摘要:在非平衡數據分類問題中,為了合成有價值的新樣本和刪除無影響的原樣本,提出一種基于邊界混合重采樣的非平衡數據分類算法。該算法首先引入支持k-離群度概念,找出數據集中的邊界點集和非邊界點集;利用改進的SMOTE算法將少數類中的邊界點作為目標樣本合成新的點集,同時對多數類中的非邊界點采用基于距離的欠采樣算法,以此達到類之間的平衡。通過實驗結果對比表明了該算法在保證G-mean值較優的前提下,一定程度上提高了少數類的分類精度。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機工程與應用雜志, 半月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:博士論壇、網絡、通信與安全、數據庫、信號與信息處理 、工程與應用等。于1964年經新聞總署批準的正規刊物。