基于特征選擇與改進的Tri-training的半監(jiān)督網(wǎng)絡(luò)流量分類
摘要: 網(wǎng)絡(luò)流量分類對網(wǎng)絡(luò)管理意義重大,目前基于機器學(xué)習(xí)的流量分類方法存在標(biāo)注瓶頸、樣本不平衡的問題。針對這兩個問題,提出一種基于特征選擇與改進的Tri-training算法結(jié)合的半監(jiān)督網(wǎng)絡(luò)流量分類模型。根據(jù)最大信息系數(shù)、皮爾遜系數(shù)選擇出與類高度相關(guān)但彼此不相關(guān)的特征,利用改進的Relief F選擇出有利于少數(shù)類分類的特征,并將選擇出的特征組合成最優(yōu)特征子集緩解不平衡數(shù)據(jù)對分類的影響。... (共11頁)
開通會員,享受整站包年服務(wù)