一種應(yīng)用于機(jī)器學(xué)習(xí)的惡意網(wǎng)頁特征提取方法
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>768 K
標(biāo)簽: 機(jī)器學(xué)習(xí) 惡意網(wǎng)頁檢測(cè) 哈希壓縮
所需積分:0分積分不夠怎么辦,?
文檔介紹:基于機(jī)器學(xué)習(xí)的惡意網(wǎng)頁檢測(cè)技術(shù)進(jìn)行研究,。目前流行的“特征碼”“白名單”等方式,,僅能夠檢測(cè)已知的惡意網(wǎng)頁,;機(jī)器學(xué)習(xí)方法,,能夠檢測(cè)出未知的惡意網(wǎng)頁,,但在處理網(wǎng)頁特征時(shí)要面臨數(shù)據(jù)量大,、復(fù)雜和繁瑣的問題,。提出一種哈希壓縮的方法,用于處理網(wǎng)頁的特征數(shù)據(jù),。該方法在保證檢測(cè)模型的漏報(bào)率和誤報(bào)率下可實(shí)現(xiàn)將150萬的特征映射在2萬的特征空間內(nèi),,對(duì)提取出的特征數(shù)據(jù)運(yùn)用K折交叉驗(yàn)證法訓(xùn)練多個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)模型和集成學(xué)習(xí)模型。并通過評(píng)估模型的檢測(cè)效果,,篩選出表現(xiàn)最好的分類檢測(cè)模型,。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。