安全類文章的多文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) | |
所屬分類:技術(shù)論文 | |
上傳者:muyx | |
文檔大?。?span>568 K | |
標(biāo)簽: 深度學(xué)習(xí) 文本分類 爬蟲 | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:目前安全類網(wǎng)站信息的分類標(biāo)簽各不相同,沒有統(tǒng)一分類標(biāo)準(zhǔn),,使安全類網(wǎng)站無法準(zhǔn)確地向用戶展示特定類別的安全信息。面對大量的安全類網(wǎng)站的技術(shù)類文章信息,,用戶需要花費(fèi)大量的時(shí)間來識別文本類別,。因此,設(shè)計(jì)一個(gè)多文本分類系統(tǒng)對于提高安全類網(wǎng)站的用戶體驗(yàn)和使用效率具有重要意義,。開發(fā)了一套基于CNN和LSTM混合模型的安全類文章多文本分類系統(tǒng),,本系統(tǒng)采用基于Scrapy框架的網(wǎng)絡(luò)爬蟲,該網(wǎng)絡(luò)爬蟲支持定制化配置提取不同布局的頁面數(shù)據(jù),,支持?jǐn)?shù)據(jù)持久化存儲,。并在 CNN和 LSTM混合模型基礎(chǔ)上設(shè)計(jì)實(shí)現(xiàn)了多文本自動標(biāo)注模塊,,實(shí)現(xiàn)了網(wǎng)站安全類信息的自動分類,相對傳統(tǒng)的CNN和LSTM模型分類準(zhǔn)確率分別提升1.79%和1.54%,,F(xiàn)1值分別提升1.02%和0.32%,。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2