基于爬蟲(chóng)和TFIDF-NB算法的微博情感分析
所屬分類(lèi):技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>544 K
標(biāo)簽: 微博輿情 網(wǎng)絡(luò)爬蟲(chóng) 情感分類(lèi)
所需積分:0分積分不夠怎么辦,?
文檔介紹:針對(duì)微博網(wǎng)絡(luò)輿情信息量大,、無(wú)規(guī)則、隨機(jī)變化的特點(diǎn),,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于Scrapy框架的微博評(píng)論爬蟲(chóng),將某熱點(diǎn)事件的若干條微博評(píng)論進(jìn)行爬取并存進(jìn)數(shù)據(jù)庫(kù),,然后進(jìn)行文本分割,、LDA(Latent Dirichlet Allocation)主題聚類(lèi),最后使用TFIDF-NB算法進(jìn)行情感分類(lèi),。實(shí)驗(yàn)結(jié)果表明,,TFIDF-NB算法平均準(zhǔn)確率高于線性支持向量機(jī)算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,,具有較好的情感分類(lèi)效果,。
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。