基于HybridDL模型的文本相似度檢測(cè)方法 | |
所屬分類:技術(shù)論文 | |
上傳者:aetmagazine | |
文檔大?。?span>440 K | |
標(biāo)簽: Doc2Vec 潛在狄利克雷分布 文本表示 | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:為了提高文本相似度檢測(cè)算法的準(zhǔn)確度,,提出一種結(jié)合潛在狄利克雷分布(Latent Dirichlet Allocation,,LDA)與Doc2Vec模型的文本相似度檢測(cè)方法,,并把該算法得到的模型命名為HybridDL模型,。該算法通過(guò)Doc2Vec對(duì)文檔訓(xùn)練得到文檔向量,,再利用LDA模型得到文檔主題與各個(gè)主題下特征詞出現(xiàn)的概率,,對(duì)文檔中各主題及特征詞計(jì)算概率加權(quán)和,,映射到Doc2Vec文檔向量中,。實(shí)驗(yàn)結(jié)果表明,,新算法模型比傳統(tǒng)的Doc2Vec模型對(duì)相似文本的判斷更加敏感,在文本相似度檢測(cè)上具有更高的準(zhǔn)確度,。 | |
現(xiàn)在下載 | |
VIP會(huì)員,,AET專家下載不扣分;重復(fù)下載不扣分,,本人上傳資源不扣分,。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2