基于HybridDL模型的文本相似度檢測(cè)方法
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>440 K
標(biāo)簽: Doc2Vec 潛在狄利克雷分布 文本表示
所需積分:0分積分不夠怎么辦,?
文檔介紹:為了提高文本相似度檢測(cè)算法的準(zhǔn)確度,,提出一種結(jié)合潛在狄利克雷分布(Latent Dirichlet Allocation,,LDA)與Doc2Vec模型的文本相似度檢測(cè)方法,,并把該算法得到的模型命名為HybridDL模型,。該算法通過(guò)Doc2Vec對(duì)文檔訓(xùn)練得到文檔向量,,再利用LDA模型得到文檔主題與各個(gè)主題下特征詞出現(xiàn)的概率,,對(duì)文檔中各主題及特征詞計(jì)算概率加權(quán)和,,映射到Doc2Vec文檔向量中,。實(shí)驗(yàn)結(jié)果表明,,新算法模型比傳統(tǒng)的Doc2Vec模型對(duì)相似文本的判斷更加敏感,在文本相似度檢測(cè)上具有更高的準(zhǔn)確度,。
現(xiàn)在下載
VIP會(huì)員,,AET專家下載不扣分;重復(fù)下載不扣分,,本人上傳資源不扣分,。