基于深度注意力的融合全局和語義特征的圖像描述模型
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>907 K
標(biāo)簽: 圖像描述 全局特征 語義特征
所需積分:0分積分不夠怎么辦,?
文檔介紹:現(xiàn)有的圖像描述模型使用全局特征時受限于感受野大小相同,,而基于對象區(qū)域的圖像特征缺少背景信息。為此,,提出了一種新的語義提取模塊提取圖像中的語義特征,,使用多特征融合模塊將全局特征與語義特征進(jìn)行融合,使得模型同時關(guān)注圖像的關(guān)鍵對象內(nèi)容信息和背景信息,。并提出基于深度注意力的解碼模塊,,對齊視覺和文本特征以生成更高質(zhì)量的圖像描述語句。所提模型在Microsoft COCO數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)評估,,分析結(jié)果表明該方法能夠明顯提升描述的性能,,相較于其他先進(jìn)模型具有競爭力。
現(xiàn)在下載
VIP會員,,AET專家下載不扣分,;重復(fù)下載不扣分,本人上傳資源不扣分,。