基于深度注意力的融合全局和語義特征的圖像描述模型AET-電子技術(shù)應用-最豐富的電子設(shè)計資源平臺

基于深度注意力的融合全局和語義特征的圖像描述模型
所屬分類：技術(shù)論文
上傳者：wwei
文檔大小：907 K
標簽：圖像描述全局特征語義特征
所需積分：0分積分不夠怎么辦？
文檔介紹：現(xiàn)有的圖像描述模型使用全局特征時受限于感受野大小相同，而基于對象區(qū)域的圖像特征缺少背景信息。為此，提出了一種新的語義提取模塊提取圖像中的語義特征，使用多特征融合模塊將全局特征與語義特征進行融合，使得模型同時關(guān)注圖像的關(guān)鍵對象內(nèi)容信息和背景信息。并提出基于深度注意力的解碼模塊，對齊視覺和文本特征以生成更高質(zhì)量的圖像描述語句。所提模型在Microsoft COCO數(shù)據(jù)集上進行了實驗評估，分析結(jié)果表明該方法能夠明顯提升描述的性能，相較于其他先進模型具有競爭力。
現(xiàn)在下載
VIP會員，AET專家下載不扣分；重復下載不扣分，本人上傳資源不扣分。

活動