基于增強語義信息理解的場景圖生成
所屬分類:技術論文
上傳者:zhoubin333
文檔大?。?span>4006 K
標簽: 場景圖生成 圖像裁剪 語義轉(zhuǎn)化
所需積分:0分積分不夠怎么辦?
文檔介紹:場景圖生成(SGG)任務旨在檢測圖像中的視覺關系三元組,,即主語,、謂語、賓語,,為場景理解提供結(jié)構視覺布局,。然而,現(xiàn)有的場景圖生成方法忽略了預測的謂詞頻率高但卻無信息性的問題,,從而阻礙了該領域進步,。為了解決上述問題,提出一種基于增強語義信息理解的場景圖生成算法,。整個模型由特征提取模塊,、圖像裁剪模塊、語義轉(zhuǎn)化模塊,、拓展信息謂詞模塊四部分組成,。特征提取模塊和圖像裁剪模塊負責提取視覺特征并使其具有全局性和多樣性。語義轉(zhuǎn)化模塊負責將謂詞之間的語義關系從常見的預測中恢復信息預測,。拓展信息謂詞模塊負責擴展信息謂詞的采樣空間,。在數(shù)據(jù)集VG和VG-MSDN上與其他方法進行比較,平均召回率分別達到59.5%和40.9%,。該算法可改善預測出來的謂詞信息性不足問題,,進而提升場景圖生成算法的性能。
現(xiàn)在下載
VIP會員,,AET專家下載不扣分,;重復下載不扣分,本人上傳資源不扣分,。