基于X-Linear和語(yǔ)義嵌入的視頻描述算法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>608 K
標(biāo)簽: 視頻描述 語(yǔ)義嵌入 X-Linear注意力
所需積分:0分積分不夠怎么辦,?
文檔介紹:注意力機(jī)制和視頻語(yǔ)義嵌入使得視頻描述任務(wù)取得了顯著的提升,,為更好地利用時(shí)序動(dòng)態(tài)特征和語(yǔ)義信息,,提出一種基于X-Linear的語(yǔ)義嵌入視頻描述算法(X-Linear Semantic Embedding Network,,XLSNet),。該算法以基于編碼解碼器網(wǎng)絡(luò)為基礎(chǔ),,使用X-Linear注意力模塊對(duì)視頻特征進(jìn)行編碼,,該模塊使用雙線性池化來(lái)增加視頻時(shí)序特征的高階交互,最終提取豐富的時(shí)序動(dòng)態(tài)特征,;為充分利用視頻語(yǔ)義信息,,使用語(yǔ)義嵌入的GRU和X-Linear作為解碼器對(duì)視頻描述進(jìn)行生成。為防止過(guò)擬合現(xiàn)象,,對(duì)解碼器的GRU使用了層歸一化和變分Dropout,。所提出的算法僅僅使用了視頻幀特征,在公開(kāi)視頻描述數(shù)據(jù)集MSVD上取得了很好的效果,。
現(xiàn)在下載
VIP會(huì)員,,AET專家下載不扣分;重復(fù)下載不扣分,,本人上傳資源不扣分,。