引言
方面級(jí)情感分類是情感分析任務(wù)的一個(gè)分支,,旨在確定句子中特定方面詞的情感極性,。給定句子“Lots of extra space but the keyboard is ridiculously small.”,方面級(jí)情感分類(ASC)的任務(wù)是對句子中給定的方面詞“space”和“keyboard”,,應(yīng)該可以得出對應(yīng)的情感極性分別為積極和消極,。
之前的研究通過將循環(huán)神將網(wǎng)絡(luò)(RNN)與注意力機(jī)制[1]進(jìn)行結(jié)合,可以明顯提高此類任務(wù)的性能,。但是注意力機(jī)制很容易受到噪聲的影響,。局部上下文聚焦機(jī)制[2](LCF)發(fā)現(xiàn)方面詞自身周圍的單詞對其情感極性的判別更加重要,通過使用LCF捕獲局部上下文,,并使用動(dòng)態(tài)距離掩碼(CDM)或動(dòng)態(tài)距離加權(quán)(CDW)可以捕獲方面詞周圍的重要信息,。同時(shí),隨著預(yù)訓(xùn)練模型BERT[3]的出現(xiàn),,對BERT結(jié)構(gòu)做出針對性的調(diào)整也成為了研究方向,。盡管上述方法已經(jīng)取得了顯著的成績,但是仍然存在以下兩點(diǎn)問題,。(1)未充分挖掘BERT語義信息,。Ganesh等人[4]發(fā)現(xiàn)BERT自身高層的語義信息已經(jīng)足夠豐富,如何更好地利用這些信息仍有待進(jìn)一步研究,。(2)局部關(guān)鍵特征提取不充分,。在使用LCF的模型中使用固定閾值劃分局部上下文,,其范圍不夠精確;同時(shí)在兩類上下文中使用的特征提取方法未能很好地提取局部關(guān)鍵信息,。
為了解決上述問題,,本文提出了一個(gè)全新的模型,通過結(jié)合BERT語義融合和關(guān)鍵詞特征提取進(jìn)行方面級(jí)情感分類,。一是提出BERT語義融合模塊,,利用門控函數(shù)將BERT編碼器不同層的表示向量進(jìn)行融合。二是提出關(guān)鍵字特征提取模塊,,根據(jù)句子長度動(dòng)態(tài)確定局部上下文和非局部上下文的范圍,,并通過句法二次掩碼和距離感知注意力提取兩類上下文的關(guān)鍵特征。三是引入?yún)f(xié)同注意力模塊,,將局部特征,、全局特征和方面詞特征融合,得到融合局部信息和方面詞信息的全局特征,。
本文的主要貢獻(xiàn)總結(jié)如下:
(1)將BERT編碼器的第9~12層通過針對性設(shè)計(jì)的門控函數(shù)進(jìn)行語義融合,,提取到了包含豐富語義的句子初始的上下文表示向量。
(2)提出了關(guān)鍵字特征提取模塊,。該模塊通過句子長度動(dòng)態(tài)確定局部上下文和非局部上下文,,并用句法二次掩碼和距離感知注意力來分別提取對應(yīng)區(qū)域的局部關(guān)鍵特征。
(3)設(shè)計(jì)了全新的協(xié)同注意力,。通過使用注意力機(jī)制融合全局特征,、局部特征和方面詞特征來獲得包含豐富語義信息的全新特征。
本文詳細(xì)內(nèi)容請下載:
http://forexkbc.com/resource/share/2000006226
作者信息:
胡耀庭,,韓雨橋,,石宇航,高宣,,彭玉青
(河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院,,天津300401)