基于偽觸發(fā)詞的并行預(yù)測(cè)篇章級(jí)事件抽取方法[人工智能][消費(fèi)電子]

篇章級(jí)事件抽取一般將事件抽取任務(wù)分為候選實(shí)體識(shí)別,、事件檢測(cè)和論元識(shí)別3個(gè)子任務(wù),,然后采用級(jí)聯(lián)的方式依次進(jìn)行,這樣的方式會(huì)造成誤差傳遞,;另外,,現(xiàn)有的大多數(shù)模型在解碼事件時(shí),,對(duì)事件數(shù)量的預(yù)測(cè)隱含在解碼過(guò)程中,且只能按照預(yù)定義的事件順序及預(yù)定義的角色順序預(yù)測(cè)事件論元,,使得先抽取的事件并沒(méi)有考慮到后面抽取的事件,。針對(duì)以上問(wèn)題提出一種多任務(wù)聯(lián)合的并行預(yù)測(cè)事件抽取框架。首先,,使用預(yù)訓(xùn)練語(yǔ)言模型作為文檔句子的編碼器,,檢測(cè)文檔中存在的事件類型,并使用結(jié)構(gòu)化自注意力機(jī)制獲取偽觸發(fā)詞特征,,預(yù)測(cè)每種事件類型的事件數(shù)量,;然后將偽觸發(fā)詞特征與候選論元特征進(jìn)行交互,并行預(yù)測(cè)每個(gè)事件對(duì)應(yīng)的事件論元,,在大幅縮減模型訓(xùn)練時(shí)間的同時(shí)獲得與基線模型相比更好的性能,。最終事件抽取結(jié)果F1值為78%,事件類型檢測(cè)子任務(wù)F1值為98.7%,,事件數(shù)量預(yù)測(cè)子任務(wù)F1值為90.1%,,實(shí)體識(shí)別子任務(wù)F1值為90.3%。

發(fā)表于:2024/4/29 13:10:00