融入翻譯記憶庫的法律領(lǐng)域神經(jīng)機器翻譯方法*AET-電子技術(shù)應用-最豐富的電子設(shè)計資源平臺

融入翻譯記憶庫的法律領(lǐng)域神經(jīng)機器翻譯方法*
所屬分類：技術(shù)論文
上傳者：zhoubin333
文檔大小：3666 K
標簽：神經(jīng)機器翻譯語義信息結(jié)構(gòu)信息
所需積分：0分積分不夠怎么辦？
文檔介紹：面向法律領(lǐng)域的神經(jīng)機器翻譯對于合同文本翻譯等應用場景具有重要價值。由于法律領(lǐng)域雙語對齊語料稀缺，翻譯效果還不理想。針對該問題，目前有效的方法是融入翻譯記憶或翻譯模版等外部信息，但法律領(lǐng)域的文本多具有固定的表達結(jié)構(gòu)且用詞準確規(guī)范，在翻譯記憶庫中同時利用翻譯結(jié)構(gòu)信息和語義信息能夠進一步提升法律領(lǐng)域翻譯性能。基于此，提出一種融入翻譯記憶庫的法律領(lǐng)域機器翻譯方法。提出了一種新的法律領(lǐng)域翻譯記憶庫，首先基于語義和結(jié)構(gòu)信息的相似性訓練跨語言檢索模型以充分利用單語數(shù)據(jù)，然后從翻譯記憶庫中檢索與輸入源句相關(guān)的一組翻譯記憶和翻譯模版，進而引導翻譯模型生成目標句子。實驗表明，在MHLAW數(shù)據(jù)集上，提出的方法可以使譯文較基線模型提升1.28個BLEU點。
現(xiàn)在下載
VIP會員，AET專家下載不扣分；重復下載不扣分，本人上傳資源不扣分。

活動