語(yǔ)音偽裝方法及其防御對(duì)策綜述-AET-電子技術(shù)應(yīng)用

語(yǔ)音偽裝方法及其防御對(duì)策綜述

《信息技術(shù)與網(wǎng)絡(luò)安全》2020年第8期

鄭琳琳1，孫蒙1，張雄偉1，潘志欣2

1.陸軍工程大學(xué)，江蘇南京210007；2.海軍工程大學(xué)，湖北武漢430000

摘要： 語(yǔ)音偽裝是指以隱藏說(shuō)話人身份為目的對(duì)說(shuō)話人的個(gè)性特征進(jìn)行的改變。近年來(lái)，隨著智能語(yǔ)音交互技術(shù)和聲紋認(rèn)證產(chǎn)品的快速發(fā)展，語(yǔ)音偽裝被應(yīng)用到語(yǔ)音產(chǎn)品隱私保護(hù)中，但是也被不法分子用以實(shí)施違法犯罪行為。因此，語(yǔ)音偽裝成為目前語(yǔ)音處理和信息安全領(lǐng)域非常有實(shí)用意義的研究問(wèn)題。在簡(jiǎn)要介紹語(yǔ)音偽裝的典型模型和方法的基礎(chǔ)上，梳理了語(yǔ)音偽裝威脅量化評(píng)估方案，總結(jié)了近幾年偽裝語(yǔ)音的防御對(duì)策，分析了目前防御對(duì)策中存在的問(wèn)題及技術(shù)難點(diǎn)，并對(duì)語(yǔ)音偽裝的未來(lái)研究發(fā)展方向進(jìn)行了展望。

關(guān)鍵詞： 語(yǔ)音偽裝聲紋識(shí)別自動(dòng)說(shuō)話人確認(rèn) 語(yǔ)音變換

中圖分類號(hào)： TN912
文獻(xiàn)標(biāo)識(shí)碼： A
DOI： 10.19358/j.issn.2096-5133.2020.08.007
引用格式：鄭琳琳，孫蒙，張雄偉，等. 語(yǔ)音偽裝方法及其防御對(duì)策綜述[J].信息技術(shù)與網(wǎng)絡(luò)安全，2020，39(8)：33-42.

Voice disguise and its countermeasures for anti-disguise

Zheng Linlin1，Sun Meng1，Zhang Xiongwei1，Pan Zhixin2

1.Army Engineering University of PLA，Nanjing 210007，China； 2.Naval University of Engineering，Wuhan 430000，China

Abstract： Voice disguise refers to the change of the personality characteristics of the speaker for the purpose of hiding the speaker′s identity. In recent years, with the rapid development of intelligent voice interaction technology and voiceprint authentication products, voice disguise has been applied to the privacy protection of voice products, but it has also been used by criminals to commit illegal crimes. Therefore, voice disguise has become a very practical research issue in the field of voice processing and information security. On the basis of introducing the typical models and methods of voice disguise, the methods of quantifying voice disguise threat assessment methods are summarized in this paper, and the defense countermeasures of disguise voice in recent years are introduced. Then, the problems and technical difficulties still existing in defense countermeasures are analyzed. Finally, the prospects for the research development direction of voice disguise are given.

Key words : voice disguise；speaker recognition；automatic speaker verification；voice transformation

語(yǔ)音是人們?nèi)粘＝涣髦械囊环N最直接、最有效和最常用的傳遞信息方式。由于說(shuō)話人發(fā)音器官的生理差異和后天成長(zhǎng)環(huán)境形成的行為差異，每個(gè)人的語(yǔ)音都帶有強(qiáng)烈的個(gè)性特征，能夠像虹膜、指紋、人臉等生物認(rèn)證技術(shù)一樣，成為身份驗(yàn)證的重要手段，稱為聲紋識(shí)別技術(shù)。聲紋技術(shù)因其具有經(jīng)濟(jì)、可靠、交互自然等優(yōu)勢(shì)而備受關(guān)注，具有重要研究意義和廣泛應(yīng)用前景。

雖然每個(gè)說(shuō)話人的語(yǔ)音有自己的個(gè)性特征，但是語(yǔ)音也是可以被模仿和偽裝的。目前，市面上流行的各類變聲器及變聲軟件可以對(duì)說(shuō)話人的語(yǔ)音進(jìn)行個(gè)性化改變，致使人耳甚至部分聲紋識(shí)別技術(shù)產(chǎn)品很難識(shí)別出說(shuō)話人的身份。犯罪分子利用特定手段來(lái)偽裝自己的語(yǔ)音不被辨識(shí)出來(lái)，實(shí)施電話詐騙、恐嚇、綁架勒索等相關(guān)新聞報(bào)道也是數(shù)見(jiàn)不鮮。軍事上，某些組織成員通過(guò)使用全新的電話號(hào)碼和語(yǔ)音偽裝的方式來(lái)逃脫政府監(jiān)控的識(shí)別。隨著智能語(yǔ)音交互技術(shù)被廣泛應(yīng)用到商業(yè)活動(dòng)和軍事應(yīng)用中，人們對(duì)信息安全的要求也越來(lái)越高。然而，語(yǔ)音偽裝嚴(yán)重影響聲紋識(shí)別效果，使犯罪分子有機(jī)可乘。

語(yǔ)音偽裝(Voice Disguise)是指對(duì)于正常語(yǔ)音的任何改變、扭曲或者偏離。它涵蓋了故意偽裝和非故意偽裝兩種形式。網(wǎng)絡(luò)空間安全領(lǐng)域更多關(guān)注的是故意偽裝，即“以掩蓋真實(shí)身份為目的，有意識(shí)地改變聲音，使其模糊、畸變、扭曲的發(fā)音方式”。偽裝語(yǔ)音的相關(guān)研究工作最早可追溯至20世紀(jì)六十年代初期的法庭說(shuō)話人辨認(rèn)，至今已有50多年的研究歷史。近年來(lái)，語(yǔ)音信號(hào)處理和互聯(lián)網(wǎng)技術(shù)的進(jìn)步，以及語(yǔ)音數(shù)據(jù)獲取和共享的更加便捷，有力地推動(dòng)了語(yǔ)音偽裝技術(shù)的發(fā)展。特別是基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的語(yǔ)音合成技術(shù)能夠生成特定說(shuō)話人的語(yǔ)音樣本，對(duì)聲紋識(shí)別接口的用戶構(gòu)成了嚴(yán)重的隱私威脅。因此，語(yǔ)音偽裝受到學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注，諸多國(guó)內(nèi)外學(xué)者開(kāi)展了與語(yǔ)音偽裝相關(guān)的研究。日本東京國(guó)立資訊研究所、法國(guó)國(guó)家信息與自動(dòng)化研究所以及美國(guó)伊利諾理工大學(xué)等開(kāi)展了語(yǔ)音偽裝方式的研究，進(jìn)一步提高了偽裝語(yǔ)音的匿名化程度；中國(guó)刑警學(xué)院和多地公安部門(mén)針對(duì)偽裝語(yǔ)音變聲規(guī)律及其對(duì)自動(dòng)說(shuō)話人確認(rèn)系統(tǒng)(Automatic Speaker Verification，ASV)的影響展開(kāi)了相關(guān)工作；清華大學(xué)、南京郵電大學(xué)以及中山大學(xué)等在偽裝語(yǔ)音防御對(duì)策方面做了相關(guān)研究，并相繼取得了一些研究成果。

本文在簡(jiǎn)要梳理語(yǔ)音偽裝的典型模型和基本方法的基礎(chǔ)上，介紹了語(yǔ)音偽裝的威脅量化評(píng)估方法，歸納了語(yǔ)音偽裝的防御對(duì)策，并總結(jié)了目前語(yǔ)音偽裝防御對(duì)策研究中仍存在的問(wèn)題和挑戰(zhàn)，對(duì)未來(lái)的發(fā)展方向作出了展望。

本文詳細(xì)內(nèi)容請(qǐng)下載：http://forexkbc.com/resource/share/2000003244

作者信息：

鄭琳琳1，孫蒙1，張雄偉1，潘志欣2

(1.陸軍工程大學(xué)，江蘇南京210007；2.海軍工程大學(xué)，湖北武漢430000)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容