劉凱
?。ㄩL江大學(xué) 工程技術(shù)學(xué)院,, 湖北 荊州 434023)
摘要:在數(shù)字語音真?zhèn)渭夹g(shù)中,基于電網(wǎng)頻率的檢測方法是當(dāng)前研究的熱點(diǎn),。由于數(shù)字錄音設(shè)備在錄音過程中不僅記錄語音內(nèi)容本身,,還攜帶微弱的電網(wǎng)電壓或電流信號,利用Duffing共振理論來提取數(shù)字錄音信號中的微弱電網(wǎng)信號,,根據(jù)其輸出特征參數(shù)的幅頻特性和相頻特性來判斷錄音文件的真?zhèn)涡?。通過實(shí)驗(yàn)分析論證了該方法的可行性和實(shí)用性,,為數(shù)字錄音真?zhèn)舞b別技術(shù)提供了一條新的研究方向。
關(guān)鍵詞:語音真?zhèn)舞b別,;電網(wǎng)頻率,;Duffing共振;特征參數(shù)
0引言
近年來,,數(shù)字多媒體技術(shù)飛速發(fā)展,數(shù)字信息已經(jīng)滲透到人們生活的方方面面,。在語音處理技術(shù)領(lǐng)域,,人們已經(jīng)可以很方便地獲取語音信號,并利用音頻編輯軟件對其進(jìn)行有意或無意的編輯和修改,,這種篡改行為對語音數(shù)據(jù)的安全性構(gòu)成了強(qiáng)大的威脅,。隨著數(shù)字信息已逐步應(yīng)用于司法取證,語音真?zhèn)螜z測技術(shù)也逐漸成為國內(nèi)外學(xué)術(shù)界研究的熱點(diǎn),。
電力系統(tǒng)是促進(jìn)國家發(fā)展的基本因素之一,,公用的電網(wǎng)信號可以看成是一個正弦波,它有一個固定的頻率,,該頻率稱為電網(wǎng)頻率(Eleetrie Network Frequency,,ENF)[1]。電網(wǎng)提供的大部分電力都是來自于能產(chǎn)生交流電的渦輪,,這些渦輪的轉(zhuǎn)速便決定了電網(wǎng)頻率,,正常運(yùn)行的電網(wǎng)頻率值是50 Hz或60 Hz,中國的電網(wǎng)頻率值是50 Hz,。電網(wǎng)頻率變化具有均一性和唯一性,,其波動不僅表征系統(tǒng)的動態(tài)行為,而且承載豐富的時間信息,。由于數(shù)字錄音的原理與模擬磁帶錄音不同,,無法在磁蹤跡和抹音磁頭上找到錄音開始、停頓和終止等物理特征,,因而迫切需要尋找其他的鑒別方法,。GRIGORAS C將電網(wǎng)頻率變化與數(shù)字錄音真?zhèn)舞b別聯(lián)系起來,提出電網(wǎng)頻率準(zhǔn)則[25],。該方法認(rèn)為數(shù)字錄音設(shè)備在錄音過程中不僅記錄語音內(nèi)容本身,,而且還因該設(shè)備由電網(wǎng)直接供電的緣故而捕獲到微弱的電網(wǎng)電壓或電流信號;若錄音設(shè)備采用電池供電,,周圍其他的用電設(shè)備產(chǎn)生的電磁場也有可能感應(yīng)出電信號,,在錄音記錄中留下感應(yīng)信號的蹤跡[67]。近年來,,隨機(jī)共振在信息技術(shù)領(lǐng)域的應(yīng)用已經(jīng)有了相當(dāng)大的發(fā)展,,例如基于隨機(jī)共振的信號檢測方法為強(qiáng)噪聲背景下弱信號的提取提供了新的途徑[8],。因此可以考慮利用Duffing共振理論來提取錄音信號中的微弱電網(wǎng)或電壓信號,從而判斷錄音文件的真?zhèn)涡浴?/p>
1Duffing共振理論基礎(chǔ)
Duffing方程的一般形式為[9]:
其中,,γ是阻尼系數(shù),;κ、ζ為常數(shù),;FcosΩt是系統(tǒng)的外力項(xiàng),;Ω是外力項(xiàng)頻率。式中正,、負(fù)號分別表示硬彈簧和軟彈簧兩種情況,。理論情況下,在線性系統(tǒng)中當(dāng)強(qiáng)迫力的頻率與系統(tǒng)本身的頻率相同時,,系統(tǒng)會出現(xiàn)共振現(xiàn)象,,在非線性系統(tǒng)中也會出現(xiàn)類似的情況。
無阻尼情況下Duffing方程為:
令κ=ω20 ,,ζ=εβ20,,其中ε>0,引進(jìn)多重時間尺度變量,,如多重時間尺度[10],,有:
認(rèn)為函數(shù)x不僅依賴于ε和t,還依賴于T0,T1,T2,…,,Tn,,有:
x=x0(T0,T1,…,Tn)+εx1(T0,T1,…,Tn)+…(4)
得到式(2)的一階近似解:
考慮有阻尼的Duffing方程:
令α=α(T2,T3,…,Tn),ω=ω0+3β20α28ω0ε ,,θ0=θ(T2,T3,…,Tn)
僅考慮無阻尼Duffing方程的通解,,式(7)的通解為:
x(t)=αexp(-γt)cos(ωt+θ0)(8)
其中,α為振幅,,ω為角頻率,,θ0為初始相位。
考慮有外力驅(qū)動的情況(式(1)),,即當(dāng)式(8)中ω=Ω時系統(tǒng)發(fā)生共振,。
當(dāng)在t(0+)時刻輸入一個脈沖響應(yīng)δ(t),系統(tǒng)的時域函數(shù)為h(t),,由δ(t)*h(t)=x(t),,可以得出H(s)=X(s),即h(t)=x(t),。
2基于Duffing共振的語音真?zhèn)螜z測技術(shù)
該檢測技術(shù)具有如圖1所示的步驟,。
(1)首先對待檢測錄音信號進(jìn)行預(yù)處理,。預(yù)處理包括抗混疊濾波,,預(yù)加重和分幀加窗,。
(2)對預(yù)處理的錄音信號進(jìn)行快速傅里葉變換(FFT變換)得到其頻譜特性,。
?。?)將頻域信號通過一個Duffing共振帶通濾波器,帶通濾波器的中心頻率為50 Hz,,該濾波信號即為提取到的電網(wǎng)信號,。通過第1章Duffing共振理論的介紹已經(jīng)得出了模擬濾波器的單位沖擊響應(yīng)h(t),對其進(jìn)行拉普拉斯變換就可以得到模擬帶通濾波器的系統(tǒng)函數(shù)H(s),,然后通過雙線性變換就可以得到數(shù)字帶通濾波器的系統(tǒng)函數(shù)H(z),,該濾波器的幅頻特性如圖2所示。
?。?)畫出該濾波信號的幅頻圖和相位圖,。
?。?)根據(jù)幅頻圖和相位圖上有無突然的跳變來判斷音頻是否發(fā)生過篡改操作,。圖2Duffing共振帶通濾波器的幅頻特性
3實(shí)驗(yàn)和分析
有4段待檢測錄音音頻,都是由計算機(jī)的麥克風(fēng)錄音,,錄音和篡改軟件為Cool Edit Pro V21簡體中文版,,分別對應(yīng)音頻1、音頻2,、音頻3和音頻4,。其中音頻1為女生未經(jīng)過篡改的原始錄音,錄音內(nèi)容為“零”,, 音頻2為男生未經(jīng)過篡改的原始錄音,,錄音內(nèi)容為“零”,將音頻1復(fù)制粘貼到音頻2為音頻3,,內(nèi)容變?yōu)椤傲懔恪?,將音頻1由軟件加入頻率為50 Hz的合音得到音頻4。分別對音頻1,、音頻2,、音頻3和音頻4用基于Duffing共振的篡改檢測方法進(jìn)行真?zhèn)螜z測,檢測流程如圖1所示,。
圖3~圖6分別為音頻1,、音頻2、音頻3和音頻4的時域波形圖,,圖7~圖10分別為音頻1,、音頻2、音頻3和音頻4經(jīng)系統(tǒng)后的頻譜圖,。
從圖7,、圖8可以看出,,沒有經(jīng)過篡改的音頻信號經(jīng)過系統(tǒng)后的頻譜圖具有比較好的雙峰性,而且第一個峰的頻率在50 Hz,。圖9是經(jīng)過篡改后的音頻信號經(jīng)系統(tǒng)后的頻譜圖,,從圖中可看出只有一個峰值,而且峰值處的頻率為100 Hz,。
由此可以得出結(jié)論,,經(jīng)過篡改后的音頻信號經(jīng)過系統(tǒng)后的頻譜會發(fā)生較大的突變,頻譜的中心發(fā)生搬移,。
圖9與圖7的幅頻圖完全一致,,人為添加計算機(jī)合成的同頻率音頻對音頻信號通過系統(tǒng)后的幅頻特性沒有影響。圖11和圖12分別為音頻1和音頻4通過系統(tǒng)后的相頻圖,,從圖中可以看出,,音頻4的相頻特性較音頻1相位發(fā)生了很大的變化。
4結(jié)論
本文研究了一種基于Duffing共振的語音數(shù)字語音真?zhèn)舞b別技術(shù),,通過實(shí)驗(yàn),,對比實(shí)驗(yàn)結(jié)果,經(jīng)復(fù)制粘貼篡改操作的音頻信號經(jīng)過Duffing共振系統(tǒng),,其幅頻特性會發(fā)生較大的變化,;而經(jīng)計算機(jī)軟件添加合成音頻的音頻信號經(jīng)過Duffing系統(tǒng)后,其幅頻特性基本不變,,變化的是相頻特性,。由實(shí)驗(yàn)可以得出:基于Duffing共振的數(shù)字語音真?zhèn)舞b別具有一定的可行性和實(shí)用性,在以后的研究過程中,,還會進(jìn)一步探討該系統(tǒng)在其他數(shù)字語音篡改技術(shù)中的應(yīng)用,。
參考文獻(xiàn)
[1] GUPTA S, CHO S,, JAYKUO C C. Current developments and future trends in audio authentication [J]. IEEE Multimedia, 2012,19(1): 5059.
?。?] GRIGORAS C. Digital audio recording analysis: The electric network frequency criterion[C]. Diamond Cut Productions, Inc., Applications Notes AN4, 2003.
[3] GRIGORAS C. Digital audio recording analysis: the electric network frequency (ENF) criterion [J]. The International Journal of Speech Language and the Law, 2005, 12(1):6376.
?。?] GRIGORAS C. Applications of ENF criterion in forensic audio, video, computer and telecommunication analysis [J]. Forensic Science International, 2007(167):136143.
?。?] GRIGORAS C. Applications of ENF analysis in forensic authentication of digital audio and video recordings [J]. The Journal of Audio Engineering Society, 2009, 57(9):643661.
[6] 楊林國.詞類擴(kuò)充方法在語音識別中的應(yīng)用[J].電子技術(shù)應(yīng)用,2014,40(6):123125,129.
?。?] 趙媛媛,王力.基于流形學(xué)習(xí)ISOP算法的語音特征提取及應(yīng)用研究[J].微型機(jī)與應(yīng)用,2014,33(1):4345,49.
?。?] 賴志慧,冷永剛,,孫建橋,,等.基于Duffing振子的變尺度微弱特征信號檢測方法研究[J].物理學(xué)報,2012,62(5):05050310505039.
?。?] 王海波.Duffing方程非線性振動特性的計算和分析[D].西安:西安建筑科技大學(xué),,2009.
?。?0] 徐博侯,曲紹興.非線性力學(xué)導(dǎo)論[M].杭州:浙江大學(xué)出版社,,2012.