文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.173520
中文引用格式: 喬健,王建明. 抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法[J].電子技術(shù)應(yīng)用,,2018,,44(3):72-76,80.
英文引用格式: Qiao Jian,,Wang Jianming. GCC-PHAT time difference estimation algorithm based on binary frequency weight with suppressing wind noise[J]. Application of Electronic Technique,,2018,44(3):72-76,,80.
0 引言
準(zhǔn)確定位聲源是移動(dòng)設(shè)備進(jìn)行聽覺場(chǎng)景分析的首要步驟,其結(jié)果對(duì)后續(xù)混合聲源分離,、聲源辨識(shí),、語(yǔ)音識(shí)別有直接影響。延時(shí)求和波束形成[1]技術(shù)在進(jìn)行聲源定位時(shí)已被廣泛使用,,需要使用信號(hào)到達(dá)麥克風(fēng)陣列中不同麥克風(fēng)的時(shí)間差值(Time Difference Of Arrival,,TDOA)。而相位變換廣義互相關(guān)(Generalized Cross Correlation-Phase Transform,,GCC-PHAT)算法具有很短的判決時(shí)延和較好的跟蹤能力,,適用于低混響環(huán)境,是常用的TDOA估計(jì)算法,。
VALIN J M提出了一種使用遞歸方法計(jì)算權(quán)值的改進(jìn)的GCC-PHAT算法[2],,即連續(xù)值頻點(diǎn)加權(quán)GCC-PHAT算法,來提高原算法對(duì)加性噪聲的魯棒性,。連續(xù)權(quán)值計(jì)算需要使用最小值控制遞歸平均[3](Minimum Controlled Recursive Averaging,,MCRA)算法估計(jì)噪聲,但MCRA算法在噪聲變化后需要適應(yīng)時(shí)間調(diào)整參數(shù)[4],,因而對(duì)于加性非平穩(wěn)間或噪聲,,使用連續(xù)權(quán)值的加權(quán)方法無法消除其干擾,最終導(dǎo)致TDOA估計(jì)錯(cuò)誤,。因此本文在頻點(diǎn)加權(quán)GCC-PHAT算法的基礎(chǔ)上,,利用接收信號(hào)中風(fēng)噪聲與聲源信號(hào)頻點(diǎn)間相干性差異,提出一種頻點(diǎn)離散值加權(quán)GCC-PHAT算法,,以消除風(fēng)噪聲及背景噪聲對(duì)TDOA估計(jì)的干擾,。實(shí)驗(yàn)結(jié)果表明,相較原算法,,新算法的結(jié)果可靠性和運(yùn)算效率都明顯提高,。
1 互相關(guān)算法估計(jì)信號(hào)時(shí)差
1.1 場(chǎng)景聲學(xué)模型
設(shè)聲源信號(hào)在存在加性噪聲的混響環(huán)境中傳播,由麥克風(fēng)陣列接收,。加性噪聲由背景噪聲和風(fēng)噪聲組成,。風(fēng)噪聲是一種特殊的非平穩(wěn)噪聲,由麥克風(fēng)薄膜表面湍流產(chǎn)生,,導(dǎo)致接收信號(hào)產(chǎn)生嚴(yán)重畸變,。背景噪聲在聲學(xué)環(huán)境中近似為遠(yuǎn)場(chǎng)聲源產(chǎn)生的彌漫性噪聲。聲源信號(hào)與風(fēng)噪聲及背景噪聲等加性噪聲不相關(guān),。
設(shè)n為信號(hào)時(shí)域采樣序號(hào),,m為陣列中麥克風(fēng)編號(hào),,s(n)為聲源信號(hào),hm(n)是聲源到麥克風(fēng)m之間的房間系統(tǒng)沖擊響應(yīng)序列,,wm(n)表示風(fēng)噪聲,,bm(n)為背景噪聲信號(hào)。背景噪聲不需要考慮混響,,則麥克風(fēng)m接收信號(hào)ym(n)表示為:
1.2 頻點(diǎn)加權(quán)GCC-PHAT算法
接收信號(hào)在整個(gè)時(shí)間域上非平穩(wěn),。利用接收信號(hào)短時(shí)平穩(wěn)特性,通過短時(shí)傅里葉變換,,將分幀后信號(hào)變換到時(shí)頻域分析[5],。選擇長(zhǎng)度為N的海寧窗h(n)對(duì)接收信號(hào)分幀,減小信號(hào)幀間頻率截?cái)嘈?yīng),。設(shè)信號(hào)幀間步進(jìn)長(zhǎng)度為ΔN個(gè)采樣間隔,,則接收信號(hào)第l幀表示為ym(lΔN+n),其傅里葉變換結(jié)果為:
2 離散值頻點(diǎn)加權(quán)GCC-PHAT算法
2.1 離散頻點(diǎn)權(quán)值
VALIN J M等人提出的頻點(diǎn)連續(xù)權(quán)值計(jì)算基于先驗(yàn)信噪比(Signal-to-Noise Ratio,,SNR)估計(jì),。頻點(diǎn)k對(duì)應(yīng)的連續(xù)權(quán)值為:
式中,為MCRA算法所得噪聲功率譜估計(jì),。
連續(xù)權(quán)值是關(guān)于信噪比的單調(diào)函數(shù),,值域?yàn)閇0,1],,用soft mask表示,,取值如圖1所示。
頻點(diǎn)連續(xù)權(quán)值計(jì)算依賴噪聲功率譜估計(jì)和信號(hào)相鄰幀間信噪值連續(xù)性,。比較風(fēng)噪聲和語(yǔ)音信號(hào)瞬時(shí)功率隨時(shí)間的變化曲線,,可以看出風(fēng)噪聲時(shí)域變化特性強(qiáng)于語(yǔ)音信號(hào)[6]。現(xiàn)有語(yǔ)音增強(qiáng)算法均默認(rèn)噪聲變化慢于語(yǔ)音,,故對(duì)于包含風(fēng)噪聲的信號(hào),,上述方法無法得出先驗(yàn)信噪比。且連續(xù)權(quán)值取值為[0,,1],,當(dāng)聲源信號(hào)受噪聲嚴(yán)重干擾(SNR<0)時(shí),信號(hào)頻點(diǎn)對(duì)應(yīng)權(quán)值大于零,,加權(quán)后信號(hào)仍然保留噪聲成分,,導(dǎo)致最終TDOA估計(jì)出錯(cuò)。本文在已有頻點(diǎn)加權(quán)方法基礎(chǔ)上提出一種使用頻點(diǎn)離散權(quán)值的風(fēng)噪聲抑制算法,。新權(quán)值是關(guān)于信號(hào)頻點(diǎn)相干值的函數(shù),,不依賴噪聲估計(jì),且只取離散值0和1,完全消除含噪頻點(diǎn)對(duì)TDOA估計(jì)結(jié)果的干擾,。新權(quán)值用wind mask表示,。
風(fēng)噪聲由麥克風(fēng)表面的湍流產(chǎn)生,不同麥克風(fēng)間風(fēng)噪聲頻點(diǎn)無相干性,。但對(duì)于同一聲源信號(hào),,陣列中麥克風(fēng)的接收信號(hào)在各頻點(diǎn)上都具有高相干性,。引入相干譜值(Magnitude Squared Coherence,,MSC),對(duì)信號(hào)各頻點(diǎn)間相干性大小進(jìn)行量化:
式中,,Pm1m2,、Pm1m1、Pm2m2分別為麥克風(fēng)m1,、m2信號(hào)的互功率譜密度和自功率譜密度,。
MSC值反映了不同信號(hào)在頻點(diǎn)k上的相干程度。如圖2所示,,對(duì)于近場(chǎng)平穩(wěn)聲源的兩路信號(hào),,在信號(hào)存在頻率范圍內(nèi),MSC值在1附近,,而在風(fēng)噪聲存在的低頻區(qū)域,,MSC值始終分布在0附近。圖3為包含風(fēng)噪聲的1幀信號(hào)MSC取值,。在風(fēng)噪聲存在的低頻范圍,,信號(hào)各頻點(diǎn)處0≤MSC≤1,且包含噪聲成分越多,,MSC取值越小,。風(fēng)噪聲頻率范圍外信號(hào)各頻點(diǎn)MSC接近1。但背景噪聲間也具有相干性[7],,其MSC取值滿足式(8),,其中dm1m2為麥克風(fēng)之間距離。因此使用相干差異消除風(fēng)噪聲干擾前需要預(yù)先消除背景噪聲,。
分析不同類型信號(hào)發(fā)現(xiàn),,只有無噪聲干擾的近場(chǎng)平穩(wěn)聲源信號(hào),各頻點(diǎn)間MSC值始終接近1,。其余信號(hào)頻點(diǎn)MSC取值在[0,,1]內(nèi)。因此可以利用信號(hào)間頻點(diǎn)的相干值檢測(cè)噪聲,,并通過加權(quán)方式只保留信號(hào)中未受干擾頻點(diǎn),。上述結(jié)論數(shù)學(xué)表達(dá)如式(9)所示,其中θwind為相干值閾值,。
不同于連續(xù)頻點(diǎn)權(quán)值計(jì)算基于單路信號(hào),,新權(quán)值計(jì)算同時(shí)基于2路信號(hào),,則式(3)可以表示為:
2.2 預(yù)增強(qiáng)信號(hào)
MCRA算法避免了信號(hào)活躍性檢測(cè)方法在低信噪和無聲段因高誤檢率引起的錯(cuò)誤估計(jì)。但MCRA算法在固定長(zhǎng)度時(shí)間窗內(nèi)搜索頻帶功率譜最小值,,產(chǎn)生噪聲估計(jì)滯后,。本文提出一種連續(xù)時(shí)域上的當(dāng)前功率譜最小值搜索方法,提高估計(jì)速度,。在搜索功率譜最小值前,,先做如下時(shí)域遞歸平滑獲得平滑功率譜值:
由于噪聲先驗(yàn)概率比為單調(diào)函數(shù),根據(jù)Bayes最小風(fēng)險(xiǎn)代價(jià)判決準(zhǔn)則,,MCRA算法使用信號(hào)功率譜與其局部最小值的比值Sr(l,,k)與固定閾值δ比較,判決頻點(diǎn)是否包含信號(hào)分量,,計(jì)算信號(hào)存在概率,。但是固定閾值δ僅適用于平穩(wěn)噪聲情況,對(duì)包含非平穩(wěn)噪聲情況判決不敏感,。根據(jù)信號(hào)頻率分布特性:風(fēng)噪聲分布在中低頻率區(qū)域,,中高頻部分為包含背景噪聲的聲源信號(hào),新算法選擇如下分段閾值δ(k):
2.3 算法運(yùn)算負(fù)載分析
移動(dòng)設(shè)備計(jì)算資源有限,,對(duì)算法實(shí)時(shí)性也有要求,,故必須考慮算法運(yùn)算量。對(duì)于包含M個(gè)麥克風(fēng)的陣列,,使用頻點(diǎn)加權(quán)GCC-PHAT算法估計(jì)TDOA,,信號(hào)每幀均需要執(zhí)行M次FFT和M(M-1)/2次IFFT操作。為簡(jiǎn)化分析,,假設(shè)傅里葉正,、逆變換運(yùn)算量相同,則M個(gè)麥克風(fēng)的陣列估計(jì)TDOA運(yùn)算量記為(M2+M)/2次運(yùn)算,,復(fù)雜度為O(M2),,故隨著陣列中麥克風(fēng)個(gè)數(shù)增加,算法運(yùn)算量快速上升,。
3 實(shí)驗(yàn)結(jié)果分析與對(duì)比
3.1 實(shí)驗(yàn)參數(shù)
本部分將在不同測(cè)試條件下比較不同頻點(diǎn)加權(quán)GCC-PHAT算法性能,。表1給出算法對(duì)應(yīng)參數(shù)。為確保時(shí)頻變換后獲取接收信號(hào)全部頻率成分,,設(shè)置fs為48 000 Hz,;接收信號(hào)每幀包含的采樣點(diǎn)數(shù)N對(duì)應(yīng)信號(hào)時(shí)長(zhǎng)在20 ms~30 ms,窗序列設(shè)置為相同長(zhǎng)度,;為保持平穩(wěn)信號(hào)幀間的連續(xù)性,,設(shè)幀步進(jìn)ΔN=N/2,即幀間50%重疊;c為20 ℃,、101.1 kPa條件下聲速,;ε是接近0的小數(shù),避免實(shí)際應(yīng)用中式(11)結(jié)果溢出,;判決閾值θwind,、θD、θmin取值依據(jù)多次實(shí)驗(yàn)結(jié)果確定,。根據(jù)表1中參數(shù),,算法引入延遲Δl·ΔN/fs=32 ms。在人機(jī)語(yǔ)音交互中,,這種量級(jí)的時(shí)間延遲可以忽略,。
基于IMAGE方法[9],,計(jì)算尺寸為10 m×8 m×3.5 m的混響房間模型的沖激響應(yīng)序列,。選擇一段7 s的語(yǔ)音作為目標(biāo)聲源信號(hào),卷積沖激序列模擬信號(hào)的混響效果,。目前沒有語(yǔ)料庫(kù)提供相應(yīng)的風(fēng)噪聲信號(hào),,需要通過實(shí)驗(yàn)采集。信號(hào)采集使用一對(duì)匹配全指向拜亞動(dòng)力MM1麥克風(fēng),,模擬氣流由空氣壓縮機(jī)產(chǎn)生,。以房間一角作為坐標(biāo)原點(diǎn)建立直角坐標(biāo)系,聲源及麥克風(fēng)位置見表2,。i,、j、k為x,、y,、z軸單位向量。
3.2 算法性能指標(biāo)
3.3 結(jié)果分析
圖5,、圖6分別為混響環(huán)境(RT60=200 ms)中的含噪(SNR=5 dB)信號(hào)的語(yǔ)譜圖以及不同頻點(diǎn)加權(quán)方法權(quán)值分布,。圖5(a)顯示風(fēng)噪聲集中在信號(hào)低頻區(qū)域,且隨時(shí)間快速變化,。MCRA算法不能準(zhǔn)確估計(jì)風(fēng)噪聲,,因此圖5(b)中頻點(diǎn)取的連續(xù)權(quán)值在低頻區(qū)域值接近1,對(duì)含風(fēng)噪聲頻點(diǎn)無衰減,,含噪信號(hào)頻點(diǎn)被帶入相關(guān)值計(jì)算,。圖6(a)中噪聲功率譜估計(jì)曲線顯示,對(duì)于平穩(wěn)噪聲,,因頻帶上的信號(hào)功率通常衰減的最小值接近噪聲功率值,,故基于最小值統(tǒng)計(jì)的算法消除平穩(wěn)背景噪聲效果好。但對(duì)于快速變化噪聲,算法設(shè)計(jì)依據(jù)決定估計(jì)值會(huì)產(chǎn)生滯后,,增強(qiáng)的信號(hào)仍包含風(fēng)噪聲,。同時(shí)表明信號(hào)增強(qiáng)方法不能消除風(fēng)噪聲干擾。本文提出算法對(duì)應(yīng)權(quán)值分布如圖6(b)所示,,判斷并直接去除信號(hào)低頻范圍內(nèi)受干擾頻點(diǎn)(權(quán)值為0),,只保留強(qiáng)相干性頻點(diǎn)(權(quán)值為1)。風(fēng)噪聲頻率范圍外中高頻區(qū)域的信號(hào)頻點(diǎn)則盡量保留,,帶入相關(guān)值計(jì)算,。
圖7為上述實(shí)驗(yàn)條件中使用不同權(quán)值的GCC-PHAT算法估計(jì)TDOA結(jié)果統(tǒng)計(jì)。實(shí)驗(yàn)結(jié)果表明,,不加權(quán)和使用連續(xù)權(quán)值的GCC-PHAT算法估計(jì)值統(tǒng)計(jì)峰值均在τc(Delay=-3)處,,對(duì)應(yīng)位置聲源為麥克風(fēng)表面湍流。只有使用wind mask權(quán)值加權(quán)的GCC-PHAT算法估計(jì)結(jié)果集中分布在τt(Delay=-18)附近,,對(duì)應(yīng)位置為目標(biāo)聲源,,滿足應(yīng)用要求。
表3為不同混響,、信噪比測(cè)試條件下,,不同頻點(diǎn)加權(quán)GCC-PHAT算法估計(jì)TDOA結(jié)果可靠性(Tpq)及運(yùn)算負(fù)載(Lpq)對(duì)比。實(shí)際場(chǎng)景中,,風(fēng)噪聲特殊的產(chǎn)生方式?jīng)Q定其必定對(duì)信號(hào)干擾嚴(yán)重,。如在低混響(RT60=0)、低信噪(SNR=0 dB)環(huán)境中,,使用wind mask加權(quán)算法估計(jì)結(jié)果對(duì)應(yīng)Tpq=54.2%,,優(yōu)于使用連續(xù)權(quán)值(31.2%)和不加權(quán)(20.1%)的GCC-PHAT算法。存在混響的低信噪環(huán)境(RT60=200 ms,,SNR=0 dB)中,,使用wind mask加權(quán)的算法結(jié)果對(duì)應(yīng)Tpq下降至48.6%,仍優(yōu)于其他加權(quán)算法,。盡管新的加權(quán)算法在混響情況下運(yùn)算量有所增加,,但均顯著低于其他已有算法。實(shí)驗(yàn)證明,,存在風(fēng)噪聲干擾的場(chǎng)景中,,使用本文提出算法所得結(jié)果更加可靠,運(yùn)算量也更小,。
4 結(jié)論
通過GCC-PHAT算法估計(jì)TDOA值帶入波束成形算法是定位聲源的常用方法,。本文針對(duì)已有GCC-PHAT算法無法消除風(fēng)噪聲干擾問題原因進(jìn)行分析,并通過對(duì)目標(biāo)信號(hào)和噪聲信號(hào)時(shí)頻特性研究,,提出一種基于信號(hào)間頻點(diǎn)相干性差異的頻點(diǎn)離散值加權(quán)GCC-PHAT算法,。實(shí)驗(yàn)表明,,相較使用基于信噪比估計(jì)的連續(xù)值頻點(diǎn)加權(quán)算法,本文提出的方法所得結(jié)果準(zhǔn)確可靠,,運(yùn)算量小,,具有一定的工程實(shí)用價(jià)值。
參考文獻(xiàn)
[1] BADALI A,,VALIN J M,,MICHAUD F,et al.Evaluating real-time audio localization algorithms for artificial audition in robotics[C].IEEE/RSJ International Conference on Intelligent Robots and Systems,,2009,,IROS 2009,IEEE,,2009:2033-2038.
[2] VALIN J M,,MICHAUD F,ROUAT J.Robust localization and tracking of simultaneous moving sound sources using beamforming and particle filtering[J].Robotics and Autonomous Systems,,2007,,55(3):216-228.
[3] COHEN I,BERDUGO B.Noise estimation by minima controlled recursive averaging for robust speech enhancement[J].IEEE Signal Processing Letters,,2002,,9(1):12-15.
[4] 夏丙寅,鮑長(zhǎng)春.適應(yīng)噪聲強(qiáng)度突變的噪聲估計(jì)加速方法[J].信號(hào)處理,,2013,29(10):1336-1345.
[5] 宋知用.MATLAB在語(yǔ)音信號(hào)分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,,2013.
[6] NELKE C M,,VARY P.Measurement, analysis and simulation of wind noise signals for mobile communication devices[C].2014 14th International Workshop on Acoustic Signal Enhancement(IWAENC),IEEE,,2014:327-331.
[7] NELKE C M,,VARY P.Dual microphone wind noise reduction by exploiting the complex coherence[C].Proceedings of Speech Communication,11.ITG Symposium,,VDE,,2014:1-4.
[8] LOIZOU P C.語(yǔ)音增強(qiáng)-理論與實(shí)踐[M].高毅,肖莉,,鄧方,,譯.成都:電子科技大學(xué)出版社,2012.
[9] 武曉光,,郭天文.基于房間沖激響應(yīng)的聲學(xué)模型的建立和仿真[J].微電子學(xué)與計(jì)算機(jī),,2014(4):56-59.
作者信息:
喬 健,王建明
(南京工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,,江蘇 南京211816)