《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法
抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法
2018年電子技術(shù)應(yīng)用第3期
喬 健,王建明
南京工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,,江蘇 南京211816
摘要: 針對(duì)麥克風(fēng)陣列使用GCC-PHAT算法估計(jì)信號(hào)到達(dá)時(shí)差對(duì)加性噪聲敏感,,以及基于信噪比估計(jì)的連續(xù)值加權(quán)GCC-PHAT算法無法消除環(huán)境中類似風(fēng)噪聲的變化噪聲干擾的情況,提出了一種抑制風(fēng)噪聲的頻點(diǎn)加權(quán)GCC-PHAT算法,。通過分析已有算法的不足,,新算法選擇使用離散頻點(diǎn)加權(quán),并通過信號(hào)頻點(diǎn)間相干性量化值和時(shí)域關(guān)聯(lián)性計(jì)算權(quán)值,,去除風(fēng)噪聲干擾頻點(diǎn),;同時(shí)估計(jì)聲源信號(hào)活躍度,調(diào)整算法運(yùn)算量,。實(shí)驗(yàn)表明,,與已有的GCC-PHAT算法相比,新算法能有效消除風(fēng)噪聲對(duì)估計(jì)結(jié)果的干擾,,同時(shí)降低運(yùn)算負(fù)載,。
中圖分類號(hào): TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.173520
中文引用格式: 喬健,王建明. 抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法[J].電子技術(shù)應(yīng)用,,2018,,44(3):72-76,80.
英文引用格式: Qiao Jian,,Wang Jianming. GCC-PHAT time difference estimation algorithm based on binary frequency weight with suppressing wind noise[J]. Application of Electronic Technique,,2018,44(3):72-76,,80.

GCC-PHAT time difference estimation algorithm based on binary frequency weight with suppressing wind noise
Qiao Jian,,Wang Jianming
Department of Computer Science and Technology,Nanjing Tech University,,Nanjing 211816,,China
Abstract: Aiming at the problems that GCC-PHAT algorithm is sensitive to additive noise and the weighted GCC-PHAT algorithm based on prior SNR can′t eliminate the jamming of non-stationary noise——wind noise, an improved GCC-PHAT algorithm is presented.The improved algorithm utilizes the binary frequency weight calculated by magnitude of coherence and correlation in signal adjacent frames to eliminate frequency component disturbed by wind noise. Meanwhile, computational load of the algorithm would be modulated with voice activity according to binary weight. The experiment results show that the proposed algorithm can effectively suppress wind noise and significantly improve computational load.
Key words : GCC; TDOA; binary frequency weight; wind noise

0 引言

    準(zhǔn)確定位聲源是移動(dòng)設(shè)備進(jìn)行聽覺場(chǎng)景分析的首要步驟,其結(jié)果對(duì)后續(xù)混合聲源分離,、聲源辨識(shí),、語(yǔ)音識(shí)別有直接影響。延時(shí)求和波束形成[1]技術(shù)在進(jìn)行聲源定位時(shí)已被廣泛使用,,需要使用信號(hào)到達(dá)麥克風(fēng)陣列中不同麥克風(fēng)的時(shí)間差值(Time Difference Of Arrival,,TDOA)。而相位變換廣義互相關(guān)(Generalized Cross Correlation-Phase Transform,,GCC-PHAT)算法具有很短的判決時(shí)延和較好的跟蹤能力,,適用于低混響環(huán)境,是常用的TDOA估計(jì)算法,。

    VALIN J M提出了一種使用遞歸方法計(jì)算權(quán)值的改進(jìn)的GCC-PHAT算法[2],,即連續(xù)值頻點(diǎn)加權(quán)GCC-PHAT算法,來提高原算法對(duì)加性噪聲的魯棒性,。連續(xù)權(quán)值計(jì)算需要使用最小值控制遞歸平均[3](Minimum Controlled Recursive Averaging,,MCRA)算法估計(jì)噪聲,但MCRA算法在噪聲變化后需要適應(yīng)時(shí)間調(diào)整參數(shù)[4],,因而對(duì)于加性非平穩(wěn)間或噪聲,,使用連續(xù)權(quán)值的加權(quán)方法無法消除其干擾,最終導(dǎo)致TDOA估計(jì)錯(cuò)誤,。因此本文在頻點(diǎn)加權(quán)GCC-PHAT算法的基礎(chǔ)上,,利用接收信號(hào)中風(fēng)噪聲與聲源信號(hào)頻點(diǎn)間相干性差異,提出一種頻點(diǎn)離散值加權(quán)GCC-PHAT算法,,以消除風(fēng)噪聲及背景噪聲對(duì)TDOA估計(jì)的干擾,。實(shí)驗(yàn)結(jié)果表明,相較原算法,,新算法的結(jié)果可靠性和運(yùn)算效率都明顯提高,。

1 互相關(guān)算法估計(jì)信號(hào)時(shí)差

1.1 場(chǎng)景聲學(xué)模型

    設(shè)聲源信號(hào)在存在加性噪聲的混響環(huán)境中傳播,由麥克風(fēng)陣列接收,。加性噪聲由背景噪聲和風(fēng)噪聲組成,。風(fēng)噪聲是一種特殊的非平穩(wěn)噪聲,由麥克風(fēng)薄膜表面湍流產(chǎn)生,,導(dǎo)致接收信號(hào)產(chǎn)生嚴(yán)重畸變,。背景噪聲在聲學(xué)環(huán)境中近似為遠(yuǎn)場(chǎng)聲源產(chǎn)生的彌漫性噪聲。聲源信號(hào)與風(fēng)噪聲及背景噪聲等加性噪聲不相關(guān),。

    設(shè)n為信號(hào)時(shí)域采樣序號(hào),,m為陣列中麥克風(fēng)編號(hào),,s(n)為聲源信號(hào),hm(n)是聲源到麥克風(fēng)m之間的房間系統(tǒng)沖擊響應(yīng)序列,,wm(n)表示風(fēng)噪聲,,bm(n)為背景噪聲信號(hào)。背景噪聲不需要考慮混響,,則麥克風(fēng)m接收信號(hào)ym(n)表示為:

    ck6-gs1.gif

1.2 頻點(diǎn)加權(quán)GCC-PHAT算法

    接收信號(hào)在整個(gè)時(shí)間域上非平穩(wěn),。利用接收信號(hào)短時(shí)平穩(wěn)特性,通過短時(shí)傅里葉變換,,將分幀后信號(hào)變換到時(shí)頻域分析[5],。選擇長(zhǎng)度為N的海寧窗h(n)對(duì)接收信號(hào)分幀,減小信號(hào)幀間頻率截?cái)嘈?yīng),。設(shè)信號(hào)幀間步進(jìn)長(zhǎng)度為ΔN個(gè)采樣間隔,,則接收信號(hào)第l幀表示為ym(lΔN+n),其傅里葉變換結(jié)果為:

ck6-gs2-4.gif

2 離散值頻點(diǎn)加權(quán)GCC-PHAT算法

2.1 離散頻點(diǎn)權(quán)值

    VALIN J M等人提出的頻點(diǎn)連續(xù)權(quán)值計(jì)算基于先驗(yàn)信噪比(Signal-to-Noise Ratio,,SNR)估計(jì),。頻點(diǎn)k對(duì)應(yīng)的連續(xù)權(quán)值為:

ck6-gs5-6.gif

式中,ck6-gs5-6-x1.gif為MCRA算法所得噪聲功率譜估計(jì),。

    連續(xù)權(quán)值是關(guān)于信噪比的單調(diào)函數(shù),,值域?yàn)閇0,1],,用soft mask表示,,取值如圖1所示。

ck6-t1.gif

    頻點(diǎn)連續(xù)權(quán)值計(jì)算依賴噪聲功率譜估計(jì)和信號(hào)相鄰幀間信噪值連續(xù)性,。比較風(fēng)噪聲和語(yǔ)音信號(hào)瞬時(shí)功率隨時(shí)間的變化曲線,,可以看出風(fēng)噪聲時(shí)域變化特性強(qiáng)于語(yǔ)音信號(hào)[6]。現(xiàn)有語(yǔ)音增強(qiáng)算法均默認(rèn)噪聲變化慢于語(yǔ)音,,故對(duì)于包含風(fēng)噪聲的信號(hào),,上述方法無法得出先驗(yàn)信噪比。且連續(xù)權(quán)值取值為[0,,1],,當(dāng)聲源信號(hào)受噪聲嚴(yán)重干擾(SNR<0)時(shí),信號(hào)頻點(diǎn)對(duì)應(yīng)權(quán)值大于零,,加權(quán)后信號(hào)仍然保留噪聲成分,,導(dǎo)致最終TDOA估計(jì)出錯(cuò)。本文在已有頻點(diǎn)加權(quán)方法基礎(chǔ)上提出一種使用頻點(diǎn)離散權(quán)值的風(fēng)噪聲抑制算法,。新權(quán)值是關(guān)于信號(hào)頻點(diǎn)相干值的函數(shù),,不依賴噪聲估計(jì),且只取離散值0和1,完全消除含噪頻點(diǎn)對(duì)TDOA估計(jì)結(jié)果的干擾,。新權(quán)值ck6-t1-x1.gif用wind mask表示,。

    風(fēng)噪聲由麥克風(fēng)表面的湍流產(chǎn)生,不同麥克風(fēng)間風(fēng)噪聲頻點(diǎn)無相干性,。但對(duì)于同一聲源信號(hào),,陣列中麥克風(fēng)的接收信號(hào)在各頻點(diǎn)上都具有高相干性,。引入相干譜值(Magnitude Squared Coherence,,MSC),對(duì)信號(hào)各頻點(diǎn)間相干性大小進(jìn)行量化:

    ck6-gs7.gif

式中,,Pm1m2,、Pm1m1、Pm2m2分別為麥克風(fēng)m1,、m2信號(hào)的互功率譜密度和自功率譜密度,。

    MSC值反映了不同信號(hào)在頻點(diǎn)k上的相干程度。如圖2所示,,對(duì)于近場(chǎng)平穩(wěn)聲源的兩路信號(hào),,在信號(hào)存在頻率范圍內(nèi),MSC值在1附近,,而在風(fēng)噪聲存在的低頻區(qū)域,,MSC值始終分布在0附近。圖3為包含風(fēng)噪聲的1幀信號(hào)MSC取值,。在風(fēng)噪聲存在的低頻范圍,,信號(hào)各頻點(diǎn)處0≤MSC≤1,且包含噪聲成分越多,,MSC取值越小,。風(fēng)噪聲頻率范圍外信號(hào)各頻點(diǎn)MSC接近1。但背景噪聲間也具有相干性[7],,其MSC取值滿足式(8),,其中dm1m2為麥克風(fēng)之間距離。因此使用相干差異消除風(fēng)噪聲干擾前需要預(yù)先消除背景噪聲,。

    ck6-gs8.gif

ck6-t2.gif

ck6-t3.gif

    分析不同類型信號(hào)發(fā)現(xiàn),,只有無噪聲干擾的近場(chǎng)平穩(wěn)聲源信號(hào),各頻點(diǎn)間MSC值始終接近1,。其余信號(hào)頻點(diǎn)MSC取值在[0,,1]內(nèi)。因此可以利用信號(hào)間頻點(diǎn)的相干值檢測(cè)噪聲,,并通過加權(quán)方式只保留信號(hào)中未受干擾頻點(diǎn),。上述結(jié)論數(shù)學(xué)表達(dá)如式(9)所示,其中θwind為相干值閾值,。

    ck6-gs9.gif

ck6-t4.gif

ck6-gs10.gif

    不同于連續(xù)頻點(diǎn)權(quán)值計(jì)算基于單路信號(hào),,新權(quán)值計(jì)算同時(shí)基于2路信號(hào),,則式(3)可以表示為:

    ck6-gs11.gif

2.2 預(yù)增強(qiáng)信號(hào)

    MCRA算法避免了信號(hào)活躍性檢測(cè)方法在低信噪和無聲段因高誤檢率引起的錯(cuò)誤估計(jì)。但MCRA算法在固定長(zhǎng)度時(shí)間窗內(nèi)搜索頻帶功率譜最小值,,產(chǎn)生噪聲估計(jì)滯后,。本文提出一種連續(xù)時(shí)域上的當(dāng)前功率譜最小值搜索方法,提高估計(jì)速度,。在搜索功率譜最小值前,,先做如下時(shí)域遞歸平滑獲得平滑功率譜值:

ck6-gs12-13.gif

    由于噪聲先驗(yàn)概率比為單調(diào)函數(shù),根據(jù)Bayes最小風(fēng)險(xiǎn)代價(jià)判決準(zhǔn)則,,MCRA算法使用信號(hào)功率譜與其局部最小值的比值Sr(l,,k)與固定閾值δ比較,判決頻點(diǎn)是否包含信號(hào)分量,,計(jì)算信號(hào)存在概率,。但是固定閾值δ僅適用于平穩(wěn)噪聲情況,對(duì)包含非平穩(wěn)噪聲情況判決不敏感,。根據(jù)信號(hào)頻率分布特性:風(fēng)噪聲分布在中低頻率區(qū)域,,中高頻部分為包含背景噪聲的聲源信號(hào),新算法選擇如下分段閾值δ(k):

ck6-gs14-16.gif

2.3 算法運(yùn)算負(fù)載分析

    移動(dòng)設(shè)備計(jì)算資源有限,,對(duì)算法實(shí)時(shí)性也有要求,,故必須考慮算法運(yùn)算量。對(duì)于包含M個(gè)麥克風(fēng)的陣列,,使用頻點(diǎn)加權(quán)GCC-PHAT算法估計(jì)TDOA,,信號(hào)每幀均需要執(zhí)行M次FFT和M(M-1)/2次IFFT操作。為簡(jiǎn)化分析,,假設(shè)傅里葉正,、逆變換運(yùn)算量相同,則M個(gè)麥克風(fēng)的陣列估計(jì)TDOA運(yùn)算量記為(M2+M)/2次運(yùn)算,,復(fù)雜度為O(M2),,故隨著陣列中麥克風(fēng)個(gè)數(shù)增加,算法運(yùn)算量快速上升,。

ck6-gs17.gif

3 實(shí)驗(yàn)結(jié)果分析與對(duì)比

3.1 實(shí)驗(yàn)參數(shù)

    本部分將在不同測(cè)試條件下比較不同頻點(diǎn)加權(quán)GCC-PHAT算法性能,。表1給出算法對(duì)應(yīng)參數(shù)。為確保時(shí)頻變換后獲取接收信號(hào)全部頻率成分,,設(shè)置fs為48 000 Hz,;接收信號(hào)每幀包含的采樣點(diǎn)數(shù)N對(duì)應(yīng)信號(hào)時(shí)長(zhǎng)在20 ms~30 ms,窗序列設(shè)置為相同長(zhǎng)度,;為保持平穩(wěn)信號(hào)幀間的連續(xù)性,,設(shè)幀步進(jìn)ΔN=N/2,即幀間50%重疊;c為20 ℃,、101.1 kPa條件下聲速,;ε是接近0的小數(shù),避免實(shí)際應(yīng)用中式(11)結(jié)果溢出,;判決閾值θwind,、θD、θmin取值依據(jù)多次實(shí)驗(yàn)結(jié)果確定,。根據(jù)表1中參數(shù),,算法引入延遲Δl·ΔN/fs=32 ms。在人機(jī)語(yǔ)音交互中,,這種量級(jí)的時(shí)間延遲可以忽略,。

ck6-b1.gif

    基于IMAGE方法[9],,計(jì)算尺寸為10 m×8 m×3.5 m的混響房間模型的沖激響應(yīng)序列,。選擇一段7 s的語(yǔ)音作為目標(biāo)聲源信號(hào),卷積沖激序列模擬信號(hào)的混響效果,。目前沒有語(yǔ)料庫(kù)提供相應(yīng)的風(fēng)噪聲信號(hào),,需要通過實(shí)驗(yàn)采集。信號(hào)采集使用一對(duì)匹配全指向拜亞動(dòng)力MM1麥克風(fēng),,模擬氣流由空氣壓縮機(jī)產(chǎn)生,。以房間一角作為坐標(biāo)原點(diǎn)建立直角坐標(biāo)系,聲源及麥克風(fēng)位置見表2,。i,、j、k為x,、y,、z軸單位向量。

ck6-b2.gif

3.2 算法性能指標(biāo)

ck6-gs18-21.gif

3.3 結(jié)果分析

    圖5,、圖6分別為混響環(huán)境(RT60=200 ms)中的含噪(SNR=5 dB)信號(hào)的語(yǔ)譜圖以及不同頻點(diǎn)加權(quán)方法權(quán)值分布,。圖5(a)顯示風(fēng)噪聲集中在信號(hào)低頻區(qū)域,且隨時(shí)間快速變化,。MCRA算法不能準(zhǔn)確估計(jì)風(fēng)噪聲,,因此圖5(b)中頻點(diǎn)取的連續(xù)權(quán)值在低頻區(qū)域值接近1,對(duì)含風(fēng)噪聲頻點(diǎn)無衰減,,含噪信號(hào)頻點(diǎn)被帶入相關(guān)值計(jì)算,。圖6(a)中噪聲功率譜估計(jì)曲線顯示,對(duì)于平穩(wěn)噪聲,,因頻帶上的信號(hào)功率通常衰減的最小值接近噪聲功率值,,故基于最小值統(tǒng)計(jì)的算法消除平穩(wěn)背景噪聲效果好。但對(duì)于快速變化噪聲,算法設(shè)計(jì)依據(jù)決定估計(jì)值會(huì)產(chǎn)生滯后,,增強(qiáng)的信號(hào)仍包含風(fēng)噪聲,。同時(shí)表明信號(hào)增強(qiáng)方法不能消除風(fēng)噪聲干擾。本文提出算法對(duì)應(yīng)權(quán)值分布如圖6(b)所示,,判斷并直接去除信號(hào)低頻范圍內(nèi)受干擾頻點(diǎn)(權(quán)值為0),,只保留強(qiáng)相干性頻點(diǎn)(權(quán)值為1)。風(fēng)噪聲頻率范圍外中高頻區(qū)域的信號(hào)頻點(diǎn)則盡量保留,,帶入相關(guān)值計(jì)算,。

ck6-t5.gif

ck6-t6.gif

    圖7為上述實(shí)驗(yàn)條件中使用不同權(quán)值的GCC-PHAT算法估計(jì)TDOA結(jié)果統(tǒng)計(jì)。實(shí)驗(yàn)結(jié)果表明,,不加權(quán)和使用連續(xù)權(quán)值的GCC-PHAT算法估計(jì)值統(tǒng)計(jì)峰值均在τc(Delay=-3)處,,對(duì)應(yīng)位置聲源為麥克風(fēng)表面湍流。只有使用wind mask權(quán)值加權(quán)的GCC-PHAT算法估計(jì)結(jié)果集中分布在τt(Delay=-18)附近,,對(duì)應(yīng)位置為目標(biāo)聲源,,滿足應(yīng)用要求。

ck6-t7.gif

    表3為不同混響,、信噪比測(cè)試條件下,,不同頻點(diǎn)加權(quán)GCC-PHAT算法估計(jì)TDOA結(jié)果可靠性(Tpq)及運(yùn)算負(fù)載(Lpq)對(duì)比。實(shí)際場(chǎng)景中,,風(fēng)噪聲特殊的產(chǎn)生方式?jīng)Q定其必定對(duì)信號(hào)干擾嚴(yán)重,。如在低混響(RT60=0)、低信噪(SNR=0 dB)環(huán)境中,,使用wind mask加權(quán)算法估計(jì)結(jié)果對(duì)應(yīng)Tpq=54.2%,,優(yōu)于使用連續(xù)權(quán)值(31.2%)和不加權(quán)(20.1%)的GCC-PHAT算法。存在混響的低信噪環(huán)境(RT60=200 ms,,SNR=0 dB)中,,使用wind mask加權(quán)的算法結(jié)果對(duì)應(yīng)Tpq下降至48.6%,仍優(yōu)于其他加權(quán)算法,。盡管新的加權(quán)算法在混響情況下運(yùn)算量有所增加,,但均顯著低于其他已有算法。實(shí)驗(yàn)證明,,存在風(fēng)噪聲干擾的場(chǎng)景中,,使用本文提出算法所得結(jié)果更加可靠,運(yùn)算量也更小,。

ck6-b3.gif

4 結(jié)論

    通過GCC-PHAT算法估計(jì)TDOA值帶入波束成形算法是定位聲源的常用方法,。本文針對(duì)已有GCC-PHAT算法無法消除風(fēng)噪聲干擾問題原因進(jìn)行分析,并通過對(duì)目標(biāo)信號(hào)和噪聲信號(hào)時(shí)頻特性研究,,提出一種基于信號(hào)間頻點(diǎn)相干性差異的頻點(diǎn)離散值加權(quán)GCC-PHAT算法,。實(shí)驗(yàn)表明,,相較使用基于信噪比估計(jì)的連續(xù)值頻點(diǎn)加權(quán)算法,本文提出的方法所得結(jié)果準(zhǔn)確可靠,,運(yùn)算量小,,具有一定的工程實(shí)用價(jià)值。

參考文獻(xiàn)

[1] BADALI A,,VALIN J M,,MICHAUD F,et al.Evaluating real-time audio localization algorithms for artificial audition in robotics[C].IEEE/RSJ International Conference on Intelligent Robots and Systems,,2009,,IROS 2009,IEEE,,2009:2033-2038.

[2] VALIN J M,,MICHAUD F,ROUAT J.Robust localization and tracking of simultaneous moving sound sources using beamforming and particle filtering[J].Robotics and Autonomous Systems,,2007,,55(3):216-228.

[3] COHEN I,BERDUGO B.Noise estimation by minima controlled recursive averaging for robust speech enhancement[J].IEEE Signal Processing Letters,,2002,,9(1):12-15.

[4] 夏丙寅,鮑長(zhǎng)春.適應(yīng)噪聲強(qiáng)度突變的噪聲估計(jì)加速方法[J].信號(hào)處理,,2013,29(10):1336-1345.

[5] 宋知用.MATLAB在語(yǔ)音信號(hào)分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,,2013.

[6] NELKE C M,,VARY P.Measurement, analysis and simulation of wind noise signals for mobile communication devices[C].2014 14th International Workshop on Acoustic Signal Enhancement(IWAENC),IEEE,,2014:327-331.

[7] NELKE C M,,VARY P.Dual microphone wind noise reduction by exploiting the complex coherence[C].Proceedings of Speech Communication,11.ITG Symposium,,VDE,,2014:1-4.

[8] LOIZOU P C.語(yǔ)音增強(qiáng)-理論與實(shí)踐[M].高毅,肖莉,,鄧方,,譯.成都:電子科技大學(xué)出版社,2012.

[9] 武曉光,,郭天文.基于房間沖激響應(yīng)的聲學(xué)模型的建立和仿真[J].微電子學(xué)與計(jì)算機(jī),,2014(4):56-59.



作者信息:

喬  健,王建明 

(南京工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,,江蘇 南京211816)

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。