??? 摘? 要: 分析了耳蝸濾波器與小波變換" title="小波變換" target="_blank">小波變換的相似性,,以耳蝸頻率響應(yīng)為基礎(chǔ),,設(shè)計(jì)出相應(yīng)的小波變換基函數(shù),,并通過二進(jìn)尺度變換得到一組小波作為耳蝸濾波器組,。研究了利用該小波濾波器組進(jìn)行多分辨率分析的數(shù)字實(shí)現(xiàn)方法,,給出了相應(yīng)的分析濾波器,。理論和實(shí)驗(yàn)結(jié)果均表明,,利用小波變換來(lái)實(shí)現(xiàn)耳蝸濾波器組是可行的。?
??? 關(guān)鍵詞: 耳蝸濾波器組; 離散小波變換; 多分辨分析; 語(yǔ)音信號(hào)處理
?
??? 耳蝸濾波器在語(yǔ)音增強(qiáng),、語(yǔ)音編碼,、語(yǔ)音識(shí)別等方面得到了廣泛的應(yīng)用[1-2]。耳蝸濾波器的設(shè)計(jì)因此也成了語(yǔ)音信號(hào)處理研究的一個(gè)熱點(diǎn),。耳蝸濾波器組的實(shí)現(xiàn)通常是在各頻率點(diǎn)上分別設(shè)計(jì)濾波器,,然后利用VLSI(Very Large Scale Integration)來(lái)實(shí)現(xiàn)。這種方法設(shè)計(jì)出的濾波器各通道相互獨(dú)立,,參數(shù)調(diào)整需要分別進(jìn)行,,增加了濾波器設(shè)計(jì)和修改的復(fù)雜度,并且由于采用模擬的方法,,其可靠性和靈活性都受到了很大的限制[3],。數(shù)字耳蝸的實(shí)現(xiàn)近年來(lái)得到了廣泛的關(guān)注。Kate在1991年就提出了耳蝸濾波器數(shù)字實(shí)現(xiàn)的軟件算法,,Summerfield于1992年利用ASIC實(shí)現(xiàn)了該算法[4],。然而這種數(shù)字濾波器是對(duì)耳蝸濾波器高度簡(jiǎn)化的模式,它只是由一個(gè)二階濾波器后級(jí)聯(lián)數(shù)個(gè)一階濾波器構(gòu)成,。1997年,,Lim[5]設(shè)計(jì)出了基于VHDL的耳蝸濾波器組模型,不過他的濾波器是一階Butterworth濾波器,。隨后也出現(xiàn)了一系列的數(shù)字濾波器模型, 然而這些濾波器都是對(duì)耳蝸濾波器組的高度簡(jiǎn)化,,其頻率響應(yīng)與生物學(xué)的測(cè)試結(jié)果也相去較遠(yuǎn)。2002年,Apurva Mishra[6]以耳蝸濾波器的Hubbard’s TWAmp模型的頻率響應(yīng)為基礎(chǔ),,通過最小均方誤差算法對(duì)模型的頻率響應(yīng)進(jìn)行擬合,,從而設(shè)計(jì)出數(shù)字濾波器的系數(shù),他采用IIR的方式來(lái)實(shí)現(xiàn),,這種方法設(shè)計(jì)出的濾波器雖然與生物學(xué)模型吻合較好,但其普適性和設(shè)計(jì)的靈活性較差,,而且IIR為非線性相位濾波器,,相位失真會(huì)對(duì)聽覺系統(tǒng)后續(xù)處理產(chǎn)生影響。?
??? 本研究將小波變換的多分辨時(shí)頻分析思想引入到耳蝸濾波器組的設(shè)計(jì)中,。利用生理學(xué)上獲得的耳蝸頻率響應(yīng)數(shù)據(jù)設(shè)計(jì)小波基函數(shù) (母小波),,通過母小波獲得一組二進(jìn)制離散小波基作為耳蝸濾波器組。這組濾波器覆蓋了人類聽覺范圍,,并且由于它們都源自母小波,,所以具有很好的一致性,其頻率響應(yīng)與生理學(xué)結(jié)果也能很好地吻合,。?
1 小波變換與耳蝸濾波器?
??? 耳蝸是內(nèi)耳的主要組成部分,,它是一條蝸牛狀卷曲的管子,里面充滿了液體,其形狀示意如圖1(a)所示,。在耳蝸液體的中部有基膜,,當(dāng)有聲波進(jìn)入時(shí),基膜的不同區(qū)域會(huì)對(duì)不同頻率產(chǎn)生最大程度的響應(yīng),,即沿基膜發(fā)生“諧振”,。沿耳蝸各點(diǎn)的諧振頻率分布如圖1(a)所示。發(fā)生諧振時(shí),,基膜上的內(nèi)毛細(xì)胞會(huì)將諧振信息轉(zhuǎn)換為神經(jīng)脈沖并通過聽覺神經(jīng)傳輸?shù)酱竽X,,也就是說(shuō),耳蝸的不同位置允許不同頻率的聲波信號(hào)通過[7],。從這種響應(yīng)模式的耳蝸的作用相當(dāng)于沿基膜放置的一組帶通濾波器,。實(shí)驗(yàn)數(shù)據(jù)表明,這組濾波器的帶寬成對(duì)數(shù)增大,,其頻率響應(yīng)曲線呈現(xiàn)恒定Q值的特點(diǎn),,并且這些濾波器具有非對(duì)稱的頻率響應(yīng),在高頻端比在低頻端的下降更為陡峭,。這種結(jié)構(gòu)的濾波器組為聽覺系統(tǒng)提供了一個(gè)多分辨率分析系統(tǒng):當(dāng)輸入為快速變化持續(xù)時(shí)間短的信號(hào)時(shí),,其頻率高,將會(huì)在高諧振頻率的通道產(chǎn)生激勵(lì),,而此通道濾波器帶寬大,,可以獲得高的時(shí)間分辨率;而對(duì)頻譜尖銳的信號(hào)則可提供很好的頻率分辨率,。所以,,聽覺系統(tǒng)的時(shí)頻分析具有很高的靈活性和自適應(yīng)性。?
?
?
??? 拉直后的耳蝸的頻率響應(yīng)特性如圖1(b)所示,,其中心頻率隨位置呈對(duì)數(shù)分布,,將其頻率響應(yīng)記為Hω(x-ln(ω))[8],ln(ω)表示自然底對(duì)數(shù),。?
??? 假設(shè)輸入信號(hào)f(t),,其Fourier變換?
????
??? ??
??? 這正是輸入信號(hào)f(t)的連續(xù)小波變換。τ為平移參數(shù),,s為尺度參數(shù),。小波變換的基函數(shù)(母小波):?
?????
式中,WTf(s,τ)表示f(t)的小波變換,,其中的*表示卷積,。取不同的尺度因子s,得到一組濾波器Ψs(τ),這組小波濾波器具有恒定的Q值,,這與耳蝸濾波器組的恒Q特性也是相符的,。?
??? 離散小波變換的小波基Ψn,m(t)是通過對(duì)小波的尺度參數(shù)和平移參數(shù)抽樣得到的,。實(shí)際中采用最多的是二進(jìn)制抽樣,am=2-m,,τn=nam,得到離散化小波:?
??? hn,m(t)=2m/2h(2mt-n), m,n∈Z?
??? 這是一種自然的抽樣,,當(dāng)比例因子以2為倍數(shù)增大時(shí),小波濾波器的帶寬以2為倍數(shù)減小,,同時(shí),,平移的抽樣率也以2為倍數(shù)減小,這樣,一半的帶寬采用一半的抽樣率,,可以有效避免數(shù)據(jù)冗余,。二進(jìn)制小波濾波器組的自適應(yīng)性表現(xiàn)在:它利用一組恒Q值的帶通濾波器將信號(hào)劃分為若干倍頻頻帶,并且在各頻帶內(nèi)的時(shí)間抽樣與帶寬成正比,。?
??? 上述分析表明,,小波變換的特點(diǎn)與耳蝸的頻率分析特性極為相似,小波變換引入耳蝸濾波器組的設(shè)計(jì)中,。從耳蝸頻率響應(yīng)的實(shí)測(cè)數(shù)據(jù)中獲得Hω(x-ln(ω)),,便可根據(jù)(6)式計(jì)算小波基,進(jìn)而通過尺度變換得到一組帶通濾波器,,可以大大簡(jiǎn)化濾波器設(shè)計(jì),。傳統(tǒng)的耳蝸濾波器組設(shè)計(jì)方法是對(duì)各通道分別設(shè)計(jì),各通道相互獨(dú)立,,參數(shù)調(diào)整需要分別進(jìn)行,,增加了濾波器設(shè)計(jì)的復(fù)雜度。而基于小波變換的濾波器組設(shè)計(jì)就可以很好地回避這個(gè)問題,。?
2 聽覺小波濾波器組的設(shè)計(jì)與實(shí)現(xiàn)?
??? 人耳耳蝸?lái)憫?yīng)的頻率范圍大約為20 Hz~20 kHz,,其對(duì)數(shù)中心頻率大約為f0=1 kHz。參考文獻(xiàn)[9]給出了這一中心頻率的耳蝸濾波器的幅頻響應(yīng)曲線,如圖2所示,。
?
?
??? 利用MATLAB的invfreqz函數(shù)設(shè)計(jì)具有上述幅頻特性的濾波器系數(shù),。這種方法設(shè)計(jì)出的濾波器的頻率響應(yīng)是給定頻率響應(yīng)在最小均方誤差意義上的逼近。通過這組濾波器的系數(shù)便可得到相應(yīng)的小波基函數(shù)Ψ(t),,如圖3所示,。?
?
?
??? 以該沖擊響應(yīng)為小波基函數(shù),通過二進(jìn)制尺度變換得到一組小波,這組小波濾波器的中心頻率從62.5 Hz(1 kHz×2-4)到16 kHz(1 kHz×24)呈對(duì)數(shù)分布,其幅頻響應(yīng)如圖4所示,。與基于物理學(xué)原理的耳蝸濾波器模型的頻率響應(yīng)相比較,,可以看出,,該小波濾波器組反映出了耳蝸濾波器的本質(zhì)特征,。圖5是基于物理學(xué)原理的耳蝸濾波器模型在各倍頻程上的頻率響應(yīng)。?
?
?
?
??? 得到小波函數(shù)Ψ(t)后,,便可通過式(8)設(shè)計(jì)尺度函數(shù)φ(t)[10],,得到的φ(t)如圖6所示,。?
?
?
????
??? 結(jié)合Ψ(t)和φ(t),通過關(guān)系式(9),、式(10)計(jì)算二進(jìn)制小波用于多分辨率分析的低通濾波器H(ω)和高通濾波器G(ω),進(jìn)而得到濾波器系數(shù)h(n)和g(n)[11-12],,如圖7所示。?
?
?
?????
??? 二進(jìn)聽覺小波多分辨率分析實(shí)現(xiàn)框圖如圖8所示,。?
?
?
3 實(shí)驗(yàn)結(jié)果及討論?
??? 圖9為用上述設(shè)計(jì)的聽覺小波濾波器組對(duì)實(shí)際的語(yǔ)音信號(hào)進(jìn)行處理的各通道的處理結(jié)果,。其輸入信號(hào)為男音,內(nèi)容為“we,,be”,,采樣率為10 kHz,8 bit量化,。濾波器組的輸出經(jīng)過全波整流和低通濾波(截止頻率300 Hz,,二階IIR濾波器)。?
?
?
??? 圖9中,,a是輸入語(yǔ)音信號(hào)的波形,,b~g為各倍頻帶內(nèi)的輸出波形,由于語(yǔ)音信號(hào)頻率一般在50 Hz~5 kHz以內(nèi),,所以實(shí)驗(yàn)中只使用了62.5 Hz~4 kHz 這7個(gè)倍頻通道,。由實(shí)驗(yàn)結(jié)果可以看出,不同的音素會(huì)在不同的濾波通道出現(xiàn),,例如,,半元音|w|(對(duì)應(yīng)圖中樣點(diǎn)1~1 500)主要分布在中頻段(f0=125、250,、500)三個(gè)通道,;爆破音|b|濾(對(duì)應(yīng)圖中樣點(diǎn)6 000~7 000)則基本只出現(xiàn)在f0=125 Hz的通道,而元音|i:|則在低頻段和高頻段均會(huì)出現(xiàn),??梢姡〔ㄗ儞Q能很好地表征語(yǔ)音信號(hào)在頻域內(nèi)的特征,。?
??? 二進(jìn)聽覺小波對(duì)信號(hào)實(shí)施逐級(jí)抽取(如圖8),,使得抽樣率自適應(yīng)匹配信號(hào)帶寬,從而有效減少了冗余數(shù)據(jù),。而且小波變換有快速算法,,所以用小波變換來(lái)設(shè)計(jì)和實(shí)現(xiàn)耳蝸濾波器組可以提高語(yǔ)音處理系統(tǒng)的實(shí)時(shí)性。然而,,從圖9中也可以看出,,這種方法的缺點(diǎn)就是它只能在各倍頻程頻率點(diǎn)上實(shí)現(xiàn)濾波,對(duì)頻帶的劃分比較粗糙,,而實(shí)際的生理系統(tǒng)中與耳蝸基膜相連的內(nèi)毛細(xì)胞多達(dá)上萬(wàn)個(gè),,即耳蝸將聽覺頻段劃分成了上萬(wàn)個(gè)子帶進(jìn)行處理,。所以這種方法還有進(jìn)一步的改進(jìn)之處。?
??? 理論分析及實(shí)驗(yàn)結(jié)果均表明,,二進(jìn)制小波變換的特性與耳蝸濾波器組的特性存在很多相似之處,,例如,頻率的對(duì)數(shù)分布特性,、濾波器組的恒Q特性等,。利用小波變換來(lái)實(shí)現(xiàn)耳蝸濾波,不僅可以使濾波器的設(shè)計(jì)和修改大大簡(jiǎn)化,,而且可以通過快速算法提高實(shí)時(shí)性,。?
參考文獻(xiàn)?
[1] YU Shao, CHANG Chip Hong. A generalized timefrequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human?auditory system. IEEE Transactions on Systems,MAN,?and Cybernetic, Part B: Cybernetics, 2007,37(4):877-889.?
[2]?WONG Chun Kit. A decimated electronic cochlea?on a reconfigurable platform, Master thesis, Chinese?University of Hong Kong, July, 2006.?
[3]?LEONG M P,JIN C T,LEONG P H W.An FPGAbased electronic cochlea. EURASIP Journal on?Applied?? Signal Processing, 2003(7):629-638.?
[4] SUMMERFIELD C D, LYON R F.ASIC implementation of the lyon cochlea model. Proc. IEEE Int.Conf.Acoust., Speech, and Signal Processing, San?Francisco, CA, 1992:673-676.?
[5]?LIM S C, TEMPLE A R, JONES S, et al. VHDLbased design of biologically inspired pitch detection?system. in Proc. IEEE Int. Conf. Neural Networks,?vol. 2, Houston, TX, 1997, pp. 922-927.?
[6]?MISHRA A, HUBBARD A E. A cochlear filter implemented? with a field-programmable gate array. IEEE Transactions on Circuits and Systems II:Analog and Digital Signal?Processing, 2002,49(1):54-60.?
[7] SALIMPOUR Y, ABOLHASSANI M D, ZADEH S H.Auditory wavelet transform. The 3rd European Medical?and Biological Engineering Conference, November, 2005:20-25.?
[8] ALDROUBI A, UNCER M. Wavelets in medicine and?biology. CRC press, Inc.1996:528-529.?
[9]?KIANG N Y S. Processing of speech by the auditory?nervous system. Acoust. Soc. Am,1980,68(3):830-835.?
[10] MALLAT S. A wavelet tour of signal processing.Academic?Press, 1999.?
[11] KARMAKAR A, KUMAR A, PATNEY R K. Design of?optimal wavelet packet trees based on auditory perception?criterion. IEEE Signal Processing Letters,2007,14(4):240-243.?
[12] SALIMPOUR Y, ABOLHASSANI M D. Auditory wavelet?transform based on auditory wavelet families. Proceedings?of the 28th IEEE EMBS Annual International Conference?New York City, USA, Aug 30-Sept 3, 2006.