《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 車載環(huán)境下語音端點檢測的研究
車載環(huán)境下語音端點檢測的研究
2017年微型機(jī)與應(yīng)用第5期
張恒,,周萍
桂林電子科技大學(xué) 電子工程與自動化學(xué)院,廣西 桂林 541000
摘要: 語音端點檢測直接決定了語音識別的精度和速度。車載環(huán)境是一個非常復(fù)雜的環(huán)境,,信噪比(SNR)有可能出現(xiàn)很低的情況,對于傳統(tǒng)的時域端點檢測方法來說,,在這種環(huán)境下的端點檢測效果很差,,而雙門限在高信噪比條件下,端點檢測的效果非常好,,識別率很高,,這就使得提高車載環(huán)境下語音SNR非常關(guān)鍵。文章提出采用改進(jìn)的小波去噪和改進(jìn)的雙門限方法進(jìn)行端點檢測,。實驗結(jié)果表明,,綜合改進(jìn)小波去噪和改進(jìn)雙門限的方法雖然有一定量的信號失真,但失真在可接受范圍之內(nèi),,并且在不增大運算量的情況下端點檢測的效果比傳統(tǒng)的雙門限效果要好,,表明了本文算法的有效性,。
Abstract:
Key words :

  張恒,周萍

 ?。ü鹆蛛娮涌萍即髮W(xué) 電子工程與自動化學(xué)院,,廣西 桂林 541000)

       摘要:語音端點檢測直接決定了語音識別的精度和速度。車載環(huán)境是一個非常復(fù)雜的環(huán)境,,信噪比(SNR)有可能出現(xiàn)很低的情況,,對于傳統(tǒng)的時域端點檢測方法來說,在這種環(huán)境下的端點檢測效果很差,,而雙門限在高信噪比條件下,,端點檢測的效果非常好,識別率很高,,這就使得提高車載環(huán)境下語音SNR非常關(guān)鍵,。文章提出采用改進(jìn)的小波去噪和改進(jìn)的雙門限方法進(jìn)行端點檢測。實驗結(jié)果表明,,綜合改進(jìn)小波去噪和改進(jìn)雙門限的方法雖然有一定量的信號失真,,但失真在可接受范圍之內(nèi),并且在不增大運算量的情況下端點檢測的效果比傳統(tǒng)的雙門限效果要好,,表明了本文算法的有效性,。

  關(guān)鍵詞:車載環(huán)境;小波去噪,;雙門限,;端點檢測

  中圖分類號:TN912.34文獻(xiàn)標(biāo)識碼:ADOI: 10.19358/j.issn.1674-7720.2017.05.007

  引用格式:張恒,周萍.車載環(huán)境下語音端點檢測的研究[J].微型機(jī)與應(yīng)用,,2017,36(5):21-23.

0引言

  *基金項目:廣西研究生教育創(chuàng)新計劃資助項目(YCSZ2015152)隨著語音識別技術(shù)的研究和發(fā)展,,應(yīng)用語音技術(shù)開發(fā)的產(chǎn)品已涉及到人們生活的多個方面,有聲控電話交換,、語音撥號系統(tǒng),、聲控智能玩具、醫(yī)療服務(wù)等,,促進(jìn)了整個社會經(jīng)濟(jì)的發(fā)展,,在未來也將帶來社會科技的變革。目前,,語音識別技術(shù)已經(jīng)應(yīng)用在很多玩具車上,,很多廠商也正在加快速度研究車載語音系統(tǒng)。經(jīng)過幾十年來人們對語音識別技術(shù)的探索和研究,,語音識別技術(shù)以及用于開發(fā)語音的硬件設(shè)備都在不斷地改進(jìn)更新,,語音識別產(chǎn)品已經(jīng)逐步從實驗室走向工廠,各廠商已經(jīng)推出各種系統(tǒng)的汽車產(chǎn)品。

  語音端點檢測在語音信號處理中是一個極其重要的環(huán)節(jié),,它決定了后面的處理結(jié)果,,比如對語音信號的特征提取、模式匹配時的正確率,。車載環(huán)境下的語音噪聲非常復(fù)雜,,車內(nèi)發(fā)動機(jī)聲音、輪胎與路面之間的摩擦聲,、空氣擾動,、窗外嘈雜聲等[1],使得信噪比降低,。在低信噪比的條件下,,使用傳統(tǒng)的雙門限端點檢測方法,會大大降低識別率,,雙門限在信噪比較高時有非常好的效果,,而使用頻率或其他模式匹配的檢測方法會增加其運算量,不利于車載環(huán)境下的實時性要求,,因此本文提出一種基于改進(jìn)的小波降噪和改進(jìn)的基于短時能量與過零率雙門限端點檢測的方法,,最大限度地還原語音有效信號,為之后的特征提取和模式匹配提供良好的資源,。

1小波去噪

  小波去噪在處理非平穩(wěn)信號上有很大的優(yōu)勢,,其中關(guān)鍵的步驟是閾值的選取,這對于去噪的效果影響較大,。

  1.1小波變換

  小波變換(Wavelet Transform,WT)是近幾十年發(fā)展起來的一種新的數(shù)學(xué)分析方法,,特別是近十幾年,在很多領(lǐng)域都有廣泛的應(yīng)用,。小波變換的實質(zhì)是由一個低通濾波器和一系列帶通濾波器組成,。它是短時傅里葉變換(STFT)的變化形式,繼承和發(fā)展了局部化的思想,,具有多頻率分析,、能夠聚焦到信號的細(xì)節(jié),被稱作是“數(shù)學(xué)顯微鏡”[2],。小波變換能隨信號頻率的改變而調(diào)整分析窗口大小,,具有一定的自適應(yīng)性,能夠解決很多Fourier不能解決的問題,,特別是在非平穩(wěn)信號中,小波變換的優(yōu)勢更加突顯,。

  1.2小波去噪原理

  基于小波變換的優(yōu)勢,,小波去噪成為小波變換重要的應(yīng)用之一。去噪的方法主要有:模具極大值檢測法、相關(guān)性去噪,、閾值法,、平移不變量小波去噪法[3]。其中閾值法運用較為廣泛,,其算法運算量低,,易于實現(xiàn),且效果很好,。本文主要基于改進(jìn)的閾值法進(jìn)行去噪,。小波去噪分為3個過程,其步驟可總結(jié)為[4]:(1)小波分解,;(2)閾值處理,;(3)小波重構(gòu)。

  小波閾值去噪主要有軟閾值和硬閾值法,,它們都具有自己的優(yōu)缺點,,通常采用兩者結(jié)合的方式對小波系數(shù)進(jìn)行估計。軟閾值和硬閾值法是1994年由Donoho在小波變換的基礎(chǔ)上提出的[5],。下面分別介紹它們以及本文改進(jìn)的閾值法,。

  (1)硬閾值法和軟閾值法

  硬閾值,,當(dāng)小于等于閾值時將小波系數(shù)置零,,當(dāng)大于閾值時保持小波系數(shù)不變,其閾值函數(shù)如式(1):

  j,k=wj,k|wj,k|≥λ

  0|wj,k|<λ(1)

  軟閾值,,當(dāng)小于等于閾值時將小波系數(shù)置零,,當(dāng)大于閾值時對小波系數(shù)閾值進(jìn)行收縮處理,其閾值函數(shù)如式(2)[6]:

  N)@B7Z2PQ{3PQ%W@5~I1_D1.png

  上面的兩個公式中j,k為量化后的小波系數(shù),,wj,k為小波分解系數(shù),,λ為設(shè)定的閾值。

  對于上面的軟,、硬閾值,,要根據(jù)具體的噪聲環(huán)境而做出選擇,因此其閾值法具有一定的局限性,,不能很好地適用于強(qiáng)噪聲或復(fù)雜噪聲環(huán)境下,。基于上面閾值函數(shù)的缺陷,,本文提出了以下改進(jìn)的閾值法,,使其能運用到車載環(huán)境中。

 ?。?)本文改進(jìn)的閾值法

  為了克服閾值法的缺點,,本文采用如下的閾值函數(shù)進(jìn)行去噪:

  )7~MZO700PT(5R3`J2SL]7X.png (j+1)為閾值;其中σ為噪聲標(biāo)準(zhǔn)差,,σ等于高頻系數(shù)的絕對中值,σ=median(abs(D)),Nj為高頻系數(shù)的長度,。

2改進(jìn)的雙門限算法

  由于雙門限算法簡單可行,、復(fù)雜程度低、運算量小,、實時性較好等,,很多學(xué)者或科研人員在其上改進(jìn)各種算法。

  2.1雙門限算法原理

  語音信號一般可分為無聲段(靜音段),、清音段,、濁音段,由于他們的能量是有一定區(qū)別的,,顯然濁音段能量大于清音段,,清音段大于無聲段,但在實際檢測過程中,,由于噪聲以及清音段本身能量較低的特點,,使得無聲段與清音段難以區(qū)分[7],所以還有一種信號特征用于其檢測,,即短時過零率,。短時過零率表示信號穿過橫坐標(biāo)(零電平)的次數(shù)。短時能量和短時過零率函數(shù)定義分別為式(4),、式(5):

  7VJ33MW~W[B3A8J${$S6HPQ.png

  對于上面式(4)和式(5),,x(m)為語音信號,En為能量,,h(n-m)為相關(guān)的濾波器,,Zn為過零率。

  2.2本文改進(jìn)的雙門限算法

  語音開始和結(jié)尾對于端點檢測至關(guān)重要,,因為閾值的設(shè)定要通過靜音段確定,,而為了增強(qiáng)檢測的適應(yīng)性,應(yīng)根據(jù)具體的噪聲環(huán)境確定能量閾值,,而不能單一運用一個閾值到所有的信噪比環(huán)境下,。通常需要通過能量的最大值max和最小值min來確定一個閾值,即采用一種折中的方法選取閾值,。參考文獻(xiàn)[7]采用的是當(dāng)能量的最大值max比上能量的最小值min小于33.33時,,閾值下限ITL設(shè)置為0.03max+0.97min,反之ITL設(shè)置為4min,;閾值上限ITU設(shè)置為4ITL[8],。

  由于低信噪比環(huán)境下以上雙門限算法有一定局限性,端點檢測的效果很差,,通過大量的采集數(shù)據(jù)和實驗,,本文得出如下的改進(jìn)門限法,。設(shè)置能量閾值的上,、下限如式(6)所示:

  ITL=1.45 IMM

  ITU=1.55 ITL(6)

  IMM為前15幀的能量幅值的平均值,。

  通過前面改進(jìn)的小波去噪方法提高了信噪比,使得端點檢測識別率提高,,這樣在車載壞境下的特征提取和模式匹配準(zhǔn)確度會提高,。下面給出實驗結(jié)果。

3實驗結(jié)果

001.jpg

  通過多次采集不同車載環(huán)境下的噪聲,,采用sym8小波,,分解層數(shù)為5時效果比較明顯。圖1給出了改進(jìn)小波去噪效果,,分別在-5 db,、0 db、5 db時的去噪效果比較,,其橫坐標(biāo)為語音的采樣點數(shù),,縱坐標(biāo)為語音信號幅度值。表1是幾種不同噪聲環(huán)境下輸出的SNR和MSE,。

002.jpg

從表1中可以得出在低信噪比的環(huán)境下小波去噪發(fā)揮了它的優(yōu)勢,。圖1幾種不同低信噪比條件下的去噪效果通過小波去噪后,得到了更好的語音資源,,此時將去噪后的語音進(jìn)行端點檢測會得到更好的效果[9],,表2列出了不同信噪比情況下幾種不同環(huán)境下車載語音端點檢測結(jié)果,從中可以看出,,“我到北京去”這段語音相比于傳統(tǒng)的雙門限,,去噪以及改進(jìn)后的雙門限檢測效果更好,其檢測率高于傳統(tǒng)雙門限檢測率,,且沒有增加算法的運算量,,使實時性得到保障。從圖1和表1數(shù)據(jù)分析,,小波去噪在車載強(qiáng)噪音環(huán)境下效果較為明顯,,改進(jìn)的雙門限檢測方法也具有一定適應(yīng)性,能夠在車載多變的噪聲環(huán)境下進(jìn)行檢測,。從表1可以看出,,在車載高SNR條件下,檢測效果有明顯的提升,;在低SNR下,,雖然檢測效果有所下降,但相比于傳統(tǒng)的檢測效果還是有所提升,。通過信噪比SNR和均方誤差MSE衡量語音去噪的效果,,從表中可以看到降噪明顯,。通過表2的對比看出,端點檢測率提高了,,表明語音檢測的有效性,。

003.jpg

4結(jié)論

  對于車載環(huán)境下,噪聲是比較大,、比較復(fù)雜的,,低SNR會使傳統(tǒng)雙門限檢測方法的識別率大大降低[10],對于這一缺點,,本文首先采用了改進(jìn)小波去噪算法提高車載環(huán)境下的SNR,,再使用改進(jìn)的雙門限算法進(jìn)行端點檢測。從實驗結(jié)果來看,,失真不影響檢測效率,,且提高了檢測率,證明本文算法切實可行,。

參考文獻(xiàn)

 ?。?] 馬龍華,郝燕玲.車載環(huán)境下語音識別方法研究[D].哈爾濱:哈爾濱工程大學(xué),,2009.

 ?。?] 吳勇,吳傳生.基于小波去噪研究方法[D].武漢:武漢理工大學(xué),,2007.

 ?。?] 金寶龍,李輝,,趙乃杰,,等.一種新的小波閾值去噪算法[J].彈箭與制導(dǎo)學(xué)報,2011,,31(1):167-169.

 ?。?] 趙廣超,肖斌,,國闖,,等.小波分析理論與圖像降噪處理[J].微型機(jī)與應(yīng)用.2011,30(19): 35-37.

  [5] 段永剛,,馬立元,,李永軍,等.基于小波分析的改進(jìn)軟閾值去噪算法[J].科學(xué)技術(shù)與工程,,2010,,10(23):5755-5658.

  [6] 楊岳飛,,劉輝,,譚檢平.帶噪語音信號小波去噪算法研究[J].計算機(jī)工程與應(yīng)用,,2015,51(14):211-213.

 ?。?] 陳東鈺,,周萍.基于雙門限算法的語音端點檢測和聲韻母分離研究[J].桂林電子科技大學(xué)學(xué)報,2011,,31(6):481-482.

 ?。?] 劉慶升,,徐霄鵬,,黃文浩.一種語音端點檢測的探究[J].計算機(jī)工程,2003,29(3):120-121.

 ?。?] 魯遠(yuǎn)耀,,周妮,肖珂,,等.強(qiáng)噪音環(huán)境下改進(jìn)的語音端點檢測算法[J].計算機(jī)應(yīng)用,2014,34(5):1386-1390.

 ?。?0] 劉華平,李昕,,徐柏齡,,等.語音信號端點檢測方法綜述及展望[J].計算機(jī)應(yīng)用研究,2008,25(8):2278-2283.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。