??? 摘 要: 介紹了一種基于隱馬爾可夫模型的軸承故障音頻信號(hào)診斷方法,。通過對軸承音頻信號(hào)的Mel頻率倒譜系數(shù)特征提取,分別采用離散HMM和連續(xù)高斯混合密度HMM兩種方法進(jìn)行建模與診斷研究,。與CGHMM方法相比,,DHMM方法運(yùn)算速度快,但診斷精度低,。而從總體上來看,,兩種方法都具有運(yùn)算速度快,診斷精度高的優(yōu)點(diǎn),。結(jié)果表明,,本文方法具有很好的應(yīng)用前景。?
??? 關(guān)鍵詞: 軸承,; Mel頻率倒譜系數(shù),;隱馬爾可夫模型; 音頻信號(hào)
?
??? 軸承是機(jī)械設(shè)備中應(yīng)用最為廣泛的一種通用部件,,也是最容易損壞的零件之一,,它工作正常與否直接影響整臺(tái)機(jī)器的性能,因而軸承故障診斷成為重要的研究課題和目前的研究熱點(diǎn)[1-4],。在軸承故障診斷研究中,,通常是對其工作時(shí)產(chǎn)生的振動(dòng)信號(hào)[1]或音頻信號(hào)[2-4]進(jìn)行分析,以判斷軸承運(yùn)行狀態(tài),。振動(dòng)信號(hào)法通過安裝在軸承座或箱體適當(dāng)?shù)胤降募铀俣葌鞲衅鳙@取軸承振動(dòng)信號(hào),,并對其信號(hào)進(jìn)行分析與處理,進(jìn)而判斷軸承是否運(yùn)行正常,。此方法的不足在于需要將加速度傳感器固定在待檢測的設(shè)備上,,增加了成本,使用也不方便,。音頻信號(hào)的采集屬于非接觸式,,只需要利用麥克風(fēng)作為聲音傳感器,不但使用方便而且成本低廉,,具有振動(dòng)信號(hào)不可代替的優(yōu)勢,。參考文獻(xiàn)[2-4]研究表明,當(dāng)軸承運(yùn)行狀態(tài)發(fā)生變化,,音頻信號(hào)特性也會(huì)隨之變化時(shí),,因而對音頻信號(hào)分析是一種有效、可行的軸承故障診斷方法,。目前,,基于音頻信號(hào)的軸承故障診斷方法主要有:小波分析[2],、神經(jīng)網(wǎng)絡(luò)[3]和盲源分離方法[4]等。?
??? 隱馬爾可夫模型HMM(Hidden Markov Model)是一種描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,,能夠?qū)Χ鄠€(gè)觀察樣本進(jìn)行有效融合而構(gòu)成一個(gè)模型,,具有較好的抗噪能力,在交通監(jiān)測[5],、圖像識(shí)別[6],、語音識(shí)別[7-8]以及基于振動(dòng)信號(hào)的故障診斷[1]等領(lǐng)域中都得到了較好的應(yīng)用,也是目前為止最有效的語音識(shí)別方法,。而Mel頻率倒譜系數(shù)MFCC(Mel Frequency Cepstrum Coefficients)考慮了人耳聽覺特性,,能很好地反映音頻信號(hào)特征,在語音識(shí)別,、音頻分類和檢索研究領(lǐng)域應(yīng)用十分廣泛[8],。本文通過對音頻信號(hào)的MFCC特征提取,分別采用DHMM(Discrete HMM)和CGHMM(Continuous Gaussian Mixture HMM)兩種方法進(jìn)行建模與診斷研究,。DHMM方法對觀測序列進(jìn)行了量化處理,,運(yùn)算速度快,,卻降低了診斷精度,。而CGHMM方法不需要量化,避免了量化帶來的數(shù)據(jù)處理誤差,,提高了診斷精度,,但減慢了運(yùn)算速度。從總體上來看,,兩種方法都具有運(yùn)算速度快,、診斷精度高的優(yōu)點(diǎn),具有很好的應(yīng)用前景,。?
1 理論基礎(chǔ) ?
1.1 MFCC?
??? Mel頻率倒譜系數(shù)MFCC用于信號(hào)特征提取,,其計(jì)算過程如下[8-9]:?
??? (1) 確定每一幀信號(hào)的長度N及幀移,并對每一幀信號(hào)序列進(jìn)行預(yù)處理(加窗,、預(yù)加重等),。本文采用應(yīng)用較廣的漢明窗:?
????ω(n)=(1-α)-αcos(2πn/N)????????????????????????????? ? (1)?
式中,0<α<1,,通常取值為0.46,。?
??? (2) 將預(yù)處理后的信號(hào)進(jìn)行快速傅立葉變換(FFT),將時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào),再計(jì)算其模的平方得到能量譜P[k],,0≤k≤N-1,。?
??? (3) 選取濾波器個(gè)數(shù)為M,并定義最低頻率接近零,,最高頻率為輸入音頻信號(hào)頻率的一半,,再根據(jù)mel(f)頻率與實(shí)際線性頻率f的關(guān)系mel( f )=2 595lg(1+f/700)計(jì)算出三角帶通濾波器組Hm[k],則能量譜P[k]通過三角帶通濾波器組Hm(k)后的輸出為:?
?????
??? (4) 對S[m]進(jìn)行離散余弦變換(DCT)即得到MFCC系數(shù):?
?????
??? (5) 取C[1],C[2],…,,C[V]作為MFCC參數(shù),此處V是MFCC參數(shù)的維數(shù),,通常為12~16,。?
1.2 HMM?
??? 隱馬爾可夫模型HMM是在Markov鏈的基礎(chǔ)上發(fā)展起來的一種概率模型,由三個(gè)基本參數(shù)來描述,。第一個(gè)參數(shù)為狀態(tài)轉(zhuǎn)移概率A={aij|1≤i,j≤N},,aij=P(qt+1=Sj/qt=Si)表示從狀態(tài)Si變化到狀態(tài)Sj的轉(zhuǎn)移概率,顯然且aij≥0,,其中,,qt表示Markov鏈t時(shí)刻所處的狀態(tài),N為HMM狀態(tài)數(shù),。第二個(gè)參數(shù)為觀察值概率分布B={bj(k)|1≤j≤N, 1≤k≤M},,bj(k)=P(Ok/qt=Sj)表示進(jìn)入狀態(tài)Sj時(shí)輸出為Ok的概率,Ok表示觀察值,,M為可能的觀察值數(shù)目,。根據(jù)觀察值序列的分布特點(diǎn),HMM模型可分為離散DHMM和連續(xù)DHMM兩大類,。同時(shí),,如果觀察值序列服從連續(xù)高斯混合密度函數(shù)分布,則為連續(xù)高斯混合密度CGHMM,。最后一個(gè)參數(shù)是初始概率分布π={πi|1≤i≤N},,πi=P(q1=si)表示Markov鏈從狀態(tài)Si開始的概率,顯然
?
??? 有了如上定義,,HMM可描述為:?
??? λ=(π,A,B)????????????????????????????????????? ?(4)?
2 基于HMM的故障診斷?
??? 基于HMM的軸承故障音頻信號(hào)診斷系統(tǒng)框圖如圖1所示,,主要包括數(shù)據(jù)采集、特征提取,、HMM訓(xùn)練和HMM診斷等部分,。?
?
?
2.1數(shù)據(jù)采集?
??? 數(shù)據(jù)采集是使用麥克風(fēng)作為聲音傳感器,將軸承的音頻信號(hào)變?yōu)橐欢ǖ碾娖叫盘?hào)輸入計(jì)算機(jī),,即錄制波形音頻的過程,。在數(shù)據(jù)采集之前,需要按照一定規(guī)則設(shè)定好音頻信號(hào)幾個(gè)重要的采集參數(shù):采樣頻率,、位數(shù)和聲道數(shù),。本文在采樣頻率為22.05kHz、A/D轉(zhuǎn)換精度為16位,、聲道數(shù)為單聲道的條件下,,采用VC++中提供的函數(shù)庫,實(shí)現(xiàn)對軸承音頻信號(hào)的數(shù)據(jù)采集,。簡單流程為:打開錄音設(shè)備,、準(zhǔn)備WAVE數(shù)據(jù)頭,、準(zhǔn)備數(shù)據(jù)塊、開始錄音,、停止錄音以及關(guān)閉錄音等,,詳細(xì)過程請參見參考文獻(xiàn)[10]。?
2.2 特征提取?
??? 特征提取是指從軸承音頻信號(hào)中提取有用的統(tǒng)計(jì)數(shù)據(jù),,如Mel頻率倒譜特征參數(shù)(MFCC),、線性預(yù)測倒譜系數(shù)(LPCC)、感覺加權(quán)線性預(yù)測系統(tǒng)(PLP)等,是故障建模與識(shí)別的關(guān)鍵,,直接影響到故障診斷效果,。此外,特征提取還可以用差分系數(shù)近似描述音頻信號(hào)的幀間相關(guān)性,,反映信號(hào)的動(dòng)態(tài)特征,。動(dòng)態(tài)特征和靜態(tài)特征互相補(bǔ)充,提高了系統(tǒng)的診斷性能,。因?yàn)镸FCC參數(shù)充分利用人耳的聽覺特性,,能很好地體現(xiàn)音頻信號(hào)的主要信息,在語音識(shí)別,、音頻分類和檢索領(lǐng)域應(yīng)用十分廣泛[8],。所以本文選用12維MFCC參數(shù)和12維一階差分MFCC進(jìn)行診斷實(shí)驗(yàn)。?
2.3 HMM訓(xùn)練?
??? HMM訓(xùn)練是指從同類故障的大量音頻信號(hào)樣本中提取統(tǒng)計(jì)信息,,利用恰當(dāng)?shù)挠?xùn)練算法對模型參數(shù)反復(fù)修正直至收斂,,最后得到模型的狀態(tài)轉(zhuǎn)移概率A,、觀察值概率分布B,、初始概率分布π等參數(shù)。典型的訓(xùn)練算法有Baum-Welch算法,,但此算法是在假定只有一個(gè)觀察值訓(xùn)練序列的條件下得到的,。為了增加HMM故障診斷系統(tǒng)的穩(wěn)健性和提高故障診斷的準(zhǔn)確率,需要選取多個(gè)樣本進(jìn)行訓(xùn)練,,以建立軸承各類故障狀態(tài)的HMM參數(shù)模型,。記L個(gè)觀察值序列(即L個(gè)樣本)為O(1)、O(2),、…,、O(L),每個(gè)觀察值序列的長度記為T,,則此時(shí),,基于多觀察值序列訓(xùn)練的重估公式可寫為:?
???
2.4 HMM診斷?
??? 訓(xùn)練完成之后將模型參數(shù)存儲(chǔ),此時(shí),,系統(tǒng)就具備了診斷的能力,。診斷過程中,,輸入待檢測軸承音頻信號(hào),經(jīng)過預(yù)處理,、MFCC特征提取后,,得到觀察值序列O={O1,O2,…,OT}。然后,,對此觀察值序列進(jìn)行故障檢測,,當(dāng)檢測到有故障發(fā)生時(shí),再進(jìn)一步進(jìn)行故障診斷,,判斷出音頻信號(hào)的故障類型,。?
??? (1) 故障檢測?
??? 故障檢測只需要訓(xùn)練一個(gè)代表軸承正常狀態(tài)的HMM模型,記為λ0,。根據(jù)前向-后向算法[8]計(jì)算出待檢信號(hào)O={O1,O2,…,OT}在正常模型λ0下的輸出概率P(O/λ0),。如果此概率P(O/λ0)大于預(yù)先確定的某一閾值,則表明軸承工作正常;否則,,軸承有可能出現(xiàn)某種故障,,需要進(jìn)一步進(jìn)行故障診斷。?
??? (2) 故障診斷?
??? 同樣使用前向-后向算法[8],,快速有效地計(jì)算出觀察值序列O={O1,O2,…,OT}在各HMM模型下的輸出概率,,通常情況下,概率最大的模型即為診斷結(jié)果,。為了提高系統(tǒng)的診斷精度,,可在后處理階段輔以必要的拒識(shí)算法,比如設(shè)定適當(dāng)?shù)母怕书撝?,如果最大概率小于這個(gè)閾值,,則診斷為其他運(yùn)行狀態(tài)。?
3 軸承故障診斷實(shí)驗(yàn)?
??? 在Visual C++7.0環(huán)境下,,自主開發(fā)了基于HMM的音頻故障診斷平臺(tái),,本文所有實(shí)驗(yàn)均在此平臺(tái)上完成;診斷對象為6202CM深溝球滾動(dòng)軸承,,其轉(zhuǎn)速為1800r/m,;采樣頻率為22.05kHz;A/D轉(zhuǎn)換精度16位,;數(shù)據(jù)幀長512,,幀移128。通過特征提取,,將每幀信號(hào)都轉(zhuǎn)換成12維MFCC和12維一階差分MFCC,,形成長度為32的觀察值序列,分別采用DHMM和CGHMM兩種方法進(jìn)行了建模與診斷實(shí)驗(yàn)。?
??? 在模型訓(xùn)練環(huán)節(jié),,對于正常聲音,、內(nèi)圈異音、外圈異音,、滾動(dòng)體異音以及保持架音等五種軸承狀態(tài),,各采集30組音頻數(shù)據(jù)樣本進(jìn)行訓(xùn)練,分別得到DHMM和CGHMM兩類模型訓(xùn)練過程,,兩種故障模型的平均訓(xùn)練時(shí)間如表1所示,。由表可以看出,由于DHMM對觀測序列進(jìn)行了量化處理,,計(jì)算量小,,訓(xùn)練速度快;而CGHMM的復(fù)雜度比較高,,收斂過程長,,比DHMM方法的訓(xùn)練時(shí)間多出近一倍(但也在實(shí)時(shí)要求之內(nèi))。?
??? 在診斷環(huán)節(jié),,另外采集了20組正常聲音,、內(nèi)圈異音、外圈異音以及10組滾動(dòng)體異音和保持架音等五組數(shù)據(jù)分別進(jìn)行了測試,,得到的基于DHMM和CGHMM的故障診斷結(jié)果分別如表2和表3所示,。在DHMM方法中,共80次診斷出現(xiàn)8次誤診,,總的診斷精度接近90%,,效果較良。而CGHMM方法只出現(xiàn)2次誤診,,診斷精度達(dá)到了97.5%,,明顯高于DHMM方法,更具有良好的應(yīng)用前景,。?
?
?
?
??? 本文在VC++平臺(tái)下,,自主開發(fā)了一套基于HMM的軸承故障音頻診斷平臺(tái),。通過對音頻信號(hào)的MFCC特征提取,,分別采用DHMM和CGHMM兩種方法進(jìn)行建模與診斷研究。由于DHMM方法對觀測序列進(jìn)行了量化處理,,運(yùn)算速度快,,但降低了診斷精度。而CGHMM方法不需要量化,,避免了量化帶來的數(shù)據(jù)處理誤差,,提高了診斷精度,但減慢了運(yùn)算速度。從總體上來看,,兩種方法都具有運(yùn)算速度快,、診斷精度高的優(yōu)點(diǎn),具有很好的應(yīng)用前景,。?
參數(shù)文獻(xiàn)?
[1] OCAK H, LOPARO K A. A new bearing fault detection??and diagnosis scheme based on hidden markov modeling?of vibration signals [A]. IEEE International Conference on?Acoustics, Speech, and Signal Processing, 2001,(5):3141-3144.?
[2] 周艷玲,,楊德斌,徐金梧,等.基于聲信號(hào)的軸承故障診斷方法[J].振動(dòng)與沖擊, 2002,21(2):21-23.?
[3] 李良敏.基于遺傳算法的盲源分離在軸承診斷中的應(yīng)用[J].軸承,2005,(9):31-34.?
[4] 高向東,,黃石生,,高存臣.神經(jīng)網(wǎng)絡(luò)及聲譜分析技術(shù)在軸承故障診斷中的應(yīng)用[J].軸承, 1996,(8):2-5.?
[5] JIEN K, WATANABE T, RITTSCHER J, et al. An?HMM-based segmentation method for traffic monitoring?movies [J]. IEEE Trans on Pattern Analysis and Machine?Intel, 2002,24(9):1291-1296.?
[6]?LIU N J, DAVIS R I A, LOVELL B C, et al. Effect of?initial HMM choices in multiple sequence training for gesture recognition[A]. International Conference on Information?Technology, 2004:608-613.?
[7]?謝錦輝.隱Markov模型(HMM)及其在語音處理中的應(yīng)用[M].武漢: 華中理工大學(xué)出版社, 1995.?
[8] HUANG Hai Dong. Spoken language processing[M].Prentice Hall, 2001.?
[9] 陸汝華,楊勝躍,,朱穎,,等.基于DHMM的軸承故障音頻診斷方法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(17):218-220.?
[10] 陸汝華.基于HMM的軸承故障音頻診斷方法研究[D]:碩士學(xué)位論文. 長沙:中南大學(xué)出版社,,2007.