摘 要: 通過對(duì)語音識(shí)別原理的系統(tǒng)分析,結(jié)合特定人語音識(shí)別的具體情況,,研究了動(dòng)態(tài)規(guī)整算法(DTW),,應(yīng)用凌陽SPCE061A單片機(jī),實(shí)現(xiàn)了基于實(shí)時(shí)語音識(shí)別的門禁系統(tǒng)的總體設(shè)計(jì),。試驗(yàn)表明,,在1.3 s內(nèi),系統(tǒng)誤差率低于8%,。該系統(tǒng)可應(yīng)用于現(xiàn)代建筑的電子門鎖類產(chǎn)品中,,對(duì)實(shí)現(xiàn)智能化控制具有較強(qiáng)的實(shí)用價(jià)值。
關(guān)鍵詞: 語音識(shí)別,;智能門禁,;DTW,;SPCE061A
隨著社會(huì)的發(fā)展,無論在企業(yè)還是民宅中,,人們對(duì)門禁系統(tǒng)的使用越來越廣泛,。然而傳統(tǒng)門禁無法滿足各種使用場合的復(fù)雜性和智能性,于是綜合應(yīng)用語音識(shí)別,、指紋識(shí)別,、虹膜識(shí)別、紅外感應(yīng)等最新生物識(shí)別技術(shù)的門禁系統(tǒng)廣泛吸引了人們的注意,,并將逐步成為門禁系統(tǒng)發(fā)展的主流與趨勢[1],。
本文提出了基于高性價(jià)比的凌陽SPCE061A單片機(jī),以16位的μ′nSP為主控芯片,,通過添加部分外圍元件,,即可搭建一個(gè)經(jīng)濟(jì)的、功能相對(duì)完善的智能實(shí)時(shí)語音門禁系統(tǒng),。該系統(tǒng)具有成本低,、功耗低等優(yōu)點(diǎn),是一種安全有效,、有市場價(jià)值的門禁系統(tǒng)解決方案,。
1 語音識(shí)別的基本原理
語音識(shí)別技術(shù)就是對(duì)不同說話人的不同說話內(nèi)容進(jìn)行準(zhǔn)確的識(shí)別,其本質(zhì)是屬于模式識(shí)別的范疇,。系統(tǒng)原理框圖如圖1所示,。從圖中可以看出,識(shí)別結(jié)果的正確與否與模式匹配息息相關(guān),。計(jì)算機(jī)首先從特定人處取得語音信號(hào)并訓(xùn)練制作成語音的特征模型庫,。當(dāng)系統(tǒng)需要進(jìn)行語音識(shí)別時(shí),對(duì)新輸入的語音信號(hào)進(jìn)行分析,,抽取其語音特征參數(shù),。通過與語音系統(tǒng)中所儲(chǔ)存的特征模型進(jìn)行對(duì)比,在一些特定的搜索和匹配策略下尋找最優(yōu)的匹配模板,。通過查表系統(tǒng)就能給出語音識(shí)別的結(jié)果,。其主要步驟分為:預(yù)處理、特征參數(shù)提取,、語音的訓(xùn)練與識(shí)別,。
在進(jìn)行語音的預(yù)處理以及特征參數(shù)的提取之后,就要運(yùn)用某種識(shí)別方法辨識(shí)出測試的說話人,,說話人識(shí)別算法部分是整個(gè)說話人識(shí)別處理流程中最核心的一環(huán),,直接決定著系統(tǒng)的識(shí)別性能[2]。主要任務(wù)是將預(yù)處理后的所有需要辨識(shí)的語音信號(hào)進(jìn)行特征參數(shù)的提取,經(jīng)過訓(xùn)練形成參考模板庫,,然后將某個(gè)特定的需要識(shí)別的說話人的語音以同樣的方法得到其測試模板,,最后用此模板與庫中的模板進(jìn)行模式匹配,以達(dá)到識(shí)別的目的,。常用的識(shí)別算法有矢量量化VQ(Vector Quantization),、動(dòng)態(tài)時(shí)間規(guī)整法DTW(Dynamic Time Warping)、隱馬可夫模型HMM(Hidden Markov Model)和人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Networks)等[3],。
2 語音門禁系統(tǒng)硬件設(shè)計(jì)
圖2為系統(tǒng)總體的硬件設(shè)計(jì)框圖,,系統(tǒng)主控制模塊以凌陽SPCE061A單片機(jī)為核心部件,麥克風(fēng)輸入模塊采集語音聲波信號(hào)轉(zhuǎn)換為模擬電壓信號(hào),,采樣調(diào)理電路對(duì)電信號(hào)進(jìn)行濾波,,去除噪聲干擾。通過單片機(jī)自帶的AD采集模塊實(shí)現(xiàn)對(duì)說話人識(shí)別確認(rèn)的功能,。輸出部分采用兩路輸出的形式,。一路輸出為揚(yáng)聲器模塊,可以語音播報(bào)識(shí)別的結(jié)果信息,;另一路輸出為電子門鎖驅(qū)動(dòng)模塊,,驅(qū)動(dòng)門鎖的開合。
3.2 軟件流程
本系統(tǒng)軟件的開發(fā)使用了凌陽公司的μ′nSP IDE集成開發(fā)平臺(tái),這個(gè)高效的開發(fā)環(huán)境支持匯編與C語言的混合編寫,,還支持編譯,、鏈接等功能,集成了調(diào)試和實(shí)時(shí)分析等實(shí)用功能,,為開發(fā)提供了便利,。
語音識(shí)別門禁系統(tǒng)的軟件總體流程如圖3所示。本程序分為3個(gè)模塊,,分別為中斷模塊,、訓(xùn)練模塊和識(shí)別模塊。
首先獲取語音信息,,經(jīng)過模數(shù)轉(zhuǎn)換,、預(yù)加重、自動(dòng)增益等處理后根據(jù)中斷類別進(jìn)入訓(xùn)練或者識(shí)別模塊,。訓(xùn)練模塊將經(jīng)過處理的語音信號(hào)通過特征提取,存入語音特征模型庫,。而識(shí)別模塊通過改進(jìn)識(shí)別算法將輸入語音信號(hào)的特征與訓(xùn)練后語音特征模型庫進(jìn)行對(duì)比分析,。
4 試驗(yàn)結(jié)果與結(jié)論
本文實(shí)現(xiàn)的基于SPCE061A的實(shí)時(shí)語音識(shí)別門禁系統(tǒng)具有識(shí)別特定人條件下短時(shí)語音的功能。樣機(jī)經(jīng)過測試,,對(duì)特定人進(jìn)行語音采樣和辨識(shí)訓(xùn)練后,,對(duì)100次語音輸入訪問測試,正確通過為93次,識(shí)別率達(dá)到93%,;樣本有效但拒絕訪問請(qǐng)求7次,,拒識(shí)率為7%,達(dá)到了預(yù)期的設(shè)計(jì)要求,。
參考文獻(xiàn)
[1] 黎育紅.基于語音識(shí)別技術(shù)的門禁系統(tǒng)的研究[J].電子技術(shù)應(yīng)用,,2006,32(12):88-91.
[2] 趙力.語音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,,2005.
[3] 胡文靜.基于SPCE061A語音識(shí)別門禁系統(tǒng)實(shí)現(xiàn)的研究[J].計(jì)算技術(shù)與自動(dòng)化,,2011,30(2):111-114.
[4] 宋大杰.基于DTW的說話人識(shí)別及其在DSP上的實(shí)現(xiàn)[D].江西:東華理工大學(xué),,2012.
[5] 蔣曄.基于短語音和信道變化的說話人識(shí)別研究[D].江蘇:南京理工大學(xué),,2013.
[6] 白瑜.語音信號(hào)特征參數(shù)的提取[J].科技傳播,2011,,12(24):228-229.
[7] 姚燁豪.基于語音識(shí)別和RFID技術(shù)的智能門禁系統(tǒng)研究[J].科技信息,,2012(2):31-32.