《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 礦用數(shù)字漏泄移動通信系統(tǒng)中語音編解碼的研究與實現(xiàn)
礦用數(shù)字漏泄移動通信系統(tǒng)中語音編解碼的研究與實現(xiàn)
來源:微型機與應(yīng)用2011年第21期
婁開宇,昂志敏,,楊 柳
(合肥工業(yè)大學 計算機與信息學院,,安徽 合肥 230009)
摘要: 結(jié)合礦井的實際環(huán)境討論了井下數(shù)字漏泄移動通信系統(tǒng)中語音編解碼方法的選擇原則,;分析了LD-CELP算法的特點和優(yōu)勢,,研究了該算法的性能,;給出了在TMS320DM643平臺上LD-CELP編解碼方法的具體設(shè)計方案。
Abstract:
Key words :

摘  要: 結(jié)合礦井的實際環(huán)境討論了井下數(shù)字漏泄移動通信系統(tǒng)中語音編解碼方法的選擇原則,;分析了LD-CELP算法的特點和優(yōu)勢,,研究了該算法的性能,;給出了在TMS320DM643平臺上LD-CELP編解碼方法的具體設(shè)計方案,。
關(guān)鍵詞: 井下數(shù)字通信;語音編解碼,;LD-CELP,;TMS320DM643

 國家工信部近年將逐步停止對模擬對講機型號的核準,并將在幾年內(nèi)完成模擬對講機到數(shù)字對講機的過渡,。根據(jù)這一規(guī)定及市場的發(fā)展前景可以看出,,現(xiàn)有的礦井下模擬漏泄通信系統(tǒng)在未來5~6年后將逐步淘汰,因此開發(fā)先進的礦井下數(shù)字漏泄通信系統(tǒng)是現(xiàn)代通信技術(shù)發(fā)展的必然趨勢,。而語音通信作為數(shù)字通信的核心部分必然會作為研究的重點,,其中選擇適應(yīng)井下復(fù)雜環(huán)境的數(shù)字語音編解碼方法顯得尤為重要,。
1 語音編解碼技術(shù)及井下選擇標準
1.1 語音編碼的分類及介紹

 語音信號的編碼方法可分為波形編碼、參數(shù)編碼和混合編碼三類,。波形編碼自適應(yīng)能力強,,語音質(zhì)量好,但所需要的編碼速率較高,,一般在16 kb/s以上,。而參數(shù)編碼以數(shù)學模型模擬語音信號產(chǎn)生機制為基礎(chǔ),通過提取信號的特征參數(shù)來編碼,,優(yōu)點是編碼速率低,,但語音質(zhì)量較差,清晰度不高,?;旌暇幋a則是在保留分析合成編碼的技術(shù)基礎(chǔ)上,引進了波形編碼準則去優(yōu)化激勵信號,,從而在低碼率上獲得了較高質(zhì)量的合成語音,。連續(xù)可變斜率增量調(diào)制(CVSD)是增量調(diào)制的一種改進方法。這種方法中信號斜率是根據(jù)碼流中連“1”或連“0”的個數(shù)來檢測,,所以又稱為數(shù)字檢測,。低時延碼激勵線性預(yù)測編碼(LD-CELP)是G.728語音編碼標準算法,這種算法采用后向自適應(yīng)線性預(yù)測,、50階全極點合成濾波,、短激勵矢量(5個樣值)等改進方法,達到高質(zhì)量和低時延的目的,,總的編碼時延小于2 ms,。
1.2 適合井下通信要求的編碼方式
 礦井下環(huán)境復(fù)雜,存在著巷道繁多,、干擾較大等特點,,所以在選擇編碼方式時一定要結(jié)合實際環(huán)境選擇適合井下通信的方法,其原則有:(1)雖然井下通信對語音的清晰度要求不是很高,,但井下環(huán)境比較復(fù)雜,,巷道距離長,彎道多,,噪聲大,,所以編碼應(yīng)有較強的抗噪聲干擾和抗誤碼性能;(2)井下帶寬資源有限,,所以語音編碼速率在保證話音清晰的前提下應(yīng)盡可能低,,以減少在系統(tǒng)帶寬中的占有率;(3)對編譯碼時延要求不是很高,但編譯碼器必須簡單,,性價比要高,;(4)井下環(huán)境易燃易爆,所以設(shè)備功率要小,,必須是本安型的防爆設(shè)備,。目前國內(nèi)井下通信系統(tǒng)主要應(yīng)用的數(shù)字語音編碼方式為CVSD編碼,它主要有以下優(yōu)點:原理簡單,,硬件要求低,,抗誤碼性能強和技術(shù)成熟,具有專屬芯片產(chǎn)品CMX639,。但隨著技術(shù)的發(fā)展,,現(xiàn)代井下通信系統(tǒng)有了更高的要求,在語音通信的基礎(chǔ)上要求圖像或視頻的通信功能,,這樣就要求利用DSP,、FPGA等模塊化的嵌入式系統(tǒng)來實現(xiàn),而且要求語音編碼的速率更低,,盡可能地不占用寶貴的井下帶寬資源,。CVSD在編碼速率方面有著局限性,在16 kb/s以上語音質(zhì)量比較良好,,但是在16 kb/s下語音質(zhì)量下降很快,,不能適應(yīng)現(xiàn)代井下數(shù)字通信系統(tǒng)的要求,所以尋找一個更加合適的語音編碼方式勢在必行,,而作為ITU-T的G.728標準的LD-CELP方法是系統(tǒng)最佳的選擇,。
2 LD-CELP原理及實現(xiàn)
 LD-CELP被ITU-T定為標準的G.728語音編碼協(xié)議,圖1和圖2是算法的編解碼器原理圖,。LD-CELP和CELP(碼本激勵線性預(yù)測)算法一樣利用了合成分析法進行碼本搜索,,并在此基礎(chǔ)上利用后向自適應(yīng)預(yù)測技術(shù)對短時譜包絡(luò)和增益進行預(yù)測,所以能達到算法延時0.625 ms,,一路編解碼延時小于2 ms,。編碼過程首先將速率為64 kb/s的A律或者μ律PCM輸入信號轉(zhuǎn)換成均勻量化的PCM信號,接著由5個連續(xù)的語音樣點su(5n),,su(5n+1),,……su(5n+4)形成一個五維語音矢量。激勵碼本中共有1 024個五維的碼矢量,。對于每個輸入語音矢量,,編碼器利用合成分析法從碼本中搜索出最佳碼矢量,,然后將10 bit的碼本標號送出去,。線性預(yù)測(LP)系數(shù)是用先前量化過的語音信號來提取和更新的。每4個相鄰的輸入矢量(20個樣點)構(gòu)成一幀,每幀更新一次LP系數(shù),;激勵的增益也是利用之前量化激勵信號的增益信息逐矢量地進行提取和更新,。LD-CELP這種獨特的編碼技術(shù)在16 kb/s速率上編解碼后的語音質(zhì)量在MOS(平均意見分,最大值5分)評分標準中達到了4.173的高分,,基本可以還原原始的語音信號,,并且在低于16 kb/s速率下語音質(zhì)量能保持較好的穩(wěn)定狀態(tài)。其優(yōu)良的性能完全適合礦井下數(shù)字漏泄移動通信的要求,。


3 硬件設(shè)計
 系統(tǒng)采用了SEED-DEC643作為算法實時實現(xiàn)的硬件平臺,,以高性能的32 bit定點DSP(TMS320DM643)為主控芯片的DSP系統(tǒng),處理能力達到了4 800 MIPS,,完全滿足運算的需求,。芯片上集成了一個多通道音頻串行接口(McASP)外設(shè),具有8根串行數(shù)據(jù)線,,由軟件配置輸入和輸出,,具有很強的可編程能力,可以配置為多種同步串口標準,,可以和音頻ADC,、DAC,Codec,,數(shù)字音頻接口接收器DIR和S/PDIF傳輸物理層器件實現(xiàn)無縫連接,,直接與各種器件高速接口。圖3所示為TMS320DM643接口框圖,。

 以TMS320DM643為核心的聲碼器結(jié)構(gòu)框圖如圖4所示,。DEC643開發(fā)板通過XDS510PLUS仿真器與PC機連接,由PC機通過CCS(Code Composer Studio)集成開發(fā)環(huán)境進行調(diào)試,。運行時,,語音信號由MIC輸入,經(jīng)A/D轉(zhuǎn)換為數(shù)字信號,,通過設(shè)定的串口0進入DM643編碼器部分對該語音信號進行編碼,,編碼后進入解碼模塊進行解碼,輸出重建語音信號,,最后經(jīng)串口1送至D/A轉(zhuǎn)換器輸出至耳機,,從而完成編解碼的過程。

4 軟件設(shè)計

 


 軟件設(shè)計主要采用混合編程方法實現(xiàn),,在DSP資源配置,、通信串口模塊、中斷模塊,、濾波器等模塊采用了匯編程序編寫,。編碼模塊流程圖和主程序流程圖分別如圖5,、圖6所示。主程序首先用GEL文件對DM643進行初始化,,再初始化McASP模塊,,然后打開中斷控制寄存器,允許中斷請求,,設(shè)置數(shù)據(jù)接收緩存,,進入主循環(huán),開始接收,、處理和發(fā)送數(shù)據(jù),。在接收過程中不斷檢測接收緩存區(qū),直至緩存區(qū)為空,,數(shù)據(jù)接收完畢,,將一幀數(shù)據(jù)從中取出,同時緩存區(qū)計數(shù)器清零,,開始對接收的語音數(shù)據(jù)進行壓縮編碼處理,。解碼過程則是編碼的逆過程。重復(fù)上述循環(huán)過程完成對一組語音數(shù)據(jù)的編解碼處理,。

 利用系統(tǒng)對語音數(shù)據(jù)進行采集與分析,,對一段男聲錄音“合肥工業(yè)大學”的原始語音信號和編解碼后的信號的時域波形進行比較,如圖7,、圖8所示,,可以看出,原始錄音人為夾雜了一些噪聲時,,波形相對比較尖銳,,而在假定信道無噪聲干擾的情況下利用LD-CELP編解碼后的語音信號波形能夠很好地重建原始信號的包絡(luò),可以過濾出原始信號中尖銳的環(huán)境噪聲,,并且語音編碼速率得到了很大的降低,,實現(xiàn)在低速率下滿足人們對語音可懂度和清晰度的要求,節(jié)約了整個系統(tǒng)的帶寬,。

 本文通過對LD-CELP算法原理的分析,,在TMS320DM643平臺上實現(xiàn)了編解碼的過程,演示了算法的性能,。說明了LD-CELP完全可以在數(shù)字通信快速發(fā)展的今天代替目前礦井下常用的CVSD算法,,實現(xiàn)更高質(zhì)量的語音通信,并且其在低速率通信下能保持高清晰度的特點,,大大節(jié)省了整個漏泄通信系統(tǒng)的帶寬,,為以后在DM643平臺上開發(fā)礦井數(shù)字漏泄移動通信系統(tǒng)中先進的視頻通信模塊提供了良好的條件。在下一步的研究中將結(jié)合礦井下復(fù)雜的巷道環(huán)境,,在傳輸過程中模擬加入一些礦井中常見的噪聲,,進一步分析LD-CELP算法在井下特定環(huán)境具有各種干擾的情況下能否適應(yīng)數(shù)字漏泄移動通信系統(tǒng)對語音通信功能的要求,。
參考文獻
[1] CCITT. Recommendation G.728.coding of speech at 16 kb/s using low-delay code excited linear prediction.Geneva,1992.
[2] Texas Instruments. TMS320DM643 user′s guide[Z]. 2004.
[3] 張雪英.數(shù)字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,,2010.
[4] 楊行峻.語音信號數(shù)字處理[M].北京:電子工業(yè)出版社,2007.
[5] SEED-DTK643V1.0實驗手冊.北京合眾達電子技術(shù)有限公司,,2009.

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。