礦用數(shù)字漏泄移動(dòng)通信系統(tǒng)中語(yǔ)音編解碼的研究與實(shí)現(xiàn)-AET-電子技術(shù)應(yīng)用

礦用數(shù)字漏泄移動(dòng)通信系統(tǒng)中語(yǔ)音編解碼的研究與實(shí)現(xiàn)

來(lái)源：微型機(jī)與應(yīng)用2011年第21期

婁開宇，昂志敏，楊柳

(合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院，安徽合肥 230009)

摘要： 結(jié)合礦井的實(shí)際環(huán)境討論了井下數(shù)字漏泄移動(dòng)通信系統(tǒng)中語(yǔ)音編解碼方法的選擇原則；分析了LD-CELP算法的特點(diǎn)和優(yōu)勢(shì)，研究了該算法的性能；給出了在TMS320DM643平臺(tái)上LD-CELP編解碼方法的具體設(shè)計(jì)方案。

關(guān)鍵詞： DSP 井下數(shù)字通信語(yǔ)音編解碼 LD-CELP TMS320DM643

Abstract：

Key words :

　國(guó)家工信部近年將逐步停止對(duì)模擬對(duì)講機(jī)型號(hào)的核準(zhǔn)，并將在幾年內(nèi)完成模擬對(duì)講機(jī)到數(shù)字對(duì)講機(jī)的過渡。根據(jù)這一規(guī)定及市場(chǎng)的發(fā)展前景可以看出，現(xiàn)有的礦井下模擬漏泄通信系統(tǒng)在未來(lái)5~6年后將逐步淘汰，因此開發(fā)先進(jìn)的礦井下數(shù)字漏泄通信系統(tǒng)是現(xiàn)代通信技術(shù)發(fā)展的必然趨勢(shì)。而語(yǔ)音通信作為數(shù)字通信的核心部分必然會(huì)作為研究的重點(diǎn)，其中選擇適應(yīng)井下復(fù)雜環(huán)境的數(shù)字語(yǔ)音編解碼方法顯得尤為重要。
1 語(yǔ)音編解碼技術(shù)及井下選擇標(biāo)準(zhǔn)
1.1 語(yǔ)音編碼的分類及介紹
　語(yǔ)音信號(hào)的編碼方法可分為波形編碼、參數(shù)編碼和混合編碼三類。波形編碼自適應(yīng)能力強(qiáng)，語(yǔ)音質(zhì)量好，但所需要的編碼速率較高，一般在16 kb/s以上。而參數(shù)編碼以數(shù)學(xué)模型模擬語(yǔ)音信號(hào)產(chǎn)生機(jī)制為基礎(chǔ)，通過提取信號(hào)的特征參數(shù)來(lái)編碼，優(yōu)點(diǎn)是編碼速率低，但語(yǔ)音質(zhì)量較差，清晰度不高。混合編碼則是在保留分析合成編碼的技術(shù)基礎(chǔ)上，引進(jìn)了波形編碼準(zhǔn)則去優(yōu)化激勵(lì)信號(hào)，從而在低碼率上獲得了較高質(zhì)量的合成語(yǔ)音。連續(xù)可變斜率增量調(diào)制(CVSD)是增量調(diào)制的一種改進(jìn)方法。這種方法中信號(hào)斜率是根據(jù)碼流中連“1”或連“0”的個(gè)數(shù)來(lái)檢測(cè)，所以又稱為數(shù)字檢測(cè)。低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)是G.728語(yǔ)音編碼標(biāo)準(zhǔn)算法，這種算法采用后向自適應(yīng)線性預(yù)測(cè)、50階全極點(diǎn)合成濾波、短激勵(lì)矢量(5個(gè)樣值)等改進(jìn)方法，達(dá)到高質(zhì)量和低時(shí)延的目的，總的編碼時(shí)延小于2 ms。
1.2 適合井下通信要求的編碼方式
　礦井下環(huán)境復(fù)雜，存在著巷道繁多、干擾較大等特點(diǎn)，所以在選擇編碼方式時(shí)一定要結(jié)合實(shí)際環(huán)境選擇適合井下通信的方法，其原則有：(1)雖然井下通信對(duì)語(yǔ)音的清晰度要求不是很高，但井下環(huán)境比較復(fù)雜，巷道距離長(zhǎng)，彎道多，噪聲大，所以編碼應(yīng)有較強(qiáng)的抗噪聲干擾和抗誤碼性能；(2)井下帶寬資源有限，所以語(yǔ)音編碼速率在保證話音清晰的前提下應(yīng)盡可能低，以減少在系統(tǒng)帶寬中的占有率；(3)對(duì)編譯碼時(shí)延要求不是很高，但編譯碼器必須簡(jiǎn)單，性價(jià)比要高；(4)井下環(huán)境易燃易爆，所以設(shè)備功率要小，必須是本安型的防爆設(shè)備。目前國(guó)內(nèi)井下通信系統(tǒng)主要應(yīng)用的數(shù)字語(yǔ)音編碼方式為CVSD編碼，它主要有以下優(yōu)點(diǎn)：原理簡(jiǎn)單，硬件要求低，抗誤碼性能強(qiáng)和技術(shù)成熟，具有專屬芯片產(chǎn)品CMX639。但隨著技術(shù)的發(fā)展，現(xiàn)代井下通信系統(tǒng)有了更高的要求，在語(yǔ)音通信的基礎(chǔ)上要求圖像或視頻的通信功能，這樣就要求利用DSP、FPGA等模塊化的嵌入式系統(tǒng)來(lái)實(shí)現(xiàn)，而且要求語(yǔ)音編碼的速率更低，盡可能地不占用寶貴的井下帶寬資源。CVSD在編碼速率方面有著局限性，在16 kb/s以上語(yǔ)音質(zhì)量比較良好，但是在16 kb/s下語(yǔ)音質(zhì)量下降很快，不能適應(yīng)現(xiàn)代井下數(shù)字通信系統(tǒng)的要求，所以尋找一個(gè)更加合適的語(yǔ)音編碼方式勢(shì)在必行，而作為ITU-T的G.728標(biāo)準(zhǔn)的LD-CELP方法是系統(tǒng)最佳的選擇。
2 LD-CELP原理及實(shí)現(xiàn)
　LD-CELP被ITU-T定為標(biāo)準(zhǔn)的G.728語(yǔ)音編碼協(xié)議，圖1和圖2是算法的編解碼器原理圖。LD-CELP和CELP(碼本激勵(lì)線性預(yù)測(cè))算法一樣利用了合成分析法進(jìn)行碼本搜索，并在此基礎(chǔ)上利用后向自適應(yīng)預(yù)測(cè)技術(shù)對(duì)短時(shí)譜包絡(luò)和增益進(jìn)行預(yù)測(cè)，所以能達(dá)到算法延時(shí)0.625 ms，一路編解碼延時(shí)小于2 ms。編碼過程首先將速率為64 kb/s的A律或者μ律PCM輸入信號(hào)轉(zhuǎn)換成均勻量化的PCM信號(hào)，接著由5個(gè)連續(xù)的語(yǔ)音樣點(diǎn)su(5n)，su(5n+1)，……su(5n+4)形成一個(gè)五維語(yǔ)音矢量。激勵(lì)碼本中共有1 024個(gè)五維的碼矢量。對(duì)于每個(gè)輸入語(yǔ)音矢量，編碼器利用合成分析法從碼本中搜索出最佳碼矢量，然后將10 bit的碼本標(biāo)號(hào)送出去。線性預(yù)測(cè)(LP)系數(shù)是用先前量化過的語(yǔ)音信號(hào)來(lái)提取和更新的。每4個(gè)相鄰的輸入矢量(20個(gè)樣點(diǎn))構(gòu)成一幀，每幀更新一次LP系數(shù)；激勵(lì)的增益也是利用之前量化激勵(lì)信號(hào)的增益信息逐矢量地進(jìn)行提取和更新。LD-CELP這種獨(dú)特的編碼技術(shù)在16 kb/s速率上編解碼后的語(yǔ)音質(zhì)量在MOS(平均意見分，最大值5分)評(píng)分標(biāo)準(zhǔn)中達(dá)到了4.173的高分，基本可以還原原始的語(yǔ)音信號(hào)，并且在低于16 kb/s速率下語(yǔ)音質(zhì)量能保持較好的穩(wěn)定狀態(tài)。其優(yōu)良的性能完全適合礦井下數(shù)字漏泄移動(dòng)通信的要求。

3 硬件設(shè)計(jì)
　系統(tǒng)采用了SEED-DEC643作為算法實(shí)時(shí)實(shí)現(xiàn)的硬件平臺(tái)，以高性能的32 bit定點(diǎn)DSP(TMS320DM643)為主控芯片的DSP系統(tǒng)，處理能力達(dá)到了4 800 MIPS，完全滿足運(yùn)算的需求。芯片上集成了一個(gè)多通道音頻串行接口(McASP)外設(shè)，具有8根串行數(shù)據(jù)線，由軟件配置輸入和輸出，具有很強(qiáng)的可編程能力，可以配置為多種同步串口標(biāo)準(zhǔn)，可以和音頻ADC、DAC，Codec，數(shù)字音頻接口接收器DIR和S/PDIF傳輸物理層器件實(shí)現(xiàn)無(wú)縫連接，直接與各種器件高速接口。圖3所示為TMS320DM643接口框圖。

　以TMS320DM643為核心的聲碼器結(jié)構(gòu)框圖如圖4所示。DEC643開發(fā)板通過XDS510PLUS仿真器與PC機(jī)連接，由PC機(jī)通過CCS(Code Composer Studio)集成開發(fā)環(huán)境進(jìn)行調(diào)試。運(yùn)行時(shí)，語(yǔ)音信號(hào)由MIC輸入，經(jīng)A/D轉(zhuǎn)換為數(shù)字信號(hào)，通過設(shè)定的串口0進(jìn)入DM643編碼器部分對(duì)該語(yǔ)音信號(hào)進(jìn)行編碼，編碼后進(jìn)入解碼模塊進(jìn)行解碼，輸出重建語(yǔ)音信號(hào)，最后經(jīng)串口1送至D/A轉(zhuǎn)換器輸出至耳機(jī)，從而完成編解碼的過程。

4 軟件設(shè)計(jì)

　軟件設(shè)計(jì)主要采用混合編程方法實(shí)現(xiàn)，在DSP資源配置、通信串口模塊、中斷模塊、濾波器等模塊采用了匯編程序編寫。編碼模塊流程圖和主程序流程圖分別如圖5、圖6所示。主程序首先用GEL文件對(duì)DM643進(jìn)行初始化，再初始化McASP模塊，然后打開中斷控制寄存器，允許中斷請(qǐng)求，設(shè)置數(shù)據(jù)接收緩存，進(jìn)入主循環(huán)，開始接收、處理和發(fā)送數(shù)據(jù)。在接收過程中不斷檢測(cè)接收緩存區(qū)，直至緩存區(qū)為空，數(shù)據(jù)接收完畢，將一幀數(shù)據(jù)從中取出，同時(shí)緩存區(qū)計(jì)數(shù)器清零，開始對(duì)接收的語(yǔ)音數(shù)據(jù)進(jìn)行壓縮編碼處理。解碼過程則是編碼的逆過程。重復(fù)上述循環(huán)過程完成對(duì)一組語(yǔ)音數(shù)據(jù)的編解碼處理。

　利用系統(tǒng)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行采集與分析，對(duì)一段男聲錄音“合肥工業(yè)大學(xué)”的原始語(yǔ)音信號(hào)和編解碼后的信號(hào)的時(shí)域波形進(jìn)行比較，如圖7、圖8所示，可以看出，原始錄音人為夾雜了一些噪聲時(shí)，波形相對(duì)比較尖銳，而在假定信道無(wú)噪聲干擾的情況下利用LD-CELP編解碼后的語(yǔ)音信號(hào)波形能夠很好地重建原始信號(hào)的包絡(luò)，可以過濾出原始信號(hào)中尖銳的環(huán)境噪聲，并且語(yǔ)音編碼速率得到了很大的降低，實(shí)現(xiàn)在低速率下滿足人們對(duì)語(yǔ)音可懂度和清晰度的要求，節(jié)約了整個(gè)系統(tǒng)的帶寬。

　本文通過對(duì)LD-CELP算法原理的分析，在TMS320DM643平臺(tái)上實(shí)現(xiàn)了編解碼的過程，演示了算法的性能。說(shuō)明了LD-CELP完全可以在數(shù)字通信快速發(fā)展的今天代替目前礦井下常用的CVSD算法，實(shí)現(xiàn)更高質(zhì)量的語(yǔ)音通信，并且其在低速率通信下能保持高清晰度的特點(diǎn)，大大節(jié)省了整個(gè)漏泄通信系統(tǒng)的帶寬，為以后在DM643平臺(tái)上開發(fā)礦井?dāng)?shù)字漏泄移動(dòng)通信系統(tǒng)中先進(jìn)的視頻通信模塊提供了良好的條件。在下一步的研究中將結(jié)合礦井下復(fù)雜的巷道環(huán)境，在傳輸過程中模擬加入一些礦井中常見的噪聲，進(jìn)一步分析LD-CELP算法在井下特定環(huán)境具有各種干擾的情況下能否適應(yīng)數(shù)字漏泄移動(dòng)通信系統(tǒng)對(duì)語(yǔ)音通信功能的要求。
參考文獻(xiàn)
[1] CCITT. Recommendation G.728.coding of speech at 16 kb/s using low-delay code excited linear prediction.Geneva，1992.
[2] Texas Instruments. TMS320DM643 user′s guide[Z]. 2004.
[3] 張雪英.數(shù)字語(yǔ)音處理及MATLAB仿真[M].北京：電子工業(yè)出版社，2010.
[4] 楊行峻.語(yǔ)音信號(hào)數(shù)字處理[M].北京：電子工業(yè)出版社，2007.
[5] SEED-DTK643V1.0實(shí)驗(yàn)手冊(cè).北京合眾達(dá)電子技術(shù)有限公司，2009.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容