摘 要: 針對無線衰落信道中AMR-WB寬帶語音編碼,,提出一種基于多速率刪余卷積碼的不等錯誤保護傳輸方案,。根據(jù)AMR-WB語音編碼數(shù)據(jù)的不同重要性,,采用強錯誤保護能力的刪余卷積碼為AMR-WB語音編碼中的A類數(shù)據(jù)提供錯誤保護能力,,對B類數(shù)據(jù)采用高碼率刪余卷積碼提供錯誤保護能力。研究結(jié)果表明,,在同樣傳輸帶寬條件下,,不等錯誤能力保護可以有效改善無線衰落信道中AMR-WB語音質(zhì)量。
關(guān)鍵詞: 自適應多速率寬帶語音編碼,;無線衰落信道,;不等錯誤保護;刪余卷積碼
?
國際電信聯(lián)盟ITU(International Telecommunication Union)于2003年發(fā)布了高質(zhì)量的自適應多速率寬帶AMR-WB(Adaptive Multi-Rate Wideband)語音編碼G.722.2作為未來全球移動通信系統(tǒng)GSM(Global System for Mobile)與寬帶碼分多址WCDMA(Wideband Code Division Multiple Access)移動通信系統(tǒng)的寬帶語音編解碼標準[1],。該語音編碼標準采樣率為16kHz,,支持的語音帶寬為50~7 000Hz,其語音質(zhì)量相對于G.711,、G.723,、G.728都有明顯提高。G.722.2采用代數(shù)碼激勵線性預測ACELP(Algebraic Code-Excited Linear Prediction)算法,,提供比特率從6.60kb/s到23.85kb/s的9種不同的編碼模式,,語音聲碼器根據(jù)無線信道和傳輸狀況來自適應地選擇合適速率進行編碼傳輸,支持不連續(xù)傳輸模式,、語音激活檢測和舒適背景噪聲產(chǎn)生的功能[2],。AMR-WB寬帶編解碼標準可以應用于無線通信網(wǎng)絡和有線通信網(wǎng)絡, 解決了不同網(wǎng)絡之間的語音編碼方式的轉(zhuǎn)換問題,,可以緩解通信系統(tǒng)與設備之間不同語音編碼方式轉(zhuǎn)換帶來的額外復雜性[3],。
如何提高無線衰落信道中AMR-WB語音的傳輸質(zhì)量是無線多媒體通信研究的一個熱點,其中不等錯誤能力保護UEP(Unequal Error Protection)是一種簡單有效的手段,。UEP通過對語音編碼中不同類型的數(shù)據(jù)提供不同的錯誤保護能力來改善語音的傳輸質(zhì)量,。本文研究平坦Rayleigh衰落信道中UEP下AMR-WB的性能,采用不同碼率的變速率刪余卷積碼RCPC(Rate Compatible Punctured Convolutional Codes)為AMR-WB語音編碼數(shù)據(jù)提供的不同錯誤保護能力,。研究結(jié)果表明,,在語音質(zhì)量感覺評價準則下,采用不等錯誤保護能力的RCPC可以改善衰落信道中AMR-WB語音的傳輸質(zhì)量,。
1 AMR-WB語音編碼器的分類保護特性
AMR-WB編解碼器是按20ms為一幀進行處理的,,在每幀中包括了三部分:AMR-WB頭部、AMR-WB輔助信息(模式預測4bit,、模式要求4bit,、CRC校驗8bit)、AMR-WB核心幀,。AMR-WB核心幀存放的是語音數(shù)據(jù)或舒適噪聲參數(shù),。由編碼器產(chǎn)生的比特順序為{s(1),s(2),…,s(K)}, K代表不同的編碼模式所產(chǎn)生的總比特數(shù)。這些比特在輸出編碼器之前將根據(jù)它們的主觀重要性的不同而重新調(diào)整順序,,以達到不等錯誤保護的目的,。排序算法為:
其中m=0,1,…,8為編碼模式,,tablem(j)的內(nèi)容在G.722.2附件E表格E.5中給出,。
重新排序的比特順序變?yōu)閧d(0),d(1),…,d(K)},其重要性隨著K的增大而減小,。重新排序的比特流根據(jù)它們的主觀重要性被分成A,、B和C三類數(shù)據(jù)。不同模式下三類分配的比特數(shù)如表1所示,。
?
A類數(shù)據(jù)中的比特對錯誤非常敏感,,其中的錯誤都會嚴重影響解碼端正常的解碼操作,因此需要采用合適的錯誤隱藏方法進行解決,,A類需要用在幀的輔助信息中加入CRC校驗來對數(shù)據(jù)進行差錯校驗,。8位CRC產(chǎn)生的多項式為
????
B類和C類較A類對錯誤有更強的魯棒性,其中的比特錯誤會降低語音質(zhì)量,,但這些類的錯誤比特在解碼過程中不會影響到語音的可懂度,。B類比C類對錯誤更敏感些。
2 AMR-WB編碼器算法
G.722.2中AMR-WB語音編碼采用ACELP算法,,編碼模型為碼激勵線性預測CELP(Code Excited Linear Prediction)模型,。CELP采用合成分析、碼本搜索過程,、感覺加權(quán),、矢量量化和線性預測技術(shù)[4]。CELP合成模型如圖1所示,。
?
在這種模型中,,線性預測編碼LPC(Linear Prediction Coding)濾波器是一個16階的短時濾波器,其傳輸函數(shù)為:
其中,是量化的線性預測濾波器系數(shù),,基音周期合成濾波器(長時合成濾波器)形式為:
其中, T為基音延時,,gp為基音增益,。CELP采用自適應碼本中的一個矢量來逼近語音的長時基音結(jié)構(gòu);同時采用固定隨機碼本中的一個碼矢量來逼近語音短時,、長時預測后的殘差信號,。從兩個碼本中搜索出最佳碼矢量,乘以各自的最佳增益后相加,,得到CELP激勵信號源,。將激勵信號輸入線性預測綜合濾波器1/A(z),得到合成語音信號與原始信號s(n)的誤差經(jīng)過感覺加權(quán)濾波器W(z)得到感覺加權(quán)誤差e(n),,CELP用感覺加權(quán)的最小均方預測誤差作為搜索最佳碼矢量及其幅度的度量準則,,使感覺加權(quán)誤差最小的碼矢量即是最佳碼矢量。AMR-WB的感覺加權(quán)濾波器的形式為:
???
??? AMR-WB編解碼器從每一幀中提取LPC濾波器系數(shù),、自適應碼本和固定碼本的序號和增益;對這些參數(shù)經(jīng)過編碼后傳輸?shù)浇邮斩?。接收端從接收到的?shù)據(jù)流中提取參數(shù),構(gòu)建濾波器來重建語音,。
3 無線衰落信道的編碼
??? RCPC是通過對標準碼率為碼率的卷積碼進行周期性刪余得到不同碼率兼容的卷積碼,,由同一個卷積碼刪余得到的各種碼率的RCPC可以共用一個Viterbi譯碼器進行譯碼[5]。RCPC在通信系統(tǒng)中被廣泛應用,。本文利用不同速率的RCPC實現(xiàn)UEP功能,,其中1/3卷積碼的生成元為(13,15,17)8,自由距離為10,,刪余后1/2卷積碼的生成元為(15,17)8,,自由距離為6,二者共用一個Viterbi譯碼器[6],。圖2為平坦瑞利信道中RCPC硬判決譯碼的性能,,橫坐標為比特信噪比(Eb/N0),縱坐標為誤比特率BER(Bit Error Rate),。
??? 從圖2可知,在相同的信噪比條件下,,1/3碼率的RCPC相對于碼率為1/2的RCPC大約有2dB的編碼增益。本文利用碼率為1/2和1/3的RCPC實現(xiàn)AMR-WB數(shù)據(jù)的不等錯誤保護,。
4 仿真與實驗結(jié)果?
在對語音文件仿真時,,使用ITU-T G.722.2附件D提供的語音測試序列作為語音原材料。其文件名為tst.inp, 大小為125KB,,采用ITU編碼格式,。實驗過程為:AMR-WB編碼器先對tst.inp進行壓縮編碼,輸出碼流經(jīng)過RCPC信道編碼之后采用BPSK進行調(diào)制,,調(diào)制后的信號通過瑞利衰落信道傳送到接收端,;接收端采用與發(fā)送端相反的操作,最終得到以.out為后綴的語音輸出文件。評判語音質(zhì)量時采用ITU-T建議P.862.3中給出的語音質(zhì)量感覺評價方法,,即PESQ(Perceptual Evaluation of Speech Quality)算法[7],。PESQ得分用于衡量語音質(zhì)量。
AMR-WB編碼器提供了9種不同的編碼模式,,對每種模式都采用RCPC信道編碼,,對AMR-WB核心幀中重要程度最高的A類數(shù)據(jù)使用速率為1/3的信道編碼,對B類數(shù)據(jù)使用速率為1/2的信道編碼,, C類數(shù)據(jù)沒有編碼比特,因此不予考慮,。在不采用UEP時,,對A和B類數(shù)據(jù)統(tǒng)一采用碼率為4/9的RCPC,這樣采用UEP和不采用UEP的編碼方案具有相同的傳輸帶寬,。圖3給出了tst.inp語音文件在采用UEP和不采用UEP情況下的部分語音時域波形圖,。從圖中可以看出,在沒有使用UEP情況下其質(zhì)量相對要差一些,。
對AMR-WB核心幀采用UEP方案的PESQ得分與沒有采用UEP方案時的得分進行比較,,可以得到圖4的結(jié)果。在相同的編碼模式下, 使用刪余卷積碼對語音進行刪余保護,,其PESQ值高于沒有使用時的得分,。從圖中還可以看出在較低速率編碼模式下兩者的差別更為明顯,說明在低速率語音編碼情況下,,采用UEP提高語音質(zhì)量的效果更為明顯,。
?
本文利用不同碼率的刪余卷積碼對AMR-WB核心幀中不同重要程度的語音編碼數(shù)據(jù)提供不同的錯誤保護能力。研究結(jié)果表明,,在相同傳輸帶寬的條件下,,不同錯誤保護可以改善AMR-WB語音質(zhì)量,在低速率語音編碼模式下效果更為明顯,。
參考文獻
[1]?ITU-T Recommendation G.722.2: Wideband coding of Speech at around 16kbit/s using Adaptive Multi-Rate
?Wideband(AMR-WB) [S]. ITU, 2003.
[2]?VARGA I, IACOVO R. Standardization of the AMR?wideband speech codec in 3GPP and ITU-T [J]. IEEE?Communications Magazine, 2006,44(5):66-73.
[3]?OJALA P, LAKANIEMI A. Wideband speech codec:?system characteristics, quality advances, and deployment
?strategies [J]. IEEE Communications Magazine,2006,44(5):59-65.
[4]?HUANG Yi Teng, BENESTY J. Audio signal processing?for ext-generation multimedia communication systems [M]. ?Boston, MA, USA: Kluwer Academic Publishers.
[5]?HAGENAUER J. Rate-compatible punctured convolutional?codes(RCPC Codes) and their applications[J].IEEE Trans.Comm, Apr.1988,36(4):389-399.
[6]?SHU LIN, COSTELLO D. Error control coding: fundamentals and applications [M]. Upper Saddle River, NJ,
?USA: Prentice Hall, 2003.
[7]?ITU-T recommendation P. 862.3: Application guide for?objective quality measurement based on recommendations?[S]. ITU, 2007.