AMBE-2000TM語音壓縮編碼電路分析-AET-電子技術(shù)應(yīng)用

AMBE-2000TM語音壓縮編碼電路分析

摘要： AMBE-2000TM語音壓縮編碼電路分析,1引言語音壓縮編碼技術(shù)一直是在盡可能低的數(shù)碼率下獲得盡可能好的合成語音質(zhì)量的矛盾中發(fā)展的。數(shù)碼率實質(zhì)上反映的是頻帶寬度，降低數(shù)碼率實質(zhì)上就是壓縮頻帶寬度。

關(guān)鍵詞： 數(shù)據(jù)轉(zhuǎn)換碼率數(shù)據(jù)幀激勵信號接收端傳輸率壓縮技術(shù)

Abstract：

Key words :

1 引言

語音壓縮編碼技術(shù)一直是在盡可能低的數(shù)碼率下獲得盡可能好的合成語音質(zhì)量的矛盾中發(fā)展的。數(shù)碼率實質(zhì)上反映的是頻帶寬度，降低數(shù)碼率實質(zhì)上就是壓縮頻帶寬度。近10年來，固定電話和移動通信高速發(fā)展，頻率資源變得愈加寶貴，信道利用率成為一項關(guān)鍵因素，這促使語音壓縮技術(shù)，即語音編碼技術(shù)不斷發(fā)展。在有線通信及移動通信、衛(wèi)星通信和掌上電腦的語音傳送應(yīng)用中，語音編碼依舊扮演著十分重要的角色。
基于多帶激勵(MBE)算法，1997年，美國數(shù)字語音系統(tǒng)公司(DVSI)研制出先進的多帶激勵(AMBE-Advanced MBE)語音雙工編解碼芯片AMBE-1000TM，AMBE算法是標準MBE的改進和補充。隨后又推出AMBE-2000TM型語音壓縮碼電路。該壓縮技術(shù)已被證明優(yōu)于CELP，RELP，VSELP，MELP，ECELP，MP-MLQ，LPC-10及其他壓縮技術(shù)。該語音電路能應(yīng)用于包括數(shù)字移動通信系統(tǒng)在內(nèi)的許多領(lǐng)域，如衛(wèi)星通信、保密通信、語音多路技術(shù)、語音郵件、多媒體、IP電話等。

2 多帶激勵編碼的原理

美國麻省理工學院(MIT)的D．W．Griffin博士提出的多帶激勵(MBE)語音編碼方案突破了二元激勵的局限性，是一個不用預(yù)測殘差的完全的參數(shù)語音編碼器，在2．0kb／s～4．8kb／s速率內(nèi)能夠合成質(zhì)量比傳統(tǒng)聲碼器好得多的語音，并且具有較好的自然度和容忍環(huán)境噪聲的能力，是目前這一速率范圍內(nèi)的一種較理想的編碼算法。

2．1 MBE的基本原理

多帶激勵的基本原理如圖1所示，將語音譜按各基音諧波頻率分成若干個帶，對各帶信號分別進行清濁音判決。總的激勵信號由各帶激勵信號相加構(gòu)成。對于濁音帶用以基音周期為間隔的脈沖序列譜作為激勵信號譜；對于清音帶采用白噪聲譜作為激勵信號譜，最后將各帶信號相加，形成全帶激勵信號。激勵信號通過時變數(shù)字濾波器，確定各諧波帶的相對幅度和相位，將激勵譜映射為語音譜。這種方案能將合成語音與原始語音在頻譜的細致結(jié)構(gòu)上擬合得很好，更加符合實際語音的特性，因而能夠獲得較高的自然度。

2．2 AMBE的語音壓縮算法

AMBE是在MBE基礎(chǔ)上的改進和補充，基本算法是先將輸入的每幀160個數(shù)字話音取樣，分成交迭的段，經(jīng)模型分析后得出該幀的模型參數(shù)。編碼器先進行V／U判別，將其分成交迭的8個段；再對每個段進行模型分析，得到模型參數(shù)，然后量化編碼，最后加上前向糾錯碼(FEC)，以2．0kb／s～9．6kb／s的碼率發(fā)送。解碼器將接收到的比特流進行相應(yīng)的糾錯解碼，將重構(gòu)模型參數(shù)，再利用這些參數(shù)進行合成，恢復出語音。

3 AMBE-2000TM電路簡介

3．1 電路優(yōu)點

1)優(yōu)異的語音質(zhì)量；2)低造價，低功耗，緊湊的引腳100 TQFP型封裝；3)無需外部存儲器；4)較強的抗干擾能力；5)支持插入前向糾錯碼的可變速率(2．0kb／s～9．6kb／s)；6)全雙工實時處理；7)語音激活探測(VAD)／舒適背景噪音插入；8)雙音多頻(DTMF)探測和生成；9)回音抵消。

3．2 基本工作原理

該電路可以被視為兩個獨立的部分即編碼器和解碼器。編碼器接收8kHz話音數(shù)據(jù)流(16位線性、8位A率、8位μ率)并以所希望的碼率輸出數(shù)據(jù)流到傳輸信道上，相反，解碼器接收從傳輸信道上傳送的數(shù)據(jù)流合成出8kHz話音數(shù)據(jù)流。其編碼器與解碼器的接口時序是完全異步的。基本工作原理如圖2所示。

3．3 工作模式及其幀格式

3．3．1 工作模式

AMBE-2000TM不同于AMBE-1000TM，AMBE-2000TM只有串行接口模式，沒有并行接口模式。

AMBE-2000TM有四種工作模式：主幀格式、主非幀格式、從幀格式和從非幀格式。這四種工作模式都可以用軟件編程和硬件引腳設(shè)置來獲得。

在從模式下，AMBE-2000TM的編碼器輸出壓縮后的數(shù)據(jù)流所需的選通信號CHAN_TX_STRB由外部時鐘源提供。在主模式下，CHAN_TX_STRB由內(nèi)部時鐘源提供。

在正常工作中，編碼器要每20ms輸出一幀數(shù)據(jù)，而解碼器需要接收處理一幀數(shù)據(jù)，對于編碼器和解碼器都需要有一些數(shù)據(jù)格式，主要的目的是為編碼時提供一定的校正信息。采用幀格式模式時，編碼器輸出的數(shù)據(jù)都是已知的固定幀格式，在該模式下有一些狀態(tài)標志信息，用于控制目的和同步，并用于解碼器解碼。采用非幀格式時，編碼器的輸出數(shù)據(jù)沒有固定的格式，其同步和控制的狀態(tài)信息比特數(shù)據(jù)插入語音編碼比特流中，它們一起被視為連續(xù)的語音數(shù)據(jù)流，因此，該模式的一個優(yōu)點就是在信道上不用為傳幀頭而增加額外的帶寬。缺點是解碼器為了能在正確地合成語音波形之前獲得與數(shù)據(jù)流同步，需要接收完10組～12組語音數(shù)據(jù)幀。

3．3．2 幀格式工作模式下數(shù)據(jù)的幀格式

數(shù)據(jù)幀格式分為輸入幀格式和輸出幀格式。

1)輸入幀格式

輸入格式如表1所示，可以看出，Word0是固定的0x13EC，起同步作用。Word1控電源模式并包含幀丟失和舒適噪音插入信息。Word2～Word6用以調(diào)節(jié)碼率(2．0kb／s～9．6kb／s)。Word7～Word9為未用字，全為"0"。Wordl0為雙音多頻的控制信息。WoM11含有語音激活探測、休眠狀態(tài)、回音消除等控制信息。word 12～word 23是真正的話音數(shù)據(jù)(40 bit～192bit)。

2)輸出幀格式

輸出格式如表2所示，輸出幀格式與輸入幀格式基本相同，只是將Word7作為位錯誤率信息字，用以報告位錯誤信息。Word8用于報告軟件決定距離信息。Word9用于報告最近解碼幀探測到的位錯誤數(shù)。

4 AMBE-2000TM在系統(tǒng)中的應(yīng)用

4．1 A／D-D／A接口的選擇

從模擬語音信號到AMBE-2000TM的接口是A／D及D／A轉(zhuǎn)換器，其選擇很重要，將影響系統(tǒng)語音的質(zhì)量，可以是標準的8位／4率或A率壓擴量化的PCM信號，也可以是16位線性量化的PCM信號，使用16位線性量化的PCM編碼器能獲得更好的語音效果。本系統(tǒng)采用Analog Devices公司的AD73311AR，它是16位線性量化PCM編解碼器，采樣率為32kHz，可同時進行A／D轉(zhuǎn)換和D／A轉(zhuǎn)換。

4．2 AMBE-2000TM的傳輸信道接口

AMBE-2000TM的輸出數(shù)據(jù)在信道中傳輸?shù)倪^程如圖3所示。

從圖3可以清楚地看到，從編碼器輸出的一幀數(shù)據(jù)并不全部送到信道上傳給接收方的解碼器，而是在本地將前192bit的數(shù)據(jù)幀頭抽取掉，只發(fā)送后面的192個語音數(shù)據(jù)比特，到達接收端后，再由系統(tǒng)完成在這192bit的前面加上數(shù)據(jù)幀頭的工作，組成一幀完整的數(shù)據(jù)幀后送給接收端的解碼器進行解碼。必須注意的是，語音數(shù)據(jù)在信道上傳輸時必須加上系統(tǒng)幀頭，否則無法在接收端實現(xiàn)同步。此外，當碼率為9600b／s時，這192bit才全部為有效的壓縮語音數(shù)據(jù)，當?shù)陀? 600b／s時，只有一部分為有效壓縮語音數(shù)據(jù)，其余的補"0"，這些"0"仍需通過信道傳輸給接收方的解碼器進行解碼。

4．3 系統(tǒng)設(shè)計

本系統(tǒng)采用AD73311AR實現(xiàn)模／數(shù)、數(shù)／模轉(zhuǎn)換，用xilinx公司的FPGA實現(xiàn)對AMBE-2000TM的數(shù)據(jù)幀頭的抽取和合成的控制處理。如上所述，AMBE-2000TM的一幀數(shù)據(jù)只將語音數(shù)據(jù)和加上的系統(tǒng)幀頭送入信道，發(fā)送給接收端，在接收端收到的語音數(shù)據(jù)必須去掉系統(tǒng)幀頭再加上數(shù)據(jù)幀頭后才能送給解碼器進行解碼。FPGA完成幀頭的控制功能。整個系統(tǒng)框圖如圖4所示。在本系統(tǒng)中，AMBE-2000TM是設(shè)置為主幀格式模式。在整個系統(tǒng)工作之前，要對AMBE-2000TM復位，低電平有效，復位時間不少于50μs，在復位信號出現(xiàn)上升沿后95ms，電路才開始處理AD73311的PCM信號。信道的傳輸率為4 kb／s。

5 仿真結(jié)果

圖5是從AMBE-2000TM出來的壓縮數(shù)據(jù)的幀頭，192位幀頭只仿真了前面的16位，以后的全設(shè)為"0"。圖6是送給AMBE-2000TM解碼的數(shù)據(jù)(只顯示了幀頭)。圖7是去掉幀頭只加上系統(tǒng)幀頭Oxl3EC作為同步用的信道數(shù)據(jù)，為了方便，仿真時將有效數(shù)據(jù)設(shè)定為"1001．．．．．．"(一幀有效數(shù)據(jù)共40bit)。傳輸率為4kb／s．

6 結(jié)束語

本系統(tǒng)進行了30個小時的長時間實驗，一直保持著良好的工作狀態(tài)。在4kb／s的傳輸率下，保持了較高的語音質(zhì)量，并具有較強的語音識別能力。該系統(tǒng)的語音信號經(jīng)過調(diào)制后可用于無線通信，我們用FSK進行調(diào)制傳輸取得了滿意的語音效果。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容