用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法[圖]-AET-電子技術(shù)應用

用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法[圖]

來源：《電聲技術(shù)》1999年02期

竇維蓓陽學仕董在望清華大學電子工程系

摘要： 用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法[圖],摘要：MPEG音頻層III壓縮算法，是由ISO11172－3標準規(guī)定的一種高效、高保真的壓縮編碼算法

關(guān)鍵詞： DSP MPEG 壓縮編碼 Huffman

Abstract：

Key words :

摘要：MPEG音頻層III壓縮算法，是由ISO11172－3標準規(guī)定的一種高效、高保真的壓縮編碼算法。由于層III壓縮算法的復雜度高，運算量大，為此提出了在實時應用中，基于數(shù)字信號處理器(Digital Signal Processor，以下簡稱DSP)實現(xiàn)層III壓縮算法的關(guān)鍵運算的加速措施。

1 概述

數(shù)字音頻壓縮技術(shù)給人們提供了一種更為有效的音頻存儲、傳輸方法。音頻壓縮的技術(shù)有很多種，它們的復雜度、音頻壓縮質(zhì)量、以及壓縮比都有很大的差別。如：μ－law音頻壓縮算法，其特點是簡單，但壓縮比很低，但音質(zhì)一般。根據(jù)CCITTG.711建議，采用自然對數(shù)的量化過程，在輸入幅度比較小的時候能夠提供比較大精度的量化，而對于出現(xiàn)概率比較小的大幅度信號，量化噪聲相對而言則較大。這種量化方式使得8bit的數(shù)字量化信號在量化噪聲效果上等同于14bit的線性量化。而ADPCM壓縮編碼則充分利用了相鄰的抽樣值幅度變化比較小的特點，編碼輸出結(jié)果是當前抽樣值與預測值的差值。雖然ADPCM編碼的保真度較高，但其壓縮比卻比較小，只能夠達到4/1的壓縮比。改進的ADPCM編碼方法有IMA (Interactive Multimedia Association)提出的改進算法，CCITT的G.721，G.723建議等[1]。

MPEG(Motion Picture Expert Group)音頻壓縮標準提供了一種高保真度，高壓縮比的壓縮算法。在ISO11172－3標準中，描述了具有不同復雜度和性能的子帶音頻編碼方案，以適應各種高音質(zhì)數(shù)字音頻的應用。根據(jù)編碼計算復雜度及編碼效率的不同，分為層I，層II和層III三種標準。

MPEG音頻標準最初來源于被分為四種類型的算法草案，它們是音頻頻域感覺熵編碼ASPEC(Audio Spectral Perceptual Entropy Coding)，掩蔽模式通用子帶集成編碼與多路復用MUSICAM(Masking－pattern Universal Sub－band Integrated Coding and Multiplexing)，子帶ADPCM SB/ADPCM(Sub－Band Adaptive Difference PCM)。經(jīng)過一系列的客觀和主觀音質(zhì)測試，考慮到不同比特率下的音質(zhì)，對傳輸比特錯誤的敏感性，編碼/解碼復雜度，以及編解碼延時等因素，在大約100kbit/s低碼率下，ASPEC和MUSICAM表現(xiàn)出最好的音質(zhì)效果。在低碼率(64kbit/s)時，ASPEC表現(xiàn)出更為出色的音質(zhì)，而MUSICAM則在編碼解碼的復雜度和延時上略勝一籌。根據(jù)ASPEC的若干算法，對 MUSICAM進行改進，加大了計算復雜度，但獲得了更好的壓縮比及音質(zhì)，這就是ISO11172－3音頻層III的標準。

層I是最簡單的一種算法。如Philips公司的數(shù)字盒式錄音機DCC(DIGItal Compact Cassette)便是利用層I的壓縮算法，其應用的比特率為192kbit/s每通道。

層II具有中等的編碼復雜度，適用比特率大約為128kbit/s每通道。廣泛應用于數(shù)字音頻廣播DAB(Digital Audio Broadcasting)的音頻編碼及視頻CD中。

層III是最復雜的編碼算法，但是在相同的比特率下，它所提供的音質(zhì)也是最好的。典型的比特率為64kbit/s，最適合于ISDN上的音頻傳輸。

1998年4月22日，APT(Audio Processing Technique)公司利用Apt－X100系統(tǒng)，通過ISDN線路，成功地轉(zhuǎn)播了北京—東京—上海的“國際地球日”大型廣播音樂會。但是，這次轉(zhuǎn)播占用了3條(即6個B)的ISDN線路，以保證22kHz頻響的立體聲傳送，這是由于Apt－X100系統(tǒng)采用的是SB/ADPCM音頻壓縮方法[2]。然而，如果使用MPEG層III音頻壓縮方法，只需要一條ISDN線路，就可以實現(xiàn)22kHz頻響的立體聲傳送。由于MPEG層III音頻壓縮編碼復雜度太高，運算量太大，難以用一般的DSP(Digital Signal Processor)單片實現(xiàn)，所以在目前的音響設備中很少使用這一算法。為了能用較低的成本實現(xiàn)MPEG層III這一高效音頻壓縮算法，我們對這一算法進行了全面分析，提出了適用于DSP實現(xiàn)的編碼加速方案。

2 MPEG音頻層III壓縮編碼流程及特點

MPEG音頻層III壓縮編碼流程如圖1所示，相對于層Ⅰ和層Ⅱ而言，其特點在于：

用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法
圖1 MPEG音頻層Ⅲ編碼流程圖(單聲道模型)

(1)利用獨立于信號頻率及聲壓級的耳蝸擴散函數(shù)(Cochlea spreading function)—Modified Rounded類擴散函數(shù)，計算人耳聽覺的掩蔽門限。

(2)增加了MDCT模塊，以提高頻率分辨率。

(3)通過控制環(huán)，對非均勻量化率進行迭代分配，以保持相對恒定的信噪比。并且，采用不定長熵編碼—Huffman編碼，對量化后的各子帶信號可以獲得更好的數(shù)據(jù)壓縮比。

將層III編碼算法流程分成：(1)時頻映射，(2)心理聲學模型，(3)量化編碼等三大功能塊。時頻映射中，是多相混合濾波器組(Polyphase/MDCT Hybrid Filter Bank)的計算，這是較規(guī)范的計算，其運算量是可計算的。而且有各種快速算法，以降低運算復雜度。心理聲學模型的計算，主要運算量集中在1024點和256點的FFT。不過，這是比較標準的計算過程，無論用哪種FFT都可以精確估計其運算復雜度。而量化編碼是通過迭代循環(huán)來完成，其循環(huán)控制變量是不確定的，再加上Huffman碼表的查找表過程，使其運算量和復雜度難以預測和估計。因此，我們認為：量化編碼部分的規(guī)范化是優(yōu)化MPEG音頻層III編碼的突破點。

層III編碼器迭代循環(huán)與量化編碼部分完成的功能是：將子帶濾波和MDCT變換后的樣值進行量化并根據(jù)心理聲學模型的計算結(jié)果進行量化噪聲的控制，使得在一定比特率要求的情況下完成頻域信號的Huffman編碼。層III量化編碼部分的迭代循環(huán)分為內(nèi)循環(huán)和外循環(huán)，參考文獻[1]中FigureC.9.a，C.9.b，C.9.c給出了量化編碼的迭代循環(huán)流圖。

3 用DSP實現(xiàn)音頻層III壓縮的主要問題及解決方案

DSP編程并不提供像C語言一樣的靈活指針、數(shù)組尋址操作。在用DSP實現(xiàn)音頻層III壓縮中的迭代循環(huán)量化編碼時，由于涉及到非規(guī)則性的大量數(shù)組尋址操作，而消耗大量指令，降低了DSP的利用率，抑制了編碼的實時實現(xiàn)。因此，不規(guī)則的類似表查詢指令，需要經(jīng)過很好的組織才能夠使程序結(jié)構(gòu)清楚，簡潔，高效。

3.1 Huffman編碼的多重地址索引

層III編碼中的Huffman編碼是一個窮舉、查表的過程。在參考文獻[1]表B.7中列出了用于層III編碼的32個Huffman碼表。它們的最大值域范圍，碼表適用的信號統(tǒng)計特性都不相同。在編碼過程中，首先找到能夠?qū)⑺幋a區(qū)域樣值的最大值，并依次查詢各個Huffman碼表，直到該碼表能夠?qū)@一最大值進行編碼為止，然后計算用該表進行編碼所需的比特數(shù)。再嘗試相同編碼值域范圍的另一些碼表，找到最小比特數(shù)需求的碼表進行最后的編碼。

由于標準中所提供的32個表中，并非所有的表都能用，而且有大量的碼表只是linbits不同。因此如何存儲這些碼表，并能夠很方便地進行查詢、編碼，是編碼過程中很關(guān)鍵的問題之一。但提出的“多級索引”方法可以很好地的解決這一問題。過程如圖2所示。對可能的表有不同的處理方式：

用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法
圖2 Huffman編碼的多重地址索引

*正常表　如表15，即每一級索引都是對應于表15的各項信息。
*無效表　如表14，其最終的指向是碼表零，即相當于無效表。
*雷同表　如表16和17實際上只是在第II級索引的linbits不同，其最后的Huffman數(shù)據(jù)是相同的。通過這樣的多級碼表地址索引可以很好的解決程序的模塊化實現(xiàn)。

3.2 層III編碼迭代循環(huán)的加速

在迭代循環(huán)編碼部分，對于使用標準中所建議的初始量化常數(shù)進行量化和編碼時，初始比特數(shù)要求要遠遠大于所允許的上限值。這時，如果只是將步長加一進行再次量化編碼，將會使得系統(tǒng)效率大大地降低。

經(jīng)過實際的實驗結(jié)果，一般初始可獲得比特數(shù)大約為700bits/Granule，而初始的量化編碼結(jié)果一般在5000bits以上。如果再次量化步長加上20，可以迅速地逼近所要求的比特數(shù)。表1列出了一種我們使用的可能加速逼近方法。

表1 一種可能的迭代循環(huán)加速方法
用DSP實現(xiàn)MPEG音頻層III壓縮的加速方法

在AD(Analog Device)公司的定點DSP芯片ADSP2181上實際的運算結(jié)果表明，這種加速方法能夠?qū)⒃惴ǖ闹噶钸\算周期減少2/3左右。

4 結(jié)束語

MPEG音頻層III壓縮標準是一種高效、高保真的壓縮編碼算法，但由于其復雜度和運算量較高，很難用一般的DSP實時實現(xiàn)。在對該算法進行全面分析的基礎上，提出了在用DSP實現(xiàn)時，降低復雜度、提高DSP運算效率的關(guān)鍵是優(yōu)化循環(huán)迭代量化編碼。提出“Huffman編碼的多重地址索引”，對非規(guī)則性的大量數(shù)組尋址操作提供了簡明清晰的線條，節(jié)省了尋址指令，提高了DSP的利用率。進一步還提出了“迭代循環(huán)的加速”方案，通過ADSP2181定點芯片的運算，表明該方案能減少2/3的指令周期。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容