《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 業(yè)界動態(tài) > 面向運動圖像遠程實時傳輸?shù)腍.263壓縮方法的分析與優(yōu)化

面向運動圖像遠程實時傳輸?shù)腍.263壓縮方法的分析與優(yōu)化

2008-10-22
作者:余振建 周 健 戴梅萼

  摘? 要: H.263是面向運動圖像遠程實時傳輸?shù)膲嚎s方法,?;诖罅繉嶋H研究,,分析了H.263的算法流程,從色彩空間轉換函數(shù),、DCT,、IDCT、運動估計" title="運動估計">運動估計和運動補償?shù)榷喾矫嫣岢霾崿F(xiàn)對H.263的優(yōu)化策略,,采用增強PB幀模式提高壓縮比" title="壓縮比">壓縮比,,最后給出了定量測試結果。

????關鍵詞: H.263 CIF DCT IDCT 運動估計與運動補償

?

  運動圖像遠程實時傳輸系統(tǒng)的網(wǎng)絡傳輸部分架構在Internet之上,,而現(xiàn)階段Internet的狀況是帶寬小,、延遲大、不穩(wěn)定,。所以為了獲得良好的實時傳輸效果,,除了改善傳輸控制機制之外,還需要實現(xiàn)高壓縮比,、低耗時,、能達到實時壓縮和解壓縮效果的運動圖像壓縮方法。H.263是國際電信協(xié)會-電信標準化部門ITU-T(The International Telecommunications Union-Telecommunication Standardization Sector)于1995年通過的用于低比特率實時傳輸?shù)囊曨l編解碼協(xié)議,。其設計初衷是滿足帶寬低于64kbps的低帶寬視頻應用需求,,如視頻會議、可視電話等?,F(xiàn)在H.263也被應用于運動圖像遠程實時傳輸系統(tǒng)中,,但原始的H.263在實時性和壓縮比等方面還有不少可優(yōu)化余地。本文針對具體的運動圖像遠程實時傳輸系統(tǒng)應用,,在大量研究工作基礎上提出多個H.263的優(yōu)化策略,,并取得了相當好的效果。

1 H.263壓縮算法的分析概要

  H.263的輸入視頻幀格式為QCIF(Quarter Common Intermediate Format,,大小為176×144)、CIF(Common Intermediate Format,,大小為352×288)等,。將每個視頻幀分成許多宏塊" title="宏塊">宏塊(MB-Micro Block),每個宏塊由4個Y亮度塊,、1個Cb色度塊和1個Cr色度塊組成,。塊(Block)的大小為8×8。H.263以宏塊為單位進行視頻幀的壓縮,。

  H.263使用離散余弦變換DCT(Discrete Cosine Transform)減小空間冗余,,使用運動估計和運動補償(Motion Estimation and Motion Compensation)減小時間冗余。H.263有兩種編碼方式,,一種是Intra方式,,幀內(nèi)編碼,,產(chǎn)生的幀作為關鍵幀-I幀;另一種是Inter方式,幀間編碼,,產(chǎn)生的幀作為非關鍵幀-P幀,。

  通過分析,將H.263壓縮算法的流程圖歸納為如圖1所示,。

?

?

  通過分析和測試表明,,DCT、運動估計和運動補償是H.263最重要的部分,,同時也是H.263實現(xiàn)中最耗時的運算環(huán)節(jié),。要提高H.263的運算速度,就要針對這些環(huán)節(jié)進行優(yōu)化,。

2 轉換函數(shù),、DCT和運動估計環(huán)節(jié)的優(yōu)化

2.1 色彩空間轉換函數(shù)的優(yōu)化

  CIF格式基于YUV色彩空間,而應用程序中,,大多數(shù)視頻采集程序只提供RGB色彩空間的視頻幀,,因此需要建立從RGB色彩空間到YUV色彩空間的轉換函數(shù)。

  RGB到YUV的轉換函數(shù)如下所示,,其中Y為YUV色彩空間的亮度值,,U(Cb)和V(Cr)為YUV色彩空間的色度值。

    

  H.263原有的色彩空間轉換算法采用浮點運算,,但浮點運算會消耗較多的CPU周期,。為了加快視頻處理速度,采用整型乘法和向右移位來代替浮點乘除,,從而有效縮短了轉換時間,。

  優(yōu)化后的轉換函數(shù)如下:

  

2.2 DCT、IDCT算法的優(yōu)化

    

?

  通過分析得出,,DCT快速算法的實現(xiàn)可以有兩種方式,。一種方法是把已有的快速變換算法(如FFT、FHT等)映射到DCT計算中,,這種方式多了一個映射環(huán)節(jié),,增加了計算的復雜度;另一種方法是從DCT變換本身尋找規(guī)律進行改進。

  在H.263應用中,,注意到兩條規(guī)律:一是能量集中在少部分DCT系數(shù)上;二是隨著量化步長的增大,,被量化為零的DCT系數(shù)增多,而且對DCT計算的精度要求降低,。于是,,采用一種零系數(shù)預測策略,即根據(jù)量化步長,,首先對DCT變換的輸入數(shù)據(jù)分類,,對于給定的量化步長,,如果輸入數(shù)據(jù)將要被量化為0,那么這些數(shù)據(jù)就不必做DCT運算,,而直接將變換結果置為0,。這樣只需對部分數(shù)據(jù)進行DCT變換,因此節(jié)省了大量無效運算,。另外,,利用DCT的局部并行性,使用Intel的多媒體處理指令集-MMX來實現(xiàn)DCT計算,,大幅度提高了運算速度,。

2.3 運動估計與運動補償算法的優(yōu)化

  運動估計是指在參考幀中搜索一個與當前幀圖像塊最相似的圖像塊,即最佳匹配塊,,搜索結果用運動向量來表示,。運動補償是指利用參考幀和已求得的運動向量重構當前幀,把重構幀和當前幀的差值作為當前幀的補償值進行壓縮編碼,。兩者互相配合,,共同實現(xiàn)壓縮效果。

  運動估計算法的研究從兩方面著手:快速搜索算法和塊匹配" title="塊匹配">塊匹配準則,。

  最簡單的搜索算法是全搜索法(FS),,這種算法精度高,但計算量過于龐大,。為了加快運算速度,,保證精度,人們提出了很多快速搜索算法:三步法(TSS)及基于三步法的改進算法,、二維對數(shù)法(LOGS),、交叉搜索法(CS)、四步法(4SS),、預測搜索法(PSA),、鉆石搜索法(DS)等。鉆石搜索法是迄今為止綜合性能最優(yōu)的快速搜索算法之一,,用于本次項目研究中,。

  塊匹配準則決定何時找到最佳匹配塊,從而終止搜索進程,。傳統(tǒng)的準則有絕對平均誤差函數(shù)(MAE),、互相關函數(shù)(CCF),、均方誤差函數(shù)(MSE),、最大誤差最小函數(shù)(MME)等。由于傳統(tǒng)方法沒有考慮人眼的視覺特性,,所以判斷結果和人眼的感知相差較大,。實際H.263采用的塊匹配準則為MSE的替代準則SAD(絕對差和),,兩者的公式如下:

  ????

  其中:F0和F-1分別代表當前幀和重構幀(參考幀);k,l為待編碼宏塊在當前幀中的坐標;x,,y為重構幀中參考宏塊的坐標;N表示宏塊的尺寸,,此處為16。從公式中可見,,SAD用絕對值運算代替了MSE的乘方運算,,明顯降低了運算量,從而可以加快計算速度,。

  測試表明,,SAD的計算量要比MSE的計算量減少三分之一,而它們的圖像效果相當,。

  此外,,還可以利用硬件特性加速塊匹配準則的運算速度,Intel的MMX技術提供了這種特性,。SAD等塊匹配準則主要針對短數(shù)據(jù)的重復計算,,MMX增加了系統(tǒng)單個指令操作數(shù)據(jù)的數(shù)目(SIMD),從而可以在一個指令中完成多組數(shù)據(jù)的計算,,實現(xiàn)并行機制,,從而加快運算速度。

3 提高壓縮比的選擇

  H.263提供了許多高級模式來提高視頻壓縮比,。從對壓縮效率的貢獻角度看,,大運動向量模式、高級預測模式,、PB幀模式和增強PB幀模式是最重要的4個高級模式,。

  在大運動向量模式和高級預測模式下,運動向量可以指到圖像邊界以外,,增大了運動向量的表達范圍,,從而在本質(zhì)上提高了運動補償?shù)木纫愿纳凭幋a效率。

  基本PB幀模式下,,一個PB幀是一個P幀和一個B幀組成的整體,。當前P幀由前一個P幀預測得到,B幀則由前一個P幀和當前P幀預測得到(見圖2),。PB幀模式在增加較少比特數(shù)的情況下,,將幀率提高了近一倍。

?

?

  增強PB幀模式的主要改進點在于預測方式的增強,?;綪B幀模式對B幀圖像(或宏塊 )僅允許使用雙向預測,而增強的PB幀模式對B幀圖像則允許使用前向預測(見圖3),、后向預測(見圖4)和雙向預測(見圖2)三種" title="三種">三種手段,。這樣,,在壓縮過程中,有機會選擇更合適的預測方法處理B幀圖像(或宏塊),,從而提高B幀的壓縮效率,。基本PB幀模式的B幀只能通過雙向預測獲得,,這對慢速運動圖像效果較好,。當輸入運動圖像存在快速不規(guī)則運動時,B幀質(zhì)量會急劇惡化,,而增強PB幀模式的B幀有三種預測方式可選,,可以解決這一難題。通過分析和測試表明,,增強PB幀模式比基本PB幀模式有更強的魯棒性,,更適用于運動圖像遠程實時傳輸。

?

?

?

  大運動向量模式和高級預測模式由于增大了運動向量的表示范圍,,可以增強運動補償?shù)木?,從而提高壓縮比;而增強PB幀模式引入B幀,有三種預測方式可以生成B幀,,在相同幀率的情況下,,將壓縮比提高近80%,壓縮效果明顯,。在實際程序設計中,,筆者配合傳輸環(huán)境測試模塊,在網(wǎng)絡帶寬較低時實現(xiàn)這三種方式的配合使用,,發(fā)揮了更大的壓縮效率,,達到更高的壓縮比。

4 實驗數(shù)據(jù)和性能分析

4.1 算法優(yōu)化測試

  分別取100幀三種不同格式(SUB-QCIF:88×72,,QCIF:176×144,,CIF:352×288)的視頻幀,每20幀取1個關鍵幀,,視頻幀質(zhì)量取6000,,比較優(yōu)化前和優(yōu)化后算法的時間效率,結果如(圖5)所示,。

?

?

  縱軸單位為毫秒,,表示壓縮完成所需時間??梢?,要處理的視頻幀越大,優(yōu)化后的算法取得的加速效果越明顯。

4.2 增強PB幀模式壓縮效果測試

  分別取100幀三種不同格式(SUB-QCIF:88×72,,QCIF:176×144,CIF:352×288)的視頻幀,,每20幀取1個關鍵幀,,視頻幀質(zhì)量取6000,比較使用增強PB幀模式前和使用增強PB幀模式后算法的壓縮效率,,結果如(圖6)所示,。

?

?

  縱軸為壓縮比。要處理的視頻幀越大,,冗余信息越多,,增強PB幀模式的壓縮效果越明顯。

?

參考文獻

1 趙 鵬,,戴梅萼,,付 良. 遠程機器人監(jiān)控系統(tǒng)關鍵技術的研究和實現(xiàn). 小型微型計算機系統(tǒng),2000;(12)

2 戴梅萼,,趙鵬,,付良,武志光,,王治.機器人圖像的采集,、壓縮和實時傳輸?shù)难芯?清華大學學報(自然科學版),2001,;41

? (7)

3 ITU-T,,Draft ITU-T Recommendation H.263 Version 3.2000.11

4 Kok C W.Fast Algorithm for Computing Discrete Cosine Transform[J]. IEEE Trans,On Signal Processing,,1997

5 Jordi Ribas-Corbera,,Shawmin Lei.Rate Control in DCT Video Coding for Low-Delay Communications[J]. IEEE

Trans,On Circuits and Systems for Video Tech,,1999

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉載的所有的文章,、圖片、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者,。如涉及作品內(nèi)容、版權和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。