摘 要:降低多媒體算法的復(fù)雜性和存儲(chǔ)器需求對(duì)于存儲(chǔ)器資源和運(yùn)算能力都很有限的嵌入式設(shè)備" title="嵌入式設(shè)備">嵌入式設(shè)備是十分重要的。在極低" title="極低">極低碼率應(yīng)用時(shí),,JPEG存在嚴(yán)重的方塊效應(yīng),,JPEG2000具有極高的運(yùn)算復(fù)雜性和存儲(chǔ)器需求,。分析了H.264 INTRA幀編碼的運(yùn)算復(fù)雜性和存儲(chǔ)器需求,,并提出了一種減小運(yùn)算復(fù)雜性的有效方法,。結(jié)果顯示,H.264 INTRA幀編碼具有極低的運(yùn)算量和存儲(chǔ)器需求,,非常適合嵌入式設(shè)備的靜止圖像編碼" title="圖像編碼">圖像編碼,。
關(guān)鍵詞: 靜止圖像編碼 H.264 JPEG2000 零塊檢測(cè)
嵌入式多媒體設(shè)備的靜止圖像編碼有著廣泛的應(yīng)用,如照片的拍攝與傳輸,。設(shè)備處理的圖像越來越大,存儲(chǔ)容量和傳輸能力都相當(dāng)有限,因而靜止圖像編解碼要求具有較低的運(yùn)算復(fù)雜性,、較少的存儲(chǔ)器需求和極好的壓縮性能,。目前已經(jīng)制定的靜止圖像壓縮標(biāo)準(zhǔn)主要有JPEG和JPEG2000。JPEG標(biāo)準(zhǔn)在中高速率上壓縮效果較好, 對(duì)于細(xì)節(jié)分量多的灰度圖像, 當(dāng)編碼壓縮率低于每像素0.25比特時(shí),視覺失真大,重構(gòu)圖像存在嚴(yán)重的方塊效應(yīng),不能很好地適應(yīng)網(wǎng)絡(luò)傳輸圖像的需要,。JPEG2000為了降低運(yùn)算中的存儲(chǔ)器需求,,使用分塊技術(shù),對(duì)每個(gè)小塊進(jìn)行處理,但采用較小的塊在低碼率時(shí)存在與JPEG一樣的方塊效應(yīng),。因而JPEG2000 在低比特率應(yīng)用時(shí), 建議不分塊或者分成較大的塊,,以保證良好的率失真性能, 但運(yùn)算復(fù)雜性和存儲(chǔ)器需求都極高。
視頻編碼新標(biāo)準(zhǔn)H.264代表著繼MPEG1/2和MPEG4后的第三代視頻編碼標(biāo)準(zhǔn),。H.264比以前的標(biāo)準(zhǔn)提供了更高的編碼增益,。H.264的INTRA幀編碼算法充分利用圖像中的空間相關(guān)和變換域的相關(guān)性,提供了極高的編碼增益,,可以用來對(duì)靜止圖像進(jìn)行編碼,。在文獻(xiàn)[1]中H.264采用JM73代碼,JPEG2000 采用Jasper 1.700.5,對(duì)標(biāo)準(zhǔn)靜止測(cè)試圖像和視頻序列進(jìn)行測(cè)試,。測(cè)試結(jié)果表明:與JPEG2000相比,,H.264 INTRA幀具有更高的客觀質(zhì)量和主觀質(zhì)量,但譯碼器的運(yùn)算復(fù)雜性卻比JPEG2000低50%左右,。在嵌入式設(shè)備上,,多媒體應(yīng)用的實(shí)時(shí)性不僅取決于算法的運(yùn)算次數(shù),還取決于可得到的存儲(chǔ)器帶寬,。CPU的工作頻率越來越高,,存儲(chǔ)器的頻率卻增加緩慢,很多算法的瓶頸在于數(shù)據(jù)輸入輸出,。有效減小算法的存儲(chǔ)器需求,,減少中間結(jié)果的存儲(chǔ)需求,可縮減片外存儲(chǔ)器訪問次數(shù),,提高應(yīng)用的實(shí)時(shí)性能,。下面主要討論降低H.264 INTRA幀編碼的運(yùn)算復(fù)雜性和存儲(chǔ)器需求的方法。
1 減少運(yùn)算復(fù)雜性
H.264 INTRA幀具有比JPEG2000更高的客觀質(zhì)量,,這主要是由于INTRA幀采用的多種幀內(nèi)預(yù)測(cè)模式較好地去掉了空間冗余,。對(duì)于平滑的背景區(qū)域采用16×16大小的粗糙預(yù)測(cè),共有4種可能的預(yù)測(cè)方向,。對(duì)于快速變化的圖像區(qū)域,,采用4×4的塊,共有9種預(yù)測(cè)模式,。在預(yù)測(cè)后,,對(duì)殘差信號(hào)進(jìn)行整型" title="整型">整型變換消除頻譜相關(guān)性,。高效的去方塊效應(yīng)濾波器改善了圖像的信噪比和主觀質(zhì)量。圖1是H.264編碼器的結(jié)構(gòu)流程圖,。從圖1可以看出,,在整幀圖像的熵編碼后,對(duì)逆整型變換后的重建數(shù)據(jù)進(jìn)行去方塊效應(yīng),,去方塊效應(yīng)后的重建圖像數(shù)據(jù)用作下一幀預(yù)測(cè)圖像的編碼,,或者用于編碼同時(shí)顯示重建圖像。編碼器的作用主要是壓縮原始數(shù)據(jù)產(chǎn)生輸出碼流,,若不需要在本地編碼器中顯示重建圖像(例如衛(wèi)星照片的拍攝),,則編碼器中的整幀圖像的去方塊效應(yīng)可以省去,節(jié)省大約30%的運(yùn)算,。宏塊" title="宏塊">宏塊的幀內(nèi)預(yù)測(cè)包含9種4×4模式和4種16×16模式如圖2,。INTRA 16×16 預(yù)測(cè)僅僅采用左邊16個(gè)像素和上邊16個(gè)像素作參考;INTRA 4×4 預(yù)測(cè)僅僅采用左邊4個(gè)像素和上邊9個(gè)像素作參考,,因而在逆整型變換和重建(逆變換結(jié)果與預(yù)測(cè)值相加)時(shí),,僅僅需要計(jì)算16×16宏塊的第16行與第16列像素、4×4塊的第4行與第4列像素,,沒有必要計(jì)算所有的像素,。對(duì)于16×16的塊,減少224個(gè)重建像素的計(jì)算,。對(duì)于4×4的塊,,減少8個(gè)重建像素的計(jì)算。整型變換,、量化,、逆量化、掃描以及逆變換消耗比較多的編碼時(shí)間,,可利用在模式選擇時(shí)計(jì)算的絕對(duì)差值和(SAD),,提前判斷整型變換后量化系數(shù)全0塊,從而省去全0塊的整型變換,、量化,、逆量化、掃描以及逆變換這一系列操作,。若SAD小于某個(gè)門限T,,各個(gè)變換系數(shù)絕對(duì)值小于量化步長(Qstep),該塊為0塊,。實(shí)驗(yàn)中取T等于3Qstep,獲得了較高的檢測(cè)率和較低的檢測(cè)差錯(cuò)率,。H.264 采用整型變換,為簡(jiǎn)化門限的推導(dǎo),,其中的整型變換與4×4的離散余弦變換(DCT)相差較小,,DCT變換為:
系數(shù)量化為0,。由于該式是量化系數(shù)全為零的充分條件,而不是必要條件,。實(shí)驗(yàn)結(jié)果顯示,,使用該門限檢測(cè)出零塊的正確性為100%,,大量的量化系數(shù)為全零塊卻檢測(cè)不出來,。為了大幅提高零塊檢出率,增大該門限T為3Qstep,,測(cè)量miss.qcf 20幀編碼的平均情況,,測(cè)試結(jié)果見表1。從表1可以看出,,零塊檢測(cè)率隨著量化索引增大而增大,,可能將部分非零塊檢測(cè)成零塊,但這對(duì)信噪比影響不大,。
?
2 縮減存儲(chǔ)器需求
減少運(yùn)算中的存儲(chǔ)器需求對(duì)于嵌入式設(shè)備十分重要,。宏塊編碼的過程包含預(yù)測(cè)、模式選擇,、變換量化掃描,、逆量化等。從圖2可以看出,,在INTRA16×16的4種預(yù)測(cè)模式中,,只使用上邊和左邊的各16個(gè)像素作為預(yù)測(cè)參考,在INTRA 4×4 的9種預(yù)測(cè)模式中,,僅使用左邊4個(gè)像素和上邊9個(gè)像素作為預(yù)測(cè)參考,,因而重建圖像并不需要整幀存儲(chǔ),只需存儲(chǔ)這幾個(gè)參考點(diǎn)就可以了,。假設(shè)宏塊編碼按照從左到右,、從上到下順序進(jìn)行,則水平方向的像素需要存儲(chǔ)一整行,。在INTRA 4×4模式編碼時(shí),,由于相鄰的4×4塊模式高度相關(guān),采用相鄰塊的預(yù)測(cè)模式預(yù)測(cè)當(dāng)前塊的最可能模式,,同樣只需要存儲(chǔ)上邊一行4×4和左邊一個(gè)4×4塊的編碼模式(如圖3),。在對(duì)量化后變字長編碼(VLC)系數(shù)的個(gè)數(shù)進(jìn)行編碼時(shí),需要利用相鄰兩塊的非零系數(shù)個(gè)數(shù)對(duì)該塊進(jìn)行預(yù)測(cè),,也只需要存儲(chǔ)上邊一行4×4和左邊一個(gè)4×4塊的編碼模式的非零系數(shù)個(gè)數(shù),,如圖3。在對(duì)整幀圖像的數(shù)據(jù)比特串(SODB)添加原始字節(jié)序列載荷(RBSP)結(jié)尾比特(RBSP trailing bits,,添加一比特的“1”和若干比特“0”,,以便字節(jié)對(duì)齊)后,,再檢查RBSP 中是否存在連續(xù)的三字節(jié)“00000000 00000000 000000xx”;若存在這種連續(xù)的三字節(jié)碼,在第三字節(jié)前插入一字節(jié)的“0×03”,以免與起始碼競(jìng)爭(zhēng),,形成EBSP碼流,,這需要將近兩倍的整幀圖像碼流大小。為了減小存儲(chǔ)器需求,,在每個(gè)宏塊編碼結(jié)束后即檢查該宏塊SODB中的起始碼競(jìng)爭(zhēng)問題,,并保留SODB最后兩字節(jié)的零字節(jié)個(gè)數(shù),以便與下一宏塊的SODB的開始字節(jié)形成連續(xù)的起始碼競(jìng)爭(zhēng)檢測(cè),;對(duì)一幀圖像的最后一個(gè)宏塊,,先添加結(jié)尾停止比特,再檢測(cè)起始碼競(jìng)爭(zhēng),。采用這種方法產(chǎn)生H.264 附錄B中的字節(jié)流時(shí),,存儲(chǔ)器需求從兩幀碼流大小縮小到兩個(gè)宏塊碼流大小。通過對(duì)碼流輸出過程的改進(jìn),,使INTRA幀編碼需要的存儲(chǔ)器大小不隨圖像大小的增加而增加,,這時(shí)編碼過程中的存儲(chǔ)器不超過9K個(gè)整數(shù)。對(duì)于基于片上存儲(chǔ)器的多媒體處理器,,存儲(chǔ)器需求的減少可以大量縮減中間結(jié)果的片外片上轉(zhuǎn)移,,減小數(shù)據(jù)轉(zhuǎn)移的負(fù)擔(dān),提高程序的運(yùn)行速度,。
采用H.264 INTRA幀對(duì)靜止圖像進(jìn)行編碼時(shí),,在編碼器端不需要顯示本地重建圖像,可省掉去方塊效應(yīng)濾波器,;利用模式選擇時(shí)計(jì)算的絕對(duì)差值和,,可提前判斷量化后全零系數(shù)塊,節(jié)省大量的計(jì)算,。分階段地對(duì)各個(gè)宏塊的碼流插入競(jìng)爭(zhēng)阻止字節(jié)(emulation prevention byte),,以保證原始字節(jié)序列載荷中不含起始碼,有效減少存儲(chǔ)器的需求,。運(yùn)算復(fù)雜性和存儲(chǔ)器需求極低的H.264 INTRA編碼模式,,可代替JPEG2000,用于嵌入式設(shè)備的靜止圖像編碼,。
參考文獻(xiàn)
1 Aravind AL, Bindu P. Rao, Sudhir S. Kudva,et al. Quality and complexity comparison of H.264 intra mode with JPEG2000 and JPEG[J].ICIP2004, IEEE international conference on image processing: 525~528
2 Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification (ITU-T Rec.H.264|ISO/IEC 14496-10 AVC) Joint Video Team (JVT),Mar.2003,Doc. JVT -G050
3 H.264/MPEG-4 Part 10: Intra Prediction. www.vcodex.com/h264_intrapred.pdf
4 zhou Xuan ,Yu zhenghua,Yu Songyu. Method for detecting all-zero DCT coefficients ahead of discrete cosine transfor-mation and quantization[J]. Electronics Letters:1839~1840