文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2015)04-0159-04
0 引言
近年來,,隨著多媒體技術(shù)的快速發(fā)展,,人們對圖像壓縮的要求越來越高,某些情況下,,JPEG標(biāo)準(zhǔn)和JPEG2000標(biāo)準(zhǔn)已經(jīng)無法滿足要求,,為此,必須采用一種新的壓縮技術(shù)對圖像進(jìn)行有效壓縮,。感興趣區(qū)域(Region of Interest,,ROI)編碼技術(shù)利用了人眼的視覺特性,已成為目前圖像壓縮研究的熱點,。所謂ROI編碼,,就是將圖像中比較關(guān)注區(qū)域(亦稱ROI)的位平面設(shè)置得比其余區(qū)域(亦稱BG)的位平面高,就可優(yōu)先傳輸ROI系數(shù),,相對提高圖像質(zhì)量,。
對于ROI編碼,一些學(xué)者根據(jù)JPEG2000標(biāo)準(zhǔn)提供的一般位移(General Shift,,GShift)法和最大位移(Maximum Shift,,MaxShift)法,提出了一些改進(jìn)方法,。Wang Zhou[1]等提出了逐個位平面位移(BbBShift)法,,該方法先上移重要的ROI位平面,,然后逐個交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移,。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,,該方法將ROI位平面分為兩部分,上移其中重要的ROI位平面,。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,,該方法上移重要的ROI位平面,同時下移非重要的BG位平面,,其余的位平面保持不變,。這些改進(jìn)方法的實質(zhì)都是先傳輸ROI系數(shù),然后傳輸BG系數(shù)和剩余的ROI系數(shù),。
本文通過研究前人的方法,,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,,并將此方法嵌入到多級樹集合分裂(Set Partitioning in Hierarchical Trees,,SPIHT)算法中。該方法可使圖像觀察者先對圖像情況大致了解,,然后決定是否需要,。這種改進(jìn)的方法可用于帶寬受限的網(wǎng)絡(luò)中。
1 多級樹集合分裂(SPIHT)算法
SPIHT算法是在嵌入式零樹小波(EZW)算法[4]的基礎(chǔ)上提出的一種新算法[5],。該算法采用空間方向樹,、全體子孫集合和非直系子孫集合的概念,提高了編碼效率[6],。SPIHT算法還能生成一個嵌入碼流,,接收的碼流在任意點被截斷時都可重構(gòu)圖像。
SPIHT算法的編碼過程由正向小波變換,、量化編碼等組成,。在SPIHT算法的基礎(chǔ)上嵌入ROI部分:確定ROI、生成ROI模板,、下移BG位平面,、ROI形狀和位置信息編碼,從而形成基于GShift法的ROI編碼過程,,如圖1所示,。解碼是編碼的逆過程。
圖1 基于GShift法的ROI編碼過程
2 ROI編碼
2.1 ROI掩模
定義ROI掩模來標(biāo)定小波系數(shù)中屬于ROI的點,。若將ROI定義為矩形,,此時只需確定矩形的左上角坐標(biāo)(x1,y1)和右下角坐標(biāo)(x2,,y2),。ROI掩模M(i,,j)可由式(1)表示[7],其生成過程[7]如圖2所示,。
2.2 ROI編碼方法
GShift法和MaxShift法是兩種最基本,、最常用的ROI編碼方法[8],如圖3所示,。在GShift法中,,選擇一個位移因子S把BG位平面都下降S位,這樣,,ROI的最重要位平面就高于BG的所有位平面,,ROI就可以優(yōu)先編碼。解碼時,,ROI就能獲得較好的恢復(fù),。S越大,ROI相對BG的優(yōu)先級越高,,質(zhì)量也就越高,。當(dāng)GShift法中的位移因子S增大到使得ROI位平面與BG位平面無重疊時,,此時GShift法就變成了MaxShift法,。
圖3 兩種ROI編碼方法[8]
3 改進(jìn)方法
3.1 部分背景位平面位移(PBBShift)法
某些情況下,觀察者想在圖像剛開始解碼時了解一下圖像的大概情況,,這就需要一部分BG位平面置于與ROI位平面同等高的位平面上,。根據(jù)GShift法,本文提出了PBBShift法,,如圖4所示,,其中S1為BG的重要位平面,S2為BG剩余位平面的下移位數(shù),。PBBShift法將BG位平面分為兩部分:重要位平面和剩余位平面,。編碼時,BG的重要位平面不位移,,剩余位平面向下位移,。解碼時只需將BG的剩余位平面上移即可。由于該方法只需下移部分BG位平面,,故稱此方法為PBBShift法,。
圖4 PBBShift法
3.2 編碼流程圖
相比GShift法的ROI編碼過程,PBBShift法的ROI編碼部分相對復(fù)雜些,,它要將BG位平面分為兩部分分別進(jìn)行位移,,具體的編碼過程如圖5所示。解碼是編碼的逆過程,。
4 實驗分析與結(jié)論
圖5 PBBShift法編碼過程
圖6 Lena原圖
實驗選取Lena圖像(512×512,,8 bit),,如圖6所示,ROI定義在臉部,,為矩形,。實驗采用MATLAB編程,將ROI部分嵌入到SPIHT算法中,,先進(jìn)行6級9/7小波變換,,然后用PBCBShift法對位平面進(jìn)行位移,其中S1=2,,S2=2,,最后得到編碼數(shù)據(jù)流。圖像的客觀評價用峰值信噪比(PSNR)表示,,單位為分貝(dB),,PSNR越大,質(zhì)量越好,。圖7為PBBShift法下各區(qū)域的PSNR對比,。圖8為PBBShift法得到的主觀視覺效果圖。實驗還將PBBShift法與No-Shift法,、GShift法作比較,,圖9為3種方法得到的PSNR實驗結(jié)果,其中,,(a)為ROI的PSNR對比,,(b)為BG的PSNR對比,(c)為全圖的PSNR對比,。由于選取的ROI的面積占整幅圖像的比重小,,所以全圖的PSNR接近于BG的PSNR。
圖7 PBBShift法各區(qū)域PSNR對比
從圖7可知,,低碼率下,,ROI和BG的PSNR都比較小,相差不大,;隨著碼率的增大,,ROI的PSNR先快速增大,然后平穩(wěn)增大,,而BG的PSNR先緩慢增大,,然后平穩(wěn)增大。從圖8看出,,低碼率下,,ROI和BG都比較模糊,但能看出輪廓;隨著碼率的增大,,ROI比BG獲得更好的視覺效果,,當(dāng)碼率增大到一定時,ROI和BG都很清楚,。
圖8 PBBShift法得到的主觀視覺效果圖
圖9 3種算法得到的PSNR對比
從圖9(a)看出,,對于ROI,低碼率下,,PBBShift法和No-Shift法得到的PSNR相差不大,;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都低于GShift法的PSNR,。從圖9(b)看出,,對于BG,低碼率下,,PBBShift法和No-Shift法得到的PSNR相差不大,;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都高于GShift法的PSNR,。
從上面幾組實驗,,得出以下結(jié)論:
(1)本文提出的方法先解碼ROI系數(shù)和重要的BG系數(shù),后解碼剩余的BG系數(shù),。運用該方法可先了解圖像的大致內(nèi)容,,繼續(xù)解碼時,ROI將比BG獲得更好的視覺效果,。
(2)本文提出的方法介于GShift法和No-Shift法之間,。要使BG在低碼率下能較清楚地顯示,,只需增大S1的值,,此時本文方法就接近No-Shift法。要使ROI與BG有更大的視覺對比度,,只需增大S2的值,,此時本文方法就接近GShift法。
5 總結(jié)
ROI編碼技術(shù)是靜態(tài)圖像壓縮標(biāo)準(zhǔn)支持的一種新技術(shù),,該技術(shù)為圖像的高性能壓縮提供了很好的解決方案,。本文在分析GShift法的基礎(chǔ)上,提出了一種改進(jìn)的ROI編碼方法,,即PBBShift法,。本文的創(chuàng)新點在于,該方法可以使觀察者先了解圖像的大致情況,,如果是需要的圖像就繼續(xù)傳輸,,ROI將比BG獲得更好的視覺效果,如果不是需要的圖像就停止傳輸,節(jié)省等待時間,。實驗證明,,該方法是有效的。這種改進(jìn)的ROI編碼技術(shù)將在未來圖像壓縮領(lǐng)域發(fā)揮重大的作用,。
參考文獻(xiàn)
[1] Wang Zhou,,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,,9(5):160-162.
[2] Liu Lijie,,F(xiàn)an Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,,10(2):35-38.
[3] 梁燕.基于小波變換的序列圖像感興趣區(qū)域編碼[D].天津:天津大學(xué),,2005.
[4] 牛德智,陳長興,,王曙釗,,等.一種基于EZW改進(jìn)算法的圖像壓縮方法研究[J].電子技術(shù)應(yīng)用,2010,,36(12):128-131.
[5] JAIN V,,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),,2012:1-6.
[6] 陳秀梅,,王偉,湯敏.基于Curvelet變換和SPIHT算法的醫(yī)學(xué)圖像感興趣區(qū)域壓縮[J].中國醫(yī)學(xué)影像學(xué)雜志,,2014,,22(10):786-792.
[7] 小野定康,鈴木純司.JPEG2000技術(shù)[M].北京:科學(xué)出版社,,2004.
[8] 袁建亮,,朱遠(yuǎn)平.基于JPEG2000的感興趣區(qū)域壓縮編碼算法[J].天津師范大學(xué)學(xué)報(自然科學(xué)版),2014,,34(1):42-46.