《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于自適應(yīng)分組與壓縮感知的分布式視頻編碼方法
基于自適應(yīng)分組與壓縮感知的分布式視頻編碼方法
來源:微型機(jī)與應(yīng)用2012年第15期
黃 濤,熊繼平,,宣利峰,,趙 健
(浙江師范大學(xué) 數(shù)理與信息工程學(xué)院,浙江 金華 321004)
摘要: 針對(duì)快速場景變換環(huán)境中基于壓縮感知的分布式視頻編碼所存在的問題,,提出了一種基于自適應(yīng)動(dòng)態(tài)分組與壓縮感知的分布式視頻編碼方法,。對(duì)采集的視頻幀在基本分組的基礎(chǔ)上插入一個(gè)自適應(yīng)分組分離器,通過設(shè)定門限閾值實(shí)現(xiàn)能夠根據(jù)視頻場景變換的動(dòng)態(tài)調(diào)整分組,。實(shí)驗(yàn)表明,,與基本分組方法重構(gòu)效果相比,采用自適應(yīng)動(dòng)態(tài)分組方法的重構(gòu)效果有了較大改進(jìn),,其峰值信噪比也有大大改善和提高,,有效地解決了視頻幀中場景變化較快造成的關(guān)鍵信息邊緣紋理損失的問題。
Abstract:
Key words :

摘  要: 針對(duì)快速場景變換環(huán)境中基于壓縮感知分布式視頻編碼所存在的問題,,提出了一種基于自適應(yīng)動(dòng)態(tài)分組與壓縮感知的分布式視頻編碼方法,。對(duì)采集的視頻幀在基本分組的基礎(chǔ)上插入一個(gè)自適應(yīng)分組分離器,通過設(shè)定門限閾值實(shí)現(xiàn)能夠根據(jù)視頻場景變換的動(dòng)態(tài)調(diào)整分組,。實(shí)驗(yàn)表明,,與基本分組方法重構(gòu)效果相比,,采用自適應(yīng)動(dòng)態(tài)分組方法的重構(gòu)效果有了較大改進(jìn),其峰值信噪比也有大大改善和提高,,有效地解決了視頻幀中場景變化較快造成的關(guān)鍵信息邊緣紋理損失的問題,。
關(guān)鍵詞: 多媒體傳感器網(wǎng)絡(luò);分布式視頻編碼,;壓縮感知,;圖像組

 分布式視頻編碼[1-2]DVC(Distributed Video Coding)是多媒體視頻傳感器網(wǎng)絡(luò)[3-4]MVSN(Multimedia Video Sensor Networks)中視頻信號(hào)處理常用的一種技術(shù)。由于受到帶寬和能耗等條件的限制,,為了使編碼端(多媒體視頻傳感器節(jié)點(diǎn))對(duì)視頻信息的編碼復(fù)雜度降低,,傳統(tǒng)的基于奈奎斯特采樣定理的視頻編碼標(biāo)準(zhǔn)并不適用于多媒體傳感器網(wǎng)絡(luò)的低成本、低能耗的要求,。近年來信號(hào)與信息領(lǐng)域的研究熱點(diǎn)壓縮感知[5-6]CS(Compressive Sensing)技術(shù)的出現(xiàn),,由于其以全新的采樣技術(shù)進(jìn)行采樣,實(shí)現(xiàn)了采樣和壓縮同時(shí)進(jìn)行,,大大減少了采樣率,,從而降低了編碼端的運(yùn)算復(fù)雜度。Guillemot C[7]等人提出一種分布式視頻編碼方法來解決視頻信號(hào)的編碼問題,,利用分布式視頻編碼大大降低了編碼端的運(yùn)算復(fù)雜度,,實(shí)現(xiàn)了編碼端的簡單、低功率的要求,。但這種方法還是采用的傳統(tǒng)的奈奎斯特采樣,,其采集的海量數(shù)據(jù)使得性能并不高,如果應(yīng)用到MVSN中將使得編碼復(fù)雜度極高,,實(shí)用性差,。周燕[8]等人提出把壓縮感知CS應(yīng)用到MVSN的視頻信息處理中,減少視頻信號(hào)稀疏分解過程的計(jì)算量和存儲(chǔ)量,,但遺憾的是未采用DVC技術(shù),,所以重構(gòu)幀的峰值信噪比(PSNR)不高,效果不佳,。Pereira F[9]等人提出一種基于CS的分布式視頻編碼框架,,這種方法具有兩大優(yōu)點(diǎn):(1)在信號(hào)的稀疏處理上,利用每一幀對(duì)首幀的差值,,得到稀疏視頻信號(hào),,再利用CS低壓縮采用率進(jìn)行采樣處理,最后恢復(fù)的視頻信號(hào)效果得到改善,;(2)使CS幀在低采樣率的情況下也可以良好地恢復(fù)重構(gòu),。然而其缺點(diǎn)也十分明顯,一旦視頻信號(hào)中場景變化較快,,其重構(gòu)視頻幀的效果將大打折扣,。汪瀅[10]提出了一種基于基本圖像組GOP(Group of Picture)和壓縮感知的分布式視頻編碼,,即把所有采集幀進(jìn)行GOP分組,然后再對(duì)每一個(gè)GOP組分別進(jìn)行處理,,從而在一定程度上改善了重構(gòu)效果,,具有一定的場景變換適用性,然而不足之處是分組顯得單調(diào)固定,,不具備靈活變換性,。針對(duì)以上問題,本文在研究總結(jié)前人所做工作的基礎(chǔ)上,,提出并實(shí)現(xiàn)了一種新穎的自適應(yīng)動(dòng)態(tài)圖像組分組的CS分布式視頻編碼方法,,這種方法首先繼承了基本分組法的優(yōu)點(diǎn),同時(shí)避免了基本分組法造成的組數(shù)固定,、不靈活的缺點(diǎn),,通過設(shè)定門限閾值T來實(shí)現(xiàn)自適應(yīng)動(dòng)態(tài)調(diào)整圖像組分組的目的。實(shí)驗(yàn)仿真表明:(1)重構(gòu)后的峰值信噪比(PSNR)得到大大改善和提高,,重構(gòu)效果非常良好,;(2)具有場景變化的適用性。
1 基于自適應(yīng)動(dòng)態(tài)圖像分組的CS分布式視頻處理機(jī)制
 本文首先介紹Pereira F[9]等人提出的基于差值處理的CS分布式視頻編碼方法(差值法),,以及汪瀅[10]的基本圖像組和壓縮感知的分布式視頻編碼方法(基本分組法),,最后提出一種自適應(yīng)分組的CS分布式視頻編碼方法(動(dòng)態(tài)分組法),并與上面兩種方法對(duì)比證明所提出的動(dòng)態(tài)分組法的優(yōu)勢,。
1.1 差值法與基本分組法
 圖1所示為基于差值法處理的CS分布式視頻編碼框架,,在這種框架下,首先對(duì)第1幀x1標(biāo)定為關(guān)鍵幀(KEY幀),,即基本層,。第2幀到最后一幀(x1,…,,xj)標(biāo)定為WZ幀,然后再對(duì)采集的視頻幀從第2幀開始,,每幀都對(duì)第1幀進(jìn)行作差值處理,,其產(chǎn)生的差值(Δx1,…,,Δxj)也叫做增強(qiáng)層,,同時(shí)采用CS技術(shù)對(duì)數(shù)據(jù)進(jìn)行壓縮編碼處理,在恢復(fù)端對(duì)首幀基本層采用傳統(tǒng)的CS重構(gòu)技術(shù),,對(duì)增強(qiáng)層采用聯(lián)合稀疏解碼(JSM-1)模型[11]進(jìn)行重構(gòu),。最后再進(jìn)行簡單疊加運(yùn)算即可得到重構(gòu)視頻信號(hào)。

 圖2所示為基本圖像組分組的原理及框架結(jié)構(gòu),,其基本流程是:首先對(duì)原始視頻信號(hào)進(jìn)行固定GOP分組,,然后再對(duì)每一個(gè)GOP組分別進(jìn)行處理,,對(duì)每一GOP組的幀圖像的處理方法采用上面介紹的差值法進(jìn)行處理,最后再對(duì)每一個(gè)GOP分組的幀信息進(jìn)行合并疊加得到總體的重構(gòu)視頻信號(hào),??梢钥闯觯眠@種基本分組方法得到的每一個(gè)GOP,,其所含有的視頻幀數(shù)相對(duì)固定,,即每一分組的視頻幀數(shù)相等,因此還是沒有實(shí)現(xiàn)真正意義上的根據(jù)視頻場景變換的動(dòng)態(tài)調(diào)整GOP分組的目的,。

1.2 動(dòng)態(tài)分組法
 針對(duì)第1.1節(jié)基本分組法所造成的GOP組數(shù)固定,、不靈活的缺點(diǎn),提出了一種自適應(yīng)動(dòng)態(tài)圖像分組法,,簡稱為動(dòng)態(tài)分組法,。圖3所示為所提出的基于自適應(yīng)分組和壓縮感知的分布式視頻編碼框架圖,與基本分組方法相比,,在基本分組的基礎(chǔ)上插入一個(gè)自適應(yīng)分組分離器,,目的是為了真正意義上實(shí)現(xiàn)能夠根據(jù)視頻場景變換的動(dòng)態(tài)調(diào)整GOP分組的目的。



 對(duì)每一幀視頻信號(hào),,首先從橫向看,,使用差值法隨著視頻幀數(shù)增大,PSNR值逐漸下降,,效果比較差,。比較基本分組法和動(dòng)態(tài)分組法,(1)首先從分組上進(jìn)行比較,,由于設(shè)置的GOP=5,,所以基本分組每一個(gè)GOP就比較固定,自始至終都以5個(gè)一組劃分開來,,從而在分組上單調(diào)呆板,,不具有靈活性,而所提出的動(dòng)態(tài)分組法在分組上就顯得動(dòng)態(tài)靈活了很多,;(2)再從重構(gòu)效果(PSNR)上進(jìn)行比較,,雖然少數(shù)幾個(gè)點(diǎn)的PSNR相同外,動(dòng)態(tài)分組法整體效果的PSNR值要明顯高于基本方法的整體效果的PSNR值,,尤其在WZ幀上,,動(dòng)態(tài)分組的主要目的就是改善WZ幀的重構(gòu)效果。
 差值方法模糊化了圖像的重要關(guān)鍵信息,,所以重構(gòu)出來的效果就很差,,foreman序列是人物表情變化(即場景變化)比較大序列,所以差值法和基本分組方法整體重構(gòu)效果不理想,因此證明了所提出的動(dòng)態(tài)分組方法具有良好的場景變化適應(yīng)性,。
 從主觀評(píng)價(jià)上來看,,由于第30幀圖像恰好為WZ幀,比較用上面敘述的三種不同的方法對(duì)第30幀進(jìn)行重構(gòu),,得到的峰值信噪比PSNR值,,如表1所示,可以看出所提出動(dòng)態(tài)分組方法的優(yōu)勢,,其PSNR遠(yuǎn)遠(yuǎn)大于前兩種,。再比較圖像的紋理視覺效果,如圖5所示,。

 

 

 從圖5中可以看出,,(d)幀圖像的圖像紋理均比(b)、(c)好,。首先與(b)比較,,可以發(fā)現(xiàn)(b)圖像中效果特別差,里面的關(guān)鍵人物幾乎不見了,,這樣就失去了圖像的重要信息了,;再與(c)比較,發(fā)現(xiàn)(c)圖像中人物邊緣出現(xiàn)白斑,,由于人物是不斷運(yùn)動(dòng)的,,具有動(dòng)態(tài)特征,而基本分組并不具備這種動(dòng)態(tài)特性,,所以最后重構(gòu)的效果會(huì)比較差,;從(d)中可以看出采用本文所提出的基于自適應(yīng)分組方法所重構(gòu)的視頻幀(d)圖像的效果良好,人物也清晰可見,,邊緣紋理也比較理想,。同樣測試hall序列等也有類似的效果。
 利用本文提出的基于自適應(yīng)分組與壓縮感知的分布式視頻編碼方法,,重構(gòu)后的視頻幀整體效果良好,,峰值信噪比大大改善,能夠適用于視頻場景變化劇烈的場合,。門限閾值的選擇是本文自適應(yīng)算法的關(guān)鍵,,本文中采用的是簡單但行之有效的求列向量均值的方法設(shè)置門限閾值,下一步的研究方向可以針對(duì)具體的應(yīng)用場景在自適應(yīng)算法復(fù)雜性和重構(gòu)效率之間權(quán)衡,,選擇其他智能算法來優(yōu)化閾值,,進(jìn)而達(dá)到更完善的分組目的,。
參考文獻(xiàn)
[1] GIROD B,, AARON A, RANE S. Distributed video coding[J]. Proceedings of the IEEE Special Issue on Advances in Video Coding and Delivery, 2005,, 93(1):71-83.
[2] 王尊亮,,李學(xué)俊.分布式視頻編碼技術(shù)研究進(jìn)展[J].計(jì)算機(jī)工程與設(shè)計(jì), 2010,, 31(3): 31-34.
[3] 魯琴.無線多媒體傳感器網(wǎng)絡(luò)多節(jié)點(diǎn)協(xié)同圖像采集與壓縮技術(shù)研究[D].北京:國防科學(xué)技術(shù)大學(xué),,2009.
[4] http://www.eefocus.com/article/07-12/4155121112071731.html.
[5] GUILLEMOT  C. Distributed monoview and multiview video coding: basics, problems and recent advances[J]. IEEE Signal Processing Magazine,, 2007,, 24(5): 67-76.
[6] DONOHO  D. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006,, 52(4): 1289-1306.
[7] CAND?魪S E,, WAKIN M.  A sensing paradigm that goes against the common knowledge in data acquisition[J]. IEEE Signal Processing Magazine, 2008,, 25(2): 21-30.
[8] 周燕,,王東,鐘勇.壓縮傳感在無線視頻監(jiān)控中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用研究,, 2010,,27(6): 73-75.
[9] PEREIRA F. Selecting the most promising application scenarios[J]. Signal Processing: Image Communication, 2008,, 23(9):339-352.
[10] 汪瀅.壓縮感知在視頻編碼中的應(yīng)用研究[D].北京:北京郵電大學(xué),,2010.
[11] 蔡述庭,王欽若.視頻傳感網(wǎng)中魯棒多視角分布式視頻編碼[J].計(jì)算機(jī)工程,,2009,,35(24):219-221.
[12] http://trace.eas.asu.edu/yuv/

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。