摘 要: 由于自然圖像摳圖具有高度的不確定性,,目前的摳圖方法中對(duì)于前背景顏色較為復(fù)雜的圖片處理效果并不理想,。本文首先通過(guò)采集大量的樣本對(duì)來(lái)估計(jì)初始的掩膜值,但是通過(guò)采樣得到的樣本對(duì)并不能很好地估計(jì)掩膜值,,為此定義未知像素與前背景樣本點(diǎn)的空間距離和顏色距離函數(shù)來(lái)對(duì)其進(jìn)行優(yōu)化,。通過(guò)最小化該代價(jià)函數(shù)來(lái)求得最優(yōu)的樣本對(duì),使得最終得到的結(jié)果實(shí)現(xiàn)了準(zhǔn)確性和魯棒性的良好均衡,。自然圖像摳圖實(shí)驗(yàn)結(jié)果表明,,與其他幾種摳圖算法相比,本算法在視覺(jué)效果上和均差誤差上都優(yōu)于其他算法,。
關(guān)鍵詞: 自然圖像摳圖;掩膜值,;信度函數(shù)
0 引言
摳圖就是從一張給定的圖片中提取出感興趣的部分,,數(shù)字圖像摳圖可以表示為前景F和背景B的線性組合,即顏色組合公式:
對(duì)于圖像中的每個(gè)像素點(diǎn)(x, y),,式(1)中的I(x, y)代表該點(diǎn)的像素值,,F(xiàn)(x, y)和B(x, y)代表該點(diǎn)的前景色和背景色的像素值,α代表前景色所占的比例,,稱之為透明度或者掩膜值,,α的取值介于[0, 1]之間,當(dāng)α=1時(shí)表明當(dāng)前像素是完全前景像素,,當(dāng)α=0時(shí)表示當(dāng)前像素是完全背景像素,,而摳圖的本質(zhì)就是求出每個(gè)像素點(diǎn)對(duì)應(yīng)的α值。由于式(1)中α,、F和B都是未知的,,所以式(1)的解具有高度不確定性,因此自然圖像摳圖實(shí)際上是一個(gè)不能精確求解的過(guò)程,。
當(dāng)前的摳圖方法根據(jù)研究圖像近鄰像素的相關(guān)性和圖像統(tǒng)計(jì),,可分為基于采樣、基于傳播,、采樣傳播相結(jié)合三種方法,。其中基于采樣的摳圖方法通過(guò)計(jì)算前景和背景的顏色來(lái)估計(jì)掩膜值,早期的方法如Bayesian Matting[1],、Ruzon-Tomasi[2],、Hillman[3]等都是基于采樣的方法,,但是通過(guò)采樣的方法采集到的前景和背景像素的樣本點(diǎn)具有不確定性,使得最終得到的掩膜值不夠精確,;基于傳播的方法不需要通過(guò)采集樣本點(diǎn)來(lái)估計(jì)掩膜值,,它假設(shè)未知像素在一個(gè)小窗口內(nèi)是局部平滑的,再在閉合空間中求解α,。Random Walk Matting[4] ,、Closed Form Solution[5] 、Poisson Matting[6]等都屬于基于傳播的方法,,該方法對(duì)大部分圖片都能取得較好的結(jié)果,,但是對(duì)一些前景和背景顏色較為復(fù)雜的圖像,采樣與傳播相結(jié)合的方法能取得更好的結(jié)果,,如Shared Matting[7],、Robust Matting[8]、Comprehensive Sampling Matting[9]等,。
對(duì)于復(fù)雜的圖像,,要計(jì)算得到精確的掩膜值是比較困難的。本文首先采集大量的與未知像素相鄰的樣本點(diǎn),,然后通過(guò)未知像素與前景和背景樣本點(diǎn)的顏色空間距離來(lái)定義一個(gè)目標(biāo)函數(shù)對(duì)其進(jìn)行優(yōu)化,,從而選出最優(yōu)的樣本對(duì)來(lái)求圖像的掩膜值,最后結(jié)合拉普拉斯矩陣和信度值函數(shù)對(duì)其進(jìn)行優(yōu)化得到最終的掩膜值,。將本文得到的結(jié)果與多種摳圖算法進(jìn)行比較,,結(jié)果表明本文算法能取得更好的掩膜值。
1 Comprehensive Sampling Sets方法介紹
為了求出每個(gè)未知像素的最優(yōu)樣本對(duì),,Comprehensive Sampling Sets方法根據(jù)光學(xué)和圖像空間統(tǒng)計(jì)來(lái)建立一個(gè)目標(biāo)函數(shù):
其中K表示像素點(diǎn)Iz與由式(1)求出的估計(jì)值之間的彩色誤差:
S表示樣本對(duì)(F,,B)和未知像素的空間距離:
其中SzF是像素z的所有前景樣本點(diǎn)的集合,│SzF│表示樣本點(diǎn)的個(gè)數(shù),,SzB與其類似,,F(xiàn)iS表示樣本點(diǎn)Fi的空間坐標(biāo)。
C表示圖像中的顏色統(tǒng)計(jì):
其中d(Fi, Bi)是Fi和Bi的顏色分布:
是樣本 Fi的均值,、方差以及樣本群的大小,。根據(jù)目標(biāo)函數(shù)O,從中選出最優(yōu)的樣本對(duì),,再根據(jù)下式:
計(jì)算出一個(gè)初始的掩膜值α,,然后根據(jù)參考文獻(xiàn)[7]的方法對(duì)初始掩膜值進(jìn)行優(yōu)化。
2 基于顏色采樣摳圖
2.1 區(qū)域劃分
本文的算法需要用戶預(yù)先提供一張?jiān)瓐D像的trimap圖,,也叫三分圖,,它通過(guò)用戶手工操作得到目標(biāo)邊界的前景、背景和未知區(qū)域的精細(xì)劃分,在得到的三分圖中,,白色部分即為已知的前景區(qū)域,,黑色部分為已知的背景區(qū)域,灰色部分則是需要計(jì)算的未知區(qū)域,。
區(qū)域劃分的目的是減少計(jì)算的復(fù)雜度,,因?yàn)閳D像中大部分區(qū)域的掩膜值都是已知的,即前景部分的掩膜值為1,,背景部分的掩膜值為0,,只需要計(jì)算未知區(qū)域每個(gè)像素點(diǎn)的掩膜值。區(qū)域劃分的準(zhǔn)確性對(duì)掩膜值有很大的影響,,因此,,為了使得到的結(jié)果更加精確,本文實(shí)驗(yàn)所需的三分圖都由http://www.alphamatting.com./datasets.php下載得到,。
2.2 初始掩膜值的估計(jì)
由式(1)可知,,對(duì)于一幅彩色圖像,該式中α,、 F和B都是未知的,,所以首先通過(guò)采樣的方法來(lái)采集前景像素樣本點(diǎn)F和背景像素樣本點(diǎn)B。在本文的算法中,,采用參考文獻(xiàn)[8]的方法來(lái)采樣,,即沿著己知前景區(qū)域和己知背景區(qū)域的邊界稀疏地采集樣本點(diǎn),這樣采集得到的樣本集合能夠較好地捕捉到前景色或背景色的變化,,當(dāng)采集到足夠的樣本點(diǎn)之后,再根據(jù)式(7)來(lái)求初始的missing image file,,但是僅僅通過(guò)采樣得到的missing image file還很粗糙,,需要進(jìn)一步優(yōu)化。
為了優(yōu)化初始的掩膜值,,定義一個(gè)顏色空間代價(jià)函數(shù)來(lái)選擇最終的樣本對(duì):
其中,,表示當(dāng)前像素I與由顏色線性組合式(1)得到的估計(jì)值的顏色距離,如果當(dāng)前像素I與顏色組合公式估計(jì)的值十分接近,,那么(Fi, Bj)就可以作為較優(yōu)的樣本對(duì)來(lái)估計(jì)掩膜值,。這個(gè)式子在參考文獻(xiàn)[8]中首次被提出,在文獻(xiàn)參考[9]和[10]中也采用了相同的顏色代價(jià)函數(shù),,但是由于采集到的樣本對(duì)較多,,僅僅通過(guò)式(8)來(lái)選擇最終的樣本對(duì)并不可靠,所以接下來(lái)定義空間代價(jià)函數(shù)
:
與參考文獻(xiàn)[9]的空間代價(jià)函數(shù)類似,,為每個(gè)前景和背景樣本點(diǎn)定義一個(gè)空間距離函數(shù)missing image file和missing image file,,式(9)和(10)中missing image file、missing image file和xI代表前景樣本點(diǎn),、背景樣本點(diǎn)和未知像素的空間坐標(biāo),,missing image file和missing image file表示已知的前景和背景樣本點(diǎn)的集合,。接下來(lái)根據(jù)顏色代價(jià)函數(shù)定義Pα,它表示當(dāng)一個(gè)未知像素與前景樣本點(diǎn)的顏色較近而與背景樣本點(diǎn)的顏色相差較大時(shí),,就認(rèn)為該未知像素很有可能就是一個(gè)完全前景像素,,因此定義下式:
其中:
當(dāng)PF趨近于0時(shí),最小化Pα就相當(dāng)于最小化α,;當(dāng)PF趨近于1時(shí),,最小化Pα就相當(dāng)于最大化α;當(dāng)PF=0.5時(shí),,則Pα是一個(gè)常數(shù)項(xiàng),。式(11)將會(huì)在目標(biāo)函數(shù)中用來(lái)求最優(yōu)的樣本對(duì)。
結(jié)合顏色空間代價(jià)函數(shù)定義一個(gè)選擇最終樣本對(duì)的代價(jià)函數(shù):
最小化式(13)來(lái)求最優(yōu)的樣本對(duì),,并且把求得的最優(yōu)的樣本對(duì)記為:
再利用求得的最優(yōu)樣本對(duì)來(lái)重新估計(jì)未知像素的掩膜值 ,。
2.3 掩膜值的優(yōu)化
在上述算法中已經(jīng)計(jì)算得到一個(gè)掩膜值,但是這個(gè)掩膜值并不夠精確,,所以接下來(lái)采用閉合式空間中求解的方法對(duì)其進(jìn)行優(yōu)化,。首先采用參考文獻(xiàn)[5]的方法構(gòu)造一個(gè)拉普拉斯矩陣,由于摳圖問(wèn)題是典型的不確定問(wèn)題,,因此需要添加一定的約束條件,,把求得的掩膜值missing image file和信度值f作為數(shù)據(jù)項(xiàng),信度值missing image file,,其中σ=0.01,,并且結(jié)合拉普拉斯矩陣作為約束項(xiàng)來(lái)構(gòu)造一個(gè)代價(jià)函數(shù):
missing image file
上式中,missing image file和missing image file是權(quán)重參數(shù),,設(shè)為200和0.1,,D是一個(gè)對(duì)角矩陣,已知區(qū)域的像素記為1,,未知像素的像素記為0,,F(xiàn)是對(duì)角線元素為信度值f的對(duì)角矩陣;對(duì)式(15)關(guān)于α求導(dǎo)并令導(dǎo)數(shù)為0即可求得最終的α,,圖1所得結(jié)果即為最終得到的掩膜值,。
3 實(shí)驗(yàn)及結(jié)果
本文實(shí)驗(yàn)均在matlab下完成。實(shí)驗(yàn)的系統(tǒng)配置為Inter(R) Core(TM) Quad CPU處理器,、2.66 GHz主頻以及3.46 GB內(nèi)存,。實(shí)驗(yàn)所需圖片均由http://www.alphamatting.com./datasets.php下載得到,其中包括實(shí)驗(yàn)原圖,、trimap圖和ground-truth圖,,如圖2所示。本文將5幅圖得到的實(shí)驗(yàn)結(jié)果與Robust Matting[8],Global Sampling[10],、Comprehensive Sampling Sets [9]所得的結(jié)果進(jìn)行比較,。還計(jì)算出各個(gè)算法得到的掩膜圖與其相應(yīng)的ground-truth圖的均方誤差作為算法性能評(píng)價(jià)的量化指標(biāo),如表1所示,。
從表1及圖3可以看出,,通過(guò)對(duì)5組圖片進(jìn)行實(shí)驗(yàn),本文算法不管是從視覺(jué)角度還是均方誤差角度都具有明顯的優(yōu)勢(shì),,其他三種算法中,,Comprehensive Sampling Sets最好,Global Sampling次之,,Robust Matting效果較差,。從實(shí)驗(yàn)結(jié)果可以看出,Robust Matting對(duì)于前背景顏色較為相近的圖片處理效果較差,, Global Sampling對(duì)細(xì)節(jié)的把握不夠精確,。本文算法得到的掩膜圖不僅在細(xì)節(jié)部分優(yōu)于其他3種算法,而且與ground-truth相比,,誤差最小,。
4 結(jié)論
本文首先通過(guò)采集大量的樣本對(duì)求出初始的掩膜值,再定義一個(gè)顏色空間代價(jià)函數(shù)來(lái)選擇最優(yōu)的樣本對(duì),,與以前的算法比較,,本文利用未知像素與其較近的前景或背景樣本點(diǎn)的距離來(lái)判斷該未知像素是否為完全前景像素或者完全背景像素,并且在最終掩膜值的優(yōu)化過(guò)程中把信度值作為約束項(xiàng),,使得最終得到的結(jié)果在細(xì)節(jié)方面更加精確,,而且對(duì)于前背景顏色較為相近的圖片也能得到較為理想的結(jié)果。
參考文獻(xiàn)
[1] Chuang Y Y, Curless B, Salesin D H, et al. A bayesian approach to digital matting[C]. Computer Vision and Pattern
Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. IEEE, 2001, 2(2):
264-271.
[2] Ruzon M A, Tomasi C. Alpha estimation in natural images[C]. Computer Vision and Pattern Recognition, 2000: Proceedings of IEEE Conference on. IEEE, 2000: 18-25.
[3] Hillman P, Hannah J, Renshaw D. Alpha channel estimation in high resolution images and image sequences[C].Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer SocietyConference on. IEEE, 2001, 1(1)::1063-1068.
[4] Grady L, Schiwietz T, Aharon S, et al. Random walks for interactive alpha-matting[C]. Proceedings of VIIP. 2005,2005: 423-429.
[5] Levin A, Lischinski D, Weiss Y. A closed-form solution to natural image matting[J]. Pattern Analysis and MachineIntelligence, IEEE Transactions on, 2008, 30(2): 228-242.