《電子技術應用》
您所在的位置:首頁 > 顯示光電 > 設計應用 > 基于改進協(xié)方差矩陣的半色調圖像分類研究
基于改進協(xié)方差矩陣的半色調圖像分類研究
2015年微型機與應用第19期
鐘智彥,文志強,,葉德剛
(湖南工業(yè)大學 計算機與通信學院,,湖南 株洲 412007)
摘要: 針對半色調圖像分類中只存在0和1的特點,,提出了一種基于改進的協(xié)方差矩陣在半色調圖像中的分類方法,。根據(jù)協(xié)方差矩陣在實現(xiàn)半色調圖像分類中個數(shù)少且并未體現(xiàn)其局部和全局信息的特性,,對協(xié)方差矩陣的底層特征進行改進,。利用樣本的局部特性和核密度估計方法,,實現(xiàn)黎曼流形上的貝葉斯分類策略,。實驗中研究協(xié)方差矩陣的底層特征與傳統(tǒng)協(xié)方差矩陣的特征提取方法并對其進行分類性能比較。實驗結果表明,,在半色調圖像分類中,,與傳統(tǒng)的協(xié)方差矩陣相比較,改進的協(xié)方差矩陣提取出的特征在分類中平均錯誤分類率更低
Abstract:
Key words :

  摘  要: 針對半色調圖像分類中只存在0和1的特點,,提出了一種基于改進的協(xié)方差矩陣在半色調圖像中的分類方法,。根據(jù)協(xié)方差矩陣在實現(xiàn)半色調圖像分類中個數(shù)少且并未體現(xiàn)其局部和全局信息的特性,,對協(xié)方差矩陣的底層特征進行改進。利用樣本的局部特性和核密度估計方法,,實現(xiàn)黎曼流形上的貝葉斯分類策略,。實驗中研究協(xié)方差矩陣的底層特征與傳統(tǒng)協(xié)方差矩陣的特征提取方法并對其進行分類性能比較。實驗結果表明,,在半色調圖像分類中,,與傳統(tǒng)的協(xié)方差矩陣相比較,改進的協(xié)方差矩陣提取出的特征在分類中平均錯誤分類率更低,。

  關鍵詞: 半色調圖像,;協(xié)方差矩陣;黎曼流形,;最近鄰分類器

0 引言

  數(shù)字半色調(也稱為空間抖動)始于19世紀50年代,,是將一幅連續(xù)色調的圖像先進行二值化處理,再用這些黑白二色的點來表示各個等級灰度的技術[1],。數(shù)字半色調技術已廣泛應用于傳真,、打印、印刷,、顯示設備及數(shù)字圖像的壓縮存儲等領域,。較常用的數(shù)字半色調方法有:有序抖動法[2]、誤差分散法[3],、點分散法[4],、綠噪聲半調法[5]等。通過分析現(xiàn)有的半色調技術可知,,不同半色調技術應用于多級圖像時將產(chǎn)生具有各自不同特性的半色調圖像[6],,有周期性、點分布,、點分散性,、點相關性等。當通用型逆半色調技術用于某種半色調圖像的重建時,,將缺少相關半色調模式信息,,所以較難獲得半色調圖像的最優(yōu)重建。

  目前數(shù)字半色調圖像分類方法的研究比較少,。Chang[7]首先對半色調圖像分類進行研究,,指出在半色調圖像恢復成連續(xù)灰度圖像之前運用一維自相關函數(shù),提取出四類半色調圖像,,最后用BP神經(jīng)網(wǎng)絡進行分類,。雖然該方法分類結果有時能達到100%,但獲取的類別比較少。文志強[1,,8]提出一種在3個方向上利用像素自相關特征進行同或運算來描述紋理特征的有監(jiān)督流形上的半色調分類方法,,利用圖像分塊的思想獲取紋理特征,目的在于提高建模效率和紋理特征的有效性,。

  以上方法都基于歐式空間,,本文提出的方法需在黎曼空間上進行特征匹配,再利用黎曼距離和局部概率密度來實現(xiàn)對半色調圖像的分類,。黎曼流形是具有黎曼度量的微分流形,,即有一個對稱正定協(xié)變的二階張量場在這個流形上,相比于歐式空間,,具有更豐富的黎曼度量方法,,是研究概率分布和模式匹配的有效工具。

1 傳統(tǒng)協(xié)方差矩陣建模方法

  通過多種半色調技術可將多級灰度圖像轉化為半色調圖像樣本,,并對其進行分類,。12種常用半色調技術,如表1所示,。圖1給出相應的12幅灰度圖像產(chǎn)生的半色調圖像(以lena(大?。?56×256)為例)。由圖1可知,,不同半色調技術產(chǎn)生的半色調圖像具有不同的紋理特征,。一些半色調圖像紋理比較明顯,如圖1中的(a),、(g),、(h)、(i)子圖,;另一些紋理差別不明顯,,分類較困難,如圖1中(b),、(c),、(e)和(l)子圖難以區(qū)分,,子圖(d),、(f)、(j)和(k)區(qū)別也較小,。由分析可知,,造成半色調圖像分類錯誤率高的最主要原因是紋理差別不明顯。因此,,本文在半色調圖像上對協(xié)方差矩陣改進之后再進行構建與分類,。

  協(xié)方差矩陣[13-14](Covariance matrix,COV)是概率論、統(tǒng)計學的一個概念,,通過不同維度計算協(xié)方差構成的矩陣,,衡量兩個隨機變量的變化。協(xié)方差矩陣表示一個多維隨機變量各個維度之間的相關性,。協(xié)方差矩陣于2006年被Tuzel O,,Porikli F[15]作為描述子最先應用在醫(yī)學圖像處理的目標檢測中,能夠很好地描述圖像,,因為將其用于圖像特征提取時,,將區(qū)域圖像不同的特征值通過統(tǒng)計矢量的方式統(tǒng)一于協(xié)方差矩陣中。COV作為描述子具有很好的魯棒性,,對外部形態(tài)和光照的改變能很好地維持其主要特征的不變性,,所以可將COV應用于半色調圖像的特征提取中[16]。

  COV定義如下:

  設I為一維強度或三維強度的彩色圖像,,f為原圖I內具有M×N個像素的區(qū)域圖像,,h為該區(qū)域f內提取的d維特征向量,如式(1)所示:

  1.png

  將區(qū)域f每個像素的特征向量通過共生關系統(tǒng)一到協(xié)方差矩陣C中,,如式(2)所示:

  2.png

  其中,,h(x,y)為區(qū)域矩陣每個元素的特征向量,,u為M×N個dx1維特征向量h(x,,y)的均值,h(x,,y)表示區(qū)域圖像每個像素的底層特征,,如式(3)所示:

  h(x,y)=[|fxx|,,|fyy|,,|fx|,|fy|,,f(x,,y)]T(3)

  式(2)中C(f)為協(xié)方差矩陣,融合了原始圖像底層的五個特征,,等價于公式(4):

  C(f)=HHT(4)

  由公式(1)~(4)可知,,COV能夠較好地表示圖像的特征,且具有如下優(yōu)點:

 ?。?)很好的辨識度,。能夠將區(qū)域圖像多種特征融合于COV中。

 ?。?)更低的維數(shù),。COV是一個對稱的半正定矩陣,,所以d維的特征向量構成的協(xié)方差矩陣具有(d2+d)/2個不同值。

 ?。?)很好的魯棒性,。將一幅圖像旋轉后,若選取的特征適當,,則形成的COV不發(fā)生相應的改變,。

  2 改進的協(xié)方差矩陣建模方法

  COV雖然有很多優(yōu)點,但也存在不足,。由公式(2)可知,,當h(x,y)=u時,,協(xié)方差矩陣的行列式有可能為0,,所以準確地講,協(xié)方差矩陣應屬半正定矩陣,,針對該問題可采用附加一個足夠小的對角矩陣p來進行預處理,。

  可以看到,圖1中12幅半色調圖像的紋理不明顯,,分類較困難,。針對這一難點,可將半色調圖像求梯度,,即通過梯度信息來描述圖像中物體的邊緣,、輪廓、形狀等紋理特征,。對圖像加入水平邊緣算子[-1,,0,1]和垂直邊緣算子[-1,,0,,1]T,并將該特征加入?yún)f(xié)方差矩陣的底層特征中,。所以提出改進的協(xié)方差矩陣(Improved covariance matrix,,ICM)。

  本文獲取區(qū)域半色調圖像f的底層特征如公式(5)所示,,通過公式(2)將其構成COV,。

  h(x,y)=[x,,y,,|fx|,|fxx|,,|fy|,,|fyy|,f(x,,y),,

  5.png

  其中,x,,y分別為區(qū)域半色調圖像的坐標值,,f(x,y)設定以位置(x,,y)為中心的n×n(實驗中n取9)鄰域各個像素值之和,,|fx|、|fxx|為像素值在x方向的一階,、二階導,,|fy|、|fyy|為像素值在y方向的一階,、二階導,。arctan|fy|/(|fx|+p)為f(x,y)在位置(x,,y)處的梯度,。由于協(xié)方差矩陣的行列式有可能為0,所以添加一個無窮小量,。S1(x,,y)=(|Ix|*|Ix|+|Iy|*|Iy|+|fx|*|fx|+|fy|*|fy|),其中Ix為水平邊緣梯度,,Iy為垂直邊緣梯度,。S2(x,y)=arctan|Iy|/(|Ix|+p),。圖2為對應圖1中ICM特征圖像示例圖,。由圖2可知,各矩陣的特征圖都有一定的差別,,這說明提取的特征矩陣可用于描述半色調圖像,。即加入梯度算子后,圖像的輪廓明顯變得更清晰,。將梯度算子加入COV的底層特征后,,特征更明顯,更容易區(qū)分圖像的紋理信息,。ICM算法實現(xiàn)步驟如下:

002.jpg

  算法:ICM算子的構造

  輸入:一幅大小為M×N的區(qū)域半色調圖像f

  輸出:能夠表征原始半色調圖像的改進協(xié)方差矩陣

  Step1 根據(jù)公式(5)獲取區(qū)域半色調圖像的十個底層特征,,分別是x,y,,|fx|,,|fxx|,,|fy|,|fyy|,,f(x,,y),arctan|fy|/(|fx|+p),,S1(x,,y),S2(x,,y),;

  Step2根據(jù)公式(2)計算區(qū)域半色調圖像f的協(xié)方差 矩陣C(f)。

3 實驗結果及比較

  3.1 實驗環(huán)境

  本實驗在Windows 7操作系統(tǒng)環(huán)境下進行,,采用VC6.0結合OpenCV 1.0及MATLAB 7.11進行編程,。常用半色調圖像由VC6.0結合OpenCV 1.0產(chǎn)生,ICM特征的提取使用MATLAB 7.11生成,。

  3.2 實驗結果

  對原始圖像產(chǎn)生12類常用半色調圖像庫,,對每類隨機取出410幅樣本(大小為256×256)。對每幅圖像提取ICM特征,,之后從每類410個協(xié)方差矩陣的特征中隨機抽取205個作為訓練樣本,,剩余205個作為測試樣本。為驗證提出方法的有效性,,取相同K值不同類型的特征矩陣在黎曼流形上采用K最近鄰分類器對紋理特征進行分類?,F(xiàn)取K=23,應用傳統(tǒng)的協(xié)方差矩陣與本文提出方法對隨機取出的410×12幅圖像進行分類,,比較其分類精度如表2和表3所示,。

  由表2可知,采用傳統(tǒng)協(xié)方差矩陣對12類常用的半色調圖像的平均分類正確率為83.487 5%,,由表3可知,,提出方法對12類常用半色調圖像的平均分類正確率為92.598 3%。比較表明,,本文所提出的方法有所改善,。

  3.3 參數(shù)影響

  對于多類別(類別數(shù)大于2)投票時可能會出現(xiàn)兩種或多種類別票數(shù)相同問題,這種情況下分類器取K個近鄰值中最小值對應的類別為最終類別,。分類結果性能采用平均分類錯誤率(公式(7))和分類錯誤方差率(公式(8))來評價,,其中公式(6)為錯誤分類率。平均分類錯誤率越小說明分類效果越好,,分類錯誤方差率越小說明分類器越穩(wěn)定,。

 6.png

78.png

  其中,nj為測試樣本總數(shù),,mj為正確分類樣本數(shù),,N為總的類別數(shù)(N=12),,j為類別數(shù),j=1,,2,,…,,12,。

003.jpg

  本實驗測試不同K值對相同類型的影響。由12類常用半色調圖像變更不同的K值,,分別取11,,15,19,,23,,27,31,,35七個值來比較傳統(tǒng)協(xié)方差矩陣和提出方法提取特征矩陣對其進行eave和v比較,,折線圖比較如圖3和圖4所示。由圖3可知,,常用12類半色調圖像的分類中,,COV在K=19時分類效果最好,ICM在K=23時分類效果最好,。但不管K為何值,,提出方法效果均優(yōu)于COV。由圖4的v折線圖可知,,COV在K=23時分類器最穩(wěn)定,,ICM在K=27時v最小,此時的分類器性能最穩(wěn)定,。不管K為何值,,本文提出方法的分類器更穩(wěn)定。由此證明,,提出方法的有效性,。

4 總結

  針對12類常用半色調圖像的分類問題,對半色調圖像的特征建模和分類方法進行了深入研究,,提出對傳統(tǒng)的協(xié)方差矩陣進行改進,,并用黎曼流形上的K最近鄰方法對提取出的特征矩陣進行分類。通過比較分類精度來驗證提出方法的有效性,。實驗證明,,將傳統(tǒng)的協(xié)方差矩陣與提出方法進行eave和v比較,可知提出方法在K=23時,,eave最低,,即分類效果最好,;在K=27時,v最小,,即分類器性能最穩(wěn)定,,所以在選擇K值時應視需求而定。

參考文獻

  [1] 文志強,,胡永祥,,朱文球.基于統(tǒng)計量模板的半色調圖像特征提取與分類[J].計算機科學,2013,,40(12):94-112.

  [2] LIU Y F,, GUO J M. New class tiling design for dot-diffused halftoning[J]. IEEE Trans. on Image Process, 2013,,2(3): 1199-1208.

  [3] STEVENSON R. Inverse halftoning via MAP estimation[J].IEEE Trans. on Image Processing,, 1997, 6(4): 574-583.

  [4] MESE M,, VAIDYANATHAN P P. Recent advances in digital halftoning and inverse halftoning methods[J]. IEEE Trans. on Ciruits and Systems: Fundamental Theory and Applications,, 2002,49(6): 790-805.

  [5] LIU Y F,, GUO J M,, LEE J D. Inverse halftoning based on the Bayesian theorem[J]. IEEE Trans. on Image Process, 2011,, 20(4): 1077-1084.

  [6] 文志強,,胡永祥,朱文球.黎曼流形上半調圖像的協(xié)方差建模與貝葉斯分類方法[J].模式識別與人工智能,,2013,,26(11):993-1003.

  [7] CHANG P C, YU C S. Neural net classification and LMS reconstruction to halftone images[C]. Proc. of the SPIE Visual Communications and Image Processing,, San Jose,, USA, 1998: 592-602.

  [8] Wen Zhiqiang,, Hu Yongxiang,, Zhu Wenqiu. A novel classification method of halftone image via statistics matrices[J]. IEEE Trans. on Image Process, 2014,, 23(11): 4724-4736.

  [9] GUO J M,, LIU Y F, CHANG J Y,, et al. Efficient halftoning based on multiple look-up tables[J]. IEEE Trans. on Image Process,, 2013, 22(11):4522-4531.

  [10] MESE M, VAIDYANATHAN P P. Recent advances in digital halftoning and inverse halftoning methods[J]. Circuits and Systems I: Fundamental Theory and Applications,, IEEE Transactions on,, 2002,49(6):790-805.

  [11] ULICHNEY R. Digital halftoning and the physical reconstruction function[C]. Ph. D Dissertation. Cambridge,, USA: Massachusetts Institute of Technology,, 1986.

  [12] KNUTH D E. Digital halftones by dot diffusion[J]. ACM Trans. on Graphics, 1987,, 6(4):245-273.

  [13] MESE M,, VAIDYANATHAN P P. Optimized halftoning using dot diffusion and methods for inverse halftoning[J]. IEEE Trans. on Images Process, 2000,,9(4):691-709.

  [14] WU Y,, CHENG J,, WANG J,, et al. Real-time probabilistic covariance tracking with efficient model update[J]. IEEE Trans. on Image Process, 2012,,21(5):2824-2837 .

  [15] PORIKLI F,, TUZEL O, MEER P. Covariance tracking using model update based on lie algebra[C]. Computer Vision and Pattern Recognition,, 2006 IEEE Computer Society Conference on. IEEE,, 2006:728-735.

  [16] Wen Zhiqiang, Hu Yongxiang,, Zhu Wenqiu. Bayesian classification of halftone image based on region covariance[J]. Intelligent System Design and Engineering Applications,, 2013(3):398-401.


此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載,。