文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2014)11-0120-03
0 引言
傳統(tǒng)的昆蟲(chóng)識(shí)別主要是通過(guò)專家觀察昆蟲(chóng)的外部特征并與標(biāo)準(zhǔn)的樣本進(jìn)行鑒別,,工作量大,。為科學(xué)準(zhǔn)確地識(shí)別害蟲(chóng)與預(yù)防蟲(chóng)害,利用計(jì)算機(jī)模式識(shí)別可有效地管理昆蟲(chóng)圖像數(shù)據(jù)庫(kù),?;趦?nèi)容的圖像檢索自動(dòng)提取昆蟲(chóng)的底層與高層特征,匹配視覺(jué)特征,,將相似性較大的圖像反饋給用戶,,不僅較少了工作量,且提高了檢索精度,。
顏色特征作為重要的圖像視覺(jué)特征之一,,其不受圖像的尺寸、平移,、旋轉(zhuǎn)的影響,。提取顏色特征的方法相對(duì)容易,研究者提出了基于顏色特征的諸多算法[1],,如顏色直方圖,、顏色矩、顏色熵,、顏色聚合向量,、顏色相關(guān)圖等。顏色特征檢索方法只是基于內(nèi)容圖像檢索的一種方法, 在實(shí)際應(yīng)用中應(yīng)與其他特征檢索方法相結(jié)合, 檢索效果會(huì)更佳[2],。紋理特征是圖像另一個(gè)重要特征,,不僅體現(xiàn)了灰度值間的相互關(guān)系,而且反映出紋理變化規(guī)律的周期性,,成為分析圖像特征的重要方法,。單一特征片面地描述圖像信息,丟失了圖像的部分信息,,檢索通用性差,,檢索效果不好[3]。采用綜合特征提取圖像視覺(jué)特征,可有效地改善檢索效果,,更加符合人的視覺(jué)要求,。本文首先實(shí)現(xiàn)了顏色特征和紋理特征的SVM圖像檢索仿真,在此基礎(chǔ)上結(jié)合圖像分塊,,實(shí)現(xiàn)三者結(jié)合的SVM圖像檢索仿真,。
1 算法描述
1.1 顏色矩
顏色矩于1995年被Stricker和Orengo提出,是一種簡(jiǎn)單且有效的圖像顏色特征描述方法,。圖像的顏色分布信息主要集中在低階矩中,,采用顏色直方圖的一階矩、二階中心矩和三階中心矩就可以表達(dá)圖像的顏色特征[4],。
其中,,hij表示第i個(gè)顏色通道分量中灰度為j的像素出現(xiàn)的概率,n表示灰度級(jí),。
1.2 灰度共生矩陣
灰度共生矩陣方法是公認(rèn)的有效方法,,具有較強(qiáng)的適應(yīng)能力和魯棒性[5]。
假設(shè)f(x,,y)為一幅灰度圖像,,對(duì)圖像中任一區(qū)域R,定義S為區(qū)域中具有特定空間聯(lián)系的像素對(duì)的集合,,則灰度共生矩陣可表示為:
其中,,為圖像任意一點(diǎn)與其他相鄰點(diǎn)的偏離方向,d為偏離距離,。在實(shí)際應(yīng)用中,,為減小計(jì)算量,需對(duì)式(4)進(jìn)行歸一化,,即式(5)所示:
為減少θ的方向數(shù),,通常計(jì)算4個(gè)方向的灰度共生矩陣,即θ取值為0°,、45°,、90°、135°,。根據(jù)在共生矩陣基礎(chǔ)上提取的數(shù)字統(tǒng)計(jì)量,,取主要5種描述紋理統(tǒng)計(jì)量,分別為能量,、相關(guān)性,、熵、對(duì)比度和逆差矩,。
1.3 SVM
SVM(支持向量機(jī))建立在統(tǒng)計(jì)學(xué)習(xí)和VC維理論的基礎(chǔ)上[6],,在解決小樣本問(wèn)題中存在特有的優(yōu)勢(shì),,其主要思想是構(gòu)造一個(gè)使分類間隔最大的超平面,使得離分類超平面最近的樣本點(diǎn)間的間隔最大,,從而控制VC維大小,,降低了機(jī)器學(xué)習(xí)的復(fù)雜度。在訓(xùn)練小樣本情況下,不需要特定問(wèn)題的先驗(yàn)知識(shí),,可以很好地控制學(xué)習(xí)機(jī)器的推廣能力,,因而在圖像檢索中可以有效地改善檢索結(jié)果[7]。
SVM解決分類問(wèn)題,,使得一些在低維特征空間不可分問(wèn)題在高維空間變得可分。SVM分類器主要受兩個(gè)關(guān)鍵因素的影響:其一,,誤差懲罰參數(shù)C,;其二,核函數(shù)形式及其參數(shù)設(shè)置[8],。選擇不同的核函數(shù)以及相同核函數(shù)設(shè)置不同參數(shù)對(duì)其分類性能均有影響,。這里借用MATLAB自帶的Libsvm軟件包,構(gòu)造訓(xùn)練模型,,實(shí)現(xiàn)圖像樣本預(yù)測(cè),。LIBSVM中最重要的是核函數(shù)及其相關(guān)參數(shù)的選取。常用的核函數(shù)有線性核,、多項(xiàng)式核和RBF核,。一般選擇RBF核及徑向基核函數(shù),它只有一個(gè)待定參數(shù),,其值越大,,收斂速度越快[9]。
本實(shí)驗(yàn)分別從正,、負(fù)類圖像中選取前N張用于訓(xùn)練集,,其余的1 000-N用于測(cè)試集。選取SVM類型為e-SVR,,核函數(shù)選用RBF(徑向基函數(shù))核,,又稱高斯核函數(shù),SVM分類器優(yōu)化問(wèn)題就轉(zhuǎn)化式(6)的最小化問(wèn)題:
其中,,ai為拉格朗日乘子,,C為懲罰參數(shù)。式(6)的最小值取決于參數(shù)(C,,?酌)的設(shè)置,,合適的參數(shù)可使得SVM分類器的性能最佳,其推廣能力最好,。經(jīng)過(guò)多次試驗(yàn),,C取100,,?酌取1/k,k為類數(shù),。用訓(xùn)練數(shù)據(jù)訓(xùn)練SVM分類器,,預(yù)測(cè)測(cè)試樣本,同時(shí),,為了避免數(shù)值計(jì)算困難問(wèn)題,,采用尺度因子壓縮數(shù)據(jù),用ROC曲線與AUC值作為評(píng)價(jià)分類器性能的指標(biāo),。
2 改進(jìn)算法
2.1 圖像分塊
圖像分塊通過(guò)綜合利用圖像全局特征和綜合特征,,更好地描述了圖像內(nèi)容。由于顏色空間分布存在差異性,,故將圖像分成若干個(gè)子塊[10],。分塊圖像特征檢索方法具有良好的旋轉(zhuǎn)、平移和尺度不變性,,得到的檢索結(jié)果能夠很好地滿足人的視覺(jué)感受[11],。圖像的空間分布信息對(duì)圖像相似性判斷的影響極大,圖像分塊注重了圖像的空間分布信息,,實(shí)現(xiàn)了基于均勻分塊的圖像檢索算法[12],,三者結(jié)合更加全面地描述了圖像信息,使得檢索結(jié)果更加準(zhǔn)確,。
2.2 Bag of Words算法描述
Bag of Words算法也稱為詞袋算法,,是一種有效的基于語(yǔ)義特征提取與描述的物體識(shí)別算法。其基本思想是假定對(duì)于一個(gè)文本,,忽略其詞序和語(yǔ)法,、句法,僅僅將其看作是一些詞匯的集合,,而文本中的每個(gè)詞匯都是獨(dú)立的[13],。Bag of Words算法首先要提取圖像的特征點(diǎn),通過(guò)描述方式轉(zhuǎn)化為特征描述符,,利用K-Means對(duì)描述符進(jìn)行聚類,,得到每個(gè)類的聚類中心,所有的聚類中心的集合成為視覺(jué)詞匯,,最后利用機(jī)器學(xué)習(xí)的方法對(duì)多個(gè)類別的描述符進(jìn)行訓(xùn)練,。
2.3 Bag of Words模型
Bag of Words模型應(yīng)用于圖像表示,為了能表示一幅圖像,,需將圖像視為文檔,。K-Means算法是基于樣本間相似度測(cè)量的間接聚類算法,其特點(diǎn):理論可靠,、算法簡(jiǎn)單,、收斂速度快[14],。
實(shí)驗(yàn)將圖像庫(kù)里的圖像大小分成50×50,采用重疊的分塊方式,,并提取每塊的顏色紋理特征,,由于圖像大小不同,故分塊的數(shù)量也不同,。為了能用標(biāo)準(zhǔn)的SVM學(xué)習(xí)與檢索,,借鑒Bag of Words模型,則步驟如下:
(1)用K-Means對(duì)所有訓(xùn)練圖像的所有分塊的顏色與紋理特征進(jìn)行聚類,,找到聚類中心點(diǎn),,構(gòu)造視覺(jué)詞匯;
(2)將每幅圖像的分塊特征向量在聚類中心點(diǎn)映射,,得到圖像的映射向量,;
(3)以圖像的映射向量作為圖像的特征向量,從而利用SVM學(xué)習(xí)與檢索,。
用K-Means算法將訓(xùn)練類的所有圖像示例聚成100類,并產(chǎn)生每一類的投影特征,,建立每小類的視覺(jué)字,,分別計(jì)算訓(xùn)練與測(cè)試類的投影特征。
3 實(shí)驗(yàn)分析
實(shí)驗(yàn)選取蝴蝶,、蜻蜓,、蜜蜂、蟋蟀,、蝗蟲(chóng),、螳螂、天牛,、棉鈴蟲(chóng)(幼蟲(chóng)),、瓢蟲(chóng)與蚜蟲(chóng)10類各100張圖片構(gòu)建昆蟲(chóng)圖像數(shù)據(jù)庫(kù)。分別采用顏色矩小波紋理綜合特征與圖像分塊結(jié)合顏色矩小波紋理綜合特征的方法,,進(jìn)行SVM圖像檢索,。實(shí)驗(yàn)結(jié)果如表1所示。
根據(jù)每類圖像的AUC值繪制PR曲線,,如圖1所示,。
實(shí)驗(yàn)表明,圖像分塊特征結(jié)合顏色紋理綜合特征檢索效果比顏色紋理綜合特征SVM圖像檢索結(jié)果精度高,,同時(shí)也表明了全面的綜合特征描述了圖像的完整信息,。
4 結(jié)論
利用計(jì)算機(jī)模式識(shí)別可有效地識(shí)別昆蟲(chóng),通過(guò)提取綜合特征描述昆蟲(chóng)圖像信息,,構(gòu)建訓(xùn)練模型,,使用SVM訓(xùn)練樣本,,并預(yù)測(cè)測(cè)試樣本。圖像分塊彌補(bǔ)了圖像空間分布信息,,更加全面描述了圖像內(nèi)容,,SVM在圖像檢索中的應(yīng)用提高了檢索精度。
參考文獻(xiàn)
[1] 李勃,,章毓晉.基于特征元素和關(guān)聯(lián)規(guī)則的圖像分類方法[J].電子學(xué)報(bào),,2002,30(9):1262-1265.
[2] 李向陽(yáng),,莊越挺,,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2001,,38(3):344-348.
[3] 肖秦琨,,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計(jì)算機(jī)技術(shù)與發(fā)展,,2013,,23(4):107-110.
[4] 孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,,2009.
[5] 侯群群,,王飛,嚴(yán)麗.基于灰度共生矩陣的彩色遙感圖像紋理特征提取[J].國(guó)土資源遙感,,2013,,25(12):26-32.
[6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,,2001,,23(8):800-810.
[7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 奉國(guó)和.SVM分類核函數(shù)及參數(shù)選擇比較[J].計(jì)算機(jī)工程與應(yīng)用,,2011,,47(3):126-127.
[9] 羅成石.基于LIBSVM 的糧食水分?jǐn)?shù)據(jù)融合研究[J].科學(xué)技術(shù)與工程,2012,,12(2):292-294.
[10] 陳雅芳,,薛清福,陳方芳,,等.基于圖像全局和局部顏色特征的圖像檢索[J].長(zhǎng)春教育學(xué)院學(xué)報(bào),,2013,29(24):50-51.
[11] 郭麗,,黃元元,,楊靜宇.用分塊圖像特征進(jìn)行商標(biāo)圖像檢索[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)報(bào),2004,,16(7):968-972.
[12] 張磊,,林福宗,,張鈸.基于支持向量機(jī)的相關(guān)反饋圖像索算法[J].清華大學(xué)學(xué)報(bào),2002,,42(1):80-83.
[13] 孫孟柯,,張紅梅.基于Bag of words模型的圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2012,,8(5):1139-1141.
[14] 曾接賢,,王軍婷,符祥.K均值聚類分割的多特征圖像檢索方法[J].計(jì)算機(jī)工程與應(yīng)用,,2013,,49(2):226-227.