摘 要: 為進(jìn)一步提高牛肉大理石紋評級的正確率,,提出了基于完整局部二值模式(Completed Local Binary Pattern,,CLBP)、改進(jìn)核主成分分析(Kernel Principal Component Analysis,,KPCA)和隨機(jī)森林(Random Forests,,RF)的牛肉大理石紋評級方法。首先,,利用CLBP提取牛肉大理石紋圖像的紋理特征,;其次,采用混沌蜂群算法對KPCA的核參數(shù)進(jìn)行優(yōu)化,,使KPCA的降維效果和特征提取達(dá)到最優(yōu),,獲得表征牛肉大理石紋樣本圖像的特征向量,;最后,使用隨機(jī)森林完成牛肉大理石紋樣本的分級識別,,獲得最終評級結(jié)果,。大量實驗結(jié)果表明,與基于分形維和圖像特征的方法,、基于灰度共生矩陣和BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)法相比,,本文方法所得識別率最高。
關(guān)鍵詞: 牛肉大理石紋評級,;圖像處理,;完整局部二值模式;混沌蜂群優(yōu)化,;核主成分分析,;隨機(jī)森林
0 引言
牛肉大理石紋的豐富程度與牛肉的口感、質(zhì)地,、多汁性及風(fēng)味有著直接關(guān)系,,它直接影響著牛肉的定價與消費,被國內(nèi)外普遍作為牛肉評級的主要指標(biāo)之一,。人工的評級結(jié)果容易受到個人差異性和主觀性的影響,,存在評級準(zhǔn)確率低和速度慢的問題,研究實現(xiàn)牛肉大理石紋的自動化評級,,對提高牛肉質(zhì)量評定的準(zhǔn)確率和速度有著重要的現(xiàn)實意義[1-2],。
近年來,將圖像處理技術(shù)應(yīng)用于牛肉大理石紋的自動評級成為國內(nèi)外人們的研究熱點[3-5],。參考文獻(xiàn)[6-7]大多僅考慮肌內(nèi)脂肪的面積比例和顆粒數(shù)量,,沒有深入考慮大理石花紋的紋理特征。參考文獻(xiàn)[8-9]采用圖像灰度共生矩陣的統(tǒng)計量描述牛肉大理石紋特征,,再分別結(jié)合BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或線性回歸模型進(jìn)行評級,,該類方法還需要引入其他的紋理特征和評價指標(biāo)來進(jìn)一步提升方法的評級正確率。參考文獻(xiàn)[10]提出了完整局部二值模式(Completed LBP,,CLBP),,在紋理圖像的分類應(yīng)用中發(fā)揮了顯著作用。采用CLBP計算牛肉大理石紋圖像的特征參數(shù),,可以更好地表征大理石紋的分布性狀特點,,有助于提高最終的評級正確率。由于所得特征參數(shù)維數(shù)較大,,需進(jìn)行降維處理,。本文采用混沌蜂群優(yōu)化的核主成分分析(Kernel Principal Component Analysis,KPCA)方法來實現(xiàn)降維過程,。KPCA[11]被人們廣泛應(yīng)用于非線性特征提取,,但由于其核參數(shù)選擇大多依據(jù)經(jīng)驗,,導(dǎo)致特征提取和降維的效果受到了不同程度的影響。采用結(jié)構(gòu)簡單且可有效避免局部極值的混沌蜂群算法對核參數(shù)進(jìn)行優(yōu)化,,可以更好地減少時間花費,,參數(shù)優(yōu)化后的KPCA具備最優(yōu)的特征提取和降維性能。
隨機(jī)森林(Random Forests,,RF)[12-13]是一種較新的分類器,,它具有適應(yīng)高維小樣本數(shù)據(jù)、可以自動地進(jìn)行功能選擇,、對無關(guān)特征不敏感,、同等適用于二類分類和多類分類問題等優(yōu)點,且不需要進(jìn)行復(fù)雜的參數(shù)選擇,,分類正確率和識別效率都優(yōu)于多元線性回歸模型,、BP神經(jīng)網(wǎng)絡(luò)方法。結(jié)合RF實現(xiàn)牛肉大理石紋的評級可望獲得更高的評級正確率和效率,。
基于上述分析,,本文提出基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋評級方法,。首先利用CLBP提取表征牛肉大理石紋圖像的特征參數(shù),;其次,采用混沌蜂群優(yōu)化的KPCA對CLBP編碼信息進(jìn)行降維,,得到樣本圖像的特征向量,;最后利用RF完成評級。
1 牛肉大理石紋圖像的特征提取和降維
1.1 CLBP特征提取
牛肉大理石紋圖像的LBP編碼是按照式(1)計算得出的,。
式中,gc是中心像素點的灰度值,,gp是鄰域像素點的灰度值,,P是鄰域像素點數(shù),R是鄰域半徑,。
通過對圖像進(jìn)行局部差值符號與大小的轉(zhuǎn)換(Local Difference Sign-Magnitude Transform,,LDSMT)分析,可以得到中心描述子(CLBP-Center,,CLBP_C),、符號描述子(CLBP-Sign,CLBP_S)和大小描述子(CLBP-Magnitude,,CLBP_M),。參照局部二值模式方法,計算中心像素灰度值與鄰域像素灰度值之差:dp=gp-gc,,dp又可以分解為:
dp=sp×mp,,sp=sgn(dp),,mp=|dp|(2)
式中,,,表示dp的符號,,mp表示dp的大小。
CLBP_M編碼和CLBP_C編碼的計算公式分別如式(3)和式(4)所示:
式中,,c是局部圖像中mp的均值,。
FCLBP_CP,R=s(gc,,cI),,s(x,cI)=1,,x≥cI0,,x<cI(4)
式中,cI是局部圖像的灰度均值,。
建立融合CLBP_S,、CLBP_M和CLBP_C的3維聯(lián)合直方圖,記為“CLBP_S/M/C”,,以此表征紋理圖像的特征,。
1.2 混沌蜂群優(yōu)化KPCA
設(shè)xi(i=1,2,,…,,N)是牛肉大理石紋圖像的N個訓(xùn)練樣本,被函數(shù)映射到高維空間中成為(xi),。假設(shè),,利用式(5)計算訓(xùn)練樣本在高維特征空間的協(xié)方差矩陣C。
那么,,式(8)變?yōu)椋?/p>
)
求解式(9)可以得到特征值λk,、參數(shù)向量?琢k和特征向量νk,那么任意樣本在高維特征空間的投影是:
以主成分貢獻(xiàn)率大于或等于90%為標(biāo)準(zhǔn),,則綜合評價函數(shù)為:
式中,,p是主成分個數(shù),是各主成分的貢獻(xiàn)率,。
采用多項式K(x,,xi)=[a(x,xi)+b]q作為核函數(shù),,核參數(shù)a,,b和q將直接影響KPCA特征提取和降維的效果。通常確定上述核參數(shù)大多依靠經(jīng)驗,,使得KPCA特征提取和降維效果很難達(dá)到最優(yōu),。選用混沌蜂群優(yōu)化算法對核參數(shù)進(jìn)行選擇,,有望使KPCA具備最優(yōu)的特征提取和降維性能。
混沌蜂群優(yōu)化KPCA具體步驟如下:
?。?)初始化食物源,,種群大小ns為30,維數(shù)D為3,,a∈[0,,1],b∈[2,,3],,q∈[1,2],,引領(lǐng)蜂與觀察蜂的數(shù)目為ns/2,,局部搜索最大循環(huán)次數(shù)nMC為20,跳出局部極值的界限nL為3,,當(dāng)前循環(huán)次數(shù)CT為1,,最大循環(huán)次數(shù)CM為20。
?。?)將KPCA的綜合評價函數(shù)式(12)作為混沌蜂群算法的目標(biāo)函數(shù),,引領(lǐng)蜂產(chǎn)生候選食物源,并在原食物源和候選食物源之間產(chǎn)生新的食物源,。
?。?)觀察蜂依據(jù)每個食物源的選擇概率,選擇一個食物源,,并執(zhí)行與該位置引領(lǐng)蜂相同的操作,,進(jìn)一步局部搜索。
?。?)引領(lǐng)蜂進(jìn)入偵查階段,,依據(jù)nL判定食物源是否陷入局部極值,對陷入局部極值的食物源利用式(13)產(chǎn)生的Tent映射混沌序列進(jìn)行擾動,,得到新的食物源。并更新陷入局部極值的食物源,。
式中,,i=1,2,,…,,k且cHi≠0.25,0.5和0.75,,k是混沌序列的長度大小,。
?。?)若CT達(dá)到最大循環(huán)次數(shù)CM,則循環(huán)結(jié)束,,輸出最優(yōu)參數(shù)a,、b和q,否則CT=CT+1,。
2 牛肉大理石紋圖像的等級評定
RF是以統(tǒng)計學(xué)習(xí)為理論基礎(chǔ),,通過對測試樣本的重復(fù)抽樣隨機(jī)產(chǎn)生多棵決策樹,再構(gòu)成森林,,最后用簡單的多數(shù)投票法來確定分類的結(jié)果,。RF具體包含學(xué)習(xí)和分類2個過程[14-15]。
?。?)學(xué)習(xí)過程,。設(shè)決策樹的數(shù)量是M,訓(xùn)練樣本集為T={(x1,,y1),,(x2,y2),,…,,(xi,yi),,…,,(xl,yl)},,其中xi∈Rn,,yi∈R,i=1,,2,,…,l,,xi表示樣本特征向量,,yi為樣本類別,l為樣本數(shù)量,。首先采用具備無權(quán)重,、有放回特點的Bagging方法,利用原訓(xùn)練集生成M個有差異的子集,;然后,,采用CART(Classification And Regression Trees)算法進(jìn)行節(jié)點分裂,再利用隨機(jī)選擇輸入變量(Forest-RI)的方式實現(xiàn)隨機(jī)特征變量的選取,計算出節(jié)點屬性指標(biāo),,分裂終止即構(gòu)建出一顆二叉決策樹,;最后,由所有的決策樹構(gòu)成RF,。
?。?)分類過程。將待分類樣本集輸入到RF,,用簡單多數(shù)投票的方式作為RF的輸出結(jié)果,,實現(xiàn)最終分類。
綜上所述,,本文方法的實現(xiàn)流程如圖1所示,。
3 實驗結(jié)果與分析
本文所使用的樣本圖像是由專業(yè)評級師將牛肉劃分為五級之后,再使用CCD相機(jī)在流水線上獲取的,,共250張圖像,,每級50張,其中訓(xùn)練樣本50張,、待評級樣本200張,。采用本文提出的基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級評定方法進(jìn)行實驗,,并將所得評級結(jié)果與參考文獻(xiàn)[7]方法,、參考文獻(xiàn)[8]方法進(jìn)行了對比。實驗是在Intel(R)Core(TM)Duo CPU T5550 1.83 GHz,、4 GB RAM,、MATLAB7.8環(huán)境中進(jìn)行的。圖2為我國NY/T676-2010牛肉大理石紋圖譜實例,,為該等級的最低標(biāo)準(zhǔn),;圖3為背最長肌最大內(nèi)接矩形區(qū)域的灰度圖像,用以牛肉大理石紋圖像的CLBP特征提取和混沌蜂群優(yōu)化的KPCA降維,。
采用CLBP提取50張訓(xùn)練樣本牛肉大理石紋圖像特征參數(shù),,用于混沌蜂群的KPCA參數(shù)優(yōu)化訓(xùn)練,經(jīng)過多次實驗,,結(jié)果表明降維后前4維主成分的累積貢獻(xiàn)率已達(dá)到98.05%,,因此選用降維后的前4維主成分組成特征向量就可以有效體現(xiàn)原始的特征向量,同時也達(dá)到了預(yù)期的降維目的,。表1列舉說明了經(jīng)混沌蜂群優(yōu)化的KPCA降維后,,前4維主成分的單獨貢獻(xiàn)率和累積貢獻(xiàn)率。
表2給出了利用本文所涉及的3種方法得到的牛肉大理石紋圖像待評級樣本單級識別率和總體識別率,。可以看出,與參考文獻(xiàn)[7]方法和參考文獻(xiàn)[8]方法相比,,本文方法得到的單級識別率和總體識別率均更高,。參考文獻(xiàn)[7]方法中構(gòu)造多元多項式模型的三個特征變量是:基于計盒維數(shù)、脂肪面積比率,、脂肪顆??倲?shù),這三個特征變量主要反映的是牛肉大理石紋圖像中脂肪和肌肉數(shù)量上的統(tǒng)計信息,,并不能夠完整地反映出由肌內(nèi)脂肪顆粒的分布情況所呈現(xiàn)的紋理信息,;加之,多元線性回歸模型屬于線性估計解決方法,,它容易因受到樣本特征空間數(shù)據(jù)間的相互作用影響,,出現(xiàn)對稱效應(yīng)、叢聚效應(yīng)和屏蔽效應(yīng),,因此,,由構(gòu)造成的多元線性回歸模型所獲得的牛肉大理石紋圖像單級識別率和總體識別率還不夠高。參考文獻(xiàn)[8]方法中通過計算牛肉大理石紋圖像的灰度共生矩陣統(tǒng)計量作為特征值,,能夠較好地反映圖像的紋理特征,,但由于選用的特征量數(shù)量有限,還不能夠反映出牛肉大理石紋圖像中所有的紋理信息,;另外,,所用的分類器是BP神經(jīng)網(wǎng)絡(luò)分類器,它的構(gòu)造原則是依據(jù)經(jīng)驗風(fēng)險最小化,,對樣本數(shù)量的依賴程度高,,容易出現(xiàn)過學(xué)習(xí)現(xiàn)象,同時還存在易陷入局部最優(yōu)問題,,最后所得的牛肉大理石紋圖像單級識別率和總體識別率還不太高,。本文方法中,采用CLBP計算牛肉大理石紋圖像的特征參數(shù),,利用混沌蜂群優(yōu)化的KPCA對特征參數(shù)進(jìn)行降維,,最終用前4維主成分表征牛肉大理石紋圖像,可以避免不能完全反映圖像紋理信息的問題,;結(jié)合RF進(jìn)行分類識別,,可以有效地提高分類精度和穩(wěn)定性。實驗結(jié)果表明,,本文方法所得單級識別率和總體識別率均最高,,是一種行之有效的牛肉大理石紋評級方法。
4 結(jié)論
本文提出基于CLBP,、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級評定方法,。首先采用CLBP編碼方式來提取表征牛肉大理石紋圖像的特征參數(shù);然后,利用混沌蜂群優(yōu)化的KPCA方法對表征牛肉大理石紋圖像的參數(shù)進(jìn)行降維,,降低冗余度,,選取累積貢獻(xiàn)率達(dá)到 98.05%的前4維主成分構(gòu)造特征向量;最后,,使用RF完成分類識別,。通過大量的實驗,結(jié)果表明評級正確率分別達(dá)到100%(一級),、95%(二級),、95%(三級)、 97.5%(四級),、100%(五級),。相比文獻(xiàn)[7]方法、文獻(xiàn)[8]方法,,采用本文方法所得的評級正確率最高,,可有助于提高牛肉大理石紋評級的準(zhǔn)確率和速度。
參考文獻(xiàn)
[1] 湯曉艷,,王敏,,錢永忠,等.牛肉分級標(biāo)準(zhǔn)及分級技術(shù)發(fā)展概況綜述[J].食品科學(xué),,2011,,32(19):288-293.
[2] 周彤,彭彥昆.牛肉大理石花紋圖像特征信息提取及自動分級方法[J].農(nóng)業(yè)工程學(xué)報,,2013,,29(15):286-293.
[3] 陳坤杰,姬長英.牛肉自動分級技術(shù)研究進(jìn)展分析[J].農(nóng)業(yè)機(jī)械學(xué)報,,2006,,37(3):153-156.
[4] TAN J. Meat quality evaluation by computer vision[J]. Journal of Food Engineering, 2004,, 61(1): 27-35.
[5] FUKUDA O,, NABEOKA N, MIYAJIMA T. Estimation of marbling score in live cattle based on ICA and a neural network[C]. IEEE 2013 International Conference on Systems Man and Cybernetics,, Manchester,, 2013: 1622-1627.
[6] 陳坤杰,姬長英.基于圖像運算的牛肉大理石花紋分割方法[J].農(nóng)業(yè)機(jī)械學(xué)報,,2007,,38(5):195-196.
[7] 陳坤杰,吳貴茹,,於海明,,等.基于分形維和圖像特征的牛肉大理石花紋等級判定模型[J].農(nóng)業(yè)機(jī)械學(xué)報,,2012,43(5):147-151.
[8] 謝元澄,,徐煥良,,謝莊.基于牛肉大理石花紋標(biāo)準(zhǔn)(BMS)圖像的紋理特征分析[J].中國農(nóng)業(yè)科學(xué),2010,,43(24):5121-5128.
[9] 張建勛,李濤,,孫權(quán),,等.豬眼肌B超圖像紋理特征提取與分類[J].重慶理工大學(xué)學(xué)報:自然科學(xué)版,2013(2):74-78.
[10] Guo Zhenhua,, Zhang Lei,, ZHANG D. A completed modeling of local binary pattern operator for texture classification[J]. IEEE Transactions on Image Processing, 2010,,19(6):1657-1663.
[11] Zhang Yi,, Han Jing, Yue Jiang,, et al. Weighted KPCA degree of homogeneity amended non-classical receptive field inhibition model for salient contour extraction in low-light-level image[J]. IEEE Transactions on Image Processing,, 2014,23(6): 2732-2743.
[12] CHOI J H,, SONG G Y,, LEE J W. Road identification in monocular color images using random forest and color correlogram[J]. International Journal of Automotive Technology, 2012,,13(6):941-948.
[13] 楊帆,,林琛,周綺鳳,,等.基于隨機(jī)森林的潛在k近鄰算法及其在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J].系統(tǒng)工程理論與實踐,,2012,32(4):815-825.
[14] 陳超,,李文藻.一種基于隨機(jī)森林與顏色特征的巖屑識別算法[J].四川大學(xué)學(xué)報(自然科學(xué)版),,2012,49(3):587-592.
[15] 曹正鳳.隨機(jī)森林算法優(yōu)化研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),,2014.