文獻(xiàn)標(biāo)識碼:A
DOI: 10.19358/j.issn.2096-5133.2018.12.008
引用格式:王周璞,,何小海,吳小強(qiáng),,等.基于頻譜特性和自適應(yīng)蟲孔定位的小麥識別[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2018,37(12):35-38,43.
0 引言
小麥?zhǔn)俏覈蠹Z食作物之一,,面積和產(chǎn)量均占全國糧食作物的1/4左右,小麥產(chǎn)量和小麥的質(zhì)量對穩(wěn)定國內(nèi)糧食供給,,保障糧食安全具有至關(guān)重要的作用,。小麥不完善粒主要是指受到損傷的顆粒。按照國標(biāo)規(guī)定,,小麥的不完善粒種類主要包括破碎粒,、生蟲粒、生病粒(赤霉病粒和黑胚粒)和發(fā)芽粒,。
對于不完善粒的檢測,,目前國家糧食管控部門在收糧時采取的仍然是傳統(tǒng)的人工檢測方法,這種方法具有工作強(qiáng)度大,、對技術(shù)人員專業(yè)技能要求高,、人工檢測速度緩慢等不可忽視的缺點(diǎn)。近些年來國內(nèi)外專家也都不斷聚焦于這個領(lǐng)域的研究,以期能實現(xiàn)小麥不完善粒檢測的自動化,,如利用聲音科學(xué)來檢測的方法[1],、基于高光譜技術(shù)的檢測方法[2]、基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)模型的檢測方法[3],。雖然這些方法都能實現(xiàn)自動化檢測的功能,,但還是存在很多缺點(diǎn)。例如,,利用聲音科學(xué)的方法使用麥克風(fēng)來采集聲音,,非常容易受到環(huán)境音和噪聲的干擾;基于高光譜技術(shù)[4]的檢測方法圖像采集設(shè)備價格昂貴且不能實現(xiàn)多種不完善粒品種混合檢測,;基于CNN模型的深度學(xué)習(xí)檢測方法所需樣本量大,,且識別時間長。
目前,,傳統(tǒng)機(jī)器學(xué)習(xí)的方法被廣泛應(yīng)用于物體識別,、圖像分割、風(fēng)險預(yù)估等關(guān)系國計民生的實際應(yīng)用中[5],。為了解決上述方法中存在的不足,,本文提出利用支持向量機(jī)(Support Vector Machine,SVM)分類器以及利用小麥自適應(yīng)蟲孔定位和頻譜特性來提取特征的識別方法,。該方法能實現(xiàn)快速,、準(zhǔn)確地對小麥不完善粒分類,并顯著提升小麥不完善粒的識別率,。
1 識別方法
1.1 原料和識別方法
本研究使用的所有訓(xùn)練,、測試及建庫小麥均是由中儲糧成都儲藏研究院有限公司提供。所有樣本的原始分類標(biāo)簽均是由中儲糧成都儲藏研究院有限公司的質(zhì)檢人員檢測確認(rèn),,確保標(biāo)簽準(zhǔn)確,。本研究選擇使用掃描儀掃描錄入小麥圖像,分為上,、下兩個方向,,各類型小麥以互不粘連的隨機(jī)朝向置于掃描儀的載物板上,圖片以BMP格式保存,。掃描完成后,,進(jìn)行小麥的定位、麥粒分割,、麥粒精分割,、特征提取、識別等步驟完成小麥識別和分類過程[6],。
1.2 自適應(yīng)蟲孔特征提取
在不完善粒識別方法的研究中,,識別率較低的類別之一就是蟲孔類不完善粒,因其存在蟲孔位置難以確定、蟲孔與背景難以區(qū)分等問題,。通過研究發(fā)現(xiàn),,在最大類間方差法(Otsu)獲取最佳分割閾值的基礎(chǔ)上,能夠較好地針對每幅小麥圖像自適應(yīng)定位蟲孔位置并提取蟲孔特征參數(shù)[7],。其流程圖如圖1所示,。
自適應(yīng)蟲孔特征提取方法利用最大類間方差法針對分割后的單粒小麥圖像自適應(yīng)尋找最佳分割閾值。其原理為:設(shè)有小麥圖像G(x,y),,大小為w×h,,小麥和背景色的分割閾值記作t,小于閾值t的像素值為目標(biāo)色,,其個數(shù)記作G0,,其加權(quán)平均灰度值為c0;大于閾值t的像素值為背景色,,其個數(shù)記作G1,其加權(quán)平均灰度值為c1,。首先,對每幅小麥圖像自適應(yīng)尋找最佳分割閾值,,可得下式:
式中,,b0為小于閾值t的像素值與整幅圖像的比例;b1為大于閾值t的像素值與整幅圖像的比例,;c為整幅圖像的平均灰度值,;迭代后得到的最大t值即所求最佳分割閾值。再使用閾值分割的方法,,將大于閾值的像素值置為255,,其余部分置為0。
從圖2的閾值分割圖中可以看出,,小麥圖片邊緣存在很多細(xì)小的凸起,,且在部分區(qū)域存在明顯的纖細(xì)連接。消除小物體后,,計算蟲孔面積作為特征參數(shù)讀入,。結(jié)果表明,這種方法能夠極大提升小麥蟲蝕粒的識別率,。
1.3 基于頻譜特性的特征提取
在不完善粒識別方法的研究中,,識別率較低類別中還有一類是發(fā)芽類不完善粒。這類小麥對小麥品質(zhì)有較大影響,。研究發(fā)現(xiàn),,發(fā)芽粒因其在小麥胚部形狀和灰度值過渡上與正常粒和破碎粒有較明顯區(qū)別,在頻域上此種區(qū)別表現(xiàn)得更為明顯,。如圖3所示,,圖(a)為發(fā)芽粒原始圖和發(fā)芽粒頻域圖,,圖(b)為正常粒原始圖和正常粒頻域圖??梢悦黠@地看到發(fā)芽粒的亮點(diǎn)和暗點(diǎn)分布有明顯的角度分布特性,。
發(fā)芽粒分割圖如圖4(a)所示,正常粒分割圖如圖4(b)所示,。
提取頻譜圖分別在0°,、45°、90°,、135°方向的熵,、能量、對比度和逆差矩[8]的特征參數(shù),。
熵是圖像中所蘊(yùn)含信息的隨機(jī)性度量,。如圖5(b)所示,這里描述的熵值表示圖像白點(diǎn)分布的復(fù)雜性和規(guī)律性,。研究發(fā)現(xiàn),,發(fā)芽粒的熵值在各個方向上的數(shù)值均小于正常粒,這表明發(fā)芽粒在頻譜圖上是一種較規(guī)則,、白點(diǎn)數(shù)較少,、圖像較簡單的分布。引入式(5)來定義熵值:
能量也是矩特征中的一個重要維度,。能量能夠定量地反映圖像中紋理的細(xì)致與否,,應(yīng)用到頻譜圖上,反映的則是頻譜圖白點(diǎn)分布的密集程度,。研究發(fā)現(xiàn),,發(fā)芽粒在各個方向上能量的數(shù)值均大于正常粒,這表明發(fā)芽粒在頻譜圖上是一種較均勻和較規(guī)則的紋理變化,。引入式(6)來定義能量值:
對比度用于度量矩陣值的分布。該維度可以反映圖像的清晰度和凹槽的紋理,。引入式(7)來定義對比度:
其中,, f(i,j)表示圖像中某一點(diǎn)處的灰度逆差矩,在頻譜圖上可以反映圖像局部變化的劇烈程度,。圖5(a)為方向標(biāo)示圖,;圖(b)中1、2,、3,、4分別為發(fā)芽粒等分為4個局部的圖像;圖(c)中5,、6,、7,、8分別為正常粒等分為4個局部的圖像。在0°,、90°,、135°三個方向上發(fā)芽粒的圖像變化大于正常粒。
基于頻譜特性的特征和其他維度特征共同作用,,能極大提高發(fā)芽粒的識別率,。
1.4 SVM模型
SVM分類思想本質(zhì)上與線性回歸LR分類方法相似。先使用一組訓(xùn)練集數(shù)據(jù)來訓(xùn)練SVM中的權(quán)重系數(shù),,然后對測試集進(jìn)行驗證和分類,。
通過訓(xùn)練,可以得到一個分割超平面,。在樣本空間中,,可以使用以下等式來描述超平面的劃分:
wT+b=0 (8)
其中,w=(w1;w2;…;wd)為法向量,;b為位移項,。樣本空間中任意點(diǎn)x到超平面(w,b)的距離可表示為:
(9)
兩個異類支持向量(support vector)到超平面的距離總和為:
(10)
稱為“間隔”。
得到具有“最大間隔”的劃分超平面,,即:
(11)
2 結(jié)果與分析
由于沒有公共的小麥圖像數(shù)據(jù)庫,,本文建立了自己的數(shù)據(jù)庫。分別選出3 000粒正常粒小麥,、1 000粒破碎粒小麥,、1 000粒蟲蝕粒小麥、1 000粒病斑粒小麥,、1 000粒發(fā)芽粒小麥作為訓(xùn)練樣本,。使用SVM分類器,提取自適應(yīng)蟲孔特征,、基于頻譜特性的特征,、面積、周長,、RGB三分量,、HSV三分量、最小外接圓面積等共計89維特征,。
使用本文敘述的識別方案對80粒正常粒,、80粒破碎粒、80粒生蟲粒,、80粒生病粒,、80粒發(fā)芽粒分上下圖進(jìn)行判別,結(jié)果如表1所示,,得出5種不完善粒的平均識別率為96.90%,。由于特征重疊的影響,,5類小麥都出現(xiàn)了一定程度的誤判現(xiàn)象,但仍保持了較為不錯的識別正確率,??紤]在實際糧食收購中,人們對于正常粒和異常粒的區(qū)分最為關(guān)注,,因此表1著重展示正常粒和異常?;旌系淖R別率。
對比表1和表2,,將本文提出的基于自適應(yīng)蟲孔和頻譜特性的小麥不完善粒識別方法與未使用本文提出特征的識別結(jié)果相比較,。可以得出,,對于生蟲粒,,識別率由82.50%提升至93.02%;對于發(fā)芽粒,,識別率由87.50%提升至96.25%,。
將本研究所使用的測試數(shù)據(jù)使用ANN、Adaboost和Radom trees分類器進(jìn)行識別,。使用原始測試集來驗證每個模型的準(zhǔn)確性,,可以得到表3所示的結(jié)果。
對比表3和表1可以看出,,本文所采用的基于SVM的小麥不完善粒識別方法比經(jīng)典的Adaboost等方法識別率平均提高了20%左右,。
3 結(jié)論
基于自適應(yīng)蟲孔和頻譜特性的小麥識別方法對小麥提取包括基于自適應(yīng)的蟲孔特征、基于頻譜特性的特征,、以及面積,、周長、RGB三分量,、HSV三分量,、最小外接圓面積等共計89維特征。在各維度特征的綜合作用下,,小麥不完善粒識別率得到了顯著提高,。本研究在SVM分類器的基礎(chǔ)上提出了針對正常粒、破碎粒,、生蟲粒、生病粒,、發(fā)芽粒的有效特征,,尤其是針對大部分算法無法精確分類的發(fā)芽粒和生蟲粒提出了更有效的特征。本文所描述的識別方法具有模型訓(xùn)練時間短,、對前端采集設(shè)備采集圖片質(zhì)量依賴低,、能批量化識別以及識別速度快等優(yōu)點(diǎn),,有利于小麥不完善粒的實際應(yīng)用場景檢測識別。
目前,,由于沒有公共的小麥圖像數(shù)據(jù)庫,,因此本文構(gòu)建了數(shù)據(jù)庫。本文實驗用小麥均是單一品種的白麥,。因此,,研究能廣泛適用于實際小麥?zhǔn)占Z現(xiàn)場的更有效的適合多品種小麥識別[9]的算法是下一階段需要解決的問題。其次,,圖片的采集方案仍然是基于掃描的靜態(tài)方法,,人工布樣時間長。因此,,對動態(tài)實時采集的識別方案的研究也是下一階段需要解決的問題,。最后,本文提出的特征提取方法需要采集89維特征參數(shù),,繼續(xù)研究特征降維[10]問題也是需要進(jìn)一步關(guān)注的重點(diǎn),。
參考文獻(xiàn)
[1] 魏琳,王愛民,,楊紅衛(wèi).基于聲學(xué)原理的小麥蟲蝕粒檢測方法研究[J].農(nóng)機(jī)化研究,,2013(6):33-36.
[2] 于重重,周蘭,,王鑫,,等.基于CNN神經(jīng)網(wǎng)絡(luò)的小麥不完善粒高光譜檢測[J].食品科學(xué),2017,,38(24):283-287.
[3] 余樂,,吳超,吳靜珠,等.結(jié)合高光譜與CNN的小麥不完善粒識別方法[J].電子測量與儀器學(xué)報,,2017,,31(8):1297-1303.
[4] 吳靜珠,劉倩,,陳巖,等.基于近紅外與高光譜技術(shù)的小麥種子多指標(biāo)檢測方法[J].傳感器與微系統(tǒng),,2016,35(7):42-44.
[5] 張玉榮,,陳賽賽,,周顯青,等.基于圖像處理和神經(jīng)網(wǎng)絡(luò)的小麥不完善粒識別方法研究[J].糧油食品科技,,2014,,22(3):59-63.
[6] 陳豐農(nóng).基于機(jī)器視覺的小麥并肩雜與不完善粒動態(tài)實時監(jiān)測研究[D].杭州:浙江大學(xué),2012.
[7] 徐苗苗.彩色紋理圖像特征提取與分類研究[D].廣州:華南理工大學(xué),,2016.
[8] PAWAR V N,TALBAR S N. Machine learning approach for object recognition[J].International Journal of Modeling & Optimization,2012,,2(5):622-628.
[9] PINTO A M, MOREIRA A P.Object recognition using laser range finder and machine learning techniques[J].Robotics and Computer Integrated Manufacturing,2013,29(1):12-22.
[10] KHALID S,KHALIL T, NASREEEN S. A survey of feature selection and feature extraction techniques in machine learning[C].Science and Information Conference (SAI),2014:372-378.
(收稿日期:2018-09-03)
作者簡介:
王周璞(1993-),,男,碩士研究生,,主要研究方向:圖像處理與網(wǎng)絡(luò)通信,。
何小海(1964-),通信作者,,男,,教授,主要研究方向:圖像處理與網(wǎng)絡(luò)通信,。E-mail:[email protected],。
吳小強(qiáng)(1969-),男,,高級工程師,,主要研究方向:計算機(jī)應(yīng)用與模式識別。