文獻(xiàn)標(biāo)識(shí)碼:A
DOI: 10.19358/j.issn.2096-5133.2018.12.008
引用格式:王周璞,,何小海,吳小強(qiáng),,等.基于頻譜特性和自適應(yīng)蟲孔定位的小麥識(shí)別[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2018,37(12):35-38,43.
0 引言
小麥?zhǔn)俏覈?guó)三大糧食作物之一,,面積和產(chǎn)量均占全國(guó)糧食作物的1/4左右,小麥產(chǎn)量和小麥的質(zhì)量對(duì)穩(wěn)定國(guó)內(nèi)糧食供給,,保障糧食安全具有至關(guān)重要的作用,。小麥不完善粒主要是指受到損傷的顆粒。按照國(guó)標(biāo)規(guī)定,,小麥的不完善粒種類主要包括破碎粒,、生蟲粒、生病粒(赤霉病粒和黑胚粒)和發(fā)芽粒,。
對(duì)于不完善粒的檢測(cè),,目前國(guó)家糧食管控部門在收糧時(shí)采取的仍然是傳統(tǒng)的人工檢測(cè)方法,這種方法具有工作強(qiáng)度大,、對(duì)技術(shù)人員專業(yè)技能要求高,、人工檢測(cè)速度緩慢等不可忽視的缺點(diǎn)。近些年來(lái)國(guó)內(nèi)外專家也都不斷聚焦于這個(gè)領(lǐng)域的研究,,以期能實(shí)現(xiàn)小麥不完善粒檢測(cè)的自動(dòng)化,,如利用聲音科學(xué)來(lái)檢測(cè)的方法[1]、基于高光譜技術(shù)的檢測(cè)方法[2],、基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)模型的檢測(cè)方法[3],。雖然這些方法都能實(shí)現(xiàn)自動(dòng)化檢測(cè)的功能,但還是存在很多缺點(diǎn),。例如,,利用聲音科學(xué)的方法使用麥克風(fēng)來(lái)采集聲音,,非常容易受到環(huán)境音和噪聲的干擾;基于高光譜技術(shù)[4]的檢測(cè)方法圖像采集設(shè)備價(jià)格昂貴且不能實(shí)現(xiàn)多種不完善粒品種混合檢測(cè),;基于CNN模型的深度學(xué)習(xí)檢測(cè)方法所需樣本量大,,且識(shí)別時(shí)間長(zhǎng)。
目前,,傳統(tǒng)機(jī)器學(xué)習(xí)的方法被廣泛應(yīng)用于物體識(shí)別,、圖像分割、風(fēng)險(xiǎn)預(yù)估等關(guān)系國(guó)計(jì)民生的實(shí)際應(yīng)用中[5],。為了解決上述方法中存在的不足,,本文提出利用支持向量機(jī)(Support Vector Machine,SVM)分類器以及利用小麥自適應(yīng)蟲孔定位和頻譜特性來(lái)提取特征的識(shí)別方法。該方法能實(shí)現(xiàn)快速,、準(zhǔn)確地對(duì)小麥不完善粒分類,,并顯著提升小麥不完善粒的識(shí)別率。
1 識(shí)別方法
1.1 原料和識(shí)別方法
本研究使用的所有訓(xùn)練,、測(cè)試及建庫(kù)小麥均是由中儲(chǔ)糧成都儲(chǔ)藏研究院有限公司提供,。所有樣本的原始分類標(biāo)簽均是由中儲(chǔ)糧成都儲(chǔ)藏研究院有限公司的質(zhì)檢人員檢測(cè)確認(rèn),確保標(biāo)簽準(zhǔn)確,。本研究選擇使用掃描儀掃描錄入小麥圖像,,分為上、下兩個(gè)方向,,各類型小麥以互不粘連的隨機(jī)朝向置于掃描儀的載物板上,,圖片以BMP格式保存。掃描完成后,,進(jìn)行小麥的定位,、麥粒分割,、麥粒精分割,、特征提取、識(shí)別等步驟完成小麥識(shí)別和分類過(guò)程[6],。
1.2 自適應(yīng)蟲孔特征提取
在不完善粒識(shí)別方法的研究中,,識(shí)別率較低的類別之一就是蟲孔類不完善粒,因其存在蟲孔位置難以確定,、蟲孔與背景難以區(qū)分等問(wèn)題,。通過(guò)研究發(fā)現(xiàn),在最大類間方差法(Otsu)獲取最佳分割閾值的基礎(chǔ)上,,能夠較好地針對(duì)每幅小麥圖像自適應(yīng)定位蟲孔位置并提取蟲孔特征參數(shù)[7],。其流程圖如圖1所示。
自適應(yīng)蟲孔特征提取方法利用最大類間方差法針對(duì)分割后的單粒小麥圖像自適應(yīng)尋找最佳分割閾值,。其原理為:設(shè)有小麥圖像G(x,y),,大小為w×h,,小麥和背景色的分割閾值記作t,小于閾值t的像素值為目標(biāo)色,,其個(gè)數(shù)記作G0,,其加權(quán)平均灰度值為c0;大于閾值t的像素值為背景色,,其個(gè)數(shù)記作G1,其加權(quán)平均灰度值為c1,。首先,對(duì)每幅小麥圖像自適應(yīng)尋找最佳分割閾值,,可得下式:
式中,,b0為小于閾值t的像素值與整幅圖像的比例;b1為大于閾值t的像素值與整幅圖像的比例,;c為整幅圖像的平均灰度值,;迭代后得到的最大t值即所求最佳分割閾值。再使用閾值分割的方法,,將大于閾值的像素值置為255,,其余部分置為0。
從圖2的閾值分割圖中可以看出,,小麥圖片邊緣存在很多細(xì)小的凸起,,且在部分區(qū)域存在明顯的纖細(xì)連接。消除小物體后,,計(jì)算蟲孔面積作為特征參數(shù)讀入,。結(jié)果表明,這種方法能夠極大提升小麥蟲蝕粒的識(shí)別率,。
1.3 基于頻譜特性的特征提取
在不完善粒識(shí)別方法的研究中,,識(shí)別率較低類別中還有一類是發(fā)芽類不完善粒。這類小麥對(duì)小麥品質(zhì)有較大影響,。研究發(fā)現(xiàn),,發(fā)芽粒因其在小麥胚部形狀和灰度值過(guò)渡上與正常粒和破碎粒有較明顯區(qū)別,在頻域上此種區(qū)別表現(xiàn)得更為明顯,。如圖3所示,,圖(a)為發(fā)芽粒原始圖和發(fā)芽粒頻域圖,圖(b)為正常粒原始圖和正常粒頻域圖,??梢悦黠@地看到發(fā)芽粒的亮點(diǎn)和暗點(diǎn)分布有明顯的角度分布特性。
發(fā)芽粒分割圖如圖4(a)所示,,正常粒分割圖如圖4(b)所示,。
提取頻譜圖分別在0°、45°、90°,、135°方向的熵,、能量、對(duì)比度和逆差矩[8]的特征參數(shù),。
熵是圖像中所蘊(yùn)含信息的隨機(jī)性度量,。如圖5(b)所示,這里描述的熵值表示圖像白點(diǎn)分布的復(fù)雜性和規(guī)律性,。研究發(fā)現(xiàn),,發(fā)芽粒的熵值在各個(gè)方向上的數(shù)值均小于正常粒,這表明發(fā)芽粒在頻譜圖上是一種較規(guī)則,、白點(diǎn)數(shù)較少,、圖像較簡(jiǎn)單的分布。引入式(5)來(lái)定義熵值:
能量也是矩特征中的一個(gè)重要維度,。能量能夠定量地反映圖像中紋理的細(xì)致與否,,應(yīng)用到頻譜圖上,反映的則是頻譜圖白點(diǎn)分布的密集程度,。研究發(fā)現(xiàn),,發(fā)芽粒在各個(gè)方向上能量的數(shù)值均大于正常粒,這表明發(fā)芽粒在頻譜圖上是一種較均勻和較規(guī)則的紋理變化,。引入式(6)來(lái)定義能量值:
對(duì)比度用于度量矩陣值的分布,。該維度可以反映圖像的清晰度和凹槽的紋理。引入式(7)來(lái)定義對(duì)比度:
其中,, f(i,j)表示圖像中某一點(diǎn)處的灰度逆差矩,,在頻譜圖上可以反映圖像局部變化的劇烈程度。圖5(a)為方向標(biāo)示圖,;圖(b)中1,、2、3,、4分別為發(fā)芽粒等分為4個(gè)局部的圖像,;圖(c)中5、6,、7,、8分別為正常粒等分為4個(gè)局部的圖像,。在0°,、90°、135°三個(gè)方向上發(fā)芽粒的圖像變化大于正常粒,。
基于頻譜特性的特征和其他維度特征共同作用,,能極大提高發(fā)芽粒的識(shí)別率。
1.4 SVM模型
SVM分類思想本質(zhì)上與線性回歸LR分類方法相似。先使用一組訓(xùn)練集數(shù)據(jù)來(lái)訓(xùn)練SVM中的權(quán)重系數(shù),,然后對(duì)測(cè)試集進(jìn)行驗(yàn)證和分類,。
通過(guò)訓(xùn)練,可以得到一個(gè)分割超平面,。在樣本空間中,,可以使用以下等式來(lái)描述超平面的劃分:
wT+b=0 (8)
其中,w=(w1;w2;…;wd)為法向量,;b為位移項(xiàng),。樣本空間中任意點(diǎn)x到超平面(w,b)的距離可表示為:
(9)
兩個(gè)異類支持向量(support vector)到超平面的距離總和為:
(10)
稱為“間隔”。
得到具有“最大間隔”的劃分超平面,,即:
(11)
2 結(jié)果與分析
由于沒(méi)有公共的小麥圖像數(shù)據(jù)庫(kù),,本文建立了自己的數(shù)據(jù)庫(kù)。分別選出3 000粒正常粒小麥,、1 000粒破碎粒小麥,、1 000粒蟲蝕粒小麥、1 000粒病斑粒小麥,、1 000粒發(fā)芽粒小麥作為訓(xùn)練樣本,。使用SVM分類器,提取自適應(yīng)蟲孔特征,、基于頻譜特性的特征,、面積、周長(zhǎng),、RGB三分量,、HSV三分量、最小外接圓面積等共計(jì)89維特征,。
使用本文敘述的識(shí)別方案對(duì)80粒正常粒,、80粒破碎粒、80粒生蟲粒,、80粒生病粒,、80粒發(fā)芽粒分上下圖進(jìn)行判別,結(jié)果如表1所示,,得出5種不完善粒的平均識(shí)別率為96.90%,。由于特征重疊的影響,5類小麥都出現(xiàn)了一定程度的誤判現(xiàn)象,,但仍保持了較為不錯(cuò)的識(shí)別正確率,。考慮在實(shí)際糧食收購(gòu)中,,人們對(duì)于正常粒和異常粒的區(qū)分最為關(guān)注,,因此表1著重展示正常粒和異常粒混合的識(shí)別率。
對(duì)比表1和表2,,將本文提出的基于自適應(yīng)蟲孔和頻譜特性的小麥不完善粒識(shí)別方法與未使用本文提出特征的識(shí)別結(jié)果相比較,。可以得出,,對(duì)于生蟲粒,,識(shí)別率由82.50%提升至93.02%;對(duì)于發(fā)芽粒,,識(shí)別率由87.50%提升至96.25%,。
將本研究所使用的測(cè)試數(shù)據(jù)使用ANN、Adaboost和Radom trees分類器進(jìn)行識(shí)別,。使用原始測(cè)試集來(lái)驗(yàn)證每個(gè)模型的準(zhǔn)確性,,可以得到表3所示的結(jié)果。
對(duì)比表3和表1可以看出,,本文所采用的基于SVM的小麥不完善粒識(shí)別方法比經(jīng)典的Adaboost等方法識(shí)別率平均提高了20%左右,。
3 結(jié)論
基于自適應(yīng)蟲孔和頻譜特性的小麥識(shí)別方法對(duì)小麥提取包括基于自適應(yīng)的蟲孔特征、基于頻譜特性的特征,、以及面積,、周長(zhǎng)、RGB三分量,、HSV三分量,、最小外接圓面積等共計(jì)89維特征。在各維度特征的綜合作用下,,小麥不完善粒識(shí)別率得到了顯著提高,。本研究在SVM分類器的基礎(chǔ)上提出了針對(duì)正常粒、破碎粒,、生蟲粒,、生病粒、發(fā)芽粒的有效特征,,尤其是針對(duì)大部分算法無(wú)法精確分類的發(fā)芽粒和生蟲粒提出了更有效的特征,。本文所描述的識(shí)別方法具有模型訓(xùn)練時(shí)間短、對(duì)前端采集設(shè)備采集圖片質(zhì)量依賴低,、能批量化識(shí)別以及識(shí)別速度快等優(yōu)點(diǎn),,有利于小麥不完善粒的實(shí)際應(yīng)用場(chǎng)景檢測(cè)識(shí)別。
目前,,由于沒(méi)有公共的小麥圖像數(shù)據(jù)庫(kù),,因此本文構(gòu)建了數(shù)據(jù)庫(kù)。本文實(shí)驗(yàn)用小麥均是單一品種的白麥,。因此,,研究能廣泛適用于實(shí)際小麥?zhǔn)占Z現(xiàn)場(chǎng)的更有效的適合多品種小麥識(shí)別[9]的算法是下一階段需要解決的問(wèn)題。其次,,圖片的采集方案仍然是基于掃描的靜態(tài)方法,,人工布樣時(shí)間長(zhǎng)。因此,,對(duì)動(dòng)態(tài)實(shí)時(shí)采集的識(shí)別方案的研究也是下一階段需要解決的問(wèn)題,。最后,本文提出的特征提取方法需要采集89維特征參數(shù),,繼續(xù)研究特征降維[10]問(wèn)題也是需要進(jìn)一步關(guān)注的重點(diǎn),。
參考文獻(xiàn)
[1] 魏琳,王愛(ài)民,,楊紅衛(wèi).基于聲學(xué)原理的小麥蟲蝕粒檢測(cè)方法研究[J].農(nóng)機(jī)化研究,,2013(6):33-36.
[2] 于重重,周蘭,,王鑫,,等.基于CNN神經(jīng)網(wǎng)絡(luò)的小麥不完善粒高光譜檢測(cè)[J].食品科學(xué),2017,,38(24):283-287.
[3] 余樂(lè),,吳超,吳靜珠,等.結(jié)合高光譜與CNN的小麥不完善粒識(shí)別方法[J].電子測(cè)量與儀器學(xué)報(bào),,2017,,31(8):1297-1303.
[4] 吳靜珠,劉倩,,陳巖,等.基于近紅外與高光譜技術(shù)的小麥種子多指標(biāo)檢測(cè)方法[J].傳感器與微系統(tǒng),,2016,35(7):42-44.
[5] 張玉榮,,陳賽賽,,周顯青,等.基于圖像處理和神經(jīng)網(wǎng)絡(luò)的小麥不完善粒識(shí)別方法研究[J].糧油食品科技,,2014,,22(3):59-63.
[6] 陳豐農(nóng).基于機(jī)器視覺(jué)的小麥并肩雜與不完善粒動(dòng)態(tài)實(shí)時(shí)監(jiān)測(cè)研究[D].杭州:浙江大學(xué),2012.
[7] 徐苗苗.彩色紋理圖像特征提取與分類研究[D].廣州:華南理工大學(xué),,2016.
[8] PAWAR V N,TALBAR S N. Machine learning approach for object recognition[J].International Journal of Modeling & Optimization,2012,,2(5):622-628.
[9] PINTO A M, MOREIRA A P.Object recognition using laser range finder and machine learning techniques[J].Robotics and Computer Integrated Manufacturing,2013,29(1):12-22.
[10] KHALID S,KHALIL T, NASREEEN S. A survey of feature selection and feature extraction techniques in machine learning[C].Science and Information Conference (SAI),2014:372-378.
(收稿日期:2018-09-03)
作者簡(jiǎn)介:
王周璞(1993-),男,,碩士研究生,,主要研究方向:圖像處理與網(wǎng)絡(luò)通信。
何小海(1964-),,通信作者,,男,,教授,主要研究方向:圖像處理與網(wǎng)絡(luò)通信,。E-mail:[email protected],。
吳小強(qiáng)(1969-),男,,高級(jí)工程師,,主要研究方向:計(jì)算機(jī)應(yīng)用與模式識(shí)別。