摘 要: 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征,再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識(shí)別,取得了較好的實(shí)驗(yàn)效果。
關(guān)鍵詞: 特征提取 神經(jīng)網(wǎng)絡(luò) 目標(biāo)識(shí)別
傳統(tǒng)的特征提取方法建立在目標(biāo)分割的基礎(chǔ)上,通過(guò)分割獲得目標(biāo)的形狀信息,并與已知的待識(shí)別目標(biāo)的形狀特征進(jìn)行比較,實(shí)現(xiàn)目標(biāo)分類(lèi)。目標(biāo)的形狀特征通常由一組參數(shù)來(lái)描述,如不變矩、Fourier描繪子、各線特征的起點(diǎn)和終點(diǎn)、各點(diǎn)特征(角點(diǎn)、形殊點(diǎn))的位置等。故傳統(tǒng)的特征提取方法可視作參數(shù)化方法。但由于目標(biāo)分割問(wèn)題自身的內(nèi)在復(fù)雜性,目前還不存在通用的、理想的目標(biāo)分割方法。近年來(lái),人們的注意力較多地集中于所謂的無(wú)分割(Segmentation Free)目標(biāo)識(shí)別,即利用目標(biāo)的灰度信息提取某些統(tǒng)計(jì)特征(如全局的或局部的灰度均值、灰度標(biāo)準(zhǔn)差等),構(gòu)成目標(biāo)的特征,并將其作為神經(jīng)網(wǎng)絡(luò)的輸入,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)即可用于目標(biāo)識(shí)別,這是一類(lèi)非參數(shù)化的特征提取技術(shù)。具體實(shí)現(xiàn)時(shí),可供采用的特征提取方法很多,簡(jiǎn)單的如進(jìn)行方向投影或提取方向邊緣特征等,復(fù)雜的如采用各種局部或全局變換等。本文重點(diǎn)研究了一種非參數(shù)化的特征提取方法——感興趣算子圖像特征提取方法。
1 感興趣算子特征提取方法
感興趣算子(Interest Operator)提取的是圖像在其水平、垂直和二個(gè)對(duì)角線方向上的灰度方差。圖1為感興趣算子特征提取示意圖。
例如對(duì)一幅大小為50×60象素的圖像采用上面的方法進(jìn)行特征提取,則選取的圖像子塊像素大小為5×5。因此可以將原圖像劃分成無(wú)重疊的120個(gè)子塊,然后針對(duì)每個(gè)圖像子塊提取圖像的感興趣特征向量。
2 模塊化的神經(jīng)網(wǎng)絡(luò)
模塊化神經(jīng)網(wǎng)絡(luò)由若干獨(dú)立訓(xùn)練的子網(wǎng)絡(luò)組成,每一子網(wǎng)絡(luò)分別針對(duì)訓(xùn)練樣本集的某一子集進(jìn)行分類(lèi)識(shí)別,通過(guò)組合各子網(wǎng)絡(luò)的分類(lèi)決策確定最終的識(shí)別結(jié)果。訓(xùn)練樣本集各子集的劃分采用了數(shù)據(jù)分組技術(shù),即將樣本根據(jù)一定的相似性準(zhǔn)則劃分為多組。如此分組后,各網(wǎng)絡(luò)僅需解決一個(gè)更為簡(jiǎn)單的分類(lèi)問(wèn)題,因此可提高分類(lèi)識(shí)別概率。
2.1 基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)
基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)按照某種規(guī)則將圖像特征分成幾個(gè)不同的特征組。每個(gè)特征組都用一個(gè)獨(dú)立的神經(jīng)網(wǎng)絡(luò)來(lái)訓(xùn)練識(shí)別,然后由一個(gè)融合網(wǎng)絡(luò)將各獨(dú)立神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果綜合得到最后的識(shí)別結(jié)果。這種算法的優(yōu)點(diǎn)是:通過(guò)分組,每個(gè)用于識(shí)別的神經(jīng)網(wǎng)絡(luò)只需要處理某一部分特征而不是全部,從而減少了單個(gè)網(wǎng)絡(luò)的自由參數(shù),降低了問(wèn)題的復(fù)雜度。
2.2 基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)
基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)框圖如圖2所示。
該算法的實(shí)現(xiàn)包括以下幾個(gè)步驟:
(1)將原始圖像按照某種規(guī)則分成若干圖像子塊,各個(gè)圖像子塊間可以有交叉也可以無(wú)交叉。圖3和圖4分別為有交叉和無(wú)交叉圖像分塊的示意圖。
(2)對(duì)每一個(gè)圖像子塊進(jìn)行特征提取,得到其相應(yīng)的圖像特征。本文選用了感興趣算子的特征提取方法。
(3)對(duì)步驟(2)經(jīng)過(guò)特征提取所得到的圖像特征向量進(jìn)行特征選擇,以去除特征向量間的冗余特征和選出具有更強(qiáng)分類(lèi)識(shí)別能力的特征,從而降低特征維數(shù),減小識(shí)別算法中神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模。
(4)對(duì)每幅子圖分別用一個(gè)單獨(dú)的BP網(wǎng)絡(luò)對(duì)其進(jìn)行訓(xùn)練或識(shí)別。
(5)將各個(gè)獨(dú)立BP網(wǎng)絡(luò)的輸出結(jié)果送到一個(gè)融合網(wǎng)絡(luò)中進(jìn)行融合從而得到最終判識(shí)結(jié)果。
基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)除了可以降低問(wèn)題的復(fù)雜性外,還具有一定的抗局部遮擋能力。由于一些人為的或非人為的因素,目標(biāo)圖像可能會(huì)受到局部遮擋的影響。由于局部遮擋本身的復(fù)雜性和其對(duì)目標(biāo)遮擋部位的不可預(yù)測(cè)性,使得抗遮擋成為一個(gè)相對(duì)困難的課題。基于圖像子塊的特征分組策略具有一定的抗局部遮擋能力。
設(shè)原圖像在長(zhǎng)度和寬度方向分別被等分為X和Y份,于是可以得到X×Y個(gè)子塊圖像。若局部遮擋處于第(i,j)個(gè)子塊上,則只有該子塊受到影響并導(dǎo)致與它對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行錯(cuò)誤判識(shí)的可能性增大。但是由于其他子塊及對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)的判識(shí)并未受到遮擋影響,因此至少可以得到X×Y-1個(gè)網(wǎng)絡(luò)的正確輸出。經(jīng)過(guò)融合網(wǎng)絡(luò),最終可以消除對(duì)第(i,j)個(gè)子塊圖像的錯(cuò)誤判識(shí)的影響而得到正確的識(shí)別結(jié)果,達(dá)到抗遮擋的效果。當(dāng)然,實(shí)際應(yīng)用中局部遮擋可能會(huì)存在于不止一個(gè)子塊圖像中,但只要這些子塊圖像的數(shù)量占總子塊圖像數(shù)的比重相對(duì)較小,這種特征分組神經(jīng)網(wǎng)絡(luò)識(shí)別策略就可以表現(xiàn)出很好的抗局部遮擋性能。
3 實(shí)驗(yàn)結(jié)果及其分析
實(shí)驗(yàn)中訓(xùn)練樣本取kh-11、kh-12、lacrosses三類(lèi)衛(wèi)星的三個(gè)譜段(CCD:可見(jiàn)光,MIDDLE:中波,LONG:長(zhǎng)波)圖像作為試驗(yàn)用的樣本。
(1)訓(xùn)練樣本:取每類(lèi)不同譜段的圖像001、005、009、L、057共15幅圖像。如果三個(gè)譜段的圖像一起訓(xùn)練,則訓(xùn)練樣本個(gè)數(shù)為15×9=135;如果只有單譜段圖像參加訓(xùn)練,則訓(xùn)練樣本個(gè)數(shù)為:15×3=45。
(2)識(shí)別樣本:取每類(lèi)不同譜段的圖像003、007、0011、L、059以及060、061、L、072總共30幅圖像。如果三個(gè)譜段的圖像一起識(shí)別,則識(shí)別樣本個(gè)數(shù)為30×9=270;如果只有單譜段圖像參加識(shí)別,則識(shí)別樣本個(gè)數(shù)為30×3=90。
表1給出了不同分辨率情況下的正確識(shí)別率。其中,All組實(shí)驗(yàn)表示對(duì)每類(lèi)三個(gè)譜段的衛(wèi)星圖像進(jìn)行實(shí)驗(yàn),CCD、MIDDLE和LONG組實(shí)驗(yàn)分別表示對(duì)可見(jiàn)光譜段、中波紅外圖像和長(zhǎng)波紅外圖像進(jìn)行實(shí)驗(yàn)。CCD為可見(jiàn)光圖像,MIDDLE為中波圖像,LONG為長(zhǎng)波圖像。
研究中還用最小距離分類(lèi)器對(duì)提取的不同目標(biāo)的參數(shù)化特征進(jìn)行了實(shí)驗(yàn),以便觀察其與神經(jīng)網(wǎng)絡(luò)方法的性能差異。在實(shí)驗(yàn)中,三類(lèi)目標(biāo)的圖片各為3×72=216幅,用奇數(shù)圖作為訓(xùn)練樣本,對(duì)偶數(shù)圖進(jìn)行識(shí)別。表2顯示了在三組不同分辨率下選擇不同特征集得到的識(shí)別結(jié)果。
從實(shí)驗(yàn)中可以發(fā)現(xiàn),常規(guī)分類(lèi)方法性能不穩(wěn)定,而且其識(shí)別率與神經(jīng)網(wǎng)絡(luò)方法相比要低很多。
參考文獻(xiàn)
1 Choi S M.A segmentation-free recognition of two touching
numerals using neural network.In:Proceedings of the Fifth
International Conference on Document Analysis and
Recognition,1999
2 Ozdil M A,Vural F T Y.Optical character recognition
without segmentation.In:Proceedings of the Fourth Inter-
national Conference on Document Analysis and Recogni-
tion,1997
3 Rocha J,Pavlidis T.Character recognition without segmen-
tation.IEEE Transactions on,Pattern Analysis and
Machine Intelligence,1995;17:903
4 Cai C,Shi Z.A modular neural network architecture with
approximation capability and its applications. The Second
IEEE International Conference on Cognitive Informatics,
2003
5 Wang L C,Der S Z,Nasrabadi N M.Automatic target
recognition using a feature-decomposition and data-
decomposition modular neural network.IEEE Transactions
on Image Processing,1998;7:1113