摘 要: 當(dāng)前基于神經(jīng)網(wǎng)絡(luò)方法的車牌字符識別技術(shù)都使用固定的訓(xùn)練樣本,,學(xué)習(xí)的效果受初始樣本限制,,對于識別過程中新出現(xiàn)的不同角度,、光線等特征的字符圖片不能自適應(yīng)地學(xué)習(xí),。本文針對這個問題提出了基于在線序列極限學(xué)習(xí)機(OS-ELM)的車牌字符識別方法,。在樣本實時更新中使系統(tǒng)自適應(yīng)調(diào)整網(wǎng)絡(luò)權(quán)值,不斷提高識別準(zhǔn)確率,。本文設(shè)計了漢字,、字母、字母混合數(shù)字三個字符分類器,,根據(jù)車牌字符的排列特征識別相應(yīng)的字符,。通過與傳統(tǒng)ELM方法和BP神經(jīng)網(wǎng)絡(luò)法對比,結(jié)果證明該字符識別技術(shù)達到了較高的識別率,,在訓(xùn)練速度上也比BP神經(jīng)網(wǎng)絡(luò)法提高了2~3個數(shù)量級,。
關(guān)鍵詞: 車牌字符識別;極速學(xué)習(xí)機,;在線序列,;特征提取
0 引言
車牌識別是智能交通系統(tǒng)(Intelligent Transportation System,ITS)的重要組成部分,。在交通擁堵,、停車場管理和套牌檢測等眾多領(lǐng)域得到了廣泛的應(yīng)用。在車牌識別系統(tǒng)中字符識別是核心與難點,,目前字符識別方法主要有模板匹配法,、神經(jīng)網(wǎng)絡(luò)技術(shù),以及兩者的聯(lián)合應(yīng)用,。
中國大陸車牌字符中含一位漢字且漢字結(jié)構(gòu)復(fù)雜,,識別困難,出錯率高,,模板匹配法對于相似的字符區(qū)分能力差,,同時受光線和天氣等復(fù)雜情況的影響,在特征數(shù)據(jù)維數(shù)過大時效率較低,。神經(jīng)網(wǎng)絡(luò)技術(shù)以BP(Back Propagation)算法居多[1-2],。BP神經(jīng)網(wǎng)絡(luò)具有良好的自學(xué)習(xí)性和存儲知識的能力,但網(wǎng)絡(luò)的訓(xùn)練速度慢,,存在局部最優(yōu)解等問題,。因而基于該方法的車牌字符識別只能離線訓(xùn)練樣本,測試精度也較依賴于初始樣本的全面性,。
Huang等[3-5]提出了極限學(xué)習(xí)機(Extreme Learning Machine,,ELM),設(shè)置合適的隱藏層節(jié)點數(shù),,為輸入權(quán)值和隱藏層偏差隨機賦值,,輸出層權(quán)值通過最小二乘法得到,整個過程一次完成,,無需迭代,,與BP神經(jīng)網(wǎng)絡(luò)相比學(xué)習(xí)速度顯著提高,于是出現(xiàn)了一些基于ELM及其改進算法的車牌識別方法,。Gou Chao等[6]利用ELM算法構(gòu)建分類器,,設(shè)計了完整的車牌識別系統(tǒng),,取得了較好的分類性能。但是所采用的訓(xùn)練樣本始終是初始樣本集,,對于車牌識別,,初始訓(xùn)練樣本包含全部拍攝角度的車牌字符圖片是比較困難的,所以ELM算法對于新出現(xiàn)的字符樣本沒有學(xué)習(xí)能力,,限制了網(wǎng)絡(luò)的魯棒性和泛化能力,。因此有必要尋找一種算法,可以將就近識別的樣本加入訓(xùn)練集,,做到實時訓(xùn)練,。
本文設(shè)計了基于在線序列極限學(xué)習(xí)機[7](Online Sequential Extreme Learning Machine,OS-ELM)的車牌識別分類器,,能夠在小樣本數(shù)量的基礎(chǔ)上,,實時訓(xùn)練,自適應(yīng)調(diào)整網(wǎng)絡(luò)參數(shù),,可快速地獲得高識別率,。并提出一種新的適合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特征提取方式,以降低提取特征的維度,,滿足車牌識別準(zhǔn)確性,、魯棒性和實時性要求。
1 車牌字符的特征提取
本文主要采用字符的網(wǎng)格特征和圖像矩陣行列信息作為待識別的字符特征,。由于漢字字符筆劃錯綜復(fù)雜且分布不均,,而字母和數(shù)字字符相對比較簡單,容易提取特征值,,因而在提取特征方法的具體實施上兩者有所差別,,以便后續(xù)投入不同的分類器。
對漢字的特征提取具體步驟為:
?。?)網(wǎng)格特征提取,。將歸一化后的漢字字符(大小為32×16)平均劃分成4×4大小相等的子區(qū)域,計算每個子區(qū)域中白色像素值數(shù)量,,產(chǎn)生32個網(wǎng)格特征,。
(2)行列特征信息提取,。從漢字圖像第一行開始,,提取第一行中白色像素點的個數(shù),之后將每隔兩行的下一行定為目標(biāo)行,,逐一統(tǒng)計目標(biāo)行中的白點數(shù),。用同樣方法對圖像矩陣列進行操作。至此,提取出17個行列特征信息值,。漢字“浙”的字符特征提取過程示例如圖1,。
對于英文字母字符和數(shù)字字符的特征提取,也是采用網(wǎng)格特征結(jié)合行列特征的提取方法,。但是由于字母,、數(shù)字結(jié)構(gòu)簡單,,為便于訓(xùn)練,,提取較小維數(shù)的向量作為特征向量。本文提取了16個網(wǎng)格特征和9個行列信息特征共25維特征向量,。
2 車牌字符分類器的設(shè)計
本文根據(jù)車牌字符的排列特點構(gòu)造了三個基于OS-ELM的子網(wǎng)絡(luò)分類器,,分別為漢字字符分類器、字母字符分類器以及字母/數(shù)字混合字符分類器,,一方面降低了識別時間,,另一方面也提高了識別精度。三種分類器如圖2所示,。
分類器配置方面,,提取的特征向量維數(shù)即輸入節(jié)點數(shù)目。訓(xùn)練樣本中漢字字符有14種,,分別為魯,、京、浙,、豫,、粵、陜,、遼,、蘇、吉,、瓊,、滬、桂,、冀,、閩;車牌中沒有O和I兩個字母,,所以字母有24種,,字母加數(shù)字有34種。三種分類器配置如表1,。
3 OS-ELM車牌字符識別算法設(shè)計
傳統(tǒng)的極限學(xué)習(xí)機只能學(xué)習(xí)不變的數(shù)據(jù),,而如果初期訓(xùn)練樣本不能包含全部角度的字符圖片,則新字符圖片由于具有不同角度,以及受遮擋,、污跡等影響特殊特征會難以識別,,故而限制了網(wǎng)絡(luò)的泛化能力。部分特殊特征的字符圖片如圖3所示,。
所以本文采用OS-ELM算法,,將后繼車牌樣本分批加入訓(xùn)練,增強網(wǎng)絡(luò)的泛化能力,,構(gòu)建基于在線序列極限學(xué)習(xí)的車牌識別方法,。網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖4。以漢字分類器設(shè)計為例,,將提取400張漢字字符圖片特征數(shù)據(jù)均分為4批先后輸入網(wǎng)絡(luò),,學(xué)習(xí)過程如下:
(1)初始化階段,。取k=0,,其中k為送到網(wǎng)絡(luò)的字符數(shù)據(jù)批次。給定激活函數(shù),,隱層節(jié)點數(shù)目L和初始訓(xùn)練數(shù)據(jù),,其中xi為輸入特征向量,ti為每個特征向量對應(yīng)的字符類別,,N0=100,,L由交叉驗證法試驗后取為40。隨機產(chǎn)生輸入權(quán)值向量ωj和偏置bj初始化網(wǎng)絡(luò),,則由參考文獻[6],,輸出權(quán)值向量?茁(0)=P0H0TT0。其中:
?。?)在線學(xué)習(xí)階段,。給定第k+1批數(shù)據(jù),計算出隱層輸出矩陣為Hk+1,,輸出權(quán)值向量為:
令k=k+1,,返回到在線學(xué)習(xí)階段,不斷更新參數(shù)H和β,,直到學(xué)習(xí)完4批數(shù)據(jù),。
4 實驗結(jié)果及分析
實驗中選取了100幅實際的車牌圖片。用三個OS-ELM分類器進行整體的識別,。隱藏層節(jié)點數(shù)目本文用5折交叉驗證法選擇最優(yōu)數(shù)目,。識別速度取50次測試結(jié)果的平均值。識別結(jié)果如表2所示,。
本文還將OS-ELM法與已有的ELM法,、BP神經(jīng)網(wǎng)絡(luò)的車牌字符識別方法進行了實驗結(jié)果的比較,。具體比較為:從大量準(zhǔn)確分割出的單個字符中選取100張包含字母及數(shù)字的字符圖像作為對比測試樣本,100張作為ELM法和BP神經(jīng)網(wǎng)絡(luò)法的訓(xùn)練樣本,,同時作為OS-ELM訓(xùn)練樣本的第一批輸入樣本,,再選取200張字符圖片分別作為ELM法的第二、第三批訓(xùn)練樣本,。測試結(jié)果如表3所示,,其中識別結(jié)果采取50次識別結(jié)果的平均值。
從表2,、表3的實驗對比結(jié)果可以看出,,BP神經(jīng)網(wǎng)絡(luò)算法由于本身繁瑣的迭代過程,因而訓(xùn)練耗費時間很長,。OS-ELM法相比于BP神經(jīng)網(wǎng)絡(luò)法不僅在字符的識別率上表現(xiàn)出了更令人滿意的效果,,能達到90%以上,,而且在識別速度上更是體現(xiàn)出很大的優(yōu)越性,,訓(xùn)練速度比BP法高出近200倍。與ELM法相比,,識別速度相差不多,,但有更好的泛化性能。
5 結(jié)束語
本文采用在線序列學(xué)習(xí)機算法對車牌字符進行識別,,與BP法相比訓(xùn)練時間短,,能夠滿足在線訓(xùn)練的要求;與ELM法相比有更好的泛化能力,。采用字符的網(wǎng)格特征和圖像矩陣行列信息提取的特征提取方法,,降低了特征維數(shù)。針對車牌字符的排列特征,,設(shè)計了漢字,、字母、字母與數(shù)字三個分類器,,能夠提高分類準(zhǔn)確率并且縮短運算時間,。該車牌字符識別技術(shù)可以應(yīng)用于道路監(jiān)控中對實時性要求較高的場合。
參考文獻
[1] KOVAL V,, TURCHENKO V,, KOCHAN V. Smart license pattern recognition system based on imaging processing using neural network[C]. Procedings of the Second IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing System-technology and Applications. Lviv, Ukraine: IEEE press,,2003:123-127.
[2] 劉雄飛,,朱盛春.車牌字符多特征提取與BP神經(jīng)網(wǎng)絡(luò)的識別算法[J].計算機仿真,2014,,31(10):161-164.
[3] HUANG G B,, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006,,70(1):489-501.
[4] HUANG G B,, WANG D H, LAN Y. Extreme learning machines: a survey[J]. Intelligent Journal of Machine Learning and Cybernetics,, 2011,,2(2):107-122.
[5] HUANG G B, ZHOU H M,, DING X J,, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on System, Man,, and Cybernetics,, 2012,42(2):513-529.
[6] Gou Chao,, Wang Kunfeng,, Yu Zhongdong. License plate recognition using MSER and HOG based on ELM[C]. IEEE Service Operation and Logistics, and Informatics,,2014:217-221.
[7] Liang Nanying,, Huang Guangbin, SARATCHANDRAN P,, et al. A fast and accurate online sequential learning algorithm for feedforward networks[J]. IEEE Transactions on Neural Networks,, 2006,17(6):1411-1423.