摘 要: 針對手機等手持終端的客觀題自動閱卷系統(tǒng),提出了一種基于區(qū)域生長的表格定位算法,,該算法對表格外框的確定有較好的適應性,并且對表格外噪聲數(shù)據(jù)有較強的抗干擾能力,。測試表明,該算法提高了表格定位精度和閱卷準確率。
關鍵詞: 表格識別,; 模板匹配,; OpenCV; Android
傳統(tǒng)的人工閱卷方式往往花費大量的人力物力和時間,,效率低下,卻不能得到一個很好的效果,。因此,采用一種高效準確的閱卷方式顯得尤為重要,。參考文獻[1]提出了一種基于圖像識別的閱卷系統(tǒng),這種閱卷系統(tǒng)需要對現(xiàn)有的常用答題卷格式進行改造,,并且需要用掃描儀對學生的答題卷進行掃描,,這勢必會增加考試閱卷的復雜度。近年來,,帶有照相機功能的智能手機等移動終端快速增長且廣泛使用,,為高效地自動智能閱卷提供了很好的解決方案。
本文利用帶有照相機功能的智能手機設計實現(xiàn)自動閱卷,,教師只需將標準答案輸入Android智能手機中,,然后對學生答題卷進行拍照,如圖1所示,,通過手機閱卷軟件便可以輕松得到學生客觀題的考試成績,。這種閱卷方式可以降低人工評卷誤差,減少教師閱卷工作量,。
1 智能手機自動閱卷系統(tǒng)設計
各類考試的試卷中一般都會包括客觀題部分,,大多數(shù)考試答題卷的客觀題部分都是由表格設計構成的。本文重點介紹系統(tǒng)在Android平臺下識別表格圖像,,實現(xiàn)智能手機自動閱卷功能,,具體流程如圖2所示。
1.1 圖像采集
與掃描儀獲取圖像資源相比,,采用智能手機中的照相機獲取圖片的方式具有方便,、快捷、應用一體化等特點,。通過Android操作系統(tǒng)自帶的照相機進行圖像采集,,并將采集到的圖像存儲到SD卡中等待后臺應用程序進行處理。
1.2 圖像預處理
照相機獲取的圖片攜帶了顏色特征,,所以首先需要對圖像進行二值化操作,。除此之外,,為了取得更好的字符定位效果和字符識別精度,還需要對圖像進行傾斜校正等操作,。
1.2.1圖像二值化
由于文檔圖片的顏色特征比較單一,,因此本文采用參考文獻[2]提出的基于簡單閾值的Ridler和Calvard的聚類算法,取得了較好的二值化效果,。
1.2.2 圖像的傾斜校正
答題卷在被照相機拍照的過程中,,或多或少都會存在一定的傾斜。傾斜會給字符的分割和識別帶來很大的影響,所以處理表格圖像很關鍵的一步是圖像的傾斜校正,。
由參考文獻[3]可知,,傳統(tǒng)的校正方法可通過Hough變化求出水平線的角度后,采用仿射變換調節(jié)圖像的角度,。該方法因為采用了Hough變化,,需要耗費大量的時間。參考文獻[4]提出了一種基于縱坐標投影峰值的表格圖像傾斜調整算法,,通過計算峰值之間的距離來度量表格的傾斜度,。本文采用這種方法來進行傾斜矯正,該方法適用于帶有表格信息的二值圖像,,其算法計算量較小,,在實際中有一定的使用價值。
1.3 表格數(shù)據(jù)定位與拆分
往往一張答題卷分為多個部分,,而客觀題部分只是其中一個模塊,,所以表格數(shù)據(jù)定位拆分模塊主要負責表格邊框的定位,并且有效地對表格中的數(shù)據(jù)進行拆分,。
1.4 表格數(shù)據(jù)識別
答題卷的客觀題部分一般主要由答題序號(也就是印刷體數(shù)字)和答案(手寫體A,、B、C,、D)構成,。在進行數(shù)字和字符識別之前,通過參考文獻[4]提供的方法可以使每個字符邊緣沒有空白區(qū)域,,如圖3所示,。
1.4.1 手寫字符特征提取算法
字符特征提取的好壞直接影響著最終的識別效果。參考文獻[5]提供了一些字符的特征提取應遵循的規(guī)則,。參考文獻[6]提出了一種針對手寫數(shù)字適應性較強的模板法——13點特征提取法,,該方法具有實時、快速和準確等特點,,但是該方法遇到大小不一的圖片時就會難以識別,。在此基礎上,本文采用此方法歸一化的結果來提取特征以適用于手寫英文字符的識別。
1.4.2 手寫體字符的識別
本文采用模板匹配進行字符識別,,將標準的書寫方式作為模板錄入模板庫中,,利用圖像之間的最短距離作為判別函數(shù)。對于一個待測試的樣本X=(a1,a2,…,an)T,,計算X和訓練集中的某個樣本Xj(0<j<N, N為訓練集中樣本的個數(shù))之間的距離循環(huán)求出待測樣本和,。訓練集中各個已知樣本之間的距離為dj,比較所有的dj值,找出最小的d作為X所屬的訓練集類別,。
2.3 算法描述
本文針對橫線集和豎線集中包含非目標區(qū)域的表格線的問題以及橫線集與豎線集斷線的問題,,改進了表格框線檢測提取算法中的Hough變換算法和交叉點特征法[8],提出了一種基于區(qū)域生長的表格定位算法。算法具體流程如下,。
(1)對傾斜校正過后的圖像表格線進行檢測,,將檢測到的線條進行歸類,得到橫線集與豎線集,。設橫線集為U1,,豎線集為U2,通過與操作可以粗略得到交點集C,,而最終需要得到的表格線外區(qū)域由4點集B構成。同時假設C中包含孤立交點為e,。
(2)從C中選取4個相鄰交點作為R的起始節(jié)點或叫種子節(jié)點,,如圖5(a)所示,區(qū)域應盡量小,,且不包含其他交點,,并且a與d和b與c形成橫線關系,a與b和c與d形成豎線關系,。
(3)生長區(qū)域選定,,擴充區(qū)域R進行生長,這樣可以填充掉斷線區(qū)域,。選定閾值T,,將R區(qū)域向4個方向擴充T個像素,如圖5(b)所示(T的選擇應該適中,選擇過大,,會導致區(qū)域錯誤生長,;選擇過小,區(qū)域不能正常生長),。
(4)迭代橫線集U1與豎線集U2中的線段,,若線段L與生長區(qū)域相交,則R區(qū)域向線段L擴充直至L末端為止,,形成新的R區(qū)域,,返回步驟(3)進行新生長區(qū)域的選定;若不存在L與生長區(qū)域相交,則跳轉至步驟(5),。圖5(c),、圖5(d),、圖5(e)所示為表格生長區(qū)域的生長過程。
(3)由于算法假設中整個表格不可能出現(xiàn)完全斷裂(這里完全斷裂是指小模塊與表格其他線段的最小距離大于T),因此通過線段連通性可以證明區(qū)域多次擴展后,最后的生長區(qū)域R在包含所有的表格區(qū)域后停止生長,。
(4)由于假設中表格數(shù)據(jù)與表格外的數(shù)據(jù)之間存在一定的距離(假設距離大于T),,則最終的生長區(qū)域不包含表格外數(shù)據(jù)。
3 測試結果及分析
本文采用三星i9300作為測試平臺,,Android 4.0.4的系統(tǒng)版本,。本文采用OpenCV2(版本號為2.4.5)作為圖像處理的庫。
3.1 幾種常見定位算法的對比
對帶有表格外噪聲數(shù)據(jù)的考試試卷(如圖6所示)運用不同表格框線檢測算法進行表格數(shù)據(jù)定位,。分別通過Hough變換表格框線檢測算法[8],、交點特征提取算法[9]、由鄭秀清等人提出的一種改進的自動表格框線檢測算法[10]和本文提出的基于區(qū)域生長的表格定位算法得到的結果如圖7所示,。
Hough變換檢查直線算法輸入原始圖片后,,可以檢測到圖像中的所有直線。將這些直線中的橫線與豎線選擇出來,,可以構成檢測結果,,如圖7(a)所示。由結果可以看出,,Hough算法得到的線段除表格框線外,,還存在表格外的直線,利用算法得到的直線集很難區(qū)分出哪些是表格線,,哪些是非表格線,,因此很難對表格區(qū)域進行有效的定位。
交點特征提取算法將橫線與豎線的交點作為特征,,通過交點可以大體描繪出表格區(qū)域,。然而由于圖像采集中光線不均勻與圖像預處理的誤差,容易出現(xiàn)漏檢短框線的問題,,從而會直接影響到交點的檢測,,如圖7(b)中出現(xiàn)部分交點漏檢的情況。
鄭秀清等人提出的改進的自動表格框線檢測算法主要應用數(shù)學形態(tài)學來對表格框線進行處理,,對表格線進行了斷點補償,,很好地去除噪聲帶來的困擾,但是同樣不能過濾掉表格外的孤立交點,,如圖7(c)所示,。
通過區(qū)域定位算法則可以很好地進行斷線補償并且過濾掉表格區(qū)域以外的孤立交點,如圖7(d)所示,,采用該方法可以得到表格數(shù)據(jù)的交點集,,對表格數(shù)據(jù)進行有效的定位。
隨機選取20種常見的不同類型的表格型試卷,通過圖像采集得到80張圖片作為圖像庫,,分別用不同方法進行答題區(qū)域的分割,,結果如表1所示。對比結果表明,,基于區(qū)域生長的表格定位算法在圖片較清晰,、滿足算法假設條件的情況下有較高的定位準確率。
傳統(tǒng)的考試答題卷客觀題部分主要存在于表格中,,針對這種答題卷,,本文針對Android移動終端設計了一種高效易用的自動閱卷方案,包括圖像的采集,、預處理,、表格圖像的識別和字符識別等。針對表格圖像定位與手寫字符識別算法進行了優(yōu)化,,實驗結果表明,,該自動閱卷方案具有高效、簡單易用,、便于推廣的優(yōu)點,。
參考文獻
[1] 張站,劉政怡.基于圖像識別的閱卷系統(tǒng)的設計與實現(xiàn)[J]. 微型機與應用, 2011,30(4):44-47.
[2] RIDLER T W, CALVARD S. Picture thresholding using an iterative threshold selection method[J]. IEEE Transactions on Systems, Man and Cybernetics, 1978,8(8):630-632.
[3] 謝亮. 表格識別預處理技術與表格字符提取算法的研究[D].廣州:中山大學, 2005.
[4] 巨志勇, 鄭應平. 二值表格圖像傾斜校正算法[C]. 第一屆中國高校通信類院系學術研討會論文集, 2007.
[5] 許雁飛, 陳春玲, 陳夏梅. 基于 OpenCV 的脫機手寫字符識別技術[J]. 信息與電腦(理論版), 2011
(8):39.
[6] 鐘樂海, 胡偉. 手寫體數(shù)字識別系統(tǒng)中一種 新的特征提取方法[J]. 四川大學學報 (自然科學版), 2007(5):15.
[7] KIRYATI N, ELDAR Y, BRUCKSTEIN A M. A probabilistic Hough transform[J]. Pattern Recognition,1991, 24(4):303-316.
[8] ILLINGWORTH J, KITTLER J. A survey of the Hough transform[J].Computer Vision, Graphics,and Image Processing, 1988,44(1):87-116.
[9] WENYIN L, DORI D. From raster to vectors: extracting visual information from line drawings[J]. Pattern
Analysis & Applications, 1999,2(1):10-21.
[10] 鄭秀清,付茂名.一種改進的自動表格框線檢測方法[J].中國民航飛行學院學報, 2004,15(4): 30-32.