《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于Hough變換的手寫體維文字符傾斜校正算法
基于Hough變換的手寫體維文字符傾斜校正算法
來源:微型機(jī)與應(yīng)用2013年第8期
姜 文,, 盧朝陽,, 李 靜
(西安電子科技大學(xué) 通信工程學(xué)院,, 陜西 西安710071)
摘要: 由于手寫體維文字符的特點(diǎn)以及個人書寫風(fēng)格不同,,會造成維文字符的傾斜,,影響字符的特征提取和識別,。提出了一種基于Hough變換的手寫體維文雙線傾斜校正算法,。實(shí)驗(yàn)結(jié)果表明,,該算法能夠準(zhǔn)確、快速地檢測出傾斜手寫體維文字符的傾斜角度,,實(shí)現(xiàn)字符的傾斜校正,。
關(guān)鍵詞: 維文字符 Hough變換 傾斜校正
Abstract:
Key words :

摘  要: 由于手寫體維文字符的特點(diǎn)以及個人書寫風(fēng)格不同,,會造成維文字符的傾斜,影響字符的特征提取和識別,。提出了一種基于Hough變換的手寫體維文雙線傾斜校正算法,。實(shí)驗(yàn)結(jié)果表明,該算法能夠準(zhǔn)確,、快速地檢測出傾斜手寫體維文字符的傾斜角度,,實(shí)現(xiàn)字符的傾斜校正。
關(guān)鍵詞: 維文字符,; Hough變換,; 傾斜校正

    近年來,隨著科技的發(fā)展,,手機(jī)的應(yīng)用范圍越來越廣泛,,這就給手機(jī)終端上的手寫輸入以及手寫識別提供了很大的發(fā)展空間。目前,,國內(nèi)手機(jī)上的中文手寫輸入技術(shù)發(fā)展很迅速,國外關(guān)于英文,、阿拉伯文等文字的手機(jī)終端手寫輸入技術(shù)已經(jīng)發(fā)展得比較成熟了。我國新疆地區(qū)的少數(shù)民族文字——維吾爾族文字與阿拉伯文非常相似,,可以借鑒阿拉伯文手機(jī)終端的手寫輸入技術(shù),。不同的人有不同的書寫風(fēng)格,造成手寫體維吾爾文有很大的隨意性,;而且受手機(jī)屏幕大小的限制,,導(dǎo)致手機(jī)終端上手寫的維文字符會產(chǎn)生一定的傾斜度。進(jìn)行聯(lián)機(jī)和脫機(jī)維文字符的特征提取和識別[1]之前都需要對手寫體維文字符進(jìn)行傾斜校正,。
    目前,,比較常用的傾斜檢測方法有基于Hough變換的方法[2]、基于交叉相關(guān)性的方法,、行間距跨度相關(guān)法[3],、基于Fourier變換的方法[3]、基于投影的方法[3]和K-最近鄰簇的方法等,。
    本文基于Hough變換檢測字符傾斜角度,利用Hough變換對灰度化之后的傾斜字符提取字符的基線,根據(jù)基線并結(jié)合維文字符的書寫特點(diǎn),利用旋轉(zhuǎn)變換對手寫體維文字符進(jìn)行傾斜校正,。
1 手寫體維文字符的特征
1.1 手寫體維文字符的特征

     手寫體維文字符具有如下獨(dú)特的特征[4]。
   (1)維吾爾文由32個基本字符組成,,其中包括8個原音字符和24個輔音字符,。
   (2)根據(jù)每一個字符出現(xiàn)的位置不同(詞首、詞中,、詞末等),,通常可以分為獨(dú)立,、前連,、前后連和后連4種書寫形式,,因此,維文字符有120多種書寫形式,。
     (3)維文字符書寫時筆畫連續(xù)流暢,,根據(jù)從右向左的方向書寫,主體筆劃方向特征明顯,。
   (4)維文字符的筆劃較少,,許多字符的主體筆劃相同,僅僅根據(jù)不同的附加筆劃來區(qū)分,,附加部分與字符主體上,、下不粘連。一般地,,主體筆劃是沿著基線書寫的,,而附加筆劃在基線的上方或下方分布,所以基線可以作為區(qū)分附加筆畫位置的參考線,。
1.2 維文字符的分類
    維文字符的120多種形式是以32個基本字符為基礎(chǔ)的,,是根據(jù)字符處于詞的不同位置而變換出來的。對32個基本字符按照基線進(jìn)行分類,其中基線為垂直線的有9個,基線為水平線的有22個, 其他1個,。
2 基于Hough的傾斜檢測算法
2.1 Hough變換原理

 Hough變換的原理[2,4]是:利用圖像空間和Hough參數(shù)空間的點(diǎn)-線對偶性,, 將圖像空間的檢測問題轉(zhuǎn)換到參數(shù)空間。通過在參數(shù)空間里進(jìn)行簡單的累加統(tǒng)計,,再根據(jù)概率最大原理得到圖像空間的一些特性,,最后將數(shù)據(jù)映射回圖像空間。Hough變換檢測受干擾的影響較小,,是一種快速的直線檢測方法,。在實(shí)際應(yīng)用中,通常圖像平面上的一個點(diǎn)就對應(yīng)到參數(shù)r-θ平面上的一條曲線上,。如圖1所示,,直線與原點(diǎn)的法線距離為r,法線與x軸的夾角為θ,,直線上的每個點(diǎn)都滿足:

2.2 手寫體維文字符雙線傾斜檢測算法
    Hough變換在檢測過程中抗干擾性好,它利用圖像空間目標(biāo)像素的坐標(biāo)去計算參數(shù)空間中參考點(diǎn)的可能軌跡,,是一種很好的直線提取方法。
2.2.1 維文字符預(yù)處理
    進(jìn)行Hough變化之前還需要對字符圖像進(jìn)行預(yù)處理,,包括灰度化和細(xì)化兩個過程,。
    (1)對字符圖像進(jìn)行灰度化。將24色位圖格式的傾斜維文字符圖像轉(zhuǎn)換成256色的灰度圖像,,并進(jìn)行去噪處理。
 (2)通過細(xì)化,,對字符圖像進(jìn)行骨架提取,。

2.3 維文字符的傾斜校正
    根據(jù)檢測出的傾斜角度α和β,,對維文字符進(jìn)行旋轉(zhuǎn)變換,實(shí)現(xiàn)字符的傾斜校正,。
3 實(shí)驗(yàn)結(jié)果與分析
    實(shí)驗(yàn)利用Visual Studio 2008為平臺編寫程序來實(shí)現(xiàn)基于Hough變換的維文字符的傾斜校正,。大多數(shù)手寫體字符的傾斜校正角度在[-45°,45°]之間,,少數(shù)手寫體字符的傾斜校正角度超出這個范圍,。以水平基線或者垂直基線為軸進(jìn)行校正,校正結(jié)果與印刷體原圖的對比如圖3,、圖4所示,。

    一些字符使用基于水平或者垂直基線進(jìn)行校正之后,仍不能得到理想的效果,。為了解決這一特殊情況,,根據(jù)雙線檢測提取出兩個傾斜角度,可采用角平分線法,,即將Hough變換檢測到的兩條直線的角平分線作為基線進(jìn)行傾斜校正,。利用角平分線法進(jìn)行校正的結(jié)果如圖5、圖6所示,。

    可以看出,,與單純使用水平基線或垂直基線作為旋轉(zhuǎn)軸相比,使用角平分線法對傾斜維文字符進(jìn)行校正,傾斜度有了明顯的改善。
    對480幅傾斜手寫體圖像進(jìn)行字符校正,結(jié)果如表2和表3所示,,其中表3根據(jù)基線的檢測次序分類,,表3根據(jù)基線的方向分類。

    本文根據(jù)維文字符的書寫特點(diǎn)和字符基線位置的不同對字符進(jìn)行分類,;對經(jīng)過預(yù)處理的維文手寫體字符采用基于Hough變換的雙線傾斜校正算法提取傾斜角度,。用該算法校正了480幅不同的手寫體維文字符,得到了滿意的效果,。國內(nèi)外均有文獻(xiàn)研究手寫體數(shù)字的傾斜校正[5],,本文算法也可用于手寫體數(shù)字的傾斜校正。此外,,該算法也可用于處于傾斜狀態(tài)的印刷體維文字符和印刷體數(shù)字的傾斜校正,。
參考文獻(xiàn)
[1] 任宏宇,袁保社,,田園. 基于BP神經(jīng)網(wǎng)絡(luò)的維吾爾聯(lián)機(jī)手寫字符識別[J]. 微電子學(xué)與計算機(jī),,2010,27(8):238-241.
[2] MAHMOUD A, SHATNAWI A,OMAR K. Skew detection and correction technique for arabic document images based  on centre of gravity[J]. Journal of Computer Science,2009,21(3):363-368.
[3] 李政,楊揚(yáng),頡斌,等. 一種基于Hough變換的文檔圖像傾斜糾正方法[J].計算機(jī)應(yīng)用,2005,25(3):583-585.
[4] 萬芳.聯(lián)機(jī)手寫維吾爾文字識別技術(shù)的研究與實(shí)現(xiàn)[D].烏魯木齊:新疆大學(xué),,2007.
[5] 王有偉,劉捷. 手寫體數(shù)字識別中的一種新的傾斜校正的方法[J].計算機(jī)工程,,2004,30(11):128-130.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。