頊聰,,陶永鵬
(大連外國語大學(xué) 軟件學(xué)院,, 遼寧 大連 116044)
摘要:局部二值模式(LBP)算法是人臉識(shí)別領(lǐng)域中的經(jīng)典算法,能夠捕捉局部的細(xì)節(jié)特征,,但其魯棒性和識(shí)別率易受外部環(huán)境變化的影響。文章深入研究了LBP算法,,從LBP算子,、直方圖特征提取對(duì)傳統(tǒng)LBP算法進(jìn)行改進(jìn),并結(jié)合LIOP編碼方法,,進(jìn)一步提出了增強(qiáng)局部量化模式(ELQP)的人臉識(shí)別算法,。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的LBP算法具有更高的識(shí)別率和較強(qiáng)的魯棒性,。
關(guān)鍵詞:LBP 算子;圖像融合;人臉識(shí)別;特征提取
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.19358/j.issn.16747720.2016.23.005
引用格式:頊聰,,陶永鵬. 基于改進(jìn)的LBP人臉識(shí)別算法的研究[J].微型機(jī)與應(yīng)用,2016,35(23):18-20,27.
0引言
人臉識(shí)別,,特指利用分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù),。研究人臉識(shí)別重點(diǎn)在于對(duì)核心算法的研究,通過算法的改進(jìn)使識(shí)別結(jié)果具有實(shí)用化的識(shí)別率和識(shí)別速度。當(dāng)前人臉識(shí)別領(lǐng)域中,,主要有以下核心算法研究[1]:(1)通過積分方式進(jìn)行歐式距離表示,形成的基于幾何特征的算法,,例如MIT的Brunelli和Poggio科研團(tuán)隊(duì)。(2)利用模板匹配算法進(jìn)行人臉特征提?。ㄈ缑济?、眼睛輪廓的特征提取),,例如Harvard大學(xué)SmithKettlewell眼睛研究中心,。然而目前面臨的主要問題是外界環(huán)境的不斷變化對(duì)人臉識(shí)別產(chǎn)生了巨大影響,,加大了識(shí)別的難度。如何提出新算法或改進(jìn)原有的算法進(jìn)行有效的人臉特征提取是目前人臉識(shí)別技術(shù)研究的重點(diǎn),。
早期的研究提出了Eigenface方法[2],,主要是利用主成分分析(PCA)進(jìn)行人臉特征提取,形成特征臉,,因?yàn)槌醪教崛〉拿枋鋈四樛庠谧兓奶卣髂樉S度較高,,所以要進(jìn)行降維處理。在此基礎(chǔ)上進(jìn)一步提出了Fisherface[3]方法,,先應(yīng)用PCA對(duì)特征向量進(jìn)行降維,,然后使用線性判別分析(LDA)使特征的類內(nèi)差異減小并增大類間差異。但是這些基于全局特征的方法對(duì)于表情,、光照,、遮擋這些變化十分敏感,,于是基于局部特征的人臉?biāo)惴ㄖ饾u成為新的研究熱點(diǎn),。
1LBP的算法的改進(jìn)
1.1LBP理論
局部二值模式(LBP)算法是一種典型的基于局部特征的識(shí)別算法[4]。LBP局部二值模式是一種基于灰度值比較的局部紋理結(jié)構(gòu)表示方法,,與灰度特征相比表示能力更強(qiáng),。它對(duì)于邊緣、角點(diǎn)和平滑變化的圖像區(qū)域都能良好地表示出來,。對(duì)于任意圖像I來說,,LBP通過比較中心像素點(diǎn)和鄰域像素點(diǎn)的值來對(duì)圖像進(jìn)行重編碼,其定義如下:
其中φ(x)為閾值化函數(shù),,只有當(dāng)x的值大于等于0時(shí)函數(shù)值為1,,否則函數(shù)值為0;n代表LBP編碼總的鄰域點(diǎn)數(shù),;k表示第k個(gè)鄰域點(diǎn),;c代表中心像素點(diǎn)。
LBP算法計(jì)算方法簡單,,不涉及到復(fù)雜的運(yùn)算,,但是本身存在兩個(gè)缺陷:
第一,隨著LBP的鄰域點(diǎn)數(shù)量增加,LBP的主模數(shù)量會(huì)成指數(shù)形式增加,。
第二,LBP編碼雖然有一定的灰度不變性和旋轉(zhuǎn)不變性,,但是對(duì)姿態(tài)變化和光照變化等外界環(huán)境依然不夠魯棒。
1.2LBP算子的改進(jìn)
對(duì)于LBP算法的改進(jìn),,目的是克服原有算法的不足,,提高在復(fù)雜外界環(huán)境下人臉的識(shí)別率。
由于基于局部特征提取框架主要分為三個(gè)部分,,因此主要的改進(jìn)方向有:圖像濾波,、模式采樣,、模式編碼三個(gè)。
1.2.1圖像濾波上的改進(jìn)
在不同的光照環(huán)境下得到的人臉圖像存在顯著的差異,,為了消除這種差異需要對(duì)圖片進(jìn)行預(yù)處理,。具體來說就是對(duì)于圖像I使用濾波核w進(jìn)行濾波處理,得到圖像f(I),,然后對(duì)f(I)進(jìn)行LBP編碼,。增強(qiáng)圖像細(xì)節(jié)。
1.2.2模式采樣的改進(jìn)
LBP方法只使用了鄰域點(diǎn)與中心像素點(diǎn)的大小關(guān)系,,沒有利用上鄰域點(diǎn)之間的大小關(guān)系,,而且對(duì)于鄰域點(diǎn)之間的權(quán)重是相等的。因此如何利用鄰域點(diǎn)之間的大小關(guān)系進(jìn)行編碼是重點(diǎn)解決的關(guān)鍵技術(shù)問題,??紤]到局部序數(shù)模式算法可以對(duì)鄰域點(diǎn)按照一定的關(guān)系排序,因此本文采用該算法去改善模式的編碼,。
1.2.3模式編碼上的改進(jìn)
LBP編碼的主模數(shù)與鄰域點(diǎn)數(shù)之間存在指數(shù)關(guān)系,,然而為了增強(qiáng)判別能力不得不使用較大的鄰域點(diǎn)數(shù)。因此如何降低主模數(shù)量是重點(diǎn)解決的關(guān)鍵技術(shù)問題,。針對(duì)這個(gè)問題HUSSAIN S U提出了LQP,,通過使用離線K均值距離建立一個(gè)碼本,并將二進(jìn)制序列分成K個(gè)子類來編碼主模,。
1.3直方圖特征提取
改進(jìn)LBP算子后,,需要進(jìn)一步進(jìn)行直方圖下的特征提取。如圖1所示,。
?。?)直方圖特征度量
基于圖像分塊的直方圖特征提取是一種局部建模方法,計(jì)算得到空間直方圖對(duì)于表情,、飾物,、光照、姿態(tài)等的變化不敏感,。為了對(duì)直方圖特征進(jìn)行相似度比較,,因此需要使用一定的度量標(biāo)準(zhǔn)。對(duì)于圖片的直方圖特征表示來說,,傳統(tǒng)的歐氏距離度量不再適用于直方圖相似度的計(jì)算,,直方圖相交距離[5]可以有效表示其直方圖特征的類似狀況,因此本文加以采用,,并給出直方圖相交距離的數(shù)學(xué)定義:
?。?)直方圖權(quán)重度量方法
人臉不同的部位對(duì)于身份的辨別具有不同的重要性。不同的直方圖特征對(duì)應(yīng)的判別能力也不同,因此需要對(duì)不同的直方圖塊賦予不同的權(quán)重,。整體的直方圖特征就是由每一個(gè)區(qū)域的直方圖連接起來的,。為了體現(xiàn)不同直方圖塊在整體人臉的不同部位的重要性,需要進(jìn)行權(quán)重的分配,。而目前關(guān)于權(quán)重的設(shè)置并沒有一個(gè)很好的方案,,人工指定的方法過于復(fù)雜,對(duì)于各個(gè)區(qū)域權(quán)重的取值過于隨意,,取值全靠經(jīng)驗(yàn),。因此針對(duì)不同的直方圖特征對(duì)應(yīng)的判別能力的不同,本文改寫了上面直方圖相交的公式,,加入了權(quán)重后其直方圖相交距離為:就是第i塊直方圖對(duì)應(yīng)的權(quán)重值,。
(3)直方圖特征的降維方法
直方圖特征維數(shù)過高不利于后續(xù)的識(shí)別和實(shí)際應(yīng)用中實(shí)時(shí)計(jì)算的要求,,因此有必要對(duì)直方圖特征進(jìn)行降維處理,。本文利用特征降維法PCA[6],算法步驟為:①計(jì)算散布矩陣S,;②計(jì)算散布矩陣S的本征值和本征向量,;③按本征值的大小,從大到小對(duì)其對(duì)應(yīng)的本征向量進(jìn)行排序,;④選擇其中最大的d個(gè)本征值對(duì)應(yīng)的本征向量,,并將其作為投影向量,,構(gòu)成D×d投影矩陣W,。
測(cè)試結(jié)果如圖2所示。
圖2(a)是原始人臉圖像,,圖2(b)是采用分塊的 LBP圖像的空間增強(qiáng)直方圖算法進(jìn)行特征提取的人臉圖像,,圖2(c)是經(jīng)過 PCA 降維的特征圖像??梢钥闯鼋?jīng)過 PCA 降維的人臉的局部細(xì)節(jié)特征依然保留,,但數(shù)據(jù)量降低,說明經(jīng) PCA 降維的特征提取取得了良好的效果,。通過降維后人臉圖像特征矩陣識(shí)別將轉(zhuǎn)化為樣本分類的求解問題,,本文則通過構(gòu)建最小支持向量機(jī)來進(jìn)行分類。
2增強(qiáng)局部量化模式(ELQP)人臉識(shí)別算法
2.1概述
因LBP的鄰域編碼能力比較弱化,,依然影響最終人臉的識(shí)別,,所以本文在改進(jìn)LBP算法的基礎(chǔ)上進(jìn)行更進(jìn)一步的研究,提出增強(qiáng)局部量化模式(ELQP)的人臉識(shí)別算法,。
LIOP[7]是用鄰域序數(shù)關(guān)系代替LBP的鄰域編碼,,具有更強(qiáng)的判別能力,LQP是一種通過查表的方式對(duì)特征向量進(jìn)行編碼的方法,可以在不增加計(jì)算復(fù)雜度的情況下對(duì)更大的鄰域進(jìn)行采樣編碼,。因此結(jié)合LIOP和LQP的優(yōu)點(diǎn)提出了ELQP算法進(jìn)行人臉識(shí)別,。
2.2LIOP主模數(shù)指數(shù)級(jí)增加的解決
LIOP也會(huì)遇到隨著鄰域點(diǎn)數(shù)的增加,主模數(shù)呈指數(shù)級(jí)增加的問題,。應(yīng)用局部量化模式可以在一定程度上解決這個(gè)問題,。局部量化模式通過預(yù)先建立的查找表來對(duì)特征向量進(jìn)行量化編碼,設(shè)計(jì)分為訓(xùn)練和編碼兩個(gè)階段,。訓(xùn)練階段提取所有圖像的鄰域特征向量,,應(yīng)用K均值聚類算法得到一個(gè)碼本。編碼階段使用查表法將特征向量編碼成碼本中對(duì)應(yīng)的碼字,,從而獲得LQP編碼圖,。
2.3融合LIOP和LQP的特征提取方法
增強(qiáng)局部量化模式是融合LIOP與LQP的特征提取方法。如何進(jìn)行融合是問題處理的關(guān)鍵,。本文設(shè)計(jì)的ELQP編碼選用16個(gè)鄰域點(diǎn)構(gòu)成的鄰域向量計(jì)算離線碼本,。為了降低計(jì)算量,此處將圖像分成6×6的子塊,,分別為每一個(gè)子塊計(jì)算一個(gè)碼本,。鄰域點(diǎn)的定義如圖3所示。
2.4似度量與降維方法
所有圖像提取特征向量后都需要比較圖像之間的相似度,??紤]到識(shí)別過程的計(jì)算效率,針對(duì)直方圖特征一般使用直方圖相交度量來計(jì)算相似度,。如何定義兩個(gè)直方圖的特征向量并計(jì)算直方圖相交距離是重點(diǎn)解決的關(guān)鍵問題,。同時(shí)利用Fisher[8]進(jìn)行特征向量的權(quán)重的分配。對(duì)于降維處理本算法采用了WPCA[9]降維,。
3實(shí)驗(yàn)參數(shù)與結(jié)果
實(shí)驗(yàn)中的所有算法使用直方圖相交度量的結(jié)果如表1所示,。表2給出了各算法的特征提取時(shí)間和維數(shù)。
從表1的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),,本文方法的識(shí)別率在遮擋,、表情、年齡,、背景和距離5個(gè)測(cè)試集上的結(jié)果優(yōu)于與之對(duì)比的PCA,、LBP、Fisherface算法,。
表2的結(jié)果表明本文算法ELQP在高維度下提取時(shí)間用時(shí)很少,,效率高于PCA及Fisherface算法。這說明了本文算法的實(shí)用性較強(qiáng),。
4結(jié)論
人臉識(shí)別是一個(gè)具有巨大挑戰(zhàn)力的課題,,雖然近十幾年來得到了非常大的關(guān)注,,也取得了很多的研究成果,但是仍然沒有在本質(zhì)上有很大的突破,。本文通過分析局部二值模式(LBP)算法在人臉識(shí)別中的問題,,針對(duì)LBP算子在圖像濾波、模式采樣,、模式編碼三個(gè)方面進(jìn)行了改進(jìn),,以提高在多變環(huán)境下LBP算法的人臉識(shí)別率。在改進(jìn)的局部二值模式(LBP)算法基礎(chǔ)上,,本文針對(duì)LBP編碼時(shí)鄰域特征向量的關(guān)系進(jìn)行深入研究,,結(jié)合LIOP和LQP算法的優(yōu)點(diǎn),提出了增強(qiáng)局部量化模式(ELQP)算法,。并通過實(shí)驗(yàn)進(jìn)行了驗(yàn)證,,證明了本算法的優(yōu)越性。
參考文獻(xiàn)
?。?] 山世光.人臉識(shí)別中若干關(guān)鍵問題的研究[D]. 北京:中國科學(xué)院計(jì)算技術(shù)研究所,2004.
?。?] 張寶昌.人臉特征提取和非線性識(shí)別方法的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué), 2006.
[3] ZHAO W, CHELLAPPA R, PHILLIPS P J, et al.Face recognition: a literature survey[J].ACM computing surveys (CSUR), 2003, 35(4): 399-458.
?。?] 雷震.人臉識(shí)別關(guān)鍵問題和算法研究[D]. 北京:中國科學(xué)院計(jì)算技術(shù)研所,2010.
?。?] HARMAON L D, KHAN M K, LASCH R, et al. Machine identification of human faces[J]. Pattern Recognition, 1981, 13(2): 97-110.
[6] CHELLAPPA R, WILSON C L, SIROHEY S. Human and machine recognition of faces: a survey[J]. Proceedings of the IEEE, 1995, 83(5): 705-741.
?。?] PENTLAND A, MOGHADDAM B, STARNER T. Viewbased and modular eigenspaces for face recognition[C].Computer Vision and Pattern Recognition, 1994. Proceedings CVPR'94., 1994 IEEE Computer Society Conference on. IEEE, 1994: 84-91.
?。?] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[9] 謝術(shù)富.人臉識(shí)別中的局部表示方法研究[D].北京:中國科學(xué)院計(jì)算技術(shù)研究所,2010.