文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2016.09.033
中文引用格式: 首照宇,,楊曉帆,李萌芽. 基于局部特征與核低秩表示的人臉識(shí)別算法[J].電子技術(shù)應(yīng)用,,2016,,42(9):126-128,132.
英文引用格式: Shou Zhaoyu,,Yang Xiaofan,,Li Mengya. Face recognition based on local feature and kernel low-rank representation[J].Application of Electronic Technique,2016,,42(9):126-128,,132.
0 引言
人臉識(shí)別一直是近年來(lái)計(jì)算機(jī)視覺(jué)領(lǐng)域中的重要研究方向,被用于門(mén)禁,、生物入侵,、安防等實(shí)際應(yīng)用環(huán)境中。然而,,人臉識(shí)別仍然是一個(gè)具有挑戰(zhàn)的問(wèn)題,,例如遮擋、偽裝,、光照變化等噪聲對(duì)人臉圖片的影響會(huì)導(dǎo)致后續(xù)識(shí)別效果下降,。從幾十年前至今,眾多學(xué)者在人臉識(shí)別技術(shù)的發(fā)展中對(duì)這些問(wèn)題進(jìn)行了研究,,提出了許多針對(duì)這些問(wèn)題的富有建設(shè)性的算法,。
原始的局部二值模式(Local Binary Patterns,,LBP)算法是由OJALA T等人提出的用于紋理分類(lèi)的方法[1],它是一個(gè)由局部像素比較獲得的二進(jìn)制序列,。AHONEN T等人將LBP用于人臉識(shí)別領(lǐng)域并將其改進(jìn)為對(duì)光照變化具有魯棒性的方法[2],。在文獻(xiàn)[3]中,LBP通常用來(lái)處理人臉識(shí)別中的光照問(wèn)題,。實(shí)驗(yàn)表明,,經(jīng)過(guò)LBP處理后的圖片比原始圖片在識(shí)別時(shí)具有更強(qiáng)的魯棒性。近年來(lái),,Liu Guangcan等人提出了低秩表示的算法[4](Low-Rank Representation,,LRR),該算法可以對(duì)子空間進(jìn)行分類(lèi),。LRR的目的是尋找一個(gè)字典中所有向量表示一個(gè)基于候選線性組合的最低秩表示,。基于局部特征對(duì)處理人臉圖片時(shí)的魯棒性和低秩表示分類(lèi)的框架,,結(jié)合近年來(lái)被廣泛用于克服提取特征和分類(lèi)時(shí)線性方法的極限的核方法,本文提出了一種基于局部特征與核低秩表示的人臉識(shí)別算法,。
1 相關(guān)知識(shí)
1.1 低秩表示
Liu Guangcan等人[4]提出了對(duì)子空間結(jié)構(gòu)進(jìn)行分析的低秩表示算法(LRR),,該方法也可以用于對(duì)線性子空間的數(shù)據(jù)進(jìn)行無(wú)監(jiān)督分類(lèi)。如果給定一個(gè)適當(dāng)?shù)淖值?,LRR可以學(xué)習(xí)到所有觀測(cè)向量通過(guò)字典原子的所有可能線性組合表示中的最低秩表示[5],。秩最小化的問(wèn)題可以通過(guò)下式求解:
其中X是一個(gè)測(cè)試數(shù)據(jù)矩陣,X的每一列是都一個(gè)測(cè)試對(duì)象,。A是一個(gè)字典,,Z是字典A對(duì)X的一個(gè)低秩表示。式(1)中求秩最小的問(wèn)題可以通過(guò)求核范數(shù)來(lái)代替,,則式(1)可改寫(xiě)為:
當(dāng)數(shù)據(jù)有噪聲干擾時(shí),,LRR的優(yōu)化模型定義如下:
其中A·Z是低秩部分,E是與X相關(guān)的誤差(或噪聲)部分,,||E||2,,1是適應(yīng)于不同遮擋模型的誤差項(xiàng),適用于小的高斯噪聲,,||E||1適用于隨機(jī)遮擋,,>0是低秩和誤差兩部分的平衡因子。已經(jīng)有許多學(xué)者提出了低秩恢復(fù)問(wèn)題的解法,,例如迭代閾值法[6],、加速近端梯度法[7]、增廣拉格朗日法[8](Augmented Lagrange Multiplier,,ALM),。其中ALM方法有著更快的速度和更高的準(zhǔn)確度,,本文采用ALM方法來(lái)處理低秩問(wèn)題。
1.2 核函數(shù)
核函數(shù)是一項(xiàng)眾所周知的應(yīng)用于機(jī)器學(xué)習(xí)中的技術(shù),,如SVM,、KPCA、KFDA算法[9]中都應(yīng)用了核函數(shù),。通過(guò)核函數(shù)可以將原始的特征空間通過(guò)非線性映射轉(zhuǎn)換到一個(gè)高維的核特征空間,,并且在高維空間將問(wèn)題轉(zhuǎn)換為線性問(wèn)題解決[10]。例如多項(xiàng)式核k(x,,y)=(〈x+y〉+c)d和高斯核k(x,,y)=exp(-γ||x-y||2)都是常見(jiàn)的核函數(shù),其中d和γ是核函數(shù)的參數(shù),。
2 基于局部特征與核低秩表示的人臉識(shí)別算法(LKLRR)
2.1 局部特征提取
LBP是用于描述局部紋理算子,,通過(guò)比較圍繞像素的計(jì)算值的特征表征的二進(jìn)制序列,然后將該序列轉(zhuǎn)化為十進(jìn)制數(shù)來(lái)表示該點(diǎn)的特征[1],。過(guò)多的二進(jìn)制模式會(huì)給計(jì)算帶來(lái)不便,,OJALA T采用了一種新的“等價(jià)模式”來(lái)解決這一問(wèn)題,同時(shí)該算法也提高了LBP的統(tǒng)計(jì)特性并對(duì)LBP算子的模式種類(lèi)進(jìn)行降維,。OJALA T的“等價(jià)模式”表示如下:當(dāng)從0→1或從1→0相應(yīng)的循環(huán)LBP二進(jìn)制數(shù)跳兩次時(shí),,對(duì)應(yīng)二進(jìn)制模式LBP被稱(chēng)為等價(jià)類(lèi)模式,另一種類(lèi)型便為混合模式,。改進(jìn)后的二進(jìn)制模式類(lèi)型降低的同時(shí)也不會(huì)使任何信息丟失,。這使得特征向量的維數(shù)更少,并能消弱高頻噪聲的滋擾,。
2.2 基于局部特征與核低秩表示
假設(shè)一個(gè)經(jīng)過(guò)LBP特征提取后的樣本通過(guò)一個(gè)非線性映射從原始的特征空間Rm映射到高維特征空間分別表示由所有訓(xùn)練樣本和測(cè)試樣本所組成的矩陣通過(guò)非線性映射?漬轉(zhuǎn)換到高維特征空間,,其中就是上述高維空間F。通過(guò)式(4)可以將測(cè)試樣本圖片在核特征空間F中通過(guò)訓(xùn)練樣本圖片線性表示,。
因此,,在核空間中的低秩表示問(wèn)題可以通過(guò)式(5)來(lái)表示:
其中Z為訓(xùn)練樣本矩陣在高維核特征空間對(duì)測(cè)試樣本矩陣最低秩表示。其中和都未知,,從而式(5)無(wú)法直接求解,。將樣本特征空間F中進(jìn)行降維處理,也就是樣本圖片從F空間映射到其低維子空間中,,假設(shè)P∈RD×d是F中的變換矩陣,,求解式(5)可通過(guò)式(6)來(lái)實(shí)現(xiàn):
其中映射矩陣P是與圖片相關(guān)的矩陣,通過(guò)應(yīng)用KPCA中的核降維方法,,映射矩陣中的向量是空間F中與圖片線性相關(guān)的向量,,表示如下式:
其中Pj為P∈[P1,P1,,…,,Pd]=RD×d中的第j個(gè)向量,,是與第j個(gè)變換向量相關(guān)的偽變換向量。令是偽變換矩陣,,則變換矩陣P可以通過(guò)下式表示:
將式(8)帶入式(6),,則有:
其中核矩陣和由相應(yīng)的核函數(shù)計(jì)算得出。對(duì)于樣本α和β,,則有其中k(:,,:)表示一個(gè)核函數(shù)。令,,則式(1)的約束表達(dá)式可以通過(guò)式(5)來(lái)代替,,則優(yōu)化問(wèn)題轉(zhuǎn)為下式:
考慮到噪聲對(duì)樣本的影響,將式(10)轉(zhuǎn)化為如下更加魯棒的優(yōu)化模型:
其中E表示高維空間中的相關(guān)誤差,。>0表示兩部分的平衡因子,。其中轉(zhuǎn)換矩陣通過(guò)應(yīng)用KPCA中降維獲得變換矩陣的方法計(jì)算得出,偽變換向量j可以通過(guò)求解特征值的方法計(jì)算:
將歸一化后的特征向量進(jìn)行排序,,選擇最大的前d個(gè)特征值j,,j=1,2,,3,,…d所對(duì)應(yīng)的特征向量則可獲得偽轉(zhuǎn)換矩陣祝。將其代入優(yōu)化后的模型,,則可通過(guò)求解低秩表示的問(wèn)題來(lái)進(jìn)行后續(xù)的分類(lèi)判別。
具體的算法步驟如下:
?。?)輸入:i類(lèi)訓(xùn)練樣本矩陣A∈Rm×n,,k個(gè)測(cè)試樣本矩陣B∈Rm×k;
?。?)分別對(duì)訓(xùn)練樣本和測(cè)試樣本進(jìn)行LBP特征提取后進(jìn)行核變換得到訓(xùn)練樣本的LBP核矩陣和測(cè)試樣本的LBP核矩陣,;
(3)將樣本通過(guò)映射函數(shù)進(jìn)行處理,,隨后獲得高維特征空間中的訓(xùn)練和測(cè)試樣本的特征矩陣,;
(4)通過(guò)特征值和特征向量的方法求解偽變換矩陣后對(duì)高維特征矩陣進(jìn)行降維,;
?。?)對(duì)降維后的測(cè)試和訓(xùn)練特征矩陣通過(guò)式(11)進(jìn)行低秩表示獲得系數(shù)矩陣Z;
?。?)通過(guò)下式計(jì)算每個(gè)樣本與每類(lèi)樣本之間的殘差:
其中l(wèi)=1,,2,…,,k,;j=1,,2,…,,i,。
(7)輸出:
3 實(shí)驗(yàn)結(jié)果及分析
本部分將本文提出的LKLRR與SRC,、CRC和LRR等算法分別在AR,、Extended YaleB、FERET等人臉庫(kù)進(jìn)行了光照,、表情及遮擋變化實(shí)驗(yàn)對(duì)比,。實(shí)驗(yàn)表明,本文提出的基于局部特征與核低秩表示的人臉識(shí)別算法的識(shí)別率比其他幾種方法的識(shí)別率要高,,而針對(duì)有遮擋和偽裝的人臉圖片提出的基于局部特征與核低秩表示的人臉識(shí)別算法的識(shí)別率也有更強(qiáng)的魯棒性和識(shí)別率,。
3.1 Extended Yale B數(shù)據(jù)庫(kù)光照變化
Extended Yale B人臉庫(kù)由38個(gè)人的2 414幅正面人臉組成,其中每人大約有64幅圖像,,來(lái)自64種實(shí)驗(yàn)光照條件,。圖1為該人臉庫(kù)中部分人臉圖片。本部分實(shí)驗(yàn)隨機(jī)地選擇每人32幅圖片作為訓(xùn)練樣本集,,其余的32幅人臉圖片作為測(cè)試樣本集,。每幅圖片都調(diào)整為96×84。表1給出了不同方法在該人臉庫(kù)中的識(shí)別率,。
由表1可以看出,,圖片進(jìn)行LBP特征提取后,通過(guò)低秩表示進(jìn)行分類(lèi)的方法對(duì)于人臉圖片的識(shí)別率增加,,增加了核函數(shù)的低秩表示,,表現(xiàn)出更加優(yōu)越的識(shí)別性能。
3.2 AR數(shù)據(jù)庫(kù)光照及表情變化
在AR人臉數(shù)據(jù)庫(kù)中選擇50名男性和50名女性構(gòu)成一個(gè)人臉數(shù)據(jù)庫(kù),,提取每人14幅人臉圖片,,包括人臉圖像的表情和光照變化,其中7幅作為訓(xùn)練樣本,,其余的作為測(cè)試集,。圖像尺寸統(tǒng)一調(diào)整為83×60。表2顯示多種算法在該人臉庫(kù)上的比較,。由表2可看出,,本文的算法相比其他算法識(shí)別率明顯提高。
3.3 FERET數(shù)據(jù)庫(kù)姿態(tài)偏轉(zhuǎn)
FERET數(shù)據(jù)庫(kù)中包含了200個(gè)人,,每人7幅總共1 400幅表情,、光照以及不同尺度下的姿態(tài)變化人臉圖片。圖2為實(shí)驗(yàn)中某個(gè)目標(biāo)的圖像,,從左到右分別為標(biāo)準(zhǔn),、表情變化,、光照變化、偏轉(zhuǎn)-25°,、偏轉(zhuǎn)-15°,、偏轉(zhuǎn)+15°、偏轉(zhuǎn)+25°的人臉圖像,。采用前3幅人臉圖片作為訓(xùn)練集,,其余4個(gè)偏轉(zhuǎn)角度不同的圖片分別作為4個(gè)測(cè)試集。所有的圖片均裁剪為80×80,。表3為FERET數(shù)據(jù)庫(kù)中姿態(tài)偏轉(zhuǎn)尺度不同的情況下多種算法的識(shí)別率比較,。表3可以明顯反映出提出的LKLRR算法相較于其他集中算法識(shí)別率有著顯著的優(yōu)勢(shì),尤其是在測(cè)試集姿態(tài)偏轉(zhuǎn)尺度較大時(shí)(+25°和-25°)明顯提高,。
3.4 偽裝實(shí)驗(yàn)
本部分采用了AR人臉庫(kù)進(jìn)行實(shí)驗(yàn),,其中每人選取7幅人臉圖片進(jìn)行訓(xùn)練,3幅墨鏡遮擋,、3幅圍巾遮擋的人臉圖片進(jìn)行測(cè)試,,同樣將每幅圖片的大小調(diào)整為83×60,表4是各個(gè)方法分別對(duì)于墨鏡遮擋和圍巾遮擋的人臉識(shí)別率比較,,從表中可以看出本文的方法對(duì)于偽裝的人臉圖像的識(shí)別率較其他方法有很大的提高,。
4 總結(jié)
針對(duì)人臉圖片的遮擋、偽裝,、光照及表情變化等問(wèn)題,,本文提出基于局部特征與核低秩表示的人臉識(shí)別算法。首先將樣本通過(guò)描述局部特征的LBP算子進(jìn)行特征提取,,加強(qiáng)了圖像的局部細(xì)節(jié)特征,。隨后將特征轉(zhuǎn)換到高維的特征空間后進(jìn)行核低秩表示來(lái)進(jìn)行后續(xù)的分類(lèi)識(shí)別。實(shí)驗(yàn)表明,,本文的LKLRR算法在處理遮擋、偽裝以及光照變化等問(wèn)題時(shí)的魯棒性更強(qiáng),,識(shí)別率更高,。
參考文獻(xiàn)
[1] OJALA T,HARWOOD I.A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition,,1996,,29(1):51-59.
[2] AHONEN T,HADID A,,PIETIK?魧INEN M.Face recognition with local binary patterns[C].Lecture Notes in Computer Science,,2004,3021:469-481.
[3] Yuan Xiaotong,,Liu Xiaobai,,Yan Shuicheng.Visual classification with multitask joint sparse representation[J].IEEETransactions on Image Processing A Publication of the IEEE Signal Processing Society,,2010,21(10):3493-3500.
[4] Liu Guangcan,,Lin Zhouchen,,Yan Shuicheng,et al.Robustrecovery of subspace structures by low-rank representation[J].IEEE Transactions on Software Engineering,,2012,,35(1):171-184.
[5] ZHANG Y,JIANG Z,,DAVIS L S.Learning Structured lowrank representations for image classification[C].Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,,2013:676-683.
[6] DAUBECHIES I,DEFRISE M,,MOL C D.An iterative thresholding algorithm for linear inverse problems with a sparsity constraint[J].Communications on Pure & Applied Mathematics,,2003,57(11):1413-1457.
[7] BECK A,,TEBOULLE M.A fast iterative shrinkage-thresh-olding algorithm for linear inverse problems[J].Siam Journal on Imaging Sciences,,2009,2(1):183-202.
[8] BERTSEKAS D P.Constrained optimization and Lagrangemultiplier methods[M].Athena Scientific,,1996.
[9] SMOLA A,,M?譈LLER K.Nonlinear component analysis as a kernel eigenvalue problem[C].Neu.Img.2006:1299-1319.
[10] KANG C,LIAO S,,XIANG S,,et al.Kernel sparse representation with local patterns for face recognition[C].ImageProcessing(ICIP),2011 18th IEEE International Conferenceon.IEEE,,2011:3009-3012.