2 常用的人臉識別方法
Brunelli和 P oggiol6 認 為,,人臉識別技 術和方法可以分為兩大類 :基于幾何特征(G eom etric F ea-ture— based ) 的方 法 和 基 于 模 板 匹 配 (T em plateM atching— based)的方法. 基于幾何特征方法 的思想是首先檢測出嘴 巴,、 鼻子 、 眉毛 ,、 眼睛等臉部主要部件的位置和大小 ,然后利用這些部件 的總體幾何 分布關系以及相互之間的參數(shù) 比例來識別人臉. 基于模板的方法利用模板和整個人臉圖像 的像素值之間的自相關性 進行識 別 這類 方法也叫做基 于表 象(A ppearance— based )的方法. 雖然后來出現(xiàn)了很多新的人臉識別技術和方法 ,, 然 而這些技術和方法仍然可以按照 Brunell i和 P oggio 的方法分類,。
本文系統(tǒng)分析了現(xiàn)今常用的人臉識別方法,將人臉識別方法分為基于幾何特征的方法、 基于模 型的方法,、 基于統(tǒng)計的方法,、基于神經(jīng)網(wǎng)絡的方法和多分類器集成方法。
2.1 基 于幾 何特 征 的方法
文獻中記載最早 的人臉識別方法就是 Bledsoe提出的基于幾何特征的方法_7],, 該方法 以面部特征點之間的距離和比率作為特征 ,,通過最近鄰方法來識別人臉. 以該方法 建立 的人臉識別系統(tǒng)是一個半自動系統(tǒng),面部特征點必須由人手工定位,。也正是由于人工的參與,,該系統(tǒng)對光照變化和姿態(tài)變化不敏感。
K anade[8]首先計算眼角,、鼻孔,、 嘴巴,、 下巴等面部特征之間的距離和它們之間的角度 以及其它幾何關系, 然后通過這些幾何關系進行人臉的識別工作.在一個 2o 人的數(shù)據(jù)庫上識別率為 45% 一75%,。
Brunelli和 Poggio_6 通過計算鼻子的寬度和長度 ,、 嘴巴位置和下 巴形狀 等進行識別 , 在一個 47 人的人臉庫上的識別 率為 90% ,。然 而,, 簡單模板 匹配方法在同一人臉庫上的識別率為 100% 。
側影 (P rofile)識別 也是早期基于幾何特征人臉識別的一個重要方法 ,, 其基本原理是從人臉 的側影輪廓線上提取特征點 ,, 將側影轉化為輪廓曲線, 從中提取基準點 ,。 根據(jù) 這些點之 間的幾何特征來進行識別. 由于側影識別相對較簡單且應用面小,, 對側影識別 的研究較少。
基于幾何特征 的方法非常直觀 ,。 識別速度快 ,, 內(nèi)存要求較少 , 提取 的特征在一定程度上對光照變化不太敏感. 但是 ,, 當人臉具有一定 的表情或者姿態(tài)變化時 ,, 特征提取不精確 ,而且由于忽略了整個圖像 的很多細節(jié)信息 ,, 識別率較低 ,, 所以近年來 已經(jīng)很少有
新的發(fā)展。
2.2 基于模型的方法
隱馬 爾 可 夫 模 型 (H idden M arkov M odel,。H M M )是一種常用的模型,, 基于 H M M 的方法首先被用于聲音識 別等 身份識別 上 , 之后 被 N efian 和H ayes 引入到人臉識別領域 .它是用于描述信號統(tǒng)計特性的一組統(tǒng)計模型. H M M 用 馬爾可 夫鏈來模擬信號統(tǒng)計特性 的變化,, 而這種變化又是 問接通過觀察序列來描述 的,, 因此馬爾可夫過程是 一個 雙重的隨機過程. 在 H M M 中結點表示狀態(tài), 有 向邊表示狀態(tài)之間的轉移 ,, 一個狀態(tài)可 以具有特征空間
中的任意特征,, 對同一特征 , 不同形態(tài)表現(xiàn)出這一特征的概率不 同. 在人臉識 別過程 中,, N efian 首 先采用兩維離散余 弦變換 (D iscrete Cosine T ransform ,,D C T ) 抽取人臉特征 , 得到觀察 向量,, 構建 H M M 人臉模型 ,, 然后用 E M (E xpectati on M axi m i zati on )算法[n]i jl I練. 利用該模型就可以算 出每個待識別 人臉觀察向量的概率 , 從而完成識別. H M M 方法 的魯棒性較好 , 對表情,、 姿態(tài)變化不太敏感 ,, 識別率高。
主動形狀模型 (A ctive Shape M odel,,A SM )方法 由 Cootes 等人 提 出It2],, Cootes 對 形狀和局 部灰度表象建模 ,, 用建立 的 A SM 在新 的圖像 中定 位易變的物體. 后來,, L anitis 等將 其應用于解釋人臉 圖像 , 在使用 A SM 找出人臉 的形狀后 ,, 將人臉切割并
歸一到統(tǒng)一的框架 ,, 對這個 與形 狀無關 的人臉采用亮度模型來進行解釋和識別。
主動 表 象 模 型 (A ctive A ppearance M odel,,A A M )可以看成是對 A SM 的進 一步擴展l _1 lf 1],, 是一種通用的非線性 圖像 編碼模式 , 通過變形處理將通用人臉模型與輸 入圖像進行 匹配 ,, 并將控制參數(shù)作為分類的特征向量.
2.3 基于統(tǒng)計的方法
基于統(tǒng)計 的方法將人臉圖像 視為隨機 向量 ,, 從而用一些統(tǒng)計方法 來分析人臉模式 , 這類方法有著完備的統(tǒng)計學理論支持,; 得到了較好地發(fā)展 ,, 出現(xiàn)了一些較成功的算法.
特征臉 (E igenface)方法由 T urk 和 Pentland_1 5_提 出. 對于每一幅人臉圖像 , 按 照從上到下 ,、 從左到右 的順序將所有像素 的灰度值 串成一個高維 向量,,然 后 通過 主成分 分 析 (P rincipal C om ponent A naly—sis。 P C A )[ 將高維 向量降低維 數(shù). 用 PC A 降維主要基于以下三點 : (1)壓縮功能 ,。 在低維空間內(nèi) 比較圖像將提高計算效率 ,; (2)人臉樣本的分布近似正態(tài)分布。 方差大的維可能與有用信號相關,, 而方差小的維可能對應噪聲 ,, 因此去掉小方差對應 的維將有利于提高識 別精確率 ; (3)因為每 幅圖像都被 減去均值 ,, 且被放縮成單位向量 ,, 兩幅圖像之間的相關性與特征空間中投影之間的距離成反 比, 因此特征空間
中的最近鄰匹配是圖像相關性 的有效近似. PC A 技術首先 由 K irby 和 Sirovi ch 引 入 到 人 臉 識 別 領域 ,, 并且證明 了 PC A 是使 原始圖像 與重構 圖像之間的均方誤差極小化的最佳壓縮方式. 一 幅圖像在各個特征臉上 的投影組成 了該 圖像 的權值向量,,將待識別圖像的權值 向量與人臉數(shù)據(jù)庫 中各圖像的權值向量相 比較 , 確定哪一幅 圖像與待識別 圖像的
權值向量最接近.后來 Pentland 等人L1 ]進一步擴展了特征臉方法 將類似的思想運用到面部特征上 ,,分別得到了本征眼,、 本征鼻、 本征嘴,, 并且將 它們結合起來進行人臉識別.實驗結果表明,,這樣比單獨使用特征臉效果更好. 特征臉方法計算量低 ,,使用方便,并且效果 良好 ,目前已經(jīng)成為人臉識別的基準程序(Benchm ark)和事實上的工業(yè)標 準.但是它對于外界因素所帶來的圖像差異和人臉 自身所造成的差異是不加區(qū)分的,, 因此外界因素(例如光照,、 姿態(tài))變化會 引起識別率的降低.
特征臉方法使用由各個特征臉擴展的空間來表示人臉, 雖然可以有效地表示人臉信息,, 但是并不能有效鑒別和區(qū)分人臉. 很多研究 者提 出了使用其他線性空間來代替 特征臉空間 以取得 更好 的識別 效果. 此中線性判別分析 (L inear D iscrim inate A naly—sis,,L D A )方法(也叫 F isher臉方法) 9]利用了類別歸屬信息 ,它選擇類內(nèi)散 布正交 的矢量作為特征臉空間,, 從而壓制 了圖像之間與識別信息無關的差異,,強調(diào) 了不同人臉之間的差別 , 同時弱化 了同一人臉由于光照 ,、視角和表情而引起 的變化,, 獲得了比特征臉更好的識別效 果. L D A 是一種 監(jiān)督學 習方法 ,而PC A 是非 監(jiān)督學 習方法.Belhum eur_ _J 9J對 16 個人的各 10 幅圖像進行識別實驗 ,,PC A 方法 的識別率為 81%,,而 F isher臉方法的識別率為 99.4 %.
M oghaddam 等人提出貝葉斯人臉識別方法 .他們提出了一種基于概率的圖像相似度度量方法 , 將人臉圖像之間的差異分 為類問差異和類 內(nèi)差異 ,,其中類間差異表示不同對象之問的本質差異,,類內(nèi)差異為同- - x~象 的不 同圖像之 間的差異 ,而實際人臉圖像之 間的差異為兩者之和. 如果類 內(nèi)差異大于類問差異 ,, 則認 為兩人臉 圖像屬于同一對象的可能性大.他們提出了類 闖差異和類內(nèi)差異度量的概率模型和計算方法 由于貝葉斯相似度 的計算涉及復雜的非線性計算 ,, M oghaddam 等人提出了一種線性 的快速計算方法. 這種人臉識別方法在 1996 年美國 D A PA R 組織的 F ER ET 人臉測試Ⅲ中是效果最好的方法之一, 特別是在克服光照 和表情變化對識別的影響方面性能較好.
奇異值 分 解 (Singul ar V alue D ecom positi on ,,SV D ) 1 ]是一種有效 的代數(shù)特征提取方法. 奇異值特征具有 良好的穩(wěn)定性 ,、 轉置不變性 、 旋轉不變性 ,、位移不變性 以及鏡像變換 不變性等重要性質 ,, 因此奇異值分解技術也被應用到人臉識別領域.
獨立成分分析(Independent C om ponent A nal—ysi s, IC A )_ _2,。 可 以看成是 對 PC A 的推廣. P C A 利用二階矩去掉輸入數(shù)據(jù) 的相關性 ,, 使得數(shù)據(jù)的協(xié)方差為零, 而 IC A 使得輸入數(shù)據(jù)的二階和高階矩依賴性最 ?。?IC A 首先被 用 于盲源 分 離 (B lind SourceSeparation ,, B SS )問題 , 用來將 觀察信號分解 成一系列獨立信號的線性組合. IC A 用于人臉識別有兩種結構(I(2A A rchitecture I 和 IC A A rchitecture II)和多種算法 (例如 F astIC A 和 InfoM ax )口 ,,PC A和 IC A A rchitecture II 利用 的是全局特征 ,, 而 IC AA rchitecture I 利用的是空間局部特征. B D raper 等人_2 詳細比較了 PC A 和 IC A 在人臉驗證和面部表情識別 中的性能. 人臉驗證實驗 中, IC A A rchitec—ture II 的性能最好 , PC A 的性能與距離度量標準有關 ,, IC A A rchitecture I 的性能較差 ,, IC A 用 F astI—C A 算法較好 ; 表情識別實驗中,, 用 InfoM ax 算法實現(xiàn)的 IC A A rchi tecture I性能最好.
2.4 基于神經(jīng)網(wǎng)絡的方法
神經(jīng) 網(wǎng)絡在人臉識別領域有很長的應用歷史 ,,1994 年就出現(xiàn)了神經(jīng)網(wǎng)絡用于人臉處理的綜述性文章.
Kohonenc 最早將自組織映射(Self O rgani—zing Map,SOM )神經(jīng) 網(wǎng)絡用于人臉識別.他利用
SOM 的聯(lián)想能力“ 回憶” 人臉. 即使當輸入人臉圖像具有較大噪音干擾或者有部分 圖像丟失時,也能恢復出完整的人臉.
動態(tài)鏈接結構(D ynam ic L ink A rehitecture,DLA )是用于人臉識 別 的最有影 響的神經(jīng) 網(wǎng)絡方法.DIA 試圖解決傳統(tǒng)的神經(jīng)網(wǎng)絡中一些概念性問題,,其中最突出的是網(wǎng)絡中語法關系的表達.DIA 利用突觸的可塑性將神經(jīng)元集合劃分成若干圖結構,,同時保留了神 經(jīng)網(wǎng)絡的優(yōu)點.DLA 使 用G abor 小波來表示 圖像的特征.
Law rence和Giles 等人采用將 自組織映射神經(jīng)網(wǎng)絡(S()M )與卷積神經(jīng)網(wǎng)絡相結合 的混合 神經(jīng)網(wǎng)絡方法進行人臉識別.SO M 實現(xiàn)對 圖像的采樣向量降維 ,且對圖像樣本的小幅度變形不敏感 ,; 卷積網(wǎng)絡用來實現(xiàn)相鄰像素間的相關性知識 ,, 在一定程度對圖象的平移 ,、 旋轉 ,、 尺度和局部 變形不敏感. 在O R I 人臉 庫 8]上進 行仿 真實驗 ,與用 K arhunen —I. o6ve 變換代 替 S()M 或 者用 多層 感知 器 (M ulti—L ayer P erceptron ,,M I P )代替 卷積 神經(jīng) 網(wǎng)絡相 比,,該方法取得 了較低的錯誤率; 與特征臉方法相 比,,當待識別對象的訓練樣本數(shù)從 1 到 5 變化時,,該方法都取得了較好的識別性能。
I in 和 K ung_2 9l提出了一種基于概率決策的神經(jīng) 網(wǎng) 絡 (P robabilistic D eci si on— Based N eural N et—w ork,,PD B N N )人臉識別方法. 主要原理是采用虛擬樣本進行強化和反 強化學 習,, 從 而得到較理想的概率估計結果, 并且采用模塊 化的網(wǎng)絡結構加快網(wǎng)絡 的學 習.
用于人臉識別 的神經(jīng)網(wǎng)絡還有 : M L P 的一種變形——時滯 神 經(jīng) 網(wǎng) 絡 (T im e D elay N eural N et—w orks,, T D N N )Eao】 ,、 徑 向 基 函數(shù) 網(wǎng)絡 (R adial B asisF unction N etw ork , R B F N )[ ]. R icanek 等 人[駝 ]采用 的 H opfield 網(wǎng)絡 ,, 能有效地實現(xiàn)低 分辨率人臉 的聯(lián)想和識別.神經(jīng)網(wǎng)絡方法較其他人臉識別方法有著特有的優(yōu)勢,, 通過對神經(jīng) 網(wǎng)絡 的訓練可 以獲得其他方法難以實現(xiàn)的關于人臉圖像的規(guī) 則和特征 的隱性表示,避免了復雜的特征抽取工作 ,, 并有利于硬件的實現(xiàn).缺點主要在于其方法的可解 釋性較弱 ,且要求多張人臉圖像作為訓練集 ,, 只適合于小型人臉庫.
2. 5 多分類器集成方法
將多個學習系統(tǒng)(例如分類器)組合是 目前機器學習的熱門課題之一,,這種技術 已經(jīng)被廣泛運用到模式識別之 中. 當前人臉識別方法都只能在特定約束條件下取得較好的性能 ,然而在現(xiàn)實應用 中,,人臉的表象會因為光照方 向,、 姿態(tài) 、 表情變化而產(chǎn)生較大的變化, 每種特定 的識別器只對其中一部分變化 比較敏感 ,,因此,,將可以整合互補信息的多個分類器集成能夠提高整個系統(tǒng) 的分類準確率.
Gutta 等人口3]提出將集成的RBF與決策樹(D ecision T ree)結合起來進行人臉識別. 結合 了全局的模板匹配和離散特 征的優(yōu)點 ,在一個 350 人 的人臉庫上測試,,取得了較好的實驗結果.
H uang 等人 在多特征臉空間的基礎上 ,, 采用神經(jīng)網(wǎng)絡集成(N eural N etw ork Ensem ble)的方法,實現(xiàn) 了對多視角人臉 的識別. 首先將人臉深度方 向的偏轉角度人為的分為幾組 (多個視 角),,然后為每個視角訓練一個神經(jīng) 網(wǎng)絡 ,,最后對所 有視角對應的多個神經(jīng)網(wǎng)絡的輸出進行集成. 實驗表明, 該方法不必預先估計偏轉角度就可 以取得較好 的識別性能 ,,而且能實現(xiàn)人臉偏轉角度的自動判斷.
Lu等人I3朝通 過將 PC A ,、IC A 、L D A 進行集成進行人臉識別.首先分別用這三種方法對同一張人臉進行識別 ,每種方法的識別分為測試人臉 與數(shù)據(jù)庫中人臉的投影向量之間夾角的余 弦值 ,; 然后用簡單求和方式或 R BF 網(wǎng)絡對三個得分進行集成. 在一個包含有 206 個人 ,, 每人 1O 張照片的人臉庫上進行實驗 , 集成方法的識別性能最 好,簡單求和方式 比R BF 網(wǎng)絡集成方式性能略好.