《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 結(jié)合結(jié)構(gòu)約束的人臉跟蹤算法研究
結(jié)合結(jié)構(gòu)約束的人臉跟蹤算法研究
2014年微型機(jī)與應(yīng)用第12期
李 鵬1,, 王峰娟2
1. 中國(guó)電子科技集團(tuán)公司 第三十八研究所,2. 安徽三聯(lián)學(xué)院安徽 合肥
摘要:  目標(biāo)跟蹤是人工智能領(lǐng)域中最重要的核心問(wèn)題之一,,在工農(nóng)業(yè),、娛樂(lè)及軍事領(lǐng)域都具有非常重要的應(yīng)用價(jià)值[1],。目前,在目標(biāo)跟蹤研究中,,常用的方法主要分為基于模型的方法和模型無(wú)關(guān)的方法兩大類,。基于模型的方法需要事先對(duì)擬跟蹤的目標(biāo)進(jìn)行詳細(xì)的研究,,手工標(biāo)注大量的樣本并建立目標(biāo)模型實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤,。這類方法前期工作量大,跟蹤過(guò)程的實(shí)時(shí)性差,,而且難以適應(yīng)隨機(jī)變形的目標(biāo),,特別是當(dāng)目標(biāo)較復(fù)雜,難以獲得精確的模型時(shí),,這類方法將完全失效,。與模型無(wú)關(guān)的方法一般通過(guò)自動(dòng)提取目標(biāo)特征和相似度比對(duì)實(shí)現(xiàn)目標(biāo)跟蹤過(guò)程。該類方法不需要事先知道目標(biāo)的先驗(yàn)信息,,可以在跟蹤過(guò)程中不斷對(duì)目標(biāo)特征進(jìn)行學(xué)習(xí),,來(lái)改善和豐富對(duì)目標(biāo)的理解。模型無(wú)關(guān)的方法能夠快速建立目標(biāo)跟蹤并在線學(xué)習(xí)以適應(yīng)目標(biāo)變化的特點(diǎn),使其具有更好的應(yīng)用價(jià)值,,是目前研究的熱點(diǎn)[2],。
Abstract:
Key words :

  摘要: 在分析人臉結(jié)構(gòu)特征的基礎(chǔ)上,通過(guò)引入人臉主要器官的結(jié)構(gòu)約束并結(jié)合改進(jìn)的方向梯度直方圖特征和增量SVM,, 提出了一種新的人臉跟蹤算法,。實(shí)驗(yàn)證明,該算法能夠顯著提高人臉跟蹤過(guò)程的穩(wěn)定性和準(zhǔn)確性,,并具有良好的實(shí)時(shí)性能,。

  關(guān)鍵詞: 人臉跟蹤;結(jié)構(gòu)信息,;方向梯度直方圖,;增量SVM

  目標(biāo)跟蹤是人工智能領(lǐng)域中最重要的核心問(wèn)題之一,在工農(nóng)業(yè),、娛樂(lè)及軍事領(lǐng)域都具有非常重要的應(yīng)用價(jià)值[1],。目前,,在目標(biāo)跟蹤研究中,常用的方法主要分為基于模型的方法和模型無(wú)關(guān)的方法兩大類,?;谀P偷姆椒ㄐ枰孪葘?duì)擬跟蹤的目標(biāo)進(jìn)行詳細(xì)的研究,手工標(biāo)注大量的樣本并建立目標(biāo)模型實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤,。這類方法前期工作量大,,跟蹤過(guò)程的實(shí)時(shí)性差,而且難以適應(yīng)隨機(jī)變形的目標(biāo),,特別是當(dāng)目標(biāo)較復(fù)雜,,難以獲得精確的模型時(shí),這類方法將完全失效,。與模型無(wú)關(guān)的方法一般通過(guò)自動(dòng)提取目標(biāo)特征和相似度比對(duì)實(shí)現(xiàn)目標(biāo)跟蹤過(guò)程,。該類方法不需要事先知道目標(biāo)的先驗(yàn)信息,可以在跟蹤過(guò)程中不斷對(duì)目標(biāo)特征進(jìn)行學(xué)習(xí),,來(lái)改善和豐富對(duì)目標(biāo)的理解,。模型無(wú)關(guān)的方法能夠快速建立目標(biāo)跟蹤并在線學(xué)習(xí)以適應(yīng)目標(biāo)變化的特點(diǎn),使其具有更好的應(yīng)用價(jià)值,是目前研究的熱點(diǎn)[2],。

  人臉跟蹤是當(dāng)前目標(biāo)跟蹤領(lǐng)域研究的一個(gè)熱點(diǎn),,其在治安、娛樂(lè),、科研等領(lǐng)域具有很大的現(xiàn)實(shí)意義,。人臉目標(biāo)介于剛體和柔性體之間,具有以下特點(diǎn):人臉大致輪廓和內(nèi)部器官之間結(jié)構(gòu)關(guān)系相對(duì)穩(wěn)定,;跟蹤過(guò)程中內(nèi)部結(jié)構(gòu)之間的空間位置存在變形,,但滿足一定約束;內(nèi)部結(jié)構(gòu)本身的形狀和大小也可能存在變形,。本文通過(guò)研究人臉目標(biāo)的結(jié)構(gòu)及外觀特點(diǎn),,提出了一種新的結(jié)合結(jié)構(gòu)約束的人臉跟蹤方法,其基本思想是,,為人臉主要的器官(雙眼,、嘴)建立獨(dú)立的描述和比較模塊,并對(duì)器官間的結(jié)構(gòu)約束進(jìn)行建模,,利用結(jié)構(gòu)信息輔助完成目標(biāo)搜索和評(píng)分,,最終確定目標(biāo)位置。實(shí)驗(yàn)證明,,該方法進(jìn)行人臉跟蹤的準(zhǔn)確度和穩(wěn)定性較傳統(tǒng)CamShift等算法有明顯提高,,而且具有良好的實(shí)時(shí)性,具有較高的應(yīng)用價(jià)值,。

  1 方法

  1.1人臉結(jié)構(gòu)約束

  人臉具有典型的結(jié)構(gòu)化特征,,通常所謂的“五官”按照規(guī)則排列在人臉上,,這些器官之間存在明顯的結(jié)構(gòu)約束,但又可以進(jìn)行較大程度的變形[3-4],。在人臉跟蹤過(guò)程中,利用人臉各部分分別建??梢栽黾犹卣鞯姆€(wěn)定性,提高跟蹤的精度[4],;同時(shí),,引入各結(jié)構(gòu)之間的約束關(guān)系,能夠提高人臉跟蹤的適應(yīng)性,,排除誤報(bào),。在人臉圖像中,五官中的雙眼,、嘴往往具有較大的顯著性,而鼻子,、耳朵特征一般較為模糊,,特別是在光線、角度不理想的情況下,,鼻子,、耳朵常不能提供有效的特征。因此,,本文以雙眼,、嘴共3個(gè)面部主要器官為對(duì)象,對(duì)它們的空間結(jié)構(gòu)約束進(jìn)行建模,。定義評(píng)價(jià)函數(shù):

  111.jpg

  其中,Scorew為對(duì)于窗口圖像w的評(píng)分,。等式右邊包括兩部分,第一部分為檢測(cè)圖像與目標(biāo)的特征相似度,,本文通過(guò)方向梯度直方圖結(jié)合SVM獲得,;第二部分為目標(biāo)各模塊之間的結(jié)構(gòu)化約束評(píng)分。為了兼顧跟蹤的準(zhǔn)確性和實(shí)時(shí)性要求,,這里結(jié)構(gòu)信息采用了雙眼間向量(距離,,角度)、嘴部與雙眼間向量(距離,,角度)共6個(gè)約束形成的三角形作為結(jié)構(gòu)約束,,如圖1所示。?姿1,、?姿2分別是兩部分的權(quán)重因子,。人臉跟蹤的過(guò)程就是尋找式(1)最小值的過(guò)程。

001.jpg

  1.2 改進(jìn)的方向梯度直方圖

  方向梯度直方圖HOG(Histogram of Oriented Gradient)特征是一種常用的圖像特征描述子,,如圖2所示,,由法國(guó)國(guó)家計(jì)算機(jī)技術(shù)和控制研究所的DALAL N和TRIGGS B在2005年的CVPR上首次提出,。由于其對(duì)幾何和光學(xué)變形具有良好的適應(yīng)性,HOG特征已經(jīng)被廣泛應(yīng)用于計(jì)算機(jī)視覺和圖像處理中[5],。通過(guò)計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的HOG來(lái)構(gòu)成特征,。為了對(duì)各模塊進(jìn)行特征提取并保證系統(tǒng)的實(shí)時(shí)性,本文根據(jù)人臉跟蹤的具體情況對(duì)經(jīng)典HOG算法進(jìn)行了針對(duì)性的優(yōu)化,,方法如下,。

002.jpg

  (1)對(duì)輸入圖像進(jìn)行顏色空間的標(biāo)準(zhǔn)化(Gamma校正法),以降低圖像局部的陰影和光照變化所造成的影響,。

  (2)獲取滑動(dòng)窗圖像并灰度化,,將圖像統(tǒng)一為48×64大小的標(biāo)準(zhǔn)圖像。

  (3)計(jì)算圖像每個(gè)像素的方向梯度,。

  (4)根據(jù)跟蹤的目標(biāo)大小,將圖像劃分成4像素×4像素的方格,。

  (5)將360°按每個(gè)方向45°劃分為8個(gè)方向。與經(jīng)典HOG算法不同,,本文根據(jù)每個(gè)像素的梯度方向,,將其幅值線性差值計(jì)入與其方向相鄰的兩個(gè)方向通道內(nèi),統(tǒng)計(jì)每個(gè)方格的HOG,。

  (6)將所有方格得到的HOG串聯(lián)起來(lái)便得到改進(jìn)的HOG特征,。

  與經(jīng)典算法相比,優(yōu)化的HOG特征簡(jiǎn)化了圖像分塊策略,,提高了特征計(jì)算的速度,。同時(shí),由于增加了方向差值過(guò)程,,使方向梯度的穩(wěn)定性得到了較大提高,,具有更好的抗噪聲性能。實(shí)驗(yàn)證明,,在本應(yīng)用中該特征在提高計(jì)算速度的前提下對(duì)圖像具有不低于經(jīng)典HOG算法的表征能力,。

  1.3 增量SVM

  支持向量機(jī)(SVM) 是VAPNIK等人提出的一種經(jīng)典的機(jī)器學(xué)習(xí)方法,由于其優(yōu)越的學(xué)習(xí)能力,,一經(jīng)提出就在國(guó)內(nèi)外學(xué)術(shù)界受到廣泛重視,。SVM算法通過(guò)使用非線性映射將低維樣本映射到高維空間,并在高維空間使用結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論構(gòu)建全局最優(yōu)分割超平面,,能夠使整個(gè)樣本空間的期望風(fēng)險(xiǎn)以某個(gè)概率滿足一定上界[6],。

  雖然SVM具有很多優(yōu)勢(shì),但其經(jīng)典理論并不具有增量學(xué)習(xí)的能力,,即要求使用者在訓(xùn)練初期能夠收集一個(gè)相對(duì)完整的訓(xùn)練集[7],。對(duì)于非模型目標(biāo)跟蹤來(lái)說(shuō),在跟蹤初期,對(duì)目標(biāo)的描述和理解往往是片面的,,很難獲得完善的訓(xùn)練集,,因此需要在跟蹤過(guò)程中對(duì)學(xué)習(xí)機(jī)進(jìn)行不斷的修正。如果使用經(jīng)典SVM訓(xùn)練方法,,每次增加樣本時(shí),,需要對(duì)所有原始樣本重新訓(xùn)練,訓(xùn)練時(shí)間將隨著跟蹤的持續(xù)而不斷提升,,最終導(dǎo)致不能實(shí)時(shí)跟蹤,。為了解決這一問(wèn)題,本文將核函數(shù)局部化算法引入SVM理論,,實(shí)現(xiàn)在不顯著增加訓(xùn)練時(shí)間的前提下不斷更新樣本,,使SVM分類精度可以隨著跟蹤的進(jìn)行和樣本集的積累而逐步提高。需要特別指出的是,,本文在式(1)中使用的是SVM的特征距離,,而非SVM預(yù)測(cè)標(biāo)簽。

  首先按照經(jīng)典SVM訓(xùn)練方法得到初始分類器,,經(jīng)典SVM的判別函數(shù)一般表示為:

  

222.png

  其中,,K(·)為核函數(shù),獲得最優(yōu)超平面f和支持向量集SV,。利用核函數(shù)的局部特征,當(dāng)跟蹤到目標(biāo)得到新的樣本后,,驗(yàn)證KKT條件:

  

333.png

  其中,,非零?琢i為支持向量。判斷新樣本是否能被超平面f正確分類,,如果新樣本能夠被正確分類,,則說(shuō)明該新樣本在分類內(nèi)部,此時(shí)不需要對(duì)分類器進(jìn)行修正,,即可進(jìn)行下一輪跟蹤,;如果不能被正確分類,則需要調(diào)整分類器,。需要指出的是,,當(dāng)新增樣本違背KKT條件時(shí),原樣本集中非支持向量也可能轉(zhuǎn)化為支持向量,,因此需要由新增樣本得到一個(gè)新的SVM來(lái)檢驗(yàn)原始樣本是否違背KKT 條件,。最終由所有支持向量與所有違背KKT條件的樣本組合構(gòu)成新的訓(xùn)練集,并得到最終的新的SVM,。該增量學(xué)習(xí)方法不僅具有良好的數(shù)學(xué)基礎(chǔ),,而且僅使用現(xiàn)有樣本中少量的樣本進(jìn)行重新訓(xùn)練,大大降低了SVM的訓(xùn)練時(shí)間,提高了系統(tǒng)實(shí)時(shí)性[6],。

  2 結(jié)合結(jié)構(gòu)信息的人臉跟蹤算法

  綜合以上各部分,,本文提出的算法具體流程如下:

  (1)獲取第一幀圖像并手動(dòng)框定人臉及雙眼、嘴部區(qū)域,,生成初始化樣本集,。

  (2)提取雙眼、嘴部改進(jìn)的方向梯度直方圖特征,,訓(xùn)練初始SVM,;計(jì)算結(jié)構(gòu)約束,初始化結(jié)構(gòu)參數(shù),。

  (3)取下一幀,,搜索雙眼及嘴部候選區(qū)域,記錄SVM距離,。

  (4)在候選區(qū)域中尋找最小化式(1)的區(qū)域,,作為跟蹤結(jié)果。

  (5)根據(jù)跟蹤結(jié)果修正結(jié)構(gòu)參數(shù),。

  (6)每累計(jì)跟蹤10幀,,利用新的正負(fù)樣本(正樣本為跟蹤到的目標(biāo),負(fù)樣本為搜索過(guò)程中獲得的目標(biāo)周圍的圖像區(qū)域)增量更新SVM,。

  (7)返回到步驟(3),,進(jìn)行下一輪跟蹤。

  3 實(shí)驗(yàn)

  實(shí)驗(yàn)所用的計(jì)算機(jī)平臺(tái)為I3-2120 @3.30 GHz CPU,,4 GB內(nèi)存,,操作系統(tǒng)為Windows XP SP3。測(cè)試程序在MATLAB 2011b平臺(tái)下實(shí)現(xiàn),。本文選取了近年來(lái)比較著名的電影和電視劇中的片段作為測(cè)試對(duì)象,。在這些片段第1幀用鼠標(biāo)框取了待跟蹤人臉及其雙眼和嘴部,從第2幀開始進(jìn)行跟蹤,,部分結(jié)果如圖3所示,。將本文提出的算法與經(jīng)典CamShift算法相比較,結(jié)果如表1所示,可以看出本文算法在跟蹤精度上具有明顯優(yōu)勢(shì),。

003.jpg

004.jpg

  本文通過(guò)研究人臉的結(jié)構(gòu)特征,,對(duì)人臉主要器官的結(jié)構(gòu)約束進(jìn)行建模,并結(jié)合改進(jìn)的HOG與增量SVM,開發(fā)出一種新的人臉跟蹤算法,。實(shí)驗(yàn)結(jié)果表明,,本文提出的算法能夠在人臉跟蹤過(guò)程中更好地適應(yīng)目標(biāo)的角度變化和部分遮擋,跟蹤精度和穩(wěn)定性優(yōu)于傳統(tǒng)的CamShift算法,,并能夠達(dá)到實(shí)時(shí)性要求,。

  參考文獻(xiàn)

  [1] 馬曉路,劉倩,牟海軍.基于Mean Shift 和粒子濾波的運(yùn)動(dòng)目標(biāo)跟蹤[J].微型機(jī)與應(yīng)用,2012,,31(23):42-44.

  [2] 張寶峰,,趙建平,朱均超. 基于OpenCV的室內(nèi)環(huán)境下多目標(biāo)跟蹤[J].微型機(jī)與應(yīng)用, 2013,,32(9):24-26.

  [3] Zhang Lu,, Laurens van der Maaten. Structure PreservingObject Tracking[C]. 2013 IEEE Conference on Computer Vision and Pattern Recognition,2013:1838-1845.

  [4] BRANSON S, PERONA P, BELONGIE S. Strong superv-ision from weak annotation: interactive training of defor-mable part models[C]. 2011 IEEE International Conference on Computer Vision, 2011:1832-1839.

  [5] 王文武,, 王華昌. 嵌入式客流量統(tǒng)計(jì)模塊的設(shè)計(jì)和實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2011,,37(8):33-35.

  [6] 牛勝石,毛曉暉,,侯建華,,等.基于Adaboost和SVM的人頭實(shí)時(shí)檢測(cè)[J].微型機(jī)與應(yīng)用,2010,13(1):33-36.

  [7] 潘以楨,, 胡越明. 改進(jìn)的在線支持向量機(jī)訓(xùn)練算法[J].計(jì)算機(jī)工程,2009,,35(22):212-215.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。