文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.11.008
引用格式: 張星星,,李金龍. 基于GANs無(wú)監(jiān)督回歸三維參數(shù)化人臉模型[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,39(11):50-55.
0 引言
三維人臉重建是指通過(guò)一張或多張同一個(gè)人的照片來(lái)構(gòu)建該人的三維人臉網(wǎng)格,。該課題一直是計(jì)算機(jī)視覺(jué)和圖形學(xué)的熱門關(guān)注焦點(diǎn),,擁有廣泛的應(yīng)用場(chǎng)景,如人臉身份識(shí)別,、醫(yī)學(xué)方案展示,、三維人臉動(dòng)畫(huà)等。
在三維人臉重建領(lǐng)域,,VETTER T和BLANTZ V在1999年提出的三維人臉參數(shù)化模型(3DMM)[1]具有重要意義,。3DMM采集了200位實(shí)驗(yàn)對(duì)象的臉部激光掃描數(shù)據(jù)集,并對(duì)該數(shù)據(jù)集進(jìn)行主成分分析(PCA),。通過(guò)對(duì)PCA所提取的基向量進(jìn)行線性組合從而構(gòu)成一張新的人臉,。
傳統(tǒng)的三維人臉重建基于迭代方法[2],即針對(duì)輸入人臉,,利用人臉關(guān)鍵點(diǎn),,反復(fù)調(diào)整基向量的參數(shù)使得三維人臉?shù)秩竞筇崛〉娜四橁P(guān)鍵點(diǎn)與二維人臉關(guān)鍵點(diǎn)接近,以此達(dá)到具有輸入人臉特征的三維人臉網(wǎng)格,。然而,,該方法較為依賴人臉關(guān)鍵點(diǎn)的檢測(cè)結(jié)果,在人臉姿勢(shì)較大或有遮擋物時(shí),,效果較差,,迭代過(guò)程耗時(shí)也較長(zhǎng),。
近年來(lái),,隨著深度學(xué)習(xí)的不斷發(fā)展,越來(lái)越多的研究開(kāi)始運(yùn)用基于回歸的方法重建三維人臉,。然而,,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,一個(gè)亟需解決的問(wèn)題便是三維人臉訓(xùn)練數(shù)據(jù)稀少,。針對(duì)這一問(wèn)題,,部分研究提出利用合成數(shù)據(jù)[3-4],即先隨機(jī)初始化3DMM的參數(shù)作為參照的三維人臉,,而后將該三維人臉投影成的二維人臉作為輸入數(shù)據(jù),,進(jìn)而擴(kuò)大訓(xùn)練數(shù)據(jù)集。因?yàn)楹铣蓴?shù)據(jù)投影形成的二維圖片不能反映真實(shí)世界的復(fù)雜度,,故GENOVA K[5]提議采用真實(shí)圖片及合成圖片的混合數(shù)據(jù)集進(jìn)行兩步訓(xùn)練,。TEWARI A[6]利用編碼解碼器結(jié)構(gòu)直接從單張圖片重建三維人臉,,解碼器是基于專業(yè)知識(shí)精心設(shè)計(jì)的,但可擴(kuò)展性較低,。TRAN A T[7]等人提議利用迭代方法形成的三維人臉作為神經(jīng)網(wǎng)絡(luò)所需的配對(duì)三維人臉數(shù)據(jù)進(jìn)行訓(xùn)練,。
本文基于前人的思想,提出采用GANs神經(jīng)網(wǎng)絡(luò)回歸3DMM模型參數(shù)進(jìn)行三維人臉重建任務(wù),。在解決三維人臉數(shù)據(jù)稀少問(wèn)題上,,本文提出兩種并列的監(jiān)督信號(hào):(1)二維監(jiān)督信號(hào):利用三維人臉投影后的二維人臉與輸入的二維人臉身份差異及皮膚顏色差異,來(lái)提供二維層面的監(jiān)督信號(hào),,使得二者相近,;(2)三維監(jiān)督信號(hào):利用重構(gòu)的三維人臉頂點(diǎn)分布與普遍三維人臉頂點(diǎn)分布差異,來(lái)提供三維層面的監(jiān)督信號(hào),,以使得重構(gòu)后的三維人臉具備真實(shí)感人臉形狀,。由于僅依賴二維監(jiān)督信號(hào)可能會(huì)導(dǎo)致一些重構(gòu)后三維人臉頂點(diǎn)離正常人臉頂點(diǎn)偏差較大,雖然投影結(jié)果依舊初具人臉形狀,,仍能被系統(tǒng)識(shí)別,,但視覺(jué)感受卻與普遍人臉形狀相差較大。其原因在于缺少三維監(jiān)督信號(hào),,使得重構(gòu)后的三維人臉頂點(diǎn)分布近似于普遍三維人臉頂點(diǎn)分布,。本文擬采用生成對(duì)抗網(wǎng)絡(luò)(GANs)[8]來(lái)提供三維監(jiān)督信號(hào),利用生成器及判別器的對(duì)抗生成,,指引人臉頂點(diǎn)分布接近于真實(shí)感人臉頂點(diǎn)分布,。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000003177
作者信息:
張星星1,李金龍2
(1.中國(guó)科學(xué)技術(shù)大學(xué) 軟件學(xué)院,,安徽 合肥230026,;
2.中國(guó)科學(xué)技術(shù)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 合肥230026)