《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 一文讀懂 GAN 理念及應(yīng)用方向

一文讀懂 GAN 理念及應(yīng)用方向

2019-06-21

  【導(dǎo)讀】這是一篇關(guān)于GAN的零基礎(chǔ)入門介紹,。作者用“制假販子”和“偵探”的比方講起,,形象介紹了關(guān)于GAN的概念、組成和運(yùn)作機(jī)制,,以及基于GAN常見熱門應(yīng)用方向等入門概念性知識,。

  目前,人工智能AI)領(lǐng)域正在快速發(fā)展,每隔一段時間就取得新的突破,。最近突出的一個詞是Generative Adversarial Network(GAN) - 但這是什么意思,?

  名詞解釋:究竟什么是生成對抗網(wǎng)絡(luò)(GAN)?

  GAN背后的理念最初是在2014年提出的,,在最基本的層面上將,,它描述了一個系統(tǒng),這個系統(tǒng)中將兩個AI系統(tǒng)(神經(jīng)網(wǎng)絡(luò))相互對立,,以提高模型輸出結(jié)果的質(zhì)量,。

  為了理解GAN是如何工作的,可以想象一個盲人偽造者試圖仿造一幅大師的畫作,。首先,,他并不知道這幅畫應(yīng)該是什么樣子的,但他碰巧有一位朋友對所有大師的杰作都有照片般的記憶,。

  這位朋友相當(dāng)于一名偵探,,必須確定他的朋友所展示的畫作是與真正偉大大師創(chuàng)作的畫作一致,還是明顯的贗品,。

  這是GAN運(yùn)行的基本機(jī)制--只不過這位偽造者他的朋友都是AI,,行事速度超快,每秒可以制造和檢測數(shù)千件贗品,。然后兩人都從結(jié)果中進(jìn)行“學(xué)習(xí)”,,以改善在未來的表現(xiàn)。偵探在檢測贗品方面的能力越來越強(qiáng),,要求偽造者必須要把贗品做的更逼真才行,。

  近年來,由于GAN能夠基于現(xiàn)有的真實(shí)信息建立的規(guī)則制造出“新”信息,,因此在人工智能開發(fā)領(lǐng)域引起了廣泛關(guān)注,。編寫說明書可能是一個典型的例子。開發(fā)人員在成千上萬的指導(dǎo)手冊的內(nèi)容作為訓(xùn)練數(shù)據(jù)對GAN進(jìn)行訓(xùn)練,,有朝一日可以創(chuàng)建一個可以查看任何工具,,設(shè)備或軟件的系統(tǒng),再為這個系統(tǒng)生成一份使用說明書,。

  如何設(shè)計了解你感覺的AI

5d0af54feb95c-thumb.png

  接下來,,讓我們更深入地研究一下GAN的工作機(jī)制。負(fù)責(zé)創(chuàng)建虛假數(shù)據(jù)的“偽造”網(wǎng)絡(luò)被稱為生成網(wǎng)絡(luò),,它的工作是閱讀并理解訓(xùn)練數(shù)據(jù)的特征屬性,。然后嘗試通過生成遵循相同規(guī)則的“候選”數(shù)據(jù)集來復(fù)制這些訓(xùn)練數(shù)據(jù)。

  “偵探”網(wǎng)絡(luò)的作用是識別生成網(wǎng)絡(luò)的輸出數(shù)據(jù)是(人工生成的)假數(shù)據(jù),,還是真實(shí)的(訓(xùn)練)數(shù)據(jù),,這個“偵探”稱為判別網(wǎng)絡(luò),。因為判別網(wǎng)絡(luò)與生成網(wǎng)絡(luò)進(jìn)行對抗性競爭,所以整個系統(tǒng)被描述為“對抗性網(wǎng)絡(luò)”,。

  對于GAN的應(yīng)用實(shí)例,,最典型的就是“假臉生成工具”。為網(wǎng)站提供動力的網(wǎng)絡(luò)已經(jīng)學(xué)會了制作人臉的超逼真圖像,,雖然這些人臉圖像幾乎完美再現(xiàn)了真實(shí)人臉圖像的一切細(xì)節(jié)特征和規(guī)則,,但無一例外都是計算機(jī)程序生成的,現(xiàn)實(shí)世界中并不存在,。

  人們可能存在這樣的固有印象,,即計算機(jī)是將人們的眼睛、耳朵,、嘴巴和頭發(fā)的數(shù)據(jù)庫中的碎片數(shù)據(jù)組合在一起,,來構(gòu)建面部圖像的,但事實(shí)并非如此,。生成網(wǎng)絡(luò)的“輸入”數(shù)據(jù)只是一串?dāng)?shù)字,,只有判別網(wǎng)絡(luò)才能看到訓(xùn)練數(shù)據(jù)。生成網(wǎng)絡(luò)需要完全基于判別網(wǎng)絡(luò)的輸出來改善自己的輸出,。

  作為判別網(wǎng)絡(luò)給出的唯一反饋,,是對生成網(wǎng)絡(luò)輸出是否與訓(xùn)練數(shù)據(jù)匹配的“是或否”的判斷,這個生成-判斷-再生成的過程要循環(huán)多次,,生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的性能不斷提升后,,才可能產(chǎn)生與訓(xùn)練輸入足夠相似的人臉圖像輸出。

5d0af55045c03-thumb.png

 ?。ㄟ@個例子實(shí)際上借用了去年由Nvidia開發(fā)的proGAN模型,,該模型在與運(yùn)行過程中會逐漸增加生成網(wǎng)絡(luò)輸出的圖像分辨率,從4*4超低分辨率開始,,最終生成逼真的人臉,。)

  用于訓(xùn)練對抗性網(wǎng)絡(luò)的數(shù)據(jù)不必為標(biāo)記數(shù)據(jù),因為判別網(wǎng)絡(luò)可以完全基于訓(xùn)練數(shù)據(jù)本身的特征來對生成網(wǎng)絡(luò)的輸出做出判斷,。所以,GAN既可以用于監(jiān)督學(xué)習(xí),,也可以用于無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),。

  GAN的另一個用處是為其他AI應(yīng)用程序高效地創(chuàng)建訓(xùn)練數(shù)據(jù)集。大多數(shù)當(dāng)前的AI技術(shù),,特別是深度學(xué)習(xí)技術(shù),,都依賴于海量的訓(xùn)練數(shù)據(jù)。

  GAN可以生成遵循“自然”數(shù)據(jù)集的所有規(guī)則的數(shù)據(jù)集,,因此理論上可以用于深度學(xué)習(xí)模型的訓(xùn)練,。這一點(diǎn)對于醫(yī)學(xué)成像領(lǐng)域非常有用,,收集真實(shí)數(shù)據(jù)成本高、耗時久,,而且需要患者同意,,以及大量的醫(yī)學(xué)專業(yè)知識才能對其進(jìn)行數(shù)據(jù)標(biāo)記。利用GAN可以有效克服這些障礙,。

  GAN可用于創(chuàng)建虛構(gòu)的圖像,,移動視頻,文本甚至是音樂,。雖然近期對GAN存在著大量炒作,,但它顯然是近年來從AI領(lǐng)域出現(xiàn)的最有趣的新概念之一,我們可以期待在不久的將來看到更多基于GAN的令人興奮的新應(yīng)用,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]