谷歌神秘機(jī)構(gòu)X實(shí)驗(yàn)室里的一項(xiàng)令人驚奇的項(xiàng)目被世界所知曉,。這些擁有三百萬個(gè)神經(jīng)元的模擬神經(jīng)網(wǎng)絡(luò)在沒有人工幫助的情況下,,只依靠從YouTube里獲得的圖片就識(shí)別出了圖片中的貓和人物,。
項(xiàng)目的成員組建了一個(gè)新的研究小組,,這就是公司搜索部門下面的“谷歌大腦”( Google Brain),。他們和其他的研究者一起很快向世界證明了一個(gè)擁有幾十年歷史的發(fā)明——人工神經(jīng)網(wǎng)絡(luò)將圖像識(shí)別和語音識(shí)別的精確度提升到了一個(gè)前所未有的新高度,。深度學(xué)習(xí)的成功促使谷歌和其他公司開始大舉投資人工智能,,甚至使一些專家開始宣稱“我們應(yīng)該為出現(xiàn)比人類更加聰明的軟件做好準(zhǔn)備,。”
然而,,谷歌這個(gè)“貓檢測(cè)器”在某種程度上是一條死胡同。近期深度學(xué)習(xí)的成功是建立在那些需要人工幫助其學(xué)習(xí)的軟件之上的,,這極大限制了人工智能的上升空間,。
谷歌的實(shí)驗(yàn)使用了一種非監(jiān)督式學(xué)習(xí)的方法,軟件被輸入未經(jīng)加工的原始數(shù)據(jù),,然后必須在沒有人工幫助的情況下計(jì)算出結(jié)果,。盡管它可以學(xué)會(huì)識(shí)別貓、人臉和其他物體,,但它的精確度還沒有達(dá)到可以使用的水平,。深度學(xué)習(xí)研究和基于此的產(chǎn)品開發(fā)的爆發(fā)都是基于監(jiān)督式學(xué)習(xí),數(shù)據(jù)需要人工打好標(biāo)簽之后再提供給軟件——例如,,我們要給圖片中的各個(gè)物體都標(biāo)上名稱,。
事實(shí)證明,這對(duì)于解決一些問題非常有效,,比如說識(shí)別圖片中的物體,、過濾垃圾郵件,甚至是為用戶回復(fù)短信提供建議(這是谷歌去年上線的一項(xiàng)功能),。但如果需要軟件更好地去理解世界,,那可能就需要非監(jiān)督式學(xué)習(xí)了,Jeff Dean如是說,,他現(xiàn)在領(lǐng)導(dǎo)著谷歌大腦項(xiàng)目,,也曾經(jīng)在Google X 的“貓檢測(cè)器”項(xiàng)目中工作過。
“我非常確信我們需要它,,”Dean 說,,“當(dāng)你有正確的數(shù)據(jù)集時(shí),,監(jiān)督式學(xué)習(xí)會(huì)表現(xiàn)得很好,但終極的非監(jiān)督式學(xué)習(xí)會(huì)成為構(gòu)建真正的智能系統(tǒng)中重要的一環(huán)——如果你觀察人類的學(xué)習(xí)方式,,你就會(huì)發(fā)現(xiàn)全部都是非監(jiān)督式的,。”
一個(gè)絕好的例子就是,,嬰兒的學(xué)習(xí)方式為成年時(shí)期的智能打下了基礎(chǔ),。比如說我們知道,當(dāng)一個(gè)物體移到視線之外時(shí)依然存在,,或者沒有支撐就會(huì)掉到地上,,這些事情是我們通過觀察世界而學(xué)習(xí)到的,并不需要明確的指引,。和動(dòng)物一樣,,如果機(jī)器人想要探索真實(shí)世界,那它們就需要這種常識(shí),。這也能鞏固更加抽象的任務(wù),,例如對(duì)語言的理解。
Facebook人工智能研究組主管Yann LeCun說,,如果人工智能要滿足人們更大的野心,,就必須弄清楚軟件如何才能完成那些對(duì)人類嬰兒來說十分容易的事情。他說:“我們都知道,,最終的答案就是非監(jiān)督式學(xué)習(xí),。解決了非監(jiān)督式學(xué)習(xí)的問題,將把我們帶向更高的級(jí)別,?!?/p>
盡管他們還沒有得到最終的答案,但Facebook,、Google等公司以及學(xué)術(shù)界的研究者正在對(duì)某些有限的非監(jiān)督式學(xué)習(xí)進(jìn)行實(shí)驗(yàn),。
其中一個(gè)研究分支的目的是創(chuàng)造出一個(gè)人工神經(jīng)網(wǎng)絡(luò),讓它消化吸收視頻和圖像,,并用它們獲得的關(guān)于世界的知識(shí)產(chǎn)生出新的圖像——這意味著它們已經(jīng)形成了關(guān)于世界是如何運(yùn)行的內(nèi)部表征,。對(duì)世界作出精準(zhǔn)的預(yù)測(cè)是人類智能中一個(gè)非常重要的基本特征。
Facebook的研究者建造了一個(gè)稱為 EyeScream的軟件,。這個(gè)軟件可以根據(jù)提示(例如“教堂”或“飛機(jī)”)生成可識(shí)別的圖像,。他們也在研究對(duì)視頻做出預(yù)測(cè)的軟件。Google旗下DeepMind的研究者已經(jīng)開發(fā)了一種軟件,,給它一些部分遮掩的圖片,,它能用十分真實(shí)的圖像來進(jìn)行填補(bǔ)。
DeepMind還在研究一種完全的非監(jiān)督式學(xué)習(xí),,叫做強(qiáng)化學(xué)習(xí)(reinforcement learning),。在強(qiáng)化學(xué)習(xí)中,,軟件被訓(xùn)練來接收關(guān)于自我表現(xiàn)的自動(dòng)反饋——比如說,這些反饋會(huì)來自電腦游戲的得分系統(tǒng),。還有一些不使用深度學(xué)習(xí)的研究者則證明,,軟件可以從單個(gè)例子中學(xué)會(huì)識(shí)別手寫字體(見《人工智能終于能像人類一樣學(xué)習(xí)》)。
但是迄今為止,,這些嘗試都尚未揭示出一條能讓非監(jiān)督式學(xué)習(xí)達(dá)到人類水平的路徑,,或者說,軟件尚不能僅通過經(jīng)歷或?qū)嶒?yàn)就學(xué)會(huì)與真實(shí)世界有關(guān)的復(fù)雜東西,。百度硅谷AI實(shí)驗(yàn)室主任Adam Coates說:“目前,,我們似乎缺失了某個(gè)關(guān)鍵的思想?!?/p>
Coates說,,隨著搜尋的繼續(xù),監(jiān)督式學(xué)習(xí)依然還能帶給我們很多東西:互聯(lián)網(wǎng)公司可以獲得大量數(shù)據(jù),,包括人們做了什么事和關(guān)心什么事,,可以用這些原料來建造比今天的產(chǎn)品更加有用的語音交互和個(gè)人助理等產(chǎn)品。他說:“在不遠(yuǎn)的未來,,你還可以用標(biāo)記數(shù)據(jù)來做很多事,。”大公司在這方面花了許多金錢,,讓合約商為他們的機(jī)器學(xué)習(xí)系統(tǒng)標(biāo)記數(shù)據(jù)。
Facebook的LeCun相信,,研究者不會(huì)永遠(yuǎn)依靠標(biāo)記數(shù)據(jù),。但是,他拒絕評(píng)價(jià)軟件還需要多久才能到達(dá)人類智能的水平,。他說:“我們知道原材料,,但卻不知道菜譜。這可能還需要花費(fèi)一些時(shí)間,?!?/p>