世界排名第一的柯潔,,曾認真研究了一年多AlphaGo喜歡的三三式,;在這一年多,,AlphaGo則從第18代迭代為第60代。這些表象背后,,人工智能深度學(xué)習能力經(jīng)歷了怎樣的演進,?
一場科技層面注定失敗的比賽
這是一場業(yè)內(nèi)同行普遍不看好結(jié)果的比賽。
盡管柯潔在大戰(zhàn)前悲壯地表示,,“我會用所有的熱情去與它做最后的對決,,不管面對再強大的對手——我也絕不會后退!”賽前的豪邁,,依然改變不了失敗的結(jié)果,。在專業(yè)棋手看來,輸四分之一子的柯潔雖敗猶榮,。
對柯潔而言,,這是一場注定艱難但必須爭勝的戰(zhàn)斗。在此之前,,柯潔專門研究了AlphaGo喜歡的三三式,,并在比賽中應(yīng)用。
而在這一年中,,AlphaGo從對陣李世石時的第18代,,迭代為對陣柯潔時的第60代??焖俚谋澈?,是AlphaGo全新的深度學(xué)習邏輯。這種經(jīng)歷迭代的深度學(xué)習邏輯,,其強大力讓人難以望其項背,。
深度學(xué)習的兩次邏輯變更
2016年在AlphaGo以4:1大勝李世石后,人工智能再次進入大眾的視野,,而在這場世紀“人機大戰(zhàn)”后,,Deepmind隨即宣布“阿爾法狗”進入閉關(guān)狀態(tài),。
直到2016年12月29日,AlphaGo才化身為神秘的Master再次復(fù)出,。隨后其在短短一周內(nèi),,擊敗了包括目前中韓第一人柯潔和樸廷桓,以及古力,、陳耀燁,、范廷鈺、常昊等10多位中韓世界冠軍,,豪取60連勝,,就連原來信心滿滿的柯潔也對此也一改以往自信狂傲的口吻,聲稱自己很可能全輸給AlphaGo,。
而前兩次人機對決的場景還歷歷在目,第三次人機大戰(zhàn)卻已悄然來臨,,但整個人類世界對于兩方選手的感情卻發(fā)生了顛覆性的變化,,一邊倒的認為柯潔必輸。
那么這一年時間里AlphaGo身上究竟發(fā)生了什么,?居然讓輿論變化如此之大,,這無疑源于人們對AlphaGo了解的加深。
與李世石對戰(zhàn)的AlphaGo 1.0版混合了三種算法:蒙特卡洛樹搜索+監(jiān)督學(xué)習+增強學(xué)習,。其中,,蒙特卡洛樹搜索是一種優(yōu)化過的暴力計算,比1997年深藍的暴力計算更聰明,。而這里的監(jiān)督學(xué)習,,是通過學(xué)習3000萬部人類棋譜,對六段以上職業(yè)棋手走棋規(guī)律進行模仿,,也是AlphaGo獲得突破性進展的關(guān)鍵算法,。而增強學(xué)習作為輔助,是兩臺AlphaGo從自我對戰(zhàn)眾中學(xué)習如何下棋,,對棋力提升有限,。
此次AlphaGo 2.0的技術(shù)原理已有顛覆式改變。首先是放棄了監(jiān)督學(xué)習,,沒有再用人的3000萬局棋譜進行訓(xùn)練,。這本是AlphaGo最亮眼的算法,也是今天主流機器學(xué)習不可避免的核心條件:依賴于優(yōu)質(zhì)的數(shù)據(jù),,在這個特定問題下就這么被再次突破了,。
其次,放棄了蒙特卡洛樹搜索,,不再進行暴力計算,。理論上,,算法越笨,就越需要暴力計算做補充,。算法越聰明,,就可以大大減少暴力計算。從AlphaGo 2.0的“馬甲”Master的歷史行為看,,走棋非常迅速,,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力計算,。
再次,,極大地強化了增強學(xué)習的作用,之前敲邊鼓的算法,,正式成為扛把子主力,。想想看有多勵志:兩臺白癡機器,遵守走棋和獲勝規(guī)則,,從隨機走棋開始日夜切磋,,總結(jié)經(jīng)驗,不斷批評和自我批評,,一周后終成大器,。
通俗地講,1.0版本的AlphaGo尚需借助人類棋譜來增長功力,,而新版阿爾法狗2.0已正式摒棄人類棋譜,,只靠計算機自身深度學(xué)習的方式成長——即探索“深度學(xué)習”方式的極限,臻至“圍棋之神”的境界,。所以,,它現(xiàn)在在圍棋方面儼然打通了任督二脈,人類根本找不到其脈搏,。
而在今年4月,,AlphaGo之父哈薩比斯在英國劍橋大學(xué)進行了演講,專門提到為了幫助 AlphaGo 提升,。他公開表示,,之前 AlphaGo 提升一個版本需要 3 個月,現(xiàn)在只需要 1 周,。AlphaGo 對陣李世石時的版本號是 V18,,而當下的版本估計已經(jīng)到了 V60,在邏輯上和棋局策略上已經(jīng)今非昔比,。
誠如哈薩比斯所說,,AlphaGo證明了人類3000年來在圍棋上犯了一個大錯,其僅憑兩臺機器自我對弈中學(xué)習和進化,,最終不僅趕超了人類進化的速度,,還發(fā)展出一套截然不同的下棋方法,,并且更加接近完美的狀態(tài),實現(xiàn)了對人類的碾壓,,重演了一部圍棋的進化史,,而且得出了與這兩千年來不同的進化結(jié)果。
如今,,人工智能已經(jīng)上升為國家戰(zhàn)略,,而在2017年業(yè)界的聲音也的確進入了該領(lǐng)域的下一個階段——更加強調(diào)人工智能技術(shù)的落地。未來社會每個人身邊獨有一個人工智能助手,,人類將從簡單重復(fù)的勞動中解脫出來,。
人工智能產(chǎn)業(yè)風口已來
不過,柯潔輸給AlphaGo并不代表人類敗給了人工智能,,因為這種對抗從來不是技術(shù)與人關(guān)系的實質(zhì),。人工智能的出現(xiàn)從來不是作為人類的對手,而是作為人類的助手,。
就好像現(xiàn)在多數(shù)人應(yīng)該都覺得,,讓人和汽車比誰跑得快,連娛樂價值都沒有了,,而如何利用汽車、利用無人駕駛讓我們的生活更方便,,才是更有價值的探索方向,。這也是谷歌一直所追求的“如何讓機器更智能,如何讓人的生活更好”,,而且阿爾法狗后面站著的實際上就是人類本身,。
而隨著阿爾法狗在深度學(xué)習領(lǐng)域的示范效應(yīng),深度學(xué)習有望進一步加速滲透至各個行業(yè),,垂直行業(yè)的信息化公司有望充分利用深度學(xué)習提升行業(yè)智能水平,。目前,谷歌,、微軟,、 Facebook、百度等巨頭紛紛開源深度學(xué)習框架,,大大降低開發(fā)深度學(xué)習系統(tǒng)應(yīng)用門檻,,加速滲透至各個行業(yè),包括金融,、醫(yī)療,、服務(wù)機器人、法律,、無人駕駛,、教育,、氣象、農(nóng)業(yè)等,,垂直行業(yè)的信息化公司有望迎來發(fā)展良機,。2017年被業(yè)內(nèi)評價為人工智能應(yīng)用元年。
基于人工智能巨大的發(fā)展空間,,國內(nèi)相關(guān)上市公司也將迎來發(fā)展契機,。阿里云、騰訊,、百度,、科大訊飛等行業(yè)巨頭,大疆,、華大基因,、柔宇科技等創(chuàng)新企業(yè)正在人工智能領(lǐng)域開始耕耘。
而相較于在原創(chuàng)性研究領(lǐng)域的薄弱,,中國在AI應(yīng)用方面具有獨特的優(yōu)勢:一方面政府統(tǒng)一規(guī)劃使得國內(nèi)在人工智能方面的投入可能取得更好成果,,另一方面國內(nèi)巨大的市場需求,將促使人工智能在產(chǎn)業(yè)應(yīng)用的落地加快,,最終產(chǎn)生一些在國外無法實現(xiàn)的應(yīng)用模式,。
在AlphaGo不斷迭代深度學(xué)習邏輯的同時,人類在不斷拓寬對人工智能的應(yīng)用,。在這一場永不停歇的人機大戰(zhàn)中,,誰是最終的贏家,結(jié)局已經(jīng)注定,。