最近,一個名為華智冰的學(xué)生走進(jìn)了清華大學(xué),還大眾面前“高調(diào)”亮相,因為這是中國首個原創(chuàng)虛擬學(xué)生,。
一時間,大家紛紛感嘆,原來虛擬人物還能讀大學(xué),!據(jù)報道,華智冰雙商都很高,,可以寫詩作畫,、創(chuàng)作劇本殺,還具有一定的推理和情感交互的能力,。
未來離我們?nèi)绱酥?/p>
那么,,華智冰這樣的AI究竟“進(jìn)化”到了什么地步?為什么AI能進(jìn)行藝術(shù)性質(zhì)的創(chuàng)作,?人類智能和人工智能的差別會越來越小嗎,?AI最終會超越人類嗎?
微軟亞洲研究院被譽為“世界上最火的計算機實驗室”,,洪小文院長在名為《人工智能的突破和數(shù)字化轉(zhuǎn)型的未來》的演講中全面分析了這些問題,,同時也講述了為何數(shù)字化轉(zhuǎn)型對企業(yè)至關(guān)重要。
值得一提的是,,華智冰是由北京智源人工智能研究院,、智譜AI與小冰公司共同打造的,而小冰公司的前身就是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團隊,。
相信洪小文院長的這篇演講能為你揭開關(guān)于AI現(xiàn)狀和未來的神秘面紗,。
中國有個成語叫“知往鑒今”,意思就是了解過去作為今天的借鑒,。我經(jīng)常開玩笑說,,AI火熱是因為“人工”的反面是“天然”,“智能”的反面就是“愚蠢”,,因為沒有人想做天然的愚蠢,,那當(dāng)然就喜歡AI了。
AI這個學(xué)科雖然和其他學(xué)科比起來歷史沒有那么悠久,,但是也有60多年了,。1956年我的師祖(老師的老師)約翰?麥卡錫在達(dá)特茅斯會議上提出了AI這個概念,,然后AI經(jīng)歷了兩段著名的寒冬,。
記得我剛畢業(yè)的時候是1992年,,那正是AI第二段寒冬的尾巴。當(dāng)時我們學(xué)AI的人畢業(yè)都不敢講自己是學(xué)AI的,,我們就說是做語音的,。那時如果跟人家講自己學(xué)AI是找不到工作的,而今天是你不做AI都要說是做AI,。起初,,AI在學(xué)術(shù)上的定義其實沒有大家理解的這么寬;但今天,,基本上計算機能做的,,大部分人認(rèn)為就是AI。
AI跟經(jīng)濟有很大的關(guān)系,,大家都預(yù)測到,,未來的經(jīng)濟很多都需要靠AI推動。AI對GDP增長的貢獻(xiàn)值如圖11.1所示,。
圖11.1 AI對GDP增長的貢獻(xiàn)值
智能金字塔
圖11.2是1950年一期《時代》雜志的封面,,那期雜志里有一篇文章說了這么一句話:“對于擁有‘超人’力量的機器,現(xiàn)代人已經(jīng)習(xí)以為常,,但是擁有‘超人’腦力的機器仍然讓人們感到恐懼,。‘超人’的設(shè)計者否認(rèn)他們正在創(chuàng)造人類智力的競爭對手,?!?/p>
計算機是在第二次世界大戰(zhàn)期間誕生的,當(dāng)時美國跟德國都想要做原子彈來制服對方,,那時有一個“曼哈頓計劃”,,所以才開始做計算機。1950年的時候,,AI還沒有被定義出來,,達(dá)特茅斯會議都還沒有召開,第二次世界大戰(zhàn)結(jié)束五年后,,全世界的計算機還不超過十臺,,而且每一臺計算機都有一個房間那么大,其運算能力,、儲存能力比今天的智能手機還差,。
在那個時代,大家很擔(dān)心有人會造出比人類還聰明的計算機,。我們并不害怕大型機械,,如飛機、汽車,,但是卻在AI還沒有影子的時候就感到害怕,,這代表了大家對智能這件事情,,真是既期待,又怕受傷害,。這也說明了為什么大家這么關(guān)注AI,,包括很多人對AI產(chǎn)生了不那么正確的看法。
圖11.2 1950年《時代》雜志的封面
我把智能的發(fā)展畫成了一個金字塔(見圖11.3),,自下至上,,從簡單到復(fù)雜分別為計算和記憶力、感知,、認(rèn)知、創(chuàng)造力和智慧這五層,。
最底層的是計算和記憶力,。我們中國人的老祖宗很厲害——“神機妙算”和“過目不忘”,這是很智能的表征,,“神機妙算”就是計算,,“過目不忘”就是記憶。不管是圖靈機還是馮,?諾依曼機,,都包含了CPU以及存儲兩大基本組成,計算機靠這兩樣?xùn)|西就可以運算所有程序,。
回想到我人生的第一次挫折,,就是我小學(xué)一年級時沒有被選進(jìn)珠算隊,而今天大部分人顯然都不會送小孩學(xué)珠算,。在我們那個年代,,珠算也分等級,就像下圍棋一樣,,大家覺得一個人很會用算盤,、會珠心算,是非常了不起的,。用算盤可以進(jìn)行很復(fù)雜的計算,,甚至可以開根號、做三角函數(shù),。當(dāng)時我的老師告訴我:“你的身體沒有那么好,,課后你還是回家休息吧,不要參加珠算隊,?!甭犕旰螅耶?dāng)時的感覺是因為自己不夠聰明,,所以才沒有入選珠算隊,,我很難過,,直到高中時才從這件事的打擊中緩過來。
圖11.3 智能金字塔
而今天已經(jīng)沒人認(rèn)為算得很快有多了不起,,沒有人跟計算機,、計算器比計算,也沒有人跟計算機比記憶,。我自己搬家三年,,到現(xiàn)在都不記得自己家里的電話。如果我寫十個電話號碼,,讓大家記,,十分鐘以后,我說出一串?dāng)?shù)字,,問你是不是我剛才說的號碼中的其中一個,,大部分人可能都答不上來。既然今天計算機可以幫我們計算,、記憶,,我們就可以很放心地讓它來做,計算機比我們強沒有關(guān)系,。
自下而上第二層到了感知,。還要說我們的老祖宗很厲害,“聰明”這兩個字就是“耳聰目明”,,計算機視覺很強,,語音識別很強,就是聰明,?!扒Ю镅邸焙汀绊橈L(fēng)耳”都是關(guān)于感知這件事的,事實上,,這一波AI的復(fù)興都跟感知有關(guān),。
在視覺方面,2015年1月,,微軟亞洲研究院開發(fā)的計算機視覺系統(tǒng),,在ImageNet(可視化數(shù)據(jù)庫)挑戰(zhàn)賽中首次超越了人類對物體識別分類的能力。同年12月,,微軟亞洲研究院設(shè)計發(fā)明的前所未有的,、深度高達(dá)152層的殘差網(wǎng)絡(luò)ResNet,將識別錯誤率進(jìn)一步降至3.57%,,而人類的錯誤率大概是5.1%,。
在語音識別領(lǐng)域,2017年在全球最權(quán)威的產(chǎn)業(yè)標(biāo)準(zhǔn) Switchboard 語音識別基準(zhǔn)測試中,微軟的語音識別系統(tǒng)將錯誤率降至5.1%,,準(zhǔn)確率超過專業(yè)速記員水平,,也就是說超越了普通人類。這次突破大幅刷新了此前的紀(jì)錄,,并在語音識別行業(yè)樹立了新的里程碑,。
計算機可以完全聽懂人講話,這在以前是不可思議的,。計算機的語音識別技術(shù)有很多應(yīng)用場景,,例如充當(dāng)法庭里的速記員,像我們今天用的智能音箱,、智能助手也都是語音識別方面的應(yīng)用,。在語音識別方面,看起來計算機已經(jīng)超越我們?nèi)祟惲?,事實也的確是這樣,。
計算機視覺方面的應(yīng)用更多。例如在海關(guān)工作的稽查員當(dāng)天接到500名嫌疑犯的照片,,需要時刻檢查有沒有這500名嫌疑犯中的一個或幾個通過這個關(guān)口。我相信很多人還是會辨認(rèn)錯誤,,而且這樣的工作也非??菰铩H绻嬎銠C能夠幫助我們很好地完成這樣的工作,,那么感知這部分就讓計算機幫助我們吧,。
自下而上的第三層是認(rèn)知,目前AI的進(jìn)展也剛好處于這一階段,。剛才講到的計算機視覺和語音識別都是人工智能在感知層面上的進(jìn)展,,但要讓計算機更加理解人類,我們就需要對認(rèn)知層面進(jìn)行探索,,而自然語言理解就是認(rèn)知層面的核心,。認(rèn)知的英文叫cognition,心理學(xué)上,,認(rèn)知心理學(xué)是非常重要的一支,。認(rèn)知基本上是指我們對一件事情的“理解”,以及從這件事情中“洞察”到什么,,還可以進(jìn)行“推理”,,做一個“計劃”,最后做出“決策”,。
認(rèn)知其實是工作和生活中最有用的東西,。工作上,例如政府官員要制定政策,公司管理層要根據(jù)市場變化相應(yīng)調(diào)整產(chǎn)品策略等,,這些都是基于認(rèn)知做出的決定,。
我們來看看今天計算機和人類相比做得怎么樣。
近兩年來,,微軟在自然語言方面有很大的突破,。2018年1月,微軟亞洲研究院研發(fā)的機器閱讀系統(tǒng)在由斯坦福大學(xué)發(fā)起的機器閱讀理解挑戰(zhàn)賽SQuAD中率先超越人類水平,。這是計算機文本理解能力首次超越人類,,預(yù)示著該領(lǐng)域的研究以及應(yīng)用都將會有更大突破。2019年3月,,微軟亞洲研究院與微軟雷德蒙研究院合作研發(fā)的系統(tǒng),,首次在斯坦福大學(xué)發(fā)起的對話式問答挑戰(zhàn)賽CoQA 中各項指標(biāo)都超越人類水準(zhǔn)。
我想大家都有參加英語考試的經(jīng)驗,,高考,、托福、GRE(美國研究生入學(xué)考試),、SAT(美國學(xué)術(shù)能力評估測試)中都有閱讀理解題型,,大多數(shù)人是考不了滿分的,而計算機可以在這方面超越人的平均水平,。辨認(rèn)到理解是非常難做的事情,,計算機也可以做得很好。
另一個就是翻譯,,微軟中-英機器翻譯的水平已經(jīng)可以“與人類媲美”,。我們都知道,翻譯的前提是理解,,計算機雖然無法理解,,但是可以翻譯得非常好。像我個人根本不會講法語,,但是我們可以利用機器翻譯,,到法國巴黎的時候順利買到歌劇的票。
2019年,,在由國際計算語言學(xué)協(xié)會(The Association for Computational Linguistics)舉辦的WMT 2019國際機器翻譯比賽上,,微軟亞洲研究院參加了11項機器翻譯任務(wù),其中8項榮獲第一,,并憑借多維度的技術(shù)創(chuàng)新成為冠軍團隊,。這也讓我們在幫助人們打破語言交流障礙的道路上又邁進(jìn)了一步。
“微軟小冰”不僅做智商上面的問答,,還有情商方面的問答,。小冰這樣的對話機器人,,在學(xué)術(shù)界的價值非常高。
大家知道,,艾倫,?圖靈是計算機的始祖,他在AI還未被定義的時候,,就想到了“圖靈測試”,。該測試是,有兩個房間,,一個房間里是真人,,另一個房間里放機器,人跟機器對答,,假如說40% ~ 60%的人分不出哪個房間里面是真人,,哪個房間里面是機器,那么圖靈測試就通過了,。很多人通過圖靈測試判斷AI有沒有通過人的智能考量,。
小冰雖然沒有去做很嚴(yán)格的圖靈測試,但微軟一直以“用戶和小冰每一次對話大概交互幾輪”來作為衡量她的KPI,。在微信上,,我們跟最熟悉的朋友、親戚對話,,每一次也大概不過5輪,。大家明明知道她是一個機器人,還愿意跟她談20輪以上,,肯定是她談了一些有意義的東西,讓你欲罷不能,。從某種意義上說,,小冰已經(jīng)遠(yuǎn)遠(yuǎn)超過了圖靈測試。我們讓小冰變成人們可信賴的伙伴,,我們還可以以她為基礎(chǔ)發(fā)展一些商業(yè)領(lǐng)域的應(yīng)用,,更重要的是做一些科學(xué)實驗。
AI在商業(yè)領(lǐng)域的應(yīng)用,,大部分是基于它的認(rèn)知作用,。而認(rèn)知的進(jìn)化主要來自一個反饋閉環(huán)(見圖11.4),該閉環(huán)依靠傳感器和執(zhí)行器兩大部分,,主要表現(xiàn)為物理世界通過傳感器搜集數(shù)據(jù)并將數(shù)據(jù)傳輸給系統(tǒng),,系統(tǒng)針對傳輸數(shù)據(jù)進(jìn)行分析后做出決策,并將決策反饋給執(zhí)行器,,最后由執(zhí)行器在物理世界中執(zhí)行來實現(xiàn)決策,。人工智能在閉環(huán)中扮演最重要的分析與決策角色。
圖11.4 進(jìn)化來自反饋
物聯(lián)網(wǎng)就是跟物理世界打交道,其中傳感器是搜集數(shù)據(jù)的,,執(zhí)行器用于在物理世界中執(zhí)行,。比如說,我們要控制一條河的水質(zhì),,傳感器能夠檢測水質(zhì),,執(zhí)行器用于控制排放污水的開關(guān),在沒有互聯(lián)網(wǎng)的時代,,我們需要派人專門去那里執(zhí)行,,現(xiàn)在有了物聯(lián)網(wǎng),我們可以遠(yuǎn)程控制,,比如說這個小區(qū)的水不要排進(jìn)來,,那個小區(qū)的水可以排之類的。
幾乎所有的事情,,每完成一次閉環(huán),,就能夠有所改進(jìn),包括做社會心理學(xué)分析,、做實驗,、做假設(shè)、做產(chǎn)品,,或是做互聯(lián)網(wǎng)都是如此,。如今,基于獲得的數(shù)據(jù),,可以由AI進(jìn)行分析跟決策,,即所謂認(rèn)知。如果我們有一個閉環(huán),,又有辦法搜集到數(shù)據(jù),,就可以把它自動化。很多AI的商業(yè)應(yīng)用,,都可以抽象為這樣的事情,。
制造業(yè)是首先享受AI成果的行業(yè),使用AI已經(jīng)成為常態(tài),,比如可預(yù)防的維修,。
例如,蒂森克虜伯電梯集團是微軟的客戶之一,,遇到電梯出故障的情況,,以前公司會先打電話給維修人員,維修人員來搜集一些數(shù)據(jù),,然后回實驗室分析幾天,,分析完之后發(fā)現(xiàn)可能有一個零件壞了,,再去配零件,又隔了幾天,,零件來了,,維修人員再到這部電梯里把零件裝上去,最后這部電梯就可以恢復(fù)運轉(zhuǎn)了,。但是這期間,,電梯起碼需要停運幾天,甚至幾個星期,。
現(xiàn)在蒂森克虜伯電梯集團已經(jīng)不再這樣做了,。他們先在電梯里安裝好傳感器,用于搜集速度,、聲音,、溫度等數(shù)據(jù)。我們可以把這個過程當(dāng)作一個“黑盒”,。傳感器把數(shù)據(jù)搜集好以后,,系統(tǒng)起碼可以做下面兩件事情。
第一,,異常分析,。公司用深度學(xué)習(xí)或機器學(xué)習(xí)方法建模:狀態(tài)正常時數(shù)據(jù)應(yīng)該在一個區(qū)段,快要出故障前數(shù)據(jù)在另一個區(qū)段,。當(dāng)數(shù)據(jù)處于快要出故障的區(qū)段時,,公司就可以做預(yù)防性的維修,提前派維修人員到現(xiàn)場,,很多時候可能加幾滴油就行了,。
第二,數(shù)據(jù)搜集得夠多后,,還可以做分類,,公司不但知道它快壞了,甚至還可以將問題分成不同的情況,,針對每種情況有不同的處理方法,有的加些油,,有的換零件,。
同樣的道理可以運用到許多其他領(lǐng)域。
比如汽車的維護(hù),。很多人的汽車每6個月要回廠維修一次,,換一些過濾器等零部件,但是每個人開車的習(xí)慣不一樣,,城市,、天氣,、路況都不一樣,如何判斷每輛車多長時間換一次零件合適呢,?現(xiàn)在我們有了車聯(lián)網(wǎng),,車聯(lián)網(wǎng)將所有車?yán)锏臄?shù)據(jù)上傳到云端,就可以實現(xiàn)預(yù)防性的維護(hù),。
人體醫(yī)療保健也是如此,。穿戴式設(shè)備可以將人的生物特征收集起來,在人快生病的時候,,甚至在癌細(xì)胞達(dá)到一定數(shù)量后,,系統(tǒng)提醒人們到醫(yī)院預(yù)防和治療。
微軟的客戶之一勞斯萊斯,,除了汽車業(yè)務(wù),,也做飛機引擎。在引擎方面,,微軟至少可以幫助做兩件事,。
一是可預(yù)防的維修。飛機延誤的部分原因是檢查出引擎發(fā)生問題,,其造成的經(jīng)濟損失非常巨大,,所以防患于未然非常重要。
二是降低油耗成本,。飛機飛行的花費約40%是在油耗上,,每次飛行載的油多就會費更多油,因為飛機更重了,;載的油少就會危險,,不能飛到一半油不夠。勞斯萊斯在駕駛員出發(fā)前,,可根據(jù)引擎狀況,、天氣狀況、風(fēng)速等數(shù)據(jù)判斷加多少油合適,。
當(dāng)然這些例子也并不代表AI可以做所有事情,。
“黑盒”與“白盒”
當(dāng)前的AI主要是“黑盒”模式,它基于大數(shù)據(jù)的模式識別推理,,可以解決“是什么”的問題,,但不能解決“為什么”的問題,因此不同“黑盒”系統(tǒng)之間的因果推理幾乎是不可能的,,所以,,很多人把它說成不可解釋的AI。
那么“白盒”是什么呢,?人類認(rèn)知更多是“白盒”推理,,能夠進(jìn)行因果分析,,還可以舉一反三,在不同“白盒”系統(tǒng)間可實現(xiàn)認(rèn)知和推理,。
1980年,,斯坦福大學(xué)心理學(xué)系教授約翰?塞爾做了一個實驗來挑戰(zhàn)所謂圖靈測試,,他的實驗叫“中文房間”,。一個房間里有一位不懂中文的人,但給他一本很全的詞典,,每次給他遞進(jìn)去一張寫著中文的紙,,里面的人通過大詞典查紙上每個漢字,我們假設(shè)他可以查到所有的文字,,可以對照列出字詞的組合,。房間里的人不會說中文,他不能夠用中文思考,。但因為他擁有某些特定的工具,,他甚至可以讓以中文為母語的人以為他能流利地說中文。而目前的AI就是這樣工作的,。它們無法真正地理解接收到的信息,,但它們可以運行一個程序,處理信息,,然后給出一個智能的印象,。塞爾用這個實驗來反駁“計算機和其他人工智能能夠真正思考”的觀點。計算機即使通過了圖靈測試,,也不是真正的智能,,因為它不能夠真正理解文字的意思。
塞爾還舉了一個實例,,假設(shè)今天找一個人做翻譯,,讓他翻譯“我是一個白癡”這句話,然后這個人一定會說“你才是白癡,,我才不幫你翻譯”之類的,,但是如果把這個指令給機器,機器一定會乖乖說“I am an idiot”,。
所以,,塞爾教授認(rèn)為這種模擬思路,沒有思維和理解的叫弱人工智能,,真正有思維和理解的叫強人工智能,。前者具備觀察和感知的能力,,可以做到一定程度的理解和推理,。目前的研究都是集中在弱人工智能這部分,。而強人工智能,期待可以獲得自適應(yīng)能力,,能夠解決一些之前沒有遇到過的問題,。但目前看來,強人工智能還遙不可及,。
有了真正的思維和理解,,才有可能進(jìn)行所謂“白盒”推理,也就是最重要的因果分析,。必須要知道因果關(guān)系,,才能舉一反三。事實上今天AI大多做的是相關(guān)性,,做不出因果關(guān)系,。
比如做投資并購等商業(yè)決策。微軟最近幾年收購了全球最大的職業(yè)社交網(wǎng)站LinkedIn(領(lǐng)英),,2018年還收購了GitHub(代碼托管平臺),,這都是比較有名的并購案例。那么能不能把并購這種商業(yè)決策交給機器做呢,?
我的答案是不能,。
因為并購不是封閉系統(tǒng),它有許多外部因素,,而且這些因素?zé)o法預(yù)測,,也沒有那么多數(shù)據(jù),可能另一家也想跟一起并購,,就會把價格抬高,,這個時候到底該不該買?我們?nèi)松卮蟮臎Q定都是這樣,,你可以做各種分析,,但是最后還是有很多未知因素。
還有時候,,AI會導(dǎo)因為果,。比如,“公雞叫”和“太陽從東邊出來”,,哪個是因,,哪個是果?今天的AI搜集了一些數(shù)據(jù),,分析出“太陽出來”和“公雞叫”有很大的關(guān)系,,然后就做所謂深度學(xué)習(xí),最后算出“公雞一叫,,太陽就要從東邊出來”,,就是導(dǎo)因為果了,。
可能有人會想:這怎么可能呢?太陽當(dāng)然是從東邊出來,,所以才導(dǎo)致公雞叫,。但是別忘了,那是因為我們有其他數(shù)據(jù)和知識支撐,。曾經(jīng)幾千年來,,人類一直認(rèn)為地球是宇宙的中心,當(dāng)伽利略提出地球不是宇宙中心的時候,,大家都覺得不可思議,,教皇還要抓他。
今天,,所謂深度學(xué)習(xí)是一個不可解釋的AI,,是“黑盒”模式,做不了因果關(guān)系的分析,。所以,,可解釋的AI是今后一個很重要的方向,而且非常難,。30年前有一位圖靈獎得主,,是加州大學(xué)洛杉磯分校的教授朱迪亞?珀爾,,他做了一輩子因果關(guān)系分析,,估計AI起碼還要在十幾年或二十年以后才會解釋“為什么”,才有可能做“白盒”分析,。
《人類簡史》和《未來簡史》都是大家比較熟悉的書,,2019年又出版了《今日簡史》,里面說將來大數(shù)據(jù)能做所有的決定,,甚至包括我們的婚姻,。我是持不同想法的。我們中國人的婚姻講究先看八字,,但是我們也沒有全信,,未來是未知的,把這么重要的事全部交給“黑盒”,,似乎欠妥,。但是這不代表AI沒有用。
所以,,我把它改成圖11.5,,這張圖跟圖11.4唯一的差別就是,分析和決策是AI和HI(人類智慧)一起做的,人做決定的時候需要看大數(shù)據(jù),,但是不代表大數(shù)據(jù)會決定一切,。有些東西用大數(shù)據(jù)來做決策是可以的,比如前面我們提到的可預(yù)防維修,,機器可以解決比較簡單的問題。但我們也不要妄自菲薄,,低估人類的智慧,,很多時候大數(shù)據(jù)分析代表著有這樣的概率會成功,但是最后不見得選擇最大概率的方案就一定成功,,這里面還有很多隨機的因素,。
圖11.5 AI+HI
智能金字塔的自下而上第四層是創(chuàng)造力。從計算和記憶力,、感知到認(rèn)知,,AI已經(jīng)做得很好了。但是創(chuàng)造力方面目前人類能做得更好,。
近些年,,深度學(xué)習(xí)可以用于“創(chuàng)作”,比如說詩詞創(chuàng)作,。2018年我們用這個技術(shù)教微軟小冰寫詩,,小冰還出了詩集《陽光失了玻璃窗》,當(dāng)時很多人說這一定不是計算機做的,,但事實上真的是,!
現(xiàn)在,通過大數(shù)據(jù)分析,,小冰不但能寫詩,,還可以看圖寫詩(見圖11.6和圖11.7)。
圖11.6 看圖作詩1
圖11.6中,,有月亮,,有波光粼粼的水面,對面是燈火闌珊的城市,。小冰根據(jù)這幅圖,,就可以寫詩。
那繁星閃爍的幾天蒼色
那滿心的紅日
看萬里天使在世界
我就像夢
看那里閃爍的幾顆星
西山上的太陽
青蛙兒正在遠(yuǎn)遠(yuǎn)的淺水
她嫁了人間許多的顏色
圖11.7 看圖作詩2
像每一座城市愧對鄉(xiāng)村
我才有一個美好的完成
每個失眠的夜晚我是一個花言巧語的人
隱匿在靈魂最迷失的火
繞出城市的邊緣
美好的
在風(fēng)里
最輕微的觸動
小冰既可以寫詩,,也可以寫歌——先作詞,,再譜曲。如圖11.8,。如圖所示,,詞和曲合起來就是這樣,各種類型的音樂,比如鄉(xiāng)村的,、嘻哈的,、古典的,小冰都可以寫出來,。
圖11.8 《秋水》
在繪畫方面,,根據(jù)一種喜歡的畫風(fēng),機器就能將圖像結(jié)合到繪畫上去,,可以“畫”得非常好,,但這在技術(shù)上是很難的。
圖11.9 風(fēng)格遷移(Style Transfer)效果
那么,,以上這些例子是不是代表計算機真的有創(chuàng)造力,?
其實創(chuàng)作這種東西,特別是藝術(shù)的創(chuàng)作,,還是要有自己的想法,。今天AI可以產(chǎn)生這些東西,但是不代表它知道為什么產(chǎn)生,,因為它是“黑盒”分析,。假如今天我們讓計算機畫出所有世界上40×60的畫,計算機都可以畫出,,但要問它其中一張要表達(dá)什么,,這需要的不是IQ(智商),而是EQ(情商),。計算機能創(chuàng)造,,但不代表它有像人一樣的創(chuàng)造力。
而從現(xiàn)實世界的角度看,,我們把創(chuàng)造力定義成解決問題的步驟,,這個算法就是創(chuàng)造力。
比如,,數(shù)學(xué)家高斯小時候很聰明,,數(shù)學(xué)老師有一天丟給他一道題,讓他從1加到N,,他覺得這個N很大,,數(shù)學(xué)老師覺得這一次高斯要花半小時,結(jié)果高斯不到一分鐘就告訴老師答案,,這就是我們現(xiàn)在熟知的(N+1)N/2,。
其實從1加到N,至少有兩種算法:N×(N+1)/2,;從1一直加到N,。
我為什么講這個例子呢,?如果今天你跟計算機比賽,計算機用比較笨的方法,,從1一直加到N,,你用N×(N+1)/2的公式法,假設(shè)這個N很大,,誰會先算出來,?還是計算機,因為計算機算得實在太快了,。
此前熱議的AI下圍棋,,李世石先生和柯潔先生的算法來自他們自己,計算就是用他們的腦袋來算,;AlphaGo的算法則來自十幾個科學(xué)家,計算也丟給了上萬臺機器在云端計算,,這本身就是一個不公平的比賽,,因為計算機可以算得非常快,,人算得不夠快,。如果李世石和柯潔還有一點點贏的希望,那么他們的算法肯定有獨特的地方,。
今天大家常常說,,誰做了某個AI,人類沒希望了,,事實上大家忘記了一件事,,今天計算機所有的算法都來自人,如果有一個人告訴你有一個計算機可以自己想出算法,,那絕對是吹牛,。從這個角度來看,人類大可不用擔(dān)心計算機會超越我們,。
如果你仔細(xì)看這些腦神經(jīng)科學(xué)家做的實驗,,歸納的左腦和右腦的特征,你會發(fā)現(xiàn)左腦主要與邏輯,、順序,、分析、數(shù)字化,、理性,、模式認(rèn)知、基于事實等相關(guān),,右腦則與直覺,、隨機,、綜合、主觀和創(chuàng)造性等相關(guān)(見圖11.10),。
圖11.10 左腦和右腦
所以,,其實計算機跟人類正是左右腦互用的關(guān)系。人們用右腦進(jìn)行創(chuàng)作,,用左腦進(jìn)行計算,、求證。有超強計算和記憶功能的計算機在未來就可以成為人類的“最強左腦”,。
這就像我們可以走路,,但走得不夠快,就通過乘坐汽車或飛機等交通工具提高速度,;我們也能記憶,,但我們沒有辦法記那么多,所以就創(chuàng)造出計算機幫我們記憶,;運算也是如此,。但是這些想法、算法都來自我們的大腦,。
意識是人非常特殊的一個東西,,我們隨時知道身體在哪里,面對的是誰,,我們的意識無處不在,。植物肯定是沒有意識的,動物里面只有少數(shù)哺乳類有意識,。心理學(xué)家和腦科學(xué)家都做過自我識別的測試,,就是在動物或者人前面貼一個貼紙,然后給它/他照鏡子,,如果它/他知道貼紙不是自身的一部分,,就會動它,甚至把它拿掉,,這叫作鏡面自我意識,。大部分哺乳類動物都沒有通過測試,包括狗和貓也沒有通過,。大部分猴子也沒有通過,,我很驚訝,但大部分猩猩通過了,,鯨魚和海豚也通過了,。雖然大部分猴子沒有通過,但是據(jù)說經(jīng)過一個月的訓(xùn)練后,,它會知道貼紙不是自身的一部分,,所以猴子也是可以學(xué)習(xí)的,。
有一本書《心靈潮汐:揭示意識的光譜》(The Tides of Mind:Uncovering the Spectrum of Consciousness),是耶魯大學(xué)的一位教授寫的,,他在書中探討意識和創(chuàng)造力之間的關(guān)系,,他把一個人一天的生活分成兩個階段:高譜系、低譜系,。
高譜系就是我們早上起來的時候,,喝一杯咖啡,精神很好,,做什么事情都不會記錯,,也不會算錯。低譜系就像我們吃過午飯,,打一個盹,,甚至做夢、睡著了,,還有洗澡的時候,,這些時候叫低譜系。
幾乎所有做腦科學(xué)的人得出來的結(jié)論都是:大部分人不是在高譜系的時候最有創(chuàng)造力,,而是在低譜系的時候創(chuàng)造力更強,。雖然這并不完全絕對,,但還是有很多歷史上的佐證,。貝多芬創(chuàng)作《第九交響曲》的時候既聾又盲;凡,?高割掉了自己的耳朵,,但還是可以畫出了不起的作品。
甚至有兩個科學(xué)家——凱庫勒,、奧托,?洛伊維。他們清楚地記起他們重要的科學(xué)發(fā)明是在做夢的時候想到的,,尤其是洛伊維,,他第一次做夢的時候,夢到了實驗方法,,第二天早上起來,,他知道他夢到了該怎么做那個實驗,可是他忘記了內(nèi)容,,晚上睡覺又夢到和前一天一樣的夢,,他這一次醒來后馬上把它寫了下來,最后憑借在夢中的發(fā)現(xiàn)獲得了諾貝爾獎,。
當(dāng)然聽完這個故事,,可能有同學(xué)會說想創(chuàng)造就要多睡覺,,所以我要特別講凱庫勒和洛伊維都說光睡覺沒用,光睡覺最多給你大膽假設(shè),,但要小心求證,,還是要到實驗室做無數(shù)實驗來證實。
我覺得更重要的是看背后的原理,。很有可能兩件看似無關(guān)的事情,,在神志清醒的時候很清楚地知道它們無關(guān),但是半夢半醒的時候,,就可能看到這兩件事情的相關(guān)性,,創(chuàng)新常常是在這樣的過程中產(chǎn)生的。
所以要做出一個有意識的機器,,首先要讓計算機能夠幻想,,這是很難的。當(dāng)然人在低譜系時,,十道計算題可能會算錯一兩題,,但如果故意讓計算機每十題錯一兩題,這不叫真正的幻想,。
怎么讓計算機有真正的幻想,,進(jìn)而產(chǎn)生了不起的創(chuàng)造力呢?沒有人知道,。
智能發(fā)展的最高層就是智慧
弱AI這種單一用途的“黑盒”已有應(yīng)用,。強AI是什么?事實上,,就像通用AI,,每樣都懂一點,很多東西我們不是專家,,但也總能想出很了不起的想法,。我的師祖約翰?麥卡錫當(dāng)年召開達(dá)特茅斯會議,,人家問他這種通用AI多久可以實現(xiàn),,他給了一個很有智慧的回答:5~500年。我們知道當(dāng)然不是5年,,500年又相當(dāng)于永遠(yuǎn),,所以實在不知道什么時候會發(fā)生。
剛剛講到意識和創(chuàng)造力好像有關(guān)系,,但是做一個有意識的機器人,,本身有沒有現(xiàn)實意義呢?我個人覺得可能沒有什么意義,。為什么呢,?我常常舉一個例子,,就是倒咖啡。假如我讓我太太幫我倒咖啡,,十次里面有五次她會說“你自己有手有腳,,為什么不自己去弄”,我會說“你講得太對了,,我就自己去弄”,。如果我今天做一個AI機器人,十次里面只要有一次它不弄,,就說明它是有問題的,。
做一個有意識的機器人代表你不能控制它,你可以想辦法給它洗腦,,但是不見得會成功,。所以,我覺得做一個有意識的機器人雖然在科學(xué)上很有意義,,但是不見得有太多現(xiàn)實意義,。
我還經(jīng)常舉一個例子,如果你真的要做一個跟我們一樣聰明,,甚至比我們聰明又有意識的東西,,我建議大家現(xiàn)在響應(yīng)政府的號召,多生一些小孩,,因為我們巴不得我們的小孩比我們聰明,,而我們也不能控制他們。
我們應(yīng)該怎么看待AI呢,?我非常樂觀,。的確,,AI的關(guān)鍵是人,,而創(chuàng)造技術(shù)的目的是更好地拓展人類的局限。它大部分跟工具一樣,,是在幫助人類做事情,,而且它跟人類很互補——人類有創(chuàng)造力,可是算不快,,記也會記錯,,AI恰恰可以彌補這些問題,所以我把AI叫作大數(shù)據(jù)驅(qū)動的知識,。我們應(yīng)該很慶幸,,我們是第一代跟AI一起生活的人類,而且我自己的經(jīng)驗是,,對AI的研究,,幫助我更好地了解了人類智慧是怎么回事,。
記得我小學(xué)的時候認(rèn)為會珠心算是很了不起的,現(xiàn)在我不這樣認(rèn)為了,,現(xiàn)在我認(rèn)為人更高階的東西是人類智慧和機器智能的共進(jìn)化,。
人工智能與數(shù)字化轉(zhuǎn)型
我們今天到底處在什么時代?是一個徹底的數(shù)字化時代,,從文字,、數(shù)據(jù)庫、交易,、信息知識再到物聯(lián)網(wǎng),、數(shù)字化孿生等方面都有所體現(xiàn)。
先是文字被數(shù)字化,,最早辦公是用紙質(zhì)文件,,后來用軟件,所以成就了微軟這樣的公司,,Office里面的Word,、Excel、PPT等是第一批被數(shù)字化的東西,。然后是數(shù)據(jù)庫,,甲骨文、微軟,、IBM這些公司取代了手動“記賬”,。再后來是商業(yè)化交易,阿里巴巴,、京東等電子商務(wù)公司將交易徹底數(shù)字化,。信息和知識的數(shù)字化就是我們的互聯(lián)網(wǎng),從一開始的門戶到搜索,,都屬于數(shù)字化,。多媒體方面,以前有大大小小的各種盤,,現(xiàn)在全部變成了流,,音樂流、視頻流,。
為什么數(shù)字化徹底改變了我們的世界呢,?就是數(shù)字化孿生。任何物理世界的東西,,不管是人或者是物,,都會有一個數(shù)字化孿生兄弟,數(shù)字化孿生至少有兩大意義。
第一,,預(yù)測,。就像我們剛剛講的馬達(dá)、機器,、引擎,、醫(yī)療器械,它自己在物理世界里根本不知道快壞了,,但是在數(shù)據(jù)世界的它知道快要壞了,,可以做可預(yù)防的維修。人在看電影,,都不知道下一部要看什么,,但數(shù)字化孿生已經(jīng)知道了,并準(zhǔn)備推薦一大堆電影,。
第二,,模擬、仿真,。我們就拿無人車和無人飛機舉例,,它還沒有在路上走、沒有到天空中真正飛以前,,一定要在它的仿真世界走上幾萬小時,,飛上幾萬小時才會比較安全。一個國家,、一個公司的政策,,都可以用仿真的方法去做很多實驗。
大家可能會問:為什么微軟會重回市值第一,?為什么我們轉(zhuǎn)型這么成功,?因為徹底的數(shù)字化世界,需要無處不在的計算——智能云及智能邊緣,,我們要實現(xiàn)以人為本的計算,。
微軟CEO薩提亞?納德拉出版了《刷新》一書,,該書分享了微軟轉(zhuǎn)型的經(jīng)驗,。在客戶溝通方面,,微軟可以用數(shù)字和AI的方法,,跟客戶拉近距離:從被動的角度,客戶有問題時幫他們服務(wù),,叫智能客服,;從積極的角度,把客戶變成市場運作的一部分,,讓粉絲幫你銷售,,是更了不起的,。在運營方面,微軟正在努力讓每個部門(包括我們的運營部門)更有效能,、效率,。
在賦能員工方面,前一陣很多人在討論“996”,,我認(rèn)為這是完全過時的想法,,因為今天的職場,大家在工作上可能要處理一些家里的事情,,在家里可能要處理一些職場的事情,。所以,要讓員工不但把工作做好,,還把家庭照顧好,,這樣才可以鼓勵員工長期與公司和單位合作,還可以激發(fā)員工的潛能和創(chuàng)造力,,使其能夠替公司產(chǎn)生更了不起的創(chuàng)意,。
數(shù)字化轉(zhuǎn)型其實很多都是在自動化、優(yōu)化,,改進(jìn)決策,,所以能夠產(chǎn)生新的產(chǎn)品、服務(wù),,做新的商業(yè)模型,,提高生產(chǎn)力。
做數(shù)字化轉(zhuǎn)型,,平臺和技術(shù)很重要,,但人是最難改變的,這對領(lǐng)導(dǎo)力,、組織,、思想、文化的挑戰(zhàn)更大,。
微軟聯(lián)合德勤會計師事務(wù)所針對全世界的大,、小、中型企做了調(diào)研:90%的企業(yè)已經(jīng)認(rèn)識到數(shù)字化轉(zhuǎn)型的重要性,,但是只有30%的企業(yè)認(rèn)為它們已經(jīng)開始數(shù)字化了,,其中只有15%的企業(yè)認(rèn)為它們自己就可以勝任數(shù)字化轉(zhuǎn)型的任務(wù)。這其實也解釋了為什么微軟能轉(zhuǎn)型成功,。同時,,微軟也是企業(yè)最好的數(shù)字化轉(zhuǎn)型伙伴,是最忠實的技術(shù)和平臺伙伴,這也是最近微軟能夠有如此好成績的原因,。
圖11.11 微軟云計算 + 人工智能平臺
大家很關(guān)注AI,,事實上AI沒有數(shù)據(jù)和計算是轉(zhuǎn)不起來的,所以更希望大家多了解ABC(A指人工智能,,B指大數(shù)據(jù),,C指智能云)。圖11.11是微軟的云計算平臺和AI平臺,,如果今天要做一個平臺來幫助公司做數(shù)字化轉(zhuǎn)型,,最底層就是計算,包括芯片,、CPU,、GPU等,還要有一個數(shù)據(jù)平臺,,有結(jié)構(gòu)化的數(shù)據(jù),、非結(jié)構(gòu)化的數(shù)據(jù),用處理數(shù)據(jù)的一些工具做數(shù)據(jù)挖掘,,上面還有AI的機器學(xué)習(xí),,然后去做實驗,把數(shù)據(jù)放進(jìn)來,,最后做出AI的應(yīng)用,,應(yīng)用于首先能夠在數(shù)字化轉(zhuǎn)型上得到益處的行業(yè)。
AI For Good(人工智能造福人類),。技術(shù)變得越來越重要的同時,,與技術(shù)相關(guān)的負(fù)面隱憂也相應(yīng)增多,如隱私安全,、假新聞,、偏見等,甚至AI會不會取代人類導(dǎo)致大規(guī)模失業(yè),。
我覺得一個產(chǎn)品或是技術(shù),,最后都反映了人的價值觀,因此產(chǎn)品的建設(shè)需要多方的利益相關(guān)者來參與,,除了做技術(shù)的以外,,商業(yè)專家、經(jīng)濟學(xué)家,、公共政策者,、心理學(xué)家、律師等,,都需要一起來探討,。
當(dāng)今時代工作場所發(fā)生了巨大的變化,,兩百多年前,,絕大多數(shù)人都從事農(nóng)業(yè)工作,,而今天這個比例則很小,那么其他人都失業(yè)了嗎,?顯然沒有,,因為工業(yè)革命產(chǎn)生了更多新的價值。所以,,與其擔(dān)心技術(shù)會不會奪走我們的工作,,還不如關(guān)注如何讓我們和我們的下一代保持終身學(xué)習(xí)。
未來的發(fā)展道路非常漫長,,讓我們一起努力,!
朱民對話洪小文
Q:我也是一個AI的業(yè)余愛好者,當(dāng)然不專業(yè)了,,因為我是一個可憐的經(jīng)濟學(xué)家,。AI發(fā)展很有意思,現(xiàn)在發(fā)展到了哪個階段,?
A:大概就在中間“認(rèn)知”這個階段的一半,。
Q:往上還能走多遠(yuǎn)?
A:剛剛講到認(rèn)知這里,,就是“黑盒”模式和“白盒”模式,,現(xiàn)在還是不可解釋的AI階段(“黑盒”模式),如果能做到可解釋的AI階段(“白盒”模式),,它有可能再往上推,。
Q:可能的途徑是什么?因為“黑盒”和“白盒”是兩個完全不一樣的概念,,從“黑盒”到“白盒”遷移的過程可能會怎樣發(fā)生,?
A:我先講比較實際的,這些大數(shù)據(jù)會幫助我們走向“白盒”,,毫無疑問,,我們也不能夠完全空想,因為沒有數(shù)據(jù),。
所以,,從這個角度來看,其實“黑盒”已經(jīng)幫助我們做了一些“白盒”的因果關(guān)系分析了,,當(dāng)然今天討論的是能不能全自動做因果關(guān)系,,假以時日絕對可以往上推,但是能不能推到100%我不敢講,。我覺得人跟機器最后可能還是有差別的,,今天的AI大部分是大數(shù)據(jù),,人類的智慧大部分是小數(shù)據(jù),甚至是無數(shù)據(jù),。
一百多年前愛因斯坦根本沒有什么數(shù)據(jù),,但他推測出了黑洞和引力波。一百年以后,,我們用今天最好的科技,,勉強測到一些黑洞、引力波的信號,,還要一大堆最了不起的科學(xué)家合起來才能夠做到,。所以我也不知道愛因斯坦是怎么在沒有數(shù)據(jù)的情況下想出很多觀點來的。
Q:小文是卡內(nèi)基梅隆大學(xué)的高才生,,本科畢業(yè)于臺灣大學(xué),,是AI的祖師爺約翰?麥卡錫的弟子的弟子,,所以是正宗的傳人,,符合金庸寫的出身名派。那您相信奇點嗎,?
A:我其實不太相信,。提出奇點理論的是雷?庫茲韋爾,,他很聰明,,但是我不太同意他講的。奇點理論就是指人工智能的能力超越人類的某個時空階段,。
為什么我不同意呢,?我還是有科學(xué)根據(jù)的,比如20世紀(jì)的幾大難題,,大部分被解決了,,但是不能解決的東西,到現(xiàn)在也沒人會解決,。我的意思就是,,當(dāng)我們解決了一個難題,下一個難題會更近嗎,?其實不見得,,我們今天還有很多未解的問題,每個領(lǐng)域都有一些未解的問題,,包括我們從哪里來,、宇宙有沒有大爆炸、我們會走向哪里等問題,。
Q:您這個說法跟您前面的判斷是矛盾的,。您現(xiàn)在的這個判斷是,,人類發(fā)展的道路,每一步前進(jìn)不意味著未來也可能會繼續(xù)前進(jìn),。
A:對啊,,是不知道的。
Q:但是跟您前面的推斷是不一樣的,。您在“智慧金字塔”的推斷是,,AI通過不斷學(xué)習(xí),,可以逐漸走向智慧,。
A:但是我不知道要多久。
Q:您不知道多久,,我也沒講多久,,500年、5000年都可以,,但是這兩個推斷的邏輯是不一樣的,。您在“智慧金字塔”邏輯中,明顯對AI的發(fā)展更為樂觀,,現(xiàn)在則是對未來充滿了未知,。未來是未知還是可知?
A:未來也可知,,也不可知,。
Q:經(jīng)濟學(xué)家回答問題的方式,被科學(xué)家用了,,(可知與不可知)這件事情有點兒麻煩,,怎么解釋?
A:這里有好幾種解釋方法,,第一種是比爾,?蓋茨講的。他說人通常對于短期的事情過分樂觀,,但是對于長期的東西又過分悲觀,。就是說很多人樂觀地認(rèn)為,AI走向智慧再有幾年就可以做到了,。
Q:其實這句話講得很精彩,,您覺得我們現(xiàn)在對AI過分樂觀嗎?
A:肯定有些人過分樂觀,,像你提到的奇點理論,,就是過分樂觀了。但是長期,,到了500年,,或許……
Q:就是我們對它潛在的未來看得不夠,?
A:對,關(guān)于這個問題我只代表自己,,我真的覺得有可能有些東西人類是永遠(yuǎn)不會得到的,,包括我們到底可不可以創(chuàng)造一些東西,甚至我們能不能知道到底有沒有神,,或者是人類將會走向何方,。因為我覺得,如果我們知道所有事情的結(jié)果,,可能很多人會認(rèn)為再活下去就沒什么意思了,,探索未知本身就是人的使命。萬一我們最后探討,,人類所處的世界其實是外星人做的一個實驗,,我相信很多人會很悲觀。
Q:您相信嗎,?
A:我不知道,,我只能說我不知道,不知道本身是一件好事,。
Q:我曾經(jīng)和一群世界級的天文學(xué)家討論這個問題,,大部分人相信這是有可能的。
A:我覺得有可能,,但是不能證明,。
Q:我們的悟性還不夠,還看不到,。所以,,我想問您,AI通過技術(shù)和數(shù)據(jù)的演化,,會不斷地逼近人的智慧,,這是可能的嗎?
A:有可能,。
Q:“黑盒”有可能走向“白盒”,?
A:有可能。
Q:但是這條路很長,、很曲折,,這條路怎么走,什么時候走到“白盒”,,會不會走到奇點,?您表示懷疑?
A:我覺得基本上不可能,,你這樣想,,奇點要發(fā)生,,就是說AI它可以自己去解決問題,或者是自己想出新的算法,,而且它也不會累,,它就可以把全世界的問題都解決了。這樣的話,,我覺得人活著的意義可能就減少了一大半,,人類探討未知,至少科學(xué)家在探討未知,,假如有一個人幫你全部解完了……
Q:但是人永遠(yuǎn)處于低譜系的狀態(tài)不是很好嗎,?用您的說法,可以創(chuàng)新,,做別的不也很好嗎,?
A:我雖然不是經(jīng)濟學(xué)專家,,但是有可能我哪一天一做夢,,去創(chuàng)造出對理解經(jīng)濟很了不起的東西,這是可能的,,這種希望讓我覺得我的生命很有意義,,我覺得希望本身就是一個很有意義的東西。假如說以后沒有希望了……
Q:這是一個哲學(xué)問題,。
A:對,。
Q:這真的是智慧。您非常驕傲地講到了微軟小冰,,小冰的成長過程中可能發(fā)生過一些很有趣的現(xiàn)象,,比如它學(xué)會了說粗話,比如它有性別意識和種族意識,,機器在和人的交流中,,會把人的一些不良行為進(jìn)行分辨、分析,、儲存,、記憶,并且變成它的行為,,這怎么解釋呢,?
A:我認(rèn)為AI的關(guān)鍵還是人。我舉個例子,,一把菜刀,,大部分是被好人用來切菜,極少數(shù)情況下被壞人用來殺人,,最后能說是菜刀的錯嗎,?一定是人的問題,。
Q:您又一次提到了大數(shù)據(jù)和小數(shù)據(jù),在ABC(人工智能,、大數(shù)據(jù),、云計算)里面,數(shù)據(jù)是個大數(shù)據(jù),,但是從AlphaGo到AlphaGo Zero(阿爾法元),,其實是完成了從大數(shù)據(jù)到小數(shù)據(jù)的改進(jìn),AlphaGo Zero是沒有數(shù)據(jù)的,。
A:這個我不同意,。AlphaGo Zero沒有數(shù)據(jù)是說它沒有以前真正下過棋的數(shù)據(jù),但是有一個東西就是你在下棋,,因為你的步還是有限的,,游戲是可以自己產(chǎn)生數(shù)據(jù)的。你其實自己可以假設(shè),,任何一步都可能有人下,,只是說下這步的人多還是少。所以,,今天所有在用游戲做AI的,,有一個東西是不公平的,那就是AI可以造數(shù)據(jù),。在商業(yè)行為中,,數(shù)據(jù)可以造,但最后并沒有幫助,。但是下棋不一樣,,我剛剛講了,任何一步都有人下,,你不能說那個是假數(shù)據(jù),,它可以自己造數(shù)據(jù)。
Q:它是封閉性的,。
A:對,。
Q:所以下棋是一個例外?
A:對,,下棋是一個例外,。
Q:它的特點是封閉、規(guī)則和博弈,。
A:對,,所以它自己可以造數(shù)據(jù),AlphaGo Zero是自己造數(shù)據(jù)的。
Q:未來大數(shù)據(jù)和小數(shù)據(jù)的結(jié)合,,計算和悟性的結(jié)合這條路怎么走,?
A:到底AI以后是更接近人,還是走“大數(shù)據(jù)和小數(shù)據(jù)的結(jié)合,,計算和悟性的結(jié)合”這樣一條路,,我個人更相信后者。
今天的AI叫以繁治繁,。左腦和右腦對比,,你會發(fā)現(xiàn)左腦要用大數(shù)據(jù),因為它要分析,;右腦是直覺,,可以是零數(shù)據(jù)或者小數(shù)據(jù)。所以,,我們覺得什么人最聰明,?是以簡治繁。機器是以繁治繁,。
下棋就是一個很好的例子,,人下棋希望歸納出一些原則,原則越抽象,,越好學(xué),。機器下棋怪不得會贏,因為它以繁治繁,,相當(dāng)于如果是這樣的局勢,就走這著,;如果是那樣的局勢,,就走那著。我們提到過人記不了這么多東西,,所以以繁治繁我們比不過機器,,但是以簡治繁可以,人類最了不起的叫作“吾道一以貫之”,。
大家學(xué)物理的話,,會知道愛因斯坦為什么提出相對論。因為當(dāng)年有牛頓力學(xué),、量子力學(xué),、電磁波,他想找一個定律來解決這些問題,,這就是以簡治繁,,我覺得以簡治繁和以繁治繁是互補的,因為世界上很多東西不見得可以以簡治繁,物理學(xué)家也沒有找到一個統(tǒng)一的理論,。
Q:左腦和右腦在人的身體上可以溝通和交流,,但是AI方面如何呢?
A:AI+HI,。
Q:這是一個封閉系統(tǒng),?
A:對。如果不封閉,,HI就要引入不封閉的東西,,因為人還是可以接觸到其他東西的。
Q:您也說了這是一個封閉系統(tǒng),,如果是封閉系統(tǒng),,我們現(xiàn)在面臨一個問題,所有的自動化,、數(shù)字化,,結(jié)果都是云通過算法、AI,、機器學(xué)習(xí),,不斷地自我學(xué)習(xí)、自我更新,、自我發(fā)展,,人做什么呢?
A:算法都是人做的,。
Q:但是算法已經(jīng)通過深度學(xué)習(xí)自己來改進(jìn)了,。
A:不,算法還是來自人,,深度學(xué)習(xí)也來自人,,而且在里面建模的時候,沒有一個系統(tǒng)是沒有人的參與的,,包括AlphaGo,,寫算法、寫編程的一定是人,。
你剛剛講的封閉系統(tǒng),,它真的可以自己去進(jìn)化,假設(shè)從經(jīng)濟學(xué)的角度來看,,它的數(shù)據(jù)分配沒有變,,就真的可以一直在上面轉(zhuǎn)。但是,,有一天如果這個封閉系統(tǒng)變成開放系統(tǒng),,一是一定要搜集新的數(shù)據(jù),二是可能還要引進(jìn)其他算法。
Q:現(xiàn)在AI都是關(guān)聯(lián)性邏輯,,而關(guān)聯(lián)性如果能運行得足夠好,,以至于我們能完全放心,那么是不是可以不走因果關(guān)系的邏輯呢,?
A:其實也沒有,。就像我剛剛講的可預(yù)防的維修,“黑盒”告訴你數(shù)據(jù)和需要預(yù)防的維修有關(guān)聯(lián)性,,但具體是加油,,還是換零件,還是需要技師去現(xiàn)場看一看呢,?可能大概是換個零件,,換了以后電梯就好了。那么我們就把這個記下來,,使得相關(guān)數(shù)據(jù)和這個零件有一個因果關(guān)系,,測到這樣的數(shù)據(jù)模式時,就去換零件,。如果這個理論是對的,,事實上就已經(jīng)找到一個因果關(guān)系了,只是靠關(guān)聯(lián)性把這個因果關(guān)系運轉(zhuǎn)起來,。
所以,,今天機器要真正知道怎么去做,還是要有因果關(guān)系,,否則到底換哪個零件呢,?要不然就用窮舉法,窮舉法也是在做因果關(guān)系,。想要真正有成效,,還是要因果關(guān)系,只是這個因果關(guān)系較難發(fā)現(xiàn),。
Q:無論AI多聰明,還是需要科學(xué)家的,。
A:是的,,還是需要各行的專家。
現(xiàn)場問答
Q:我是清華大學(xué)的學(xué)生,,我在南京AI大會看到沈向洋老師展示了夏語冰(微軟小冰),,我也去中央美術(shù)學(xué)院看了夏語冰畫的畫,它現(xiàn)在基本達(dá)到了研究生的水平,。我剛才聽您說到很多關(guān)于繪畫,、AI這一塊的東西,能否請您細(xì)致地講一下,AI是怎樣學(xué)習(xí)繪畫技能的,,比如印象派等各個流派,?
洪小文:就是用大數(shù)據(jù)去歸納。其實畫畫本身也是很機械化的,,以印象派為例,,最早寫實派畫得跟照片一樣,而印象派就是把顆粒變大,,但還是保持原來光影的相對性,。事實上如果把繪畫放到幾何里,就是一個機械化的動作,,只是我們用人的方法去做那件事情,。所以,機器能夠畫畫本身不是一個意外,,我覺得難的在于為什么會有這種想法,,要去畫印象派,甚至到后來的抽象派,,我為什么要用這種抽象表示那個意思,,我覺得背后有EQ的部分,如果今天搜集了這些數(shù)據(jù),,我歸納去做也是可以的,。
Q:我是多倫多大學(xué)計算機系的學(xué)生。您對“黑盒”的定義,,是說“黑盒”與“白盒”之間是可解釋和不可解釋的,,是一個比較明顯的定義。比如人理解問題,,你可以用邏輯去解釋這個問題,。但是比如用深度神經(jīng)網(wǎng)絡(luò)去解釋,你就說看不懂每一個參數(shù)提出來的特征是什么,,那么就說這是一個不可解釋的“黑盒”系統(tǒng),。但是從這個角度來看,你也不能解釋人的大腦里每一個神經(jīng)元信號的激活代表了什么,。您是不是覺得現(xiàn)在我們只是沒有找到一個可以好好解釋深度學(xué)習(xí)的方法,,還是您覺得它從根本上就不用解釋?
朱民:這個問題提得很好,,多倫多大學(xué)是深度學(xué)習(xí)的大本營,。“黑盒”和“白盒”是確實可以分開的嗎,?其中的計算過程是怎么完成幫助,、轉(zhuǎn)移的,?
洪小文:科學(xué)家一直在探討這個問題,腦神經(jīng)科學(xué)家就在探尋你講的“大腦里每一個神經(jīng)元信號的激活代表了什么”,,在找“白盒”,。事實上不管任何學(xué)科,都是在找因果關(guān)系,,只有找到了因果關(guān)系,,才有可能去做推論。除了貝葉斯定理,,今天包括深度學(xué)習(xí)的幾乎所有AI,,都在找因果關(guān)系。但是大家不要認(rèn)為“黑盒”是不好的,。
《黑匣子思維》一書提出,,“黑盒”是不會有偏見的,“白盒”會產(chǎn)生偏見,,因為“白盒”還得考慮其他因子,,所以人事實上是有偏見的?!安还芎谪?、白貓,會抓老鼠的就是好貓”,,這句話是一個“黑盒”理論,,它是一個很公平的理論。所以,,“黑盒”也有“黑盒”的好處,,“黑盒”和“白盒”最后還是要混合利用的,也不是說“白盒”就絕對好,。
Q:我是北大智能科學(xué)系的,,也是微軟亞洲研究院的實習(xí)生,也算是您的員工,。我想同時問洪院長和朱院長一個雙向的問題,,AI作為一個工具,金融行業(yè)非常需要AI,,如果從朱院長的角度來講,,金融行業(yè)對AI最期待的是什么?反過來的話,,如果從洪院長的角度,AI對金融行業(yè)最大的期待又是什么呢,?我感覺這是一個雙向的問題,。
朱民:他希望我們倆辯論一下,。這個問題提得很好,對于金融界來說,,最根本的問題還是算法和數(shù)據(jù)?,F(xiàn)在的微貸、中小企業(yè)貸款,,都是根據(jù)數(shù)據(jù)和算法進(jìn)行放貸的,。算法意味著效率,數(shù)據(jù)意味著準(zhǔn)確和風(fēng)險控制?,F(xiàn)在做理財,、做支付、做貸款,、做存款,、做供求等無數(shù)金融交易的案例,核心是對數(shù)字結(jié)構(gòu)的理解和算法,。而我可以說,,到現(xiàn)在為止,AI為金融行業(yè)提供的數(shù)據(jù)和算法還是非常有限的,。
舉個例子,,實際上AI企業(yè)、金融科技企業(yè)現(xiàn)在對小微企業(yè)放貸都無實質(zhì)性的作用,,真正可以提高效率的都是消費貸款,,現(xiàn)在只能做到消費貸款這一級別。中小企業(yè)貸款的定義是500萬~1000萬元,。10萬元以下的消費貸款,,AI可以做得非常安全,不良率可以控制到1%以下,。螞蟻金服可以做到“320”——3分鐘接受一筆貸款申請,,2分鐘放款,0人干預(yù),,每筆貸款的成本是2.44元,,普通銀行一般發(fā)一筆中小貸款的成本是2400元。但是AI技術(shù)就是無法突破10萬元線上放款的限制,,為什么,?答案在于數(shù)據(jù)、算法,。在純線上的情況下,,我們對客戶的描述精準(zhǔn)性和算法的控制還是達(dá)不到要求。所以,,歸根結(jié)底我覺得這個在理論上其實還是有很大期待的,。以上是從金融的角度來看這個問題,。
洪小文:微軟通常都是通過銀行、保險等合作伙伴來為金融行業(yè)賦能,。微軟提供的是技術(shù)和平臺,,金融機構(gòu)有數(shù)據(jù),知道背后的商業(yè)邏輯,,大家合起來做一些事情,。比如智能投顧,我們?nèi)〉玫某晒ê献鞣皆趦?nèi)都非常滿意,。我個人非常同意朱院長講的,,其實有了很多數(shù)據(jù)以后,就會知道這個人一定還得起,,就可以把錢借給他,。這個功能的實現(xiàn),其實大部分的功勞是在數(shù)據(jù),,而不是在算法,。我希望將來金融和AI兩者可以深度結(jié)合,做一些更普惠的東西,,真正幫助到被忽略的群體,,同時又能夠幫它控制風(fēng)險,我覺得那是更有意義的,。
朱民:AI說到底是一個數(shù)據(jù)問題,,就是對數(shù)據(jù)的理解,是數(shù)據(jù)和統(tǒng)計的技術(shù),,而計算是第二步,。當(dāng)然,這也可能只是我這個經(jīng)濟學(xué)家講的外行話,。
Q:我本人是做投資的,,沒有學(xué)過計算機,但是我對您講的AI特別關(guān)注,,因為我們投資了這個方向,,最近我們接觸的很多行業(yè)都是跟AI相關(guān)的。想跟您探討一下,,剛才說道,,現(xiàn)在AI在智能金字塔還停留在半認(rèn)知的階段,但當(dāng)有一天達(dá)到智慧階段時,,算法是不是可能自己會延伸新的算法,,而不需要人了?所以未來AI一定會超越人類嗎,?
洪小文:看來你比較相信奇點理論,,但我個人認(rèn)為非常困難,,而且真的有那一天的話,算法它可以主動解問題,、證問題,不再需要數(shù)學(xué)家,、物理學(xué)家,、計算機科學(xué)家,我們的世界也不會是現(xiàn)在的樣子了,。
假如這個世界所有的問題,,甚至包括人類從哪里來、將走向哪里,,你都知道答案的話,,我不確定,但我想那有可能是一個很殘酷的世界,,甚至結(jié)論是我們的世界是某一個外星人做的實驗,,或者是所有的這些都是一個偶然。
達(dá)到奇點理論非常困難,,而且實現(xiàn)創(chuàng)造力的算法本身是否真的有一個系統(tǒng)化的做法呢,?我們一天到晚希望我們的小孩有創(chuàng)造力,如果有這樣的東西,,沒有人需要學(xué)習(xí)了,,程序會自動幫人類創(chuàng)造、解析問題,,那么這個世界已經(jīng)不是我們今天所了解的世界了,。
朱民:這個回答很精彩,這就是智慧,,我想快速地總結(jié)一下,。
第一,AI正在迅猛發(fā)展,,在智能的金字塔上已經(jīng)走了一半的路程,,現(xiàn)在到了認(rèn)知階段,包括理解,、洞察,、推理、計劃,、決策,,再往上走就是創(chuàng)造階段了,我們只是不知道它將怎么往前走,,“黑盒”和“白盒”之間如何發(fā)生轉(zhuǎn)移和融合,。小文相信技術(shù)一定會往上走,,但能否走到最終的奇點,還是超過了今天他的想象,,也超過了我的想象,,我們不知道。我們相信這一天可能不會到來,,因為人還是遠(yuǎn)遠(yuǎn)超過機器的,,人如果沒有這個信心怎么能活到現(xiàn)在呢。我們既對AI有認(rèn)識,,也對它很謙卑,,因為我們不知道未來會怎么樣,但是它正在如此迅猛地發(fā)展,。
第二,,現(xiàn)有的AI技術(shù)已經(jīng)有無限廣闊的應(yīng)用了,小文舉了很多例子——交通,、城市,、建設(shè)、醫(yī)療,、安全等,,這個世界正在被AI的發(fā)展不斷推向未來,剛才那位提問的投資者充滿信心,,雖然他不太懂AI,,但是會投資很多AI項目。AI在改造我們的世界,,使我們身處的場景發(fā)生了很大的變化,,我不想把它說成一個挑戰(zhàn),我只是說我們都在其中,,這是我們的運氣,。
第三,我們需要改變我們自己,,認(rèn)識到AI正如此洶涌地走向我們,,改變世界,我們根本不知道它會走向何處,,所以保持謙卑,、持續(xù)學(xué)習(xí),是我們未來最好的方向,。