吳甘沙
馭勢科技聯合創(chuàng)始人、董事長兼CEO
4月17日下午,,湛廬特別邀請圣塔菲研究所客座教授,、《AI 3.0》一書作者梅拉妮·米歇爾,中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任王飛躍,,馭勢科技聯合創(chuàng)始人,、董事長兼CEO吳甘沙,清華大學計算機系副教授,、智源青年科學家劉知遠等國內外知名科學家和創(chuàng)業(yè)者,,以及特別嘉賓達闥云端機器人小姜,一起探討AI 3.0時代的新商機和新生態(tài),。
這次全智能場景發(fā)布會第一次采用了演播室和戶外智能場景雙現場形式,,在無人駕駛汽車和云端智能機器人的烘托下,全面展示了中國人工智能領域的創(chuàng)新實力和前沿進展,。幾位科學家,、企業(yè)家跨界深度交流,共同探討了人工智能發(fā)展現狀,,以及透視當下AI發(fā)展的關鍵問題,,并對產業(yè)布局和政策提出了可供參考的建議,助力未來的想象與開創(chuàng),。
以下為馭勢科技聯合創(chuàng)始人,、董事長兼CEO吳甘沙的演講精華內容
1、無人駕駛是人工智能頂上的皇冠
在科學技術飛速發(fā)展的今天,,人工智能被廣泛應用在多個尖端領域,,比如無人駕駛、生命科學探索及醫(yī)藥制造等,。除了商業(yè)應用,,人工智能還創(chuàng)造了打敗排名世界第一的人類棋手柯潔的輝煌戰(zhàn)績。在所有這些任務中,,自動駕駛被譽為人工智能頂上的皇冠,,這是為什么呢?在吳甘沙老師看來,,無人駕駛獲得這一贊譽的關鍵在于mission critical AI,。
那么什么是mission critical AI呢,?通俗來講,就是關鍵任務人工智能,。它與我們通常所說的人工智能的差別主要在于準確率,。在傳統的人臉識別技術中,我們說其準確率為92%或95%,,事實上,,兩者之間并沒有多大區(qū)別。而在自動駕駛這樣的關鍵任務中,,我們需要確保其準確率達到100%,,或者說無限接近100%。這就好比我們給出了100萬張不同的試卷,,由人工智能來答,,它只能有一張試卷上出錯,其他都必須得滿分,。
就目前投入應用的無人駕駛技術而言,,它所搭載的人工智能實現的是一個非常簡單的閉環(huán),這個閉環(huán)主要包括五個部分,。第一個部分是感知,,而這個感知是通過傳感器來實現的。這些傳感器能幫助車輛“眼觀六路,、耳聽八方”。第二個部分是認知,,用于幫助車輛判斷周圍物體的運動,,識別道路標志等。第三個部分是車輛導航和定位,,導航是知道車輛往哪里去,,定位是明確車輛在哪里。而目前無人駕駛采用的定位技術誤差只有幾厘米,。第四個部分是決策和規(guī)劃,,主要是車輛的中央處理器根據車輛周圍的情況確定下一步的動作。第五個部分是控制,,就是將中央處理器的指令轉變?yōu)榭刂栖囕v底盤的動作,。
2、今天的無人駕駛建立在笨鳥式的人工智能之上
無人駕駛的前景非常吸引人,,但就當前的發(fā)展情況而言,,實現的難度非常大。目前的人工智能,,吳甘沙老師稱其為笨鳥式人工智能,,因為它是通過大量的數據,通過蠻力式的計算,通過歷史的記憶,,比如高精地圖,,整合形成的。車輛需要將沿路的道路記憶輸入進去,,其中還會遇到數據不全或算力不足等問題,,這種情況下,人們就必須做出取舍,,通過設計大量冗余去彌補單個部件的不可靠性,。
就現在汽車安裝的傳感器來說,有基于激光的,,有基于攝像頭的,,有基于毫米波雷達的,有基于超聲波的,。這些傳感器每一種都有其優(yōu)缺點,,在應用過程中,我們需要對其進行組合,。而這種組合跟我們追求的終極的人工智能是有很大差別的,。
所謂的笨鳥式人工智能,意味著要在現有基礎上實現非??煽康臒o人駕駛,,需要積累幾十億公里的數據。目前,,谷歌的無人駕駛汽車積累的數據也不過幾千萬公里,。而幾十億公里,相當于一個人類司機幾百萬年的駕齡,。
很多人通常認為無人駕駛人工智能已經得到了大規(guī)模應用,,而實際情況是我們的科學家和制造者還在研究開發(fā)的過程中,目前的人工智能和我們理想中的職能還有很大的差距,。我們都傾向于稱目前階段的,、仍有許多局限的人工智能為專用人工智能或領域人工智能,即AI2.0,,與其相對的則是通用人工智能,,即AI3.0。AI3.0是人工智能未來發(fā)展的必然趨勢,,而這也是梅拉妮·米歇爾在《AI3.0》這本書中重點介紹的,。
今天的無人駕駛在識別一輛車時,是靠著大量的勞動力對后臺數據一一進行標注實現的,,可以說,,沒有人工就沒有智能,。《AI3.0》中描述了一個場景,,是一個推著嬰兒車的孕婦牽著一條狗出現在路邊,。當人類看到這個場景時,我們可能產生無數種解讀,,比如通過孕婦的表情去判斷,,她臉上的表情是驚詫還是平靜;比如觀察孕婦周圍有沒有人,,這個人有沒有可能對她們采取下一步動作,。人類,即使是小孩都可以輕松對這一場景進行準確,、迅速的判斷,,但對人工智能來說就很難。
解讀這一場景實際上需要大量的認知技能,,比如解讀人與人之間的眼神交流或是博弈關系,。在目前的人工智能中,我們是需要對機器捕捉到的圖片進行標注,,來告訴人工智能圖片中包含哪些信息的,。想要讓機器看到這樣的場景就自動產生正確的解讀,實際是需要下一代更通用的人工智能去解決的問題,。
在無人駕駛人工智能發(fā)展的當下,,我國的發(fā)展速度與國外尤其是美國相比是不算太晚的。而在算法能力方面,,兩者間也不存在代際的差別,,相反,我們還具備一些國外沒有的優(yōu)勢,。目前應用的人工智能2.0,,是由應用驅動,、需求驅動和場景驅動的,。在這些方面,我國具有得天獨厚的優(yōu)勢,。
梅拉妮在《AI3.0》中講到,,無人駕駛人工智能的發(fā)展過程可以分為0~5級,共計6個階段,。就技術發(fā)展而言,,國內的無人駕駛處在4級,嚴格來講,,4級的標準是完全脫離司機的操控,,但因為相關法律法規(guī)的限定,,我們現在都需要在車上配備安全員。特斯拉的auto pilot(自動駕駛)功能則屬于2級,,其本質上是一種輔助駕駛,,主要功能是幫助司機減負,實際的責任人還是司機本身,。而3級則意味著責任人由司機轉變?yōu)轳{駛系統,,這個系統可以在它完整的能力覆蓋范圍內自動駕駛,在必要時尋求司機的干預,。再繼續(xù)往上看,,就到了5級,當前的科學家普遍認為5級是一個可望而不可及的目標,,需要借助AI3.0,,即通用的人工智能才能實現,它可以實現的場景是“隨叫隨到”,。
3,、實現真正的無人駕駛,我們要從AI2.0跨入AI3.0
在無人駕駛領域,,除了數據積累以外,,人們遇到的難題還有很多,其中一些是可解的,,比如它的發(fā)展受限于木桶效應,;另一些則是很難解的,比如“9010原則”,。梅拉妮在《AI3.0》中解釋說,,“9010原則”是指無人駕駛實際上已經走完了90%的道路,但是剩下10%的道路還需要我們花費90%的時間和努力,。
想要破解無人駕駛人工智能未來發(fā)展的種種難題,,關鍵在于我們對人的認知及在相關科學理論方面能否取得突破。那為什么是對人的認知的突破呢,?因為從本質上講,,我們對人腦的工作機制還不甚了解?;蛟S,,我們在腦科學、認知科學方面取得的進展,,才是促進通用人工智能發(fā)展的密鑰,。
在《AI3.0》中,梅拉妮將現在人們關心的人工智能領域的各個熱門領域進行了清晰的梳理,,比如無人駕駛,、機器學習,、視覺識別等,它明確地指出了人工智能目前的發(fā)展階段,,還暢想了未來人工智能領域即將發(fā)生的巨變,。對于想要了解人工智能行業(yè)的大眾讀者和相關領域的創(chuàng)業(yè)者和管理者而言,《AI3.0》超越了一般圖書,,能為他們提供極具權威性,、專業(yè)性、前沿性和啟發(fā)性的知識與見解,。
第三波人工智能的爆發(fā)即將來臨,,未來世界的潮水會涌向哪里?《AI3.0》,,立足前沿,,深度思考,超脫技術,,是每一個渴望摸準時代的脈搏,、站立潮頭的現代人都不能錯過的新銳之作。