《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 觀點 | 文因互聯(lián) CEO 鮑捷:確保搞砸人工智能項目的十種方法

觀點 | 文因互聯(lián) CEO 鮑捷:確保搞砸人工智能項目的十種方法

2018-08-03
關(guān)鍵詞: 人工智能 SVoice Web本體語言

做成一件事兒不容易,而坑恒在,。

鮑捷博士于5月10日在將門創(chuàng)投的線上 talk 中盤點了人工智能項目的大坑小坑,,選出了看上去非常反常識的十個經(jīng)典坑,。

這是一篇大實話合集,,但別絕望,,最后將會放出從二十年踩坑經(jīng)驗中總結(jié)出的彩蛋,,共勉,。

作者介紹

鮑捷博士,,文因互聯(lián) CEO,。擁有20年學(xué)術(shù)界和工業(yè)界的相關(guān)經(jīng)驗。美國Iowa State University人工智能博士,,RPI博士后,,MIT訪問研究員,W3C OWL(Web本體語言)工作組成員,,前三星美國研發(fā)中心研究員,,三星問答系統(tǒng)SVoice第二代系統(tǒng)核心設(shè)計師。主要研究領(lǐng)域涵蓋人工智能的諸多分支,,包括機器學(xué)習(xí),、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘,、自然語言處理,、形式推理、語義網(wǎng)和本體工程等,,發(fā)表了70多篇領(lǐng)域內(nèi)相關(guān)論文,。是中文信息學(xué)會語言與知識計算專委會委員,中國計算機協(xié)會會刊編委,,W3C顧問會員會代表,。2010年以來關(guān)注金融智能化的研究和應(yīng)用,,成果有XBRL語義模型,基于知識圖譜的基本面分析,、金融問答引擎,、財務(wù)報告自動化提取、自動化監(jiān)管等,。

以下為演講原文:


鮑捷博士:我今天的題目是《確保搞砸人工智能項目的十種方法》,,按照這十種方法,基本上可以搞砸項目,。(笑)

之所以能夠講這個題目,,是因為我自己之前也搞砸過很多項目,下面列表里超過一半的項目最后是失敗的:

微信圖片_20180803161805.jpg

我開始想,,為什么大部分的項目最后做不成,?

我經(jīng)歷了好幾次很痛苦的時刻,比如剛到RPI(倫斯特理工學(xué)院)做博士后,,這個學(xué)校有全美做知識圖譜最好的實驗室,,實驗室的James Hendler和Deborah Mcguinness,都是這個領(lǐng)域最好的老師,。

我在那里做了一個知識管理系統(tǒng),,在我看來,我們是世界上最好的語義網(wǎng)實驗室,,也是最專業(yè)的一群人,,不用這個技術(shù)來武裝自己好像說不過去,所以我就做了一個語義檢索系統(tǒng),,但是后來沒有人用,。

我就在反思到底問題在哪,為什么這行真正最好的專家,,做出這樣一個系統(tǒng),,連自己都不用?

微信圖片_20180803161854.jpg

我不停地在想,,人工智能項目失敗的核心原因到底有哪些,?

當(dāng)然,后來經(jīng)歷了更多的失敗,?;谶@些直接或者間接失敗的經(jīng)歷,我逐漸總結(jié)出來確保一個項目會失敗的一些原因,。這些原因很多時候看起來是反直覺的,,我會逐一地跟大家講。

在最后,我也會總結(jié)如果想要避免這10個坑,,應(yīng)該做什么,。

NO.1 一下子砸很多的錢

第一種確保你的項目失敗的方法:一下子砸很多的錢。

我目前也在創(chuàng)業(yè),,有VC問我:“你們做的這個事,,如果BAT砸很多的錢,是不是就一下子能趕上你們,?”

我說不會,,通常舉的例子,就是日本的五代機,。當(dāng)初日本舉全國之力,,砸了幾百億日元,最終沒有做成,。

五代機是什么,?1970年代末是人工智能的第一次冬天開始回升的時候。80年代開始進入人工智能第二個高峰,。這時候,,日本啟動了一個新的項目,叫第五代計算機,。

什么叫第五代計算機?前四代計算機,,分別是電子管的,、晶體管的、集成電路的,,和大規(guī)模集成電路的,。日本到第五代計算機的時候,他們認(rèn)為要想做人工智能,,就必須用人工智能的專有硬件,。

微信圖片_20180803161941.jpg

(《知識信息處理系統(tǒng)的挑戰(zhàn):第五代計算機系統(tǒng)初步報告》中第五代計算機系統(tǒng)概念圖)

這個話是不是聽起來很耳熟?最近在做深度學(xué)習(xí)的時候,,看到了很多關(guān)于深度學(xué)習(xí)芯片的想法,。這個想法并不新,因為在30年前,,日本人在五代機的計算里,,就已經(jīng)有這樣的想法了,只是當(dāng)時的人工智能芯片,,不是現(xiàn)在深度學(xué)習(xí)的芯片,,而是Prolog的芯片。

Prolog是人工智能的一種語言,主要是一種邏輯建模語言,。如果能夠用Prolog來建計算機,,計算機就可以進行思維,可以處理各種各樣認(rèn)知的任務(wù),。這是一個非常大型的國家項目,,最終花了幾百億日元,耗掉10年時間以后,,在1992年,,終于勝利地失敗了。

這不是個例,,很多大型的項目,,最后都失敗了。

一開始砸很多錢,,為什么還會失?。磕阋?,做一個項目,,通常是有目標(biāo)的。當(dāng)你有一個大預(yù)算的時候,,你的目標(biāo)通常也定得很高,。像五代機的目標(biāo),不單當(dāng)時是做不到的,,三十年后的今天,,也是做不到的。

雖然五代機失敗了,,但是日本的人工智能技術(shù),,在五代機的研發(fā)當(dāng)中得到了很大的提升,所以到了20年后,,語義網(wǎng)興起的時候,,日本的語義網(wǎng)研究水平還是相當(dāng)好的,那些錢沒有白花,,它培養(yǎng)了很多的人才,。

在日本做五代機的同時,美國也有類似的研究,,主要是LISP machine,,LISP是人工智能的另外一種語言,也是邏輯建模的語言,。其中有一個公司叫think machine,。當(dāng)時至少有100家LISP公司。

為什么單獨要提到think machine?創(chuàng)始人在失敗之后沉寂了一段時間,,開了一個新的公司叫MetaWeb,,MetaWeb是2005年的時候成立的,這個公司有一個產(chǎn)品叫Freebase,,用Wikipedia做了一個很好的知識庫,。

微信圖片_20180803162003.jpg

2010年這個公司被谷歌收購,改名叫谷歌知識圖譜,。所以今天谷歌的知識圖譜有很多歷史淵源,,可以追溯到30年前LISP machine的研究里面。

羅馬不是一天建成的,,所以一下子砸很多錢,,就會導(dǎo)致項目的目標(biāo)過高,從而導(dǎo)致這個項目有極大的失敗概率,。

我曾經(jīng)遇到過一個大型國企的人,,他跟我說,他們要花3000萬建一個企業(yè)內(nèi)部知識管理系統(tǒng),。我就問他,,你那個3000萬是怎么投的?他說我第一年就要投3000萬,。然后我沒說話,,因為我的想法是這個項目一定會失敗。后來這個項目的的確確失敗了,。

也有一些大公司投比這還多得多的錢來做AI項目,。這些都不一定讓事情更容易成功。

這是第一種方法,,一下子砸很多錢。

NO.2 根據(jù)最新論文來決定技術(shù)路線

第二種方法:根據(jù)最新的論文來決定技術(shù)路線,,這可能也是一個反常識的事情,。

因為最新的技術(shù)不是最好的技術(shù),要注意,,在工程領(lǐng)域里面,,通常面臨著實際的約束來解決問題的。而論文是一種實驗室的環(huán)境,,是不一樣的,。

比如說實驗室里,可以假設(shè)有一些數(shù)據(jù),,可以假設(shè)這些數(shù)據(jù)已經(jīng)被集成了,,被清洗了,是沒有噪聲的??梢约僭O(shè)目標(biāo)是清晰的,,但所有的這些假設(shè)在現(xiàn)實中都不一定成立的。

最好的例子,,就是信息抽取,,這是2013年的EMNLP上的一篇文章,我拆出來的圖,。

微信圖片_20180803162045.jpg

這個圖告訴我們做NLP的論文和實際的工業(yè)系統(tǒng)所采用的技術(shù)路線有什么不一樣的地方,。

從2003年到2012年整整10年,學(xué)術(shù)界所發(fā)表的自然語言處理論文的實體抽取子領(lǐng)域里,,完全用機器學(xué)習(xí)的方法論文占到了75%,,混合機器學(xué)習(xí)和基于規(guī)則的方法論文占到了21%,完全只用規(guī)則方法的論文,,只有百分之一點幾,,非常低的比例。但是當(dāng)看到工業(yè)界的實際應(yīng)用的時候,,發(fā)現(xiàn)了完全不同的技術(shù)占比分布,,用規(guī)則方法的占到了45%。

如果光看大型的供應(yīng)商,,比如說IBM這樣的公司,,67%的軟件是完全基于規(guī)則方法的。完全基于統(tǒng)計方法即machine learning方法的軟件,,在所有的供應(yīng)商那里占33%,,在大型的供應(yīng)商那里只占了17%。

所以從學(xué)術(shù)界的研究到工業(yè)界的實踐,,有一個非常巨大的差異,。為什么會有這樣的差異?就是我剛才提到的,,在發(fā)表論文的時候,,完全不需要考慮現(xiàn)實中所會遇到的那些約束條件。在知識提取,、實體提取領(lǐng)域,,盡管現(xiàn)在從理論上來說,已經(jīng)解決了,,比如說實體識別問題,、NER問題、分詞問題,,但是到了真正現(xiàn)實的語料中,,發(fā)現(xiàn)這些方法都不好用,。這也可以用另外一個問題來驗證這一點,就是問答系統(tǒng),。

今天看到大部分的論文——我沒有做精確的統(tǒng)計,,只是基于模糊定性的看法——能看到大部分發(fā)表的問答系統(tǒng)的論文都是基于統(tǒng)計方法的。特別是這兩年基于NLP的方法,,尤其是基于端到端的方法的,。無一例外,能夠真正在工業(yè)中應(yīng)用起來的問答系統(tǒng),,除了小冰這樣的閑聊系統(tǒng)之外,,真正的面向解決任務(wù)型的問答系統(tǒng),全部都是用規(guī)則系統(tǒng)的,。我還不知道哪一個是用深度學(xué)習(xí)的,,當(dāng)然也可能有用在某一個具體的細節(jié),或者某一個組件上面,,我沒有見到過用于整體架構(gòu)上,。

所以當(dāng)決定一個工程問題技術(shù)路線的時候,不一定要按照最新的論文趨勢來做這件事情,,甚至,,論文和十年之后的技術(shù)都不一定有相關(guān)性。一定要根據(jù)現(xiàn)實的情況,,根據(jù)現(xiàn)實的約束,,來決定技術(shù)路線。

NO.3 脫離真正的應(yīng)用場景

第三種方法:如果脫離了真正的應(yīng)用場景,,項目就注定會失敗,。

這里我用OWL2來說明。OWL2是一種語言,,對于做語義網(wǎng)的同學(xué)們很熟悉了,。

在Web上所知道的所有的這些標(biāo)準(zhǔn)化的格式,比如說HTML都是W3C,,即萬維網(wǎng)聯(lián)盟設(shè)計的,。萬維網(wǎng)聯(lián)盟也會負責(zé)Web上其他的協(xié)議,其中有一個協(xié)議叫OWL,。它是在講,,在互聯(lián)網(wǎng)上如何表達我們的知識,。

比如說,,一個餐館要發(fā)布它的菜單,該用什么樣的格式來發(fā)布,?或者我現(xiàn)在要在網(wǎng)上發(fā)布我的簡歷,,希望被谷歌更好地檢索到,。我要告訴谷歌,我是一個人,,我姓什么,,叫什么,出生年月是什么,,我應(yīng)該用什么樣的格式發(fā)布這樣的數(shù)據(jù),。其中一個格式就是OWL。OWL的第一個版本在2004年發(fā)布,,第二個版本是在2010年發(fā)布,。

OWL WORKING GROUP比較活躍的工作組的成員里面,有相當(dāng)多的知名大學(xué)的老師,,還有一些知名公司的科學(xué)家,,包括IBM、Oracle,、惠普,。你們注意到,我剛才提到這些大公司的時候,,有一些名字沒有出現(xiàn),,比如說谷歌和Facebook。

OWL2本來希望想做的事情,,是設(shè)計如何在網(wǎng)上表達并發(fā)布日常生活衣食住行信息的,。但是,最終工作組成員的構(gòu)成,,一種是大學(xué)研究人員,,另外一種是大公司做企業(yè)級應(yīng)用的,大部分是遠離場景的,。

最終設(shè)計出來的產(chǎn)品,,也就是OWL2語言,脫離了真正想去服務(wù)的那個場景,。OWL WORKING GROUP在開會的時候,,寫了大概好幾十個應(yīng)用案例,但是大部分的案例都是這樣的:一個制藥公司要做一個藥,,應(yīng)該怎么表達制藥的知識,,或者一個醫(yī)生如何表達病歷、疾病或基因,,大體上都是這樣的應(yīng)用,。沒有任何一個案例是在講述在網(wǎng)上如何找一個朋友,或者如何跟朋友聊天,,或者如何去訂餐,,日常生活中的案例都是沒有的,。

OWL2最終寫出來以后,有600頁紙,,這是一個非常復(fù)雜的語言,。事實上,也就是在一些少量的企業(yè)級應(yīng)用里面被用到了,,在真正的日常應(yīng)用當(dāng)中,,成功的案例幾乎沒有。這就是個典型的脫離了應(yīng)用場景的項目,,所以這個項目,,花了很多錢,最終沒有達到真實想達到的目標(biāo),。

NO.4 使用過于領(lǐng)先的架構(gòu)

第四種方法,,使用過于領(lǐng)先的架構(gòu)。

這也是跟前面第二種方法相呼應(yīng)的,,第二種方法說,,你不能根據(jù)最新的論文來決定你的技術(shù)路線。第四種方法是在講,,如果你使用了一種特別先進的架構(gòu),,反而有可能導(dǎo)致你的項目失敗。

Twine在2007年被稱為世界上第一個大規(guī)模的語義網(wǎng)的應(yīng)用,。當(dāng)時是一個明星企業(yè),,這個公司到了2010年的時候關(guān)門了。為什么,?Twine在成立的時候,,想做一個語義書簽的應(yīng)用。比如說我讀了一篇文章,,我覺得很好,,把它保存下來,留著以后再讀,。Twine的機器人就會分析我保存下來的這篇文章到底在說啥,,然后給這個文章一個語義標(biāo)簽。如果有人訂閱了我的標(biāo)簽,,他就可以不斷地看到我這個標(biāo)簽下收藏的好東西,,就這么一個想法。

Twine在底層用了一個叫RDF的新數(shù)據(jù)庫,,RDF是一種語義網(wǎng)的語言,,比關(guān)系數(shù)據(jù)庫增強很多,它是可以進行推理的數(shù)據(jù)庫,。但是當(dāng)Twine用戶量達到200萬的時候,,它就遇到了一個瓶頸,數(shù)據(jù)庫的性能不夠,。所以Twine的CEO就決定,,開發(fā)一個新的數(shù)據(jù)庫。

當(dāng)時這個公司大概是40個人,,用20個人來研發(fā)基礎(chǔ)性的東西——一個新的語義數(shù)據(jù)庫,。2008年的時候,情況還不錯,,他們發(fā)現(xiàn)自己做的東西是個很好的東西,,突然就在想,我們做的東西為什么只搜索書簽,?完全可以搜索整個Web上的東西,。于是他們就做了一次轉(zhuǎn)型,去做整個Web的語義搜索,。步子太大,,就把公司拖死了。到了2008年經(jīng)濟危機爆發(fā)的時候,,資金鏈斷裂,,撐了一年以后就死了。

在死的時候,,Twine的CEO Nova Spivack ,,是我們領(lǐng)域非常值得尊重的一個先行者,也是一個技術(shù)大拿,,同時也是一個非常成功的投資人,。他就檢討了Twine的失敗。他說我試圖在太多的地方進行革新,,我應(yīng)該要么革新一個平臺,,要么革新一個應(yīng)用,要么革新一個商業(yè)模式,,但是我似乎在太多的地方都進行革新了,,而且我使用了一種非常超前的架構(gòu),就是RDF數(shù)據(jù)庫,,導(dǎo)致了我要追求的目標(biāo)太大,,我無法達到這個目標(biāo)。

我想他說的這個話,,即使到今天,,也是非常值得思考的。

這個項目相關(guān)的分析文章,,我差不多每過兩年都要仔仔細細地看一遍,。Twine失敗了以后,, Nova Spivack 對公司進行了一次轉(zhuǎn)型,成立了一個新的公司叫 Bottlenose,,還是用了同樣的技術(shù),,用在了更聚焦的應(yīng)用場景上,從2C的服務(wù)轉(zhuǎn)到2B的服務(wù)上去,。

Bottlenose這個公司,,到目前為止已經(jīng)8年時間了,還是很成功的,。2B的應(yīng)用相對而言不太需要這么大量的數(shù)據(jù),,不用解決系統(tǒng)可伸縮性問題,突出了這個系統(tǒng)最核心的優(yōu)勢,,即語義分析和理解能力,。

像Twine這樣失敗的例子是不罕見的。用一個過于先進的架構(gòu)的時候,,通常會面臨一開始很難去預(yù)期的一些風(fēng)險,,甚至不僅僅是像RDF數(shù)據(jù)庫這樣的小眾的產(chǎn)品,更加大眾的產(chǎn)品,,也有可能會遇到這樣的情況,。

比如說有人經(jīng)常會問我說,你們做知識圖譜的應(yīng)用,,是不是一定要用圖數(shù)據(jù)庫,?我就通常回答說不一定,。

如果你熟悉圖數(shù)據(jù)庫,,比如說你對 Neo4j 整個運維都非常地熟悉了,你知道它的JAVA虛擬機如果出錯的時候,,該如何處理,;你知道它內(nèi)存不夠的時候,該怎么辦,;你知道怎么進行數(shù)據(jù)的分片,,知道怎么進行主從的復(fù)制……所有這些運維問題都很熟悉的時候,你就可以試一試上這個應(yīng)用,。

在上應(yīng)用的時候不要太著急,,如果你只是一個在線應(yīng)用,可以放一放,,先把離線的這部分運維的工作搞清楚以后,,然后再上線,也可以先用一個小數(shù)據(jù)集試一試??傊?,步子不要太大。

NO.5 不能管理用戶預(yù)期

第五種方法,,不能管理用戶預(yù)期,。

這是一個特別常見的項目失敗的原因,甚至不是因為技術(shù)上做不到,,而是用戶預(yù)期更大。

我先說一個技術(shù)上完全做不到的,,比如說有一個銀行,,他們推出了所謂的機器人大堂經(jīng)理,你可以跟一個機器人對話辦理業(yè)務(wù),。顯然,,這個東西如果真的能夠做到,應(yīng)該是非常令人吃驚的事情,,這已經(jīng)遠遠超出當(dāng)前技術(shù)邊界,。

最近有一個比較有名的騙局,就是機器人索菲亞,。沙特阿拉伯還給了它第一個公民的身份,,這是一個非常典型的詐騙。

微信圖片_20180803162121.jpg

這種類型的機器人是不太可能出現(xiàn)的,。

在其他應(yīng)用當(dāng)中也會遇到這樣的情況,,尤其是對話機器人是最容易引起用戶的圖靈測試欲望。當(dāng)用戶發(fā)現(xiàn)跟他對話的是一個機器人的時候,,他就會試圖去調(diào)戲這個機器人,。比如很多人都會去調(diào)戲siri,所以siri積累了很多段子,,準(zhǔn)備應(yīng)對大家調(diào)戲,。

如果你是提供了一個搜索引擎,那么大家的預(yù)期是比較低的,。但如果你以一個問答引擎的形式,,提供同樣的內(nèi)容,大家的預(yù)期就會高很多,。

我們最早提供了一個終端級產(chǎn)品,,用戶的評價就不是特別好,后來我們調(diào)整了一下定位,,把它調(diào)整成用搜索界面來提供服務(wù),,系統(tǒng)頂層的智能程度沒有太大改變,但是用戶的預(yù)期和評價馬上就好起來了,因為用戶預(yù)期降低了,。這樣的語義搜索引擎,,相比其他的搜索引擎,其實還是好一些的,。

對話機器人其實也一樣,,如果你給用戶的預(yù)期,是能夠跟他平等對話的機器人的話,,通常是很難達到的,。用戶通常玩一玩就會發(fā)現(xiàn)好傻,然后就不玩了,,所以大家注意到谷歌機器人跟Apple的siri機器人定位有很大區(qū)別,,谷歌機器人不僅僅做對話,它能夠預(yù)先幫你去做一些事情,,甚至主動地去幫你做一些自動化的事情,,其實這是非常聰明的選擇。

目前能夠跟人長期進行交互的機器人,,其實是一個更加偏秘書型的,,或者說它就是一個幫助你進行任務(wù)自動化的機器。如果你是立足于對話,,其實很難滿足用戶預(yù)期,,但是如果你立足于自動化,就比較容易達到用戶預(yù)期,。同樣的技術(shù),,你用不同的方法去服務(wù)用戶,用戶預(yù)期不一樣,,用戶的感覺就完全不一樣,。所以要盡可能地讓用戶感知到產(chǎn)品的成熟度,在他的預(yù)期之上,,這個產(chǎn)品才有可能成功,,他才愿意付費。


NO.6 不理解認(rèn)知復(fù)雜性

第六點叫做不能理解認(rèn)知復(fù)雜性,。

這個事情我在剛開始的時候就提到了,,這個例子就是Semantic Wiki,我寫了很多個這樣的系統(tǒng),,Semantic Wiki是什么呢,?大家肯定都用過維基百科或者百度百科,這只是一個典型的維基系統(tǒng),,有很多人去寫一個頁面,。Semantic Wiki也是基于協(xié)作的,,也是一個Wiki,只不過在這個Wiki的頁面上,,你可以打一些標(biāo)簽,,加一些注釋。

它可以解決什么問題呢,?比如可以解決頁面之間的數(shù)據(jù)一次性問題,,就是一個頁面上的數(shù)據(jù),可以流到另外一個頁面上去,,舉個例子,,比如說在維基百科上面,可以看到很多國家的GDP,,就是國民生產(chǎn)總值,,在中國的頁面上,會有中國GDP,,在亞洲國家的GDP列表上面,,也會有中國GDP,,然后在世界國家的GDP列表上,,也會有中國GDP,那么是不是可以有一個機制,,比如在一個頁面,,寫下中國的GDP是多少,只要這個數(shù)字改變,,其他所有頁面上的數(shù)字會同步改變,,用Semantic Wiki技術(shù)就可以做到這一點。當(dāng)然Semantic wiki還可以做很多很酷的其他的事情,,很強大,。

我從2004年開始就開始寫Semantic Wiki系統(tǒng),前前后后寫了三個Semantic Wiki系統(tǒng),,后來我加入了一個開源社區(qū),,叫 Semantic MediaWiki, 基于這樣的系統(tǒng),,我做了一個很好的知識管理系統(tǒng),。

2010年我們試圖來推廣這個系統(tǒng),當(dāng)時是做了一個實驗,,也是一個美國的國家機構(gòu)委托我們做的,,就是要測試用這種協(xié)作的知識管理系統(tǒng)來記錄一些事件,能不能記錄得很好,,好到可以后面讓機器自動進行處理,。

當(dāng)時做的對比實驗是找了一群RPI的計算機系本科生,讓他們來看電視連續(xù)劇,看完以后描述情節(jié),。一部分人用自然語言來進行描述,,一部分人用Semantic Wiki,以更加結(jié)構(gòu)化的方式來進行描述,。然后再找了學(xué)生來分別閱讀前兩組學(xué)生的描述,,最后讓他們來做題,看哪個組能夠更精準(zhǔn)地來復(fù)原電視劇情節(jié),。最后得到的結(jié)果發(fā)現(xiàn)是用自然語言描述是更容易,,就是描述得更精準(zhǔn),速度更快,。

然后我們仔細去看那些學(xué)生寫的結(jié)構(gòu)化的描述,,發(fā)現(xiàn)是錯誤百出,比如說張三擁抱了李四,,對于一般的所謂有過知識工程訓(xùn)練的人來看,,很明顯擁抱應(yīng)該是一個關(guān)系,張三和李四應(yīng)該是兩個人,,一個是主語,,一個是賓語,那么就應(yīng)該是主謂賓,,張三擁抱李四是很清楚的一個知識建模,,但是相當(dāng)多的學(xué)生,他們把這么一個特別簡單的建模就給搞錯了,,他們沒有辦法理解什么叫概念,?什么叫關(guān)系?什么叫屬性,?甚至他們不知道什么叫主語和賓語,?然后發(fā)現(xiàn)在一開始設(shè)想這件事情的時候,忽視了絕大多數(shù)的人,,在他們的教育生涯中比如高中教育里面,,是沒有結(jié)構(gòu)化思維的訓(xùn)練的,這是一種事先無法意識到的認(rèn)知復(fù)雜性,。

由于我們都經(jīng)過十年以上的訓(xùn)練,,所以就完全把這些東西當(dāng)成是天然的事情。后來在OWL WORKING GROUP也遇到了同樣的事情,,有人說這個東西太復(fù)雜了,,其中有一個邏輯學(xué)家就抗議說,這東西不復(fù)雜,,這東西在計算機上跑的時候,,它的算法復(fù)雜性只是多項式復(fù)雜性而已,,然后我聽了這句話以后,突然意識到了一個事情,,就是在這些邏輯學(xué)家的腦子里面,,他們所提到的復(fù)雜性是指一個語言對于機器的復(fù)雜性,所以我們通常把它稱為計算復(fù)雜性,。

但是實際上普通人所理解的復(fù)雜性不是這樣的,,比如說你半頁紙就能說明白的東西,那是一個簡單的東西,,如果讓我看到20頁紙,,才能看明白,那這個東西是一個復(fù)雜的東西,。所以一個技術(shù),,你能不能夠讓程序員用起來,能不能讓用戶用起來,,最核心的事情,,你是不是能夠讓他們在認(rèn)知上面覺得這東西,一看就懂,,一聽就懂,,一打開就懂,不用解釋,,這才叫簡單,。

在很多算法的設(shè)計上面也好,,文檔的設(shè)計上面也好,,應(yīng)用的設(shè)計上也好,它最終能不能用得好,,關(guān)鍵是讓人感覺到它簡單好用,,這就是一個很重要的因素。斯坦福Parser,,為什么在NLP領(lǐng)域里面被用的這么廣,,一個很重要的原因,它的文檔寫的好,,每一個類都有文檔,,提供了足夠多的案例。

所以好的文檔可以極大地降低一個產(chǎn)品的認(rèn)知復(fù)雜性,,即使你的產(chǎn)品本身是復(fù)雜的,,你把文檔寫好,也足以有助于推廣這個產(chǎn)品,,所以盡可能地讓能夠接觸到你產(chǎn)品的人,,不管是搞語言的,,搞技術(shù)的,搞算法的人都感覺到這東西簡單,,是保證你的產(chǎn)品成功的一個關(guān)鍵,。

NO.7 專業(yè)性不足

第七點,這一點就很好理解了,,專業(yè)性不足,。

我經(jīng)常會遇到這樣一些人,說某某公司現(xiàn)在想做一個問答系統(tǒng),,希望投入三五個人,,可能大多數(shù)情況下沒有博士,多數(shù)情況下可能就是一個工程人員,,試圖很快的時間,,兩三個月之內(nèi),甚至三五個月之內(nèi),,把這樣一個東西做出來,,也是一種幻想。當(dāng)然我不會直接說破,。

人工智能產(chǎn)品,,的的確確是有它的專業(yè)性的。很多機構(gòu)想試圖自己去做這樣的事情,,花了1000萬,、2000萬、3000萬冤枉錢,,結(jié)果做不到,。確實,如果沒有一個足夠?qū)I(yè)的人是很難把這種事情給做成的,。

我也經(jīng)歷了很多這樣的事情,,在曾經(jīng)做過的一個語義理解系統(tǒng)里面,也經(jīng)歷了這樣的問題,。我想能夠完成這樣一個系統(tǒng),,實際上是要綜合很多不同的算法,不是一個算法就能夠解決掉的,。比如說,,從正面的例子來看,IBM Watson 系統(tǒng)里面有幾十種不同的算法,,有機器學(xué)習(xí)的算法,,有自然語言處理的算法,有知識圖譜的算法,。你要把所有的這些算法恰到好處地組合在一起,,拿捏的尺度就是一個特別重要的能力,。你該用什么樣的東西,你該不用什么樣的東西,。

比如說規(guī)則系統(tǒng),,任何一個人都可以寫10條正則表達式,這是沒有問題的,。但是如果你能夠?qū)懞?00條正則表達式,,那你一定是一個非常優(yōu)秀的工程人員,你的軟件工程能力很過硬,。如果你能夠管理好1,000條正則表達式,,那你一定是一個科班出身的,有專業(yè)級的知識管理訓(xùn)練的人,。如果你能夠真正地管理好10,000條正則表達式,,那你一定是一個有非常豐富的規(guī)則管理經(jīng)驗的人。

當(dāng)然我說的1,000條,、10,000條,,并不是說你 copy paste 10,000次,改其中幾個字,,那個不算,。人工智能的很多事情,困難就在這兒,。你到網(wǎng)上去拿一個什么開源包啥的,,你把它做到80%,都很容易做得到,。但難度就在于最后的20%,,通常可能需要98%,、99%的正確率,,才能夠滿足用戶的需求,,但是如果專業(yè)性不夠,,最后的這些點是非常難的。

打個比方說,,你要登月的話,,你需要的不是梯子,是火箭,。你搬個梯子,,最后只能爬到樹上去,再也沒辦法往上走了,。你需要的是停下來造火箭,,造火箭就是專業(yè)性,,如果專業(yè)性不足,你永遠只是停留在80%的水平上,,再也升不上去,。

回到剛才講的語義理解的項目。當(dāng)時就遇到了蠻多困難,,要能夠集成規(guī)則的方法,,集成統(tǒng)計的方法,集成自然語言處理的方法,。當(dāng)時全球有很多實驗室一起來做這件事情,,但缺這樣一種角色,能夠把所有的尺度拿捏得特別好的,。

其實IBM把Watson系統(tǒng)做出來,,也是經(jīng)歷了很多內(nèi)部變遷,包括項目管理人的變化,,包括各種技術(shù)選型的變化,,能夠做到這一些,這種人才是非常短缺的,。在中國,,能夠真正從頭到尾把一個語義的理解系統(tǒng)架構(gòu)做好的人,是非常非常少的,,也許10個,,也許20個,數(shù)量確實不多,。我相信在其他人工智能領(lǐng)域,,也面臨著同樣的情況。

專業(yè)性也不會僅僅只局限于程序或者技術(shù)這一塊,,人工智能的產(chǎn)品經(jīng)理,,人工智能項目的運營,還有整個后面的知識系統(tǒng),,數(shù)據(jù)的治理,,都是需要很專業(yè)的人來做,現(xiàn)在這些人才都非常地短缺,。

NO.8 工程能力不足

第八種方法就是工程能力不足,。

我的博士論文是一個分布式推理機,但因為編程能力不夠,,一直到我畢業(yè)為止,,都沒有能夠把它實現(xiàn)出來。當(dāng)然后來到了2012年,、2013年之后,,圖計算,,包括基于消息交換的圖計算出來之后,那時候我再來做分布式推理機就比較容易了,。

但這是我特別大的一個教訓(xùn),。

在這之后,我就比較關(guān)注,,如果做一件事情,,先能夠把我的工程能力補足。這個工程能力,,包括軟件工程能力,,如何寫代碼,如何管理代碼,,如何做系統(tǒng)集成,,還有回歸測試,如何進行代碼的版本控制等等,。后來我面試人的時候,,也比較關(guān)注這些東西。

一個人工智能的技術(shù)能不能做得好,,核心往往不僅僅是算法,,而是底下的架構(gòu),還有系統(tǒng),。比如論文中其實是很好的分布式推理算法,,但是我因為缺少這個架構(gòu),就沒有辦法把這個東西實現(xiàn)出來,。后來像深度學(xué)習(xí)也是這樣的,。最近看到陳天奇他們的實驗室,把算法,、架構(gòu),、操作系統(tǒng)都放在一個實驗室里面來運作,覺得這是一個特別好的事情,。目前算法和架構(gòu)之間的裂縫太大了,。

工程是解決人工智能的核心鑰匙。如果代碼能力不行,,架構(gòu)能力不行,,工程能力不行,在這個情況下,,根本就不應(yīng)該去談算法。優(yōu)先應(yīng)該把工程能力補起來,,然后再談算法,。

NO.9 陣容太豪華

第九點,,陣容太豪華。

這一點不太好說具體的項目是什么,,太敏感了,。

但是我就從邏輯上給大家講一下。因為一個項目如果太豪華,,核心的問題就是沉沒成本,。

我們也經(jīng)常看到一些初創(chuàng)公司,,不管是從商務(wù)上,,還是從技術(shù)上,特別優(yōu)秀的人組成了一個公司,,最后還是會失敗,。為什么?因為比較優(yōu)秀的人,,就是想要做大的事情,。一個大的事情,很難一下子就做對,。通常大的事情,,是從小的事情成長起來的。如果我們不能夠讓豪華的陣容,,從小事做起,,通常這樣一個事情是會失敗的。

微信圖片_20180803162158.jpg

邏輯很簡單,,我就不多說了,。

NO.10 時機不到,運氣不好

第十點,,我可以把所有其他的因素丟到這兒,,就是時機不到、運氣不好,。

微信圖片_20180803162259.jpg

其實可以把所有其他的事情都歸結(jié)為運氣不好,。

比如說我們現(xiàn)在看深度學(xué)習(xí),比如像attention,、卷積,、LSTM、聯(lián)想記憶等等所有這些概念在90年代,,我讀研究生的時候,,這些概念都已經(jīng)有了,但是當(dāng)時是做不到的。當(dāng)時即使有了這些算法,,也沒有這樣的算力,,即使有了這樣的算力,沒有這樣的數(shù)據(jù),。

在2000年的時候,,我在碩士畢業(yè)之后,就在研究一種分層的多層神經(jīng)網(wǎng)絡(luò),。我們把它稱為hierarchical neural network,,跟后來深度學(xué)習(xí)的想法非常接近。我?guī)е@個想法,,去見我的博士導(dǎo)師,。說我想繼續(xù)沿著這個方向往前走,但他說現(xiàn)在整個神經(jīng)網(wǎng)絡(luò)都已經(jīng)拿不到投資了,,你再往前走,,也走不下去,所以后來就放棄了這個方向,,準(zhǔn)備做語義網(wǎng)了,。10年之后,這個方法終于找到了機會,,后來就變成了深度學(xué)習(xí)的東西,。

很多時候,時機不到,,即使你有這個算法,,你也做不到。90年代的神經(jīng)網(wǎng)絡(luò),,差不多花了10年的時間,,才等到了自己的復(fù)蘇。

知識圖譜也是一樣的,,知識圖譜大概也等了十幾年的時間,,到了最近這幾年才真正地得到了大規(guī)模的應(yīng)用。

總結(jié)

讓我們來取個反,,做個總結(jié):

微信圖片_20180803162326.jpg

最后一點,,時機和運氣再啰嗦一下。

很多時候,,我們是真的不知道這件事情能不能做得成,,也真的不知道,自己處于什么樣的歷史階段,。很難預(yù)言未來是什么,,但是至少有一點,,如果我們多去了解一些算法層面的發(fā)展,包括人工智能的發(fā)展史,,包括相關(guān)的這些技術(shù)的發(fā)展史,,能夠更好地理解未來,。

所以我也推薦一下尼克老師的《人工智能簡史》這本書,。我看了兩遍都挺有收獲的??戳诉@東西,,能更多地理解什么是時機,什么是運氣,。

有時候我也經(jīng)常會讀一些經(jīng)典的文章,,十年前或20年前的書,我讀了還是挺有啟發(fā)的,。比如說,,今年我又把Tim Berners-Lee《編織萬維網(wǎng)》那本書又重新讀了一遍,讀了一遍以后,,我就堅定信心了,。

知識圖譜這樣一個互聯(lián)全世界的記憶的系統(tǒng),大概率到2030年能夠?qū)崿F(xiàn),,這還是一個很遙遠的時間,,但是根據(jù)歷史規(guī)律,應(yīng)該到2030年能實現(xiàn)了,。

一方面,,降低我們現(xiàn)在的預(yù)期,另一方面也給我們前進更大的鼓勵,。

場景躍遷理論

微信圖片_20180803162411.jpg

剛才反反復(fù)復(fù)提到了,,要控制用戶的預(yù)期,控制自己的預(yù)期,。做一個項目,,要從小到大,循序漸進,。最后把所有的東西抽象到更高層面上,,我自己總結(jié)為一個理論,叫場景躍遷理論,。

這個理論的核心,,是說一個人工智能的公司需要多次的產(chǎn)品市場匹配,就是Product-Market Fit,。如果提供了一個產(chǎn)品,,市場恰恰需要,,而這個市場恰恰又很大,就說得到了一個產(chǎn)品市場匹配,。

經(jīng)典的互聯(lián)網(wǎng)創(chuàng)業(yè),,通常做一次產(chǎn)品的市場匹配,就可以成功了,。但人工智能往往要做好幾次,,互聯(lián)網(wǎng)公司和人工智能公司很不一樣。

一個稱為養(yǎng)雞場模式,,一個稱為養(yǎng)小孩模式,。

互聯(lián)網(wǎng)公司是一種養(yǎng)雞場模式,它是一個大規(guī)模的復(fù)雜系統(tǒng)Complex system,。它的關(guān)鍵是可擴展性,。我養(yǎng)了一只雞,我發(fā)現(xiàn)這只雞不錯,,我養(yǎng)1萬只雞,,這就是養(yǎng)雞場模式。核心就是如何能養(yǎng)一萬只雞,,這就叫可擴展性,。

人工智能應(yīng)用是另外一種類型的復(fù)雜系統(tǒng),叫Complicated system,,它是有非常多的組件,,通常是上百種奇奇怪怪的組件組合在一起。它的核心并不是養(yǎng)一萬只雞,,更多像養(yǎng)小孩一樣,,生完孩子,從小給他換尿布,,給他喂奶,,教他走路,教他說話,,逗他玩,,小學(xué)、中學(xué),、大學(xué),,一路把他養(yǎng)大,每一個階段所面臨的主要任務(wù)都不一樣,。你如何能夠讓這小孩成長,,我們把它稱為可演進性,這才是AI公司最核心的因素,。

把一個AI的公司給養(yǎng)大,,其實是特別不容易的事情,。就跟養(yǎng)小孩一樣,往往前5年的時間,,都在搭團隊,,搞基礎(chǔ),特別辛苦,。公司存活的觀念就是,,如何能夠在演進的過程中,逐步地掙錢,,而不是試圖一步到位地找到市場產(chǎn)品結(jié)合點,。不僅僅是在人工智能的階段要掙錢,,在人工智障的階段,,也要能夠掙錢。

沒有一個完整的系統(tǒng),,怎么能掙錢,?只能夠把系統(tǒng)中的某些組件拿出去,做部分的商業(yè)化,。就好像毛毛蟲到蝴蝶一樣,,毛毛蟲要蛻皮,蛻好幾次,,才能變成一個蝴蝶,。毛毛蟲階段,它要吃樹葉子,,在蝴蝶那個階段,,它是要吃花蜜,所以它在兩個不同的階段,,它的商業(yè)模式是完全不一樣的,。人工智能公司也要蛻好幾次皮。在早期的時候,,因為產(chǎn)品還不夠完善,,所以人工智能公司早期都是外包公司,這是正常的,,就應(yīng)該接受,,這是發(fā)展必經(jīng)的階段。

總結(jié)今天所說的一切,,人工智能是一種新興的事物,,它是非常復(fù)雜的東西。很難用傳統(tǒng)的舊經(jīng)驗來套這樣一種東西的發(fā)展,,必須經(jīng)過很長時間的演化,,才能夠達到成熟的狀態(tài),。而這個演化力才是我們想做一個成功的商業(yè)的嘗試,最關(guān)鍵的因素,。如何保證在一次又一次的場景躍遷當(dāng)中,,團隊不散架,這樣的能力,,才是決定了某一個商業(yè)上面能不能成功的最大的關(guān)鍵,。

我覺得不僅僅是商業(yè),不管是在學(xué)校里做研究也好,,還是在大型跨國公司里做研究也好,,很多道理都是一樣的。就是如何能夠循序漸進地,,從小到大地來做,,謝謝大家!



本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。