徐匡迪院士之問揭開當(dāng)下中國人工智能虛偽的面紗,。五一前上海召開的院士沙龍活動中“徐匡迪之問”引發(fā)共鳴:“中國有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中?”核心算法缺位,,人工智能發(fā)展面臨“卡脖子”窘境,。中國制造正從“硬件組裝廠”向“軟件組裝廠”蔓延,,政產(chǎn)學(xué)研浮躁如故、積習(xí)難改,。
“中國有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中,?”五一前上海召開院士沙龍活動,,中國工程院院士徐匡迪等多位院士的發(fā)問引發(fā)業(yè)界共鳴,,被稱為“徐匡迪之問”,。這一對當(dāng)下中國人工智能直擊核心的提問,不但表明了當(dāng)下中國人工智能發(fā)展的短板,,同時(shí)也揭去了披在當(dāng)下所謂“人工智能”算法外表華麗的面紗,。
“我國人工智能領(lǐng)域真正搞算法的科學(xué)家鳳毛麟角?!?月28日超聲大數(shù)據(jù)與人工智能應(yīng)用與推廣大會,,東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程學(xué)院教授萬遂人表示,“徐匡迪之問”直擊我國人工智能發(fā)展的核心關(guān)鍵問題,,“如果這種情況不改變,,我國人工智能應(yīng)用很難走向深入,、也很難獲得重大成果”,。
人工智能是計(jì)算機(jī)技術(shù)發(fā)展到高級階段,融合了數(shù)學(xué),、統(tǒng)計(jì)學(xué),、概率、邏輯,、倫理等多學(xué)科于一身的復(fù)雜系統(tǒng),。是當(dāng)下所有信息技術(shù)所不能達(dá)到的高級應(yīng)用。其最為核心的技術(shù)便是人工智能算法,。如何讓計(jì)算機(jī)能像人類一樣進(jìn)行思考,,如同人一樣利用現(xiàn)有的知識進(jìn)行學(xué)習(xí)并實(shí)現(xiàn)合乎邏輯的推理,是人工智能算法試圖實(shí)現(xiàn)的目標(biāo),。其技術(shù)絕不是一般公司能夠輕輕松松實(shí)現(xiàn)的,。當(dāng)下國際社會公認(rèn)的人工智能研發(fā)頂尖公司,如Google和IBM等投入了海量資源,,動用了頂尖的數(shù)學(xué)科學(xué)家,、計(jì)算機(jī)專家,能實(shí)現(xiàn)了計(jì)算機(jī)程序的一定程度智能化,,但距離真正的AI仍然相差很遠(yuǎn),。
進(jìn)入2018年,中國人工智能產(chǎn)業(yè)“忽如一夜春風(fēng)來,,千樹萬樹梨花開”,,一下子出現(xiàn)了無數(shù)人工智能研發(fā)公司,,并都號稱到得了顯著技術(shù)進(jìn)步。比如基于人工智能的醫(yī)學(xué)圖像識別系統(tǒng),,對于某個(gè)疾病的識別率高達(dá)95%以上,,遠(yuǎn)遠(yuǎn)高于人工判讀。中國人工智能真實(shí)如此繁榮嗎,?
1
中國人工智能產(chǎn)業(yè)界研發(fā)現(xiàn)狀
某業(yè)內(nèi)人士有幸了解過國內(nèi)某大型互聯(lián)網(wǎng)企業(yè)制作的人工智能應(yīng)用,。其定位于利用AI程序判讀CT圖像,利用算法實(shí)現(xiàn)對病灶的判讀,,提高醫(yī)生的效率并降低負(fù)擔(dān),。
當(dāng)問到其核心的人工智能算法的時(shí)候,企業(yè)倒也是直言不諱,,其核心技術(shù)是使用了國際上開源的人工智能算法,。在被引入后進(jìn)行針對特定目的進(jìn)行了二次開發(fā),并最后整體打包成為一套完整的人工智能應(yīng)用,。正是因?yàn)槭褂昧碎_源的人工智能算法,,才出現(xiàn)了許多應(yīng)用明顯能力不足的情況。
比如其無法提供一套大一統(tǒng)的應(yīng)用,。公司一共向我們展了大約六種疾病的診斷應(yīng)用,。不同的疾病需要使用對應(yīng)的AI程序才可以得出相對準(zhǔn)確的結(jié)果。如果將A疾病的算法使用到B疾病上,,完全無法正常工作,。就我淺薄的理解,真正人工智能的算法并不應(yīng)當(dāng)如些,。它應(yīng)當(dāng)是一套通用的算法,,既可以用于A疾病的診斷,同樣也可以用于B疾病,。我們需要做的是提供大量疾病案例供AI學(xué)習(xí)訓(xùn)練,,隨著訓(xùn)練樣本數(shù)量的增加,會使人工智能模型被訓(xùn)練的越來越準(zhǔn)確,。但是這種一個(gè)疾病一個(gè)AI的方式還是頭一次聽說,。好比一個(gè)醫(yī)生只能看男性長胡子的感冒患者,如果是個(gè)不沒長胡子的男患者,,只能去隔壁就醫(yī)了,。
浙江大學(xué)應(yīng)用數(shù)學(xué)研究所所長孔德興教授清清楚楚說明白了這個(gè)問題。因?yàn)楣臼褂玫亩际情_源算法,。開源人工智能算法能力是不足的,,根本無法實(shí)現(xiàn)預(yù)期的能力。人工智能算法堪稱信息行業(yè)的核武器。如此威力龐大的算法怎么樣可會在網(wǎng)上被開源出來,?可以認(rèn)為開源的人工智能算法相當(dāng)于玩具水平的東西,。想借助這種低水平的算法,來實(shí)現(xiàn)真正的人工智能應(yīng)用怎么可能實(shí)現(xiàn)呢,?
開源算法唯一好處在于人人都可獲得,,門檻非常低。所以大量公司從網(wǎng)上下載了開源算法,,然后以其為核心研發(fā)出一套AI應(yīng)用,,再披上華麗的面紗,唬的普通用戶奉若神明,。這也在突然間中國出現(xiàn)了如此多的人工智能公司的原因之一吧,。
真正人工智能的到來還需要很長時(shí)間,絕不是借助網(wǎng)上共享了的代碼就能夠?qū)崿F(xiàn)的,,必須要腳踏實(shí)地,,一步一個(gè)腳印地開發(fā)出來,不付出努力想投機(jī)取巧是萬萬不能的,。我國依靠開源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展,?為什么要有自己的底層框架和核心算法?
2
缺少核心算法,,會被“卡脖子”
“如果缺少核心算法,,當(dāng)碰到關(guān)鍵性問題時(shí),還是會被人‘卡脖子’,?!闭憬髮W(xué)應(yīng)用數(shù)學(xué)研究所所長孔德興教授對科技日報(bào)記者表示,我國人工智能產(chǎn)業(yè)的創(chuàng)新能力并沒有傳說中的那樣強(qiáng),,事實(shí)是,產(chǎn)業(yè)發(fā)展過度依賴開源代碼和現(xiàn)有數(shù)學(xué)模型,,真正屬于中國自己的東西并不多,。
4個(gè)月零基礎(chǔ)學(xué)會人工智能、16講入門人工智能,、算法線下大課……類似培訓(xùn)在網(wǎng)絡(luò)上非?;鸨ㄟ^對于現(xiàn)有算法,、模型的學(xué)習(xí)和訓(xùn)練,,成長為人工智能工程師的“短平快”可見一斑。
既然代碼是開源的,,拿來用就好,,為什么還有可能被“卡脖子”?
孔德興解釋,開源代碼是可以拿過來使用,,但專業(yè)性,、針對性不夠,效果往往不能滿足具體任務(wù)的實(shí)際要求,。以圖像識別為例,,用開源代碼開發(fā)出的AI即使可以準(zhǔn)確識別人臉,但在對醫(yī)學(xué)影像的識別上卻難以達(dá)到臨床要求,?!袄鐚Ω闻K病灶的識別,由于邊界模糊,、對比度低,、器官黏連甚至重疊等困難,用開源代碼很難做到精準(zhǔn)識別,。在三維重構(gòu),、可視化等方面難以做到精準(zhǔn)反應(yīng)真實(shí)的解剖信息,甚至?xí)霈F(xiàn)誤導(dǎo)等問題,,這在醫(yī)學(xué)應(yīng)用上是‘致命’的,。”
“碰到專業(yè)性高的研究任務(wù),,一旦被‘卡脖子’將會是非常被動的,,所以一定要有自己的算法?!笨椎屡d說,。換句話說,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算,。用開源代碼“調(diào)教”出的AI頂多是個(gè)“常人”,,而要幫助AI成長為“細(xì)分領(lǐng)域?qū)<摇保枰詳?shù)學(xué)為基礎(chǔ)的原始核心模型,、代碼和框架創(chuàng)新,。秦隴紀(jì)總結(jié),中國制造正從“硬件組裝廠”向“軟件組裝廠”蔓延,,浮躁如故,。
3
有算法之“根”才能撐起產(chǎn)業(yè)“繁茂”
所謂“樹大根深”,人工智能的發(fā)展也是同樣道理,,越在底層深深扎下根基,,越能夠發(fā)展出強(qiáng)大的產(chǎn)業(yè)。那么,,借助開源代碼,,“半路出家”的AI產(chǎn)業(yè)為什么會難以為繼?
孔德興解釋說,在獲得同樣數(shù)據(jù)的前提下,,以開源代碼運(yùn)行,,AI深度學(xué)習(xí)之后或許能輸出結(jié)果,但由于訓(xùn)練框架固定,、算法限制,,當(dāng)用戶進(jìn)行具體的實(shí)際應(yīng)用時(shí),將很難達(dá)到所期望的結(jié)果,,而且難以修改,、完善、優(yōu)化算法,。
“如果從底層算法做起,,那么整個(gè)數(shù)學(xué)模型、整個(gè)算法設(shè)計(jì),、整個(gè)模擬訓(xùn)練‘一脈相承’,,不僅可以協(xié)同優(yōu)化,而且可以根據(jù)需求隨時(shí)修改,,從而真正解決實(shí)際問題,。”孔德興說,,基礎(chǔ)算法往往是指研究共性問題的算法,,它涉及到基礎(chǔ)數(shù)學(xué)理論、高性能數(shù)值計(jì)算等學(xué)科,,可以應(yīng)用到多種實(shí)際問題中,;而針對性強(qiáng)的應(yīng)用算法往往會應(yīng)用到具體問題所涉及的“具體知識、先驗(yàn)信息”,,從而更好地解決實(shí)際應(yīng)用問題,。
“基礎(chǔ)算法和應(yīng)用算法都很重要,擁有基礎(chǔ)算法將更有助于應(yīng)用算法的豐富與深入,?!笨椎屡d說,AI要應(yīng)對的現(xiàn)實(shí)生活是復(fù)雜,、多變的,當(dāng)能夠“應(yīng)對自如”時(shí),,才能夠促成產(chǎn)業(yè)的“繁茂”,。
4
呼吁三方協(xié)力讓數(shù)學(xué)不再置身事外
“一方面是政策引導(dǎo),其實(shí)國家已經(jīng)在加大這方面的扶持,,例如科研基金上的設(shè)置等,。”針對如何解決“徐匡迪之問”反映出來的問題,孔德興認(rèn)為,,第二方面是行業(yè)企業(yè)在進(jìn)行科技創(chuàng)新時(shí),,應(yīng)有意識將數(shù)學(xué)學(xué)者納入進(jìn)來?!叭绻ㄟ^算法的開發(fā),,最終產(chǎn)品落地了,企業(yè)應(yīng)該將算法開發(fā)時(shí)的數(shù)學(xué)學(xué)者納入到成果分享中來,?!笨椎屡d說,社會目前對于數(shù)學(xué)科學(xué)等“軟實(shí)力”的認(rèn)可程度不足,,行業(yè)或法規(guī)層面應(yīng)該做好數(shù)學(xué)研究成果的產(chǎn)權(quán)保護(hù)工作,。
“第三方面,數(shù)學(xué)家本身應(yīng)該積極參與到人工智能發(fā)展的浪潮里,?!笨椎屡d呼吁,AI的未來發(fā)展需要數(shù)學(xué)家深度參與,。由于目前仍處于“弱人工智能”時(shí)代(可以說是數(shù)據(jù)智能時(shí)代),,AI的實(shí)現(xiàn)主要是依賴計(jì)算機(jī)的巨大算力和巨大的存儲能力,底層算法的問題或許并不突出,,但在未來的發(fā)展,,AI將可能融入邏輯、思維等智慧的內(nèi)容,,這些都需要數(shù)學(xué)科學(xué)的原始創(chuàng)新,,有大量的基礎(chǔ)問題亟待數(shù)學(xué)家攻克。
算法的進(jìn)階一定是來源于“原創(chuàng)者”,,而不是“跟隨者”,。孔德興說:“實(shí)際上深度學(xué)習(xí)的應(yīng)用已遇到了天花板,,我們需要新的數(shù)學(xué)技術(shù)(如部分依賴邏輯,、部分依賴數(shù)據(jù)的‘聰明算法’),讓計(jì)算機(jī)變得聰明起來,。這些工作都需要數(shù)學(xué)家的參與,。”(采訪來源:科技日報(bào))
5
人工智能發(fā)展陷入了拿來主義怪圈
歷史已經(jīng)證明,,通過購買現(xiàn)成的產(chǎn)品與技術(shù)來實(shí)現(xiàn)技術(shù)的跨越,,在科學(xué)技術(shù)領(lǐng)域是行不通的。中國科技行業(yè)的哪一樣,,不都是經(jīng)歷了艱苦奮斗,,無數(shù)科學(xué)家默默無聞為之奉獻(xiàn)后,,方才得以傲視世界群雄?比如中國的量子技術(shù),,比如中國的國防科技,,中國的天宮空間站,中國的嫦娥月球車,。
作為技術(shù)高度密集的人工智能技術(shù),,其商業(yè)領(lǐng)域竟然是陷入了拿來主義,著實(shí)讓人意外,。中國AI產(chǎn)業(yè)大約從2018年開始一夜爆紅,,稍微有些規(guī)模的IT廠家無不宣稱,已經(jīng)推出人工智能產(chǎn)品到市場上,。當(dāng)時(shí)認(rèn)為這也是中國科學(xué)人多年來的厚積薄發(fā),,技術(shù)積累到一定程度后實(shí)現(xiàn)了產(chǎn)業(yè)的繁榮??上У漠?dāng)徐匡迪院士發(fā)出直擊靈魂的提問后,,才發(fā)現(xiàn)原來中國的AI產(chǎn)業(yè)不過是看上去很美麗。
人工智能技術(shù)本質(zhì)上是以數(shù)學(xué)算法為核心,,輔以計(jì)算機(jī)技術(shù)的產(chǎn)品,。與其說是一個(gè)IT產(chǎn)品,倒不如說是一套數(shù)學(xué)理論,,如隨機(jī)森林算法,,貝葉斯算法等都是復(fù)雜的數(shù)學(xué)、統(tǒng)計(jì)學(xué),、概率領(lǐng)域的內(nèi)容,。這些算法試圖通過數(shù)字概率來描述人類思考的過程。計(jì)算機(jī)技術(shù)不過是通過編程語言在信息系統(tǒng)中實(shí)現(xiàn)算法過程,??梢娡苿尤斯ぶ悄芮斑M(jìn)的必定是數(shù)學(xué)領(lǐng)域的專家,而不是IT部門的人才,。
基礎(chǔ)學(xué)科,,比如數(shù)學(xué)一直是我們非常薄弱的環(huán)節(jié)。當(dāng)華羅庚將中國數(shù)學(xué)推向一個(gè)高峰后,,之后眾人還只是在努力追趕國際同行,,一直沒有能在國際上獨(dú)領(lǐng)風(fēng)騷??上攵谌斯ぶ悄苌虡I(yè),、民用領(lǐng)域,我們的進(jìn)展同國際同行相經(jīng)差距明顯,。所以2018年的AI產(chǎn)業(yè)大爆發(fā)就讓人心生懷疑,。
沒有安心研發(fā),那么就拿現(xiàn)成的好了,。正巧大家可以從網(wǎng)上下載到開源人工智能算法,。于是大家都將其下載下來,加上漂亮的外殼,,讓我們的AI產(chǎn)品炫酷奪目,。如果有機(jī)會能探究當(dāng)下較火的商業(yè)人工智能產(chǎn)品,最終會發(fā)現(xiàn)所有算法都指向了同一個(gè)來源,。不是說開源不好,,正如浙江大學(xué)孔德興教授所言,開源的產(chǎn)品是由其它國家人開發(fā)出來的,,無論其功能好與壞,,你并不知道它的開發(fā)思路是怎么樣的。算法高效之處不知為何,,而其能力不足之處也茫然不知,。盡管其是開放源代碼的,不知道有多少IT公司認(rèn)認(rèn)真真地研讀一遍將其吃透研究明白了,。
還有一點(diǎn)想跟大家討論的是,,開源的人工智能算法絕不會是高效的,或者說是真正的算法程度,。開源代碼是IT高手們將自己想法實(shí)現(xiàn)并放到網(wǎng)上供大家討論的東西,,往往是初級的,探索性的東西,。據(jù)說當(dāng)現(xiàn)開源AI代碼是從印度工程師放出來的(這點(diǎn)也是聽聞,,不確定)。現(xiàn)在大家應(yīng)當(dāng)有所體會,,人工智能絕不會是一兩個(gè)工程師就可以搞出來的東西,,要不為什么谷歌公司投入了那么多人力物力才實(shí)現(xiàn)了將國際象棋冠軍打敗的程度。而這套算法卻無法應(yīng)對英國高中數(shù)學(xué)問題,。還有一點(diǎn),,真正尖端的人工智能算法,永遠(yuǎn)不會出現(xiàn)在互聯(lián)網(wǎng)上供人們共享的,。
資本的力量是可怕的,。為了賺取利潤占領(lǐng)市場,商家秉持著唯快不破的想法,,極速將產(chǎn)品推出來,,哪有功夫去管它是好是壞呢??墒侨斯ぶ悄苁且婚T科學(xué),,是最為嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)課題,,不可能容得下這般不負(fù)責(zé)任的炒作。
這個(gè)世界是公平的,,你怎樣對待科學(xué),,這就會怎樣對待你。玩弄科學(xué),,炒作概念,,不腳踏實(shí)地的鉆研反而投機(jī)取巧,必定會被其反噬,。如果大家一直在追蹤AI發(fā)展情況,,其實(shí)已經(jīng)可以感受到,似乎AI的熱度較去年有所下降,。而到現(xiàn)在為止尚未有一個(gè)真正能拿出手的商業(yè)人工智能產(chǎn)品在市場上出現(xiàn),。這已經(jīng)說明許多。
愛之深恨之切,。我們都期盼著中國IT有朝一日能夠站在世界巔峰,。這個(gè)過程是需要腳踏實(shí)地的,一個(gè)臺階一個(gè)臺階攀登上去,,沒有任何取巧的辦法,。亡羊補(bǔ)牢未為晚也,希望徐匡迪之問能驚醒中國IT公司,,扎扎實(shí)實(shí)的一步一個(gè)腳印的走下去,,讓國人早日用上真正的人工智能應(yīng)用。