徐匡迪院士5問(wèn)揭開(kāi)當(dāng)下中國(guó)人工智能虛偽的面紗-AET-電子技術(shù)應(yīng)用

徐匡迪院士5問(wèn)揭開(kāi)當(dāng)下中國(guó)人工智能虛偽的面紗

日期： 2019-09-15

關(guān)鍵詞： 徐匡迪人工智能

　　徐匡迪院士之問(wèn)揭開(kāi)當(dāng)下中國(guó)人工智能虛偽的面紗。五一前上海召開(kāi)的院士沙龍活動(dòng)中“徐匡迪之問(wèn)”引發(fā)共鳴：“中國(guó)有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中？”核心算法缺位，人工智能發(fā)展面臨“卡脖子”窘境。中國(guó)制造正從“硬件組裝廠”向“軟件組裝廠”蔓延，政產(chǎn)學(xué)研浮躁如故、積習(xí)難改。

　　“中國(guó)有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中？”五一前上海召開(kāi)院士沙龍活動(dòng)，中國(guó)工程院院士徐匡迪等多位院士的發(fā)問(wèn)引發(fā)業(yè)界共鳴，被稱(chēng)為“徐匡迪之問(wèn)”。這一對(duì)當(dāng)下中國(guó)人工智能直擊核心的提問(wèn)，不但表明了當(dāng)下中國(guó)人工智能發(fā)展的短板，同時(shí)也揭去了披在當(dāng)下所謂“人工智能”算法外表華麗的面紗。

　　“我國(guó)人工智能領(lǐng)域真正搞算法的科學(xué)家鳳毛麟角。”4月28日超聲大數(shù)據(jù)與人工智能應(yīng)用與推廣大會(huì)，東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程學(xué)院教授萬(wàn)遂人表示，“徐匡迪之問(wèn)”直擊我國(guó)人工智能發(fā)展的核心關(guān)鍵問(wèn)題，“如果這種情況不改變，我國(guó)人工智能應(yīng)用很難走向深入、也很難獲得重大成果”。

　　人工智能是計(jì)算機(jī)技術(shù)發(fā)展到高級(jí)階段，融合了數(shù)學(xué)、統(tǒng)計(jì)學(xué)、概率、邏輯、倫理等多學(xué)科于一身的復(fù)雜系統(tǒng)。是當(dāng)下所有信息技術(shù)所不能達(dá)到的高級(jí)應(yīng)用。其最為核心的技術(shù)便是人工智能算法。如何讓計(jì)算機(jī)能像人類(lèi)一樣進(jìn)行思考，如同人一樣利用現(xiàn)有的知識(shí)進(jìn)行學(xué)習(xí)并實(shí)現(xiàn)合乎邏輯的推理，是人工智能算法試圖實(shí)現(xiàn)的目標(biāo)。其技術(shù)絕不是一般公司能夠輕輕松松實(shí)現(xiàn)的。當(dāng)下國(guó)際社會(huì)公認(rèn)的人工智能研發(fā)頂尖公司，如Google和IBM等投入了海量資源，動(dòng)用了頂尖的數(shù)學(xué)科學(xué)家、計(jì)算機(jī)專(zhuān)家，能實(shí)現(xiàn)了計(jì)算機(jī)程序的一定程度智能化，但距離真正的AI仍然相差很遠(yuǎn)。

　　進(jìn)入2018年，中國(guó)人工智能產(chǎn)業(yè)“忽如一夜春風(fēng)來(lái)，千樹(shù)萬(wàn)樹(shù)梨花開(kāi)”，一下子出現(xiàn)了無(wú)數(shù)人工智能研發(fā)公司，并都號(hào)稱(chēng)到得了顯著技術(shù)進(jìn)步。比如基于人工智能的醫(yī)學(xué)圖像識(shí)別系統(tǒng)，對(duì)于某個(gè)疾病的識(shí)別率高達(dá)95%以上，遠(yuǎn)遠(yuǎn)高于人工判讀。中國(guó)人工智能真實(shí)如此繁榮嗎？

　　中國(guó)人工智能產(chǎn)業(yè)界研發(fā)現(xiàn)狀

　　某業(yè)內(nèi)人士有幸了解過(guò)國(guó)內(nèi)某大型互聯(lián)網(wǎng)企業(yè)制作的人工智能應(yīng)用。其定位于利用AI程序判讀CT圖像，利用算法實(shí)現(xiàn)對(duì)病灶的判讀，提高醫(yī)生的效率并降低負(fù)擔(dān)。

　　當(dāng)問(wèn)到其核心的人工智能算法的時(shí)候，企業(yè)倒也是直言不諱，其核心技術(shù)是使用了國(guó)際上開(kāi)源的人工智能算法。在被引入后進(jìn)行針對(duì)特定目的進(jìn)行了二次開(kāi)發(fā)，并最后整體打包成為一套完整的人工智能應(yīng)用。正是因?yàn)槭褂昧碎_(kāi)源的人工智能算法，才出現(xiàn)了許多應(yīng)用明顯能力不足的情況。

　　比如其無(wú)法提供一套大一統(tǒng)的應(yīng)用。公司一共向我們展了大約六種疾病的診斷應(yīng)用。不同的疾病需要使用對(duì)應(yīng)的AI程序才可以得出相對(duì)準(zhǔn)確的結(jié)果。如果將A疾病的算法使用到B疾病上，完全無(wú)法正常工作。就我淺薄的理解，真正人工智能的算法并不應(yīng)當(dāng)如些。它應(yīng)當(dāng)是一套通用的算法，既可以用于A疾病的診斷，同樣也可以用于B疾病。我們需要做的是提供大量疾病案例供AI學(xué)習(xí)訓(xùn)練，隨著訓(xùn)練樣本數(shù)量的增加，會(huì)使人工智能模型被訓(xùn)練的越來(lái)越準(zhǔn)確。但是這種一個(gè)疾病一個(gè)AI的方式還是頭一次聽(tīng)說(shuō)。好比一個(gè)醫(yī)生只能看男性長(zhǎng)胡子的感冒患者，如果是個(gè)不沒(méi)長(zhǎng)胡子的男患者，只能去隔壁就醫(yī)了。

　　浙江大學(xué)應(yīng)用數(shù)學(xué)研究所所長(zhǎng)孔德興教授清清楚楚說(shuō)明白了這個(gè)問(wèn)題。因?yàn)楣臼褂玫亩际情_(kāi)源算法。開(kāi)源人工智能算法能力是不足的，根本無(wú)法實(shí)現(xiàn)預(yù)期的能力。人工智能算法堪稱(chēng)信息行業(yè)的核武器。如此威力龐大的算法怎么樣可會(huì)在網(wǎng)上被開(kāi)源出來(lái)？可以認(rèn)為開(kāi)源的人工智能算法相當(dāng)于玩具水平的東西。想借助這種低水平的算法，來(lái)實(shí)現(xiàn)真正的人工智能應(yīng)用怎么可能實(shí)現(xiàn)呢？

　　開(kāi)源算法唯一好處在于人人都可獲得，門(mén)檻非常低。所以大量公司從網(wǎng)上下載了開(kāi)源算法，然后以其為核心研發(fā)出一套AI應(yīng)用，再披上華麗的面紗，唬的普通用戶奉若神明。這也在突然間中國(guó)出現(xiàn)了如此多的人工智能公司的原因之一吧。

　　真正人工智能的到來(lái)還需要很長(zhǎng)時(shí)間，絕不是借助網(wǎng)上共享了的代碼就能夠?qū)崿F(xiàn)的，必須要腳踏實(shí)地，一步一個(gè)腳印地開(kāi)發(fā)出來(lái)，不付出努力想投機(jī)取巧是萬(wàn)萬(wàn)不能的。我國(guó)依靠開(kāi)源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展？為什么要有自己的底層框架和核心算法？

　　缺少核心算法，會(huì)被“卡脖子”

　　“如果缺少核心算法，當(dāng)碰到關(guān)鍵性問(wèn)題時(shí)，還是會(huì)被人‘卡脖子’。”浙江大學(xué)應(yīng)用數(shù)學(xué)研究所所長(zhǎng)孔德興教授對(duì)科技日?qǐng)?bào)記者表示，我國(guó)人工智能產(chǎn)業(yè)的創(chuàng)新能力并沒(méi)有傳說(shuō)中的那樣強(qiáng)，事實(shí)是，產(chǎn)業(yè)發(fā)展過(guò)度依賴(lài)開(kāi)源代碼和現(xiàn)有數(shù)學(xué)模型，真正屬于中國(guó)自己的東西并不多。

　　4個(gè)月零基礎(chǔ)學(xué)會(huì)人工智能、16講入門(mén)人工智能、算法線下大課……類(lèi)似培訓(xùn)在網(wǎng)絡(luò)上非常火爆，通過(guò)對(duì)于現(xiàn)有算法、模型的學(xué)習(xí)和訓(xùn)練，成長(zhǎng)為人工智能工程師的“短平快”可見(jiàn)一斑。

　　既然代碼是開(kāi)源的，拿來(lái)用就好，為什么還有可能被“卡脖子”？

　　孔德興解釋?zhuān)_(kāi)源代碼是可以拿過(guò)來(lái)使用，但專(zhuān)業(yè)性、針對(duì)性不夠，效果往往不能滿足具體任務(wù)的實(shí)際要求。以圖像識(shí)別為例，用開(kāi)源代碼開(kāi)發(fā)出的AI即使可以準(zhǔn)確識(shí)別人臉，但在對(duì)醫(yī)學(xué)影像的識(shí)別上卻難以達(dá)到臨床要求。“例如對(duì)肝臟病灶的識(shí)別，由于邊界模糊、對(duì)比度低、器官黏連甚至重疊等困難，用開(kāi)源代碼很難做到精準(zhǔn)識(shí)別。在三維重構(gòu)、可視化等方面難以做到精準(zhǔn)反應(yīng)真實(shí)的解剖信息，甚至?xí)霈F(xiàn)誤導(dǎo)等問(wèn)題，這在醫(yī)學(xué)應(yīng)用上是‘致命’的。”

　　“碰到專(zhuān)業(yè)性高的研究任務(wù)，一旦被‘卡脖子’將會(huì)是非常被動(dòng)的，所以一定要有自己的算法。”孔德興說(shuō)。換句話說(shuō)，是否掌握核心代碼將決定未來(lái)的AI“智力大比拼”中是否擁有勝算。用開(kāi)源代碼“調(diào)教”出的AI頂多是個(gè)“常人”，而要幫助AI成長(zhǎng)為“細(xì)分領(lǐng)域?qū)＜摇保枰詳?shù)學(xué)為基礎(chǔ)的原始核心模型、代碼和框架創(chuàng)新。秦隴紀(jì)總結(jié)，中國(guó)制造正從“硬件組裝廠”向“軟件組裝廠”蔓延，浮躁如故。

　　有算法之“根”才能撐起產(chǎn)業(yè)“繁茂”

　　所謂“樹(shù)大根深”，人工智能的發(fā)展也是同樣道理，越在底層深深扎下根基，越能夠發(fā)展出強(qiáng)大的產(chǎn)業(yè)。那么，借助開(kāi)源代碼，“半路出家”的AI產(chǎn)業(yè)為什么會(huì)難以為繼？

　　孔德興解釋說(shuō)，在獲得同樣數(shù)據(jù)的前提下，以開(kāi)源代碼運(yùn)行，AI深度學(xué)習(xí)之后或許能輸出結(jié)果，但由于訓(xùn)練框架固定、算法限制，當(dāng)用戶進(jìn)行具體的實(shí)際應(yīng)用時(shí)，將很難達(dá)到所期望的結(jié)果，而且難以修改、完善、優(yōu)化算法。

　　“如果從底層算法做起，那么整個(gè)數(shù)學(xué)模型、整個(gè)算法設(shè)計(jì)、整個(gè)模擬訓(xùn)練‘一脈相承’，不僅可以協(xié)同優(yōu)化，而且可以根據(jù)需求隨時(shí)修改，從而真正解決實(shí)際問(wèn)題。”孔德興說(shuō)，基礎(chǔ)算法往往是指研究共性問(wèn)題的算法，它涉及到基礎(chǔ)數(shù)學(xué)理論、高性能數(shù)值計(jì)算等學(xué)科，可以應(yīng)用到多種實(shí)際問(wèn)題中；而針對(duì)性強(qiáng)的應(yīng)用算法往往會(huì)應(yīng)用到具體問(wèn)題所涉及的“具體知識(shí)、先驗(yàn)信息”，從而更好地解決實(shí)際應(yīng)用問(wèn)題。

　　“基礎(chǔ)算法和應(yīng)用算法都很重要，擁有基礎(chǔ)算法將更有助于應(yīng)用算法的豐富與深入。”孔德興說(shuō)，AI要應(yīng)對(duì)的現(xiàn)實(shí)生活是復(fù)雜、多變的，當(dāng)能夠“應(yīng)對(duì)自如”時(shí)，才能夠促成產(chǎn)業(yè)的“繁茂”。

　　呼吁三方協(xié)力讓數(shù)學(xué)不再置身事外

　　“一方面是政策引導(dǎo)，其實(shí)國(guó)家已經(jīng)在加大這方面的扶持，例如科研基金上的設(shè)置等。”針對(duì)如何解決“徐匡迪之問(wèn)”反映出來(lái)的問(wèn)題，孔德興認(rèn)為，第二方面是行業(yè)企業(yè)在進(jìn)行科技創(chuàng)新時(shí)，應(yīng)有意識(shí)將數(shù)學(xué)學(xué)者納入進(jìn)來(lái)。“如果通過(guò)算法的開(kāi)發(fā)，最終產(chǎn)品落地了，企業(yè)應(yīng)該將算法開(kāi)發(fā)時(shí)的數(shù)學(xué)學(xué)者納入到成果分享中來(lái)。”孔德興說(shuō)，社會(huì)目前對(duì)于數(shù)學(xué)科學(xué)等“軟實(shí)力”的認(rèn)可程度不足，行業(yè)或法規(guī)層面應(yīng)該做好數(shù)學(xué)研究成果的產(chǎn)權(quán)保護(hù)工作。

　　“第三方面，數(shù)學(xué)家本身應(yīng)該積極參與到人工智能發(fā)展的浪潮里。”孔德興呼吁，AI的未來(lái)發(fā)展需要數(shù)學(xué)家深度參與。由于目前仍處于“弱人工智能”時(shí)代(可以說(shuō)是數(shù)據(jù)智能時(shí)代)，AI的實(shí)現(xiàn)主要是依賴(lài)計(jì)算機(jī)的巨大算力和巨大的存儲(chǔ)能力，底層算法的問(wèn)題或許并不突出，但在未來(lái)的發(fā)展，AI將可能融入邏輯、思維等智慧的內(nèi)容，這些都需要數(shù)學(xué)科學(xué)的原始創(chuàng)新，有大量的基礎(chǔ)問(wèn)題亟待數(shù)學(xué)家攻克。

　　算法的進(jìn)階一定是來(lái)源于“原創(chuàng)者”，而不是“跟隨者”。孔德興說(shuō)：“實(shí)際上深度學(xué)習(xí)的應(yīng)用已遇到了天花板，我們需要新的數(shù)學(xué)技術(shù)(如部分依賴(lài)邏輯、部分依賴(lài)數(shù)據(jù)的‘聰明算法’)，讓計(jì)算機(jī)變得聰明起來(lái)。這些工作都需要數(shù)學(xué)家的參與。”(采訪來(lái)源：科技日?qǐng)?bào))

　　人工智能發(fā)展陷入了拿來(lái)主義怪圈

　　歷史已經(jīng)證明，通過(guò)購(gòu)買(mǎi)現(xiàn)成的產(chǎn)品與技術(shù)來(lái)實(shí)現(xiàn)技術(shù)的跨越，在科學(xué)技術(shù)領(lǐng)域是行不通的。中國(guó)科技行業(yè)的哪一樣，不都是經(jīng)歷了艱苦奮斗，無(wú)數(shù)科學(xué)家默默無(wú)聞為之奉獻(xiàn)后，方才得以傲視世界群雄？比如中國(guó)的量子技術(shù)，比如中國(guó)的國(guó)防科技，中國(guó)的天宮空間站，中國(guó)的嫦娥月球車(chē)。

　　作為技術(shù)高度密集的人工智能技術(shù)，其商業(yè)領(lǐng)域竟然是陷入了拿來(lái)主義，著實(shí)讓人意外。中國(guó)AI產(chǎn)業(yè)大約從2018年開(kāi)始一夜爆紅，稍微有些規(guī)模的IT廠家無(wú)不宣稱(chēng)，已經(jīng)推出人工智能產(chǎn)品到市場(chǎng)上。當(dāng)時(shí)認(rèn)為這也是中國(guó)科學(xué)人多年來(lái)的厚積薄發(fā)，技術(shù)積累到一定程度后實(shí)現(xiàn)了產(chǎn)業(yè)的繁榮。可惜的當(dāng)徐匡迪院士發(fā)出直擊靈魂的提問(wèn)后，才發(fā)現(xiàn)原來(lái)中國(guó)的AI產(chǎn)業(yè)不過(guò)是看上去很美麗。

　　人工智能技術(shù)本質(zhì)上是以數(shù)學(xué)算法為核心，輔以計(jì)算機(jī)技術(shù)的產(chǎn)品。與其說(shuō)是一個(gè)IT產(chǎn)品，倒不如說(shuō)是一套數(shù)學(xué)理論，如隨機(jī)森林算法，貝葉斯算法等都是復(fù)雜的數(shù)學(xué)、統(tǒng)計(jì)學(xué)、概率領(lǐng)域的內(nèi)容。這些算法試圖通過(guò)數(shù)字概率來(lái)描述人類(lèi)思考的過(guò)程。計(jì)算機(jī)技術(shù)不過(guò)是通過(guò)編程語(yǔ)言在信息系統(tǒng)中實(shí)現(xiàn)算法過(guò)程。可見(jiàn)推動(dòng)人工智能前進(jìn)的必定是數(shù)學(xué)領(lǐng)域的專(zhuān)家，而不是IT部門(mén)的人才。

　　基礎(chǔ)學(xué)科，比如數(shù)學(xué)一直是我們非常薄弱的環(huán)節(jié)。當(dāng)華羅庚將中國(guó)數(shù)學(xué)推向一個(gè)高峰后，之后眾人還只是在努力追趕國(guó)際同行，一直沒(méi)有能在國(guó)際上獨(dú)領(lǐng)風(fēng)騷。可想而知在人工智能商業(yè)、民用領(lǐng)域，我們的進(jìn)展同國(guó)際同行相經(jīng)差距明顯。所以2018年的AI產(chǎn)業(yè)大爆發(fā)就讓人心生懷疑。

　　沒(méi)有安心研發(fā)，那么就拿現(xiàn)成的好了。正巧大家可以從網(wǎng)上下載到開(kāi)源人工智能算法。于是大家都將其下載下來(lái)，加上漂亮的外殼，讓我們的AI產(chǎn)品炫酷奪目。如果有機(jī)會(huì)能探究當(dāng)下較火的商業(yè)人工智能產(chǎn)品，最終會(huì)發(fā)現(xiàn)所有算法都指向了同一個(gè)來(lái)源。不是說(shuō)開(kāi)源不好，正如浙江大學(xué)孔德興教授所言，開(kāi)源的產(chǎn)品是由其它國(guó)家人開(kāi)發(fā)出來(lái)的，無(wú)論其功能好與壞，你并不知道它的開(kāi)發(fā)思路是怎么樣的。算法高效之處不知為何，而其能力不足之處也茫然不知。盡管其是開(kāi)放源代碼的，不知道有多少I(mǎi)T公司認(rèn)認(rèn)真真地研讀一遍將其吃透研究明白了。

　　還有一點(diǎn)想跟大家討論的是，開(kāi)源的人工智能算法絕不會(huì)是高效的，或者說(shuō)是真正的算法程度。開(kāi)源代碼是IT高手們將自己想法實(shí)現(xiàn)并放到網(wǎng)上供大家討論的東西，往往是初級(jí)的，探索性的東西。據(jù)說(shuō)當(dāng)現(xiàn)開(kāi)源AI代碼是從印度工程師放出來(lái)的(這點(diǎn)也是聽(tīng)聞，不確定)。現(xiàn)在大家應(yīng)當(dāng)有所體會(huì)，人工智能絕不會(huì)是一兩個(gè)工程師就可以搞出來(lái)的東西，要不為什么谷歌公司投入了那么多人力物力才實(shí)現(xiàn)了將國(guó)際象棋冠軍打敗的程度。而這套算法卻無(wú)法應(yīng)對(duì)英國(guó)高中數(shù)學(xué)問(wèn)題。還有一點(diǎn)，真正尖端的人工智能算法，永遠(yuǎn)不會(huì)出現(xiàn)在互聯(lián)網(wǎng)上供人們共享的。

　　資本的力量是可怕的。為了賺取利潤(rùn)占領(lǐng)市場(chǎng)，商家秉持著唯快不破的想法，極速將產(chǎn)品推出來(lái)，哪有功夫去管它是好是壞呢。可是人工智能是一門(mén)科學(xué)，是最為嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)課題，不可能容得下這般不負(fù)責(zé)任的炒作。

　　這個(gè)世界是公平的，你怎樣對(duì)待科學(xué)，這就會(huì)怎樣對(duì)待你。玩弄科學(xué)，炒作概念，不腳踏實(shí)地的鉆研反而投機(jī)取巧，必定會(huì)被其反噬。如果大家一直在追蹤AI發(fā)展情況，其實(shí)已經(jīng)可以感受到，似乎AI的熱度較去年有所下降。而到現(xiàn)在為止尚未有一個(gè)真正能拿出手的商業(yè)人工智能產(chǎn)品在市場(chǎng)上出現(xiàn)。這已經(jīng)說(shuō)明許多。

　　愛(ài)之深恨之切。我們都期盼著中國(guó)IT有朝一日能夠站在世界巔峰。這個(gè)過(guò)程是需要腳踏實(shí)地的，一個(gè)臺(tái)階一個(gè)臺(tái)階攀登上去，沒(méi)有任何取巧的辦法。亡羊補(bǔ)牢未為晚也，希望徐匡迪之問(wèn)能驚醒中國(guó)IT公司，扎扎實(shí)實(shí)的一步一個(gè)腳印的走下去，讓國(guó)人早日用上真正的人工智能應(yīng)用。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

徐匡迪院士5問(wèn)揭開(kāi)當(dāng)下中國(guó)人工智能虛偽的面紗

日期： 2019-09-15

相關(guān)內(nèi)容