人工智能是什么,?
它是技術(shù)還是應(yīng)用,,我們怎么樣才能實(shí)現(xiàn)科幻電影中營造的人工智能世界?
當(dāng)夢想照進(jìn)現(xiàn)實(shí),,一步步的從理論成為實(shí)際,,這中間有太多的路要走,每個人,,每個企業(yè)對于同一技術(shù)的思考都不盡相同,。
但是,所謂大道至簡,,條條大路通羅馬,,殊途同歸,,說的都是一個道理。
人工智能半導(dǎo)體,,從軟到硬
人工智能,,作為一項(xiàng)應(yīng)用,正在重復(fù)過去數(shù)十年個人計(jì)算機(jī)走過的老路,。
從硬件,軟件,,再到硬件的發(fā)展,,就像天平的兩端,需要在兩者之間找到最佳的平衡點(diǎn),,才能夠?qū)崿F(xiàn)技術(shù)和應(yīng)用的落地,。
在蘋果,谷歌,,微軟在軟件基礎(chǔ)之上打磨人工智能功能之后,,這些企業(yè)也意識到了硬件的重要性,谷歌甚至專門為人工智能開發(fā)了其特有的專用芯片TPU,,這也說明,,人工智能芯片對于整個產(chǎn)業(yè)來說,正在變得至關(guān)重要,。
在美國是這樣,,在韓國也是如此。
根據(jù)美國知識產(chǎn)權(quán)局表示,,2017 年 AI 半導(dǎo)體專利達(dá) 391 件,,對比 2013 年的 32 件,近 4 年成長超過 10 倍,,且速度逐年加快,,2014 年有 59 件、2015 年成長三成至 77 件,,2016 年更是倍增至 167 件,。
而在中國,在人工智能的浪潮中,,有這樣一群人,,他們畢業(yè)于國內(nèi)外的頂級高效,對人工智能有著深刻的認(rèn)識,,大多數(shù)曾供職于國內(nèi)外的頂級研究室,,或在高校任職,現(xiàn)在,,都投身于人工智能的浪潮從,,以各自對于人工智能硬件的認(rèn)知,,推動人工智能半導(dǎo)體方面的發(fā)展。
其中,,尤以地平線機(jī)器人,,深鑒科技和寒武紀(jì)這三家企業(yè)被業(yè)內(nèi)提到的次數(shù)最多,也最為人津津樂道,。
那么這三家企業(yè)在實(shí)現(xiàn)人工智能的大道上,,到底有什么區(qū)別呢?
在3月15日舉行的AI半導(dǎo)體技術(shù)論壇上,,這樣一個以打假著稱的日子里,,我們看一看這三家企業(yè)有何不同吧。
以下敘述,,沒有排名,,僅以演講順序?yàn)橹鳌?/p>
地平線機(jī)器人:嵌入式人工智能
一家企業(yè)能否成功主要取決于幾個方面,能否把握市場趨勢,,能否推出具有優(yōu)勢的產(chǎn)品,,能否不隨波逐流,有自己的思路,。
按照地平線機(jī)器人芯片規(guī)劃部部長譚洪賀的話來說,,成立于2015年的地平線,從成立之初就對人工智能芯片的設(shè)計(jì)有著自己獨(dú)特的想法,。
適用于IT領(lǐng)域的安迪比爾定理: “Andy gives, Bill takes away.(安迪提供什么,,比爾拿走什么。)” ,,在地平線看來也適用于人工智能芯片市場,。
摩爾定理給所有的計(jì)算機(jī)消費(fèi)者帶來一個希望,如果我今天嫌計(jì)算機(jī)太貴買不起,,那么我等十八個月就可以用一半的價錢來買,。要真是這樣簡單的話,計(jì)算機(jī)的銷售量就上不去了,。需要買計(jì)算機(jī)的人會多等幾個月,,已經(jīng)有計(jì)算機(jī)的人也沒有動力更新計(jì)算機(jī)。
這一定理說明了硬件和算法之間的問題,,也確定了地平線在人工智能芯片上的發(fā)展方向,。
由于有了足夠的硬件資源,工程師做事情更講究自己的工作效率,,程序的規(guī)范化和可讀性等等,。另外,由于人工成本的提高,,為了節(jié)省工程師的時間,,算法更迭會越來越快,,同時效率卻越來越低。今天的比昨天的占用硬件資源多是一件在所難免的事,。
這就像“缸”與“水”的關(guān)系一樣,,芯片是外在的缸,算法是水,,想要實(shí)現(xiàn)更多的人工智能的功能,,就需要更多,更多功能的算法,,也就要求必須要有足夠大的缸來裝下這些算法,,缸比水大,頂多算是資源過剩,,水比缸大,在芯片上可就不單是簡簡單單的溢出問題了,。
因此,,譚洪賀表示,地平線在設(shè)計(jì)芯片的時候,,都是將算法和芯片作為一個整體來考慮,,協(xié)同進(jìn)行設(shè)計(jì)。
這一想法的結(jié)果就是,,2017年12月20號,,地平線在北京舉辦了一場名為“AI芯時代”的產(chǎn)品發(fā)布會。
地平線帶來了全新的嵌入式人工智能視覺處理器:面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器,。
按照地平線創(chuàng)始人&CEO余凱的話來說,,這是完全由地平線自主研發(fā)的人工智能芯片,采用地平線的第一代BPU架構(gòu),,具有全球領(lǐng)先的性能:可實(shí)時處理 1080p30視頻,,每幀中可同時對200個目標(biāo)進(jìn)行檢測、跟蹤,、識別,,典型功耗1.5W,每幀延時小于30ms,。
據(jù)公開資料顯示,,余凱是前百度IDL副院長,百度無人駕駛項(xiàng)目發(fā)起人之一,。這個名字體現(xiàn)了地平線公司對超越邊界的執(zhí)著,。公司從創(chuàng)立伊始就以打造中國的Neural Processing Unit (NPU)為目標(biāo)。希望通過研發(fā)高性能,、低功耗,、低成本的處理器和算法軟件,,解決終端設(shè)備在本地的算法和計(jì)算問題,成為嵌入式人工智能的領(lǐng)導(dǎo)者,。為了實(shí)現(xiàn)這個目標(biāo),,他們自主研發(fā)了一種創(chuàng)新的嵌入式人工智能處理器架構(gòu)IP——Brain Processing Unit,也就是我們所說的BPU,。
“從本質(zhì)上來說,,地平線既不單純是一家算法公司或者是一家芯片公司。作為一家嵌入式人工智能解決方案公司,,地平線的目標(biāo)是要做全球的嵌入式人工智能的領(lǐng)導(dǎo)者,。做AI的大腦,提供高性能,,高能效,,全站式的解決方案?!?/p>
芯片結(jié)構(gòu)的不停迭代告訴我們,,CPU屬于標(biāo)量處理器,GPU是向量處理器,,從谷歌的TPU和地平線的BPU開始,,已經(jīng)演變成張量的處理器,因此所有的模塊都屬于張量處理的模塊,。要求在存儲和數(shù)據(jù)處理的過程中,,注意尺度的問題。對于張量處理器來說,,無論是二維還是三維,,都需要確定主攻的方向。
地平線對于人工智能的看法分為三個步驟,,第一,,是做能夠感知的AI,也就是能夠感知周圍的世界,。第二步建模,,以實(shí)現(xiàn)對周圍環(huán)境進(jìn)行3D建模或者是結(jié)構(gòu)建模,。最后實(shí)現(xiàn)決策和規(guī)劃,,再基于感知和建模的結(jié)果,反饋到現(xiàn)實(shí)之中,。
寒武紀(jì):人工智能芯片的多樣化挑戰(zhàn)
與地平線2015年入局不同,,寒武紀(jì)可以說算是國內(nèi)最早一批的人工智能公司之一。
資料記載,寒武紀(jì)的起源可以追溯至2008年,,其前身為中科院計(jì)算所成立的一只10人學(xué)術(shù)團(tuán)隊(duì),。
估計(jì)當(dāng)時的這10個人都沒有想到會成立一家公司,更能夠推出芯片,,攪動中國人工智能市場,。
事實(shí)往往就是這么出乎意料,早期以發(fā)表學(xué)術(shù)論文為主的這一只團(tuán)隊(duì),,在2015年研制出了首個處理器產(chǎn)品,,并逐漸開始商業(yè)化。
但是,,一個巨大的問題擺在了這個團(tuán)隊(duì)面前,,沒有公司,商業(yè)化運(yùn)營很難進(jìn)行下去,,因此,,2016年3月,寒武紀(jì)公司正式成立,。
在中國科學(xué)院計(jì)算技術(shù)研究所陳云霽,、陳天石兩兄弟的領(lǐng)導(dǎo)下,2016年,,寒武紀(jì)推出的寒武紀(jì)1A處理器(Cambricon-1A)是世界首款商用深度學(xué)習(xí)專用處理器,面向智能手機(jī),、安防監(jiān)控,、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備,。
按照寒武紀(jì)執(zhí)行董事羅韜話來說,,在中國提供人工智能芯片的企業(yè)中,寒武紀(jì)解決方案最為完整,。目前,,寒武紀(jì)已與通信設(shè)備商華為合作,在后者智能手機(jī)Mate 10搭載的麒麟970芯片集成了1A的IP(知識產(chǎn)權(quán)),,并與IT設(shè)備商中科曙光推出了面向人工智能推理任務(wù)的服務(wù)器Phaneron,。
陳云霽曾這樣說到:“人的大腦是已知最智能的物體。如果能把大腦中神經(jīng)元和突觸數(shù)字化抽象出來,,這樣的數(shù)字化網(wǎng)絡(luò)某種程度上可能就繼承了人腦對信息的處理能力,。”
從現(xiàn)有情況來看,,一方面神經(jīng)網(wǎng)絡(luò)確實(shí)是智能處理的好方法,,但另一方面通用處理器在這方面效率很低,為什么不能用人工智能的辦法來設(shè)計(jì)一款專門的芯片呢,?所以,,“寒武紀(jì)”芯片就是要解決這個專門的問題,。
“寒武紀(jì)”AI芯片可以在計(jì)算機(jī)中模擬神經(jīng)元和突觸的計(jì)算,對信息進(jìn)行智能處理,。通過設(shè)計(jì)專門存儲結(jié)構(gòu)和指令集,,每秒可以處理160億個神經(jīng)元和超過2萬億個突觸,功耗卻只有原來的1/10,。
按照寒武紀(jì)目前的想法來看,,人工智能芯片面臨的就是多樣化問題,這個多樣化,,包括兩個方面:需求多樣化和形態(tài)多樣化,。
需求多樣化是指,對于不同的神經(jīng)網(wǎng)絡(luò)來說,,就想吃飯一樣,,不同的人口味都不同,有的人喜歡甜的,,有的人喜歡咸的,。應(yīng)用在不用領(lǐng)域的神經(jīng)網(wǎng)絡(luò),基于不同的功能,,不同的需求,,要求也不盡相同。大規(guī)模的神經(jīng)網(wǎng)絡(luò)需要高性能,,高效化的芯片,。小規(guī)模的神經(jīng)網(wǎng)絡(luò)需要低能耗的芯片。
而形態(tài)多樣化,,則是指對于同一款神經(jīng)網(wǎng)絡(luò)芯片,,想要能夠支持多種形態(tài)的神經(jīng)網(wǎng)絡(luò),不僅要在結(jié)構(gòu)上,,也要在算法等諸多方面做出全面的考慮,,才能夠滿足多個神經(jīng)網(wǎng)絡(luò)的需求。
深鑒科技:軟硬件協(xié)同
深鑒科技的團(tuán)隊(duì)真可謂是“全明星陣容”,,其創(chuàng)始團(tuán)隊(duì)全部是由來自斯坦福大學(xué)與清華大學(xué)的深度學(xué)習(xí)硬件加速研究者組建而成,。其中,聯(lián)合創(chuàng)始人&CTO單羿作為前百度前百度IDL異構(gòu)計(jì)算方向創(chuàng)始成員,,曾入選過IBM PhD Fellowship(IBM博士英才計(jì)劃)項(xiàng)目,。
聯(lián)合創(chuàng)始人韓松在2016年世界頂級深度學(xué)習(xí)會議ICLR上,以一篇Deep Compression(深度神經(jīng)網(wǎng)絡(luò)壓縮)論文與AlphaGo的開發(fā)者——谷歌DeepMind共同活動了最佳論文獎,,同時因?yàn)槠浜芨叩难芯吭煸?,韓松將于2018年任職MIT(麻省理工)助理教授。
另一位聯(lián)合創(chuàng)人汪玉是清華電子系副教授,國家自然科學(xué)基金“優(yōu)青”獲得者,清華大學(xué)教改以來首批終身教授,汪玉從2006年就已經(jīng)開始研究FPGA,,并且是現(xiàn)任ACM FPGA技術(shù)委員會亞太地區(qū)唯一成員,。
所以,雖然深鑒科技在2016年才成立,,但是已經(jīng)吸引了來自百度,、360、華為,、風(fēng)河,、Intel、Nokia等公司在內(nèi)的大批行業(yè)精英,,使得整個團(tuán)隊(duì)在具有國際學(xué)術(shù)影響力的同時又具備了資深的工業(yè)經(jīng)驗(yàn),。
資料顯示,深鑒科技最為核心的即Deep Learning Processing Unit(DPU)及神經(jīng)網(wǎng)絡(luò)壓縮編譯技術(shù),,甚至被世界最大的FPGA芯片廠商Xilinx認(rèn)為是世界深度學(xué)習(xí)硬件加速的典范,。
所謂DPU既深度學(xué)習(xí)處理器,其精髓就在于使用了深度壓縮技術(shù),。這項(xiàng)技術(shù)不僅可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響精度,,還可以使用芯片存儲深度學(xué)習(xí)算法模型,減少內(nèi)存讀取次數(shù),,大大降低運(yùn)行功耗,。
與此同時,基于優(yōu)化協(xié)同性,,深度壓縮技術(shù)對于硬件本身也提出了新的要求,。為此,深鑒科技推出了兩種用于深度學(xué)習(xí)處理器的底層架構(gòu)——亞里士多德架構(gòu)和笛卡爾架構(gòu),,以及面向DPU的深度神經(jīng)網(wǎng)絡(luò)開發(fā)工具包DNNDK。
姚頌認(rèn)為,,所有產(chǎn)品都可以分為四個層次:能用,、好用、讓用戶想用,、讓用戶愛用——AI芯片產(chǎn)品也是如此,。
對于AI芯片來說:
第一層是能用,就是這塊芯片能夠跑AI,、能夠?qū)ι疃葘W(xué)習(xí)運(yùn)算進(jìn)行加速,。
第二層是好用,如何讓這塊芯片支持的AI算法種類多一點(diǎn),,讓用戶開發(fā)起來更簡單,。
第三層是想用,那就是用戶用你的產(chǎn)品開發(fā)起來更簡單、算法跑出來性能更好,,選擇別的產(chǎn)品時開發(fā)起來更麻煩,。
第四層則是愛用,也就是用戶粘性高,,當(dāng)很多使用你的芯片的人集成在一起,,形成社區(qū)與軟件生態(tài),有很多開放的項(xiàng)目代碼可以供人交流參考,,這就不僅是能用或者好用了,,而是讓用戶愛用。
人工智能的兩個方向
近年來,,英特爾,、英偉達(dá)、Facebook,、微軟,、Google、IBM,、蘋果,、華為等科技公司都在積極布局AI芯片,復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò)計(jì)算需求很高,,除了云計(jì)算,,需要有更多更強(qiáng)大的本地計(jì)算資源。
咨詢公司Tractica的預(yù)測數(shù)據(jù)顯示,,到2025年,,與人工智能相關(guān)的深度學(xué)習(xí)芯片組市場收入,將由去年的5億美元飆升至122億美元的規(guī)模,,復(fù)合年均增長率超過40%,。這一數(shù)據(jù)不僅是基于巨頭的參與,也是源自人工智能創(chuàng)業(yè)企業(yè)近年來的爆發(fā),。
要知道,,從1956人工智能概念被提出以來,經(jīng)歷60多年的發(fā)展,,這項(xiàng)技術(shù)前后經(jīng)歷了多次跌宕起伏,。隨著AlphaGo打敗李世石這樣的典型案例出現(xiàn),無論是各國政府還是資本市場,,都將人工智能視為今后發(fā)展的戰(zhàn)略中心,。
我國更是提出了要將人工智能與傳統(tǒng)行業(yè)進(jìn)行深度融合,這為一大批企業(yè)提供了極好的發(fā)展空間,。更為重要的是,,“大眾創(chuàng)業(yè)萬眾創(chuàng)新”的新時代也為廣大創(chuàng)業(yè)者提供了良好的發(fā)展平臺,。
在這波人工智能的創(chuàng)業(yè)浪潮中,有兩個創(chuàng)業(yè)方向:1,、以算法為主,,做算法研究 ;2,、以硬件為主,,做AI芯片。
總結(jié)
在這場硝煙尚未完全燃起的戰(zhàn)爭中,,美國一直以來是全球人工智能領(lǐng)域領(lǐng)跑的國家,,但中國已經(jīng)開始著手加速入局。這兩年,,數(shù)家中國公司開始芯片研發(fā),,“XPU”的出現(xiàn)如雨后春筍。
而以地平線,,寒武紀(jì),,深鑒科技為主的大批人工智能芯片企業(yè)正在以各自對于人工智能行業(yè)的獨(dú)特思考,不斷的摸索自己的發(fā)展之路,,創(chuàng)造屬于自己的人工智能領(lǐng)域,。
地平線的發(fā)展策略是,針對使用場景需求研究最適合的算法框架,,然后將算法框架實(shí)現(xiàn)在芯片上,,其目的是做“嵌入式人工智能”,用芯片加算法的模式,,進(jìn)行單點(diǎn)突破,。
寒武紀(jì)則選擇了另一條路徑。2016年發(fā)布了人工智能專用指令集后,,寒武紀(jì)在軟件平臺投入了大量的人力,。寒武紀(jì)不僅令處理器可以支持主流的編程框架,同時開發(fā)了專用函數(shù)庫,、編譯器,、模型生成工具等,降低開發(fā)者使用的門檻,。相對而言,寒武紀(jì)的芯片通用性更強(qiáng),。
而深鑒科技走的是為深度學(xué)習(xí)提供高效靈活的軟硬一體解決方案的道路,。無論是推出Deep Learning Processing Unit(DPU)還是神經(jīng)網(wǎng)絡(luò)壓縮編譯技術(shù),深鑒科技始終認(rèn)為,,每家AI芯片公司都需要成為一家軟件&系統(tǒng)公司,,這樣才能在市場競爭中取得優(yōu)勢,。