AI芯片的發(fā)展,離不開人工智能技術(shù)的成熟,。人工智能從1956年誕生至今,共經(jīng)歷過(guò)三次大的浪潮,。進(jìn)入21世紀(jì),,由于計(jì)算機(jī)性能的提升和海量數(shù)據(jù)的產(chǎn)生,以及機(jī)器學(xué)習(xí)和CNN技術(shù)(Convolutional Nerual Networks,,卷積神經(jīng)網(wǎng)絡(luò))獲得突破,,算法、算力和數(shù)據(jù)都滿足了人工智能的商業(yè)化落地需求,,人工智能迎來(lái)了高速發(fā)展的階段,。
實(shí)際上,人工智能產(chǎn)業(yè)得以快速發(fā)展,,離不開目前唯一的物理基礎(chǔ)——芯片,。可以說(shuō),,“無(wú)芯片不AI”,,能否開發(fā)出具有超高運(yùn)算能力、符合市場(chǎng)需求的芯片,,已成為人工智能能否可持續(xù)發(fā)展的重要因素,。
近年來(lái),AI芯片產(chǎn)業(yè)發(fā)展迅猛,,眾多企業(yè)紛紛布局,。但從芯片的起步、發(fā)展,、成熟的三個(gè)階段來(lái)看,,人工智能芯片仍然處于起步階段。
巨頭新銳,共遇產(chǎn)業(yè)瓶頸
按應(yīng)用場(chǎng)景的不同,,AI芯片設(shè)計(jì)可分為云端訓(xùn)練,、云端推斷、終端推斷三部分,。其中云端訓(xùn)練芯片主要以英偉達(dá)的GPU為主,,新入競(jìng)爭(zhēng)者是谷歌的TPU,以及深耕FPGA的賽靈思與英特爾,。在云端推斷方面,,代表企業(yè)有AMD、谷歌,、英偉達(dá),、百度、寒武紀(jì)等,。
在終端推斷方面,,由于移動(dòng)終端、自動(dòng)駕駛等應(yīng)用場(chǎng)景需求逐漸爆發(fā),,布局企業(yè)包括傳統(tǒng)芯片巨頭和初創(chuàng)企業(yè),,如高通、華為海思,、地平線,、寒武紀(jì)、比特大陸等,。
不難發(fā)現(xiàn),,在市場(chǎng)格局上,雖然目前都是傳統(tǒng)芯片巨頭占據(jù)著AI芯片市場(chǎng)的霸主地位,。但AI芯片落地難,,是困擾巨頭與新銳的共同問(wèn)題。
來(lái)源:清華大學(xué)未來(lái)芯片創(chuàng)新中心
地平線聯(lián)合創(chuàng)始人兼副總裁黃暢告訴億歐科創(chuàng):AI芯片落地之所以難,,首先是大家技術(shù)上都遇到了共同的瓶頸,,也是所謂的“馮·諾依曼瓶頸”。
提高AI芯片性能的關(guān)鍵之一,,在于支持高效的數(shù)據(jù)訪問(wèn),。在傳統(tǒng)馮·諾伊曼體系結(jié)構(gòu)中,數(shù)據(jù)從處理單元外的存儲(chǔ)器提取,,處理完之后再寫回存儲(chǔ)器。AI芯片本身基于馮·諾伊曼體系結(jié)構(gòu),,使用簡(jiǎn)單的功能是完全沒(méi)問(wèn)題的,。
但由于運(yùn)算部件和存儲(chǔ)部件存在速度差異,當(dāng)運(yùn)算能力達(dá)到一定程度,由于訪問(wèn)存儲(chǔ)器的速度無(wú)法跟上運(yùn)算部件消耗數(shù)據(jù)的速度,,再增加運(yùn)算部件也無(wú)法得到充分利用,,即形成所謂的馮·諾依曼瓶頸,或“內(nèi)存墻”問(wèn)題,,這是長(zhǎng)期困擾計(jì)算機(jī)體系結(jié)構(gòu)的難題,。
目前常見的方法是利用高速緩存(Cache)等層次化存儲(chǔ)技術(shù),盡量緩解運(yùn)算和存儲(chǔ)的速度差異,。然而,,AI芯片中需要存儲(chǔ)和處理的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于之前常見的應(yīng)用。這都使得馮·諾依曼瓶頸問(wèn)題在AI應(yīng)用中愈發(fā)嚴(yán)重,?!翱梢圆豢鋸埖卣f(shuō),大部分針對(duì)AI提出的硬件架構(gòu)創(chuàng)新都是在和這個(gè)問(wèn)題做斗爭(zhēng),?!秉S暢補(bǔ)充道。
不過(guò),,也正是由于人工智能芯片的技術(shù)難題,,導(dǎo)致不論是巨頭還是新銳都處于同一起跑線,這給國(guó)產(chǎn)企業(yè)提供了良好的超越“賽道”,。這也避免了傳統(tǒng)巨頭利用自身已有優(yōu)勢(shì),,快速甩開對(duì)手。
問(wèn)鼎全球,,如何彎道超車
19年6月20日,,寒武紀(jì)推出第二代云端“思元270”;6月21日,,華為發(fā)布人工智能手機(jī)芯片“麒麟810”,;7月3日,百度發(fā)布人工智能芯片遠(yuǎn)場(chǎng)語(yǔ)音交互芯片“鴻鵠”,;10月29日,,地平線發(fā)布AIoT邊緣計(jì)算人工智能芯片“旭日二代”。
可以發(fā)現(xiàn),,國(guó)產(chǎn)企業(yè)在AI芯片領(lǐng)域的布局已初見雛形,,有一戰(zhàn)之力。但想問(wèn)鼎全球,,仍需改善一些不足,。
針對(duì)國(guó)產(chǎn)AI芯片的發(fā)展,中國(guó)工程院院士倪光南多次表示,,芯片設(shè)計(jì)門檻極高,,只有極少數(shù)企業(yè)能夠承受中高端芯片研發(fā)成本,,這也制約了芯片領(lǐng)域創(chuàng)新。我國(guó)可以借鑒開源軟件成功經(jīng)驗(yàn),,降低創(chuàng)新門檻,,提高企業(yè)自主能力,發(fā)展國(guó)產(chǎn)開源芯片,。
“開源軟件正成為當(dāng)前軟件產(chǎn)業(yè)的主流,,芯片產(chǎn)業(yè)也可以采用開源這種模式?!蹦吖饽蠌?qiáng)調(diào),,目前在芯片開發(fā)方面,新的RISC-V指令集是一種能夠降低處理器芯片IP成本的新模式,。企業(yè)可以自由免費(fèi)使用RISC-V進(jìn)行CPU設(shè)計(jì),、開發(fā)并添加自有指令集進(jìn)行拓展等。RISC-V對(duì)于當(dāng)前AI芯片架構(gòu)的優(yōu)化,,成本的控制,,都有很好的效果。
關(guān)于AI芯片架構(gòu),,其實(shí)我國(guó)企業(yè)已有不少可圈可點(diǎn)的案例,,例如華為的達(dá)芬奇架構(gòu),寒武紀(jì)的Cambricon-X架構(gòu),,鯤云科技的CAISA架構(gòu),,地平線的伯努利架構(gòu)等。
比起人工智能芯片架構(gòu),,我國(guó)更應(yīng)該關(guān)注人工智能芯片的產(chǎn)業(yè)鏈完整度,。
我國(guó)制造芯片的最新設(shè)備和工藝比國(guó)際先進(jìn)水平落后多代,因此一些人工智能芯片需要送到境外進(jìn)行制造和封裝,。這就會(huì)造成芯片產(chǎn)量不足,,以及價(jià)格過(guò)高的問(wèn)題。使得下游很多使用其模組的產(chǎn)品無(wú)法量產(chǎn),,造成惡性循環(huán),,不利于行業(yè)的發(fā)展。
作為國(guó)內(nèi)邊緣側(cè)AI芯片領(lǐng)域的先行者,,嘉楠科技早在2016年就掌握了16nm制程工藝,,之所以現(xiàn)階段的AI芯片制程工藝仍為28nm,主要也是受價(jià)格和出貨量的限制,。
賽迪顧問(wèn)《中國(guó)人工智能芯片產(chǎn)業(yè)發(fā)展白皮書》顯示,,中國(guó)人工智能芯片市場(chǎng)規(guī)模保持高速增長(zhǎng)。云端領(lǐng)域,,2018年云端市場(chǎng)全球占比17.0%,;預(yù)計(jì)2021年將達(dá)221.5億元,,CAGR達(dá) 51.23%。終端領(lǐng)域,,2021年將達(dá)84.1億元,CAGR為59.3%,。
面對(duì)如此廣闊的市場(chǎng),,希望國(guó)產(chǎn)企業(yè)能潛心突破瓶頸,問(wèn)鼎全球,。
作者:張偉超