AI芯片的發(fā)展,,離不開人工智能技術(shù)的成熟,。人工智能從1956年誕生至今,,共經(jīng)歷過三次大的浪潮。進(jìn)入21世紀(jì),,由于計(jì)算機(jī)性能的提升和海量數(shù)據(jù)的產(chǎn)生,,以及機(jī)器學(xué)習(xí)和CNN技術(shù)(Convolutional Nerual Networks,卷積神經(jīng)網(wǎng)絡(luò))獲得突破,,算法,、算力和數(shù)據(jù)都滿足了人工智能的商業(yè)化落地需求,人工智能迎來了高速發(fā)展的階段,。
實(shí)際上,,人工智能產(chǎn)業(yè)得以快速發(fā)展,離不開目前唯一的物理基礎(chǔ)——芯片,??梢哉f,“無芯片不AI”,,能否開發(fā)出具有超高運(yùn)算能力,、符合市場(chǎng)需求的芯片,,已成為人工智能能否可持續(xù)發(fā)展的重要因素。
近年來,,AI芯片產(chǎn)業(yè)發(fā)展迅猛,,眾多企業(yè)紛紛布局。但從芯片的起步,、發(fā)展,、成熟的三個(gè)階段來看,人工智能芯片仍然處于起步階段,。
巨頭新銳,,共遇產(chǎn)業(yè)瓶頸
按應(yīng)用場(chǎng)景的不同,AI芯片設(shè)計(jì)可分為云端訓(xùn)練,、云端推斷、終端推斷三部分,。其中云端訓(xùn)練芯片主要以英偉達(dá)的GPU為主,,新入競(jìng)爭(zhēng)者是谷歌的TPU,以及深耕FPGA的賽靈思與英特爾,。在云端推斷方面,,代表企業(yè)有AMD、谷歌,、英偉達(dá),、百度、寒武紀(jì)等,。
在終端推斷方面,,由于移動(dòng)終端、自動(dòng)駕駛等應(yīng)用場(chǎng)景需求逐漸爆發(fā),,布局企業(yè)包括傳統(tǒng)芯片巨頭和初創(chuàng)企業(yè),,如高通、華為海思,、地平線,、寒武紀(jì)、比特大陸等,。
不難發(fā)現(xiàn),,在市場(chǎng)格局上,雖然目前都是傳統(tǒng)芯片巨頭占據(jù)著AI芯片市場(chǎng)的霸主地位,。但AI芯片落地難,,是困擾巨頭與新銳的共同問題。
來源:清華大學(xué)未來芯片創(chuàng)新中心
地平線聯(lián)合創(chuàng)始人兼副總裁黃暢告訴億歐科創(chuàng):AI芯片落地之所以難,,首先是大家技術(shù)上都遇到了共同的瓶頸,,也是所謂的“馮·諾依曼瓶頸”,。
提高AI芯片性能的關(guān)鍵之一,在于支持高效的數(shù)據(jù)訪問,。在傳統(tǒng)馮·諾伊曼體系結(jié)構(gòu)中,,數(shù)據(jù)從處理單元外的存儲(chǔ)器提取,處理完之后再寫回存儲(chǔ)器,。AI芯片本身基于馮·諾伊曼體系結(jié)構(gòu),,使用簡(jiǎn)單的功能是完全沒問題的。
但由于運(yùn)算部件和存儲(chǔ)部件存在速度差異,,當(dāng)運(yùn)算能力達(dá)到一定程度,,由于訪問存儲(chǔ)器的速度無法跟上運(yùn)算部件消耗數(shù)據(jù)的速度,再增加運(yùn)算部件也無法得到充分利用,,即形成所謂的馮·諾依曼瓶頸,,或“內(nèi)存墻”問題,這是長(zhǎng)期困擾計(jì)算機(jī)體系結(jié)構(gòu)的難題,。
目前常見的方法是利用高速緩存(Cache)等層次化存儲(chǔ)技術(shù),,盡量緩解運(yùn)算和存儲(chǔ)的速度差異。然而,,AI芯片中需要存儲(chǔ)和處理的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于之前常見的應(yīng)用,。這都使得馮·諾依曼瓶頸問題在AI應(yīng)用中愈發(fā)嚴(yán)重?!翱梢圆豢鋸埖卣f,,大部分針對(duì)AI提出的硬件架構(gòu)創(chuàng)新都是在和這個(gè)問題做斗爭(zhēng)?!秉S暢補(bǔ)充道,。
不過,也正是由于人工智能芯片的技術(shù)難題,,導(dǎo)致不論是巨頭還是新銳都處于同一起跑線,,這給國產(chǎn)企業(yè)提供了良好的超越“賽道”。這也避免了傳統(tǒng)巨頭利用自身已有優(yōu)勢(shì),,快速甩開對(duì)手,。
問鼎全球,如何彎道超車
19年6月20日,,寒武紀(jì)推出第二代云端“思元270”,;6月21日,華為發(fā)布人工智能手機(jī)芯片“麒麟810”,;7月3日,,百度發(fā)布人工智能芯片遠(yuǎn)場(chǎng)語音交互芯片“鴻鵠”;10月29日,,地平線發(fā)布AIoT邊緣計(jì)算人工智能芯片“旭日二代”,。
可以發(fā)現(xiàn),,國產(chǎn)企業(yè)在AI芯片領(lǐng)域的布局已初見雛形,有一戰(zhàn)之力,。但想問鼎全球,,仍需改善一些不足。
針對(duì)國產(chǎn)AI芯片的發(fā)展,,中國工程院院士倪光南多次表示,,芯片設(shè)計(jì)門檻極高,只有極少數(shù)企業(yè)能夠承受中高端芯片研發(fā)成本,,這也制約了芯片領(lǐng)域創(chuàng)新,。我國可以借鑒開源軟件成功經(jīng)驗(yàn),降低創(chuàng)新門檻,,提高企業(yè)自主能力,,發(fā)展國產(chǎn)開源芯片。
“開源軟件正成為當(dāng)前軟件產(chǎn)業(yè)的主流,,芯片產(chǎn)業(yè)也可以采用開源這種模式,。”倪光南強(qiáng)調(diào),,目前在芯片開發(fā)方面,新的RISC-V指令集是一種能夠降低處理器芯片IP成本的新模式,。企業(yè)可以自由免費(fèi)使用RISC-V進(jìn)行CPU設(shè)計(jì),、開發(fā)并添加自有指令集進(jìn)行拓展等。RISC-V對(duì)于當(dāng)前AI芯片架構(gòu)的優(yōu)化,,成本的控制,,都有很好的效果。
關(guān)于AI芯片架構(gòu),,其實(shí)我國企業(yè)已有不少可圈可點(diǎn)的案例,,例如華為的達(dá)芬奇架構(gòu),寒武紀(jì)的Cambricon-X架構(gòu),,鯤云科技的CAISA架構(gòu),,地平線的伯努利架構(gòu)等。
比起人工智能芯片架構(gòu),,我國更應(yīng)該關(guān)注人工智能芯片的產(chǎn)業(yè)鏈完整度,。
我國制造芯片的最新設(shè)備和工藝比國際先進(jìn)水平落后多代,因此一些人工智能芯片需要送到境外進(jìn)行制造和封裝,。這就會(huì)造成芯片產(chǎn)量不足,,以及價(jià)格過高的問題。使得下游很多使用其模組的產(chǎn)品無法量產(chǎn),,造成惡性循環(huán),,不利于行業(yè)的發(fā)展,。
作為國內(nèi)邊緣側(cè)AI芯片領(lǐng)域的先行者,嘉楠科技早在2016年就掌握了16nm制程工藝,,之所以現(xiàn)階段的AI芯片制程工藝仍為28nm,,主要也是受價(jià)格和出貨量的限制。
賽迪顧問《中國人工智能芯片產(chǎn)業(yè)發(fā)展白皮書》顯示,,中國人工智能芯片市場(chǎng)規(guī)模保持高速增長(zhǎng),。云端領(lǐng)域,2018年云端市場(chǎng)全球占比17.0%,;預(yù)計(jì)2021年將達(dá)221.5億元,,CAGR達(dá) 51.23%。終端領(lǐng)域,,2021年將達(dá)84.1億元,,CAGR為59.3%。
面對(duì)如此廣闊的市場(chǎng),,希望國產(chǎn)企業(yè)能潛心突破瓶頸,,問鼎全球。
作者:張偉超