2018年以來,,不少以算法為主的語音,、視覺、自動駕駛等公司也開始研發(fā)AI芯片,,將算法和芯片進行更好的結合,,來針對多樣化的場景,未來軟硬結合將會是趨勢,。
隨著深度學習和AI應用的不斷演進,,近兩年AI芯片廠商不斷涌現(xiàn),加之貿(mào)易摩擦中芯片概念的普及,,2018年的AI芯片領域持續(xù)火熱,。在國內(nèi),貼上AI芯片標簽的公司已經(jīng)超過40家,,其中的佼佼者們獲得不菲融資,。
盡管目前AI在行業(yè)應用方面的滲透有限,但是算力的供需還是不平衡,。近日,,華為智能計算業(yè)務部總裁邱隆就向21世紀經(jīng)濟報道記者表示:“原來由摩爾定律驅動的計算產(chǎn)業(yè),面對爆發(fā)式的計算需求無以為繼,。摩爾定律在正常的時候,,以每年1.5倍增長,50%的算力增長,在過去幾年間,,每年的算力實際增長只有10%,。人工智能在過去幾年間,算力增長了30萬倍,,至少每一年我們的算力要增長10倍?!?/p>
這意味著人工智能除了算法外,,對算力也存在強大的需求。面對增多的B端應用場景,,也有更多的AI芯片公司加入角逐,。從功能角度細分,AI芯片可分為訓練芯片和推理芯片,,在訓練方面,,目前英偉達獨樹一幟,但是在推理方面,,可選擇的芯片種類不只是GPU,,還有FPGA(現(xiàn)場可編程門陣列)、ASIC(專用集成電路)等,。在各個分類中,,芯片巨頭們各有千秋,接下來還要考驗落地情況,。
群雄混戰(zhàn)
芯片目前主要是提供算力支持,,2018年,AI芯片大廠和創(chuàng)業(yè)公司們均有不少新動作,。
最大的玩家當屬英偉達和英特爾,。英偉達的GPU抓住了計算設備需求的關鍵時機,在圖形渲染,、人工智能和區(qū)塊鏈領域的計算表現(xiàn)突出,,希望成為真正的算力平臺,其中,,英偉達在訓練方面的代表芯片就是Tesla V100,。由于英偉達GPU布局AI的時間早于英特爾、賽靈思等公司,,整體生態(tài)較為完整,,產(chǎn)品在IT公司中得到廣泛應用。
英特爾則通過收購案來彌補AI芯片的賽道:2015年167億美金收購FPGA巨頭Altera,。FPGA在云計算,、物聯(lián)網(wǎng)、邊緣計算等方面有很大的潛力,。隨著5G浪潮的到來,,物聯(lián)網(wǎng)的數(shù)據(jù)分析及計算需求會暴增,,物聯(lián)網(wǎng)的接入節(jié)點至少是數(shù)百億級的規(guī)模,比手機規(guī)模要高出1-2個數(shù)量級,。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化,,這是FPGA的強項,F(xiàn)PGA可以通過自身結構的改變來適應定制化計算場景的需求,,能為不同類型的設備提供高效芯片,。
同時,英特爾還收購了Nervana,,計劃用這家公司在深度學習方面的能力來對抗GPU,,Nervana的最新版深度學習芯片將在2019年量產(chǎn)。此外,,英特爾還收購了視覺處理芯片初創(chuàng)公司 Movidius,、自動駕駛公司Mobileye。
算法巨頭谷歌則另辟蹊徑,,以ASIC類型的芯片來滿足自身需求,。具體來看,谷歌的TPU通過脈動陣列(systolic array)這一核心架構來提升算力,,2018年發(fā)布的TPU3.0版本采用8位低精度計算節(jié)省晶體管,,速度能加快最高100PFlops(每秒1000萬億次浮點計算)。
再看國內(nèi),,華為在2018年10月發(fā)布了兩顆AI芯片——昇騰910(max)和昇騰310(mini),。昇騰910主要用于云端計算,其半精度算力達到了256 TFLOPS,,預計將于2019年第二季度量產(chǎn),;昇騰310用于終端低功耗場景,擁有8TFLOPS半精度計算力,,目前已經(jīng)量產(chǎn),,但是并不對外銷售。
國內(nèi)的明星初創(chuàng)企業(yè)也紛紛獲得投資或者收購,。2018年中,,寒武紀推出面向數(shù)據(jù)中心市場云端智能芯片 MLU100,浪潮,、聯(lián)想,、曙光的AI服務器產(chǎn)品將搭載MLU100 芯片。但是在手機端,,華為麒麟芯片將用達芬奇架構代替寒武紀架構,。另一家公司地平線選擇自動駕駛的場景,奧迪是其合作伙伴。產(chǎn)品包括基于旭日2.0處理器架構的XForce邊緣AI計算平臺,、基于征程(Journey)2.0 架構的地平線 Matrix 自動駕駛計算平臺,、核心板旭日X1600、智能攝像機解決方案等,。
深鑒科技則在2018年被賽靈思收購,,價格約3億美元。深鑒科技一方面提供基于神經(jīng)網(wǎng)絡深度壓縮技術和DPU平臺,,為深度學習提供端到端的解決方案,。另一方面通過神經(jīng)網(wǎng)絡與FPGA的協(xié)同優(yōu)化,提供高性價比的嵌入式端與云端的推理平臺,,已應用于安防、數(shù)據(jù)中心,、汽車等領域,。
挑戰(zhàn)與趨勢
整體而言,英偉達的實力在第一梯隊,,但是競爭者眾多,,除了上述企業(yè)外,AMD,、高通,、聯(lián)發(fā)科、三星等公司均在AI芯片上有所布局,,并且戰(zhàn)況愈發(fā)激烈,。
不過,目前在AI芯片領域沒有哪一家占據(jù)絕對優(yōu)勢,,集邦咨詢向21世紀經(jīng)濟報道記者表示:“初創(chuàng)企業(yè)方面,,就我們的觀察,畢竟仍在草創(chuàng)階段,,客戶的采用意愿,,以及導入后,終端市場的接受狀況,,將是未來需要觀察的地方,。總結來看,,還是國際芯片大廠的布局速度較快,。”
從國內(nèi)和國外的角度看,,一位AI業(yè)內(nèi)人士告訴21世紀經(jīng)濟報道記者:“國內(nèi)外主要是技術結構上的差距,,底層技術科學上和國外的差距顯著,但是應用層面上差距不大,甚至有創(chuàng)新的應用點,。不少AI芯片公司通過定制化服務小規(guī)??蛻簦槍端場景進行開發(fā),,比如專門處理語音,、圖像?!?/p>
同時,,AI芯片也面臨不少挑戰(zhàn),杜克大學教授陳怡然就曾提到,,AI芯片在設計方面有四大挑戰(zhàn),。
其一是大容量存儲和高密度計算,當神經(jīng)深度學習網(wǎng)絡的復雜度越來越高的時候,,參數(shù)也會越來越多,,怎么處理是一大難題;第二個挑戰(zhàn)是要面臨特定領域的架構設計,,因為場景越來越豐富,,這些場景的計算需求是完全不一樣的。怎么樣通過對于不同的場景的理解,,設置不同的硬件架構變得非常重要,。
第三個挑戰(zhàn)是芯片設計要求高,周期長,,成本昂貴,。從芯片規(guī)格設計、芯片結構設計,、RTL設計,、物理版圖設計、晶圓制造,、晶圓測試封裝,,需要2到3年時間,正常的時間里軟件會有一個非??焖俚陌l(fā)展,。但是算法在這個期間內(nèi)將會快速更新,芯片如何支持這些更新也是難點,。
第四個挑戰(zhàn)是架構及工藝,。隨著工藝不斷的提升,從90納米到10納米,,邏輯門生產(chǎn)的成本到最后變得飽和,。也許在速度上,、功耗上會有提升,但單個邏輯生產(chǎn)的成本不會再有新的下降,。這種情況下如果仍然用幾千甚至上萬個晶體管去做一個比較簡單的深度學習的邏輯,,最后在成本上是得不償失的。
在芯片的產(chǎn)業(yè)鏈中,,生產(chǎn)環(huán)節(jié)主要依靠臺積電,、格芯等芯片代工廠商。但是國內(nèi)在設計領域逐步前進,,并且AI專用芯片相對于CPU,、GPU來說難度沒有那么大,因此不少創(chuàng)業(yè)公司也為自己精通的行業(yè)定制AI芯片,。
2018年以來,,不少以算法為主的語音、視覺,、自動駕駛等公司也開始研發(fā)AI芯片,,將算法和芯片進行更好的結合,來針對多樣化的場景,,未來軟硬結合將會是趨勢。