八月初秋,,天氣一如既往的火熱,。南國深圳,華為坂田基地更是一番熱火朝天的景象,。三天前,,華為輪值主席徐直軍在這里推出華為高端 AI 芯片昇騰 910 ,開啟華為在先進(jìn)技術(shù)領(lǐng)域挑戰(zhàn)硅谷的最新嘗試,。
一直以來,,華為自研芯片都是人們關(guān)注的焦點(diǎn)。,,正是因?yàn)橛辛俗灾餮邪l(fā)的海思麒麟系列手機(jī)芯片,,華為才能快速搶占手機(jī)市場,一路“攻城略地”,,躋身中國智能手機(jī)行業(yè)第一寶座,。當(dāng)然,作為目前全球體量最大的通信設(shè)備商,、全球坐三望二的智能手機(jī)廠商,,華為自研芯片不止于此。巴龍,、鯤鵬,、凌霄還有這次發(fā)布會重點(diǎn)推出的昇騰,,華為自研芯片已經(jīng)覆蓋手機(jī)、服務(wù)器,、路由器,,電視、AI 等多個領(lǐng)域,。自研芯片已然成為華為的核心競爭力,,一個其他競爭對手所不具備的獨(dú)特優(yōu)勢。
昇騰系列芯片主打人工智能領(lǐng)域,,用于處理構(gòu)建人工智能算法的海量數(shù)據(jù),。華為的這次公布,讓不少人沸騰了,,網(wǎng)上的言論越傳越神,,被稱作“攻破了又一個讓國人蒙羞的城池”,“實(shí)現(xiàn)了彎道超車”,,甚至出現(xiàn)了華為將在云端 AI 芯片領(lǐng)域干掉英偉達(dá),、谷歌的論斷。這些評價是否正確,?華為昇騰芯片真的有那么大影響力嗎,?
江湖霸主英偉達(dá)
AI 芯片是什么,半導(dǎo)體業(yè)界并沒有嚴(yán)格的界定,。一般來說,,AI 芯片被稱為 AI 加速器或計算卡,也就是 AI 應(yīng)用中的大量計算任務(wù)的模塊,,目前主要有 GPU,、FPGA 和 ASIC 三種技術(shù)路線。其中 GPU 在 AI 訓(xùn)練方面已經(jīng)發(fā)展到較為成熟的階段,,谷歌,、臉書、微軟,、 推特和百度等公司都在使用 GPU 分析圖片,、視頻和音頻文件,以實(shí)現(xiàn)深度學(xué)習(xí)等功能,。
看到這里,,很多人心里納悶, GPU 不是顯示芯片么,,怎么用來搞 AI ,。其實(shí)這個道理很簡單,GPU 負(fù)責(zé)處理圖形數(shù)據(jù)處理,,擁有大體量的邏輯運(yùn)算單元用于數(shù)據(jù)處理,,對于密集型數(shù)據(jù)可以進(jìn)行并行處理,。人工智能的神經(jīng)網(wǎng)絡(luò)架構(gòu)有個特征,剛算出來的數(shù)往往再投入結(jié)算,,一輪輪迭代以凸顯關(guān)鍵細(xì)節(jié),這種計算不需要太多數(shù)據(jù)緩存單元,,不需要復(fù)雜的邏輯控制,,只要計算單元夠多就行。相比注重邏輯判斷的 CPU ,,GPU 芯片顯然更加適用于人工智能深度計算,。
在 GPU 芯片領(lǐng)域,英偉達(dá)是當(dāng)之無愧的龍頭老大,。在人工智能興起之初,,由于 GPU 芯片在深度學(xué)習(xí)領(lǐng)域的優(yōu)勢,英偉達(dá)與斯坦福大學(xué)的吳恩達(dá)合作開發(fā)了一種使用大規(guī)模GPU計算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法,。與此同時,,英偉達(dá)與谷歌的人工智能團(tuán)隊合作,建造了當(dāng)時最大的人工神經(jīng)網(wǎng)絡(luò),。之后,,各深度學(xué)習(xí)團(tuán)隊開始廣泛大批量使用英偉達(dá)的顯卡。
如今,,全球估計有 3000 家 AI 創(chuàng)業(yè)公司,,其中一半以上都是在英偉達(dá)的平臺上構(gòu)建的??萍季揞^也不例外,,谷歌、微軟,、臉書,、亞馬遜都在購買英偉達(dá)芯片,用于構(gòu)建自己的數(shù)據(jù)中心,。數(shù)據(jù)研究公司 Gartner 顯示,,英偉達(dá)擁有 AI 芯片市場約四分之三的份額。上一財年,,英偉達(dá)從用于數(shù)據(jù)中心的 AI 芯片銷售中獲得將近 30 億美元收入,。在人工智能芯片領(lǐng)域,英偉達(dá)已經(jīng)是當(dāng)之無愧的江湖霸主,。
挑戰(zhàn)者昇騰 910
AI 芯片這個江湖兇險異常,,英偉達(dá)目前是霸主,可誰也不敢保證未來會發(fā)生什么,。深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分,,所謂訓(xùn)練,,就是給不斷計算大數(shù)據(jù),讓它慢慢學(xué)會識別和區(qū)分對象,;所謂推理,,就是讓訓(xùn)練好的機(jī)器干活。GPU 芯片在算法訓(xùn)練上非常高效,,可在推斷中對于單項輸入進(jìn)行處理的時候,,并行計算的優(yōu)勢不能完全發(fā)揮出來。
因?yàn)?GPU 芯片 在人工智能深度學(xué)習(xí)上的天生劣勢,,一些企業(yè)將目光投向?qū)S锰幚硇酒?,采?FPGA/ASIC 技術(shù)路線設(shè)計專業(yè) AI 芯片。FPGA 的前期啟動成本低,,后期可以進(jìn)行再編程,,可以采用 OpenCL等更高效的編程語言,降低硬件編程的難度,,還可以整合系統(tǒng)模塊,,提高應(yīng)用的靈活性,與GPU相比,,F(xiàn)PGA 具備更強(qiáng)的平均計算能力和更低的功耗,。
ASIC 運(yùn)行速度比 FPGA 更快,是一種為專用目的設(shè)計的,,面向特定用戶需求的定制芯片,。在大規(guī)模量產(chǎn)的情況下具備性能更強(qiáng)、體積更小,、功耗更低,、成本更低、可靠性更髙等優(yōu)點(diǎn),。華為昇騰 910 就是 ASIC 芯片,,它采用 7nm+ EUV 制程工藝,達(dá)芬奇架構(gòu),,計算力可達(dá)到 256TFOPS,,比英偉達(dá)最新的 V100 還要高出一倍。值得注意的是,,昇騰 910 達(dá)到規(guī)格算力所需功耗僅 310W,,明顯低于設(shè)計規(guī)格的 350W。
江山代有人才出,,各領(lǐng)風(fēng)騷數(shù)百年,,而在日新月異的科技領(lǐng)域,數(shù)百年的跨度會縮減為三五年。強(qiáng)如英偉達(dá),,在稱雄 AI 芯片領(lǐng)域六七年之后,,也開始顯露頹勢。人工智能領(lǐng)域有三要素:數(shù)據(jù),、算法和算力,。數(shù)據(jù)為芯片處理的對象,算法即計算的邊界,,而算力則直接決定了計算效率,。對于華為來說,芯片是它們的硬實(shí)力,,算力即它在 AI 領(lǐng)域的競爭力。有了最強(qiáng)算力加持,,昇騰 910 這個氣勢洶洶的挑戰(zhàn)者,,擁有足夠的實(shí)力與底氣挑戰(zhàn)江湖霸主英偉達(dá)。
達(dá)芬奇 AI 架構(gòu)
昇騰 910 的誕生,,使得華為在 AI 芯片領(lǐng)域地位大幅上升,,不過這遠(yuǎn)遠(yuǎn)不夠。英偉達(dá)技術(shù)雄厚,,有針對各種場景的優(yōu)化,,華為僅靠一款芯片,打敗英偉達(dá)無從說起,。在深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方面,,英偉達(dá)現(xiàn)在擁有一個由軟件、大學(xué),、初創(chuàng)企業(yè)和合作伙伴組成的強(qiáng)大和自我維持的生態(tài)系統(tǒng),,這些伙伴讓英偉達(dá)很難被擊敗。
同時,,AI 芯片不是個特別大的行業(yè),,AI 芯片在整個芯片領(lǐng)域占比不到 1%。華為進(jìn)軍人工智能領(lǐng)域,,追求的是全棧,。所謂全棧,是指在芯片設(shè)計,、訓(xùn)練推理計算框架 MindSpore ,、全流程服務(wù)(ModelArts)一體到位。在全棧理念基礎(chǔ)上 華為宣布“達(dá)芬奇”架構(gòu),,提出 MindSpore 計算框架,,一舉橫跨公有云、私有云端、邊緣等,,實(shí)現(xiàn)全棧全場景 AI 解決,。
達(dá)芬奇是歐洲文藝復(fù)興時期最完美的代表,他是科學(xué)家,、發(fā)明家,、建筑
工程師,也是畫家,。華為使用達(dá)芬奇這個名字,,透露出其 AI 戰(zhàn)略布局的光芒與野心。數(shù)據(jù)預(yù)測,,到 2025 年全球智能終端數(shù)量將會達(dá)到 400 億臺,,智能助理的普及率將達(dá)到 90%,企業(yè)數(shù)據(jù)的使用率將達(dá)到 86%,。
人工智能將會改變所有行業(yè),,華為的理想是將 AI 技術(shù)融于產(chǎn)品,在達(dá)芬奇 AI 架構(gòu)基礎(chǔ)上構(gòu)建一個萬物智能的世界,。昇騰 910 AI 芯片是達(dá)芬奇架構(gòu)的排頭兵,,在不久的將來,華為勢必會研發(fā)更多的 ASIC 專用 AI 芯片,,挑戰(zhàn)英偉達(dá)的 AI 生態(tài)系統(tǒng),!