《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 斷供風(fēng)波后,,國產(chǎn)GPU補(bǔ)位難在哪?

斷供風(fēng)波后,,國產(chǎn)GPU補(bǔ)位難在哪,?

2022-10-26
來源:自主可控新鮮事
關(guān)鍵詞: GPU 英偉達(dá) AMD

英偉達(dá)AMD的高端通用GPU禁運(yùn)事件再次揪緊了中國半導(dǎo)體行業(yè)的神經(jīng),,國內(nèi)超算、東數(shù)西算,、云計算,、自動駕駛等行業(yè)已明顯感到“寒意”。但正如硬幣的兩面,,這一禁令無疑也為國產(chǎn)GPU廠商創(chuàng)造了新的補(bǔ)位機(jī)會,。

但從GPU市場來看,仍上演著巨大的“落差”情節(jié),。在集成GPU市場,,英特爾、英偉達(dá),、AMD三分天下,;獨(dú)立GPU領(lǐng)域,基本是英偉達(dá)和AMD的天下,,前者市場份額甚至超出2/3,;在GPGPU領(lǐng)域,英偉達(dá)更是一騎絕塵,。當(dāng)英特爾,、英偉達(dá)、AMD通過并購或整合,在GPU+CPU+DPU時代全面布局并掌控話語權(quán)的當(dāng)下,,國內(nèi)GPU廠商仍需奮起直追,。 

要在GPU領(lǐng)域形成突圍之勢,國產(chǎn)GPU的性能,、生態(tài),、應(yīng)用等均是一環(huán)接一環(huán)的考驗(yàn)。要在性能層面率先通關(guān),,IP的力量不容小覷,。在生態(tài)層面,是借助CUDA占位還是自建生態(tài),,仍是個兩難的選擇,。

風(fēng)起云涌

GPU的重要性從其市場規(guī)模可見一斑,。

在多重因素交織影響下,,GPU已然完成華麗“蛻變”,從最早用于2D/3D圖形的計算和處理,,到近年來憑借并行處理和通用計算的優(yōu)勢成為數(shù)據(jù)中心,、5G、AIoT,、自動駕駛領(lǐng)域的關(guān)鍵算力的基礎(chǔ)設(shè)施,,GPU市場亦迎來了高速大發(fā)展。

據(jù)Gartner預(yù)測,,截至2023年,,AIoT、5G應(yīng)用等將快速拉升全球商用GPU市場,,規(guī)模有望達(dá)到250億美元,,包括PC在內(nèi)的民用GPU市場也將提升至150億美元。

在這一風(fēng)雷激蕩的市場,,不僅成就了英偉達(dá),、AMD等的高歌猛進(jìn),也為無數(shù)的新進(jìn)入者提供了逐鹿的舞臺,。受市場需求以及政策,、資本的推動,,GPU在國內(nèi)受到瘋狂追捧,,國內(nèi)GPU初創(chuàng)企業(yè)如雨后春筍冒出,融資紀(jì)錄不斷刷出新高,,多方出擊,,呈現(xiàn)“星星之火,可以燎原”之勢。

要指出的是,,GPU隨著技術(shù)的進(jìn)階以及應(yīng)用的拓展,,體系也日益龐雜,按接入類型可分為集成GPU和獨(dú)立GPU,,以應(yīng)用來區(qū)分則有PC GPU,、移動GPU和服務(wù)器GPU三類;按功能劃分,,可分為側(cè)重圖形圖像的渲染GPU和側(cè)重通用計算的GPGPU,。

國內(nèi)初創(chuàng)GPU公司結(jié)合自己的優(yōu)勢和階段性定位,分別采取了不同的切入路線,,有的以GPGPU為重,,有的直指渲染GPU,也有先期立足GPGPU而后切入渲染GPU或并行推進(jìn)的,,涉及壁仞,、沐曦、登臨,、天數(shù)智芯,、摩爾線程、勵算,、深流微,、瀚博、芯瞳,、格蘭菲等等,。

作為此次禁運(yùn)事件的主角,英偉達(dá)的A100,、H100均是數(shù)據(jù)中心加速卡,,A100擁有540億晶體管,采用臺積電7nm工藝制程,,支持FP16,、FP32和FP64浮點(diǎn)運(yùn)算。而H100作為英偉達(dá)最新一代數(shù)據(jù)中心GPU,,集成了800億晶體管,,最高1.8萬個CUDA核心,采用臺積電定制的4nm工藝,,已全面投產(chǎn),,合作伙伴50多款基于H100的服務(wù)器將在年底前上市。

雖然國內(nèi)還有一年的緩沖期可以繼續(xù)備貨英偉達(dá)的產(chǎn)品(如果可以通過報備和審核),,但一年以后很可能還將面臨無法拿到最先進(jìn)產(chǎn)品的可能,,不同應(yīng)用端對此的感受或“冷暖自知”。

應(yīng)用掣肘

“相對于超算、互聯(lián)網(wǎng)等應(yīng)用場景來說,,正在飛速發(fā)展的自動駕駛汽車領(lǐng)域才是這次訓(xùn)練卡禁售風(fēng)波的最大受害者,。”集微咨詢直接斷言,。

因超算中的核心算力還是以CPU為主,,且可以用協(xié)處理器來配合核心CPU來進(jìn)行工作,GPGPU的影響在短期內(nèi)不會對超算應(yīng)用產(chǎn)生太大的影響,。

此外,,雖然互聯(lián)網(wǎng)應(yīng)用的智能推薦、圖像識別等算法也需要大量訓(xùn)練,,但慶幸的是我國互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)經(jīng)歷了蓬勃發(fā)展時期,,目前處于穩(wěn)定期,算法迭代和應(yīng)用落地相對比較成熟,,目前互聯(lián)網(wǎng)巨頭手中訓(xùn)練資源相對比較平衡,,而且各家也都針對自己的業(yè)務(wù)需求特點(diǎn)開始自研訓(xùn)練芯片,英偉達(dá)訓(xùn)練卡的禁售看似對互聯(lián)網(wǎng)產(chǎn)業(yè)影響大,,但實(shí)際情況比想象得要好一些,。

相較之下,自動駕駛端體會的“寒意”或更為明顯,。

雖然英偉達(dá)沒有直接禁售自動駕駛芯片,,但自動駕駛算法的訓(xùn)練還是無法繞開云端GPGPU的。國內(nèi)智能汽車或自動駕駛汽車的產(chǎn)品迭代快速,,新車發(fā)布周期在縮短,,硬件堆疊也在不斷增加,攝像頭視覺傳感器,、雷達(dá)等硬件模塊的單車配置在快速上升,,高級別自動駕駛等級的迭代與滲透也在快速發(fā)展。從而導(dǎo)致自動駕駛算法迭代也要跟上步伐,,算法的迭代必然以訓(xùn)練為前提,,訓(xùn)練量的增加必定會反饋在對訓(xùn)練卡性能和需求的提升。

更值得注意的是,,自動駕駛信息涉及到的數(shù)據(jù),,大多涉及保密級較高的內(nèi)容,這部分內(nèi)容大概率是無法依靠租賃云服務(wù)商的訓(xùn)練服務(wù)器來解決的,。

IP難關(guān)

國內(nèi)GPU初創(chuàng)企業(yè)而言,,長期、持續(xù)的利潤支撐才是GPU跨代發(fā)展的強(qiáng)勁驅(qū)動力,,在英偉達(dá),、ADM等巨頭構(gòu)筑的高壁壘面前,瞄準(zhǔn)目標(biāo)應(yīng)用大量的驗(yàn)證及出貨是國產(chǎn)GPU必然要越過的難關(guān),。

而GPU作為高性能高復(fù)雜度的大芯片,,想在短期內(nèi)快速推出相關(guān)產(chǎn)品,必然依賴外部IP,。而且,,近段時間以來,國內(nèi)GPU廠商以接二連三的點(diǎn)亮和商用來探索發(fā)展之道,。但除卻生態(tài),、落地挑戰(zhàn)之外,據(jù)一位業(yè)內(nèi)人士分析,,國內(nèi)GPU核心基礎(chǔ)技術(shù)的投入還是不太夠,,雖然目前研發(fā)GPU的公司很多,但絕大部分是license IP模式,,而且同質(zhì)化較為明顯,。

提及GPU IP,主要有數(shù)字和模擬兩大IP,,每一大IP體系有不同的分類,。從模擬IP來看,分為三部分,,一是PCIe,;二是Memory,涉及DDR5/4,、LPDDR5/4等,;三是重要的顯示IP,即Displayport和 HDMI,。從數(shù)字IP來看,,涉及最核心的GPU IP,還有基于RISC-V或Arm的微控制器IP,;以及Video編解碼如H.264等IP,。要注意的是,在GPGPU層面,,核心IP大都為廠商自研,,也有廠商采用Imagination等訓(xùn)練或推理的IP,且GPGPU不需顯示IP,。

從理論上來說,,自研IP越多,GPU的差異化更明顯,,但相對而言資金,、人員,、時間上的成本投入也更高。一家從事GPGPU研發(fā)的企業(yè)代表告知,,GPU IP自研需要36-48個月以及200個工程師,,而采用外購IP的方式,可以減少12-18個月開發(fā)周期,。

微信圖片_20221026094232.jpg

不得不說,,因設(shè)計GPU IP的問題非常復(fù)雜,許多最優(yōu)的解決方案已經(jīng)獲得專利保護(hù),,使得GPU 核心IP市場成為少數(shù)玩家的陣地,。

在PC和服務(wù)器GPU領(lǐng)域,核心的GPU IP廠商主要是Imagination,、芯原,、格蘭菲;在移動GPU領(lǐng)域,,主要有Arm Mali,、Imagination PowerVR系列,芯原在前幾年收購美國嵌入式GPU設(shè)計商圖芯之后亦有不少授權(quán)用戶,,以及高通的Adreno,。高通Adreno從AMD買入,且不對外銷售,。作為GPU的老牌巨頭,,英偉達(dá)、AMD均有自己的強(qiáng)大GPU IP,,英特爾也購買了AMD的GPU IP要在獨(dú)立GPU市場卷土重來,。

整體而言,國內(nèi)GPGPU企業(yè)與國際大廠技術(shù)差距約3年,,渲染GPU與國際大廠差距約10年左右,。要想彌補(bǔ)這一差距,不止要在生態(tài)層面發(fā)力,,提升國內(nèi)核心IP能力顯然是必然要做的功課,。

對此業(yè)內(nèi)人士也指出,從GPU IP 供應(yīng)商來看,,國內(nèi)本土研發(fā)存在投入不足,、競爭力偏弱、市場窄,、技術(shù)研發(fā)的后續(xù)力不明朗等問題,。國內(nèi)想發(fā)展GPU,是要想辦法讓GPU技術(shù)鏈條各個環(huán)節(jié)上,,真金白銀投入技術(shù)研發(fā)的公司生存并慢慢滾動發(fā)展,。

值得關(guān)注的是,,盡管火熱的Chiplet開啟了 IP的新型復(fù)用模式,也為IP 廠商的經(jīng)營模式帶來全新變革,,國內(nèi)GPU IP廠商芯原等也在加速實(shí)現(xiàn)以Chiplet形式的IP芯片化,。但我們認(rèn)為,這除對商業(yè)模式帶來挑戰(zhàn)之外,,還要解決設(shè)計,、die到die接口挑戰(zhàn),、封裝和制造等層面的難關(guān),,難以實(shí)現(xiàn)彎道超車。

生態(tài)之憂

盡管A100和H100的禁售成為國內(nèi)GPGPU發(fā)展的新催化劑,,可以說造就了難得的機(jī)會窗口,,但要成功“補(bǔ)位”,除了性能差距之外,,生態(tài)過關(guān)顯得尤為迫切,。 

“很多客戶用英偉達(dá)的訓(xùn)練加速卡已用得非常順手了,一方面是其性能優(yōu)異,,通用性強(qiáng),,另一方面則是生態(tài),CUDA的運(yùn)算平臺適合各類模型,,客戶基于此可高效訓(xùn)練或改進(jìn)自己的算法,。”集微咨詢表示,,“國內(nèi)在芯片設(shè)計上的能力與頭部品牌還存在不小的差距,,再考慮到軟件和生態(tài)層面,差距就又會進(jìn)一步拉大,?!?/p>

正如一家GPGPU廠商代表所言,GPGPU的生態(tài)非常復(fù)雜,,要求一路打通到應(yīng)用層,,提供面向所有應(yīng)用的全面支持,甚至要自主開發(fā)以支持一個新的應(yīng)用領(lǐng)域,。

盡管禁運(yùn)有一年的緩沖期,,但一年以后呢?很可能還將面臨無法拿到最先進(jìn)產(chǎn)品的可能,。雖然英偉達(dá)也放話說可提供一些相對低端的性能不及A100的產(chǎn)品讓客戶通過堆疊等來實(shí)現(xiàn)相應(yīng)的算力,,但這仍將大幅影響訓(xùn)練的成本和效率。

因而,,雖然國內(nèi)在GPGPU領(lǐng)域?qū)崿F(xiàn)了一些國產(chǎn)替代,,但在性能上要達(dá)到A100水平,,短期內(nèi)還不現(xiàn)實(shí)。此外,,更大的阻力來自生態(tài),,雖然眾多國產(chǎn)GPGPU公司芯片都支持兼容CUDA,但兼容度和兼容水平無法量化,,各家的產(chǎn)品水平標(biāo)準(zhǔn)也不統(tǒng)一,,這必定會增加算法工程師的使用和學(xué)習(xí)成本。

兼容是捷徑,,但不是終點(diǎn),,從長遠(yuǎn)來說一定要建立自己的生態(tài)。國內(nèi)GPGPU廠商還應(yīng)風(fēng)物長宜放眼量,。

無疑,,美對我國芯片行業(yè)的全面圍剿將形成一道新的半導(dǎo)體“鐵幕”,也將不斷加速國產(chǎn)芯片自主化的進(jìn)程,,但要從弱到強(qiáng),,從低端到高端,顯然是一場以數(shù)年為計的長征之路,。



更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

二維碼.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]