《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 斷供風(fēng)波后,,國產(chǎn)GPU補位難在哪,?

斷供風(fēng)波后,,國產(chǎn)GPU補位難在哪,?

2022-10-26
來源:自主可控新鮮事
關(guān)鍵詞: GPU 英偉達 AMD

英偉達AMD的高端通用GPU禁運事件再次揪緊了中國半導(dǎo)體行業(yè)的神經(jīng),國內(nèi)超算,、東數(shù)西算,、云計算、自動駕駛等行業(yè)已明顯感到“寒意”,。但正如硬幣的兩面,,這一禁令無疑也為國產(chǎn)GPU廠商創(chuàng)造了新的補位機會。

但從GPU市場來看,,仍上演著巨大的“落差”情節(jié),。在集成GPU市場,英特爾,、英偉達,、AMD三分天下,;獨立GPU領(lǐng)域,,基本是英偉達和AMD的天下,前者市場份額甚至超出2/3,;在GPGPU領(lǐng)域,,英偉達更是一騎絕塵。當英特爾,、英偉達,、AMD通過并購或整合,,在GPU+CPU+DPU時代全面布局并掌控話語權(quán)的當下,國內(nèi)GPU廠商仍需奮起直追,。 

要在GPU領(lǐng)域形成突圍之勢,,國產(chǎn)GPU的性能、生態(tài),、應(yīng)用等均是一環(huán)接一環(huán)的考驗,。要在性能層面率先通關(guān),IP的力量不容小覷,。在生態(tài)層面,,是借助CUDA占位還是自建生態(tài),仍是個兩難的選擇,。

風(fēng)起云涌

GPU的重要性從其市場規(guī)??梢娨话摺?/p>

在多重因素交織影響下,,GPU已然完成華麗“蛻變”,,從最早用于2D/3D圖形的計算和處理,到近年來憑借并行處理和通用計算的優(yōu)勢成為數(shù)據(jù)中心,、5G,、AIoT、自動駕駛領(lǐng)域的關(guān)鍵算力的基礎(chǔ)設(shè)施,,GPU市場亦迎來了高速大發(fā)展,。

據(jù)Gartner預(yù)測,截至2023年,,AIoT,、5G應(yīng)用等將快速拉升全球商用GPU市場,規(guī)模有望達到250億美元,,包括PC在內(nèi)的民用GPU市場也將提升至150億美元,。

在這一風(fēng)雷激蕩的市場,不僅成就了英偉達,、AMD等的高歌猛進,,也為無數(shù)的新進入者提供了逐鹿的舞臺。受市場需求以及政策,、資本的推動,,GPU在國內(nèi)受到瘋狂追捧,國內(nèi)GPU初創(chuàng)企業(yè)如雨后春筍冒出,,融資紀錄不斷刷出新高,,多方出擊,呈現(xiàn)“星星之火,可以燎原”之勢,。

要指出的是,,GPU隨著技術(shù)的進階以及應(yīng)用的拓展,體系也日益龐雜,,按接入類型可分為集成GPU和獨立GPU,,以應(yīng)用來區(qū)分則有PC GPU、移動GPU和服務(wù)器GPU三類,;按功能劃分,,可分為側(cè)重圖形圖像的渲染GPU和側(cè)重通用計算的GPGPU。

國內(nèi)初創(chuàng)GPU公司結(jié)合自己的優(yōu)勢和階段性定位,,分別采取了不同的切入路線,,有的以GPGPU為重,有的直指渲染GPU,,也有先期立足GPGPU而后切入渲染GPU或并行推進的,,涉及壁仞、沐曦,、登臨,、天數(shù)智芯、摩爾線程,、勵算,、深流微、瀚博,、芯瞳,、格蘭菲等等。

作為此次禁運事件的主角,,英偉達的A100,、H100均是數(shù)據(jù)中心加速卡,A100擁有540億晶體管,,采用臺積電7nm工藝制程,,支持FP16、FP32和FP64浮點運算,。而H100作為英偉達最新一代數(shù)據(jù)中心GPU,,集成了800億晶體管,最高1.8萬個CUDA核心,,采用臺積電定制的4nm工藝,,已全面投產(chǎn),合作伙伴50多款基于H100的服務(wù)器將在年底前上市,。

雖然國內(nèi)還有一年的緩沖期可以繼續(xù)備貨英偉達的產(chǎn)品(如果可以通過報備和審核),,但一年以后很可能還將面臨無法拿到最先進產(chǎn)品的可能,,不同應(yīng)用端對此的感受或“冷暖自知”,。

應(yīng)用掣肘

“相對于超算,、互聯(lián)網(wǎng)等應(yīng)用場景來說,正在飛速發(fā)展的自動駕駛汽車領(lǐng)域才是這次訓(xùn)練卡禁售風(fēng)波的最大受害者,?!奔⒆稍冎苯訑嘌浴?/p>

因超算中的核心算力還是以CPU為主,,且可以用協(xié)處理器來配合核心CPU來進行工作,,GPGPU的影響在短期內(nèi)不會對超算應(yīng)用產(chǎn)生太大的影響。

此外,,雖然互聯(lián)網(wǎng)應(yīng)用的智能推薦,、圖像識別等算法也需要大量訓(xùn)練,但慶幸的是我國互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)經(jīng)歷了蓬勃發(fā)展時期,,目前處于穩(wěn)定期,,算法迭代和應(yīng)用落地相對比較成熟,目前互聯(lián)網(wǎng)巨頭手中訓(xùn)練資源相對比較平衡,,而且各家也都針對自己的業(yè)務(wù)需求特點開始自研訓(xùn)練芯片,,英偉達訓(xùn)練卡的禁售看似對互聯(lián)網(wǎng)產(chǎn)業(yè)影響大,但實際情況比想象得要好一些,。

相較之下,,自動駕駛端體會的“寒意”或更為明顯。

雖然英偉達沒有直接禁售自動駕駛芯片,,但自動駕駛算法的訓(xùn)練還是無法繞開云端GPGPU的,。國內(nèi)智能汽車或自動駕駛汽車的產(chǎn)品迭代快速,新車發(fā)布周期在縮短,,硬件堆疊也在不斷增加,,攝像頭視覺傳感器、雷達等硬件模塊的單車配置在快速上升,,高級別自動駕駛等級的迭代與滲透也在快速發(fā)展,。從而導(dǎo)致自動駕駛算法迭代也要跟上步伐,算法的迭代必然以訓(xùn)練為前提,,訓(xùn)練量的增加必定會反饋在對訓(xùn)練卡性能和需求的提升,。

更值得注意的是,自動駕駛信息涉及到的數(shù)據(jù),,大多涉及保密級較高的內(nèi)容,,這部分內(nèi)容大概率是無法依靠租賃云服務(wù)商的訓(xùn)練服務(wù)器來解決的。

IP難關(guān)

國內(nèi)GPU初創(chuàng)企業(yè)而言,,長期,、持續(xù)的利潤支撐才是GPU跨代發(fā)展的強勁驅(qū)動力,在英偉達、ADM等巨頭構(gòu)筑的高壁壘面前,,瞄準目標應(yīng)用大量的驗證及出貨是國產(chǎn)GPU必然要越過的難關(guān),。

而GPU作為高性能高復(fù)雜度的大芯片,想在短期內(nèi)快速推出相關(guān)產(chǎn)品,,必然依賴外部IP,。而且,近段時間以來,,國內(nèi)GPU廠商以接二連三的點亮和商用來探索發(fā)展之道,。但除卻生態(tài)、落地挑戰(zhàn)之外,,據(jù)一位業(yè)內(nèi)人士分析,,國內(nèi)GPU核心基礎(chǔ)技術(shù)的投入還是不太夠,雖然目前研發(fā)GPU的公司很多,,但絕大部分是license IP模式,,而且同質(zhì)化較為明顯。

提及GPU IP,,主要有數(shù)字和模擬兩大IP,,每一大IP體系有不同的分類。從模擬IP來看,,分為三部分,,一是PCIe;二是Memory,,涉及DDR5/4,、LPDDR5/4等;三是重要的顯示IP,,即Displayport和 HDMI,。從數(shù)字IP來看,涉及最核心的GPU IP,,還有基于RISC-V或Arm的微控制器IP,;以及Video編解碼如H.264等IP。要注意的是,,在GPGPU層面,,核心IP大都為廠商自研,也有廠商采用Imagination等訓(xùn)練或推理的IP,,且GPGPU不需顯示IP,。

從理論上來說,自研IP越多,,GPU的差異化更明顯,,但相對而言資金,、人員、時間上的成本投入也更高,。一家從事GPGPU研發(fā)的企業(yè)代表告知,,GPU IP自研需要36-48個月以及200個工程師,而采用外購IP的方式,,可以減少12-18個月開發(fā)周期。

微信圖片_20221026094232.jpg

不得不說,,因設(shè)計GPU IP的問題非常復(fù)雜,,許多最優(yōu)的解決方案已經(jīng)獲得專利保護,使得GPU 核心IP市場成為少數(shù)玩家的陣地,。

在PC和服務(wù)器GPU領(lǐng)域,,核心的GPU IP廠商主要是Imagination、芯原,、格蘭菲,;在移動GPU領(lǐng)域,主要有Arm Mali,、Imagination PowerVR系列,,芯原在前幾年收購美國嵌入式GPU設(shè)計商圖芯之后亦有不少授權(quán)用戶,以及高通的Adreno,。高通Adreno從AMD買入,,且不對外銷售。作為GPU的老牌巨頭,,英偉達,、AMD均有自己的強大GPU IP,英特爾也購買了AMD的GPU IP要在獨立GPU市場卷土重來,。

整體而言,,國內(nèi)GPGPU企業(yè)與國際大廠技術(shù)差距約3年,渲染GPU與國際大廠差距約10年左右,。要想彌補這一差距,,不止要在生態(tài)層面發(fā)力,提升國內(nèi)核心IP能力顯然是必然要做的功課,。

對此業(yè)內(nèi)人士也指出,,從GPU IP 供應(yīng)商來看,國內(nèi)本土研發(fā)存在投入不足,、競爭力偏弱,、市場窄、技術(shù)研發(fā)的后續(xù)力不明朗等問題,。國內(nèi)想發(fā)展GPU,,是要想辦法讓GPU技術(shù)鏈條各個環(huán)節(jié)上,,真金白銀投入技術(shù)研發(fā)的公司生存并慢慢滾動發(fā)展。

值得關(guān)注的是,,盡管火熱的Chiplet開啟了 IP的新型復(fù)用模式,,也為IP 廠商的經(jīng)營模式帶來全新變革,國內(nèi)GPU IP廠商芯原等也在加速實現(xiàn)以Chiplet形式的IP芯片化,。但我們認為,,這除對商業(yè)模式帶來挑戰(zhàn)之外,還要解決設(shè)計,、die到die接口挑戰(zhàn),、封裝和制造等層面的難關(guān),難以實現(xiàn)彎道超車,。

生態(tài)之憂

盡管A100和H100的禁售成為國內(nèi)GPGPU發(fā)展的新催化劑,,可以說造就了難得的機會窗口,但要成功“補位”,,除了性能差距之外,,生態(tài)過關(guān)顯得尤為迫切。 

“很多客戶用英偉達的訓(xùn)練加速卡已用得非常順手了,,一方面是其性能優(yōu)異,,通用性強,另一方面則是生態(tài),,CUDA的運算平臺適合各類模型,,客戶基于此可高效訓(xùn)練或改進自己的算法?!奔⒆稍儽硎?,“國內(nèi)在芯片設(shè)計上的能力與頭部品牌還存在不小的差距,再考慮到軟件和生態(tài)層面,,差距就又會進一步拉大,。”

正如一家GPGPU廠商代表所言,,GPGPU的生態(tài)非常復(fù)雜,,要求一路打通到應(yīng)用層,提供面向所有應(yīng)用的全面支持,,甚至要自主開發(fā)以支持一個新的應(yīng)用領(lǐng)域,。

盡管禁運有一年的緩沖期,但一年以后呢,?很可能還將面臨無法拿到最先進產(chǎn)品的可能,。雖然英偉達也放話說可提供一些相對低端的性能不及A100的產(chǎn)品讓客戶通過堆疊等來實現(xiàn)相應(yīng)的算力,但這仍將大幅影響訓(xùn)練的成本和效率,。

因而,,雖然國內(nèi)在GPGPU領(lǐng)域?qū)崿F(xiàn)了一些國產(chǎn)替代,,但在性能上要達到A100水平,短期內(nèi)還不現(xiàn)實,。此外,,更大的阻力來自生態(tài),雖然眾多國產(chǎn)GPGPU公司芯片都支持兼容CUDA,,但兼容度和兼容水平無法量化,,各家的產(chǎn)品水平標準也不統(tǒng)一,這必定會增加算法工程師的使用和學(xué)習(xí)成本,。

兼容是捷徑,,但不是終點,從長遠來說一定要建立自己的生態(tài),。國內(nèi)GPGPU廠商還應(yīng)風(fēng)物長宜放眼量,。

無疑,,美對我國芯片行業(yè)的全面圍剿將形成一道新的半導(dǎo)體“鐵幕”,,也將不斷加速國產(chǎn)芯片自主化的進程,但要從弱到強,,從低端到高端,,顯然是一場以數(shù)年為計的長征之路。



更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

二維碼.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。