前幾年廣受資本追捧的GPU(圖形處理器)這一硬核賽道正在步入洗牌期,,一些原本備受矚目的通用GPU設(shè)計(jì)企業(yè)先后陷入經(jīng)營困境,。與此同時(shí),有頭部企業(yè)繼續(xù)求新求變,,已步入AI(人工智能)核心戰(zhàn)場,。
對于行業(yè)現(xiàn)狀,北京社科院研究員王鵬向證券時(shí)報(bào)記者分析,當(dāng)前國產(chǎn)GPU產(chǎn)業(yè)處于快速發(fā)展與洗牌并存的階段,。一方面,,隨著AI大模型的需求激增,國產(chǎn)GPU市場迅速崛起,,涌現(xiàn)出如摩爾線程,、壁仞科技等一批具有創(chuàng)新能力的企業(yè)。這些企業(yè)在技術(shù)研發(fā),、產(chǎn)品創(chuàng)新等方面取得了顯著進(jìn)展,,為國產(chǎn)GPU行業(yè)注入了新的活力。另一方面,,市場競爭也日益激烈,,部分初創(chuàng)企業(yè)由于資金鏈斷裂、技術(shù)瓶頸等問題陷入困境,,甚至面臨裁員,、訴訟等風(fēng)險(xiǎn)。
“長遠(yuǎn)來看,,國產(chǎn)GPU行業(yè)仍具有廣闊的發(fā)展前景,。這源于人工智能、大數(shù)據(jù),、云計(jì)算等技術(shù)的快速發(fā)展,,對高性能GPU的需求持續(xù)增長;同時(shí),,國家政策對半導(dǎo)體產(chǎn)業(yè)的支持力度不斷加大,,為國產(chǎn)GPU行業(yè)提供了良好的發(fā)展環(huán)境。此外,,隨著國產(chǎn)芯片公司在生態(tài)構(gòu)建,、技術(shù)創(chuàng)新等方面的不斷努力,國產(chǎn)GPU有望逐步縮小與國際領(lǐng)先水平的差距,?!蓖貔i說。
幾家歡喜幾家愁
近日,,國產(chǎn)GPU獨(dú)角獸壁仞科技一則動態(tài)引起業(yè)內(nèi)關(guān)注,。該公司在上海證監(jiān)局辦理IPO輔導(dǎo)備案登記,輔導(dǎo)券商為國泰君安,。這是繼今年8月26日燧原科技輔導(dǎo)備案報(bào)告公布后,,又一家啟動IPO的上海AI芯片企業(yè)。
壁仞科技創(chuàng)立于2019年,,致力于研發(fā)原創(chuàng)性的通用計(jì)算體系,,建立高效的軟硬件平臺,,同時(shí)在智能計(jì)算領(lǐng)域提供一體化的解決方案。截至目前,,公司已完成多輪融資,,公開融資總額超過50億元,投資方包括啟明創(chuàng)投,、IDG資本,、中芯聚源、格力創(chuàng)投等,。
目前,,壁仞科技首款國產(chǎn)高端通用GPU(GPGPU)壁礪系列已量產(chǎn)。在9月舉行的2024全球AI芯片峰會上,,壁仞科技還首次公布了其自研的異構(gòu)GPU協(xié)同訓(xùn)練方案,,該方案突破了大模型異構(gòu)算力孤島難題,實(shí)現(xiàn)了在本土異構(gòu)多GPU芯片算力訓(xùn)練技術(shù)領(lǐng)域的首次突破,。
另一家國內(nèi)GPU獨(dú)角獸企業(yè)也有新動作,。今年7月,摩爾線程宣布對其夸娥(KUAE)智算集群解決方案進(jìn)行重大升級,,從當(dāng)前千卡級別大幅擴(kuò)展至萬卡規(guī)模,。摩爾線程創(chuàng)始人兼CEO張建中表示,在多元趨勢下,,萬卡已是AI模型訓(xùn)練主戰(zhàn)場的標(biāo)配,。
事實(shí)上,在國內(nèi),,萬卡集群建設(shè)正高歌猛進(jìn),。去年7月,華為昇騰AI集群規(guī)模從最初的4000卡集群擴(kuò)展至16000卡,,是國內(nèi)首個(gè)萬卡AI集群,。
不過,當(dāng)前國產(chǎn)GPU產(chǎn)業(yè)的分化亦十分明顯,,一些原本備受矚目的企業(yè)接連陷入困境,。今年8月底,曾獲得2024年度重慶市“獨(dú)角獸企業(yè)”稱號的象帝先被曝約400位員工被裁,。公司在回應(yīng)中坦陳:“發(fā)展面臨一定的市場調(diào)整壓力……正在進(jìn)行組織結(jié)構(gòu)和人員配置的優(yōu)化等……并尋找外部融資機(jī)會,。”另一方面,,象帝先股東還在起訴其創(chuàng)始人唐志敏,,因其未能籌集到承諾的5億元B輪融資,。
在象帝先陷入困境之前,,同處在GPU賽道的礪算科技也曾預(yù)警,。至今年8月19日,東芯股份公告擬以不超過2億元收購礪算科技37.88%股份,,礪算科技的資金緊張局面方得以緩解,。
GPU占AI芯片
八成份額
在中關(guān)村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥看來,當(dāng)前國產(chǎn)GPU行業(yè)處于一個(gè)復(fù)雜而關(guān)鍵的轉(zhuǎn)型期,,短期行業(yè)出現(xiàn)降溫和分化,,主要是由于市場競爭加劇、技術(shù)門檻提高,、資本退潮等因素導(dǎo)致企業(yè)資金壓力增大,。在此背景下,部分實(shí)力較弱的初創(chuàng)企業(yè)在面對挑戰(zhàn)時(shí)往往更加脆弱,,而頭部企業(yè)則憑借其技術(shù)實(shí)力,、市場布局和資金優(yōu)勢逐漸嶄露頭角。
按定義和應(yīng)用看,,GPU起初是一種顯示芯片,,用于加速計(jì)算機(jī)上的圖像處理。隨著技術(shù)進(jìn)步和應(yīng)用范圍的擴(kuò)大,,GPU衍生出了GPGPU,,后者是通過利用GPU并行處理能力特別強(qiáng)、計(jì)算能效比高的特點(diǎn),,處理更為復(fù)雜的計(jì)算任務(wù)(如AI模型訓(xùn)練與推理等),。基于此,,如今的GPU已被廣泛應(yīng)用于人工智能,、虛擬現(xiàn)實(shí)、游戲,、科學(xué)計(jì)算等諸多領(lǐng)域,。
IDC數(shù)據(jù)顯示,預(yù)計(jì)到2025年,,GPU仍將占據(jù)全球AI芯片八成市場份額,。Gartner此前預(yù)測,2023年全球人工智能芯片(包含GPU,、TPU等)的市場規(guī)模達(dá)到530億美元,,并預(yù)計(jì)在2024年增長至671億美元。到2027年,,全球人工智能芯片市場規(guī)模預(yù)計(jì)達(dá)到1194億美元,。
從行業(yè)格局來看,作為GPU的發(fā)明者,,英偉達(dá)占據(jù)絕對領(lǐng)先地位,。Jon Peddie Research(JPR)數(shù)據(jù)顯示,,2024年第一季度英偉達(dá)的全球AIB顯卡(也稱獨(dú)立GPU)市場份額飆升至88%,而AMD的市場份額下降至12%,。JPR預(yù)計(jì),,2024年第二季度,AI訓(xùn)練器GPU的出貨量將繼續(xù)增加,,而游戲AIB市場可能持平或走低,。在AI芯片主戰(zhàn)場,據(jù)TechInsights數(shù)據(jù),,英偉達(dá)2023年的數(shù)據(jù)中心GPU出貨量約為376萬片,,比2022年多出近100萬片,市場占比98%,,收入達(dá)362億美元,。壓倒性擊敗了AMD和英特爾等競爭對手。
微軟公司和Meta等數(shù)據(jù)中心運(yùn)營商使用英偉達(dá)的芯片來開發(fā)和運(yùn)行AI模型,,巨大的需求使其銷售額和股價(jià)飆升,。英偉達(dá)市值在今年6月曾登頂全球第一,達(dá)到3.33萬億美元,。最新財(cái)報(bào)顯示,,在英偉達(dá)Hopper(GPU構(gòu)架平臺)、GPU計(jì)算和網(wǎng)絡(luò)平臺強(qiáng)勁需求的推動下,,公司數(shù)據(jù)中心今年第二季度收入達(dá)到262.72億美元,。
英偉達(dá)達(dá)成如今成績憑的是什么?袁帥告訴證券時(shí)報(bào)記者,,這主要源于英偉達(dá)在GPU設(shè)計(jì),、制造工藝以及軟件優(yōu)化等方面具有深厚的技術(shù)積累,其產(chǎn)品在性能,、功耗比和穩(wěn)定性等方面均處于行業(yè)領(lǐng)先地位,。同時(shí),該公司建立了完善的生態(tài)系統(tǒng),,包括CUDA平臺,、軟件開發(fā)工具包(SDK)以及豐富的第三方應(yīng)用支持等,為開發(fā)者提供了便捷的開發(fā)環(huán)境和廣泛的應(yīng)用場景,。
“英偉達(dá)的芯片產(chǎn)品先進(jìn)且功能強(qiáng)大,,配套軟件生態(tài)完善滲透率高,并且產(chǎn)品迭代進(jìn)化速度快速,,所以市場地位尚難以撼動,。”深度科技研究院院長張孝榮認(rèn)為,。
機(jī)遇和挑戰(zhàn)并存
國內(nèi)市場方面,,自2019年以來,,一批國產(chǎn)GPU初創(chuàng)公司先后成立,其中涌現(xiàn)了壁仞科技,、摩爾線程,、燧原科技等AI芯片設(shè)計(jì)獨(dú)角獸,。同時(shí),,還有一批老牌芯片設(shè)計(jì)公司也入局GPU領(lǐng)域。
這些公司的機(jī)會在于美國出口管制背景下的國產(chǎn)替代,。2022年10月,,美國政府禁止英偉達(dá)向中國出口高性能H100、A100芯片,。英偉達(dá)隨后專門面向中國市場推出了不違反美國出口管制要求的A800和H800芯片,,至去年10月,這兩項(xiàng)芯片也被限制,。2024年2月,,英偉達(dá)向中國市場特供的H20芯片接受預(yù)訂,但該芯片與H100配置相比,,GPU核心數(shù)量減少41%,,性能降低28%。對此,,英偉達(dá)2023年11月曾透露,,數(shù)據(jù)中心業(yè)務(wù)兩成以上受出口管制影響。
與此同時(shí),,國內(nèi)GPU廠商正迎頭趕上,。IDC在2023年中發(fā)布的一項(xiàng)中國AI加速卡(公開市場)出貨量統(tǒng)計(jì)顯示,2022年上半年到2023年上半年,,中國AI加速卡出貨約109萬張,,英偉達(dá)市場份額為85%,華為市占率為10%,,百度市占率為2%,,寒武紀(jì)和燧原科技均為1%。
從國內(nèi)產(chǎn)品成果來看,,不僅華為昇騰系列表現(xiàn)突出,。2024年5月份,摩爾線程與智譜AI開展了新一輪GPU大模型適配,、性能測試,。結(jié)果表明,在推理方面,,摩爾線程自研全功能GPU顯著優(yōu)于基準(zhǔn)對比產(chǎn)品RTX 3090和RTX 4090,;在訓(xùn)練方面,,摩爾線程夸娥千卡智算集群的訓(xùn)練精度與A100集群相比,誤差在1%以內(nèi),,而集群性能擴(kuò)展系數(shù)超過90%,,模型算力利用率(MFU)與A100集群相當(dāng)。
壁仞科技則于2022年8月推出采用7nm制程的GPGPU芯片BR100,,該芯片峰值算力達(dá)到國際廠商彼時(shí)在售旗艦產(chǎn)品3倍以上,,創(chuàng)下國內(nèi)互連帶寬紀(jì)錄。
不過,,挑戰(zhàn)也隨之而來,,一些行業(yè)領(lǐng)先企業(yè)先后被美國政府“盯上”。2022年12月,,寒武紀(jì)等36家被美國政府列入“實(shí)體清單”,。2023年10月,壁仞科技,、摩爾線程等亦被添加到實(shí)體清單中,。
這對相關(guān)企業(yè)影響幾何?寒武紀(jì)在2024年半年報(bào)中表示,,公司及部分子公司已被列入“實(shí)體清單”,,將對公司供應(yīng)鏈的穩(wěn)定造成一定風(fēng)險(xiǎn)。受“實(shí)體清單”等供應(yīng)鏈不利因素影響,,公司上半年?duì)I收6476.53萬元,,較上年同期下降43.42%。
生態(tài)建設(shè)待完善
王鵬指出,,當(dāng)前國際政治經(jīng)濟(jì)環(huán)境的變化對GPU行業(yè)產(chǎn)生了一定影響,。特別是美國對中國AI產(chǎn)業(yè)的打壓政策限制了國內(nèi)相關(guān)企業(yè)的進(jìn)口渠道和供應(yīng)鏈穩(wěn)定性。
袁帥向證券時(shí)報(bào)記者表示,,在面臨外部封鎖前提下,,國產(chǎn)GPU廠商要站穩(wěn)腳跟并在高端AI芯片領(lǐng)域爭得一席之地并非易事。在硬件層面,,國內(nèi)芯片代工企業(yè)在高端工藝和產(chǎn)能方面相對不足,,難以完全滿足國產(chǎn)GPU設(shè)計(jì)廠商對高端AI芯片的生產(chǎn)需求;在軟件層面,,英偉達(dá)等國際巨頭在軟件生態(tài)(CUDA等)和IP授權(quán)方面擁有強(qiáng)大優(yōu)勢,。國產(chǎn)GPU廠商在構(gòu)建和完善軟件生態(tài)以及獲取關(guān)鍵IP授權(quán)領(lǐng)域仍顯薄弱。
事實(shí)上,,CUDA被業(yè)內(nèi)普遍認(rèn)為是英偉達(dá)最大護(hù)城河,。英偉達(dá)CEO黃仁勛在今年也曾強(qiáng)調(diào)CUDA軟件系統(tǒng)生態(tài)對于AI時(shí)代的重要性。“目前,,CUDA已實(shí)現(xiàn)良性的發(fā)展循環(huán),,全球擁有500萬開發(fā)者,覆蓋醫(yī)療保健,、金融服務(wù),、計(jì)算機(jī)行業(yè)、汽車行業(yè)等領(lǐng)域,?!秉S仁勛說。
中國工程院院士,,高性能計(jì)算研究所所長鄭緯民在今年7月7日的信息化百人會上指出:“這些年國產(chǎn)芯片無論是軟件硬件都有很大的進(jìn)展,,但是用戶不太喜歡用,,原因是國產(chǎn)卡的生態(tài)系統(tǒng)不太好,。”
鄭緯民認(rèn)為,,這需要做好系統(tǒng)設(shè)計(jì)和相關(guān)軟件優(yōu)化,,具體包括十個(gè)方面:編程框架、并行加速,、通信庫,、算子庫,、AI編譯器、編程語音,、調(diào)度器、內(nèi)存分配系統(tǒng),、容錯系統(tǒng),、存儲系統(tǒng)等。在他看來,,在國產(chǎn)算力支撐大模型訓(xùn)練時(shí),,國產(chǎn)AI芯片只能達(dá)到國外芯片60%的性能,但如果把前述十個(gè)方面的軟件生態(tài)做好了,,客戶也會滿意,。
國泰君安在今年3月發(fā)布的《重視AI芯片配套的軟件生態(tài)》報(bào)告中總結(jié):誰能做出中國版“CUDA”,就能占領(lǐng)AI算力高地,。國內(nèi)各大廠商已在GPU生態(tài)上積極布局,,包括驅(qū)動程序、開發(fā)工具、應(yīng)用程序接口(API)等,,以確保其產(chǎn)品能夠更好地服務(wù)于人工智能、大數(shù)據(jù)處理,、云計(jì)算和游戲等多樣化的應(yīng)用場景,。例如,,華為推出了CANN以及對應(yīng)的生態(tài)體系,,力求突破技術(shù)瓶頸。此外,,像景嘉微,、摩爾線程等公司也在自主研發(fā)GPU產(chǎn)品,,并努力打造與之兼容的軟件環(huán)境,,以減少對外部供應(yīng)商的依賴,,提升國產(chǎn)GPU的市場競爭力等,。