上周五美股博通大漲24.43%,、市值站上萬億美元后,,本周一博通股價又上漲了11.21%,市值達1.17萬億美元。該公司拿出超市場預期的一份最新財報后,,市場對于AI定制芯片的興趣仍在高漲。即便周二美股多只芯片股普跌,,博通周二股價回調(diào)跌3.91%,,收盤市值也仍在1.1萬億美元以上。
在AI領(lǐng)域,,博通涉足定制或?qū)S眉呻娐罚?a class="innerlink" href="http://forexkbc.com/tags/ASIC" target="_blank">ASIC)和以太網(wǎng)網(wǎng)絡(luò)部件,,博通與三家大型云廠商合作開發(fā)定制AI芯片。作為一種更專用的芯片,,ASIC和更通用的GPU(圖形處理器)站在了對立面,,前者是谷歌、Meta,、亞馬遜和諸多創(chuàng)業(yè)公司的陣營,,后者則主要站著英偉達和AMD。
博通股價起飛只是ASIC反攻GPU陣營的一個前奏,。除了用自研ASIC替代英偉達GPU的云廠商,,ASIC領(lǐng)域的創(chuàng)業(yè)潮也在涌動,創(chuàng)業(yè)公司正在世界范圍內(nèi)尋找客戶,。在業(yè)內(nèi)人士看來,,GPU和ASIC之爭更像是一場通用和專用陣營之爭,在AI最終定型之前,兩種芯片都不會完全取代對方,,這場博弈也不一定以一輸一贏為結(jié)果,。
誰在給博通們創(chuàng)造業(yè)績?
GPU霸主英偉達在聚光燈下站了太久,,人們可能容易忽略背后各云廠商的造芯努力,,它們設(shè)計的ASIC滲透率可能比很多人想象的更深。
ASIC包含多類芯片,,諸如TPU(Tensor Processing Unit,,張量處理器)、LPU(語言處理器),、NPU(神經(jīng)網(wǎng)絡(luò)處理器)等,。云廠商中,谷歌多年前就布局TPU,,其第六代TPU Trillium在本月正式向客戶開放使用,;Meta今年推出了專為AI訓練和推理設(shè)計的定制芯片MTIA v2;亞馬遜有Trainium2,,并計劃明年發(fā)布Trainium3,;微軟則有自研AI芯片Azure Maia。
或許是因為不對外銷售芯片,,這些云廠商的AI芯片比較少受到市場關(guān)注,。但實際上,這些云廠商已在自己的數(shù)據(jù)中心部署ASIC芯片并著力擴大這些芯片的使用,。
以谷歌為代表,,TechInsights數(shù)據(jù)顯示,去年谷歌已悄然成為全球第三大數(shù)據(jù)中心處理器設(shè)計公司,,位列CPU霸主英特爾和GPU霸主英偉達之后,。谷歌內(nèi)部工作負載運行TPU而不對外出售芯片。
亞馬遜則向OpenAI的競爭對手Anthropic進行多次投資,,加深與該公司的綁定,。Anthropic就用了亞馬遜的Trainium。亞馬遜近日透露,,建設(shè)給Anthropic使用的Rainier超級計算機集群項目很快會完成,,亞馬遜還在建設(shè)更多產(chǎn)能以滿足其他客戶用Trainium的需求,。
定制芯片廠商博通,、Marvell的相關(guān)訂單就是來自這些云廠商。其中,,谷歌,、Meta的ASIC芯片與博通合作定制。除了谷歌,摩根大通分析師預測,,Meta有望成為下一個為博通帶來10億美元收入的ASIC客戶,。亞馬遜則與芯片廠商Marvell合作。本月初,,亞馬遜AWS剛與Marvell達成一項為期五年的協(xié)議,,雙方擬擴大在AI和數(shù)據(jù)中心連接產(chǎn)品方面的合作,以便亞馬遜部署半導體產(chǎn)品組合和專用網(wǎng)絡(luò)硬件,。
體現(xiàn)在業(yè)績上,,2024財年,博通收入同比增長44%,,達到創(chuàng)紀錄的516億美元,。該財年,博通人工智能收入同比增長220%,,達到122億美元,,推動公司的半導體收入達到創(chuàng)紀錄的301億美元。博通還展望2025財年第一季度收入同比增長22%,。
據(jù)Marvell本月早些時候發(fā)布的2025財年第三季度財報,,該季度公司營收則為15.16億美元,同比增長7%,,環(huán)比增長19%,,該公司稱環(huán)比增長幅度高于此前指引的中點,并預測下一季度營收還將環(huán)比增長19%,。Marvell表示,,第三季度的業(yè)績表現(xiàn)和對第四季度業(yè)績表現(xiàn)強勁的預期主要是由定制AI芯片項目推動的,這些項目已經(jīng)開始量產(chǎn),,并預計2026財年需求還將保持強勁勢頭,。
除了谷歌、Meta,、亞馬遜這些云廠商,,OpenAI、蘋果也多次傳出與這類ASIC定制芯片廠商合作的消息,。近日蘋果便傳出正在開發(fā)AI服務(wù)器芯片,、正與博通合作開發(fā)該芯片網(wǎng)絡(luò)技術(shù)的消息,OpenAI此前傳出已與博通合作數(shù)月構(gòu)建AI推理芯片,。
ASIC創(chuàng)業(yè)公司網(wǎng)羅客戶
云廠商自研大模型并通過投資綁定了一些大模型創(chuàng)業(yè)公司,,與ASIC定制廠商合作的自研芯片用于這些大模型訓練和推理,不需要依賴外售,。ASIC創(chuàng)業(yè)公司則不同,,它們選擇了不同的芯片代工商,并需要自己尋找客戶。
其中,,推出了晶圓級芯片的Cerebras Systems將芯片交給臺積電生產(chǎn),,Etched的Sohu芯片采用臺積電4nm工藝。采用近存計算架構(gòu)的Groq LPU芯片對制程的要求沒有那么高,,用了GlobalFoundries的14nm工藝,。
這些ASIC創(chuàng)業(yè)公司正在全世界范圍內(nèi)網(wǎng)羅客戶,從正加碼布局AI的中東國家搜尋客戶成為一些ASIC創(chuàng)業(yè)公司的共同選擇,。據(jù)Cerebras Systems公開的數(shù)據(jù),,2023年Cerebras Systems凈銷售額近7900萬美元,今年上半年達1.364億美元,。2023年該公司來自阿聯(lián)酋阿布扎比的G42公司的收入占總收入83%,,G42還承諾在明年購買價值14.3億美元的Cerebras Systems產(chǎn)品和服務(wù)。
記者9月在沙特阿拉伯的AI峰會上也看到了Cerebras Systems,、Groq和另一家AI芯片初創(chuàng)公司SambaNova Systems的身影,。Cerebras Systems當時與沙特阿美簽署了諒解備忘錄,沙特阿美計劃用Cerebras Systems的產(chǎn)品訓練和部署大模型,。
Groq則與沙特阿美的數(shù)字與技術(shù)子公司合作,,計劃在沙特建設(shè)全球最大規(guī)模的推理數(shù)據(jù)中心,該數(shù)據(jù)中心今年年底建成投運,,初期包括1.9萬個Groq LPU,,未來有望擴展至20萬個 LPU。據(jù)SymbaNova Systems官網(wǎng)消息,,該公司也與迪拜公司Solidus AI Tech合作,,計劃為歐洲的高性能計算數(shù)據(jù)中心提供SymbaNova Cloud,并與在中東,、南亞,、歐洲、非洲地區(qū)開展業(yè)務(wù)的Canvass AI公司合作,,向企業(yè)提供AI解決方案,。
此外,據(jù)企業(yè)官網(wǎng)消息,,SymbaNova Systems與美國阿貢國家實驗室合作,。Groq則與面向美國和加拿大政府部門提供IT方案的廠商Carahsoft 合作,并與能源領(lǐng)域的Earth Wind&Power合作,,計劃在挪威建設(shè)AI計算中心,。
專用與通用之爭
GPU和ASIC目前的優(yōu)缺點都很明顯。GPU勝在通用,,能運行諸多算法,,且英偉達CUDA生態(tài)成熟,具備易用性,,缺點在于通用的GPU在算力和功耗上會有一定浪費,。ASIC相對專用,針對特定算法的設(shè)計使算力和功耗表現(xiàn)可能更優(yōu),。以Groq的LPU為例,,該公司稱LPU速度比英偉達GPU快十倍,但價格和耗電量都僅為后者的十分之一,。不過,,越是專用的ASIC越難容忍太多算法,原本在GPU上跑的大模型要遷移至ASIC上運行不一定容易,,整體上易用性也低于GPU,。
在ASIC愈來愈猛的攻勢下,兩類芯片是否即將決出勝負,?或者說,,資本市場對博通的看好是不是“反噬”了對英偉達的市場預期?在博通市值站上萬億美元之時,,美股上周五至本周二,,英偉達股價連跌三天?!澳阈枰ミ_,,但我認為市場也在說,除此之外還有其他受益者,?!毙磐型顿Y公司Truist聯(lián)席首席投資官基思?勒納(Keith Lerner)評論稱。不過,,一些芯片業(yè)內(nèi)人士認為,,GPU與ASIC之爭可以看作通用芯片與專用芯片之爭,從這個層面看,,兩種芯片在一段時間之內(nèi)都有騰挪的空間,,并非簡單的一方取代一方的關(guān)系。
從使用場景看,,一名業(yè)內(nèi)人士告訴記者,,GPU仍要用在大量并行化通用用例中,在此之外的其他需求可以使用成本更低的ASIC,,例如在推理端使用低功耗的AISC,。麥肯錫的研究也認為,未來AI工作量主要轉(zhuǎn)向推理,,到2030年,,配備ASIC芯片的AI加速器將處理大多數(shù)AI工作負載,。
但具體未來ASIC能拿下多大的AI芯片市場份額,可能仍有變數(shù),,這種變數(shù)來自GPU對ASIC芯片優(yōu)點的吸收,。安謀科技產(chǎn)品總監(jiān)鮑敏祺向記者表示,GPU不一定會被其他芯片取代,。GPU主要在AI云端應(yīng)用,,GPU更容易接入openCL cuda或者SYCL這種軟件編程生態(tài)模式,具備便利性,。而從能效角度看,,GPU會帶來更多的多線程上下文切換開銷,這些開銷不容忽視,。由此看,,未來在端側(cè)場景,GPU和其他芯片會逐步走向融合,,而不是互相取代,。就像英偉達H100的Tensor Core(張量處理單元)已經(jīng)引入了更多Tensor專用的技術(shù),芯片之間已經(jīng)在取對方的長處逐步彌補自身的短處,。
千芯科技董事長陳巍也認為,,針對諸如能耗高等短板,GPU仍能在自身范疇內(nèi)進行改良,,這種改良正是吸收了專用芯片的長處,。
“GPU和其他AI芯片架構(gòu)之間,兩方面力量在博弈,,新舊此消彼長,。微軟、特斯拉,、谷歌等已經(jīng)走向研究更專用的芯片的路線,,英偉達雖然做的還是GPU,但它的路線也從原來的傳統(tǒng)GPU轉(zhuǎn)向更專用的計算結(jié)構(gòu),,其Tensor Core部分已經(jīng)明顯超過原來的CUDA Core部分,。” 陳巍告訴記者,。
目前已經(jīng)出現(xiàn)了越來越專門針對大模型的ASIC芯片,,通過更極致的專用性提高芯片效率。例如Etched將主流大模型所基于的Transformer架構(gòu)固定在芯片Sohu上,,聲稱一臺集成8塊Sohu的服務(wù)器性能匹敵160個英偉達H100 GPU,。陳巍告訴記者,他猜測后續(xù)也可能出現(xiàn)針對大模型應(yīng)用的專用GPU,,GPU廠商有比較高的概率會進一步改進Tensor Core結(jié)構(gòu),,從而犧牲掉一部分對顯存的支持能力,。
不過,這種極致的專用性也是一把雙刃劍,。另有業(yè)內(nèi)人士向記者表示,,當前AI的主流架構(gòu)是Transformer,未來隨著AI架構(gòu)演進,,Transformer不一定是終局,,在此過程中,,通用的GPU一直能被采用,,但當AI主流架構(gòu)發(fā)生變化時,特別專用的ASIC芯片將無法適應(yīng),。
從這個層面看,,ASIC也需要考慮舍棄通用性的風險?!埃℅PU通用性的重要性)確實如此,。” 鮑敏祺告訴記者,,當Transformer改變,,GPU將有優(yōu)勢。以NPU為例,,一方面,,原本的DSA(特定領(lǐng)域架構(gòu))可能無法應(yīng)對算法流程變化,因此對一些向量計算需要考慮引入更多通用能力,。另一方面,,在具備通用計算能力的情況下,芯片則可能沒有針對特定計算類型進行優(yōu)化,,導致遇到性能瓶頸,。因此設(shè)計時既要引入更多通用計算能力以適應(yīng)算法等的變化,又要平衡通用計算能力和執(zhí)行特定任務(wù)的性能,。