原文作者: 周凱揚
本文來源:電子發(fā)燒友網
原文鏈接:https://mp.weixin.qq.com/s/TjP1Q_bhpBVxGISQgimpsw
隨著近日英偉達公布2024財年第一季度的財報,,超過預期的成績再度讓大家認識到了服務器市場激增的需求。英偉達憑借其GPU在服務器領域的主導地位,,交出了一份令人滿意的答卷,。可在服務器CPU領域,,卻又是另一片光景,,英偉達從過去的觀戰(zhàn)方變成了如今的參戰(zhàn)方,也陷入了三大架構混戰(zhàn)的戰(zhàn)局中去,。
x86的你來我往
由于x86賽道的玩家相當有限,,且兩家廠商都不愿意放棄這塊蛋糕,所以呈現了一種互相拉扯的局面,。盡管英特爾占據主導地位多年,,但這幾年來AMD已經有了迎頭趕上的趨勢,憑借EPYC系列處理器蠶食了英特爾不少份額,。
從Mercury Research的統計數據來看,,在服務器的x86 CPU市場,AMD的份額從年初的10.7%增長至17.6%,,而英特爾則從89.3%降低至82.4%,。雖然兩者差距依然巨大,但多虧了AMD持續(xù)的戰(zhàn)略投入和穩(wěn)扎穩(wěn)打,,AMD有望在今年將這一份額進一步提升至20%,。
且得益于EPYC處理器上集成的AMD Infinity Guard技術,AMD的處理器在不少CSP那相當吃香,,包括微軟Azure,、谷歌云和Oracle Cloud都將其視為機密計算首選方案。加上AMD在AI軟件支持上也取得了長足的進步,,包括支持PyTorch 2.0為ROCm軟件提供原生支持,,以及TensorFlow 2.12版本開始提供TensorFlow-ZenDNN擴展,,進一步加強EPYC CPU在神經網絡推理上的靈活性。
這有一部分原因則是英特爾在備受期待的Sapphire Rapids上頻繁踩坑,,雖說今年3月,,該處理器已經正式開始交付,但可以說選了個最差的時機,。英特爾表示Sapphire Rapids獲得了400多個設計勝利,,可從市場現狀來看,今年不少CSP都選擇在服務器CPU上砍單,,據有關人士透露,,微軟在下半年砍掉了50%到70%的Sapphire Rapids訂單。
更不用說如今第五代Xeon處理器Emerald Rapids已經開始送樣,,且計劃今年第四季度開始交付,,意味著Sapphire Rapids在出貨兩個季度后就要與下一代產品同臺競爭??梢钥闯?,英特爾加快了設計步伐,試圖扭轉頹勢,,所以這一你來我往的局面應該還會持續(xù)下去,。可需要注意的是,,在整個服務器CPU市場中,,奪去英特爾市場份額可不僅僅是AMD,還有其他虎視眈眈的非x86架構,,比如Arm,。
群雄逐鹿的Arm
曾幾何時的Arm架構想要在服務器上發(fā)力,卻始終沒能撼動x86分毫,,以至于彼時的高通都決定放棄Arm服務器市場,,華芯通的昇龍4800也成了“絕唱”,可這其實完全可以歸結為時運不濟,。隨著Arm Neoverse推出后,,Arm很快就打了個漂亮的翻身仗。
隨即面世的Ampere Altra和Graviton2都是基于Neoverse N1打造的,,并迅速在市場找到了定位,,也終于開始普及商用。之后的Neoverse V1和Neoverse N2更是開啟了大廠角逐之爭,,英偉達、Marvell,、平頭哥等紛紛入局,,為Arm的服務器生態(tài)添磚加瓦,。
由于服務器處理器不像MCU那樣,基于Arm Neoverse架構設計需要巨大的人力與財力支撐,,所以目前Arm的服務器芯片基本是大廠之間的廝殺,。在公版核心架構相同的情況下,這些Arm服務器芯片紛紛用上了最先進的制造工藝,,所以更加考驗廠商們的芯片設計能力,,但Chiplet等技術的出現,其實也給到了這些廠商快速迭代產品搶占更多市場份額的機會,。
比如英偉達選擇了利用其NVLink技術來拼接成144個Neoverse V2核心的Grace Superchip,,而Ampere Computing選擇了自研Arm核心推出了192核心的Ampere One處理器。AWS在持續(xù)基于公版Neoverse核心打磨其Graviton系列處理器的同時,,也在利用Arm標準核心為其Nitro控制器打造完整的DPU生態(tài),。
在服務器軟件生態(tài)上,Arm也已經開始發(fā)力,,無論是DevOps,、虛擬化都已經對Arm架構提供了完整的支持。加之此前的日本富岳超算A64FX處理器和不久前公開的印度Aum處理器,,Arm在HPC應用上的軟件支持也在逐步到位,。
進展飛速的RISC-V
上文中,我們提到Chiplet等設計技術為Arm服務器CPU快速迭代提供了便利,,可這一通用技術也為新秀RISC-V提供了縮短TTM的機會,,比如Ventana Micro Systems的Ventana V1。Ventana表示Veyron V1的單槽SPECint2017跑分已經高出了Xeon Ice Lake 8380,、EPYC Milan 7763,、AWS Graviton3等競品,但在服務器CPU領域這類跑分的說服力并不強,,CSP廠商看重的還有擴展性,、軟件生態(tài)適配程度,而這些恰恰是RISC-V服務器CPU欠缺的,。
除此之外,,今年已經有了RISC-V服務器CPU露面,為RISC-V在服務器領域的沖鋒打頭陣,,比如算能的算豐SG2042,。SG2042基于64個高性能RISC-V核心設計,主頻高達2GHz,,且支持雙路CPU互利,。最重要的是,SG2042既是首個服務器級別的RISC-V CPU,,也是目前唯一已經提供板卡和開發(fā)套件方案的RISC-V服務器CPU,。
同樣不可否認的是,,在系統及軟件的支持上,RISC-V服務器進展飛速,,比如在開源社區(qū)的助力下,,Deepin、開源歐拉都已經陸續(xù)宣布成功適配SG2042服務器板卡,??蛇@并不代表目前的RISC-V服務器CPU處于開箱即用的狀態(tài),如今這些系統的桌面環(huán)境上僅僅支持一些文檔辦公,、影音娛樂應用,,還有大量服務器軟件與庫的適配和移植工作需要完成,諸如虛擬化等,。
RISC-V潛力巨大,,但要想追平x86甚至是Arm如今的進度,還有不小的差距,。但這也就是開源社區(qū)的優(yōu)勢和魅力了,,Arm花了十數年才達到如此里程,RISC-V或許只需要不到一半的時間,。
戰(zhàn)況展望
從創(chuàng)新性,、成本乃至性能等角度來看,其實Arm以及未來的RISC-V都會是極具競爭力的服務器CPU架構,,可現今的服務器仍是一個固執(zhí)且切入周期較長的市場,,x86目前尚未觸及設計和工藝的瓶頸,即便有了AI加速器,、DPU等組件的加入,,服務器架構并沒有發(fā)生劇變,所以x86在未來的十年內依然將占據主導地位,。
只不過隨著設計方法,、制造工藝的同步,Arm已經在該領域開啟了較為成熟的商業(yè)化進程,,隨著時間的推移,,市場份額會逐漸升高。至于RISC-V,,目前服務器生態(tài)尚不成熟,,很難獲得大型CSP的青睞,要知道CSP即便選擇自研芯片也會給到客戶更多選擇,,但RISC-V目前還沒有打入任何一家的跡象,。
這也是RISC-V在其他高性能計算領域的最大弱勢,落地應用的欠缺使得其很難作為完善的商業(yè)方案推廣。所以服務器CPU的戰(zhàn)局依然激烈,,任何一方這時候開始卸力都會像英特爾一樣,,轉瞬之間就被吞掉大量市場份額。