原文作者: 周凱揚(yáng)
本文來(lái)源:電子發(fā)燒友網(wǎng)
原文鏈接:https://mp.weixin.qq.com/s/TjP1Q_bhpBVxGISQgimpsw
隨著近日英偉達(dá)公布2024財(cái)年第一季度的財(cái)報(bào),,超過(guò)預(yù)期的成績(jī)?cè)俣茸尨蠹艺J(rèn)識(shí)到了服務(wù)器市場(chǎng)激增的需求,。英偉達(dá)憑借其GPU在服務(wù)器領(lǐng)域的主導(dǎo)地位,交出了一份令人滿(mǎn)意的答卷??稍诜?wù)器CPU領(lǐng)域,,卻又是另一片光景,英偉達(dá)從過(guò)去的觀戰(zhàn)方變成了如今的參戰(zhàn)方,,也陷入了三大架構(gòu)混戰(zhàn)的戰(zhàn)局中去,。
x86的你來(lái)我往
由于x86賽道的玩家相當(dāng)有限,且兩家廠商都不愿意放棄這塊蛋糕,,所以呈現(xiàn)了一種互相拉扯的局面,。盡管英特爾占據(jù)主導(dǎo)地位多年,但這幾年來(lái)AMD已經(jīng)有了迎頭趕上的趨勢(shì),,憑借EPYC系列處理器蠶食了英特爾不少份額,。
從Mercury Research的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,在服務(wù)器的x86 CPU市場(chǎng),,AMD的份額從年初的10.7%增長(zhǎng)至17.6%,,而英特爾則從89.3%降低至82.4%。雖然兩者差距依然巨大,,但多虧了AMD持續(xù)的戰(zhàn)略投入和穩(wěn)扎穩(wěn)打,,AMD有望在今年將這一份額進(jìn)一步提升至20%。
且得益于EPYC處理器上集成的AMD Infinity Guard技術(shù),,AMD的處理器在不少CSP那相當(dāng)吃香,,包括微軟Azure、谷歌云和Oracle Cloud都將其視為機(jī)密計(jì)算首選方案,。加上AMD在AI軟件支持上也取得了長(zhǎng)足的進(jìn)步,,包括支持PyTorch 2.0為ROCm軟件提供原生支持,以及TensorFlow 2.12版本開(kāi)始提供TensorFlow-ZenDNN擴(kuò)展,,進(jìn)一步加強(qiáng)EPYC CPU在神經(jīng)網(wǎng)絡(luò)推理上的靈活性,。
這有一部分原因則是英特爾在備受期待的Sapphire Rapids上頻繁踩坑,雖說(shuō)今年3月,,該處理器已經(jīng)正式開(kāi)始交付,,但可以說(shuō)選了個(gè)最差的時(shí)機(jī)。英特爾表示Sapphire Rapids獲得了400多個(gè)設(shè)計(jì)勝利,,可從市場(chǎng)現(xiàn)狀來(lái)看,,今年不少CSP都選擇在服務(wù)器CPU上砍單,據(jù)有關(guān)人士透露,,微軟在下半年砍掉了50%到70%的Sapphire Rapids訂單,。
更不用說(shuō)如今第五代Xeon處理器Emerald Rapids已經(jīng)開(kāi)始送樣,且計(jì)劃今年第四季度開(kāi)始交付,,意味著Sapphire Rapids在出貨兩個(gè)季度后就要與下一代產(chǎn)品同臺(tái)競(jìng)爭(zhēng),??梢钥闯觯⑻貭柤涌炝嗽O(shè)計(jì)步伐,,試圖扭轉(zhuǎn)頹勢(shì),,所以這一你來(lái)我往的局面應(yīng)該還會(huì)持續(xù)下去??尚枰⒁獾氖?,在整個(gè)服務(wù)器CPU市場(chǎng)中,奪去英特爾市場(chǎng)份額可不僅僅是AMD,,還有其他虎視眈眈的非x86架構(gòu),,比如Arm。
群雄逐鹿的Arm
曾幾何時(shí)的Arm架構(gòu)想要在服務(wù)器上發(fā)力,,卻始終沒(méi)能撼動(dòng)x86分毫,,以至于彼時(shí)的高通都決定放棄Arm服務(wù)器市場(chǎng),華芯通的昇龍4800也成了“絕唱”,,可這其實(shí)完全可以歸結(jié)為時(shí)運(yùn)不濟(jì),。隨著Arm Neoverse推出后,Arm很快就打了個(gè)漂亮的翻身仗,。
隨即面世的Ampere Altra和Graviton2都是基于Neoverse N1打造的,,并迅速在市場(chǎng)找到了定位,也終于開(kāi)始普及商用,。之后的Neoverse V1和Neoverse N2更是開(kāi)啟了大廠角逐之爭(zhēng),,英偉達(dá)、Marvell,、平頭哥等紛紛入局,,為Arm的服務(wù)器生態(tài)添磚加瓦。
由于服務(wù)器處理器不像MCU那樣,,基于Arm Neoverse架構(gòu)設(shè)計(jì)需要巨大的人力與財(cái)力支撐,,所以目前Arm的服務(wù)器芯片基本是大廠之間的廝殺。在公版核心架構(gòu)相同的情況下,,這些Arm服務(wù)器芯片紛紛用上了最先進(jìn)的制造工藝,所以更加考驗(yàn)廠商們的芯片設(shè)計(jì)能力,,但Chiplet等技術(shù)的出現(xiàn),,其實(shí)也給到了這些廠商快速迭代產(chǎn)品搶占更多市場(chǎng)份額的機(jī)會(huì)。
比如英偉達(dá)選擇了利用其N(xiāo)VLink技術(shù)來(lái)拼接成144個(gè)Neoverse V2核心的Grace Superchip,,而Ampere Computing選擇了自研Arm核心推出了192核心的Ampere One處理器,。AWS在持續(xù)基于公版Neoverse核心打磨其Graviton系列處理器的同時(shí),也在利用Arm標(biāo)準(zhǔn)核心為其N(xiāo)itro控制器打造完整的DPU生態(tài),。
在服務(wù)器軟件生態(tài)上,,Arm也已經(jīng)開(kāi)始發(fā)力,,無(wú)論是DevOps、虛擬化都已經(jīng)對(duì)Arm架構(gòu)提供了完整的支持,。加之此前的日本富岳超算A64FX處理器和不久前公開(kāi)的印度Aum處理器,,Arm在HPC應(yīng)用上的軟件支持也在逐步到位。
進(jìn)展飛速的RISC-V
上文中,,我們提到Chiplet等設(shè)計(jì)技術(shù)為Arm服務(wù)器CPU快速迭代提供了便利,,可這一通用技術(shù)也為新秀RISC-V提供了縮短TTM的機(jī)會(huì),比如Ventana Micro Systems的Ventana V1,。Ventana表示Veyron V1的單槽SPECint2017跑分已經(jīng)高出了Xeon Ice Lake 8380,、EPYC Milan 7763、AWS Graviton3等競(jìng)品,,但在服務(wù)器CPU領(lǐng)域這類(lèi)跑分的說(shuō)服力并不強(qiáng),,CSP廠商看重的還有擴(kuò)展性、軟件生態(tài)適配程度,,而這些恰恰是RISC-V服務(wù)器CPU欠缺的,。
除此之外,今年已經(jīng)有了RISC-V服務(wù)器CPU露面,,為RISC-V在服務(wù)器領(lǐng)域的沖鋒打頭陣,,比如算能的算豐SG2042。SG2042基于64個(gè)高性能RISC-V核心設(shè)計(jì),,主頻高達(dá)2GHz,,且支持雙路CPU互利。最重要的是,,SG2042既是首個(gè)服務(wù)器級(jí)別的RISC-V CPU,,也是目前唯一已經(jīng)提供板卡和開(kāi)發(fā)套件方案的RISC-V服務(wù)器CPU。
同樣不可否認(rèn)的是,,在系統(tǒng)及軟件的支持上,,RISC-V服務(wù)器進(jìn)展飛速,比如在開(kāi)源社區(qū)的助力下,,Deepin,、開(kāi)源歐拉都已經(jīng)陸續(xù)宣布成功適配SG2042服務(wù)器板卡??蛇@并不代表目前的RISC-V服務(wù)器CPU處于開(kāi)箱即用的狀態(tài),,如今這些系統(tǒng)的桌面環(huán)境上僅僅支持一些文檔辦公、影音娛樂(lè)應(yīng)用,,還有大量服務(wù)器軟件與庫(kù)的適配和移植工作需要完成,,諸如虛擬化等。
RISC-V潛力巨大,,但要想追平x86甚至是Arm如今的進(jìn)度,,還有不小的差距,。但這也就是開(kāi)源社區(qū)的優(yōu)勢(shì)和魅力了,Arm花了十?dāng)?shù)年才達(dá)到如此里程,,RISC-V或許只需要不到一半的時(shí)間,。
戰(zhàn)況展望
從創(chuàng)新性、成本乃至性能等角度來(lái)看,,其實(shí)Arm以及未來(lái)的RISC-V都會(huì)是極具競(jìng)爭(zhēng)力的服務(wù)器CPU架構(gòu),,可現(xiàn)今的服務(wù)器仍是一個(gè)固執(zhí)且切入周期較長(zhǎng)的市場(chǎng),x86目前尚未觸及設(shè)計(jì)和工藝的瓶頸,,即便有了AI加速器,、DPU等組件的加入,服務(wù)器架構(gòu)并沒(méi)有發(fā)生劇變,,所以x86在未來(lái)的十年內(nèi)依然將占據(jù)主導(dǎo)地位,。
只不過(guò)隨著設(shè)計(jì)方法、制造工藝的同步,,Arm已經(jīng)在該領(lǐng)域開(kāi)啟了較為成熟的商業(yè)化進(jìn)程,,隨著時(shí)間的推移,市場(chǎng)份額會(huì)逐漸升高,。至于RISC-V,,目前服務(wù)器生態(tài)尚不成熟,很難獲得大型CSP的青睞,,要知道CSP即便選擇自研芯片也會(huì)給到客戶(hù)更多選擇,,但RISC-V目前還沒(méi)有打入任何一家的跡象。
這也是RISC-V在其他高性能計(jì)算領(lǐng)域的最大弱勢(shì),,落地應(yīng)用的欠缺使得其很難作為完善的商業(yè)方案推廣,。所以服務(wù)器CPU的戰(zhàn)局依然激烈,任何一方這時(shí)候開(kāi)始卸力都會(huì)像英特爾一樣,,轉(zhuǎn)瞬之間就被吞掉大量市場(chǎng)份額,。