作為在智能終端領(lǐng)域呼風(fēng)喚雨的角色,,ARM的崛起在很大程度上構(gòu)筑起了今日終端市場的繁榮。由于采用授權(quán),、版稅和軟件平臺服務(wù)為主的盈利模式,,ARM能夠盡量避免在制造和工廠方面分心,將大部分精力都投入到芯片產(chǎn)品的研發(fā)設(shè)計和相關(guān)軟件平臺的開發(fā)上,,從而推進(jìn)產(chǎn)品快速進(jìn)步。
而這也正是華為海思,、高通,、蘋果等企業(yè)能夠在芯片業(yè)務(wù)上一年一旗艦的快速推出產(chǎn)品的核心原因。
當(dāng)然,,既然已經(jīng)在智能終端領(lǐng)域只手遮天,,下一步就必然是利潤更豐富、前景更好的數(shù)據(jù)中心領(lǐng)域了,。
在2011至2013年,,以高通、Calxeda,、SeaMicro為首的ARM陣營曾向數(shù)據(jù)中心領(lǐng)域發(fā)起了一輪聲勢浩大的進(jìn)攻,。希望憑借更好的能效、海量的核心數(shù)量來在云化數(shù)據(jù)中心領(lǐng)域攫取一塊市場,。不過面對強大的Intel以及相對貧弱應(yīng)用和生態(tài)系統(tǒng),,當(dāng)初信心滿滿的各路ARM英豪最終也都偃旗息鼓。高通數(shù)據(jù)中心業(yè)務(wù)被邊緣化,,甚少有新消息傳出,,SeaMicro被AMD收購,Calxeda耗盡現(xiàn)金流倒地而亡……
雖然第一批ARM數(shù)據(jù)中心方案的探索者沒有成功,,但ARM并沒有放棄自己對數(shù)據(jù)中心市場的野心,。被迫退回原有市場的ARM做了兩手準(zhǔn)備,并在5年之后重新殺向數(shù)據(jù)中心市場,。
發(fā)力HPC領(lǐng)域
2011年,,日本超算Kyo在人類歷史上首次實現(xiàn)了10petaflops(億億次)的計算性能。從Kyo開始,,人類也就開始了向E級計算(百億億次)挑戰(zhàn)的征程,。根據(jù)全球各大超算強國公布的下一代E級超算時間表來看,美國,、中國,、日本和歐盟的對應(yīng)產(chǎn)品都將在2020-2023年之間完成組裝和調(diào)試。而除了性能之外,,各國對E級超算的核心需求除了性能之外就是自主可控了,。
富士通A64fx處理器
由于沒有自己的專屬處理器架構(gòu)(Intel,、AMD及IBM同為美國公司,他們掌握核心專利的x86,、POWER架構(gòu)可以理解為美國的專屬產(chǎn)品),,中國、日本及歐盟無一例外的將目光投向了更加開放的ARM架構(gòu),。其中,,中國的天河3號將采用飛騰公司研發(fā)的FT2000 Plus 64核ARM芯片(中國另有一套曙光公司的神威E級方案,處理器采用SW26010,,屬于RISC架構(gòu));日本的后京(Post Kyo或Post K)將采用富士通的A64fx ARM架構(gòu)64核心處理器;而歐盟的E級超算雖還沒有明確具體架構(gòu),,但預(yù)計會在CPU方面采用ARM架構(gòu)、在加速卡方面采用RISC-V開源指令集,。
飛騰公司FT-2000 Plus核心架構(gòu)
巨頭們的選擇雖然有些無奈,,但在RISC-V、Open SPARC等開源架構(gòu)中,,ARM仍舊是平臺生態(tài)最好,、產(chǎn)品最完善的一種(ARM并非開源,但其授權(quán)模式卻相對開放;而且ARM是英國公司,,并被軟銀控股,,很難收到國際政治關(guān)系和格局影響)。
另一方面,,ARM公司在ARM v8.2A架構(gòu)中加入的SVE(Scalable Vector Extension)技術(shù)也能夠在很大程度上提升對應(yīng)的ARM處理器在大規(guī)?;ヂ?lián)場景中的性能表現(xiàn),使其更適合應(yīng)用在HPC這種大規(guī)模集群之上,。
至此,,在象征計算技術(shù)最前沿的E級超算領(lǐng)域,ARM架構(gòu)基本占領(lǐng)了五分之三的份額,,實現(xiàn)了對數(shù)據(jù)中心市場的躍鼎打擊,。
云化數(shù)據(jù)中心里的ARM
雖然E級超算對ARM架構(gòu)青睞有加,但這顯然不能給ARM公司貢獻(xiàn)多少有意義的營收,。ARM的真正發(fā)力點仍需要放在商用數(shù)據(jù)中心市場上,。
而隨著主流Linux系統(tǒng)對ARM處理器支持的越來越好,以Marvell公司ThunderX處理器為代表的ARM陣營也開始了向商用數(shù)據(jù)中心領(lǐng)域的再一次進(jìn)發(fā),。
在大型數(shù)據(jù)中心紛紛完成云化之后,,下一步的發(fā)展方向便是容器化及其背后對應(yīng)的serverless模式。在強大的Kubernetes加持下,,以往復(fù)雜而臃腫的應(yīng)用和服務(wù)可以被更加輕量化,、擴展和迭代更方便的微服務(wù)模式所取代。而對于數(shù)據(jù)中心來說,,這種更加碎片化的應(yīng)用交付和部署模式顯然可以進(jìn)一步提升硬件的利用率,,并進(jìn)一步降低云的成本,。
Cavium ThunderX2處理器
(Cavium雇傭了前博通工程師并購買了博通vulcan IP——博通公司的ARM處理器項目,最終被Marvell以60億美元收購)
這種碎片化的應(yīng)用或計算在很多情況下并不會產(chǎn)生太高的計算需求,,如果仍以龐大的x86 CPU核心或vCPU來運行的話顯然會產(chǎn)生一定程度的浪費,。而以ThunderX CN9980 2.5GHz處理器為例,1790美元售價將包含32個核心,、128線程以及56個PCIe 3.0通道和8個DDR4內(nèi)存通道以及高達(dá)2TB的內(nèi)存支持;功耗也只是180W,。另一方面,ThunderX處理器內(nèi)部還集成了一個高性能25Gbps網(wǎng)絡(luò)控制器,,相當(dāng)于為服務(wù)器提供了一個廉價的高性能網(wǎng)絡(luò)集成方案,。
華為鯤鵬920處理器規(guī)格(在不同場合中也可稱為Hi1620)圖片源自mobilemagazinehk
除了Marvell的ThunderX2之外,華為也推出了自己的鯤鵬920處理器及對應(yīng)的泰山服務(wù)器產(chǎn)品,。相對于ThunderX2,鯤鵬920直接采用了更先進(jìn)的7nm工藝和ARM v8.2架構(gòu),,并在180W的TDP之下提供了64個運行于2.6GHz頻率的核心,、8個DDR4內(nèi)存通道和40個lane的PCIe 4.0連接。當(dāng)然,,華為也發(fā)揮了自身在網(wǎng)絡(luò)技術(shù)方面的優(yōu)勢,,為鯤鵬920內(nèi)置了一個100Gb的RoCE控制器。
目前,,AWS已經(jīng)批量部署了自己的基于ThunderX2方案的ARMbased服務(wù)器,,并開始對外提供服務(wù)。而各家ARMbased服務(wù)器產(chǎn)品也大多瞄準(zhǔn)云計算,、分布式存儲等數(shù)據(jù)中心的核心應(yīng)用場景以及一些原生Android服務(wù)的新領(lǐng)域,。
ARM在數(shù)據(jù)中心市場能成功嗎?
與第一次沖擊不同,此次在助推ARM向數(shù)據(jù)中心市場前進(jìn)的廠商包括了Marvell和華為等資深企業(yè)級廠商,。他們均在數(shù)據(jù)中心市場中擁有廣泛的合作生態(tài)和豐富的商業(yè)經(jīng)驗,,這無疑會給ARM在數(shù)據(jù)中心市場中的發(fā)展提供強大的支持。
雖然現(xiàn)在來給ARM在數(shù)據(jù)中心市場上的表現(xiàn)定結(jié)論還太早,,但在吸取了第一次的教訓(xùn)并獲得了強大的支持后,,ARM未來的數(shù)據(jù)中心之路顯然會走的更好、更遠(yuǎn),。