長(zhǎng)久以來(lái),,服務(wù)器,、數(shù)據(jù)中心領(lǐng)域一直是x86 CPU架構(gòu)的天下,,但是隨著市場(chǎng)需求、應(yīng)用負(fù)載的多元化,,隨著云計(jì)算,、邊緣計(jì)算、高性能計(jì)算的不斷演進(jìn),,RISC-V,、ARM等架構(gòu)也都迎來(lái)了新的爆發(fā)機(jī)遇,,尤其是ARM,眾多巨頭紛紛參與,生態(tài)建設(shè)也是如火如荼,。
比如最近,亞馬遜就發(fā)布了ARM架構(gòu)的64核心Graviton2,,安晟培(Ampere)則推出了80核心的Altra?,F(xiàn)在,Mavell(美滿電子)奉上了第三代ARM芯片“ThunderX3”,。
Marvell的大名很多人可能不太熟悉,,但這家歷史悠久的半導(dǎo)體企業(yè)其實(shí)隨時(shí)都在你身邊,比如機(jī)械硬盤主控,,絕大部分都出自Marvell的手筆,,SSD主控也有豐富的產(chǎn)品。
Marvell成立于1995年,,總部位于美國(guó)加州圣克拉拉,,在美國(guó)、以色列,、印度,、德國(guó)、中國(guó)都設(shè)有研發(fā)中心,,全球員工超過(guò)5000人,,全球?qū)@^(guò)1萬(wàn)件,2020財(cái)年收入27億美元,,核心業(yè)務(wù)覆蓋存儲(chǔ),、網(wǎng)絡(luò)、計(jì)算三大領(lǐng)域,,特別是擁有超過(guò)15年的高性能多核心CPU研發(fā)經(jīng)驗(yàn),。
Mavell旗下?lián)碛型暾腃PU處理器產(chǎn)品線,包括Armada、Octeon TX,、Octeon Fusion,、ThunderX四大系列,尤其是已經(jīng)悄然成為全球最大的ARM服務(wù)器處理器供應(yīng)商,,應(yīng)用范圍,、生態(tài)支持都獨(dú)步全球,累計(jì)出貨量已突破1億顆,。
2017年,,Marvell還以約60億美元的價(jià)格收購(gòu)了美國(guó)無(wú)工廠半導(dǎo)體企業(yè)Cavium(凱為半導(dǎo)體),進(jìn)一步增強(qiáng)了ARM平臺(tái)的設(shè)計(jì)能力,。
既然有了成熟的x86,,為何要大力推廣ARM?它有什么吸引整個(gè)行業(yè)的呢,?
Marvell認(rèn)為,,在架構(gòu)、工藝,、性能,、能效、生態(tài)等多個(gè)方面,,ARM都展現(xiàn)出了更優(yōu)秀的品質(zhì),雖然不會(huì)也不能全方位取代x86,,但是在部分特定領(lǐng)域,,尤其是云計(jì)算、高性能計(jì)算等,,已經(jīng)明顯超越x86,。
架構(gòu)方面,x86一直是一個(gè)架構(gòu)打天下,,從服務(wù)器數(shù)據(jù)中心到桌面筆記本消費(fèi)級(jí),,都基于同一個(gè)架構(gòu)衍生不同的產(chǎn)品,缺乏靈活性,,尤其是在并行處理方面,,而且規(guī)模越做越大,也導(dǎo)致成本,、功耗越來(lái)越無(wú)法滿足需求,。
工藝方面,Intel已經(jīng)失去了領(lǐng)導(dǎo)地位,,至強(qiáng)系列至今還是14nm,,AMD雖然走到了7nm,但又在架構(gòu)上“取巧”使用chiplet多芯片誰(shuí)家,導(dǎo)致內(nèi)存帶寬,、內(nèi)存延遲明顯不足,,ARM方面則跟著臺(tái)積電一路走到了7nm,并即將進(jìn)入5nm,。
性能和能效方面,,Marvell認(rèn)為ARM架構(gòu)的單線程性能已經(jīng)是一流水準(zhǔn),多線程和平臺(tái)性能更是遙遙領(lǐng)先,,內(nèi)存帶寬,、延遲同樣優(yōu)秀,而且功耗低,、能效高,。
生態(tài)方面,x86雖然歷史悠久,,但負(fù)擔(dān)也很重,,比如考慮各種歷史甚至是消費(fèi)級(jí)兼容性,ARM則沒(méi)有過(guò)多拖累,,架構(gòu)直接為服務(wù)器優(yōu)化而生,。
同時(shí),軟硬件行業(yè)對(duì)ARM的支持也越來(lái)越豐富,,比如Marvell ThunderX2已經(jīng)被20多家終端客戶部署在大規(guī)模云計(jì)算,、高性能計(jì)算市場(chǎng),包括微軟Azure,、HPE,、Cray、Atos,、洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室,、桑迪亞國(guó)家實(shí)驗(yàn)室、勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室,、橡樹嶺國(guó)家實(shí)驗(yàn)室,、布里斯托大學(xué)、萊徹斯特大學(xué)等等,。
甚至,,Intel的一些軟硬件技術(shù)同樣支持ARM平臺(tái),NVIDIA,、AMD GPU同樣也支持,。
接下來(lái)說(shuō)說(shuō)具體產(chǎn)品。Marvell ThunderX系列嚴(yán)格遵循每?jī)赡晟?jí)一代的路線圖,,ThunerX2系列誕生于2018年,,而在今天的主角ThunerX3之后,,2022年還將看到ThunerX4,工藝也是一路升級(jí),,28nm,、16nm、7nm……
ThunerX3采用臺(tái)積電7nm DUV工藝制造,,基于Marvell自主研發(fā)架構(gòu),,指令集兼容ARM v8.3+,最多96個(gè)核心,,而且繼續(xù)支持4線程,,也就是最多384個(gè)線程,是上一代的整整三倍,,而且支持雙路并行,,此時(shí)單系統(tǒng)可提供128個(gè)核心、768個(gè)線程,。
同時(shí),,頻率方面基準(zhǔn)最高2.4GHz,最高加速3.1GHz,,比上代還提高了100MHz,。
新的內(nèi)核集成四個(gè)128-bit Neon SIMD單元,就寬度而言等效于一個(gè)x86 AVX-512,,從而大大提高了浮點(diǎn)性能,。Intel至強(qiáng)最高端型號(hào)兩個(gè),AMD霄龍則是每核心兩個(gè)256-bit SIMD單元,,基本等效,。
內(nèi)存支持八通道DDR4,頻率達(dá)3200MHz,,并支持64條PCIe 4.0(16個(gè)控制器),比上代PCIe 3.0更進(jìn)一步而且增加了8條通道,,未來(lái)還會(huì)隨著PCIe 5.0/6.0標(biāo)準(zhǔn)的演進(jìn)而升級(jí),。
當(dāng)然了,企業(yè)級(jí)的RAS,、虛擬化這些都是必不可少的元素,。
接下來(lái)說(shuō)說(shuō)性能,當(dāng)然都是來(lái)自Marvell官方的數(shù)據(jù),,而且具體性能表現(xiàn)取決于特定的工作負(fù)載,。
綜合性能方面,ThunderX3對(duì)比上代IPC(每時(shí)鐘周期指令數(shù))性能提升超過(guò)25%,,基本可視為架構(gòu)本身的進(jìn)步幅度,,而結(jié)合更高的運(yùn)行頻率,,單核心性能提升超過(guò)60%,再加上大大增加的核心數(shù),,整體性能提升可以超過(guò)3倍,!
對(duì)比x86雙雄,ThunderX3的優(yōu)勢(shì)不在于絕對(duì)性能,,而是更好的能效,,相比于AMD Rome二代霄龍可高出30%,對(duì)比Intel二代可擴(kuò)展至強(qiáng)更是領(lǐng)先多達(dá)1.2倍,。
ThunderX3并不貪大求全,,主攻市場(chǎng)只有兩個(gè),一是云計(jì)算,,包括大數(shù)據(jù),、數(shù)據(jù)庫(kù)、流媒體,、Web,、搜索、存儲(chǔ),、移動(dòng)應(yīng)用開發(fā),、手游等等,其高度并行,、豐富I/O,、超低延遲、ARM原都是獨(dú)特優(yōu)勢(shì),。
性能方面,,單核心四線程可以帶來(lái)可觀的性能提升,常見應(yīng)用中最多可以提升達(dá)80%,,特定負(fù)載下甚至能見到3-4倍的提升,。
對(duì)比AMD二代霄龍、Intel二代可擴(kuò)展至強(qiáng),,ThunderX3在云端也毫不示弱,,所服務(wù)的領(lǐng)域內(nèi)已經(jīng)全面勝出,而且延遲更低,,而且支持更多數(shù)量的虛擬機(jī),。
第二個(gè)主攻方向就是高性能計(jì)算,包括政府部門,、天氣預(yù)報(bào),、油氣勘探、計(jì)算機(jī)輔助工程,、生物基因,、電子設(shè)計(jì)自動(dòng)化等,,高內(nèi)存帶寬、高能效,、高并行性的特點(diǎn)可以說(shuō)非常適合,。
對(duì)比兩家x86方案, ThunderX3在浮點(diǎn),、內(nèi)存帶寬指標(biāo)以及量子化學(xué),、計(jì)算流體動(dòng)力學(xué)、計(jì)算化學(xué),、矢量物理等應(yīng)用方面,,都有著不俗的表現(xiàn)。
對(duì)于ThunderX3的市場(chǎng)前景,,Marvell也是非常積極樂(lè)觀,,透露現(xiàn)在部署ThunderX2的超過(guò)20家客戶,都在準(zhǔn)備升級(jí)ThunderX3,,而后續(xù)的ThunderX4還會(huì)繼續(xù)帶來(lái)大幅度的提升,。
中間的是上代ThunderX2