2024年11月18日,,在“2024 年超級(jí)計(jì)算”大會(huì)上,,Top500組織公布了全球最強(qiáng)超算Top500榜單,。其中,,位于美國(guó)勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室 (LLNL)的由 AMD 提供支持的 El Capitan 以 1.742 exaflops 的峰值性能成為目前地球上已知的最快的超級(jí)計(jì)算機(jī),。這也是AMD支持的超級(jí)計(jì)算機(jī)第六次登頂全球超算Top500榜單,。
據(jù)介紹,,El Capitan超級(jí)計(jì)算機(jī)位于勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室 (LLNL),,由 AMD Instinct MI300A APU 提供支持,,由惠普企業(yè) (HPE) 打造。該系統(tǒng)擁有11136 個(gè)節(jié)點(diǎn),,其中包含 44544 個(gè) AMD 的 MI300A,、主內(nèi)存容量高達(dá)5.4PB。此外還有一個(gè)近節(jié)點(diǎn)存儲(chǔ)子系統(tǒng),。
具體來(lái)說(shuō),,MI300A 芯片是 AMD 投入生產(chǎn)的最大的AI芯片,其內(nèi)部擁有多達(dá)13個(gè)小芯片,,其中GPU是新一代的CDNA 3架構(gòu),,并集成了24個(gè)Zen 4 CPU內(nèi)核,配置了8個(gè)共計(jì)128GB的HBM3內(nèi)存,。均基于臺(tái)積電5nm或6nm制程工藝(CPU/GPU計(jì)算核心為5nm,,HBM內(nèi)存和I/O等為6nm),總共集成1460 億個(gè)晶體管,。這也意味著擁有11136 個(gè)節(jié)點(diǎn)的El Capitan 擁有 11,039,616 個(gè)計(jì)算內(nèi)核 (CPU+GPU),,分布在 44,544 個(gè) AMD MI300A 處理器上。
根據(jù)最新的全球超算Top500 榜單,,El Capitan的高性能 Linpack (HPL)得分為 1.742 exaflops,,即每秒1.742萬(wàn)億次運(yùn)算,這比Top500超算榜單中的第二名Frontier快了45%,。
AMD表示,,El Capitan 是世界上最強(qiáng)大的超級(jí)計(jì)算機(jī),也是美國(guó)國(guó)家核安全管理局(NNSA)的第一臺(tái)百萬(wàn)兆級(jí)計(jì)算機(jī),,是NNSA三家實(shí)驗(yàn)室(LLNL,、洛斯阿拉莫斯和桑迪亞國(guó)家實(shí)驗(yàn)室)的首要計(jì)算資源。它將用于推進(jìn)科學(xué)發(fā)現(xiàn)和國(guó)家安全,提供必要的巨大計(jì)算能力,,以確保國(guó)家核威懾的安全性,、保障性和可靠性,而無(wú)需測(cè)試,。這個(gè)最先進(jìn)的系統(tǒng)標(biāo)志著 HPC 的巨大飛躍,,實(shí)現(xiàn)了前所未有的建模和仿真功能,這對(duì)于 NNSA 的庫(kù)存管理計(jì)劃至關(guān)重要,,該計(jì)劃可以認(rèn)證老化的核庫(kù)存,,以及其他關(guān)鍵的核安全任務(wù),例如防擴(kuò)散和反恐,。
“我們很高興看到 El Capitan 成為全球第二臺(tái)打破 exaflop 障礙并成為世界上最快的超級(jí)計(jì)算機(jī),。這款開(kāi)創(chuàng)性的機(jī)器展示了 AMD Instinct MI300 APU 令人難以置信的性能和效率,證明了 AMD,、LLNL 和 HPE 之間的專(zhuān)注工作,,“AMD 執(zhí)行副總裁兼總經(jīng)理 Forrest Norrod 說(shuō)?!霸?AMD,,我們正在以領(lǐng)先的性能和功能推動(dòng)計(jì)算的未來(lái),這些性能和功能將繼續(xù)定義未來(lái)幾年 HPC 和 AI 的融合,?!?/p>
LLNL 高級(jí)仿真和計(jì)算項(xiàng)目主任 Rob Neely 表示:“El Capitan 對(duì)美國(guó)國(guó)家核安全局的核心任務(wù)至關(guān)重要,它極大地增強(qiáng)了我們執(zhí)行大型高保真 3D 仿真集合的能力,,這些仿真可以解決任務(wù)面臨的復(fù)雜科學(xué)挑戰(zhàn),。”
LLNL 的 Livermore Computing 首席技術(shù)官 Bronis R. de Supinski 補(bǔ)充道:“利用 AMD Instinct MI300A APU,,我們構(gòu)建了一個(gè)曾經(jīng)難以想象的系統(tǒng),,在保持卓越能效的同時(shí)突破了計(jì)算性能的絕對(duì)界限。隨著 AI 在我們的領(lǐng)域越來(lái)越普遍,,El Capitan 使我們能夠?qū)?AI 與傳統(tǒng)的模擬和建模工作負(fù)載集成,,為跨各個(gè)科學(xué)學(xué)科的發(fā)現(xiàn)開(kāi)辟新的途徑?!?/p>
排名第二的超級(jí)計(jì)算機(jī)是Frontier,,它位于美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室,也是由 AMD EPYC CPU 和 AMD Instinct GPU 提供支持,,是世界上第二快的計(jì)算機(jī),,性能為 1.35 exaflops,比之前提交的 1.194 有所增加,。Rpeak 也從 1.714 exaflops 增加到 2.055 exaflops,。
排名第三的超級(jí)計(jì)算機(jī)是 Aurora,,其位于美國(guó)伊利諾伊州的阿貢國(guó)家實(shí)驗(yàn)室,其在完整安裝完畢的狀態(tài)下,,內(nèi)部將整合21248個(gè)Intel Xeon Max系列CPU,、63744個(gè)Intel Max系列GPU、20.42PB內(nèi)存,,峰值性能號(hào)稱可達(dá) 2 EFlop / s,,遠(yuǎn)超 Frontier,。
但是,,美國(guó)能源部沒(méi)有為英特爾的 Aurora 提交新的基準(zhǔn)測(cè)試。其6月前的提交的數(shù)據(jù)是1.012 exaflop/s的HPL性能,,雖然相比首次上榜時(shí)(當(dāng)時(shí)未全部安裝完成)性能幾乎翻了一倍,,基準(zhǔn)測(cè)試運(yùn)行僅占系統(tǒng)的87%。當(dāng)時(shí),,英特爾表示 Aurora 存在許多硬件問(wèn)題,,包括硬件和冷卻系統(tǒng)故障、操作錯(cuò)誤和網(wǎng)絡(luò)不穩(wěn)定,。
Aurora 沒(méi)有提交新的數(shù)據(jù),,這意味著一些問(wèn)題尚未得到完全解決。不過(guò),,Aurora 仍然引領(lǐng)著以 AI 為中心的 HPL-MxP 混合精度基準(zhǔn)測(cè)試,,使其成為世界上已知最快的 AI 超級(jí)計(jì)算機(jī),具有 10.6 AI Exaflops 的性能,。
需要指出的是,,此外,El Capitan系統(tǒng)是基于HPE的Shasta 架構(gòu)構(gòu)建的 ,,該架構(gòu)由高密度液冷 EX4000 機(jī)柜和與 Slingshot-11 網(wǎng)絡(luò)互連綁定在一起的 EX225a 加速器刀片組成,。該平臺(tái)也為另外兩臺(tái)百萬(wàn)兆次級(jí)超級(jí)計(jì)算機(jī)Frontier和Aurora提供支持。這使得HPE的系統(tǒng)在 Top500 名單上占據(jù)了前三名,,而這三個(gè)系統(tǒng)都是該名單上的E級(jí)超算系統(tǒng),。
排名第四的超算是Eagle,其安裝在微軟的 Azure 云服務(wù)基礎(chǔ)設(shè)施中,,該系統(tǒng)基于英特爾 Xeon Platinum 8480C 處理器和英偉達(dá)H100 加速器,,并實(shí)現(xiàn)了 561 Petaflop/s 的 HPL 分?jǐn)?shù)。
排名第五的超算是HPC6,,安裝在意大利 Ferrera Erbognone 的 Eni S.p.A 中心,。它是另一款 HPE Cray EX235a 系統(tǒng),采用針對(duì) HPC 和 AI 優(yōu)化的第 3 代 AMD EPYC CPU,、AMD Instinct 250X 加速器和 Slingshot-11 互連,,性能達(dá)到了 477.9 Petaflop/s。
事實(shí)上,Top500榜單中,,速度最快的前十臺(tái)超級(jí)計(jì)算機(jī)當(dāng)中,,有5臺(tái)(El Capitan、Frontier,、HPC6,、LUMI 和 Tuolumne)都是由AMD芯片提供支持的;有3臺(tái)(Aurora,、Eagle,、Leonardo)是由英特爾提供支持的;英偉達(dá)提供支持的有1臺(tái)(Alps),;日本超級(jí)計(jì)算機(jī)Fugaku則依賴Arm處理器富士通 A65FX 48c 2.2GHz ,。
同時(shí),速度最快的前十臺(tái)超級(jí)計(jì)算機(jī)當(dāng)中有 7 臺(tái)使用 Slingshot-11 互連(El Capitan,、Frontier,、Aurora、HPC6,、Alps,、LUMI 和 Tuolumne),而另外兩臺(tái)使用 Infiniband(Eagle 和 Leonardo),。Fugaku擁有自己專(zhuān)有的Tofu互連,。
德國(guó)超算JEDI位居能效榜第一
在評(píng)估高能效的Green500榜單上,德國(guó)的超級(jí)計(jì)算機(jī)JEDI位居第一,。JEDI 是一款 BullSequana XH3000 機(jī)器,,配備 Grace Hopper 超級(jí)芯片 72c 2GHz、NVIDIA GH200 超級(jí)芯片,、四軌 NVIDIA InfiniBand NDR200,、 并且總共有 19,584 個(gè)內(nèi)核。雖然在TOP500性能榜單中排名第 224 位,,但能夠達(dá)到 72.73 GFlops/W 的能效評(píng)級(jí),。
相比之下El Capitan 在滿負(fù)荷使用時(shí)消耗 >35 MW 的功率,并提供 58.89 GFlops/W,,在 Green500 最高效超級(jí)計(jì)算機(jī)排名中排名第 18 位,。
從Top500組織公布的系統(tǒng)供應(yīng)商來(lái)看,聯(lián)想以高達(dá)162臺(tái)(32.4%)的擁有數(shù)量牢牢占據(jù)著全球Top500超算榜單第一的位置,。緊隨其后的是HPE,,數(shù)量為115臺(tái)(23%)。
國(guó)產(chǎn)超算可進(jìn)入全球前五
需要指出的是,,雖然 El Capitan 現(xiàn)在是世界上已知最快的超級(jí)計(jì)算機(jī),,但是由于中國(guó)已決定不再參加Top500的HPL基準(zhǔn)測(cè)試,,實(shí)際上已經(jīng)擁有比之前的“神威太湖之光”更強(qiáng)的超級(jí)計(jì)算機(jī),但是由于一些仍處于保密狀態(tài),,因此無(wú)法進(jìn)行比較,。
不過(guò),在11月15日于北京舉行的第六屆中國(guó)超級(jí)算力大會(huì)(ChinaSC 2024)會(huì)上,,中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專(zhuān)業(yè)委員會(huì)聯(lián)合中國(guó)工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會(huì)高性能計(jì)算與數(shù)學(xué)軟件專(zhuān)業(yè)委員會(huì),、中國(guó)智能計(jì)算產(chǎn)業(yè)聯(lián)盟共同發(fā)布了2024中國(guó)高性能計(jì)算機(jī)(HPC)性能TOP100榜單。
在該榜單上,,一臺(tái)由某服務(wù)器供應(yīng)商研制,、部署于某超算中心的主機(jī)系統(tǒng)以487.94PFLOPS(約48.79億億次每秒)的測(cè)試性能蟬聯(lián)第一。該主機(jī)系統(tǒng)采用CPU+GPU異構(gòu)眾核架構(gòu),,CPU核數(shù)達(dá)到1597萬(wàn)核,,系統(tǒng)峰值達(dá)到620 PFLOPS,。而此前曾多年“霸榜”的兩臺(tái)熟悉面孔——“神威·太湖之光”和“天河二號(hào)A”,,在今年的榜單中分列第四和第六位。
如果按照487.94PFLOPS的成績(jī)來(lái)對(duì)比,,該國(guó)產(chǎn)超級(jí)計(jì)算機(jī)則可以排在全球Top500超算榜單的第五位,。