2024年11月18日,,在“2024 年超級計算”大會上,Top500組織公布了全球最強超算Top500榜單,。其中,,位于美國勞倫斯利弗莫爾國家實驗室 (LLNL)的由 AMD 提供支持的 El Capitan 以 1.742 exaflops 的峰值性能成為目前地球上已知的最快的超級計算機,。這也是AMD支持的超級計算機第六次登頂全球超算Top500榜單。
據(jù)介紹,,El Capitan超級計算機位于勞倫斯利弗莫爾國家實驗室 (LLNL),,由 AMD Instinct MI300A APU 提供支持,由惠普企業(yè) (HPE) 打造,。該系統(tǒng)擁有11136 個節(jié)點,,其中包含 44544 個 AMD 的 MI300A、主內存容量高達5.4PB,。此外還有一個近節(jié)點存儲子系統(tǒng),。
具體來說,MI300A 芯片是 AMD 投入生產的最大的AI芯片,,其內部擁有多達13個小芯片,,其中GPU是新一代的CDNA 3架構,并集成了24個Zen 4 CPU內核,,配置了8個共計128GB的HBM3內存,。均基于臺積電5nm或6nm制程工藝(CPU/GPU計算核心為5nm,,HBM內存和I/O等為6nm),總共集成1460 億個晶體管,。這也意味著擁有11136 個節(jié)點的El Capitan 擁有 11,039,616 個計算內核 (CPU+GPU),,分布在 44,544 個 AMD MI300A 處理器上。
根據(jù)最新的全球超算Top500 榜單,,El Capitan的高性能 Linpack (HPL)得分為 1.742 exaflops,,即每秒1.742萬億次運算,這比Top500超算榜單中的第二名Frontier快了45%,。
AMD表示,,El Capitan 是世界上最強大的超級計算機,也是美國國家核安全管理局(NNSA)的第一臺百萬兆級計算機,,是NNSA三家實驗室(LLNL,、洛斯阿拉莫斯和桑迪亞國家實驗室)的首要計算資源。它將用于推進科學發(fā)現(xiàn)和國家安全,,提供必要的巨大計算能力,,以確保國家核威懾的安全性、保障性和可靠性,,而無需測試。這個最先進的系統(tǒng)標志著 HPC 的巨大飛躍,,實現(xiàn)了前所未有的建模和仿真功能,,這對于 NNSA 的庫存管理計劃至關重要,該計劃可以認證老化的核庫存,,以及其他關鍵的核安全任務,,例如防擴散和反恐。
“我們很高興看到 El Capitan 成為全球第二臺打破 exaflop 障礙并成為世界上最快的超級計算機,。這款開創(chuàng)性的機器展示了 AMD Instinct MI300 APU 令人難以置信的性能和效率,,證明了 AMD、LLNL 和 HPE 之間的專注工作,,“AMD 執(zhí)行副總裁兼總經理 Forrest Norrod 說,。“在 AMD,,我們正在以領先的性能和功能推動計算的未來,,這些性能和功能將繼續(xù)定義未來幾年 HPC 和 AI 的融合?!?/p>
LLNL 高級仿真和計算項目主任 Rob Neely 表示:“El Capitan 對美國國家核安全局的核心任務至關重要,,它極大地增強了我們執(zhí)行大型高保真 3D 仿真集合的能力,這些仿真可以解決任務面臨的復雜科學挑戰(zhàn),?!?/p>
LLNL 的 Livermore Computing 首席技術官 Bronis R. de Supinski 補充道:“利用 AMD Instinct MI300A APU,,我們構建了一個曾經難以想象的系統(tǒng),在保持卓越能效的同時突破了計算性能的絕對界限,。隨著 AI 在我們的領域越來越普遍,,El Capitan 使我們能夠將 AI 與傳統(tǒng)的模擬和建模工作負載集成,為跨各個科學學科的發(fā)現(xiàn)開辟新的途徑,?!?/p>
排名第二的超級計算機是Frontier,它位于美國橡樹嶺國家實驗室,,也是由 AMD EPYC CPU 和 AMD Instinct GPU 提供支持,,是世界上第二快的計算機,性能為 1.35 exaflops,,比之前提交的 1.194 有所增加,。Rpeak 也從 1.714 exaflops 增加到 2.055 exaflops。
排名第三的超級計算機是 Aurora,,其位于美國伊利諾伊州的阿貢國家實驗室,,其在完整安裝完畢的狀態(tài)下,內部將整合21248個Intel Xeon Max系列CPU,、63744個Intel Max系列GPU,、20.42PB內存,峰值性能號稱可達 2 EFlop / s,,遠超 Frontier,。
但是,美國能源部沒有為英特爾的 Aurora 提交新的基準測試,。其6月前的提交的數(shù)據(jù)是1.012 exaflop/s的HPL性能,,雖然相比首次上榜時(當時未全部安裝完成)性能幾乎翻了一倍,基準測試運行僅占系統(tǒng)的87%,。當時,,英特爾表示 Aurora 存在許多硬件問題,包括硬件和冷卻系統(tǒng)故障,、操作錯誤和網絡不穩(wěn)定,。
Aurora 沒有提交新的數(shù)據(jù),這意味著一些問題尚未得到完全解決,。不過,,Aurora 仍然引領著以 AI 為中心的 HPL-MxP 混合精度基準測試,使其成為世界上已知最快的 AI 超級計算機,,具有 10.6 AI Exaflops 的性能,。
需要指出的是,此外,,El Capitan系統(tǒng)是基于HPE的Shasta 架構構建的 ,,該架構由高密度液冷 EX4000 機柜和與 Slingshot-11 網絡互連綁定在一起的 EX225a 加速器刀片組成,。該平臺也為另外兩臺百萬兆次級超級計算機Frontier和Aurora提供支持。這使得HPE的系統(tǒng)在 Top500 名單上占據(jù)了前三名,,而這三個系統(tǒng)都是該名單上的E級超算系統(tǒng),。
排名第四的超算是Eagle,其安裝在微軟的 Azure 云服務基礎設施中,,該系統(tǒng)基于英特爾 Xeon Platinum 8480C 處理器和英偉達H100 加速器,,并實現(xiàn)了 561 Petaflop/s 的 HPL 分數(shù)。
排名第五的超算是HPC6,,安裝在意大利 Ferrera Erbognone 的 Eni S.p.A 中心,。它是另一款 HPE Cray EX235a 系統(tǒng),采用針對 HPC 和 AI 優(yōu)化的第 3 代 AMD EPYC CPU,、AMD Instinct 250X 加速器和 Slingshot-11 互連,,性能達到了 477.9 Petaflop/s。
事實上,,Top500榜單中,,速度最快的前十臺超級計算機當中,有5臺(El Capitan,、Frontier,、HPC6、LUMI 和 Tuolumne)都是由AMD芯片提供支持的,;有3臺(Aurora,、Eagle、Leonardo)是由英特爾提供支持的,;英偉達提供支持的有1臺(Alps);日本超級計算機Fugaku則依賴Arm處理器富士通 A65FX 48c 2.2GHz ,。
同時,,速度最快的前十臺超級計算機當中有 7 臺使用 Slingshot-11 互連(El Capitan、Frontier,、Aurora,、HPC6、Alps,、LUMI 和 Tuolumne),,而另外兩臺使用 Infiniband(Eagle 和 Leonardo)。Fugaku擁有自己專有的Tofu互連,。
德國超算JEDI位居能效榜第一
在評估高能效的Green500榜單上,,德國的超級計算機JEDI位居第一。JEDI 是一款 BullSequana XH3000 機器,,配備 Grace Hopper 超級芯片 72c 2GHz,、NVIDIA GH200 超級芯片,、四軌 NVIDIA InfiniBand NDR200、 并且總共有 19,584 個內核,。雖然在TOP500性能榜單中排名第 224 位,,但能夠達到 72.73 GFlops/W 的能效評級。
相比之下El Capitan 在滿負荷使用時消耗 >35 MW 的功率,,并提供 58.89 GFlops/W,,在 Green500 最高效超級計算機排名中排名第 18 位。
從Top500組織公布的系統(tǒng)供應商來看,,聯(lián)想以高達162臺(32.4%)的擁有數(shù)量牢牢占據(jù)著全球Top500超算榜單第一的位置,。緊隨其后的是HPE,數(shù)量為115臺(23%),。
國產超算可進入全球前五
需要指出的是,,雖然 El Capitan 現(xiàn)在是世界上已知最快的超級計算機,但是由于中國已決定不再參加Top500的HPL基準測試,,實際上已經擁有比之前的“神威太湖之光”更強的超級計算機,,但是由于一些仍處于保密狀態(tài),因此無法進行比較,。
不過,,在11月15日于北京舉行的第六屆中國超級算力大會(ChinaSC 2024)會上,中國計算機學會高性能計算專業(yè)委員會聯(lián)合中國工業(yè)與應用數(shù)學學會高性能計算與數(shù)學軟件專業(yè)委員會,、中國智能計算產業(yè)聯(lián)盟共同發(fā)布了2024中國高性能計算機(HPC)性能TOP100榜單,。
在該榜單上,一臺由某服務器供應商研制,、部署于某超算中心的主機系統(tǒng)以487.94PFLOPS(約48.79億億次每秒)的測試性能蟬聯(lián)第一,。該主機系統(tǒng)采用CPU+GPU異構眾核架構,CPU核數(shù)達到1597萬核,,系統(tǒng)峰值達到620 PFLOPS,。而此前曾多年“霸榜”的兩臺熟悉面孔——“神威·太湖之光”和“天河二號A”,在今年的榜單中分列第四和第六位,。
如果按照487.94PFLOPS的成績來對比,,該國產超級計算機則可以排在全球Top500超算榜單的第五位。