近日,全球Top500組織在德國(guó)漢堡舉行的國(guó)際超算大會(huì)(ISC 2024)上,,正式發(fā)布了第63屆全球超級(jí)計(jì)算機(jī)Top500榜單,。
其中,美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室和AMD合作的Frontier以 1.206 EFlop/s的峰值性能排名第一,,美國(guó)阿貢國(guó)家實(shí)驗(yàn)室和Intel合作的Aurora則首次突破E級(jí)大關(guān),,以1.012 EFlop/s的峰值性能排名第二。
中國(guó)的超算依舊是無(wú)緣前十,,并且不再參與該HPL基準(zhǔn)測(cè)試,。
Frontier蟬聯(lián)第一,Aurora排名第二
在Top500超算榜單中,,前十大性能最強(qiáng)超級(jí)計(jì)算機(jī)的排名基本上與六個(gè)月前在SC23會(huì)議期間公布的排名保持一致,。
唯一的新進(jìn)前10的超級(jí)計(jì)算機(jī)是來(lái)自瑞士國(guó)家超級(jí)計(jì)算中心(CSCS)的Alps machine,排名第6名位
具體前十名單如下:
1,、Frontier以 1.206 EFlop/s的HPL性能繼續(xù)蟬聯(lián)第一,。
該超算位于美國(guó)田納西州的橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室(ORNL),由美國(guó)能源部(DOE)運(yùn)營(yíng),。其采用了HPE Cray EX235a架構(gòu),,2GHz AMD EPYC 64C CPU和AMD Instinct 250X GPU,共有8699904個(gè)CPU和GPU核心,,并借助于Slingshot 11網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,。此外,F(xiàn)rontier還具有高達(dá)52.59 GFlops/W的額定能效,,
2,、Aurora以1.012 Exaflop/s的HPL性能排名第二,。
相比去年首次上榜時(shí)(當(dāng)時(shí)未全部安裝完成)性能幾乎翻了一倍。該超算安裝在美國(guó)伊利諾伊州的阿貢國(guó)家實(shí)驗(yàn)室,,也是由美國(guó)能源部運(yùn)營(yíng),。
Aurora 基于HPE Cray EX網(wǎng)絡(luò),整合了21248個(gè)Intel Xeon Max系列CPU,、63744個(gè)Intel Max系列GPU,、20.42PB內(nèi)存,峰值性能號(hào)稱可達(dá) 2 EFlop / s,,遠(yuǎn)超 Frontier。
3,、Eagle以561.2PFlop/s的HPL性能排名第三,。
該超算安裝在微軟Azure云平臺(tái)上,并且它依然是Top500超算中最高排名的云計(jì)算系統(tǒng),。這款微軟NDv5系統(tǒng)的強(qiáng)大性能,,源于IntelXeon Platinum 8480C處理器和英偉達(dá)(NVIDIA) H100 GPU加速器的結(jié)合。
4,、Fugaku憑借其442 PFlop/s的HPL性能排名第四,。
該超算安裝在日本神戶的理研計(jì)算科學(xué)研究中心(R-CCS),基于 2.2GHz Fujitsu A64FX 48C處理器,,Tofu interconnect D互聯(lián),,共計(jì)擁有7630848個(gè)核心,繼續(xù)保持了美國(guó)以外地區(qū)排名最高的超級(jí)計(jì)算機(jī)的地位,。
5,、LUMI以379.7 PFlop/s的HPL性能排名第五。
該超算安裝在芬蘭CSC EuroHPC中心,,是歐洲最強(qiáng)的超級(jí)計(jì)算機(jī),,其基于HPE Cray EX235a系統(tǒng),AMD第三代EPYC 64C 2GHz處理器,,AMD Instinct MI250X加速器,,Slingshot-11網(wǎng)絡(luò)、
6,、Alps 以270 PFlop/s的HPL性能排名第六,。
該超算安裝于瑞士國(guó)家超級(jí)計(jì)算中心 (CSCS),基于HPE Cray 254n系統(tǒng)構(gòu)建的超算,,3.1GHz NVIDIA Grace 72C處理器,,NVIDIA GH200超級(jí)芯片,Slingshot-11網(wǎng)絡(luò)互聯(lián),。
7,、Leonardo以241.2PFlop/s的HPL性能排名第七。
該超算安裝在意大利CINECA的EuroHPC,基于Atos BullSequana XH2000系統(tǒng),,由IntelXeon Platinum CPU和NVIDIA A100加速器提供強(qiáng)大的計(jì)算能力,,還采用了四軌NVIDIA HDR100 Infiniband。
8,、MareNostrum 5 ACC以175.3PFlop/s的HPL性能排名第八,。
該超算安裝在西班牙的EuroHPC/巴塞羅那超級(jí)計(jì)算中心,基于BullSequana XH3000系統(tǒng),,采用了IntelXeon Platinum 8460Y處理器,、NVIDIA H100加速器以及Infiniband NDR200網(wǎng)絡(luò)連接技術(shù)。
9,、Summit以148.6PFlop/s的HPL性能排名第九,。
該超算是IBM公司在美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室建造的超級(jí)計(jì)算機(jī),擁有4356個(gè)節(jié)點(diǎn),,每個(gè)節(jié)點(diǎn)配備了兩個(gè)22核的3.07GHz IBM POWER9 CPU和六個(gè)NVIDIA Tesla V100 GPU,,每個(gè)GPU上集成了80個(gè)流式處理器(SM)。
10,、Eos以121.4PFlop/s的HPL性能排名第十,。
該超算是英偉達(dá)內(nèi)部使用的 DGX SuperPOD,由Xeon Platinum 8480C 56C 3.8GHz,,NVIDIA H100加速器共同驅(qū)動(dòng),,還采用了英偉達(dá)Infiniband NDR 400G交換機(jī)。
對(duì)于排名第二的Aurora超算實(shí)際測(cè)試性能僅1.012 ExaFlop/s,,遠(yuǎn)低于號(hào)稱性能最高可達(dá)2 EFlop/s的問(wèn)題,,阿貢國(guó)家實(shí)驗(yàn)室的副主任兼杰出研究員Rick Stevens表示,2 exaFLOPS這一數(shù)值是基于Aurora核心處理器數(shù)量與處理器峰值性能相乘得出的理論峰值,,但這并非負(fù)責(zé)維護(hù)和運(yùn)營(yíng)Aurora的阿貢系統(tǒng)經(jīng)理所設(shè)定的實(shí)際性能目標(biāo)或期望,。
Stevens解釋說(shuō):“峰值性能是一個(gè)通過(guò)計(jì)算得出的理論數(shù)字,它基于時(shí)鐘速率與單個(gè)計(jì)算元件運(yùn)算次數(shù)的乘積,。實(shí)際上,,典型的系統(tǒng)只能達(dá)到這個(gè)峰值的一小部分,這取決于它們所執(zhí)行的任務(wù),,通常在50%,、60%或70%之間。Aurora上標(biāo)稱的2 exaFlop/s峰值實(shí)際上是結(jié)合了GPU和CPU的FLOPS得出的,。在基準(zhǔn)測(cè)試中,,通常不會(huì)這樣做。如果查看Top500榜單中其他類似的系統(tǒng),,就會(huì)發(fā)現(xiàn)它們同樣擁有非常大的理論峰值,,但實(shí)際達(dá)到的峰值比例與Aurora類似,。因此,這并不是一個(gè)根本性的問(wèn)題,?!?/p>
Stevens表示,Aurora在基準(zhǔn)測(cè)試中應(yīng)該能夠?qū)崿F(xiàn)LINPACK性能的提升,,因?yàn)樵谧罱幕鶞?zhǔn)測(cè)試執(zhí)行時(shí),,Aurora 11%的計(jì)算能力尚未被激活。
他預(yù)測(cè),,當(dāng)整個(gè)系統(tǒng)安裝完成之后,,將會(huì)產(chǎn)生更高的基準(zhǔn)測(cè)試數(shù)據(jù)。然而,,他拒絕透露阿貢國(guó)家實(shí)驗(yàn)室對(duì)于Aurora在完全運(yùn)行狀態(tài)下的具體性能目標(biāo)數(shù)字,。
根據(jù)HPC-AI行業(yè)分析機(jī)構(gòu)Hyperion Research公司的首席執(zhí)行官Earl Joseph的預(yù)計(jì),隨著時(shí)間的推移和系統(tǒng)的進(jìn)一步調(diào)優(yōu),,Aurora最終將會(huì)超過(guò)1.5 exaFlop/s。
中國(guó)不再參加Top500的HPL基準(zhǔn)測(cè)試
在中國(guó)的國(guó)家級(jí)超算去年跌出Top500榜單前十之后,,依然無(wú)緣于最新的前十榜單,。
在去年的榜單上,中國(guó)的神威·太湖之光和天河二號(hào)A也進(jìn)入了前十五,,分別排名第11和第14位,。
Top500組織在最新發(fā)布的報(bào)告中指出,中國(guó)已決定不再參加Top500的HPL基準(zhǔn)測(cè)試,。
在最新的Top500名單中,,美國(guó)依然是擁有超級(jí)計(jì)算機(jī)數(shù)量最多的國(guó)家。美國(guó)在其之前的基礎(chǔ)上新增了7臺(tái)超級(jí)計(jì)算機(jī),,使得其總數(shù)達(dá)到了168臺(tái),。而中國(guó)則從104臺(tái)減少到了80臺(tái)。
Top500組織表示:“事實(shí)上,,中國(guó)在這份新名單上并未報(bào)告任何新加入的超級(jí)計(jì)算機(jī),。”
從大的區(qū)域變化來(lái)看,,北美地區(qū)依然保持領(lǐng)先地位,,從上一份榜單的160臺(tái)系統(tǒng)增加到171臺(tái)。而亞洲地區(qū)則出現(xiàn)了下滑,,從169臺(tái)系統(tǒng)減少到148臺(tái),。
與此同時(shí),歐洲地區(qū)實(shí)現(xiàn)了顯著的增長(zhǎng),,從143臺(tái)增加到160臺(tái),,位列北美地區(qū)之后,,成為了全球第二大超級(jí)計(jì)算機(jī)分布區(qū)域。
Intel拿下63%的處理器份額
Top500組織表示,,此次前500強(qiáng)的超算當(dāng)中,,采用Intel CPU的占比依然是高達(dá)63.00%,但低于六個(gè)月前的67.80%,。
相比之下,,前500強(qiáng)超算當(dāng)中,有156個(gè)系統(tǒng)(31.20%)使用的AMD處理器,,高于六個(gè)月前的28.00%,。
另外,還有194個(gè)超算系統(tǒng)使用了加速器/協(xié)處理器技術(shù),,高于六個(gè)月前的185個(gè),。其中有83個(gè)使用了NVIDIA Ampere GPU,48個(gè)使用NVIDIA Volta GPU,。
從總算力來(lái)看,,所有Top500超算的的總綜合性能從6個(gè)月前的7.01 ExaFlop/s(EFlop/s)提高到現(xiàn)在的8.21 ExaFlop/s。Top100的性能門檻達(dá)到了9.44 PFlop/s,。
從核心數(shù)量來(lái)看,,TOP500超算的平均并發(fā)級(jí)別達(dá)到了每個(gè)系統(tǒng)229426個(gè)內(nèi)核,高于六個(gè)月前的212027個(gè),。
Green 500超算
今年的超級(jí)計(jì)算機(jī)Green500榜單也有了顯著的變化,,前三名的綠色超級(jí)計(jì)算機(jī)均為新上榜者。
排名第一的是JEDI–JUPITER Exascale Development Instrument,,這臺(tái)超級(jí)計(jì)算機(jī)由德國(guó)的EuroHPC/FZJ開(kāi)發(fā),。在TOP500超級(jí)計(jì)算機(jī)排名中,JEDI位列第190位,,展現(xiàn)出了不俗的性能實(shí)力,。其能效評(píng)級(jí)高達(dá)72.73GFlop/W,HPL得分為4.5 PFlop/s,。JEDI是一款配備NVIDIA Grace Hopper Superchip 72C的BullSequana XH3000架構(gòu)的超級(jí)計(jì)算,,總共有19584個(gè)核心處理器。
英國(guó)布里斯托爾大學(xué)的Isambard-AI以68.83 GFlop/W能效評(píng)級(jí)和7.42 PFLop/s的HPL得分位居第二,。Isambard-AI在TOP500中排名第129位,,擁有34,272個(gè)核心處理器。
排名第三的是來(lái)自波蘭Cyfronet的Helios system,。該機(jī)器的能效得分為66.95GFlop/W HPL得分為19.14 PFlop/s,。
Top500組織在討論能源效率時(shí),還特別提到了Top500榜單第一的Frontier系統(tǒng),。Frontier系統(tǒng)取得了1.206EFlop/s的HPL成績(jī),,這一成績(jī)證明了其優(yōu)秀的計(jì)算能力,。同時(shí),F(xiàn)rontier在能源效率方面也表現(xiàn)出色,,獲得了56.97GFlop/W的分?jǐn)?shù),。這使得Frontier在Green500榜單中排名第11位,。