在昨日舉行的ISC 2019國際超算大會上,,全球超算500強出爐,中國超算失榜首但在數(shù)量上以219臺蟬聯(lián)第一,,遠超過美國116臺,,而美國Summit以20億億次運算速度暫奪世界超級計算機領(lǐng)域的頭把交椅,,據(jù)悉,這臺超級計算機搭載的近28000塊NVIDIA GPU提供了95%的計算力,。
現(xiàn)如今,超級計算機領(lǐng)域已開始向百萬兆級計算規(guī)模進擊,。美國目前在建的Aurora及Frontier中包括加速器等主要硬件分別由Intel及AMD提供,。NVIDIA也不甘缺席,在本屆超算大會上宣布,,將利用其芯片與Arm的處理器打造超級計算機,,進一步推動英偉達開發(fā)用于氣候變化預測和核武器建模的系統(tǒng)。NVIDIA支持Arm CPU,,或為高性能計算行業(yè)構(gòu)建節(jié)能,、支持AI的百萬兆級超算開辟全新途徑。
Arm具備足夠?qū)嵙M擊Exascale超算領(lǐng)域
英國Arm公司是全球領(lǐng)先的半導體知識產(chǎn)權(quán)(IP)供應商,, 于2016年被日本軟銀集團(SoftBank)以234億英鎊(約合310億美元)高價收購,,該公司為大多數(shù)手機芯片提供底層處理器技術(shù)。
但Arm處理器與英特爾或IBM芯片的不同之處在于,,Arm本身并不制造芯片,。相反,它將底層技術(shù)授權(quán)出去,,這樣其他人就可以自主制造芯片,。華為、蘋果,、三星,、高通、飛利浦等各大芯片廠商們都從Arm那里購買授權(quán),,全球超90%的智能設備均采用Arm架構(gòu),,包括手機、平板,、手表,、電視、無人機等,。
在超大規(guī)模數(shù)據(jù)中心和高性能計算的服務器市場,,英特爾x86處理器長期占據(jù)主導地位, 隨著Arm處理器的崛起,傳統(tǒng)x86 CPU市場面臨著巨大的威脅,。
經(jīng)過多年發(fā)展,,很多面向高性能計算的應用及AI框架也支持了Arm指令集架構(gòu),同時目前Arm內(nèi)核的性能也大幅提高,。和其他架構(gòu)相比,,Arm的一大特色在于出色的能效,,它能夠為超級計算機提供開放式架構(gòu),因此用戶可以添加各種有益于超級計算的技術(shù),,例如緊密集成,。
一直以來,Arm都在尋求機會將其處理器擴展至高性能計算領(lǐng)域,。2016年8月宣布將與日本富士通公司合作,,開發(fā)一個以64位ARMv8-A驅(qū)動的Post K超級計算機;同年12月宣布收購Allinea Software公司,后者主要為超級計算機提供性能分析工具;2018年6月,,美國能源部下屬的桑迪亞國家實驗室宣布建造基于Arm處理器的超算Astra,,并于同年11月現(xiàn)身TOP500列表;于此同時,Cray在英國氣象局交付了一臺基于Arm的超級計算機Isambard;而且日本的下一代超級計算機Post-K也同樣基于Arm架構(gòu),。
就美國超級計算機Astra為什么選擇Arm,,制造方惠普稱“Arm服務器在功耗方面更加經(jīng)濟,可以打包的更加緊密,,且惠普青睞該平臺的內(nèi)存性能,。”
而且如中國的飛騰等公司已經(jīng)使用ARMv8指令集設計出了FT-2000+/64處理器,,Arm加入Exascale超算領(lǐng)域其實力已然足夠,。
據(jù)悉,全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,,包括歐洲處理器計劃(European Processor Initiative),、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等,。
NVIDIA將支持Arm CPU打造超級計算機
長期以來,,NVIDIA始終以為PC提供圖形芯片而聞名,以使視頻游戲看起來更逼真,。近些年來NVIDIA在AI新興領(lǐng)域投入巨大,,其CUDA加速計算實力不可小覷,因而日益成長為數(shù)據(jù)中心市場的佼佼者,。
NVIDIA的CUDA GPU芯片被用于與英特爾,、IBM等公司的中央處理器(CPU)協(xié)同工作,完成大規(guī)模并行計算的加速任務,。昨日發(fā)布的Green500排行榜,,在全球最節(jié)能的25款超級計算機中,有22款都得益于NVIDIA的支持,。
而實現(xiàn)這些的關(guān)鍵因素在于:采用NVIDIAGPU的超級計算機能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級計算集群的處理;以及NVIDIA發(fā)明的SXM3D封裝和可實現(xiàn)極密集型擴展節(jié)點的NVIDIA NVLink互連技術(shù),。
據(jù)了解,NVIDIA與Arm有10年的合作基礎,,此前,,NVIDIA幾款用于便攜式游戲,、自動駕駛汽車、機器人和嵌入式AI計算的系統(tǒng)級芯片產(chǎn)品都采用了Arm,。對于此次雙方推進在在超算領(lǐng)域的合作,,NVIDIA解決方案架構(gòu)與工程團隊副總裁Marc Hamilton表示,NVIDIA和Arm已為這個計劃準備了兩年左右,,現(xiàn)在是最佳的發(fā)布時機,。
盡管英偉達加速計算部門副總裁伊恩·巴克(Ian Buck)表示,從技術(shù)角度看,,建造配有Arm處理器的超級計算機將是一個“嚴峻的考驗”,。但他坦言,,英偉達之所以這么做,,是因為歐洲和日本的研究人員希望利用Arm的技術(shù)開發(fā)超級計算芯片,這實際上為他們提供了超越IBM和英特爾的第三種選擇,,他們可以在這方面擁有更多控制權(quán),。
談及Arm的技術(shù)時,巴克表示,,“這種開放性使得Arm的技術(shù)非常有吸引力,,它能夠為超級計算提供一個開放式架構(gòu),這也是我們宣布支持Arm的原因,?!?/p>
據(jù)悉,NVIDIA將于今年年底前向Arm生態(tài)系統(tǒng)提供全堆棧的AI,、HPC軟件,,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫,、GPU加速的AI框架和軟件開發(fā)工具,,比如支持OpenACC的PGI編譯器和性能分析器。
堆棧優(yōu)化完成后,,NVIDIA將為所有主要CPU架構(gòu)提供加速,,至此,NVIDIA將完成了在x86,、POWER(OpenPower)及Arm多種處理器指令集體系結(jié)構(gòu)上構(gòu)建超算,。對于Arm而言,通過將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),,將進一步助推其在HPC服務器市場的創(chuàng)新,。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實現(xiàn)大幅提升,,以達到百萬兆級,?!?/p>
對于NVIDIA CUDA架構(gòu)向Arm的開放,超級計算中心,、系統(tǒng)提供商和系統(tǒng)級芯片制造商,,包括Ampere Computing、Cray,、CSC,、EPI、HPE,、Julich,、Marvell、Mellanox,、日本物理化學研究所計算科學研究中心等,,均認為該舉有利于解決HPC行業(yè)日益不可持續(xù)的功耗水平問題。
作為促進科學發(fā)現(xiàn)的重要工具,,超級計算機已挺進“百萬兆級”,。在這個賽道上,如今又迎來了一位新的重量級選手,。NVIDIA 能否將 CUDA和Arm的軟件生態(tài)無縫銜接, 為高性能計算行業(yè)構(gòu)建節(jié)能,、支持AI的百萬兆級超算開辟全新途徑,值得觀望,。