Xilinx 推出史上最強(qiáng)大加速器卡 Alveo U55C ,專為 HPC 與大數(shù)據(jù)工作負(fù)載打造
2021-11-18
來源:Xilinx
2021 年 11 月 16 日,中國(guó)北京———自適應(yīng)計(jì)算的領(lǐng)先企業(yè)賽靈思公司(Xilinx, Inc.,,(NASDAQ: XLNX))今日在全球超級(jí)計(jì)算大會(huì)( SC21 )上宣布,,推出 Alveo? U55C 數(shù)據(jù)中心加速器卡,,以及一款基于標(biāo)準(zhǔn)、API-driven 的集群解決方案,,用于大規(guī)模部署 FPGA,。Alveo U55C 加速器可為高性能計(jì)算( HPC )和數(shù)據(jù)庫(kù)工作負(fù)載提供卓越的單位功耗性能,同時(shí)還能通過賽靈思? HPC 集群解決方案簡(jiǎn)便擴(kuò)展,。
圖:Xilinx Alveo U55C 加速器卡
全新Alveo U55C 卡專為 HPC 和大數(shù)據(jù)工作負(fù)載而構(gòu)建,,是賽靈思史上最強(qiáng)大的 Alveo 加速器卡,能夠提供 Alveo 加速器產(chǎn)品系列中的最高計(jì)算密度和 HBM 容量,。結(jié)合賽靈思基于 RoCE v2 的全新集群解決方案,,可令運(yùn)行大規(guī)模計(jì)算工作負(fù)載的各類客戶大獲裨益,支持其利用現(xiàn)有數(shù)據(jù)中心基礎(chǔ)架構(gòu)和網(wǎng)絡(luò),,實(shí)現(xiàn)強(qiáng)大的基于 FPGA 的 HPC 集群,。
賽靈思執(zhí)行副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理 Salil Raje 表示:“現(xiàn)在,針對(duì)目標(biāo) HPC 工作負(fù)載擴(kuò)展 Alveo 計(jì)算能力比以往更簡(jiǎn)單,、更高效,、更強(qiáng)大。在架構(gòu)層面,,以 Alveo 卡為代表的 FPGA 加速器,,能夠以最低成本為眾多計(jì)算密集型工作負(fù)載提供最高性能。我們引入了基于標(biāo)準(zhǔn)的方法,,其支持利用客戶的現(xiàn)有基礎(chǔ)架構(gòu)和網(wǎng)絡(luò)創(chuàng)建 Alveo HPC 集群,。借助這一方法,我們正將這些主要優(yōu)勢(shì)大規(guī)模應(yīng)用于任意數(shù)據(jù)中心,。這是實(shí)現(xiàn) Alveo 和自適應(yīng)計(jì)算在數(shù)據(jù)中心更廣泛應(yīng)用的一次重大飛躍,。”
專為 HPC 和大數(shù)據(jù)應(yīng)用打造
Alveo U55C 卡融合了當(dāng)前 HPC 工作負(fù)載所需的眾多關(guān)鍵特性。它能提供更高的數(shù)據(jù)流水線并行度,、卓越的存儲(chǔ)器管理,、優(yōu)化的整個(gè)流水線的數(shù)據(jù)遷移,以及 Alveo 產(chǎn)品系列中最高的單位功耗性能,。 Alveo U55C 卡采用單插槽,、全高半長(zhǎng)( FHHL )外形尺寸,最大功耗低至 150W,。與前一代雙插槽Alveo U280 卡相比,,Alveo U55C 提供了優(yōu)異的計(jì)算密度,還將 HBM2 容量翻倍至 16GB,。U55C 以更小的外形尺寸提供了更高的算力,,有助于創(chuàng)建基于 Alveo 加速器的密集集群。它專為需要性能擴(kuò)展的高密度流式數(shù)據(jù),、高 I/O 數(shù)學(xué)和大型計(jì)算問題而開發(fā),,例如大數(shù)據(jù)分析和 AI 應(yīng)用。
圖:Xilinx Alveo U55C 加速器卡
通過利用 RoCE v2 和數(shù)據(jù)中心橋接技術(shù),,再結(jié)合 200 Gbps 帶寬,,這款 API-driven 的集群解決方案使 Alveo 網(wǎng)絡(luò)可在性能和時(shí)延方面媲美 InfiniBand 網(wǎng)絡(luò),且無需對(duì)廠商加鎖,。MPI (信息傳遞接口)集成功能使 HPC 開發(fā)人員能以賽靈思 Vitis? 統(tǒng)一軟件平臺(tái)擴(kuò)展 Alveo 數(shù)據(jù)流水線,。利用現(xiàn)有開放標(biāo)準(zhǔn)和框架,現(xiàn)在能跨數(shù)百?gòu)?nbsp;Alveo 卡上進(jìn)行性能擴(kuò)展,,無需考慮服務(wù)器平臺(tái)和網(wǎng)絡(luò)基礎(chǔ)架構(gòu),,同時(shí)還能共享工作負(fù)載和存儲(chǔ)器。
借助面向應(yīng)用和集群的高層次編程,,軟件開發(fā)者和數(shù)據(jù)科學(xué)家能夠運(yùn)用 Vitis 平臺(tái),,解鎖 Alveo 和自適應(yīng)計(jì)算的優(yōu)勢(shì)。賽靈思大力投入于 Vitis 開發(fā)平臺(tái)和工具流程,,旨在令不具備硬件專業(yè)知識(shí)的軟件開發(fā)者和數(shù)據(jù)科學(xué)家,,也能更容易地使用自適應(yīng)計(jì)算。Vitis 平臺(tái)支持 Pytorch 和 Tensorflow 等主流 AI 框架,,還支持 C,、C++ 和 Python 等高層次編程語言,,使開發(fā)者能利用特定 API 和庫(kù)來構(gòu)建領(lǐng)域解決方案,,或者使用賽靈思軟件開發(fā)套件,從而在現(xiàn)有數(shù)據(jù)中心內(nèi)輕松加速關(guān)鍵 HPC 工作負(fù)載,。
HPC 客戶用例
CSIRO 是澳大利亞的國(guó)立研究機(jī)構(gòu),,擁有全球最大的射電天文望遠(yuǎn)鏡天線陣列。CSIRO現(xiàn)正使用 Alveo U55C 卡,,用于其平方公里陣列( Square Kilometer Array )射電望遠(yuǎn)鏡的信號(hào)處理,。將 Alveo 卡部署為配備 HBM 的網(wǎng)絡(luò)附加加速器,,能夠在整個(gè) HPC 信號(hào)處理集群中實(shí)現(xiàn)大規(guī)模吞吐量?;?nbsp;Alveo 加速器的集群使 CSIRO 能夠處理海量計(jì)算任務(wù),,從 13.1 萬根天線中實(shí)時(shí)聚合、過濾,、準(zhǔn)備和處理數(shù)據(jù),。420 張 Alveo U55C 卡通過支持 P4 語言的 100Gbs 交換機(jī)實(shí)現(xiàn)完全聯(lián)網(wǎng),在整個(gè)信號(hào)處理集群中提供了 460GBs 的 HBM2 帶寬,。Alveo U55C 集群的處理性能可達(dá) 15Tb/s 的總吞吐量,,功耗更低且更具成本效益,顯著節(jié)省了成本,。CSIRO 現(xiàn)正完成一項(xiàng) Alveo 參考設(shè)計(jì),,以助力其他射電天文學(xué)或相鄰產(chǎn)業(yè)獲得同樣的成功。
圖:Xilinx Alveo U55C 加速器卡
Ansys LS-DYNA 碰撞仿真軟件幾乎用于全球所有的汽車公司,。安全性和結(jié)構(gòu)系統(tǒng)的設(shè)計(jì)往往取決于模型性能,,因其能以計(jì)算機(jī)輔助設(shè)計(jì)有限元方法( FEM )仿真來降低物理碰撞測(cè)試的成本。FEM 求解器是驅(qū)動(dòng)具備數(shù)億個(gè)自由度仿真的主要算法,,而這些龐大的算法可以細(xì)分為更基本的求解器,,如 PCG、稀疏矩陣,、ICCG,。與 x86 CPU 相比,利用超并行數(shù)據(jù)流水線在大量 Alveo 卡上進(jìn)行性能擴(kuò)展,,LS-DYNA 能夠?qū)崿F(xiàn)超過 5 倍的性能加速,。這能在一個(gè) Alveo 流水線中提高單位時(shí)鐘周期的工作效率,令 LS-DYNA 客戶受益于突破性的仿真時(shí)間,。
Ansys 戰(zhàn)略合作伙伴總監(jiān) Wim Slagter 表示:“秉持不懈創(chuàng)新的精神,,我們很高興與賽靈思展開合作,在我們的 LS-DYNA 仿真應(yīng)用中大幅加速有限元求解器,,表征隱式有限元方法 90% 的負(fù)載特性,。我們期待在賽靈思加速的助力下,實(shí)現(xiàn)支持創(chuàng)新者設(shè)計(jì)未來的使命,?!?br/>
TigerGraph 是一家領(lǐng)先的圖分析平臺(tái)提供商,正使用多張 Alveo U55C 卡為兩種最高效算法進(jìn)行集群與加速,,以驅(qū)動(dòng)基于圖的推薦和集群引擎,。對(duì)于數(shù)據(jù)科學(xué)家而言,圖數(shù)據(jù)庫(kù)可謂一種顛覆性平臺(tái)。圖從信息孤島中采集數(shù)據(jù)并重點(diǎn)關(guān)注數(shù)據(jù)間的關(guān)系,。圖領(lǐng)域的下一個(gè)前沿是實(shí)時(shí)查找答案,。Alveo U55C 將推薦引擎的查詢和預(yù)測(cè)時(shí)間從數(shù)分鐘縮短至數(shù)毫秒。與基于 CPU 的集群相比,,使用多張 U55C 卡擴(kuò)展分析所提供的出色計(jì)算能力和存儲(chǔ)器帶寬,,可將圖查詢速度提升高達(dá) 45 倍。質(zhì)量評(píng)分也提升高達(dá) 35%,,從而顯著提升置信度,,將誤報(bào)幾率降至低個(gè)位數(shù)。
產(chǎn)品供貨與輕松評(píng)估
Alveo U55C 卡目前可通過 China.xilinx.com 和賽靈思授權(quán)分銷商購(gòu)買,。該產(chǎn)品還可通過基于公有云的 FaaS( FPGA-as-a-Service,,F(xiàn)PGA 即服務(wù) )供應(yīng)商進(jìn)行簡(jiǎn)便評(píng)估,也可以通過選定的托管數(shù)據(jù)中心進(jìn)行專屬預(yù)覽,。集群解決方案現(xiàn)已提供專屬預(yù)覽,,預(yù)計(jì)將于明年第二季度全面問世。
賽靈思將于本周舉辦的全球超級(jí)計(jì)算大會(huì)( SC21 )上展示 Alveo U55C 加速器卡及合作伙伴解決方案,。歡迎注冊(cè) SC21,,訪問賽靈思虛擬展臺(tái)。