NVIDIA公布DGX SuperPOD ,, 全球排名第22位的超級(jí)計(jì)算機(jī)
NVIDIA今日公布的全球速度排名第22位的超級(jí)計(jì)算機(jī) - DGX SuperPOD,,清晰地詮釋了為何人工智能的領(lǐng)先地位需要由最佳的計(jì)算能力來支持。 DGX SuperPOD為滿足企業(yè)的自動(dòng)駕駛汽車部署項(xiàng)目提供了所需的人工智能基礎(chǔ)設(shè)施,。
該超級(jí)計(jì)算機(jī)系統(tǒng)的搭建,,僅用時(shí)3個(gè)星期,采用了96臺(tái)NVIDIA DGX-2H超級(jí)計(jì)算機(jī)與Mellanox互聯(lián)技術(shù),。其處理能力高達(dá)9.4 petaflops,,能夠用于訓(xùn)練安全自動(dòng)駕駛汽車所需要的海量深度神經(jīng)網(wǎng)絡(luò)。
基于DGX SuperPOD的設(shè)計(jì),,客戶可通過任意DGX-2合作伙伴購買整套超級(jí)計(jì)算機(jī)系統(tǒng),,或者其中的一部分。
自動(dòng)駕駛汽車的人工智能訓(xùn)練可以說得上是密集型計(jì)算密的終極挑戰(zhàn),。
一臺(tái)數(shù)據(jù)收集車輛每小時(shí)能生成1 TB數(shù)據(jù),。整個(gè)車隊(duì)經(jīng)過數(shù)年行駛后,,其數(shù)據(jù)量將會(huì)很快達(dá)到幾PB(千兆兆字節(jié))的量級(jí),。這些數(shù)據(jù)會(huì)被用來根據(jù)道路規(guī)則對(duì)算法進(jìn)行訓(xùn)練,并且還會(huì)被用來找出車輛內(nèi)運(yùn)行的深度神經(jīng)網(wǎng)絡(luò)的潛在故障,,然后在連續(xù)的循環(huán)中再次訓(xùn)練,。
NVIDIA人工智能基礎(chǔ)設(shè)施副總裁Clement Farabet表示:“若要保持人工智能領(lǐng)先地位,則需要在計(jì)算基礎(chǔ)設(shè)施方面保持領(lǐng)先,。很少有像訓(xùn)練自動(dòng)駕駛汽車這樣對(duì)人工智能又如此之高的需求,,其需要對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)萬次的反復(fù)訓(xùn)練,以滿足極高的精度需求,。對(duì)于如此大規(guī)模處理能力而言,,DGX SuperPOD無可替代?!?/p>
DGX SuperPOD內(nèi)含1,536顆NVIDIA V100 Tensor Core GPU,,由NVIDIA NVSwitch及 Mellanox網(wǎng)絡(luò)結(jié)構(gòu)相聯(lián)接,為其提供強(qiáng)力支持,,使其能夠以同等大小的超級(jí)計(jì)算機(jī)所無可匹敵的性能處理數(shù)據(jù),。
該套系統(tǒng)能夠不間斷運(yùn)行,優(yōu)化自動(dòng)駕駛軟件,,并以前所未有的周轉(zhuǎn)時(shí)間(turnaround time)反復(fù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),。
例如,DGX SuperPOD軟硬件平臺(tái)能夠在不到2分鐘的時(shí)間之內(nèi)完成ResNet-50訓(xùn)練,。在2015年,,該人工智能模型推出的時(shí)候,即便采用當(dāng)時(shí)最先進(jìn)的系統(tǒng) – 單顆NVIDIA K80 GPU,,也需要25天才能了完成訓(xùn)練任務(wù),。而DGX SuperPOD生成結(jié)果的速度較之加快了18,000倍,。
具備同等性能的其他TOP500超級(jí)計(jì)算機(jī)系統(tǒng)都由數(shù)千臺(tái)服務(wù)器構(gòu)建而成,而DGX SuperPOD占地面積更少,,其體積比這些同等系統(tǒng)小400倍左右,。
如今,NVIDIA DGX系統(tǒng)已經(jīng)被眾多有著大規(guī)模計(jì)算需求的企業(yè)機(jī)構(gòu)所采用,,例如寶馬,、Continental、福特與Zenuity 等汽車公司,,還有Facebook,、微軟與富士膠片等公司,以及日本理化學(xué)研究所與美國能源部實(shí)驗(yàn)室等研究領(lǐng)域的領(lǐng)導(dǎo)者,。
參考架構(gòu),,構(gòu)建你自己的SuperPOD
DGX SuperPOD不僅能夠快速運(yùn)行深度學(xué)習(xí)模型。
得益于其模塊化和企業(yè)級(jí)設(shè)計(jì),,該系統(tǒng)還能夠以極快的速度完成部署,。
其他同等規(guī)模的系統(tǒng)通常需要6-9個(gè)月才能完成部署畢,而對(duì)于DGX SuperPOD而言,,在工程師采用經(jīng)過驗(yàn)證的規(guī)范性方法情況下,,其僅需3個(gè)星期即可部署完畢。
通過構(gòu)建像DGX SuperPOD這樣的超級(jí)計(jì)算機(jī),,使NVIDIA從中學(xué)會(huì)了如何設(shè)計(jì)面向大規(guī)模人工智能機(jī)器的系統(tǒng),。這是超級(jí)計(jì)算機(jī)技術(shù)領(lǐng)域內(nèi)的一大進(jìn)步,這讓大規(guī)模計(jì)算能力得以跨出學(xué)術(shù)界,,為那些想要使用高性能計(jì)算加快其各種計(jì)劃的交通運(yùn)輸公司及其他行業(yè)所用,。
對(duì)于那些還沒有部署人工智能的數(shù)據(jù)中心的企業(yè)機(jī)構(gòu)而言,如果他們希望使用NVIDIA SuperPOD架構(gòu)來滿足其需求,,NVIDIA則可以通過DGX-Ready Data Center計(jì)劃為其提供簡(jiǎn)單化快速的部署,。
NVIDIA的數(shù)據(jù)中心托管服務(wù)提供商將隨時(shí)幫助企業(yè)客戶構(gòu)建并部署基于DGX系統(tǒng)的世界級(jí)人工智能數(shù)據(jù)中心。
創(chuàng)新始于內(nèi)部
在NVIDIA推出的自研系統(tǒng)當(dāng)中,,DGX SuperPOD不是其中唯一一個(gè)出現(xiàn)在全球最快速超級(jí)計(jì)算機(jī)TOP500榜單上的系統(tǒng),。
NVIDIA于2016年推出的SATURNV系統(tǒng)此前就曾率先登上了Green500榜首位置,其被視作全球最經(jīng)濟(jì)高效的系統(tǒng),,在TOP500榜單排名第28位,。
隨后,SATURNV Volta(由NVIDIA DGX-1系統(tǒng)提供支持)與DGX-2H POD也因其強(qiáng)大性能與高能效而得到認(rèn)可,。
在Green500最新榜單上的25強(qiáng)超級(jí)計(jì)算機(jī)中,,有22套都采用了基于NVIDIA GPU的設(shè)備。