今年6月,最新的超算TOP 500榜單公布,美國能源部田納西州橡樹嶺國家實驗室 (Oak Ridge National Lab)推出的超級計算機(jī)“Summit” (頂點)奪得冠軍,,此前連續(xù)四屆占據(jù)TOP 500榜首的神威·太湖之光退居第二,。數(shù)據(jù)顯示,,Summit 20億億次的性能比神威·太湖之光高出60%,。雖然我國痛失超算榜首位置,但從上榜的超算總數(shù)上看,,中國以206臺位居第一,,占比超40%,而美國只有124臺??梢哉f,,雙方各有勝負(fù)。
美:長期占據(jù)榜首 芯片競爭優(yōu)勢明顯
在超級計算機(jī)的發(fā)展歷史中,,美國一直獨(dú)占鰲頭,,這不容否認(rèn)。只有在近幾年,,中國的超級計算實力奮起直追,,才可與之相爭。盡管如此,,在歷屆超級計算機(jī)榜單上,,美國擁有的機(jī)器數(shù)量大部分時間超過了中國,且美國在超級計算機(jī)排行榜TOP500中的總數(shù)量也居于全球首位,。
除數(shù)量外,,在超級計算機(jī)芯片領(lǐng)域,美國一直以來居于絕對的領(lǐng)先地位,。在十幾年前,,超級計算機(jī)芯片供應(yīng)商只有英特爾、IBM兩家公司,,英特爾與IBM型成了相對平衡雙寡頭局面。而之后AMD又參與了超級計算機(jī)芯片競爭,,2015年,,因美國開始對中國超級計算機(jī)領(lǐng)域施行芯片禁運(yùn),痛定思痛之后大力投入超級計算機(jī)研發(fā)工作,。然而現(xiàn)狀來看,,美國英特爾公司仍是全球芯片領(lǐng)域的老大,在最新TOP500榜單上的500臺超算中,,就有476臺使用英特爾的芯片,。
中:進(jìn)展神速 以自主研發(fā)突破困局
在2008年的全球500強(qiáng)超級計算機(jī)榜單里,前幾名被美國包攬,,而且前100名里中國一席身影都沒有,。這種狀況一直持續(xù)到2010年,深圳國家超算中心星云超級機(jī)實現(xiàn)了前100名零的突破,,一舉取得了世界第二的排名,。隨后這一情況勢如破竹,2011年,,中國天河1A超級計算機(jī)超過原排名第一的美國美洲虎系統(tǒng)取得了世界超級計算機(jī)的第一把交椅,。緊接著從2013年起,我國的超級計算機(jī)就一直占據(jù)著世界超級計算機(jī)排名的第一位。直至本次被美國“Summit”逆襲,。但這一敗績不會持續(xù)太久,,此前5月在天津舉辦的第二屆世界智能大會上,中國國家超算天津中心對外展示了我國新一代百億億次超級計算機(jī)“天河三號”原型機(jī),,有望在2020年研制成功并重回超算榜首,。
除了TOP500榜單的冠軍的爭奪,在上榜超級計算機(jī)的數(shù)量上,,中國的優(yōu)勢也在持續(xù)擴(kuò)大,。最新榜單顯示,500臺超級計算機(jī)中,,中國以206臺位居第一,,占比超40%,而美國只有124臺,。
而且,,我國的超級計算機(jī),在自主可控方面的發(fā)展取得巨大進(jìn)展,。我國超算最高性能的代表,,神威·太湖之光全部使用 “申威26010”處理器,搭載神威睿思操作系統(tǒng),,實現(xiàn)軟件和硬件全部國產(chǎn)化,;天河一號、天河二號,、天河三號全部采用的是國產(chǎn)CPU,。(天河一號剛出來奪得世界第一,當(dāng)時確實是用英特爾處理器,,后來美國對高端芯片禁止出口,,天河一號也全換成國產(chǎn)處理器。)
下一代超算:需解決并行計算和異構(gòu)計算兩大難題
面對中美在超算上的競爭,歐盟,、日本,、加拿大等都不愿意屈居人后,紛紛布局下一代超算,做技術(shù)儲備。
不少人認(rèn)為,構(gòu)建超級計算機(jī)就是在做芯片處理的加法,處理器(CPU)越多,計算速度也就越快,。事實并非如此,。打個比方,三人共同協(xié)作完成任務(wù),除去正常開展任務(wù)工作外,還需要耗費(fèi)人力進(jìn)行任務(wù)分解、任務(wù)分配,、結(jié)果歸總等管理工作,。管理工作不科學(xué),總體工作效率會大幅降低。所以,和普通計算機(jī)相比,超級計算機(jī)還有并行計算和異構(gòu)計算兩大難題需要解決,。
并行計算是指同時使用多種計算資源解決計算問題的過程,是提高計算機(jī)系統(tǒng)計算速度和處理能力的一種有效手段,。它的基本思想是用多個處理器來協(xié)同求解同一問題,即將被求解的問題分解成若干個部分,各部分均由一個獨(dú)立的處理機(jī)來并行計算。并行計算的目的是為了加快求解速度,擴(kuò)大求解規(guī)模。
異構(gòu)計算是指使用不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)的計算方式,。不同種類的處理器都有適合其處理的任務(wù)類型,比如CPU適合做串行,、邏輯復(fù)雜度高的任務(wù);GPU主要用于圖形處理和矩陣運(yùn)算,適合做簡單,、并行度高的任務(wù),;TPU(Tensor Processing Unit,張量處理單元)是為機(jī)器學(xué)習(xí)定制的芯片,主要用于人工智能領(lǐng)域。