超級計算(Supercomputing)這一名詞在1929年首次出現(xiàn)在《紐約世界報》關于“IBM為哥倫比亞大學建造大型報表機(tabulator)”的報道中,。超級計算機的定義是由數(shù)百個以上處理器組成的,,能夠完成計算普通PC機和服務器不能完成的大型、復雜課題的計算機,。以2017年生產(chǎn)的筆記本電腦或個人臺式機主流配置作參照,,我國運行速度最快的神威·太湖之光的運算能力相當于200多萬臺普通電腦。超級計算機的運算能力由此可以見一斑,。所以說,,超級計算機是妥妥的“大國重器”,誰掌握了超算能力,,誰就在科技領域占據(jù)了一個制高點,。
一個國家的超級計算機實力與其發(fā)展息息相關,。經(jīng)濟發(fā)展產(chǎn)生了很多需求,如天氣預報,、風洞實驗,、航空航天等,需要具有更快處理數(shù)據(jù)能力的超級計算機,。當某個國家擁有一臺世界排名第一的超級計算機時,,意味著這個國家一切繁復的運算、模擬將比其他國家更快,、更準確,,相應地最終設計制造周期將大幅度縮短,無論是在軍用還是在民用上都將獲得無可比擬的領先優(yōu)勢,。這也就難怪各科技強國都不遺余力得在此領域加大投入,不斷沖擊世界超級計算機之巔,。其中美國和中國無疑居于領先地位。
自1993年有了TOP500超算排名之后,,美國多年來一直壟斷著TOP500超算冠軍,,在數(shù)量上也占據(jù)絕對優(yōu)勢。不過最近十年來中國已經(jīng)成功實現(xiàn)追趕并超越美國,,入圍TOP500的超算越來越多,,尤其是最近5年10屆TOP500冠軍先后被我國的天河二號和神威·太湖之光所奪得。目前我國計算速度最快的神威·太湖之光具有93 PFLOP(1 PFLOP 等于每秒一千萬億次的浮點運算,,也就是9.3億億次每秒)的極限性能,,相當于美國能源部下屬橡樹嶺國家實驗室開發(fā)的Titan(18 PFLOP)超級計算機的5倍。直至今年的6月份,,美國能源部下屬橡樹嶺國家實驗室的新一代超算Summit擊敗此前曾四連冠的神威·太湖之光,,一舉占據(jù)冠軍位置。
未來超算的性能競爭將集中到每秒百億億次
Summit 的出現(xiàn)將超級計算機的峰值運算速度提高到每秒百億億次,。全球超級計算機的競賽提前幾年進入E級競賽階段,,美國和中國領先。美國正在研究開發(fā)幾臺這樣的機器,,每臺機器的成本可能在4億美元至6億美元之間,,并且得到了英偉達、IBM 以及英特爾等公司的合作幫助,。美國的目標是在2021年和2023年之間完成使至少一臺“百億億級”計算機,。
按照中國的時間表,中國最早有望在2020年發(fā)布E級超算,。目前中國同時啟動了三大E級超算原型系統(tǒng)的研發(fā),,分別是國防科大和天津超算中心的“天河三號”、中科曙光的E級超算,,以及江南所和濟南超算中心的“神威”E級超算,。
國家超算無錫中心主任楊廣文也曾透露,,“神威·太湖之光”新一代百億億次超算的研制已經(jīng)列入國家“十三五”規(guī)劃,并以“神威”“曙光”“天河”等系列超級計算機為龍頭開展研制,,有望在2020年左右推出首臺國產(chǎn)百億億級次超級計算機,。
“天河一號”研發(fā)部部長孟祥飛在十九大“黨代表通道”上透露,他們正在進行百億億次超級計算機的研發(fā),,預計2020年研制成功,。曙光的Torus技術可以說是為E級計算而生的。Torus網(wǎng)絡架構本身的密度高擴展性好,,橫向擴展的成本增長呈直線型,,更像是橫向擴展的一個狀態(tài),更適合在大規(guī)模節(jié)點的范圍中使用,。
人工智能應用的超級計算機應該成為競爭焦點
橡樹嶺的研究小組說,,Summit是第一臺既支持傳統(tǒng)計算也支持運行人工智能應用的超級計算機,比如機器學習和神經(jīng)網(wǎng)絡等運行都可以在其上實現(xiàn),。Summit基于 IBM在2017年12月于北京所發(fā)表的最新一代 Power PC 9216 架構,,與多達 27648 個 NVIDIA GPU 組合而成,目的在于解決目前機器學習與神經(jīng)網(wǎng)絡等 AI 應用的性能瓶頸,。
高性能計算機就是為人工智能而生的,。當年的超級電腦“深藍”在國際象棋上打敗卡斯特洛夫。十年后,,人工智能Alpha GO才在圍棋上擊敗了李世石,。超級計算機與AI結合的前景被業(yè)界普遍看好,確實非常值得期待,。
中國在AI芯片、AI算法,、大數(shù)據(jù)積累,、算力等方面都具有發(fā)展?jié)摿Γ耆梢栽贏I應用的超算競爭中,,達成科技與商業(yè)的完美結合的大目標,。