最近美國能源部下屬的橡樹嶺國家實驗室放了一個大招:新一代超級計算機(jī)“Summit(頂點)”正式發(fā)布,幫助美國重新奪回超算領(lǐng)域的桂冠,。其浮點運算速度峰值可達(dá)每秒20億億次,比中國的最強(qiáng)超算“神威太湖之光”快60%。由于6月是每半年公布一次的全球超算500強(qiáng)榜單年中更新的時間,美國搶在這期榜單公布前宣布成功研制“頂點”,可見其重回超算之巔的急迫心情,。
美國超級計算機(jī)“頂點”拿下頭把交椅
這臺“頂點”超級計算機(jī)是由IBM公司作為總承包商,為橡樹嶺國家實驗室開發(fā)的,英偉達(dá)公司以及一些技術(shù)專家從旁輔助,耗資2億美元,占地面積有兩個網(wǎng)球場那么大。這臺龐然大物足足由4608臺計算服務(wù)器組成,每個服務(wù)器包含兩個22核的IBM Power9處理器和6臺NVIDIA Tesla V100圖形處理單元加速器,。
該實驗室說,它們不僅使“頂點”的浮點運算速度峰值可達(dá)每秒20億億次,還能讓“頂點”在執(zhí)行某些科學(xué)運算時,“混合精度”運算速度達(dá)到每秒330億億次,。
橡樹嶺國家實驗室專家杰夫·尼克爾斯說,“頂點”比過去超級計算機(jī)的計算能力和存儲能力更強(qiáng),擁有龐大和高質(zhì)量的文件系統(tǒng)以及快速的數(shù)據(jù)通道,這讓研究人員在使用它時可以更快得到更精確的結(jié)果。
中國目前最強(qiáng)的超算——“神威太湖之光”,峰值運算性能為12.5億億次,“頂點”比“神威太湖之光”快了將近60%,。
放眼國際,中美超算實力最強(qiáng),無論是數(shù)量上還是性能上都甩開其他國家一大截,。不過在20年前,和美國爭奪最強(qiáng)超算頭把交椅的一直是日本。
1999年,日本投入400億日元(約合人民幣25億元),開始了名為“地球模擬器”的超級計算機(jī)開發(fā)計劃,。2002年,日本“地球模擬器”超級計算機(jī)成功推出,并將多年來一直獨占鰲頭的美國擠下了“頭把交椅”,。但正是“地球模擬器”的橫空出世觸動了美國,美國政府隨后開始加大了在超級計算機(jī)研發(fā)方面的投入,并在2004年重新占據(jù)“第一”,而且在前100名中一直占據(jù)大多數(shù)的席位。這種美國占據(jù)霸主地位的情況一直延續(xù)了6年,。
而自日本奪下超級計算機(jī)第一把交椅之后,利用超級計算機(jī)展開研發(fā)業(yè)務(wù)的日本企業(yè)雖然也經(jīng)歷了一個大發(fā)展,多達(dá)如今的180家,在諸如新藥的研制和新車型的設(shè)計方面,超級計算機(jī)長袖善舞,大有用武之地,。但由于日本近年的投入力度不夠,再也沒有后續(xù)的超級計算機(jī)問世。
現(xiàn)在,面對中美在超算上的競爭,歐盟,、日本,、加拿大等都不愿意屈居人后,紛紛布局下一代超算,做技術(shù)儲備。
不少人認(rèn)為,構(gòu)建超級計算機(jī)就是在做芯片處理的加法,處理器(CPU)越多,計算速度也就越快,。事實并非如此,。打個比方,三人共同協(xié)作完成任務(wù),除去正常開展任務(wù)工作外,還需要耗費人力進(jìn)行任務(wù)分解、任務(wù)分配,、結(jié)果歸總等管理工作,。管理工作不科學(xué),總體工作效率會大幅降低。所以,和普通計算機(jī)相比,超級計算機(jī)還有并行計算和異構(gòu)計算兩大難題需要解決,。
并行計算是指同時使用多種計算資源解決計算問題的過程,是提高計算機(jī)系統(tǒng)計算速度和處理能力的一種有效手段,。它的基本思想是用多個處理器來協(xié)同求解同一問題,即將被求解的問題分解成若干個部分,各部分均由一個獨立的處理機(jī)來并行計算。并行計算的目的是為了加快求解速度,擴(kuò)大求解規(guī)模,。
異構(gòu)計算是指使用不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)的計算方式,。不同種類的處理器都有適合其處理的任務(wù)類型,比如CPU適合做串行,、邏輯復(fù)雜度高的任務(wù);GPU主要用于圖形處理和矩陣運算,適合做簡單,、并行度高的任務(wù),;TPU(Tensor Processing Unit,張量處理單元)是為機(jī)器學(xué)習(xí)定制的芯片,主要用于人工智能領(lǐng)域。
讓氣象預(yù)測間隔從30分鐘縮短到10分鐘
超級計算機(jī)可以干什么?據(jù)新華社消息,美國能源部長里克·佩里說,“頂點”超算將給能源研究,、科學(xué)發(fā)現(xiàn),、經(jīng)濟(jì)競爭力和國家安全帶來深遠(yuǎn)影響。美能源部今年將啟動遴選科學(xué)項目,申請使用“頂點”超算的科學(xué)項目已開始排隊,。橡樹嶺國家實驗室計算生物學(xué)家丹·雅各布森說,“頂點”超算有望憑借強(qiáng)大的計算能力,打開此前人們難以想象的科研空間,。
比如,天文學(xué)家計劃用它模擬超新星爆發(fā)。橡樹嶺國家實驗室計算天體物理學(xué)家布朗森·梅瑟說,“頂點”的計算能力比早先所用的計算機(jī)強(qiáng)大很多,因此能使模擬時間延長數(shù)千倍,為研究宇宙中如何出現(xiàn)金和鐵等重元素提供線索,。在材料學(xué)領(lǐng)域,研究人員需要能在原子層面模擬材料的性質(zhì),但他們在過去的計算機(jī)上只能模擬數(shù)十個原子的行為,現(xiàn)在他們計劃用“頂點”模擬數(shù)百個原子的行為,從而幫助尋找超導(dǎo)體等新材料,。在人工智能與醫(yī)療的交叉領(lǐng)域,“頂點”也有用武之地。比如將其用于癌癥研究,幫助醫(yī)生找出癌癥發(fā)病過程中基因,、生物標(biāo)記物和環(huán)境等因素間的關(guān)系,。還可用它分析蛋白質(zhì)和細(xì)胞的功能,幫助防治阿爾茨海默病和心臟病等疾病。
據(jù)了解,目前超級計算機(jī)已同理論研究和科學(xué)實驗一起成為人類探索未知世界的三大科學(xué)手段,被稱為支撐科學(xué)發(fā)現(xiàn)的第三個支柱,。
知乎網(wǎng)友“小侯飛氘”舉了這樣一個例子,在飛行器制造領(lǐng)域,經(jīng)常要計算飛機(jī)附近空氣的流動以及飛行器本身的受力情況,。最常用的計算方法是把空氣、機(jī)體分割成一個個小塊,分別計算每個小塊的運動和受力,再整合起來得到整體的運動和受力情況,。一般來說,分割得越精細(xì),每個小塊越小,計算越準(zhǔn)確,。而魚與熊掌不可兼得,分割得越精細(xì),計算量也越大。
在科研和工程領(lǐng)域,有許許多多這樣的計算任務(wù),例如原子基本性質(zhì)的量子力學(xué)計算,、藥物反應(yīng)過程的分子動力學(xué)模擬、黑洞碰撞的相對論模擬,、大氣運動和天氣變化的預(yù)測,、橋梁設(shè)計中的受力計算……這些復(fù)雜的問題,如果用單個CPU核心計算,可能要花上幾個月甚至是幾年才能得到結(jié)果。這么長的計算時間是難以接受的,所以我們需要用多個CPU核心進(jìn)行并行計算以提高效率,集成大量CPU于一身的超算自然就應(yīng)需而生了,。
再比如,在氣象研究領(lǐng)域,1983年研制的第一臺銀河超級計算機(jī),讓中國成為世界上少數(shù)能發(fā)布5-7天天氣預(yù)報的國家,也是發(fā)展中國家里的第一個,。
近年來,日本理化學(xué)研究所和氣象廳的團(tuán)隊利用超級計算機(jī)“京”分析氣象衛(wèi)星“向日葵8號”的觀測數(shù)據(jù),捕捉曾難以用于天氣預(yù)報的云層高度和厚度,更加準(zhǔn)確地預(yù)測臺風(fēng)和集中暴雨。據(jù)報道,2015年開始運用的“向日葵8號”的觀測間隔從此前的30分鐘變?yōu)?0分鐘,這使得更早發(fā)現(xiàn)危險并促成居民疏散成為可能,。
該團(tuán)隊介紹,“向日葵8號”捕捉從云層頂部發(fā)出的紅外線,探測迄今難以確認(rèn)的云層高度,。然后通過超算“京”模擬附近的氣象信息,推測云層的厚度。使用這些數(shù)據(jù)可預(yù)測隨風(fēng)飄動的云層動向,。
傳統(tǒng)超算功耗高,量子計算是未來發(fā)展方向
以往超級計算機(jī)通過增加處理器數(shù)量就能不斷提高性能,但美國勞倫斯·伯克利國家實驗室的豪斯·費姆尼教授認(rèn)為,最近幾年超算技術(shù)上的發(fā)展,都不足以突破E級超算(即每秒百億億次計算)的障礙,。
超算發(fā)展目前面臨的挑戰(zhàn)首先是功耗控制難。目前的集成水平和此前相比并沒有根本性改善,以現(xiàn)有技術(shù),E級超級計算機(jī)的功耗會超過20兆瓦,建造費用將超過2億美元,這將帶來一系列技術(shù)和運營問題,。例如“天河二號”一年僅電費就要1億元人民幣,全速運算的話,電費更高達(dá)1.5億元,。如果還是按照老思路,依靠增加規(guī)模制造出的E級超算,功耗可能會達(dá)到50-100兆瓦,這需要有一個專門的核電站來給它供電,這樣的超算顯然沒有實用價值,。同時這樣密集排列的大功率處理器,也會帶來無法解決的散熱問題。因此國際上公認(rèn)的E級超算標(biāo)準(zhǔn)是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破,。
其次是可靠性問題,將來超級計算機(jī)并發(fā)部件將超過10億,以現(xiàn)在的故障率,平均每10-20分鐘系統(tǒng)就會報一次硬件錯誤,而每次處理錯誤需要半個小時,。這顯然也是無法容忍的。
此外,超算還面臨數(shù)據(jù)的訪問速度限制,。如果按現(xiàn)有設(shè)計方法,通過不斷增加處理器數(shù)量來研制超算,其體型和規(guī)模會越來越大,數(shù)據(jù)在存儲器和處理器之間進(jìn)出所耗費的功率會越來越多,。有人甚至預(yù)測,超算90%的功率將被用于數(shù)據(jù)輸送。
因此,美國也有一些學(xué)者認(rèn)為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運算速度的模式,而注重實用價值,。例如放棄通用型超算,根據(jù)實際需求定制超算,。Top500榜單創(chuàng)始人、田納西大學(xué)計算機(jī)科學(xué)家杰克·東格拉就認(rèn)為:“速度并不意味著一切,。盡管汽車達(dá)到300公里/小時的速度讓人驚嘆,但大多數(shù)情況下汽車的真正價值在于,在日常限速范圍內(nèi)安全可靠地行駛,。”
傳統(tǒng)計算方式的路已經(jīng)快走到盡頭,量子計算正成為各國研發(fā)的重點,。量子計算是全新計算模式,它不同于當(dāng)前數(shù)據(jù)中心,、云環(huán)境、PC和其他設(shè)備中的數(shù)字計算,。數(shù)字計算需要把數(shù)據(jù)編碼為二進(jìn)制數(shù)字(比特位),每個比特位處于兩個確定狀態(tài)中的一個(0或1),。然而,量子計算使用量子位,后者可以同時處于多個狀態(tài)。因此,量子位上的操作可以實現(xiàn)并行的大量計算,。
從本質(zhì)上說,量子計算就是并行計算的終極目標(biāo),有攻克傳統(tǒng)計算機(jī)無解難題的巨大潛力,。例如,量子計算機(jī)可以模擬自然環(huán)境來推進(jìn)化學(xué)、材料科學(xué)和分子建模等領(lǐng)域的科研工作,。從美國到歐洲,從頂尖科研機(jī)構(gòu)到科技企業(yè)巨頭,圍繞量子技術(shù)的攻關(guān)已全面展開,量子革命引發(fā)的新一輪科技競賽如火如荼,。
比如,谷歌在2017年4月份宣布推出49量子位處理器。谷歌首席科學(xué)家John Martinis曾公開表示:為率先登頂“量子霸權(quán)”,他所帶領(lǐng)的團(tuán)隊正在利用49量子比特模擬系統(tǒng)攻克經(jīng)典計算機(jī)無法解出的難題,。