超算,,超級計算機,,是所有計算機中運算速度最快、性能最強的一類,,在科研和軍事等尖端領域擁有舉足輕重的地位,,是綜合國力的體現(xiàn),堪稱國之重器,?;蛟S這些高尖端的龐然大物距離我們尋常百姓的生活很遙遠,所以我們甚至無法感知到它們的存在,。但近期一些事件和一些消息則刺痛了很多國人的神經(jīng):美國最新發(fā)布“Summit”超級計算機在時隔五年之后,,終于從中國的“神威·太湖之光”手中奪回“世界第一超算”寶座。
美國“Summit”重奪世界第一超算寶座
what,?我們居然在這么高尖端的領先過美國長達五年之久,?一些小伙伴看到這則消息時或許會有這樣的感嘆。沒錯,,答案是肯定的,。出于好奇,筆者順著這條新聞線索在這個陌生的領域找到了很多有趣的數(shù)據(jù)和有意思的故事,,不敢獨享決定梳理出來分享給大家,。
單個Summit超算服務器的內(nèi)部結(jié)構(gòu)
借著Summit這個狠角色,我們先來進行一些科普小知識,,超算究竟擁有如何驚世駭俗的計算能力呢,?Summit超級計算機由IBM主導完成,整個超級系統(tǒng)由4608臺計算節(jié)點,,每個節(jié)點包含2個22核IBM Power9處理器(負責協(xié)調(diào))和6個NVIDIA Tesla V100圖形處理單元加速器(負責計算),,并可提供每秒高達20億億次的浮點運算速度峰值!
27648枚NVIDIA Tesla V100 GPU核心提供超強算力
那么,,該如何理解這個每秒20億億次浮點運算呢,?如果以我們常見的筆記本電腦為參照物的話,Summit超級計算機的運算能力相當于100萬臺筆記本,;假如一個人每秒可進行1次運算,,他需要活到63億年以上才能與Summit的每一秒運算量相當。
算力驚人Summit自然也是個大家伙,,4608個節(jié)點每個都有如冰箱大小,,總重量高達340噸,它被放置在將近900平米的一個超大房間內(nèi),,據(jù)稱連接這些節(jié)點的線纜就有接近300公里的長度,。由于算力驚人自然,,發(fā)熱量自然巨大,因此全部采用水冷的散熱方式,。Summit每運行1分鐘,,就需要1.5萬升冷卻液的流量,而它消耗的電量足以為超過8000個美國家庭提供照明,。
既然我們知道了美國Summit超算的實力不俗,,那么中國的超算水平又在什么段位?
全球超算排排坐 中國實力并不弱
對于全球超級計算機的排名情況,,全球有一個比較公認的“TOP500”榜單,,這是由國外權威的超算專家聯(lián)合編制,在全球具有較高的公信力,。在2018年度“超算TOP500榜”中,,美國IBM最新發(fā)布的Summit和Sierra已經(jīng)分列榜單的冠第1和第3名,而此前蟬聯(lián)多年榜首的中國的“神威·太湖之光”和“天河2號”已經(jīng)下降至第2和第4名的位置,。
全球超算TOP500榜前十位(www.top500.org)
而如果你仔細查看這個榜單的話,你會發(fā)現(xiàn)他們的排名是按照Rmax(實測峰值)和Rpeak(理論峰值)來進行排序,。而對于任何一臺計算機而言,,Rpeak理論性能更多的是一種參考,Rmax實測性能則顯得更為關鍵,,即使是超級計算機也是如此,。接下來我們將范圍縮小至TOP5,看看這些世界頂級的超級計算機究竟在實力上有多大差距,。
全球頂級超算TOP5實力排名
此前榜單的頭把交椅由中國的神威·太湖之光把持數(shù)年,,美國在五年之后發(fā)布Summit,重新奪回第一個寶座,。從數(shù)據(jù)來看,,Summit的實測峰值比神威·太湖之光高出了31%左右。由于我們采用實測峰值數(shù)據(jù)來進行比較,,再考慮到兩者創(chuàng)建時間的差別,,因此兩者的實際差距其實并非像有些媒體宣稱的那樣近乎倍數(shù)的懸殊差距。
中國超算實力規(guī)模依然全球最強
接下來這組數(shù)據(jù)將會更加有趣,,此前有媒體把TOP500榜單中的所有超級計算機進行了國別的歸類,,發(fā)現(xiàn)來自中國的超算上榜206臺,比例高達41%,。來自美國的超算上榜124臺,,比例是25%,中美兩個超級大國統(tǒng)治了全球超過65%的超級計算機,,雖然個體被美國超越,,但中國超算的規(guī)模仍為全球當之無愧的第一,。
那么問題來了,中國如何再次超越美國Summit重奪全球超算性能第一的寶座,?有的小伙伴說堆更多的處理器就好了,,然而真實情況卻并非這么簡單!
技術封鎖下崛起的中國“芯”勢力
構(gòu)建一整套全球頂級的超算系統(tǒng)并非是單純的堆砌處理器這么簡單,,首先要有足夠強悍的計算個體芯片,、先進的運算管理技術、操作系統(tǒng)的支持,,以及足夠的財力支持才能夠造的出,。當然這一切的背后,最核心的因素是還要有國家層面的政策扶持,,以及足夠的尖端科技人才儲備,。所以說,超算是一個國家綜合實力的體現(xiàn)一點也不為過,。
我國的超算起步比較晚,,但是進步神速,這和我國高速發(fā)展需求和國家政策支持有著密不可分的關系,。中國的天河二號超級計算機曾經(jīng)6次蟬聯(lián)世界超算TOP500冠軍,,確立了中國在全球超算中的絕對地位。但是由于天河二號早期使用的是intel Xeon的芯片方案,,引來了一些質(zhì)疑和非議,。中國超算的快速崛起也使得美國政府在2015年頒布了引發(fā)轟動的“限售”事件:美國政府嚴禁intel等公司向中國四家超算中心出口高性能計算芯片。
國產(chǎn)Matrix-2000加速器替代intel Xeon
最近中美貿(mào)易摩擦和中興事件讓中國“芯”提升到了國家戰(zhàn)略的高度,,其實在很多年以前美國就已經(jīng)對我國的高尖端芯片領域進行“技術封鎖”,。2015年美國“限售”事件爆發(fā),中國決定采用國產(chǎn)芯片替代,。直至2017年9月份,,廣州超算中心宣布年底前升級天河2號超算系統(tǒng),使用國產(chǎn)加速器Matrix-2000取代原本的Intel Xeon Phi加速器,。通過國產(chǎn)芯片升級后的天河2A超級計算機取得了算力翻倍的驚人成績,。
國產(chǎn)Matrix-2000賦予天河2A性能翻倍的
國產(chǎn)Matrix-2000的出現(xiàn)打破了美國的“技術封鎖”,升級后的天河2A超級計算機的浮點性能從之前的54.9PFLOPS提升到了94.97PFLOPS,,互聯(lián)與I/O方面性能指標也獲得了較大幅度的技術進步,。網(wǎng)絡帶寬從原來的10Gbps升級到了14Gbps,延遲從1.57us降至1us,,內(nèi)存容量從1.4PB升級到了3.4PB,,存儲容量從12.4PB升級到了19PB,帶寬翻倍到1TB/s,,而功耗則從17.8MW降至16.9MW,,能效大幅提升,。
天河2A超級計算機實現(xiàn)國產(chǎn)芯片替代
略帶神秘色彩的Matrix-2000芯片是由國防科大自主研發(fā)設計,網(wǎng)傳由天津邁創(chuàng)公司出品,。在中國超算白手起家的內(nèi)憂,,疊加美國“禁售”的外患的大背景下,中國超算憑借自主研發(fā)的Matrix-2000實現(xiàn)“絕地反殺”,,此舉無疑可以載入史冊,。
唯有堅定完全自主研發(fā)才是出路
自中國863計劃實施以來,超級計算系統(tǒng)的研發(fā)受到了國家的高度重視,,但由于基礎薄弱起步較晚,,在國際舞臺中一直受制于人。美國商務部2015年實施“禁售”高端芯片事件爆發(fā),,更是堅定了我國高端芯片自主研發(fā)的路線,,并被提升到國家戰(zhàn)略高度。中國目前最強大的超級計算機——神威·太湖之光就是在這樣的背景下誕生的,。
再次實現(xiàn)超越的神威·太湖之光超級計算機
神威·太湖之光超級計算機安裝了40960個中國自主研發(fā)的“申威26010”眾核處理器,,該眾核處理器采用64位自主申威指令系統(tǒng),峰值性能為12.5億億次/秒,,持續(xù)性能為9.3億億次/秒。2016年,,國際TOP500組織發(fā)布的榜單顯示,,“神威·太湖之光”超級計算機系統(tǒng)登頂榜單之首, 不僅速度比第二名“天河二號”快出近兩倍,,其效率也提高3倍。
神秘的申威26010眾核處理器
申威26010眾核處理器采用64位自主申威指令系統(tǒng),,峰值性能3.168萬億次每秒,,核心工作頻率1.5GHz?!吧裢狻崩锇惭b有40960個這樣的處理器。使用中國自主芯片制造的“神威太湖之光”取代“天河二號”登上榜首,,中國超算上榜總數(shù)量也有史以來首次超過美國名列第一。
申威26010眾核處理器的出現(xiàn)基本實現(xiàn)了對Intel Xeon Phi加速卡的替代,。雖然在單片的性能上仍舊跟Intel Xeon存在性能上的差距,但是得益于體積和功耗上面的優(yōu)勢,,可使得一個小小的機箱就可放置256個計算節(jié)點,,同體積計算性能反殺Intel Xeon Phi。
某專題片對申威26010的報道
相比其他國產(chǎn)芯片,,申威則要顯得更加低調(diào)和神秘一些,因為申威處理器自誕生之初就背負著軍工國防和國家信息安全的使命,,其研發(fā)單位總參謀部第五十六研究所(無錫江南計算技術研究所)于2003年開始著手設計中國人自己的高性能芯片。在國家"核高基"重大專項支持下,,申威處理采用自主指令集開發(fā),,且具有完全自主知識產(chǎn)權。
天河三號超級計算機有望2020年研制成功
雖然目前我國兩臺重量級超級計算機“神威·太湖之光”和“天河2A”被來自美國的“Summit”和“Sierra”所超越,,但兩強交手互有勝負也在情理之中,。據(jù)最新的消息顯示,,我國“天河三號”目前正在積極的研發(fā)大眾,并有望在2020年重新奪回第一寶座,,并實現(xiàn)對“神威·太湖之光”高達八倍的性能超越,。更加值得期待的是,,“天河三號”有望采用全自主創(chuàng)新設計,自主飛騰CPU,、自主天河高速互聯(lián)通信,,以及自主麒麟操作系統(tǒng),。
然而我們必須清醒的意識到,,在芯片領域我們所面臨的對手是如此強大,,無論IBM、intel,、nVIDIA任何一個芯片公司都具有足夠強大的實力,。同時需要特別注意的是,,早在5年前,,美國政府就已經(jīng)停止為超級計算機項目的贊助撥款。轉(zhuǎn)而開始大力投資量子計算機的研發(fā)工作。這也是此前美國超級計算機止步不前,,最終被中國一舉超越的重要原因,。
擺在國產(chǎn)芯片面前的挑戰(zhàn)和使命同樣重大,在當前的國際局勢下,,唯有鑒定的走自主研發(fā)的道路,,徹底擺脫受制于人才是唯一出路。無論是2020年即將投入使用的“天河三號”,,還是“神威·太湖之光”后續(xù)的升級,,在關乎國家經(jīng)濟命脈和信息安全的超級計算機領域,國產(chǎn)芯片將會愈發(fā)壯大,,讓我們拭目以待,!