《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 中國超級計算機日租金上萬元 硬件領(lǐng)先軟件仍需大量投入

中國超級計算機日租金上萬元 硬件領(lǐng)先軟件仍需大量投入

2018-05-17

1526439506920000831.jpg

除了呼呼的風扇聲,,賽場一片沉寂,,在場的上百名大學生緊盯著電腦,,手指飛快地敲擊鍵盤,。

這群平均年齡不到22歲的大學生,,面對的是當下最前沿的研究:機器閱讀理解,、獲2017年諾貝爾化學獎的冷凍電鏡技術(shù),、美國國家航空航天局(NASA)的流體力學模擬軟件……

面對海量的數(shù)據(jù),,清華大學的大四學生李北辰估算后決定調(diào)整方案,,“幾乎沒法跑完”,。臨到結(jié)束,他甚至能聽到自己的心臟“咚咚”地跳動,。

這是2018年世界大學生超級計算機競賽(簡稱ASC18)的現(xiàn)場,,在2天20小時的規(guī)定時間里,每個隊伍需要自己搭建小型超級計算機,,完成組委會布置的4道題目,,運算的結(jié)果將作為最后成績的評分依據(jù)。

李北辰隊伍搭建的機器的運算能力,,約為1萬臺現(xiàn)在市面上主流家用電腦運算能力之和,,但相比目前世界上最快的超級計算機“神威·太湖之光”,他們的算力還不到百分之一,。

在幾個國家超級計算中心的超級計算機里,,日夜運行著全國各地發(fā)來的運算指令。不管是天文觀測,、航空模擬計算,,還是天氣預(yù)報,、生物醫(yī)療等日常生活的需求,都需要超級計算機的支撐,。

“超級計算機的研究水平?jīng)Q定了一個國家的尖端科研實力,。以天氣預(yù)報為例,如果計算明天天氣的時間超過一天,,那這個預(yù)報就毫無意義了,。”國家超級計算濟南中心主任張云泉告訴中國青年報·中青在線記者,。目前中,、美、日,、俄等國對高性能超級計算機研究大力投入的背后,,也是搶占科研制高點的競賽。

1后面17個0

這是一個以萬億為計量單位的世界,。

在超級計算機領(lǐng)域,,有著一份世界500強榜單。根據(jù)最新的排名,,如果一臺機器的運算能力達不到500萬億次每秒,,它將被無情地“除名”。衡量超級計算機的標準“簡單粗暴”:運算能力夠快,。上一代超級計算機使用的架構(gòu)與目前主流的不同,,現(xiàn)在的技術(shù)將來也可能被量子計算機取代。

這份榜單每隔半年更新一次,,總是能引起全世界的關(guān)注,,人們津津樂道冠軍的更替,哪個國家上榜的超級計算機最多,、總算力最高還被美國總統(tǒng)寫進國情咨文,。

2013年至今,中國自主研發(fā)的超級計算機就一直穩(wěn)坐榜首,。最近兩年,,這個位置屬于“神威·太湖之光”,它的峰值運算速度達到每秒12.5億億次,,“1”后面17個“0”,,大致相當于200萬臺普通電腦同時運行。

但它遠不止是堆積用于運算的中央處理器(CPU)和圖形處理器(GPU)這么簡單,。張云泉告訴記者,,超級計算機的運算速度不遵循“1+1=2”的公式,還得考慮它們之間工作分配、數(shù)據(jù)傳輸?shù)膿p耗,?!斑@就像領(lǐng)導(dǎo)10個人和領(lǐng)導(dǎo)1000個人的區(qū)別,如果不能合理管理,,每個人的工作效率都會大大降低,,即每個CPU和GPU的性能都沒有得到充分運用?!?/p>

在國家超級計算濟南中心,,“神威·藍光”超級計算機黑色的機箱緊密排布,圍成一個大圈,,被小心安放在數(shù)百平方米的一樓大廳內(nèi),。當這臺研發(fā)費用數(shù)億元的機器運轉(zhuǎn)時,,功耗是1兆瓦,,大致相當于1.5萬戶家庭的家電功率總和,每年僅電費一項支出就接近2000萬元人民幣,。

相比國家超級計算中心的“大手筆”,,李北辰參加的ACS18則要求機器總功耗在3000瓦以內(nèi),這意味著能使用的CPU,、GPU數(shù)量有一個上限,。

為了最大化利用它們的運算能力,他們必須精打細算,,一方面仔細分配每個節(jié)點的運算內(nèi)容,,另一方面還要簡化復(fù)雜的運算,讓每個節(jié)點能同時計算盡可能多的內(nèi)容,。

在這次比賽中,,他們隊伍用了16塊GPU,總價值超過60萬元人民幣,。為了分攤風險,,幾位隊員一人負責幾塊,小心翼翼地將這些寶貝從學校的實驗室運到比賽現(xiàn)場,。賽前,,場地上趴滿了選手,大家都在緊張地安裝和調(diào)試設(shè)備,。

租用超算一天,,花費上萬元

比賽開始不多久,參賽的選手就開始冒汗,。除了心理因素,,還因為現(xiàn)場設(shè)備高速運轉(zhuǎn)時,會釋放大量的熱量,,隊員戲稱“可以攤雞蛋了”,。每個GPU都必須配備降溫風扇,,否則就會因溫度過高而停止運行。

對超級計算機來說,,如何有效地帶走這些“大腦”思考時散發(fā)的熱量一度是發(fā)展瓶頸,。在國家超級計算廣州中心,工程師專門建造了冷水廠,,不間斷運送8攝氏度的水進入“天河二號”的水冷系統(tǒng),。

機房還安排人員24小時值班,監(jiān)控機器的運轉(zhuǎn)狀況,,清理垃圾進程,,實現(xiàn)效率的最大化?!笆菣C器就有損壞和出問題的概率,,怎樣讓它們的影響盡可能小也是門學問?!睆堅迫f,。

李北辰曾參加另一場大學生超算競賽,48小時不間斷地比賽,,他和隊員只能輪流睡覺,,保證有人時刻盯著機器運行。此外,,組委會還隨機對賽場斷電,,考查程序及時備份的能力。在實際使用中,,這些都是極可能出現(xiàn)的挑戰(zhàn),。

中山大學腫瘤防治中心的博士后趙齊對此深有體會,他所在的團隊是最早用“天河二號”測試生物應(yīng)用的團隊之一,。因為需要處理大量的生物基因組數(shù)據(jù),,他們從2012年起就開始使用超級計算機。

他告訴中國青年報·中青在線記者,,他曾遇到各種奇怪的報錯和任務(wù)丟失,,環(huán)境配置也不定時出問題,經(jīng)常算出他自己都不敢相信的結(jié)果,。

這是因為生物信息領(lǐng)域在超級計算機上的應(yīng)用還在起步階段,,成熟的軟件不多,很多時候需要用戶和超算中心的工作人員合作開發(fā)解決問題,。

在過去5年,,光他一個人就用“天河二號”處理了超過100TB的數(shù)據(jù)。超級計算機能在幾天或幾小時里,處理一般計算機半年乃至幾年才能處理完的工作,。以前,,等待運算結(jié)果是他最苦悶的時候,“用上超級計算機算是奔小康了,?!?/p>

因為需要處理的數(shù)據(jù)太多,網(wǎng)絡(luò)傳輸較慢,,趙齊有時會采用郵寄硬盤的方式,,“郵遞員最快”。

只是這樣的代價很高,。趙齊所在的實驗室每年消耗在數(shù)據(jù)存儲上的錢就在5萬元左右,。租用超級計算機進行數(shù)據(jù)處理,有時一天就會花費上萬元,。

對多數(shù)用戶來說,,使用超級計算機和自己的電腦沒什么區(qū)別,登錄賬號,,上傳數(shù)據(jù)就行了,,運算遠在千里之外進行。

超算世界500強前兩名是中國

當你拿起智能手機,,向語音助手詢問天氣,遠在美國的超級計算機在不到1秒的時間里理解了你的意思,。甜美的女聲播報的結(jié)果,,則由濟南、廣州,、無錫等多地的超級計算機共同計算得出,。

大量影視公司利用它進行后期特效處理,傳統(tǒng)制造業(yè)也倚仗這個技術(shù),,部分公司洗衣液的瓶子都是超級計算機設(shè)計的,。

有了超級計算機,研究者可以模擬出人類器官對藥物的反應(yīng),,大大縮短新藥的研發(fā)時間,,節(jié)省成本。在抗埃博拉病毒藥物的篩選中,,超級計算機能夠在一天內(nèi)完成超過4000萬分子化合物的篩選,,以最快的速度應(yīng)對爆發(fā)性惡性傳染病。

此外,,使用超級計算機進行核爆炸模擬還是美國研究核武器的方式,。

過去,超級計算機的主要任務(wù)是進行科學計算。最近幾年,,有關(guān)人工智能的運算請求也越來越多,。

為此,ASC競賽也開始引入人工智能的問題,,李北辰打比方說,,過去他們的工作類似于計算式子的結(jié)果,但現(xiàn)在,,他們更像是在做應(yīng)用題,,要先讀懂問題,從中抽象出式子,,再進行計算,。

目前,“天河二號”的用戶已經(jīng)超過1200家,,包括各大高校,、研究所,支撐國家級課題超過400項,。

2001年時,,超級計算機500強名單中沒有一臺來自中國。而現(xiàn)在,,榜單前兩名都被中國占據(jù),。此外,中國的上榜數(shù)量達到204,,排名第二的美國只有143,。

2015年,美國開始對中國超級計算機領(lǐng)域施行芯片禁運,,在那以前,,美國對中國出口超級計算機也有諸多限制,例如出售的機器性能不能高于中國自己所能研發(fā)的機器性能,。

張云泉告訴記者,,我國已經(jīng)掌握超級計算機的制造技術(shù),包括“神威·太湖之光”“神威·藍光”的一系列設(shè)備,,從芯片,、操作系統(tǒng)到冷卻系統(tǒng)都完全由我國自主研發(fā)。

雖然中國在硬件條件上取得領(lǐng)先地位,,但軟件方面仍需要大量的投入,。目前應(yīng)用于超級計算機的商用軟件幾乎全部由美國、日本等國開發(fā),,中國的市場占有率基本為零,。

“應(yīng)用于超算的生物信息學軟件開發(fā)起來舉步維艱,。”趙齊感慨,,“人才缺口很大,。”他所在的專業(yè),,很多人都放棄使用“天河二號”,,因為學習和溝通成本太高。他覺得,,超算中心應(yīng)該做更多對超算技術(shù)的科普和培訓,。

在計算機科學領(lǐng)域,超級計算機不是熱門方向,。李北辰的同學中,,每年只有10%左右的同學對這個方向有興趣,多數(shù)人還是投身人工智能的研究,。

在張云泉看來,,解決軟件問題需要政策和財政兩方面的支持?!拔鞣絿以诔泐I(lǐng)域多是制訂10-20年的計劃,,背后有點軍備競賽的意思。但中國一直是制訂5年計劃,,完成后再討論下一個5年要不要繼續(xù),。這樣規(guī)劃不夠長遠,技術(shù)團隊也難以保持穩(wěn)定,?!?/p>

他介紹,我國對超級計算機領(lǐng)域研究的總投入與美國接近,,但對軟件的投入偏低,目前僅占總投入的20%,。他認為,,這個比例應(yīng)該到50%比較合適,美國,、日本也是這個比例,。

“美國對超級計算機的研究已經(jīng)超過了50年,而我國才剛剛30年,,我們需要多一些耐心,。”張云泉說,,“過去我們是跟在別人后面跑,,就只顧得上追了?,F(xiàn)在我們超前了,該看清前進的方向,,這比追趕花功夫得多,。”(王嘉興/中國青年報)


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。