超算是一個(gè)國(guó)家計(jì)算能力和經(jīng)濟(jì)實(shí)力的綜合較量,,所以每年舉行的國(guó)際超算大會(huì)都是世界各國(guó)叫板超算能力的競(jìng)技場(chǎng),。上周在德國(guó)法蘭克福召開(kāi)的2019年國(guó)際超算大會(huì)(ISC 2019)上,公布了新一期的Top500榜單,,中國(guó)以44%的份額高居第一,,幾乎是排名第二的美國(guó)的兩倍。曙光這次在ISC上展出了其HPC產(chǎn)品——曙光新一代硅立方高性能計(jì)算機(jī)(以下簡(jiǎn)稱硅立方),,完成了該產(chǎn)品的歐洲“首秀”,。該產(chǎn)品以高性能、高功率密度,、高效冷卻而備受關(guān)注,,單體功率即可達(dá)320kW,PUE低于1.04,,在展會(huì)上備受關(guān)注,。
目前,全球HPC發(fā)展面臨新的轉(zhuǎn)型,,無(wú)論是在技術(shù)上還是發(fā)展方向上或是在服務(wù)模式上都蘊(yùn)含新的變數(shù),,曙光的“硅立方”創(chuàng)新有哪些可以復(fù)制的經(jīng)驗(yàn)?曙光如何看到未來(lái)的HPC技術(shù)之變,?未來(lái)的HPC將呈現(xiàn)哪些新的趨勢(shì),?就相關(guān)問(wèn)題,日前《中國(guó)電子報(bào)》記者采訪了曙光公司總裁助理兼高性能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理李斌,。
全浸沒(méi)式相變液冷技術(shù)突破能耗困境
一個(gè)十萬(wàn)億億次的超算中心能耗甚至相當(dāng)于一個(gè)小型核電站,,國(guó)內(nèi)某超算中心的年耗電量約為2億度,電費(fèi)超過(guò)1億元,。如果未來(lái)計(jì)算力進(jìn)一步提升到百億億次,、千億億次,那么功耗就將是成為難以逾越的“墻”。曙光的硅立方采用什么思路來(lái)突破能耗的挑戰(zhàn),?這種液冷技術(shù)有沒(méi)有更大復(fù)制范圍?液冷對(duì)于攻克高性能計(jì)算機(jī)功耗問(wèn)題有什么啟示,?
李斌表示,,高性能計(jì)算機(jī)或者通用的IT設(shè)備,它的冷卻技術(shù)和方案需要從三個(gè)維度進(jìn)行設(shè)計(jì):其一是制冷效率,。如何高效把熱量快速的從IT設(shè)備帶走,,這是要考慮的第一點(diǎn)。其二是節(jié)能性,。把熱量帶出去之后,,可能需要消耗額外的能耗。其三冷卻方案成本和維護(hù),,這個(gè)也需要考慮,。
現(xiàn)在業(yè)界的基本技術(shù)路線是從傳統(tǒng)的風(fēng)冷散熱轉(zhuǎn)向液冷散熱。而液冷技術(shù)現(xiàn)在也分很多流派,,有用冷板間接式的液冷,,這個(gè)技術(shù)在國(guó)際上起步比較早,也比較成熟,。曙光在這方面投入比較早,,在2015年基本就實(shí)現(xiàn)了這個(gè)技術(shù)的量產(chǎn)。現(xiàn)在從制冷散熱,、效率,、節(jié)能技術(shù)方向上有了更好的選擇,就是用浸沒(méi)式的液冷,。在這個(gè)方向上有相變和非相變不同的技術(shù)方案,,“相變”就是利用冷卻液的沸騰過(guò)程高效的帶走熱量。在浸沒(méi)的相變液冷方面,,曙光應(yīng)該處于國(guó)際領(lǐng)先地位,,浸沒(méi)式液冷的效率比冷板好,不過(guò)目前在浸沒(méi)液冷技術(shù)領(lǐng)域進(jìn)行投入和突破的廠商并不多,。李斌介紹,。
既然浸沒(méi)式液冷的效率比冷板好,為什么采用這個(gè)方式的廠商并不多呢,?李斌說(shuō):“其一是因?yàn)殡y度大,。要實(shí)現(xiàn)浸沒(méi)相變冷卻有一系列的科學(xué)問(wèn)題和工程問(wèn)題需要解決。比如所有的元器件要進(jìn)行浸泡,,它的電信號(hào)等一系列就會(huì)有影響,,這跟普通的風(fēng)冷有很大的差別,需要的不僅僅是物理學(xué),在化學(xué),、材料科學(xué)上都需要突破,。其二是浸沒(méi)液冷的成本和維度難度大?!崩畋笸嘎?,曙光去年在美國(guó)的SC和今年德國(guó)ISC上都展示了新一代風(fēng)冷板的技術(shù)路線,這類產(chǎn)品在國(guó)際上也是非常領(lǐng)先的?,F(xiàn)在開(kāi)始研發(fā)嘗試將液冷技術(shù)用在通用服務(wù)器上,。
目前制冷、散熱效率其實(shí)已經(jīng)低近到了一個(gè)極限,,設(shè)備的密度也做得非常高了,,全年的冷卻PUE曙光可以降到1.04,但依然有很多維度的創(chuàng)新可以做,。李斌表示,,比如熱量利用的如此大的計(jì)算中心所產(chǎn)生的熱量、熱源,,可以用作熱水源給大樓供暖,,給游泳池加熱等,在未來(lái),,當(dāng)我們?cè)O(shè)計(jì)規(guī)劃計(jì)算中心就可以把整體的能耗和能源利用進(jìn)行很好的結(jié)合,。
高性能計(jì)算普及化服務(wù)化
計(jì)算正在向服務(wù)化、云化的方向發(fā)生變化,,高性能發(fā)展也正在高性能計(jì)算機(jī)到高性能計(jì)算技術(shù)方向去演變,。在這種背景之下,高性能計(jì)算機(jī)也在朝著通用化,、普及化,、平民化方向發(fā)展,HPC要實(shí)現(xiàn)平民化會(huì)從哪幾個(gè)維度會(huì)發(fā)生變化,?
李斌表示,,計(jì)算領(lǐng)域的大趨勢(shì)是走向融合,各種技術(shù)包括云計(jì)算,、大數(shù)據(jù),、人工智能、高性能計(jì)算等界限正變得模糊,。而高性能計(jì)算機(jī)的用途正在從科學(xué)計(jì)算,、工程計(jì)算,向面向更多的社會(huì)服務(wù),,包括數(shù)據(jù)處理,、云化服務(wù)方向演變。
李斌進(jìn)一步表示,這樣的融合更多的是從計(jì)算機(jī)設(shè)計(jì)方式或者管理運(yùn)維的方式上進(jìn)行區(qū)別,。比如,,傳統(tǒng)高性能計(jì)算機(jī)的業(yè)務(wù)支撐方式是批處理資源方式。而云的方式更強(qiáng)調(diào)彈性資源配置,,大數(shù)據(jù),、人工智能可能面向不同業(yè)務(wù)的處理方式。從計(jì)算設(shè)備硬件來(lái)說(shuō)沒(méi)有太大的本質(zhì)差別,,更多能是在管理的方式上。現(xiàn)在我們?cè)谠O(shè)計(jì)大型高性能計(jì)算機(jī)時(shí),,已經(jīng)考慮到這樣的資源管理和服務(wù)的方式,,從而提供更加融合的技術(shù)來(lái)支撐。事實(shí)上,,一個(gè)傳統(tǒng)的高性能計(jì)算機(jī)有足夠強(qiáng)的計(jì)算能力和存儲(chǔ)能力來(lái)支撐不同的業(yè)務(wù)類型,,而現(xiàn)在的一些新技術(shù),本身也是以融合服務(wù)為前提,,包括高性能計(jì)算機(jī)也都多分布式存儲(chǔ),,這樣當(dāng)我們?cè)谧龃髷?shù)據(jù)處理的時(shí)候,就可以實(shí)現(xiàn)對(duì)不同業(yè)務(wù)之間的融合,。
人工智能,、大數(shù)據(jù)、物聯(lián)網(wǎng)等應(yīng)用需求現(xiàn)在發(fā)生很多的變化,,這些變化,,要求高性能計(jì)算技術(shù)有怎么樣調(diào)整才能應(yīng)用需求的變化呢?
李斌表示,,高性能計(jì)算機(jī)所面對(duì)的需求在走向融合和多元化,。原來(lái)的HPC過(guò)去更多的任務(wù)處理是偏向離線的,而現(xiàn)在更多的任務(wù)處理要從離線走向在線,。走向在線,,必不可少地要與物聯(lián)網(wǎng)相關(guān)的各種數(shù)據(jù)采集設(shè)備、科學(xué)裝置,、儀器設(shè)備實(shí)現(xiàn)耦合,。計(jì)算方式從過(guò)去的離線處理,走向更多的在線應(yīng)用場(chǎng)景,,要走向在線必服務(wù)方式,,與物聯(lián)網(wǎng)技術(shù)耦合就車(chē)給必須。這其中的變化有兩個(gè)關(guān)鍵趨勢(shì),,一是處理任務(wù)和業(yè)務(wù)類型的變化,,二是與終端設(shè)備或者物聯(lián)網(wǎng)設(shè)備走向聯(lián)合。
增強(qiáng)能力加速國(guó)際化合作
李斌表示,目前國(guó)際上對(duì)高性能計(jì)算機(jī)的定位和方向,、支撐服務(wù)和服務(wù)方式有了一些新共識(shí),,也蘊(yùn)含著一些新的技術(shù)架構(gòu)的變化,同時(shí)國(guó)際上的競(jìng)爭(zhēng)強(qiáng)度,、熱度不斷增大,。從走出去的角度看,曙光一方面是不斷增強(qiáng)實(shí)力,,希望心無(wú)旁鶩的研發(fā),,爭(zhēng)取在技術(shù)創(chuàng)新上有更大的技術(shù)突破,另一方面也在積極尋找合作的機(jī)會(huì),,增強(qiáng)海外的服務(wù)和運(yùn)維能力,。
在這次ISC上,許多來(lái)自美國(guó),、英國(guó)等國(guó)外合作伙伴以及展覽的參觀者都對(duì)硅立方給予了很高的評(píng)價(jià),。來(lái)自俄羅斯的RSC 的COO Alexey表示,曙光的超算已經(jīng)達(dá)到全球領(lǐng)先水平,,我們非常愿意與曙光合作,,為俄羅斯用戶提供先進(jìn)的解決方案。