西班牙巴塞隆納超級運(yùn)算中心(Barcelona Supercomputing Center;BSC)宣布將開發(fā)一款混合型超級計(jì)算機(jī),其中將首次使用Nvidia公司的Tegra ARM CPU及其支持CUDA的Tesla GPU ,,期望能夠?qū)崿F(xiàn)達(dá)百萬兆級(Exascale)的運(yùn)算性能,。
BSC表示,這款原型系統(tǒng)將是世界上第一個(gè)采用ARM CPU/GPU的超級運(yùn)算組合,。該中心指出,,該計(jì)劃的短期目標(biāo)在于開發(fā)出可達(dá)到比當(dāng)今最具能源效率的系統(tǒng)更高2~5倍能效的超級計(jì)算機(jī),最終的目標(biāo)則是使其能較現(xiàn)有超級計(jì)算機(jī)架構(gòu)更低15~ 30倍的能源,,而能達(dá)到Exascale級效能,。
這項(xiàng)崇高的目標(biāo)已經(jīng)被命名為歐盟“EU Mont-Blanc計(jì)劃”,主要在于完成這項(xiàng)概念驗(yàn)證,,以顯示未來在更加節(jié)能的嵌入式移動技術(shù)上所可能實(shí)現(xiàn)的各種應(yīng)用,;同時(shí),針對超級計(jì)算機(jī)領(lǐng)域所能采用的ARM架構(gòu)展開軟件研發(fā),。
“在目前大部份的系統(tǒng)中,,光是CPU本身就消耗掉大部分的能源,這部份通常占了40%以上,,”該項(xiàng)Mont-Blanc計(jì)劃的負(fù)責(zé)人Alex Ramirez表示,。“相形之下,Mont-Blanc架構(gòu)則有賴于嵌入式與行動裝置中用于計(jì)算能效的加速器以及ARM處理器,,從而可望在2014年以前提升4~10倍的能源效率,。”
Nvidia公司Telsa行銷總監(jiān)Sumit Gupta表示,在超級運(yùn)算領(lǐng)域中采用ARM處理器的想法并不像有些人所認(rèn)為的那么牽強(qiáng),,特別是ARM CPU現(xiàn)在已經(jīng)用于云端服務(wù)器中進(jìn)行測試了,。Gupta并提及Calxeda與惠普(HP)公司合作計(jì)劃的重要性──其重要性不僅以概念上來看,同時(shí)也因?yàn)镠P的銷售量通常是相當(dāng)大的,。
“無論人們想要或喜歡什么,,基于ARM的架構(gòu)都將實(shí)現(xiàn),”Gupta說,。“ARM就是高性能運(yùn)算(HPC)和PC的未來,。”
Gupta說,雖然在超級運(yùn)算領(lǐng)域中采用圖形處理器仍是一項(xiàng)相當(dāng)新的技術(shù),但目前已經(jīng)開始看到大量的采用了,,同時(shí),,周遭也開始出現(xiàn)相關(guān)的軟件生態(tài)系統(tǒng)。
為了加速這一發(fā)展趨勢,,并鼓勵更多采用ARM架構(gòu)的計(jì)劃,,NVIDIA公司表示正計(jì)劃開發(fā)一款硬件與軟件開發(fā)工具套件,其中將提供一個(gè)由獨(dú)立型NVIDIA GPU加速的四核NVIDIA Tegra 3 ARM CPU,。
該工具套件的硬件將由SECO公司開發(fā),,預(yù)計(jì)可在2012年上半年完成。NVIDIA公司專有的CUPA并行編程工具套件也將為該硬件提供支持,。
此外,,針對使用Nividia GPU技術(shù)的HPC中心,Nividia還提供了一項(xiàng)獎勵計(jì)劃,,將授予“CUDA卓越研究中心”(CUDA Center of Excellence)的認(rèn)證,。
BSC與莫斯科國立大學(xué)(Lomonosov Moscow State University)最近剛成為“CUDA卓越研究中心”之一,其它還有美國約翰霍普金斯大學(xué),、史丹佛大學(xué),、哈佛大學(xué)、中國科學(xué)院制程工程研究所,、國立臺灣大學(xué),、東京工業(yè)大學(xué)、清華大學(xué)(中國),、劍橋大學(xué),、美國伊利諾大學(xué)香檳分校、馬里蘭大學(xué),、田納西大學(xué),、喬治亞理工學(xué)院以及猶他大學(xué)等13個(gè)CUDA卓越研究中心。
BSC是西班牙加泰羅尼亞理工大學(xué)/巴塞隆納大學(xué)(Universitat Politecnica de Catalunya/Barcelona Tech)旗下的高性能運(yùn)算研究中心,,也是西班牙的國家超級運(yùn)算中心,,以及歐洲效能最強(qiáng)大的超級計(jì)算機(jī)之一MareNostrum的座落基地。該中心最近還部署了西班牙最快的電腦叢集──采用256顆Nvidia Telsa M2090GPU與四核CPU,,據(jù)稱可實(shí)現(xiàn)186Tflop的峰值運(yùn)算性能,。