Portland Group發(fā)布CUDA C/C++多核x86編譯器
2011-12-21
意法半導(dǎo)體全資子公司、全球領(lǐng)先的高性能計(jì)算(HPC)編譯器供應(yīng)商Portland Group宣布,,性能優(yōu)化的支持多核x86平臺(tái)的PGI CUDA C/C++編譯器(CUDA-x86)將于2012年1月與PGI 2012版共同上市發(fā)售,。
CUDA是英偉達(dá)(NVIDIA)開發(fā)的通過NVIDIA GPU(圖形處理器)的強(qiáng)大處理性能大幅提升運(yùn)算性能的并行計(jì)算架構(gòu)。CUDA-x86編程模型最初發(fā)布于2010年NVIDIA GPU技術(shù)研討會(huì)上,,旨在將CUDA編程模型從圖形處理器延伸到系統(tǒng)級(jí),。CUDA-x86的發(fā)布是x86+GPU架構(gòu)成為集成并行平臺(tái)的重要一步。
Portland Group總監(jiān)Douglas Miles表示:“CUDA-x86 是PGI全力支持的CPU+GPU異構(gòu)系統(tǒng)編程藍(lán)圖中重要的里程碑,。集成PGI Accelerator編譯器的基于指令的GPU編程模型讓GPU編程入門變得極其容易,。編程人員通過CUDA擴(kuò)展架構(gòu)能夠編寫明確的擴(kuò)展性很強(qiáng)的并行算法,然后針對(duì)特定平臺(tái)自由擴(kuò)展并深度優(yōu)化算法,。隨著基于加速器的系統(tǒng)普及率不斷提高,,我們預(yù)計(jì)這兩種方法將變得至關(guān)重要。”
英偉達(dá)CUDA市場(chǎng)部總監(jiān)Sanford Russell表示:“CUDA是目前全球使用最廣泛的GPU并行編程模型,軟件開發(fā)人員需要同一代碼可在多個(gè)架構(gòu)上運(yùn)行的靈活性,。CUDA是在異構(gòu)計(jì)算環(huán)境中運(yùn)行的高性能并行應(yīng)用軟件的通用編程模型,,CUDA-x86的上市為用戶帶來了CUDA的優(yōu)勢(shì)。”
PGI 的CUDA-x86編譯器將CUDA C/C++視為AMD 和英特爾的通用多核x86微處理器本機(jī)并行編程語言,。CUDA-x86完全支持英偉達(dá)CUDA C/C++圖形處理器編程語言,,因此,編程人員只需重新編譯CUDA應(yīng)用程序源代碼,,即可在x86 主處理器運(yùn)行CUDA程序,。
通過使用CUDA-x86編程模型,開發(fā)人員能夠編譯并優(yōu)化CUDA應(yīng)用程序,,使其能夠運(yùn)行在基于x86微處理器的工作站,、服務(wù)器和服務(wù)器集群上,無論計(jì)算機(jī)是否配備NVIDIA GPU加速器,。在轉(zhuǎn)譯為在x86處理器上運(yùn)行后,,CUDA C/C++應(yīng)用程序使用英特爾和AMD的多核微處理器和SIMD (單指令多數(shù)據(jù)流)指令集執(zhí)行并行運(yùn)算。
PGI CUDA C/C++多核x86編譯器的主要功能:
· 在x86主處理器上對(duì)本機(jī)CUDA C/C++語言進(jìn)行優(yōu)化和并行化處理,。
· 在x86主處理器上低開銷本機(jī)并行執(zhí)行CUDA C/C++語言,。
· 使用主處理器內(nèi)核執(zhí)行每個(gè)CUDA線程模塊;盡可能自動(dòng)消除同步,。
· 支持AMD和英特爾的最新處理器,,支持新的AVX指令。
· 自動(dòng)內(nèi)聯(lián)內(nèi)核中所有設(shè)備函數(shù),,并將Chevron語法轉(zhuǎn)譯成并行/矢量循環(huán),。
· 在x86主處理器上完全支持英偉達(dá)的CUDA C/C++圖形處理器編程語言。
· 完全支持GPU紋理存儲(chǔ)器,。
· 支持NVIDIA CUBLAS軟件庫(kù),。
· 支持PGI所有的英特爾和AMD主處理器優(yōu)化功能。
此外,,PGI CUDA C/C++ GPU編譯器預(yù)計(jì)在2012年中期上市,,屆時(shí),通過使用PGI Unified Binary™ 技術(shù),,在配備GPU時(shí),,二進(jìn)制的可執(zhí)行程序?qū)⒛軌蚴褂肗VIDIA GPU,如無GPU配備,,二進(jìn)制的可執(zhí)行程序?qū)⒛J(rèn)使用多核x86處理器,。
性能數(shù)據(jù)
在一次主流并行編程模型性能對(duì)比測(cè)試中,PGI使用CUDA-x86版和OpenMP版LBM基準(zhǔn)測(cè)試工具(屬于Parboil基準(zhǔn)測(cè)試軟件)對(duì)CUDA和OpenMP程序的執(zhí)行時(shí)間進(jìn)行了對(duì)比分析,。下表列出了兩個(gè)不同編程模型的程序執(zhí)行時(shí)間:
基準(zhǔn) |
OpenMP執(zhí)行時(shí)間 |
CUDA 執(zhí)行時(shí)間 |
LBM |
221秒 |
221秒 |
系統(tǒng):4核英特爾酷睿i7 920(2.67GHz),,12GB內(nèi)存,,Red Hat Enterprise Linux 5.3
如欲了解詳細(xì)的性能信息,,請(qǐng)?jiān)L問PGI公司網(wǎng)站:http://www.pgroup.com/cuda-x86
價(jià)格與供貨
PGI CUDA C/C++多核x86編譯器是預(yù)計(jì)于2012年1月發(fā)布的PGI 2012 12.1版的組件,。PGI Accelerator C/C++ 授權(quán)用戶通過當(dāng)前的訂閱服務(wù)可免費(fèi)獲得最新版編譯器。PGI產(chǎn)品支持Linux,、Apple Mac OS X以及Microsoft Windows等操作系統(tǒng),。用戶在Portland Group網(wǎng)站注冊(cè)后,即可獲得15天免費(fèi)試用,。Portland Group公司網(wǎng)站:www.pgroup.com,。
關(guān)于Portland Group
意法半導(dǎo)體的全資子公司Portland Group是知名的軟件開發(fā)商,為基于AMD和英特爾的x64處理器和NVIDEA GPU加速器的工作站,、服務(wù)器和服務(wù)器群集提供高性能并行Fortran,、C和C++編譯器及開發(fā)工具。關(guān)于Portland Group的產(chǎn)品詳情,,請(qǐng)?jiān)L問公司網(wǎng)站www.pgroup.com或發(fā)電子郵件至[email protected],。