為進一步幫助開發(fā)者利用英特爾硬件的先進功能,,近日,英特爾宣布英特爾? oneAPI工具包的2023年版本已在英特爾?開發(fā)者云平臺(Intel? Developer Cloud)上線,,并正在通過現(xiàn)有的渠道推送。
新的oneAPI 2023工具包支持即將推出的第四代英特爾?至強?可擴展處理器、英特爾?至強? CPU Max 系列和英特爾?數(shù)據(jù)中心GPU,,包括Flex系列和新的Max系列。這些工具可提升性能和生產(chǎn)力,,并增加了對新的Codeplay1插件的支持,,使開發(fā)者能更容易地為那些非英特爾的GPU架構(gòu)編寫SYCL代碼。這些基于標準的工具提供了硬件方面的選擇,,也讓在跨架構(gòu)系統(tǒng)上運行的高性能應用的開發(fā)變得更加輕松,。
英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫,、分析和移植工具,,以及優(yōu)化后的AI和機器學習框架,讓開發(fā)者能為oneAPI支持的CPU,、GPU和FPGA構(gòu)建高性能,、跨架構(gòu)的應用。開發(fā)者可使用這些工具快速實現(xiàn)性能目標,,并通過單個代碼庫節(jié)省時間,,從而將更多時間用于創(chuàng)新。
新版本的oneAPI工具包可幫助開發(fā)者利用英特爾硬件的先進功能:
· 第4代英特爾至強可擴展處理器和至強CPU Max系列,,內(nèi)置英特爾?高級矩陣擴展(英特爾? AMX),、Quick Assist 技術(QAT)、英特爾?AVX-512,、bfloat16 及更多,。
· 英特爾?數(shù)據(jù)中心GPU,包括內(nèi)置基于硬件的AV1編碼器的Flex系列,,以及Max系列,。Max系列提供靈活數(shù)據(jù)類型的支持,內(nèi)置英特爾? Xe矩陣擴展(英特爾?XMX),、矢量化引擎(vector engine),、英特爾?Xe-Link互聯(lián)擴展和其它功能。
oneAPI 2023工具包具有先進的軟件性能:
· 英特爾? Fortran編譯器(Intel? Fortran Compiler)提供了完整的 Fortran 語言直至 Fortran 2018標準的支持,并擴展了對 OpenMP GPU 分流的支持,,加快了符合標準的應用程序的開發(fā),。
· 英特爾? oneAPI數(shù)學內(nèi)核庫(oneMKL)包含OpenMP 分流能力的擴展,提高了可移植性,。
· 英特爾? oneAPI 深度神經(jīng)網(wǎng)絡庫(oneDNN) 支持第四代英特爾至強處理器和Max系列CPU處理器的高級深度學習功能,,包括英特爾?AMX、英特爾?AVX-512,、VNNI 和 bfloat16,。
通過豐富的SYCL支持,以及代碼遷移和分析工具的強化,,讓面向多架構(gòu)系統(tǒng)的代碼開發(fā)變得更輕松,,進而提高開發(fā)者的生產(chǎn)力。
· 英特爾?oneAPI DPC++/C++編譯器增加了Codeplay為英偉達和AMD GPU開發(fā)的新插件的支持,,以簡化SYCL代碼的編寫,,并提高代碼面向這些處理器架構(gòu)的可移植性。這提供了一個統(tǒng)一的構(gòu)建環(huán)境,,并整合了工具,,以提高跨平臺生產(chǎn)力。作為該解決方案的一部分,,英特爾和Codeplay將為英偉達GPU的oneAPI插件開始提供商業(yè)化的優(yōu)先支持(priority support),。
· 基于開源 SYCLomatic的英特爾? DPC++ 兼容性工具增加了100多個新的CUDA APIs支持,讓從CUDA到SYCL的代碼遷移變得更容易,。
· 用戶可以使用英特爾?VTune? Profiler識別大規(guī)模MPI應用中的不均衡問題,。
· 英特爾? Advisor為英特爾數(shù)據(jù)中心GPU Max系列添加了自動化roofline分析,以識別內(nèi)存,、緩存或計算瓶頸,,確認其原因并進行優(yōu)先處理,同時提供可操作的建議,,以優(yōu)化從CPU到GPU 的工作負載分流中的重復數(shù)據(jù)傳輸成本,。
48%4的開發(fā)者面向使用多種處理器的異構(gòu)系統(tǒng)進行開發(fā),因此需要更高效的跨架構(gòu)編程來應對現(xiàn)實工作負載日益擴大的范圍和規(guī)模,。結(jié)合使用oneAPI 的開放,、統(tǒng)一的編程模型與英特爾基于標準的多架構(gòu)工具,開發(fā)者能夠在CPU和加速器的硬件,、性能,、生產(chǎn)力和代碼可移植性方面自由地進行選擇。相反,,為專有編程模型(如 CUDA)編寫的代碼,,缺乏面向其它硬件的可移植性,,讓開發(fā)實踐變得孤立,將企業(yè)困于一個封閉的生態(tài)系統(tǒng)中,。
此外,, 開放生態(tài)系統(tǒng)也在繼續(xù)擴大對oneAPI的使用,新的oneAPI卓越中心正在陸續(xù)成立,。劍橋大學Open Zettascale 實驗室正致力于將重要的百萬兆級的備選代碼(candidate codes)移植到oneAPI上,,包括CASTEP,、FEniCS和AREPO,。該中心還提供課程和研討會,由專家講授oneAPI使用方法和工具,,用于編譯和移植代碼以及優(yōu)化性能,。目前,在全球總共已經(jīng)建立了30個oneAPI卓越中心,。
更多信息可以來這里獲取==>>電子技術應用-AET<<