英特爾?至強?可擴展處理器是面向云游戲,、多媒體處理與傳輸、虛擬桌面基礎(chǔ)架構(gòu)和推理運算的處理器標(biāo)桿,,致力于為當(dāng)今的媒介消費提供鼎力支持,。隨著當(dāng)前工作負(fù)載密度和復(fù)雜程度的快速增長,,以上每個細(xì)分領(lǐng)域都將提出不同的工作負(fù)載需求,包括從處理像素,、推理和分析,、到渲染新的畫面內(nèi)容,再到將這些像素輸出至客戶端設(shè)備進行查看或進一步分析,。然而,,目前這些工作都是通過在云端的各個獨立產(chǎn)品來完成的。
在本屆英特爾 On 產(chǎn)業(yè)創(chuàng)新峰會(Intel Vision)上,,英特爾分享了其代號為 Arctic Sound-M(ATS-M)的數(shù)據(jù)中心 GPU 的更多細(xì)節(jié),。ATS-M 是一顆支持高質(zhì)量轉(zhuǎn)碼和高性能的強大 GPU,能夠提供每秒 150 萬億次運算(150 TOPS),,共擁有兩種配置,。ATS-M 能夠通過單一解決方案靈活地處理廣泛的工作負(fù)載,并在不犧牲性能或者質(zhì)量的同時,,優(yōu)化總體擁有成本(TCO),。
更多信息:欲了解關(guān)于代號為 Arctic Sound-M 的英特爾數(shù)據(jù)中心 GPU 的更多信息,以及 Business Insights Vision 上的演講和新聞,,請訪問英特爾新聞中心,。
面向數(shù)據(jù)中心工作負(fù)載的多用途 GPU
該英特爾數(shù)據(jù)中心 GPU 將包含兩種不同的配置。150W 功率版本在一個3/4長,、全高尺寸的 PCIe 4.0 加速卡中封裝了 32 個 Xe 內(nèi)核,。75W 功率版本則在半高尺寸的 PCIe 4.0 加速卡中封裝了兩顆具有 8 個 Xe 內(nèi)核的 GPU,共 16 個 Xe 內(nèi)核,。這兩種配置均配備了 4 個 Xe 媒體引擎,、英特爾首款面向數(shù)據(jù)中心的 AV1 硬件編碼器和加速器、GDDR6 內(nèi)存,、光線追蹤單元和內(nèi)置 XMX AI 加速,。
采用開源軟件的行業(yè)領(lǐng)先數(shù)據(jù)中心 GPU
該英特爾數(shù)據(jù)中心 GPU 由完整的解決方案堆棧支持,為開發(fā)者提供了面向流媒體,、云游戲和云端推理的開源軟件堆棧,,并廣泛支持 AVC、HEVC,、VP9,,以及更多 API,、框架和最新的編解碼器。
oneAPI 為加速計算提供了高效,、智能的路徑,,讓開發(fā)者免受專有編程模型所帶來的經(jīng)濟和技術(shù)負(fù)擔(dān)。它為專用硬件的封閉編程語言供了開放的選擇,,即通過一套完整,、可靠的工具包來完善現(xiàn)有編程語言和并行計算模型,從而釋放硬件的全部性能,,并且能夠讓開發(fā)者設(shè)計出開放,、可移植的代碼,更大限度地利用多種 CPU 和 GPU 的組合,。
云游戲
全球云游戲市場呈現(xiàn)持續(xù)快速增長趨勢,,預(yù)計到2026年,其復(fù)合年增長率(CAGR)將達到 43.2%,,市值將近 32 億美元[1],。英特爾可為 Windows 和 Android 云游戲平臺提供支持,為廣大玩家?guī)砀咂焚|(zhì)的游戲體驗,。ATS-M 擁有兩種不同的產(chǎn)品外形設(shè)計,,用戶可靈活地選擇符合他們特定工作負(fù)載的產(chǎn)品配置。無論用戶對峰值性能,、高密度提出需求,,還是期待通過一個平臺滿足跨智能手機和 PC 游戲的融合云游戲解決方案,這款 GPU 均可以提供出色的游戲串流體驗,。
全堆棧媒體流支持
該 GPU 配備了英特爾首款基于硬件加速的 AV1 編碼器,,可在不犧牲質(zhì)量的同時,帶來 30%[2] 比特率的提升,。[3]作為引領(lǐng)新一代媒體串流的 GPU,,它可實現(xiàn)一卡同時處理多達 8 路 4K 視頻流或超過30 路 1080p 視頻流。在一臺 4 卡服務(wù)器中,,可以實現(xiàn)每節(jié)點處理 120 路視頻流以及每機架處理 13,000 路視頻流,。
利用 Intel oneVPL,媒體串流和傳輸軟件堆??梢悦嫦虬?AV1 在內(nèi)的所有主流編解碼器進行解碼和編碼加速,。流媒體發(fā)行商可以在 FFmpeg 或 GStreamer 這兩大領(lǐng)先多媒體處理框架中進行選擇,它們均可通過 oneVPL 針對英特爾 CPU 和 GPU 進行加速,。英特爾還提供了開放視覺云(Open Visual Cloud),,這是一套用于媒體、分析,、圖形和沉浸式媒體的開源軟件堆棧,,它針對云原生部署進行了優(yōu)化,使其能夠在 FFmpeg 和 GStreamer 框架內(nèi)運行,。
全堆棧虛擬桌面基礎(chǔ)架構(gòu)支持(VDI)
過去兩年,,隨著遠(yuǎn)程辦公需求的增加,虛擬桌面基礎(chǔ)架構(gòu)(VDI)和設(shè)備即服務(wù)(DaaS)迎來了快速增長(最近一項研究表明增長超過 11%[4])?,F(xiàn)代操作系統(tǒng)和應(yīng)用程序?qū)D形處理的要求越來越高,,顯示器的分辨率也隨之提高;GPU 可以通過承載渲染和編碼功能,,以更短的響應(yīng)時間和更高的幀率來改善用戶體驗,。由此釋放出來的 CPU 處理能力可以帶來應(yīng)用程序工作負(fù)載的性能提升。
英特爾的這款數(shù)據(jù)中心 GPU 還提供了靈活的虛擬 GPU(vGPU)調(diào)度策略(固定的,、靈活的以及硬件利用率優(yōu)化過的時間片任務(wù)調(diào)度器),,讓管理員能夠單獨微調(diào) GPU 上每個虛擬機的運行指令。目前,,其他廠商的產(chǎn)品僅允許在所有虛擬機的全局設(shè)置中進行相關(guān)調(diào)整,。
與目前市面上其他產(chǎn)品不同的是,英特爾不會針對基于硬件的可擴展 I/O 虛擬化(SIOV)額外收取任何軟件授權(quán)費,,這將有助于相關(guān)提供商降低虛擬化部署的總成本,。
全堆棧媒體分析支持
每個在視覺媒體場景執(zhí)行的推理都需先經(jīng)過視頻解碼和預(yù)處理,然后才能交給 AI 模型進行下一步操作,。集成兩顆 GPU 的 75W 功率版本 ATS-M 能夠在計算和解碼能力上實現(xiàn)很好的平衡,,且不受媒體限制。因此,,它能夠針對媒體分析類的工作負(fù)載提供良好的擴展性,,為客戶提供更高的流密度和更低的成本。
在使用 oneVPL 對于視頻流的解碼和編碼進行加速的同時,,oneDNN(oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫)可針對內(nèi)核進行 AI 優(yōu)化,,加速面向 TensorFlow 或 PyTorch 框架的推理模型;也可通過 OpenVINO 的模型優(yōu)化器和推理引擎,,進一步加速推理以及客戶工作負(fù)載的部署,。上述 AI 和媒體軟件以及堆棧的組合可以在至強處理器和英特爾數(shù)據(jù)中心 GPU 之間無縫運行。
代號為 Arctic Sound-M 的英特爾數(shù)據(jù)中心 GPU 已經(jīng)獲得超過 15 款來自業(yè)界領(lǐng)先合作伙伴的設(shè)計,,并將于 2022 年第三季度發(fā)布,。