受惠于過去幾年人工智能的爆發(fā),,全球GPU領導廠商英偉達不但成為全球市值最高的半導體企業(yè),。與此同時,公司又收購了Mellanox和Arm,,打造了完整的數(shù)據(jù)中心芯片產(chǎn)品線,,全新的英偉達儼然成為數(shù)據(jù)中心最炙手可熱的明星。
英偉達創(chuàng)始人黃仁勛在昨晚開幕的GTC大會上也表示,在其CPU,、DPU和GPU這三條產(chǎn)品線,,公司未來在數(shù)據(jù)中心將會創(chuàng)造更多可能。而在本次大會上,,英偉達也帶來了CPU和DPU的更新,。尤其是收購Arm之后發(fā)布的首款CPU,更吸引了廣泛的關注,。
在筆者看來,,這顆芯片的發(fā)布,又一次吹響了英偉達向英特爾盤踞的數(shù)據(jù)中心市場進攻的號角,。
為什么數(shù)據(jù)中心需要新的xPU,?
熟悉數(shù)據(jù)中心構造的讀者應該知道,傳統(tǒng)的數(shù)據(jù)中心必不可少的一個芯片那就是英特爾X86架構的CPU,。然而伴隨著AI的流行,,這種傳統(tǒng)的架構就不再滿足了新興應用的需求,這就給有用并行計算先天優(yōu)勢的英偉達帶來了機會,,這也是他們過去幾年在數(shù)據(jù)中心如魚得水的原因,。
但按照黃仁勛的說法,隨著數(shù)據(jù)中心訓練模型的變大,,加上對芯片處理能力需求的提升,,這就給數(shù)據(jù)中心的CPU的數(shù)據(jù)“搬運”和網(wǎng)絡相關處理帶來了新的挑戰(zhàn)。換而言之,,就是當前數(shù)據(jù)中心使用的X86 CPU很難兼顧數(shù)據(jù)在CPU和GPU之間流動和網(wǎng)絡處理的需求,,為此這就給DPU和英偉達自研的Arm架構CPU帶來了機會。這也是英偉達收購Mellanox和Arm的原因,。
所謂DPU,,也就是Data Processing Unit(數(shù)據(jù)處理器)。在英偉達的產(chǎn)品線布局中,,這是一款把ARM處理器核,、VLIW矢量計算引擎和智能網(wǎng)卡的功能集成在了一起的產(chǎn)品,主要應用在分布式存儲,、網(wǎng)絡計算和網(wǎng)絡安全領域,。根據(jù)相關資料顯示,這款產(chǎn)品是他們基于公司之前收購的Mellanox內(nèi)部孵化而成的,。
據(jù)介紹,,DPU可從CPU上卸載關鍵的網(wǎng)絡、存儲和安全任務,,使企業(yè)能夠將其IT基礎設施轉變?yōu)樽钕冗M的數(shù)據(jù)中心,。此類數(shù)據(jù)中心可實現(xiàn)加速,、具有完全可編程性,并具有 “零信任”安全功能,,防止數(shù)據(jù)泄露和網(wǎng)絡攻擊,。這就減輕了CPU的負載,讓其只專注于亟需處理的各種企業(yè)應用程序,。
來到CPU方面,,正如前文所說,數(shù)據(jù)中心目前幾乎都是X86架構的至強處理器的市場,。然而黃仁勛指出,,正是因為這樣的配置,影響了整個數(shù)據(jù)中心的數(shù)據(jù)傳輸,。“現(xiàn)在CPU的存儲和PCIE帶寬,,嚴重影響了GPU能力的釋放”,,黃仁勛強調(diào),為此他推出了全新的基于Arm架構打造的CPU Grace,,希望借助這個新處理器以及自有的NVlink來解決這個數(shù)據(jù)瓶頸問題,。
英偉達xPU的強勢出擊
在上述思路的驅動下,英偉達推出了全新的DPU Bluefield-3 和新款CPU Grace,。
首先看DPU方面,,據(jù)介紹,BlueField-3將具有16個Arm A78內(nèi)核,,能提供十倍于BlueField 2的計算能力,,在帶寬方便則可以達到400Gbit / s,同時也加上了對PCIe gen 5的支持,,獲得了比PCIe gen 3快四倍的速度,。在這個芯片中,Nvidia還加入了兩個加速器,,為軟件定義存儲,、網(wǎng)絡、安全,、流和TLS / IPSEC加密等應用提供支持,。此外和BlueField-2一樣BLUEFIELD-3能給5G電信和時間同步數(shù)據(jù)中心的精確定時。數(shù)據(jù)顯示BlueField-3的額定值為350 SPECINT和1.5 TOPS(TeraOps),。
黃仁勛進一步指出,,一個Bluefield-3 DPU約等于300個x86 cpu內(nèi)核,因此它能夠大大減輕CPU的負載,。BlueField-3同時還可以充當Nvidia的Morpheus云原生網(wǎng)絡安全框架的監(jiān)視或遙測代理,。據(jù)介紹,,公司將于2024年推出性能更強的Bluefield-3 ,進一步加強公司在這個市場的影響力,。
以美國海軍少將,、計算機編程先驅Grace Hopper的名字命名的CPU,則開啟了英偉達數(shù)據(jù)中心的新時代,。據(jù)黃仁勛介紹,,這個處理器能夠與常規(guī)GPU產(chǎn)品一起工作,讓公司能夠獲得更全面地垂直集成其硬件堆棧的能力,。按照NVIDIA的說法,,該芯片是專門為大規(guī)模神經(jīng)網(wǎng)絡工作負載設計的,預計將于2023年在NVIDIA產(chǎn)品中使用,。
按照anandtech介紹,,Grace的發(fā)布旨在填補NVIDIA AI服務器產(chǎn)品線中CPU的空白。該公司的GPU非常適合某些類的深度學習工作負載,,但GPU并不能執(zhí)行數(shù)據(jù)中心里的所有操作,,這就是CPU存在的意義,為此NVIDIA當前的服務器產(chǎn)品通常依賴于AMD的EPYC處理器和Intel至強這樣的處理器,,
但正如前文所說,,這些處理器對于一般的計算而言是非常快,,但不能滿足NVIDIA所追求的那種高速I / O和深度學習優(yōu)化,。特別在NVIDIA目前使用PCI Express來進行CPU和GPU連接時,這種連接方式就成為瓶頸,。如果引入NVLink,,那么系統(tǒng)中的GPU彼此之間就可以直接快速對話,而不需返回主機CPU或系統(tǒng)RAM,。
“基于Grace的系統(tǒng)與NVIDIA GPU緊密結合后,,性能將比目前基于X86 CPU的,最先進的 NVIDIA DG高出十倍”,,黃仁勛表示,。“絕大多數(shù)的數(shù)據(jù)中心仍將繼續(xù)使用現(xiàn)有的CPU,,而Grace將主要用于計算領域的細分市場”,,黃仁勛進一步指出。
從anandtech的介紹我們可以看到,,在之前,,NVIDIA為了在數(shù)據(jù)中心使用NVLink,選擇了POWER9處理器作為合作伙伴,,但Grace的發(fā)布,,從某種程度上宣布了這種合作的終結,。
寫在最后
其實在這次發(fā)布會上,NVIDIA還發(fā)布了他們新一代的AI自動駕駛汽車處理器NVDIA DRIVE Atlan,,它能夠提供約為上代產(chǎn)品Orin四倍的速度,。作為一款集成了DPU、下一代架構GPU,、新型Arm 內(nèi)核和最新深度學習和計算機視覺加速器的SoC,,NVDIA DRIVE Atlan能夠獲得高達1000TOPS的速度,以及能提供極高的帶寬,,為未來的自動駕駛設計賦能,。
除了芯片以外,NVIDIA還帶來了各種軟硬件的更新,,例如用于仿真,、協(xié)作、和自助機器訓練的NVIDIA Omniverse,,專為工作組打造的便攜式AI數(shù)據(jù)中心NVIDIA DGX Station,,面向企業(yè)級的NVDIA EGX,用于訓練Transformer框架的NVIDIA Megatron,,用于計算藥物研發(fā)加速庫Clara Discovery的一些模型,能夠為量子電路模擬器提供加速的cuQuantum,,數(shù)據(jù)中心安全平臺NVIDIA Morpheus,,先進的深度學習對話式AI Jarvis和推理服務器Triton等一系列產(chǎn)品。此外,,英偉達還宣布了和Ampere computing和Amazon等一系列Arm服務器芯片廠商的合作,,共同推動Arm生態(tài)的發(fā)展。
黃仁勛表示,,憑借公司現(xiàn)有的芯片,、軟件、AI和各種產(chǎn)品,,英偉達能助力開發(fā)者成就畢生的事業(yè),。尤其是在芯片方面,黃仁勛強調(diào),,公司數(shù)據(jù)中心路線圖包括CPU,、GPU和DPU這三類芯片,而Grace和BlueField是其中必不可少的關鍵組成部分,。每個芯片架構歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉變),,一年專注于 x86 平臺,另一年專注于 Arm 平臺,。
“我們每年都會發(fā)布激動人心的新品,。三類芯片,,逐年飛躍,一個架構,?!秉S仁勛補充說。