繼在游戲,、數(shù)據(jù)中心市場收獲巨額回報之后,,英偉達希望覆蓋更多的AI計算領域,而下一個重點就是企業(yè)計算,。在日前舉辦的COMPUTEX 2021上,,英偉達面向企業(yè)計算發(fā)布了重大計劃和創(chuàng)新產(chǎn)品。
黃仁勛在今年4月的GTC大會上,,首次強調(diào)了發(fā)展企業(yè)計算的決心,。在他看來,現(xiàn)在正處于第二輪AI發(fā)展浪潮的起點,,而這波發(fā)展將以企業(yè)和產(chǎn)業(yè)邊緣計算為主,,AI將徹底改變?nèi)虼笮托袠I(yè),包括制造,、物流,、農(nóng)業(yè)、醫(yī)療健康,、金融服務和運輸業(yè),。
在COMPUTEX 2021上,英偉達企業(yè)計算負責人Manuvir Das也表示,,現(xiàn)在是實現(xiàn)AI大眾化,,將其巨大力量帶給企業(yè)用戶及其客戶的好時機。
英偉達企業(yè)計算負責人Manuvir Das
面向企業(yè)級AI計算,,英偉達在構(gòu)建三個基本要素:普適性強,、可用于制造任何系統(tǒng)的硬件基礎,用于AI的軟件平臺,,以及用于協(xié)作設計的軟件平臺。
擴大認證服務器生態(tài)系統(tǒng)
目前,面向企業(yè)級的NVIDIA EGX,,英偉達正在擴大NVIDIA-Certified認證服務器生態(tài)系統(tǒng),,使得企業(yè)用戶的使用和部署更為便捷。
Das解釋說,,為助力系統(tǒng)制造商創(chuàng)建AI優(yōu)化設計,,并確保這些系統(tǒng)能夠得到客戶的信賴,NVIDIA 制定了一項針對GPU加速服務器的計劃——NVIDIA 認證計劃,。
來自研華科技,、Altos、永擎電子,、華碩,、戴爾科技、技嘉,、慧與,、聯(lián)想、QCT,、超微等公司的 NVIDIA 認證系統(tǒng)正在不斷增加,,其中包括主流數(shù)據(jù)中心使用的一些主流 x86 服務器,它們將AI的力量帶了給更多行業(yè),,包括醫(yī)療,、制造、零售和金融服務,。
憑借NVIDIA認證系統(tǒng),,企業(yè)能夠支持傳統(tǒng)數(shù)據(jù)中心以及混合云中的各種復雜工作。其中包括在VMware vSphere上運行NVIDIA AI Enterprise和數(shù)據(jù)分析軟件,,來部署支持AI的企業(yè)級平臺,,從而實現(xiàn)批量運行AI工作負載;還包括在NVIDIA Omniverse Enterprise上實現(xiàn)設計協(xié)作,、高級模擬以及在紅帽O(jiān)penShift平臺上實現(xiàn)AI部署,。系統(tǒng)還可與 Cloudera 數(shù)據(jù)工程和機器學習無縫集成,把交付模型的時間從幾個小時縮短至幾分鐘,。
據(jù)了解,,NVIDIA 認證系統(tǒng)經(jīng)過嚴格的測試,在性能,、安全性和可擴展性方面延續(xù)NVIDIA 的設計最佳實踐,。這些系統(tǒng)的價格和性能水平各異,采用NVIDIA A100,、A40,、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列網(wǎng)卡,。
目前,在高級AI訓練和云計算服務領域,,戴爾科技,、慧與、寧暢和超微已經(jīng)率先推出基于NVIDIA HGX加速計算平臺,、經(jīng)過認證的新服務器,。這些產(chǎn)品通過四或八個NVIDIA A100 GPU、NVIDIA NVLink GPU互連技術,、NVIDIA InfiniBand網(wǎng)絡以及NVIDIA AI和HPC軟件棧提供領先的AI性能,。
首批NVIDIA認證系統(tǒng)運用BlueField-2 DPU提升安全性
“今后,DPU 將成為所有服務器,、數(shù)據(jù)中心和邊緣的一個重要組成部分”,,Das 表示,“NVIDIA 認證系統(tǒng)計劃將擴展至采用 NVIDIA BlueField DPU 的系統(tǒng),?!?/p>
今年下半年,幾家系統(tǒng)制造商將首次發(fā)布經(jīng)過新一類NVIDIA認證系統(tǒng)的服務器,,將通過BlueField-2 DPU(數(shù)據(jù)處理器)在網(wǎng)絡,、存儲和安全性能上實現(xiàn)突破。
通過卸載CPU的工作任務,,單一BlueField-2 DPU可以提供125個CPU核才能實現(xiàn)的數(shù)據(jù)中心服務,,從而釋放服務器CPU周期以支持各種關鍵業(yè)務應用。
NVIDIA 認證將于2022年擴展至Arm CPU服務器
Das 宣布,,NVIDIA 認證系統(tǒng)計劃將擴展至支持配備 Arm 核主機 CPU 的加速系統(tǒng),。
此外,英偉達與技嘉科技合作開發(fā)了一款Arm HPC開發(fā)者套件,,為HPC,、AI和科學計算應用開發(fā)提供硬件和軟件一體化的平臺。該平臺經(jīng)NVIDIA驗證,,可滿足嚴苛的HPC應用要求,,包含一個來自Ampere Computing的基于Arm Neoverse的Ampere Altra處理器、兩個A100 GPU,、兩個BlueField-2 DPU以及NVIDIA HPC SDK,。
Das 表示:“隨著 GPU 和 DPU 加速器承擔更多的 AI 計算工作負載,將主機 CPU 作為編排器比將它作為計算引擎更有用,?!?/p>
下一步,為了將Arm生態(tài)系統(tǒng)擴展至企業(yè)以實現(xiàn)高性能AI計算,,技嘉科技和緯穎科技計劃將提供新的服務器,,采用基于Arm Neoverse 的CPU,、NVIDIA Ampere架構(gòu)GPU/BlueField-2 DPU。這款服務器預計將于明年上市,,屆時將被提交至NVIDIA進行認證,。
云端開發(fā)中心便于企業(yè)AI項目從原型快速投入生產(chǎn)
為了幫助企業(yè)將AI項目從原型快速投入生產(chǎn),,英偉達最新發(fā)布了一款托管在云端的開發(fā)中心NVIDIA Base Command Platform,。
多數(shù)企業(yè)現(xiàn)在都知道AI對其數(shù)字化轉(zhuǎn)型計劃的成功至關重要,但是目前面臨的一項復雜挑戰(zhàn)是,,如何將其部署并整合到企業(yè)中,。NVIDIA Base Command Platform專為大規(guī)模、多用戶和多團隊的 AI 開發(fā)工作流程而設計,,而且這些工作流程既可以在本地也可以在云中托管,。憑借這款軟件,研究人員和數(shù)據(jù)科學家能夠同時使用加速計算資源工作,,幫助企業(yè)最大程度地提高其專家級開發(fā)者和寶貴 AI 基礎設施的生產(chǎn)力,。
谷歌云成為計劃在云實例中啟用Base Command Platform 來管理和編排集群的首批云服務提供商之一。谷歌云機器學習基礎設施產(chǎn)品管理總監(jiān)Manish Sainani表示:“這款混合型AI產(chǎn)品,,可以使得企業(yè)只需編寫一次就能在任何地方運行,,靈活接入多個NVIDIA A100 Tensor Core GPU,通過采用按需的加速計算,,企業(yè)可以加快AI開發(fā)速度,。”
據(jù)介紹,,Base Command Platform為整個AI開發(fā)提供了統(tǒng)一的視圖,。該視圖通過圖形用戶界面和命令行API以及綜合監(jiān)控和報告儀表盤來促進資源的輕松共享。包括NVIDIA NGC的AI和分析軟件目錄,、與MLOps軟件集成的API,、Jupyter筆記本等在內(nèi)的一系列豐富的AI和數(shù)據(jù)科學工具幫助研究人員可以更快的計劃和安排工作負載、完善模型和獲得洞察,。
3D設計/模擬協(xié)作和安全也是布局重點
Das 還宣布,,NVIDIA 將與全球領先的系統(tǒng)供應商合作提供NVIDIA Omniverse Enterprise,助力各行各業(yè)的團隊輕松開展 3D 設計和模擬協(xié)作,。屆時,,每家公司需支付的費用為 14,000 美元起。
安全方面,,Das宣布正與紅帽合作,,為 OpenShift 和目前企業(yè)級數(shù)據(jù)中心中最常用的商業(yè) Linux 版本——紅帽企業(yè) Linux(Red Hat Enterprise Linux,簡稱RHEL)提供 Morpheus 開發(fā)者套件,。Morpheus是今年GTC大會上發(fā)布的,,使用機器學習來識別,、捕捉和處理威脅與異常的一款軟件套件。
據(jù)Das 介紹,,網(wǎng)絡安全公司現(xiàn)在將能夠在 RHEL 和 OpenShift 上使用 Morpheus,,為所有企業(yè)級數(shù)據(jù)中心帶來先進的安全措施。
寫在最后
繼在嵌入式領域,、邊緣市場布局了五六年后,,英偉達今年明顯針對企業(yè)級計算加大了投入力度。
任何邊緣端設備,,穩(wěn)定性,、長時間運行的故障率等都是非常重要的指標,英偉達正在通過其認證計劃在這方面做出支持和保證,。
此外,,在邊緣計算領域,某些情況下比數(shù)據(jù)中心更復雜,,比如在面臨各種各樣的設備和應用選件時,,如何把不同應用融合在一起成為一個成熟的產(chǎn)品,考驗的是平臺完備性,。這是英偉達在邊緣市場面臨的挑戰(zhàn),。
當然,邊緣設備和數(shù)據(jù)中心其實是緊密結(jié)合的,,因為模型都是從云中訓練所得,,這是英偉達從數(shù)據(jù)中心向邊緣擴展的巨大優(yōu)勢。為了幫助合作伙伴的想法快速落地,,中間的架構(gòu)統(tǒng)一性,、還有各種工具便利性就變得非常重要。這也將是英偉達下一步在邊緣計算生態(tài)建設和產(chǎn)品創(chuàng)新的關鍵,。