NVIDIA刷新AI推理紀(jì)錄，推出面向企業(yè)級服務(wù)器的A30和A10 GPU-AET-電子技術(shù)應(yīng)用

NVIDIA刷新AI推理紀(jì)錄，推出面向企業(yè)級服務(wù)器的A30和A10 GPU

日期： 2021-04-24

來源：EEWORLD

關(guān)鍵詞： NVIDIA 企業(yè)級服務(wù)器

　　NVIDIA刷新AI推理紀(jì)錄，推出面向企業(yè)級服務(wù)器的A30和A10 GPU

　　NVIDIA AI平臺在從數(shù)據(jù)中心到邊緣的所有MLPerf基準(zhǔn)測試類別中脫穎而出

　　加利福尼亞州圣克拉拉市—2021年4月21日—NVIDIA今日宣布其AI推理平臺在最新MLPerf基準(zhǔn)測試所有類別中展現(xiàn)出的性能均創(chuàng)下紀(jì)錄。這一AI推理平臺通過NVIDIA? A30和A10 GPU對主流服務(wù)器實(shí)現(xiàn)了全新的擴(kuò)展。

　　MLPerf是業(yè)界公認(rèn)的AI性能衡量基準(zhǔn)，涵蓋計(jì)算機(jī)視覺、醫(yī)學(xué)影像、推薦系統(tǒng)、語音識別和自然語言處理等一系列工作負(fù)載。

　　此次MLPerf是NVIDIA A30和A10 GPU的首秀。兩款GPU集高性能與低功耗于一身，可成為企業(yè)在AI推理、訓(xùn)練、圖形和傳統(tǒng)企業(yè)級計(jì)算工作負(fù)載等諸多方面的主流選擇。思科、戴爾科技、慧與、浪潮和聯(lián)想預(yù)計(jì)將從今年夏季開始將這兩款GPU集成到其最高容量的服務(wù)器中。

　　NVIDIA能夠取得如此佳績，得益于NVIDIA AI平臺的廣度，其包含多種類型的GPU和AI軟件，包括TensorRT?和NVIDIA Triton?推理服務(wù)器—— 微軟、Pinterest、Postmates、T-Mobile、USPS和微信等領(lǐng)先企業(yè)都部署了該平臺。

　　NVIDIA加速計(jì)算部門總經(jīng)理兼副總裁Ian Buck表示：“隨著AI持續(xù)為各行各業(yè)帶來變革，MLPerf也成為企業(yè)的一項(xiàng)重要工具，能夠助力其在IT基礎(chǔ)設(shè)施投資方面做出明智的決策。如今，所有主要OEM廠商都提交了MLPerf測試結(jié)果，NVIDIA及合作伙伴的關(guān)注點(diǎn)不僅在于實(shí)現(xiàn)全球領(lǐng)先的AI性能，同時還注重通過即將面市的一系列搭載A30和A10 GPU的企業(yè)級服務(wù)器來實(shí)現(xiàn)AI普及化。”

　　MLPerf結(jié)果

　　NVIDIA是唯一一家針對數(shù)據(jù)中心和邊緣類別中的每項(xiàng)測試都提交結(jié)果的公司，在所有MLPerf工作負(fù)載中均展現(xiàn)出頂級的性能。

　　多項(xiàng)提交結(jié)果還基于Triton推理服務(wù)器，其支持來自所有主要框架的模型，可在GPU及CPU上運(yùn)行，并針對批處理、實(shí)時和串流傳輸?shù)炔煌牟樵冾愋瓦M(jìn)行了優(yōu)化，可簡化在應(yīng)用中部署AI的復(fù)雜性。在配置相當(dāng)?shù)那闆r下，采用Triton的提交結(jié)果所達(dá)到的性能接近于最優(yōu)化的GPU實(shí)現(xiàn)及CPU實(shí)現(xiàn)能夠達(dá)到的性能。

　　NVIDIA還開創(chuàng)性地使用NVIDIA Ampere架構(gòu)的多實(shí)例GPU性能，在單一GPU上使用7個MIG實(shí)例，同時運(yùn)行所有7項(xiàng)MLPerf離線測試。該配置實(shí)現(xiàn)了與單一MIG實(shí)例獨(dú)立運(yùn)行幾乎完全相同的性能。

　　這些提交結(jié)果展示了MIG的性能和通用性，使基礎(chǔ)設(shè)施經(jīng)理能夠針對特定應(yīng)用，配置適當(dāng)數(shù)量的GPU計(jì)算，從而讓每個數(shù)據(jù)中心GPU都能發(fā)揮最大的效用。

　　除NVIDIA公司提交的測試結(jié)果外，多家NVIDIA合作伙伴也提交了共360多項(xiàng)基于NVIDIA GPU的測試結(jié)果，包括阿里云、戴爾科技、富士通、技嘉科技、慧與、浪潮、聯(lián)想和超微。

　　NVIDIA不斷拓展的AI平臺

　　NVIDIA A30和A10 GPU是NVIDIA AI平臺中的最新成員。NVIDIA AI平臺包括NVIDIA Ampere架構(gòu)GPU、NVIDIA Jetson AGX Xavier?、Jetson Xavier NX，以及經(jīng)優(yōu)化后能夠?qū)崿F(xiàn)AI加速的全棧NVIDIA軟件。

　　A30能夠?yàn)樾袠I(yè)標(biāo)準(zhǔn)服務(wù)器提供通用的性能，支持廣泛的AI推理和主流企業(yè)級計(jì)算工作負(fù)載，如推薦系統(tǒng)、對話式AI和計(jì)算機(jī)視覺。

　　NVIDIA A10 GPU可加速深度學(xué)習(xí)推理、交互式渲染、計(jì)算機(jī)輔助設(shè)計(jì)和云游戲，使企業(yè)能夠基于通用基礎(chǔ)設(shè)施，為混合型AI和圖形工作負(fù)載提供支持。通過采用NVIDIA虛擬GPU軟件，可改進(jìn)管理，為設(shè)計(jì)師、工程師、藝術(shù)家和科學(xué)家所用的虛擬桌面提高利用率并完善配置。

　　NVIDIA Jetson平臺基于NVIDIA Xavier?系統(tǒng)級模塊，可在邊緣提供服務(wù)器級的AI性能，助力機(jī)器人、醫(yī)療健康、零售等領(lǐng)域?qū)崿F(xiàn)更多的創(chuàng)新應(yīng)用。Jetson基于NVIDIA的統(tǒng)一架構(gòu)和CUDA-X? 軟件堆棧，是唯一采用緊湊型設(shè)計(jì)、能夠運(yùn)行所有邊緣工作負(fù)載且功耗低于30W的平臺。

　　供貨

　　NVIDIA A100 GPU搭載于領(lǐng)先服務(wù)器制造商的服務(wù)器、所有主要云服務(wù)提供商的云端，以及NVIDIA DGX?系統(tǒng)產(chǎn)品組合（包括NVIDIA DGX Station A100、NVIDIA DGX A100和NVIDIA DGX SuperPOD）。

　　預(yù)計(jì)A30和A10（功耗分別為165W和150W）將從今夏起用于各類服務(wù)器中，包括經(jīng)嚴(yán)格測試以確保在各類工作負(fù)載下均可實(shí)現(xiàn)高性能的NVIDIA認(rèn)證系統(tǒng)?。

　　Jetson AGX Xavier 和Jetson Xavier NX系統(tǒng)級模塊已通過全球經(jīng)銷商供貨。

　　NVIDIA Triton和NVIDIA TensorRT均可通過NVIDIA的軟件目錄NGC?獲取。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

NVIDIA刷新AI推理紀(jì)錄，推出面向企業(yè)級服務(wù)器的A30和A10 GPU

日期： 2021-04-24

來源：EEWORLD

相關(guān)內(nèi)容