英偉達正式推出AI代工業(yè)務(wù)和推理微服務(wù)-AET-電子技術(shù)應(yīng)用

英偉達正式推出AI代工業(yè)務(wù)和推理微服務(wù)

攜手Meta Llama 3.1開源模型，為客戶定制部署“超級模型”

日期： 2024-07-24

來源：IT之家

關(guān)鍵詞： 英偉達 AI代工 NVIDIAAIFoundry NVIDIANIM MetaLlama3.1

7 月 24 日消息，英偉達公司昨日（7 月 23 日）發(fā)布新聞稿，正式推出“NVIDIA AI Foundry”代工服務(wù)和“NVIDIA NIM”推理微服務(wù)。

“NVIDIA AI Foundry”代工服務(wù)

英偉達表示客戶可以使用 Meta 的 Llama 3.1 AI 模型，以及英偉達的軟件、計算和專業(yè)知識，為特定領(lǐng)域定制構(gòu)建“超級模型”。

客戶可以利用專有數(shù)據(jù)、由 Llama 3.1 405B 和英偉達 Nemotron Reward 模型生成的合成數(shù)據(jù)來訓(xùn)練這些“超級模型”。

NVIDIA AI Foundry 由 NVIDIA DGX? Cloud AI 平臺提供支持，該平臺與世界領(lǐng)先的公共云共同設(shè)計，為企業(yè)提供大量計算資源，并可根據(jù) AI 需求的變化輕松擴展。

NVIDIA AI Foundry 包括 Nemotron 和 Edify 等英偉達創(chuàng)建的 AI 模型、流行的開放式基礎(chǔ)模型、用于定制模型的 NVIDIA NeMo? 軟件，以及 NVIDIA DGX? Cloud 上的專用容量（由 NVIDIA AI 專家構(gòu)建并提供支持）。

輸出結(jié)果由 NVIDIA NIM（一個推理微服務(wù)，其中包括定制模型、優(yōu)化引擎和標準 API）負責，可以部署到任何地方。

NVIDIA NIM 推理微服務(wù)

注：NVIDIA NIM 是一套加速推理微服務(wù)，允許企業(yè)在云計算、數(shù)據(jù)中心、工作站和 PC 等任何地方的 NVIDIA GPU 上運行 AI 模型。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

英偉達正式推出AI代工業(yè)務(wù)和推理微服務(wù)

日期： 2024-07-24

來源：IT之家

相關(guān)內(nèi)容