《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 高端訪(fǎng)談 > NVIDIA 的“三臺(tái)計(jì)算機(jī)”方案開(kāi)啟機(jī)器人進(jìn)化新時(shí)代

NVIDIA 的“三臺(tái)計(jì)算機(jī)”方案開(kāi)啟機(jī)器人進(jìn)化新時(shí)代

2025-01-24
來(lái)源:英偉達(dá)
關(guān)鍵詞: 英偉達(dá) 機(jī)器人

  人形機(jī)器人一般是指具有與人類(lèi)類(lèi)似的身體結(jié)構(gòu)和運(yùn)動(dòng)方式(雙足行走,、雙手協(xié)作等)的智能機(jī)器人。人形機(jī)器人既需要極強(qiáng)的運(yùn)動(dòng)控制能力,,也需要具備非常強(qiáng)的感知計(jì)算能力,。人形機(jī)器人更能適應(yīng)于各類(lèi)現(xiàn)實(shí)生活場(chǎng)景,使得機(jī)器人能從“專(zhuān)用”轉(zhuǎn)向“通用”,,以此形成規(guī)模效應(yīng)和降低成本,。

  隨著人工智能技術(shù)不斷發(fā)展,通過(guò)結(jié)合人工智能,、機(jī)械工程和傳感技術(shù),,人形機(jī)器人可以模仿人類(lèi)的動(dòng)作和行為,執(zhí)行各種任務(wù),。

 31eecaf0ce31560ad1bf830aac945a1.jpg

  NVIDIA 機(jī)器人與邊緣計(jì)算副總裁 Deepu Talla 表示,,技術(shù)進(jìn)步和仿真環(huán)境的改進(jìn)是激發(fā)人形機(jī)器人即將爆發(fā)的兩大源動(dòng)力。

  生成式人工智能和大語(yǔ)言模型技術(shù)的進(jìn)步,,打破了數(shù)字應(yīng)用和物理應(yīng)用間的界限,,而仿真環(huán)境的改進(jìn),使得機(jī)器人研發(fā)不再受限于物理環(huán)境,從而使得機(jī)器人技術(shù)獲得了跨越式發(fā)展,。

  為了推動(dòng)機(jī)器人從“專(zhuān)用”走向“通用”,,NVIDIA以其在計(jì)算領(lǐng)域突破性創(chuàng)新成果為基礎(chǔ),面向機(jī)器人領(lǐng)域推出了集合訓(xùn)練,、仿真和計(jì)算的“三臺(tái)計(jì)算機(jī)”解決方案,。

   第一臺(tái)計(jì)算機(jī)用于訓(xùn)練:這是用于訓(xùn)練AI模型的系統(tǒng)。訓(xùn)練通常在云端,、數(shù)據(jù)中心或像NVIDIA DGX這樣的強(qiáng)大系統(tǒng)上進(jìn)行,,這是構(gòu)建機(jī)器人“大腦”的關(guān)鍵步驟。

   第二臺(tái)計(jì)算機(jī)用于仿真:一旦訓(xùn)練完成,,就需要進(jìn)行測(cè)試,。以往的標(biāo)準(zhǔn)是物理測(cè)試,但這種方式既慢又昂貴,,還存在風(fēng)險(xiǎn),。更好的解決方案是引入一個(gè)“仿真層”,即“數(shù)字孿生”,,在虛擬環(huán)境中完成測(cè)試,。仿真允許在大規(guī)模、快速且安全的條件下運(yùn)行數(shù)千種場(chǎng)景測(cè)試,,無(wú)需受到真實(shí)世界時(shí)間或成本的限制,。

   第三臺(tái)計(jì)算機(jī)用于部署:第三種系統(tǒng)安裝在機(jī)器人內(nèi)部,它就是操作物理機(jī)器人的“大腦”,。對(duì)NVIDIA來(lái)說(shuō),,這可以通過(guò)像Jetson或AGX這樣的系統(tǒng)來(lái)實(shí)現(xiàn)。

  Deepu Talla 表示,,通過(guò)整合上述三個(gè)系統(tǒng),,在機(jī)器人正式部署之前,通過(guò)仿真進(jìn)行成千上萬(wàn)次測(cè)試,,可以顯著縮短機(jī)器人的開(kāi)發(fā)時(shí)間,,加速整個(gè)流程。

  NVIDIA,,并不直接制造機(jī)器人,,而是通過(guò)構(gòu)建一個(gè)包含三種計(jì)算系統(tǒng)以及相關(guān)軟件工具和工作流程的平臺(tái),幫助機(jī)器人專(zhuān)家,、研究人員,、機(jī)械工程師和測(cè)試人員更輕松地開(kāi)發(fā)機(jī)器人解決方案。

  與ChatGPT大模型可以通過(guò)數(shù)據(jù)訓(xùn)練獲得進(jìn)步不同的是,,應(yīng)用于機(jī)器人的大模型還無(wú)法獲得執(zhí)行各種動(dòng)作的海量數(shù)據(jù),。目前僅僅通過(guò)使用Apple Vision Pro或動(dòng)作捕捉套裝來(lái)記錄人類(lèi)動(dòng)作的示范,而這些方法雖能提供有用的數(shù)據(jù),但規(guī)模太小,,無(wú)法完全滿(mǎn)足機(jī)器人模型的訓(xùn)練需求,。沒(méi)有足夠的數(shù)據(jù),機(jī)器人模型無(wú)法進(jìn)行有效的訓(xùn)練,、測(cè)試或部署,。這使得數(shù)據(jù)的收集和生成成為解決機(jī)器人開(kāi)發(fā)挑戰(zhàn)的關(guān)鍵第一步。

  為了解決這一問(wèn)題,,合成數(shù)據(jù)生成變得至關(guān)重要,。

  銀河通用創(chuàng)始人、CTO王鶴表示,,通過(guò)合成數(shù)據(jù),可以生成特定動(dòng)作(例如抓取物體)的無(wú)數(shù)種變化,,或者構(gòu)建完整的虛擬環(huán)境,。通過(guò)將少量的現(xiàn)實(shí)世界數(shù)據(jù)與使用像NVIDIA Cosmos這樣的工具生成的大規(guī)模合成數(shù)據(jù)相結(jié)合,可以克服機(jī)器人技術(shù)中數(shù)據(jù)稀缺的問(wèn)題,,解決機(jī)器人領(lǐng)域的基礎(chǔ)數(shù)據(jù)挑戰(zhàn),。

  NVIDIA Cosmos是一個(gè)“世界基礎(chǔ)模型”,可以生成高度逼真,、類(lèi)似視頻游戲的環(huán)境,,用于機(jī)器人訓(xùn)練。在這里,,“世界”指的并不是地球,,而是機(jī)器人交互的環(huán)境,例如機(jī)器人操作的房間內(nèi)可見(jiàn)區(qū)域,。通過(guò)采用這種結(jié)合現(xiàn)實(shí)與合成數(shù)據(jù)的創(chuàng)新工作流,,NVIDIA正為機(jī)器人領(lǐng)域的重大進(jìn)步鋪平道路。


訂閱網(wǎng)站文章尾圖1.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。