智元機(jī)器人團(tuán)隊(duì)提出EnerVerse架構(gòu)-AET-電子技術(shù)應(yīng)用

智元機(jī)器人團(tuán)隊(duì)提出EnerVerse架構(gòu)

日期： 2025-01-08

來(lái)源：IT之家

關(guān)鍵詞： 智元機(jī)器人 EnerVerse架構(gòu)

1 月 8 日消息，如何讓機(jī)器人在任務(wù)指引和實(shí)時(shí)觀測(cè)的基礎(chǔ)上規(guī)劃未來(lái)動(dòng)作是具身智能領(lǐng)域核心問(wèn)題，其受“模態(tài)對(duì)齊”和“數(shù)據(jù)稀缺”制約。智元機(jī)器人團(tuán)隊(duì)提出 EnerVerse 架構(gòu)，通過(guò)自回歸擴(kuò)散模型（autoregressive diffusion），在生成未來(lái)具身空間的同時(shí)引導(dǎo)機(jī)器人完成復(fù)雜任務(wù)。

據(jù)介紹，不同于現(xiàn)有方法簡(jiǎn)單應(yīng)用視頻生成模型，EnerVerse 深度結(jié)合具身任務(wù)需求，創(chuàng)新性地引入稀疏記憶機(jī)制（Sparse Memory）與自由錨定視角（Free Anchor View, FAV），在提升 4D 生成能力的同時(shí)，實(shí)現(xiàn)了動(dòng)作規(guī)劃性能的突破。

智元機(jī)器人官方稱，實(shí)驗(yàn)結(jié)果表明 EnerVerse 不僅具備未來(lái)空間生成能力，更在機(jī)器人動(dòng)作規(guī)劃任務(wù)中實(shí)現(xiàn)了當(dāng)前最優(yōu)（SOTA）表現(xiàn)。從智元官方獲悉，目前項(xiàng)目主頁(yè)與論文《EnerVerse：設(shè)想機(jī)器人操作的具身未來(lái)空間》已上線，模型與相關(guān)數(shù)據(jù)集即將開(kāi)源。

EnerVerse 主要科研成員來(lái)自智元機(jī)器人研究院具身算法團(tuán)隊(duì)。論文共同一作黃思淵是上海交通大學(xué)與上海人工智能實(shí)驗(yàn)室的聯(lián)培博士生，師從 CUHK-MMLab 的李鴻升教授。博士期間的研究課題為基于多模態(tài)大模型的具身智能以及高效智能體的研究。在 CoRL、MM、 IROS、ECCV 等頂級(jí)會(huì)議上，以第一作者或共同第一作者身份發(fā)表多篇論文。另一位共同一作陳立梁是智元機(jī)器人的具身算法專家，主要負(fù)責(zé)具身空間智能與世界模型的研究。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

智元機(jī)器人團(tuán)隊(duì)提出EnerVerse架構(gòu)

日期： 2025-01-08

來(lái)源：IT之家

相關(guān)內(nèi)容