《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > OpenAI大模型上身機(jī)器人,原速演示炸場(chǎng)!

OpenAI大模型上身機(jī)器人,,原速演示炸場(chǎng)!

2024-03-14
來(lái)源:網(wǎng)易科技
關(guān)鍵詞: OpenAI Figure01 機(jī)器人 大模型

OpenAI大模型加持的機(jī)器人,,深夜來(lái)襲!

名曰Figure 01,,它能聽(tīng)會(huì)說(shuō),,動(dòng)作靈活,。

能和人類描述眼前看到的一切:

我在桌子上看到了一個(gè)紅色的蘋果,,瀝水架上面還有幾個(gè)盤子和一個(gè)杯子;然后你站在附近,,手放在桌子上,。

聽(tīng)到人類說(shuō)“想吃東西”,就馬上遞過(guò)去蘋果,。

而且對(duì)于自己做的事有清楚認(rèn)知,,給蘋果是因?yàn)檫@是桌上唯一能吃的東西。

還順便把東西整理,,能同時(shí)搞定兩種任務(wù),。

最關(guān)鍵的是,這些展示都沒(méi)有加速,,機(jī)器人本來(lái)的動(dòng)作就這么迅速,。

接下來(lái),我們繼續(xù)來(lái)看下Figure 01的細(xì)節(jié),。

OpenAI視覺(jué)語(yǔ)言大模型加持

根據(jù)創(chuàng)始人的介紹,,F(xiàn)igure 01通過(guò)端到端神經(jīng)網(wǎng)絡(luò),可以和人類自如對(duì)話,。

基于OpenAI提供的視覺(jué)理解和語(yǔ)言理解能力,,它能完成快速、簡(jiǎn)單,、靈巧的動(dòng)作,。

模型只說(shuō)是一個(gè)視覺(jué)語(yǔ)言大模型,是否為GPT-4V不得而知,。

它還能規(guī)劃動(dòng)作,、有短期記憶能力、用語(yǔ)言解釋它的推理過(guò)程,。

1.png

如對(duì)話里說(shuō)“你能把它們放在那里嗎,?”

“它們”、“那里”這種模糊表述的理解,,就體現(xiàn)了機(jī)器人的短期記憶能力,。

它使用了OpenAI訓(xùn)練的視覺(jué)語(yǔ)言模型,,機(jī)器人攝像頭會(huì)以10Hz拍下畫面,然后神經(jīng)網(wǎng)絡(luò)將以200Hz輸出24自由度動(dòng)作(手腕+手指關(guān)節(jié)角度),。

具體分工上,,機(jī)器人的策略也很像人類。

復(fù)雜動(dòng)作交給AI大模型,,預(yù)訓(xùn)練模型會(huì)對(duì)圖像和文本進(jìn)行常識(shí)推理,,給出動(dòng)作計(jì)劃;

簡(jiǎn)單動(dòng)作如抓起塑料袋(抓哪里都可以),,機(jī)器人基于已學(xué)習(xí)的視覺(jué)-動(dòng)作執(zhí)行策略,,可以做出一些“下意識(shí)”的快速反應(yīng)行動(dòng)。

同時(shí)全身控制器會(huì)負(fù)責(zé)保持機(jī)身平衡,、運(yùn)動(dòng)穩(wěn)定,。

除了最先進(jìn)的AI模型,F(xiàn)igure 01背后公司——Figure的創(chuàng)始人兼CEO還在推文中提到,,F(xiàn)igure方面整合了機(jī)器人的所有關(guān)鍵組成,。

包括電機(jī)、中間件操作系統(tǒng),、傳感器,、機(jī)械結(jié)構(gòu)等,均由Figure工程師設(shè)計(jì),。

據(jù)了解,,這家機(jī)器人初創(chuàng)公司在2周前才正式宣布和OpenAI的合作,但才13天后就帶來(lái)如此重磅成果,。不少人都開(kāi)始期待后續(xù)合作了,。

由此,具身智能領(lǐng)域又有一顆新星走到了聚光燈下,。

“將人形機(jī)器人帶進(jìn)生活”

說(shuō)到Figure,,這家公司創(chuàng)立于2022年,正如前文所言,,再次引爆外界關(guān)注,,就在十幾天前——

官宣在新一輪融資中籌集6.75億美元,估值沖到26億美元,,投資方幾乎要集齊半個(gè)硅谷,,包括微軟、OpenAI,、英偉達(dá)和亞馬遜創(chuàng)始人貝佐斯等等,。

更重要的是,OpenAI同時(shí)公開(kāi)了與Figure更進(jìn)一步合作的計(jì)劃:將多模態(tài)大模型的能力擴(kuò)展到機(jī)器人的感知,、推理和交互上,,“開(kāi)發(fā)能夠取代人類進(jìn)行體力勞動(dòng)的人形機(jī)器人”,。

用現(xiàn)在最熱的科技詞匯來(lái)說(shuō),就是要一起搞具身智能,。


weidian.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。