《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 谷歌成立新團(tuán)隊(duì)模擬物理世界AI模型

谷歌成立新團(tuán)隊(duì)模擬物理世界AI模型

2025-01-08
來(lái)源:36Kr
關(guān)鍵詞: 谷歌 DeepMind 世界模型

據(jù)報(bào)道,,谷歌正在組建一個(gè)新的團(tuán)隊(duì),,專(zhuān)注于開(kāi)發(fā)可以模擬物理世界的人工智能模型。

該團(tuán)隊(duì)的負(fù)責(zé)人是蒂姆·布魯克斯(Tim Brooks),,他原先是OpenAI視頻生成器Sora的聯(lián)合負(fù)責(zé)人之一,,后于2024年10月離開(kāi)OpenAI,跳槽至谷歌的人工智能研究實(shí)驗(yàn)室谷歌DeepMind,。

根據(jù)Brooks周一(1月6日)在社交媒體X上的最新發(fā)帖,,他領(lǐng)導(dǎo)的這個(gè)新團(tuán)隊(duì)隸屬于DeepMind,將致力于開(kāi)發(fā)可以模擬物理世界的人工智能模型。

Brooks寫(xiě)道,,“DeepMind有雄心勃勃的計(jì)劃,,要制造大規(guī)模的生成模型來(lái)模擬世界。我正在招聘一個(gè)新的團(tuán)隊(duì)來(lái)完成這個(gè)任務(wù),?!?/p>

0.jpg

根據(jù)描述,Brooks的新團(tuán)隊(duì)將著眼于開(kāi)發(fā)“實(shí)時(shí)交互生成”工具,,并研究如何將他們的模型與現(xiàn)有的多模式模型(如Gemini)集成,。

新的團(tuán)隊(duì)還將與谷歌現(xiàn)有的Gemini、Veo和Genie團(tuán)隊(duì)合作,,并以后者團(tuán)隊(duì)的工作為基礎(chǔ),,將模型擴(kuò)展到“最高水平的計(jì)算”。

據(jù)了解,,Gemini是谷歌的旗艦AI模型系列,,用于分析圖像和生成文本等任務(wù);Veo是谷歌的視頻生成模型,;至于Genie,它是谷歌的基礎(chǔ)世界模型,,為用戶(hù)提供了前所未有的交互體驗(yàn),,支持用戶(hù)借助文本、合成圖像,、照片乃至草圖等方式,,創(chuàng)造出可玩性強(qiáng)的交互式環(huán)境和可控的虛擬世界。

去年12月,,谷歌還推出了升級(jí)版的Genie 2,,能夠模擬出動(dòng)作可控、極具可玩性的逼真3D虛擬世界,。

世界模型

Brooks發(fā)布的工作描述是這樣寫(xiě)的:“我們認(rèn)為,,在視頻和多模態(tài)數(shù)據(jù)上擴(kuò)展人工智能訓(xùn)練是實(shí)現(xiàn)通用人工智能(AGI,指能夠完成人類(lèi)能完成的任何任務(wù)的人工智能)的關(guān)鍵途徑,。世界模型將為許多領(lǐng)域提供動(dòng)力,,比如視覺(jué)推理和模擬、具體化代理的規(guī)劃以及實(shí)時(shí)互動(dòng)娛樂(lè),?!?/p>

“世界模型”是目前技術(shù)流派中難度最高的一種,其特點(diǎn)在于讓機(jī)器能夠像人類(lèi)一樣對(duì)真實(shí)世界有一個(gè)全面而準(zhǔn)確的認(rèn)知,。

目前,,許多初創(chuàng)公司和大型科技公司都在追逐世界模型,包括有影響力的人工智能研究員李飛飛的World Labs,、以色列新貴Decart和初創(chuàng)公司Odyssey等,。他們認(rèn)為,,世界模型有一天可以用來(lái)創(chuàng)建互動(dòng)媒體,如視頻游戲和電影,,并運(yùn)行逼真的模擬,,如機(jī)器人訓(xùn)練環(huán)境。

不過(guò),,世界模型的發(fā)展似乎對(duì)一些創(chuàng)意人士并不友好,。

著名雜志《連線》最近的一項(xiàng)調(diào)查發(fā)現(xiàn),像動(dòng)視暴雪(Activision Blizzard)這樣的游戲工作室,,已經(jīng)解雇了大量員工,,而他們正在利用人工智能來(lái)提高生產(chǎn)率,并彌補(bǔ)人員流失,。美國(guó)動(dòng)畫(huà)協(xié)會(huì)在2024年委托進(jìn)行的一項(xiàng)研究估計(jì),,到2026年,美國(guó)將有超過(guò)10萬(wàn)個(gè)電影,、電視和動(dòng)畫(huà)工作崗位被人工智能取代,。

相較于被取代,合作似乎是一種更友好的方式,。一些新興的世界模特領(lǐng)域的初創(chuàng)公司,,比如Odyssey,已經(jīng)承諾與有創(chuàng)意的專(zhuān)業(yè)人士合作,。這是否會(huì)成為谷歌的做法,,仍有待觀察。

另外,,對(duì)于世界模型而言,,版權(quán)問(wèn)題懸而未決。一些世界模型是根據(jù)視頻游戲播放的片段進(jìn)行訓(xùn)練的,,這可能會(huì)使開(kāi)發(fā)這些模型的公司在視頻未經(jīng)許可的情況下成為訴訟的目標(biāo),。

而擁有Youtube的谷歌聲稱(chēng),根據(jù)平臺(tái)的服務(wù)條款,,它有權(quán)基于YouTube視頻訓(xùn)練自己的模型,。但該公司并未透露將為培訓(xùn)采購(gòu)哪些具體視頻。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。