《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 谷歌展示Genie模型:一張草圖就能生成一個2D游戲

谷歌展示Genie模型:一張草圖就能生成一個2D游戲

2024-02-28
來源:澎湃新聞

谷歌DeepMind團隊展示了Genie模型,,能把草圖變成2D游戲,。

生成式人工智能可以通過語言、圖像甚至視頻生成創(chuàng)造性內容,。而DeepMind引入了生成式人工智能新范式——Genie(generative interactive environments,,生成式交互環(huán)境),根據(jù)單個圖像提示來生成“交互式可玩環(huán)境”,。該模型從游戲視頻中學習游戲機制后,,可以通過一個簡單提示創(chuàng)建2D平臺類游戲。

2月26日,,DeepMind表示,,Genie是一個從互聯(lián)網(wǎng)視頻中訓練出來的基礎世界模型,它可以根據(jù)合成圖像,、照片甚至草圖生成各種各樣動作可控的2D世界,,使人們能夠與他們想象的虛擬世界互動,。

“只需要一張圖片,,Genie就可以創(chuàng)建一個全新的互動環(huán)境?!?DeepMind表示,,這為生成和進入虛擬世界打開了大門。例如可以采用最先進的文生圖大模型來生成初始幀,,然后用Genie賦予它們“生命”,。

Genie的模型參數(shù)只有110億,,根據(jù)人類玩2D平臺類游戲的20多萬小時視頻進行無監(jiān)督訓練。Genie的出現(xiàn)要歸功于谷歌研究人員開發(fā)的可推斷視頻幀之間動作的潛在動作模型,、將原始視頻幀轉換為離散標記的視頻分詞器,,以及推測下一幀的動態(tài)模型。

DeepMind表示,,Genie的獨特之處在于,,它能夠在沒有動作標簽的情況下,完全從互聯(lián)網(wǎng)視頻中學習精細的控制,。這是一個挑戰(zhàn),,因為互聯(lián)網(wǎng)視頻通常沒有關于執(zhí)行哪個動作的標簽,甚至沒有關于應該控制圖像哪個部分的標簽,。

DeepMind開發(fā)人員蒂姆·羅克塔謝爾(Tim Rockt?schel)表示,,Genie學習各種潛在動作,以一致性控制角色,。Genie習得潛動作空間不僅具有多樣性和一致性,,并且具有可解釋性。此外,,Genie模型是通用的,,并不局限于2D。

DeepMind 在官方聲明中也表示,,Genie “專注于2D平臺類游戲和機器人的視頻”,,“但我們的方法是通用的,適用于任何類型的領域,,并可以擴展到更大的互聯(lián)網(wǎng)數(shù)據(jù)集,。”DeepMind認為,,Genie引入了一個能從圖像或文本生成整個交互式世界的時代,,它將成為訓練未來通才AI智能體的催化劑。

不過Genie是一個研究項目,,而不是最終產品,。它的訓練視頻是160 x 90像素的超低分辨率視頻,每秒只有10幀,,它生成的“游戲”同樣是低分辨率的,,每秒只有1幀?!霸撃P湍壳耙悦棵?幀的速度運行,,所以現(xiàn)在它離實時可玩還很遠?!钡倌贰ち_克塔謝爾表示,。


weidian.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉載的所有的文章,、圖片、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容、版權和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]