智源人工智能研究院推出大模型全家桶-AET-電子技術(shù)應(yīng)用

智源人工智能研究院推出大模型全家桶

日期： 2024-06-18

來源：澎湃新聞

關(guān)鍵詞： 智源研究院大模型多模態(tài)大模型具身智能生物計(jì)算大模型

6月14日，2024北京智源大會在中關(guān)村展示中心開幕，北京智源人工智能研究院（簡稱智源研究院）推出大模型“全家桶”。

智源研究院院長王仲遠(yuǎn)表示，現(xiàn)階段語言大模型的發(fā)展已經(jīng)具備了通用人工智能非常核心的理解和推理能力，并且形成了一條以語言大模型為核心對齊和映射其他模態(tài)的技術(shù)路線，從而讓模型具備了初步的多模態(tài)理解和生成能力。但這并不是讓人工智能感知、理解物理世界的終極技術(shù)路線，而是應(yīng)該采取統(tǒng)一模型的范式，實(shí)現(xiàn)多模態(tài)的輸入和輸出，讓模型具備原生的多模態(tài)擴(kuò)展能力，向世界模型演進(jìn)。未來，大模型將以數(shù)字智能體的形態(tài)與智能硬件融合，以具身智能的形態(tài)從數(shù)字世界進(jìn)入物理世界，同時(shí)，大模型這一技術(shù)手段可為科學(xué)研究提供新的知識表達(dá)范式，加速人類對微觀物理世界規(guī)律的探索與研究突破，不斷趨近通用人工智能的終極目標(biāo)。

智源研究院此次推出的大模型“全家桶”，包括智源多模態(tài)大模型、具身智能大模型、生物計(jì)算大模型等。

針對大模型訓(xùn)練算力消耗高的問題，智源研究院和中國電信人工智能研究院（TeleAI）基于模型生長和損失預(yù)測等關(guān)鍵技術(shù)，聯(lián)合研發(fā)并推出全球首個(gè)低碳單體稠密萬億語言模型Tele-FLM-1T。該模型與百億級的52B版本、千億級的102B版本共同構(gòu)成Tele-FLM系列模型。Tele-FLM系列模型僅以業(yè)界普通訓(xùn)練方案9%的算力資源，基于112臺A800服務(wù)器，用4個(gè)月完成3個(gè)模型總計(jì)2.3T tokens的訓(xùn)練，訓(xùn)練出萬億稠密模型Tele-FLM-1T。

針對大模型幻覺等問題，智源研究院自主研發(fā)了通用語義向量模型BGE（BAAI General Embedding）系列，基于檢索增強(qiáng)RAG技術(shù)，實(shí)現(xiàn)數(shù)據(jù)之間精準(zhǔn)的語義匹配，支持大模型調(diào)用外部知識的調(diào)用。

行業(yè)現(xiàn)有的多模態(tài)大模型多為對于不同任務(wù)而訓(xùn)練的專用模型，例如Stable Diffusion之于文生圖，Sora之于文生視頻，GPT-4V之于圖生文。每類模型都有對應(yīng)的架構(gòu)和方法，例如對于視頻生成，行業(yè)普遍參照Sora選擇了DiT架構(gòu)。但是現(xiàn)有模型的能力多為單一分散的能力組合，而不是原生的統(tǒng)一能力，例如目前Sora還做不到圖像和視頻的理解。為了實(shí)現(xiàn)多模態(tài)、統(tǒng)一、端到端的下一代大模型，智源研究院推出Emu3原生多模態(tài)世界模型，采用智源自研多模態(tài)自回歸技術(shù)路徑，在圖像、視頻、文字上聯(lián)合訓(xùn)練，使模型具備原生多模態(tài)能力，實(shí)現(xiàn)圖像、視頻、文字的統(tǒng)一輸入和輸出。

在具身大模型方面，對于具身智能通用抓取能力，智源針對跨任意形狀和材質(zhì)的泛化難題，突破95%的真機(jī)實(shí)驗(yàn)成功率，實(shí)現(xiàn)商業(yè)級動作執(zhí)行水平。借助這項(xiàng)技術(shù)，即使在復(fù)雜光線透射、反射的情況下，機(jī)器人依然能準(zhǔn)確感知透明、高反光物體的形狀和姿態(tài)，并預(yù)測出高成功率的抓取位姿。

在分級具身大模型系統(tǒng)方面，智源研發(fā)了能夠從失敗中重思考、再嘗試的鉸接物體操作大模型系統(tǒng)SAGE。該系統(tǒng)結(jié)合三維視覺小模型對空間幾何的精確感知能力和通用圖文大模型的通用物體操作知識，使大模型驅(qū)動的機(jī)器人能夠在任務(wù)執(zhí)行失敗時(shí)重新思考并再次嘗試新的交互方式，實(shí)現(xiàn)傳統(tǒng)機(jī)器人技術(shù)無法企及的智能性和魯棒性。此外，智源研究院探索了生成式人工智能在分子生物學(xué)中的應(yīng)用，推出全原子生物分子模型OpenComplex 2，以及實(shí)時(shí)孿生心臟計(jì)算模型。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

智源人工智能研究院推出大模型全家桶

日期： 2024-06-18

來源：澎湃新聞

相關(guān)內(nèi)容