3 月 5 日消息,武漢人工智能研究院聯(lián)合中國科學(xué)院自動化研究所自主研發(fā)的“紫東太初”大模型已迭代到 2.0 版本,,根據(jù)官方最新消息,,“紫東太初 3.0”將于今年上半年發(fā)布,。
據(jù)湖北日報報道,,武漢人工智能研究院院長王金橋介紹:“上半年,,我們將發(fā)布‘紫東太初’3.0,進一步提升大模型對千行百業(yè)的賦能能力,。借力相關(guān)研究,,院方與東風(fēng)汽車,、光庭信息在智能駕駛領(lǐng)域的合作已全面展開,。”
據(jù)IT之家此前報道,,紫東太初第一代 AI 大模型于 2021 年發(fā)布,,由中國科學(xué)院自動化研究所和華為聯(lián)合開發(fā),號稱是“全球首個千億參數(shù)多模態(tài)大模型”,。
區(qū)別于當(dāng)前以文本為主的大部分語言大模型,,“紫東太初”大模型在研發(fā)之初即以多模態(tài)技術(shù)為核心,利用圖-音-文等更多類型數(shù)據(jù)進行跨模態(tài)的統(tǒng)一表征和學(xué)習(xí),,實現(xiàn)了圖像,、文本,、語音三模態(tài)數(shù)據(jù)間的“統(tǒng)一表示”與“相互生成”。
紫東太初 2.0 于 2023 年 6 月發(fā)布,,基于華為全棧國產(chǎn)化軟硬件平臺昇騰 AI 與昇思 MindSpore,,相比第一代著力提升了決策與判斷能力,在文本,、圖片,、音頻的基礎(chǔ)上,“紫東太初”2.0 可融入 3D,、視頻,、傳感信號等更多模態(tài)數(shù)據(jù),并優(yōu)化語音,、視頻和文本的融合認(rèn)知以及常識計算等功能,。
報道稱,升級到 3.0 版本,,大模型將在各項性能優(yōu)化的基礎(chǔ)上,,具備自主選擇、使用工具的能力,,滿足更深層次的邏輯交互需要,。
針對智能駕駛,“紫東太初”將大幅縮短,、優(yōu)化其訓(xùn)練過程,。通過大語言模型和多模態(tài)能力,大模型可以替代海量的人工,,完成汽車,、信號燈、路標(biāo)等數(shù)據(jù)的自動標(biāo)注,,大幅提升智能汽車感知世界的效率,。
同時,“紫東太初”接入汽車后,,能夠更深層次地學(xué)習(xí),、理解駕駛目標(biāo)和意圖,快速將環(huán)境信息翻譯成設(shè)備能讀懂的語言,,并預(yù)測未來幾秒內(nèi)的情況,,提前向汽車下達合適指令。