4月23日消息,,商湯科技在中國(guó)北京舉行新品發(fā)布會(huì),,正式發(fā)布人工智能大模型“日日新5.0”,。
日日新5.0大模型采用了先進(jìn)的MOE(Mixture of Experts)混合專家架構(gòu),,這一架構(gòu)的引入,,使得模型在處理復(fù)雜任務(wù)時(shí)能夠表現(xiàn)出更高的效率和準(zhǔn)確性,。
同時(shí),,該模型基于超過(guò)10TB的數(shù)據(jù)tokens進(jìn)行深度學(xué)習(xí)訓(xùn)練,,還擁有高達(dá)200K的推理上下文窗口。這一特性使得模型在處理長(zhǎng)文本或復(fù)雜推理任務(wù)時(shí),,能夠更好地捕捉上下文信息,,從而做出更準(zhǔn)確的判斷。
此外,,該模型在知識(shí),、推理、數(shù)學(xué),、代碼等多個(gè)方面全面對(duì)標(biāo)GPT-4 Turbo,,展現(xiàn)了其強(qiáng)大的綜合實(shí)力。
日日新作為商湯科技推出的大模型體系,,不僅包含了自然語(yǔ)言處理模型“商量”(SenseChat),,還涵蓋了文生圖模型“秒畫(huà)”以及數(shù)字人視頻生成平臺(tái)“如影”(SenseAvatar)等多個(gè)模塊。這些模塊的協(xié)同工作,,使得日日新大模型能夠?yàn)橛脩籼峁└迂S富和全面的服務(wù),。
該大模型體系于2023年4月由商湯科技董事長(zhǎng)兼首席執(zhí)行官徐立宣布推出,并于同年8月獲批上線,。自上線以來(lái),,日日新大模型已經(jīng)在多個(gè)領(lǐng)域得到了廣泛應(yīng)用,并取得了顯著成效,。
日日新大模型的主要功能包括自然語(yǔ)言生成,、文生圖、感知模型標(biāo)注以及模型研發(fā)功能,。用戶可以通過(guò)自然語(yǔ)言輸入,,利用大模型的意圖識(shí)別、邏輯理解與代碼解釋器的能力,,實(shí)現(xiàn)自動(dòng)數(shù)據(jù)轉(zhuǎn)化為有意義的分析和可視化結(jié)果,。這一功能在智能客服、智能寫(xiě)作,、智能設(shè)計(jì)等領(lǐng)域具有廣泛的應(yīng)用前景,。