《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 商湯發(fā)布6000億多模態(tài)日日新大模型5.5系列

商湯發(fā)布6000億多模態(tài)日日新大模型5.5系列

2024-07-08
來(lái)源:鈦媒體

1.jpg

對(duì)標(biāo) OpenAI GPT-4o 的中國(guó)版本來(lái)了,!

7 月 5 日舉行的 2024 世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)分論壇上,,國(guó)內(nèi) AGI 公司商湯科技發(fā)布日日新大模型 5.5 系列。

其中,,最引發(fā)關(guān)注的,是國(guó)內(nèi)首個(gè)所見(jiàn)即所得,、實(shí)時(shí)流式多模態(tài)交互模型 " 日日新 5o",,交互體驗(yàn)對(duì)標(biāo) GPT-4o,實(shí)現(xiàn)全新 AI 交互模式,。另外,,全新日日新 5.5 的模型參數(shù)規(guī)模達(dá) 6000 億,綜合性能較 " 日日新 5.0" 平均提升 30%,,在數(shù)學(xué)推理,、英文能力和指令跟隨等能力明顯增強(qiáng),交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)標(biāo) GPT-4o,,同時(shí)也是國(guó)內(nèi)對(duì)標(biāo) GPT-4 Turbo 領(lǐng)先的國(guó)產(chǎn)大模型之一,。

2.jpg

3.jpg

商湯科技董事長(zhǎng)兼 CEO 徐立在演講中表示,大模型本質(zhì)意義上是在做一個(gè)記憶的事情,,記住世界的知識(shí),,而它有的一點(diǎn)智力完全是來(lái)自于對(duì)于知識(shí)背后高階的思維邏輯和記憶;同時(shí),,行業(yè)要進(jìn)行變化,交互模式一定是先行的,;另外,,基于手機(jī)旗艦平臺(tái),端側(cè) 5.5 Lite 模型版本性能精度提升 10%,、首包延遲下降 40%,、推理效率提升 15%,達(dá)到每秒 90.2 個(gè)漢字的處理速度,。因此,,商湯在模型上面的能力,實(shí)際上還是在日日新,,不停地迭代和演進(jìn),。

徐立還透露,為了讓更多企業(yè)用戶(hù)低門(mén)檻接入并使用 " 日日新 " 大模型體系能力,,商湯于近期推出了 " 大模型 0 元 Go" 計(jì)劃,。凡是 " 日日新 " 的新注冊(cè)用戶(hù),都可獲得涉及調(diào)用,、遷徙,、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí),,商湯還將免費(fèi)贈(zèng)送 5000 萬(wàn) Tokens 包,,并且派出專(zhuān)屬搬家顧問(wèn),幫助 OpenAI 用戶(hù)實(shí)現(xiàn)零服務(wù)成本遷移。

4.jpg

實(shí)際上,,最近一年多,,商湯持續(xù)擴(kuò)大 AI 大模型投入力度,確立了 " 模型即服務(wù) " 的商業(yè)模式,,通過(guò) " 大模型 + 大裝置 " 推動(dòng)實(shí)現(xiàn)通用人工智能(AGI)目標(biāo),。

今年 3 月,商湯科技董事長(zhǎng)兼 CEO 徐立表示,,在 Scaling Law(尺度規(guī)律)指引下,,大模型正處于技術(shù)革命與性能提升的黃金時(shí)期。自 2023 年發(fā)布以來(lái),,商湯 " 日日新 " 大模型的能力每隔三個(gè)月都會(huì)有顯著提升,,實(shí)現(xiàn)了萬(wàn)卡萬(wàn)參的大模型訓(xùn)練能力,在基礎(chǔ)模型,、多模態(tài),、編程和工具調(diào)用、百萬(wàn)字無(wú)損上下文,、終端小模型上都達(dá)到國(guó)內(nèi)領(lǐng)先水平,。

據(jù) 2023 年財(cái)報(bào)數(shù)據(jù),商湯 " 日日新 " 大模型 + 大裝置驅(qū)動(dòng)生成式 AI 業(yè)務(wù)爆發(fā)式增長(zhǎng) 200%,,收入達(dá) 12 億元,,貢獻(xiàn)了 35% 的營(yíng)收。這是商湯成立十年以來(lái),,以最快速度從無(wú)到有,、超過(guò) 10 億元收入體量的業(yè)務(wù)。

業(yè)務(wù)層面,,2024 年上半年,,商湯通過(guò)其大模型技術(shù)與多家行業(yè)頭部企業(yè)達(dá)成緊密合作。例如金山辦公的 WPS AI 通過(guò)整合商湯的大模型技術(shù),,實(shí)現(xiàn)了辦公軟件的智能化升級(jí),;小米公司的小愛(ài)同學(xué)業(yè)務(wù)在商湯大模型技術(shù)的助力下,用戶(hù)體驗(yàn)得到了顯著提升,;海通證券與商湯合作,,構(gòu)建金融 AI 應(yīng)用推動(dòng)數(shù)字化升級(jí);閱文集團(tuán)通過(guò)結(jié)合商湯科技的擬人大模型技術(shù),,打造 AI native 的虛擬社交生態(tài)平臺(tái)——筑夢(mèng)島,。

徐立表示,商湯的大模型自從文本開(kāi)始,,拓展至代碼辦公,、擬人對(duì)話(huà),、金融、農(nóng)業(yè)等多個(gè)垂直行業(yè),,推出專(zhuān)屬模型和一體機(jī),,使客戶(hù)能高效、經(jīng)濟(jì)地使用 AI 大模型,。目前,,商湯大模型已有超 3000 家客戶(hù)。

"現(xiàn)在的認(rèn)知其實(shí)還是在于,,說(shuō)如何用大模型去賦能行業(yè),,而且我認(rèn)為,我們處在一個(gè)很重要,、關(guān)鍵的轉(zhuǎn)折節(jié)點(diǎn),,也就是接下來(lái) AI 的超級(jí)時(shí)刻,有賴(lài)于我們共同去營(yíng)造超級(jí)應(yīng)用,。" 徐立表示,。

整體來(lái)說(shuō),全新商湯日日新大模型 5.5 版本,,在原生多模態(tài)能力下按場(chǎng)景需求可提供純語(yǔ)言,、多圖理解、4o 語(yǔ)音,、文生圖,、代碼 / 辦公小浣熊、擬人,、端側(cè)模擬、行業(yè)模型等多模態(tài),、多版本,、強(qiáng)場(chǎng)景 Agent 形態(tài)。

商湯披露,,截至目前,,已有超過(guò)兩百家企業(yè)選擇使用商湯代碼小浣熊工具,此次升級(jí)的小浣熊模型響應(yīng)速度提升達(dá) 5 倍,;同時(shí),,辦公小浣熊支持端側(cè)落地;基于 " 日日新 5.5" 大模型驅(qū)動(dòng)下,,從 5 月到今天,,全新商湯擬人模型版本的平均使用時(shí)長(zhǎng)在 SDK 調(diào)用下日均達(dá)到 130 分鐘,次日留存可以有 50% 以上,,且人均的對(duì)話(huà)人數(shù)超過(guò) 90 次,;另外,全新端側(cè)模型性能不斷提升,支持手機(jī),、平板,、一體機(jī)、車(chē)載等終端設(shè)備,,甚至還支持元蘿卜智能臺(tái)燈,。

另外,商湯早前還發(fā)布國(guó)內(nèi)首個(gè) " 可控 " 人物視頻生成大模型 Vimi,,也就是 " 圖生視頻 " 產(chǎn)品,,僅通過(guò)一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類(lèi)視頻,并支持多種驅(qū)動(dòng)方式,,可通過(guò)已有人物視頻,、動(dòng)畫(huà)、聲音,、文字等多種元素進(jìn)行驅(qū)動(dòng),。

會(huì)前交流時(shí),商湯研究院研發(fā)總監(jiān)盧樂(lè)煒 向鈦媒體 AGI 等透露,,目前商湯日日新的多模態(tài)模型就是邁向?qū)τ谝曨l理解,、對(duì)真實(shí)世界理解。" 在視頻指標(biāo)方面,,我們的模型跟目前的 SOTA 的方法相比,,有一個(gè) 10%-20% 的提升。"

" 性能提升需要模型有相當(dāng)大的規(guī)模,。另外,,如何更快速地訓(xùn)練一個(gè)更大(參數(shù))規(guī)模的模型,無(wú)論從算法,、設(shè)計(jì)還有工程的配合,,都需要很大的工作量,所以我們過(guò)去兩個(gè)月一直在持續(xù)攻關(guān),。" 盧樂(lè)煒表示,。

5.jpg

徐立強(qiáng)調(diào),商湯持續(xù)推進(jìn)模型應(yīng)用,,端側(cè)大模型的 API 接入價(jià)格將達(dá)到每臺(tái)設(shè)備,、每年 9.9 元。

目前,,商湯在多模態(tài),、基礎(chǔ)模型、文生圖,、文生視頻,、擬(數(shù)字)人模型,、行業(yè)垂直模型、端側(cè)模型,、開(kāi)源模型等熱門(mén)技術(shù)上均有涉獵和持續(xù)迭代,,同時(shí)也在不斷調(diào)整優(yōu)化整體研發(fā)和商業(yè)化節(jié)奏。鈦媒體 AGI 了解到,,預(yù)計(jì) V6 版本將會(huì)在今年內(nèi)公布,。

" 所有的智能音箱、智能車(chē)載,、智能眼鏡,,大家都來(lái)接上我們的端側(cè)大模型,真正讓大家用得起 AI 大模型,,AI 才會(huì)進(jìn)入它的超級(jí)時(shí)刻,。" 徐立在演講結(jié)尾表示。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118,;郵箱:[email protected],。