如何度量國(guó)產(chǎn)大模型,?
AIC" target="_blank">WAIC 此前比的是有無(wú)大模型,,如今比的是大模型落地能力,。
如果想要度量國(guó)產(chǎn)大模型大小廠商的實(shí)力,,WAIC(世界人工智能大會(huì))是一個(gè)不錯(cuò)的切口,。
眾所周知,,2023 年是國(guó)產(chǎn)大模型元年,在去年的 WAIC 之后,,騰訊發(fā)布混元大模型,,字節(jié)跳動(dòng)上線豆包 APP,而后通過(guò)豆包大模型正式開啟對(duì)外服務(wù),,年輕的月之暗面,、MiniMax 等創(chuàng)業(yè)公司形成了「五小虎」的格局,這讓今年的 WAIC 有了更強(qiáng)的指向性:大模型選手們都已走向臺(tái)前,,給了 AI 行業(yè)更多的機(jī)會(huì)和答案,。
相比去年,今年最大的變化就是,,國(guó)內(nèi)參與的互聯(lián)網(wǎng)科技公司更多了,。
除了老面孔騰訊、阿里,、百度和螞蟻之外,,今年的互聯(lián)網(wǎng)新面孔,包括 B 站和最近通過(guò)視頻大模型可靈走紅網(wǎng)絡(luò)的快手,,也包括「五小虎」中的智譜AI和百川智能,,甚至還有號(hào)稱要改變「五小虎」為「六小強(qiáng)」的階躍星辰。
當(dāng)然,,沒(méi)有出現(xiàn)的重要公司也不少,,比如在大模型領(lǐng)域飛速進(jìn)化的字節(jié)跳動(dòng)和月之暗面等。
往年 WAIC 上廠商們比的是有無(wú)大模型,,如今比的是大模型落地能力,。所以,從時(shí)間的發(fā)展周期上來(lái)說(shuō),,WAIC 已經(jīng)有了國(guó)產(chǎn)大模型度量衡的意味,,一系列國(guó)產(chǎn)大模型產(chǎn)品和落地應(yīng)用進(jìn)行公開展示,未來(lái)更加可期,。
7 月的 WAIC 結(jié)束后,,國(guó)產(chǎn)大模型廠商將會(huì)密集發(fā)布一系列多模態(tài)大模型,,行業(yè)進(jìn)化的速度將進(jìn)一步加快,比如 MiniMax 就在 WAIC 上透露,,將在下個(gè)月發(fā)布 AI 視頻生成產(chǎn)品,。
1 騰訊猛提速,阿里拼落地
阿里一直是 WAIC 的重要一員,。曾幾何時(shí),,大模型尚未成為行業(yè)發(fā)展的共識(shí),馬斯克和馬云就曾在 WAIC 上對(duì)人工智能的話題產(chǎn)生分歧,。馬云認(rèn)為,,人類無(wú)法創(chuàng)造出比自己聰明的生物;而馬斯克對(duì)這一論斷明確表示反對(duì),。
而今年 WAIC 上,,負(fù)責(zé)傳遞阿里聲音的人是阿里云創(chuàng)始人王堅(jiān)。
王堅(jiān)認(rèn)為,,在算法和數(shù)據(jù)等條件下,,人工智能對(duì)大公司會(huì)友好一點(diǎn),但是友好并不意味著寬容,,一定會(huì)有新的大公司出現(xiàn),,也一定會(huì)讓現(xiàn)在的大公司浴火重生。而大小企業(yè)的差別在于,,大企業(yè)會(huì)覺(jué)得 AI 是工具的革命,,小企業(yè)一定會(huì)覺(jué)得這是革命的工具,,「大企業(yè)也要意識(shí)到這是革命的工具,,那這個(gè)變化就來(lái)了?!?/p>
阿里如今是中國(guó)大模型背后的重要推手,,最廣為人知的標(biāo)簽,就是投資了 5 家大模型公司,,把月之暗面,、MiniMax、智譜 AI ,、百川智能和零一萬(wàn)物這5個(gè)獨(dú)角獸通通納入版圖之中,。
而今年的 WAIC 上,阿里也成了現(xiàn)場(chǎng)火爆的體驗(yàn)打卡點(diǎn),。
阿里不光展示了國(guó)內(nèi)用戶規(guī)模第一的智能編碼助手「通義靈碼」,,更是通過(guò)「通義十二時(shí)辰——體驗(yàn) AI 助手陪伴的一天」,全方位通義千問(wèn)大模型背后的對(duì)話,、效率,、智能體,、視覺(jué)四大核心能力,讓用戶感知 AI 助手在生活,、學(xué)習(xí)和工作中的實(shí)際作用,。
此外,釘釘和支付寶也是阿里 AI 能力落地上的重要一面,。釘釘通過(guò)「未來(lái)生產(chǎn)力」論壇,,展示了釘釘在智能組織構(gòu)建,以及 AI 在實(shí)際生產(chǎn)工作場(chǎng)景中的創(chuàng)新應(yīng)用案例,;支付寶的 AI 能力則通過(guò)支付寶智能助理,、AI 金融助理和 AI 就醫(yī)助理觸達(dá)用戶的生活場(chǎng)景。
相比阿里在 WAIC 場(chǎng)館內(nèi)的互動(dòng)感,,騰訊展示的更多則是場(chǎng)外發(fā)聲和產(chǎn)品進(jìn)化,。
自 5 月 30 日騰訊正式上線混元大模型 APP 元寶以來(lái),騰訊在大模型的推廣和進(jìn)化速度一直在提升,。尤其是最近騰訊云與智慧產(chǎn)業(yè)事業(yè)群 CEO 湯道生的采訪中談到,,騰訊對(duì)大模型并不是不著急,他跟馬化騰在針對(duì)大模型技術(shù)變革的企業(yè)微信群聊中,,經(jīng)常討論最新前沿并跟進(jìn)業(yè)務(wù)進(jìn)展,。
「我們從技術(shù)長(zhǎng)期布局投入,轉(zhuǎn)到產(chǎn)品的市場(chǎng)去進(jìn)攻,?!箿郎J(rèn)為,騰訊也不算在大模型上慢了一步,,不是什么都唯快不破,,過(guò)去半年騰訊在大模型上的新產(chǎn)品、新版本發(fā)布的頻率越來(lái)越高,,是因?yàn)轵v訊的風(fēng)格一貫是持續(xù)打磨產(chǎn)品,,不斷改善體驗(yàn),隨著市場(chǎng)慢慢成型,,用戶需求更明確,、清晰,騰訊也會(huì)加快步伐,。
事實(shí)上,,元寶 APP 發(fā)布不到一個(gè)月,就已經(jīng)更新了五六版,。
根據(jù)騰訊混元大模型負(fù)責(zé)人劉煜宏最新透露,,到目前為止,騰訊內(nèi)部有接近 700 個(gè)業(yè)務(wù)接入混元,,包括騰訊會(huì)議,、文檔,,微信讀書的 AI 助手等,基本上騰訊所有的(業(yè)務(wù))都用,,內(nèi)部調(diào)用量大概將近 3 億次,。
相比較湯道生的態(tài)度,劉煜宏承認(rèn),,去年混元大模型發(fā)布節(jié)奏慢,,一部分原因是因?yàn)橥读撕芏噘Y源先服務(wù)好內(nèi)部的「客戶」,因?yàn)轵v訊做事情,,「對(duì)外開放前一定要先在內(nèi)部打磨好,,自己的狗糧自己先消化」。
更重要的一點(diǎn)是,,劉煜宏談及了騰訊在大模型上的思考變化,。騰訊最初做混元大模型的邏輯,并沒(méi)有想要做 toC 的產(chǎn)品,,而是把基礎(chǔ)模型打磨好,,服務(wù)內(nèi)部需求,后來(lái)不斷調(diào)整方向,,推出「混元模型助手」到后來(lái)的獨(dú)立 APP,,就是因?yàn)椤覆惶剿髟?AI 大模型應(yīng)用,不知道怎么跟業(yè)務(wù)更好合作」,。
是否 toC 這個(gè)大模型的邏輯起點(diǎn),,也是騰訊和字節(jié)最大的不同。字節(jié)的大模型能力最先就是通過(guò)豆包 APP 進(jìn)行探索,,最后用豆包成為大模型的名字開啟對(duì)外服務(wù),。如今,混元大模型和豆包大模型走到了應(yīng)用層競(jìng)爭(zhēng)的同樣邏輯,,最大的變量就是騰訊的追趕速度,。
2 中廠的焦慮
今年的 WAIC上,,相比騰訊,、阿里這樣的大廠用大模型服務(wù)內(nèi)部業(yè)務(wù)生態(tài),Minimax,、智譜 AI 這些大模型創(chuàng)業(yè)公司算是第一次登場(chǎng),,他們更焦慮于如何站穩(wěn)腳跟后茁壯成長(zhǎng)。
比如,,展臺(tái)緊靠阿里的階躍星辰,,就在 WAIC上發(fā)布了三個(gè)大模型,其中包括 Step-2:萬(wàn)億參數(shù)的 MoE 模型,,目前還需要申請(qǐng)才能體驗(yàn),;Step-1.5V:千億參數(shù)多模態(tài)模型,,除了圖片理解能力提升外,也支持視頻理解,;Step-1X:圖像生成模型,,DiT 架構(gòu),600M,、2B,、8B 三種不同的參數(shù)量,對(duì)中國(guó)文化和元素進(jìn)行了優(yōu)化,。
階躍星辰的創(chuàng)辦人是微軟前全球副總裁姜大昕,,正在進(jìn)行一輪估值 20 億美元的新融資,據(jù)傳阿里也將參與階躍星辰的這次融資,。階躍星辰入場(chǎng)雖晚,,但極力想擠入「大模型五小虎」的戰(zhàn)隊(duì)中,在營(yíng)銷上試圖把格局改變?yōu)椤噶?qiáng)」,。
但卷模型還有出路嗎,?
正如百度創(chuàng)始人李彥宏在 WAIC 上所說(shuō),去年的百模大戰(zhàn)造成了社會(huì)資源的巨大浪費(fèi),,尤其是算力浪費(fèi),,但同時(shí)也使得中國(guó)追趕世界上最先進(jìn)基礎(chǔ)模型的能力得到了建立。李彥宏呼吁行業(yè)不要卷模型,,要去卷應(yīng)用,,「沒(méi)有應(yīng)用,光有一個(gè)基礎(chǔ)模型,,不管是開源還是閉源都一文不值」,。
應(yīng)用走在模型前面這一點(diǎn)上,快手可能是階躍星辰的范例,。
快手也是今年 WAIC 上的新面孔,,也將在 WAIC 上發(fā)布快手大模型和新產(chǎn)品,但其著力點(diǎn)更具有落地屬性,,重點(diǎn)是通過(guò)大模型打開商業(yè)化的空間,,以及通過(guò)視頻生成技術(shù)給短視頻行業(yè)注入新生機(jī)。目前,,快手大模型家族包括 1750 億參數(shù)規(guī)模的通用大語(yǔ)言模型「快意」,、文生圖大模型產(chǎn)品「可圖」和視頻生成大模型「可靈」。
此前《快手可靈,,把壓力給到了抖音剪映》已經(jīng)提及,,通過(guò)海外社交媒體的病毒式傳播,在文生視頻領(lǐng)域上,,快手「可靈」比肩 Sora ,,成為國(guó)產(chǎn)大模型中最先「交卷」的一家,,雖然目前國(guó)內(nèi)市場(chǎng)尚無(wú)對(duì)手,但更多的競(jìng)爭(zhēng)對(duì)手正在趕來(lái)的路上,。
而就在 6 月底,,快手「可靈」更進(jìn)一步,在文生視頻的基礎(chǔ)上,,拓展到了圖生視頻領(lǐng)域,,用戶只需要上傳圖片,就可以使可靈對(duì)圖像進(jìn)行理解,,賦予其 5 秒鮮活的生命力,。同時(shí),可靈還推出了視頻續(xù)寫功能,,用戶可以在已生成視頻的基礎(chǔ)上延續(xù)生成內(nèi)容,,能夠最長(zhǎng)生產(chǎn)約 3 分鐘的連貫視頻。
近期在微博等社交媒體上,,已經(jīng)流行起來(lái)通過(guò)快手可靈大模型進(jìn)行視頻創(chuàng)作,,尤其是甄嬛吃漢堡、還珠格格喝可樂(lè)等一系列惡搞《甄嬛傳》《西游記》《還珠格格》等經(jīng)典作品的短視頻,,都是通過(guò)可靈制作的,。截至目前,快手可靈注冊(cè)申請(qǐng)用戶數(shù)已經(jīng)超過(guò)了 54 萬(wàn),。
但遺憾的是,,快手大模型產(chǎn)品在 C 端市場(chǎng)引發(fā)的熱度,沒(méi)有反應(yīng)到資本市場(chǎng)中,,從 6 月 6 日可靈發(fā)布測(cè)試至今,,快手的股價(jià)一直處于緩慢下跌趨勢(shì)中,跌幅達(dá)到 15%,。
3 人形機(jī)器人是 AI 終極形態(tài),?
人形機(jī)器人已經(jīng)成為 AI 從數(shù)字世界落地到現(xiàn)實(shí)物理世界的香餑餑。
今年 WAIC 上展出了 45 款智能機(jī)器人,,其中有 25 款是人形機(jī)器人,。尤其是大模型的加持下,有了大模型能力的人形機(jī)器人,,相當(dāng)于擁有了自主決策和分解任務(wù)能力的大腦,。
特斯拉一直是 WAIC 的???,而除了 Cybertruck 汽車和 FSD(全自動(dòng)駕駛),今年特斯拉拿出來(lái)的最吸引人的產(chǎn)品就是二代人形機(jī)器人 Optimus,。
2021 年 8 月,,特斯拉發(fā)布了 Optimus 第一款智能機(jī)器人,,搭載了特斯拉自主研發(fā)的神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺(jué)技術(shù)。2023 年 12 月,,特斯拉公開了二代 Optimus(擎天柱)機(jī)器人,,相比一代更靈活,能用手拿雞蛋,,識(shí)別物體,,還能走路。
人形機(jī)器人的難度在于量產(chǎn)通用,,特斯拉預(yù)計(jì)明年開始限量生產(chǎn),,將有超過(guò) 1000 個(gè) Optimus 在特斯拉工廠幫助人類完成生產(chǎn)任務(wù)。馬斯克預(yù)計(jì),,人形機(jī)器人將成為工業(yè)主力,,數(shù)量有望超越人類,預(yù)計(jì)達(dá)到 100-200 億,。
特斯拉面對(duì)的挑戰(zhàn)很大,,因?yàn)槠淠繕?biāo)是年產(chǎn) 10 億臺(tái),占據(jù)市場(chǎng) 10% 以上份額,。要實(shí)現(xiàn)這一目標(biāo)必然要讓機(jī)器人的成本降低,,控制在 1 萬(wàn)美元左右,售價(jià)預(yù)計(jì) 2 萬(wàn)美元,,這將為特斯拉帶來(lái) 25-30 萬(wàn)億的市場(chǎng),。
而最能跟特斯拉二代人形機(jī)器人 Optimus 產(chǎn)生對(duì)標(biāo)的,是杭州的宇樹科技在今年 5 月發(fā)布的第二款通用人形機(jī)器人G1,,其標(biāo)準(zhǔn)版售價(jià) 9.9 萬(wàn)元,,這個(gè)價(jià)格遠(yuǎn)低于特斯拉的 Optimus,這凸顯出國(guó)內(nèi)人形機(jī)器人的「降本」優(yōu)勢(shì),。
在宇樹科技 5 個(gè)月前最新一輪融資中,,投資方包括美團(tuán)、源碼資本等,。更重要的是,,在機(jī)器人展示中,G1 機(jī)器人可以模擬人手的精準(zhǔn)操控能力,,不光能實(shí)現(xiàn)搬運(yùn)重物等常規(guī)操作,,還能實(shí)現(xiàn)汽水瓶開啟、焊接等精細(xì)化工作,。
相比于特斯拉人形機(jī)器人的團(tuán)隊(duì),,宇樹科技的團(tuán)隊(duì)更加年輕,創(chuàng)始人王興興是一位 90 后的年輕創(chuàng)造者。而特斯拉則是當(dāng)初從 OpenAI 挖來(lái)的深度學(xué)習(xí)專家安德烈·卡帕斯,,統(tǒng)領(lǐng)特斯拉的自動(dòng)駕駛工程師團(tuán)隊(duì)和人形機(jī)器人的開發(fā),。
馬斯克和王興興瞄準(zhǔn)的都是通用人形機(jī)器人,這是一個(gè)百億美元級(jí)別的市場(chǎng),。馬斯克認(rèn)為,,擎天柱機(jī)器人是將特斯拉轉(zhuǎn)變?yōu)閮r(jià)值 10 萬(wàn)億美元企業(yè)的關(guān)鍵,甚至人形機(jī)器人的潛力比特斯拉的電動(dòng)汽車業(yè)務(wù)更重要,。
而英偉達(dá)最新的財(cái)報(bào)也顯示,,其未來(lái)發(fā)展的戰(zhàn)略三大方向,其中之一就是 AI 應(yīng)用,,確立以智能汽車,、人形機(jī)器人、工業(yè)數(shù)字化和醫(yī)學(xué) AI 為未來(lái)增長(zhǎng)曲線,。
但通用人形機(jī)器人還有很長(zhǎng)的進(jìn)化成熟之路,。此前王興興在采訪中表示,目前大家做的事情很簡(jiǎn)單,,就是把 AI 技術(shù)拿過(guò)來(lái)給機(jī)器人用,,「目前 AI 跟機(jī)器人結(jié)合的技術(shù)臨界點(diǎn)還沒(méi)到,可能整個(gè)技術(shù)方案還沒(méi)跑通」,。
究其根本,,挑戰(zhàn)就在于如何用大模型讓人形機(jī)器人的行動(dòng)系統(tǒng)智能化,也就是讓機(jī)器人的大腦足夠成熟,,確??煽啃院蜏?zhǔn)確度。而一旦人工智能真正邁入通用人工智能階段,,人形機(jī)器人成為 AI 應(yīng)用的終極形態(tài)之一的夢(mèng)想才會(huì)成真,,人機(jī)共生的時(shí)代才會(huì)到來(lái)。