國產(chǎn)大模型 WAIC 競技：大廠拼落地，中廠顯焦慮-AET-電子技術(shù)應(yīng)用

國產(chǎn)大模型 WAIC 競技：大廠拼落地，中廠顯焦慮

日期： 2024-07-08

來源：藍(lán)洞商業(yè)

關(guān)鍵詞： 國產(chǎn)大模型 WAIC AI

AIC" target="_blank">WAIC 此前比的是有無大模型，如今比的是大模型落地能力。

如果想要度量國產(chǎn)大模型大小廠商的實(shí)力，WAIC（世界人工智能大會）是一個不錯的切口。

眾所周知，2023 年是國產(chǎn)大模型元年，在去年的 WAIC 之后，騰訊發(fā)布混元大模型，字節(jié)跳動上線豆包 APP，而后通過豆包大模型正式開啟對外服務(wù)，年輕的月之暗面、MiniMax 等創(chuàng)業(yè)公司形成了「五小虎」的格局，這讓今年的 WAIC 有了更強(qiáng)的指向性：大模型選手們都已走向臺前，給了 AI 行業(yè)更多的機(jī)會和答案。

相比去年，今年最大的變化就是，國內(nèi)參與的互聯(lián)網(wǎng)科技公司更多了。

除了老面孔騰訊、阿里、百度和螞蟻之外，今年的互聯(lián)網(wǎng)新面孔，包括 B 站和最近通過視頻大模型可靈走紅網(wǎng)絡(luò)的快手，也包括「五小虎」中的智譜AI和百川智能，甚至還有號稱要改變「五小虎」為「六小強(qiáng)」的階躍星辰。

當(dāng)然，沒有出現(xiàn)的重要公司也不少，比如在大模型領(lǐng)域飛速進(jìn)化的字節(jié)跳動和月之暗面等。

往年 WAIC 上廠商們比的是有無大模型，如今比的是大模型落地能力。所以，從時間的發(fā)展周期上來說，WAIC 已經(jīng)有了國產(chǎn)大模型度量衡的意味，一系列國產(chǎn)大模型產(chǎn)品和落地應(yīng)用進(jìn)行公開展示，未來更加可期。

7 月的 WAIC 結(jié)束后，國產(chǎn)大模型廠商將會密集發(fā)布一系列多模態(tài)大模型，行業(yè)進(jìn)化的速度將進(jìn)一步加快，比如 MiniMax 就在 WAIC 上透露，將在下個月發(fā)布 AI 視頻生成產(chǎn)品。

1 騰訊猛提速，阿里拼落地

阿里一直是 WAIC 的重要一員。曾幾何時，大模型尚未成為行業(yè)發(fā)展的共識，馬斯克和馬云就曾在 WAIC 上對人工智能的話題產(chǎn)生分歧。馬云認(rèn)為，人類無法創(chuàng)造出比自己聰明的生物；而馬斯克對這一論斷明確表示反對。

而今年 WAIC 上，負(fù)責(zé)傳遞阿里聲音的人是阿里云創(chuàng)始人王堅。

王堅認(rèn)為，在算法和數(shù)據(jù)等條件下，人工智能對大公司會友好一點(diǎn)，但是友好并不意味著寬容，一定會有新的大公司出現(xiàn)，也一定會讓現(xiàn)在的大公司浴火重生。而大小企業(yè)的差別在于，大企業(yè)會覺得 AI 是工具的革命，小企業(yè)一定會覺得這是革命的工具，「大企業(yè)也要意識到這是革命的工具，那這個變化就來了。」

阿里如今是中國大模型背后的重要推手，最廣為人知的標(biāo)簽，就是投資了 5 家大模型公司，把月之暗面、MiniMax、智譜 AI 、百川智能和零一萬物這5個獨(dú)角獸通通納入版圖之中。

而今年的 WAIC 上，阿里也成了現(xiàn)場火爆的體驗(yàn)打卡點(diǎn)。

阿里不光展示了國內(nèi)用戶規(guī)模第一的智能編碼助手「通義靈碼」，更是通過「通義十二時辰——體驗(yàn) AI 助手陪伴的一天」，全方位通義千問大模型背后的對話、效率、智能體、視覺四大核心能力，讓用戶感知 AI 助手在生活、學(xué)習(xí)和工作中的實(shí)際作用。

此外，釘釘和支付寶也是阿里 AI 能力落地上的重要一面。釘釘通過「未來生產(chǎn)力」論壇，展示了釘釘在智能組織構(gòu)建，以及 AI 在實(shí)際生產(chǎn)工作場景中的創(chuàng)新應(yīng)用案例；支付寶的 AI 能力則通過支付寶智能助理、AI 金融助理和 AI 就醫(yī)助理觸達(dá)用戶的生活場景。

相比阿里在 WAIC 場館內(nèi)的互動感，騰訊展示的更多則是場外發(fā)聲和產(chǎn)品進(jìn)化。

自 5 月 30 日騰訊正式上線混元大模型 APP 元寶以來，騰訊在大模型的推廣和進(jìn)化速度一直在提升。尤其是最近騰訊云與智慧產(chǎn)業(yè)事業(yè)群 CEO 湯道生的采訪中談到，騰訊對大模型并不是不著急，他跟馬化騰在針對大模型技術(shù)變革的企業(yè)微信群聊中，經(jīng)常討論最新前沿并跟進(jìn)業(yè)務(wù)進(jìn)展。

「我們從技術(shù)長期布局投入，轉(zhuǎn)到產(chǎn)品的市場去進(jìn)攻。」湯道生認(rèn)為，騰訊也不算在大模型上慢了一步，不是什么都唯快不破，過去半年騰訊在大模型上的新產(chǎn)品、新版本發(fā)布的頻率越來越高，是因?yàn)轵v訊的風(fēng)格一貫是持續(xù)打磨產(chǎn)品，不斷改善體驗(yàn)，隨著市場慢慢成型，用戶需求更明確、清晰，騰訊也會加快步伐。

事實(shí)上，元寶 APP 發(fā)布不到一個月，就已經(jīng)更新了五六版。

根據(jù)騰訊混元大模型負(fù)責(zé)人劉煜宏最新透露，到目前為止，騰訊內(nèi)部有接近 700 個業(yè)務(wù)接入混元，包括騰訊會議、文檔，微信讀書的 AI 助手等，基本上騰訊所有的（業(yè)務(wù)）都用，內(nèi)部調(diào)用量大概將近 3 億次。

相比較湯道生的態(tài)度，劉煜宏承認(rèn)，去年混元大模型發(fā)布節(jié)奏慢，一部分原因是因?yàn)橥读撕芏噘Y源先服務(wù)好內(nèi)部的「客戶」，因?yàn)轵v訊做事情，「對外開放前一定要先在內(nèi)部打磨好，自己的狗糧自己先消化」。

更重要的一點(diǎn)是，劉煜宏談及了騰訊在大模型上的思考變化。騰訊最初做混元大模型的邏輯，并沒有想要做 toC 的產(chǎn)品，而是把基礎(chǔ)模型打磨好，服務(wù)內(nèi)部需求，后來不斷調(diào)整方向，推出「混元模型助手」到后來的獨(dú)立 APP，就是因?yàn)椤覆惶剿髟?AI 大模型應(yīng)用，不知道怎么跟業(yè)務(wù)更好合作」。

是否 toC 這個大模型的邏輯起點(diǎn)，也是騰訊和字節(jié)最大的不同。字節(jié)的大模型能力最先就是通過豆包 APP 進(jìn)行探索，最后用豆包成為大模型的名字開啟對外服務(wù)。如今，混元大模型和豆包大模型走到了應(yīng)用層競爭的同樣邏輯，最大的變量就是騰訊的追趕速度。

2 中廠的焦慮

今年的 WAIC上，相比騰訊、阿里這樣的大廠用大模型服務(wù)內(nèi)部業(yè)務(wù)生態(tài)，Minimax、智譜 AI 這些大模型創(chuàng)業(yè)公司算是第一次登場，他們更焦慮于如何站穩(wěn)腳跟后茁壯成長。

比如，展臺緊靠阿里的階躍星辰，就在 WAIC上發(fā)布了三個大模型，其中包括 Step-2：萬億參數(shù)的 MoE 模型，目前還需要申請才能體驗(yàn)；Step-1.5V：千億參數(shù)多模態(tài)模型，除了圖片理解能力提升外，也支持視頻理解；Step-1X：圖像生成模型，DiT 架構(gòu)，600M、2B、8B 三種不同的參數(shù)量，對中國文化和元素進(jìn)行了優(yōu)化。

階躍星辰的創(chuàng)辦人是微軟前全球副總裁姜大昕，正在進(jìn)行一輪估值 20 億美元的新融資，據(jù)傳阿里也將參與階躍星辰的這次融資。階躍星辰入場雖晚，但極力想擠入「大模型五小虎」的戰(zhàn)隊中，在營銷上試圖把格局改變?yōu)椤噶?qiáng)」。

但卷模型還有出路嗎？

正如百度創(chuàng)始人李彥宏在 WAIC 上所說，去年的百模大戰(zhàn)造成了社會資源的巨大浪費(fèi)，尤其是算力浪費(fèi)，但同時也使得中國追趕世界上最先進(jìn)基礎(chǔ)模型的能力得到了建立。李彥宏呼吁行業(yè)不要卷模型，要去卷應(yīng)用，「沒有應(yīng)用，光有一個基礎(chǔ)模型，不管是開源還是閉源都一文不值」。

應(yīng)用走在模型前面這一點(diǎn)上，快手可能是階躍星辰的范例。

快手也是今年 WAIC 上的新面孔，也將在 WAIC 上發(fā)布快手大模型和新產(chǎn)品，但其著力點(diǎn)更具有落地屬性，重點(diǎn)是通過大模型打開商業(yè)化的空間，以及通過視頻生成技術(shù)給短視頻行業(yè)注入新生機(jī)。目前，快手大模型家族包括 1750 億參數(shù)規(guī)模的通用大語言模型「快意」、文生圖大模型產(chǎn)品「可圖」和視頻生成大模型「可靈」。

此前《快手可靈，把壓力給到了抖音剪映》已經(jīng)提及，通過海外社交媒體的病毒式傳播，在文生視頻領(lǐng)域上，快手「可靈」比肩 Sora ，成為國產(chǎn)大模型中最先「交卷」的一家，雖然目前國內(nèi)市場尚無對手，但更多的競爭對手正在趕來的路上。

而就在 6 月底，快手「可靈」更進(jìn)一步，在文生視頻的基礎(chǔ)上，拓展到了圖生視頻領(lǐng)域，用戶只需要上傳圖片，就可以使可靈對圖像進(jìn)行理解，賦予其 5 秒鮮活的生命力。同時，可靈還推出了視頻續(xù)寫功能，用戶可以在已生成視頻的基礎(chǔ)上延續(xù)生成內(nèi)容，能夠最長生產(chǎn)約 3 分鐘的連貫視頻。

近期在微博等社交媒體上，已經(jīng)流行起來通過快手可靈大模型進(jìn)行視頻創(chuàng)作，尤其是甄嬛吃漢堡、還珠格格喝可樂等一系列惡搞《甄嬛傳》《西游記》《還珠格格》等經(jīng)典作品的短視頻，都是通過可靈制作的。截至目前，快手可靈注冊申請用戶數(shù)已經(jīng)超過了 54 萬。

但遺憾的是，快手大模型產(chǎn)品在 C 端市場引發(fā)的熱度，沒有反應(yīng)到資本市場中，從 6 月 6 日可靈發(fā)布測試至今，快手的股價一直處于緩慢下跌趨勢中，跌幅達(dá)到 15%。

3 人形機(jī)器人是 AI 終極形態(tài)？

人形機(jī)器人已經(jīng)成為 AI 從數(shù)字世界落地到現(xiàn)實(shí)物理世界的香餑餑。

今年 WAIC 上展出了 45 款智能機(jī)器人，其中有 25 款是人形機(jī)器人。尤其是大模型的加持下，有了大模型能力的人形機(jī)器人，相當(dāng)于擁有了自主決策和分解任務(wù)能力的大腦。

特斯拉一直是 WAIC 的常客，而除了 Cybertruck 汽車和 FSD（全自動駕駛），今年特斯拉拿出來的最吸引人的產(chǎn)品就是二代人形機(jī)器人 Optimus。

2021 年 8 月，特斯拉發(fā)布了 Optimus 第一款智能機(jī)器人，搭載了特斯拉自主研發(fā)的神經(jīng)網(wǎng)絡(luò)和計算機(jī)視覺技術(shù)。2023 年 12 月，特斯拉公開了二代 Optimus（擎天柱）機(jī)器人，相比一代更靈活，能用手拿雞蛋，識別物體，還能走路。

人形機(jī)器人的難度在于量產(chǎn)通用，特斯拉預(yù)計明年開始限量生產(chǎn)，將有超過 1000 個 Optimus 在特斯拉工廠幫助人類完成生產(chǎn)任務(wù)。馬斯克預(yù)計，人形機(jī)器人將成為工業(yè)主力，數(shù)量有望超越人類，預(yù)計達(dá)到 100-200 億。

特斯拉面對的挑戰(zhàn)很大，因?yàn)槠淠繕?biāo)是年產(chǎn) 10 億臺，占據(jù)市場 10% 以上份額。要實(shí)現(xiàn)這一目標(biāo)必然要讓機(jī)器人的成本降低，控制在 1 萬美元左右，售價預(yù)計 2 萬美元，這將為特斯拉帶來 25-30 萬億的市場。

而最能跟特斯拉二代人形機(jī)器人 Optimus 產(chǎn)生對標(biāo)的，是杭州的宇樹科技在今年 5 月發(fā)布的第二款通用人形機(jī)器人G1，其標(biāo)準(zhǔn)版售價 9.9 萬元，這個價格遠(yuǎn)低于特斯拉的 Optimus，這凸顯出國內(nèi)人形機(jī)器人的「降本」優(yōu)勢。

在宇樹科技 5 個月前最新一輪融資中，投資方包括美團(tuán)、源碼資本等。更重要的是，在機(jī)器人展示中，G1 機(jī)器人可以模擬人手的精準(zhǔn)操控能力，不光能實(shí)現(xiàn)搬運(yùn)重物等常規(guī)操作，還能實(shí)現(xiàn)汽水瓶開啟、焊接等精細(xì)化工作。

相比于特斯拉人形機(jī)器人的團(tuán)隊，宇樹科技的團(tuán)隊更加年輕，創(chuàng)始人王興興是一位 90 后的年輕創(chuàng)造者。而特斯拉則是當(dāng)初從 OpenAI 挖來的深度學(xué)習(xí)專家安德烈·卡帕斯，統(tǒng)領(lǐng)特斯拉的自動駕駛工程師團(tuán)隊和人形機(jī)器人的開發(fā)。

馬斯克和王興興瞄準(zhǔn)的都是通用人形機(jī)器人，這是一個百億美元級別的市場。馬斯克認(rèn)為，擎天柱機(jī)器人是將特斯拉轉(zhuǎn)變?yōu)閮r值 10 萬億美元企業(yè)的關(guān)鍵，甚至人形機(jī)器人的潛力比特斯拉的電動汽車業(yè)務(wù)更重要。

而英偉達(dá)最新的財報也顯示，其未來發(fā)展的戰(zhàn)略三大方向，其中之一就是 AI 應(yīng)用，確立以智能汽車、人形機(jī)器人、工業(yè)數(shù)字化和醫(yī)學(xué) AI 為未來增長曲線。

但通用人形機(jī)器人還有很長的進(jìn)化成熟之路。此前王興興在采訪中表示，目前大家做的事情很簡單，就是把 AI 技術(shù)拿過來給機(jī)器人用，「目前 AI 跟機(jī)器人結(jié)合的技術(shù)臨界點(diǎn)還沒到，可能整個技術(shù)方案還沒跑通」。

究其根本，挑戰(zhàn)就在于如何用大模型讓人形機(jī)器人的行動系統(tǒng)智能化，也就是讓機(jī)器人的大腦足夠成熟，確保可靠性和準(zhǔn)確度。而一旦人工智能真正邁入通用人工智能階段，人形機(jī)器人成為 AI 應(yīng)用的終極形態(tài)之一的夢想才會成真，人機(jī)共生的時代才會到來。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

國產(chǎn)大模型 WAIC 競技：大廠拼落地，中廠顯焦慮

日期： 2024-07-08

來源：藍(lán)洞商業(yè)

相關(guān)內(nèi)容