《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 中國(guó)大模型價(jià)格戰(zhàn)背后的真相

中國(guó)大模型價(jià)格戰(zhàn)背后的真相

2024-05-23
來源:極客公園

5 月 21 日上午,,阿里云在其例行峰會(huì)上,,意外地釋放了大降價(jià)的消息:通義千問 GPT-4 級(jí)主力模型推理輸入價(jià)格降至 0.5 元 / 百萬 tokens,直降 97%,。

1.jpg

這個(gè)大幅度降價(jià)的消息瞬間引發(fā)了與業(yè)界的普遍關(guān)注和討論,但短短數(shù)小時(shí)連鎖反應(yīng)出現(xiàn)了,,百度智能云官宣文心大模型主力模型 ERNIE Speed(上下文長(zhǎng)度 8K,、128K)、ERNIE Lite(上下文長(zhǎng)度 8K,、128K)免費(fèi),。雖然這兩個(gè)模型和阿里宣布降價(jià)的模型并不完全對(duì)應(yīng),但是這個(gè)動(dòng)作讓很多人開始高呼中國(guó)大模型企業(yè)的 API 商業(yè)模式,,難道就這樣在 3 小時(shí)內(nèi)就消失了嗎,?

2.jpg

實(shí)際上在更早之前,字節(jié)跳動(dòng)宣布,,豆包通用模型推理輸入價(jià)格為 0.8 元 / 百萬 tokens,。

雖然這些價(jià)格背后在并發(fā)量,,模型能力上有很多不同的細(xì)節(jié)區(qū)別,甚至根據(jù)創(chuàng)業(yè)者的實(shí)際計(jì)算,,真正落到業(yè)務(wù)里用起來,,各家的成本下降都沒有宣傳上那么夸張。

但至少紙面上看,,每百萬 token 推理輸入量,,字節(jié)、阿里,、百度先后在一周內(nèi)官宣了 0.8 元,,0.5 元和免費(fèi)的報(bào)價(jià)。有業(yè)界人士甚至開玩笑說,,眼瞅著下一家跟進(jìn)的廠商可能就得發(fā)錢補(bǔ)貼讓客戶用 API 了,,在這么短的時(shí)間內(nèi)產(chǎn)生這樣劇烈的變化,到底是因?yàn)槭裁??這是一次市場(chǎng)宣傳上的內(nèi)卷,?還是大模型 API 調(diào)用的商業(yè)模式,就真的這么消解了嗎,?

01

價(jià)格戰(zhàn)背后,,大模型

API 調(diào)用的商業(yè)模式

其實(shí)最早 ChatGPT 發(fā)布時(shí),大家對(duì)大模型直接作為服務(wù)被調(diào)用的商業(yè)模式有很大期待,。畢竟,,與上一波 AI 煙囪式的項(xiàng)目交付方式相比,大模型帶來了更通用的 AI 能力,,作為標(biāo)準(zhǔn)化服務(wù)被調(diào)用,,道理上也說得通。

就拿 OpenAI 來說,,有兩大商業(yè)化手段,,一是像 ChatGPT Plus 20 美元 / 月這樣的會(huì)員訂閱模式,另一個(gè)是開發(fā)者 API 調(diào)用服務(wù),。在這兩大標(biāo)準(zhǔn)化服務(wù)的拉動(dòng)下,,2023 年 12 月 31 日,,The information 爆出 OpenAI 的年度經(jīng)常性收入(Annual Recurring Revenue,,ARR)已經(jīng)達(dá)到了 16 億美元。

但即便強(qiáng)如 OpenAI 的模型能力,,這個(gè)體量的營(yíng)收相比其百億美金級(jí)別的研發(fā)成本而言,,目前看也還是杯水車薪。

3.jpg

事實(shí)上,,只提供模型的 API,,距離 AI 應(yīng)用在場(chǎng)景中落地還有很大距離,,大部分 AI 應(yīng)用還需要在一個(gè)通用的模型 API 之上,在場(chǎng)景里喂數(shù)據(jù),、做微調(diào)等來優(yōu)化模型引擎,。看到這一瓶頸后,,國(guó)內(nèi)大模型廠商在過去一年也做了一系列探索來降低 AI 應(yīng)用的門檻,,以期擴(kuò)大大模型的調(diào)用量。

以百度智能云為例,,去年相繼推出模型開發(fā)工具 Model Builder 和 AI 應(yīng)用開發(fā) AppBuilder,、更具效價(jià)比的不同模型等,但模型的調(diào)用增長(zhǎng)似乎依然有限,。今年 4 月,,百度智能云推出生態(tài)打法,和有渠道,、場(chǎng)景的供應(yīng)商一起合作服務(wù)客戶,,旨在進(jìn)一步拉升文心大模型標(biāo)準(zhǔn)化的 API 調(diào)用量。這些跡象上看,,大廠們顯然并沒有真的準(zhǔn)備放棄 API 調(diào)用的商業(yè)模式,,但這個(gè)商業(yè)模式還沒有真正收到成規(guī)模的錢,倒是真的問題,。

上周,,百度最新公布的數(shù)據(jù)顯示,文心大模型日處理文本 2500 億 token,,另一大廠字節(jié)跳動(dòng)日均處理 1200 億 token 文本,,但其中很大一部分是大廠內(nèi)部業(yè)務(wù)在調(diào)用做 AI 應(yīng)用和業(yè)務(wù)探索。

可以看出,,盡管模型廠商做了很多嘗試,,但標(biāo)準(zhǔn)化的模型 API 并沒有迎來確定性的增長(zhǎng)。

這是本周大廠模型推理價(jià)格降低的大前提和背景,。理解了模型 API 調(diào)用的需求現(xiàn)狀,,也就不難理解這一波降價(jià)動(dòng)作——降價(jià)并沒有真的損失多少收入,不如激活下市場(chǎng),,賺個(gè)吆喝,,促進(jìn)很多企業(yè)從「免費(fèi)試用」開始下水,早點(diǎn)啟動(dòng)對(duì) AI 進(jìn)入業(yè)務(wù)流的嘗試,。

其實(shí),,這一波降價(jià)的連鎖反應(yīng),真正的源頭并不是阿里云,,也不是字節(jié)跳動(dòng),,比大廠降價(jià)更早的,,是一家創(chuàng)業(yè)公司。

5 月 6 日,,國(guó)內(nèi)創(chuàng)業(yè)公司幻方旗下的大模型公司「深度求索」開源了第二代 MoE 模型:DeepSeek-V2,,主打參數(shù)更多、能力更強(qiáng),、成本更低,。

由于 DeepSeek 的技術(shù)優(yōu)勢(shì)在全球大模型圈子得到了普遍好評(píng),而其在模型能力逼近第一梯隊(duì)閉源模型的前提下,,還把推理成本降到了 1 塊錢 / 百萬 token,,也就是說,成本是 Llama3 70B 的七分之一,,GPT-4 Turbo 的七十分之一,。而且,DeepSeek v2 還能做到有利潤(rùn),,這顯然是是模型架構(gòu),、系統(tǒng)、工程的一系列進(jìn)步帶來的成本降低,。

這一信息在實(shí)際做模型應(yīng)用的產(chǎn)業(yè)界引起了廣泛討論,,在海外也引起了不小的波動(dòng),半導(dǎo)體和人工智能獨(dú)立研究機(jī)構(gòu) SemiAnaysis 稱其性能直逼大模型 GPT-4 所代表的第一梯隊(duì),,同時(shí)推理價(jià)格相當(dāng)?shù)?,是不可小覷的中國(guó)力量。

DeepSeek v2 宣布其價(jià)格為 1 元 / 百萬 token 后,,隨即引來了大模型價(jià)格戰(zhàn),,智譜、面壁,、字節(jié),、阿里、百度,,以及今天跟進(jìn)的科大訊飛,、騰訊云相繼宣布了模型推理價(jià)格降低。

對(duì)于各家不同的降價(jià)策略,,已經(jīng)有一些質(zhì)疑聲音稱一些降價(jià)的模型本身吞吐量就低,,而高性能模型并沒有降價(jià)。并且還有很多細(xì)節(jié)條款會(huì)讓最終企業(yè)用起來沒有宣傳的那么便宜,,從這個(gè)角度看,,降價(jià)更多是模型廠商出于市場(chǎng)和品牌的考量,進(jìn)行的一波內(nèi)卷,。

歸根結(jié)底,,能形成價(jià)格戰(zhàn)的連鎖反應(yīng),也是當(dāng)前各大模型的能力放在可用的場(chǎng)景中,,尚未拉開差距,,用戶甚至有免費(fèi)開源的產(chǎn)品可以用。

一位 SaaS 廠商創(chuàng)始人向極客公園表示,,「對(duì)我來說用誰的其實(shí)無所謂,,因?yàn)樗麄冏詈笈艿枚疾畈欢啵?dāng)把時(shí)間線拉長(zhǎng)來看,,最后這些廠商提供的模型 API 服務(wù),,99.9% 的概率跟今天的云是差不多的概念。另外,,如果一個(gè)通用的模型 API 無法深度適配場(chǎng)景,,還是要自己基于開源模型,用場(chǎng)景數(shù)據(jù)做專門的深度訓(xùn)練,,也不會(huì)接通用的模型 API,。」

最終的的客戶需求,,其實(shí)是端到端的訴求,,是可以用、可以看到效果的東西,,而不是模型調(diào)用,。

02

大模型,巨頭和

創(chuàng)業(yè)公司有不同的游戲

當(dāng)然,,模型推理價(jià)格降低本身也是技術(shù)發(fā)展帶來的必然結(jié)果,,有一系列工程、架構(gòu),、系統(tǒng)手段可以持續(xù)優(yōu)化,。今天凌晨微軟 Build 開發(fā)者大會(huì)上,納德拉還舉例解釋了這一趨勢(shì),。他說,,過去一年 GPT-4 性能提升了 6 倍,但成本降低到了之前的 1/12,,對(duì)應(yīng)性能 / 成本提升了 70 倍,。

4.jpg

「難的是探索模型能力上限,至于模型推理價(jià)格一定有辦法降低」,,Minimax 創(chuàng)始人嚴(yán)俊杰上周坐客極客公園直播節(jié)目中表述了這一技術(shù)趨勢(shì),,他表示,模型推理價(jià)格降低到可用,,在學(xué)術(shù)界已經(jīng)發(fā)生過三次了,,這不難,。

模型技術(shù)的攀升,才是 API 調(diào)用商業(yè)模式能繼續(xù)增長(zhǎng)的前提,。其實(shí)細(xì)看今天宣布降價(jià)的模型產(chǎn)品也是一樣,,真正大規(guī)模、高性能,、支持高并發(fā)的模型推理還是要收費(fèi),,降價(jià)幅度是有限的。

但長(zhǎng)期來看,,API 模式最終考驗(yàn)的還是模型能力,,如果技術(shù)拉不開差距,價(jià)格也一定拉不開差距,,最終模型調(diào)用的價(jià)值會(huì)被稀釋,,雖然依舊是重要的基礎(chǔ)設(shè)施,但價(jià)值大小就從油變水了,。

換一個(gè)角度看,,今天一個(gè)通用的模型 API 可能不是迫切的需求。就像 Lepton.ai 的創(chuàng)始人賈揚(yáng)清在朋友圈表達(dá)的觀點(diǎn),,「站在整個(gè) AI 業(yè)界的角度我想說,,降價(jià)是個(gè)拍腦袋就可以做的簡(jiǎn)單策略,但是真正的 To B 商業(yè)成功更難,?!菇裉炱髽I(yè)在使用 AI 的時(shí)候,并不是成本驅(qū)動(dòng)的,,「今天不是說 API 貴才沒有人用,,而是因?yàn)橐闱宄降自趺从闷饋懋a(chǎn)生業(yè)務(wù)價(jià)值」,。

從這個(gè)角度看,,如何把大模型能力推動(dòng)到企業(yè)的業(yè)務(wù)里的很大一部分任務(wù),可能又回落到傳統(tǒng) SaaS 廠商(用 AI 升級(jí)產(chǎn)品之后)手里,,需要他們作為智能生產(chǎn)力的「干線物流」+「前置倉」,,輸送到各個(gè)場(chǎng)景中。

隨著模型 API 直供模式的高度內(nèi)卷,,巨頭其實(shí)已經(jīng)在向能交付價(jià)值的 SaaS 看,,微軟今天宣稱 GitHub Copilot 訂閱者已經(jīng)有 180 萬付費(fèi)用戶。谷歌近日也正在與 CRM 營(yíng)銷巨頭 Hubspot 談高達(dá) 300 億美金收購可能性,,因?yàn)榍罢呖赡軙?huì)利用這次收購來加強(qiáng)其在 AI 領(lǐng)域產(chǎn)品整合,。

對(duì)于巨頭而言,模型技術(shù)和實(shí)際場(chǎng)景,兩個(gè)都要抓,,才能有規(guī)?;氖杖搿5珰w根結(jié)底,,模型能力和別人拉開距離,,才是 API 模式可以產(chǎn)生價(jià)值的「華山一條路」的挑戰(zhàn),。

而對(duì)于大模型創(chuàng)業(yè)公司而言,,也是個(gè)「華山兩條路」的局面,即要么做出比大公司更好的模型技術(shù),,要么從模型走向產(chǎn)品,,直接創(chuàng)造價(jià)值。

智能的能力不會(huì)是免費(fèi)的,,但是怎么規(guī)?;膭?chuàng)造價(jià)值,巨頭和創(chuàng)業(yè)公司,,都還在尋找答案,。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。