“百模大戰(zhàn)”，來(lái)了-AET-電子技術(shù)應(yīng)用

“百模大戰(zhàn)”，來(lái)了

日期： 2023-04-13

作者：王敏

來(lái)源：深燃

關(guān)鍵詞： 文心一言 ChatGPT 大模型

　　深燃（shenrancaijing）原創(chuàng)

　　作者 | 王敏

　　編輯 | 金玙璠

　　一夜之間，AI大模型熱得發(fā)燙。

　　繼3月中旬，百度最先下場(chǎng)，以“文心一言”搶占了對(duì)標(biāo)ChatGPT的“國(guó)內(nèi)第一”后，過(guò)去一個(gè)月，大模型一直是市場(chǎng)的焦點(diǎn)。尤其是在過(guò)去一周里，各界選手紛紛“大干快上”，密集開(kāi)“卷”，要么直接卷大模型，要么卷產(chǎn)品卷Demo，要么卷預(yù)告卷進(jìn)展。總之，大模型江湖，徹底火起來(lái)了。

　　百度最先挑起戰(zhàn)事，阿里、商湯跟得最緊、跑得最猛，都已發(fā)布類ChatGPT產(chǎn)品。

　　不止如此，科大訊飛等中大廠的大模型也已經(jīng)在發(fā)布的路上。而適配到具體場(chǎng)景的應(yīng)用和產(chǎn)品，比如360的“360智腦”已經(jīng)進(jìn)行過(guò)現(xiàn)場(chǎng)演示，有贊也帶來(lái)了由大模型驅(qū)動(dòng)的首個(gè)AI產(chǎn)品“加我智能”。就連飛書(shū)，也悄悄上線了關(guān)于智能助手“My AI”的Demo視頻。

　　就在去年，AI還因?yàn)樯虡I(yè)化困局而被外界詬病。去年年底，OpenAI的ChatGPT問(wèn)世，成為了攪動(dòng)AI大模型江湖的鯰魚(yú)，一時(shí)間，各類選手紛紛涌了進(jìn)來(lái)。

　　被視為是移動(dòng)互聯(lián)網(wǎng)時(shí)代第一場(chǎng)大戰(zhàn)的“千團(tuán)大戰(zhàn)”，至今仍令人記憶猶新，那時(shí)，從業(yè)者們的信念是，所有的行業(yè)都值得用互聯(lián)網(wǎng)再做一遍。時(shí)至今日，阿里巴巴集團(tuán)董事會(huì)主席兼CEO張勇在4月11日已經(jīng)喊出“所有產(chǎn)品都值得用大模型重做一遍”的口號(hào)。盡管當(dāng)下還處于大模型混戰(zhàn)的早期階段，各家的能力更新，都還沒(méi)有正式對(duì)外開(kāi)放，對(duì)于大廠的大模型能力，還沒(méi)有一套成熟的評(píng)估體系，但是，AI大模型時(shí)代的變革，已經(jīng)開(kāi)始醞釀。

　　市場(chǎng)各種信號(hào)都昭示著，“百模大戰(zhàn)”的帷幕已經(jīng)拉開(kāi)。曾經(jīng)，硝煙彌漫的“千團(tuán)大戰(zhàn)”，結(jié)局是一地雞毛，數(shù)千家公司同臺(tái)競(jìng)技，只有美團(tuán)最終跑了出來(lái)，無(wú)數(shù)公司淪為炮灰。現(xiàn)如今，AI時(shí)代的“百模大戰(zhàn)”，“入場(chǎng)券”更貴，對(duì)于資源、技術(shù)、人才的要求更高，也更需要耐心和時(shí)間。新選手燒錢(qián)燒時(shí)間，結(jié)果也可能只是巨頭的陪跑。這場(chǎng)持久戰(zhàn)，才剛剛開(kāi)始。

　　百“模”大戰(zhàn)，一觸即發(fā)

　　大模型江湖混戰(zhàn)，愈演愈烈，下場(chǎng)的選手越來(lái)越多。競(jìng)爭(zhēng)最激烈也最受關(guān)注的，便是在大模型領(lǐng)域有所積累的互聯(lián)網(wǎng)巨頭選手們。

　　這波混戰(zhàn)源起ChatGPT。巨頭選手們的類ChatGPT產(chǎn)品以及最新的AI大語(yǔ)言模型首先受到關(guān)注。其中，百度3月16日發(fā)布了“文心一言”；阿里的“通義千問(wèn)”已從4月7日開(kāi)始企業(yè)內(nèi)測(cè)；商湯科技在4月10日的技術(shù)交流會(huì)上帶來(lái)了“商量SenseChat”，目前還未對(duì)外開(kāi)放；360在3月29日現(xiàn)場(chǎng)演示了“360智腦”后，也將于4月16日開(kāi)啟企業(yè)內(nèi)測(cè)。

　　這些類ChatGPT產(chǎn)品，主打的都是對(duì)話問(wèn)答、文本及代碼等生成能力，外界常常會(huì)把多輪對(duì)話、數(shù)學(xué)能力、編碼能力作為測(cè)評(píng)的標(biāo)準(zhǔn)。

　　業(yè)界的共識(shí)是，國(guó)內(nèi)這些產(chǎn)品相較ChatGPT，還有一定的差距。但是這些產(chǎn)品，究竟孰強(qiáng)孰弱、孰優(yōu)孰劣，還難下定論，因?yàn)樯刑幱趦?nèi)測(cè)或演示階段。

　　不過(guò)，各家的產(chǎn)品形態(tài)有一定差別。比如，盡管文心一言的生成圖片能力遭到吐槽，但已經(jīng)實(shí)現(xiàn)了多模態(tài)交互；通義千問(wèn)增加了“百寶袋”，把寫(xiě)提綱、SWOT分析等能力單獨(dú)列成板塊以供使用；360則是直接和搜索引擎場(chǎng)景進(jìn)行了結(jié)合。

　　與類ChatGPT產(chǎn)品共同進(jìn)入我們視野的，則是各家的大模型體系。

　　其中，360的大模型，此前市場(chǎng)關(guān)注度并不算高。不過(guò)，360稱，其人工智能研究院從2020年開(kāi)始，一直在對(duì)包括類ChatGPT在內(nèi)的大模型通用人工智能技術(shù)持續(xù)投入。

　　其余三家中，百度“文心一言”和阿里的“通義千問(wèn)”，背后分別是此前已經(jīng)發(fā)布過(guò)的文心大模型體系和通義大模型體系；商湯“商量SenseChat”背后是最新問(wèn)世的“日日新SenseNova”大模型體系。三家本質(zhì)都是在統(tǒng)一AI底座的基礎(chǔ)上，在通用模型層覆蓋NLP、視覺(jué)等領(lǐng)域，再進(jìn)行行業(yè)模型和場(chǎng)景模型的孵化。

　微信截圖_20230413102202.png

　　文心大模型除了有文心一言、AI作畫(huà)應(yīng)用文心一格外，還和工業(yè)、能源、金融等多個(gè)行業(yè)客戶共同打造了11個(gè)行業(yè)大模型。商湯基于大模型體系，還發(fā)布了AI內(nèi)容創(chuàng)作社區(qū)平臺(tái)“秒畫(huà)”、AI數(shù)字人視頻生成平臺(tái)“如影”、3D內(nèi)容生成平臺(tái)“瓊宇”、“格物”。

　　接下來(lái)，預(yù)計(jì)最快亮相的選手，當(dāng)屬科大訊飛。其計(jì)劃于5月6日發(fā)布“1+N認(rèn)知智能大模型”，“1”是底座平臺(tái)，“N”則是應(yīng)用于多個(gè)行業(yè)領(lǐng)域的專用大模型版本，同時(shí)，“N”個(gè)場(chǎng)景的示范性應(yīng)用產(chǎn)品也將隨之呈現(xiàn)。但是否會(huì)有類ChatGPT產(chǎn)品，還不確定。

　　備受市場(chǎng)期待的選手，還有華為、騰訊、京東、字節(jié)跳動(dòng)，這幾家雖然沒(méi)有大張旗鼓發(fā)布基于大語(yǔ)言模型的新產(chǎn)品，但也找機(jī)會(huì)對(duì)外重新梳理大模型體系或透露新進(jìn)展。

　　其中，華為云首席科學(xué)家田奇在4月8日的一場(chǎng)公開(kāi)活動(dòng)上表示，華為盤(pán)古大模型在2022年發(fā)布NLP大模型、CV大模型和科學(xué)計(jì)算三個(gè)基礎(chǔ)大模型之后，又陸續(xù)發(fā)布行業(yè)大模型系列，包括盤(pán)古氣象大模型、藥物分子大模型等等，華為大模型還是堅(jiān)定走To B的路線。其內(nèi)部專家此前就曾指出，“華為很少在新的趨勢(shì)出現(xiàn)后，立馬追上”。

　　騰訊曾于2022年發(fā)布混元大模型體系，據(jù)透露，目前也在研發(fā)類ChatGPT產(chǎn)品；京東4月對(duì)外宣稱，計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”；字節(jié)跳動(dòng)根據(jù)公開(kāi)報(bào)道正分別在語(yǔ)言和圖像兩種模態(tài)上發(fā)力。

　　當(dāng)然，市場(chǎng)上也不乏蹭熱點(diǎn)的選手。昆侖萬(wàn)維的大語(yǔ)言模型“天工”3.5，也將于4月17日開(kāi)啟內(nèi)測(cè)。4月11日，深交所向昆侖萬(wàn)維下發(fā)關(guān)注函，再次提醒不得利用市場(chǎng)熱點(diǎn)題材，進(jìn)行“蹭熱點(diǎn)”等違法違規(guī)行為。

　　除了這些大公司之外，根據(jù)民生證券相關(guān)研報(bào)統(tǒng)計(jì)，目前國(guó)內(nèi)至少已經(jīng)有30多家大模型亮相，其中不乏參數(shù)規(guī)模甚至超過(guò)ChatGPT規(guī)模的大模型。廠商涵蓋了互聯(lián)網(wǎng)巨頭、AI上市公司、服務(wù)器龍頭企業(yè)、科研院所與一級(jí)市場(chǎng)創(chuàng)業(yè)公司。

　　大模型應(yīng)接不暇，新產(chǎn)品層出不窮，ChatGPT風(fēng)口上的諸神混戰(zhàn)才剛剛開(kāi)始。

　　搶發(fā)大模型，大廠不能錯(cuò)過(guò)的一戰(zhàn)

　　大廠混戰(zhàn)大模型之際，各家的大模型能力究竟幾何，才是最令外界好奇的。以往，大廠選手們做大模型，總是粗暴地拼參數(shù)量，業(yè)內(nèi)大模型的參數(shù)從百億進(jìn)化到了千億甚至萬(wàn)億。

　　現(xiàn)如今，參數(shù)量早已不能當(dāng)作衡量大模型能力的唯一標(biāo)準(zhǔn)。AI領(lǐng)域從業(yè)者章容對(duì)深燃表示，大模型的能力或許有學(xué)術(shù)層面的評(píng)估，但依然缺乏較為成熟的評(píng)估標(biāo)準(zhǔn)和體系。

　　文心一言發(fā)布后，百度創(chuàng)始人李彥宏在3月下旬曾對(duì)外表示，文心一言不如最新的ChatGPT版本，但是差距不是很大，可能就是一兩個(gè)月的差別。就連剛剛下場(chǎng)成立AI公司“百川智能”的搜狗創(chuàng)始人王小川也對(duì)外表示，正在研發(fā)大模型產(chǎn)品，今年內(nèi)可能就能追上ChatGPT3.5的水平，至于趕上GPT-4或者GPT-5，可能需要3年左右的時(shí)間。

　　現(xiàn)如今，業(yè)界衡量大模型能力最直接的標(biāo)準(zhǔn)，似乎變成了和ChatGPT相比差距有多大，多久能追上，但也只能是模糊對(duì)比。

　　雖然如何評(píng)價(jià)大模型的實(shí)力還沒(méi)有統(tǒng)一標(biāo)準(zhǔn)。但是，大廠們已經(jīng)開(kāi)始展望大模型進(jìn)入到業(yè)務(wù)應(yīng)用層能帶來(lái)的變革。從目前選手們的參與思路來(lái)看，百度、阿里都已經(jīng)宣布未來(lái)主流業(yè)務(wù)，將與最新的大語(yǔ)言模型深度結(jié)合。

　　在文心一言發(fā)布前，李彥宏在內(nèi)部信中就曾介紹，百度計(jì)劃將搜索、智能云、自動(dòng)駕駛多項(xiàng)主力業(yè)務(wù)與文心一言整合。4月11日的阿里云峰會(huì)上，張勇也表示，阿里巴巴所有產(chǎn)品，包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等，未來(lái)都將接入“通義千問(wèn)”大模型進(jìn)行改造。目前釘釘和天貓精靈已經(jīng)接入測(cè)試，新功能將在評(píng)估之后發(fā)布。

　　大廠主流業(yè)務(wù)的改造正在醞釀或進(jìn)行。而大廠掌握著更多的場(chǎng)景和數(shù)據(jù)，也能反哺大模型的發(fā)展。

　　在云計(jì)算領(lǐng)域，2022年，以天翼云為代表的運(yùn)營(yíng)商云加速崛起，而以阿里、騰訊為代表的互聯(lián)網(wǎng)大廠云計(jì)算業(yè)務(wù)增速放緩，大廠云需要找到新的增長(zhǎng)驅(qū)動(dòng)力，張勇甚至下場(chǎng)擔(dān)任阿里云事業(yè)部的一把手。

　　顯然，大模型正在扮演這樣的角色。百度、阿里、華為，都是云事業(yè)部來(lái)做大模型to B、to G的對(duì)外服務(wù)，云計(jì)算市場(chǎng)頭部四朵云已經(jīng)集齊三朵。在大模型時(shí)代，正如李彥宏所言，云計(jì)算市場(chǎng)的游戲規(guī)則正在發(fā)生根本性變化。

　　企業(yè)協(xié)同辦公市場(chǎng)中，疫情以來(lái)，釘釘、飛書(shū)、企業(yè)微信三足鼎立的格局基本形成。而釘釘在4月11日展示了接入“通義千問(wèn)”的Demo之后，飛書(shū)在當(dāng)天下午也緊急發(fā)布了智能助手“My AI”的Demo視頻。就如同微軟Office 365的Copilot產(chǎn)品，釘釘和飛書(shū)的Demo，都或?qū)椭殘?chǎng)人在工作效率方面實(shí)現(xiàn)大幅提升。現(xiàn)在，壓力給到了企業(yè)微信。

　　在搜索領(lǐng)域占市場(chǎng)六成份額的百度，要讓文心一言改造搜索體驗(yàn)。占據(jù)搜索市場(chǎng)三成份額的360緊隨其后演示360智腦，被外界認(rèn)為是，開(kāi)啟了搜索市場(chǎng)爭(zhēng)奪戰(zhàn)。

　　同樣，商湯、科大訊飛這些曾經(jīng)的AI大廠，見(jiàn)證了從機(jī)器學(xué)習(xí)到AI大模型時(shí)代的變遷，現(xiàn)如今，更是不愿錯(cuò)過(guò)大模型的風(fēng)口。

　　擁抱大模型，就是擁抱下一個(gè)時(shí)代。大模型內(nèi)卷之際，結(jié)合場(chǎng)景，基于大模型的產(chǎn)品依然在層出不窮。比如有贊接入GPT-4，上線了“加我智能”。同花順的AI產(chǎn)品將在4月14日上線，但是否會(huì)在其i問(wèn)財(cái)產(chǎn)品的基礎(chǔ)上有所創(chuàng)新，還未可知。

　　“讓子彈先飛半年”

　　“大廠們都是先來(lái)占位！”章容稱，“因?yàn)榇竽Ｐ偷哪芰€遠(yuǎn)未成熟落地，現(xiàn)在互聯(lián)網(wǎng)大廠更像是在秀肌肉”。

　　一位即將進(jìn)行AIGC創(chuàng)業(yè)的AI從業(yè)者告訴深燃，大模型就像是AI時(shí)代的操作系統(tǒng)，大廠搶先占位，不排除是為了搶客戶、搶人才。畢竟，大佬們下場(chǎng)官宣創(chuàng)業(yè)，往往伴隨著招人。

　　但更值得注意的是，大模型的能力越強(qiáng)，API可以實(shí)現(xiàn)的應(yīng)用端場(chǎng)景就越豐富，相當(dāng)于大廠都在爭(zhēng)AI時(shí)代的“App Store”。

　　大模型并非一朝一夕就能夠煉造的，現(xiàn)如今大廠選手大模型動(dòng)態(tài)層出不窮，本質(zhì)還是過(guò)去幾年技術(shù)積累的產(chǎn)物。

　　做大模型，必然伴隨著重投入。在國(guó)外，微軟投資OpenAI，先后投資了超100億美元，而OpenAI對(duì)于GPT-3的訓(xùn)練費(fèi)用已經(jīng)超過(guò)1200萬(wàn)美元。這一點(diǎn)，從國(guó)內(nèi)大廠的研發(fā)投入也可窺一斑。

　　財(cái)報(bào)顯示，2022年百度的核心研發(fā)費(fèi)用為214.16億元，占百度核心收入比例達(dá)到22.4%。過(guò)去10年，百度研發(fā)投入超1000億元。根據(jù)商湯財(cái)報(bào)，過(guò)去四年，商湯總營(yíng)收為149.8億元，而研發(fā)開(kāi)支則達(dá)到了114.3億元，營(yíng)收占比達(dá)到76.3%。

　　或許也是因?yàn)槿绱酥氐耐度耄瑢?duì)于大模型領(lǐng)域內(nèi)卷加劇，業(yè)界出現(xiàn)一種討論，國(guó)外已經(jīng)跑出了GPT-4，面對(duì)如此大的差距，國(guó)內(nèi)新選手現(xiàn)在殺入戰(zhàn)場(chǎng)做大模型，意義大不大，會(huì)不會(huì)造成人才和資源的浪費(fèi)。

　　2023年以來(lái)，多位大佬宣布下場(chǎng)進(jìn)行大模型創(chuàng)業(yè)，但是一部分人的思路已經(jīng)開(kāi)始調(diào)整。出門(mén)問(wèn)問(wèn)創(chuàng)始人李志飛最近多次對(duì)外表示，做大模型不能過(guò)于樂(lè)觀，貿(mào)然進(jìn)入難度很大，而且競(jìng)爭(zhēng)激烈。他的思路已經(jīng)從開(kāi)始的做通用型大模型，轉(zhuǎn)向更注重結(jié)合自身業(yè)務(wù)場(chǎng)景，做垂直整合大模型。

　　他認(rèn)為，國(guó)內(nèi)在1-2年之后，將會(huì)有50家以上的公司擁有自己的大模型。包括互聯(lián)網(wǎng)大廠自研、中型互聯(lián)網(wǎng)公司基于開(kāi)源大模型微調(diào)、一些AI公司及垂直領(lǐng)域的甲方，都會(huì)有大模型，市場(chǎng)大模型的供給一定不會(huì)太少。

　　也有很多業(yè)界人士認(rèn)為，未來(lái)大模型的發(fā)展，將會(huì)是頭部幾家寡頭之間的競(jìng)爭(zhēng)。

　　但是，中國(guó)必須做自己的大模型，已是共識(shí)。出現(xiàn)分歧，本質(zhì)上還是因?yàn)椋竽Ｐ偷镊閼?zhàn)才剛剛開(kāi)始。

　　民生證券相關(guān)研報(bào)指出，目前表面上大模型百花齊放，不再稀缺，是因?yàn)殚_(kāi)源基礎(chǔ)以及大公司本身的算力儲(chǔ)備與資金實(shí)力，單純發(fā)布一個(gè)大模型門(mén)檻，沒(méi)有市場(chǎng)想象那么高。但是能夠擁有高質(zhì)量數(shù)據(jù)場(chǎng)景，才能持續(xù)迭代，性能逐步逼近ChatGPT的大模型，預(yù)計(jì)最終仍是“鳳毛麟角”。市場(chǎng)會(huì)逐步凝結(jié)共識(shí)：得數(shù)據(jù)者得天下，數(shù)據(jù)成為大模型差異化競(jìng)爭(zhēng)的關(guān)鍵。

　　算力、算法、數(shù)據(jù)是AI大模型研發(fā)的三大要素。大廠云們?cè)谒懔ι蠐碛幸欢▋?yōu)勢(shì)。AI領(lǐng)域從業(yè)者貝科對(duì)深燃表示，華為布局昇騰芯片、昇騰生態(tài)已經(jīng)多年，而且在各地也投資了算力中心，現(xiàn)如今也已經(jīng)有了一定量的算力儲(chǔ)備。阿里整個(gè)集團(tuán)在GPU算力上也有一定儲(chǔ)備。但這并不意味著大模型能力一定能持續(xù)攀升。

　　章容認(rèn)為，大模型將帶來(lái)生產(chǎn)力的變革，已經(jīng)是毋庸置疑的事實(shí)，但是，即便是國(guó)外跑得最快的OpenAI以及微軟，目前在商業(yè)化落地上已經(jīng)有所進(jìn)展，但也依然不能說(shuō)成熟穩(wěn)定。至于國(guó)內(nèi)大廠的大模型，目前更是還處于非常早期的階段。

　　一方面，生成式人工智能的信息安全問(wèn)題已經(jīng)顯現(xiàn)。4月11日，國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》，強(qiáng)調(diào)了生成內(nèi)容的真實(shí)性，并且提出了相應(yīng)的容錯(cuò)率和懲罰措施。

　　另一方面，當(dāng)前國(guó)內(nèi)市場(chǎng)上最新的大模型產(chǎn)品，無(wú)論是面向C端的體驗(yàn)產(chǎn)品，還是面向企業(yè)的接口，基本都處于內(nèi)測(cè)階段，還沒(méi)有真正放開(kāi)。

　　按照目前的形勢(shì)，章容認(rèn)為，當(dāng)前大模型從發(fā)布走向到企業(yè)端，摸索如何真正提升生產(chǎn)力，至少需要半年的時(shí)間。

本文經(jīng)深燃團(tuán)隊(duì)授權(quán)轉(zhuǎn)載，如需轉(zhuǎn)載請(qǐng)至深燃公眾號(hào)申請(qǐng)授權(quán)。

　更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

“百模大戰(zhàn)”，來(lái)了

日期： 2023-04-13

作者：王敏

來(lái)源： 深燃

相關(guān)內(nèi)容

來(lái)源：深燃