《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > “百模大戰(zhàn)”,,來了

“百模大戰(zhàn)”,來了

2023-04-13
作者:王敏
來源: 深燃

  深燃(shenrancaijing)原創(chuàng)

  作者 | 王敏

  編輯 | 金玙璠

  一夜之間,,AI大模型熱得發(fā)燙,。

  繼3月中旬,百度最先下場,,以“文心一言”搶占了對標ChatGPT的“國內第一”后,,過去一個月,大模型一直是市場的焦點,。尤其是在過去一周里,,各界選手紛紛“大干快上”,密集開“卷”,,要么直接卷大模型,要么卷產品卷Demo,,要么卷預告卷進展,。總之,,大模型江湖,,徹底火起來了。

  百度最先挑起戰(zhàn)事,,阿里,、商湯跟得最緊、跑得最猛,,都已發(fā)布類ChatGPT產品,。

  不止如此,,科大訊飛等中大廠的大模型也已經在發(fā)布的路上。而適配到具體場景的應用和產品,,比如360的“360智腦”已經進行過現(xiàn)場演示,,有贊也帶來了由大模型驅動的首個AI產品“加我智能”。就連飛書,,也悄悄上線了關于智能助手“My AI”的Demo視頻,。

  就在去年,AI還因為商業(yè)化困局而被外界詬病,。去年年底,,OpenAI的ChatGPT問世,成為了攪動AI大模型江湖的鯰魚,,一時間,,各類選手紛紛涌了進來。

  被視為是移動互聯(lián)網時代第一場大戰(zhàn)的“千團大戰(zhàn)”,,至今仍令人記憶猶新,,那時,從業(yè)者們的信念是,,所有的行業(yè)都值得用互聯(lián)網再做一遍,。時至今日,阿里巴巴集團董事會主席兼CEO張勇在4月11日已經喊出“所有產品都值得用大模型重做一遍”的口號,。盡管當下還處于大模型混戰(zhàn)的早期階段,,各家的能力更新,都還沒有正式對外開放,,對于大廠的大模型能力,,還沒有一套成熟的評估體系,但是,,AI大模型時代的變革,,已經開始醞釀。

  市場各種信號都昭示著,,“百模大戰(zhàn)”的帷幕已經拉開,。曾經,硝煙彌漫的“千團大戰(zhàn)”,,結局是一地雞毛,,數(shù)千家公司同臺競技,只有美團最終跑了出來,,無數(shù)公司淪為炮灰?,F(xiàn)如今,AI時代的“百模大戰(zhàn)”,,“入場券”更貴,,對于資源,、技術、人才的要求更高,,也更需要耐心和時間,。新選手燒錢燒時間,結果也可能只是巨頭的陪跑,。這場持久戰(zhàn),,才剛剛開始。

  百“?!贝髴?zhàn),,一觸即發(fā)

  大模型江湖混戰(zhàn),愈演愈烈,,下場的選手越來越多,。競爭最激烈也最受關注的,便是在大模型領域有所積累的互聯(lián)網巨頭選手們,。

  這波混戰(zhàn)源起ChatGPT,。巨頭選手們的類ChatGPT產品以及最新的AI大語言模型首先受到關注。其中,,百度3月16日發(fā)布了“文心一言”,;阿里的“通義千問”已從4月7日開始企業(yè)內測;商湯科技在4月10日的技術交流會上帶來了“商量SenseChat”,,目前還未對外開放,;360在3月29日現(xiàn)場演示了“360智腦”后,也將于4月16日開啟企業(yè)內測,。

  這些類ChatGPT產品,,主打的都是對話問答、文本及代碼等生成能力,,外界常常會把多輪對話,、數(shù)學能力、編碼能力作為測評的標準,。

  業(yè)界的共識是,,國內這些產品相較ChatGPT,還有一定的差距,。但是這些產品,究竟孰強孰弱,、孰優(yōu)孰劣,,還難下定論,因為尚處于內測或演示階段,。

  不過,,各家的產品形態(tài)有一定差別,。比如,盡管文心一言的生成圖片能力遭到吐槽,,但已經實現(xiàn)了多模態(tài)交互,;通義千問增加了“百寶袋”,把寫提綱,、SWOT分析等能力單獨列成板塊以供使用,;360則是直接和搜索引擎場景進行了結合。

  與類ChatGPT產品共同進入我們視野的,,則是各家的大模型體系,。

  其中,360的大模型,,此前市場關注度并不算高,。不過,360稱,,其人工智能研究院從2020年開始,,一直在對包括類ChatGPT在內的大模型通用人工智能技術持續(xù)投入。

  其余三家中,,百度“文心一言”和阿里的“通義千問”,,背后分別是此前已經發(fā)布過的文心大模型體系和通義大模型體系;商湯“商量SenseChat”背后是最新問世的“日日新SenseNova”大模型體系,。三家本質都是在統(tǒng)一AI底座的基礎上,,在通用模型層覆蓋NLP、視覺等領域,,再進行行業(yè)模型和場景模型的孵化,。

 微信截圖_20230413102202.png

  文心大模型除了有文心一言、AI作畫應用文心一格外,,還和工業(yè),、能源、金融等多個行業(yè)客戶共同打造了11個行業(yè)大模型,。商湯基于大模型體系,,還發(fā)布了AI內容創(chuàng)作社區(qū)平臺“秒畫”、AI數(shù)字人視頻生成平臺“如影”,、3D內容生成平臺“瓊宇”,、“格物”。

  接下來,,預計最快亮相的選手,,當屬科大訊飛。其計劃于5月6日發(fā)布“1+N認知智能大模型”,,“1”是底座平臺,,“N”則是應用于多個行業(yè)領域的專用大模型版本,,同時,“N”個場景的示范性應用產品也將隨之呈現(xiàn),。但是否會有類ChatGPT產品,,還不確定。

  備受市場期待的選手,,還有華為,、騰訊、京東,、字節(jié)跳動,,這幾家雖然沒有大張旗鼓發(fā)布基于大語言模型的新產品,但也找機會對外重新梳理大模型體系或透露新進展,。

  其中,,華為云首席科學家田奇在4月8日的一場公開活動上表示,華為盤古大模型在2022年發(fā)布NLP大模型,、CV大模型和科學計算三個基礎大模型之后,,又陸續(xù)發(fā)布行業(yè)大模型系列,包括盤古氣象大模型,、藥物分子大模型等等,,華為大模型還是堅定走To B的路線。其內部專家此前就曾指出,,“華為很少在新的趨勢出現(xiàn)后,,立馬追上”。

  騰訊曾于2022年發(fā)布混元大模型體系,,據(jù)透露,,目前也在研發(fā)類ChatGPT產品;京東4月對外宣稱,,計劃在今年發(fā)布新一代產業(yè)大模型“言犀”,;字節(jié)跳動根據(jù)公開報道正分別在語言和圖像兩種模態(tài)上發(fā)力。

  當然,,市場上也不乏蹭熱點的選手,。昆侖萬維的大語言模型“天工”3.5,也將于4月17日開啟內測,。4月11日,,深交所向昆侖萬維下發(fā)關注函,再次提醒不得利用市場熱點題材,,進行“蹭熱點”等違法違規(guī)行為,。

  除了這些大公司之外,根據(jù)民生證券相關研報統(tǒng)計,,目前國內至少已經有30多家大模型亮相,,其中不乏參數(shù)規(guī)模甚至超過ChatGPT規(guī)模的大模型。廠商涵蓋了互聯(lián)網巨頭,、AI上市公司,、服務器龍頭企業(yè)、科研院所與一級市場創(chuàng)業(yè)公司,。

  大模型應接不暇,,新產品層出不窮,ChatGPT風口上的諸神混戰(zhàn)才剛剛開始,。

  搶發(fā)大模型,,大廠不能錯過的一戰(zhàn)

  大廠混戰(zhàn)大模型之際,各家的大模型能力究竟幾何,,才是最令外界好奇的,。以往,大廠選手們做大模型,,總是粗暴地拼參數(shù)量,,業(yè)內大模型的參數(shù)從百億進化到了千億甚至萬億。

  現(xiàn)如今,,參數(shù)量早已不能當作衡量大模型能力的唯一標準,。AI領域從業(yè)者章容對深燃表示,大模型的能力或許有學術層面的評估,,但依然缺乏較為成熟的評估標準和體系,。

  文心一言發(fā)布后,百度創(chuàng)始人李彥宏在3月下旬曾對外表示,,文心一言不如最新的ChatGPT版本,,但是差距不是很大,可能就是一兩個月的差別,。就連剛剛下場成立AI公司“百川智能”的搜狗創(chuàng)始人王小川也對外表示,,正在研發(fā)大模型產品,今年內可能就能追上ChatGPT3.5的水平,,至于趕上GPT-4或者GPT-5,,可能需要3年左右的時間。

  現(xiàn)如今,,業(yè)界衡量大模型能力最直接的標準,,似乎變成了和ChatGPT相比差距有多大,多久能追上,,但也只能是模糊對比,。

  雖然如何評價大模型的實力還沒有統(tǒng)一標準。但是,大廠們已經開始展望大模型進入到業(yè)務應用層能帶來的變革,。從目前選手們的參與思路來看,,百度、阿里都已經宣布未來主流業(yè)務,,將與最新的大語言模型深度結合,。

  在文心一言發(fā)布前,李彥宏在內部信中就曾介紹,,百度計劃將搜索,、智能云、自動駕駛多項主力業(yè)務與文心一言整合,。4月11日的阿里云峰會上,,張勇也表示,阿里巴巴所有產品,,包括天貓,、釘釘、高德地圖,、淘寶,、優(yōu)酷、盒馬等,,未來都將接入“通義千問”大模型進行改造,。目前釘釘和天貓精靈已經接入測試,新功能將在評估之后發(fā)布,。

  大廠主流業(yè)務的改造正在醞釀或進行,。而大廠掌握著更多的場景和數(shù)據(jù),也能反哺大模型的發(fā)展,。

  在云計算領域,,2022年,以天翼云為代表的運營商云加速崛起,,而以阿里,、騰訊為代表的互聯(lián)網大廠云計算業(yè)務增速放緩,大廠云需要找到新的增長驅動力,,張勇甚至下場擔任阿里云事業(yè)部的一把手,。

  顯然,大模型正在扮演這樣的角色,。百度,、阿里、華為,,都是云事業(yè)部來做大模型to B,、to G的對外服務,云計算市場頭部四朵云已經集齊三朵。在大模型時代,,正如李彥宏所言,,云計算市場的游戲規(guī)則正在發(fā)生根本性變化。

  企業(yè)協(xié)同辦公市場中,,疫情以來,,釘釘、飛書,、企業(yè)微信三足鼎立的格局基本形成。而釘釘在4月11日展示了接入“通義千問”的Demo之后,,飛書在當天下午也緊急發(fā)布了智能助手“My AI”的Demo視頻,。就如同微軟Office 365的Copilot產品,釘釘和飛書的Demo,,都或將幫助職場人在工作效率方面實現(xiàn)大幅提升?,F(xiàn)在,壓力給到了企業(yè)微信,。

  在搜索領域占市場六成份額的百度,,要讓文心一言改造搜索體驗。占據(jù)搜索市場三成份額的360緊隨其后演示360智腦,,被外界認為是,,開啟了搜索市場爭奪戰(zhàn)。

  同樣,,商湯,、科大訊飛這些曾經的AI大廠,見證了從機器學習到AI大模型時代的變遷,,現(xiàn)如今,,更是不愿錯過大模型的風口。

  擁抱大模型,,就是擁抱下一個時代,。大模型內卷之際,結合場景,,基于大模型的產品依然在層出不窮,。比如有贊接入GPT-4,上線了“加我智能”,。同花順的AI產品將在4月14日上線,,但是否會在其i問財產品的基礎上有所創(chuàng)新,還未可知,。

  “讓子彈先飛半年”

  “大廠們都是先來占位,!”章容稱,“因為大模型的能力還遠未成熟落地,現(xiàn)在互聯(lián)網大廠更像是在秀肌肉”,。

  一位即將進行AIGC創(chuàng)業(yè)的AI從業(yè)者告訴深燃,,大模型就像是AI時代的操作系統(tǒng),大廠搶先占位,,不排除是為了搶客戶,、搶人才。畢竟,,大佬們下場官宣創(chuàng)業(yè),,往往伴隨著招人。

  但更值得注意的是,,大模型的能力越強,,API可以實現(xiàn)的應用端場景就越豐富,相當于大廠都在爭AI時代的“App Store”,。

  大模型并非一朝一夕就能夠煉造的,,現(xiàn)如今大廠選手大模型動態(tài)層出不窮,本質還是過去幾年技術積累的產物,。

  做大模型,,必然伴隨著重投入。在國外,,微軟投資OpenAI,,先后投資了超100億美元,而OpenAI對于GPT-3的訓練費用已經超過1200萬美元,。這一點,,從國內大廠的研發(fā)投入也可窺一斑。

  財報顯示,,2022年百度的核心研發(fā)費用為214.16億元,,占百度核心收入比例達到22.4%。過去10年,,百度研發(fā)投入超1000億元,。根據(jù)商湯財報,過去四年,,商湯總營收為149.8億元,,而研發(fā)開支則達到了114.3億元,營收占比達到76.3%,。

  或許也是因為如此重的投入,,對于大模型領域內卷加劇,業(yè)界出現(xiàn)一種討論,,國外已經跑出了GPT-4,,面對如此大的差距,,國內新選手現(xiàn)在殺入戰(zhàn)場做大模型,意義大不大,,會不會造成人才和資源的浪費,。

  2023年以來,多位大佬宣布下場進行大模型創(chuàng)業(yè),,但是一部分人的思路已經開始調整,。出門問問創(chuàng)始人李志飛最近多次對外表示,做大模型不能過于樂觀,,貿然進入難度很大,,而且競爭激烈。他的思路已經從開始的做通用型大模型,,轉向更注重結合自身業(yè)務場景,,做垂直整合大模型。

  他認為,,國內在1-2年之后,將會有50家以上的公司擁有自己的大模型,。包括互聯(lián)網大廠自研,、中型互聯(lián)網公司基于開源大模型微調、一些AI公司及垂直領域的甲方,,都會有大模型,,市場大模型的供給一定不會太少。

  也有很多業(yè)界人士認為,,未來大模型的發(fā)展,,將會是頭部幾家寡頭之間的競爭。

  但是,,中國必須做自己的大模型,,已是共識。出現(xiàn)分歧,,本質上還是因為,,大模型的鏖戰(zhàn)才剛剛開始。

  民生證券相關研報指出,,目前表面上大模型百花齊放,,不再稀缺,是因為開源基礎以及大公司本身的算力儲備與資金實力,,單純發(fā)布一個大模型門檻,,沒有市場想象那么高。但是能夠擁有高質量數(shù)據(jù)場景,,才能持續(xù)迭代,,性能逐步逼近ChatGPT的大模型,,預計最終仍是“鳳毛麟角”。市場會逐步凝結共識:得數(shù)據(jù)者得天下,,數(shù)據(jù)成為大模型差異化競爭的關鍵,。

  算力、算法,、數(shù)據(jù)是AI大模型研發(fā)的三大要素,。大廠云們在算力上擁有一定優(yōu)勢。AI領域從業(yè)者貝科對深燃表示,,華為布局昇騰芯片,、昇騰生態(tài)已經多年,而且在各地也投資了算力中心,,現(xiàn)如今也已經有了一定量的算力儲備,。阿里整個集團在GPU算力上也有一定儲備。但這并不意味著大模型能力一定能持續(xù)攀升,。

  章容認為,,大模型將帶來生產力的變革,已經是毋庸置疑的事實,,但是,,即便是國外跑得最快的OpenAI以及微軟,目前在商業(yè)化落地上已經有所進展,,但也依然不能說成熟穩(wěn)定,。至于國內大廠的大模型,目前更是還處于非常早期的階段,。

  一方面,,生成式人工智能的信息安全問題已經顯現(xiàn)。4月11日,,國家互聯(lián)網信息辦公室發(fā)布了《生成式人工智能服務管理辦法(征求意見稿)》,,強調了生成內容的真實性,并且提出了相應的容錯率和懲罰措施,。

  另一方面,,當前國內市場上最新的大模型產品,,無論是面向C端的體驗產品,,還是面向企業(yè)的接口,基本都處于內測階段,,還沒有真正放開,。

  按照目前的形勢,,章容認為,當前大模型從發(fā)布走向到企業(yè)端,,摸索如何真正提升生產力,,至少需要半年的時間,。

       本文經深燃團隊授權轉載,如需轉載請至深燃公眾號申請授權,。

 更多精彩內容歡迎點擊==>>電子技術應用-AET<<


微信圖片_20210517164139.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點,。轉載的所有的文章,、圖片、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容、版權和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]