5月6日消息,,估值超200億的國(guó)內(nèi) AI 大模型獨(dú)角獸公司“智譜 AI”正在研發(fā)對(duì)標(biāo)OpenAI Sora的高質(zhì)量文生視頻模型,預(yù)計(jì)最快年內(nèi)發(fā)布,。
“文生視頻目前處于一個(gè)快速發(fā)展的階段,,預(yù)計(jì)今年將是文生視頻大模型的爆發(fā)期,。國(guó)內(nèi)公司在文生視頻技術(shù)方面的客戶需求非常多樣,,從電影拍攝到短視頻、游戲制作等,。智譜也將通過(guò)使用更高質(zhì)量的數(shù)據(jù)和更大的參數(shù),,開(kāi)發(fā)高質(zhì)量的文生視頻產(chǎn)品?!币晃恢亲V AI 內(nèi)部人士對(duì)鈦媒體App表示,。
據(jù)悉,成立于2019年的智譜 AI,,由清華大學(xué)計(jì)算機(jī)系的技術(shù)成果轉(zhuǎn)化而來(lái),,源自清華大學(xué)知識(shí)工程(KEG)實(shí)驗(yàn)室。智譜AI CEO張鵬畢業(yè)于清華大學(xué)計(jì)算機(jī)系,,與總裁王紹蘭同為清華創(chuàng)新領(lǐng)軍博士,,董事長(zhǎng)劉德兵師從高文院士,曾任清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副主任,,三位創(chuàng)始成員都是KEG實(shí)驗(yàn)室核心成員,。
智譜 AI 是國(guó)內(nèi)最早入局大模型賽道的公司之一,也是目前國(guó)內(nèi)頭部大模型廠商代表之一,。
2023年3月,,智譜 AI 推出千億開(kāi)源基座對(duì)話模型ChatGLM系列,并在過(guò)去一年內(nèi)完成4次升級(jí),,于2024年1月推出GLM4系列,。
同時(shí),基于全自研基座大模型的能力,,智譜 AI 亦已構(gòu)建了AIGC模型產(chǎn)品矩陣,,包括 AI 提效助手智譜清言、高效率代碼模型CodeGeeX,、多模態(tài)理解模型CogVLM和文生圖模型CogView等,。
張鵬在今年3月透露,截至2023年底,,智譜 AI 已擁有超2000家生態(tài)合作伙伴,、超1000個(gè)大模型規(guī)模化應(yīng)用,,另有200多家企業(yè)跟智譜AI進(jìn)行了深度共創(chuàng),,覆蓋傳媒、咨詢,、消費(fèi),、金融、新能源、互聯(lián)網(wǎng),、智能辦公等多個(gè)細(xì)分場(chǎng)景的多個(gè)頭部企業(yè),。
張鵬強(qiáng)調(diào),由于智譜對(duì)多個(gè)模型版本進(jìn)行開(kāi)源,,所以到目前為止,,智譜ChatGLM-6B全球累計(jì)下載量已經(jīng)超過(guò)了1300萬(wàn),GitHub Star星數(shù)達(dá)到5萬(wàn),,整個(gè)量級(jí)超過(guò)了Meta Llama兩個(gè)版本的總和,。智譜 AI 已獲得全球最受歡迎的開(kāi)源機(jī)構(gòu)的第五名,是全球唯一一家上榜的中國(guó)機(jī)構(gòu)和組織,,“力壓了包括OpenAI,、谷歌,還有微軟”,。
融資方面,,智譜AI已完成五輪融資。投資方包括君聯(lián)資本,、啟明創(chuàng)投,、中科創(chuàng)星、美團(tuán),、螞蟻,、阿里、騰訊,、小米,、金山、順為,、Boss直聘,、好未來(lái)、紅杉,、高瓴等多家機(jī)構(gòu),,2023年融資額超過(guò)25億元人民幣,最新一輪是2024年3月北京市人工智能產(chǎn)業(yè)投資基金參與投資,。
截至目前,智譜 AI 公司估值超過(guò)200億元人民幣,,是國(guó)內(nèi) AI 領(lǐng)域獨(dú)角獸(超過(guò)10億美元)企業(yè),。
鈦媒體App了解到,對(duì)于智譜AI 當(dāng)前的綜合能力水平,,內(nèi)部人士稱“性能接近海外頂級(jí)模型”,。
“最新基座大模型GLM-4,整體性能相比上一代大幅提升,逼近 GPT-4,。如果做一個(gè)比較量化的對(duì)比,,我們當(dāng)時(shí)對(duì)標(biāo)的對(duì)象是GPT-4,其性能的對(duì)比可以在很多方面上做到 95%左右,。在比如中文對(duì)齊的任務(wù)下,,我們甚至可以略微超過(guò)它。根據(jù)最新的海外伯克利Arena Hard 基準(zhǔn)測(cè)試,GLM排名僅次于GPT-4 Turbo 和Claude 3 Opus,,在國(guó)內(nèi)外模型中均處于領(lǐng)先地位,。”智譜內(nèi)部人士稱,。
智譜內(nèi)部人士反復(fù)強(qiáng)調(diào),,公司是投入時(shí)間比較早,擁有完全自主,、自研,、國(guó)產(chǎn)化的千億級(jí)模型算法,并且實(shí)現(xiàn)全棧國(guó)產(chǎn)化,,從底層到模型層,、應(yīng)用層、應(yīng)用接口PaaS層等實(shí)現(xiàn)全棧的自主研發(fā),。同時(shí),,在整個(gè)大模型體系里邊,除了語(yǔ)言模型,,智譜還有文生圖模型,、圖生文模型、代碼模型等多種模型,,與目前全球最先進(jìn)的OpenAI相比,,其模型種類跟它形成了一一對(duì)標(biāo)。
鈦媒體App了解到,,雖然智譜 AI 已研發(fā)出多模態(tài)模型GLM-4,,但據(jù)悉,今年2月Sora發(fā)布之前,,智譜AI已經(jīng)在研發(fā)文生視頻模型,。
智譜 AI 內(nèi)部人士坦言,對(duì)標(biāo)Sora的文生視頻模型發(fā)展突破的關(guān)鍵主要包括技術(shù)路線選擇,、訓(xùn)練所用的高質(zhì)量視頻素材語(yǔ)料兩個(gè)方面,。
“技術(shù)路線上,Transformer 與Diffusion 的結(jié)合架構(gòu)如何在效率和效果上進(jìn)行優(yōu)化,,如何解決連續(xù)幀之間的抖動(dòng)問(wèn)題,,如何在滿足高分辨率的同時(shí)實(shí)現(xiàn)高一致性的長(zhǎng)序列生成,如何獲取高質(zhì)量數(shù)據(jù)泛化到更多更細(xì)節(jié)的真實(shí)場(chǎng)景,都是技術(shù)上需要解決和通過(guò)大量實(shí)驗(yàn)試錯(cuò)的問(wèn)題,;數(shù)據(jù)集方面,,此前 Sora 被評(píng)價(jià)模型對(duì)攝影術(shù)語(yǔ)(跟拍、平移,、鏡頭切換)的理解有限,,所生成的視頻后期還需要對(duì)視頻素材進(jìn)行超分處理。公司會(huì)注重更全面的優(yōu)質(zhì)數(shù)據(jù)版權(quán)與使用,?!鄙鲜鋈耸糠Q。
但值得注意的是,,早前智譜 AI 投資的生數(shù)科技與清華大學(xué)聯(lián)合發(fā)布中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng),、高一致性、高動(dòng)態(tài)性視頻大模型Vidu,,被稱為“國(guó)內(nèi)首個(gè)Sora級(jí)視頻模型”,,也是中國(guó)首個(gè)純自研視頻大模型。
一旦智譜也發(fā)布類似的文生視頻模型的話,,智譜AI將與被投公司生數(shù)科技產(chǎn)生競(jìng)爭(zhēng)關(guān)系,。
據(jù)鈦媒體App編輯梳理,截止目前,,智譜 AI 以產(chǎn)業(yè)型投資方式,,已經(jīng)投資、入股超過(guò)13家 AI 產(chǎn)業(yè)鏈的初創(chuàng)公司,。
張鵬曾向鈦媒體App等表示,,今天的智譜 AI正在經(jīng)歷一個(gè)從量變到質(zhì)變的過(guò)程,特別是像大模型所謂的涌現(xiàn),。而公司目標(biāo)是瞄準(zhǔn)AGI,,實(shí)現(xiàn)超過(guò)人類水平的超級(jí)認(rèn)知智能、實(shí)現(xiàn) AI 的自我解釋,、自我評(píng)測(cè),、自我監(jiān)督,同時(shí)還將確保模型安全,、可控,。