5月6日消息,,估值超200億的國內 AI 大模型獨角獸公司“智譜 AI”正在研發(fā)對標OpenAI Sora的高質量文生視頻模型,,預計最快年內發(fā)布。
“文生視頻目前處于一個快速發(fā)展的階段,預計今年將是文生視頻大模型的爆發(fā)期,。國內公司在文生視頻技術方面的客戶需求非常多樣,,從電影拍攝到短視頻,、游戲制作等,。智譜也將通過使用更高質量的數據和更大的參數,開發(fā)高質量的文生視頻產品,?!币晃恢亲V AI 內部人士對鈦媒體App表示。
據悉,,成立于2019年的智譜 AI,,由清華大學計算機系的技術成果轉化而來,源自清華大學知識工程(KEG)實驗室,。智譜AI CEO張鵬畢業(yè)于清華大學計算機系,,與總裁王紹蘭同為清華創(chuàng)新領軍博士,董事長劉德兵師從高文院士,,曾任清華數據科學研究院科技大數據研究中心副主任,,三位創(chuàng)始成員都是KEG實驗室核心成員。
智譜 AI 是國內最早入局大模型賽道的公司之一,,也是目前國內頭部大模型廠商代表之一,。
2023年3月,智譜 AI 推出千億開源基座對話模型ChatGLM系列,,并在過去一年內完成4次升級,,于2024年1月推出GLM4系列。
同時,,基于全自研基座大模型的能力,,智譜 AI 亦已構建了AIGC模型產品矩陣,包括 AI 提效助手智譜清言,、高效率代碼模型CodeGeeX,、多模態(tài)理解模型CogVLM和文生圖模型CogView等。
張鵬在今年3月透露,,截至2023年底,,智譜 AI 已擁有超2000家生態(tài)合作伙伴、超1000個大模型規(guī)?;瘧?,另有200多家企業(yè)跟智譜AI進行了深度共創(chuàng),,覆蓋傳媒、咨詢,、消費,、金融,、新能源,、互聯(lián)網、智能辦公等多個細分場景的多個頭部企業(yè),。
張鵬強調,,由于智譜對多個模型版本進行開源,所以到目前為止,,智譜ChatGLM-6B全球累計下載量已經超過了1300萬,,GitHub Star星數達到5萬,整個量級超過了Meta Llama兩個版本的總和,。智譜 AI 已獲得全球最受歡迎的開源機構的第五名,,是全球唯一一家上榜的中國機構和組織,“力壓了包括OpenAI,、谷歌,,還有微軟”。
融資方面,,智譜AI已完成五輪融資,。投資方包括君聯(lián)資本、啟明創(chuàng)投,、中科創(chuàng)星,、美團、螞蟻,、阿里,、騰訊、小米,、金山,、順為、Boss直聘,、好未來,、紅杉、高瓴等多家機構,,2023年融資額超過25億元人民幣,,最新一輪是2024年3月北京市人工智能產業(yè)投資基金參與投資。
截至目前,,智譜 AI 公司估值超過200億元人民幣,,是國內 AI 領域獨角獸(超過10億美元)企業(yè),。
鈦媒體App了解到,對于智譜AI 當前的綜合能力水平,,內部人士稱“性能接近海外頂級模型”,。
“最新基座大模型GLM-4,整體性能相比上一代大幅提升,,逼近 GPT-4,。如果做一個比較量化的對比,我們當時對標的對象是GPT-4,,其性能的對比可以在很多方面上做到 95%左右,。在比如中文對齊的任務下,我們甚至可以略微超過它,。根據最新的海外伯克利Arena Hard 基準測試,GLM排名僅次于GPT-4 Turbo 和Claude 3 Opus,,在國內外模型中均處于領先地位?!敝亲V內部人士稱,。
智譜內部人士反復強調,公司是投入時間比較早,,擁有完全自主,、自研、國產化的千億級模型算法,,并且實現全棧國產化,,從底層到模型層、應用層,、應用接口PaaS層等實現全棧的自主研發(fā),。同時,在整個大模型體系里邊,,除了語言模型,,智譜還有文生圖模型、圖生文模型,、代碼模型等多種模型,,與目前全球最先進的OpenAI相比,其模型種類跟它形成了一一對標,。
鈦媒體App了解到,,雖然智譜 AI 已研發(fā)出多模態(tài)模型GLM-4,但據悉,,今年2月Sora發(fā)布之前,,智譜AI已經在研發(fā)文生視頻模型。
智譜 AI 內部人士坦言,對標Sora的文生視頻模型發(fā)展突破的關鍵主要包括技術路線選擇,、訓練所用的高質量視頻素材語料兩個方面,。
“技術路線上,Transformer 與Diffusion 的結合架構如何在效率和效果上進行優(yōu)化,,如何解決連續(xù)幀之間的抖動問題,,如何在滿足高分辨率的同時實現高一致性的長序列生成,如何獲取高質量數據泛化到更多更細節(jié)的真實場景,,都是技術上需要解決和通過大量實驗試錯的問題,;數據集方面,此前 Sora 被評價模型對攝影術語(跟拍,、平移,、鏡頭切換)的理解有限,所生成的視頻后期還需要對視頻素材進行超分處理,。公司會注重更全面的優(yōu)質數據版權與使用?!鄙鲜鋈耸糠Q,。
但值得注意的是,早前智譜 AI 投資的生數科技與清華大學聯(lián)合發(fā)布中國首個長時長,、高一致性,、高動態(tài)性視頻大模型Vidu,被稱為“國內首個Sora級視頻模型”,,也是中國首個純自研視頻大模型,。
一旦智譜也發(fā)布類似的文生視頻模型的話,智譜AI將與被投公司生數科技產生競爭關系,。
據鈦媒體App編輯梳理,,截止目前,智譜 AI 以產業(yè)型投資方式,,已經投資,、入股超過13家 AI 產業(yè)鏈的初創(chuàng)公司。
張鵬曾向鈦媒體App等表示,,今天的智譜 AI正在經歷一個從量變到質變的過程,,特別是像大模型所謂的涌現。而公司目標是瞄準AGI,,實現超過人類水平的超級認知智能,、實現 AI 的自我解釋、自我評測,、自我監(jiān)督,,同時還將確保模型安全、可控。