《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 智譜AI正研發(fā)對標Sora的國產文生視頻模型

智譜AI正研發(fā)對標Sora的國產文生視頻模型

最快年內發(fā)布
2024-05-07
來源:鈦媒體
關鍵詞: 智譜AI 文生視頻

5月6日消息,,估值超200億的國內 AI 大模型獨角獸公司“智譜 AI”正在研發(fā)對標OpenAI Sora的高質量文生視頻模型,,預計最快年內發(fā)布。

“文生視頻目前處于一個快速發(fā)展的階段,預計今年將是文生視頻大模型的爆發(fā)期,。國內公司在文生視頻技術方面的客戶需求非常多樣,,從電影拍攝到短視頻,、游戲制作等,。智譜也將通過使用更高質量的數據和更大的參數,開發(fā)高質量的文生視頻產品,?!币晃恢亲V AI 內部人士對鈦媒體App表示。

據悉,,成立于2019年的智譜 AI,,由清華大學計算機系的技術成果轉化而來,源自清華大學知識工程(KEG)實驗室,。智譜AI CEO張鵬畢業(yè)于清華大學計算機系,,與總裁王紹蘭同為清華創(chuàng)新領軍博士,董事長劉德兵師從高文院士,,曾任清華數據科學研究院科技大數據研究中心副主任,,三位創(chuàng)始成員都是KEG實驗室核心成員。

智譜 AI 是國內最早入局大模型賽道的公司之一,,也是目前國內頭部大模型廠商代表之一,。

2023年3月,智譜 AI 推出千億開源基座對話模型ChatGLM系列,,并在過去一年內完成4次升級,,于2024年1月推出GLM4系列。

同時,,基于全自研基座大模型的能力,,智譜 AI 亦已構建了AIGC模型產品矩陣,包括 AI 提效助手智譜清言,、高效率代碼模型CodeGeeX,、多模態(tài)理解模型CogVLM和文生圖模型CogView等。

張鵬在今年3月透露,,截至2023年底,,智譜 AI 已擁有超2000家生態(tài)合作伙伴、超1000個大模型規(guī)?;瘧?,另有200多家企業(yè)跟智譜AI進行了深度共創(chuàng),,覆蓋傳媒、咨詢,、消費,、金融,、新能源,、互聯(lián)網、智能辦公等多個細分場景的多個頭部企業(yè),。

張鵬強調,,由于智譜對多個模型版本進行開源,所以到目前為止,,智譜ChatGLM-6B全球累計下載量已經超過了1300萬,,GitHub Star星數達到5萬,整個量級超過了Meta Llama兩個版本的總和,。智譜 AI 已獲得全球最受歡迎的開源機構的第五名,,是全球唯一一家上榜的中國機構和組織,“力壓了包括OpenAI,、谷歌,,還有微軟”。

融資方面,,智譜AI已完成五輪融資,。投資方包括君聯(lián)資本、啟明創(chuàng)投,、中科創(chuàng)星,、美團、螞蟻,、阿里,、騰訊、小米,、金山,、順為、Boss直聘,、好未來,、紅杉、高瓴等多家機構,,2023年融資額超過25億元人民幣,,最新一輪是2024年3月北京市人工智能產業(yè)投資基金參與投資。

截至目前,,智譜 AI 公司估值超過200億元人民幣,,是國內 AI 領域獨角獸(超過10億美元)企業(yè),。

鈦媒體App了解到,對于智譜AI 當前的綜合能力水平,,內部人士稱“性能接近海外頂級模型”,。

“最新基座大模型GLM-4,整體性能相比上一代大幅提升,,逼近 GPT-4,。如果做一個比較量化的對比,我們當時對標的對象是GPT-4,,其性能的對比可以在很多方面上做到 95%左右,。在比如中文對齊的任務下,我們甚至可以略微超過它,。根據最新的海外伯克利Arena Hard 基準測試,GLM排名僅次于GPT-4 Turbo 和Claude 3 Opus,,在國內外模型中均處于領先地位?!敝亲V內部人士稱,。

智譜內部人士反復強調,公司是投入時間比較早,,擁有完全自主,、自研、國產化的千億級模型算法,,并且實現全棧國產化,,從底層到模型層、應用層,、應用接口PaaS層等實現全棧的自主研發(fā),。同時,在整個大模型體系里邊,,除了語言模型,,智譜還有文生圖模型、圖生文模型,、代碼模型等多種模型,,與目前全球最先進的OpenAI相比,其模型種類跟它形成了一一對標,。

鈦媒體App了解到,,雖然智譜 AI 已研發(fā)出多模態(tài)模型GLM-4,但據悉,,今年2月Sora發(fā)布之前,,智譜AI已經在研發(fā)文生視頻模型。

智譜 AI 內部人士坦言,對標Sora的文生視頻模型發(fā)展突破的關鍵主要包括技術路線選擇,、訓練所用的高質量視頻素材語料兩個方面,。

“技術路線上,Transformer 與Diffusion 的結合架構如何在效率和效果上進行優(yōu)化,,如何解決連續(xù)幀之間的抖動問題,,如何在滿足高分辨率的同時實現高一致性的長序列生成,如何獲取高質量數據泛化到更多更細節(jié)的真實場景,,都是技術上需要解決和通過大量實驗試錯的問題,;數據集方面,此前 Sora 被評價模型對攝影術語(跟拍,、平移,、鏡頭切換)的理解有限,所生成的視頻后期還需要對視頻素材進行超分處理,。公司會注重更全面的優(yōu)質數據版權與使用?!鄙鲜鋈耸糠Q,。

但值得注意的是,早前智譜 AI 投資的生數科技與清華大學聯(lián)合發(fā)布中國首個長時長,、高一致性,、高動態(tài)性視頻大模型Vidu,被稱為“國內首個Sora級視頻模型”,,也是中國首個純自研視頻大模型,。

一旦智譜也發(fā)布類似的文生視頻模型的話,智譜AI將與被投公司生數科技產生競爭關系,。

據鈦媒體App編輯梳理,,截止目前,智譜 AI 以產業(yè)型投資方式,,已經投資,、入股超過13家 AI 產業(yè)鏈的初創(chuàng)公司。

張鵬曾向鈦媒體App等表示,,今天的智譜 AI正在經歷一個從量變到質變的過程,,特別是像大模型所謂的涌現。而公司目標是瞄準AGI,,實現超過人類水平的超級認知智能,、實現 AI 的自我解釋、自我評測,、自我監(jiān)督,,同時還將確保模型安全、可控。


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,,并不代表本網站贊同其觀點。轉載的所有的文章,、圖片,、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容,、版權和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。