《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 2024Q1人工智能里程碑盤點(diǎn):Sora和Kimi做對(duì)了什么

2024Q1人工智能里程碑盤點(diǎn):Sora和Kimi做對(duì)了什么

2024-04-01
來源:快科技
關(guān)鍵詞: 人工智能 Sora Kimi

2024年一季度即將結(jié)束。在以ChatGPT為起點(diǎn)的AI風(fēng)潮席卷世界一年后,,全球生成式AI應(yīng)用加速發(fā)展,,多模態(tài)模型及應(yīng)用成為新一輪AI競(jìng)賽的“主戰(zhàn)場(chǎng)”。

目前,,國(guó)內(nèi)AIGC賽道應(yīng)用層品類持續(xù)多元化,,海外助手類應(yīng)用逐漸成為主流。

盤點(diǎn)一季度資本市場(chǎng)最“出圈”的AI應(yīng)用,,文生視頻賽道上,,Sora在2月春節(jié)假期后引起市場(chǎng)關(guān)注;3月國(guó)產(chǎn)AI對(duì)話助手Kimi在突破200萬字的長(zhǎng)文本技術(shù)后,,訪問量與市場(chǎng)關(guān)注度激增,;3月下旬,初創(chuàng)企業(yè)Suno發(fā)布同名模型V3版本發(fā)布,,一條龍“包辦”歌詞,、歌聲、配樂,指向多模態(tài)應(yīng)用流行新趨勢(shì),。

1.png

文字聊天助手在ChatGPT問世之后成為各方人工智能巨頭進(jìn)軍的方向,,而多模態(tài)AI應(yīng)用在2023年也已開始批量涌現(xiàn),2024年仍然在A股“出圈”的Sora,、Kimi做對(duì)了什么,?

Sora:更長(zhǎng)的視頻與商業(yè)化落地

繼文生視頻“獨(dú)角獸”Pika大火之后,龍年春節(jié)期間,,OpenAI發(fā)布的文生視頻大模型Sora迅速風(fēng)靡,。

Sora初步具備了理解物理世界的能力,率先將文生視頻長(zhǎng)度突破了1分鐘長(zhǎng)度,,較其他模型表現(xiàn)更出色,,還支持圖生視頻、視頻生視頻,、視頻擴(kuò)展,、多角度鏡頭等。春節(jié)后,,Sora行情引領(lǐng)A股人工智能概念走強(qiáng),。

其最關(guān)鍵的突破可以概括為以下幾點(diǎn),據(jù)中泰證券概括,,一是生成效果上的可用性極高(60s時(shí)長(zhǎng),、分辨率1080p);二是從技術(shù)路線上解決了模態(tài)之間的對(duì)齊問題,;三是從產(chǎn)業(yè)發(fā)展看,,Sora通用性極強(qiáng),有望統(tǒng)一視頻生成生態(tài),。

而另一邊,,Pika等競(jìng)爭(zhēng)者也在持續(xù)迭代,3月,,Pika添加了 AI 視頻自動(dòng)生成音效功能,用戶可以直接在應(yīng)用程序中完成并創(chuàng)建新的聲音文件,,在此之前,,Pika還推出了口型同步功能,在成為“一條龍”式AI 視頻平臺(tái)的路上前進(jìn),。

Kimi:開啟超長(zhǎng)文本競(jìng)爭(zhēng)

Kimi智能助手這一AI對(duì)話工具由月之暗面(Moonshot AI)在2023年10月推出,,之后歷經(jīng)三次版本迭代。

三月中旬,,月之暗面宣布在大模型長(zhǎng)上下文窗口技術(shù)上取得新的突破,,Kimi智能助手已支持200萬字超長(zhǎng)無損上下文。

隨后,“解鎖”長(zhǎng)文本能力的Kimi概念在市場(chǎng)爆火,,多家上市公司發(fā)布公告稱接入Kimi或正在與其溝通,。百度、阿里也雙雙宣布加碼,,角逐長(zhǎng)文本大模型賽道,。

目前海內(nèi)外商業(yè)化AI應(yīng)用仍然以聊天助手類為主。在海外,,a16z最新的全球 AI 產(chǎn)品 Top100 榜單2024年有22家新公司上榜,,LLM助手占主導(dǎo)地位,ChatGPT網(wǎng)站穩(wěn)居榜首,。在國(guó)內(nèi),,根據(jù)AI產(chǎn)品榜aicpb.com統(tǒng)計(jì),目前國(guó)內(nèi)智能聊天助手占主流,,國(guó)內(nèi)訪問量前十中有六款產(chǎn)品為AI ChatBots,,其中目前Kimi增速最高,2月環(huán)比為107.6%,,在國(guó)內(nèi)AI產(chǎn)品訪問量排行榜中的排名升至第3位,,僅次于百度文心一言的1006萬和阿里通義千問的365萬。

Kimi在競(jìng)爭(zhēng)激烈的同類產(chǎn)品中被二級(jí)市場(chǎng)關(guān)注,,民生證券認(rèn)為,,優(yōu)勢(shì)在于其長(zhǎng)文本處理能力,領(lǐng)先于同期其他模型產(chǎn)品,。月之暗面創(chuàng)始人曾表示:“無損的長(zhǎng)上下文是通用人工智能的關(guān)鍵基礎(chǔ)”,。而這一趨勢(shì)在海外同類產(chǎn)品中也已出現(xiàn)。機(jī)器之心數(shù)據(jù)顯示,,OpenAI尚未上線的GPT-4.5Turbo上下文窗口將高達(dá)256K token(約20萬詞),,Anthropic剛剛發(fā)布的Claude 3支持200K tokens上下文。

Suno: 降低AI音樂創(chuàng)作門檻

近期,,AI初創(chuàng)公司Suno更新了文生音樂模型Suno V3,,可通過幾秒時(shí)間創(chuàng)作2分鐘的“廣播級(jí)”音質(zhì)完整歌曲,并新增了更豐富的音樂風(fēng)格和流派選項(xiàng),,如古典音樂,、爵士、Hiphop等,。相比V1版本20-40 秒的時(shí)長(zhǎng),,V3版本在完整度、提示詞依從以及交互界面等各方面都有改進(jìn),。Suno V3支持AI生成音樂歌詞,,但其能力側(cè)重于音頻生產(chǎn),在文本生成方面,其與Open AI有合作,。在模型運(yùn)行時(shí),,Suno調(diào)用ChatGPT生成歌詞和標(biāo)題。

AI應(yīng)用在向多模態(tài)延伸的同時(shí),,智能文字助手的接入也在成為AI初創(chuàng)企業(yè)的新嘗試,。

掀起行情的“爆款”AI有何共通之處?

無論是Sora的強(qiáng)擴(kuò)展性長(zhǎng)視頻,,還是Kimi的超長(zhǎng)無損上下文,、Suno在文生音頻中調(diào)用ChatGPT實(shí)現(xiàn)“一條龍”創(chuàng)作,都填補(bǔ)了市場(chǎng)中AI產(chǎn)品的某些技術(shù)性空白,。而其更多的共通點(diǎn)在于面向C端用戶的開放體驗(yàn)和顯著的商業(yè)化預(yù)期,。

ToC的切入點(diǎn)

Sora尚未正式發(fā)布,但其母公司OpenAI是最早一批開啟人工智能商業(yè)化的企業(yè),。

在Sora的測(cè)試階段,,其最先被開放給視覺藝術(shù)家、設(shè)計(jì)師,、電影制作人等群體,,首批拿到Sora授權(quán)的導(dǎo)演、藝術(shù)家們已在本周公開自己創(chuàng)作的最新短片,。

Kimi與Suno均有面向C端用戶的免費(fèi)訪問形式,,也獲得良好口碑。

華泰證券觀點(diǎn)表示,,Kimi的戰(zhàn)略是基于閉源的C端模型,,加速模型迭代,讓B端公司接入其API合作賦能,。

商業(yè)化預(yù)期

獲A股市場(chǎng)關(guān)注的AI模型/應(yīng)用單品往往有著更清晰的商業(yè)化預(yù)期,。

在文生視頻賽道,最新消息顯示,,OpenAI試圖借助Sora進(jìn)軍好萊塢,。據(jù)報(bào)道,OpenAI計(jì)劃下周在美國(guó)洛杉磯與好萊塢諸多工作室,、媒體高管,、藝人經(jīng)紀(jì)開會(huì),以構(gòu)建娛樂產(chǎn)業(yè)的合作伙伴關(guān)系,、并鼓勵(lì)眾多制片公司將OpenAI的新款A(yù)I視頻生成器融入它們的工作中。OpenAI CEO Altman已經(jīng)在今年奧斯卡電影節(jié)周末出席洛杉磯的多場(chǎng)活動(dòng),。

在智能聊天助手賽道,,Kimi母公司聯(lián)合創(chuàng)始人預(yù)計(jì),2024年會(huì)推出多模態(tài)模型及產(chǎn)品,預(yù)計(jì)在24年上半年開啟商業(yè)化模式,。而這一發(fā)展路徑,,在海外已被OpenAI驗(yàn)證過。

熱門AI應(yīng)用對(duì)A股市場(chǎng)的影響,?

Sora與LLM推理更需要內(nèi)存帶寬的資源需求不同,,視覺模型推理將對(duì)芯片本身算力和內(nèi)存容量提出更高要求。

縱觀機(jī)構(gòu)對(duì)Sora概念所給出的投資建議,,機(jī)會(huì)集中于:①光通信領(lǐng)域和算力基礎(chǔ)設(shè)施領(lǐng)域,,需要更高的算力和帶寬②AI文生視頻技術(shù)有望對(duì)影視、廣告營(yíng)銷,、游戲與視覺內(nèi)容創(chuàng)作等傳媒領(lǐng)域進(jìn)行重塑,。

和Kimi相關(guān)的投資主線則包括語料素材庫價(jià)值的凸顯(包括文字、圖像,、視頻),、Kimi賦能應(yīng)用的邏輯、與其他國(guó)產(chǎn)優(yōu)質(zhì)大模型合作的邏輯,。

Kimi近期連續(xù)宕機(jī)則顯示從訓(xùn)練走向推理對(duì)于算力的需求將會(huì)巨大,,而且這種需求僅僅剛開始。華福證券復(fù)盤稱,,回顧本年Kimi行情,,最先領(lǐng)漲的是可接入Kimi的應(yīng)用場(chǎng)景,包括閱讀,、短劇劇本生成等場(chǎng)景相關(guān)的標(biāo)的,,而后行情傳導(dǎo)到模型語料,即擁有視頻語料,、文字語料的各個(gè)標(biāo)的,,子版塊輪動(dòng)路徑和OpenAI行情較為相似。

與Suno相關(guān)的投資機(jī)會(huì),,開源證券解讀稱,,AI音樂生成模型訓(xùn)練或拉動(dòng)對(duì)音樂版權(quán)、音頻語料數(shù)據(jù)的需求,。

除了以上“爆款”AI,,近期還有階躍星辰大模型(萬億參數(shù))、英偉達(dá)的一系列AI應(yīng)用新部署等面世,,AGI范式的構(gòu)建仍在不斷重塑中,。在此過程中,機(jī)構(gòu)的投資建議更多地指向訓(xùn)練數(shù)據(jù)集,、算力和應(yīng)用賦能,。

算力,、數(shù)據(jù)集、應(yīng)用方向的新機(jī)會(huì)

國(guó)產(chǎn)AI算力鏈在芯片,、交換機(jī),、存儲(chǔ)、AI服務(wù)器等方向的機(jī)遇早已明確,,而2024年新生的機(jī)遇也在醞釀,。一季度,國(guó)盛證券表示,,國(guó)內(nèi)外對(duì)液冷的需求有望形成共振,,液冷從“可選”到“必選”的過程將大幅提升市場(chǎng)空間,成為算力重要細(xì)分賽道,;興業(yè)證券有色金屬研究團(tuán)隊(duì)認(rèn)為,,英偉達(dá)新發(fā)布的GB200 NVLink銅互聯(lián)方案以及高速連接器需求放量有望打開高端銅合金市場(chǎng)需求。

2024年人工智能產(chǎn)業(yè)對(duì)于訓(xùn)練數(shù)據(jù)集的需求持續(xù)多模態(tài)化,,開源證券表示,,長(zhǎng)文本訓(xùn)練或拉動(dòng)知識(shí)、文學(xué)類語料需求,,多模態(tài)訓(xùn)練或拉動(dòng)圖片,、視頻類語料需求。AI領(lǐng)域版權(quán)糾紛不斷,,海外近期多起由于未經(jīng)出版社同意使用版權(quán)方內(nèi)容訓(xùn)練大模型判罰落地,,驗(yàn)證數(shù)據(jù)要素價(jià)值。三月末,,國(guó)內(nèi)《生成式人工智能服務(wù)安全基本要求》落地,,方正證券表示,優(yōu)質(zhì)的視頻和文本版權(quán)商價(jià)值凸顯,。

2.png

AI對(duì)應(yīng)用的賦能在ToB領(lǐng)域也已有許多嘗試,,近期的機(jī)構(gòu)觀點(diǎn)更多指向多模態(tài)、長(zhǎng)文本的應(yīng)用加速,。

華泰證券表示,,綜合當(dāng)下全球AI應(yīng)用發(fā)展情況,海外ToC應(yīng)用進(jìn)展與國(guó)內(nèi)大模型能力升級(jí)或?qū)⒊蔀?024年AI應(yīng)用的關(guān)注重點(diǎn),。

海外,,AI應(yīng)用2023年針對(duì)ToB場(chǎng)景全面鋪開,大模型逐步嵌入企業(yè)IT基礎(chǔ)架構(gòu),。

伴隨模型能力提升,,ToC應(yīng)用有望迎來新拐點(diǎn),多模態(tài)應(yīng)用與智能終端(AI手機(jī),、AIPC)有望提速,;國(guó)內(nèi),,大模型能力優(yōu)化仍是產(chǎn)業(yè)重點(diǎn),,長(zhǎng)文本能力成為當(dāng)前多家公司的模型能力重點(diǎn),。

伴隨基礎(chǔ)模型能力提升,國(guó)內(nèi)AI應(yīng)用產(chǎn)品化,、商業(yè)化節(jié)奏有望全面加快,。

下一個(gè)Kimi何處尋?

從技術(shù)角度上,,中泰證券認(rèn)為,,繼文本、代碼,、圖片,、視頻之后,下一個(gè)有可能實(shí)現(xiàn)突破的AI模態(tài)大概率是3D,。

目前海外在AI+3D技術(shù)上主要分為工業(yè)場(chǎng)景探索與非工業(yè)場(chǎng)景探索,。非工業(yè)場(chǎng)景應(yīng)用探索主要主要面向游戲、元宇宙中的3D資產(chǎn)設(shè)計(jì),;工業(yè)場(chǎng)景應(yīng)用則主要以衍生式設(shè)計(jì)軟件,。

但AI+3D建模技術(shù)當(dāng)前也面臨較多挑戰(zhàn),如3D數(shù)據(jù)與資產(chǎn)缺乏,、AI訓(xùn)練難度高,、AI實(shí)時(shí)渲染技術(shù)有限、商業(yè)化落地難度大等問題,。

而從A股市場(chǎng)角度,,能夠掀起行情的“黑馬”往往出現(xiàn)在ToC端受眾群體較多且有商業(yè)應(yīng)用催化的方向。

天風(fēng)證券計(jì)算機(jī)團(tuán)隊(duì)在Kimi掀起市場(chǎng)熱潮期間曾經(jīng)發(fā)布相關(guān)問卷調(diào)查,,結(jié)果顯示,,Kimi 培育用戶習(xí)慣逐步形成且黏性很高,并非營(yíng)銷導(dǎo)流的一次性熱潮,,同時(shí)在某些特定場(chǎng)景下也形成了用戶的核心需求(如金融),。

從繞不開的通用場(chǎng)景如辦公出發(fā),垂直場(chǎng)景看好金融,,建議關(guān)注辦公軟件,、多模態(tài)賽道、金融和法律應(yīng)用,、B端應(yīng)用等,。

3.png


雜志訂閱.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]