2023年,,英偉達(dá)幾乎一整年都在關(guān)注高端顯卡、AI大模型,、超級(jí)計(jì)算等數(shù)據(jù)中心業(yè)務(wù),以至于市場(chǎng)都快要忘記英偉達(dá)在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件“軍火商”,。
事實(shí)上,,在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同時(shí),英偉達(dá)并沒有忘本,,黃仁勛早已開始盤算,,如何用AI到“電競(jìng)椅和辦公桌”上去賺錢了。
在剛剛結(jié)束的2024 CES上英偉達(dá)發(fā)布了大量聚集PC端的AI應(yīng)用和GPU新品。包括GeForce RTX 40 SUPER系列顯卡,,NVIDIA AI Workbench,,開源庫(kù)TensorRT-LLM,以及生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù),。
一系列PC端的GPU產(chǎn)品和應(yīng)用,,全部圍繞本屆CES上PC廠商們最關(guān)注的話題AIPC。然而,,對(duì)于一心撲在AI上的英偉達(dá)來(lái)說(shuō),,對(duì)PC用戶的“關(guān)心”,還保留了多少呢,?英偉達(dá)對(duì)業(yè)界熱炒的AIPC到底是什么態(tài)度,?
PC業(yè)務(wù)的前景不如數(shù)據(jù)中心
事實(shí)上,在2023年AI大模型爆發(fā)以前,,英偉達(dá)最大的市場(chǎng)一直是PC端的“游戲”板塊,。
英偉達(dá)從2015年開始把主營(yíng)業(yè)務(wù)分為游戲(Gaming)、企業(yè)(Enterprise),、高性能計(jì)算和云(HPC & Cloud),、自動(dòng)駕駛(Automotive)幾個(gè)板塊。也是自2015年起,,超算和云,,也就是未來(lái)的數(shù)據(jù)中心業(yè)務(wù),開始在英偉達(dá)的營(yíng)收中一步步走向高位,。
2016年,,英偉達(dá)對(duì)其業(yè)務(wù)板塊進(jìn)行了調(diào)整,去掉了Enterprise和HPC & Cloud兩個(gè)板塊,,取而代之的是今天的專業(yè)可視化(Professional Visualization)和數(shù)據(jù)中心(Datacenter),。英偉達(dá)還首次單獨(dú)公布了這幾個(gè)業(yè)務(wù)板塊的營(yíng)收情況。游戲業(yè)務(wù)的目標(biāo)用戶就是個(gè)人電腦,,專業(yè)可視化的用戶則多數(shù)是商業(yè)客戶使用的工作站,。
2016年英偉達(dá)全年的總收入為50.10億美元。在2016年1月31日結(jié)束的財(cái)年中,,英偉達(dá)的游戲業(yè)務(wù)收入為28.18億美元,;專業(yè)可視化業(yè)務(wù)的收入為7.50億美元;數(shù)據(jù)中心業(yè)務(wù)的收入為3.39億美元,;自動(dòng)駕駛業(yè)務(wù)收入為3.20億美元,。
其中游戲業(yè)務(wù)和專業(yè)可視化分別占總收入的56.25%和14.97%,今天如日中天的數(shù)據(jù)中心,,在當(dāng)時(shí)只占總收入的6.77%,。
個(gè)人電腦市場(chǎng)雖然穩(wěn)定,,但市場(chǎng)似乎已經(jīng)能夠看到天花板了,不僅增長(zhǎng)速度有限,,且由于技術(shù)門檻不高,,這一領(lǐng)域的市場(chǎng)競(jìng)爭(zhēng)也日益激烈。
2017,、2018年,,AI技術(shù)首次爆發(fā)。給英偉達(dá)帶來(lái)了一條新的增長(zhǎng)曲線,。
2018財(cái)年,GPU加速計(jì)算對(duì)于深度學(xué)習(xí)的支持使得英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)快速增長(zhǎng),,當(dāng)年數(shù)據(jù)中心業(yè)務(wù)的收入為193.2億美元,,專業(yè)可視化為93.4億美元。數(shù)據(jù)中心的營(yíng)收和增幅都遠(yuǎn)超專業(yè)可視化,。
數(shù)據(jù)中心業(yè)務(wù)的飛速發(fā)展,,可以說(shuō)是把英偉達(dá)從傳統(tǒng)游戲硬件供應(yīng)商,帶上了多元化技術(shù)公司的軌道,。
市調(diào)機(jī)構(gòu)TBRC在2024年1月發(fā)布的最新報(bào)告中預(yù)測(cè),,2023年全球個(gè)人電腦市場(chǎng)規(guī)模約為2040.9億美元,預(yù)計(jì)到2024年將增長(zhǎng)到2123.8億美元,,復(fù)合年增長(zhǎng)率(CAGR)為4.1%,。個(gè)人電腦市場(chǎng)規(guī)模預(yù)計(jì)在未來(lái)幾年將保持增長(zhǎng)。到2028年,,或?qū)⒃鲋?677.1億美元,,復(fù)合年增長(zhǎng)率為6.0%。
數(shù)據(jù)中心的市場(chǎng)規(guī)模和增長(zhǎng)潛力則比個(gè)人電腦更大,。2023年的全球數(shù)據(jù)中心市場(chǎng)規(guī)模約2526.8億美元,,比個(gè)人電腦市場(chǎng)規(guī)模大了約20%。預(yù)計(jì)到2024年將增至2749.8億美元,,復(fù)合年增長(zhǎng)率(CAGR)為8.8%,。未來(lái)幾年數(shù)據(jù)中心市場(chǎng)規(guī)模的增長(zhǎng)也更為強(qiáng)勁。TBRC預(yù)計(jì),,到2028年,,這一市場(chǎng)的規(guī)模將增至3884.1億美元,復(fù)合年增長(zhǎng)率(CAGR)為9.0%,。
相比于個(gè)人電腦業(yè)務(wù),,數(shù)據(jù)中心無(wú)論是市場(chǎng)規(guī)模、市場(chǎng)競(jìng)爭(zhēng)格局,,還是用戶需求,、技術(shù)發(fā)展趨勢(shì),不管當(dāng)下還是未來(lái),都明顯更好做,,也更賺錢,。
數(shù)據(jù)中心有多賺錢?
在英偉達(dá)最新的2024財(cái)年第三季度財(cái)報(bào)中,,快速上升的數(shù)據(jù)中心業(yè)務(wù)營(yíng)收1451.4億美元,,占總營(yíng)收的80%,完全碾壓了英偉達(dá)在PC端的傳統(tǒng)核心業(yè)務(wù)“游戲”,。對(duì)于英偉達(dá)來(lái)說(shuō),,數(shù)據(jù)中心業(yè)務(wù)不管是當(dāng)下還是未來(lái),都是最能賺錢,,賺錢最快,,賺錢最簡(jiǎn)單的業(yè)務(wù)。
今天的技術(shù)趨勢(shì)強(qiáng)烈指向云計(jì)算,、大數(shù)據(jù),、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域,這些都是數(shù)據(jù)中心業(yè)務(wù)的關(guān)鍵驅(qū)動(dòng)力,。
AI推動(dòng)著各家公司對(duì)高算力,、超級(jí)算力的需求持續(xù)上漲。2023年年中,,科技博客GPU Utils對(duì)GPU短缺問(wèn)題做了一次調(diào)查,,博主Clay Pascal給出的調(diào)查結(jié)果稱,彼時(shí)谷歌云擁有大約2.5萬(wàn)塊H100,,微軟云服務(wù)Azure可能有1萬(wàn)-4萬(wàn)塊H100,,甲骨文的情況應(yīng)該類似。Azure的大部分容量都將流向OpenAI,。
Clay Pascal預(yù)測(cè)對(duì)于H100的需求,,OpenAI可能需要5萬(wàn)塊,Meta可能需要2.5萬(wàn)塊,,大型云廠商可能每家都需要3萬(wàn)塊,,加上其他一些初創(chuàng)企業(yè),可能總共需要大約43.2萬(wàn)塊H100,。以每塊約3.5萬(wàn)美元計(jì)算,,所需GPU的價(jià)值約為150億美元。這還不包括中國(guó)公司,。
Clay Pascal在博客中寫道:我被告知,,對(duì)于需要100或1000塊(英偉達(dá)GPU)H100的公司來(lái)說(shuō),Azure(微軟云服務(wù))和GCP(谷歌云服務(wù))實(shí)際上已經(jīng)沒有容量了,,亞馬遜也接近沒有容量了,。
研究機(jī)構(gòu)Omdia的調(diào)研結(jié)果則稱,,英偉達(dá)在2023年第三季度售出了近50萬(wàn)個(gè)A100和H100 GPU,基于H100的服務(wù)器的交付周期已延長(zhǎng)至36到52周,。雖然不知道目前英偉達(dá)的補(bǔ)貨情況,,不過(guò)從OpenAI近期接連發(fā)生的斷網(wǎng),停賬號(hào),,以及新功能升級(jí)來(lái)看,,不管補(bǔ)貨能力如何,需求的巨大缺口仍在,。
在巨大的需求面前,,英偉達(dá)也開始了坐地起價(jià)。在芯片行業(yè)中,,高端產(chǎn)品的利潤(rùn)率通常較高,,不少高端產(chǎn)品的利潤(rùn)率可達(dá)50%以上。而英偉達(dá)的高端GPU利潤(rùn)率高得可怕,,投資銀行Raymond James的消息稱H100 GPU的成本只有3320美元,但英偉達(dá)賣出的價(jià)格為2.5-3萬(wàn)美元,,利潤(rùn)率高達(dá)1000%,。
如今英偉達(dá)a100和H100服務(wù)器的價(jià)格,在國(guó)內(nèi)更是炒得離譜,,2023年最后三個(gè)月,,8卡H100服務(wù)器的價(jià)格上浮一度達(dá)到300萬(wàn)元人民幣。
英偉達(dá)有多需要AIPC,?
數(shù)據(jù)中心這么好賺,,那是否意味著英偉達(dá)會(huì)就此減弱對(duì)PC市場(chǎng)的關(guān)注呢?
短期來(lái)看恐怕還不會(huì),,畢竟在過(guò)去30年里,,PC一直是英偉達(dá)的主戰(zhàn)場(chǎng)。在這里,,英偉達(dá)不僅有優(yōu)勢(shì),,有經(jīng)驗(yàn),更重要的是有信心,。
個(gè)人電腦市場(chǎng),,特別是游戲和專業(yè)圖形處理領(lǐng)域,在今天仍然是英偉達(dá)重要的收入來(lái)源,。英偉達(dá)2024財(cái)年第三季度業(yè)績(jī)顯示,,游戲業(yè)務(wù)營(yíng)收為285.6億美元,同比增長(zhǎng)超80%,。隨著游戲行業(yè)的發(fā)展和虛擬現(xiàn)實(shí)技術(shù)的進(jìn)步,,PC市場(chǎng)的增長(zhǎng)潛力仍然巨大,。
另一方面,英偉達(dá)在PC市場(chǎng)上,,亦處在壟斷地位,。英偉達(dá)在2022年全球獨(dú)立GPU市場(chǎng)中的市占率為88%,AMD和Intel僅占8%和4%,。
更重要的是,,英偉達(dá)在GPU方面豐富的產(chǎn)品線,可以在PC市場(chǎng)上長(zhǎng)期發(fā)貨優(yōu)勢(shì),。英偉達(dá)提供了一系列針對(duì)不同用戶需求的GPU產(chǎn)品,,包括面向游戲玩家和創(chuàng)作者的Ampere,以及面向數(shù)據(jù)中心的Hopper3,。英偉達(dá)還構(gòu)建了包括驅(qū)動(dòng)程序,、開發(fā)工具和應(yīng)用程序在內(nèi)的全面生態(tài)系統(tǒng)。
從目前來(lái)看如果英偉達(dá)的RTX40系列顯卡在PC上能夠支持新的AI業(yè)務(wù),,那么未來(lái)仍將獨(dú)占這一百億級(jí)別的市場(chǎng),,甚至通過(guò)AI技術(shù)的升級(jí),進(jìn)一步擴(kuò)大個(gè)人pc市場(chǎng)中GPU的裝機(jī)率,,推動(dòng)全球市場(chǎng)規(guī)模更上一個(gè)臺(tái)階,。
2023年數(shù)據(jù)中心業(yè)務(wù)的增長(zhǎng)速度驚人,與AI大模型這一新興技術(shù)的爆發(fā)密切相關(guān),。然而,,AI大模型目前對(duì)全球科技市場(chǎng)來(lái)說(shuō)仍處在非常早期的階段,未來(lái)的增長(zhǎng)持續(xù)性到底如何,,對(duì)云端服務(wù)器的需求如何都未可知,。
而PC業(yè)務(wù),在過(guò)去30年中已經(jīng)走出了一條穩(wěn)定的增長(zhǎng)曲線,。由此可想,,雖然英偉達(dá)勢(shì)必會(huì)重點(diǎn)投資更有利可圖且增長(zhǎng)潛力更大的數(shù)據(jù)中心業(yè)務(wù),但一定也不會(huì)把早已站穩(wěn)腳跟的PC業(yè)務(wù)市場(chǎng)拱手讓人,。
RTX 40系列的機(jī)遇和挑戰(zhàn)
AIPC概念在市場(chǎng)上被熱炒,,很多廠商都在提出把AI落地到本地,從而降低云計(jì)算成本,、提高安全性和響應(yīng)效率,。這無(wú)疑給PC端的GPU創(chuàng)造了新的市場(chǎng)機(jī)遇。
英偉達(dá)在2024 CES上最新發(fā)布的GeForce RTX 40 SUPER系列顯卡中,,GeForce RTX 4080 SUPER在AI視頻生成上比GeForce RTX 3080 Ti快1.5倍,,圖片生成上快1.7倍。SUPER GPUs的Tensor Cores能夠?qū)崿F(xiàn)每秒高達(dá)836萬(wàn)億次AI運(yùn)算(TOPS),,從而為游戲,、創(chuàng)作和日常生產(chǎn)力帶來(lái)變革性的AI能力,。
NVIDIA AI Workbench則允許開發(fā)者快速創(chuàng)建、測(cè)試和定制預(yù)訓(xùn)練的生成式AI模型和大型語(yǔ)言模型(LLM),。TensorRT-LLM是一個(gè)開源庫(kù),,用于加速PC上大型語(yǔ)言模型的運(yùn)行。最新版本的TensorRT-LLM現(xiàn)已可用,,它為PC增加了更多預(yù)優(yōu)化模型,,與其他推理后端相比,運(yùn)行速度提高了多達(dá)5倍,。
此外,,英偉達(dá)還發(fā)布了生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù),使開發(fā)者能夠向游戲中添加智能,、動(dòng)態(tài)的數(shù)字化角色,。此外,NVIDIA還發(fā)布了“Chat with RTX”技術(shù)演示,,它允許AI愛好者通過(guò)所謂的“檢索增強(qiáng)生成”(RAG)技術(shù),,輕松地將PC上的大型語(yǔ)言模型(LLM)連接到自己的數(shù)據(jù)。
這些新品都針對(duì)生成式AI做了大量?jī)?yōu)化,,為GPU在未來(lái)的AIPC中發(fā)力提供了機(jī)會(huì),。
有趣的是,最近有研究團(tuán)隊(duì)發(fā)現(xiàn)RTX4090在一定條件下甚至有可能替代服務(wù)器級(jí)芯片,。
上海交通大學(xué)的研究團(tuán)隊(duì)就開發(fā)了一個(gè)名為PowerInfer的高性能CPU/GPU混合LLM推理引擎。這款引擎大幅降低了對(duì)GPU內(nèi)存的需求,,并減少了CPU與GPU之間的數(shù)據(jù)傳輸,,從而提高了整體效率??梢栽趩蝹€(gè)NVIDIA RTX 4090 GPU上運(yùn)行大型語(yǔ)言模型(LLM),,達(dá)到平均每秒產(chǎn)生13.20個(gè)token的速度,峰值速度更是高達(dá)29.08 tokens/s,,這與頂尖的A100 GPU服務(wù)器性能相差無(wú)幾,,僅低18%,適用于多種LLM應(yīng)用場(chǎng)景,。
PC端GPU在AI加持下雖然機(jī)遇巨大,。但在AIPC的大潮流中競(jìng)爭(zhēng)也比高端GPU更激烈。
如今,,英偉達(dá)要面對(duì)的競(jìng)爭(zhēng)中已經(jīng)不只有AMD和Intel了,。蘋果M系列芯片提出的統(tǒng)一內(nèi)存架構(gòu)(Unified Memory Architecture, UMA),給生成式AI的預(yù)訓(xùn)練過(guò)程提供了一種選擇,。
UMA允許CPU和GPU共享相同的物理內(nèi)存,,減少了數(shù)據(jù)在不同內(nèi)存之間的復(fù)制需求,,提高效率。此外蘋果的硬件優(yōu)化使其設(shè)備在執(zhí)行AI相關(guān)任務(wù)時(shí)能耗更低,。蘋果的硬件和軟件高度集成的特性,,也為特定的AI應(yīng)用提供了更好的優(yōu)化空間。
目前,,已經(jīng)有大量AI大模型開發(fā)者開始嘗試使用蘋果電腦訓(xùn)練大語(yǔ)言模型,。最新款Mac Studio的頂配版本,已經(jīng)可以訓(xùn)練700億參數(shù)的LLaMA2模型,。
不過(guò),,雖然UMA具備諸多優(yōu)勢(shì),但它更多地集中在蘋果自己的生態(tài)系統(tǒng)內(nèi),,與外部系統(tǒng)的兼容性可能有限,。且相比專業(yè)的GPU,蘋果的硬件可能在處理極其復(fù)雜的AI模型時(shí)有性能瓶頸,。
英偉達(dá)在AI領(lǐng)域深耕多年,,擁有強(qiáng)大的技術(shù)積累和廣泛的應(yīng)用生態(tài),這些都是蘋果短時(shí)間內(nèi)難以匹敵的,。盡管蘋果UMA可能在某些方面對(duì)英偉達(dá)構(gòu)成挑戰(zhàn),,但英偉達(dá)的GPU在AI領(lǐng)域依然具有很強(qiáng)的競(jìng)爭(zhēng)力。
PC業(yè)務(wù)能救中國(guó)市場(chǎng)嗎,?
黃仁勛在英偉達(dá)2024財(cái)年第三季度的財(cái)報(bào)電話中提到,,英偉達(dá)20-25%的業(yè)務(wù)來(lái)自中國(guó),美國(guó)對(duì)中國(guó)的高端芯片制裁,,將會(huì)對(duì)英偉達(dá)造成嚴(yán)重影響,。
2023年8月,英國(guó)《金融時(shí)報(bào)》曾報(bào)道了一則中國(guó)云廠商搶購(gòu)英偉達(dá)高端GPU的新聞,,稱百度,、字節(jié)跳動(dòng)、騰訊和阿里巴巴四家公司合計(jì)向英偉達(dá)訂購(gòu)了價(jià)值50億美元的AI芯片,。而受美國(guó)制裁法案的影響,,英偉達(dá)機(jī)會(huì)完全無(wú)法履行這些訂單。
為了保住中國(guó)業(yè)務(wù),,英偉達(dá)再度開始積極設(shè)計(jì)3款”中國(guó)特供“芯片,。
某國(guó)內(nèi)服務(wù)器制造商近期曾向虎嗅透露,芯片限制政策對(duì)國(guó)內(nèi)服務(wù)器生產(chǎn)沒有影響,,因?yàn)椴还苡ミ_(dá)推出什么芯片,,服務(wù)器要做的只是適配NV-Link。目前搭載新的“中國(guó)特供”芯片的服務(wù)器已經(jīng)接受了很多客戶的下單,不過(guò)受到美國(guó)政府加強(qiáng)管制的影響,,原本計(jì)劃2024年1月到貨的“中國(guó)特供”,,現(xiàn)在看肯定要延后了。
有消息稱,,拜登政府已經(jīng)開始調(diào)查英偉達(dá)為中國(guó)開發(fā)的三款新型AI芯片的具體細(xì)節(jié),。美國(guó)商務(wù)部長(zhǎng)吉娜·雷蒙多在接受外媒采訪時(shí)談道:“我們會(huì)檢查每一個(gè)新芯片的每一個(gè)規(guī)格,顯然是為了確保它不違反出口管制,?!?/p>
雷蒙多說(shuō),英偉達(dá)“能夠,、愿意,、也應(yīng)該向中國(guó)出售AI芯片,因?yàn)榇蠖鄶?shù)AI芯片將用于商業(yè)應(yīng)用”,,但“我們不能允許他們運(yùn)送最復(fù)雜,、處理能力最高的AI芯片,這將使中國(guó)能夠訓(xùn)練他們的前沿模型”,。她強(qiáng)調(diào)說(shuō)不能向中國(guó)企業(yè)出售其最先進(jìn)的半導(dǎo)體,,并表示將不斷更新出口管制規(guī)則。
美國(guó)對(duì)中國(guó)的芯片封鎖,,與其說(shuō)是在制裁中國(guó),,倒不如說(shuō)是在制裁英偉達(dá)。
1月7日,,美國(guó)《華爾街日?qǐng)?bào)》以“英偉達(dá)在中國(guó)的新困境,,客戶不想要它的降級(jí)芯片”為題,報(bào)道了英偉達(dá)為應(yīng)對(duì)拜登政府出口限制,,向中國(guó)出售降級(jí)特供版AI芯片,,但中國(guó)客戶不感興趣的最新困境。
事實(shí)上,,RTX40系列顯卡在中國(guó)的銷售也未必會(huì)一帆風(fēng)順,有消息稱,,目前英偉達(dá)在中國(guó)可以銷售的最高端芯片為RTX 4090D,,這款新芯片比RTX4090的性能低了5%左右。英偉達(dá)介紹該產(chǎn)品將從2024年1月起陸續(xù)在中國(guó)上市,。
有知情人士向虎嗅透露,,為了緩和與中國(guó)客戶的關(guān)系,英偉達(dá)在積極開發(fā)“中國(guó)特供”的同時(shí),,也在與中國(guó)服務(wù)器廠商協(xié)商,,希望能在中低端服務(wù)器,以及PC業(yè)務(wù)方面做出一些讓步,,從而在不取消訂單的情況下,,用其他產(chǎn)品替代已經(jīng)下單但不能發(fā)貨的高端芯片產(chǎn)品,。
雖然對(duì)于中國(guó)的AI公司來(lái)說(shuō),沒有全面封鎖GPU芯片就等于斷了AI研發(fā)的電,。但這對(duì)中國(guó)的芯片企業(yè)來(lái)說(shuō),,或許是一個(gè)好消息。