2023年,,英偉達(dá)幾乎一整年都在關(guān)注高端顯卡,、AI大模型、超級計(jì)算等數(shù)據(jù)中心業(yè)務(wù),,以至于市場都快要忘記英偉達(dá)在PC市場上也是壟斷全球市場的硬件“軍火商”,。
事實(shí)上,,在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同時(shí),英偉達(dá)并沒有忘本,,黃仁勛早已開始盤算,,如何用AI到“電競椅和辦公桌”上去賺錢了。
在剛剛結(jié)束的2024 CES上英偉達(dá)發(fā)布了大量聚集PC端的AI應(yīng)用和GPU新品,。包括GeForce RTX 40 SUPER系列顯卡,,NVIDIA AI Workbench,開源庫TensorRT-LLM,,以及生成式AI驅(qū)動的語音和動畫模型在內(nèi)的NVIDIA ACE微服務(wù),。
一系列PC端的GPU產(chǎn)品和應(yīng)用,全部圍繞本屆CES上PC廠商們最關(guān)注的話題AIPC,。然而,,對于一心撲在AI上的英偉達(dá)來說,對PC用戶的“關(guān)心”,,還保留了多少呢,?英偉達(dá)對業(yè)界熱炒的AIPC到底是什么態(tài)度?
PC業(yè)務(wù)的前景不如數(shù)據(jù)中心
事實(shí)上,,在2023年AI大模型爆發(fā)以前,,英偉達(dá)最大的市場一直是PC端的“游戲”板塊。
英偉達(dá)從2015年開始把主營業(yè)務(wù)分為游戲(Gaming),、企業(yè)(Enterprise),、高性能計(jì)算和云(HPC & Cloud)、自動駕駛(Automotive)幾個(gè)板塊,。也是自2015年起,,超算和云,,也就是未來的數(shù)據(jù)中心業(yè)務(wù),開始在英偉達(dá)的營收中一步步走向高位,。
2016年,,英偉達(dá)對其業(yè)務(wù)板塊進(jìn)行了調(diào)整,去掉了Enterprise和HPC & Cloud兩個(gè)板塊,,取而代之的是今天的專業(yè)可視化(Professional Visualization)和數(shù)據(jù)中心(Datacenter),。英偉達(dá)還首次單獨(dú)公布了這幾個(gè)業(yè)務(wù)板塊的營收情況。游戲業(yè)務(wù)的目標(biāo)用戶就是個(gè)人電腦,,專業(yè)可視化的用戶則多數(shù)是商業(yè)客戶使用的工作站,。
2016年英偉達(dá)全年的總收入為50.10億美元。在2016年1月31日結(jié)束的財(cái)年中,,英偉達(dá)的游戲業(yè)務(wù)收入為28.18億美元,;專業(yè)可視化業(yè)務(wù)的收入為7.50億美元;數(shù)據(jù)中心業(yè)務(wù)的收入為3.39億美元,;自動駕駛業(yè)務(wù)收入為3.20億美元,。
其中游戲業(yè)務(wù)和專業(yè)可視化分別占總收入的56.25%和14.97%,今天如日中天的數(shù)據(jù)中心,,在當(dāng)時(shí)只占總收入的6.77%,。
個(gè)人電腦市場雖然穩(wěn)定,但市場似乎已經(jīng)能夠看到天花板了,,不僅增長速度有限,,且由于技術(shù)門檻不高,這一領(lǐng)域的市場競爭也日益激烈,。
2017,、2018年,AI技術(shù)首次爆發(fā),。給英偉達(dá)帶來了一條新的增長曲線,。
2018財(cái)年,GPU加速計(jì)算對于深度學(xué)習(xí)的支持使得英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)快速增長,,當(dāng)年數(shù)據(jù)中心業(yè)務(wù)的收入為193.2億美元,,專業(yè)可視化為93.4億美元。數(shù)據(jù)中心的營收和增幅都遠(yuǎn)超專業(yè)可視化,。
數(shù)據(jù)中心業(yè)務(wù)的飛速發(fā)展,,可以說是把英偉達(dá)從傳統(tǒng)游戲硬件供應(yīng)商,帶上了多元化技術(shù)公司的軌道,。
市調(diào)機(jī)構(gòu)TBRC在2024年1月發(fā)布的最新報(bào)告中預(yù)測,,2023年全球個(gè)人電腦市場規(guī)模約為2040.9億美元,預(yù)計(jì)到2024年將增長到2123.8億美元,,復(fù)合年增長率(CAGR)為4.1%,。個(gè)人電腦市場規(guī)模預(yù)計(jì)在未來幾年將保持增長,。到2028年,或?qū)⒃鲋?677.1億美元,,復(fù)合年增長率為6.0%,。
數(shù)據(jù)中心的市場規(guī)模和增長潛力則比個(gè)人電腦更大。2023年的全球數(shù)據(jù)中心市場規(guī)模約2526.8億美元,,比個(gè)人電腦市場規(guī)模大了約20%,。預(yù)計(jì)到2024年將增至2749.8億美元,復(fù)合年增長率(CAGR)為8.8%,。未來幾年數(shù)據(jù)中心市場規(guī)模的增長也更為強(qiáng)勁。TBRC預(yù)計(jì),,到2028年,,這一市場的規(guī)模將增至3884.1億美元,復(fù)合年增長率(CAGR)為9.0%,。
相比于個(gè)人電腦業(yè)務(wù),,數(shù)據(jù)中心無論是市場規(guī)模、市場競爭格局,,還是用戶需求,、技術(shù)發(fā)展趨勢,不管當(dāng)下還是未來,,都明顯更好做,,也更賺錢。
數(shù)據(jù)中心有多賺錢,?
在英偉達(dá)最新的2024財(cái)年第三季度財(cái)報(bào)中,,快速上升的數(shù)據(jù)中心業(yè)務(wù)營收1451.4億美元,占總營收的80%,,完全碾壓了英偉達(dá)在PC端的傳統(tǒng)核心業(yè)務(wù)“游戲”,。對于英偉達(dá)來說,數(shù)據(jù)中心業(yè)務(wù)不管是當(dāng)下還是未來,,都是最能賺錢,,賺錢最快,賺錢最簡單的業(yè)務(wù),。
今天的技術(shù)趨勢強(qiáng)烈指向云計(jì)算,、大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域,,這些都是數(shù)據(jù)中心業(yè)務(wù)的關(guān)鍵驅(qū)動力,。
AI推動著各家公司對高算力、超級算力的需求持續(xù)上漲,。2023年年中,,科技博客GPU Utils對GPU短缺問題做了一次調(diào)查,,博主Clay Pascal給出的調(diào)查結(jié)果稱,彼時(shí)谷歌云擁有大約2.5萬塊H100,,微軟云服務(wù)Azure可能有1萬-4萬塊H100,,甲骨文的情況應(yīng)該類似。Azure的大部分容量都將流向OpenAI,。
Clay Pascal預(yù)測對于H100的需求,,OpenAI可能需要5萬塊,Meta可能需要2.5萬塊,,大型云廠商可能每家都需要3萬塊,,加上其他一些初創(chuàng)企業(yè),可能總共需要大約43.2萬塊H100,。以每塊約3.5萬美元計(jì)算,,所需GPU的價(jià)值約為150億美元。這還不包括中國公司,。
Clay Pascal在博客中寫道:我被告知,,對于需要100或1000塊(英偉達(dá)GPU)H100的公司來說,Azure(微軟云服務(wù))和GCP(谷歌云服務(wù))實(shí)際上已經(jīng)沒有容量了,,亞馬遜也接近沒有容量了,。
研究機(jī)構(gòu)Omdia的調(diào)研結(jié)果則稱,英偉達(dá)在2023年第三季度售出了近50萬個(gè)A100和H100 GPU,,基于H100的服務(wù)器的交付周期已延長至36到52周,。雖然不知道目前英偉達(dá)的補(bǔ)貨情況,不過從OpenAI近期接連發(fā)生的斷網(wǎng),,停賬號,,以及新功能升級來看,不管補(bǔ)貨能力如何,,需求的巨大缺口仍在,。
在巨大的需求面前,英偉達(dá)也開始了坐地起價(jià),。在芯片行業(yè)中,,高端產(chǎn)品的利潤率通常較高,不少高端產(chǎn)品的利潤率可達(dá)50%以上,。而英偉達(dá)的高端GPU利潤率高得可怕,,投資銀行Raymond James的消息稱H100 GPU的成本只有3320美元,但英偉達(dá)賣出的價(jià)格為2.5-3萬美元,,利潤率高達(dá)1000%,。
如今英偉達(dá)a100和H100服務(wù)器的價(jià)格,在國內(nèi)更是炒得離譜,,2023年最后三個(gè)月,,8卡H100服務(wù)器的價(jià)格上浮一度達(dá)到300萬元人民幣,。
英偉達(dá)有多需要AIPC?
數(shù)據(jù)中心這么好賺,,那是否意味著英偉達(dá)會就此減弱對PC市場的關(guān)注呢,?
短期來看恐怕還不會,畢竟在過去30年里,,PC一直是英偉達(dá)的主戰(zhàn)場,。在這里,英偉達(dá)不僅有優(yōu)勢,,有經(jīng)驗(yàn),,更重要的是有信心。
個(gè)人電腦市場,,特別是游戲和專業(yè)圖形處理領(lǐng)域,,在今天仍然是英偉達(dá)重要的收入來源。英偉達(dá)2024財(cái)年第三季度業(yè)績顯示,,游戲業(yè)務(wù)營收為285.6億美元,同比增長超80%,。隨著游戲行業(yè)的發(fā)展和虛擬現(xiàn)實(shí)技術(shù)的進(jìn)步,,PC市場的增長潛力仍然巨大。
另一方面,,英偉達(dá)在PC市場上,,亦處在壟斷地位。英偉達(dá)在2022年全球獨(dú)立GPU市場中的市占率為88%,,AMD和Intel僅占8%和4%,。
更重要的是,英偉達(dá)在GPU方面豐富的產(chǎn)品線,,可以在PC市場上長期發(fā)貨優(yōu)勢,。英偉達(dá)提供了一系列針對不同用戶需求的GPU產(chǎn)品,包括面向游戲玩家和創(chuàng)作者的Ampere,,以及面向數(shù)據(jù)中心的Hopper3,。英偉達(dá)還構(gòu)建了包括驅(qū)動程序、開發(fā)工具和應(yīng)用程序在內(nèi)的全面生態(tài)系統(tǒng),。
從目前來看如果英偉達(dá)的RTX40系列顯卡在PC上能夠支持新的AI業(yè)務(wù),,那么未來仍將獨(dú)占這一百億級別的市場,甚至通過AI技術(shù)的升級,,進(jìn)一步擴(kuò)大個(gè)人pc市場中GPU的裝機(jī)率,,推動全球市場規(guī)模更上一個(gè)臺階。
2023年數(shù)據(jù)中心業(yè)務(wù)的增長速度驚人,,與AI大模型這一新興技術(shù)的爆發(fā)密切相關(guān),。然而,,AI大模型目前對全球科技市場來說仍處在非常早期的階段,未來的增長持續(xù)性到底如何,,對云端服務(wù)器的需求如何都未可知,。
而PC業(yè)務(wù),在過去30年中已經(jīng)走出了一條穩(wěn)定的增長曲線,。由此可想,,雖然英偉達(dá)勢必會重點(diǎn)投資更有利可圖且增長潛力更大的數(shù)據(jù)中心業(yè)務(wù),但一定也不會把早已站穩(wěn)腳跟的PC業(yè)務(wù)市場拱手讓人,。
RTX 40系列的機(jī)遇和挑戰(zhàn)
AIPC概念在市場上被熱炒,,很多廠商都在提出把AI落地到本地,從而降低云計(jì)算成本,、提高安全性和響應(yīng)效率,。這無疑給PC端的GPU創(chuàng)造了新的市場機(jī)遇。
英偉達(dá)在2024 CES上最新發(fā)布的GeForce RTX 40 SUPER系列顯卡中,,GeForce RTX 4080 SUPER在AI視頻生成上比GeForce RTX 3080 Ti快1.5倍,,圖片生成上快1.7倍。SUPER GPUs的Tensor Cores能夠?qū)崿F(xiàn)每秒高達(dá)836萬億次AI運(yùn)算(TOPS),,從而為游戲,、創(chuàng)作和日常生產(chǎn)力帶來變革性的AI能力。
NVIDIA AI Workbench則允許開發(fā)者快速創(chuàng)建,、測試和定制預(yù)訓(xùn)練的生成式AI模型和大型語言模型(LLM),。TensorRT-LLM是一個(gè)開源庫,用于加速PC上大型語言模型的運(yùn)行,。最新版本的TensorRT-LLM現(xiàn)已可用,,它為PC增加了更多預(yù)優(yōu)化模型,與其他推理后端相比,,運(yùn)行速度提高了多達(dá)5倍,。
此外,英偉達(dá)還發(fā)布了生成式AI驅(qū)動的語音和動畫模型在內(nèi)的NVIDIA ACE微服務(wù),,使開發(fā)者能夠向游戲中添加智能,、動態(tài)的數(shù)字化角色。此外,,NVIDIA還發(fā)布了“Chat with RTX”技術(shù)演示,,它允許AI愛好者通過所謂的“檢索增強(qiáng)生成”(RAG)技術(shù),輕松地將PC上的大型語言模型(LLM)連接到自己的數(shù)據(jù),。
這些新品都針對生成式AI做了大量優(yōu)化,,為GPU在未來的AIPC中發(fā)力提供了機(jī)會。
有趣的是,最近有研究團(tuán)隊(duì)發(fā)現(xiàn)RTX4090在一定條件下甚至有可能替代服務(wù)器級芯片,。
上海交通大學(xué)的研究團(tuán)隊(duì)就開發(fā)了一個(gè)名為PowerInfer的高性能CPU/GPU混合LLM推理引擎,。這款引擎大幅降低了對GPU內(nèi)存的需求,并減少了CPU與GPU之間的數(shù)據(jù)傳輸,,從而提高了整體效率,。可以在單個(gè)NVIDIA RTX 4090 GPU上運(yùn)行大型語言模型(LLM),,達(dá)到平均每秒產(chǎn)生13.20個(gè)token的速度,,峰值速度更是高達(dá)29.08 tokens/s,這與頂尖的A100 GPU服務(wù)器性能相差無幾,,僅低18%,,適用于多種LLM應(yīng)用場景。
PC端GPU在AI加持下雖然機(jī)遇巨大,。但在AIPC的大潮流中競爭也比高端GPU更激烈,。
如今,英偉達(dá)要面對的競爭中已經(jīng)不只有AMD和Intel了,。蘋果M系列芯片提出的統(tǒng)一內(nèi)存架構(gòu)(Unified Memory Architecture, UMA),,給生成式AI的預(yù)訓(xùn)練過程提供了一種選擇。
UMA允許CPU和GPU共享相同的物理內(nèi)存,,減少了數(shù)據(jù)在不同內(nèi)存之間的復(fù)制需求,,提高效率。此外蘋果的硬件優(yōu)化使其設(shè)備在執(zhí)行AI相關(guān)任務(wù)時(shí)能耗更低,。蘋果的硬件和軟件高度集成的特性,也為特定的AI應(yīng)用提供了更好的優(yōu)化空間,。
目前,,已經(jīng)有大量AI大模型開發(fā)者開始嘗試使用蘋果電腦訓(xùn)練大語言模型。最新款Mac Studio的頂配版本,,已經(jīng)可以訓(xùn)練700億參數(shù)的LLaMA2模型,。
不過,雖然UMA具備諸多優(yōu)勢,,但它更多地集中在蘋果自己的生態(tài)系統(tǒng)內(nèi),,與外部系統(tǒng)的兼容性可能有限。且相比專業(yè)的GPU,,蘋果的硬件可能在處理極其復(fù)雜的AI模型時(shí)有性能瓶頸,。
英偉達(dá)在AI領(lǐng)域深耕多年,擁有強(qiáng)大的技術(shù)積累和廣泛的應(yīng)用生態(tài),,這些都是蘋果短時(shí)間內(nèi)難以匹敵的,。盡管蘋果UMA可能在某些方面對英偉達(dá)構(gòu)成挑戰(zhàn),但英偉達(dá)的GPU在AI領(lǐng)域依然具有很強(qiáng)的競爭力。
PC業(yè)務(wù)能救中國市場嗎,?
黃仁勛在英偉達(dá)2024財(cái)年第三季度的財(cái)報(bào)電話中提到,,英偉達(dá)20-25%的業(yè)務(wù)來自中國,美國對中國的高端芯片制裁,,將會對英偉達(dá)造成嚴(yán)重影響,。
2023年8月,英國《金融時(shí)報(bào)》曾報(bào)道了一則中國云廠商搶購英偉達(dá)高端GPU的新聞,,稱百度,、字節(jié)跳動、騰訊和阿里巴巴四家公司合計(jì)向英偉達(dá)訂購了價(jià)值50億美元的AI芯片,。而受美國制裁法案的影響,,英偉達(dá)機(jī)會完全無法履行這些訂單。
為了保住中國業(yè)務(wù),,英偉達(dá)再度開始積極設(shè)計(jì)3款”中國特供“芯片,。
某國內(nèi)服務(wù)器制造商近期曾向虎嗅透露,芯片限制政策對國內(nèi)服務(wù)器生產(chǎn)沒有影響,,因?yàn)椴还苡ミ_(dá)推出什么芯片,,服務(wù)器要做的只是適配NV-Link。目前搭載新的“中國特供”芯片的服務(wù)器已經(jīng)接受了很多客戶的下單,,不過受到美國政府加強(qiáng)管制的影響,,原本計(jì)劃2024年1月到貨的“中國特供”,現(xiàn)在看肯定要延后了,。
有消息稱,,拜登政府已經(jīng)開始調(diào)查英偉達(dá)為中國開發(fā)的三款新型AI芯片的具體細(xì)節(jié)。美國商務(wù)部長吉娜·雷蒙多在接受外媒采訪時(shí)談道:“我們會檢查每一個(gè)新芯片的每一個(gè)規(guī)格,,顯然是為了確保它不違反出口管制,。”
雷蒙多說,,英偉達(dá)“能夠,、愿意、也應(yīng)該向中國出售AI芯片,,因?yàn)榇蠖鄶?shù)AI芯片將用于商業(yè)應(yīng)用”,,但“我們不能允許他們運(yùn)送最復(fù)雜、處理能力最高的AI芯片,,這將使中國能夠訓(xùn)練他們的前沿模型”,。她強(qiáng)調(diào)說不能向中國企業(yè)出售其最先進(jìn)的半導(dǎo)體,并表示將不斷更新出口管制規(guī)則,。
美國對中國的芯片封鎖,,與其說是在制裁中國,倒不如說是在制裁英偉達(dá)。
1月7日,,美國《華爾街日報(bào)》以“英偉達(dá)在中國的新困境,,客戶不想要它的降級芯片”為題,報(bào)道了英偉達(dá)為應(yīng)對拜登政府出口限制,,向中國出售降級特供版AI芯片,,但中國客戶不感興趣的最新困境。
事實(shí)上,,RTX40系列顯卡在中國的銷售也未必會一帆風(fēng)順,,有消息稱,目前英偉達(dá)在中國可以銷售的最高端芯片為RTX 4090D,,這款新芯片比RTX4090的性能低了5%左右,。英偉達(dá)介紹該產(chǎn)品將從2024年1月起陸續(xù)在中國上市。
有知情人士向虎嗅透露,,為了緩和與中國客戶的關(guān)系,,英偉達(dá)在積極開發(fā)“中國特供”的同時(shí),也在與中國服務(wù)器廠商協(xié)商,,希望能在中低端服務(wù)器,,以及PC業(yè)務(wù)方面做出一些讓步,從而在不取消訂單的情況下,,用其他產(chǎn)品替代已經(jīng)下單但不能發(fā)貨的高端芯片產(chǎn)品,。
雖然對于中國的AI公司來說,沒有全面封鎖GPU芯片就等于斷了AI研發(fā)的電,。但這對中國的芯片企業(yè)來說,,或許是一個(gè)好消息。