GTC 2022過后,,廣大人民群眾紛紛奔走相告,黃仁勛又帶著他的新“核彈”來“炸街”了。
具體發(fā)布的新產(chǎn)品和技術(shù),,很多文章都已經(jīng)詳盡地介紹過了,,一言以蔽之:牛,!其中最炸裂的是H100 GPU,,采用了臺積電4納米制程工藝,,集成1800億個晶體管,,浮點計算能力相比前一代A100快了三倍,被看作英偉達的新一代“核彈”,。
一時間鑼鼓喧天,、鞭炮齊鳴,工業(yè)界盼到了“算力怪獸”,,消費者們也迎來了顯卡降價的日子,。
但冷靜下來想一想,英偉達是“為AI繼算力,,為眾人送溫暖”的大善人嗎,?無論粉絲還是看客,,都必須承認,英偉達是一個商業(yè)奇才,。作為最傳奇的數(shù)字經(jīng)濟股,,它的營收遠低于英特爾或Meta,,但市值卻遙遙領(lǐng)先,,這顯然不是“技術(shù)信仰”所能夠解釋的。
用黃仁勛本人的說法,,英偉達歷史上幾次具有里程碑意義的關(guān)鍵技術(shù)推出,,背后其實都是對自家 GPU 技術(shù)的發(fā)展成果進行了“泛化”(generalize),發(fā)現(xiàn)它居然可以做更多不同的事情,。
究竟是新需求催生了新產(chǎn)品,,還是新產(chǎn)品激活了新需求,這是一個“雞生蛋蛋生雞”的問題,。但我們可以從英偉達的行動與結(jié)果的相關(guān)性中,,總結(jié)出一個屢試不爽的模板:
在主流需求未曾觸頂?shù)臅r候,擴充豐富產(chǎn)品線,,哪怕“穿馬甲”也要全面布局,,將利基市場挖掘到最大價值;而一旦主流需求出現(xiàn)頹勢和退潮,,超過當(dāng)前市場需求的核彈級產(chǎn)品就會被拋出(當(dāng)然功耗也爆炸了),,再次點燃大眾和華爾街對GPU的想象空間,進一步英偉達的估值推向新高,。
比起“卷王之王”,,英偉達更像是穩(wěn)坐釣魚臺的姜太公,把全球消費者和產(chǎn)業(yè)界拿捏得明明白白,。
四次供需“反彈”,,英偉達的算力霸主之路
英偉達的算力霸主地位,究竟是怎么實現(xiàn)的呢,?細數(shù)歷史上的幾次里程碑事件,,會發(fā)現(xiàn)有四次關(guān)鍵“反彈”。
第一次反彈:個人電腦的增長風(fēng)暴,。
從1993年成立到1999年這段時間里,,英偉達在群雄林立的顯卡市場中并沒有占據(jù)太大的領(lǐng)先優(yōu)勢。
當(dāng)時研發(fā)顯示芯片的廠商多如牛毛,,除了IBM,、索尼、東芝等半導(dǎo)體巨頭,,垂直賽道如Matrox,、3dfx,、Trident、S3 Graphics都曾引領(lǐng)風(fēng)騷,。英偉達先后發(fā)布的NV1,、NV2都沒有什么競爭力,差點破產(chǎn),。1999發(fā)布的TNT2(也就是“NV5”)雖然奪得了性能桂冠,,但速度只比NV4提高了10%至17%,跟主要競爭對手3dfx Vodoo3也沒有拉開差距,。
于是,,第一個“核彈”來了,英偉達推出了NV10,,也就是GeForce 256——第一款專業(yè)圖形處理核心,,直接轟開了個人電腦游戲加速的市場。
在此之前,,GPU顯示芯片都屬于固定功能的芯片,,而GeForce 256的出現(xiàn),成為了第一款“集成了轉(zhuǎn)換,、照明,、三角形設(shè)置/剪裁和渲染引擎的單芯片處理器”,能夠每秒處理至少1000萬個多邊形,,讓GPU可以從CPU手里接管大量幾何運算的工作,,解決通用計算無法解決的問題,極大地推動了PC游戲,、創(chuàng)意設(shè)計等對GPU的需求,。
為了充分發(fā)揮GeForce 256的計算潛力,英偉達還基于該芯片推出了Quadro框架,,服務(wù)于專業(yè)繪圖工作站,,用來幫助創(chuàng)意和技術(shù)人員更高效地工作。隨后又推出了可編程 shader,,讓開發(fā)者可以在GPU上發(fā)揮更多創(chuàng)意,,比如3D渲染、游戲開發(fā),、特效制作等……
用黃仁勛的話來說就是:鼓勵或者調(diào)動全球人民的激情,,讓他們了解什么叫三維的圖形處理器,給他們提供很多工具進行創(chuàng)新,。
GeForce256發(fā)布的第二年,,英偉達就接到了微軟的訂單,為Xbox視頻游戲機開發(fā)顯卡。此后靠的則是“半年更新,、一年換代”的市場操作,。GeForce系列產(chǎn)品線不斷豐富、全面布局,,覆蓋了高中低端各類市場,,還學(xué)會了穿“馬甲”,在原有芯片基礎(chǔ)上稍作提升和改進,,就作為新系列快速推向市場,。將競爭對手卷得苦不堪言,英偉達也因此占據(jù)了GPU市場70%以上的份額,。
到了2007年,,英偉達市值已經(jīng)上漲了500%以上,被《福布斯》雜志評為年度公司,。
第二次反彈:并行計算的強勁推力。
早在2006年,,英偉達就推出了革命性的通用計算架構(gòu)CUDA,,以及通用計算硬件Tesla GPU。但在當(dāng)時,,深度學(xué)習(xí)并沒有現(xiàn)在這般受歡迎,,只有一些大型企業(yè)、研究機構(gòu)需要GPU來進行藥物發(fā)明,、天氣建模,、金融分析等高性能計算任務(wù)。
英偉達是從何時起開始加大力度激活對GPU并行計算能力的需求呢,?答案是2009年,。
這一年,英偉達舉辦了首屆“GPU技術(shù)會議”,,面向“使用GPU解決重要計算工作的開發(fā)者,、工程師和科研人員”布道。
2006-2009年間,,市場發(fā)生了什么變化,?受摩爾定律的統(tǒng)治,個人消費者對電腦顯卡的性能需求開始倦怠了,。
期間,,英偉達其實也有不錯的產(chǎn)品發(fā)布,比如重量級的Tegra移動處理器,,集成了ARM架構(gòu)處理器和Geforce GPU,,功耗比普通PC筆記本電腦低30倍。產(chǎn)品雖好,卻很難激發(fā)起消費者的澎湃熱情,,畢竟市場上還有那么多顯卡在賣,,只要愿意等,就能以更香的價格入手,。
同時,,因為一些被OEM整合到蘋果、戴爾,、惠普的筆記本當(dāng)中的GPU缺陷,,導(dǎo)致“異常故障率”而成為集體訴訟的對象。僅2008年第一季度,,英偉達的收入減少了約2億美元,。股價也從37美元一路跌到6美元左右。
于是英偉達開始加大高性能計算領(lǐng)域的布局,,在首屆GPU技術(shù)會議上,,推出了代號為 “Fermi” 費米的下一代CUDA GPU架構(gòu),并大力宣傳GPU在大規(guī)模并行計算任務(wù)的優(yōu)勢,。
費米架構(gòu)作為“核彈”是稱職的,,一方面,它的性能很高,,基于該架構(gòu)的Geforce 4系列產(chǎn)品在性能上成功壓制了競爭對手,,但這一架構(gòu)的功耗和發(fā)熱量也十分恐怖。
無論如何,,自此之后,,英偉達在計算領(lǐng)域廣受歡迎,2010年全球最快的超級計算機天河-1A,,就采用了7168顆英偉達的Tesla M2050 GPU,,將大規(guī)模并行GPU與多核CPU結(jié)合,成為當(dāng)時異構(gòu)計算的代表,。
2012年深度學(xué)習(xí)三巨頭之一Geoffrey Hinton及其學(xué)生Alex,,使用GPU來加速訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),在ImageNet競賽中一鳴驚人,,掀開了人工智能第三次浪潮的大幕,,進一步帶動了英偉達GPU的銷量。
AI需求的增長,,還幫助英偉達開拓了汽車市場,,緊接著2013年發(fā)布的Geforce GTX Titan泰坦,代表了開普勒架構(gòu)的頂級水準(zhǔn),,成為自動駕駛汽車和高級駕駛輔助系統(tǒng)的算力基礎(chǔ),,支撐關(guān)鍵的計算機視覺功能,。
人工智能從學(xué)術(shù)界到工業(yè)界的強勁需求,推動了GPU價格和英偉達股價水漲船高,,完成了一次驚艷世界的“反彈”,。
第三次反彈:礦難之后,圖靈破局,。
英偉達在深度學(xué)習(xí)領(lǐng)域的身位持續(xù)領(lǐng)先,,但別忘了,規(guī)模龐大的零售市場可是現(xiàn)金牛啊,。
2018年8月14日的SIGGRAPH 2018上,,英偉達全新一代“圖靈”架構(gòu)GPU問世,支持實時光線追蹤,,專用于AI加速計算的張量核心首次加入了民用3D計算產(chǎn)品,,為游戲世界帶來了逼真的照明和反射效果。
在此之前,,普通消費者早就“苦挖礦久矣”,。
數(shù)字貨幣的爆火,讓挖礦成了一門好生意,,GPU被“礦廠”大量收購,,一時間供不應(yīng)求,加上黃牛囤積居奇,,導(dǎo)致顯卡的市場價格比零售價格高出了好幾倍,普通消費者只能望洋興嘆,。直到時間進入2018年,,數(shù)字貨幣的潮水逐漸褪去,礦卡銷量急劇下滑,,顯卡庫存增加,,一卡難求的局面有所緩解。
顯卡廠商不僅面臨降價殺估值的壓力,,隨著大量礦卡流通到零售渠道中,,還亟須打消消費者持幣觀望的情緒。這個時候,,黃仁勛帶著“英偉達十多年來在計算機圖形領(lǐng)域最重要的創(chuàng)新”,,再一次刺激了市場。
全新的技術(shù)和架構(gòu),,將GPU的性能和英偉達的市值,,又推到了一個全新的高度。
第四次反彈:幣圈走熊,,但產(chǎn)業(yè)智能方興未艾,。
今年最大的變化,是缺芯情況有所緩解,同時幣圈再次走熊,,比特幣和以太坊價格都創(chuàng)下新低,,GPU價格再一次回落。根據(jù)國外媒體報道,,英偉達已經(jīng)通知合作伙伴 GPU 的生產(chǎn)成本將下調(diào) 8% - 12%,。如果顯卡價格進一步下降,市場對英偉達的信心也會過度反映到股價上,。
不過,,你永遠可以相信英偉達“核彈工廠”的能力。誠如大家在GTC 2022大會所看到的,,全新一代產(chǎn)品和技術(shù)全部瞄準(zhǔn)了最具想象空間的產(chǎn)業(yè)AI應(yīng)用場景,。
最新一代“核彈”H100 GPU,和Hopper 架構(gòu),,專為Transformer大參數(shù)模型打造,,可以說是完美迎合了預(yù)訓(xùn)練大模型的需求。
NVIDIA Quantum-2,,主芯片包含570億個晶體管,,為云服務(wù)商和超算中心提供AI算力,正對應(yīng)著如火如荼的AI基礎(chǔ)設(shè)施建設(shè),。
AI超級計算機NVIDIA Jetson AGXOrin,,簡直是自主機器人研發(fā)人員“捕獲器”。
更不要提開放式平臺 NVIDIA Omniverse,,試問哪個想做元宇宙的公司能不心動呢,?Meta就用英偉達DGX A100系統(tǒng)構(gòu)建了自己的首臺AI超級計算機。
憑借這幾個“大餅”,,黃仁勛也在GTC大會上自信地指出,,英偉達未來有能力實現(xiàn)萬億美元的銷售收入,可以說是完美化解(或者說讓大眾忽略)了GPU市場波動,。
英偉達的“核彈”背后,,都是跟隨著GPU市場變動,不斷創(chuàng)造需求,、刺激供給的過程,。商業(yè)價值不斷飆升的同時,確實給GPU技術(shù)帶來了巨大提升,。
這能說明,,黃仁勛是“商業(yè)奇才”嗎?恐怕不行,。
姜太公釣魚,,把反彈效應(yīng)玩明白了
憑借GPU在圖形計算上的貢獻,,黃仁勛也被江湖人稱“AI教父”,甚至一度想要干掉摩爾定律,,推動自己的“黃氏定律”主宰計算市場,。
但其實從四次供需“反彈”中可以看到,英偉達不過是把摩爾定律的“反彈效應(yīng)”拿捏得明明白白了,。
所謂“反彈效應(yīng)”(Rebound effect),,也被叫做“收回效應(yīng)”(take-back effect),最早是由威廉·斯坦利·杰文斯在《煤炭問題》一書中提出的,,指的是提高效率的新技術(shù),,最終預(yù)期收益減少的情況。
放在IT領(lǐng)域,,就是“What Andy gives,,Bill takes away”安迪(英特爾CEO安迪·格羅夫)帶來的CPU硬件性能提升,最終會由比爾(微軟CEO比爾蓋茨)通過軟件/服務(wù)不斷擴大而收回,。
結(jié)果就是,,雖然摩爾定律會推動計算硬件不斷提效降價,但因為“反彈效應(yīng)”,,不斷產(chǎn)生新的需求/應(yīng)用/場景,,吃掉硬件性能提升帶來的好處。
只有這樣,,用戶才會愿意掏錢更新機器,,以便能享用到更新更消耗資源的服務(wù)。
回望個人電腦,、智能手機的發(fā)展歷程,,無不是在摩爾定律及其反彈效應(yīng)下發(fā)展起來的。而英偉達所在的GPU市場,,顯然沒有脫離這一范疇。
一方面,,英偉達的產(chǎn)品性能提升速度,,雖然超過了摩爾定律所規(guī)定的“18個月翻一倍”,實現(xiàn)了AI計算性能的逐年翻倍,,也就是“黃氏定律 (Huang’s Law)”,。但從最新一代H100 GPU的性能提升上,顯然還依賴于延續(xù)了半個多世紀(jì)的半導(dǎo)體制程工藝限制,,采用了臺積電的4nm(而非此前業(yè)界猜測的5nm)工藝,,再結(jié)合全新的架構(gòu)設(shè)計,才能達到“核彈”級別,。
另外,,性能提升必須通過新的服務(wù)/應(yīng)用“take back ”,,不然用戶只需要等相同性能的GPU降價就可以了,沒有必要花大價錢去買新的,。這也是為什么AI大模型訓(xùn)練,、自動駕駛、元宇宙,、機器人……作為GTC大會的“全家桶”才會同時登場,,通過各行各業(yè)的智能化來消耗掉新技術(shù)帶來的AI算力資源。
黃仁勛也曾在采訪中提到過,,英偉達“甚至用了市場營銷的預(yù)算,,幫開發(fā)者營銷他們用我們架構(gòu)開發(fā)的產(chǎn)品,來創(chuàng)造市場需求”,。
所以說,,英偉達的每一次“核彈”炸街,其實都是在硬件性能回收出現(xiàn)不順利的時候,,再一次開辟出更大的需求空間,,以緩解技術(shù)收益減少的局面。
“What NVIDIA gives,,AI takes away”,,英偉達靠這一手,把全球玩家和華爾街投資人拿捏得明明白白,,市值也就次次化險為夷“穩(wěn)坐釣魚臺”了,。
愿者上鉤:自己卷自己有什么問題嗎?
某種角度來說,,英偉達對“反彈效應(yīng)”和大眾需求的拿捏,,是“姜太公釣魚,愿者上鉤”,。只要研究人員覺得模型訓(xùn)練時間從十幾天縮短到幾個小時很值,;只要游戲玩家覺得更逼真的渲染效果真香;只要Meta覺得GPU對元宇宙來說不可或缺……這不就夠了嗎,?
確實,,乍一看,好像通過刺激需求來避免技術(shù)收益降低,,是在和大家作對,,但實際上,科技企業(yè)對反彈效應(yīng)的努力規(guī)避,,也會帶來很多衍生好處,。
一方面,新技術(shù)的反彈效應(yīng)是不可避免的,。
這會直接降低技術(shù)產(chǎn)品的成本,,除非你是追逐最新顯卡的發(fā)燒友游戲玩家,,否則只要愿意等待,總能以更低的價格買到更高性能的GPU,,誰跟真金白銀有仇呢,?
此外,為了避免新技術(shù)收益降低,,科技企業(yè)不得不投入大量精力開發(fā)下一代產(chǎn)品,,卷過了競爭對手還不行,還得自己卷自己,。如今英偉達已經(jīng)占據(jù)GPU的絕對優(yōu)勢地位,,但依然在不斷推陳出新,不然就要被罵“擠牙膏”,。對于有替換需求的群體來說,,總有更好的產(chǎn)品可以選擇。
同時,,更高的性能和資源,,也會孕育出很多前所未有的應(yīng)用和服務(wù),計算機剛誕生時格外昂貴,,只能為美國頂尖大學(xué)研究機構(gòu)所用,,而且還只會下棋,現(xiàn)在一部千元手機就可以讓偏遠山區(qū)的農(nóng)民上網(wǎng)直播賣水果,。同樣,,我們往后看五到十年,如果自動駕駛汽車的比例從現(xiàn)在的不到1%變成50%,,人們停留在元宇宙的時間和現(xiàn)在玩手機一樣頻繁,,那么這會催生多少新興的服務(wù)和商業(yè)公司呢?
黃仁勛本人曾回憶第一個GPU產(chǎn)品的研發(fā)過程,,他說:“可能也沒有人知道自己需要什么,。因為事情經(jīng)常是這樣,你沒看到過一個東西,,就不會知道自己是否需要,。”
不過回想一下,,很多曾經(jīng)我們以為可有可無的功能,比如視頻通話,、在線直播,、高清視頻……在今天都已經(jīng)成為必備功能。需求確實是可以被創(chuàng)造的,,不過,,需求也有輕重緩急,,英偉達不斷甩出的“魚鉤”,對你是否有吸引力呢,?