GPGPU似乎是最近幾年才流行起來(lái)的,,外行人聽(tīng)著感覺(jué)是比GPU還要厲害的東西,。事實(shí)上,,GPGPU是英文General-Purpose computing on Graphics Processing Units的縮寫(xiě),,中文譯為通用圖形處理器,,可以理解為是GPU的一個(gè)分支。
從歷史的角度來(lái)看,,GPU的產(chǎn)生是為了解決游戲中圖形渲染效率的問(wèn)題,,但是隨著圖形芯片技術(shù)的不斷迭代,GPU的處理功能和計(jì)算能力不斷提升,。2001年,,得益于shader的出現(xiàn),GPU在圖形流水線中引入了可編程性,,從此GPU能做的事情不再局限于圖形數(shù)據(jù)的處理,,而將觸角延伸至其他計(jì)算密集的領(lǐng)域,開(kāi)啟了GPGPU時(shí)代,。
跳過(guò)GPU
本土廠商為何選擇自研GPGPU,?
有人說(shuō),沒(méi)了圖形渲染的GPGPU不過(guò)是一款專(zhuān)用的ASIC,,真的是這樣嗎,?在2021年中國(guó)集成電路設(shè)計(jì)創(chuàng)新大會(huì)上,筆者也對(duì)該問(wèn)題進(jìn)行了提問(wèn),。沐曦集成的CEO陳維良是這樣回復(fù)的,,“ASIC的設(shè)計(jì)是偏離通用GPU架構(gòu)的,其軟件適配靈活性將面臨很大的挑戰(zhàn),,產(chǎn)品的應(yīng)用生命周期也比GPGPU短,。”這意味著GPGPU和ASIC從底層架構(gòu)上就能區(qū)別是兩種技術(shù),,各自服務(wù)于相應(yīng)的應(yīng)用場(chǎng)景,,并不能混為一談。
圖源 | 沐曦集成官網(wǎng)
至于“跳過(guò)GPU,,直接選擇GPGPU新戰(zhàn)場(chǎng)”的原因,,陳維良表示,“全球GPU市場(chǎng)已經(jīng)形成半壟斷局面,,再加上圖形渲染是一個(gè)存量市場(chǎng),,正面交鋒實(shí)屬不易,選擇增量市場(chǎng)的計(jì)算型GPU,,也就是我們說(shuō)的GPGPU,,也許是明智之舉?!?/p>
事實(shí)上,,跳過(guò)GPU的說(shuō)法本身就不是很準(zhǔn)確。從GPU體系架構(gòu)的角度來(lái)看,,我們可以把GPGPU分為三大家族,。
傳統(tǒng)GPU
主導(dǎo)者包括英偉達(dá)和AMD/ATI,這類(lèi)架構(gòu)有一個(gè)顯著的特性,,那就是包含大量結(jié)構(gòu)簡(jiǎn)單的處理核心構(gòu)成的陣列,。它會(huì)以高度并行化的方式批量處理數(shù)據(jù),這些帶有向量特征的處理陣列是由傳統(tǒng)GPU中的多條并行的渲染管線發(fā)展而來(lái),。此外,,這類(lèi)GPGPU中仍或多或少地存在一些專(zhuān)用于圖像處理的部件,如紋理Cache、幀緩沖等,。但是,,隨著通用計(jì)算的需求日益顯著,GPGPU正越來(lái)越專(zhuān)注于通用計(jì)算能力,,而漸漸弱化其作為顯卡的功能,。
傳統(tǒng)多核CPU
典型代表是以CPU著稱(chēng)的Intel,它的架構(gòu)理念是對(duì)傳統(tǒng)CPU核心進(jìn)行裁剪,,從而得到相對(duì)輕量級(jí)的處理核心,,構(gòu)成其計(jì)算部件。這樣做的優(yōu)點(diǎn)是可以兼容部分傳統(tǒng)CPU的指令集,,它的缺點(diǎn)是相對(duì)于上述GPGPU中的細(xì)粒度處理單元,,這類(lèi)處理核心仍然比較復(fù)雜,因此核心的集成度遠(yuǎn)不及第一家族的GPGPU,。
GPU和CPU聯(lián)姻產(chǎn)物
融合了GPU和CPU的架構(gòu)特色,,典型的代表是AMD的APU產(chǎn)品系列。這類(lèi)架構(gòu)的做法是將GPGPU中的處理陣列直接作為CPU的加速部件集成到同一顆芯片內(nèi),。這樣做帶來(lái)了兩大好處:
CPU核心的融入增強(qiáng)了GPGPU的標(biāo)量處理能力,,更適合通用計(jì)算的要求;
融合的結(jié)構(gòu)可緩解GPGPU和CPU之間的通信帶寬受限問(wèn)題,。
此外,,英偉達(dá)作為一家美籍華人創(chuàng)立的公司,其實(shí)并沒(méi)有把太多的研發(fā)工作投在中國(guó),,所以從人才組成的角度,,我國(guó)做GPGPU的創(chuàng)業(yè)者大部分來(lái)自AMD、Imagination和Intel,,其中AMD占主導(dǎo),。事實(shí)上,這些本土公司在做GPGPU時(shí),,他們的研發(fā)人員之前都經(jīng)歷過(guò)GPU相關(guān)技術(shù)的研發(fā),,因此從技術(shù)的角度來(lái)說(shuō),并沒(méi)有跳過(guò)GPU,,而站在市場(chǎng)的角度,,面對(duì)數(shù)據(jù)爆發(fā)時(shí)代的到來(lái),自研GPGPU是順應(yīng)市場(chǎng)自然選擇的結(jié)果,。
頭部站隊(duì)初步形成
國(guó)產(chǎn)GPGPU正醞釀一場(chǎng)“大落地”
根據(jù)不完全統(tǒng)計(jì),,中國(guó)大陸大約有7家相對(duì)主流的GPGPU公司,它們分別是天數(shù)智芯,、登臨科技,、壁仞科技、摩爾線程、珠海芯動(dòng)力,、沐曦集成和紅山微電子,。
為什么說(shuō)頭部戰(zhàn)隊(duì)已經(jīng)基本形成呢?因?yàn)镚PGPU的技術(shù)開(kāi)發(fā)難度是很高的,?!巴ǔI(yè)內(nèi)一款高端芯片的前端和后端設(shè)計(jì)要耗時(shí)1~3年,,設(shè)計(jì)完成后的流片環(huán)節(jié),,需要3~6個(gè)月,還會(huì)有流片失敗一切重來(lái)的風(fēng)險(xiǎn),。即使成功流片,,仍然還需要經(jīng)過(guò)3~12個(gè)月的產(chǎn)品測(cè)試調(diào)優(yōu),才能最終開(kāi)啟量產(chǎn),?!?天數(shù)智芯董事長(zhǎng)兼CEO刁石京如是說(shuō)。
舉個(gè)例子,,強(qiáng)如intel,,從1997年開(kāi)始布局,通過(guò)收購(gòu)C&T,,入股Real3D后,,在1998年推出了第一款獨(dú)立GPU i740后就少有成果,直到2007年眼紅英偉達(dá)的GPGPU市場(chǎng),,開(kāi)始重啟GPU計(jì)劃,,推出產(chǎn)品Larrabee,可惜性能價(jià)格都沒(méi)有競(jìng)爭(zhēng)力,,再到2020年又推出了全新的獨(dú)立GPU架構(gòu)Xe,,可惜截至目前,Intel仍未推出自己消費(fèi)級(jí)的獨(dú)立GPU產(chǎn)品,。
由此可知,,GPGPU市場(chǎng)準(zhǔn)入門(mén)檻是很高的,而目前從大廠出來(lái)有這方面技術(shù)積累,,又能拉到投資的人基本流動(dòng)得差不多了,。此外,我們知道GPGPU的工藝要用上12nm,、7nm甚至5nm技術(shù),,除了高端技術(shù)人員的薪資支出以外,流片的成本也非常之高,,高投入意味著必須要高產(chǎn)出才能盈利,,因此產(chǎn)品落地量產(chǎn)勢(shì)在必行。而這些本土的GPGPU廠家大多面向數(shù)據(jù)中心和云端市場(chǎng),頭部可以配合“拉練”的客戶(hù)梯隊(duì)也都已經(jīng)形成,,后面再擠入困難有些大,。
天垓100
圖源 | 天數(shù)智芯官網(wǎng)
結(jié)合上述論點(diǎn),我們來(lái)看一下本土GPGPU廠商的進(jìn)展情況,。
從產(chǎn)品落地的角度來(lái)看,,目前只有天數(shù)智芯宣布其首款云端7nm GPGPU產(chǎn)品卡——“天垓100”已正式進(jìn)入量產(chǎn)環(huán)節(jié)(今年10月29日的消息),單芯算力每秒147T@FP16,。緊隨其后的是登臨科技,、珠海芯動(dòng)力和壁仞科技。
登臨科技在7月14日宣布其首款GPU+產(chǎn)品已成功回片通過(guò)測(cè)試,,開(kāi)始客戶(hù)送樣,;珠海芯動(dòng)力的聯(lián)合創(chuàng)始人李原在今年7月份透露,其第一款應(yīng)用于邊緣服務(wù)器的芯片R8已經(jīng)流片,,采用三星14nm工藝,,算力達(dá)到32 TOPS,功耗小于14W,;壁仞科技在今年的10月8日宣布其首款7nm GPGPU——BR100已正式交付臺(tái)積電流片,,預(yù)計(jì)將于明年面向市場(chǎng)發(fā)布。
接下來(lái)是摩爾線程,,摩爾線程在11月25日的發(fā)布中只表明其首顆國(guó)產(chǎn)全功能GPU研制成功,,換句話(huà)說(shuō)流片、測(cè)試,、聯(lián)調(diào)等等都還是后頭的事兒,。
至于另外兩家,沐曦集成和紅山微電子,,成立的日期相對(duì)較晚,,目前應(yīng)該還在初代產(chǎn)品研發(fā)階段。值得一提的是,,沐曦集成的研發(fā)隊(duì)伍還是很強(qiáng)大的,,其創(chuàng)始人陳維良曾任AMD圖形研發(fā)高級(jí)總監(jiān),CTO楊建為前AMD Fellow,,所以未來(lái)躋身前三的機(jī)會(huì)也很大,。
當(dāng)然,前面只是根據(jù)各家企業(yè)產(chǎn)品落地的情況進(jìn)行了梳理,,至于他們所用的產(chǎn)品架構(gòu),、工藝制程、算力,、能效比,、面向的細(xì)分市場(chǎng)以及公司戰(zhàn)略等都不在考慮的范圍內(nèi),,要是都考慮進(jìn)來(lái),可能這個(gè)進(jìn)度又得推翻重來(lái),。不過(guò)從這些廠商的產(chǎn)品發(fā)布進(jìn)度來(lái)看,,目前大家都想當(dāng)“第一”,可以說(shuō)是正在醞釀一場(chǎng)“趕集式”的大落地,。
GPGPU的下游市場(chǎng)在哪里,?
廠商的紛紛投入,離不開(kāi)投資界的推動(dòng),,更離不開(kāi)下游市場(chǎng)的需求,。
據(jù)公開(kāi)數(shù)據(jù)顯示,目前中國(guó)GPGPU 90%的市場(chǎng)都被以英偉達(dá)為代表的外企瓜分,,僅2019年,,英偉達(dá)和AMD兩大美企就在國(guó)內(nèi)GPGPU市場(chǎng)賺走了約80億元。半壟斷市場(chǎng)帶來(lái)的是高售價(jià),,當(dāng)前一塊高端的GPGPU板卡,市場(chǎng)售價(jià)高達(dá)十幾萬(wàn)元,,相當(dāng)于一輛普通小轎車(chē)的價(jià)格,。與此同時(shí),有專(zhuān)家預(yù)測(cè),,到2025年,,我國(guó)GPGPU芯片板卡的市場(chǎng)規(guī)模將達(dá)458億元,年復(fù)合增長(zhǎng)率高達(dá)32%,。由此可見(jiàn),,GPGPU產(chǎn)品國(guó)產(chǎn)化勢(shì)在必行。
那么有人要問(wèn)了,,國(guó)內(nèi)GPGPU的市場(chǎng)需求到底分布在哪些行業(yè)呢,?根據(jù)業(yè)內(nèi)人士提供的中國(guó)GPGPU出貨量行業(yè)結(jié)構(gòu)信息顯示,2019年接近一半的GPGPU用于互聯(lián)網(wǎng)市場(chǎng),,三分之一左右的GPGPU用于安防和政府市場(chǎng),,十分之一左右的GPGPU用于其他行業(yè)的AI應(yīng)用,接近十分之一的GPGPU用于HPC市場(chǎng),。當(dāng)然這是2019年的數(shù)據(jù),,現(xiàn)在的情況可能會(huì)有所調(diào)整,比如HPC的比重有所增加等等,。
寫(xiě)在最后
英偉達(dá)3000億美元市值,、AMD 1000億美元市值,中國(guó)的GPGPU市場(chǎng)規(guī)模和賽道都足夠大,,也許三五年后,,本土也能做出個(gè)“小英偉達(dá)”,、“小AMD”來(lái)。所以說(shuō),,國(guó)產(chǎn)GPGPU的下一步考驗(yàn)的是如何做大,?而除了持續(xù)融資提供經(jīng)濟(jì)動(dòng)力外,這些公司所有的競(jìng)爭(zhēng)力都將聚焦于一點(diǎn),,那就是產(chǎn)品高性能下的性?xún)r(jià)比,,性?xún)r(jià)比決定出貨量,出貨量代表市場(chǎng)的認(rèn)可,,市場(chǎng)帶來(lái)資金活水,,從而形成良性循環(huán)。