從早期“百家爭雄”,,到英偉達“一統(tǒng)江湖”,,再到如今AMD,、英特爾欲“三分天下”,。
GPU在技術(shù)與市場的不斷變換輪轉(zhuǎn)中,,迎來一次次蛻變與重塑,。
GPU(Graphic Processing Unit),,圖形處理器,,又稱顯示核心,、視覺處理器、顯示芯片,,是一種專門在個人電腦,、工作站、游戲機和一些移動設(shè)備上做圖像和圖形相關(guān)運算工作的微處理器,。
由于可視化需要大量的圖形,、圖像計算能力,無論是云端還是邊緣側(cè)都需要大量的高性能圖像處理能力,,因此近年來GPU實現(xiàn)了較快的市場增速,。同時,隨著GPU自身在并行處理和通用計算的優(yōu)勢,,逐步拓展了其在服務(wù)器,、汽車、礦機,、人工智能,、邊緣計算等領(lǐng)域的衍生需求。
據(jù)數(shù)據(jù)統(tǒng)計,,2020年全球GPU行業(yè)規(guī)模為200億美元,,預(yù)計2021年將增長15%,。從2015年到2025年,GPU行業(yè)預(yù)計平均每年增長13%,,將從80億美元擴展到350億美元的規(guī)模,。
GPU可以按照兩種方式進行分類:按照接入方式可以分為集成GPU和獨立GPU,集成GPU將圖形核心以單獨芯片的方式集成在主板上或CPU芯片上,,并且動態(tài)共享部分系統(tǒng)內(nèi)存作為顯存使用,,因此能夠提供簡單的圖形處理能力,以及較為流暢的編碼應(yīng)用,;獨立GPU擁有單獨的圖形核心和獨立的顯存,,能夠滿足復(fù)雜龐大的圖形處理需求,并提供高效的視頻編碼應(yīng)用,。
另一種是根據(jù)應(yīng)用端的不同可以分為PC GPU,、移動GPU和服務(wù)器GPU。PC GPU是用于PC端,,既有獨立也有集成,;移動GPU用于移動端,一般都是集成,;服務(wù)器GPU是專為計算加速或深度學(xué)習(xí)應(yīng)用的獨立GPU,。
GPU分類及代表廠商
GPU發(fā)展歷程,英偉達一統(tǒng)江湖
GPU的誕生和演進
在PC誕生之初,,并不存在GPU這個概念,,所有的圖形和多媒體運算都由CPU負責(zé)。但是由于X86 CPU的暫存器數(shù)量有限,,適合串行計算而不適合并行計算,。以英特爾為代表的廠商多次推出SSE等多媒體拓展指令集試圖彌補CPU的缺陷,但僅僅在指令集方面的改進起不到根本效果,,所以誕生了圖形加速器作為CPU的輔助運算單元,。
追溯GPU的歷史,要從圖形顯示控制器說起,。世界上第一臺個人電腦IBM5150于1981年由IBM公司發(fā)布,,這臺PC搭載了黑白顯示適配器(MDA)和彩色圖形適配器(CGA),這便是最早的圖形顯示控制器,。后來,,IBM又推出EGA,并于1987年提出了VGA標準,,VGA在文字模式下可支持720×400分辨率,,繪圖模式下可支持640×480×16色和320×200×256色輸出,為了保證兼容性,,當今的顯卡依然會遵循VGA標準,。
從MDA到VGA,,圖形圖像的運算都由CPU來完成,圖形卡的作用主要是將其顯示出來,。1991年,,S3 Graphics推出的“S3 86C911”,正式開啟2D圖形硬件加速時代,,它能進行字符,、基本2D圖元和矩形的繪制。到了1995年,,幾乎所有的顯卡都具備2D加速功能,,2D圖形接口GDI、DirectFB等也都相繼出現(xiàn),,并延續(xù)至今。
1994年,,3DLabs發(fā)布的Glint 300SX是第一顆用于PC的3D圖形加速芯片,,它支持高氏著色、深度緩沖,、抗鋸齒,、Alpha混合等特性,開啟了顯卡的3D加速時代,。然而這個階段的顯卡大多沒有執(zhí)行統(tǒng)一的標準,,加速功能也不盡相同。能夠看到,,GPU概念推出之前,,ATI、英偉達,、3DFX等公司在此領(lǐng)域展開激烈競爭,,推動著圖形處理芯片的發(fā)展。
直到1999年,,英偉達推出GeForce256圖形處理芯片時,,首次提出了GPU的概念,它整合了硬件變換和光照(T&L),、立方環(huán)境材質(zhì)貼圖和頂點混合,、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,,并且兼容DirectX和OpenGL,,被稱為世界上第一款GPU。
GPU的出現(xiàn)(硬件T&L的引入)使計算機減少了對CPU的依賴,,并解放了部分原本CPU的工作,。2001年微軟發(fā)布DirectX 8,,提出了渲染單元模式(shader model)的概念。從此,,GPU從硬件T&L進入shader時代,,此時的GPU架構(gòu)還是固定管線。
固定管線架構(gòu)持續(xù)多年,,直到微軟推出DirectX 10,,shader不再扮演固定的角色,每一個shader都可以處理頂點和像素,,這就是統(tǒng)一渲染著色器(unified shader),,它的出現(xiàn)避免了固定管線中頂點著色器和像素著色器資源分配不合理的現(xiàn)象發(fā)生,使得GPU利用率更高,。
第一款采用統(tǒng)一渲染架構(gòu)的GPU是ATI在2005年與微軟合作的游戲主機XBOX 360上采用的Xenos,,它是ATI第一代統(tǒng)一渲染架構(gòu)。而真正具有影響力的,,是英偉達在2006年發(fā)布的GeForce 8800 GTX(核心代號G80),,成為第一款采用統(tǒng)一渲染架構(gòu)的桌面GPU,其架構(gòu)影響了日后的數(shù)代產(chǎn)品,,是一款極具劃時代意義的GPU,。
與G80一同發(fā)布的,還有著名的CUDA,,它能利用英偉達 GPU的運算能力進行并行計算,,拓展了GPU的應(yīng)用領(lǐng)域,然而這時的CUDA只能算是GPU的副業(yè),。2011年TESLA GPU計算卡發(fā)布,,標志著英偉達將正式用于計算的GPU產(chǎn)品線獨立出來,憑借著架構(gòu)上的優(yōu)勢,,GPU在通用計算及超級計算機領(lǐng)域,,逐漸取代CPU成為主角。
英偉達“一統(tǒng)江湖”
在早期的圖形處理器市場中玩家眾多,,3DFX通過推出Voodoo 3D加速卡在當時領(lǐng)先于市場同行,。英偉達由于蔑視當時的主流標準,采用自創(chuàng)的四邊形成像(QTM)技術(shù),,在同時期打造的NV1和NV2都未成功,。此后陸續(xù)推出RIVA系列和TNT、TNT2,,逐漸占據(jù)市場主流地位,,并最終通過1999年的GeForce256擊敗3DFX,并于2000年英偉達將3DFX的知識產(chǎn)權(quán)買斷。
在進入21世紀后,,英偉達從此前的蠻荒時代中脫穎而出,,市場中主要還剩下英偉達和ATI。ATI在1985年至2006年之間是全球重要的顯示芯片公司,,2000年ATI推出Radeon品牌,,從此與英偉達開創(chuàng)了獨立GPU領(lǐng)域兩強爭霸的格局。2006年AMD斥資54億美元收購ATI,,旨在融合CPU和GPU,。在AMD收購ATI之后的重心更多地轉(zhuǎn)向中低端市場,性能端漸漸落后于英偉達,。而后英偉達牢牢掌控著高端市場,,AMD的GPU則成為了性價比的代名詞。
目前,,獨立顯卡市場主要由英偉達和AMD兩家占據(jù),。市場調(diào)查機構(gòu)——Jon Peddie Research發(fā)布的二季度顯卡市場報告顯示,在目前獨立顯卡市場中,,目前AMD和NIVDIA兩大廠商居于統(tǒng)治地位,,從市場份額上來看,AMD獨顯份額為17%,,英偉達則增長到了83%。英特爾在前不久宣布進軍高端獨立顯卡市場,,預(yù)計首款產(chǎn)品將于明年問世,。
來源:JPR、海豚投研
報告顯示,,英偉達在顯卡市場中表現(xiàn)強勁,,市場占有率和出貨量均有明顯增長。AMD則需要面臨顯卡和處理器雙線作戰(zhàn),,產(chǎn)能更顯緊張,,所以市場份額呈現(xiàn)了下降的趨勢。
英偉達的GPU架構(gòu)自2008年以來幾乎一直保持著每2年一次大更新的節(jié)奏,,帶來更多更新的運算單元和更好的API適配性,。在工藝制程方面,英偉達GPU從2008年GT200系列的65nm制程逐步升級到了RTX3000系列的7/8nm制程,,在整個過程中,,晶體管數(shù)量提升了20多倍,使英偉達GPU的能效提升了數(shù)十倍,,占領(lǐng)了獨立顯卡技術(shù)的制高點,。
2008-2020英偉達GPU微架構(gòu)進化(圖源:慧博資訊)
英偉達通過對產(chǎn)品的打磨,從眾多顯卡廠商中脫穎而出,鑄就了GPU高端市場的壟斷地位,。同時隨著自動駕駛,、AI、AR/VR等領(lǐng)域的興起,,擁有領(lǐng)先優(yōu)勢的英偉達有望繼續(xù)領(lǐng)跑市場,,憑借產(chǎn)品的領(lǐng)先性和稀缺性,鞏固自身行業(yè)地位,。
根據(jù)前十多年的GPU發(fā)展軌跡來看,,GPU微架構(gòu)的升級趨勢可以簡要地概括為“更多、更專,、更智能”,。“更多”指的是晶體管數(shù)量和運算單元的增加,,其中包括流處理器單元,、紋理單元、光柵單元等數(shù)量上升,;“更?!笔侵赋顺R?guī)的計算單元,GPU還會增加新的運算單元,。例如,,英偉達的圖靈架構(gòu)相較于帕斯卡架構(gòu)新增加了光追單元(RT Cores)和張量單元(Tensor Core),分別處理實時光線追蹤和人工智能運算,;“更智能”是指GPU的AI運算能力上升,。如第三代的張量單元相較于上代在吞吐量上提升了1倍。
此外,,在整個過程中,,英偉達一直堅持不采用IDM的模式,而是讓臺積電負責(zé)GPU的制造,,自生專注于芯片設(shè)計,,充分發(fā)揮比較優(yōu)勢,分散了GPU設(shè)計和制造的風(fēng)險,,符合半導(dǎo)體分工的大趨勢,。
英特爾、AMD奮起直追,,欲三分天下
目前在全球GPU市場中主要的3個玩家:英偉達,、AMD和英特爾。英偉達專注于GPU領(lǐng)域,,由于此前不具備CPU業(yè)務(wù),,公司重心放在更高性能的獨立顯卡方向,。AMD和英特爾由于自身有CPU業(yè)務(wù),在2009年后兩家廠商都各自大力發(fā)展內(nèi)置于CPU的高性能集成式圖形處理內(nèi)核,。
瞄準了未來的市場需求,,以及英偉達在獨顯市場的壟斷地位,英特爾,、AMD奮起直追,,想要三分天下。
英特爾直面出擊
由于英特爾在CPU市場的巨大市場優(yōu)勢,,帶動了集成顯卡的出貨,。英特爾憑借在CPU市場60%以上的市場份額,獲得了GPU市場份額上的領(lǐng)先地位,。
英特爾是全球最大的PC GPU供應(yīng)商,,也是PC和服務(wù)器顯卡唯一的IDM廠商。英特爾的GPU最早可以追溯到1998年的i740,,但是由于羸弱的性能和緩慢的更新速度,,一直沒有非常大的起色。進入酷睿i時代后,,英特爾通過將核芯顯卡和CPU進行捆綁銷售,,利用CPU的龐大市場份額,確立了公司在集成GPU領(lǐng)域的寡頭壟斷地位,。
英特爾核芯顯卡市占率達到68.3%(圖源:JPR)
近日,,英特爾CEO Pat Gelsinger在受訪中表示,目前獨顯市場幾乎由英偉達占據(jù),,在許多顯示技術(shù)應(yīng)用變得更偏重使用英偉達提供產(chǎn)品,,使其變得過于專有,對于市場生態(tài)發(fā)展顯然不利,。因此英特爾希望借助接下來持續(xù)更新的oneAPI框架設(shè)計,讓開發(fā)者,、硬件廠商能更容易統(tǒng)整CPU,、GPU,乃至于以FPGA形式建構(gòu)更具彈性的運算方式,,解決編碼模型在不同微架構(gòu)間的壁壘,,最大化跨平臺表現(xiàn)和最小化開發(fā)成本,以一種對行業(yè)及其創(chuàng)新且更有利和開放的方式來實現(xiàn)更加友好的生態(tài)系統(tǒng),。
Gelsinger進一步說明了英特爾打算如何在GPU市場上提供有吸引力的產(chǎn)品,,并談到他們將如何在英特爾平臺上實現(xiàn)從集成到分立的無縫過渡。他表示,,英特爾聘請了AMD前頂級GPU架構(gòu)師Vineet Goel來監(jiān)督GPU產(chǎn)品基于的Xe GPU架構(gòu),,負責(zé)“架構(gòu)、設(shè)計和驗證英特爾的Xe IP路線圖”。
Xe GPU架構(gòu)是2020年英特爾在其架構(gòu)日中首次推出的,,Xe微架構(gòu)可以滿足從集成/入門圖形需求到數(shù)據(jù)中心和高性能計算的需求,,Xe的推出標志著英特爾向高性能獨立顯卡領(lǐng)域的擴張。
Xe系列可以細分為集成/低功耗的Xe-LP,、娛樂/游戲的Xe-HPG,、數(shù)據(jù)中心/高性能的Xe-HP、高性能計算的Xe-HPC,。英特爾獨立GPU分為銳炬Xe MAX和服務(wù)器GPU,,均隸屬于Xe LP系列,微架構(gòu)與核顯Xe相同,,采用標準封裝和10nm SuperFin制程,。
目前,Xe-LP的集成版本已經(jīng)被第11代酷睿所采用,。Xe-LP的移動獨立GPU版本DG1和服務(wù)器獨立GPU版本SG1也已發(fā)布,。未來,英特爾還將推出面向游戲和高性能桌面的Xe HPG產(chǎn)品線,,增加光線追蹤等硬件支持,,采用傳統(tǒng)封裝,外包生產(chǎn),。英特爾服務(wù)器GPU將使用Xe HPC,、Xe HP微架構(gòu),采用2.5D和3D先進封裝,,10nm SuperFin及更先進自家或外包工藝,。
根據(jù)Pat Gelsinger的說法,強調(diào)本身在CPU設(shè)計本質(zhì)上的優(yōu)勢,,加上目前持續(xù)在GPU產(chǎn)品設(shè)計上精進,,配合oneAPI框架設(shè)計,借此針對不同運算需求搭配最佳組合,。相比英偉達將主力放在GPU產(chǎn)品設(shè)計,,英特爾在產(chǎn)品設(shè)計將能統(tǒng)籌更多運算應(yīng)用資源,能以相對更低價格取得,,預(yù)期能帶動更大的規(guī)模和使用效益,。
從英特爾即將推出的 Xe-HPG 顯卡背后的期待來看,英特爾有了一個好的開端,。至于與AMD的斗爭,,Gelsinger認為,英特爾即將推出的Alder Lake和Sapphire Rapids將有可能終結(jié)對手近年來的成功,。
AMD雙向突圍
AMD是全球唯一可以同時提供高性能GPU和CPU的企業(yè),,且能夠同時提供獨立GPU和集成GPU,,其集成GPU主要運用在Ryzen APU、嵌入式,、半定制平臺中,。獨立GPU分為Radeon和Instinct系列,主要用于游戲,、專業(yè)視覺,、服務(wù)器等應(yīng)用。
筆者曾在文章《芯片巨頭的瘋狂五年》一文中,,描述了AMD近年來的勢不可擋之勢,。“去年,,除了Ryzen 5000系CPU的發(fā)布,,AMD還發(fā)布了再次震驚世界的Radeon 6000系列GPU,性能摸到了RTX 3090的水準,,可以說一舉追平了跟英偉達多年的差距,。2019年以來,RDNA架構(gòu)顯卡的成功試水,,使得連續(xù)三年業(yè)績飄紅的AMD在原有市值基礎(chǔ)上繼續(xù)大幅上漲,,2022年前,AMD將基于更先進的制程打造RDNA3微架構(gòu),,進一步強化光追等計算表現(xiàn),。”
過去六年,,AMD的計算和圖形收入的營收由18.05億美元上升至64.32億美元,,年復(fù)合增速29%。未來五年,,AMD計劃成為高性能計算的領(lǐng)導(dǎo)者,,提供顛覆性的CPU和GPU方案。
從Mercury Research的數(shù)據(jù)可以看到,,經(jīng)過長達六年的重返數(shù)據(jù)中心的爭奪戰(zhàn),,到2021年第一季度,AMD的X86處理器在數(shù)據(jù)中心的銷售份額達到了11.5%,,并且制定了可靠的路線圖,以應(yīng)對不斷壯大且正在復(fù)蘇的英特爾的競爭,。同時,,這對于更愿意組合GPU和CPU的優(yōu)勢互相促進產(chǎn)品銷量的AMD來講,無疑也將給英偉達帶來一定程度上的沖擊,。
綜合來看,,全球GPU已經(jīng)進入了寡頭壟斷的格局,。在傳統(tǒng)GPU市場中,排名前三的英偉達,、AMD,、英特爾的營收幾乎可以代表整個GPU行業(yè)的收入。
來源:JPR,、海豚投研
獨立顯卡領(lǐng)域主要由英偉達和AMD控制,,而集成顯卡領(lǐng)域由英特爾和AMD掌控。就整個GPU市場而言,,英特爾在核心GPU上獲得桂冠,,市場份額為68%,英偉達和AMD為15%上下,。
對于英偉達來說,,主要對手就是英特爾和AMD,雖然英偉達的獨立GPU全球第一,,但是其并不具備CPU設(shè)計能力,,相反AMD一直以來都是CPU和GPU同步發(fā)展,而且都還做得不錯,,專注于CPU的英特爾也開始計劃搞獨立GPU了,,而且英特爾除了X86之外,還押寶了RISC-V,,都在針對CPU和GPU同時布局,。
因此,押寶Arm成了英偉達一個非常好且不容錯過的機會,,此舉可以讓英偉達具備CPU設(shè)計能力,,也可以做到CPU和GPU同時發(fā)展,甚至未來還能和X86展開競爭,??梢灶A(yù)見,如果Arm的收購能成功,,英偉達將會更加強大,。
中國市場的X因素
全球GPU市場表現(xiàn)為寡頭壟斷下的高增長,年復(fù)合增速超過30%,,主要市場份額被英偉達,、英特爾、AMD等美系企業(yè)占領(lǐng),。在此宏觀背景下,,國產(chǎn)GPU企業(yè)蓬勃發(fā)展,在GPU軟硬件方面同時出擊,。
國產(chǎn)GPU的發(fā)展落后于國產(chǎn)CPU,,在國產(chǎn)GPU的開發(fā)中,,GPU對CPU的依賴性和GPU的高研發(fā)難度,阻礙了該產(chǎn)業(yè)的快速發(fā)展,。直到2014年,,長沙景嘉微才成功研發(fā)出了國內(nèi)首款國產(chǎn)高性能、低功耗GPU芯片——JM5400,,打破了國外產(chǎn)品長期壟斷我國GPU市場的局面,。
中國GPU市場規(guī)模和潛力非常大,龐大的整機制造能力意味著巨量的GPU需求,。另外,,國內(nèi)在物聯(lián)網(wǎng)、車聯(lián)網(wǎng),、人工智能等新興計算領(lǐng)域,,對GPU也存在海量需求。據(jù)IDC預(yù)測,,2024年中國GPU服務(wù)器市場規(guī)模將達到64億美元,,市場空間巨大。
有觀點表示,,AI技術(shù)的爆發(fā)和信創(chuàng)產(chǎn)業(yè)的起步給國產(chǎn)GPU帶來了真正的發(fā)展機遇,。
GPU在并行計算、浮點以及矩陣運算方面具有強大的性能,,逐漸在高性能計算,、云端AI應(yīng)用等場景中處于主導(dǎo)地位。雖然英偉達在這個領(lǐng)域占據(jù)主導(dǎo)地位,,由于其產(chǎn)品價格昂貴,,且國內(nèi)對產(chǎn)業(yè)鏈安全的考量,國產(chǎn)通用GPU有著廣闊的成長空間,。同樣,,由于信創(chuàng)產(chǎn)業(yè)的發(fā)展,國內(nèi)的桌面GPU也得到了難得的發(fā)展機遇,。
在圖形GPU領(lǐng)域,,還是以景嘉微、航錦科技等為代表的傳統(tǒng)企業(yè)為主力,。另外,,國內(nèi)從事CPU研發(fā)的企業(yè)(如兆芯、龍芯等),,也開始切入這個賽道,,增強了國內(nèi)GPU企業(yè)的整體研發(fā)實力。以國產(chǎn)替代為核心驅(qū)動力,在政策指引和充足資金保障下,,整個信創(chuàng)產(chǎn)業(yè)將為國產(chǎn)GPU帶來巨大的市場空間,遠超以往的軍用等專業(yè)市場,。
雖然國產(chǎn)GPU與主流廠商的差距仍很大,,但是GPU國產(chǎn)化的道路仍在持續(xù)推進。2021年,,景嘉微的JM9系列芯片流片,、封裝順利。雖然比此前的量產(chǎn)計劃晚了1-2年,,但產(chǎn)品研發(fā)量產(chǎn)工作仍在穩(wěn)步推進,。JM9系列產(chǎn)品對標英偉達的GTX1080。雖然按之前JM7系列情況看,,在使用上可能出現(xiàn)效果打折的情況,,但比上一代產(chǎn)品有望實現(xiàn)較大的提升。
國內(nèi)GPU廠商和產(chǎn)品不完全統(tǒng)計:
國內(nèi)GPU廠商不完全統(tǒng)計(如有遺漏,,歡迎補充)
當前,,國產(chǎn)GPU已經(jīng)能完成日常辦公等基本的任務(wù)需求,有望先從軍工領(lǐng)域拓展至國內(nèi)政企辦公領(lǐng)域,,但是在性能和使用效果方面的差距還是難以打開民用市場,。
GPU的使用效果主要受到硬件和驅(qū)動兩方面的影響。從國產(chǎn)GPU的發(fā)展情況看,,硬件端的追趕較容易實現(xiàn),,工藝制程、顯存位寬,、顯存大小,、時鐘頻率和顯存頻率等GPU的外在指標,可以通過逆向開發(fā)較快實現(xiàn),。但即使在相同的硬件情況下,,GPU驅(qū)動也將明顯影響使用效果,之前AMD顯卡出問題也大多是驅(qū)動造成的,。因此,,對于國產(chǎn)GPU在驅(qū)動方面需要更長的時間去追趕。
GPGPU蔚然成風(fēng)
2018年6月,,圖靈獎獲得者John Hennessy 和 David Patterson發(fā)表了《計算機架構(gòu)新的黃金時代》的主題演講,,提出了特定領(lǐng)域架構(gòu)(DSA)的概念,旨在為計算機架構(gòu)帶來創(chuàng)新并努力邁向新的黃金時代,。
顧名思義,,GPU就是用于3D圖形領(lǐng)域的DSA,其目標是在3D虛擬世界中渲染照片般逼真的圖像,。過去20多年里,,GPU的基本需求就源于視頻加速,,2D/3D游戲,圖像渲染,。
然而,,除了3D用途之外,幾乎所有人工智能研究人員都使用GPU來探索超越3D圖形領(lǐng)域的概念,。GPU運用自身在并行處理和通用計算的優(yōu)勢,,逐步開拓服務(wù)器、汽車,、礦機,、人工智能、邊緣計算等領(lǐng)域的衍生需求,。雖然GPU無法離開CPU獨立運作,,但是在當前“云化”加速的時代,離開了GPU的CPU也無法勝任龐大的計算需求,。所以GPU和CPU組成了異構(gòu)運算體系,,從底層經(jīng)由系統(tǒng)軟件和驅(qū)動層支持著上層的各種應(yīng)用。GPU已經(jīng)成為了專用計算時代的剛需,。
我們將這種設(shè)計理念稱為通用GPU,,即GPGPU,是一種利用GPU處理圖形渲染之外通用計算任務(wù)的高性能芯片,。近年來,,在摩爾定律演進的放緩和GPU在通用計算領(lǐng)域的高速發(fā)展的此消彼長之下,通用圖形處理器(GPGPU)逐漸“反客為主”,,利用GPU來計算原本由CPU處理的通用計算任務(wù),。
在GPGPU領(lǐng)域,目前各個GPU廠商的GPGPU的實現(xiàn)方法不盡相同,,如英偉達使用的CUDA技術(shù),、原ATI的ATI Stream技術(shù)、Open CL聯(lián)盟,、微軟的Directcompute技術(shù),。這些技術(shù)可以讓GPU在媒體編碼加速、視頻補幀與畫面優(yōu)化,、人工智能與深度學(xué)習(xí),、科研領(lǐng)域、超級計算機等方面發(fā)揮異構(gòu)加速的優(yōu)勢,。
以上幾種技術(shù)中,,只有OpenCL支持跨平臺和開放標注的特性,還可以使用專門的可編程電路來加速計算,業(yè)界支持非常廣泛,。但是,,從市占率角度來看,英偉達無疑是行業(yè)的標桿,,其不僅擁有百萬開發(fā)者支持的CUDA,,還在指令集的覆蓋面、顆粒度,、效率等維度有領(lǐng)先優(yōu)勢,早早憑借強大的GPU+CUDA方案切入深度學(xué)習(xí)領(lǐng)域,,用大筆研發(fā)投入和時間堆積起堅不可摧的生態(tài)城墻,,鮮有能與其相提并論的玩家。
在2021年以前,,中國企業(yè)雖然在一些專用芯片領(lǐng)域多有突破,,但在GPGPU領(lǐng)域仍是空白。再考慮到產(chǎn)業(yè)生態(tài),,國產(chǎn)GPGPU替代還有很長的路要走,。以中國的云端AI訓(xùn)練芯片市場為例,最大的供應(yīng)商為國外廠商,,其市場份額達90%,。
今年以來,壁仞科技,、登臨科技,、天數(shù)智芯等本土廠商在GPGPU市場英偉達一家獨大的背景下,相繼進行流片量產(chǎn),,正在努力改變現(xiàn)況,。除此之外,若想真正實現(xiàn)自主可控,,GPGPU創(chuàng)企們還需在CUDA生態(tài)的基礎(chǔ)上來推廣自己的芯片,,隨著初代國產(chǎn)芯片陸續(xù)順利落地,打造完整的國產(chǎn)核心技術(shù)生態(tài)體系也將是必經(jīng)之路,。
因其強大的并行處理能力和存儲帶寬,,GPGPU在人工智能市場和高性能市場有廣闊的應(yīng)用空間。有數(shù)據(jù)預(yù)計,,到2025年,,我國GPGPU芯片板卡的市場規(guī)模將達458億元,2019年到2025年的年復(fù)合增長率將高達32%,。按行業(yè)來分,,互聯(lián)網(wǎng)及云數(shù)據(jù)中心為228億元,安防與政府數(shù)據(jù)中心為142億元,行業(yè)AI應(yīng)用為37億元,,高性能計算為28億元,。
由此可見,從預(yù)期市場和國產(chǎn)替代的緊迫性來講,,GPGPU擁有大好前景,,一旦突破國際巨頭在“硬件+生態(tài)”層面的壁壘,本土企業(yè)的前景將十分美好,。
寫在最后
從GPU行業(yè)廠商的動態(tài)和布局來看,,戰(zhàn)火已經(jīng)燃起,都在謀劃著自己的保衛(wèi)或突擊之戰(zhàn),。國產(chǎn)GPU廠商的興起,,將給行業(yè)帶來新的不確定因素,機遇和挑戰(zhàn)同樣巨大,。
最后,,引用AI芯天下的觀點,談?wù)剣鴥?nèi)GPU行業(yè)要克服的“幾座大山”:
?。?)產(chǎn)品方面,。與英偉達等國際巨頭相比,國內(nèi)GPU尚屬于起步階段,。在圖形GPU方面,,國內(nèi)領(lǐng)先的景嘉微公司,其最新產(chǎn)品也只相當于英偉達幾年前的產(chǎn)品水平,。未來更多高清3D應(yīng)用的出現(xiàn)將帶來GPU需求的持續(xù)增長,,對GPU處理能力也是一項不小的挑戰(zhàn),持續(xù)改進GPU系統(tǒng)架構(gòu)和設(shè)計方法,,提高運算能力和綜合顯示能力,,以應(yīng)對新形勢提出的發(fā)展要求。
?。?)專利方面,。數(shù)據(jù)顯示,全球GPU技術(shù)領(lǐng)域?qū)@麛?shù)量排名前20的公司占有全球70%的GPU專利,。英偉達,,英特爾和AMD還是GPU技術(shù)領(lǐng)域全球?qū)@易宄钟袛?shù)量排名的前三。其中,,英偉達持有專利數(shù)量占全球總量的近20%,。所謂得專利者得天下,本土廠商需要在此發(fā)力,,構(gòu)建出可靠的護城河,。
?。?)在圖形領(lǐng)域,GPU對于CPU和操作系統(tǒng)的依附性很強,。在GPGPU領(lǐng)域,,CUDA生態(tài)是國內(nèi)企業(yè)必須要翻越的一座大山。當前的AI開發(fā)工程師,,多數(shù)是在CUDA平臺上進行開發(fā)的,。因此,即使有國產(chǎn)GPU芯片可以實現(xiàn)替代,,但要開發(fā)者實現(xiàn)遷移則是一項更為艱巨的工作,。
(4)近些年,,國外GPU技術(shù)快速發(fā)展,,已經(jīng)大大超出了其傳統(tǒng)功能的范疇。國內(nèi)GPU芯片的研制雖然可滿足目前大多數(shù)圖形應(yīng)用需求,,但在科學(xué)計算、人工智能及新型的圖形渲染技術(shù)方面仍然和國外領(lǐng)先水平存在較大差距,,未來持續(xù)發(fā)展國產(chǎn)GPU勢在必行,。