《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動(dòng)態(tài) > 高端GPU芯片:英偉達(dá)的獨(dú)角戲?

高端GPU芯片:英偉達(dá)的獨(dú)角戲,?

2022-09-20
作者:張心怡
來源: 中國電子報(bào)
關(guān)鍵詞: 英偉達(dá) GPU 芯片

  高端GPU作為通用計(jì)算的“加速神器”,,日漸成為大型數(shù)據(jù)中心,、人工智能,、超算等領(lǐng)域的剛需。長期以來,,英偉達(dá)在高端GPU市場占據(jù)主導(dǎo)地位,,市場占有率一度超過90%。目前來看,,國內(nèi)企業(yè)突破英偉達(dá)等國外公司的壟斷仍然任重道遠(yuǎn),,但國內(nèi)基于架構(gòu)創(chuàng)新的DSA(特定領(lǐng)域架構(gòu),即針對(duì)特定領(lǐng)域的可編程處理器)芯片產(chǎn)品日漸豐富,,可能會(huì)帶來一些曙光,。

  高端GPU與傳統(tǒng)GPU“涇渭分明”

  20世紀(jì)90年代,Play Station等游戲主機(jī)的發(fā)布和彩色顯示器的出現(xiàn),,催生了3D游戲的萌芽,。而彼時(shí)的3D制作主要依靠計(jì)算機(jī)的CPU執(zhí)行,計(jì)算任務(wù)需要串行排隊(duì),,難以滿足游戲畫質(zhì)的提升需求,。英偉達(dá)的GeForce 256,將“GPU”概念推向市場,。自此,,光線追蹤等圖形圖像處理任務(wù)有了專用芯片承載,在提升3D畫質(zhì)的同時(shí),,也提升了計(jì)算機(jī)的整體效能,。

  隨著超算等高并發(fā)性計(jì)算需求不斷增長,GPU用于計(jì)算任務(wù)的可能性受到業(yè)界關(guān)注,。英偉達(dá)首席科學(xué)家David Kirk認(rèn)為,,GPU的浮點(diǎn)運(yùn)算和并行計(jì)算能力不應(yīng)該局限于圖像渲染。在他的倡導(dǎo)下,,英偉達(dá)以推動(dòng)GPU從專用計(jì)算芯片走向通用計(jì)算處理器為目標(biāo),,推出了GPGPU(即通用GPU),,并于2006年發(fā)布并行編程模型CUDA。GPGPU與CUDA組成的軟硬件底座,,構(gòu)成了英偉達(dá)引領(lǐng)AI計(jì)算的根基,。

  由于GPGPU專注高性能算力,也常常被業(yè)界和市場稱為“高端GPU”,,并發(fā)展出與傳統(tǒng)GPU“涇渭分明”的應(yīng)用路徑,。燧原科技產(chǎn)品市場部總監(jiān)陳超向《中國電子報(bào)》記者指出,傳統(tǒng)GPU聚焦圖像學(xué),,關(guān)注幀數(shù),、渲染逼真度、對(duì)于真實(shí)場景的映射程度等指標(biāo),,主要用于運(yùn)行游戲,、專業(yè)圖像處理、加密貨幣處理等場景,。而高端GPU是用于計(jì)算加速的芯片產(chǎn)品,,專注于基礎(chǔ)科學(xué)等超算領(lǐng)域和訓(xùn)練、推理等大規(guī)模人工智能計(jì)算場景,。

  2022年第二季度獨(dú)立GPU市場(包括AIB 合作伙伴顯卡)份額

微信圖片_20220920091128.png

  來源:Jon Peddie Research

  “高端GPU不涉及消費(fèi)級(jí)GPU的場景,,純粹用于計(jì)算加速。高端GPU早期用于超算等高性能計(jì)算場景,,真正的蓬勃興起并大規(guī)模產(chǎn)生一些商業(yè)行為,,是在人工智能迅猛發(fā)展產(chǎn)生了強(qiáng)有力的算力需求之后,GPU被大量應(yīng)用于人工智能場景,,特別是人工智能訓(xùn)練,。”陳超向記者指出,。

  目標(biāo)不同則指標(biāo)不同,高端GPU有著與傳統(tǒng)GPU不同的關(guān)注點(diǎn),。昆侖芯科技CEO業(yè)務(wù)助理宋春曉向《中國電子報(bào)》表示,,衡量高端GPU的主要維度是通用性、易用性和高性能,。通用性指硬件架構(gòu)要有足夠的靈活性,,以適應(yīng)人工智能不斷迭代變化的算法和場景。易用性是指較低的開發(fā)門檻,,讓開發(fā)者更容易上手,,結(jié)合實(shí)際場景進(jìn)行定制化的開發(fā)。高性能指芯片產(chǎn)品的基礎(chǔ)性能和性價(jià)比要對(duì)標(biāo)國際先進(jìn)水平,,才能進(jìn)行市場開拓,。

  算力大小往往是市場對(duì)GPU性能優(yōu)劣的“第一印象”,。但高端GPU的性能不等于紙面性能,尤其不能以單一性能的紙面數(shù)據(jù)來衡量,。

  “在實(shí)際使用的過程中,,GPU的通用性、易用性,、實(shí)際性的重要程度遠(yuǎn)大于紙面標(biāo)出的算力這一單一性能,。紙面指標(biāo)標(biāo)得再高,也要關(guān)注內(nèi)存和帶寬夠不夠,,以及芯片之間的互聯(lián)等問題解決得好不好,。用單一性能來衡量GPU是否高端,是一個(gè)常見的誤區(qū),?!彼未簳哉f。

  硬件性能最終要通過軟件接口被開發(fā)者感知和使用,。芯動(dòng)科技GPU項(xiàng)目總監(jiān)何穎對(duì)《中國電子報(bào)》記者表示,,高端GPU設(shè)計(jì)的算力,需要專門優(yōu)化過的驅(qū)動(dòng)和加速庫,。只有軟硬協(xié)同,,才能把高端GPU的算力真正應(yīng)用到實(shí)際場景中。

  高性能計(jì)算將是主要“競技場”

  長期以來,,英偉達(dá)在高端GPU市場占據(jù)主導(dǎo)地位,,市場占有率一度超過90%,在人工智能計(jì)算領(lǐng)域尤其具備壟斷性優(yōu)勢,。迄今為止,,英偉達(dá)推出了面向高性能計(jì)算和AI訓(xùn)練的Volta、Ampere,、Hopper等架構(gòu),,并以此為基礎(chǔ)推出了V100、A100,、H100等高端GPU,,面向向量的雙精度浮點(diǎn)算力從7.8 TFLOPS一路來到30 TFLOPS。

  市場優(yōu)勢的建立,,歸功于英偉達(dá)GPU產(chǎn)品能力的均衡和生態(tài)的完善,。

  “英偉達(dá)在通用性、易用性和高性能三個(gè)方面做得比較均衡,,加上英偉達(dá)在每一代架構(gòu)上都有所創(chuàng)新,,為軟件承接大模型訓(xùn)練和推理場景的人工智能計(jì)算提供了持續(xù)提升的硬件基礎(chǔ)。”宋春曉說,。

  “人工智能對(duì)于生態(tài)的要求非常高,,涉及框架、應(yīng)用,、模型的適配等,,英偉達(dá)率先基于CUDA生態(tài)將上下游打通,對(duì)于下游的算法開發(fā)商和服務(wù)商來說,,它的GPU在性能具備優(yōu)勢的同時(shí)還保持了易用性,。”陳超表示,。

  作為全球第二大獨(dú)立GPU供應(yīng)商,,AMD雖在高端GPU的整體份額與英偉達(dá)存在差距,卻在超算領(lǐng)域闖出了一片天,。在最新全球超算TOP500榜單上,,世界上最快的超級(jí)計(jì)算機(jī)橡樹嶺國家實(shí)驗(yàn)室(ORNL)Frontier、世界排名第三的超級(jí)計(jì)算機(jī)LUMI,,都采用了AMD EPYC處理器和AMD Instinct MI250X GPU加速器,。

  AMD在超算領(lǐng)域的亮眼表現(xiàn),是建立在針對(duì)性的軟硬件設(shè)計(jì)上,,基于CDNA 2架構(gòu)的GPU加速器,、ROCm軟件平臺(tái)與開源應(yīng)用程序資源中心AMD Infinity Hub的組合,構(gòu)成了對(duì)于科研人員更加友好的硬件性能和編程環(huán)境,。

  “超算涉及許多科研探索性質(zhì)的計(jì)算任務(wù),,AMD開源的軟件格局為科學(xué)家探索新的計(jì)算方式提供了更多可能和便利?!标惓硎?。

  “AMD針對(duì)架構(gòu)和適用場景做了更細(xì)分的設(shè)計(jì),使GPU產(chǎn)品能夠更多地應(yīng)用于科學(xué)計(jì)算場景,,因?yàn)樗麄兊碾p精度做得比較好,。”宋春曉表示,。

  但高性能計(jì)算和AI計(jì)算并不能與GPU劃等號(hào),。陳超指出,高性能及AI計(jì)算本質(zhì)上具有四項(xiàng)基本要求,。一是高精度,尤其高性能計(jì)算對(duì)于FP64雙精度浮點(diǎn)有著較高的需求,;二是高性能,,以滿足面向超大數(shù)據(jù)量的信息處理要求;三是并發(fā)計(jì)算,大大縮短信息處理全流程延時(shí),;四是軟件易用性,,能支撐更廣泛的應(yīng)用場景,且易于編程和開發(fā),。

  “雖然直接采用GPU進(jìn)行高性能或AI計(jì)算較為便利,,但上層應(yīng)用降本增效的核心訴求對(duì)底層算力提出了更高要求,國外AI創(chuàng)企推出的AI芯片往往基于全新的架構(gòu),,對(duì)并行計(jì)算能力進(jìn)行全面提升和重點(diǎn)優(yōu)化,。國內(nèi)相關(guān)的AI芯片領(lǐng)先企業(yè)同樣推出了一系列基于DSA架構(gòu)的人工智能計(jì)算芯片,也是出于同樣的考慮,?!标惓f。

微信圖片_20220920091610.jpg

  燧原科技在世界人工智能大會(huì)的展臺(tái)

  在國內(nèi)市場,,基于架構(gòu)創(chuàng)新的DSA芯片產(chǎn)品日漸豐富,。例如華為面向AI計(jì)算特征的自研架構(gòu)達(dá)芬奇,昆侖芯科技推出的一代架構(gòu)“XPU-K”和二代架構(gòu)“XPU-R”,,燧原科技的自研架構(gòu)“GCU-CARA”已進(jìn)入規(guī)模落地期,。隨著AI計(jì)算的應(yīng)用場景越來越細(xì)分和復(fù)雜,定制化,、異構(gòu)化的DSA有望在下一代計(jì)算平臺(tái)中發(fā)揮更大效用,。

  架構(gòu)和軟件是攻克高端GPU的核心要素

  無論是高端GPU,還是同樣以優(yōu)化并行計(jì)算效率為核心的各類DSA芯片,,都有著技術(shù),、人才、資金密集的特征,,研發(fā)難度不容小覷,。

  在采訪中,三位受訪者均表示,,架構(gòu)設(shè)計(jì)是攻克高端GPU的核心要素,。

微信圖片_20220920092044.png

  百度昆侖芯產(chǎn)品

  架構(gòu)設(shè)計(jì)具體難在哪里?首先是各項(xiàng)能力的均衡性,。宋春曉表示,,架構(gòu)設(shè)計(jì)的通用性、易用性和高性能構(gòu)成了“不可能三角”,。如果優(yōu)先保障通用性,,兼顧各個(gè)場景,就難以在某一個(gè)場景進(jìn)行足夠的定制化以提供更高性能,。如果找到了一種兼顧通用性和高性能的路徑,,將是一個(gè)跨度較大的架構(gòu)創(chuàng)新,,生態(tài)上要推倒重來,易用性會(huì)受到很大影響,。

  “在架構(gòu)設(shè)計(jì)過程中,,一方面注重有哪些巧思能夠在這個(gè)‘不可能三角’中盡可能達(dá)到平衡;另一方面也要充分理解市場,、客戶的需求,,比如客戶在什么情況下,能夠在通用性,、易用性,、高性能的哪一點(diǎn)去做到什么程度的取舍。了解這些情況之后,,才能設(shè)計(jì)出合理,、均衡、契合需求的架構(gòu),?!彼未簳愿嬖V記者。

  其次是指令集設(shè)計(jì),?!爸噶罴怯布撵`魂。指令集的多與少,、高效與否,,對(duì)于芯片架構(gòu)以及微架構(gòu)有著重大影響。如果指令集設(shè)計(jì)巧妙,,芯片架構(gòu)會(huì)更加高效,,客戶做開發(fā)時(shí)也能在應(yīng)用、開發(fā)效率,、性能,、成本方面獲得較為均衡的支持?!标惓f,。

  此外,架構(gòu)設(shè)計(jì)對(duì)于芯片企業(yè)在產(chǎn)業(yè)鏈理解能力和技術(shù)積累上提出了更高要求,。

  “硬件架構(gòu)層面上,,高端GPU的構(gòu)成極其復(fù)雜,涉及先進(jìn)工藝層面的超大規(guī)模集成電路設(shè)計(jì),。頭部公司積累了大量專利,,對(duì)后來者構(gòu)筑了極高的技術(shù)壁壘?!焙畏f說,。

  高端GPU的另一個(gè)門檻是軟件生態(tài),。可以說,,軟件決定了GPU生態(tài)的能力上限,也是硬件能力充分釋放和靈活調(diào)度的必要條件,。

  “高端GPU需要廠商提供高度優(yōu)化的驅(qū)動(dòng),,以及各種加速庫和相關(guān)的文檔,以支持用戶紛繁復(fù)雜的使用場景,。此外,,終端用戶需要廠商提供功能強(qiáng)大的工具以輔助問題診斷和性能調(diào)優(yōu)?!焙畏f表示,。據(jù)悉,芯動(dòng)科技推出的風(fēng)華系列GPU已經(jīng)兼容了OpenGL4.3,,并支持微軟Windows10  DirectX圖形框架,。

  在完成硬件設(shè)計(jì)和軟件棧構(gòu)建的基礎(chǔ)上,還要考慮芯片的工程實(shí)現(xiàn),。陳超表示,,高端計(jì)算芯片對(duì)于算力性能的要求非常極致,往往會(huì)用到最先進(jìn)的工藝和封裝技術(shù),,運(yùn)行時(shí)鐘的頻率也非常高,,需要考慮功耗對(duì)于環(huán)境和運(yùn)行可靠性的影響。同時(shí),,也要考慮芯片的生產(chǎn)良率,。

  “良率直接影響高端GPU的成本,這個(gè)成本會(huì)最終體現(xiàn)到消費(fèi)端,,影響算力成本的高與低,。所以良率是高端GPU工業(yè)化、商業(yè)化落地中非常重要的因素,?!标惓f。

  除了產(chǎn)業(yè)鏈環(huán)節(jié)本身,,人才作為研發(fā)的生力軍,,也是高端GPU研發(fā)水平的決定性因素。

  “國內(nèi)專業(yè)對(duì)口人才相對(duì)稀缺,,需要在2~3年甚至更長的培養(yǎng)時(shí)間里,,有持續(xù)投入和資金支持。我們非常注重國內(nèi)外人才的積累,,以保障研發(fā)基礎(chǔ)和創(chuàng)新迭代的能力,,同時(shí)也有利于新生代的培養(yǎng),,進(jìn)一步夯實(shí)人才基礎(chǔ)?!焙畏f說,。

  更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。