《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 英偉達(dá)下一代GPU拋棄臺(tái)積電7nm,?爆料稱基于三星10nm全線支持光線追蹤 性能提升40%

英偉達(dá)下一代GPU拋棄臺(tái)積電7nm,?爆料稱基于三星10nm全線支持光線追蹤 性能提升40%

2020-03-13
來(lái)源:與非網(wǎng)

  3 月 13 日訊,昨日,,有爆料消息稱英偉達(dá)的下一代 GPU 架構(gòu)將基于三星 10nm 制程,,而不是之前報(bào)道的臺(tái)積電 7nm 工藝,據(jù)稱使用的 10nm 制程更接近于三星提供的 8LPP 技術(shù),,另外新的 Tegra 芯片也將使用相同的制程,。

  之前放出兩張疑似是 Ampere GPU 核心架構(gòu)圖的 Twitter 帳號(hào)@CorgiKitty 在昨天也發(fā)布了新的傳言,稱新一代芯片將會(huì)使用三星的 10nm 節(jié)點(diǎn)工藝,,而不是此前坊間傳聞中的 7nm EUV 工藝,。

  外媒表示,英偉達(dá)安培架構(gòu)曝光的 GPU 有 GA102,、GA103,、GA104,、GA106 和 GA1075 款,,配置最高的是 GA102。報(bào)道還稱英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線跟蹤),,這意味著英偉達(dá)在安培架構(gòu)上對(duì) RT 核心設(shè)計(jì)進(jìn)行升級(jí),,使其在性能較弱的顯卡中也能實(shí)現(xiàn)光線追蹤的效果。

1.png

  一,、實(shí)時(shí)光線跟蹤

  英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線跟蹤),,這意味著英偉達(dá)在安培架構(gòu)上對(duì) RT 核心設(shè)計(jì)進(jìn)行升級(jí),使其在性能較弱的顯卡中也能實(shí)現(xiàn)光線追蹤的效果。

  使用基于光線追蹤的算法(包括 ray tracing, path tracing, photon mapping, beam tracing, cone tracing 等等 )進(jìn)行圖形渲染,。渲染對(duì)象是包含真實(shí)剛體及柔體物理模擬的動(dòng)態(tài)場(chǎng)景,。場(chǎng)景分辨率需達(dá)到 720P,并需要允許動(dòng)態(tài)攝像機(jī)以及多光源(點(diǎn) / 面光源),。渲染幀率需不低于 30 并以 60 為目標(biāo),,渲染結(jié)果應(yīng)該有較小的(肉眼難于分辨的)噪點(diǎn)。如果是 path tracing 等蒙特卡洛方法,,則還需要無(wú)偏的結(jié)果(不然會(huì)出現(xiàn)局部模糊等 artifacts),。

  目前的應(yīng)用包括各類(lèi)照片級(jí)渲染應(yīng)用中場(chǎng)景設(shè)計(jì)的快速原型生成,視頻游戲中的部分場(chǎng)景渲染,。未來(lái)的應(yīng)用領(lǐng)域會(huì)更加廣闊,。但實(shí)時(shí)的光線追蹤的難點(diǎn)在于場(chǎng)景復(fù)雜度和需要的真實(shí)感渲染效果決定了遍歷和相交檢測(cè)的巨大計(jì)算量(場(chǎng)景分割數(shù)據(jù)結(jié)構(gòu)的重構(gòu)和光線與場(chǎng)景的相交測(cè)試是兩項(xiàng)主要計(jì)算)。這是渲染領(lǐng)域以及任何模擬計(jì)算領(lǐng)域里終極的矛盾:效率和質(zhì)量的矛盾,。

  目前的解決方案有兩個(gè)方向的努力:軟件角度和硬件角度,,軟件角度又可以分為自低向上和自頂向下的優(yōu)化:BVH 和其他層級(jí)結(jié)構(gòu)的場(chǎng)景分割(kd-tree, oc-tree, BSP-tree 等)是自頂向下的方法,,在對(duì)場(chǎng)景進(jìn)行分割時(shí)還有一項(xiàng)十分常用的優(yōu)化算法:Surface Area Heuristic (SAH),。硬件角度的優(yōu)化又可以分為采用 GPU 和 SIMD 的優(yōu)化以及專門(mén)的 ray tracing 硬件。前者就是對(duì)上述軟件優(yōu)化的算法進(jìn)行針對(duì) GPU 或 SIMD 的優(yōu)化,,同時(shí)一些并行環(huán)境下的數(shù)學(xué)庫(kù)函數(shù)和其他基本算法如排序等也間接起到了加速的作用,。后者就是指將 ray tracing 中獨(dú)有的相交檢測(cè),場(chǎng)景分割等部分采用專門(mén)的硬件來(lái)優(yōu)化,。此次英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線跟蹤),,RT 核心方面的設(shè)計(jì)已逐步完善。

  二,、NVIDIA 的新核心比上代性能提升了 40%

  在 GeekBench 5 測(cè)試數(shù)據(jù)庫(kù)里面,,曝光了兩組 NVIDIA 的新核心,參數(shù)暴漲,,規(guī)格相當(dāng)?shù)膹?qiáng)大,,但都達(dá)不到 8192 個(gè) CUDA 核心。其中一塊核心擁有 118 組計(jì)算單元,,假如每組繼續(xù)延續(xù) 64 個(gè)流處理器的規(guī)格,,那么 CUDA 核心數(shù)量就是 7552 個(gè),低于在此之前爆料的 8192 個(gè) CUDA 核心,。

  另一塊核心削減了 108 組計(jì)算單元,,于是 CUDA 核心就只有 6912 個(gè),至于頻率在 1.01GHz 左右,。這樣的參數(shù)遠(yuǎn)于 8912 個(gè) CUDA 核心,。

  但我們可不可以這么認(rèn)為,,128 組計(jì)算單元對(duì)應(yīng) 8192 個(gè) CUDA 核心數(shù)是這塊核心的最大規(guī)格,至于 118 組計(jì)算單元和 108 組計(jì)算單元,,是閹割后的版本,,分別適用于不同的領(lǐng)域。

  配置最低的 GA107 為 1280 流處理器,,4GB 顯存,,最高的 GA102 GPU 為 5376 流處理器,12GB 顯存,,其中 GA102 比上代的 RTX 2080Ti 性能提升了 40%,。

2.png

  圖片來(lái)源:GeekBench 5 測(cè)試數(shù)據(jù)庫(kù)


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。