三星8nm工藝，最高售價(jià)1500美元，英偉達(dá)新一代顯卡面世-AET-電子技術(shù)應(yīng)用

三星8nm工藝，最高售價(jià)1500美元，英偉達(dá)新一代顯卡面世

日期： 2020-09-02

來源：半導(dǎo)體行業(yè)觀察

關(guān)鍵詞： NVIDIA GeForceRTX 8nm

　微信圖片_20200902120413.png

　　在寄予了很大的期望，并泄漏了不少信息后，NVIDIA終于在今天上午發(fā)布了其下一代視頻卡GeForce RTX 30系列。這系列是基于NVIDIA Ampere架構(gòu)的游戲和圖形變體設(shè)計(jì)，并基于三星8nm工藝的優(yōu)化版本打造。NVIDIA方面表示，這些新卡在游戲性能方面取得了重大改進(jìn)。最新一代的GeForce還將具有一些新功能，以進(jìn)一步將這些卡與NVIDIA基于Turing的RTX 20系列分別開來。

　　NVIDIA新發(fā)布的RTX 30系列的前三張卡分別是：RTX 3090，RTX 3080和RTX3070。這些卡都將在下個(gè)月半的時(shí)間內(nèi)推出。其中RTX 3090和RTX 3080更是必須一提。這兩款顯卡將分別作為NVIDIA GeForce RTX 2080 Ti和RTX 2080 / 2080S的后繼產(chǎn)品，他們創(chuàng)下了圖形性能的新高。當(dāng)然，RTX 3090的價(jià)格也創(chuàng)下了歷史新高。

　　第一款上市的顯卡是GeForce RTX3080。NVIDIA表示，新顯卡是上一代產(chǎn)品RTX 2080性能的兩倍，該顯卡將于9月17 日以700美元的價(jià)格發(fā)售。一周后，功能更強(qiáng)大的GeFoce RTX 3090將在9月24 日上市，售價(jià)為1500美元。而TX 3070被定位為更多傳統(tǒng)的甜蜜點(diǎn)卡，它將在下個(gè)月將以499美元的價(jià)格上市。

　　游戲領(lǐng)域的Ampere架構(gòu)：GA102

　　與NVIDIA過往的做法一樣，他們?cè)诮裉焐衔绲墓_演講不是深入探討架構(gòu)。但NVIDIA仍然繼續(xù)其成功的發(fā)布經(jīng)驗(yàn)。這意味著要進(jìn)行大量的演示，推薦和宣傳視頻，并概要介紹最新一代GPU所采用的幾種技術(shù)和工程設(shè)計(jì)決策。最終的結(jié)果是，我們對(duì)RTX 30系列有一個(gè)不錯(cuò)的了解，但是我們必須等待NVIDIA提供一些深入的技術(shù)介紹，才能了解得更透徹。

　　據(jù)了解，頂級(jí)顯卡中使用的Ampere和GA102 GPU為NVIDIA的產(chǎn)品線帶來了幾項(xiàng)主要的硬件改進(jìn)。其中最大的改進(jìn)是晶體管尺寸的不斷縮小，這要?dú)w功于三星8nm工藝的定制版本。我們對(duì)此工藝的信息有限，因?yàn)樗鼪]有被使用太多的地方，但從較高的層次上講，這是三星公司最密集的傳統(tǒng)非EUV工藝，源自其較早的10nm工藝。

　　總而言之，NVIDIA在采用更小的工方面已經(jīng)有些遲了，但是由于該公司已經(jīng)重新開發(fā)了首先交付大型GPU的親和力，因此他們需要更高的晶圓產(chǎn)量（更少的缺陷）才能將芯片交付市場(chǎng)。

　　對(duì)于NVIDIA的產(chǎn)品而言，三星的8nm工藝是對(duì)他們先前工藝的完整升級(jí)，臺(tái)積電的12nm“ FFN”本身就是臺(tái)積電16nm工藝的優(yōu)化版本。因此新工藝讓NVIDIA的晶體管密度顯著提高，

　　就GA102而言，在它里面集成了280億個(gè)晶體管，這在大量的CUDA內(nèi)核和其他可用硬件中得到了體現(xiàn)。圖靈（Turing）和麥克斯韋（Maxwell）等中代架構(gòu)在架構(gòu)水平上獲得了大部分收益，而安培（Ampere）（如之前的帕斯卡（Pascal））則受益于光刻工藝的適當(dāng)改進(jìn)。所有這一切的唯一障礙是Dennard Scaling 它已經(jīng)死了并且不會(huì)回來。因此，盡管NVIDIA可以在芯片中封裝比以往更多的晶體管，但功耗卻在提高，這在顯卡的TDP中得到了體現(xiàn)。

　　NVIDIA沒有為我們提供GA102的特定die尺寸，但是根據(jù)一些照片，我們有足夠的信心相信它會(huì)超過500平方毫米。它比754平方毫米的 TU102的尺寸要小得多，但它仍然是一個(gè)相當(dāng)大的芯片，并且是三星生產(chǎn)的最大芯片之一。

　　繼續(xù)，讓我們談?wù)凙mpere架構(gòu)本身。作為NVIDIA A100加速器的一部分，這個(gè)架構(gòu)于今年春天推出，直到現(xiàn)在我們也僅是從面向計(jì)算的角度看到了Ampere。GA100缺少幾個(gè)圖形功能，因此NVIDIA可以最大化分配給計(jì)算的芯片空間，因此，像GA102這樣的以圖形為重點(diǎn)的Ampere GPU仍然是Ampere系列的成員，兩者之間有很多區(qū)別。這就是說，到目前為止，NVIDIA一直能夠?qū)mpere的游戲方面的能力保持神秘。

　　從計(jì)算的角度來看，Ampere看起來與Volta相當(dāng)，而從圖形的角度來看也是如此。GA102并未引入任何新奇的功能塊，如RT核或張量核，但已對(duì)其功能和相對(duì)大小進(jìn)行了調(diào)整。此處最顯著的變化是，與Ampere GA100一樣，應(yīng)用在游戲的Ampere繼承并更新了功能更強(qiáng)大的張量內(nèi)核，NVIDIA將其稱為第三代張量內(nèi)核。單個(gè)Ampere SM可以提供比Turing SM兩倍的張量吞吐量，盡管只有一半的張量核心數(shù)量。而且，NVIDIA似乎在GA102上保留了基本的設(shè)置。那就使得NVIDIA的FP16張量核心性能比上一代提高了一倍以上。

　　同時(shí)，NVIDIA已經(jīng)確認(rèn)GA102中使用的張量內(nèi)核，其他Ampere圖形GPU也支持稀疏性以實(shí)現(xiàn)更高的性能，那就意味著NVIDIA在張量內(nèi)核功能方面沒有退步。總體而言，對(duì)張量核心性能的關(guān)注，強(qiáng)調(diào)了NVIDIA對(duì)深度學(xué)習(xí)和AI性能的承諾，因?yàn)樵摴菊J(rèn)為深度學(xué)習(xí)不僅是其數(shù)據(jù)中心業(yè)務(wù)的驅(qū)動(dòng)器，而且也是其游戲業(yè)務(wù)的驅(qū)動(dòng)器。我們只需深入研究NVIDIA的深度學(xué)習(xí)超級(jí)采樣（Deep Learning Super Sampling ：DLSS）技術(shù)，即可了解原因。DLSS部分依賴于張量內(nèi)核來提供盡可能多的性能，而NVIDIA仍在尋找更多方法來充分利用其張量內(nèi)核。

　　光線追蹤（RT）核心也得到了增強(qiáng)，盡管我們不確定到什么程度。除了具有更多SM的GA102在整體上具有更多的功能外，據(jù)說各個(gè)RT內(nèi)核的速度最高可快2倍，而NVIDIA可能專門引用了光線/三角形相交性能。NVIDIA的演示幻燈片中也有一些關(guān)于RT核心并發(fā)的簡短說明，但是該公司在簡短演示中并未對(duì)該主題進(jìn)行任何真正的詳細(xì)介紹，因此我們正在等待技術(shù)簡介以獲取更多詳細(xì)信息。

　　總體而言，更快的RT內(nèi)核對(duì)于游戲行業(yè)的光線追蹤野心是一個(gè)好消息，因?yàn)楣饩€追蹤在RTX 20系列卡上的性能成本很高。話雖如此，但NVIDIA所做的任何事情都無法完全消除這種損失。光線追蹤是一項(xiàng)艱巨的工作，需要一段時(shí)間，但更多且經(jīng)過重新平衡的硬件可以幫助降低成本。

　　最后但同樣重要的是，我們要關(guān)注一下著色器核心（ shader cores）。這是對(duì)游戲性能最重要的領(lǐng)域，也是NVIDIA今天所說得最少的領(lǐng)域。我們知道，新的RTX 30系列卡包含了數(shù)量驚人的FP32 CUDA內(nèi)核，這要?dú)w功于NVIDIA在其SM配置中將其標(biāo)記為“ 2x FP32”。結(jié)果，即使是中端的RTX 3080也提供29.8 TFLOP的FP32著色器性能，是上一代RTX 2080 Ti的兩倍以上。簡而言之，這些GPU中有數(shù)量驚人的ALU，坦率地說，考慮到晶體管數(shù)量，ALU比我預(yù)期的要多得多。

　　當(dāng)然，Shading 性能并不是一切，這就是為什么NVIDIA自己對(duì)這些顯卡的性能要求不如僅Shading 性能方面的提高那么高。但是，考慮到計(jì)算機(jī)圖形的令人尷尬的并行性，著色器在很多時(shí)候肯定是瓶頸。這就是為什么在此問題上投入更多的硬件（在這種情況下，更多的CUDA內(nèi)核）是一種有效的策略的原因。

　　此時(shí)的主要問題是這些附加的CUDA內(nèi)核是如何組織的，以及對(duì)于SM中的執(zhí)行模型意味著什么。我們誠然在這里進(jìn)入了更詳細(xì)的技術(shù)細(xì)節(jié)，但是Ampere如何輕松地填充這些額外的內(nèi)核將成為其能夠更好地發(fā)揮所有這些teraFLOP性能的關(guān)鍵因素。這是由線程扭曲中額外的IPC提取驅(qū)動(dòng)的嗎？還是運(yùn)行進(jìn)一步的扭曲？

　　最后一點(diǎn)，當(dāng)我們?cè)诘却嘘P(guān)新卡的更多技術(shù)信息時(shí)，值得注意的是，NVIDIA的規(guī)格表或其他材料均未提及卡中的任何其他圖形功能。值得稱道的是，圖靈已經(jīng)領(lǐng)先一步，提供的功能將在兩年內(nèi)成為新的DirectX 12 Ultimate /功能級(jí)別12_2，比其他任何供應(yīng)商都要早。因此，隨著Microsoft和其他領(lǐng)域的追趕，NVIDIA并沒有立即追求的更高功能。不過，看到NVIDIA從其廣為人知的帽子中抽出一兩個(gè)新的圖形功能來吸引眾人，還是很不尋常。

　　I / O：PCI Express4.0，SLI和RTX IO

　　NVIDIA在 GeForce卡中引入了Ampere，也將Ampere改進(jìn)的I / O功能帶入了消費(fèi)市場(chǎng)。盡管這里沒有什么是開創(chuàng)性的，但這里的一切都有助于保持NVIDIA最新一代顯卡的良好運(yùn)轉(zhuǎn)。

　　據(jù)了解，I / O前端的功能包括對(duì)PCI-Express 4.0的支持。這是在NVIDIA的A100加速器上引入的，因此，它的加入是在意料之中，但這仍然是自8年前GTX 680推出以來NVIDIA PCIe帶寬的首次增加。借助完整的PCIe 4.0 x16插槽，RTX 30系列卡在每個(gè)方向上的I / O帶寬達(dá)到32GB /s，是RTX 20系列卡訪問速度的兩倍。

　　至于PCIe 4.0對(duì)性能的影響，我們目前預(yù)計(jì)不會(huì)有太大的不同，因?yàn)楹苌儆凶C據(jù)表明Turing卡受到PCIe 3.0速度的限制，即使PCIe 3.0 x8在大多數(shù)情況下也已足夠使用。安培的更高性能無疑會(huì)增加對(duì)更多帶寬的需求，但幅度不會(huì)太大。這可能就是為什么甚至NVIDIA都沒有大力推廣PCIe 4.0支持的原因（盡管在這里僅次于AMD可能是一個(gè)因素）。

　　同時(shí)，似乎SLI支持將持續(xù)存在至少至少一代。NVIDIA的RTX 3090卡包括一個(gè)用于SLI和其他多GPU用途的NVLInk連接器。因此，多GPU渲染即使幾乎沒有發(fā)生，也仍然有效。NVIDIA今天的演講沒有對(duì)該功能進(jìn)行任何進(jìn)一步的詳細(xì)介紹，但是值得注意的是，Ampere架構(gòu)引入了NVLink 3，如果NVIDIA將其用于RTX 3090，則意味著3090的NVLink帶寬可能是上一代的RTX 2080 Ti的兩倍，每個(gè)方向的速度為100GB/s。

　　總體而言，我懷疑RTX 3090上包含NVLInk連接器對(duì)于計(jì)算用戶來說是一個(gè)新玩法，由于知道VRAM容量對(duì)先進(jìn)的深度學(xué)習(xí)模型的重要習(xí)慣，許多用戶將對(duì)擁有24GB VRAM的快速消費(fèi)級(jí)卡感到垂涎三尺……不過，NVIDIA絕不會(huì)放棄在圖形方面進(jìn)行追加銷售的機(jī)會(huì)。

　　最終，隨著RTX 30系列的發(fā)布，NVIDIA還宣布了他們稱為RTX IO的新I / O功能套件。從高層次看，這似乎是NVIDIA對(duì)Microsoft即將推出的DirectStorage API 的實(shí)現(xiàn)，就像在首次啟動(dòng)的XboxSeries X控制臺(tái)上一樣，它允許從存儲(chǔ)到GPU的直接連接，實(shí)現(xiàn)異步assets流的傳輸，通過繞開CPU來完成大部分工作，DirectStorage（以及擴(kuò)展為RTX IO）可以通過讓GPU更直接地獲取所需的資源來改善I / O延遲和GPU的吞吐量。

　　除了Microsoft為該技術(shù)提供標(biāo)準(zhǔn)化API之外，這里最重要的創(chuàng)新是Ampere GPU能夠直接解壓縮assets。游戲assets經(jīng)常被壓縮以用于存儲(chǔ)目的-至少Flight Simulator 2020占用甚至更多的 SSD空間，并且當(dāng)前將這些assets解壓縮為GPU可以使用的東西是CPU的工作。將其從CPU卸載不僅可以將其釋放給其他任務(wù)，而且最終完全擺脫了中間人，這有助于改善assets流性能和游戲加載時(shí)間。

　　務(wù)實(shí)地說，我們已經(jīng)知道該技術(shù)已經(jīng)應(yīng)用于Xbox Series X和PlayStation 5，因此很大程度上是Microsoft和NVIDIA與下一代游戲機(jī)保持同等水平。但是，它確實(shí)需要在GPU端進(jìn)行一些真正的硬件改進(jìn)，以處理所有這些I / O請(qǐng)求并能夠有效地解壓縮各種類型的assets。

　　Ampere功耗效率改進(jìn)：1.9倍？可能不是

　　除了整體視頻卡性能之外，NVIDIA的第二大技術(shù)支柱是整體功耗效率。功率效率是GPU設(shè)計(jì)的基石，因?yàn)閳D形工作負(fù)載有令人尷尬地并行化，并且GPU性能受到總功耗的限制。功率效率是所有GPU發(fā)布中經(jīng)常關(guān)注的焦點(diǎn)。NVIDIA為確保RTX 30系列的發(fā)布而給予了一定的關(guān)注。

　　總體而言，NVIDIA聲稱Ampere的功耗效率提高了1.9倍。對(duì)于后Dennard時(shí)代的制造工藝節(jié)點(diǎn)的全面發(fā)展，這實(shí)際上是一個(gè)令人驚訝的說法。請(qǐng)注意，這絕非不可能，但這遠(yuǎn)超NVIDIA從Pascal升級(jí)到Turing所獲得的提升。

　　但是，如果深入研究NVIDIA的說法，這個(gè)1.9倍的提升就顯得越來越夸張。

　　此處的直接奇怪之處是，通常功耗效率是以固定的功耗水平而不是固定的性能水平來衡量的。隨著晶體管的功耗大約增加電壓的三次方，像Ampere這樣具有更多功能塊的“更寬”部分可以以更低的頻率進(jìn)行時(shí)鐘輸出，從而達(dá)到與Turing相同的整體性能。本質(zhì)上，這張圖是將最壞的Turing與最好的Ampere進(jìn)行比較，那么問題來了，如果我們將Ampere降頻到與Turing一樣慢，那會(huì)是什么樣？而不是“在相同約束下安培比圖靈快多少？”。

　　換句話說，在特定的功耗下，NVIDIA的圖表并未向我們展示了直接的性能比較。

　　如果您實(shí)際上進(jìn)行了固定的功耗比較，那么Ampere在NVIDIA的圖表中看起來就不會(huì)那么好。在此示例中，Turing在240W時(shí)達(dá)到60fps，而Ampere的性能曲線大約為90fps。可以肯定的是，這仍然是一個(gè)很大的改進(jìn)，但是每瓦性能僅提高了50％。最終，功耗效率的確切提高將取決于您在圖表中的采樣位置，但是很顯然，按照更常規(guī)的指標(biāo)定義，NVIDIA使用Ampere的功耗效率提高不會(huì)達(dá)到NVIDIA幻燈片所聲稱的90％。

　　所有這些都反映在新RTX 30系列卡的TDP中。RTX 3090消耗的功耗高達(dá)350瓦，甚至RTX 3080也消耗320W的功率。如果我們信奉NVIDIA的性能要求，RTX 3080提供的性能比RTX 2080高出100％，功耗增加了49％，那么每瓦性能的有效提高僅為34％。而RTX 3090的比較則更加苛刻，NVIDIA宣稱性能提高了50％，功耗增加了25％，那就意味著其凈功耗效率僅增加了20％。

　　最終，很明顯，NVIDIA在Ampere一代產(chǎn)品中獲得的大部分性能提升將來自更高的功耗限制。有了280億的晶體管，這些卡將變得更快，但是它將需要比以往更多的電源來點(diǎn)亮它們。

　　支持PAM的GDDR6X

　　除了核心GPU架構(gòu)本身之外，GA102還引入了對(duì)另一種新內(nèi)存類型的支持：GDDR6X。這是由Micron和NVIDIA開發(fā)的GDDR6演進(jìn)版技術(shù)，GDDR6X旨在通過在內(nèi)存總線上使用多級(jí)信令來實(shí)現(xiàn)更高的內(nèi)存總線速度（并因此獲得更大的內(nèi)存帶寬）。通過采用這種策略，NVIDIA和美光科技可以繼續(xù)推動(dòng)具有成本效益的獨(dú)立存儲(chǔ)技術(shù)的發(fā)展，從而繼續(xù)滿足NVIDIA最新一代GPU的要求。這標(biāo)志著NVIDIA在過去幾代產(chǎn)品中的第三種存儲(chǔ)技術(shù)，從GDDR5X到GDDR6再到GDDR6X。

　　美光公司上個(gè)月發(fā)布了有關(guān)該技術(shù)的一些早期技術(shù)文件時(shí)表示，通過采用脈沖幅度調(diào)制4（ulse Amplitude Modulation-4 ：PAM4），GDDR6X能夠每個(gè)時(shí)鐘發(fā)送四個(gè)不同的符號(hào)，實(shí)質(zhì)上是每個(gè)時(shí)鐘移動(dòng)兩位，而不是通常每個(gè)時(shí)鐘移動(dòng)一位。為了簡潔起見，我不會(huì)完全重述該討論，但我將重點(diǎn)介紹。

　　在非常高的水平上，PAM4與NRZ（二進(jìn)制編碼）的區(qū)別是使單個(gè)單元（或在這種情況下為傳輸）將保持的電氣狀態(tài)數(shù)增加一倍。PAM4使用4種信號(hào)電平，而不是傳統(tǒng)的0/1高/低信令，因此一個(gè)信號(hào)可以編碼為四種可能的兩位模式：00/01/10/11。這樣一來，PAM4可以承載的數(shù)據(jù)量是NRZ的兩倍，而不必將傳輸帶寬加倍，這將帶來更大的挑戰(zhàn)。

　　反過來，PAM4需要更復(fù)雜的存儲(chǔ)控制器和存儲(chǔ)設(shè)備來處理多種信號(hào)狀態(tài)，但同時(shí)也會(huì)降低存儲(chǔ)總線頻率，從而簡化了其他方面。對(duì)于NVIDIA來說，最重要的一點(diǎn)可能是它的電源效率更高，每位帶寬消耗降低約15％。可以肯定的是，總的DRAM功耗仍在上升，因?yàn)檫@遠(yuǎn)遠(yuǎn)超出了帶寬獲得的補(bǔ)償，但是DRAM上節(jié)省的每一焦耳都被應(yīng)用在GPU的其他方面。

　　根據(jù)美光的文件，該公司設(shè)計(jì)的第一代GDDR6X達(dá)到21Gbps。但是NVIDIA在這里顯得略為保守，RTX 3090的速度為19.5Gbps，RTX 3080的速度為19Gbps。即使在這些速度下，假設(shè)內(nèi)存總線大小相同的情況下，內(nèi)存帶寬仍比上一代卡提高了36％-39％。總體而言，這種進(jìn)展仍然是規(guī)范的例外。從歷史上講，我們通常看不到連續(xù)幾代產(chǎn)品都能獲得如此大的內(nèi)存帶寬。但是，隨著提供更多的SM，我只能想象NVIDIA的產(chǎn)品團(tuán)隊(duì)很高興擁有它。

　　但是，GDDR6X確實(shí)存在一個(gè)明顯的缺點(diǎn)：容量。

　　盡管美光計(jì)劃在將來開發(fā)16Gbit芯片，但從今天開始，他們將來只會(huì)生產(chǎn)8Gbit芯片。此密度與NVIDIA RTX 20系列卡及其GTX 1000系列卡上的存儲(chǔ)芯片相同。因此，至少對(duì)于這些卡而言，沒有“免費(fèi)”的存儲(chǔ)容量升級(jí)。RTX 3080僅獲得10GB的VRAM，而RTX 2080僅為8GB，這是因?yàn)槭褂昧溯^大的320位內(nèi)存總線（即10個(gè)芯片而不是8個(gè)芯片）。同時(shí)，RTX 3090獲得24GB的VRAM，但是只能通過在384位內(nèi)存總線上以clamshell 模式使用12對(duì)芯片，從而使存儲(chǔ)芯片的數(shù)量做到RTX 2080 Ti的兩倍多。

　　HDMI 2.1和AV1引入，VirtualLink出局

　　最后，在顯示I / O面板上，Ampere和新的GeForce RTX 30系列卡在此處進(jìn)行了幾個(gè)顯著更改。最重要的是，他們終于有了對(duì)HDMI 2.1的支持。HDMI 2.1已經(jīng)在電視中（并將在今年的主機(jī)中交付）面世，它為桌面帶來了一些功能，其中最引人注目的是支持更大的電纜帶寬。

　　HDMI 2.1電纜可以傳輸高達(dá)48Gbps的數(shù)據(jù)，是HDMI 2.0的2.6倍以上，從而可以提供更高的顯示分辨率和刷新率，例如以165Hz以上的頻率運(yùn)行的8K電視或4K顯示器。帶寬的飛躍甚至使HDMI領(lǐng)先于DisplayPort。DisplayPort 1.4僅提供大約66％的帶寬。雖然DisplayPort 2.0 最終會(huì)擊敗它，但目前看來，Ampere對(duì)于該技術(shù)而言還為時(shí)過早。

　　綜上所述，我仍在等待NVIDIA確認(rèn)其新GeForce卡是否支持全48Gbps信號(hào)速率。因?yàn)槟承〩DMI 2.1電視已經(jīng)發(fā)貨，支持更低的數(shù)據(jù)速率，因此，NVIDIA在這里做同樣的事情并非不可想象。

　　從游戲的角度來看，HDMI 2.1的其他功能是通過HDMI支持可變刷新率。但是，此功能不是HDMI 2.1獨(dú)有的，確實(shí)已經(jīng)被移植到NVIDIA的RTX 20卡，因此，隨著電纜帶寬的增加，對(duì)它的支持將在這里變得更加有用，但從技術(shù)上講，它并不是NVIDIA卡的新功能……

　　同時(shí)，RTX 20系列卡上引入的VirtualLink端口即將淘汰。業(yè)界試圖建立一個(gè)端口，以將視頻，數(shù)據(jù)和電源整合起來，用于VR頭戴式耳機(jī)中，但這個(gè)嘗試已經(jīng)失敗了，三大頭戴式VR制造商（Oculus，HTC，Valve）都沒有使用該端口。因此，您不會(huì)在RTX 30系列卡上找到該端口。

　　最后，當(dāng)我們討論視頻時(shí)，NVIDIA還確認(rèn)了新的Ampere GPU包括其NVDEC視頻解碼模塊的更新版本。該芯片制造商將這一功能提高到了NVIDIA所謂的Gen 5，增加了對(duì)新AV1視頻編解碼器的解碼支持。

　　人們普遍期望，即將出現(xiàn)的免版稅編解碼器將成為H.264 / AVC的事實(shí)上的繼任者，因?yàn)镠EVC進(jìn)入市場(chǎng)已經(jīng)有很多年了（并且最近所有的GPU都已經(jīng)支持了）。編解碼器附近的madcap專利使用費(fèi)情況不利于其采用。相比之下，AV1在分發(fā)中的使用應(yīng)提供與HEVC相似或略好于HEVC的質(zhì)量，但無需支付版稅，這使其對(duì)內(nèi)容供應(yīng)商的吸引力更大。迄今為止，AV1的一個(gè)缺點(diǎn)是CPU負(fù)擔(dān)很重，即使在高端臺(tái)式機(jī)中，硬件解碼支持也很重要，以便避免占用CPU資源并確保流暢，無干擾的播放。

　　NVIDIA在這里沒有詳細(xì)介紹其AV1支持的內(nèi)容，但是另一篇博客文章提到了10位色彩支持和8K解碼，因此聽起來NVIDIA已經(jīng)覆蓋了基礎(chǔ)。

　　同時(shí)，沒有提及對(duì)該公司NVENC區(qū)塊的進(jìn)一步改進(jìn)。最近針對(duì)Turing發(fā)布進(jìn)行了修改，從而擴(kuò)大了NVIDIA HEVC編碼功能的范圍以及整體HEVC和H.264圖像質(zhì)量。否則，對(duì)于硬件AV1編碼，我們還為時(shí)過早，因?yàn)樵摼幗獯a器的某些獨(dú)特屬性正在使硬件編碼更難破解。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

三星8nm工藝，最高售價(jià)1500美元，英偉達(dá)新一代顯卡面世

日期： 2020-09-02

來源：半導(dǎo)體行業(yè)觀察

相關(guān)內(nèi)容