將GDDR6的優(yōu)勢(shì)從圖形計(jì)算擴(kuò)展至高性能網(wǎng)絡(luò)應(yīng)用
2020-02-17
作者:Achronix資深現(xiàn)場(chǎng)應(yīng)用工程師 袁光(Kevin Yuan)
來源:Achronix
等線簡(jiǎn)介:隨著網(wǎng)絡(luò)和數(shù)據(jù)中心帶寬需求的日益提升,針對(duì)高性能內(nèi)存解決方案的需求也是水漲船高,。對(duì)于超過 400 Gbps 的系統(tǒng)開發(fā),,以經(jīng)濟(jì)高效的方式實(shí)現(xiàn)內(nèi)存方案的性能和效率已經(jīng)成為項(xiàng)目中的重要挑戰(zhàn)之一。
1. 概述
隨著網(wǎng)絡(luò)和數(shù)據(jù)中心帶寬需求的日益提升,,針對(duì)高性能內(nèi)存解決方案的需求也是水漲船高,。對(duì)于超過 400 Gbps 的系統(tǒng)開發(fā),以經(jīng)濟(jì)高效的方式實(shí)現(xiàn)內(nèi)存方案的性能和效率已經(jīng)成為項(xiàng)目中的重要挑戰(zhàn)之一,。
圖形雙數(shù)據(jù)速率 (GDDR) 內(nèi)存最初是為了滿足游戲機(jī)和PC的高性能圖形計(jì)算需求而開發(fā)的,,自2008年面市至今歷經(jīng)十余載,已經(jīng)在市場(chǎng)中久經(jīng)考驗(yàn),,如今也正被應(yīng)用于網(wǎng)絡(luò)和數(shù)據(jù)中心領(lǐng)域等其他領(lǐng)域,,為產(chǎn)品提供低風(fēng)險(xiǎn)、靈活而又經(jīng)濟(jì)高效內(nèi)存解決方案,。
在接下來的章節(jié)中,本文將首先分享推動(dòng)這些高帶寬和高性能需求的網(wǎng)絡(luò)行業(yè)宏觀趨勢(shì),,然后討論GDDR6如何以比當(dāng)今任何其他高帶寬內(nèi)存解決方案更好地滿足這些需求,,最后介紹Achronix Speedster7t FPGA產(chǎn)品中的GDDR6控制器。
我們將會(huì)陸續(xù)推出關(guān)于GDDR6其他有用知識(shí)的系列文章,,比如GDDR6構(gòu)架和基本使用方法,,存取帶寬與延遲的性能測(cè)評(píng),網(wǎng)絡(luò)應(yīng)用參考設(shè)計(jì),,以及如何應(yīng)對(duì)GDDR6系統(tǒng)級(jí)設(shè)計(jì)中的信號(hào)完整性挑戰(zhàn),,敬請(qǐng)關(guān)注。
2. 網(wǎng)絡(luò)行業(yè)趨勢(shì)
思科在2019年發(fā)布的可視化網(wǎng)絡(luò)指數(shù)(Visual Networking Index)報(bào)告[1]稱,,2017 年全球互聯(lián)網(wǎng)IP流量月均為 122 EB (1018 Bytes),,預(yù)計(jì) 到2022 年將增加到 396 EB,復(fù)合年增長(zhǎng)率 (CAGR) 為 26%,,這一趨勢(shì)大部分與大數(shù)據(jù)的興起和不斷增長(zhǎng)的視頻流量有關(guān),。
圖 1:全球互聯(lián)網(wǎng)IP流量預(yù)測(cè)(Cisco VNI 2017-2022)[1]
同一研究[1]預(yù)測(cè),,智能手機(jī)和平板電腦等接入設(shè)備的數(shù)量將從 2017 年的 180 億臺(tái)增長(zhǎng)到 2022 年的 285 多億臺(tái)設(shè)備(圖 2),屆時(shí)人均所擁有的網(wǎng)絡(luò)接入設(shè)備數(shù)量將達(dá)到 3.6臺(tái),。得益于5G以及物聯(lián)網(wǎng)(IoT)的發(fā)展,,2022年總連接節(jié)點(diǎn)數(shù)量中M2M設(shè)備的數(shù)量將超過50%。
圖 2:需要連接的網(wǎng)絡(luò)設(shè)備(Cisco VNI 2017-2022)[1]
3. 是什么在推動(dòng)網(wǎng)絡(luò)需求,?
幾個(gè)重要領(lǐng)域的增長(zhǎng)正在推動(dòng)網(wǎng)絡(luò)行業(yè)中這些前所未有的需求:
移動(dòng)數(shù)據(jù)和互聯(lián)網(wǎng)視頻:通過互聯(lián)網(wǎng)按需訪問數(shù)據(jù)和高清視頻的需求不斷增加,。(此處不包含非按需的網(wǎng)絡(luò)訪問,比如占據(jù)全網(wǎng)流量25%以上的DDoS攻擊)
物聯(lián)網(wǎng) (IoT): 物聯(lián)網(wǎng)正在增加必須訪問網(wǎng)絡(luò)的設(shè)備數(shù)量,,如可穿戴設(shè)備,、智能家電和汽車。
云服務(wù):無數(shù)企業(yè)正在將其服務(wù)遷移到云中,,云端的創(chuàng)新業(yè)務(wù)也在不斷的增加,。
大數(shù)據(jù)分析:要使復(fù)雜網(wǎng)絡(luò)的所有部分都高效運(yùn)行,網(wǎng)絡(luò)中的邊緣設(shè)備必須通過智能的數(shù)據(jù)分析,,來更好,、更快地了解其攜帶的數(shù)據(jù)。
總之,,更多的用戶,、更多的設(shè)備、更大的屏幕,,以及更多樣的云端服務(wù)正在推動(dòng) IP 流量呈指數(shù)級(jí)增長(zhǎng),。在增長(zhǎng)沒有放緩跡象的情況下,我們?nèi)绾卧O(shè)計(jì)產(chǎn)品以滿足這些要求,?
4. 為什么使用GDDR6,?
原因1:極佳的性能
如今,GDDR6的密度已經(jīng)做到16Gbits,,與最高容量的 DDR4 內(nèi)存芯片一致,。GDDR6 器件的帶寬高達(dá)512Gb/s,是DDR4 的 10 倍,。在未來,,GDDR6將按照標(biāo)準(zhǔn)向更高容量更快速度演進(jìn)。GDDR6的這些優(yōu)勢(shì),,使其成為滿足現(xiàn)代網(wǎng)絡(luò)需求的理想選擇,。
圖3: DDR vs. GDDR 容量比較 [2]
圖4: DDR vs. GDDR 帶寬比較 [2]
原因2:降低總擁有成本
在考慮總擁有成本 (TCO) 時(shí),請(qǐng)務(wù)必考慮設(shè)計(jì)的所有方面,。圖 5 比較了三種不同的方法,,以滿足 1Tb 交換應(yīng)用程序的需求。如圖所示,,相對(duì)于DDR4,,采用GDDR6 不僅可以將設(shè)計(jì)復(fù)雜性降低80%,,還可以減少 82% 的PCB面積占用,并將能效提高 44%,。
圖5: 各種主流內(nèi)存方案的總擁有成本(TCO)比較 [2]
原因3:輕松設(shè)計(jì)
如果您已經(jīng)熟悉傳統(tǒng)的DDR 設(shè)計(jì),,則使用 GDDR 內(nèi)存進(jìn)行設(shè)計(jì)將是一種熟悉的低風(fēng)險(xiǎn)體驗(yàn)。對(duì)邏輯工程師和軟件工程師來說,,GDDR6 與傳統(tǒng)DDR技術(shù)使用的方法類似,,Speedster7t FPGA 所內(nèi)建的GDDR6控制器進(jìn)一步簡(jiǎn)化了設(shè)計(jì)。對(duì)于硬件工程師來說,,GDDR6 的高速單端SerDes信號(hào)管腳與DDR的低速信號(hào)管腳的設(shè)計(jì)規(guī)則區(qū)別較大,,Achronix將提供高速信號(hào)設(shè)計(jì)手冊(cè)以及參考設(shè)計(jì),幫助客戶低風(fēng)險(xiǎn)地從DDR遷移到GDDR6,。
如果您已經(jīng)熟悉GDDR5設(shè)計(jì),,那么過渡至GDDR6將是非常順滑的設(shè)計(jì)體驗(yàn)。GDDR6 和 GDDR5 之間的主要區(qū)別與封裝和引腳相關(guān),,遵循相同的設(shè)計(jì)實(shí)踐,。
5. Achronix Speedster7t FPGA產(chǎn)品中的GDDR6控制器
Achronix 半導(dǎo)體的 Speedster7t FPGA 系列針對(duì)高帶寬工作負(fù)載進(jìn)行了優(yōu)化,消除了與傳統(tǒng) FPGA 相關(guān)的性能瓶頸,。Speedster7t FPGA 基于臺(tái)積電的 7nm FinFET 工藝技術(shù),,采用革命性的新型 2D 片上網(wǎng)絡(luò) (NoC)和獨(dú)創(chuàng)的機(jī)器學(xué)習(xí)處理器 (MLP)矩陣,并利用高帶寬 GDDR6 接口,、400G 以太網(wǎng)和 PCI Express Gen5 端口等IP,,可提供 ASIC 級(jí)性能,同時(shí)保留完整的編程性能,。
圖6: Achronix Speedster7t1500 高性能FPGA 構(gòu)架 [3]
Speedster7t FPGA 設(shè)計(jì)具有多達(dá)8個(gè) GDDR6 控制器,,以較低的成本提供最快的訪問速度,同時(shí)保證相當(dāng)于LPDDR5水平的低功耗,。每個(gè) GDDR6控制器支持多達(dá) 32 位數(shù)據(jù),,總共支持4Tbps的內(nèi)存帶寬。 GDDR6 控制器和 PHY 是硬 IP,,無需消耗FPGA中的可編程邏輯資源,,也無需面對(duì)布局布線所帶來的時(shí)序收斂挑戰(zhàn),。這些特征共同使GDDR6 SDRAM 接口成為下一代系統(tǒng)設(shè)計(jì)的絕佳選擇,。
參考文獻(xiàn):
1.Visual Networking Index: Forecast and Trends, 2017–2022. Cisco, 2019
2.Extending the Benefits of GDDR Beyond Graphics. Micron, 2017
3.Achronix official website http://www.achronix.com