《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動(dòng)態(tài) > 數(shù)據(jù)中心SSD存儲(chǔ)發(fā)展的幾大趨勢(shì):除了PCIe Gen5和AI,,還有這些……

數(shù)據(jù)中心SSD存儲(chǔ)發(fā)展的幾大趨勢(shì):除了PCIe Gen5和AI,,還有這些……

2021-02-26
來源: 電子工程專輯
關(guān)鍵詞: SSD存儲(chǔ) AI PCIeGen5

  無容置疑2020是非常特別的一年,疫情的初期由于防護(hù)和隔離的要求,在某種程度上影響了SSD的產(chǎn)能和銷售,,然而當(dāng)今高度互聯(lián)的世界很快就調(diào)整了過來,,充分利用網(wǎng)絡(luò)來進(jìn)行正常的商業(yè)生產(chǎn)和生活,,使得寬帶,,網(wǎng)絡(luò)會(huì)議,社交服務(wù)網(wǎng)站等有了急速的發(fā)展,,因此也帶動(dòng)了對(duì)高性能SSD的需求,。

  隨著超過100層的3D NAND的量產(chǎn),QLC逐步被PC OEM廠商采用,,NVMe標(biāo)準(zhǔn)提出了更多新的功能,,SSD存儲(chǔ)控制也在不斷發(fā)展。為此,我們專訪了英韌科技(上海)有限公司聯(lián)合創(chuàng)始人,、SoC設(shè)計(jì)副總裁賴的是先生,。英韌科技是專注于SSD主控芯片的一家國內(nèi)企業(yè)——這家公司在短時(shí)間內(nèi)就聲名鵲起。除了產(chǎn)品之外,,很大程度也是源自其最初的幾名創(chuàng)始人,,包括吳子寧博士、賴的是等此前都有Marvell這類老牌企業(yè)的工作經(jīng)驗(yàn),,比如吳子寧博士此前是Marvell的全球CTO,,而賴的是則是東芝美國高級(jí)研發(fā)總監(jiān)。

  在與賴的是的對(duì)話中,,我們大致可以窺見企業(yè)級(jí)尤其是數(shù)據(jù)中心SSD市場發(fā)展的幾個(gè)重要趨勢(shì),并且從中理解英韌科技預(yù)備為行業(yè)帶來的一些新的技術(shù),;同時(shí)也加深對(duì)于某些特定技術(shù)和應(yīng)用發(fā)展方向的理解,。

  微信圖片_20210226110407.jpg

  威剛?cè)ツ暾故镜倪_(dá)到7GB/s順序讀取速度的PCIe Gen4 SSD,采用Innogrit Rainier控制器

  PCIe Gen5提前到來

  賴的是在與我們對(duì)話中,,首先就提到了PCIe Gen5 SSD的即將到來,。這就讓人感到意外,因?yàn)槟壳癙CIe Gen4還正在普及之中,,PCIe Gen5為什么就要來了,?“Gen5比想象中來得要快一些。Intel打算明年正式實(shí)現(xiàn)Gen5的支持,。整個(gè)高端存儲(chǔ)產(chǎn)業(yè),,明年年初到年中,就會(huì)有一些Gen5的產(chǎn)品問世,。大概到2023年,,Gen5的產(chǎn)品可能會(huì)更多?!辟嚨氖潜硎?。

  英韌科技現(xiàn)有面向數(shù)據(jù)中心的Tacoma產(chǎn)品線,“我們準(zhǔn)備把Tacoma升級(jí)到PCIe Gen5”,。同時(shí)賴的是確認(rèn)了,,英韌科技明年就會(huì)有PCIe Gen5的SSD控制器產(chǎn)品推向市場。

  “事實(shí)上,,每代PCIe規(guī)格產(chǎn)品的迭代大概是5-8年,。Gen4的迭代可能會(huì)快一些,我們可能會(huì)以更快的速度跨入Gen5產(chǎn)品的支持,。Gen6則還需要一段時(shí)間,,要求也會(huì)很高?!?/p>

  Gen4的迭代為什么會(huì)更快,?賴的是補(bǔ)充說:“AMD在2019年7月7日發(fā)布了PCIe Gen4的chipset支持,。Intel在2020的下半年才有一些對(duì)應(yīng)的產(chǎn)品問世。Intel期望能夠挽回技術(shù)領(lǐng)導(dǎo)者位置,,立刻就準(zhǔn)備去支持PCIe Gen5,。”

  事實(shí)上在Intel晚于AMD近一年才推出PCIe Gen4之際,,市場就猜測(cè)Intel可能會(huì)更早地跳過Gen4過渡到Gen5,。在Intel的規(guī)劃表中,今年將推向市場的服務(wù)器平臺(tái)Sapphire Rapids(Willow Cove)會(huì)首次引入DDR5和PCIe Gen5支持,,而且支持的通道數(shù)上限還將更高,。

  與此同時(shí),明年推向市場的Intel首個(gè)大小核設(shè)計(jì)的Alder Lake,,以及AMD Zen 4都將實(shí)現(xiàn)對(duì)PCIe Gen5的支持,。另外,2019年Intel就宣布其CXL(Compute eXpress Link)緩存一致互聯(lián)就將建基于PCIe Gen5,。

  在我們看來,,這是x86陣營兩名市場玩家競爭,帶動(dòng)周邊I/O大跨步的體現(xiàn),。英韌科技作為PCIe Gen4 SSD控制芯片的領(lǐng)導(dǎo)者,,也將抓住PCIe Gen5的科技創(chuàng)新和領(lǐng)先的機(jī)會(huì)?!敖窈笥㈨g的產(chǎn)品會(huì)逐步變得普及,,各種應(yīng)用場景都會(huì)適配?!辟嚨氖钦f,,“我們會(huì)走向高端市場,比如說16個(gè)通道,,再加上PCIe Gen5市場,,去開辟我們的新增長點(diǎn)?!?/p>

  微信圖片_20210226110445.jpg

  “PCIe Gen5帶寬實(shí)際上就是PCIe Gen4的兩倍,,每個(gè)通道從 16 Gb/s變?yōu)?2 Gb/s,X8就是256Gb/s,。目前已經(jīng)有了100Gbps,、200Gbps的Ethernet Backbone, 用PCIe Gen5 X8去連接服務(wù)器所能實(shí)現(xiàn)的吞吐量就大了很多,?!?/p>

  雖然就目前來看, PCIe Gen5 “真正走進(jìn)消費(fèi)用戶或數(shù)據(jù)中心,應(yīng)該還需要一段時(shí)間,。PCIe Gen4目前剛剛進(jìn)入到數(shù)據(jù)中心領(lǐng)域,。服務(wù)器更新一般是4-5年為一個(gè)周期,產(chǎn)品后續(xù)淘汰20%-25%,。而且PCIe Gen5的產(chǎn)品也比較貴,。” 想必最早的PCIe Gen5產(chǎn)品會(huì)集中在企業(yè)級(jí)應(yīng)用上——正如Gen4最早應(yīng)用于數(shù)據(jù)中心,,如今開始普及到了消費(fèi)市場,。但由于當(dāng)前市場的特殊性,PCIe Gen5大約的確會(huì)提前來到,。先一步有PCIe Gen5的產(chǎn)品落地將是英韌科技這類技術(shù)領(lǐng)先的高端應(yīng)用企業(yè)間的新一輪的較量,,也很有可能成為新的市場格局建立的起點(diǎn)。

  存儲(chǔ)中的AI技術(shù)

  英韌科技聯(lián)合創(chuàng)始人,、董事會(huì)董事長兼CEO吳子寧博士在FMS 2019(閃存峰會(huì))上曾經(jīng)做過題為《怎樣通過系統(tǒng)與控制器優(yōu)化,,實(shí)現(xiàn)2倍吞吐和IOPS(How to get 2x throughput and IOPS by System and Controller Optimization)》的演講。英韌科技也是較早提出“智能存儲(chǔ)”,,或者“AI存儲(chǔ)”的企業(yè)之一。

  這項(xiàng)技術(shù)預(yù)期是應(yīng)用在英韌科技的Tacoma控制器中的,,意即主要面向數(shù)據(jù)中心,。

  賴的是在采訪中向我們解釋了AI在SSD存儲(chǔ)中的價(jià)值?!坝袀€(gè)冷熱數(shù)據(jù)的概念,,我們已經(jīng)驗(yàn)證了在SSD存儲(chǔ)過程中對(duì)冷熱數(shù)據(jù)進(jìn)行區(qū)分的實(shí)現(xiàn)方法。什么是冷熱數(shù)據(jù)呢,?如果某段空間頻繁讀寫,,那么這就成為了熱數(shù)據(jù);一段空間很長時(shí)間采取讀寫一次,,那么就是冷數(shù)據(jù),。”

  “我們知道,,SSD的PE cycle(Program/Erase Cycle)是有限的,。如果頻繁讀寫某一段空間而不做特殊處理,就會(huì)影響整體SSD的壽命,。如果能夠?qū)⒗?、熱?shù)據(jù)分開,熱的數(shù)據(jù)比如說放到SLC或者其他PE cycle更久的NAND區(qū)間,,整個(gè)SSD的壽命就會(huì)增加不少,。這是個(gè)使用趨勢(shì)。”

  “對(duì)于數(shù)據(jù)中心這類應(yīng)用而言,,我相信這樣的技術(shù)能夠帶來性能上的提升,。”雖然賴的是很謙虛地表示目前仍在“嘗試以后會(huì)不會(huì)變成流行,,能不能給客戶帶來利益”,,并表示“希望它會(huì)成為趨勢(shì)”,但我們認(rèn)為其發(fā)展?jié)摿θ匀皇窍喈?dāng)之甚的,,足以成為企業(yè)級(jí)或至少數(shù)據(jù)中心類SSD發(fā)展的技術(shù)趨勢(shì),。

  吳子寧博士在閃存峰會(huì)上的主題演講提到,“英韌科技找到一種方法,,基于這些SCM構(gòu)建低時(shí)延SSD,。結(jié)合網(wǎng)絡(luò)(NVMeOF)、軟件(新型的文件系統(tǒng))上的改進(jìn),,我們能夠?qū)⒄w訪問時(shí)延縮減85%(從遠(yuǎn)程服務(wù)器獲取數(shù)據(jù)),。”吳子寧博士說,。

  其中針對(duì)時(shí)延占比較高的SSD,,下面這張圖是當(dāng)時(shí)吳子寧博士提到降低SSD時(shí)延,各部分的方法,。比如SCM介質(zhì)替代TLC NAND;英韌科技開發(fā)的新型ECC架構(gòu)將控制器的時(shí)延降低至5ms;再加上PCIe Gen4將傳輸時(shí)間減半,。“

微信圖片_20210226110537.jpg

  這個(gè)數(shù)據(jù)應(yīng)該是基于XL-FLASH(鎧俠,、西數(shù)推的一種SCM),,相比一般的TLC NAND實(shí)現(xiàn)了據(jù)說將近10倍的讀取時(shí)延縮減,亦極大增加了IOPS(IO per second),。

  雖然SCM很快,,但同時(shí)成本高、容量小,?!币齑蠖斓拇鎯?chǔ),最符合直覺的方法應(yīng)該是把TLC和SCM結(jié)合起來,?!啊标P(guān)鍵是把熱數(shù)據(jù)(hot data)放進(jìn)SCM中,能夠?qū)崿F(xiàn)快速存儲(chǔ),;而將冷數(shù)據(jù)(cold data)放進(jìn)TLC中,,以降低成本?!?/p>

  不過怎么才能知道數(shù)據(jù)是”冷“的還是”熱“的呢,?這其實(shí)就是”智能存儲(chǔ)“這個(gè)稱謂的由來,。英韌科技就應(yīng)用了AI,或者說神經(jīng)網(wǎng)絡(luò),。首先是做數(shù)據(jù)識(shí)別的模型訓(xùn)練,,喂的數(shù)據(jù)是PC用戶數(shù)據(jù)時(shí),據(jù)說能夠?qū)崿F(xiàn)99.94%的精度,;針對(duì)企業(yè)數(shù)據(jù)應(yīng)用另外的模型,,則可實(shí)現(xiàn)94.72%的精度?;诖嗽诳刂破髦屑尤肜?熱數(shù)據(jù)的預(yù)測(cè)器,。

微信圖片_20210226110605.jpg

  在控制器芯片中,這個(gè)預(yù)測(cè)器應(yīng)該是個(gè)專門的硬件單元,。輸入是用戶數(shù)據(jù),,輸出則是冷熱數(shù)據(jù)標(biāo)簽(flag)。存儲(chǔ)管理模塊利用這些數(shù)據(jù)標(biāo)簽,,將對(duì)應(yīng)的熱數(shù)據(jù)放到SCM中,,將冷數(shù)據(jù)放進(jìn)TLC NAND。當(dāng)然這種設(shè)定在英韌現(xiàn)有架構(gòu)的實(shí)施方案中,,可能具備了更大的彈性,。

  這個(gè)架構(gòu)被英韌科技稱作Tacoma架構(gòu),即利用CPU和專門的神經(jīng)網(wǎng)絡(luò)加速器進(jìn)行冷熱數(shù)據(jù)的預(yù)測(cè),。應(yīng)該也是英韌科技Tacoma系列產(chǎn)品名的由來,。結(jié)合XL-Flash,AI技術(shù),,各種讀寫、檢索操作相比沒有應(yīng)用這些技術(shù)的普通SSD(雖然keynote上并沒有明確對(duì)比對(duì)象),,吞吐增加將近2倍,。而且它相比由應(yīng)用去說明冷/熱數(shù)據(jù),具備了比較出色的自適應(yīng)性,。

  我們特別詢問賴的是,,應(yīng)用于Tacoma的AI專用硬件IP,是否來自英韌科技自己,?!币膊皇且婚_始就是自己的。存儲(chǔ)中應(yīng)用AI,,我們自己也一直在摸索的過程中,。剛開始我們用的是NVDLA(Nvidia Deep Learning Accelerator)?!百嚨氖钦f,,”后來逐步發(fā)現(xiàn)我們的方向,,包括聽取了客戶的需求,跟之前有一些不符,,所以我們就開始自己做,。“

  RISC-V成為選擇之一

  去年11月份,,SiFive發(fā)布的博客文章中提到SiFive和英韌科技合作,,英韌科技未來的SSD控制器可能會(huì)采用SiFive 7-Series核心IP。賴的是表示,,”我們一直與ARM緊密合作,,目前所有的SSD控制器都使用ARM的CPU。由于RISC-V 逐步成熟,,加上我們有不少客戶在要求我們對(duì)RISC-V的支持,,我們開始考慮把RISC-V作為選擇之一,從而開始和SiFive以及國內(nèi)的StarFive(賽昉科技)進(jìn)行了技術(shù)討論,,探討未來可能的合作,。“

  ”我們對(duì)SiFive和StarFive的RISC-V CPU做過一些測(cè)試,,我們覺得其潛力不錯(cuò),。其性能和ARM R5系列類似,設(shè)計(jì)比較靈活,,同時(shí)也有某些對(duì)SSD控制比較友好的功能,。“賴的是說,。

  SiFive也的確在宣傳頁上,,提及SiFive面向存儲(chǔ)市場的的7 series。雖然我們不清楚英韌預(yù)備在未來推的產(chǎn)品具體會(huì)采用哪個(gè)IP,,不過SiFive方面曾提及ISC(In-Storage Computing) SoC所需的一些關(guān)鍵特性,。這些特性,實(shí)則也能幫我們更深入地理解,,SSD主控芯片中的處理器,,究竟有什么獨(dú)特。

  這些特性包括:(1)低時(shí)延,、實(shí)時(shí)地執(zhí)行數(shù)據(jù)移動(dòng),,以及智能的損耗均衡管理,實(shí)現(xiàn)SSD壽命延長,、增強(qiáng)SSD存儲(chǔ)設(shè)備的可靠性,。(2)跑Linux應(yīng)用,實(shí)現(xiàn)各種數(shù)據(jù)處理,、數(shù)據(jù)分析,、AI計(jì)算,,在存儲(chǔ)設(shè)備內(nèi)執(zhí)行;也包括追蹤,、debug,、高級(jí)中斷控制、安全,、硬件加密等,。(3)”在全球范圍內(nèi),降低商業(yè)風(fēng)險(xiǎn),,加強(qiáng)產(chǎn)品可用性“,。

  以上幾點(diǎn)看起來是相當(dāng)契合英韌科技SSD控制器產(chǎn)品需求的,當(dāng)然還有Silicon Proven實(shí)現(xiàn)層面的問題等等,。其中技術(shù)選擇多元化,、”降低商業(yè)風(fēng)險(xiǎn)“ 大約也是英韌科技作為一家中國企業(yè),開始選擇RISC-V的原因,。

  西數(shù)一直以來就是RISC-V的支持者,,2017年就宣布準(zhǔn)備將HDD、SSD和存儲(chǔ)系統(tǒng)的處理器轉(zhuǎn)向RISC-V,,其SweRV核心就是RISC-V架構(gòu),;此前希捷面向HDD也宣布利用RISC-V控制器做HDD磁頭定位的運(yùn)動(dòng)控制信息處理;韓國FADU很早之前就有RISC-V SSD解決方案……或許現(xiàn)有市場環(huán)境,,對(duì)RISC-V而言,,是個(gè)相當(dāng)難得的契機(jī)。

  未來的更多機(jī)遇

  英韌科技作為成立僅4年的初創(chuàng)企業(yè),,已經(jīng)實(shí)現(xiàn)了3顆芯片的流片和量產(chǎn),,產(chǎn)品落地效率還是相當(dāng)之快的。所以此前CES展一些成熟的SSD產(chǎn)品上都能見到其身影,。在我們看來,,這類有豐富行業(yè)經(jīng)驗(yàn)的技術(shù)領(lǐng)軍人物帶領(lǐng)的年輕企業(yè),眼中的機(jī)遇大概是更能代表存儲(chǔ)行業(yè)未來的,。除了上述幾個(gè)相關(guān)SSD的幾個(gè)重要趨勢(shì)外,,賴的是在談?dòng)㈨g科技著眼的方向時(shí),,主要提到了兩點(diǎn),。

  ”一方面是PCIe,剛才已經(jīng)提到過了,,我們可能會(huì)更快地跨入到Gen5產(chǎn)品的支持,。“賴的是說,。

  ”而在閃存方面,,接口速率也在不斷提升,。從800 MT/s,到1.2 GT/s,、1.6 GT/s甚至更高,。這也是我們要投入和保持領(lǐng)先的一個(gè)方向?!?/p>

  ”控制器本身要根據(jù)這兩邊的情況往前走,,我們一直在做相關(guān)的開發(fā)和跟進(jìn)。隨著對(duì)于這些方向的理解,,AI存儲(chǔ)就是為了解決怎樣更高效地使用存儲(chǔ)的問題,,存儲(chǔ)就成為了一個(gè)存儲(chǔ)系統(tǒng)?!?/p>

  ”我們?cè)谶@方面都有規(guī)劃,,包括數(shù)據(jù)處理的加速,還有存儲(chǔ)系統(tǒng)本身,。比如最新的一些存儲(chǔ)系統(tǒng),,像是ZNS(Zoned Namespaces)、Key-Value Object storage的支持等等,,都會(huì)是我們關(guān)注和投入的方面,。“這些機(jī)遇,,理論上應(yīng)當(dāng)也是其他SSD控制器市場玩家的機(jī)遇,。

微信圖片_20210226110755.jpg

  英韌科技目前面向市場的策略似乎是首先由Shasta、Shasta+以及Rainier,,打開消費(fèi)級(jí),、企業(yè)級(jí)及工業(yè)級(jí)市場,擴(kuò)大產(chǎn)量和用戶群,?!蔽覀冞€會(huì)有一些迭代,把性能做得更好,、功耗做得更低,,同時(shí)降低成本,讓客戶能夠從中受益,。那么今后的產(chǎn)品會(huì)更為普及,。各種應(yīng)用場景都會(huì)有。包括逐步在數(shù)據(jù)中心這樣的市場上一展拳腳,?!?/p>

  面向高端客戶端、數(shù)據(jù)中心和企業(yè)級(jí)應(yīng)用的Rainier和Tacoma系列控制器都選擇了臺(tái)積電的12nm工藝,?!敝暗腜CIe Gen3,,選擇的節(jié)點(diǎn)是28nm,PCIe Gen4我們用的節(jié)點(diǎn)是12nm,。簡單地說,,這個(gè)節(jié)點(diǎn)的優(yōu)勢(shì)在die size上,12nm大概是28nm的一半,?!?/p>

  ”而在功耗方面,12nm大概是28nm的40%左右,。假設(shè)要是用28nm去實(shí)現(xiàn)PCIe Gen4的話,,功耗會(huì)比較大?!?這應(yīng)該是為英韌科技做企業(yè)市場開拓的組成部分,。尤其像Tacoma這樣融合了各種尖端技術(shù)的SSD控制器,會(huì)是我們更加樂見的,。

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]