隨著人工智能和元宇宙等對于高性能計(jì)算有強(qiáng)烈需求的應(yīng)用逐漸成為半導(dǎo)體行業(yè)的新市場驅(qū)動(dòng),內(nèi)存的性能發(fā)展也成了這些應(yīng)用的重要支撐,,這也成為內(nèi)存行業(yè)繼續(xù)大力投入新技術(shù)發(fā)展的重要?jiǎng)恿Α?/p>
在這些高性能計(jì)算系統(tǒng)中,,內(nèi)存帶寬和容量將決定計(jì)算性能(例如人工智能算法中需要的大容量神經(jīng)網(wǎng)絡(luò)模型計(jì)算,以及元宇宙應(yīng)用中的高性能渲染技術(shù)),,這也就是高性能計(jì)算領(lǐng)域人們常常提及的“內(nèi)存墻”,。在許多高性能計(jì)算應(yīng)用中,事實(shí)上邏輯計(jì)算并非整個(gè)系統(tǒng)的瓶頸,,而數(shù)據(jù)存取才是整個(gè)系統(tǒng)速度的決定性因素,。一方面,內(nèi)存芯片技術(shù)需要進(jìn)一步提升帶寬和容量,,而另一方面則需要在設(shè)計(jì)整體系統(tǒng)時(shí),,確保有高效的內(nèi)存存取機(jī)制,從而打破內(nèi)存墻的限制,,進(jìn)一步提升高性能計(jì)算的性能,。
上周,三星召開了2022年技術(shù)發(fā)布會(huì)(Tech Day 2022),其中發(fā)布了三星在未來幾年內(nèi)的內(nèi)存技術(shù)發(fā)展路線圖,。從中,,我們認(rèn)為其對于內(nèi)存發(fā)展的主題圍繞著“更快,更大,,更智能”幾個(gè)方向,,這也與前面所討論的高性能計(jì)算對于內(nèi)存的需求相吻合。由于三星是內(nèi)存芯片領(lǐng)域的領(lǐng)導(dǎo)者,,我們認(rèn)為它公布的路線圖將會(huì)很大程度上反映整體內(nèi)存芯片行業(yè)的發(fā)展動(dòng)向,。
更快:新內(nèi)存接口將成為突破內(nèi)存墻的主力
內(nèi)存接口決定了整體系統(tǒng)可以以多快的速度存取內(nèi)存里面的數(shù)據(jù),因此也是決定了整體系統(tǒng)性能的重要因素,。隨著新一代內(nèi)存接口的問世,,高性能計(jì)算系統(tǒng)的性能也可望得到進(jìn)一步提升。
在三星公布的內(nèi)存接口路線圖中,,我們可以看到涵蓋不同領(lǐng)域的內(nèi)存接口演進(jìn)的速度,。首先,在云端高性能服務(wù)器領(lǐng)域,,HBM已經(jīng)成為了高端GPU的標(biāo)配,,這也是三星在重點(diǎn)投資的領(lǐng)域之一。HBM的特點(diǎn)是使用高級封裝技術(shù),,使用多層堆疊實(shí)現(xiàn)超高IO接口寬度,,同時(shí)配合較高速的接口傳輸速率,從而實(shí)現(xiàn)高能效比的超高帶寬,。
在三星發(fā)布的路線圖中,,2022年HBM3技術(shù)已經(jīng)量產(chǎn),其單芯片接口寬度可達(dá)1024 bit,,接口傳輸速率可達(dá)6.4 Gbps,,相比上一代提升1.8倍,從而實(shí)現(xiàn)單芯片接口帶寬819 GB/s,,如果使用6層堆疊可以實(shí)現(xiàn)4.8 TB/s的總帶寬,。而在三星公布的路線圖上,,2024年預(yù)計(jì)將實(shí)現(xiàn)接口速度高達(dá)7.2 Gbps的HBM3p,,從而將數(shù)據(jù)傳輸率相比這一代進(jìn)一步提升10%,從而將堆疊的總帶寬提升到5 TB/s以上,。另外,,這里的計(jì)算還沒有考慮到高級封裝技術(shù)帶來的高多層堆疊和內(nèi)存寬度提升,我們預(yù)計(jì)到時(shí)候單芯片和堆疊芯片到2024年HBM3p都將實(shí)現(xiàn)更多的總帶寬提升,。而這也將會(huì)成為人工智能應(yīng)用的重要推動(dòng)力,,我們預(yù)計(jì)在2025年之后的新一代云端旗艦GPU中看到HBM3p的使用,從而進(jìn)一步加強(qiáng)云端人工智能的算力,。
除了HBM之外,,在桌面和移動(dòng)應(yīng)用中,,渲染也正在成為元宇宙相關(guān)應(yīng)用的重要支柱。例如,,在虛擬現(xiàn)實(shí)應(yīng)用中,,為了實(shí)現(xiàn)沉浸感,對于圖像渲染的需求越來越強(qiáng),。高端虛擬現(xiàn)實(shí)設(shè)備會(huì)使用桌面級GPU做渲染,,并且將渲染的圖像通過串流傳回虛擬現(xiàn)實(shí)設(shè)備中,而目前最流行的虛擬現(xiàn)實(shí)一體機(jī)則會(huì)需要使用移動(dòng)級GPU在一體機(jī)中直接做圖像渲染,。這些應(yīng)用都需要越來越大的顯存帶寬,,而三星這次發(fā)布的GDDR7(針對桌面級應(yīng)用)和LPDDR5X(針對移動(dòng)級應(yīng)用)都是針對這些應(yīng)用的重要技術(shù)支柱。其中LPDDR5X的IO數(shù)據(jù)率可達(dá)8.5 Gbps,,比之前LPDDR5(6.4 Gbps)提升30%,,而GDDR7的IO速率可達(dá)36 Gbps,是之前GDDR6的兩倍,。
總體來說,,這次三星從內(nèi)存接口角度公布的路線圖顯示了從“更快”的角度,三星將進(jìn)一步成為內(nèi)存業(yè)界的領(lǐng)跑者之一,,從而為半導(dǎo)體行業(yè)的進(jìn)一步賦能人工智能和元宇宙等下一代應(yīng)用提供支持,。
更大:芯片和系統(tǒng)級創(chuàng)新將成為更大內(nèi)存系統(tǒng)的關(guān)鍵
隨著人工智能技術(shù)的演進(jìn),神經(jīng)網(wǎng)絡(luò)模型的參數(shù)也在越來越多(今年已經(jīng)全面走向十億級參數(shù)規(guī)模,,未來幾年預(yù)期將進(jìn)一步實(shí)現(xiàn)數(shù)量級上的提升),,而計(jì)算中需要使用的中間結(jié)果存儲(chǔ)需求也對DRAM的容量提出新的需求。
為了滿足這樣對于存儲(chǔ)容量的需求,,我們同時(shí)需要芯片級和系統(tǒng)級的解決方案,。在芯片層面,三星給出的答案是新一代使用1b(12 nm)特征尺寸生產(chǎn)的DRAM,,從而實(shí)現(xiàn)更大的集成度,。三星宣布1b DRAM將會(huì)在2023年量產(chǎn),這也意味著三星在DRAM領(lǐng)域進(jìn)一步鞏固自己領(lǐng)先的地位,。
除了芯片級方案之外,,系統(tǒng)級方案也是增加內(nèi)存容量的重要方向。例如,,在云端服務(wù)器市場,,使用CXL技術(shù)做內(nèi)存擴(kuò)展就是一個(gè)很有潛力的方向。使用CXL做內(nèi)存擴(kuò)展的原理是把大量DRAM芯片集成在同一張內(nèi)存擴(kuò)展卡里,,然后使用CXL主控芯片使用CXL協(xié)議接入高速接口中(PCIe),,從而可以供系統(tǒng)直接使用,而無需占用DRAM插槽和接口,以起到內(nèi)存容量擴(kuò)展的作用,。
今年早些時(shí)候,,三星公布了自己基于CXL內(nèi)存擴(kuò)展技術(shù)的最新結(jié)果,其中使用了為了CXL專門開發(fā)的ASIC主控芯片,,并且在機(jī)器學(xué)習(xí)等重要應(yīng)用中取得了和使用傳統(tǒng)DDR內(nèi)存接口幾乎一樣的性能,,從而表明使用CXL做DRAM容量擴(kuò)展從性能而言將是一個(gè)可行的技術(shù)方案,目前主要需要解決的是成本方面的考量,,從而讓該技術(shù)進(jìn)一步得到應(yīng)用,。
三星這次也公布了自己在CXL領(lǐng)域的持續(xù)投資,未來我們預(yù)計(jì)將看到更多CXL內(nèi)存擴(kuò)展方面的產(chǎn)品,。我們預(yù)計(jì),,CXL首先會(huì)在對于內(nèi)存容量有巨大需求且對于性能有強(qiáng)烈需求的應(yīng)用中(例如超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型)開始得到使用,并且在未來越來越多地?cái)U(kuò)展到其他應(yīng)用中去,。
更智能:存內(nèi)計(jì)算可望成為下一代內(nèi)存新范式
除了在更大和更快兩方面有提升之外,,三星另一個(gè)布局方向是智能化DRAM,即針對機(jī)器學(xué)習(xí)和人工智能等應(yīng)用使用存內(nèi)計(jì)算和近內(nèi)存計(jì)算這樣的新技術(shù),。
三星主要的存內(nèi)計(jì)算技術(shù)稱為HBM-PIM,,其中PIM即存內(nèi)計(jì)算(process in memory)的縮寫。其具體原理是在HBM內(nèi)存中直接集成計(jì)算單元,。傳統(tǒng)的計(jì)算過程中,,首先會(huì)從內(nèi)存中讀出數(shù)據(jù),然后在其他芯片中的計(jì)算單元中做計(jì)算,,然后把結(jié)果寫回內(nèi)存,。而在HBM-PIM中,三星的技術(shù)路徑是在給DRAM的指令不僅僅是讀取和寫入,,也可以直接是計(jì)算,,例如可以給“寫入數(shù)據(jù)A同時(shí)將該數(shù)據(jù)和B相加”,這樣在下次讀出時(shí),,直接就得到已經(jīng)計(jì)算過的數(shù)據(jù),,而無需再次讀出并做計(jì)算。這樣就節(jié)省了大量額外的數(shù)據(jù)移動(dòng)開銷,,能實(shí)現(xiàn)更好的延遲和能效比,。目前,三星已經(jīng)在HBM2的DRAM中完成了第一代HBM-PIM的開發(fā)(Aquabolt),,而在三星公布的路線圖中,,我們也看到了HBM3-PIM列上了日程,,預(yù)計(jì)在2024年完成開發(fā),。
除了存內(nèi)計(jì)算之外,另一種技術(shù)方案是在DRAM旁邊直接集成加速器邏輯以降低訪問內(nèi)存的開銷,這樣的技術(shù)三星稱為AXDIMM(accelerator DIMM),,在三星公布的路線圖上預(yù)計(jì)2024-2025年完成開發(fā),。
我們認(rèn)為,三星在智能化DRAM方面的布局從長遠(yuǎn)來看將會(huì)對內(nèi)存技術(shù)和市場格局有深遠(yuǎn)影響,,未來隨著機(jī)器學(xué)習(xí)等應(yīng)用對于內(nèi)存訪問提出進(jìn)一步需求,,我們認(rèn)為這樣的技術(shù)將有機(jī)會(huì)獲得主流系統(tǒng)廠商越來越多的應(yīng)用。
結(jié)語
隨著人工智能等應(yīng)用的演進(jìn),,DRAM的未來發(fā)展也正在向賦能這類下一代應(yīng)用的方向靠攏,。從三星公布的路線圖來看,未來的DRAM技術(shù)發(fā)展除了進(jìn)一步提升DRAM芯片的容量和接口速度之外,,還有在系統(tǒng)層面的革新方向(包括CXL內(nèi)存擴(kuò)展以及存內(nèi)計(jì)算/近內(nèi)存計(jì)算等智能化DRAM),,DRAM技術(shù)的演進(jìn)將會(huì)帶給芯片和系統(tǒng)廠商越來越多的技術(shù)創(chuàng)新機(jī)會(huì),而這些創(chuàng)新將會(huì)進(jìn)一步推動(dòng)新應(yīng)用和新場景的出現(xiàn),,從而讓整個(gè)領(lǐng)域進(jìn)一步發(fā)展,。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<