在物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能 (AI) 的推動下,從交通運輸,、醫(yī)療保健到零售和娛樂等眾多行業(yè)將走上轉(zhuǎn)型之路,,應用材料公司將其統(tǒng)稱為 AI 計算時代。
在以前的計算時代中,,大型機/小型機、PC/服務(wù)器和智能手機/平板電腦均受益于摩爾定律的進步,,伴隨著 2D 微縮,,產(chǎn)品的性能,、功耗和面積/成本(也稱為“PPAC”)得以同步提升。
雖然 AI 時代的各類應用正在蓬勃發(fā)展,,但摩爾定律卻放緩了腳步,;因此,行業(yè)需要在 2D 微縮以外取得突破,,以全新方式推動 PPAC 的提升,。具體而言,我們需要新的計算架構(gòu),、新材料,、新結(jié)構(gòu)(特別是節(jié)省面積的 3D 結(jié)構(gòu)),以及用于芯片堆疊和異構(gòu)設(shè)計的高級封裝,。
AI 時代的架構(gòu)變化正在對邏輯和存儲器產(chǎn)生影響,。機器學習的算法大量地使用通用邏輯中極為復雜的矩陣乘法運算,這推動了加速器及其存儲器的轉(zhuǎn)變,。AI 計算包含兩種明顯不同的存儲器任務(wù):第一種是存儲計算的中間結(jié)果,;第二種是存儲與訓練模型相關(guān)的權(quán)重。
性能和功耗對于云計算和邊緣計算都十分重要,,而存儲器方面的創(chuàng)新能夠為此提供助力,。一種使用現(xiàn)有存儲器技術(shù)的方法是“近存儲器”,其中大量工作存儲器被壓縮并放置在物理上與邏輯存儲器緊密相鄰的位置,,通過高速接口連接,。例如,3D 堆疊和硅通孔技術(shù)正愈發(fā)受到歡迎,。作為這些應用中的“工作存儲器”,,SRAM 和 DRAM 的一個主要缺點在于它們是易失性存儲器,需要持續(xù)供電來保存數(shù)據(jù)(如權(quán)重),。
為了降低云和邊緣的功耗,,設(shè)計人員正在評估兼具高性能和非易失性的新型存儲器,因為它們只有在主動讀寫時才需要使用電源,。有三種方案引領(lǐng)著新型存儲器,, 它們分別是磁性RAM (MRAM)、相變式 RAM (PCRAM) 和電阻式 RAM (ReRAM) ,。
不同于使用電荷,,上述三款存儲器利用新材料產(chǎn)生不同的電阻率狀態(tài) ,而高低電阻依次表示 1 和 0,。MRAM 利用磁場方向的變化來控制電阻率,。PCRAM 利用了從非晶態(tài)到晶態(tài)的材料排列結(jié)構(gòu)變化。ReRAM 在材料中創(chuàng)造了一條電流通路。PCRAM 和 ReRAM 均提供電阻率的中間階段,,這可在每個單元中存儲多層的比特數(shù)據(jù),。
我們來了解一下 AI 時代的計算應用,了解它們?nèi)绾卧谖磥硭{圖中推動創(chuàng)新,。
圖 1. AI 時代推動半導體創(chuàng)新的復興之路
物聯(lián)網(wǎng)邊緣應用可被劃分為低性能/低功耗應用,,以及高性能/高功耗應用。
例如,,采用 AI 算法的安全攝像頭是一種低性能/低功耗應用,AI 算法非常適合面部和語音識別等應用,。設(shè)計目標是盡可能多地處理邊緣數(shù)據(jù),,并且僅將重要信息傳輸?shù)皆啤S捎诓蓸宇l率較低,,因此性能要求也很低,。功耗(包括待機功耗)至關(guān)重要,對于電池供電設(shè)備尤為如此,。
目前,,業(yè)界在邊緣設(shè)備中使用 SRAM 存儲器。SRAM 并非理想選擇,,因為每個存儲單元需要多達六個晶體管,,而且源泄漏功率會很高。在存儲權(quán)重方面,,SRAM 的能效并不突出,,特別是在低頻設(shè)計中使用時。作為替代方案,,MRAM 可確保將晶體管密度提高數(shù)倍,,從而實現(xiàn)更高的存儲密度或更小的芯片尺寸。MRAM 的另一個關(guān)鍵特性在于,,這種產(chǎn)品經(jīng)專門設(shè)計,,可以安裝到嵌入式片上系統(tǒng)產(chǎn)品 (SOC) 的后端互連層中。MRAM 可用于存儲 SOC 的操作系統(tǒng)和應用程序,,無需使用嵌入式閃存芯片便可實現(xiàn)這一目的,,從而減少了系統(tǒng)芯片的總數(shù)和成本。
高性能“近邊緣”應用,,如缺陷檢測和醫(yī)學篩檢,,則需要更高的性能。MRAM 的一種變型稱作自旋軌道轉(zhuǎn)矩 MRAM (SOT-MRAM),,經(jīng)證實,,這種產(chǎn)品在速度和功耗方面可能優(yōu)于自旋轉(zhuǎn)移力矩 MRAM (STT-MRAM)。
云計算需要盡可能高的計算性能,而訓練時則需要將大量數(shù)據(jù)轉(zhuǎn)移到機器學習加速器附近,,相應地,,需要為機器學習加速器提供較大的片上 SRAM 緩存并輔以大型片外 DRAM 陣列——這就要求使用持續(xù)的電源。用電量對云服務(wù)提供商非常重要,,因為 AI 時代的數(shù)據(jù)會呈指數(shù)級增長,,而電網(wǎng)功率有限且成本高昂。PCRAM 的功耗和成本比 DRAM 更低,,而性能則比固態(tài)硬盤和機械硬盤更高,,因此成為云計算架構(gòu)的首選方案。
除了上述“二進制”的邊緣應用,、近邊緣應用和云應用方面具備廣闊前景外,,在存儲內(nèi)計算的研究也在日益深入??梢韵胂?,在存儲器陣列中為機器學習執(zhí)行頻繁的矩陣乘法運算。設(shè)計人員正在探索偽交叉點架構(gòu),,其中權(quán)重存儲在各個存儲器節(jié)點上,。PCRAM、ReRAM 甚至鐵電場效應晶體管 (FeFET) 都是優(yōu)秀的備選方案,,因為它們都有每單元多層存儲的潛力,。目前而言,ReRAM 看起來是最適合此類應用的存儲器,??梢岳脷W姆定律和基爾霍夫定律在陣列內(nèi)完成矩陣乘法運算,而無需向芯片內(nèi)移入和移出權(quán)重,。多層單元架構(gòu)能夠?qū)崿F(xiàn)全新級別的存儲器密度,,為設(shè)計和使用更大的模型提供支持。需要對新材料進行全面的開發(fā)和工程設(shè)計,,才能將這些新的模擬存儲器付諸現(xiàn)實,,目前應用材料公司正在積極探索部分極具代表性的方案。
當摩爾定律的指數(shù)級發(fā)展速度逐漸減緩,,AI 時代將迎來數(shù)據(jù)上的指數(shù)級增長,。這種壓力已經(jīng)在推動著架構(gòu)、材料,、3D 結(jié)構(gòu)以及用于芯片堆疊和異構(gòu)集成的先進封裝不斷創(chuàng)新,。存儲器與 AI 計算引擎的關(guān)系越來越緊密,最終,,存儲器可能成為 AI 計算引擎本身,。隨著這些創(chuàng)新嶄露頭角,,我們將見證性能、功耗和密度(面積/成本)的顯著提升——隨著新型存儲器的逐步優(yōu)化,,邊緣,、近邊緣和云應用的需求最終會得到滿足。我們需要硬件上的全面復興來釋放 AI 時代的全部潛力,。