在上周舉辦的Computex上,,AMD發(fā)布了其實驗性的產(chǎn)品,,即基于3D Chiplet技術(shù)的3D V-Cache,。該技術(shù)使用臺積電的3D Fabric先進封裝技術(shù),成功地將包含有64MB L3 Cache的chiplet以3D堆疊的形式與處理器封裝在了一起,。
在AMD展示的概念芯片中,處理器芯片是Ryzen 5000,,其原本的處理器Chiplet中就帶有32 MB L3 Cache,,而在和64 MB的3D V-Cache做3D封裝后,每個Ryzen 5000 Chiplet可以訪問總共96 MB的L3 Cache,。而在每個包含多個Ryzen 5000 Chiplet的處理器中,,則最多可以訪問高達192MB的L3 Cache。
先進封裝已經(jīng)成為推動處理器性能提升的主要動力
隨著半導(dǎo)體工藝節(jié)點越來越接近物理極限,,每一代半導(dǎo)體工藝節(jié)點提升對于芯片性能帶來的收益也越來越小,,通常在15%左右。而在AMD發(fā)布的帶有3D V-Cache的處理器則在工藝不變(仍然使用7nm臺積電工藝)的情況下,,在3D游戲等對于處理器性能有高需求的應(yīng)用場景中實現(xiàn)了約15%的性能提升,。這一點說明先進封裝在今天已經(jīng)能實現(xiàn)原來需要半導(dǎo)體工藝節(jié)點前進整整一代才能實現(xiàn)的性能提升;而在未來隨著半導(dǎo)體工藝越來越接近極限,,每一代工藝帶來的性能增益越來越小,,先進封裝可望取代半導(dǎo)體工藝成為芯片性能提升的主要推動力。
而在先進封裝領(lǐng)域,,AMD已經(jīng)有了多年的積累,,從2015年開始使用HBM技術(shù),到2019年推出使用chiplet的產(chǎn)品,,到今天推出3D chiplet,,每一步都可以看見AMD對于先進封裝領(lǐng)域投入的決心。
在先進封裝領(lǐng)域,,有兩條由應(yīng)用驅(qū)動的技術(shù)路徑,。一條的主要訴求是提升互聯(lián)密度,從而解決芯片之間的通信帶寬,,其代表產(chǎn)品就是基于2.5D/3D高級封裝的HBM DRAM接口標(biāo)準(zhǔn),,使用HBM可以將DRAM和處理器(CPU,GPU以及其他ASIC)之間的通信帶寬大大提升,,從而緩解這些處理器的內(nèi)存墻問題,。目前,HBM已經(jīng)成為高端GPU的標(biāo)配,同時也應(yīng)用于不少針對云端處理的AI芯片(例如谷歌的TPU)中,。
除此之外,,另一條技術(shù)路徑是chiplet,即在封裝系統(tǒng)里面不再使用少量的大芯片做集成,,而是改用數(shù)量更多但是尺寸更小的芯片粒(chiplet)作為基本單位,。使用chiplet的第一個優(yōu)點是提升了良率,如果使用大芯片的話,,如果在芯片的晶圓面積上出現(xiàn)瑕疵,,那么整個芯片就有了瑕疵,無法作為良品使用,;但是如果把同樣面積的芯片拆分為多個chiplet,,那么出現(xiàn)瑕疵的話就僅僅是瑕疵出現(xiàn)的那個chiplet無法使用,而其他chiplet則不受影響,,這樣就提升了良率,,而這對于良率存在挑戰(zhàn)的先進半導(dǎo)體工藝至關(guān)重要。Chiplet另外的潛力在于可以實現(xiàn)更靈活的異構(gòu)集成,,在同一封裝系統(tǒng)中不同的chiplet可以使用不同的半導(dǎo)體工藝實現(xiàn),,從而進一步降低成本(例如某些對于邏輯性能需求不高的模組可以使用成熟工藝)并提升性能。
而這次AMD的3D Chiplet則是把兩條先進封裝的技術(shù)路線匯合到了一起,。AMD發(fā)布的3D V-Cache中,,首先處理器和堆疊的L3 Cache都使用了chiplet,另外在3D V-Cache和處理器chiplet之間,,也使用了先進封裝帶來的高密度互聯(lián),,其互聯(lián)密度較2D chiplet高兩百多倍,相比傳統(tǒng)的3DIC技術(shù)也能提高15倍,。我們認為,,AMD將3D Chiplet投入商用對于先進封裝領(lǐng)域來說,將是類似HBM進入GPU這樣的里程碑式事件,。
臺積電進一步鞏固在代工領(lǐng)域的地位
在AMD發(fā)布的3D chiplet背后,,是臺積電的先進半導(dǎo)體工藝技術(shù)和先進封裝技術(shù)。臺積電作為同時掌握了最先進半導(dǎo)體工藝和封裝技術(shù)的代工廠,,其全球最頂尖代工廠的地位得到了鞏固,,同時其在先進技術(shù)領(lǐng)域也將變得更加強勢。
早在2019年的VLSI Symposium中,,臺積電就發(fā)表了類似這次AMD 3D Chiplet的技術(shù),。臺積電把這個技術(shù)System on Integrated Chips(SOIC),其主要解決的就是進一步提升3D封裝中的互聯(lián)密度,。傳統(tǒng)3DIC技術(shù)的連線密度受到bump尺寸的限制,,從而限制了集成總線的帶寬和互聯(lián)成本,。而臺積電SoIC技術(shù)一個關(guān)鍵優(yōu)勢就是無須bump,只要將兩塊要堆疊的芯片的銅互聯(lián)做部分裸露并對準(zhǔn),,之后即可通過熱處理工藝完成兩塊芯片的電路連接,。這樣一來,兩塊堆疊芯片之間的走線密度以及信號傳輸功耗都可以大大改善,。在今年的ISSCC中,,臺積電又一次展示了SOIC技術(shù),這次臺積電為該技術(shù)商用起了一個正式的名字(3DFabric),,并且公布了更多互聯(lián)密度相關(guān)的數(shù)據(jù),其互聯(lián)密度相比傳統(tǒng)的基于bump的3DIC技術(shù)可以提升16倍,,該數(shù)據(jù)與AMD這次在Computex發(fā)布的相關(guān)數(shù)字(相比3DIC互聯(lián)密度提升15倍)也大體相符,。
如前所述,隨著摩爾定律的半導(dǎo)體工藝節(jié)點提升接近極限,,先進封裝技術(shù)將會慢慢接班半導(dǎo)體工藝節(jié)點而成為芯片性能提升的推動力,。臺積電在擁有最先進半導(dǎo)體工藝的同時,也在先進封裝領(lǐng)域領(lǐng)跑全球,,其在半導(dǎo)體代工領(lǐng)域的領(lǐng)導(dǎo)者地位將延續(xù)下去,。于此同時,在AMD首發(fā)基于3DFabric的產(chǎn)品之后,,預(yù)計在未來會有更多芯片設(shè)計公司跟進使用3DFabric來實現(xiàn)高性能芯片,,從而進一步推廣下一代先進封裝技術(shù)的應(yīng)用。
3D Chiplet在AI時代大有作為
我們認為,,類似3D Chiplet的技術(shù)在AI時代將會有廣泛應(yīng)用,。
目前,人工智能已經(jīng)成為推動半導(dǎo)體行業(yè)市場收入的重要引擎,?;谏窠?jīng)網(wǎng)絡(luò)的人工智能需要強大的算力支撐其模型訓(xùn)練和部署,因此高性能計算芯片在AI時代至關(guān)重要,,這也是全球范圍內(nèi)出現(xiàn)了不少AI芯片初創(chuàng)公司的原因,。對于AI計算來說,內(nèi)存訪問已經(jīng)越來越成為性能的瓶頸,,因此如何提升處理器(AI芯片)與存儲器之間的內(nèi)存訪問速度和效率變得越來越重要,。為了解決這個問題,目前云端AI芯片使用HBM DRAM配合大容量的片上SRAM已經(jīng)成為標(biāo)配(例如谷歌的TPU),。HBM DRAM和大容量SRAM缺一不可,,其中HBM DRAM容量大,但是存取需要較大的延遲,,因此常用來存儲系統(tǒng)調(diào)度算法中在未來可能會用到的數(shù)據(jù),;而SRAM的帶寬大于HBM,,延時也較小,但是容量也遠小于DRAM,,常用來存取在當(dāng)前立即需要用到的數(shù)據(jù),。在人工智能領(lǐng)域,隨著GPT-3這樣的巨型模型越來越多,,對于DRAM和SRAM容量的需求都越來越大,,而SRAM擴容目前看來最有希望的方法之一就是使用類似3D Chiplet的技術(shù),使用3D堆疊的方式來獲得更大的容量(如這次AMD在使用3D V-Cache后SRAM容量就擴大到了三倍),,因此我們認為隨著臺積電的3DFabric技術(shù)進一步成熟,,AI芯片很可能是下一個使用該技術(shù)的產(chǎn)品,并且隨著人工智能市場越來越大,,AI芯片也將進一步將3D Chiplet帶向主流,,同時使用HBM加3D Chiplet技術(shù)的芯片產(chǎn)品將會進入更多產(chǎn)品中獲得使用。