最近,chiplet這個(gè)概念熱了起來,,從美國DARPA的CHIPS項(xiàng)目到Intel的Foveros等,,都把chiplet看成是未來芯片的重要基礎(chǔ)技術(shù)。簡(jiǎn)單來說,,chiplet技術(shù)就是像搭積木一樣,,把一些預(yù)先生產(chǎn)好的能實(shí)現(xiàn)特定功能的芯片裸片(die)通過先進(jìn)的集成技術(shù)(比如3D integration等)集成封裝在一起,形成一個(gè)系統(tǒng)芯片(SoC),。而這些基本的裸片就是chiplet,。從這個(gè)意義上來說,,chiplet就是一個(gè)新的IP復(fù)用模式。未來,,以chiplet模式集成的芯片會(huì)是一個(gè)“超級(jí)”異構(gòu)系統(tǒng),,可以為AI計(jì)算帶來更多的靈活性和新的機(jī)會(huì)。
chiplet模式興起
chiplet的概念其實(shí)很簡(jiǎn)單,,就是硅片級(jí)別的”復(fù)用”,。設(shè)計(jì)一個(gè)系統(tǒng)級(jí)芯片,以前的方法是從不同的IP供應(yīng)商購買一些IP,,軟核(代碼)或硬核(版圖),,結(jié)合自研的模塊,集成為一個(gè)SoC,,然后在某個(gè)芯片工藝節(jié)點(diǎn)上完成芯片設(shè)計(jì)和生產(chǎn)的完整流程,。未來,對(duì)于某些IP,,你可能不需要自己做設(shè)計(jì)和生產(chǎn)了,,而只需要購買別人己經(jīng)做好的硅片(管芯),然后在一個(gè)封裝里集成起來,,形成一個(gè)SiP(System in Package),。所以chiplet也是一種IP,但它是以硅片的形式提供,而不是之前依軟件形式,。
從這段描述來看chiplet可以說是一種新的芯片設(shè)計(jì)模式,,要實(shí)現(xiàn)chiplet這種新的IP復(fù)用模式,首先要具備的技術(shù)基礎(chǔ)就是先進(jìn)的芯片集成封裝技術(shù),。SiP的概念其實(shí)很早就有,,把多個(gè)芯片裝在一個(gè)封裝里也有很久的歷史了。但要實(shí)現(xiàn)chiplet這種高靈活度,,高性能,,低成本的芯片復(fù)用愿景,必須要具備有先進(jìn)的芯片集成技術(shù),,比如Intel最近提出的EMIB,Foveros,,3D集成技術(shù)等。
未來芯片設(shè)計(jì)中,,產(chǎn)品的功能,,成本與上市時(shí)間等是主要因素,如果你想把所有東西都集成在一個(gè)芯片上,,導(dǎo)致芯片的面積會(huì)很大,需要很長的時(shí)間。如果你想使用先進(jìn)的制造工藝,,它的成本會(huì)更高,越來越不切實(shí)際,。更為重要的是未來的許多器件,使用的材料也并非一定是硅材料,可能是鍺,,III-V族,,碳化硅等,因此如果能把一個(gè)復(fù)雜的芯片分解成若干個(gè)子系統(tǒng),,而其中有些子系統(tǒng)可能是標(biāo)準(zhǔn)化的產(chǎn)品,,就是chiplet中的某一種,最后把它封裝在一體,。它是近期半導(dǎo)體業(yè)在后摩爾定律的方向之一,,通俗說就是“異質(zhì)集成”,或者叫“異構(gòu)集成”,。
Chiplet典型范例
英特爾實(shí)際上有幾種不同的芯片組解決方案,,它有助于揭示未來的芯片組三個(gè)發(fā)展方向,顯然臺(tái)積電等也擁有獨(dú)特的封裝技術(shù),,由此拿到了蘋果的處理器芯片訂單,。
英特爾的EMIB(Embedded Multi-Die Interconnect Bridge,嵌入式多核心互聯(lián)橋接)封裝技術(shù)理念與2.5D封裝類似,,但技術(shù)水平更高,。
EMIB在本質(zhì)上是一種非常薄的硅中介層(interposer),上面有密度非常高的互聯(lián)結(jié)構(gòu),,我們把它們成為微凸塊,,EMIB的密度遠(yuǎn)高于在其它標(biāo)準(zhǔn)封裝基板上發(fā)現(xiàn)的那種密度。微凸塊是一些微小的焊球,,可以把一個(gè)芯片連接到另一個(gè)芯片上,,后者連接到封裝內(nèi)的高密度互聯(lián)結(jié)構(gòu)上。
使用EMIB能把GPU和HBM(高帶寬內(nèi)存)集成在一起,,使用了封裝內(nèi)部的HBM接口,。然后我們?cè)跇?biāo)準(zhǔn)電路板級(jí)接口上使用了PCI Express,用它來承接GPU和CPU的功能,。
另一個(gè)例子是Stratix 10 FPGA,。它實(shí)際上是英特爾首次展示的EMIB解決方案。Stratix 10的中心是一個(gè)英特爾的FPGA,,圍繞著它有六個(gè)小芯片,。其中,有四個(gè)是高速收發(fā)器,,兩個(gè)是高帶寬內(nèi)存,,它們都裝在一個(gè)封裝之中。這個(gè)例子中集成了來自三家代工廠,、使用了六種不同的代工節(jié)點(diǎn)生產(chǎn)出來的芯片組,。因此,,Stratix 10進(jìn)一步證明了不同代工廠生產(chǎn)的器件之間的互操作性。
此外,,這顆芯片中使用了一種被稱為AIB的行業(yè)標(biāo)準(zhǔn)硅片到硅片接口,,這是英特爾的高級(jí)接口總線。這是英特爾專為這種芯片設(shè)計(jì)的總線接口標(biāo)準(zhǔn),,它是實(shí)現(xiàn)封裝內(nèi)部高帶寬,、邏輯到邏輯器件互聯(lián)的重要支撐??梢哉f,,HBM是用于內(nèi)存集成的第一個(gè)標(biāo)準(zhǔn),而AIB是用于邏輯器件集成的第一個(gè)標(biāo)準(zhǔn),。
第三個(gè)例子是英特爾的Foveros解決方案,,這是邏輯器件上堆疊邏輯器件的芯片方案,在2017年12月份首次提到該方案,,并在2018年一月份的CES展會(huì)上發(fā)布了一款產(chǎn)品-Lakefield,。它是一種芯片組集成,不過它不是水平堆疊,,而是垂直堆疊,。
對(duì)于這種邏輯器件上堆疊邏輯器件方案,可能需要更長的時(shí)間才能把它演化成一種工業(yè)領(lǐng)域的標(biāo)準(zhǔn),。因?yàn)樗@上面的芯片基本上都是共同設(shè)計(jì)的,。在邏輯器件上堆疊內(nèi)存可能會(huì)是最先衍生出三維堆疊開發(fā)標(biāo)準(zhǔn)的地方。
散熱是最大的問題,。其實(shí),,你也可以想象,硅片堆疊會(huì)讓任何類型的散熱問題都變得更為棘手,。因此,,我們確實(shí)需要繼續(xù)規(guī)劃分層,以適應(yīng),、調(diào)整各個(gè)熱點(diǎn),。此外,我們還需要考慮整個(gè)系統(tǒng)的架構(gòu)設(shè)計(jì)問題,。三維堆疊不僅僅涉及到物理架構(gòu),,它能一直影響到架構(gòu)決策,而且是整個(gè)CPU/GPU和系統(tǒng)的架構(gòu),。
對(duì)于芯片組還需要建立新的測(cè)試技術(shù)和標(biāo)準(zhǔn),。
圍繞測(cè)試的行業(yè)標(biāo)準(zhǔn)非常重要。通常而言,,對(duì)于一個(gè)完整的封裝里的器件進(jìn)行測(cè)試,。首先需要把一個(gè)一個(gè)能正常工作的芯片組放到封裝內(nèi),,但是即便每個(gè)芯片組能正常工作,也很難保證集成在一起的大芯片能正常工作,,然而這種測(cè)試需要設(shè)置另外的精細(xì)pad來放探針。
最后一個(gè)也很明顯,,就是機(jī)械標(biāo)準(zhǔn),,微凸塊的放置和它們之間的通路也需要有標(biāo)準(zhǔn)來支持互操作性。
很多chiplet模式的問題最終都需要EDA工具的改進(jìn)來給出答案,,需要EDA工具從架構(gòu)探索,,到芯片實(shí)現(xiàn),甚至到物理設(shè)計(jì)的全面支持,。
chiplet模式的挑戰(zhàn)
首先當(dāng)然是集成技術(shù)的挑戰(zhàn),。chiplet模式的基礎(chǔ)還是先進(jìn)的封裝技術(shù),必須能夠做到低成本和高可靠性,。這部分主要看foundry和封裝廠商,。隨著先進(jìn)工藝部署的速度減緩,封裝技術(shù)逐漸成為大家關(guān)注的重點(diǎn),。此外,,集成技術(shù)的挑戰(zhàn)還來自集成標(biāo)準(zhǔn)?;氐紺HIPS項(xiàng)目,,可以看出,該項(xiàng)目的重點(diǎn)就是設(shè)計(jì)工具和集成標(biāo)準(zhǔn),。Intel的AIB(Advanced Interface Bus)就是一個(gè)硅片到硅片的互聯(lián)標(biāo)準(zhǔn),,如果未來能夠成為業(yè)界的標(biāo)準(zhǔn)(類似ARM的AMBA總線標(biāo)準(zhǔn)的作用),則chiplet的模式就可能更快的普及,。還有,,對(duì)于這種“超級(jí)”異構(gòu)系統(tǒng),其更大的優(yōu)化空間也同時(shí)意味著架構(gòu)優(yōu)化的難度也會(huì)大大增加,。
除了集成技術(shù)之外,,chiplet模式能否成功的另一個(gè)大問題是質(zhì)量保障。我們?cè)谶x擇IP的時(shí)候,,除了PPA(power,performance and cost)之外,,最重要的一個(gè)考量指標(biāo)就是IP本身的質(zhì)量問題。IP本身有沒有bug,,接入系統(tǒng)會(huì)不會(huì)帶來問題,,有沒有在真正的硅片上驗(yàn)證過等等。在目前的IP復(fù)用方法中,,對(duì)IP的測(cè)試和驗(yàn)證已經(jīng)有比較成熟的方法,。但是對(duì)于chiplet來說,,這還是個(gè)需要探索的問題。雖然,,相對(duì)傳統(tǒng)IP,,chiplet是經(jīng)過硅驗(yàn)證的產(chǎn)品,本身保證了物理實(shí)現(xiàn)的正確性,。但它仍然有個(gè)良率的問題,,而且如果SiP其中的一個(gè)硅片有問題,則整個(gè)系統(tǒng)都會(huì)受影響,,代價(jià)很高,。因此,集成到SiP中的chiplet必須保證100%無故障,。從這個(gè)問題延伸,,還有集成后的SiP如何進(jìn)行測(cè)試的問題。將多個(gè)chiplet封裝在一起后,,每個(gè)chiplet能夠連接到的芯片管腳更為有限,,有些chiplet可能完全無法直接從芯片外部管腳直接訪問,這也給芯片測(cè)試帶來的新的挑戰(zhàn),。
因此chiplet尚是個(gè)新生亊物,目前至少能供選擇的芯片組并不很多,另外它還面臨如下一些挑戰(zhàn):
眼下還沒有標(biāo)準(zhǔn)的方法貼裝或堆壘芯片組,;
裸芯片到裸芯片的互連方案很昂貴;
設(shè)計(jì)和制造之間還有缺口,,例如如何驗(yàn)證和測(cè)試芯片組,;
有一點(diǎn)目前還不是很清楚:一旦它們被制造出來交給集成商和封裝廠以后, 誰將來負(fù)責(zé)這些芯片組。