近期,,半導(dǎo)體業(yè)倍受關(guān)注的一大熱點(diǎn)事件是三星官宣量產(chǎn)3nm制程芯片。實(shí)際上,,在官方消息發(fā)出之前,,業(yè)界就一直在議論此事,焦點(diǎn)就是良率問題,。由于在追趕臺積電的道路上不遺余力,,三星幾乎用盡渾身解數(shù),這一次,,在臺積電即將于下半年量產(chǎn)3nm制程之前,,搶先宣布量產(chǎn),比拼的意味濃厚,。但從近些年的情況來看,,在先進(jìn)制程工藝方面,屢屢被臺積電碾壓,,一個很重要的原因就是三星難以保證良率,,這在獲取客戶信心方面是個很大的減分項(xiàng)。
前些年,,在10nm和7nm制程剛量產(chǎn)的時候,,高通驍龍845 SoC由三星代工生產(chǎn),驍龍855,、865則由臺積電7nm制程工藝生產(chǎn),,英偉達(dá)原計劃由三星生產(chǎn)的7nm制程GPU芯片,也轉(zhuǎn)移到了臺積電,。那時,,三星在良率方面就落后于臺積電,,訂單量明顯少于對手。
2021年,,4nm制程興起,,高通將驍龍 8 Gen1 Plus的生產(chǎn)訂單轉(zhuǎn)給了臺積電,很重要的原因就是三星4nm制程工藝的良率僅為35%左右,,與臺積電超過70%的良率相比差太多,。
今年2月,據(jù)韓媒Infostock Daily報道,,三星電子懷疑旗下晶圓代工廠的產(chǎn)量及良率報告存在造假行為,,因此,三星DS部門受到了管理咨詢部門對其晶圓代工廠5nm制程良率的調(diào)查,,緊隨其后的將是4nm和3nm調(diào)查,。該事件的起因是,三星晶圓代工業(yè)務(wù)飽受低良率之苦,,特別是4/5nm制程量產(chǎn)后,,出現(xiàn)了良率極其低下的情況,交貨時間不斷延后,,招致了三星高層的懷疑,。一位熟悉三星電子內(nèi)部情況的高管表示:“由于晶圓代工業(yè)務(wù)交付的數(shù)量難以滿足最近的訂單需求,我們對非內(nèi)存工藝的良率表示懷疑,,眾所周知,,基于該良率(指此前良率報告的數(shù)據(jù))是可以滿足訂單交付的?!惫芾碜稍儾块T的懷疑對象是DS部門現(xiàn)任及前任高管,,調(diào)查內(nèi)容包括:之前遞交的良率報告是否真實(shí),用于提升良率的資金究竟流向何方,。
今年6月,,三星任命了內(nèi)存制造技術(shù)中心副總裁Kim Hong-shik領(lǐng)導(dǎo)晶圓代工技術(shù)創(chuàng)新團(tuán)隊。通過改組,,三星調(diào)動存儲芯片專家來領(lǐng)導(dǎo)代工業(yè)務(wù)的核心部門,。此次,,晶圓代工部門的重組,,也是為了改善3nm芯片良率,努力反超臺積電,。
臺積電之所以能在先進(jìn)制程方面領(lǐng)先全球,,高良率是殺手锏。據(jù)悉,,該公司7nm制程在量產(chǎn)開始3個季度后,,其不良率降至每平方厘米0.09,,5nm制程量產(chǎn)初期,不良率低于同期的7nm,,缺陷密度大約為每平方厘米0.10~0.11,,隨著5nm芯片量產(chǎn)進(jìn)程的推進(jìn),不良率降至0.10以下,。
另一大芯片巨頭英特爾也飽受良率困擾,,2020年7月,該公司發(fā)布消息稱,,原計劃于2021年底上市的7nm芯片,,因工藝存在缺陷,導(dǎo)致良率下降,,發(fā)布時間推遲6個月,。在此之前,英特爾在10nm制程的研發(fā)過程中就遇到了很多困難,,多次延期,,2019年初才實(shí)現(xiàn)量產(chǎn)。
綜上,,芯片良率的重要性可見一斑,。
芯片良率簡析
簡單的說,芯片良率就是晶圓上合格芯片數(shù)量與芯片總數(shù)的比值,,這個數(shù)值越大,,說明有用芯片數(shù)量越多,浪費(fèi)越少,,成本也就越低,,利潤越高。
良率還可以細(xì)分為wafer(硅晶圓)良率,、die良率和封測良率,,這三種良率的乘積則是總良率??偭悸适撬芯A廠的核心機(jī)密,,外界很難知曉。它可以反應(yīng)出這家晶圓廠制造芯片的總體水平和營收能力,。
芯片制造的每一個階段,,從晶圓制造、中測,、封裝到成測,,每一步都會對總良率產(chǎn)生影響,其中,晶圓制造是影響良率的主要因素,。
良率還受設(shè)備,、原材料等因素影響,要想達(dá)到較高水平,,需要穩(wěn)定工藝設(shè)備,,定期做工藝能力恢復(fù)。另外,,環(huán)境因素對以上提到的三種良率都會產(chǎn)生影響,,如塵埃、濕度,、溫度和光照亮度等,,芯片制造和封測過程需要在超潔凈的工作環(huán)境中進(jìn)行。
另外,,wafer的尺寸會直接影響良率,,一般情況下,中心區(qū)域的良率較高,,邊緣區(qū)域的良率較低(這是由制造工藝決定的),。wafer尺寸越大,中心區(qū)面積占總面積比例也大,,良率越高,。
良率不是一成不變的,它會隨著工藝技術(shù)的不斷成熟而提升,。一般情況下,,新制程工藝剛量產(chǎn)的時候,良率比較低,,隨著生產(chǎn)的推進(jìn),,以及導(dǎo)致低良率的因素被發(fā)現(xiàn)和改進(jìn),良率會不斷提升,,較為成熟的產(chǎn)線良率可以達(dá)到95%以上,。
很多半導(dǎo)體公司都有專門從事良率提升工作的工程師,在晶圓廠,,有專門的良率提高(YE)部門,,良率工程師負(fù)責(zé)提高晶圓良率;在IC設(shè)計企業(yè),,運(yùn)營部門有專業(yè)的產(chǎn)品工程師(PE)負(fù)責(zé)提高良率,。
拿什么拯救你,我的良率
芯片良率如此重要,,全行業(yè)都非常關(guān)注,,晶圓廠,、IC設(shè)計企業(yè),、半導(dǎo)體設(shè)備和材料廠商,,以及行業(yè)科研機(jī)構(gòu)都在進(jìn)行各種研究探索,為提升芯片良率添磚加瓦,。
當(dāng)然,,提升良率的主戰(zhàn)場依然是晶圓廠(IDM廠或晶圓代工廠)。要提升良率,,首先需要深入研究芯片良率與可靠性之間的關(guān)系,,而可靠性與芯片缺陷有直接關(guān)系,因此,,減少芯片生產(chǎn)過程中的缺陷數(shù)量可以提升基準(zhǔn)良率,,同時可以提高器件的可靠性。
為了提高可靠性,,需要投入時間,、資金和相關(guān)資源,以提高良率,,這就需要進(jìn)行權(quán)衡,,因?yàn)椴煌愋托酒瑢煽啃缘囊蟛煌c之對應(yīng)的資源投入也不同,,這也會直接影響利潤,。例如,消費(fèi)類電子產(chǎn)品用芯片對可靠性要求沒有那么高(與工業(yè)和汽車芯片相比),,因此,,對于這類芯片,達(dá)到一定良率之后,,晶圓廠不會做再高的追求,,而是將資源分配到開發(fā)下一個節(jié)點(diǎn)的制程和設(shè)備,這樣可以提高成熟節(jié)點(diǎn)的盈利能力,。而對于高可靠性要求的芯片(如車用芯片,,其可靠性要求比消費(fèi)類芯片高兩至三個數(shù)量級),晶圓廠必須追求更高的基準(zhǔn)良率水平,,也就需要在制程工藝和設(shè)備方面投入更多資源,。不過,高性能與高良率之間是存在矛盾關(guān)系的,,很難兼顧,。
對于晶圓廠而言,大多數(shù)影響良率的系統(tǒng)性問題都已解決,,實(shí)際良率損失主要是由制程設(shè)備或環(huán)境的隨機(jī)缺陷造成的,。為了檢測出可靠性缺陷,,晶圓廠的產(chǎn)線必須具備相應(yīng)的制程控制設(shè)備和檢測取樣機(jī)制,采用的缺陷檢測系統(tǒng)必須具備所需的缺陷靈敏度,,并維護(hù)良好且達(dá)到規(guī)格,。檢測取樣必須針對制程步驟達(dá)到足夠的頻次,以快速檢測到制程或設(shè)備的偏移,。此外,,必須有足夠的檢測產(chǎn)能用以支持加速異常偵測。
在實(shí)際操作過程中,,常見的難點(diǎn)是精確找出基準(zhǔn)缺陷的出處,,有時,缺陷產(chǎn)生之后經(jīng)過多個制程步驟才被檢測到,,這對設(shè)備監(jiān)控系統(tǒng)和機(jī)制的要求很高,,做不好的話,常常找不出問題的根源在哪,。為了解決這個問題,,系統(tǒng)會先檢測一片晶圓,使其在指定的制程設(shè)備中運(yùn)行,,然后再次檢測,,第二次檢測發(fā)現(xiàn)的任何新缺陷必定是由該指定的制程設(shè)備產(chǎn)生的,這樣,,就可以找出缺陷的根源所在,。因此,設(shè)置好一套靈敏的檢測機(jī)制,,可以揭示源自每個制程設(shè)備的隨機(jī)良率損失并將其解決,。
此外,晶圓廠可以對每個設(shè)備上出現(xiàn)的缺陷進(jìn)行分類,,并生成資料庫,,可作為現(xiàn)場故障的失效分析參考。這種方法需要非常頻繁的設(shè)備認(rèn)證(至少每天一次),。
通過以上這些措施和方法,,晶圓廠可以有效控制缺陷,從而提升芯片良率水平,。當(dāng)然,,除了這些,晶圓廠還有其它提升良率的方式方法,,這里就不再贅述了,。
除了晶圓廠產(chǎn)線的流程控制,產(chǎn)業(yè)鏈上游的半導(dǎo)體材料廠商,,特別是硅晶圓廠商,,也可以通過創(chuàng)新技術(shù),,在晶圓層面為提升良率提供保障。
例如,,來自韓國科學(xué)與信息通信技術(shù)部下屬的韓國機(jī)械與材料研究所(KIMM)和新加坡南洋理工大學(xué)(NTU)的科學(xué)家開發(fā)了一種技術(shù)——新型納米轉(zhuǎn)移印刷技術(shù)(Nanotransfer-basedprinting),,它可以制造出高度均勻的硅晶圓。他們將無化學(xué)粘合劑打印技術(shù)與金屬輔助化學(xué)蝕刻相結(jié)合,,可以用于增強(qiáng)表面對比度以使納米結(jié)構(gòu)可見,。
這種納米轉(zhuǎn)移印刷技術(shù)是通過在相對低溫(160°C)下將金(Au)納米結(jié)構(gòu)層轉(zhuǎn)移到硅襯底上,,形成具有納米線(nanowires)的高度均勻的晶圓,,以實(shí)現(xiàn)在制造過程中控制所需的厚度。這種技術(shù)允許快速,、均勻,、大規(guī)模制造晶圓,同時,,制造的晶圓幾乎沒有缺陷,,生產(chǎn)出的芯片良率非常高。在實(shí)驗(yàn)室測試中,,能夠?qū)?9%的20nm厚Au薄膜轉(zhuǎn)移到6英寸晶圓上,。當(dāng)采用該方法加工6英寸晶圓時,結(jié)果顯示印刷層保持完整,,在蝕刻過程中彎曲最小,,證明該Nanotransfer-basedprinting技術(shù)具有出色的均勻性和穩(wěn)定性。
KIMM-NTU團(tuán)隊認(rèn)為該技術(shù)可以很容易地擴(kuò)展到12英寸晶圓上,,而這是三星,,英特爾、臺積電和GlobalFoundries等晶圓廠產(chǎn)線中的主流晶圓尺寸,。
性能與良率之爭
談到芯片良率,,就不能不談性能,因?yàn)檫@兩者之間是存在矛盾關(guān)系的,。在消費(fèi)類電子產(chǎn)品芯片大行其道的時代,,良率占絕對上風(fēng),因?yàn)橄M(fèi)電子產(chǎn)品對性能的要求沒那么高,。但隨著近些年消費(fèi)電子市場的疲軟,,相應(yīng)地,高性能計算(HPC),、汽車電子市場快速發(fā)展,,且潛力巨大,而這些類型的芯片對性能要求極高,,此時,,良率就不得不做些讓步了,,因?yàn)樵诮^對高性能的量產(chǎn)要求下,良率不可能做得像消費(fèi)類芯片那么高,。
這樣,,各種新型芯片架構(gòu)就涌現(xiàn)了出來。最具代表性的,,也是最極端的就是Cerebras的晶圓級大芯片,。
2019年8月,人工智能初創(chuàng)公司Cerebras Systems發(fā)布了Cerebras Wafer Scale Engine(WSE)處理器,,這是一個超大芯片,,由一個12英寸晶圓制成。而傳統(tǒng)芯片則很小,,一個12英寸晶圓可以制造出三,、四百個芯片。
WSE擁有1.2萬億個晶體管,,專門面向AI任務(wù)開發(fā),,這顆巨型芯片,面積達(dá)到42225平方毫米,。
通常情況下,,晶圓廠不會制造這么大的芯片,因?yàn)樵趩蝹€晶圓的加工過程中通常會出現(xiàn)一些雜質(zhì),,雜質(zhì)會直接影響芯片良率,,而單個芯片越大,整體良率越低,。像Cerebras這么大的芯片,,其良率保障是個凸出的問題。不過,,Cerebras Systems公司表示,,其設(shè)計的芯片留有冗余,一種雜質(zhì)不會導(dǎo)致整個芯片都不能用,。
2021年4月,,Cerebras Systems公司又推出了WSE的升級版WSE-2,集成了2.6萬億個晶體管,。該公司稱設(shè)計出了一個可以繞過任何制造缺陷的系統(tǒng)來實(shí)現(xiàn)100%的良率,,最初,Cerebras有1.5%的額外內(nèi)核允許缺陷的存在,。
之所以會出現(xiàn)WSE這樣的超大芯片,,原因在于,高性能計算市場對性能的敏感度高于價格,,高性能計算市場的主要客戶并非C端,,而是B端的行業(yè)客戶,,他們對成本不敏感,最關(guān)心的是性能,。特別是近些年,,AI在云計算市場的應(yīng)用風(fēng)起云涌,云端AI芯片的客戶主要是谷歌這樣的互聯(lián)網(wǎng)巨頭,,在這些巨頭眼里,,算力就是王道,它們對算力的追求幾乎是無止境的,,這一點(diǎn)和信奉“夠用就好”的消費(fèi)電子市場完全不同,。
當(dāng)然,像Cerebras Systems公司這樣的芯片屬于極端案例,,大多數(shù)情況下,,高性能計算市場的芯片尺寸還是在傳統(tǒng)范圍以內(nèi),。但良率與性能之間的矛盾問題還是有增無減,。需要有新的解決方案。
此時,,Chiplet應(yīng)運(yùn)而生,,它在兼顧性能和良率方面有獨(dú)到之處。如果要提升性能就必須減少片外通信,,而想提升良率則必須保證單一芯片面積不能太大,。Chiplet方案恰恰能同時兼顧這兩點(diǎn)。Chiplet可將單一芯粒(die)面積做?。ù_保良率),,并用高級封裝技術(shù)把不同的芯粒集成在一起。這樣,,芯粒之間的通信并不需要走PCB板,,可以在封裝內(nèi)進(jìn)行,這就大大降低了片外通信的開銷,。AMD最先在數(shù)據(jù)中心商用了Chiplet方案,,且取得了良好的效果,看到商機(jī)后,,英特爾也在跟進(jìn),,開發(fā)了一整套先進(jìn)制程工藝和封裝技術(shù)。
總之,,在先進(jìn)制程不斷迭代的今天,,芯片良率問題變得越來越突出,與此同時,,高性能需求也在給良率找麻煩,。一切都好難,,能夠玩轉(zhuǎn)這些的廠商恐怕會越來越少。