美東時(shí)間10月8日周二在華盛頓舉行的“英偉達(dá)AI峰會(huì)”期間,,英偉達(dá)強(qiáng)調(diào)了同臺(tái)積電在加速計(jì)算領(lǐng)域合作的成績(jī):英偉達(dá)名為cuLitho 的計(jì)算光刻平臺(tái)正在臺(tái)積電投入生產(chǎn),,加速計(jì)算進(jìn)一步大幅提升了計(jì)算光刻這一芯片制造基石步驟的速度,,并降低能耗,。
英偉達(dá)稱,cuLitho 將加速計(jì)算引入計(jì)算光刻領(lǐng)域,。將 cuLitho 投入生產(chǎn)使臺(tái)積電能夠加快下一代芯片技術(shù)的開(kāi)發(fā),而目前的生產(chǎn)流程正接近物理學(xué)的極限,。臺(tái)積電應(yīng)用cuLitho進(jìn)行生產(chǎn)可以提高制造下一代先進(jìn)半導(dǎo)體芯片的速度,,并突破物理限制,。
計(jì)算光刻是電腦芯片制造的關(guān)鍵步驟。ASML對(duì)它的定義是,,利用計(jì)算機(jī)建模,、仿真和數(shù)據(jù)分析等手段,預(yù)測(cè),、校正,、優(yōu)化和驗(yàn)證光刻工藝在一系列圖案、工藝和系統(tǒng)條件下的成像性能,。它涉及電磁物理,、光化學(xué)、計(jì)算幾何,、迭代優(yōu)化和分布式計(jì)算這些復(fù)雜的計(jì)算,,是整個(gè)半導(dǎo)體設(shè)計(jì)和制造過(guò)程中計(jì)算最密集的工作負(fù)載。晶圓代工廠通常會(huì)專門(mén)為這些計(jì)算設(shè)立大型數(shù)據(jù)中心,。而現(xiàn)在先進(jìn)芯片的尺寸越來(lái)越小,,降至3nm及以下,需要計(jì)算光刻更加精準(zhǔn),,計(jì)算光刻所需的時(shí)間也越來(lái)越多,。沒(méi)有更強(qiáng)大的計(jì)算光刻很難實(shí)現(xiàn)復(fù)雜的掩模版設(shè)計(jì)。計(jì)算光刻歷來(lái)是將新技術(shù)節(jié)點(diǎn)和電腦架構(gòu)推向市場(chǎng)的瓶頸,。
去年的英偉達(dá)開(kāi)發(fā)者大會(huì)GTC上,,英偉達(dá)發(fā)布了基于GPU構(gòu)建的cuLitho計(jì)算光刻技術(shù)軟件庫(kù),被稱為改變計(jì)算光刻領(lǐng)域游戲規(guī)則的軟件,。cuLitho的核心是英偉達(dá)科學(xué)家發(fā)明的一組并行算法,,計(jì)算光刻工藝的所有部分都可以并行運(yùn)行。原來(lái)需要4萬(wàn)個(gè)CPU系統(tǒng)才能完成的工作,,現(xiàn)在僅需用500個(gè)英偉達(dá)DGX H100系統(tǒng)即可完成,。使用cuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3-5倍,而耗電量可以比當(dāng)前配置降低9倍,。
本周二英偉達(dá)重申了今年GTC大會(huì)上披露的成績(jī),,每年,先進(jìn)的代工廠要為計(jì)算光刻耗費(fèi)數(shù)百億小時(shí)CPU計(jì)算時(shí)間,,一個(gè)芯片掩模組通??赡苄枰?3000 萬(wàn)小時(shí)或更多的 CPU 計(jì)算時(shí)間,因此代工廠必須有大型數(shù)據(jù)中心,。而通過(guò)加速計(jì)算,,350 套英偉達(dá)H100 Tensor Core GPU 的系統(tǒng)現(xiàn)在就可以取代 4萬(wàn)套CPU 系統(tǒng),加快了生產(chǎn)時(shí)速度,,同時(shí)降低了成本,、空間要求和功耗,。
臺(tái)積電CEO魏哲家在今年的英偉達(dá)GTC大會(huì)上表示,通過(guò)與英偉達(dá)一同將 GPU 加速計(jì)算整合到臺(tái)積電的工作流中臺(tái)積電大幅提升了性能,、增加了吞吐量,、縮短了周期時(shí)間,并減少了功耗,。
英偉達(dá)今年的GTC大會(huì)披露,,自去年推出以來(lái),cuLitho 為臺(tái)積電的創(chuàng)新圖案化技術(shù)帶來(lái)了新的機(jī)遇,。在共享工作流上進(jìn)行的 cuLitho 測(cè)試顯示,,英偉達(dá)和臺(tái)積電共同將曲線流程速度和傳統(tǒng)曼哈頓式流程速度分別提升了 45 倍和近 60 倍。這兩種流程的不同點(diǎn)在于曲線流程的光掩模形狀為曲線,,曼哈頓式流程的光掩模形狀被限制為水平或垂直,。
本周二英偉達(dá)還提到其開(kāi)發(fā)的生成式 AI 應(yīng)用算法。事實(shí)證明,,這種算法提升了cuLitho 平臺(tái)的價(jià)值,。在 cuLitho 加快流程速度的基礎(chǔ)上,新的生成式 AI 工作流將速度又提升了兩倍,。應(yīng)用生成式 AI 可以創(chuàng)建近乎完美的反向光掩?;蚍聪蚪鉀Q方案,解決計(jì)算光刻中光的衍射問(wèn)題,,然后再通過(guò)傳統(tǒng)的嚴(yán)格物理方法推導(dǎo)出最終的光掩模,,從而將整個(gè)光學(xué)鄰近效應(yīng)校正 (OPC) 流程加快兩倍。
OPC在半導(dǎo)體光刻中的應(yīng)用已有三十年歷史,。英偉達(dá)稱,,三十年來(lái),很少有像加速計(jì)算和AI這兩種技術(shù)這樣,,為OPC帶來(lái)如此迅速的轉(zhuǎn)變,。這些技術(shù)讓物理模擬更精確,并且實(shí)現(xiàn)了曾經(jīng)資源密集型的數(shù)學(xué)技術(shù),。
目前晶圓廠工藝的許多變化都需要對(duì) OPC 進(jìn)行修改,,這增加了計(jì)算量,并給晶圓廠的開(kāi)發(fā)周期帶來(lái)瓶頸,。計(jì)算光刻技術(shù)的速度大幅提升加快了晶圓廠創(chuàng)建每個(gè)掩膜的速度,,從而縮短了開(kāi)發(fā)新技術(shù)節(jié)點(diǎn)的總周期。更重要的是,,它讓過(guò)去無(wú)法實(shí)現(xiàn)的新計(jì)算成為可能,。
英偉達(dá)舉例稱,二十年前科學(xué)文獻(xiàn)就提出了逆向光刻技術(shù),但由于計(jì)算時(shí)間過(guò)長(zhǎng),,因此在很大程度上無(wú)法在全芯片規(guī)模上實(shí)現(xiàn)準(zhǔn)確計(jì)算,。有了 cuLitho,情況就不再如此,。領(lǐng)先的代工廠將用它來(lái)提升逆向和曲線解決方案,這將有助于創(chuàng)造下一代強(qiáng)大的半導(dǎo)體,。