《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > EDA與制造 > 業(yè)界動(dòng)態(tài) > 5000核并行,,EDA效率提升53倍,!國(guó)內(nèi)最大規(guī)模OPC上云

5000核并行,,EDA效率提升53倍,!國(guó)內(nèi)最大規(guī)模OPC上云

2020-11-24
來(lái)源:EETOP
關(guān)鍵詞: OPC EDA 光刻技術(shù)

  上一篇《EDA云實(shí)證Vol.1:從30天到17小時(shí),,如何讓HSPICE仿真效率提升42倍?》里,,我們幫一家Design House提高了使用HSPICE進(jìn)行芯片設(shè)計(jì)仿真的效率,。

  而設(shè)計(jì)好的集成電路圖案需要通過(guò)光刻機(jī)轉(zhuǎn)印到晶圓上才能完成制造,這就是芯片制造中最重要的一個(gè)步驟——光刻,。

  在先進(jìn)工藝特別是 FinFET 工藝中,,計(jì)算光刻已經(jīng)成為光刻工藝研發(fā)的核心。

  光學(xué)鄰近效應(yīng)校正(Optical Proximity Correction,,OPC)屬于計(jì)算光刻技術(shù)的一種,,主要是利用軟件和高性能計(jì)算,來(lái)模擬仿真光刻過(guò)程中的光學(xué)和化學(xué)過(guò)程,,通過(guò)仿真建立精確的計(jì)算模型,,然后調(diào)整圖形的邊沿不斷仿真迭代,直到逼近理想的圖形,,最終加速工藝研發(fā)周期的目標(biāo),。

微信圖片_20201124131735.jpg

  這一過(guò)程對(duì)計(jì)算資源的需求隨著模型的精確度呈指數(shù)級(jí)別增長(zhǎng)。

  舉個(gè)例子,,一款7nm芯片需要高達(dá)100層的光罩,,每層光罩?jǐn)?shù)據(jù)都需要使用EDA工具進(jìn)行OPC的過(guò)程。整個(gè)過(guò)程對(duì)硬件算力要求很高,,EDA工具需要運(yùn)行在幾千核的服務(wù)器CPU上,,動(dòng)輒就是幾十萬(wàn)核時(shí)。

  我們通過(guò)今天的實(shí)證驗(yàn)證了如何在不同場(chǎng)景下,,大幅幫用戶(hù)縮短O(píng)PC運(yùn)行時(shí)間,,同時(shí)確保云端和本地計(jì)算結(jié)果的完全一致性和計(jì)算性能的穩(wěn)定性。

  這次實(shí)證涉及的場(chǎng)景很細(xì)致,,既有License服務(wù)器的配置地點(diǎn),,又有不同調(diào)度器,還一一對(duì)云上計(jì)算結(jié)果和本地做了數(shù)據(jù)對(duì)比,,使用的計(jì)算資源數(shù)量跨度也很大,,從80-5000核不等,非常細(xì)致,,極具參考性,。

  實(shí)證背景信息

  A社是一家大型IC設(shè)計(jì)公司,隨著近年業(yè)務(wù)規(guī)模不斷擴(kuò)大,,OPC相關(guān)計(jì)算需求增大,。

  但A社本地機(jī)房空間不足,原先傳統(tǒng)托管IDC模式也難以滿(mǎn)足彈性需求,,導(dǎo)致大量任務(wù)出現(xiàn)排隊(duì),,無(wú)法及時(shí)輸出成果,,拖慢了整個(gè)IC研發(fā)進(jìn)程。

  公司希望在本地建設(shè)和IDC托管之外,,尋求具備彈性的大規(guī)模算力來(lái)滿(mǎn)足業(yè)務(wù)高峰期的需求,,來(lái)滿(mǎn)足業(yè)務(wù)擴(kuò)展需求。

  實(shí)證目標(biāo)

  1,、OPC任務(wù)能否在云端有效運(yùn)行,?

  2、fastone平臺(tái)能否滿(mǎn)足業(yè)務(wù)彈性資源需求,,有效減少OPC運(yùn)行時(shí)間,?

  3、License Server配置在本地和云端對(duì)計(jì)算性能/一致性/穩(wěn)定性是否有影響,?

  4,、fastone能否支持不同調(diào)度器SGE/Slurm?使用不同調(diào)度器對(duì)計(jì)算性能/一致性/穩(wěn)定性是否有影響,?

  5,、fastone平臺(tái)的云端輸出計(jì)算結(jié)果是否與本地完全一致?

  實(shí)證參數(shù)

  平臺(tái):

  fastone企業(yè)版產(chǎn)品

  應(yīng)用:

  Synopsys Proteus?OPC

  適用場(chǎng)景:

  在提交設(shè)計(jì)到制造之前,,模擬仿真光學(xué)鄰近效應(yīng)校正,,從理論上探索增大最小可分辨特征尺寸(Minimum Resolvable Feature size,MRF)和工藝窗口(Process Window,,PW)的途徑,,指導(dǎo)工藝參數(shù)的優(yōu)化。

  License配置:

  本次實(shí)證分別驗(yàn)證了License Server部署在本地和云端的表現(xiàn),。

  云端硬件配置:

  本次實(shí)證涉及的考察因素比較多,,尤其是本地和云上進(jìn)行了同步一對(duì)一對(duì)比。用戶(hù)希望和本地硬件配置盡量保持一致,,有更好的可比性,,所以選擇了跟本地接近的內(nèi)存密集型實(shí)例機(jī)型,。

  調(diào)度器:

  本次實(shí)證同時(shí)采用了SGE和Slurm兩種調(diào)度器,。

  技術(shù)架構(gòu)圖:

微信圖片_20201124131742.png

  兩個(gè)紅框表示EDA License Server分別部署在本地或云端。

  應(yīng)A社對(duì)于數(shù)據(jù)保密的要求,,

  本實(shí)證所有數(shù)據(jù)均經(jīng)過(guò)處理,。

  實(shí)證場(chǎng)景一

  5000核大規(guī)模OPC業(yè)務(wù)上云驗(yàn)證

  結(jié)論:

  1、云端調(diào)度5000核計(jì)算資源運(yùn)算一組OPC任務(wù),,耗時(shí)為80核計(jì)算資源運(yùn)算耗時(shí)的0.019倍,,相當(dāng)于從一個(gè)月縮短到13.8小時(shí);

  2,、公有云廠(chǎng)商大內(nèi)存型資源數(shù)量不算多,,單個(gè)區(qū)域想要一次性獲取高達(dá)5000核的內(nèi)存型實(shí)例很難實(shí)現(xiàn)。fastone平臺(tái)的Auto-Scale功能可在較短時(shí)間內(nèi),根據(jù)用戶(hù)需求,,自動(dòng)化跨區(qū)調(diào)度到大量目標(biāo)類(lèi)型計(jì)算資源,。

  實(shí)證過(guò)程:

  1、云端調(diào)度80核計(jì)算資源運(yùn)算一組任務(wù),,耗時(shí)為x,;

  5、云端調(diào)度5000核計(jì)算資源運(yùn)算一組任務(wù),,耗時(shí)為0.019x,。

微信圖片_20201124131745.jpg

  關(guān)于通過(guò)fastone平臺(tái)的Auto-Scale功能基于用戶(hù)時(shí)間優(yōu)先策略和成本優(yōu)先策略自動(dòng)調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類(lèi)型或相似類(lèi)型實(shí)例資源,這篇文章《生信云實(shí)證Vol.3:提速2920倍,!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子》里有詳細(xì)說(shuō)明,。

微信圖片_20201124131750.jpg

  實(shí)證場(chǎng)景二

  License Server配置在本地VS云端

  云上VS本地:計(jì)算性能/一致性/穩(wěn)定性驗(yàn)證

  結(jié)論:

  1、License Server部署在本地和云端對(duì)于計(jì)算結(jié)果無(wú)影響,;

  2,、云端和本地分別運(yùn)行相同OPC任務(wù):

  計(jì)算性能:云上計(jì)算時(shí)間均優(yōu)于本地;

  一致性:云端和本地計(jì)算結(jié)果均完全一致,;

  穩(wěn)定性:集群運(yùn)行均無(wú)中斷,,GUI啟動(dòng)均正常。

微信圖片_20201124131758.jpg

  實(shí)證過(guò)程:

  1,、License Server部署在本地,,云上調(diào)度80/240/480/1600/3200/5000核計(jì)算資源運(yùn)行OPC任務(wù),本地同步運(yùn)行80/240/480/1600/3200/5000核相同OPC任務(wù),;

  2,、License Server部署在云端,云上調(diào)度80/240/480/1600/3200/5000核計(jì)算資源運(yùn)行OPC任務(wù),,本地同步運(yùn)行80/240/480/1600/3200/5000核相同OPC任務(wù),。

  實(shí)證場(chǎng)景三

  License Server配置在本地VS云端

  云端擴(kuò)展性驗(yàn)證

  結(jié)論一:

  1、License Server配置在本地,,使用云端資源運(yùn)算OPC任務(wù),,性能隨資源增加線(xiàn)性提升。

微信圖片_20201124131801.jpg

  注:參考值分別為:80核-1,、240核-0.3333,、480核-0.1667、1600核-0.05,、3200核-0.025,,5000核-0.016。

  實(shí)證過(guò)程:

  將License Server部署在本地:

  1,、云端調(diào)度80核計(jì)算資源運(yùn)算Case1,,耗時(shí)為x,;

  2、云端調(diào)度240核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.3375x,;

  3、云端調(diào)度480核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.1679x,;

  4、云端調(diào)度1600核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0518x,;

  5、云端調(diào)度3200核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0285x,;

  6、云端調(diào)度5000核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0216x,;

  7、云端調(diào)度80核計(jì)算資源運(yùn)算Case2,,耗時(shí)為y,;

  8、云端調(diào)度240核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.3389y,;

  9、云端調(diào)度480核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.1682y,;

  10、云端調(diào)度1600核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0529y,;

  11、云端調(diào)度3200核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0300y,;

  12、云端調(diào)度5000核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0230y,。

  結(jié)論二:

  License Server配置在云端,,使用云端資源運(yùn)算OPC任務(wù),,性能隨資源增加線(xiàn)性提升。

微信圖片_20201124131805.jpg

  注:參考值分別為:80核-1,、240核-0.3333,、480核-0.1667,、1600核-0.05、3200核-0.025,,5000核-0.016,。

  實(shí)證過(guò)程:

  將License Server部署在云端:

  1、云端調(diào)度80核計(jì)算資源運(yùn)算Case1,,耗時(shí)為x,;

  2、云端調(diào)度240核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.3346x,;

  3、云端調(diào)度480核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.1672x,;

  4、云端調(diào)度1600核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0515x,;

  5、云端調(diào)度3200核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0270x,;

  6、云端調(diào)度5000核計(jì)算資源運(yùn)算Case1,,耗時(shí)為0.0191x,;

  7、云端調(diào)度80核計(jì)算資源運(yùn)算Case2,,耗時(shí)為y,;

  8、云端調(diào)度240核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.3390y,;

  9、云端調(diào)度480核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.1691y,;

  10、云端調(diào)度1600核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0588y,;

  11、云端調(diào)度3200核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0329y,;

  12、云端調(diào)度5000核計(jì)算資源運(yùn)算Case2,,耗時(shí)為0.0262y,。

  實(shí)證場(chǎng)景四

  不同調(diào)度器驗(yàn)證:SGE VS Slurm

  云端2000核/5000核

  結(jié)論:

  1,、分別使用SGE和Slurm調(diào)度云端2000核/5000核運(yùn)行相同OPC任務(wù),對(duì)于計(jì)算結(jié)果無(wú)影響,;

  2,、云端和本地使用不同調(diào)度器分別運(yùn)行相同OPC任務(wù):

  計(jì)算性能:云上計(jì)算時(shí)間均優(yōu)于本地;

  一致性:云端和本地計(jì)算結(jié)果均完全一致

  穩(wěn)定性:集群運(yùn)行均無(wú)中斷,,GUI啟動(dòng)均正常,。

微信圖片_20201124131808.jpg

  實(shí)證過(guò)程:

  1、使用SGE調(diào)度器,,云上調(diào)度2000核計(jì)算資源運(yùn)算一組OPC任務(wù),,本地同步運(yùn)行2000核相同OPC任務(wù);

  2,、使用SGE調(diào)度器,,云上調(diào)度5000核計(jì)算資源運(yùn)算一組OPC任務(wù),本地同步運(yùn)行5000核相同OPC任務(wù),;

  3,、使用Slurm調(diào)度器,云上調(diào)度2000核計(jì)算資源運(yùn)算一組OPC任務(wù),,本地同步運(yùn)行2000核相同OPC任務(wù),;

  4、使用Slurm調(diào)度器,,云上調(diào)度5000核計(jì)算資源運(yùn)算一組OPC任務(wù),,本地同步運(yùn)行5000核相同OPC任務(wù)。

  這篇文章《億萬(wàn)打工人的夢(mèng):16萬(wàn)個(gè)CPU隨你用》里,,我們基于這四家主流調(diào)度器:LSF/SGE/Slurm/PBS以及它們的9個(gè)演化版本進(jìn)行了梳理和盤(pán)點(diǎn),,尤其是對(duì)云的支持方面劃了重點(diǎn)??梢粤私庖幌?。

  實(shí)證小結(jié)

  1、Proteus?OPC任務(wù)在云端能有效運(yùn)行,;

  2,、fastone平臺(tái)能夠大幅度縮短O(píng)PC任務(wù)運(yùn)行時(shí)間;

  3,、License Server配置在本地和云端,,對(duì)計(jì)算性能/一致性/穩(wěn)定性沒(méi)有影響;

  4,、fastone平臺(tái)使用不同調(diào)度器SGE/Slurm,,對(duì)計(jì)算性能/一致性/穩(wěn)定性沒(méi)有影響;

  5、云端和本地運(yùn)行相同OPC任務(wù),,對(duì)計(jì)算結(jié)果沒(méi)有影響。

  本次EDA行業(yè)Cloud HPC實(shí)證系列Vol.4就到這里了,。

  在下一期實(shí)證中,,我們將對(duì)Virtuoso使用速石平臺(tái)進(jìn)行驗(yàn)證。請(qǐng)保持關(guān)注哦,!

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話(huà):010-82306118,;郵箱:[email protected]