1956年人工智能(AI)概念被提出時,,即使是想象力最豐富的預(yù)言家,應(yīng)該也難以預(yù)料到2022年的AI,,早已打敗了全球最頂級的圍棋選手,,能夠預(yù)測天氣,診療疾病,,甚至,,AI還在改變被譽為“工業(yè)糧食”的半導(dǎo)體行業(yè)。
隨著半導(dǎo)體制造工藝的持續(xù)演進,,采用先進制程的芯片,,單顆芯片集成的晶體管數(shù)量高達數(shù)百億個,系統(tǒng)愈加復(fù)雜,,設(shè)計挑戰(zhàn)越來越大,。但與此同時,終端應(yīng)用的軟件和算法加速迭代,,以月或者年為周期更新的芯片越來越難以滿足終端需求,,芯片設(shè)計的周期亟需縮短。
EDA工具與AI技術(shù)的結(jié)合,,不僅能設(shè)計出PPA(性能,、功耗、面積)更好的芯片,,還能顯著縮短芯片設(shè)計周期,。在達成提供更好、更快,、更便宜的芯片愿景的同時,,也將大幅降低芯片設(shè)計的門檻,讓更多人和企業(yè)能夠設(shè)計出所需的芯片,,將對芯片行業(yè)產(chǎn)生深遠影響,。
2020年,,新思科技推出了業(yè)界首個用于芯片設(shè)計的自主人工智能應(yīng)用程序——DSO.ai (Design Space Optimization AI)。作為一款人工智能和推理引擎,,DSO.ai能夠在芯片設(shè)計的巨大求解空間里搜索優(yōu)化目標,。
目前,全球頂級的芯片設(shè)計公司,,包括英特爾,、聯(lián)發(fā)科、三星,、索尼、瑞薩電子等都已經(jīng)采用了DSO.ai,,在不同的芯片工藝節(jié)點和不同類型的芯片設(shè)計中,,普遍獲得了4-5倍,甚至更高的效率的提升,。
一經(jīng)嘗試就讓芯片公司們喜愛的DSO.ai,,還有一個“熱啟動”絕招。
各種芯片,,都能用AI設(shè)計
將AI技術(shù)與EDA工具結(jié)合,,有兩個核心價值,首先是力圖讓EDA更加智能,,減少重復(fù)且繁雜的工作,,讓使用者用相同甚至更短時間設(shè)計出PPA更好的芯片;其次是大幅降低使用者的門檻,,解決人才短缺的挑戰(zhàn),。
DSO.ai更加智能這一核心價值的體現(xiàn),是能夠在巨大的芯片設(shè)計解決方案空間中,,搜索優(yōu)化目標,,利用強化學(xué)習(xí)來優(yōu)化功耗、性能和面積,。
無論是x86架構(gòu),、Arm架構(gòu)還是傳感器,無論使最先進的工藝,,還是成熟的工藝,,都可以用DSO.ai實現(xiàn)PPA的提升,同時縮短設(shè)計周期,。
當然,,在實際使用DSO.ai時,不同的開發(fā)者在設(shè)計芯片時優(yōu)化的目標會有所差異,,比如手機芯片開發(fā)者側(cè)重CPU功耗的優(yōu)化,,圖像傳感器開發(fā)者則更希望縮短設(shè)計周期加速產(chǎn)品上市,,DSO.ai都能夠靈活地解決差異化的需求,并且?guī)頂?shù)倍的效率提升,。
DSO.ai之所以能在不同工藝節(jié)點和不同技術(shù)架構(gòu)中都能實現(xiàn)顯著的效率提升,,核心原因是基于新思科技在EDA領(lǐng)域積累的多年豐富的行業(yè)經(jīng)驗,借助AI的自動化學(xué)習(xí)能力和底層算例,,把此前需要開發(fā)者們一遍遍嘗試的重復(fù)而繁雜的工作,,交由AI快速探索數(shù)以萬億計的設(shè)計方法找到最優(yōu)解,因此具有普遍的適用性,。
DSO.ai的第二大核心價值,,能夠幫傳統(tǒng)芯片設(shè)計公司解決人才短缺的挑戰(zhàn),并大幅降低芯片設(shè)計的門檻,。
數(shù)字化趨勢下,,大型系統(tǒng)級公司們紛紛開始自研芯片,通過定制芯片來優(yōu)化其應(yīng)用或工作負載,。但大型系統(tǒng)級公司往往缺乏芯片設(shè)計的經(jīng)驗和經(jīng)驗豐富的芯片設(shè)計的人才,,DSO.ai能夠完美解決大型系統(tǒng)級公司面臨的挑戰(zhàn)。
借助DSO.ai,,一個只有幾年工作經(jīng)驗的開發(fā)者,,也能達到有多年豐富經(jīng)驗開發(fā)者的設(shè)計水準。
DSO.ai的兩大優(yōu)勢,,將惠及幾乎各種類型的芯片設(shè)計公司,,典型的就是通用芯片公司和系統(tǒng)級兩大類客戶。 對于通用芯片公司,,DSO.ai的目標是通過仿真驗證,、快速原型等更快、更易用的工具,,使芯片生產(chǎn)出來之前就能模擬出實際的性能,、功耗等表現(xiàn),節(jié)約成本和設(shè)計周期,。對于系統(tǒng)級公司,,DSO.ai通過各種IP模塊和設(shè)計工具幫助他們解決芯片架構(gòu)和工藝的選擇。
數(shù)量級性能提升,,門檻大幅降低
由于需要更加強大的算力作為支撐,,所以DSO.ai的出現(xiàn)在一定程度上也是得益于云計算的普及,新思科技也通過和云服務(wù)提供商合作提供DSO.ai解決方案,。
當然,,正如云計算的普及不是一蹴而就,一開始,,DSO.ai在芯片設(shè)計公司眼中也是新生事物,。剛開始,,頂級芯片設(shè)計公司們對于DSO.ai的態(tài)度也有些謹慎,但對DSO.ai進行測試之后,,他們發(fā)現(xiàn),,在獲得PPA大幅提升的同時還能縮短設(shè)計周期。很快,,DSO.ai就迅速獲得了全球頂尖芯片設(shè)計公司們的認可,。
英特爾、聯(lián)發(fā)科,、三星,、索尼和瑞薩電子等都是典型的例子。
英特爾發(fā)現(xiàn),,面對優(yōu)化高性能芯片的PPA并縮短設(shè)計周期這一目標時,,有諸多關(guān)鍵挑戰(zhàn)需要解決,包括:設(shè)計尺寸大,,運行時間長;對于較大尺寸的設(shè)計,,最終RTL到GDS的收斂循環(huán)更長,;在最后階段執(zhí)行多個手動ECO延長了設(shè)計關(guān)閉時間;跨多個設(shè)計向量優(yōu)化PPA將增加實驗數(shù)量等,。
在實際案例中,,英特爾采用DSO.ai技術(shù)對芯片設(shè)計周期和PPA進行優(yōu)化,實現(xiàn)了設(shè)計時間結(jié)果質(zhì)量提高約40%,,運行時間加速了約20%,。英特爾通過將DSO.ai并入?yún)^(qū)塊布局布線(PnR)流程中,有助于縮短芯片設(shè)計周期并實現(xiàn)最佳PPA,,減少了人工/ECO收斂工作中的攪動,,并及時向RTL所有者提供反饋以修復(fù)嚴重違反時間路徑的問題。
英特爾的例子還充分說明了DSO.ai易于定制的特性,,可以很好地解決芯片設(shè)計中計時或功耗帶來的挑戰(zhàn),、通過創(chuàng)建布局指標幫助緩解擁塞點、以及使用庫單元數(shù)量的限制,。
聯(lián)發(fā)科和三星也采用了DSO.ai技術(shù)提高先進制程Arm架構(gòu)移動CPU的性能和功耗,。在三星的案例中,DSO.ai技術(shù)被成功應(yīng)用于開發(fā)Voptz和Ftarget優(yōu)化應(yīng)用程序,,通過自動探索大量的電壓(V)/目標頻率(F)空間以找出最高基準分數(shù)和最長電池時間的最佳組合,。此外,DSO.ai RL模型將通過分析之前運行中的選擇,,自動學(xué)習(xí)并生成更好的組合,。
結(jié)果顯示,,三星在4nm Arm Big CPU的實驗中,在相同的工作電壓下,,DSO.ai實現(xiàn)了頻率提高13%-80%,;而在相同的工作頻率下,最高可將功耗降低25%,。
三星的實踐展示了AI驅(qū)動的解決方案提高了生產(chǎn)力,,助力開發(fā)者能夠輸出高質(zhì)量的結(jié)果。
雖然和設(shè)計CPU有所不同,,但索尼在設(shè)計傳感器時要以最短的時間滿足各種類型終端的需求,,也需要縮短設(shè)計周期,提高結(jié)果質(zhì)量(PPA),。
因此,,索尼也在設(shè)計傳感器的過程中順利采用了DSO.ai技術(shù)并驗證了其出眾的性能,與專家工程師的人工操作相比,,DSO.ai實現(xiàn)最佳結(jié)果僅需1/4的設(shè)計周期,、1/5的設(shè)計工作量,并成功將功耗降低了3%,,進一步提升設(shè)計結(jié)果質(zhì)量,。
索尼發(fā)現(xiàn),與冷啟動相比,,熱啟動具備一些優(yōu)勢,,例如僅需1/2周期,并減少1/3的工作量,。
熱啟動,,也正是新思科技DSO.ai的絕招。
熱啟動,,DSO.ai的絕招
之所以說是絕招,,是因為目前業(yè)界集成AI的EDA工具中,僅新思科技的DSO.ai提供了熱啟動模式,。
眾所周知,,AI技術(shù)需要利用大量的計算資源來實現(xiàn)模擬人腦的神經(jīng)思考,而計算資源的不足往往限制了AI技術(shù)在高端應(yīng)用或大型企業(yè)的部署,。DSO.ai能夠?qū)⒚恳淮芜\行的學(xué)習(xí)經(jīng)驗保存到訓(xùn)練數(shù)據(jù)庫中,,之后就可以利用訓(xùn)練數(shù)據(jù)庫來提高設(shè)計探索的效率,減少執(zhí)行時間并降低對計算資源的要求,。
DSO.ai有熱啟動與冷啟動兩種模式,。
冷啟動實際上就是無訓(xùn)練數(shù)據(jù)的模式,需要執(zhí)行并創(chuàng)建訓(xùn)練數(shù)據(jù),,并選擇使用自己的“未訓(xùn)練”抽樣來分配第一個參數(shù),。一個新的設(shè)計引入DSO.ai時都是從冷啟動開始,,所以需要執(zhí)行大量訓(xùn)練工作,且必須在同一流程中執(zhí)行多次,。
熱啟動模式則是將“冷/熱啟動”的結(jié)果用作一個進程的模式,,在有訓(xùn)練數(shù)據(jù)的情況下自動學(xué)習(xí),以尋求最優(yōu)解,。熱啟動的顯著優(yōu)勢就是能夠減少工作量和縮短周期,,與此同時,熱啟動也能降低對算力的需求,。
英特爾在實踐中發(fā)現(xiàn),,有了熱啟動模式,能夠用更少的工程師實現(xiàn)更好的設(shè)計結(jié)果,。聯(lián)發(fā)科也體會到,,如果了解設(shè)計的參數(shù),實現(xiàn)了PPA的提升,,可以利用熱啟動提高生產(chǎn)力,,更進一步,也就可以實現(xiàn)復(fù)雜的計算和決策,。
新思科技能夠率先在業(yè)界推出熱啟動模式,,與新思科技較早在五六年前就組建了AI團隊研發(fā)相關(guān)項目有密切關(guān)系。
不止于此,,新思科技還在嘗試探索將熱啟動模式前移,也就是通過與IP提供商合作,,面向共同的客戶做針對性的優(yōu)化,,進一步提升DSO.ai效率。
新思科技將不斷提升DSO.ai的性能,,比如易用性的改進,、更加智能化(冷熱模式的自動切換)、適用性進一步擴大,,這些也都是客戶所期待的,。DSO.ai,正在被越來越多芯片設(shè)計公司采用,,新思科技也正在把AI與EDA的融合從數(shù)字芯片邏輯設(shè)計擴展到驗證環(huán)節(jié),。
未來,從芯片的架構(gòu)設(shè)計,、制造以及封裝的全流程都會融入AI技術(shù),。新思作為擁有芯片設(shè)計全流程的工具,能夠更容易可以在整個程中都使用AI,,帶來更顯著的全面提升,,而芯片行業(yè)深刻的變革,,也已經(jīng)開始。
我們迎來了突破性的芯片設(shè)計的新時代,。