9月1日,,Cadence一年一度的CadenceLIVE China用戶大會(huì)成功以線上的形式舉辦,,此次“CadenceLIVE China 2020”的主題為“釋放想象”,,由主題峰會(huì)、12場(chǎng)技術(shù)分論壇和線上設(shè)計(jì)者展會(huì)組成,,匯聚Cadence的技術(shù)用戶,、開發(fā)者與業(yè)界專家,涵蓋從IP/SoC設(shè)計(jì),、驗(yàn)證仿真,、封裝和板級(jí)設(shè)計(jì)及系統(tǒng)分析全流程的技術(shù)分享。在主題峰會(huì)部分,,嘉賓們從產(chǎn)業(yè)趨勢(shì),,到技術(shù)革新,發(fā)布了深度見解,。
大會(huì)一開始,,Cadence公司副總裁、中國(guó)及東南亞地區(qū)總經(jīng)理徐昀表示,,隨著科創(chuàng)板助推產(chǎn)業(yè)發(fā)展騰飛,,優(yōu)秀的半導(dǎo)體企業(yè)開始不斷走到臺(tái)前,中國(guó)一直是Cadence投資重地,,本地化支撐是我們的服務(wù)宗旨,,對(duì)中國(guó)半導(dǎo)體未來充滿信心。
Cadence公司副總裁,、中國(guó)及東南亞地區(qū)總經(jīng)理徐昀
Cadence公司CEO陳立武(Lip-Bu Tan)帶來了主題為《推動(dòng)以數(shù)據(jù)為中心的革命》的演講,,他表示,目前業(yè)內(nèi)有5大技術(shù)潮流:5G,、超大規(guī)模計(jì)算(Hyperscale Computing),、工業(yè)物聯(lián)網(wǎng)、自動(dòng)駕駛以及AI,,背后推動(dòng)力則是芯片,。大數(shù)據(jù)推動(dòng)整個(gè)半導(dǎo)體行業(yè)的發(fā)展,包括數(shù)據(jù)收集,、傳輸,、存儲(chǔ)、處理,、分析,,需要各方面的創(chuàng)新,包括架構(gòu),、設(shè)計(jì)EDA,、IP以及整個(gè)生態(tài)的創(chuàng)新。
Cadence公司CEO陳立武
如今我們正在步入超大規(guī)模計(jì)算時(shí)代,,一方面數(shù)據(jù)指數(shù)級(jí)上升,,過去兩年時(shí)間產(chǎn)生的數(shù)據(jù)達(dá)到了約90%,其中非結(jié)構(gòu)化的數(shù)據(jù)占到80%,,只有低于2%的數(shù)據(jù)是被分析和處理的,。另一方面,性能和延時(shí)需要滿足從端到5G固定無線接入,,再到邊緣計(jì)算,,以及后面的數(shù)據(jù)中心的各自需求。超大規(guī)模的資本投入也使得產(chǎn)業(yè)轉(zhuǎn)型成為可能,,再加之受到從年初以來的疫情影響,,人們的工作、生活,、娛樂行為開始轉(zhuǎn)為線上方式,,使得相關(guān)的資本支出將繼續(xù)增加,。
截取自陳立武演講
陳立武表示,數(shù)據(jù)中心的革命正在推動(dòng)產(chǎn)業(yè)多方面的需求以及技術(shù)創(chuàng)新,,在數(shù)據(jù)處理方面,,應(yīng)用開始驅(qū)動(dòng)系統(tǒng)設(shè)計(jì),特定領(lǐng)域的加速變得非常重要,,管理軟件堆棧也日益重要,;在存儲(chǔ)方面,出現(xiàn)以內(nèi)存為中心的計(jì)算,,對(duì)延遲,、帶寬、容量和成本有了更高要求,,下一代存儲(chǔ)技術(shù)如PCM,、MRAM、QVM,、3D NAND需求旺盛,;在數(shù)據(jù)連接方面,需要超高帶寬,,市面上已經(jīng)出現(xiàn)從12.8 Terabits到25.6 Terabits傳輸能力的方案,,51.2 Terabits的方案明年也將出現(xiàn);在數(shù)據(jù)分析方面,,數(shù)據(jù)訓(xùn)練需要大量的標(biāo)記數(shù)據(jù)集,,也需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)簽和分析的新方法,此外啟發(fā)式函數(shù)和圖分析會(huì)有很大發(fā)展,。
如此的時(shí)代大背景下,,AI/ML、系統(tǒng)設(shè)計(jì)以及EDA的發(fā)展正在推動(dòng)產(chǎn)業(yè)從設(shè)計(jì)到系統(tǒng)再到智能化的發(fā)展,,因此,,Cadence也成立了Intelligent System Design策略,其中包括整合EDA,、系統(tǒng)設(shè)計(jì)和AI,;貫穿整個(gè)設(shè)計(jì)的智能化;以計(jì)算軟件為基礎(chǔ),;系統(tǒng),、硬件、軟件的協(xié)同優(yōu)化,;跨多個(gè)系統(tǒng)域,。
截取自陳立武演講
摩爾定律速度的放緩,設(shè)計(jì)成本的不斷增加,行業(yè)內(nèi)開始探索新的突破口,,其中異構(gòu)集成,、SiP、Chiplets等都實(shí)現(xiàn)了創(chuàng)新,,陳立武表示,,Cadence可以在3D封裝方面提供完整的設(shè)計(jì)解決方案,,尤其擅長(zhǎng)混合融合設(shè)計(jì),。
在演講期間,陳立武透露Cadence大力投資了Green Hills公司,,加強(qiáng)了在安全嵌入式方面的投入,,進(jìn)一步完善Cadence智能系統(tǒng)設(shè)計(jì)的策略,幫助客戶設(shè)計(jì)更優(yōu)質(zhì)的芯片以及更快的上市時(shí)間,,滿足不同需求,。
在云服務(wù)方案,給客戶不同應(yīng)用方式,,目前有125家大小公司在使用Cadence的方案,,其中包括臺(tái)積電、三星等客戶,。目前,,Cadence的工具可以在云上操作。
Cadence公司總裁Anirudh Devgan博士的演講主題為《計(jì)算軟件驅(qū)動(dòng)智能系統(tǒng)設(shè)計(jì)》,。Anirudh Devgan表示:“未來十年,,科技將驅(qū)動(dòng)更多的計(jì)算軟件、更多的數(shù)據(jù)分析以及更多的數(shù)學(xué)軟件,。無論是EDA還是AI系統(tǒng)方面,,Cadence的軟件都處于非常有利的位置?!?/p>
Cadence公司總裁Anirudh Devgan博士
其中,,驗(yàn)證芯片和系統(tǒng)是一個(gè)非常大的問題,據(jù)Anirudh Devgan介紹,,Cadence的客戶運(yùn)行了非常多的驗(yàn)證和仿真加速周期,,其中CPU核心是10的13次方,GPU設(shè)計(jì)是10的15次方,。如果運(yùn)行10個(gè)15次方的周期,,對(duì)于芯片驗(yàn)證來說是非常龐大,但永遠(yuǎn)不知道什么時(shí)候是足夠的,。
截取自Anirudh Devgan演講
隨著時(shí)間推移,,在軟件和硬件驗(yàn)證需求會(huì)越來越大。Anirudh Devgan稱“我們使用了多個(gè)引擎,,包括仿真器,,形式驗(yàn)證引擎,,使得每個(gè)引擎性能達(dá)到一流?!?/p>
當(dāng)然,,一流的引擎遠(yuǎn)遠(yuǎn)不夠,背后的計(jì)算運(yùn)籌也值得思考,,它決定了使用更好的不同引擎的程度,,以及驗(yàn)證解決方案的整體有效性。在驗(yàn)證中,,計(jì)算運(yùn)籌使用數(shù)學(xué)算法來管理不同的引擎,,并知道什么時(shí)候使用什么。
在回歸測(cè)試?yán)又?,過程中包含了大量的驗(yàn)證仿真,,那么回歸測(cè)試的有效性決定了整體驗(yàn)證的有效性。Anirudh Devgan表示Xcelium ML使用了機(jī)器學(xué)習(xí),,來提高整體回歸和驗(yàn)證的吞吐量,。運(yùn)行Xcelium ML可以獲得相同的驗(yàn)證覆蓋率、相同的設(shè)計(jì)覆蓋率,,但速度加快了5倍,。
截取自Anirudh Devgan演講
Anirudh Devgan介紹了Cadence驗(yàn)證方案的另一亮點(diǎn)——Palladium硬件仿真加速器和Protium原型驗(yàn)證平臺(tái)的動(dòng)態(tài)組合,Palladium是SoC調(diào)試中最好的引擎,。而Protium在軟件調(diào)試方面堪稱一流,,運(yùn)行速度比Palladium快得多,兩者結(jié)合就有兩個(gè)相同的前端,,因此可以非常容易的從硬件驗(yàn)證過渡到軟件驗(yàn)證,,這種組合對(duì)客戶非常有益。兩者的使用多少取決于客戶的靈活調(diào)整,。
截取自Anirudh Devgan演講
在數(shù)字實(shí)現(xiàn)設(shè)計(jì)方面,,Anirudh Devgan回顧了Cadence的產(chǎn)品——Innovus,Genus,,Tempus,,Quantus。最早的產(chǎn)品追溯到2013年,,期間,,Cadence的目標(biāo)是提供一個(gè)完全的整合方案。當(dāng)工藝節(jié)點(diǎn)走到16nm,、7nm以下,,引擎需要被完全整合,Cadence需要持續(xù)提供最好的PPA產(chǎn)品(功耗、性能和面積),。
而數(shù)字全流程的關(guān)鍵技術(shù)就是運(yùn)用ML,,當(dāng)客戶設(shè)計(jì)他們的芯片時(shí),他們并不是只運(yùn)行一次這些工具,。工具一次次被運(yùn)行,,使用者在運(yùn)行中獲得知識(shí),然后將其轉(zhuǎn)換到下一次運(yùn)行中進(jìn)一步優(yōu)化,,這是過去幾十年常規(guī)設(shè)計(jì)過程,。只有使用機(jī)器學(xué)習(xí),它提供精確的框架,,將之前的知識(shí)應(yīng)用到下一次運(yùn)行中,,Anirudh Devgan稱之為非常強(qiáng)大的轉(zhuǎn)變,。不僅運(yùn)行一次,,而且從一次運(yùn)行到下一次運(yùn)行知道怎樣優(yōu)化。使用ML是一個(gè)強(qiáng)大的科技,,來對(duì)設(shè)計(jì)規(guī)格進(jìn)行更有效的搜索,,它將會(huì)在工具中找到最佳的選擇,最好的流程,,供客戶使用,。
截取自Anirudh Devgan演講
在3D-IC方面,“我們正在努力使Allegro與Innovus和Virtuoso結(jié)合,,這就是IC設(shè)計(jì)實(shí)現(xiàn)系統(tǒng)以及封裝實(shí)現(xiàn)系統(tǒng),,為客戶提供一個(gè)整合的方案?!?Anirudh Devgan表示,,“Cadence處在一個(gè)特殊位置,作為僅有的能真的無縫整合先進(jìn)封裝和IC設(shè)計(jì)的公司,,在這上面,,我們正在加入許多分析工具。產(chǎn)業(yè)正在發(fā)生巨大的變化,,Cadence正在大量投資,,為客戶提供正確的方案?!?/p>
截取自Anirudh Devgan演講
Anirudh Devgan還提到一項(xiàng)收購(gòu)案,,即收購(gòu)InspectAR,一款增強(qiáng)現(xiàn)實(shí)的平臺(tái),?!暗谝淮芜M(jìn)入增強(qiáng)現(xiàn)實(shí)領(lǐng)域,從Allegro平臺(tái)開始服務(wù)Allegro用戶,我相信增強(qiáng)現(xiàn)實(shí)能真的幫助PCB和封裝設(shè)計(jì),?!?/p>
“AR是一個(gè)特殊的價(jià)值點(diǎn),正在飛速發(fā)展,,但還沒有應(yīng)用在EDA設(shè)計(jì)工具以及系統(tǒng)工具中,,但我們覺得這是應(yīng)用AR到Allegro和SoC產(chǎn)品的絕好機(jī)會(huì)?!?/p>
在《大芯片量產(chǎn),,硬科技落地》的主題演講中,燧原科技CEO趙立東做開場(chǎng)白:“2020年已過大半,,充滿了機(jī)遇與不確定性,,本著做大芯片,拼硬科技的初心,?!?/p>
燧原科技CEO趙立東
從英偉達(dá)市值超過英特爾這一標(biāo)志性事件來看,趙立東表示:“英偉達(dá)憑借著在AI領(lǐng)域的龍頭地位和重倉(cāng)押注數(shù)據(jù)中心,,這也是燧原定位的市場(chǎng),,說明我們戰(zhàn)略方向是正確的,在互聯(lián)網(wǎng),、垂直市場(chǎng)和新基建三個(gè)方向積極拓展業(yè)務(wù),,以技術(shù)創(chuàng)新和業(yè)務(wù)盈利雙輪驅(qū)動(dòng)業(yè)務(wù)發(fā)展?!?/p>
從具體產(chǎn)品來看,,據(jù)燧原科技COO張亞林介紹,燧原科技DTU云端訓(xùn)練芯片系統(tǒng)的架構(gòu)是GCA(General Compute Architecture)架構(gòu),,在以往,,AI的通用架構(gòu)是GPU,隨著時(shí)間發(fā)展與技術(shù)迭代,,英偉達(dá)和AMD不再把GPU作為加速手段,,而是把游戲加速卡與AI加速卡分開。
燧原科技COO張亞林
張亞林表示:“燧原科技一直遵循最先進(jìn)的架構(gòu)設(shè)計(jì)原則,,在DTU云端訓(xùn)練芯破系統(tǒng)里,,完全通用化了計(jì)算系統(tǒng),其中囊括四個(gè)模塊:通用計(jì)算引擎,、通用數(shù)據(jù)引擎,、通用智能互聯(lián)和通用編程模型?!?/p>
其中,,通用計(jì)算引擎負(fù)載AI計(jì)算部分,,可以進(jìn)行全數(shù)據(jù)精度的計(jì)算,同時(shí)內(nèi)置特定加速器對(duì)點(diǎn)/向量/矩陣運(yùn)算,,還有內(nèi)置核心對(duì)超越函數(shù)加速,,同時(shí)支持多線程和多核心同步。通過數(shù)據(jù)引擎對(duì)L1/L2/L3分布式存儲(chǔ),,且內(nèi)置計(jì)算部分,,還是指令驅(qū)動(dòng)的數(shù)據(jù)流,對(duì)帶寬/能耗進(jìn)行深度優(yōu)化,,以及稀疏處理,。在通用智能互聯(lián)部分,內(nèi)置了強(qiáng)大互聯(lián)引擎,,構(gòu)建2D Mesh的拓?fù)浣Y(jié)構(gòu),,也支持定制拓?fù)浣Y(jié)構(gòu),燧原分布式運(yùn)算支持多機(jī)多卡部署,。在通用編程模型上,,充分設(shè)計(jì)自己編程語言,對(duì)計(jì)算流和運(yùn)算核心進(jìn)行高效編程,,也支持自動(dòng)算子生成和融合,。
具體規(guī)格來看,云燧T10支持20TFLOPS的在FP32的單卡算力,,以及80TFLOPS在BF16的算力,支持PCIe 4.0互聯(lián),,最大功耗225W,。涵蓋了人工智能大部分場(chǎng)景,計(jì)算機(jī)視覺,、語音,、自然語言處理、推薦,、強(qiáng)化學(xué)習(xí)等復(fù)雜模型訓(xùn)練,。
此外,云燧T10-Matrix是一個(gè)面向數(shù)據(jù)中心的人工智能訓(xùn)練集群系統(tǒng),,目前已完成大規(guī)模部署的互聯(lián)網(wǎng)數(shù)據(jù)中心的商用集群系統(tǒng)(可擴(kuò)展到千卡規(guī)模),。
“大芯片的設(shè)計(jì)難度比小芯片是指數(shù)級(jí)上升,挑戰(zhàn)主要在芯片,、板卡,、服務(wù)器以及軟件上?!睆垇喠直硎敬笮酒牧慨a(chǎn)并不是觸手可得,,芯片端需要保證可靠性,、在性能/頻率/電壓調(diào)協(xié)下保持性能、良率,、功耗/散熱,;板卡端要保持可靠性、信號(hào)完整性,、良率,、功耗/散熱問題;服務(wù)器方面,,需要進(jìn)行兼容性測(cè)試,、壓力測(cè)試、質(zhì)量認(rèn)證以及系統(tǒng)工具,;軟件端,,需要考慮可靠性/穩(wěn)定性、靈活的編程模型和開發(fā)接口,、多模型覆蓋以及完整工具鏈,。
真正的大芯片量產(chǎn),硬科技落地要走過非常長(zhǎng)的路,,其中架構(gòu)完成只是完成5%,,流片完成只進(jìn)行了20%,芯片點(diǎn)亮完成了30%,,芯片功能測(cè)試完成只是達(dá)成了50%,,此后還要從芯片、板卡,、服務(wù)器,、軟件等多方面保證,才能確保最終的大芯片量產(chǎn),。
最后,,張亞林表示,大芯片是中國(guó)挺起科技脊梁的必要方向,,我們需要實(shí)現(xiàn)真正的業(yè)務(wù)落地和算力普惠,,為中國(guó)的科技界帶來更多更好的解決方案,實(shí)現(xiàn)整個(gè)人工智能規(guī)?;膽?yīng)用,,這才是當(dāng)下科技時(shí)代應(yīng)該做的東西。
亞馬遜網(wǎng)絡(luò)服務(wù)副總裁,、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara演講主題為《云計(jì)算和工業(yè)合作如何幫助改變芯片開發(fā)的曲線》,,演講一開始,Nafea Bshara從一款芯片產(chǎn)品說起,。
亞馬遜網(wǎng)絡(luò)服務(wù)副總裁,、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara
幾個(gè)月前,,亞馬遜發(fā)布了第二代自研服務(wù)器芯片Graviton2,基于ARM架構(gòu)自研的第二代服務(wù)器處理器芯片Graviton2,,相比1代Graviton,,Graviton2的性能提升7倍。在此前的發(fā)布會(huì)上,,亞馬遜還將其與配備Intel至強(qiáng)鉑金(最高3.1GHz)的第五代實(shí)例進(jìn)行對(duì)比,,單核心性能全面領(lǐng)先。
截取自Nafea Bshara演講
也因?yàn)榇?,外界?duì)Annapurna Labs的關(guān)注度不斷提高,。據(jù)Nafea Bshara介紹,Annapurna Labs成立于2011年,,專注于IT基礎(chǔ)設(shè)施,,起初是一個(gè)非常小的團(tuán)隊(duì),資本也不是很多,。隨著市場(chǎng)的炒作,,人們開始關(guān)注云計(jì)算的初創(chuàng)公司,但在2011年,,人們對(duì)云計(jì)算的關(guān)注度還不是很高,。
資料顯示,2015年時(shí),,Annapurna Labs與亞馬遜進(jìn)行了合作,,亞馬遜推出了EC2 C4實(shí)例系列。除了將網(wǎng)絡(luò)虛擬化裝載到定制硬件之外,,這些實(shí)例還得到了為存儲(chǔ)服務(wù)優(yōu)化的ASIC的支持,。隨后是收購(gòu)讓亞馬遜如虎添翼,不斷在服務(wù)器芯片上有自己的動(dòng)作,。
Nafea Bshara表示,半導(dǎo)體行業(yè)有一個(gè)獨(dú)特的產(chǎn)業(yè)鏈,,囊括EDA,、IP、代工廠,、封裝等,,而芯片設(shè)計(jì)又是一個(gè)高風(fēng)險(xiǎn)的業(yè)務(wù),依賴于全球技術(shù)和供應(yīng)商的支持,。
此外,,芯片的開發(fā)還遵循著開發(fā)成本、價(jià)值時(shí)間,、工程人員不斷指數(shù)級(jí)增長(zhǎng)的規(guī)律,。起初亞馬遜采取與Arm等合作伙伴合作的方式,,來進(jìn)入到市場(chǎng),并從18個(gè)月內(nèi)完成從0到投產(chǎn)的目標(biāo),。隨后困難接踵而至,,先進(jìn)工藝的追求開始影響亞馬遜的突破。Nafea Bshara表示,,此時(shí)的亞馬遜開始思考如何通過強(qiáng)大的工具來制定計(jì)劃和降低成本,,與此同時(shí),亞馬遜開始與Cadence緊密的合作,。
截取自Nafea Bshara演講
Nafea Bshara聲稱,,利用Cadence JasperGold,通過形式驗(yàn)證是提高質(zhì)量的關(guān)鍵所在,,而這也是亞馬遜提高芯片質(zhì)量和工程生產(chǎn)率的最佳工具,,同時(shí)可以優(yōu)化上市時(shí)間以及降低開發(fā)成本。整體來說,,在完成關(guān)鍵任務(wù)所需的時(shí)間上縮短了10倍以上,。
此外,使用亞馬遜Graviton2可以處理大部分的EDA工作負(fù)載,,據(jù)Nafea Bshara介紹,,從2016年-2017年推出的R4到2020年的R6g實(shí)例來看,AWS最新的Graviton2在R6g上的實(shí)例,,比前一代R5上英特爾的芯片提高20%運(yùn)算速度,,以及20%的功耗降低。從2017年到2020年的進(jìn)化來看,,整體運(yùn)算速度提高了44%,,功耗優(yōu)化了89%。
從基于云的EDA開發(fā)趨勢(shì)來看,,有了質(zhì)的轉(zhuǎn)變,,曾經(jīng)需要考慮服務(wù)器購(gòu)買、服務(wù)器更新,、購(gòu)買怎樣服務(wù)器的抉擇,。如今基于云的EDA開發(fā),可以挑選最理想的服務(wù)器,,對(duì)產(chǎn)品上市和IT成本有了很大優(yōu)化,,團(tuán)隊(duì)擁有自己的預(yù)算并且開支受到監(jiān)控,更可以在預(yù)算之內(nèi)選擇更多服務(wù)器,,最后還有安全監(jiān)控,、管理、存儲(chǔ)/備份等服務(wù),。
作為集成電路產(chǎn)業(yè)上游的領(lǐng)軍企業(yè),,Cadence在過去30多年見證了全球半導(dǎo)體的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,。如今,數(shù)據(jù)的爆炸式增長(zhǎng)正在助推數(shù)據(jù)中心的革命,,而軟件工具在背后支撐起整個(gè)產(chǎn)業(yè)鏈的健康快速的發(fā)展,,一場(chǎng)軟件創(chuàng)新時(shí)代已經(jīng)來臨。