《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > EDA與制造 > 業(yè)界動(dòng)態(tài) > 關(guān)于芯片產(chǎn)業(yè)的未來(lái),專(zhuān)家是這樣看的,!

關(guān)于芯片產(chǎn)業(yè)的未來(lái),,專(zhuān)家是這樣看的!

2019-08-11
關(guān)鍵詞: 芯片產(chǎn)業(yè)

  2019年度國(guó)際計(jì)算機(jī)體系結(jié)構(gòu)旗艦會(huì)議ISCA于6月在美國(guó)亞利桑那州鳳凰城召開(kāi),。6月23日與ISCA一起舉行的遠(yuǎn)景研討會(huì)(SIGARCH Visioning Workshop)吸引了上百位聽(tīng)眾,。一方面是因?yàn)榇舜窝杏憰?huì)主題“面向下一代計(jì)算的敏捷開(kāi)放硬件(Agile and Open Hardware for Next-Generation Computing)”是當(dāng)前體系結(jié)構(gòu)研究領(lǐng)域的前沿?zé)狳c(diǎn),引起了很多人的關(guān)注,;另一方面11位報(bào)告人中大牛云集,,有圖靈獎(jiǎng)得主David Patterson教授,也有多位美國(guó)工程院院士加持,,還有來(lái)自MIT,、Berkeley、Stanford,、UCSD,、Google、Nvidia,、DARPA等頂尖大學(xué),、企業(yè)和政府機(jī)構(gòu)的專(zhuān)家(自己成了唯一的一位來(lái)自美國(guó)以外的報(bào)告人,多少有些勢(shì)單力?。?。

  全程聽(tīng)完了一天的報(bào)告,我的最大感觸是開(kāi)源硬件(芯片)在美國(guó)各界已經(jīng)成為一種共識(shí)——從學(xué)術(shù)界,、企業(yè)界到DARPA這樣的政府機(jī)構(gòu),,都在積極投入到開(kāi)源芯片與芯片敏捷開(kāi)發(fā)方向的研究中。早在2016年的首屆Architecture 2030遠(yuǎn)景研討會(huì)上,,很多人就認(rèn)為開(kāi)源硬件將會(huì)是未來(lái)的大主題(Big Theme,,如圖1)。而在國(guó)內(nèi),,很多人對(duì)開(kāi)源硬件/芯片的理解還有些片面,,只是認(rèn)為“開(kāi)源芯片=RISC-V”。

微信圖片_20190811222453.jpg

  圖1. 2016年遠(yuǎn)景研討會(huì)上開(kāi)源硬件便備受關(guān)注

  遠(yuǎn)景研討會(huì)(Visioning Workshop)

  ACM體系結(jié)構(gòu)專(zhuān)業(yè)委員會(huì)SIGARCH組織的遠(yuǎn)景研討會(huì)(Visioning Workshop)是一個(gè)暢想未來(lái)的學(xué)術(shù)研討會(huì),。第一屆在2016年的ISCA上舉辦,,當(dāng)年的主題是《Architecture 2030》,,知名華人學(xué)者UCSB的謝源教授受邀做了題為《Technology-driven Architecture Innovation: Challenges and Opportunities》的報(bào)告。第二屆是在多倫多舉辦的ISCA上,,主題為《Trends in Machine Learning》,,圖靈獎(jiǎng)得主 Yoshua Bengio 教授以及陳天奇、賈揚(yáng)清兩位博士均為受邀報(bào)告人,。

  今年是第三屆,,主題是“Agile and Open Hardware for Next-Generation Computing”,一共有11個(gè)報(bào)告,,以下是議程,。

  David Patterson, UC Berkeley/Google, A New Golden Age for Computer Architecture

  Vivienne Sze, MIT, Domain-Specific Architectures for AI and Robotics: Opportunities and Challenges

  Serge Leef, DARPA, Automatic Implementation of Secure Silicon

  Andrew Kahng, UCSD, Bringing Design Technology and Architecture Closer Together: What Open Source Might Enable

  Yungang Bao, Chinese Academy of Sciences, The Four Steps to An Open-Source Chip Design Ecosystem

  Richard Ho, Google, Building A Sustainable Open-Source Hardware Ecosystem

  Mark Horowitz, Stanford, AHA! – Agile HArdware

  Jason Cong, UCLA, Democratize Customizable Computing

  Brucek Khailany, NVIDIA, Machine-Learning-Assisted Agile VLSI Design for Machine Learning

  Borivoje Nikoli?, UC Berkeley, Generating the Next Wave of Custom Chips

  Adam Chlipala, MIT, Strong Formal Verification Across a Hardware-Software Stack with RISC-V

微信圖片_20190811222447.jpg

  圖3. 2019年遠(yuǎn)景研討會(huì)11位報(bào)告人

  報(bào)告1:圖靈獎(jiǎng)得主David Patterson教授眼中的體系結(jié)構(gòu)黃金時(shí)代

  Patterson教授介紹敏捷與開(kāi)放體系結(jié)構(gòu)的挑戰(zhàn)與機(jī)遇。其實(shí)他的報(bào)告在很多場(chǎng)合都有講過(guò),,其中他對(duì)處理器指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)的分類(lèi)值得專(zhuān)門(mén)再提一下,。

  首先,他向大家強(qiáng)調(diào)ISA指令集,、微結(jié)構(gòu)設(shè)計(jì),、產(chǎn)品是三個(gè)層次。如圖4,,ISA是規(guī)范標(biāo)準(zhǔn),往往用一本書(shū)甚至幾張紙來(lái)記錄描述,;微結(jié)構(gòu)設(shè)計(jì)是具體實(shí)現(xiàn),,對(duì)應(yīng)的是源代碼;產(chǎn)品則是設(shè)計(jì)的實(shí)例化,,比如RedHat推出的Linux發(fā)行版,。他進(jìn)一步將指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)都分為三類(lèi):開(kāi)放免費(fèi)(open & free)、可授權(quán)(Licensiable),、封閉(closed),。于是,我們可以看到,,Intel就屬于封閉指令集+封閉設(shè)計(jì),,ARM屬于可授權(quán)指令集+可授權(quán)設(shè)計(jì),但要獲得授權(quán)價(jià)格不菲,,往往需要上百萬(wàn)甚至數(shù)千萬(wàn)美元,。

  RISC-V為全世界提供了開(kāi)放免費(fèi)指令集+開(kāi)放免費(fèi)設(shè)計(jì)的選擇。根據(jù)圖5的第一行,,我們可以知道只有先有了開(kāi)源開(kāi)放的指令集,,才有可能有開(kāi)源開(kāi)放的微架構(gòu)設(shè)計(jì),即綠色格子,。需要強(qiáng)調(diào)的是RISC-V本身是一種標(biāo)準(zhǔn)規(guī)范,,和C/C++語(yǔ)言規(guī)范,、POSIX系統(tǒng)調(diào)用等這些標(biāo)準(zhǔn)是一樣的。本身是開(kāi)放的,,誰(shuí)都可以基于這些標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)自己的處理器,。但有一點(diǎn)需要厘清的是即使都是基于開(kāi)源開(kāi)放指令集(比如RISC-V),也存在三種不同的商業(yè)模式:(1)Google,、NVidia等企業(yè)在內(nèi)部大量使用RISC-V核作為MCU,,但他們不對(duì)外開(kāi)放IP以及源代碼,這就屬于第一行的紅色格子,;(2)SiFive公司,、中國(guó)臺(tái)灣晶心Andes、阿里平頭哥的RISC-V核是可以被授權(quán)給第三方使用,,但并不開(kāi)源RTL級(jí)源碼,,因此屬于橙色格子;(3)Berkeley的Rocket Chip,、劍橋大學(xué)的LowRISC,、蜂鳥(niǎo)E203等RISC-V核將RTL級(jí)源碼也開(kāi)源,這些設(shè)計(jì)可歸到綠色格子,。

  圖4.ISA指令集,、微結(jié)構(gòu)設(shè)計(jì)、產(chǎn)品三個(gè)層次以及對(duì)應(yīng)的三種商業(yè)模式

微信圖片_20190811222444.jpg

  圖5. 三種不同商業(yè)模式形成處理器分類(lèi)

  從圖5第一行可知,,開(kāi)放開(kāi)源指令集并不等于就有了開(kāi)源的微結(jié)構(gòu)設(shè)計(jì),,這兩者很容易被混為一談。很多人也誤判RISC-V受到DARPA資助會(huì)影響其開(kāi)放性,。事實(shí)上,,TCP/IP協(xié)議也是DARPA資助下形成的互連標(biāo)準(zhǔn),但在具體實(shí)現(xiàn)層面也可以有不同商業(yè)模式:(1)在網(wǎng)絡(luò)協(xié)議棧的軟件實(shí)現(xiàn)方面,,有集成到BSD/Linux中的開(kāi)源TCP/IP協(xié)議棧,,也有微軟實(shí)現(xiàn)集成到商用Windows的TCP/IP協(xié)議棧;(2)在硬件實(shí)現(xiàn)方面上,,美國(guó)思科公司可以研發(fā)支持IP協(xié)議的路由器,,中國(guó)華為公司也可以研制自己支持IP協(xié)議的路由器,并不會(huì)因?yàn)槭荰CP/IP協(xié)議是受DARPA支持而不能使用,。

  另一個(gè)典型的例子是龍芯,。龍芯是基于MIPS指令集發(fā)展起來(lái)的,而MIPS最早是由美國(guó)企業(yè)開(kāi)發(fā)和維護(hù)的,,但人們都認(rèn)為龍芯是自主設(shè)計(jì)開(kāi)發(fā)的,,這正是區(qū)分了標(biāo)準(zhǔn)規(guī)范和微架構(gòu)設(shè)計(jì)。但談到RISC-V時(shí),,大家又經(jīng)?;鞛橐徽?,實(shí)不應(yīng)該。

  報(bào)告2:面向AI和機(jī)器人的加速器設(shè)計(jì)

  MIT的Vivienne Sze教授介紹了面向AI,、機(jī)器人和視頻壓縮的加速器設(shè)計(jì),。如圖6所示,Sze教授認(rèn)為領(lǐng)域?qū)S眉铀倨髟O(shè)計(jì)的套路是:(1)挖掘應(yīng)用特征——利用專(zhuān)用硬件來(lái)將并行性,、數(shù)據(jù)訪問(wèn)特征等特征轉(zhuǎn)變?yōu)橥掏屡c能效,;(2)設(shè)計(jì)更高效負(fù)載——在不影響結(jié)果質(zhì)量的前提下,通過(guò)算法與硬件協(xié)同設(shè)計(jì)更高效的負(fù)載,;(3)定義應(yīng)用范圍——根據(jù)應(yīng)用需求平衡靈活性與效率,。

  Sze教授用了三個(gè)例子分別展示這個(gè)套路的有效性,即DNN,、機(jī)器人自動(dòng)導(dǎo)航,、視頻壓縮。圖7是一個(gè)DNN的例子,,其他兩個(gè)例子可以直接看她的PPT材料,。

  Sze教授近年來(lái)獲得了各種獎(jiǎng)項(xiàng),今年ISCA上她的學(xué)生也獲得了最佳博士論文獎(jiǎng),。個(gè)人覺(jué)得他們團(tuán)隊(duì)的工作屬于穩(wěn)扎穩(wěn)打型,,他們的設(shè)計(jì)中采用的技術(shù)方案都是意料之中,并沒(méi)有特別的亮眼的地方,。但是他們的工作做得非常扎實(shí),,每一項(xiàng)工作都會(huì)把芯片做出來(lái)(如圖8),讓人很佩服,。相比之下很多其他團(tuán)隊(duì)的工作更多只是停留在論文階段的漂亮設(shè)計(jì),。

  題外話(huà):Sze教授的研究工作風(fēng)格讓我想起中科院動(dòng)物所所長(zhǎng)周琪院士的團(tuán)隊(duì),。周所在報(bào)告時(shí)提到他的學(xué)生曾抱怨,,“我們發(fā)表一篇文章數(shù)據(jù)量是其他團(tuán)隊(duì)的10倍,有這個(gè)必要嗎,?”他的回答是:“你以后會(huì)認(rèn)識(shí)到,,發(fā)表文章不是最難的,最難的是文章發(fā)表了要把它撤回來(lái)”,。世界頂尖團(tuán)隊(duì)的研究風(fēng)格都是類(lèi)似的,。

微信圖片_20190811222443.jpg

  圖6. 硬件加速器設(shè)計(jì)三部曲

微信圖片_20190811222437.jpg

  圖7. 采用三部曲設(shè)計(jì)方法的DNN加速器案例

微信圖片_20190811222435.jpg

  圖8. MIT Sze教授團(tuán)隊(duì)設(shè)計(jì)與實(shí)現(xiàn)的系列芯片

  報(bào)告3:來(lái)自DARPA的視角

  DARPA一直是顛覆式創(chuàng)新的代表,它孕育了很多對(duì)人類(lèi)產(chǎn)生巨大影響的項(xiàng)目,,比如Internet,、GPS等。在半導(dǎo)體領(lǐng)域,,MPW模式/Fabless模式都是在DARPA資助的項(xiàng)目中孕育出來(lái)的,。因此DARPA的視角也值得關(guān)注,。

  這次報(bào)告的是項(xiàng)目主管Serge Leef,他之前一直在工業(yè)界,,已經(jīng)有豐富的芯片領(lǐng)域經(jīng)驗(yàn),。他的報(bào)告介紹了如何自動(dòng)化實(shí)現(xiàn)芯片安全。除了傳統(tǒng)大家知道的芯片架構(gòu)安全,,他還專(zhuān)門(mén)強(qiáng)調(diào)了供應(yīng)鏈安全,,這也反映了美國(guó)在對(duì)華為禁運(yùn)的同時(shí),其實(shí)也在擔(dān)心有一天禁運(yùn)的板子打到自己身上,。

  這個(gè)報(bào)告并沒(méi)有包含具體的技術(shù),,但給人印象深刻的是Serge從整個(gè)業(yè)界生態(tài)角度來(lái)分析技術(shù)的價(jià)值——他提到降低芯片設(shè)計(jì)門(mén)檻不僅僅是一個(gè)技術(shù)問(wèn)題,也將促進(jìn)風(fēng)投和創(chuàng)業(yè),,從而推動(dòng)行業(yè)的創(chuàng)新(圖9與圖10),。對(duì)于這一點(diǎn)我深表贊同,自己也曾寫(xiě)過(guò)一篇從經(jīng)濟(jì)學(xué)角度分析開(kāi)源芯片的文章《駁“發(fā)展開(kāi)源芯片弊大于利”論》,。我曾經(jīng)看過(guò)其他DARPA的材料,,也都能看到類(lèi)似這種跳出技術(shù)本身、從更宏觀的角度分析的思路,,很值得學(xué)習(xí),。

微信圖片_20190811222433.jpg

  圖9. 傳統(tǒng)初創(chuàng)企業(yè)Seed/A輪/B輪融資額度穩(wěn)步提升,但芯片初創(chuàng)企業(yè)A輪就需要2000萬(wàn)美元

微信圖片_20190811222431.jpg

  圖10. DARPA希望能將芯片設(shè)計(jì)門(mén)檻降下來(lái),,促進(jìn)風(fēng)投和初創(chuàng)行業(yè),,推動(dòng)創(chuàng)新

  ERI自從2017年啟動(dòng)以來(lái),其資助的研究?jī)?nèi)容越來(lái)越成體系,。下圖是DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖,。DARPA每年也會(huì)在7月份舉辦ERI Summit,將這些項(xiàng)目的核心成員們召集研討進(jìn)展與下階段工作,。值得一提的是ERI Summit的報(bào)告材料都是可以公開(kāi)下載,,這是2018年的日程與報(bào)告下載地址:[http://eri-summit.com/agenda]

微信圖片_20190811222429.jpg

  圖11. DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖

  報(bào)告4:高效開(kāi)源EDA工具鏈已在路上(OpenROAD)

  UCSD的Andrew Kahng教授獲得了DARPA項(xiàng)目的資助,開(kāi)展高效開(kāi)源EDA工具鏈的研究,。他認(rèn)為EDA以前是關(guān)注質(zhì)量,,但現(xiàn)在該開(kāi)始關(guān)注把易用性了。他參與的DARPA IDEA項(xiàng)目目標(biāo)非常激進(jìn)——24小時(shí)內(nèi)全自動(dòng)地完成IP,、SoC芯片,、PCB版的設(shè)計(jì)(圖12)。

  在DARPA的資助下,,他帶領(lǐng)團(tuán)隊(duì)啟動(dòng)了OpenROAD項(xiàng)目,,該項(xiàng)目將從四個(gè)維度來(lái)應(yīng)對(duì)芯片設(shè)計(jì)復(fù)雜度問(wèn)題:(1)最大化劃分,將大的設(shè)計(jì)盡可能劃分為小模塊,,這樣可以?xún)蓚€(gè)好處,,一方面是降低算法復(fù)雜度,,另一方面就是更易挖掘并行性;(2)并行優(yōu)化,,這一點(diǎn)與前面最大化劃分密切聯(lián)想,,當(dāng)存在大量并行度時(shí),就可以采用各種加速并行的技術(shù)來(lái)優(yōu)化,,包括使用GPU來(lái)加速,;(3)采用機(jī)器學(xué)習(xí)的工具與流程,傳統(tǒng)芯片設(shè)計(jì)流程中有很多經(jīng)驗(yàn)規(guī)則,,這一點(diǎn)可以通過(guò)訓(xùn)練大量已有設(shè)計(jì)變成神經(jīng)網(wǎng)絡(luò)模型,,從而加速最優(yōu)電路設(shè)計(jì)的搜索和預(yù)測(cè)。這方面也是Kahng教授在報(bào)告中特別強(qiáng)調(diào)的,;(4)受限的布局方案也可以減少布局布線(xiàn)時(shí)的算法復(fù)雜度,。

  OpenRoad將于今年推出Alpha版,然后在2020年推出v1.0版本,。

微信圖片_20190811222428.jpg

  圖12. DARPA IDEA項(xiàng)目的目標(biāo)是全自動(dòng)化(無(wú)人干預(yù)),、24小時(shí)完成全系統(tǒng)硬件設(shè)計(jì)

微信圖片_20190811222425.jpg

  圖13. OpenRoad在四方面進(jìn)行優(yōu)化

微信圖片_20190811222423.jpg

  圖14. OpenRoad將于今明兩年開(kāi)源

  EDA是國(guó)內(nèi)芯片設(shè)計(jì)產(chǎn)業(yè)最大的軟肋,中國(guó)的EDA工具企業(yè)始終未能做大做強(qiáng),。如今,,美國(guó)開(kāi)始將EDA轉(zhuǎn)向開(kāi)源,中國(guó)又應(yīng)該如何應(yīng)對(duì),?這個(gè)問(wèn)題值得認(rèn)真研究,。我自己的觀點(diǎn)是開(kāi)源總體對(duì)中國(guó)是有利的,但開(kāi)源也存在競(jìng)爭(zhēng),,只有更多的投入,、參與和貢獻(xiàn),才能在開(kāi)源社區(qū)中起到主導(dǎo)作用,。中國(guó)不一定能在所有環(huán)節(jié)上都存在優(yōu)勢(shì),,但還是有可能在某些環(huán)節(jié)上推出有競(jìng)爭(zhēng)力的開(kāi)源EDA工具。

微信圖片_20190811222421.jpg

  圖15. 全世界范圍內(nèi)開(kāi)源EDA工具出現(xiàn)快速增長(zhǎng)趨勢(shì)

  報(bào)告5:中國(guó)的聲音

  我是這屆遠(yuǎn)景研討會(huì)上唯一一位來(lái)自美國(guó)以外的報(bào)告人,,這也反映了美國(guó)在這個(gè)方向上處于絕對(duì)領(lǐng)先地位,。我的報(bào)告題目是“The Four Steps to An Open-Source Chip Ecosystem”,,根據(jù)過(guò)去幾年在開(kāi)源芯片與敏捷開(kāi)放領(lǐng)域的一些實(shí)踐,,梳理了構(gòu)建開(kāi)源芯片生態(tài)所需要突破的四個(gè)方面:開(kāi)源ISA/IP/SoC、開(kāi)源EDA工具鏈,、高效低成本的仿真驗(yàn)證,、系統(tǒng)軟件。然后對(duì)每一部分的現(xiàn)狀和未來(lái)努力方向進(jìn)行了分析,。

微信圖片_20190811222420.jpg

  圖16. 構(gòu)建開(kāi)源芯片生態(tài)所需要突破的四個(gè)要素

  報(bào)告6:CHIPS聯(lián)盟與開(kāi)源UVM驗(yàn)證框架

  來(lái)自Google的Richard Ho博士介紹了CHIPS聯(lián)盟——這是近期Google聯(lián)合了6家企業(yè)成立了一個(gè)開(kāi)源芯片聯(lián)盟,,旨在推動(dòng)開(kāi)源芯片生態(tài)(圖17),。這7家企業(yè)每一家都貢獻(xiàn)了開(kāi)源芯片設(shè)計(jì)中所需要的功能模塊,例如西部數(shù)據(jù)的SweRV核,、SiFive的Rocket核,、Google的RISC-V-DV驗(yàn)證工具等。從圖18可以看到,,越來(lái)越多的開(kāi)源工具開(kāi)始出現(xiàn),,未來(lái)基于全開(kāi)源EDA工具設(shè)計(jì)開(kāi)源芯片,將不會(huì)是空談,。

微信圖片_20190811222418.jpg

  圖17. CHIPS聯(lián)盟旨在推動(dòng)開(kāi)源芯片生態(tài)

微信圖片_20190811222416.jpg

  圖18. 越來(lái)越多的開(kāi)源工具開(kāi)始出現(xiàn)

  Google開(kāi)源了一個(gè)面向RISC-V的驗(yàn)證框架(圖19),,可以通過(guò)RISC-V-DV來(lái)產(chǎn)生指令流,對(duì)設(shè)計(jì)進(jìn)行壓力測(cè)試,。芯片設(shè)計(jì)過(guò)程中的驗(yàn)證環(huán)境非常耗時(shí)耗力,,但又是極其重要的環(huán)節(jié)。應(yīng)該說(shuō)Google的這個(gè)開(kāi)源工具確實(shí)芯片設(shè)計(jì)中的痛點(diǎn),,但如何能靈活應(yīng)對(duì)不同的設(shè)計(jì),,如何能達(dá)到更高的性能,這些都還需要不斷優(yōu)化,。

微信圖片_20190811222414.jpg

  圖19.  Google開(kāi)源的針對(duì)RISC-V的驗(yàn)證框架

  報(bào)告7:硬件加速器設(shè)計(jì)與領(lǐng)域?qū)S谜Z(yǔ)言DSL

  美國(guó)工程院院士,、斯坦福大學(xué)的Mark Horowitz教授介紹了他們?cè)诩铀倨黝I(lǐng)域的工作。Horowitz教授早期參與了很多多處理器架構(gòu),、高帶寬內(nèi)存的研究,,創(chuàng)辦了Rambus公司。在這個(gè)報(bào)告中,,他認(rèn)為設(shè)計(jì)一個(gè)硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件上,,這可以分解為三個(gè)步驟(圖20):(1)用領(lǐng)域?qū)S谜Z(yǔ)言DSL來(lái)寫(xiě)應(yīng)用;(2)用編譯器將應(yīng)用映射到可編程的硬件模型(也可以看作某種粒度的ISA)上,;(3)將ISA映射到目標(biāo)硬件上,。

  Horowitz教授接著介紹了團(tuán)隊(duì)正在開(kāi)發(fā)的AHA工具鏈,融合了上述三個(gè)步驟(圖21),。報(bào)告非常精彩的部分是他坦言到雖然這套工具鏈能工作,,也開(kāi)發(fā)出了芯片,但還存在很大的問(wèn)題,,整個(gè)工具鏈需要重構(gòu),。然后他總結(jié)了6個(gè)經(jīng)驗(yàn)教訓(xùn):(1)敏捷開(kāi)發(fā)應(yīng)該關(guān)注系統(tǒng)構(gòu)建,而不僅僅是加速器的性能,,用戶(hù)關(guān)心的應(yīng)用最終性能,;(2)硬件設(shè)計(jì)不只是功能,還包括很多復(fù)雜問(wèn)題,如時(shí)序,、布局,、測(cè)試生成等,這些都不應(yīng)該暴露給用戶(hù),,因此可以通過(guò)DSL+編譯器來(lái)為用戶(hù)屏蔽這些底層細(xì)節(jié),;(3)用戶(hù)使用加速器時(shí)都會(huì)重寫(xiě)應(yīng)用代碼,既然需要重寫(xiě),,從一開(kāi)始就應(yīng)該讓用戶(hù)使用DSL,;(4)用戶(hù)希望為一類(lèi)應(yīng)用設(shè)計(jì)加速器,而不是僅僅為一個(gè)應(yīng)用,,因此粗粒度可重構(gòu)架構(gòu)CGRA是很好的選擇,;(5)敏捷開(kāi)發(fā)的核心是重用,因此要盡可能設(shè)計(jì)一些新工具提供重用度,;(6)開(kāi)源硬件可以降低NRE成本,,降低維護(hù)成本,但開(kāi)源硬件的形式不一定是硬件,,而將會(huì)是以軟件工具或代碼的形式,。

  Horowitz教授的這幾點(diǎn)經(jīng)驗(yàn)教訓(xùn)具有很強(qiáng)的啟發(fā)性,也很具有可操作性,,他們團(tuán)隊(duì)的工作值得關(guān)注,。

微信圖片_20190811222409.jpg

  圖20. 硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件

微信圖片_20190811222406.jpg

  圖21. 斯坦福大學(xué)開(kāi)發(fā)的芯片敏捷開(kāi)發(fā)AHA工具鏈

  報(bào)告8:高層次綜合

  美國(guó)工程院院士、UCLA的Jason Cong教授是FPGA與高層次綜合HLS(High-Level Synthesis)領(lǐng)域的頂尖專(zhuān)家,。HLS是從1980年代FPGA興起時(shí)CMU,、IBM等就開(kāi)始研究,但一直未能形成商用,。從2006年開(kāi)始,,Cong教授在UCLA啟動(dòng)了xPilot項(xiàng)目,后成立公司AutoESL推出AutoPilot工具,,并于2011年被Xilinx收購(gòu)集成為Vivado HLS工具,。在報(bào)告中,Cong教授指出HLS還面臨兩大挑戰(zhàn)(圖22):

 ?。?)需要花大力氣對(duì)代碼重構(gòu)才能達(dá)到好的性能,,簡(jiǎn)單的C代碼在綜合得到硬件后甚至可能比CPU性能慢上百倍(圖23)。Cong教授團(tuán)隊(duì)認(rèn)為可通過(guò)編譯優(yōu)化技術(shù)來(lái)解決這個(gè)問(wèn)題,,因此開(kāi)發(fā)了一個(gè)編譯器Merlin,,簡(jiǎn)化代碼重構(gòu)工作。體系結(jié)構(gòu)設(shè)計(jì)的“三大法寶”為并行,、流水和緩存,。Merlin編譯器的目標(biāo)是將“三大法寶”對(duì)應(yīng)的設(shè)計(jì)規(guī)則集成到編譯器中,從而在整個(gè)過(guò)程中減少人的參與,。

 ?。?)如何在很大的設(shè)計(jì)空間中找到優(yōu)化設(shè)計(jì)也是一個(gè)很大的挑戰(zhàn)。前面提到體系結(jié)構(gòu)層次有“三大法寶”,,而在具體設(shè)計(jì)時(shí)每一個(gè)法寶都有很多種選擇,,因此設(shè)計(jì)空間很大。這個(gè)挑戰(zhàn)不僅僅是學(xué)術(shù)界關(guān)心,,事實(shí)上工業(yè)界也很關(guān)心,,我們和海思技術(shù)交流中也提到這點(diǎn)。為了應(yīng)對(duì)這個(gè)問(wèn)題,,Cong教授團(tuán)隊(duì)開(kāi)發(fā)了一套自動(dòng)化設(shè)計(jì)空間探索框架(Automated design space exploration framework),。目前還主要是基于梯度進(jìn)行空間搜索,這方面還有很大的優(yōu)化空間,。

微信圖片_20190811222403.jpg

  圖22. 高層次綜合HLS面臨的兩大挑戰(zhàn)

微信圖片_20190811222401.jpg

  圖23. C代碼需要重構(gòu)才能獲得加速,,否則可能會(huì)比CPU慢上百倍

  Cong教授認(rèn)為讓程序員來(lái)寫(xiě)HLS代碼效率太低,應(yīng)該提供更高抽象的語(yǔ)言,,即領(lǐng)域?qū)S玫恼Z(yǔ)言DSL——程序員用更高級(jí)的DSL來(lái)寫(xiě)代碼,,然后自動(dòng)生成HLS代碼,進(jìn)而映射到FPGA上(圖24),。到這里可以看出這個(gè)技術(shù)思路與斯坦福Horowitz教授提出的三個(gè)步驟一致,,如果接著往下看,也會(huì)發(fā)現(xiàn)第10個(gè)來(lái)自Berkeley的報(bào)告也是同樣的理念,。

微信圖片_20190811222400.jpg

  圖24. DSL能提高HLS開(kāi)發(fā)效率

  報(bào)告9:英偉達(dá)的敏捷開(kāi)發(fā)實(shí)踐

  英偉達(dá)ASIC與VISL研究部門(mén)主任Brucek Khailany介紹了他們采用機(jī)器學(xué)習(xí)方法的敏捷開(kāi)發(fā)技術(shù),。英偉達(dá)積極投入芯片敏捷開(kāi)發(fā),其動(dòng)力也是因?yàn)楝F(xiàn)在芯片設(shè)計(jì)太過(guò)復(fù)雜,。例如,,英偉達(dá)產(chǎn)品的開(kāi)發(fā)周期一般需要3-5年,其中設(shè)計(jì)與驗(yàn)證的時(shí)間與成本占比大約70%(圖25),,2018年Nvidia Xavier SoC一共花了8000人年,!因此英偉達(dá)希望能將開(kāi)發(fā)周期與成本降低一個(gè)數(shù)量級(jí)。

  英偉達(dá)的總體思路包含三個(gè)要點(diǎn)(圖26):(1)使用更高級(jí)的開(kāi)發(fā)語(yǔ)言,,英偉達(dá)選擇的是C++,;(2)利用HLS工具將C++代碼轉(zhuǎn)變?yōu)镽TL代碼,從而可以嫁接到現(xiàn)有的ASIC開(kāi)發(fā)流程,;(3)充分使用已經(jīng)開(kāi)發(fā)好的庫(kù)和生成器(libraries/generator),,盡可能地重用已有設(shè)計(jì)從而節(jié)省時(shí)間。值得一提的是,,第(3)點(diǎn)庫(kù)和生成器是面向領(lǐng)域?qū)S玫男酒艚蓍_(kāi)發(fā)方法中很重要的環(huán)節(jié),,未來(lái)將會(huì)決定芯片敏捷開(kāi)發(fā)的性能與質(zhì)量,。最近這方面的工作也開(kāi)始增加,比如英偉達(dá)開(kāi)發(fā)的MatchLib,,Berkeley開(kāi)發(fā)的面向RISC-V的Rocket Chip Generator和面向模擬電路的Analogy Generator(下一章節(jié)將會(huì)介紹),。

  最后Khailany簡(jiǎn)要總結(jié)了將機(jī)器學(xué)習(xí)應(yīng)用到芯片設(shè)計(jì)自動(dòng)化方面的相關(guān)工作(圖27)。如之前Cong教授報(bào)告中提到,,設(shè)計(jì)自動(dòng)化中面臨的挑戰(zhàn)之一便是巨大的設(shè)計(jì)空間,。深度學(xué)習(xí)在大空間高效搜索方面則具有很大的潛力。

微信圖片_20190811222358.jpg

  圖25. 英偉達(dá)產(chǎn)品開(kāi)發(fā)周期需要3-5年,,設(shè)計(jì)與驗(yàn)證占比大約70%

微信圖片_20190811222357.jpg

  圖26. 敏捷開(kāi)發(fā)思路三個(gè)要點(diǎn):高層次語(yǔ)言,、工具、庫(kù)/生成器

微信圖片_20190811222355.jpg

  圖27. 機(jī)器學(xué)習(xí)為敏捷開(kāi)發(fā)帶來(lái)的機(jī)遇

  報(bào)告10:支持硬件敏捷開(kāi)發(fā)的新語(yǔ)言與生成器

  Berkeley的 Borivoje Nikoli? 教授的核心觀點(diǎn)是生成器(generator)將是芯片敏捷開(kāi)發(fā)的核心(圖28),,可以降低芯片設(shè)計(jì)的成本和開(kāi)發(fā)周期,。生成器技術(shù)和軟件開(kāi)發(fā)中的面向?qū)ο笏枷胗泻芏嘞嗤ㄖ帲琯enerator可以看作是一個(gè)class,。簡(jiǎn)單總結(jié)一下這種方式的好處:(1)重用度高,,一個(gè)生成器可產(chǎn)生很多實(shí)例;(2)更易定制化,,可通過(guò)修改參數(shù)產(chǎn)生不同的實(shí)例,;(3)便于驗(yàn)證,理論上對(duì)生成器充分驗(yàn)證(包括形式化驗(yàn)證),,可以保障生成實(shí)例的正確性,。

  Nikoli?教授帶領(lǐng)團(tuán)隊(duì)過(guò)去幾年在這方面做出了杰出的貢獻(xiàn)。他們發(fā)明了具備更高抽象能力的Chisel語(yǔ)言,,使生成器的開(kāi)發(fā)變得更簡(jiǎn)單,。事實(shí)上,近年來(lái)非?;鸬腞ISC-V最早開(kāi)源實(shí)現(xiàn)Rocket Chip實(shí)現(xiàn)就是一個(gè)基于Chisel的生成器(圖31),。

  一款SoC芯片設(shè)計(jì)很大的挑戰(zhàn)是模擬電路。Nikoli?教授開(kāi)發(fā)了BAG(Berkeley Analog Generator),,一套基于Python的開(kāi)源模擬電路生成器(圖29),,包括 Comparator 、多種ADC/DAC生成器,、SerDes生成器(圖30)等,。這些生成器在ST 28nm, GF 22nm, TSMC 16nm等不同工藝下成功流片。當(dāng)然目前實(shí)測(cè)性能與業(yè)界主流產(chǎn)品相比還有差距,,比如使用TSMC 16nm工藝的ADC采樣頻率為7GS/s,,精度為6.5bit,而ADI公司于2017年便開(kāi)發(fā)出基于28nm工藝的10GS/s,、精度為12bit的產(chǎn)品,。但值得一提的是這些都是開(kāi)源設(shè)計(jì),,如果社區(qū)和企業(yè)在此基礎(chǔ)上不斷優(yōu)化改進(jìn),有可能最終得到足夠性能的開(kāi)源模擬電路設(shè)計(jì),。

微信圖片_20190811222350.jpg

  圖28. 生成器(generator)是芯片敏捷開(kāi)發(fā)的核心

微信圖片_20190811222348.jpg

  圖29. 數(shù)字電路生成器Chisel3和模擬電路生成器BAG2

微信圖片_20190811222339.jpg

  圖30. 基于BAG2的SerDes生成器

微信圖片_20190811222303.jpg

  圖31. 基于Chisel與BAG生成的RISC-V芯片

  報(bào)告11:端到端的形式化驗(yàn)證

  形式化驗(yàn)證(Formal Verification)方法被認(rèn)為是保證系統(tǒng)正確性的最有效方法,。自從2009年第一個(gè)經(jīng)過(guò)形式化驗(yàn)證的操作系統(tǒng)內(nèi)核SeL4發(fā)表以來(lái),形式化驗(yàn)證方法已收到越來(lái)越多地關(guān)注,,尤其是在操作系統(tǒng)領(lǐng)域,。2016年,,美國(guó)NSF在計(jì)算機(jī)領(lǐng)域額度最大的“Expedition in Computing”項(xiàng)目(5年1000萬(wàn)美元)資助了由普林斯頓大學(xué),、麻省理工學(xué)院、康奈爾大學(xué),、賓夕法尼亞大學(xué)聯(lián)合申請(qǐng)的形式化驗(yàn)證軟硬件全系統(tǒng)棧的項(xiàng)目:DeepSpec(圖32),,一個(gè)目標(biāo)極其遠(yuǎn)大而具有顛覆性、同時(shí)也極具挑戰(zhàn)的研究項(xiàng)目,。

  MIT的Adam Chlipala教授也是DeepSpec的co-PI,,他在Visioning Workshop上介紹了基于RISC-V開(kāi)展的全系統(tǒng)端到端強(qiáng)形式化驗(yàn)證研究進(jìn)展(圖33),包括硬件RTL層次的驗(yàn)證,、編譯器的驗(yàn)證等,。Chlipala教授展示了一個(gè)經(jīng)過(guò)驗(yàn)證的RISC-V核實(shí)現(xiàn)(圖34,圖35),,目前還只能用于演示點(diǎn)燈,。

  報(bào)告中我的理解是相比于傳統(tǒng)的Verilog,具有更高抽象的硬件描述語(yǔ)言(如BlueSpec,、Chisel)將有助于RTL層次的形式化驗(yàn)證,。不過(guò)由于自己對(duì)這個(gè)領(lǐng)域也了解不多,所以也無(wú)法更深入地解讀他們的研究工作,。

  在這里可以分享一段有趣的經(jīng)歷:我在普林斯頓大學(xué)做博士后時(shí)在同一個(gè)辦公室的是Andrew Appel教授的博士后Lennart Beringer,,當(dāng)時(shí)正在開(kāi)展編譯器的形式化驗(yàn)證研究。當(dāng)時(shí)曾問(wèn)過(guò)他形式化驗(yàn)證的前景,,他自己認(rèn)為可能需要20年才能實(shí)用,。讓人感慨的是,幾年后,,即使在一線(xiàn)研究人員看來(lái)都很遙遠(yuǎn)的研究卻得到了NSF的大力資助,,而Lennart現(xiàn)在也正是DeepSpec項(xiàng)目的副主任。相比較于美國(guó)大力資助形式化驗(yàn)證的系統(tǒng)實(shí)現(xiàn),,國(guó)內(nèi)從事這方面研究的團(tuán)隊(duì)就顯得太少了,,也很難得到資助。這種現(xiàn)狀亟需改變,。

微信圖片_20190811222256.jpg

  圖32. 2016年NSF Expedition in Computing項(xiàng)目:DeepSpec

微信圖片_20190811222253.jpg

  圖33. 端到端形式化驗(yàn)證框架

微信圖片_20190811222249.jpg

  圖34. RISC-V核的形式化驗(yàn)證示例

微信圖片_20190811222246.jpg

  圖35. 經(jīng)過(guò)驗(yàn)證的RISC-V核

  中國(guó)的挑戰(zhàn)與機(jī)遇

  芯片一直是中國(guó)半導(dǎo)體產(chǎn)業(yè)的軟肋,,如何破解中國(guó)半導(dǎo)體產(chǎn)業(yè)面臨的“卡脖子”問(wèn)題,,各界都在積極實(shí)踐與探索。

  中國(guó)當(dāng)前需要盡快突破被稱(chēng)為是“燃眉之急”的多項(xiàng)關(guān)鍵技術(shù),,但從長(zhǎng)遠(yuǎn)來(lái)看,,中國(guó)芯片領(lǐng)域面臨的 “卡脖子”問(wèn)題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足——我們?cè)鲞^(guò)一項(xiàng)統(tǒng)計(jì),2008到2017年的十年間體系結(jié)構(gòu)頂會(huì)ISCA論文的第一作者(可認(rèn)為是芯片架構(gòu)研究?jī)?yōu)秀人才)85%選擇在美國(guó)就業(yè),,僅有4%在中國(guó)就業(yè),,差距巨大(圖36)。這與當(dāng)前芯片設(shè)計(jì)門(mén)檻過(guò)高,,導(dǎo)致中國(guó)大學(xué)無(wú)法開(kāi)展芯片相關(guān)教學(xué)與研究密切相關(guān),。

  這種人才危機(jī)美國(guó)也曾經(jīng)歷過(guò),1982年全美上千所大學(xué)中只有不到100 位教授和學(xué)生從事半導(dǎo)體相關(guān)的研究,。為了應(yīng)對(duì)人才危機(jī),,美國(guó)DARPA在1981年啟動(dòng)MOSIS項(xiàng)目,為大學(xué)提供流片服務(wù),,通過(guò)MPW模式大幅降低芯片設(shè)計(jì)門(mén)檻(圖37),。三十余年來(lái)MOSIS為大學(xué)和研究機(jī)構(gòu)流了60000多款芯片,培養(yǎng)了數(shù)萬(wàn)名學(xué)生,。因此,,降低芯片設(shè)計(jì)門(mén)檻亦可大幅提高人才培養(yǎng)效率。

  開(kāi)源芯片與敏捷開(kāi)發(fā),,有可能再未來(lái)實(shí)現(xiàn)數(shù)量級(jí)地降低芯片開(kāi)發(fā)門(mén)檻,。開(kāi)源芯片生態(tài)仍處于起步階段,如果中國(guó)能積極參與并主導(dǎo)開(kāi)源芯片生態(tài)中若干核心模塊,,那么就有可能吸引更多開(kāi)發(fā)人員,、民間資本參與芯片開(kāi)發(fā),提高芯片領(lǐng)域的創(chuàng)新活力,,同時(shí)也能為中國(guó)芯片企業(yè)提供基于開(kāi)源的芯片關(guān)鍵技術(shù)與優(yōu)秀人才,、擺脫“卡脖子”困境。

微信圖片_20190811222242.jpg

  圖36. “卡脖子”問(wèn)題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足

微信圖片_20190811222240.jpg

  圖37. 美國(guó)應(yīng)對(duì)半導(dǎo)體人才危機(jī)的方式

  結(jié)語(yǔ):2030憧憬

  總結(jié)來(lái)說(shuō),,開(kāi)源芯片與敏捷開(kāi)發(fā)備受關(guān)注,,背后存在兩方面的驅(qū)動(dòng)力:

  (1)應(yīng)對(duì)摩爾定律終結(jié)的技術(shù)發(fā)展需求:Dennard Scaling定律和摩爾定律逐漸走向終結(jié),,但摩爾定律賦予芯片的能力并未充分挖掘出來(lái),。例如實(shí)現(xiàn)一個(gè)矩陣乘法,普通程序員寫(xiě)的程序和懂體系架構(gòu)的專(zhuān)家寫(xiě)的程序性能上甚至?xí)?3000倍的差距,。因此,,面向某個(gè)特定領(lǐng)域?qū)?zhuān)家知識(shí)實(shí)現(xiàn)到芯片中,就有可能提升幾百甚至幾千倍的性能功耗比,,從而充分挖掘芯片上晶體管的潛力,。但這種領(lǐng)域?qū)S皿w系結(jié)構(gòu)(DSA)會(huì)帶來(lái)碎片化問(wèn)題,,需要從芯片設(shè)計(jì)成本與周期兩個(gè)維度同時(shí)降低門(mén)檻,才能應(yīng)對(duì)種類(lèi)繁多的領(lǐng)域?qū)S眉铀倨鳌?/p>

 ?。?)激發(fā)創(chuàng)新活力,、繁榮芯片產(chǎn)業(yè)的市場(chǎng)需求:長(zhǎng)期以來(lái)芯片研發(fā)成本高、周期長(zhǎng),,導(dǎo)致了該領(lǐng)域的高門(mén)檻,,嚴(yán)重阻礙了創(chuàng)新。即使研制一款中檔芯片,,也往往需要數(shù)百人年,、數(shù)千萬(wàn)甚至上億的研發(fā)投入,導(dǎo)致資本不愿投資,。因此,,只有少數(shù)企業(yè)才能承擔(dān),,資本市場(chǎng)對(duì)芯片投資也是極其謹(jǐn)慎保守,,制約了芯片領(lǐng)域的創(chuàng)新活力。

  構(gòu)建開(kāi)源芯片生態(tài)與敏捷開(kāi)發(fā)方法一個(gè)長(zhǎng)期的系統(tǒng)工程,,面臨著諸多挑戰(zhàn),,但也是一個(gè)不管是學(xué)術(shù)上還是商業(yè)上都值得探索的方向,也需要各界的支持與參與,。

  后記:IEEE MICRO特刊

  Visioning Workshop結(jié)束后的第二天,,IEEE MICRO雜志的主編和編委聯(lián)系到我。他們也在現(xiàn)場(chǎng)聽(tīng)了報(bào)告,,認(rèn)為這個(gè)方向很重要,,邀請(qǐng)我來(lái)組織一期關(guān)于敏捷開(kāi)發(fā)與開(kāi)源硬件的特刊,我欣然接受,。經(jīng)過(guò)前期的一些討論,,現(xiàn)在已經(jīng)確定了幾個(gè)時(shí)間節(jié)點(diǎn),Call-for-Paper也已出爐,。歡迎大家賜稿,!

微信圖片_20190811222234.jpg

  圖38. Call-for-Paper of IEEE Micro Special Issue


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話(huà):010-82306118,;郵箱:[email protected]