2017年的國際固態(tài)半導(dǎo)體電路大會落下帷幕已經(jīng)半個多月,半導(dǎo)體業(yè)的同仁們又回到了工作狀態(tài),。我們不妨回過頭來好好檢視今年ISSCC上的議程和論文,,看看2017年半導(dǎo)體電路行業(yè)哪些方向正在變得熱門。
用于人工智能的深度學(xué)習芯片
今年ISSCC的主題是“Intelligent Chips for A Smart World”,,“人工智能”這個關(guān)鍵詞幾乎呼之欲出,。2012年后,人工智能以Alexnet誕生為標志迎來了高速發(fā)展期,。隨著去年AlphaGO戰(zhàn)勝李世石,,人們對這輪人工智能大潮的期待又上了一個臺階。
這一代人工智能的主要技術(shù)是深度神經(jīng)網(wǎng)絡(luò)(DNN),。具體地,目前深度學(xué)習應(yīng)用最火的領(lǐng)域是在計算機視覺領(lǐng)域,,而該領(lǐng)域由于應(yīng)用的特性(圖片中特征的本地性),,最適合的網(wǎng)絡(luò)結(jié)構(gòu)是深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)。最初,,人工智能應(yīng)用都是運行在CPU上,,目標是評估深度學(xué)習模型的性能(預(yù)測/分類準確度等),運行速度并不是最關(guān)鍵的指標,。然而,,隨著深度學(xué)習逐漸實用化,具體的硬件部署和運行效率變得越來越重要,,畢竟如果一次人臉識別需要1分鐘才能完成那么用戶體驗太差了,。這時候,大家發(fā)現(xiàn)CPU已經(jīng)不夠用了,,原因是CPU中太多的芯片面積用在了復(fù)雜的控制邏輯上,,用于計算的單元其實并不多,而DCNN需要的是大量并行運算,,其控制流并不復(fù)雜,。因此CPU并不適合DCNN應(yīng)用。AlexNet的部署中用到了GPU,,可以說是深度學(xué)習硬件上的第一次革命,。相比CPU,GPU中的控制流較簡單,,大部分芯片面積都用做運算,,因此非常適合深度學(xué)習應(yīng)用。而且,GPU使用SIMT(單指令流多線程)的架構(gòu),,能夠?qū)?nèi)存訪問延遲帶來的影響降低到最小,,從而實現(xiàn)高性能計算。
然而,,GPU雖然能夠減小內(nèi)存訪問延遲的影響,,卻不能減小內(nèi)存訪問次數(shù)。GPU每次訪問內(nèi)存都伴隨著能量消耗,,因此一旦內(nèi)存訪問次數(shù)多了,,能量消耗就很大,這就使得GPU無法使用在對能量消耗約束較多的場合,。為了能夠普及人工智能,,專用的ASIC勢在必行。也正因為ASIC需要優(yōu)化能量,,所以機器學(xué)習ASIC的主要指標是能量效率OPS/W=OP/J,,即單位能量可以實現(xiàn)的操作數(shù)。
機器學(xué)習ASIC在ISSCC上其實很早就有相關(guān)論文,,例如來自韓國KAIST的Yoo組在近五年來一直在發(fā)表相關(guān)論文,,但是之前機器學(xué)習往往是作為視覺SoC的一個特性,而不是最大的賣點,,發(fā)表的論文也是以視覺SoC的名義,。直到2016年,來自MIT的陳喻新在ISSCC發(fā)表了Eyeriss,,深度學(xué)習加速器的概念一炮而紅,,天下群雄響應(yīng)。Eyeriss明確提出了傳統(tǒng)GPU方案的問題在于數(shù)據(jù)流中的內(nèi)存訪問太浪費能量并且會成為性能瓶頸,,而DCNN算法中許多數(shù)據(jù)是可以復(fù)用的,,因此優(yōu)化數(shù)據(jù)訪問是深度學(xué)習加速器的重要優(yōu)化方向。Eyeriss的能量效率可達200GOPS/W左右,,相對于GPU是巨大的進步,。
Eyeriss架構(gòu)圖
在去年,Eyeriss發(fā)表的session名叫Next-Generation Processors,,而在Eyeriss名震江湖后,,無數(shù)人做了follow up,于是今年這個session干脆改名成了Deep-Learning Processors,,因為大家都在做深度學(xué)習加速,。今年論文的主要賣點仍然是數(shù)據(jù)流優(yōu)化,除此之外還有計算精度優(yōu)化,。今年論文能量效率已經(jīng)從去年Eyeriss的200GOPS/W進化到了2.9TOPS/W(STMicroelectronics),,8.1TOPS/W(KAIST)甚至10TOPS/W(KU Leuven),,照這么玩下去恐怕能量效率很快就會到瓶頸,接下來要做的優(yōu)化就是要做差異化了,。
同頻全雙工收發(fā)機
隨著無線通訊技術(shù)的發(fā)展,,各種應(yīng)用對于帶寬需求越來越高,頻譜資源也顯得越來越捉襟見肘,。如何提高頻譜資源的利用率,?之前的FDM(頻分復(fù)用)通訊協(xié)議往往需要給上行鏈路和下行鏈路分配不同的頻段,那么有沒有可能使用同一個頻段同時做上行鏈路和下行鏈路,,即全雙工,?如果使用全雙工同頻收發(fā)機,那么頻譜資源利用率一下就翻倍了,!
如果要做全雙工的話,,主要問題就是如何解決發(fā)射機(TX)和接收機(RX)互相干擾。TX的射頻信號能量可以比RX接收到的能量高5-6個數(shù)量級,,因此如果同時同頻傳輸?shù)脑扵X對RX的干擾問題不解決好RX這邊一定就沒法工作了,。這個問題其實已經(jīng)有不少人研究了很久,之前也有不同切入點的解決方案,,例如UCLA Ethan Wang組的秦逝寒就利用時變傳輸線實現(xiàn)能很好地隔離TX/RX的全雙工,。另外的一條路則是利用較傳統(tǒng)的射頻系統(tǒng)(包括基于CMOS的射頻電路以及標準的射頻前端元件例如雙工器)來實現(xiàn)全雙工,這種方案往往使用電路系統(tǒng),,在RX鏈路合適的位置加入一個和TX干擾信號完全相反的信號來抵消TX的干擾。這條路主要先驅(qū)者是哥倫比亞大學(xué)的Prof. Harish Krishnaswamy,。2014年ISSCC,,Prof. Harish Krishnaswamy組的Jin Zhou發(fā)表了他們組第一篇使用干擾抵消技術(shù)的論文,引發(fā)了半導(dǎo)體行業(yè)極大的興趣,,來自學(xué)術(shù)界和工業(yè)界的同行們基于這篇論文做了許多后續(xù)工作,,而Krishnaswamy組自己也繼續(xù)做了不少改進。而也正是Krishnaswamy組這幾年在ISSCC連續(xù)發(fā)表關(guān)于全雙工TRX的高質(zhì)量論文今年的ISSCC才會有這樣的一個session,,而發(fā)表第一篇論文的Jin Zhou也憑借著漂亮的工作順利拿到了UIUC的教職,。
今年該Session的三篇論文,分別來自于華盛頓大學(xué)(西雅圖)的Tong Zhang,,哥倫比亞大學(xué)Krishnaswamy組的Negar Reiskarimian和臺灣清華大學(xué)的Yu-Hsien Kao,。兩篇是工作在傳統(tǒng)2GHz以下頻段的射頻收發(fā)機,另一篇則是10GHz X-band的FMCW雷達,。
毫米波/THz為主流接受
毫米波/太赫茲電路在前幾年的ISSCC都有單獨的session,,但是今年卻不再有單獨的session。但是,,并不是因為毫米波/THz電路不再受到青睞,,而是這些電路被歸到了TX and RX Building Blocks的session中(Session 17)。可見,,原本這些電路因為工作頻率較高而不被認為是常規(guī)電路需要單獨的session,,而在經(jīng)過多年的努力并被主流半導(dǎo)體電路社區(qū)接受后,毫米波/THz電路今年進入了一個常規(guī)的session,。
來自日本的廣島大學(xué)的論文展示了載波在300GHz,,數(shù)據(jù)率高達105Gb/s的CMOS發(fā)射機,令人印象深刻,。
GaN Driver電路
GaN是最近很火的器件,,因為其卓越的性能得到了越來越多的應(yīng)用,例如在高壓電源管理,,功率放大器等等,。這次在ISSCC 2017,有了一個關(guān)于GaN的新session,,即Session 25: GaN Drivers and Galvanic Isolators,。
ISSCC今年新加的這個session說明了GaN正在獲得越來越多的認可。有趣的是,,該session中,,GaN主要還是用在電源管理,尤其是設(shè)計高電壓的電源電壓轉(zhuǎn)換電路,。GaN由于很高的擊穿電壓以及較小的寄生效應(yīng),,在高電壓應(yīng)用時可以做到損耗較小,目前已經(jīng)有許多大廠(例如TI等)推出了相關(guān)產(chǎn)品,。GaN在電源產(chǎn)品中將會得到更大程度的普及,。而目前看來TI也是GaN領(lǐng)域的領(lǐng)先者,該session四篇論文中的三篇來自于TI,。