2017年的國際固態(tài)半導(dǎo)體電路大會落下帷幕已經(jīng)半個多月,半導(dǎo)體業(yè)的同仁們又回到了工作狀態(tài)。我們不妨回過頭來好好檢視今年ISSCC上的議程和論文,,看看2017年半導(dǎo)體電路行業(yè)哪些方向正在變得熱門,。
用于人工智能的深度學(xué)習(xí)芯片
今年ISSCC的主題是“Intelligent Chips for A Smart World”,“人工智能”這個關(guān)鍵詞幾乎呼之欲出,。2012年后,,人工智能以Alexnet誕生為標(biāo)志迎來了高速發(fā)展期,。隨著去年AlphaGO戰(zhàn)勝李世石,,人們對這輪人工智能大潮的期待又上了一個臺階,。
這一代人工智能的主要技術(shù)是深度神經(jīng)網(wǎng)絡(luò)(DNN)。具體地,,目前深度學(xué)習(xí)應(yīng)用最火的領(lǐng)域是在計算機(jī)視覺領(lǐng)域,,而該領(lǐng)域由于應(yīng)用的特性(圖片中特征的本地性),最適合的網(wǎng)絡(luò)結(jié)構(gòu)是深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN),。最初,,人工智能應(yīng)用都是運行在CPU上,目標(biāo)是評估深度學(xué)習(xí)模型的性能(預(yù)測/分類準(zhǔn)確度等),,運行速度并不是最關(guān)鍵的指標(biāo),。然而,隨著深度學(xué)習(xí)逐漸實用化,,具體的硬件部署和運行效率變得越來越重要,,畢竟如果一次人臉識別需要1分鐘才能完成那么用戶體驗太差了。這時候,,大家發(fā)現(xiàn)CPU已經(jīng)不夠用了,,原因是CPU中太多的芯片面積用在了復(fù)雜的控制邏輯上,用于計算的單元其實并不多,,而DCNN需要的是大量并行運算,,其控制流并不復(fù)雜。因此CPU并不適合DCNN應(yīng)用,。AlexNet的部署中用到了GPU,,可以說是深度學(xué)習(xí)硬件上的第一次革命。相比CPU,,GPU中的控制流較簡單,,大部分芯片面積都用做運算,因此非常適合深度學(xué)習(xí)應(yīng)用,。而且,,GPU使用SIMT(單指令流多線程)的架構(gòu),能夠?qū)?nèi)存訪問延遲帶來的影響降低到最小,,從而實現(xiàn)高性能計算,。
然而,GPU雖然能夠減小內(nèi)存訪問延遲的影響,,卻不能減小內(nèi)存訪問次數(shù),。GPU每次訪問內(nèi)存都伴隨著能量消耗,因此一旦內(nèi)存訪問次數(shù)多了,,能量消耗就很大,,這就使得GPU無法使用在對能量消耗約束較多的場合,。為了能夠普及人工智能,專用的ASIC勢在必行,。也正因為ASIC需要優(yōu)化能量,,所以機(jī)器學(xué)習(xí)ASIC的主要指標(biāo)是能量效率OPS/W=OP/J,即單位能量可以實現(xiàn)的操作數(shù),。
機(jī)器學(xué)習(xí)ASIC在ISSCC上其實很早就有相關(guān)論文,,例如來自韓國KAIST的Yoo組在近五年來一直在發(fā)表相關(guān)論文,但是之前機(jī)器學(xué)習(xí)往往是作為視覺SoC的一個特性,,而不是最大的賣點,,發(fā)表的論文也是以視覺SoC的名義。直到2016年,,來自MIT的陳喻新在ISSCC發(fā)表了Eyeriss,,深度學(xué)習(xí)加速器的概念一炮而紅,天下群雄響應(yīng),。Eyeriss明確提出了傳統(tǒng)GPU方案的問題在于數(shù)據(jù)流中的內(nèi)存訪問太浪費能量并且會成為性能瓶頸,,而DCNN算法中許多數(shù)據(jù)是可以復(fù)用的,因此優(yōu)化數(shù)據(jù)訪問是深度學(xué)習(xí)加速器的重要優(yōu)化方向,。Eyeriss的能量效率可達(dá)200GOPS/W左右,,相對于GPU是巨大的進(jìn)步。
Eyeriss架構(gòu)圖
在去年,,Eyeriss發(fā)表的session名叫Next-Generation Processors,,而在Eyeriss名震江湖后,無數(shù)人做了follow up,,于是今年這個session干脆改名成了Deep-Learning Processors,,因為大家都在做深度學(xué)習(xí)加速。今年論文的主要賣點仍然是數(shù)據(jù)流優(yōu)化,,除此之外還有計算精度優(yōu)化,。今年論文能量效率已經(jīng)從去年Eyeriss的200GOPS/W進(jìn)化到了2.9TOPS/W(STMicroelectronics),8.1TOPS/W(KAIST)甚至10TOPS/W(KU Leuven),,照這么玩下去恐怕能量效率很快就會到瓶頸,,接下來要做的優(yōu)化就是要做差異化了。
同頻全雙工收發(fā)機(jī)
隨著無線通訊技術(shù)的發(fā)展,,各種應(yīng)用對于帶寬需求越來越高,,頻譜資源也顯得越來越捉襟見肘。如何提高頻譜資源的利用率,?之前的FDM(頻分復(fù)用)通訊協(xié)議往往需要給上行鏈路和下行鏈路分配不同的頻段,,那么有沒有可能使用同一個頻段同時做上行鏈路和下行鏈路,即全雙工,?如果使用全雙工同頻收發(fā)機(jī),,那么頻譜資源利用率一下就翻倍了!
如果要做全雙工的話,,主要問題就是如何解決發(fā)射機(jī)(TX)和接收機(jī)(RX)互相干擾,。TX的射頻信號能量可以比RX接收到的能量高5-6個數(shù)量級,因此如果同時同頻傳輸?shù)脑扵X對RX的干擾問題不解決好RX這邊一定就沒法工作了,。這個問題其實已經(jīng)有不少人研究了很久,,之前也有不同切入點的解決方案,例如UCLA Ethan Wang組的秦逝寒就利用時變傳輸線實現(xiàn)能很好地隔離TX/RX的全雙工,。另外的一條路則是利用較傳統(tǒng)的射頻系統(tǒng)(包括基于CMOS的射頻電路以及標(biāo)準(zhǔn)的射頻前端元件例如雙工器)來實現(xiàn)全雙工,,這種方案往往使用電路系統(tǒng),在RX鏈路合適的位置加入一個和TX干擾信號完全相反的信號來抵消TX的干擾,。這條路主要先驅(qū)者是哥倫比亞大學(xué)的Prof. Harish Krishnaswamy,。2014年ISSCC,Prof. Harish Krishnaswamy組的Jin Zhou發(fā)表了他們組第一篇使用干擾抵消技術(shù)的論文,,引發(fā)了半導(dǎo)體行業(yè)極大的興趣,,來自學(xué)術(shù)界和工業(yè)界的同行們基于這篇論文做了許多后續(xù)工作,而Krishnaswamy組自己也繼續(xù)做了不少改進(jìn),。而也正是Krishnaswamy組這幾年在ISSCC連續(xù)發(fā)表關(guān)于全雙工TRX的高質(zhì)量論文今年的ISSCC才會有這樣的一個session,,而發(fā)表第一篇論文的Jin Zhou也憑借著漂亮的工作順利拿到了UIUC的教職。
今年該Session的三篇論文,,分別來自于華盛頓大學(xué)(西雅圖)的Tong Zhang,,哥倫比亞大學(xué)Krishnaswamy組的Negar Reiskarimian和臺灣清華大學(xué)的Yu-Hsien Kao。兩篇是工作在傳統(tǒng)2GHz以下頻段的射頻收發(fā)機(jī),,另一篇則是10GHz X-band的FMCW雷達(dá),。
毫米波/THz為主流接受
毫米波/太赫茲電路在前幾年的ISSCC都有單獨的session,但是今年卻不再有單獨的session,。但是,,并不是因為毫米波/THz電路不再受到青睞,而是這些電路被歸到了TX and RX Building Blocks的session中(Session 17),??梢姡具@些電路因為工作頻率較高而不被認(rèn)為是常規(guī)電路需要單獨的session,,而在經(jīng)過多年的努力并被主流半導(dǎo)體電路社區(qū)接受后,,毫米波/THz電路今年進(jìn)入了一個常規(guī)的session。
來自日本的廣島大學(xué)的論文展示了載波在300GHz,,數(shù)據(jù)率高達(dá)105Gb/s的CMOS發(fā)射機(jī),,令人印象深刻。
GaN Driver電路
GaN是最近很火的器件,因為其卓越的性能得到了越來越多的應(yīng)用,,例如在高壓電源管理,,功率放大器等等。這次在ISSCC 2017,,有了一個關(guān)于GaN的新session,,即Session 25: GaN Drivers and Galvanic Isolators。
ISSCC今年新加的這個session說明了GaN正在獲得越來越多的認(rèn)可,。有趣的是,,該session中,GaN主要還是用在電源管理,,尤其是設(shè)計高電壓的電源電壓轉(zhuǎn)換電路,。GaN由于很高的擊穿電壓以及較小的寄生效應(yīng),在高電壓應(yīng)用時可以做到損耗較小,,目前已經(jīng)有許多大廠(例如TI等)推出了相關(guān)產(chǎn)品,。GaN在電源產(chǎn)品中將會得到更大程度的普及。而目前看來TI也是GaN領(lǐng)域的領(lǐng)先者,,該session四篇論文中的三篇來自于TI,。