芯東西1月7日消息,,人工智能(AI)正改變臨床診斷,、自動(dòng)駕駛、語音翻譯等更多領(lǐng)域,,而計(jì)算速度和功耗日益成為AI的主要瓶頸,。傳統(tǒng)電子計(jì)算方法逐漸走向性能極限后,,近幾年,關(guān)于用光學(xué)芯片加速AI的研究逐漸興起,。
這不,,2021年剛開年,頂級(jí)科學(xué)期刊《Nature》上就在一天之內(nèi)連發(fā)兩篇利用光學(xué)特性加速AI處理的光子芯片論文,。
論文:https://doi.org/10.1038/s41586-020-03063-0
其中一篇論文題目為《用于光學(xué)神經(jīng)網(wǎng)絡(luò)的11 TOPS光子卷積加速器(11 TOPS photonic convolutional accelerator for optical neural networks)》,,論文主要作者有Xingyuan Xu、Mengxi Tan等人,,來自澳大利亞斯威本科技大學(xué),、蒙納士大學(xué)、皇家墨爾本理工大學(xué),、香港城市大學(xué),、中國(guó)科學(xué)院等科研院所。
該論文展示了一種通用光學(xué)向量卷積加速器,,其計(jì)算速度可超過10 TOPS(每秒10萬億次運(yùn)算),,能生成足以進(jìn)行人臉識(shí)別的25萬個(gè)像素的圖像卷積。研究人員使用相同硬件運(yùn)行一個(gè)有10個(gè)輸出神經(jīng)元的光學(xué)卷積神經(jīng)網(wǎng)絡(luò),,識(shí)別手寫數(shù)字圖像的準(zhǔn)確率達(dá)88%,。
論文:https://doi.org/10.1038/s41586-020-03070-1
另一篇論文名為《利用積分光子張量核的并行卷積處理(Parallel convolutional processing using an integrated photonic tensor core)》,論文主要作者有J. Feldmann等人,,來自美國(guó)匹茲堡大學(xué),、德國(guó)明斯特大學(xué)、英國(guó)牛津大學(xué),、??巳卮髮W(xué)、瑞士洛桑EPFL及蘇黎世IBM研究實(shí)驗(yàn)室等科研院所,。
該論文介紹了一個(gè)基于張量核心的計(jì)算專用集成光子硬件加速器,,通過將相變材料與光子結(jié)構(gòu)結(jié)合,運(yùn)算速度可達(dá)每秒數(shù)萬億次乘累加運(yùn)算(每秒1012次MAC運(yùn)算或每秒tera-MAC運(yùn)算),。
01.
光學(xué)頻率梳為光子計(jì)算帶來新機(jī)遇
因性能出色,,人工神經(jīng)網(wǎng)絡(luò)被廣泛用于AI處理任務(wù),這些網(wǎng)絡(luò)使用多層相互連接的人工神經(jīng)元執(zhí)行復(fù)雜的數(shù)學(xué)運(yùn)算,,使用大多數(shù)計(jì)算資源的基本運(yùn)算稱為矩陣矢量乘法,。
為了加速人工神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù),人們已經(jīng)進(jìn)行了各種努力來設(shè)計(jì)和實(shí)現(xiàn)特定的電子計(jì)算系統(tǒng),,尤其在專用集成電路,、類腦計(jì)算和存內(nèi)計(jì)算定制芯片方面已取得相當(dāng)大的成功。
電子是電子計(jì)算中信息的載體,,而光子長(zhǎng)期以來一直被視為替代選擇,。
光譜涵蓋了廣泛的波長(zhǎng)范圍,,因此許多不同波長(zhǎng)的光子可以同時(shí)進(jìn)行多路復(fù)用(并行傳輸)和調(diào)制(以使其可以攜帶信息的方式進(jìn)行更改),而不會(huì)相互干擾光信號(hào),。信息以光速傳播則可以帶來最小的時(shí)間延遲,。
此外,無源傳輸(不需要輸入功率)有助于超低功耗,,且相位調(diào)制(從而改變了光波的量子力學(xué)相位)使得光在頻率大于40 GHz時(shí)易于調(diào)制和檢測(cè),。
過去幾十年,光學(xué)通信取得了巨大的成功,,但使用光子進(jìn)行計(jì)算仍具有挑戰(zhàn)性,,尤其是在與最先進(jìn)的電子處理器相當(dāng)?shù)囊?guī)模和性能水平上。
這種困難來自于缺乏合適的并行計(jì)算機(jī)制,、材料來允許人工神經(jīng)元進(jìn)行高速非線性(復(fù)雜)響應(yīng),,以及將可擴(kuò)展光子器件集成到計(jì)算硬件中。
幸運(yùn)的是,,過去幾年中稱為光學(xué)頻率梳設(shè)備的發(fā)展為集成光子處理器帶來了新的機(jī)遇,。
光學(xué)頻率梳是一組具有發(fā)射光譜的光源,由成千上萬條頻率均勻且緊密間隔的清晰光譜線組成,。這些設(shè)備在光譜學(xué),、光學(xué)時(shí)鐘計(jì)量學(xué)和電信等各個(gè)領(lǐng)域都取得巨大的成功,并獲得了2005年諾貝爾物理學(xué)獎(jiǎng),。
光學(xué)頻率梳可被集成到計(jì)算機(jī)芯片,,并作為用于光子計(jì)算的高功率效率的能源。該系統(tǒng)非常適合于通過波長(zhǎng)復(fù)用進(jìn)行數(shù)據(jù)并行處理,。
02.
單個(gè)光子處理器內(nèi)核算力超10 TOPS
在論文《用于光學(xué)神經(jīng)網(wǎng)絡(luò)的11 TOPS光子卷積加速器》中,,Xu及其同事使用這樣的設(shè)置來生產(chǎn)通用集成光子處理器。該設(shè)備執(zhí)行一種矩陣-向量乘法,,用于圖像處理應(yīng)用的矩陣卷積。
作者采用了一種巧妙的方法來進(jìn)行卷積,。他們首先使用色散(傳輸光的速度取決于其波長(zhǎng))來為波長(zhǎng)復(fù)用的光信號(hào)產(chǎn)生不同的時(shí)間延遲,。然后,他們沿著與光的波長(zhǎng)相關(guān)的維度組合這些信號(hào),。
▲光學(xué)CNN結(jié)構(gòu)
通過充分利用大范圍的光子波長(zhǎng),,Xu等人實(shí)現(xiàn)了針對(duì)不同卷積運(yùn)算的并行計(jì)算。使用單個(gè)處理內(nèi)核,,光子計(jì)算速度超過10 TOPS,,能在超過14千兆赫的帶寬下工作,且僅受數(shù)據(jù)吞吐量的限制,。
這項(xiàng)工作另一個(gè)受歡迎的特點(diǎn)是,,作者在實(shí)際應(yīng)用中確定了其光子卷積處理器的入口點(diǎn),。特別是,他們建議處理器可以用于混合光電子框架,,例如在光纖通信中進(jìn)行原位計(jì)算,。
03.
將相變材料存儲(chǔ)單元與光學(xué)頻率梳結(jié)合
在論文《利用積分光子張量核的并行卷積處理》中,F(xiàn)eldmann和他的同事獨(dú)立地制造了一個(gè)集成光子處理器,,通過使用集成張量核心可進(jìn)行并行卷積處理,。
該設(shè)備在基于相變材料(可以在非晶相和結(jié)晶相之間切換的材料)的存內(nèi)計(jì)算架構(gòu)中使用光學(xué)頻率梳。作者通過波長(zhǎng)復(fù)用對(duì)輸入數(shù)據(jù)進(jìn)行充分的并行處理,,并利用相變材料集成單元陣列進(jìn)行了類似的矩陣-向量乘法運(yùn)算,。
這種高度并行化的框架可以在單個(gè)步驟中高速處理整個(gè)圖像。此外,,原則上,,在不久的將來,該系統(tǒng)可以使用商業(yè)制造程序進(jìn)行大規(guī)模擴(kuò)展,,并將有助于現(xiàn)場(chǎng)機(jī)器學(xué)習(xí),。
▲用于在光照下運(yùn)行矩陣乘法的處理器示意圖(圖源:牛津大學(xué))
由于卷積過程涉及無源傳輸,理論上光子處理核心的計(jì)算能以光速和低功耗執(zhí)行,。這種方法具有可擴(kuò)展性和可訓(xùn)練性,,對(duì)于能源密集型應(yīng)用非常有價(jià)值,如云計(jì)算,、自動(dòng)駕駛汽車,、實(shí)時(shí)視頻識(shí)別等要求較高的應(yīng)用。
該研究主要作者之一明斯特大學(xué)研究生Johannes Feldmann說:“利用光進(jìn)行信號(hào)傳輸,,使處理器能夠通過波長(zhǎng)多路復(fù)用執(zhí)行并行數(shù)據(jù)處理,,這帶來更高的計(jì)算密度,并且僅需一個(gè)時(shí)間步長(zhǎng),,就能進(jìn)行許多矩陣乘法,。相比通常在低GHz工作的傳統(tǒng)電子設(shè)備,光調(diào)制速度可以達(dá)到50至100GHz范圍,?!?/p>
04.
結(jié)語:光子芯片或成未來計(jì)算架構(gòu)可行路徑
這些研究結(jié)果表明,集成光子技術(shù)在需要大量數(shù)據(jù)的人工智能應(yīng)用(如自動(dòng)駕駛,、實(shí)時(shí)視頻處理和下一代云計(jì)算服務(wù))中具有并行,、快速和高效計(jì)算硬件的潛力。
鑒于傳統(tǒng)電子計(jì)算方法面臨的挑戰(zhàn),,集成光子技術(shù)的出現(xiàn)令人興奮,,它正成為實(shí)現(xiàn)未來計(jì)算架構(gòu)前所未有性能的一個(gè)潛在接班人。
不過,,構(gòu)建實(shí)用的光學(xué)計(jì)算機(jī)需要材料科學(xué),、光子學(xué),、電子學(xué)等領(lǐng)域的研究人員之間的廣泛跨學(xué)科努力和合作。
盡管報(bào)道的光子處理器具有較高的單位面積計(jì)算能力和潛在的可伸縮性,,但是全光學(xué)計(jì)算規(guī)模(光學(xué)人工神經(jīng)元的數(shù)量)仍然很小,。另外,因?yàn)榇嬖诠逃械匚展獾挠?jì)算元件,,且電信號(hào)和光信號(hào)經(jīng)常需要轉(zhuǎn)換,,能量效率會(huì)受到限制。
另一個(gè)研究途徑是發(fā)展先進(jìn)的非線性集成光子計(jì)算體系結(jié)構(gòu),,而非一維或二維的線性卷積,。通過將電子電路和數(shù)千或數(shù)百萬個(gè)光子處理器集成到合適的體系結(jié)構(gòu)中,同時(shí)利用光子和電子處理器的混合光電框架可能在不久的將來,,帶給AI硬件革命性的變化,。這些硬件將在通信、數(shù)據(jù)中心操作和云計(jì)算等領(lǐng)域具有重要的應(yīng)用,。
如想了解更多光子AI芯片發(fā)展脈絡(luò)及產(chǎn)業(yè)現(xiàn)狀,,可閱讀《一篇論文引發(fā)的光子AI芯片革命!這次真想要了摩爾定律的命》一文,。