據(jù)外媒報道,,當?shù)貢r間2月26日,,東芝電子歐洲公司(TEE)宣布將研發(fā)一種用于汽車應用的圖像識別片上系統(tǒng)(SoC),,該系統(tǒng)與東芝以前的產(chǎn)品相比,,深度學習加速器的速度是原來的10倍,,功率效率為4倍,。該項技術的細節(jié)在2019年IEEE國際固態(tài)線路研討會(ISSCC)上公布,,該研討會于2月19日在舊金山舉行。
自動緊急制動等高級駕駛輔助系統(tǒng)提供越來越先進的能力,,而且實現(xiàn)此類系統(tǒng)需要圖像識別片上系統(tǒng),,此類片上系統(tǒng)需要能夠在低功耗的情況下高速識別道路交通標志以及道路狀況。
深度神經(jīng)網(wǎng)絡(DNN)是一種以大腦神經(jīng)網(wǎng)絡為模型的算法,,與傳統(tǒng)的模式識別和機器學習相比,,能夠更精確地進行識別處理,而且人們普遍認為其適用于汽車應用,。但是,,使用傳統(tǒng)處理器、基于深度神經(jīng)網(wǎng)絡的圖像識別依賴大量的乘積累加(MAC)計算,,因而需要大量處理時間,,而且也需要消耗更多功率。
東芝推出的深度神經(jīng)網(wǎng)絡(DNN)加速器克服了上述問題,,而且該加速器在硬件中實現(xiàn)了深度學習,,具備以下3個特點:
1、 平行乘積累加(MAC)組件,。深度神經(jīng)網(wǎng)絡(DNN)處理需要很多乘積累加計算,,東芝的新設備具有4個處理器,每個都有256個乘積累加組件,從而提升了深度神經(jīng)網(wǎng)絡(DNN)的處理速度,。
2,、 減少對動態(tài)隨機存取存儲器(DRAM)的訪問。傳統(tǒng)的片上系統(tǒng)沒有本地存儲器來保存深度神經(jīng)網(wǎng)絡執(zhí)行組件附近的暫態(tài)數(shù)據(jù),,而且處理本地存儲器會消耗很多功率。使用乘積累加(MAC)計算加載權重數(shù)據(jù)也要消耗功率,。而在東芝的新設備中,,深度神經(jīng)網(wǎng)絡(DNN)執(zhí)行組件附近執(zhí)行的是靜態(tài)隨機存取存儲器(SRAM),深度神經(jīng)網(wǎng)絡(DNN)處理分成了子處理塊,,以將暫態(tài)數(shù)據(jù)存儲于靜態(tài)隨機存取存儲器(SRAM)中,,減少對動態(tài)隨機存取存儲器(DRAM)的訪問。此外,,東芝還為加速器增加了一個解壓裝置,,提前將權重數(shù)據(jù)壓縮、存儲在動態(tài)隨機存取存儲器中,,再通過解壓裝置上傳權重數(shù)據(jù),,可減少從動態(tài)隨機存取存儲器(DRAM)中上傳權重數(shù)據(jù)所帶來的功率消耗。
3,、 減少對靜態(tài)隨機存取存儲器(SRAM)的訪問,。傳統(tǒng)的深度學習需要在處理完深度神經(jīng)網(wǎng)絡的每一層之后再訪問靜態(tài)隨機存取存儲器,此過程會消耗大量功率,。東芝推出的加速器具有流水線式結構,,位于深度神經(jīng)網(wǎng)絡的深度神經(jīng)網(wǎng)絡執(zhí)行組件中,完成一系列的深度神經(jīng)網(wǎng)絡計算只需訪問一次靜態(tài)隨機存取存儲器(SRAM),。
該新型片上系統(tǒng)符合汽車應用功能安全的全球標準ISO26262,。東芝將繼續(xù)提升其片上系統(tǒng)的功率效率和處理速度,并將于今年9月份開始交付其下一代圖像識別處理器ViscontiTM5的樣品,。