·全面的視覺(jué)平臺(tái)集成了新的CEVA-XM6 DSP內(nèi)核、硬件加速器,、神經(jīng)網(wǎng)絡(luò)軟件框架,、軟件庫(kù)和廣泛的算法支持
·推動(dòng)實(shí)現(xiàn)面向大眾市場(chǎng)智能視覺(jué)應(yīng)用的嵌入式神經(jīng)網(wǎng)絡(luò)
·面向自主駕駛,、感應(yīng)和躲避式無(wú)人機(jī)、虛擬和增強(qiáng)現(xiàn)實(shí)、智能監(jiān)控、智能手機(jī),、機(jī)器人等應(yīng)用
專(zhuān)注于智能互聯(lián)設(shè)備的全球領(lǐng)先信號(hào)處理IP授權(quán)公司CEVA宣布推出一款基于DSP的全新產(chǎn)品,為低功耗嵌入式系統(tǒng)帶來(lái)深度學(xué)習(xí)和人工智能(AI)能力,。這款全面的可擴(kuò)展集成硬件和軟件IP平臺(tái)的核心是全新圖像和視覺(jué)DSP CEVA-XM6 ,,使得開(kāi)發(fā)人員能夠高效地利用神經(jīng)網(wǎng)絡(luò)和機(jī)器視覺(jué)能力,用于智能手機(jī),、無(wú)人駕駛車(chē)輛,、監(jiān)控、機(jī)器人,、無(wú)人機(jī)和其它帶有相機(jī)功能的智能器件,。
與上一代CEVA-XM4智能視覺(jué)DSP相比,這個(gè)基于CEVA-XM6的新型視覺(jué)平臺(tái)的神經(jīng)網(wǎng)絡(luò)性能提高至八倍,,所有計(jì)算機(jī)視覺(jué)內(nèi)核性能改善達(dá)到三倍,。這個(gè)新型架構(gòu)集成的關(guān)鍵增強(qiáng)功能包括新的矢量和標(biāo)量處理單元,以及指令集,、存儲(chǔ)帶寬和 DMA的大量增強(qiáng)功能,。
這個(gè)新型視覺(jué)平臺(tái)進(jìn)一步擴(kuò)展了CEVA產(chǎn)品在實(shí)施神經(jīng)網(wǎng)絡(luò)時(shí)與采用GPU的主流架構(gòu)相比的性能優(yōu)勢(shì),。與用于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)的領(lǐng)先GPU嵌入式系統(tǒng)相比,,CEVA最新的圖像和視覺(jué)平臺(tái)的性能每瓦特效率(performance-per-watt efficiency)提升25倍以上,用于A(yíng)lexNet和GoogLeNet等卷積神經(jīng)網(wǎng)絡(luò)(CNN)的處理速度加快四倍,。
CEVA視覺(jué)業(yè)務(wù)部副總裁兼總經(jīng)理Ilan Yona稱(chēng):“隨著計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù)成為主流,,我們需要在高功耗GPU引擎產(chǎn)生的深度神經(jīng)網(wǎng)絡(luò)和部署這些功率和性能受限的嵌入式應(yīng)用之間架起橋梁,消除中間的鴻溝,。我們的新型視覺(jué)平臺(tái)在這方面非常出色,,為開(kāi)發(fā)人員提供最全面的技術(shù)集,能夠快速應(yīng)對(duì)這些嵌入式使用案例,?!?/p>
這款視覺(jué)平臺(tái)集成了大量軟件和硬件IP,為在嵌入式系統(tǒng)中部署機(jī)器視覺(jué)和深度學(xué)習(xí)提供上市時(shí)間和功率優(yōu)勢(shì),。除CEVA-XM6 DSP本身之外,,這平臺(tái)還包括CNN特定功能加速器和圖像去扭曲(針對(duì)所有類(lèi)型的圖像變換),、CEVA受到廣泛贊譽(yù)的CDNN2神經(jīng)網(wǎng)絡(luò)軟件框架、OpenCV,、OpenCL和OpenVX API,、CEVA-CV計(jì)算機(jī)視覺(jué)庫(kù),以及一組廣泛應(yīng)用的優(yōu)化算法,。
嵌入式視覺(jué)聯(lián)盟創(chuàng)立者Jeff Bier道:“各種終端產(chǎn)品的設(shè)計(jì)人員都渴望在其設(shè)計(jì)中集成視覺(jué)智能,。通常,這些開(kāi)發(fā)人員使用的視覺(jué)和深度學(xué)習(xí)算法要求以低成本,、低功耗,,并且可編程的方法提供極高的處理性能。我非常贊賞CEVA長(zhǎng)期致力于提供滿(mǎn)足這些需求的處理器和軟件工具,?!?/p>
技術(shù)特點(diǎn)
CEVA-XM6以強(qiáng)大的CEVA-XM4和CEVA-MM3101處理器為基礎(chǔ),并已經(jīng)有了超過(guò)25個(gè)設(shè)計(jì)項(xiàng)目,。它具備了一系列提供突破性神經(jīng)網(wǎng)絡(luò)性能和高級(jí)計(jì)算機(jī)視覺(jué)處理能力的架構(gòu)創(chuàng)新和增強(qiáng)功能,,包括:
·創(chuàng)新矢量處理單元(VPU)架構(gòu):確保95%以上的MAC利用率,是現(xiàn)今業(yè)界中無(wú)人能及的卓越水平
·增強(qiáng)并行分散 – 集中存儲(chǔ)負(fù)荷機(jī)制:進(jìn)一步改善視覺(jué)算法性能,,包括SLAM和深度映射,。
·Sliding Window 2.0? :這個(gè)專(zhuān)利機(jī)制利用圖像處理的像素重疊,有助于在更廣泛的神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)更高的利用率,,以及適應(yīng)這些網(wǎng)絡(luò)日益增加的復(fù)雜性,。
·選件32路SIMD矢量浮點(diǎn)單元,其中包括IEEE半精度標(biāo)準(zhǔn)(FP16)和重大的非線(xiàn)性運(yùn)算增強(qiáng),。
·其它改進(jìn)包括加速CNN性能的增強(qiáng)3D數(shù)據(jù)處理方案,,與CEVA-XM4相比,控制代碼性能改進(jìn)了50%,,并具有進(jìn)一步縮小代碼尺寸的新的可擴(kuò)展單元及多核和系統(tǒng)集成支持,。
除CEVA-XM6 DSP外,這種視覺(jué)平臺(tái)的其它關(guān)鍵部件包括:
·CDNN加速器:16位CDNN加速器具有512 MACs/cycle,,確保提供業(yè)界最佳性能以處理目前最復(fù)雜的神經(jīng)網(wǎng)絡(luò),。CDNN加速器還用于釋放CEVA-XM6 DSP內(nèi)的256 MAC單元,允許并行運(yùn)行其它計(jì)算機(jī)視覺(jué)任務(wù),。這種靈活的方法使得CDNN加速器配合CEVA-XM6的架構(gòu)成為了支持新的圖像算法,、網(wǎng)絡(luò)結(jié)構(gòu)和改變快速演變的深度學(xué)習(xí)空間中的層類(lèi)型的最佳選擇。
·圖像去扭曲加速器 :對(duì)于寬角攝像頭應(yīng)用,,比如360度攝像頭來(lái)說(shuō),,圖像去扭曲加速器支持ARM幀緩沖壓縮(AFBC)協(xié)議,提供最佳系統(tǒng)互操作性,。
·加速器認(rèn)知補(bǔ)充軟件:在CEVA-XM6 DSP上運(yùn)行,,提供高效加速器利用率,,使設(shè)計(jì)人員能夠進(jìn)一步差異化其產(chǎn)品設(shè)計(jì)。
·CDNN2軟件框架:經(jīng)優(yōu)化及與CEVA-XM6和加速器協(xié)作,,使得開(kāi)發(fā)人員很容易利用此工具生成并將其專(zhuān)有神經(jīng)網(wǎng)絡(luò)移植到CEVA-XM6上,,從而顯著加速利用最新最先進(jìn)的網(wǎng)絡(luò)拓?fù)浜蛯拥男阅埽ㄖС諧affe和Google的機(jī)器學(xué)習(xí)軟件庫(kù)TensorFlow,。
·符合ISO 26262主動(dòng)安全性的產(chǎn)品包:在汽車(chē)應(yīng)用場(chǎng)合支持下一代ADAS和自主駕駛解決方案的需求,。
CEVA的CDNN2軟件框架同時(shí)針對(duì)CEVA-XM6和CDNN加速器優(yōu)化,完全支持16位定點(diǎn)精度,,確保運(yùn)行在32位浮點(diǎn)環(huán)境中培訓(xùn)的網(wǎng)絡(luò)時(shí)精度降低小于1%,。這是神經(jīng)網(wǎng)絡(luò)從研發(fā)過(guò)渡到面向大批量汽車(chē)和消費(fèi)者應(yīng)用的高成本和功率效益解決方案的關(guān)鍵。
供貨
CEVA將于2016年第四季向主要客戶(hù)授權(quán)許可CEVA-XM6 DSP和視覺(jué)平臺(tái)組件,,并且將于2017年第一季進(jìn)行普通授權(quán)許可,。