3月6日,,在“AI in 5G——引領(lǐng)新時(shí)代論壇”上,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)正式發(fā)布“AIIA DNN benchmark V0.5”首輪評(píng)估結(jié)果,。該評(píng)估在AIIA權(quán)威測(cè)試平臺(tái)完成,基于端側(cè)推斷任務(wù)的深度神經(jīng)網(wǎng)絡(luò)處理器基準(zhǔn)測(cè)試,。在四大典型應(yīng)用場(chǎng)景下,,能夠客觀反映具有深度學(xué)習(xí)處理能力的處理器或加速器的性能水平。評(píng)估結(jié)果顯示,,海思麒麟980和瑞芯微RK3399表現(xiàn)上佳,。
“AIIA DNN benchmark V0.5”評(píng)估的標(biāo)準(zhǔn)較為嚴(yán)苛,包含四大典型場(chǎng)景和兩大類評(píng)測(cè)指標(biāo)等,,指標(biāo)包含速度(fps)和算法性能,,如top1 、top5,、mAP,、mIoU、PSNR等,。同時(shí),,這也是深度學(xué)習(xí)處理器領(lǐng)域首次區(qū)分整型和浮點(diǎn)對(duì)比的Benchmark。福州瑞芯微電子的RK3399開發(fā)板展現(xiàn)出搶眼數(shù)據(jù),。
采用28nm工藝的福州瑞芯微電子RK3399開發(fā)板,,在評(píng)估中展現(xiàn)出超強(qiáng)性能。評(píng)估數(shù)據(jù)顯示,,在浮點(diǎn)模型不需要定點(diǎn)化重新訓(xùn)練的情況下,,int8計(jì)算以精度損失最大為1%的代價(jià),達(dá)到相對(duì)于浮點(diǎn)計(jì)算兩倍的性能,。
此外,,在Interpretation評(píng)測(cè)中,AIIA第一次嘗試在基準(zhǔn)測(cè)試中將量化和浮點(diǎn)模型分開評(píng)測(cè),。而福州瑞芯微電子RK3399開發(fā)板同樣取得多項(xiàng)優(yōu)異數(shù)據(jù),,在業(yè)內(nèi)處于前列水平。
值得一提的是,,福州瑞芯微電子RK3399開發(fā)板數(shù)據(jù)搶眼的背后,,離不開前沿技術(shù)的支持。比如RK3399融入了Tengine,,后者是由OPEN AI LAB開發(fā)的一款輕量級(jí)模塊化高性能神經(jīng)網(wǎng)絡(luò)推理引擎,。Tengine專門針對(duì)Arm嵌入式設(shè)備優(yōu)化,且無需依賴第三方庫,,可跨平臺(tái)使用支持Android,、Liunx等,。
Tengine支持各類常見卷積神經(jīng)網(wǎng)絡(luò),包括SqueezeNet,,MobileNet,,AlexNet,ResNet等,,支持層融合,、8位量化等優(yōu)化策略。通過調(diào)用針對(duì)不同CPU微構(gòu)架優(yōu)化的HCL庫,,能將Arm CPU的性能充分挖掘出來,。而RK3399的Cortex-A72單線程運(yùn)行移動(dòng)端常用的MobileNet,一次只需要111ms,。
在IoT設(shè)備,、智能交互設(shè)備、個(gè)人電腦,、機(jī)器人等人工智能設(shè)備的創(chuàng)新與研發(fā)上,,福州瑞芯微電子已經(jīng)在技術(shù)上展現(xiàn)出領(lǐng)先優(yōu)勢(shì),除了RK3399以外,,旗艦級(jí)人工智能芯片RK3399Pro同樣極具看點(diǎn),,其首次采用CPU+GPU+NPU的硬件結(jié)構(gòu)設(shè)計(jì)。這一芯片集成的NPU(神經(jīng)網(wǎng)絡(luò)處理器)融合了福州瑞芯微電子在機(jī)器視覺,、語音處理,、深度學(xué)習(xí)等方面的關(guān)鍵技術(shù),片上NPU運(yùn)算性能高達(dá)3.0TOPs,,具備高性能,、低功耗、開發(fā)易等優(yōu)勢(shì),。
人工智能芯片大變革時(shí)代,,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA) “AIIA DNN benchmark V0.5”權(quán)威測(cè)試平臺(tái)的亮相以及首輪數(shù)據(jù)發(fā)布,或?qū)⒔K結(jié)AI芯片缺乏統(tǒng)一數(shù)據(jù)測(cè)試標(biāo)準(zhǔn)的局面,,加速人工智能芯片的技術(shù)蛻變與進(jìn)化,。