·恩智浦展示了應(yīng)用于 MCU 的 Glow 神經(jīng)網(wǎng)絡(luò)編譯器為基于視覺和語音的機(jī)器學(xué)習(xí)應(yīng)用帶來的諸多優(yōu)勢,。恩智浦也是首家針對 MCU 實(shí)現(xiàn)相較于標(biāo)準(zhǔn)版 Glow 2 至 3 倍性能的半導(dǎo)體供應(yīng)商
· 開源 Glow 編譯器最初由 Facebook 開發(fā),,恩智浦現(xiàn)在將其集成到 eIQ?機(jī)器學(xué)習(xí)軟件開發(fā)環(huán)境中,為旗下 i.MX RT 系列跨界 MCU 提供高性能推理
· 恩智浦的 Glow 實(shí)施面向 Arm? Cortex?-M 內(nèi)核和 Cadence? Tensilica? HiFi 4 DSP,,為 i.MX RT 系列跨界 MCU 提供特定平臺的優(yōu)化
荷蘭埃因霍溫——2020 年 8 月 5 日——恩智浦半導(dǎo)體 NXP Semiconductors N.V.今日發(fā)布了 eIQ機(jī)器學(xué)習(xí)(ML) 軟件對 Glow神經(jīng)網(wǎng)絡(luò)(NN) 編譯器的支持功能,針對恩智浦的 i.MXRT 跨界 MCU,帶來業(yè)界首個(gè)實(shí)現(xiàn)以較低存儲器占用提供更高性能的神經(jīng)網(wǎng)絡(luò)編譯器應(yīng)用,。 Glow 編譯器由 Facebook開發(fā),能夠集成特定于目標(biāo)的優(yōu)化,,恩智浦利用這種能力,,使用適用于 Arm Cortex-M內(nèi)核和 Cadence Tensilica HiFi 4 DSP 的神經(jīng)網(wǎng)絡(luò)算子庫,最大程度地提升 i.MX RT685 以及 i.MX RT1050和 RT1060 的推理性能,。此外,,此功能已集成到恩智浦的 eIQ 機(jī)器學(xué)習(xí)軟件開發(fā)環(huán)境中,在恩智浦的MCUXpresso SDK 中免費(fèi)提供,。
使用 Glow 充分發(fā)揮 MCU 架構(gòu)特性的優(yōu)勢
2018 年 5 月,,率先開發(fā) PyTorch 的 Facebook 推出了開源社區(qū)項(xiàng)目 Glow(Graph Lowering 神經(jīng)網(wǎng)絡(luò)編譯器),其目的是提供優(yōu)化,,提高一系列硬件平臺上的神經(jīng)網(wǎng)絡(luò)性能,。作為一種神經(jīng)網(wǎng)絡(luò)編譯器, Glow基于未優(yōu)化的神經(jīng)網(wǎng)絡(luò)生成高度優(yōu)化的代碼,。這個(gè)特點(diǎn)有別于典型的神經(jīng)網(wǎng)絡(luò)模型處理,,后者采用即時(shí)編譯,因而需要更高的性能,還會增加存儲器開銷,。像 Glow這樣直接運(yùn)行優(yōu)化代碼可以顯著降低處理和存儲器要求,。恩智浦也在 Glow 開源社區(qū)中扮演著積極角色,幫助推廣和普及 Glow 的新功能,。
Facebook 軟件工程經(jīng)理 Dwarak Rajagopal表示:“GitHub 中提供的標(biāo)準(zhǔn)版 Glow 可以直接在任何設(shè)備上運(yùn)行,,讓用戶能夠靈活地針對感興趣的基礎(chǔ)架構(gòu)編譯神經(jīng)網(wǎng)絡(luò)模型,包括 Arm Cortex-A 和 Cortex-M 內(nèi)核以及 RISC-V 架構(gòu),。恩智浦使用充分利用 MCU 計(jì)算元件的專用軟件庫,,實(shí)現(xiàn)了 2-3 倍的性能提升,展示了從基于云的高端機(jī)器到低成本的嵌入式平臺的廣泛范圍內(nèi),,將 Glow 神經(jīng)網(wǎng)絡(luò)編譯器用于機(jī)器學(xué)習(xí)應(yīng)用的諸多優(yōu)勢,。”
優(yōu)化機(jī)器學(xué)習(xí)框架以增強(qiáng)競爭優(yōu)勢
未來幾年內(nèi),,對機(jī)器學(xué)習(xí)應(yīng)用的需求預(yù)期將會大幅增加,。據(jù) TIRIAS Research預(yù)測,到 2025年,, 98%的邊緣設(shè)備將使用某種形式的機(jī)器學(xué)習(xí)/人工智能,。根據(jù)市場預(yù)測,到 2025 年,,預(yù)計(jì)將有 180 億至 250 億部設(shè)備包含機(jī)器學(xué)習(xí)功能,,盡管它們可能并沒有專用的機(jī)器學(xué)習(xí)加速器。消費(fèi)型設(shè)備制造商和嵌入式物聯(lián)網(wǎng)開發(fā)人員將需要優(yōu)化機(jī)器學(xué)習(xí)框架,,以便實(shí)現(xiàn)使用 MCU 的低功耗邊緣嵌入式應(yīng)用,。
恩智浦半導(dǎo)體資深副總裁兼邊緣處理業(yè)務(wù)總經(jīng)理 Ron Martino 表示:“借助 eIQ 機(jī)器學(xué)習(xí)軟件框架,利用高度集成的 i.MX 應(yīng)用處理器和高性能 i.MX RT 跨界 MCU 的強(qiáng)大功能,,恩智浦正在推動(dòng)機(jī)器學(xué)習(xí)功能在邊緣設(shè)備上的實(shí)現(xiàn),。隨著 i.MX RT 系列跨界 MCU 增加對 Glow 的支持,我們的客戶能夠編譯深度神經(jīng)網(wǎng)絡(luò)模型,,為他們的應(yīng)用帶來競爭優(yōu)勢,。”
恩智浦的面向機(jī)器學(xué)習(xí)的邊緣智能環(huán)境解決方案是一個(gè)全面的工具包,,提供開發(fā)人員需要的構(gòu)建模塊,,幫助他們高效地在邊緣設(shè)備中實(shí)施機(jī)器學(xué)習(xí)。 Glow 整合到 eIQ 軟件后,,機(jī)器學(xué)習(xí)開發(fā)人員將擁有全面的高性能框架,,可在包括 i.MX RT 跨界 MCU 和 i.MX 8 應(yīng)用處理器的恩智浦邊緣處理解決方案上進(jìn)行擴(kuò)展??蛻魮碛辛烁鼜?qiáng)大的工具,,能夠在 i.MX RT MCU和 i.MX應(yīng)用處理器上開發(fā)機(jī)器學(xué)習(xí)語音應(yīng)用,、對象識別、人臉識別等應(yīng)用,。
利用恩智浦的 Glow 神經(jīng)網(wǎng)絡(luò)實(shí)施來提高性能
eIQ 現(xiàn)在包含對 Glow 和 TensorFlow Lite 的推理支持,,對于這些實(shí)施,恩智浦通常會執(zhí)行基準(zhǔn)測試以衡量其性能,。 MCU 基準(zhǔn)測試包括標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)模型,,例如 CIFAR-10。以 CIFAR-10 模型為例,,恩智浦采集的基準(zhǔn)測試數(shù)據(jù)表明了如何利用 i.MX RT1060 器件(采用 600MHz Arm Cortex-M7),、 i.MX RT1170器件(采用 1GHz Arm Cortex-M7)和 i.MX RT685 器件(采用 600 MHz Cadence Tensilica HiFi 4 DSP)的性能優(yōu)勢。
恩智浦對 Glow 的支持離不開 Cadence 為 Tensilica HiFi 4 DSP 提供的神經(jīng)網(wǎng)絡(luò)庫(NNLib),,該 DSP 提供了 4.8GMAC 性能,。同樣以 CIFAR-10 為例,恩智浦的 Glow 實(shí)施使用這一 DSP 來加快神經(jīng)網(wǎng)絡(luò)運(yùn)算,,實(shí)現(xiàn)了 25 倍的性能提升。
Cadence Tensilica IP 企業(yè)副總裁 Sanjive Agarwala 表示:“Tensilica HiFi 4 DSP 最初集成在 i.MX RT600跨界 MCU 中,,目的是提高各種不同的音頻和語音處理應(yīng)用的速度,。但是,當(dāng)有越來越多機(jī)器學(xué)習(xí)推理應(yīng)用瞄準(zhǔn)了低成本,、低功耗的 MCU 級應(yīng)用時(shí),, HiFi 4 DSP 憑借固有的 DSP 計(jì)算性能,成為加快這些神經(jīng)網(wǎng)絡(luò)模型的理想選擇,。隨著恩智浦在 eIQ 機(jī)器學(xué)習(xí)軟件中實(shí)施 Glow,, i.MX RT600 MCU 的客戶能夠利用該 DSP 來滿足多種機(jī)器學(xué)習(xí)應(yīng)用的需求,包括關(guān)鍵詞檢索(KWS) ,、語音識別,、降噪和異常檢測?!?/p>
Arm 公司機(jī)器學(xué)習(xí)營銷副總裁 Dennis Laudick 表示:“恩智浦將 Arm CMSIS-NN 軟件庫包括在 elQ 中,,目的是最大程度地提升性能,減少 Arm Cortex-M 內(nèi)核上的神經(jīng)網(wǎng)絡(luò)存儲器占用,。以 CIFAR-10 神經(jīng)網(wǎng)絡(luò)模型為例,,恩智浦能夠利用 CMSIS-NN 實(shí)現(xiàn) 1.8倍的性能提升。其他神經(jīng)網(wǎng)絡(luò)模型應(yīng)該能夠產(chǎn)生相似的結(jié)果,,這清晰地展示了這款高級編譯器和我們的優(yōu)化神經(jīng)網(wǎng)絡(luò)算子庫的優(yōu)勢,。”
上市時(shí)間
恩智浦的集成 Glow 神經(jīng)網(wǎng)絡(luò)編譯器的 eIQ 軟件現(xiàn)已上市,,通過 i.MX RT600 跨界 MCU,、 i.MX RT1050和 i.MX RT1060 跨界 MCU 的 MCUXpresso SDK 提供。未來將會推出適用于恩智浦其他 MCU 的集成Glow 神經(jīng)網(wǎng)絡(luò)編譯器的 eIQ 軟件。
關(guān)于 i.MX RT 系列跨界 MCU
i.MX RT 系列是業(yè)內(nèi)首個(gè)跨界 MCU 產(chǎn)品組合,,以經(jīng)濟(jì)的價(jià)格,,提供高性能的 Arm Cortex-M 內(nèi)核、實(shí)時(shí)功能和 MCU 可用性,。該系列代表了低功耗應(yīng)用處理器與高性能微控制器的融合,。 i.MX RT 系列填補(bǔ)了傳統(tǒng) MCU 和 i.MX 應(yīng)用處理器之間的空白,為 MCU 客戶提供了顯著提高性能和改進(jìn)集成的方法,,一如既往地簡單易用,。