《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 萊迪思FPGA在網(wǎng)絡(luò)邊緣計(jì)算AI開發(fā)方案

萊迪思FPGA在網(wǎng)絡(luò)邊緣計(jì)算AI開發(fā)方案

2018-06-06
關(guān)鍵詞: 萊迪思 FPGA AI

  FPGA 向來是高大上的形象,,即便在人工智能火熱的今天,,圍繞 FPGA 討論的焦點(diǎn)也集中在云端的加速,與之相提并論的,,更多是以高性能計(jì)算見長的 GPU,、CPU、DSP,。

  但是,,有家公司,,卻專注在“網(wǎng)絡(luò)邊緣端”,將產(chǎn)品布局在適于低功耗運(yùn)行的低密度 FPGA 上,,其全新的毫瓦級功耗 FPGA 解決方案 ——LatTIcesenAI ,為機(jī)器學(xué)習(xí)推理在大眾市場物聯(lián)網(wǎng)應(yīng)用中實(shí)現(xiàn)快速部署創(chuàng)造機(jī)遇,, 且聽萊迪思半導(dǎo)體亞太區(qū)資深事業(yè)發(fā)展經(jīng)理陳英仁娓娓道來。

1.png

  萊迪思半導(dǎo)體亞太區(qū)資深事業(yè)發(fā)展經(jīng)理陳英仁

  快速興起的網(wǎng)絡(luò)邊緣計(jì)算

  提及 AI 或智能計(jì)算,,我們更多會想到“云端的加速”,。但并非所有應(yīng)用都將在云端運(yùn)行,。萊迪思《加速實(shí)現(xiàn)網(wǎng)絡(luò)邊緣低功耗人工智能應(yīng)用》白皮書中表明,,另一輪從集中式到分布式的系統(tǒng)架構(gòu)轉(zhuǎn)變的征兆已經(jīng)顯而易見了,無論到來與否,,有一點(diǎn)確信無疑,,那就是低延遲要求、不斷加劇的隱私問題和通信帶寬限制,,將驅(qū)動網(wǎng)絡(luò)邊緣對智能化的需求,。陳英仁以智能音響為例,集合了語音控制,、攝像頭檢測功能的智能音響,,可以為生活帶來更多的便利性,但也正由于存在攝像頭,、麥克風(fēng),,隱私暴露就成為大家擔(dān)心的問題。如果這時在終端加入數(shù)據(jù)處理和分析功能,,就可以很好地對隱私進(jìn)行保護(hù),。此外,終端的很多應(yīng)用是需要低延遲的,,甚至有時在沒有網(wǎng)絡(luò)的情況下,,也需要保證在線下進(jìn)行及時的反饋,這時也需要終端數(shù)據(jù)處理的加入,。

  這樣的需求有多大,?Gartner 分析表示:“目前企業(yè)產(chǎn)品的數(shù)據(jù)約有 10% 都在傳統(tǒng)的集中式數(shù)據(jù)中心或云端以外的地方處理,到 2022年,,這一數(shù)據(jù)將會達(dá)到 50% ,。”

2.png

  正如在消費(fèi)物聯(lián)網(wǎng)領(lǐng)域所見,,隨著傳感器數(shù)量和種類的激增,,需要部署更多的計(jì)算資源用于實(shí)時數(shù)據(jù)處理,能夠?qū)崿F(xiàn)這種本地傳感器數(shù)據(jù)處理的毫瓦級功耗,、小體積,、低成本,、靈活支持各類傳統(tǒng)接口以及性能/精度可調(diào)節(jié)的半導(dǎo)體解決方案就顯得至關(guān)重要。

  低功耗對物聯(lián)網(wǎng)邊緣應(yīng)用的重要性不言而喻,。陳英仁介紹,,不同的應(yīng)用場景、不同種類的傳感器,,動輒成千上萬的傳感器部署,,24小時無休,如果每兩三天充電或更換一次電池,,增加了太多的維護(hù)成本,,因而智能終端應(yīng)用的半導(dǎo)體功耗需要達(dá)到幾瓦甚至毫瓦級。

  成本也是一個關(guān)鍵要素,,隨著物聯(lián)網(wǎng)的發(fā)展,,越來越多的地方都需要用到傳感器,因而任何一個解決方案都必須能與其他批量生產(chǎn)的網(wǎng)絡(luò)邊緣解決方案一決高下,。

  電路板面積小至幾平方毫米,,也更有利于方便集成到邊緣終端應(yīng)用中。

  考慮到邊緣應(yīng)用終端的多樣性,,處理芯片需要具備最大化的設(shè)計(jì)靈活性,,能夠提供廣泛的 I/O 接口以支持不同的傳感器。

  最后設(shè)計(jì)人員還需要能通過自定義量化平衡精度,、功耗和成本的解決方案,,從而實(shí)現(xiàn)更有效地邊緣計(jì)算。

  應(yīng)運(yùn)而生 sensAI

  顧名思義,,sensAI 為優(yōu)化 AI 應(yīng)用而生,,那么我們就有必要先了解 AI的概念。1956 年夏,,人工智能先驅(qū)們的夢想是借由新興計(jì)算機(jī)構(gòu)建具有人類智力特征的復(fù)雜機(jī)器,。這就是所謂的“通用人工智能(General AI)”的概念——擁有人類的所有感覺(甚至可能更多)、所有理智,,像人類一樣思考的神奇機(jī)器,。而機(jī)器學(xué)習(xí)是用來實(shí)現(xiàn)人工智能的一種方式?!巴ǔ?,機(jī)器學(xué)習(xí)要求兩種類型的計(jì)算工作量——訓(xùn)練和推理” 陳英仁介紹,訓(xùn)練系統(tǒng)通過現(xiàn)有的數(shù)據(jù)習(xí)得新能力,,例如人臉檢測功能通過采集和分析成千上萬張圖片來學(xué)習(xí)識別人臉,,這種高度密集的計(jì)算,往往需要使用高性能硬件如 GPU或高性能 FPGA 等進(jìn)行快速處理,。而推理環(huán)節(jié)主要過識別圖案和執(zhí)行任務(wù)將系統(tǒng)能力用于處理新數(shù)據(jù),,邊運(yùn)行邊學(xué)習(xí),,隨著時間的推移變得愈加智能。一般分為兩個場景:在云端數(shù)據(jù)中心響應(yīng)用戶需求和在終端智能設(shè)備響應(yīng)用戶需求,。在云端數(shù)據(jù)中心,,各家公有云服務(wù)廠商都紛紛部署了高性能云計(jì)算服務(wù)器。而在而在終端設(shè)備,,由于前面所述說隱私性,、低延遲的需求,很多應(yīng)用都會在終端部署以提升智能度,, 設(shè)計(jì)人員可以使用經(jīng)過優(yōu)化的,、低功耗、低密度的FPGA,,滿足日益嚴(yán)苛的性能和功耗要求,。

  對此,,萊迪思推出基于 iCE40 UltraPlus 和 ECP5 FPGA 系列的新型全套開發(fā)生態(tài)系統(tǒng)——LatTIce senAI,,旨在實(shí)現(xiàn)機(jī)器學(xué)習(xí)推理在大眾物聯(lián)網(wǎng)應(yīng)用中實(shí)現(xiàn)快速部署。LatTIce senAI 提供經(jīng)過優(yōu)化的解決方案,,具有超低功耗(低于 1mW-1W),、封裝尺寸小(5.5-100 mm2)、接口靈活(MIPI? CSI-2,、LVDS,、GigE 等)和批量價格低(約 1-10 美元)等優(yōu)勢。

3.png

  之所以推出 sensAI , 陳英仁解釋道,,F(xiàn)PGA 天生適合做計(jì)算,,但更多時候,計(jì)算是客戶的核心技術(shù),,甚至有部分客戶還沒有這項(xiàng)技術(shù),,那么如何能夠幫助他們快速地利用 FPGA 的低功耗、低成本,、小體積實(shí)現(xiàn)計(jì)算,,就成了 FPGA 推廣最大難題。因此,,sensAI就是為了讓客戶能夠在傳感器的橋接和數(shù)據(jù)聚合中,,增加更多智能以實(shí)現(xiàn)低延時、低功耗的計(jì)算,,即客戶手中有數(shù)據(jù)和樣本,,就可以在 FPGA 中做計(jì)算,尤其在網(wǎng)絡(luò)編程里,。

  sensAI 以模塊化硬件平臺為基礎(chǔ),,包括基于低功耗 iCE40 UltraPlus FPGA的移動開發(fā)平臺(MDP)

  和基于 ECP5 FPGA 器件的視頻接口平臺( VIP ),, MDP 包括一系列板載傳感器,如圖像傳感器,、麥克風(fēng),、羅盤、壓力傳感器和陀螺儀等,,可用于毫瓦級功耗的應(yīng)用,。VIP 的功耗稍高但總體低于 1 W,可實(shí)現(xiàn) MIPI CSI-2,、嵌入式DisplayPort (eDP),、HDMI、GigE Vision和USB3在內(nèi)的接口互連,。

4.png

  為配合硬件平臺,,萊迪思提供了新的神經(jīng)網(wǎng)絡(luò)加速器 IP 核。該軟 IP 包括針對iCE40 UltraPlus FPGA 優(yōu)化后的 BNN(二值神經(jīng)網(wǎng)絡(luò))1加速器,,支持 1 bit 權(quán)重量化和 1 bit 激活量化,,可以實(shí)現(xiàn)低功耗的偵測和推理。還包括針對ECP5 FPGA 優(yōu)化的 CNN (卷積神經(jīng)網(wǎng)絡(luò))加速器,,該核可支持不同權(quán)重和激活的量化(1bit,、8bit和16bit),實(shí)現(xiàn)功耗和精度的平衡,,設(shè)置的位寬越高,,準(zhǔn)確度通常會越高。

  為了更方便的應(yīng)用上述 IP ,,萊迪思提供從 Caffe/TensorFlow 到 FPGA 的神經(jīng)網(wǎng)絡(luò)編譯器工具,、LatTIce Radiant

  和 Lattice Diamond 設(shè)計(jì)軟件。通過開源的深度學(xué)習(xí)框架 Caffe/TensorFlow 實(shí)現(xiàn)網(wǎng)絡(luò)訓(xùn)練,,然后經(jīng)過萊迪思獨(dú)立開發(fā)的神經(jīng)網(wǎng)絡(luò)編譯器將經(jīng)過訓(xùn)練的網(wǎng)絡(luò)模型映射成定點(diǎn)數(shù)值表示以匹配其 FPGA ,,可在沒有 RTL 設(shè)計(jì)經(jīng)驗(yàn)的情況下,將網(wǎng)絡(luò)應(yīng)用移植到其 FPGA 中,。此外,,神經(jīng)網(wǎng)絡(luò)編譯器能夠快速分析、模擬和編譯 CNN/BNN,, 在sensAI IP 核上實(shí)現(xiàn),。這樣補(bǔ)足了 FPGA 在計(jì)算應(yīng)用中的高門檻。

  陳英仁介紹,,為了更好地簡化邊緣應(yīng)用的 AI 開發(fā),,萊迪思也提供了專門針對超低功耗優(yōu)化的參考設(shè)計(jì)及演示。比如低功耗人臉檢測,、關(guān)鍵詞檢測,、對象計(jì)數(shù),、面部跟蹤以及速度標(biāo)志牌檢測等。

5.png

  基于萊迪思 MDP 移動開發(fā)平臺實(shí)現(xiàn)的人臉檢測 Demo,,其功耗約為 800-850 微瓦,,搭配低功耗影響傳感器,可實(shí)現(xiàn)精準(zhǔn)的,、毫瓦以下人臉偵測,,如智能門鈴、智能鎖,、智能化妝鏡,、超市結(jié)賬等

  此外,萊迪思也構(gòu)建了經(jīng)認(rèn)證的合作伙伴生態(tài)系統(tǒng),,旨在聯(lián)合國內(nèi)外不同領(lǐng)域的 AI 應(yīng)用合作伙伴(在某些領(lǐng)域有專長的服務(wù)商),,為智能家居、智慧城市,、智能工廠等領(lǐng)域的客戶快速,、有效地提供定制化的解決方案。

6.png

  “sensAI神經(jīng)網(wǎng)絡(luò)加速器和神經(jīng)網(wǎng)絡(luò)編譯器是我們最核心的部分,,” 陳英仁表示,,因?yàn)槿R迪思為客戶實(shí)現(xiàn)簡潔的低功耗推理。對已經(jīng)在使用 FPGA 進(jìn)行橋接和連接技術(shù)的客戶,,可以有更多的選擇優(yōu)化設(shè)計(jì)。對于即將在邊緣應(yīng)用終端加入智能的新用戶,,有sensAI 和天生的接口特性的加持,,萊迪思 FPGA 也是一個性能、功耗,、成本,、開發(fā)難度相當(dāng)有競爭力的選擇。

  未來可期

  談到 AI 的應(yīng)用,, “其實(shí)大家還在思考,,怎么樣應(yīng)用 AI 讓生活更簡單,” sensAI 簡化了算法的開發(fā)門檻,,讓設(shè)計(jì)人員更多地去思考如何更好地實(shí)現(xiàn)應(yīng)用,,陳英仁舉了幾個例子,尖叫聲檢測,、槍聲檢測,、玻璃打碎聲音檢測、智能穿衣鏡,、面部跟蹤等等,,似乎更多的應(yīng)用在等著人們放飛想象力得以實(shí)現(xiàn),。但是,可以預(yù)見到的一個趨勢是,,隨著用戶尋求更高級別的智能,,對于靠近 IoT 數(shù)據(jù)源的低功耗推理的需求將與日俱增。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。