2021 年 4 月,,業(yè)界領(lǐng)先的 Versal? AI Core 和 Versal Prime 系列器件開始全面量產(chǎn)發(fā)貨,,這也意味著賽靈思繼FPGA 之后而打造的ACAP 自適應(yīng)計(jì)算加速平臺(tái)謝列,,取得了令人激動(dòng)的階段性成果,,
但是就如同我們的宇宙萬物一樣,,Versal? 世界發(fā)展的腳步也從未停歇,。從客戶設(shè)計(jì),,生態(tài)系統(tǒng)合作伙伴 (包括第三方參考設(shè)計(jì),、IP、軟件和操作系統(tǒng)支持)到產(chǎn)品系列 ( 如近期推出的 Versal AI Edge 和 HBM 系列 )及每個(gè)系列的多種器件,,以及硬化 IP 特性,,基準(zhǔn)測(cè)試,軟 IP 庫和軟件庫等,齊頭并進(jìn),,不斷推進(jìn),。
本文我將著重為大家介紹人工智能開發(fā)者最關(guān)注的 Versal AI Core 系列的最新發(fā)展。
Versal AI Core 系列的新特性
Versal AI Core 系列的最新擴(kuò)展,,是新增兩大 VC2xxx ACAP 系列,,即 VC2802 和 VC2602。如果您認(rèn)為 VC2xxxx 器件肯定意味著 AI Core 系列中增添了某些重要的新的硬化 IP 特性,,恭喜您答對(duì)了,!如下表所示,VC2xxx 系列帶來了三大激動(dòng)人心的新特性:
1.AIE-ML 是 AI 引擎的最新版本,,其中包括緊密耦合的存儲(chǔ)器塊,,可提供優(yōu)異的存儲(chǔ)器訪問并降低時(shí)延
2.具有多個(gè)視頻解碼器引擎 (VDE) 的集成視頻解碼器單元 (VDU)
3.PCIe? Gen5 支持
關(guān)于AIE-ML 及其與 VC1xxx 器件內(nèi)的 AI 引擎的差異,詳見 Xilinx.com 上的 AI 引擎技術(shù)頁面中的詳細(xì)介紹,。
簡單地說,,AIE-ML 使用的是與 AI 引擎相同的基礎(chǔ)架構(gòu)和工具流,但通過添加對(duì) INT4,、BFLOAT16 的原生支持,,將每個(gè) AI 引擎的本地?cái)?shù)據(jù)存儲(chǔ)器容量倍增至 64KB,并新增與 AIE-ML 陣列直接耦合的 512KB 存儲(chǔ)器塊(即無需將自適應(yīng)引擎中的鄰近可編程邏輯 (PL) 用于存儲(chǔ)器緩存),,AIE-ML 還能針對(duì)機(jī)器學(xué)習(xí)進(jìn)行進(jìn)一步優(yōu)化,。這樣一來,與 AI 引擎相比,,AIE-ML 的 AI 計(jì)算密度提高 4 倍,,時(shí)延降低一半,與 GPU 相比單位功耗性能增加 4 倍,。每個(gè) AIE-ML 大約等同于 100 個(gè) DSP58,、2000 個(gè) LUT,以及 16 個(gè) PL 的Block RAM,,使用基于 PL 的實(shí)現(xiàn)方案可以將功耗節(jié)省 33%,。
VDU 能夠支持單路 4Kp60 流的 H.264 和 H.265 編解碼,或者最多 32 路 720p15 流及兩者之間的所有編解碼,。如果要想在 PL 中實(shí)現(xiàn)上述標(biāo)準(zhǔn),,那么每單元就需要 12 萬個(gè) LUT、50 個(gè) DSP58 和 3 個(gè)Block RAM,。使用硬化 VDU 后,,可將每個(gè) VDU 的功耗降低 3.6W。這使其理想適用于眾多智能視頻應(yīng)用,。在這些應(yīng)用中,,多部視頻攝像頭向中央樞紐饋送數(shù)據(jù),,中央樞紐負(fù)責(zé)解碼并執(zhí)行先進(jìn) ML 算法
此外,PCIe Gen5 還新增了對(duì)最先進(jìn)的 PCI Express 標(biāo)準(zhǔn)的支持,。該標(biāo)準(zhǔn)即將在數(shù)據(jù)中心內(nèi)部署,,以在云端實(shí)現(xiàn)更大帶寬和更高智能,。增加硬化 PCIe Gen5 支持能帶來可觀的效益,,不僅能節(jié)省 30 萬 LUT,還能將每核心功耗降低節(jié)省 3W ,。
智能應(yīng)用
當(dāng)然,,VC2802 和 VC2602 ACAP 中的所有這些新特性,自然必有其用處,。它們將支持大量全新的“智能”應(yīng)用,,在邊緣和世界各地的數(shù)據(jù)中心中廣泛部署。其中一個(gè)示例就是智慧城市應(yīng)用,。這類應(yīng)用使用多個(gè)視頻攝像頭監(jiān)測(cè)車流或人流,,并使用實(shí)時(shí) ML 算法評(píng)估實(shí)時(shí)流量或周邊安全。
另一種智能應(yīng)用是零售領(lǐng)域的“智能零售防損”應(yīng)用,。視頻攝像頭可以用在商場(chǎng)和店鋪里,,在銷售點(diǎn)實(shí)時(shí)監(jiān)控商品失竊或商品貼標(biāo)錯(cuò)誤。損耗 (Shrinkage )是零售業(yè)的一大難題,,智能零售應(yīng)用能夠顯著降低損耗率,。
這些只是 Versal 生態(tài)系統(tǒng)通過擴(kuò)張,支持新市場(chǎng)和新用例的一小部分示例,。
入門指南
如果您已準(zhǔn)備好立即加入 Versal設(shè)計(jì)的世界,,我想推薦兩種評(píng)估與原型設(shè)計(jì)平臺(tái)作為您的起點(diǎn)。一個(gè)是 VCK190 套件,,也是首款 Versal AI Core 系列評(píng)估套件,。另一個(gè)是SmartLynq+ 模塊,為實(shí)現(xiàn)高速調(diào)試與追溯而構(gòu)建,,提供包含 AI 引擎在內(nèi)的對(duì) Versal 架構(gòu)的完整可見性,。
此外,我們還提供了豐富的文檔,、示例,、參考設(shè)計(jì)、資源和方法,,為您在評(píng)估平臺(tái)上的開發(fā)工作提速,。如果您剛剛開始接觸 Versal ACAP,也無需擔(dān)心,!您可以先使用我們的設(shè)計(jì)流程助手 ( Design Flow Assistant)啟動(dòng)開發(fā)規(guī)劃,,然后使用我們的設(shè)計(jì)流程中心( Design Process Hubs),,輕松地按設(shè)計(jì)流程找到全部文檔。此外,,我們還在賽靈思 GitHub 上提供了大量的 Versal 和 Vitis 開源示例和有針對(duì)性的參考設(shè)計(jì),。
后續(xù)更精彩
VC2802 和 VC2602 的加入,為 AI Core 系列帶來了激動(dòng)人心的新功能,,然而,, 這并不是全部,未來還會(huì)有更多令人興奮的消息,。歡迎申請(qǐng)加入 Versal ACAP 快報(bào)更新列表,,率先獲得最新產(chǎn)品訊息。