《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > FPGA的下一代形態(tài)是這樣的

FPGA的下一代形態(tài)是這樣的

2019-07-01
關(guān)鍵詞: FPGA ACAP Versal

  早前,,Xilinx宣布其新一代基于ACAP架構(gòu)的芯片系列Versal已經(jīng)正式出貨給第一批客戶,,并將在今年下半年正式大規(guī)模出貨。這也意味著Xilinx研發(fā)多年的新架構(gòu)終于到了經(jīng)歷市場(chǎng)檢驗(yàn)的階段,。

20190701103049545.jpg

  自從Xilinx從2018年發(fā)布ACAP架構(gòu)以來,,該架構(gòu)就得到了行業(yè)的高度關(guān)注。ACAP全稱“靈活計(jì)算加速平臺(tái)”(Adaptive Computation Acceleration Platform),,該芯片不僅包含了FPGA的可配置邏輯,,還包含了ARM核,以及AI Engine和DSP Engine,。這意味著使用ACAP架構(gòu)的芯片將可以滿足三種需求:ARM核可以運(yùn)行一些通用化且對(duì)性能需求不高的任務(wù),,例如操作系統(tǒng);FPGA可配置邏輯可以運(yùn)行定制化邏輯,;而AI Engine則可以運(yùn)行AI相關(guān)的高性能專用計(jì)算,,例如矩陣運(yùn)算等。

2.jpg

  ACAP架構(gòu)里新加入的AI Engine是大家關(guān)注的焦點(diǎn),。根據(jù)Xilinx發(fā)布的資料,,該AI Engine是一組SIMD核陣列,每個(gè)核都包含了完整的RISC處理器,、定點(diǎn)SIMD處理單元,、浮點(diǎn)SIMD處理單元以及本地內(nèi)存。每個(gè)核之間還可以通過片上網(wǎng)絡(luò)(NoC)連接到一起,,從而可以實(shí)現(xiàn)高度靈活的數(shù)據(jù)流,。這樣的架構(gòu),事實(shí)上類似眾核架構(gòu),。在這次發(fā)布的Versal AI Core系列芯片中,將會(huì)集成128-400個(gè)AI Engine,,從而實(shí)現(xiàn)43-133TOPS的INT8定點(diǎn)計(jì)算能力,。

3.jpg

4.jpg

  FPGA的演化邏輯

  為什么Xilinx會(huì)在FPGA里面加入專用的AI Engine呢?我們不妨回顧一下FPGA的發(fā)展歷史,。

  在FPGA最初出現(xiàn)的時(shí)候,,其最大的賣點(diǎn)是可以配置成任意的邏輯,只要邏輯容量不超過FPGA的上限即可,。最初人們對(duì)于FPGA的期望是滿足其功能需求,。

  在這樣的預(yù)期下,使用FPGA的系統(tǒng)可以劃分為兩個(gè)部分,,一個(gè)是使用通用處理器實(shí)現(xiàn)的高速處理部分,,而另一部分是使用FPGA實(shí)現(xiàn)的特殊功能部分,。換句話說,F(xiàn)PGA的主要角色是協(xié)處理器,。

  然而,,隨著用戶的需求和FPGA公司的業(yè)務(wù)擴(kuò)展,F(xiàn)PGA并不滿足于只當(dāng)一個(gè)協(xié)處理器,。從用戶角度來說,,事實(shí)上這種主-從處理器的系統(tǒng)在設(shè)計(jì)和集成的時(shí)候會(huì)比較麻煩,如何正確處理主-從處理器之間的可靠互聯(lián)和數(shù)據(jù)通信協(xié)議設(shè)計(jì)都需要不少功夫,。隨著FPGA容量的增大,,不少用戶試著在FPGA上部署一個(gè)處理器核來跑OS并控制其余部分的可編程邏輯。然而,,這樣的效率很低,,因?yàn)樘幚砥骱耸且环N通用處理器,而FPGA事實(shí)上最合適的領(lǐng)域是定制化邏輯而非通用處理器,。從Xilinx和Altera這樣的FPGA公司業(yè)務(wù)來說,,F(xiàn)PGA作為協(xié)處理器的市場(chǎng)可以提供的利潤率顯然會(huì)小于整個(gè)系統(tǒng)的利潤率。因此,,基于供需雙方的需求,,Xilinx推出了包含了ARM硬核和FPGA的Zynq系列芯片,而Altera也推出了類似概念的Altera SoC系列產(chǎn)品,。

  在Zynq和Altera SoC這類的產(chǎn)品中,,包含了一個(gè)ARM處理器硬核,以及可編程邏輯,。由于處理器是硬核,,因此可以運(yùn)行在GHz這樣的頻率范圍,相比之前跑在FPGA上的軟核只能跑到100MHz這樣的頻率,,可以說集成ARM硬核是大大提升了通用處理器核的性能,,使其不再成為系統(tǒng)的性能瓶頸。此外,,由于ARM硬核和FPGA集成在同一塊芯片上,,因此處理器和FPGA之間有著豐富的高速互聯(lián)資源,從而讓ARM硬核和FPGA邏輯之間的數(shù)據(jù)交換變得高效,。同時(shí)在工具鏈上,,對(duì)于ARM核+FPGA的協(xié)同工作也提供了很好的支持。這樣幾個(gè)要素組合在一起,,就實(shí)現(xiàn)了一個(gè)重要的突破,,即這樣一個(gè)包含ARM核和FPGA的芯片在不少場(chǎng)景下可以直接作為一個(gè)系統(tǒng)工作,而不再依賴于其他主處理器了。因此,,集成了ARM核的FPGA就不再是一個(gè)協(xié)處理器,,而是可以作為一個(gè)主處理器。

  到了今天,,隨著FPGA目標(biāo)人工智能市場(chǎng),,事實(shí)上又出現(xiàn)了之前同樣的情況:不少用戶希望用FPGA實(shí)現(xiàn)人工智能計(jì)算,但是FPGA實(shí)現(xiàn)人工智能計(jì)算的能力有限,,而另一方面主流人工智能計(jì)算其實(shí)都相當(dāng)規(guī)則,,基本都是基于矩陣運(yùn)算,因此Xilinx在ACAP的架構(gòu)中主動(dòng)加入了能靈活支持這類人工智能運(yùn)算的硬核——AI Engine,,從而希望能作為完整的系統(tǒng)支持人工智能計(jì)算,,并慢慢從芯片廠商走向系統(tǒng)廠商。

  ACAP對(duì)于人工智能市場(chǎng)的影響

  ACAP主要針對(duì)的市場(chǎng)是云端和邊緣計(jì)算市場(chǎng),。云端市場(chǎng)即數(shù)據(jù)中心的服務(wù)器,,在此類應(yīng)用中,ACAP可望作為用于加速人工智能計(jì)算的加速卡進(jìn)入服務(wù)器,。目前,,亞馬遜AWS已經(jīng)有不少部署了Xilinx FPGA的服務(wù)器,隨著ACAP的發(fā)布,,可望會(huì)有更多FPGA進(jìn)入此類云計(jì)算市場(chǎng),。值得注意的是,ACAP主要的強(qiáng)項(xiàng)是低精度定點(diǎn)計(jì)算(INT8),,因此針對(duì)的AI應(yīng)用主要是推理,,而作為云端人工智能重要應(yīng)用的訓(xùn)練仍然會(huì)需要擅長浮點(diǎn)運(yùn)算的GPU。而在AI推理方面,,F(xiàn)PGA相比GPU的優(yōu)勢(shì)是功耗小并且可定制,,因此會(huì)在該領(lǐng)域與GPU競(jìng)爭(zhēng)市場(chǎng)份額。然而,,相比GPU完整的開發(fā)者生態(tài),,F(xiàn)PGA的開發(fā)生態(tài)仍然不夠成熟,因此工具鏈等開發(fā)生態(tài)可能會(huì)成為充分開啟FPGA潛力的關(guān)鍵點(diǎn),。

5.jpg

  在云端市場(chǎng)之外,,邊緣計(jì)算將是ACAP的重點(diǎn)市場(chǎng)。邊緣計(jì)算介于終端節(jié)點(diǎn)和云之間,,邊緣服務(wù)器部署在物聯(lián)網(wǎng)終端附近,它收集終端設(shè)備的信息并做就近處理,,同時(shí)將必要的信息再上傳至云端,。物聯(lián)網(wǎng)、5G和自動(dòng)駕駛技術(shù)在大大增加邊緣計(jì)算市場(chǎng)潛力的同時(shí),也對(duì)邊緣計(jì)算提出了新的需求,,需要邊緣計(jì)算在做網(wǎng)絡(luò)操作和數(shù)據(jù)存儲(chǔ)之外,,還要能實(shí)現(xiàn)實(shí)時(shí)人工智能計(jì)算,而這也是ACAP主要針對(duì)的市場(chǎng),。事實(shí)上,,通信基站本來就是FPGA的主要市場(chǎng)之一,因此隨著5G結(jié)合邊緣計(jì)算和人工智能的概念,,ACAP顯然也能迎合這樣的潮流,,從而有望隨著5G+概念的崛起占領(lǐng)更多通信市場(chǎng)。

  對(duì)于人工智能芯片初創(chuàng)公司來說,,ACAP將會(huì)在云端和邊緣計(jì)算端成為一個(gè)有力的競(jìng)爭(zhēng)者,。考慮ACAP的計(jì)算能力(40-100TOPS),,我們認(rèn)為ACAP在邊緣計(jì)算方面將有非常強(qiáng)的競(jìng)爭(zhēng)力(在云端對(duì)于算力的需求將會(huì)很快超過100TOPS,,因此ACAP或許將更多發(fā)揮其在可配置而非算力方面的優(yōu)勢(shì))。由于FPGA成本較高,,因此我們認(rèn)為ACAP將會(huì)更多面對(duì)高端市場(chǎng),,但是從整體上來說,我們認(rèn)為ACAP將會(huì)成為Xilinx進(jìn)軍人工智能市場(chǎng)的一把利器,。

  對(duì)于Xilinx FPGA的老對(duì)手——Intel來說,,應(yīng)對(duì)Xilinx ACAP的策略并非針鋒相對(duì)推出另一款功能相近的芯片,而是利用自身在封裝工藝上的優(yōu)勢(shì)以虛擊實(shí),。今年四月,,Intel發(fā)布了下一代FPGA構(gòu)架AgileX,該架構(gòu)利用EMIB封裝,,可以把FPGA和其他芯片粒封裝在一起,。因此,如果客戶選擇在AgileX的系統(tǒng)中集成一塊用于AI加速的芯片粒,,則可以實(shí)現(xiàn)和Xilinx ACAP類似的效果,。這樣一來,Intel的AgileX方案比起Xilinx來說更加靈活,,因?yàn)閄ilinx的ACAP只針對(duì)AI相關(guān)計(jì)算優(yōu)化,,而Intel的AgileX優(yōu)化的計(jì)算取決于客戶選擇集成什么芯片粒。然而,,現(xiàn)在芯片粒的生態(tài)還未完善,,因此無論是成本、工具鏈還是產(chǎn)能來說都要打個(gè)問號(hào),,因此我們認(rèn)為Intel的AgileX架構(gòu)的第一批客戶還主要是針對(duì)希望能和Intel深度合作使用EMIB技術(shù)并且有技術(shù)實(shí)力理解甚至定制芯片粒系統(tǒng)的大客戶,,這樣看來,我們認(rèn)為Xilinx的ACAP是賭定了AI市場(chǎng),并且希望能快速覆蓋更多的客戶,;而Intel還不愿意放棄FPGA的靈活性,,因此并不希望這么早就把FPGA和AI深度綁定,而是希望FPGA能作為其芯片粒生態(tài)的先鋒部隊(duì),。這另一方面和兩家公司的架構(gòu)也有關(guān):FPGA只是Intel的一個(gè)事業(yè)部,,其產(chǎn)品定義必須服從Intel整體的戰(zhàn)略;而FPGA產(chǎn)品對(duì)于Xilinx來說就是全部,,所以一切都圍繞FPGA,。

6.jpg

  對(duì)于中國芯片公司來說,意識(shí)到FPGA與專用加速器以及處理器硬核集成的趨勢(shì)也是重要的,。雖然我們?cè)贔PGA領(lǐng)域尚需追趕,,但是FPGA SoC的架構(gòu)與FPGA更像是一種橫向擴(kuò)展而非縱向加深,也即完全可以在與研發(fā)FPGA并行進(jìn)行,,從而在未來更快追上FPGA發(fā)展的步伐,。從另一個(gè)角度來說,我們也可以認(rèn)為FPGA下一步的發(fā)展已經(jīng)不只是如何把FPGA邏輯規(guī)模做大速度做快,,而是如何把FPGA搭配其他應(yīng)用組成在靈活度和性能方面都足夠好的SoC,。隨著FPGA IP的發(fā)展,中國芯片公司也可以考慮購買FPGA IP搭配專用加速器IP,,從而實(shí)現(xiàn)我們自己的“ACAP”,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。