CertusPro-NX是萊迪思在18個(gè)月內(nèi)采用Nexus技術(shù)平臺(tái)開發(fā)的第四款產(chǎn)品,它將為更廣泛的應(yīng)用帶來行業(yè)領(lǐng)先的功耗,、性能和尺寸優(yōu)勢(shì)。這些通用FPGA提供低功耗、小尺寸和高帶寬I/O(例如PCIe Gen3和千兆以太網(wǎng)接口)等特性,。它們非常適用于網(wǎng)絡(luò)邊緣人工智能、工業(yè)IoT,、5G控制平面和其他應(yīng)用,。本白皮書由萊迪思贊助,但文中觀點(diǎn)和分析內(nèi)容為作者所有,。
萊迪思半導(dǎo)體推出的第四款基于Nexus平臺(tái)的產(chǎn)品——CertusPro-NX為現(xiàn)有FPGA市場(chǎng)帶來了重大革新,。該系列FPGA采用28 nm FD-SOI工藝制造,擁有低功耗和小尺寸優(yōu)勢(shì),,主要針對(duì)低密度器件市場(chǎng),。與之前發(fā)布的Certus-NX相比,新產(chǎn)品的邏輯單元從17 K提升到了96 K,。2020年,,通用FPGA市場(chǎng)更加多元化,市場(chǎng)規(guī)模增長(zhǎng)約為10%,;CertusPro-NX可用于實(shí)現(xiàn)各種功能,,應(yīng)用領(lǐng)域包括5G蜂窩網(wǎng)、人工智能和物聯(lián)網(wǎng),。這些市場(chǎng)不斷發(fā)生著變化,,而FPGA則能提供ASIC不具備的強(qiáng)大靈活性。
新產(chǎn)品系列有兩種型號(hào),,CPNX-50K有52K邏輯單元,;CPNX-100K有96K邏輯單元,也是首發(fā)工程樣片,。如圖1所示,,后一種型號(hào)有一個(gè)支持LPDDR4 DRAM的可編程I/O(同類FPGA中尚屬首次)。萊迪思還將內(nèi)部存儲(chǔ)器容量拓展了3倍,,讓CertusPro-NX在進(jìn)行存儲(chǔ)密集運(yùn)算時(shí)降低功耗,。
圖1:CertusPro-NX框圖。全新FPGA包含7.3 Mb的片上存儲(chǔ)器,、156個(gè)18x18乘法器的DSP模塊,、可編程邏輯以及8個(gè)靈活的10Gbps SERDES通道(可配置連接DisplayPort或CoaXPress),。
在設(shè)計(jì)CertusPro-NX系列產(chǎn)品時(shí),萊迪思采用了28 nmFD-SOI工藝,。盡管之前人們對(duì)這個(gè)選擇存在質(zhì)疑,,但萊迪思完美達(dá)成了功耗和軟錯(cuò)誤率方面的標(biāo)準(zhǔn),這對(duì)公司贏得客戶的多個(gè)應(yīng)用設(shè)計(jì)來說至關(guān)重要,。除了可編程邏輯之外,,CertusPro-NX還擁有硬核模塊,也可以降低功耗,。它還包括一個(gè)10G以太網(wǎng)端口和一個(gè)四通道PCIe Gen3控制器,。萊迪思還尤其關(guān)注位流配置模塊,因而其器件的啟動(dòng)速度非常之快,,可在不到 30 毫秒內(nèi)完成配置,。
CertusPro-NX相比于前代產(chǎn)品提升巨大,能夠讓客戶在他們基于FPGA的設(shè)計(jì)中實(shí)現(xiàn)高級(jí)功能,。萊迪思將新產(chǎn)品的邏輯單元數(shù)量翻倍,,拓展了片上存儲(chǔ)器容量,升級(jí)了PCIe控制器以及可編程I/O接口,。與英特爾的Cyclone V GT系列和賽靈思的Artix-7系列相比,,新產(chǎn)品的性能達(dá)到了行業(yè)最佳。
機(jī)器視覺和網(wǎng)絡(luò)邊緣AI
除了拓展CertusPro-NX的可編程邏輯架構(gòu)外,,萊迪思還強(qiáng)化了該平臺(tái)的AI功能,。新器件使用了7.3 Mb的內(nèi)部存儲(chǔ)器,客戶可以加載輕量化的神經(jīng)網(wǎng)絡(luò)來識(shí)別物體,、監(jiān)聽關(guān)鍵詞或檢測(cè)異常行為,。然而硬件只是設(shè)計(jì)的一方面。萊迪思的sensAI軟件集合能與Caffe,、TensorFlow,、TensorFlow Lite和Keras等框架配合使用,且擁有萊迪思AI編譯器的支持,。這一經(jīng)過驗(yàn)證的解決方案集合為眾多萊迪思客戶提供了功耗和資源效率充分優(yōu)化的人工智能應(yīng)用,。該軟件平臺(tái)與公司的多款FPGA兼容(CertusPro-NX的兼容性計(jì)劃于今年晚些時(shí)候推出)。
網(wǎng)絡(luò)邊緣的機(jī)器視覺應(yīng)用不僅要求使用硬件來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò),,還需要傳感器兼容,、傳感器聚合和圖像預(yù)處理等功能。在這方面,,萊迪思通過可編程I/O和SERDES模塊來為CertusPro-NX的客戶提供足夠的靈活性,。例如,許多高清圖像傳感器都采用SLVS-EC接口,,這是許多網(wǎng)絡(luò)邊緣AI加速器所缺少的,。
可編程SERDES還支持各種將數(shù)據(jù)從網(wǎng)絡(luò)邊緣傳輸?shù)较到y(tǒng)內(nèi)部的標(biāo)準(zhǔn),,包括CoaXPress和10G Ethernet。
CertusPro-NX 的片上存儲(chǔ)器大小遠(yuǎn)超競(jìng)品,。由于DRAM操作會(huì)增加功耗并降低吞吐量,,所以如果所有權(quán)重都存儲(chǔ)在芯片上,神經(jīng)網(wǎng)絡(luò)就能以最佳狀態(tài)運(yùn)行,,且能夠最大限度地減少DRAM訪問,。因此,客戶希望擁有更大的片上存儲(chǔ)器,。萊迪思全新FPGA可以存儲(chǔ)多達(dá)100萬個(gè)8位權(quán)重——幾乎是Cyclone V GT或Artix-7的兩倍,。由于芯片內(nèi)部可以存儲(chǔ)更多的權(quán)重,CertusPro-NX可以在不訪問DRAM的情況下運(yùn)行更大的AI模型,,從而降低功耗,。
當(dāng)萊迪思FPGA確實(shí)需要訪問DRAM時(shí)會(huì)使用可編程I/O模塊,它支持LPDDR4和速度達(dá)1066 Mbps的DDR3存儲(chǔ)器,。CertusPro-NX是同類產(chǎn)品中首個(gè)支持LPDDR4的產(chǎn)品——比僅提供DDR3及更低標(biāo)準(zhǔn)的競(jìng)品領(lǐng)先一代。然而,,平均而言,,這種較新的技術(shù)會(huì)增加芯片和系統(tǒng)的功耗。但由于CertusPro-NX有著更大的片上存儲(chǔ)器和優(yōu)化的存儲(chǔ)器控制器,,它可以通過使用片上和外部存儲(chǔ)器,,降低能耗和存儲(chǔ)器訪問時(shí)間來達(dá)到新的能效高度。長(zhǎng)期的可用性也是包括嵌入式視覺在內(nèi)的許多市場(chǎng)關(guān)注的問題,,LPDDR4則解除了這種擔(dān)憂,。
構(gòu)建智能家居甚至是智慧城市的一個(gè)關(guān)鍵因素是可見性。大多數(shù)終端用戶更傾向于不顯眼的物聯(lián)網(wǎng)傳感器設(shè)計(jì),,而小尺寸的微處理器是此類設(shè)計(jì)的核心,。CertusPro-NX的面積僅為81 mm2,在支持SERDES的同類產(chǎn)品中擁有最小的封裝,,比Cyclone V GT小33%,,比Artix-7小84%。小尺寸FPGA進(jìn)一步增加了設(shè)計(jì)的可用空間,,讓OEM廠商得以增加更多功能或縮小設(shè)計(jì)尺寸,。
工業(yè)物聯(lián)網(wǎng)
最新一代工業(yè)物聯(lián)網(wǎng)的特點(diǎn)就是大規(guī)模自動(dòng)化,這得益于互連和數(shù)據(jù)分析方面的進(jìn)步,。為實(shí)現(xiàn)自動(dòng)化分揀和包裝等任務(wù),,智能工廠需要數(shù)千臺(tái)物聯(lián)網(wǎng)設(shè)備,它們每天共生成和處理的數(shù)據(jù)量達(dá)TB級(jí),。驅(qū)動(dòng)這些設(shè)備的芯片必須尺寸小,、功耗低且可靠性高,。為了讓客戶為工業(yè)4.0做好充分準(zhǔn)備,萊迪思在其最新一代FPGA中采用了以上原則,。
與基于CMOS工藝的FPGA競(jìng)品相比,,CertusPro-NX采用了FD-SOI來降低功耗。對(duì)這種功耗優(yōu)勢(shì)進(jìn)行量化分析的一種方法是查看各個(gè)供應(yīng)商的功耗估算器,。假設(shè)設(shè)計(jì)需要65 K邏輯單元,、使用了75%的DSP和存儲(chǔ)器、運(yùn)行兩個(gè)5Gbps的SERDES通道,。對(duì)于在85℃結(jié)溫和125MHz頻率下運(yùn)行的該設(shè)計(jì)而言,,CertusPro-NX的總功耗(動(dòng)態(tài)+靜態(tài))比Artix-7少75%,比Cyclone V GT少65%,,如圖 2 所示,。
這些數(shù)據(jù)展示了FD-SOI工藝帶來的強(qiáng)大功耗優(yōu)勢(shì)。該制造技術(shù)在基板中使用絕緣層,,與其他28 nm Bulk CMOS產(chǎn)品相比,,漏電流最多可降低75%;而漏電流是產(chǎn)生靜態(tài)功耗和待機(jī)功耗的主要因素,。
隨著OEM廠商通過提高功耗來提升其產(chǎn)品性能,,英特爾和賽靈思的FPGA將比萊迪思FPGA更快地超過其結(jié)溫閾值。憑借其領(lǐng)先的功耗效率,,CertusPro-NX擁有更多功耗和散熱空間,,從而幫助OEM廠商縮減系統(tǒng)尺寸,降低散熱管理成本,。此外在結(jié)溫以下運(yùn)行的系統(tǒng)不需要安裝容易出現(xiàn)機(jī)械故障的風(fēng)扇,。
散熱對(duì)于工業(yè)馬達(dá)控制更為重要。馬達(dá)往往是密封的,,防止灰塵顆粒進(jìn)入,,縮短其使用壽命。然而,,在運(yùn)行期間,,熱量會(huì)在馬達(dá)中積聚并提高FPGA周圍的環(huán)境溫度。與競(jìng)品相比,,萊迪思的低功耗解決方案能讓FPGA控制更高扭矩的馬達(dá)而不會(huì)過熱,。
圖2:FPGA功耗比較。LC = 邏輯單元,。與英特爾和賽靈思的同類FPGA相比,,萊迪思FPGA的功耗降低65-75%。此處的功耗估算是5 Gbps雙通道SERDES應(yīng)用在125MHz以及85℃結(jié)溫下,,資源使用率為75%時(shí)計(jì)算得出的,。(數(shù)據(jù)來源:萊迪思)
FD-SOI還擁有消除單粒子翻轉(zhuǎn)(SEU)錯(cuò)誤的額外優(yōu)勢(shì),。當(dāng)輻射粒子穿過器件并與存儲(chǔ)器或寄存器單元相互作用時(shí)會(huì)發(fā)生這種錯(cuò)誤,這會(huì)導(dǎo)致器件邏輯狀態(tài)錯(cuò)誤翻轉(zhuǎn),,從而破壞存儲(chǔ)器或數(shù)據(jù)路徑,。與Artix-7相比,CertusPro-NX可降低99%的軟錯(cuò)誤數(shù)量,,無需使用軟錯(cuò)誤檢測(cè)邏輯和糾錯(cuò)代碼,。這種方法既提高了系統(tǒng)可靠性,又簡(jiǎn)化了客戶設(shè)計(jì),。
CertusPro-NX的平均故障間隔時(shí)間(MTBF)是Artix-7的110倍,。這一特性可滿足汽車和醫(yī)療系統(tǒng)對(duì)可靠性的需求;由于不需要經(jīng)常進(jìn)行現(xiàn)場(chǎng)調(diào)整,,因此還可以降低維護(hù)成本,,保證關(guān)鍵操作的正常持續(xù)運(yùn)行。較高的MTBF還可以提高工業(yè)機(jī)器人的安全性,,因?yàn)榭刂艶PGA進(jìn)入未知狀態(tài)可能會(huì)導(dǎo)致機(jī)器故障,,從而造成人身傷害或財(cái)產(chǎn)損失。
OEM廠商通常需要將FPGA與其他系統(tǒng)組件配對(duì),,這要求芯片間接口擁有高帶寬,,防止數(shù)據(jù)流瓶頸。全新CertusPro-NX具有支持此類連接的四通道PCIe Gen3控制器,。而其競(jìng)品通常只支持PCIe Gen2,每個(gè)通道速度比PCIe Gen3慢了50%,。更高的SERDES帶寬結(jié)合更新的PCIe技術(shù),,讓CertusPro-NX的客戶打破芯片互連的瓶頸,而使用其他解決方案可能難以實(shí)現(xiàn)這樣的效果,。
5G應(yīng)用
為了更好地服務(wù)于無線網(wǎng)絡(luò),,基站OEM會(huì)將控制平面和用戶平面分開,讓每個(gè)平面獨(dú)立擴(kuò)展——這是5G網(wǎng)絡(luò)的一個(gè)關(guān)鍵特性,,因?yàn)殡S著3GPP不斷發(fā)布新規(guī)范,,這兩個(gè)平面每年都會(huì)有所變化??刂破矫媸悄K化的,,因此無線網(wǎng)絡(luò)供應(yīng)商可以將其功能拆分到多個(gè)芯片中或?qū)⑺鼈冋系絾蝹€(gè)芯片上。它處理各種任務(wù),,包括身份驗(yàn)證,、客戶端 (UE) 會(huì)話管理和統(tǒng)一數(shù)據(jù)管理。
盡管CPU可以執(zhí)行所有這些功能,,但它的效率不如FPGA,。據(jù)行業(yè)估計(jì),,OEM廠商需要高效的硬件,因?yàn)槊總€(gè)5G基站的功耗比4G基站高70%,??紤]到靈活性和功耗限制,基站OEM通常需要FPGA來協(xié)助增強(qiáng)處理器或 ASIC,。萊迪思新產(chǎn)品的功耗低于Artix-7和Cyclone V GT,,簡(jiǎn)化了基站的散熱管理。
5G小基站空間狹小,,數(shù)據(jù)流動(dòng)量大,。CertusPro-NX在擁有SERDES功能的同類芯片產(chǎn)品尺寸最小,非常適合小尺寸設(shè)計(jì)且數(shù)據(jù)速率不會(huì)受到限制,。如圖3所示,,CertusPro-NX領(lǐng)先的75 Gbps SERDES帶寬比Artix-7高36%,是Cyclone V GT的2倍以上,。對(duì)于數(shù)據(jù)包管理等高帶寬功能,,萊迪思FPGA憑借其更大的SERDES帶寬可提供更高的吞吐量,面積效率遙遙領(lǐng)先,。
圖3:SERDES總帶寬,。CertusPro-NX超過競(jìng)品達(dá)2倍之多,在數(shù)據(jù)密集型操作(例如5G基站中的統(tǒng)一數(shù)據(jù)管理)方面有著顯著優(yōu)勢(shì),。(數(shù)據(jù)來源:萊迪思)
結(jié)論
萊迪思推出CertusPro-NX主要是為了滿足機(jī)器視覺,、工業(yè)物聯(lián)網(wǎng)、5G蜂窩網(wǎng)和其他不斷增長(zhǎng)的市場(chǎng)需求,。該器件經(jīng)優(yōu)化的內(nèi)部存儲(chǔ)器和LPDDR4可最大限度地減少神經(jīng)網(wǎng)絡(luò)等存儲(chǔ)密集型操作的功耗,。FD-SOI技術(shù)降低了功耗和故障率,讓下一代器件更可靠且運(yùn)行成本更低,。新款FPGA的10Gbps SERDES和行業(yè)領(lǐng)先的封裝尺寸使其非常適合輔助數(shù)據(jù)處理的小型系統(tǒng),,例如5G蜂窩網(wǎng)絡(luò)。除了在這些領(lǐng)域中表現(xiàn)出色,,OEM還可以將其應(yīng)用于許多其他領(lǐng)域,,包括國(guó)防、汽車和幀抓取,。
文中三款FPGA包含數(shù)量大致相同的邏輯單元,,但萊迪思的產(chǎn)品由于支持LPDDR4而具有顯著優(yōu)勢(shì)。相比之下,,其他器件仍采用DDR3存儲(chǔ)器,。CertusPro-NX 還提供更大的內(nèi)部存儲(chǔ)器和領(lǐng)先的SERDES帶寬。客戶不僅可以使用萊迪思FPGA處理和傳輸更多數(shù)據(jù),,而且還可以將功耗降低多達(dá)75%,,電路板面積減少84%。
通過推出CertusPro-NX,,萊迪思為多年來投資較少的這一重要領(lǐng)域注入了新的活力,。它的主要競(jìng)爭(zhēng)對(duì)手在過去十年中沒有發(fā)布任何一款新的低成本架構(gòu)產(chǎn)品,因此它有機(jī)會(huì)通過PCIe Gen3和LPDDR4等新技術(shù)來鞏固其最新產(chǎn)品系列的市場(chǎng)地位,。這一策略讓萊迪思在低功耗FPGA的功耗和尺寸方面始終保持領(lǐng)先,。CertusPro-NX在前一代產(chǎn)品創(chuàng)新技術(shù)的基礎(chǔ)上,擴(kuò)展了存儲(chǔ)器,、SERDES和邏輯功能,,更好地服務(wù)于5G基站、工業(yè)物聯(lián)網(wǎng)和機(jī)器視覺等新興市場(chǎng),。