8月8日,,英特爾在美國總部召開了名為“以數(shù)據(jù)為中心(Data-Centric)”的創(chuàng)新峰會。在會上,以英特爾執(zhí)行副總裁、數(shù)據(jù)中心集團(tuán)總經(jīng)理Navin Shenoy為首的各產(chǎn)品線主要負(fù)責(zé)人介紹了英特爾在大數(shù)據(jù)時(shí)代的發(fā)展愿景和布局,,對“以數(shù)據(jù)為中心的計(jì)算(Data-Centric Computing)”的潛在市場進(jìn)行了分析,并且公布了若干英特爾相關(guān)軟硬件產(chǎn)品的發(fā)展路線圖,。
本次峰會披露了很多關(guān)于FPGA的重大動(dòng)態(tài),,其中包括正式宣布了基于英特爾FPGA的智能網(wǎng)卡產(chǎn)品線,以及其第一款代號為“Cascade Glacier(冰川瀑布)”的量產(chǎn)版智能網(wǎng)卡,。作為這款產(chǎn)品的FPGA研發(fā)團(tuán)隊(duì)的主要成員之一,,筆者從立項(xiàng)之初就參與了它的各項(xiàng)研發(fā)工作,,并負(fù)責(zé)了多個(gè)軟硬件模塊和系統(tǒng)的設(shè)計(jì)與驗(yàn)證任務(wù),。因此對于這款產(chǎn)品的正式對外發(fā)布,我倍感欣喜,,并希望通過本文進(jìn)一步梳理和分析峰會的技術(shù)細(xì)節(jié),,以及從以下幾個(gè)方面探討FPGA在大數(shù)據(jù)時(shí)代的各種機(jī)遇和挑戰(zhàn):
1.英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)及其潛在市場
2.基于FPGA的智能網(wǎng)卡產(chǎn)品線的正式發(fā)布
3.英特爾人工智能計(jì)算加速器產(chǎn)品系列的相關(guān)布局
4.FPGA開發(fā)的痛點(diǎn)與潛在方案
英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)
近年來,英特爾一直積極的尋求業(yè)務(wù)轉(zhuǎn)型,,即從一家以個(gè)人計(jì)算機(jī)和CPU為主的企業(yè),,轉(zhuǎn)向以數(shù)據(jù)為中心并圍繞其發(fā)展全棧式解決方案的公司,。為了實(shí)現(xiàn)這一目標(biāo),這幾年英特爾先后收購了FPGA大廠Altera(167.5億美金),,自動(dòng)駕駛大廠Mobileye(153億美金),,人工智能芯片初創(chuàng)公司Nervana、機(jī)器視覺公司Movidus等眾多公司擴(kuò)展其產(chǎn)品線,,并同時(shí)招攬了兩位芯片設(shè)計(jì)大神Jim Keller和 Raja Koduri分別擔(dān)任半導(dǎo)體工程總負(fù)責(zé)人和芯片總架構(gòu)師,,負(fù)責(zé)統(tǒng)領(lǐng)英特爾各類芯片(特別是高端數(shù)據(jù)中心芯片)的整體架構(gòu)和路線圖規(guī)劃。另外,,英特爾旗下的風(fēng)投部門僅在2017年就投資了包括地平線在內(nèi)的十余家AI初創(chuàng)企業(yè),,各領(lǐng)域總投資額超過五億美元。
推動(dòng)這場變革的主要力量,,就是目前方興未艾的大數(shù)據(jù)浪潮,。目前,全世界現(xiàn)有的超過90%的數(shù)據(jù)都是在過去的兩年內(nèi)產(chǎn)生的,。隨著人工智能,、自動(dòng)駕駛、5G,、云計(jì)算等各種技術(shù)的不斷發(fā)展,,各類數(shù)據(jù)將會基于源源不斷的產(chǎn)生,預(yù)計(jì)到2025年時(shí),,數(shù)據(jù)總量將比現(xiàn)在增長10倍,。由于上述技術(shù)的發(fā)展都基于對大數(shù)據(jù)的研究和分析,因此有人形象的將數(shù)據(jù)比作未來人工智能時(shí)代的石油,。
隨著數(shù)據(jù)量的增長和技術(shù)的發(fā)展,,對數(shù)據(jù)進(jìn)行處理的能力也有了長足的進(jìn)步。特別是隨著摩爾定律的延續(xù),,從2012年至2017年,,處理數(shù)據(jù)所需的計(jì)算和存儲成本分別下降了56%和77%;同時(shí),,處理數(shù)據(jù)的性能相較2006年則提升了41倍,,如圖1所示。然而即便如此,,現(xiàn)如今只有不到1%的數(shù)據(jù)被有效的進(jìn)行了處理,、分析和利用。由此可見,,如何高效的以數(shù)據(jù)為中心進(jìn)行現(xiàn)有系統(tǒng)的優(yōu)化設(shè)計(jì),、升級和創(chuàng)新,擁有著巨大的市場潛力和前景,。
圖1:摩爾定律的延續(xù)帶來的數(shù)據(jù)處理性能的增長
在本次峰會上,,英特爾對其2022年的大數(shù)據(jù)相關(guān)的潛在市場規(guī)模(Total Addressable Market – TAM)做了自己的預(yù)測,,如下圖所示:
圖2:2022年英特爾大數(shù)據(jù)相關(guān)的潛在市場規(guī)模
英特爾的各類以數(shù)據(jù)為中心的業(yè)務(wù)部門主要包括四個(gè)子業(yè)務(wù)群:第一,傳統(tǒng)的數(shù)據(jù)中心業(yè)務(wù),,包括Xeon處理器,、網(wǎng)絡(luò)、連接等,;第二,,非易失性存儲業(yè)務(wù);第三,,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù),,包括各類人工智能相關(guān)的業(yè)務(wù)部門;第四,,F(xiàn)PGA業(yè)務(wù),。我在本文中將將其統(tǒng)一稱作“泛數(shù)據(jù)中心”集團(tuán)。至2022年,,泛數(shù)據(jù)中心集團(tuán)的潛在市場規(guī)模將超過2000億美元,,并由此成為英特爾歷史上最大的市場機(jī)遇。其中,,各個(gè)子業(yè)務(wù)群的市場規(guī)模分別為,,傳統(tǒng)數(shù)據(jù)中心業(yè)務(wù)超過900億美元、非易失性存儲業(yè)務(wù)750億美元,,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù)330億美元,,F(xiàn)PGA相關(guān)的業(yè)務(wù)也超過80億美元。
為此,,英特爾提出了“全棧式”的數(shù)據(jù)中心系統(tǒng)解決方案路線圖,,并由此打造以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),如下圖所示,。
圖3:英特爾全棧式數(shù)據(jù)中心解決方案
可以看到,,這個(gè)路線圖主要由“三駕馬車”進(jìn)行驅(qū)動(dòng),分別是傳輸,、存儲和計(jì)算,。值得注意的是,圖中在傳輸和計(jì)算的部分都明確標(biāo)出了FPGA的存在,。下文將進(jìn)一步分析FPGA在這兩個(gè)領(lǐng)域中所面臨的主要機(jī)遇和挑戰(zhàn),。
使用FPGA智能網(wǎng)
卡加速數(shù)據(jù)中心網(wǎng)絡(luò)
(1)數(shù)據(jù)中心網(wǎng)絡(luò)市場高速增長
在2022年,,F(xiàn)PGA的數(shù)據(jù)中心相關(guān)業(yè)務(wù)的潛在市場規(guī)模將達(dá)到80億美元,,較現(xiàn)在增長將超過30億美元,。就英特爾FPGA業(yè)務(wù)部(原Altera)而言,,其數(shù)據(jù)中心相關(guān)業(yè)務(wù)的年同比增長率在今年一季度達(dá)到了140%,,與高端FPGA器件相關(guān)的增幅達(dá)50%,而整體業(yè)務(wù)也有超過兩位數(shù)的增長,,見下圖所示,。
圖4:英特爾可編程業(yè)務(wù)部年增長率
FPGA的一個(gè)最主要的應(yīng)用領(lǐng)域就是對各類網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行并行化處理。這里的網(wǎng)絡(luò),,既包括傳統(tǒng)的有線通信網(wǎng)絡(luò),,也包括正在興起的5G無線網(wǎng)絡(luò),以及在數(shù)據(jù)中心里的各類網(wǎng)絡(luò)連接,。
?。?)FPGA智能網(wǎng)卡產(chǎn)品線發(fā)布
前文中提到,作為本次峰會的一大亮點(diǎn),,英特爾發(fā)布了全新的基于FPGA的智能網(wǎng)卡產(chǎn)品線,,以及其中的首款量產(chǎn)級產(chǎn)品,代號為“Cascade Glacier(冰川瀑布)”,。由此進(jìn)一步擴(kuò)充了英特爾的以太網(wǎng)硬件產(chǎn)品線,,形成了傳統(tǒng)網(wǎng)卡(ASIC)+智能網(wǎng)卡(FPGA)+網(wǎng)絡(luò)功能加速卡(FPGA)的完整產(chǎn)品組合,如下圖所示,。
圖5:英特爾數(shù)據(jù)中心以太網(wǎng)硬件產(chǎn)品線
這類智能網(wǎng)卡的產(chǎn)生背景是為了應(yīng)對數(shù)據(jù)中心網(wǎng)絡(luò)流量的爆炸性增長,。從下圖可以看到,全球數(shù)據(jù)中心的網(wǎng)絡(luò)流量將從2016年的6.8Z字節(jié)(1ZB等于10的12次方GB)暴增至2021年的20.6Z字節(jié),,年復(fù)合增長率約為25%,。同時(shí)值得注意的是,這其中大部分的網(wǎng)絡(luò)流量都是在數(shù)據(jù)中心內(nèi)部的,,因此如何優(yōu)化處理這類網(wǎng)絡(luò)流量就成了亟需解決的課題,。另外,在目前的通信及云服務(wù)提供商的數(shù)據(jù)中心里,,部分CPU核心被用來實(shí)現(xiàn)必須的存儲和網(wǎng)絡(luò)功能,,如針對虛擬化交換的OVS(Open Virtual Switch),以及針對I/O虛擬化的Virtio等等,,這樣使得寶貴的CPU資源被非用戶任務(wù)占用,,造成可用CPU資源的壓縮和緊張。為解決這些問題,,Cascade Glacier智能網(wǎng)卡由此產(chǎn)生,。
圖6:全球數(shù)據(jù)中心網(wǎng)絡(luò)流量增長率
如圖7所示,Cascade Glacier基于英特爾Arria10系列FPGA,,能為云數(shù)據(jù)中心的網(wǎng)絡(luò)流量提供2x25GbE的數(shù)據(jù)處理加速,。
圖7a:FPGA智能網(wǎng)卡Cascade Glacier
與傳統(tǒng)網(wǎng)卡以及現(xiàn)有的其他智能網(wǎng)卡相比,它提供了業(yè)界唯一的對Virtio協(xié)議的硬件支持和加速,使得云數(shù)據(jù)中心里的虛擬機(jī)可以進(jìn)行無縫的動(dòng)態(tài)遷移,,而不需要安裝額外的驅(qū)動(dòng),,極大的擴(kuò)展了數(shù)據(jù)中心的部署靈活性。另外,,它將原本在CPU上實(shí)現(xiàn)的OVS功能完全卸載到FPGA上實(shí)現(xiàn),,釋放了寶貴的CPU資源。另外,,它還提供了FPGA靈活的可編程以及低功耗的特點(diǎn),,方便在數(shù)據(jù)中心中大規(guī)模部署,以及對常用網(wǎng)絡(luò)功能進(jìn)行定制化加速,。作為英特爾獨(dú)立開發(fā)的量產(chǎn)級智能網(wǎng)卡產(chǎn)品,,Cascade Glacier會與英特爾”泛數(shù)據(jù)中心“架構(gòu)中的其他組成部分,如Xeon CPU,、存儲器,、AI協(xié)處理器和加速器等,進(jìn)行軟硬件深度整合,,從而提供完整的端到端的系統(tǒng)解決方案,。目前,Cascade Glacier已經(jīng)進(jìn)入了最后的批量裝配階段,,并預(yù)計(jì)將于2019年一季度正式出貨,。
圖7b:使用智能網(wǎng)卡進(jìn)行CPU功能卸載
Cascade Glacier可以算是英特爾針對云數(shù)據(jù)中心而設(shè)計(jì)開發(fā)的第一代基于FPGA的智能網(wǎng)卡量產(chǎn)產(chǎn)品,很好的解決了行業(yè)痛點(diǎn),,因此已經(jīng)吸引了很多大型云服務(wù)提供商的關(guān)注,。相信在不久的將來,會有更多關(guān)于這款產(chǎn)品的詳細(xì)信息和部署情況被正式公布,,屆時(shí)我會更深入的介紹關(guān)于Cascade Glacier的更多性能特點(diǎn),。