包括AMD,、ARM、華為(Huawei),、IBM,、Mellanox,、高通(Qualcomm)與賽靈思(Xilinx)等7家廠商近日宣布,將聯(lián)手針對(duì)伺服器加速器(server accelerators)聯(lián)手定義快取一致性互連架構(gòu)(cache-coherent interconnect),。
7家晶片供應(yīng)商近日宣布將聯(lián)手針對(duì)伺服器加速器(server accelerators)聯(lián)手定義快取一致性互連架構(gòu)(cache-coherent interconnect),,在云端運(yùn)算應(yīng)用領(lǐng)域提供英特爾(Intel)、Nvidia以外的替代方案,。此舉是橫跨ARM,、x86與Power架構(gòu)處理器的伺服器硬體架構(gòu)合作。
上述7家晶片廠商包括AMD,、ARM,、華為(Huawei)、IBM,、Mellanox、高通(Qualcomm)與賽靈思(Xilinx),,將聯(lián)手為定義伺服器加速器快取一致性互連(Cache Coherent Interconnect for Accelerators,,CCIX)規(guī)格;該聯(lián)盟預(yù)計(jì)在今年底公布規(guī)格草案,,但到目前為止并未公布任何關(guān)于此合作案的技術(shù)或財(cái)務(wù)細(xì)節(jié),。
英特爾在去年以167億美元收購(gòu)了可程式化邏輯元件供應(yīng)商Altera,有部分原因就是為了使用后者的FPGA做為Xeon伺服器處理器的加速器,;英特爾已經(jīng)開始推出在單一封裝中整合Altera之FPGA與其Xeon處理器的產(chǎn)品,。至于其他處理器供應(yīng)商則是分別與賽靈思接洽,試圖為其晶片建立快取一致性連結(jié),;于是Xilinx提出了定義適用所有處理器之單一連結(jié)的想法,。
從去年開始,,以加速器晶片來(lái)提高處理器性能的需求如野火般延燒整個(gè)運(yùn)算產(chǎn)業(yè),大部分來(lái)自于各家網(wǎng)路巨擘開始在眾多新興應(yīng)用領(lǐng)域如語(yǔ)音識(shí)別,、影像識(shí)別以及上下文搜尋等,,采用新一代的機(jī)器學(xué)習(xí)演算法。
Google在甫落幕的年度Google I/O大會(huì)上也宣布已經(jīng)自行開發(fā)加速器晶片(參考閱讀),,稱為張量處理單元(tensor processing unit,,TPU);應(yīng)用于相對(duì)速度較低且非一致性快取的PCI Express匯流排,。目前TPU已經(jīng)應(yīng)用于Google的資料中心處理各種任務(wù),,被視為該公司云端服務(wù)的差異化特色之一。
微軟(Microsoft)與百度(Baidu)也已經(jīng)在資料中心使用FPGA,,加速?gòu)乃褜ひ娴骄W(wǎng)路安全性等不斷增加的任務(wù)處理速度,;他們通常是在PCIe板卡上使用FPGA。而Nvidia今年稍早發(fā)表首款采用快取一致性連結(jié)介面NVLink的繪圖處理器Pascal,;該介面用以連結(jié)Nvidia的GPU以及采用IBM Power架構(gòu)的處理器,。
今年稍早,F(xiàn)acebook發(fā)表了以GPU為基礎(chǔ),、應(yīng)用于人工智慧任務(wù)的伺服器設(shè)計(jì),;而Google的一位頂尖工程師則于不久前透露(參考原文),該公司在資料中心采用越來(lái)越多數(shù)量的GPU,。
除了機(jī)器學(xué)習(xí),,上述的CCIX組織成員表示,將開發(fā)的介面會(huì)有助于加速器進(jìn)駐包括巨量資料分析,、網(wǎng)路處理等應(yīng)用,;特定功能加速器在協(xié)助通用處理器方面所扮演的角色重要性越來(lái)越顯著,因?yàn)楹笳呷粢s上摩爾定律的步伐(Moore’s law),,成本變得越來(lái)越高昂,。CCIX標(biāo)準(zhǔn)可望應(yīng)用于廣泛的加速器與伺服器處理器,但合作成員都尚未透露具體計(jì)畫,。
賽靈思表示該規(guī)格將應(yīng)用于16奈米制程FPGA,,但未提及產(chǎn)品何時(shí)上市;Mellanox則可能會(huì)在高階網(wǎng)路控制器以及收購(gòu)自EZChip的網(wǎng)路處理器都采用該規(guī)格,。而IBM在今年稍早展示的,、預(yù)計(jì)2017年問世之Power 9處理器電路圖(參考原文),其中的快取一致性介面應(yīng)該就是CCIX,。
高通與華為可能會(huì)在開發(fā)中的ARM架構(gòu)伺服器單晶片采用新介面,;AMD則應(yīng)該會(huì)在未來(lái)的ARM架構(gòu)與x86架構(gòu)伺服器處理器、還有Radeon繪圖處理器都采用CCIX,不過到目前為止AMD并未像是競(jìng)爭(zhēng)對(duì)手Nvidia那樣著重GPU加速器的市場(chǎng),。
CCIX會(huì)是開放性FPGA應(yīng)用程式介面的補(bǔ)充
CCIX組織尚未決定其介面規(guī)格將會(huì)采用免費(fèi)授權(quán)模式,,或是將之交由經(jīng)認(rèn)證的標(biāo)準(zhǔn)機(jī)構(gòu)來(lái)經(jīng)營(yíng);此外該組織也尚未透露任何關(guān)于介面頻寬,、資料傳輸速率或延遲等方面的技術(shù)目標(biāo),,僅表示相關(guān)參數(shù)至少都能與目前的其他替代方案媲美。
“我們將能與所有現(xiàn)存替代技術(shù)競(jìng)爭(zhēng),,在某些應(yīng)用案例中甚至表現(xiàn)可以更好,;”賽靈思架構(gòu)副總裁Gaurav Singh表示:“我們將有單一個(gè)跨越x86、Power與ARM架構(gòu)的一致性協(xié)議──這是以往從未有過的,?!?/p>
網(wǎng)路巨擘如Google正準(zhǔn)備探詢由英特爾x86架構(gòu)轉(zhuǎn)移至例如ARM或是Power架構(gòu)的可能性;今年稍早,,一位微軟工程師表示,,資料中心日益龐大的工作負(fù)載將迫使運(yùn)算架構(gòu)重新設(shè)計(jì),而有一部分焦點(diǎn)將集中在新種類的加速器,。
最近開放源碼軟體開發(fā)商Red Hat正在主導(dǎo)重整針對(duì)包括FPGA在內(nèi)之伺服器加速器軟體編程介面的支援,,對(duì)此Singh表示:“CCIX將與其行動(dòng)互補(bǔ);”他進(jìn)一步指出:“CCIX不會(huì)定義應(yīng)用程式介面(API),,那個(gè)部分將會(huì)由軟體業(yè)者來(lái)主導(dǎo),。CCIX會(huì)需要一些平臺(tái)軟體方面的改變來(lái)支援,但我們不預(yù)期會(huì)動(dòng)到作業(yè)系統(tǒng),?!?/p>
“我們將因?yàn)閾碛羞x擇性而獲益,有像是CCIX這樣的替代方案對(duì)產(chǎn)業(yè)界是好事,;”Red Hat負(fù)責(zé)上述針對(duì)加速器之開放性編程介面的Jon Masters表示,,CCIX提供了產(chǎn)業(yè)界需要的一些功能;是在英特爾的QPI以及IBM的CAPI (Coherent Accelerator Processor Interface)以外,,另一個(gè)很不錯(cuò)的替代技術(shù),。他指出在軟體部分,目標(biāo)是定義使用加速器的開放性軟體介面,,因此無(wú)論底層互連技術(shù)是QPI,、PCI Express、CAPI或CCIX等等,,都有免驅(qū)動(dòng)程式的編程環(huán)境。
CCIX成員有大量現(xiàn)有技術(shù)可利用,,例如ARM有一套一致性SoC互連,,AMD主導(dǎo)的異質(zhì)系統(tǒng)架構(gòu)基金會(huì)(Heterogeneous Systems Architecture Foundation)為手機(jī)處理器的CPU、GPU開發(fā)了快取一致性連結(jié),;此外IBM已經(jīng)在Power架構(gòu)晶片中使用一致性加速器處理器介面(即CAPI),。
市場(chǎng)研究機(jī)構(gòu)Moor Insights and Strategy的資深分析師Karl Freund認(rèn)為,,如果CCIX能順利推廣,潛在好處將會(huì)非常龐大,;不過他預(yù)期最終成果可能要到2019年甚至2020年才會(huì)看到,,因?yàn)樵撨B結(jié)介面得等到IBM的Power 9、AMD的Zen以及ARM的新一代處理器核心問世之后才會(huì)現(xiàn)身,。
而Freund也表示,,推動(dòng)CCIX的七家大廠還少了一家──Nvidia的缺席會(huì)在它們進(jìn)入運(yùn)算加速以及圍繞其軟體建立了有價(jià)值的生態(tài)系統(tǒng)時(shí)成為問題。