近日,,Nvidia召開了秋季GTC并發(fā)布了一系列新的芯片和硬件,。從GTC發(fā)布的產(chǎn)品來看,,我們認(rèn)為Nvidia最近一系列的動作都是在加強(qiáng)數(shù)據(jù)中心服務(wù)器市場的布局,。雖然Nvidia占據(jù)了人工智能加數(shù)據(jù)中心的風(fēng)口,,但是我們?nèi)匀徽J(rèn)為Nvidia在打入數(shù)據(jù)中心的道路上有不少挑戰(zhàn)需要克服,。
Nvidia在數(shù)據(jù)中心的新產(chǎn)品:DPU
在GTC上,,Nvidia著重介紹的一個產(chǎn)品是它在數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域的新產(chǎn)品:Data Processing Unit(數(shù)據(jù)處理器,,DPU),。DPU把ARM處理器核,、VLIW矢量計算引擎和智能網(wǎng)卡的功能集成在了一起,主要應(yīng)用在分布式存儲,、網(wǎng)絡(luò)計算和網(wǎng)絡(luò)安全領(lǐng)域,。
在數(shù)據(jù)中心的分布式計算中,存儲和網(wǎng)絡(luò)都需要大量的處理器資源,。對于存儲,,在數(shù)據(jù)中心中大量存儲是分布式的,每個服務(wù)器可以訪問的存儲空間遠(yuǎn)遠(yuǎn)不僅限于本地的硬盤,,這一方面大大增加了分布式存儲的靈活性,,但是另一方面這類分布式數(shù)據(jù)存儲系統(tǒng)的訪問會需要額外的軟件處理來完成,而傳統(tǒng)上這類分布式存儲的軟件處理會使用CPU來完成,。
除了分布式存儲之外,,數(shù)據(jù)中心服務(wù)器之間的網(wǎng)絡(luò)互聯(lián)也有一套底層軟件系統(tǒng),這套軟件需要能完成網(wǎng)絡(luò)互聯(lián)協(xié)議,,除此之外還需要能跑一套數(shù)據(jù)中心必備的網(wǎng)絡(luò)安全系統(tǒng),。傳統(tǒng)上,這些處理也會跑在CPU上,而隨著智能網(wǎng)卡(SmartNIC)的逐漸普及,,智能網(wǎng)卡正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議處理方面緩慢地取代CPU,。
Nvidia的DPU事實上可以看做是SmartNIC的增強(qiáng)版本,一方面加強(qiáng)了SmartNIC對于網(wǎng)絡(luò)協(xié)議和網(wǎng)絡(luò)安全的處理能力,,另一方面整合并加強(qiáng)了分布式存儲的處理能力,,從而讓DPU能在這兩個領(lǐng)域更多地替代CPU。
事實上,,Nvidia這次著重介紹的DPU是由它于近年收購的Mellanox內(nèi)部孵化的,。該產(chǎn)品最初的定位就是增強(qiáng)型智能網(wǎng)卡,其第一代產(chǎn)品BlueShield 1已經(jīng)于去年發(fā)布了,,只是由于是試水產(chǎn)品因此比較低調(diào),。Nvidia內(nèi)部應(yīng)該是看到了數(shù)據(jù)中心中網(wǎng)絡(luò)和存儲相關(guān)處理的機(jī)會,因此給第二代BlueShield項目傾注了更多資源,,同時也提出了DPU的概念,。Nvidia這樣的操作有點像20多年前由它提出的GPU——在Nvidia提出GPU之前,大多數(shù)公司對于同類產(chǎn)品的概念一直是顯示加速卡,,而Nvidia認(rèn)為顯示卡不僅僅是一種附屬于CPU的顯示加速,,而且在計算機(jī)系統(tǒng)中能擔(dān)負(fù)起和CPU接近甚至更重要任務(wù),因此提出了GPU的概念,。這次Nvidia提出DPU這個新概念,,可以看出Nvidia對于網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域的重視。而在未來,,Nvidia計劃繼續(xù)推進(jìn)BlueShield DPU產(chǎn)品線,,一方面增強(qiáng)其網(wǎng)絡(luò)互連處理能力,另一方面還計劃加強(qiáng)其AI處理能力,,從另一個維度增加產(chǎn)品的功能性,。
DPU+ARM是Nvidia替代中低端x86的切入點
自從Nvidia開始收購ARM之后,我們看到Nvidia已經(jīng)在多個場合顯示了其利用ARM處理器進(jìn)一步占領(lǐng)數(shù)據(jù)中心服務(wù)器市場的決心,,而DPU則是Nvidia最新的一個布局,。
回顧Nvidia在數(shù)據(jù)中心市場的策略,最初Nvidia的立足點在于其在人工智能領(lǐng)域無與倫比的優(yōu)勢,,其GPU配合CUDA生態(tài)成功地抓住了數(shù)據(jù)中心最大的增量市場,,即人工智能計算。
而在此之后,,Nvidia顯然已經(jīng)不滿足于抓住增量市場,,更希望能切入數(shù)據(jù)中心的存量市場,即設(shè)法用自己的芯片產(chǎn)品去取代Intel(以及AMD)主導(dǎo)的x86 CPU,。目前,,唯一能與x86 CPU性能和生態(tài)屬于同一數(shù)量級的唯有ARM,,而這也是Nvidia決定收購ARM的重要原因。一旦Nvidia正式完成收購ARM,,那么集成了ARM核的DPU將成為Nvidia打入數(shù)據(jù)中心存量市場取代x86 CPU的第一個切入點。如前所述,,傳統(tǒng)上會使用低端x86處理器來完成數(shù)據(jù)中心中網(wǎng)絡(luò)協(xié)議處理,、網(wǎng)絡(luò)安全和存儲控制等任務(wù),而使用DPU之后,,就不再需要再使用CPU來處理這些任務(wù)了,。從另一個角度來看,事實上就是Nvidia的DPU在數(shù)據(jù)中心的網(wǎng)絡(luò)協(xié)議處理,、網(wǎng)絡(luò)安全和存儲控制市場取代了低端x86 CPU,。
事實上,Nvidia選擇使用DPU來打這個市場,,而不是推出ARM核直接和低端x86 CPU競爭是一個明智之舉,。首先,智能網(wǎng)卡和智能存儲領(lǐng)域CPU逐漸被取代是大勢所趨,,Nvidia在這個領(lǐng)域同時也有Mellanox的技術(shù)積累,,可以說是順勢而為。此外,,DPU在網(wǎng)絡(luò)和存儲領(lǐng)域從概念上來說是CPU的下一代產(chǎn)品,,所以說雖然DPU中的ARM核性能未必比同一代對標(biāo)的低端x86 CPU更強(qiáng),但是整體來說由于在DPU SoC上集成了專用的處理加速模塊,,因此總體性能一定是超過x86 CPU的,。因此,Nvidia雖然第一步想要取代的是低端x86 CPU,,但是其推出的對標(biāo)產(chǎn)品并不低端,,這從市場定位上來說也很討巧。
Nvidia在中高端數(shù)據(jù)中心處理器市場仍然面臨挑戰(zhàn)
DPU為Nvidia替代低端x86 CPU打開了道路,,但是在中高端數(shù)據(jù)中心處理器市場,,Nvidia如何把握市場仍然是一個未知數(shù),也面臨不少挑戰(zhàn),。
首先,,在中高端市場,目前Nvidia的GPU和x86處理器是標(biāo)準(zhǔn)配置,,或者說Nvidia的產(chǎn)品和x86處理器仍然處于互補的關(guān)系,。如果想要完全吃下高端市場,即使用Nvidia的GPU加Nvidia基于ARM架構(gòu)的處理器做高端服務(wù)器,,目前來看還需要在ARM處理器的性能上更進(jìn)一步,。我們知道,,ARM基于RISC的架構(gòu)能占領(lǐng)移動市場主要是依靠能效比,而在服務(wù)器市場,,尤其是高端服務(wù)器市場,,能效比的重要程度較弱,主要還是需要看性能,。從技術(shù)上來說,,Intel和AMD在高性能服務(wù)器處理器領(lǐng)域一直是領(lǐng)導(dǎo)者,也有數(shù)十年的經(jīng)驗積累,,而ARM架構(gòu)做高性能處理器的時間并不久,,而直到今天基于ARM架構(gòu)尚沒有公開發(fā)售且成功的服務(wù)器端高性能處理器。當(dāng)然,,隨著未來人工智能重要性提升,,或許在一些應(yīng)用場景GPU比起CPU來說要更重要,Nvidia因此可以推出圍繞人工智能的GPU+ARM處理器中高端服務(wù)器產(chǎn)品,,但是這樣的搭配能實現(xiàn)多高的性能尚不清楚,,而且很明顯如果ARM處理器的性能相比x86越弱,那么這樣組合的服務(wù)器的使用場景就越狹窄,。
除此之外,,Nvidia在中高端數(shù)據(jù)中心處理器可能遇到的另一個挑戰(zhàn)是客戶自研芯片。亞馬遜為AWS已經(jīng)發(fā)布了基于ARM核的自研處理器Graviton,。云提供商對于自身的需求最清楚,,因此自研芯片非常合乎情理,而且有機(jī)會能為自身的云服務(wù)提供差異化競爭的能力,。如果谷歌等其它云服務(wù)商也跟進(jìn)使用ARM架構(gòu)自研芯片,,那么這些云廠商就會成為Nvidia的客戶同時也是競爭對手。Nvidia如何在客戶自研芯片和x86之間找到一個中高端服務(wù)器處理器的切入點,,我們還需拭目以待,。