近日,,Nvidia召開了秋季GTC并發(fā)布了一系列新的芯片和硬件,。從GTC發(fā)布的產品來看,我們認為Nvidia最近一系列的動作都是在加強數(shù)據(jù)中心服務器市場的布局,。雖然Nvidia占據(jù)了人工智能加數(shù)據(jù)中心的風口,但是我們仍然認為Nvidia在打入數(shù)據(jù)中心的道路上有不少挑戰(zhàn)需要克服,。
Nvidia在數(shù)據(jù)中心的新產品:DPU
在GTC上,,Nvidia著重介紹的一個產品是它在數(shù)據(jù)中心網(wǎng)絡領域的新產品:Data Processing Unit(數(shù)據(jù)處理器,DPU),。DPU把ARM處理器核,、VLIW矢量計算引擎和智能網(wǎng)卡的功能集成在了一起,主要應用在分布式存儲,、網(wǎng)絡計算和網(wǎng)絡安全領域,。
在數(shù)據(jù)中心的分布式計算中,存儲和網(wǎng)絡都需要大量的處理器資源,。對于存儲,,在數(shù)據(jù)中心中大量存儲是分布式的,,每個服務器可以訪問的存儲空間遠遠不僅限于本地的硬盤,這一方面大大增加了分布式存儲的靈活性,,但是另一方面這類分布式數(shù)據(jù)存儲系統(tǒng)的訪問會需要額外的軟件處理來完成,,而傳統(tǒng)上這類分布式存儲的軟件處理會使用CPU來完成。
除了分布式存儲之外,,數(shù)據(jù)中心服務器之間的網(wǎng)絡互聯(lián)也有一套底層軟件系統(tǒng),,這套軟件需要能完成網(wǎng)絡互聯(lián)協(xié)議,除此之外還需要能跑一套數(shù)據(jù)中心必備的網(wǎng)絡安全系統(tǒng),。傳統(tǒng)上,,這些處理也會跑在CPU上,而隨著智能網(wǎng)卡(SmartNIC)的逐漸普及,,智能網(wǎng)卡正在網(wǎng)絡安全和網(wǎng)絡協(xié)議處理方面緩慢地取代CPU,。
Nvidia的DPU事實上可以看做是SmartNIC的增強版本,一方面加強了SmartNIC對于網(wǎng)絡協(xié)議和網(wǎng)絡安全的處理能力,,另一方面整合并加強了分布式存儲的處理能力,,從而讓DPU能在這兩個領域更多地替代CPU。
事實上,,Nvidia這次著重介紹的DPU是由它于近年收購的Mellanox內部孵化的,。該產品最初的定位就是增強型智能網(wǎng)卡,其第一代產品BlueShield 1已經(jīng)于去年發(fā)布了,,只是由于是試水產品因此比較低調,。Nvidia內部應該是看到了數(shù)據(jù)中心中網(wǎng)絡和存儲相關處理的機會,因此給第二代BlueShield項目傾注了更多資源,,同時也提出了DPU的概念,。Nvidia這樣的操作有點像20多年前由它提出的GPU——在Nvidia提出GPU之前,大多數(shù)公司對于同類產品的概念一直是顯示加速卡,,而Nvidia認為顯示卡不僅僅是一種附屬于CPU的顯示加速,,而且在計算機系統(tǒng)中能擔負起和CPU接近甚至更重要任務,因此提出了GPU的概念,。這次Nvidia提出DPU這個新概念,,可以看出Nvidia對于網(wǎng)絡數(shù)據(jù)處理領域的重視。而在未來,,Nvidia計劃繼續(xù)推進BlueShield DPU產品線,,一方面增強其網(wǎng)絡互連處理能力,另一方面還計劃加強其AI處理能力,,從另一個維度增加產品的功能性,。
DPU+ARM是Nvidia替代中低端x86的切入點
自從Nvidia開始收購ARM之后,我們看到Nvidia已經(jīng)在多個場合顯示了其利用ARM處理器進一步占領數(shù)據(jù)中心服務器市場的決心,而DPU則是Nvidia最新的一個布局,。
回顧Nvidia在數(shù)據(jù)中心市場的策略,,最初Nvidia的立足點在于其在人工智能領域無與倫比的優(yōu)勢,其GPU配合CUDA生態(tài)成功地抓住了數(shù)據(jù)中心最大的增量市場,,即人工智能計算,。
而在此之后,Nvidia顯然已經(jīng)不滿足于抓住增量市場,,更希望能切入數(shù)據(jù)中心的存量市場,,即設法用自己的芯片產品去取代Intel(以及AMD)主導的x86 CPU。目前,,唯一能與x86 CPU性能和生態(tài)屬于同一數(shù)量級的唯有ARM,,而這也是Nvidia決定收購ARM的重要原因。一旦Nvidia正式完成收購ARM,,那么集成了ARM核的DPU將成為Nvidia打入數(shù)據(jù)中心存量市場取代x86 CPU的第一個切入點,。如前所述,傳統(tǒng)上會使用低端x86處理器來完成數(shù)據(jù)中心中網(wǎng)絡協(xié)議處理,、網(wǎng)絡安全和存儲控制等任務,,而使用DPU之后,就不再需要再使用CPU來處理這些任務了,。從另一個角度來看,,事實上就是Nvidia的DPU在數(shù)據(jù)中心的網(wǎng)絡協(xié)議處理、網(wǎng)絡安全和存儲控制市場取代了低端x86 CPU,。
事實上,,Nvidia選擇使用DPU來打這個市場,而不是推出ARM核直接和低端x86 CPU競爭是一個明智之舉,。首先,,智能網(wǎng)卡和智能存儲領域CPU逐漸被取代是大勢所趨,,Nvidia在這個領域同時也有Mellanox的技術積累,,可以說是順勢而為。此外,,DPU在網(wǎng)絡和存儲領域從概念上來說是CPU的下一代產品,,所以說雖然DPU中的ARM核性能未必比同一代對標的低端x86 CPU更強,但是整體來說由于在DPU SoC上集成了專用的處理加速模塊,,因此總體性能一定是超過x86 CPU的,。因此,Nvidia雖然第一步想要取代的是低端x86 CPU,,但是其推出的對標產品并不低端,,這從市場定位上來說也很討巧。
Nvidia在中高端數(shù)據(jù)中心處理器市場仍然面臨挑戰(zhàn)
DPU為Nvidia替代低端x86 CPU打開了道路,,但是在中高端數(shù)據(jù)中心處理器市場,,Nvidia如何把握市場仍然是一個未知數(shù),,也面臨不少挑戰(zhàn)。
首先,,在中高端市場,,目前Nvidia的GPU和x86處理器是標準配置,或者說Nvidia的產品和x86處理器仍然處于互補的關系,。如果想要完全吃下高端市場,,即使用Nvidia的GPU加Nvidia基于ARM架構的處理器做高端服務器,目前來看還需要在ARM處理器的性能上更進一步,。我們知道,,ARM基于RISC的架構能占領移動市場主要是依靠能效比,而在服務器市場,,尤其是高端服務器市場,,能效比的重要程度較弱,主要還是需要看性能,。從技術上來說,,Intel和AMD在高性能服務器處理器領域一直是領導者,也有數(shù)十年的經(jīng)驗積累,,而ARM架構做高性能處理器的時間并不久,,而直到今天基于ARM架構尚沒有公開發(fā)售且成功的服務器端高性能處理器。當然,,隨著未來人工智能重要性提升,,或許在一些應用場景GPU比起CPU來說要更重要,Nvidia因此可以推出圍繞人工智能的GPU+ARM處理器中高端服務器產品,,但是這樣的搭配能實現(xiàn)多高的性能尚不清楚,,而且很明顯如果ARM處理器的性能相比x86越弱,那么這樣組合的服務器的使用場景就越狹窄,。
除此之外,,Nvidia在中高端數(shù)據(jù)中心處理器可能遇到的另一個挑戰(zhàn)是客戶自研芯片。亞馬遜為AWS已經(jīng)發(fā)布了基于ARM核的自研處理器Graviton,。云提供商對于自身的需求最清楚,,因此自研芯片非常合乎情理,而且有機會能為自身的云服務提供差異化競爭的能力,。如果谷歌等其它云服務商也跟進使用ARM架構自研芯片,,那么這些云廠商就會成為Nvidia的客戶同時也是競爭對手。Nvidia如何在客戶自研芯片和x86之間找到一個中高端服務器處理器的切入點,,我們還需拭目以待,。