曾經(jīng),,作為電腦的大腦,計算機需要CPU,。計算機內存儲的數(shù)據(jù),、外圍的設備和其他組建要么將數(shù)據(jù)輸入CPU,要么接受CPU的指令,。
后來,,為了減輕CPU的壓力,,GPU應運而生。雖然GPU的出現(xiàn)是為了減輕CPU在圖像處理方面的壓力,,但是由于其優(yōu)秀的并行處理能力,,如今GPU不局限于圖像渲染,還應用于人工智能,、深度學習,、大數(shù)據(jù)分析等領域。
到了現(xiàn)在,,隨著核心網(wǎng),、匯聚網(wǎng)朝著100G、200G發(fā)展,,接入網(wǎng)也達到50G,、100G,CPU無法提供足夠的算力來處理數(shù)據(jù)包,。因此,,出現(xiàn)了“性能帶寬增速比失調”的問題。AWS形象地稱之為“數(shù)據(jù)中心稅”——還未運行業(yè)務程序,,接入網(wǎng)絡數(shù)據(jù)就要占去許多計算資源,。
舉一個例子,在云計算場景下,,虛擬機之間的數(shù)據(jù)轉發(fā),,通常而言20個VM需要消耗的算力,如果用Xeon的多核CPU來處理大概需要5個核的算力,,這是將一筆比很大的開銷,。
阿里云彈性計算產(chǎn)品線負責人張獻濤曾經(jīng)算了一筆賬,阿里云營收規(guī)模已經(jīng)達到上百億元,,如果存儲,、網(wǎng)絡占用約10%的CPU資源,則意味著年損失10多億元,。
因此,,為了繼續(xù)減輕CPU的負擔,DPU登上舞臺,。對于CPU處理效率低下同時GPU也處理不了的負載,,就可以卸載到專用的DPU進行處理。
DPU的概念是由英偉達帶火的,。在2020年上半年,,英偉達以69億美元的對價收購以色列網(wǎng)絡芯片公司 Mellanox Technologies,并與同年推出BlueField-2 DPU,,從此拉開了DPU發(fā)展的序幕,。
英偉達首席執(zhí)行官黃仁勛表示:“DPU將是未來計算的三大支柱之一,。CPU用于通用計算、GPU用于加速計算,,而DPU在數(shù)據(jù)中心移動數(shù)據(jù),,進行數(shù)據(jù)處理?!?/p>
DPU競爭開始
DPU最早落地的領域是云計算,,很多云服務商早就意識到了問題,AWS從2015年就已經(jīng)探索DPU的發(fā)展,,收購芯片廠商Annapurna Labs,,推出Nitro芯片。雖然當時還沒有“DPU”這一名字,,但Nitro被公認為是DPU的早期形態(tài),。之后,2017年AWS正式推出了Nitro,,將網(wǎng)絡,、存儲和安全任務卸載到基于Arm架構的專用設備上。
同樣是2017年,,為了解決隨著云計算業(yè)務規(guī)模的擴大,,資源爭搶、算力損失的問題,,阿里云推出了神龍(X-Dragon),,通過虛擬化來達到轉接CPU存儲、網(wǎng)絡等基礎功能的目的,。很快,,阿里云就把天貓雙十一當做試驗場并成功運營,后來上汽成了第一家神龍架構的試驗客戶,。
回看過去,,我們可以將2017這一年稱之為DPU元年。
三年后英偉達將其命名為DPU之后,,才有了一個統(tǒng)一的叫法,。目前來看,真正實現(xiàn)大規(guī)模商用DPU架構的,,全球只有兩家:亞馬遜的AWS,,以及阿里云,。
而云服務商中,,不止亞馬遜與阿里云布局DPU,同樣看中云服務的騰訊云也加入了DPU的研發(fā),。以統(tǒng)一算力底座,,降低總體成本為目的,,騰訊自研了水杉和銀杉兩代DPU。目前,,騰訊自研DPU已經(jīng)支撐公有云外部客戶,,以及微信、QQ,、騰訊會議等自研業(yè)務上云,。
去年加入云計算的新成員字節(jié)跳動也宣布將自研DPU,計劃通過火山引擎云產(chǎn)品的方式對外服務,。
在云廠商的來勢洶洶下,,芯片廠商也并非無動于衷。
當初帶火DPU的英偉達,,自然對DPU有所部署,。英偉達計劃在2022年推出性能更強的BlueField3;到2022年,,英偉達計劃推出第三代DPU,;2024年推出集成其GPU模塊的BlueField4。
Marvell最新推出的OCTEON 10系列DPU,,采用了Armv9架構的Neoverse N2 CPU內核和臺積電5nm制程工藝,,支持最新的PCIe 5.0 I/O與DDR5內存。作為DPU的重要補充,,Marvell還為OCTEON 10引入了內部機器學習(ML)引擎,。這樣,從本質上講,,Marvell正在成為英偉達的直接競爭對手,。
英特爾也參與戰(zhàn)局,在2021年6月發(fā)布首款IPU產(chǎn)品,,將其視為云戰(zhàn)略的重要支柱之一,,助力數(shù)據(jù)中心網(wǎng)絡加速走向可編程的分布式架構。2022年4月,,英特爾公布收購云解決方案公司Granulate的協(xié)議,,以提升自身在云計算系統(tǒng)的綜合協(xié)調性;2022年5月,,英特爾發(fā)布第二代IPU,,并公布將在2023—2024年間上線第三代IPU的消息?;诙说蕉丝删幊棠芰?,英特爾不斷在“云端”實現(xiàn)高效運算,解鎖數(shù)據(jù)中心基礎設施的新潛力。
國內DPU初創(chuàng)企業(yè)
DPU的賽道上也逐漸出現(xiàn)了中國企業(yè)的身影,,并且隨著DPU風口的漸起成功融到資金,。目前來說,國內比較受到關注的DPU初創(chuàng)企業(yè)包括:云豹智能,、中科馭數(shù),、芯啟源、云脈芯聯(lián),、星云智聯(lián),、大禹智芯。
今年6月,,大禹智芯宣布完成A輪融資,,融資金額未公布,該輪融資由前海方舟旗下的智慧互聯(lián)產(chǎn)業(yè)基金,、中原前?;鸷妄R魯前海基金共同投資,,融資資金將用于產(chǎn)品研發(fā)和推廣,。
云豹智能同樣在6月完成了B輪融資,據(jù)悉本輪云豹投后估值約90 億元,,而本輪投資方包括騰訊,、淡馬錫、深創(chuàng)投,、華西村股份旗下投資平臺一村資本,、民生銀行上市金融控股平臺民銀資本、耀途資本,,這是騰訊第3 次投資這家成立不到 2 年的 DPU 公司,。
9月,中科馭數(shù)宣布完成超以往輪次融資規(guī)模的數(shù)億元B輪融資,,由金融街資本領投,,建設銀行旗下建信股權跟投,老股東靈均投資,、光環(huán)資本,、泉宗資本連續(xù)三輪追投。
芯啟源在去年11月完成數(shù)億元的Pre-A4 輪融資后,,今年3月宣布再獲超億元戰(zhàn)略投資,,本輪融資由國家集成電路產(chǎn)業(yè)基金旗下子基金上海超越摩爾領投,老股東允泰資本繼續(xù)堅定跟投,。
可以看到,,在DPU的熱潮下,,不少初創(chuàng)企業(yè)紛紛拿到巨額融資。但作為數(shù)據(jù)處理的一大將,,DPU需要與CPU,、GPU同量級的投入,,可是市場規(guī)模遠不如CPU,、GPU。據(jù)統(tǒng)計,,2021年全球DPU市場規(guī)模達到50.7億美元,,CPU市場規(guī)模則可達532億美元,這其中是10倍的差距,。
有業(yè)內人士做過一個估算,,在終端場景,大芯片的銷量至少需要達到數(shù)千萬級別才能有效攤薄一次性的研發(fā)成本,;在數(shù)據(jù)中心場景,,則需要50萬甚至100萬以上的銷量,才能有效攤薄研發(fā)成本,。
根據(jù)海外做 DPU 的初創(chuàng)公司如 Fungible 和 Pensando 等需要的資深開發(fā)人員規(guī)模,、研發(fā)時間、需要購買的 IP 和測試工具以及這些公司融到的資金去估算,,開發(fā)這樣復雜的高端通用的 DPU 芯片大概需要 3 億美元以上的成本,,才能實現(xiàn)客戶量產(chǎn)。
這注定了DPU不可能是一個簡單的創(chuàng)業(yè)“游戲”,。
DeepTech曾經(jīng)總結了打造一個成功的 DPU 芯片企業(yè),,至少需要兼具的六大條件:一是具備高端芯片開發(fā)經(jīng)驗;二是要有大量商業(yè)落地的經(jīng)驗,;三是有成功創(chuàng)業(yè)經(jīng)驗的團隊,;四是對云計算客戶業(yè)務非常熟悉;五是與云計算大廠客戶緊密合作,,有豐富的場景實戰(zhàn)經(jīng)驗,;六是必須要巨額融資。
創(chuàng)始人經(jīng)歷來看,,不少初創(chuàng)公司或缺乏高端芯片開發(fā)經(jīng)驗,,或缺乏頭部云服務商合作的經(jīng)驗等,是否能走到最后還是一個問號,。
云豹智能創(chuàng)始人蕭啟陽,,博士畢業(yè)于美國斯坦福大學,后續(xù)在硅谷創(chuàng)辦 RMI 公司,;中科馭數(shù)創(chuàng)始人鄢貴海是中科院背景,;芯啟源,,創(chuàng)始人盧笙有銷售 USB 和 TCAM 芯片的背景;大禹智芯創(chuàng)始人李爽是前美團公有云的負責人,,對云業(yè)務有一定的認識,,這四家家公司創(chuàng)始人都有相關背景。
云脈芯聯(lián),、星云智聯(lián)等企業(yè)的創(chuàng)始人在公開資料中,,并沒有開發(fā)高端芯片和創(chuàng)業(yè)的經(jīng)驗。云脈芯聯(lián)創(chuàng)始人劉永鋒是技術出身,,曾在阿里和華為工作過,,在公開信息沒有查到其創(chuàng)始人有開發(fā)高端芯片和創(chuàng)業(yè)的經(jīng)驗;星云智聯(lián),,兩位創(chuàng)始人是夏廬生和于勇,。夏廬生曾擔任安信證券研究中心通信行業(yè)首席分析師,公開信息查不到于勇在芯片行業(yè)的背景,。
即使強如英偉達,,其DPU發(fā)布兩年左右,使用的人數(shù)也尚且不多,,更何況是本就在芯片方面發(fā)展相對欠缺的中國芯片初創(chuàng)企業(yè),。目前能夠拿出成績的僅有中科馭數(shù)、云豹智能兩家企業(yè),。
成立僅一年后,,中科馭數(shù)第一顆芯片就已成功完成流片,并取得了業(yè)界數(shù)據(jù)庫與時序數(shù)據(jù)處理融合加速芯片零的突破,。中科馭數(shù)的第三代DPU芯片的研發(fā)迭代也已經(jīng)接近尾聲,。中科馭數(shù)第二代DPU芯片K2已于今年年初投片,預計在10月回片,。
云豹的第一款 DPU SoC(系統(tǒng)級芯片)正在開發(fā)階段,,計劃于明年量產(chǎn)。去年底云豹已發(fā)布基于 FPGA 版本的 DPU 云霄,。
與 CPU,、GPU 等一樣,DPU 結構復雜,、開發(fā)周期長,、投入大。起步于2020 年和 2021 年的中國DPU初創(chuàng)企業(yè),,算上前期團隊組建時間,,開發(fā)周期也僅在 1 年左右,何時能出現(xiàn)量產(chǎn)的產(chǎn)品是市場都在期待的,。
總結
實際上,,梳理中國DPU行業(yè)商業(yè)模式后,,能將其分為兩種。
一種是以芯啟源為代表的,,通過自研中高級軟件,、外購處理器和網(wǎng)絡芯片的方式,這類方式門檻適中,,DPU產(chǎn)線核心研發(fā)團隊需至少10人,,預判在5至8年收回前期成本。
另一種是以中科馭數(shù)和云豹為代表的,,自研處理器微架構和中高級軟件,,外購網(wǎng)絡芯片的方式,,這類方式門檻較高,,DPU產(chǎn)線核心研發(fā)團隊需具備至少40人。
DPU沒有統(tǒng)一的標準,、需要與云計算基礎設施緊密綁定,、產(chǎn)品的通用性問題、沒有明確的大客戶,,這些都是DPU創(chuàng)業(yè)會遇到的問題,。
目前要解決DPU標準化應用,還存在一定挑戰(zhàn),。由于數(shù)據(jù)中心本身的復雜性,,各大廠商一方面采用商用現(xiàn)貨組件(即COTS)來構建系統(tǒng),追求低成本,,一方面又設法分層服務化,,打造面向不用類型客戶的標準化產(chǎn)品,但除此之外的所有技術實現(xiàn)幾乎都是“八仙過海,,各顯神通,。”
中科馭數(shù)創(chuàng)始人鄢貴海也表示:“有的廠商強化IO能力,、有的關注路由轉發(fā),、有的重視存儲卸載、有的關注安全加密,,不一而足,。”而上層負載不同,,也必然對底層架構有各異的需求,,這也許是目前DPU標準化面臨的最大挑戰(zhàn)。
更多信息可以來這里獲取==>>電子技術應用-AET<<