本文作者: 米樂
本文來源:半導(dǎo)體產(chǎn)業(yè)縱橫
原文鏈接:https://mp.weixin.qq.com/s/I86D8zWpPQIMSgqEc5DKig
日前,,華為輪值董事長胡厚崑說道,科技革命經(jīng)過了數(shù)次浪潮,,從互聯(lián)網(wǎng)到移動(dòng)化到云計(jì)算,、到人工智能,,每一輪的變革都給社會(huì)帶來了深遠(yuǎn)的影響。毫無疑問,,今天通用人工智能(AI)正給我們無窮的想象空間,,也正帶領(lǐng)我們走進(jìn)下一個(gè)黃金十年。
當(dāng)前,,人工智能,、大數(shù)據(jù)應(yīng)用進(jìn)入快速發(fā)展階段,自動(dòng)駕駛,、機(jī)器人,、AR/VR、元宇宙等應(yīng)用加速落地,,傳統(tǒng)數(shù)字基礎(chǔ)設(shè)施難以滿足大模型,、多模態(tài)等新型技術(shù)發(fā)展,擁有強(qiáng)大集群算力的新型數(shù)據(jù)中心成為突破人工智能發(fā)展瓶頸的重要基礎(chǔ),。
DPU作為突破數(shù)據(jù)流量指數(shù)級(jí)增長帶來的性能瓶頸的關(guān)鍵技術(shù),,通過算力卸載、算力釋放和算力拓展,,釋放CPU的計(jì)算資源,,實(shí)現(xiàn)任務(wù)加速處理,提升整體計(jì)算效率,,達(dá)到降本增效,,產(chǎn)業(yè)賦能價(jià)值凸顯。因此,,也成為構(gòu)建新型算力基礎(chǔ)設(shè)施的重要基礎(chǔ)部件和下一代芯片技術(shù)競(jìng)爭的高地,。
DPU也被預(yù)測(cè)為2023年的十大科技趨勢(shì)之一,這份“洪荒之力”發(fā)展的如何呢,?
01
“新貴”是怎樣練成的
有人說,,DPU 將成為未來計(jì)算的三大支柱之一,未來的數(shù)據(jù)中心標(biāo)配是:CPU + DPU + GPU ,。
DPU 最直接的作用是作為 CPU 的卸載(offload)引擎,,其效果是給 CPU“減負(fù)”。《DPU技術(shù)白皮書》主編,、中國科學(xué)院計(jì)算所研究員鄢貴海作了一個(gè)形象比喻,,說DPU 提供了數(shù)據(jù)中心一把“殺雞”的工具,節(jié)省的是 CPU 這把“牛刀”,,以釋放 CPU 算力,,留給更需要它的業(yè)務(wù)負(fù)載。這個(gè)比喻也形象地說明了DPU這個(gè)新貴的定位,。
DPU 通過執(zhí)行以下主要功能為現(xiàn)代數(shù)據(jù)中心帶來許多好處:
一,、提高處理能力: DPU 減輕 CPU 的網(wǎng)絡(luò)和通信工作負(fù)載,從而釋放資源用于應(yīng)用程序處理,。
二,、提高效率和性能: 通過將處理核心與硬件加速器塊相結(jié)合來大規(guī)模處理以數(shù)據(jù)為中心的工作負(fù)載,DPU 可以提高性能并減少延遲,。
三,、處理復(fù)雜任務(wù)的能力: DPU 旨在處理大型數(shù)據(jù)中心中的數(shù)據(jù)密集型工作負(fù)載,支持云環(huán)境或驅(qū)動(dòng)人工智能,、深度學(xué)習(xí)算法和其他數(shù)據(jù)密集型應(yīng)用的超級(jí)計(jì)算機(jī),。
四、能夠滿足數(shù)據(jù)中心不斷增長的需求: 隨著數(shù)據(jù)中心需求的增長和變得更加密集,,DPU 可以進(jìn)行擴(kuò)展,,以適應(yīng)數(shù)量和復(fù)雜性不斷增加的工作負(fù)載。此外,,DPU 可以添加到現(xiàn)有的硬件基礎(chǔ)設(shè)施中,,從而實(shí)現(xiàn)靈活且適應(yīng)性強(qiáng)的數(shù)據(jù)中心架構(gòu)。
五,、提高可靠性和可用性: DPU 可以通過冗余和高可用性等功能提供更高的可靠性,,確保在發(fā)生硬件故障時(shí)關(guān)鍵數(shù)據(jù)處理任務(wù)的連續(xù)性。
六,、降低成本: DPU 可以通過從 CPU 卸載處理任務(wù)并處理復(fù)雜任務(wù)來降低與管理數(shù)據(jù)中心相關(guān)的總體硬件成本,,從而需要更少的硬件組件。
DPU,、CPU 和 GPU 之間有什么區(qū)別呢,?
首先在功能上, DPU(數(shù)據(jù)處理單元),、CPU(中央處理單元)和GPU(圖形處理單元)都是計(jì)算處理器,各自執(zhí)行不同的功能,。CPU是負(fù)責(zé)計(jì)算機(jī)系統(tǒng)整體運(yùn)行的主處理器,,是計(jì)算機(jī)的“大腦”。GPU 是用于圖形計(jì)算任務(wù)(例如渲染3D 圖像或視頻)的專用處理器。DPU 是最新的處理器,,專門用于以數(shù)據(jù)為中心的工作負(fù)載,,例如數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)和安全操作,。
其次是架構(gòu),,CPU 由幾個(gè)強(qiáng)大的處理核心組成,這些核心針對(duì)串行或順序處理進(jìn)行了優(yōu)化,,這意味著一項(xiàng)又一項(xiàng)任務(wù),。GPU 具有大量針對(duì)并行處理(即同時(shí)執(zhí)行任務(wù))進(jìn)行優(yōu)化的更簡單的內(nèi)核。DPU 結(jié)合了處理核心,、硬件加速器塊和高性能網(wǎng)絡(luò)接口,,可大規(guī)模處理以數(shù)據(jù)為中心的任務(wù)。
另外,,CPU 幾乎用于所有計(jì)算機(jī)設(shè)備,,從智能手機(jī)到計(jì)算機(jī)再到服務(wù)器。GPU 經(jīng)常用于游戲電腦,。DPU 主要用于數(shù)據(jù)中心,。
基于明顯的優(yōu)勢(shì),國外大廠已經(jīng)早早地開始發(fā)展DPU了,。
2019年,,英偉達(dá)以69億美元的價(jià)格收購以色列網(wǎng)絡(luò)芯片公司Mellanox,并于同年推出BlueField-2 DPU,,自此拉開DPU高速發(fā)展的序幕,。
在 2020 年 GPU 技術(shù)大會(huì)上,英偉達(dá)首席執(zhí)行官黃仁勛推出了名為 BlueField-2 數(shù)據(jù)處理單元 (DPU) 的全新處理器系列,。開發(fā)人員可以通過軟件平臺(tái) DOCA SDK 訪問 DPU,。DPU和DOCA SDK可與英偉達(dá)GPU硬件和CUDA軟件的強(qiáng)大組合相媲美。
7月11日業(yè)內(nèi)四名知情人士報(bào)道,,歐盟監(jiān)管機(jī)構(gòu)將于本周三批準(zhǔn)博通以690億美元收購軟件制造商VMware的交易,。報(bào)道稱,歐盟委員會(huì)將接受博通的讓步,,即VMware的軟件將繼續(xù)與競(jìng)爭對(duì)手的硬件兼容,。知情人士表示,這一舉措已被證明足以解決歐盟競(jìng)爭監(jiān)管機(jī)構(gòu)的擔(dān)憂,,而無需博通出售VMware的部分業(yè)務(wù),。
這次的收購如果成功,博通就可以進(jìn)一步進(jìn)軍數(shù)據(jù)中心市場(chǎng),,特別是數(shù)據(jù)處理單元(DPU)市場(chǎng),,也稱為智能網(wǎng)絡(luò)接口卡(smartNIC)市場(chǎng)。VMware也一直在尋找自己的DPU/smartNIC市場(chǎng)之路。自 2020 年以來,,該公司一直致力于一項(xiàng)名為 Project Monterey 的項(xiàng)目,,研究其虛擬化軟件如何與 DPU 配合使用。
2022年 3 月,,高級(jí)技術(shù)營銷架構(gòu)師 Dave Morera 對(duì)該項(xiàng)目的描述是:“根據(jù) VMware 的蒙特利項(xiàng)目,,網(wǎng)絡(luò)流量、分布式防火墻等網(wǎng)絡(luò)進(jìn)程將被卸載到SmartNIC (智能網(wǎng)絡(luò)接口卡),;這意味著不僅 x86 服務(wù)器的資源被繞過,,流量本身也被繞過。蒙特利項(xiàng)目還將促進(jìn)在 DPU 本身上安裝 ESXi 和NSX,,從而將所需的 CPU 資源從 x86 卸載到 DPU,,不僅釋放 x86 上的資源供虛擬機(jī)使用,而且還提供額外的安全層”,。
除了英偉達(dá)之外,,下表展示了其他國際廠商的DPU產(chǎn)品。
02
國內(nèi)DPU起勢(shì)猛
雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)與國外一線廠商相比還有差距,,但是在DPU架構(gòu)的理解上還是有獨(dú)到的見解的,,而且我國目前在數(shù)據(jù)中心這個(gè)領(lǐng)域,無論是市場(chǎng)規(guī)模還是增速,,特別是用戶數(shù)量,,相較于國外都有巨大的優(yōu)勢(shì)。國內(nèi)廠商有望充分利用這一市場(chǎng)優(yōu)勢(shì),,加快發(fā)展步伐,,在DPU這個(gè)賽道與國外廠商逐鹿中原。
國內(nèi)廠商在啃的是一塊新的“硬骨頭”,。DPU技術(shù)的特點(diǎn)是燒錢多,、周期長、產(chǎn)品面向政企,、很難快速上量,但是技術(shù)壁壘高,、客戶黏性強(qiáng)。同時(shí), DPU是全球新近發(fā)展起來的一項(xiàng)新技術(shù),不像很多成熟芯片已經(jīng)形成了“西強(qiáng)東弱”的格局,在DPU上中國和西方國家沒有代際差,。
也就是說DPU是全球新近發(fā)展起來的一種專用處理器,。國內(nèi)廠商的一些產(chǎn)品處在從小批量到規(guī)模化應(yīng)用的階段,已經(jīng)有了第一批客戶,。當(dāng)下的任務(wù)是,保持產(chǎn)品迭代以適應(yīng)用戶需求,。同時(shí),推動(dòng)產(chǎn)品從小批量到規(guī)模化落地,再要考慮如何去復(fù)制同類客戶,。
然而DPU產(chǎn)業(yè)化的挑戰(zhàn)很大,這包括一些供應(yīng)鏈緊張,、人才不足的共性難題,還有需求碎片化,、大量兼容適配的特殊挑戰(zhàn),目前單顆DPU成本較高。
與存儲(chǔ)器,、CPU這種成熟產(chǎn)品不同,這些芯片已經(jīng)被標(biāo)準(zhǔn)化,國際大廠擁有技術(shù)的,、成本的優(yōu)勢(shì),并善于利用產(chǎn)品的周期性調(diào)整價(jià)格,以驅(qū)逐追趕者,。國產(chǎn)的道路是后發(fā)追趕式的,面臨的競(jìng)爭非常殘酷。
DPU未來也會(huì)走向標(biāo)準(zhǔn)化,。中科馭數(shù)公司的創(chuàng)始人兼 CEO鄢貴海說:“我們感受到的競(jìng)爭氛圍更寬松,而且創(chuàng)新的空間更大,比如我們正在研究如何將端到端的延遲從20微秒降低到2微秒,對(duì)于很多技術(shù)點(diǎn),各家都有不同的實(shí)現(xiàn)方法,但若這項(xiàng)技術(shù)在國際上已經(jīng)相對(duì)成熟,那國產(chǎn)幾乎沒有空間去創(chuàng)新了,最緊要的任務(wù)就是趕上國際的水平,做出一個(gè)自主可控的方案,。”
在全球格局尚未形成之前,國產(chǎn) DPU 需要利用國內(nèi)的資源稟賦和更多國產(chǎn)芯片達(dá)成生態(tài)協(xié)同,并服務(wù)于本土的信息基礎(chǔ)設(shè)施,在全球角逐一項(xiàng)新技術(shù)的關(guān)鍵窗口期,探索出一種“中國方案”,。
其中“定制化方案”就是國產(chǎn)DPU很好的發(fā)展方向和布局思路,。DPU是個(gè)新興市場(chǎng),客戶需求還處于粗放階段,,各種方案都有適合的應(yīng)用場(chǎng)景,。因?yàn)橥婕也欢啵蛻粜枨蟊容^分散,,單個(gè)廠商無法服務(wù)眾多客戶,,因此現(xiàn)階段都能夠通過為客戶進(jìn)行定制化服務(wù)獲得訂單。
國內(nèi)未來DPU的發(fā)展和布局應(yīng)采取一些差異化競(jìng)爭思路,,一方面,,加快自主研發(fā)DPU的進(jìn)程。不管是處理器架構(gòu)的研發(fā),,還是網(wǎng)絡(luò)芯片的研發(fā),,都要加快產(chǎn)品的迭代速度。另一方面,,在商業(yè)模式上,,找一些細(xì)分的產(chǎn)品角度進(jìn)行創(chuàng)新。多與國內(nèi)的云計(jì)算,、數(shù)據(jù)中心的廠商合作,,先進(jìn)行小批量的產(chǎn)品鋪設(shè),再進(jìn)行大規(guī)模的布局,。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<