《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動(dòng)態(tài) > 阿里云首發(fā)CIPU處理器 為OS反向自研

阿里云首發(fā)CIPU處理器 為OS反向自研

2022-06-15
來源:21ic
關(guān)鍵詞: 阿里云 CIPU OS

剛剛,,阿里云正式對(duì)外發(fā)布全新處理器:CIPU,。

不僅架構(gòu)全自研,還號(hào)稱要“替代CPU成為新一代云計(jì)算核心硬件”!

云計(jì)算搞了這么些年,,CPU在數(shù)據(jù)中心可一直還是牢牢占據(jù)“C位”。

就在去年,,阿里還花大力氣推出了5nm的服務(wù)器CPU倚天710,。

這怎么就突然要打破傳統(tǒng)了呢?

CIPU,這個(gè)比CPU多了一個(gè)I的新面孔,,究竟什么來頭?

CIPU究竟是什么?

CIPU全稱Cloud Infrastructure Process Units,,意為云基礎(chǔ)設(shè)施處理器。

從名字上就能看出,,這是一顆云端處理器,,專門用于連接服務(wù)器內(nèi)硬件和云上虛擬化資源,。

據(jù)阿里云介紹,之所以用CIPU取代以CPU為核心的架構(gòu),,就是為了更好地“壓榨”服務(wù)器硬件,、獲取更多虛擬化資源,并讓已有的資源用起來更順手,。

軟件上,,CIPU接入飛天云操作系統(tǒng),更高效地完成虛擬化資源編排調(diào)度的工作;

硬件上,,飛天操作系統(tǒng)通過CIPU能快速云化管理數(shù)據(jù)中心物理設(shè)備,,并對(duì)網(wǎng)絡(luò)和存儲(chǔ)硬件進(jìn)行加速,這樣一來不僅不會(huì)再浪費(fèi)CPU的算力,,還能增強(qiáng)網(wǎng)絡(luò)和存儲(chǔ)性能,。

從功能來說,它擁有四大特性:

云原生最佳載體,,即每個(gè)裸金屬系統(tǒng)能運(yùn)行2000個(gè)容器,,并用沙箱容器技術(shù)為容器提供更安全的隔離,鏈路啟動(dòng)速度在50ms以內(nèi);

芯片直接實(shí)現(xiàn)IO引擎,,其中存儲(chǔ)I/O操作每秒可進(jìn)行300萬次,,網(wǎng)絡(luò)I/O最高每秒5000萬個(gè)分組數(shù)據(jù)包,存儲(chǔ)長尾時(shí)延降低50%;

芯片級(jí)安全加固,,即能高速卸載加密后的數(shù)據(jù),,將芯片級(jí)硬件的不可篡改性映射到軟件上;

增強(qiáng)型融合網(wǎng)絡(luò),即在RDMA技術(shù)加持下,,網(wǎng)絡(luò)延遲最低達(dá)到5微秒,,帶寬最高能達(dá)到200GB。

從性能來說,,它又給計(jì)算,、存儲(chǔ)和網(wǎng)絡(luò)三類資源帶來了不少提升。

計(jì)算上,,CIPU能快速接入不同類型資源的神龍?jiān)品?wù)器,,單容器虛擬化消耗減少50%,啟動(dòng)速度快350%,。以運(yùn)行部分?jǐn)?shù)據(jù)庫和服務(wù)器為例,,Nginx性能就提升了89%,Redis提升68%,,MySQL提升60%,,此外對(duì)于AI和大數(shù)據(jù)場景也有提升。

存儲(chǔ)上,,CIPU能對(duì)存算分離架構(gòu)的塊存儲(chǔ)接入進(jìn)行硬件加速,,存儲(chǔ)時(shí)延最低達(dá)到30微秒,,帶寬最高200Gbps,支持云上多計(jì)算節(jié)點(diǎn)NVME共享訪問云盤塊存儲(chǔ),,Oracle RAC,、SAP Hana等高可用數(shù)據(jù)庫無縫上云。

網(wǎng)絡(luò)上,,CIPU對(duì)高帶寬物理網(wǎng)絡(luò)進(jìn)行了硬件加速,,基礎(chǔ)帶寬達(dá)到200GB,并采用自研的RDMA-Solar協(xié)議,,網(wǎng)絡(luò)時(shí)延降低至16us,,相較自建物理機(jī)的集群吞吐量提升30%、業(yè)務(wù)高峰期延遲下降90%,。

有意思的是,,阿里云這款CIPU處理器,其實(shí)已經(jīng)在內(nèi)部打磨好幾年了,。

它最初的“靈感”,,來自于阿里云內(nèi)部一個(gè)叫做神龍卡的設(shè)備。

神龍卡誕生于2017年,,從功能上來講有點(diǎn)類似于AWS發(fā)布的一款名叫Nitro的平臺(tái)(集成了虛擬機(jī)監(jiān)視器,、帶外管理等功能),甚至比AWS發(fā)布的時(shí)間更早一點(diǎn),。

經(jīng)過了好幾輪迭代后,,神龍卡逐漸加入了編排調(diào)度、硬件加速等更多能力,,最終誕生了CIPU的雛形,隨后也在繼續(xù)完善這一款產(chǎn)品,。

一方面,,據(jù)阿里云智能云架構(gòu)總監(jiān)黃瑞瑞介紹,在這幾年里,,CIPU已經(jīng)承受過像“雙十一”這種體量的性能&壓力“測試”了,。

另一方面,有不少阿里云的客戶,,也或多或少已經(jīng)使用過基于CIPU的云計(jì)算服務(wù),。雖然客戶可能對(duì)底層硬件層沒有直接的感知,但阿里云的網(wǎng)絡(luò),、存儲(chǔ)等性能,,這幾年確實(shí)在不斷上升,例如,,不久前阿里云就成為國內(nèi)唯一獲評(píng)全球十大計(jì)算機(jī)網(wǎng)絡(luò)研究機(jī)構(gòu)的中國企業(yè),。

如今來看,,CIPU的出現(xiàn)確實(shí)再次打破了云計(jì)算的“瓶頸”,將整體性能提升了一大部分,。

不過,,要說推翻CPU在云數(shù)據(jù)中心里“C位”的想法,倒也不是阿里一家有之,。

在市面上相似概念的產(chǎn)品里,,CIPU相比IPU、DPU來說,,又究竟有什么不同?

為什么是CIPU?

要說清楚這件事兒,,還是得從云計(jì)算技術(shù)的發(fā)展歷程說起。

過去十幾年來云計(jì)算技術(shù)的發(fā)展,,可以大體分為兩個(gè)階段,。

第一階段,在分布式技術(shù)的推動(dòng)之下,,互聯(lián)網(wǎng)企業(yè)開始將業(yè)務(wù)從大型機(jī)向分布式系統(tǒng)遷移,,打下了分布式架構(gòu)的底座。

第二階段,,資源池化技術(shù)出現(xiàn),。這一技術(shù)通過計(jì)算存儲(chǔ)分離的架構(gòu),實(shí)現(xiàn)了對(duì)資源的統(tǒng)一調(diào)度編排,,使得彈性計(jì)算成為可能,。

對(duì)于用戶而言,這也就意味著云計(jì)算可靠性和可用性的極大提升,。

在這兩個(gè)階段,,計(jì)算體系架構(gòu)都是以CPU為核心的。

但當(dāng)云計(jì)算發(fā)展到今天,,以大數(shù)據(jù)應(yīng)用為代表的數(shù)據(jù)密集型場景越來越多,,這種以CPU為中心的架構(gòu)便開始暴露短板:

首先,以CPU為中心的架構(gòu)會(huì)導(dǎo)致計(jì)算和網(wǎng)絡(luò)傳輸之間的時(shí)延較大,。

其次,,大數(shù)據(jù)應(yīng)用增多,導(dǎo)致數(shù)據(jù)中心內(nèi)部數(shù)據(jù)遷移量增大,,以CPU為中心的架構(gòu)無法提供高帶寬,。

再者,以阿里云為例,,其在全球27個(gè)國家和地區(qū),、84個(gè)可用區(qū)管理著上百萬臺(tái)服務(wù)器。但以CPU為中心的架構(gòu)很難解決這種超大規(guī)?;A(chǔ)設(shè)施的復(fù)雜管理問題,。

如此一來,,解決之道也就指向了一個(gè)方向:打破以CPU為中心的傳統(tǒng)云計(jì)算體系架構(gòu),定義新一代云計(jì)算基礎(chǔ)技術(shù),。

而這也正是如今各大廠商所追逐的最新技術(shù)熱點(diǎn),。

比如英偉達(dá)的DPU(Data Processing Units),2020年10月一經(jīng)發(fā)布,,便在業(yè)界引發(fā)熱議,。

顧名思義,DPU側(cè)重解決的是數(shù)據(jù)遷移帶寬的問題,。作為集成加速平臺(tái),,DPU能夠從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù),,降低CPU的開銷,。

老黃當(dāng)時(shí)表示:

數(shù)據(jù)中心已成為新型計(jì)算單元,而DPU是其重要的組成部分,。CPU,、GPU和DPU的結(jié)合,可構(gòu)成完全可編程的單一AI計(jì)算單元,,提供前所未有的安全性和算力,。

而英特爾也緊隨其后,提出了“IPU”(Infrastructure Processing Units)的概念,。

相比于DPU,,IPU更強(qiáng)調(diào)虛擬化云化能力,通過網(wǎng)絡(luò)虛擬化,、存儲(chǔ)虛擬化,、網(wǎng)絡(luò)存儲(chǔ)管理以及安全等功能,加速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,,釋放CPU核來提高應(yīng)用程序性能,。

盡管在概念上有些許區(qū)分,但無論是DPU還是IPU,,都是想通過軟件定義+硬件加速的方式,替代CPU成為數(shù)據(jù)中心的核心硬件,。

由此也可以看出,,阿里云此番推出的CIPU,更像是IPU和DPU的綜合體,,既能云化虛擬化管控?cái)?shù)據(jù)中心,,又能解決數(shù)據(jù)遷移帶寬的問題。

而更大的區(qū)別在于,,阿里云本身就是一家云廠商,,還是有飛天云操作系統(tǒng)的那一種,。

這就意味著,與英偉達(dá),、英特爾這樣的硬件廠商不同,,阿里云對(duì)于云計(jì)算技術(shù)發(fā)展各個(gè)階段所面臨的問題,有更為切身的體會(huì),。

前文提到,,CIPU是一顆專門為飛天系統(tǒng)設(shè)計(jì)的處理器。也就是說,,它從設(shè)計(jì)之初,,就是貼合云計(jì)算行業(yè)痛點(diǎn)、結(jié)合飛天系統(tǒng)特點(diǎn)去做的,。

這樣的軟硬一體化,,一方面,既能通過硬件提供高性能,,又能通過軟件提供靈活性,。

另一方面,從一開始就避免了適配性的問題,,能通過1+1>2的方式,,做到更強(qiáng)的性能、更低的價(jià)格,、更高的穩(wěn)定性,。

自主研發(fā)的云計(jì)算

如此看來,最先享受到這波技術(shù)發(fā)展紅利的,,就是云上用戶們——

云計(jì)算能做到更高的性價(jià)比了,。

而作為CIPU背后的云廠商,阿里云此番技術(shù)發(fā)布,,也扣上了云計(jì)算技術(shù)國產(chǎn)化在新階段的重要一環(huán),。

以阿里云自身為例:

2009年,阿里云自研云計(jì)算操作系統(tǒng)飛天誕生,。雙11,、12306春運(yùn)購票等大家津津樂道的極限并發(fā)場景,都跑在這個(gè)系統(tǒng)之上,。

2017年,,為了解決服務(wù)器虛擬化性能損耗的問題,阿里云自主研發(fā)了神龍架構(gòu)(就是上文提到的神龍卡),,通過把虛擬化轉(zhuǎn)移到專用硬件中進(jìn)行加速,,實(shí)現(xiàn)了性能“0損耗”。

在云存儲(chǔ)技術(shù)方面,阿里云自研的盤古分布式存儲(chǔ)系統(tǒng),,推動(dòng)了面向數(shù)據(jù)中心ZNSSSD國際標(biāo)準(zhǔn)的發(fā)展,。與西部數(shù)據(jù)(WD)共同提出的NVMe2.0,是目前云計(jì)算業(yè)內(nèi)最為先進(jìn)的軟硬一體深度融合的分布式存儲(chǔ)系統(tǒng),。

去年,,阿里云還發(fā)布了首款CPU倚天710,刷新了Arm服務(wù)器芯片性能紀(jì)錄,。

……

從網(wǎng)絡(luò)到存儲(chǔ),,從軟件到硬件,通過13年的技術(shù)積累,、自主研發(fā),,阿里云作為國內(nèi)云廠商的代表,正在世界云計(jì)算的舞臺(tái)上發(fā)出越來越高的聲量,。

而CIPU的推出,,則意味著這種在技術(shù)自主化方面的努力,或許已更進(jìn)一步:

嘗試打破海外云廠商,、硬件廠商定義的傳統(tǒng)發(fā)展路線,,走出一條自己的新路。

每當(dāng)技術(shù)發(fā)展到一個(gè)更新?lián)Q代的新階段,,圍繞話語權(quán)的競爭往往精彩不斷,,影響更甚于科技圈本身。

5G如是,,云技術(shù)亦如是,。

好戲或許才剛剛開場。




1最后文章空三行圖片11.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected]