《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > 中國移動(dòng)今年將開展GSE中試

中國移動(dòng)今年將開展GSE中試

給智算網(wǎng)絡(luò)更多選擇
2024-05-11
來源:C114通信網(wǎng)

大模型需要大算力,大算力需要大集群,,大集群需要大網(wǎng)絡(luò),!

業(yè)界對(duì)此沒有疑問,但選擇什么樣的機(jī)間互聯(lián)技術(shù),,卻有著不同的技術(shù)實(shí)現(xiàn)路徑,。

是先入為主的InfiniBand,還是當(dāng)前呼聲很高的UEC,;其實(shí),,我們有更多的選擇。在近日舉行的“中國移動(dòng)算力網(wǎng)絡(luò)大會(huì)”上,,中國移動(dòng)副總經(jīng)理高同慶宣布,,對(duì)標(biāo)國際主流的IB和UEC方案,形成中國自主的技術(shù)體系--全調(diào)度以太網(wǎng)GSE),,今年將開展GSE中試,,加速GSE關(guān)鍵技術(shù)和產(chǎn)業(yè)成熟,為標(biāo)準(zhǔn)開放的新型智算互聯(lián)貢獻(xiàn)中國方案。

有了IB和UEC,,我們?yōu)槭裁催€需要GSE?GSE將會(huì)給產(chǎn)業(yè)界帶來價(jià)值,?從理念到技術(shù)再到產(chǎn)品和應(yīng)用的落地,,GSE還需要邁過哪些門檻?

我們?yōu)槭裁葱枰狦SE

在回答這個(gè)問題之前,,先讓看看算力形態(tài)的變化,。業(yè)界現(xiàn)在將算力分為通算、超算與智算,,其中智算作為AI能力的主要載體,,到2025年可能會(huì)占據(jù)新增算力的85%左右。也就是說智算將逐漸成為AI市場(chǎng)主流,,作為智算的載體,,智算中心的重要性就不言而喻了。

智算中心與傳統(tǒng)數(shù)據(jù)中心存在很大不同,,不僅體現(xiàn)在卡型,、性能、功耗,、算力密度等方面,,主要由GPU服務(wù)器聯(lián)網(wǎng)構(gòu)成的智算中心需要完全不同的網(wǎng)絡(luò)架構(gòu)。當(dāng)大模型訓(xùn)練時(shí),,并行計(jì)算節(jié)點(diǎn)越多,,通信效率越重要,智算網(wǎng)絡(luò)性能成為集群算力提升的關(guān)鍵,??偨Y(jié)下來,智算中心網(wǎng)絡(luò)要求很特殊,,需要高帶寬,、零丟包、超低時(shí)延,、高可用性,,月級(jí)零故障。

簡言之,,我們需要新的網(wǎng)絡(luò)架構(gòu),。客觀來看,,英偉達(dá)主導(dǎo)的InfiniBand因其自身特性,,是當(dāng)前市場(chǎng)主流選擇,但I(xiàn)nfiniBand在產(chǎn)業(yè)開發(fā)性、部署成本方面非常不友好,。還有很重要的一點(diǎn),,在云譎波詭的地緣政治環(huán)境下,產(chǎn)品與解決方案的可持續(xù)獲得性也是個(gè)問題,。

InfiniBand不行,,我們可以選另外一條技術(shù)演進(jìn)路徑,從底層革新傳統(tǒng)以太網(wǎng)機(jī)制,,同時(shí)又最大限度的利用以太網(wǎng)產(chǎn)業(yè)的開放性和成熟性,。亂拳打死老師傅,這的確是個(gè)好主意,!

從以太網(wǎng)這條技術(shù)路徑來看,,主要有兩個(gè)流派。一種是采用大量的私有協(xié)議,,自己做深度優(yōu)化,,性能的確是很強(qiáng),國內(nèi)有些云服務(wù)商走的是這條路,;一種是用開源社區(qū)思路,,“眾人拾柴火焰高”,比如國內(nèi)主導(dǎo)的GSE,,是美國主導(dǎo)的UEC,,都是這個(gè)思路。

1.jpg

但需要強(qiáng)調(diào)的是,,UEC和GSE的先后關(guān)系,。很多人先入為主的認(rèn)為,我國在智算領(lǐng)域落后于美國,,GSE是在拾UEC牙慧,!但事實(shí)剛好與之相反。在2023年5月份,,中國移動(dòng)聯(lián)合10余家中國企業(yè)率先發(fā)布全調(diào)度以太網(wǎng)技術(shù)架構(gòu)(GSE)白皮書,,這標(biāo)志著GSE技術(shù)的確立。幾個(gè)月之后,,包括英特爾,、AMD、HPE,、Arista,、Broadcom、思科,、Meta和微軟等主導(dǎo)成立的超級(jí)以太網(wǎng)聯(lián)盟(UEC)才成立,。

GSE能夠給行業(yè)帶來什么,?我覺得最重要的有兩點(diǎn):

第一,給了智算中心服務(wù)器互聯(lián)更多選擇,。在云譎波詭的地緣政治環(huán)境下,,可選擇性、可獲取性比性能,、成本本身更為重要,。況且,GSE也在快速的走向成熟,,形成標(biāo)準(zhǔn)開放的技術(shù)體系,!

第二,,給了中國AI產(chǎn)業(yè)路徑更多選擇,。在先進(jìn)算力芯片受限的前提下,我們只能通過別的方式來彌補(bǔ),,“以網(wǎng)強(qiáng)算”是個(gè)必然路徑,。但網(wǎng)絡(luò)芯片存在代際差距,網(wǎng)絡(luò)可能成為我國AI發(fā)展的“新卡點(diǎn)”,。我們單純的從這個(gè)公式來看:集群有效算力={GPU單卡算力*總卡數(shù)*線性加速比*有效運(yùn)行時(shí)],,前面這幾個(gè)變量我們都受限,更需要做好GSE這篇文章,。

GSE應(yīng)該怎么去落地,?

首先,我們要有自信,。AI特別是AGI就是未來的方向,,在這點(diǎn)上,是沒有任何疑問的,。在AGI落地的技術(shù)路徑上,,“以網(wǎng)強(qiáng)算”是個(gè)必然選擇。

我們有全球最好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,,有全球最好的移動(dòng)通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,,有全球技術(shù)最為領(lǐng)先的400G光傳送網(wǎng)。當(dāng)然,,我們也完全可以有最優(yōu)的智算中心網(wǎng)絡(luò),,或者智算中心機(jī)間互聯(lián)技術(shù)生態(tài)。在挑戰(zhàn)或者取代IB的這條道路上,,UEC可以做到的,,GSE為什么不能做到呢?

其次,,產(chǎn)業(yè)鏈形成合力,。孫凝暉院士說的好,,國內(nèi)智能計(jì)算生態(tài)孱弱,更為嚴(yán)重的是國內(nèi)企業(yè)之間山頭林立,,其實(shí)在機(jī)間互聯(lián)技術(shù)選擇上也一樣,。比如在今年的云網(wǎng)智聯(lián)大會(huì)上,就有類似的聲音出來,,認(rèn)為GSE是中國移動(dòng)主導(dǎo)的,,是個(gè)個(gè)體行為,UEC才是主流,。

從全球來看,,特別是從用戶的CAPEX來看,UEC的確是遠(yuǎn)遠(yuǎn)超過GSE,;但國內(nèi)企業(yè)在UEC中到底有沒有,,有多少話語權(quán),這都是疑問,。對(duì)于GSE而言,,的確是中國移動(dòng)倡導(dǎo)成立的,但GSE發(fā)展離不開開放性,,GSE推進(jìn)計(jì)劃現(xiàn)在已經(jīng)有40多家成員,,既要最大限度兼容以太網(wǎng)生態(tài),更要最大限度包容產(chǎn)業(yè)生態(tài),。

還是要小步快跑,。智算中心的發(fā)展和演進(jìn),和傳統(tǒng)的CT行業(yè)是不同的,,標(biāo)準(zhǔn)是個(gè)很有意思的問題,,是在發(fā)展中不斷地凝聚共識(shí)、優(yōu)化技術(shù)路徑,;小步快跑才能形成可持續(xù)的社區(qū)繁榮生態(tài),。從GSE的發(fā)展歷程來看,也的確在朝著這個(gè)方向前行,。特別是在上個(gè)月,,《新型智算中心以太網(wǎng)物理層安全(PHYSec)架構(gòu)白皮書》的發(fā)布,說明了GSE產(chǎn)業(yè)鏈的努力,。

最后,,當(dāng)然也是最重要的,要用“誠意”和“信心”去培育,、催熟產(chǎn)業(yè)鏈,。所以,在今年的中國移動(dòng)算力網(wǎng)絡(luò)大會(huì)上,,當(dāng)高總宣布要開展GSE“中試”時(shí),,產(chǎn)業(yè)鏈還是很受鼓舞的,。可能有些讀者對(duì)于“中試”不是很清楚,,翻譯過來的意思就是“現(xiàn)網(wǎng)試商用”,!這也凸顯了中國移動(dòng)在推動(dòng)民族智算和AI產(chǎn)業(yè)發(fā)展中的央企擔(dān)當(dāng)。當(dāng)然,,我們也相信中國移動(dòng)具備這樣的能力,,無論是從傳送網(wǎng)100G到400G的躍遷,還是從移動(dòng)網(wǎng)從3G到5G的嬗變,,或亦是承載網(wǎng)從PTN到SPN的沿革,,中國移動(dòng)都已經(jīng)證明了自己。GSE,,我們相信同樣如此,!


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。