1、為什么要關(guān)注網(wǎng)絡(luò),?
傳統(tǒng)網(wǎng)絡(luò)在技術(shù)和產(chǎn)品方面比較成熟。數(shù)據(jù)中心網(wǎng)絡(luò)在建設(shè)過(guò)程中,,主要以傳統(tǒng)網(wǎng)絡(luò)為標(biāo)準(zhǔn),,通過(guò)對(duì)其修補(bǔ)來(lái)匹配數(shù)據(jù)中心網(wǎng)絡(luò)的要求,。
斗轉(zhuǎn)星移,,傳統(tǒng)網(wǎng)絡(luò)的劣勢(shì)隨著數(shù)據(jù)中心的發(fā)展在逐漸放大。AI,、邊緣計(jì)算等新的業(yè)務(wù)形態(tài)對(duì)數(shù)據(jù)中心的網(wǎng)絡(luò)提出了新的新需求,,南北向流量的增長(zhǎng)、對(duì)時(shí)延和吞吐要求的不斷提高,,使對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)的研究逐漸成為一個(gè)比較緊迫的事情。各種國(guó)際標(biāo)準(zhǔn)組織紛紛成立相關(guān)的研究組來(lái)開(kāi)展相關(guān)工作,。網(wǎng)絡(luò)已經(jīng)不再只是一個(gè)流量轉(zhuǎn)發(fā)的只需要追求穩(wěn)定的平臺(tái),,它逐漸成為一個(gè)重要的生產(chǎn)環(huán)節(jié),成為數(shù)據(jù)中心創(chuàng)新的一個(gè)重要方面,。
2,、什么新場(chǎng)景?
數(shù)據(jù)中心技術(shù)與承載業(yè)務(wù)的發(fā)展變化,,是數(shù)據(jù)中心對(duì)網(wǎng)絡(luò)產(chǎn)生新需求的重要原因,。
一方面,隨著計(jì)算虛擬化,、存儲(chǔ)虛擬化的快速發(fā)展,,計(jì)算、存儲(chǔ)資源進(jìn)一步整合,,極大地提高了計(jì)算,、存儲(chǔ)執(zhí)行效率與資源利用率,而網(wǎng)絡(luò)具有數(shù)據(jù)傳輸?shù)闹匾δ?,必須進(jìn)行相應(yīng)的調(diào)整,,以迎合其它方面技術(shù)發(fā)展帶來(lái)的新需求。
另一方面,,數(shù)據(jù)中心相關(guān)業(yè)務(wù)發(fā)展對(duì)網(wǎng)絡(luò)的性能提出更高的要求,。相關(guān)業(yè)務(wù)場(chǎng)景包括大型在線(xiàn)數(shù)據(jù)密集(OLDI)服務(wù),如用于在線(xiàn)購(gòu)物,,社交媒體和網(wǎng)絡(luò)搜索的自動(dòng)推薦系統(tǒng),;高性能深度學(xué)習(xí)網(wǎng)絡(luò);NVMe高速存儲(chǔ)業(yè)務(wù)等應(yīng)用場(chǎng)景,。OLDI需要對(duì)高頻率,、高速率的請(qǐng)求進(jìn)行即時(shí)回應(yīng);深度學(xué)習(xí)在模型訓(xùn)練過(guò)程中需要高性能的計(jì)算系統(tǒng),,并行計(jì)算數(shù)據(jù)的傳輸通信時(shí)間極大影響著計(jì)算的性能,;NVMe非常適合未來(lái)云數(shù)據(jù)中心高度并行的要求,而為保證NVMe的可靠性,需要對(duì)網(wǎng)絡(luò)在延時(shí)方面提出更加苛刻的要求,。
這些業(yè)務(wù)場(chǎng)景的不斷涌現(xiàn)和進(jìn)一步深度應(yīng)用,,也使得數(shù)據(jù)中心對(duì)于內(nèi)部網(wǎng)絡(luò)的要求不斷提高。
3,、現(xiàn)在有什么問(wèn)題,?
目前數(shù)據(jù)中心在網(wǎng)絡(luò)方面存在諸多需要解決的問(wèn)題。
以數(shù)據(jù)中心當(dāng)前主流的Scale-out架構(gòu)為例,,其主要是2級(jí),、3級(jí)CLOS,少數(shù)可能達(dá)到5級(jí),、6級(jí)CLOS,。而many-to-one流量模型和all-to-all流量模型,使得這種架構(gòu)在未來(lái)數(shù)據(jù)中心新場(chǎng)景下存在丟包,、時(shí)延,、吞吐等多方面的挑戰(zhàn)。
圖1 many-to-one流量模型 圖2 all-to-all流量模型
如圖1所示為many-to-one流量模型,,流量從server1到server5,、從server7到server5、從server9到server5,,整網(wǎng)無(wú)阻塞,, 只有l(wèi)eaf2向server5的方向出端口方向buffer是瓶頸。如圖2所示為all-to-all流量模型,,流量從server1到server5,、從server9到server6,整網(wǎng)無(wú)阻塞,, 只有spine1向leaf2的方向出端口方向buffer是瓶頸,。上述網(wǎng)絡(luò)中的瓶頸問(wèn)題,將會(huì)極大的影響數(shù)據(jù)中心網(wǎng)絡(luò)的性能,,需要采用適當(dāng)?shù)姆椒ń鉀Q瓶頸產(chǎn)生的影響,。
4、無(wú)損網(wǎng)絡(luò)如何做,?
針對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)面對(duì)的各種問(wèn)題,,相關(guān)機(jī)構(gòu)進(jìn)行了深入的研究,提出了相應(yīng)的解決方案,。無(wú)損網(wǎng)絡(luò)是數(shù)據(jù)中心網(wǎng)絡(luò)問(wèn)題的解決方案之一,,其主要通過(guò)擁塞控制、負(fù)載均衡,、流量控制等方式,,解決包括many-to-one和all-to-all流量模型在內(nèi)的數(shù)據(jù)中心網(wǎng)絡(luò)存在的問(wèn)題,,其技術(shù)發(fā)展也主要是在這三個(gè)方面發(fā)展。
其中流量控制主要是管理兩個(gè)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸速率,,通過(guò)接收端的反饋,,從而調(diào)節(jié)發(fā)送端發(fā)送數(shù)據(jù)的速率,使得接收端接收與發(fā)送端發(fā)送相匹配,。
負(fù)載均衡是接收端和發(fā)送端存在多條路徑的情況下,,將兩節(jié)點(diǎn)間的流量合理的在多條了路徑上進(jìn)行分發(fā)。
網(wǎng)絡(luò)擁塞會(huì)引起數(shù)據(jù)包在網(wǎng)絡(luò)設(shè)備中排隊(duì)甚至導(dǎo)致隊(duì)列溢出而丟棄,,是導(dǎo)致網(wǎng)絡(luò)高動(dòng)態(tài)時(shí)延的主要原因,,擁塞控制很好的解決了上述問(wèn)題。
目前,,無(wú)損網(wǎng)絡(luò)技術(shù)主要在以上三個(gè)方面進(jìn)行技術(shù)創(chuàng)新,,解決數(shù)據(jù)中心網(wǎng)絡(luò)面臨的問(wèn)題。
5,、我們能做什么?
無(wú)損網(wǎng)絡(luò)是開(kāi)放數(shù)據(jù)中心標(biāo)準(zhǔn)推進(jìn)委員會(huì)(ODCC)的重點(diǎn)研究?jī)?nèi)容之一,,已經(jīng)得到了中國(guó)信息通信研究院,、中國(guó)電信、中國(guó)移動(dòng),、百度,、美團(tuán)、華為,、Mellanox等企事業(yè)單位的支持,,相關(guān)的技術(shù)規(guī)范和白皮書(shū)也在制定當(dāng)中,將于今年十月的開(kāi)放數(shù)據(jù)中心峰會(huì)發(fā)布相關(guān)的成果,。數(shù)據(jù)中心網(wǎng)絡(luò)已經(jīng)不能很好的適應(yīng)技術(shù),、業(yè)務(wù)場(chǎng)景對(duì)于數(shù)據(jù)中心網(wǎng)絡(luò)的要求,隨著技術(shù)和業(yè)務(wù)場(chǎng)景的發(fā)展,,這種影響將逐步擴(kuò)大,。為了更好的服務(wù)數(shù)據(jù)中心業(yè)務(wù)新需求,需要通過(guò)新技術(shù),、新產(chǎn)品解決數(shù)據(jù)中心面臨的網(wǎng)絡(luò)問(wèn)題,,這樣不僅有利于數(shù)據(jù)中心的長(zhǎng)遠(yuǎn)發(fā)展,同時(shí)也有利于企業(yè)技術(shù)創(chuàng)新,,產(chǎn)品換代,。