DeepSeek開(kāi)源周第二日：開(kāi)源首個(gè)用于MoE模型訓(xùn)練通信庫(kù)-AET-電子技術(shù)應(yīng)用

DeepSeek開(kāi)源周第二日：開(kāi)源首個(gè)用于MoE模型訓(xùn)練通信庫(kù)

日期： 2025-02-25

來(lái)源：C114通信網(wǎng)

關(guān)鍵詞： Deepseek 開(kāi)源周 DeepEP MoE

今天是DeepSeek 開(kāi)源周第二日，一早，DeepSeek如約就放出了開(kāi)源代碼庫(kù)DeepEP王炸。

據(jù)了解，DeepEP是首個(gè)用于 MoE 模型訓(xùn)練和推理的開(kāi)源 EP 通信庫(kù)，它填補(bǔ)了MoE模型專用通信工具的空白，為大規(guī)模分布式AI訓(xùn)練和實(shí)時(shí)推理場(chǎng)景提供了更高效的底層支持。

在這里，簡(jiǎn)單介紹一下DeepEP的技術(shù)性能特點(diǎn)：

1、高效通信架構(gòu)

支持優(yōu)化的全對(duì)全通信模式，實(shí)現(xiàn)節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的NVLink與RDMA互聯(lián)，提升數(shù)據(jù)傳輸效率

2、多精度與調(diào)度優(yōu)化

原生支持FP8低精度運(yùn)算調(diào)度，降低計(jì)算資源消耗。

3、重性能內(nèi)核

據(jù)介紹，高吞吐量?jī)?nèi)核可適用于訓(xùn)練和推理預(yù)填充場(chǎng)景，最大化數(shù)據(jù)處理能力；

4、低延遲內(nèi)核

它針對(duì)推理解碼場(chǎng)景設(shè)計(jì)，采用純RDMA通信和自適應(yīng)路由技術(shù)，減少延遲。

5、資源控制與重疊機(jī)制

通過(guò)靈活的GPU資源控制策略，實(shí)現(xiàn)計(jì)算與通信過(guò)程的高效重疊，避免資源閑置。

6、深度優(yōu)化場(chǎng)景

針對(duì)NVLink到RDMA的非對(duì)稱帶寬轉(zhuǎn)發(fā)場(chǎng)景進(jìn)行專項(xiàng)優(yōu)化，提升異構(gòu)網(wǎng)絡(luò)下的傳輸性能；

此外，它還支持SM（Streaming Multiprocessors）數(shù)量動(dòng)態(tài)控制，平衡不同任務(wù)（如訓(xùn)練與推理）的吞吐量需求。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

DeepSeek開(kāi)源周第二日：開(kāi)源首個(gè)用于MoE模型訓(xùn)練通信庫(kù)

日期： 2025-02-25

來(lái)源：C114通信網(wǎng)

相關(guān)內(nèi)容