《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 阿里巴巴開(kāi)源深度學(xué)習(xí)訓(xùn)練框架EPL 可支持10萬(wàn)億參數(shù)超大模型

阿里巴巴開(kāi)源深度學(xué)習(xí)訓(xùn)練框架EPL 可支持10萬(wàn)億參數(shù)超大模型

2022-03-05
來(lái)源:阿里云

3月4日消息,,阿里巴巴宣布完全開(kāi)源支持10萬(wàn)億模型的自研分布式深度學(xué)習(xí)訓(xùn)練框架EPL(Easy Parallel Library,,原名whale),進(jìn)一步完善深度學(xué)習(xí)生態(tài),。

EPL由阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI團(tuán)隊(duì)自主研發(fā),,PAI是面向開(kāi)發(fā)者和企業(yè)的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)工程平臺(tái),提供包含數(shù)據(jù)標(biāo)注,、模型構(gòu)建,、模型訓(xùn)練、編譯優(yōu)化,、推理部署在內(nèi)的AI開(kāi)發(fā)全鏈路服務(wù),內(nèi)置140多種優(yōu)化算法,,具備豐富的行業(yè)場(chǎng)景插件,,為用戶提供低門檻、高性能的云原生AI工程化能力,。

EPL是PAI團(tuán)隊(duì)一次面向大規(guī)模深度學(xué)習(xí)分布式自動(dòng)化訓(xùn)練的探索,,EPL希望能夠簡(jiǎn)化深度學(xué)習(xí)模型從單機(jī)訓(xùn)練到分布式開(kāi)發(fā)調(diào)試的流程。EPL通過(guò)對(duì)不同并行化策略進(jìn)行統(tǒng)一抽象,、封裝,,在一套分布式訓(xùn)練框架中支持多種并行策略,并進(jìn)行顯存,、計(jì)算,、通信等全方位優(yōu)化來(lái)提供易用、高效的分布式訓(xùn)練框架,。

EPL適合不同場(chǎng)景的模型,,在阿里巴巴內(nèi)部已經(jīng)支持圖像、推薦,、語(yǔ)音,、視頻、自然語(yǔ)言,、多模態(tài)等多樣性的業(yè)務(wù)場(chǎng)景,。同時(shí),EPL也支持不同規(guī)模的模型,,最大完成了10萬(wàn)億規(guī)模的M6模型訓(xùn)練,,相比之前發(fā)布的大模型GPT-3,M6實(shí)現(xiàn)同等參數(shù)規(guī)模能耗僅為其1%,。最新測(cè)試結(jié)果顯示,,使用EPL的流水+數(shù)據(jù)并行對(duì)Bert Large模型進(jìn)行優(yōu)化,相比于數(shù)據(jù)并行,訓(xùn)練速度提升了66%,。

阿里云資深技術(shù)專家九豐表示,,“近些年,隨著深度學(xué)習(xí)的火爆,,模型的參數(shù)規(guī)模飛速增長(zhǎng),,同時(shí)為訓(xùn)練框架帶來(lái)更大挑戰(zhàn)。為應(yīng)對(duì)這個(gè)問(wèn)題,,我們研發(fā)了EPL,,EPL功能也隨著業(yè)務(wù)需求的迭代逐漸完善。未來(lái),,我們將在軟硬件一體優(yōu)化,、全自動(dòng)策略探索等幾個(gè)探索性方向上持續(xù)投入精力。今天,,我們將EPL完全開(kāi)源,,希望和深度學(xué)習(xí)訓(xùn)練框架的開(kāi)發(fā)者或深度學(xué)習(xí)從業(yè)者之間有更多更好的交流和共建,持續(xù)完善深度學(xué)習(xí)生態(tài),?!?/p>




最后文章空三行圖片.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。