《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 百度全面升級百舸AI異構(gòu)計算平臺4.0和千帆大模型平臺3.0

百度全面升級百舸AI異構(gòu)計算平臺4.0和千帆大模型平臺3.0

2024-09-26
來源:IT之家

9 月 25 日消息,,2024 百度云智大會今日在北京召開,,百度在大會上宣布全面升級百舸 AI 異構(gòu)計算平臺 4.0、千帆大模型平臺 3.0 兩大 AI 基礎(chǔ)設(shè)施,,并升級代碼助手,、智能客服,、數(shù)字人三大 AI 原生應(yīng)用產(chǎn)品。

百度智能云事業(yè)群總裁沈抖表示:“2024 年大模型的產(chǎn)業(yè)落地正在加速,,目前在千帆大模型平臺上,,文心大模型日均調(diào)用量超過 7 億次,,累計幫助用戶精調(diào)了 3 萬個大模型,開發(fā)出 70 多萬個企業(yè)級應(yīng)用,。過去一年,,文心旗艦大模型降價幅度超過 90%,主力模型全面免費,?!?/p>

升級百舸 4.0

為滿足企業(yè)落地大模型從集群創(chuàng)建、開發(fā)實驗,,到模型訓(xùn)練,、推理的全旅程算力需求,百度智能云升級發(fā)布百舸 AI 異構(gòu)計算平臺 4.0,,面向萬卡,、十萬卡集群全面升級算力管理能力。

集群創(chuàng)建階段:百舸 4.0 預(yù)置了主流的大模型訓(xùn)練工具,,能夠?qū)崿F(xiàn)工具層面的秒級部署,,并將萬卡集群運行準(zhǔn)備時間從幾周縮減至 1 小時。

0.png

開發(fā)實驗階段:企業(yè)需要針對業(yè)務(wù)目標(biāo)對不同架構(gòu),、參數(shù)的模型進行多次測試,,進而制定最佳模型訓(xùn)練策略,保障后續(xù)訓(xùn)練的性能和效果,。百舸 4.0 全新升級的可觀測大盤,,能夠?qū)Χ嘈具m配、集群效能,、任務(wù)自動容錯等方面進行全方位監(jiān)測。

模型訓(xùn)練階段:百舸 4.0 能夠自動篩查集群狀態(tài),,并基于對 GPU 故障的預(yù)測,,及時轉(zhuǎn)移工作負(fù)載,降低故障發(fā)生頻次,。此外,,百舸故障秒級感知定位、Flash Checkpoint 模型任務(wù)狀態(tài)回滾等技術(shù),,能夠減少集群故障處置時間,。

百度官方表示,目前百舸在萬卡集群上實現(xiàn)了有效訓(xùn)練時長占比 99.5% 以上,。此外,,百舸 4.0 通過集群設(shè)計、任務(wù)調(diào)度,、并行策略,、顯存優(yōu)化等一系列升級,整體性能相比業(yè)界平均水平提升 30%。

在模型推理環(huán)節(jié),,百舸則通過架構(gòu)分離,、KV Cache、負(fù)載分配等一系列加速方法,,實現(xiàn)了模型推理的降本提效,,尤其在長文本推理方面,推理效率號稱提升超過 1 倍,。

百舸 4.0 號稱已經(jīng)構(gòu)建了十萬卡級別的超大規(guī)模無擁塞 HPN 高性能網(wǎng)絡(luò),、10ms 級別超高精度網(wǎng)絡(luò)監(jiān)控,以及面向十萬卡集群的分鐘級故障恢復(fù)能力,。

千帆 3.0,,三大服務(wù)升級

為了滿足企業(yè)客戶對模型調(diào)用、模型開發(fā),、應(yīng)用開發(fā)的需求,,百度智能云發(fā)布千帆大模型平臺 3.0。

模型調(diào)用方面:升級后的千帆平臺,,不但可以調(diào)用包括文心系列大模型在內(nèi)的近百個國內(nèi)外大模型,,還支持調(diào)用語音、視覺等各種傳統(tǒng)的小模型,。過去一年,,文心旗艦大模型降價幅度超過 90%、主力模型全面免費,。

0.png

模型開發(fā)方面:對于需要定制,、微調(diào)專屬模型的客戶,千帆 3.0 不僅提供了大模型工具鏈,,還支持 CV,、NLP、語音等傳統(tǒng)模型的開發(fā),,并實現(xiàn)數(shù)據(jù),、模型、算力等資源的統(tǒng)一納管和調(diào)度,。

0.png

模型投入使用后,,千帆平臺還支持企業(yè)將應(yīng)用中產(chǎn)生的數(shù)據(jù),經(jīng)過采樣評估,、人工標(biāo)注,、對齊或微調(diào)等方式反饋給模型,形成數(shù)據(jù)飛輪,。

應(yīng)用開發(fā)方面:針對企業(yè)落地大模型的高頻應(yīng)用場景,,千帆 3.0 從檢索效果,、檢索性能、存儲擴展,、調(diào)配靈活性四方面對企業(yè)級檢索增強生成(RAG)進行了升級,;針對企業(yè)級 Agent 的開發(fā),千帆 3.0 增加了業(yè)務(wù)自主編排,、人工編排,、知識注入、記憶能力以及百度搜索等 80 多個官方組件支持,。

此外,,本次大會還發(fā)布了智能化低代碼應(yīng)用開發(fā)平臺“AI 速搭”,通過自然語言對話就能進行企業(yè)級應(yīng)用開發(fā),。

代碼助手,、智能客服、數(shù)字人升級

為了滿足企業(yè)直接選購成熟 AI 應(yīng)用的需求,,百度智能云面向數(shù)字人,、智能客服、代碼提效,,升級了三大 AI 原生應(yīng)用產(chǎn)品,,IT之家匯總升級內(nèi)容如下:

1、基于文心大模型重構(gòu)的 AI 原生智能客服應(yīng)用“客悅”:

在用戶復(fù)雜意圖理解,、多模態(tài)信息交流等方面實現(xiàn)了大幅提升,,讓智能客服變得更聰明、更擬人,。

“問題自助解決率”是智能客服領(lǐng)域最關(guān)鍵的考核指標(biāo),,當(dāng)前業(yè)內(nèi)平均水平是 80%,升級后,,客悅將這一指標(biāo)提升至 92%,。

目前,客悅已累計幫助企業(yè)客戶服務(wù)超過 1.5 億人次,,交互超過 5 億次。

2,、基于大模型能力,,新升級的曦靈數(shù)字人 4.0:

支持根據(jù)文字快速生成不同妝造、不同行業(yè)特色的 3D 數(shù)字人形象和視頻,。本次大會期間,,曦靈平臺宣布:將 3D 超寫實數(shù)字人的價格從萬元降價至 199 元。

全新升級的 4D(3D + 時間維度)自動綁定技術(shù)和創(chuàng)新模態(tài)遷移技術(shù),,還解決了傳統(tǒng) 2D 數(shù)字人動作僵硬的問題,,可以實現(xiàn)人物在不同角度,、形體、表情的高度一致,,即使是面部微表情也能做到自然,、逼真。

3,、全新升級的全流程 AI 代碼提效工具“文心快碼”:

本次大會,,文心快碼業(yè)界首發(fā)「企業(yè)級代碼架構(gòu)解釋」、「企業(yè)級代碼審查」兩項全新功能,。企業(yè)級代碼架構(gòu)解釋能在項目接手初期,,實現(xiàn)工程架構(gòu)的智能解讀,幫工程師快速理解業(yè)務(wù)邏輯,;而企業(yè)級代碼審查則能傳承資深工程師的編碼經(jīng)驗,,智能輔助程序員查缺補漏。

此外,,針對市面上通用代碼助手缺乏對企業(yè)歷史代碼庫的理解的痛點,,文心快碼全新升級的「企業(yè)級代碼輔助能力」能夠深度理解企業(yè)代碼庫,快速學(xué)習(xí)企業(yè)過往的代碼與規(guī)范,,讓生成的代碼更貼近企業(yè)的要求,。

目前,文心快碼已經(jīng)服務(wù)超過 1 萬家企業(yè)客戶,,整體研發(fā)效率提升 20%,。

0.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。