《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 百度全面升級百舸AI異構計算平臺4.0和千帆大模型平臺3.0

百度全面升級百舸AI異構計算平臺4.0和千帆大模型平臺3.0

2024-09-26
來源:IT之家

9 月 25 日消息,,2024 百度云智大會今日在北京召開,,百度在大會上宣布全面升級百舸 AI 異構計算平臺 4.0、千帆大模型平臺 3.0 兩大 AI 基礎設施,,并升級代碼助手,、智能客服,、數(shù)字人三大 AI 原生應用產(chǎn)品。

百度智能云事業(yè)群總裁沈抖表示:“2024 年大模型的產(chǎn)業(yè)落地正在加速,,目前在千帆大模型平臺上,,文心大模型日均調用量超過 7 億次,,累計幫助用戶精調了 3 萬個大模型,開發(fā)出 70 多萬個企業(yè)級應用,。過去一年,,文心旗艦大模型降價幅度超過 90%,主力模型全面免費,?!?/p>

升級百舸 4.0

為滿足企業(yè)落地大模型從集群創(chuàng)建、開發(fā)實驗,,到模型訓練,、推理的全旅程算力需求,百度智能云升級發(fā)布百舸 AI 異構計算平臺 4.0,,面向萬卡,、十萬卡集群全面升級算力管理能力。

集群創(chuàng)建階段:百舸 4.0 預置了主流的大模型訓練工具,,能夠實現(xiàn)工具層面的秒級部署,,并將萬卡集群運行準備時間從幾周縮減至 1 小時。

0.png

開發(fā)實驗階段:企業(yè)需要針對業(yè)務目標對不同架構,、參數(shù)的模型進行多次測試,,進而制定最佳模型訓練策略,保障后續(xù)訓練的性能和效果,。百舸 4.0 全新升級的可觀測大盤,,能夠對多芯適配、集群效能,、任務自動容錯等方面進行全方位監(jiān)測,。

模型訓練階段:百舸 4.0 能夠自動篩查集群狀態(tài),并基于對 GPU 故障的預測,,及時轉移工作負載,,降低故障發(fā)生頻次。此外,,百舸故障秒級感知定位,、Flash Checkpoint 模型任務狀態(tài)回滾等技術,能夠減少集群故障處置時間,。

百度官方表示,,目前百舸在萬卡集群上實現(xiàn)了有效訓練時長占比 99.5% 以上。此外,,百舸 4.0 通過集群設計,、任務調度、并行策略,、顯存優(yōu)化等一系列升級,,整體性能相比業(yè)界平均水平提升 30%,。

在模型推理環(huán)節(jié),百舸則通過架構分離,、KV Cache,、負載分配等一系列加速方法,實現(xiàn)了模型推理的降本提效,,尤其在長文本推理方面,,推理效率號稱提升超過 1 倍。

百舸 4.0 號稱已經(jīng)構建了十萬卡級別的超大規(guī)模無擁塞 HPN 高性能網(wǎng)絡,、10ms 級別超高精度網(wǎng)絡監(jiān)控,,以及面向十萬卡集群的分鐘級故障恢復能力。

千帆 3.0,,三大服務升級

為了滿足企業(yè)客戶對模型調用,、模型開發(fā)、應用開發(fā)的需求,,百度智能云發(fā)布千帆大模型平臺 3.0,。

模型調用方面:升級后的千帆平臺,不但可以調用包括文心系列大模型在內的近百個國內外大模型,,還支持調用語音,、視覺等各種傳統(tǒng)的小模型。過去一年,,文心旗艦大模型降價幅度超過 90%,、主力模型全面免費。

0.png

模型開發(fā)方面:對于需要定制,、微調專屬模型的客戶,,千帆 3.0 不僅提供了大模型工具鏈,還支持 CV,、NLP,、語音等傳統(tǒng)模型的開發(fā),并實現(xiàn)數(shù)據(jù),、模型,、算力等資源的統(tǒng)一納管和調度。

0.png

模型投入使用后,,千帆平臺還支持企業(yè)將應用中產(chǎn)生的數(shù)據(jù),經(jīng)過采樣評估,、人工標注,、對齊或微調等方式反饋給模型,形成數(shù)據(jù)飛輪,。

應用開發(fā)方面:針對企業(yè)落地大模型的高頻應用場景,,千帆 3.0 從檢索效果,、檢索性能、存儲擴展,、調配靈活性四方面對企業(yè)級檢索增強生成(RAG)進行了升級,;針對企業(yè)級 Agent 的開發(fā),千帆 3.0 增加了業(yè)務自主編排,、人工編排,、知識注入、記憶能力以及百度搜索等 80 多個官方組件支持,。

此外,,本次大會還發(fā)布了智能化低代碼應用開發(fā)平臺“AI 速搭”,通過自然語言對話就能進行企業(yè)級應用開發(fā),。

代碼助手,、智能客服、數(shù)字人升級

為了滿足企業(yè)直接選購成熟 AI 應用的需求,,百度智能云面向數(shù)字人,、智能客服、代碼提效,,升級了三大 AI 原生應用產(chǎn)品,,IT之家匯總升級內容如下:

1、基于文心大模型重構的 AI 原生智能客服應用“客悅”:

在用戶復雜意圖理解,、多模態(tài)信息交流等方面實現(xiàn)了大幅提升,,讓智能客服變得更聰明、更擬人,。

“問題自助解決率”是智能客服領域最關鍵的考核指標,,當前業(yè)內平均水平是 80%,升級后,,客悅將這一指標提升至 92%,。

目前,客悅已累計幫助企業(yè)客戶服務超過 1.5 億人次,,交互超過 5 億次,。

2、基于大模型能力,,新升級的曦靈數(shù)字人 4.0:

支持根據(jù)文字快速生成不同妝造,、不同行業(yè)特色的 3D 數(shù)字人形象和視頻。本次大會期間,,曦靈平臺宣布:將 3D 超寫實數(shù)字人的價格從萬元降價至 199 元,。

全新升級的 4D(3D + 時間維度)自動綁定技術和創(chuàng)新模態(tài)遷移技術,還解決了傳統(tǒng) 2D 數(shù)字人動作僵硬的問題,可以實現(xiàn)人物在不同角度,、形體,、表情的高度一致,即使是面部微表情也能做到自然,、逼真,。

3、全新升級的全流程 AI 代碼提效工具“文心快碼”:

本次大會,,文心快碼業(yè)界首發(fā)「企業(yè)級代碼架構解釋」,、「企業(yè)級代碼審查」兩項全新功能。企業(yè)級代碼架構解釋能在項目接手初期,,實現(xiàn)工程架構的智能解讀,,幫工程師快速理解業(yè)務邏輯;而企業(yè)級代碼審查則能傳承資深工程師的編碼經(jīng)驗,,智能輔助程序員查缺補漏,。

此外,針對市面上通用代碼助手缺乏對企業(yè)歷史代碼庫的理解的痛點,,文心快碼全新升級的「企業(yè)級代碼輔助能力」能夠深度理解企業(yè)代碼庫,,快速學習企業(yè)過往的代碼與規(guī)范,讓生成的代碼更貼近企業(yè)的要求,。

目前,,文心快碼已經(jīng)服務超過 1 萬家企業(yè)客戶,整體研發(fā)效率提升 20%,。

0.png


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉載的所有的文章,、圖片、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容、版權和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]