《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布通用大模型評測標準

中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布通用大模型評測標準

2024-10-14
來源:C114通信網(wǎng)

10月12日,在2024中國移動全球合作伙伴大會期間,,中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布大模型評測體系建設(shè)的重要成果《通用大模型評測標準》,,為產(chǎn)業(yè)界遴選優(yōu)質(zhì)大模型提供重要參考依據(jù)。中國移動總經(jīng)理何飚,、副總經(jīng)理高同慶,,電子標準院、中國電信,、國家電網(wǎng),、中國石油、中國物流,、南方電網(wǎng),、阿里、科大訊飛,、智譜等聯(lián)合編制單位領(lǐng)導(dǎo)出席發(fā)布儀式,。

1.jpg

大模型評測是助力人工智能賦能行業(yè)應(yīng)用的重要一環(huán)。當前眾多企業(yè)已啟動大模型建設(shè),,亟需建立配套的通用大模型和行業(yè)大模型評測體系,。為發(fā)揮大模型評測領(lǐng)域的引領(lǐng)作用,中國移動聯(lián)合電子標準院及16家重點央企共同開展大模型評測體系建設(shè)工作,。第一階段將圍繞通用領(lǐng)域和4個重點行業(yè)領(lǐng)域,,從評測標準制定、評測基地建設(shè),、評測試點應(yīng)用等方面開展工作,。

目前,中國移動攜手央企及產(chǎn)業(yè)各方遵循“確保評測權(quán)威,、加強業(yè)界協(xié)同,、解決實際問題,、保持開放態(tài)度”的原則,初步完成通用大模型評測標準制定,,得到行業(yè)龍頭央企,、業(yè)界頭部公司、知名高校及科研機構(gòu)充分認可,,為后續(xù)試點評測等工作奠定了堅實基礎(chǔ),。

通用大模型評測標準基于“2-4-6”框架?!?”代表兩類評測視角,,以重點行業(yè)實際使用需求為導(dǎo)向,與國標對模型能力要求拉齊,,將評測任務(wù)劃分為理解和生成兩類視角,。“4”代表四類評測要素,,從評測全生命周期中提取出評測工具,、評測數(shù)據(jù)、評測方式和評測指標四類關(guān)鍵要素,,確保評測工作可實施性,。“6”代表六大評測維度,,綜合考慮大模型應(yīng)用過程中的核心能力,,設(shè)定功能性、準確性,、可靠性,、安全性、交互性和應(yīng)用性六大維度,。該標準廣泛吸納產(chǎn)學(xué)研用各方意見,,并結(jié)合行業(yè)特色場景需求,可為通用大模型全面評估提供客觀依據(jù),,為AI賦能千行百業(yè)提供保障,。

未來,中國移動將聯(lián)合行業(yè)龍頭企業(yè),、業(yè)界頭部公司,、知名高校和科研機構(gòu),深入挖掘石油,、電力,、交通和物流等重點行業(yè)應(yīng)用需求,持續(xù)打造并完善通用及行業(yè)大模型評測體系,,積極建設(shè)大模型評測基地,,廣泛征集各中央企業(yè)及頭部民企積極參與大模型評測,,打造落地應(yīng)用最佳實踐,為提升AI+行業(yè)新質(zhì)生產(chǎn)力,,保障國產(chǎn)大模型高質(zhì)量發(fā)展,,貢獻央企力量。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]