近日,國內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單,。本次評測選取海內(nèi)外24個(gè)具有代表性的大模型,,結(jié)果顯示,山海大模型對齊,、智能體,、安全等多項(xiàng)能力全球領(lǐng)跑。
持續(xù)升級,,多項(xiàng)能力全球領(lǐng)跑
作為國內(nèi)權(quán)威通用大模型綜合性測評基準(zhǔn),,SuperBench由清華大學(xué)人工智能研究院基礎(chǔ)模型研究中心聯(lián)合中國人民大學(xué),、中關(guān)村實(shí)驗(yàn)室共同發(fā)起,旨在為大模型領(lǐng)域提供一套客觀,、科學(xué)的評測標(biāo)準(zhǔn),,促進(jìn)大模型技術(shù)、應(yīng)用和生態(tài)健康發(fā)展,。
此次SuperBench評測數(shù)據(jù)集包含語義,、對齊、代碼,、智能體,、安全、數(shù)理邏輯和指令遵循,,共涵蓋七大類,,32個(gè)子類。評測數(shù)據(jù)顯示:
在人類對齊能力評測中,,山海大模型3.0得分8.21分,,排名全球第五、國內(nèi)第二,。其中,,山海大模型在中文語言方面的表現(xiàn)極為出色,以8.41分的成績與o1-preview并列全球第二,。在中文語言細(xì)分項(xiàng)中,,山海大模型在基本任務(wù)、綜合問答,、文本寫作3項(xiàng)分類評測中均躋身Top3,,并在文本寫作評測中榮獲第一。
在智能體能力評測中,,山海大模型3.0得分3.44分,,排名全球第七、國內(nèi)第五,。其中,,山海大模型在網(wǎng)絡(luò)購物方面的表現(xiàn)超過70分,位列全球第二,,對比國外模型領(lǐng)先優(yōu)勢明顯,。
在安全和價(jià)值觀能力評測中,山海大模型3.0得分89.4分,,位居全球第二,。其中,山海大模型在倫理道德,、攻擊冒犯,、身體健康,、隱私財(cái)產(chǎn)四個(gè)細(xì)分評測項(xiàng)中均位列三甲,并在身體健康和隱私財(cái)產(chǎn)評測中獲得第一,。
自2023年5月問世以來,,山海大模型已相繼在OpenCompass大模型評測、SuperCLUE中文大模型基準(zhǔn)測評,、MedBench評測,、Flageval大模型評測等多個(gè)權(quán)威評測中屢創(chuàng)佳績,充分展現(xiàn)出業(yè)界一流的通用能力和領(lǐng)先于世界的行業(yè)大模型能力,。
此次評測,,是山海大模型綜合能力的又一次集中展現(xiàn),也標(biāo)志著其技術(shù)迭代和創(chuàng)新發(fā)展達(dá)到了一個(gè)新的高度,。
加速落地,,擁抱更多應(yīng)用場景
大模型必須結(jié)合實(shí)際場景才能真正創(chuàng)造價(jià)值。作為大模型產(chǎn)業(yè)化落地的先行者,,云知聲也在積極推動(dòng)山海大模型與具體行業(yè)場景的深度結(jié)合,,將理論中的技術(shù)創(chuàng)新轉(zhuǎn)化為新質(zhì)生產(chǎn)力,為各行各業(yè)帶來前所未有的效率提升和價(jià)值創(chuàng)造,。
目前,,山海大模型已在智慧醫(yī)療、智慧座艙,、智慧交通,、智慧營銷、智慧政務(wù),、智慧司法等場景實(shí)現(xiàn)落地應(yīng)用。
在智慧醫(yī)療領(lǐng)域,,云知聲基于山海大模型,,打造門診病歷生成系統(tǒng)、手術(shù)病歷撰寫助手,、商保智能理賠系統(tǒng)等醫(yī)療產(chǎn)品,,專注醫(yī)療服務(wù)提質(zhì)增效,為患者帶來更優(yōu)質(zhì)均衡的醫(yī)療體驗(yàn),。例如,,針對門診場景中的病歷撰寫需求,門診病歷生成系統(tǒng)可實(shí)現(xiàn)診室復(fù)雜環(huán)境下的降噪,、醫(yī)患角色區(qū)分,、信息摘要及病歷自動(dòng)生成等功能,有效提升病歷書寫效率,,切實(shí)為醫(yī)務(wù)人員減負(fù),。目前,,門診病歷生成系統(tǒng)已在北京友誼醫(yī)院上線應(yīng)用,得到院方的高度認(rèn)可和一致好評,。
在智慧座艙領(lǐng)域,,云知聲依托山海大模型重構(gòu)語音識別、語義理解,、語音合成的全鏈路語音方案,,基于大模型的理解與生成能力,賦能用車,、出游,、主動(dòng)關(guān)懷、健康,、通用聊天等多個(gè)細(xì)分場景,,讓座艙體驗(yàn)從簡單的語音交互邁向全面智能的個(gè)性化交互。
在智慧交通領(lǐng)域,,云知聲以山海大模型為核心,,數(shù)據(jù)和創(chuàng)新為兩大引擎,云知聲構(gòu)建起覆蓋軌道交通,、公交交通,、航空交通、交通樞紐,、道路交通等多個(gè)細(xì)分場景的智慧大交通全景圖,,全方位、多維度賦能交通產(chǎn)業(yè),,驅(qū)動(dòng)城市交通向智能化,、高效化方向邁進(jìn)。目前,,包括廈門高崎機(jī)場數(shù)智客服,、廈門地鐵智能客服系統(tǒng)、南寧火車東站智慧客服屏,、青島全息屏智能交互服務(wù)終端等在內(nèi)的多款交通創(chuàng)新應(yīng)用已投入使用,,共同引領(lǐng)未來交通出行新體驗(yàn)。
在智慧營銷領(lǐng)域,,云知聲基于山海大模型,,融合積累多年的智能語音技術(shù),打造藍(lán)藻AI內(nèi)容創(chuàng)作平臺,,為用戶提供AI聲音克隆,、AI文字配音、AI文案創(chuàng)作,、AI智播等服務(wù),,助力內(nèi)容生產(chǎn)更快,,更好,更具個(gè)性化,,打造內(nèi)容營銷新質(zhì)生產(chǎn)力,。
隨著技術(shù)提升和應(yīng)用場景的不斷拓展,未來大模型市場競爭將持續(xù)加劇,,進(jìn)一步推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)升級,。接下來,云知聲將繼續(xù)保持大模型能力穩(wěn)步提升,,以山海為抓手,,在產(chǎn)業(yè)側(cè)實(shí)現(xiàn)加速落地,引領(lǐng)千行百業(yè)向更智能,、更高效,、更可持續(xù)的方向發(fā)展。