4 月 17 日消息,4 月 15-19 日,,第 27 屆聯(lián)合國科技大會在瑞士日內(nèi)瓦召開。其間,,世界數(shù)字技術院(WDTA)于 4 月 16 日發(fā)布了一系列突破性成果,,包括《生成式人工智能應用安全測試標準》和《大語言模型安全測試方法》兩項國際標準。
據(jù)中國經(jīng)濟網(wǎng)報道,,這兩項國際標準為大模型及生成式 AI 應用方面的安全測試標準,,代表著全球人工智能安全評估和測試進入新的基準。
這兩項標準由 OpenAI,、螞蟻集團,、科大訊飛、谷歌、微軟,、英偉達,、百度、騰訊等數(shù)十家單位的多名專家學者共同編制而成,,其中《大語言模型安全測試方法》由螞蟻集團牽頭編制,。
《標準》為測試、驗證生成式 AI 應用(尤其是使用大語言模型構建的應用程序)的安全性提供框架,,定義了 AI 應用程序架構每層測試驗證范圍,,包括不限于如下方面。
基礎模型選擇
嵌入和矢量數(shù)據(jù)庫
RAG 或檢索增強生成
AI 應用運行時的安全
《方法》則為大模型本身安全性評估提供了“全面,、嚴謹且實操性強”的結構性方案,,提出了大語言模型的安全風險分類,、攻擊的分類分級方法以及測試方法,。據(jù)報道,《方法》可以解決大語言模型固有的復雜性,,全面測試其抵御敵對攻擊的能力,,使開發(fā)人員和組織能夠識別和緩解潛在漏洞,并最終提高使用大語言模型構建的人工智能系統(tǒng)的安全性和可靠性,。
注:WDTA 系國際非政府組織,,于日內(nèi)瓦注冊。該機構遵從聯(lián)合國指導框架,,致力于在全球范圍內(nèi)推進數(shù)字技術,,促進國際合作。AI STR(安全,、可信,、負責任)計劃是 WDTA 的核心倡議,旨在確保人工智能系統(tǒng)的安全性,、可信性和責任性,。