8 月 10 日消息,OpenAI 公司于 8 月 8 日發(fā)布報(bào)告,概述了 GPT-4o 模型的系統(tǒng)卡(System Card),,介紹了包括外部紅隊(duì)(模擬敵人攻擊),、準(zhǔn)備框架(Preparedness Framework)在內(nèi)的諸多細(xì)節(jié)。
OpenAI 表示 GPT-4o 模型的核心就是準(zhǔn)備框架(Preparedness Framework),,這是一種評(píng)估和降低人工智能系統(tǒng)相關(guān)風(fēng)險(xiǎn)的系統(tǒng)方法,。IT之家從報(bào)道中獲悉,,該框架主要用于識(shí)別網(wǎng)絡(luò)安全,、生物威脅、說(shuō)服和模型自主性等領(lǐng)域的潛在危險(xiǎn),。
除了針對(duì) GPT-4 和 GPT-4V 進(jìn)行的安全評(píng)估和緩解措施外,,OpenAI 還針對(duì) GPT-4o 的音頻功能開(kāi)展了更多安全工作。
評(píng)估的風(fēng)險(xiǎn)包括揚(yáng)聲器識(shí)別,、未經(jīng)授權(quán)的語(yǔ)音生成,、受版權(quán)保護(hù)內(nèi)容的潛在生成、無(wú)根據(jù)推斷以及不允許的內(nèi)容,?;谶@些評(píng)估結(jié)果,OpenAI 在模型和系統(tǒng)層面都實(shí)施了保障措施,。
OpenAI 還與 100 多名外部紅隊(duì)人員合作,,在向公眾發(fā)布模型之前對(duì)其進(jìn)行評(píng)估。紅隊(duì)人員將進(jìn)行探索性的能力發(fā)現(xiàn),,評(píng)估模型帶來(lái)的新的潛在風(fēng)險(xiǎn),,并對(duì)緩解措施進(jìn)行壓力測(cè)試。