「第三代人工智能」能幫助我們做什么,?瑞萊智慧 RealAI 用兩年的時(shí)間給出了一個(gè)答案。
「第一代知識(shí)驅(qū)動(dòng)的 AI 利用知識(shí),、算法和算力 3 個(gè)要素構(gòu)造 AI;第二代數(shù)據(jù)驅(qū)動(dòng)的 AI 利用數(shù)據(jù)、算法與算力 3 個(gè)要素構(gòu)造 AI,。由于第一、二代 AI 只是從一個(gè)側(cè)面模擬人類的智能行為,因此存在各自的局限性,,不可能觸及人類真正的智能,。」清華大學(xué)人工智能研究院院長,、中國科學(xué)院院士張鈸等人在今年 9 月份的一篇??恼轮羞@樣寫道。
在這篇文章中,,他們還首次全面闡述了第三代人工智能的理念,,提出第三代人工智能的發(fā)展路徑是融合第一代的知識(shí)驅(qū)動(dòng)和第二代的數(shù)據(jù)驅(qū)動(dòng)的人工智能, 利用知識(shí),、數(shù)據(jù),、算法和算力 4 個(gè)要素, 建立新的可解釋和魯棒的 AI 理論與方法,,發(fā)展安全,、可信、可靠和可擴(kuò)展的 AI 技術(shù)(詳細(xì)信息請(qǐng)參見:《清華張鈸院士??恼拢哼~向第三代人工智能(全文收錄)》),。
其實(shí),早在 2016 年,,張鈸教授就提出了發(fā)展「第三代人工智能」的理念,。在他看來,雖然當(dāng)前的 AI 已經(jīng)取得了一些進(jìn)展,,但仍面臨魯棒性差,、決策不透明等問題,需要把知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)結(jié)合起來解決問題,。
2018 年,,由張鈸、朱軍(清華大學(xué)人工智能研究院基礎(chǔ)理論研究中心主任)擔(dān)任首席科學(xué)家的瑞萊智慧(RealAI)作為產(chǎn)學(xué)研技術(shù)公司從清華大學(xué)人工智能研究院孵化成立,。這家公司的愿景是:以第三代人工智能技術(shù)為依托,,克服一般深度學(xué)習(xí)存在的諸多缺點(diǎn),從根本上增強(qiáng)人工智能的可靠性,、可信性以及安全性,。
兩年后的今天,在「2020 第三代人工智能產(chǎn)業(yè)論壇暨瑞萊智慧 RealAI 戰(zhàn)略發(fā)布會(huì)」上,,RealAI 第一次向外界展示了他們基于第三代人工智能技術(shù)打造的 AI 原生基礎(chǔ)設(shè)施產(chǎn)品藍(lán)圖,。
論壇上,瑞萊智慧 CEO 田天指出,,當(dāng)前 AI 基礎(chǔ)設(shè)施建設(shè)的重心集中在數(shù)據(jù),、算力平臺(tái)上,,主要為 AI 提供基礎(chǔ)運(yùn)算條件和生產(chǎn)力,打個(gè)比方,,相當(dāng)于是解決了 AI 的溫飽問題。數(shù)據(jù)和算力的快速增長作為「外部驅(qū)動(dòng)力」的確帶動(dòng)了 AI 技術(shù)在包括人臉識(shí)別,、語音識(shí)別等領(lǐng)域的快速發(fā)展,,驅(qū)動(dòng) AI 產(chǎn)業(yè)「第一增長曲線」的出現(xiàn)。
但隨著數(shù)據(jù)受場(chǎng)景復(fù)雜與隱私保護(hù)限制,、算力增長緩慢等問題的出現(xiàn),,AI 產(chǎn)業(yè)的第一增長曲線開始放緩。在此情景下,,我們亟需為 AI 產(chǎn)業(yè)打開「數(shù)據(jù)」和「算力」之外的全新維度,,從增強(qiáng)算法底層能力出發(fā),發(fā)展出AI「內(nèi)生驅(qū)動(dòng)力」,。
不過想要加強(qiáng)AI內(nèi)生驅(qū)動(dòng)力,,有幾道「關(guān)卡」需要我們?nèi)ネ黄疲ǜ影踩煽康臎Q策(AI 決策邏輯和鏈路都不明確,、易受攻擊),、數(shù)據(jù)隱私與安全(信息泄露、數(shù)據(jù)孤島)以及 AI 應(yīng)用場(chǎng)景的管控(算法公平,、社會(huì)倫理),。
「作為 AI 產(chǎn)業(yè)的建設(shè)者,我們從基礎(chǔ)設(shè)施的角度看待這一問題,,在繼承自互聯(lián)網(wǎng)時(shí)代的數(shù)據(jù)平臺(tái),、算力平臺(tái)之外,需要建設(shè) AI 原生基礎(chǔ)設(shè)施,,從 AI 技術(shù)自身能力出發(fā)提供必備保障」,,田天表示。
經(jīng)過兩年的努力,,田天等人已經(jīng)給出了這套基礎(chǔ)設(shè)施的藍(lán)圖,。
在算法可靠方面,他們研發(fā)了基于貝葉斯深度學(xué)習(xí)技術(shù)的可解釋 AI 建模平臺(tái) RealBox,。該平臺(tái)在 2019 年正式發(fā)布,,目前已經(jīng)在多家金融機(jī)構(gòu)實(shí)際使用,并且通過了中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟的首批可信 AI 認(rèn)證,。在應(yīng)用可控方面,,他們推出的DeepReal深度偽造檢測(cè)工具,能夠高效精準(zhǔn)地判斷視頻,、圖片等內(nèi)容素材是否是經(jīng)過AI偽造生成的,,避免相應(yīng)輿情,,DeepReal 入選了國家工信安全中心人工智能優(yōu)秀產(chǎn)品,基于其中的核心技術(shù),,RealAI 也獲得了 GeekPwn2020 年深度偽造檢測(cè)項(xiàng)目冠軍,。
除此以外,活動(dòng)現(xiàn)場(chǎng)還發(fā)布了兩款新品,。
其中一款是針對(duì)數(shù)據(jù)安全的RealSecure,,它是業(yè)內(nèi)首個(gè)編譯級(jí)的隱私保護(hù)機(jī)器學(xué)習(xí)平臺(tái),其核心模塊「隱私保護(hù)AI編譯器」能夠自動(dòng)將普通機(jī)器學(xué)習(xí)算法程序轉(zhuǎn)換為分布式,、隱私安全程序,,使隱私安全的人工智能商業(yè)應(yīng)用門檻大幅降低。
另一款是針對(duì)算法可靠發(fā)布的RealSafe2.0,,它是世界首個(gè)企業(yè)級(jí)AI安全平臺(tái)RealSafe的升級(jí)版,,相當(dāng)于是針對(duì)AI模型的殺毒軟件和防火墻。升級(jí)后的RealSafe提供針對(duì)目標(biāo)識(shí)別等算法的安全攻防能力,,同時(shí)增加了后門漏洞檢測(cè)等功能,。
田天表示,「這一系列 AI 原生基礎(chǔ)設(shè)施可以打開 AI 能力的全新維度,,激發(fā) AI 的第二增長曲線,,為 AI 賦能各行各業(yè)帶來全新市場(chǎng)機(jī)會(huì)?!?/p>
業(yè)內(nèi)首個(gè)編譯級(jí)隱私保護(hù)機(jī)器學(xué)習(xí)平臺(tái) RealSecure 亮相
在 AI 的發(fā)展過程中,,數(shù)據(jù)是基礎(chǔ)生產(chǎn)力,用于解決 AI 的「溫飽問題」,。但由于數(shù)據(jù)本身難以獲取,、加工,還涉及行業(yè)機(jī)密,、用戶隱私等問題,,很多數(shù)據(jù)擁有者不愿或不能將數(shù)據(jù)上傳至一個(gè)數(shù)據(jù)中心進(jìn)行模型訓(xùn)練,從而形成了一個(gè)個(gè)的「煙囪」或「孤島」,。
針對(duì)這個(gè)問題,,分布式隱私保護(hù)機(jī)器學(xué)習(xí)是一種新興的解決方案,它能使多方合作完成學(xué)習(xí)目標(biāo),,但又避免各方傳輸原始數(shù)據(jù),,這并不是一個(gè)全新的概念,類似的術(shù)語還包括谷歌等機(jī)構(gòu)提出的「聯(lián)邦學(xué)習(xí)」,,實(shí)現(xiàn)「數(shù)據(jù)不出門,,可用不可見」,但在實(shí)際商業(yè)應(yīng)用中卻面臨三大痛點(diǎn):
第一是學(xué)術(shù)界工業(yè)界公認(rèn)的隱私保護(hù)機(jī)器學(xué)習(xí)最主要的問題—性能差,。隱私保護(hù)機(jī)器學(xué)習(xí)需要多方配合執(zhí)行,,多方需要以加密形式完成參數(shù)交換,,加密帶來了高達(dá)百倍的性能損失。同時(shí)超參數(shù)設(shè)置等與既有機(jī)器學(xué)習(xí)生態(tài)存在差距,,隱私保護(hù)機(jī)器學(xué)習(xí)的速度慢了近千倍,。本地幾十秒的模型訓(xùn)練,隱私保護(hù)下需要數(shù)小時(shí),。而特征篩選,、模型調(diào)參、模型驗(yàn)證又需要幾十上百次重復(fù)建模流程,,為了實(shí)現(xiàn)數(shù)據(jù)安全,極大的犧牲了建模速度,。
第二是隱私保護(hù)機(jī)器學(xué)習(xí)難以大規(guī)模商業(yè)化落地的重要原因—難以兼容現(xiàn)有機(jī)器學(xué)習(xí)生態(tài),。不同于傳統(tǒng)機(jī)器學(xué)習(xí),隱私保護(hù)機(jī)器學(xué)習(xí)是分布式系統(tǒng),、密碼學(xué),、人工智能三個(gè)領(lǐng)域的結(jié)合。為了實(shí)現(xiàn)隱私保護(hù)的目標(biāo),,各家機(jī)構(gòu)要組織團(tuán)隊(duì)學(xué)習(xí)分布式系統(tǒng),、學(xué)習(xí)密碼學(xué);學(xué)習(xí)使用新算法,、新框架,,并在新平臺(tái)下執(zhí)行程序。這也意味著,,AI 團(tuán)隊(duì)長期以來積累下的經(jīng)驗(yàn)和方法論在隱私保護(hù)機(jī)器學(xué)習(xí)領(lǐng)域無法直接運(yùn)用,,重建或改寫的投入與代價(jià)非常之大。
第三隱私保護(hù)最核心的問題是保障數(shù)據(jù)財(cái)產(chǎn)的安全,,這也意味著,,平臺(tái)自身的安全性應(yīng)該是可被檢驗(yàn)的。現(xiàn)有模式都是純黑盒運(yùn)行,,安全性檢驗(yàn)完全依賴專家背書,,但整個(gè)平臺(tái)代碼量巨大,專家逐行審計(jì)模式難以實(shí)現(xiàn),。而且實(shí)際生產(chǎn)環(huán)境中,,是否真的按照審計(jì)時(shí)提供的代碼邏輯執(zhí)行,也都難以保障,。
隱私保護(hù)機(jī)器學(xué)習(xí)平臺(tái) RealSecure 就是在以上需求下誕生的,,它首創(chuàng)以底層數(shù)據(jù)流圖的視角揭示機(jī)器學(xué)習(xí)算法與對(duì)應(yīng)分布式隱私保護(hù)機(jī)器學(xué)習(xí)算法的聯(lián)系,通過算子組合將機(jī)器學(xué)習(xí)生態(tài)與隱私保護(hù)機(jī)器學(xué)習(xí)生態(tài)一脈打通,,解決企業(yè)搭建隱私保護(hù)生態(tài)面臨著的性能差,、易用性差,、黑盒協(xié)議等諸多難題,實(shí)現(xiàn)兩大生態(tài)的一體化,。
得益于底層編譯級(jí)的能力,,RSC 具備三大優(yōu)勢(shì):
性能強(qiáng)勁。借助密碼學(xué)優(yōu)化,、AI 算法優(yōu)化等改進(jìn)實(shí)現(xiàn),,模型訓(xùn)練相比某主流國產(chǎn)開源框架(最新版)性能提升約 40 倍,耗時(shí)從 4 小時(shí) 40 分鐘縮減至 6 分鐘,??紤]到特征工程與自動(dòng)調(diào)參環(huán)境,隱私保護(hù)下完成全流程建模,,總耗時(shí)實(shí)現(xiàn)從日級(jí)別到小時(shí)級(jí)別的飛躍,。
無感應(yīng)用。實(shí)現(xiàn)機(jī)器學(xué)習(xí)生態(tài)與隱私保護(hù)機(jī)器學(xué)習(xí)生態(tài)的「一脈相承」,,僅需要少量改動(dòng),,可以通過自動(dòng)轉(zhuǎn)換完成機(jī)器學(xué)習(xí)算法平臺(tái)框架與隱私保護(hù)機(jī)器學(xué)習(xí)平臺(tái)框架的統(tǒng)一,數(shù)據(jù)科學(xué)家能夠以與機(jī)器學(xué)習(xí)建模相同的方式使用隱私保護(hù)機(jī)器學(xué)習(xí),,易用性大幅提升,。
安全透明。真正的隱私保護(hù)學(xué)習(xí)應(yīng)用應(yīng)該是白盒可驗(yàn)證的,,所有底層執(zhí)行的計(jì)算是可審計(jì)的,,這樣才能保證隱私保護(hù)學(xué)習(xí)平臺(tái)的安全性。RealSecure 以數(shù)據(jù)流圖形式,,將中間計(jì)算過程公開,,實(shí)現(xiàn)計(jì)算過程的安全透明。
RealAI 表示,,易用性與性能的顛覆性提升,,也讓 RealSecure 成為更快更容易應(yīng)用到商業(yè)環(huán)境的「企業(yè)級(jí)」隱私保護(hù)機(jī)器學(xué)習(xí)平臺(tái)。
在發(fā)布會(huì)現(xiàn)場(chǎng),,田天還闡明了他們開發(fā)這兩款產(chǎn)品的理念:「當(dāng)在應(yīng)用中碰到技術(shù)難題時(shí),,我們不是見一個(gè)解決一個(gè),修修補(bǔ)補(bǔ),;而是發(fā)現(xiàn)一個(gè)問題就看到一類問題,,并通過底層技術(shù)框架、平臺(tái)的突破,,助力產(chǎn)業(yè)的升級(jí),。今天我們重點(diǎn)發(fā)布的兩款新品都是這一理念的典型代表,它們的產(chǎn)品定位,、功能和價(jià)值都是獨(dú)一無二,,RealAI 首創(chuàng),。」
世界首款企業(yè)級(jí) AI 安全平臺(tái) RealSafe 迎來 2.0
在網(wǎng)絡(luò)安全時(shí)代,,網(wǎng)絡(luò)攻擊的大規(guī)模滲透催生出一大批殺毒軟件,。但隨著 AI 逐漸成為基礎(chǔ)設(shè)施的一部分,針對(duì) AI 模型的「殺毒軟件」卻一直處于缺位狀態(tài),。
這種缺位存在巨大的安全隱患,。數(shù)據(jù)顯示,去年就已經(jīng)有超過 40% 的手機(jī)配備了人臉識(shí)別方案,,但其中一些通過一副印有特殊紋理圖案的眼鏡就能輕松解鎖,。
如果說手機(jī)影響的只是隱私和財(cái)產(chǎn)安全,那自動(dòng)駕駛系統(tǒng)的安全漏洞則是真正的致命威脅,。國際管理咨詢公司(Roland Berger)預(yù)測(cè),,2020 年全球自動(dòng)駕駛車端系統(tǒng)的市場(chǎng)規(guī)模有望超過 1000 億美元。但與此同時(shí),,黑客只需要在標(biāo)識(shí)牌上加上特定圖案就可以讓機(jī)器把限速標(biāo)識(shí)識(shí)別為停止標(biāo)識(shí),導(dǎo)致致命事故的發(fā)生,。
要徹底解決這些問題,,我們需要理解深度神經(jīng)網(wǎng)絡(luò)等 AI 算法是如何學(xué)習(xí)和工作的,但直到今天,,我們?nèi)詫?duì)此知之甚少,。因此,我們可能需要換一個(gè)思路,。
對(duì)此,,RealAI 給出的解決方案是:模型安全檢測(cè) + 防御。也就是說,,我們可以先通過多種攻擊方法對(duì)模型的安全風(fēng)險(xiǎn)類別和高低進(jìn)行檢測(cè),,然后提供多種方案提升模型的安全性。這就是他們今年年初推出的世界首款企業(yè)級(jí) AI 安全平臺(tái)——RealSafe,。
在安全檢測(cè)階段,,RealSafe 會(huì)利用多種攻擊算法生成不同迭代次數(shù)、擾動(dòng)大小的對(duì)抗樣本進(jìn)行模擬攻擊,,嘗試使其出錯(cuò),,然后統(tǒng)計(jì)其出錯(cuò)的概率和分布,輸出檢測(cè)報(bào)告,。該平臺(tái)相當(dāng)于一款「殺毒軟件」,,整個(gè)檢測(cè)過程全界面化操作,用戶無需具備專業(yè)的模型安全算法知識(shí)和編程開發(fā)經(jīng)驗(yàn),。
在防御階段,,RealSafe 支持多種去除對(duì)抗噪聲的通用防御方法,,可實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的自動(dòng)去噪處理,破壞攻擊者惡意添加的對(duì)抗噪聲,。同時(shí),,RealSafe 也支持檢測(cè)輸入數(shù)據(jù)是否含有對(duì)抗樣本,這種防御方式在模型和輸入數(shù)據(jù)之間構(gòu)建了一道「防火墻」,,將有攻擊意圖的數(shù)據(jù)擋在了模型之外,。
今年 4 月份,RealAI 發(fā)布了 RealSafe 1.0,,可用于提高人臉識(shí)別模型的安全性,,提高應(yīng)對(duì)對(duì)抗樣本攻擊(如上文中印有特殊紋理圖案的眼鏡)的能力。幾個(gè)月后的今天,,RealSafe 實(shí)現(xiàn)了快速迭代,,2.0 版本正式上線。與 RealSafe 1.0 相比,,2.0 版本在支持防御的攻擊類型,、適用范圍等方面進(jìn)行了擴(kuò)展。
首先,,在檢測(cè)抗對(duì)抗樣本攻擊的安全性基礎(chǔ)上,,新版本增加了「模型后門攻擊」自動(dòng)化檢測(cè),可以針對(duì)模型每個(gè)類別搜索并還原后門觸發(fā)器的最終結(jié)果,,并依據(jù)還原結(jié)果的離散程度判別模型是否被植入后門,。此外,測(cè)試報(bào)告還可以展示出模型被植入后門的類別以及對(duì)應(yīng)的后門所在區(qū)域,。
「模型后門攻擊」是一種新興的針對(duì)機(jī)器學(xué)習(xí)模型的攻擊方式,,攻擊者會(huì)在模型中埋藏后門,使得被感染的模型在一般情況下表現(xiàn)正常,。但當(dāng)后門觸發(fā)器被激活時(shí),,模型的輸出將變?yōu)楣粽哳A(yù)先設(shè)置的惡意目標(biāo)。由于模型在后門未被觸發(fā)之前表現(xiàn)正常,,因此這種惡意的攻擊行為很難被發(fā)現(xiàn),。雖然目前來看這種攻擊方式在實(shí)際場(chǎng)景中還不太常見,但針對(duì)可能存在的攻擊對(duì)算法進(jìn)行加固仍然具有重要意義,。這也表現(xiàn)了 RealAI 在產(chǎn)品布局上的前瞻性,。
其次,2.0 版的 RealSafe 將適用范圍擴(kuò)展到了目標(biāo)檢測(cè),、圖像分類等底層 AI 模型,。前者的典型應(yīng)用場(chǎng)景包括安防場(chǎng)景中的人體檢測(cè)、車輛、無人機(jī)檢測(cè),,以及自動(dòng)駕駛場(chǎng)景中的人體檢測(cè),、車輛檢測(cè)等。后者的典型應(yīng)用場(chǎng)景包括社交網(wǎng)絡(luò)與短視頻應(yīng)用的色情,、暴恐,、侵權(quán)元素的識(shí)別,手機(jī)相冊(cè)的自動(dòng)分類等,。這些場(chǎng)景也是目前 AI 模型應(yīng)用最廣泛,、安全需求最迫切的領(lǐng)域。
在進(jìn)行安全性檢測(cè)后,,RealSafe 平臺(tái)還提供了多種功能幫助用戶提升 AI 模型安全性,。以對(duì)抗樣本去噪為例,平臺(tái)將自動(dòng)針對(duì)已被測(cè)的模型,,量化出多種通用對(duì)抗樣本去噪方案對(duì)模型安全性的提升效果,,便于用戶選擇最適合當(dāng)前被測(cè)模型的防御解決方案。
RealSafe 集成了多項(xiàng)國際領(lǐng)先的 AI 對(duì)抗攻防算法,,榮獲多項(xiàng)世界 AI 安全大賽冠軍,。與業(yè)界已有的一些人工智能對(duì)抗技術(shù)工具包相比,RealSafe 還具有支持基于生成模型的對(duì)抗樣本攻防,、支持黑盒檢測(cè),、零代碼易上手等優(yōu)勢(shì)。
目前,,RealSafe 已在工信部重大建設(shè)項(xiàng)目以及某電網(wǎng)公司落地應(yīng)用。
RealAI 表示,,未來,,RealSafe 還將提供應(yīng)對(duì)模型竊取、數(shù)據(jù)逆向還原等新型 AI 安全風(fēng)險(xiǎn)的解決方案,。
底層技術(shù)與應(yīng)用場(chǎng)景
為了打造基于第三代 AI 的基礎(chǔ)設(shè)施,,RealAI 應(yīng)用了多項(xiàng)技術(shù),包括:
貝葉斯深度學(xué)習(xí):將深度學(xué)習(xí)和貝葉斯方法的優(yōu)勢(shì)有機(jī)結(jié)合,,將數(shù)據(jù)和預(yù)測(cè)結(jié)果中天然存在的不確定性納入考慮,,提升 AI 模型的泛化能力,從而實(shí)現(xiàn)可靠可解釋的 AI,;
可解釋機(jī)器學(xué)習(xí):保證在建模過程中,,從關(guān)鍵特征和決策相關(guān)依據(jù)等不同維度給出解釋,增進(jìn)人們對(duì) AI 結(jié)果的理解,;
AI 安全對(duì)抗攻防:通過對(duì)抗的方式發(fā)現(xiàn) AI 算法存在漏洞的機(jī)理,,并通過對(duì)抗防御技術(shù)指導(dǎo)魯棒 AI 算法和系統(tǒng)研發(fā);
新一代知識(shí)圖譜:將領(lǐng)域知識(shí)引入到 AI 建模中,實(shí)現(xiàn)知識(shí)與數(shù)據(jù)的共同驅(qū)動(dòng),;
隱私保護(hù)機(jī)器學(xué)習(xí):解決 AI 場(chǎng)景下的數(shù)據(jù)流通問題,,實(shí)現(xiàn)在明文數(shù)據(jù)不出庫的情況下,通過與密碼學(xué)和分布式系統(tǒng)結(jié)合的方式,,支持 AI 模型的訓(xùn)練和預(yù)測(cè),;同時(shí)保證 AI 對(duì)數(shù)據(jù)的用量和用途,控制權(quán)屬和收益,。
……
這些技術(shù)的運(yùn)用極大地提高了 AI 技術(shù)在現(xiàn)實(shí)場(chǎng)景中的可用性,。RealAI的AI基礎(chǔ)設(shè)施產(chǎn)品已經(jīng)用于解決金融風(fēng)控場(chǎng)景中的數(shù)據(jù)有偏、資產(chǎn)配置效率低,、基建場(chǎng)景中的數(shù)據(jù)缺失等問題,。
為了進(jìn)一步從研究、平臺(tái),、產(chǎn)業(yè)賦能三方面持續(xù)發(fā)力,,加速安全、可信,、可靠的產(chǎn)業(yè)智能化升級(jí),,RealAI 也與北京智源人工智能研究院聯(lián)合成立安全人工智能創(chuàng)新中心,助力人工智能產(chǎn)業(yè)負(fù)責(zé)任發(fā)展,。
AI 基礎(chǔ)設(shè)施的建設(shè)是一項(xiàng)長期任務(wù),,田天表示,RealAI 將「堅(jiān)持長期主義,,推動(dòng) AI 更高質(zhì)量的服務(wù)于人類社會(huì),。」