盡管歐盟的 《通用數(shù)據(jù)保護(hù)條例》(GDPR)和加利福尼亞的《加州消費(fèi)者隱私法案》(CCPA)等數(shù)據(jù)隱私立法旨在防止隱私泄露,,但消費(fèi)者的隱私仍然經(jīng)常受到黑客,、公司和政府的侵犯,。隨著企業(yè)與第三方公司共享消費(fèi)者數(shù)據(jù)以獲取洞察力,、改善服務(wù)或?qū)?shù)據(jù)資產(chǎn)貨幣化,,這種情況正在不斷加劇,。隱私增強(qiáng)技術(shù)(PET)使企業(yè)能夠利用越來(lái)越多的數(shù)據(jù),,同時(shí)確保個(gè)人或敏感信息保持私密性,。
例如,,人工智能公司和人工智能顧問(wèn)經(jīng)常會(huì)遇到這個(gè)問(wèn)題,,因?yàn)樗麄冃枰褂每蛻魯?shù)據(jù)來(lái)構(gòu)建機(jī)器學(xué)習(xí)模型,這時(shí)候就需要一種安全的方式來(lái)訪問(wèn)客戶數(shù)據(jù),,而隱私增強(qiáng)技術(shù)可以實(shí)現(xiàn)這一點(diǎn),。
什么是隱私增強(qiáng)技術(shù)(PET)
隱私增強(qiáng)技術(shù)是一個(gè)籠統(tǒng)的術(shù)語(yǔ),包括在隱私信息采集,、存儲(chǔ),、以及在執(zhí)行搜索或分析過(guò)程中對(duì)于保護(hù)和增強(qiáng)隱私安全性的數(shù)據(jù)安全技術(shù),旨在提取數(shù)據(jù)價(jià)值,,以充分發(fā)揮其商業(yè),、科學(xué)和社會(huì)價(jià)值,但同時(shí)又不會(huì)危及這些信息的隱私和安全性,。
為什么隱私增強(qiáng)技術(shù)(PET)現(xiàn)在很重要,?
與任何其他數(shù)據(jù)隱私解決方案一樣,隱私增強(qiáng)技術(shù)對(duì)于企業(yè)來(lái)說(shuō)很重要,,原因有以下三點(diǎn):
GDPR和CCPA等數(shù)據(jù)保護(hù)法案正在迫使組織保護(hù)消費(fèi)者數(shù)據(jù),。因?yàn)橐坏┌l(fā)生數(shù)據(jù)泄露,企業(yè)可能需要支付高額罰款,。根據(jù)DLA Piper 《2020年GDPR數(shù)據(jù)泄露調(diào)查》報(bào)告顯示,,罰款舉措已經(jīng)落實(shí),從2018年5月到2020年1月,,GDPR罰款金額已經(jīng)超過(guò)1.26億美元,。
由于您的企業(yè)在分析和應(yīng)用程序測(cè)試方面缺乏自給自足的能力,因此數(shù)據(jù)可能需要由第三方組織進(jìn)行測(cè)試,。隱私增強(qiáng)技術(shù)能夠在數(shù)據(jù)共享的同時(shí)實(shí)現(xiàn)隱私保護(hù),。
隱私泄露可能會(huì)損害您的企業(yè)聲譽(yù),企業(yè)或客戶(取決于您的商業(yè)模式)可能終止與您的合作,。一個(gè)例子就是劍橋分析公司丑聞后Facebook的股價(jià)下跌,。
常見(jiàn)的隱私增強(qiáng)技術(shù)示例
密碼算法
1. 同態(tài)加密
同態(tài)加密是一種加密方法,被廣泛認(rèn)為是加密的“圣杯”,,允許對(duì)加密密文進(jìn)行計(jì)算,。它生成一個(gè)加密結(jié)果,,當(dāng)解密時(shí),該結(jié)果匹配操作的結(jié)果,,就好像它們是在未加密的數(shù)據(jù)(即明文)上執(zhí)行的一樣,。這使得加密數(shù)據(jù)能夠被傳輸、分析并返回給數(shù)據(jù)所有者,,數(shù)據(jù)所有者可以解密信息并查看原始數(shù)據(jù)的結(jié)果,。因此,公司可以出于分析目的與第三方共享敏感數(shù)據(jù),。
同態(tài)加密不是一項(xiàng)新技術(shù),,學(xué)術(shù)領(lǐng)域已經(jīng)進(jìn)行了30多年的研究。盡管從歷史上來(lái)看同態(tài)加密一直是計(jì)算密集型的技術(shù),,但現(xiàn)在的最新突破使之可廣泛用于各種商業(yè)應(yīng)用,。
一些常見(jiàn)的同態(tài)加密類型包括:
全同態(tài)加密:同時(shí)支持乘法和加法,并且對(duì)執(zhí)行的操作數(shù)量沒(méi)有限制,。利用全同態(tài)加密可以實(shí)現(xiàn)讓解密方只能獲知最后的結(jié)果,,而無(wú)法獲得每個(gè)密文的消息與同態(tài)計(jì)算方式,從而提高隱私信息的安全性,;
部分同態(tài)加密:可以對(duì)加密數(shù)據(jù)執(zhí)行一種類型的操作,,例如僅提供乘法或加法,但不能同時(shí)進(jìn)行,;
有點(diǎn)同態(tài)加密:可以執(zhí)行多種類型的運(yùn)算(例如加法,、乘法),但只能執(zhí)行有限數(shù)量的運(yùn)算,;
2. 安全多方計(jì)算(SMPC)
這是同態(tài)加密的一個(gè)子領(lǐng)域,,但存在一個(gè)區(qū)別:它允許多方共同對(duì)數(shù)據(jù)進(jìn)行操作,同時(shí)保持其各自的輸入信息私有和安全,。因此,,機(jī)器學(xué)習(xí)模型可以應(yīng)用于加密數(shù)據(jù),因?yàn)镾MPC適用于更大規(guī)模的數(shù)據(jù),。
3. 差分隱私
差分隱私可以防止共享有關(guān)個(gè)人的任何數(shù)據(jù),。在差分隱私中,出于混淆目的,,將隨機(jī)生成的“噪聲”添加到基礎(chǔ)數(shù)據(jù)中,對(duì)更改后的數(shù)據(jù)執(zhí)行的任何計(jì)算僅在統(tǒng)計(jì)/方向上正確(即不準(zhǔn)確),。因此,,由于不能保證準(zhǔn)確的結(jié)果并且限制了可能的計(jì)算,因此差分隱私的應(yīng)用領(lǐng)域比其他隱私增強(qiáng)技術(shù)要窄,。
4. 零知識(shí)證明(ZKP)
ZKP 使用一組加密算法,,允許在不泄露證明數(shù)據(jù)的情況下驗(yàn)證信息,。可用于身份驗(yàn)證等場(chǎng)景,,例如無(wú)需提交準(zhǔn)確生日信息就可驗(yàn)證用戶是否符合規(guī)定年齡,。
數(shù)據(jù)屏蔽技術(shù)
一些隱私增強(qiáng)技術(shù)也是數(shù)據(jù)屏蔽技術(shù),企業(yè)使用它們來(lái)保護(hù)其數(shù)據(jù)集中的敏感信息,。
5. 混淆
這是數(shù)據(jù)屏蔽的通用術(shù)語(yǔ),,它包含多種方法來(lái)通過(guò)向日志或配置文件添加分散注意力或誤導(dǎo)性的數(shù)據(jù)以替換敏感信息。
6. 假名化(Pseudonymisation)
術(shù)語(yǔ)“假名化”在GDPR中被提及15次之多,,它是指在一個(gè)資料記錄中的識(shí)別字段被一個(gè)或多個(gè)人為的標(biāo)識(shí)符或化名所代替的程序,。GDPR建議使用假名化技術(shù)建立個(gè)人資料以降低資料主體的風(fēng)險(xiǎn),并協(xié)助控制者與處理者履行資料保護(hù)的義務(wù),。
7. 小數(shù)據(jù)
與大數(shù)據(jù)相對(duì)應(yīng),,小數(shù)據(jù)(Small Data)指人工智能或者機(jī)器學(xué)習(xí)系統(tǒng)借助數(shù)據(jù)增強(qiáng)、轉(zhuǎn)移學(xué)習(xí),、合成數(shù)據(jù)集等技術(shù),,使用很少,甚至不使用真實(shí)數(shù)據(jù),。隨著小數(shù)據(jù)技術(shù)的興起,,也許未來(lái)的人工智能模型將不再需要海量的訓(xùn)練數(shù)據(jù),同時(shí)也將極大降低隱私風(fēng)險(xiǎn),。
8. 通信匿名技術(shù)
通信匿名技術(shù)作為一種主要的隱私增強(qiáng)技術(shù)被廣泛應(yīng)用于互聯(lián)網(wǎng)的各個(gè)方面,,現(xiàn)有的通信匿名技術(shù)主要是通過(guò)多次存儲(chǔ)轉(zhuǎn)發(fā)(利用Mix網(wǎng)絡(luò)和洋蔥路由技術(shù))來(lái)改變消息的外觀(報(bào)文延遲、亂序,、報(bào)文填充等),,并利用Mix網(wǎng)絡(luò)的刷新機(jī)制消除消息間的對(duì)應(yīng)關(guān)系,從而為在線用戶提供隱私保護(hù),,典型的低時(shí)延通信匿名系統(tǒng)包括Tor,,I2P等。
這些通信匿名系統(tǒng)不僅提供了對(duì)Internet用戶的身份信息的保護(hù),,同時(shí)實(shí)現(xiàn)了對(duì)服務(wù)提供者的身份信息保護(hù),,它們?cè)试S用戶能夠在確保服務(wù)器IP不被泄漏的前提下提供網(wǎng)絡(luò)服務(wù)。
借助人工智能和機(jī)器學(xué)習(xí)算法的技術(shù)
9. 合成數(shù)據(jù)生成
合成數(shù)據(jù)本身就是人工智能對(duì)數(shù)據(jù)進(jìn)行提取歸納的產(chǎn)物,,這些算法會(huì)學(xué)習(xí)真實(shí)數(shù)據(jù)的結(jié)構(gòu)性和關(guān)聯(lián)性,,生成無(wú)限量的相同質(zhì)量的人工數(shù)據(jù)。
這樣產(chǎn)生的數(shù)據(jù)可以符合原先數(shù)據(jù)的特征,,依舊具有一定的價(jià)值,,但是卻沒(méi)有隱私問(wèn)題。
而且,,在這個(gè)過(guò)程中可以對(duì)人工智能進(jìn)行編程,,以提供社會(huì)所需的公平性結(jié)果,,從而從源頭上糾正偏見(jiàn),以減少任何潛在的違反公平性的行為,。其合成結(jié)果將會(huì)是公平的合成數(shù)據(jù),,是完全匿名和去偏見(jiàn)的。
10. “聯(lián)邦學(xué)習(xí)”(Federated Learning)
“聯(lián)邦學(xué)習(xí)”指的是在滿足隱私保護(hù)和數(shù)據(jù)安全的前提下,,設(shè)計(jì)一個(gè)機(jī)器學(xué)習(xí)框架,,使各個(gè)機(jī)構(gòu)在不交換數(shù)據(jù)的情況下進(jìn)行協(xié)作,提升機(jī)器學(xué)習(xí)的效果,。其核心就是解決“數(shù)據(jù)孤島”和數(shù)據(jù)隱私保護(hù)的問(wèn)題,,通過(guò)建立一個(gè)數(shù)據(jù)“聯(lián)邦”,讓參與各方都獲益,,推動(dòng)技術(shù)整體持續(xù)進(jìn)步,。
具體的實(shí)現(xiàn)策略是:建立一個(gè)虛擬的共有模型。這個(gè)虛擬模型類似于把數(shù)據(jù)聚合在一起建立的最優(yōu)模型,,但是在建立虛擬模型的時(shí)候,,數(shù)據(jù)本身不移動(dòng),因此不泄露隱私,,符合數(shù)據(jù)合規(guī)要求,,建好的模型也僅在各自的區(qū)域?yàn)楸镜氐哪繕?biāo)服務(wù)。在這樣一個(gè)聯(lián)邦機(jī)制下,,各個(gè)參與者的身份和地位相同,,實(shí)現(xiàn)“共同富裕”,。
隱私增強(qiáng)技術(shù)的主要用例
測(cè)試數(shù)據(jù)管理:應(yīng)用程序測(cè)試和數(shù)據(jù)分析有時(shí)需求由第三方提供商處理,。即使是在內(nèi)部處理,公司也應(yīng)盡量減少對(duì)客戶數(shù)據(jù)的內(nèi)部訪問(wèn),。使用不會(huì)顯著影響測(cè)試結(jié)果的合適隱私增強(qiáng)技術(shù) 對(duì)組織至關(guān)重要,。
金融交易:由于公民有與其他方進(jìn)行私人交易的自由,金融機(jī)構(gòu)有責(zé)任保護(hù)客戶的隱私,。
醫(yī)療保健服務(wù):醫(yī)療保健行業(yè)收集并共享(在需要時(shí))患者的電子健康記錄(EHR),。例如,臨床數(shù)據(jù)可用于搜索各種藥物組合的不良反應(yīng),。在這種情況下,,醫(yī)療保健公司通過(guò)使用隱私增強(qiáng)技術(shù)可以確保患者數(shù)據(jù)的隱私,。
?促進(jìn)包括中介在內(nèi)的多方之間的數(shù)據(jù)傳輸:對(duì)于在雙方之間充當(dāng)中間人的企業(yè),,隱私增強(qiáng)技術(shù)的使用至關(guān)重要,因?yàn)檫@些企業(yè)負(fù)責(zé)保護(hù)雙方信息的隱私。
總結(jié)
用戶對(duì)隱私的渴望將是科技業(yè),,更是網(wǎng)絡(luò)安全行業(yè)的下一個(gè)“金礦”。無(wú)論是在政府法規(guī)的引導(dǎo)下還是在消費(fèi)者需求的引導(dǎo)下,,企業(yè)都必須準(zhǔn)備好在優(yōu)先考慮數(shù)據(jù)和隱私安全性的世界中運(yùn)營(yíng),。
此外,隨著隱私增強(qiáng)技術(shù)在商業(yè)領(lǐng)域中的日益流行和廣泛應(yīng)用,,越來(lái)越多的企業(yè)將其作為數(shù)字化轉(zhuǎn)型的必備技術(shù),。但是,企業(yè)首先需要識(shí)別哪些是以隱私為中心的業(yè)務(wù),,然后選擇投資最合適的隱私增強(qiáng)技術(shù),。