這次開發(fā)出的數(shù)據(jù)保護(hù)工具,,可確保關(guān)鍵數(shù)據(jù)集中的敏感個(gè)人信息通過嚴(yán)密檢查后再公開共享,比如用于跟蹤COVID-19疫情蔓延的數(shù)據(jù)集。
澳大利亞國家科學(xué)機(jī)構(gòu)(CSIRO)下轄Data61專家小組,、新南威爾士州政府、澳大利亞計(jì)算機(jī)協(xié)會(huì)(ACS)等多家機(jī)構(gòu)合作開發(fā)了一款隱私保障工具,,被命名為個(gè)人信息因素(Personal Information Factor,,簡稱PIF),可評(píng)估任意數(shù)據(jù)集內(nèi)的個(gè)人數(shù)據(jù)風(fēng)險(xiǎn),,建立起有針對(duì)性的高效保護(hù)機(jī)制,。
傳統(tǒng)上,這類評(píng)估往往由領(lǐng)先的數(shù)據(jù)與隱私專家進(jìn)行,。如今,,專家們可以使用計(jì)算機(jī)模型快速驗(yàn)證數(shù)據(jù)敏感性評(píng)估結(jié)果。
自2020年以來,,澳大利亞國家科學(xué)機(jī)構(gòu)一直與本國網(wǎng)絡(luò)安全合作研究中心(CSCRC)合作探索增強(qiáng)這款工具的方法,。
01 使用復(fù)雜的數(shù)據(jù)分析算法
PIF工具使用了一種復(fù)雜的數(shù)據(jù)分析算法,對(duì)數(shù)據(jù)集敏感信息的還原風(fēng)險(xiǎn)(已脫敏的個(gè)人信息是否還能與實(shí)際所有者重新匹配起來)做出評(píng)估,。
自2020年3月以來,,新南威爾士州政府一直使用這款工具的早期版本對(duì)州內(nèi)的COVID-19疫情傳播數(shù)據(jù)集進(jìn)行跟蹤,旨在保證數(shù)據(jù)內(nèi)容公開發(fā)布前得到適當(dāng)保護(hù),。
新南威爾士州政府首席數(shù)據(jù)科學(xué)家Ian Oppermann博士表示,,“目前,PIF工具的作用可以說是獨(dú)一無二,。它經(jīng)歷了長期的合作與發(fā)展,,源自各州、聯(lián)邦政府以及行業(yè)從業(yè)者們的不懈努力,?!?/p>
“每一天,它都在幫助我們對(duì)新南威爾士州民眾的匿名COVID-19感染數(shù)據(jù)集進(jìn)行安全性與隱私風(fēng)險(xiǎn)評(píng)估,。在它的幫助下,,我們能夠在公開發(fā)布數(shù)據(jù)內(nèi)容之前,將敏感信息還原風(fēng)險(xiǎn)降至最低水平,?!?/p>
Oppermann博士還提到,,COVID-19進(jìn)一步增強(qiáng)了公眾對(duì)于數(shù)據(jù)隱私需求的認(rèn)識(shí)。
Oppermann博士指出,,“考慮到社區(qū)對(duì)于不斷增長的COVID-19病例的強(qiáng)烈關(guān)注,,我們需要在細(xì)粒度層級(jí)上及時(shí)發(fā)布關(guān)鍵信息,詳細(xì)介紹何時(shí),、何處確認(rèn)了新的COVID-19病例,。這項(xiàng)工作要求我們?cè)谝咔榱餍谐跗谕评沓隹赡艿母腥驹颍⒋_認(rèn)感染者的年齡范圍,?!?/strong>
“我們希望相關(guān)數(shù)據(jù)盡可能詳盡精準(zhǔn),同時(shí)切實(shí)保護(hù)與這些數(shù)據(jù)集相關(guān)的個(gè)人隱私與身份信息,?!?/p>
02 數(shù)據(jù)去身份化方法可進(jìn)一步提高隱私水平
澳大利亞國家科學(xué)機(jī)構(gòu)Data61項(xiàng)目首席研究員兼高級(jí)研究科學(xué)家Sushmita Ruj博士表示,新的數(shù)據(jù)去身份化方法有望進(jìn)一步提高隱私水平,,并保證個(gè)人私密數(shù)據(jù)得到嚴(yán)格保護(hù),。
Ruj博士提到,“在研究了多種隱私指標(biāo)之后,,研究小組決定采取一種統(tǒng)一的衡量方法,,用于評(píng)估對(duì)特定數(shù)據(jù)成功進(jìn)行身份還原的風(fēng)險(xiǎn)水平?!?/p>
“PIF一直在探索新的方法,,考慮如何消除各類能夠?qū)崿F(xiàn)身份還原的攻擊方法,并據(jù)此對(duì)不同數(shù)據(jù)集采用量身定制的保護(hù)手段,。以此為基礎(chǔ),,該工具將為各個(gè)數(shù)據(jù)集做出一項(xiàng)PIF評(píng)分?!?/p>
如果PIF高于所需的閾值,,則程序?qū)⑻岢鋈绾翁岣呖蚣馨踩健⒆C明數(shù)據(jù)集可以安全公開發(fā)布的相關(guān)建議,。
澳大利亞網(wǎng)絡(luò)安全合作研究中心研究主任Helge Janicke教授表示,,最重要的目標(biāo)是在信息共享需求與保護(hù)隱私之間找到平衡點(diǎn)。Janicke教授提到,,“在PIF的幫助下,,各方可以充分了解風(fēng)險(xiǎn)水平,這無疑補(bǔ)充了相關(guān)工具領(lǐng)域的空白,?!?/p>
“數(shù)據(jù)分析已經(jīng)成為一項(xiàng)廣為人知的技術(shù)方案,但我們以往很難把握共享輸出結(jié)果的具體質(zhì)量,。正因?yàn)槿绱?,PIF在根據(jù)指標(biāo)評(píng)估關(guān)鍵數(shù)據(jù)共享行為的道德保障與負(fù)責(zé)任水平方面,發(fā)揮著極為重要的作用,。借助這項(xiàng)技術(shù),,數(shù)據(jù)所有者可以全面評(píng)估與數(shù)據(jù)共享相關(guān)的風(fēng)險(xiǎn)與后續(xù)影響?!?/p>
PIF工具還可用于檢查其他有待發(fā)布的數(shù)據(jù)集,,比如在COVID-19社交隔離期間收集到的家庭暴力數(shù)據(jù)與公共交通工具使用數(shù)據(jù)。CSIRO Data61與CSCRC將繼續(xù)開發(fā)PIF工具,,并規(guī)劃在2022年6月之前進(jìn)入外部推廣階段,。