文獻(xiàn)標(biāo)識碼:A
DOI:10.19358/j.issn.2097-1788.2023.04.011
引用格式:邱浩宸,張信明.基于屬性加密的聯(lián)邦學(xué)習(xí)參與方選擇方案[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,,42(4):62-69.
0 引言
隨著機器學(xué)習(xí)的廣泛應(yīng)用,,其在各個領(lǐng)域都取得了令人矚目的成就,從智慧城市產(chǎn)生的海量多源數(shù)據(jù)中建立機器學(xué)習(xí)模型的需求變得愈加強烈,。在能源,、醫(yī)療和社區(qū)治理等方面人們迫切需要使用機器學(xué)習(xí)模型來執(zhí)行諸如識別和預(yù)測等任務(wù)。然而,,訓(xùn)練數(shù)據(jù)的獲取是一個無法回避的關(guān)注點,,嚴(yán)格的公民信息保護(hù)條例以及人們對個人隱私的保護(hù)要求使得城市正在誕生一個個“數(shù)據(jù)孤島”。聯(lián)邦學(xué)習(xí)被認(rèn)為是在智慧城市的場景中訓(xùn)練模型的很有應(yīng)用前景的技術(shù),。在這個框架下,,機器學(xué)習(xí)模型可以由分布在各地的參與方使用本地的數(shù)據(jù)進(jìn)行合作訓(xùn)練,從而避免了隱私數(shù)據(jù)的泄漏,。自從谷歌公司提出使用聯(lián)邦學(xué)習(xí)來預(yù)測用戶下一個鍵盤輸入的應(yīng)用以來,,已經(jīng)有眾多研究者參與到這一熱門的研究方向。
有別于傳統(tǒng)的集中訓(xùn)練,,聯(lián)邦學(xué)習(xí)中的數(shù)據(jù)類別通常是非獨立同分布的,,此外由于擁有的數(shù)據(jù)量不同,參與方可能在每個訓(xùn)練輪次訓(xùn)練不同數(shù)量的樣本,。這些異質(zhì)性會顯著影響模型訓(xùn)練時間和準(zhǔn)確性,,因此選擇恰當(dāng)?shù)膮⑴c方進(jìn)行訓(xùn)練尤為重要。然而現(xiàn)有的聯(lián)邦學(xué)習(xí)參與方選擇方案要么是根據(jù)對模型更新的貢獻(xiàn)度量來選擇具有更高統(tǒng)計效用的客戶端,,要么是根據(jù)計算資源和通信約束來選擇客戶端,。這些方案雖然取得了一定的效果,但也存在著隱患,,比如某些參與方利用上傳的梯度信息進(jìn)行隱私推斷,,以及某些參與方企圖以不勞而獲的方式得到全局模型。
本文詳細(xì)內(nèi)容請下載:http://forexkbc.com/resource/share/2000005270
作者信息:
邱浩宸,張信明
(中國科學(xué)技術(shù)大學(xué)計算機科學(xué)與技術(shù)學(xué)院,,安徽合肥230026)