文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.032
0 引言
數(shù)據(jù)安全是信息安全的關鍵環(huán)節(jié),。在當今大數(shù)據(jù)技術和互聯(lián)網(wǎng)飛速發(fā)展的時代,,數(shù)據(jù)是推動國家經(jīng)濟與社會發(fā)展的重要戰(zhàn)略資源。在電力行業(yè)領域,,隨著信息技術的深入應用,,尤其是用電采集、SCADA等系統(tǒng)的應用,,業(yè)務數(shù)據(jù)量呈爆炸式增長,,數(shù)據(jù)中蘊藏的巨大商業(yè)價值被逐步挖掘出來,同時也帶來了巨大的安全挑戰(zhàn)——個人隱私信息的保護。2017年6月,,《中華人民共和國網(wǎng)絡安全法》正式實施,,其中對個人信息的保護做了明確規(guī)定,網(wǎng)絡運營者應當采取技術措施和其他必要措施,,確保其收集的個人信息安全,,防止信息泄露、毀損,、丟失,。
由于非線性數(shù)據(jù)量巨大,數(shù)據(jù)關系錯綜復雜,,傳統(tǒng)的安全手段難以提供完善的保障,,攻擊者可通過大數(shù)據(jù)技術還原信息、竊取隱私。因此,,針對大數(shù)據(jù)應用建設過程中的安全問題,,根據(jù)實際情況制定特有的數(shù)據(jù)脫敏規(guī)則加以保障,對提高電力大數(shù)據(jù)安全應用具有重要意義,。
1 電力大數(shù)據(jù)脫敏策略研究
電力大數(shù)據(jù)的應用場景主要有重過載預測,、日用電負荷預測、設備事故關聯(lián)分析,、精準客戶服務,、業(yè)務工單分析等,涉及用戶數(shù)據(jù),、工單數(shù)據(jù),、流程數(shù)據(jù)、用電數(shù)據(jù),、設備數(shù)據(jù)等,。為了保護客戶隱私數(shù)據(jù),提高電力信息安全,,需要對重要數(shù)據(jù)進行脫敏,。
數(shù)據(jù)脫敏又叫數(shù)據(jù)漂白或者數(shù)據(jù)去隱私化,通過一定的規(guī)則,,對某些重要信息進行數(shù)據(jù)的變形,,以實現(xiàn)對重要隱私數(shù)據(jù)的可靠保護。比如個人身份識別數(shù)據(jù)(personal identifiable data),、個人重要數(shù)據(jù)(personal sensitive data)和商業(yè)重要數(shù)據(jù)等,,必須經(jīng)過脫敏后才能使用,尤其是在大數(shù)據(jù)應用的開發(fā)測試階段,。經(jīng)過數(shù)據(jù)脫敏后的數(shù)據(jù),,就可以在規(guī)定的授權環(huán)境中使用,。
在電力行業(yè)中,,重要數(shù)據(jù)主要包括兩方面,一是工作中各業(yè)務系統(tǒng)的運行數(shù)據(jù),,包括內部郵件,、組織架構、業(yè)務流程數(shù)據(jù),、各類工單數(shù)據(jù),、現(xiàn)場工作票數(shù)據(jù)、各類電表儀器實時量測數(shù)據(jù)等,;二是客戶的個人信息,,包括個人客戶的姓名、性別、年齡,、住址,、手機號、身份證號,、銀行賬號等,,單位客戶的名稱、地址,、行業(yè)等,。
本文通過研究一種自適用于電力大數(shù)據(jù)應用的數(shù)據(jù)脫敏手段,自適應于電力大數(shù)據(jù)場景中的數(shù)據(jù)脫敏分類,,精準定位電力業(yè)務重要數(shù)據(jù),,從而實現(xiàn)電力業(yè)務數(shù)據(jù)的多層次安全防護。
2 重點內容及創(chuàng)新點
電力大數(shù)據(jù)脫敏的最大難點在于電力大數(shù)據(jù)不同業(yè)務場景下的數(shù)據(jù)安全(隱私保護)和數(shù)據(jù)信息價值兩者之間的平衡,,因此,,電力大數(shù)據(jù)應用建設中的重要數(shù)據(jù)保護需要在保護數(shù)據(jù)安全的基礎上更好地展現(xiàn)大數(shù)據(jù)的業(yè)務應用價值,從而為電力事業(yè)提供更高水平的服務,。
2.1 脫敏規(guī)則遵循原則
(1)數(shù)據(jù)可用性需求:要求脫敏后的數(shù)據(jù)能夠滿足各業(yè)務部門的大數(shù)據(jù)應用需求,。如分析用戶用電習慣,需要保留完整戶號信息,、用戶電量信息,,戶號作為用戶在電力系統(tǒng)里的唯一標記,可在電力系統(tǒng)里作為基礎查詢標識,。而用戶姓名,、性別、地址,、聯(lián)系方式可以隱私數(shù)據(jù)可以脫敏展示,。
(2)數(shù)據(jù)的邏輯關聯(lián):為滿足大數(shù)據(jù)的分析邏輯特征、統(tǒng)計分布特征,,對于復雜的業(yè)務,,需要保留各種數(shù)據(jù)之間的關聯(lián)性。如工單數(shù)據(jù)分析,,需要保留工單信息,、客戶信息、內部流程信息等數(shù)據(jù)之間的關聯(lián)性,。
(3)數(shù)據(jù)可重現(xiàn)性:采用相同規(guī)則和參數(shù)配置,,相同源數(shù)據(jù)脫敏后的數(shù)據(jù)必須保持一致。
(4)脫敏規(guī)則可配置:可以結合應用需求和隱私保護的需要,,動態(tài)配置脫敏規(guī)則及相關處理方法,,從而滿足各種不同業(yè)務應用的需要,。
2.2 數(shù)據(jù)脫敏分類分級方法
在電力行業(yè)的大數(shù)據(jù)應用建設過程中,因為數(shù)據(jù)的多樣性以及生產(chǎn),、營銷等應用各自的分析側重點不同,,對數(shù)據(jù)脫敏細分提出了更高要求?;陔娏Υ髷?shù)據(jù)場景數(shù)據(jù)安全(隱私保護)和數(shù)據(jù)信息價值的共同追求,,遵循以上數(shù)據(jù)脫敏規(guī)則,結合電網(wǎng)業(yè)務數(shù)據(jù)的實際情況,,根據(jù)不同的應用場景,,按用戶編號、客戶姓名,、電話號碼,、用電地址、身份證號等不同類別進行數(shù)據(jù)脫敏,,并將數(shù)據(jù)脫敏工作按不同的數(shù)據(jù)類型分為三個等級,,從一級到三級安全等級依次降低,從而實現(xiàn)了基于多層次安全等級防護的電力大數(shù)據(jù)應用建設,。
下面就用戶編號,、客戶姓名、電話號碼,、用電地址,、身份證號等不同類別數(shù)據(jù)進行等級劃分,具體舉例說明:
2.3 建立電力大數(shù)據(jù)脫敏管理平臺
電力大數(shù)據(jù)脫敏管理平臺及應用架構分別如圖1,、圖2所示,。
根據(jù)數(shù)據(jù)脫敏的規(guī)則以及本文提出的分類分級脫敏的設定,設計適用于電力大數(shù)據(jù)的數(shù)據(jù)脫敏機制:
(1)源數(shù)據(jù)層:電力大數(shù)據(jù)來源于電力系統(tǒng)內部各系統(tǒng)的數(shù)據(jù),,主要包括用戶數(shù)據(jù),、工單數(shù)據(jù)、流程數(shù)據(jù),、用電數(shù)據(jù),、設備數(shù)據(jù)等。
(2)脫敏處理:根據(jù)脫敏規(guī)則選取相應的脫敏算法,,將原始數(shù)據(jù)進行拆分和脫敏存儲,,并遵循設定的分級脫敏規(guī)則,,對于重要數(shù)據(jù)進行分級脫敏并分別存儲,,形成數(shù)據(jù)中間庫。
(3)脫敏中間庫存儲:中間庫重要數(shù)據(jù)采用單獨字段分級脫敏存儲,,保證數(shù)據(jù)存儲的安全性,。同時中間庫的應用也有助于提高系統(tǒng)的工作效率,。
(4)脫敏數(shù)據(jù)服務:根據(jù)應用場景需求分析所要展示的數(shù)據(jù)及數(shù)據(jù)之間的關聯(lián)特性,并分析數(shù)據(jù)是否需要脫敏,,自動識別脫敏的級別,,從中間庫提取相關數(shù)據(jù)。如張三豐->張先生->張**->張*,,某某某指揮部-> ***,。系統(tǒng)同時進行數(shù)據(jù)的校驗,符合數(shù)據(jù)安全規(guī)則的交由應用層進行相關展示,。
(5)電力大數(shù)據(jù)應用:根據(jù)各業(yè)務部門的需求,,電力大數(shù)據(jù)的應用場景主要有業(yè)務工單分析、精準客戶服務,、用電行為分析,、設備故障管理分析、用電負荷預測,。
采用本文的數(shù)據(jù)脫敏機制,,在保證數(shù)據(jù)安全的基礎上,根據(jù)數(shù)據(jù)重要度不同的分級制度能夠更好地滿足業(yè)務場景應用,。如進行業(yè)務工單的重復致電分析,,需要展示的數(shù)據(jù)是電話號碼、戶號,、姓名,、地址、致電次數(shù),、關聯(lián)工單等,。采用本方法的分級脫敏規(guī)則,電話號碼作為展示主體,,采用三級脫敏,,保留主要特征。戶號作為系統(tǒng)唯一標記不脫敏,。用戶姓名,、身份證、地址信息采用二級脫敏,,保證用戶隱私,。即保證了大數(shù)據(jù)應用的直觀展示,同時業(yè)務部門在系統(tǒng)中有據(jù)可查,、有效處理,,又保護了用戶的隱私,避免了數(shù)據(jù)安全風險,。
2.4 應用實例介紹
以營銷服務工單熱詞分析場景為例,,涉及的業(yè)務數(shù)據(jù)有全量工單數(shù)據(jù),、客戶基本信息數(shù)據(jù)、接入點信息數(shù)據(jù),、接入點計量表信息數(shù)據(jù),、計量表讀數(shù)數(shù)據(jù)、氣象數(shù)據(jù),,這些原始數(shù)據(jù)有數(shù)據(jù)量大,、數(shù)據(jù)形態(tài)多樣性等特點,具體情況如下表:
3 結論
數(shù)據(jù)脫敏是電力行業(yè)信息化應用中的一個環(huán)節(jié),,現(xiàn)有的脫敏方法既要滿足大數(shù)據(jù)價值分析應用的需要,,也要遵從整體信息安全治理的要求。本文研究了電力大數(shù)據(jù)典型應用場景下的數(shù)據(jù)脫敏分級分類方法,,通過電力大數(shù)據(jù)脫敏管理平臺實現(xiàn)電力業(yè)務數(shù)據(jù)內容,、性質及應用場景的自適應脫敏,分級分類脫敏,,并對數(shù)據(jù)脫敏的框架提出建議及具體的脫敏執(zhí)行方案,,在保護用戶隱私、保證數(shù)據(jù)安全的前提下,,滿足各業(yè)務單位,、數(shù)據(jù)歸口單位、科技信息等部門大數(shù)據(jù)成果應用需求,。
參考文獻
[1] 張沛,楊華飛,許元斌.電力大數(shù)據(jù)及其在電網(wǎng)公司的應用[J].中國電機工程學報,2014,34(增刊):85-92.
[2] 彭小圣,鄧迪元,程時杰,等.面向智能電網(wǎng)應用的電力大數(shù)據(jù)關鍵技術[J].中國電機工程學報,2015,34(3):503-511.
[3] 張沛,和怡,張大海,等.電力大數(shù)據(jù)應用的判斷原則[J].電力建設,2017,38(5):85-90.
[4] Datamasker. Data masking:what you need to know[J].A Net 2000 Ltd.White Paper, 2016.
[5] CHOUDRY B. Masking the data on cloud[J].International Journal of Advances in Computing, 2012,1(04):388—390.
[6] CASTELLANOS M, Zhang BaimenezI,et al. Data desensitization of customer data for use in optimizer performance experiments[M].IEEE International Conference on Data Engineering, 2010:1081-1092.
[7] Gartner.Gartner 2014 Magic Quadrant Data Masking Report[R].2015.
[8] 王繼業(yè).智能電網(wǎng)大數(shù)據(jù)[M].北京:中國電力出版社.
作者信息:
黃凌宇1,,叢中方1,趙 城2,,葉紅星2,,張豹鋒2
(1. 山東文登抽水蓄能有限公司,山東 威海264200,;2. 北京易用視點科技有限公司,,北京100144)