《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究
基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究
信息技術與網(wǎng)絡安全 1期
黃冠杰
(對外經(jīng)濟貿易大學 統(tǒng)計學院,,北京100105)
摘要: 針對電力企業(yè)關鍵信息基礎設施大量業(yè)務數(shù)據(jù)易遭受網(wǎng)絡攻擊的現(xiàn)象,,基于各業(yè)務信息系統(tǒng)下已有的網(wǎng)絡安全設備,,通過輔助設備采集流量數(shù)據(jù),采用Canopy-Kmeans算法進行數(shù)據(jù)分析研究,。首先通過實驗證明了Canopy-Kmeans算法在處理流量數(shù)據(jù)時,相比傳統(tǒng)K-means算法,,具有更好的聚類效果,,準確率提高約11%;然后以采集到的電力關鍵業(yè)務系統(tǒng)的流量數(shù)據(jù)為基礎,基于Canopy-Kmeans算法進行挖掘分析實驗,,完成相同類型流量數(shù)據(jù)的聚類,,分析出攻擊流量與業(yè)務流量的特征項,排除部分誤報信息,,合理開展網(wǎng)絡安全防護工作,。
中圖分類號: TP391.1
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.003
引用格式: 黃冠杰. 基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究[J].信息技術與網(wǎng)絡安全,2022,,41(1):18-22.
Research on electric power enterprise flow data analysis based on Canopy-Kmeans algorithm
Huang Guanjie
(School of Statistics,,University of International Business and Economics,Beijing 100105,,China)
Abstract: Aiming at the phenomenon that a large number of business data of the key information infrastructure of electric power enterprises are vulnerable to network attacks, based on the existing network security equipment under each business information system, the flow data is collected through auxiliary equipment, and Canopy-Kmeans algorithm is used for data analysis and research. Firstly, through experiments, it is proved that the Canopy-Kmeans algorithm has a better clustering effect than the traditional K-means algorithm when processing flow data, and the accuracy rate is increased by about 11%. Then, the collected flow data of the power key business system is used,,mining and analysis experiments are conducted based on the Canopy-Kmeans algorithm to complete the clustering of the same type of traffic data, analyze the characteristic items of attack traffic and business traffic, eliminate some misreporting information, and carry out network security protection work reasonably.
Key words : electricity;flow collection,;Canopy-Kmeans,;clustering;flow data analysis

0 引言

隨著信息化與工業(yè)化的深度融合,,各式各樣的信息系統(tǒng)得到了廣泛應用,,信息安全問題不斷涌現(xiàn),關于信息網(wǎng)絡的攻防戰(zhàn)也愈演愈烈,。近幾年,,國際上不法組織頻繁攻擊電力企業(yè),層出不窮的網(wǎng)絡攻擊可能會導致系統(tǒng)出現(xiàn)故障,,造成網(wǎng)絡癱瘓,,嚴重時造成大范圍較長時間的電網(wǎng)故障,產(chǎn)生巨大影響和危害,。電力系統(tǒng)作為現(xiàn)代社會的關鍵信息基礎設施之一,,其產(chǎn)生的大量業(yè)務數(shù)據(jù)及操作數(shù)據(jù),也就自然成為了網(wǎng)絡攻擊的重點目標[1],。建立健全的電力數(shù)據(jù)分析體系,,助力電力企業(yè)識別異常流量,保障電力數(shù)據(jù)安全迫在眉睫,。

目前已有部分企業(yè)和專家針對電力數(shù)據(jù)的網(wǎng)絡安全進行了研究,,高翔[2]等人采用灰色關聯(lián)分析和支持向量機算法對電力信息系統(tǒng)網(wǎng)絡安全進行態(tài)勢評估;李群[3]等人提出一種基于“聚類+分類”的惡意攻擊檢測方法,,對流量預處理結果進行聚類,,基于CART決策樹對攻擊簇實現(xiàn)分類;高鵬[4]等人采用國產(chǎn)密碼,、量子密鑰分發(fā)和區(qū)塊鏈技術對電力終端和數(shù)據(jù)進行保護,;劉川[5]等人基于云計算平臺和SDN技術搭建了一體化電力數(shù)據(jù)安全防護框架,,用于身份認證、攻擊防范,、入侵檢測,。

但目前大部分電力企業(yè)對于收集到的流量數(shù)據(jù)的挖掘和綜合分析明顯還不夠。若要合理地進行數(shù)據(jù)分析并分類治理,,首先要做到電力企業(yè)流量數(shù)據(jù)的充分采集,,通過對采集到的數(shù)據(jù)進行ETL(Extract-Transform-Load,抽取-轉換-加載),、挖掘和分析[6-7],,最終將分析結果應用于實際安全運維中,做到精準治理,。本文以某電力企業(yè)的實際運行環(huán)境為例,,首先簡述本文所需的流量數(shù)據(jù)的數(shù)據(jù)來源及采集方式,得到其各業(yè)務系統(tǒng)下已有的網(wǎng)絡安全設備中的流量數(shù)據(jù),,然后分別利用傳統(tǒng)K-means算法與Canopy-Kmeans算法進行流量數(shù)據(jù)聚類分析,,挖掘出攻擊流量與業(yè)務流量的特征項,并排除部分誤報信息,。本研究對合理開展網(wǎng)絡安全防護工作具有指導意義,。


本文詳細內容請下載:http://forexkbc.com/resource/share/2000003931




作者信息:

黃冠杰

(對外經(jīng)濟貿易大學 統(tǒng)計學院,,北京100105)


此內容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權禁止轉載。