基于聯(lián)邦學習的加密流量分析研究-AET-電子技術應用

基于聯(lián)邦學習的加密流量分析研究

網(wǎng)絡安全與數(shù)據(jù)治理

崔又文1,2，馮千燁1，何云華1，高健桐1,2，單伯瑜1,2，劉馨妍1

1.北方工業(yè)大學信息學院；2.文脈聯(lián)坊（北京）科技有限責任公司

摘要： 當今信息化時代背景下，加密流量呈爆炸式增長，其在保障了信息傳輸?shù)陌踩缘耐瑫r，也給了不法分子可乘之機，對流量的分類、識別提出了前所未有的挑戰(zhàn)，盡管傳統(tǒng)的基于規(guī)則的識別方法和流級行為特征等方案能實現(xiàn)較高準確率的分類、識別，但在數(shù)據(jù)隱私和安全方面仍有待提升。著重研究基于聯(lián)邦學習技術的網(wǎng)絡加密流量識別系統(tǒng)，針對使用SSL/TLS進行加密的流量特征，提出了一種高效加密流量識別模型，主要通過特征提取和模型訓練來實現(xiàn)對加密流量的準確分類，可以在不接觸原始數(shù)據(jù)的前提下，進行信息共享和模型訓練，通過加權(quán)平均策略獲得準確的加密流量分析模型，有效監(jiān)測夾雜在海量數(shù)據(jù)中的高危流量。在加密數(shù)據(jù)集上的實驗有效驗證了該方法的可行性。

關鍵詞： 加密流量聯(lián)邦學習網(wǎng)絡安全網(wǎng)絡流量分類

中圖分類號：TP309.2文獻標識碼：ADOI:10.19358/j.issn.2097-1788.2025.01.002引用格式：崔又文，馮千燁，何云華，等. 基于聯(lián)邦學習的加密流量分析研究［J］.網(wǎng)絡安全與數(shù)據(jù)治理，2025，44（1）：9-15，36.

Research on encrypted traffic analysis based on federated learning

Cui Youwen 1, 2, Feng Qianye 1, He Yunhua 1, Gao Jiantong 1, 2, Shan Boyu 1, 2, Liu Xinyan 1

1. School of Information Science and Technology, Northern Polytechnic University; 2. Wenmai Lianfang (Beijing) Technology Co., Ltd.

Abstract： In the era of informatization, the encrypted traffic is exploding. While ensuring the security of information transmission, it also gives criminals plenty of opportunities, and poses unprecedented challenges to the classification and identification of traffic. Although traditional rule-based identification methods and flow-level behavior characteristics can achieve higher accuracy classification and identification, it still needs to be improved in data privacy and security.This paper focuses on the network encryption traffic identification system based on federated learning. Aiming at the traffic characteristics encrypted by SSL / TLS, an efficient encryption traffic identification model is proposed. The model mainly realizes the accurate classification of encrypted traffic through feature extraction and model training. The scheme can carry out information sharing and model training without touching the original data. The accurate encrypted traffic analysis model is obtained by weighted average strategy, and the high-risk traffic mixed in massive data is effectively monitored. Experiments on encrypted data sets effectively verify the feasibility of the method.

Key words : encrypting traffic; federated learning; network security; network traffic classification

引言

隨著信息化的快速發(fā)展，網(wǎng)絡流量的安全性備受關注。近年來，隨著 SSL/TLS 等流量加密算法的普及，加密流量比例已超過 90%。雖然加密技術提升了信息傳輸?shù)陌踩裕絹碓蕉嗟膼阂廛浖ㄟ^加密技術隱藏自己，引發(fā)了更多不可控的安全隱患。《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示，截至2023年6月，我國互聯(lián)網(wǎng)普及率更是高達76.4%［1］，互聯(lián)網(wǎng)企業(yè)對加密流量識別和檢測的不重視給了不法分子更多可乘之機，如何保障安全的網(wǎng)絡環(huán)境成為了當下的挑戰(zhàn)。SSL/TLS協(xié)議是當下主流的加密算法之一，攻擊者可以通過將惡意行為嵌入被 SSL/TLS 協(xié)議加密的內(nèi)容中，對公眾網(wǎng)絡安全造成威脅。傳統(tǒng)的基于端口號和深度包檢測的流量分析方法在加密流量面前顯得力不從心。在加密通信時代，學界積極探索新的技術路徑，如楊旭提出的基于流量統(tǒng)計特征的分類方法，將流量外部統(tǒng)計特征與機器學習相結(jié)合，有效解決了偽裝端口、加密流量等問題，為加密流量分類提供了新思路［2］。仝鑫等人提出的基于機器學習的加密流量分析方法，展示了該領域在特征工程、分類器模型等方面的研究進展，在一定程度上提高了加密流量識別的準確率［3］。此外，朱蓓佳等人提出的基于對比學習的加密流量檢測技術，通過設計特定的檢測方案來提高檢測準確率和泛化性，但仍需在保障數(shù)據(jù)安全方面進一步探索［4］。在此情形下，迫切需求一種既能有效利用數(shù)據(jù)又能保障數(shù)據(jù)安全的新技術，聯(lián)邦學習等技術應運而生，其核心優(yōu)勢在于可在不匯聚原始數(shù)據(jù)的前提下進行分布式建模，打破數(shù)據(jù)孤島，實現(xiàn)數(shù)據(jù)隱私保護與高效利用的雙重目標。面對這一問題，本研究認為，根據(jù)SSL/TLS分別在客戶端與服務端相互認證等技術特點，使用分布式聯(lián)邦學習進行本地監(jiān)測成為了一種可行的方案。聯(lián)邦學習的核心理念是在保證數(shù)據(jù)隱私安全及合法合規(guī)的基礎上，利用各個節(jié)點完全掌握的數(shù)據(jù)共同建模，核心優(yōu)勢在于原始數(shù)據(jù)無需匯聚在中央服務器，在各個終端服務器即可進行訓練和計算模型梯度信息，只將參數(shù)和梯度等信息上傳至中央服務器，通過加權(quán)等方式整合最終模型，下發(fā)到各個服務器終端，從而有效打破數(shù)據(jù)孤島，提升模型的效果。該方法不僅可以有效保護用戶隱私，還可以綜合大量數(shù)據(jù)使得系統(tǒng)對加密流量更加敏感，識別率大大提高。本文研究了基于聯(lián)邦學習技術的SSL/TLS加密流量識別，通過預處理網(wǎng)絡流量數(shù)據(jù)，提取關鍵特征，并利用聯(lián)邦學習框架訓練模型，實現(xiàn)了高效的加密流量分類，同時保護了數(shù)據(jù)安全和用戶隱私。實驗結(jié)果表明，該方法在分類準確率、實時性和隱私保護等方面均優(yōu)于傳統(tǒng)方法。

本文詳細內(nèi)容請下載：

http://forexkbc.com/resource/share/2000006295

作者信息：

崔又文1,2，馮千燁1，何云華1，高健桐1,2，單伯瑜1,2，劉馨妍1

（1.北方工業(yè)大學信息學院，北京100144；

2.文脈聯(lián)坊（北京）科技有限責任公司，北京100143）

Magazine.Subscription.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關內(nèi)容