摘 要: 提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量識別方法,。根據(jù)實際網(wǎng)絡(luò)中的流量數(shù)據(jù),建立了一個基于RBF神經(jīng)網(wǎng)絡(luò)的流量識別模型,。先介紹了RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計及學(xué)習(xí)算法,,針對RBF神經(jīng)網(wǎng)絡(luò)在隱節(jié)點(diǎn)過多的情況下算法過于復(fù)雜的缺點(diǎn),采用了優(yōu)化的算法計算隱含層節(jié)點(diǎn),。仿真實驗證明,,該模型具有較好的準(zhǔn)確率、低復(fù)雜度,、高識別效果和良好的自適應(yīng)性,。
關(guān)鍵詞: RBF神經(jīng)網(wǎng)絡(luò);流量識別,;流量分類
隨著互聯(lián)網(wǎng)業(yè)務(wù)量的急劇增長,,網(wǎng)絡(luò)性能和服務(wù)質(zhì)量方面的問題日益突出。在網(wǎng)絡(luò)資源有限的情況下,,建立網(wǎng)絡(luò)流量模型,,識別網(wǎng)絡(luò)流量,及時作出控制或者調(diào)整,,將會極大提高網(wǎng)絡(luò)性能和服務(wù)質(zhì)量,。尤其是隨著近年來互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)主要流量已經(jīng)由傳統(tǒng)的FTP,、TELNET和HTTP向P2P和IM服務(wù)轉(zhuǎn)變,。傳統(tǒng)的網(wǎng)絡(luò)流量識別方法已經(jīng)不能滿足當(dāng)前網(wǎng)絡(luò)發(fā)展的需求。
神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)關(guān)系具有良好的逼近能力,,所以本文提出了一種基于RBF函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量模型,。RBF神經(jīng)網(wǎng)絡(luò)為局部神經(jīng)網(wǎng)絡(luò)模型,計算速度快,、實時性好,,相對于傳統(tǒng)的線性流量模型具有更高的逼近能力和良好的自適應(yīng)性,并可克服基于BP神經(jīng)網(wǎng)絡(luò)的流量模型訓(xùn)練時間長及計算復(fù)雜度高的不足,。
1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及學(xué)習(xí)算法
1.1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
RBF神經(jīng)網(wǎng)絡(luò)是20世紀(jì)80年代由MOODY J和DARKEN C提出的一種神經(jīng)網(wǎng)絡(luò)模型,,是具有單隱層的前饋網(wǎng)絡(luò),屬于局部逼近網(wǎng)絡(luò),,已證明能以任意精度逼近任一連續(xù)函數(shù),。RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,。
網(wǎng)絡(luò)由輸入層、徑向基函數(shù)隱含層,、輸出層三層構(gòu)成,。低維空間非線性可分的問題總可以映射到一個高維空間,使其在此高維空間中為線性可分[1],。RBF的輸出單元部分構(gòu)成一個單層感知機(jī),,只要合理選擇隱單元數(shù)(高維空間的維數(shù))和作用函數(shù),就可以把原來的問題映射為一個線性可分問題[2],。RBF網(wǎng)絡(luò)中輸入到隱含層的映射是非線性的,,而隱含層到輸出的映射是線性的。隱含層的節(jié)點(diǎn)數(shù)與實際問題的要求有直接的關(guān)聯(lián),,過多的節(jié)點(diǎn)數(shù)會導(dǎo)致學(xué)習(xí)時間過長和低容錯率,,所以必須優(yōu)化隱含層的節(jié)點(diǎn)數(shù)。隱含層的節(jié)點(diǎn)數(shù)可以采用式(1)計算:
2 識別過程
流量識別過程分為四個部分:數(shù)據(jù)獲取過程,、數(shù)據(jù)預(yù)處理過程,、數(shù)據(jù)訓(xùn)練過程和測試數(shù)據(jù)分類過程。重點(diǎn)在于建立一個RBF神經(jīng)網(wǎng)絡(luò)模型對網(wǎng)絡(luò)流量進(jìn)行分類,。
(1)數(shù)據(jù)獲取過程是通過數(shù)據(jù)獲取模塊提取網(wǎng)絡(luò)連接記錄和分析特征,,以選擇合適的網(wǎng)絡(luò)特征屬性作為原始的輸入值。選擇一組最合適的特征子集作為RBF神經(jīng)網(wǎng)絡(luò)的原始輸入值,。
(2)數(shù)據(jù)預(yù)處理過程是將特征子集映射到[-1,1]的范圍[4],。
(3)數(shù)據(jù)訓(xùn)練過程是將經(jīng)過預(yù)處理后的網(wǎng)絡(luò)流量特征子集作為RBF神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練集。
(4)根據(jù)RBF神經(jīng)網(wǎng)絡(luò)的輸出對網(wǎng)絡(luò)流量進(jìn)行分類,。
3 試驗與分析
本文選用流量文庫http://newsfeed.ntcu.net/中給出的兩組實際數(shù)據(jù)進(jìn)行實驗,兩組數(shù)據(jù)分別如表1,、表2所示,。
RBF網(wǎng)絡(luò)在數(shù)據(jù)一中采用248個輸入層節(jié)點(diǎn)、262個隱含層節(jié)點(diǎn)和11個輸出層節(jié)點(diǎn)的結(jié)構(gòu),;在數(shù)據(jù)二中采用248個輸入節(jié)點(diǎn),、260個隱含層節(jié)點(diǎn)和8個輸出層節(jié)點(diǎn)的結(jié)構(gòu)。實驗結(jié)果如表3所示,。
本文提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量識別方法,。通過測試兩組開發(fā)的網(wǎng)絡(luò)流量數(shù)據(jù)集,證明該方法具有較高的準(zhǔn)確度,、低復(fù)雜性和良好的自適應(yīng)性,。
參考文獻(xiàn)
[1] Shi Zhongzhi.Neural Network[M].Beijing:Higher Education Press,2009.
[2] COVER T M.Geometrical and statistical properties of system of linear inequalities with applications in pattern recognition[J].IEEE Transactions on Electronic Computer,,1965(14):326-334.
[3] Fei Sike Technology R&D Center.Matlab Application[M]. Beijing:Electronic Industry Press,,2005.
[4] MOORE A W,,ZUEV D.Discriminators for use in flow-based classification[A].Intel Research,Cambridge,,2005.
[5] 王俊松.基于Elman神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量建模及預(yù)測[J].計算機(jī)工程,,2009(9):190-191.