摘 要: 告警相關性分析有多種方法,,本文所討論的基于微波通信的告警相關性分析基于代碼方法的基本思想,是建立潛在的問題(故障)和表征這些問題癥狀(告警)的關聯(lián)矩陣,,并用其進行故障定位,。此方法適用范圍廣、速度快,,能夠處理較高比率的癥狀丟失和虛假癥狀,,本文主要研究關聯(lián)規(guī)則在微波通信告警中的具體應用,。
關鍵詞: 基于代碼方法,;告警相關性分析,;故障管理
在電信市場日趨開放的今天,競爭日益激烈,,各種新興電信業(yè)務不斷涌現(xiàn),。為了提高電信企業(yè)的市場競爭力,降低企業(yè)的維護成本,,減少直至避免用戶服務終端受到影響,,必須對整個電信網(wǎng)絡的管理方式進行一些改進。在規(guī)模,、技術及競爭相對層次較低的情況下,,采取原來的處理方式是可行的。但隨著數(shù)字化,、集成化的發(fā)展,,各種新業(yè)務、新技術被廣泛應用,,電信網(wǎng)絡規(guī)模和網(wǎng)絡結構發(fā)生了根本性的改變,。傳統(tǒng)的網(wǎng)絡管理已經不能滿足企業(yè)日益發(fā)展的需要,并會造成人力和財力的大量浪費,。
在電信網(wǎng)絡管理中,,故障管理是一個重要而且難度很大的任務。尤其是通信網(wǎng)絡,,每天都會產生大量的告警信息,。面對著大量告警,網(wǎng)絡管理員很難快速進行故障定位和診斷,。一個大型網(wǎng)站應用層故障恢復的時間中約有93%的時間花費在對故障的檢測和診斷上,。因此,在進行故障定位之前必須對網(wǎng)絡產生的大量告警信息進行有效地分析和解釋,。網(wǎng)管中心的任務是在接收到網(wǎng)絡產生的告警之后對告警進行分析,。告警分析意味著對告警中包含的零散信息進行整合,并從整體上對告警作出解釋,。在故障管理中有些告警處理軟件采用了告警關聯(lián)技術,,稱為告警關聯(lián)系統(tǒng)。它的主要作用是自動過濾掉冗余的告警,、識別故障以及建議一些預見性的措施,,因此在故障管理中極具價值。目前,,很多電信網(wǎng)管都采用了告警關聯(lián)系統(tǒng)作為網(wǎng)管智能化的一部分,。
1 現(xiàn)階段國內外研究方法及缺點
隨著數(shù)據(jù)挖掘技術的發(fā)展,,越來越多的研究人員采用數(shù)據(jù)挖掘方法分析告警數(shù)據(jù)。利用數(shù)據(jù)挖掘技術可以進行網(wǎng)絡故障隔離和診斷,、選擇正確措施,、進行預維護和趨勢分析。最近人們已經提出了很多算法用于完成這一任務,,然而現(xiàn)存的算法都有其自身的缺陷,,不能有效挖掘告警信息。
(1)基于關聯(lián)規(guī)則挖掘方法的告警分析
基于關聯(lián)規(guī)則挖掘的方法在告警分析數(shù)據(jù)挖掘領域內占據(jù)了十分重要的位置,,這是因為關聯(lián)規(guī)則挖掘方法具有其他方法無法比擬的優(yōu)點,。正如參考文獻[1]中總結的那樣,通過這種挖掘方法得出的規(guī)則符合人的思維,,容易理解,,因此,目前處理告警序列的操作員樂于用這種規(guī)則的形式表達知識,。而且這樣的規(guī)則可以表達這一領域內的簡單聯(lián)系,,并且有助于高效地挖掘出數(shù)據(jù)中隱藏的信息。然而,,現(xiàn)存算法挖掘效率還比較低,,并且參考文獻[5]研究發(fā)現(xiàn),一般關聯(lián)規(guī)則挖掘方法對大規(guī)模數(shù)據(jù)庫會產過多的規(guī)則,,即產生所謂的規(guī)則爆炸問題,,使決策者面對太多的規(guī)則而無所適從。
(2)基于神經網(wǎng)絡方法的告警分析
神經網(wǎng)絡方法模擬人腦神經網(wǎng)絡,,神經元是其基本處理單元,。由神經元可以構成各種不同拓撲結構的神經網(wǎng)絡。為了讓神經網(wǎng)絡實現(xiàn)事件關聯(lián)功能,,首先要對其進行訓練,,將網(wǎng)絡設備上的告警信息與實際網(wǎng)絡故障情況作為神經網(wǎng)絡的輸入和輸出,不斷調整神經元相互連接的權值,。經過訓練后的神經網(wǎng)絡就能根據(jù)存儲在神經元連接上的權值識別出特定的故障,。參考文獻[2,4]指出,,如果目標僅僅是進行好的預測,,神經網(wǎng)絡的確具有一定功能。然而,,這種方法需要有較好的訓練數(shù)據(jù),,并且在當前應用中,重要的一點是發(fā)現(xiàn)的知識應該具有可理解性,因為電信公司不會愿意把許多黑匣子安到其系統(tǒng)中去,。因此,,神經網(wǎng)絡方法在這方面仍需改進。
(3)基于案例推理方法的告警分析
案例推理是基于集中存儲的認知模型,。其基本思想是將以前解決問題的經驗以案例的形式存放在案例庫中,,當遇到問題時就從案例庫中查找同類案例的求解,從而獲得當前問題的解決方法,。參考文獻[3]開發(fā)了三個模塊對告警關聯(lián)方法進行模擬:一個模塊用于生成故障和告警,,另一個模塊用于定義網(wǎng)絡配置,,最后一個模塊再進行告警過濾和關聯(lián),。但是這種方法是基于經驗和事例來解決問題的,所以對于網(wǎng)絡處理反應不敏感,,不適應要求實時性高的告警處理,。
(4)基于代碼方法的告警分析
代碼方法的基本思想是建立潛在的問題(故障)和表征這些問題癥狀(告警)的關聯(lián)矩陣并用其進行故障定位。參考文獻[6]提出一種綜合方法,。該方法結合小代碼書和簡單專家規(guī)則的優(yōu)點進行告警分析,,取得了一定成果。使用代碼方法簡單,、適用范圍廣,、速度快,能夠處理較高比率的癥狀丟失和虛假癥狀,。此方法適合微波通信小心的故障管理系統(tǒng),。
(5)其他方法
除上述所列方法外,還有其他方法,,如聚類方法,、模糊邏輯等。聚類是把一組個體按照相似性歸成若干類別,。參考文獻[7]通過聚類算法預測出一些告警集合的發(fā)生可以導致哪些告警集合的隨后發(fā)生,。參考文獻[8]在進行告警數(shù)據(jù)分析時采用了遺傳算法生成相關性規(guī)則的預測模式,用來對故障進行預測,。對融合算法的研究也逐漸進入了人們的視野,。根據(jù)當前專家系統(tǒng)不能適應網(wǎng)絡日益發(fā)展的需要,提出一種綜合智能解決方法,,將神經網(wǎng)絡和基于案例的推理進行結合從而完成對告警數(shù)據(jù)的分析,。將遺傳算法和神經網(wǎng)絡進行結合,通過實驗證明,,該方法在網(wǎng)絡學習和訓練效率上高于傳統(tǒng)的BP算法,、標準遺傳算法和一般的自適應遺傳算法。
2 告警相關性在微波通信中的應用
由于通信告警在邏輯上具有告警相關性,,單個的故障告警往往會觸發(fā)一系列的相關聯(lián)的告警,,導致產生大量告警信息,,使對故障的判斷和定位變得困難。例如:在微波通信中,,在網(wǎng)絡管理客戶端上對同一個MPT進行收發(fā)頻率的配置,,如果配置的收發(fā)頻率和MPT真實的收發(fā)頻率不一致,會出現(xiàn)Incompatible Frequency Alarm,,同時會導致Incompatible Shifer Alarm告警的產生,,這就是由于兩個告警之間的關聯(lián)性,一個告警的產生,,導致另一個告警的產生,。如果網(wǎng)絡中同時發(fā)生多個故障,告警的情況就會變得更為復雜,。網(wǎng)絡管理員面對這些大量的告警信息是很難找出故障發(fā)生的根本原因,,從而無法修復所發(fā)生的故障。
告警相關性分析的目標是為網(wǎng)絡中某個設備故障抑制不必要或不相關的告警,,為網(wǎng)絡管理員提供更準確的故障告警信息,,找到產生故障告警的根源,以實現(xiàn)快速,、準確的故障定位,。告警相關性分析,一定的告警可以抑制比它級別低的告警,,同時也可以被比它級別高的告警抑制,。
告警相關性分析的過程,就是比較所有出現(xiàn)的通信告警之間的優(yōu)先級關系,,抑制告警級別低的告警,,使其不上報給網(wǎng)絡管理系統(tǒng),只向上發(fā)送最高級別的告警,,以減少告警上報的數(shù)量,,有利于告警根源的準確判斷。告警抑制功能用來減少故障告警的上報數(shù)量,,硬件告警能夠抑制所有的通信告警,,被抑制的告警將不再上報給網(wǎng)絡管理系統(tǒng)。如出現(xiàn)MPT Card Fail Alarm,,則所有的通信業(yè)務將中斷,,也就不會出現(xiàn)通信告警。高級別的通信告警會抑制低級別的告警,,被抑制的通信告警將不再被上報給網(wǎng)管系統(tǒng)顯示,。如出現(xiàn)Demodulator Fail告警,就不會在上報High BER告警。
告警處理過程模型如圖1所示,。
3 告警相關性處理流程圖
告警相關性是告警處理的重要組成部分,,告警管理模塊從微波通信接收和發(fā)射設備中獲得通信告警相關信息,并在告警管理模塊中完成告警的處理,。告警相關性組件只能利用檢測到的告警狀態(tài)去做告警相關性處理,。告警相關性處理流程如圖2所示。
(1)告警管理進程從微波通信接收和發(fā)射設備中獲得告警的狀態(tài),。
(2)如果檢測到的告警狀態(tài)和老的告警不相同,,則保存新的檢測到的告警,并且轉到(3),,否則什么都不做,。
(3)計算是否有比這個告警級別高的告警,如果有,,則重新計算告警相關性狀態(tài),,保存并發(fā)送到告警上報模塊,;如果沒有,,則計算是否有比此告警級別低的告警,如果有,,則重新計算告警相關性狀態(tài),,保存并發(fā)送到告警上報模塊。
4 實驗結果
實驗結果如圖3所示,。
本文提出的告警相關性分析模型與其他模型比較具有以下優(yōu)點:(1)更可靠,,易于實現(xiàn);(2)便于修改告警相關性規(guī)則,;(3)自適于網(wǎng)絡配置信息的改變,;(4)適用于微波通信設備的故障診斷,但由于組成微波通信網(wǎng)的設備很復雜,,生產廠商型號,、規(guī)格的不同,為得到一個通用相關性模型,,使它適用于各種電信網(wǎng)絡,,還需繼續(xù)研究。
參考文獻
[1] KICIMAN E,, FOX A. Detecting and localizing anomalous behavior to discover failures in component-based internet ser vices[R]. Technical Report,, Stanford, 2004.
[2] CHEN M S,, HAN J,, YU P S. Data mining: an overview from database perspective[J]. IEEE Transactions on Knowledge and Data Engineering, 1996,8(6):866-883.
[3] WIETGREFE H. Investigation and practical assessment of alarm correlation methods for the use in GSM access networks[C]. In: R. Stadler and M.Ulema,,Editors,, Proc. Network Operation and Management Symposium, 2002:391-404.
[4] 鄭慶國,,呂衛(wèi)鋒.通信網(wǎng)絡中的告警相關性研究[J].計算機工程與應用,,2002(2):11-14.
[5] KLEMETTINEN M, MANNILA H,, TOIVONEN H. Interactive exploration of interesting findings in the telecommunication network alarm sequence analyzer TASA[J]. Information and Software Technology,, 1999,41:557-567.
[6] KLEMETTINEN M. A knowledge discovery methodology for telecommunication network alarm databases[D]. Finland: Department of Computer Science,, University of Helsinki,, 1999.
[7] MANNILA H, TOIVONEN H. Discovering generalized episodesusing minimal occurrences[C]. In: Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining(KDD’96).關聯(lián)規(guī)則挖掘在電信網(wǎng)絡告警分析中的應用研究Portland,,Oregon:AAAI Press,,1996:146-151.
[8] 胡一飛.計算機網(wǎng)絡中告警數(shù)據(jù)處理技術的研究[J].福建電腦,2005(11):32-33.