文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 楊曉軍,錢成. 一種基于電流狀態(tài)監(jiān)測分析的系統(tǒng)自我監(jiān)控管理技術[J].電子技術應用,,2018,,44(9):79-81,86.
英文引用格式: Yang Xiaojun,,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,,44(9):79-81,,86.
0 引言
現(xiàn)代社會對信息系統(tǒng)設備的高可靠性,、易測試性的要求越來越高,“實時,、動態(tài),、快速、精確”已成為當今信息系統(tǒng)的新主題,。系統(tǒng)健康管理技術日益發(fā)展,,已成為提高系統(tǒng)高可用性的關鍵技術之一[1],其基本思想是對系統(tǒng)的關鍵部件狀態(tài)進行實時監(jiān)測,并基于系統(tǒng)的健康管理知識庫,,進行實時的自主保障診斷,、預測與健康管理,從而提高系統(tǒng)的高可用性,。
在規(guī)則知識自動挖掘獲取方面,,從數(shù)據(jù)中挖掘提取規(guī)則知識的技術在很多領域取得了成功應用,如:賀林曉利用關聯(lián)規(guī)則挖掘方法提取變電設備故障診斷規(guī)則[2],;黃常海等人對船舶事故的因果關系數(shù)據(jù)進行分析挖掘,,提取預測和控制船舶事故的關聯(lián)規(guī)則[3]。
電源系統(tǒng)是信息系統(tǒng)的關鍵部件之一,,可以通過對電源系統(tǒng)電流的實時監(jiān)測與數(shù)據(jù)挖掘分析,,在線實時預測預警系統(tǒng)設備的運行狀態(tài),并根據(jù)不同運行狀態(tài)對其進行狀態(tài)診斷與保障維護,,從而提高系統(tǒng)的高可用性,。
本文以提高信息系統(tǒng)的高可用性、易測試性為目的,,采用健康管理的技術理念,,通過對一類系統(tǒng)的電源系統(tǒng)架構改造,增加了電流實時狀態(tài)監(jiān)測與診斷知識學習功能,,通過對系統(tǒng)設備啟動運行中的電流監(jiān)測,,實現(xiàn)了對運行狀態(tài)的在線自診斷,從而給系統(tǒng)的維護檢修提供輔助決策支持功能,。
1 基于電流狀態(tài)監(jiān)測分析的自我狀態(tài)監(jiān)測診斷方法
本文設計的自我監(jiān)控診斷系統(tǒng)架構如圖1所示,。其基本思想如下:對系統(tǒng)運行過程中的關鍵狀態(tài)數(shù)據(jù)進行實時在線監(jiān)測記錄,保存到歷史數(shù)據(jù)庫中,,并通過模式識別,、數(shù)據(jù)挖掘等方法,挖掘提取出數(shù)據(jù)中潛在的規(guī)則知識,;然后在系統(tǒng)實際運行中,,根據(jù)關鍵狀態(tài)數(shù)據(jù)的實時監(jiān)測值,通過規(guī)則匹配及時診斷發(fā)現(xiàn)系統(tǒng)設備的異常運行狀態(tài),,進行預警并提出相應的系統(tǒng)保障預案,,以便及時對系統(tǒng)進行維護保障,從而提高系統(tǒng)的可用性,。
供電系統(tǒng)是系統(tǒng)的關鍵部件之一,,系統(tǒng)設備的不同工作負荷狀態(tài)往往對應著一定的電流序列值。圖2反映了一個服務器設備在運行大型程序,、運行普通程序,、系統(tǒng)空閑時的電流變化的動態(tài)狀態(tài)(采樣頻率為10 Hz),。系統(tǒng)空閑時,電流穩(wěn)定在一個較小范圍內,;當運行程序特別是在其運行大型程序或處于CPU占用率較高時,,電流會出現(xiàn)明顯上升并至一定峰值高度??梢酝ㄟ^對計算機設備電流變化的特征判定計算機的當前基本工作狀態(tài),。本文即采用對系統(tǒng)設備運行中電流狀態(tài)的監(jiān)測與診斷分析的方法來進行系統(tǒng)自我監(jiān)測診斷。
1.1 電源部件的改進
一些老舊系統(tǒng)的供電系統(tǒng)一般不具備電流狀態(tài)在線監(jiān)測分析功能,,為了對系統(tǒng)電流進行實時狀態(tài)診斷分析,,本文對現(xiàn)有某系統(tǒng)的電源系統(tǒng)架構進行改進,增加了電源參數(shù)監(jiān)控模塊來實時采樣記錄工作設備的電流數(shù)據(jù),,對記錄的歷史數(shù)據(jù)通過數(shù)據(jù)聚類分類算法提取系統(tǒng)設備各種運行模式時的電流序列模式知識庫,,實現(xiàn)基于知識庫的系統(tǒng)設備實時監(jiān)控自我保障預警分析。
在系統(tǒng)架構中,,電源是通過多個分線器與不同的工作設備連接來提供,,原分線器不具備監(jiān)控各工作設備電流狀態(tài)的功能。為了采集記錄分析各工作設備的工作電流,,本設計增加了一個智能電源記錄分析模塊,,如圖3所示,它可以實時采集記錄各工作設備的工作電流值的歷史數(shù)據(jù),。
智能分線器按照10 Hz的采樣頻率對工作設備的電流進行采樣記錄,,并傳輸給診斷分析儀對數(shù)據(jù)進行處理。由診斷分析模塊從歷史數(shù)據(jù)中挖掘系統(tǒng)設備工作模式的特征知識庫,,并基于實時采樣的電流序列,,通過知識庫診斷分析系統(tǒng)設備的運行狀態(tài)。
1.2 系統(tǒng)設備工作模式特征知識庫構建
從圖2可以看出,,設備的每種工作模式對應著一定的電流特征模式,,這里采用下列電流特征模型Mt來描述系統(tǒng)的不同工作狀態(tài)的模式模型:
對系統(tǒng)正常運行中的歷史數(shù)據(jù)進行模式學習,建立模式知識庫,,當實際運行時的模式與模式庫中的正常模式匹配度較低時,則預警設備維護人員,,并記錄相應的異常模式,,以輔助設備維護人員及時進行設備維護保障。
為了獲得較高的歸納能力,,這里采用模糊數(shù)學的模糊值方法來描述電流的狀態(tài),、窗口的大小。其中,,IS表示電流模糊取值為小,,IM表示電流模糊取值中,,IL表示電流模糊取值為大,IT表示電流模糊取值為特大,;WS表示窗口大小取值為小,,WM表示窗口大小取值為中,WL表示窗口大小取值為大,。相應的隸屬度函數(shù)曲線如圖4所示,。
采用這種模型,對于圖2表示的某服務器工作模式曲線,,可以建立如下的系統(tǒng)正常工作模式知識庫:
學習獲得系統(tǒng)工作模式的算法流程如下:
輸入:電流序列數(shù)值ik,;
輸出:系統(tǒng)工作模式知識S。
begin
(1)計算電流模式窗口Wt:
①當|ik-ik-1|較小時,,則將k-1時刻作為Wt的開始時刻,;
②當|ik-ik-1|較大,且在模式窗口狀態(tài)時,,將k時刻作為窗口Wt的結束時刻,;
③按照W的模糊隸屬度函數(shù),計算得出Wt的離散值
(2)統(tǒng)計Wt窗口內系統(tǒng)的電流值:
①去掉Wt窗口的電流狀態(tài)值中的最大,、最小值,,然后求其平均值iwt;
②根據(jù)電流模糊隸屬度函數(shù)求iwt的模糊值
(3)計算模式Mt=的支持度Ct:
①累計Mt的模式數(shù),;
②Ct=Mt的模式數(shù)/總模式數(shù),。
(4)由支持度大于閾值的模式組成系統(tǒng)的模式知識庫S;
end
1.3 系統(tǒng)工作模式在線自診斷分析
從系統(tǒng)設備的正常運行狀態(tài)下的電流歷史狀態(tài)數(shù)據(jù)中,,學習建立了系統(tǒng)的正常模式知識庫后,,就可以根據(jù)電流序列的狀態(tài)模式與知識庫中的模式進行匹配,不能匹配的模式則為異常模式,,或者人工分析判斷為正常時作為正常模式加入模式庫,。
工作模式自診斷分析算法流程如下:
輸入:電流狀態(tài)值ik,模式知識庫S,;
輸出:系統(tǒng)工作狀態(tài),。
begin
(1)計算電流模式窗口Wt的模糊值
(2)統(tǒng)計Wt窗口內系統(tǒng)的電流值模糊狀態(tài)值
(3)計算系統(tǒng)工作模式知識庫中是否含有模式沒可匹配的模式時,則預警系統(tǒng)存在異常工作狀態(tài),;
end
2 試驗分析
利用上述方法,,本設計對某系統(tǒng)的無線通信設備6個月的正常運行中歷史記錄電流數(shù)據(jù)進行了學習,建立了系統(tǒng)正常無故障工作狀態(tài)下的工作模式知識庫,。對系統(tǒng)中正常運行的無線發(fā)射設備以頻率10 Hz進行電流采樣,,通常情況下,在其進行對外話音或數(shù)據(jù)通信時可以發(fā)現(xiàn)明顯的電流變化,,且每次發(fā)射的電流變化過程基本一致,。在無線發(fā)射設備靜默或待機狀態(tài),,電流相對平穩(wěn),當出現(xiàn)話音通信或定期的數(shù)據(jù)通信時,,其電流出現(xiàn)明顯的躍升,,該電流變化特征可作為該無線發(fā)射設備工作狀態(tài)判定的依據(jù),工作模式知識數(shù)據(jù)如圖5所示,。
在一次無線網絡互聯(lián)過程中發(fā)現(xiàn)數(shù)據(jù)通信中斷,。一般情況下需要排查整個通信鏈路中參與通信的終端設備、網絡交換設備,、路由設備,、安防設備以及無線通信設備。在增加了電流數(shù)據(jù)采樣后,,系統(tǒng)發(fā)現(xiàn)該無線通信設備電流數(shù)據(jù)長時間保持在靜默待機狀態(tài),,與以往運行路由協(xié)議進行周期數(shù)據(jù)發(fā)射模式明顯不同。
根據(jù)系統(tǒng)正常無故障狀態(tài)下工作模式知識庫:S={(IS,,WM,,0.32),(IS,,WT,,0.28),(IM,,WM,,0.10),(IM,,WT,,0.13),(IL,,WM,,0.17)},對系統(tǒng)運行中工作狀態(tài)進行實時在線自診斷分析,,并檢測出該無線通信設備工作異常狀態(tài)模式(IL,,WS),進一步對該異常進行機理分析后,,診斷為一電子器件老化故障,。
3 結論
本文基于系統(tǒng)健康管理的思想,以提高系統(tǒng)的自我診斷保障功能為目標,,通過對原有電源系統(tǒng)的改造,,增加了運行電流狀態(tài)實時監(jiān)測記錄功能,,可以監(jiān)測系統(tǒng)設備運行中的電流模式特征,;建立了電流模式的特征模型,,并通過歷史數(shù)據(jù)學習獲得正常模式知識庫,根據(jù)實時運行中的電流模式特征和知識庫自我監(jiān)測診斷,,發(fā)現(xiàn)異常運行狀態(tài),,從而可以及時針對相應的異常按照相應異常預案進行維護保障,以提高系統(tǒng)維護的實時性,,有利于提高系統(tǒng)的高可用性,。
參考文獻
[1] 胡蔦慶,胡雷,,陳凌,,等.裝備健康管理的現(xiàn)狀、未來與挑戰(zhàn)[J].國防科技,,2015,,36(1):10-15.
[2] 賀林曉.基于粗糙集的關聯(lián)規(guī)則挖掘在變電設備故障診斷中的應用[D].北京:華北電力大學,2015.
[3] 黃常海,,高德毅,,胡甚平,等.基于Apriori算法的船舶交通事故關聯(lián)規(guī)則分析[J].上海海事大學學報,,2014,,35(3):18-22.
作者信息:
楊曉軍,錢 成
(中國電子科技集團第二十八研究所,,江蘇 南京210007)