《電子技術應用》
您所在的位置:首頁 > 測試測量 > 設計應用 > 一種基于電流狀態(tài)監(jiān)測分析的系統(tǒng)自我監(jiān)控管理技術
一種基于電流狀態(tài)監(jiān)測分析的系統(tǒng)自我監(jiān)控管理技術
2018年電子技術應用第9期
楊曉軍,錢 成
中國電子科技集團第二十八研究所,江蘇 南京210007
摘要: 信息系統(tǒng)的高可靠,、易測試是保證其使用效能的重要因素,一些老舊系統(tǒng)受當時技術發(fā)展的約束,,無法做到易測試。如何提高這些系統(tǒng)的測試性從而保障系統(tǒng)的高可用性,,是信息系統(tǒng)技術改造的關鍵技術之一,。通過對一類系統(tǒng)的電源系統(tǒng)架構改造,增加系統(tǒng)電流實時狀態(tài)監(jiān)測與自我監(jiān)控診斷功能,,通過對系統(tǒng)中設備啟動運行中的電流監(jiān)測,,實現(xiàn)對系統(tǒng)運行狀態(tài)的在線自我狀態(tài)監(jiān)控診斷,從而給系統(tǒng)的維護檢修提供輔助決策支持功能,。該技術對于提高系統(tǒng)的精準維護與高可用性具有重要意義,。
中圖分類號: TP311
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 楊曉軍,錢成. 一種基于電流狀態(tài)監(jiān)測分析的系統(tǒng)自我監(jiān)控管理技術[J].電子技術應用,,2018,,44(9):79-81,86.
英文引用格式: Yang Xiaojun,,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,,44(9):79-81,,86.
A self-monitoring and management technology for systems based on real-time current monitoring and analysis
Yang Xiaojun,Qian Cheng
The 28th Research Institute of China Electronics Technology Group Corporation,,Nanjing 210007,,China
Abstract: The high reliability and easy testing of the information system are important factors to ensure the efficiency of the information system. Some old systems are constrained by the technological development of the past time, and can not be easily tested. How to improve the testability of these systems so as to ensure the high availability of the system is one of the key technologies for the technical transformation of information systems. In this paper, the power system architecture of a class of systems is transformed to increase the real-time state monitoring, self monitoring and diagnosis function of the system current. By monitoring the current of the equipment in the system, the on-line self state monitoring and diagnosis of the running state of the system is realized. It provides the auxiliary decision support function for the maintenance of the system, which is of great significance to improve the precision maintenance and high availability of the system.
Key words : information system;self-monitoring and management,;high availability

0 引言

    現(xiàn)代社會對信息系統(tǒng)設備的高可靠性,、易測試性的要求越來越高,“實時,、動態(tài),、快速、精確”已成為當今信息系統(tǒng)的新主題,。系統(tǒng)健康管理技術日益發(fā)展,,已成為提高系統(tǒng)高可用性的關鍵技術之一[1],其基本思想是對系統(tǒng)的關鍵部件狀態(tài)進行實時監(jiān)測,并基于系統(tǒng)的健康管理知識庫,,進行實時的自主保障診斷,、預測與健康管理,從而提高系統(tǒng)的高可用性,。

    在規(guī)則知識自動挖掘獲取方面,,從數(shù)據(jù)中挖掘提取規(guī)則知識的技術在很多領域取得了成功應用,如:賀林曉利用關聯(lián)規(guī)則挖掘方法提取變電設備故障診斷規(guī)則[2],;黃常海等人對船舶事故的因果關系數(shù)據(jù)進行分析挖掘,,提取預測和控制船舶事故的關聯(lián)規(guī)則[3]

    電源系統(tǒng)是信息系統(tǒng)的關鍵部件之一,,可以通過對電源系統(tǒng)電流的實時監(jiān)測與數(shù)據(jù)挖掘分析,,在線實時預測預警系統(tǒng)設備的運行狀態(tài),并根據(jù)不同運行狀態(tài)對其進行狀態(tài)診斷與保障維護,,從而提高系統(tǒng)的高可用性,。

    本文以提高信息系統(tǒng)的高可用性、易測試性為目的,,采用健康管理的技術理念,,通過對一類系統(tǒng)的電源系統(tǒng)架構改造,增加了電流實時狀態(tài)監(jiān)測與診斷知識學習功能,,通過對系統(tǒng)設備啟動運行中的電流監(jiān)測,,實現(xiàn)了對運行狀態(tài)的在線自診斷,從而給系統(tǒng)的維護檢修提供輔助決策支持功能,。

1 基于電流狀態(tài)監(jiān)測分析的自我狀態(tài)監(jiān)測診斷方法

    本文設計的自我監(jiān)控診斷系統(tǒng)架構如圖1所示,。其基本思想如下:對系統(tǒng)運行過程中的關鍵狀態(tài)數(shù)據(jù)進行實時在線監(jiān)測記錄,保存到歷史數(shù)據(jù)庫中,,并通過模式識別,、數(shù)據(jù)挖掘等方法,挖掘提取出數(shù)據(jù)中潛在的規(guī)則知識,;然后在系統(tǒng)實際運行中,,根據(jù)關鍵狀態(tài)數(shù)據(jù)的實時監(jiān)測值,通過規(guī)則匹配及時診斷發(fā)現(xiàn)系統(tǒng)設備的異常運行狀態(tài),,進行預警并提出相應的系統(tǒng)保障預案,,以便及時對系統(tǒng)進行維護保障,從而提高系統(tǒng)的可用性,。

ck1-t1.gif

    供電系統(tǒng)是系統(tǒng)的關鍵部件之一,,系統(tǒng)設備的不同工作負荷狀態(tài)往往對應著一定的電流序列值。圖2反映了一個服務器設備在運行大型程序,、運行普通程序,、系統(tǒng)空閑時的電流變化的動態(tài)狀態(tài)(采樣頻率為10 Hz),。系統(tǒng)空閑時,電流穩(wěn)定在一個較小范圍內,;當運行程序特別是在其運行大型程序或處于CPU占用率較高時,,電流會出現(xiàn)明顯上升并至一定峰值高度??梢酝ㄟ^對計算機設備電流變化的特征判定計算機的當前基本工作狀態(tài),。本文即采用對系統(tǒng)設備運行中電流狀態(tài)的監(jiān)測與診斷分析的方法來進行系統(tǒng)自我監(jiān)測診斷。

ck1-t2.gif

1.1 電源部件的改進

    一些老舊系統(tǒng)的供電系統(tǒng)一般不具備電流狀態(tài)在線監(jiān)測分析功能,,為了對系統(tǒng)電流進行實時狀態(tài)診斷分析,,本文對現(xiàn)有某系統(tǒng)的電源系統(tǒng)架構進行改進,增加了電源參數(shù)監(jiān)控模塊來實時采樣記錄工作設備的電流數(shù)據(jù),,對記錄的歷史數(shù)據(jù)通過數(shù)據(jù)聚類分類算法提取系統(tǒng)設備各種運行模式時的電流序列模式知識庫,,實現(xiàn)基于知識庫的系統(tǒng)設備實時監(jiān)控自我保障預警分析。

    在系統(tǒng)架構中,,電源是通過多個分線器與不同的工作設備連接來提供,,原分線器不具備監(jiān)控各工作設備電流狀態(tài)的功能。為了采集記錄分析各工作設備的工作電流,,本設計增加了一個智能電源記錄分析模塊,,如圖3所示,它可以實時采集記錄各工作設備的工作電流值的歷史數(shù)據(jù),。

ck1-t3.gif

    智能分線器按照10 Hz的采樣頻率對工作設備的電流進行采樣記錄,,并傳輸給診斷分析儀對數(shù)據(jù)進行處理。由診斷分析模塊從歷史數(shù)據(jù)中挖掘系統(tǒng)設備工作模式的特征知識庫,,并基于實時采樣的電流序列,,通過知識庫診斷分析系統(tǒng)設備的運行狀態(tài)。

1.2 系統(tǒng)設備工作模式特征知識庫構建

    從圖2可以看出,,設備的每種工作模式對應著一定的電流特征模式,,這里采用下列電流特征模型Mt來描述系統(tǒng)的不同工作狀態(tài)的模式模型:

ck1-gs1-2.gif

    對系統(tǒng)正常運行中的歷史數(shù)據(jù)進行模式學習,建立模式知識庫,,當實際運行時的模式與模式庫中的正常模式匹配度較低時,則預警設備維護人員,,并記錄相應的異常模式,,以輔助設備維護人員及時進行設備維護保障。

    為了獲得較高的歸納能力,,這里采用模糊數(shù)學的模糊值方法來描述電流的狀態(tài),、窗口的大小。其中,,IS表示電流模糊取值為小,,IM表示電流模糊取值中,,IL表示電流模糊取值為大,IT表示電流模糊取值為特大,;WS表示窗口大小取值為小,,WM表示窗口大小取值為中,WL表示窗口大小取值為大,。相應的隸屬度函數(shù)曲線如圖4所示,。

ck1-t4.gif

    采用這種模型,對于圖2表示的某服務器工作模式曲線,,可以建立如下的系統(tǒng)正常工作模式知識庫:

    ck1-gs3.gif

    學習獲得系統(tǒng)工作模式的算法流程如下:

    輸入:電流序列數(shù)值ik,;

    輸出:系統(tǒng)工作模式知識S。

    begin

    (1)計算電流模式窗口Wt

    ①當|ik-ik-1|較小時,,則將k-1時刻作為Wt的開始時刻,;

    ②當|ik-ik-1|較大,且在模式窗口狀態(tài)時,,將k時刻作為窗口Wt的結束時刻,;

    ③按照W的模糊隸屬度函數(shù),計算得出Wt的離散值ck1-t4-x1.gif

    (2)統(tǒng)計Wt窗口內系統(tǒng)的電流值:

    ①去掉Wt窗口的電流狀態(tài)值中的最大,、最小值,,然后求其平均值iwt

    ②根據(jù)電流模糊隸屬度函數(shù)求iwt的模糊值ck1-t4-x2.gif

    (3)計算模式Mt=ck1-t4-x3.gif的支持度Ct

    ①累計Mt的模式數(shù),;

    ②Ct=Mt的模式數(shù)/總模式數(shù),。

    (4)由支持度大于閾值的模式組成系統(tǒng)的模式知識庫S;

    end

1.3 系統(tǒng)工作模式在線自診斷分析

    從系統(tǒng)設備的正常運行狀態(tài)下的電流歷史狀態(tài)數(shù)據(jù)中,,學習建立了系統(tǒng)的正常模式知識庫后,,就可以根據(jù)電流序列的狀態(tài)模式與知識庫中的模式進行匹配,不能匹配的模式則為異常模式,,或者人工分析判斷為正常時作為正常模式加入模式庫,。

    工作模式自診斷分析算法流程如下:

    輸入:電流狀態(tài)值ik,模式知識庫S,;

    輸出:系統(tǒng)工作狀態(tài),。

    begin

    (1)計算電流模式窗口Wt的模糊值ck1-t4-x4.gif

    (2)統(tǒng)計Wt窗口內系統(tǒng)的電流值模糊狀態(tài)值ck1-t4-x5.gif

    (3)計算系統(tǒng)工作模式知識庫中是否含有模式ck1-t4-x6.gif沒可匹配的模式時,則預警系統(tǒng)存在異常工作狀態(tài),;

    end

2 試驗分析

    利用上述方法,,本設計對某系統(tǒng)的無線通信設備6個月的正常運行中歷史記錄電流數(shù)據(jù)進行了學習,建立了系統(tǒng)正常無故障工作狀態(tài)下的工作模式知識庫,。對系統(tǒng)中正常運行的無線發(fā)射設備以頻率10 Hz進行電流采樣,,通常情況下,在其進行對外話音或數(shù)據(jù)通信時可以發(fā)現(xiàn)明顯的電流變化,,且每次發(fā)射的電流變化過程基本一致,。在無線發(fā)射設備靜默或待機狀態(tài),,電流相對平穩(wěn),當出現(xiàn)話音通信或定期的數(shù)據(jù)通信時,,其電流出現(xiàn)明顯的躍升,,該電流變化特征可作為該無線發(fā)射設備工作狀態(tài)判定的依據(jù),工作模式知識數(shù)據(jù)如圖5所示,。

ck1-t5.gif

    在一次無線網絡互聯(lián)過程中發(fā)現(xiàn)數(shù)據(jù)通信中斷,。一般情況下需要排查整個通信鏈路中參與通信的終端設備、網絡交換設備,、路由設備,、安防設備以及無線通信設備。在增加了電流數(shù)據(jù)采樣后,,系統(tǒng)發(fā)現(xiàn)該無線通信設備電流數(shù)據(jù)長時間保持在靜默待機狀態(tài),,與以往運行路由協(xié)議進行周期數(shù)據(jù)發(fā)射模式明顯不同。

    根據(jù)系統(tǒng)正常無故障狀態(tài)下工作模式知識庫:S={(IS,,WM,,0.32),(IS,,WT,,0.28),(IM,,WM,,0.10),(IM,,WT,,0.13),(IL,,WM,,0.17)},對系統(tǒng)運行中工作狀態(tài)進行實時在線自診斷分析,,并檢測出該無線通信設備工作異常狀態(tài)模式(IL,,WS),進一步對該異常進行機理分析后,,診斷為一電子器件老化故障,。

3 結論

    本文基于系統(tǒng)健康管理的思想,以提高系統(tǒng)的自我診斷保障功能為目標,,通過對原有電源系統(tǒng)的改造,,增加了運行電流狀態(tài)實時監(jiān)測記錄功能,,可以監(jiān)測系統(tǒng)設備運行中的電流模式特征,;建立了電流模式的特征模型,,并通過歷史數(shù)據(jù)學習獲得正常模式知識庫,根據(jù)實時運行中的電流模式特征和知識庫自我監(jiān)測診斷,,發(fā)現(xiàn)異常運行狀態(tài),,從而可以及時針對相應的異常按照相應異常預案進行維護保障,以提高系統(tǒng)維護的實時性,,有利于提高系統(tǒng)的高可用性,。

參考文獻

[1] 胡蔦慶,胡雷,,陳凌,,等.裝備健康管理的現(xiàn)狀、未來與挑戰(zhàn)[J].國防科技,,2015,,36(1):10-15.

[2] 賀林曉.基于粗糙集的關聯(lián)規(guī)則挖掘在變電設備故障診斷中的應用[D].北京:華北電力大學,2015.

[3] 黃常海,,高德毅,,胡甚平,等.基于Apriori算法的船舶交通事故關聯(lián)規(guī)則分析[J].上海海事大學學報,,2014,,35(3):18-22.



作者信息:

楊曉軍,錢  成

(中國電子科技集團第二十八研究所,,江蘇 南京210007)

此內容為AET網站原創(chuàng),,未經授權禁止轉載。