摘 要: 運用自組織特征映射神經(jīng)網(wǎng)絡的工作原理和具體實現(xiàn)算法進行故障診斷分析,在對已有神經(jīng)網(wǎng)絡聚類分析方法概括和總結的基礎上,結合實驗數(shù)據(jù),、仿真數(shù)據(jù)對自組織特征映射算法故障模型診斷進行研究,得出了有意義的結論,。
關鍵詞: 數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡聚類;自組織特征映射,;特征提取
實時監(jiān)測設備運行狀況,在運行參數(shù)發(fā)生變化時及時報警并提示操作人員進行檢查,對于保障設備的正常運行具有重要的意義,。傳統(tǒng)的故障診斷方法一般都是采用基于知識的故障診斷系統(tǒng),以領域專家和操作人員的啟發(fā)性主觀經(jīng)驗知識為基礎,經(jīng)過產(chǎn)生式推理和演繹推理來獲得大量的規(guī)則,從而獲得診斷故障原因和部位。但由于基于知識的故障診斷系統(tǒng)不具有學習功能,知識的獲取途徑只有通過專家或操作人員總結經(jīng)驗獲取,從而制約了其進一步的發(fā)展[1,,2],。
神經(jīng)網(wǎng)絡是模擬人腦結構開發(fā)的一種并行運算的數(shù)字算法,由輸入層,、輸出層和隱層組成,可以用來建立輸入輸出之間復雜的映射關系,。由于具有良好的記憶聯(lián)想功能,因此在故障診斷領域得到了廣泛的應用,。但是傳統(tǒng)BP神經(jīng)網(wǎng)絡只能用于確定性關系的學習,,不能處理矛盾樣本,而故障診斷系統(tǒng)中的數(shù)據(jù)有些具有一定的離散性,,因此需要將輸入層的確定性信息模糊化之后變成模糊量,,將傳統(tǒng)神經(jīng)網(wǎng)絡變?yōu)槟:窠?jīng)網(wǎng)絡,將與故障運行參數(shù)相對應的隸屬度數(shù)值作為輸入,,從而使神經(jīng)網(wǎng)絡系統(tǒng)更加適合設備故障狀態(tài)的描述,。
1 自組織映射算法
1.1 拓撲機構與權值調整
1981年KOHONEN T教授提出一種自組織特征映射SOFM(Self-Organizing Feature Map),又稱為SOM網(wǎng)或Kohonen網(wǎng),。他認為當一個神經(jīng)網(wǎng)絡接受外界輸入模式時將會分為不同的對應區(qū)域,,各區(qū)域對輸入模式具有不同的響應特征。SOFM網(wǎng)共兩層,,輸入層模擬感知外界輸入信息的視網(wǎng)膜 ,,輸出層模擬做出響應的大腦皮層。輸入層各神經(jīng)元通過權向量將外界信息匯集到輸出層的各神經(jīng)元,。輸出層屬于競爭層,,神經(jīng)元的排列有多種形式,如一維線陣,、二維平面陣和三維刪格陣,。輸出按照二維平面組織是SOFM網(wǎng)最典型的組織方式,結構如圖1所示,。SOFM網(wǎng)采用的學習算法是在“勝者為王”算法基礎上改進的,,主要區(qū)別在于調整權向量與側抑制的方式不同。SOFM學習算法中不僅獲勝神經(jīng)元本身要調整權向量,,其周圍的神經(jīng)元在其影響下也要不同程度地調整權向量,。權向量的調整函數(shù)稱為墨西哥帽函數(shù)。由于該函數(shù)的復雜性,,在實際中采用較為簡化的大禮帽函數(shù)或廚師帽函數(shù)來處理,。
(6)結束檢查。訓練結束是以學習率?濁(t)是否衰減到0或某個預定的正小數(shù)為條件,,不滿足條件則回到步驟(2)[3,,4]。
2 自組織映射算法在故障診斷中的處理
2.1 理論依據(jù)
任何聚類算法的參數(shù)對聚類結果都具有直接的影響,,當考慮高維數(shù)據(jù)的時候,,合理的降維是一個很重要的方面,降維應該遵循一定的方法,。在算法中處理高維數(shù)據(jù)時將更高維密集單元的搜索限制在子空間密集單元的交集中,,這種候選空間的確定采用基于關聯(lián)規(guī)則挖掘中的先驗性質,該性質在所有空間中利用數(shù)據(jù)項的先驗知識以裁減空間,。采用的性質是:如果數(shù)據(jù)在k維單元是密集的,,則它在k-1維空間上的投影也是密集的。也就是說,,給定一個k維的候選密集單元,,檢查它的k-1維投影單元,如果發(fā)現(xiàn)任何一個不是密集的,,則知道第k維的單元也不是密集的[5],。由此進一步得出結論,如果聚類的某一維是密集的,,則它對于整個k維聚類也是可用的,,否則,在整個k維數(shù)據(jù)聚類中不起作用,。把這一關聯(lián)規(guī)則挖掘中的性質應用到故障特征屬性的降維中,。
SOFM的數(shù)據(jù)壓縮和特征抽取的功能,將高維空間的樣本在保持拓撲結構不變的條件下投影到低維空間,,在高維空間中很多模式的分布具有復雜特性,,但當映射到低維空間后,由于維度和節(jié)點數(shù)量(從多維對象映像到二維的神經(jīng)網(wǎng)絡節(jié)點)的降低,,其規(guī)律很明顯,。
2.2 算法
2.2.1 預處理:選擇合適的維參與映射
自組織特征映射網(wǎng)絡聚類是模型聚類的一種,其自組織學習過程也可以描述為:對于每一個網(wǎng)絡的輸入,,只調整一部分權值,,使權向量更接近或更偏離輸入矢量,這一調整過程,,就是競爭學習,。隨著不斷學習,所有權向量都在輸入矢量空間相互分離,,形成了各自代表輸入空間的一類模式,,這就是自組織映射網(wǎng)絡的特征自動識別的聚類功能。每個故障模式參數(shù)樣本作為聚類的一個“典型”,可以根據(jù)新對象與哪個參數(shù)樣本最相似(基于某種距離計算方法)而將其分派到相應的聚類中,。被診斷設備狀態(tài)可以由一系列的特征參數(shù)來描述,,一旦設備出現(xiàn)某個故障或多個故障,其狀態(tài)特征參數(shù)也會發(fā)生相應的變化,。因而,,特定的特征參數(shù)值反映了相應的設備故障。在故障診斷領域,,當設備處于故障狀態(tài)時,,將特征參數(shù)呈現(xiàn)出的特定取值稱之為故障征兆,即不同的故障征兆對應著不同的故障類型,;通常,,設備的故障類型不止一種,因此用故障域來表述設備可能出現(xiàn)的多種故障類型,,用征兆域來表述可能出現(xiàn)的多種故障征兆,。由此可見,可以認為故障診斷即進行由征兆域到故障域的模式識別,,或是由征兆域到故障模式的具有聯(lián)想能力的判別分類[6-8],。
需要指出的是,文本型數(shù)據(jù)轉換以后應該作為分類數(shù)據(jù)來處理,。一般,,在聚類過程中,如果分類維和密集維表示的是非空間屬性中不同特征的某個方面,,包括太密集的數(shù)據(jù)或者太分散的數(shù)據(jù),,都不適合進入聚類,如果不是作為分類數(shù)據(jù),,則太集中的數(shù)據(jù)不會對聚類產(chǎn)生影響,,只會增加處理的時間。而太分散的數(shù)據(jù)會對聚類結果產(chǎn)生不良的影響,。但是對于表示同一特征的不同維來說,,有些維是密集的,有些維不是密集的,,因此需要在這些維中選擇合適的維進行聚類,。
2.2.2 診斷實例
在故障診斷分析應用中,用戶應該根據(jù)聚類的目的先選擇一些候選維,,準備參與聚類,。取X1~X10 作為征兆參數(shù),在系統(tǒng)中各自參數(shù)點具有不同特點,,在發(fā)生可能的故障時,,它們的變化范圍和方向各不相同,,對征兆參數(shù)進行歸一化處理,如表1所示,。
應用自組織特征映射網(wǎng)絡來模擬模糊聚類故障診斷的全過程,,應用Matlab工具箱進行編程,根據(jù)故障樣本,,利用newsom創(chuàng)建網(wǎng)絡的競爭層為6×6的結構,,網(wǎng)絡結構是可以調整的,,可以根據(jù)數(shù)據(jù)規(guī)模進行調整,,然后輸入樣本p(如表1參數(shù)值進行訓練),利用函數(shù)train和函數(shù)sim對網(wǎng)絡進行訓練,,并對故障樣本進行模糊聚類,。由于訓練步數(shù)大小影響著網(wǎng)絡的聚類性能,分別設置100,、200和500步對網(wǎng)絡進行訓練,,觀察性能[7,8],;選用聚類效果較好的訓練步數(shù)為500步的網(wǎng)絡,,利用自組織特征映射網(wǎng)絡選取聚類數(shù)目為6類,應用訓練數(shù)據(jù)對網(wǎng)絡進行訓練,,保存網(wǎng)絡參數(shù)的訓練結果,,以及訓練數(shù)據(jù)的離散結果,然后利用訓練后的網(wǎng)絡對測試數(shù)據(jù)進行離散化處理,,即可得到離散化結果,如圖2所示,,可見6種故障模式分別占據(jù)不同區(qū)域,可作為故障診斷故障基準,。
競爭層輸出的不同的神經(jīng)元代表了不同的故障類型,,系統(tǒng)某種故障與標準樣本的故障類型越相似,在競爭層上的興奮神經(jīng)元的幾何位置也就越接近。模擬某電子設備的典型故障,,試驗中選取了5個故障樣本,經(jīng)模糊量化后得到待檢故障模式,,如表2所示。
將其輸入到已訓練好的SOFM神經(jīng)網(wǎng)絡,在競爭層中出現(xiàn)了圖3的分類結果,。第1組故障樣本輸出的幾何距離Di最接近故障形式A,,表明該故障形式為末級組件電路故障;同理,,可判斷第2組故障樣本的故障形式為激勵產(chǎn)生故障,;第3組和第4組故障樣本的輸出分別與D和B的位置重合,表明第3組和第4組故障樣本的故障形式分別為PIN開關故障和前級組件電路故障,;第5組故障樣本的輸出最接近F,,表明該故障形式可能為饋線故障,。診斷結果與仿真機模擬的故障一致。
模糊聚類分析是依據(jù)客觀事物間的特征,、親疏程度和相似性,,通過建立模糊相似關系,對客觀事物進行分類的數(shù)學方法,。用模糊聚類分析方法處理帶有模糊性的聚類問題更客觀,、靈活和直觀,且計算更加簡便,。實踐表明,,它突破了常規(guī)邏輯推理方法的局限,在很少先驗知識的情況下,,能快速而準確地解決故障診斷問題,。
參考文獻
[1] 楊軍,馮振聲,,黃考利,,等.裝備智能故障診斷技術[M]. 北京:國防工業(yè)出版社,2004:119-122.
[2] 何青,,張海巖,,張志.基于C8051F的便攜式多通道數(shù)據(jù)采集系統(tǒng)[J].儀器儀表學報,2006,,27(6):140-141.
[3] WANG X,,ILTON H.DBRS:a density based spatial clustering method with random sampling[C].Proceedings of the 7th PAKDD.Seoul,Korea,,2003:563-575.
[4] TROST B,,L IANG M.Mechanical fault detection using fuzzy index fusion[J].International Journal of Machine Tools & Manufacture,2007(47):1702-1714.
[5] CZESLAW T K,,TERESA O K.Neural networks application for induction motor faults diagnosis[J].Mathematics and Computers in Simulation,,2003(63):435-448.
[6] 程昌銀,李琳.模糊神經(jīng)網(wǎng)絡故障診斷研究[J].武漢理工大學學報,,2002,,24(1):220-225.
[7] 羅志勇.雷達系統(tǒng)智能故障診斷技術研究[D].西安:西北工業(yè)大學,2006.
[8] PAKKANEN J.The evolving tree,,a new kind of self-organizing neural network[C].Proceedings of the Workshop on Self-Organizing Maps,,Kitakyushu,Japan,,2003:311-316.