文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.191123
中文引用格式: 可婷,,葛雪純,張立東,,等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應用,,2020,46(4):29-33.
英文引用格式: Ke Ting,,Ge Xuechun,,Zhang Lidong,et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique,,2020,,46(4):29-33.
0 引言
作為一種重要的鐵路信號基礎(chǔ)設(shè)備,道岔的運行情況與列車的安全運行和運輸效率密不可分,,一旦道岔運行發(fā)生故障沒有及時檢修,,會帶來非常大的安全隱患,對人們的生命和財產(chǎn)安全造成巨大損失[1],。因此,,實時監(jiān)控其運行狀態(tài)并及時處理故障是鐵路安全運行的關(guān)鍵問題之一。
目前,,我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機動作時的電流值,。圖1給出了隨著時間變化,道岔轉(zhuǎn)轍機動作時產(chǎn)生的電流變化趨勢圖,。該圖可分為切斷表示電流、解鎖,、轉(zhuǎn)換,、鎖閉、接通表示電流5個階段,。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機監(jiān)測系統(tǒng)監(jiān)測出的道岔動作電流曲線與總結(jié)得到的電流曲線進行人為比對,,最終確定道岔的工作狀態(tài)。然而,,這種人工識別方式存在3個方面的缺陷:(1)對維護人員的工作經(jīng)驗依賴度較高,,容易出現(xiàn)誤判或漏判等情況,特別是當?shù)啦砉收媳徽`判為正常狀態(tài)時,,會導致未及時采取維護措施,,造成無法挽回的損失;(2)在中國高速鐵路和客運專線飛速發(fā)展的今天,,這種單純靠人工經(jīng)驗判斷錯綜復雜的道岔設(shè)備的運行狀態(tài)需要耗費大量的人力,、物力和財力;(3)人工判斷效率極其低下,,已經(jīng)完全不能滿足經(jīng)濟發(fā)展的要求和人民出行的需求,。因此,在當今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下,,研究一種具備學習能力的道岔故障智能識別系統(tǒng)是亟待解決的問題之一,。
隨著人工智能方法的逐漸成熟和完善,,國內(nèi)外專家學者利用人工智能方法對鐵路道岔故障的識別進行了初步的研究,并取得了一些成果,。例如,,邢玉龍等人考慮外部環(huán)境因素,對數(shù)據(jù)做特殊處理,,建立數(shù)學模型進行故障檢測[2],。然而,該模型和方法的分類性能并不穩(wěn)定,,泛化能力不強,。王思明、雷燁和關(guān)瓊利用支持向量機方法設(shè)計不同的求解算法,,實現(xiàn)道岔設(shè)備的故障診斷[3-4],。鐘志旺、唐濤和王峰通過分詞算法將故障文檔表達在詞項特征空間中,,并將故障文檔表達在主題特征空間上,,以SVM算法構(gòu)造診斷器[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計改進算法,,用于道岔故障診斷[6-7],。然而,神經(jīng)網(wǎng)絡(luò)在訓練樣本較少時分類性能不佳,,會出現(xiàn)過擬合現(xiàn)象,。總之,,以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時才具有較好的識別效果,。事實上,在實際的運行環(huán)境中,,每個道岔出現(xiàn)故障的概率十分小,,即故障樣本遠少于正常樣本,是一種不均衡問題,。此外,,不同道岔電流數(shù)據(jù)維度并不相同,且道岔電流數(shù)據(jù)往往維度很高,,這也會導致以上方法的運算時間較長,,不能滿足鐵路道岔實時檢測的要求。
針對以上兩個普遍存在的問題,,本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù),,具體地,包括道岔數(shù)據(jù)的缺失值補齊,、特征提取,、道岔智能識別問題的轉(zhuǎn)化,、道岔的智能識別技術(shù)、識別性能指標的設(shè)計等方面的研究,。以廣州鐵路局的道岔數(shù)據(jù)為實驗數(shù)據(jù),,在環(huán)境為MATLAB 2014a,Windows 7,,Intel Core i3 2.4 GHz CPU下進行實驗模擬,。實驗結(jié)果表明,本文的識別系統(tǒng)在不均衡道岔樣本中仍具有很好的識別能力,,并具有強泛化能力,,且其識別平均時間為0.04 s,滿足智能識別的實時性要求,。
1 道岔故障智能識別系統(tǒng)
1.1 道岔電流數(shù)據(jù)特征選擇
微機監(jiān)測采集數(shù)據(jù)的周期為0.04 s,,道岔正常轉(zhuǎn)換時,需要6.4 s~10 s,,于是會產(chǎn)生160~250個電流數(shù)據(jù),;而道岔卡阻時,其轉(zhuǎn)換時間可能長達30 s,,甚至更長時間,,此時會采集600多個甚至更多的電流數(shù)據(jù)。因此,,這就可能存在兩個問題:(1)以道岔動作一次得到的電流值為一個樣本向量,,那么多次動作將得到多個樣本向量,以這些樣本向量作為本文的訓練樣本,,發(fā)現(xiàn)其維度并不相同,這將大大增加后面的訓練難度; (2)道岔卡阻時會產(chǎn)生高維數(shù)據(jù),,這必然增加模型學習的訓練時間,,導致道岔故障識別遲緩。因此,,本文首先對數(shù)據(jù)進行預處理,,即利用缺失值補零的方式將所有數(shù)據(jù)補為維度相同的向量。然而,,補零操作必會出現(xiàn)高維小樣本數(shù)據(jù),,導致過擬合現(xiàn)象的出現(xiàn)。因此,,接下來就需要對高維小樣本數(shù)據(jù)進行特征提取,,本文采取主成分分析方法對數(shù)據(jù)進行特征選擇和提取。主成分分析(Principal Component Analysis,,PCA)是KARL P發(fā)明的一種特征提取技術(shù)[8],,它對多個樣本的輸入矩陣求協(xié)方差矩陣,,根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性,通過獲得累計方差貢獻率,,選擇協(xié)方差矩陣相應的特征向量,,確定主成分。具體的數(shù)據(jù)處理步驟如下:
(1)輸入:鐵路道岔電流的n個樣本向量,、參數(shù)θ,;
(2)原始數(shù)據(jù)預處理:以樣本的最高維度m為訓練樣本的維度,將低于m維的樣本進行補零操作,,初步得樣本如下:
1.2 智能識別問題的轉(zhuǎn)化
一方面,,道岔異常可能出現(xiàn)在任何一個階段,,且異常情況極其復雜,;另一方面,出現(xiàn)異常道岔的概率較低,,即本文得到的訓練數(shù)據(jù)為不均衡數(shù)據(jù),,正常數(shù)據(jù)較多,而異常數(shù)據(jù)極少,。鑒于此特點,,區(qū)別于已有方法,本文將學習問題轉(zhuǎn)化為不均衡分類問題,,即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù),,記作x1,x2,,…,,xp,其標簽記為yi=1,,i=1,,…,p,;道岔正常電流曲線數(shù)據(jù)為負類數(shù)據(jù),,記作xp+1,xp+2,,…,,xn,其標簽記為yi=-1,,i=p+1,,…,n,。與負類樣本相比較,,正類數(shù)據(jù)的錯誤識別會導致更加嚴重的后果,。因此,本文更看重正類數(shù)據(jù)的正確識別,。本文在已知兩類訓練樣本前提下,,通過學習一個決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈Rr×1的所屬類別。
1.3 道岔故障識別器
由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)[9]——支持向量機(SVM),,是以結(jié)構(gòu)風險最小化為原則,,將最大間隔思想和基于核的方法結(jié)合起來,構(gòu)建優(yōu)化模型,。在很多實際應用中,,該模型都表現(xiàn)出了很好的泛化能力?;诖?,為了保證正類樣本能正確分類,本文設(shè)定正類樣本的懲罰參數(shù)大于負類樣本的懲罰參數(shù),,來構(gòu)建如下非均衡學習的SVM模型:
由此可以推出:
1.4 道岔故障識別性能指標
在學習到一個分類器之后,,需要對它的分類性能進行評估。目前,,有許多標準來評估一個分類器性能,,如:分類精度(分類的正確率)、分類錯誤率,。然而,,在鐵路道岔故障識別的電流數(shù)據(jù)中可能有高達98%的情況是正常道岔, 那么一個分類器不做任何分析而簡單地把每個數(shù)據(jù)分成“負類”就能達到98%的精度,。顯然,,分類精度這樣的評價準則在鐵路道岔識別問題中是毫無用處的。本文更看重鐵路故障道岔(正類)的識別情況,,受自然語言處理問題及部分監(jiān)督學習問題[10]的啟發(fā),,本文設(shè)計正類樣本的查全率及查準率兩個評價標準。具體的定義如下:
式(14)和(15)中各個指標的具體含義如圖2所示,。
這兩個評估標準的直觀含義是十分明顯的,即更加關(guān)注正類樣本是否更加準確及全面地識別,。然而,,由于這兩個標準從兩個角度說明正類樣本的識別性能,并不相關(guān),。這時,,可以對查全率和查準率求調(diào)和平均數(shù),得到新的評價標準,,即F值:
該評價標準對故障道岔的識別提出更高的要求,,只有查全率和查準率都大時,,F(xiàn)值才大;有一個小,,F(xiàn)值就不高,。
2 數(shù)值實驗
2.1 實驗安排
本文實驗數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值,記為W1902#和W1904#,。這些數(shù)據(jù)包括道岔的定位到反位,、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過前期的數(shù)據(jù)缺失值補零預處理及特征提取后,,隨機取其中的80%作為訓練集,,剩余的20%作為測試集進行預測。實驗重復進行100次,,取平均F值即為本文分類器最終的分類性能的評估,。
2.2 參數(shù)設(shè)置
本文取累計貢獻率?茲=95%,保證95%的數(shù)據(jù)信息量不丟失,,利用主成分分析進行數(shù)據(jù)降維,。本文采用十折交叉驗證方法對偏置-SVM的模型進行選擇。十折交叉驗證(10-fold cross-validation)[11]是將數(shù)據(jù)集隨機分成10份,,輪流將其中9份作為訓練樣本,,1份作為驗證樣本。懲罰參數(shù)C+,,C-在集合{2-10,,2-9,…,,210}中選擇,。此外,本文采用高斯核K(xi,,x)=進行數(shù)據(jù)分類,,核參數(shù)?滓在集合{2-10,2-9,,…,,210}中選擇。每組參數(shù)在十折交叉驗證中得到10個F值,,計算其平均F值,。本文取最高平均F值所對應的參數(shù)為最優(yōu)參數(shù),同時偏置支持向量機的模型隨之確定,。
2.3 實驗結(jié)果
通過MATLAB軟件實現(xiàn)對數(shù)據(jù)的缺失值補零及PCA降維處理后,,得到的訓練樣本如表1所示。其中,#正樣本表示異常道岔數(shù)據(jù)量,,#負樣本表示正常道岔數(shù)據(jù)量,,#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù),#訓練(80%)表示隨機取80%數(shù)據(jù)作為訓練數(shù)據(jù)的個數(shù),,#測試(20%)表示測試數(shù)據(jù)個數(shù),。通過表1發(fā)現(xiàn)在進行數(shù)據(jù)降維之后,樣本的屬性個數(shù)有明顯的下降,,從600多降到7~8維,,這說明采集到的電流值大部分都是冗余的,沒有區(qū)分度和實際意義的,。
在進行100次的實驗運行后,,得到W1902#和W1904#道岔檢測的平均查全率、查準率及F值,,如表2,、表3所示。表2說明W1902#道岔的查全率高達0.98以上,,平均F值為0.94以上,。
表3體現(xiàn)了W1904#極好的效果,平均查全率值高達100%,,即本文偏置-SVM智能識別器可以精準檢測故障道岔,。
3 結(jié)論
本文提出了一種鐵路智能檢測系統(tǒng),該系統(tǒng)從數(shù)據(jù)預處理,、特征選擇,、SVM建模到性能評價標準設(shè)計這幾個方面做了詳細的研究,最后針對廣州鐘村站的道岔電流數(shù)據(jù),,利用MATLAB軟件進行仿真實驗,。實驗結(jié)果顯示,該智能系統(tǒng)具有強的泛化能力,,即在環(huán)境復雜變化時仍具有極高的檢測效果,,同時運行時間為0.04 s,滿足實時性要求,。
參考文獻
[1] 中華人民共和國鐵道部.鐵路行車事故案例選編[M].北京:中國鐵道版社,,1999.
[2] 邢玉龍,趙會兵,,田健.道岔動作電流曲線的特征提取方法及道岔故障診斷方法:中國,,CN105260595B[P].2017-03-15.
[3] 王思明,雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學學報,,2010,,29(4):1-5.
[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報,2015,,31(4):230-232.
[5] 鐘志旺,,唐濤,王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學報,,2018,,40(7):80-87.
[6] DIEGO J,PEDREGALA F P,,GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety,,2004,83(1):103-110.
[7] GARCIA M F,,SCHMID F,,CONDE J.Wear assessment employing remote condition monitoring:a case study[J].Wear,2003,,255(7):1209-1220.
[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems,,1987,2(1):37-52.
[9] CORTES C,,VAPNIK V.Support-vector network[J].Machine Learning,,1995,20:273-297.
[10] KE T,,JING L,,LV H,et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence,,2018,,48(8):2373-2392.
[11] 鄧乃揚,田英杰.支持向量機——理論,、算法與拓展[M].北京:科學出版社, 2009.
作者信息:
可 婷1,,葛雪純2,張立東1,,呂 慧1
(1.天津科技大學 理學院,,天津300457;2.北京華鐵信息技術(shù)有限公司,,北京100081)