文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.191123
中文引用格式: 可婷,葛雪純,,張立東,等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用,,2020,,46(4):29-33.
英文引用格式: Ke Ting,Ge Xuechun,,Zhang Lidong,,et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique,2020,,46(4):29-33.
0 引言
作為一種重要的鐵路信號基礎(chǔ)設(shè)備,,道岔的運(yùn)行情況與列車的安全運(yùn)行和運(yùn)輸效率密不可分,一旦道岔運(yùn)行發(fā)生故障沒有及時檢修,,會帶來非常大的安全隱患,,對人們的生命和財產(chǎn)安全造成巨大損失[1]。因此,,實時監(jiān)控其運(yùn)行狀態(tài)并及時處理故障是鐵路安全運(yùn)行的關(guān)鍵問題之一,。
目前,我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機(jī)監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機(jī)動作時的電流值,。圖1給出了隨著時間變化,,道岔轉(zhuǎn)轍機(jī)動作時產(chǎn)生的電流變化趨勢圖。該圖可分為切斷表示電流,、解鎖,、轉(zhuǎn)換、鎖閉,、接通表示電流5個階段,。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機(jī)監(jiān)測系統(tǒng)監(jiān)測出的道岔動作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對,最終確定道岔的工作狀態(tài),。然而,,這種人工識別方式存在3個方面的缺陷:(1)對維護(hù)人員的工作經(jīng)驗依賴度較高,容易出現(xiàn)誤判或漏判等情況,,特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時,,會導(dǎo)致未及時采取維護(hù)措施,造成無法挽回的損失,;(2)在中國高速鐵路和客運(yùn)專線飛速發(fā)展的今天,,這種單純靠人工經(jīng)驗判斷錯綜復(fù)雜的道岔設(shè)備的運(yùn)行狀態(tài)需要耗費大量的人力、物力和財力,;(3)人工判斷效率極其低下,,已經(jīng)完全不能滿足經(jīng)濟(jì)發(fā)展的要求和人民出行的需求。因此,,在當(dāng)今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下,,研究一種具備學(xué)習(xí)能力的道岔故障智能識別系統(tǒng)是亟待解決的問題之一。
隨著人工智能方法的逐漸成熟和完善,,國內(nèi)外專家學(xué)者利用人工智能方法對鐵路道岔故障的識別進(jìn)行了初步的研究,,并取得了一些成果。例如,邢玉龍等人考慮外部環(huán)境因素,,對數(shù)據(jù)做特殊處理,,建立數(shù)學(xué)模型進(jìn)行故障檢測[2]。然而,,該模型和方法的分類性能并不穩(wěn)定,,泛化能力不強(qiáng)。王思明,、雷燁和關(guān)瓊利用支持向量機(jī)方法設(shè)計不同的求解算法,,實現(xiàn)道岔設(shè)備的故障診斷[3-4]。鐘志旺,、唐濤和王峰通過分詞算法將故障文檔表達(dá)在詞項特征空間中,,并將故障文檔表達(dá)在主題特征空間上,以SVM算法構(gòu)造診斷器[5],。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計改進(jìn)算法,,用于道岔故障診斷[6-7]。然而,,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時分類性能不佳,,會出現(xiàn)過擬合現(xiàn)象??傊?,以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時才具有較好的識別效果。事實上,,在實際的運(yùn)行環(huán)境中,,每個道岔出現(xiàn)故障的概率十分小,即故障樣本遠(yuǎn)少于正常樣本,,是一種不均衡問題,。此外,不同道岔電流數(shù)據(jù)維度并不相同,,且道岔電流數(shù)據(jù)往往維度很高,這也會導(dǎo)致以上方法的運(yùn)算時間較長,,不能滿足鐵路道岔實時檢測的要求,。
針對以上兩個普遍存在的問題,本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù),,具體地,,包括道岔數(shù)據(jù)的缺失值補(bǔ)齊、特征提取,、道岔智能識別問題的轉(zhuǎn)化,、道岔的智能識別技術(shù)、識別性能指標(biāo)的設(shè)計等方面的研究,。以廣州鐵路局的道岔數(shù)據(jù)為實驗數(shù)據(jù),,在環(huán)境為MATLAB 2014a,,Windows 7,Intel Core i3 2.4 GHz CPU下進(jìn)行實驗?zāi)M,。實驗結(jié)果表明,,本文的識別系統(tǒng)在不均衡道岔樣本中仍具有很好的識別能力,并具有強(qiáng)泛化能力,,且其識別平均時間為0.04 s,,滿足智能識別的實時性要求。
1 道岔故障智能識別系統(tǒng)
1.1 道岔電流數(shù)據(jù)特征選擇
微機(jī)監(jiān)測采集數(shù)據(jù)的周期為0.04 s,,道岔正常轉(zhuǎn)換時,,需要6.4 s~10 s,于是會產(chǎn)生160~250個電流數(shù)據(jù),;而道岔卡阻時,,其轉(zhuǎn)換時間可能長達(dá)30 s,甚至更長時間,,此時會采集600多個甚至更多的電流數(shù)據(jù),。因此,這就可能存在兩個問題:(1)以道岔動作一次得到的電流值為一個樣本向量,,那么多次動作將得到多個樣本向量,,以這些樣本向量作為本文的訓(xùn)練樣本,發(fā)現(xiàn)其維度并不相同,,這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時會產(chǎn)生高維數(shù)據(jù),,這必然增加模型學(xué)習(xí)的訓(xùn)練時間,導(dǎo)致道岔故障識別遲緩,。因此,,本文首先對數(shù)據(jù)進(jìn)行預(yù)處理,即利用缺失值補(bǔ)零的方式將所有數(shù)據(jù)補(bǔ)為維度相同的向量,。然而,,補(bǔ)零操作必會出現(xiàn)高維小樣本數(shù)據(jù),導(dǎo)致過擬合現(xiàn)象的出現(xiàn),。因此,,接下來就需要對高維小樣本數(shù)據(jù)進(jìn)行特征提取,本文采取主成分分析方法對數(shù)據(jù)進(jìn)行特征選擇和提取,。主成分分析(Principal Component Analysis,,PCA)是KARL P發(fā)明的一種特征提取技術(shù)[8],它對多個樣本的輸入矩陣求協(xié)方差矩陣,,根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性,,通過獲得累計方差貢獻(xiàn)率,選擇協(xié)方差矩陣相應(yīng)的特征向量,確定主成分,。具體的數(shù)據(jù)處理步驟如下:
(1)輸入:鐵路道岔電流的n個樣本向量,、參數(shù)θ;
(2)原始數(shù)據(jù)預(yù)處理:以樣本的最高維度m為訓(xùn)練樣本的維度,,將低于m維的樣本進(jìn)行補(bǔ)零操作,,初步得樣本如下:
1.2 智能識別問題的轉(zhuǎn)化
一方面,道岔異??赡艹霈F(xiàn)在任何一個階段,,且異常情況極其復(fù)雜;另一方面,,出現(xiàn)異常道岔的概率較低,,即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù),正常數(shù)據(jù)較多,,而異常數(shù)據(jù)極少,。鑒于此特點,區(qū)別于已有方法,,本文將學(xué)習(xí)問題轉(zhuǎn)化為不均衡分類問題,,即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù),記作x1,,x2,,…,xp,,其標(biāo)簽記為yi=1,,i=1,…,,p,;道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù),記作xp+1,,xp+2,,…,xn,,其標(biāo)簽記為yi=-1,,i=p+1,…,,n。與負(fù)類樣本相比較,,正類數(shù)據(jù)的錯誤識別會導(dǎo)致更加嚴(yán)重的后果,。因此,本文更看重正類數(shù)據(jù)的正確識別。本文在已知兩類訓(xùn)練樣本前提下,,通過學(xué)習(xí)一個決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈Rr×1的所屬類別,。
1.3 道岔故障識別器
由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)[9]——支持向量機(jī)(SVM),是以結(jié)構(gòu)風(fēng)險最小化為原則,,將最大間隔思想和基于核的方法結(jié)合起來,,構(gòu)建優(yōu)化模型。在很多實際應(yīng)用中,,該模型都表現(xiàn)出了很好的泛化能力,。基于此,,為了保證正類樣本能正確分類,,本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù),來構(gòu)建如下非均衡學(xué)習(xí)的SVM模型:
由此可以推出:
1.4 道岔故障識別性能指標(biāo)
在學(xué)習(xí)到一個分類器之后,,需要對它的分類性能進(jìn)行評估,。目前,有許多標(biāo)準(zhǔn)來評估一個分類器性能,,如:分類精度(分類的正確率),、分類錯誤率。然而,,在鐵路道岔故障識別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔,, 那么一個分類器不做任何分析而簡單地把每個數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然,,分類精度這樣的評價準(zhǔn)則在鐵路道岔識別問題中是毫無用處的,。本文更看重鐵路故障道岔(正類)的識別情況,受自然語言處理問題及部分監(jiān)督學(xué)習(xí)問題[10]的啟發(fā),,本文設(shè)計正類樣本的查全率及查準(zhǔn)率兩個評價標(biāo)準(zhǔn),。具體的定義如下:
式(14)和(15)中各個指標(biāo)的具體含義如圖2所示。
這兩個評估標(biāo)準(zhǔn)的直觀含義是十分明顯的,,即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識別,。然而,由于這兩個標(biāo)準(zhǔn)從兩個角度說明正類樣本的識別性能,,并不相關(guān),。這時,可以對查全率和查準(zhǔn)率求調(diào)和平均數(shù),,得到新的評價標(biāo)準(zhǔn),,即F值:
該評價標(biāo)準(zhǔn)對故障道岔的識別提出更高的要求,只有查全率和查準(zhǔn)率都大時,,F(xiàn)值才大,;有一個小,,F(xiàn)值就不高。
2 數(shù)值實驗
2.1 實驗安排
本文實驗數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值,,記為W1902#和W1904#,。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位),。經(jīng)過前期的數(shù)據(jù)缺失值補(bǔ)零預(yù)處理及特征提取后,,隨機(jī)取其中的80%作為訓(xùn)練集,剩余的20%作為測試集進(jìn)行預(yù)測,。實驗重復(fù)進(jìn)行100次,,取平均F值即為本文分類器最終的分類性能的評估。
2.2 參數(shù)設(shè)置
本文取累計貢獻(xiàn)率?茲=95%,,保證95%的數(shù)據(jù)信息量不丟失,,利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗證方法對偏置-SVM的模型進(jìn)行選擇,。十折交叉驗證(10-fold cross-validation)[11]是將數(shù)據(jù)集隨機(jī)分成10份,,輪流將其中9份作為訓(xùn)練樣本,1份作為驗證樣本,。懲罰參數(shù)C+,,C-在集合{2-10,2-9,,…,,210}中選擇。此外,,本文采用高斯核K(xi,,x)=進(jìn)行數(shù)據(jù)分類,核參數(shù)?滓在集合{2-10,,2-9,,…,210}中選擇,。每組參數(shù)在十折交叉驗證中得到10個F值,,計算其平均F值。本文取最高平均F值所對應(yīng)的參數(shù)為最優(yōu)參數(shù),,同時偏置支持向量機(jī)的模型隨之確定,。
2.3 實驗結(jié)果
通過MATLAB軟件實現(xiàn)對數(shù)據(jù)的缺失值補(bǔ)零及PCA降維處理后,得到的訓(xùn)練樣本如表1所示,。其中,,#正樣本表示異常道岔數(shù)據(jù)量,#負(fù)樣本表示正常道岔數(shù)據(jù)量,,#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù),,#訓(xùn)練(80%)表示隨機(jī)取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個數(shù),,#測試(20%)表示測試數(shù)據(jù)個數(shù)。通過表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后,,樣本的屬性個數(shù)有明顯的下降,從600多降到7~8維,,這說明采集到的電流值大部分都是冗余的,,沒有區(qū)分度和實際意義的。
在進(jìn)行100次的實驗運(yùn)行后,,得到W1902#和W1904#道岔檢測的平均查全率,、查準(zhǔn)率及F值,如表2,、表3所示,。表2說明W1902#道岔的查全率高達(dá)0.98以上,平均F值為0.94以上,。
表3體現(xiàn)了W1904#極好的效果,,平均查全率值高達(dá)100%,即本文偏置-SVM智能識別器可以精準(zhǔn)檢測故障道岔,。
3 結(jié)論
本文提出了一種鐵路智能檢測系統(tǒng),,該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇,、SVM建模到性能評價標(biāo)準(zhǔn)設(shè)計這幾個方面做了詳細(xì)的研究,,最后針對廣州鐘村站的道岔電流數(shù)據(jù),利用MATLAB軟件進(jìn)行仿真實驗,。實驗結(jié)果顯示,,該智能系統(tǒng)具有強(qiáng)的泛化能力,即在環(huán)境復(fù)雜變化時仍具有極高的檢測效果,,同時運(yùn)行時間為0.04 s,,滿足實時性要求。
參考文獻(xiàn)
[1] 中華人民共和國鐵道部.鐵路行車事故案例選編[M].北京:中國鐵道版社,,1999.
[2] 邢玉龍,,趙會兵,田健.道岔動作電流曲線的特征提取方法及道岔故障診斷方法:中國,,CN105260595B[P].2017-03-15.
[3] 王思明,,雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報,2010,,29(4):1-5.
[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報,,2015,31(4):230-232.
[5] 鐘志旺,,唐濤,,王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報,,2018,40(7):80-87.
[6] DIEGO J,,PEDREGALA F P,,GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety,2004,,83(1):103-110.
[7] GARCIA M F,,SCHMID F,CONDE J.Wear assessment employing remote condition monitoring:a case study[J].Wear,,2003,,255(7):1209-1220.
[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems,1987,,2(1):37-52.
[9] CORTES C,,VAPNIK V.Support-vector network[J].Machine Learning,1995,,20:273-297.
[10] KE T,,JING L,LV H,,et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence,,2018,48(8):2373-2392.
[11] 鄧乃揚(yáng),,田英杰.支持向量機(jī)——理論,、算法與拓展[M].北京:科學(xué)出版社, 2009.
作者信息:
可 婷1,葛雪純2,,張立東1,,呂 慧1
(1.天津科技大學(xué) 理學(xué)院,天津300457,;2.北京華鐵信息技術(shù)有限公司,,北京100081)