鐵路道岔故障的智能診斷-AET-電子技術(shù)應(yīng)用

鐵路道岔故障的智能診斷

2020年電子技術(shù)應(yīng)用第4期

可婷1，葛雪純2，張立東1，呂慧1

1.天津科技大學(xué) 理學(xué)院，天津300457；2.北京華鐵信息技術(shù)有限公司，北京100081

摘要： 傳統(tǒng)的道岔故障檢測方式不僅會耗費(fèi)大量人力、物力、財(cái)力，而且檢測結(jié)果完全依賴于個(gè)人工作經(jīng)驗(yàn)。隨著人工智能的飛速發(fā)展，研究鐵路道岔的智能診斷器是亟待解決的問題。提出一種智能檢測系統(tǒng)，該系統(tǒng)從預(yù)處理數(shù)據(jù)、特征提取、構(gòu)建不均衡數(shù)據(jù)的智能識別器以及設(shè)計(jì)更符合要求的評價(jià)標(biāo)準(zhǔn)方面進(jìn)行了具體而深入的研究。最后，通過MATLAB軟件對廣州鐘村站W(wǎng)1902#和W1904#型號的道岔動作電流數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示，智能檢測系統(tǒng)不僅具有非常高的識別性能和泛化能力,而且識別時(shí)間僅為0.04 s, 滿足鐵路實(shí)時(shí)性要求。

關(guān)鍵詞： 鐵路道岔故障檢測支持向量機(jī) 不均衡問題主成分分析

中圖分類號： TN98；TP319
文獻(xiàn)標(biāo)識碼： A
DOI：10.16157/j.issn.0258-7998.191123
中文引用格式： 可婷，葛雪純，張立東，等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用，2020，46(4)：29-33.
英文引用格式： Ke Ting，Ge Xuechun，Zhang Lidong，et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique，2020，46(4)：29-33.

An intelligent diagnosis for railway turnout fault

Ke Ting1，Ge Xuechun2，Zhang Lidong1，Lv Hui1

1.College of Science，Tianjin University of Science & Technology，Tianjin 300457，China； 2.Beijing Huatie Information Technology Co.，Ltd.，Beijing 100081，China

Abstract： The traditional turnout fault detection method not only leads to consume a lot of manpower, material resources and financial resources, but also relies on manual experience. With the rapid development of artificial intelligence, designing an intelligent diagnostic system to diagnose the turnout is a key problem. In this paper, an intelligent detection system is proposed, which contains data preprocessing, feature extraction, switch intelligent classifier and more suitable evaluation criterion design. It is simulated by MATLAB, the experimental results on Guangzhou village station switch current data of model W1902# and model W1904# shows that the current intelligent detection method not only has the ability of self-learning, but also can be detected efficiently in the complex changes of the environment, and the recognition time is only 0.04 s, which meets the real-time requirement of railway.

Key words : railway turnout；fault detection; support vector machine(SVM)；imbalanced datasets；principal component analysis

0 引言

作為一種重要的鐵路信號基礎(chǔ)設(shè)備，道岔的運(yùn)行情況與列車的安全運(yùn)行和運(yùn)輸效率密不可分，一旦道岔運(yùn)行發(fā)生故障沒有及時(shí)檢修，會帶來非常大的安全隱患，對人們的生命和財(cái)產(chǎn)安全造成巨大損失^[1]。因此，實(shí)時(shí)監(jiān)控其運(yùn)行狀態(tài)并及時(shí)處理故障是鐵路安全運(yùn)行的關(guān)鍵問題之一。

目前，我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機(jī)監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機(jī)動作時(shí)的電流值。圖1給出了隨著時(shí)間變化，道岔轉(zhuǎn)轍機(jī)動作時(shí)產(chǎn)生的電流變化趨勢圖。該圖可分為切斷表示電流、解鎖、轉(zhuǎn)換、鎖閉、接通表示電流5個(gè)階段。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機(jī)監(jiān)測系統(tǒng)監(jiān)測出的道岔動作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對，最終確定道岔的工作狀態(tài)。然而，這種人工識別方式存在3個(gè)方面的缺陷：(1)對維護(hù)人員的工作經(jīng)驗(yàn)依賴度較高，容易出現(xiàn)誤判或漏判等情況，特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時(shí)，會導(dǎo)致未及時(shí)采取維護(hù)措施，造成無法挽回的損失；(2)在中國高速鐵路和客運(yùn)專線飛速發(fā)展的今天，這種單純靠人工經(jīng)驗(yàn)判斷錯綜復(fù)雜的道岔設(shè)備的運(yùn)行狀態(tài)需要耗費(fèi)大量的人力、物力和財(cái)力；(3)人工判斷效率極其低下，已經(jīng)完全不能滿足經(jīng)濟(jì)發(fā)展的要求和人民出行的需求。因此，在當(dāng)今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下，研究一種具備學(xué)習(xí)能力的道岔故障智能識別系統(tǒng)是亟待解決的問題之一。

隨著人工智能方法的逐漸成熟和完善，國內(nèi)外專家學(xué)者利用人工智能方法對鐵路道岔故障的識別進(jìn)行了初步的研究，并取得了一些成果。例如，邢玉龍等人考慮外部環(huán)境因素，對數(shù)據(jù)做特殊處理，建立數(shù)學(xué)模型進(jìn)行故障檢測^[2]。然而，該模型和方法的分類性能并不穩(wěn)定，泛化能力不強(qiáng)。王思明、雷燁和關(guān)瓊利用支持向量機(jī)方法設(shè)計(jì)不同的求解算法，實(shí)現(xiàn)道岔設(shè)備的故障診斷^[3-4]。鐘志旺、唐濤和王峰通過分詞算法將故障文檔表達(dá)在詞項(xiàng)特征空間中，并將故障文檔表達(dá)在主題特征空間上，以SVM算法構(gòu)造診斷器^[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計(jì)改進(jìn)算法，用于道岔故障診斷^[6-7]。然而，神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時(shí)分類性能不佳，會出現(xiàn)過擬合現(xiàn)象。總之，以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時(shí)才具有較好的識別效果。事實(shí)上，在實(shí)際的運(yùn)行環(huán)境中，每個(gè)道岔出現(xiàn)故障的概率十分小，即故障樣本遠(yuǎn)少于正常樣本，是一種不均衡問題。此外，不同道岔電流數(shù)據(jù)維度并不相同，且道岔電流數(shù)據(jù)往往維度很高，這也會導(dǎo)致以上方法的運(yùn)算時(shí)間較長，不能滿足鐵路道岔實(shí)時(shí)檢測的要求。

針對以上兩個(gè)普遍存在的問題，本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù)，具體地，包括道岔數(shù)據(jù)的缺失值補(bǔ)齊、特征提取、道岔智能識別問題的轉(zhuǎn)化、道岔的智能識別技術(shù)、識別性能指標(biāo)的設(shè)計(jì)等方面的研究。以廣州鐵路局的道岔數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù)，在環(huán)境為MATLAB 2014a，Windows 7，Intel Core i3 2.4 GHz CPU下進(jìn)行實(shí)驗(yàn)?zāi)M。實(shí)驗(yàn)結(jié)果表明，本文的識別系統(tǒng)在不均衡道岔樣本中仍具有很好的識別能力，并具有強(qiáng)泛化能力，且其識別平均時(shí)間為0.04 s，滿足智能識別的實(shí)時(shí)性要求。

1 道岔故障智能識別系統(tǒng)

1.1 道岔電流數(shù)據(jù)特征選擇

微機(jī)監(jiān)測采集數(shù)據(jù)的周期為0.04 s，道岔正常轉(zhuǎn)換時(shí)，需要6.4 s~10 s，于是會產(chǎn)生160~250個(gè)電流數(shù)據(jù)；而道岔卡阻時(shí)，其轉(zhuǎn)換時(shí)間可能長達(dá)30 s，甚至更長時(shí)間，此時(shí)會采集600多個(gè)甚至更多的電流數(shù)據(jù)。因此，這就可能存在兩個(gè)問題：(1)以道岔動作一次得到的電流值為一個(gè)樣本向量，那么多次動作將得到多個(gè)樣本向量，以這些樣本向量作為本文的訓(xùn)練樣本，發(fā)現(xiàn)其維度并不相同，這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時(shí)會產(chǎn)生高維數(shù)據(jù)，這必然增加模型學(xué)習(xí)的訓(xùn)練時(shí)間，導(dǎo)致道岔故障識別遲緩。因此，本文首先對數(shù)據(jù)進(jìn)行預(yù)處理，即利用缺失值補(bǔ)零的方式將所有數(shù)據(jù)補(bǔ)為維度相同的向量。然而，補(bǔ)零操作必會出現(xiàn)高維小樣本數(shù)據(jù)，導(dǎo)致過擬合現(xiàn)象的出現(xiàn)。因此，接下來就需要對高維小樣本數(shù)據(jù)進(jìn)行特征提取，本文采取主成分分析方法對數(shù)據(jù)進(jìn)行特征選擇和提取。主成分分析(Principal Component Analysis，PCA)是KARL P發(fā)明的一種特征提取技術(shù)^[8]，它對多個(gè)樣本的輸入矩陣求協(xié)方差矩陣，根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性，通過獲得累計(jì)方差貢獻(xiàn)率，選擇協(xié)方差矩陣相應(yīng)的特征向量，確定主成分。具體的數(shù)據(jù)處理步驟如下：

(1)輸入：鐵路道岔電流的n個(gè)樣本向量、參數(shù)θ；

(2)原始數(shù)據(jù)預(yù)處理：以樣本的最高維度m為訓(xùn)練樣本的維度，將低于m維的樣本進(jìn)行補(bǔ)零操作，初步得樣本如下：

1.2 智能識別問題的轉(zhuǎn)化

一方面，道岔異常可能出現(xiàn)在任何一個(gè)階段，且異常情況極其復(fù)雜；另一方面，出現(xiàn)異常道岔的概率較低，即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù)，正常數(shù)據(jù)較多，而異常數(shù)據(jù)極少。鑒于此特點(diǎn)，區(qū)別于已有方法，本文將學(xué)習(xí)問題轉(zhuǎn)化為不均衡分類問題，即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù)，記作x₁，x₂，…，x_p，其標(biāo)簽記為y_i=1，i=1，…，p；道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù)，記作x_p+1，x_p+2，…，x_n，其標(biāo)簽記為yi=-1，i=p+1，…，n。與負(fù)類樣本相比較，正類數(shù)據(jù)的錯誤識別會導(dǎo)致更加嚴(yán)重的后果。因此，本文更看重正類數(shù)據(jù)的正確識別。本文在已知兩類訓(xùn)練樣本前提下，通過學(xué)習(xí)一個(gè)決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈R^r×1的所屬類別。

1.3 道岔故障識別器

由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)^[9]——支持向量機(jī)(SVM)，是以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則，將最大間隔思想和基于核的方法結(jié)合起來，構(gòu)建優(yōu)化模型。在很多實(shí)際應(yīng)用中，該模型都表現(xiàn)出了很好的泛化能力。基于此，為了保證正類樣本能正確分類，本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù)，來構(gòu)建如下非均衡學(xué)習(xí)的SVM模型：

由此可以推出：

1.4 道岔故障識別性能指標(biāo)

在學(xué)習(xí)到一個(gè)分類器之后，需要對它的分類性能進(jìn)行評估。目前，有許多標(biāo)準(zhǔn)來評估一個(gè)分類器性能，如：分類精度(分類的正確率)、分類錯誤率。然而，在鐵路道岔故障識別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔，那么一個(gè)分類器不做任何分析而簡單地把每個(gè)數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然，分類精度這樣的評價(jià)準(zhǔn)則在鐵路道岔識別問題中是毫無用處的。本文更看重鐵路故障道岔(正類)的識別情況，受自然語言處理問題及部分監(jiān)督學(xué)習(xí)問題^[10]的啟發(fā)，本文設(shè)計(jì)正類樣本的查全率及查準(zhǔn)率兩個(gè)評價(jià)標(biāo)準(zhǔn)。具體的定義如下：

式(14)和(15)中各個(gè)指標(biāo)的具體含義如圖2所示。

這兩個(gè)評估標(biāo)準(zhǔn)的直觀含義是十分明顯的，即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識別。然而，由于這兩個(gè)標(biāo)準(zhǔn)從兩個(gè)角度說明正類樣本的識別性能，并不相關(guān)。這時(shí)，可以對查全率和查準(zhǔn)率求調(diào)和平均數(shù)，得到新的評價(jià)標(biāo)準(zhǔn)，即F值：

該評價(jià)標(biāo)準(zhǔn)對故障道岔的識別提出更高的要求，只有查全率和查準(zhǔn)率都大時(shí)，F(xiàn)值才大；有一個(gè)小，F(xiàn)值就不高。

2 數(shù)值實(shí)驗(yàn)

2.1 實(shí)驗(yàn)安排

本文實(shí)驗(yàn)數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值，記為W1902#和W1904#。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過前期的數(shù)據(jù)缺失值補(bǔ)零預(yù)處理及特征提取后，隨機(jī)取其中的80%作為訓(xùn)練集，剩余的20%作為測試集進(jìn)行預(yù)測。實(shí)驗(yàn)重復(fù)進(jìn)行100次，取平均F值即為本文分類器最終的分類性能的評估。

2.2 參數(shù)設(shè)置

本文取累計(jì)貢獻(xiàn)率?茲=95%，保證95%的數(shù)據(jù)信息量不丟失，利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗(yàn)證方法對偏置-SVM的模型進(jìn)行選擇。十折交叉驗(yàn)證(10-fold cross-validation)^[11]是將數(shù)據(jù)集隨機(jī)分成10份，輪流將其中9份作為訓(xùn)練樣本，1份作為驗(yàn)證樣本。懲罰參數(shù)C₊，C_-在集合{2^-10，2^-9，…，2¹⁰}中選擇。此外，本文采用高斯核K(x_i，x)= rgzn2-2.2-x1.gif 進(jìn)行數(shù)據(jù)分類，核參數(shù)?滓在集合{2^-10，2^-9，…，2¹⁰}中選擇。每組參數(shù)在十折交叉驗(yàn)證中得到10個(gè)F值，計(jì)算其平均F值。本文取最高平均F值所對應(yīng)的參數(shù)為最優(yōu)參數(shù)，同時(shí)偏置支持向量機(jī)的模型隨之確定。

2.3 實(shí)驗(yàn)結(jié)果

通過MATLAB軟件實(shí)現(xiàn)對數(shù)據(jù)的缺失值補(bǔ)零及PCA降維處理后，得到的訓(xùn)練樣本如表1所示。其中，#正樣本表示異常道岔數(shù)據(jù)量，#負(fù)樣本表示正常道岔數(shù)據(jù)量，#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù)，#訓(xùn)練(80%)表示隨機(jī)取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個(gè)數(shù)，#測試(20%)表示測試數(shù)據(jù)個(gè)數(shù)。通過表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后，樣本的屬性個(gè)數(shù)有明顯的下降，從600多降到7~8維，這說明采集到的電流值大部分都是冗余的，沒有區(qū)分度和實(shí)際意義的。

在進(jìn)行100次的實(shí)驗(yàn)運(yùn)行后，得到W1902#和W1904#道岔檢測的平均查全率、查準(zhǔn)率及F值，如表2、表3所示。表2說明W1902#道岔的查全率高達(dá)0.98以上，平均F值為0.94以上。

表3體現(xiàn)了W1904#極好的效果，平均查全率值高達(dá)100%，即本文偏置-SVM智能識別器可以精準(zhǔn)檢測故障道岔。

3 結(jié)論

本文提出了一種鐵路智能檢測系統(tǒng)，該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇、SVM建模到性能評價(jià)標(biāo)準(zhǔn)設(shè)計(jì)這幾個(gè)方面做了詳細(xì)的研究，最后針對廣州鐘村站的道岔電流數(shù)據(jù)，利用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示，該智能系統(tǒng)具有強(qiáng)的泛化能力，即在環(huán)境復(fù)雜變化時(shí)仍具有極高的檢測效果，同時(shí)運(yùn)行時(shí)間為0.04 s，滿足實(shí)時(shí)性要求。

參考文獻(xiàn)

[1] 中華人民共和國鐵道部．鐵路行車事故案例選編[M]．北京：中國鐵道版社，1999．

[2] 邢玉龍，趙會兵，田健.道岔動作電流曲線的特征提取方法及道岔故障診斷方法：中國，CN105260595B[P].2017-03-15.

[3] 王思明，雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報(bào)，2010，29(4)：1-5.

[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報(bào)，2015，31(4)：230-232.

[5] 鐘志旺，唐濤，王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報(bào)，2018，40(7)：80-87.

[6] DIEGO J，PEDREGALA F P，GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety，2004，83(1)：103-110.

[7] GARCIA M F，SCHMID F，CONDE J.Wear assessment employing remote condition monitoring：a case study[J].Wear，2003，255(7)：1209-1220.

[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems，1987，2(1)：37-52.

[9] CORTES C，VAPNIK V.Support-vector network[J].Machine Learning，1995，20：273-297.

[10] KE T，JING L，LV H，et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence，2018，48(8)：2373-2392.

[11] 鄧乃揚(yáng)，田英杰.支持向量機(jī)——理論、算法與拓展[M]．北京：科學(xué)出版社, 2009.

作者信息:

可婷1，葛雪純2，張立東1，呂慧1

(1.天津科技大學(xué) 理學(xué)院，天津300457；2.北京華鐵信息技術(shù)有限公司，北京100081)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容