文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.191066
中文引用格式: 程起澤,陳澤華,,張雲(yún)欽,,等. 基于CNN-LSTM的太陽能光伏組件故障診斷研究[J].電子技術(shù)應(yīng)用,2020,,46(4):66-70.
英文引用格式: Cheng Qize,,Chen Zehua,Zhang Yunqin,,et al. Research on fault diagnosis of solar photovoltaic module based on CNN-LSTM[J]. Application of Electronic Technique,,2020,46(4):66-70.
0 引言
光伏電站建設(shè)在人跡罕至的野外,,準(zhǔn)確定位問題支路位置與故障類型對進一步提高光伏發(fā)電系統(tǒng)的運行效率及降低發(fā)電成本具有重要意義[1],。
近年來,國內(nèi)外學(xué)者對光伏組件發(fā)電系統(tǒng)采用建模的方法,,對組件運行時采集到的圖像采用圖像分析的方法,,針對某種特定故障進行診斷。當(dāng)前針對光伏組件故障診斷主要分為圖像方法,、物理方法,、數(shù)學(xué)方法以及智能方法幾大類別。前者主要有紅外圖像診斷法[2-4],、多傳感器法[5-7],、參數(shù)估算法[8-10]、時域反射分析法[11]等,,后者有基于神經(jīng)網(wǎng)絡(luò)的診斷方法[12-13],。
對于能源公司下的多個大型光伏電站,其建設(shè)時期不同,,采購的設(shè)備規(guī)格種類存在很大差異,,數(shù)據(jù)精準(zhǔn)度不夠,數(shù)學(xué)方法很難適用于大型電站,。同時因為電站經(jīng)常建設(shè)在環(huán)境條件惡劣的野外,,這對于獲得光伏組件紅外圖像造成困難。近些年來,,集成了最大功率跟蹤(Maximum Power Point Tracking,,MPPT)[14]的組串式光伏逆變器使用廣泛,但由于經(jīng)濟因素,,大型和超大型電站使用的還是集中式光伏逆變器,,不能監(jiān)控到組件的運行情況,這對數(shù)據(jù)采集造成很大困難,?;诔杀究紤],,公司很難再為投入使用的光伏電站更新多種傳感器設(shè)備,。
針對數(shù)據(jù)采集設(shè)備有限的大型光伏電站,本文提出了一種基于CNN-LSTM的深度學(xué)習(xí)診斷模型,,僅需要使用電站采集到的海量歷史支路電流數(shù)據(jù)及其故障維修記錄來訓(xùn)練模型,,在電站運行時使用訓(xùn)練好的模型就可以診斷出故障支路,,在電站原有設(shè)備基礎(chǔ)上完成診斷。
1 故障定義與數(shù)據(jù)處理
1.1 光伏陣列布局
本文以山西某光伏電站為研究對象,,該電站光伏陣列由60個區(qū)組成,,每個區(qū)包含兩個逆變器,每個逆變器下有7個匯流箱,,每個匯流箱下包括15條支路,,每條支路由21塊電池板串聯(lián)構(gòu)成。數(shù)據(jù)采集設(shè)備可精確采集到每一支路的電流數(shù)據(jù),。通常,,故障會發(fā)生在電池板上、電池板背后的接線盒中,、數(shù)據(jù)傳輸線路以及電站的數(shù)據(jù)采集系統(tǒng)中,。圖1為該電站光伏陣列布局示意圖。
1.2 光伏組件故障定義
光伏發(fā)電受天氣因素影響極大,,數(shù)據(jù)波動極大?,F(xiàn)有數(shù)據(jù)采集設(shè)備雖可以采集到電壓、輻照強度,、區(qū)域溫度,、濕度等多種數(shù)據(jù),但一個采集設(shè)備收集的是多個區(qū)域的數(shù)據(jù),,覆蓋面太廣,,無法精確定位到實際發(fā)生故障的支路。
傳統(tǒng)的光伏組件故障診斷通常是從組件故障類型出發(fā),,針對一種或某幾種故障,,去尋找數(shù)據(jù)的變化與這些故障的關(guān)聯(lián)規(guī)則,如果關(guān)聯(lián)規(guī)則不明顯,,往往需要增添額外的數(shù)據(jù)采集設(shè)備,。傳統(tǒng)方法可以檢測到的故障類型有限,且需要在原有數(shù)據(jù)采集設(shè)備的基礎(chǔ)上增添額外的設(shè)備來收集數(shù)據(jù),。本文與之相反,,是從采集到的歷史數(shù)據(jù)及其數(shù)據(jù)表現(xiàn)入手,依據(jù)在這些數(shù)據(jù)上曾經(jīng)發(fā)生過的故障進行分析,,從而實現(xiàn)對運行中的組件進行診斷,。
根據(jù)現(xiàn)場實際發(fā)生過的光伏組件故障及故障產(chǎn)生時采集到的電流數(shù)據(jù),本文將組件故障定義為5類:
(1)突發(fā)性故障:其故障發(fā)生原因為光伏組件板面燒穿或者板后接線盒部位熔斷而導(dǎo)致的組件突然停止運行,,需要立即處理此故障以避免發(fā)生危險,。該故障電流數(shù)據(jù)表現(xiàn)為在運行過程中電流值突降到零后不再變化。
(2)通信故障:其發(fā)生的原因為信道傳輸線路存在問題,,需要對通信設(shè)備進行檢修維護,。該故障電流數(shù)據(jù)多表現(xiàn)為無規(guī)律變化,,或者存在明顯脫離一般常識的電流值。
(3)更換組件:表示正常運行中的支路當(dāng)天進行過修理或者人工的斷電檢測,,該支路組件會根據(jù)其逐塊小塊光伏模塊人工檢測的結(jié)果決定是否更換其中的問題模塊,。電流數(shù)據(jù)的表現(xiàn)為在同一匯流箱下某條異常支路的電流曲線從零值恢復(fù)到正常發(fā)電。
(4)持平故障:其故障原因為電池板未啟動或其通信傳輸?shù)脑O(shè)備未啟動,,可根據(jù)監(jiān)控系統(tǒng)排查,。持平故障的數(shù)據(jù)表現(xiàn)一般分為兩種,一種表現(xiàn)為電流值持平在零值,,另一種表現(xiàn)為持平在任意電流值,。
(5)老化故障:故障產(chǎn)生原因為設(shè)備老化造成的發(fā)電效率下降,可根據(jù)實際老化情況及電站電池板儲量決定是否更換,。其數(shù)據(jù)表現(xiàn)為電流值隨著天數(shù)的增加呈現(xiàn)持續(xù)降低趨勢,,嚴(yán)重時同一匯流箱下故障支路運行時電流值比同匯流箱下其他支路電流低0.5 A及以上,但仍在發(fā)電,。其中,,第1和2類故障為組件運行時需要優(yōu)先處理的故障,如圖2所示,;第3,、4和5類為次重要故障,可根據(jù)電站調(diào)度暫緩處理,,如圖3所示,。
1.3 數(shù)據(jù)處理
為解決實際采集到的數(shù)據(jù)類型少的問題,并且充分利用真實的電流歷史數(shù)據(jù),,本文根據(jù)電站光伏陣列布局的特點,,設(shè)計針對該陣列的特征提取算法,以獲取支路運行時正常組件與異常組件之間的差異,。
1.3.1 數(shù)據(jù)降采樣
原始支路電流數(shù)據(jù)按天(24 h)獲取,,采樣頻率為1 s。將每天以秒為單位的支路電流數(shù)據(jù)降采樣為以分為單位,,采樣區(qū)間為[8:00,,18:00],即一天600個采樣點,。將單個匯流箱下的15條支路作為一個分組處理單元,。
1.3.2 特征提取
在每一個處理單元上定義特征提取組、橫向特征與縱向特征,,之后對每一采樣點數(shù)據(jù)進行橫向特征與縱向特征的提取,,并結(jié)合歷史臺賬信息制作標(biāo)簽數(shù)據(jù)集。
定義1 特征提取組:定義15條支路相同時刻采樣點的電流值為特征提取組,每天600個采樣點作為時間步長,,用向量(600,15)表示,。每天每個匯流箱下可獲得600個間隔為1 min的特征提取組,。
定義2 橫向特征:計算每一特征提取組的電流平均值mean、最大值max,、方差var,、最小值min與標(biāo)準(zhǔn)差std作為橫向特征,用向量(600,,5)表示,。
橫向特征用以表示某一時刻,該匯流箱下支路電流的統(tǒng)計特性,。在提取橫向特征時,,需清洗掉大幅度偏離正常值的電流值,補以0值代替,。
定義3 縱向特征:使用一階差分定義電流曲線縱向特征,,即電流每一時間步后一采樣點與前一采樣點的差值,其計算公式如下:
其中,,Δt=1 s,。縱向特征表示支路電流一天內(nèi)隨時間與太陽輻照變化的變化率,,用向量(600×15,,1)表示。
1.3.3 標(biāo)準(zhǔn)數(shù)據(jù)集
將每一個處理單元每條支路電流的每個采樣點的橫向,、縱向特征與該支路這一采樣點的降采樣電流值組合起來,,得到這一時間步下輸入模型的電流數(shù)據(jù)。將每天每個處理單元每條支路電流的橫向,、縱向特征與該支路電流經(jīng)過維度變換,,共同組成支路電流標(biāo)準(zhǔn)數(shù)據(jù)集。用向量(600×15,,7)表示,。所有歷史數(shù)據(jù)將以相同格式進入標(biāo)準(zhǔn)數(shù)據(jù)集,它們將作為CNN-LSTM的訓(xùn)練集,。圖4為具體的數(shù)據(jù)準(zhǔn)備過程,。
2 CNN-LSTM模型
2.1 CNN模型
LECUN Y L[15]于1989年提出的卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種包含卷積操作與神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的深層前饋型神經(jīng)網(wǎng)絡(luò)。近幾年隨著CNN及其擴展模型在圖像領(lǐng)域的成功應(yīng)用,,CNN在深度學(xué)習(xí)中的地位越來越重要,。
通常的CNN模型包含3個主要部分:卷積層、池化層、全連接層,。每一個卷積層中會有多個卷積核,,其計算公式如下:
2.2 LSTM模型
長短期記憶模型(LSTM)[16]是一種帶有記憶功能的神經(jīng)網(wǎng)絡(luò),是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,,RNN)的一種變種,,通過門遞歸單元來控制信息的流動與操作,LSTM對時序型數(shù)據(jù)的處理具有極為優(yōu)秀的表現(xiàn),,現(xiàn)被廣泛應(yīng)用于機器翻譯[17],、自然語言處理[18]等領(lǐng)域。
LSTM模型通過特殊的三門結(jié)構(gòu),,解決了傳統(tǒng)RNN中的梯度消失問題,,使LSTM模型可以更好地對更長、更復(fù)雜的時間序列數(shù)據(jù)進行訓(xùn)練與學(xué)習(xí),。
2.3 構(gòu)建CNN-LSTM檢測模型
傳統(tǒng)的LSTM模型處理時序數(shù)據(jù)效果良好,,但是其結(jié)構(gòu)的復(fù)雜性致使模型訓(xùn)練開銷非常大。待學(xué)習(xí)數(shù)據(jù)設(shè)置的時間步長越大,,進行學(xué)習(xí)訓(xùn)練需要花費的時間越多,。
針對電流數(shù)據(jù)縱向特征復(fù)雜、橫向特征稀疏的問題,,本文在傳統(tǒng)的LSTM模型前先使用CNN對數(shù)據(jù)集進行處理,,以提取低維的深層次特征。用CNN將橫向電流特征進一步提取升維,,將縱向時間維度上的特征進行提取降維,,再使用LSTM模型進行訓(xùn)練時就可以達到降低整個模型訓(xùn)練時間開銷的同時提升整個模型的精確度與準(zhǔn)確度的效果,并且通過不同網(wǎng)絡(luò)的組合使模型變?yōu)樯疃染W(wǎng)絡(luò),,增強了模型的非線性,,避免了訓(xùn)練過程中過擬合現(xiàn)象的發(fā)生。
具體的模型構(gòu)建如下:根據(jù)歷史數(shù)據(jù)及故障類型構(gòu)建標(biāo)簽數(shù)據(jù)集,。訓(xùn)練數(shù)據(jù)集為三維數(shù)據(jù)集(N,,600,7),,其中N表示檢測的支路,。訓(xùn)練數(shù)據(jù)集首先進入一個兩層的卷積模型進一步提取特征和降低數(shù)據(jù)維度,得到向量(N,,150,,64),向量(N,,150,,64)再進入一個三層的長短期記憶模型進行訓(xùn)練,訓(xùn)練學(xué)習(xí)后的數(shù)據(jù)(N,64)再進入一個全連接層后得到待診斷支路標(biāo)簽(N,,1),。訓(xùn)練完成后使用測試數(shù)據(jù)集對模型進行驗證,根據(jù)結(jié)果反饋對模型進行調(diào)整,。表1為模型中每層的具體參數(shù),。
3 實驗驗證
現(xiàn)有光伏組件故障診斷實驗驗證方式多為搭建仿真平臺及搭建小型發(fā)電板測試,然而在實際生產(chǎn)過程中,,影響電池板發(fā)電的因素有環(huán)境溫度,、海拔高度,、太陽能輻照強度,、電池板放置角度影響的散射光和直射光照到電池板上量的多少、電池板的背板溫度,、風(fēng)向,、空氣的純凈程度、云層高低,、電池板型號造成的轉(zhuǎn)換效率差異等,。單純的仿真實驗無法完全真實表現(xiàn)出電池板現(xiàn)場實際的運行狀態(tài)。
3.1 實驗數(shù)據(jù)來源
本文使用的數(shù)據(jù)集來自山西某光伏電站的實時生產(chǎn)數(shù)據(jù),,數(shù)據(jù)中包含了上述復(fù)雜因素,。針對本文提出的診斷方法,使用山西某光伏電站2018年1月~10月3個區(qū)的數(shù)據(jù)進行訓(xùn)練和測試,。以2個區(qū)的數(shù)據(jù)做訓(xùn)練,,1個區(qū)的數(shù)據(jù)用作測試集。訓(xùn)練集共計28個區(qū)數(shù)據(jù),,420條支路,,10個月(304天),總計127 680條數(shù)據(jù),;測試數(shù)據(jù)共計14個區(qū),,210條支路,304天,,總計63 840條數(shù)據(jù),。
3.2 實驗環(huán)境
實驗環(huán)境為Ubuntu 16.04.2,采用3塊NVIDIA的 K40顯卡,,TensorFlow-GPU 1.4.1,,訓(xùn)練迭代次數(shù)均為5 000次,模型參數(shù)調(diào)優(yōu)使用多層網(wǎng)格搜索,,保證實驗使用的損失函數(shù)相同,。為進行對比實驗,本文分別使用深度學(xué)習(xí)方法BP模型、CNN模型,、Autoencoder模型,、Encoder-LSTM、LSTM模型,、Bi-LSTM模型,、CNN-LSTM模型進行對比實驗,實驗采用相同的實驗環(huán)境及迭代次數(shù),。其中,,BP、CNN為傳統(tǒng)網(wǎng)絡(luò),,LSTM為時序性網(wǎng)絡(luò),,Autoencoder為解決傳統(tǒng)LSTM訓(xùn)練緩慢的自編碼網(wǎng)絡(luò)模型。
3.3 實驗結(jié)果及分析
從表2結(jié)果分析,,CNN-LSTM模型結(jié)果最令人滿意,,并且其訓(xùn)練效率大大優(yōu)于其他模型。相比于傳統(tǒng)BP,、Autoencoder,、CNN這些直接利用電流數(shù)值特征進行學(xué)習(xí)而忽略電流時序特性的網(wǎng)絡(luò),CNN-LSTM的網(wǎng)絡(luò)結(jié)構(gòu)充分利用了光伏發(fā)電與輻照強度呈正相關(guān)的時序性特點,,將電流隨時間變化而變化的特性引入模型中進行學(xué)習(xí)訓(xùn)練,;與LSTM、Bi-LSTM,、Encoder-LSTM這些只考慮電流時序性的網(wǎng)絡(luò)結(jié)構(gòu)相比,,CNN-LSTM的網(wǎng)絡(luò)結(jié)構(gòu)充分利用了CNN模型的升降維功能,解決了數(shù)據(jù)特征類型少的問題,;與Autoencoder網(wǎng)絡(luò)相比,,CNN-LSTM的網(wǎng)絡(luò)結(jié)構(gòu)在對縱向特征進行降維的同時最大程度地保留了電流的時序特性,解決了LSTM模型訓(xùn)練時間過長的問題,,綜合優(yōu)化了模型的特征選擇與訓(xùn)練時間,,最終達到了良好的效果。
訓(xùn)練結(jié)束時,,模型損失函數(shù)值降到0.032 1,,正確率達到93%,損失函數(shù)為均方對數(shù)損失Msle,,激活函數(shù)為ReLU,,優(yōu)化器為Adam。使用測試數(shù)據(jù)集進行測試后,,準(zhǔn)確率達到92%,。同時根據(jù)能源公司要求,,對公司隨機提供的兩周兩個匯流箱下電流數(shù)據(jù)進行測試,準(zhǔn)確率達到95%,。模型效果達到預(yù)期,,且效果大大優(yōu)于其他模型所能達到的效果。
4 結(jié)論
本文提出了一種基于CNN-LSTM的光伏組件診斷方法:
(1)從光伏組件運行時采集到的現(xiàn)場支路電流數(shù)據(jù)及其歷史故障記錄出發(fā),,并結(jié)合實際生產(chǎn)中對不同故障類型處理的緊急程度作為對光伏組件故障進行分類的依據(jù),,提出了一種新的故障分類方法。
(2)提出了一種根據(jù)不同光伏陣列的布局而設(shè)計的特征提取算法,,用以表示理想發(fā)電狀態(tài),,來解決實際生產(chǎn)中可獲取到的數(shù)據(jù)種類單一的問題。
(3)在進入LSTM模型訓(xùn)練前,,使用CNN網(wǎng)絡(luò)對數(shù)據(jù)進行處理,。利用CNN網(wǎng)絡(luò)的升降維功能進一步解決了實際獲取到的數(shù)據(jù)種類少的問題,并且在最大程度保留電流時序特性的基礎(chǔ)上,,對縱向特征進行降維,,減少了模型訓(xùn)練時間,,解決了大訓(xùn)練集使用LSTM模型訓(xùn)練緩慢的問題,。
本方法2019年在電站現(xiàn)場進行測試,運行速度快且診斷效果良好,,在得到模型后在實際使用中省去花費大量時間的訓(xùn)練過程,,可以在實際電站故障診斷中較好地投入使用,不需要額外再在電站中增添設(shè)備,,可直接接入生產(chǎn)監(jiān)控系統(tǒng),,診斷速度快,符合大型電站的日常使用需要,。
參考文獻
[1] 胡義華,,陳昊,徐瑞東.基于電壓掃描的光伏陣列故障診斷策略[J].中國電機工程學(xué)報,,2010(S1):185-191.
[2] 王培珍,,鄭詩程.基于紅外圖像的太陽能光伏陣列故障分析[J].太陽能學(xué)報,2010,,31(2):197-201.
[3] LI W C,,TSAI D M.Automatic saw-mark detection in multicrystalline solar wafer images[J].Solar Energy Materials & Solar Cells,2011,,95(8):2206-2220.
[4] Li Chunlai,,Zong Xianshuang,GUDAKE.A survey of online fault diagnosis for PV module based on BP neural network[C].2016 International Conference on Smart City and Systems Engineering(ICSCSE).IEEE,,2016: 2094-2100.
[5] Tang Jianeng,,Zhu Yongqiang,,Wang Wenshan.Fault diagnosis method and simulation analysis for photovoltaic array[C].International Conference on Electrical & Control Engineering.IEEE,2011:1569-1573.
[6] 王歡,,徐小力.一種新型光伏陣列在線故障檢測方法研究[J].儀器儀表學(xué)報,,2015,36(12):2765-2772.
[7] 王元章,,李智華,,吳春華.一種四參數(shù)的光伏組件在線故障診斷方法[J].中國電機工程學(xué)報,2014,,34(13):2078-2087.
[8] 張程熠,,唐雅潔,李永杰,,等.適用于小樣本的神經(jīng)網(wǎng)絡(luò)光伏預(yù)測方法[J].電力自動化設(shè)備,,2017,37(1):101-106,,111.
[9] HU Y,,GAO B,SONG X,,et al.Photovoltaic fault detection using a parameter based model[J].Solar Energy,,2013,96:96-102.
[10] 楊宏超,,程若發(fā),,呂彩艷,等.光伏組件內(nèi)部參數(shù)辨識與輸出特性研究[J].電子技術(shù)應(yīng)用,,2018,,44(1):125-128.
[11] 王元章,吳春華,,周笛青,,等.基于BP神經(jīng)網(wǎng)絡(luò)的光伏陣列在線故障診斷[J].電網(wǎng)技術(shù),2013,,37(8):2094-2100.
[12] AKRAM M N,,LOTFIFARD S.Modeling and health monitoring of DC side of photovoltaic array[J].IEEE Transactions on Sustainable Energy,2015,,6(4):1-9.
[13] 焦李成,,楊淑媛,劉芳,,等.神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J].計算機學(xué)報,,2016,39(8):1697-1716.
[14] 傅敏,,嵇保健,,黃勝明.低輸入紋波光伏微型逆變器的研究[J].電子技術(shù)應(yīng)用,,2017,43(5):143-146.
[15] LECUN Y L,,BOTTOU L,,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,,1998,,86(11):2278-2324.
[16] HOCHREITER S , SCHMIDHUBER J.Long short-term memory[J].Neural Computation, 1997,9(8):1735-1780.
[17] GHOSH S,,VINYALS O,,STROPE B,et al.Contextual LSTM(CLSTM) models for large scale NLP tasks[J].arXiv:1602.06291v2[cs.CL],,2016.
[18] Wu Haoyin,,Chen Jin,F(xiàn)an Kai.Research on speech feature extraction and recognition model based on SVM[J].Journal of Wuhan University of Technology,,2014(2):316-319.
作者信息:
程起澤1,,陳澤華1,張雲(yún)欽1,,蔣文杰2,,劉曉峰1,沈 亮2
(1.太原理工大學(xué) 大數(shù)據(jù)學(xué)院,,山西 太原 030001,;2.晉能清潔能源有限公司,,山西 太原 030001)