文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.057
0 引言
反竊電工作是電網(wǎng)公司的重點(diǎn)工作之一,,隨著地區(qū)經(jīng)濟(jì)的持續(xù)增長(zhǎng),,居民生活水平不斷提升,電力需求增長(zhǎng)的同時(shí),,竊電現(xiàn)象卻越發(fā)嚴(yán)重,,竊電的手段也多種多樣,由以前的跨表用電向現(xiàn)在的高科技竊電演變,,使得竊電排查工作更加困難,。竊電問(wèn)題嚴(yán)重影響了電網(wǎng)公司正常的供電秩序,嚴(yán)重危害了公共安全和社會(huì)穩(wěn)定。因此提高竊電用戶(hù)排查的準(zhǔn)確性和覆蓋面迫在眉睫[1-3],。
本項(xiàng)目基于用電信息采集系統(tǒng)和營(yíng)銷(xiāo)業(yè)務(wù)應(yīng)用系統(tǒng)積累的海量用戶(hù)用電信息,,綜合考慮各種竊電特征,建立用戶(hù)竊電概率分析模型,,通過(guò)機(jī)器學(xué)習(xí)算法分析手段,,力求較為準(zhǔn)確地定量分析出各用戶(hù)的竊電嫌疑水平,,以提高竊電嫌疑用戶(hù)鎖定精度,。建立預(yù)警、排查和處理的閉環(huán)工作機(jī)制,,加大反竊電的查處懲治力度,,保障企業(yè)經(jīng)營(yíng)效益。
1 研究現(xiàn)狀
據(jù)了解,,現(xiàn)階段國(guó)內(nèi)多個(gè)研究結(jié)構(gòu)在反竊電研究領(lǐng)域有各自的特點(diǎn),,例如:研究的數(shù)據(jù)范圍主要是以電壓、電流,、三相不平衡為主的高壓用戶(hù)竊電識(shí)別,;以功率、負(fù)荷,、臺(tái)戶(hù)關(guān)系等為出發(fā)點(diǎn),,研究發(fā)生竊電行為時(shí)的間接表現(xiàn)形式;以專(zhuān)家經(jīng)驗(yàn)判斷的比較粗糙的過(guò)濾規(guī)則等[4],。
這些研究方法都有很多的片面性,,例如數(shù)據(jù)維度較少、只針對(duì)高壓用戶(hù),、分析方法比較簡(jiǎn)單等,,在實(shí)際應(yīng)用中并沒(méi)有達(dá)到理想效果。雖然在某些情況下也能有一定的表現(xiàn)效果,,但是如果推廣到全量用戶(hù)的竊電識(shí)別下,,就會(huì)顯得不太適用,即使使用了高精準(zhǔn)度的模型算法,,如果沒(méi)有選擇最合適的數(shù)據(jù)范圍,,仍然達(dá)不到理想的識(shí)別效果[5-6]。
2 研究思路
本文基于已有的數(shù)據(jù)挖掘在反竊電場(chǎng)景的研究成果,,來(lái)實(shí)現(xiàn)全量數(shù)據(jù),、多維用戶(hù)特征、高精度模型算法的竊電用戶(hù)精確識(shí)別,,并便于輕量部署應(yīng)用,,以支撐業(yè)務(wù)人員的反竊電工作[7]。改進(jìn)方向主要體現(xiàn)在:
(1)本次研究以某省全量用戶(hù)的用戶(hù)群體為分析目標(biāo),對(duì)各類(lèi)型的用戶(hù)有普遍的適用性,,便于在后期的應(yīng)用中快速推廣部署,。
(2)數(shù)據(jù)范圍以全量歷史用電數(shù)據(jù)、用戶(hù)基礎(chǔ)特征信息數(shù)據(jù)及臺(tái)區(qū)線損數(shù)據(jù)為主,,構(gòu)建特有的用電特征量,,可以直接反映出發(fā)生竊電時(shí)的數(shù)據(jù)特點(diǎn)。
(3)本次研究在多個(gè)前沿的機(jī)器學(xué)習(xí)模型基礎(chǔ)上,,進(jìn)行了多重交叉驗(yàn)證與自適用優(yōu)化策略,,取得很高的精準(zhǔn)度,可實(shí)現(xiàn)模型的自學(xué)習(xí)過(guò)程與智能優(yōu)化,。
(4)建立了針對(duì)性的高維度特征工程,,對(duì)特定的用戶(hù)群體進(jìn)行單獨(dú)標(biāo)記識(shí)別,可識(shí)別周期性用電與不規(guī)律用電,。
(5)研究成果可輕量部署在國(guó)網(wǎng)公司內(nèi)部服務(wù)器上,,操作簡(jiǎn)單易懂,可定期輸出某地區(qū)的疑似竊電用戶(hù)清單,,供排查人員線下查訪,。
一般發(fā)生竊電的情況下,最直接會(huì)體現(xiàn)在用電量的異常上,。本文所研究?jī)?nèi)容,,以全量用戶(hù)的歷史用電數(shù)據(jù)為中心,構(gòu)建基于用戶(hù)特征的用電量挖掘模型,,從多個(gè)時(shí)間維度構(gòu)建深度用電量特征量,。
從不同的竊電手段來(lái)看,對(duì)電表動(dòng)手腳的竊電的行為會(huì)導(dǎo)致用戶(hù)用電量減少,,根據(jù)竊電方式不同和竊電嚴(yán)重程度很可能會(huì)出現(xiàn)用電量突降,、電能示值逆向減少的異常現(xiàn)象,,因此可利用電表日凍結(jié)電能示值及天,、周、月不同時(shí)間周期的多種統(tǒng)計(jì)值判斷用電趨勢(shì)的異常走向和不規(guī)律用電,;對(duì)于越表竊電的行為,,竊電量大的會(huì)導(dǎo)致臺(tái)區(qū)線損異常增大,可以根據(jù)臺(tái)區(qū)線損的變化情況判斷臺(tái)區(qū)用戶(hù)的嫌疑概率,;同時(shí)電壓等級(jí),、行業(yè)分類(lèi)、用戶(hù)分類(lèi),、用電容量等用戶(hù)特征也是區(qū)分竊電用戶(hù)的重要特征,,可以增強(qiáng)模型對(duì)各類(lèi)別用戶(hù)的區(qū)分功能,。竊電識(shí)別流程如圖1所示。
3 數(shù)據(jù)處理
3.1 數(shù)據(jù)范圍
竊電行為發(fā)生后會(huì)直接體現(xiàn)在用電量的異常變化和線損的增高,,所以本次研究選取某地區(qū)全量的用戶(hù)數(shù)據(jù),,以用電戶(hù)檔案信息、電能表示數(shù)值的數(shù)據(jù),、臺(tái)區(qū)線損數(shù)據(jù)及歷史竊電記錄數(shù)據(jù)為主要分析數(shù)據(jù),,如表1所示。
3.2 計(jì)算特征統(tǒng)計(jì)量
通過(guò)對(duì)基礎(chǔ)數(shù)據(jù)的探索,,確定選取用戶(hù)電能示數(shù)表的部分?jǐn)?shù)據(jù)為主要建模原始數(shù)據(jù),。其次,通過(guò)對(duì)歷史竊電用戶(hù)歷史電能表走勢(shì)的變化情況進(jìn)行探索總結(jié),,并結(jié)合業(yè)務(wù)知識(shí),,以用電量數(shù)據(jù)的多種統(tǒng)計(jì)指標(biāo)為依據(jù),,精準(zhǔn)區(qū)分出用電量異常情況下數(shù)據(jù)的表現(xiàn)特征,,用此特征量數(shù)據(jù)輸入模型,可達(dá)到明顯的效果,。選定竊電用戶(hù)與未知用戶(hù)的電能示數(shù)數(shù)據(jù)進(jìn)行以下處理:
(1)計(jì)算匯總每個(gè)用戶(hù)不同時(shí)間周期下的用電量數(shù)據(jù),;
(2)計(jì)算每個(gè)用戶(hù)相鄰時(shí)間周期之間的差異變化;
(3)計(jì)算線損率與當(dāng)月度匯總用電量的相關(guān)性,,并設(shè)定權(quán)重值,;
(4)對(duì)用戶(hù)基礎(chǔ)信息數(shù)據(jù)進(jìn)行分類(lèi)編碼。
對(duì)以上數(shù)據(jù)表進(jìn)行多維度統(tǒng)計(jì)匯總,,計(jì)算得出多種指標(biāo),,分別代表各時(shí)間周期下用戶(hù)每日的用電量和用電量差異的統(tǒng)計(jì)指標(biāo),包括均值,、標(biāo)準(zhǔn)差,、極差、50%分位區(qū)間,、中位數(shù),、偏度、峰度及日用電量小于等于0的次數(shù)等,。
4 模型算法
利用數(shù)據(jù)處理得出的50個(gè)維度的特征變量,,構(gòu)建多種分類(lèi)模型算法,經(jīng)過(guò)多重交叉驗(yàn)證的對(duì)比篩選,,選擇表現(xiàn)效果最好的模型進(jìn)行最終的分類(lèi)預(yù)測(cè),。Adaboost算法屬于集成學(xué)習(xí)算法,是Boosting 算法家族中代表算法,通過(guò)若干個(gè)弱分類(lèi)器,,整合為一個(gè)強(qiáng)分類(lèi)器的方法來(lái)提高學(xué)習(xí)準(zhǔn)確性,,AdaBoost 算法就是將容易找到的識(shí)別率不高的弱分類(lèi)算法提升為識(shí)別率很高的強(qiáng)分類(lèi)算法,。
4.1 建模過(guò)程
經(jīng)過(guò)加工后的特征量包括用電曲線特征和用戶(hù)檔案特征,例如用電量數(shù)據(jù)在不同時(shí)間段下的多種統(tǒng)計(jì)量,、用戶(hù)電壓等級(jí),、行業(yè)類(lèi)型等。AdaBoost算法通過(guò)對(duì)用戶(hù)特征集的訓(xùn)練產(chǎn)生不同的分類(lèi)器,每次迭代都通過(guò)計(jì)算誤差率來(lái)改變樣本權(quán)重,也就是提高分錯(cuò)樣本權(quán)重,重點(diǎn)對(duì)分錯(cuò)樣本進(jìn)行訓(xùn)練,,直到達(dá)到迭代次數(shù)或者損失函數(shù)小于某一閾值,,如圖2所示。
(1)初始化每個(gè)訓(xùn)練樣例的權(quán)值,,共M個(gè)訓(xùn)練樣例,。
(2)共進(jìn)行N輪學(xué)習(xí),第n輪學(xué)習(xí)過(guò)程如下:
① 使用權(quán)值分布為Wn的訓(xùn)練樣例學(xué)習(xí)得到基分類(lèi)器Gn,;
② 計(jì)算上一步得到的基分類(lèi)器的誤差率,;
③ 計(jì)算Gn前面的權(quán)重系數(shù);
④ 更新訓(xùn)練樣例的權(quán)重系數(shù),;
⑤ 重復(fù)步驟①~④,,得到一系列的權(quán)重參數(shù)an和基分類(lèi)器Gn。
(3)通過(guò)臺(tái)區(qū)線損計(jì)算出線損修正系數(shù),,臺(tái)區(qū)線損越高,,其竊電嫌疑越高,得出最終用戶(hù)竊電嫌疑概率,。
4.2 模型結(jié)果
模型結(jié)果如表2所示,,列表中分別為電表編號(hào)、歷史竊電記錄標(biāo)識(shí),、預(yù)測(cè)分類(lèi)及各分類(lèi)的概率,。以竊電概率大于50%作為劃分疑似竊電用戶(hù)和正常用戶(hù)的邊界,實(shí)際應(yīng)用中可以根據(jù)實(shí)際情況調(diào)高此分界值,。
圖3為對(duì)應(yīng)的ROC曲線,,曲線整體靠近左上角,其中,,準(zhǔn)確率為96%,,召回率為93%,模型結(jié)果的準(zhǔn)確率較好,,召回率也較高,,預(yù)測(cè)準(zhǔn)確性較高。
4.3 模型成效
選取某地區(qū)全量用戶(hù)進(jìn)行竊電用戶(hù)識(shí)別,,識(shí)別出較多電表頻繁歸零,、電表逆走、異常波動(dòng)等情況,,其中某用戶(hù)電能示值曲線如圖4所示,,實(shí)地排查后找出部分用戶(hù)確有真實(shí)竊電的行為,,其余疑似竊電用戶(hù)雖未找到竊電的證據(jù),但是由于用戶(hù)無(wú)法解釋異常的用電曲線,,也同樣判定為重點(diǎn)監(jiān)控目標(biāo),。
5 結(jié)束語(yǔ)
本次研究是基于用戶(hù)全量特征,針對(duì)全量用戶(hù)做的分析,,對(duì)各類(lèi)型的用電戶(hù)有普遍適用性,,適合開(kāi)展大面積的排查工作。模型可以進(jìn)行輕量部署,,定期支持常規(guī)用電檢查和專(zhuān)項(xiàng)反竊電活動(dòng),。
基于反竊電模型的成果,可以進(jìn)一步開(kāi)展研究工作,。例如結(jié)合擴(kuò)報(bào)裝新用戶(hù)的用戶(hù)畫(huà)像和用電負(fù)荷模擬情況,,將用戶(hù)實(shí)際用電量和預(yù)測(cè)用電量比對(duì),提前預(yù)測(cè)用戶(hù)的用電行為,;也可以結(jié)合智能電表的實(shí)時(shí)采集信息進(jìn)行實(shí)時(shí)監(jiān)控,,在發(fā)現(xiàn)異常的第一時(shí)間及時(shí)報(bào)警;也可以將反竊電的成果和臺(tái)區(qū)線損治理,、營(yíng)配調(diào)貫通治理的工作結(jié)合起來(lái),,相互配合,通過(guò)數(shù)據(jù)治理的成果提升數(shù)據(jù)的可靠性,。
參考文獻(xiàn)
[1] 建峰,葛健.基于用電行為的反竊電智能分析系統(tǒng)[J].電力設(shè)備,,2016(23).
[2] 林志堅(jiān), 姚偉智, 黃朝凱, 等. 基于用電行為分析的反竊電在線監(jiān)測(cè)及智能診斷系統(tǒng)研究[J]. 新技術(shù)新工藝, 2015(5): 137-140.
[3] 周文婷, 顧楠, 王濤, 等. 基于數(shù)據(jù)挖掘算法的用戶(hù)竊電嫌疑分析[J]. 河南科學(xué), 2015, 33(10): 1767-1772.
[4] 于光輝,,耿桂森.基于用電信息采集系統(tǒng)的防竊電措施[J].山東電力技術(shù),2014, 41(3): 49-51.
[5] 陳鵬飛. 基于用電信息采集系統(tǒng)的竊電在線稽查裝置的開(kāi)發(fā)應(yīng)用[D].北京:華北電力大學(xué),2013.
[6] 張瑞. 基于用電信息數(shù)據(jù)挖掘的智能反竊電研究與應(yīng)用[J]. 價(jià)值工程, 2016, 35(35): 51-54.
[7] 柴鵬飛,,陳國(guó)棟.數(shù)據(jù)分析在反竊電中的應(yīng)用[J].河南電力技術(shù), 2013(2): 61-64.
作者信息:
隋春明,張劍鋒,楊文博,任彥偉
(國(guó)網(wǎng)吉林省電力公司,,吉林 長(zhǎng)春 130000)