《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于用電特征的多維度竊電識別技術(shù)
基于用電特征的多維度竊電識別技術(shù)
2018智能電網(wǎng)增刊
隋春明,張劍鋒,楊文博,任彥偉
國網(wǎng)吉林省電力公司,吉林 長春 130000
摘要: 針對某地區(qū)電網(wǎng)存在的竊電用戶較多的問題,基于用戶用電特征構(gòu)建數(shù)學(xué)分析模型,,通過整合各類典型竊電案例數(shù)據(jù)特征,,建立多維度的反竊電分析方法,精確定位出竊電嫌疑用戶,。實(shí)踐表明,,采用全方位多角度構(gòu)建的竊電識別技術(shù)是科學(xué)有效的,對實(shí)際的竊電排查工作有很大的推動作用,。
中圖分類號: TM7
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.057
Abstract:
Key words :

0  引言

    反竊電工作是電網(wǎng)公司的重點(diǎn)工作之一,,隨著地區(qū)經(jīng)濟(jì)的持續(xù)增長,居民生活水平不斷提升,,電力需求增長的同時(shí),,竊電現(xiàn)象卻越發(fā)嚴(yán)重,竊電的手段也多種多樣,,由以前的跨表用電向現(xiàn)在的高科技竊電演變,,使得竊電排查工作更加困難。竊電問題嚴(yán)重影響了電網(wǎng)公司正常的供電秩序,,嚴(yán)重危害了公共安全和社會穩(wěn)定,。因此提高竊電用戶排查的準(zhǔn)確性和覆蓋面迫在眉睫[1-3]

    本項(xiàng)目基于用電信息采集系統(tǒng)和營銷業(yè)務(wù)應(yīng)用系統(tǒng)積累的海量用戶用電信息,,綜合考慮各種竊電特征,,建立用戶竊電概率分析模型,,通過機(jī)器學(xué)習(xí)算法分析手段,力求較為準(zhǔn)確地定量分析出各用戶的竊電嫌疑水平,,以提高竊電嫌疑用戶鎖定精度,。建立預(yù)警、排查和處理的閉環(huán)工作機(jī)制,,加大反竊電的查處懲治力度,,保障企業(yè)經(jīng)營效益。

1  研究現(xiàn)狀

    據(jù)了解,,現(xiàn)階段國內(nèi)多個研究結(jié)構(gòu)在反竊電研究領(lǐng)域有各自的特點(diǎn),,例如:研究的數(shù)據(jù)范圍主要是以電壓、電流,、三相不平衡為主的高壓用戶竊電識別,;以功率、負(fù)荷,、臺戶關(guān)系等為出發(fā)點(diǎn),,研究發(fā)生竊電行為時(shí)的間接表現(xiàn)形式;以專家經(jīng)驗(yàn)判斷的比較粗糙的過濾規(guī)則等[4],。

    這些研究方法都有很多的片面性,,例如數(shù)據(jù)維度較少、只針對高壓用戶,、分析方法比較簡單等,,在實(shí)際應(yīng)用中并沒有達(dá)到理想效果。雖然在某些情況下也能有一定的表現(xiàn)效果,,但是如果推廣到全量用戶的竊電識別下,,就會顯得不太適用,即使使用了高精準(zhǔn)度的模型算法,,如果沒有選擇最合適的數(shù)據(jù)范圍,,仍然達(dá)不到理想的識別效果[5-6]

2  研究思路

    本文基于已有的數(shù)據(jù)挖掘在反竊電場景的研究成果,,來實(shí)現(xiàn)全量數(shù)據(jù),、多維用戶特征、高精度模型算法的竊電用戶精確識別,,并便于輕量部署應(yīng)用,,以支撐業(yè)務(wù)人員的反竊電工作[7]。改進(jìn)方向主要體現(xiàn)在:

    (1)本次研究以某省全量用戶的用戶群體為分析目標(biāo),,對各類型的用戶有普遍的適用性,,便于在后期的應(yīng)用中快速推廣部署。

    (2)數(shù)據(jù)范圍以全量歷史用電數(shù)據(jù),、用戶基礎(chǔ)特征信息數(shù)據(jù)及臺區(qū)線損數(shù)據(jù)為主,,構(gòu)建特有的用電特征量,,可以直接反映出發(fā)生竊電時(shí)的數(shù)據(jù)特點(diǎn)。

    (3)本次研究在多個前沿的機(jī)器學(xué)習(xí)模型基礎(chǔ)上,,進(jìn)行了多重交叉驗(yàn)證與自適用優(yōu)化策略,,取得很高的精準(zhǔn)度,可實(shí)現(xiàn)模型的自學(xué)習(xí)過程與智能優(yōu)化,。

    (4)建立了針對性的高維度特征工程,,對特定的用戶群體進(jìn)行單獨(dú)標(biāo)記識別,可識別周期性用電與不規(guī)律用電,。

    (5)研究成果可輕量部署在國網(wǎng)公司內(nèi)部服務(wù)器上,,操作簡單易懂,可定期輸出某地區(qū)的疑似竊電用戶清單,,供排查人員線下查訪,。

    一般發(fā)生竊電的情況下,最直接會體現(xiàn)在用電量的異常上,。本文所研究內(nèi)容,,以全量用戶的歷史用電數(shù)據(jù)為中心,構(gòu)建基于用戶特征的用電量挖掘模型,,從多個時(shí)間維度構(gòu)建深度用電量特征量,。

    從不同的竊電手段來看,對電表動手腳的竊電的行為會導(dǎo)致用戶用電量減少,,根據(jù)竊電方式不同和竊電嚴(yán)重程度很可能會出現(xiàn)用電量突降、電能示值逆向減少的異?,F(xiàn)象,,因此可利用電表日凍結(jié)電能示值及天、周,、月不同時(shí)間周期的多種統(tǒng)計(jì)值判斷用電趨勢的異常走向和不規(guī)律用電,;對于越表竊電的行為,竊電量大的會導(dǎo)致臺區(qū)線損異常增大,,可以根據(jù)臺區(qū)線損的變化情況判斷臺區(qū)用戶的嫌疑概率,;同時(shí)電壓等級、行業(yè)分類,、用戶分類,、用電容量等用戶特征也是區(qū)分竊電用戶的重要特征,可以增強(qiáng)模型對各類別用戶的區(qū)分功能,。竊電識別流程如圖1所示,。

scm-t1.gif

3  數(shù)據(jù)處理

3.1  數(shù)據(jù)范圍

    竊電行為發(fā)生后會直接體現(xiàn)在用電量的異常變化和線損的增高,所以本次研究選取某地區(qū)全量的用戶數(shù)據(jù),,以用電戶檔案信息,、電能表示數(shù)值的數(shù)據(jù),、臺區(qū)線損數(shù)據(jù)及歷史竊電記錄數(shù)據(jù)為主要分析數(shù)據(jù),如表1所示,。

scm-b1.gif

3.2  計(jì)算特征統(tǒng)計(jì)量

    通過對基礎(chǔ)數(shù)據(jù)的探索,,確定選取用戶電能示數(shù)表的部分?jǐn)?shù)據(jù)為主要建模原始數(shù)據(jù)。其次,,通過對歷史竊電用戶歷史電能表走勢的變化情況進(jìn)行探索總結(jié),,并結(jié)合業(yè)務(wù)知識,以用電量數(shù)據(jù)的多種統(tǒng)計(jì)指標(biāo)為依據(jù),,精準(zhǔn)區(qū)分出用電量異常情況下數(shù)據(jù)的表現(xiàn)特征,,用此特征量數(shù)據(jù)輸入模型,可達(dá)到明顯的效果,。選定竊電用戶與未知用戶的電能示數(shù)數(shù)據(jù)進(jìn)行以下處理:

    (1)計(jì)算匯總每個用戶不同時(shí)間周期下的用電量數(shù)據(jù),;

    (2)計(jì)算每個用戶相鄰時(shí)間周期之間的差異變化;

    (3)計(jì)算線損率與當(dāng)月度匯總用電量的相關(guān)性,,并設(shè)定權(quán)重值,;

    (4)對用戶基礎(chǔ)信息數(shù)據(jù)進(jìn)行分類編碼。

    對以上數(shù)據(jù)表進(jìn)行多維度統(tǒng)計(jì)匯總,,計(jì)算得出多種指標(biāo),,分別代表各時(shí)間周期下用戶每日的用電量和用電量差異的統(tǒng)計(jì)指標(biāo),包括均值,、標(biāo)準(zhǔn)差,、極差、50%分位區(qū)間,、中位數(shù),、偏度、峰度及日用電量小于等于0的次數(shù)等,。

4  模型算法

    利用數(shù)據(jù)處理得出的50個維度的特征變量,,構(gòu)建多種分類模型算法,經(jīng)過多重交叉驗(yàn)證的對比篩選,,選擇表現(xiàn)效果最好的模型進(jìn)行最終的分類預(yù)測,。Adaboost算法屬于集成學(xué)習(xí)算法,是Boosting 算法家族中代表算法,通過若干個弱分類器,,整合為一個強(qiáng)分類器的方法來提高學(xué)習(xí)準(zhǔn)確性,,AdaBoost 算法就是將容易找到的識別率不高的弱分類算法提升為識別率很高的強(qiáng)分類算法。

4.1  建模過程

    經(jīng)過加工后的特征量包括用電曲線特征和用戶檔案特征,,例如用電量數(shù)據(jù)在不同時(shí)間段下的多種統(tǒng)計(jì)量,、用戶電壓等級、行業(yè)類型等,。AdaBoost算法通過對用戶特征集的訓(xùn)練產(chǎn)生不同的分類器,每次迭代都通過計(jì)算誤差率來改變樣本權(quán)重,也就是提高分錯樣本權(quán)重,重點(diǎn)對分錯樣本進(jìn)行訓(xùn)練,,直到達(dá)到迭代次數(shù)或者損失函數(shù)小于某一閾值,,如圖2所示。

scm-t2.gif

    (1)初始化每個訓(xùn)練樣例的權(quán)值,,共M個訓(xùn)練樣例,。

    (2)共進(jìn)行N輪學(xué)習(xí),第n輪學(xué)習(xí)過程如下:

    ① 使用權(quán)值分布為Wn的訓(xùn)練樣例學(xué)習(xí)得到基分類器Gn,;

    ② 計(jì)算上一步得到的基分類器的誤差率,;

    ③ 計(jì)算Gn前面的權(quán)重系數(shù);

    ④ 更新訓(xùn)練樣例的權(quán)重系數(shù),;

    ⑤ 重復(fù)步驟①~④,,得到一系列的權(quán)重參數(shù)an和基分類器Gn

    (3)通過臺區(qū)線損計(jì)算出線損修正系數(shù),,臺區(qū)線損越高,,其竊電嫌疑越高,得出最終用戶竊電嫌疑概率,。

4.2  模型結(jié)果

    模型結(jié)果如表2所示,,列表中分別為電表編號、歷史竊電記錄標(biāo)識,、預(yù)測分類及各分類的概率,。以竊電概率大于50%作為劃分疑似竊電用戶和正常用戶的邊界,實(shí)際應(yīng)用中可以根據(jù)實(shí)際情況調(diào)高此分界值,。

scm-b2.gif

    圖3為對應(yīng)的ROC曲線,,曲線整體靠近左上角,其中,,準(zhǔn)確率為96%,,召回率為93%,模型結(jié)果的準(zhǔn)確率較好,,召回率也較高,,預(yù)測準(zhǔn)確性較高,。

scm-t3.gif

4.3  模型成效

    選取某地區(qū)全量用戶進(jìn)行竊電用戶識別,,識別出較多電表頻繁歸零、電表逆走,、異常波動等情況,,其中某用戶電能示值曲線如圖4所示,實(shí)地排查后找出部分用戶確有真實(shí)竊電的行為,,其余疑似竊電用戶雖未找到竊電的證據(jù),,但是由于用戶無法解釋異常的用電曲線,也同樣判定為重點(diǎn)監(jiān)控目標(biāo),。

scm-t4.gif

5  結(jié)束語

    本次研究是基于用戶全量特征,,針對全量用戶做的分析,,對各類型的用電戶有普遍適用性,適合開展大面積的排查工作,。模型可以進(jìn)行輕量部署,,定期支持常規(guī)用電檢查和專項(xiàng)反竊電活動。

    基于反竊電模型的成果,,可以進(jìn)一步開展研究工作,。例如結(jié)合擴(kuò)報(bào)裝新用戶的用戶畫像和用電負(fù)荷模擬情況,將用戶實(shí)際用電量和預(yù)測用電量比對,,提前預(yù)測用戶的用電行為,;也可以結(jié)合智能電表的實(shí)時(shí)采集信息進(jìn)行實(shí)時(shí)監(jiān)控,在發(fā)現(xiàn)異常的第一時(shí)間及時(shí)報(bào)警,;也可以將反竊電的成果和臺區(qū)線損治理,、營配調(diào)貫通治理的工作結(jié)合起來,相互配合,,通過數(shù)據(jù)治理的成果提升數(shù)據(jù)的可靠性,。

參考文獻(xiàn)

[1] 建峰,葛健.基于用電行為的反竊電智能分析系統(tǒng)[J].電力設(shè)備,,2016(23).

[2] 林志堅(jiān), 姚偉智, 黃朝凱, 等. 基于用電行為分析的反竊電在線監(jiān)測及智能診斷系統(tǒng)研究[J]. 新技術(shù)新工藝, 2015(5): 137-140.

[3] 周文婷, 顧楠, 王濤, 等. 基于數(shù)據(jù)挖掘算法的用戶竊電嫌疑分析[J]. 河南科學(xué), 2015, 33(10): 1767-1772.

[4] 于光輝,,耿桂森.基于用電信息采集系統(tǒng)的防竊電措施[J].山東電力技術(shù),2014, 41(3): 49-51.

[5] 陳鵬飛. 基于用電信息采集系統(tǒng)的竊電在線稽查裝置的開發(fā)應(yīng)用[D].北京:華北電力大學(xué),2013.

[6] 張瑞. 基于用電信息數(shù)據(jù)挖掘的智能反竊電研究與應(yīng)用[J]. 價(jià)值工程, 2016, 35(35): 51-54.

[7] 柴鵬飛,,陳國棟.數(shù)據(jù)分析在反竊電中的應(yīng)用[J].河南電力技術(shù), 2013(2): 61-64.



作者信息:

隋春明,張劍鋒,楊文博,任彥偉

(國網(wǎng)吉林省電力公司,,吉林 長春 130000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。