《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 配電網項目投資與線路臺區(qū)的關聯分析
配電網項目投資與線路臺區(qū)的關聯分析
2018智能電網增刊
胡 宏1,彭 濤2
1.國網江蘇省電力有限公司,江蘇 南京 210000,;2. 國網江蘇省電力有限公司,,江蘇 南京 210000
摘要: 配電網工程在國家穩(wěn)增長、調結構,、惠民生中發(fā)揮重要作用,近些年國家電網公司對配電網工程投資力度逐漸加大,但隨之也出現了部分項目與實際需求有差異,、投資不合理等現象。針對線路運營數據的關鍵指標構建了綜合評價指標體系,,利用組合賦權法確定指標權重,,最終得到線路投資迫切程度的得分情況。然后通過文本挖掘技術對在建項目處理后,,達到配電網項目投資情況與線路打分結果的關聯分析,。進而查看在建項目對線路薄弱環(huán)節(jié)是否存在整改計劃,實現了對在建項目的投資合理性分析,為電網企業(yè)科學合理地進行配電網投資提供借鑒,,發(fā)揮運監(jiān)中心在企業(yè)閉塞環(huán)節(jié)優(yōu)化,、風險防控、管理提升工作中的積極作用,。
中圖分類號: TM7
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.071
Abstract:
Key words :

0  引言

    配電網工程在國家穩(wěn)增長,、調結構、惠民生中發(fā)揮重要作用,。近年來,,公司不斷加大配電網等基礎性建設的投資力度,配電網新建,、改建和擴建,,有效得提高了供電可靠性和穩(wěn)定性。但是由于配電網工程具有投資規(guī)模大,、結構復雜,、多方參與等特點,在項目投資決策中缺少對于項目與線路臺區(qū)的關聯分析,,不能全面反映資源投入轉換成應有產出結果的效益,,出現了部分項目與實際需求有差異、項目投產后設備利用率不足,、投資不合理等現象,。

    目前,針對配電網投資效益如何最優(yōu)化的研究仍較少,。文獻[1]分析了配電網投資后得到的經濟效益,,但其只是從財務角度出發(fā),沒有考慮其他影響因素,;文獻[2]在配電網評估模型和技術方法層面進行了研究,,但太側重于技術實現的介紹,而沒有把投資的經濟效益考慮在內,;文獻[3]介紹了十分全面的評價指標體系的構建,,但太多的評價指標反而容易干擾評價結果,導致評價結果失真,;文獻[4]構建了輔助電網基建項目決策的模型,,但沒有充分考慮投資限額的問題,因此存在某些地區(qū)的投資金額大于投資限額的問題,;文獻[5]構建了激勵監(jiān)管環(huán)境下多周期優(yōu)化潮流和監(jiān)管約束模型,;文獻[6]提出了一種可隨機優(yōu)化的配網投資決策模型;文獻[7]建立了配電自動化系統(tǒng)成本效益綜合分析模型,。

    基于上述研究成果現狀,,本文針對線路運營數據的關鍵指標構建了綜合評價指標體系,,利用熵權法與層次分析法結合的組合賦權法確定指標權重,,進而得到線路投資迫切程度的得分情況,,然后通過基于條件隨機場的文本挖掘技術對在建項目進行線路主體名稱提取后,對配電網項目投資情況與線路打分結果進行關聯分析,,最后用實例驗證了該方法的合理性,。

1  研究方法

1.1 熵權法

    熵權法的核心是根據指標變異性的大小來確定權重。一般地,,指標的信息熵越小,,其變異程度就越大,那么該指標提供的信息量就越多,,其權重就越大[8],,從而在綜合評價中所起的作用也就越大。

hh-gs1.gif

1.2  層次分析(AHP)法

    AHP通過分析復雜系統(tǒng)所包含的因素及相關關系,,構造一個層次分析結構模型[9],,然后按照標度規(guī)則將各指標進行兩兩比較,得到指標判斷矩陣,,最后計算得到判斷矩陣的最大特征值以及最大特征值對應的特征向量,,從而得出權重向量。其主要步驟如下:

    (1)依據標度規(guī)則,,構造兩兩比較判斷矩陣A:

hh-gs2-3.gif

    hh-gs4-7.gif

    如果CR<0.1,,則判斷矩陣A通過了一致性檢驗,否則對A進行重新修正,。

1.3  基于單位化約束條件的組合賦權法

    組合主客觀指標權重的綜合賦權法是理想的指標權重確定方法,,目前,組合集成賦權法已存在多種形式,,本文選用的是基于單位化約束條件的綜合賦權法[10],。

    假設主觀賦權AHP法得到的指標權重向量為:w=(w1,w2,…,wn),客觀賦權熵權法得到的指標權重向量為:v=(v1,v2,…,vn),,且主客觀權重和分別均為1,,令R=αw+βv,其中R為組合主客觀權重后的最終權重向量,,α,、β分別為主客觀權重向量的系數,且α,、β滿足約束條件:α22=1,。

    令各評價對象的最終得分值為di,依據多屬性決策的加法原則有:

hh-gs8-11.gif

    最后將系數α,、β代入式(8)即可得到各評價對象的得分情況,。

1.4  基于條件隨機場(CRF)的文本挖掘算法

    CRF是指在給定一組輸入隨機變量條件下,,得出另一組輸出隨機變量的條件概率分布的模型,條件隨機場可以用于不同的預測問題,,尤其是在中文文本提取問題上的應用[11],。

    設X與Y是隨機變量,P(Y|X)是在給定X條件下Y的條件概率分布,。若隨機變量Y構成一個無向圖,,G=(V,E)表示的馬爾科夫隨機場,即:P(YV│X,YW,W≠V)=P(YV│X,YW,W~V),,對任意結點V成立,,則稱條件概率分布P(Y|X)為條件隨機場,式中W~V表示在圖G=(V,E)中與結點V有邊連接的所有結點W,,W≠V表示結點V以外的所有結點,。

    在定義中,并沒有要求X和Y具有相同的結構?,F實中,,一般假設X和Y具有相同的圖結構。本文主要考慮無向圖為如圖1和2所示的線性鏈的情況,,即:

    G=(V={1,2,3,…,n},E={(i,i+1)}),i=1,2,3,…,(n-1)

hh-t1.gif

hh-t2.gif

    在此情況下,,X=(X1,X2,…,Xn),Y=C(Y1,Y2,…,Yn),稱(X,Y)是一個條件隨機場,。

    CRF++工具是著名的使用命令行進行控制的條件隨機向量場的訓練和測試工具,,本文的研究實現了Python和工具的聯調,使得該算法的訓練和測試命令更加簡單明了,,根據用具自選參數設定顯示內容,,同時根據需求定制特征模板。雖然CRF++工具占用內存較大,,但是它的結果準確率較高,,總的來說,CRF++是綜合性能最佳的工具,。

2  配電網項目投資與線路的關聯分析

2.1  綜合評價指標體系構建

    配電網對項目的投資旨在滿足用戶不斷增加的用電負荷需要,,在此基礎上再盡可能較多地獲得企業(yè)收益,因此本文從配電網運營數據層面構建指標體系,,對線路運營指標進行綜合評價,,從而驗證在建項目投資的合理情況。綜合評價的關鍵在于確定評價指標的選取,,本文從線路供電可靠性,、負荷水平、電壓質量以及三相不平衡這4個維度出發(fā)構建的指標體系如表1所示,,指標能從信息系統(tǒng)直接提取,,避免了主觀因素的參與,。

hh-b1.gif

2.2  項目線路主體名稱提取

    由于在建項目絕大部分是針對10 kV線路進行的,而且項目名稱的命名也存在不規(guī)范的情況,,因此,,本文對項目中10 kV線路主體名稱的提取采用基于CRF的文本挖掘算法。整個提取流程如圖3所示,,具體步驟如下:

hh-t3.gif

    (1)對項目名稱進行預處理,,主要包括對字母大小寫轉換,、羅馬數字規(guī)范化以及統(tǒng)一某些漢字的書寫等工作,。

    (2)對預處理后的文本進行分詞,這個過程除了采用第三方算法包自帶的分詞規(guī)則外,,還需要添加自定義詞典,,本文加入了電力行業(yè)專業(yè)詞匯、城市信息詞匯,、設備臺賬表抽取的線路名稱詞匯等,。

    (3)識別命名實體(線路主體),基于條件隨機場的命名實體識別需要手動對分詞后的文本進行標注,,預先根據文本句式特點建立命名實體標注集對每個詞進行手動標注,。

    (4)手動標注結束后,需要建立相應的幾種特征模板來指定訓練時涉及的特征值,,從這幾種模板中選擇準確率最高的一種作為最終的特征模板加入模型定義中,,本文中,特征模板選用了CRF++的標準范例模板Template_NER_01,、Template_NER_02,。Template_NER_01模板中設定窗口大小為1,即認為當前詞與前后一個詞之間在語義上關聯度最高,;Template_NER_02模板中設定窗口大小為2,,即認為當前詞與前后兩個詞之間在語義上關聯度最高。

    (5)采用條件隨機場CRF工具,,利用之前標注后的訓練集分別加入兩種特征模板訓練模型,,隨后在此基礎上輸入測試數據進行不斷測試,找出測試集準確率較高的模型,,最后輸入要預測的文本到該模型中便可返回相應的線路主體,。

2.3  分析流程

    本文基于配電網線路的重過載、超載,、過電壓,、低電壓、三相不平衡,、停電等方面指標,,從業(yè)務系統(tǒng)中提取多維度信息,,通過綜合評價法對線路指標情況進行打分,然后通過基于條件隨機場的文本挖掘技術對在建項目進行線路主體名稱提取后,,關聯分析所有線路的得分情況與在建項目對于線路的投資情況,,進而驗證在建項目的投資必要性和合理性,最終為電網企業(yè)科學合理地進行配電網投資提供借鑒,,發(fā)揮運監(jiān)中心在企業(yè)閉塞環(huán)節(jié)優(yōu)化,、風險防控、管理提升工作中的積極作用,。圖4為本文分析的技術流程,。

hh-t4.gif

3  實例分析

3.1  數據來源

    提取配電網運營監(jiān)測平臺某供電公司2017年全年的配變運營數據,包括電壓質量,、負荷,、三相不平衡以及停電數據,對其中配變所屬線路利用正則表達式進行統(tǒng)一規(guī)范化后,,得到10 kV線路的各指標數據,。例如,線路停電指標的計算采用停電類別為“電網故障停限電”,、停電時間在2017年內,、線路所屬電壓質量為10 kV后的某線路下所有配變的停電時長總和、停電次數總和作為該線路的停電指標計算結果,,同理計算得到線路的其他運營指標計算結果,。然后將線路供電可靠性、負荷水平,、電壓質量,、三相不平衡4個維度的指標數據進行關聯,匯總得到記錄數為19 082條線路指標數據寬表,。樣例結構如表2所示,。

hh-b2.gif

3.2  線路綜合評價

    線路指標數據的綜合評價采用AHP法與熵權法相結合的組合賦權法確定指標權重。首先分別計算主,、客觀法確定的指標權重值,,然后利用基于單位化約束條件的組合集成算法將二者進行組合得到最終的指標權重。具體步驟如下:

    (1)針對前面的指標體系,,構建一級指標專家打分判斷矩陣,,結果如表3所示。

hh-b3.gif

    經計算,,CI= 0.074,,CR= 0.082<0.1,通過一致性檢驗,得到的一級指標權重為(0.546,0.211,0.078,0.165),。

    (2)構建二級指標專家打分判斷矩陣,。以供電可靠性維度為例,,構建故障停電時長及故障停電次數的判斷矩陣如表4所示。同理,,構建其他維度下的二級指標判斷矩陣,。

hh-b4.gif

    經計算,得到的各維度下二級指標權重分別為(0.333,0.667),、(0.167,0.833),、(0.167,0.833)、(0.667,0.333)

    (3)將得到的一級,、二級權重值對應元素相乘便可得出AHP指標權重值,,結果為w=(0.182,0.364,0.035, 0.176,0.013,0.065,0.11,0.055)。

    (4)按照前面熵權法的介紹,,得出熵權法確定的指標權重結果為v=(0.108,0.101,0.139,0.234,0.182,0.161, 0.0367,0.038),。

    (5)利用基于單位化約束條件的組合集成賦權法組合主客觀權重w、v,,得到指標:故障停電時長、故障停電次數,、重載時長,、超載時長、低電壓時長,、過電壓時長,、三相不平衡次數、三相不平衡時長對應的權重結果為:R=(0.156,0.273,0.071,0.196, 0.072,0.098,0.084,0.049),。

    (6)計算線路得分結果,。利用線路實際指標值與最終的指標權重向量R進行加權求和可以計算出19 082條10 kV線路的最終得分,樣例如表5所示,。

hh-b5.gif

3.3  項目名稱文本挖掘

    本文選用2018年1月~3月共17 881個在建項目,,剔除110 kV和20 kV的工程項目后剩余項目記錄數17 533個,由于項目基礎信息中并沒有針對具體的線路名稱字段,,因此只能從項目名稱中利用文本挖掘的技術提取項目主體,。

    在對項目名稱字段進行數據預處理的基礎上,引入自定義詞典及停用詞詞典,,利用R中的jieba分詞算法包對項目名稱短文本進行了分詞,,基于CRF的實體識別首先需要對分詞后的文本進行手動標注,其中標注符號的說明如表6所示,。一部分分詞后的樣本標注樣例如表7所示,。

hh-b6.gif

hh-b7.gif

    本文特征模板選用了CRF++的標準范例模板Template_NER_01、Template_NER_02,,采用條件隨機場CRF工具反復訓練模型,,得到兩種特征模板及其測試集對應的準確率和召回率統(tǒng)計結果如表8所示,。

hh-b8.gif

    因此選用準確率和召回率都較高的Template_NER_2作為最終的特征模板。將2018年的17 553個項目經過以上預處理,、分詞,、標注等一系列操作后輸入訓練好的最佳模型中,可得到如表9所示的樣例結果,。

hh-b9.gif

3.4  實驗結果分析

    從配變運營數據整理,、計算得到10 kV線路19 082條,通過上面綜合評價算法相應得到19 082條線路的得分值,。同時,,2018年在建10 kV項目共17 533個,通過基于CRF的文本挖掘算法能提取出線路名稱的項目共15 743個,,由于存在多個項目投資一條線路的情況,,因此從這15 743個項目中整理得到8 218條10 kV線路,能與19 082條有得分值的線路關聯起來的項目有14 457個,,相應地,,能關聯起來的線路有7 329條。即,,從全省2018年1~3月對項目/線路的投資情況看,,未關聯到線路運營數據卻存在投資行為的線路有889條,可能原因一是從項目名稱中提取的線路名稱與運營數據的線路無法匹配,,二是存在一部分已投資線路的運營指標并未出現異常,,因此無法與運營數據中的線路關聯。能關聯起來的線路有7 329條,,達到7 329/8 218=89%的線路投資覆蓋率,,但是從線路運營指標層面看,這89%的線路投資是否合理,,是否存在得分很高但投資金額很低或者得分很低但投資金額高的情況還需進一步分析,。

    結合2018年前3個月對項目投資金額的考慮,得出線路得分與線路總投資的關系如圖5所示,,橫軸代表項目得分,,縱軸代表項目投資情況。對于成本類項目,,投資金額基本都在200萬元以下,,不存在得分很低但投資金額大于200萬元的情況;而對于資本類項目,,有不少20分以下的項目投資金額卻在2 000萬元以上,,并且不存在得分大于70分以上的項目。具體的線路得分分布與投資金額的分布詳細情況如表10、表11所示,。

hh-t5.gif

hh-b10.gif

hh-b11.gif

    從表10成本類項目的投資情況看出,,存在1條線路的投資超過1 000萬元,但其綜合評價得分小于20分,;并且存在4條線路的得分在50分以上,,但其投資金額卻小于100萬元的情況。從表11資本類項目的投資情況看出,,有5條線路的綜合評價得分小于20分,,但其投資金額在3 000萬元以上;有7條線路的得分在50分以上但其投資金額卻在100萬元以下,。

    綜上,,從運營數據層面來說,通過對在建項目所投資的線路進行綜合評價并結合其投資總金額的分析發(fā)現,,絕大多數的項目投資相對合理,,但也確實存在某些項目有投資不合理的情況:得分低但實際投資金額大或者得分高但實際投資金額少的線路數17條,占總線路數的比例為0.24%,,針對這些項目仍需要結合其他方面的參考因素(比如社會因素,、經濟因素、氣象因素等)衡量是否投資合理,。

4  結論

    配電網工程在國家穩(wěn)增長,、調結構、惠民生中發(fā)揮重要作用,。隨著近年來不斷加大配電網等基礎性建設的投資力度,配電網新建,、改建和擴建,,有效地提高了供電可靠性和穩(wěn)定性。本文針對線路運營數據的關鍵指標構建了綜合評價指標體系,,利用組合賦權法確定指標權重,,進而得到線路投資迫切程度的得分情況,然后通過基于條件隨機場的文本挖掘技術對在建項目進行線路主體名稱提取后,,對配電網項目投資情況與線路打分結果進行關聯分析,,得到不同項目分類下線路得分與投資金額的具體分布情況。通過本文的研究,,可以從線路運營數據層面發(fā)現投資分配的合理性,,為電網企業(yè)科學合理地進行配電網投資提供借鑒,從而有效發(fā)揮運監(jiān)中心在企業(yè)閉塞環(huán)節(jié)優(yōu)化,、風險防控,、管理提升工作中的積極作用。

參考文獻

[1] 吳鴻亮. 配電網投資經濟效益計算分析[J]. 電網與清潔能源, 2010,26(9):13-16.

[2] 盧建昌,王偉. 基于熵權密切值法的配電網評估模型[J].華東電力,2013,41(5):1047-1050.

[3] 王敬敏,施婷. 智能配電網評估指標體系的構建[J]. 華北電力大學學報,2012,39(6):65-70.

[4] 宋伶俐, 楊軍, 周博文, 等.一種電網基建項目輔助決策方法[J].電力自動化設備,2013,33(6):64-69.

[5] HUANG Y,SODER L.Assessing the impact of incentive regulationon distribution network investment considering distributedgeneration integration[J].International Journal of Electrical Power& Energy Systems,2017,89:126-135.

[6] KONSTANTELOS I,GIANNELOS S,STRBAC G.Strategic valuationof smart grid technology options in distribution networks[J]. IEEE Transactions on Power Systems,2017,32(2):1293-1303.

[7] 王宗耀,蘇浩益. 配網自動化系統(tǒng)可靠性成本效益分析[J]. 電力系統(tǒng)保護與控制,2014,42(6):98-103.

[8] 沈世鎰,吳忠華.信息論基礎與應用[M]. 北京: 高等教育出版社,2004.

[9] 吳澤寧, 張超, 越仁榮, 等. 工程項目系統(tǒng)評價(第一版)[M]. 鄭州: 黃河水利出版社, 2002.

[10] 郭亞軍. 綜合評價理論與方法[M]. 北京: 科學出版社,2002.

[11] LEE S, LEE G G. Heuristic methods for reducing errors of geographic named entities learned by bootstrapping[C]. LNCS 3651: Proceedings of the Second International Joint Conference on Natural Language Processing, Jeju Island, Korea, October 11-13, 2005. Berlin, Heidelberg: Springer, 2005:658-669.



作者信息:

胡  宏1,彭  濤2

(1.國網江蘇省電力有限公司,,江蘇 南京 210000,;2. 國網江蘇省電力有限公司,江蘇 南京 210000)

此內容為AET網站原創(chuàng),,未經授權禁止轉載,。