文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.173985
中文引用格式: 方芳,,田世明,,卜凡鵬,等. 一種自適應(yīng)選擇樣本的用電負(fù)荷預(yù)測方法[J].電子技術(shù)應(yīng)用,,2017,,43(11):18-21,26.
英文引用格式: Fang Fang,,Tian Shiming,,Bu Fanpeng,et al. An electric load forecasting method based on adaptive selection of samples[J].Application of Electronic Technique,,2017,,43(11):18-21,26.
0 引言
短期負(fù)荷預(yù)測是電力系統(tǒng)實(shí)現(xiàn)安全運(yùn)行與經(jīng)濟(jì)調(diào)度的前提與保障[1-3],及時(shí)準(zhǔn)確的預(yù)測能為電力網(wǎng)絡(luò)運(yùn)行各個(gè)環(huán)節(jié)的管理者及調(diào)度部門提供決策依據(jù),,同時(shí)也是實(shí)時(shí)電價(jià)策略制定,、電力市場規(guī)劃實(shí)施的基礎(chǔ)。短期負(fù)荷預(yù)測,,尤其是未來24小時(shí)的短期預(yù)測,,由于負(fù)荷波動(dòng)隨機(jī)性強(qiáng),、影響因素種類眾多、負(fù)荷周期性差異大[4],,一直是負(fù)荷預(yù)測工作中的難點(diǎn)與重點(diǎn),。
影響未來負(fù)荷波動(dòng)狀況的因素眾多,除了氣溫,、濕度,、降雨量等氣象因素,經(jīng)濟(jì)產(chǎn)業(yè)波動(dòng),、重大節(jié)假日等也與其存在相關(guān)關(guān)系,,如何在模型中考慮多種因素而又能消除因素間的多重共線性及樣本數(shù)不足的缺陷,成為研究的阻礙[5-6],。在機(jī)器學(xué)習(xí)領(lǐng)域,嶺回歸技術(shù)恰好對樣本數(shù)小于特征數(shù),、特征間存在多重共線性這一預(yù)測場景適用,。文獻(xiàn)[7]將主成份分析與嶺回歸結(jié)合進(jìn)行了短期負(fù)荷分析,文獻(xiàn)[7-8]則結(jié)合偏最小二乘與嶺回歸建立了PLSR-RE預(yù)測模型進(jìn)行中長期負(fù)荷預(yù)測,。由于缺少特征相似樣本的提取,,這些預(yù)測方法都沒有發(fā)掘出嶺回歸技術(shù)在小樣本多特征情形下相較普通最小二乘回歸的優(yōu)勢。
面對短期負(fù)荷預(yù)測在較短時(shí)期內(nèi)就存在較大非周期性差異的特點(diǎn),,固定的預(yù)測模型即使使用了較多的歷史數(shù)據(jù)做訓(xùn)練,,也很可能在預(yù)測數(shù)周后預(yù)測效果就大為下降。因此在24小時(shí)負(fù)荷預(yù)測中,,一個(gè)改進(jìn)趨勢便是依據(jù)預(yù)測日的某些特征,,自適應(yīng)選擇其適用的預(yù)測模型。自適應(yīng)的思想在人工智能領(lǐng)域應(yīng)用廣泛,,自適應(yīng)系統(tǒng)可以從自身的挫折,、對外部世界的觀察和經(jīng)歷中進(jìn)行學(xué)習(xí)[9-14]。當(dāng)條件發(fā)生變化時(shí),,它能夠?qū)ψ陨碜龀鱿鄳?yīng)調(diào)整,。本文將自適應(yīng)的思想結(jié)合嶺回歸預(yù)測技術(shù),建立了一套預(yù)測精度較好的24小時(shí)短期負(fù)荷預(yù)測模型,,并結(jié)合某區(qū)實(shí)際數(shù)據(jù)分析模型的預(yù)測效果,。
1 自適應(yīng)負(fù)荷預(yù)測原理
自適應(yīng)預(yù)測的目標(biāo)是針對不同的預(yù)測日,通過某種指標(biāo)自動(dòng)比較各種預(yù)測模型在對預(yù)測日進(jìn)行預(yù)測時(shí)的性能,,一方面自適應(yīng)地選擇合適的預(yù)測方法,,另外一方面,還要自適應(yīng)地進(jìn)行模型參數(shù)的尋優(yōu),,以實(shí)現(xiàn)自動(dòng)地將具有最優(yōu)參數(shù)的最優(yōu)模型應(yīng)用于下一次預(yù)測,。
通常評(píng)價(jià)預(yù)測模型的主要指標(biāo)是模型的預(yù)測精確度,而由于對待預(yù)測日的實(shí)際負(fù)荷未知,其實(shí)際預(yù)測精確度難以估計(jì),。因此在使用自適應(yīng)技術(shù)時(shí),,可以考慮使用兩種自適應(yīng)模式:預(yù)測日特征自適應(yīng)及虛擬預(yù)測日自適應(yīng)。
預(yù)測日特征自適應(yīng),,即通過預(yù)測日的特征,,如氣象特征、節(jié)假日信息,、人流密度等預(yù)報(bào)信息,,在歷史日中選擇與預(yù)測日特征相近的相似日進(jìn)行模型自適應(yīng)訓(xùn)練與尋優(yōu),最終完成預(yù)測,。其優(yōu)點(diǎn)是訓(xùn)練時(shí)間較短,,缺點(diǎn)是特征相似日的自適應(yīng)模型可能對預(yù)測日精度較差。
虛擬預(yù)測日自適應(yīng),,是首先通過預(yù)測日的特征,,在歷史日中選擇與預(yù)測日最相近的虛擬預(yù)測日,通過對虛擬預(yù)測日預(yù)測精度不斷尋優(yōu),,得到一個(gè)精度較高的模型用于實(shí)際預(yù)測日,。該預(yù)測方法優(yōu)點(diǎn)是自適應(yīng)程度高,預(yù)測效果好,,缺點(diǎn)是尋優(yōu)時(shí)間較長,,對虛擬日的尋優(yōu)過程可能造成過擬合而在實(shí)際預(yù)測中性能下降。
2 嶺回歸與帶交叉驗(yàn)證的嶺回歸
嶺回歸是一種適用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,,屬于一種改進(jìn)的最小二乘法,。嶺回歸最為經(jīng)典的應(yīng)用場景是不考慮多重共線性,引入較多的影響因素來對模型進(jìn)行擬合,,這一場景下時(shí)常會(huì)造成樣本的特征維度大于樣本的個(gè)數(shù),,從而自變量矩陣是不滿秩的,在普通最小二乘法中需要對自變量自乘矩陣求逆,,而該場景下該矩陣接近于奇異,,對其求逆存在很大誤差,而嶺回歸則不會(huì)存在這一問題,。
回歸分析中常用的最小二乘法是一種無偏估計(jì),,對于一個(gè)適定問題,X通常是列滿秩的,,回歸模型可以表述如下:
其中X為自變量矩陣,,θ為回歸參數(shù)矩陣,y為因變量向量,。
采用最小二乘法,,定義的損失函數(shù)為殘差的平方和,,表述如下:
為求取最小化損失,對上述問題求導(dǎo)后,,可得到時(shí)殘差平方和最小化的參數(shù)矩陣:
當(dāng)X不是列滿秩時(shí),,或者其某些列之間的線性相關(guān)性較大時(shí),XTX的行列式接近于0,,即XTX接近于奇異,,上述問題轉(zhuǎn)變?yōu)橐粋€(gè)不適定問題。此時(shí)對XTX求逆的誤差急劇增大,,傳統(tǒng)的最小二乘法表現(xiàn)出非穩(wěn)定性和不可靠性,。
為解決上述問題,在上述的損失函數(shù)中加入一個(gè)正則化項(xiàng),,即變?yōu)椋?/p>
帶交叉驗(yàn)證的嶺回歸算法則是通過預(yù)先設(shè)定好α的不同取值(通常設(shè)定一個(gè)步長與范圍,,在一定區(qū)間內(nèi)等步長取值作為α的取值集合),通過對樣本所有點(diǎn)隨機(jī)劃分訓(xùn)練點(diǎn)的測試點(diǎn),,對每一個(gè)測試點(diǎn)遍歷α的取值集合做嶺回歸預(yù)測,,最終通過交叉驗(yàn)證選取使整體擬合誤差最小的α值作為最終的嶺回歸模型的α值。
3 模型輸入變量數(shù)值化
對于一天之后的短期負(fù)荷預(yù)測,,影響其負(fù)荷大小的相關(guān)因子主要是星期類型、月份,、總體的時(shí)間趨勢,、該日的氣象值、該日相對于前一日的氣象變化,、前一日的負(fù)荷值,。將以上因素?cái)?shù)值化表述如下:
星期類型:
其中wi,j表示第i個(gè)氣象類型(如溫度,、濕度,、氣壓等)在該日第j個(gè)時(shí)點(diǎn)的氣象值。
相對前一日氣象變化值:
其中wdi,,j表示第i個(gè)氣象類型(如溫度,、濕度、氣壓等)該日第j個(gè)時(shí)點(diǎn)的值與前一日第j個(gè)時(shí)點(diǎn)的值作差分得到的氣象變化量,。
前一日負(fù)荷:
即44+8×m維,,m為考慮的氣象因素種類數(shù),假設(shè)考慮4種天氣因素,,則模型輸入為236維向量,,而在3年的歷史數(shù)據(jù)中選擇的與預(yù)測日天氣類型相近的訓(xùn)練樣本顯然不會(huì)超過236個(gè),因此需要使用嶺回歸技術(shù)實(shí)現(xiàn)這一預(yù)測模型,。
綜上,,對預(yù)測日i第k個(gè)時(shí)點(diǎn)負(fù)荷的預(yù)測模型可寫為:
4 自適應(yīng)預(yù)測方法
依據(jù)預(yù)測模型的自適應(yīng)程度,,分別建立了模式1至模式3三種預(yù)測模型。
4.1 模式1:訓(xùn)練所有樣本的RidgeCV回歸模型
該模式即將預(yù)測日之前所有歷史日的負(fù)荷及相關(guān)因素均用于模型的訓(xùn)練,,其基本流程如圖1所示,。
模式1的優(yōu)點(diǎn)是方法簡單、實(shí)現(xiàn)容易,,對每一個(gè)預(yù)測日只需要使用所用歷史數(shù)據(jù)訓(xùn)練好的一個(gè)模型,,從而預(yù)測速度快。但由于缺乏對待預(yù)測日自身特點(diǎn)的針對性,,預(yù)測效果容易受到整體訓(xùn)練樣本中無關(guān)樣本的干擾,,因此可以考慮已經(jīng)不同預(yù)測日自身特點(diǎn)篩選用于訓(xùn)練的樣本,從而提高訓(xùn)練的效率與針對性,,達(dá)到提高預(yù)測精度的目的,。由此提出模式2的預(yù)測方法。
4.2 模式2:依據(jù)預(yù)測日天氣自適應(yīng)選擇最優(yōu)訓(xùn)練樣本訓(xùn)練模型
模式2考慮具體實(shí)現(xiàn)自適應(yīng)預(yù)測中的依據(jù)預(yù)測日特征自適應(yīng)方法,。具有相同天氣類型與氣象變化情況的日期,,其負(fù)荷與天氣因素、前日負(fù)荷變化情況也存在相似性,,通過尋找對預(yù)測日有較高氣象相似度的歷史日作為訓(xùn)練樣本訓(xùn)練模型,,能夠最大程度地排除無關(guān)樣本對建立預(yù)測模型的干擾,從而提高最終預(yù)測模型的準(zhǔn)確性與針對性,。
模式2基本預(yù)測流程如圖2所示,。其相比模式1增加了相關(guān)樣本篩選功能,排除了無關(guān)樣本對預(yù)測日的干擾,,減少模型訓(xùn)練時(shí)間的同時(shí)提高最終預(yù)測精度,。
4.3 模式3:最小化虛擬日預(yù)測誤差自適應(yīng)選擇權(quán)重篩選訓(xùn)練樣本的預(yù)測模型
模式3相比模式2,加入了虛擬預(yù)測日預(yù)測的概念,,將虛擬預(yù)測日預(yù)測誤差極小化作為模型優(yōu)化的目標(biāo),,通過優(yōu)化用于篩選的權(quán)重系數(shù)向量ω1、ω2,,使得最終用于訓(xùn)練的樣本與預(yù)測日氣象狀況高度相關(guān),,從而最終模型更適用于預(yù)測日,以提高對最終預(yù)測日的預(yù)測精度,。
具體流程如圖3所示,。
5 預(yù)測結(jié)果
通過實(shí)際使用模式2和模式3對某地區(qū)電網(wǎng)的實(shí)際負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測,同時(shí)與短期負(fù)荷預(yù)測中精度較高的SVR預(yù)測方法進(jìn)行精度的比較,,分析使用自適應(yīng)技術(shù)后模型的預(yù)測結(jié)果,。
圖4為模式2、模式3與SVR測試結(jié)果,,通過觀察可發(fā)現(xiàn),,在對節(jié)假日與工作日交匯的日期及負(fù)荷變化大的日期的預(yù)測中,,模式2與模式3的預(yù)測效果要好于支持向量回歸預(yù)測,模式3相比模式2預(yù)測效果差別不大,,但整體的預(yù)測誤差要小于模式2,,其中模式2預(yù)測MAPE為1.024%,模式3預(yù)測MAPE為0.978%,,SVR預(yù)測MAPE1.464%,,模式2雖然誤差較模式3大,但對于氣象變化大的預(yù)測日效果更好,,模式3則在負(fù)荷平穩(wěn)時(shí)段預(yù)測精度最高,。
6 結(jié)論
在嶺回歸預(yù)測模型及自適應(yīng)思想的基礎(chǔ)上,本文提出了一種應(yīng)用虛擬預(yù)測日方法的自適應(yīng)嶺回歸預(yù)測模型,,并依據(jù)自適應(yīng)程度提出了兩種預(yù)測模式,。模型在實(shí)際運(yùn)用中體現(xiàn)了對不同類型預(yù)測日的針對性,相比常用的SVR預(yù)測模型精度更高,,對負(fù)荷突變?nèi)盏倪m應(yīng)性更強(qiáng),,總體預(yù)測效果更好。
參考文獻(xiàn)
[1] 康重慶,,夏清,,劉梅,等.電力系統(tǒng)負(fù)荷預(yù)測[M].北京:中國電力出版社,,2007.
[2] 牛東曉,,曹樹華,趙磊,,等.電力負(fù)荷預(yù)測技術(shù)及其應(yīng)用[M].北京:中國電力出版社,,2009.
[3] 劉晨暉.電力系統(tǒng)負(fù)荷預(yù)報(bào)理論與方法[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,,1987.
[4] TAYLOR R C.An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics[J].BMC Bioinformatics,,2010,11(12):S1.
[5] DEAN J,,GHEMAWAT S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,,2008,51(1):107-113.
[6] ENE A,,IM S,,MOSELEY B.Fast clustering using Map-Reduce[C].Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining,ACM,,2011:681-689.
[7] 楊卓.基于負(fù)荷混沌特性和最小二乘支持向量機(jī)的短期負(fù)荷預(yù)測[D].西安:西安理工大學(xué),,2008.
[8] 何永秀,王躍錦,,楊麗芳,,等.基于最小二乘支持向量機(jī)的居民用電預(yù)測研究[J].電力需求側(cè)管理,,2010,12(3):19-23.
[9] WONG P C,,SHEN H W,,JOHNSON C R,et al.The top 10 challenges in extreme-scale visual analytics[J].IEEE computer graphics and applications,,2012,,32(4):63.
[10] 顧丹珍,艾芊,,陳陳,,等.自適應(yīng)神經(jīng)網(wǎng)絡(luò)在負(fù)荷動(dòng)態(tài)建模中的應(yīng)用[J].中國電機(jī)工程學(xué)報(bào),2007,,27(16):31-36.
[11] GUO H,,MAO N,YUAN X.Wysiwyg(what you see is what you get)volume visualization[J].Visualization and Computer Graphics,,IEEE Transactions on,,2011,17(12):2106-2114.
[12] AHRENS J,,BRISLAWN K,,MARTIN K,et al.Large-scale data visualization using parallel data streaming[J].Computer Graphics and Applications,,IEEE,,2001,21(4):34-41.
[13] ROSS R B,,PETERKA T,,SHEN H W,et al.Visualization and parallel I/O at extreme scale[C].Journal of Physics:Conference Series IOP Publishing,,2008.
[14] JAGADISH H V,,OOI B C,TAN K L,,et al.Distance:An adaptive B+-tree based indexing method for nearest neighbor search[J].ACM Transactions on Database Systems(TODS),,2005,30(2):364-397.
作者信息:
方 芳1,,田世明2,,卜凡鵬2,蘇 運(yùn)3
(1.國網(wǎng)北京市電力公司昌平供電公司,,北京102200,;
2.中國電力科學(xué)研究院,北京100192;3.國網(wǎng)上海市電力公司,,上海200437)