文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.182725
中文引用格式: 楊爍,孫欽斐,朱潔,,等. 基于大數(shù)據(jù)平臺(tái)的電采暖用電量預(yù)測(cè)分析[J].電子技術(shù)應(yīng)用,,2018,44(11):61-63.
英文引用格式: Yang Shuo,,Sun Qinfei,,Zhu Jie,et al. Forecast and analysis of electric heating consumption based on big data platform[J]. Application of Electronic Technique,,2018,,44(11):61-63.
0 引言
近年來(lái),研究人員對(duì)電力用戶分類,、用電行為特征等進(jìn)行了一些研究,。如,文獻(xiàn)[1]以傳統(tǒng)行業(yè)劃分為基礎(chǔ)提出基于聚類的用戶分類研究,;文獻(xiàn)[2]進(jìn)一步將居民電力用戶類型作為研究對(duì)象,,并通過(guò)云平臺(tái)和聚類算法K-Means相結(jié)合的方式,將居民用戶分為了5類并分析了各類用戶行為,;文獻(xiàn)[3]-[6]從用電負(fù)荷的角度出發(fā),,對(duì)行業(yè)或家庭用戶進(jìn)行分類,為公司決策提供更有針對(duì)性的參考依據(jù),,例如有序用電,、峰谷電量,具有一定的實(shí)際意義,。研究人員進(jìn)一步討論形成的智能用電策略在有效提高用戶的用電效率,,減少家庭能耗,實(shí)現(xiàn)經(jīng)濟(jì)用電的方面很有指導(dǎo)意義,。在家庭用戶方面,,文獻(xiàn)[7]建立了家庭用戶號(hào)、房屋面積,、家庭成員數(shù),、每天用電量、峰谷電量,、家用電器數(shù)等的數(shù)據(jù)維度模型,,進(jìn)而利用大量家庭用戶用電數(shù)據(jù)進(jìn)行分析挖掘??紤]到用戶負(fù)荷除了受用戶自身作息習(xí)慣和經(jīng)濟(jì)收入等直接因素影響外,,還與節(jié)氣、天氣,、當(dāng)?shù)刈畹蜌鉁?、重要?jié)假日和地域?qū)傩缘拈g接因素密切相關(guān),文獻(xiàn)[8]-[10]分別考慮上述因素,,實(shí)現(xiàn)對(duì)居民用電行為特性的差異化分析,,為需求響應(yīng)提供了有效的數(shù)據(jù)支撐,例如峰時(shí)耗電率,、負(fù)荷率,、谷電系數(shù)、平段的用電量百分比等,。
本文基于大數(shù)據(jù)分析平臺(tái),,通過(guò)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,研究各種因素對(duì)用戶采暖耗電量的影響,,建立用戶的采暖用電量預(yù)測(cè)模型,,并最終應(yīng)用在北京市“煤改電”工程智能服務(wù)平臺(tái)上。本文充分考慮該工程數(shù)據(jù)體量大,,找出影響采暖用電量的關(guān)鍵因素,。此研究對(duì)于降低用戶采暖成本以及完善配電網(wǎng)建設(shè)和用戶用電負(fù)荷配置提供數(shù)據(jù)支撐,具有積極意義,。
1 智能服務(wù)平臺(tái)架構(gòu)設(shè)計(jì)
本文中智能服務(wù)平臺(tái)總體架構(gòu)主要分為以下5個(gè)層次:基礎(chǔ)層,、數(shù)據(jù)采集層、數(shù)據(jù)分析層,、綜合應(yīng)用層,、展現(xiàn)層以及統(tǒng)一信息庫(kù),具體如圖1所示,。
平臺(tái)功能架構(gòu)如圖2所示,。
用戶通過(guò)智能采暖APP實(shí)時(shí)監(jiān)測(cè)家庭采暖設(shè)備、采集設(shè)備,,對(duì)異常情況進(jìn)行告警,,同時(shí)通過(guò)智能采暖APP智能操控采暖設(shè)備,并對(duì)采暖設(shè)備的量費(fèi)信息,、補(bǔ)貼信息進(jìn)行便捷查詢,,提升供電服務(wù)質(zhì)量,。
企業(yè)通過(guò)對(duì)“煤改電”工程的用戶信息、采暖設(shè)備運(yùn)行情況,、室內(nèi)溫度,、氣象信息等數(shù)據(jù)的采集,、運(yùn)算和分析處理,,了解用戶的采暖習(xí)慣偏好,提高用戶采暖用電數(shù)據(jù)預(yù)測(cè)的精準(zhǔn)度,,同時(shí)結(jié)合區(qū)域負(fù)荷數(shù)據(jù),,為完善配電網(wǎng)建設(shè)和用戶負(fù)荷配置提供數(shù)據(jù)支撐。
值得指出的是,,在平臺(tái)底層采用了基于Hadoop的HDFS數(shù)據(jù)存儲(chǔ)以及內(nèi)存計(jì)算引擎Spark的大數(shù)據(jù)技術(shù),。HDFS分布式存儲(chǔ)主要是供Hadoop應(yīng)用程序使用,滿足低成本,、高容錯(cuò)、高吞吐等大數(shù)據(jù)處理需求特性,。Spark具有構(gòu)架先進(jìn),、運(yùn)算高效、簡(jiǎn)單易用等優(yōu)點(diǎn),,同時(shí)可與Hadoop無(wú)縫連接,,提供整體解決方案。此外Spark在機(jī)器學(xué)習(xí)方面有著天然的優(yōu)勢(shì),,在迭代處理計(jì)算方面比Hadoop快100倍,,系統(tǒng)具有很好的可擴(kuò)展性,。
樣本數(shù)據(jù)采集通過(guò)安裝在選取的典型用戶家中的溫濕度傳感器,、電流電壓傳感器,按15 min的間隔頻率進(jìn)行數(shù)據(jù)采集,,整個(gè)采暖季采集到上1 000萬(wàn)條設(shè)備監(jiān)控?cái)?shù)據(jù),結(jié)合氣象數(shù)據(jù)服務(wù)平臺(tái)提供的采暖季歷史氣象記錄數(shù)據(jù),,通過(guò)ETL工具從采集廠商提供的前置數(shù)據(jù)庫(kù)讀取到基于大數(shù)據(jù)的智能服務(wù)平臺(tái)Hive數(shù)據(jù)倉(cāng)庫(kù)中。
NN模型訓(xùn)練及預(yù)測(cè)流程如圖3所示,。主要預(yù)測(cè)分析步驟如下:
(1)通過(guò)pySpark編寫數(shù)據(jù)清洗的Job任務(wù)程序,,對(duì)采集到的異常、缺失,、重復(fù)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,,并對(duì)每個(gè)時(shí)間段的耗電電量進(jìn)行統(tǒng)計(jì);
(2)通過(guò)對(duì)收集的特征數(shù)據(jù)進(jìn)行相關(guān)性分析,,去除相關(guān)性過(guò)低的特征數(shù)據(jù),,最終保留相關(guān)性大于0.5的5個(gè)特征數(shù)據(jù);
(3)對(duì)特征數(shù)據(jù)進(jìn)行規(guī)范化數(shù)據(jù)處理,,并將數(shù)據(jù)集拆分為訓(xùn)練集和測(cè)試集兩組,;
(4)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫(kù)中的K-Means聚類算法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行聚類模型分析;
(5)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫(kù)中的線性回歸算法LinearRegression進(jìn)行線性回歸分析,;
(6)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫(kù)中的BP神經(jīng)網(wǎng)絡(luò)算法NNbp進(jìn)行模型訓(xùn)練和預(yù)測(cè)分析,。
通過(guò)該平臺(tái)能快速地對(duì)數(shù)據(jù)進(jìn)行處理和分析,從而提升數(shù)據(jù)分析和決策效率,。
2 BP模型設(shè)計(jì)和配置
本文采用BP網(wǎng)絡(luò)(Back-Propagation Network)進(jìn)行模型訓(xùn)練和預(yù)測(cè)分析,。該BP網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成,。本次研究選用m×k×n的3層BP網(wǎng)絡(luò)模型,,網(wǎng)絡(luò)選用S型傳遞函數(shù)f(x)=1/(1+e-x),通過(guò)反傳誤差函數(shù)E=Σi(Ti+Oi)2/2(Ti為期望輸出,,Oi為網(wǎng)絡(luò)的計(jì)算輸出),,不斷調(diào)節(jié)網(wǎng)絡(luò)權(quán)值和閾值使誤差函數(shù)E達(dá)到極小。
基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,,以“室外溫度,、室外濕度、室內(nèi)溫度,、用戶房屋面積,、人口數(shù)”為自變量,反復(fù)調(diào)節(jié)模型參數(shù),,建立預(yù)測(cè)模型,。因此輸入層的節(jié)點(diǎn)數(shù)為5,輸出層的節(jié)點(diǎn)數(shù)為1,。在網(wǎng)絡(luò)設(shè)計(jì)過(guò)程中, 確定隱層神經(jīng)元數(shù)量很重要,。過(guò)多的隱層神經(jīng)元會(huì)加大網(wǎng)絡(luò)計(jì)算量,容易產(chǎn)生過(guò)度擬合問(wèn)題; 太少的神經(jīng)元個(gè)數(shù)會(huì)影響網(wǎng)絡(luò)性能, 可能達(dá)不到預(yù)期效果,。網(wǎng)絡(luò)中隱層神經(jīng)元的數(shù)量與實(shí)際問(wèn)題的復(fù)雜性,、期望誤差的設(shè)置以及輸入和輸出層的神經(jīng)元數(shù)直接相關(guān)。本次實(shí)驗(yàn)在選取隱層神經(jīng)元個(gè)數(shù)的問(wèn)題上參照了以下的經(jīng)驗(yàn)公式:
其中,,n為輸入層神經(jīng)元個(gè)數(shù),,m為輸出層神經(jīng)元個(gè)數(shù),a為[1,,10]之間的常數(shù),。
根據(jù)經(jīng)驗(yàn)公式,,神經(jīng)元個(gè)數(shù)計(jì)算可取值為4~13之間,在本次實(shí)驗(yàn)中選取隱層神經(jīng)元個(gè)數(shù)為6,。Sigmoid可微函數(shù)和線性函數(shù)通常被BP神經(jīng)網(wǎng)絡(luò)采用作為網(wǎng)絡(luò)的激勵(lì)函數(shù)。由于網(wǎng)絡(luò)的輸出歸一到[-1,,1]范圍內(nèi),,因此預(yù)測(cè)模型選取S 型對(duì)數(shù)函數(shù)tansig作為輸出層神經(jīng)元的激勵(lì)函數(shù)。本次預(yù)測(cè)模型網(wǎng)絡(luò)迭代次數(shù)epochs選定為5 000,,期望誤差goal為0.000 1,,學(xué)習(xí)速率lr為0.01,。
3 實(shí)驗(yàn)和結(jié)果分析
本文對(duì)北京地區(qū)2017年~2018年實(shí)施了“煤改電”項(xiàng)目的用戶的實(shí)測(cè)數(shù)據(jù)進(jìn)行分析,,所選數(shù)據(jù)集中包含:室外溫度、室外濕度,、室內(nèi)溫度,、用戶房屋面積、人口數(shù)及采暖耗電量,。本文選取了實(shí)際使用電采暖大于40日的用戶數(shù)據(jù),,對(duì)其進(jìn)行數(shù)據(jù)處理與清洗,預(yù)測(cè)采暖小時(shí)耗電量,。對(duì)數(shù)據(jù)歸一化處理得到有效數(shù)據(jù)共24 150條,。通過(guò)模型計(jì)算得到的用戶采暖耗電量,對(duì)16 180條訓(xùn)練數(shù)據(jù)的預(yù)測(cè)結(jié)果如圖4所示,。
圖4中列出了根據(jù)采集的特征數(shù)據(jù)計(jì)算得到的采暖負(fù)荷的真實(shí)值及預(yù)測(cè)值,。根據(jù)相對(duì)誤差和平均誤差的計(jì)算公式,計(jì)算得到的訓(xùn)練集平均平方誤差為0.821 94,。從圖中可以看出,,實(shí)際數(shù)據(jù)曲線和預(yù)測(cè)數(shù)據(jù)具有一致性,在用戶實(shí)時(shí)負(fù)荷數(shù)據(jù)完備且真實(shí)的前提下,,本研究所采用的預(yù)測(cè)模型能夠有效預(yù)測(cè)24小時(shí)用戶的用電量,。隨著實(shí)際數(shù)據(jù)的積累和模型訓(xùn)練精度的提升,最終能夠?qū)崿F(xiàn)對(duì)實(shí)際用戶數(shù)據(jù)的預(yù)測(cè),。
4 結(jié)論
本文建立了基于大數(shù)據(jù)分析的智能服務(wù)平臺(tái),,并利用BP網(wǎng)絡(luò)對(duì)用戶用電量進(jìn)行實(shí)際建模和預(yù)測(cè),該預(yù)測(cè)結(jié)果和實(shí)際數(shù)據(jù)具有一致性,。當(dāng)然,,實(shí)際的預(yù)測(cè)準(zhǔn)確度不但與外界環(huán)境溫度相關(guān),而且與用戶家庭人口數(shù),、房間大小和使用偏好等特性相關(guān),。因此,,針對(duì)當(dāng)前有效數(shù)據(jù)量的不足,能夠通過(guò)后續(xù)的數(shù)據(jù)補(bǔ)充,,進(jìn)行針對(duì)性建模和預(yù)測(cè),,從而進(jìn)一步提升模型的精度,讓系統(tǒng)發(fā)揮更大的價(jià)值,。本文所建立的系統(tǒng)已經(jīng)應(yīng)用在北京“煤改電”工程中,,對(duì)完善配電網(wǎng)建設(shè)和用戶用電負(fù)荷配置具有顯著價(jià)值。
參考文獻(xiàn)
[1] 馮曉蒲.基于實(shí)際負(fù)荷曲線的電力用戶分類技術(shù)研究[D].保定:華北電力大學(xué),,2011.
[2] 張素香,劉建明,趙丙鎮(zhèn).基于云計(jì)算的居民用電行為分析模型研究[J].電網(wǎng)技術(shù),,2013(6):65-69.
[3] 王炳鑫,侯巖,,方紅旺.面向“削峰填谷”的電力客戶用電行為分析[J].電信科學(xué),,2017,33(5):164-170.
[4] 張鐵峰,,顧明迪.電力用戶負(fù)荷模式提取技術(shù)及應(yīng)用綜述[J].電網(wǎng)技術(shù),,2016,40(3):804-811.
[5] 孫毅,,劉迪,,李彬,等.基于家庭用電負(fù)荷關(guān)聯(lián)度的實(shí)時(shí)優(yōu)化策略[J].電網(wǎng)技術(shù),,2016,,40(6):1825-1829.
[6] 孫毅,馮云,,崔燦.基于動(dòng)態(tài)自適應(yīng)K均值聚類的電力用戶負(fù)荷編碼與行為分析[J].電力科學(xué)與技術(shù)學(xué)報(bào),,2017,32(3):3-8.
[7] 趙莉,,候興哲,,胡君.基于改進(jìn)k-means算法的海量智能用電數(shù)據(jù)分析[J].電網(wǎng)技術(shù),2014(10):104-109.
[8] 李樂(lè),,辛江.北京農(nóng)村“煤改電”用戶負(fù)荷分析及供電策略[J].中國(guó)電力企業(yè)管理,,2017(10):56-58.
[9] 劉旭,羅滇生,姚建剛.基于負(fù)荷分解和實(shí)時(shí)氣象因素的短期負(fù)荷預(yù)測(cè)[J].電網(wǎng)技術(shù),,2009(12):98-104.
[10] 蘇適,,李康平,嚴(yán)玉廷.基于密度空間聚類和引力搜索算法的居民負(fù)荷用電模式分類模型[J].電力自動(dòng)化設(shè)備,,2018 (1):129-136.
作者信息:
楊 爍,,孫欽斐,朱 潔,陳 平
(國(guó)網(wǎng)北京市電力公司電力科學(xué)研究院,,北京100075)