文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.04.013
引用格式: 張子霖. 基于深度強化學習的電動汽車協(xié)調(diào)充電算法[J].信息技術與網(wǎng)絡安全,,2022,41(4):83-89.
0 引言
電動汽車作為一種新型的分布式移動資源,,已成為智能電網(wǎng)發(fā)展的重要組成部分[1],,越來越多的研究人員開始關注電動汽車在電網(wǎng)中的社會價值。但電動汽車的日益普及也不可避免地給用戶和電網(wǎng)帶來了一系列的問題和挑戰(zhàn),。例如,,大量電動汽車的不協(xié)調(diào)充電,,將導致電網(wǎng)承受不可預測的負荷,。因此,,如何設計多輛電動汽車在整個工作過程中的協(xié)調(diào)充電策略,以降低能源成本,,保證用戶對電動汽車荷電狀態(tài)的滿意度,,并將對配電網(wǎng)的影響降到最低,是亟需解決的問題,。
近年來,,為了解決電動汽車的協(xié)調(diào)充電問題,出現(xiàn)了許多分布式調(diào)度方法,。例如,,為了最大限度地提高電動汽車用戶的便利性,開發(fā)了一種分散的基于交替方向乘法器的優(yōu)化算法[2],。為使電動汽車充電成本最小化,,使用電動汽車充電概率模型建立了一個嚴格凸分散系統(tǒng)形式的多人博弈[3]。但上述研究只關注了單一的目標,,這在實際應用中往往是受限制的,。針對多目標的協(xié)調(diào)充電問題,通過多智能體自私協(xié)同優(yōu)化的方案,,除了實現(xiàn)用戶利益以外,,也保證避免變壓器過載[4],但它沒有充分考慮狀態(tài)空間泛化和值函數(shù)逼近的影響,,導致擬合性能較差,,計算開銷也不理想。針對該問題,,文獻[5]考慮采用基于機器學習的方法,,其以收斂速度快、計算效率高而被廣泛應用于大規(guī)模數(shù)據(jù)的高維問題中,。
本文詳細內(nèi)容請下載:http://forexkbc.com/resource/share/2000004104
作者信息:
張子霖
(中國科學技術大學 自動化系,,安徽 合肥230026)