用于巡航導(dǎo)彈突防航跡規(guī)劃的改進(jìn)深度強(qiáng)化學(xué)習(xí)算法 | |
所屬分類:技術(shù)論文 | |
上傳者:aetmagazine | |
文檔大?。?span>609 K | |
標(biāo)簽: 巡航導(dǎo)彈 DDPG算法 突防策略 | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:為了解決巡航導(dǎo)彈面臨動(dòng)態(tài)預(yù)警機(jī)雷達(dá)威脅下的突防航跡規(guī)劃問題,,提出一種改進(jìn)深度強(qiáng)化學(xué)習(xí)智能航跡規(guī)劃方法,。針對(duì)巡航導(dǎo)彈面對(duì)預(yù)警威脅的突防任務(wù),,構(gòu)建了典型的作戰(zhàn)場(chǎng)景,,給出了預(yù)警機(jī)雷達(dá)探測(cè)概率的預(yù)測(cè)公式,,在此基礎(chǔ)上設(shè)計(jì)了一種引入動(dòng)態(tài)預(yù)警威脅的獎(jiǎng)勵(lì)函數(shù),,使用深度確定性策略梯度網(wǎng)絡(luò)算法(Deep Deterministic Policy Gradient,,DDPG)探究巡航導(dǎo)彈智能突防問題。針對(duì)傳統(tǒng)DDPG算法中探索噪聲時(shí)序不相關(guān)探索能力差的問題,引入了奧恩斯坦-烏倫貝克噪聲,,提高了算法的訓(xùn)練效率,。計(jì)算結(jié)果表明,改進(jìn)的DDPG算法訓(xùn)練收斂時(shí)間更短,。 | |
現(xiàn)在下載 | |
VIP會(huì)員,,AET專家下載不扣分;重復(fù)下載不扣分,,本人上傳資源不扣分,。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2