用于巡航導(dǎo)彈突防航跡規(guī)劃的改進(jìn)深度強(qiáng)化學(xué)習(xí)算法
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>609 K
標(biāo)簽: 巡航導(dǎo)彈 DDPG算法 突防策略
所需積分:0分積分不夠怎么辦,?
文檔介紹:為了解決巡航導(dǎo)彈面臨動(dòng)態(tài)預(yù)警機(jī)雷達(dá)威脅下的突防航跡規(guī)劃問題,,提出一種改進(jìn)深度強(qiáng)化學(xué)習(xí)智能航跡規(guī)劃方法,。針對(duì)巡航導(dǎo)彈面對(duì)預(yù)警威脅的突防任務(wù),,構(gòu)建了典型的作戰(zhàn)場(chǎng)景,,給出了預(yù)警機(jī)雷達(dá)探測(cè)概率的預(yù)測(cè)公式,,在此基礎(chǔ)上設(shè)計(jì)了一種引入動(dòng)態(tài)預(yù)警威脅的獎(jiǎng)勵(lì)函數(shù),,使用深度確定性策略梯度網(wǎng)絡(luò)算法(Deep Deterministic Policy Gradient,,DDPG)探究巡航導(dǎo)彈智能突防問題。針對(duì)傳統(tǒng)DDPG算法中探索噪聲時(shí)序不相關(guān)探索能力差的問題,引入了奧恩斯坦-烏倫貝克噪聲,,提高了算法的訓(xùn)練效率,。計(jì)算結(jié)果表明,改進(jìn)的DDPG算法訓(xùn)練收斂時(shí)間更短,。
現(xiàn)在下載
VIP會(huì)員,,AET專家下載不扣分;重復(fù)下載不扣分,,本人上傳資源不扣分,。