用于巡航導(dǎo)彈突防航跡規(guī)劃的改進(jìn)深度強(qiáng)化學(xué)習(xí)算法AET-電子技術(shù)應(yīng)用-最豐富的電子設(shè)計(jì)資源平臺(tái)

用于巡航導(dǎo)彈突防航跡規(guī)劃的改進(jìn)深度強(qiáng)化學(xué)習(xí)算法
所屬分類：技術(shù)論文
上傳者：aetmagazine
文檔大小：609 K
標(biāo)簽：巡航導(dǎo)彈 DDPG算法突防策略
所需積分：0分積分不夠怎么辦？
文檔介紹：為了解決巡航導(dǎo)彈面臨動(dòng)態(tài)預(yù)警機(jī)雷達(dá)威脅下的突防航跡規(guī)劃問題，提出一種改進(jìn)深度強(qiáng)化學(xué)習(xí)智能航跡規(guī)劃方法。針對(duì)巡航導(dǎo)彈面對(duì)預(yù)警威脅的突防任務(wù)，構(gòu)建了典型的作戰(zhàn)場景，給出了預(yù)警機(jī)雷達(dá)探測概率的預(yù)測公式，在此基礎(chǔ)上設(shè)計(jì)了一種引入動(dòng)態(tài)預(yù)警威脅的獎(jiǎng)勵(lì)函數(shù)，使用深度確定性策略梯度網(wǎng)絡(luò)算法(Deep Deterministic Policy Gradient，DDPG)探究巡航導(dǎo)彈智能突防問題。針對(duì)傳統(tǒng)DDPG算法中探索噪聲時(shí)序不相關(guān)探索能力差的問題，引入了奧恩斯坦-烏倫貝克噪聲，提高了算法的訓(xùn)練效率。計(jì)算結(jié)果表明，改進(jìn)的DDPG算法訓(xùn)練收斂時(shí)間更短。
現(xiàn)在下載
VIP會(huì)員，AET專家下載不扣分；重復(fù)下載不扣分，本人上傳資源不扣分。

活動(dòng)