基于模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大?。?span>1703 K | |
標(biāo)簽: 多智能體路徑規(guī)劃 強(qiáng)化學(xué)習(xí) 模仿學(xué)習(xí) | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:多智能體路徑規(guī)劃(Multi-Agent Path Finding, MAPF)擴(kuò)展到大型動(dòng)態(tài)環(huán)境中是一個(gè)越來越有挑戰(zhàn)的問題。現(xiàn)實(shí)世界中,,環(huán)境動(dòng)態(tài)變化往往需要實(shí)時(shí)重新規(guī)劃路徑,。在部分可觀察環(huán)境中,使用強(qiáng)化學(xué)習(xí)方法學(xué)習(xí)分散的策略解決MAPF問題表現(xiàn)出較大潛力,。針對(duì)智能體之間如何學(xué)會(huì)合作和環(huán)境獎(jiǎng)勵(lì)稀疏問題,,提出基于模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃算法。實(shí)驗(yàn)表明,,該方法在高密度障礙環(huán)境中具有較好的性能和擴(kuò)展性,。 | |
現(xiàn)在下載 | |
VIP會(huì)員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2