基于深度強(qiáng)化學(xué)習(xí)和社會(huì)力模型的移動(dòng)機(jī)器人自主避障 | |
所屬分類:技術(shù)論文 | |
上傳者:zhoubin333 | |
文檔大?。?span>1912 K | |
標(biāo)簽: 深度強(qiáng)化學(xué)習(xí) 社會(huì)力模型 自主避障 | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:深度強(qiáng)化學(xué)習(xí)在移動(dòng)機(jī)器人自主避障領(lǐng)域已得到廣泛應(yīng)用,,其基本原理是通過模擬環(huán)境中的不斷試錯(cuò),,結(jié)合獎(jiǎng)勵(lì)機(jī)制提升機(jī)器人的避障性能,。然而,,針對(duì)不同任務(wù)場(chǎng)景,,網(wǎng)絡(luò)訓(xùn)練效率存在顯著差異,。同時(shí),,在人群密集的場(chǎng)景中,,機(jī)器人的行為可能對(duì)人類造成干擾。為了應(yīng)對(duì)訓(xùn)練效率低下和機(jī)器人行為不符合社會(huì)規(guī)范的問題,提出了一種將社會(huì)力模型融入深度強(qiáng)化學(xué)習(xí)的自主避障策略,。該策略首先將人類未來的運(yùn)動(dòng)軌跡考慮進(jìn)獎(jiǎng)勵(lì)函數(shù),,以確保機(jī)器人理解人類意圖并避免闖入人類的舒適區(qū)。其次,,在訓(xùn)練過程中引入先驗(yàn)的傳統(tǒng)控制器模型,,并設(shè)計(jì)了一種基于概率的切換開關(guān),以隨機(jī)切換控制器輸出,,提高機(jī)器人的探索效率,。實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠增加機(jī)器人與人類之間的安全距離,,同時(shí)實(shí)現(xiàn)平穩(wěn)導(dǎo)航,。 | |
現(xiàn)在下載 | |
VIP會(huì)員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2