技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的水下機(jī)器人軌跡控制方法及控制系統(tǒng),包括學(xué)習(xí)階段和應(yīng)用階段;在學(xué)習(xí)階段,通過仿真器模擬水下機(jī)器人的運(yùn)作過程,采集仿真器所模擬的正在運(yùn)作的水下機(jī)器人的數(shù)據(jù),包括各時刻的狀態(tài)和各時刻對應(yīng)下一時刻的目標(biāo)狀態(tài),通過這些數(shù)據(jù)針對決策神經(jīng)網(wǎng)絡(luò)、輔助決策神經(jīng)網(wǎng)絡(luò)、評價神經(jīng)網(wǎng)絡(luò)和輔助評價神經(jīng)網(wǎng)絡(luò)四個神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí);在應(yīng)用階段,獲取到水下機(jī)器人當(dāng)前時刻的狀態(tài)以及下一時刻的目標(biāo)狀態(tài),然后輸入至學(xué)習(xí)階段最終學(xué)習(xí)得到的決策神經(jīng)網(wǎng)絡(luò)中,通過決策神經(jīng)網(wǎng)絡(luò)計(jì)算出水下機(jī)器人當(dāng)前時刻需要的推進(jìn)力。本發(fā)明可以實(shí)現(xiàn)水下機(jī)器人運(yùn)動軌跡的精確控制。
技術(shù)研發(fā)人員:馬瓊雄;余潤笙;石振宇;黃晁星;李騰龍;張慶茂
受保護(hù)的技術(shù)使用者:華南師范大學(xué)
技術(shù)研發(fā)日:2017.06.22
技術(shù)公布日:2017.08.29