本發(fā)明涉及一種面向多智能體路徑規(guī)劃的分層協(xié)同深度強(qiáng)化學(xué)習(xí)決策方法,屬于多智能體路徑規(guī)劃。、深度強(qiáng)化學(xué)習(xí)(deep?reinforcement?learning,drl)是將深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合的一種算法,用于實(shí)現(xiàn)從原始輸入到輸出的端到端控制,根據(jù)當(dāng)前智能體的狀態(tài)和行為,優(yōu)化策略,在完成...