技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于深度帶權(quán)雙Q學(xué)習(xí)的大范圍監(jiān)控方法,首先,提供Q值表包括QA表和QB表的機(jī)器人,其次,不明物體進(jìn)入大范圍空間以觸發(fā)機(jī)器人,再次,機(jī)器人感知當(dāng)前狀態(tài)s,判斷當(dāng)前狀態(tài)s是否為目標(biāo)狀態(tài),如是,則機(jī)器人到達(dá)下一狀態(tài)并監(jiān)控不明物體,如不是,機(jī)器人到下一狀態(tài),機(jī)器人根據(jù)下一狀態(tài)得到獎(jiǎng)賞值,機(jī)器人等概率的選擇更新QA值或QB值,然后更新Q值,知道收斂得到一個(gè)最優(yōu)監(jiān)控策略。本發(fā)明不但解決監(jiān)控范圍有限和攝像頭容量有限的問(wèn)題,而且不需考慮多臺(tái)攝像頭同步的問(wèn)題,降低了成本。本發(fā)明還公開(kāi)了一種基于深度帶權(quán)雙Q學(xué)習(xí)的大范圍監(jiān)控機(jī)器人。
技術(shù)研發(fā)人員:章宗長(zhǎng);潘致遠(yuǎn);王輝
受保護(hù)的技術(shù)使用者:蘇州大學(xué)
技術(shù)研發(fā)日:2017.05.11
技術(shù)公布日:2017.10.24