本發(fā)明屬于多智能體,具體涉及一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、多智能體圍捕任務(wù)中最重要的是考慮其具體定義,即多智能體如何體現(xiàn)群體的優(yōu)勢以及圍捕智能體之間的協(xié)作能力。在多智能體圍捕任務(wù)的過程中,圍捕智能體不斷靠近目標智能體時應(yīng)與其他鄰居智能體保持一定的圍捕隊形,圍捕隊形不應(yīng)間隔較大導(dǎo)致圍捕隊形過于松散,也不應(yīng)間隔較小導(dǎo)致圍捕隊形過于緊密,在圍捕智能體協(xié)同運動時在一定范圍內(nèi)距離適中且穩(wěn)定的圍捕隊形最佳。
3、環(huán)境復(fù)雜度主要由環(huán)境中靜態(tài)障礙物多少和分布與圍捕成功條件決定。多智能體圍捕任務(wù)中涉及到的環(huán)境因素較多,包括目標智能體、環(huán)境中靜態(tài)障礙物、其他圍捕智能體等,這就要求圍捕智能體具備適應(yīng)復(fù)雜環(huán)境的能力,并具備強大的規(guī)劃和控制能力。
4、多智能體圍捕的實際場景一般存在著復(fù)雜度高、障礙物多的難題,因此,如何實現(xiàn)復(fù)雜環(huán)境下的多智能體圍捕的合理性和穩(wěn)定性是亟需解決的難題。同時,如何解決多智能體圍捕任務(wù)的圍捕智能體群體協(xié)同性問題,以發(fā)揮每個圍捕智能體的作用提高多智能體圍捕效率,也是多智能體圍捕的難題。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法及系統(tǒng),考慮動態(tài)鄰居智能體勢場力和多智能體圍捕成功條件進行目標智能體的圍捕,實現(xiàn)復(fù)雜環(huán)境下多智能體的高效圍捕。
2、根據(jù)一些實施例,本發(fā)明的第一方案提供了一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,采用如下技術(shù)方案:
3、一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,包括:
4、獲取多智能體的圍捕環(huán)境信息;
5、基于所獲取的圍捕環(huán)境信息,設(shè)置多智能體圍捕成功條件;
6、考慮動態(tài)鄰居智能體勢場和所設(shè)置的多智能體圍捕成功條件,確定圍捕智能體隊形;
7、圍捕智能體在所確定的圍捕智能體隊形中進行目標智能體的圍捕,若當(dāng)前圍捕智能體成功捕獲目標智能體,則基于動態(tài)鄰居智能體勢能進行鄰居圍捕智能體的圍捕,否則繼續(xù)進行目標智能體的圍捕直到成功捕獲目標智能體為止;
8、鄰居圍捕智能體根據(jù)所設(shè)置的多智能體圍捕成功條件進行目標智能體的圍捕;
9、當(dāng)所有的鄰居圍捕智能體均成功圍捕目標智能體時,結(jié)束智能體的圍捕,完成多智能體圍捕。
10、作為進一步的技術(shù)限定,所述圍捕智能體在所確定的圍捕智能體隊形中進行目標智能體的圍捕的過程中,若當(dāng)前圍捕智能體成功捕獲目標智能體,則該圍捕智能體將被處理為障礙物且跟隨目標智能體保持相對位置不變運動,此時,目標智能體的運動線速度損失一半;鄰居圍捕智能體繼續(xù)進行目標智能體的圍捕,擴大剩余圍捕智能體的圍捕成功范圍,完成目標智能體的圍捕。
11、作為進一步的技術(shù)限定,基于所述動態(tài)鄰居智能體勢場所產(chǎn)生的動態(tài)鄰居智能體勢場力指導(dǎo)圍捕智能體運動,形成圍捕智能體之間呈預(yù)設(shè)距離的圍捕隊形,當(dāng)圍捕智能體之間的間距大于預(yù)設(shè)距離時產(chǎn)生引力,當(dāng)圍捕智能體之間的間距小于預(yù)設(shè)距離時產(chǎn)生斥力。
12、作為進一步的技術(shù)限定,所述多智能體圍捕成功條件為:當(dāng)目標智能體進入第一個圍捕智能體的圍捕成功范圍后,目標智能體的運動線速度損失,當(dāng)前圍捕智能體跟隨目標智能體以相同線速度同步移動且當(dāng)前目標智能體被視為跟隨目標智能體移動的障礙物;當(dāng)目標智能體進入其他鄰居智能體的圍捕成功范圍內(nèi)時,本次圍捕任務(wù)成功。
13、作為進一步的技術(shù)限定,在基于動態(tài)鄰居智能體勢能進行鄰居圍捕智能體的圍捕的過程中,依次進行多智能體圍捕的狀態(tài)空間、動作空間和獎勵函數(shù)的設(shè)計。
14、進一步的,圍捕智能體由初始位置出發(fā)躲避障礙物和鄰居智能體,圍捕目標智能體的過程中,在不同狀態(tài)下,基于所獲取的多智能體圍捕環(huán)境信息中的距離信息和角度信息,確定當(dāng)前圍捕智能體與目標智能體的相對位置,完成狀態(tài)空間的設(shè)計;所述動作空間為靜態(tài)障礙物斥力場尺度因子和動態(tài)鄰居智能體勢場力距離參數(shù);所述獎勵函數(shù)至少包括圍捕成功獎勵、障礙物碰撞懲罰、鄰居智能體碰撞懲罰、距離引導(dǎo)獎勵和步數(shù)冗余懲罰。
15、根據(jù)一些實施例,本發(fā)明的第二方案提供了一種基于動態(tài)鄰居智能體勢場的多智能體圍捕系統(tǒng),采用如下技術(shù)方案:
16、一種基于動態(tài)鄰居智能體勢場的多智能體圍捕系統(tǒng),包括:
17、獲取模塊,其被配置為獲取多智能體的圍捕環(huán)境信息;
18、設(shè)置模塊,其被配置為基于所獲取的圍捕環(huán)境信息,設(shè)置多智能體圍捕成功條件;
19、確定模塊,其被配置為考慮動態(tài)鄰居智能體勢場和所設(shè)置的多智能體圍捕成功條件,確定圍捕智能體隊形;
20、圍捕模塊,其被配置為圍捕智能體在所確定的圍捕智能體隊形中進行目標智能體的圍捕,若當(dāng)前圍捕智能體成功捕獲目標智能體,則基于動態(tài)鄰居智能體勢能進行鄰居圍捕智能體的圍捕,否則繼續(xù)進行目標智能體的圍捕直到成功捕獲目標智能體為止;鄰居圍捕智能體根據(jù)所設(shè)置的多智能體圍捕成功條件進行目標智能體的圍捕;當(dāng)所有的鄰居圍捕智能體均成功圍捕目標智能體時,結(jié)束智能體的圍捕,完成多智能體圍捕。
21、根據(jù)一些實施例,本發(fā)明的第三方案提供了一種計算機可讀存儲介質(zhì),采用如下技術(shù)方案:
22、一種計算機可讀存儲介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明第一方案所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法中的步驟。
23、根據(jù)一些實施例,本發(fā)明的第四方案提供了一種電子設(shè)備,采用如下技術(shù)方案:
24、一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并在處理器上運行的程序,所述處理器執(zhí)行所述程序時實現(xiàn)如本發(fā)明第一方案所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法中的步驟。
25、根據(jù)一些實施例,本發(fā)明的第五方案提供了一種計算機程序產(chǎn)品,采用如下技術(shù)方案:
26、一種計算機程序產(chǎn)品,包括軟件代碼,所述軟件代碼中的程序執(zhí)行如本發(fā)明第一方案所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法中的步驟。
27、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
28、本發(fā)明考慮動態(tài)鄰居智能體勢場力和多智能體圍捕成功條件進行目標智能體的圍捕,優(yōu)化多智能體圍捕任務(wù)的圍捕成功條件和目標智能體運動,實現(xiàn)復(fù)雜環(huán)境下多智能體的高效圍捕。
1.一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,包括:
2.如權(quán)利要求1中所述的一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,所述圍捕智能體在所確定的圍捕智能體隊形中進行目標智能體的圍捕的過程中,若當(dāng)前圍捕智能體成功捕獲目標智能體,則該圍捕智能體將被處理為障礙物且跟隨目標智能體保持相對位置不變運動,此時,目標智能體的運動線速度損失一半;鄰居圍捕智能體繼續(xù)進行目標智能體的圍捕,擴大剩余圍捕智能體的圍捕成功范圍,完成目標智能體的圍捕。
3.如權(quán)利要求1中所述的一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,基于所述動態(tài)鄰居智能體勢場所產(chǎn)生的動態(tài)鄰居智能體勢場力指導(dǎo)圍捕智能體運動,形成圍捕智能體之間呈預(yù)設(shè)距離的圍捕隊形,當(dāng)圍捕智能體之間的間距大于預(yù)設(shè)距離時產(chǎn)生引力,當(dāng)圍捕智能體之間的間距小于預(yù)設(shè)距離時產(chǎn)生斥力。
4.如權(quán)利要求1中所述的一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,所述多智能體圍捕成功條件為:當(dāng)目標智能體進入第一個圍捕智能體的圍捕成功范圍后,目標智能體的運動線速度損失,當(dāng)前圍捕智能體跟隨目標智能體以相同線速度同步移動且當(dāng)前目標智能體被視為跟隨目標智能體移動的障礙物;當(dāng)目標智能體進入其他鄰居智能體的圍捕成功范圍內(nèi)時,本次圍捕任務(wù)成功。
5.如權(quán)利要求1中所述的一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,在基于動態(tài)鄰居智能體勢能進行鄰居圍捕智能體的圍捕的過程中,依次進行多智能體圍捕的狀態(tài)空間、動作空間和獎勵函數(shù)的設(shè)計。
6.如權(quán)利要求5中所述的一種基于動態(tài)鄰居智能體勢場的多智能體圍捕方法,其特征在于,圍捕智能體由初始位置出發(fā)躲避障礙物和鄰居智能體,圍捕目標智能體的過程中,在不同狀態(tài)下,基于所獲取的多智能體圍捕環(huán)境信息中的距離信息和角度信息,確定當(dāng)前圍捕智能體與目標智能體的相對位置,完成狀態(tài)空間的設(shè)計;所述動作空間為靜態(tài)障礙物斥力場尺度因子和動態(tài)鄰居智能體勢場力距離參數(shù);所述獎勵函數(shù)至少包括圍捕成功獎勵、障礙物碰撞懲罰、鄰居智能體碰撞懲罰、距離引導(dǎo)獎勵和步數(shù)冗余懲罰。
7.一種基于動態(tài)鄰居智能體勢場的多智能體圍捕系統(tǒng),其特征在于,包括:
8.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)了如權(quán)利要求1-6中任一項所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法的步驟。
9.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)了如權(quán)利要求1-6中任一項所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法的步驟。
10.一種計算機程序產(chǎn)品,包括軟件代碼,其特征在于,所述軟件代碼中的程序執(zhí)行如權(quán)利要求1-6中任一項所述的基于動態(tài)鄰居智能體勢場的多智能體圍捕方法的步驟。