無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法和裝置

文檔序號：40405663發(fā)布日期：2024-12-20 12:29閱讀：20來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

本技術(shù)涉及無人機(jī)自主決策，特別是涉及一種無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法和裝置。

背景技術(shù)：

1、隨著無人機(jī)技術(shù)的發(fā)展，反制無人機(jī)技術(shù)的發(fā)展也被提上日程，本研究以無人機(jī)多目標(biāo)任務(wù)決策為任務(wù)場景，當(dāng)有多個無人機(jī)同時執(zhí)行任務(wù)時，無人機(jī)集群任務(wù)完成可以明顯提高任務(wù)執(zhí)行的效率，然而在多任務(wù)目標(biāo)場景下，無人機(jī)集群完成任務(wù)的效率會明顯降低，目前，一種做法是無人機(jī)集群通過決策分為多個無人機(jī)子集群完成，然而，目前常規(guī)技術(shù)是控制中心與無人機(jī)集群進(jìn)行通信交互，通過下發(fā)無人機(jī)集群的決策指令，進(jìn)行任務(wù)執(zhí)行。這種方式失去通信交互后則無法實現(xiàn)，目前也有基于智能體的無人機(jī)集群自主決策，但是對于單個無人機(jī)，其決策較為單一，無法同時應(yīng)對多個任務(wù)目標(biāo)執(zhí)行的復(fù)雜情況。

技術(shù)實現(xiàn)思路

1、基于此，有必要針對上述技術(shù)問題，提供一種能夠根據(jù)不同任務(wù)難度，自主切換無人機(jī)狀態(tài)并靈活輸出決策的無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法和裝置。

2、一種無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法，所述方法包括：

3、構(gòu)建無人機(jī)集群中無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)以及博弈決策神經(jīng)網(wǎng)絡(luò)；所述分布式?jīng)Q策有限狀態(tài)機(jī)中所述無人機(jī)的狀態(tài)包括：決策保持者、正常決策者、糾結(jié)者以及迷失者；

4、在當(dāng)前決策輪次，根據(jù)無人機(jī)存儲的上一決策輪次存儲的決策數(shù)據(jù)以及當(dāng)前獲取的實時數(shù)據(jù)，對所述博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行實時參數(shù)調(diào)整；

5、設(shè)置所述分布式?jīng)Q策有限狀態(tài)機(jī)中狀態(tài)跳轉(zhuǎn)規(guī)則；所述狀態(tài)跳轉(zhuǎn)規(guī)則包括：若無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)的狀態(tài)為正常決策者，判斷無人機(jī)與任意任務(wù)目標(biāo)的距離均大于無人機(jī)決策距離閾值，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者；若判斷無人機(jī)短時決策跳變大于無人機(jī)短時決策記憶容量乘以無人機(jī)短時決策容忍跳變率，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為糾結(jié)者；跳轉(zhuǎn)為決策保持者的無人機(jī)若離任意任務(wù)目標(biāo)的距離小于決策距離閾值，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者，處于決策保持者的無人機(jī)若當(dāng)前迷失者狀態(tài)位為1，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離任意任務(wù)目標(biāo)的距離大于決策距離閾值，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離所有任務(wù)目標(biāo)的距離均變大或者變小，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為迷失者的無人機(jī)若所統(tǒng)計步數(shù)達(dá)到閾值，則迷失者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者；

6、處于所述正常決策者和所述糾結(jié)者狀態(tài)的無人機(jī)通過實時調(diào)整參數(shù)后的博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行決策輸出，處于所述迷失者的無人機(jī)通過任務(wù)目標(biāo)數(shù)量和預(yù)設(shè)距離內(nèi)無人機(jī)數(shù)量的比較關(guān)系，確定迷失者的最優(yōu)任務(wù)目標(biāo)作為決策輸出，處于所述決策保持者的無人機(jī)保持上一決策輪次的決策。

7、在其中一個實施例中，還包括：當(dāng)處于正常決策者的無人機(jī)同時滿足糾結(jié)者和決策保持者的跳轉(zhuǎn)條件，若正常決策者成為糾結(jié)者之后滿足迷失者條件則優(yōu)先跳轉(zhuǎn)糾結(jié)者；若正常決策者成為糾結(jié)者之后不滿足迷失者條件則優(yōu)先跳轉(zhuǎn)決策保持者。

8、在其中一個實施例中，還包括：無人機(jī)的狀態(tài)在正常決策者和糾結(jié)者狀態(tài)下，若糾結(jié)者在同時滿足迷失者和決策保持者的跳轉(zhuǎn)條件，則優(yōu)先進(jìn)入迷失者狀態(tài)，若不滿足迷失者狀態(tài)條件則成為決策保持者，正常決策者滿足決策保持者的進(jìn)入條件則直接成為決策保持者。

9、在其中一個實施例中，還包括：設(shè)置決策保持標(biāo)志位、糾結(jié)者標(biāo)志位以及迷失者標(biāo)志位；當(dāng)無人機(jī)的狀態(tài)處于決策保持者時，所述決策保持標(biāo)志位置1，否則為0；當(dāng)無人機(jī)的狀態(tài)處于糾結(jié)者時，所述糾結(jié)者標(biāo)志位置1，否則為0；當(dāng)無人機(jī)的狀態(tài)處于迷失者時，所述迷失者標(biāo)志位置1，否則為0。

10、在其中一個實施例中，還包括：若處于所述迷失者的無人機(jī)預(yù)設(shè)距離內(nèi)無人機(jī)數(shù)量等于任務(wù)目標(biāo)數(shù)量，則處于所述迷失者的無人機(jī)選擇距離最近的任務(wù)目標(biāo)為最優(yōu)任務(wù)目標(biāo)作為決策輸出，否則處于所述迷失者的無人機(jī)選擇差額最小的任務(wù)目標(biāo)為最優(yōu)任務(wù)目標(biāo)作為決策輸出。

11、在其中一個實施例中，還包括：給每個決策變量分配決策變量權(quán)重，以及根據(jù)所述決策變量權(quán)重構(gòu)建博弈決策神經(jīng)網(wǎng)絡(luò)為：

12、;

13、其中，為博弈決策神經(jīng)網(wǎng)絡(luò)，表示網(wǎng)絡(luò)系數(shù)，決策變量權(quán)重根據(jù)網(wǎng)絡(luò)系數(shù)歸一化得到，表示網(wǎng)絡(luò)參數(shù)；

14、在當(dāng)前決策輪次，將無人機(jī)存儲的上一決策輪次存儲的決策數(shù)據(jù)以及當(dāng)前獲取的實時數(shù)據(jù)輸入所述博弈決策神經(jīng)網(wǎng)絡(luò)，以此對所述博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行實時參數(shù)調(diào)整。

15、在其中一個實施例中，還包括：根據(jù)所述決策變量的任意兩個決策變量計算得到一組決策變量權(quán)重，然后根據(jù)計算得到的一組決策變量權(quán)重和另一組決策變量權(quán)重進(jìn)行拓展，得到第三個決策變量權(quán)重，以此計算得到所有決策變量權(quán)重。

16、一種無人機(jī)集群多目標(biāo)的分布式?jīng)Q策裝置，所述裝置包括：

17、框架構(gòu)建模塊，用于構(gòu)建無人機(jī)集群中無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)以及博弈決策神經(jīng)網(wǎng)絡(luò)；所述分布式?jīng)Q策有限狀態(tài)機(jī)中所述無人機(jī)的狀態(tài)包括：決策保持者、正常決策者、糾結(jié)者以及迷失者；

18、參數(shù)調(diào)整模塊，用于在當(dāng)前決策輪次，根據(jù)無人機(jī)存儲的上一決策輪次存儲的決策數(shù)據(jù)以及當(dāng)前獲取的實時數(shù)據(jù)，對所述博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行實時參數(shù)調(diào)整；

19、狀態(tài)跳轉(zhuǎn)邏輯設(shè)置模塊，用于設(shè)置所述分布式?jīng)Q策有限狀態(tài)機(jī)中狀態(tài)跳轉(zhuǎn)規(guī)則；所述狀態(tài)跳轉(zhuǎn)規(guī)則包括：若無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)的狀態(tài)為正常決策者，判斷無人機(jī)與任意任務(wù)目標(biāo)的距離均大于無人機(jī)決策距離閾值，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者；若判斷無人機(jī)短時決策跳變大于無人機(jī)短時決策記憶容量乘以無人機(jī)短時決策容忍跳變率，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為糾結(jié)者；跳轉(zhuǎn)為決策保持者的無人機(jī)若離任意任務(wù)目標(biāo)的距離小于決策距離閾值，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者，處于決策保持者的無人機(jī)若當(dāng)前迷失者狀態(tài)位為1，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離任意任務(wù)目標(biāo)的距離大于決策距離閾值，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離所有任務(wù)目標(biāo)的距離均變大或者變小，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為迷失者的無人機(jī)若所統(tǒng)計步數(shù)達(dá)到閾值，則迷失者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者；

20、決策輸出模塊，用于處于所述正常決策者和所述糾結(jié)者狀態(tài)的無人機(jī)通過實時調(diào)整參數(shù)后的博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行決策輸出，處于所述迷失者的無人機(jī)通過任務(wù)目標(biāo)數(shù)量和預(yù)設(shè)距離內(nèi)無人機(jī)數(shù)量的比較關(guān)系，確定迷失者的最優(yōu)任務(wù)目標(biāo)作為決策輸出，處于所述決策保持者的無人機(jī)保持上一決策輪次的決策。

21、一種計算機(jī)設(shè)備，包括存儲器和處理器，所述存儲器存儲有計算機(jī)程序，所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)以下步驟：

22、構(gòu)建無人機(jī)集群中無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)以及博弈決策神經(jīng)網(wǎng)絡(luò)；所述分布式?jīng)Q策有限狀態(tài)機(jī)中所述無人機(jī)的狀態(tài)包括：決策保持者、正常決策者、糾結(jié)者以及迷失者；

23、在當(dāng)前決策輪次，根據(jù)無人機(jī)存儲的上一決策輪次存儲的決策數(shù)據(jù)以及當(dāng)前獲取的實時數(shù)據(jù)，對所述博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行實時參數(shù)調(diào)整；

24、設(shè)置所述分布式?jīng)Q策有限狀態(tài)機(jī)中狀態(tài)跳轉(zhuǎn)規(guī)則；所述狀態(tài)跳轉(zhuǎn)規(guī)則包括：若無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)的狀態(tài)為正常決策者，判斷無人機(jī)與任意任務(wù)目標(biāo)的距離均大于無人機(jī)決策距離閾值，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者；若判斷無人機(jī)短時決策跳變大于無人機(jī)短時決策記憶容量乘以無人機(jī)短時決策容忍跳變率，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為糾結(jié)者；跳轉(zhuǎn)為決策保持者的無人機(jī)若離任意任務(wù)目標(biāo)的距離小于決策距離閾值，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者，處于決策保持者的無人機(jī)若當(dāng)前迷失者狀態(tài)位為1，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離任意任務(wù)目標(biāo)的距離大于決策距離閾值，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離所有任務(wù)目標(biāo)的距離均變大或者變小，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為迷失者的無人機(jī)若所統(tǒng)計步數(shù)達(dá)到閾值，則迷失者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者；

25、處于所述正常決策者和所述糾結(jié)者狀態(tài)的無人機(jī)通過實時調(diào)整參數(shù)后的博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行決策輸出，處于所述迷失者的無人機(jī)通過任務(wù)目標(biāo)數(shù)量和預(yù)設(shè)距離內(nèi)無人機(jī)數(shù)量的比較關(guān)系，確定迷失者的最優(yōu)任務(wù)目標(biāo)作為決策輸出，處于所述決策保持者的無人機(jī)保持上一決策輪次的決策。

26、一種計算機(jī)可讀存儲介質(zhì)，其上存儲有計算機(jī)程序，所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)以下步驟：

27、構(gòu)建無人機(jī)集群中無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)以及博弈決策神經(jīng)網(wǎng)絡(luò)；所述分布式?jīng)Q策有限狀態(tài)機(jī)中所述無人機(jī)的狀態(tài)包括：決策保持者、正常決策者、糾結(jié)者以及迷失者；

28、在當(dāng)前決策輪次，根據(jù)無人機(jī)存儲的上一決策輪次存儲的決策數(shù)據(jù)以及當(dāng)前獲取的實時數(shù)據(jù)，對所述博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行實時參數(shù)調(diào)整；

29、設(shè)置所述分布式?jīng)Q策有限狀態(tài)機(jī)中狀態(tài)跳轉(zhuǎn)規(guī)則；所述狀態(tài)跳轉(zhuǎn)規(guī)則包括：若無人機(jī)的分布式?jīng)Q策有限狀態(tài)機(jī)的狀態(tài)為正常決策者，判斷無人機(jī)與任意任務(wù)目標(biāo)的距離均大于無人機(jī)決策距離閾值，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者；若判斷無人機(jī)短時決策跳變大于無人機(jī)短時決策記憶容量乘以無人機(jī)短時決策容忍跳變率，則判斷無人機(jī)的狀態(tài)跳轉(zhuǎn)為糾結(jié)者；跳轉(zhuǎn)為決策保持者的無人機(jī)若離任意任務(wù)目標(biāo)的距離小于決策距離閾值，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者，處于決策保持者的無人機(jī)若當(dāng)前迷失者狀態(tài)位為1，則決策保持者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離任意任務(wù)目標(biāo)的距離大于決策距離閾值，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為決策保持者，跳轉(zhuǎn)為糾結(jié)者的無人機(jī)若離所有任務(wù)目標(biāo)的距離均變大或者變小，則糾結(jié)者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為迷失者，跳轉(zhuǎn)為迷失者的無人機(jī)若所統(tǒng)計步數(shù)達(dá)到閾值，則迷失者的無人機(jī)的狀態(tài)跳轉(zhuǎn)為正常決策者；

30、處于所述正常決策者和所述糾結(jié)者狀態(tài)的無人機(jī)通過實時調(diào)整參數(shù)后的博弈決策神經(jīng)網(wǎng)絡(luò)進(jìn)行決策輸出，處于所述迷失者的無人機(jī)通過任務(wù)目標(biāo)數(shù)量和預(yù)設(shè)距離內(nèi)無人機(jī)數(shù)量的比較關(guān)系，確定迷失者的最優(yōu)任務(wù)目標(biāo)作為決策輸出，處于所述決策保持者的無人機(jī)保持上一決策輪次的決策。

31、上述無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)，根據(jù)無人機(jī)可能會面臨的不同目標(biāo)決策場景設(shè)計了分布式有限狀態(tài)機(jī)，設(shè)定了有限狀態(tài)機(jī)的狀態(tài)和跳轉(zhuǎn)條件。另外，構(gòu)建了分布式博弈決策神經(jīng)網(wǎng)絡(luò)，實現(xiàn)無人機(jī)局部信息下考慮不同決策變量時候的最優(yōu)目標(biāo)選擇。該網(wǎng)絡(luò)實現(xiàn)了通過無人機(jī)的環(huán)境信息歷史數(shù)據(jù)以及實時觀測量，實現(xiàn)局部信息下各個決策變量權(quán)重系數(shù)的自適應(yīng)調(diào)整。即無人機(jī)即飛即調(diào)參。本發(fā)明實現(xiàn)了在無通信下無人機(jī)依靠周圍局部信息下的自主決策選擇任務(wù)目標(biāo)，能夠靈活應(yīng)用于多種無人機(jī)決策任務(wù)目標(biāo)選擇任務(wù)場景，具有實機(jī)部署的實用性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：朱先強(qiáng),王琛,陳星璇,朱承,張千楨,韓思寧,李楊樺,丁兆云,張勝
技術(shù)所有人：中國人民解放軍國防科技大學(xué)
我是此專利的發(fā)明人

上一篇：一種高強(qiáng)度節(jié)能聯(lián)板的制作方法
上一篇：一種超聲波振動位移傳感器的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、唐老師：1.高效節(jié)能裝備 2.流動穩(wěn)定性 3.汽車流場分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
3、王老師：電子信息處理、先進(jìn)檢測方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

無人機(jī)集群多目標(biāo)的分布式?jīng)Q策方法和裝置