本發(fā)明涉及移動邊緣計算,特別是涉及一種多無人機輔助移動邊緣計算軌跡優(yōu)化方法、裝置和設備。
背景技術:
1、隨著智能導航和增強現(xiàn)實等應用的普及,計算密集型和延遲敏感型任務越來越多,人們期望享受比以往任何時候都更便捷的生活。移動邊緣計算(mec)通過將計算和存儲資源移動到網(wǎng)絡邊緣,可通過部署基站、接入點等設備來增強用戶設備執(zhí)行計算密集型任務的能力,顯著減少傳輸和處理延遲,節(jié)省移動設備的能源,并保護隱私和安全。然而,隨著5g與核心網(wǎng)的進一步融合,mec節(jié)點進一步高度分布,固定基站的存在導致了mec在應對災難時的響應能力較差,并且部署方面存在一定的局限性。無人機具有高度的靈活性、機動性,可以有效解決mec固定基站靈活性受限和災難響應能力差等問題。由于有限的計算和能量資源,一架無人機僅能實現(xiàn)有限的區(qū)域覆蓋以及有限的任務卸載能力,多架無人機可以共同提供更強的計算能力以及更大范圍的區(qū)域覆蓋,還可以根據(jù)需求靈活移動和調(diào)整位置,在不同區(qū)域提供服務,因此多架無人機輔助的移動邊緣計算將更符合實際情況。此外,由于無人機需要從不同的起飛點飛到特定區(qū)域提供卸載幫助,不同的無人機軌跡可能導致不同的信道質(zhì)量,從而導致不同的通信延遲和能耗。因此,有必要考慮無人機的軌跡優(yōu)化問題,以獲得最小的執(zhí)行延遲。在機載資源有限的情況下,無人機的計算任務分配量也會影響計算延遲,如何合理地進行資源分配,使緊急程度較高的任務可以盡快地執(zhí)行是至關重要的。通過聯(lián)合優(yōu)化軌跡和用戶關聯(lián)可以使系統(tǒng)更加靈活地響應終端設備的計算請求,提高系統(tǒng)的適應性和魯棒性。
技術實現(xiàn)思路
1、基于此,有必要針對上述技術問題,提供一種多無人機輔助移動邊緣計算軌跡優(yōu)化方法、裝置和設備,使得用戶設備所提出的任務請求可以在最短的時間內(nèi)完成并且有最小的響應失敗率。
2、一種多無人機輔助移動邊緣計算軌跡優(yōu)化方法,所述方法包括:
3、構建用戶關聯(lián)模型;所述用戶關聯(lián)模型是指無人機和用戶設備要卸載的計算任務之間的對應關系;在所述用戶關聯(lián)模型中限定在每個時隙中:每架無人機最多接受其覆蓋范圍內(nèi)的預設數(shù)量的計算任務、每個計算任務只能由無人機或者用戶設備執(zhí)行,以及每個用戶設備最多產(chǎn)生一個計算任務請求;
4、構建無人機移動模型;無人機移動模型限制無人機和用戶設備在一個預設區(qū)域內(nèi)以及任意兩架無人機之間的最小距離;
5、構建任務計算模型;任務計算模型用于計算每個時隙中各個計算任務的任務計算時間;
6、構建無人機能耗模型;無人機能耗模型用于限制每架無人機在整個服務周期內(nèi)的總能耗;
7、基于用戶關聯(lián)模型、無人機移動模型、構建任務計算模型以及無人機能耗模型,構建無人機的深度強化學習模型,具體為:將無人機的自身狀態(tài)、當前所執(zhí)行計算任務的信息以及其覆蓋范圍內(nèi)的其他無人機與其之間的相對距離定義為局部觀測;其中,無人機的自身狀態(tài)包括:無人機的位置、剩余能量以及空閑資源;將預設區(qū)域內(nèi)的環(huán)境中所有無人機的局部觀測的聚合信息定義為全局觀測;將無人機在單位時隙中的飛行角度和飛行距離定義為動作;根據(jù)任務計算總時間、計算任務請求響應失敗率以及無人機移動模型中的限制來構建獎勵函數(shù);任務請求響應失敗是指任務計算時間超過相應計算任務請求的最大容忍時間;
8、以最大化獎勵函數(shù)為目標,對無人機移動軌跡進行優(yōu)化。
9、一種多無人機輔助移動邊緣計算軌跡優(yōu)化裝置,所述裝置包括:
10、用戶關聯(lián)模型構建模塊,用于構建用戶關聯(lián)模型;用戶關聯(lián)模型是指無人機和用戶設備要卸載的計算任務之間的對應關系;在用戶關聯(lián)模型中限定在每個時隙中:每架無人機最多接受其覆蓋范圍內(nèi)的預設數(shù)量的計算任務、每個計算任務只能由無人機或者用戶設備執(zhí)行,以及每個用戶設備最多產(chǎn)生一個計算任務請求;
11、無人機移動模型構建模塊,用于構建無人機移動模型;無人機移動模型限制無人機和用戶設備在一個預設區(qū)域內(nèi)以及任意兩架無人機之間的最小距離;
12、任務計算模型構建模塊,用于構建任務計算模型;任務計算模型用于計算每個時隙中各個計算任務的任務計算時間;
13、無人機能耗模型構建模塊,用于構建無人機能耗模型;無人機能耗模型用于限制每架無人機在整個服務周期內(nèi)的總能耗;
14、深度強化學習模型構建模塊,用于基于用戶關聯(lián)模型、無人機移動模型、構建任務計算模型以及無人機能耗模型,構建無人機的深度強化學習模型,具體為:將無人機的自身狀態(tài)、當前所執(zhí)行計算任務的信息以及其覆蓋范圍內(nèi)的其他無人機與其之間的相對距離定義為局部觀測;其中,無人機的自身狀態(tài)包括:無人機的位置、剩余能量以及空閑資源;將預設區(qū)域內(nèi)的環(huán)境中所有無人機的局部觀測的聚合信息定義為全局觀測;將無人機在單位時隙中的飛行角度和飛行距離定義為動作;根據(jù)任務計算總時間、計算任務請求響應失敗率以及無人機移動模型中的限制來構建獎勵函數(shù);任務請求響應失敗是指任務計算時間超過相應計算任務請求的最大容忍時間;
15、無人機移動軌跡優(yōu)化模塊,用于以最大化獎勵函數(shù)為目標,對無人機移動軌跡進行優(yōu)化。
16、一種計算機設備,包括存儲器和處理器,存儲器存儲有計算機程序,處理器執(zhí)行計算機程序時實現(xiàn)以下步驟:
17、構建用戶關聯(lián)模型;所述用戶關聯(lián)模型是指無人機和用戶設備要卸載的計算任務之間的對應關系;在所述用戶關聯(lián)模型中限定在每個時隙中:每架無人機最多接受其覆蓋范圍內(nèi)的預設數(shù)量的計算任務、每個計算任務只能由無人機或者用戶設備執(zhí)行,以及每個用戶設備最多產(chǎn)生一個計算任務請求;
18、構建無人機移動模型;無人機移動模型限制無人機和用戶設備在一個預設區(qū)域內(nèi)以及任意兩架無人機之間的最小距離;
19、構建任務計算模型;任務計算模型用于計算每個時隙中各個計算任務的任務計算時間;
20、構建無人機能耗模型;無人機能耗模型用于限制每架無人機在整個服務周期內(nèi)的總能耗;
21、基于用戶關聯(lián)模型、無人機移動模型、構建任務計算模型以及無人機能耗模型,構建無人機的深度強化學習模型,具體為:將無人機的自身狀態(tài)、當前所執(zhí)行計算任務的信息以及其覆蓋范圍內(nèi)的其他無人機與其之間的相對距離定義為局部觀測;其中,無人機的自身狀態(tài)包括:無人機的位置、剩余能量以及空閑資源;將預設區(qū)域內(nèi)的環(huán)境中所有無人機的局部觀測的聚合信息定義為全局觀測;將無人機在單位時隙中的飛行角度和飛行距離定義為動作;根據(jù)任務計算總時間、計算任務請求響應失敗率以及無人機移動模型中的限制來構建獎勵函數(shù);任務請求響應失敗是指任務計算時間超過相應計算任務請求的最大容忍時間;
22、以最大化獎勵函數(shù)為目標,對無人機移動軌跡進行優(yōu)化。
23、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
24、構建用戶關聯(lián)模型;所述用戶關聯(lián)模型是指無人機和用戶設備要卸載的計算任務之間的對應關系;在所述用戶關聯(lián)模型中限定在每個時隙中:每架無人機最多接受其覆蓋范圍內(nèi)的預設數(shù)量的計算任務、每個計算任務只能由無人機或者用戶設備執(zhí)行,以及每個用戶設備最多產(chǎn)生一個計算任務請求;
25、構建無人機移動模型;無人機移動模型限制無人機和用戶設備在一個預設區(qū)域內(nèi)以及任意兩架無人機之間的最小距離;
26、構建任務計算模型;任務計算模型用于計算每個時隙中各個計算任務的任務計算時間;
27、構建無人機能耗模型;無人機能耗模型用于限制每架無人機在整個服務周期內(nèi)的總能耗;
28、基于用戶關聯(lián)模型、無人機移動模型、構建任務計算模型以及無人機能耗模型,構建無人機的深度強化學習模型,具體為:將無人機的自身狀態(tài)、當前所執(zhí)行計算任務的信息以及其覆蓋范圍內(nèi)的其他無人機與其之間的相對距離定義為局部觀測;其中,無人機的自身狀態(tài)包括:無人機的位置、剩余能量以及空閑資源;將預設區(qū)域內(nèi)的環(huán)境中所有無人機的局部觀測的聚合信息定義為全局觀測;將無人機在單位時隙中的飛行角度和飛行距離定義為動作;根據(jù)任務計算總時間、計算任務請求響應失敗率以及無人機移動模型中的限制來構建獎勵函數(shù);任務請求響應失敗是指任務計算時間超過相應計算任務請求的最大容忍時間;
29、以最大化獎勵函數(shù)為目標,對無人機移動軌跡進行優(yōu)化。
30、上述多無人機輔助移動邊緣計算軌跡優(yōu)化方法、裝置和設備,首先構建多個模型,具體為:用戶關聯(lián)模型,用于定義無人機和計算任務之間的對應關系;無人機移動模型,用于約束無人機和用戶位置所處位置以及避免無人機相撞;任務計算模型,用于計算任務執(zhí)行時間;無人機能耗模型,用于約束無人機能耗。接著,在上述模型的基礎上,構建無人機的深度強化學習模型,并分別定義局部觀測、全局觀測、動作、獎勵等參數(shù)的含義,其中,根據(jù)無人機的移動角度和距離定義無人機的動作,根據(jù)任務執(zhí)行總時間和任務響應失敗率等定義獎勵函數(shù),最后以最大化獎勵函數(shù)為目的,對無人機的移動軌跡進行優(yōu)化。采用本方法能夠在不獲取精確全局狀態(tài)信息的情況下,通過對無人機的移動軌跡和用戶關聯(lián)進行聯(lián)合優(yōu)化,使用戶設備所提出的任務請求可以在最短的時間內(nèi)完成并且有最小的響應失敗率,即能夠找到具有最小任務完成時間和任務請求失敗率的任務卸載決策和移動軌跡,并且該效果具有一定的穩(wěn)定性。