技術(shù)特征:1.一種基于多目標(biāo)深度強(qiáng)化學(xué)習(xí)的數(shù)字孿生體部署方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的數(shù)字孿生體部署方法,其特征在于,所述步驟s2中懲罰系數(shù)在訓(xùn)練過程中動(dòng)態(tài)調(diào)整,具體方法為:
技術(shù)總結(jié)本發(fā)明公開了一種基于多目標(biāo)深度強(qiáng)化學(xué)習(xí)的數(shù)字孿生體部署方法,針對數(shù)字孿生邊緣網(wǎng)絡(luò)進(jìn)行分析,構(gòu)建多目標(biāo)深度強(qiáng)化學(xué)習(xí)模型的狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)函數(shù),在狀態(tài)中引入用戶和智能反射表面的連接關(guān)系,在獎(jiǎng)勵(lì)函數(shù)中引入約束項(xiàng)的懲罰函數(shù),然后對多目標(biāo)深度強(qiáng)化學(xué)習(xí)模型進(jìn)行設(shè)置和訓(xùn)練,實(shí)時(shí)獲取當(dāng)前數(shù)字孿生邊緣網(wǎng)絡(luò)的狀態(tài)信息,采用訓(xùn)練好的多目標(biāo)深度強(qiáng)化學(xué)習(xí)模型確定各個(gè)數(shù)字孿生體部署的目標(biāo)邊緣服務(wù)器。本發(fā)明設(shè)置多個(gè)優(yōu)化目標(biāo),采用多目標(biāo)深度強(qiáng)化學(xué)習(xí)來確定數(shù)字孿生體的部署策略,提高數(shù)字孿生邊緣網(wǎng)絡(luò)的合理性和工作性能。
技術(shù)研發(fā)人員:吳紅海,邢玲,馬華紅,鄧凱凱,吉朋偉,張曉輝,陸曉瑩,趙東,劉亮,傅慧源,陶發(fā)展,謝萍,彭凱,李美玲,王峰,張海平
受保護(hù)的技術(shù)使用者:河南科技大學(xué)
技術(shù)研發(fā)日:技術(shù)公布日:2024/12/19