技術特征:1.一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,其特征在于,具體步驟如下:
2.如權利要求1所述的一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,其特征在于,所述步驟一中,感知節(jié)點周期性地感知輸電塔的健康狀態(tài),并將感知數(shù)據(jù)交付給匯聚節(jié)點;匯聚節(jié)點收集輸電塔健康狀態(tài)數(shù)據(jù)后判斷輸電塔是否正常運行,是否需要人工維修。
3.如權利要求1所述的一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,其特征在于,所述步驟二中,觀測狀態(tài)st公式為:
4.如權利要求1所述的一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,其特征在于,所述步驟四中,系統(tǒng)最小剩余能量為:
5.如權利要求1所述的一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,其特征在于,所述步驟七中,每個感知節(jié)點獲取的信息包括:數(shù)據(jù)包緩存非空時,與鄰居節(jié)點交換的數(shù)據(jù),能量緩存信息,信道狀態(tài)、輸電線電磁干擾情況、自身剩余能量、自身數(shù)據(jù)緩存、鄰居節(jié)點剩余能量與鄰居數(shù)據(jù)緩存。
技術總結本發(fā)明公開了一種基于強化學習的高能效多跳與功率控制聯(lián)合方法,屬于輸電線物聯(lián)網(wǎng)領域;具體為:搭建鏈路型無線傳感網(wǎng)絡架構,各感知節(jié)點在當前時隙分別獲取自身以及鄰居的觀測狀態(tài)s<subgt;t</subgt;,然后,選擇包含下一跳節(jié)點以及發(fā)送功率等級的動作a<subgt;t</subgt;;同時執(zhí)行與環(huán)境進行交互,得到全局效用函數(shù)r<subgt;t</subgt;;并在當前時隙結束,保留四元組<s<subgt;t</subgt;,a<subgt;t</subgt;,r<subgt;t</subgt;,s<subgt;t+1</subgt;>;接著,當前回合下,該網(wǎng)絡利用記憶的每個時隙下的N個四元組作為訓練集,對多跳與功率控制模型進行訓練,更新該模型的參數(shù)后部署在傳感器節(jié)點上,每個感知節(jié)點向選擇的下一跳節(jié)點以選定的發(fā)射功率發(fā)送數(shù)據(jù)包。本發(fā)明能夠根據(jù)環(huán)境動態(tài)變化自適應地選擇傳輸路徑和發(fā)射功率,提升系統(tǒng)能效的智能調(diào)度與資源分配。
技術研發(fā)人員:王鑫,梁鋼,崔力民,解鵬,張志軍,李慶,李陽,姚永波,蔡子安,張振杰
受保護的技術使用者:國網(wǎng)新疆電力有限公司信息通信公司
技術研發(fā)日:技術公布日:2024/12/19