基于Transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)

文檔序號(hào)：40372894發(fā)布日期：2024-12-20 11:55閱讀：5來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

基于Transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)

本發(fā)明屬于通信對(duì)抗，特別是一種基于transformer(全自注意力網(wǎng)絡(luò))和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)。

背景技術(shù)：

1、無線通信在軍事領(lǐng)域的情報(bào)傳遞、戰(zhàn)場(chǎng)指揮等多個(gè)方面發(fā)揮了重要作用，如何在作戰(zhàn)時(shí)干擾敵方通信對(duì)于取得戰(zhàn)場(chǎng)勝利有著舉足輕重的影響。但隨著跳頻通信、直接擴(kuò)頻通信、自適應(yīng)技術(shù)和抗干擾通信技術(shù)的發(fā)展，特別是認(rèn)知無線電技術(shù)的使用，干擾敵方通信變得愈加困難。

2、對(duì)于這種情況，一種簡(jiǎn)單的方法是使用大功率噪聲對(duì)頻段進(jìn)行壓制干擾。但這種干擾方法不僅會(huì)消耗大量能量，還會(huì)損害己方通信。在現(xiàn)實(shí)環(huán)境中，己方需要進(jìn)行實(shí)時(shí)、高質(zhì)量通信，可用于干擾的能量也有限。因此，找到對(duì)敵方通信的低功耗、精確、智能、自適應(yīng)干擾策略已經(jīng)迫在眉睫。

3、傳統(tǒng)的干擾方法基于博弈論，最優(yōu)化理論等理論技術(shù)尋找最優(yōu)參數(shù)進(jìn)行干擾，但這些研究依賴于通信方和環(huán)境的先驗(yàn)信息。在缺乏先驗(yàn)信息的場(chǎng)景中，這些理論并不適用。目前，更多學(xué)者使用強(qiáng)化學(xué)習(xí)來學(xué)習(xí)通信干擾策略。例如，有學(xué)者提出了基于多臂老虎機(jī)框架的干擾強(qiáng)盜算法(gb)，能夠找到最優(yōu)的物理層參數(shù)進(jìn)行攻擊。還有學(xué)者提出使用正交分解來實(shí)現(xiàn)不同的干擾樣式，并在訓(xùn)練過程中不斷優(yōu)化干擾動(dòng)作選擇區(qū)域的智能干擾算法(ib)。但這些干擾方法仍存在以下缺陷：

4、(1)研究對(duì)象局限于bpsk和qpsk，16qam等調(diào)制樣式，因此通過學(xué)習(xí)得到的干擾策略很可能不是最優(yōu)的；

5、(2)未考慮干擾方功率消耗問題，當(dāng)干擾方能夠發(fā)射的功率較小時(shí)會(huì)對(duì)干擾效果產(chǎn)生影響。

6、(3)基于強(qiáng)化學(xué)習(xí)的干擾方法只能針對(duì)一種狀態(tài)進(jìn)行訓(xùn)練，當(dāng)敵方改變調(diào)制信號(hào)時(shí)，需要重新尋找最佳干擾參數(shù)，該類算法并不適用于實(shí)際中快速變化的環(huán)境。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)，解決目前通信干擾技術(shù)只能對(duì)少數(shù)調(diào)制樣式進(jìn)行干擾，無法依據(jù)環(huán)境改變智能地調(diào)整干擾策略的問題。

2、實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為：一種基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，包括以下步驟：

3、步驟1、建立通信干擾系統(tǒng)模型，確定通信干擾流程，并確定需要被干擾的通信方調(diào)制樣式和干擾方采用的干擾調(diào)制樣式；

4、步驟2、采用深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)干擾決策，選用全自注意力網(wǎng)絡(luò)即transformer作為深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)，ddqn作為深度學(xué)習(xí)算法；

5、步驟3、依據(jù)通信信號(hào)和干擾信號(hào)特點(diǎn)，定義深度強(qiáng)化學(xué)習(xí)所需的狀態(tài)和動(dòng)作空間；

6、步驟4、依據(jù)干擾效果和干擾信號(hào)功耗設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)；

7、步驟5、構(gòu)建基于transformer?encoder的q網(wǎng)絡(luò)，使用1層transformer?encoder和2層fc構(gòu)成q網(wǎng)絡(luò)，其中encoder表示編碼器，fc表示全連接層；

8、步驟6、在開始訓(xùn)練q網(wǎng)絡(luò)前，為每一通信調(diào)制樣式建立無效干擾列表，用于記錄干擾無效的干擾調(diào)制樣式；

9、步驟7、基于ddqn對(duì)q網(wǎng)絡(luò)進(jìn)行訓(xùn)練，每一輪隨機(jī)選取一個(gè)狀態(tài)進(jìn)行訓(xùn)練，直到達(dá)到指定的訓(xùn)練輪數(shù)；

10、步驟8、采用訓(xùn)練好的q網(wǎng)絡(luò)進(jìn)行認(rèn)知通信干擾。

11、一種基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾系統(tǒng)，該系統(tǒng)用于實(shí)現(xiàn)所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，所述系統(tǒng)包括通信干擾系統(tǒng)模型構(gòu)建模塊、干擾決策模塊、狀態(tài)和動(dòng)作空間定義模塊、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)模塊、網(wǎng)絡(luò)構(gòu)建模塊、無效干擾列表建立模塊、訓(xùn)練模塊和通信干擾模塊，其中：

12、通信干擾系統(tǒng)模型構(gòu)建模塊，建立通信干擾系統(tǒng)模型，確定通信干擾流程，并確定需要被干擾的通信方調(diào)制樣式和干擾方采用的干擾調(diào)制樣式；

13、干擾決策模塊，采用深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)干擾決策，選用全自注意力網(wǎng)絡(luò)即transformer作為深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)，ddqn作為深度學(xué)習(xí)算法；

14、狀態(tài)和動(dòng)作空間定義模塊，依據(jù)通信信號(hào)和干擾信號(hào)特點(diǎn)，定義深度強(qiáng)化學(xué)習(xí)所需的狀態(tài)和動(dòng)作空間；

15、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)模塊，依據(jù)干擾效果和干擾信號(hào)功耗設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)；

16、網(wǎng)絡(luò)構(gòu)建模塊，構(gòu)建基于transformer?encoder的q網(wǎng)絡(luò)，使用1層transformerencoder和2層fc構(gòu)成q網(wǎng)絡(luò)，其中encoder表示編碼器，fc表示全連接層；

17、無效干擾列表建立模塊，在開始訓(xùn)練q網(wǎng)絡(luò)前，為每一通信調(diào)制樣式建立無效干擾列表，用于記錄干擾無效的干擾調(diào)制樣式；

18、訓(xùn)練模塊，基于ddqn對(duì)q網(wǎng)絡(luò)進(jìn)行訓(xùn)練，每一輪隨機(jī)選取一個(gè)狀態(tài)進(jìn)行訓(xùn)練，直到達(dá)到指定的訓(xùn)練輪數(shù)；

19、通信干擾模塊，采用訓(xùn)練好的q網(wǎng)絡(luò)進(jìn)行認(rèn)知通信干擾。

20、一種移動(dòng)終端，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法。

21、本發(fā)明與現(xiàn)有技術(shù)相比，其顯著優(yōu)點(diǎn)為：

22、(1)本發(fā)明對(duì)19種調(diào)制樣式的干擾策略進(jìn)行研究，研究范圍比之前研究更廣，能夠有效學(xué)習(xí)對(duì)每種調(diào)制樣式的干擾策略。

23、(2)本發(fā)明設(shè)計(jì)的獎(jiǎng)勵(lì)函數(shù)將干擾方功耗考慮在內(nèi)，使得算法學(xué)習(xí)到的干擾策略能夠以低功耗成功干擾通信方通信。

24、(3)本發(fā)明設(shè)計(jì)的算法能夠?qū)Χ喾N狀態(tài)進(jìn)行訓(xùn)練，能夠有效應(yīng)對(duì)通信方改變調(diào)制信號(hào)的情況，適用于變化環(huán)境。

技術(shù)特征：

1.一種基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟1中，建立通信干擾系統(tǒng)模型，具體如下：

3.根據(jù)權(quán)利要求2所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟1中，確定需要被干擾的通信方調(diào)制樣式和干擾方采用的干擾調(diào)制樣式，具體如下：

4.根據(jù)權(quán)利要求3所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟3中，依據(jù)通信信號(hào)和干擾信號(hào)特點(diǎn)，定義深度強(qiáng)化學(xué)習(xí)所需的狀態(tài)和動(dòng)作空間，具體如下：

5.根據(jù)權(quán)利要求4所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟4中，依據(jù)干擾效果和干擾信號(hào)功耗設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)，具體如下：

6.根據(jù)權(quán)利要求5所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟5中，構(gòu)建基于transformer?encoder的q網(wǎng)絡(luò)，使用1層transformer?encoder和2層fc構(gòu)成q網(wǎng)絡(luò)，具體如下：

7.根據(jù)權(quán)利要求6所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟6中，無效干擾列表的建立過程具體如下：

8.根據(jù)權(quán)利要求7所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，其特征在于，步驟7中，基于ddqn對(duì)q網(wǎng)絡(luò)進(jìn)行訓(xùn)練，具體如下：

9.一種基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾系統(tǒng)，其特征在于，該系統(tǒng)用于實(shí)現(xiàn)權(quán)利要求1～8任一項(xiàng)所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法，所述系統(tǒng)包括通信干擾系統(tǒng)模型構(gòu)建模塊、干擾決策模塊、狀態(tài)和動(dòng)作空間定義模塊、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)模塊、網(wǎng)絡(luò)構(gòu)建模塊、無效干擾列表建立模塊、訓(xùn)練模塊和通信干擾模塊，其中：

10.一種移動(dòng)終端，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1～8任一項(xiàng)所述的基于transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法。

技術(shù)總結(jié)
本發(fā)明公開了一種基于Transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)，該方法為：將Transformer?Encoder作為深度強(qiáng)化學(xué)習(xí)的網(wǎng)絡(luò)，用于處理敵方通信的狀態(tài)信息，再用DDQN根據(jù)處理后的信息選出干擾動(dòng)作；通過設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)和建立無效干擾列表來選出功耗低的動(dòng)作并提高算法的收斂速度。所述系統(tǒng)包括通信干擾系統(tǒng)模型構(gòu)建模塊、干擾決策模塊、狀態(tài)和動(dòng)作空間定義模塊、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)模塊、網(wǎng)絡(luò)構(gòu)建模塊、無效干擾列表建立模塊、訓(xùn)練模塊和通信干擾模塊。本發(fā)明能夠干擾成功多種通信信號(hào)，并且能夠減少交互次數(shù)，提高收斂速度，具有較穩(wěn)定的性能。

技術(shù)研發(fā)人員：金虎,侯文君,彭闖,雷迎科,姜麗,馮輝,滕飛,張孟伯
受保護(hù)的技術(shù)使用者：中國(guó)人民解放軍國(guó)防科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：金虎,侯文君,彭闖,雷迎科,姜麗,馮輝,滕飛,張孟伯
技術(shù)所有人：中國(guó)人民解放軍國(guó)防科技大學(xué)
我是此專利的發(fā)明人

上一篇：一種顯示屏背光源的背光檢測(cè)裝置的制作方法
上一篇：一種飛行模擬用垂直起降無人飛行器的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于Transformer和深度強(qiáng)化學(xué)習(xí)的認(rèn)知通信干擾方法及系統(tǒng)