一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法

文檔序號：40466213發(fā)布日期：2024-12-27 09:31閱讀：6來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及無線通信，具體涉及一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法，尤其適用復(fù)雜電磁環(huán)境下多目標(biāo)探測任務(wù)場景。

背景技術(shù)：

1、隨著雷達(dá)的廣泛應(yīng)用和雷達(dá)數(shù)量的快速增長，雷達(dá)所處的頻譜被不斷地?cái)D占，其抗干擾能力也不斷地受到考驗(yàn)。雷達(dá)系統(tǒng)在執(zhí)行任務(wù)時(shí)往往面臨著復(fù)雜且不確定的電磁頻譜環(huán)境，這要求其雷達(dá)從收集到的大量信息中甄別出有效信息，從而有效決策出下一步動作。在我們的研究中，每部雷達(dá)都必須在擁擠的頻譜中分配子頻段、調(diào)頻斜率和波束方向，以避免相互干擾并成功探測目標(biāo)，這是一個(gè)順序決策問題。通常情況下，采用馬爾科夫決策過程對上述決策問題進(jìn)行建模。然而，如果將問題建模為馬爾可夫決策過程，就會導(dǎo)致優(yōu)化問題難以找到全局最優(yōu)解從而收斂到次優(yōu)解，而且行動空間的數(shù)量也會變得非常復(fù)雜。甚至?xí)?dǎo)致算法無法收斂。此外，由于雷達(dá)之間存在干擾，在一個(gè)時(shí)隙內(nèi)無法有效判斷目標(biāo)是否真實(shí)。因此，需要多個(gè)時(shí)隙來觀察判斷，這也導(dǎo)致該問題成為了一個(gè)具有不同時(shí)間尺度的復(fù)雜決策問題。

技術(shù)實(shí)現(xiàn)思路

1、針對擁擠的頻譜環(huán)境中面對動態(tài)多目標(biāo)時(shí)的雷達(dá)系統(tǒng)頻譜資源分配問題，本發(fā)明提出了一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法，通過與環(huán)境的信息交互，雷達(dá)系統(tǒng)學(xué)習(xí)自適應(yīng)頻譜資源配置的最優(yōu)策略，以求解復(fù)雜電磁環(huán)境中面對動態(tài)多目標(biāo)時(shí)的雷達(dá)頻譜資源復(fù)雜決策問題。

2、為實(shí)現(xiàn)上述技術(shù)目的，本發(fā)明采取的技術(shù)方案為：

3、一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法，所述雷達(dá)自適應(yīng)頻譜資源配置方法包括以下步驟：

4、每個(gè)雷達(dá)根據(jù)探測到的信息，對探測到的目標(biāo)進(jìn)行聚類，結(jié)合當(dāng)前波束方向、探測到的目標(biāo)數(shù)量、測量的目標(biāo)距離和目標(biāo)聚類結(jié)果信息，采用波束方向策略網(wǎng)絡(luò)選擇相應(yīng)的波束方向，并在接下來的數(shù)個(gè)時(shí)隙保持該波束方向；接著，每個(gè)雷達(dá)結(jié)合選擇的波束方向、頻譜被占用情況和相對噪聲水平估計(jì)值，采用頻譜配置策略網(wǎng)絡(luò)選擇每個(gè)時(shí)隙的調(diào)頻斜率和子頻段發(fā)射信號；

5、根據(jù)接收信號計(jì)算回報(bào)，分別結(jié)合波束方向價(jià)值網(wǎng)絡(luò)和頻譜配置價(jià)值網(wǎng)絡(luò)的輸出，更新波束方向策略網(wǎng)絡(luò)參數(shù)和波束方向價(jià)值網(wǎng)絡(luò)參數(shù)與頻譜配置策略網(wǎng)絡(luò)參數(shù)和頻譜配置價(jià)值網(wǎng)絡(luò)參數(shù)。

6、進(jìn)一步地，所述基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法包括以下步驟：

7、步驟1：獲取當(dāng)前時(shí)隙t的雷達(dá)位置、上個(gè)時(shí)隙t-1各個(gè)雷達(dá)探測到的信息和選擇的波束方向，形成特征矩陣；

8、步驟2：由雷達(dá)與目標(biāo)的之間的通聯(lián)關(guān)系組成鄰接矩陣，并將特征矩陣與鄰接矩陣輸入到卷積神經(jīng)網(wǎng)絡(luò)中推理得到目標(biāo)聚類結(jié)果；

9、步驟3：獲取當(dāng)前時(shí)隙t雷達(dá)的波束方向、探測到的目標(biāo)數(shù)量、測量的目標(biāo)距離和目標(biāo)聚類結(jié)果信息，將其作為當(dāng)前雷達(dá)波束方向決策的狀態(tài)；

10、步驟4：采用波束方向策略網(wǎng)絡(luò)進(jìn)行波束方向動作選擇，根據(jù)輸出的動作選擇概率從預(yù)設(shè)的波束方向集合中選擇某一方向作為接下來數(shù)個(gè)時(shí)隙的信號波束發(fā)射方向；

11、步驟5：獲取當(dāng)前時(shí)隙t雷達(dá)的波束方向、頻譜被占用情況和相對噪聲水平估計(jì)值，將其作為當(dāng)前雷達(dá)頻譜配置決策的狀態(tài)；

12、步驟6：采用頻譜配置策略網(wǎng)絡(luò)進(jìn)行調(diào)頻斜率和子頻段動作選擇，根據(jù)輸出的動作選擇概率從預(yù)設(shè)的動作合集中選擇調(diào)頻斜率和子頻段作為下一個(gè)時(shí)隙t+1的信號發(fā)射參數(shù)；

13、步驟7：當(dāng)下一個(gè)時(shí)隙t+1雷達(dá)發(fā)射信號，并接收到信號之后，根據(jù)頻譜配置價(jià)值網(wǎng)絡(luò)的輸出與頻譜配置決策的回報(bào)值，計(jì)算第一時(shí)間差誤差，并根據(jù)第一時(shí)間差誤差訓(xùn)練頻譜配置策略網(wǎng)絡(luò)和頻譜配置價(jià)值網(wǎng)絡(luò)；

14、步驟8：經(jīng)過nδt個(gè)時(shí)隙之后，根據(jù)波束方向價(jià)值網(wǎng)絡(luò)的輸出與波束方向決策的回報(bào)值，計(jì)算第二時(shí)間差誤差，并根據(jù)第二時(shí)間差誤差訓(xùn)練波束方向策略網(wǎng)絡(luò)和波束方向價(jià)值網(wǎng)絡(luò)；

15、步驟9：在每nδt個(gè)時(shí)隙重復(fù)上述步驟1至步驟8直至達(dá)到停止條件，此時(shí)動作選擇策略收斂。

16、步驟2進(jìn)一步包括：

17、構(gòu)建特征矩陣其中pt表示雷達(dá)系統(tǒng)中的雷達(dá)位置坐標(biāo)集合，wt表示每個(gè)雷達(dá)波束方向集合，表示每個(gè)雷達(dá)目標(biāo)距離測量值的集合；

18、構(gòu)建鄰接矩陣a，鄰接矩陣a由雷達(dá)i與目標(biāo)k的之間的通聯(lián)關(guān)系組成，若探測到該目標(biāo)則對應(yīng)的位置a(k，i)置1，反之置0；

19、在卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行圖卷積，具體如下：

20、

21、其中in為單位矩陣，是的度矩陣，hl為每一層的特征矩陣；σ(·)是softmax函數(shù)；wl表示卷積神經(jīng)網(wǎng)絡(luò)第l層權(quán)重矩陣；在輸出層得到目標(biāo)聚類結(jié)果rei之后，計(jì)算交叉熵?fù)p失函數(shù)：

22、

23、其中ti為采用獨(dú)熱編碼的標(biāo)簽矩陣；在完成預(yù)訓(xùn)練之后的wl被直接應(yīng)用于波束方向決策的目標(biāo)聚類，將聚類結(jié)果作為觀測之一以幫助搜尋目標(biāo)。

24、步驟2進(jìn)一步包括：

25、將整個(gè)頻譜等分成y個(gè)不重疊的子頻段，雷達(dá)每個(gè)時(shí)隙選擇一個(gè)子頻段，子頻段數(shù)量大于雷達(dá)數(shù)量；每個(gè)雷達(dá)i使用的mimo雷達(dá)均為mt個(gè)發(fā)射天線和mr個(gè)接收天線的mimo雷達(dá)，均采取均勻線陣排布，相鄰的發(fā)射/接收天線的間隔d＝λ/2，λ為波長；

26、第i個(gè)mimo雷達(dá)的第mt個(gè)發(fā)射天線發(fā)射信號為：

27、

28、其中b表示信號帶寬，表示第i個(gè)雷達(dá)的線性調(diào)頻間隔，表示第i個(gè)雷達(dá)使用的載波頻率；

29、采用波束成形技術(shù)使得mimo雷達(dá)發(fā)射信號主瓣能量集中，采用的碼本為：

30、

31、其中p表示dft碼本的總碼字?jǐn)?shù)，以及p＝0，1，...，p-1；mt表示每個(gè)雷達(dá)發(fā)射天線的總數(shù)量；

32、經(jīng)過波束成形后的第i個(gè)雷達(dá)上的mimo雷達(dá)的第mt個(gè)發(fā)射天線發(fā)射信號為：

33、

34、判斷目標(biāo)是否在雷達(dá)發(fā)射信號的主瓣范圍內(nèi)，若目標(biāo)在主瓣范圍內(nèi)則認(rèn)為雷達(dá)發(fā)射信號的波束范圍內(nèi)存在目標(biāo)，發(fā)射信號在目標(biāo)上鏡面反射并形成回波信號；否則認(rèn)為雷達(dá)沒有探測到目標(biāo)；

35、當(dāng)?shù)?，個(gè)機(jī)載mimo雷達(dá)探測到目標(biāo)后，其第mr個(gè)接收天線接收到的信號為：

36、

37、其中x表示其他與第i個(gè)雷達(dá)采用同一個(gè)載頻的第x個(gè)雷達(dá)，ni(t)表示高斯白噪聲，γ表示天線接收系數(shù)，為第i個(gè)節(jié)點(diǎn)上的mimo雷達(dá)的第mt個(gè)發(fā)射天線的信號反射到目標(biāo)并被第mr個(gè)接收天線接收的時(shí)間延遲，γxi為第，個(gè)雷達(dá)接收到第x(x≠i)個(gè)雷達(dá)的發(fā)射信號的接收系數(shù)，為第x個(gè)雷達(dá)的第mt個(gè)發(fā)射天線的信號在目標(biāo)上鏡面反射并被為第，個(gè)雷達(dá)的第mr個(gè)接收天線接收的時(shí)間延遲；

38、部分為第i個(gè)雷達(dá)接收到自身的發(fā)射信號的目標(biāo)回波，滿足γi＝gρ/(ri)4以及其中m＝mtmr，c為光速，ri為目標(biāo)與第，個(gè)雷達(dá)的距離，ρ為目標(biāo)反射系數(shù)，g表示雷達(dá)的天線增益，θi為目標(biāo)相對于第，個(gè)雷達(dá)的方位角，vi為目標(biāo)與第i個(gè)雷達(dá)的相對速度；部分為采用同一個(gè)子頻段的其他雷達(dá)對第，個(gè)雷達(dá)的干擾信號，滿足γxi＝gρ/(rxi)4以及其中rxi為第x個(gè)雷達(dá)與第i個(gè)雷達(dá)的相對距離，vxi為第x個(gè)雷達(dá)相對第i個(gè)雷達(dá)的速度，θxi為第x個(gè)雷達(dá)相對第i個(gè)雷達(dá)的方位角；

39、對差頻信號沿頻率軸做一維恒虛警檢測，通過計(jì)算背景噪聲和干擾噪聲自適應(yīng)產(chǎn)生檢測門限，將檢測單元幅值與檢測門限進(jìn)行對比，得到是否檢測到目標(biāo)的結(jié)果；對每一個(gè)檢測出目標(biāo)的檢測單元進(jìn)行檢測，若該檢測單元與另一個(gè)檢測出目標(biāo)的檢測單元相鄰則認(rèn)為是同一目標(biāo)，否則為另一個(gè)目標(biāo)，最后得到目標(biāo)個(gè)數(shù)yi，t。

40、進(jìn)一步地，在波束方向馬爾可夫決策過程中，給定狀態(tài)空間智能體i在時(shí)隙t中觀測到的狀態(tài)定義為其中表示智能體i觀測到目標(biāo)的相對距離，yi，t表示通過cfar檢測出的目標(biāo)個(gè)數(shù)；在時(shí)隙t中智能體i決定的波束方向動作定義為得到的決策立即在時(shí)隙t中執(zhí)行，雷達(dá)發(fā)射信號采用一個(gè)新的波束方向wi，t+1，波束方向保持不變，直到在時(shí)隙t+1中被執(zhí)行；即時(shí)回報(bào)定義為：

41、

42、分別采用兩個(gè)全連接神經(jīng)網(wǎng)絡(luò)來近似波束方向策略網(wǎng)絡(luò)π(s；θ)和波束方向價(jià)值網(wǎng)絡(luò)v(s；ω)，兩個(gè)網(wǎng)絡(luò)的輸入均為智能體，的狀態(tài)觀測波束方向價(jià)值網(wǎng)絡(luò)的輸出為狀態(tài)對應(yīng)的價(jià)值波束方向策略網(wǎng)絡(luò)的輸出為狀態(tài)下每個(gè)動作對應(yīng)的概率；定義策略網(wǎng)絡(luò)參數(shù)和價(jià)值網(wǎng)絡(luò)參數(shù)為智能體，需要迭代優(yōu)化的參數(shù)；在時(shí)隙t中，波束方向決策選擇動作的策略表示為：表示在狀態(tài)si，t下依據(jù)策略網(wǎng)絡(luò)參數(shù)在輸出的各方案中以一定的概率選中動作波束方向策略網(wǎng)絡(luò)的輸出層采用softmax激活函數(shù)，滿足：

43、

44、根據(jù)獲得的累積獎勵及價(jià)值網(wǎng)絡(luò)的輸出，計(jì)算第一時(shí)間差誤差：

45、

46、波束方向價(jià)值網(wǎng)絡(luò)以時(shí)間差均方誤差最小化為目標(biāo)更新波束方向價(jià)值網(wǎng)絡(luò)參數(shù)，將損失函數(shù)定義為：

47、

48、其中β為損失系數(shù)；則波束方向價(jià)值網(wǎng)絡(luò)參數(shù)的更新公式為：

49、

50、其中α為權(quán)重因子。波束方向策略網(wǎng)絡(luò)在第一時(shí)間差誤差的指導(dǎo)下，沿?fù)p失函數(shù)的梯度方向更新網(wǎng)絡(luò)參數(shù)，其損失函數(shù)定義為：

51、

52、波束方向策略網(wǎng)絡(luò)參數(shù)的更新公式為：

53、

54、進(jìn)一步地，在頻譜配置馬爾可夫決策過程中，狀態(tài)空間和動作空間分別為和智能體j在時(shí)隙t內(nèi)觀測到的狀態(tài)定義為其中為上層的波束方向決策所執(zhí)行的動作，fj，t表示雷達(dá)通過信號接收裝置觀測到的當(dāng)前時(shí)隙t下頻譜占用狀態(tài)，表示相對噪聲水平估計(jì)值；智能體j決定的頻譜決策動作為其中和αj，t分別表示智能體j在時(shí)隙t選擇的子頻段和調(diào)頻斜率；每個(gè)智能體j根據(jù)選擇的動作和去發(fā)射信號，得到接收信號；

55、對接收信號進(jìn)行快速傅里葉變化得到其在當(dāng)前時(shí)隙t下的頻譜rj，t(f)，使用采樣間隔δf對rj，t(f)進(jìn)行采樣，采樣間隔δf由采樣率和fft點(diǎn)數(shù)決定，得到序列其中mf是fft點(diǎn)數(shù)的數(shù)量；

56、對序列進(jìn)行升序排序，得到一個(gè)新的序列

57、

58、通過丟棄最大的nt個(gè)樣本，消除目標(biāo)回波，得到噪聲水平的估計(jì)值：

59、

60、其中nt是丟棄的數(shù)量，式中，lmax為最大目標(biāo)的長度尺寸，nmax為最大目標(biāo)數(shù)；相對噪聲水平的估計(jì)值由噪聲水平的估計(jì)值與沒有干擾的相對噪聲水平的除得到，表示為：

61、

62、利用接收信號的頻譜得到相對噪聲水平的估計(jì)值，即時(shí)回報(bào)表示為：

63、

64、其中η0為設(shè)定的閾值；

65、定義策略網(wǎng)絡(luò)參數(shù)和價(jià)值網(wǎng)絡(luò)參數(shù)在時(shí)隙t中智能體j觀察到上層決策在執(zhí)行動作之后按照策略選擇動作具體為：

66、

67、頻譜配置決策動作在每個(gè)小時(shí)隙δt內(nèi)進(jìn)行決策，并在執(zhí)行完發(fā)射信號動作結(jié)束時(shí)在當(dāng)前時(shí)隙內(nèi)就獲取獎勵

68、計(jì)算第二時(shí)間差誤差：

69、

70、頻譜配置價(jià)值網(wǎng)絡(luò)以時(shí)間差均方誤差最小化為目標(biāo)更新價(jià)值網(wǎng)絡(luò)參數(shù)每個(gè)小時(shí)隙內(nèi)損失函數(shù)為：

71、

72、頻譜配置價(jià)值網(wǎng)絡(luò)參數(shù)根據(jù)損失函數(shù)進(jìn)行更新，在根據(jù)價(jià)值網(wǎng)絡(luò)的損失函數(shù)得到策略網(wǎng)絡(luò)損失函數(shù)后，策略網(wǎng)絡(luò)參數(shù)按照公式更新：

73、

74、與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果如下：

75、本發(fā)明提出了一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法，每個(gè)時(shí)隙開始時(shí)，雷達(dá)系統(tǒng)中每個(gè)雷達(dá)根據(jù)探測到的信息，對探測到的目標(biāo)進(jìn)行聚類；雷達(dá)參考分類結(jié)果與自身的觀測，選擇相應(yīng)的波束方向，并在接下來的數(shù)個(gè)時(shí)隙保持該波束方向。接著，每個(gè)雷達(dá)選擇調(diào)頻斜率和子頻帶發(fā)射信號，再根據(jù)接收信號計(jì)算回報(bào)，并更新策略。為了獲得雷達(dá)系統(tǒng)自適應(yīng)頻譜資源配置的最優(yōu)策略，將其建模為半馬爾可夫決策過程。并提供了一種基于分層強(qiáng)化學(xué)習(xí)的雷達(dá)自適應(yīng)頻譜資源配置和目標(biāo)聚類算法，使用了分層決策框架下的基于行動器-評判器算法的雷達(dá)自適應(yīng)頻譜資源配置與基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)聚類。本發(fā)明成功解決了復(fù)雜電磁環(huán)境中面對動態(tài)多目標(biāo)時(shí)的雷達(dá)頻譜資源復(fù)雜決策問題。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃洋,劉文強(qiáng),張淮奇,朱秋明,王威
技術(shù)所有人：南京航空航天大學(xué)
我是此專利的發(fā)明人

上一篇：一種標(biāo)牌毛邊切割清理裝置的制作方法
上一篇：一種鋼釬加工裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于目標(biāo)聚類的雷達(dá)自適應(yīng)頻譜資源配置方法