基于ε-貪婪的在線序貫感知與機會接入方法

文檔序號：7871087閱讀：382來源：國知局

專利名稱：基于ε-貪婪的在線序貫感知與機會接入方法
技術領域：
本發(fā)明涉及無線通信技術中的認知無線電領域，具體講是針對統(tǒng)計未知的機會頻譜接入系統(tǒng)中，最優(yōu)序貫感知順序的在線學習方法。
背景技術：
受頻譜監(jiān)管部門的倡議和認知無線電技術進步的驅動，動態(tài)頻譜接入(DSA)已經(jīng)被廣泛認可為提高頻譜利用率的有效手段。為了保護主用戶通信不受影響，認知用戶在接入信道前需要對信道進行頻譜感知，以確保信道空閑。受限于硬件水平，認知終端通常一次只能感知整個頻段的一小部分。在此情況下，如何合理的安排感知順序，將直接影響系統(tǒng)的吞吐量和接入時延。實現(xiàn)最優(yōu)的信道感知與接入中的一個關鍵難點，就是難以預估的信道統(tǒng)計分布，尤其是實際的異構網(wǎng)絡場景下，不同信道的可用概率和鏈路質量不盡相同。在線學習，由于其與生俱來的自適應性和有效性，已經(jīng)被廣泛應用于動態(tài)無線網(wǎng)絡中。通過限定認知用戶在每個時隙中只感知一個信道，現(xiàn)有的在線接入研究將此類問題建模為經(jīng)典的多臂老虎機(MAB =Mult1-Armed Bandit)分析模型。即用戶只需要根據(jù)對信道收益的統(tǒng)計，在每個時隙選擇一個信道接入，來最大化系統(tǒng)累計吞吐量。盡管這種簡單的“每時隙選一個信道”的研究模型在同步的周期感知系統(tǒng)中有一定的合理性，但在更多的分布式認知網(wǎng)絡里，尤其是點對點通信場景，這種簡單模型并不合適。一方面，由于信道感知時間通常都遠遠小于傳輸時隙(比如，TV信道的感知時間通常為10毫秒級，而主用戶保護約束下的傳輸時隙為2秒)，當用戶感知發(fā)現(xiàn)當前信道占用時，直接切換到下一信道進行頻譜感知比在原信道等待下一次傳輸時隙更為合理且有效。另一方面，由于無線信道狀態(tài)的隨機性，切換信道進行感知通常都能獲得更多的傳輸機會，即獲得多信道分集增益。并且，由于可用信道的數(shù)目眾多 (比如，超過半數(shù)的用戶擁有20個以上的可用TV信道)，這種分集增益還是非?？捎^的?；诖耍景l(fā)明針對統(tǒng)計未知的異構信道網(wǎng)絡下，提出一種基于在線學習的序貫信道感知與接入策略。不同于以往方法中限制每時隙只選擇一個信道感知接入，在本方案的模型中，允許用戶在每個時隙中序貫地感知信道，并機會的接入進行傳輸。由此，通過實時動態(tài)地調整感知順序和接入策略，最大化系統(tǒng)在一定時間段上的累積吞吐量收益。

發(fā)明內容
本發(fā)明提出了一種動態(tài)頻譜環(huán)境中基于ε -貪婪的在線序貫感知與機會接入方法，以解決在統(tǒng)計信息未知時，序貫感知順序學習與累積吞吐量優(yōu)化的問題。本發(fā)明是采用以下技術方案實現(xiàn)的:一種基于ε -貪婪算法的在線序貫感知與機會接入方法，在每個時隙中，用戶序貫地感知信道，并機會的接入進行傳輸。本發(fā)明中，包括初始化相關參數(shù)的步驟和在每一個時隙進行的基于在線學習的接入決策的步驟。
本發(fā)明中，初始化相關參數(shù)的步驟具體包括:1.1對每個信道i，i e {I,..., N}，初始化各信道空閑概率估計g = O，各信道被感知的次數(shù)統(tǒng)計IIi=O ；1.2初始化候選信道集合Stl=U,...，N}，其中N為信道總數(shù)；1.3初始化ε-貪婪算法的控制參數(shù)ε = ε(ι，ε ^的取值與信道總數(shù)N相關，根據(jù)網(wǎng)絡場景中的信道數(shù)目N，Stl取0.5 2.5之間的一個值。本發(fā)明中，所述的算法控制參數(shù)ε ^的取值與信道總數(shù)N的關系，如表I所示；
權利要求
1.一種基于ε-貪婪算法的在線序貫感知與機會接入方法，其特征在于在每個時隙中，用戶序貫地感知信道，并機會的接入進行傳輸。
2.根據(jù)權利要求1所述的基于ε-貪婪的在線序貫感知與機會接入方法，其特征在于，包括初始化相關參數(shù)的步驟和在每一個時隙進行的基于在線學習的接入決策的步驟。
3.根據(jù)權利要求2所述的基于貪婪算法的在線序貫感知與機會接入方法，其特征在于，初始化相關參數(shù)的步驟具體包括: 1.1對每個信道i，i e {I,..., N}，初始化各信道空閑概率估計^ = O,各信道被感知的次數(shù)統(tǒng)計Iii=O ； 1.2初始化候選信道集合Stl= {1，...，N}，其中N為信道總數(shù)； 1.3初始化貪婪算法的控制參數(shù)ε =、，^的取值與信道總數(shù)N相關，根據(jù)網(wǎng)絡場景中的信道數(shù)目N，Stl取0.5 2.5之間的一個值。
4.根據(jù)權利要求3所述的基于貪婪算法的在線序貫感知與機會接入方法，其特征在于，所述的算法控制參數(shù)y ^的取值與信道總數(shù)N的關系，如表I所示；
5.根據(jù)權利要求2所述的基于貪婪的在線序貫感知與機會接入方法，其特征在于，在任一時隙j進行基于在線學習的信道接入決策的步驟具體包括: 步驟0.對每個信道i，i e {1，...，N}，初始化各信道空閑概率估計~ =0，各信道被感知的次數(shù)統(tǒng)計Iii=O ；步驟1.采用下述公式調整候選信道集合S和算法控制參數(shù)ε ；
全文摘要
一種基于ε-貪婪算法的在線序貫感知與機會接入方法，在每個時隙中，用戶序貫地感知信道，并機會的接入進行傳輸；包括初始化相關參數(shù)的步驟和在每一個時隙進行的基于在線學習的接入決策的步驟。本發(fā)明能夠主動的學習環(huán)境并自適應環(huán)境的動態(tài)變化。本發(fā)明是一種在線的實施決策方法，系統(tǒng)根據(jù)每一次的決策和反饋實時調整下一步的決策，從而得以最大化系統(tǒng)的長期累積吞吐量收益。
文檔編號H04W74/08GK103179675SQ20131000634
公開日2013年6月26日申請日期2013年1月8日優(yōu)先權日2013年1月8日
發(fā)明者王金龍, 吳啟暉, 李柏文, 鄭學強申請人:中國人民解放軍理工大學通信工程學院

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：王金龍;吳啟暉;李柏文;鄭學強
技術所有人：中國人民解放軍理工大學通信工程學院
我是此專利的發(fā)明人

上一篇：一種基于冗余控制和分簇路由的無線傳感網(wǎng)節(jié)能方法
上一篇：一種上報信道質量指示的方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于ε-貪婪的在線序貫感知與機會接入方法