專利名稱:認(rèn)知無線電網(wǎng)絡(luò)中基于重復(fù)博弈的組播路由算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于認(rèn)知無線電組播路由領(lǐng)域,尤其涉及路由選擇問題。針對(duì)認(rèn)知無線電 網(wǎng)絡(luò)頻譜分配的動(dòng)態(tài)性和差異性,設(shè)計(jì)了一種組播路由算法。
背景技術(shù):
認(rèn)知無線電(Cognitive Radio,CR)的概念起源于1999年Jos印h Mitolo博士的奠 基性工作,其核心思想是認(rèn)知無線電具有學(xué)習(xí)能力,能與周圍環(huán)境交互信息,以感知和利用在 該空間的可用頻譜,并限制和降低沖突的發(fā)生。認(rèn)知無線電的學(xué)習(xí)能力是使它從概念走向?qū)?際應(yīng)用的真正原因。有了足夠的人工智能,它就可能通過吸取過去的經(jīng)驗(yàn)來對(duì)實(shí)際的情況進(jìn) 行實(shí)時(shí)響應(yīng),過去的經(jīng)驗(yàn)包括對(duì)死區(qū)、干擾和使用模式等的了解。這樣,認(rèn)知無線電有可能賦 予無線電設(shè)備根據(jù)頻帶可用性、位置和過去的經(jīng)驗(yàn)來自主確定采用哪個(gè)頻帶的功能。隨著無線通信的迅速發(fā)展,頻譜資源日益匱乏,目前認(rèn)知無線電技術(shù)已成為解決 無線頻譜資源短缺的關(guān)鍵技術(shù)。認(rèn)知無線電的主要有以下4個(gè)功能頻譜感知、頻譜管理、 頻譜移動(dòng)性以及頻譜共享,其主要工作包括無線頻譜分析、信道識(shí)別、發(fā)射功率控制和動(dòng)態(tài) 頻譜資源管理。其中,認(rèn)知無線電網(wǎng)絡(luò)的組播路由設(shè)計(jì)亟待解決,已成為研究的一個(gè)熱點(diǎn)。數(shù)據(jù)在網(wǎng)絡(luò)中傳輸有單播、組播以及廣播3種方式,單播只能在發(fā)送者和每一接 收者之間實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò)連接,廣播實(shí)現(xiàn)的是發(fā)送者向子網(wǎng)每一個(gè)主機(jī)投遞一份數(shù)據(jù)包。 對(duì)于認(rèn)知無線電網(wǎng)絡(luò),發(fā)送者需要向多個(gè)接收者發(fā)送數(shù)據(jù),組播技術(shù)在認(rèn)知網(wǎng)絡(luò)中體現(xiàn)出 了其獨(dú)特的優(yōu)越性,實(shí)現(xiàn)了發(fā)送者和每一接收者之間實(shí)現(xiàn)點(diǎn)對(duì)多點(diǎn)網(wǎng)絡(luò)連接。當(dāng)發(fā)送者同 時(shí)給多個(gè)的接收者傳輸相同的數(shù)據(jù)時(shí),只需復(fù)制一份的相同數(shù)據(jù)包。它提高了數(shù)據(jù)傳送效 率,減少了骨干網(wǎng)絡(luò)出現(xiàn)擁塞的可能性。為了進(jìn)行有效的組播通信,確定組播路由非常關(guān)鍵。組播路由算法的研究目標(biāo)是 采用行之有效的算法,使得通信中的節(jié)點(diǎn)同時(shí)向多個(gè)目的節(jié)點(diǎn)發(fā)送數(shù)據(jù)時(shí),根據(jù)網(wǎng)絡(luò)的拓 撲結(jié)構(gòu)以及鏈路狀態(tài),在滿足約束條件的前提下建立一種結(jié)構(gòu)來實(shí)現(xiàn)目標(biāo)函數(shù)的優(yōu)化,使 網(wǎng)絡(luò)費(fèi)用最小。衡量一個(gè)組播算法好壞的標(biāo)準(zhǔn)通常是基于以下3個(gè)方面——組播樹的鏈路 總造價(jià)、端到端延時(shí)以及可擴(kuò)展性。在認(rèn)知無線電網(wǎng)絡(luò)的路由算法設(shè)計(jì)過程中,必須考慮到認(rèn)知用戶對(duì)頻譜的使用不 會(huì)對(duì)主用戶造成干擾的問題。對(duì)于認(rèn)知用戶來說,其所使用的無線頻譜資源是屬于主用戶 也就是授權(quán)用戶的,在這其中主用戶是要受到保護(hù)的,認(rèn)知用戶在對(duì)于這樣的頻譜資源進(jìn) 行利用時(shí),必須保證不能影響到主用戶的正常服務(wù),這是頻譜資源管理和政策上的規(guī)定,同 時(shí)也是在授權(quán)頻段使用認(rèn)知無線電技術(shù)時(shí)所應(yīng)該做到的基本的頻譜禮儀之一。鑒于以上考慮,本發(fā)明提供了認(rèn)知無線電網(wǎng)絡(luò)中的一種基于重復(fù)博弈的路由路由 算法。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于重復(fù)博弈論的組播路由算法,針對(duì)認(rèn)知無線電網(wǎng)絡(luò)頻譜分配的動(dòng)態(tài)性和差異性,通過將路由選擇的歷史參與到下次路由選擇中,從而簡(jiǎn)化了算法的 冗余度。此外,基于動(dòng)態(tài)博弈中重復(fù)博弈論的思想,在路由選擇中引入聲譽(yù),解決了在不對(duì) 主用戶造成干擾的情況下,認(rèn)知節(jié)點(diǎn)既能保證其所選路徑滿足端到端延時(shí)最小的條件,又 能使路由算法的冗余度達(dá)到簡(jiǎn)化的算法設(shè)計(jì)目標(biāo)。本發(fā)明既能夠使能次用戶在路由選擇時(shí) 達(dá)到自己的要求,又沒有對(duì)主用戶對(duì)其授權(quán)頻譜地使用造成干擾,從而可以使用到對(duì)端到 端延時(shí)有所要求的實(shí)際網(wǎng)絡(luò)中。一、組播路由算法中的博弈論分析模型博弈論是一種分析人類交互過程中各種復(fù)雜問題的經(jīng)濟(jì)學(xué)工具,在路由選擇問題 中,參與路由選擇的節(jié)點(diǎn)可以視作是博弈的參與者,每個(gè)節(jié)點(diǎn)都期望在每次選路過程中自 己的利益得到最大化,這就是一個(gè)博弈的過程,博弈的最后結(jié)果是各個(gè)節(jié)點(diǎn)的利益達(dá)到一 個(gè)均衡,即納什均衡,但是該均衡不一定是博弈的最優(yōu)解,需要經(jīng)過分析以及證明找到最優(yōu) 解,即,除了該最優(yōu)策略,每個(gè)節(jié)點(diǎn)再也找不到其他的策略能在不損害其他節(jié)點(diǎn)利益的前提 下單方面提高自身的利益。博弈論的方法有很多,按照時(shí)間因素的參與與否可以分為靜態(tài)博弈和動(dòng)態(tài)博弈, 對(duì)于實(shí)際的網(wǎng)絡(luò),認(rèn)知節(jié)點(diǎn)的選路過程必定是多次,因此考慮用動(dòng)態(tài)博弈分析路由問題。在 本發(fā)明中,認(rèn)知節(jié)點(diǎn)之間的博弈視作是無限重復(fù)博弈。在無限重復(fù)博弈中,同一個(gè)博弈被無 限期重復(fù)多次,對(duì)于任何一個(gè)參與者的欺騙和違約行為,其他參與者總會(huì)有機(jī)會(huì)給予報(bào)復(fù)。 由于在無限期重復(fù)博弈中,報(bào)復(fù)的機(jī)會(huì)總是存在的,所以,每一個(gè)參與者都不會(huì)采取違約或 欺騙的行為,參與者之間合作的均衡解是存在的。利用博弈論來分析路由問題可以分為以下六個(gè)步驟建立博弈的理論模型、分析 該博弈模型是否具有穩(wěn)定狀態(tài)、分析所得狀態(tài)是否最優(yōu)、分析所有節(jié)點(diǎn)是否向該狀態(tài)集中、 分析該狀態(tài)是否穩(wěn)定、分析該穩(wěn)定狀態(tài)的可擴(kuò)展性。具體流程如圖1所示。在傳統(tǒng)的路由算法中,節(jié)點(diǎn)的每次選路都需要計(jì)算出最優(yōu)路徑。這種算法可以很 好的實(shí)現(xiàn)最優(yōu)化路由,但是其中存在著不可避免的冗余性,這是由于在某一時(shí)刻選路時(shí)的 最 優(yōu)路徑也很可能下一次選路的最優(yōu)路徑,因此,借助路由選擇的歷史可以簡(jiǎn)化路由算法。二、基于重復(fù)博弈的組播路由算法本方法采用經(jīng)濟(jì)學(xué)領(lǐng)域的博弈論知識(shí),將重復(fù)博弈運(yùn)用到認(rèn)知無線電網(wǎng)絡(luò)中,針 對(duì)認(rèn)知無線電網(wǎng)絡(luò)頻譜分配的動(dòng)態(tài)性和差異性,設(shè)計(jì)了一種組播路由算法,從而實(shí)現(xiàn)了在 不對(duì)主用戶造成干擾的情況下,認(rèn)知節(jié)點(diǎn)的所選路徑滿足端到端延時(shí)最小的條件,同時(shí)還 使得路由算法的冗余度得到了簡(jiǎn)化的目的。認(rèn)知無線電網(wǎng)絡(luò)中基于重復(fù)博弈的組播路由算法的具體設(shè)計(jì)如圖2所示步驟如 下(1)單階段組播策略在該博弈中,博弈的參與者是認(rèn)知無線電網(wǎng)絡(luò)中的所有理性認(rèn)知節(jié)點(diǎn),行動(dòng)策略 是參與選路的節(jié)點(diǎn)選擇路徑的集合,效用函數(shù)是實(shí)現(xiàn)從認(rèn)知節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)之間所選路徑 的端到端延時(shí)最小。針對(duì)認(rèn)知無線電網(wǎng)絡(luò)中的路由選擇博弈過程,形式化定義如下①博弈G中的每個(gè)階段子博弈為r ;②網(wǎng)絡(luò)中共有η個(gè)理性認(rèn)知節(jié)點(diǎn),它們組成博弈參與者集合Ν,Ν= {1,2,...,η};③Si表示參與節(jié)點(diǎn)i的策略集,定義集合S = (S1, S2, ... , SJ ;
④定義效用函數(shù)集Ui =S — R,效用函數(shù)Ui (Vij);⑤在博弈G中,對(duì)于每一個(gè)參與節(jié)點(diǎn)1,效用函數(shù)仏是31和其對(duì)手、的函數(shù),其 中,Si是參與節(jié)點(diǎn)i的策略,s_i是其對(duì)手的策略;⑥貼現(xiàn)因子δ看成是認(rèn)知節(jié)點(diǎn)關(guān)于歷史偏好的變量?;谝陨险f明,該博弈模型如下G= {Γ,Ν, {SjieN, {UjieN, δ}(2)參與節(jié)點(diǎn)i的端到端延遲時(shí)間假定參與節(jié)點(diǎn)i選擇路徑j(luò),假設(shè)鏈路的容量為…,鏈路上數(shù)據(jù)流的速率為Vj,則 單個(gè)包在路徑上的延遲時(shí)間為l/(Cj-Vj)。認(rèn)知網(wǎng)絡(luò)中有多個(gè)參與節(jié)點(diǎn),所以考慮多個(gè)數(shù)據(jù) 流的情況。假設(shè)網(wǎng)絡(luò)有η個(gè)理性路由器R1, R2,...,Rn,即博弈的參與者,這些路由器分別以 X1, λ2,..., λη的泊松分布形式向網(wǎng)絡(luò)發(fā)送數(shù)據(jù);假設(shè)Ri所選擇的路徑為Ij,則其處理能 力,即鏈路容量為μ ij ;Vij表示認(rèn)知節(jié)點(diǎn)i沿路徑j(luò)轉(zhuǎn)發(fā)數(shù)據(jù)流的速率。該網(wǎng)絡(luò)的任務(wù)模 型如圖3所示。定義數(shù)據(jù)流在每條路徑上的延遲時(shí)間為
η 則參與節(jié)點(diǎn)i的端到端延遲時(shí)間為 (3)多階段策略博弈假定,<表示節(jié)點(diǎn)i在t時(shí)間的行動(dòng)策略,每一個(gè)階段的策略α'=(4,4,…,a'n),t 時(shí)間的歷史Ρ = (a°, a1, an)。則節(jié)點(diǎn)i在t階段博弈中的行動(dòng)策略可以表示為5丨,這 里4 =彳(/0。在t階段的重復(fù)博弈中,節(jié)點(diǎn)的效用函數(shù)為 則
),其中,ρ ^.(k)表示節(jié)點(diǎn)i選擇鏈路j的概率,且P υ e [-1,1]上式中,<,<表示認(rèn)知節(jié)點(diǎn)i選擇的鏈路j在t時(shí)間時(shí)的聲譽(yù)定義此時(shí)節(jié)點(diǎn)的效 用函數(shù)為S1i= au; +錢‘,其中,α,β為加權(quán)因子對(duì)于每一時(shí)間t,參與者i的效用是4,則效用流<,乂,…可以表示成 (4)驗(yàn)證算法可靠性由(1)得到了該博弈的效用函數(shù)U”每個(gè)參與節(jié)點(diǎn)選擇延遲時(shí)間最短的路徑,要 求延遲時(shí)間最小,即min (Ui (Vij)}
利用規(guī)劃求解法,該博弈模型中參與節(jié)點(diǎn)i的最優(yōu)解為 g卩,當(dāng)Vij取該值時(shí),參與節(jié)點(diǎn)所選擇的路徑延遲時(shí)間最小。進(jìn)一步的,步驟(3)的多階段博弈模型中,還可以通過將路由選擇的歷史參與到 下次路由選擇中,從而簡(jiǎn)化了算法的冗余度,具體步驟如下分析算法冗余度節(jié)點(diǎn)與鏈路之間可能的情況如圖4所示,橫向表示鏈路的情況,縱向表示節(jié)點(diǎn)的 選擇。并且假設(shè)U (鏈路不是最優(yōu),節(jié)點(diǎn)未選擇)=U (N,N) = ν ‘,U (鏈路最優(yōu),節(jié)點(diǎn)未選擇)=U (Y,N) = ν〃,U(鏈路不是最優(yōu),節(jié)點(diǎn)選擇)=U(N,Y) = ν"‘,U(鏈路最優(yōu),節(jié)點(diǎn)選擇)=U(Y,Y) = ν" 〃。假設(shè)在t = 0時(shí)刻博弈參與的雙方,即節(jié)點(diǎn)和鏈路通過合作達(dá)到納什均衡,則在t =1時(shí)刻,歷史h1 = (N,N)。因此,雙方再次合作,t = 2時(shí)刻,h2 = ((N, N), (N,N)),以此 類推到之后所經(jīng)過的時(shí)刻。在前t時(shí)間里,節(jié)點(diǎn)獲得的收益是ν',假設(shè)在t時(shí)刻節(jié)點(diǎn)首先選擇了偏離之前所 達(dá)到的均衡狀態(tài),即,節(jié)點(diǎn)選擇該鏈路進(jìn)行數(shù)據(jù)傳輸,此時(shí),節(jié)點(diǎn)的收益為ν"。由于節(jié)點(diǎn)的 選擇,誘使鏈路最優(yōu),從而在之后的t+l,t+2,...時(shí)刻,節(jié)點(diǎn)獲得的收益是ν"“。由于前t時(shí)間參與者的收益為ν' t時(shí)刻的收益是ν" t之后的每一時(shí)刻收 益為ν" “ i,因此,此時(shí)的平均貼現(xiàn)值為(I-St)v'廣 δ tC(I-S)v" JSv" “ J針對(duì)不同的δ值計(jì)算節(jié)點(diǎn)的平均貼現(xiàn)值,發(fā)現(xiàn),對(duì)于ν" “ > ν" >ν' >ν"‘, 當(dāng)δ >1/2時(shí)博弈的雙方才能維持合作,S卩,在有限次重復(fù)博弈中,如果節(jié)點(diǎn)一直不選擇特 定的鏈路,則納什均衡將會(huì)一直持續(xù)下去。當(dāng)然,在實(shí)際網(wǎng)絡(luò)中,我們希望所選擇的鏈路即 就是最優(yōu)的路徑,但這是理想的情況。通過博弈分析得出較為合理的結(jié)果,根據(jù)分析結(jié)果可 以進(jìn)行組播路由的算法設(shè)計(jì)。綜上所述,本發(fā)明基于動(dòng)態(tài)博弈中重復(fù)博弈論的思想,在路由選擇中引入聲譽(yù),解 決了在不對(duì)主用戶造成干擾的情況下,認(rèn)知節(jié)點(diǎn)達(dá)到了其所選路徑滿足端到端延時(shí)最小的 條件的算法設(shè)計(jì)目標(biāo);通過將路由選擇的歷史參與到下次路由選擇中,從而簡(jiǎn)化了算法的 冗余度。
圖1博弈論分析流程圖。圖2是本發(fā)明的步驟流程圖。圖3單階段網(wǎng)絡(luò)任務(wù)模型。圖4節(jié)點(diǎn)與鏈路的策略博弈圖。
具體實(shí)施方式
下面以一個(gè)實(shí)例來介紹所述方法的具體實(shí)施過程。網(wǎng)絡(luò)要求目標(biāo)網(wǎng)絡(luò)規(guī)模中等,節(jié)點(diǎn)數(shù)目在50-100之間,要求在滿足在不對(duì)主用戶造成干擾的情況下,認(rèn)知節(jié)點(diǎn)既能保證其所選路徑滿足端到端延時(shí)最小的條件,又能使 路由算法的冗余度達(dá)到簡(jiǎn)化的算法設(shè)計(jì)目標(biāo);路由協(xié)議認(rèn)知無線電網(wǎng)絡(luò)中基于重復(fù)博弈的組播路由協(xié)議;實(shí)施目的使用本發(fā)明所述方法,計(jì)算認(rèn)知節(jié)點(diǎn)所選路徑的端到端延時(shí),并分析算 法冗余度,即判斷目標(biāo)網(wǎng)絡(luò)對(duì)路由算法的可信賴程度。實(shí)施過程根據(jù)路由算法及已經(jīng)建立 的重復(fù)博弈路由模型,利用單階段博弈模型得到認(rèn)知節(jié)點(diǎn)所選路徑的端到端延時(shí)時(shí)間;在 多階段博弈中,將路由選擇的歷史參與到下次路由選擇中,分析算法的冗余度是否得到簡(jiǎn) 化。算法的具體過程如下(1)初始化每個(gè)參與節(jié)點(diǎn)在各個(gè)路徑上的策略,定義參數(shù)m,m表示算法得到最優(yōu) 解需要執(zhí)行的次數(shù)。(2)進(jìn)行一次博弈。將每條路徑按其執(zhí)行能力速率進(jìn)行降序排列。(3)
,則進(jìn)行如下賦值過程 對(duì)于i = l,2,...,n,進(jìn)行賦值 (4)通過以上計(jì)算得出參與節(jié)點(diǎn)的策略,以及該策略下WUi(Vij)值。求得
,將n傳給下一個(gè)參與節(jié)點(diǎn)。(5)重復(fù)執(zhí)行以上三步,直到所有參與節(jié)點(diǎn)的策略分配都計(jì)算完成。此時(shí),重新回 到第一個(gè)參與節(jié)點(diǎn)的側(cè)策略計(jì)算,判定η取值是否滿足誤差需要。若滿足則得到了各個(gè)參 與節(jié)點(diǎn)的策略分配,結(jié)束算法;若不滿足需求,則重復(fù)執(zhí)行以上三步,直到滿足需求。(6)將以上求得的最佳路徑作為歷史記錄下來,當(dāng)再次選路時(shí),將歷史hj代入進(jìn) 行計(jì)算,從而得到重復(fù)博弈的最優(yōu)解。最小化每個(gè)參與節(jié)點(diǎn)選擇延遲時(shí)間最短的路徑,即
min{Ui(Vij)}。經(jīng)仿真實(shí)驗(yàn),在目標(biāo)網(wǎng)絡(luò)中,基于重復(fù)博弈的組播路由算法實(shí)現(xiàn)了使認(rèn)知節(jié)點(diǎn)滿 足在不對(duì)主用戶造成干擾的情況下,既能保證其所選路徑滿足端到端延時(shí)最小的條件,又 能使路由算法的冗余度達(dá)到簡(jiǎn)化的算法設(shè)計(jì)目標(biāo)。在實(shí)際應(yīng)用中,可根據(jù)本發(fā)明給出的分 析結(jié)果和實(shí)際需要快速選擇合適的路徑。同時(shí),也可為利用博弈論知識(shí)解決路由選擇以及 對(duì)其相關(guān)算法的改進(jìn)提供一種有效參考。
權(quán)利要求
認(rèn)知無線電網(wǎng)絡(luò)中基于重復(fù)博弈的組播路由算法,所述算法具體步驟如下1.1建立組播路由算法的單階段博弈模型在該博弈模型中,博弈的參與者是認(rèn)知無線電網(wǎng)絡(luò)中的所有理性認(rèn)知節(jié)點(diǎn),行動(dòng)策略是參與選路的節(jié)點(diǎn)選擇路徑的集合,效用函數(shù)是實(shí)現(xiàn)從認(rèn)知節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)之間所選路徑的端到端延時(shí)最小,針對(duì)認(rèn)知無線電網(wǎng)絡(luò)中的路由選擇博弈過程,形式化定義如下①博弈G中的每個(gè)階段子博弈為Γ;②網(wǎng)絡(luò)中共有n個(gè)理性認(rèn)知節(jié)點(diǎn),它們組成博弈參與者集合N,N={1,2,...,n};③Si表示參與節(jié)點(diǎn)i的策略集,定義集合S={S1,S2,...,Sn};④定義效用函數(shù)集UiS→R,效用函數(shù)Ui(vij);⑤在博弈G中,對(duì)于每一個(gè)參與節(jié)點(diǎn)i,效用函數(shù)Ui是Si和其對(duì)手S-i的函數(shù),其中,Si是參與節(jié)點(diǎn)i的策略,S-i是其對(duì)手的策略;⑥貼現(xiàn)因子δ看成是認(rèn)知節(jié)點(diǎn)關(guān)于歷史偏好的變量;基于以上說明,該博弈模型如下G={Γ,N,{Si}i∈N,{Ui}i∈N,δ};1.2參與節(jié)點(diǎn)i的端到端延遲時(shí)間;假定參與節(jié)點(diǎn)i選擇路徑j(luò),假設(shè)鏈路的容量為cj,鏈路上數(shù)據(jù)流的速率為vj,則單個(gè)包在路徑上的延遲時(shí)間為1/(cj-vj);認(rèn)知網(wǎng)絡(luò)中有多個(gè)參與節(jié)點(diǎn),所以考慮多個(gè)數(shù)據(jù)流的情況,假設(shè)網(wǎng)絡(luò)有n個(gè)理性路由器R1,R2,...,Rn,即博弈的參與者,這些路由器分別以λ1,λ2,...,λn的泊松分布形式向網(wǎng)絡(luò)發(fā)送數(shù)據(jù);假設(shè)Ri所選擇的路徑為lj,則其處理能力,即鏈路容量為μij;vij表示認(rèn)知節(jié)點(diǎn)i沿路徑j(luò)轉(zhuǎn)發(fā)數(shù)據(jù)流的速率;定義數(shù)據(jù)流在每條路徑上的延遲時(shí)間為 <mrow><msub> <mi>D</mi> <mi>ij</mi></msub><mrow> <mo>(</mo> <msub><mi>v</mi><mi>ij</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>/</mo><mrow> <mo>(</mo> <msub><mi>c</mi><mi>ij</mi> </msub> <mo>-</mo> <munderover><mi>Σ</mi><mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn></mrow><mi>n</mi> </munderover> <msub><mi>v</mi><mi>kj</mi> </msub> <msub><mi>λ</mi><mi>k</mi> </msub> <mo>)</mo></mrow> </mrow>則參與節(jié)點(diǎn)i的端到端延遲時(shí)間為 <mrow><msub> <mi>U</mi> <mi>i</mi></msub><mrow> <mo>(</mo> <msub><mi>v</mi><mi>ij</mi> </msub> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msub> <mi>v</mi> <mi>ij</mi></msub><msub> <mi>D</mi> <mi>ij</mi></msub><mrow> <mo>(</mo> <msub><mi>v</mi><mi>ij</mi> </msub> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><mo>[</mo><msub> <mi>v</mi> <mi>ij</mi></msub><mo>/</mo><mrow> <mo>(</mo> <msub><mi>c</mi><mi>ij</mi> </msub> <mo>-</mo> <munderover><mi>Σ</mi><mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn></mrow><mi>n</mi> </munderover> <msub><mi>v</mi><mi>kj</mi> </msub> <msub><mi>λ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>]</mo> </mrow>1.3建立組播路由算法的多階段博弈模型;假定,表示節(jié)點(diǎn)i在t時(shí)間的行動(dòng)策略,每一個(gè)階段的策略t時(shí)間的歷史ht=(a0,a1,...,an),則節(jié)點(diǎn)i在t階段博弈中的行動(dòng)策略可以表示為這里在t階段的重復(fù)博弈中,節(jié)點(diǎn)的效用函數(shù)為 <mrow><msubsup> <mi>U</mi> <mi>i</mi> <mi>t</mi></msubsup><mrow> <mo>(</mo> <msubsup><mi>v</mi><mi>ij</mi><mi>t</mi> </msubsup> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msubsup> <mi>v</mi> <mi>ij</mi> <mi>t</mi></msubsup><msubsup> <mi>D</mi> <mi>ij</mi> <mi>t</mi></msubsup><mrow> <mo>(</mo> <msubsup><mi>v</mi><mi>ij</mi><mi>t</mi> </msubsup> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><mo>[</mo><msubsup> <mi>v</mi> <mi>ij</mi> <mi>t</mi></msubsup><mo>/</mo><mrow> <mo>(</mo> <msub><mi>c</mi><mi>ij</mi> </msub> <mo>-</mo> <munderover><mi>Σ</mi><mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn></mrow><mi>n</mi> </munderover> <msubsup><mi>v</mi><mi>kj</mi><mi>t</mi> </msubsup> <msub><mi>λ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>]</mo> </mrow>則其中,ρij(k)表示節(jié)點(diǎn)i選擇鏈路j的概率,且ρij∈[-1,1]上式中,表示認(rèn)知節(jié)點(diǎn)i選擇的鏈路j在t時(shí)間時(shí)的聲譽(yù)定義此時(shí)節(jié)點(diǎn)的效用函數(shù)為其中,α,β為加權(quán)因子對(duì)于每一時(shí)間t,參與者i的效用是則效用流可以表示成 <mrow><mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>δ</mi> <mo>)</mo></mrow><munderover> <mi>Σ</mi> <mrow><mi>t</mi><mo>=</mo><mn>0</mn> </mrow> <mo>∞</mo></munderover><msup> <mi>δ</mi> <mi>t</mi></msup><msubsup> <mi>s</mi> <mi>i</mi> <mi>t</mi></msubsup> </mrow>1.4驗(yàn)證算法可靠性由步驟1.1得到了該博弈的效用函數(shù)Ui,每個(gè)參與節(jié)點(diǎn)選擇延遲時(shí)間最短的路徑,要求延遲時(shí)間最小,即min{Ui(vij)}利用規(guī)劃求解法,該博弈模型中參與節(jié)點(diǎn)i的最優(yōu)解為 <mrow><msub> <mi>v</mi> <mi>ij</mi></msub><mo>=</mo><mo>[</mo><msub> <mi>c</mi> <mi>ij</mi></msub><mo>-</mo><msup> <mrow><mo>(</mo><msub> <mi>c</mi> <mi>ij</mi></msub><mo>)</mo> </mrow> <mrow><mn>1</mn><mo>/</mo><mn>2</mn> </mrow></msup><mrow> <mo>(</mo> <munderover><mi>Σ</mi><mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn></mrow><mi>n</mi> </munderover> <msub><mi>c</mi><mi>ij</mi> </msub> <mo>-</mo> <msub><mi>λ</mi><mi>i</mi> </msub> <mo>)</mo></mrow><mo>/</mo><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>c</mi> <mi>ij</mi></msub><mo>)</mo> </mrow> <mrow><mn>1</mn><mo>/</mo><mn>2</mn> </mrow></msup><mo>]</mo><mo>/</mo><msub> <mi>λ</mi> <mi>i</mi></msub> </mrow>即,當(dāng)vij取該值時(shí),參與節(jié)點(diǎn)所選擇的路徑延遲時(shí)間最小。FSA00000134456100021.tif,FSA00000134456100022.tif,FSA00000134456100023.tif,FSA00000134456100024.tif,FSA00000134456100026.tif,FSA00000134456100027.tif,FSA00000134456100028.tif,FSA00000134456100029.tif,FSA000001344561000210.tif
2.根據(jù)權(quán)利要求1所述的認(rèn)知無線電網(wǎng)絡(luò)中基于重復(fù)博弈的組播路由算法,其特征在 于在所述步驟1. 3的多階段博弈模型中,還可以通過將路由選擇的歷史參與到路由選擇 中,從而為下次路由選擇提供了參考,并節(jié)省了大量計(jì)算相同路徑延遲時(shí)間的帶寬,進(jìn)而有 效地簡(jiǎn)化了算法的冗余度,具體步驟如下分析算法冗余度根據(jù)節(jié)點(diǎn)與鏈路之間可能的情況,假設(shè) U(鏈路不是最優(yōu),節(jié)點(diǎn)未選擇)=U(N,N) = v', U(鏈路最優(yōu),節(jié)點(diǎn)未選擇)=U(Y,N) =v", U(鏈路不是最優(yōu),節(jié)點(diǎn)選擇)=U(N,Y) =v"‘, U(鏈路最優(yōu),節(jié)點(diǎn)選擇)=U(Y,Y) =v"“;假設(shè)在t = 0時(shí)刻博弈參與的雙方,即節(jié)點(diǎn)和鏈路通過合作達(dá)到納什均衡,則在t = 1 時(shí)刻,歷史h1: (N, N),因此,雙方再次合作,t = 2時(shí)刻,h2= ((N, N), (N,N)),以此類推 到之后所經(jīng)過的時(shí)刻;在前t時(shí)間里,節(jié)點(diǎn)獲得的收益是v',假設(shè)在t時(shí)刻節(jié)點(diǎn)首先選擇了偏離之前所達(dá)到 的均衡狀態(tài),即,節(jié)點(diǎn)選擇該鏈路進(jìn)行數(shù)據(jù)傳輸,此時(shí),節(jié)點(diǎn)的收益為v";由于節(jié)點(diǎn)的選擇, 誘使鏈路最優(yōu),從而在之后的t+l,t+2,...時(shí)刻,節(jié)點(diǎn)獲得的收益是v"“;由于前t時(shí)間參與者的收益為v' i,t時(shí)刻的收益是v" y t之后的每一時(shí)刻收益為 Vi"“,因此,此時(shí)的平均貼現(xiàn)值為 針對(duì)不同的S值計(jì)算節(jié)點(diǎn)的平均貼現(xiàn)值,發(fā)現(xiàn),對(duì)于v" “ >v" > v' >v"‘,當(dāng) 6 ^ 1/2時(shí)博弈的雙方才能維持合作,S卩,在有限次重復(fù)博弈中,如果節(jié)點(diǎn)一直不選擇特定 的鏈路,則納什均衡將會(huì)一直持續(xù)下去。
全文摘要
本發(fā)明屬于認(rèn)知無線電組播路由領(lǐng)域,尤其涉及路由選擇問題。針對(duì)認(rèn)知無線電網(wǎng)絡(luò)頻譜分配的動(dòng)態(tài)性和差異性,設(shè)計(jì)了一種組播路由算法。本發(fā)明的算法主要包括如下步驟1、建立組播路由算法的單階段博弈模型;2、參與節(jié)點(diǎn)i的端到端延遲時(shí)間;3、建立組播路由算法的多階段博弈模型;4、驗(yàn)證算法可靠性。本發(fā)明通過將路由選擇的歷史參與到下次路由選擇中,從而簡(jiǎn)化了算法的冗余度。此外,基于動(dòng)態(tài)博弈中重復(fù)博弈論的思想,在路由選擇中引入聲譽(yù),解決了在不對(duì)主用戶造成干擾的情況下,認(rèn)知節(jié)點(diǎn)既能保證其所選路徑滿足端到端延時(shí)最小的條件,又能使路由算法的冗余度達(dá)到簡(jiǎn)化的算法設(shè)計(jì)目標(biāo)。
文檔編號(hào)H04W16/18GK101860798SQ201010181769
公開日2010年10月13日 申請(qǐng)日期2010年5月19日 優(yōu)先權(quán)日2010年5月19日
發(fā)明者劉濤, 周賢偉, 王超, 胡佳慧, 陳月云 申請(qǐng)人:北京科技大學(xué)