本發(fā)明屬于無(wú)線通信
技術(shù)領(lǐng)域:
,具體涉及一種利用博弈理論和在線學(xué)習(xí)來(lái)優(yōu)化微蜂窩網(wǎng)絡(luò)資源分配的方法。
背景技術(shù):
:當(dāng)前,隨著智能手機(jī)、筆記本電腦等智能設(shè)備的快速發(fā)展,傳統(tǒng)上主要依托于有線固定接入的電子銀行、電子醫(yī)療和網(wǎng)上購(gòu)物等應(yīng)用已開(kāi)始呈現(xiàn)出移動(dòng)化的特點(diǎn);并且隨著用戶終端處理能力增強(qiáng)和無(wú)線業(yè)務(wù)日益豐富,無(wú)線接入需承載的業(yè)務(wù)量將急劇增加。據(jù)預(yù)測(cè),無(wú)線業(yè)務(wù)量將在未來(lái)十年增長(zhǎng)1000倍。傳統(tǒng)的宏蜂窩網(wǎng)絡(luò)將難以滿足日益增長(zhǎng)的無(wú)線業(yè)務(wù)量,因此,如何應(yīng)對(duì)現(xiàn)代移動(dòng)通信網(wǎng)絡(luò)中快速增長(zhǎng)的業(yè)務(wù)量并提供更高的數(shù)據(jù)速率成為進(jìn)一步推動(dòng)無(wú)線通信發(fā)展的關(guān)鍵技術(shù)。為了實(shí)現(xiàn)高速無(wú)線接入的愿景,微蜂窩技術(shù)應(yīng)運(yùn)而生。微蜂窩技術(shù)的基本原理是在宏蜂窩網(wǎng)絡(luò)中設(shè)置低功耗、低成本的微蜂窩來(lái)卸載宏蜂窩的流量,從而提高傳統(tǒng)宏蜂窩網(wǎng)絡(luò)的覆蓋率和容量(參考文獻(xiàn)Y.Li,A.Maeder,L.Fan,A.Nigam,andJ.Chou,OverviewoffemtocellsupportinadvancedWiMAXsystems.IEEECommunicationsMagazine,vol.49,no.7,pp.122-130,2011.)。微蜂窩包括一個(gè)微基站和若干個(gè)用戶,由于微基站減小了用戶和網(wǎng)絡(luò)接入點(diǎn)之間的距離,因此可以提高用戶的數(shù)據(jù)傳輸速率。然而,大量高密度的部署微蜂窩會(huì)導(dǎo)致嚴(yán)重的微蜂窩間干擾,不同微蜂窩內(nèi)的用戶之間的干擾隨之加強(qiáng)。為了提高通信性能、降低不同微蜂窩內(nèi)用戶之間的互干擾,需要設(shè)計(jì)高效的干擾控制策略。微蜂窩網(wǎng)絡(luò)的干擾控制問(wèn)題近年來(lái)得到了廣泛關(guān)注和深入研究,其中兩種有效的干擾控制方法為基于博弈理論的動(dòng)態(tài)信道分配機(jī)制(參考文獻(xiàn)Z.Zhang,L.Song,Z.HanandW.Saad,Coalitionalgameswithover-lappingcoalitionsforinterferencemanagementinsmallcellnetworks.IEEETransactionsonWirelessCommunications,vol.13,no.5,pp.2659-2669,2014.)和基于圖和分簇思想的信道分配方法(參考文獻(xiàn)L.Zhou,R.Ruby,H.Zhao,X.Ji,J.Weietal,Agraph-basedresourceallocationschemewithinterferencecoordinationinsmallcellnetworks.Globecom2014Workshop-HeterogeneousandSmallCellNetworks,pp.1223-1228,2014.)。兩種干擾控制方法的基本原理都是通過(guò)設(shè)計(jì)合理的信道分配方法,避免距離較近的多個(gè)微蜂窩接入同一個(gè)信道,從而降低不同微蜂窩內(nèi)用戶之間的干擾。現(xiàn)有的基于博弈論的干擾控制方法的核心思想是:將微蜂窩之間的干擾關(guān)系建模為一個(gè)博弈模型,效用函數(shù)定義為博弈參與者受到的干擾水平的函數(shù)。根據(jù)構(gòu)建的博弈模型設(shè)計(jì)相應(yīng)的信道分配算法,博弈參與者以?xún)?yōu)化效用函數(shù)為目標(biāo)來(lái)更新信道選擇策略,若當(dāng)前的選擇的信道的干擾水平比較高,則下一時(shí)隙會(huì)選擇其他干擾水平相對(duì)較低的信道,這樣的信道選擇更新原則可以減小不同微蜂窩內(nèi)用戶之間的互干擾?;趫D和分簇思想的干擾控制方法的核心思想是:首先,根據(jù)微蜂窩實(shí)際的地理位置,將地理位置距離較近的若干個(gè)微蜂窩分到同一個(gè)簇內(nèi),距離較遠(yuǎn)的微蜂窩分到不同簇內(nèi)。由于不同簇之間的微蜂窩距離遠(yuǎn)、干擾小,因此這樣的分簇可以在不同簇之間實(shí)現(xiàn)頻譜資源的復(fù)用。然后,同一簇內(nèi)的多個(gè)微蜂窩之間進(jìn)行信道資源的分配選擇,盡量使干擾強(qiáng)的微蜂窩分配到不同的信道上從而降低蜂窩間的強(qiáng)干擾。綜合以上分析可以發(fā)現(xiàn):目前已有的微蜂窩網(wǎng)絡(luò)中干擾控制方法的研究大多關(guān)注于信道選擇,忽略了微基站的功率控制問(wèn)題。從單獨(dú)一個(gè)微蜂窩的角度出發(fā),為了提高用戶的通信速率,微基站會(huì)自私地增大自身的發(fā)射功率。但是從全網(wǎng)角度出發(fā),任意微基站自私地增大發(fā)射功率都會(huì)對(duì)鄰近微蜂窩內(nèi)的用戶產(chǎn)生更大的干擾。因此在超密集組網(wǎng)條件下,為了降低不同微蜂窩內(nèi)用戶之間的互干擾、提高用戶的通信速率,不僅要實(shí)現(xiàn)穩(wěn)定的信道資源分配,還是實(shí)現(xiàn)有效的微基站功率控制。已有的基于演化博弈的干擾控制方法(參考文獻(xiàn)P.Semasinghe,E.HossainandK.Zhu,Anevolutionarygamefordistributedresourceallocationinself-organizingsmallcells.IEEETransactionsonMobileComputing,vol.14,no.2,pp.274-287,2014.)同時(shí)考慮了信道分配和功率控制兩個(gè)方面。微蜂窩內(nèi)的微基站作為博弈參與者,通過(guò)比較自己用戶的速率與種群內(nèi)所有微蜂窩用戶的速率平均值來(lái)更新信道選擇和功率選擇。然而,由于該方法的博弈效用函數(shù)的設(shè)計(jì)僅僅關(guān)注于博弈者自身受到的干擾,而沒(méi)有考慮到自身對(duì)整個(gè)網(wǎng)絡(luò)其他博弈者的干擾影響,因此無(wú)法實(shí)現(xiàn)最小化系統(tǒng)干擾水平。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于針對(duì)微蜂窩網(wǎng)絡(luò)中干擾控制、動(dòng)態(tài)資源(信道和功率)分配問(wèn)題,提出一種微蜂窩網(wǎng)絡(luò)中的分布式資源分配方法,該方法是基于博弈理論的信道選擇和功率控制的分步資源分配方法,在大規(guī)模、超密集組網(wǎng)條件下通過(guò)實(shí)現(xiàn)不同微蜂窩之間的信道分配和功率控制,達(dá)到降低不同微蜂窩之間互干擾、提高用戶的通信速率的目的為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種微蜂窩網(wǎng)絡(luò)中的分布式資源分配方法,其特征在于,將微蜂窩網(wǎng)絡(luò)映射到位于控制中心處的一個(gè)虛擬判決網(wǎng)絡(luò),虛擬判決網(wǎng)絡(luò)中的每一個(gè)認(rèn)知代理對(duì)應(yīng)一個(gè)用戶;所有用戶將自己的地理位置坐標(biāo)信息上報(bào)給所屬的微基站,微基站將覆蓋范圍內(nèi)有通信需求的用戶的位置信息上報(bào)給控制中心對(duì)應(yīng)的認(rèn)知代理,然后由認(rèn)知代理完成信道選擇和功率選擇;控制中心將信道選擇結(jié)果和功率選擇結(jié)果下發(fā)給微基站,微基站完成微蜂窩內(nèi)用戶的資源分配。進(jìn)一步,信道選擇方法為:認(rèn)知代理根據(jù)當(dāng)前的信道選擇概率為所對(duì)應(yīng)的用戶選擇一個(gè)信道,并計(jì)算選擇該信道的信道效用函數(shù),然后根據(jù)該信道效用函數(shù)更新每一個(gè)信道的選擇概率;循環(huán)前述信道選擇和概率更新過(guò)程直至信道選擇實(shí)現(xiàn)收斂;功率選擇方法為:認(rèn)知代理根據(jù)當(dāng)前的功率選擇概率為所對(duì)應(yīng)用戶所屬微基站選擇一個(gè)發(fā)射功率,并計(jì)算選擇該功率的功率效用函數(shù),然后根據(jù)該功率效用函數(shù)更新每一個(gè)功率的選擇概率;循環(huán)前述功率選擇和概率更新過(guò)程直至功率選擇實(shí)現(xiàn)收斂。進(jìn)一步,任意認(rèn)知代理n的信道效用函數(shù)un的計(jì)算方法如式(1)所示:式(1)中,an是認(rèn)知代理n選擇的信道,a-n是除認(rèn)知代理n以外其余所有認(rèn)知代理選擇的信道,aj是認(rèn)知代理j的信道選擇,n*是認(rèn)知代理n對(duì)應(yīng)用戶所屬的微基站,是微基站n*在信道an上的發(fā)射功率,是微基站n*與認(rèn)知代理j所對(duì)應(yīng)用戶之間的信道增益,αn是用戶n的活動(dòng)概率(即有通信需求的概率),αj是用戶j的活動(dòng)概率;j*是認(rèn)知代理j對(duì)應(yīng)用戶所屬的微基站,是微基站j*在信道aj上的發(fā)射功率,是用戶n和微基站j*之間的信道增益;是微基站j*到用戶n之間的距離,γ是路徑損耗因子,函數(shù)I{an=aj}滿足式(2)I{aj=an}=1,aj=an0,aj≠an---(2)]]>認(rèn)知代理n更新信道選擇概率的方法如公式(3)所示,Pr[an(k+1)=an(k)]=1-exp{[un(k)/X]β}YPr[an(k+1)=m]=1-exp{[vm/X]β}Y---(3)]]>公式(3)中,Pr[an(k+1)=an(k)]是認(rèn)知代理n在第k+1個(gè)時(shí)隙與第k個(gè)時(shí)隙選擇相同信道的概率,Pr[an(k+1)=m]是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇信道m(xù)的概率,Y=exp{un(k)β}+exp{vmβ},β是學(xué)習(xí)參數(shù),k代表當(dāng)前的時(shí)隙,X是所有認(rèn)知代理都選擇同一信道時(shí)的總干擾水平,其中,un(k)為認(rèn)知代理n在當(dāng)前時(shí)隙內(nèi)選擇信道an(k)獲得的信道效用函數(shù),vm為認(rèn)知代理n在當(dāng)前探測(cè)信道m(xù)獲得的信道效用函數(shù)。進(jìn)一步,任意認(rèn)知代理n的功率效用函數(shù)Un的計(jì)算方法如式(4)所示,Un(bn,b-n)=rn+Σi∈Mc,i≠nri-Σi∈Mc,i≠nri(n)---(4)]]>式(4)中,bn是認(rèn)知代理n選擇的功率,b-n是除認(rèn)知代理n以外其余所有認(rèn)知代理選擇的功率,假如認(rèn)知代理n最終選擇信道c,則Mc是選擇信道c的認(rèn)知代理的集合,rn是根據(jù)香農(nóng)公式得到的用戶n在選擇的信道c上的速率,rn如公式(5)所示,式(5)中,B是信道帶寬,σ是噪聲功率。αn是用戶n的活動(dòng)概率(即有通信需求的概率),αj是用戶j的活動(dòng)概率,n*是認(rèn)知代理n對(duì)應(yīng)用戶所屬的微基站,是微基站n*在信道c上的發(fā)射功率,是微基站n*與認(rèn)知代理n所對(duì)應(yīng)用戶之間的信道增益;j*是認(rèn)知代理j對(duì)應(yīng)用戶所屬的微基站,是微基站j*在信道c上的發(fā)射功率,是用戶n和微基站j*之間的信道增益。是微基站n*(用戶n所屬的微基站)的最大功率限制。式(4)中,ri是用戶i在信道ai上的速率,其具體定義式與式(5)相同,表示當(dāng)用戶n所屬的微基站發(fā)射功率為0時(shí),用戶i得到的速率,如公式(6)所示,ri(n)=αiBlog(1+Pi*chi*iΣj∈Mc,j≠nαjPj*chj*i+σ)---(6)]]>公式(6)中,Mc是選擇信道c的認(rèn)知代理的集合,αi是用戶i的活動(dòng)概率,是微基站i*在信道c上的發(fā)射功率,是微基站i*與認(rèn)知代理i所對(duì)應(yīng)用戶之間的信道增益;αj是用戶j的活動(dòng)概率,是微基站j*在信道c上的發(fā)射功率,是微基站j*與認(rèn)知代理j所對(duì)應(yīng)用戶之間的信道增益。進(jìn)一步,采用強(qiáng)化學(xué)習(xí)中的Q學(xué)習(xí)來(lái)實(shí)現(xiàn)功率選擇收斂,其中,每一個(gè)認(rèn)知代理根據(jù)功率效用函數(shù)值,按照式(7)、(8)和(9)所示規(guī)則更新Q值,Qn,l(k+1)=Qn,l(k)+λkI(bn(k),l)(U~n(k)-Qn,l(k))---(7)]]>U~n(k)=Un(k)Rl---(8)]]>Rl=αnBlog(1+Pn*anhn*nΣj∈Mc,j≠nαjPj*ajhj*n)---(9)]]>其中,Qn,l(k)是認(rèn)知代理n在第k個(gè)時(shí)隙選擇功率l時(shí)得到的Q值大小,Qn,l(k+1)是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇功率l時(shí)得到的Q值,Un(k)是認(rèn)知代理n在第k個(gè)時(shí)隙得到的效用函數(shù),λk是步進(jìn)因子,I(bn(k),l)的定義如式(10)所示,I(bn(k),l)=1,bn(k)=l0,bn(k)≠l---(10)]]>公式(10)中,bn(k)是認(rèn)知代理n在第k個(gè)時(shí)隙的功率選擇;每一個(gè)認(rèn)知代理根據(jù)當(dāng)前的功率選擇概率和更新后的Q值,按照式(11)所示原則更新功率選擇概率,pn,l(k+1)=pn,l(k)(1+η)Qn,l(k)Σl′=1Lpn,l′(k)(1+η)Qn,l′(k),∀n,l---(11)]]>式(11)中,pn,l(k+1)是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇功率l的概率,pn,l'(k)是認(rèn)知代理n在第k個(gè)時(shí)隙選擇功率l'的概率,的含義是“對(duì)任意的認(rèn)知代理n來(lái)說(shuō)”,η是學(xué)習(xí)參數(shù)。使用本發(fā)明方法進(jìn)行資源分配時(shí),將實(shí)際的微蜂窩網(wǎng)絡(luò)映射到位于控制中心處的一個(gè)虛擬判決網(wǎng)絡(luò),虛擬判決網(wǎng)絡(luò)中的決策者是一些認(rèn)知代理,每一個(gè)認(rèn)知代理對(duì)應(yīng)一個(gè)實(shí)際的用戶。所有用戶將自己的地理位置坐標(biāo)信息上報(bào)給所屬的微基站,微基站將覆蓋范圍內(nèi)有通信需求的用戶的位置信息上報(bào)給控制中心對(duì)應(yīng)的認(rèn)知代理。接下來(lái),分步完成信道選擇和功率選擇。首先,認(rèn)知代理根據(jù)當(dāng)前的信道選擇概率為所對(duì)應(yīng)的用戶選擇一個(gè)信道接入,并計(jì)算該信道的效用函數(shù)。這里所謂的按照概率選擇信道是指任意一個(gè)用戶都以某一概率選擇接入某一個(gè)信道,即每個(gè)信道對(duì)每個(gè)用戶而言都對(duì)應(yīng)一個(gè)選擇概率,用戶每次都是選擇概率值最大的信道接入。根據(jù)信道選擇的效用函數(shù)更新每一個(gè)信道的選擇概率。循環(huán)信道選擇和概率更新過(guò)程直至信道選擇實(shí)現(xiàn)收斂。之后,與信道選擇過(guò)程類(lèi)似,認(rèn)知代理根據(jù)當(dāng)前的功率選擇概率為所對(duì)應(yīng)用戶所屬微基站選擇一個(gè)發(fā)射功率,并計(jì)算該功率選擇的效用函數(shù)。根據(jù)功率選擇的效用函數(shù)更新每一個(gè)功率的選擇概率。循環(huán)功率選擇和概率更新過(guò)程直至功率選擇實(shí)現(xiàn)收斂。最后,控制中心將信道選擇結(jié)果和功率選擇結(jié)果下發(fā)給各個(gè)微基站,微基站完成微蜂窩內(nèi)用戶的資源分配。本發(fā)明為一種基于博弈理論和在線學(xué)習(xí)的分布式資源分配方法。資源分配時(shí)同時(shí)考慮信道選擇和功率控制,博弈效用函數(shù)的設(shè)計(jì)不僅考慮到用戶自身得到的效用值,同時(shí)考慮該用戶對(duì)其他用戶效用值的影響,從而實(shí)現(xiàn)最小化干擾的目的。本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)在于,(1)本發(fā)明充分利用智能網(wǎng)關(guān)(控制中心,即大型計(jì)算機(jī))的高效、快速計(jì)算優(yōu)勢(shì),將用戶需要完成的基于博弈論的資源分配學(xué)習(xí)方法映射到智能網(wǎng)關(guān)處進(jìn)行快速運(yùn)算,避免了集中式資源分配方式存在的全網(wǎng)計(jì)算量大的缺陷,實(shí)現(xiàn)完全分布式資源分配,因而適用于大規(guī)模、超密集網(wǎng)絡(luò);(2)本發(fā)明同時(shí)考慮了降低干擾策略的信道選擇和功率控制兩個(gè)方面,分步實(shí)現(xiàn)信道資源分配和功率控制。其中,信道選擇先粗略地實(shí)現(xiàn)干擾降低的目的,功率控制進(jìn)一步降低用戶間干擾,提高用戶的通信速率,因此本發(fā)明在性能上進(jìn)一步降低干擾、提高全網(wǎng)吞吐量;此外,在控制中心處實(shí)現(xiàn)了完全分布式的資源分配,避免了集中式在計(jì)算量方面的缺陷,因此適用于大規(guī)模網(wǎng)絡(luò);(3)本發(fā)明針對(duì)功率控制,提出基于邊際效用的功率控制效用函數(shù),該效用函數(shù)不僅考慮了該用戶得到的速率,同時(shí)考慮了該用戶對(duì)同信道上其他用戶的干擾,因此可以最小化用戶間干擾、最大化系統(tǒng)吞吐量(用戶的通信速率)。附圖說(shuō)明圖1是使用本發(fā)明方法的一種系統(tǒng)模型。圖2是本發(fā)明所述微蜂窩網(wǎng)絡(luò)中的分布式資源分配方法流程示意圖。圖3是本發(fā)明實(shí)施例中任意用戶的信道選擇收斂示意過(guò)程。圖4是本發(fā)明實(shí)施例中任意用戶的功率選擇收斂示意過(guò)程。圖5是本發(fā)明實(shí)施例中不同信道數(shù)下吞吐量性能隨微蜂窩數(shù)的變數(shù)示意圖。圖6是本發(fā)明方法與現(xiàn)有演化博弈方法的吞吐量性能比較示意圖。具體實(shí)施方式容易理解,依據(jù)本發(fā)明的技術(shù)方案,在不變更本發(fā)明的實(shí)質(zhì)精神的情況下,本領(lǐng)域的一般技術(shù)人員可以想象出本發(fā)明微蜂窩網(wǎng)絡(luò)中的分布式資源分配方法流的多種實(shí)施方式。因此,以下具體實(shí)施方式和附圖僅是對(duì)本發(fā)明的技術(shù)方案的示例性說(shuō)明,而不應(yīng)當(dāng)視為本發(fā)明的全部或者視為對(duì)本發(fā)明技術(shù)方案的限制或限定。結(jié)合圖1,是使用本發(fā)明所述微蜂窩網(wǎng)絡(luò)中的分布式資源分配方法的分布式資源分配系統(tǒng)模型。系統(tǒng)中包含1個(gè)控制中心,S個(gè)微蜂窩,N個(gè)用戶,以及M個(gè)正交可用信道。本發(fā)明的基本思想是,在實(shí)際的微蜂窩網(wǎng)絡(luò)映射到位于控制中心處的一個(gè)虛擬判決網(wǎng)絡(luò)(決策者是一些認(rèn)知代理),每一個(gè)認(rèn)知代理對(duì)應(yīng)一個(gè)終端用戶。將信道選擇和功率控制問(wèn)題分別建模為博弈模型,博弈的參與者是所有的認(rèn)知代理。網(wǎng)絡(luò)中的用戶將自己的地理位置信息上報(bào)給所屬的微基站,微基站將覆蓋范圍內(nèi)所有用戶的信息分別上報(bào)給虛擬判決網(wǎng)絡(luò)中對(duì)應(yīng)的認(rèn)知代理。在信道選擇階段,認(rèn)知代理選擇一個(gè)信道,并根據(jù)其他代理的信道選擇情況計(jì)算當(dāng)前受到的干擾水平。利用空間自適應(yīng)學(xué)習(xí)算法,根據(jù)本信道選擇的干擾水平更新該信道的選擇概率。在下一時(shí)隙,認(rèn)知代理選擇所有信道中概率值最大的信道接入(概率值大說(shuō)明代理在該信道上受到的干擾水平低)。多次迭代學(xué)習(xí)之后,所有認(rèn)知代理的信道選擇實(shí)現(xiàn)收斂,并將信道選擇結(jié)果作為輸入進(jìn)入功率控制階段。此時(shí),所有認(rèn)知代理要選擇在接入信道上與所屬微基站的通信功率。認(rèn)知代理選擇一個(gè)功率之后計(jì)算當(dāng)前功率得到的數(shù)據(jù)速率,利用Q學(xué)習(xí)算法,將得到的速率值轉(zhuǎn)化為該功率的選擇概率。多次迭代學(xué)習(xí)之后,所有認(rèn)知代理的功率選擇可以實(shí)現(xiàn)收斂。最后,控制中心將資源分配結(jié)果下發(fā)給各個(gè)微基站,微基站完成微蜂窩內(nèi)用戶的資源分配。本發(fā)明的具體實(shí)施包括兩個(gè)部分,每部分步驟如下:第一部分:信道選擇步驟1:信道選擇博弈模型構(gòu)建,完成以下工作:1.1博弈模型:將信道選擇問(wèn)題建模為一個(gè)博弈模型,定義為該博弈模型中包含三個(gè)組成部分,其中,是所有參與博弈的認(rèn)知代理的集合,An是認(rèn)知代理n的可用信道選擇策略空間,且un是認(rèn)知代理n的效用函數(shù)。1.2效用函數(shù):定義任意認(rèn)知代理信道選擇受到的干擾水平為In,且In的定義如式(1)所示式(1)中,an是認(rèn)知代理n的信道選擇,αn是用戶n的活動(dòng)概率(即有通信需求的概率),是認(rèn)知代理j所屬微基站j*在信道aj上的發(fā)射功率,是用戶n和微基站j*之間的信道增益。是微基站j*到用戶n之間的距離,γ是路徑損耗因子。函數(shù)I{aj=an}滿足式(2)I{aj=an}=1,aj=an0,aj≠an---(4)]]>考慮到信道選擇中的干擾控制問(wèn)題,將任意認(rèn)知代理n的信道選擇的效用函數(shù)un定義為如式(3)所示:式(3)中,an是認(rèn)知代理n選擇的信道,a-n是除認(rèn)知代理n以外其余所有認(rèn)知代理選擇的信道,aj是認(rèn)知代理j的信道選擇,n*是認(rèn)知代理n對(duì)應(yīng)用戶所屬的微基站,是微基站n*在信道an上的發(fā)射功率,是微基站n*與認(rèn)知代理j所對(duì)應(yīng)用戶之間的信道增益,αn是用戶n的活動(dòng)概率(即有通信需求的概率),αj是用戶j的活動(dòng)概率。同理,j*是認(rèn)知代理j對(duì)應(yīng)用戶所屬的微基站,是基站j*在信道aj上的發(fā)射功率,是用戶n和微基站j*之間的信道增益;是微基站j*到用戶n之間的距離,γ是路徑損耗因子,且函數(shù)I{aj=an}滿足上式(2)。1.3博弈的優(yōu)化目標(biāo):以式(3)的效用函數(shù)為優(yōu)化目標(biāo)進(jìn)行信道選擇,最終可以實(shí)現(xiàn)全網(wǎng)干擾水平最小化的優(yōu)化目標(biāo)如式(4)所示,公式(4)說(shuō)明,信道選擇的博弈優(yōu)化目標(biāo)是最小化系統(tǒng)中所有認(rèn)知代理受到的干擾水平之和。以上式(4)為優(yōu)化目標(biāo)進(jìn)行信道選擇,可以實(shí)現(xiàn)最小化用戶之間干擾的目的。步驟2:進(jìn)行信道選擇,更新信道選擇概率,完成以下工作:2.1初始化:每個(gè)認(rèn)知代理從它的可用信道集Ai中等概率隨機(jī)選擇一個(gè)信道ai(0)。2.2認(rèn)知代理選擇:通過(guò)自組織的方式,認(rèn)知代理n被隨機(jī)選出進(jìn)行信道選擇概率更新。此時(shí)所有認(rèn)知代理保持當(dāng)前信道選擇不變,被選擇的代理n按照式(3)計(jì)算其在當(dāng)前時(shí)隙內(nèi)信道選擇an(k)獲得的效用函數(shù)un(k),k代表當(dāng)前的時(shí)隙。2.3探測(cè):之后,被選出的代理n以概率1/|An|隨機(jī)地在可用信道集中選擇一個(gè)信道m(xù),其中|An|指代理n的可用信道數(shù)目。所有認(rèn)知代理保持當(dāng)前的信道選擇不變,代理n按照式(3)估計(jì)其在當(dāng)前探測(cè)信道m(xù)獲得的效用函數(shù)vm。2.4更新信道選擇概率:被選出的代理n根據(jù)以下規(guī)則更新信道選擇概率:Pr[an(k+1)=an(k)]=1-exp{[un(k)/X]β}YPr[an(k+1)=m]=1-exp{[vm/X]β}Y---(7)]]>其中,Pr[an(k+1)=an(k)]是認(rèn)知代理n在第k+1個(gè)時(shí)隙與第k個(gè)時(shí)隙選擇相同信道的概率,Pr[an(k+1)=m]是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇信道m(xù)的概率,Y=exp{un(k)β}+exp{vmβ},β是學(xué)習(xí)參數(shù),k代表當(dāng)前的時(shí)隙。X是所有代理都選擇同一信道時(shí)的總干擾水平,un(k)為代理n在當(dāng)前時(shí)隙內(nèi)信道選擇an(k)獲得的效用函數(shù),vm為代理n在當(dāng)前探測(cè)信道m(xù)獲得的效用函數(shù)。2.5更新信道選擇:被選出的代理n根據(jù)更新后的信道選擇概率,選擇概率值最大的信道接入。步驟3:循環(huán)步驟2.2-2.5,直至所有認(rèn)知代理的信道選擇實(shí)現(xiàn)收斂,即以概率1選擇某一信道接入。第二部分:功率選擇步驟1:功率選擇博弈模型構(gòu)建,完成以下工作:1.1博弈模型:將功率選擇問(wèn)題建模為一個(gè)博弈模型,定義為該博弈模型中包含三個(gè)組成部分,其中,是所有參與博弈的認(rèn)知代理的集合,Bn是代理n的功率選擇策略空間。本發(fā)明考慮到實(shí)際中微基站可用的發(fā)射功率是離散的,因此定義可用功率策略空間為Bn={P1,P2,...,PL},其中Pl為任意一個(gè)可用的發(fā)射功率。Un是認(rèn)知代理n的效用函數(shù)。1.2效用函數(shù):考慮到任意微基站n*(用戶n所屬的微基站)的最大功率限制功率選擇應(yīng)滿足公式(6)所示的限制條件,式(6)說(shuō)明,同一微基站下所有用戶的功率之和不能超過(guò)該基站的最大功率限制。這里,為微基站n*與該基站下選擇信道m(xù)的用戶之間的通信功率。在下面的步驟內(nèi)容里,所有的用戶將以數(shù)據(jù)速率最大化為原則來(lái)調(diào)整該功率。假如認(rèn)知代理n的信道選擇結(jié)果為信道c,根據(jù)第一部分信道選擇結(jié)果,定義信道c的認(rèn)知代理集合為Mc,根據(jù)香農(nóng)公式得到用戶n在選擇信道c、功率時(shí)的速率rn如式(7)所示:式(7)中,B是信道帶寬,σ是噪聲功率。αn是用戶n的活動(dòng)概率(即有通信需求的概率),αj是用戶j的活動(dòng)概率。n*是認(rèn)知代理n對(duì)應(yīng)用戶所屬的微基站,是微基站n*在信道c上的發(fā)射功率,是微基站n*與認(rèn)知代理n所對(duì)應(yīng)用戶之間的信道增益。同理,j*是認(rèn)知代理j對(duì)應(yīng)用戶所屬的微基站,是微基站j*在信道c上的發(fā)射功率,hj*n是用戶n和微基站j*之間的信道增益。是微基站n*(用戶n所屬的微基站)的最大功率限制??紤]到功率選擇中的用戶速率最大化的原則,定義任意認(rèn)知代理n的效用函數(shù)如式(8)所示,Un(bn,b-n)=rn+Σi∈Mc,i≠nri-Σi∈Mc,i≠nri(n)---(10)]]>式(8)中,bn是認(rèn)知代理n的功率選擇,b-n是除代理n以外其余所有認(rèn)知代理的功率選擇。rn是根據(jù)香農(nóng)公式得到的用戶n在選擇信道c上的速率,ri是用戶i在信道c上的速率。表示當(dāng)認(rèn)知代理n所屬的微基站發(fā)射功率為0時(shí),用戶i得到的速率,其如公式(9)所示,ri(n)=αiBlog(1+Pi*chi*iΣj∈Mc,j≠nαjPj*chj*i+σ)---(11)]]>公式(9)中,Mc是選擇信道c的認(rèn)知代理的集合,αi是用戶i的活動(dòng)概率,是微基站i*在信道c上的發(fā)射功率,是微基站i*與認(rèn)知代理i所對(duì)應(yīng)用戶之間的信道增益。同理,αj是用戶j的活動(dòng)概率,是微基站j*在信道c上的發(fā)射功率,是微基站j*與用戶j所對(duì)應(yīng)用戶之間的信道增益。1.3博弈優(yōu)化目標(biāo):按照最大化(8)式所示的效用函數(shù)進(jìn)行功率選擇時(shí),可以實(shí)現(xiàn)全網(wǎng)所有用戶通信速率的最大化,如公式(10)所示:公式(10)說(shuō)明,功率選擇的博弈優(yōu)化目標(biāo)是最大化系統(tǒng)中所有用戶得到的數(shù)據(jù)速率之和。以上式(10)為優(yōu)化目標(biāo)進(jìn)行信道選擇,可以實(shí)現(xiàn)最大化用戶通信速率的目的。步驟2:進(jìn)行功率選擇,更新功率選擇概率,完成以下工作:2.1定義任意代理n的功率選擇概率矢量為pn={pn,1,pn,2,...,pn,L},pn,l代表了代理n選擇功率l的概率。2.2初始化:初始化所有代理的功率選擇概率矢量為pn={1/L,1/L,...,1/L},每個(gè)認(rèn)知代理從它的可用功率集Bn中等概率隨機(jī)選擇一個(gè)功率bn(0)。為了避免認(rèn)知代理之間進(jìn)行功率選擇信息交換,實(shí)現(xiàn)完全分布式的自主功率選擇,本發(fā)明采用強(qiáng)化學(xué)習(xí)中的Q學(xué)習(xí)來(lái)實(shí)現(xiàn)功率選擇收斂。初始化Q學(xué)習(xí)中的Q值矢量為Qn,l(0)=0,(Qn,l是認(rèn)知代理n選擇功率l對(duì)應(yīng)的Q值)。2.3計(jì)算效用函數(shù)值:所有認(rèn)知代理根據(jù)當(dāng)前的功率選擇,按照式(8)計(jì)算當(dāng)前的功率效用函數(shù)值。2.4更新Q值:每一個(gè)認(rèn)知代理根據(jù)功率選擇得到的效用函數(shù)值,按照式(11)、(12)和(13)所示規(guī)則更新Q值,Qn,l(k+1)=Qn,l(k)+λkI(bn(k),l)(U~n(k)-Qn,l(k))---(13)]]>U~n(k)=Un(k)Rl---(14)]]>Rl=αnBlog(1+Pn*anhn*nΣj∈Mc,j≠nαjPj*ajhj*n)---(15)]]>其中,Qn,l(k)是認(rèn)知代理n在第k個(gè)時(shí)隙選擇功率l時(shí)得到的Q值大小,Qn,l(k+1)是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇功率l時(shí)得到的Q值。Un(k)是認(rèn)知代理n在第k個(gè)時(shí)隙得到的效用函數(shù),λk是步進(jìn)因子,I(bn(k),l)的定義如式(14)所示,I(bn(k),l)=1,bn(k)=l0,bn(k)≠l---(14)]]>公式(14)中,bn(k)是認(rèn)知代理n在第k個(gè)時(shí)隙的功率選擇。2.5更新功率選擇概率:每一個(gè)認(rèn)知代理根據(jù)當(dāng)前的功率選擇概率和更新后的Q值,按照式(15)所示原則更新功率選擇概率,pn,l(k+1)=pn,l(k)(1+η)Qn,l(k)Σl′=1Lpn,l′(k)(1+η)Qn,l′(k),∀n,l---(15)]]>其中,pn,l(k+1)是認(rèn)知代理n在第k+1個(gè)時(shí)隙選擇功率l的概率,pn,l'(k)是認(rèn)知代理n在第k個(gè)時(shí)隙選擇功率l'的概率。代表對(duì)任意的認(rèn)知代理n,η是學(xué)習(xí)參數(shù)。2.6更新功率選擇:任意一個(gè)認(rèn)知代理根據(jù)更新后的功率選擇概率,選擇概率值最大的功率bn(k+1)。步驟3:循環(huán)步驟2.3-2.6,直至所有認(rèn)知代理的功率選擇實(shí)現(xiàn)收斂,即以概率1選擇某一功率。實(shí)施例:本發(fā)明的一個(gè)具體實(shí)施例如下描述,系統(tǒng)仿真采用Matlab軟件,參數(shù)設(shè)定不影響一般性。該實(shí)施例中,驗(yàn)證信道選擇和功率選擇收斂(圖3和圖4)時(shí),微蜂窩的總數(shù)S=15,驗(yàn)證吞吐量(系統(tǒng)所有用戶平均通信速率)性能時(shí)(圖5和圖6),微蜂窩的總數(shù)從10增長(zhǎng)到20。任意微蜂窩下所覆蓋的用戶數(shù)為(1,2,3)中的一個(gè)任意值。信道帶寬為B=200kHz,噪聲功率為σ=-130dB,路徑損耗因子為γ=3.7??捎眯诺罃?shù)為M=4,可用離散功率空間為{10mw,30mw,50mw,70mw,90mw},微基站最大發(fā)射功率為100mw。學(xué)習(xí)參數(shù)β=k,λk=1/k,η=0.4,其中,k是學(xué)習(xí)算法的迭代次數(shù)。所有用戶的活動(dòng)概率為0~1之間的任意值。S個(gè)微基站均勻地分布在100m×100m的方形范圍內(nèi),且每個(gè)微基站的覆蓋半徑為10m,用戶均勻地分布在所屬微基站的覆蓋范圍內(nèi)。該實(shí)施例中,首先以干擾水平最小化為原則進(jìn)行多用戶的信道選擇,然后基于信道選擇結(jié)果,以吞吐量最大化為原則進(jìn)行功率選擇。在信道選擇階段,假設(shè)所有微基站的發(fā)射功率為50mw。之后在功率選擇階段,進(jìn)一步優(yōu)化每個(gè)基站在每個(gè)選擇信道上的發(fā)射功率。本發(fā)明提出的微蜂窩網(wǎng)絡(luò)的分布式資源分配方法的具體過(guò)程如下:步驟1:信道選擇初始化。初始化迭代次數(shù)k=0,每個(gè)認(rèn)知代理從它的可用信道集Ai中等概率隨機(jī)選擇一個(gè)信道ai(0)。步驟2:信道選擇概率更新。通過(guò)自組織的方式,認(rèn)知代理n被選擇出來(lái)進(jìn)行策略更新。以第k=2個(gè)時(shí)隙為例,認(rèn)知代理n=9被選出。該代理在本時(shí)隙內(nèi)的信道選擇和信道探測(cè)分別為an(k)=2,m=4,對(duì)應(yīng)的效用函數(shù)如表1所示。表1:認(rèn)知代理n=9不同策略對(duì)應(yīng)的效用值信道選擇an(k)=2m=4效用值/X0.39770.1281進(jìn)一步按照信道選擇概率更新規(guī)則(5)可知,更新后的信道選擇概率如表2所示。表2:認(rèn)知代理n=9第k=2個(gè)時(shí)隙的信道選擇概率信道編號(hào)1234選擇概率00.368400.6316根據(jù)表2的概率更新結(jié)果可知,該代理在下一時(shí)隙選擇信道4接入并保持不變,直至該用戶再次被選擇出來(lái)進(jìn)行策略更新。步驟3:信道選擇概率收斂。循環(huán)執(zhí)行步驟2多個(gè)時(shí)隙后,信道選擇實(shí)現(xiàn)收斂。以第k=1000個(gè)時(shí)隙為例,任意選擇系統(tǒng)中的一個(gè)認(rèn)知代理n=4,該代理的信道選擇概率如表3所示??梢?jiàn),該代理的信道選擇實(shí)現(xiàn)收斂,最終以概率1選擇信道3。其他認(rèn)知代理的信道選擇概率最終結(jié)果與表3相似,由于認(rèn)知代理數(shù)目較多(認(rèn)知代理總數(shù)N=28),這里不再一一列出。表3:認(rèn)知代理n=4在第k=1000個(gè)時(shí)隙的信道選擇概率信道編號(hào)1234選擇概率0010網(wǎng)絡(luò)中在第k=1000個(gè)時(shí)隙所有認(rèn)知代理的信道選擇實(shí)現(xiàn)收斂,最終的信道選擇結(jié)果如表4所示。表4:所有認(rèn)知代理最終的信道選擇結(jié)果步驟4:功率選擇初始化。初始化迭代次數(shù)k=0,功率選擇概率pn={1/5,1/5,...,1/5},每個(gè)認(rèn)知代理從它的可用功率集Bn中等概率隨機(jī)選擇一個(gè)功率bn(0)。初始化Q值矢量為Qn,l(0)=0,步驟5:更新Q值和功率選擇概率?;谛诺肋x擇結(jié)果,所有認(rèn)知代理選擇接入信道的通信功率。根據(jù)自己和其他代理的功率選擇結(jié)果得到效用值,并據(jù)此更新Q值和功率選擇概率。以第k=1個(gè)時(shí)隙為例,任意代理n=1的功率選擇為10mw,對(duì)應(yīng)的Q值更新結(jié)果如表5所示。表5:認(rèn)知代理n=1在第k=1個(gè)時(shí)隙的功率選擇Q值結(jié)果功率10mw30mw50mw70mw90mwQ值0.22010000[0122]根據(jù)表5得到的Q值更新結(jié)果,按照功率選擇概率更新原則(15)可得功率選擇概率,如表6所示。表6:認(rèn)知代理n=1在第k=1個(gè)時(shí)隙的功率選擇概率功率10mw30mw50mw70mw90mw選擇概率0.21200.19700.19700.19700.1970步驟6:功率選擇概率收斂。循環(huán)執(zhí)行步驟5多個(gè)時(shí)隙后,功率選擇實(shí)現(xiàn)收斂。以第k=500個(gè)時(shí)隙為例,任意選擇系統(tǒng)中的一個(gè)認(rèn)知代理n=4,該代理的功率選擇概率如表7所示。可見(jiàn),該代理的功率選擇實(shí)現(xiàn)收斂,最終以概率1選擇功率30mw。其他認(rèn)知代理的功率選擇概率最終結(jié)果與表7相似,這里不再一一列出。表7:認(rèn)知代理n=4在第k=500個(gè)時(shí)隙的功率選擇概率功率10mw30mw50mw70mw90mw選擇概率01000網(wǎng)絡(luò)中共有28個(gè)用戶,圖3和圖4分別為網(wǎng)絡(luò)中任意一個(gè)用戶的信道選擇和功率選擇的概率收斂過(guò)程。從圖3中可以看出,該用戶在大約300次迭代學(xué)習(xí)之后,以概率1選擇信道1。從圖4可以看出,該用戶在大約250次迭代學(xué)習(xí)之后選擇功率50mw。上述兩個(gè)仿真結(jié)果說(shuō)明,本發(fā)明所提的學(xué)習(xí)算法能夠?qū)崿F(xiàn)微蜂窩網(wǎng)絡(luò)中穩(wěn)健的信道接入和功率控制,且算法收斂速度較快。為清晰體現(xiàn)本發(fā)明所提方法的吞吐量性能,圖5給出了在不同信道數(shù)下吞吐量性能隨微蜂窩數(shù)的變化情況。在該仿真中,假設(shè)所有微蜂窩下覆蓋的用戶數(shù)為2。從圖5中可以看出:1)網(wǎng)絡(luò)的平均吞吐量性能隨微蜂窩數(shù)的增大而減小,2)吞吐量性能隨可用信道數(shù)的增加而提高。當(dāng)網(wǎng)絡(luò)中微蜂窩數(shù)量增加時(shí),網(wǎng)絡(luò)中總的用戶數(shù)增加,用戶之間的干擾加大。網(wǎng)絡(luò)平均吞吐量定義為所有用戶的速率之和的平均值,當(dāng)用戶間干擾增大時(shí),用戶得到的數(shù)據(jù)速率減小,因而網(wǎng)絡(luò)平均吞吐量性能降低。此外,當(dāng)網(wǎng)絡(luò)的可用信道數(shù)增加時(shí),選擇同一信道的用戶之間的干擾減小,因此用戶的數(shù)據(jù)速率增大,網(wǎng)絡(luò)平均吞吐量性能提高。為了進(jìn)一步體現(xiàn)本發(fā)明所提分布式資源分配算法的性能優(yōu)勢(shì),圖6給出了本發(fā)明方法與已有研究中所提的演化博弈方法的性能對(duì)比結(jié)果。在該仿真中,假設(shè)所有微蜂窩內(nèi)覆蓋的用戶數(shù)為1。從圖6可以看出,由于本發(fā)明方法分步考慮了信道選擇和功率控制,兩部分的博弈效用函數(shù)都不僅考慮了本用戶的效用,同時(shí)考慮了本用戶對(duì)其他用戶的干擾影響,因此相較于演化博弈方法,可以進(jìn)一步降低用戶之間的干擾、提高系統(tǒng)吞吐量。綜上,本發(fā)明提出的方法同時(shí)考慮了微蜂窩網(wǎng)絡(luò)中的資源分配的信道選擇和功率控制兩個(gè)問(wèn)題。信道選擇粗略的實(shí)現(xiàn)了用戶間的干擾控制,功率選擇部分,通過(guò)設(shè)計(jì)基于邊際效用的效用函數(shù)進(jìn)一步實(shí)現(xiàn)了干擾減小,實(shí)現(xiàn)了全網(wǎng)吞吐量的最大化。此外,本發(fā)明利用了智能網(wǎng)關(guān)(控制中心)的大量、快速數(shù)據(jù)處理的優(yōu)勢(shì),將多用戶的資源分配問(wèn)題映射到控制中心的虛擬決策網(wǎng)絡(luò)進(jìn)行計(jì)算,實(shí)現(xiàn)了完全分布式的資源分配,避免了集中式方式在計(jì)算量方面的缺陷,因而適用于實(shí)際的大容量、超密集網(wǎng)絡(luò)中。當(dāng)前第1頁(yè)1 2 3