本發(fā)明屬于無線通信領(lǐng)域中的認(rèn)知無線電技術(shù),具體涉及一種具備異常數(shù)據(jù)凈化能力的在線頻譜預(yù)測方法。
背景技術(shù):
移動網(wǎng)和物聯(lián)網(wǎng)的飛速發(fā)展正在侵占著有限的頻譜資源,因此人們迫切需要新的頻譜資源來滿足這種需要。一般通過頻譜數(shù)據(jù)分析,比如頻譜感知和頻譜預(yù)測,來捕獲頻譜演化過程中的相關(guān)信息。頻譜感知主要是確定當(dāng)前無線電頻譜的狀態(tài);而頻譜預(yù)測則通過探索頻譜數(shù)據(jù)之間的相關(guān)性和規(guī)律性,基于歷史數(shù)據(jù),預(yù)測未來的無線電頻譜狀態(tài)。
高效頻譜預(yù)測的挑戰(zhàn)之一就是歷史數(shù)據(jù)觀察中數(shù)據(jù)異常、測量誤差及數(shù)據(jù)丟失的出現(xiàn)。數(shù)據(jù)異常在實際頻譜數(shù)據(jù)中是很常見的。例如,無線傳輸過程的開放性和不斷智能化的頻譜感知可能導(dǎo)致多種多樣的數(shù)據(jù)偽造攻擊。頻譜測量的不完美性同樣不可避免,特別是當(dāng)?shù)统杀绢l譜傳感器被用于收集數(shù)據(jù)時。數(shù)據(jù)丟失同樣常見,原因有三:測量誤差和傳輸丟包;測量設(shè)備能力的局限性;現(xiàn)有的頻譜測量算法僅僅測量每一時隙中的部分頻譜帶。同時,很多網(wǎng)絡(luò)操作需要完整的、干凈的數(shù)據(jù)。因此,穩(wěn)健、精確地捕獲頻譜狀態(tài)的演化并預(yù)測未來頻譜狀態(tài)是極具挑戰(zhàn)性的。
另一個挑戰(zhàn)是頻譜預(yù)測方法設(shè)計中的數(shù)據(jù)實時處理能力。過期的頻譜預(yù)測是無用的?,F(xiàn)有的研究大多數(shù)集中在批處理算法上,這極大地限制了儲存、分析實時頻譜數(shù)據(jù)的可擴(kuò)展性,同時也限制了對非平穩(wěn)頻譜數(shù)據(jù)演化的追蹤能力。將頻譜狀態(tài)數(shù)據(jù)看作一個矩陣,其行表示頻域,列表示時域,那么隨著行與列的增加,批處理算法的計算復(fù)雜度和時間消耗都在上升。另外,批處理算法假想歷史數(shù)據(jù)是完整的,它捕獲的是頻譜演化的長期平穩(wěn)數(shù)據(jù),但它平均了相關(guān)的短期非平穩(wěn)變化。
技術(shù)實現(xiàn)要素:
本發(fā)明提出一種具備異常數(shù)據(jù)凈化能力的在線頻譜預(yù)測方法,可以穩(wěn)健、精確地捕獲頻譜狀態(tài)的演化并預(yù)測未來頻譜狀態(tài),同時具有實時處理數(shù)據(jù)的能力。
為了解決上述技術(shù)問題,本發(fā)明提供一種具備異常數(shù)據(jù)凈化能力的在線頻譜預(yù)測方法,其特征在于,用式(1)所示矩陣表示頻譜數(shù)據(jù)矩陣,
式(1)中,集合ωt為一個包含f×t個元素的集合,其元素為頻譜數(shù)據(jù)矩陣中未缺失的數(shù)據(jù),集合ωt之外的元素為頻譜數(shù)據(jù)矩陣中缺失的數(shù)據(jù);
式(1)中,矩陣xt為具有f行t列的頻譜數(shù)據(jù)矩陣,矩陣xt的每一個元素xf,t,f∈{1,...,f},t∈{1,...,t}表示第f個頻段在第t個時隙的頻譜狀態(tài),矩陣xt的每一行元素xf,.:=[xf,1,xf,2,,...,xf,t],f∈{1,...,f}表示在連續(xù)t個時隙內(nèi)、第f個頻段的頻譜狀態(tài),矩陣xt的每一列x.,t:=[x1,t,x2,t,...,xf,t]',t∈{1,...,t}表示在第t個時隙內(nèi)、全部f個頻段的頻譜狀態(tài)分布;
式(1)中,矩陣zt大小為f×t,其第f行第t列元素對應(yīng)信號分量zf,t,f=1,...,f,t=1,...,t;矩陣at大小為f×t,其第f行第t列元素對應(yīng)異常數(shù)據(jù)分量af,t,f=1,...,f,t=1,...,t;矩陣vt大小為f×t,其第f行第t列元素對應(yīng)噪聲分量vf,t,f=1,...,f,t=1,...,t;
將矩陣xt的前t-1列的全部f個頻段的頻譜狀態(tài)視作歷史頻譜數(shù)據(jù),根據(jù)所述歷史頻譜數(shù)據(jù)預(yù)測第t個時隙全部f個頻段的頻譜數(shù)據(jù)。
進(jìn)一步,根據(jù)所述歷史頻譜數(shù)據(jù)預(yù)測第t個時隙全部f個頻段頻譜數(shù)據(jù)的方法為:
步驟一、初始化:
將矩陣xt第t列的f個頻段頻譜數(shù)據(jù)置為零,得到頻譜數(shù)據(jù)矩陣
輸入?yún)?shù)r,β,其中r是信號分量zt的秩的上限;β為遺忘因子,且0≤β≤1;輸入秩控制參數(shù)
步驟二、在線優(yōu)化:
從時隙t=1開始,每過一個時隙,t增加1,每當(dāng)有時隙t改變時,執(zhí)行以下過程:
2.1如式(2)所示計算中間變量矩陣d[t]:
其中,ir是一個為常數(shù)的單位矩陣;ot是一個對角矩陣,其對角元素的取值為:如果第t個時隙的第f個頻段屬于初始化時選取的k個頻段之一,則該對角矩陣的第f個對角元素為1,否則置為0;p'[t-1]是p[t-1]的轉(zhuǎn)置矩陣;t=1時矩陣p[t-1]的值由初始化給出;t>1時矩陣p[t-1]的值由后續(xù)的計算給出;
2.2如式(3)所示計算中間變量矩陣f[t]:
其中,矩陣d'[t]是矩陣d[t]的轉(zhuǎn)置矩陣;
2.3如式(4)所示計算異常數(shù)據(jù)分量a[t]:
其中,
2.4如式(5)所示計算中間變量q[t]:
其中,
2.5針對各個頻段f=1,...,f,如式(6)、(7)以及(8)依次計算如下三個中間變量:
gf[t]=βgf[t-1]+ωf,tq[t]q'[t](6)
其中,pf[t]是p[t]第f;,ωf,t為一個符號函數(shù),當(dāng)?shù)趖個時隙的第f個頻段的頻譜值
2.6如式(9)所示計算第t個時隙中所有f個頻段的頻譜狀態(tài)
至此預(yù)測出第t個時隙所有f個頻段的頻譜狀態(tài)。
本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點在于:(1)本發(fā)明方法綜合考慮了信號分量的低秩特性和異常數(shù)據(jù)分量的稀疏特性,考慮了歷史頻譜數(shù)據(jù)可能不完整或有缺失這一客觀條件,通過數(shù)據(jù)凈化克消除了頻譜數(shù)據(jù)中存在偏差和異常情況的影響;(2)本發(fā)明方法通過在線優(yōu)化克服了傳統(tǒng)離線頻譜預(yù)測方法時延大、預(yù)測不及時的局限性,能夠在歷史頻譜數(shù)據(jù)量不斷增大的情況下快速實時預(yù)測頻譜狀態(tài)。
附圖說明
圖1為本發(fā)明頻譜預(yù)測的原理示意圖。
圖2為本發(fā)實驗性能示意圖。
具體實施方式
容易理解,依據(jù)本發(fā)明的技術(shù)方案,在不變更本發(fā)明的實質(zhì)精神的情況下,本領(lǐng)域的一般技術(shù)人員可以想象出本發(fā)明具備異常數(shù)據(jù)凈化能力的在線頻譜預(yù)測方法的多種實施方式。因此,以下具體實施方式和附圖僅是對本發(fā)明的技術(shù)方案的示例性說明,而不應(yīng)當(dāng)視為本發(fā)明的全部或者視為對本發(fā)明技術(shù)方案的限制或限定。
圖1是本發(fā)明對頻譜進(jìn)行預(yù)測的原理示意圖。本發(fā)明中用一個f行t列的頻譜數(shù)據(jù)矩陣xt∈rf×t來表示,其行表示頻域,列表示時域。頻譜數(shù)據(jù)矩陣中的每一個矩陣元素xf,t,f∈{1,...,f},t∈{1,...,t}表示第f個頻段在第t個時隙的頻譜狀態(tài)。頻譜數(shù)據(jù)矩陣每一行xf,.:=[xf,1,xf,2,,...,xf,t],f∈{1,...,f}表示在連續(xù)t個時隙內(nèi)、第f個頻段的頻譜狀態(tài),矩陣每一列x.,t:=[x1,t,x2,t,...,xf,t]',t∈{1,...,t}表示在第t個時隙內(nèi)、全部f個頻段的頻譜狀態(tài)分布。本發(fā)明將前t-1列的全部f個頻段的頻譜狀態(tài)視作歷史頻譜數(shù)據(jù),歷史數(shù)據(jù)中包括正常頻譜數(shù)據(jù)、異常頻譜數(shù)據(jù)和缺失頻譜數(shù)據(jù),然后根據(jù)歷史頻譜數(shù)據(jù)準(zhǔn)確、高效地預(yù)測出第t列的全部f個頻段的頻譜狀態(tài),即根據(jù)歷史頻譜數(shù)據(jù)預(yù)測出第t個時隙全部f個頻段的頻譜數(shù)據(jù)。
頻譜數(shù)據(jù)模型
考慮到測量頻譜數(shù)據(jù)時,記錄了各自獨立的f個頻段下的t個時隙的頻譜數(shù)據(jù)。本發(fā)明首先建立第t個時隙測量到的第f個頻段上的頻譜數(shù)據(jù)xf,t的一般化模型。該模型能 夠同時測量歷史頻譜數(shù)據(jù)、噪聲信號、異常數(shù)據(jù)及數(shù)據(jù)丟失等因素。本發(fā)明用公式(1)所示的頻譜數(shù)據(jù)模型表示頻譜數(shù)據(jù)xf,t,
xf,t=zf,t+af,t+vf,t,f=1,...f,t=1,...,t,(1)
公式(1)中,zf,t表示信號分量,af,t表示異常數(shù)據(jù)分量,vf,t表示噪聲分量,信號分量zf,t如式(2)所示,
zf,t=hf,t·pf,t(2)
其中,pf,t表示信號強(qiáng)度值;hf,t是一個符號函數(shù),當(dāng)前時隙的頻率下存在信號時,hf,t=1,當(dāng)不存在信號時,hf,t=0。
頻譜數(shù)據(jù)矩陣
首先,為刻畫n個頻點的占用狀態(tài),引入大小為n×n的對角矩陣rn×n,其每個對角元素取值為0或1,取值為0的對角元素對應(yīng)的頻點沒有授權(quán)信號;反之,取值為1的對角元素對應(yīng)的頻點存在授權(quán)信號。
為刻畫f個頻點下的t個時隙的頻譜數(shù)據(jù),引入大小為f×t的矩陣xt,其第f行第t列元素對應(yīng)測量到的頻譜數(shù)據(jù)xf,t,f=1,...,f,t=1,...,t;進(jìn)一步,引入大小為f×t的矩陣zt,其第f行第t列元素對應(yīng)信號分量zf,t,f=1,...,f,t=1,...,t;引入大小為f×t的矩陣vt,其第f行第t列元素對應(yīng)噪聲分量vf,t,f=1,...,f,t=1,...,t;引入大小為f×t的矩陣at,其第f行第t列元素對應(yīng)異常數(shù)據(jù)分量af,t,f=1,...,f,t=1,...,t。在此基礎(chǔ)上,可以將公式(1)所示的頻譜數(shù)據(jù)模型用公式(3)所示的頻譜數(shù)據(jù)矩陣表示,
xt=zt+at+vt(3)
其中,zt對應(yīng)信號分量,具有低秩特性;at對應(yīng)異常數(shù)據(jù)分量,具有稀疏特性;vt對應(yīng)噪聲分量,具有隨機(jī)特性。vt的引入使得zt+vt,的結(jié)構(gòu)近似于低秩,at的引入則破壞了其低秩特性。
同時,本發(fā)明引入一個包含f×t個元素的集合ωt對存在數(shù)據(jù)缺失的情況進(jìn)行建模;進(jìn)一步引入采樣算子
在線頻譜預(yù)測方法
在前述建模的基礎(chǔ)上,本發(fā)明根據(jù)前t-1個時隙的所有f個頻段的歷史頻譜數(shù)據(jù),預(yù)測第t個時隙所有f個頻段的頻譜狀態(tài),在此過程中盡可能地去除異常數(shù)據(jù)分量、隨機(jī)噪聲分量以及部分歷史數(shù)據(jù)缺失的影響。具體地,通過以下步驟實現(xiàn):
步驟一、初始化。
將前t-1個時隙所有f個頻段的頻譜狀態(tài)作為歷史頻譜數(shù)據(jù),由于待預(yù)測的第t個時隙f個頻段的所有數(shù)據(jù)均未知,因此首先第t列的f個頻段數(shù)據(jù)初始值置為零,得到頻譜數(shù)據(jù)矩陣
輸入算法參數(shù)r,β,其中r是式(3)中信號部分的秩的上限。0≤β≤1是遺忘因子,當(dāng)β<1時,歷史數(shù)據(jù)是呈指數(shù)遞減,因此近期的測量數(shù)據(jù)變得更重要。以及輸入秩控制參數(shù)
步驟二、在線優(yōu)化。
為了得到的實時的、高效的預(yù)測解,本發(fā)明采用在線交替最小化方法。本步驟采用在線優(yōu)化的方式進(jìn)行,相比于離線優(yōu)化,基于在線優(yōu)化的頻譜預(yù)測采取迭代優(yōu)化的思路,即預(yù)測第t個時隙的f個頻段的頻譜狀態(tài)時直接利用第t-1個時隙的預(yù)測結(jié)果進(jìn)行迭代更新;離線優(yōu)化則需利用前t-1個時隙的所有歷史數(shù)據(jù),計算的復(fù)雜度隨歷史數(shù)據(jù)的數(shù)量增加而增大。具體地,本發(fā)明中基于在線優(yōu)化的頻譜預(yù)測過程如下:
從時隙t=1開始,每過一個時隙,t增加1,每當(dāng)有時隙t改變時,執(zhí)行以下過程:
1)先計算中間變量矩陣d[t]:
其中,
2)計算中間變量矩陣f[t]:
其中,d'[t]是d[t]的轉(zhuǎn)置矩陣。
3)計算異常數(shù)據(jù)分量a[t]:
其中,
4)計算中間變量q[t]:
其中,
5)針對各個頻段f=1,...,f,依次計算如下三個中間變量:
gf[t]=βgf[t-1]+ωf,tq[t]q'[t](9)
至此,a[t],q[t]和p[t],分別通過公式(7)(8)和(11)得到。其中pf[t]是p[t]第f列。其中,0≤β≤1是遺忘因子,ωf,t是一個符號函數(shù),當(dāng)?shù)趖個時隙的第f個頻率處的頻譜值
6)計算獲得第t個時隙中所有f個頻段的頻譜狀態(tài)
由此獲得第t個時隙所有f個頻段的頻譜狀態(tài)。
對本發(fā)明頻譜預(yù)測方法的性能評估
本發(fā)明選擇從預(yù)測錯誤的角度來衡量頻譜預(yù)測的好壞,從現(xiàn)實的頻譜矩陣中抽取數(shù)據(jù),并將預(yù)測結(jié)果與真實數(shù)據(jù)相比較,給出預(yù)測性能評估指標(biāo):均方根誤差rmse(db), 用以衡量預(yù)測錯誤。
將第t時隙的rmse的預(yù)測定義為:
其中,zt和
本發(fā)明試驗中,使用實際測量的數(shù)據(jù)作為真實數(shù)據(jù)或者原始頻譜矩陣。然后以一個隨機(jī)的丟失速率pmiss統(tǒng)一地、獨立地從一個矩陣中抽取元素來產(chǎn)生不完整的歷史數(shù)據(jù)。向原始數(shù)據(jù)的一部分入口中注入異常數(shù)據(jù),使用的方法仍然是標(biāo)準(zhǔn)的異常注入方法。設(shè)定入口部分的異常注入為10%,并且使得數(shù)據(jù)異常規(guī)模為s=10。對于本發(fā)明提出的在線頻譜預(yù)測算法,矩陣的秩控制參數(shù)設(shè)定為
圖2展示了本發(fā)明方法預(yù)測的性能結(jié)果,其中(a)展示的是電視頻段頻譜預(yù)測結(jié)果,(b)展示的是人工產(chǎn)生的高斯隨機(jī)數(shù)據(jù)的預(yù)測結(jié)果,通過對比可以看出:1)本發(fā)明方法在數(shù)據(jù)缺失較少時預(yù)測的均方根誤差(rmse)性能更好,即圖中10%的數(shù)據(jù)缺失下性能比50%數(shù)據(jù)缺失下性能更好;2)電視頻段的預(yù)測均方根誤差(rmse)性能遠(yuǎn)好于高斯隨機(jī)數(shù)據(jù),這是因為電視頻段的頻譜數(shù)據(jù)變化規(guī)律性更強(qiáng),更容易被準(zhǔn)確預(yù)測。