基于流形學習的指紋庫自更新方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種基于流形學習的指紋庫自更新方法和裝置,涉及定位領域。本發(fā)明利用相同或相近位置信號強度在低維位置空間具有的相似性為依據(jù),基于大量無標記數(shù)據(jù),利用流形技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點,從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點,基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點,并將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量空間的數(shù)據(jù)點,最后根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高維信號向量空間的數(shù)據(jù)點更新指紋庫,實現(xiàn)了基于大量無標記數(shù)據(jù)的指紋庫自更新過程,賦予指紋庫自適應無線信號環(huán)境變化的能力,提供定位算法的魯邦性,同時降低了樣本的采集代價。
【專利說明】基于流形學習的指紋庫自更新方法和裝置
【技術領域】
[0001] 本發(fā)明涉及定位領域,特別涉及一種基于流形學習的指紋庫自更新方法和裝置。
【背景技術】
[0002] 指紋庫保存有位置空間與信號向量空間之間的映射關系,根據(jù)接收到的信號向量 和指紋庫可以確定相應的位置信息,從而實現(xiàn)定位。由此可見,建立精確的位置空間與信號 向量空間之間的映射模型,對提高定位精度至關重要。
[0003] 目前指紋庫通常采用監(jiān)督學習的訓練算法來建立的位置空間與信號向量空間之 間的映射模型,該方法在離線訓練階段需要從實際環(huán)境中采集大量的訓練數(shù)據(jù)集,訓練數(shù) 據(jù)集全部為標記數(shù)據(jù),即經(jīng)用戶確認位置的位置點的信號向量。采集帶有標記數(shù)據(jù)的訓練 數(shù)據(jù)集,樣本收集代價非常高。
[0004] 并且,無線信號容易受到環(huán)境的影響而發(fā)生變化,在信號分布變化時位置空間與 信號向量空間的映射關系會發(fā)生較大改變,此時,如果仍然按照之前建立的指紋庫進行定 位,定位精度就會急劇下降。按照現(xiàn)有技術,需要重新采集大量帶有標記數(shù)據(jù)的訓練數(shù)據(jù)集 來更新指紋庫中的信息,樣本收集代價非常高。
[0005] 由此可見,現(xiàn)有的指紋庫更新方法無法適用無線信號多變的通信環(huán)境,每次指紋 庫更新均需要采集大量帶有標記數(shù)據(jù)的訓練數(shù)據(jù)集,樣本收集代價非常高。
【發(fā)明內容】
[0006] 本發(fā)明實施例所要解決的一個技術問題是:解決指紋庫更新過程由于需要大量標 記數(shù)據(jù)的訓練數(shù)據(jù)集所導致的樣本收集代價較高的問題。
[0007] 根據(jù)本發(fā)明實施例的一個方面,提出一種基于流形學習的指紋庫自更新方法,包 括:基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點, 其中,所述高維信號向量空間的數(shù)據(jù)點包括無標記數(shù)據(jù),無標記數(shù)據(jù)是指未經(jīng)用戶確認位 置的位置點的信號向量;從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點;基于可信數(shù)據(jù)點 預測出其他位置的數(shù)據(jù)點;將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量空間的 數(shù)據(jù)點;根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高維信號向量 空間的數(shù)據(jù)點更新指紋庫。
[0008] 所述基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置空間對應 的數(shù)據(jù)點包括:在高維信號向量空間的數(shù)據(jù)點中尋找其中任意第一數(shù)據(jù)點的預設數(shù)量的鄰 居數(shù)據(jù)點;由鄰居數(shù)據(jù)點構造鄰接圖,并計算鄰接圖的鄰接矩陣;根據(jù)鄰接矩陣將高維信 號向量空間的第一數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點。
[0009] 所述從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點包括:通過粗大誤差濾除方法 或者距離閾值過濾方法從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點。
[0010] 所述基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點包括:采用數(shù)據(jù)插值方法或者高斯 過程方法,基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點。 toon] 所述高維信號向量空間的數(shù)據(jù)點還包括標記數(shù)據(jù);其中,標記數(shù)據(jù)是指經(jīng)用戶確 認位置的位置點的信號向量。
[0012] 根據(jù)本發(fā)明實施例的再一個方面,提出一種基于流形學習的指紋庫自更新裝置, 包括:第一映射單元,用于基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位 置空間對應的數(shù)據(jù)點,其中,所述高維信號向量空間的數(shù)據(jù)點包括無標記數(shù)據(jù),無標記數(shù)據(jù) 是指未經(jīng)用戶確認位置的位置點的信號向量;篩選單元,用于從低維位置空間的數(shù)據(jù)點中 篩選出可信數(shù)據(jù)點;預測單元,用于基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點;第二映射 單元,用于將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量空間的數(shù)據(jù)點;更新單 元,用于根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高維信號向量 空間的數(shù)據(jù)點更新指紋庫。
[0013] 所述第一映射單元,具體用于在高維信號向量空間的數(shù)據(jù)點中尋找其中任意第一 數(shù)據(jù)點的預設數(shù)量的鄰居數(shù)據(jù)點;由鄰居數(shù)據(jù)點構造鄰接圖,并計算鄰接圖的鄰接矩陣; 根據(jù)鄰接矩陣將高維信號向量空間的第一數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點。
[0014] 所述篩選單元,具體用于通過粗大誤差濾除方法或者距離閾值過濾方法從低維位 置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點。
[0015] 所述預測單元,具體用于采用數(shù)據(jù)插值方法或者高斯過程方法,基于可信數(shù)據(jù)點 預測出其他位置的數(shù)據(jù)點。
[0016] 所述高維信號向量空間的數(shù)據(jù)點還包括標記數(shù)據(jù);其中,標記數(shù)據(jù)是指經(jīng)用戶確 認位置的位置點的信號向量。
[0017] 本發(fā)明利用相同位置或相近位置信號強度在低維位置空間所具有的相似性為依 據(jù),基于采集的大量無標記數(shù)據(jù),利用流形技術將高維信號向量空間的數(shù)據(jù)點映射為低維 位置空間對應的數(shù)據(jù)點,然后從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點,基于可信數(shù) 據(jù)點預測出其他位置的數(shù)據(jù)點,并將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量 空間的數(shù)據(jù)點,最后根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高 維信號向量空間的數(shù)據(jù)點更新指紋庫,實現(xiàn)了基于大量無標記數(shù)據(jù)的指紋庫自更新過程, 賦予指紋庫自適應無線信號環(huán)境變化的能力,提供定位算法的魯邦性,同時降低了樣本的 采集代價。
[0018] 通過以下參照附圖對本發(fā)明的示例性實施例的詳細描述,本發(fā)明的其它特征及其 優(yōu)點將會變得清楚。
【專利附圖】
【附圖說明】
[0019] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。
[0020] 圖1為本發(fā)明基于流形學習的指紋庫自更新方法一個實施例的流程示意圖。
[0021] 圖2為本發(fā)明信號向量空間與位置空間的映射關系不意圖。
[0022] 圖3為本發(fā)明基于流形學習的指紋庫自更新方法再一個實施例的流程示意圖。
[0023] 圖4為本發(fā)明基于流形學習的指紋庫自更新裝置一個實施例的結構示意圖。
【具體實施方式】
[0024] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。以下 對至少一個示例性實施例的描述實際上僅僅是說明性的,決不作為對本發(fā)明及其應用或使 用的任何限制?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提 下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0025] 除非另外具體說明,否則在這些實施例中闡述的部件和步驟的相對布置、數(shù)字表 達式和數(shù)值不限制本發(fā)明的范圍。
[0026] 同時,應當明白,為了便于描述,附圖中所示出的各個部分的尺寸并不是按照實際 的比例關系繪制的。
[0027] 對于相關領域普通技術人員已知的技術、方法和設備可能不作詳細討論,但在適 當情況下,所述技術、方法和設備應當被視為授權說明書的一部分。
[0028] 在這里示出和討論的所有示例中,任何具體值應被解釋為僅僅是示例性的,而不 是作為限制。因此,示例性實施例的其它示例可以具有不同的值。
[0029] 應注意到:相似的標號和字母在下面的附圖中表示類似項,因此,一旦某一項在一 個附圖中被定義,則在隨后的附圖中不需要對其進行進一步討論。
[0030] 為了解決指紋庫更新過程由于需要大量標記數(shù)據(jù)的訓練數(shù)據(jù)集所導致的樣本收 集代價較高的問題,本發(fā)明提出一種基于大量無標記數(shù)據(jù)的指紋庫自更新方案(即指紋庫 自適應更新方案),大大降低了樣本的采集代價。其中,標記數(shù)據(jù)是指經(jīng)用戶確認位置的位 置點的信號向量,無標記數(shù)據(jù)是指未經(jīng)用戶確認位置的位置點的信號向量。需要說明的是, 本發(fā)明提出的指紋庫自更新方案可以全部采用無標記數(shù)據(jù),也可以大量采用無標記數(shù)據(jù), 少量采用標記數(shù)據(jù)。由于標記數(shù)據(jù)的位置信息是經(jīng)過用戶確認的,因此,部分采用標記數(shù)據(jù) 可以使指紋庫中的數(shù)據(jù)更加準確。下面詳細說明本發(fā)明的方案。
[0031] 圖1為本發(fā)明基于流形學習的指紋庫自更新方法一個實施例的流程示意圖。如圖 1所示,將在線定位階段用戶提供的大量無標記數(shù)據(jù)和少量標記數(shù)據(jù)或者全部無標記數(shù)據(jù) 輸入流形學習模型,流形學習模型輸出有效數(shù)據(jù),有效數(shù)據(jù)輸入已有的指紋庫更新指紋庫 數(shù)據(jù),輸出更新的指紋庫。其中,有效數(shù)據(jù)例如可以是步驟S305中的可信數(shù)據(jù)點對應的高 維信號向量空間的數(shù)據(jù)點以及映射得到的高維信號向量空間的數(shù)據(jù)點。
[0032] 圖2描述的是信號向量空間與位置空間的映射關系示意圖。將一個工作日分為若 干時間段,表示為T=It 1, t2, ...,tj,根據(jù)某時段內采集的無標記數(shù)據(jù)(還可以有少量標記 數(shù)據(jù)),運用流形學習方法完成指紋庫的自適應更新。如圖2所示,某一時間段的信號向量 空間(例如m維,m > 2)中的數(shù)據(jù)點SA、SB、S。分別映射為位置空間(例如2維)中的數(shù)據(jù)點 A、B、C,經(jīng)過一段時間后,各位置點的信號向量空間可能會發(fā)生改變,改變后的信號向量空 間中的數(shù)據(jù)點S/、SB'、S C'分別映射為位置空間中的數(shù)據(jù)點A、B、C?;诹餍螌W習的指 紋庫更新方案基于如下假設:i)物理位置相距較近點的信號強度相似,同樣的信號強度相 似點的物理位置較近。ii)信號強度在相隔較長的時間段內變化較大,相隔較短時間內變 化較小。不同時間段的同一位置同一接入點(AP)的信號組成一個信號對,例如{S A,S/ }, {SB,V }。例如,A、B點物理距離較接近,因此某時間段內,信號向量空間中的Sb比Sc更 相近Sa,在另一時間段內,信號空間發(fā)生了改變,但變化后的信號向量V仍然比Sc'更相 近 sA'。
[0033] 圖3為本發(fā)明基于流形學習的指紋庫自更新方法再一個實施例的流程示意圖。
[0034] 如圖3所示,本實施例的指紋庫自更新方法包括以下步驟:
[0035] S301,基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置空間對應 的數(shù)據(jù)點。
[0036] 其中,高維信號向量空間的數(shù)據(jù)點包括無標記數(shù)據(jù),無標記數(shù)據(jù)是指未經(jīng)用戶確 認位置的位置點的信號向量。高維信號向量空間的數(shù)據(jù)點還可以包括標記數(shù)據(jù),標記數(shù)據(jù) 是指經(jīng)用戶確認位置的位置點的信號向量。部分采用標記數(shù)據(jù)可以使指紋庫中的數(shù)據(jù)更加 準確。標記數(shù)據(jù)可以由系統(tǒng)提供糾錯接口,用戶在產(chǎn)生錯失定位結果時,可以通過該糾錯接 口向系統(tǒng)提供正確位置。
[0037] 本步驟實現(xiàn)了高維空間到低維空間的降維過程,其中一種示例性的實現(xiàn)方法為:
[0038] (1)局部近鄰選?。涸诟呔S信號向量空間的數(shù)據(jù)點中尋找其中任意第一數(shù)據(jù)點的 預設數(shù)量的鄰居數(shù)據(jù)點,例如可以采用k最近鄰方法選取鄰居節(jié)點,即通過計算兩兩信號 向量之間的歐式距離,獲取最近的k個鄰居節(jié)點。
[0039] (2)構建鄰接矩陣W :由鄰居數(shù)據(jù)點構造鄰接圖G,并計算鄰接圖的鄰接矩陣。
[0040] 鄰接圖G的一種構造方法為:若某兩個鄰居數(shù)據(jù)點i,j近鄰,則Gij = 1,否則,若 兩點i,j不近鄰,則Gij為0。
[0041] 鄰接矩陣也稱為權重矩陣,可以使用熱核方法確定,即若Gi j = 1,則 Wfexpl;- Il Xi-Xj Il 2/(2 〇 2)],否則若Gij = 0,則Wij=O,其中,Xi和Xj分別表示信號向量, σ表示常量系數(shù),Ilxi-Xjll表示兩向量Xi和Xj之間的距離?;蛘?,可以使用簡化表示,即 若 Gi j = 1,則 Wij=I,否則若 Gi j = 0,則 Wij=CL
[0042] (3)特征映射(降維):根據(jù)鄰接矩陣將高維信號向量空間的第一數(shù)據(jù)點映射為低 維位置空間對應的數(shù)據(jù)點。
[0043] 在高維空間中距離相近的向量族轉換到低維空間后還應保持相似的拓撲結構。則 可以通過最小二乘原理構造下面的目標函數(shù):
【權利要求】
1. 一種基于流形學習的指紋庫自更新方法,包括: 基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點, 其中,所述高維信號向量空間的數(shù)據(jù)點包括無標記數(shù)據(jù),無標記數(shù)據(jù)是指未經(jīng)用戶確認位 置的位置點的信號向量; 從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點; 基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點; 將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量空間的數(shù)據(jù)點; 根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高維信號向量空 間的數(shù)據(jù)點更新指紋庫。
2. 根據(jù)權利要求1所述的方法,其特征在于,所述基于流形學習技術將高維信號向量 空間的數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點包括: 在高維信號向量空間的數(shù)據(jù)點中尋找其中任意第一數(shù)據(jù)點的預設數(shù)量的鄰居數(shù)據(jù) 占. 由鄰居數(shù)據(jù)點構造鄰接圖,并計算鄰接圖的鄰接矩陣; 根據(jù)鄰接矩陣將高維信號向量空間的第一數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點。
3. 根據(jù)權利要求1所述的方法,其特征在于,所述從低維位置空間的數(shù)據(jù)點中篩選出 可信數(shù)據(jù)點包括: 通過粗大誤差濾除方法或者距離閾值過濾方法從低維位置空間的數(shù)據(jù)點中篩選出可 信數(shù)據(jù)點。
4. 根據(jù)權利要求1所述的方法,其特征在于,所述基于可信數(shù)據(jù)點預測出其他位置的 數(shù)據(jù)點包括: 采用數(shù)據(jù)插值方法或者高斯過程方法,基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點。
5. 根據(jù)權利要求1所述的方法,其特征在于,所述高維信號向量空間的數(shù)據(jù)點還包括 標記數(shù)據(jù),標記數(shù)據(jù)是指經(jīng)用戶確認位置的位置點的信號向量。
6. -種基于流形學習的指紋庫自更新裝置,包括: 第一映射單元,用于基于流形學習技術將高維信號向量空間的數(shù)據(jù)點映射為低維位置 空間對應的數(shù)據(jù)點,其中,所述高維信號向量空間的數(shù)據(jù)點包括無標記數(shù)據(jù),無標記數(shù)據(jù)是 指未經(jīng)用戶確認位置的位置點的信號向量; 篩選單元,用于從低維位置空間的數(shù)據(jù)點中篩選出可信數(shù)據(jù)點; 預測單元,用于基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點; 第二映射單元,用于將低維位置空間中預測出的數(shù)據(jù)點映射為高維信號向量空間的數(shù) 據(jù)點; 更新單元,用于根據(jù)可信數(shù)據(jù)點對應的高維信號向量空間的數(shù)據(jù)點以及映射得到的高 維信號向量空間的數(shù)據(jù)點更新指紋庫。
7. 根據(jù)權利要求6所述的裝置,其特征在于,所述第一映射單元,具體用于 在高維信號向量空間的數(shù)據(jù)點中尋找其中任意第一數(shù)據(jù)點的預設數(shù)量的鄰居數(shù)據(jù) 占. 由鄰居數(shù)據(jù)點構造鄰接圖,并計算鄰接圖的鄰接矩陣; 根據(jù)鄰接矩陣將高維信號向量空間的第一數(shù)據(jù)點映射為低維位置空間對應的數(shù)據(jù)點。
8. 根據(jù)權利要求6所述的裝置,其特征在于,所述篩選單元,具體用于 通過粗大誤差濾除方法或者距離閾值過濾方法從低維位置空間的數(shù)據(jù)點中篩選出可 信數(shù)據(jù)點。
9. 根據(jù)權利要求6所述的裝置,其特征在于,所述預測單元,具體用于 采用數(shù)據(jù)插值方法或者高斯過程方法,基于可信數(shù)據(jù)點預測出其他位置的數(shù)據(jù)點。
10. 根據(jù)權利要求6所述的裝置,其特征在于,所述高維信號向量空間的數(shù)據(jù)點還包括 標記數(shù)據(jù),標記數(shù)據(jù)是指經(jīng)用戶確認位置的位置點的信號向量。
【文檔編號】G06F17/30GK104424276SQ201310386266
【公開日】2015年3月18日 申請日期:2013年8月30日 優(yōu)先權日:2013年8月30日
【發(fā)明者】劉源, 孫智強, 邵齊海, 羅智勇 申請人:中國電信集團公司