一種應(yīng)用于無線傳感網(wǎng)絡(luò)的分布式相似性查詢方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種應(yīng)用于無線傳感網(wǎng)絡(luò)的分布式相似性查詢方法,屬于無線傳感網(wǎng) 絡(luò)下的相似查詢技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 無線傳感網(wǎng)絡(luò)(Wireless Sensor化twork,WSN)是當(dāng)前在國際上備受關(guān)注、設(shè)及 多學(xué)科高度交叉、知識高度集成的前沿?zé)狳c(diǎn)研究領(lǐng)域,被認(rèn)為是21世紀(jì)最重要的技術(shù)之一。 WSN系統(tǒng)通常包括傳感器節(jié)點(diǎn)、匯聚節(jié)點(diǎn)和管理節(jié)點(diǎn),大量傳感器節(jié)點(diǎn)隨機(jī)部署在監(jiān)測區(qū) 域,通過自組織的方式形成網(wǎng)絡(luò),負(fù)責(zé)收集監(jiān)測區(qū)域的數(shù)據(jù);匯聚節(jié)點(diǎn)收集傳感節(jié)點(diǎn)的數(shù) 據(jù),經(jīng)過數(shù)據(jù)整合,提交給管理節(jié)點(diǎn);用戶可W通過管理節(jié)點(diǎn)對傳感器網(wǎng)絡(luò)進(jìn)行配置管理、 發(fā)布監(jiān)測任務(wù)W及收集監(jiān)測數(shù)據(jù)。WS州尋邏輯上的信息世界和客觀上的物理世界融合在一 起,它在工業(yè)、農(nóng)業(yè)、交通、軍事、安全、醫(yī)療、空間探測等眾多領(lǐng)域都有著廣泛的應(yīng)用。
[0003] 由于WSN的傳感節(jié)點(diǎn)通常由電池供電,可用能量有限,因此能耗是WSN的一個(gè)重要 問題,特別是在相似數(shù)據(jù)查詢時(shí),匹配所有節(jié)點(diǎn)的數(shù)據(jù)將消耗大量能量,縮短網(wǎng)絡(luò)的生命周 期。
[0004] 局部敏感哈希(^Locality Sensitive Hashing,LSH)是最近非常流行的一種相似 性捜索算法,因其不錯(cuò)的捜索效率W及較強(qiáng)的高維適應(yīng)性而被廣泛應(yīng)用于各個(gè)領(lǐng)域。其基 本思想是通過一組特殊的哈希函數(shù),對數(shù)據(jù)進(jìn)行哈希,使距離近的點(diǎn)沖突的概率遠(yuǎn)大于距 離遠(yuǎn)的點(diǎn)沖突的概率;在查詢時(shí),使用相同的函數(shù),將查詢點(diǎn)哈希到桶中,選取桶中數(shù)據(jù)作 為候選點(diǎn)進(jìn)行距離判斷,最終確定相似數(shù)據(jù)。
[0005] 傳統(tǒng)L甜技術(shù)的主要問題是為了保證足夠的召回率和精確率通常需要數(shù)W百計(jì)的 哈希表,運(yùn)就給索引的存儲帶來很大的壓力,龐大的哈希表占用過多的內(nèi)存,在海量文件系 統(tǒng)中,L甜的應(yīng)用遇到瓶頸。
【發(fā)明內(nèi)容】
[0006] 針對上述技術(shù)問題,本發(fā)明所要解決的技術(shù)問題是提供一種應(yīng)用于無線傳感網(wǎng)絡(luò) 的分布式相似性查詢方法,解決了無線傳感網(wǎng)絡(luò)的能耗問題,W及數(shù)據(jù)相似性查詢的效率 問題。
[0007] 本發(fā)明為了解決上述技術(shù)問題采用W下技術(shù)方案:本發(fā)明設(shè)計(jì)了一種應(yīng)用于無線 傳感網(wǎng)絡(luò)的分布式相似性查詢方法,針對無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)進(jìn)行L組K維局部敏感 哈希映射,構(gòu)建各個(gè)數(shù)據(jù)項(xiàng)分別所映射的L組K維局部敏感哈希指紋值,即一個(gè)數(shù)據(jù)項(xiàng)對應(yīng)L 組局部敏感哈希指紋值集合,各組局部敏感哈希指紋值集合分別包括K維局部敏感哈希指 紋值,L和K為預(yù)設(shè)整數(shù)值;所述分布式相似性查詢方法包括如下步驟:
[000引步驟OOl.針對查詢數(shù)據(jù)項(xiàng)Vsi),獲得其進(jìn)行L組K維局部敏感哈希映射時(shí),各組各維 按預(yù)設(shè)切割寬度W進(jìn)行分割取整前的映射值尤U 進(jìn)入步驟002;其中,1 = 1、…、L,k =1、…、K,Ai,k和Bi,k為無線傳感網(wǎng)絡(luò)中各數(shù)據(jù)項(xiàng)進(jìn)行L組K維局部敏感哈希映射時(shí),各組各 維所對應(yīng)的隨即參數(shù),且無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)之間所對應(yīng)各組各維的Al,k和Bi,k彼此 對應(yīng)相同,Al,k為查詢數(shù)據(jù)項(xiàng)V翰)對應(yīng)第1組第k維局部敏感哈希映射時(shí),與查詢數(shù)據(jù)項(xiàng)V窗旬維 數(shù)相同,且每一維服從P穩(wěn)態(tài)分布的隨機(jī)高維向量;Bi,k為查詢數(shù)據(jù)項(xiàng)V窗旬對應(yīng)第1組第k維局 部敏感哈希映射時(shí),屬于[O,W]之間的隨機(jī)數(shù);
[0009] 步驟002.根據(jù)查詢數(shù)據(jù)項(xiàng)進(jìn)行L組K維局部敏感哈希映射時(shí),各組各維按預(yù)設(shè) 切割寬度W進(jìn)行分割取整前的映射值/,U 獲得查詢數(shù)據(jù)項(xiàng)V翰)進(jìn)行L組K維局部敏感 哈希映射后,各組局部敏感哈希指紋值集合中各維局部敏感哈希指紋值A(chǔ)進(jìn)入 步驟003;
[0010] 步驟003.將無線傳感網(wǎng)絡(luò)中的所有數(shù)據(jù)項(xiàng)作為待對比數(shù)據(jù)項(xiàng),分別針對各個(gè)待對 比數(shù)據(jù)項(xiàng),將待對比數(shù)據(jù)項(xiàng)各組局部敏感哈希指紋值集合中各維局部敏感哈希指紋值,分 別與查詢數(shù)據(jù)項(xiàng)V翰)對應(yīng)各組局部敏感哈希指紋值集合中對應(yīng)維局部敏感哈希指紋值進(jìn)行 相減,獲得對應(yīng)差值^,4,[;> .??. * .,:進(jìn)入步驟004;其中,1綱fct= 1窗旬,1綱fct= 1、…、L,1窗旬=1、…、 L,為,《&,*表示待對比數(shù)據(jù)項(xiàng)第1概K組局部敏感哈希指紋值集合中第k維局部敏感哈希 指紋值,與查詢數(shù)據(jù)項(xiàng)V齒自第1翰)組局部敏感哈希指紋值集合中第k維局部敏感哈希指紋值 的相減結(jié)果;
[0011] 步驟004.針對所有差值\^&,*,判斷是否存在絕對值大于1的4 I. *,是則 定義該/胃*所對應(yīng)待對比數(shù)據(jù)項(xiàng)第1衙批組局部敏感哈希指紋值集合與查詢數(shù)據(jù)項(xiàng) V窗旬第1翰)組局部敏感哈希指紋值集合之間的組相似性權(quán)重A,,,/胃,,=0,并進(jìn)入步驟005;否 則進(jìn)入步驟006;
[0012] 步驟005.針對所有待對比數(shù)據(jù)項(xiàng)的局部敏感哈希指紋值集合中剩余局部敏感哈 希指紋值集合,判斷是否存在所對應(yīng)所有差值巧的絕對值均不大于1的局部敏感哈 希指紋值集合,是則進(jìn)入步驟006;否則進(jìn)入步驟008;
[0013] 步驟006.分別針對所對應(yīng)所有差值巧Z胃*的絕對值均不大于1的各組局部敏 感哈希指紋值集合,根據(jù)其對應(yīng)的巧,獲得為胃所對應(yīng)的各個(gè)待對比數(shù)據(jù)項(xiàng) 第1概K組局部敏感哈希指紋值集合,按如下公式:
[0015] 獲得為》,", A所對應(yīng)待對比數(shù)據(jù)項(xiàng)第1椒批組局部敏感哈希指紋值集合中第k維 局部敏感哈希指紋值,與查詢數(shù)據(jù)項(xiàng)V翰)第1查組局部敏感哈希指紋值集合中第k維局部敏 感哈希指紋值的單位相似性權(quán)重ti),然后進(jìn)入步驟007;
[0016] 步驟007 .針對所對應(yīng)所有差值\,,&,*的絕對值均不大于1的各組局部敏感哈 希指紋值集合,根據(jù)如下公式:
[0018] 獲得其對應(yīng)C', . *所對應(yīng)待對比數(shù)據(jù)項(xiàng)第1概K組局部敏感哈希指紋值集合與 查詢數(shù)據(jù)項(xiàng)第1登ft組局部敏感哈希指紋值集合的組相似性權(quán)重%,并進(jìn)入步驟 008;其中,A為預(yù)設(shè)常數(shù);
[0019] 步驟008.分別針對無線傳感網(wǎng)絡(luò)中各個(gè)待對比數(shù)據(jù)項(xiàng),將待對比數(shù)據(jù)項(xiàng)所有L組 局部敏感哈希指紋值集合,分別相對于查詢數(shù)據(jù)項(xiàng)V齒自對應(yīng)各組局部敏感哈希指紋值集合 的組相似性權(quán)重相加,獲得該待對比數(shù)據(jù)項(xiàng)相對于查詢數(shù)據(jù)項(xiàng)V翰)的相似性權(quán)重, 并進(jìn)入步驟009;
[0020] 步驟009.針對無線傳感網(wǎng)絡(luò)中各個(gè)待對比數(shù)據(jù)項(xiàng)相對于查詢數(shù)據(jù)項(xiàng)V窗旬的相似性 權(quán)重,篩選獲得大于預(yù)設(shè)相似性權(quán)重闊值的相似性權(quán)重所對應(yīng)的待對比數(shù)據(jù)項(xiàng),作為候選 數(shù)據(jù)項(xiàng),并進(jìn)入步驟010;
[0021] 步驟010.根據(jù)查詢數(shù)據(jù)項(xiàng)V窗自進(jìn)行局部敏感哈希映射前的數(shù)據(jù),W及各個(gè)候選數(shù) 據(jù)項(xiàng)進(jìn)行局部敏感哈希映射前的數(shù)據(jù),分別計(jì)算各個(gè)候選數(shù)據(jù)項(xiàng)和查詢數(shù)據(jù)項(xiàng)Vsa之間的 歐式距離,然后篩選獲得大于預(yù)設(shè)歐式距離闊值的歐式距離所對應(yīng)的候選數(shù)據(jù)項(xiàng),即查詢 數(shù)據(jù)項(xiàng)V翰)的相似性查詢結(jié)果。
[0022] 作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述針對無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)采用基于 P穩(wěn)態(tài)局部敏感哈希映射方法,進(jìn)行L組K維局部敏感哈希映射,構(gòu)建各個(gè)數(shù)據(jù)項(xiàng)分別所映射 的L組K維局部敏感哈希指紋值。
[0023] 作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述針對無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)進(jìn)行L組K 維局部敏感哈希映射,構(gòu)建各個(gè)數(shù)據(jù)項(xiàng)分別所映射的L組K維局部敏感哈希指紋值,包括如 下步驟:
[0024] 步驟aOl.針對無線傳感網(wǎng)絡(luò)中的數(shù)據(jù)項(xiàng),隨機(jī)獲得其進(jìn)行L組K維局部敏感哈希映 射時(shí),所對應(yīng)各組各維的Al,k、Bi,k,且無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)之間所對應(yīng)各組各維的 Al,謝Bi,k彼此對應(yīng)相同,并進(jìn)入步驟a02;其中,Al,功數(shù)據(jù)項(xiàng)對應(yīng)第1組第k維局部敏感哈希 映射時(shí),與該數(shù)據(jù)項(xiàng)維數(shù)相同,且每一維服從P穩(wěn)態(tài)分布的隨機(jī)高維向量;Bi,k為數(shù)據(jù)項(xiàng)對應(yīng) 第1組第k維局部敏感哈希映射時(shí),屬于[0,W]之間的隨機(jī)數(shù);
[0025] 步驟a02.根據(jù)無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)分別所對應(yīng)各組各維的Al,k、Bi,k,按如 下公式:
[0027] 獲得無線傳感網(wǎng)絡(luò)中各個(gè)數(shù)據(jù)項(xiàng)分別所對應(yīng)各組各維局部敏感哈希指紋值 (^),即一個(gè)數(shù)據(jù)項(xiàng)對應(yīng)L組局部敏感哈希指紋值集合,各組局部敏感哈希指紋值集合 分別包括K維局部敏感哈希指紋值;其中,V表示無線傳感網(wǎng)絡(luò)中的數(shù)據(jù)項(xiàng)。
[0028] 作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟OOl中,針對查詢數(shù)據(jù)項(xiàng)V査詢,按如下公 式:
[0029] A,心戶查詞)=年^飾+如
[0030] 獲得其進(jìn)行L組K維局部敏感哈希映射時(shí),各組各維按預(yù)設(shè)切割寬度W進(jìn)行分割取 整前的映射值充
[0031] 作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟002中,根據(jù)查詢數(shù)據(jù)項(xiàng)Vs旬進(jìn)行L組K 維局部敏感哈希映射時(shí),各組各維按預(yù)設(shè)切割寬度W進(jìn)行分割取整前的映射值 /4。,3。(^5),按如下公式:
[0033] 獲得查詢數(shù)據(jù)項(xiàng)V翰)進(jìn)行L組K維局部敏感哈希映射后,各組局部敏感哈希指紋值 集合中各維的局部敏感哈希指紋值*
[0034] 本發(fā)明所述一種應(yīng)用于無線傳感網(wǎng)絡(luò)的分布式相似性查詢方法采用W上技術(shù)方 案與現(xiàn)有技術(shù)相比,具有W下技術(shù)效果:本發(fā)明設(shè)計(jì)的一種應(yīng)用于無線傳感網(wǎng)絡(luò)的分布式 相似性查詢方法,針對無線傳感網(wǎng)絡(luò)中傳感節(jié)