亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于隱私保護(hù)的數(shù)據(jù)索引方法

文檔序號:6622400閱讀:493來源:國知局
一種基于隱私保護(hù)的數(shù)據(jù)索引方法
【專利摘要】本發(fā)明公開了一種基于隱私保護(hù)的數(shù)據(jù)索引方法,屬于數(shù)據(jù)處理【技術(shù)領(lǐng)域】。本發(fā)明包括:提出了一種R-tree劃分算法,使得任意兩個葉子節(jié)點之間都沒有重疊,在葉子節(jié)點上獨(dú)立地添加噪音使得本地索引PR-tree滿足差分隱私;針對選取的部分PR-tree節(jié)點,采用了一種映射機(jī)制將每一個PR-tree節(jié)點映射到相應(yīng)的CAN服務(wù)器上從而構(gòu)建全局索引。本發(fā)明設(shè)計了一種基于隱私保護(hù)的兩層分布式索引PR-CAN給用戶提供范圍計數(shù)查詢,不僅能夠有效地保護(hù)用戶隱私安全而且加快了用戶查詢的速度,提升了查詢吞吐率,同時所有查詢用戶都能夠訪問云平臺上的索引數(shù)據(jù),增強(qiáng)了數(shù)據(jù)的共享程度。
【專利說明】一種基于隱私保護(hù)的數(shù)據(jù)索弓I方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于數(shù)據(jù)處理【技術(shù)領(lǐng)域】,更具體地,涉及一種基于隱私保護(hù)的數(shù)據(jù)索引方法。

【背景技術(shù)】
[0002]隨著云計算應(yīng)用的發(fā)展,云計算中的隱私保護(hù)問題受到越來越多研究者的關(guān)注。目前,云計算中面向查詢處理的隱私保護(hù)技術(shù)主要是基于加密的方式。在眾多相關(guān)研究中,可查詢的加密技術(shù)能夠有效地通過加密的方式保護(hù)個體的隱私,允許用戶安全地在密文上進(jìn)行查詢。數(shù)據(jù)擁有者發(fā)布到云服務(wù)器上的數(shù)據(jù)是以加密的方式存儲的。用戶的查詢也用相同的方式加密,查詢請求發(fā)送到云服務(wù)器進(jìn)行查詢處理,最后將結(jié)果返回給查詢用戶。但是加密技術(shù)也存在一些弊端,例如加密/解密操作的時間開銷很大,查詢響應(yīng)時間必然較長,而且只有授權(quán)用戶能夠訪問加密后的云數(shù)據(jù),數(shù)據(jù)的共享程度不足。
[0003]目前,隱私保護(hù)中的匿名化技術(shù)及噪音擾亂技術(shù)被廣泛應(yīng)用于數(shù)據(jù)隱私安全領(lǐng)域中,其不需要對數(shù)據(jù)進(jìn)行加密/解密操作,同樣也能為用戶數(shù)據(jù)提供強(qiáng)隱私保護(hù)。近年來,差分隱私已經(jīng)成為一種新的隱私保護(hù)模型,該模型通過向查詢或者分析結(jié)果中添加噪音以達(dá)到隱私保護(hù)效果,最常見的算法是采用噪音添加機(jī)制,并且這種噪音的添加服從拉普拉斯分布。
[0004]為了使查詢用戶能夠更好、更快地訪問云平臺上的數(shù)據(jù),在云平臺上構(gòu)建高效的索引顯得尤為重要。目前已經(jīng)有很多研究者對云計算環(huán)境下的分布式索引技術(shù)展開了深入的研究。然而,如何在構(gòu)建索引的同時保護(hù)用戶數(shù)據(jù)的隱私,為查詢用戶提供基于隱私保護(hù)的數(shù)據(jù)發(fā)布視圖還很少有人研究。


【發(fā)明內(nèi)容】

[0005]針對現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于云平臺隱私數(shù)據(jù)的索引方法。數(shù)據(jù)擁有者將數(shù)據(jù)托管到云平臺上,必須要保證用戶的隱私信息不被泄露。同時云平臺會對數(shù)據(jù)建立高效的索引,方便用戶進(jìn)行快速的查詢。云數(shù)據(jù)對所有的用戶共享,即所有的用戶都可以訪問云數(shù)據(jù)。
[0006]為實現(xiàn)上述目的,本發(fā)明提供一種基于隱私數(shù)據(jù)保護(hù)的索引方法,包括以下步驟:
[0007]步驟I創(chuàng)建基于差分隱私保護(hù)的本地索引PR-tree,具體包括以下子步驟:
[0008](1-1)本地數(shù)據(jù)采用R-tree索引;
[0009](1-2)對所述R-tree索引重新進(jìn)行劃分,使得任意兩個葉子節(jié)點的范圍都不存在相互重疊的情形,且所有葉子節(jié)點索引的數(shù)據(jù)加起來正好是整個數(shù)據(jù)集;
[0010](1-3)在每一葉子節(jié)點索引的數(shù)據(jù)上獨(dú)立地添加噪音,創(chuàng)建滿足差分隱私要求的本地索引PR-tree ;
[0011]步驟2構(gòu)建分布式全局索引PR-CAN,具體包括以下子步驟:
[0012](2-1)采用索引選取算法,從每個本地索引PR-tree上選取部分PR-tree節(jié)點形成節(jié)點集,其中所述索引選取算法保證選取的節(jié)點產(chǎn)生最小的查詢開銷總和;
[0013](2-2)將選取的每一個PR-tree節(jié)點映射到相應(yīng)的CAN節(jié)點上。
[0014]通過本發(fā)明所構(gòu)思的以上技術(shù)方案,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下的有益效果:
[0015](I)與現(xiàn)有算法Quad-opt相比,分布式索引PR-CAN在提供同等隱私保護(hù)力度的情形下,能夠保證更高的數(shù)據(jù)可用性。這是因為分布式索引PR-CAN采用了 R-tree索引方式將數(shù)據(jù)層面上相隔較近的數(shù)據(jù)劃分到了一個區(qū)域中,而不是簡單地將數(shù)據(jù)空間進(jìn)行分割。另一方面,也是因為分布式索引PR-CAN采用了較好的噪音添加機(jī)制,只在互斥的葉子節(jié)點上獨(dú)立地添加了噪音,對上層節(jié)點不添加任何噪音;
[0016](2)采用噪音擾亂的方式對數(shù)據(jù)信息進(jìn)行了強(qiáng)隱私保護(hù),避開了操作耗時的加密/解密技術(shù)。查詢用戶發(fā)送查詢請求后,就能較快速地從系統(tǒng)獲取查詢的結(jié)果值,不需要繁瑣的交互時間開銷;
[0017](3)構(gòu)建的全局索引并不是全部的PR-tree索引節(jié)點,也不是簡單地存放在Master節(jié)點上,而是選取部分PR-tree節(jié)點構(gòu)建而成,全局索引分布在不同的服務(wù)器上,這樣能夠避免Master節(jié)點成為索引查詢的性能瓶頸。

【專利附圖】

【附圖說明】
[0018]圖1是本發(fā)明分布式索引PR-CAN的框架圖;
[0019]圖2是本發(fā)明基于隱私保護(hù)的數(shù)據(jù)索引方法的流程圖;
[0020]圖3是本發(fā)明構(gòu)建全局索引PR-CAN的詳細(xì)流程圖;
[0021]圖4是本發(fā)明查詢請求的處理流程圖;
[0022]圖5是本發(fā)明本地索引PR-tree的查詢處理流程圖。

【具體實施方式】
[0023]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個實施方式中所涉及到的技術(shù)特征只要彼此之間未構(gòu)成沖突就可以相互組合。
[0024]圖1所示為本發(fā)明基于隱私保護(hù)的分布式索引PR-CAN的框架圖。圖中的服務(wù)器節(jié)點按職能分為三種=Master節(jié)點、存儲節(jié)點和CAN節(jié)點。分布式存儲系統(tǒng)就是由存儲節(jié)點構(gòu)成,每一個存儲節(jié)點負(fù)責(zé)存放一部分的應(yīng)用數(shù)據(jù),然后在這些數(shù)據(jù)之上構(gòu)建一個滿足差分的本地索引PR-tree,為用戶提供基于隱私保護(hù)的范圍計數(shù)查詢。在本地索引PR-tree之上,還構(gòu)建了一層輔助索引,即全局索引PR-CAN,該全局索引PR-CAN分布式存放于CAN節(jié)點之上,并由CAN覆蓋網(wǎng)絡(luò)組織。其中起到關(guān)鍵作用的是Master節(jié)點,其負(fù)責(zé)整個索引的構(gòu)建和查詢處理過程,并且需要實時地和客戶端及其他節(jié)點保持通信。一方面,Master節(jié)點需要將客戶端傳送來的查詢負(fù)載按照一定的策略分布式發(fā)送給其他節(jié)點;另一方面,從每個本地索引上查詢到的部分結(jié)果最終也要在Master節(jié)點上匯集,然后將查詢結(jié)果返回給客戶端。
[0025]圖2所示為本發(fā)明基于隱私保護(hù)的數(shù)據(jù)索引方法的流程圖,具體包括以下步驟:
[0026](I)創(chuàng)建基于差分隱私保護(hù)的本地索引PR-tree,具體包括以下子步驟:
[0027](1-1)在初始化情況下,本地數(shù)據(jù)采用R-tree索引,同層節(jié)點之間可能存在重疊區(qū)域。
[0028](1-2)對R-tree索引重新進(jìn)行劃分,使得任意兩個葉子節(jié)點的范圍都不存在相互重疊的情形,即相當(dāng)于所有新的葉子節(jié)點將整個數(shù)據(jù)空間做了一個互斥的劃分,且每一個葉子節(jié)點索引的數(shù)據(jù)加起來正好是整個數(shù)據(jù)集,非葉子節(jié)點包含的數(shù)據(jù)個數(shù)由其孩子節(jié)點所包含的數(shù)據(jù)求和而得。
[0029](1-3)在每一個新的葉子節(jié)點索引的數(shù)據(jù)上獨(dú)立地添加噪音,然后將添加了噪音的數(shù)據(jù)發(fā)布出去,使得R-tree索引滿足差分隱私保護(hù)的要求,以下簡稱為PR-tree索引。
[0030]在本發(fā)明實施例中,采用添加噪音的方式實現(xiàn)差分隱私。對于提供差分隱私的隨機(jī)函數(shù)Α,只要隨機(jī)函數(shù)A能夠滿足差分隱私模型的具體要求,攻擊者就竊取不了目標(biāo)對象的隱私信息。具體地,添加的噪音服從參數(shù)為s (f)/e的拉普拉斯分布,其中s (f)為敏感度,ε為隱私預(yù)算。
[0031](2)創(chuàng)建基于內(nèi)容尋址網(wǎng)絡(luò)(Content Addressable Network,以下簡稱CAN)的分布式索引PR-CAN,這里PR-CAN索引包含了基于差分隱私保護(hù)的本地索引PR-tree和在本地索引之上的一層全局索引。構(gòu)建的全局索引分布式存放于多臺服務(wù)器上,這樣能夠避免將全局索引存放于一臺服務(wù)器上造成的性能瓶頸。具體包括以下子步驟:
[0032](2-1)采用索引選取算法,從每個本地索引PR-tree上選取部分PR-tree節(jié)點形成節(jié)點集。該索引選取算法是自適應(yīng)的,根據(jù)給定的具體查詢負(fù)載,能夠保證選取的節(jié)點產(chǎn)生最小的查詢開銷總和。
[0033](2-2)將選取的所有PR-tree節(jié)點映射到相應(yīng)的CAN節(jié)點上,每一個PR-tree節(jié)點可能擁有多個副本。
[0034](3)執(zhí)行索引微調(diào)算法,調(diào)整上述選取的PR-tree節(jié)點集以適應(yīng)實時查詢的具體需求。具體地,如果在實時查詢中,有些節(jié)點被訪問的頻率過高,就用其孩子節(jié)點替換該節(jié)點進(jìn)行發(fā)布;如果有些節(jié)點被訪問的頻率過低,就將其用其父親節(jié)點替換該節(jié)點進(jìn)行發(fā)布。
[0035]圖3所示為本發(fā)明構(gòu)建全局索引PR-CAN的詳細(xì)流程圖。在本發(fā)明實施例中,給定任意一個本地索引PR-tree和閾值Vthri,具體包含以下步驟:
[0036](I)采用索引選取算法從當(dāng)前本地索引PR-tree上選取部分PR-tree節(jié)點放入集合之中,得到初始化結(jié)點集S。假定存儲服務(wù)器Ni選取了部分PR-tree結(jié)點集S,索引選取算法必須保證結(jié)點集S的兩個特性:完整性(3% ^S,Vt^Ni,數(shù)據(jù)t 一定能夠被PR-tree結(jié)點Iii檢索到),獨(dú)一性(給定結(jié)點集S中的任意兩個PR-tree結(jié)點不存在同一條從某個葉子結(jié)點到根結(jié)點的路徑)。
[0037]為了更好地說明索引選取算法,引入了查詢開銷模型,該索引選取算法能夠保證針對當(dāng)前查詢獲取最小的查詢開銷。具體地,只考慮單個查詢q的查詢處理開銷模型Cp (q),包含以下三個方面的查詢開銷:
[0038]給定一個查詢q,路由到每一個與待查范圍相交的CAN節(jié)點上的開銷是

【權(quán)利要求】
1.一種基于隱私保護(hù)的數(shù)據(jù)索引方法,其特征在于,包括: 步驟I創(chuàng)建基于差分隱私保護(hù)的本地索引PR-tree,具體包括以下子步驟: (1-1)本地數(shù)據(jù)采用R-tree索引; (1-2)對所述R-tree索引重新進(jìn)行劃分,使得任意兩個葉子節(jié)點的范圍都不存在相互重疊的情形,且所有葉子節(jié)點索引的數(shù)據(jù)加起來正好是整個數(shù)據(jù)集; (1-3)在每一葉子節(jié)點索引的數(shù)據(jù)上獨(dú)立地添加噪音,創(chuàng)建滿足差分隱私要求的本地索引 PR-tree ; 步驟2構(gòu)建分布式全局索引PR-CAN,具體包括以下子步驟: (2-1)采用索引選取算法,從每個本地索引PR-tree上選取部分PR-tree節(jié)點形成節(jié)點集,其中所述索引選取算法保證選取的節(jié)點產(chǎn)生最小的查詢開銷總和; (2-2)將選取的每一個PR-tree節(jié)點映射到相應(yīng)的CAN節(jié)點上。
2.如權(quán)利要求1所述的方法,其特征在于,還包括: 步驟3執(zhí)行索引微調(diào)算法,調(diào)整所述步驟(2-1)形成的節(jié)點集以適應(yīng)實時查詢的具體需求,如果在實時查詢中有些節(jié)點被訪問的頻率過高,就用其孩子節(jié)點替換所述節(jié)點進(jìn)行數(shù)據(jù)發(fā)布;如果有些節(jié)點被訪問的頻率過低,就將其用其父親節(jié)點替換所述節(jié)點進(jìn)行數(shù)據(jù)發(fā)布。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(1-3)添加的噪音服從參數(shù)為s(f)/e的拉普拉斯分布,其中s (f)為敏感度,ε為隱私預(yù)算。
4.如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(2-1)中,所述選取的節(jié)點產(chǎn)生的查詢開銷總和包含以下三個方面的查詢開銷: (a)將單個查詢q路由到每一個與待查范圍相交的CAN節(jié)點上的開銷是
,其中N是網(wǎng)絡(luò)中組織的服務(wù)器個數(shù),t是范圍與所述查詢q的待查范圍有重疊的CAN服務(wù)器個數(shù),d是數(shù)據(jù)維度; (b)在查詢過程中可能出現(xiàn)某個待查CAN節(jié)點的全局索引中,沒有一個索引項與所述查詢q的查詢范圍有重疊,記這種無效的過程開銷為
,其中Sfk(Nm)表示CAN節(jié)點Ntji中與查詢范圍不相交的所有全局索引項,m是CAN節(jié)點的個數(shù); (C)雖然某些候選節(jié)點的范圍與所述查詢q的查詢范圍有重疊,但也有可能查詢不到任何滿足條件的結(jié)果,記這種無效查詢過程引發(fā)的開銷為
、其中Spi(Nsi)表示選取于Nsi本地索引的所有候選PR-tree節(jié)點集,Ns為存儲服務(wù)器的個數(shù),C為PR-tree節(jié)點的最大分支數(shù),h」表示PR-tree節(jié)點η」所在本地索引PR-tree的高度,則Clfty可以看作在以所述PR-tree節(jié)點η」作為根節(jié)點的子樹上做查詢時所經(jīng)過的總的節(jié)點數(shù)。
5.如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(2-2)具體包括以下子步驟: (2-2-1)判斷所述步驟(2-1)形成的所述結(jié)點集是否為空,是則結(jié)束流程,否則執(zhí)行步驟(2-2-2); (2-2-2)對于結(jié)點集中的每一個PR-tree節(jié)點叫,計算其中心點Ci和半徑Ri ;(2-2-3)對于給定的閾值vthri,如果Ri > Vthrd,則所述PR-tree節(jié)點Iii將被映射到所有與其范圍有重疊的CAN節(jié)點上;如果Ri ( Vthrd,則所述PR-tree節(jié)點Iii就會被映射到一個范圍包含了所述中心點Ci的CAN節(jié)點上; (2-2-4)對于所述步驟(2-2-3)中每一個滿足條件的CAN節(jié)點,將所述PR-tree節(jié)點Iii作為一個索引項插入到其全局索引之中,再執(zhí)行步驟(2-2-1)。
6.如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(1-3)中所述本地索引PR-tree的查詢處理具體包括以下步驟: 步驟A判斷查詢范圍R是否包含根節(jié)點T的最小邊界矩形,如果所述根節(jié)點T的所述最小邊界矩形完全包含在所述查詢范圍R之中,則將所述根節(jié)點T索引的數(shù)據(jù)個數(shù)添加到查詢結(jié)果之中,輸出查詢結(jié)果后流程結(jié)束,否則執(zhí)行步驟B ; 步驟B判斷所述根節(jié)點T是否為葉子節(jié)點,如果所述根節(jié)點T不是葉子節(jié)點,判斷所述根節(jié)點T的每一個分支E是否與所述查詢范圍R有重疊區(qū)域,如果有重疊區(qū)域,則對于每一個與所 述查詢范圍R有重疊區(qū)域的孩子節(jié)點Ei,算法將遞歸執(zhí)行,所述根節(jié)點T被賦值為Ei,所述查詢范圍R不變,然后執(zhí)行所述步驟A ;如果沒有重疊區(qū)域,則流程結(jié)束;如果所述根節(jié)點T是葉子節(jié)點且所述最小邊界矩形與所述查詢范圍R存在重疊區(qū)域Area (R Π T),則執(zhí)行步驟C ; 步驟C計算所述重疊區(qū)域Area (R Π T)大小與所述根節(jié)點T的所述最小邊界矩形大小的比例
,然后將所述比例f乘以所述根節(jié)點T索引的數(shù)據(jù)個數(shù)后添加到查
詢結(jié)果中并輸出查詢結(jié)果。
【文檔編號】G06F17/30GK104133903SQ201410379668
【公開日】2014年11月5日 申請日期:2014年8月4日 優(yōu)先權(quán)日:2014年8月4日
【發(fā)明者】丁曉鋒, 金海 , 喻青, 徐慧 申請人:華中科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1