0040] 數(shù)據(jù)空間尺寸確定子模塊,用于根據(jù)數(shù)據(jù)空間大小得到數(shù)據(jù)空間的長度L和寬度 H;
[0041] 單元格劃分子模塊,用于根據(jù)以下數(shù)據(jù)域粒度劃分模型,將數(shù)據(jù)空間劃分為mXm 個(gè)單元格,
[0042]
[0043] 其中,k為相對誤差與面積的比例系數(shù),e為隱私預(yù)算,
[0044] 計(jì)算橫軸上每個(gè)單元格長度1,I=L/m,
[0045] 計(jì)算縱軸上每個(gè)單元格長度h,h=H/m,
[0046] 根據(jù)1和h的值,依次記錄每個(gè)單元格Ci的左、上、右、下四個(gè)邊框的坐標(biāo)值,i= 1,2,? ? ?,mXm;
[0047] 數(shù)據(jù)點(diǎn)處理子模塊,用于從數(shù)據(jù)集中依次取出一個(gè)數(shù)據(jù)點(diǎn)point(x,y),如果 point(X,y)落于單元格Ci,則Ci增加一個(gè)計(jì)數(shù),否則不增加;
[0048] 單元格集合生成子模塊,用于命令數(shù)據(jù)點(diǎn)提取子模塊從數(shù)據(jù)集中依次取出下一個(gè) 數(shù)據(jù)點(diǎn)進(jìn)行處理,直到數(shù)據(jù)集中所有數(shù)據(jù)點(diǎn)都取完成為止,最后得到一個(gè)數(shù)據(jù)空間S的單 元格集合Ic1,C2, ...Ci, ...CmxJ,對應(yīng)的計(jì)數(shù)集合為(X1,X2, ...Xi, ...XmxJ,Xi為單元格Ci 中的數(shù)據(jù)點(diǎn)計(jì)數(shù);劃分模塊,用于基于均勻性度量參數(shù),將相似單元格合并到同一個(gè)劃分, 包括以下子模塊,
[0049] 均勻性度量參數(shù)確定子模塊,用于從數(shù)據(jù)空間分割模塊所得數(shù)據(jù)空間S的mXm個(gè) 單元格中依次取出一個(gè)單元格Ci,計(jì)算均勻性度量參數(shù)U(S),
[0051] 其中,X(Ci)為當(dāng)前單元格中數(shù)據(jù)點(diǎn)集計(jì)數(shù),X(Cj)為除當(dāng)前單元格的其他單元格 中數(shù)據(jù)點(diǎn)集計(jì)數(shù),Ix(Ci)-X(Cj) I不超過相應(yīng)給定閾值,Num為Ix(Ci)-X(Cj) I不超過相應(yīng)給 定閾值的單元格總個(gè)數(shù);
[0052] 單元格合并子模塊,用于若U(S)小于等于相應(yīng)給定閾值,則單元格(^與Cj合并到 一個(gè)劃分,若大于相應(yīng)給定閾值,則單元格(^與cj不合并到一個(gè)劃分;
[0053] 若當(dāng)前單元格C1沒有與任何單元格進(jìn)行合并,則當(dāng)前單元格c1單獨(dú)作為一個(gè)劃 分;
[0054] 將合并的單元格從數(shù)據(jù)空間S中移除;
[0055] 劃分集合生成子模塊,用于命令均勻性度量參數(shù)確定子模塊從數(shù)據(jù)空間S中依次 取出下一個(gè)單元格進(jìn)行處理,直到數(shù)據(jù)空間S為空,設(shè)得到N個(gè)劃分,最后得到一個(gè)數(shù)據(jù)空 間S的劃分集合(P1,p2,? ? ?pn,? ? ?pN},n= 1,2,? ? ?,N;
[0056] 含噪數(shù)據(jù)添加模塊,用于向每個(gè)劃分中分別添加符合拉普拉斯分布的隨機(jī)噪聲, 得到含噪數(shù)據(jù)集,包括以下子模塊,
[0057] 隨機(jī)噪聲計(jì)算子模塊,用于計(jì)算符合拉普拉斯分布的隨機(jī)噪聲noise~Lap(Af/ e),相應(yīng)位置參數(shù)為0,尺度參數(shù)為Af/e,其中,Af為全局敏感度;
[0058] 隨機(jī)噪聲添加子模塊,用于從數(shù)據(jù)空間S的劃分集合{Pl,p2, ...pn,...pN}中依次 取出一個(gè)劃分Pn,向劃分Pn中添加噪聲noise(pn);
[0059] 單元格噪聲確定子模塊,用于計(jì)算劃分pn中每個(gè)單元格噪聲的大小,設(shè)某單元格 Ci為劃分pn中所包含的單元格,相應(yīng)噪聲noise(c;) =noise(pn)/pn.size(),pn.size()為 劃分Pn中所包含的單元格個(gè)數(shù);
[0060] 含噪數(shù)據(jù)集生成子模塊,用于命令隨機(jī)噪聲添加子模塊從數(shù)據(jù)空間S的劃分集合 {Pl,p2, ...pn,...pN}中依次取出下一個(gè)劃分進(jìn)行處理,直到數(shù)據(jù)空間S的N個(gè)劃分都取完 為止,最后得到一個(gè)含噪數(shù)據(jù)集,每個(gè)含噪計(jì)數(shù):^對應(yīng)一個(gè)單元格c1;
[0061]查詢模塊,用于基于含噪數(shù)據(jù)添加模塊所得含噪數(shù)據(jù)集對外提供數(shù)據(jù)查詢結(jié)果, 包括以下子模塊,
[0062] 查詢輸入子模塊,用于給定一個(gè)查詢Q,指定左、上、右、下四個(gè)邊框的坐標(biāo)值,Q為 正方形或矩形;
[0063] 噪聲計(jì)數(shù)子模塊,用于從數(shù)據(jù)空間S的mXm個(gè)單元格中依次取出一個(gè)單元格Ci, 若(^完全包含于查詢Q,則Q得到單元格c,的噪聲計(jì)數(shù)若C1不完全包含于查詢Q, Q與(^的交集為Ii,通過I1的面積與ci面積的比值乘以噪聲計(jì)數(shù)筆得到交集I1中的噪聲計(jì) 數(shù)天、
[0064] 含噪結(jié)果統(tǒng)計(jì)子模塊,用于命令噪聲計(jì)數(shù)子模塊從數(shù)據(jù)空間S的mXm個(gè)單元格中 依次取出下一個(gè)單元格進(jìn)行處理,直到數(shù)據(jù)空間S的mXm個(gè)單元格都取完為止,求得查詢 Q包含的單元格中噪聲計(jì)數(shù)爲(wèi)/之和i;
[0065]結(jié)果返回子模塊,用于為查詢Q返回含噪結(jié)果I。
[0066] 而且,隨機(jī)噪聲計(jì)算子模塊中,全局敏感度A f = 1。
[0067]而且,噪聲計(jì)數(shù)子模塊中,若C1不完全包含于查詢Q,Q與單元格ci交集Ii的噪聲 計(jì)數(shù)areaCQ為Q與單元格(^交集1;的面積,area(Ci)為單元 格C1的面積。
[0068] 本發(fā)明基于對噪聲誤差和均勻假設(shè)誤差的分析,提出了一種新穎的數(shù)據(jù)域粒度劃 分模型來平衡兩種誤差,使得數(shù)據(jù)查詢總誤差最小。此模型建立時(shí)考慮了查詢?yōu)榫匦蔚那?形,更符合數(shù)據(jù)查詢實(shí)際情況。進(jìn)一步,通過對數(shù)據(jù)空間中相似單元格進(jìn)行合并,使得地理 空間數(shù)據(jù)的查詢誤差更低,在保護(hù)用戶隱私記錄安全的同時(shí),極大增強(qiáng)了數(shù)據(jù)的可用性。
[0069] 與現(xiàn)有技術(shù)對比有如下的有益效果:
[0070] 1.從數(shù)據(jù)域劃分粒度出發(fā),而不是僅僅通過樹型結(jié)構(gòu)對數(shù)據(jù)域進(jìn)行分割以提高數(shù) 據(jù)可用性,使得數(shù)據(jù)劃分粒度更優(yōu),數(shù)據(jù)可用性更高。
[0071] 2.數(shù)據(jù)域粒度劃分模型建立時(shí),數(shù)據(jù)查詢Q可以是正方形,也可以是矩形,此模型 更符合數(shù)據(jù)查詢實(shí)際情況,使得劃分粒度更準(zhǔn)確。
[0072] 3.相似單元格合并時(shí),不僅僅是相鄰單元格之間進(jìn)行合并,只要均勻性度量參數(shù) 小于給定閾值,不相鄰的單元格也可以合并,降低了添加到每個(gè)單元格中的噪聲,進(jìn)一步提 高了數(shù)據(jù)可用性。
【附圖說明】
[0073] 圖1是本發(fā)明實(shí)施例的數(shù)據(jù)查詢Q的查詢示意圖。
[0074]圖2是本發(fā)明實(shí)施例的相似單元格合并示意圖。
【具體實(shí)施方式】
[0075] 本發(fā)明提出了一種面向地理空間數(shù)據(jù)的用戶隱私保護(hù)方法,該方法基于噪聲誤差 和均勻假設(shè)誤差提出了一種更符合數(shù)據(jù)查詢實(shí)際情況的數(shù)據(jù)域粒度劃分模型,通過此模 型,能夠更準(zhǔn)確地對數(shù)據(jù)空間進(jìn)行分割,提高數(shù)據(jù)查詢精度和數(shù)據(jù)可用性;本發(fā)明還設(shè)計(jì)了 數(shù)據(jù)空間中相似單元格的合并,進(jìn)一步提高了數(shù)據(jù)的可用性。為使本發(fā)明的目的、技術(shù)方案 和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施案例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
[0076] 圖1所示為本發(fā)明數(shù)據(jù)查詢Q的查詢示意圖,如圖所示,查詢Q為虛線框,Q與數(shù)據(jù) 空間中的單元格相交,圖中陰影部分為Q包含區(qū)域,點(diǎn)陰影部分所屬單元格完全包含于Q, 斜線陰影部分所屬單元格部分包含于Q,查詢Q形狀可為矩形,在其基礎(chǔ)上建立的數(shù)據(jù)域粒 度劃分模型更符合數(shù)據(jù)查詢實(shí)際情況,數(shù)據(jù)空間的分割粒度更準(zhǔn)確。圖2為相似單元格合 并示意圖,所有相似單元格合并到同一個(gè)劃分,如所有點(diǎn)陰影單元格合并到劃分A,所有斜 線陰影單元格合并到劃分B,所有斜線網(wǎng)格陰影單元格合并到劃分C,所有橫豎線網(wǎng)格陰影 單元格合并到劃分D,等等類似,進(jìn)一步提高數(shù)據(jù)查詢精度和數(shù)據(jù)可用性。
[0077] 本發(fā)明提出一種地理空間數(shù)據(jù)的用戶隱私保護(hù)方法,具體實(shí)施時(shí)可采用計(jì)算機(jī)軟 件技術(shù)實(shí)現(xiàn)自動運(yùn)行流程。實(shí)施例流程包括以下步驟:
[0078] 步驟一、根據(jù)數(shù)據(jù)域粒度劃分模型對數(shù)據(jù)空間進(jìn)行分割,將整體數(shù)據(jù)空間劃分為 一個(gè)個(gè)獨(dú)立單元格,執(zhí)行以下步驟:
[0079] I. 1根據(jù)數(shù)據(jù)空間大小得到數(shù)據(jù)空間的長度L和寬度H ;
[0080] 1. 2將數(shù)據(jù)空間劃分為mXm個(gè)單元格,本發(fā)明的數(shù)據(jù)域粒度劃分模型如下,
[0081]
[0082] 其中,k為相對誤差與面積的比例系數(shù),可通過線性回歸分析確定,例如可取值為 0. 1314,e為隱私預(yù)算,本領(lǐng)域技術(shù)人員可自行預(yù)設(shè)取值,通常取一個(gè)較小值,如0.1、0. 5 或1,計(jì)算橫軸上每個(gè)單元格長度1,I=L/m,計(jì)算縱軸上每個(gè)單元格長度h,h=H/m,根據(jù) 1和h的值,依次記錄每個(gè)單元格Ci的左、上、右、下四個(gè)邊框的坐標(biāo)值,i= 1,2,. . .,mXm;
[0083]1. 3從數(shù)據(jù)集中依次取出一個(gè)數(shù)據(jù)點(diǎn)point(X,y),如果point(X,y)落于單元格 C1,即X小于C1右側(cè)邊框橫軸坐標(biāo)值,大于等于c忐側(cè)邊框橫軸坐標(biāo)值,y小于c上側(cè)邊框 縱軸坐標(biāo)值,大于等于C1下側(cè)邊框縱軸坐標(biāo)值,則c,增加一個(gè)計(jì)數(shù),否則不增加;
[0084] 1.4返回步驟1.3從數(shù)據(jù)集中依次取出下