亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符求解方法

文檔序號:6629290閱讀:923來源:國知局
一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符求解方法
【專利摘要】本發(fā)明涉及一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符求解方法,屬于信息安全中的隱私保護(hù)【技術(shù)領(lǐng)域】,該方法包括以下步驟:首先將數(shù)據(jù)表集轉(zhuǎn)化為超圖二分圖,然后利用圖的兩點間通路求解方法計算二分結(jié)點集中兩點之間的所有通路,最后輸出所有通路。本發(fā)明方法有效解決了QUASI_IDENTIFIER方法在相關(guān)數(shù)據(jù)表求解過程中因為Paths方法產(chǎn)生的效率問題,使Paths方法的時間復(fù)雜度O(V4)降為本發(fā)明方法的O(V3)。
【專利說明】-種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符求解方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種準(zhǔn)標(biāo)識符求解方法,特別涉及一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符的 求解方法,屬于信息安全中的隱私保護(hù)【技術(shù)領(lǐng)域】。

【背景技術(shù)】
[0002] 保護(hù)發(fā)布數(shù)據(jù)的隱私信息主要采用匿名的方法。為了隱藏元組標(biāo)識和敏感信息之 間的關(guān)系,首先要刪除數(shù)據(jù)表中的顯式標(biāo)識符。但美國卡基梅隆大學(xué)的LSweeney指出, 即使所有的顯式標(biāo)識符都已經(jīng)被刪除,數(shù)據(jù)表中仍有隱私泄漏的隱患。L.Sweeney利用從 不同網(wǎng)站購買到的馬薩諸塞州集體保險信息表和選民信息表,通過屬性組合{Race,Birth Date,Sex,Zip}進(jìn)行連接,得到了馬薩諸塞州前州長WillianWeld的醫(yī)療信息,而這兩個 數(shù)據(jù)表中的任何一個都不會泄漏醫(yī)療信息。
[0003] k-匿名方法是一種廣泛應(yīng)用的匿名方法,它能有效防止由連接攻擊造成的隱私信 息泄露,并能保證發(fā)布數(shù)據(jù)的完整性和一定的數(shù)據(jù)效用。其基本思想是將待發(fā)布數(shù)據(jù)表和 已發(fā)布的相關(guān)數(shù)據(jù)表進(jìn)行連接的屬性定義為準(zhǔn)標(biāo)識符,并且使得在準(zhǔn)標(biāo)識符上的投影所得 到的具有相同屬性值的元組個數(shù)至少為k個(k> = 2),從而達(dá)到保護(hù)敏感信息的目的。由 此可見,準(zhǔn)標(biāo)識符是導(dǎo)致連接攻擊的主要因素,而確定k值和準(zhǔn)標(biāo)識符是k-匿名方法的關(guān) 鍵環(huán)節(jié)。
[0004] 以往k-匿名方法的研究都是在已預(yù)先確定準(zhǔn)標(biāo)識符的情況下進(jìn)行的,研究者根 據(jù)個人經(jīng)驗指定準(zhǔn)標(biāo)識符。然而在實際應(yīng)用中,準(zhǔn)確的準(zhǔn)標(biāo)識符對k-匿名方法的有效性具 有重要意義。只有找到準(zhǔn)確的準(zhǔn)標(biāo)識符,才能防止通過準(zhǔn)標(biāo)識符連接造成隱私泄露;只有找 到數(shù)量恰當(dāng)?shù)臏?zhǔn)標(biāo)識符,才能避免因為過度泛化所帶來的發(fā)布數(shù)據(jù)效用低下的問題。
[0005] 目前在k-匿名中準(zhǔn)標(biāo)識符求解問題的研究中,主要應(yīng)用的方法為最小準(zhǔn)標(biāo)識符 屬性求解方法(MaskingQuasiidentifiers)。然而,在對特定數(shù)據(jù)集的準(zhǔn)標(biāo)識符求解問題 上,Song等人指出,MaskingQuasiidentifiers方法依然存在缺陷,因為該方法沒有考慮數(shù) 據(jù)表的多次發(fā)布而引起的多次連接攻擊,致使求解結(jié)果不準(zhǔn)確。由此,Song等人提出了基 于超圖的準(zhǔn)標(biāo)識符求解方法QUASI_IDENTIFIER,該方法可以很好的解決準(zhǔn)標(biāo)識符求解特別 是數(shù)據(jù)表動態(tài)發(fā)布過程中的準(zhǔn)標(biāo)識符求解問題。然而QUASI_IDENTIFIER方法在使用Paths 方法將超圖轉(zhuǎn)化為普通圖的過程中仍存在效率問題


【發(fā)明內(nèi)容】

[0006] 本發(fā)明針對QUASI_IDENTIFIER方法在相關(guān)數(shù)據(jù)表求解過程中因為Paths方法產(chǎn) 生的效率問題,提出了一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符的求解方法。
[0007] 本發(fā)明方法的思想是首先將超圖轉(zhuǎn)換為二分圖,然后利用圖的兩點間通路求解方 法計算二分結(jié)點集中兩點之間的所有通路,最后輸出所有通路。該方法雖然增加了轉(zhuǎn)換成 二分圖的結(jié)點數(shù),但時間復(fù)雜度是以多項式的時間增加,相比于Paths方法的指數(shù)時間增 長,效率顯著提高。
[0008] 本發(fā)明是通過下述技術(shù)方案實現(xiàn)的:
[0009] 輸入:標(biāo)識符E,敏感屬性S,數(shù)據(jù)表集IT1,IV"TJ;
[0010] 輸出:若能從S推測出E,則輸出從S到E的序列集合,否則輸出空集;
[0011] 一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符的求解方法,包括以下步驟:
[0012] 1)將數(shù)據(jù)表集IT1JfTJ轉(zhuǎn)化為超圖H,將S作為起始點Vs,將E作為結(jié)束點Ve ;
[0013] 2)將超圖H轉(zhuǎn)化為二分圖G〈H>;
[0014] 3)用鄰接表A存儲超圖二分圖中頂點集V及V的鄰接點;
[0015] 4)用線性表Visited存儲二分頂點集中每一個點的訪問標(biāo)記并全部初始化為未 標(biāo)記;
[0016] 5)將起始點作為Vil;
[0017] 6)標(biāo)記Vil,若Vil是結(jié)束點I,則輸出從起始點到結(jié)束點的節(jié)點序列,然后轉(zhuǎn)到8), 否則進(jìn)一步判斷Vil是否有未標(biāo)記的鄰接節(jié)點;
[0018] 7)若Vil有未標(biāo)記的鄰接節(jié)點,則將Vil的第一個未標(biāo)記的鄰接節(jié)點Vjl作為Vil的 子節(jié)點,并將M乍為Vil,轉(zhuǎn)到6);否則,轉(zhuǎn)到8);
[0019] 8)取消對Vil的標(biāo)記,若Vil有未標(biāo)記的兄弟節(jié)點,則將Vil的第一個未標(biāo)記兄弟節(jié) 點M乍為Vil的父節(jié)點的子節(jié)點,并將L作為Vil,轉(zhuǎn)到6);否則,進(jìn)一步判斷Vil是否有父 節(jié)點;
[0020] 9)若Vil有父節(jié)點,則將父節(jié)點作為Vil ;
[0021] 10)判斷若Vil和Vs是同一個點,則算法結(jié)束,否則,轉(zhuǎn)到8)。
[0022] 有益效果
[0023] 在保證準(zhǔn)確率的前提下,本發(fā)明降低了原有方法的時間復(fù)雜度。在二分圖中,從 起點到終點搜索過程在最壞情況下要經(jīng)過每一個點,經(jīng)過每一點的最壞情況要遍歷每一條 邊。假設(shè)二分圖中有V個點,E條邊,則方法的時間復(fù)雜度為O(VE)。在二分圖的點數(shù)不變 的前提下,當(dāng)上下兩排點的點數(shù)相同時邊數(shù)最多,此時有E=V2/4,所以方法的時間復(fù)雜度 為〇 (V3),優(yōu)于Paths方法的0 (V4)。

【專利附圖】

【附圖說明】
[0024] 圖1是一個超圖示意圖。
[0025] 圖2是一個二分圖示意圖。
[0026] 圖3是由表3、4、5、6轉(zhuǎn)換成的超圖。
[0027] 圖4是由圖3轉(zhuǎn)成的超圖二分圖。
[0028] 圖5是本發(fā)明方法的流程圖。
[0029] 圖6是以本發(fā)明方法以Disease為起始點,以Name為結(jié)束點時形成的搜索樹。

【具體實施方式】
[0030] 為了說明本發(fā)明方法的有效性,首先要介紹一些定義、方法,進(jìn)行可行性分析,并 通過一些例子來說明這些概念。
[0031] 定義1:敏感信息
[0032] 設(shè)R(A)為一關(guān)系,其中,R為關(guān)系名,A為屬性集,有E,SGA且E尹S, T1 (A1),T2 (A2),…,Tn(An)為基于R的已發(fā)布數(shù)據(jù)表。如果從保密角度考慮,允許EGAi,SGAj(l彡i,j彡n八i關(guān)j),但不允許E,SGAk(l彡k彡n),則稱TIE,SR為數(shù)據(jù) 發(fā)布過程中的敏感信息,記為F(E,S),稱F(E,S)中的元組為敏感信息元組,其中,E為標(biāo)識 符,S為敏感屬性。
[0033]例1表1原始數(shù)據(jù)表

【權(quán)利要求】
1. 一種改進(jìn)的k-匿名中準(zhǔn)標(biāo)識符的求解方法,其特征在于,包括以下步驟: 1) 將數(shù)據(jù)表集IT1, T2··· TJ轉(zhuǎn)化為超圖H,將S作為起始點Vs,將E作為結(jié)束點Ve ; 其中Ti為第i個數(shù)據(jù)表,I < i < n ;S為敏感屬性,E為標(biāo)識符; 2) 將超圖H轉(zhuǎn)化為二分圖G〈H> ; 3) 用鄰接表A存儲超圖二分圖中頂點集V及V的鄰接點; 4) 用線性表Visited存儲二分頂點集中每一個點的訪問標(biāo)記并全部初始化為未標(biāo)記; 5) 將起始點Vs作為Vil ; 6) 標(biāo)記Vil,若Vil是結(jié)束點I,則輸出從起始點到結(jié)束點的節(jié)點序列,然后轉(zhuǎn)到8),否 則進(jìn)一步判斷V il是否有未標(biāo)記的鄰接節(jié)點; 7) 若Vil有未標(biāo)記的鄰接節(jié)點,則將Vil的第一個未標(biāo)記的鄰接節(jié)點L作為Vil的子節(jié) 點,并將M乍為V il,轉(zhuǎn)到6);否則,轉(zhuǎn)到8); 8) 取消對Vil的標(biāo)記,若Vil有未標(biāo)記的兄弟節(jié)點,則將Vil的第一個未標(biāo)記兄弟節(jié)點V jI 作為Vil的父節(jié)點的子節(jié)點,并將Vp作為Vil,轉(zhuǎn)到6);否則,判斷Vil是否有父節(jié)點; 9) 若Vil有父節(jié)點,則將父節(jié)點作為Vil ; 10) 判斷若Vil和Vs是同一個點,則算法結(jié)束,否則,轉(zhuǎn)到8)。
【文檔編號】G06F21/60GK104318167SQ201410522379
【公開日】2015年1月28日 申請日期:2014年10月7日 優(yōu)先權(quán)日:2014年10月7日
【發(fā)明者】金福生, 胡曉煒, 顏震, 李松, 韓翔宇 申請人:北京理工大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1