本發(fā)明涉及數(shù)據(jù)隱私保護(hù)
技術(shù)領(lǐng)域:
:,具體涉及一種動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法。
背景技術(shù):
::社會(huì)網(wǎng)絡(luò)是由許多節(jié)點(diǎn)和邊構(gòu)成的一種社會(huì)結(jié)構(gòu),節(jié)點(diǎn)通常是指?jìng)€(gè)人或組織,節(jié)點(diǎn)之間的連線即邊代表個(gè)人或組織的相互關(guān)系。隨著經(jīng)濟(jì)的快速發(fā)展,社會(huì)網(wǎng)絡(luò)的應(yīng)用也越來(lái)越普及,例如facebook、linkinin等。社會(huì)網(wǎng)絡(luò)中包含著用戶有很多的個(gè)人信息,例如姓名,性別,年齡,地址,職業(yè)。在社會(huì)網(wǎng)絡(luò)圖中,屬性表示為標(biāo)簽,用戶可以選擇特定屬性信息隱藏,所以標(biāo)簽可以分為敏感和非敏感。最常用且直觀的一種匿名方法為簡(jiǎn)單匿名,即移除能唯一標(biāo)識(shí)用戶的顯式標(biāo)識(shí)符屬性,只保留標(biāo)簽表示屬性信息。許多先前的研究已經(jīng)證實(shí)簡(jiǎn)單匿名不足以保護(hù)用戶隱私。而現(xiàn)有的研究也僅是基于靜態(tài)網(wǎng)絡(luò)設(shè)計(jì)的通用的隱私保護(hù)方法,隱私保護(hù)技術(shù)集中于研究單次數(shù)據(jù)發(fā)布,而很少是基于動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布的用途來(lái)設(shè)計(jì)隱私保護(hù)方法。發(fā)展變化的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)動(dòng)態(tài)發(fā)布需要?jiǎng)討B(tài)的隱私保護(hù)方法來(lái)處理。技術(shù)實(shí)現(xiàn)要素:本發(fā)明所要解決的是現(xiàn)有隱私保護(hù)的匿名方法僅是基于靜態(tài)網(wǎng)而設(shè)計(jì),而無(wú)法適用于動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布的問(wèn)題,提供一種動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法。為解決上述問(wèn)題,本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法,包括如下步驟:步驟1、設(shè)定隱私水平l和時(shí)間窗口w,并將分組表gs-table置為空;步驟2、初始化當(dāng)前時(shí)刻t原始的社會(huì)網(wǎng)絡(luò)數(shù)據(jù);即去掉顯示的標(biāo)識(shí)屬性,改用標(biāo)簽表示;同時(shí),將節(jié)點(diǎn)集合按度數(shù)排列,得到新的節(jié)點(diǎn)集合;步驟3、對(duì)帶敏感標(biāo)簽的節(jié)點(diǎn)根據(jù)鄰居標(biāo)簽相似度進(jìn)行分組;步驟3.1、選擇新的節(jié)點(diǎn)集合中度數(shù)最大的帶敏感標(biāo)簽的節(jié)點(diǎn),并將該選中的節(jié)點(diǎn)從新的節(jié)點(diǎn)集合中去除;步驟3.2、計(jì)算選中的帶敏感標(biāo)簽的節(jié)點(diǎn)和新的節(jié)點(diǎn)集合中的每個(gè)節(jié)點(diǎn)的標(biāo)簽相似度,并將該選中的帶敏感標(biāo)簽的節(jié)點(diǎn)及其標(biāo)簽相似度最相似的節(jié)點(diǎn)歸為一組,直到該分組中所包含的節(jié)點(diǎn)個(gè)數(shù)達(dá)到隱私水平l;步驟3.3、重復(fù)步驟3.1-3.2,直至新的節(jié)點(diǎn)集合中不再含有帶敏感標(biāo)簽的節(jié)點(diǎn);步驟4、完成分組的工作后,將t時(shí)刻所生成的分組,合并到分組表gs-table中;步驟5、判斷當(dāng)前時(shí)刻t是否小于等于時(shí)間窗口w;如果t≤w,則返回步驟2;如果t>w,則從分組表gs-table中移除t-w時(shí)刻所生成的分組;步驟6、對(duì)于分組表gs-table中的各個(gè)分組,對(duì)組內(nèi)所有節(jié)點(diǎn)的1-鄰居圖采用邊復(fù)制和標(biāo)簽泛化的方法把原始圖匿名成同構(gòu);步驟7、發(fā)布匿名后的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)。上述步驟1中,將節(jié)點(diǎn)集合按度數(shù)降序排列,得到新的節(jié)點(diǎn)序列。上述方法中,每個(gè)時(shí)刻t對(duì)應(yīng)一次原始的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)的更新。上述方法中,隱私水平l的取值范圍介于2~30之間。上述方法中,時(shí)間窗口w的取值范圍介于1~10之間。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下特點(diǎn):(1)本發(fā)明在每次分組時(shí),都把鄰居標(biāo)簽相似度最大的節(jié)點(diǎn)分到一組,直到所有的帶敏感標(biāo)簽的節(jié)點(diǎn)分配合適的分組,最后對(duì)組內(nèi)的非敏感標(biāo)簽的個(gè)體在匿名社會(huì)網(wǎng)絡(luò)中做隱藏標(biāo)簽處理;這樣能夠保護(hù)帶敏感標(biāo)簽的節(jié)點(diǎn),使得帶敏感標(biāo)簽的節(jié)點(diǎn)在匿名前后的改變小,匿名損失最?。?2)本發(fā)明對(duì)w次發(fā)布的社會(huì)網(wǎng)絡(luò)進(jìn)行l(wèi)w-grouping分組,使之滿足動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布的匿名要求,t時(shí)刻已經(jīng)分組的節(jié)點(diǎn),t+1時(shí)刻不能分到其他組中,這樣攻擊者就不能通過(guò)比對(duì)多次發(fā)布,使敏感信息泄露;(3)本發(fā)明建立一個(gè)gs-table表,其僅保證在連續(xù)w次發(fā)布中,對(duì)組內(nèi)節(jié)點(diǎn)的1-鄰居圖進(jìn)行匿名化處理,而超過(guò)w次發(fā)布時(shí)候,則從表內(nèi)移除t-w時(shí)刻的分組,從而保證數(shù)據(jù)的可用性和效用性。附圖說(shuō)明圖1為動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法的原理圖。圖2為動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法的流程圖。圖3為不同時(shí)刻輸入的社會(huì)網(wǎng)絡(luò),其中(a)為t=1時(shí)刻輸入的社會(huì)網(wǎng)絡(luò)g1,(b)為t=2時(shí)刻輸入的社會(huì)網(wǎng)絡(luò)g2,(c)為t=3時(shí)刻輸入的社會(huì)網(wǎng)絡(luò)g3。圖4為不同時(shí)刻匿名后的社會(huì)網(wǎng)絡(luò),其中(a)為t=2時(shí)刻匿名社會(huì)網(wǎng)絡(luò)g2’,(b)為t=3時(shí)刻匿名社會(huì)網(wǎng)絡(luò)g3’。具體實(shí)施方式本發(fā)明用到的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)是帶標(biāo)簽的簡(jiǎn)單無(wú)向圖,攻擊者的背景知識(shí)可以是任意節(jié)點(diǎn)所在的特定的子圖信息,即鄰居標(biāo)簽信息。社會(huì)網(wǎng)絡(luò)數(shù)據(jù)在發(fā)布前需要進(jìn)行初步的匿名處理,即去掉唯一標(biāo)識(shí)節(jié)點(diǎn)的顯示標(biāo)識(shí)屬性,如姓名等,改用標(biāo)簽表示屬性信息。發(fā)布的圖用gt(vt;et;lt)表示動(dòng)態(tài)網(wǎng)絡(luò)t時(shí)刻的圖,其中vt為節(jié)點(diǎn)的集合,表示社會(huì)網(wǎng)絡(luò)中的個(gè)人或其他實(shí)體;et表示個(gè)體之間的關(guān)聯(lián),即圖中邊的集合,表示個(gè)人或?qū)嶓w間的關(guān)系,如朋友、合作關(guān)系;lt表示個(gè)體的標(biāo)簽的集合。本發(fā)明提出了一個(gè)動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布隱私模型,即lw-graphic-diversity。該lw-graphic-diversity模型給定一個(gè)在時(shí)刻t帶標(biāo)簽的動(dòng)態(tài)網(wǎng)絡(luò)gt(vt;vst;et;lt)和一個(gè)隱私閾值l。其中vt表示節(jié)點(diǎn)的集合;vst表示帶敏感標(biāo)簽的節(jié)點(diǎn)的集合;et表示邊的集合;lt表示個(gè)體的標(biāo)簽的集合;γ表示節(jié)點(diǎn)到標(biāo)簽的映射關(guān)系,γ:vt→lt。在這個(gè)模型中,把節(jié)點(diǎn)鄰居標(biāo)簽信息作為攻擊者的背景知識(shí),個(gè)體自身的敏感標(biāo)簽,作為用戶需要保護(hù)的敏感信息,就是將原始網(wǎng)絡(luò)gt轉(zhuǎn)化為局部擾亂的匿名社會(huì)網(wǎng)絡(luò)gt’,使匿名后的網(wǎng)絡(luò)在動(dòng)態(tài)發(fā)布中滿足l-多樣性要求。在動(dòng)態(tài)發(fā)布的社會(huì)網(wǎng)絡(luò)經(jīng)過(guò)本發(fā)明的匿名方法處理,能夠有效防止攻擊者使用背景知識(shí)對(duì)用戶所在的發(fā)布的數(shù)據(jù)中重新定位。參見(jiàn)圖1,本發(fā)明所設(shè)計(jì)的動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法,其主要的數(shù)據(jù)處理過(guò)程為:首先是初始化數(shù)據(jù),即去掉顯示的標(biāo)識(shí)屬性,改用標(biāo)簽表示。除此之外,再將節(jié)點(diǎn)集合vt按度數(shù)降序排列,得到新的節(jié)點(diǎn)序列。接下來(lái)是對(duì)帶敏感標(biāo)簽的節(jié)點(diǎn)根據(jù)鄰居標(biāo)簽相似度進(jìn)行分組,在此過(guò)程中:先選擇第一個(gè)帶敏感標(biāo)簽節(jié)點(diǎn),這里選擇當(dāng)前節(jié)點(diǎn)列表中度數(shù)最大的敏感節(jié)點(diǎn),此時(shí)節(jié)點(diǎn)集合vt中除去已選中的節(jié)點(diǎn)。后計(jì)算這個(gè)節(jié)點(diǎn)和vt中的每個(gè)節(jié)點(diǎn)的標(biāo)簽相似度,選擇最相似的節(jié)點(diǎn)放在一組,直到組中節(jié)點(diǎn)包含的節(jié)點(diǎn)個(gè)數(shù)達(dá)到隱私水平l。再選擇下一個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn),重復(fù)以上步驟直到剩下的節(jié)點(diǎn)集合v的個(gè)數(shù)小于l,候選集中的節(jié)點(diǎn)表示準(zhǔn)備選到組中的帶敏感標(biāo)簽的節(jié)點(diǎn)集。直到候選節(jié)點(diǎn)集合為空,此時(shí)所有的敏感標(biāo)簽節(jié)點(diǎn)分到鄰居標(biāo)簽信息相似度最大的組。但如果存在組g中帶標(biāo)簽個(gè)體個(gè)數(shù)小于l,則從組集中移除組gi,并且將組中的節(jié)點(diǎn)分到和組中節(jié)點(diǎn)有最大標(biāo)簽相似度的其他的組中去。完成分組的工作后,將生成的組集ct,即t時(shí)刻所有g(shù)i的集合,合并到gs-table中去,要保證w時(shí)刻內(nèi)隱私得到保護(hù),對(duì)組內(nèi)節(jié)點(diǎn)的1-鄰居圖通過(guò)邊復(fù)制和標(biāo)簽泛化的方法把原始圖匿名成同構(gòu),最后發(fā)布匿名后的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)。為解決連續(xù)發(fā)布動(dòng)態(tài)網(wǎng)絡(luò)的隱私問(wèn)題,同時(shí)也保證數(shù)據(jù)效用性,本發(fā)明建立一個(gè)分組表gs-table,只保證連續(xù)w次發(fā)布中,對(duì)組內(nèi)節(jié)點(diǎn)的1-鄰居圖進(jìn)行匿名化處理;而超過(guò)w時(shí)間,則從表內(nèi)移除t-w時(shí)刻的分組。gs-table是有組集構(gòu)成,t=1時(shí)刻的組集記為c1,即將帶標(biāo)簽節(jié)點(diǎn)按照標(biāo)簽相似度進(jìn)行分組,直到帶敏感標(biāo)簽的節(jié)點(diǎn)所在候選集為空,分組操作結(jié)束。組集中包含的組gi,每個(gè)組中包含的是l個(gè)帶不同標(biāo)簽的節(jié)點(diǎn)集,紅色標(biāo)記的是帶敏感標(biāo)簽的節(jié)點(diǎn),黑色是帶非敏感標(biāo)簽的節(jié)點(diǎn)。每個(gè)組中包含不少于1個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn)。組中的節(jié)點(diǎn)在發(fā)布社會(huì)網(wǎng)絡(luò)匿名圖時(shí),組內(nèi)節(jié)點(diǎn)標(biāo)簽要全部隱藏。t=2時(shí)刻的組集記為c2,c1組集gi中已經(jīng)分過(guò)組的節(jié)點(diǎn),不能在c2組集的其他組中出現(xiàn)。t=2時(shí)刻和組gi中節(jié)點(diǎn)有最大鄰居標(biāo)簽相似度,但還未分到任何組中,通過(guò)分組,加入到c1組集gi中,生成c2組集中的gi’。直到w次連續(xù)后,gs-table構(gòu)建完成。對(duì)于t=2時(shí)刻的新添加的帶敏感標(biāo)簽的節(jié)點(diǎn),也進(jìn)行分組操作,不能分到任何現(xiàn)有的組中,新添加的帶敏感節(jié)點(diǎn)要根據(jù)分組算法單獨(dú)分到新創(chuàng)建的組中,保證組內(nèi)新添加節(jié)點(diǎn)不少于l個(gè)帶不同標(biāo)簽的個(gè)體,并且保證組內(nèi)節(jié)點(diǎn)全是新添加的節(jié)點(diǎn)。當(dāng)t>w時(shí),移除t=1時(shí)刻的c1,在滿足以上隱私要求條件下,更新ct組集中的節(jié)點(diǎn)。保證了數(shù)據(jù)的可用性。下面通過(guò)一個(gè)具體的實(shí)例來(lái)對(duì)本發(fā)明進(jìn)行進(jìn)一步說(shuō)明:例:時(shí)間窗口w設(shè)為2。其中g(shù)1中的節(jié)點(diǎn)v1和g2中的節(jié)點(diǎn)v3是帶敏感標(biāo)簽的節(jié)點(diǎn),其他節(jié)點(diǎn)是不帶敏感標(biāo)簽的個(gè)體。如表1,t=1時(shí)刻對(duì)每個(gè)帶敏感標(biāo)簽的個(gè)體劃分到鄰居標(biāo)簽相似度最大的組中。如表2,t=2時(shí)刻對(duì)節(jié)點(diǎn)重新分組,得到新的分組,此時(shí)gs-table中包括c1,c2。如表3,t=3時(shí)刻將t=1時(shí)刻在gs-table的分組移除,再對(duì)節(jié)點(diǎn)進(jìn)行重新分組,此時(shí)gs-table中包括c2,c3。t=2時(shí)刻需要匿名的節(jié)點(diǎn)就是gi∪gi’中所有的節(jié)點(diǎn)。針對(duì)動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)多次發(fā)布防止標(biāo)簽鄰居攻擊用途中這一具體應(yīng)用,本發(fā)明提出了一種滿足動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)隱私匿名方法,即動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法,如圖2所示,主要的實(shí)現(xiàn)過(guò)程如下:步驟1:初始化數(shù)據(jù)集,輸入社會(huì)網(wǎng)絡(luò)gt,參數(shù)隱私水平l,時(shí)間窗口w,分組表gs-table。每個(gè)時(shí)刻t對(duì)應(yīng)一次原始的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)的更新。圖3為不同時(shí)刻輸入的社會(huì)網(wǎng)絡(luò)gt,t=1,2,3,w=2,l=2。步驟2:將gs-table置為空,將節(jié)點(diǎn)集合vt按度數(shù)進(jìn)行降序排列,以方便后續(xù)程序中節(jié)點(diǎn)的選擇。步驟3:判斷當(dāng)前時(shí)刻t是否小于等于w,若是,則轉(zhuǎn)到步驟4。否則轉(zhuǎn)到步驟9。由于算法在進(jìn)行第一分組之前,當(dāng)前時(shí)刻t=1即連續(xù)發(fā)布次數(shù)必定小于等于設(shè)定的時(shí)間窗口w,因此在具體的算法編譯上,步驟3關(guān)于w與w判斷的步驟,可以在每次分組步驟運(yùn)行之前進(jìn)行,也可以在每次完成分組步驟之后進(jìn)行,且并不會(huì)影響本發(fā)明實(shí)現(xiàn)效果。在步驟3中,從以下兩方面防止多次發(fā)布鄰居標(biāo)簽信息攻擊,同時(shí)保證數(shù)據(jù)的效用性:在選擇帶敏感標(biāo)簽節(jié)點(diǎn)分組時(shí),如果t=1時(shí)刻已經(jīng)分組的節(jié)點(diǎn),t=2時(shí)刻不能分到其他組里面去,有效防止了通過(guò)比對(duì)多次發(fā)布的社會(huì)網(wǎng)絡(luò)而造成了信息的泄露。對(duì)于t時(shí)刻的新添加的帶敏感標(biāo)簽的節(jié)點(diǎn),也進(jìn)行分組操作,不能分到任何現(xiàn)有的組中,新添加的帶敏感節(jié)點(diǎn)要根據(jù)分組算法單獨(dú)分到新創(chuàng)建的組中,保證組內(nèi)新添加節(jié)點(diǎn)不少于隱私水平l個(gè)帶不同標(biāo)簽的個(gè)體,并且保證組內(nèi)任意節(jié)點(diǎn)是新添加的節(jié)點(diǎn),帶有相似的鄰居標(biāo)簽信息。當(dāng)t>w時(shí),移除t-w+1時(shí)刻的組集,在滿足以上隱私要求條件下,更新ct組集中的節(jié)點(diǎn),t-w+1時(shí)刻不需要再匿名的帶非敏感標(biāo)簽的節(jié)點(diǎn)保持在t-1時(shí)刻的匿名狀態(tài),保證了數(shù)據(jù)的可用性。步驟4:判斷當(dāng)前的帶敏感標(biāo)簽的節(jié)點(diǎn)集vst是否為空。若為空,則轉(zhuǎn)到步驟5。否則轉(zhuǎn)到步驟10。步驟5:選擇vst中帶敏感標(biāo)簽的節(jié)點(diǎn)us,即要找到gi的第一個(gè)節(jié)點(diǎn)us;則當(dāng)前的分組即為gi={us}。步驟6:判斷當(dāng)前的分組中的節(jié)點(diǎn)個(gè)數(shù)是否小于隱私水平l。如果小于l,則轉(zhuǎn)到步驟7。否則轉(zhuǎn)到步驟11。步驟7:判斷當(dāng)前的候選集節(jié)點(diǎn)個(gè)數(shù)是否大于0。如果大于0,則轉(zhuǎn)到步驟8。否則轉(zhuǎn)到步驟11。只有節(jié)點(diǎn)的標(biāo)簽不在當(dāng)前gi中,節(jié)點(diǎn)才會(huì)合并到候選集中。步驟8:計(jì)算當(dāng)前的帶敏感標(biāo)簽的節(jié)點(diǎn)和候選節(jié)點(diǎn)集中各節(jié)點(diǎn)的鄰居標(biāo)簽相似度,得到和帶敏感標(biāo)簽的節(jié)點(diǎn)有最大鄰居標(biāo)簽相似度的節(jié)點(diǎn)合并到當(dāng)前的分組gi中,同時(shí)vt=vt-{umax}。為了使得每個(gè)組內(nèi)的節(jié)點(diǎn)有相同的鄰居標(biāo)簽信息,我們對(duì)節(jié)點(diǎn)進(jìn)行適當(dāng)?shù)姆纸M,所以在相同組內(nèi)的1-鄰居圖和標(biāo)簽信息是同構(gòu)的。帶有非敏感標(biāo)簽的節(jié)點(diǎn)需要插入圖中,使得節(jié)點(diǎn)的標(biāo)簽鄰居圖在每個(gè)組內(nèi)是同構(gòu)的,并且組內(nèi)節(jié)點(diǎn)不少于l個(gè)。我們用以下指標(biāo)對(duì)節(jié)點(diǎn)進(jìn)行分組:鄰居標(biāo)簽相似度(nlss)。對(duì)于兩個(gè)節(jié)點(diǎn),v1的鄰居標(biāo)簽信息(nlsv1)和v2的鄰居標(biāo)簽信息(nlsv2),他們的鄰居標(biāo)簽信息相似度可以計(jì)算為:在t=1時(shí)刻,由于當(dāng)前的帶敏感標(biāo)簽的節(jié)點(diǎn)vst不為空,所以選擇第一個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn)us,此時(shí)選擇x,則g1={x},|g1|小于l,候選節(jié)點(diǎn)集中的節(jié)點(diǎn)要和x的標(biāo)簽屬性不同,且候選集中的節(jié)點(diǎn)數(shù)不為空,從候選節(jié)點(diǎn)集中選取和x的鄰居標(biāo)簽相似度最大的節(jié)點(diǎn),依次計(jì)算nlss(x,vit),得到max(nlss(x,y))=3/3=1,即他們有相同的鄰居標(biāo)簽信息,鄰居標(biāo)簽序列都為b,d,t,依據(jù)算法,選擇候選集合中的節(jié)點(diǎn)y,g1=g1∪{y},當(dāng)前的vt=vt-{y},g1組中的節(jié)點(diǎn)個(gè)數(shù)不小于l,此時(shí)c1=c1∪{g1},如果gi中的節(jié)點(diǎn)數(shù)少于l,則將組中的節(jié)點(diǎn)按照鄰居標(biāo)簽信息相似度,找到同組中節(jié)點(diǎn)有最大標(biāo)簽相似度的組中去。在t=2時(shí)刻,從候選節(jié)點(diǎn)集中選取和的標(biāo)簽相似度最大的節(jié)點(diǎn),依次計(jì)算nlss(x,vit),得到max(nlss(x,z))=4/4=1,即他們有相同的鄰居標(biāo)簽信息,鄰居標(biāo)簽序列都為b,b,d,t,依據(jù)算法,選擇候選集合中的節(jié)點(diǎn)z,g1=g1∪{z},當(dāng)前的vt=vt-{z},g1組中的節(jié)點(diǎn)個(gè)數(shù)不小于l,此時(shí)c2=c2∪{g1},如果gi中的節(jié)點(diǎn)數(shù)少于l,則將組中的節(jié)點(diǎn)按照鄰居標(biāo)簽相似度,找到同組中節(jié)點(diǎn)有最大標(biāo)簽相似度的組中去。必須指出的是在發(fā)布社會(huì)網(wǎng)絡(luò)圖中,分組的節(jié)點(diǎn)要進(jìn)行標(biāo)簽隱藏處理。步驟9:超過(guò)w時(shí)間,從表內(nèi)移除t-w時(shí)刻的分組,從gs-table中移除t-w時(shí)刻內(nèi)的組集ct。步驟10:將不少于l個(gè)不同的標(biāo)簽的分組gi合并到ct中。步驟11:判斷分組gi中的節(jié)點(diǎn)個(gè)數(shù)是否小于l。如果是的話轉(zhuǎn)到步驟13,否則轉(zhuǎn)到步驟2。步驟12:從ct中移除當(dāng)前gi,將組中的節(jié)點(diǎn)分到同u有最大鄰居標(biāo)簽信息相似度的其他組中。步驟13:將ct合并到gs-table中。我們建立一個(gè)gs-table表,只保證連續(xù)2次發(fā)布中,對(duì)組內(nèi)節(jié)點(diǎn)的1-鄰居圖進(jìn)行匿名化處理,超過(guò)w=2時(shí)刻,從表內(nèi)移除t=1時(shí)刻的分組。t=1時(shí)刻得到c1的節(jié)點(diǎn)集合為{x,y},此時(shí)gs-table中包括c1,在t=2時(shí)刻得到c2中的節(jié)點(diǎn)集合為{x,z},將c2合并到gs-table,此時(shí)gs-table中包括c1和c2,即在t=2時(shí)刻要對(duì){x,y,z}做邊復(fù)制標(biāo)簽泛化的匿名化處理。只要t≤w,我們會(huì)一直構(gòu)建gs-table。在t=3時(shí)刻,其中t>w=2,將t=1時(shí)刻中的c1移除,并將t=3時(shí)刻的鄰居標(biāo)簽相似度得到的分組c3合并到gs-table中。t=3時(shí)刻只要對(duì){x,z}做邊復(fù)制標(biāo)簽泛化的匿名化處理,對(duì)于y節(jié)點(diǎn)t=3時(shí)刻,不再進(jìn)行接下來(lái)的匿名操作。步驟14:對(duì)組內(nèi)所有節(jié)點(diǎn)的1-鄰居圖通過(guò)邊復(fù)制和標(biāo)簽泛化把原始圖匿名成同構(gòu)。t=1時(shí)刻原始圖滿足2-graphic-diversity,對(duì)于每個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn)us,至少有1個(gè)有相同標(biāo)簽鄰居圖的節(jié)點(diǎn),但節(jié)點(diǎn)本身帶不同的標(biāo)簽。攻擊者不能高于1/2的概率識(shí)別帶敏感標(biāo)簽的個(gè)體x。在圖中節(jié)點(diǎn)x帶有敏感標(biāo)簽,同時(shí),x和y有相同的1-鄰居圖,鄰居標(biāo)簽信息也相同,即鄰居標(biāo)簽都為b,d,t。gs-table中,{x,y}在組g1中。且在t=1時(shí)刻有相同的鄰居結(jié)構(gòu),所以他們是不可區(qū)分的。t=2時(shí)刻原始圖中帶敏感標(biāo)簽的節(jié)點(diǎn)x的鄰居標(biāo)簽信息發(fā)生變化,為b,b,d,t。為使帶敏感標(biāo)簽的個(gè)體不被泄露,敏感標(biāo)簽節(jié)點(diǎn)分組和lw-grouping算法產(chǎn)生的鄰居標(biāo)簽相似度最大的節(jié)點(diǎn)集{x,y,z},將x,y,z的1-鄰居圖做邊插入和標(biāo)簽泛化的算法,匿名為同構(gòu)。其中將節(jié)點(diǎn)vi的所有一步鄰居節(jié)點(diǎn)集合和這些節(jié)點(diǎn)間的邊的集合稱為節(jié)點(diǎn)vi的1-鄰居圖。邊插入是為了保證節(jié)點(diǎn)的鄰居標(biāo)簽結(jié)構(gòu)相似,我們先匹配標(biāo)簽后匹配節(jié)點(diǎn)的度,t=2時(shí)刻節(jié)點(diǎn)x新認(rèn)識(shí)了標(biāo)簽為b,度為1的節(jié)點(diǎn),t=2匿名圖中我們選擇一個(gè)未匹配的帶非敏感標(biāo)簽的節(jié)點(diǎn),標(biāo)簽同樣為b,度為2的節(jié)點(diǎn)與y之間插入邊。之后插入其他邊使得x,y,z的1-鄰居結(jié)構(gòu)圖為同構(gòu)的。參見(jiàn)圖4(a)。t=3時(shí)刻對(duì)節(jié)點(diǎn)集{x,z}中節(jié)點(diǎn)x,z的1-鄰居圖通過(guò)邊插入和標(biāo)簽泛化的算法,匿名為同構(gòu)。y節(jié)點(diǎn)的1-鄰居結(jié)構(gòu)保持在t=2時(shí)刻匿名圖的狀態(tài)。因?yàn)橹灰WC連續(xù)2次發(fā)布中,對(duì)組內(nèi)節(jié)點(diǎn)的1-鄰居圖進(jìn)行匿名化處理,超過(guò)t=2時(shí)刻,從表內(nèi)移除t=1時(shí)刻的分組。參見(jiàn)圖4(b)。步驟15:結(jié)束。下面通過(guò)一個(gè)具體實(shí)例對(duì)本發(fā)明進(jìn)行進(jìn)一步說(shuō)明:以下為本發(fā)明方法在本例中的社會(huì)網(wǎng)絡(luò)圖數(shù)據(jù)匿名前后保護(hù)帶敏感標(biāo)簽個(gè)體的情況。t=1,t=2時(shí)刻如果攻擊者知道個(gè)體x的1-鄰居結(jié)構(gòu)圖,因?yàn)閭€(gè)體z也有相同的標(biāo)簽-鄰居圖,攻擊者不能以高于1/2的概率識(shí)別個(gè)體x,通過(guò)比對(duì)兩次發(fā)布的社會(huì)網(wǎng)絡(luò)圖,攻擊者不能唯一確定個(gè)體x及她的屬性l,因?yàn)閤不是是唯一的節(jié)點(diǎn)度發(fā)生變化,個(gè)體及她的職業(yè)不會(huì)被泄露。t=2,t=3時(shí)刻如果攻擊者知道x的1-鄰居結(jié)構(gòu)圖,因?yàn)閦也有相同的標(biāo)簽-鄰居圖,攻擊者不能以高于1/2的概率識(shí)別個(gè)體x,通過(guò)比對(duì)兩次發(fā)布的社會(huì)網(wǎng)絡(luò)圖,攻擊者不能唯一確定個(gè)體x及她的屬性l,因?yàn)閭€(gè)體x不是是唯一的節(jié)點(diǎn)度發(fā)生變化,個(gè)體及她的職業(yè)不會(huì)被泄露。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12