專利名稱:協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于Web服務(wù)中,協(xié)作式識別泄露用戶隱私信息站點的方法。本 發(fā)明成果可以用于互聯(lián)網(wǎng)中隱私信息泄露站點的識別,屬于計算機(jī)網(wǎng)絡(luò)安全領(lǐng)域。
背景技術(shù):
Web技術(shù)的發(fā)展和廣泛應(yīng)用為用戶提供了豐富多樣的服務(wù),但是由此帶來了隱私 信息保護(hù)的問題。用戶在獲得Web站點提供的服務(wù)之前,往往需要在站點注冊,在注冊過程 中站點一般要求用戶提交一些信息,如用戶名、電子郵箱地址等。用戶在與站點交互的過程 中,會動態(tài)地產(chǎn)生一些與用戶相關(guān)的數(shù)字行為,如瀏覽歷史、購買記錄等等,這些注冊信息 和交互信息包含了用戶的一些隱私,如果被泄露會對用戶造成個人名譽(yù)損失、經(jīng)濟(jì)損失和 精神傷害等等。盡管站點一般都有自己的隱私策略,并聲明不會在未經(jīng)用戶許可的情況下 泄露用戶的隱私信息,但有的站點為了其商業(yè)利益而將用戶隱私信息泄露給第三方。在此 之后,用戶會不斷收到一些廣告性質(zhì)的垃圾郵件,對用戶產(chǎn)生困擾?,F(xiàn)有的針對基于Web服務(wù)中的隱私信息保護(hù)方法,通常采用一些技術(shù)手段并結(jié)合 使用站點的隱私策略來對用戶隱私信息進(jìn)行保護(hù),但是現(xiàn)有的隱私保護(hù)方法存在以下的缺 點第一,廣泛使用的匿名技術(shù)在一定程度上阻斷了用戶的隱私信息與其身份之間的聯(lián)系, 但是一旦用戶身份信息被泄露,用戶的所有相關(guān)信息就被泄露了。此外,由于各種因素如背 景知識等的存在,使得匿名破解非常容易。第二,站點的隱私策略和隱私保護(hù)方法雖然能夠 對隱私信息進(jìn)行一定的保護(hù),但是一旦站點違背其隱私策略,用戶的隱私信息還是會被泄 露出去。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的 方法,針對Web站點泄露用戶隱私信息給第三方后,用戶經(jīng)常收到帶有廣告性質(zhì)的垃圾郵 件的問題。使用本發(fā)明的方法能夠識別出泄露用戶隱私信息的站點,本發(fā)明采用的分解參 與者輸入的技術(shù)方法能夠使得參與者不知道其他人是否在候選站點注冊或交互過,最大限 度的保護(hù)了參與者的隱私。根據(jù)本發(fā)明的識別結(jié)果,用戶可以調(diào)整對隱私信息泄露站點的 信任或改變與之的交互模式,從而達(dá)到對用戶隱私信息保護(hù)的目的。本發(fā)明采用協(xié)作的方式完成,當(dāng)用戶收到垃圾郵件后,如果希望找到泄露自己隱 私信息的站點并愿意參加識別泄露用戶隱私信息站點的工作(以下簡稱參與者),將垃圾 郵件向郵件服務(wù)提供商舉報并告知郵件服務(wù)提供商自己愿意參加識別的工作。經(jīng)過一個時 間周期,郵件服務(wù)提供商生成一張舉報的垃圾郵件內(nèi)容相同的參與者名單,并將該名單告 知所有的參與者。其中,“一個時間周期”在實際應(yīng)用中可以具體確定時間期限,如8小、1 天等,在此不做特殊規(guī)定。參與者通過協(xié)作來識別泄露用戶隱私信息的站點。本發(fā)明的應(yīng) 用框架結(jié)構(gòu)如圖1所示。站點泄露的用戶的隱私信息分為兩類一是注冊信息(其中可能 包括用戶名、電子郵件地址、興趣等),二是通過用戶和站點的交互行為,站點分析出的用戶行為信息。本發(fā)明采取如下的技術(shù)方案。協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點 的方法,實現(xiàn)本方法的整體框架包括用戶、隱私信息泄露站點、得到用戶隱私信息的第三 方(以下簡稱第三方)和協(xié)作模型。協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法,其特征在于,包括以 下步驟1.用戶收到垃圾郵件后,向郵件服務(wù)提供商舉報該垃圾郵件,并說明是否愿意參 加識別泄露用戶隱私信息站點的工作;2.經(jīng)過一個時間周期,郵件服務(wù)提供商根據(jù)收到的舉報,對于相同內(nèi)容的垃圾郵 件舉報,生成一張參與者名單,并將該名單告知所有的參與者。其中,“一個時間周期”在實 際應(yīng)用中可以具體確定時間期限,如8小、1天等,在此不做特殊規(guī)定。3.參與者收到參與者名單后,通過協(xié)作來完成識別泄露用戶隱私信息的站點,該 協(xié)作模型包括站點集合產(chǎn)生模塊、站點計算模塊和隱私信息泄露站點確定模塊三個部分3. 1)站點集合產(chǎn)生模塊實現(xiàn)產(chǎn)生一個所有參與者注冊或交互過的站點集合的功 能,該模塊的功能實現(xiàn)通過參與者之間的通信完成,包括以下三個步驟3. 1. 1)每一個參與者擁有一個公私鑰對(CPK,CSK),公鑰CPK對所有參與者公開, 私鑰CSK只有自己知道。所有η (η ^ 2)個參與者共享一個計算公私鑰對,該計算公私鑰 對與每個參與者擁有的公私鑰對不同,其中公鑰CPK對所有參與者公開,私鑰CSK分成t (t <n)份,由η個參與者中的t個人保管。其中,公私鑰的具體加密體制和本發(fā)明中用到的 加密算法由實際應(yīng)用選擇,在此不做特殊規(guī)定,計算公鑰的產(chǎn)生由η個參與者進(jìn)行密鑰協(xié) 商產(chǎn)生,協(xié)商方法可由實際應(yīng)用中自由選擇,在此也不做特殊規(guī)定。每一個參與者選擇一些 站點,生成一個站點集合。記第i(l < i < η)個參與者為Pi, Pi產(chǎn)生的站點集合為Hii Is1, Sf sa}其中,s表示站點,a是大于等于的整數(shù)。對于前n-1個參與者,每個參與者分別使 用計算公鑰CPK加密IV加密結(jié)果為Ci,然后使用第η個參與者的公鑰CPKn加密Ci,加密結(jié) 果為c/。3. 1.2)對于前n-1個參與者,第Pi個參與者把前i個參與者經(jīng)加密過的站點集合 組成集合C’ {ci’,c2,·· /},發(fā)送給第Pi+1個參與者。其中,集合C’中的ci’,c2,-.c/ 的排列順序是隨機(jī)的,這是為了保護(hù)參與者的隱私,使得第i+Ι個參與者不能分辨出前i個 參與者的輸入。3. 1.3)第Plri個參與者把集合C’ {C1’,C2,….Cn_/ }發(fā)送給第η個參與者Pn, 第Pn個參與者使用自己的私鑰CSK1J 密集合C’ {C1’,C2,…cn_/ },得到集合Clc1, c2···. CV1I第Pn個參與者用計算公鑰CPK加密自己選擇的站點集合mn,加密結(jié)果是cn。第
參與者把cn加入到集合C中,形成一個新的集合C” {Cl,(V··. cj。3. 1.4)第參與者將集合C” {Cl,(V··. cn}告知前n_l個參與者,t個參與者 將計算私鑰CSK恢復(fù),并告知η個參與者恢復(fù)的計算私鑰CSK。其中密鑰恢復(fù)算法由密鑰分 割算法決定,在此不做特殊規(guī)定。η個參與者用計算私鑰CSK解密集合C” {Cl,(v.Cn},每 個參與者都得到一個η個參與者輸入的所有站點的集合Sls1, s2,…sb}b是大于等于2的 整數(shù),集合S為候選站點集合。3. 2)站點計算模塊完成對于候選站點集合S,計算出所有參與者都注冊或交互過的站點的功能。該模塊的功能實現(xiàn)包括以下步驟3.2. 1)經(jīng)過3. 1.4)的計算,每個參與者都得到了候選站點集合S。對于候選站點 集合中的每一個站點s,用二進(jìn)制來表示,因此一個站點表示為由0、1組成的字符串d’。對 于集合S中的每一個站點,如果參與者在該站點注冊或交互過,則在表示該站點的二進(jìn)制 字符串最后一位后面加上一位“ 1 ”,如果沒有注冊或交互過,在最后一位加上一位“0”。因 此,每一個參與者產(chǎn)生一個由二進(jìn)制字符串組成的候選站點集合D {屯,屯,…db}。3. 2. 2)每個參與者對于自己的集合D中的η個二進(jìn)制字符串d,隨機(jī)分解η份,對 于第j個字符串Clj該分解滿足(dj = djl Λ dj2. . . . 2jn) (j為整數(shù)且1彡j彡η),其中 “Λ”表示邏輯運(yùn)算“and”。隨機(jī)分解方法的規(guī)則是,對于要分解的字符串,如果某一位取值 是1,則被分解成的η份中該位都取1,如果要分解的字符串某一位取值是0,則隨機(jī)分解成 的η份中該位至少有一位為0。對于集合D中的第1個站點djl,b是整數(shù)且1 < 1 < b, b彡2),第i (1彡i彡η)個參與者把Clli發(fā)給第q個參與者(q是整數(shù)且1彡q彡b)。3. 2. 3)對于集合D中的第j(j是整數(shù)且1彡j彡η)個站點(Ij,第i個參與者計 算yi = (bjl Abj2.... Abji),然后把計算結(jié)果71告知其余η-l個參與者。因此,所有 參與者計算最終結(jié)果y = yl Λ y2.... Λ yn。如果該計算結(jié)果的最后一位是0,則表示不 是全部的參與者都在第j個站點注冊或交互過;如果計算結(jié)果的最后一位是1,則表示所有 的參與者都在第j個站點注冊或交互過,把該站點記為隱私泄露候選站點。把所有的隱私 泄露候選站點記入集合SCISC1, scv·· SCu} (u, b是整數(shù)且1彡u彡b)。3. 2. 4)如果集合SC為空,則結(jié)束。該次計算失敗,即沒有找到隱私泄露的站點。 如果集合SC不為空,則通過隱私信息泄露站點確定模塊來確定隱私泄露站點。3. 3)隱私泄露站點確認(rèn)模塊實現(xiàn)識別泄露用戶隱私信息的站點的功能,該功能由 以下步驟實現(xiàn)3. 3. 1) η個參與者協(xié)商產(chǎn)生u個測試者(U是整數(shù)且1 < k < U),具體協(xié)商方法不 做特殊規(guī)定。針對隱私泄露候選站點集合SC {SCl,叱廣^ 丨,第!^&是整數(shù)且^!^^!!) 個測試者使用新的用戶信息如用戶名、電子郵件地址等在第k個站點注冊或交互,其中,測 試過程使用的郵箱稱為測試郵箱。經(jīng)過一個時間周期,如1天或1周等,如果第k個測試者 在測試郵箱收到了垃圾郵件,并且該測試者在自己識別隱私泄露站點計算過程中的郵箱里 也收到了相同的垃圾郵件,則該測試者截取測試郵箱中收到的垃圾郵件的圖片,將該圖片 發(fā)送給所有的參與者,因此,該測試者進(jìn)行測試的站點為泄露用戶隱私的站點。本發(fā)明提出一種協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法,改方 法針對基于Web服務(wù)中站點泄露用戶隱私信息給第三方后,用戶經(jīng)常收到帶有廣告性質(zhì)的 垃圾郵件的問題。本發(fā)明采用協(xié)作的方式對泄露用戶隱私的站點進(jìn)行識別,經(jīng)過協(xié)作,能夠 識別出泄露用戶隱私信息的站點。在該協(xié)作過程中,采用分解表示站點的方法,使得參與者 不知道其他人是否在候選站點注冊或交互過,最大限度的保護(hù)了參與者的隱私。
圖1本發(fā)明的應(yīng)用框架結(jié)構(gòu)2本發(fā)明的識別過程流程圖
具體實施例方式本發(fā)明的具體實施方式
以三個參與者協(xié)作識別泄露用戶隱私的站點為例,說明本 發(fā)明的協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法。用戶A、B、C、D在站點1注冊或交互過后,站點1將用戶的隱私信息包含電子郵件 地址泄露給了第三方,第三方開始向A、B、C、D發(fā)送一些帶有廣告性質(zhì)的垃圾郵件。A、B、C、D四個人收到了相同的垃圾郵件1,他們向郵件服務(wù)提供商舉報垃圾郵件, 但是只有A、B、C三個人愿意參與協(xié)作識別泄露隱私信息站點的工作。經(jīng)過一個時間周期, 如2天,郵件服務(wù)提供商沒有再收到對于垃圾郵件1的舉報。郵件服務(wù)提供商生成參與者 名單,其中包含A、B、C,并將該名單發(fā)送給A、B和C。A、B、C三人協(xié)商產(chǎn)生一個計算公私鑰對,公鑰CPK三個人都知道,私鑰CSK分成兩 份,由B禾Π C保管。Α、B、C三人每人有一個自己公私鑰對,其中公鑰CPK公開,私鑰CSK只 有自己知道。A根據(jù)自己注冊和交互過的站點情況,產(chǎn)生一個站點集合ma Is1, s2, s3, s4},使 用計算公鑰CPK加密ma,加密結(jié)果為Ca,然后使用第三個參與者C的公鑰加密Ca,加密結(jié)果 為ca’。B根據(jù)自己注冊和交互過的站點情況,產(chǎn)生一個站點集合mb Is1, s2, s3, sj,使用計算 公鑰CPK加密mb,加密結(jié)果為cb,然后使用第三個參與者C的公鑰加密cb,加密結(jié)果為cb’。A將Ca'發(fā)送給B,B將C,{ca,,cb'}發(fā)送給參與者C,其中集合C,中Ca'和Cb'的 順序是隨機(jī)的。參與者C使用自己的私鑰CSK。解密C’ {ca’,cb’},得到{ca,cb}.參與者C 用計算公鑰CPK加密自己選擇的站點集合m。{s2, s3},加密結(jié)果是c。。參與者C把C。加入到 {ca, CbI中,形成一個新的集合C” {ca, cb, Cj0參與者C將C” {ca, cb, cj告知參與者A和B,參與者B和C恢復(fù)計算私鑰CSK,并 將CSK告知參與者A。參與者A、B、C用計算私鑰CSK解密C” {ca, cb, cj,得到三個人輸入 的站點集合Sls1, S2, S3, s4, sj,即是候選站點。這五個候選站點分別用二進(jìn)制表示為001、010、100、101、110,因為參與者A在S1, S2, S3, S4注冊或交互過,因此,在前四個站點最后一位后面再加上一位“1”,在第五個站點 最后一位后面加上一位 “0”,得到一個集合 D {dp d2,d3,d4,dj = {0011,0101,1001,1011, 1100}。同理參與者B和C也產(chǎn)生自己的集合D。如下表所示。
權(quán)利要求
協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法,其特征在于,包括以下步驟1).用戶收到垃圾郵件后,向郵件服務(wù)提供商舉報該垃圾郵件,并說明是否愿意參加識別泄露用戶隱私信息站點的工作;2).經(jīng)過一個時間周期,郵件服務(wù)提供商根據(jù)收到的舉報,對于相同內(nèi)容的垃圾郵件舉報,生成一張參與者名單,并將該名單告知所有的參與者;3).參與者收到參與者名單后,通過協(xié)作來完成識別泄露用戶隱私信息的站點,該協(xié)作模型包括站點集合產(chǎn)生模塊、站點計算模塊和隱私信息泄露站點確定模塊三個部分3.1)站點集合產(chǎn)生模塊實現(xiàn)產(chǎn)生一個所有參與者注冊或交互過的站點集合的功能,該模塊的功能實現(xiàn)通過參與者之間的通信完成,包括以下三個步驟3.1.1)每一個參與者擁有一個公私鑰對(CPK,CSK),公鑰CPK對所有參與者公開,私鑰CSK只有自己知道;所有n(n≥2)個參與者共享一個計算公私鑰對,該計算公私鑰對與每個參與者擁有的公私鑰對不同,其中公鑰CPK對所有參與者公開,私鑰CSK分成t(t<n)份,由n個參與者中的t個人保管;其中,公私鑰的具體加密體制和本發(fā)明中用到的加密算法由實際應(yīng)用選擇,在此不做特殊規(guī)定,計算公鑰的產(chǎn)生由n個參與者進(jìn)行密鑰協(xié)商產(chǎn)生,協(xié)商方法可由實際應(yīng)用中自由選擇,在此也不做特殊規(guī)定;每一個參與者選擇一些站點,生成一個站點集合;記第i(1≤i<n)個參與者為Pi,Pi產(chǎn)生的站點集合為mi{s1,s2…sa}其中,s表示站點,a是大于等于的整數(shù);對于前n 1個參與者,每個參與者分別使用計算公鑰CPK加密mi,加密結(jié)果為ci,然后使用第n個參與者的公鑰CPKn加密ci,加密結(jié)果為ci’;3.1.2)對于前n 1個參與者,第Pi個參與者把前i個參與者經(jīng)加密過的站點集合組成集合C’{c1’,c2’…ci’},發(fā)送給第Pi+1個參與者;其中,集合C’中的c1’,c2’….ci’的排列順序是隨機(jī)的,這是為了保護(hù)參與者的隱私,使得第i+1個參與者不能分辨出前i個參與者的輸入;3.1.3)第Pn 1個參與者把集合C’{c1’,c2’….cn 1’}發(fā)送給第n個參與者Pn,第Pn個參與者使用自己的私鑰CSKn解密集合C’{c1’,c2’…cn 1’},得到集合C{c1,c2….cn 1};第Pn個參與者用計算公鑰CPK加密自己選擇的站點集合mn,加密結(jié)果是cn;第Pn個參與者把cn加入到集合C中,形成一個新的集合C”{c1,c2….cn};3.1.4)第Pn個參與者將集合C”{c1,c2….cn}告知前n 1個參與者,t個參與者將計算私鑰CSK恢復(fù),并告知n個參與者恢復(fù)的計算私鑰CSK;其中密鑰恢復(fù)算法由密鑰分割算法決定,在此不做特殊規(guī)定;n個參與者用計算私鑰CSK解密集合C”{c1,c2….cn},每個參與者都得到一個n個參與者輸入的所有站點的集合S{s1,s2,…sb}b是大于等于2的整數(shù),集合S為候選站點集合;3.2)站點計算模塊完成對于候選站點集合S,計算出所有參與者都注冊或交互過的站點的功能;該模塊的功能實現(xiàn)包括以下步驟3.2.1)經(jīng)過3.1.4)的計算,每個參與者都得到了候選站點集合S;對于候選站點集合中的每一個站點s,用二進(jìn)制來表示,因此一個站點表示為由0、1組成的字符串d’;對于集合S中的每一個站點,如果參與者在該站點注冊或交互過,則在表示該站點的二進(jìn)制字符串最后一位后面加上一位“1”,如果沒有注冊或交互過,在最后一位加上一位“0”;因此,每一個參與者產(chǎn)生一個由二進(jìn)制字符串組成的候選站點集合D{d1,d2,…db};3.2.2)每個參與者對于自己的集合D中的n個二進(jìn)制字符串d,隨機(jī)分解n份,對于第j個字符串dj該分解滿足(dj=dj1∧dj2....djn)(j為整數(shù)且1≤j≤n),其中“∧”表示邏輯運(yùn)算“and”;隨機(jī)分解方法的規(guī)則是,對于要分解的字符串,如果某一位取值是1,則被分解成的n份中該位都取1,如果要分解的字符串某一位取值是0,則隨機(jī)分解成的n份中該位至少有一位為0;對于集合D中的第1個站點dj(l,b是整數(shù)且1≤l≤b,b≥2),第i(1≤i≤n)個參與者把dli發(fā)給第q個參與者(q是整數(shù)且1≤q≤b);3.2.3)對于集合D中的第j(j是整數(shù)且1≤j≤n)個站點dj,第i個參與者計算yi=(bj1∧bj2....∧bji),然后把計算結(jié)果yi告知其余n 1個參與者;因此,所有參與者計算最終結(jié)果y=y(tǒng)1∧y2....∧yn;如果該計算結(jié)果的最后一位是0,則表示不是全部的參與者都在第j個站點注冊或交互過;如果計算結(jié)果的最后一位是1,則表示所有的參與者都在第j個站點注冊或交互過,把該站點記為隱私泄露候選站點;把所有的隱私泄露候選站點記入集合SC{sc1,sc2…scu}(u,b是整數(shù)且1≤u≤b);3.2.4)如果集合SC為空,則結(jié)束;該次計算失敗,即沒有找到隱私泄露的站點;如果集合SC不為空,則通過隱私信息泄露站點確定模塊來確定隱私泄露站點;3.3)隱私泄露站點確認(rèn)模塊實現(xiàn)識別泄露用戶隱私信息的站點的功能,該功能由以下步驟實現(xiàn)3.3.1)n個參與者協(xié)商產(chǎn)生u個測試者(u是整數(shù)且1≤k≤u),具體協(xié)商方法不做特殊規(guī)定;針對隱私泄露候選站點集合SC{sc1,sc2…scu},第k(k是整數(shù)且1≤k≤u)個測試者使用新的用戶信息在第k個站點注冊或交互,其中,測試過程使用的郵箱稱為測試郵箱;經(jīng)過一個時間周期,如果第k個測試者在測試郵箱收到了垃圾郵件,并且該測試者在自己識別隱私泄露站點計算過程中的郵箱里也收到了相同的垃圾郵件,則該測試者截取測試郵箱中收到的垃圾郵件的圖片,將該圖片發(fā)送給所有的參與者,因此,該測試者進(jìn)行測試的站點為泄露用戶隱私的站點。
全文摘要
協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法,屬于計算機(jī)網(wǎng)絡(luò)安全領(lǐng)域,用于基于Web的服務(wù)中泄露用戶隱私信息站點的識別。本發(fā)明的目的是提供一種協(xié)作式識別基于Web服務(wù)中泄露用戶隱私信息站點的方法。針對Web服務(wù)站點泄露用戶隱私信息給第三方后,用戶經(jīng)常收到帶有廣告性質(zhì)的垃圾郵件的問題。收到垃圾郵件并愿意參與隱私信息泄露站點識別的用戶通過協(xié)作識別出泄露用戶隱私信息站點。本發(fā)明采用分解參與者輸入的技術(shù)方法能夠使得參與者不知道其參與者的輸入,最大限度的保護(hù)了參與者的隱私。
文檔編號H04L29/08GK101984629SQ201010522428
公開日2011年3月9日 申請日期2010年10月22日 優(yōu)先權(quán)日2010年10月22日
發(fā)明者何涇沙, 馬書南, 高楓 申請人:北京工業(yè)大學(xué)