亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法

文檔序號(hào):6358289閱讀:382來源:國(guó)知局
專利名稱:一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)處理方法,特別是一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法。
背景技術(shù)
近年來聚類挖掘已在一些深層次數(shù)據(jù)應(yīng)用中取得較大進(jìn)展,但隨著人們對(duì)數(shù)據(jù)隱 私的日益關(guān)注,對(duì)數(shù)據(jù)進(jìn)行共享挖掘也帶來了隱私保護(hù)方面的問題。例如,通過對(duì)電子病歷 進(jìn)行挖掘可以得到病癥的聚類,但醫(yī)療機(jī)構(gòu)若直接將原始數(shù)據(jù)提供給挖掘者,會(huì)導(dǎo)致病例 數(shù)據(jù)暴露,泄露患者隱私。保險(xiǎn)公司的理賠信息、銀行卡交易等數(shù)據(jù)中隱含的聚類模式,對(duì) 政府和企業(yè)決策具有重要意義,同時(shí)又都可能涉及個(gè)人隱私。隱私保護(hù)數(shù)據(jù)發(fā)布需要在保護(hù)數(shù)據(jù)隱私和維持?jǐn)?shù)據(jù)可用性間尋求一種折中,目前 數(shù)據(jù)隱藏技術(shù)的主要思想是通過對(duì)原始個(gè)體數(shù)據(jù)取值的修改實(shí)現(xiàn)對(duì)微數(shù)據(jù)隱私安全的保 護(hù),這種修改將以較大的概率造成數(shù)據(jù)個(gè)體差異的改變;而聚類挖掘恰恰通過分析數(shù)據(jù)個(gè) 體的相似和相異性,按照屬于同一聚簇的數(shù)據(jù)對(duì)象具有較低的相異性,屬于不同聚簇的數(shù) 據(jù)對(duì)象間具有較高相異性的思想將數(shù)據(jù)劃分成簇,聚類過程嚴(yán)重依賴于個(gè)體數(shù)據(jù)間的相異 性。某種程度上,聚類與隱藏在原理上存在依賴數(shù)據(jù)個(gè)體差異與弱化數(shù)據(jù)個(gè)體差異的沖突, 導(dǎo)致面向聚類的數(shù)據(jù)隱藏有別于面向其它數(shù)據(jù)應(yīng)用的隱藏。面向聚類的數(shù)據(jù)隱藏發(fā)布更是 由于以下幾方面原因變得困難(1)保持聚類可用性的困難較之面向計(jì)數(shù)查詢或關(guān)聯(lián)、分類挖掘時(shí)隱藏處理中需保持的數(shù)據(jù)可用性特征和約 束,聚類可用性與數(shù)據(jù)分布及個(gè)體數(shù)據(jù)內(nèi)部結(jié)構(gòu)相似性的關(guān)系更為緊密。而數(shù)據(jù)隱藏正是 通過修改個(gè)體數(shù)據(jù)特征實(shí)現(xiàn)保護(hù)數(shù)據(jù)隱私,這種修改極易引起個(gè)體數(shù)據(jù)內(nèi)部結(jié)構(gòu)相似性和 數(shù)據(jù)分布的連鎖變化。(2)數(shù)值型數(shù)據(jù)的約束數(shù)值型數(shù)據(jù)是聚類分析常見的數(shù)據(jù)類型。不同于類別型數(shù)據(jù),數(shù)值型數(shù)據(jù)缺少顯 式的屬性類別層次,數(shù)據(jù)匿名隱藏方法常用的泛化和抑制操作將失效或造成較大的信息丟 失。對(duì)數(shù)值型數(shù)據(jù)集進(jìn)行聚類分析,歐式距離是評(píng)價(jià)數(shù)據(jù)間相似性和相異性的基本指標(biāo),隱 藏方法需要保證隱藏前后任意數(shù)據(jù)記錄間的歐式距離關(guān)系不變,以確保隱藏發(fā)布后數(shù)據(jù)的 聚類質(zhì)量不變或改變較小。已有的一些數(shù)據(jù)隱藏發(fā)布方法存在不適用于數(shù)值型數(shù)據(jù)隱藏或難以兼顧隱藏后 數(shù)據(jù)聚類可用性與數(shù)據(jù)隱私安全性的不足。

發(fā)明內(nèi)容
發(fā)明目的針對(duì)上述現(xiàn)有技術(shù)無法很好的解決面向聚類挖掘的隱私保護(hù)數(shù)據(jù)共 享發(fā)布問題,本發(fā)明的目的是提供一種基于阿基米德螺線旋轉(zhuǎn)的隱私保護(hù)數(shù)據(jù)共享發(fā)布方 法,以實(shí)現(xiàn)web環(huán)境下多數(shù)據(jù)源數(shù)據(jù)的安全共享與聚類可用性。技術(shù)方案為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法,包括如下步驟(如

圖1所示)(1)用戶向服務(wù)器提交包含η條記錄的原始數(shù)據(jù)集D,D包含m個(gè)屬性列I1,12,...,I .
丄m ‘(2)若所述步驟(1)中的m為奇數(shù),則轉(zhuǎn)到步驟(3),若m為偶數(shù),則轉(zhuǎn)到步驟(4);(3)為D生成第m+1個(gè)屬性列Im+1,D中η條記錄在屬性列Im+1上的取值均為0 ;(4)將D中屬性列隨機(jī)兩兩分組,得到m/2或(m+l)/2個(gè)屬性列對(duì)(Ii, Ij), 1彡i乒j彡m+1 ;對(duì)于一個(gè)屬性列對(duì)(Ii, Ij),Ii稱為Ij的配對(duì)屬性列,Ij也為Ii的配對(duì) 屬性列;(5)對(duì)D中任意三個(gè)滿足AB彡AC彡BC的不同的數(shù)據(jù)點(diǎn)A、B、C,生成基于阿基 米德螺線旋轉(zhuǎn)數(shù)據(jù)變換后保持所述三個(gè)數(shù)據(jù)點(diǎn)距離關(guān)系保持穩(wěn)定的旋轉(zhuǎn)參數(shù)取值范圍 β,, ke [1,2,3, ... ,^3];這里保持穩(wěn)定的意思是,原來A、B、C三個(gè)數(shù)據(jù)點(diǎn)距離關(guān)系是 AB ^ AC ^ BC,則生成基于阿基米德螺線旋轉(zhuǎn)數(shù)據(jù)變換后三個(gè)數(shù)據(jù)點(diǎn)距離關(guān)系原則上仍保 持不變,僅在取等號(hào)時(shí)可能發(fā)生微小的變化;(6)生成原始數(shù)據(jù)集D的阿基米德螺線旋轉(zhuǎn)參數(shù)取值范圍β ^ P=IcIlPk-,(7)選取滿足ε X α e 的螺距參數(shù)ε與旋轉(zhuǎn)角度α,對(duì)D中各屬性對(duì)的投 影數(shù)據(jù)子集進(jìn)行阿基米德螺線旋轉(zhuǎn),生成變換后投影數(shù)據(jù)子集;(8)若m為奇數(shù),將變換后Im+1屬性列及其配對(duì)屬性列合并,并與其它變換后投影 數(shù)據(jù)子集進(jìn)行并操作,生成D的變換后數(shù)據(jù)集D';若m為偶數(shù),對(duì)變換后所有投影數(shù)據(jù)子 集進(jìn)行并操作,生成D的變換后數(shù)據(jù)集D'。所述步驟(5)中旋轉(zhuǎn)參數(shù)取值范圍β k的生成方法可為假設(shè)1、2屬性列組成一 對(duì),3、4屬性列組成一對(duì),…,m-l、m屬性列組成一對(duì),任意數(shù)據(jù)點(diǎn)A、B、C向量表示如下A(A1, A2, ... , Am),B(B1; B2, ... , Bm),C(C1, C2, ... , Cm);其中線段AA、B1B2與原點(diǎn)0的夾角為θ n, A3A4, B3B4與0的夾角為θ 12,..., AnrlAm、BnrlBm與0的夾角為θ 1(m/2);線段A1A2> C1C2與0的夾角為θ 21,A3A4, C3C4與0的夾角 為 θ 22' · · · ‘ Am-!Am> Cm^1Cm 與 0 的夾角為 θ
2(m/2) ° 其中 Q 11、Q 12、· · ·、Q 1 (m/2) ‘ Q 21、^ 22、· · ·、
θ 2(ffl/2) e
,假設(shè)
m/2M = 2^(cosi92i. - cos(9b.),
i=l
m/2N =- Ci + ay(cos(92i. - cos(9b.) + c. cos02j - cos6u\
i=l則旋轉(zhuǎn)變換后AB和AC距離關(guān)系保持穩(wěn)定的阿基米德旋轉(zhuǎn)參數(shù)取值范圍《的生成 方法如下①M(fèi)= 0,N = 0 時(shí),《=(0, + α>);②M = 0,N 乒 0 時(shí),允=(0, (ABl-ACX );③M > 0 樹,βΙ=(0,(-Ν-·^Ν2 -4M(AB2-AC2))/2M );④M < 0 時(shí),^=(0,(-, +J,2 -4M(AB2-AC2))/2M);對(duì)AC ^ BC進(jìn)行類似分析生成旋轉(zhuǎn)變換后AC和BC距離關(guān)系保持穩(wěn)定的阿基米德旋轉(zhuǎn)參數(shù)取值范圍Λ2 l)M = 0,N = 0 時(shí),/¢=(0,+00);
2)M=0,N ≠ 0時(shí),
權(quán)利要求
1.一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法,其特征在于,包括如下步驟(1)用戶向服務(wù)器提交包含η條記錄的原始數(shù)據(jù)集D,D包含m個(gè)屬性列I1,12,…,Im;(2)若所述步驟(1)中的m為奇數(shù),則轉(zhuǎn)到步驟(3),若m為偶數(shù),則轉(zhuǎn)到步驟;(3)為D生成第m+1個(gè)屬性列Im+1,D中η條記錄在屬性列Im+1上的取值均為0;(4)將D中屬性列隨機(jī)兩兩分組,得到m/2或(m+1)/2個(gè)屬性列對(duì)(Ii, Ij),1≤i≠j≤m+1 ;(5)對(duì)D中任意三個(gè)滿足AB彡AC彡BC的不同的數(shù)據(jù)點(diǎn)A、B、C,生成基于阿基米德螺線 旋轉(zhuǎn)數(shù)據(jù)變換后保持所述三個(gè)數(shù)據(jù)點(diǎn)距離關(guān)系保持穩(wěn)定的旋轉(zhuǎn)參數(shù)取值范圍0k,ke [1, 2,3,· · ·,Cn ];(6)生成原始數(shù)據(jù)集D的阿基米德螺線旋轉(zhuǎn)參數(shù)取值范圍β" ^o=I £ A;(7)選取滿足εX α e 的螺距參數(shù)ε與旋轉(zhuǎn)角度α,對(duì)D中各屬性對(duì)的投影數(shù) 據(jù)子集進(jìn)行阿基米德螺線旋轉(zhuǎn),生成變換后投影數(shù)據(jù)子集;(8)若m為奇數(shù),將變換后Im+1屬性列及其配對(duì)屬性列合并,并與其它變換后投影數(shù)據(jù) 子集進(jìn)行并操作,生成D的變換后數(shù)據(jù)集D';若m為偶數(shù),對(duì)變換后所有投影數(shù)據(jù)子集進(jìn) 行并操作,生成D的變換后數(shù)據(jù)集D'。
2.根據(jù)權(quán)利要求1所述一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法,其特征在于,所述步驟(5)中 旋轉(zhuǎn)參數(shù)取值范圍β k的生成方法為假設(shè)1、2屬性列組成一對(duì),3、4屬性列組成一對(duì),…, m-l、m屬性列組成一對(duì),任意數(shù)據(jù)點(diǎn)A、B、C向量表示如下A (A1, A2, -,Am), B (B1, B2,…,Bm),C(C1; C2,-,Cm);其中線段ΑΑ、ΒΑ與原點(diǎn)0的夾角為θ n,A3A4^B3B4與0的夾角為θ 12,...,Am_1Am>Bm_1Bm 與0的夾角為θ工W2);線段A1AyC1C2與0的夾角為θ 21,A3A4、C3C4與0的夾角為θ四,…, Am—iAm、Cm—A 與0的夾角為 Q 2 (m/2) ° 其中 Q 11、Q 12、 .··、^ 1 (m/2),^ 21、^ 22、 .··、^ 2 (m/2) ^rp · cos (rp/ ε + δ ) = χ-0χ rp · sin(rp/ ε + δ ) = y-0yX'與y'由下式求得 χ ‘ = (rp+ ε α ) cos (rp/ ε + α + δ ) +Ox y ‘ = (rp+ ε α ) sin (rp/ ε + α + δ ) +Oy其中,rp表示P(x,y)到螺心坐標(biāo)為(0X,Oy)的歐幾里德距離,
4.根據(jù)權(quán)利要求1所述一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法,其特征在于,所述步驟(8) 中,若m為奇數(shù),對(duì)變換后Im+1屬性列及其配對(duì)屬性列合并方法如下Ilrt屬性列的配對(duì)屬性列為屬性列Ii, 1彡i彡m,生成屬性列對(duì)(Ii, Im+1),其投影數(shù)據(jù)子集對(duì)應(yīng)阿基米德螺線螺心坐標(biāo)為(Ox,0),假設(shè)Q' (x' ,y')為對(duì)該投影數(shù)據(jù)子集實(shí)施阿基米德螺線旋轉(zhuǎn)變換生成數(shù)據(jù)集中的任意數(shù)據(jù)記錄,則
全文摘要
本發(fā)明公開了一種隱私保護(hù)數(shù)據(jù)共享發(fā)布方法,包括如下步驟用戶通過服務(wù)器接口提交數(shù)據(jù)集,服務(wù)器判斷數(shù)據(jù)集維數(shù),若為奇數(shù),則增加一個(gè)屬性,該維數(shù)據(jù)屬性值置零,將屬性隨機(jī)兩兩分組;分析數(shù)據(jù)集中數(shù)據(jù)點(diǎn)間的距離關(guān)系,確定阿基米德螺線旋轉(zhuǎn)參數(shù),借助阿基米德螺線的幾何性質(zhì),對(duì)原始數(shù)據(jù)中屬性值對(duì)進(jìn)行阿基米德螺線旋轉(zhuǎn)變換,生成變換后數(shù)據(jù)集。本發(fā)明通過維持原始數(shù)據(jù)集任意三個(gè)數(shù)據(jù)記錄間距離關(guān)系穩(wěn)定實(shí)現(xiàn)隱藏前后數(shù)據(jù)集聚類效果相同(或相似),實(shí)現(xiàn)有效兼顧聚類可用性和數(shù)據(jù)隱私安全性的隱私保護(hù)數(shù)據(jù)共享發(fā)布。
文檔編號(hào)G06F21/00GK102147814SQ20111009792
公開日2011年8月10日 申請(qǐng)日期2011年4月19日 優(yōu)先權(quán)日2011年4月19日
發(fā)明者倪巍偉, 崇志宏, 陸介平, 黃茂峰 申請(qǐng)人:東南大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1