一種安全的分布式重復(fù)數(shù)據(jù)刪除方法
【專利摘要】本發(fā)明公開(kāi)了一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,利用秘密共享技術(shù)來(lái)把文件分割成片段,而不采用加密機(jī)制。這些共享將分布在多個(gè)獨(dú)立的存儲(chǔ)服務(wù)器。此外,為了支持去重,本發(fā)明將計(jì)算一個(gè)不同的短值,發(fā)送給每個(gè)存儲(chǔ)服務(wù)器來(lái)作為一個(gè)片段的指針。只有第一次上傳這些數(shù)據(jù)的擁有者才需要進(jìn)行這樣的計(jì)算和秘密共享的分布,之后擁有相同數(shù)據(jù)拷貝的人就不再需要計(jì)算和存儲(chǔ)這些共享了?;謴?fù)數(shù)據(jù)拷貝時(shí),用戶必須訪問(wèn)最低數(shù)量的存儲(chǔ)服務(wù)器通過(guò)認(rèn)證和獲得秘密共享來(lái)重構(gòu)數(shù)據(jù)。換句話說(shuō),數(shù)據(jù)的秘密共享只能被擁有相同拷貝的授權(quán)了的用戶訪問(wèn)。
【專利說(shuō)明】一種安全的分布式重復(fù)數(shù)據(jù)刪除方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)領(lǐng)域中的云儲(chǔ)存服務(wù),具體涉及一種安全的分布式重復(fù)數(shù)據(jù)刪除方法。
【背景技術(shù)】
[0002]數(shù)據(jù)去重技術(shù)廣泛的應(yīng)用在數(shù)據(jù)備份中來(lái)減少網(wǎng)絡(luò)和存儲(chǔ)開(kāi)銷,它通過(guò)檢測(cè)和消除數(shù)據(jù)冗余來(lái)實(shí)現(xiàn)這一點(diǎn)。數(shù)據(jù)去重技術(shù)消除數(shù)據(jù)冗余,只留下一個(gè)物理副本,而不會(huì)保留多個(gè)相同內(nèi)容的數(shù)據(jù)拷貝。當(dāng)下已經(jīng)有很多的數(shù)據(jù)去重技術(shù)出現(xiàn),他們基于各種各樣的去重策略,例如客戶端或服務(wù)器端去重,文件級(jí)或塊級(jí)去重等等。尤其是在云計(jì)算時(shí)代到來(lái)的時(shí)候,云存儲(chǔ)中面臨的日益增長(zhǎng)的數(shù)據(jù)問(wèn)題使得很多企業(yè)和團(tuán)體都外包數(shù)據(jù)存儲(chǔ)給第三方機(jī)構(gòu),這種情況下,數(shù)據(jù)去重技術(shù)就顯得異常的關(guān)鍵?,F(xiàn)在的很多商業(yè)云存儲(chǔ)服務(wù)機(jī)構(gòu),例如Dropbox, Mozy和Memopal,他們都開(kāi)始使用數(shù)據(jù)去重技術(shù)來(lái)降低帶寬和存儲(chǔ)的開(kāi)銷。
[0003]數(shù)據(jù)去重,同時(shí)提高存儲(chǔ)和帶寬效率,在傳統(tǒng)的數(shù)據(jù)加密體系下是不可調(diào)和的。加密機(jī)制通常在外包數(shù)據(jù)進(jìn)入云之前進(jìn)行。傳統(tǒng)的加密機(jī)制,包括公鑰加密和對(duì)稱密鑰加密,需要不同的用戶用他們自己的密鑰加密數(shù)據(jù)。這樣造成的結(jié)果是,不同用戶加密的完全相同的數(shù)據(jù)拷貝將會(huì)帶來(lái)不同的密文,使得去重技術(shù)無(wú)法實(shí)施。為了克服這個(gè)問(wèn)題,有人提出了收斂加密來(lái)加密數(shù)據(jù)同時(shí)保證去重的實(shí)施。基于收斂加密的數(shù)據(jù)去重系統(tǒng),它使用一個(gè)收斂密鑰來(lái)加密或解密一個(gè)數(shù)據(jù)拷貝,這個(gè)收斂密鑰是根據(jù)數(shù)據(jù)拷貝自身的內(nèi)容計(jì)算哈希值得到的。因此,相同的數(shù)據(jù)拷貝將生成相同的收斂密鑰,也就意味著會(huì)加密成相同的密文,使得云服務(wù)器能實(shí)施數(shù)據(jù)去重技術(shù)。
[0004]然而,這個(gè)方法面臨了兩個(gè)很關(guān)鍵的調(diào)度問(wèn)題。首先,用戶必須存儲(chǔ)巨大數(shù)量的密鑰。尤其是,在一個(gè)塊級(jí)的數(shù)據(jù)去重系統(tǒng)中,每個(gè)用戶必須生成和保留一個(gè)加密的收斂密鑰給每一個(gè)加密的外包數(shù)據(jù)塊,使得他們之后可以下載和解密這個(gè)數(shù)據(jù)。顯然的,在這樣的一個(gè)基于收斂加密的系統(tǒng)中,收斂密鑰將隨著存儲(chǔ)塊的數(shù)量線性增長(zhǎng),將會(huì)愈發(fā)龐大。其次,先前的去重系統(tǒng)僅僅支持單服務(wù)器設(shè)置下的數(shù)據(jù)保密性,這將可能帶來(lái)保密的失敗或者數(shù)據(jù)的丟失。實(shí)際上,數(shù)據(jù)的可靠性在去重存儲(chǔ)系統(tǒng)中是一個(gè)非常關(guān)鍵的問(wèn)題,因?yàn)閷?duì)于所有用戶來(lái)說(shuō),每個(gè)存儲(chǔ)的文件在服務(wù)器上只剩下了一個(gè)拷貝。如果這個(gè)共享的拷貝丟失了,一個(gè)無(wú)法估量的大量數(shù)據(jù)將不可訪問(wèn),因?yàn)樗泄蚕磉@個(gè)數(shù)據(jù)的文件將變得無(wú)效。結(jié)果也就是,單服務(wù)器設(shè)置的去重系統(tǒng)有著數(shù)據(jù)丟失的潛在隱患。因此,怎么樣提供更好的可靠性成為了去重系統(tǒng)中的一個(gè)關(guān)鍵的安全需求問(wèn)題。
【發(fā)明內(nèi)容】
[0005]在本發(fā)明中將展示怎樣在云計(jì)算環(huán)境下設(shè)計(jì)一個(gè)具備更高可靠性的安全的數(shù)據(jù)去重系統(tǒng)。本發(fā)明在去重系統(tǒng)中提出一個(gè)分布式云存儲(chǔ)服務(wù)器。主要的技術(shù)思想是利用秘密共享技術(shù)來(lái)把文件分割成片段,而不采用加密機(jī)制。這些共享將分布在多個(gè)獨(dú)立的存儲(chǔ)服務(wù)器。[0006]此外,為了支持去重,本發(fā)明將計(jì)算一個(gè)不同的短值,發(fā)送給每個(gè)存儲(chǔ)服務(wù)器來(lái)作為一個(gè)片段的指紋。只有第一次上傳這些數(shù)據(jù)的擁有者才需要進(jìn)行這樣的計(jì)算和秘密共享的分布,之后擁有相同數(shù)據(jù)拷貝的人就不再需要計(jì)算和存儲(chǔ)這些共享了。恢復(fù)數(shù)據(jù)拷貝時(shí),用戶必須訪問(wèn)最低數(shù)量的存儲(chǔ)服務(wù)器通過(guò)認(rèn)證和獲得秘密共享來(lái)重構(gòu)數(shù)據(jù)。換句話說(shuō),數(shù)據(jù)的秘密共享只能被擁有相同拷貝的授權(quán)了的用戶訪問(wèn)。
[0007]因此,數(shù)據(jù)保密性在本發(fā)明的系統(tǒng)中是可以不通過(guò)加密而達(dá)到的。這就省去了在用戶端對(duì)密鑰的管理問(wèn)題,并且使得數(shù)據(jù)存儲(chǔ)更可靠。
[0008]傳統(tǒng)的去重方法不能夠直接的擴(kuò)展應(yīng)用到多服務(wù)器系統(tǒng)。從更多的細(xì)節(jié)而言,如果一個(gè)短值存儲(chǔ)在不同的云存儲(chǔ)服務(wù)器中來(lái)支持去重檢查,那個(gè)對(duì)傳統(tǒng)的去重方法來(lái)說(shuō),他就不能夠抵擋共謀攻擊。換句話說(shuō),任何服務(wù)器都能夠通過(guò)相同的短值來(lái)驗(yàn)證自己的擁有者身份,從而從其他服務(wù)器中獲取數(shù)據(jù)的其它片段。本發(fā)明進(jìn)一步的解決了兩種共謀攻擊,分別是,針對(duì)數(shù)據(jù)的共謀攻擊和針對(duì)PoW的共謀攻擊。據(jù)了解,針對(duì)安全去重的現(xiàn)有技術(shù)中都沒(méi)有涉及到引入分布式存儲(chǔ)服務(wù)器,并考慮其中的可靠性問(wèn)題。
[0009]為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0010]本發(fā)明為一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟:
[0011]SI所述用戶計(jì)算并發(fā)送文件和/或數(shù)據(jù)標(biāo)簽至所述云服務(wù)器,用于檢查是否存在
重復(fù);
[0012]S2如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)文件和/或數(shù)據(jù)進(jìn)行秘密共享計(jì)算后獲得若干個(gè)碎片;`[0013]S3計(jì)算并獲得所述若干個(gè)碎片所對(duì)應(yīng)的云服務(wù)器上的標(biāo)簽;
[0014]S4所述用戶在安全信道中向所述云服務(wù)器上傳一組含有與所述文件和/或數(shù)據(jù)對(duì)應(yīng)的值,所述云服務(wù)器存儲(chǔ)所述值并返回一個(gè)指針至所述用戶作本地存儲(chǔ);
[0015]其中,所述文件和/或數(shù)據(jù)標(biāo)簽為元數(shù)據(jù)標(biāo)簽<J)F=TagGen(F)。
[0016]需要進(jìn)一步說(shuō)明的是,如檢查發(fā)現(xiàn)重復(fù),還包括:
[0017]SlOl所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的帶有服務(wù)器身份id的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器;
[0018]S102當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
[0019]需要進(jìn)一步說(shuō)明的是,所述用戶計(jì)算所述文件和/或數(shù)據(jù)標(biāo)簽時(shí)公式如下:
[0020]Φ , = TagGef^(FJdj),
[0021]TagGen'為標(biāo)簽,F為文件和/或數(shù)據(jù),id」為身份,j為個(gè)數(shù);其中,個(gè)數(shù)j可阻止所述云服務(wù)器獲取其他云服務(wù)器的相同文件或塊。
[0022]需要進(jìn)一步說(shuō)明的是,所述值為{ctF,Cj,表示元數(shù)據(jù)標(biāo)簽文件的第j個(gè)碎片和第j個(gè)id為j的云服務(wù)器上的標(biāo)簽。
[0023]本發(fā)明適用于文件級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
[0024]本發(fā)明另一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟:
[0025]SI所述用戶向所述云服務(wù)器上傳文件和/或數(shù)據(jù),先進(jìn)行文件級(jí)分布式重復(fù)數(shù)據(jù)刪除,如果發(fā)現(xiàn)重復(fù),則執(zhí)行文件級(jí)去重;否則,所述用戶執(zhí)行塊級(jí)去重。
[0026]S2將所述文件和/或數(shù)據(jù)劃分為一組片段并計(jì)算其標(biāo)簽后發(fā)送至所述云服務(wù)器檢查是否存在重復(fù);
[0027]S3如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)所述片段進(jìn)行秘密共享計(jì)算后獲得若干塊;同時(shí),所述用戶計(jì)算身份id」信息為的服務(wù)器上的數(shù)據(jù)標(biāo)簽,并通過(guò)安全信道上傳一組值至所述云服務(wù)器;
[0028]S4所述云服務(wù)器收到所述值后,返回關(guān)聯(lián)的指針至所述用戶作本地存儲(chǔ)。
[0029]需要進(jìn)一步說(shuō)明的是,如檢查發(fā)現(xiàn)重復(fù),還包括:
[0030]S201所述云服務(wù)器接收所述片段標(biāo)簽后計(jì)算一個(gè)所述片段的信號(hào)矢量;
[0031]S202所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器;
[0032]S203當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
[0033]本發(fā)明適用于塊級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
[0034]本發(fā)明有益效果在于:
[0035]1、能夠滿足有效的去重性,同時(shí)保證很高的可靠性。使用秘密分割技術(shù)替代傳統(tǒng)加密方法來(lái)保護(hù)數(shù)據(jù)保密性。特別的是,通過(guò)使用秘密共享體制,數(shù)據(jù)被分割成片段并存儲(chǔ)在不同的服務(wù)器中。此外,本發(fā)明所提出的架構(gòu)支持文件級(jí)和塊級(jí)的去重;
[0036]2、安全分析表明本發(fā)明提出的去重系統(tǒng)在安全模型下是安全的。特別的是,即使有攻擊者擁有了限制范圍內(nèi)的數(shù)據(jù)片段,數(shù)據(jù)依然是安全的;
[0037]3、使用秘密共享機(jī)制,滿足了高可靠性和保密等級(jí)。評(píng)估結(jié)果顯示本發(fā)明對(duì)于數(shù)據(jù)操作是非常效率的。
【具體實(shí)施方式】
[0038]下面將結(jié)合【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步的描述。需要說(shuō)明的是,下述實(shí)施例僅對(duì)本發(fā)明作出詳細(xì)的解釋,但不應(yīng)理解為對(duì)本發(fā)明的限制。
[0039]基于秘密共享技術(shù),將文件分割成若干片段,而不采用加密機(jī)制。在這樣的系統(tǒng)中,通過(guò)安全的分布數(shù)據(jù)給多個(gè)云服務(wù)器,用戶就不用自己管理密鑰。區(qū)別于現(xiàn)有的去重系統(tǒng)中使用收斂加密,而不需要任何加密機(jī)制。
[0040]基于上述構(gòu)思,本發(fā)明為一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟:
[0041]SI所述用戶計(jì)算并發(fā)送文件和/或數(shù)據(jù)標(biāo)簽至所述云服務(wù)器,用于檢查是否存在
重復(fù);
[0042]S2如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)文件和/或數(shù)據(jù)進(jìn)行秘密共享計(jì)算后獲得若干個(gè)碎片;
[0043]S3計(jì)算并獲得所述若干個(gè)碎片所對(duì)應(yīng)的云服務(wù)器上的標(biāo)簽;
[0044]S4所述用戶在安全信道中向所述云服務(wù)器上傳一組含有與所述文件和/或數(shù)據(jù)對(duì)應(yīng)的值,所述云服務(wù)器存儲(chǔ)所述值并返回一個(gè)指針至所述用戶作本地存儲(chǔ);[0045]其中,所述文件和/或數(shù)據(jù)標(biāo)簽為元數(shù)據(jù)標(biāo)簽ΦF=TagGen (F)。
[0046]需要進(jìn)一步說(shuō)明的是,如檢查發(fā)現(xiàn)重復(fù),還包括:
[0047]SlOl所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的帶有服務(wù)器身份id的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器;
[0048]S102當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
[0049]需要進(jìn)一步說(shuō)明的是,所述用戶計(jì)算所述文件和/或數(shù)據(jù)標(biāo)簽時(shí)公式如下:
[0050]Φ丨'ui = TagGefi^Fj-(Il),
[0051]TagGen'為標(biāo)簽,F為文件和/或數(shù)據(jù),id」為身份,j為個(gè)數(shù);其中,個(gè)數(shù)j可阻止所述云服務(wù)器獲取其他云服務(wù)器的相同文件或塊。
[0052]需要進(jìn)一步說(shuō)明的是,所述值為{ctF,Cj,Φρ?+},表示元數(shù)據(jù)標(biāo)簽文件的第j個(gè)碎片和第j個(gè)id為j的云服務(wù)器上的標(biāo)簽。
[0053]本發(fā)明適用于文件級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
[0054]本發(fā)明另一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟: [0055]SI所述用戶向所述云服務(wù)器上傳文件和/或數(shù)據(jù),先進(jìn)行文件級(jí)分布式重復(fù)數(shù)據(jù)刪除,如果發(fā)現(xiàn)重復(fù),則執(zhí)行文件級(jí)去重;否則,所述用戶執(zhí)行塊級(jí)去重。
[0056]S2將所述文件和/或數(shù)據(jù)劃分為一組片段并計(jì)算其標(biāo)簽后發(fā)送至所述云服務(wù)器檢查是否存在重復(fù);
[0057]S3如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)所述片段進(jìn)行秘密共享計(jì)算后獲得若干塊;同時(shí),所述用戶計(jì)算身份id」信息為的服務(wù)器上的數(shù)據(jù)標(biāo)簽,并通過(guò)安全信道上傳一組值至所述云服務(wù)器;
[0058]S4所述云服務(wù)器收到所述值后,返回關(guān)聯(lián)的指針至所述用戶作本地存儲(chǔ)。
[0059]需要進(jìn)一步說(shuō)明的是,如檢查發(fā)現(xiàn)重復(fù),還包括:
[0060]S201所述云服務(wù)器接收所述片段標(biāo)簽后計(jì)算一個(gè)所述片段的信號(hào)矢量;
[0061]S202所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器;
[0062]S203當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
[0063]本發(fā)明適用于塊級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
[0064]根據(jù)上述方法,其具體實(shí)施例如下:
[0065]實(shí)施例一
[0066]系統(tǒng)設(shè)定:在我們的構(gòu)建中,假定S-CSPs存儲(chǔ)服務(wù)器的數(shù)目為n,身份分別表示為Id1, id2...,idn。定義安全參數(shù)為1λ,并初始化秘密共享機(jī)制SS= (Share, Recover),—個(gè)標(biāo)簽生成算法TagGen。存儲(chǔ)服務(wù)器的文件存儲(chǔ)系統(tǒng)設(shè)定為丄。
[0067]文件上傳:上傳一個(gè)文件F,用戶與S-CSPs交互來(lái)實(shí)現(xiàn)去重。更準(zhǔn)確的說(shuō),用戶首先計(jì)算并發(fā)送文件標(biāo)簽 <i)F=TagGen (F)給S-CSPs來(lái)進(jìn)行去重檢查。
[0068]如果發(fā)現(xiàn)了一個(gè)重復(fù),用戶計(jì)算并發(fā)送=TagGen'(FJdj)給第j個(gè)擁有身份的S-CSP服務(wù)器。引進(jìn)指數(shù)j的目的是阻止服務(wù)器獲取其他S-CSPs的相同文件或塊。如果與元數(shù)據(jù)匹配,則用戶將被給予一個(gè)指針來(lái)只想服務(wù)器中的我們的共享數(shù)據(jù)。
[0069]否則,如果沒(méi)有發(fā)現(xiàn)重復(fù),用戶將進(jìn)行如下操作,他在文件F上進(jìn)行秘密共享算法SS獲得Ic^=Share(F),這里h是文件F的第j個(gè)碎片。他同樣進(jìn)行
A.u1:計(jì)算當(dāng)做第j個(gè)S-CSP的標(biāo)簽。最終,用戶通過(guò)安全信道上傳
一組值{ ΦΡ,Cj, Φρ, idj}給擁有身份id」的服務(wù)器S-CSP。S-CSP存儲(chǔ)這些值并返回一個(gè)指針到用戶本地存儲(chǔ)。
[0070]文件下載:下載文件F時(shí),用戶首先從存儲(chǔ)服務(wù)器下載秘密共享{C」}。特別的是,用戶發(fā)送F的指針給S-CSPs。在收集到足夠的共享之后,用戶就能夠通過(guò)算法Recover {Cj}恢復(fù)文件F。
[0071]對(duì)于實(shí)現(xiàn)塊級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng),本發(fā)明可以這樣實(shí)現(xiàn):包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟:
[0072]SI所述用戶向所述云服務(wù)器上傳文件和/或數(shù)據(jù),先進(jìn)行文件級(jí)分布式重復(fù)數(shù)據(jù)刪除,如果發(fā)現(xiàn)重復(fù),則執(zhí)行文件級(jí)去重;否則,所述用戶執(zhí)行塊級(jí)去重。
[0073]S2將所述文件和/或數(shù)據(jù)劃 分為一組片段并計(jì)算其標(biāo)簽后發(fā)送至所述云服務(wù)器檢查是否存在重復(fù);
[0074]S3如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)所述片段進(jìn)行秘密共享計(jì)算后獲得若干塊;同時(shí),所述用戶計(jì)算- j - n,并通過(guò)安全信道上傳一組值至所述云服務(wù)器;
[0075]S4所述云服務(wù)器收到所述值后,返回關(guān)聯(lián)的指針至所述用戶作本地存儲(chǔ)。
[0076]需要進(jìn)一步說(shuō)明的是,如檢查發(fā)現(xiàn)重復(fù),還包括:
[0077]S201所述云服務(wù)器接收所述片段標(biāo)簽后計(jì)算一個(gè)所述片段的信號(hào)矢量;
[0078]S202對(duì)每一個(gè)i,如果存在一些存儲(chǔ)的塊標(biāo)簽與匹配,所述用戶就進(jìn)一步計(jì)算并發(fā)這Φι, , =給身份信息為坤的云服務(wù)器;
[0079]M03如果也與存儲(chǔ)的關(guān)聯(lián)標(biāo)簽相匹配,所述云服務(wù)器返回一個(gè)Bi的塊指針給所述用戶;所述用戶保留Bi的塊指針,則不需上傳B”
[0080]根據(jù)上述方法,其具體實(shí)施例如下:
[0081]實(shí)施例一
[0082]這一部分,將展示如何達(dá)到細(xì)粒度塊級(jí)分布式去重。在一個(gè)塊級(jí)去重系統(tǒng)中,用戶同樣需要在上傳他的文件之前執(zhí)行文件級(jí)去重。如果沒(méi)有發(fā)現(xiàn)重復(fù),用戶分割他的文件為塊級(jí),并運(yùn)行塊級(jí)去重。系統(tǒng)設(shè)定與文件級(jí)去重系統(tǒng)是一樣的,僅僅是塊大小參數(shù)這里要先
定義一下。
[0083]文件上傳:上傳一個(gè)文件F,用戶首先進(jìn)行文件級(jí)去重。如果發(fā)現(xiàn)了重復(fù),則執(zhí)行文件級(jí)去重。如果沒(méi)有發(fā)現(xiàn)重復(fù),用戶就執(zhí)行如下的塊級(jí)去重方式。
[0084]首先把文件F劃分成一組片段{BJ。對(duì)每一個(gè)片段Bi,用戶將執(zhí)行塊級(jí)去重檢查,通過(guò)計(jì)算Φβ, = TagGeniBi),數(shù)據(jù)處理和去重檢查類似于文件級(jí)去重,就是把文件F換成了塊B”根據(jù)接收到的塊標(biāo)簽攜帶身份ic^_的服務(wù)器計(jì)算一個(gè)塊信號(hào)矢量crs通過(guò)如下方式:對(duì)每一個(gè)i,如果存在一些存儲(chǔ)的塊標(biāo)簽與么匹配,用戶就進(jìn)一步計(jì)算并發(fā)送
ΦΒ?,] =(孕,_/)給身份信息為坤的s-csp的服務(wù)器。如果也與存儲(chǔ)的關(guān)聯(lián)標(biāo)簽
相匹配,S-CSP就返回一個(gè)Bi的塊指針給用戶。然后,用戶保留Bi的塊指針,就不需要在上傳 Bi 了。
[0085]否則,用戶對(duì)Bi運(yùn)行秘密共享算法SS,獲得{Cij} =Share (Bi),其中Cij是Bi的第j個(gè)秘密共享。用戶同時(shí)計(jì)算J并通過(guò)安全信道上傳一組值給
身份信息為的服務(wù)器。服務(wù)器存儲(chǔ)這些值,返回關(guān)聯(lián)的指針給用戶本地存儲(chǔ)。
[0086]文件下載:下載一個(gè)文件F= {BJ,用戶首先從S-CSPs服務(wù)器下載F中的塊Bi的所有秘密共享IcuU特別的,用戶發(fā)送Bi的所有指針給服務(wù)器。在收集齊所有共享之后,用戶通過(guò)算法ReC0Ver{.}恢復(fù)所有片段Bi,然`后通過(guò)F= {BJ得到文件F。
【權(quán)利要求】
1.一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,其特征在于,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟: Si所述用戶計(jì)算并發(fā)送文件和/或數(shù)據(jù)標(biāo)簽至所述云服務(wù)器,用于檢查是否存在重復(fù); S2如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)文件和/或數(shù)據(jù)進(jìn)行秘密共享計(jì)算后獲得若干個(gè)碎片; S3計(jì)算并獲得所述若干個(gè)碎片所對(duì)應(yīng)的云服務(wù)器上的標(biāo)簽; S4所述用戶在安全信道中向所述云服務(wù)器上傳一組含有與所述文件和/或數(shù)據(jù)對(duì)應(yīng)的值,所述云服務(wù)器存儲(chǔ)所述值并返回一個(gè)指針至所述用戶作本地存儲(chǔ); 其中,所述文件和/或數(shù)據(jù)標(biāo)簽為元數(shù)據(jù)標(biāo)簽ΦF=TagGen (F)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,如檢查發(fā)現(xiàn)重復(fù),還包括: SlOl所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的帶有服務(wù)器身份id的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器; S102當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述用戶計(jì)算所述文件和/或數(shù)據(jù)標(biāo)簽時(shí)公式如下:
Φ,,,: =TagGen'(FJdi), TagGen'為標(biāo)簽,F為文件和/或數(shù)據(jù),id」為身份,j為個(gè)數(shù);其中,個(gè)數(shù)j可阻止所述云服務(wù)器獲取其他云服務(wù)器的相同文件或塊。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述值為ΦΡ,idj,表示元數(shù)據(jù)標(biāo)簽文件的第j個(gè)碎片和第j個(gè)id為j的云服務(wù)器上的標(biāo)簽。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,適用于文件級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
6.一種安全的分布式重復(fù)數(shù)據(jù)刪除方法,其特征在于,包括多個(gè)作為存儲(chǔ)服務(wù)器的云服務(wù)器,以及向所述云服務(wù)器上傳文件和/或數(shù)據(jù)的用戶,所述方法包括以下步驟: S1所述用戶向所述云服務(wù)器上傳文件和/或數(shù)據(jù),先進(jìn)行文件級(jí)分布式重復(fù)數(shù)據(jù)刪除,如果發(fā)現(xiàn)重復(fù),則執(zhí)行文件級(jí)去重;否則,所述用戶執(zhí)行塊級(jí)去重。 S2將所述文件和/或數(shù)據(jù)劃分為一組片段并計(jì)算其標(biāo)簽后發(fā)送至所述云服務(wù)器檢查是否存在重復(fù); S3如檢查沒(méi)有發(fā)現(xiàn)重復(fù),對(duì)所述片段進(jìn)行秘密共享計(jì)算后獲得若干塊;同時(shí),所述用戶計(jì)算身份id」信息為的服務(wù)器上的數(shù)據(jù)標(biāo)簽,并通過(guò)安全信道上傳一組值至所述云服務(wù)器; S4所述云服務(wù)器收到所述值后,返回關(guān)聯(lián)的指針至所述用戶作本地存儲(chǔ)。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,如檢查發(fā)現(xiàn)重復(fù),還包括: S201所述云服務(wù)器接收所述片段標(biāo)簽后計(jì)算一個(gè)所述片段的信號(hào)矢量; S202所述用戶計(jì)算并發(fā)送所述文件和/或數(shù)據(jù)的標(biāo)簽至其他擁有與所述用戶相同身份的云服務(wù)器; S203當(dāng)所述標(biāo)簽與原存在與云服務(wù)器中的文件和/或數(shù)據(jù)標(biāo)簽匹配時(shí),所述云服務(wù)器分配一個(gè)指針給所述用戶用于對(duì)所述文件和/或數(shù)據(jù)進(jìn)行共享。
8.根據(jù)權(quán)要求6所述的方法,其特征在于,適用于塊級(jí)的分布式重復(fù)數(shù)據(jù)刪除系統(tǒng)。
【文檔編號(hào)】H04L29/08GK103763362SQ201410014630
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2014年1月13日 優(yōu)先權(quán)日:2014年1月13日
【發(fā)明者】陳曉峰, 尤沛, 李進(jìn), 李柏晴 申請(qǐng)人:西安電子科技大學(xué)