一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)云存儲(chǔ)的重復(fù)數(shù)據(jù)刪除方法,具體涉及用戶能夠及時(shí)有效地證明服務(wù)器上文件所有權(quán)的一種重復(fù)數(shù)據(jù)刪除方法。
【背景技術(shù)】
[0002]隨著各行各業(yè)信息化的要求越來越高,需要存儲(chǔ)的數(shù)據(jù)量越來越龐大,然而,已經(jīng)存儲(chǔ)的數(shù)據(jù)中有相當(dāng)一部分是重復(fù)的,這樣既浪費(fèi)存儲(chǔ)空間又增加了存儲(chǔ)的工作量。為了緩解存儲(chǔ)系統(tǒng)的空間增長問題,提出了重復(fù)數(shù)據(jù)刪除技術(shù),有效地節(jié)約存儲(chǔ)空間和應(yīng)用更加合理的方式來管理數(shù)據(jù)。據(jù)報(bào)告,商業(yè)應(yīng)用在存儲(chǔ)和備份中能夠?qū)崿F(xiàn)的重復(fù)刪除比率從I:10到高達(dá)1:500,從而節(jié)約存儲(chǔ)空間和寬帶達(dá)到90%。
[0003]在傳統(tǒng)應(yīng)用重復(fù)數(shù)據(jù)刪除技術(shù)的云存儲(chǔ)系統(tǒng)中,各用戶首先向服務(wù)器上傳文件的哈希值,然后云存儲(chǔ)服務(wù)器檢查數(shù)據(jù)庫中是否存在該哈希值。如果哈希值在數(shù)據(jù)庫不存在,服務(wù)器則要求用戶上傳整個(gè)文件,否則不上傳整個(gè)文件。
[0004]但是,對(duì)于文件級(jí)重復(fù)數(shù)據(jù)刪除技術(shù)而言,目前存在的主要問題是:云存儲(chǔ)服務(wù)器通過一些短小的信息(如哈希值)來判斷用戶是否擁有整個(gè)文件,針對(duì)多用戶而言,如果該哈希值泄露,其他用戶就可以通過短小的信息來獲得整個(gè)文件,因此用戶存儲(chǔ)在服務(wù)器的文件就很不安全。
【發(fā)明內(nèi)容】
[0005]發(fā)明的目:提出一種先快速有效地證明用戶對(duì)文件擁有所有權(quán),再刪除用戶的重復(fù)數(shù)據(jù)文件的方法,解決了傳統(tǒng)重復(fù)數(shù)據(jù)刪除方法中通過一些短小的信息(如哈希值)來判斷文件是否重復(fù),而沒有判斷用戶是否對(duì)文件具有所有權(quán)的安全性問題。
[0006]技術(shù)方案:一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法,包括如下步驟:
[0007]本地客戶端接受用戶需要存儲(chǔ)的數(shù)據(jù)文件;
[0008]用通用哈希函數(shù)將文件壓縮成固定大小(如64M),對(duì)壓縮后的文件分割成若干數(shù)據(jù)塊,將數(shù)據(jù)塊用SHA256算法生產(chǎn)一個(gè)唯一的長為128位(bits)的散列值,再對(duì)每兩個(gè)散列值一組計(jì)算建立Merkle哈希樹。
[0009]本地客戶端通過Merkle哈希樹與主存儲(chǔ)服務(wù)器進(jìn)行信息交換,確定用戶是否擁有該數(shù)據(jù)文件的所有權(quán),如果擁有,則進(jìn)行文件級(jí)重復(fù)數(shù)據(jù)刪除,否則本地客戶端上傳并保存數(shù)據(jù)文件至主存儲(chǔ)服務(wù)器。
[0010]本發(fā)明采用上述技術(shù)方案,具有以下有益效果:本發(fā)明提供了一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法,通過對(duì)數(shù)據(jù)文件建立Merkle哈希樹與主存儲(chǔ)服務(wù)器進(jìn)行信息交換,確定用戶對(duì)文件擁有所有權(quán)后再刪除重復(fù)數(shù)據(jù),實(shí)現(xiàn)了在保證數(shù)據(jù)壓縮率情況下,月艮務(wù)器能夠確定用戶對(duì)文件擁有所有權(quán),保證了用戶文件的安全性。
【附圖說明】
[0011]圖1為本發(fā)明實(shí)施流程圖;
[0012]圖2為數(shù)據(jù)文件的Merkle樹;
[0013]圖3為本地客戶端與主服務(wù)器確定文件所有權(quán)流程圖。
【具體實(shí)施方式】
[0014]下面結(jié)合附圖對(duì)本發(fā)明的方法作進(jìn)一步說明。
[0015]一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法,包括:本地客戶端接收需要存儲(chǔ)數(shù)據(jù)文件;用通用哈希算法將文件壓縮成固定長度,并對(duì)壓縮后文件建立Merkle哈希樹;再與主存儲(chǔ)服務(wù)器進(jìn)行進(jìn)行信息交換,從而判斷用戶對(duì)文件擁有所有權(quán);最后刪除重復(fù)數(shù)據(jù);其具體步驟如下:
[0016]I)本地客戶端接收需要存儲(chǔ)的數(shù)據(jù)文件;
[0017]2)采用通用哈希函數(shù)將數(shù)據(jù)文件壓縮成固定大小(如64M),如果數(shù)據(jù)文件小于固定大小,則直接跳到3);
[0018]3)對(duì)壓縮后文件按照指定的塊數(shù)(如256塊)進(jìn)行分割;
[0019]4)用抗碰撞哈希函數(shù)計(jì)算數(shù)據(jù)塊的哈希值;
[0020]5)對(duì)數(shù)據(jù)塊的哈希值每兩個(gè)一組進(jìn)行哈希計(jì)算,建立Merkle哈希樹;
[0021]6)傳送數(shù)據(jù)塊Merkle哈希樹根值至主存儲(chǔ)服務(wù)器,判斷是否存在;
[0022]A.存在,⑴主存儲(chǔ)服務(wù)器隨機(jī)返回一定數(shù)量Merkle哈希樹葉子結(jié)點(diǎn),本地客戶端響應(yīng)葉子結(jié)點(diǎn)的兄弟路徑的哈希值;(2)主存儲(chǔ)服務(wù)器判斷兄弟路徑的哈希值是正確的,則標(biāo)記該用戶完成存儲(chǔ)文件,并標(biāo)記用戶具有文件的所有權(quán);(3)主服務(wù)器判斷兄弟路徑不正確,則轉(zhuǎn)到B;
[0023]B.不存在,(I)在本地客戶端存儲(chǔ)數(shù)據(jù)文件Merkle哈希樹;(2)將數(shù)據(jù)文件以及數(shù)據(jù)文件Merkle哈希樹發(fā)送至主存儲(chǔ)服務(wù)器,并進(jìn)行存儲(chǔ);
[0024]7)完成數(shù)據(jù)重復(fù)刪除。
[0025]除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
【主權(quán)項(xiàng)】
1.一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法,其特征在于,包括如下步驟: 本地客戶端接受用戶需要存儲(chǔ)的數(shù)據(jù)文件; 用通用哈希函數(shù)將文件壓縮成固定大小(如64M),對(duì)壓縮后的文件分割成若干塊數(shù)據(jù),將數(shù)據(jù)塊用SHA256算法生產(chǎn)一個(gè)唯一的長為128位(bits)的散列值,再對(duì)每兩個(gè)散列值一組計(jì)算建立Merkle哈希樹。 本地客戶端通過Merkle哈希樹與主存儲(chǔ)服務(wù)器進(jìn)行信息交換,確定用戶是否擁有該數(shù)據(jù)文件的所有權(quán),如果擁有,則進(jìn)行文件級(jí)重復(fù)數(shù)據(jù)刪除,否則本地客戶端上傳并保存數(shù)據(jù)文件至主存儲(chǔ)服務(wù)器。
【專利摘要】本發(fā)明公開了一種可證明文件所有權(quán)的重復(fù)數(shù)據(jù)刪除方法,包括如下步驟:本地客戶端接受需要存儲(chǔ)數(shù)據(jù)文件;用哈希算法將文件壓縮成固定長度,并對(duì)壓縮后文件建立Merkle哈希樹;再與主存儲(chǔ)服務(wù)器進(jìn)行信息交換,從而判斷用戶對(duì)文件擁有所有權(quán);最后刪除重復(fù)數(shù)據(jù),確保了各用戶數(shù)據(jù)文件存儲(chǔ)的安全性。
【IPC分類】G06F17-30
【公開號(hào)】CN104636369
【申請(qǐng)?zhí)枴緾N201310557417
【發(fā)明人】王立進(jìn), 徐勤, 李 榮, 朱燕濤, 劉傳宇
【申請(qǐng)人】北京安碼科技有限公司
【公開日】2015年5月20日
【申請(qǐng)日】2013年11月7日