亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)據(jù)處理方法及裝置的制作方法

文檔序號:7675792閱讀:152來源:國知局
專利名稱:數(shù)據(jù)處理方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及存儲領(lǐng)域,特別涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù)
隨著企業(yè)的數(shù)據(jù)量不斷增大,大量的重復(fù)數(shù)據(jù)給存儲帶來嚴(yán)峻的挑戰(zhàn)。而重復(fù)數(shù)據(jù)刪除(Data de-duplication,簡稱De-Dupe)作為通過有效地減少數(shù)據(jù),降低數(shù)據(jù)存儲成本的重要技術(shù),成為大家關(guān)注的焦點(diǎn)。重復(fù)數(shù)據(jù)刪除技術(shù)的實(shí)現(xiàn)中,系統(tǒng)通過計(jì)算并檢查數(shù)據(jù)塊(或文件)的指紋數(shù)據(jù), 指紋數(shù)據(jù)是用以唯一標(biāo)識某一文件或者文件的某一數(shù)據(jù)塊的數(shù)據(jù),判斷該數(shù)據(jù)塊是否與已經(jīng)存儲的元數(shù)據(jù)重復(fù)。如果重復(fù),則只需要保留指向該元數(shù)據(jù)的指針,如果指紋數(shù)據(jù)顯示該數(shù)據(jù)塊是全新的,則保留該數(shù)據(jù)塊,并作為元數(shù)據(jù)供以后使用。在現(xiàn)有的重復(fù)數(shù)據(jù)刪除技術(shù)中,大多采用定長的數(shù)據(jù)塊切割方式對需備份的文件進(jìn)行切割,當(dāng)客戶端首次備份后如果在該文件的頭部或者中部進(jìn)行修改,例如插入、刪除、 更新等,此時如果采用傳統(tǒng)的定長數(shù)據(jù)塊切割方式,即使對原備份文件進(jìn)行修改的數(shù)據(jù)量很小,原文件中已有的數(shù)據(jù)塊也會依次發(fā)生移動,因此在發(fā)生變化后的文件中找到之前備份過的重復(fù)數(shù)據(jù)塊的個數(shù)會減少,這就會降低重復(fù)數(shù)據(jù)刪除效率,導(dǎo)致更多的數(shù)據(jù)塊被傳輸?shù)椒?wù)器端,這一方面會增加網(wǎng)絡(luò)帶寬的消耗,另一方面會增加服務(wù)器端的數(shù)據(jù)存儲。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法及裝置,可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法,包括計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。 本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法,包括接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針。本發(fā)明實(shí)施例提供的客戶端,包括第一計(jì)算模塊,用于計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);第一發(fā)送模塊,用于將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;第一接收模塊,用于接收服務(wù)器發(fā)送的比對結(jié)果;第二發(fā)送模塊,用于根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。本發(fā)明實(shí)施例提供的服務(wù)器,包括第三接收模塊,用于接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);第一比對模塊,用于將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;第四發(fā)送模塊,用于將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針。從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)本發(fā)明實(shí)施例當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時,將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲, 進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。


為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施方式的一個數(shù)據(jù)處理方法流程圖;圖2是本發(fā)明實(shí)施方式的另一個數(shù)據(jù)處理方法流程圖;圖3是本發(fā)明實(shí)施方式中再一個數(shù)據(jù)處理方法流程圖;圖4是本發(fā)明實(shí)施方式中又一個數(shù)據(jù)處理方法流程圖;圖5是本發(fā)明實(shí)施方式中客戶端與服務(wù)器的數(shù)據(jù)交互圖;圖6是本發(fā)明實(shí)施方式一個客戶端的結(jié)構(gòu)示意圖;圖7是本發(fā)明實(shí)施方式另一個客戶端的結(jié)構(gòu)示意圖;。
圖8是本發(fā)明實(shí)施方式一個服務(wù)器的結(jié)構(gòu)示意圖;圖9是本發(fā)明實(shí)施方式另一個服務(wù)器的結(jié)構(gòu)示意圖;圖10(a)是本發(fā)明實(shí)施例中的數(shù)據(jù)塊劃分示意圖;圖10(b)是本發(fā)明實(shí)施例中的數(shù)據(jù)塊的一個指紋數(shù)據(jù)示意圖;圖10(c)是本發(fā)明實(shí)施例中的數(shù)據(jù)塊的另一個指紋數(shù)據(jù)示意圖;圖10(d)是本發(fā)明實(shí)施例中的數(shù)據(jù)塊的再一個指紋數(shù)據(jù)示意圖。
具體實(shí)施例方式為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。參見圖一,是本發(fā)明一個實(shí)施方式所公開的數(shù)據(jù)處理方法;在本發(fā)明實(shí)施例中,客戶端已完成了文件的首次備份,經(jīng)過一段時間以后,原文件發(fā)生變化,即需要將變化后的文件重新備份到服務(wù)器,完成服務(wù)器對元數(shù)據(jù)的更新;步驟S401 計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的文件的各個數(shù)據(jù)塊各自生成一個32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識,需要特別指出的是,除了使用以上列舉的算法外,本實(shí)施例以及后續(xù)的其他實(shí)施例中,還可以根據(jù)具體需要使用其他算法生成指紋數(shù)據(jù),只要客戶端與服務(wù)器的算法一致或者具有對應(yīng)性,且通過算法產(chǎn)生的數(shù)據(jù)能夠唯一標(biāo)識待備份文件數(shù)據(jù)塊即可;在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;這里的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。步驟S402 將待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;具體地,客戶端將計(jì)算得出的各個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于服務(wù)器依次將其與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行對比;這里的服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),是指將首次備份時客戶端發(fā)送給服務(wù)器的元數(shù)據(jù)按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的指紋數(shù)據(jù);這里的保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將服務(wù)器之前保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。步驟S403 根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。具體地,對于比對結(jié)果相同的數(shù)據(jù)塊,服務(wù)器只需指示客戶端將該數(shù)據(jù)塊的指針發(fā)送給服務(wù)器即可,對于比對結(jié)果不同的數(shù)據(jù)塊,服務(wù)器需指示客戶端發(fā)送該數(shù)據(jù)塊。需要說明的是,上述實(shí)施例可以是對一個文件進(jìn)行備份,也可以是對由多個文件組成的一個文件集進(jìn)行備份,具體的備份方法類似,不再贅述。本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。參見圖二,是本發(fā)明一個實(shí)施方式所公開的數(shù)據(jù)處理方法,在本發(fā)明實(shí)施例中,客戶端已完成了文件的首次備份,經(jīng)過一段時間以后,原文件發(fā)生變化,即需要將變化后的文件備份到服務(wù)器,完成服務(wù)器對元數(shù)據(jù)的更新,與實(shí)施例一不同的是,實(shí)施例一是從客戶端的角度描述的,而本實(shí)施例是從服務(wù)器的角度來描述的;步驟S501 接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的待備份文件的各個數(shù)據(jù)塊各自生成一個32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識;在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;這里的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。步驟S502 將待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;這里的服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),是指將首次備份時客戶端發(fā)送給服務(wù)器的元數(shù)據(jù)按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的指紋數(shù)據(jù);這里的保存的文件的各個數(shù)據(jù)塊的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù);需要說明的是,服務(wù)器比對指紋數(shù)據(jù)可以采用rsync滾動校驗(yàn)算法,依次將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù),以及地址的偏移量加1的指紋數(shù)據(jù)與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,同時需要指出的是,本步驟的目的在于進(jìn)行指紋數(shù)據(jù)的對比,為了方便說明而以rsync算法進(jìn)行舉例,但顯然的,除了 rsync算法外,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況選用其他算法;例如以定長為2的數(shù)據(jù)塊為例;第一次,將客戶端發(fā)送的第一個數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器保存的文件的第一個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則將其與服務(wù)器保存的文件的第二個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則依次比對,直至服務(wù)器保存的文件的最后一個數(shù)據(jù)塊的指紋數(shù)據(jù),如果仍然不相同,則將其與服務(wù)器保存的文件的第一個數(shù)據(jù)塊的地址的偏移量加1的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則將其與服務(wù)器保存的文件的第二個數(shù)據(jù)塊的地址的偏移量加1的指紋數(shù)據(jù)進(jìn)行比對,如果仍然找不到匹配的指紋數(shù)據(jù),則可以通知客戶端發(fā)送該數(shù)據(jù)塊;第二次,將客戶端發(fā)送的第一個數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù)按照第一次的步驟,依次與服務(wù)器保存的文件的數(shù)據(jù)塊,及偏移量加1的數(shù)據(jù)塊進(jìn)行比對。需要說明的是,在本發(fā)明實(shí)施例中除了可以將文件的數(shù)據(jù)按照長度為2來劃分?jǐn)?shù)據(jù)塊以外,還可以按照長度為3、定長為4等來劃分?jǐn)?shù)據(jù)塊;若以長度為3來劃分?jǐn)?shù)據(jù)塊,則當(dāng)將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比較時,不但要依次比較數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù),還需要依次比較數(shù)據(jù)塊的地址的偏移量加2的數(shù)據(jù)塊的指紋數(shù)據(jù);若以長度為4來劃分?jǐn)?shù)據(jù)塊,則當(dāng)將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比較時,不但要依次比較數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù),還需要依次比較數(shù)據(jù)塊的地址的偏移量加2的數(shù)據(jù)塊的指紋數(shù)據(jù),以及數(shù)據(jù)塊的地址的偏移量加3的數(shù)據(jù)塊的指紋數(shù)據(jù);以此類推,若以長度為N來劃分?jǐn)?shù)據(jù)塊,N為大于2的自然數(shù),待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是該待備份文件的各個數(shù)據(jù)塊的地址的偏移量從加1,依次遞增至加N-I后的數(shù)據(jù)塊的指紋數(shù)據(jù)。同樣地,客戶端的各個數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊,也是從偏移量加1 遞增至偏移量加N-I的數(shù)據(jù)塊。步驟S503 將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針。在步驟S502中,服務(wù)器通過比對得出發(fā)生變化的數(shù)據(jù)塊,由此可以將比對結(jié)果發(fā)送給客戶端,指示客戶端將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。參見圖三,是本發(fā)明另一個實(shí)施方式所公開的數(shù)據(jù)處理方法;在本發(fā)明實(shí)施例中,客戶端已完成了文件的首次備份,文件首次備份是將客戶端的文件完整地備份到服務(wù)器,服務(wù)器將該文件作為元數(shù)據(jù)保存。
在經(jīng)過一段時間后,該文件可能發(fā)生變化,即需要將變化后的文件備份到服務(wù)器, 完成服務(wù)器對元數(shù)據(jù)的更新。下面將具體對文件可能發(fā)生變化之后的備份方法進(jìn)行描述步驟SlOl 計(jì)算待備份文件的指紋數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的文件生成一個 32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識。步驟S102 將該待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于將該待備份文件的指紋數(shù)據(jù)與服務(wù)器保存的文件的指紋數(shù)據(jù)進(jìn)行比對;具體地,客戶端將在步驟SlOl計(jì)算獲得的待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器, 服務(wù)器在文件的首次備份時已通過計(jì)算獲得該文件的指紋數(shù)據(jù),在接收到客戶端發(fā)送的指紋數(shù)據(jù)后與其在先保存的指紋數(shù)據(jù)進(jìn)行比較,若指紋數(shù)據(jù)相同,則說明文件沒有發(fā)生變化, 若指紋數(shù)據(jù)不同,則說明文件已經(jīng)發(fā)生變化。步驟S102和步驟S103的技術(shù)效果在于,在經(jīng)過一段時間t以后,如果不確定原文件是否發(fā)生變化,可以將當(dāng)前文件的指紋數(shù)據(jù)與原文件的指紋數(shù)據(jù)進(jìn)行比對,以確定原文件是否發(fā)生變化,若沒有變化,則客戶端將該文件的指針發(fā)送給服務(wù)器即可,不必進(jìn)行后面的操作,然而在本發(fā)明實(shí)施例中重點(diǎn)討論的是原文件發(fā)生變化的情況。步驟S103 接收服務(wù)器發(fā)送的比對結(jié)果,當(dāng)比對結(jié)果為不相同時,計(jì)算該待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及各個數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù);具體地,在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;計(jì)算各個數(shù)據(jù)塊的指紋數(shù)據(jù)的方法與步驟SlOl中計(jì)算待備份文件的指紋數(shù)據(jù)的方法一致,這里不在贅述;另外,當(dāng)比對結(jié)果相同時,說明待備份文件與服務(wù)器中保存的元數(shù)據(jù)相比沒有變化,則將該備份文件的指針發(fā)送給服務(wù)器即可。步驟S104 將各個數(shù)據(jù)塊的指紋數(shù)據(jù)及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;具體地,客戶端將計(jì)算得出的各個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于服務(wù)器依次將其與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行對比;這里的服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),是指將首次備份時客戶端發(fā)送給服務(wù)器的元數(shù)據(jù)按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的指紋數(shù)據(jù);這里的保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。步驟S105 根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器;具體地,對于比對結(jié)果相同的數(shù)據(jù)塊,服務(wù)器只需指示客戶端將該數(shù)據(jù)塊的指針發(fā)送給服務(wù)器即可,對于比對結(jié)果不同的數(shù)據(jù),服務(wù)器需指示客戶端發(fā)送該數(shù)據(jù)。需要說明的是,上述實(shí)施例可以是對一個文件進(jìn)行備份,也可以是對一個文件集中的多個文件進(jìn)行備份,具體的備份方法類似,不再贅述。本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的數(shù)據(jù)塊進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。參見圖四,是本發(fā)明另一個實(shí)施方式所公開的數(shù)據(jù)處理方法;在本發(fā)明實(shí)施例中,客戶端已完成了文件的首次備份,文件首次備份是將客戶端的文件完整地備份到服務(wù)器,服務(wù)器將該文件作為元數(shù)據(jù)保存。在經(jīng)過一段時間后,該文件可能發(fā)生變化,即需要將變化后的文件備份到服務(wù)器, 完成服務(wù)器對元數(shù)據(jù)的更新。下面將具體對文件可能發(fā)生變化之后的備份方法進(jìn)行描述, 與實(shí)施例一不同之處在于,實(shí)施例一是從客戶端的角度描述的,而本實(shí)施例是從服務(wù)器的角度描述的;步驟S201 接收客戶端發(fā)送的待備份文件的指紋數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的數(shù)據(jù)生成一個 32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識。步驟S202 將該待備份文件的指紋數(shù)據(jù)與保存的文件的指紋數(shù)據(jù)進(jìn)行比對,并將比對結(jié)果發(fā)送給客戶端;具體地,服務(wù)器在文件的首次備份時已通過計(jì)算獲得該文件的指紋數(shù)據(jù),在接收到客戶端發(fā)送的指紋數(shù)據(jù)后與其在先保存的指紋數(shù)據(jù)進(jìn)行比較,若指紋數(shù)據(jù)相同,則說明文件沒有發(fā)生變化,若指紋數(shù)據(jù)不同,則說明文件已經(jīng)發(fā)生變化。步驟S202和步驟S203的技術(shù)效果在于,在經(jīng)過一段時間t以后,如果不確定原文件是否發(fā)生變化,可以將當(dāng)前文件的指紋數(shù)據(jù)與原文件的指紋數(shù)據(jù)進(jìn)行比對,以確定原文件是否發(fā)生變化,若沒有變化,則客戶端將該文件的指針發(fā)送給服務(wù)器即可,不必進(jìn)行后面的操作,然而在本發(fā)明實(shí)施例中重點(diǎn)討論的是原文件發(fā)生變化的情況。步驟S203 計(jì)算保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);具體地,在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;計(jì)算各個數(shù)據(jù)塊的指紋數(shù)據(jù)的方法與步驟S201中計(jì)算待備份文件的指紋數(shù)據(jù)的方法一致,這里不再贅述;這里的保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù),具體的計(jì)算方法與前面一致,這里不再贅述。步驟S204 接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),并將其與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對。步驟S205 將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針;具體地,對于比對結(jié)果相同的數(shù)據(jù)塊,服務(wù)器只需指示客戶端將該數(shù)據(jù)塊的指針發(fā)送給服務(wù)器即可,對于比對結(jié)果不同的數(shù)據(jù),服務(wù)器需指示客戶端發(fā)送該數(shù)據(jù)塊。需要說明的是,上述實(shí)施例可以是對一個文件進(jìn)行備份,也可以是對同一個文件集所包含的多個文件進(jìn)行備份,具體的備份方法類似,不再贅述。本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。參見圖五,圖五是以一個具體的示例來說明本發(fā)明一個實(shí)施方式所公開的數(shù)據(jù)處理方法,需要說明的是,對已經(jīng)完成數(shù)據(jù)首次備份的實(shí)施例而言,下面的步驟S301及S302 不是必須的;步驟S301 客戶端首次備份文件數(shù)據(jù)到服務(wù)器;步驟S302 服務(wù)器保存首次備份文件數(shù)據(jù)及該文件的指紋數(shù)據(jù);具體地,服務(wù)器將客戶端發(fā)送的備份文件數(shù)據(jù)作為元數(shù)據(jù)保存,以及將通過計(jì)算獲得的該文件的指紋數(shù)據(jù)也保存下來,對于指紋數(shù)據(jù)的計(jì)算方法已在前面實(shí)施例中說明, 這里不再贅述。S303 經(jīng)過一段時間t后,客戶端計(jì)算并發(fā)送文件的指紋數(shù)據(jù);具體地,經(jīng)過一段時間t后,原文件可能會發(fā)生變化,客戶端需要將變化的數(shù)據(jù)發(fā)送給服務(wù)器以實(shí)現(xiàn)數(shù)據(jù)同步;然而,此時客戶端并不知道原文件是否發(fā)生變化,因此需要對原文件變化與否進(jìn)行驗(yàn)證,驗(yàn)證的具體方法為計(jì)算當(dāng)前文件的指紋數(shù)據(jù),并將其發(fā)送給服務(wù)器。步驟S304 服務(wù)器將客戶端發(fā)送的指紋數(shù)據(jù)與保存的指紋數(shù)據(jù)進(jìn)行比對;具體地,服務(wù)器接收客戶端發(fā)送的其當(dāng)前文件的指紋數(shù)據(jù),與其保存的原文件的指紋數(shù)據(jù)進(jìn)行比對,如果兩個指紋數(shù)據(jù)相同,則說明文件沒有發(fā)生變化,如果兩個指紋數(shù)據(jù)不同,則說明文件發(fā)生變化,由于本發(fā)明實(shí)施例所要解決的技術(shù)問題是文件發(fā)生變化以后的處理,所以這里重點(diǎn)討論文件發(fā)生變化以后的情況。步驟S305 發(fā)送比對結(jié)果;具體地,服務(wù)器在步驟S304中通過比對發(fā)現(xiàn)文件發(fā)生了變化,就將比對結(jié)果發(fā)送給客戶端,接下來進(jìn)行后面的步驟,若服務(wù)器在步驟S304中通過比對發(fā)現(xiàn)文件沒有變化,則不需要對服務(wù)器中保存的文件進(jìn)行更新了。步驟S306 計(jì)算并發(fā)送各個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);下面以在原文件頭部插入一位數(shù)據(jù)來舉例說明原文件為1234ABC;在原文件頭部插入一位數(shù)據(jù)0之后為01234ABC ;在本發(fā)明實(shí)施例中以定長2來劃分?jǐn)?shù)據(jù)塊,即上述01234ABC可以劃分為如圖 10(a)所示的4個數(shù)據(jù)塊;在步驟S306中,客戶端通過計(jì)算獲得每個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),具體而言,就是計(jì)算數(shù)據(jù)塊(0,1)、(2,3), (4、A)、(B、C)的指紋數(shù)據(jù),以及(1,2)、(3,4)、(A,B)、(C)的指紋數(shù)據(jù),并將這些指紋數(shù)據(jù)發(fā)送給服務(wù)器;步驟S307 服務(wù)器計(jì)算保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)及文件的各個數(shù)據(jù)塊的地址偏移量加1后的各個數(shù)據(jù)塊的指紋數(shù)據(jù),并依次與客戶端發(fā)送的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;具體地,以步驟S306中的文件為例,服務(wù)器保存的元數(shù)據(jù)同樣為1234ABC ;該各個數(shù)據(jù)塊的指紋數(shù)據(jù)及文件的各個數(shù)據(jù)塊的地址偏移量加1后的各個數(shù)據(jù)塊的指紋數(shù)據(jù)為如圖10(b)所示服務(wù)器接收到客戶端發(fā)送的當(dāng)前文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)后,將第一個數(shù)據(jù)塊(0,1)的指紋數(shù)據(jù)FPA ‘,依次與服務(wù)器中保存的文件的數(shù)據(jù)塊(1,2)的指紋數(shù)據(jù)FP A, 數(shù)據(jù)塊(3,4)的指紋數(shù)據(jù)FP B,數(shù)據(jù)塊(A,B)的指紋數(shù)據(jù)FP C,數(shù)據(jù)塊(C)的指紋數(shù)據(jù)FP D,以及偏移量加1的數(shù)據(jù)塊0,3)的指紋數(shù)據(jù)FP E,數(shù)據(jù)塊(4,A)的指紋數(shù)據(jù)FP F,數(shù)據(jù)塊(B,C)的指紋數(shù)據(jù)FP G進(jìn)行比對;在現(xiàn)有技術(shù)中,服務(wù)器只會計(jì)算、保存元數(shù)據(jù)的各個數(shù)據(jù)塊的指紋數(shù)據(jù)FPA,F(xiàn)P B, FP C,F(xiàn)P D,當(dāng)用其同當(dāng)前文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對時可以發(fā)現(xiàn),當(dāng)前文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)與FP A,F(xiàn)P B, FP C,F(xiàn)P D均不相同,因此將當(dāng)前文件的所有數(shù)據(jù)塊都備份到服務(wù)器中,這就降低了重復(fù)數(shù)據(jù)刪除率,增加了服務(wù)器端的數(shù)據(jù)量和網(wǎng)絡(luò)帶寬的消耗了 ;而在本發(fā)明實(shí)施中,服務(wù)器將數(shù)據(jù)塊(0,1)的指紋數(shù)據(jù)FP A,與FP A,F(xiàn)P B,FP C, FP D,F(xiàn)P Ε,FP F,FP G進(jìn)行比對后,發(fā)現(xiàn)不同,隨即比對文件偏移量加1的數(shù)據(jù)塊(1,2)的指紋數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)塊(1,2)的指紋數(shù)據(jù)與FP A相同,這說明原文件的頭部增加了一位數(shù)據(jù),于是服務(wù)器將該比對結(jié)果發(fā)送給客戶端,要求客戶端將數(shù)據(jù)0發(fā)送至服務(wù)器。接下來依次對其余的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比較,可以發(fā)現(xiàn)數(shù)據(jù)塊(3,4)的指紋數(shù)據(jù)與FP B相同,數(shù)據(jù)塊(Α,B)的指紋數(shù)據(jù)與FP C相同,數(shù)據(jù)塊(C)的指紋數(shù)據(jù)與FP D 相同,由此可以得出結(jié)論當(dāng)前文件是在原文件的頭部增加了一位數(shù)據(jù)0。步驟S308發(fā)送比對結(jié)果;步驟S309 發(fā)送指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指紋。具體的,客戶端將原文件頭部插入的數(shù)據(jù)0發(fā)送給服務(wù)器。
可見,本發(fā)明實(shí)施例只是將發(fā)生變化了的一位數(shù)據(jù)及其指針發(fā)送給服務(wù)器,與現(xiàn)有技術(shù)相比提高了重復(fù)數(shù)據(jù)刪除率,減少了服務(wù)器的數(shù)據(jù)存儲和網(wǎng)絡(luò)帶寬的消耗。下面再以原文件的中部的數(shù)據(jù)發(fā)生改變?yōu)槔f明本發(fā)明實(shí)施例的數(shù)據(jù)處理方法;例如將原文件1234ABC修改為15D23C ;客戶端將當(dāng)前文件15D23C按照長度2劃分的數(shù)據(jù)塊如圖10 (c)所示為(1,5)、(D, 2)、(3,C)由上述實(shí)施例可知,服務(wù)器保存的元數(shù)據(jù)為1234ABC ;該各個數(shù)據(jù)塊的指紋數(shù)據(jù)及文件的各個數(shù)據(jù)塊的偏移量加1后的各個數(shù)據(jù)塊的指紋數(shù)據(jù)如圖10(d)所示服務(wù)器將客戶端發(fā)送的數(shù)據(jù)塊(1,5)的指紋數(shù)據(jù)FP A’與其計(jì)算保存的指紋數(shù)據(jù) FP A, FP B, FP C,F(xiàn)P D,F(xiàn)P E,F(xiàn)P F,F(xiàn)P G進(jìn)行比對后,發(fā)現(xiàn)沒有匹配的指紋數(shù)據(jù);服務(wù)器接下來將客戶端發(fā)送的數(shù)據(jù)塊(5,D)的指紋數(shù)據(jù)與其保存的指紋數(shù)據(jù)進(jìn)行比對后,發(fā)現(xiàn)仍然沒有匹配的指紋數(shù)據(jù),說明數(shù)據(jù)塊(1,幻是一個發(fā)生變化的數(shù)據(jù)塊;然后,服務(wù)器將客戶端發(fā)送的數(shù)據(jù)塊(D,2)的指紋數(shù)據(jù)與其保存的指紋數(shù)據(jù)進(jìn)行比對后,發(fā)現(xiàn)沒有與其匹配的指紋數(shù)據(jù);服務(wù)器接下來將客戶端發(fā)送的數(shù)據(jù)塊0,3)的指紋數(shù)據(jù)與其保存的指紋數(shù)據(jù)進(jìn)行比對后,發(fā)現(xiàn)與FP E匹配,說明當(dāng)前數(shù)據(jù)塊在原數(shù)據(jù)塊23的基礎(chǔ)上增加了一位數(shù)據(jù)D,因此可以指示客戶端將數(shù)據(jù)D及其指針發(fā)送給服務(wù)器;服務(wù)器接下來將客戶端剩下的數(shù)據(jù)塊C的指紋數(shù)據(jù)與其保存的指紋數(shù)據(jù)進(jìn)行比對后,發(fā)現(xiàn)與FP D匹配,因此可以數(shù)據(jù)塊C沒有發(fā)生變化,只需指示客戶端將數(shù)據(jù)塊C的指針發(fā)送給服務(wù)器即可;需要說明的是,客戶端對文件按照給定長度進(jìn)行劃分是一種邏輯上的劃分,并非是真正意義上的將文件劃分為若干個數(shù)據(jù)塊,目的是方便與服務(wù)器端保存的文件數(shù)據(jù)進(jìn)行對比,找出發(fā)生變化的數(shù)據(jù),因此在數(shù)據(jù)塊的劃分并不是固定的,以上述例子為例,當(dāng)發(fā)現(xiàn)數(shù)據(jù)塊(Dd)的偏移量加1的數(shù)據(jù)塊(1,幻的指紋數(shù)據(jù)能夠在服務(wù)器端找到匹配的指紋數(shù)據(jù)時,可以在邏輯上將數(shù)據(jù)塊(1,幻作為一個數(shù)據(jù)塊,而將其前面一位的數(shù)據(jù)D,以及后面的數(shù)據(jù)C分別作為單獨(dú)的數(shù)據(jù)塊。服務(wù)器完成比對之后,可以通過發(fā)送比對結(jié)果指示客戶端將發(fā)生變化的數(shù)據(jù)塊 (1,5)、數(shù)據(jù)塊(D)及該兩個數(shù)據(jù)塊的指針發(fā)送給服務(wù)器。由此可以看出,本發(fā)明實(shí)施例與現(xiàn)有技術(shù)相比,當(dāng)文件的頭部或中部發(fā)生變化時, 可以提高數(shù)據(jù)重復(fù)刪除率,減少服務(wù)器的數(shù)據(jù)存儲量及網(wǎng)絡(luò)帶寬的消耗。參見圖六,是本發(fā)明一個實(shí)施方式所公開的客戶端;第一計(jì)算模塊601 用于計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),本發(fā)明實(shí)施例匯總,指紋數(shù)據(jù)是用以唯一標(biāo)識某一文件或者文件的某一數(shù)據(jù)塊的數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的文件的各個數(shù)據(jù)塊各自生成一個32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識,需要特別指出的是,除了使用以上列舉的算法外,本實(shí)施例以及后續(xù)的其他實(shí)施例中,還可以根據(jù)具體需要使用其他算法生成指紋數(shù)據(jù),只要客戶端與服務(wù)器的算法一致或者具有對應(yīng)性,且通過算法產(chǎn)生的數(shù)據(jù)能夠唯一標(biāo)識待備份文件數(shù)據(jù)塊即可;在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;這里的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。第一發(fā)送模塊602 用于將待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;具體地,客戶端將計(jì)算得出的各個數(shù)據(jù)塊的指紋數(shù)據(jù),及文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于服務(wù)器依次將其與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行對比;這里的服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),是指將首次備份時客戶端發(fā)送給服務(wù)器的元數(shù)據(jù)按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的指紋數(shù)據(jù);這里的保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將服務(wù)器之前保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。第一接收模塊603 用于接收服務(wù)器發(fā)送的比對結(jié)果。第二發(fā)送模塊604:用于根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。具體地,對于比對結(jié)果相同的數(shù)據(jù)塊,服務(wù)器只需指示客戶端將該數(shù)據(jù)塊的指針發(fā)送給服務(wù)器即可,對于比對結(jié)果不同的數(shù)據(jù)塊,服務(wù)器需指示客戶端發(fā)送該數(shù)據(jù)塊。需要說明的是,上述實(shí)施例可以是對一個文件進(jìn)行備份,也可以是對由多個文件組成的一個文件集進(jìn)行備份,具體的備份方法類似,不再贅述。本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。在上述實(shí)施例中還可以包括第二計(jì)算模塊605、第三發(fā)送模塊606和第二接收模塊 607 ;第二計(jì)算模塊605,用于計(jì)算待備份文件的指紋數(shù)據(jù);第三發(fā)送模塊606,用于將該待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于將該待備份文件的指紋數(shù)據(jù)與服務(wù)器保存的文件的指紋數(shù)據(jù)進(jìn)行比對;具體地,客戶端將計(jì)算獲得的待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器,服務(wù)器在文件的首次備份時已通過計(jì)算獲得該文件的指紋數(shù)據(jù),在接收到客戶端發(fā)送的指紋數(shù)據(jù)后與其在先保存的指紋數(shù)據(jù)進(jìn)行比較,若指紋數(shù)據(jù)相同,則說明文件沒有發(fā)生變化,若指紋數(shù)據(jù)不同,則說明文件已經(jīng)發(fā)生變化。第二接收模塊607,用于接收服務(wù)器的比對結(jié)果。本實(shí)施例與上一實(shí)施例的不同之處在于,在經(jīng)過一段時間t以后,如果不確定原文件是否發(fā)生變化,可以將當(dāng)前文件的指紋數(shù)據(jù)與原文件的指紋數(shù)據(jù)進(jìn)行比對,以確定原文件是否發(fā)生變化,若沒有變化,則客戶端將該文件的指針發(fā)送給服務(wù)器即可,不必進(jìn)行后面的操作。參見圖六,是本發(fā)明一個實(shí)施方式所公開的服務(wù)器;第三接收模塊701 用于接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);具體地,指紋數(shù)據(jù)是指采用SHA-1,MD-5等類似的算法將待備份的待備份文件的各個數(shù)據(jù)塊各自生成一個32位或者1 位哈希值與數(shù)據(jù)形成一一對應(yīng)關(guān)系,由此生成的指紋數(shù)據(jù)是該待備份文件數(shù)據(jù)的唯一標(biāo)識;在本發(fā)明實(shí)施例中將待備份文件按照給定長度劃分為數(shù)據(jù)塊,數(shù)據(jù)塊是數(shù)據(jù)的物理記錄,這里的數(shù)據(jù)塊可以理解為一組或按順序連續(xù)排列在一起的幾組記錄,是主存儲器與輸入、輸出設(shè)備或外存儲器之間進(jìn)行傳輸?shù)囊粋€數(shù)據(jù)單位;這里的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù)。 第一比對模塊702,用于將待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù), 以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;這里的服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),是指將首次備份時客戶端發(fā)送給服務(wù)器的元數(shù)據(jù)按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的指紋數(shù)據(jù);這里的保存的文件的各個數(shù)據(jù)塊的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是指將保存的文件按照給定的長度進(jìn)行劃分的數(shù)據(jù)塊的地址的偏移量加1后,得到的數(shù)據(jù)塊的指紋數(shù)據(jù);需要說明的是,服務(wù)器比對指紋數(shù)據(jù)可以采用rsync滾動校驗(yàn)算法,依次將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù),以及地址的偏移量加1的指紋數(shù)據(jù)與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,同時需要指出的是,本步驟的目的在于進(jìn)行指紋數(shù)據(jù)的對比,為了方便說明而以rsync算法進(jìn)行舉例,但顯然的,除了 rsync算法外,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況選用其他算法;例如以定長為2的數(shù)據(jù)塊為例;第一次,將客戶端發(fā)送的第一個數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器保存的文件的第一個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則將其與服務(wù)器保存的文件的第二個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則依次比對,直至服務(wù)器保存的文件的最后一個數(shù)據(jù)塊的指紋數(shù)據(jù),如果仍然不相同,則將其與服務(wù)器保存的文件的第一個數(shù)據(jù)塊的地址的偏移量加1的指紋數(shù)據(jù)進(jìn)行比對,如果不相同,則將其與服務(wù)器保存的文件的第二個數(shù)據(jù)塊的地址的偏移量加1的指紋數(shù)據(jù)進(jìn)行比對,如果仍然找不到匹配的指紋數(shù)據(jù),則可以通知客戶端發(fā)送該數(shù)據(jù)塊;第二次,將客戶端發(fā)送的第一個數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù)按照第一次的步驟,依次與服務(wù)器保存的文件的數(shù)據(jù)塊,及偏移量加1的數(shù)據(jù)塊進(jìn)行比對。需要說明的是,在本發(fā)明實(shí)施例中除了可以將文件的數(shù)據(jù)按照長度為2來劃分?jǐn)?shù)據(jù)塊以外,還可以按照長度為3、定長為4等來劃分?jǐn)?shù)據(jù)塊;若以長度為3來劃分?jǐn)?shù)據(jù)塊,則當(dāng)將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比較時,不但要依次比較數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù),還需要依次比較數(shù)據(jù)塊的地址的偏移量加2的數(shù)據(jù)塊的指紋數(shù)據(jù);若以長度為4來劃分?jǐn)?shù)據(jù)塊,則當(dāng)將客戶端發(fā)送的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端的各個數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比較時,不但要依次比較數(shù)據(jù)塊的地址的偏移量加1的數(shù)據(jù)塊的指紋數(shù)據(jù),還需要依次比較數(shù)據(jù)塊的地址的偏移量加2的數(shù)據(jù)塊的指紋數(shù)據(jù),以及數(shù)據(jù)塊的地址的偏移量加3的數(shù)據(jù)塊的指紋數(shù)據(jù);以此類推,若以長度為N來劃分?jǐn)?shù)據(jù)塊,N為大于2的自然數(shù),待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),是該待備份文件的各個數(shù)據(jù)塊的地址的偏移量從加1,依次遞增至加N-I后的數(shù)據(jù)塊的指紋數(shù)據(jù)。同樣地,客戶端的各個數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊,也是從偏移量加1 遞增至偏移量加N-I的數(shù)據(jù)塊。第四發(fā)送模塊703,用于將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針服務(wù)器通過第一比對模塊702比對得出發(fā)生變化的數(shù)據(jù)塊,由此可以將比對結(jié)果發(fā)送給客戶端,指示客戶端將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)
ο本發(fā)明實(shí)施例的有益效果在于,當(dāng)客戶端待備份文件發(fā)生變化需要再次備份時, 將該待備份文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及待備份文件的數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與服務(wù)器端保存的文件的數(shù)據(jù)塊的指紋數(shù)據(jù),以及文件的數(shù)據(jù)塊的地址的偏移量遞增的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對,然后將指紋數(shù)據(jù)發(fā)生變化的數(shù)據(jù)塊所對應(yīng)的數(shù)據(jù)發(fā)送給服務(wù)器。因此可以在保證服務(wù)器端備份文件唯一存儲的前提下,有效地減少服務(wù)器端數(shù)據(jù)存儲,進(jìn)一步提高重復(fù)數(shù)據(jù)刪除率。在上述實(shí)施例中,還可以包括第四接收模塊705和第二比對模塊706 ;第四接收模塊705,用于接收客戶端發(fā)送的待備份文件的指紋數(shù)據(jù);第二比對模塊706,用于將待備份文件的指紋數(shù)據(jù)與保存的文件的指紋數(shù)據(jù)進(jìn)行比對,并將比對結(jié)果發(fā)送給客戶端,用于客戶端判斷所述待備份文件是否發(fā)生變化。本實(shí)施例與上一實(shí)施例的不同之處在于,在經(jīng)過一段時間t以后,如果不確定原文件是否發(fā)生變化,可以將當(dāng)前文件的指紋數(shù)據(jù)與原文件的指紋數(shù)據(jù)進(jìn)行比對,以確定原文件是否發(fā)生變化,若沒有變化,則客戶端將該文件的指針發(fā)送給服務(wù)器即可,不必進(jìn)行后面的操作。進(jìn)一步地,在上述實(shí)施例中,還可以包括第三計(jì)算模塊704 ;第三計(jì)算模塊,可以用于計(jì)算并保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,上述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。以上對本發(fā)明所提供的一種能耗確定方法及裝置進(jìn)行了詳細(xì)介紹,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實(shí)施例的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處, 因此,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種數(shù)據(jù)處理方法,其特征在于,包括計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括計(jì)算所述待備份文件的指紋數(shù)據(jù);將所述待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的指紋數(shù)據(jù)進(jìn)行比對;接收服務(wù)器發(fā)送的比對結(jié)果,當(dāng)所述待備份文件發(fā)生變化時,執(zhí)行步驟計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述待備份文件的各個數(shù)據(jù)塊的長度為2時,所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),包括所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量加1后的數(shù)據(jù)塊的指紋數(shù)據(jù);當(dāng)所述待備份文件的各個數(shù)據(jù)塊的長度為N時,N為大于2的自然數(shù),所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),包括所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量從加1,依次遞增至加N-I后的數(shù)據(jù)塊的指紋數(shù)據(jù)。
4.一種數(shù)據(jù)處理方法,其特征在于,包括接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括接收客戶端發(fā)送的待備份文件的指紋數(shù)據(jù);將所述待備份文件的指紋數(shù)據(jù)與保存的文件的指紋數(shù)據(jù)進(jìn)行比對,并將比對結(jié)果發(fā)送給客戶端,用于當(dāng)客戶端判斷出所述待備份文件發(fā)生變化時,執(zhí)行步驟接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù)。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括計(jì)算并保存所述保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,當(dāng)所述待備份文件的各個數(shù)據(jù)塊的長度為2時,所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),包括所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量加1后的數(shù)據(jù)塊的指紋數(shù)據(jù);當(dāng)所述待備份文件的各個數(shù)據(jù)塊的長度為N時,N為大于2的自然數(shù),所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù),包括所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量從加1,依次遞增至加N-I后的數(shù)據(jù)塊的指紋數(shù)據(jù)。
8.一種客戶端,其特征在于,包括第一計(jì)算模塊,用于計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);第一發(fā)送模塊,用于將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;第一接收模塊,用于接收服務(wù)器發(fā)送的比對結(jié)果;第二發(fā)送模塊,用于根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針發(fā)送給服務(wù)器。
9.根據(jù)權(quán)利要求8所述的客戶端,其特征在于,還包括第二計(jì)算模塊,用于計(jì)算所述待備份文件的指紋數(shù)據(jù);第三發(fā)送模塊,用于將所述待備份文件的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的指紋數(shù)據(jù)進(jìn)行比對;第二接收模塊,用于接收服務(wù)器發(fā)送的比對結(jié)果,當(dāng)所述待備份文件發(fā)生變化時啟動第一計(jì)算模塊。
10.一種服務(wù)器,其特征在于,包括第三接收模塊,用于接收客戶端發(fā)送的待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);第一比對模塊,用于將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)與保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;第四發(fā)送模塊,用于將比對結(jié)果發(fā)送給客戶端,并接收客戶端發(fā)送的指紋數(shù)據(jù)不一致的數(shù)據(jù)塊及指針。
11.根據(jù)權(quán)利要求10所述的服務(wù)器,其特征在于,還包括第四接收模塊,用于接收客戶端發(fā)送的待備份文件的指紋數(shù)據(jù);第二比對模塊,用于將所述待備份文件的指紋數(shù)據(jù)與保存的文件的指紋數(shù)據(jù)進(jìn)行比對,并將比對結(jié)果發(fā)送給客戶端,用于當(dāng)客戶端判斷所述待備份文件發(fā)生變化時啟動第三接收模塊。
12.根據(jù)權(quán)利要求10所述的服務(wù)器,其特征在于,還包括第三計(jì)算模塊,用于計(jì)算并保存所述保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)。
全文摘要
本發(fā)明實(shí)施例公開了一種數(shù)據(jù)處理方法,包括計(jì)算待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù);將所述待備份文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及所述待備份文件的各個數(shù)據(jù)塊的地址的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)發(fā)送給服務(wù)器,用于與服務(wù)器保存的文件的各個數(shù)據(jù)塊的指紋數(shù)據(jù),以及保存的文件的各個數(shù)據(jù)塊的偏移量遞增后的數(shù)據(jù)塊的指紋數(shù)據(jù)進(jìn)行比對;根據(jù)服務(wù)器發(fā)送的比對結(jié)果,將發(fā)生變化的數(shù)據(jù)發(fā)送給服務(wù)器??梢蕴岣咧貜?fù)數(shù)據(jù)刪除率。
文檔編號H04L29/08GK102202098SQ201110136079
公開日2011年9月28日 申請日期2011年5月25日 優(yōu)先權(quán)日2011年5月25日
發(fā)明者任欣, 何非 申請人:成都市華為賽門鐵克科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1