亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng)的制作方法

文檔序號(hào):6377707閱讀:139來源:國知局
專利名稱:一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,特別涉及一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng)。
背景技術(shù)
在現(xiàn)有技術(shù)中,提高海量信息存儲(chǔ)率的重要方法是刪除系統(tǒng)中存在的重復(fù)數(shù)據(jù)。系統(tǒng)中存在的重復(fù)數(shù)據(jù)是指存儲(chǔ)在系統(tǒng)中的完全相同的兩份或兩份以上數(shù)據(jù)。在刪除系統(tǒng)中存在的重復(fù)數(shù)據(jù)前,首先獲取上傳數(shù)據(jù)的數(shù)據(jù)信息,根據(jù)數(shù)據(jù)信息判斷系統(tǒng)中是否已經(jīng)存在上傳數(shù)據(jù),當(dāng)已經(jīng)存在上傳數(shù)據(jù)時(shí),刪除上傳數(shù)據(jù)。
上傳數(shù)據(jù)的數(shù)據(jù)信息是對(duì)上傳數(shù)據(jù)進(jìn)行哈希計(jì)算所得的值。哈希計(jì)算是計(jì)算機(jī)領(lǐng)域中的一種散列算法,用于把任意長(zhǎng)度的二進(jìn)制值映射為固定長(zhǎng)度的較小二進(jìn)制值。在獲得上傳數(shù)據(jù)的數(shù)據(jù)信息后,將數(shù)據(jù)信息與系統(tǒng)中保存的數(shù)據(jù)信息進(jìn)行對(duì)比,若數(shù)據(jù)信息一致,則表示系統(tǒng)中存在與上傳數(shù)據(jù)相同的數(shù)據(jù),需要?jiǎng)h除上傳數(shù)據(jù)。若數(shù)據(jù)信息不一致,則表示系統(tǒng)中不存在與上傳數(shù)據(jù)相同的數(shù)據(jù),直接把上傳數(shù)據(jù)存儲(chǔ)在系統(tǒng)中。所述系統(tǒng)中保存的數(shù)據(jù)信息是指對(duì)存儲(chǔ)在數(shù)據(jù)系統(tǒng)中的數(shù)據(jù)進(jìn)行哈希計(jì)算所得的值。在實(shí)現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題I、由于需要?jiǎng)h除重復(fù)數(shù)據(jù),因此系統(tǒng)中不能存儲(chǔ)兩份以上的相同數(shù)據(jù),對(duì)于重要的數(shù)據(jù)不能進(jìn)行備份操作,降低了數(shù)據(jù)可靠性;2、當(dāng)出現(xiàn)異常情況,如停電等,系統(tǒng)中產(chǎn)生垃圾數(shù)據(jù),降低存儲(chǔ)率;所述垃圾數(shù)據(jù)是系統(tǒng)進(jìn)行刪除重復(fù)數(shù)據(jù)的過程中,系統(tǒng)已檢測(cè)出上傳數(shù)據(jù)為重復(fù)數(shù)據(jù),需要進(jìn)行刪除,但由于停電等意外情況的發(fā)生,導(dǎo)致未更新上傳數(shù)據(jù)元數(shù)據(jù)和刪除上傳數(shù)據(jù),使系統(tǒng)中存在一份不需要的數(shù)據(jù);3、用戶上傳數(shù)據(jù)時(shí),若在線進(jìn)行刪除重復(fù)數(shù)據(jù)的操作,影響用戶體驗(yàn)。若上傳后進(jìn)行刪除數(shù)據(jù)的操作,需要對(duì)全系統(tǒng)進(jìn)行掃描,增加系統(tǒng)開銷。

發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng),解決系統(tǒng)中對(duì)于重要的數(shù)據(jù)不能進(jìn)行備份操作,垃圾數(shù)據(jù)不能刪除的技術(shù)問題。為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案第一方面,提供一種刪除重復(fù)數(shù)據(jù)的方法,包括獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù)。在第一方面的第一種可能的實(shí)現(xiàn)方式中,判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。第二方面,提供一種刪除重復(fù)數(shù)據(jù)的裝置,包括
輸入數(shù)據(jù)獲取單元,用于獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。第一哈希單元,用于對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。數(shù)據(jù)信息建立單元,用于建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù)。在第二方面的第一種可能的實(shí)現(xiàn)方式中,第一判斷單元,用于判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。輸入數(shù)據(jù)刪除單元,用于當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。
第三方面,提供一種計(jì)算機(jī)系統(tǒng),包括總線,與所述總線相連的處理器以及與所述總線相連的存儲(chǔ)器;其中所述處理器包括上述提及的裝置。本發(fā)明實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng),首先獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。通過上述刪除重復(fù)數(shù)據(jù)的方法,記錄備份數(shù),刪除垃圾數(shù)據(jù),對(duì)系統(tǒng)中重要的數(shù)據(jù)進(jìn)行備份,提高系統(tǒng)存儲(chǔ)空間存儲(chǔ)率,優(yōu)化用戶體驗(yàn),加快運(yùn)行效率。


為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明實(shí)施例I中刪除重復(fù)數(shù)據(jù)的流程框圖;圖2為本發(fā)明實(shí)施例2中刪除重復(fù)數(shù)據(jù)的流程框圖;圖3為本發(fā)明實(shí)施例2中已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)刪除列表的框圖;圖4為本發(fā)明實(shí)施例2中另一種刪除重復(fù)數(shù)據(jù)的流程框圖;圖5為本發(fā)明實(shí)施例2中第三種刪除重復(fù)數(shù)據(jù)的流程框圖;圖6為本發(fā)明實(shí)施例3中一種刪除重復(fù)數(shù)據(jù)裝置的框圖;圖7為本發(fā)明實(shí)施例3中另一種刪除重復(fù)數(shù)據(jù)裝置的框圖;圖8為本發(fā)明實(shí)施例3中第三種刪除重復(fù)數(shù)據(jù)裝置的框圖;圖9為本發(fā)明實(shí)施例3中元數(shù)據(jù)更新單元的框圖;圖10為本發(fā)明實(shí)施例3中計(jì)算機(jī)系統(tǒng)的框圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。實(shí)施例I :
本發(fā)明的一個(gè)實(shí)施例提供了一種刪除重復(fù)數(shù)據(jù)的方法,如圖I所示,該方法包括如下步驟101、獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。用戶將輸入數(shù)據(jù)以及與該輸入數(shù)據(jù)的副本數(shù)一同輸入計(jì)算機(jī)中。102、對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。本發(fā)明實(shí)施例中提及的哈希計(jì)算是計(jì)算機(jī)領(lǐng)域中的一種散列算法,用于把任意長(zhǎng)度的二進(jìn)制值映射為固定長(zhǎng)度的較小二進(jìn)制值。103、建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù)。
104、判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息。所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。在計(jì)算機(jī)中,已經(jīng)存儲(chǔ)了大量的數(shù)據(jù),每一份已存儲(chǔ)數(shù)據(jù)對(duì)相應(yīng)的建立了唯一的已存儲(chǔ)數(shù)據(jù)信息,每份已存儲(chǔ)數(shù)據(jù)信息中包括對(duì)應(yīng)的已存儲(chǔ)數(shù)據(jù)的哈希值和副本數(shù)。105、當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),表示在步驟101中獲取的用戶的輸入數(shù)據(jù)已經(jīng)存在,不需要再進(jìn)行存儲(chǔ),此時(shí)對(duì)該輸入數(shù)據(jù)進(jìn)行刪除。本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法,通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。通過上述方法,克服對(duì)重要數(shù)據(jù)不能備份的問題,提高數(shù)據(jù)的可靠性。實(shí)施例2 本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法,如圖2所示,包括201、獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。202、對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。所述哈希計(jì)算是計(jì)算機(jī)領(lǐng)域中的一種散列算法,用于把任意長(zhǎng)度的二進(jìn)制值映射為固定長(zhǎng)度的較小二進(jìn)制值。203、建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù)。204、判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息。所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。在計(jì)算機(jī)中,已經(jīng)存儲(chǔ)了大量的數(shù)據(jù),每一份已存儲(chǔ)數(shù)據(jù)相應(yīng)的建立了唯一的已存儲(chǔ)數(shù)據(jù)信息,每份已存儲(chǔ)數(shù)據(jù)信息中包括對(duì)應(yīng)的已存儲(chǔ)數(shù)據(jù)的哈希值和副本數(shù)。步驟204判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息,即判斷是否存在與用戶的輸入數(shù)據(jù)的數(shù)據(jù)信息所包括的哈希值和副本數(shù)分別相同的已存儲(chǔ)數(shù)據(jù)信息。如果兩個(gè)數(shù)據(jù)信息中的哈希值和副本數(shù)分別相同,可以判定這兩個(gè)數(shù)據(jù)信息所對(duì)應(yīng)的兩個(gè)數(shù)據(jù)是相同的數(shù)據(jù)。205、當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)。所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)記錄有所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。206、根據(jù)所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的刪除列表。
所述刪除列表記錄有被執(zhí)行過刪除動(dòng)作的所述已存儲(chǔ)數(shù)據(jù)的文件名。207、將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。舉例來說,如圖3所示,已存儲(chǔ)數(shù)據(jù)3001對(duì)應(yīng)有已存儲(chǔ)數(shù)據(jù)信息301,301具有對(duì)應(yīng)的狀態(tài)信息項(xiàng)302,302記錄有3001在硬盤上的存儲(chǔ)地址303 (具體的,303可以是3001存儲(chǔ)的起始地址)。此外,系統(tǒng)還對(duì)應(yīng)存儲(chǔ)地址303建立有對(duì)應(yīng)的刪除列表304。假設(shè)在304中記錄了 3041,3042,3043共三項(xiàng),這三項(xiàng)分別是三個(gè)不同的文件名,且對(duì)應(yīng)相同的文件內(nèi)容,即3001。
通過步驟205至207,將用戶的輸入數(shù)據(jù)的文件名加入到對(duì)應(yīng)的刪除列表中。該刪除列表對(duì)應(yīng)已在系統(tǒng)中存儲(chǔ)的已存儲(chǔ)數(shù)據(jù),并且該已存儲(chǔ)數(shù)據(jù)與用戶的輸入數(shù)據(jù)是相同的。208、將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。所述元數(shù)據(jù)記錄有與元數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址、數(shù)據(jù)的副本數(shù)、數(shù)據(jù)的文件名。209、刪除所述輸入數(shù)據(jù)。本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法,通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取對(duì)應(yīng)的刪除列表并將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。然后將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,最后刪除所述輸入數(shù)據(jù)。通過上述方法,克服對(duì)重要數(shù)據(jù)不能備份的問題,方便對(duì)執(zhí)行上述步驟的數(shù)據(jù)進(jìn)行管理。本發(fā)明的一個(gè)實(shí)施例還提供一種刪除重復(fù)數(shù)據(jù)的方法,如圖4所示,該方法包括如下步驟401獲取系統(tǒng)中已存在的元數(shù)據(jù)。所述系統(tǒng)中已存在的元數(shù)據(jù)記錄有所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù)、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名。402、對(duì)所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)進(jìn)行哈希計(jì)算,得到第二哈希值。403、構(gòu)造第二數(shù)據(jù)信息,所述第二數(shù)據(jù)信息包括所述第二哈希值,所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù)。404、判斷是否存在與所述第二數(shù)據(jù)信息相同的在系統(tǒng)中已存在的第三數(shù)據(jù)信息。當(dāng)存在第三數(shù)據(jù)信息時(shí),執(zhí)行步驟405。405、獲取所述第三數(shù)據(jù)信息對(duì)應(yīng)的第三狀態(tài)信息項(xiàng)。所述第三狀態(tài)信息項(xiàng)記錄有所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址。406、根據(jù)所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的第三刪除列表。所述第三刪除列表記錄有被執(zhí)行過刪除動(dòng)作的第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的文件名。407、判斷是否在所述第三刪除列表存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名。當(dāng)不存在所述當(dāng)前元數(shù)據(jù)記錄的文件名時(shí),執(zhí)行步驟408。408、將所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址。409、刪除所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)。需要說明的是,對(duì)元數(shù)據(jù)的獲取動(dòng)作,是通過對(duì)所有元數(shù)據(jù)進(jìn)行遍歷來執(zhí)行的。即對(duì)于每個(gè)元數(shù)據(jù),都會(huì)執(zhí)行上述步驟401至409的流程,當(dāng)然,如果在執(zhí)行過程中不能滿足步驟404或407的判斷條件,則終止對(duì)當(dāng)前元數(shù)據(jù)的后續(xù)步驟。本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法,通過當(dāng)前元數(shù)據(jù)獲得當(dāng)前數(shù)據(jù)進(jìn)而得到第二哈希值,然后構(gòu)造第二數(shù)據(jù)信息,當(dāng)在系統(tǒng)中存在與所述第二數(shù)據(jù)信息相·同的第三數(shù)據(jù)信息時(shí),獲得第三數(shù)據(jù)信息對(duì)應(yīng)的第三刪除列表。若所述第三刪除列表不存在當(dāng)前元數(shù)據(jù)記錄的文件名,則將所述當(dāng)前元數(shù)據(jù)記錄的當(dāng)前數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址并刪除當(dāng)前數(shù)據(jù)的存儲(chǔ)地址中的所述當(dāng)前數(shù)據(jù)。通過上述方法,刪除系統(tǒng)中的垃圾數(shù)據(jù),提高系統(tǒng)存儲(chǔ)空間存儲(chǔ)率。進(jìn)一步的,本發(fā)明的一個(gè)實(shí)施例還提供一種刪除重復(fù)數(shù)據(jù)的方法,如圖5所示,該方法包括如下步驟501、獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。502、對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。503、建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù)。504、判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。505、當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng);所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)記錄有所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。506、根據(jù)所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的刪除列表;所述刪除列表記錄有被執(zhí)行過刪除動(dòng)作的所述已存儲(chǔ)數(shù)據(jù)的文件名。507、將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。508、經(jīng)過預(yù)設(shè)定的時(shí)間段。509、將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。所述元數(shù)據(jù)記錄有與元數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址、數(shù)據(jù)的副本數(shù)、數(shù)據(jù)的文件名。510、刪除所述輸入數(shù)據(jù)。本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的方法,通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取對(duì)應(yīng)的刪除列表并將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,最后刪除所述輸入數(shù)據(jù)。通過上述方法,克服了用戶上傳數(shù)據(jù)時(shí)進(jìn)行在線進(jìn)行刪除重復(fù)數(shù)據(jù)的操作,影響用戶體驗(yàn)和上傳后進(jìn)行刪除數(shù)據(jù)的操作,需要對(duì)全系統(tǒng)進(jìn)行掃描,增加系統(tǒng)開銷的問題,優(yōu)化了用戶體驗(yàn),加快運(yùn)行效率。實(shí)施例3本發(fā)明的一個(gè)實(shí)施例提供了一種刪除重復(fù)數(shù)據(jù)的裝置,如圖6所示,該裝置包括輸入數(shù)據(jù)獲取單元61,第一哈希單元62,數(shù)據(jù)信息建立單元63,第一判斷單元64,輸入數(shù)據(jù)刪除單元65。其中輸入數(shù)據(jù)獲取單元61用于獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù)。第一哈希單元62用于對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值。數(shù)據(jù)信息建立單元63用于建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包 括所述哈希值,所述副本數(shù)。第一判斷單元64用于判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù)。輸入數(shù)據(jù)刪除單元65用于刪除所述輸入數(shù)據(jù)。進(jìn)一步的,如圖7所示,所述裝置還包括狀態(tài)信息項(xiàng)獲取單元66,用于當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng);所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)記錄有所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。刪除列表獲取單元67,用于根據(jù)所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的刪除列表;所述刪除列表記錄有被執(zhí)行過刪除動(dòng)作的所述已存儲(chǔ)數(shù)據(jù)的文件名。文件名添加單元68,用于將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。元數(shù)據(jù)更新單元69,用于將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址;所述元數(shù)據(jù)記錄有與元數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址、數(shù)據(jù)的副本數(shù)、數(shù)據(jù)的文件名。進(jìn)一步的,如圖8所示,所述裝置還包括元數(shù)據(jù)獲取單元610,第二哈希單元611,第二數(shù)據(jù)信息建立單元612,第二判斷單元613,第三狀態(tài)信息項(xiàng)獲取單元614,第三刪除列表獲取單元615,第三判斷單元616,存儲(chǔ)地址更新單元617,當(dāng)前數(shù)據(jù)刪除單元618。其中元數(shù)據(jù)獲取單元610用于獲取獲取系統(tǒng)中已存在的元數(shù)據(jù)。第二哈希單元611用于對(duì)所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)進(jìn)行哈希計(jì)算,得到第二哈希值。第二數(shù)據(jù)信息建立單元612用于構(gòu)造第二數(shù)據(jù)信息。第二判斷單元613用于判斷是否存在與所述第二數(shù)據(jù)信息相同的第三數(shù)據(jù)信息。第三狀態(tài)信息項(xiàng)獲取單元614用于當(dāng)存在與所述第二數(shù)據(jù)信息相同的第三數(shù)據(jù)息時(shí),獲取所述第二數(shù)據(jù)息對(duì)應(yīng)的第二狀態(tài)息項(xiàng)。第三刪除列表獲取單元615用于根據(jù)所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的第三刪除列表;所述第三刪除列表記錄有被執(zhí)行過刪除動(dòng)作的第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的文件名。第三判斷單元616用于判斷是否在所述第三刪除列表存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名。
存儲(chǔ)地址更新單元617用于當(dāng)所述第三刪除列表不存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名時(shí),將所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址;。當(dāng)前數(shù)據(jù)刪除單元618用于刪除所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)。通過當(dāng)前元數(shù)據(jù)獲得當(dāng)前數(shù)據(jù)進(jìn)而得到第二哈希值,然后構(gòu)造第二數(shù)據(jù)信息,當(dāng)在系統(tǒng)中存在與所述第二數(shù)據(jù)信息相同的第三數(shù)據(jù)信息時(shí),獲得第三數(shù)據(jù)信息對(duì)應(yīng)的第三刪除列表。若所述第三刪除列表不存在當(dāng)前元數(shù)據(jù)記錄的文件名,則將所述當(dāng)前元數(shù)據(jù)記錄的當(dāng)前數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址并刪除當(dāng)前數(shù)據(jù)的存儲(chǔ)地址中的所述當(dāng)前數(shù)據(jù)。通過上述裝置,刪除系統(tǒng)中的垃圾數(shù)據(jù),提高系統(tǒng)存儲(chǔ)空間存儲(chǔ)率。進(jìn)一步的,如圖9所示,元數(shù)據(jù)更新單元69包括元數(shù)據(jù)更新子單元691,用于在將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表后,經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入 數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。本發(fā)明的一個(gè)實(shí)施例提供一種刪除重復(fù)數(shù)據(jù)的裝置,通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。通過上述裝置,記錄備份數(shù),增強(qiáng)數(shù)據(jù)可靠性。進(jìn)一步的,存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取對(duì)應(yīng)的刪除列表并將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,最后刪除所述輸入數(shù)據(jù),這樣方便對(duì)已經(jīng)執(zhí)行過刪除操作的數(shù)據(jù)的管理。此外,通過當(dāng)前元數(shù)據(jù)獲得當(dāng)前數(shù)據(jù)進(jìn)而得到第二哈希值,然后構(gòu)造第二數(shù)據(jù)信息,當(dāng)在系統(tǒng)中存在與所述第二數(shù)據(jù)信息相同的第三數(shù)據(jù)信息時(shí),獲得第三數(shù)據(jù)信息對(duì)應(yīng)的第三刪除列表。若所述第三刪除列表不存在當(dāng)前元數(shù)據(jù)記錄的文件名,則將所述當(dāng)前元數(shù)據(jù)記錄的當(dāng)前數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址并刪除當(dāng)前數(shù)據(jù)的存儲(chǔ)地址中的所述當(dāng)前數(shù)據(jù)。通過上述方法,刪除系統(tǒng)中的垃圾數(shù)據(jù),提高系統(tǒng)存儲(chǔ)空間存儲(chǔ)率。再者,所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表后,經(jīng)過預(yù)設(shè)定的時(shí)間段,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,克服了用戶上傳數(shù)據(jù)時(shí)進(jìn)行在線進(jìn)行刪除重復(fù)數(shù)據(jù)的操作,影響用戶體驗(yàn)和上傳后進(jìn)行刪除數(shù)據(jù)的操作,需要對(duì)全系統(tǒng)進(jìn)行掃描,增加系統(tǒng)開銷的問題,優(yōu)化了用戶體驗(yàn),加快運(yùn)行效率。本發(fā)明的一個(gè)實(shí)施例還提供了一種計(jì)算機(jī)系統(tǒng),如圖10所示,包括總線701,處理器702,存儲(chǔ)器703。其中,處理器702中包括上述提及的任意一種刪除重復(fù)數(shù)據(jù)的裝置。本發(fā)明的實(shí)施例提供一種計(jì)算機(jī)系統(tǒng),通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息。當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取對(duì)應(yīng)的刪除列表并將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,最后刪除所述輸入數(shù)據(jù)。通過上述裝置,克服了用戶上傳數(shù)據(jù)時(shí)進(jìn)行在線進(jìn)行刪除重復(fù)數(shù)據(jù)的操作,影響用戶體驗(yàn)和上傳后進(jìn)行刪除數(shù)據(jù)的操作,需要對(duì)全系統(tǒng)進(jìn)行掃描,增加系統(tǒng)開銷的問題,優(yōu)化了用戶體驗(yàn),加快運(yùn)行效率。通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在可讀取的存儲(chǔ)介質(zhì)中,如計(jì)算機(jī)的軟盤,硬盤或光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服 務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種刪除重復(fù)數(shù)據(jù)的方法,其特征在于,包括 獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù); 對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值; 建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù);判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù); 當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng);所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)記錄有所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址;根據(jù)所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的刪除列表;所述刪除列表記錄有被執(zhí)行過刪除動(dòng)作的所述已存儲(chǔ)數(shù)據(jù)的文件名; 將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,系統(tǒng)按照預(yù)設(shè)的周期遍歷系統(tǒng)中已存在的元數(shù)據(jù),包括 獲取系統(tǒng)中已存在的元數(shù)據(jù);所述系統(tǒng)中已存在的元數(shù)據(jù)記錄有所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù)、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名; 對(duì)所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)進(jìn)行哈希計(jì)算,得到第二哈希值; 構(gòu)造第二數(shù)據(jù)信息,所述第二數(shù)據(jù)信息包括所述第二哈希值,所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù); 判斷是否存在與所述第二數(shù)據(jù)信息相同的在系統(tǒng)中已存在的第三數(shù)據(jù)信息; 若存在,獲取所述第三數(shù)據(jù)信息對(duì)應(yīng)的第三狀態(tài)信息項(xiàng);所述第三狀態(tài)信息項(xiàng)記錄有所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址; 根據(jù)所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的第三刪除列表;所述第三刪除列表記錄有被執(zhí)行過刪除動(dòng)作的第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的文件名; 判斷是否在所述第三刪除列表存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名;若否,將所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址; 刪除所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,在刪除所述輸入數(shù)據(jù)前,還包括 將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址;所述元數(shù)據(jù)記錄有與元數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址、數(shù)據(jù)的副本數(shù)、數(shù)據(jù)的文件名。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,包括 在將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表后,經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。
6.一種刪除數(shù)據(jù)重復(fù)數(shù)據(jù)的裝置,其特征在于,包括 輸入數(shù)據(jù)獲取單元,用于獲取用戶的輸入數(shù)據(jù),以及用戶輸入的副本數(shù); 第一哈希單元,用于對(duì)所述輸入數(shù)據(jù)進(jìn)行哈希計(jì)算,得到哈希值; 數(shù)據(jù)信息建立單元,用于建立所述輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括所述哈希值,所述副本數(shù); 第一判斷單元,用于判斷是否存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息;所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)唯一的已存儲(chǔ)數(shù)據(jù); 輸入數(shù)據(jù)刪除單元,用于當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),刪除所述輸入數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括 狀態(tài)信息項(xiàng)獲取單元,用于當(dāng)存在與所述數(shù)據(jù)信息相同的已存儲(chǔ)數(shù)據(jù)信息時(shí),獲取所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng);所述已存儲(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的狀態(tài)信息項(xiàng)記錄有所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址; 刪除列表獲取單元,用于根據(jù)所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的刪除列表;所述刪除列表記錄有被執(zhí)行過刪除動(dòng)作的所述已存儲(chǔ)數(shù)據(jù)的文件名; 文件名添加單元,用于將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括 元數(shù)據(jù)獲取單元,用于獲取系統(tǒng)中已存在的元數(shù)據(jù);所述系統(tǒng)中已存在的元數(shù)據(jù)記錄有所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù)、所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名; 第二哈希單元,用于對(duì)所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)進(jìn)行哈希計(jì)算,得到第二哈希值; 第二數(shù)據(jù)信息建立單元,構(gòu)造第二數(shù)據(jù)信息,所述第二數(shù)據(jù)信息包括所述第二哈希值,所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的副本數(shù); 第二判斷單元,用于判斷是否存在與所述第二數(shù)據(jù)信息相同的在系統(tǒng)中已存在的第三數(shù)據(jù)信息; 第三狀態(tài)信息項(xiàng)獲取單元,用于當(dāng)存在與所述第二數(shù)據(jù)信息相同的第三數(shù)據(jù)信息時(shí),獲取所述第三數(shù)據(jù)信息對(duì)應(yīng)的第三狀態(tài)信息項(xiàng);所述第三狀態(tài)信息項(xiàng)記錄有所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址; 第三刪除列表獲取單元,用于根據(jù)所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址,獲取對(duì)應(yīng)的第三刪除列表;所述第三刪除列表記錄有被執(zhí)行過刪除動(dòng)作的第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的文件名; 第三判斷單元,用于判斷是否在所述第三刪除列表存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名; 存儲(chǔ)地址更新單元,用于當(dāng)在所述第三刪除列表不存在所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的文件名時(shí),將所述當(dāng)前元數(shù)據(jù)記錄的當(dāng)前數(shù)據(jù)的存儲(chǔ)地址更新為所述第三數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址;當(dāng)前數(shù)據(jù)刪除單元,用于刪除所述系統(tǒng)中已存在的元數(shù)據(jù)對(duì)應(yīng)數(shù)據(jù)的存儲(chǔ)地址中的數(shù)據(jù)。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括 元數(shù)據(jù)更新單元,用于在刪除所述輸入數(shù)據(jù)前,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址;所述元數(shù)據(jù)記錄有與元數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)地址、數(shù)據(jù)的副本數(shù)、數(shù)據(jù)的文件名。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述元數(shù)據(jù)更新單元,包括 元數(shù)據(jù)更新子單元,用于在將所述用戶輸入的數(shù)據(jù)的文件名加入所述刪除列表后,經(jīng)過預(yù)設(shè)定的時(shí)間段后,將所述輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述輸入數(shù)據(jù)的存儲(chǔ)地址變更為所述已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的所述已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址。
11.一種計(jì)算機(jī)系統(tǒng),其特征在于,包括 總線,與所述總線相連的處理器以及與所述總線相連的存儲(chǔ)器; 其中所述處理器包括權(quán)利要求6至10中任意一項(xiàng)所述的裝置。
全文摘要
本發(fā)明的實(shí)施例公開一種刪除重復(fù)數(shù)據(jù)的方法、裝置和系統(tǒng),涉及計(jì)算機(jī)領(lǐng)域,解決現(xiàn)有技術(shù)中數(shù)據(jù)可靠性低,垃圾數(shù)據(jù)多,系統(tǒng)開銷大的問題。一種刪除重復(fù)數(shù)據(jù)的方法,包括通過用戶輸入數(shù)據(jù)和需要存儲(chǔ)的副本數(shù)得到哈希值,進(jìn)而得到與輸入數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)信息和對(duì)應(yīng)的刪除列表,將用戶輸入數(shù)據(jù)的文件名加入所述刪除列表。然后將輸入數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的輸入數(shù)據(jù)的存儲(chǔ)地址變更為已存儲(chǔ)數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)記錄的已存儲(chǔ)數(shù)據(jù)的存儲(chǔ)地址,最后刪除所述輸入數(shù)據(jù)。本發(fā)明主要應(yīng)用于計(jì)算機(jī)系統(tǒng)中。
文檔編號(hào)G06F17/30GK102902762SQ20121036120
公開日2013年1月30日 申請(qǐng)日期2012年9月25日 優(yōu)先權(quán)日2012年9月25日
發(fā)明者鄭錫濤, 張輝, 戰(zhàn)宏亮, 韓明 申請(qǐng)人:華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1