專利名稱:一種節(jié)省存儲空間的多臺計算機系統(tǒng)共享備份方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對計算機系統(tǒng)數(shù)據(jù)進行克隆備份,特別是局域網(wǎng)內(nèi)計算機的系統(tǒng)數(shù)據(jù)備份。
背景技術(shù):
隨著計算機的發(fā)展,計算機系統(tǒng)安裝配置變得越來越復(fù)雜,同時,因計算機病毒,入侵,誤操作等,使系統(tǒng)及數(shù)據(jù)極易遭到破壞,重新安裝系統(tǒng),驅(qū)動,應(yīng)用程序等,既復(fù)雜又耗時,因此產(chǎn)生了一些對系統(tǒng)進行克隆備份的產(chǎn)品,在系統(tǒng)發(fā)生問題時,可直接由克隆備份時生成的數(shù)據(jù)映像對系統(tǒng)進行恢復(fù)。
在每臺計算機中,操作系統(tǒng)及應(yīng)用程序通常占用大量硬盤空間,一般在2-4GB左右,如果將每臺計算機中的以上數(shù)據(jù)都進行備份,需要巨大的網(wǎng)絡(luò)存儲空間,每臺計算機,每備份一個版本,都要占用相同的服務(wù)器存儲空間,所以目前產(chǎn)品,無法有效支持多人同時備份,以及多版本備份,不能實現(xiàn)簡單安全的系統(tǒng)管理。
發(fā)明內(nèi)容本發(fā)明目的是克服現(xiàn)有技術(shù)的不足,提供一種節(jié)省存儲空間的計算機系統(tǒng)備份方法,對多臺計算機,通過數(shù)據(jù)共享存放,實現(xiàn)系統(tǒng)數(shù)據(jù)多版本網(wǎng)絡(luò)備份,達到占用網(wǎng)絡(luò)存儲空間小,備份速度快的目的。
針對計算機中數(shù)據(jù)的特征,相同的操作系統(tǒng)及應(yīng)用程序,安裝在任何計算機中,其數(shù)據(jù)內(nèi)容大部分相同,僅有少量差異化數(shù)據(jù)。尤其在同一個單位(局域網(wǎng))內(nèi),計算機安裝的操作系統(tǒng)及應(yīng)用程序大致相同,差異化更小。因此,考慮到以上特征,如果能夠?qū)崿F(xiàn)數(shù)據(jù)共享存放的方式,將不同計算機中的相同的數(shù)據(jù),在服務(wù)器上僅需要保存一份,這樣可大大節(jié)省服務(wù)器硬盤空間,使多機,多版本備份成為可能。
計算機系統(tǒng)中,數(shù)據(jù)以文件方式存放,對相同的操作系統(tǒng)及應(yīng)用程序,在不同計算機中,絕大部份文件內(nèi)容相同。如果對這些計算機系統(tǒng)進行備份,相同文件僅需要存儲一份即可。但不同計算機中,文件名,大小均相同的文件,內(nèi)容不一定相同,且不同文件名的文件,內(nèi)容也可能完全相同,所以要實現(xiàn)共享存儲,第一個必要條件,是對每個文件的數(shù)據(jù),要有一個唯一區(qū)別的代碼(ID),如果兩個文件內(nèi)容完全相同,則此代碼相同,否則代碼一定不相同。此代碼可用文件大小加上文件內(nèi)容的MD5值表示,其中MD5為業(yè)內(nèi)通用標(biāo)準(zhǔn)算法,其結(jié)果與文件內(nèi)容的每一個字節(jié)相關(guān),對相同大小的數(shù)據(jù),可保證其結(jié)果的唯一性。
有了以上的文件ID,每個文件備份前,均進行計算,如果計算后該ID對應(yīng)的文件數(shù)據(jù)已經(jīng)存放在服務(wù)器上,則不再需要進行存儲,否則才將其傳輸存儲到服務(wù)器上。
一個文件的備份存儲方式如圖1所示,文件名稱為該文件的區(qū)別代碼ID,即原始大小以及內(nèi)容的MD5值,文件內(nèi)容為原始文件數(shù)據(jù)內(nèi)容,或壓縮后的數(shù)據(jù)內(nèi)容。
通過適當(dāng)?shù)奈募?biāo)示轉(zhuǎn)換,將備份文件名稱列表與數(shù)據(jù)文件分離,通過文件名,文件內(nèi)容ID建立關(guān)聯(lián),結(jié)構(gòu)如圖2所示。
對計算機1及計算機2,備份前,首先生成各自獨立的備份文件列表,然后將所有文件進行備份。在服務(wù)器上,保存有已經(jīng)備份過的所有文件的列表,以及所對應(yīng)的文件數(shù)據(jù)的存放位置。當(dāng)某臺計算機備份時,經(jīng)過比對文件數(shù)據(jù)內(nèi)容ID,如果所備份的文件在服務(wù)器上已經(jīng)存在,則不再需要備份存儲該文件,僅需紀錄該文件與其數(shù)據(jù)的對應(yīng)關(guān)系即可。
本發(fā)明的優(yōu)點和積極效果通過備份數(shù)據(jù)的共享,備份時大部份文件不需要實際發(fā)送到服務(wù)器,因此實現(xiàn)數(shù)據(jù)傳輸量的大幅降低,備份速度顯著提高,且對網(wǎng)絡(luò)帶寬的占用也顯著降低;通過應(yīng)用本發(fā)明,使多臺計算機系統(tǒng)備份成為可能,占用空間可降低到普通方式的十分之一或更少,備份效率大幅提升,有效解決了因系統(tǒng)損壞,誤操作,病毒侵害等造成的系統(tǒng)恢復(fù)問題。
圖1是文件的備份存儲方式結(jié)構(gòu)示意圖;圖2是備份文件名稱列表與數(shù)據(jù)文件對應(yīng)表及備份數(shù)據(jù)結(jié)構(gòu)關(guān)聯(lián)示意圖;圖3是一臺計算機具體的系統(tǒng)備份流程示意圖。
具體實施方式實施例如圖3所示,為一臺計算機的系統(tǒng)備份流程示意圖,具體流程說明如下3-1備份開始,逐一讀取需要備份的文件;3-2依據(jù)文件大小,以及文件內(nèi)容所計算出的MD5值,構(gòu)成該文件的ID;3-3將該ID發(fā)送至服務(wù)器,進行查詢,檢查該文件是否已經(jīng)備份過;3-4如果未備份,則將該文件數(shù)據(jù)發(fā)送至服務(wù)器,進行備份;3-5將該文件及其ID對應(yīng)的數(shù)據(jù)文件,加入到備份列表;3-6檢查是否所有文件備份完成,未完成,讀取下一個文件,進行備份;3-7全部完成,結(jié)束。
具體應(yīng)用對比實例下面以共享備份系統(tǒng)(ezDRP),對本發(fā)明的實施效果進行說明。
普通計算機中,操作系統(tǒng)及應(yīng)用程序,以安裝Windows XP系統(tǒng),Office等工具軟件為例,通常占用3GB左右數(shù)據(jù)空間。不同計算機中,以上系統(tǒng)及應(yīng)用程序所包含文件完全相同的比例,約為90-95%,即相同文件約為2.8GB以上。
在對以上典型配置的計算機系統(tǒng)進行備份時,單臺計算機,就需要備份3GB數(shù)據(jù)到服務(wù)器上。假設(shè)一個單位內(nèi)有20臺計算機,要實現(xiàn)對全部計算機系統(tǒng)進行備份,則需要備份約60GB數(shù)據(jù),占用大量服務(wù)器存儲空間,且如果要進行多版本備份,則每個版本,都要再備份3GB數(shù)據(jù)。
而采用本發(fā)明的方法,快速甄別出不同計算機中的相同文件,將該文件僅保存一份,按照以上情況,備份全部20臺計算機系統(tǒng),僅需要備份2.8+0.2*20=6.8GB,備份數(shù)據(jù)僅為普通方式的11%左右,節(jié)省大量存儲空間。并且因此可實現(xiàn)多版本備份,每臺計算機增加一個備份版本,僅最多增加約0.2G備份數(shù)據(jù)。
權(quán)利要求
1.一種節(jié)省存儲空間的多臺計算機系統(tǒng)共享備份方法,其特征是該方法按照以下步驟完成第一、對各備份文件給出一個唯一確定的區(qū)別代碼ID;第二、將備份文件的數(shù)據(jù)內(nèi)容與區(qū)別代碼ID建立關(guān)聯(lián),建立一個數(shù)據(jù)內(nèi)容列表,并將數(shù)據(jù)內(nèi)容與數(shù)據(jù)內(nèi)容列表存儲在服務(wù)器上;第三、將備份文件名稱與區(qū)別代碼ID建立關(guān)聯(lián),并在服務(wù)器上建立一個包含備份文件名稱與區(qū)別代碼ID的備份文件對應(yīng)列表。
2.根據(jù)權(quán)利要求1所述的一種節(jié)省存儲空間的多臺計算機系統(tǒng)共享備份方法,其特征是唯一確定的區(qū)別代碼ID可用文件大小加上文件內(nèi)容的MD5值表示。
全文摘要
一種節(jié)省存儲空間的多臺計算機系統(tǒng)共享備份方法。本發(fā)明首先對每個文件的數(shù)據(jù),給出一個唯一區(qū)別的代碼(ID),此代碼可用文件大小加上文件內(nèi)容的MD5值表示。然后將備份文件的數(shù)據(jù)內(nèi)容與區(qū)別代碼ID建立關(guān)聯(lián),建立一個數(shù)據(jù)內(nèi)容列表,并將數(shù)據(jù)內(nèi)容與數(shù)據(jù)內(nèi)容列表存儲在服務(wù)器上;同時在服務(wù)器上建立一個包含備份文件名稱與區(qū)別代碼ID的備份文件對應(yīng)列表。當(dāng)某臺計算機備份時,如果所備份的文件已經(jīng)存在,則不再需要備份存儲該文件,僅需紀錄該文件與其數(shù)據(jù)的對應(yīng)關(guān)系即可。通過應(yīng)用本發(fā)明,使多臺計算機系統(tǒng)備份成為可能,占用空間可降低到普通方式的十分之一或更少,備份效率大幅提升,有效解決了因系統(tǒng)損壞,誤操作,病毒侵害等造成的系統(tǒng)恢復(fù)問題。
文檔編號G06F11/20GK1595366SQ20041001988
公開日2005年3月16日 申請日期2004年7月6日 優(yōu)先權(quán)日2004年7月6日
發(fā)明者盧鳳順 申請人:天津百維軟件科技有限公司