專利名稱:一種文件處理方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文件處理技術(shù)領(lǐng)域,尤其涉及一種文件處理方法和一種文件處理系統(tǒng)。
背景技術(shù):
現(xiàn)有的根據(jù)兩個文件內(nèi)容是否相同來執(zhí)行處理操作的方法多數(shù)為采用“逐字節(jié) (位)順序比較法”來進行文件內(nèi)容的比較,即將兩個文件的內(nèi)容讀取出來,然后順序地對其字節(jié)(位)進行逐個比較,如果有一個字節(jié)(位)不同,則兩個文件的內(nèi)容不同,執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作。如果所有的字節(jié)(位)均相同,則兩個文件的內(nèi)容相同,并執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作?!爸鹱止?jié)(位)順序比較法”雖然準確率高,但是算法效率非常低下、耗費時間長,特別是如果兩個內(nèi)容相同的文件具有海量數(shù)據(jù)的話,例如文件大于1G,那么在執(zhí)行處理操作之前對兩個文件內(nèi)容是否相同進行比較將需要花費非常大量的時間。
發(fā)明內(nèi)容
為解決上述存在的問題,本發(fā)明公開了一種文件處理方法和系統(tǒng),在比較擁有大量甚至是海量數(shù)據(jù)的兩個文件其內(nèi)容是否相同,并根據(jù)兩個文件內(nèi)容是否相同來執(zhí)行相應(yīng)操作時更具優(yōu)勢。一種文件處理方法,包括以下步驟獲取兩個文件中數(shù)據(jù)的長度;如果兩個文件中數(shù)據(jù)的長度不相同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作;如果兩個文件中數(shù)據(jù)的長度相同,則以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;在兩個文件中的相同位置,各獲取預設(shè)數(shù)目個數(shù)據(jù)組;對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較,如果有位置相同的數(shù)據(jù)組其數(shù)據(jù)內(nèi)容不同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作,否則,執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作。與現(xiàn)有技術(shù)相比,特別是與現(xiàn)有文件處理方法中采用的“逐字節(jié)(位)順序比較法”相比,本發(fā)明所提供的文件處理方法具有以下優(yōu)點第一,快速,特別是對兩個具有海量數(shù)據(jù)并且文件內(nèi)容相類似的文件執(zhí)行處理操作時,由于對兩個文件的比較速度大幅提高, 因此效率遠遠大于采用“逐字節(jié)順序比較法”的現(xiàn)有文件處理方法;第二,準確率高、靈活性強,通過數(shù)學計算,本發(fā)明的文件處理方法在保證了高效率的前提下準確率很高,并且由于預設(shè)分組長度和進行比較的數(shù)據(jù)組數(shù)目由用戶來設(shè)定,因此可根據(jù)實際環(huán)境,對不同的比較參數(shù)進行靈活設(shè)置以同時滿足高效率和高準確率的要求。一種文件處理系統(tǒng),包括文件長度獲取模塊、數(shù)據(jù)組劃分模塊、數(shù)據(jù)組獲取模塊、
4數(shù)據(jù)組比較模塊和處理操作執(zhí)行模塊;所述文件長度獲取模塊,用于獲取兩個文件中數(shù)據(jù)的長度并進行比較;所述數(shù)據(jù)組劃分模塊,用于在兩個文件中數(shù)據(jù)的長度相同時,以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;所述數(shù)據(jù)組獲取模塊,用于在兩個文件中的相同位置分別獲取預設(shè)數(shù)目個數(shù)據(jù)組;所述數(shù)據(jù)組比較模塊,用于對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較;所述處理操作執(zhí)行模塊,用于執(zhí)行兩個文件內(nèi)容相同或者不相同時所對應(yīng)的處理操作。與現(xiàn)有技術(shù)相比,特別是與現(xiàn)有文件處理系統(tǒng)中采用的“逐字節(jié)(位)順序比較法”相比,本發(fā)明所提供的文件處理系統(tǒng)具有快速、準確率高和靈活性強的優(yōu)點,尤其適用于對具有海量數(shù)據(jù)的兩個文件的內(nèi)容進行比較,并根據(jù)兩個文件內(nèi)容是否相同來執(zhí)行處理操作。
圖1是本發(fā)明文件處理方法的示意流程圖;圖2是實施例在復制操作中使用本發(fā)明文件處理方法的示意流程圖;圖3是本發(fā)明文件處理系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式為更進一步闡述本發(fā)明所采取的技術(shù)手段及取得的效果,下面結(jié)合附圖及較佳實施例,對本發(fā)明所提出的文件處理方法和系統(tǒng)的技術(shù)方案,進行清楚和完整的描述。請參閱圖1,本發(fā)明文件處理方法的示意流程圖。本發(fā)明文件處理方法包括以下步驟SlOl獲取兩個文件中數(shù)據(jù)的長度;S102如果兩個文件中數(shù)據(jù)的長度不相同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處
理操作;S103如果兩個文件中數(shù)據(jù)的長度相同,則以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;S104在兩個文件中的相同位置,分別獲取預設(shè)數(shù)目個數(shù)據(jù)組;S105對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較,如果有位置相同的數(shù)據(jù)組其數(shù)據(jù)內(nèi)容不同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作,否則,執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作。本發(fā)明所提供的文件處理方法具有以下優(yōu)點第一,快速,特別是對兩個具有海量數(shù)據(jù)并且文件內(nèi)容相類似的文件執(zhí)行處理操作時,由于對兩個文件的比較速度大幅提高, 因此效率遠遠大于采用“逐字節(jié)順序比較法”的現(xiàn)有文件處理方法;第二,準確率高、靈活性強,通過數(shù)學計算,本發(fā)明的文件處理方法在保證了高效率的前提下準確率很高,并且由于預設(shè)分組長度和進行比較的數(shù)據(jù)組數(shù)目由用戶來設(shè)定,因此可根據(jù)實際環(huán)境,對不同的比較參數(shù)進行靈活設(shè)置以同時滿足高效率和高準確率的要求。
當需要復制一個或多個文件到一個文件目錄下時,如果發(fā)現(xiàn)當前文件目錄下已經(jīng)存在相同文件名的文件,那么可以使用本發(fā)明所提供的文件處理方法對兩個文件名相同的文件進行比較,如果兩個文件內(nèi)容相同,不執(zhí)行復制操作,如果文件內(nèi)容不同,則重新命名新的目的文件名再執(zhí)行復制操作。優(yōu)選的,以上述在復制操作中出現(xiàn)相同文件名文件的情況作為具體實施例,對本發(fā)明所提供的文件處理方法做更具體的描述。SlOl獲取兩個文件中數(shù)據(jù)的長度;獲取被復制文件(又稱源文件)的完整路徑與文件名,確定存放源文件的目的文件目錄。檢索目的文件目錄中是否存在與源文件同名的文件,如果不存在,則將源文件復制到目的文件目錄中。如果在目的文件目錄中存在與源文件同名的文件(又稱目的文件),則打開同文件名的源文件與目的文件,返回指向文件的指針,將指針置于這兩個文件的最后位置,分別獲取兩個文件中數(shù)據(jù)的長度。S102如果兩個文件中數(shù)據(jù)的長度不相同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處
理操作;如果源文件與目的文件中數(shù)據(jù)的長度不相同,那么同文件名的源文件與目的文件的內(nèi)容不相同,則重新命名新的目的文件名再將源文件復制到目的文件目錄。S103如果兩個文件中數(shù)據(jù)的長度相同,則以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;如果源文件與目的文件中數(shù)據(jù)的長度相同,則對文件進行分組。由用戶設(shè)定預設(shè)分組長度n,預設(shè)分組長度η大于0并且小于源文件和目的文件中數(shù)據(jù)的長度,按照文件中數(shù)據(jù)的位置,可將源文件和目的文件的內(nèi)容被劃分為N個數(shù)據(jù)組。優(yōu)選的,按照文件中數(shù)據(jù)的前后位置,將源文件和目的文件的內(nèi)容等分為N個數(shù)據(jù)組,這樣在對兩個文件內(nèi)容進行比較時可提高效率。S104在兩個文件中的相同位置,分別獲取預設(shè)數(shù)目個數(shù)據(jù)組;在0至N的數(shù)值范圍內(nèi)隨機選取一個整數(shù)隨機數(shù)X,即χ為大于0并且小于或者等于N的整數(shù)。選取隨機數(shù)χ后,搜索隨機數(shù)存儲數(shù)組RandData,其中,隨機數(shù)存儲數(shù)組RandData 是用來保存已選取的隨機數(shù)χ數(shù)值的數(shù)組。如果隨機數(shù)存儲數(shù)組RandData中已經(jīng)存在與選取的隨機數(shù)χ相同的數(shù)值,則重新隨機選取隨機數(shù)χ ;如果隨機數(shù)存儲數(shù)組RandData中不存在與隨機數(shù)χ相同的數(shù)值,則將隨機數(shù)χ的數(shù)值存儲到隨機數(shù)存儲數(shù)組RandData中。在選取隨機數(shù)χ完后,將指向文件的指針置于源文件和目的文件中的第χ個數(shù)據(jù)組的起始位置,分別讀取源文件和目的文件中相同位置上對應(yīng)于所選取隨機數(shù)χ的數(shù)據(jù)組的數(shù)據(jù),并保存到二維數(shù)組Data中,Data
[η]存儲從源文件數(shù)據(jù)組中讀取的內(nèi)容, Data[l][n]存儲從目的文件數(shù)據(jù)組中讀取的內(nèi)容。由上述可知,本發(fā)明中獲取數(shù)據(jù)組的方式是隨機的。在每次獲取到一個隨機數(shù)X,進而獲取到源文件和目標文件中對應(yīng)位置上的數(shù)據(jù)組之后,執(zhí)行步驟S105。
S105對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較,如果有位置相同的數(shù)據(jù)組其數(shù)據(jù)內(nèi)容不同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作,否則,執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作。在步驟S104分別從源文件和目標文件中相同位置上獲取到一個數(shù)據(jù)組并保存到二維數(shù)組Data中之后,采用逐字節(jié)順序比較的方法,比較Data
[η]和Data[l][n]中分別保存的數(shù)據(jù)內(nèi)容是否完全相同,也即分別比較從源文件和目的文件中獲取的數(shù)據(jù)組的內(nèi)容是否完全相同,并記錄對Data
[η]和Data[l] [η]進行比較的次數(shù)Count。如果Data
[η]和Data[1] [η]中的內(nèi)容不同,則同文件名的源文件與目的文件的內(nèi)容不相同。如果Data
[η]和Data[l] [η]中的內(nèi)容相同,再對數(shù)組比較次數(shù)Count與獲取數(shù)據(jù)組的個數(shù),也即預設(shè)數(shù)目m進行比較,如果數(shù)組比較次數(shù)Count小于預設(shè)數(shù)目m,則重復執(zhí)行步驟S104;如果數(shù)組比較次數(shù)Count大于或者等于預設(shè)數(shù)目m,則兩個文件內(nèi)容相同。 其中,所述預設(shè)數(shù)目m是由用戶設(shè)定的,并且預設(shè)數(shù)目m小于步驟S103中所劃分的數(shù)據(jù)組的數(shù)目。文件內(nèi)容比較結(jié)束后,關(guān)閉源文件和目的文件。返回文件內(nèi)容比較結(jié)果,若兩個文件內(nèi)容相同,則不執(zhí)行復制操作,若文件內(nèi)容不同,則重新命名新的目的文件名再將源文件復制到目的文件目錄。由上述步驟S104和S105的描述可知,本實施例中從源文件和目的文件中分別獲取到的預設(shè)數(shù)目m個數(shù)據(jù)組是不重復的,當獲取到與已獲取的數(shù)據(jù)組重復的數(shù)據(jù)組時,需重新獲取數(shù)據(jù)組。并且,對獲取到的各個不同位置上的源文件和目的文件中的數(shù)據(jù)組,采取了逐個位置進行比較的方法。請參閱圖2,是實施例在復制操作中使用本發(fā)明文件處理方法的示意流程圖。對上述在復制操作中出現(xiàn)相同文件名文件時,使用本發(fā)明所提供的文件處理方法做了更直觀地描述。本發(fā)明所提供的文件處理方法,使用了統(tǒng)計學里隨機抽樣中的“等距隨機抽樣法”,在隨機抽樣比較的基礎(chǔ)上兼有順序比較的特點,用于比較大量甚至海量數(shù)據(jù)的文件時,更為方便,具有效率高、準確率高和靈活性強的優(yōu)點。優(yōu)選的,以上述在復制操作中出現(xiàn)相同文件名文件的情況作為具體實施例,對本發(fā)明所提供的文件處理系統(tǒng)做更具體的描述。請參閱圖3,本發(fā)明文件處理系統(tǒng)的結(jié)構(gòu)示意圖。本發(fā)明文件處理系統(tǒng)包括文件長度獲取模塊301、數(shù)據(jù)組劃分模塊302、數(shù)據(jù)組獲取模塊303、數(shù)據(jù)組比較模塊304和處理操作執(zhí)行模塊305 ;所述文件長度獲取模塊301,用于獲取兩個文件中數(shù)據(jù)的長度并進行比較;打開同文件名的源文件與目的文件,返回指向文件的指針,將指針置于這兩個文件的最后位置,所述文件長度獲取模塊301分別獲取兩個文件中數(shù)據(jù)的長度。如果源文件與目的文件中數(shù)據(jù)的長度不相同,那么同文件名的源文件與目的文件的內(nèi)容不相同。所述數(shù)據(jù)組劃分模塊302,用于在兩個文件中數(shù)據(jù)的長度相同時,以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;
如果源文件與目的文件中數(shù)據(jù)的長度相同,則所述數(shù)據(jù)組劃分模塊302對文件進行分組。由用戶設(shè)定預設(shè)分組長度n,預設(shè)分組長度η大于0并且小于源文件和目的文件中數(shù)據(jù)的長度,按照文件中數(shù)據(jù)的位置,優(yōu)選的,將源文件和目的文件的內(nèi)容等分為N個數(shù)據(jù)組,這樣在對兩個文件內(nèi)容進行比較時可提高效率。所述數(shù)據(jù)組獲取模塊303,用于在兩個文件中的相同位置分別獲取預設(shè)數(shù)目個數(shù)據(jù)組;所述數(shù)據(jù)組獲取模塊303在0至N的數(shù)值范圍內(nèi)隨機選取一個整數(shù)隨機數(shù)X,即χ 為大于0并且小于或者等于N的整數(shù)。選取隨機數(shù)χ后,搜索隨機數(shù)存儲數(shù)組RandData,如果數(shù)組RandData中已經(jīng)存在與隨機數(shù)X相同的數(shù)值,則所述數(shù)據(jù)組獲取模塊303重新隨機選取隨機數(shù)X ;如果數(shù)組 RandData中不存在與隨機數(shù)χ相同的數(shù)值,則所述數(shù)據(jù)組獲取模塊303將隨機數(shù)χ的數(shù)值存儲到隨機數(shù)存儲數(shù)組RandData中。所述數(shù)據(jù)組獲取模塊303在選取隨機數(shù)χ完后,將指向文件的指針置于源文件和目的文件中的第X個數(shù)據(jù)組的起始位置,分別讀取源文件和目的文件中相同位置上對應(yīng)于所選取隨機數(shù)X的數(shù)據(jù)組的數(shù)據(jù),并保存到二維數(shù)組Data中。所述數(shù)據(jù)組獲取模塊303重新選取隨機數(shù)χ并分別獲取源文件和目的文件中相同位置上對應(yīng)于所重新選取的隨機數(shù)χ的數(shù)據(jù)組,直到在源文件和目的文件中的相同位置上分別獲取到預設(shè)數(shù)目m個數(shù)據(jù)組。所述數(shù)據(jù)組比較模塊304,用于對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較;從源文件和目標文件中相同位置上獲取到一個數(shù)據(jù)組并保存到二維數(shù)組Data中之后,所述數(shù)據(jù)組比較模塊304采用逐字節(jié)順序比較的方法,分別比較從源文件和目的文件中獲取的數(shù)據(jù)組的內(nèi)容是否完全相同,并記錄對Data
[η]和Data[l] [η]進行比較的次數(shù)Count。如果DataW] [η]和Data[1] [η]中的內(nèi)容不同,則同文件名的源文件與目的文件的內(nèi)容不相同。如果DataW][n]和Data[l][n]中的內(nèi)容相同,所述數(shù)據(jù)組比較模塊304 再對數(shù)組比較次數(shù)Count與獲取數(shù)據(jù)組的個數(shù),也即預設(shè)數(shù)目m進行比較,如果數(shù)組比較次數(shù)Count小于預設(shè)數(shù)目m,則所述數(shù)據(jù)組獲取模塊303重新選取隨機數(shù)χ并分別獲取源文件和目的文件中相同位置上對應(yīng)于所重新選取的隨機數(shù)χ的數(shù)據(jù)組,所述數(shù)據(jù)組比較模塊 304按上述步驟對重新獲取的數(shù)據(jù)組進行重新比較。如果重新比較后,Data
[η]和Data[l][n]中的內(nèi)容相同,并且數(shù)組比較次數(shù) Count大于或者等于預設(shè)數(shù)目m,則同文件名的源文件與目的文件的內(nèi)容相同。所述處理操作執(zhí)行模塊305,用于執(zhí)行兩個文件內(nèi)容相同或者不相同時所對應(yīng)的處理操作。根據(jù)返回的源文件和目的文件內(nèi)容比較的結(jié)果,若兩個文件內(nèi)容相同,則所述處理操作執(zhí)行模塊305不執(zhí)行復制操作,若兩個文件內(nèi)容不同,則所述處理操作執(zhí)行模塊305 重新命名新的目的文件名再將源文件復制到目的文件目錄。本發(fā)明所提供的文件處理系統(tǒng)具有快速、準確率高和靈活性強的優(yōu)點,尤其適用于對具有海量數(shù)據(jù)的兩個文件的內(nèi)容進行比較,并根據(jù)兩個文件內(nèi)容是否相同來執(zhí)行處理操作。 以上所述的本發(fā)明實施方式,并不構(gòu)成對本發(fā)明保護范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的權(quán)利要求保護范圍之內(nèi)。
權(quán)利要求
1.一種文件處理方法,其特征在于,包括以下步驟 獲取兩個文件中數(shù)據(jù)的長度;如果兩個文件中數(shù)據(jù)的長度不相同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作; 如果兩個文件中數(shù)據(jù)的長度相同,則以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;在兩個文件中的相同位置,各獲取預設(shè)數(shù)目個數(shù)據(jù)組;對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較,如果有位置相同的數(shù)據(jù)組其數(shù)據(jù)內(nèi)容不同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作,否則,執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作。
2.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述獲取兩個文件中數(shù)據(jù)的長度的步驟中,包括以下步驟打開兩個文件; 返回指向文件的指針;將指向文件的指針置于兩個文件最后的位置; 分別獲取兩個文件中數(shù)據(jù)的長度。
3.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組的步驟中,采取了將兩個文件的內(nèi)容等分為若干數(shù)據(jù)組的方法。
4.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組的步驟中,所述預設(shè)分組長度是用戶設(shè)定的,并且所述預設(shè)分組長度小于所述文件中數(shù)據(jù)的長度。
5.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述獲取預設(shè)數(shù)目個數(shù)據(jù)組的步驟中,所述預設(shè)數(shù)目是用戶設(shè)定的,并且所述預設(shè)數(shù)目小于所述劃分的數(shù)據(jù)組的數(shù)目。
6.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述獲取預設(shè)數(shù)目個數(shù)據(jù)組的步驟中,當獲取到與已獲取的數(shù)據(jù)組重復的數(shù)據(jù)組時,需重新獲取數(shù)據(jù)組。
7.如權(quán)利要求1所述的文件處理方法,其特征在于,所述獲取預設(shè)數(shù)目個數(shù)據(jù)組的步驟,包括以下步驟在所述劃分的數(shù)據(jù)組的數(shù)目范圍內(nèi)隨機選取一個整數(shù)隨機數(shù)χ ; 選取所述整數(shù)隨機數(shù)χ后,搜索隨機數(shù)存儲數(shù)組,其中,所述隨機數(shù)存儲數(shù)組是用來保存已選取的隨機數(shù)X數(shù)值的數(shù)組,如果所述隨機數(shù)存儲數(shù)組中已存在與選取的隨機數(shù)X相同的數(shù)值,則重新隨機選取隨機數(shù)X;如果所述隨機數(shù)存儲數(shù)組中不存在與選取的隨機數(shù)X 相同的數(shù)值,則將選取的隨機數(shù)X的數(shù)值添加到隨機數(shù)存儲數(shù)組中;在選取完隨機數(shù)X后,將指向文件的指針置于兩個文件中的第X個數(shù)據(jù)組的起始位置, 分別獲取兩個文件中相同位置上對應(yīng)于所選取隨機數(shù)X的數(shù)據(jù)組;重新選取隨機數(shù)并分別獲取兩個文件中相同位置上對應(yīng)于所重新選取的隨機數(shù)的數(shù)據(jù)組,直到在兩個文件中的相同位置上分別獲取到預設(shè)數(shù)目個數(shù)據(jù)組。
8.如權(quán)利要求1所述的文件處理方法,其特征在于,在所述對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較的步驟中,采取了逐字節(jié)順序比較的方法。
9.一種文件處理系統(tǒng),其特征在于,包括文件長度獲取模塊、數(shù)據(jù)組劃分模塊、數(shù)據(jù)組獲取模塊、數(shù)據(jù)組比較模塊和處理操作執(zhí)行模塊;所述文件長度獲取模塊,用于獲取兩個文件中數(shù)據(jù)的長度并進行比較; 所述數(shù)據(jù)組劃分模塊,用于在兩個文件中數(shù)據(jù)的長度相同時,以預設(shè)分組長度為分組單位,按照文件中數(shù)據(jù)的位置,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;所述數(shù)據(jù)組獲取模塊,用于在兩個文件中的相同位置分別獲取預設(shè)數(shù)目個數(shù)據(jù)組; 所述數(shù)據(jù)組比較模塊,用于對獲取的兩個文件中位置相同的數(shù)據(jù)組進行比較; 所述處理操作執(zhí)行模塊,用于執(zhí)行兩個文件內(nèi)容相同或者不相同時所對應(yīng)的處理操作。
全文摘要
本發(fā)明公開了一種文件處理方法,包括獲取兩個文件中數(shù)據(jù)的長度;如果數(shù)據(jù)長度不相同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作;如果數(shù)據(jù)長度相同,則以預設(shè)分組長度為分組單位,將兩個文件的內(nèi)容劃分為若干數(shù)據(jù)組;在兩個文件中的相同位置,分別獲取預設(shè)數(shù)目個數(shù)據(jù)組;對獲取的數(shù)據(jù)組進行比較,如果有位置相同的數(shù)據(jù)組其數(shù)據(jù)內(nèi)容不同,則執(zhí)行兩個文件內(nèi)容不相同所對應(yīng)的處理操作,否則,執(zhí)行兩個文件內(nèi)容相同所對應(yīng)的處理操作。此外,還公開了一種文件處理系統(tǒng),包括文件長度獲取模塊、數(shù)據(jù)組劃分模塊、數(shù)據(jù)組獲取模塊、數(shù)據(jù)組比較模塊和處理操作執(zhí)行模塊。本發(fā)明文件處理方法和系統(tǒng),具有效率高、準確率高和靈活性強的優(yōu)點。
文檔編號G06F17/30GK102541991SQ20111036112
公開日2012年7月4日 申請日期2011年11月14日 優(yōu)先權(quán)日2011年11月14日
發(fā)明者胡建華, 黃寶華 申請人:廣東威創(chuàng)視訊科技股份有限公司