一種數(shù)據(jù)對比方法及裝置的制造方法
【專利摘要】本申請實施例公開了一種數(shù)據(jù)對比方法及裝置,該方法包括:獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,以檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。本申請實施例的數(shù)據(jù)對比方法及裝置,能夠準(zhǔn)確的判斷不同數(shù)據(jù)表中的數(shù)據(jù)是否一致。
【專利說明】
-種數(shù)據(jù)對比方法及裝置
技術(shù)領(lǐng)域
[0001] 本申請涉及計算機技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)對比方法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)數(shù)據(jù)的日益增長,數(shù)據(jù)表中的數(shù)據(jù)量也在逐漸遞增,目前一張數(shù)據(jù)表 的數(shù)據(jù)量有可能達到了8燈6'油7*6太字節(jié))、口8任6*油八6,拍字節(jié))級別。在一些情況下, 需要將一張數(shù)據(jù)表中的海量數(shù)據(jù)遷移到另一張數(shù)據(jù)表中。海量數(shù)據(jù)在遷移過程中容易出現(xiàn) 差錯,例如部分數(shù)據(jù)丟失或部分數(shù)據(jù)的值出現(xiàn)差錯等。因此,在數(shù)據(jù)遷移之后,需要對兩張 數(shù)據(jù)表中的數(shù)據(jù)進行對比,W確保遷移前后數(shù)據(jù)保持一致。
[0003] 現(xiàn)有技術(shù)中,通常采用統(tǒng)計分析的方法對比兩張數(shù)據(jù)表中的數(shù)據(jù)。例如,分別統(tǒng)計 兩張數(shù)據(jù)表相同字段數(shù)據(jù)的平均值(還可W是最大值、最小值、中位數(shù)等),然后將兩張數(shù) 據(jù)表的平均值進行對比。若平均值相同,則認為兩張數(shù)據(jù)表中的數(shù)據(jù)一致,若平均值不相 同,則認為兩張數(shù)據(jù)表中的數(shù)據(jù)不一致。
[0004] 但是,上述采用統(tǒng)計分析的方法對比兩張數(shù)據(jù)表中的數(shù)據(jù),并不能夠準(zhǔn)確的反映 出兩張數(shù)據(jù)表中數(shù)據(jù)的一致性。例如,一張數(shù)據(jù)表中某一字段的兩個數(shù)據(jù)分別為1500和 500,另一張數(shù)據(jù)表中該字段的兩個數(shù)據(jù)均為1000。分別計算兩張數(shù)據(jù)表該字段數(shù)據(jù)的平均 值。得到兩張數(shù)據(jù)表的平均值均為1000。由此認為兩張數(shù)據(jù)表中的數(shù)據(jù)一致。但是,兩張 數(shù)據(jù)表中的數(shù)據(jù)并不相同。
【發(fā)明內(nèi)容】
[0005] 本申請實施例的目的在于提供一種數(shù)據(jù)對比方法及裝置,W準(zhǔn)確的判斷不同數(shù)據(jù) 表中的數(shù)據(jù)是否一致。
[0006] 為解決上述技術(shù)問題,本申請實施例提供的一種數(shù)據(jù)對比方法及裝置是送樣實現(xiàn) 的:
[0007] -種數(shù)據(jù)對比方法,包括:
[0008] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0009] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0010] 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比, W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0011] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。
[0012] 另一種數(shù)據(jù)對比方法,包括:
[0013] 獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0014] 獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、 每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0015] 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0016] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0017] 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比, W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0018] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是否一致。
[0019] 另一種數(shù)據(jù)對比方法,包括:
[0020] 獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0021] 獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每 個字段的名稱和每個字段的數(shù)據(jù)類型;
[0022] 獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括字段的數(shù)量、每 個字段的名稱和每個字段的數(shù)據(jù)類型;
[0023] 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件中的數(shù)據(jù)保存至 第二數(shù)據(jù)表中;
[0024] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0025] 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比, W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0026] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致。
[0027] 另一種數(shù)據(jù)對比方法,包括:
[0028] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0029] 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域;
[0030] 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和 所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0031] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0032] 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,W檢 測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0033] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。
[0034] 另一種數(shù)據(jù)對比方法,包括:
[0035] 獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0036] 獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、 每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0037] 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0038] 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域;
[0039] 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和 所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0040] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0041] 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,W檢 測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0042] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。
[0043] 另一種數(shù)據(jù)對比方法,包括:
[0044] 獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0045] 獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每 個字段的名稱和每個字段的數(shù)據(jù)類型;
[0046] 獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括字段的數(shù)量、每 個字段的名稱和每個字段的數(shù)據(jù)類型;
[0047] 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件中的數(shù)據(jù)保存至 第二數(shù)據(jù)表中;
[0048] 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域;
[0049] 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和 所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0050] 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0051] 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,W檢 測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0052] 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。
[0053] -種數(shù)據(jù)對比裝置,包括:
[0054] 第一獲取模塊,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0055] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0056] 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字 段的數(shù)據(jù)進行對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0057] 第一判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否 一致。
[005引另一種數(shù)據(jù)對比裝置,包括:
[0059] 第二獲取模塊,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0060] 第一建立模塊,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參 數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0061] 第一保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0062] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0063] 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字 段的數(shù)據(jù)進行對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0064] 第二判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是 否一致。
[0065] 另一種數(shù)據(jù)對比裝置,包括:
[0066] 第Η獲取模塊,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0067] 第二建立模塊,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù) 包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0068] 第Η建立模塊,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù) 包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0069] 第二保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù) 文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0070] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0071] 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字 段的數(shù)據(jù)進行對比,w檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0072] 第Η判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù) 是否一致。
[0073] 另一種數(shù)據(jù)對比裝置,包括:
[0074] 第一獲取模塊,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0075] 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中 的數(shù)據(jù)分成不同的區(qū)域;
[0076] 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū) 域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0077] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0078] 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共 有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0079] 第四判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的數(shù)據(jù)不 一致。
[0080] 另一種數(shù)據(jù)對比裝置,包括:
[0081] 第二獲取模塊,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0082] 第一建立模塊,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參 數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0083] 第一保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0084] 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中 的數(shù)據(jù)分成不同的區(qū)域;
[0085] 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū) 域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0086] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0087] 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共 有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0088] 第五判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不 一致。
[0089] 另一種數(shù)據(jù)對比裝置,包括:
[0090] 第Η獲取模塊,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0091] 第二建立模塊,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù) 包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0092] 第Η建立模塊,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù) 包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0093] 第二保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù) 文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0094] 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中 的數(shù)據(jù)分成不同的區(qū)域;
[0095] 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū) 域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0096] 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0097] 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共 有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0098] 第六判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù) 不一致。
[0099] 由W上本申請實施例提供的技術(shù)方案可見,本申請實施例通過將第一數(shù)據(jù)表每個 記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,從而判斷第一數(shù)據(jù)表和第二 數(shù)據(jù)表中的數(shù)據(jù)是否一致。與現(xiàn)有技術(shù)相比,由于本申請實施例將兩張數(shù)據(jù)表中的數(shù)據(jù)進 行了一一對比,因而能夠檢測出兩張數(shù)據(jù)表之間是否存在差異數(shù)據(jù),從而準(zhǔn)確的判斷不同 數(shù)據(jù)表中的數(shù)據(jù)是否一致。
【附圖說明】
[0100] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 申請中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提 下,還可W根據(jù)送些附圖獲得其他的附圖。
[0101] 圖1是本申請實施例中一種數(shù)據(jù)對比方法的流程示意圖;
[0102] 圖2是本申請實施例中另一種數(shù)據(jù)對比方法的流程示意圖;
[0103] 圖3是本申請實施例中另一種數(shù)據(jù)對比方法的流程示意圖;
[0104] 圖4是本申請實施例中另一種數(shù)據(jù)對比方法的流程示意圖;
[0105] 圖5是本申請實施例中一種數(shù)據(jù)對比裝置的功能模塊示意圖;
[0106] 圖6是本申請實施例中另一種數(shù)據(jù)對比裝置的功能模塊示意圖;
[0107] 圖7是本申請實施例中另一種數(shù)據(jù)對比裝置的功能模塊示意圖;
[010引圖8是本申請實施例中另一種數(shù)據(jù)對比裝置的功能模塊示意圖;
[0109] 圖9是本申請實施例中另一種數(shù)據(jù)對比裝置的功能模塊示意圖;
[0110] 圖10是本申請實施例中另一種數(shù)據(jù)對比裝置的功能模塊示意圖;
【具體實施方式】
[0111] 為了使本技術(shù)領(lǐng)域的人員更好地理解本申請中的技術(shù)方案,下面將結(jié)合本申請實 施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施 例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通 技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本申請保護 的范圍。
[0112] 在本申請的說明書中:
[0113] 字段一般指數(shù)據(jù)表中的列。在數(shù)據(jù)表中,每一列一般稱為一個字段。
[0114] 記錄一般指數(shù)據(jù)表中的行。在數(shù)據(jù)表中,每一行一般稱為一個記錄。
[0115] 如圖1所示,本申請實施例提供的一種數(shù)據(jù)對比方法包括:
[0116] S101 ;獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表。
[0117] 所述第一數(shù)據(jù)表和所述第二數(shù)據(jù)表中保存有待對比的數(shù)據(jù)。
[0118] 在某一實施方式中,第一數(shù)據(jù)表為保存有海量數(shù)據(jù)的數(shù)據(jù)表。在一些情況下,將第 一數(shù)據(jù)表中的海量數(shù)據(jù)遷移到第二數(shù)據(jù)表中。為了確保遷移前后的數(shù)據(jù)保持一致,需要將 第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)進行對比。
[0119] 在另一實施方式中,第一數(shù)據(jù)表為保存有海量數(shù)據(jù)的數(shù)據(jù)表。在一些情況下,對第 一數(shù)據(jù)表中的數(shù)據(jù)使用了不穩(wěn)定的排序算法進行排序,并將排序后的數(shù)據(jù)保存到第二數(shù)據(jù) 表中。為了檢測排序前后的數(shù)據(jù)是否一致,需要將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的 數(shù)據(jù)進行對比。其中,不穩(wěn)定的排序算法一般是指若待排序的兩個數(shù)據(jù)相等,則排序之后兩 個數(shù)據(jù)的先后順序可能不變,也可能發(fā)生變化。即兩個數(shù)據(jù)的先后順序是不確定的。不穩(wěn) 定的排序算法有可能使數(shù)據(jù)產(chǎn)生差錯。例如,某一數(shù)據(jù)表中保存了學(xué)生數(shù)據(jù)。該數(shù)據(jù)表的 字段包括姓名、學(xué)號、年齡、班級等。數(shù)據(jù)表中的數(shù)據(jù)已經(jīng)按照學(xué)號大小進行了排序。在一 些情況下,仍需要按照年齡從小到大再次進行排序。如果年齡相同,則按照學(xué)號從小到大進 行排序。若選擇了不穩(wěn)定的排序算法對年齡進行排序,郝么,排序后年齡相同學(xué)生的學(xué)號有 可能產(chǎn)生差錯。
[0120] S102;選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段,將選取的字段標(biāo)記為第一字段。
[0121] 一般情況下,第一數(shù)據(jù)表和第二數(shù)據(jù)表是具有一定關(guān)聯(lián)的。例如,第二數(shù)據(jù)表中保 存的是由第一數(shù)據(jù)表遷移過去的數(shù)據(jù)。或者,第二數(shù)據(jù)表中保存的是排序后的第一數(shù)據(jù)表 中的數(shù)據(jù)。又或者,第二數(shù)據(jù)表中保存的是修改數(shù)據(jù)結(jié)構(gòu)后的第一數(shù)據(jù)表中的數(shù)據(jù)。因此, 一般情況下,第一數(shù)據(jù)表的結(jié)構(gòu)和第二數(shù)據(jù)表的結(jié)構(gòu)相類似。第一數(shù)據(jù)表和第二數(shù)據(jù)表之 間存在共有字段。
[0122] 首先獲取第一數(shù)據(jù)表的字段,然后獲取第二數(shù)據(jù)表的字段,最后選取第一數(shù)據(jù)表 和第二數(shù)據(jù)表的共有字段。將選取的字段標(biāo)記為第一字段。所述第一字段的數(shù)量可W是一 個,也可W是多個。
[0123] 在某一實施方式中,可W根據(jù)字段的名稱選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字 段。例如,第一數(shù)據(jù)表的字段包括賬戶名稱、商品金額、商品種類。第二數(shù)據(jù)表的字段包括 賬戶名稱、商品金額。第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段為賬戶名稱和商品金額。將賬 戶名稱和商品金額標(biāo)記為第一字段。第一字段的數(shù)量為兩個。
[0124] S103;將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表第一字段的數(shù)據(jù)進行 對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù)。
[01巧]將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表第一字段的數(shù)據(jù)進行對比, 若第一數(shù)據(jù)某個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表第一字段的數(shù)據(jù)均不相同,則該記錄的 數(shù)據(jù)為第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的差異數(shù)據(jù)。在第一數(shù)據(jù)表的記錄均對比完后,從第 二數(shù)據(jù)表中選出與第一數(shù)據(jù)表第一字段的數(shù)據(jù)均不相同的記錄,選出的記錄的數(shù)據(jù)為第一 數(shù)據(jù)表和第二數(shù)據(jù)表之間的差異數(shù)據(jù)。
[0126] 在某一實施方式中,在步驟S103中,將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第 二數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)進行對比。
[0127] 進一步的,在將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄第一 字段的數(shù)據(jù)進行對比的過程中,將第一記錄每個第一字段的數(shù)據(jù)分別與第二記錄相應(yīng)第一 字段的數(shù)據(jù)進行對比。所述第一記錄為第一數(shù)據(jù)表的任一記錄。所述第二記錄為第二數(shù)據(jù) 表的任一記錄。所述相應(yīng)第一字段一般為名稱相同的第一字段。
[012引下面W-個具體例子詳細說明W上的對比過程。
[0129] 第一數(shù)據(jù)表如下面的表1所示。第二數(shù)據(jù)表如下面的表2所示。第一數(shù)據(jù)表包 括Nick、Age和Tag字段。第二數(shù)據(jù)表包括Nick、Age、Tag和trading-volume字段。選取 Nick、Age和Tag字段作為第一字段。第一字段的數(shù)量為3個。
[0130] 表 1
[0131]
陽134] 選取表1第一個記錄(第一行)每個第一字段的數(shù)據(jù)。選取表2第一個記錄每個 第一字段的數(shù)據(jù)。然后將表1第一個記錄和表2第一個記錄Nick字段的數(shù)據(jù)進行對比,即 將"Tom"和"Jack"進行對比。由于"Tom"和"Jack"不相同,因此表1第一個記錄和表2 第一個記錄Nick字段的數(shù)據(jù)不相同。從而判斷表1第一個記錄第一字段的數(shù)據(jù)與表2第 一個記錄第一字段的數(shù)據(jù)不相同。
[0135] 選取表2第二個記錄每個第一字段的數(shù)據(jù)。將表1第一個記錄和表2第二個記錄 Nick字段的數(shù)據(jù)進行對比。由于二者都為"Tom",因此表1第一個記錄和表2第二個記錄 Nick字段的數(shù)據(jù)相同。然后將表1第一個記錄和表2第二個記錄Age字段的數(shù)據(jù)進行對 比。由于二者都為"30",因此表1第一個記錄和表2第二個記錄Age字段的數(shù)據(jù)相同。最 后將表1第一個記錄和表2第二個記錄Tag字段的數(shù)據(jù)進行對比。由于二者都為"美食", 因此表1第一個記錄和表2第二個記錄Tag字段的數(shù)據(jù)相同。從而判斷表1第一個記錄第 一字段的數(shù)據(jù)與表2第二個記錄第一字段的數(shù)據(jù)相同。
[0136] 接下來選取表1第二個記錄每個第一字段的數(shù)據(jù)。選取表2第一個記錄每個第一 字段的數(shù)據(jù)。然后將表1第二個記錄和表2第一個記錄Nick字段的數(shù)據(jù)進行對比。由于 二者都為"化ck",因此表1第二個記錄和表2第一個記錄Nick字段的數(shù)據(jù)相同。然后將 表1第二個記錄和表2第一個記錄Age字段的數(shù)據(jù)進行對比。由于二者都為"20",因此表 1第二個記錄和表2第一個記錄Age字段的數(shù)據(jù)相同。最后將表1第二個記錄和表2第一 個記錄Tag字段的數(shù)據(jù)進行對比。由于"女裝"和"美食"不相同,因此表1第二個記錄和 表2第一個記錄Tag字段的數(shù)據(jù)不相同。從而判斷表1第二個記錄第一字段的數(shù)據(jù)與表2 第一個記錄第一字段的數(shù)據(jù)不相同。
[0137] 選取表2第二個記錄每個第一字段的數(shù)據(jù)。將表1第二個記錄和表2第二個記錄 Nick字段的數(shù)據(jù)進行對比。由于"Jack"和"Tom"不相同,因此表1第二個記錄和表2第二 個記錄Nick字段的數(shù)據(jù)不相同。從而判斷表1第二個記錄第一字段的數(shù)據(jù)與表2第二個 記錄第一字段的數(shù)據(jù)不相同。
[013引 由W上的對比過程可知,由于表1第二個記錄第一字段的數(shù)據(jù)與表2每個記錄第 一字段的數(shù)據(jù)均不相同。因此,將表1第二個記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類似地,將 表2第一個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0139] 進一步的,為了加快數(shù)據(jù)對比的速度,在對比之前,可W分別將第一數(shù)據(jù)表和第二 數(shù)據(jù)表每個第一字段的數(shù)據(jù)按相同的順序進行拼接處理。具體如下:
[0140] 將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)按順序拼接。將第二數(shù)據(jù)表每個記錄第一 字段的數(shù)據(jù)按相同順序拼接。最后將第一數(shù)據(jù)表每個記錄拼接后的數(shù)據(jù)與第二數(shù)據(jù)表每個 記錄拼接后的數(shù)據(jù)進行對比。
[0141] 下面W-個具體例子詳細說明W上的對比過程。
[0142] 第一數(shù)據(jù)表如表1所示。第二數(shù)據(jù)表如表2所示。針對表1的每個記錄,按照 nick、age和tag字段的順序進行拼接。拼接后的數(shù)據(jù)如下面的表3所示。
[014引表3
[0144]
[0145]
[0146] 針對表2的每個記錄。同樣按照nick、age和tag字段的順序進行拼接。拼接后 的數(shù)據(jù)如下面的表4所示。
[0147] 表 4 [014 引
[0149] 選取表3第一個記錄的數(shù)據(jù)。選取表4第一個記錄的數(shù)據(jù)。然后將表3第一個記 錄的數(shù)據(jù)和表4第一個記錄的數(shù)據(jù)進行對比。即將"Tom30美食"和"化ck20美食"進行對 比。由于二者不相同,因此表3第一個記錄的數(shù)據(jù)和表4第一個記錄的數(shù)據(jù)不相同。
[0150] 選取表4第二個記錄的數(shù)據(jù)。然后將表3第一個記錄的數(shù)據(jù)和表4第二個記錄的 數(shù)據(jù)進行對比。由于二者均為"Tom30美食",因此表3第一個記錄的數(shù)據(jù)和表4第二個記 錄的數(shù)據(jù)相同。
[0151] 接下來選取表3第二個記錄的數(shù)據(jù)。選取表4第一個記錄的數(shù)據(jù)。然后將表3第 二個記錄的數(shù)據(jù)和表4第一個記錄的數(shù)據(jù)進行對比。即將"化ck20女裝"和"化ck20美食" 進行對比。由于二者不相同,因此表3第二個記錄的數(shù)據(jù)和表4第一個記錄的數(shù)據(jù)不相同。
[0152] 選取表4第二個記錄的數(shù)據(jù)。然后將表3第二個記錄的數(shù)據(jù)和表4第二個記錄的 數(shù)據(jù)進行對比。即將"化ck20女裝"和"Tom30美食"進行對比。由于二者不相同,因此表 3第二個記錄的數(shù)據(jù)和表4第二個記錄的數(shù)據(jù)不相同。
[0153] 由W上的對比過程可知,由于表3第二個記錄的數(shù)據(jù)與表4每個記錄的數(shù)據(jù)均不 相同。因此,將表3第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。類似地,將表4第一個記錄的數(shù)據(jù) 標(biāo)記為差異數(shù)據(jù)。
[0154] 表3的每個記錄與表1的每個記錄具有一一對應(yīng)的關(guān)系。表4的每個記錄與表2 的每個記錄具有一一對應(yīng)的關(guān)系。根據(jù)表3的記錄的行數(shù)(例如第一行、第二行)可W獲 取表1中的相應(yīng)記錄。同樣,根據(jù)表4的記錄的行數(shù)可W獲取表2中的相應(yīng)記錄。由于表3 第二個記錄的行數(shù)為第二行,因此將表1第二個記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類似地, 將表2第一個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[015引進一的,為了加快數(shù)據(jù)對比的速度,在對比之前,還可W分別將第一數(shù)據(jù)表和第二 數(shù)據(jù)表每個第一字段的數(shù)據(jù)轉(zhuǎn)換為相同長度的數(shù)據(jù),例如MD5數(shù)據(jù)。具體如下:
[0156] 將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)按順序進行拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換 為相同長度的數(shù)據(jù),將該相同長度的數(shù)據(jù)記為第一數(shù)據(jù)。將第二數(shù)據(jù)表每個記錄第一字段 的數(shù)據(jù)按相同的順序進行拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為相同長度的數(shù)據(jù),將該相同長度 的數(shù)據(jù)記為第二數(shù)據(jù)。最后將第一數(shù)據(jù)表每個記錄的第一數(shù)據(jù)與第二數(shù)據(jù)表每個記錄的第 二數(shù)據(jù)進行對比。
[0157] 下面W-個具體例子詳細說明W上的對比過程。
[0158] 第一數(shù)據(jù)表如表1所示,第二數(shù)據(jù)表如表2所示。針對表1的每個記錄,按照nick、 age和tag字段的順序進行拼接。拼接后的數(shù)據(jù)如表3所示。將表3每個記錄的數(shù)據(jù)轉(zhuǎn)換 為第一數(shù)據(jù),轉(zhuǎn)換后的數(shù)據(jù)如表5所示。
[0159] 表 5
[0160]
[0161] 針對表2的每個記錄。同樣按照nick、age和tag字段的順序進行拼接。拼接后 的數(shù)據(jù)如下面的表4所示。將表4每個記錄的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù),轉(zhuǎn)換后的數(shù)據(jù)如表6 所示。
[016引 表6 [0163]
[0164] 選取表5第一個記錄的數(shù)據(jù)。選取表6第一個記錄的數(shù)據(jù)。然后將表5第 一個記錄的數(shù)據(jù)和表6第一個記錄的數(shù)據(jù)進行對比。即將"7313945297rc5F81"和 "304CF40D47E1C0FF"進行對比。由于二者不相同,因此表5第一個記錄的數(shù)據(jù)和表6第一 個記錄的數(shù)據(jù)不相同。
[0165] 選取表6第二個記錄的數(shù)據(jù)。然后將表5第一個記錄的數(shù)據(jù)和表6第二個記錄的 數(shù)據(jù)進行對比。由于二者均為"7313945297FC5F81",因此表5第一個記錄的數(shù)據(jù)和表6第 二個記錄的數(shù)據(jù)相同。
[0166] 接下來選取表5第二個記錄的數(shù)據(jù)。選取表6第一個記錄的數(shù)據(jù)。然后將表 5第二個記錄的數(shù)據(jù)和表6第一個記錄的數(shù)據(jù)進行對比。即將"15C677犯36F32C90"和 "304CF40D47E1C0FF"進行對比。由于二者不相同,因此表5第二個記錄的數(shù)據(jù)和表6第一 個記錄的數(shù)據(jù)不相同。
[0167] 選取表6第二個記錄的數(shù)據(jù)。然后將表5第二個記錄的數(shù)據(jù)和表6第二個記錄的 數(shù)據(jù)進行對比。即將"15C677犯36F32C90"和"7313945297FC5F81"進行對比。由于二者不 相同,因此表5第二個記錄的數(shù)據(jù)和表6第二個記錄的數(shù)據(jù)不相同。
[016引 由W上的對比過程可知,由于表5第二個記錄的數(shù)據(jù)與表6每個記錄的數(shù)據(jù)均不 相同。因此,將表5第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。類似地,將表6第一個記錄的數(shù)據(jù) 標(biāo)記為差異數(shù)據(jù)。
[0169] 表5的每個記錄與表1的每個記錄具有一一對應(yīng)的關(guān)系。表6的每個記錄與表2 的每個記錄具有一一對應(yīng)的關(guān)系。根據(jù)表5的記錄的行數(shù)(例如第一行、第二行)可W獲 取表1中的相應(yīng)記錄。同樣,根據(jù)表6的記錄的行數(shù)可W獲取表2中的相應(yīng)記錄。由于表5 第二個記錄的行數(shù)為第二行,因此將表1第二個記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類似地, 將表2第一個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0170] 在另一實施方式中,當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間設(shè)有主鍵(primary key)時,可W使用主鍵加快數(shù)據(jù)表之間數(shù)據(jù)對比的速度。由于第一數(shù)據(jù)表和第二數(shù)據(jù)表是 具有一定關(guān)聯(lián)的,因此可W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表的配置數(shù)據(jù),W判斷第一數(shù)據(jù)表 和第二數(shù)據(jù)表之間是否設(shè)有主鍵。其中,所述主鍵一般是數(shù)據(jù)表中的一個或多個字段,它的 值用于惟一地標(biāo)識數(shù)據(jù)表中的記錄。當(dāng)兩個數(shù)據(jù)表之間設(shè)有主鍵時,郝么,同一個主鍵值在 兩個數(shù)據(jù)表中代表的是同一個記錄。
[0171] 在步驟S103中,使用主鍵加快數(shù)據(jù)表之間數(shù)據(jù)對比速度的過程如下:
[0172] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵。針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第Η記錄和第四記錄。將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對 比。所述第Η記錄為第一數(shù)據(jù)表的記錄,所述第四記錄為第二數(shù)據(jù)表的記錄;
[0173] 進一步的,在將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對比的 過程中,將第Η記錄每個第一字段的數(shù)據(jù)分別與第四記錄相應(yīng)第一字段的數(shù)據(jù)進行對比。 所述相應(yīng)第一字段一般為名稱相同的第一字段。
[0174] 下面W -個具體例子詳細說明W上的對比過程。
[0Π 5] 第一數(shù)據(jù)表如下面的表7所示。第二數(shù)據(jù)表如下面的表8所示。第一數(shù)據(jù)表包括 ID、Nick和Tag字段。第二數(shù)據(jù)表包括ID、Nick、Tag和trading-volume字段。選取nick 和tag字段作為第一字段。第一字段的數(shù)量為2個。ID字段為第一數(shù)據(jù)表和第二數(shù)據(jù)表之 間的主鍵。
[017引表7 Γ01771
陽181] 首先選取主鍵值001。在表7中,主鍵值001所對應(yīng)的為第一個記錄。在表8中, 主鍵值001所對應(yīng)的為第一個記錄。將表7第一個記錄和表8第一個記錄Nick字段的數(shù) 據(jù)進行對比。由于二者都為"Tom",因此表7第一個記錄和表8第一個記錄Nick字段的數(shù) 據(jù)相同。然后將表7第一個記錄和表8第一個記錄Tag字段的數(shù)據(jù)進行對比。由于二者都 為"美食",因此表7第一個記錄和表8第一個記錄Tge字段的數(shù)據(jù)相同。從而判斷表7第 一個記錄第一字段的數(shù)據(jù)與表8第一個記錄第一字段的數(shù)據(jù)相同。
[0182] 接下來選取主鍵值002。在表7中,主鍵值002所對應(yīng)的為第二個記錄。在表8 中,主鍵值002所對應(yīng)的為第二個記錄。將表7第二個記錄和表8第二個記錄Nick字段的 數(shù)據(jù)進行對比。由于二者都為"化ck",因此表7第一個記錄和表8第一個記錄Nick字段的 數(shù)據(jù)相同。然后將表7第二個記錄和表8第二個記錄Tag字段的數(shù)據(jù)進行對比。由于"女 裝"和"美食"不相同,因此表7第二個記錄和表8第二個記錄Tag字段的數(shù)據(jù)不相同。從 而判斷表7第二個記錄第一字段的數(shù)據(jù)與表8第二個記錄第一字段的數(shù)據(jù)不相同。
[0183] 由W上的對比過程可知,表7第二個記錄第一字段的數(shù)據(jù)與表8第二個記錄第一 字段的數(shù)據(jù)不相同。并且由于主鍵值用于惟一地標(biāo)識數(shù)據(jù)表中的記錄,因此表7第二個記 錄第一字段的數(shù)據(jù)與表8其它記錄第一字段的數(shù)據(jù)也不相同。因此,將表7第二個記錄的 數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類似地,將表8第二個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0184] 更進一步的,在一些情況下,對于數(shù)據(jù)表中數(shù)據(jù)類型為整數(shù)或?qū)崝?shù)的數(shù)據(jù),允許其 在第一數(shù)據(jù)表和第二數(shù)據(jù)表中存在一定的差異,只要該差異在合理的范圍內(nèi)即可。因此,對 于數(shù)據(jù)表中數(shù)據(jù)類型為整數(shù)或?qū)崝?shù)的數(shù)據(jù),可W設(shè)定闊值。具體方法如下:
[0185] 從第一字段中選取數(shù)據(jù)類型為整數(shù)或?qū)崝?shù)的字段,將選取的字段記為第二字段。 其中,所述數(shù)據(jù)類型為整數(shù)的字段包括但不限于數(shù)據(jù)類型為int、bigint、long或short的 字段,所述數(shù)據(jù)類型為實數(shù)的字段包括但不限于數(shù)據(jù)類型為float或double的字段。所述 第二字段的數(shù)量可W為1個,也可W為多個。
[0186] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵。針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第Η記錄和第四記錄。將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對 比。所述第Η記錄為第一數(shù)據(jù)表的記錄,所述第四記錄為第二數(shù)據(jù)表的記錄;
[0187] 在將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對比的過程中,首 先從第一字段中選取第二字段;然后根據(jù)第Η記錄第二字段的數(shù)據(jù)和第四記錄第二字段的 數(shù)據(jù)按第一預(yù)設(shè)函數(shù)進行計算;然后將計算結(jié)果與第一闊值進行比較。
[018引當(dāng)計算結(jié)果大于第一闊值時,表示第二字段的數(shù)據(jù)在第一數(shù)據(jù)表和第二數(shù)據(jù)表中 的差異過大。因此將第Η記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù),將第四記錄的數(shù)據(jù)標(biāo)記為第二 差異數(shù)據(jù)。
[0189] 當(dāng)計算結(jié)果小于第一闊值時,表示第二字段的數(shù)據(jù)在第一數(shù)據(jù)表和第二數(shù)據(jù)表中 的差異在合理范圍內(nèi)。此時,選取第一字段中除去第二字段后剩余的字段,然后將第Η記錄 剩余字段的數(shù)據(jù)與第四記錄剩余字段的數(shù)據(jù)進行對比。
[0190] 所述第一預(yù)設(shè)函數(shù)可W是油s(a. gmv-b. gmv)/max(a. gmv,b. gmv)。其中,a表示第 一數(shù)據(jù)表,b表示第二數(shù)據(jù)表,gmv表示第二字段,abs為取絕對值運算,max為取最大值運 算,a. gmv表示第一數(shù)據(jù)表任一記錄gmv字段的數(shù)值,b. gmv表示第二數(shù)據(jù)表任一記錄gmv 字段的數(shù)值。
[0191] 第一闊值的大小可W根據(jù)實際的需求而靈活設(shè)定。若對數(shù)據(jù)的一致性要求較高, 則第一闊值可W設(shè)定的小些。若對數(shù)據(jù)的一致性要求較低,則第一闊值可W設(shè)定的大些。
[0192] 下面W-個具體例子詳細說明W上的對比過程。
[0193] 第一數(shù)據(jù)表如下面的表9所示。第二數(shù)據(jù)表如下面的表10所示。第一數(shù)據(jù)表包括 ID、Nick和Age字段。第二數(shù)據(jù)表包括ID、化ck、Age和trading-volume字段。選取nick 和Age字段為第一字段。第一字段的數(shù)量為2個。ID字段為第一數(shù)據(jù)表和第二數(shù)據(jù)表之間 的主鍵。在第一字段中,由于Age字段的數(shù)據(jù)類型為整數(shù),因此將age字段記為第二字段。 第一預(yù)設(shè)函數(shù)為油S (表9. Age-表10. Age)/max (表9. Age,表10. Age)。第一闊值的數(shù)值 設(shè)為0.2。
[0194] 表 9
[0195]
[019 引
[0199] 首先選取主鍵值001。在表9中,主鍵值001所對應(yīng)的為第一個記錄。在表10中, 主鍵值001所對應(yīng)的為第一個記錄。首先將表9第一個記錄和表10第一個記錄Age字段 的數(shù)據(jù)進行對比。表9第一個記錄Age字段的數(shù)據(jù)為30。表10第一個記錄Age字段的數(shù) 據(jù)為25。計算第一預(yù)設(shè)函數(shù)的值為0.167,小于0.2。因此認為表9第一個記錄和表10第 一個記錄Age字段的數(shù)據(jù)相同。然后將表9第一個記錄和表10第一個記錄Nick字段的數(shù) 據(jù)進行對比。由于二者都為"Tom",因此表9第一個記錄和表10第一個記錄Tge字段的數(shù) 據(jù)相同。從而判斷表9第一個記錄第一字段的數(shù)據(jù)與表10第一個記錄第一字段的數(shù)據(jù)相 同。
[0200] 接下來選取主鍵值002。在表9中,主鍵值002所對應(yīng)的為第二個記錄。在表10 中,主鍵值002所對應(yīng)的為第二個記錄。首先將表9第二個記錄和表10第二個記錄Age字 段的數(shù)據(jù)進行對比。表9第二個記錄Age字段的數(shù)據(jù)為20。表10第二個記錄Age字段的 數(shù)據(jù)為15。計算第一預(yù)設(shè)函數(shù)的值為0.25,大于0.2。因此認為表9第二個記錄和表10第 二個記錄Age字段的數(shù)據(jù)不相同。從而判斷表9第二個記錄第一字段的數(shù)據(jù)與表10第二 個記錄第一字段的數(shù)據(jù)不相同。
[0201] 由W上的對比過程可知,表9第二個記錄第一字段的數(shù)據(jù)與表10第二個記錄第一 字段的數(shù)據(jù)不相同。并且由于主鍵值用于惟一地標(biāo)識數(shù)據(jù)表中的記錄,因此表9第二個記 錄第一字段的數(shù)據(jù)與表10其它記錄第一字段的數(shù)據(jù)也不相同。因此,將表9第二個記錄的 數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類似地,將表10第二個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0202] 進一步的,為了加快數(shù)據(jù)對比的速度,在對比之前,可W分別將第一數(shù)據(jù)表和第二 數(shù)據(jù)表每個第一字段的數(shù)據(jù)按相同的順序進行拼接處理。具體如下:
[0203] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵。針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第Η記錄和第四記錄。將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對 比。所述第Η記錄為第一數(shù)據(jù)表的記錄,所述第四記錄為第二數(shù)據(jù)表的記錄;
[0204] 在將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對比的過程中,將 第Η記錄第一字段的數(shù)據(jù)按順序拼接。將第四記錄第一字段的數(shù)據(jù)按相同順序拼接。最后 將第Η記錄拼接后的數(shù)據(jù)與第四記錄拼接后的數(shù)據(jù)進行對比。
[0205] 下面W-個具體例子詳細說明W上的對比過程。
[0206] 第一數(shù)據(jù)表如表7所示,第二數(shù)據(jù)表如表8所示。針對表7的每個記錄,按照nick 和tag字段的順序進行拼接。拼接后的數(shù)據(jù)如下面的表11所示。
[0207] 表 11 [020引
[0209] 針對表8的每個記錄,同樣按照nick和tag字段的順序進行拼接。拼接后的數(shù)據(jù) 如下面的表12所示。
[0210] 表 12
[0211]
[0212] 首先選取主鍵值001。在表11中,主鍵值001所對應(yīng)的為第一個記錄。在表12 中,主鍵值001所對應(yīng)的為第一個記錄。將表11第一個記錄的數(shù)據(jù)和表12第一個記錄的 據(jù)進行對比。由于二者都為"Tom美食",因此表11第一個記錄的數(shù)據(jù)和表12第一個記錄 的數(shù)據(jù)相同。
[0213] 接下來選取主鍵值002。在表11中,主鍵值002所對應(yīng)的為第二個記錄。在表12 中,主鍵值002所對應(yīng)的為第二個記錄。將表11第二個記錄的數(shù)據(jù)和表12第二個記錄的 數(shù)據(jù)進行對比。由于"化ck女裝"和"化ck美食"不相同,因此表11第二個記錄的數(shù)據(jù)和 表12第二個記錄的數(shù)據(jù)不相同。
[0214] 由W上的對比過程可知,表11第二個記錄的數(shù)據(jù)與表12第二個記錄的數(shù)據(jù)不相 同。并且由于主鍵值用于惟一地標(biāo)識數(shù)據(jù)表中的記錄,因此表11第二個記錄的數(shù)據(jù)與表12 其它記錄的數(shù)據(jù)也不相同。因此,將表11第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。類似地,將 表12第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。
[0215] 表11的每個記錄與表7的每個記錄具有一一對應(yīng)的關(guān)系。表12的每個記錄與表 8的每個記錄具有一一對應(yīng)的關(guān)系。根據(jù)表11的記錄的行數(shù)(例如第一行、第二行)可W 獲取表7中的相應(yīng)記錄。同樣,根據(jù)表12的記錄的行數(shù)可W獲取表8中的相應(yīng)記錄。由于 表11第二個記錄的行數(shù)為第二行,因此將表7第二個記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類 似地,將表8第二個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0216] 進一的,為了加快數(shù)據(jù)對比的速度,在對比之前,還可W分別將第一數(shù)據(jù)表和第二 數(shù)據(jù)表每個第一字段的數(shù)據(jù)轉(zhuǎn)換為相同長度的數(shù)據(jù),例如MD5數(shù)據(jù)。具體如下:
[0217] 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵。針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第Η記錄和第四記錄。將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對 比。所述第Η記錄為第一數(shù)據(jù)表的記錄,所述第四記錄為第二數(shù)據(jù)表的記錄;
[021引在將第Η記錄第一字段的數(shù)據(jù)與第四記錄第一字段的數(shù)據(jù)進行對比的過程中,將 第Η記錄第一字段的數(shù)據(jù)按順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為相同長度的數(shù)據(jù),將該相 同長度的數(shù)據(jù)記為第Η數(shù)據(jù)。將第四記錄第一字段的數(shù)據(jù)按相同順序拼接,并將拼接后的 數(shù)據(jù)轉(zhuǎn)換為相同長度的數(shù)據(jù),將該相同長度的數(shù)據(jù)記為第四數(shù)據(jù)。最后將第Η數(shù)據(jù)與第四 數(shù)據(jù)進行對比。
[0219] 下面W -個具體例子詳細說明W上的對比過程。
[0220] 第一數(shù)據(jù)表如表7所示,第二數(shù)據(jù)表如表8所示。針對表7的每個記錄,按照nick、 age和tag字段的順序進行數(shù)據(jù)拼接。拼接后的數(shù)據(jù)如表11所示。將表11每個記錄的數(shù) 據(jù)轉(zhuǎn)換為第Η數(shù)據(jù),轉(zhuǎn)換后的數(shù)據(jù)如下面的表13所示。
[0221] 表 13
[0222]
[0223] 針對表8的每個記錄,同樣按照nick、age和tag字段的順序進行數(shù)據(jù)拼接。拼接 后的數(shù)據(jù)如表12所示。將表12每個記錄的數(shù)據(jù)轉(zhuǎn)換為第四數(shù)據(jù),轉(zhuǎn)換后的數(shù)據(jù)如下面的 表14所示。
[0224] 表 14
[0225]
[0226] 首先選取主鍵值001。在表13中,主鍵值001所對應(yīng)的為第一個記錄。在表14 中,主鍵值001所對應(yīng)的為第一個記錄。將表13第一個記錄的數(shù)據(jù)和表14第一個記錄的 數(shù)據(jù)進行對比。由于二者都為"0E00CD她49CD抓17",因此表13第一個記錄的數(shù)據(jù)和表14 第一個記錄的數(shù)據(jù)相同。
[0227] 接下來選取主鍵值002。在表13中,主鍵值002所對應(yīng)的為第二個記錄。在表14 中,主鍵值002所對應(yīng)的為第二個記錄。將表13第二個記錄的數(shù)據(jù)和表14第二個記錄的 數(shù)據(jù)進行對比。由于"EA80沈836598CCBC"和"7CFF45CB8F19CFE0"不相同,因此表13第二 個記錄的數(shù)據(jù)和表14第二個記錄的數(shù)據(jù)不相同。
[022引 由W上的對比過程可知,表13第二個記錄的數(shù)據(jù)與表14第二個記錄的數(shù)據(jù)不相 同。并且由于主鍵值用于惟一地標(biāo)識數(shù)據(jù)表中的記錄,因此表13第二個記錄的數(shù)據(jù)與表14 其它記錄的數(shù)據(jù)也不相同。因此,將表13第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。類似地,將 表14第二個記錄的數(shù)據(jù)標(biāo)記為差異數(shù)據(jù)。
[0229] 表13的每個記錄與表7的每個記錄具有一一對應(yīng)的關(guān)系。表14的每個記錄與表 8的每個記錄具有一一對應(yīng)的關(guān)系。根據(jù)表13的記錄的行數(shù)(例如第一行、第二行)可W 獲取表7中的相應(yīng)記錄。同樣,根據(jù)表14的記錄的行數(shù)可W獲取表8中的相應(yīng)記錄。由于 表13第二個記錄的行數(shù)為第二行,因此將表7第二個記錄的數(shù)據(jù)標(biāo)記為第一差異數(shù)據(jù)。類 似地,將表8第二個記錄的數(shù)據(jù)標(biāo)記為第二差異數(shù)據(jù)。
[0230] S104;根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。
[0231] 在某一實施方式中,當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)(例如 第一差異數(shù)據(jù)或第二差異數(shù)據(jù))時,則判斷第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)不 一致。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,則判斷第一數(shù)據(jù)表中的 數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)一致。
[0232] 在另一實施方式中,可W設(shè)定第二闊值。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間 存在差異數(shù)據(jù)時,統(tǒng)計第五記錄的數(shù)量,統(tǒng)計第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄 的數(shù)量。根據(jù)第五記錄的數(shù)量、第一數(shù)據(jù)表記錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第二預(yù) 設(shè)函數(shù)進行計算。將計算結(jié)果與第二闊值進行比較。當(dāng)計算結(jié)果小于第二闊值時,判斷第 一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)一致。當(dāng)計算結(jié)果大于第二闊值時,判斷第一數(shù)據(jù)表和第 二數(shù)據(jù)表中的數(shù)據(jù)不一致。其中,第五記錄為第一數(shù)據(jù)表和第二數(shù)據(jù)表中具有差異數(shù)據(jù)的 記錄(例如第一差異數(shù)據(jù)或第二差異數(shù)據(jù))。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存 在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)一致。
[0233] 所述第二預(yù)設(shè)函數(shù)包括a/化+C)。其中,a為第五記錄的數(shù)量,b為第一數(shù)據(jù)表記 錄的數(shù)量,C為第二數(shù)據(jù)表記錄的數(shù)量。
[0234] 第二闊值的大小可W根據(jù)實際的需求而靈活設(shè)定。若對數(shù)據(jù)的一致性要求較高, 則第二闊值可W設(shè)定的小些。若對數(shù)據(jù)的一致性要求較低,則第二闊值可W設(shè)定的大些。
[0235] 在另一實施方式中,在判斷第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)不一致 時,顯示差異數(shù)據(jù)。例如顯示第一差異數(shù)據(jù)和/或第二差異數(shù)據(jù)。從而精確的定位出差異 數(shù)據(jù)。當(dāng)然,為了節(jié)省資源空間、計算時間W及考慮到實際需求,也可W顯示部分差異數(shù)據(jù) (例如其中的100個)。所述顯示差異數(shù)據(jù),包括在第一數(shù)據(jù)表中突出顯示第一差異數(shù)據(jù), W及在第二數(shù)據(jù)表中突出顯示第二差異數(shù)據(jù)。
[0236] 在另一實施方式中,第一數(shù)據(jù)表和第二數(shù)據(jù)表存在于不同的服務(wù)器上。因此,在步 驟S103之前,需要將第一數(shù)據(jù)表傳送至第二數(shù)據(jù)表所在的服務(wù)器上?;蛘邔⒌诙?shù)據(jù)表傳 送至第一數(shù)據(jù)表所在的服務(wù)器上。送樣,第一數(shù)據(jù)表和第二數(shù)據(jù)表位于同一個服務(wù)器上,從 而便于第一數(shù)據(jù)表和第二數(shù)據(jù)表之間進行數(shù)據(jù)對比。
[0237] 在另一實施方式中,在步驟S103之前,分別對第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)進行忽略字符、忽略浮點精度或忽略字段內(nèi)分隔符處理。
[023引對數(shù)據(jù)表中的數(shù)據(jù)進行忽略字符處理,一般是將需要忽略的字符替換為空字符。 例如,忽略數(shù)據(jù)表中的"a"字符,一般是將數(shù)據(jù)表中的"a"字符替換為空字符。
[0239] 對數(shù)據(jù)表中的數(shù)據(jù)進行忽略浮點精度處理,一般是對數(shù)據(jù)表中數(shù)據(jù)類型為實數(shù)的 數(shù)據(jù)進行截取。例如,忽略小數(shù)點后四位的精度,即從小數(shù)點右邊第Η位開始向左截取。忽 略浮點精度處理可W屏蔽不同數(shù)據(jù)類型之間(例如bigint數(shù)據(jù)類型和double數(shù)據(jù)類型之 間)存儲格式的差異。在對數(shù)據(jù)表中的數(shù)據(jù)進行忽略浮點精度處理的過程中,還可W將數(shù) 據(jù)表中的數(shù)據(jù)統(tǒng)一轉(zhuǎn)換為浮點數(shù)的形式或科學(xué)計數(shù)法的形式,W屏蔽科學(xué)計數(shù)法與純浮點 數(shù)之間存儲格式的差異。
[0240] -般地,在數(shù)據(jù)表中對于多個文字較短的內(nèi)容,可W使用分隔符將它們隔開。從而 將多個文字較短的內(nèi)容保存在一個字段里。所述分隔符包括","或";"。
[0241] 對數(shù)據(jù)表中的數(shù)據(jù)進行忽略字段內(nèi)分隔符處理,一般是將數(shù)據(jù)表字段內(nèi)的分隔符 替換為空字符。在將分隔符替換為空字符后,還可W對字段內(nèi)的字符按照統(tǒng)一的順序進行 排序。
[024引例如,將表15第一個記錄tag字段"女裝;美食"中的";"替換為空字符。同時, 將表15第二個記錄tag字段"女裝,美食"中的","替換為空字符。在將分隔符替換為空 字符后,將每個記錄tag字段的數(shù)據(jù)統(tǒng)一排序為"女裝美食"。最終形成表16。
[024引 表15 [0244]
[0247] W上的忽略字符、忽略浮點精度和忽略字段內(nèi)分隔符,可W由內(nèi)置的S化函數(shù)執(zhí) 行,也可W由用戶編寫的U壯(user-defined化nction;用戶自定義函數(shù))執(zhí)行。
[024引 W忽略字符為例,內(nèi)置的SQL函數(shù)可W是如下的指令:
[0249] select@s ='油C, def'
[0巧0] @str = replace 姆S,")
[0巧1] 上述指令表示將"油c,def"中的逗號替換為空格符。替換后的數(shù)據(jù)為"油C def"。
[0252] 本實施例的數(shù)據(jù)對比方法,將第一數(shù)據(jù)表每個記錄的數(shù)據(jù)和第二數(shù)據(jù)表的數(shù)據(jù)進 行一一對比,因此能夠準(zhǔn)確的判斷第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。
[0253] 同時,本實施例的數(shù)據(jù)對比方法,可W精確定位第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的 差異數(shù)據(jù),便于進一步的分析處理。
[0254] 同時,本實施例的數(shù)據(jù)對比方法,設(shè)置了第一闊值和第二闊值,便于根據(jù)實際的需 求靈活的設(shè)置數(shù)據(jù)對比的精度。并且,能夠避免將合理的數(shù)據(jù)波動認定為差異數(shù)據(jù)。
[0255] 同時,本實施例的數(shù)據(jù)對比方法,可W通過代碼實現(xiàn)。通過設(shè)定觸發(fā)時間(例如每 天的0點),實現(xiàn)了定時自動數(shù)據(jù)對比。
[0巧6] 在一些情況下,只關(guān)必兩張數(shù)據(jù)表中部分區(qū)域之間的數(shù)據(jù)是否一致。因此,在本申 請的另一個實施例中,在數(shù)據(jù)對比之前,將數(shù)據(jù)表劃分成不同的區(qū)域。如圖2所示,包括:
[0巧7] S201 ;獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表。
[0巧引 步驟S201與步驟S101的內(nèi)容類似。
[0259] S202;按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域。
[0260] -般地,不同時間段的數(shù)據(jù)存儲在數(shù)據(jù)表的不同區(qū)域。例如,第一天的數(shù)據(jù)存儲在 數(shù)據(jù)表的第1-500行,第二天的數(shù)據(jù)存儲在數(shù)據(jù)表的第501-1000行。
[0261] 或者,不同業(yè)務(wù)的數(shù)據(jù)存儲在數(shù)據(jù)表的不同區(qū)域。例如,淘寶網(wǎng)的交易數(shù)據(jù)存儲在 數(shù)據(jù)表的第1-500行,天貓商城的數(shù)據(jù)存儲在數(shù)據(jù)表的第501-1000行。
[0262] 在某一實施方式中,所述預(yù)設(shè)分區(qū)規(guī)則包括W時間為單元將數(shù)據(jù)表劃分成不同的 區(qū)域。例如,將數(shù)據(jù)表劃分成第一區(qū)域和第二區(qū)域。其中,第一區(qū)域存儲第一天的數(shù)據(jù),第 二區(qū)域存儲第二天的數(shù)據(jù)。
[0263] 在另一實施方式中,所述預(yù)設(shè)分區(qū)規(guī)則包括W業(yè)務(wù)為單元將數(shù)據(jù)表中的數(shù)據(jù)劃分 成不同的區(qū)域。例如,將數(shù)據(jù)表中劃分成第一區(qū)域和第二區(qū)域。其中,第一區(qū)域中存儲淘寶 網(wǎng)的交易數(shù)據(jù),第二區(qū)域存儲天貓商城的交易數(shù)據(jù)。
[0264] S203;從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū) 域和所述第二區(qū)域中數(shù)據(jù)的屬性相同。
[0265] 所述數(shù)據(jù)的屬性包括數(shù)據(jù)的時間或數(shù)據(jù)的業(yè)務(wù)類型。例如,第一區(qū)域和第二區(qū)域 中均為第一天的數(shù)據(jù)。又如,第一區(qū)域和第二區(qū)域中均為淘寶網(wǎng)的交易數(shù)據(jù)。
[0266] S204;選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段,將選取的字段標(biāo)記為第一字段。
[0267] 步驟S204與步驟S102的內(nèi)容類似。
[026引S205;將第一區(qū)域每個記錄第一字段的數(shù)據(jù)與第二區(qū)域第一字段的數(shù)據(jù)進行對 比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù)。
[0269] 步驟S205的內(nèi)容與步驟S103的內(nèi)容類似。
[0270] S206 ;根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。
[0271] 在某一實施方式中,當(dāng)?shù)谝粎^(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù) 表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。
[0272] 在另一實施方式中,可W設(shè)定第二闊值。當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在 差異數(shù)據(jù)時,統(tǒng)計第六記錄的數(shù)量,統(tǒng)計第一區(qū)域記錄的數(shù)量,統(tǒng)計第二區(qū)域記錄的數(shù)量。 根據(jù)第六記錄的數(shù)量、第一區(qū)域記錄的數(shù)量和第二區(qū)域記錄的數(shù)量按第Η預(yù)設(shè)函數(shù)進行計 算。將計算結(jié)果與第二闊值進行比較。當(dāng)計算結(jié)果大于第二闊值時,判斷第一數(shù)據(jù)表和第 二數(shù)據(jù)表中的數(shù)據(jù)不一致。其中,第六記錄為第一區(qū)域和第二區(qū)域中具有差異數(shù)據(jù)的記錄。
[0273] 所述第Η預(yù)設(shè)函數(shù)包括a/化+C)。其中,a為第六記錄的數(shù)量,b為第一區(qū)域記錄 的數(shù)量,C為第二區(qū)域記錄的數(shù)量。
[0274] 第二闊值的大小可W根據(jù)實際的需求而靈活設(shè)定。若對數(shù)據(jù)的一致性要求較高, 則第二闊值可W設(shè)定的小些。若對數(shù)據(jù)的一致性要求較低,則第二闊值可W設(shè)定的大些。
[0275] 在另一實施方式中,在判斷第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)不一致 時,顯示差異數(shù)據(jù)。從而精確的定位出差異數(shù)據(jù)。當(dāng)然,為了節(jié)省資源空間、計算時間W及 考慮到實際需求,也可W顯示部分差異數(shù)據(jù)(例如其中的100個)。
[0276] 在另一實施方式中,在步驟S205之前,分別對第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)進行忽略字符、忽略浮點精度或忽略字段內(nèi)分隔符處理。
[0277] 本實施例的數(shù)據(jù)對比方法,將第一數(shù)據(jù)表和第二數(shù)據(jù)表劃分成不同的區(qū)域。將第 一數(shù)據(jù)表和第二數(shù)據(jù)表相應(yīng)區(qū)域之間的數(shù)據(jù)進行一一對比。因此,本實施例的數(shù)據(jù)對比方 法,實現(xiàn)了兩張數(shù)據(jù)表之間的分區(qū)對比。從而簡少了數(shù)據(jù)對比的時間。例如,一張數(shù)據(jù)表中 可能保存了較長時間的數(shù)據(jù),在一些情況下,只需要對比數(shù)據(jù)表中最近一段時間的數(shù)據(jù)。 [027引與圖1和圖2所對應(yīng)的實施例相比,在本申請的另一個實施例中,可W將數(shù)據(jù)文件 中的數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)表中的數(shù)據(jù),從而實現(xiàn)了數(shù)據(jù)表與數(shù)據(jù)文件之間的數(shù)據(jù)對比。如圖3 所示,包括:
[0279] S301 ;獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表。
[0280] 所述第一數(shù)據(jù)文件和所述第一數(shù)據(jù)表中保存有待對比的數(shù)據(jù)。
[0281] 所述第一數(shù)據(jù)文件包括txt文件、exl文件和word文件等。
[0282] S302;獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包括字段的 數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型。
[0283] -般情況下,第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是具有一定關(guān)聯(lián)的。例如,第一 數(shù)據(jù)表中保存的是由第一數(shù)據(jù)文件遷移過去的數(shù)據(jù)?;蛘撸谝粩?shù)據(jù)表中保存的是排序后 的第一數(shù)據(jù)文件中的數(shù)據(jù)?;蛘撸谝粩?shù)據(jù)表中保存的是修改數(shù)據(jù)結(jié)構(gòu)后的第一數(shù)據(jù)文件 中的數(shù)據(jù)。因此,能夠?qū)⒌谝粩?shù)據(jù)文件中的數(shù)據(jù)遷移到第二數(shù)據(jù)表中。
[0284] 例如,第一參數(shù)中包括兩個字段,名稱分別為age和tag。其中,age字段的數(shù)據(jù)類 型為int。tag字段的數(shù)據(jù)類型為string。郝么,建立的第二數(shù)據(jù)表如下面的表17。
[028引 表17
[0286]
[0287] S303 ;將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中。
[028引在某一實施方式中,將第一數(shù)據(jù)文件中的數(shù)據(jù)復(fù)制到第二數(shù)據(jù)表中。
[0289] S304;選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段,將選取的字段標(biāo)記為第一字段。
[0290] 步驟S304的內(nèi)容與步驟S102的內(nèi)容相似。
[0291] S305;將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表第一字段的數(shù)據(jù)進行 對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù)。
[0292] 步驟S305的內(nèi)容與步驟S103的內(nèi)容相類似。
[0293] S306;根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)是否一 致。
[0294] 在某一實施方式中,當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,貝U 判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù) 據(jù)表之間不存在差異數(shù)據(jù)時,則判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)一致。
[0295] 在另一實施方式中,可W設(shè)定第二闊值。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間 存在差異數(shù)據(jù)時,統(tǒng)計第五記錄的數(shù)量,統(tǒng)計第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄 的數(shù)量。根據(jù)第五記錄的數(shù)量、第一數(shù)據(jù)表記錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第二預(yù) 設(shè)函數(shù)進行計算。將計算結(jié)果與第二闊值進行比較。當(dāng)計算結(jié)果小于第二闊值時,判斷第 一數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)一致。當(dāng)計算結(jié)果大于第二闊值時,判斷第一 數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。其中,第五記錄為第一數(shù)據(jù)表和第二數(shù)據(jù)表中具 有差異數(shù)據(jù)的記錄。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一 數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)一致。
[0296] 所述第二預(yù)設(shè)函數(shù)包括a/化+C)。其中,a為第五記錄的數(shù)量,b為第一數(shù)據(jù)表記 錄的數(shù)量,C為第二數(shù)據(jù)表記錄的數(shù)量。
[0297] 第二闊值的大小可W根據(jù)實際的需求而靈活設(shè)定。若對數(shù)據(jù)的一致性要求較高, 則第二闊值可w設(shè)定的小些。若對數(shù)據(jù)的一致性要求較低,則第二闊值可w設(shè)定的大些。 [029引在另一實施方式中,在判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第一數(shù)據(jù)表中的數(shù)據(jù)不一致 時,顯示差異數(shù)據(jù)。當(dāng)然,為了節(jié)省資源空間、計算時間W及考慮到實際需求,也可W顯示部 分差異數(shù)據(jù)(例如其中的100個)。
[0299] 在另一實施方式中,在步驟S305之前,分別對第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)進行忽略字符、忽略浮點精度或忽略字段內(nèi)分隔符處理。
[0300] 在另一實施方式中,在步驟S305之前,將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū) 域。從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和所述 第二區(qū)域中數(shù)據(jù)的屬性相同。相應(yīng)地,在步驟S305中,將第一區(qū)域每個記錄第一字段的數(shù) 據(jù)與第二區(qū)域第一字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù) 據(jù)。相應(yīng)地,在步驟S306中,根據(jù)檢測結(jié)果判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一 致。
[0301] 本實施例的數(shù)據(jù)對比方法,將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中。從而 實現(xiàn)了數(shù)據(jù)文件和數(shù)據(jù)表之間的數(shù)據(jù)對比。提高了本申請數(shù)據(jù)對比方法的通用性。
[0302] 與圖1和圖2所對應(yīng)的實施例相比,在本申請的另一個實施例中,可W將數(shù)據(jù)文件 中的數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)表中的數(shù)據(jù),從而實現(xiàn)了兩個數(shù)據(jù)文件之間的數(shù)據(jù)對比。如圖4所示, 包括:
[0303] S401 ;獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件。
[0304] 所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件中保存有待對比的數(shù)據(jù)。
[0305] 所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件包括txt文件、exl文件和word文件等。
[0306] S402;獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù) 量、每個字段的名稱和每個字段的數(shù)據(jù)類型。
[0307] S403;獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括字段的數(shù) 量、每個字段的名稱和每個字段的數(shù)據(jù)類型。
[030引 步驟S402、步驟S403的內(nèi)容與步驟S302的內(nèi)容相似。
[0309] S404 ;將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件中的數(shù)據(jù) 保存至第二數(shù)據(jù)表中。
[0310] 步驟S404的內(nèi)容與步驟S303的內(nèi)容相似。
[0311] S405;選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段,將選取的字段標(biāo)記為第一字段。
[0312] 步驟S405的內(nèi)容與步驟S102的內(nèi)容相類似。
[0313] S406;將第一數(shù)據(jù)表每個記錄第一字段的數(shù)據(jù)與第二數(shù)據(jù)表第一字段的數(shù)據(jù)進行 對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù)。
[0314] 步驟S406的內(nèi)容與步驟S103的內(nèi)容相類似。
[0315] S407;根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致。
[0316] 在某一實施方式中,當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,貝U 判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。當(dāng)檢測到第一數(shù)據(jù)表和第二 數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,則判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第二數(shù)據(jù)文件中的數(shù)據(jù)一 致。
[0317] 在另一實施方式中,可W設(shè)定第二闊值。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間 存在差異數(shù)據(jù)時,統(tǒng)計第五記錄的數(shù)量,統(tǒng)計第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄 的數(shù)量。根據(jù)第五記錄的數(shù)量、第一數(shù)據(jù)表記錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第二預(yù) 設(shè)函數(shù)進行計算。將計算結(jié)果與第二闊值進行比較。當(dāng)計算結(jié)果小于第二闊值時,判斷第 一數(shù)據(jù)文件中的數(shù)據(jù)和第二數(shù)據(jù)文件中的數(shù)據(jù)一致。當(dāng)計算結(jié)果大于第二闊值時,判斷第 一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。其中,第五記錄為第一數(shù)據(jù)表和第二數(shù)據(jù)表 中具有差異數(shù)據(jù)的記錄。當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷 第一數(shù)據(jù)文件中的數(shù)據(jù)和第二數(shù)據(jù)文件中的數(shù)據(jù)一致。
[031引所述第二預(yù)設(shè)函數(shù)包括a/化+C)。其中,a為第五記錄的數(shù)量,b為第一數(shù)據(jù)表記 錄的數(shù)量,C為第二數(shù)據(jù)表記錄的數(shù)量。
[0319] 第二闊值的大小可W根據(jù)實際的需求而靈活設(shè)定。若對數(shù)據(jù)的一致性要求較高, 則第二闊值可W設(shè)定的小些。若對數(shù)據(jù)的一致性要求較低,則第二闊值可W設(shè)定的大些。
[0320] 在另一實施方式中,在判斷第一數(shù)據(jù)文件中的數(shù)據(jù)和第二數(shù)據(jù)文件中的數(shù)據(jù)不一 致時,顯示差異數(shù)據(jù)。當(dāng)然,為了節(jié)省資源空間、計算時間W及考慮到實際需求,也可W顯示 部分差異數(shù)據(jù)(例如其中的100個)。
[0321] 在另一實施方式中,在步驟S406之前,分別對第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)進行忽略字符、忽略浮點精度或忽略字段內(nèi)分隔符處理。
[0322] 在另一實施方式中,在步驟S406之前,將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū) 域。從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和所述 第二區(qū)域中數(shù)據(jù)的屬性相同。相應(yīng)地,在步驟S406中,將第一區(qū)域每個記錄第一字段的數(shù) 據(jù)與第二區(qū)域第一字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù) 據(jù)。相應(yīng)地,在步驟S407中,根據(jù)檢測結(jié)果判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不 一致。
[0323] 本實施例的對比數(shù)據(jù)的方法,將第一數(shù)據(jù)文件中的數(shù)據(jù)轉(zhuǎn)換為第一數(shù)據(jù)表中的數(shù) 據(jù),將第二數(shù)據(jù)文件中的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù)表中的數(shù)據(jù),從而實現(xiàn)了數(shù)據(jù)文件之間的數(shù) 據(jù)對比。提高了本申請數(shù)據(jù)對比方法的通用性。
[0324] 本申請實施例還提供一種數(shù)據(jù)對比裝置,如圖5所示,包括:
[0325] 第一獲取模塊501,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0326] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0327] 第一對比模塊503,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共 有字段的數(shù)據(jù)進行對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[032引第一判斷模塊504,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是 否一致。
[0329] 在某一實施方式中,所述第一對比模塊503還包括第一對比單元505,用于將第一 數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比。
[0330] 在另一實施方式中,所述第一對比模塊503還包括第二對比單元506,用于獲取第 一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和 第Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記 錄為第一數(shù)據(jù)表的記錄,所述第Η記錄為第二數(shù)據(jù)表的記錄。
[0331] 在另一實施方式中,,所述裝置還包括;第一顯示模塊507,用于在判斷第一數(shù)據(jù) 表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[0332] 本申請實施例還提供另一種數(shù)據(jù)對比裝置,如圖6所示,包括:
[0333] 第二獲取模塊601,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0334] 第一建立模塊602,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第 一參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0335] 第一保存模塊603,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0336] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0337] 第一對比模塊503,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共 有字段的數(shù)據(jù)進行對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[033引第二判斷模塊604,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù) 是否一致。
[0339] 在某一實施方式中,所述第一對比模塊503還包括第一對比單元505,用于將第一 數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比。
[0340] 在另一實施方式中,所述第一對比模塊503還包括第二對比單元506,用于獲取第 一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和 第Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記 錄為第一數(shù)據(jù)表的記錄,所述第Η記錄為第二數(shù)據(jù)表的記錄。
[0341] 在另一實施方式中,所述裝置還包括第二顯示模塊605,用于在判斷第一數(shù)據(jù)文件 和第一數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[0342] 本申請實施例還提供另一種數(shù)據(jù)對比裝置,如圖7所示,包括:
[0343] 第Η獲取模塊701,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0344] 第二建立模塊702,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一 參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0345] 第Η建立模塊703,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二 參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0346] 第二保存模塊704,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù) 據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0347] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[034引第一對比模塊503,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共 有字段的數(shù)據(jù)進行對比,W檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù);
[0349] 第Η判斷模塊705,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù) 據(jù)是否一致。
[0350] 在某一實施方式中,所述第一對比模塊503還包括第一對比單元505,用于將第一 數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比。
[0351] 在另一實施方式中,所述第一對比模塊503還包括第二對比單元506,用于獲取第 一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和 第Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記 錄為第一數(shù)據(jù)表的記錄,所述第Η記錄為第二數(shù)據(jù)表的記錄。
[0352] 在另一實施方式中,所述裝置還包括第Η顯示模塊706,用于在判斷第一數(shù)據(jù)文件 和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[0353] 本申請實施例還提供另一種數(shù)據(jù)對比裝置,如圖8所示,包括:
[0354] 第一獲取模塊501,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表;
[0355] 分區(qū)模塊801,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)分成不同的區(qū)域; 防356] 第二選取模塊802,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二 區(qū)域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 防357] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[035引第二對比模塊803,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記 錄共有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0359] 第四判斷模塊804,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的數(shù)據(jù) 不一致。
[0360] 在某一實施方式中,所述裝置還包括;第一顯示模塊507,用于在判斷第一數(shù)據(jù)表 和第二數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[0361] 在另一實施方式中,所述第二對比模塊803包括第Η對比單元805,用于將第一區(qū) 域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比。
[0362] 在另一實施方式中,所述第二對比模塊803包括第四對比單元806,用于獲取第一 數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和第 Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記錄 為第一區(qū)域的記錄,所述第Η記錄為第二區(qū)域的記錄。
[0363] 本申請實施例還提供另一種數(shù)據(jù)對比裝置,如圖9所示,包括:
[0364] 第二獲取模塊601,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表;
[0365] 第一建立模塊602,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第 一參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0366] 第一保存模塊603,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0367] 分區(qū)模塊801,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)分成不同的區(qū)域;
[036引第二選取模塊802,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二 區(qū)域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0369] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0370] 第二對比模塊803,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記 錄共有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0371] 第五判斷模塊901,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù) 不一致。
[0372] 在某一實施方式中,所述第二對比模塊803包括第Η對比單元805,用于將第一區(qū) 域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比。
[0373] 在另一實施方式中,所述第二對比模塊803包括第四對比單元806,用于獲取第一 數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和第 Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記錄 為第一區(qū)域的記錄,所述第Η記錄為第二區(qū)域的記錄。
[0374] 在另一實施方式中,所述裝置還包括第二顯示模塊605,用于在判斷第一數(shù)據(jù)文件 和第一數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[0375] 本申請實施例還提供另一種數(shù)據(jù)對比裝置,如圖10所示,包括:
[0376] 第Η獲取模塊701,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件;
[0377] 第二建立模塊702,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一 參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[037引第Η建立模塊703,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二 參數(shù)包括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型;
[0379] 第二保存模塊704,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù) 據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中;
[0380] 分區(qū)模塊801,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表 中的數(shù)據(jù)分成不同的區(qū)域;
[0381] 第二選取模塊802,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二 區(qū)域,所述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性;
[0382] 第一選取模塊502,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段;
[0383] 第二對比模塊803,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記 錄共有字段的數(shù)據(jù)進行對比,W檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù);
[0384] 第六判斷模塊1001,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的 數(shù)據(jù)不一致。
[0385] 在某一實施方式中,所述第二對比模塊803包括第Η對比單元805,用于將第一區(qū) 域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比。
[0386] 在另一實施方式中,所述第二對比模塊803包括第四對比單元806,用于獲取第一 數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和第 Η記錄,將第二記錄共有字段的數(shù)據(jù)與第Η記錄共有字段的數(shù)據(jù)進行對比,所述第二記錄 為第一區(qū)域的記錄,所述第Η記錄為第二區(qū)域的記錄。
[0387] 在另一實施方式中,所述裝置還包括第Η顯示模塊706,用于在判斷第一數(shù)據(jù)文件 和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致之后,顯示差異數(shù)據(jù)。
[038引在20世紀(jì)90年代,對于一個技術(shù)的改進可W很明顯地區(qū)分是硬件上的改進(例 女口,對二極管、晶體管、開關(guān)等電路結(jié)構(gòu)的改進)還是軟件上的改進(對于方法流程的改 進)。然而,隨著技術(shù)的發(fā)展,當(dāng)今的很多方法流程的改進已經(jīng)可W視為硬件電路結(jié)構(gòu)的直 接改進。設(shè)計人員幾乎都通過將改進的方法流程編程到硬件電路中來得到相應(yīng)的硬件電路 結(jié)構(gòu)。因此,不能說一個方法流程的改進就不能用硬件實體模塊來實現(xiàn)。例如,可編程邏輯 器件(Programmable Logic Device, PLD)(例如現(xiàn)場可編程口陣列(Field Programmable Gate Array, FPGA))就是送樣一種集成電路,其邏輯功能由用戶對器件編程來確定。由設(shè) 計人員自行編程來把一個數(shù)字系統(tǒng)"集成"在一片PLD上,而不需要請芯片制造廠商來設(shè) 計和制作專用的集成電路芯片2。而且,如今,取代手工地制作集成電路芯片,送種編程也 多半改用"邏輯編譯器(logic compiler)"軟件來實現(xiàn),它與程序開發(fā)撰寫時所用的軟件 編譯器相類似,而要編譯之前的原始代碼也得用特定的編程語言來撰寫,此稱之為硬件描 述語言(Hardware Description Language,皿L),而皿L也并非僅有一種,而是有許多種, 女口 ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、 JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是 VHDL(Ve;ry-Hi 曲-Speed Integrated Circuit Hardware Description Language)與 Verilog2。本領(lǐng)域技術(shù)人員 也應(yīng)該清楚,只需要將方法流程用上述幾種硬件描述語言稍作邏輯編程并編程到集成電路 中,就可W很容易得到實現(xiàn)該邏輯方法流程的硬件電路。
[0389] 控制器可W按任何適當(dāng)?shù)姆绞綄崿F(xiàn),例如,控制器可W采取例如微處理器或處理 器W及存儲可由該(微)處理器執(zhí)行的計算機可讀程序代碼(例如軟件或固件)的計算 機可讀介質(zhì)、邏輯口、開關(guān)、專用集成電路(Application Specific Integrated Cir州it, ASIC)、可編程邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限于W下微控制 器;ARC 625D、Atmel AT91SAM、Microchip PIC18F2服20 U及 Silicone L油S C8051F320, 存儲器控制器還可W被實現(xiàn)為存儲器的控制邏輯的一部分。
[0390] 本領(lǐng)域技術(shù)人員也知道,除了 W純計算機可讀程序代碼方式實現(xiàn)控制器W外,完 全可W通過將方法步驟進行邏輯編程來使得控制器W邏輯Π 、開關(guān)、專用集成電路、可編程 邏輯控制器和嵌入微控制器等的形式來實現(xiàn)相同功能。因此送種控制器可W被認為是一種 硬件部件,而對其內(nèi)包括的用于實現(xiàn)各種功能的裝置也可W視為硬件部件內(nèi)的結(jié)構(gòu)?;蛘?甚至,可W將用于實現(xiàn)各種功能的裝置視為既可W是實現(xiàn)方法的軟件模塊又可W是硬件部 件內(nèi)的結(jié)構(gòu)。
[0391] 上述實施例闡明的系統(tǒng)、裝置、模塊或單元,具體可W由計算機芯片或?qū)嶓w實現(xiàn), 或者由具有某種功能的產(chǎn)品來實現(xiàn)。
[0392] 為了描述的方便,描述W上裝置時W功能分為各種單元分別描述。當(dāng)然,在實施本 申請時可W把各單元的功能在同一個或多個軟件和/或硬件中實現(xiàn)。
[0393] 通過W上的實施方式的描述可知,本領(lǐng)域的技術(shù)人員可W清楚地了解到本申請可 借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谒蜆拥睦斫猓旧暾埖募夹g(shù)方案本質(zhì) 上或者說對現(xiàn)有技術(shù)做出貢獻的部分可軟件產(chǎn)品的形式體現(xiàn)出來,在一個典型的配置 中,計算設(shè)備包括一個或多個處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。該計算機 軟件產(chǎn)品可W包括若干指令用W使得一臺計算機設(shè)備(可W是個人計算機,服務(wù)器,或者 網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。該計算機軟件產(chǎn) 品可W存儲在內(nèi)存中,內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲 器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是 計算機可讀介質(zhì)的示例。計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體 可W由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可W是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模 塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機存取 存儲器(SRAM)、動態(tài)隨機存取存儲器值RAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲 器(ROM)、電可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只 讀存儲器(CD-ROM)、數(shù)字多功能光盤值VD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲 或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可W被計算設(shè)備訪問的信息。按 照本文中的界定,計算機可讀介質(zhì)不包括短暫電腦可讀媒體(transitory media),如調(diào)制 的數(shù)據(jù)信號和載波。
[0394] 本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實 施例而言,由于其基本相似于方法實施例,所W描述的比較簡單,相關(guān)之處參見方法實施例 的部分說明即可。
[0395] 本申請可用于眾多通用或?qū)S玫挠嬎銠C系統(tǒng)環(huán)境或配置中。例如:個人計算機、月良 務(wù)器計算機、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置 頂盒、可編程的消費電子設(shè)備、網(wǎng)絡(luò)PC、小型計算機、大型計算機、包括W上任何系統(tǒng)或設(shè)備 的分布式計算環(huán)境等等。
[0396] 本申請可W在由計算機執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可W在分布式計算環(huán)境中實踐本申請,在送些分布式計算環(huán)境中,由 通過通信網(wǎng)絡(luò)而被連接的遠程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可W 位于包括存儲設(shè)備在內(nèi)的本地和遠程計算機存儲介質(zhì)中。
[0397] 雖然通過實施例描繪了本申請,本領(lǐng)域普通技術(shù)人員知道,本申請有許多變形和 變化而不脫離本申請的精神,希望所附的權(quán)利要求包括送些變形和變化而不脫離本申請的 精神。
【主權(quán)項】
1. 一種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,以檢 測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。2. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二 數(shù)據(jù)表中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù) 表中的數(shù)據(jù)不一致; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)表和第二數(shù) 據(jù)表中的數(shù)據(jù)一致。3. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二 數(shù)據(jù)表中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,統(tǒng)計第一記錄的數(shù)量,統(tǒng)計 第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄的數(shù)量,根據(jù)第一記錄的數(shù)量、第一數(shù)據(jù)表記 錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第一預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行 比較,根據(jù)比較結(jié)果判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致,其中,第一記錄為第 一數(shù)據(jù)表和第二數(shù)據(jù)表中具有差異數(shù)據(jù)的記錄; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)表和第二數(shù) 據(jù)表中的數(shù)據(jù)一致。4. 如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)表和第二 數(shù)據(jù)表之間的數(shù)據(jù)是否一致,包括: 當(dāng)計算結(jié)果小于第一閾值時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)一致; 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。5. -種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表; 獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每個 字段的名稱和每個字段的數(shù)據(jù)類型; 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,以檢 測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是否一致。6. 如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第 一數(shù)據(jù)表中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第一數(shù) 據(jù)表中的數(shù)據(jù)不一致; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第一 數(shù)據(jù)表中的數(shù)據(jù)一致。7. 如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第 一數(shù)據(jù)表中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,統(tǒng)計第一記錄的數(shù)量,統(tǒng)計 第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄的數(shù)量,根據(jù)第一記錄的數(shù)量、第一數(shù)據(jù)表記 錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第一預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行 比較,根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是否一致,其中,第一記錄為 第一數(shù)據(jù)表和第二數(shù)據(jù)表中具有差異數(shù)據(jù)的記錄; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第一 數(shù)據(jù)表中的數(shù)據(jù)一致。8. 如權(quán)利要求7所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和第 一數(shù)據(jù)表中的數(shù)據(jù)是否一致,包括: 當(dāng)計算結(jié)果小于第一閾值時,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)一致; 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。9. 一種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件; 獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每個字 段的名稱和每個字段的數(shù)據(jù)類型; 獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括字段的數(shù)量、每個字 段的名稱和每個字段的數(shù)據(jù)類型; 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件中的數(shù)據(jù)保存至第二 數(shù)據(jù)表中; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,以檢 測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致。10. 如權(quán)利要求9所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第二數(shù) 據(jù)文件中的數(shù)據(jù)不一致; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第二 數(shù)據(jù)文件中的數(shù)據(jù)一致。11. 如權(quán)利要求9所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致,包括: 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間存在差異數(shù)據(jù)時,統(tǒng)計第一記錄的數(shù)量,統(tǒng)計 第一數(shù)據(jù)表記錄的數(shù)量,統(tǒng)計第二數(shù)據(jù)表記錄的數(shù)量,根據(jù)第一記錄的數(shù)量、第一數(shù)據(jù)表記 錄的數(shù)量和第二數(shù)據(jù)表記錄的數(shù)量按第一預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行 比較,根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致,其中,第一記錄 為第一數(shù)據(jù)表和第二數(shù)據(jù)表中具有差異數(shù)據(jù)的記錄; 當(dāng)檢測到第一數(shù)據(jù)表和第二數(shù)據(jù)表之間不存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第二 數(shù)據(jù)文件中的數(shù)據(jù)一致。12. 如權(quán)利要求11所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)是否一致,包括: 當(dāng)計算結(jié)果小于第一閾值時,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)一致; 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。13. 如權(quán)利要求1、5或9所述的方法,其特征在于,所述將第一數(shù)據(jù)表每個記錄共有字 段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,包括: 將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行 對比。14. 如權(quán)利要求1、5或9所述的方法,其特征在于,所述將第一數(shù)據(jù)表每個記錄共有字 段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比,包括: 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵; 針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和第三記錄,所述第二記錄為第一 數(shù)據(jù)表的記錄,所述第三記錄為第二數(shù)據(jù)表的記錄; 將第二記錄共有字段的數(shù)據(jù)與第三記錄共有字段的數(shù)據(jù)進行對比。15. 如權(quán)利要求13所述的方法,其特征在于,所述將第一數(shù)據(jù)表每個記錄共有字段的 數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄每個共有字段的數(shù)據(jù)分別與第三記錄每個共有字段的數(shù)據(jù)進行對比,所述 第二記錄為第一數(shù)據(jù)表的任一記錄,所述第三記錄為第二數(shù)據(jù)表的任一記錄。16. 如權(quán)利要求13所述的方法,其特征在于,所述將第一數(shù)據(jù)表每個記錄共有字段的 數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第一順序拼接,將第三記錄共有字段的數(shù)據(jù)按第一順序 拼接,所述第二記錄為第一數(shù)據(jù)表的任一記錄,所述第三記錄為第二數(shù)據(jù)表的任一記錄; 將第二記錄拼接后的數(shù)據(jù)與第三記錄拼接后的數(shù)據(jù)進行對比。17. 如權(quán)利要求13所述的方法,其特征在于,所述將第一數(shù)據(jù)表每個記錄共有字段的 數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第一數(shù)據(jù),所 述第二記錄為第一數(shù)據(jù)表的任一記錄; 將第三記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù),所 述第三記錄為第二數(shù)據(jù)表的任一記錄; 將第一數(shù)據(jù)與第二數(shù)據(jù)進行對比。18. 如權(quán)利要求14所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄每個共有字段的數(shù)據(jù)分別與第三記錄每個共有字段的數(shù)據(jù)進行對比。19. 如權(quán)利要求14所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第一順序拼接,將第三記錄共有字段的數(shù)據(jù)按第一順序 拼接; 將第二記錄拼接后的數(shù)據(jù)與第三記錄拼接后的數(shù)據(jù)進行對比。20. 如權(quán)利要求14所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第一數(shù)據(jù); 將第三記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù); 將第一數(shù)據(jù)與第二數(shù)據(jù)進行對比。21. 如權(quán)利要求3、7或11所述的方法,其特征在于,所述第一預(yù)設(shè)函數(shù)包括:aAb+c), 其中,a為第一記錄的數(shù)量,b為第一數(shù)據(jù)表記錄的數(shù)量,c為第二數(shù)據(jù)表記錄的數(shù)量。22. 如權(quán)利要求18所述的方法,其特征在于,所述將第二記錄每個共有字段的數(shù)據(jù)分 別與第三記錄每個共有字段的數(shù)據(jù)進行對比,以檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存 在差異數(shù)據(jù),包括: 從共有字段中選取第一字段,所述第一字段為數(shù)據(jù)類型為整數(shù)或?qū)崝?shù)的字段; 根據(jù)第二記錄第一字段的數(shù)據(jù)和第三記錄第一字段的數(shù)據(jù)按第二預(yù)設(shè)函數(shù)進行計 算; 將計算結(jié)果與第二閾值進行比較,以檢測第二記錄第一字段和第三記錄第一字段之間 是否存在差異數(shù)據(jù)。23. 如權(quán)利要求22所述的方法,其特征在于,所述第二預(yù)設(shè)函數(shù)包括: abs (a. md-b. md) /max (a. md, b. md),其中,abs為取絕對值運算,max為取最大值運算,a 為第一數(shù)據(jù)表,b為第二數(shù)據(jù)表,md為第一字段。24. -種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表; 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域; 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和所述 第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,以檢測第 一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。25. 如權(quán)利要求24所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第 二數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中 的數(shù)據(jù)不一致。26. 如權(quán)利要求24所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第 二數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,統(tǒng)計第二記錄的數(shù)量,統(tǒng)計第一 區(qū)域記錄的數(shù)量,統(tǒng)計第二區(qū)域記錄的數(shù)量,根據(jù)第二記錄的數(shù)量、第一區(qū)域記錄的數(shù)量和 第二區(qū)域記錄的數(shù)量按第三預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行比較,根據(jù)比 較結(jié)果判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致,其中,第二記錄為第一區(qū)域和第二 區(qū)域中具有差異數(shù)據(jù)的記錄。27. 如權(quán)利要求26所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)表和第 二數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致。28. 如權(quán)利要求2、4、25或27所述的方法,其特征在于,在判斷第一數(shù)據(jù)表和第二數(shù)據(jù) 表中的數(shù)據(jù)不一致之后,所述方法還包括:顯示差異數(shù)據(jù)。29. -種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表; 獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每個 字段的名稱和每個字段的數(shù)據(jù)類型; 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域; 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和所述 第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,以檢測第 一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。30. 如權(quán)利要求29所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第一數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表 中的數(shù)據(jù)不一致。31. 如權(quán)利要求29所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第一數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,統(tǒng)計第二記錄的數(shù)量,統(tǒng)計第一 區(qū)域記錄的數(shù)量,統(tǒng)計第二區(qū)域記錄的數(shù)量,根據(jù)第二記錄的數(shù)量、第一區(qū)域記錄的數(shù)量和 第二區(qū)域記錄的數(shù)量按第三預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行比較,根據(jù)比 較結(jié)果判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致,其中,第二記錄為第一區(qū)域和第 二區(qū)域中具有差異數(shù)據(jù)的記錄。32. 如權(quán)利要求31所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和 第一數(shù)據(jù)表中的數(shù)據(jù)不一致,包括: 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。33. 如權(quán)利要求6、8、30或32所述的方法,其特征在于,在判斷第一數(shù)據(jù)文件和第一數(shù) 據(jù)表中的數(shù)據(jù)不一致之后,所述方法還包括:顯示差異數(shù)據(jù)。34. -種數(shù)據(jù)對比方法,其特征在于,包括: 獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件; 獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括字段的數(shù)量、每個字 段的名稱和每個字段的數(shù)據(jù)類型; 獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括字段的數(shù)量、每個字 段的名稱和每個字段的數(shù)據(jù)類型; 將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件中的數(shù)據(jù)保存至第二 數(shù)據(jù)表中; 按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表和第二數(shù)據(jù)表分成不同的區(qū)域; 從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所述第一區(qū)域和所述 第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,以檢測第 一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。35. 如權(quán)利要求34所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文 件中的數(shù)據(jù)不一致。36. 如權(quán)利要求34所述的方法,其特征在于,所述根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)不一致,包括: 當(dāng)檢測到第一區(qū)域和第二區(qū)域之間存在差異數(shù)據(jù)時,統(tǒng)計第二記錄的數(shù)量,統(tǒng)計第一 區(qū)域記錄的數(shù)量,統(tǒng)計第二區(qū)域記錄的數(shù)量,根據(jù)第二記錄的數(shù)量、第一區(qū)域記錄的數(shù)量和 第二區(qū)域記錄的數(shù)量按第三預(yù)設(shè)函數(shù)進行計算,將計算結(jié)果與第一閾值進行比較,根據(jù)比 較結(jié)果判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致,其中,第二記錄為第一區(qū)域和 第二區(qū)域中具有差異數(shù)據(jù)的記錄。37. 如權(quán)利要求36所述的方法,其特征在于,所述根據(jù)比較結(jié)果判斷第一數(shù)據(jù)文件和 第二數(shù)據(jù)文件中的數(shù)據(jù)不一致,包括: 當(dāng)計算結(jié)果大于第一閾值時,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致。38. 如權(quán)利要求10、12、35或37所述的方法,其特征在于,在判斷第一數(shù)據(jù)文件和第二 數(shù)據(jù)文件中的數(shù)據(jù)不一致之后,所述方法還包括:顯示差異數(shù)據(jù)。39. 如權(quán)利要求24、29或34所述的方法,其特征在于,所述將第一區(qū)域每個記錄共有字 段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,包括: 將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比。40. 如權(quán)利要求24、29或34所述的方法,其特征在于,所述將第一區(qū)域每個記錄共有字 段的數(shù)據(jù)與第二區(qū)域共有字段的數(shù)據(jù)進行對比,包括: 獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵; 針對每個主鍵值,獲取該主鍵值所對應(yīng)的第二記錄和第三記錄,所述第二記錄為第一 區(qū)域的記錄,所述第三記錄為第二區(qū)域的記錄; 將第二記錄共有字段的數(shù)據(jù)與第三記錄共有字段的數(shù)據(jù)進行對比。41. 如權(quán)利要求39所述的方法,其特征在于,所述將第一區(qū)域每個記錄共有字段的數(shù) 據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄每個共有字段的數(shù)據(jù)分別與第三記錄每個共有字段的數(shù)據(jù)進行對比,所述 第二記錄為第一區(qū)域的任一記錄,所述第三記錄為第二區(qū)域的任一記錄。42. 如權(quán)利要求39所述的方法,其特征在于,所述將第一區(qū)域每個記錄共有字段的數(shù) 據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第一順序拼接,將第三記錄共有字段的數(shù)據(jù)按第一順序 拼接,所述第二記錄為第一區(qū)域的任一記錄,所述第三記錄為第二區(qū)域的任一記錄; 將第二記錄拼接后的數(shù)據(jù)與第三記錄拼接后的數(shù)據(jù)進行對比。43. 如權(quán)利要求39所述的方法,其特征在于,所述將第一區(qū)域每個記錄共有字段的數(shù) 據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第一數(shù)據(jù),所 述第二記錄為第一區(qū)域的任一記錄; 將第三記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù),所 述第三記錄為第二區(qū)域的任一記錄; 將第一數(shù)據(jù)與第二數(shù)據(jù)進行對比。44. 如權(quán)利要求40所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄每個共有字段的數(shù)據(jù)分別與第三記錄每個共有字段的數(shù)據(jù)進行對比。45. 如權(quán)利要求40所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第一順序拼接,將第三記錄共有字段的數(shù)據(jù)按第一順序 拼接; 將第二記錄拼接后的數(shù)據(jù)與第三記錄拼接后的數(shù)據(jù)進行對比。46. 如權(quán)利要求40所述的方法,其特征在于,所述將第二記錄共有字段的數(shù)據(jù)與第三 記錄共有字段的數(shù)據(jù)進行對比,包括: 將第二記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第一數(shù)據(jù); 將第三記錄共有字段的數(shù)據(jù)按第二順序拼接,并將拼接后的數(shù)據(jù)轉(zhuǎn)換為第二數(shù)據(jù); 將第一數(shù)據(jù)與第二數(shù)據(jù)進行對比。47. 如權(quán)利要求26、31或36所述的方法,其特征在于,所述第三預(yù)設(shè)函數(shù)包括:a/ (b+c),其中,a為第一記錄的數(shù)量,b為第一區(qū)域記錄的數(shù)量,c為第二區(qū)域記錄的數(shù)量。48. 如權(quán)利要求44所述的方法,其特征在于,所述將第二記錄每個共有字段的數(shù)據(jù)分 別與第三記錄每個共有字段的數(shù)據(jù)進行對比,以檢測第一區(qū)域和第二區(qū)域之間是否存在差 異數(shù)據(jù),包括: 從共有字段中選取第一字段,所述第一字段為數(shù)據(jù)類型為整數(shù)或?qū)崝?shù)的字段; 根據(jù)第二記錄第一字段的數(shù)據(jù)和第三記錄第一字段的數(shù)據(jù)按第四預(yù)設(shè)函數(shù)進行計 算; 將計算結(jié)果與第二閾值進行比較,以檢測第二記錄第一字段和第三記錄第一字段之間 是否存在差異數(shù)據(jù)。49. 如權(quán)利要求48所述的方法,其特征在于,所述第四預(yù)設(shè)函數(shù)包括: abs (a. md-b. md) /max (a. md, b. md),其中,abs為取絕對值運算,max為取最大值運算,a 為第一區(qū)域,b為第二區(qū)域,md為第一字段。50. 如權(quán)利要求17、20、43或46所述的方法,其特征在于,所述第一數(shù)據(jù)和所述第二數(shù) 據(jù)為MD5數(shù)據(jù)。51. 如權(quán)利要求1、5、9、24、28或32所述的方法,其特征在于,所述選取第一數(shù)據(jù)表和第 二數(shù)據(jù)表的共有字段,包括: 選取第一數(shù)據(jù)表中和第二數(shù)據(jù)表中名稱相同的字段。52. 如權(quán)利要求1、5、9、24、29或34所述的方法,其特征在于,在將第一數(shù)據(jù)表每個記錄 共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的數(shù)據(jù)進行對比之前,所述方法還包括: 對第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù)據(jù)進行忽略字符、忽略浮點精度或忽略字 段內(nèi)分隔符處理。53. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第一獲取模塊,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的 數(shù)據(jù)進行對比,以檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 第一判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)是否一致。54. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第二獲取模塊,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表; 第一建立模塊,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包 括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第一保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的 數(shù)據(jù)進行對比,以檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 第二判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)是否一 致。55. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第三獲取模塊,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件; 第二建立模塊,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括 字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第三建立模塊,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括 字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第二保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件 中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第一對比模塊,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表共有字段的 數(shù)據(jù)進行對比,以檢測第一數(shù)據(jù)表和第二數(shù)據(jù)表之間是否存在差異數(shù)據(jù); 第三判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)是否 一致。56. 如權(quán)利要求53、54或55所述的裝置,其特征在于,所述第一對比模塊包括第一對比 單元,用于將第一數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù)與第二數(shù)據(jù)表每個記錄共有字段的數(shù)據(jù) 進行對比。57. 如權(quán)利要求53、54或55所述的裝置,其特征在于,所述第一對比模塊包括第二對比 單元,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第二記錄和第三記錄,將第二記錄共有字段的數(shù)據(jù)與第三記錄共有字段的數(shù)據(jù)進行對 t匕,所述第二記錄為第一數(shù)據(jù)表的記錄,所述第三記錄為第二數(shù)據(jù)表的記錄。58. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第一獲取模塊,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表; 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù) 據(jù)分成不同的區(qū)域; 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所 述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字 段的數(shù)據(jù)進行對比,以檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 第四判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的數(shù)據(jù)不一致。59. 如權(quán)利要求53或58所述的裝置,其特征在于,所述裝置還包括: 第一顯示模塊,用于在判斷第一數(shù)據(jù)表和第二數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差異 數(shù)據(jù)。60. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第二獲取模塊,用于獲取第一數(shù)據(jù)文件和第一數(shù)據(jù)表; 第一建立模塊,用于獲取第一參數(shù),并根據(jù)第一參數(shù)建立第二數(shù)據(jù)表,所述第一參數(shù)包 括字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第一保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù) 據(jù)分成不同的區(qū)域; 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所 述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字 段的數(shù)據(jù)進行對比,以檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 第五判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致。61. 如權(quán)利要求54或60所述的裝置,其特征在于,所述裝置還包括: 第二顯示模塊,用于在判斷第一數(shù)據(jù)文件和第一數(shù)據(jù)表中的數(shù)據(jù)不一致之后,顯示差 異數(shù)據(jù)。62. -種數(shù)據(jù)對比裝置,其特征在于,包括: 第三獲取模塊,用于獲取第一數(shù)據(jù)文件和第二數(shù)據(jù)文件; 第二建立模塊,用于獲取第一參數(shù),根據(jù)第一參數(shù)建立第一數(shù)據(jù)表,所述第一參數(shù)包括 字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第三建立模塊,用于獲取第二參數(shù),根據(jù)第二參數(shù)建立第二數(shù)據(jù)表,所述第二參數(shù)包括 字段的數(shù)量、每個字段的名稱和每個字段的數(shù)據(jù)類型; 第二保存模塊,用于將第一數(shù)據(jù)文件中的數(shù)據(jù)保存至第一數(shù)據(jù)表中,將第二數(shù)據(jù)文件 中的數(shù)據(jù)保存至第二數(shù)據(jù)表中; 分區(qū)模塊,用于按照預(yù)設(shè)分區(qū)規(guī)則,分別將第一數(shù)據(jù)表中的數(shù)據(jù)和第二數(shù)據(jù)表中的數(shù) 據(jù)分成不同的區(qū)域; 第二選取模塊,用于從第一數(shù)據(jù)表中選取第一區(qū)域,從第二數(shù)據(jù)表中選取第二區(qū)域,所 述第一區(qū)域和所述第二區(qū)域中的數(shù)據(jù)具有相同的屬性; 第一選取模塊,用于選取第一數(shù)據(jù)表和第二數(shù)據(jù)表的共有字段; 第二對比模塊,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字 段的數(shù)據(jù)進行對比,以檢測第一區(qū)域和第二區(qū)域之間是否存在差異數(shù)據(jù); 第六判斷模塊,用于根據(jù)檢測結(jié)果,判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一 致。63. 如權(quán)利要求55或62所述的裝置,其特征在于,所述裝置還包括: 第三顯示模塊,用于在判斷第一數(shù)據(jù)文件和第二數(shù)據(jù)文件中的數(shù)據(jù)不一致之后,顯示 差異數(shù)據(jù)。64. 如權(quán)利要求58、60或62所述的裝置,其特征在于,所述第二對比模塊包括第三對比 單元,用于將第一區(qū)域每個記錄共有字段的數(shù)據(jù)與第二區(qū)域每個記錄共有字段的數(shù)據(jù)進行 對比。65. 如權(quán)利要求58、60或62所述的裝置,其特征在于,所述第二對比模塊包括第四對比 單元,用于獲取第一數(shù)據(jù)表和第二數(shù)據(jù)表之間的主鍵,針對每個主鍵值,獲取該主鍵值所對 應(yīng)的第二記錄和第三記錄,將第二記錄共有字段的數(shù)據(jù)與第三記錄共有字段的數(shù)據(jù)進行對 t匕,所述第二記錄為第一區(qū)域的記錄,所述第三記錄為第二區(qū)域的記錄。
【文檔編號】G06F17/30GK105989089SQ201510075473
【公開日】2016年10月5日
【申請日】2015年2月12日
【發(fā)明人】曲丹鶴
【申請人】阿里巴巴集團控股有限公司