一種文件報表比對差異的逆向分析方法及裝置的制造方法
【專利摘要】本發(fā)明提供了一種文件報表比對差異的逆向分析方法及裝置,涉及數(shù)據(jù)分析技術(shù)領(lǐng)域。方法包括:獲取文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù),并格式轉(zhuǎn)換為預(yù)設(shè)的內(nèi)部格式;生成文件報表及交易源數(shù)據(jù)各自的字段拓撲關(guān)系和記錄拓撲關(guān)系;確定待比較的文件字段或報表字段的最小集合;確定差異文件字段和差異報表字段,并確定差異交易字段;逆向確定差異交易字段所對應(yīng)的差異交易記錄,并確定差異文件記錄和差異報表記錄;之后根據(jù)分析特征樹,進行特征樹匹配,確定文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)存在差異的原因特征。本發(fā)明解決了當前人工定位分析差異,工作量較大,分析效率低下且不準確的問題。
【專利說明】
一種文件報表比對差異的逆向分析方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,尤其涉及一種文件報表比對差異的逆向分析方法 及裝置。
【背景技術(shù)】
[0002] 當前,隨著電子技術(shù)與金融業(yè)的發(fā)展。銀行卡已經(jīng)在商業(yè)領(lǐng)域中得到了廣泛的應(yīng) 用。因此,在銀行卡領(lǐng)域中,一般通過文件報表記錄銀行卡的大量交易數(shù)據(jù)等。為了更好的 保存大量交易數(shù)據(jù),一般會對文件報表進行應(yīng)用系統(tǒng)升級更新。而在更新前后,文件報表一 般會存在差異。
[0003] 目前,為了分析文件報表中的差異,一般是針對每個報表欄位或文件字段的差異, 人工來定位引起差異的交易記錄,人工分析工作量較大,且分析效率低下,并且難以準確確 定更新前后文件報表所存在的差異。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的實施例提供一種文件報表比對差異的逆向分析方法及裝置,以解決當前 由人工來定位分析文件報表中的差異,工作量較大,效率低下,且難以準確確定更新前后文 件報表所存在的差異的問題。
[0005] 為達到上述目的,本發(fā)明采用如下技術(shù)方案:
[0006] -種文件報表比對差異的逆向分析方法,包括:
[0007] 獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文件報表及交易源數(shù)據(jù),以及文件報表應(yīng) 用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù);
[0008] 將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換為 預(yù)先設(shè)置的內(nèi)部格式;其中,進行格式轉(zhuǎn)換后的第一文件報表及交易源數(shù)據(jù)包括第一交易 字段、第一文件字段、第一報表字段、第一交易記錄、第一文件記錄以及第一報表記錄;進行 格式轉(zhuǎn)換后的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文件字段、第二報表字 段、第二交易記錄、第二文件記錄以及第二報表記錄;
[0009] 生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系,并生成第 二交易字段、第二文件字段、第二報表字段的第二文件字段拓撲關(guān)系;
[0010] 根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記錄的配置關(guān)系,生成第一交易 記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系,并生成第二交易記錄、第二文 件記錄以及第二報表記錄的第二記錄拓撲關(guān)系;
[0011]根據(jù)所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系,確定待比較的文件字段或 報表字段,并生成待比較文件字段或報表字段的最小集合;
[0012]根據(jù)所述第一字段拓撲關(guān)系、所述第二字段拓撲關(guān)系以及所述最小集合進行字段 比較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所存在的差異文件 字段和差異報表字段,并定位所述差異文件字段和字段差異報表在第一字段拓撲關(guān)系以及 第二字段拓撲關(guān)系中所對應(yīng)的差異交易字段;
[0013] 根據(jù)所述第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定所述差異交易字段所 對應(yīng)的差異交易記錄,并確定所述差異交易記錄所對應(yīng)的差異文件記錄和差異報表記錄;
[0014] 根據(jù)所述差異交易記錄、差異文件記錄和差異報表記錄以及預(yù)先設(shè)置的分析特征 樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在 差異的原因特征。
[0015] 具體的,將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)的數(shù)據(jù)格式 轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式,包括:
[0016] 配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄和第二文件報表及交易源數(shù) 據(jù)中的第二文件記錄中的第一關(guān)鍵要素;所述第一關(guān)鍵要素包括第一字段名稱、第一字段 長度、第一偏移量、第一字段取值、第一交易記錄字段名稱;根據(jù)所述第一關(guān)鍵要素將所述 第一文件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一文件內(nèi)部格式數(shù)據(jù)和第 二文件內(nèi)部格式數(shù)據(jù);
[0017] 配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄和第二文件報表及交易源數(shù) 據(jù)中的第二報表記錄中的第二關(guān)鍵要素;所述第二關(guān)鍵要素包括第二字段名稱、第二字段 長度、第二偏移量,第二字段取值,字段生成的SQL語句和報表對應(yīng)的交易記錄字段集合;根 據(jù)所述第二關(guān)鍵要素將所述第一報表記錄和所述第二報表記錄轉(zhuǎn)換為所述內(nèi)部格式,生成 第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù);
[0018] 配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄和第二文件報表及交易源數(shù) 據(jù)中的第二交易記錄中的第三關(guān)鍵要素;所述第三關(guān)鍵要素包括第三字段名稱、第三字段 長度、第三字段取值;根據(jù)所述第三關(guān)鍵要素將所述第一交易記錄和所述第二交易記錄轉(zhuǎn) 換為所述內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)。
[0019] 具體的,所述生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān) 系,并生成第二交易字段、第二文件字段、第二報表字段的第二文件字段拓撲關(guān)系,包括:
[0020] 遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的記錄主鍵,在第一文件內(nèi) 部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄主鍵;
[0021] 根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的交易記錄字段名稱,在第 一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分別獲取各自對應(yīng)的字段名稱,以建立第 一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二文件內(nèi)部格式數(shù)據(jù) 與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系;
[0022] 遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù),根據(jù)所述字段生成的SQL 語句,獲取第一報表字段和第二報表字段各自對應(yīng)的交易記錄主鍵集合;
[0023] 根據(jù)所述交易記錄主鍵集合,獲取到第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式 數(shù)據(jù)分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù);
[0024] 根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄字段名稱, 獲取各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名稱,以建立第 一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表內(nèi)部格式數(shù)據(jù) 與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系;
[0025] 根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第一報表內(nèi)部 格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第一交易字段、第一 文件字段、第一報表字段的第一字段拓撲關(guān)系;
[0026] 根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第二報表內(nèi)部 格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第二交易字段、第二 文件字段、第二報表字段的第二字段拓撲關(guān)系。
[0027] 具體的,根據(jù)所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系,確定待比較的文 件字段或報表字段,并生成待比較文件字段或報表字段的最小集合,包括:
[0028] 根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名稱,從所述第一字段拓撲關(guān)系和所述 第二字段拓撲關(guān)系中確定待比較的文件字段,并排除無需比較的文件字段;
[0029] 根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名稱,從所述第一字段拓撲關(guān)系和所述 第二字段拓撲關(guān)系中確定待比較的報表字段,并排除無需比較的報表字段;
[0030] 若在第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中存在同一個交易字段對應(yīng)多 個文件字段或者多個報表字段,則僅將多個文件字段中的一個文件字段作為待比較的文件 字段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字段。
[0031] 具體的,所述預(yù)先設(shè)置的分析特征樹包括多個已知差異原因的特征匹配腳本;
[0032] 根據(jù)所述差異交易記錄、差異文件記錄和差異報表記錄以及預(yù)先設(shè)置的分析特征 樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在 差異的原因特征,包括:
[0033] 根據(jù)差異交易記錄的主鍵、差異文件記錄的主鍵、差異報表記錄的主鍵以及差異 文件字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳本;
[0034] 與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記錄、差異文件記錄和 差異報表記錄中的相關(guān)信息是否不一致;
[0035] 若所述相關(guān)信息不一致,則進行特征樹匹配完成,確定第一文件報表及交易源數(shù) 據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0036] -種文件報表比對差異的逆向分析裝置,包括:
[0037] 文件報表及交易源數(shù)據(jù)獲取單元,用于獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文 件報表及交易源數(shù)據(jù),以及文件報表應(yīng)用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù); [0038]數(shù)據(jù)格式轉(zhuǎn)換單元,用于將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源 數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式;其中,進行格式轉(zhuǎn)換后的第一文件報表及交 易源數(shù)據(jù)包括第一交易字段、第一文件字段、第一報表字段、第一交易記錄、第一文件記錄 以及第一報表記錄;進行格式轉(zhuǎn)換后的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第 二文件字段、第二報表字段、第二交易記錄、第二文件記錄以及第二報表記錄;
[0039] 字段拓撲關(guān)系生成單元,用于生成第一交易字段、第一文件字段、第一報表字段的 第一字段拓撲關(guān)系,并生成第二交易字段、第二文件字段、第二報表字段的第二文件字段拓 撲關(guān)系;
[0040] 記錄拓撲關(guān)系生成單元,用于根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記 錄的配置關(guān)系,生成第一交易記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系, 并生成第二交易記錄、第二文件記錄以及第二報表記錄的第二記錄拓撲關(guān)系;
[0041] 待比較內(nèi)容確定單元,用于根據(jù)所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān) 系,確定待比較的文件字段或報表字段,并生成待比較文件字段或報表字段的最小集合;
[0042] 差異比較單元,用于根據(jù)所述第一字段拓撲關(guān)系、所述第二字段拓撲關(guān)系以及所 述最小集合進行字段比較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù) 的所存在的差異文件字段和差異報表字段,并定位所述差異文件字段和字段差異報表在第 一字段拓撲關(guān)系以及第二字段拓撲關(guān)系中所對應(yīng)的差異交易字段;
[0043] 逆向確定單元,用于根據(jù)所述第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定所 述差異交易字段所對應(yīng)的差異交易記錄,并確定所述差異交易記錄所對應(yīng)的差異文件記錄 和差異報表記錄;
[0044] 特征樹匹配分析單元,用于根據(jù)所述差異交易記錄、差異文件記錄和差異報表記 錄以及預(yù)先設(shè)置的分析特征樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二 文件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0045] 具體的,所述數(shù)據(jù)格式轉(zhuǎn)換單元,包括:
[0046] 文件記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄和第 二文件報表及交易源數(shù)據(jù)中的第二文件記錄中的第一關(guān)鍵要素;所述第一關(guān)鍵要素包括第 一字段名稱、第一字段長度、第一偏移量、第一字段取值、第一交易記錄字段名稱;根據(jù)所述 第一關(guān)鍵要素將所述第一文件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一文 件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù);
[0047] 報表記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄和第 二文件報表及交易源數(shù)據(jù)中的第二報表記錄中的第二關(guān)鍵要素;所述第二關(guān)鍵要素包括第 二字段名稱、第二字段長度、第二偏移量,第二字段取值,字段生成的SQL語句和報表對應(yīng)的 交易記錄字段集合;根據(jù)所述第二關(guān)鍵要素將所述第一報表記錄和所述第二報表記錄轉(zhuǎn)換 為所述內(nèi)部格式,生成第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù);
[0048] 交易記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄和第 二文件報表及交易源數(shù)據(jù)中的第二交易記錄中的第三關(guān)鍵要素;所述第三關(guān)鍵要素包括第 三字段名稱、第三字段長度、第三字段取值;根據(jù)所述第三關(guān)鍵要素將所述第一交易記錄和 所述第二交易記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式 數(shù)據(jù)。
[0049] 具體的,所述字段拓撲關(guān)系生成單元,包括:
[0050] 記錄主鍵獲取模塊,用于遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的 記錄主鍵,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄主 鍵;
[0051] 第一字段拓撲關(guān)系生成模塊,用于根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格 式數(shù)據(jù)的交易記錄字段名稱,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分別獲 取各自對應(yīng)的字段名稱,以建立第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān) 系,并建立第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系;
[0052]交易記錄主鍵集合獲取模塊,用于遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格 式數(shù)據(jù),根據(jù)所述字段生成的SQL語句,獲取第一報表字段和第二報表字段各自對應(yīng)的交易 記錄主鍵集合;
[0053]第二字段拓撲關(guān)系生成模塊,用于根據(jù)所述交易記錄主鍵集合,獲取到第一報表 內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi) 部格式數(shù)據(jù);根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄字段名 稱,獲取各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名稱,以建 立第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表內(nèi)部格式 數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系;
[0054] 第三字段拓撲關(guān)系生成模塊,用于根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格 式數(shù)據(jù)的拓撲關(guān)系、第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易 主鍵一致,生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系;
[0055] 第四字段拓撲關(guān)系生成模塊,用于根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格 式數(shù)據(jù)的拓撲關(guān)系、第二報表內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易 主鍵一致,生成第二交易字段、第二文件字段、第二報表字段的第二字段拓撲關(guān)系。
[0056] 具體的,所述待比較內(nèi)容確定單元,包括:
[0057]待比較文件字段確定模塊,用于根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名稱, 從所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中確定待比較的文件字段,并排除無需 比較的文件字段;
[0058] 待比較報表字段確定模塊,用于根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名稱, 從所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中確定待比較的報表字段,并排除無需 比較的報表字段;
[0059] 最小集合確定模塊,用于在第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中存在同 一個交易字段對應(yīng)多個文件字段或者多個報表字段時,僅將多個文件字段中的一個文件字 段作為待比較的文件字段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字 段。
[0060] 具體的,所述特征樹匹配分析單元中的預(yù)先設(shè)置的分析特征樹包括多個已知差異 原因的特征匹配腳本;
[0061] 所述特征樹匹配分析單元,包括:
[0062] 特征匹配腳本遍歷模塊,用于根據(jù)差異交易記錄的主鍵、差異文件記錄的主鍵、差 異報表記錄的主鍵以及差異文件字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳本;
[0063] 判斷模塊,用于與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記錄、差 異文件記錄和差異報表記錄中的相關(guān)信息是否不一致;
[0064] 差異原因特征確定模塊,用于在所述相關(guān)信息不一致時,進行特征樹匹配完成,確 定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0065] 本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法及裝置,能夠?qū)⑽募?報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的預(yù)設(shè)內(nèi)部格式,并生成字段 拓撲關(guān)系和記錄拓撲關(guān)系;從而能夠根據(jù)段拓撲關(guān)系和記錄拓撲關(guān)系逆向定位差異交易記 錄、差異文件記錄以及差異報表記錄;進而通過預(yù)設(shè)的分析特征數(shù),進行特征樹匹配,自動 獲取到文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)存在差異的原因特征。可見, 本申請避免了不同格式的文件報表的格式差異,并且能夠自動逆向確定差異交易記錄、差 異文件記錄以及差異報表記錄,并能自動獲知存在差異的原因特征,從而避免了當前由人 工來定位分析文件報表中的差異,工作量較大,效率低下,且難以準確確定更新前后文件報 表所存在的差異的問題。
【附圖說明】
[0066] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。
[0067] 圖1為本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法的流程圖一;
[0068] 圖2為本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法的流程圖二的 A部分;
[0069] 圖3為本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法的流程圖二的 B部分;
[0070] 圖4為本發(fā)明實施例中的一種文件報表的字段拓撲圖;
[0071]圖5為本發(fā)明實施例中的一種交易字段拓撲圖;
[0072] 圖6為本發(fā)明實施例中的一種記錄拓撲圖;
[0073] 圖7為本發(fā)明實施例提供的一種文件報表比對差異的逆向分析裝置的結(jié)構(gòu)示意圖 ,
[0074] 圖8為本發(fā)明實施例提供的一種文件報表比對差異的逆向分析裝置的結(jié)構(gòu)示意圖 --〇
【具體實施方式】
[0075]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0076] 如圖1所示,本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法,包括:
[0077] 步驟101、獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文件報表及交易源數(shù)據(jù),以及文 件報表應(yīng)用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù)。
[0078] 步驟102、將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)的數(shù)據(jù)格 式轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式。
[0079]其中,進行格式轉(zhuǎn)換后的第一文件報表及交易源數(shù)據(jù)包括第一交易字段、第一文 件字段、第一報表字段、第一交易記錄、第一文件記錄以及第一報表記錄;進行格式轉(zhuǎn)換后 的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文件字段、第二報表字段、第二交易 記錄、第二文件記錄以及第二報表記錄。
[0080] 步驟103、生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系, 并生成第二交易字段、第二文件字段、第二報表字段的第二文件字段拓撲關(guān)系。
[0081] 步驟104、根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記錄的配置關(guān)系,生成 第一交易記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系,并生成第二交易記 錄、第二文件記錄以及第二報表記錄的第二記錄拓撲關(guān)系。
[0082] 步驟105、根據(jù)第一字段拓撲關(guān)系和第二字段拓撲關(guān)系,確定待比較的文件字段或 報表字段,并生成待比較文件字段或報表字段的最小集合。
[0083] 步驟106、根據(jù)第一字段拓撲關(guān)系、第二字段拓撲關(guān)系以及最小集合進行字段比 較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所存在的差異文件字 段和差異報表字段,并定位差異文件字段和字段差異報表在第一字段拓撲關(guān)系以及第二字 段拓撲關(guān)系中所對應(yīng)的差異交易字段。
[0084] 步驟107、根據(jù)第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定差異交易字段所 對應(yīng)的差異交易記錄,并確定差異交易記錄所對應(yīng)的差異文件記錄和差異報表記錄。
[0085] 步驟108、根據(jù)差異交易記錄、差異文件記錄和差異報表記錄以及預(yù)先設(shè)置的分析 特征樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù) 存在差異的原因特征。
[0086] 本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法,能夠?qū)⑽募蟊響?yīng) 用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的預(yù)設(shè)內(nèi)部格式,并生成字段拓撲關(guān) 系和記錄拓撲關(guān)系;從而能夠根據(jù)段拓撲關(guān)系和記錄拓撲關(guān)系逆向定位差異交易記錄、差 異文件記錄以及差異報表記錄;進而通過預(yù)設(shè)的分析特征數(shù),進行特征樹匹配,自動獲取到 文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)存在差異的原因特征??梢姡旧暾?避免了不同格式的文件報表的格式差異,并且能夠自動逆向確定差異交易記錄、差異文件 記錄以及差異報表記錄,并能自動獲知存在差異的原因特征,從而避免了當前由人工來定 位分析文件報表中的差異,工作量較大,效率低下,且難以準確確定更新前后文件報表所存 在的差異的問題。
[0087] 為了使本領(lǐng)域的技術(shù)人員更好的了解本發(fā)明,下面列舉一個更為詳細的實施例, 如圖2和圖3所示(其中圖2為一種文件報表比對差異的逆向分析方法的A部分,即步驟201至 步驟210;圖3為一種文件報表比對差異的逆向分析方法的的B部分,即步驟211至步驟220。 需要說明的是,A部分和B部分的作用僅為使圖示清晰,描述便捷,并不屬于對本發(fā)明實施例 的方法的限定),本發(fā)明實施例提供一種文件報表比對差異的逆向分析方法,包括:
[0088] 步驟201、獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文件報表及交易源數(shù)據(jù),以及文 件報表應(yīng)用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù)。
[0089]步驟202、配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄和第二文件報表及 交易源數(shù)據(jù)中的第二文件記錄中的第一關(guān)鍵要素,并根據(jù)所述第一關(guān)鍵要素將所述第一文 件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一文件內(nèi)部格式數(shù)據(jù)和第二文件 內(nèi)部格式數(shù)據(jù)。
[0090] 其中,所述第一關(guān)鍵要素包括第一字段名稱、第一字段長度、第一偏移量、第一字 段取值、第一交易記錄字段名稱。
[0091] 此處將第一文件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式的示例可以為:
[0092] <data> <file文件名稱="" > 〈record記錄主鍵=""> <field字段名稱字段長度=""偏移量="n字段取值對應(yīng)交 易記錄字段名稱=""/> <field字段名稱=""字段長度=""偏移量=""字段取值=""對應(yīng)交 易記彔字段名稱=""/> </rccord> </nic>
[0093] </data>
[0094]步驟203、配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄和第二文件報表及 交易源數(shù)據(jù)中的第二報表記錄中的第二關(guān)鍵要素,并根據(jù)所述第二關(guān)鍵要素將所述第一報 表記錄和所述第二報表記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一報表內(nèi)部格式數(shù)據(jù)和第二報表 內(nèi)部格式數(shù)據(jù)。
[0095] 其中,所述第二關(guān)鍵要素包括第二字段名稱、第二字段長度、第二偏移量,第二字 段取值,字段生成的SQL語句和報表對應(yīng)的交易記錄字段集合。
[0096] 此處,將第一報表記錄和所述第二報表記錄轉(zhuǎn)換為所述內(nèi)部格式,可以是例如:
[0097] <data> <rep〇rt報表名稱=""> <field字段名稱字段長度=""橫向偏移量=""縱向偏移量=""字段 取值=""字段生成的sql語句 《transaction交易記錄字段名稱=""/> 《transaction交易記錄字段名稱=""/> </field> <ficld字段名稱=""字段長度=""橫向偏移量=""縱向偏移量=""字段 取值=mi字段生成的sql語句 《transaction交易記錄字段名稱=""/> drar^action 交 U 段名稱=""/> </i1cld> </record> </clala>
[0098]步驟204、配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄和第二文件報表及 交易源數(shù)據(jù)中的第二交易記錄中的第三關(guān)鍵要素,并根據(jù)所述第三關(guān)鍵要素將所述第一交 易記錄和所述第二交易記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易 內(nèi)部格式數(shù)據(jù)。
[0099] 其中,所述第三關(guān)鍵要素包括第三字段名稱、第三字段長度、第三字段取值。
[0100] 此處,將所述第一交易記錄和所述第二交易記錄轉(zhuǎn)換為所述內(nèi)部格式,可以是例 如: -^data^ transaction 〈field字段名稱=""字段長度字段取值=""/>?
[0101] 〈field字段名稱=""字段長度字段取值=""/>. 〈/transaction〉 </data>
[0102] 此處,進行格式轉(zhuǎn)換后的第一文件報表及交易源數(shù)據(jù)包括第一交易字段、第一文 件字段、第一報表字段、第一交易記錄、第一文件記錄以及第一報表記錄;進行格式轉(zhuǎn)換后 的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文件字段、第二報表字段、第二交易 記錄、第二文件記錄以及第二報表記錄。
[0103] 步驟205、遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的記錄主鍵,在第 一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄主鍵。
[0104] 步驟206、根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的交易記錄字段 名稱,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分別獲取各自對應(yīng)的字段名 稱,以建立第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二文件 內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系。
[0105] 步驟207、遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù),根據(jù)所述字段生 成的SQL語句,獲取第一報表字段和第二報表字段各自對應(yīng)的交易記錄主鍵集合。
[0106] 步驟208、根據(jù)所述交易記錄主鍵集合,獲取到第一報表內(nèi)部格式數(shù)據(jù)和第二報表 內(nèi)部格式數(shù)據(jù)分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)。
[0107] 步驟209、根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄 字段名稱,獲取各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名 稱,以建立第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表 內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系。
[0108] 步驟210、根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第一 報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第一交易 字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系。
[0109] 步驟211、根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第二 報表內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第二交易 字段、第二文件字段、第二報表字段的第二字段拓撲關(guān)系。
[0110] 步驟212、根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記錄的配置關(guān)系,生成 第一交易記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系,并生成第二交易記 錄、第二文件記錄以及第二報表記錄的第二記錄拓撲關(guān)系。
[0111] 步驟213、根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名稱,從所述第一字段拓撲關(guān) 系和所述第二字段拓撲關(guān)系中確定待比較的文件字段,并排除無需比較的文件字段。
[0112] 步驟214、根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名稱,從所述第一字段拓撲關(guān) 系和所述第二字段拓撲關(guān)系中確定待比較的報表字段,并排除無需比較的報表字段。
[0113] 在步驟213和步驟214中可以分別默認比對全部的文件字段和報表字段。然而,也 可以根據(jù)預(yù)先設(shè)置的待比較的文件字段和報表字段來排除無需比較的報表字段。
[0114] 例如,預(yù)先配置的示例可以如下: <dil1> <includc> 文件名稱=""比較字段名稱集合字段1|字段2"/> 《report報表名稱=""比較字段名稱集合字段1|字段2"> 〈/include〉.
[0115] <exclude> <file 文件名稱排除字段名稱集合="字段1|字段2"/> 〈report報表名稱=""排除字段名稱集合="字段1|字段2,'> </exclude> </din:>
[0116] 其中〈include〉表示需要比較的字段集合,〈exclude〉表示需要排除比較的字段集 合。待比較的文件字段和報表字段只能配置在〈include〉或〈exclude〉,不能同時配置在〈 include〉和〈exclude〉。若沒有上述配置,則默認比較所有字段。
[0117] 步驟215、若在第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中存在同一個交易字 段對應(yīng)多個文件字段或者多個報表字段,則僅將多個文件字段中的一個文件字段作為待比 較的文件字段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字段,從而生 成待比較文件字段或報表字段的最小集合。
[0118] 此處,依據(jù)文件報表的字段拓撲關(guān)系,生成文件報表的字段拓撲圖,如圖4所示,得 到起始字段集合、等值字段集合和孤立字段集合;字段最小集合有起始字段和孤立字段組 成。
[0119]起始字段與等值字段:表示字段之間的取值來源完全一致,故這些字段的某個字 段定位起始字段,其余為等值字段.孤立字段:表示沒有其它字段的取值來源與其完全一 致。
[0120]之后,依據(jù)最小集合的字段和交易字段的關(guān)系,生成字段拓撲圖,如圖5所示,通過 此字段拓撲圖,能夠得到最小集合中每個字段的交易字段來源;再結(jié)合最小集合字段與等 值字段的關(guān)系,可以得出文件報表中每個字段的交易字段來源。
[0121]另外,依據(jù)交易生成到文件和報表的配置,分析每筆交易與文件報表的關(guān)系,生成 交易明細記錄和文件關(guān)系拓撲圖,這樣可以得出每個文件記錄的交易記錄來源,以及每個 報表記錄的交易記錄來源,如圖6所示。其中,明細類文件報表是指各交易記錄的明細,例如 張三在一商店刷卡消費,夠買了剃須刀;李四在同一商店刷卡消費,夠買了飲料;王五在同 一商店刷卡消費,夠買了辦公用品。而匯總類文件報表是指將各交易記錄進行匯總,例如上 述的張三、李四、王五均是在同一商店夠買了商品,則可以以該商店為目標進行匯總。
[0122] 步驟216、根據(jù)第一字段拓撲關(guān)系、第二字段拓撲關(guān)系以及最小集合進行字段比 較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所存在的差異文件字 段和差異報表字段,并定位差異文件字段和字段差異報表在第一字段拓撲關(guān)系以及第二字 段拓撲關(guān)系中所對應(yīng)的差異交易字段。
[0123] 步驟217、根據(jù)第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定差異交易字段所 對應(yīng)的差異交易記錄,并確定差異交易記錄所對應(yīng)的差異文件記錄和差異報表記錄。
[0124] 步驟218、根據(jù)差異交易記錄的主鍵、差異文件記錄的主鍵、差異報表記錄的主鍵 以及差異文件字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳本。
[0125] 其中,該特征匹配腳本存在于預(yù)先設(shè)置的分析特征樹中,該分析特征樹可以是例 如: <curaulalive>
[0126] <file文件名稱=""> <field字段名稱字段A"> <feature已知差異原因的特征匹配腳本字段A_featurer/> 〈feature已知差異原因的特征匹配腳本字段A_feature2"/>
[0127] - </lieid> </Hlc> </cumulalivc>
[0128] 當某文件字段A存在差異時,遍歷已知差異原因的特征匹配分析腳本,通過差異交 易記錄的主鍵、差異文件記錄的主鍵、差異報表記錄的主鍵以及差異文件字段和差異報表 字段。如某金額字段不一致,A_featur el腳本將分析匯率日期是否一致,若匯率日期不一 致,表示是由于匯率日期不一致引起的金額差異,則匹配成功,完成該字段的差異分析;若 匯率日期一致,則繼續(xù)遍歷下一個特征匹配腳本。若全部遍歷后,仍未找到造成差異的原因 特征,則表示需要人工分析。待人工完成其特征分析后,可以將所確定的原因特征累積到分 析特征樹中,這樣便于后續(xù)自動分析差異。
[0129] 步驟219、與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記錄、差異文 件記錄和差異報表記錄中的相關(guān)信息是否不一致。
[0130] 步驟220、若所述相關(guān)信息不一致,則進行特征樹匹配完成,確定第一文件報表及 交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0131]此處的原因特征可以有很多種,例如不同匯率日期可能導致文件報表的差異,文 件報表應(yīng)用系統(tǒng)升級前后文件報表的格式可能導致文件報表的差異。
[0132]本發(fā)明實施例提供的一種文件報表比對差異的逆向分析方法,能夠?qū)⑽募蟊響?yīng) 用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的預(yù)設(shè)內(nèi)部格式,并生成字段拓撲關(guān) 系和記錄拓撲關(guān)系;從而能夠根據(jù)段拓撲關(guān)系和記錄拓撲關(guān)系逆向定位差異交易記錄、差 異文件記錄以及差異報表記錄;進而通過預(yù)設(shè)的分析特征數(shù),進行特征樹匹配,自動獲取到 文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)存在差異的原因特征。可見,本申請 避免了不同格式的文件報表的格式差異,并且能夠自動逆向確定差異交易記錄、差異文件 記錄以及差異報表記錄,并能自動獲知存在差異的原因特征,從而避免了當前由人工來定 位分析文件報表中的差異,工作量較大,效率低下,且難以準確確定更新前后文件報表所存 在的差異的問題。
[0133] 對應(yīng)于上述圖1、圖2、圖3的方法實施例,如圖7所示,本發(fā)明實施例提供一種文件 報表比對差異的逆向分析裝置,包括:
[0134] 文件報表及交易源數(shù)據(jù)獲取單元31,可以獲取文件報表應(yīng)用系統(tǒng)升級之前的第一 文件報表及交易源數(shù)據(jù),以及文件報表應(yīng)用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù)。
[0135] 數(shù)據(jù)格式轉(zhuǎn)換單元32,可以將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易 源數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式。
[0136] 其中,進行格式轉(zhuǎn)換后的第一文件報表及交易源數(shù)據(jù)包括第一交易字段、第一文 件字段、第一報表字段、第一交易記錄、第一文件記錄以及第一報表記錄;進行格式轉(zhuǎn)換后 的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文件字段、第二報表字段、第二交易 記錄、第二文件記錄以及第二報表記錄。
[0137] 字段拓撲關(guān)系生成單元33,可以生成第一交易字段、第一文件字段、第一報表字段 的第一字段拓撲關(guān)系,并生成第二交易字段、第二文件字段、第二報表字段的第二文件字段 拓撲關(guān)系。
[0138] 記錄拓撲關(guān)系生成單元34,可以根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表 記錄的配置關(guān)系,生成第一交易記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān) 系,并生成第二交易記錄、第二文件記錄以及第二報表記錄的第二記錄拓撲關(guān)系。
[0139] 待比較內(nèi)容確定單元35,可以根據(jù)第一字段拓撲關(guān)系和第二字段拓撲關(guān)系,確定 待比較的文件字段或報表字段,并生成待比較文件字段或報表字段的最小集合。
[0140]差異比較單元36,可以根據(jù)第一字段拓撲關(guān)系、第二字段拓撲關(guān)系以及最小集合 進行字段比較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所存在的 差異文件字段和差異報表字段,并定位差異文件字段和字段差異報表在第一字段拓撲關(guān)系 以及第二字段拓撲關(guān)系中所對應(yīng)的差異交易字段。
[0141] 逆向確定單元37,可以根據(jù)第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定差異 交易字段所對應(yīng)的差異交易記錄,并確定差異交易記錄所對應(yīng)的差異文件記錄和差異報表 記錄。
[0142] 特征樹匹配分析單元38,可以根據(jù)差異交易記錄、差異文件記錄和差異報表記錄 以及預(yù)先設(shè)置的分析特征樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文 件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0143] 具體的,如圖8所示,該數(shù)據(jù)格式轉(zhuǎn)換單元32,包括:
[0144] 文件記錄轉(zhuǎn)換模塊321,可以配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄 和第二文件報表及交易源數(shù)據(jù)中的第二文件記錄中的第一關(guān)鍵要素;第一關(guān)鍵要素包括第 一字段名稱、第一字段長度、第一偏移量、第一字段取值、第一交易記錄字段名稱;根據(jù)第一 關(guān)鍵要素將第一文件記錄和第二文件記錄轉(zhuǎn)換為內(nèi)部格式,生成第一文件內(nèi)部格式數(shù)據(jù)和 第二文件內(nèi)部格式數(shù)據(jù)。
[0145] 報表記錄轉(zhuǎn)換模塊322,可以配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄 和第二文件報表及交易源數(shù)據(jù)中的第二報表記錄中的第二關(guān)鍵要素;第二關(guān)鍵要素包括第 二字段名稱、第二字段長度、第二偏移量,第二字段取值,字段生成的SQL語句和報表對應(yīng)的 交易記錄字段集合;根據(jù)第二關(guān)鍵要素將第一報表記錄和第二報表記錄轉(zhuǎn)換為內(nèi)部格式, 生成第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)。
[0146] 交易記錄轉(zhuǎn)換模塊323,可以配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄 和第二文件報表及交易源數(shù)據(jù)中的第二交易記錄中的第三關(guān)鍵要素;第三關(guān)鍵要素包括第 三字段名稱、第三字段長度、第三字段取值;根據(jù)第三關(guān)鍵要素將第一交易記錄和第二交易 記錄轉(zhuǎn)換為內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)。
[0147] 具體的,如圖8所示,該字段拓撲關(guān)系生成單元33,可以包括:
[0148] 記錄主鍵獲取模塊331,可以遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù) 據(jù)的記錄主鍵,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄 主鍵。
[0149] 第一字段拓撲關(guān)系生成模塊332,可以根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi) 部格式數(shù)據(jù)的交易記錄字段名稱,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分 別獲取各自對應(yīng)的字段名稱,以建立第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓 撲關(guān)系,并建立第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系。
[0150] 交易記錄主鍵集合獲取模塊333,可以遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi) 部格式數(shù)據(jù),根據(jù)字段生成的SQL語句,獲取第一報表字段和第二報表字段各自對應(yīng)的交易 記錄主鍵集合。
[0151] 第二字段拓撲關(guān)系生成模塊334,可以根據(jù)交易記錄主鍵集合,獲取到第一報表內(nèi) 部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部 格式數(shù)據(jù);根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄字段名 稱,獲取各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名稱,以建 立第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表內(nèi)部格式 數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系。
[0152]第三字段拓撲關(guān)系生成模塊335,可以根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi) 部格式數(shù)據(jù)的拓撲關(guān)系、第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將 交易主鍵一致,生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系。
[0153] 第四字段拓撲關(guān)系生成模塊336,可以根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi) 部格式數(shù)據(jù)的拓撲關(guān)系、第二報表內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將 交易主鍵一致,生成第二交易字段、第二文件字段、第二報表字段的第二字段拓撲關(guān)系。
[0154] 具體的,如圖8所示,該待比較內(nèi)容確定單元35,可以包括:
[0155] 待比較文件字段確定模塊351,可以根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名 稱,從第一字段拓撲關(guān)系和第二字段拓撲關(guān)系中確定待比較的文件字段,并排除無需比較 的文件字段。
[0156] 待比較報表字段確定模塊352,可以根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名 稱,從第一字段拓撲關(guān)系和第二字段拓撲關(guān)系中確定待比較的報表字段,并排除無需比較 的報表字段。
[0157] 最小集合確定模塊353,可以在第一字段拓撲關(guān)系和第二字段拓撲關(guān)系中存在同 一個交易字段對應(yīng)多個文件字段或者多個報表字段時,僅將多個文件字段中的一個文件字 段作為待比較的文件字段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字 段。
[0158] 具體的,如圖8所示,特征樹匹配分析單元38中的預(yù)先設(shè)置的分析特征樹可以包括 多個已知差異原因的特征匹配腳本。
[0159] 該特征樹匹配分析單元38,可以包括:
[0160] 特征匹配腳本遍歷模塊381,可以根據(jù)差異交易記錄的主鍵、差異文件記錄的主 鍵、差異報表記錄的主鍵以及差異文件字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳 本。
[0161] 判斷模塊382,可以與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記 錄、差異文件記錄和差異報表記錄中的相關(guān)信息是否不一致。
[0162] 差異原因特征確定模塊383,可以在相關(guān)信息不一致時,進行特征樹匹配完成,確 定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。
[0163] 值得說明的是,本發(fā)明實施例提供的一種文件報表比對差異的逆向分析裝置的具 體實現(xiàn)方式可以參見上述的方法實施例,此處不再贅述。
[0164] 本發(fā)明實施例提供的一種文件報表比對差異的逆向分析裝置,能夠?qū)⑽募蟊響?yīng) 用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的預(yù)設(shè)內(nèi)部格式,并生成字段拓撲關(guān) 系和記錄拓撲關(guān)系;從而能夠根據(jù)段拓撲關(guān)系和記錄拓撲關(guān)系逆向定位差異交易記錄、差 異文件記錄以及差異報表記錄;進而通過預(yù)設(shè)的分析特征數(shù),進行特征樹匹配,自動獲取到 文件報表應(yīng)用系統(tǒng)升級前后的文件報表及交易源數(shù)據(jù)存在差異的原因特征??梢姡旧暾?避免了不同格式的文件報表的格式差異,并且能夠自動逆向確定差異交易記錄、差異文件 記錄以及差異報表記錄,并能自動獲知存在差異的原因特征,從而避免了當前由人工來定 位分析文件報表中的差異,工作量較大,效率低下,且難以準確確定更新前后文件報表所存 在的差異的問題。
[0165] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實 施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機 可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產(chǎn) 品的形式。
[0166] 本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序 指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn) 生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實 現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0167] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0168] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計 算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或 其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0169] 本發(fā)明中應(yīng)用了具體實施例對本發(fā)明的原理及實施方式進行了闡述,以上實施例 的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員, 依據(jù)本發(fā)明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi) 容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種文件報表比對差異的逆向分析方法,其特征在于,包括: 獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文件報表及交易源數(shù)據(jù),以及文件報表應(yīng)用系 統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù); 將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換為預(yù)先 設(shè)置的內(nèi)部格式;其中,進行格式轉(zhuǎn)換后的第一文件報表及交易源數(shù)據(jù)包括第一交易字段、 第一文件字段、第一報表字段、第一交易記錄、第一文件記錄以及第一報表記錄;進行格式 轉(zhuǎn)換后的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文件字段、第二報表字段、第 二交易記錄、第二文件記錄以及第二報表記錄; 生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系,并生成第二交 易字段、第二文件字段、第二報表字段的第二文件字段拓撲關(guān)系; 根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記錄的配置關(guān)系,生成第一交易記 錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系,并生成第二交易記錄、第二文件 記錄以及第二報表記錄的第二記錄拓撲關(guān)系; 根據(jù)所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系,確定待比較的文件字段或報表 字段,并生成待比較文件字段或報表字段的最小集合; 根據(jù)所述第一字段拓撲關(guān)系、所述第二字段拓撲關(guān)系以及所述最小集合進行字段比 較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所存在的差異文件字 段和差異報表字段,并定位所述差異文件字段和字段差異報表在第一字段拓撲關(guān)系以及第 二字段拓撲關(guān)系中所對應(yīng)的差異交易字段; 根據(jù)所述第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定所述差異交易字段所對應(yīng) 的差異交易記錄,并確定所述差異交易記錄所對應(yīng)的差異文件記錄和差異報表記錄; 根據(jù)所述差異交易記錄、差異文件記錄和差異報表記錄以及預(yù)先設(shè)置的分析特征樹, 進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異 的原因特征。2. 根據(jù)權(quán)利要求1所述的文件報表比對差異的逆向分析方法,其特征在于,將第一文件 報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式, 包括: 配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄和第二文件報表及交易源數(shù)據(jù)中 的第二文件記錄中的第一關(guān)鍵要素;所述第一關(guān)鍵要素包括第一字段名稱、第一字段長度、 第一偏移量、第一字段取值、第一交易記錄字段名稱;根據(jù)所述第一關(guān)鍵要素將所述第一文 件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一文件內(nèi)部格式數(shù)據(jù)和第二文件 內(nèi)部格式數(shù)據(jù); 配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄和第二文件報表及交易源數(shù)據(jù)中 的第二報表記錄中的第二關(guān)鍵要素;所述第二關(guān)鍵要素包括第二字段名稱、第二字段長度、 第二偏移量,第二字段取值,字段生成的SQL語句和報表對應(yīng)的交易記錄字段集合;根據(jù)所 述第二關(guān)鍵要素將所述第一報表記錄和所述第二報表記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一 報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù); 配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄和第二文件報表及交易源數(shù)據(jù)中 的第二交易記錄中的第三關(guān)鍵要素;所述第三關(guān)鍵要素包括第三字段名稱、第三字段長度、 第三字段取值;根據(jù)所述第三關(guān)鍵要素將所述第一交易記錄和所述第二交易記錄轉(zhuǎn)換為所 述內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)。3. 根據(jù)權(quán)利要求2所述的文件報表比對差異的逆向分析方法,其特征在于,所述生成第 一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系,并生成第二交易字段、第 二文件字段、第二報表字段的第二文件字段拓撲關(guān)系,包括: 遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的記錄主鍵,在第一文件內(nèi)部格 式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄主鍵; 根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的交易記錄字段名稱,在第一文 件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分別獲取各自對應(yīng)的字段名稱,以建立第一文 件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二文件內(nèi)部格式數(shù)據(jù)與第 二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系; 遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù),根據(jù)所述字段生成的SQL語句, 獲取第一報表字段和第二報表字段各自對應(yīng)的交易記錄主鍵集合; 根據(jù)所述交易記錄主鍵集合,獲取到第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù) 分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù); 根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄字段名稱,獲取 各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名稱,以建立第一報 表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表內(nèi)部格式數(shù)據(jù)與第 二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系; 根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第一報表內(nèi)部格式 數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第一交易字段、第一文件 字段、第一報表字段的第一字段拓撲關(guān)系; 根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系、第二報表內(nèi)部格式 數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵一致,生成第二交易字段、第二文件 字段、第二報表字段的第二字段拓撲關(guān)系。4. 根據(jù)權(quán)利要求3所述的文件報表比對差異的逆向分析方法,其特征在于,根據(jù)所述第 一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系,確定待比較的文件字段或報表字段,并生成待 比較文件字段或報表字段的最小集合,包括: 根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名稱,從所述第一字段拓撲關(guān)系和所述第二 字段拓撲關(guān)系中確定待比較的文件字段,并排除無需比較的文件字段; 根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名稱,從所述第一字段拓撲關(guān)系和所述第二 字段拓撲關(guān)系中確定待比較的報表字段,并排除無需比較的報表字段; 若在第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中存在同一個交易字段對應(yīng)多個文 件字段或者多個報表字段,則僅將多個文件字段中的一個文件字段作為待比較的文件字 段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字段。5. 根據(jù)權(quán)利要求4所述的文件報表比對差異的逆向分析方法,其特征在于,所述預(yù)先設(shè) 置的分析特征樹包括多個已知差異原因的特征匹配腳本; 根據(jù)所述差異交易記錄、差異文件記錄和差異報表記錄以及預(yù)先設(shè)置的分析特征樹, 進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異 的原因特征,包括: 根據(jù)差異交易記錄的主鍵、差異文件記錄的主鍵、差異報表記錄的主鍵以及差異文件 字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳本; 與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記錄、差異文件記錄和差異 報表記錄中的相關(guān)信息是否不一致; 若所述相關(guān)信息不一致,則進行特征樹匹配完成,確定第一文件報表及交易源數(shù)據(jù)和 第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。6. -種文件報表比對差異的逆向分析裝置,其特征在于,包括: 文件報表及交易源數(shù)據(jù)獲取單元,用于獲取文件報表應(yīng)用系統(tǒng)升級之前的第一文件報 表及交易源數(shù)據(jù),以及文件報表應(yīng)用系統(tǒng)升級之后的第二文件報表及交易源數(shù)據(jù); 數(shù)據(jù)格式轉(zhuǎn)換單元,用于將第一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù) 的數(shù)據(jù)格式轉(zhuǎn)換為預(yù)先設(shè)置的內(nèi)部格式;其中,進行格式轉(zhuǎn)換后的第一文件報表及交易源 數(shù)據(jù)包括第一交易字段、第一文件字段、第一報表字段、第一交易記錄、第一文件記錄以及 第一報表記錄;進行格式轉(zhuǎn)換后的第二文件報表及交易源數(shù)據(jù)包括第二交易字段、第二文 件字段、第二報表字段、第二交易記錄、第二文件記錄以及第二報表記錄; 字段拓撲關(guān)系生成單元,用于生成第一交易字段、第一文件字段、第一報表字段的第一 字段拓撲關(guān)系,并生成第二交易字段、第二文件字段、第二報表字段的第二文件字段拓撲關(guān) 系; 記錄拓撲關(guān)系生成單元,用于根據(jù)預(yù)先設(shè)置的交易記錄生成到文件記錄和報表記錄的 配置關(guān)系,生成第一交易記錄、第一文件記錄以及第一報表記錄的第一記錄拓撲關(guān)系,并生 成第二交易記錄、第二文件記錄以及第二報表記錄的第二記錄拓撲關(guān)系; 待比較內(nèi)容確定單元,用于根據(jù)所述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系,確 定待比較的文件字段或報表字段,并生成待比較文件字段或報表字段的最小集合; 差異比較單元,用于根據(jù)所述第一字段拓撲關(guān)系、所述第二字段拓撲關(guān)系以及所述最 小集合進行字段比較,確定第一文件報表及交易源數(shù)據(jù)與第二文件報表及交易源數(shù)據(jù)的所 存在的差異文件字段和差異報表字段,并定位所述差異文件字段和字段差異報表在第一字 段拓撲關(guān)系以及第二字段拓撲關(guān)系中所對應(yīng)的差異交易字段; 逆向確定單元,用于根據(jù)所述第一記錄拓撲關(guān)系和第二記錄拓撲關(guān)系逆向確定所述差 異交易字段所對應(yīng)的差異交易記錄,并確定所述差異交易記錄所對應(yīng)的差異文件記錄和差 異報表記錄; 特征樹匹配分析單元,用于根據(jù)所述差異交易記錄、差異文件記錄和差異報表記錄以 及預(yù)先設(shè)置的分析特征樹,進行特征樹匹配,確定第一文件報表及交易源數(shù)據(jù)和第二文件 報表及交易源數(shù)據(jù)存在差異的原因特征。7. 根據(jù)權(quán)利要求6所述的文件報表比對差異的逆向分析裝置,其特征在于,所述數(shù)據(jù)格 式轉(zhuǎn)換單元,包括: 文件記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一文件記錄和第二文 件報表及交易源數(shù)據(jù)中的第二文件記錄中的第一關(guān)鍵要素;所述第一關(guān)鍵要素包括第一字 段名稱、第一字段長度、第一偏移量、第一字段取值、第一交易記錄字段名稱;根據(jù)所述第一 關(guān)鍵要素將所述第一文件記錄和所述第二文件記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一文件內(nèi) 部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù); 報表記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一報表記錄和第二文 件報表及交易源數(shù)據(jù)中的第二報表記錄中的第二關(guān)鍵要素;所述第二關(guān)鍵要素包括第二字 段名稱、第二字段長度、第二偏移量,第二字段取值,字段生成的SQL語句和報表對應(yīng)的交易 記錄字段集合;根據(jù)所述第二關(guān)鍵要素將所述第一報表記錄和所述第二報表記錄轉(zhuǎn)換為所 述內(nèi)部格式,生成第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù); 交易記錄轉(zhuǎn)換模塊,用于配置第一文件報表及交易源數(shù)據(jù)中的第一交易記錄和第二文 件報表及交易源數(shù)據(jù)中的第二交易記錄中的第三關(guān)鍵要素;所述第三關(guān)鍵要素包括第三字 段名稱、第三字段長度、第三字段取值;根據(jù)所述第三關(guān)鍵要素將所述第一交易記錄和所述 第二交易記錄轉(zhuǎn)換為所述內(nèi)部格式,生成第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù) 據(jù)。8. 根據(jù)權(quán)利要求7所述的文件報表比對差異的逆向分析裝置,其特征在于,所述字段拓 撲關(guān)系生成單元,包括: 記錄主鍵獲取模塊,用于遍歷第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)的記錄 主鍵,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中找到各自對應(yīng)的記錄主鍵; 第一字段拓撲關(guān)系生成模塊,用于根據(jù)第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù) 據(jù)的交易記錄字段名稱,在第一文件內(nèi)部格式數(shù)據(jù)和第二文件內(nèi)部格式數(shù)據(jù)中分別獲取各 自對應(yīng)的字段名稱,以建立第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系, 并建立第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系; 交易記錄主鍵集合獲取模塊,用于遍歷第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù) 據(jù),根據(jù)所述字段生成的SQL語句,獲取第一報表字段和第二報表字段各自對應(yīng)的交易記錄 主鍵集合; 第二字段拓撲關(guān)系生成模塊,用于根據(jù)所述交易記錄主鍵集合,獲取到第一報表內(nèi)部 格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)分別對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格 式數(shù)據(jù);根據(jù)第一報表內(nèi)部格式數(shù)據(jù)和第二報表內(nèi)部格式數(shù)據(jù)對應(yīng)的交易記錄字段名稱, 獲取各自對應(yīng)的第一交易內(nèi)部格式數(shù)據(jù)和第二交易內(nèi)部格式數(shù)據(jù)中的字段名稱,以建立第 一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,并建立第二報表內(nèi)部格式數(shù)據(jù) 與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系; 第三字段拓撲關(guān)系生成模塊,用于根據(jù)第一文件內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù) 據(jù)的拓撲關(guān)系、第一報表內(nèi)部格式數(shù)據(jù)與第一交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵 一致,生成第一交易字段、第一文件字段、第一報表字段的第一字段拓撲關(guān)系; 第四字段拓撲關(guān)系生成模塊,用于根據(jù)第二文件內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù) 據(jù)的拓撲關(guān)系、第二報表內(nèi)部格式數(shù)據(jù)與第二交易內(nèi)部格式數(shù)據(jù)的拓撲關(guān)系,將交易主鍵 一致,生成第二交易字段、第二文件字段、第二報表字段的第二字段拓撲關(guān)系。9. 根據(jù)權(quán)利要求8所述的文件報表比對差異的逆向分析裝置,其特征在于,所述待比較 內(nèi)容確定單元,包括: 待比較文件字段確定模塊,用于根據(jù)預(yù)先設(shè)置的待比較的文件字段的文件名稱,從所 述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中確定待比較的文件字段,并排除無需比較 的文件字段; 待比較報表字段確定模塊,用于根據(jù)預(yù)先設(shè)置的待比較的報表字段的報表名稱,從所 述第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中確定待比較的報表字段,并排除無需比較 的報表字段; 最小集合確定模塊,用于在第一字段拓撲關(guān)系和所述第二字段拓撲關(guān)系中存在同一個 交易字段對應(yīng)多個文件字段或者多個報表字段時,僅將多個文件字段中的一個文件字段作 為待比較的文件字段,或者僅將多個報表字段中的一個報表字段作為待比較的報表字段。10.根據(jù)權(quán)利要求9所述的文件報表比對差異的逆向分析裝置,其特征在于,所述特征 樹匹配分析單元中的預(yù)先設(shè)置的分析特征樹包括多個已知差異原因的特征匹配腳本; 所述特征樹匹配分析單元,包括: 特征匹配腳本遍歷模塊,用于根據(jù)差異交易記錄的主鍵、差異文件記錄的主鍵、差異報 表記錄的主鍵以及差異文件字段和差異報表字段,遍歷所需調(diào)用的特征匹配腳本; 判斷模塊,用于與所需調(diào)用的特征匹配腳本進行匹配,判斷當前差異交易記錄、差異文 件記錄和差異報表記錄中的相關(guān)信息是否不一致; 差異原因特征確定模塊,用于在所述相關(guān)信息不一致時,進行特征樹匹配完成,確定第 一文件報表及交易源數(shù)據(jù)和第二文件報表及交易源數(shù)據(jù)存在差異的原因特征。
【文檔編號】G06F17/30GK105930325SQ201510801507
【公開日】2016年9月7日
【申請日】2015年11月19日
【發(fā)明人】高建斌, 李 瑞, 李旭東, 申世恒, 姜金鳳, 蔡佳迪, 劉鐵
【申請人】中國銀聯(lián)股份有限公司