1.一種基于xml解析的導入excel文件的方法,其特征在于,其實現(xiàn)過程為:將excel作為一個xml進行解析,通過比對excel中表頭信息,解析xml中每一個數(shù)據(jù)單元,并進行格式驗證,對數(shù)據(jù)格式正確的行,導入到相應(yīng)的數(shù)據(jù)庫的數(shù)據(jù)表中。
2.根據(jù)權(quán)利要求1所述的一種基于xml解析的導入excel文件的方法,其特征在于,將excel進行解析以兩次遍歷的方式實現(xiàn),第一次遍歷單表頭的情況,將每行與設(shè)定的表頭進行匹配,確認該excel文件中匹配的表頭的相關(guān)信息;第二次遍歷處理多個表頭和表頭數(shù)據(jù)量較多的情況,通過將將原excel拆分為若干僅有一個表頭的excel,然后再進入啟動線程導入數(shù)據(jù)庫的步驟。
3.根據(jù)權(quán)利要求2所述的一種基于xml解析的導入excel文件的方法,其特征在于,在第一次遍歷時,確認xcel文件中匹配的表頭的相關(guān)信息包括:
開始行:匹配的表頭的數(shù)據(jù)的第一行在整個excel文件中出現(xiàn)的行數(shù);
結(jié)束行:匹配的表頭的數(shù)據(jù)的最后一行在整個excel文件中出現(xiàn)的行數(shù)。
4.根據(jù)權(quán)利要求2所述的一種基于xml解析的導入excel文件的方法,其特征在于,在第二次遍歷時,將excel拆分為不同的excel,拆分后的每一個excel文件僅有一個表頭,并且數(shù)據(jù)條數(shù)不超過1000條,然后啟用多線程,對分割后的每個excel數(shù)據(jù)文件啟動一個線程去導入數(shù)據(jù)庫中。
5.根據(jù)權(quán)利要求1所述的一種基于xml解析的導入excel文件的方法,其特征在于,對于解析后的數(shù)據(jù),匹配若干sheet頁和表頭信息,然后拆分表頭信息,產(chǎn)生拆分后的子文件,并填充到匹配規(guī)則產(chǎn)生的附件信息,最后導入數(shù)據(jù)庫中。
6.根據(jù)權(quán)利要求5所述的一種基于xml解析的導入excel文件的方法,其特征在于,所述匹配規(guī)則是指通過以下原則進行匹配并保存:首先匹配標題行上一行,即表頭的上一行信息;然后匹配文件名,即該excel的文件名;再次匹配標題行的某一行;最后匹配常量;匹配結(jié)束后將對應(yīng)的匹配信息保存到每一個拆分后的excel中,同時不合法的數(shù)據(jù)保存到一個異常數(shù)據(jù)的excel中。