本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法和系統(tǒng)。
背景技術(shù):
目前市面上基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入,其導(dǎo)入數(shù)據(jù)的流程一般是用戶在網(wǎng)頁端下載模板,然后把成績單重新復(fù)制粘貼到模板中,再上傳回網(wǎng)頁。
例如,基于網(wǎng)頁端的成績分析產(chǎn)品,導(dǎo)入成績統(tǒng)計數(shù)據(jù)時,用戶先從網(wǎng)頁端下載模板,然后把成績統(tǒng)計數(shù)據(jù)重新復(fù)制粘貼到模板中,再上傳回網(wǎng)頁。
上述方式存在如下缺陷:
(1)用戶必須按照模板,再次編輯一次成績單,工作量大、效率低;
(2)用戶在再次編輯的過程中,可能會出現(xiàn)人為的操作失誤,導(dǎo)致數(shù)據(jù)錯誤。
由此可見,現(xiàn)有的數(shù)據(jù)導(dǎo)入方案,存在效率低、容易出錯的問題。
技術(shù)實現(xiàn)要素:
基于此,有必要針對上述技術(shù)問題,提供一種基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法和系統(tǒng)。
一種基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法,包括:
將用戶自定義的電子表格上傳至網(wǎng)頁端,并在網(wǎng)頁端上選擇項目類別;其中,所述電子表格按統(tǒng)一的行、列格式填寫各個統(tǒng)計對象信息及其項目類別和各個項目類別對應(yīng)的數(shù)據(jù)信息;
在網(wǎng)頁端對該電子表格中各個統(tǒng)計對象信息及其在所選項目類別中對應(yīng)的數(shù)據(jù)信息進(jìn)行識別和抓??;
根據(jù)識別和抓取的統(tǒng)計對象信息及其對應(yīng)的導(dǎo)入數(shù)據(jù),按所選的項目類別導(dǎo)入到網(wǎng)頁端的模版中。
一種基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入系統(tǒng),包括:
表單上傳模塊,用于將用戶自定義的電子表格上傳至網(wǎng)頁端,并在網(wǎng)頁端上選擇項目類別;其中,所述電子表格按統(tǒng)一的行、列格式填寫各個統(tǒng)計對象信息及其項目類別和各個項目類別對應(yīng)的數(shù)據(jù)信息;
數(shù)據(jù)獲取模塊,用于在網(wǎng)頁端對該電子表格中各個統(tǒng)計對象信息及其在所選項目類別中對應(yīng)的數(shù)據(jù)信息進(jìn)行識別和抓?。?/p>
數(shù)據(jù)導(dǎo)入模塊,用于根據(jù)識別和抓取的統(tǒng)計對象信息及其對應(yīng)的導(dǎo)入數(shù)據(jù),按所選的項目類別導(dǎo)入到網(wǎng)頁端的模版中。
上述基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法和系統(tǒng),基于網(wǎng)頁端對用戶上傳的自定義的電子表格進(jìn)行數(shù)據(jù)信息的識別和抓取,可以抓取不同格式的電子表格數(shù)據(jù),減少了用戶的操作步驟和工作量,使得導(dǎo)入數(shù)據(jù)更加簡單便捷,避免了導(dǎo)入數(shù)據(jù)容易出錯的現(xiàn)象。
附圖說明
圖1為一個實施例的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法流程示意圖,;
圖2為數(shù)據(jù)導(dǎo)入應(yīng)用示例的流程圖;
圖3-9為異常數(shù)據(jù)的示意圖;
圖10為成績單預(yù)覽界面示意圖;
圖11為一個實施例的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入系統(tǒng)結(jié)構(gòu)示意圖。
具體實施方式
參考圖1,圖1為一個實施例的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法流程示意圖,包括:
步驟S10:將用戶自定義的電子表格上傳至網(wǎng)頁端,并在網(wǎng)頁端上選擇項目類別;其中,所述電子表格按統(tǒng)一的行、列格式填寫各個統(tǒng)計對象信息及其項目類別和各個項目類別對應(yīng)的數(shù)據(jù)信息;
此過程中用戶無需從網(wǎng)頁端下載模版,可以利用自定義格式的電子表格填寫統(tǒng)計對象信息、項目類別和各個項目類別對應(yīng)的數(shù)據(jù)信息等;電子表格按統(tǒng)一的行、列格式填寫,在此,行、列填寫內(nèi)容方向可以根據(jù)實際情況進(jìn)行選擇。
以Exel表為例,以一行記錄統(tǒng)計對象、各個項目類別;向列的方向記錄統(tǒng)計對象信息和各個項目類別對應(yīng)的數(shù)據(jù)信息。
在一個實施例中,將用戶自定義的電子表格上傳至網(wǎng)頁端的步驟,可以包括如下:
調(diào)用系統(tǒng)自帶的文件管理器界面,上傳默認(rèn)格式的電子表格文件;在上傳過程中,當(dāng)需更改電子表格文件時,刪除后重新上傳。
步驟S20:在網(wǎng)頁端對該電子表格中各個統(tǒng)計對象信息及其在所選項目類別中對應(yīng)的數(shù)據(jù)信息進(jìn)行識別和抓取;
在此,可以在在網(wǎng)頁端后臺調(diào)用工具對電子表格的記錄內(nèi)容進(jìn)行識別和抓取。
在一個實施例中,對應(yīng)的數(shù)據(jù)信息進(jìn)行識別和抓取的步驟,可以包括如下:
在網(wǎng)頁端后臺對所述電子表格的橫向單元格數(shù)據(jù)信息進(jìn)行識別,獲取統(tǒng)計對象信息和項目類別的關(guān)鍵單元格的數(shù)據(jù)信息;
根據(jù)網(wǎng)頁端上選擇的項目類別,從識別的項目類別中篩選出相應(yīng)的項目類別;
對統(tǒng)計對象信息和篩選的項目類別的關(guān)鍵單元格下整列的數(shù)據(jù)信息進(jìn)行抓取,得到統(tǒng)計對象信息及其對應(yīng)的導(dǎo)入數(shù)據(jù)。
以Exel表為例,對第一行的關(guān)鍵單元格進(jìn)行識別,抓取到統(tǒng)計對象信息和項目類別的數(shù)據(jù)信息,按Exel表的縱向,整列識別。抓取各列數(shù)據(jù)信息。
進(jìn)一步地,為了排除認(rèn)為填寫錯誤,在對統(tǒng)計對象信息和篩選的項目類別的關(guān)鍵單元格下整列的數(shù)據(jù)信息進(jìn)行抓取后,還可以包括:
對各列數(shù)據(jù)信息進(jìn)行異常檢測,查找異常的數(shù)據(jù)表格位置并通過異常標(biāo)識進(jìn)行提示。
對于異常檢測,可以從多個維度進(jìn)行檢測,包括重復(fù)信息檢測,缺漏信息檢測、特殊字符檢測、統(tǒng)計對象信息匹配檢測等。
對于所述統(tǒng)計對象信息,如果包括多個關(guān)聯(lián)的信息項;可以根據(jù)后臺的數(shù)據(jù)庫對統(tǒng)計對象信息的各個信息項進(jìn)行匹配檢測,確定各個信息項的對應(yīng)關(guān)系。
進(jìn)一步的,在異常檢測后,根據(jù)用戶的異常修改操作,對所述電子表格進(jìn)行更新,并在更新后再次對所述統(tǒng)計對象信息及其數(shù)據(jù)信息進(jìn)行異常檢測,直至所有異常修改完成。
步驟S30:根據(jù)識別和抓取的統(tǒng)計對象信息及其對應(yīng)的導(dǎo)入數(shù)據(jù),按所選的項目類別導(dǎo)入到網(wǎng)頁端的模版中;
網(wǎng)頁端后臺利用抓取的導(dǎo)入數(shù)據(jù),按所選的項目類別導(dǎo)入到網(wǎng)頁端的模版中,完成數(shù)據(jù)導(dǎo)入過程,導(dǎo)入過程利用了用戶自定義電子表格具有規(guī)律性特點,實現(xiàn)了數(shù)據(jù)的抓取,在兩種模版之間進(jìn)行轉(zhuǎn)換,用戶無需進(jìn)行表單的復(fù)制操作,提高了操作效率,避免了人為操作的失誤。
針對于本發(fā)明提供的數(shù)據(jù)導(dǎo)入方法在成績分析產(chǎn)品中的應(yīng)用,以下提供相應(yīng)的實施例。
在以下實施例中,所述統(tǒng)計對象信息包括:學(xué)號、姓名;所述項目類別包括考試科目;所述數(shù)據(jù)信息包括分?jǐn)?shù)或成績分級。
參考圖2所示,圖2為數(shù)據(jù)導(dǎo)入應(yīng)用示例的流程圖,主要包括如下過程:
s1,用戶在啟動網(wǎng)頁端后,點擊預(yù)設(shè)的【導(dǎo)入成績】按鍵,通過彈框提示用戶上傳成績單,并在界面提示用戶導(dǎo)入Exel格式的文件。
s2,用戶點擊【上傳成績單】后,調(diào)用系統(tǒng)的文件管理器界面上傳文件,上傳規(guī)則可設(shè)置如下幾項:
(1)默認(rèn)只顯示Exel格式的文件;
(2)每次只允許上傳一個文件,如需更改文件,需要用戶刪除后重新上傳;
(3)禁止用戶上傳文件夾,則禁止【上傳成績單】,將按鈕置為灰色以進(jìn)行提示。
項目類別可以包括:時間、班級、考試等。
成績單被導(dǎo)入后,用戶通過預(yù)設(shè)的輸入框標(biāo)記上對應(yīng)的項目類別,用于在被導(dǎo)入的成績單中篩選出所需要的數(shù)據(jù)。
每個項目類別的字符規(guī)則為:除了“()-_,”4個符號外,禁止其他特殊符號;當(dāng)輸入框失焦后,判斷輸入框的字符規(guī)則,如存在錯誤的字符規(guī)則,則提示“不能輸入除“()-_”之外的特殊符號。
s3,設(shè)置考試類別,項目類別可設(shè)置多個考試科目,例如:語文、數(shù)學(xué)、英語、物理、化學(xué)、生物、歷史、政治、地理、科學(xué)、計算機(jī)、美術(shù)、音樂、體育、思想品德等之類。在此可以設(shè)置后臺數(shù)據(jù)庫,用戶選擇時,調(diào)用后臺數(shù)據(jù)庫的數(shù)據(jù)。
s4,上傳成績單后,用戶可以通過選擇來篩選需要導(dǎo)入的科目。
如用戶選擇了成績單中沒有的科目,則增加一列沒有成績的科目數(shù)據(jù),用戶可以選擇重新填寫成績,或刪除這一列的成績;如用戶沒有選擇任何科目,則將預(yù)設(shè)的【完成】按鈕置為灰色以進(jìn)行提示,禁止用戶進(jìn)入下一步操作。
s5,上傳完成后,在網(wǎng)頁端后臺對用戶上傳的成績單進(jìn)行關(guān)鍵字符列的識別和抓取,以Exel表橫向單元格為基礎(chǔ),先獲取關(guān)鍵單元格,例如:學(xué)號、姓名、科目,再獲取對應(yīng)關(guān)鍵單元格下一整列的數(shù)據(jù)信息。
s6,完成字符列的抓取后,在網(wǎng)頁端后臺開始對數(shù)據(jù)進(jìn)行異常檢測,參考圖3-9所示,圖3-9為異常數(shù)據(jù)的示意圖,異常數(shù)據(jù)主要分為3大類:
(1)統(tǒng)計對象信息不匹配:
作為一個示例,參考圖3所示,對于學(xué)號和姓名等統(tǒng)計對象信息,根據(jù)后臺的數(shù)據(jù)庫來確認(rèn)兩者對應(yīng)關(guān)系,如姓名-學(xué)號錯誤,將對應(yīng)單元格標(biāo)識為異常,hover狀態(tài)下提示“姓名-學(xué)號不匹配”,可以通過用戶直接更改姓名、在網(wǎng)頁端自動匹配的方式進(jìn)行修改。
(2)信息重復(fù):
①學(xué)號與姓名重復(fù):
作為一個示例,參考圖4所示,如果列表中有兩個學(xué)號和名字都一樣,但至少有一科成績不一樣,則兩項的學(xué)號和姓名同時標(biāo)識異常,hover狀態(tài)下提示“信息重復(fù)”;如導(dǎo)入成績單中,存在多條重復(fù)數(shù)據(jù)(姓名、學(xué)號、成績完全一樣),則只導(dǎo)入一條,過濾重復(fù)信息。
②科目信息重復(fù):
作為一個示例,參考圖5所示,如果導(dǎo)入的電子表格中,存在著兩項科目名稱和分?jǐn)?shù)都一樣,則智能識別只保留其中一項,然后導(dǎo)入到預(yù)覽界面中;
如果導(dǎo)入的表格中,存在著兩項科目名稱一樣,但分?jǐn)?shù)不一樣,則保留兩項分?jǐn)?shù),并導(dǎo)入到預(yù)覽界面,并將兩個科目名稱標(biāo)識為異常,hover狀態(tài)下提示“信息重復(fù)”;
(3)數(shù)據(jù)格式錯誤:
①無學(xué)號或無姓名:
作為一個示例,參考圖6所示,如果成績單缺少學(xué)號或姓名,則在編輯界面,補(bǔ)全學(xué)號一列,并標(biāo)識為錯誤,hover狀態(tài)下提示“學(xué)號為空”;
②信息為空:
作為一個示例,參考圖7所示,如果科目分?jǐn)?shù)為空,則單元格標(biāo)識為異常,hover狀態(tài)下提示“請輸入分?jǐn)?shù)”;
③信息不符合格式:
作為一個示例,參考圖8所示,學(xué)號或姓名格式錯誤,則按“姓名-學(xué)號不匹配”處理;如果學(xué)號和姓名、格式錯誤,單元格標(biāo)識異常,hover狀態(tài)下提示“請輸入分?jǐn)?shù)”;
④勾選了導(dǎo)入電子表格中沒有的科目:
作為一個示例,參考圖9所示,如果成績單中缺失科目,則補(bǔ)全缺失的科目,并標(biāo)識單元格異常,hover狀態(tài)下提示“請輸入分?jǐn)?shù)”。
s7,在判斷異常后,形成新的成績單預(yù)覽界面,標(biāo)識異常單元格,便于用戶修改;作為一個示例,參考圖10所示,圖10為成績單預(yù)覽界面示意圖,在檢測到單元格被修改后,再進(jìn)行異常判斷的操作,如有異常則繼續(xù)標(biāo)識,無異常則取消異常標(biāo)識;
s8,當(dāng)用戶點擊【保存】操作時,導(dǎo)入數(shù)據(jù)信息。
綜上實施例所述,本發(fā)明提供的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法,基于網(wǎng)頁端對導(dǎo)入數(shù)據(jù)抓取進(jìn)行運算,可抓取不同格式Excel表下的成績單,從而減少了用戶導(dǎo)入成績數(shù)據(jù)操作步驟,大大地降低了工作量,讓導(dǎo)入成績單變得更為靈活快捷;同時通過對異常數(shù)據(jù)的判斷,從更多維度對數(shù)據(jù)進(jìn)行對比和判斷,可以為用戶排除人為填寫數(shù)據(jù)的錯誤,而且可利用后臺數(shù)據(jù),對成績單中關(guān)鍵信息(如學(xué)號和姓名)不匹配的異常進(jìn)行“一鍵匹配”,無需再次手動核對修改,便于糾正異常數(shù)據(jù)。
參考圖11,圖11為一個實施例的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入系統(tǒng)結(jié)構(gòu)示意圖,包括:
表單上傳模塊10,用于將用戶自定義的電子表格上傳至網(wǎng)頁端,并在網(wǎng)頁端上選擇項目類別;其中,所述電子表格按統(tǒng)一的行、列格式填寫各個統(tǒng)計對象信息及其項目類別和各個項目類別對應(yīng)的數(shù)據(jù)信息;
數(shù)據(jù)獲取模塊20,用于在網(wǎng)頁端對該電子表格中各個統(tǒng)計對象信息及其在所選項目類別中對應(yīng)的數(shù)據(jù)信息進(jìn)行識別和抓??;
數(shù)據(jù)導(dǎo)入模塊30,用于根據(jù)識別和抓取的統(tǒng)計對象信息及其對應(yīng)的導(dǎo)入數(shù)據(jù),按所選的項目類別導(dǎo)入到網(wǎng)頁端的模版中。
本發(fā)明的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入系統(tǒng)與本發(fā)明的基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法一一對應(yīng),在上述基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入方法的實施例闡述的技術(shù)特征及其有益效果均適用于基于網(wǎng)頁端的數(shù)據(jù)導(dǎo)入系統(tǒng)的實施例中,特此聲明。
以上所述實施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡潔,未對上述實施例中的各個技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說明書記載的范圍。
以上所述實施例僅表達(dá)了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。