本發(fā)明涉及計算機通信技術領域,尤其涉及一種紙質表單轉換為網頁表單的方法及系統(tǒng)。
背景技術:
目前各個無紙化的辦公系統(tǒng),審批系統(tǒng)逐步普及,原來紙質化的word排版的表單。例如請假單,出車申請單等等,需要轉成系統(tǒng)中的流程化的form表單,在系統(tǒng)搭建的前期需要花費大量的人力來實施?,F有技術中大多采用dreamware等類似的網頁編輯軟件,手動的將原來的word表單按部就班的繪制出來,費時,無技術含量?;蛘咄ㄟ^掃描儀轉換成word,再利用word自帶的工具轉成網絡文本,內容復雜,不符合form表單的要求,生成的只是靜態(tài)的網頁。
現有技術中通常采用采用網頁編輯器繪制表格,需要投入大量的人力。繪制出來的form表單還需要與現有的系統(tǒng)對接表單元素設置id,name,過程復雜,效率低下。繪制的表單元素長度都需要調整,不可以直接獲取到原來紙質化的表單,而word等文字處理軟件自帶的轉html的功能轉出的表單內容繁瑣,沒有form表單元素。
技術實現要素:
為克服現有技術中存在的紙質表單轉變?yōu)榫W頁表單過程復雜,效率低下的問題,本發(fā)明提供了一種紙質表單轉換為網頁表單的方法及系統(tǒng)。
一種紙質表單轉換為網頁表單的方法,包括如下步驟:
步驟一:通過圖像掃描設備將紙質表單掃描生成位圖文件;
步驟二:通過文字處理器將位圖文件轉換為文字處理器表單文件;
步驟三:根據文字處理器表單文件的內容選擇網頁表單模板,將文字處理器表單文件中的表單元素插入網頁表單模板中,生成初步的網頁表單。
優(yōu)選的,一種紙質表單轉換為網頁表單的方法,包括如下步驟:
步驟一:將紙質表單通過掃描儀轉換成tif文件;
步驟二:通過文字處理器的OCR文本識別功能將tif文件轉成文字文本表單文件;
步驟三:根據文字文本表單文件的內容選擇網頁表單模板,將文字文本表單文件中的表單元素插入網頁表單模板中,生成初步的網頁表單。
優(yōu)選的,所述步驟三還包括如下步驟:
預先設置網頁表單模板:通過網頁編輯器繪制多套模板上傳至系統(tǒng)中;
選擇網頁表單模板:根據文字處理器表單文件中的表單內容選擇表單屬性接近的網頁表單模板;
插入表單內容:根據文字處理器表單文件中的表單內容插入標題和表格創(chuàng)建控件,所述標題根據文字處理器表單文件中的表單標題確定,所述表格創(chuàng)建控件用于生成表格;
讀取文字處理器表單文件中的內容:按照奇數列與偶數列區(qū)分的方式讀取文字處理器表單文件中的內容,將讀取到的內容填充到網頁表單模板中,奇數列的內容作為變量,偶數列的內容作為文本編輯框,變量與文本編輯框一一對應;
生成初步的網頁表單:根據網頁表單模板的填充內容,通過表格創(chuàng)建控件生成初步的網頁表單。
進一步的,所述步驟三還包括如下步驟:
優(yōu)化網頁表單元素:根據文本編輯框的大小選擇采用input元素或textarea元素控件進行填充;
填充網頁表單屬性:根據文字處理器表單文件中的文字的字體,將字體數據信息轉換為像素單位填充到網頁表單中;將文字處理器表單文件中的文字轉換為命名文本元素的字段。
進一步的,所述命名文本元素的字段為拼音字段或者英文字段,選擇表單模板的同時選擇命名規(guī)則。
本發(fā)明的另一個目的是提供一種采用如前所述的紙質表單轉換為網頁表單的方法的系統(tǒng),包括:
掃描設備,用于掃描紙質表單,并生成位圖文件;
連接模塊,用于連接掃描設備、文字處理器、網頁編輯模塊和顯示模塊;
文字處理器,用于將位圖文件轉換為文字處理器可處理的文字處理器表單文件,并且讀取文字處理器表單文件內每一列的內容;
網頁編輯模塊,用于在網頁編輯過程中生成網頁表單,并且根據文字處理器讀取到的內容選擇相應的網頁表單模板進行填充屬性和創(chuàng)建文本編輯框;
顯示模塊,用于顯示文字處理器界面和網頁表單界面。
進一步的,所述文字處理器包括:
文字處理器表單轉換單元,用于將掃描設備掃描到的紙質表單的位圖文件轉換為文字處理器可處理的文字處理器表單文件;
讀取單元,用于讀取文字處理器表單文件內的每一列的內容;
文字處理界面生成模塊,用于生成文字處理器表單轉換單元和讀取單元運行過程中的用戶可操作界面。
進一步的,所述網頁編輯模塊包括:
文本編輯框創(chuàng)建單元,用于根據文字處理器讀取到的文字處理器表單文件中的偶數列的內容進行創(chuàng)建文本編輯框;
網頁表單模板預生成選擇單元,用于在生成網頁表單之前生成網頁表單模板,并且根據文字處理器讀取到的文字處理器表單文件中的內容進行選擇合適的網頁表單模板;
網頁表單界面生成單元,用于生成網頁編輯模塊運行過程中的用戶可操作界面和網頁表單。
進一步的,所述網頁編輯模塊還包括:
屬性填充單元,用于根據文字處理器表單文件中的文字的字體,將字體數據信息轉換為像素單位填充到網頁表單中;將文字處理器表單文件中的文字轉換為命名文本元素的字段;
網頁表單優(yōu)化單元,用于根據文本編輯框的大小選擇采用input元素或textarea元素控件進行填充。
與現有技術相比,本發(fā)明的有益效果是:
(1)本發(fā)明通過圖像掃描設備將紙質表單轉換為位圖文件,再通過文字處理軟件將位圖文件轉換為網頁form表單,無需人工繪制表單,并且生成的網頁form表單能夠進行設置id和name屬性等,方便快捷,節(jié)省人力,轉換效率高。
(2)本發(fā)明通過對網頁form表單進行屬性配置,能夠使得生成的網頁form表單更具有美觀性,并且能夠保持紙質表單的原貌。
(3)本發(fā)明通過預先設置網頁表單模板進行生成表單,方便快捷,無需人工操作,表單生成速度快。
具體實施方式
以下結合實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
實施例1
本具體實施方式披露了一種紙質表單轉換為網頁表單的方法,包括如下步驟:
步驟一:通過圖像掃描設備將紙質表單掃描生成位圖文件。在本發(fā)明的一個可行的具體實施方式中,可以通過手持式掃描儀或者立式掃描儀進行掃描紙質表單,并且通過掃描儀連接計算機處理設備將掃描到的圖像以tif位圖文件的形式進行保存。掃描過程中避免可見光照射影響掃描的質量。采用手持式掃描儀進行掃描時,應當在光線較暗的空間內將紙質表單平鋪在平面上進行掃描。采用立式掃描儀進行掃描時則需要將紙質表單置于掃面蓋板下方并蓋緊蓋板,不漏亮光。在本發(fā)明的其他具體實施例中,位圖文件還可以是其他格式,例如BMP文件。
優(yōu)選的,圖像掃描設備還可以是數碼相機或者手機等圖像采集類設備,采用數碼相機或者手機進行獲取圖像能夠有效的避免圖像掃描設備在掃描過程中的曝光問題。
步驟二:通過文字處理器將位圖文件轉換為文字處理器表單文件。在本發(fā)明的一個可行的具體實施例中,可以采用Office Document Imaging軟件作為文字處理器,并通過其自帶的OCR文本識別功能將tif文件轉成文字文本表單文件。OCR文字識別是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,然后用字符識別方法將形狀翻譯成計算機文字的過程。在本發(fā)明的其他具體實施例中,還可以通過其他帶有圖像文字功能的文字處理器進行,例如漢王軟件,WPS等。
步驟三:根據文字處理器表單文件的內容選擇網頁表單模板,將文字處理器表單文件中的表單元素插入網頁表單模板中,生成初步的網頁表單。
優(yōu)選的,在選擇網頁表單模板之前預先設置多個網頁表單模板,通過網頁編輯器在插入網頁表單時,自動生成網頁表單模板供選擇。可行的,在本發(fā)明的一個具體實施方式中,可以通過一網頁表單模板服務器進行提供網頁表單模板。
優(yōu)選的,選擇網頁表單模板時根據文字處理器表單文件中的表單內容選擇表單屬性接近的網頁表單模板。具體的,是根據文字文本表單文件中表格的尺寸和樣式選擇最接近的網頁表單模板。
確定好網頁表單模板之后,根據文字處理器表單文件中的表單內容插入標題和表格創(chuàng)建控件,所述標題根據文字處理器表單文件中的表單標題確定,所述表格創(chuàng)建控件用于生成表格。
優(yōu)選的,初步生成的網頁表單的填充內容是按照奇數列與偶數列區(qū)分的方式讀取到的文字處理器表單文件中的內容,其中,奇數列的內容作為變量,偶數列的內容作為文本編輯框,并且變量與文本編輯框一一對應。變量是表格需要填寫的內容,其通過空間控制在網頁上可供用戶進行填寫。
最終上傳到網頁上的網頁表單通過表格創(chuàng)建控件生成。
在本發(fā)明的另一個具體實施方式中,初步生成的網頁表單還可以根據文本編輯框的大小選擇采用input元素或textarea元素控件進行填充來進行優(yōu)化。
此外,為使得網頁表單更具有美觀性,可以根據文字處理器表單文件中的文字的字體對網頁表單填充內容進行調整??尚械模梢詫⒆煮w數據信息轉換為像素單位填充到網頁表單中,再根據像素單位進行調整網頁表單字段的大小屬性。而網頁表單內填充的文字信息則是文字處理器表單文件中的文字轉換為命名文本元素的字段,優(yōu)選的,所述命名文本元素的字段為拼音字段或英文字段,其根據文字處理器表單文件中的文字的拼音或者英文同義得到。
采用上述方法獲得的表單能夠直接放到網頁上作為form的流程表單,使用方便,能夠有效的提高紙質表單上傳到網頁的效率。
實施例2
本具體實施方式披露了一種紙質表單轉換為網頁表單的系統(tǒng),包括:
掃描設備,用于掃描紙質表單,并生成位圖文件。優(yōu)選的,掃描設備可以采用立式掃描儀、手持式掃描儀、數碼相機或者手機等圖像采集設備。掃描得到的圖像存儲為tif格式、BMP格式等位圖文件格式,采用位圖文件進行存儲圖像,圖像失真度小,能夠有效的位置紙質表單的原狀。
連接模塊,用于連接掃描設備、文字處理器、網頁編輯模塊和顯示模塊。優(yōu)選的,可以通過一數據交換機將掃描設備、文字處理器、網頁編輯模塊和顯示設備相連接,掃描設備將文件傳送給文字處理器,文字處理器與網頁編輯模塊之間相互傳送數據,而顯示模塊則接收文字處理器和網頁編輯模塊傳送的顯示信息數據。
文字處理器,用于將位圖文件轉換為文字處理器可處理的文字處理器表單文件,并且讀取文字處理器表單文件內每一列的內容??尚械?,文字處理器可以是自帶的OCR文本識別功能軟件,例如Office Document Imaging軟件、漢王和WPS等。
優(yōu)選的,文字處理器包括文字處理器表單轉換單元,用于將掃描設備掃描到的紙質表單的位圖文件轉換為文字處理器可處理的文字處理器表單文件。
讀取單元,用于讀取文字處理器表單文件內的每一列的內容。
文字處理界面生成模塊,用于生成文字處理器表單轉換單元和讀取單元運行過程中的用戶可操作界面,具體的是將讀取文字處理器表單文件內容、選擇內容等通過控件菜單選擇的形式呈現給用戶供用戶選擇。
此外,網頁編輯模塊用于在網頁編輯過程中生成網頁表單,并且根據文字處理器讀取到的內容選擇相應的網頁表單模板進行填充屬性和創(chuàng)建文本編輯框。
優(yōu)選的,所述網頁編輯模塊包括,文本編輯框創(chuàng)建單元,其用于根據文字處理器讀取到的文字處理器表單文件中的偶數列的內容進行創(chuàng)建文本編輯框。
還包括一網頁表單模板預生成選擇單元,用于在生成網頁表單之前生成網頁表單模板,并且根據文字處理器讀取到的文字處理器表單文件中的內容進行選擇合適的網頁表單模板。在選擇合適的網頁表單模板之后,通過一表格生成控件進行生成表格,用戶通過點擊控件形成需要的表格。優(yōu)選的,用戶在點擊控件之后,還會在操作界面彈出一屬性選擇對話框,用戶可以在對話框內選擇表格的屬性,包括底紋、顏色、尺寸調節(jié)和字體大小等,具體的各個屬性的名稱根據文字處理器內的表單的字段來確認。
還包括一網頁表單界面生成單元,用于生成網頁編輯模塊運行過程中的用戶可操作界面和網頁表單。用戶通過在用戶可操作界面內進行選擇控制網頁編輯模塊運行過程。
優(yōu)選的,網頁編輯模塊還包括一屬性填充單元,用于根據文字處理器表單文件中的文字的字體,將字體數據信息轉換為像素單位填充到網頁表單中;將文字處理器表單文件中的文字轉換為命名文本元素的字段??尚械?,在本發(fā)明的一個具體實施方式中,可以采用字段的拼音或者英文作為命名文本。
優(yōu)選的,網頁編輯模塊還包括一網頁表單優(yōu)化單元,用于根據文本編輯框的大小選擇采用input元素或textarea元素控件進行填充。
顯示模塊,用于顯示文字處理器界面和網頁表單界面??尚械?,在本發(fā)明的一個具體實施方式中,可以采用一液晶顯示器進行顯示,其同時作為文字處理器和網頁編輯模塊的顯示設備。用戶能夠在該液晶顯示器上看到操作的步驟和過程中的網頁表單。并且用戶還以通過該液晶顯示其看到網頁編輯的內容。
上述說明示出并描述了本發(fā)明的優(yōu)選實施例,如前所述,應當理解本發(fā)明并非局限于本文所披露的形式,不應看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構想范圍內,通過上述教導或相關領域的技術或知識進行改動。而本領域人員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應在本發(fā)明所附權利要求的保護范圍內。