專利名稱:表單制作裝置以及表單制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種制作表單的表單制作裝置以及表單制作方法。
背景技術(shù):
近年來,在各領(lǐng)域中進(jìn)行著無紙化,但是例如在組織的基礎(chǔ)業(yè)務(wù)中,發(fā)票、考勤表、 調(diào)查表、試卷等、在醫(yī)院除此以外的診斷表等仍然使用印刷在紙張上的表單。用戶為了有效地管理以后通過手寫等填寫在表單上的信息,利用掃描儀讀取表單,利用0CR(0ptical Character Reader 光符閱讀機)裝置實施OCR處理。但是,在表單的布局、格式不合適的情況下,有時無法正確地進(jìn)行OCR處理。因此, 公開了一種技術(shù),即根據(jù)由用戶輸入的OCR型號、行字段數(shù)、字符數(shù),以預(yù)先規(guī)定的形式固定地決定表單的布局(例如專利文獻(xiàn)1)。另外,提出了一種信息處理裝置,即將從表單讀取到的圖像數(shù)據(jù)與作為選擇基準(zhǔn)的多個選擇基準(zhǔn)圖像數(shù)據(jù)進(jìn)行比較,選擇對應(yīng)的選擇基準(zhǔn)圖像數(shù)據(jù),根據(jù)該選擇基準(zhǔn)圖像數(shù)據(jù)來進(jìn)行OCR處理(例如專利文獻(xiàn)2)。專利文獻(xiàn)1 日本特開平8-30659號公報專利文獻(xiàn)2 日本特開2000-132542號公報
發(fā)明內(nèi)容
發(fā)明要解決的問題以往,利用OCR裝置有時無法對掃描儀所讀取到的表單的圖像數(shù)據(jù)正確地進(jìn)行 OCR處理。另外,以O(shè)CR處理的精度為優(yōu)先而僅能固定地形成表單的布局。因此,本發(fā)明是鑒于這種問題而完成的,目的在于提供一種確保布局的自由度并能夠提高所生成的表單的OCR處理精度的表單制作裝置、表單制作程序以及表單制作方法。用于解決問題的方案為了解決上述問題,本發(fā)明的表單制作裝置具有保存部,其保存設(shè)定信息的范圍,該設(shè)定信息的范圍用于規(guī)定適合于OCR處理的圖像要素;以及圖像生成部,其根據(jù)用戶的輸入以及保存于保存部的設(shè)定信息的范圍來生成表單圖像。圖像生成部也可以根據(jù)保存部所保存的設(shè)定信息的范圍來設(shè)定構(gòu)成表單圖像的圖像要素的設(shè)定信息的初始值。還可以具有適合判斷部,該適合判斷部判斷構(gòu)成表單圖像的各個圖像要素是否適合于OCR處理。適合判斷部僅對構(gòu)成表單圖像的圖像要素中的由用戶指定的圖像要素判斷是否適合于OCR處理。適合判斷部也可以根據(jù)保存部所保存的設(shè)定信息的范圍來判斷是否適合于OCR處理。還可以具有要素替換部,該要素替換部將構(gòu)成表單圖像的圖像要素中的不適合于OCR處理的圖像要素替換為適合于OCR處理的圖像要素。也可以保存部保存作為替換候選的圖像要素的圖案,要素替換部對構(gòu)成表單圖像的圖像要素以及保存部所保存的圖案進(jìn)行圖案匹配,將匹配于圖案的圖像要素替換為適合于OCR處理的圖像要素。也可以在設(shè)定信息中至少包含字符字體、字符尺寸、紙張尺寸、格線長度、格線線寬、格線方向、文本框大小、文本框線寬、復(fù)選框大小、復(fù)選框間隔、條形碼種類、條形碼大小、條形碼單元寬度、條形碼校驗位、顏色、濾色、定位標(biāo)記大小、定位標(biāo)記配置、印刷時的倍率以及印刷后的圖像要素大小中的任一個。還可以具有輸出控制部,該輸出控制部在印刷表單圖像的情況下控制圖像形成裝置以在預(yù)先設(shè)定的印刷條件下進(jìn)行印刷。為了解決上述問題,本發(fā)明的表單制作方法具有以下步驟生成步驟,根據(jù)用戶輸入生成表單圖像;判斷步驟,判斷構(gòu)成表單圖像的各個圖像要素是否適合于OCR處理;以及顯示步驟,顯示判斷結(jié)果。發(fā)明的效果如上所述,本發(fā)明是鑒于這種問題而完成的,確保布局的自由度并能夠提高所生成的表單的OCR處理精度。
圖1是表示表單處理系統(tǒng)的概要的連接關(guān)系的說明圖。圖2是表示表單制作裝置的結(jié)構(gòu)的功能框圖。圖3是表示表單圖像的一例的說明圖。圖4是用于說明設(shè)定信息的說明圖。圖5是用于說明適合判斷部的判斷處理的說明圖。圖6是用于說明基于要素替換部的圖案匹配的替換處理的說明圖。圖7是表示OCR裝置的結(jié)構(gòu)的功能框圖。圖8是表示表單制作方法的整體處理流程的流程圖。附圖標(biāo)記說明110 表單制作裝置;130 打印機(圖像形成裝置);164 保存部;170 圖像生成部;172 適合判斷部;174 要素替換部;176 數(shù)據(jù)輸出部;178 輸出控制部。
具體實施例方式下面,參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實施方式。上述實施方式示出的尺寸、材料、其它具體的數(shù)值等僅是用于容易地理解發(fā)明的例示,除了具有特別說明的情況以外,并不限定本發(fā)明。此外,在本說明書以及附圖中,對實質(zhì)上具有相同的功能、結(jié)構(gòu)的要素附加相同的附圖標(biāo)記來省略重復(fù)說明,另外與本發(fā)明沒有直接關(guān)系的要素省略圖示。(表單處理系統(tǒng)100)圖1是表示表單處理系統(tǒng)100的概要連接關(guān)系的說明圖。表單處理系統(tǒng)100構(gòu)成為包括表單制作裝置110、0CR裝置120、打印機(圖像形成裝置)130、掃描儀140。表單制作裝置110通過因特網(wǎng)、LAN (Local Area Network :局域網(wǎng))、專用線路等通信網(wǎng)150與OCR裝置120相連接。另外,表單制作裝置110例如通過LAN與打印機130相連接,OCR裝置120例如通過LAN與掃描儀140相連接。并且,在通信網(wǎng)150上連接有企業(yè)等的基礎(chǔ)系統(tǒng)的應(yīng)用程序服務(wù)器152。表單制作裝置110當(dāng)接收由用戶輸入的制作布局的輸入時,表單制作裝置110生成與圖像要素組合在一起的表示表單154的布局的布局圖像。并且,打印機130按照所生成的該布局來印刷表單154。用戶在印刷出的表單巧4上例如通過手寫、蓋印以及沖壓等記載業(yè)務(wù)上的信息。當(dāng)向表單154的記載完成時,掃描儀140讀取記載有信息的表單154, OCR裝置120對讀取到的該圖像數(shù)據(jù)進(jìn)行OCR處理,獲取填寫在表單巧4上的填寫信息并輸出到應(yīng)用程序服務(wù)器152,由此能夠在基礎(chǔ)系統(tǒng)中利用填寫信息。例如,提出了一種表單制作裝置,即根據(jù)由用戶手動輸入的OCR型號、行字段數(shù)、 字符數(shù)來自動生成表單格式。但是,該提案中的表單制作裝置僅是統(tǒng)一決定要制作的表單的文本框、表單尺寸。在本實施方式所涉及的表單處理系統(tǒng)100中,表單制作裝置110以適合于OCR處理的方式生成表單圖像,因此能夠確保布局的自由度并提高所生成的表單154的OCR處理精度。下面,按照表單制作裝置110、OCR裝置120的順序詳細(xì)說明表單制作裝置110、OCR 裝置120的結(jié)構(gòu)。(表單制作裝置110)圖2是表示表單制作裝置110的結(jié)構(gòu)的功能框圖。表單制作裝置110構(gòu)成為包括顯示部160、操作部162、保存部164、中央控制部166。顯示部160包括液晶顯示器、有機EL (Electro Luminescence 電致發(fā)光)顯示器等。操作部162包括設(shè)置于顯示部160的顯示面上的觸摸面板、設(shè)置有多個操作鍵的鍵盤、 鼠標(biāo)等指示裝置、十字鍵以及操縱桿等。表單制作裝置110在顯示部160中顯示表單制作圖像,接受用戶通過操作部162輸入的操作而生成表單154的布局圖像(以下簡單稱為表單圖像)。在表單制作裝置110中在生成表單圖像時準(zhǔn)備以下模式作為設(shè)計模式在設(shè)計上沒有限制的普通模式;以及考慮了適合于OCR處理的OCR表單模式,按照用戶通過操作部 162的輸入來切換。另外,在OCR表單模式下,根據(jù)用戶輸入設(shè)定作為表單154的基本信息的顏色、濾色、掃描儀讀取分辨率、掃描儀校正有無等。在顏色設(shè)定中,能夠選擇彩色、黑白等。在濾除的設(shè)定中,能夠選擇以下表單使用了無法由掃描儀140識別的濾色的硬濾除表單;使通過 OCR處理裝置120中的OCR處理選擇的濾除的軟濾除表單;以及在掃描儀140的光源中使用多個顏色以避免任一顏色被濾除的非濾除表單等。在掃描儀讀取分辨率的設(shè)定中,能夠選擇200/240/300/400dpi等。在掃描儀校正有無的設(shè)定中,能夠選擇是否對由掃描儀140 讀取到的表單154的圖像數(shù)據(jù)進(jìn)行例如傾斜校正等處理。圖3是表示表單圖像的一例的說明圖。如圖3所示,作為表單圖像的圖像要素而例如設(shè)定文本框182a、字符18 、基準(zhǔn)標(biāo)記182c、條形碼182d等的配置。在此,在OCR裝置 120對掃描儀140所讀取的圖像數(shù)據(jù)實施OCR處理時,基準(zhǔn)標(biāo)記182c成為表單154的方向以及布局位置的基準(zhǔn)。另外,條形碼182d是按照規(guī)定的規(guī)則對任意的信息進(jìn)行編碼而成, 例如表示識別表單154的表單ID。
表單制作裝置110根據(jù)用戶通過操作部162的操作輸入來生成圖3示出的表單圖像。此時,表單IM包括多個輸入?yún)^(qū)域184,該多個輸入?yún)^(qū)域184是匯總具有規(guī)則性的輸入方式的區(qū)域。輸入?yún)^(qū)域184例如被文本框18 包圍。在輸入?yún)^(qū)域184中能夠按照每個輸入?yún)^(qū)域184而設(shè)定假設(shè)為要填寫的字符種類(英文、數(shù)字、日文、符號等)、屬性(手寫字符、 鉛字等)等。保存部164包括HDD (Hard Disk Drive 硬盤驅(qū)動器)、閃存存儲器、非易失性 RAM (Random Access Memory 隨機存取存儲器)等。在本實施方式中,保存部164與表單制作裝置110—體地形成,但是并不限于上述情況,也可以是分開的例如NAS(Network Attached Storage 網(wǎng)絡(luò)附加存儲)、外置 HDD、USB (Universal Serial Bus:通用串行總線)存儲器等。保存部164保存對表單圖像中的適合于OCR處理的圖像要素(例如格線)進(jìn)行規(guī)定的設(shè)定信息(例如長度、粗細(xì))的范圍以及成為替換候選的圖像要素的圖案。后面詳細(xì)說明圖像要素的圖案。在設(shè)定信息中至少包含字符字體、字符尺寸、紙張尺寸、格線長度、格線線寬、格線方向、文本框18 大小、文本框18 線寬、復(fù)選框大小、復(fù)選框間隔、條形碼種類、條形碼大小、條形碼單元寬度、條形碼校驗位、顏色、濾色、定位標(biāo)記大小、定位標(biāo)記配置、印刷時的倍率以及印刷后的圖像要素大小中的任一個。設(shè)定信息中的字符字體的選擇范圍為明體或者哥特體,字符尺寸的選擇范圍為 10 14點等。紙張尺寸的選擇范圍在普通紙張的情況下最大A4開,在濾色表單的情況下最大B4開等。格線長度的選擇范圍為5mm以上,格線的寬度的選擇范圍為0. 2mm以上,格線的方向的選擇范圍為垂直方向或者水平方向等。另外,文本框18 大小由文本框18 的高度和寬度來定義,其選擇范圍為高度IOmm以上、寬度7mm以上等。文本框18 的線寬的選擇范圍為0. 2mm以上等。設(shè)定信息中的條形碼的種類的選擇范圍為NW-7、00DE39、00DE128, JANl3等,條形碼大小的選擇范圍被指定為高度IOmm以上、整體寬度IOOmrn以下等。另外,作為構(gòu)成條形碼的每個條碼或間隔的寬度的單元寬度的選擇范圍為最小寬度0. 2mm(300/400dpi)、最小寬度0. 3mm(200/240dpi)、最大寬度2. Omm等。條形碼校驗位的選擇范圍為NW_7(系數(shù) 10/11/16)、00E39(系數(shù) 43)等。設(shè)定信息中的顏色的選擇范圍為印刷濃度較高的黑色等。濾色的選擇范圍為鮮明的紅色、綠色、藍(lán)色系統(tǒng)的顏色等。另外,印刷時的倍率的選擇范圍為90% 110%等。上述設(shè)定信息中的受到印刷時的倍率影響的例如字符大小、格線線寬等的設(shè)定信息的選擇范圍可以是印刷時的倍率為100%的情況下的尺寸(印刷后的圖像要素大小),也可以是以任意指定的倍率印刷后的尺寸。另外,在設(shè)定信息的選擇范圍中也可根據(jù)每個圖像要素的種類或者相鄰圖像要素的組合示出與相鄰圖像要素之間的間隔的下限值。并且,在保存部164中也可以將表單圖像整體視作一個圖像要素,保存上述基本信息的選擇范圍作為該圖像要素的設(shè)定信息的選擇范圍。圖4是用于說明設(shè)定信息的說明圖。圖4的(a)是用于說明復(fù)選框大小和間隔的說明圖,圖4的(b)是用于說明定位標(biāo)記192大小和配置的說明圖。如圖4的(a)所示,例如在作為圖像要素的復(fù)選框190的設(shè)定信息中,以復(fù)選框190的寬度190a、高度190b等表示復(fù)選框190的大小,以相鄰復(fù)選框190之間的橫向間隔 190c、縱向間隔190d等表示復(fù)選框190的間隔。在設(shè)定信息的選擇范圍中,寬度190a、高度 190b分別為4mm以上,橫向間隔190c、縱向間隔190d分別為2mm以上等。另外,如圖4的(b)所示,例如在作為圖像要素的定位標(biāo)記192的設(shè)定信息中,定位標(biāo)記192的大小例如在定位標(biāo)記192呈矩形的情況下以寬度192a、高度192b表示,例如在定位標(biāo)記192呈環(huán)型的情況下以直徑192c、線寬192d等表示,定位標(biāo)記192的配置例如以定位標(biāo)記192中心在表單圖像上的位置坐標(biāo)等表示。在設(shè)定信息的選擇范圍中,寬度 192a 為 4. 5mm 5. 5mm,高度 19 為 2. 5 3. 5mm,直徑 192c 為 4. 5mm 5. 5mm,線寬 192d 為1. 0 1. 5mm等。另外,在設(shè)定信息為定位標(biāo)記192中心的位置坐標(biāo)的情況下,設(shè)定信息的選擇范圍是距表單圖像的縱橫的端的距離19&、192f,分別為1. Omm以上等。關(guān)于保存部164,將上述設(shè)定信息的適合于OCR處理的范圍保存于保存部164中。 如上所述,本實施方式的表單制作裝置110能夠設(shè)定很多詳細(xì)項目作為圖像要素的設(shè)定信息,參照保存于保存部164中的設(shè)定信息的范圍來生成表單圖像,由此能夠提高OCR處理的精度。中央控制部166通過半導(dǎo)體集成電路來控制表單制作裝置110整體,其中,半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部166還作為圖像生成部170、適合判斷部172、要素替換部174、數(shù)據(jù)輸出部176、輸出控制部178、定義輸出部180而發(fā)揮功能。圖像生成部170根據(jù)用戶通過操作部162的輸入以及保存于保存部164中的設(shè)定信息的范圍來生成表單圖像。例如,在上述OCR表單模式下當(dāng)存在生成表單圖像的用戶輸入時,圖像生成部170在保存于保存部164中的設(shè)定信息的范圍內(nèi)設(shè)定構(gòu)成表單圖像的圖像要素的設(shè)定信息的初始值。當(dāng)存在指示圖像要素例如格線、文本框182a、字符182b等的配置的用戶輸入時, 圖像生成部170根據(jù)保存在保存部164中的設(shè)定信息的范圍來設(shè)定該圖像要素的設(shè)定信息、例如格線的線寬、字符182b的大小等初始值并進(jìn)行配置。根據(jù)上述結(jié)構(gòu),從開始就能夠配置設(shè)定信息被設(shè)定了適合于OCR處理的初始值的圖像要素,從而能夠提高作業(yè)效率。此時,圖像生成部170根據(jù)用戶輸入將設(shè)定信息的初始值設(shè)定為保存于保存部 164的設(shè)定信息的范圍中的更適合于OCR處理的建議值或者設(shè)定信息的范圍中的比較不適合于OCR處理的界限值。當(dāng)使用建議值時,OCR處理的精度進(jìn)一步提高,當(dāng)使用界限值時, 例如能夠相對地縮小字符尺寸或者能夠相對地縮小圖像要素間的間隔,因此表單的布局自由度提高。另外,能夠通過用戶輸入來變更初始值。還能夠使通過用戶輸入變更后的初始值初始化到變更前的初始值。另外,也可以設(shè)為保存于保存部164中的設(shè)定信息的范圍例如按照每個OCR裝置 120的型號名稱、使用于OCR裝置120的OCR處理部中的OCR處理軟件的名稱以及版本來保存,圖像生成部170根據(jù)用戶輸入或來自O(shè)CR裝置120的控制信息來使用對應(yīng)的設(shè)定信息的范圍。適合判斷部172例如以從普通模式向OCR表單模式的切換、由用戶進(jìn)行的OCR表單模式的選擇輸入為契機,判斷構(gòu)成已經(jīng)生成的表單圖像的各個圖像要素是否適合于OCR 處理。適合判斷部172例如根據(jù)保存于保存部164中的設(shè)定信息的范圍、與其它圖像要素之間的組合來判斷是否適合于OCR處理。圖5是用于說明適合判斷部172的判斷處理的說明圖。當(dāng)適合判斷部172判斷構(gòu)成表單圖像的各個圖像要素是否適合于OCR處理時,如圖5所示,在顯示部160中顯示判斷結(jié)果畫面194來向用戶通知判斷結(jié)果。例如,在區(qū)域196a中顯示如下內(nèi)容;條形碼“發(fā)票編號”(圖像要素)的高度處在保存于保存部164中的設(shè)定信息的范圍之外而成為不適合于 OCR處理的高度,以及該范圍的下限值。另外,在區(qū)域196b中顯示如下內(nèi)容字母項目“顧客ID”的字符尺寸處在保存于保存部164中的設(shè)定信息的范圍之外而成為不適合于OCR處理的大小,以及該范圍的下限值。另外,如圖5的陰影所示,當(dāng)通過用戶輸入選擇區(qū)域196a時,例如在顯示部160中并列地顯示的表單圖像中的對應(yīng)的圖像要素、即條形碼“發(fā)票編號”本身被強調(diào)顯示(高亮區(qū)),因此用戶能夠容易地掌握不適合于OCR處理的圖像要素。這樣,根據(jù)參照保存于保存部164中的圖像要素的設(shè)定信息的范圍的結(jié)構(gòu),通過對圖像要素的設(shè)定要素與范圍進(jìn)行比較這種簡單的處理,能夠判斷是否適合于OCR處理。 另外,保存部164還可以分別保存用于對新生成的圖像要素的設(shè)定信息的初始值進(jìn)行設(shè)定的設(shè)定信息的范圍以及用于判斷已經(jīng)生成的圖像要素是否適合于OCR處理的設(shè)定信息的范圍。并且,適合判斷部172根據(jù)用戶輸入,使用上述初始值的建議值來使判斷基準(zhǔn)嚴(yán)格或者使用初始值的界限值來使判斷基準(zhǔn)寬松。根據(jù)具備適合判斷部172的結(jié)構(gòu),例如即使在已經(jīng)制作出的圖像要素的設(shè)定信息不包含在保存于保存部164的設(shè)定信息的范圍內(nèi)而如果保持這樣很有可能會使OCR處理精度變得不充分的情況下,也能夠通過由圖像生成部170通知判斷為不包含在保存于保存部 164的設(shè)定信息的范圍內(nèi)的設(shè)定信息的圖像要素來催促用戶修改。另外,適合判斷部172僅對構(gòu)成表單圖像的圖像要素中的用戶獨立地或者在范圍內(nèi)指定的圖像要素、其設(shè)定信息、或者針對所有圖像要素指定的設(shè)定信息判斷是否適合于 OCR處理。根據(jù)上述結(jié)構(gòu),例如甚至考慮到OCR處理精度足夠的圖像要素、濾色等有意地設(shè)為OCR處理對象外的圖像要素等不需要判斷是否適合于OCR處理的圖像要素,從而能夠避免進(jìn)行多余的判斷處理的情況,能夠減輕處理負(fù)載并縮短處理時間。另外,例如在存在期望以特別嚴(yán)格的判斷基準(zhǔn)進(jìn)行判斷的設(shè)定信息的情況下,用戶還能夠僅選擇該設(shè)定信息,使判斷基準(zhǔn)變得嚴(yán)格之后判斷是否適合于OCR處理。要素替換部174將構(gòu)成表單圖像的圖像要素中的不適合于OCR處理的圖像要素替換為適合于OCR處理的圖像要素。如圖5所示,在判斷結(jié)果畫面194中,在上部中顯示標(biāo)記為“匯總自動修改”的按鈕198a,在區(qū)域196a、196b內(nèi)例如分別顯示標(biāo)記為“自動修改”的按鈕198b、198c。當(dāng)用戶通過操作部162選擇按鈕198a時,在所有區(qū)域196a、196b內(nèi)示出的圖像要素的設(shè)定信息被替換為分別對應(yīng)的范圍內(nèi)的值。另外,當(dāng)用戶選擇按鈕198b、198c時,能夠個別地自動修改圖像要素的設(shè)定信息。并且,并不限于自動修改,用戶也可以通過操作部162輸入任意的值來修改設(shè)定信息。根據(jù)上述結(jié)構(gòu),能夠?qū)⒉贿m合于OCR處理的圖像要素自動地替換為適合于OCR處理的圖像要素,能夠減輕用戶修改圖像要素的設(shè)定信息等以使之成為適合于OCR處理的圖像要素的作業(yè)負(fù)擔(dān)。另外,要素替換部174對構(gòu)成表單圖像的圖像要素以及保存于保存部164中的圖案進(jìn)行圖案匹配,將對應(yīng)于該圖案的圖像要素替換為適合于OCR處理的圖像要素。圖6是用于說明基于要素替換部174的圖案匹配的替換處理的說明圖。在存在輸入形式不適合于OCR處理的例如用戶利用圓圈來包圍“喜歡” “一般” “不喜歡”字符這種輸入形式的圖像要素、對一個文本框填寫預(yù)先設(shè)定的形式的多個字符(例如多位數(shù)值)的圖像要素的情況下,如圖6所示,在圖案替換畫面200中顯示針對成為建議替換的對象的圖像要素的替換候選。與圖5中說明的判斷結(jié)果畫面194同樣地,在圖案替換畫面200中也一樣,對于通過用戶輸入選擇的圖像要素,在顯示部160中并列地顯示的表單圖像中的對應(yīng)的圖像要素本身被強調(diào)顯示(高亮區(qū))。當(dāng)通過用戶輸入來選擇按鈕20 202b、按鈕20 204d中的某一個時,要素替換部174替換為與所選擇的該按鈕20 202b、按鈕20 204d對應(yīng)的例如在“喜歡” “一般” “不喜歡”各個字符一側(cè)設(shè)置復(fù)選框的圖像要素以及添加將文本框分割為與字符數(shù)量相應(yīng)的輔助線的圖像要素等。另外,當(dāng)選擇“匯總自動修改”按鈕206時,要素替換部174針對輸入形式不適合于OCR處理的各個圖像要素,根據(jù)預(yù)先設(shè)定的優(yōu)先順序,來自動地選擇輸入形式最適合于OCR處理的圖像要素并進(jìn)行替換。根據(jù)上述結(jié)構(gòu),即使用戶不知道不適合于OCR處理的輸入形式,通過由要素替換部174通知輸入形式不適合于OCR處理的圖像要素并示出其替換候選,也能夠設(shè)為由用戶輸入選擇的適合于OCR處理的輸入形式,從而能夠提高OCR處理精度。數(shù)據(jù)輸出部176將表單圖像變換為與印刷對應(yīng)的形式后輸出到打印機130。在印刷表單圖像的情況下,輸出控制部178控制打印機130使其在預(yù)先設(shè)定的印刷條件下進(jìn)行印刷。輸出控制部178并不限于直接控制打印機130的情況,輸出控制部178 也可以將禁止變更的印刷條件等控制信息輸出到打印機130,打印機130根據(jù)該控制信息來設(shè)定印刷條件。即使設(shè)定為OCR處理精度提高的布局,當(dāng)在打印機130中進(jìn)行印刷條件變更而例如進(jìn)行縮小印刷時,印刷出的表單的字符大小變小或者線粗細(xì)變細(xì),從而有可能使OCR處理精度降低。輸出控制部178控制打印機130使其在預(yù)先設(shè)定的印刷條件下進(jìn)行印刷,由此能夠避免這樣的情況。定義輸出部180將圖像生成部170所生成的表單圖像以電子方式輸出到OCR裝置 120。另外,定義輸出部180并不限于輸出表單圖像的情況,也可以從表單圖像生成用于進(jìn)行OCR處理的表示定義的定義信息來輸出到OCR裝置120。如上所述,本實施方式的表單制作裝置110能夠根據(jù)用戶輸入自由地進(jìn)行表單設(shè)計,并且能夠使圖像要素的設(shè)定信息收斂在保存于保存部164的設(shè)定信息的范圍內(nèi)來以適合于OCR處理的方式生成表單圖像。因此,能夠提高針對表單154的OCR處理的精度。(OCR 裝置 120)圖7是表示OCR裝置120的結(jié)構(gòu)的功能框圖。OCR裝置120構(gòu)成為包括顯示部 300、操作部302、中央控制部304。顯示部300包括液晶顯示器、有機EL顯示器等。操作部302包括設(shè)置于顯示部300的顯示畫面上的觸摸面板、設(shè)置有多個操作鍵的鍵盤、鼠標(biāo)等指示裝置、十字鍵、操縱桿寸。中央控制部304通過半導(dǎo)體集成電路來控制OCR裝置120整體,其中,半導(dǎo)體集成電路包括中央處理裝置(CPU)、存儲有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部304還作為圖像獲取部320、定義獲取部322、OCR處理部324、服務(wù)器輸出部3 而發(fā)揮功能。圖像獲取部320從掃描儀140獲取讀取表單巧4而生成的圖像數(shù)據(jù)。定義獲取部322獲取表單制作裝置110的定義輸出部180所輸出的表單圖像或者定義信息。在獲取到表單圖像的情況下,定義獲取部322從該表單圖像生成表示進(jìn)行OCR 處理的用于定義的定義信息。OCR處理部3 例如以圖像獲取部320所獲取到的圖像數(shù)據(jù)的圖像中的基準(zhǔn)標(biāo)記 182c的位置為基準(zhǔn),根據(jù)定義獲取部322獲取或者生成的定義信息,對掃描儀140所讀取到的表單154的圖像數(shù)據(jù)進(jìn)行OCR處理(從圖像數(shù)據(jù)抽取該圖像數(shù)據(jù)所示出的字符、數(shù)字等內(nèi)容的處理)。服務(wù)器輸出部3 將OCR處理部3 所進(jìn)行的OCR處理的結(jié)果即抽取出的字符、 數(shù)字等信息輸出到應(yīng)用程序服務(wù)器152。以上,通過所說明的表單制作裝置110、0CR裝置120,能夠在確保布局的自由度的同時提高所生成的表單巧4的OCR處理精度。另外,還提供使計算機作為表單制作裝置110 而發(fā)揮功能的表單制作程序、存儲有該表單制作程序的計算機可讀取的軟盤、光磁盤、ROM、 EPR0M、EEPR0M、CD (Compact Disc 致密光盤)、DVD (Digital Versatile Disk 數(shù)字多功能光盤)、BD(BlU-ray Disc:藍(lán)光光盤)等存儲介質(zhì)。在此,程序是指利用任意語言、描述方法進(jìn)行描述的數(shù)據(jù)處理單元。另外,還可以將該表單制作程序存儲于通過通信網(wǎng)150與表單制作裝置110相連接的任意的應(yīng)用程序服務(wù)器,還能夠根據(jù)需要下載其全部或者一部分。(表單制作方法)接著,說明運用上述表單處理系統(tǒng)的表單制作方法。圖8是表示表單制作方法的整體處理流程的流程圖。如圖8所示,當(dāng)存在指示制作表單圖像的用戶輸入時(S400),圖像生成部170判斷當(dāng)前的設(shè)計模式是否為OCR表單模式(S402),在為OCR表單模式的情況下(S402:“是”), 圖像生成部170根據(jù)基于操作部162的用戶輸入以及保存于保存部164的用于使設(shè)定信息適合于OCR處理的設(shè)定信息的范圍來生成表單圖像(S404)。在并非OCR表單模式而是普通模式的情況下(S402 “否”),圖像生成部170僅根據(jù)用戶輸入來生成表單圖像(S406)。然后,在存在指示從普通模式向OCR表單模式切換或判斷是否適合OCR處理的用戶輸入的情況下(S408 “是”),適合判斷部172分別判斷構(gòu)成表單圖像的各個圖像要素是否適合于OCR處理(S410),在顯示部160中顯示表示其判斷結(jié)果的判斷結(jié)果畫面(S412)。要素替換部174判斷是否存在指示自動或者手動修改的用戶輸入(S414),當(dāng)存在指示修改的用戶輸入時(S414 “是”),將構(gòu)成表單圖像的圖像要素中的不適合于OCR處理的圖像要素替換為適合于OCR處理的圖像要素(S416)。在圖像要素替換步驟S416之后,或者在適合判斷用戶輸入判定步驟S408中不存在指示從普通模式向OCR表單模式切換或判斷是否適合OCR處理的用戶輸入的情況下 (S408 “否”),要素替換部174判斷是否存在指示圖案匹配的用戶輸入(S418)。當(dāng)存在指示圖案匹配的用戶輸入時(S418 “是”),對構(gòu)成表單圖像的圖像要素以及保存于保存部164 的圖案進(jìn)行圖案匹配(S420),判斷是否存在匹配的圖像要素(S422)。在存在匹配的圖像要素的情況下(S422 “是”),要素替換部174使顯示部160顯示圖案替換畫面(S424)。要素替換部174判斷是否存在選擇替換候選并進(jìn)行替換的用戶輸入(S426),當(dāng)存在選擇替換候選并進(jìn)行替換的用戶輸入時(S426 “是”),要素替換部174將輸入形式不適合于OCR處理的圖像要素替換為所選擇的輸入形式適合于OCR處理的圖像要素(S428)。根據(jù)這種表單制作方法,能夠在確保布局的自由度的同時提高所生成的表單IM 的OCR處理精度。以上,參照
了本發(fā)明的優(yōu)選實施方式,但是當(dāng)然本發(fā)明并不限于上述實施方式。本領(lǐng)域技術(shù)人員在記載于權(quán)利要求范圍內(nèi)的范疇中能夠想得到各種變更例或者修改例是顯而易見的,這些當(dāng)然也屬于本發(fā)明的技術(shù)范圍。此外,本說明書的表單制作方法中的各工序不一定按照記載為流程圖的順序以時間序列進(jìn)行處理,也可以包括并列或者子程序的處理。產(chǎn)業(yè)上的可利用件能夠?qū)⒈景l(fā)明利用于制作表單的表單制作裝置、表單制作程序以及表單制作方法。
權(quán)利要求
1.一種表單制作裝置,具有保存部,其保存設(shè)定信息的范圍,該設(shè)定信息用于規(guī)定適合于OCR處理的圖像要素;以及圖像生成部,其根據(jù)用戶的輸入以及保存于上述保存部的設(shè)定信息的范圍來生成表單圖像。
2.根據(jù)權(quán)利要求1所述的表單制作裝置,其特征在于,上述圖像生成部根據(jù)上述保存部所保存的設(shè)定信息的范圍來設(shè)定構(gòu)成上述表單圖像的圖像要素的設(shè)定信息的初始值。
3.根據(jù)權(quán)利要求1或者2所述的表單制作裝置,其特征在于,還具有適合判斷部,該適合判斷部判斷構(gòu)成上述表單圖像的各個圖像要素是否適合于 OCR處理。
4.根據(jù)權(quán)利要求3所述的表單制作裝置,其特征在于,上述適合判斷部僅對構(gòu)成上述表單圖像的圖像要素中的由用戶指定的圖像要素判斷是否適合于OCR處理。
5.根據(jù)權(quán)利要求3或者4所述的表單制作裝置,其特征在于,上述適合判斷部根據(jù)上述保存部所保存的設(shè)定信息的范圍來判斷上述圖像要素是否適合于OCR處理。
6.根據(jù)權(quán)利要求1至5中的任一項所述的表單制作裝置,其特征在于,還具有要素替換部,該要素替換部將構(gòu)成上述表單圖像的圖像要素中的不適合于OCR 處理的圖像要素替換為適合于OCR處理的圖像要素。
7.根據(jù)權(quán)利要求6所述的表單制作裝置,其特征在于, 上述保存部保存作為替換候選的圖像要素的圖案,上述要素替換部對構(gòu)成上述表單圖像的圖像要素以及上述保存部所保存的圖案進(jìn)行圖案匹配,將匹配于上述圖案的圖像要素替換為適合于OCR處理的圖像要素。
8.根據(jù)權(quán)利要求1至7中的任一項所述的表單制作裝置,其特征在于,在上述設(shè)定信息中至少包含字符字體、字符尺寸、紙張尺寸、格線長度、格線線寬、格線方向、文本框大小、文本框線寬、復(fù)選框大小、復(fù)選框間隔、條形碼種類、條形碼大小、條形碼單元寬度、條形碼校驗位、顏色、濾色、定位標(biāo)記大小、定位標(biāo)記配置、印刷時的倍率以及印刷后的圖像要素大小中的任一個。
9.根據(jù)權(quán)利要求1至8中的任一項所述的表單制作裝置,其特征在于,還具有輸出控制部,在印刷上述表單圖像的情況下該輸出控制部控制圖像形成裝置以在預(yù)先設(shè)定的印刷條件下進(jìn)行印刷。
10.一種表單制作方法,具有以下步驟 生成步驟,根據(jù)用戶的輸入生成表單圖像;判斷步驟,判斷構(gòu)成表單圖像的各個圖像要素是否適合于OCR處理;以及顯示步驟,顯示上述判斷結(jié)果。
全文摘要
提供一種表單制作裝置以及表單制作方法,以往,利用OCR裝置有時無法對掃描儀所讀取的表單的圖像數(shù)據(jù)適當(dāng)?shù)剡M(jìn)行OCR處理。另外,以O(shè)CR處理的精度為優(yōu)先而僅使表單的布局固定地形成。本發(fā)明確保布局的自由度并提高所生成表單的OCR處理精度。本發(fā)明的表單制作裝置(110)具有保存部(164)和圖像生成部(170),該保存部(164)保存設(shè)定信息的范圍,該設(shè)定信息的范圍規(guī)定適合于OCR處理的圖像要素,該圖像生成部(170)根據(jù)用戶輸入以及保存于保存部的設(shè)定信息的范圍來生成表單圖像。
文檔編號G06F17/21GK102262615SQ20111013619
公開日2011年11月30日 申請日期2011年5月24日 優(yōu)先權(quán)日2010年5月24日
發(fā)明者杉田敏彥, 桑村良則, 萩澤章一, 道場鄉(xiāng) 申請人:株式會社Pfu