專利名稱:文件信息的輸入設(shè)備,輸入方法,輸入程序以及記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及一種可識(shí)別實(shí)際文件中的信息并可把該信息輸入到由計(jì)算機(jī)顯示的另一文件的文件信息輸入設(shè)備、文件信息輸入方法、文件信息輸入程序和記錄介質(zhì)。
背景技術(shù):
常規(guī)上,當(dāng)用戶想要把在實(shí)際文件中寫入的一系列字符粘貼到計(jì)算機(jī)顯示器上的另一文件時(shí),用戶需要使用掃描器等來讀取實(shí)際文件,以生成實(shí)際文件的圖像信息。然后,用戶使計(jì)算機(jī)把圖像信息識(shí)別為文本信息。用戶復(fù)制所識(shí)別的文本信息中的有關(guān)字符序列,然后把該字符序列粘貼到計(jì)算機(jī)屏幕上的文件。
第11-203403號日本專利申請公報(bào)揭示了一種信息處理器。該信息處理器使用CCD(電荷耦合二極管)攝像機(jī)以低分辨率對文件圖像進(jìn)行攝像。然后,當(dāng)把手指或筆與文件一起攝像時(shí),信息處理器獲取原始文件圖像和包括手指或筆在內(nèi)的文件圖像之間的差異,以判定要識(shí)別的指定局部區(qū)域。之后,信息處理器重新以高分辨率對指定局部區(qū)域進(jìn)行攝像,然后把指定局部區(qū)域的圖像信息識(shí)別為文本信息。
然而,上述方法存在一些問題。前者常規(guī)方法存在有關(guān)效率的問題。在前者常規(guī)方法中,要花費(fèi)較長時(shí)間來執(zhí)行所有處理,從用于對實(shí)際文件中要粘貼的部分進(jìn)行指定和識(shí)別的處理,到用于把所識(shí)別的文本信息粘貼到顯示器上的另一文件的處理,并且這些處理很復(fù)雜。
另一方面,后者常規(guī)方法也存在一些問題。在后者常規(guī)方法中,有必要對所攝像的文件圖像進(jìn)行處理,以判定手指或筆是否包括在所攝像的文件圖像內(nèi)。結(jié)果,該處理使工作負(fù)擔(dān)增加。此外,有必要從以低分辨率攝像的文件圖像中檢測手指尖端或筆尖端的位置,以判定要處理的指定局部區(qū)域。結(jié)果,由于以低分辨率攝像的信息量少,因而難以以高精度抽出要識(shí)別的局部區(qū)域。為了解決該問題,有必要按以上所述以高分辨率來對文件圖像進(jìn)行攝像。結(jié)果,所需處理時(shí)間延長。
發(fā)明內(nèi)容
本發(fā)明的一般目的是提供一種能消除上述問題的文件信息輸入設(shè)備、文件信息輸入方法和文件信息輸入程序。
本發(fā)明的一個(gè)更具體目的是提供一種能以高速和高精度把實(shí)際文件中諸如字符序列、表和圖那樣的信息輸入到由計(jì)算機(jī)顯示的另一文件的文件信息輸入設(shè)備、文件信息輸入方法和文件信息輸入程序。
為了達(dá)到上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種文件信息輸入方法,用于識(shí)別實(shí)際文件中的信息,并把所識(shí)別的信息輸入到由計(jì)算機(jī)顯示的文件,該方法包括以下步驟指定實(shí)際文件中要處理的區(qū)域;檢測要處理的指定區(qū)域;讀取要處理的區(qū)域的圖像;把要處理的區(qū)域的圖像識(shí)別為文本信息;以及把用于識(shí)別圖像的步驟的結(jié)果粘貼到由計(jì)算機(jī)顯示的文件中的相關(guān)位置。
在上述文件信息輸入方法中,文件信息輸入方法還可以包括以下步驟,即當(dāng)檢測要處理的區(qū)域時(shí),判定要處理的區(qū)域具有文本屬性、表屬性和圖屬性中的哪種屬性。
在上述文件信息輸入方法中,可以根據(jù)指定區(qū)域,把要處理的區(qū)域判定為具有文本屬性、表屬性和圖屬性中的一種。
在上述文件信息輸入方法中,可以根據(jù)指定要處理的區(qū)域所用的方法,把要處理的區(qū)域判定為具有文本屬性、表屬性和圖屬性中的一種。
在上述文件信息輸入方法中,當(dāng)把要處理的區(qū)域判定為具有文本屬性時(shí),要處理的區(qū)域還可以具有指定的模式,該模式用于把要處理的區(qū)域識(shí)別為具有文本信息。
在上述文件信息輸入方法中,當(dāng)把要處理的區(qū)域判定為具有表屬性并且一個(gè)指定位置在單元格內(nèi)時(shí),可以從包括該單元格在內(nèi)的區(qū)域檢測要處理的區(qū)域,并且其中,當(dāng)把要處理的區(qū)域判定為具有表屬性并且指定位置在任何單元格外時(shí),可以從包括距該位置預(yù)定距離內(nèi)的字符序列在內(nèi)的區(qū)域檢測要處理的區(qū)域。
根據(jù)上述發(fā)明,文件信息輸入方法可以高精度檢測由用戶指定的要輸入的區(qū)域的位置和屬性。根據(jù)所檢測的位置和屬性,文件信息輸入方法通過執(zhí)行諸如字符識(shí)別、表識(shí)別和圖處理那樣的適合于所檢測的屬性的識(shí)別處理,可把區(qū)域的圖像識(shí)別為文本信息。然后,文件信息輸入方法把所生成的信息粘貼到顯示器上的電子文件的相關(guān)位置。結(jié)果,可高速和高精度實(shí)現(xiàn)從實(shí)際文件到電子文件的諸如字符序列、表和圖那樣的信息的輸入。
通過結(jié)合附圖閱讀以下詳細(xì)說明,將更明白本發(fā)明的其他目的、特點(diǎn)和優(yōu)點(diǎn)。
圖1是示出計(jì)算機(jī)的硬件構(gòu)成的方框圖;圖2是示出根據(jù)本發(fā)明第一實(shí)施例的文件信息輸入設(shè)備的系統(tǒng)結(jié)構(gòu)的方框圖;圖3是由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖;圖4是用于對由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程進(jìn)行說明的圖;圖5是由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的坐標(biāo)獲得處理和圖像獲得處理的流程圖;圖6是當(dāng)要識(shí)別的指定區(qū)域是表區(qū)域時(shí)的識(shí)別處理和粘貼處理的流程圖;圖7是用于對由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的屬性判定處理進(jìn)行說明的圖;圖8是用于對屬性和模式進(jìn)行詳細(xì)說明的圖;圖9是由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的屬性指定處理的流程圖;
圖10是由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的詳細(xì)流程圖;圖11是由根據(jù)第二實(shí)施例的文件信息輸入設(shè)備執(zhí)行的坐標(biāo)獲得處理、圖像獲得處理和屬性判定處理的流程圖;圖12是由根據(jù)第二實(shí)施例的變化例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖;以及圖13是由根據(jù)第三實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖。
具體實(shí)施例方式
以下將參照附圖,對本發(fā)明的實(shí)施例進(jìn)行說明。
圖1示出了計(jì)算機(jī)1的硬件構(gòu)成的方框圖。如圖1所示,計(jì)算機(jī)1包括CPU(中央處理器)2,用于處理信息;一級存儲(chǔ)設(shè)備3,例如RAM(隨機(jī)存取存儲(chǔ)器),用于在CPU2執(zhí)行過程中臨時(shí)存儲(chǔ)信息;二級存儲(chǔ)設(shè)備4,例如HDD(硬盤驅(qū)動(dòng)器),用于存儲(chǔ)諸如執(zhí)行結(jié)果那樣的某些數(shù)據(jù);可換式介質(zhì)6(例如CD-ROM)的驅(qū)動(dòng)設(shè)備5,用于把信息存儲(chǔ)/分配到計(jì)算機(jī)1的外部,并從計(jì)算機(jī)1的外部獲得信息;顯示設(shè)備7,用于把執(zhí)行過程和結(jié)果顯示給用戶;以及輸入設(shè)備,例如鍵盤8和鼠標(biāo)9,通過該輸入設(shè)備,用戶可輸入指令和信息。這些部件通過總線相互連接。
圖2示出了根據(jù)本發(fā)明第一實(shí)施例的文件信息輸入設(shè)備的系統(tǒng)結(jié)構(gòu)。
文件信息輸入設(shè)備包含處理部10,攝像部15,指定部16,以及輸出部17。
文件信息輸入設(shè)備讀取實(shí)際文件的指定部分,把指定部分的圖像識(shí)別為文本信息,以及把所識(shí)別的文本信息粘貼到在顯示設(shè)備7上顯示的電子文件的指定位置。此處,這種實(shí)際文件形成為紙文件、汽車牌照、廣告標(biāo)志等。而且,假定實(shí)際文件包含字符、表、圖、公式等。另一方面,這種電子文件形成為文件信息、圖像信息、電子表格等。
如圖2所示,處理部10包括屬性判定部11,檢測部12,識(shí)別部13以及粘貼部14。
屬性判定部11判定從實(shí)際文件讀取的區(qū)域的屬性。通常有文本屬性、表屬性和圖屬性。
檢測部12對識(shí)別出文本信息的實(shí)際文件中的區(qū)域進(jìn)行檢測。
識(shí)別部13根據(jù)所判定的屬性,從所檢測區(qū)域的圖像中識(shí)別文本信息。
粘貼部14把所識(shí)別的文本信息粘貼到在計(jì)算機(jī)1的顯示設(shè)備7上的電子文件中的指定位置。
此處,文件信息輸入設(shè)備可根據(jù)程序來執(zhí)行上述過程。該程序可以存儲(chǔ)在二級存儲(chǔ)設(shè)備4內(nèi)。當(dāng)CPU執(zhí)行該程序時(shí),根據(jù)需要把該程序從二級存儲(chǔ)設(shè)備4讀取到一級存儲(chǔ)設(shè)備3。而且,該程序可以存儲(chǔ)在記錄介質(zhì)6內(nèi),并可以通過驅(qū)動(dòng)設(shè)備5讀取到一級存儲(chǔ)設(shè)備3或二級存儲(chǔ)設(shè)備4。
攝像部15讀取實(shí)際文件的圖像。例如,攝像部15可以是數(shù)字?jǐn)z像機(jī)或掃描器。
指定部16指定要輸入到顯示設(shè)備7上的電子文件的實(shí)際文件的一部分。例如,指定部16可以是電子筆等。
輸出部17由顯示設(shè)備、打印機(jī)等形成。
圖3示出了由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖。
用戶使用指定部16來指定用于定義由用戶想要粘貼到顯示設(shè)備7上的電子文件的實(shí)際文件的一部分的坐標(biāo)。
在步驟S1,文件信息輸入設(shè)備獲得坐標(biāo)信息。例如,如圖4所示,如果用戶通過拖動(dòng)電子筆來指定該部分,也就是說,如果用戶通過在起點(diǎn)接通電子筆、拖動(dòng)電子筆并然后在終點(diǎn)斷開電子筆來指定該部分,則坐標(biāo)信息可以由起點(diǎn)和終點(diǎn)的坐標(biāo)形成。在該例中,起點(diǎn)和終點(diǎn)由圖4中的實(shí)際文件的左上區(qū)域所示的接收設(shè)備來檢測。
包括上述指定部分在內(nèi)的區(qū)域由攝像部15來攝像。在步驟S2,文件信息輸入設(shè)備獲得所攝像區(qū)域的圖像。
在步驟S3,文件信息輸入設(shè)備判定指定部分的屬性。如下詳述,根據(jù)第一實(shí)施例的文件信息輸入設(shè)備根據(jù)由指定部16指定的區(qū)域來判定屬性。文件信息輸入設(shè)備把與指定區(qū)域?qū)?yīng)的屬性判定為要識(shí)別的區(qū)域的屬性。
在步驟S4,文件信息輸入設(shè)備檢測實(shí)際文件的指定區(qū)域。如上所述,根據(jù)電子筆的起點(diǎn)和終點(diǎn)來檢測指定區(qū)域。以下將對此進(jìn)行詳細(xì)說明。
在步驟S5,文件信息輸入設(shè)備根據(jù)在步驟S3判定的屬性,把所檢測區(qū)域的圖像識(shí)別為文本信息等。
在步驟S6,文件信息輸入設(shè)備把諸如文本信息那樣的識(shí)別信息粘貼在顯示設(shè)備7上的電子文件的指定區(qū)域內(nèi)。
首先,文件信息輸入設(shè)備對紙文件的一部分及其屬性進(jìn)行檢測。然后,文件信息輸入設(shè)備根據(jù)所判定的屬性,把所檢測部分的圖像識(shí)別為文本信息。最后,把所識(shí)別的部分粘貼在顯示設(shè)備7上的電子文件的指定區(qū)域內(nèi)。結(jié)果,可容易和快速地把紙文件中的字符序列、表、圖等輸入到電子文件的指定區(qū)域。以下將對由文件信息輸入設(shè)備執(zhí)行的過程進(jìn)行詳細(xì)說明。
圖4是用于對由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程進(jìn)行說明的圖。
如圖4所示,紙文件具有文本區(qū)域,其內(nèi)打印某些字符;表區(qū)域,其內(nèi)打印表;以及圖區(qū)域,其內(nèi)打印圖。
以下將對圖3概述的坐標(biāo)獲得處理和圖像獲得處理進(jìn)行詳細(xì)說明。
當(dāng)用戶把電子筆放置在紙文件的某一位置并然后接通電子筆時(shí),接收機(jī)把接通電子筆所在的坐標(biāo)檢測為起點(diǎn)。然后,當(dāng)用戶拖動(dòng)電子筆時(shí),接收機(jī)跟蹤電子筆。當(dāng)斷開電子筆時(shí),接收機(jī)把斷開電子筆所在的坐標(biāo)檢測為終點(diǎn)。文件信息輸入設(shè)備使用常規(guī)接收機(jī)來執(zhí)行該處理。
這樣,文件信息輸入設(shè)備可檢測起點(diǎn)和終點(diǎn)的坐標(biāo)。根據(jù)所檢測的坐標(biāo),文件信息輸入設(shè)備使用數(shù)字?jǐn)z像機(jī)、掃描器等來讀取紙文件的指定部分,以獲得該部分的圖像。
圖5示出了坐標(biāo)獲得處理和圖像獲得處理的流程圖。在步驟S11,文件信息輸入設(shè)備判定是否接通電子筆。在圖4所示的例子中,文件信息輸入設(shè)備判定用戶是否在紙文件上的某一位置放置和接通電子筆。如果判定為電子筆接通,則文件信息輸入設(shè)備進(jìn)到步驟S12。如果判定為未接通電子筆,則文件信息輸入設(shè)備重復(fù)步驟S11,直到接通電子筆。
在步驟S12,文件信息輸入設(shè)備獲得接通電子筆所在的位置作為起點(diǎn)。
在步驟S13,文件信息輸入設(shè)備判定是否拖動(dòng)并然后斷開電子筆。如果判定為拖動(dòng)并然后斷開電子筆,則文件信息輸入設(shè)備進(jìn)到步驟S14。如果判定為未拖動(dòng)并然后斷開電子筆,則文件信息輸入設(shè)備重復(fù)步驟S13,直到斷開電子筆。
在步驟S14,文件信息輸入設(shè)備獲得斷開電子筆所在的位置作為終點(diǎn)。
在步驟S15,文件信息輸入設(shè)備使用攝像部15來獲得根據(jù)所獲得的起點(diǎn)和所獲得的終點(diǎn)判定的區(qū)域的圖像。
結(jié)果,當(dāng)文件信息輸入設(shè)備對圖4所示的紙文件中的起點(diǎn)和終點(diǎn)進(jìn)行檢測時(shí),文件信息輸入設(shè)備可使用攝像部15來獲得由圖4中的虛線圍繞并由起點(diǎn)和終點(diǎn)定義的矩形區(qū)域的圖像信息。然后,文件信息輸入設(shè)備進(jìn)到識(shí)別處理。
以下將對圖3概述的識(shí)別處理進(jìn)行詳細(xì)說明。文件信息輸入設(shè)備識(shí)別所獲得的文件圖像。在圖4所示的該例中,所獲得的文件圖像包含三種信息形式,即文本形式,表形式和圖形式。關(guān)于紙文件的文本區(qū)域,文件信息輸入設(shè)備把文本區(qū)域的圖像識(shí)別為文本信息。關(guān)于表區(qū)域,文件信息輸入設(shè)備把表區(qū)域中的表內(nèi)的各單元格識(shí)別為文本信息。關(guān)于圖區(qū)域,文件信息輸入設(shè)備針對圖區(qū)域中的圖不進(jìn)行識(shí)別處理。
這樣,紙文件中的文本區(qū)域和表區(qū)域被識(shí)別為文本信息。此處,文件信息輸入設(shè)備可通過使用以下詳述的所獲得的屬性信息,以較高精度執(zhí)行識(shí)別處理。
最后,將對圖3所述的粘貼處理進(jìn)行詳細(xì)說明。文件信息輸入設(shè)備把所處理的信息粘貼到顯示設(shè)備7上的電子文件。如圖4所示,關(guān)于紙文件的文本區(qū)域,文件信息輸入設(shè)備把所識(shí)別的文本信息粘貼在由光標(biāo)指向的電子文件中的某一位置。關(guān)于紙文件的表區(qū)域,文件信息輸入設(shè)備同樣把所識(shí)別的文本信息粘貼在由光標(biāo)指向的電子文件的某一位置。關(guān)于紙文件的圖區(qū)域,文件信息輸入設(shè)備直接把圖區(qū)域粘貼在電子文件的指定區(qū)域中的所獲得的圖像內(nèi)。注意,根據(jù)需要來指定圖區(qū)域大小和粘貼位置。
這樣,可以高精度、容易和快速地把紙文件的文本區(qū)域中的某些字符、表區(qū)域中的字符序列以及圖區(qū)域中的圖輸入到顯示設(shè)備7上的電子文件中的指定位置。
圖6示出了當(dāng)要識(shí)別的指定區(qū)域是表區(qū)域時(shí)的識(shí)別處理和粘貼處理的流程圖。由于字符序列是通過使用下述屬性信息來識(shí)別的,因而以下將對字符序列進(jìn)行詳細(xì)說明。
在步驟S21,文件信息輸入設(shè)備抽出根據(jù)起點(diǎn)和終點(diǎn)判定的表區(qū)域的圖像。
在步驟S22,對于所抽出的表區(qū)域中的表的各單元格,文件信息輸入設(shè)備從單元格內(nèi)的字符序列的圖像中識(shí)別文本信息。
在步驟S23,文件信息輸入設(shè)備根據(jù)表中的劃線來識(shí)別表的邏輯結(jié)構(gòu)。例如,邏輯結(jié)構(gòu)包含與表的矩陣大小有關(guān)的信息。
在步驟S24,如圖4所示,文件信息輸入設(shè)備把為各單元格識(shí)別的文本信息粘貼在顯示設(shè)備7上的電子文件中的對應(yīng)單元格內(nèi)。
這樣,關(guān)于紙文件中的表區(qū)域,文件信息輸入設(shè)備可快速識(shí)別表的字符序列和邏輯結(jié)構(gòu),然后可以高精度把所識(shí)別的字符信息輸入到電子文件中的對應(yīng)單元格。
圖7是用于對由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的屬性判定處理進(jìn)行說明的圖。
在圖7的屬性指定區(qū)域中,為圖7的上部區(qū)域中的紙文件內(nèi)的各信息區(qū)域指定屬性。用戶通過在屬性指定區(qū)域中的對應(yīng)屬性區(qū)域上點(diǎn)擊電子筆,為紙文件中的信息區(qū)域指定屬性。此處,如果用戶在某一位置接通并然后斷開電子筆,則電子筆被認(rèn)為是在該位置進(jìn)行點(diǎn)擊。在用戶指定屬性之后,用戶拖動(dòng)電子筆,以便指定要識(shí)別的矩形區(qū)域。文件信息輸入設(shè)備根據(jù)所指定的屬性來識(shí)別指定區(qū)域,然后把所識(shí)別的文本信息粘貼在電子文件的對應(yīng)位置。
如圖7所示,屬性指定區(qū)域包含以下屬性·文本·姓名字符序列·地址字符序列·電話號碼字符序列·表·圖當(dāng)用戶通過在其上點(diǎn)擊電子筆來指定姓名字符序列、地址字符序列和電話號碼字符序列中的一項(xiàng)時(shí),如參照圖4和圖5所述,文件信息輸入設(shè)備獲得由起點(diǎn)和終點(diǎn)判定的矩形區(qū)域的圖像。根據(jù)指定屬性,文件信息輸入設(shè)備分別根據(jù)姓名字符序列、地址字符序列和電話號碼字符序列來編制姓名字典、地址字典和電話號碼字典。并且,文件信息輸入設(shè)備遵循一種最適合于指定屬性的抽出方法。結(jié)果,文件信息輸入設(shè)備可通過使用最合適的字典和抽出方法,以較高精度把指定字符序列的圖像識(shí)別為文本信息。
而且,如果用戶為指定的表信息選擇表屬性,則文件信息輸入設(shè)備啟動(dòng)識(shí)別引擎,用于通過對表中的垂直和水平劃線進(jìn)行檢測來正確識(shí)別表的各單元格的位置和大小。并且,文件信息輸入設(shè)備遵循一種最適合于識(shí)別表中的字符序列的識(shí)別方法。結(jié)果,文件信息輸入設(shè)備可以較高精度把表中的各單元格內(nèi)的字符序列的圖像識(shí)別為文本信息。
而且,如果用戶為指定的圖信息選擇圖屬性,則文件信息輸入設(shè)備根據(jù)需要,針對指定圖進(jìn)行比例配置和旋轉(zhuǎn)操作。然后,文件信息輸入設(shè)備把所生成的圖粘貼到電子文件的對應(yīng)位置。
如上所述,當(dāng)用戶通過點(diǎn)擊電子筆來指定屬性時(shí),文件信息輸入設(shè)備根據(jù)指定屬性來識(shí)別所獲得的圖像,然后把所識(shí)別的信息粘貼到電子文件的對應(yīng)位置。由于文件信息輸入設(shè)備根據(jù)最適合于指定屬性的識(shí)別方法來識(shí)別圖像,因而文件信息輸入設(shè)備可以較高精度識(shí)別圖像,并可把所識(shí)別的信息輸入到電子文件的對應(yīng)位置。
圖8是用于對屬性和模式進(jìn)行詳細(xì)說明的圖。
如圖8所示,屬性“文本”還包含模式“姓名”、“地址”、“電話號碼”等。當(dāng)用戶想要把紙文件中的字符序列輸入到電子文件時(shí),用戶還可指定這種模式。文件信息輸入設(shè)備可通過使用最適合指定模式的字典和抽出方法,以高精度快速地把指定的字符序列的圖像識(shí)別為文本信息。
與屬性“文本”不同,屬性“表”不包含任何模式。在表識(shí)別中,文件信息輸入設(shè)備啟動(dòng)用于識(shí)別表的識(shí)別引擎,這是因?yàn)槲募畔⑤斎朐O(shè)備需要檢測垂直和水平劃線,以判定諸如表大小及其矩陣信息那樣的表的邏輯結(jié)構(gòu)。
與屬性“文本”不同,屬性“圖”不包含任何模式。在圖輸入中,文件信息輸入設(shè)備獲得紙文件中的指定圖區(qū)域的圖像。文件信息輸入設(shè)備啟動(dòng)用于更改圖的比例并旋轉(zhuǎn)該圖的引擎。結(jié)果,文件信息輸入設(shè)備可根據(jù)需要更改圖的比例或旋轉(zhuǎn)該圖,然后可把所生成的圖粘貼在電子文件的對應(yīng)位置。
圖9示出了屬性指定處理的流程圖。
在步驟S31,文件信息輸入設(shè)備判定用戶指定哪種屬性。如上所述,例如,用戶通過在圖7所示的屬性指定區(qū)域中的一個(gè)區(qū)域上點(diǎn)擊電子筆來指定屬性。
當(dāng)用戶在步驟S31指定文本屬性中的姓名模式、地址模式和電話號碼模式中的一項(xiàng)時(shí),文件信息輸入設(shè)備使用最適合于指定屬性的字典和抽出方法,以便以高精度快速地把所獲得的圖像識(shí)別為文本信息。然后,文件信息輸入設(shè)備把所識(shí)別的文本信息粘貼到由光標(biāo)指向的電子文件的位置。
在步驟S33,當(dāng)用戶在步驟S31選擇表屬性時(shí),文件信息輸入設(shè)備啟動(dòng)被設(shè)計(jì)成最適合于識(shí)別表的表識(shí)別處理。然后,文件信息輸入設(shè)備檢測表的邏輯結(jié)構(gòu),并以高精度快速地把表中的各單元格內(nèi)的字符序列識(shí)別為文本信息。文件信息輸入設(shè)備在電子文件的對應(yīng)位置復(fù)制邏輯結(jié)構(gòu),然后把所識(shí)別的文本信息粘貼在電子文件中的所復(fù)制表內(nèi)的對應(yīng)單元格中。
在步驟S34,當(dāng)用戶在步驟S31選擇圖屬性時(shí),文件信息輸入設(shè)備啟動(dòng)被設(shè)計(jì)成最適合于圖的引擎。然后,文件信息輸入設(shè)備根據(jù)需要按比例放大或縮小該圖,并把所縮放的圖粘貼到電子文件中的對應(yīng)位置。
如上所述,當(dāng)用戶使用電子筆為要識(shí)別的區(qū)域指定屬性時(shí),文件信息輸入設(shè)備可使用最適合于指定屬性的方法,以便以高精度快速地識(shí)別圖像信息,并把所識(shí)別的信息輸入到電子文件的對應(yīng)位置。
在上述說明中,屬性被劃分為文本屬性、表屬性和圖屬性。然而,文件信息輸入設(shè)備可以為其他類型的文件編制其他屬性。如果紙文件包含諸如數(shù)學(xué)公式那樣的特種字符和符號,則該屬性被提供給文件信息輸入設(shè)備。并且,為文件信息輸入設(shè)備編制最適合于該屬性的字典和抽出方法。結(jié)果,文件信息輸入設(shè)備可通過以高速和高精度抽出和識(shí)別信息來輸入電子文件中的指定信息。
圖10示出了由根據(jù)第一實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的詳細(xì)流程圖。
在步驟S41,文件信息輸入設(shè)備獲得用戶在紙文件上操作的電子筆的坐標(biāo)信息,以判定用戶在上述屬性指定區(qū)域中指定哪種屬性。此處,假定用戶指定包括姓名字符序列在內(nèi)的區(qū)域。
在步驟S42,文件信息輸入設(shè)備根據(jù)所獲得的坐標(biāo)信息來判定指定屬性。
在步驟S43,文件信息輸入設(shè)備編制最適合于指定屬性模式的字典和抽出方法。
在步驟S44,文件信息輸入設(shè)備獲得用戶在紙文件上操作的電子筆的坐標(biāo)信息,以判定要粘貼到顯示設(shè)備7上的電子文件的區(qū)域。
在步驟S45,文件信息輸入設(shè)備根據(jù)在步驟S44獲得的坐標(biāo)信息來抽出要粘貼的區(qū)域的圖像。
在步驟S46,文件信息輸入設(shè)備通過使用所選字典,把所抽出的圖像識(shí)別為文本信息。文件信息輸入設(shè)備使用最合適的姓名字典和字符抽出方法,以便從所抽出的圖像中識(shí)別文本信息。結(jié)果,可以高精度識(shí)別文本信息。
在步驟S47,文件信息輸入設(shè)備把所識(shí)別的文本信息粘貼到電子文件中的某一位置,例如,放置光標(biāo)的位置。
這樣,當(dāng)用戶把字符序列輸入到電子文件時(shí),文件信息輸入設(shè)備對諸如姓名模式、地址模式和電話號碼模式那樣的指定字符模式進(jìn)行檢測,然后編制最適合于指定字符模式的字典和字符抽出方法。然后,文件信息輸入設(shè)備使用該字典和字符抽出方法,以便從指定區(qū)域的所抽出圖像中識(shí)別文本信息。文件信息輸入設(shè)備把所識(shí)別的文本信息粘貼到電子文件的對應(yīng)位置。由于字符識(shí)別是通過使用合適的字典和抽出方法來進(jìn)行的,因而可以高精度識(shí)別紙文件中的字符序列。
以下將參照圖11中的流程圖,對本發(fā)明的第二實(shí)施例進(jìn)行說明,其中,根據(jù)第二實(shí)施例的文件信息輸入設(shè)備與根據(jù)第一實(shí)施例的文件信息輸入設(shè)備的不同在于坐標(biāo)獲得處理、圖像獲得處理和屬性判定處理,以下將對此進(jìn)行說明。
圖11示出了由根據(jù)第二實(shí)施例的文件信息輸入設(shè)備執(zhí)行的坐標(biāo)獲得處理、圖像獲得處理和屬性判定處理的流程圖。
在步驟S51,文件信息輸入設(shè)備獲得用戶在紙文件上操作的電子筆的坐標(biāo)信息。
根據(jù)坐標(biāo)信息,如圖11所示,如果電子筆的軌跡是近似右方向水平線,則文件信息輸入設(shè)備在步驟S52判定為用戶指定在起點(diǎn)和終點(diǎn)之間包括的一行字符。因此,如上所述,文件信息輸入設(shè)備獲得包括該行字符在內(nèi)的矩形區(qū)域的圖像,然后把該圖像識(shí)別為文本信息。
在步驟S53,如圖11所示,如果電子筆在右上方向移動(dòng),則文件信息輸入設(shè)備判定為用戶指定在起點(diǎn)和終點(diǎn)之間包括的多行字符。因此,如上所述,文件信息輸入設(shè)備獲得包括這些行字符在內(nèi)的矩形區(qū)域的圖像,然后把該圖像識(shí)別為文本信息。
在步驟S54,如圖11所示,如果電子筆在右下方向移動(dòng),則文件信息輸入設(shè)備判定為用戶指定位于起點(diǎn)和終點(diǎn)之間的表。因此,文件信息輸入設(shè)備獲得包括該表在內(nèi)的矩形區(qū)域的圖像,然后根據(jù)上述表識(shí)別方法把該圖像識(shí)別為文本信息。
在步驟S55,如圖11所示,如果電子筆在左下方向移動(dòng),則文件信息輸入設(shè)備判定為用戶指定位于起點(diǎn)和終點(diǎn)之間的圖。因此,文件信息輸入設(shè)備獲得包括該圖在內(nèi)的矩形區(qū)域的圖像。
這樣,根據(jù)用戶在紙文件上操作的電子筆的預(yù)定移動(dòng),文件信息輸入設(shè)備可判定要在紙文件中識(shí)別的信息及其屬性。然后,文件信息輸入設(shè)備可根據(jù)其屬性模式,以高精度把要識(shí)別的信息的圖像識(shí)別為文本信息。結(jié)果,可更快速和更方便地把紙文件的信息輸入到電子文件中的指定位置。
以下將參照圖12中的流程圖,對本發(fā)明的第二實(shí)施例的變化例進(jìn)行說明,其中,該文件信息輸入設(shè)備與根據(jù)第二實(shí)施例的文件信息輸入設(shè)備的不同在于表識(shí)別。
圖12示出了由根據(jù)第二實(shí)施例的變化例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖。
在步驟S61,與根據(jù)第二實(shí)施例的文件信息輸入設(shè)備一樣,文件信息輸入設(shè)備獲得電子筆的坐標(biāo)信息。在本說明中,假定文件信息輸入設(shè)備檢測出用戶指定了紙文件中的表。
在步驟S62,文件信息輸入設(shè)備根據(jù)電子筆的坐標(biāo)信息來獲得包括表在內(nèi)的矩形區(qū)域的圖像。
在步驟S63,文件信息輸入設(shè)備從所獲得的圖像中抽出諸如表的劃線和單元格那樣的表的邏輯結(jié)構(gòu)。
在步驟S64,文件信息輸入設(shè)備判定電子筆尖端是否在表的單元格內(nèi)。如果尖端在單元格內(nèi),則文件信息輸入設(shè)備在步驟S65抽出包括由電子筆指向的單元格在內(nèi)的內(nèi)部矩形區(qū)域,然后對該內(nèi)部矩形區(qū)域中的各單元格的文本信息進(jìn)行識(shí)別。相比之下,如果尖端在表外,則文件信息輸入設(shè)備抽出包括距電子筆尖端的預(yù)定距離內(nèi)的字符序列在內(nèi)的區(qū)域的圖像。然后,文件信息輸入設(shè)備把所抽出的圖像識(shí)別為文本信息。
這樣,文件信息輸入設(shè)備不僅能識(shí)別指定矩形區(qū)域中的表內(nèi)的字符,而且還能識(shí)別表外的字符,然后可快速地把所識(shí)別的文本信息輸入到電子文件的指定位置。
以下將參照圖13中的流程圖,對根據(jù)本發(fā)明的第三實(shí)施例的文件信息輸入設(shè)備進(jìn)行說明,其中,該文件信息輸入設(shè)備與根據(jù)第一實(shí)施例的文件信息輸入設(shè)備的不同在于屬性判定處理。
根據(jù)第一實(shí)施例的文件信息輸入設(shè)備根據(jù)事先為各屬性分配的預(yù)定位置上發(fā)生的電子筆點(diǎn)擊來判定指定屬性。另一方面,根據(jù)第三實(shí)施例的文件信息輸入設(shè)備根據(jù)表示屬性/模式類型的各字符序列的字符識(shí)別來判定指定屬性。
圖13示出了由根據(jù)第三實(shí)施例的文件信息輸入設(shè)備執(zhí)行的過程的流程圖。
在步驟S71,文件信息輸入設(shè)備獲得用戶在紙文件上操作的電子筆的坐標(biāo)信息,以判定用戶在上述屬性指定區(qū)域中指定哪種屬性。
在步驟S72,文件信息輸入設(shè)備根據(jù)所獲得的坐標(biāo)信息來抽出屬性指定區(qū)域中的區(qū)域的圖像。此處,假定用戶指定了包括表示姓名模式的字符序列“姓名”在內(nèi)的區(qū)域。
在步驟S73,文件信息輸入設(shè)備把所抽出的圖像識(shí)別為文本信息。在此情況下,從所抽出的圖像來檢測字符序列“姓名”。根據(jù)識(shí)別結(jié)果,文件信息輸入設(shè)備根據(jù)所識(shí)別的字符序列“姓名”判定出用戶指定了姓名屬性。
在步驟S74,文件信息輸入設(shè)備編制最適合于指定的屬性模式的字典和抽出方法。
在步驟S75,文件信息輸入設(shè)備獲得用戶在紙文件上操作的電子筆的坐標(biāo)信息,以判定要粘貼到顯示設(shè)備7上的電子文件的區(qū)域。
在步驟S76,文件信息輸入設(shè)備根據(jù)在步驟S75獲得的坐標(biāo)信息來抽出要粘貼的區(qū)域。
在步驟S77,文件信息輸入設(shè)備通過使用所選字典,把所抽出的圖像識(shí)別為文本信息。文件信息輸入設(shè)備使用最合適的姓名字典和字符抽出方法,以便從所抽出的圖像中識(shí)別文本信息。結(jié)果,可以高精度識(shí)別文本信息。
在步驟S78,文件信息輸入設(shè)備10把所識(shí)別的文本信息粘貼到電子文件中的某一位置,例如,放置光標(biāo)的位置。
這樣,即使事先未針對各屬性分配區(qū)域,文件信息輸入設(shè)備也能通過識(shí)別與屬性對應(yīng)的字符序列來判定指定屬性。由于字符識(shí)別是根據(jù)所判定的屬性,使用字典和字符抽出方法來進(jìn)行的,因而可以高精度識(shí)別紙文件中的字符序列。
本發(fā)明不限于具體揭示的實(shí)施例,而是可以在不背離本發(fā)明范圍的情況下進(jìn)行變動(dòng)和修改。
權(quán)利要求
1.一種文件信息輸入設(shè)備,用于識(shí)別實(shí)際文件中的信息,并把所述識(shí)別信息輸入到由計(jì)算機(jī)顯示的文件,該設(shè)備包括指定部,用于指定所述實(shí)際文件中要處理的區(qū)域;檢測部,用于對由所述指定部指定的所述要處理的區(qū)域進(jìn)行檢測;讀取部,用于讀取所述要處理的區(qū)域的圖像;字符識(shí)別部,用于把所述要處理的區(qū)域的圖像識(shí)別為文本信息;以及粘貼部,用于把所述字符識(shí)別部的結(jié)果粘貼到由計(jì)算機(jī)顯示的所述文件的相關(guān)位置。
2.根據(jù)權(quán)利要求1所述的文件信息輸入設(shè)備,該設(shè)備還包括屬性判定部,用于當(dāng)所述檢測部對所述要處理的區(qū)域進(jìn)行檢測時(shí),判定所述要處理的區(qū)域具有文本屬性、表屬性和圖屬性中的哪種屬性3.根據(jù)權(quán)利要求2所述的文件信息輸入設(shè)備,其中,所述屬性判定部根據(jù)由所述指定部指定的區(qū)域,把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
4.根據(jù)權(quán)利要求2所述的文件信息輸入設(shè)備,其中,所述屬性判定部根據(jù)所述指定部的移動(dòng),把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
5.根據(jù)權(quán)利要求2所述的文件信息輸入設(shè)備,其中,當(dāng)所述屬性判定部把所述要處理的區(qū)域判定為具有文本屬性時(shí),所述屬性判定部還判定由所述指定部指定的模式,所述模式用于把所述要處理的區(qū)域識(shí)別為具有文本信息。
6.根據(jù)權(quán)利要求2所述的文件信息輸入設(shè)備,其中,當(dāng)所述屬性判定部判定出所述要處理的區(qū)域具有表屬性并且由所述指定部指定的位置在單元格內(nèi)時(shí),所述檢測部把包括所述單元格在內(nèi)的區(qū)域檢測為所述要處理的區(qū)域,并且其中,當(dāng)所述屬性判定部判定出所述要處理的區(qū)域具有表屬性并且由所述指定部指定的位置在任何單元格外時(shí),所述檢測部把包括距所述位置預(yù)定距離內(nèi)的字符序列在內(nèi)的區(qū)域檢測為所述要處理的區(qū)域。
7.一種文件信息輸入方法,用于識(shí)別實(shí)際文件中的信息,并把所述識(shí)別信息輸入到由計(jì)算機(jī)顯示的文件;該方法包括以下步驟指定所述實(shí)際文件中要處理的區(qū)域;檢測所述要處理的區(qū)域;讀取所述要處理的區(qū)域的圖像;把所述要處理的區(qū)域的圖像識(shí)別為文本信息;以及把所述用于識(shí)別所述圖像的步驟的結(jié)果粘貼到由計(jì)算機(jī)顯示的所述文件的相關(guān)位置。
8.根據(jù)權(quán)利要求7所述的文件信息輸入方法,該方法還包括以下步驟,即當(dāng)檢測所述要處理的區(qū)域時(shí),判定所述要處理的區(qū)域具有文本屬性、表屬性和圖屬性中的哪種屬性。
9.根據(jù)權(quán)利要求8所述的文件信息輸入方法,其中,根據(jù)指定區(qū)域,把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
10.根據(jù)權(quán)利要求8所述的文件信息輸入方法,其中,根據(jù)指定所述要處理的區(qū)域所用的方法,把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
11.根據(jù)權(quán)利要求8所述的文件信息輸入方法,其中,當(dāng)把所述要處理的區(qū)域判定為具有文本屬性時(shí),還把所述要處理的區(qū)域判定為具有指定模式,所述模式用于把所述要處理的區(qū)域識(shí)別為具有文本信息。
12.根據(jù)權(quán)利要求8所述的文件信息輸入方法,其中,當(dāng)把所述要處理的區(qū)域判定為具有表屬性并且一個(gè)指定位置在單元格內(nèi)時(shí),從包括所述單元格在內(nèi)的區(qū)域檢測所述要處理的區(qū)域,并且其中,當(dāng)把所述要處理的區(qū)域判定為具有表屬性并且該指定位置在任何單元格外時(shí),從包括距所述位置預(yù)定距離內(nèi)的字符序列在內(nèi)的區(qū)域檢測所述要處理的區(qū)域。
13.一種文件信息輸入程序,用于識(shí)別實(shí)際文件中的信息,并把所述識(shí)別信息輸入到由計(jì)算機(jī)顯示的文件,該程序使計(jì)算機(jī)執(zhí)行以下步驟指定所述實(shí)際文件中要處理的區(qū)域;檢測所述要處理的區(qū)域;讀取所述要處理的區(qū)域的圖像;把所述要處理的區(qū)域的圖像識(shí)別為文本信息;以及把所述用于識(shí)別所述圖像的步驟的結(jié)果粘貼到由計(jì)算機(jī)顯示的所述文件的相關(guān)位置。
14.根據(jù)權(quán)利要求13所述的文件信息輸入程序,該程序還使計(jì)算機(jī)執(zhí)行以下步驟,即當(dāng)檢測所述要處理的區(qū)域時(shí),判定所述要處理的區(qū)域具有文本屬性、表屬性和圖屬性中的哪種屬性。
15.根據(jù)權(quán)利要求14所述的文件信息輸入程序,其中,根據(jù)指定區(qū)域,把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
16.根據(jù)權(quán)利要求14所述的文件信息輸入程序,其中,根據(jù)指定所述要處理的區(qū)域所用的方法,把所述要處理的區(qū)域判定為具有所述文本屬性、所述表屬性和所述圖屬性中的一種。
17.根據(jù)權(quán)利要求14所述的文件信息輸入程序,其中,當(dāng)把所述要處理的區(qū)域判定為具有文本屬性時(shí),還把所述要處理的區(qū)域判定為具有指定模式,所述模式用于把所述要處理的區(qū)域識(shí)別為具有文本信息。
18.根據(jù)權(quán)利要求14所述的文件信息輸入程序,其中,當(dāng)把所述要處理的區(qū)域判定為具有表屬性并且一個(gè)指定位置在單元格內(nèi)時(shí),從包括所述單元格在內(nèi)的區(qū)域檢測所述要處理的區(qū)域,并且其中,當(dāng)把所述要處理的區(qū)域判定為具有表屬性并且該指定位置在任何單元格外時(shí),從包括距所述位置預(yù)定距離內(nèi)的字符序列在內(nèi)的區(qū)域檢測所述要處理的區(qū)域。
19.一種計(jì)算機(jī)可讀取記錄介質(zhì),用于記錄文件信息輸入程序,該文件信息輸入程序用于識(shí)別實(shí)際文件中的信息,并把所述識(shí)別信息輸入到由計(jì)算機(jī)顯示的文件,該程序使計(jì)算機(jī)執(zhí)行以下步驟指定所述實(shí)際文件中要處理的區(qū)域;檢測所述要處理的區(qū)域;讀取所述要處理的區(qū)域的圖像;把所述要處理的區(qū)域的圖像識(shí)別為文本信息;以及把所述用于識(shí)別所述圖像的步驟的結(jié)果粘貼到由計(jì)算機(jī)顯示的所述文件的相關(guān)位置。
20.一種計(jì)算機(jī)可讀取記錄介質(zhì),用于記錄文件信息輸入程序,該文件信息輸入程序用于識(shí)別實(shí)際文件中的信息,并把所述識(shí)別信息輸入到由計(jì)算機(jī)顯示的文件,該程序使計(jì)算機(jī)執(zhí)行以下步驟指定所述實(shí)際文件中要處理的區(qū)域;判定所述要處理的區(qū)域具有文本屬性、表屬性和圖屬性中的哪種屬性;檢測所述要處理的區(qū)域;讀取所述要處理的區(qū)域的圖像;把所述要處理的區(qū)域的圖像識(shí)別為文本信息;以及把所述用于識(shí)別所述圖像的步驟的結(jié)果粘貼到由計(jì)算機(jī)顯示的所述文件的相關(guān)位置。
全文摘要
文件信息的輸入設(shè)備,輸入方法,輸入程序以及記錄介質(zhì)。一種文件信息輸入設(shè)備可以高精度檢測由用戶指定的要輸入的實(shí)際文件的一個(gè)區(qū)域的位置和屬性。根據(jù)所檢測的位置和屬性,文件信息輸入設(shè)備通過執(zhí)行諸如字符識(shí)別、表識(shí)別和圖處理那樣的適合于所檢測的屬性的識(shí)別處理,可把區(qū)域圖像識(shí)別為文本信息。然后,文件信息輸入設(shè)備把所生成的信息粘貼到顯示器上的電子文件的相關(guān)位置。結(jié)果,可高速和高精度實(shí)現(xiàn)從實(shí)際文件到電子文件的諸如字符序列、表和圖那樣的信息的輸入。
文檔編號G06K9/00GK1484165SQ0314981
公開日2004年3月24日 申請日期2003年7月25日 優(yōu)先權(quán)日2002年7月26日
發(fā)明者黑川浩司, 藤本克仁, 諏訪美佐子, 堀田悅伸, 直井聰, 仁, 伸, 佐子 申請人:富士通株式會(huì)社