專利名稱:圖像處理裝置和圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置和圖像處理方法。
背景技術(shù):
諸如賬簿和費(fèi)用表的手寫項(xiàng)目的賬務(wù)表單包括由諸如無碳紙張的壓敏紙張構(gòu)成 的那些賬務(wù)表單。這些賬務(wù)表單稱作“雙重憑單”,由層疊在一起的多頁壓敏紙張構(gòu)成。當(dāng) 利用鋼筆、圓珠筆等等在雙重憑單上書寫字符時(shí),來自筆的壓力也施加到層疊在進(jìn)行書寫 的頁之下的頁,由此輸入的字符是雙份的。利用雙重憑單可以容易地準(zhǔn)備原始文檔和副本, 但是復(fù)制在副本上的字符可能是或變得模糊不清。公開了當(dāng)利用掃描儀讀取多頁文檔并讀取輸入的細(xì)節(jié)時(shí)對頁面指定恰當(dāng)格式的 技術(shù)。JP-A-2000-182055公開一種基于識別出的布局確定獲取后繼布局的方法的技術(shù)。 JP-A-2005-115573公開了如下的技術(shù)計(jì)算多頁分類賬單圖像的每頁的特征量,并且對多 個(gè)登記的分類賬單的每頁的相應(yīng)特征量進(jìn)行比較,以基于針對每個(gè)登記的分類賬單計(jì)算出 的相似度來確定與分類賬單圖像對應(yīng)的登記分類賬單。JP-A-11-7493公開了如下的技術(shù) 當(dāng)讀取多頁文檔并且實(shí)施打印字符識別時(shí),應(yīng)用從第一頁提取的信息以簡化對第二頁和后 繼頁上的字符的提取。
發(fā)明內(nèi)容
本發(fā)明的目的在于使得多頁之一的圖像中包含的字符圖像可用于處理其它頁。本發(fā)明的第一方面提供了一種圖像處理裝置,該圖像處理裝置包括獲取單元,其 獲取表示包括多頁的文檔的圖像數(shù)據(jù);提取單元,其從所獲取的圖像數(shù)據(jù)中,提取作為所述 多頁中的至少一頁的第一頁中的字符區(qū)域;以及輸出單元,其將所提取的字符區(qū)域內(nèi)的第 一部分圖像數(shù)據(jù)與不同于所述第一頁的第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出,所述第二 頁是由于具有與所述第一頁內(nèi)的所提取字符區(qū)域?qū)?yīng)的字符區(qū)域而被確定的。本發(fā)明的第二方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述輸出單元輸 出如下的字符信息所述字符信息表示通過應(yīng)用到所述第一部分圖像數(shù)據(jù)的字符識別處理 而產(chǎn)生的字符,并且與獲取的所述第二頁的圖像數(shù)據(jù)相關(guān)聯(lián)。本發(fā)明的第三方面提供了根據(jù)第二方面的圖像處理裝置,其中,所述獲取單元獲 取按特定分辨率讀取的所述第一頁的第一圖像數(shù)據(jù)、以及按低于所述特定分辨率的分辨率 讀取的不同于所述第一頁的頁的第二圖像數(shù)據(jù)。本發(fā)明的第四方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述獲取單元獲 取按特定色調(diào)讀取的所述第一頁的第一圖像數(shù)據(jù)、以及按高于所述特定色調(diào)的色調(diào)讀取的 不同于所述第一頁的頁的第二圖像數(shù)據(jù)。本發(fā)明的第五方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述輸出單元將 所述第一部分圖像數(shù)據(jù)與所述第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出到針對所述第一頁 確定的輸出目的地。
本發(fā)明的第六方面提供了根據(jù)第一方面的圖像處理裝置,該圖像處理裝置還包 括存儲器,其存儲有表示多種類型的頁的格式的格式信息;以及識別單元,其對所獲取的 圖像數(shù)據(jù)進(jìn)行分析,確定由該圖像數(shù)據(jù)表示的頁的格式的格式信息,將該格式信息與存儲 在所述存儲器中的格式信息進(jìn)行比較,并且識別所述頁的格式,并且其中,所述提取單元從 所獲取的圖像數(shù)據(jù)中提取針對識別出的格式而確定的字符區(qū)域。本發(fā)明的第七方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述提取單元從 所獲取的圖像數(shù)據(jù)中提取針對所述第一頁確定的字符區(qū)域。本發(fā)明的第八方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述輸出單元將 所述第一部分圖像數(shù)據(jù)與所述第二頁中的預(yù)定區(qū)域內(nèi)的第二部分圖像數(shù)據(jù)相關(guān)聯(lián)地輸出。本發(fā)明的第九方面提供了根據(jù)第一方面的圖像處理裝置,其中,所述輸出單元輸 出所述第一部分圖像數(shù)據(jù),所述第一部分圖像數(shù)據(jù)替代所述第二頁中的與所述第一頁的所 提取字符區(qū)域相對應(yīng)的字符區(qū)域內(nèi)的第三部分圖像數(shù)據(jù)。本發(fā)明的第十方面提供了一種圖像處理方法,該圖像處理方法包括以下步驟獲 取表示包括多頁的文檔的圖像數(shù)據(jù);從所獲取的圖像數(shù)據(jù)中,提取作為所述多頁中的至少 一頁的第一頁中的字符區(qū)域;并且將所提取的字符區(qū)域內(nèi)的第一部分圖像數(shù)據(jù)與不同于所 述第一頁的第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出,所述第二頁是由于具有與所述第一頁 中的所提取字符區(qū)域?qū)?yīng)的字符區(qū)域而被確定的。根據(jù)本發(fā)明的第一方面,可以使得多頁中的任一頁的圖像中包含的字符圖像能夠 用于處理其它頁。根據(jù)本發(fā)明的第二方面,可以使得通過基于多頁中的任一頁的圖像中包含的字符 圖像執(zhí)行字符識別處理而獲得的字符信息能夠用于處理其它頁。根據(jù)本發(fā)明的第三方面,與按用于讀取其它頁的分辨率來讀取用于執(zhí)行字符識別 處理的字符圖像的處理相比較,能夠以更高的精度來執(zhí)行字符識別。根據(jù)本發(fā)明的第四方面,能夠減小多頁中的任一頁的圖像中包含的字符圖像的數(shù)據(jù)量。根據(jù)本發(fā)明的第五方面,可以使得多頁中的任一頁的圖像中包含的字符圖像能夠 用于處理其它頁。根據(jù)本發(fā)明的第六方面,能夠基于頁的圖像來識別頁的格式。根據(jù)本發(fā)明的第七方面,可以使得多頁中的任一頁的圖像內(nèi)的區(qū)域(其中,該區(qū) 域是根據(jù)這個(gè)頁來確定的)中包含的字符圖像能夠用于處理其它頁。根據(jù)本發(fā)明的第八方面,可以將多頁中的任一頁的圖像中包含的字符圖像與另一 頁的圖像數(shù)據(jù)內(nèi)的預(yù)定區(qū)域中包含的圖像數(shù)據(jù)相關(guān)聯(lián),并且使其可以使用。根據(jù)本發(fā)明的第九方面,可以使得多頁中的任一頁的圖像中包含的字符圖像可用 于替代另一頁的圖像內(nèi)的區(qū)域中包含的圖像,其中所述區(qū)域?qū)?yīng)于字符圖像的位置。根據(jù)本發(fā)明的第十方面,可以使得多頁中的任一頁的圖像中包含的字符圖像可用 于處理其它頁。
將參照附圖詳細(xì)描述本發(fā)明的示例性實(shí)施方式。
圖1示出了圖像處理系統(tǒng)的整體結(jié)構(gòu);圖2是示出圖像處理裝置的整體結(jié)構(gòu)的框圖;圖3是示出了存儲在存儲器中的格式信息的結(jié)構(gòu)的圖;圖4是示出了要由圖像處理裝置讀取的賬務(wù)表單的第一頁的示例的圖;圖5是示出了賬務(wù)表單的第二頁的示例的圖;圖6是示出了賬務(wù)表單的第三頁的示例的圖;圖7是用于說明表示記錄區(qū)域的位置的記錄區(qū)域位置信息的定義的圖;以及圖8是示出在圖像處理裝置上讀取賬務(wù)表單的一系列操作的流程圖。
具體實(shí)施例方式1、定義下面是對術(shù)語的說明?!案袷健笔侵副硎居稍谫~務(wù)表單上繪制的分格線、包圍線等等形成的區(qū)域的排列和 位置的賬務(wù)表單的預(yù)定構(gòu)成。在這些區(qū)域中,例如,通過利用寫入工具(例如,筆)輸入字 符,或者通過應(yīng)用個(gè)人圖章而形成印章?!案袷叫畔ⅰ笔侵副硎举~務(wù)表單的格式的信息和相關(guān)信息,并且包含表示上述區(qū)域 的位置等等的數(shù)值、表示各個(gè)區(qū)域的用途的標(biāo)簽、以及各頁的區(qū)域的使用關(guān)系?!坝涗泤^(qū)域”是指由格式信息定義并且在其中輸入字符的區(qū)域。2.結(jié)構(gòu)下面描述圖像處理系統(tǒng)9(本發(fā)明的示例性實(shí)施方式)的結(jié)構(gòu)。2-1.整體結(jié)構(gòu)圖1是示出了圖像處理系統(tǒng)9的整體結(jié)構(gòu)的圖。圖像處理裝置1經(jīng)由局域網(wǎng)3和 通信網(wǎng)4 (其為互聯(lián)網(wǎng)等等)與外部處理裝置2a、2b、2c (在下文中,當(dāng)不需要對這些裝置進(jìn) 行區(qū)分時(shí),總稱為“外部裝置2”)交換信息。2-2.圖像處理裝置的結(jié)構(gòu)圖2是示出圖像處理裝置1的整體結(jié)構(gòu)的框圖。CPU(中央處理單元)11讀取并執(zhí) 行存儲在ROM(只讀存儲器)12中的引導(dǎo)程序和存儲在存儲器14中的計(jì)算機(jī)程序以控制圖 像處理裝置1的每個(gè)部分。ROM 12是由半導(dǎo)體元件等等構(gòu)成的只讀非易失性存儲裝置。ROM 12存儲有用于將存儲在存儲器14中的OS (操作系統(tǒng))加載到RAM (隨機(jī)存取存儲器)13上 的引導(dǎo)程序、以及BIOS(基本輸入/輸出系統(tǒng))等。RAM 13用作當(dāng)CPU 11執(zhí)行程序時(shí)的工 作區(qū)域。存儲器14是非易失性存儲裝置(例如,硬盤驅(qū)動(dòng)器或EEPR0M(電擦除可編程只讀 存儲器)),并且存儲讀入CPU11的程序。存儲器14還存儲分類賬頁的格式信息141。將在 以后描述格式信息141的細(xì)節(jié)。操作部15包括用于輸入各種指令的方向鍵、按鈕等等,接受用戶執(zhí)行的操作,并 且將與這些操作的細(xì)節(jié)對應(yīng)的信號提供給CPU 11。顯示器16例如包括液晶顯示器,并且顯 示與來自CPU 11的指令對應(yīng)的圖像。圖像獲取部17是獲取表示賬務(wù)表單的圖像數(shù)據(jù)的裝 置,例如以光學(xué)方式讀取繪制在介質(zhì)上的圖像以產(chǎn)生與圖像對應(yīng)的圖像數(shù)據(jù)的掃描儀。通 信部18例如包括各種調(diào)制解調(diào)器和無線通信電路、串行接口和無線接口,并且與外部設(shè)備 交換數(shù)據(jù)。
2-3.格式信息的結(jié)構(gòu)圖3是示出了存儲在存儲器14中的格式信息141的結(jié)構(gòu)的圖。格式信息141存 儲每個(gè)賬務(wù)表單名稱(即,賬務(wù)表單的名稱)的信息。賬務(wù)表單名稱的列表1410列出了 存儲在格式信息141中的所有賬務(wù)表單的賬務(wù)表單名稱,并且針對各個(gè)賬務(wù)表單分離存儲 在格式信息141中的信息。針對在賬務(wù)表單名稱的列表1410中記載的每個(gè)賬務(wù)表單名稱, 在區(qū)域定義表1411和發(fā)送目的地定義表1412中記載信息。在區(qū)域定義表1411中,針對每 個(gè)記錄區(qū)域,關(guān)聯(lián)并記載有“記錄區(qū)域識別信息”、“記錄區(qū)域位置信息”和“附加目的地信 息”,其中,“記錄區(qū)域識別信息”是用于識別賬務(wù)表單上的記錄區(qū)域的信息,“記錄區(qū)域位置 信息”表示記錄區(qū)域的位置,“附加目的地信息”表示基于該記錄區(qū)域產(chǎn)生的字符信息附加 到的頁。記錄區(qū)域識別信息是包含記錄區(qū)域的編號以及表示記錄區(qū)域的用途的標(biāo)簽名稱的 信息。記錄區(qū)域位置信息是描述定義記錄區(qū)域的矩形形狀的兩個(gè)x坐標(biāo)和兩個(gè)y坐標(biāo)的信 息。附加目的地信息針對賬務(wù)表單的所有頁,描述當(dāng)定義了單個(gè)頁作為指定頁時(shí)字符信息 的各項(xiàng)附加到的非指定頁的頁碼。針對指定頁的每個(gè)記錄區(qū)域確定附加目的地信息。換言 之,附加目的地是由于具有與指定頁內(nèi)的記錄區(qū)域?qū)?yīng)的記錄區(qū)域而確定的。發(fā)送目的地定義表1412針對每個(gè)頁記載了 “發(fā)送目的地信息”和“發(fā)送區(qū)域信 息”,其中,“發(fā)送目的地信息”表示作為該頁的圖像數(shù)據(jù)發(fā)送到的發(fā)送目的地的外部處理裝 置2的識別信息,“發(fā)送區(qū)域信息”表示從頁的圖像數(shù)據(jù)發(fā)送到發(fā)送目的地的區(qū)域。當(dāng)如圖3所示地在附加目的地信息中記載了 “2,3”時(shí),這表示記錄區(qū)域的附加目 的地是頁2和3,當(dāng)在附加目的地信息中記載了“_”時(shí),這表示沒有附加目的地。此外,在圖 3所示的示例中,賬務(wù)表單的第一頁的發(fā)送目的地例如是外部處理裝置2a,這是由與頁1對 應(yīng)的發(fā)送目的地信息中的描述“2A”表示的。發(fā)送目的地信息是識別根據(jù)頁而確定的輸出 目的地的信息,具體地講,包括外部處理裝置的IP地址、與外部處理裝置相關(guān)聯(lián)的電子郵 件地址等等。在具體的條件下,通過對由字符識別處理使用標(biāo)簽名稱從字符圖像數(shù)據(jù)提取的字 符串進(jìn)行組合,從而產(chǎn)生字符信息。例如,當(dāng)從表示目標(biāo)記錄區(qū)域的圖像的圖像數(shù)據(jù)中產(chǎn)生 了字符串“富士一郎”并且與記錄區(qū)域相關(guān)聯(lián)地獲取了標(biāo)簽名稱“名稱”時(shí),圖像處理裝置1 的CPU 11對這個(gè)信息進(jìn)行組合以產(chǎn)生字符信息“< 名稱 > 富士一郎</名稱>”。2-4.分類賬單的構(gòu)成圖4是示出了由圖像處理裝置1讀取的賬務(wù)表單的第一頁的示例的圖。在頁 B1 (其為賬務(wù)表單的第一頁)上設(shè)置了記錄區(qū)域Bill、B121、B122、記錄區(qū)域B131、B132、 B133、記錄區(qū)域B141、B142、B143、以及記錄區(qū)域B151。在記錄區(qū)域Bill、B121、B122中, 分別輸入了發(fā)送者的名稱、地址和電話號碼。在記錄區(qū)域B131、B132、B133中,分別輸入了 配送目的地的名稱、地址和電話號碼。在記錄區(qū)域B141、B142、B143中,分別輸入了要進(jìn)行 配送的貨物的名稱、要進(jìn)行配送的個(gè)數(shù)和進(jìn)行配送所需的費(fèi)用。在記錄區(qū)域B 151中輸入 了確認(rèn)方的簽字。印章區(qū)域B110、B150是進(jìn)行印記的區(qū)域并且分別疊加在記錄區(qū)域Bill、 B151上。此外,在頁顯示區(qū)域B10中,預(yù)先顯示了頁碼和賬務(wù)表單的總頁數(shù)。圖5是示出了賬務(wù)表單的第二頁的示例的圖。在頁B2(其為賬務(wù)表單的第二頁) 上,在與記錄區(qū)域B111、B121、B122、B131和B133分別對應(yīng)的位置上設(shè)置有記錄區(qū)域B211、 B221、B222、B231、B232和B233。當(dāng)用戶在賬務(wù)表單中進(jìn)行輸入時(shí),頁B1層疊在圖中的用斜線表示的區(qū)域上面。頁B1的與這些區(qū)域?qū)?yīng)的區(qū)域由壓敏紙形成。由此,在頁B1上輸 入的字符復(fù)制在頁B2上的這些區(qū)域中。此外,在頁顯示區(qū)域B20中,預(yù)先顯示頁碼和賬務(wù) 表單的總頁數(shù)。圖6是示出了賬務(wù)表單的第三頁的示例的圖。在頁B3(其為賬務(wù)表單的第三頁) 上,在與記錄區(qū)域Bill、B141、B142、B143、B151分別對應(yīng)的位置上設(shè)置了記錄區(qū)域B311、 B341、B342、B343、B351。當(dāng)用戶在賬務(wù)表單中進(jìn)行輸入時(shí),頁B2層疊在頁B3上面,頁B1層 疊在頁B2上面。層疊在頁B3上面的頁B2的與圖中的由斜線表示的區(qū)域?qū)?yīng)的區(qū)域由壓 敏紙形成。因此,在頁B1上輸入的字符通過頁B2復(fù)制到頁B3的這些區(qū)域上。此外,在頁 顯示區(qū)域B30中,預(yù)先顯示頁碼和賬務(wù)表單的總頁數(shù)。圖7是用于說明表示記錄區(qū)域的位置的記錄區(qū)域位置信息的定義的圖。圖中的點(diǎn) 0表示頁的開始點(diǎn),其為圖像獲取部17讀取的頁上的第一點(diǎn)。圖7所示的箭頭x表示圖像 獲取部17的主掃描方向,而箭頭y表示副掃描方向。圖7所示的記錄區(qū)域Bill是矩形的, 以點(diǎn)P1和P2作為對角。在主掃描方向上表示點(diǎn)P1的位置的x坐標(biāo)是xl,而在副掃描方向 上表示該位置的1坐標(biāo)是yl。點(diǎn)P2的x坐標(biāo)和y坐標(biāo)分別是x2和y2。xl小于x2,yl小 于y2。格式信息141基于與xl、x2、yl和y2對應(yīng)的數(shù)值定義每個(gè)記錄區(qū)域。3.操作接下來,將描述圖像處理系統(tǒng)9的操作,具體是圖像處理裝置1的操作。圖8是示出用于在圖像處理裝置1上讀取賬務(wù)表單的一系列操作的流程圖。賬 務(wù)表單名稱列表1410的內(nèi)容顯示在顯示器16上。當(dāng)用戶通過在觀看顯示器16上的顯示 內(nèi)容的同時(shí)操作操作部15的方向鍵和按鈕從而選擇了要讀取的賬務(wù)表單的賬務(wù)表單名稱 時(shí),CPU 111獲取并在RAM 13中存儲所選擇的賬務(wù)表單名稱(步驟S101)。接下來,當(dāng)用戶 按順序在圖像獲取部17的自動(dòng)文檔進(jìn)給器(ADF)(未示出)上層疊安放賬務(wù)表單(文檔的 示例)的多頁并且操作操作部15以發(fā)出讀取賬務(wù)表單的指令時(shí),圖像獲取部17在CPU 11 的控制下逐頁掃描賬務(wù)表單頁,并且將從每個(gè)掃描的頁產(chǎn)生的圖像數(shù)據(jù)與頁碼進(jìn)行相關(guān)聯(lián) 并將它發(fā)送給CPU 11。CPU 11將獲取的圖像數(shù)據(jù)與頁碼相關(guān)聯(lián)并且將它存儲在RAM13中 (步驟S102)。換言之,圖像獲取部17和CPU 11用作如下的獲取單元其獲取表示包括多 頁的文檔的圖像數(shù)據(jù)。此外,由存儲在RAM 13中的頁碼表示的頁是指定頁(第一頁的示 例),它是賬務(wù)表單中包含的多頁中的至少一頁,存儲在RAM 13中的圖像數(shù)據(jù)是表示指定 頁的圖像的圖像數(shù)據(jù)。CPU 11定位在步驟S101中從格式信息141的賬務(wù)表單名稱列表1410獲取的賬務(wù) 表單名稱,并指定與賬務(wù)表單名稱對應(yīng)的區(qū)域定義表1411和發(fā)送目的地定義表1412。然 后,CPU 11參照區(qū)域定義表1411的附加目的地信息字段,獲取與圖像數(shù)據(jù)的頁碼對應(yīng)的各 個(gè)記錄區(qū)域的附加目的地信息,并且針對每個(gè)記錄區(qū)域確定所獲取的附加目的地信息是否 是“-”(步驟S103)。如果確定了所獲取的附加目的地信息是“_”(即,如果針對該記錄區(qū) 域沒有定義附加目的地)(步驟S103:是),則CPU 11進(jìn)入下一個(gè)步驟。另一方面,如果確 定了所獲取的附加目的地信息不是“_” (步驟S103 否),則CPU11從圖像數(shù)據(jù)中提取由記 錄區(qū)域(字符區(qū)域的示例)的記錄區(qū)域位置信息表示的矩形區(qū)域的數(shù)據(jù),作為表示字符的 字符圖像數(shù)據(jù)(第一部分圖像數(shù)據(jù)的示例)(步驟S104)。換言之,CPU 11用作如下的提 取單元其從由獲取單元獲取的圖像數(shù)據(jù)中,提取作為多頁中的一頁的指定頁中的字符區(qū)域。此外,如果區(qū)域定義表1411中的針對各頁的各個(gè)記錄區(qū)域而確定的附加目的地信息不 是“_”,則由記錄區(qū)域的記錄區(qū)域位置信息表示的矩形區(qū)域的數(shù)據(jù)是針對指定頁而確定的 區(qū)域內(nèi)包含的字符圖像數(shù)據(jù)。換言之,在這種情況下,CPU 11用作如下的提取單元其從表 示指定頁的圖像的圖像數(shù)據(jù)中,提取針對指定頁而確定的區(qū)域中包含的字符圖像數(shù)據(jù)。然后,通過執(zhí)行字符識別處理,CPU 11從提取的字符圖像數(shù)據(jù)產(chǎn)生字符信息(步 驟S 105)。換言之,所述字符信息是表示字符并且通過對由提取單元提取的字符圖像數(shù)據(jù) 執(zhí)行字符識別處理而獲得的字符信息。然后,CPU 11將產(chǎn)生的字符信息與指定頁相關(guān)聯(lián), 同時(shí)還將它與在附加目的地信息中表示的各個(gè)附加目的地頁(即,不同于指定頁的頁)(第 二頁的示例)相關(guān)聯(lián)以將其存儲在RAM 13中(步驟S106)。例如,當(dāng)讀取了名稱為“配送表A”的賬務(wù)表單的第一頁時(shí),由于與編號為“1”的記 錄區(qū)域相關(guān)聯(lián)的附加目的地是“2,3”,所以CPU 11從與編號為“1”的記錄區(qū)域?qū)?yīng)的圖4 中的記錄區(qū)域Bill的字符圖像數(shù)據(jù)產(chǎn)生字符串“富士一郎”,將該字符串與記錄區(qū)域Bill 的標(biāo)簽名稱“名稱”進(jìn)行組合,并且產(chǎn)生由字符串“< 名稱 > 富士一郎</名稱 >”構(gòu)成的字 符信息。然后,CPU 11將產(chǎn)生的字符信息與頁2和頁3 二者相關(guān)聯(lián)并且將它存儲在RAM 13 中。在針對由圖像獲取部17讀取的頁的所有記錄區(qū)域都執(zhí)行了以上所有處理(S卩,步 驟S103到步驟S106的處理)以后,CPU 11參照發(fā)送目的地定義表1412并且獲取針對該 頁定義的發(fā)送區(qū)域信息(步驟S107)。然后,CPU 11從圖像數(shù)據(jù)中提取具有發(fā)送區(qū)域信息 中表示的號碼的記錄區(qū)域的圖像數(shù)據(jù),作為部分圖像數(shù)據(jù)(第二部分圖像數(shù)據(jù)的示例)并 且將它存儲在RAM 13中(步驟S108)。換言之,部分圖像數(shù)據(jù)是特定頁的圖像數(shù)據(jù)中的預(yù) 定區(qū)域內(nèi)的圖像數(shù)據(jù)。接下來,CPU 11確定該頁是否具有在步驟S106中與該頁相關(guān)聯(lián)的任何字符信息 (步驟S109),如果確定了存在相關(guān)聯(lián)的字符信息(步驟S 109 是),則它將所述字符信息 附加到部分圖像數(shù)據(jù)(步驟S 110)并且處理前進(jìn)步驟S111。另一方面,如果CPU 111確定 沒有相關(guān)聯(lián)的字符信息(步驟S109 否),則CPU 11使得處理直接前進(jìn)到步驟S111。在步驟SI 11中,CPU 11參照發(fā)送目的地定義表1412,獲取針對該頁定義的發(fā)送目 的地信息(步驟S111),并且將部分圖像數(shù)據(jù)發(fā)送到由發(fā)送目的地信息表示的發(fā)送目的地 (步驟S112)。由此,CPU 11用作如下的輸出單元其將由提取單元提取的字符圖像數(shù)據(jù)與 附加目的地頁的圖像數(shù)據(jù)相關(guān)聯(lián),并將此數(shù)據(jù)輸出到針對各個(gè)附加目的地頁而確定的輸出 目的地。此外,這時(shí),如果向部分圖像數(shù)據(jù)附加了字符信息,則也將該字符信息與部分圖像 數(shù)據(jù)一起發(fā)送到發(fā)送目的地。具體來說,如果字符信息已經(jīng)與在附加目的地信息中表示的 附加目的地頁(即,不同于指定頁的頁)相關(guān)聯(lián),則部分圖像數(shù)據(jù)是不同于指定頁的頁的圖 像數(shù)據(jù)內(nèi)的預(yù)定區(qū)域中包含的圖像數(shù)據(jù)。由此,CPU 11用作輸出單元,所述輸出單元通過 將如下的字符信息與附加目的地頁的圖像數(shù)據(jù)中的預(yù)定區(qū)域內(nèi)的圖像數(shù)據(jù)相關(guān)聯(lián)從而輸 出該字符信息,所述字符信息表示通過對由提取單元提取的字符圖像數(shù)據(jù)執(zhí)行字符識別處 理而確定的字符,其中所述預(yù)定區(qū)域是根據(jù)指定頁總的字符圖像數(shù)據(jù)的位置而確定的。然后,CPU 11確定在賬務(wù)表單中是否存在后繼頁(步驟S113),如果確定存在后繼 頁(步驟S113:是),則它將處理返回到步驟S102。另一方面,如果確定沒有后繼頁(步驟SI 13 否),則CPU 11結(jié)束處理。例如,在針對第一頁定義的發(fā)送區(qū)域信息中,記載了記錄區(qū)域號“1,10”。它們例 如對應(yīng)于圖4所示的記錄區(qū)域B111、B151。記錄區(qū)域B111、B151是與印章區(qū)域B110、B150 疊加的區(qū)域,印章區(qū)域B110、B150是如上所述地進(jìn)行印記的區(qū)域。在字符識別處理中不識 別印章區(qū)域的印記,由此,不能基于在字符識別處理中獲得的字符信息來確定印記。與作為 字符識別結(jié)果的字符信息分開地,CPU 11將作為這些記錄區(qū)域的圖像數(shù)據(jù)的部分圖像數(shù)據(jù) 與各頁相關(guān)聯(lián)并存儲,由此,通過所述部分圖像數(shù)據(jù)來補(bǔ)償從字符信息丟失的信息。如上所述,圖像處理系統(tǒng)9能夠?qū)⒈硎咀址诙囗撝兄辽僖豁摰膱D像中的 字符圖像數(shù)據(jù)與包含在其它頁的圖像中的部分圖像數(shù)據(jù)相關(guān)聯(lián)并且進(jìn)行處理。與原始字符 相比,例如由于筆壓力的變化或者壓敏紙張的靈敏度的變化,在雙重憑單中復(fù)制的字符經(jīng) 常變得褪色或不清楚。當(dāng)對這些褪色或不清楚的字符執(zhí)行字符識別處理時(shí),很有可能會錯(cuò) 誤地識別這些字符。在圖像處理系統(tǒng)9中,例如當(dāng)讀取雙重憑單時(shí),包含復(fù)制字符的頁的部 分圖像數(shù)據(jù)(其中,表示原始字符的字符信息已經(jīng)附加到此數(shù)據(jù))輸出到對頁進(jìn)行處理的 外部處理裝置2。由此,通過對復(fù)制字符重新利用針對原始字符執(zhí)行的第一字符識別處理的 結(jié)果,圖像處理系統(tǒng)9能夠減小進(jìn)行處理所需的時(shí)間和資源。此外,通過針對比復(fù)制字符清 楚的原始字符執(zhí)行字符識別處理,圖像處理系統(tǒng)9能夠減小字符錯(cuò)誤識別的情況。此外,在上述的示例性實(shí)施方式中,在記錄區(qū)域進(jìn)行印記。然而,本發(fā)明不限于此 示例性實(shí)施方式。例如,可以在記錄區(qū)域進(jìn)行簽名或拇指印以替代印記。在這種情況下,上 述的印章區(qū)域疊加在記錄區(qū)域上,作為簽名區(qū)域或拇指印區(qū)域。4.變型上面描述了示例性實(shí)施方式,但是可以如下修改這個(gè)示例性實(shí)施方式的細(xì)節(jié)。此 外,還可以組合下面的變型。(1)變型例 1在上述的示例性實(shí)施方式中,當(dāng)CPU 11確定了存在已經(jīng)與指定頁相關(guān)聯(lián)的字符 信息時(shí),它將該字符信息附加該頁的部分圖像數(shù)據(jù),但是CPU11可以附加字符圖像數(shù)據(jù)以 替代字符信息。在這種情況下,可以在發(fā)送目的地執(zhí)行字符識別處理。例如,當(dāng)外部處理裝 置2接收到附加于部分圖像數(shù)據(jù)并從圖形處理裝置1發(fā)送的字符圖像數(shù)據(jù)時(shí),外部處理裝 置2的CPU可以通過對字符圖像數(shù)據(jù)執(zhí)行字符識別處理來產(chǎn)生字符信息。換言之,CPU 11 可以用作如下的輸出單元其將由提取單元提取的字符圖像數(shù)據(jù)與附加目的地頁的圖像數(shù) 據(jù)相關(guān)聯(lián)并輸出,其中,所述圖像數(shù)據(jù)是根據(jù)指定頁中的圖像數(shù)據(jù)的位置而確定的。此外,在上述的示例性實(shí)施方式中,附加目的地信息僅僅針對一頁包含不同于“_” 的描述(即,僅僅存在一個(gè)指定頁),但是第二和后繼頁的附加目的地信息可以包含不同于 “_”的記載。在這種情況下,也可以將當(dāng)?shù)谝豁撌侵付摃r(shí)被定義為非指定頁的頁用作指定 頁。(2)變型例 2在上述的示例性實(shí)施方式中,當(dāng)CPU 11確定了存在已經(jīng)與不同于指定頁的頁的 部分圖像數(shù)據(jù)相關(guān)聯(lián)的字符信息時(shí),它將該字符信息附加到該部分圖像數(shù)據(jù),但是它也可 以將該字符信息直接附加到不同于指定頁的頁的圖像數(shù)據(jù)。換言之,CPU 11可以用作如下 的輸出單元其將由提取單元提取的字符圖像數(shù)據(jù)與附加目的地頁的圖像數(shù)據(jù)相關(guān)聯(lián)并輸出,其中所述圖像數(shù)據(jù)是根據(jù)指定頁中的字符圖像數(shù)據(jù)的位置而確定的。(3)變型例 3圖像獲取部17可以用不同的分辨率來讀取指定頁和非指定頁的圖像數(shù)據(jù)。由于 當(dāng)進(jìn)行字符識別處理的圖像數(shù)據(jù)的分辨率較高時(shí)字符識別變得更加準(zhǔn)確,所以與以低分辨 率讀取的圖像數(shù)據(jù)相比,以高分辨率讀取的圖像數(shù)據(jù)更加適于用作字符圖像數(shù)據(jù)。由此,在 這種情況下,在CPU 11的控制之下,圖像獲取部17以比非指定頁更高的分辨率來讀取從其 提取字符圖像數(shù)據(jù)的指定頁,以產(chǎn)生圖像數(shù)據(jù)。(4)變型例 4此外,圖像獲取部17可以用不同的色調(diào)來讀取指定頁和非指定頁的圖像數(shù)據(jù)。例 如,即使對于以黑和白兩種色調(diào)表示的黑白圖像,也可以執(zhí)行字符識別處理。通過將圖像數(shù) 據(jù)設(shè)置為低色調(diào),可以減小通信負(fù)載并且可以節(jié)省存儲空間。另一方面,由于如上所述,使 用部分圖像數(shù)據(jù)來確認(rèn)印記等等,所以高色調(diào)更適于進(jìn)行確認(rèn),并且,例如,在色彩信息缺 失的黑白圖像的情況下,可能無法實(shí)現(xiàn)確認(rèn)印記的目的。因此,在這種情況下,在CPU 11的 控制下,圖像獲取部17以比非指定頁低的色調(diào)來讀取從其提取字符圖像數(shù)據(jù)的指定頁,以 產(chǎn)生圖像數(shù)據(jù)。(5)變型例 5在上述的示例性實(shí)施方式中,發(fā)送目的地定義表1412記載了發(fā)送目的地信息(其 為指定針對各頁而確定的輸出目的地的信息),但是可以不針對各頁確定輸出目的地。換言 之,CPU 11可以將由提取單元提取的字符圖像數(shù)據(jù)與不同于指定頁的頁的圖像數(shù)據(jù)相關(guān)聯(lián) 并輸出,其中所述圖像數(shù)據(jù)是根據(jù)指定頁中的字符圖像數(shù)據(jù)的位置來確定的。(6)變型例 6在上述的示例性實(shí)施方式中,CPU 11獲取用戶選擇的賬務(wù)表單名稱并且識別獲取 的圖像數(shù)據(jù)的格式,但是可以通過分析圖像數(shù)據(jù)自身來自動(dòng)識別獲取的圖像數(shù)據(jù)的格式。 在這種情況下,存儲器14存儲有表示多種類型的頁的格式的格式信息。換言之,存儲器14 是存儲表示多種類型的頁的格式的格式信息的格式信息存儲器的示例。然后,當(dāng)CPU 11從 圖像獲取部17獲取了圖像數(shù)據(jù)時(shí),它對獲取的圖像數(shù)據(jù)執(zhí)行諸如標(biāo)注處理的分析,并且基 于分格線和其它線的位置和排列來獲得圖像數(shù)據(jù)的格式信息。CPU 11然后可以利用存儲在 存儲器14中的格式的格式信息對獲得的格式信息執(zhí)行模式匹配處理等,以識別圖像數(shù)據(jù) 表示的頁的格式。換言之,CPU11用作如下的格式識別單元其對由圖像數(shù)據(jù)獲取單元獲取 的圖像數(shù)據(jù)進(jìn)行分析,獲得表示由所述圖像數(shù)據(jù)表示的頁的格式的格式信息,將該格式信 息與由格式信息存儲器存儲的格式信息進(jìn)行比較,并且識別所述頁的格式。此外,可以使用 在預(yù)定區(qū)域中記載的細(xì)節(jié)來識別圖像數(shù)據(jù)的各項(xiàng)的格式。具體地講,例如,通過對在頁顯示 區(qū)域B10、B20和B30中記載的細(xì)節(jié)進(jìn)行分析,可以識別格式。(7)變型例 7當(dāng)組合上述的變型例1和變型例2時(shí),CPU 11用作如下的輸出單元其將由提取 單元提取的字符圖像數(shù)據(jù)與不同于指定頁的頁的圖像數(shù)據(jù)相關(guān)聯(lián)并輸出,其中所述圖像數(shù) 據(jù)是根據(jù)指定頁中的字符圖像數(shù)據(jù)的位置而確定的,但是CPU 11可以用從非指定頁獲得 的與這個(gè)位置對應(yīng)的區(qū)域中包含的圖像數(shù)據(jù)(第三部分圖像數(shù)據(jù)的示例)來替代指定頁 中的字符圖像數(shù)據(jù)。換言之,CPU 11用作如下的輸出單元其輸出提取單元提取的字符圖像數(shù)據(jù),替代與附加目的地頁的圖像數(shù)據(jù)中的字符圖像數(shù)據(jù)的位置對應(yīng)的區(qū)域內(nèi)的圖像數(shù) 據(jù)。(8)變型例 8在上述的示例性實(shí)施方式中,每當(dāng)CPU11掃描單頁時(shí),它發(fā)送頁的部分圖像,但是 它可以在掃描了作為一組的單個(gè)賬務(wù)表單以后執(zhí)行發(fā)送處理。此外,在上述的示例性實(shí)施方式中,發(fā)送目的地定義表1412記載了外部處理裝置 2的識別信息作為發(fā)送目的地信息,但是發(fā)送目的地定義表1412可以記載存儲器14中的多 個(gè)劃分存儲區(qū)域中的每一個(gè)的識別信息作為發(fā)送目的地信息。多個(gè)劃分存儲區(qū)域中的每一 個(gè)的識別信息例如可以是URL、文件路徑或物理地址。在這種情況下,對于每個(gè)頁,CPU 11 將該頁的圖像數(shù)據(jù)和附加的字符信息存儲在由發(fā)送目的地定義表1412的發(fā)送目的地信息 中記載的識別信息表示的各個(gè)存儲區(qū)域中。然后,圖像處理裝置1可以配置用于從各個(gè)存 儲區(qū)域獲取圖像數(shù)據(jù)的各個(gè)外部處理裝置2的授權(quán)設(shè)置。在這種情況下,外部處理裝置2 的識別信息可以與存儲區(qū)域中的識別信息相關(guān)聯(lián)。(9)變型例 9由圖像處理裝置1的CPU 11執(zhí)行的各個(gè)程序可以存儲并設(shè)置在計(jì)算機(jī)可讀存儲 介質(zhì)上,例如,諸如磁帶或磁盤的磁記錄介質(zhì)、諸如光盤的光記錄介質(zhì)、磁光介質(zhì)或半導(dǎo)體 存儲器。此外,還可以通過例如互聯(lián)網(wǎng)的網(wǎng)絡(luò)下載這些程序。此外,執(zhí)行這些控制操作的控 制器可以是不同于CPU的各種裝置中的任何一個(gè),例如專用處理器。此外,對于存儲器14、操作部15、顯示器16和圖像獲取部17,可以使用通過通信部 18連接的外部設(shè)備。在這種情況下,CPU 11可以通過通信部18控制各個(gè)外部設(shè)備。對本發(fā)明示例性實(shí)施方式的前述描述是為了例示和描述的目的而提供的。其并非 旨在窮舉或者將本發(fā)明限于所公開的確切形式。顯然,許多變型和修改對于本領(lǐng)域技術(shù)人 員是顯而易見的。選擇并描述這些示例性實(shí)施方式是為了最好地說明本發(fā)明的原理及其實(shí) 際應(yīng)用,從而使得本領(lǐng)域其他技術(shù)人員能夠理解本發(fā)明的適用于所構(gòu)想特定用途的各種實(shí) 施方式和各種變型。旨在由所附權(quán)利要求書及其等同物來限定本發(fā)明的范圍。
權(quán)利要求
一種圖像處理裝置,該圖像處理裝置包括獲取單元,其獲取表示包括多頁的文檔的圖像數(shù)據(jù);提取單元,其從所獲取的圖像數(shù)據(jù)中,提取作為所述多頁中的至少一頁的第一頁中的字符區(qū)域;以及輸出單元,其將所提取的字符區(qū)域內(nèi)的第一部分圖像數(shù)據(jù)與不同于所述第一頁的第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出,所述第二頁是由于具有與所述第一頁中的所提取字符區(qū)域相對應(yīng)的字符區(qū)域而被確定的。
2.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述輸出單元輸出如下的字符信息所述字 符信息表示通過應(yīng)用于所述第一部分圖像數(shù)據(jù)的字符識別處理而產(chǎn)生的字符,并且與所述 第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)。
3.根據(jù)權(quán)利要求2的圖像處理裝置,其中,所述獲取單元獲取按特定分辨率讀取的所 述第一頁的第一圖像數(shù)據(jù)、以及按低于所述特定分辨率的分辨率讀取的不同于所述第一頁 的頁的第二圖像數(shù)據(jù)。
4.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述獲取單元獲取按特定色調(diào)讀取的所述 第一頁的第一圖像數(shù)據(jù)、以及按高于所述特定色調(diào)的色調(diào)讀取的不同于所述第一頁的頁的 第二圖像數(shù)據(jù)。
5.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述輸出單元將所述第一部分圖像數(shù)據(jù)與 所述第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出到針對所述第一頁確定的輸出目的地。
6.根據(jù)權(quán)利要求1的圖像處理裝置,該圖像處理裝置還包括存儲器,其存儲有表示多種類型的頁的格式的格式信息;以及識別單元,其對所獲取的圖像數(shù)據(jù)進(jìn)行分析,確定由該圖像數(shù)據(jù)表示的頁的格式的格 式信息,將該格式信息與存儲在所述存儲器中的格式信息進(jìn)行比較,并且識別所述頁的格 式,并且其中,所述提取單元從所獲取的圖像數(shù)據(jù)中提取針對識別出的格式而確定的字符區(qū)域。
7.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述提取單元從所獲取的圖像數(shù)據(jù)中提取 針對所述第一頁確定的字符區(qū)域。
8.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述輸出單元將所述第一部分圖像數(shù)據(jù)與 所述第二頁中的預(yù)定區(qū)域內(nèi)的第二部分圖像數(shù)據(jù)相關(guān)聯(lián)地輸出。
9.根據(jù)權(quán)利要求1的圖像處理裝置,其中,所述輸出單元輸出所述第一部分圖像數(shù)據(jù), 所述第一部分圖像數(shù)據(jù)替代所述第二頁中的與所述第一頁的所提取字符區(qū)域相對應(yīng)的字 符區(qū)域內(nèi)的第三部分圖像數(shù)據(jù)。
10.一種圖像處理方法,該圖像處理方法包括以下步驟獲取表示包括多頁的文檔的圖像數(shù)據(jù);從所獲取的圖像數(shù)據(jù)中,提取作為所述多頁中的至少一頁的第一頁中的字符區(qū)域;以及將所提取的字符區(qū)域內(nèi)的第一部分圖像數(shù)據(jù)與不同于所述第一頁的第二頁的所獲取 圖像數(shù)據(jù)相關(guān)聯(lián)地輸出,所述第二頁是由于具有與所述第一頁中的所提取字符區(qū)域相對應(yīng) 的字符區(qū)域而被確定的。
全文摘要
本發(fā)明涉及圖像處理裝置和圖像處理方法。該圖像處理裝置包括獲取單元,其獲取表示包括多頁的文檔的圖像數(shù)據(jù);提取單元,其從所獲取的圖像數(shù)據(jù)中,提取作為所述多頁中的至少一頁的第一頁中的字符區(qū)域;以及輸出單元,其將所提取的字符區(qū)域內(nèi)的第一部分圖像數(shù)據(jù)與不同于所述第一頁的第二頁的所獲取圖像數(shù)據(jù)相關(guān)聯(lián)地輸出,所述第二頁是由于具有與所述第一頁中的所提取字符區(qū)域相對應(yīng)的字符區(qū)域而被確定的。
文檔編號G06K9/62GK101930546SQ20101000480
公開日2010年12月29日 申請日期2010年1月18日 優(yōu)先權(quán)日2009年6月24日
發(fā)明者榎本尚之 申請人:富士施樂株式會社