專利名稱:圖像處理裝置和圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置和圖像處理方法。
背景技術(shù):
JP-A-04_023185(專利文獻(xiàn)I)披露了如下技術(shù)從表格格式文檔的圖像數(shù)據(jù)中提取被格線包圍的單元格,判斷所提取單元格的屬性,并且依據(jù)所判定的單元格屬性識(shí)別各單元格內(nèi)的文字。JP-A-05_342408(專利文獻(xiàn)2)披露了一種文檔圖像填充裝置,其用于將來自所讀取的文檔圖像的文字區(qū)域、照片區(qū)域和圖形區(qū)域分離,對文字區(qū)域的圖像執(zhí)行文字識(shí)別并
對圖形區(qū)域的圖像執(zhí)行矢量繪圖,并且填充圖片區(qū)域作為圖像數(shù)據(jù)。JP-A-2002_73598(專利文獻(xiàn)3)披露了一種文檔處理器,其用于檢測諸如來自電子文檔的文本、圖片和表格等內(nèi)容,并且基于表示屬性的信息記錄并管理所檢測到的內(nèi)容。JP-A-09_128480(專利文獻(xiàn)4)披露了如下技術(shù)通過判斷等于或短于某一閾值的空格來提取直線作為現(xiàn)有圖案,從所提取的直線提取邊框,并且通過基于邊框裁切該圖案,即使當(dāng)構(gòu)成邊框的直線模糊時(shí)也可以準(zhǔn)確地提取圖案區(qū)域。JP-A-08_044827(專利文獻(xiàn)5)披露了一種數(shù)字復(fù)印機(jī),其用于對所讀取的原始圖像中的文字、表格和圖形執(zhí)行區(qū)域判斷,收集所判定的各個(gè)區(qū)域中相同類型的區(qū)域,對文字區(qū)域執(zhí)行文字識(shí)別,對表格區(qū)域執(zhí)行表格邊框識(shí)別處理,并且在矢量化圖形區(qū)域之后執(zhí)行圖形識(shí)別處理。JP-A-2005_128925(專利文獻(xiàn)6)披露了一種文檔編輯系統(tǒng),其用于從第一文檔的圖像信息提取模板信息,從第二文檔的圖像信息提取內(nèi)容信息,并且通過組合模板信息與內(nèi)容信息來生成組合文檔。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種圖像處理裝置和圖像處理方法,其能夠在單個(gè)表格被分割地打印在多頁上的情況下通過讀取所打印的多頁原稿來恢復(fù)原始表格作為電子文檔。根據(jù)本發(fā)明的第一方面,提供了一種圖像處理裝置,包括提取單元,其從包含有文檔讀取裝置所讀取的多頁的圖像數(shù)據(jù)的各頁提取各表格區(qū)域圖像;生成單元,其從所述提取單元所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù);判斷單元,其基于所述生成單元所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性;確定單元,其基于所述判斷單元所判定的表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序;以及恢復(fù)單元,其通過基于所述確定單元所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。根據(jù)本發(fā)明的第二方面,所述判斷單元可以基于下列信息中的至少一項(xiàng)或多項(xiàng)的組合來判斷各表格之間的連接可能性,所述信息包括各表格的高度或?qū)挾?、各表格中包含的單元格的行?shù)和列數(shù)、各單元格的高度或?qū)挾?、各單元格的屬性、?gòu)成各表格的格線的粗細(xì)、或線型。根據(jù)本發(fā)明的第三方面,所述確定單元可以基于所述提取單元所提取的表格數(shù)目確定用于判斷連接可能性的表格組合。根據(jù)本發(fā)明的第四方面,所述圖像處理裝置還可以包括輸入單元,其輸入表示分割之前的原始表格如何沿行方向和列方向進(jìn)行分割的表格分割數(shù),所述確定單元基于與所述輸入單元所輸入的表格分割數(shù)有關(guān)的信息來確定用于判斷連接可能性的表格組合。根據(jù)本發(fā)明的第五方面,所述圖像處理裝置還可以包括輸入單元,其輸入與分割之前的原始表格被分割地打印時(shí)的打印順序有關(guān)的信息,所述確定單元基于所述輸入單元所輸入的與打印順序有關(guān)的信息來確定用于判斷連接可能性的表格組合。根據(jù)本發(fā)明的第六方面,所述圖像處理裝置還可以包括顯示單元,其顯示指示連接之后各表格在整個(gè)表格中的連接位置的信息,在顯示的連接位置輸入各表格之間的許可連接時(shí),所述恢復(fù)單元通過連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的信息。 根據(jù)本發(fā)明的第七方面,提供一種圖像處理方法,包括從包含有文檔讀取裝置所讀取的多頁的圖像數(shù)據(jù)的各頁提取各表格區(qū)域圖像;從所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù);基于所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性;基于所判定的表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序;以及通過基于所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。根據(jù)本發(fā)明的第一方面,即使單個(gè)表格被分割地打印成多頁,也能夠通過讀取所打印的多頁原稿來恢復(fù)原始表格作為電子文檔。根據(jù)本發(fā)明的第二方面,除了本發(fā)明第一方面所獲得的效果之外,可以提供一種能夠基于各表格的結(jié)構(gòu)判斷連接可能性的圖像處理裝置。根據(jù)本發(fā)明的第三方面,除了本發(fā)明第一方面或第二方面所獲得的效果之外,可以提供一種能夠限制用于判斷連接可能性的表格組合的圖像處理裝置。根據(jù)本發(fā)明的第四方面,除了本發(fā)明第一方面或第二方面所獲得的效果之外,可以提供一種能夠限制用于判斷連接可能性的表格組合的圖像處理裝置。根據(jù)本發(fā)明的第五方面,除了本發(fā)明第一方面或第二方面所獲得的效果之外,可以提供一種能夠限制用于判斷連接可能性的表格組合的圖像處理裝置。根據(jù)本發(fā)明的第六方面,除了本發(fā)明第一方面至第五方面中任一方面所獲得的效果之外,可以提供一種能夠避免在錯(cuò)誤判定狀態(tài)下恢復(fù)原始表格的圖像處理裝置。根據(jù)本發(fā)明的第七方面,即使單個(gè)表格被分割地打印成多頁,也能夠通過讀取所打印的多頁原稿來恢復(fù)原始表格作為電子文檔。
下面將基于下列附圖詳細(xì)描述本發(fā)明的示例性實(shí)施例圖I是示出根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置的構(gòu)造的示意圖;圖2是示出根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置的硬件構(gòu)造的框圖;圖3是示出根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置中的圖像處理裝置的功能構(gòu)造的框圖4A至圖4C是示出在大于打印用紙的表格被打印的情況下的打印狀態(tài)的示意圖;圖5A至圖是示出當(dāng)表格連接性判斷單元判斷兩個(gè)表格的連接可能性時(shí)的具體操作的示意圖;圖6A至圖6F是示出在打印順序?yàn)閺淖笾劣也⑶冶砀窨倲?shù)為12的情況下可能的表格連接狀態(tài)的不意圖;圖7A至圖7F是示出在打印順序?yàn)閺纳现料虏⑶冶砀窨倲?shù)為12的情況下可能的表格連接狀態(tài)的不意圖;圖8A和圖SB是示出基于表格分割數(shù)X/Y判斷用于判斷表格連接性的表格組合的 情況的不意圖;圖9A至圖9C是示出當(dāng)表格數(shù)據(jù)恢復(fù)單元基于各表格之間的連接可能性判斷通過連接各表格來恢復(fù)原始表格的連接順序時(shí)的操作的示意圖;圖10是示出使用顯示單元對表示連接之后各表格在整個(gè)表格中的連接位置的信息進(jìn)行顯示的示例性情況的示意圖;圖11是示出當(dāng)根據(jù)本發(fā)明示例性實(shí)施例的圖像處理裝置讀取具有多頁的文檔時(shí)的操作的流程圖;以及圖12是示出當(dāng)根據(jù)本發(fā)明示例性實(shí)施例將圖像處理裝置讀取的多頁表格恢復(fù)為單個(gè)表格時(shí)的操作的流程圖。
具體實(shí)施例方式下面將參照附圖詳細(xì)描述本發(fā)明的示例性實(shí)施例。圖I是示出根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置10的構(gòu)造的框圖。如圖I所示,根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置10包括網(wǎng)絡(luò)接口單元14、用戶界面單元15、掃描儀16、圖像輸出單元17、圖像處理裝置30以及控制器31。掃描儀16通過讀取放在托盤等中的文檔來獲取圖像數(shù)據(jù)。掃描儀16通過掃描文檔并對諸如電荷耦合器件(CCD)等元件所獲得的信號(hào)輸出執(zhí)行模數(shù)轉(zhuǎn)換(A/D)來獲取數(shù)字圖像數(shù)據(jù)。掃描儀16所讀取的圖像數(shù)據(jù)包括紅色、綠色和藍(lán)色(RGB)各色的顏色成分。圖像處理裝置30對掃描儀16所讀取的圖像數(shù)據(jù)執(zhí)行各種圖像處理。圖像輸出單元17在控制器31的控制下基于圖像處理裝置30執(zhí)行圖像處理之后的圖像數(shù)據(jù)打印圖像。網(wǎng)絡(luò)接口單元14經(jīng)由網(wǎng)絡(luò)發(fā)送圖像數(shù)據(jù)或者接收經(jīng)由網(wǎng)絡(luò)發(fā)送的圖像數(shù)據(jù)。用戶界面單元15接收來自用戶的指示并且將指示內(nèi)容發(fā)送給控制器31。控制器31對在圖像輸出單元17中基于經(jīng)由網(wǎng)絡(luò)接口單元14接收的圖像數(shù)據(jù)或者來自圖像處理裝置30的圖像數(shù)據(jù)執(zhí)行的打印操作執(zhí)行控制。另外,控制器31還執(zhí)行控制使得掃描儀16所獲得的圖像數(shù)據(jù)在圖像處理裝置30執(zhí)行圖像處理之后通過網(wǎng)絡(luò)接口單元14經(jīng)由網(wǎng)絡(luò)被發(fā)送至期望的目的地。另外,圖像形成裝置10是如下裝置,其是具有諸如打印功能、掃描功能、復(fù)印功能和傳真功能等多項(xiàng)功能的所謂多功能機(jī)。接下來,圖2示出根據(jù)本發(fā)明示例性實(shí)施例的圖像形成裝置10的硬件構(gòu)造。如圖2所示,圖像形成裝置10包括CPU 11、存儲(chǔ)器12、諸如硬盤驅(qū)動(dòng)器(HDD)等存儲(chǔ)裝置13、用于經(jīng)由網(wǎng)絡(luò)與外部裝置之間發(fā)送或接收數(shù)據(jù)的網(wǎng)絡(luò)接口單元14、包括觸摸屏或液晶顯示器和鍵盤的用戶界面單元15、掃描儀16以及圖像輸出單元17。這些元件經(jīng)由控制總線18彼此相連。CPU 11基于存儲(chǔ)在存儲(chǔ)器12或存儲(chǔ)裝置13中的控制程序執(zhí)行預(yù)定處理,并且控制圖像形成裝置10的操作。另外,盡管在本實(shí)施例中說明的是CPU 11讀取并執(zhí)行存儲(chǔ)在存儲(chǔ)器12或存儲(chǔ)裝置13中的控制程序的情況,但是相應(yīng)程序可以存儲(chǔ)在諸如CD-ROM等存儲(chǔ)介質(zhì)中并被提供給CPU 11。圖3是示出通過執(zhí)行上述控制程序?qū)崿F(xiàn)的圖像形成裝置10中的圖像處理裝置30的功能構(gòu)造的框圖。
如圖3所示,根據(jù)本發(fā)明示例性實(shí)施例的圖像處理裝置30包括圖像數(shù)據(jù)儲(chǔ)存單元41、表格區(qū)域提取單元42、表格結(jié)構(gòu)數(shù)據(jù)生成單元43、表格數(shù)據(jù)恢復(fù)單元44、表格連接性判斷單元45、輸入單元46、顯示單元47以及格式轉(zhuǎn)換單元48。圖像數(shù)據(jù)儲(chǔ)存單元41儲(chǔ)存作為文檔讀取裝置的掃描儀16所讀取的圖像數(shù)據(jù)。表格區(qū)域提取單元42從包含有掃描儀16所讀取并儲(chǔ)存在圖像數(shù)據(jù)儲(chǔ)存單元41中的多頁的圖像數(shù)據(jù)的每一頁提取表格區(qū)域圖像。例如,如果將打印圖4A所示的表格數(shù)據(jù)并且該表格數(shù)據(jù)不適合單頁打印用紙,則如圖4B所示將該表格數(shù)據(jù)分割并打印至多頁。在本示例性實(shí)施例中,通過如圖4C所示根據(jù)打印順序掃描文檔來讀取包含有以該方式分割并打印的多頁的文檔,作為圖像數(shù)據(jù)。表格區(qū)域提取單元42從這樣多頁的圖像數(shù)據(jù)中提取各表格區(qū)域。表格區(qū)域提取單元42使用對象分離處理作為表格區(qū)域提取處理。也就是說,表格區(qū)域提取單元42對掃描儀16所讀取的圖像數(shù)據(jù)執(zhí)行對象分離處理,并且針對包括表格圖像、CG圖像、圖片圖像、文字圖像和線條圖在內(nèi)的每一對象分離圖像數(shù)據(jù)。表格結(jié)構(gòu)數(shù)據(jù)生成單元43從表格區(qū)域提取單元42所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù)。具體地說,表格結(jié)構(gòu)數(shù)據(jù)生成單元43對表格區(qū)域提取單元42所分離出的表格對象執(zhí)行布局分析,并且通過對文字對象執(zhí)行文字識(shí)別處理(光學(xué)文字識(shí)別(OCR)處理)來獲得表格結(jié)構(gòu)數(shù)據(jù)。表格連接性判斷單元45基于表格結(jié)構(gòu)數(shù)據(jù)生成單元43所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性。具體地說,表格連接性判斷單元45基于下列信息中的至少一項(xiàng)或多項(xiàng)的組合來判斷各表格之間的連接可能性,所述信息包括各表格的高度或?qū)挾?、各表格中包含的單元格的行?shù)和列數(shù)、各單元格的高度或?qū)挾取⒏鲉卧竦膶傩?、?gòu)成各表格的格線的粗細(xì)、或線型。圖5A示出比較兩個(gè)表格的高度來判斷連接可能性的情況。另外,圖5B示出比較兩個(gè)表格的Y方向上的單元格數(shù)目來判斷連接可能性的情況。圖5C示出比較兩個(gè)表格的各單元格的高度來判斷連接可能性的情況。圖示出比較兩個(gè)表格的單元格的背景色、上方格線粗細(xì)和下方格線粗細(xì)來判斷連接可能性的情況。例如,表格連接性判斷單元45可以為圖5A至圖所示的各比較項(xiàng)目預(yù)先設(shè)定值,對匹配項(xiàng)目的值做加法,并且以百分比)顯示結(jié)果作為被比較表格之間的連接可能性。另外,表格連接性判斷單元45可以通過組合全部表格來判斷左、右、上、下四個(gè)方向的連接可能性。如果保證以打印順序掃描各頁,并且判斷某一表格與之后讀取的表格之間的連接可能性,則可以只判斷右方或下方的連接可能性。另外,表格連接性判斷單元45可以不對全部的表格組合判斷連接可能性,而是基于表格區(qū)域提取單元42所提取的表格數(shù)目確定用于判斷連接可能性的表格組合。例如,假定提取表格數(shù)目為12,并且如打印的那樣讀取表格,則可以確定如圖6A至圖6F或圖7A至圖7F所示的連接順序中的任一種成立。輸入單元46通過用戶界面單元15輸入表示分割之前的原始表格如何沿行方向和列方向進(jìn)行分割的表格分割數(shù)X/Y、或與分割之前的原始表格被分割地打印時(shí)的打印順序有關(guān)的彳目息。表格連接性判斷單元45可以基于輸入單元46所輸入的與打印順序有關(guān)的信息來確定用于判斷連接可能性的表格組合。
如果指定了表格數(shù)據(jù)被分割地打印時(shí)的打印順序以及提取表格數(shù)目,則表格連接性判斷單元45可以基于表格數(shù)目和打印順序來限制用于判斷連接可能性的表格組合。例如,如果打印順序是從左至右并且表格總數(shù)為12,則確定只有如圖6A至圖6F中的任一種連接狀態(tài)。如果打印順序是從上至下并且表格總數(shù)為12,則確定只有如圖7A至圖7F中的任一種連接狀態(tài)成立。表格連接性判斷單元45可以基于輸入單元46所輸入的與表格分割數(shù)X/Y有關(guān)的信息來確定用于判斷連接可能性的表格組合。表格分割數(shù)X/Y包括與X方向分割數(shù)DIVx有關(guān)的信息和與Y方向分割數(shù)DIVy有關(guān)的信息,表原始表格在X方向和Y方向上分別被分割成多少部分。例如,下面參照圖8A和圖8B說明X方向分割數(shù)DIVx被設(shè)定為4而Y方向分割數(shù)DIVy被設(shè)定為3的情況。在該情況下,如果打印方向是從上至下,則判斷某一頁(第η頁)中右方的連接性所需的頁是n+DIVy,判斷下方的連接性所需的頁是η+1。另外,存在如下條件n+DIVy和η+1都不超過總頁數(shù)(這里,設(shè)定為12)。例如,可以認(rèn)識(shí)到,判斷第8頁的表格中右方的連接性所需的頁是第11( = 8+3)頁的表格,判斷下方的連接性所需的頁是第9( = 8+1)頁的表格。另外,如果打印方向是從左至右下,圖8B所示,則判斷某一頁(第η頁)中右方的連接性所需的頁是η+1,判斷下方的連接性所需的頁是n+DIVx。這里,存在如下條件η+1和n+DIVx都不超過總頁數(shù)(這里,設(shè)定為12)。例如,判斷第7頁的表格中右方的連接性所需的頁是第8( = 7+1)頁的表格,判斷下方的連接性所需的頁是第11( = 7+4)頁的表格。表格數(shù)據(jù)恢復(fù)單元44基于表格連接性判斷單元45所判定的各表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序。表格數(shù)據(jù)恢復(fù)單元44通過基于所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。例如,如果從第一頁文檔提取的表格與從第二頁文檔提取的表格之間在水平方向和豎直方向上的連接可能性分別為11%和92%,如圖9A所示,則表格數(shù)據(jù)恢復(fù)單元44確定連接順序使得第二頁表格連接至第一頁表格的下方。如果從第二頁文檔提取的表格與從第三頁文檔提取的表格之間在豎直方向上的連接可能性為92%,從第一頁文檔提取的表格與從第三頁文檔提取的表格之間在水平方向上的連接可能性為8%,則表格數(shù)據(jù)恢復(fù)單元44確定連接順序使得第三頁表格連接至第二頁表格的下方。如果從第三頁文檔提取的表格與從第四頁文檔提取的表格之間在豎直方向上的連接可能性為8%,從第一頁文檔提取的表格與從第四頁文檔提取的表格之間在水平方向上的連接可能性為96%,則表格數(shù)據(jù)恢復(fù)單元44確定連接順序使得第四頁表格連接至第一頁表格的右側(cè)。以該方式,表格數(shù)據(jù)恢復(fù)單兀44依次確定各頁上表格的連接順序。 顯示單元47通過用戶界面單元15顯示指示連接之后各表格在整個(gè)表格中的連接 位置的信息。例如,顯示單元47向用戶顯示圖10所示的內(nèi)容。表格數(shù)據(jù)恢復(fù)單元44可以構(gòu)造成,在顯示的連接位置輸入表格之間的許可連接時(shí),通過連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。信息轉(zhuǎn)換單元48將表格數(shù)據(jù)恢復(fù)單元44所恢復(fù)的與表格有關(guān)的數(shù)據(jù)轉(zhuǎn)換為與諸如Excel (注冊商標(biāo))等通用格式的表格有關(guān)的數(shù)據(jù),并且將該數(shù)據(jù)經(jīng)由網(wǎng)絡(luò)接口單元14發(fā)送至指定為目的地的服務(wù)器或終端。接下來參照附圖詳細(xì)說明使用根據(jù)示例性實(shí)施例的圖像處理裝置30通過從包含多頁的文檔讀取與表格有關(guān)的數(shù)據(jù)來復(fù)現(xiàn)與單個(gè)表格有關(guān)的數(shù)據(jù)時(shí)的操作。圖11是示出當(dāng)根據(jù)本發(fā)明示例性實(shí)施例的圖像處理裝置30讀取包含多頁的文檔時(shí)的操作的流程圖。首先,通過將單個(gè)表格分割為多頁而打印的文檔圖像被掃描儀16讀取,并儲(chǔ)存在圖像數(shù)據(jù)儲(chǔ)存單元41中(步驟S101)。頁數(shù)(P)增加I (步驟S102),表格區(qū)域提取單元42從該圖像數(shù)據(jù)提取表格區(qū)域(步驟S103),表格結(jié)構(gòu)數(shù)據(jù)生成單元43分析表格結(jié)構(gòu)(步驟S104)。如果還有文檔要讀取(步驟S105中為“是”),則重復(fù)步驟SlOl至S104的處理從而讀取全部頁的表格圖像。圖12是示出當(dāng)根據(jù)本發(fā)明示例性實(shí)施例將圖像處理裝置30讀取的多頁表格恢復(fù)為與單個(gè)表格有關(guān)的數(shù)據(jù)時(shí)的操作的流程圖。如果讀取了包含多頁的文檔并且從每頁獲取了表格結(jié)構(gòu)數(shù)據(jù),首先將X設(shè)定為I作為初始值(步驟S201)。表格連接性判斷單元45提取X頁的表格結(jié)構(gòu)數(shù)據(jù)(步驟S202)。也就是說,這里提取第一頁的表格結(jié)構(gòu)數(shù)據(jù)。將表示被比較頁的值Y設(shè)定為X+1 (步驟S203)。也就是說,這里將Y的初始值設(shè)定為I。然后,表格連接性判斷單元45提取Y頁的表格結(jié)構(gòu)數(shù)據(jù),即第二頁的表格結(jié)構(gòu)數(shù)據(jù)(步驟 S204)。表格連接性判斷單元45判斷第X表格與第Y表格之間的連接可能性,即第一頁的提取表格與第二頁的提取表格(步驟S205)。這里,表格連接性判斷單元45可以判斷第一頁的表格與第二頁的表格之間在左、右、上、下四個(gè)方向上的連接可能性。如果以打印順序進(jìn)行讀取,則可以只對第一頁的右方和下方的連接可能性進(jìn)行判斷。表格連接性判斷單元45更新X頁,即第一頁的表格的連接信息(步驟S206),并且使Y的值增加1(步驟S207)。如果Y的值不等于總頁數(shù)P (步驟S208中為“否”),則表格連接性判斷單元45重復(fù)步驟S204至S207的處理。也就是說,依次確定第一頁的表格與第三至P頁的表格之間的連接可能性。如果Y的值等于總頁數(shù)P (步驟S208中為“是”),則表格連接性判斷單元45使X的值增加I (步驟S209)。如果X的值不等于總頁數(shù)P (步驟S210中為“否”),則表格連接性判斷單元45重復(fù)步驟S201至S208的處理。也就是說,表格連接性判斷單元45依次確定第二頁的表格與第三至P頁的表格之間的連接可能性、第三頁的表格與第四至P頁的表格之間的連接可能性、…、第P-I頁的表格與第P頁的表格之間的連接可能性。如果X的值等于總頁數(shù)P (步驟S210中為“是”),則對全部頁的連接可能性的判斷結(jié)束,表格數(shù)據(jù)恢復(fù)單元44基于表格連接性判斷單元45所判定的各表格之間的連接可能性來確定用于指明如何連接各表格的連接順序(步驟S211)。另外,表格數(shù)據(jù)恢復(fù)單元44通過基于所確定的連接順序連接各表格來恢復(fù)分割之前的單個(gè)原始表格(步驟S212)。盡管如圖12的流程圖所示在確定連接順序的處理中對全部組合確定了表格之間的連接可能性,但是可以基于總頁數(shù)、表格分割數(shù)X/Y、打印順序等限制用于判斷連接可能性的表格組合。出于示例和說明的目的提供了本發(fā)明的示例性實(shí)施例的上述說明。其意圖不在于窮舉或?qū)⒈景l(fā)明限制為所公開的確切形式。顯然,對于本領(lǐng)域的技術(shù)人員而言許多修改和變型是顯而易見的。選擇和說明實(shí)施例是為了最佳地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,從 而使得本領(lǐng)域的其他人員能夠理解各種實(shí)施例的發(fā)明和適合于特定預(yù)期應(yīng)用的各種修改。其目的在于用所附權(quán)利要求書及其等同內(nèi)容來限定本發(fā)明的范圍。
權(quán)利要求
1.一種圖像處理裝置,包括 提取單元,其從包含有文檔讀取裝置所讀取的多頁的圖像數(shù)據(jù)的各頁提取各表格區(qū)域圖像; 生成單元,其從所述提取單元所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù);判斷單元,其基于所述生成單元所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性; 確定單元,其基于所述判斷單元所判定的表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序;以及 恢復(fù)單元,其通過基于所述確定單元所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。
2.根據(jù)權(quán)利要求I所述的圖像處理裝置,其中, 所述判斷單元基于下列信息中的至少一項(xiàng)或多項(xiàng)的組合來判斷各表格之間的連接可能性,所述信息包括各表格的高度或?qū)挾取⒏鞅砀裰邪膯卧竦男袛?shù)和列數(shù)、各單元格的高度或?qū)挾?、各單元格的屬性、?gòu)成各表格的格線的粗細(xì)、或線型。
3.根據(jù)權(quán)利要求I或2所述的圖像處理裝置,其中, 所述確定單元基于所述提取單元所提取的表格數(shù)目確定用于判斷連接可能性的表格組合。
4.根據(jù)權(quán)利要求I或2所述的圖像處理裝置,還包括 輸入單兀,其輸入表不分割之前的原始表格如何沿行方向和列方向進(jìn)行分割的表格分割數(shù), 所述確定單元基于與所述輸入單元所輸入的表格分割數(shù)有關(guān)的信息來確定用于判斷連接可能性的表格組合。
5.根據(jù)權(quán)利要求I或2所述的圖像處理裝置,還包括 輸入單元,其輸入與分割之前的原始表格被分割地打印時(shí)的打印順序有關(guān)的信息,所述確定單元基于所述輸入單元所輸入的與打印順序有關(guān)的信息來確定用于判斷連接可能性的表格組合。
6.根據(jù)權(quán)利要求I或2所述的圖像處理裝置,還包括 顯示單元,其顯示指示連接之后各表格在整個(gè)表格中的連接位置的信息, 在顯示的連接位置輸入各表格之間的許可連接時(shí),所述恢復(fù)單元通過連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的信息。
7.一種圖像處理方法,包括 從包含有文檔讀取裝置所讀取的多頁的圖像數(shù)據(jù)的各頁提取各表格區(qū)域圖像; 從所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù); 基于所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性; 基于所判定的表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序;以及 通過基于所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。
全文摘要
本發(fā)明公開一種圖像處理裝置和圖像處理方法。所述圖像處理裝置包括提取單元,其從包含有文檔讀取裝置所讀取的多頁的圖像數(shù)據(jù)的各頁提取各表格區(qū)域圖像;生成單元,其從所述提取單元所提取的各表格區(qū)域圖像生成表格的各表格結(jié)構(gòu)數(shù)據(jù);判斷單元,其基于所述生成單元所生成的各頁的表格的表格結(jié)構(gòu)數(shù)據(jù)判斷各表格之間的連接可能性;確定單元,其基于所述判斷單元所判定的表格之間的連接可能性來確定用于通過連接各表格恢復(fù)原始表格的連接順序;以及恢復(fù)單元,其通過基于所述確定單元所確定的連接順序連接各表格來恢復(fù)與分割之前的單個(gè)表格有關(guān)的數(shù)據(jù)。
文檔編號(hào)H04N1/00GK102883085SQ201210061280
公開日2013年1月16日 申請日期2012年3月9日 優(yōu)先權(quán)日2011年7月12日
發(fā)明者清水淳一, 山田俊之, 土淵清隆, 新名博, 脅山徹也 申請人:富士施樂株式會(huì)社