亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

圖像處理設(shè)備和圖像處理方法

文檔序號:6440740閱讀:154來源:國知局
專利名稱:圖像處理設(shè)備和圖像處理方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種圖像處理設(shè)備和一種圖像處理方法。
背景技術(shù)
例如,日本特開專利申請公報No. 2003-288334公開了一種表格讀取設(shè)備,該表格讀取設(shè)備通過將具有多頁的打印文檔中所包括的浮動元素(如圖形和表格)設(shè)置在適當(dāng)位置而生成結(jié)構(gòu)化文檔,例如可擴展標(biāo)記語言(XML)文檔或超文本標(biāo)記語言(HTML)文檔。例如,日本特開專利申請公報No. 5-342408公開了一種文件圖像歸檔設(shè)備,該文件圖像歸檔設(shè)備基于每種屬性(文本、照片或圖形)將輸入文件圖像的每個區(qū)域歸檔以便將原始屬性分配給該區(qū)域。 例如,日本特開專利申請公報No. 2002-073598公開了一種文件處理設(shè)備,該文件處理設(shè)備從數(shù)字化文檔提取諸如“文本”、“圖片”和“表格”之類的內(nèi)容(組成部分)并以一體的方式處理所提取的內(nèi)容或再利用所提取的內(nèi)容。例如,日本特開專利申請公報No. 9-128480公開了一種圖案提取設(shè)備,該圖案提取設(shè)備提取一定范圍的圖案,例如字符、圖形或記號,即使構(gòu)成指示圖案范圍的框架的線條不清晰。例如,日本特開專利申請公報No. 8-044827公開了一種數(shù)字復(fù)印機,該數(shù)字復(fù)印機允許用戶再利用已基于類型分開的文檔區(qū)域。例如,日本特開專利申請公報No. 2005-128925公開了一種文檔編輯系統(tǒng),該文檔編輯系統(tǒng)通過再利用現(xiàn)有文檔的良好設(shè)計、內(nèi)容等而生成新文檔。

發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種圖像處理設(shè)備和一種圖像處理方法,該圖像處理設(shè)備和圖像處理方法用于當(dāng)原始電子文檔中的表格被分割并打印在多張紙質(zhì)文檔上時,從這些多張紙質(zhì)文檔重新生成電子文檔,使得重新生成的電子文檔中的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。根據(jù)本發(fā)明的第一方面,提供一種圖像處理設(shè)備,該圖像處理設(shè)備包括標(biāo)題取得部、表格連接判定部和表格連接部。標(biāo)題取得部從具有多行和多列并被包括在以預(yù)定次序排列的多片圖像數(shù)據(jù)中的每一片內(nèi)的表格取得標(biāo)題。該標(biāo)題指示表格中設(shè)定在表格的行和列上或表格的行和列中的一者上的項目。表格連接判定部判定已從多片圖像數(shù)據(jù)內(nèi)所包括的表格取得的標(biāo)題是否互相匹配。表格連接判定部還判定以預(yù)定次序彼此相鄰并具有匹配的標(biāo)題的表格作為要連接的一組表格。表格連接部從除了第一表格以外的一個或多個第二表格中的每一個刪除標(biāo)題,并且按預(yù)定次序?qū)⒌谝槐砀窈鸵褟拿恳粋€中刪除標(biāo)題的一個或多個第二表格彼此連接。第一表格被包括在以預(yù)定次序判定的一組表格的多片圖像數(shù)據(jù)的第一片圖像數(shù)據(jù)內(nèi)。根據(jù)本發(fā)明的第二方面,在根據(jù)第一方面的圖像處理設(shè)備中,標(biāo)題位于多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的末行上。表格連接部按預(yù)定次序沿從表格到表格向下的方向?qū)⒌谝槐砀窈鸵褟拿恳粋€中刪除包括標(biāo)題的末行的一個或多個第二表格彼此連接。根據(jù)本發(fā)明的第三方面,在根據(jù)第二方面的圖像處理設(shè)備中,末行包括表格的第一行。根據(jù)本發(fā)明的第四方面,在根據(jù)第一方面的圖像處理設(shè)備中,標(biāo)題位于多片數(shù)據(jù)中的每一片內(nèi)所包括的表格的末列上。表格連接部按預(yù)定次序沿從表格到表格向右的方向?qū)⒌谝槐砀窈鸵褟拿恳粋€中刪除包括標(biāo)題的末列的一個或更多個第二表格彼此連接。根據(jù)本發(fā)明的第五方面,在根據(jù)第四方面的圖像處理設(shè)備中,末列包括表格的最左列。
根據(jù)本發(fā)明的第六方面,在根據(jù)第一方面至第五方面中的任何一方面的圖像處理設(shè)備中,當(dāng)包括相鄰表格的多片圖像數(shù)據(jù)還包括非表格組件并且非表格組件位于相鄰表格之間時,表格連接判定部判定不要連接相鄰的表格。根據(jù)本發(fā)明的第七方面,在根據(jù)第一方面至第六方面中的任何一方面的圖像處理設(shè)備中,通過讀取紙質(zhì)文檔的圖像而從紙質(zhì)文檔生成多片圖像數(shù)據(jù)。根據(jù)本發(fā)明的第八方面,在根據(jù)第七方面的圖像處理設(shè)備中,所述預(yù)定次序包括讀取紙質(zhì)文檔的次序。根據(jù)本發(fā)明的第九方面,在根據(jù)第一方面至第七方面中的任何一方面的圖像處理設(shè)備中,多片圖像數(shù)據(jù)中的每一片都包括識別排列次序的次序信息。預(yù)定次序表示通過次序信息指定的次序。根據(jù)本發(fā)明的第十方面,提供一種圖像處理方法,該圖像處理方法包括從具有多行和多列的表格取得標(biāo)題,該表格被包括在以預(yù)定次序排列的多片圖像數(shù)據(jù)中的每一片內(nèi),該標(biāo)題指示表格中的項目,這些項目被設(shè)定在表格的行和列上或表格的行和列中的一者上;判定已從多片圖像數(shù)據(jù)內(nèi)所包括的表格取得的標(biāo)題是否互相匹配,并判定以預(yù)定次序彼此相鄰并具有匹配的標(biāo)題的表格作為要連接的一組表格;以及從除了第一表格以外的一個或多個第二表格中的每一個刪除標(biāo)題,并且按預(yù)定次序?qū)⒌谝槐砀窈鸵褟拿恳粋€中刪除標(biāo)題的一個或多個第二表格彼此連接,第一表格被包括在以預(yù)定次序確定的一組表格的多片圖像數(shù)據(jù)中的第一片圖像數(shù)據(jù)內(nèi)。根據(jù)本發(fā)明的第一方面,可提供一種圖像處理設(shè)備,該圖像處理設(shè)備從通過分割原始電子文檔中所包括的附有標(biāo)題的表格而獲得的多片圖像數(shù)據(jù)重新生成電子文檔,使得重新生成的電子文檔中的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。根據(jù)本發(fā)明的第二方面,除本發(fā)明的第一方面所提供的優(yōu)點外,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備基于多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的標(biāo)題行而識別要沿豎直方向連接的表格而不提示用戶指定要連接的表格。根據(jù)本發(fā)明的第三方面,除本發(fā)明的第二方面所提供的優(yōu)點外,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備基于多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的標(biāo)題行而識別要沿豎直方向連接的表格而不提示用戶指定要連接的表格。根據(jù)本發(fā)明的第四方面,除本發(fā)明的第一方面所提供的優(yōu)點外,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備基于多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的標(biāo)題列而識別要沿水平方向連接的表格而不提示用戶指定要連接的表格。
根據(jù)本發(fā)明的第五方面,除本發(fā)明的第四方面所提供的優(yōu)點外,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備基于多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的標(biāo)題列而識別要沿水平方向連接的表格而不提示用戶指定要連接的表格。根據(jù)本發(fā)明的第六方面,除第一方面至第五方面中的任何一方面所提供的優(yōu)點夕卜,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備考慮多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的非表格組件而更精確地識別要連接的表格。根據(jù)本發(fā)明的第七方面,除第一方面至第六方面中的任何一方面所提供的優(yōu)點夕卜,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備從打印原始電子文檔中所包括的表格而獲得的輸出紙質(zhì)文檔重新生成電子文檔,使得重新生成的電子文檔中的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。根據(jù)本發(fā)明的第八方面,除本發(fā)明的第七方面所提供的優(yōu)點外,可提供這樣的圖 像處理設(shè)備,即,該圖像處理設(shè)備更容易辨識分割原始電子文檔中的表格的次序,并且更精確地重新生成電子文檔。 根據(jù)本發(fā)明的第九方面,除本發(fā)明的第一方面至第七方面中的任何一方面所提供的優(yōu)點外,可提供這樣的圖像處理設(shè)備,即,該圖像處理設(shè)備更容易辨識分割原始電子文檔中的表格的次序,并且更精確地重新生成電子文檔。根據(jù)本發(fā)明的第十方面,可提供一種圖像處理方法,該圖像處理方法從通過分割原始電子文檔中所包括的附有標(biāo)題的表格而獲得的多片圖像數(shù)據(jù)重新生成電子文檔,使得重新生成的電子文檔中的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。


將基于以下附圖詳細描述本發(fā)明的示例性實施例,其中圖IA是示出包括文本、表格、計算機圖形(CG)和照片的電子文檔的圖表;圖IB是示出通過打印圖IA所示的電子文檔而獲得的輸出紙質(zhì)文檔的圖表;圖2A是示出諸如圖IA所示的電子文檔中的表格部分的圖表;圖2B是示出通過打印圖IA所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表;圖2C是示出通過根據(jù)現(xiàn)有技術(shù)的圖像處理設(shè)備從圖2B所示的多張紙質(zhì)文檔重新生成的電子文檔的圖表;圖3A是示出電子文檔中的表格部分的圖表;圖3B是示出通過打印圖3A所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表;圖3C是示出通過根據(jù)本發(fā)明的第一示例性實施例的圖像處理設(shè)備從圖3B所示的多張紙質(zhì)文檔重新生成的電子文檔的圖表;圖4是示出根據(jù)一個示例性實施例的圖像處理設(shè)備的硬件構(gòu)造的圖表;圖5是示出在圖4所示的圖像處理設(shè)備中執(zhí)行的第一電子文檔生成程序的構(gòu)造的圖表;圖6是示出圖5所示的第一電子文檔生成程序的第一表格描繪處理單元的構(gòu)造的圖表;圖7是不出由圖6所不的第一表格信息存儲部存儲的第一表格信息表的圖表;圖8是示出由圖6所示的第一表格連接判定部執(zhí)行的用于判定是否沿豎直方向連接表格對象的表格連接判定處理的流程圖;圖9是示出由圖6所示的第一表格連接判定部執(zhí)行的用于判定是否沿水平方向連接表格對象的表格連接判定處理的流程圖;圖IOA是示出電子文檔中的附有標(biāo)題的表格部分的圖表;圖IOB是示出通過打印附有標(biāo)題的圖IOA所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表;圖IOC是示出通過根據(jù)現(xiàn)有技術(shù)的圖像處理設(shè)備從圖IOB所示的多張紙質(zhì)文檔重新生成的電子文檔的圖表;圖IlA是示出通過打印電子文檔中附有標(biāo)題的表格部分而獲得多張輸出紙質(zhì)文
檔的圖表;圖IlB是示出在重新生成電子文檔之前從其中刪除了標(biāo)題行的表格的圖表;圖IlC是示出通過根據(jù)本發(fā)明的第二示例性實施例的圖像處理設(shè)備重新生成的電子文檔的圖表;圖12是示出替換圖5所示的第一電子文檔生成程序的第一表格描繪處理單元的第二電子文檔生成程序的第二表格描繪處理單元的構(gòu)造的圖表;圖13是示出由圖12所示的第二表格信息存儲部存儲的第二表格信息表的圖表;圖14是示出由圖12所示的第二表格連接判定部執(zhí)行的用于判定是否連接表格對象的表格連接判定處理的流程圖;圖15是示出由圖12所示的第二表格連接部執(zhí)行的用于連接表格對象的表格連接處理的流程圖;以及圖16是示出替換圖5所示的第一電子文檔生成程序的第一表格描繪處理單元的第三電子文檔生成程序的第三表格描繪處理單元的構(gòu)造的圖表。
具體實施例方式在描述示例性實施例以前,下面將描述與為何作出示例性實施例有關(guān)的細節(jié)以便幫助理解示例性實施例。圖IA是示出包括文本、表格(例如,具有多行和多列)、計算機圖形(CG)和照片的電子文檔的圖表。圖IB是示出通過打印圖IA所示的電子文檔而獲得的輸出紙質(zhì)文檔的圖表。例如,當(dāng)諸如圖IA所示的電子文檔不能裝入一張打印紙時,打印裝置按打印紙的尺寸分割該電子文檔,將分割后的電子子文檔打印在多張紙質(zhì)文檔上,并輸出如圖IB所示的多張紙質(zhì)文檔。圖像處理設(shè)備從紙質(zhì)文檔的圖像數(shù)據(jù)重新生成電子文檔,通過與該圖像處理設(shè)備連接的圖像讀取裝置等讀取該紙質(zhì)文檔。圖2A是示出諸如圖IA所示的電子文檔中所包括的表格部分的圖表。圖2B是示出通過打印圖2A所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表。圖2C是示出通過圖像處理設(shè)備從圖2B所示的多張紙質(zhì)文檔重新生成的電子文檔。當(dāng)使用前述打印裝置和前述圖像處理設(shè)備時,諸如圖2A所示的電子文檔中的表格部分被分割并打印到如圖2B所示的多張紙質(zhì)文檔上。圖像處理設(shè)備通過將打印在多張紙質(zhì)文檔上的表格處理為如圖2C所示的獨立表格而重新生成電子文檔。由于重新生成的電子文檔(圖2C)不同于原始電子文檔(圖2A),所以用戶必須以某種方式重構(gòu)重新生成的電子文檔以使重新生成的電子文檔與原始電子文檔相同。圖3A是示出電子文檔中所包括的表格部分的圖表。圖3B是示出通過打印圖3A所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表。圖3C是示出通過下面將描述的根據(jù)本發(fā)明示例性實施例的圖像處理設(shè)備I從圖3B所示的多張紙質(zhì)文檔重新生成的電子文檔的圖表??紤]前述的情況提出下面要描述的根據(jù)本發(fā)明示例性實施例的圖像處理設(shè)備I。當(dāng)電子文檔中所包括的表格部分(圖3A)被分割并打印在多張紙質(zhì)文檔(圖3B)上時,圖像處理設(shè)備I從這些多張紙質(zhì)文檔重新生成電子文檔(圖3C)使得重新生成的電子文檔中的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。
第一不例性實施例下面將描述本發(fā)明的第一示例性實施例。圖4是示出圖像處理設(shè)備I的硬件構(gòu)造的圖表。如圖4所示,圖像處理設(shè)備I包括控制裝置100、圖像讀取裝置106、輸入/輸出裝置108、打印裝置110、通信裝置112和記錄裝置114??刂蒲b置100包括中央處理單元(CPU) 102和存儲器104。圖像讀取裝置106讀取紙質(zhì)文檔上的圖像以生成圖像數(shù)據(jù)。輸入/輸出裝置108包括鍵盤、觸摸屏和顯示器。打印裝置110打印電子文檔并輸出打印后的文檔。通信裝置112執(zhí)行與其它裝置的數(shù)據(jù)通信。諸如壓縮光盤(CD)驅(qū)動器或硬盤驅(qū)動器(HDD)之類的記錄裝置114將數(shù)據(jù)記錄在存儲媒體116上并從存儲媒體116復(fù)制數(shù)據(jù)。在下面的各圖中,由類似的附圖標(biāo)記表示大致相同的組件和處理步驟。圖像處理設(shè)備I經(jīng)由圖像讀取裝置106、存儲媒體116等接收通過打印電子文檔而獲得的紙質(zhì)文檔的圖像數(shù)據(jù)。圖像處理設(shè)備I處理收到的圖像數(shù)據(jù)以重新生成電子文檔(后文將參考圖5和6描述該電子文檔)。圖像處理設(shè)備I將重新生成的電子文檔輸出到打印裝置110和通信裝置112。圖5是示出在圖像處理設(shè)備I (圖4)中執(zhí)行的第一電子文檔生成程序20的構(gòu)造的圖表。如圖5所示,電子文檔生成程序20包括聯(lián)合照片專家組(JPEG)解碼單元200、預(yù)處理單元202、對象分離單元204、CG描繪處理單元206、照片描繪處理單元208、文本描繪處理單元210、光學(xué)字符辨識(OCR)單元212、框格線(ruled-line)修正處理單元214、第一表格描繪處理單元30、描繪數(shù)據(jù)合并單元218和電子文檔生成單元220。電子文檔生成程序20經(jīng)由例如存儲媒體116 (圖4)載入圖像處理設(shè)備I的存儲器104并在操作系統(tǒng)(OS)(未示出)上執(zhí)行,該操作系統(tǒng)使用圖像處理設(shè)備I的硬件資源在圖像處理設(shè)備I中運行。電子文檔生成程序20重新生成具有構(gòu)成紙質(zhì)文檔的圖像數(shù)據(jù)的要素(例如文本、表格、CG和照片)的屬性的電子文檔,該紙質(zhì)文檔已經(jīng)經(jīng)由圖像讀取裝置106和存儲媒體116(圖4)接收并通過打印電子文檔而獲得。JPEG解碼單元200將已經(jīng)經(jīng)由圖像讀取裝置106、存儲媒體116 (圖4)等接收的壓縮圖像數(shù)據(jù)解碼到未壓縮的圖像數(shù)據(jù)中并將得到的數(shù)據(jù)輸出到預(yù)處理單元202。
預(yù)處理單元202在對象分離單元204執(zhí)行處理之前對從JPEG解碼單元200輸入的圖像數(shù)據(jù)執(zhí)行預(yù)處理。然后,預(yù)處理單元202將預(yù)處理后的圖像數(shù)據(jù)輸出到對象分離單元 204。更具體地說,預(yù)處理單元202對輸入的圖像數(shù)據(jù)執(zhí)行降噪和過濾處理,使得圖像數(shù)據(jù)更容易分離為諸如文本、表格、CG和照片之類的要素(對象)。同時,圖像數(shù)據(jù)的每個要素以下將被稱為“文本對象”、“表格對象”、“CG對象”和“照片對象”等。對象分離單元204從預(yù)處理單元202輸入的圖像數(shù)據(jù)中分離出各個對象。對象分離單元204將已分離的CG對象、照片對象、文本對象和表格對象分別輸出到CG描繪處理單元206、照片描繪處理單元208、文本描繪處理單元210和框格線修正處理單元214。
CG描繪處理單元206生成用于根據(jù)從對象分離單元204輸入的CG對象生成電子 文檔的CG描繪數(shù)據(jù)(例如,矢量描繪數(shù)據(jù))并將生成的描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單元218。照片描繪處理單元208生成用于根據(jù)從對象分離單元204輸入的照片對象生成電子文檔的照片描繪數(shù)據(jù)(例如,圖像數(shù)據(jù))并將生成的描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單元218。 文本描繪處理單元210生成用于根據(jù)從對象分離單元204輸入的文本對象生成電子文檔的文本描繪數(shù)據(jù)(例如,文本數(shù)據(jù)及其字體數(shù)據(jù))并將生成的描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單元218和OCR單元212。OCR單元212對從文本描繪處理單元210輸入的描繪數(shù)據(jù)執(zhí)行OCR處理,以識別文本和該本文在圖像數(shù)據(jù)內(nèi)的位置。OCR單元212還將識別出的文本和位置作為文本數(shù)據(jù)輸出到第一表格描繪處理單元30和電子文檔生成單元220??蚋窬€修正處理單元214對從對象分離單元204輸入的表格對象的不清晰或傾斜的框格線執(zhí)行修正處理并將修正結(jié)果輸出到第一表格描繪處理單兀30。第一表格描繪處理單兀30生成用于基于從OCR單兀212輸入的文本數(shù)據(jù)和從框格線修正處理單元214 (將參考圖6等進行詳細描述)輸入的修正框格線后的表格對象來生成電子文檔的表格描繪數(shù)據(jù)(例如,表格格式數(shù)據(jù))。第一表格描繪處理單兀30還將生成的表格描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單兀218、打印裝置110和通信裝置112 (圖4)中的至少一者。描繪數(shù)據(jù)合并單元218將從CG描繪處理單元206、照片描繪處理單元208、文本描繪處理單元210和第一表格描繪處理單元30輸入的多片描繪數(shù)據(jù)彼此結(jié)合并將得到的描繪數(shù)據(jù)輸出到電子文檔生成單元220。電子文檔生成單元220在從描繪數(shù)據(jù)合并單元218輸入的結(jié)合的描繪數(shù)據(jù)的位置與通過圖像讀取裝置106 (圖4)讀取的圖像數(shù)據(jù)的位置相同的位置嵌入從OCR單元212輸入的文本數(shù)據(jù),以生成電子文檔。然后,電子文檔生成單元220將得到的電子文檔輸出到打印裝置110、通信裝置112 (圖4)等。圖6是示出圖5所示的第一電子文檔生成程序20的第一表格描繪處理單元30的構(gòu)造的圖表。
如圖6所不,表格描繪處理單兀30包括第一表格信息存儲部300、第一控制器302、第一文本數(shù)據(jù)存儲部304、第一表格掃描部306、表格結(jié)構(gòu)取得部308、第一表格連接判定部310、第一表格連接部312和表格描繪部314。表格描繪處理單元30從多張紙質(zhì)文檔生成表格描繪數(shù)據(jù),原始電子文檔中的表格部分被分割成多張紙質(zhì)文檔并打印在多張紙質(zhì)文檔中,使得生成的表格描繪數(shù)據(jù)的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。圖7是示出由表格信息存儲部300存儲的第一表格信息表的圖表。表格信息存儲部300存儲第一表格信息表,該第一表格信息表由圖6所的每個組件通過控制器302更新和調(diào)用。第一表格信息表顯不與原始電子文檔中所包括的分割后的表格對象有關(guān)的多片表格信息的列表。如圖7所不,表格信息的不例包括唯一識別表格對象的表格ID、表格對象的存儲 位置(例如,數(shù)據(jù)存儲區(qū)在存儲器中的地址)、指示表格對象的結(jié)構(gòu)的表格結(jié)構(gòu)信息、識別在豎直方向上連接的一組表格對象的豎直連接ID和識別在水平方向上連接的一組表格對象的水平連接ID。表格結(jié)構(gòu)信息的示例包括表格對象的列數(shù)和行數(shù)、每列的寬度(列寬)、每行的高度(行高)、每個單元格的網(wǎng)格圖案、每個單元格的顏色和每個單元格的框格線信息(例如顏色、類型和厚度)。例如,如圖7所示,具有表格ID “I”的表格對象被存儲在地址“pi”并且包括左起依次具有8. 5、7. 5、6和10(Cm)的寬度的四列。在每一行上,左起依次對單元格設(shè)定網(wǎng)格圖案“2,0,0,0”。豎直連接ID被設(shè)為“1”,而水平連接ID被設(shè)為“I”??刂破?02 (圖6)控制每個組件。文本數(shù)據(jù)存儲部304接收從OCR單元212 (圖5)輸入的文本數(shù)據(jù)并以描繪部314能調(diào)用該文本數(shù)據(jù)的方式存儲該文本數(shù)據(jù)。表格掃描部306掃描從框格線修正處理單兀214 (圖5)輸入的表格對象,獲得表格對象的存儲位置,并將表格ID分配給每個表格對象(下面將描述以下具體情形表格掃描部306按讀取包括該表格對象的圖像數(shù)據(jù)的次序而將較小的表格ID分配給每個圖像數(shù)據(jù)內(nèi)所包括的表格對象)。表格掃描部306通過控制器302將所分配的表格ID和獲得的存儲位置添加到存儲在表格信息存儲部300中的第一表格信息表。表格結(jié)構(gòu)取得部308在控制器302的控制下參考存儲在表格信息存儲部300中的第一表格信息表訪問每個表格對象的存儲位置(圖7)以取得表格對象的表格結(jié)構(gòu)信息。表格結(jié)構(gòu)取得部308還通過控制器302將獲得的表格結(jié)構(gòu)信息添加到存儲在表格信息存儲部300中的第一表格信息表。表格連接判定部310在控制器302的控制下按表格ID的升序依次調(diào)用存儲在表格信息存儲部300中的第一表格信息表并基于每個表格ID的表格結(jié)構(gòu)信息(圖7)來判定待連接的一組表格對象(后面將參照圖8和9進行描述)。表格連接判定部310還基于判定結(jié)果通過控制器302將每個表格對象的豎直連接ID和水平連接ID添加到存儲在表格信息存儲部300中的第一表格信息表(后面將參照圖8和9進行描述)。表格連接部312在控制器302的控制下參照存儲在表格信息存儲部300中的第一表格信息表沿豎直或水平方向連接表格對象。更具體地說,例如,表格連接部312首先訪問第一表格信息表中具有相同豎直連接ID的表格對象的存儲位置(圖7)以取得表格對象,并且表格連接部312沿豎直方向按表格ID的升序連接所取得的表格對象(一個表格對象被連接在前一表格對象下方)。然后,表格連接部312訪問在尚未沿豎直方向連接的表格對象當(dāng)中具有相同水平連接ID的表格對象的存儲位置以取得表格對象,并且表格連接部312沿水平方向按表格ID的升序連接所取得的表格對象(一個表格對象與前一表格對象的右端連接)。表格連接部312還將連接后的表格對象輸出到表格描繪部314。同時,在該示例性實施例中豎直連接優(yōu)先,但并不限于這種構(gòu)造并且可以水平連 接優(yōu)先。另外,可基于用戶指定、預(yù)定設(shè)置等來適當(dāng)?shù)馗淖兪秦Q直連接優(yōu)先還是水平連接優(yōu)先。另外,表格連接判定部310可構(gòu)造成判定沿豎直方向和水平方向中的一者連接表格對象。表格描繪部314參照由文本數(shù)據(jù)存儲部304存儲的文本數(shù)據(jù)將文本數(shù)據(jù)嵌入從表格連接部312輸入的表格對象中以生成表格描繪數(shù)據(jù)。表格描繪部314還將生成的表格描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單兀218 (圖5)、打印裝置110和通信裝置112 (圖4)中的至少一者。例如,當(dāng)表格描繪數(shù)據(jù)被輸出到打印裝置110和通信裝置112時,僅表格對象的描繪數(shù)據(jù)從圖IA和IB所示的包括其它對象(例如文本、CG和照片)的圖像數(shù)據(jù)輸出。同時,基于用戶經(jīng)由輸入/輸出裝置108(圖4)的指定、預(yù)定設(shè)置等來判定表格描繪數(shù)據(jù)的輸出目的地。圖8是示出由表格連接判定部310 (圖6)執(zhí)行的用于判定是否沿豎直方向連接表格對象的表格連接判定處理的流程圖。下面將進一步描述由表格連接判定部310執(zhí)行的用于判定是否沿豎直方向連接表格對象的表格連接判定處理。在步驟S320中,表格連接判定部310取得第一表格信息表的開始表格信息(例如,在圖7所不的第一表格信息表中具有表格ID “I”的表格信息)作為第一表格信息。在步驟S322中,表格連接判定部310判定第一表格信息表是否包括下一表格信息(例如,在圖7所的第一表格信息表中具有表格ID “2”的表格信息)。如果表格連接判定部310判定下一表格信息存在,則處理轉(zhuǎn)入步驟S324。否則,該處理結(jié)束。在步驟S324中,表格連接判定部310取得下一表格信息作為第二表格信息。在步驟S326中,表格連接判定部310判定在步驟S320中取得的第一表格信息的列數(shù)和每列寬度是否分別與在步驟S324中取得的第二表格信息的列數(shù)和對應(yīng)的列寬相匹配。如果表格連接判定部310判定列數(shù)匹配且對應(yīng)的列寬相匹配,則處理轉(zhuǎn)入步驟S328。否則,處理轉(zhuǎn)入步驟S332。除列寬完全匹配的情形以外,當(dāng)對應(yīng)的列寬之差在預(yù)定范圍內(nèi)時,表格連接判定部310可判定列寬相匹配。在步驟S328中,表格連接判定部310判定在步驟S320中取得的第一表格信息的列數(shù)和列寬以外的表格結(jié)構(gòu)信息(下文稱為“其它列信息”)是否與在步驟S324中取得的第二表格信息的其它列信息相匹配。更具體地說,例如,表格連接判定部310判定第一表格信息和第二表格信息中的對應(yīng)列上的單元格的平均顏色之間的色差是否在預(yù)定范圍內(nèi)。另外,例如,表格連接判定部310判定第 一表格信息和第二表格信息中的對應(yīng)列上的單元格的網(wǎng)格圖案是否相匹配。例如,由于在圖3B所示的紙質(zhì)文檔的I至3頁上圓點圖案網(wǎng)格位于第一列的單元格上而不位于其它列上的單元格上,因此表格連接判定部310判定網(wǎng)格圖案相匹配。另外,當(dāng)網(wǎng)格圓點沿主掃描方向的中心圓點與其沿子掃描方向的中心圓點之間的位置關(guān)系以及中心圓點的平均密度之差在預(yù)定范圍內(nèi)時,表格連接判定部310可判定網(wǎng)格圖案相匹配。另外,例如,表格連接判定部310判定第一表格信息和第二表格信息中的對應(yīng)列上的豎直框格線的色差、厚度差等是否在預(yù)定范圍內(nèi)并判定框格線是否屬于相同類型。如果表格連接判定部310判定多片其它列信息相匹配,則該處理轉(zhuǎn)入步驟S330。否則,該處理轉(zhuǎn)入步驟S332。在步驟S330中,表格連接判定部310將相同的豎直連接ID分配給第一表格信息和第二表格信息。在步驟S332中,表格連接判定部310將在步驟S324中取得的第二表格信息設(shè)定為新的第一表格信息并分配新的豎直連接ID(例如,通過對當(dāng)前豎直連接ID加“I”而獲得的值)。然后,該處理返回步驟S322。在步驟S334中,表格連接判定部310判定第一表格信息表是否包括尚未執(zhí)行表格連接判定處理的表格信息。如果表格連接判定部310判定存在未經(jīng)處理的表格信息,則該處理返回步驟S324。否則,該處理結(jié)束。同時,在圖8所示的流程圖中,如果在步驟S326中判定列數(shù)相匹配且列寬相匹配并且在步驟S328中判定多片其它列信息相匹配,則表格連接判定部310判定將第一表格信息和第二表格信息彼此連接。但是,可跳過步驟S328中的判定。這種情況下,如果表格連接判定部310在步驟S326中判定列數(shù)相匹配且列寬相匹配,則該處理轉(zhuǎn)入步驟S330。否則,該處理轉(zhuǎn)入步驟S332。圖9是示出由表格連接判定部310 (圖6)執(zhí)行的用于判定是否沿水平方向連接表格對象的表格連接判定處理的流程圖。下面將進一步描述由表格連接判定部310執(zhí)行的用于判定是否沿水平方向連接表格對象的表格連接判定處理。在步驟S320至S324中,表格連接判定部310執(zhí)行類似于在圖8所示的步驟S320至S324中執(zhí)行的處理。
在步驟S340中,表格連接判定部310判定在步驟S320中取得的第一表格信息的行數(shù)和每行高度是否分別與在步驟S324中取得的第二表格信息的行數(shù)和對應(yīng)的行高相匹配。如果表格連接判定部310判定行數(shù)相匹配且對應(yīng)的行高相匹配,則該處理轉(zhuǎn)入步驟S342。否則,該處理轉(zhuǎn)入步驟S346。除對應(yīng)的行高完全匹配的情況以外,當(dāng)對應(yīng)的行高之差在預(yù)定范圍內(nèi)時表格連接判定部310也可判定行高相匹配。在步驟S342中,表格連接判定部310判定在步驟S320中取得的第一表格信息的行數(shù)和行高以外的表格結(jié)構(gòu)信息(下文稱為“其它行信息”)是否與在步驟S324中取得的第二表格信息的其它行信息相匹配。更具體地說,例如,與步驟S328(圖8) —樣,表格連接判定部310判定第一表格信息和第二表格信息的對應(yīng)行上的單元格的平均顏色之間的色差是否在預(yù)定范圍內(nèi)。另外,例如,與步驟S328(圖8) —樣,表格連接判定部310判定第一表格信息和第二表格信息的對應(yīng)行上的所有列的網(wǎng)格圖案是否相匹配。例如,由于圖3B所不的紙質(zhì)文檔的每一頁的每一行上圓點圖案網(wǎng)格位于第一列上的單元格上而該網(wǎng)格不位于其它列的單元格上,因此表格連接判定部310判定網(wǎng)格圖案不匹配。另外,例如,與步驟S328(圖8)中一樣,表格連接判定部310判定第一表格信息和第二表格信息的對應(yīng)行上的水平框格線之間的色差或厚度差是否在預(yù)定范圍內(nèi)或框格線是否屬于相同類型。如果表格連接判定部310判定多片其它行信息與相匹配,則該處理轉(zhuǎn)入步驟S344。否則,該處理轉(zhuǎn)入步驟S346。在步驟S344中,表格連接判定部310將相同的水平ID分配給第一表格信息和第
二表格信息。在步驟S346中,表格連接判定部310將在步驟S324中取得的第二表格信息設(shè)定為新的第一表格信息并分配新的水平連接ID(例如,通過對當(dāng)前水平ID加“I”而獲得的值)。然后,該處理返回步驟S322。在步驟S332中,表格連接判定部310執(zhí)行類似于在圖8所示的步驟S332中執(zhí)行的處理。同時,在圖9所示的流程圖中,如果在步驟S340中判定行數(shù)相匹配且行高相匹配并且在步驟S342中判定多片其它行信息相匹配,則表格連接判定部310判定將第一表格信息和第二表格信息彼此連接。但是,可跳過S342中的判定。這種情況下,與豎直表格連接的情況下一樣,如果表格連接判定部310在步驟S340中判定行數(shù)相匹配且行高相匹配,則該處理轉(zhuǎn)入步驟S344。否則,該處理轉(zhuǎn)入步驟S346。下面將描述圖像處理設(shè)備I (圖4)的第一操作實例。在該操作實例中,將對以下處理進行描述該處理由圖像處理設(shè)備I執(zhí)行,以從原始電子文檔(圖3A)中的上面打印有表格部分的多張紙質(zhì)文檔(圖3B)重新生成圖3C所示的電子文檔。
圖像處理設(shè)備I (表格掃描部306 (圖6))掃描從經(jīng)由圖像讀取裝置106讀取的多張紙質(zhì)文檔的圖像數(shù)據(jù)分離出的表格對象并對第一表格信息表追加表格ID和存儲位置。更具體地說,在該操作實例中,圖像處理設(shè)備I如圖7所示追加五個表格ID和五個存儲位置。圖像處理設(shè)備I (表格結(jié)構(gòu)取得部308 (圖6))取得與這五個表格ID相對應(yīng)的每個表格對象的結(jié)構(gòu)信息并對第一表格信息表(圖7)追加取得的結(jié)構(gòu)信息。圖像處理設(shè)備I (表格連接判定部310 (圖6、8和9))基于第一表格信息表判定要豎直或水平連接的一組表格對象并對第一表格信息表追加豎直連接ID和水平連接ID。更具體地說,在該操例中,圖像處理設(shè)備I將具有表格ID “I”至“3”的表格對象(其列數(shù)、列寬和對應(yīng)的列上的網(wǎng)格圖案相匹配)的豎直連接ID設(shè)為I。圖像處理設(shè)備I還將具有表格ID “4”和“5”的表格對象的豎直連接ID設(shè)為“2”(圖7)。 另外,在該操作實例中,由于表格對象的對應(yīng)行上的單元格的網(wǎng)格圖案彼此不同,因此圖像處理設(shè)備I設(shè)定不同的水平連接ID(圖7)。圖像處理設(shè)備I (表格連接部312 (圖6))基于第一表格信息表的豎直連接ID和水平連接ID來連接表格對象。更具體地說,在該操作實例中,圖像處理設(shè)備I沿豎直方向連接具有表格ID“1”至“3”和豎直連接ID “I”的表格對象。圖像處理設(shè)備I還沿豎直方向連接具有表格ID “4”和“5”以及豎直連接ID “2”的表格對象(圖3C)。圖像處理設(shè)備I (表格描繪部314 (圖6))將文本數(shù)據(jù)嵌入連接后的表格對象中以生成表格描繪數(shù)據(jù)并將生成的表格描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單元218(圖5)、打印裝置110和通信裝置112 (圖4)中的至少一者。第二示例性實施例下面將描述本發(fā)明的第二示例性實施例。圖IOA是示出具有指示電子文檔中的各行或各列的每個項目的含義的標(biāo)題的表格部分的圖表。圖IOB是示出通過打印附有標(biāo)題的圖IOA所示的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表。圖IOC是示出通過根據(jù)現(xiàn)有技術(shù)的圖像處理設(shè)備從圖IOB所示的多張紙質(zhì)文檔重新生成的電子文檔的圖表。當(dāng)圖IOA所示的電子文檔中所包括的附有標(biāo)題的表格部分被分割并打印成如圖IOB所示的附有標(biāo)題的多張紙質(zhì)文檔時,圖像處理設(shè)備通過將打印在多張紙質(zhì)文檔上的表格處理成如圖IOC所示的均附有標(biāo)題的獨立表格而重新生成電子文檔。圖IlA是示出通過打印原始電子文檔中所包括的附有標(biāo)題的表格部分而獲得的多張輸出紙質(zhì)文檔的圖表。圖IlB是示出在重新生成電子文檔之前刪除了標(biāo)題行的表格的圖表。圖IlC是示出通過下面要描述的根據(jù)本發(fā)明第二示例性實施例的圖像處理設(shè)備I重新生成的電子文檔的圖表??紤]上述情況,對根據(jù)本發(fā)明的第二示例性實施例的圖像處理設(shè)備I進行描述。在本發(fā)明的第二示例性實施例中,將描述其中以圖IlC所示的方式重新生成電子文檔使得重新生成的表格具有與原始電子文檔中所包括的附有標(biāo)題的表格(圖11A)相同的結(jié)構(gòu)的具體情況。圖12是示出第二電子文檔生成程序24的第二表格描繪處理單元40的構(gòu)造的圖,該第二電子文檔生成程序24的第二表格描繪處理單元40代替了按照本發(fā)明的第一示例性實施例的圖5所不的第一電子文檔生成程序20的第一表格描繪處理單兀30。如圖12所示,第二表格描繪處理單元40包括第二表格信息存儲部400、第二控制器402、第二文本數(shù)據(jù)存儲部404、第二表格掃描部406、標(biāo)題取得部408、第二表格連接判定部410、第二表格連接部412和表格描繪部314。表格描繪處理單元40從上面分割并打印有均附有標(biāo)題的表格部分的多張紙質(zhì)文檔的圖像數(shù)據(jù)生成表格描繪數(shù)據(jù),使得重新生成的附有標(biāo)題的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)。 同時,在該不例性實施例中,以下將對表格的第一行顯不標(biāo)題并且分割的子表格沿豎直方向連接的具體情況進行描述。圖13是示出由表格信息存儲部400存儲的第二表格信息表格的圖表。表格信息存儲部400存儲通過圖12所示的每個組件經(jīng)由控制器402更新和調(diào)用的第二表格信息表。如圖13所不,第二表格信息表的表格信息的不例包括與圖7所不的第一表格信息表相似的表格對象的表格ID和存儲位置、指示標(biāo)題行上的每個單元格的內(nèi)容的標(biāo)題行信息和識別要連接的一組表格對象的連接ID。例如,如圖13所示,具有表格ID “I”的表格對象被存儲在地址“pi”并具有連接ID “I”。其標(biāo)題行上的單元格的內(nèi)容左起依次包括“No. ”、“AAA”、“BBB”、“CCC”和“DDD”??刂破?02 (圖12)控制每個組件。與圖6所示的文本數(shù)據(jù)存儲部304相似,文本數(shù)據(jù)存儲部404接收從OCR單元212 (圖5)輸入的文本數(shù)據(jù)并以標(biāo)題取得部408和表格描繪部314能調(diào)用該文本數(shù)據(jù)的方式存儲該文本數(shù)據(jù)。與圖6所不表格掃描部306相似,表格掃描部406掃描從框格線修正處理單兀214(圖5)輸入的表格對象,取得表格對象的存儲位置,并將表格ID分配給相應(yīng)的表格對象。表格掃描部406還經(jīng)由控制器402對存儲在表格信息存儲部400中的第二表格信息表追加所分配的表格ID和取得的存儲位置。標(biāo)題取得部408在控制器402的控制下參照存儲在表格信息存儲部400中的第二表格信息表訪問表格對象的存儲位置(圖13)以取得表格對象。標(biāo)題取得部408還參照由文本數(shù)據(jù)存儲部404存儲的文本數(shù)據(jù)取得位于與取得的表格對象的第一行上的每個單元格相對應(yīng)的位置的文本。另外,標(biāo)題取得部408經(jīng)由控制器402對存儲在表格信息存儲部400中的第二表格息表追加取得的文本。表格連接判定部410在控制器402的控制下按表格ID的升序調(diào)用存儲在表格信息存儲部400中的第二表格信息表并基于與每個表格ID相對應(yīng)的表格對象的標(biāo)題行信息來判定要連接的一組表格對象(將在后文參照圖14描述)。表格連接判定部410還基于判定結(jié)果經(jīng)由控制器402對存儲在表格信息存儲部400中的第二表格信息表追加每個表格對象的連接ID (將在后文參照圖14描述)。表格連接部412在控制器402的控制下參照存儲在表格信息存儲部400中的第二表格信息表的連接ID(圖13)連接表格對象并將連接的表格對象輸出到表格描繪部314 (將在后文參照圖15描述)。圖14是示出由表格連接判定部410 (圖12)執(zhí)行的用于判定是否連接表格對象的表格連接判定過程的流程圖。下面將進一步描述由表格連接判定部410執(zhí)行的用于判定是否連接表格對象的表格連接判定過程。在步驟S420中,表格連接判定部410取得第二表格信息表的開始表格信息(例如,圖13中的第二表格信息表中具有表格ID “I”的表格信息)作為第一表格信息。在步驟S422中,表格連接判定部410判定第二表格信息表是否包括下一表格信息(例如,圖13所不的第二表格信息表中具有表格ID “2”的表格信息)。
如果表格連接判定部410判定下一表格信息存在,則處理轉(zhuǎn)入步驟S424。否則,該處理結(jié)束。在步驟S424中,表格連接判定部410取得下一表格信息作為第二表格信息。在步驟S426中,表格連接判定部410判定在步驟S420中取得的第一表格信息的標(biāo)題行信息是否與在步驟S424中取得的第二表格信息的標(biāo)題行信息相匹配。如果表格連接判定部410判定多片標(biāo)題行信息相匹配,則該處理轉(zhuǎn)入步驟S428。否則,該處理轉(zhuǎn)入步驟S430。當(dāng)?shù)谝槐砀裥畔⒌臉?biāo)題行信息的一列的至少一個標(biāo)題與第二表格信息的標(biāo)題行信息的對應(yīng)列的對應(yīng)標(biāo)題相匹配時,表格連接判定部410可判定多片標(biāo)題行信息相匹配。另外,當(dāng)?shù)谝槐砀裥畔⒌囊涣械闹辽僖粋€標(biāo)題與第二表格信息的對應(yīng)列的對應(yīng)標(biāo)題相匹配并且第一表格信息的列數(shù)或列數(shù)及每個列寬進一步分別與第二表格信息的列數(shù)或列數(shù)及對應(yīng)的列寬相匹配時,表格連接判定部410可判定多片標(biāo)題行信息相匹配。在步驟S428中,表格連接判定部410將相同的連接ID分配給第一表格信息和第二表格信息。在步驟S430中,表格連接判定部410將在步驟S424中取得的第二表格信息設(shè)定為新的第一表格信息并分配新的連接ID(例如,通過對當(dāng)前連接ID加“I”而獲得的值)。然后,該處理返回步驟S422。在步驟S432中,表格連接判定部410判定第二表格信息表是否包括尚未對其執(zhí)行表格連接判定處理的表格信息。如果表格連接判定部410判定存在未經(jīng)處理的表格信息,則該處理返回步驟S424。否則,該處理結(jié)束。圖15是示出由表格連接部412 (圖12)執(zhí)行的用于連接表格對象的表格連接處理的流程圖。下面將進一步描述由表格連接部412執(zhí)行的用于連接表格對象的表格連接處理。在步驟S420至S424中,表格連接部412執(zhí)行與圖14所示的步驟S420至S424中類似的處理。在步驟S440中,表格連接部412判定在步驟S420中取得的第一表格信息的連接ID是否與在步驟S424中取得的第二表格信息的連接ID相匹配。如果表格連接部412判定連接ID相匹配,則該處理轉(zhuǎn)入步驟S442。否則,該處理轉(zhuǎn)入步驟S444。在步驟S442中,表格連接部412訪問在步驟S424中取得的第二表格信息的存儲位置以取得表格對象(第二表格對象),并且表格連接部412刪除取得的第二表格對象的與標(biāo)題行相對應(yīng)的第一排。 在步驟S444中,表格連接部412將第二表格信息設(shè)定為新的第一表格信息。然后,該處理返回步驟S422。在步驟S446中,表格連接部412訪問在步驟S420中取得的第一表格信息的存儲位置以取得表格對象(第一表格對象),并且表格連接部412將刪除了標(biāo)題的第二表格對象豎直連接在取得的第一表格對象下方。在步驟S448中,表格連接部412判定第二表格信息表是否包括尚未對其執(zhí)行表格連接處理的表格對象。 如果表格連接部412判定存在未經(jīng)處理的表格對象,則該處理返回步驟S424。否貝U,該處理結(jié)束。下面將描述圖像處理設(shè)備I (圖4)的第二操作實例。在該操作實例中,將對以下處理進行描述該處理圖像處理設(shè)備I執(zhí)行,以從原始電子文檔中的上面打印有附有標(biāo)題的表格部分的多張紙質(zhì)文檔(圖11A)重新生成圖IlC所示的電子文檔。圖像處理設(shè)備I (表格掃描部406 (圖12))掃描從經(jīng)由圖像讀取裝置106讀取的多張紙質(zhì)文檔的圖像數(shù)據(jù)分離出的表格對象并對第二表格信息表追加表格ID和存儲位置。更具體地說,在該操作實例中,圖像處理設(shè)備I如圖13所示追加五個表格ID和五個存儲位置。圖像處理設(shè)備I (標(biāo)題取得部408 (圖12))取得與五個表格ID相對應(yīng)的每個表格對象的標(biāo)題行信息并對第二表格信息表(圖13)追加所取得的標(biāo)題行信息。圖像處理設(shè)備I (表格連接判定部410 (圖12和14)基于第二表格信息表來判定要連接的一組表格對象并對第二表格信息表追加連接ID。更具體地說,在該操作實例中,圖像處理設(shè)備I將具有表格ID “I”至“3”并具有匹配的標(biāo)題行信息的表格對象的連接ID設(shè)為“I”。圖像處理設(shè)備I還將具有表格ID “4”和“5”的表格對象的連接ID設(shè)為“2”(圖13)。圖像處理設(shè)備I (表格連接部412 (圖12和15))基于第二表格信息表的連接ID來連接表格對象。更具體地說,在該操作實例中,圖像處理設(shè)備I從具有表格ID “I”至“3”和連接ID “I”的表格對象當(dāng)中具有表格ID “2”和“3”的表格對象中刪除標(biāo)題行(圖11B)。然后,圖像處理設(shè)備I將具有表格ID “2”和“3”的表格對象沿豎直方向依次連接在具有表格ID “I”的表格對象下方(圖11C)。圖像處理設(shè)備I還從具有表格ID “4”和“5”和連接ID “2”的表格對象當(dāng)中具有表格ID“5”的表格對象中刪除標(biāo)題行(圖11B)。然后,圖像處理設(shè)備I將具有表格ID“5”的表格對象沿豎直方向連接在具有表格ID “4”的表格對象下方(圖11C)。圖像處理設(shè)備I (表格描繪部314 (圖12))將文本數(shù)據(jù)嵌入連接后的表格對象中以生成表格描繪數(shù)據(jù),并且將生成的表格描繪數(shù)據(jù)輸出到描繪數(shù)據(jù)合并單元218 (圖5)、打印裝置110和通信裝置112(圖4)中的至少一者。第二示例性實施例的改型在第二示例性實施例的描述中,使用其中表格的第一行顯示標(biāo)題并且分割的子表格沿豎直方向連接的具體情況。但是,第二示 例性實施例并不限于該具體情況,并且可構(gòu)造成使得表格的第一列顯示標(biāo)題并且分割的子表格沿水平方向連接。在這種情況下,標(biāo)題取得部408參照由文本數(shù)據(jù)存儲部404存儲的文本數(shù)據(jù)取得在與每個表格對象的第一列上的每個單元格相對應(yīng)的位置的文本。標(biāo)題取得部408還經(jīng)由控制器402將取得的文本作為標(biāo)題列信息追加至存儲在表格信息存儲部400中的第二表格信息表。與圖14所示的表格連接判定處理中一樣,表格連接判定部410還基于標(biāo)題列信息判定要連接的一組表格對象并經(jīng)由控制器402對存儲在表格信息存儲部400中的第二表格信息表追加連接ID。與圖15所示的表格連接處理中一樣,表格連接部412基于連接ID來沿水平方向連接表格對象。另外,第二示例性實施例和第二示例性實施例的改型可彼此結(jié)合,使得當(dāng)提取的標(biāo)題位于表格的第一行上時圖像處理設(shè)備I執(zhí)行豎直表格連接處理,并且當(dāng)所提取的標(biāo)題位于表格的第一列上時執(zhí)行水平表格連接處理。另外,表格的末行或末列可顯示標(biāo)題。第三示例性實施例下面將描述本發(fā)明的第三示例性實施例。在本發(fā)明的第三示例性實施例中,將描述其中按照原始電子文檔中所包括的表格部分的標(biāo)題的有無來選擇第一和第二示例性實施例中的一者并從多張紙質(zhì)文檔的圖像數(shù)據(jù)生成表格描繪數(shù)據(jù)使得重新生成的表格具有與原始電子文檔中的表格相同的結(jié)構(gòu)的具體情況。圖16是示出第三電子文檔生成程序26的第三表格描繪處理單元50的構(gòu)造的圖,該第三電子文檔生成程序26的第三表格描繪處理單元50代替按照本發(fā)明的第一示例性實施例的圖5所不的第一電子文檔生成程序20的第一表格描繪處理單兀30。如圖16所示,第三表格描繪處理單元50包括第三表格信息存儲部500、第三控制器502、第三表格掃描部504、選擇部506、表格結(jié)構(gòu)取得部308、第一表格連接判定部310、第一表格連接部312、表格描繪部314、第二文本數(shù)據(jù)存儲部404、標(biāo)題取得部408、第二表格連接判定部410和第二表格連接部412。表格描繪處理單元50按照電子文檔中所包括的表格部分的標(biāo)題的有無來選擇第一和第二示例性實施例中的一者并生成表格描繪數(shù)據(jù)。表格信息存儲部500存儲由圖16所示的每個組件經(jīng)由控制器502更新和調(diào)用的
第三表格信息表。第三表格信息表的表格信息的不例包括與圖7所不的第一表格信息表類似的表格對象的表格ID和存儲位置并且包括指示每個表格對象的標(biāo)題的有無的標(biāo)題有/無信息。表格信息存儲部500還按照選擇部506選擇的第一和第二示例性實施例來存儲圖7所不的第一表格信息表和圖13所不的第二表格信息表。
控制器502控制每個組件。與圖6所不的表格掃描部306 —樣,表格掃描部504掃描從框格線修正處理單兀214(圖5)輸入的表格對象,取得表格對象的存儲位置,并將表格ID分配給相應(yīng)的表格對象。表格掃描部504還訪問表格對象的存儲位置以取得表格對象。例如,當(dāng)表格對象的第一行或第一列具有與其它行或列不同的格式時,表格掃描部504判斷存在標(biāo)題。否則,表格掃描部504判斷不存在標(biāo)題。這樣,表格掃描部504生成標(biāo)題有/無信息。表格掃描部504經(jīng)由控制器502對存儲在表格信息存儲部500中的第三表格信息表追加分配的表格ID、取得的存儲位置和生成的標(biāo)題有/無信息。選擇部506在控制器502的控制下按照存儲在表格信息存儲部500中的第三表格信息表的標(biāo)題有/無信息來選擇表格連接方法。 更具體地說,例如,選擇部506經(jīng)由控制器502將具有連續(xù)表格ID值的表格對象的多片表格息和第二表格息表的多片表格息當(dāng)中指不標(biāo)題存在的標(biāo)題有/無信息輸出到表格信息存儲部500作為第二表格信息表。另外,例如,選擇部506經(jīng)由控制器502將具有連續(xù)表格ID值的表格對象的多片表格信息和第三表格信息表的多片表格信息當(dāng)中指不標(biāo)題不存在的標(biāo)題有/無信息輸出到表格信息存儲部500作為第一表格信息表。第一改型在本發(fā)明的第一至第三示例性實施例中,第一至第三表格描繪處理單元30、40和50對所有經(jīng)過該處理的表格對象執(zhí)行表格連接處理,然后連接表格對象以生成表格描繪數(shù)據(jù)。但是,可逐一對每個表格對象執(zhí)行表格連接處理。第二改型在本發(fā)明的第一至第三示例性實施例中,按照讀取包括表格對象的圖像數(shù)據(jù)的次序?qū)Ρ砀駥ο髨?zhí)行表格連接判定處理和表格連接處理。但是,例如,當(dāng)如圖3B和圖IlA所示在多張紙質(zhì)文檔中的每一個上打印頁數(shù)時,可從讀取的圖像數(shù)據(jù)識別頁數(shù)并且可按頁數(shù)對表格對象執(zhí)行處理。第三改型在本發(fā)明的第一至第三示例性實施例中,第一表格連接部312和第二表格連接部412分別基于第一表格連接判定部310和第二表格連接判定部410對表格信息表追加的連接ID來對表格對象執(zhí)行表格連接處理(圖8、9和14)。但是,例如,在執(zhí)行表格連接處理之前可對用戶顯示表格連接判定處理的結(jié)果。可在從用戶收到表格連接指令之后執(zhí)行表格連接處理。第四改型在本發(fā)明的第一至第三示例性實施例中,第一表格連接判定部310和第二表格連接判定部410對通過對象分離單元204 (圖5)分離的表格對象執(zhí)行表格連接判定處理。但是,可參照圖像數(shù)據(jù)(從其中尚未分離出表格對象)及表格對象來執(zhí)行表格連接判定處理。更具體地說,例如,當(dāng)判定第一表格對象與第二表格對象之間包括其它對象(例如文本、CG和照片)時,即使第一表格對象和第二表格對象具有相匹配的表格結(jié)構(gòu)和相匹配的標(biāo)題信息,第一表格連接判定部310和第二表格連接判定部410也判定不要連接第一表格對象和第二表格對象。已基于圖示和說明的目的提供前面對本發(fā)明的示例性實施例的說明。所述說明并非旨在進行窮舉或?qū)⒈景l(fā)明限制在所公開的精確形式。顯然,眾多改型和變型對本領(lǐng)域技術(shù)人員來說將是顯而易見的。選擇和說明這些實施例以便最 好地解釋本發(fā)明的原理及其實踐應(yīng)用,從而使本領(lǐng)域技術(shù)人員能夠就適合預(yù)期的特定用途的各種實施例和各種改型來理解本發(fā)明。預(yù)期本發(fā)明的范圍由以下權(quán)利要求及它們的等效物限定。
權(quán)利要求
1.一種圖像處理設(shè)備,包括 標(biāo)題取得部,所述標(biāo)題取得部從具有多行和多列的表格取得標(biāo)題,所述表格被包括在以預(yù)定次序排列的多片圖像數(shù)據(jù)中的每一片內(nèi),所述標(biāo)題指示所述表格中的項目,所述項目被設(shè)置在所述表格的行和列上或所述表格的行和列中的一者上; 表格連接判定部,所述表格連接判定部判定已從所述多片圖像數(shù)據(jù)內(nèi)所包括的表格取得的標(biāo)題是否互相匹配,并判定以預(yù)定次序彼此相鄰并具有相匹配的標(biāo)題的表格為要連接的一組表格;以及 表格連接部,所述表格連接部從除了第一表格以外的一個或更多個第二表格中的每一個刪除所述標(biāo)題,并且按所述預(yù)定次序?qū)⑺龅谝槐砀窈鸵褟拿恳粋€中刪除所述標(biāo)題的所述一個或多個第二表格彼此連接,所述第一表格被包括在以所述預(yù)定次序判定的一組表格的多片圖像數(shù)據(jù)的第一片圖像數(shù)據(jù)內(nèi)。
2.根據(jù)權(quán)利要求I所述的圖像處理設(shè)備, 其中,所述標(biāo)題位于所述多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的表格的末行上,并且 其中所述表格連接部按所述預(yù)定次序沿從表格到表格向下的方向?qū)⑺龅谝槐砀窈鸵褟拿恳粋€中刪除包括所述標(biāo)題的末行的所述一個或多個第二表格彼此連接。
3.根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中,所述末行包括所述表格的第一行。
4.根據(jù)權(quán)利要求I所述的圖像處理設(shè)備, 其中,所述標(biāo)題位于所述多片圖像數(shù)據(jù)中的每一片內(nèi)所包括的所述表格的末列上,并且 其中,所述表格連接部按所述預(yù)定次序沿從表格到表格向右的方向?qū)⑺龅谝槐砀窈鸵褟拿恳粋€中刪除包括所述標(biāo)題的所述末列的所述一個或多個第二表格彼此連接。
5.根據(jù)權(quán)利要求4所述的圖像處理設(shè)備,其中,所述末列包括所述表格的最左列。
6.根據(jù)權(quán)利要求I至5中任一項所述的圖像處理設(shè)備,其中,當(dāng)包括所述相鄰的表格的所述多片圖像數(shù)據(jù)還包括非表格組件并且非表格組件位于所述相鄰的表格之間時,所述表格連接判定部判定不要連接所述相鄰的表格。
7.根據(jù)權(quán)利要求I所述的圖像處理設(shè)備,其中,通過讀取紙質(zhì)文檔的圖像而從所述紙質(zhì)文檔生成所述多片圖像數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的圖像處理設(shè)備,其中,所述預(yù)定次序包括讀取所述紙質(zhì)文檔的次序。
9.根據(jù)權(quán)利要求I所述的圖像處理設(shè)備, 其中,所述多片圖像數(shù)據(jù)中的每一個都包括識別排列次序的次序信息,并且 其中所述預(yù)定次序表示通過所述次序信息指定的次序。
10.一種圖像處理方法,包括 從具有多行和多列的表格取得標(biāo)題,所述表格被包括在以預(yù)定次序排列的多片圖像數(shù)據(jù)中的每一片內(nèi),所述標(biāo)題指示所述表格中的項目,所述項目被設(shè)置在所述表格的行和列上或所述表格的行和列中的一者上; 判定已從所述多片圖像數(shù)據(jù)中所包括的表格取得的標(biāo)題是否互相匹配,并判定以所述預(yù)定次序彼此相鄰并具有匹配的標(biāo)題的表格為要連接的一組表格;以及 從除了第一表格以外的一個或多個第二表格中的每一個刪除所述標(biāo)題,并且按所述預(yù)定次序?qū)⑺龅谝槐?格和已從每一個中刪除所述標(biāo)題的所述一個或多個第二表格彼此連接,所述第一表格被包括在以所述預(yù)定次序判定的一組表格的多片圖像數(shù)據(jù)的第一片圖像數(shù)據(jù)內(nèi)。
全文摘要
本發(fā)明提供一種圖像處理設(shè)備,該圖像處理設(shè)備包括標(biāo)題取得部、表格連接判定部和表格連接部。標(biāo)題取得部從具有多行和多列并且被包括在以預(yù)定次序排列的多片圖像數(shù)據(jù)中的每一片內(nèi)的表格取得標(biāo)題。該標(biāo)題指示設(shè)定在表格的行和列上或表格的行和列中的一者上的表格內(nèi)的項目。表格連接判定部判定已從多片圖像數(shù)據(jù)內(nèi)包括的表格取得的標(biāo)題是否互相匹配。表格連接判定部還判定以預(yù)定次序彼此相鄰并具有匹配的標(biāo)題的表格作為要連接的一組表格。表格連接部從除了第一表格以外的一個或多個第二表格中的每一個刪除標(biāo)題,并且按預(yù)定次序?qū)⒌谝槐砀窈鸵褟拿恳粋€中刪除標(biāo)題的一個或更多個第二表格彼此連接。第一表格被包括在以預(yù)定次序判定的一組表格的多片圖像數(shù)據(jù)的第一片圖像數(shù)據(jù)內(nèi)。
文檔編號G06T11/60GK102708580SQ20111040961
公開日2012年10月3日 申請日期2011年12月9日 優(yōu)先權(quán)日2011年3月28日
發(fā)明者土淵清隆, 山田俊之, 新名博, 清水淳一, 脅山徹也 申請人:富士施樂株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1