亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文檔圖像處理裝置和信息處理方法

文檔序號:6462418閱讀:115來源:國知局
專利名稱:文檔圖像處理裝置和信息處理方法
技術(shù)領(lǐng)域
本發(fā)明涉及文檔圖像處理裝置和信息處理方法。
背景技術(shù)
存在通過OCR對文檔圖像進(jìn)行字符識別、翻譯字符識別結(jié)果并 輸出翻譯語句的技術(shù)。在該技術(shù)中,存在原始語句和翻譯語句都布置 在同一文檔圖像中輸出的情況。
例如,專利文獻(xiàn) 1 ( JP-A-5-324720 )和專利文獻(xiàn)2 (JP-A-2002-288169)披露了將翻譯語句布置在包含于文檔圖像的原 始語句圖像的上部空間中以輸出的技術(shù)。然而,根據(jù)該背景技術(shù),其 前提條件是預(yù)先保證了翻譯空間。 —

發(fā)明內(nèi)容
本發(fā)明的目的是提供這樣的文檔圖像處理裝置和文檔圖像處理
方法對于沒有為翻譯語句保證布置空間的文檔圖像而言,所述文檔 圖像處理裝置和文檔圖像處理方法能夠在維持文檔圖像的版面布局 的同時生成包括原始語句和翻譯語句的文檔圖像。根據(jù)本發(fā)明的一方面, 一種文檔圖像處理裝置包括指定部分、 提取部分、識別部分、翻譯部分、布置部分和生成部分。所述指定部 分從文檔圖像中指定包括字符行的語句區(qū)域。所述提取部分提取所指 定的語句區(qū)域中包括的至少一個字符行圖像(line image,行式圖像)。 所述識別部分識別提取出的字符行圖像中所包括的各個字符。所述翻 譯部分翻譯由識別出的字符構(gòu)成的原始語句字符行并生成翻譯語句 字符行。所述布置部分通過縮小各個字符行圖像而在所述語句區(qū)域中 布置各個字符行圖像。所述布置部分在所述語句區(qū)域中除了布置各個 字符行圖像的區(qū)域以外的空白區(qū)域中布置所生成的各個翻譯語句字
符行。所述生成部分生成在所述語句區(qū)域中布置有各個字符行圖像和 各個翻譯語句字符行的輸出文檔的數(shù)據(jù)。根據(jù)項[1]所述的文檔圖像處理裝置,所述布置部分可以在所 述語句區(qū)域中布置行圖像。可以通過以所述語句區(qū)域的行的長度對通 過連接所縮小的各個字符行圖像而構(gòu)成的圖像進(jìn)行分割來構(gòu)造每個 行圖像。根據(jù)項[1]所述的文檔圖像處理裝置,還可以包括確定部分。
所述確定部分可以確定所述字符行圖像的大小和所述翻譯語句字符 行的字符大小,從而使得連接各個字符行圖像而得的長度和連接各個 翻譯語句字符行而得的長度大致彼此相等。根據(jù)項[2]所述的文檔圖像處理裝置,還可以包括確定部分。 所述確定部分可以確定所述字符行圖像的大小和所述翻譯語句字符 行的字符大小,從而使得連接各個字符行圖像而得的長度和連接各個 翻譯語句字符行而得的長度大致彼此相等。根據(jù)項[2]所述的文檔圖像處理裝置,所述布置部分可以在所 述語句區(qū)域中布置行語句(line sentence,行式語句)。可以通過以 所述語句區(qū)域的行的長度對通過連接各個翻譯語句字符行而構(gòu)成的 語句進(jìn)行分割來構(gòu)造每個行語句。當(dāng)連接各個字符行圖像而得的長度 大于連接各個翻譯語句字符行而得的長度時,將一些行圖像共同地布 置在所述行語句之間。當(dāng)連接各個字符行圖像而得的長度小于連接各 個翻譯語句字符行而得的長度時,將一些行語句共同地布置在所述行 圖像之間。根據(jù)項[1]至[5]中任一項所述的文檔圖像處理裝置,可以與包 括至少一個原始語句字符行的語句結(jié)構(gòu)相對應(yīng)地將所述字符行圖像 和所述翻譯語句字符行分別共同地布置。根據(jù)項[1]至[5]中任一項所述的文檔圖像處理裝置,所述布置 部分可以將根據(jù)所述字符行圖像翻譯的翻譯語句字符行布置在所述 語句區(qū)域中的字符行圖像的上側(cè)或者下側(cè)。所述布置部分可以調(diào)整所 述翻譯語句字符行的各字符的字符大小以使所述翻譯語句字符行限 制在所述字符行圖像的長度內(nèi)。 [8]根據(jù)本發(fā)明的另一方面, 一種文檔圖像處理方法包括提取 所指定的語句區(qū)域中所包括的至少一個字符行圖像;識別提取出的字 符行圖像中所包括的各個字符;翻譯由識別出的字符構(gòu)成的原始語句 字符行并生成翻譯語句字符行;通過縮小各個字符行圖像而在所述語 句區(qū)域中布置各個字符行圖像,在所述語句區(qū)域中除了布置各個字符 行圖像的區(qū)域以外的空白區(qū)域中布置所生成的各個翻譯語句字符行; 以及生成在所述語句區(qū)域中布置有各個字符行圖像和各個翻譯語句 字符行的輸出文檔的數(shù)據(jù)。根據(jù)項[8]所述的文檔圖像處理方法,布置各個字符行圖像的 步驟包括在所述語句區(qū)域中布置行圖像。通過以所述語句區(qū)域的行的 長度對通過連接所縮小的各個字符行圖像而構(gòu)成的圖像進(jìn)行分割來 構(gòu)造每個行圖像。根據(jù)項[8]所述的文檔圖像處理方法,所述文檔圖像處理方
法還可以包括確定所述字符行圖像的大小和所述翻譯語句字符行的
字符大小,從而使得連接各個字符行圖像而得的長度和連接各個翻譯 語句字符行而得的長度大致彼此相等。根據(jù)項[9]所述的文檔圖像處理方法,所述文檔圖像處理方
法還可以包括確定所述字符行圖像的大小和所述翻譯語句字符行的
字符大小,從而使得連接各個字符行圖像而得的長度和連接各個翻譯 語句字符行而得的長度大致彼此相等。根據(jù)項[9]所述的文檔圖像處理方法,布置所生成的各個翻
譯語句字符行的步驟可以包括在所述語句區(qū)域中布置行語句??梢酝?過以所述語句區(qū)域的行的長度對通過連接各個翻譯語句字符行而構(gòu) 成的語句進(jìn)行分割來構(gòu)造每個行語句。當(dāng)連接各個字符行圖像而得的 長度大于連接各個翻譯語句字符行而得的長度時,將一些行圖像共同 地布置在所述行語句之間。當(dāng)連接各個字符行圖像而得的長度小于連 接各個翻譯語句字符行而得的長度時,將一些行語句共同地布置在所 述行圖像之間。根據(jù)項[8]、 [9]、 [10]、 [11]或[12]所述的文檔圖像處理方法,
與包括至少一個原始字符行的語句結(jié)構(gòu)對應(yīng)地將所述字符行圖像和
所述翻譯語句字符行分別共同地布置。根據(jù)項[8]、 [9]、 [10]、 [11]或[12]所述的文檔圖像處理方法,
布置各個字符行圖像和所生成的各個翻譯語句字符行的步驟可以包
括將根據(jù)所述字符行圖像翻譯的翻譯語句字符行布置在所述語句區(qū)
域中的字符行圖像的上側(cè)或者下側(cè)。布置所生成的各個翻譯語句字符
行的步驟可以包括設(shè)置所述翻譯語句字符行的各個字符的字符大 小,以使所述翻譯語句字符行限制在所述字符行圖像的長度內(nèi)。
據(jù)項[1]或[8],對于沒有為翻譯語句保證布置空間的文檔圖像 而言,能夠在維持版面布局的同時生成包括原始語句和翻譯語句的文 檔圖像。
根據(jù)項[2]或[9],通過縮小字符行圖像并將縮小的各個字符行圖
像緊密地布置在文檔區(qū)域的行內(nèi),可以保證布置翻譯語句字符行的區(qū) 域,并且對于沒有為翻譯語句保證布置空間的文檔圖像而言,能夠在 維持版面布局的同時生成包括原始語句和翻譯語句的文檔圖像。
根據(jù)項[3]或[4]或[10]或[11],使字符行圖像的總長度和翻譯語句 字符行的總長度大致彼此相等,從而使得字符行圖像和翻譯語句字符 行之間的對應(yīng)關(guān)系變得清楚。此外,通過使字符行圖像的總長度和翻 譯語句字符行的總長度大致彼此相等,可以調(diào)整版面布局。
根據(jù)項[5]或[12],當(dāng)字符行圖像的總長度與翻譯語句字符行的 總長度彼此不同時,可以將其中較長一個的多個行共同地布置在較短 一個的行之間,并調(diào)整字符行圖像和翻譯語句字符行的語句區(qū)域的端 部位置。
根據(jù)項[6]或[13],對于標(biāo)點(diǎn)符號等語句結(jié)構(gòu)的各個語句塊 (lump),將字符行圖像和翻譯語句字符行分別共同地布置,從而 使得語句結(jié)構(gòu)清楚。此外,通過對于標(biāo)點(diǎn)符號等語句結(jié)構(gòu)的各語句塊 將字符行圖像和翻譯語句字符行分別共同地布置,可以調(diào)整版面布 局。
根據(jù)項[7]或[14],可以使得字符行圖像和翻譯語句字符行之間 的對應(yīng)關(guān)系變得清楚。


根據(jù)下面的附圖詳細(xì)描述本發(fā)明的示例性實(shí)施例,其中
圖1是根據(jù)示例性實(shí)施例的文檔圖像處理裝置的功能性框圖; 圖2是示出文檔圖像獲取部分獲得的文檔圖像的實(shí)例的視圖3A和3B示出轉(zhuǎn)換之前和轉(zhuǎn)換之后的語句區(qū)域的視圖4是文檔圖像處理裝置的處理的流程圖5是文檔圖像處理裝置的處理的流程圖;以及
圖6A至6C是示出布置語句區(qū)域的模式的其它實(shí)例的視圖。
具體實(shí)施例方式
下面將參照

示例性實(shí)施例。
圖1是根據(jù)示例性實(shí)施例的文檔圖像處理裝置的功能性框圖。
如圖1所示,文檔圖像處理裝置IO在功能性構(gòu)造上包括文檔圖像
獲取部分100、語句區(qū)域指定部分102、字符行圖像提取部分104、 字符識別部分106、翻譯部分108、字符大小確定部分110、布置部 分112和圖像生成部分114??梢酝ㄟ^根據(jù)計算機(jī)程序操作構(gòu)成計算 機(jī)系統(tǒng)的文檔圖像處理裝置IO來實(shí)現(xiàn)上述各個功能。此外,計算機(jī) 程序可以存儲在CD-ROM、 DVD-ROM、閃速存儲器等任何形式的計 算機(jī)可讀信息記錄介質(zhì)中,并由連接到文檔圖像處理裝置10的介質(zhì) 讀取裝置(未示出)讀取。此外,可以通過網(wǎng)絡(luò)將計算機(jī)程序下載到 文檔圖像處理裝置10中。
文檔圖像獲取部分100獲取包括字符行的文檔圖像的圖像數(shù)據(jù) (在下文中稱為"文檔圖像數(shù)據(jù)")。文檔圖像獲取部分ioo可以通 過例如接收由連接到文檔圖像處理裝置10的掃描儀(未示出)掃描 的文檔圖像數(shù)據(jù)的輸入來獲取文檔圖像數(shù)據(jù)。
圖2示出由文檔圖像獲取部分100獲取的文檔圖像200的實(shí)例。 如圖2所示,文檔圖像200包括至少一個包含字符行的部分。例如, 該部分是語句區(qū)域210、語句區(qū)域220。除了字符行以外,文檔圖像 200可以包括諸如圖像等其它對象。
語句區(qū)域指定部分102根據(jù)由文檔圖像獲取部分100獲取的文
檔圖像數(shù)據(jù)指定在文檔圖像數(shù)據(jù)所表示的文檔圖像中所包括的語句
區(qū)域。例如,在圖2所示的文檔圖像200的實(shí)例中,指定語句區(qū)域 210、語句區(qū)域220等各自的位置、區(qū)域大小等。
字符行圖像提取部分104從語句區(qū)域指定部分102所指定的語 句區(qū)域中提取出包括至少一個字符的字符行圖像。字符行圖像提取部 分104可以提取出單個或多個字符行圖像。雖然根據(jù)本示例性實(shí)施例 是以行為單位提取字符行圖像,但是也可以以短語、分句、語句、段 落等為單位提取字符行圖像。根據(jù)本示例性實(shí)施例,在圖2所示的文 檔圖像200的實(shí)例中,對于所指定的語句區(qū)域210,提取出各行的字 符行圖像300A、 300B、 300C、 300D和300E。
字符識別部分106識別由字符行圖像提取部分104提取出的字 符行圖像中所包括的各個字符??梢允褂霉淖址R別技術(shù)來識別 字符。字符識別部分106通過將對字符行圖像進(jìn)行字符識別處理而構(gòu) 成的各個字符連接起來,從而生成字符行(下文中稱為原始語句字符 行)數(shù)據(jù)。對各個字符行圖像進(jìn)行字符識別處理。
翻譯部分108將由字符識別部分106所識別的字符構(gòu)成的原始 語句字符行翻譯成其它語言,以便生成翻譯語句字符行。在上述翻譯 處理中,可以使用公知的翻譯處理技術(shù),原始文檔被翻譯成的語言并 不受特別的限制,用戶可以設(shè)定原始文檔被翻譯成的語言。
字符大小確定部分110確定字符行圖像(原始語句)以及由翻 譯部分108生成的翻譯語句字符行各自的大小。根據(jù)字符行圖像的總 長度、翻譯語句字符行的總字符量、語句區(qū)域的大小、對語句區(qū)域設(shè) 定的行間比率等,確定字符行圖像(原始語句)和翻譯語句字符行各 自的大小。在本文中,字符行圖像的大小是字符行圖像的高度和寬度, 翻譯語句字符行的大小是每個翻譯語句字符的字符大小。
根據(jù)所確定的字符行圖像(原始語句)和翻譯語句字符行各自 的大小與這兩者的長度、以及用于布置這兩者的語句區(qū)域的大小等, 布置部分112將字符行圖像和翻譯語句字符行布置為容納在語句區(qū) 域中。例如,布置部分112將圖3A所示的原始文檔圖像中的語句區(qū) 域重新構(gòu)成為圖3B所示的布置有原始語句字符行圖像和翻譯語句字
符行的語句區(qū)域。此外,布置部分112的處理的細(xì)節(jié)將在下面描述。
圖像生成部分114生成由布置部分112在語句區(qū)域中布置有字 符行圖像和翻譯語句字符行的輸出文檔圖像。輸出文檔圖像可以生成 為例如位圖數(shù)據(jù)等。此外,可以將生成的輸出文檔圖像發(fā)送到與文檔 圖像處理裝置IO連接的打印機(jī)(未示出)從而打印輸出。
接下來,將參照圖4和圖5所示的流程圖說明由文檔圖像處理 裝置IO執(zhí)行的文檔圖像生成處理的流程。
圖4示出表示文檔圖像生成處理流程的流程圖。首先,文檔圖 像處理裝置IO獲取文檔圖像的掃描圖像數(shù)據(jù)(S101)。文檔圖像處 理裝置IO分析所獲得的文檔圖像的版面布局(S102),并根據(jù)版面 布局分析結(jié)果從文檔圖像中指定包括字符行的語句區(qū)域。此外,文檔 圖像處理裝置10提取出所指定語句區(qū)域中包括的各行的字符行圖像 (S103),并將提取出的字符行圖像存儲到存儲器中。
接下來,文檔圖像處理裝置IO通過預(yù)定圖像處理將所提取的字 符行圖像分割成各個字符的矩形區(qū)域,從而識別字符(S104)。文 檔圖像處理裝置IO分析通過進(jìn)行字符識別而得到的字符所構(gòu)成的原 始語句字符行的結(jié)構(gòu),然后將原始語句字符行翻譯成預(yù)定語言 (S105),以生成翻譯語句字符行。
根據(jù)語句區(qū)域的大小和對語句區(qū)域設(shè)定的行間比率、翻譯語句 字符行的字符數(shù)量以及字符行圖像的長度等,文檔圖像處理裝置10 確定所生成的翻譯語句字符行和存儲在存儲器中的字符行圖像(原始 語句)各自的大小和各自在語句區(qū)域中的布置(S106)。下面將參 照圖5所示的流程圖說明該確定處理的細(xì)節(jié)。
首先,文檔圖像處理裝置10設(shè)定用作行間距的區(qū)域相對于語句 區(qū)域的比率(下文中稱為"行間比率")(S201)。行間比率是除 了布置字符行圖像和翻譯語句字符行的區(qū)域以外的區(qū)域與語句區(qū)域 的比率。該行間比率可以根據(jù)原始語句區(qū)域的行間距比率來確定,或 者可以將行間比率預(yù)先設(shè)定成預(yù)定值。 接下來,將字符行圖像(原始語句字符)和翻譯語句字符的大
小比率暫時設(shè)定成預(yù)定值(S202)。在本文中,根據(jù)各字符的高度 比率設(shè)定大小比率。例如,各個大小可以設(shè)定成使得原始語句字符的 高度Hl與翻譯語句字符的高度H2的比率是1:1或2:1。此外,根據(jù) 基于大小比率設(shè)定的翻譯語句字符的字符大小來計算翻譯語句字符 行的總長度(S203)。
這里,當(dāng)原始語句字符行圖像的總長度與翻譯語句字符行的總 長度對齊時(S204中判斷結(jié)果為是),重新調(diào)整每個原始語句字 符行圖像的大小和每個翻譯語句字符行的大小(S205 )??梢灾匦?調(diào)整上述大小,使得例如當(dāng)原始語句字符行圖像和翻譯語句字符行中 較長一個的長度由標(biāo)記N表示,而其中較短一個的長度由標(biāo)記M表 示時,可以通過將較短一個的字符大小乘以N/M來校正上述大小。
接下來,文檔圖像處理裝置IO判斷目前字符大小的原始語句和 翻譯語句是否限制在語句區(qū)域中(S206)。通過如下方式進(jìn)行判斷 即,根據(jù)設(shè)定的行間比率計算能夠在語句區(qū)域中布置原始語句和翻譯 語句的區(qū)域的最大高度HMAX,并判斷H=H1 (原始語句的行原始語 句字符大小的高度)XL1 (行數(shù))+H2 (翻譯語句的行翻譯語句字符 大小)XL2 (行數(shù))是否限制為等于或小于HMAX。這里,當(dāng)H〉Hmax 時,艮卩,當(dāng)判斷為不限制在語句區(qū)域中時(S206中判斷結(jié)果為否), 分別縮小原始語句(圖像)和翻譯語句的字符大小(S207)。對于 縮小率,例如,可以將原始語句(圖像)和翻譯語句分別乘以HMAX/H 以進(jìn)行縮小。此外,縮小率不限于上述情況,而是可以使兩者的縮小 率為不同的縮小率,或者可以僅縮小其中一個。
文檔圖像處理裝置IO對判斷為限制在語句區(qū)域中的原始語句和 翻譯語句分配預(yù)先確定為行間距的區(qū)域(S208)。在分配行間距時, 可以通過與原始語句和翻譯語句對應(yīng)的不同比率構(gòu)成行間距,或者可 以為兩者構(gòu)造相同的行間距。此外,根據(jù)所分配的行間距以及原始語 句和翻譯語句各自的大小布置原始語句字符行圖像和翻譯語句字符 行。
圖3B示出布置有原始語句字符行圖像和翻譯語句字符行的語
句區(qū)域的實(shí)例。如圖3B所示,按照布置一行翻譯語句字符行并在其 下方布置原始語句字符行圖像的規(guī)則,重復(fù)原始語句字符行圖像和翻 譯語句字符行的布置。此外,在圖3B所示的實(shí)例中,原始語句字符 行圖像和翻譯語句字符行的行間距由附圖標(biāo)記d表示。此外,如果每 個原始語句字符行圖像在從左側(cè)連續(xù)地緊密布置時達(dá)到語句區(qū)域的. 行的長度,則在該位置分割字符行圖像,并將分割的剩余部分圖像布 置在下一行中。以這樣的方式,與縮小字符行圖像相對應(yīng)地新生成將 要布置在語句區(qū)域210中的行圖像310A、 310B、 310C和310D,并 且在各個行圖像的上方布置翻譯語句字符行400A、 400B、 400C和 400D。可以通過連接各個原始語句字符行圖像,然后按語句區(qū)域的 各行的長度進(jìn)行分割,從而生成上述行圖像。
當(dāng)完成上述處理時,文檔圖像處理裝置IO生成輸出文檔圖像, 該輸出文檔圖像包括布置有原始語句字符行圖像和翻譯語句字符行 的語句區(qū)域(S107)??梢詫⑤敵鑫臋n圖像生成為位圖數(shù)據(jù),或者. 可以將輸出文檔圖像生成為其它格式的壓縮圖像數(shù)據(jù)。 1
根據(jù)上述文檔圖像處理裝置10,對于沒有為翻譯語句保證布置 空間的文檔圖像而言,可以在維持文檔圖像的版面布局的同時生成包 括原始語句和翻譯語句的文檔圖像。
此外,本發(fā)明不限于上述示例性實(shí)施例。
雖然根據(jù)上述示例性實(shí)施例將輸出文檔的數(shù)據(jù)生成為圖像數(shù) 據(jù),但是本發(fā)明不限于此,而是可以將輸出文檔的數(shù)據(jù)生成為處理電 子文檔的計算機(jī)應(yīng)用程序的應(yīng)用數(shù)據(jù)。
此外,對從文檔圖像提取出的原始字符行圖像和翻譯語句字符 行進(jìn)行布置的模式不限于上述示例性實(shí)施例所示的模式。圖6A至6C 示出布置語句區(qū)域的模式的其它實(shí)例。
例如,當(dāng)連接原始語句字符行圖像而得的長度和連接翻譯語句 字符行而得的長度不相等時以及當(dāng)長度不對齊時,如圖6A所示,較 長字符行(附圖中為翻譯語句字符行)的至少一部分的多行可以共同 地布置在較短字符行之間(附圖中為原始語句字符行圖像)。
此外,如圖6B所示,對于段落、短文、標(biāo)點(diǎn)等語句結(jié)構(gòu)的各個
語句塊,可以將原始語句字符行圖像和翻譯語句字符行分別共同地布 置在語句區(qū)域210中。
此外,如圖6C所示,可以將根據(jù)原始語句字符行圖像翻譯的翻
譯語句字符行布置在原始語句字符行圖像的上側(cè)或下側(cè),可以校正翻 譯語句字符行的字符大小以將翻譯語句字符行限制在原始語句字符 行圖像的長度內(nèi)。因此,可以清楚地示出原始語句字符行圖像的翻譯 和翻譯語句字符行的對應(yīng)關(guān)系。
此外,通過使原始語句字符行圖像和翻譯語句字符行的顏色彼 此不同,可以使這兩者視覺上彼此不同。
上面出于舉例和說明的目的己經(jīng)提供了對本發(fā)明的示例性實(shí)施
例的說明。這并不表示上述實(shí)施例是排他性的或者本發(fā)明只限于所公
開的準(zhǔn)確形式。很顯然,本領(lǐng)域的技術(shù)人員將會很清楚很多修改和變
化形式。所選擇和說明的示例性實(shí)施例是為了更好地解釋本發(fā)明的原 理及其實(shí)際應(yīng)用,由此使本領(lǐng)域的其它技術(shù)人員能夠理解本發(fā)明的各
種實(shí)施例以及適合于所設(shè)計的具體應(yīng)用的各種修改形式。本發(fā)明的范 圍受所附權(quán)利要求書及其等同物限定。
權(quán)利要求
1. 一種文檔圖像處理裝置,包括指定部分,其從文檔圖像中指定包括字符行的語句區(qū)域;提取部分,其提取所指定的語句區(qū)域中包括的至少一個字符行圖像;識別部分,其識別提取出的字符行圖像中所包括的各個字符;翻譯部分,其翻譯由識別出的字符構(gòu)成的原始語句字符行并生成翻譯語句字符行;布置部分,其通過縮小各個字符行圖像而在所述語句區(qū)域中布置各個字符行圖像,并且在所述語句區(qū)域中除了布置各個字符行圖像的區(qū)域以外的空白區(qū)域中布置所生成的各個翻譯語句字符行;以及生成部分,其生成在所述語句區(qū)域中布置有各個字符行圖像和各個翻譯語句字符行的輸出文檔的數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的文檔圖像處理裝置,其中, 所述布置部分在所述語句區(qū)域中布置行圖像,以及 通過以所述語句區(qū)域的行的長度對通過連接所縮小的各個字符行圖像而構(gòu)成的圖像進(jìn)行分割來構(gòu)造每個行圖像。
3. 根據(jù)權(quán)利要求1所述的文檔圖像處理裝置,還包括 確定部分,其確定所述字符行圖像的大小和所述翻譯語句字符行的字符大小,從而使得連接各個字符行圖像而得的長度和連接各個 翻譯語句字符行而得的長度大致彼此相等。
4. 根據(jù)權(quán)利要求2所述的文檔圖像處理裝置,還包括 確定部分,其確定所述字符行圖像的大小和所述翻譯語句字符行的字符大小,從而使得連接各個字符行圖像而得的長度和連接各個 翻譯語句字符行而得的長度大致彼此相等。
5. 根據(jù)權(quán)利要求2所述的文檔圖像處理裝置,其中, 所述布置部分在所述語句區(qū)域中布置行語句;通過以所述語句區(qū)域的行的長度對通過連接各個翻譯語句字符 行而構(gòu)成的語句進(jìn)行分割來構(gòu)造每個行語句;當(dāng)連接各個字符行圖像而得的長度大于連接各個翻譯語句字符 行而得的長度時,將一些行圖像共同地布置在所述行語句之間;以及當(dāng)連接各個字符行圖像而得的長度小于連接各個翻譯語句字符 行而得的長度時,將一些行語句共同地布置在所述行圖像之間。
6. 根據(jù)權(quán)利要求1至5中任一項所述的文檔圖像處理裝置,其中,與包括至少一個原始語句字符行的語句結(jié)構(gòu)對應(yīng)地將所述字符 行圖像和所述翻譯語句字符行分別共同地布置。
7. 根據(jù)權(quán)利要求1至5中任一項所述的文檔圖像處理裝置,其中,所述布置部分將根據(jù)所述字符行圖像翻譯的翻譯語句字符行布 置在所述語句區(qū)域中的字符行圖像的上側(cè)或者下側(cè);以及所述布置部分調(diào)整所述翻譯語句字符行的各個字符的字符大 小,以使所述翻譯語句字符行限制在所述字符行圖像的長度內(nèi)。
8. —種文檔圖像處理方法,包括提取所指定的語句區(qū)域中所包括的至少一個字符行圖像;識別提取出的字符行圖像中所包括的各個字符;翻譯由識別出的字符構(gòu)成的原始語句字符行并生成翻譯語句字符行;通過縮小各個字符行圖像而在所述語句區(qū)域中布置各個字符行 圖像,并且在所述語句區(qū)域中除了布置各個字符行圖像的區(qū)域以外的 空白區(qū)域中布置所生成的各個翻譯語句字符行;以及生成在所述語句區(qū)域中布置有各個字符行圖像和各個翻譯語句 字符行的輸出文檔的數(shù)據(jù)。
9. 根據(jù)權(quán)利要求8所述的文檔圖像處理方法,其中,布置各個字符行圖像的步驟包括在所述語句區(qū)域中布置行圖像;以及通過以所述語句區(qū)域的行的長度對通過連接所縮小的各個字符 行圖像而構(gòu)成的圖像進(jìn)行分割來構(gòu)造每個行圖像。
10. 根據(jù)權(quán)利要求8所述的文檔圖像處理方法,還包括 確定所述字符行圖像的大小和所述翻譯語句字符行的字符大小,從而使得連接各個字符行圖像而得的長度和連接各個翻譯語句字 符行而得的長度大致彼此相等。
11. 根據(jù)權(quán)利要求9所述的文檔圖像處理方法,還包括-確定所述字符行圖像的大小和所述翻譯語句字符行的字-符大 小,從而使得連接各個字符行圖像而得的長度和連接各個翻譯語句字 符行而得的長度大致彼此相等。
12. 根據(jù)權(quán)利要求9所述的文檔圖像處理方法,其中, 布置所生成的各個翻譯語句字符行的步驟包括在所述語句區(qū)域中布置行語句;通過以所述語句區(qū)域的行的長度對通過連接各個翻譯語句字符 行而構(gòu)成的語句進(jìn)行分割來構(gòu)造每個行語句;當(dāng)連接各個字符行圖像而得的長度大于連接各個翻譯語句字符 行而得的長度時,將一些行圖像共同地布置在所述行語句之間;以及當(dāng)連接各個字符行圖像而得的長度小于連接各個翻譯語句字符 行而得的長度時,將一些行語句共同地布置在所述行圖像之間。
13. 根據(jù)權(quán)利要求8至12中任一項所述的文檔圖像處理方法,其中, 與包括至少一個原始語句字符行的語句結(jié)構(gòu)對應(yīng)地將所述字符 行圖像和所述翻譯語句字符行分別共同地布置。
14.根據(jù)權(quán)利要求8至12中任一項所述的文檔圖像處理方法,其中,布置各個字符行圖像和所生成的各個翻譯語句字符行的步驟包括將根據(jù)所述字符行圖像翻譯的翻譯語句字符行布置在所述語句區(qū)域中的字符行圖像的上側(cè)或者下側(cè);以及布置所生成的各個翻譯語句字符行的步驟包括設(shè)置所述翻譯 語句字符行的各個字符的字符大小,以使所述翻譯語句字符行限制在 所述字符行圖像的長度內(nèi)。
全文摘要
本發(fā)明公開一種文檔圖像處理裝置,包括指定部分、提取部分、識別部分、翻譯部分、布置部分和生成部分。所述指定部分從文檔圖像中指定包括字符行的語句區(qū)域。所述提取部分提取所指定的語句區(qū)域中包括的至少一個字符行圖像。所述識別部分識別提取出的字符行圖像中所包括的各個字符。所述翻譯部分翻譯由識別出的字符構(gòu)成的原始語句字符行并生成翻譯語句字符行。所述布置部分通過縮小各個字符行圖像而在語句區(qū)域中布置各個字符行圖像。所述布置部分在語句區(qū)域中除了布置各個字符行圖像的區(qū)域以外的空白區(qū)域中布置所生成的各個翻譯語句字符行。
文檔編號G06T11/60GK101377855SQ200810094509
公開日2009年3月4日 申請日期2008年4月18日 優(yōu)先權(quán)日2007年8月27日
發(fā)明者今野裕也 申請人:富士施樂株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1