專利名稱:圖像處理裝置和圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置和圖像處理方法。
背景技術(shù):
已知這樣一種系統(tǒng),其對通過OCR從掃描文檔中獲取的文本進(jìn) 行翻譯,并在使譯文適應(yīng)原始文檔的版面布局的條件下輸出譯文(例 如參見專利文獻(xiàn)l ( JP-A-8-6948))。
然而,在公知技術(shù)中,為了保持原始文檔的版面布局,譯文的字 符大小基于語句區(qū)域的大小及翻譯后的字符數(shù)來確定。因此,存在這 樣的情況,即在原始文檔中具有相同大小的字符被輸出為在譯文中 具有不同大小的字符。為此,在公知技術(shù)中存在這樣的問題,g卩無
法保持原始文檔中各個(gè)文檔區(qū)域之間的字符大小相對關(guān)系。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供這樣一種圖像處理裝置和圖像處理方法 其允許保持文檔的翻譯前后文檔中各語句區(qū)域之間的字符大小相對關(guān) 系。根據(jù)本發(fā)明的一個(gè)方面,提供一種圖像處理裝置,該圖像處 理裝置包括區(qū)域劃分部、字符識別部、分類部、翻譯部、計(jì)算部和校 正部。區(qū)域劃分部將文檔圖像劃分成至少一個(gè)語句區(qū)域。字符識別部 對通過所述區(qū)域劃分部劃分的各個(gè)語句區(qū)域中包含的字符進(jìn)行識別。 分類部根據(jù)通過所述字符識別部識別出的字符的大小而將所述語句 區(qū)域分類成至少一個(gè)組。翻譯部為所述各個(gè)語句區(qū)域而將相應(yīng)語句區(qū) 域中的包含字符的語句翻譯成給定語言。計(jì)算部基于翻譯前相應(yīng)語句 區(qū)域的大小、行間距和字符間距以及翻譯后語句的字符數(shù),計(jì)算已經(jīng) 通過所述翻譯部為所述各個(gè)語句區(qū)域翻譯的語句的字符大小。校正部為通過所述分類部分類成同一組的每一個(gè)語句區(qū)域校正每一個(gè)語句 區(qū)域的翻譯出的字符的大小,以使通過所述計(jì)算部計(jì)算出的各字符大 小變?yōu)橄嗟?。根?jù)第[l]項(xiàng)所述的圖像處理裝置,所述校正部可以進(jìn)行校 正,以便匹配通過所述分類部分類成同一組的語句區(qū)域之中的最小字 符大小。根據(jù)第[1]項(xiàng)或第[2]項(xiàng)所述的圖像處理裝置,所述圖像處理 裝置還可包括順序確定部,其基于通過所述分類部分類而成的各組 的字符大小確定各組的順序。所述校正部可以校正所述各個(gè)語句區(qū)域 的字符大小,以使通過所述順序確定部確定的各組的順序保持不變。根據(jù)第[3]項(xiàng)所述的圖像處理裝置,所述圖像處理裝置還可以 包括字符大小信息存儲部,其存儲通過所述分類部分類而成的各組 的字符大小比例。所述校正部可以基于存儲在所述字符大小信息存儲 部中的各組的字符大小比例校正各組的字符大小。根據(jù)本發(fā)明的另一方面,提供一種圖像處理二方法,該圖像處 理方法包括將文檔圖像劃分成至少一個(gè)語句區(qū)域;識別所述各個(gè)語 句區(qū)域中包含的字符;根據(jù)識別出的字符的大小而將所述語句區(qū)域分 類成至少一個(gè)組;為所述各個(gè)語句區(qū)域而將相應(yīng)語句區(qū)域中的包含字 符的語句翻譯成給定語言;基于翻譯前相應(yīng)語句區(qū)域的大小、行間距 和字符間距以及翻譯后語句的字符數(shù),來計(jì)算已經(jīng)為所述各個(gè)語句區(qū) 域翻譯的語句的字符大??;以及對分類成同一組的每一個(gè)語句區(qū)域校 正每一個(gè)語句區(qū)域的翻譯出的字符的大小,以使計(jì)算出的各字符大小
變?yōu)橄嗟?。根?jù)第[5]項(xiàng)所述的圖像處理方法,校正翻譯出的字符的大
小的步驟可以包括進(jìn)行校正,以便匹配分類成同一組的語句區(qū)域之
中的最小字符大小。根據(jù)第[5]項(xiàng)或第[6]項(xiàng)所述的圖像處理方法,所述圖像處理 方法還可包括基于分類的各組的字符大小來確定各組的順序。校正 翻譯出的字符的大小的步驟可以包括校正所述各個(gè)語句區(qū)域的字符 大小,以使確定的各組的順序保持不變。
5[8]根據(jù)第[7]項(xiàng)所述的圖像處理方法,所述圖像處理方法還可 包括存儲分類后的各組的字符大小比例。校正翻譯出的字符的大小 的步驟可以包括基于所存儲的各組的字符大小比例來校正各組的字 符大小。
根據(jù)第[1]項(xiàng)或第[5]項(xiàng),可以保持文檔的翻譯前后各語句區(qū)域之 間的字符大小相對關(guān)系。
根據(jù)第[2]項(xiàng)或第[6]項(xiàng),可以在保持文檔圖像的版面布局的同時(shí) 保持各語句區(qū)域之間的字符大小相對關(guān)系。
根據(jù)第[3]項(xiàng)或第[7]項(xiàng),可以保持各語句區(qū)域的字符大小的順序。 根據(jù)第[4]項(xiàng)或第[8]項(xiàng),可以清楚各語句區(qū)域之間的字符大小相 對關(guān)系。
附圖簡要說明
基于下列附圖對本發(fā)明的示例性實(shí)施例進(jìn)行詳細(xì)說明,其中
圖、是示出根據(jù)示例性實(shí)施例的圖像處理系統(tǒng)的系統(tǒng)構(gòu)造的視
圖2是示出生成翻譯文檔的處理的流程圖3A、 3B、 3C和3D是示出掃描圖像的版面布局的實(shí)例的視圖; 圖4是示出確定語句區(qū)域的字符大小的處理的流程圖;以及 圖5A、 5B、 5C和5D是示出確定組的字符大小的處理的具體實(shí) 例的視圖。
具體實(shí)施例方式
在下文中,將參照附圖對用于實(shí)施本發(fā)明的示例性實(shí)施例進(jìn)行說明。
圖1是示出根據(jù)示例性實(shí)施例的圖像處理系統(tǒng)1的系統(tǒng)構(gòu)造的視 圖。如圖l所示,圖像處理系統(tǒng)l是包括圖像處理裝置10和掃描儀20 的系統(tǒng)。根據(jù)示例性實(shí)施例的圖像處理裝置10和掃描儀20各自具有 USB接口,并通過使USB接口彼此連接的USB線纜在其間進(jìn)行數(shù)據(jù) 通信。掃描儀20是包括CCD照相機(jī)并通過使用CCD照相機(jī)掃描文檔圖 像來生成掃描圖像的圖像掃描裝置。掃描儀20將生成的掃描圖像發(fā)送 到通過USB接口與其連接的圖像處理裝置10。
圖像處理裝置10是對從掃描儀20接收到的掃描圖像進(jìn)行圖像處 理的裝置。圖像處理裝置IO是這樣的計(jì)算機(jī),其至少包括CPU(中央 處理器)或存儲器作為硬件,并通過使CPU依次執(zhí)行存儲在存儲器中 的程序來進(jìn)行處理。另外,如圖1所示,圖像處理裝置IO包括圖像獲 取部100、版面布局分析部102、字符識別部104、字符大小測量部106、 組別分類部108、翻譯處理部IIO、字符大小確定部112和翻譯文檔生 成部114作為功能構(gòu)造。上述各部分的功能可通過以下方式實(shí)現(xiàn)使 用介質(zhì)讀取器(未示出)使存儲在計(jì)算機(jī)可讀的信息存儲介質(zhì)中的圖 像處理程序讀出到作為計(jì)算機(jī)系統(tǒng)的圖像處理裝置10中,并使圖像處 理裝置IO執(zhí)行所讀出的圖像處理程序。另外,盡管在這里圖像處理程 序是通過信息存儲介質(zhì)提供給圖像處理裝置10的,然而也可通過例如 互聯(lián)網(wǎng)等數(shù)據(jù)通信網(wǎng)絡(luò)將圖像處理程序從遠(yuǎn)程地點(diǎn)下載到圖像處理裝 置10。在下文中,將對上述各部分的細(xì)節(jié)進(jìn)行說明。
圖像獲取部100從與其連接的掃描儀20接收并獲取掃描圖像。掃 描圖像通過USB線纜進(jìn)行接收。
版面布局分析部102分析通過圖像獲取部IOO獲取的掃描圖像的 版面布局。版面布局分析是通過將文檔圖像劃分成標(biāo)題區(qū)域、文檔區(qū) 域、頁眉/頁腳區(qū)域、圖形區(qū)、表格區(qū)等而進(jìn)行的??蓪⒐夹g(shù)用于 版面布局分析。另外,從通過版面布局分析部102分析的版面布局中 提取包含文本的區(qū)域(在下文中稱為語句區(qū)域)作為要處理的對象。 也可通過排除例如只包含圖形的區(qū)域等不包含字符的區(qū)域來進(jìn)行語句 區(qū)域的提取。
字符識別部104通過OCR處理來識別語句區(qū)域中包含的字符。 OCR處理是通過以下方式進(jìn)行的將語句區(qū)域劃分成與相應(yīng)字符對應(yīng) 的區(qū)域,對每個(gè)細(xì)分區(qū)域進(jìn)行圖案匹配,并基于匹配結(jié)果確定每個(gè)細(xì) 分區(qū)域中包含的字符。
字符大小測量部106測量每個(gè)語句區(qū)域中包含的字符的大小(在下文中稱為字符大小),字符大小的測量值可以是從語句區(qū)域的至少 一部分中的通過字符識別部104識別出的字符的大小計(jì)算出的平均值, 或者也可以是字符大小的常用值。字符大小的測量是對所有語句區(qū)域 進(jìn)行的,并且測量出的字符大小存儲在存儲器中以便與各個(gè)語句區(qū)域
相關(guān)聯(lián)。
組別分類部108根據(jù)對各語句區(qū)域測量的字符大小將語句區(qū)域分
類成各個(gè)組??蛇@樣進(jìn)行組的分類,即將具有相同字符大小的語句 區(qū)域分類成同一組,或者將字符大小屬于預(yù)定范圍的語句區(qū)域分類成 同一組。在該示例性實(shí)施例中,具有相同字符大小的語句區(qū)域被分類 成同一組。
翻譯處理部110對每個(gè)語句區(qū)域中包含的語句進(jìn)行語法分析,然
后將該語句翻譯成不同語言(例如英語)。這里,語句區(qū)域中包含的
語句是作為通過字符識別部104進(jìn)行的識別的結(jié)果而獲得的文本數(shù)據(jù)。
可將公知技術(shù)用于翻譯處理。
在翻譯處理之后,字符大小確定部112確定每個(gè)語句區(qū)域的字符 大小。字符大小確定部112包括字符大小計(jì)算部112A和字符大小校正 部112B。
字符大小計(jì)算部112A基于語句區(qū)域的大小、行間距、字符間距 以及通過對語句區(qū)域中所含的文本進(jìn)行翻譯而獲取的譯文的字符數(shù)來 計(jì)算允許譯文能夠適應(yīng)相應(yīng)語句區(qū)域的字符大小。字符大小計(jì)算部
112A對每個(gè)語句區(qū)域進(jìn)行字符大小計(jì)算處理。
字符大小校正部112B校正譯文的字符大小,以便保持原文(原 稿)中各語句區(qū)域之間的字符大小相對關(guān)系。由字符大小校正部112B 進(jìn)行的第一校正是這樣進(jìn)行的校正,即使通過字符大小計(jì)算部112A 計(jì)算出的各語句區(qū)域的字符大小對于每一個(gè)分類組都是相等的。例如, 第一校正是通過使其它語句區(qū)域的字符大小與同一組中包含的語句區(qū) 域中的最小字符大小匹配。這樣,對每一個(gè)組來說,組中的字符大小 得到統(tǒng)一以便適應(yīng)語句區(qū)域。
另外,由字符大小校正部112B進(jìn)行的第二校正是這樣進(jìn)行的校 正,即使各組之間的字符大小的順序與原始文檔中的相應(yīng)順序一致。第二校正是通過以下方式進(jìn)行的判斷各組之間的字符大小的順序是 否與原始文檔中的相應(yīng)順序一致,并在判定各組之間的字符大小的順 序不與原始文檔中的相應(yīng)順序一致的情況下,進(jìn)一步校正順序不匹配 的組(在下文中稱為"不匹配組")的字符大小。例如,可這樣進(jìn)行 第二校正,即使為不匹配組存儲的原始順序之前和之后的組的字符 大小之間所包括的字符大小成為不匹配組的新的字符大小。
另外,在第二校正中,可將原始的各組之間的字符大小的比例存 儲在存儲器中,以便基于存儲在存儲器中的字符大小的比例進(jìn)一步校 正翻譯后各組的字符大小。具體地說,假設(shè)原始組的字符大小分別為5 點(diǎn)、10點(diǎn)和20點(diǎn),則可將這些字符大小的比例1:2:4存儲在存儲器中, 然后可以這樣校正翻譯后中間組的字符大小,即使中間組的字符大 小與其之前和之后的組的字符大小之間的間距之比為(2-l):(4-2),即 1:2。
翻譯文檔生成部114基于通過版面布局分析部102分析的版面布 局、如上所述確定的每個(gè)語句區(qū)域的譯文以及每個(gè)語句區(qū)域的字符大 小來生成翻譯文檔數(shù)據(jù)。例如,翻譯文檔數(shù)據(jù)可以以文字處理軟件的 數(shù)據(jù)格式或者例如PDL數(shù)據(jù)等預(yù)定數(shù)據(jù)格式來生成。
接下來,將參照圖2至圖5說明使用圖像處理裝置10從原始文檔 (掃描圖像)生成翻譯文檔的處理的具體流程。圖2是示出生成翻譯 文檔的處理的流程圖。
圖像處理裝置10將掃描指令發(fā)送到掃描儀20。當(dāng)掃描儀20從圖 像處理裝置10接收到掃描指令時(shí),掃描儀20通過使用CCD照相機(jī)掃 描一組文檔圖像而生成掃描圖像。掃描儀20將生成的掃描圖像發(fā)送給 圖像處理裝置10,圖像處理裝置10接收并獲取所發(fā)送的掃描圖像
(5101) 。
圖像處理裝置10分析從掃描儀20接收到的掃描圖像的版面布局
(5102) ,并指定掃描圖像的版面布局中包括的語句區(qū)域。這里,在 圖3A、3B、3C和3D中示出掃描圖像的版面布局的實(shí)例作為具體實(shí)例。 如圖3A、 3B、 3C和3D所示,掃描圖像200包括語句區(qū)域a至f。
圖像處理裝置10對經(jīng)分析的版面布局中包含的各語句區(qū)域a至f進(jìn)行用于識別每個(gè)語句區(qū)域中包含的字符的處理(S103)。
然后,圖像處理裝置IO對每個(gè)語句區(qū)域測量字符大小(S104)。
例如,字符大小的測量可以通過對每個(gè)語句區(qū)域計(jì)算從語句區(qū)域中識
別出的字符的大小的平均值或常用值來進(jìn)行。另外,圖3A的各語句區(qū) 域中所示的是作為測量結(jié)果而獲取的原文的字符大小。
當(dāng)對所有語句區(qū)域的進(jìn)行字符大小測量處理時(shí),圖像處理裝置10 基于對各語句區(qū)域測量的字符大小將各語句區(qū)域分類成各個(gè)組 (S105)。在該示例性實(shí)施例中,具有相同字符大小的語句區(qū)域被分 類成同一組。在圖3A所示實(shí)例中,"a" 、 "b" 、 "c, f"和"d, e" 被分類成不同的組。另外,按字符大小從小到大的順序?qū)⒏鱾€(gè)組設(shè)置 為Gl(d, e)、 G2(a)、 G3(c, f)和G4(b),并且每組的字符大小及與字符大 小對應(yīng)的順序被存儲在存儲器中。
在完成上述分組處理之后,圖像處理裝置IO進(jìn)行這樣的處理,即 將各語句區(qū)域中包含識別出的字符的語句翻譯成給定語言(例如英語 或漢語)—(S106)。
在完成上述翻譯處理之后,圖像處理裝置IO確定每個(gè)語句區(qū)域的 字符大小,以使翻譯后的語句(在下文中稱為翻譯語句)適應(yīng)每個(gè)語 句區(qū)域并保持原文中各文檔區(qū)域之間的字符大小相對關(guān)系(S107)。 這里,將參照圖4所示流程圖說明確定每個(gè)語句區(qū)域的字符大小的處 理。
首先,如圖4所示,圖像處理裝置IO基于語句區(qū)域的大小和翻譯 語句的字符數(shù)對每個(gè)語句區(qū)域計(jì)算適應(yīng)語句區(qū)域的字符大小(S201)。 在圖3B中,在各語句區(qū)域中所示的是通過上述計(jì)算獲得的字符大小。
在完成計(jì)算字符大小的處理之后,圖像處理裝置IO對每一組確定 屬于該組的各語句區(qū)域的字符大小中的最小字符大小作為該組的字符 大小(S202)。然后,屬于同一組的各語句區(qū)域的所有字符大小都暫 時(shí)改變?yōu)樗_定的組的字符大小。這是字符大小的第一校正。在圖3C 中,在各語句區(qū)域中所示的是通過第一校正改變的字符大小。
然后,在對所有組完成字符大小確定處理之后,圖像處理裝置IO 基于所確定的字符大小判斷是否保持原始文檔圖像中各組之間的字符大小順序(S203)。這里,如果判定沒有保持各組之間的順序(S203 中判斷結(jié)果為否),則圖像處理裝置IO計(jì)算每組的字符大小,以使 各組的順序保持不變,然后將計(jì)算出的值設(shè)置為新的字符大小(S204)。 這是字符大小的第二校正。
這里,參照圖5A、 5B、 5C禾P5D,利用具體實(shí)例說明確定組的字 符大小的處理。圖5A、 5B、 5C和5D示出了如何根據(jù)上述流程確定每 個(gè)語句區(qū)域的字符大小。也就是說,圖像處理裝置IO首先為每個(gè)字符 大小形成組(圖5A),計(jì)算適應(yīng)翻譯處理后的版面布局的字符大小(圖 5B),然后統(tǒng)一每組的字符大小(圖5C)。在這種狀態(tài)下,圖像處理 裝置IO判斷統(tǒng)一后的字符大小是否保持原始文檔中的順序??梢酝ㄟ^ 按當(dāng)前確定的字符大小從小到大的順序?qū)?dāng)前確定的字符大小與原始 順序的字符大小作比較,來對是否保持各組的順序做出判斷。
在該示例性實(shí)施例的實(shí)例中,"d,e"是組Gl,其順序與原始順 序相同,而下一個(gè)小組"c,f"是組G3。因此,做出字符大小的順序與 原文的順序不同的判定。這里,為了使各組的順序恢復(fù)到原始狀態(tài), 這樣計(jì)算原來是第二組的組G2的字符大小,即使原始的各組之間的 字符大小的相對關(guān)系保持不變,以使組G2的字符大小成為翻譯后當(dāng)前 第一組(Gl)的字符大小和翻譯后當(dāng)前第二組(G3)的字符大小之間 的大小。字符大小的計(jì)算是基于組G1、組G2和組G3的各自原始字符 大小的比例進(jìn)行的。在上述實(shí)例中,可以計(jì)算下述字符大小以便將計(jì) 算出的值設(shè)定為組G2的字符大小所述字符大小與這樣的位置對應(yīng), 在該位置處,基于組Gl、組G2和組G3的各自原始字符大小的比例 8:10:12的包括組Gl與組G2之間的間距以及組G2與組G3之間的間 距的間距(即如圖5A所示的組G1與組G3之間的間距)被劃分成1:1。 在所計(jì)算出的字符大小不是整數(shù)值的情況下,可將最接近于所計(jì)算出 的字符大小的整數(shù)值設(shè)定為新的字符大小。另外,當(dāng)將所計(jì)算出的字 符大小設(shè)定為新的組G2的字符大小時(shí),組G3和組G4的順序分別設(shè) 置為3和4,從而使各語句區(qū)域的順序變?yōu)榕c原始狀態(tài)相同。
在完成字符大小確定處理之后,圖像處理裝置10轉(zhuǎn)入步驟S108, 其中,基于每個(gè)語句區(qū)域的已確定的字符大小生成翻譯文檔(S108),然后結(jié)束處理。
另外,本發(fā)明不局限于以上實(shí)施例。
例如,可以使字符大小校正部112B進(jìn)一步對各組之間的字符大 小的間距是否小于給定間距做出判斷,并在判定各組之間的字符大小 的間距小于給定間距時(shí)校正各組的字符大小。這里,字符大小的校正 可以通過以等間距排列各組之間的字符大小來進(jìn)行。
在判定分類成同一組的語句區(qū)域的字符大小分布存在偏差、并且 存在字符大小在很大程度上不同的元素的情況下,可以使字符大小確
定部112從該組中排除字符大小在很大程度上不同的元素。
另外,字符大小確定部112在匹配組的字符大小時(shí),可通過改變
字符的縱橫比例,基于大于最小字符大小的字符大小來匹配字符大小。 另外,限制為具有較小字符大小的區(qū)域的語句長度可通過調(diào)整語
句區(qū)域翻譯后的字符間距或行間距來進(jìn)行調(diào)整。
為了解釋和說明起見,己經(jīng)提供了對于本發(fā)明實(shí)施例的前述說
明。本發(fā)明并非意在窮舉或?qū)⒈景l(fā)明限制在所披露的具體形式。顯然, 許多修改和變型對于所屬領(lǐng)域的技術(shù)人員而言是顯而易見的。實(shí)施例 的選取和說明是為了更好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,從而使 所屬領(lǐng)域的其他技術(shù)人員能夠理解本發(fā)明適用于各種實(shí)施例,并且具 有各種變型的本發(fā)明適合于所設(shè)想的特定用途。本發(fā)明意在用所附權(quán) 利要求書及其等同內(nèi)容來限定本發(fā)明的保護(hù)范圍。
1權(quán)利要求
1.一種圖像處理裝置,包括區(qū)域劃分部,其將文檔圖像劃分成至少一個(gè)語句區(qū)域;字符識別部,其對通過所述區(qū)域劃分部劃分的各個(gè)語句區(qū)域中包含的字符進(jìn)行識別;分類部,其根據(jù)通過所述字符識別部識別出的字符的大小而將所述語句區(qū)域分類成至少一個(gè)組;翻譯部,其為所述各個(gè)語句區(qū)域而將相應(yīng)語句區(qū)域中的包含字符的語句翻譯成給定語言;計(jì)算部,其基于翻譯前相應(yīng)語句區(qū)域的大小、行間距和字符間距以及翻譯后語句的字符數(shù),來計(jì)算已經(jīng)通過所述翻譯部為所述各個(gè)語句區(qū)域翻譯出的語句的字符大??;以及校正部,其為通過所述分類部分類成同一組的每一個(gè)語句區(qū)域校正每一個(gè)語句區(qū)域的翻譯出的字符的大小,以使通過所述計(jì)算部計(jì)算出的各字符大小變?yōu)橄嗟取?br>
2. 根據(jù)權(quán)利要求1所述的圖像處理裝置,其中, 所述校正部進(jìn)行校正,以便匹配通過所述分類部分類成同一組的語句區(qū)域之中的最小字符大小。
3. 根據(jù)權(quán)利要求1或2所述的圖像處理裝置,還包括順序確定部,其基于通過所述分類部分類而成的各組的字符大 小來確定各組的順序,其中,所述校正部校正所述各個(gè)語句區(qū)域的字符大小,以使通 過所述順序確定部確定的各組的順序保持不變。
4. 根據(jù)權(quán)利要求3所述的圖像處理裝置,還包括 字符大小信息存儲部,其存儲通過所述分類部分類而成的各組的字符大小比例,其中,所述校正部基于存儲在所述字符大小信息存儲部中的各 組的字符大小比例來校正各組的字符大小。
5. —種圖像處理方法,包括 將文檔圖像劃分成至少一個(gè)語句區(qū)域; 識別各個(gè)語句區(qū)域中包含的字符;根據(jù)識別出的字符的大小而將所述語句區(qū)域分類成至少一個(gè)組;為所述各個(gè)語句區(qū)域而將相應(yīng)語句區(qū)域中的包含字符的語句翻 譯成給定語言;基于翻譯前相應(yīng)語句區(qū)域的大小、行間距和字符間距以及翻譯 后語句的字符數(shù),來計(jì)算己經(jīng)為所述各個(gè)語句區(qū)域翻譯出的語句的字 符大?。灰约盀榉诸惓赏唤M的每一個(gè)語句區(qū)域校正每一個(gè)語句區(qū)域的翻譯 出的字符的大小,以使計(jì)算出的各字符大小變?yōu)橄嗟取?br>
6. 根據(jù)權(quán)利要求5所述的圖像處理方法,其中, 校正翻譯出的字符的大小的步驟包括進(jìn)行校正,以便匹配分類成同一組的語句區(qū)域之中的最小字符大小。
7. 根據(jù)權(quán)利要求5或6所述的圖像處理方法,還包括 基于分類的各組的字符大小來確定各組的順序,其中,校正翻譯出的字符的大小的步驟包括校正所述各個(gè)語 句區(qū)域的字符大小,以使所確定的各組的順序保持不變。
8. 根據(jù)權(quán)利要求7所述的圖像處理方法,還包括 存儲分類后的各組的字符大小比例,其中,校正翻譯出的字符的大小的步驟包括基于所存儲的各 組的字符大小比例來校正各組的字符大小。
全文摘要
本發(fā)明公開一種圖像處理裝置,該圖像處理裝置包括區(qū)域劃分部、字符識別部、分類部、翻譯部、計(jì)算部和校正部。區(qū)域劃分部將文檔圖像劃分成語句區(qū)域。字符識別部識別各個(gè)語句區(qū)域中的字符。分類部根據(jù)字符的大小而將語句區(qū)域分類成各個(gè)組。翻譯部為各個(gè)語句區(qū)域而將語句翻譯成給定語言。計(jì)算部計(jì)算已經(jīng)通過翻譯部為各個(gè)語句區(qū)域翻譯出的語句的字符大小。校正部為被分類成同一組的每一個(gè)語句區(qū)域校正每一個(gè)語句區(qū)域的翻譯出的字符的大小,以使通過計(jì)算部計(jì)算出的各字符大小變?yōu)橄嗟取?br>
文檔編號G06K9/22GK101320429SQ200810094520
公開日2008年12月10日 申請日期2008年4月18日 優(yōu)先權(quán)日2007年6月4日
發(fā)明者今野裕也 申請人:富士施樂株式會社