專利名稱:翻譯裝置和翻譯方法
技術領域:
本發(fā)明涉及一種翻譯裝置和翻譯方法。
背景技術:
已知這樣一種裝置即,該裝置分析具有第一語言的原始語句 的文檔的掃描圖像以將包含在該掃描圖像中的原始語句翻譯成第二
語言并輸出。例如,日本專利No.3636490披露了這樣一種技術在 用翻譯語句替換掃描圖像的原綿語句的同時將該原始語句輸出。另 夕卜,JP-A-5-324720 (這里使用的術語"JP-A"是指"未經(jīng)審查的已
公開日本專利申請")披露了這樣一種技術在各行上下排列原始語 句與翻譯語句的同時將該原始句與翻譯語句輸出。
在日本專利No.3636490所披露的技術中,可以在維持掃描圖像 的版面布局的狀態(tài)下輸出翻譯語句,但是例如不便于比較翻譯語句與 原始語句。另外,在JP-A-5-324720所披露的技術中,在有些情況下 掃描圖像的版面布局可能改變或者翻譯語句中的字符可能過小,從而 難于比較翻譯語句與原始語句。結(jié)果,可能出現(xiàn)降低便利性的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供這樣一種翻譯裝置和程序其可以在顯 著確保用戶的便利性的同時輸出翻譯語句。
(1)根據(jù)本發(fā)明的第一方面,提供了一種翻譯裝置,其包括.-圖像獲取單元,其獲取從包括有第一語言的原始語句的原始文檔(原 稿文檔)中所讀取的原始文檔圖像;翻譯單元,其將包含在所述原始 文檔圖像中的所述原始語句翻譯成第二語言;行間區(qū)域指定單元,其 指定包含在所述原始文檔圖像中的所述原始語句的各行的行間區(qū)域; 第一翻譯文檔生成單元,其通過將翻譯語句布置在所述原始文檔圖像
的各行間區(qū)域中來生成第一翻譯文檔;第二翻譯文檔生成單元,其通 過將所述原始文檔圖像中的所述原始語句替換成所述翻譯語句來生 成第二翻譯文檔;判斷單元,其基于各行間區(qū)域來判斷是否滿足非干 涉條件,其中所述非干涉條件用于判斷所述原始語句是否與所述翻譯
語句相干涉;以及輸出單元,在滿足所述非干涉條件的情況下所述輸 出單元輸出所述第一翻譯文檔,或者在不滿足所述非干涉條件的情況 下所述輸出單元輸出所述第二翻譯文檔。
(2) 根據(jù)第(1)項所述的翻譯裝置,其中,所述判斷單元根 據(jù)所述各行間區(qū)域之間的間隔是否在預定閾值以上來判斷是否滿足 所述非干涉條件。
(3) 根據(jù)第(2)項所述的翻譯裝置,其中,所述判斷單元根 據(jù)所述第一翻譯文檔中與小于所述預定閾值的行間隔相對應的行間 區(qū)域中所布置的翻譯語句的字符(文字)數(shù)目來判斷是否滿足所述非 干涉條件。
(4) 根據(jù)第(3)項所述的翻譯裝置,其中,在與小于所述預
定閾值的行間隔相對應的行間區(qū)域中所布置的翻譯語句的字符數(shù)目 與所述翻譯語句的字符總數(shù)的比率不大于預定比率的情況下,所述判 斷單元判斷為滿足所述非干涉條件。
(5) 根據(jù)第(2)至(4)項中任一項所述的翻譯裝置,還包括
閾值確定單元,其根據(jù)所述第一語言與所述第二語言的組合來確定所 述預定閾值。
(6) 根據(jù)第(1)項所述的翻譯裝置,其中,所述判斷單元根
據(jù)所述原始語句的字符是否與所述第一翻譯文檔中所述翻譯語句的 字符的外接矩形區(qū)域相干涉來判斷是否滿足所述非干涉條件。
(7) 根據(jù)第(6)項所述的翻譯裝置,其中,所述判斷單元根 據(jù)翻譯語句的字符中其外接矩形區(qū)域與所述原始語句的字符相干涉 的字符數(shù)目來判斷是否滿足所述非干涉條件。
(8) 根據(jù)第(7)項所述的翻譯裝置,其中,在翻譯語句的字 符中其外接矩形區(qū)域與所述原始語句的字符相干涉的字符數(shù)目與所 述翻譯語句的字符總數(shù)的比率不大于預定比率的情況下,所述判斷單
元判斷為滿足所述非干涉條件。
(9) 根據(jù)第(1)項所述的翻譯裝置,其中,所述判斷單元根 據(jù)所述原始語句的字符是否與所述第一翻譯文檔中所述翻譯語句的 字符相干涉來判斷是否滿足所述非干涉條件。
(10) 根據(jù)第(9)項所述的翻譯裝置,其中,所述判斷單元根 據(jù)所述翻譯語句的字符與所述原始語句的字符相干涉的部分的像素 數(shù)目來判斷是否滿足所述非干涉條件。
(11) 根據(jù)第(10)項所述的翻譯裝置,其中,在所述翻譯語 句的字符與所述原始語句的字符相干涉的部分的像素數(shù)目與所述翻 譯語句的字符的像素總數(shù)的比率不大于預定比率的情況下,所述判斷 單元判斷為滿足所述非干涉條件。
(12) 根據(jù)第(1)至(11)項中任一項所述的翻譯裝置,其中,
所述第一翻譯文檔生成單元在將各行間區(qū)域中的像素值平滑化之后 將所述翻譯語句布置在各行間區(qū)域中。
(13) 根據(jù)第(1)至(11)項中任一項所述的翻譯裝置,其中, 所述第一翻譯文檔生成單元在將各行間區(qū)域中的像素值設定成預定 值之后將所述翻譯語句布置在各行間區(qū)域中。
(14) 根據(jù)第(1)至(13)項中任一項所述的翻譯裝置,其中, 所述第一翻譯文檔生成單元根據(jù)所述行間區(qū)域的背景顏色來確定布 置在各行間區(qū)域中的所述翻譯語句的字符顏色。
(15) 根據(jù)第(1)至(14)項中任一項所述的翻譯裝置,其中, 所述原始文檔包括圖片,并且所述第二翻譯文檔生成單元指定所述原 始文檔圖像中所述圖片的圖片區(qū)域,并且在至少有一部分原始語句包 含在所指定的區(qū)域中的情況下,限制將所述至少一部分原始語句替換 成翻譯語句。
(16) 根據(jù)本發(fā)明的第二方面,提供了一種翻譯方法,其包括 獲取從包括有第一語言的原始語句的原始文檔中所讀取的原始文檔 圖像;將包含在所述原始文檔圖像中的所述原始語句翻譯成第二語 言;指定包含在所述原始文檔圖像中的所述原始語句的各行的行間區(qū) 域;通過將翻譯語句布置在所述原始文檔圖像的各行間區(qū)域中來生成
第一翻譯文檔;通過將所述原始文檔圖像中的所述原始語句替換成所 述翻譯語句來生成第二翻譯文檔;基于各行間區(qū)域判斷是否滿足非干 涉條件,其中所述非干涉條件用于判斷所述原始語句是否與所述翻譯
語句相干涉;以及在滿足所述非干涉條件的情況下輸出所述第一翻譯 文檔,或者在不滿足所述非干涉條件的情況下輸出所述第二翻譯文 檔。
根據(jù)第(1)項或第(16)項所述的本發(fā)明,可以以對于用戶顯 著便利的形式輸出所述翻譯語句。
根據(jù)第(2)項所述的本發(fā)明,可以根據(jù)所述行間區(qū)域的寬度來
選擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(3)項所述的本發(fā)明,可以基于簡單的數(shù)值指標來選擇
對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(4)項所述的本發(fā)明,與未采用這種構造的情況相比, 可以可靠地選擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(5)項所述的本發(fā)明,可以根據(jù)所述原始語句的語言與 所述翻譯語句的語言的組合來選擇對于所述翻譯語句的顯著便利的 輸出形式。
根據(jù)第(6)項所述的本發(fā)明,可以根據(jù)在將所述翻譯語句布置 在所述行間區(qū)域中時所述翻譯語句是否易于與所述原始語句相重疊 來選擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(7)項所述的本發(fā)明,可以基于簡單的數(shù)值指標來選擇 對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(8)項所述的本發(fā)明,與未采用這種構造的情況相比, 可以可靠地選擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(9)項所述的本發(fā)明,可以根據(jù)在將所述翻譯語句布置 在所述行間區(qū)域中時所述翻譯語句是否與所述原始語句相重疊來選 擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(10)項所述的本發(fā)明,可以基于簡單的數(shù)值指標來選 擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(11)項所述的本發(fā)明,與未采用這種構造的情況相比, 可以可靠地選擇對于所述翻譯語句的顯著便利的輸出形式。
根據(jù)第(12) 、 (13) 、 (14)及(15)項中任一項所述的本 發(fā)明,與未采用這種構造的情況相比,可以顯著改善用戶的便利性。
基于以下各圖對本發(fā)明的示例性實施例進行詳細說明,其中 圖1為示出根據(jù)本發(fā)明實施例的翻譯裝置的硬件構造實例的示
圖2為示出根據(jù)本發(fā)明實施例的翻譯裝置的功能塊實例的示圖3為示出原始文檔的實例的示圖4為示出指定行間區(qū)域和字符行區(qū)域的狀態(tài)的示圖5為示出行間區(qū)域和字符行區(qū)域的實例的示圖6為示出附加單詞型翻譯文檔的實例的示圖7為示出計算重疊率的狀態(tài)的示圖8為示出翻譯替換文檔的實例的示圖9為示出由根據(jù)本發(fā)明實施例的翻譯裝置進行的處理實例的 流程圖;^
圖IO為示出由根據(jù)本發(fā)明實施例的翻譯裝置進行的處理實例的 流程圖11為示出計算重疊率的狀態(tài)的示圖; 圖12為示出計算重疊率的狀態(tài)的示圖13為示出由根據(jù)本發(fā)明實施例的翻譯裝置進行的處理實例的 流程圖14為示出生成翻譯替換文檔的狀態(tài)的示圖;以及 圖15為示出由根據(jù)本發(fā)明實施例的翻譯裝置進行的處理實例的 流程圖。
具體實施例方式
將參照各附圖對本發(fā)明的示例性實施例進行說明。圖1為示出 根據(jù)本發(fā)明實施例的翻譯裝置2的硬件構造實例的示圖。如該圖所 示,翻譯裝置2包括中央處理單元40、主存儲器42、輔助存儲器44、 圖像讀取單元46、操作單元48以及顯示器50。各個單元可以通過數(shù) 據(jù)總線54相互通信。翻譯裝置2包括在圖中未示出的網(wǎng)絡接口、打 印機等。
中央處理單元40是CPU或MPU。利用預先存儲在主存儲器42 中的程序操作中央處理單元40以控制各單元。另外,中央處理單元 40利用存儲在主存儲器42中的信息進行計算操作,然后將所計算出 的數(shù)值輸出到主存儲器42中。該程序并不局限于存儲在主存儲器42 中的程序,而是也可以是存儲在諸如CD-ROM或DVD-ROM等信息 存儲介質(zhì)中的程序或從網(wǎng)絡提供的程序。
主存儲器42是諸如RAM或ROM等的存儲元件。主存儲器42 對程序進行存儲。另外,主存儲器42存儲從各單元輸入的信息。
輔助存儲器44是硬盤等。輔助存儲器44根據(jù)從中央處理單元 40輸出的控制信號來存儲在主存儲器42中所存儲的信息。
圖像讀取單元46是掃描儀。圖像讀取單元46根據(jù)從中央處理 單元40輸出的控制信號來讀取原始文檔,然后將所讀取的原始文檔 圖像輸出到主存儲器42中。這里,原始文檔包括以第一語言記載的 語句。這里,第一語言為日語。
操作單元48是鍵盤、鼠標等。操作單元48將操作信息輸出到 主存儲器42中。
顯示器50根據(jù)從中央處理單元40輸出的控制信號而對存儲在 主存儲器42中的信息進行顯示。
圖2為示出當基于程序操作中央處理單元40時由翻譯裝置2實 現(xiàn)的功能的方框圖。這里,將主要說明本發(fā)明所涉及的功能。如該圖 所示,翻譯裝置2包括原始文檔圖像獲取單元60、行間區(qū)域指定單 元62、翻譯單元64、附加單詞型翻譯文檔生成單元66、重疊判斷單 元68、翻譯替換文檔生成單元70以及翻譯結(jié)果輸出單元72。
原始文檔圖像獲取單元60主要通過圖像讀取單元46實現(xiàn)。原 始文檔圖像獲取單元60讀取原始文檔從而獲取原始文檔圖像。
行間區(qū)域指定單元62主要通過中央處理單元40實現(xiàn)。行間區(qū)
域指定單元62對原始文檔圖像獲取單元60所獲取的原始文檔圖像的
版面布局進行分析,然后指定該原始文檔圖像中所包含的語句的各行 之間的行間區(qū)域。
在本實施例中,行間區(qū)域指定單元62分析原始文檔圖像的版面 布局,然后指定各語句的語句區(qū)域(參見圖3)。另外,行間區(qū)域指 定單元62為語句區(qū)域指定字符行區(qū)域。
具體而言,如圖4所示,行間區(qū)域指定單元62對認為是形成各 語句區(qū)域中的字符的像素(字符像素)進行投影計算,并相對于這樣 的方向(在水平方向的情況下為Y軸或者在豎直方向的情況下為X 軸)生成投影直方圖即,該方向與語句區(qū)域中字符彼此相連的方向 垂直。然后,行間區(qū)域指定單元62基于各語句區(qū)域的投影直方圖指 定各語句區(qū)域的字符行區(qū)域。也就是說,行間區(qū)域指定單元62在各 語句區(qū)域中指定坐標區(qū)域并將所指定的區(qū)域設定為各字符行區(qū)域的 豎直寬度,其中在該坐標區(qū)域中字符像素的數(shù)目沿著投影軸連續(xù)為1 個或更多個。另外,行間區(qū)域指定單元62將語句區(qū)域的水平寬度設 定成各字符行區(qū)域的水平寬度。這樣,如圖5所示,行間區(qū)域指定單 元62為各語句區(qū)域指定字符行區(qū)域。
此外,行間區(qū)域指定單元62基于各語句區(qū)域的投影直方圖來計 算用于指定行間區(qū)域的頻率閾值TH1。這里,在每個語句區(qū)域中, 通過這樣的方式計算平均字符像素數(shù)目Nm:即,用字符像素的總數(shù) 除以語句區(qū)域的豎直寬度。此外,將所計算出的平均字符像素數(shù)目 Nm乘以1/a (其中"a"為預先設定的常數(shù))而獲得的數(shù)值稱為TH1。 例如如圖4所示,平均字符像素數(shù)目Nm對應于用語句區(qū)域中字符像 素的總數(shù)除以語句區(qū)域的豎直寬度(Y2-Y1)而得到的商,并且TH1 對應于再用Nm除以a而得到的商。
行間區(qū)域指定單元62在各語句區(qū)域中指定Y軸區(qū)域并將所指定 的區(qū)域設定為各行間區(qū)域的豎直寬度,其中在該Y軸區(qū)域中字符像 素的數(shù)目連續(xù)為TH1或更小。另外,將語句區(qū)域的水平寬度設定成 各行間區(qū)域的水平寬度。這樣,如圖5所示,行間區(qū)域指定單元62 為各語句區(qū)域指定行間區(qū)域。行間區(qū)域指定單元62甚至將假想設置 在第一行的字符行區(qū)域的上部的預定區(qū)域指定為行間區(qū)域。
翻譯單元64主要通過中央處理單元40實現(xiàn)。翻譯單元64將原
始文檔圖像中所包含的各語句翻譯成第二語言。
在本實施例中,翻譯單元64針對行間區(qū)域指定單元62所指定 的各語句區(qū)域而識別語句區(qū)域中所包含的語句,然后將所識別的語句 翻譯成第二語言。這里,第二語言為英語。
附加單詞型翻譯文檔生成單元66主要通過中央處理單元40實 現(xiàn)。附加單詞型翻譯文檔生成單元66通過以在原始語句中標記附加
單詞的方式將翻譯語句布置在原始文檔圖像的各行間區(qū)域中來生成 第一翻譯文檔。這里,附加單詞型翻譯文檔生成單元66通過將翻譯 語句布置在各行間區(qū)域中的方式生成如圖6所示的附加單詞型翻譯 文檔的圖像數(shù)據(jù)(即位圖數(shù)據(jù))。
具體而言,附加單詞型翻譯文檔生成單元66生成原始文檔圖像 的副本。另外,附加單詞型翻譯文檔生成單元66針對所復制的原始 文檔圖像的各語句區(qū)域而將對應語句區(qū)域中所包含的語句的翻譯語 句的各字符的圖像布置在該語句區(qū)域的各行間區(qū)域中。這里,附加單 詞型翻譯文檔生成單元66基于第一語言與第二語言的組合以預定的 字符尺寸來布置翻譯語句的各字符的圖像。另外,附加單詞型翻譯文 檔生成單元66以取決于行間區(qū)域背景顏色的字符顏色來布置翻譯語 句的各字符的圖像。例如,附加單詞型翻譯文檔生成單元66可以采 用相對于行間區(qū)域背景顏色的預定字符顏色來布置翻譯語句的各字 符的圖像,或者可以采用略微不同于行間區(qū)域背景顏色的字符顏色來 布置各字符的圖像。這樣,附加單詞型翻譯文檔生成單元66生成附 加單詞型翻譯文檔的圖像數(shù)據(jù)。當將翻譯語句布置在各行間區(qū)域中 時,翻譯語句的字符尺寸可能大于原始語句的字符尺寸,或者也可能 小于原始語句的字符尺寸。
重疊判斷單元68主要通過中央處理單元40實現(xiàn)。重疊判斷單 元68判斷是否滿足非干涉條件,其中該非干涉條件用于判斷在附加 單詞型翻譯文檔中原始語句是否與翻譯語句重疊。
在本實施例中,如圖7所示,重疊判斷單元68參照附加單詞型
翻譯文檔的圖像數(shù)據(jù)來對字符Nl的數(shù)目進行計數(shù),其中該字符N1
布置在與小于預定行間隔TH2的行間區(qū)域相對應的行間區(qū)域中。重 疊判斷單元68計算出字符Nl的數(shù)目與字符總數(shù)Mtotal的比率Pl (Nl/Mtotal),從而判斷比率Pl是否為預定閾值TH3或更小。這 里,預定行間隔TH2為翻譯語句的字符的高度。翻譯語句的字符尺 寸是基于第一語言與第二語言的組合而預先設定的尺寸,行間隔TH2 隨著第一語言與第二語言的組合而改變。在下文中,將比率P1稱為 重疊率。
當重疊率大于TH3時,重疊判斷單元68確定不滿足非干涉條件。 與此同時,當重疊率不大于TH3時,重疊判斷單元68確定滿足非干 涉條件。重疊判斷單元68將判斷結(jié)果輸出至翻譯結(jié)果輸出單元72。
翻譯替換文檔生成單元70主要通過中央處理單元40實現(xiàn)。翻 譯替換文檔生成單元70生成第二翻譯文檔,在該第二翻譯文檔中原 始文檔圖像的語句被替換為翻譯語句。這里,翻譯替換文檔生成單元 70生成如圖8所示的翻譯替換文檔的圖像數(shù)據(jù),其中各語句區(qū)域中 所包含的語句被替換為翻譯語句。
具體而言,翻譯替換文檔生成單元70生成原始文檔圖像的副本。 然后,翻譯替換文檔生成單元70確定所復制的原始文檔圖像的各語 句區(qū)域的背景顏色,并用所確定的背景顏色涂繪對應的語句區(qū)域。例 如,翻譯替換文檔生成單元70利用對應語句區(qū)域中所包含的其中一 個行間區(qū)域的背景顏色涂繪各語句區(qū)域。然后,翻譯替換文檔生成單 元70將翻譯語句的圖像布置在各語句區(qū)域中。這樣,翻譯替換文檔 生成單元70生成翻譯替換文檔的圖像數(shù)據(jù)。這里,翻譯替換文檔生 成單元70確定翻譯語句的字符尺寸以將翻譯語句插入到語句區(qū)域 中。翻譯語句的字符顏色可以是預定顏色或者是不同于語句區(qū)域背景 顏色的顏色。
翻譯結(jié)果輸出單元72主要通過顯示器50實現(xiàn)。翻譯結(jié)果輸出 單元72根據(jù)重疊判斷單元68的判斷結(jié)果輸出翻譯結(jié)果。
在本實施例中,當滿足非干涉條件時,翻譯結(jié)果輸出單元72基 于附加單詞型翻譯文檔的圖像數(shù)據(jù)將附加單詞型翻譯文檔的圖像輸
出到顯示器50中,或者當不滿足非干涉條件時,翻譯結(jié)果輸出單元
72基于翻譯替換文檔的圖像數(shù)據(jù)將附加單詞型翻譯文檔的圖像和翻 譯替換文檔的圖像輸出到顯示器50中。當不滿足非干涉條件時,翻 譯結(jié)果輸出單元72可以僅將翻譯替換文檔的圖像輸出到顯示器50 中。另外,翻譯結(jié)果輸出單元72可以打印出附加單詞型翻譯文檔的 圖像或翻譯替換文檔的圖像。
接下來,將參照圖9中所示的流程圖說明由具有上述功能的翻 譯裝置2進行的示例性處理。在本實施例中,當用戶通過使翻譯裝置 2讀取原始文檔來進行翻譯指示操作時,進行處理。
翻譯裝置2通過讀取原始文檔獲取原始文檔圖像(S101)。隨 后,翻譯裝置2利用行間區(qū)域指定單元62的功能分析原始文檔圖像 的版面布局,并指定語句區(qū)域(S102)。作為另一種選擇,翻譯裝 置2利用行間區(qū)域指定單元62的功能指定每個語句區(qū)域中的字符行 區(qū)域和行間區(qū)域(S103)。
隨后,翻譯裝置2通過OCR處理識別各字符行區(qū)域中的字符 (S104)。隨后,翻譯裝置2將所識別的各語句區(qū)域中的字符組合 起來(S105)。這樣,翻譯裝置2識別各語句區(qū)域中的對應語句區(qū) 域中所包含的語句。隨后,翻譯裝置2將各語句區(qū)域中的語句翻譯成 第二語言,并生成翻譯語句的文本(S106)。
隨后,翻譯裝置2生成附加單詞型翻譯文檔的圖像數(shù)據(jù)(S107)。 具體而言,翻譯裝置2通過進行如圖10的流程圖中所示的處理來生 成附加單詞型翻譯文檔的圖像數(shù)據(jù)。
也就是說,翻譯裝置2生成原始文檔圖像的副本。隨后,翻譯 裝置2進行諸如傾斜補償、底色消除等公知的高清晰化處理(S201)。 隨后,翻譯裝置2從所復制的原始文檔圖像中選擇處理對象的語句區(qū) 域(目標語句區(qū)域)(S202)。隨后,翻譯裝置2從目標語句區(qū)域 中選擇目標行間區(qū)域(S203)。隨后,翻譯裝置2指定目標行間區(qū) 域的背景顏色,并根據(jù)所指定的背景顏色確定翻譯語句的字符顏色 (S204)。例如,翻譯裝置2將事先相對于所指定的背景顏色而確 定的顏色或不同于所指定的背景顏色的顏色設定為翻譯語句的字符
顏色。隨后,翻譯裝置2利用在步驟S204中所指定的字符顏色將翻 譯語句的各字符的圖像布置到目標行間區(qū)域中(S205)。
隨后,當未將翻譯語句的各字符的圖像布置到每個行間區(qū)域中 時(S206中判斷結(jié)果為否),翻譯裝置2返回到步驟S203,或者當 已將翻譯語句的各字符的圖像布置到每個行間區(qū)域中時(S206中判 斷結(jié)果為是),翻譯裝置2轉(zhuǎn)入步驟S207。隨后,當未對每個語句 區(qū)域都進行從S203到S206的處理時(S207中判斷結(jié)果為否),翻 譯裝置2返回到步驟S202,或者當已對每個語句區(qū)域都進行從S203 到S206的處理時,翻譯裝置2結(jié)束處理。這樣,翻譯裝置2生成附 加單詞型翻譯文檔的圖像數(shù)據(jù)。翻譯裝置2在步驟S203之后利用公 知的方法將目標行間區(qū)域平滑化,然后可轉(zhuǎn)入步驟S204。例如,翻 譯裝置2在步驟S203之后計算在目標行間區(qū)域的像素中的下述像素 的像素數(shù)目,其中所述像素的像素值(即RGB值、反差值、亮度值 等)與相鄰像素的像素值的平均值相差預定值或更大。然后,當所計 算出的像素數(shù)目與目標行間區(qū)域的像素總數(shù)的比率不小于預定比率 時,翻譯裝置2可以將目標行間區(qū)域平滑化。作為另一種選擇,翻譯 裝置2在步驟S203之后利用預定顏色(即白色等)涂繪目標行間區(qū) 域,然后可以轉(zhuǎn)入步驟S204。
當生成附加單詞型翻譯文檔的圖像數(shù)據(jù)時,翻譯裝置2利用重 疊判斷單元68的功能計算比率Pl即重疊率(S109)。這里,翻譯 裝置2可以基于各行間區(qū)域的長度(水平寬度)和翻譯語句的字符尺 寸通過計算布置在各行間區(qū)域中的字符的數(shù)目,從而計算出字符數(shù)目 Nl。在這種情況下,由于翻譯裝置2為了計算重疊率而沒有使用附 加單詞型翻譯文檔的圖像數(shù)據(jù),則可以在步驟S108之后的步驟中生 成附加單詞型翻譯文檔的圖像數(shù)據(jù)。
這里,將重疊率設定成布置在與小于行間隔TH2的行間區(qū)域相 對應的行間區(qū)域中的字符數(shù)目Nl與翻譯語句的像素總數(shù)Mtotal的比 率P1,但該重疊率可以是不同的數(shù)值。例如,翻譯裝置2參照附加 單詞型翻譯文檔的圖像數(shù)據(jù)而對翻譯語句的各字符設定外接矩形。然 后,如圖11所示,翻譯裝置2判斷原始語句的字符是否部分或全部
包含在翻譯語句的各字符的外接矩形區(qū)域中,也就是說,原始語句的 字符是否與該外接矩形區(qū)域相干涉,然后對翻譯語句的字符中其外接
矩形區(qū)域與原始語句的字符相干涉的字符數(shù)目N2進行計數(shù)。然后,
翻譯裝置2計算字符數(shù)目N2與字符總數(shù)Mtotal的比率P2。可以將 這樣得到的比率P2設定成重疊率。
另外,例如翻譯裝置2參照附加單詞型翻譯文檔的圖像數(shù)據(jù)來 對翻譯語句的字符與原始語句的字符相干涉的整個部分中的像素數(shù) 目的總和N3進行計數(shù)(參見圖12)。然后,翻譯裝置2計算像素數(shù) 目N3與翻譯語句的全部字符中像素數(shù)目的總和Mtotal的比率P3。 可以將這樣得到的比率P3設定成重疊率。
當這樣計算出重疊率時,翻譯裝置2判斷是否滿足非干涉條件。 也就是說,翻譯裝置2判斷重疊率是否不大于預定閾值TH3(S109)。 當重疊率不大于預定閾值TH3時(S109中的判斷結(jié)果為是),翻譯 裝置2基于附加單詞型翻譯文檔的圖像數(shù)據(jù)輸出附加單詞型翻譯文 檔的圖像(S110)。例如,翻譯裝置2在顯示器50上顯示附加單詞 型翻譯文檔的圖像或者借助于打印機打印出該圖像。
另一方面,當重疊率大于預定閾值TH3時(S109中判斷結(jié)果為 否),翻譯裝置2生成翻譯替換文檔的圖像數(shù)據(jù)(S111)。具體而 言,翻譯裝置2通過進行如圖13的流程圖中所示的處理來生成翻譯 替換文檔的圖像數(shù)據(jù)。
也就是說,翻譯裝置2生成原始文檔圖像的副本,并對所復制 的原始文檔圖像進行諸如傾斜補償、底色消除等公知的高清晰化處理
(5301) 。隨后,翻譯裝置2從所復制的原始文檔圖像中選擇處理 對象的語句區(qū)域(目標語句區(qū)域),并確定目標語句區(qū)域的背景顏色
(5302) 。例如,翻譯裝置2將目標語句區(qū)域中所包含的其中一個 行間區(qū)域的背景顏色設定為目標語句區(qū)域的背景顏色。隨后,翻譯裝 置2利用在步驟S302中所確定的背景顏色涂繪目標語句區(qū)域
(5303) 。
隨后,翻譯裝置2確定布置在目標語句區(qū)域中的翻譯語句的字 符顏色(S304)。例如,翻譯裝置2將翻譯語句的字符顏色設定為
與在步驟S302中所確定的背景顏色相關的預定顏色或不同于對應的 背景顏色的顏色。隨后,翻譯裝置2確定布置在目標語句區(qū)域中的翻
譯語句的字符尺寸(S305)。例如,翻譯裝置2確定翻譯語句的字 符尺寸以將翻譯語句插入到目標語句區(qū)域中。
隨后,翻譯裝置2將翻譯語句的圖像布置在目標語句區(qū)域中 (S306)。隨后,翻譯裝置2檢查翻譯語句的圖像是否已布置在每 個語句區(qū)域中(S307),當翻譯語句的圖像未布置在每個語句區(qū)域 中時(S307中判斷結(jié)果為否),翻譯裝置2返回到步驟S302。另一 方面,當翻譯語句的圖像己布置在每個語句區(qū)域中時(S307中判斷 結(jié)果為是),翻譯裝置2結(jié)束處理。這樣,翻譯裝置2生成翻譯替換 文檔的圖像數(shù)據(jù)。翻譯裝置2可以在步驟S109之前的步驟中生成翻 譯替換文檔的圖像數(shù)據(jù)。
當這樣生成翻譯替換文檔的圖像數(shù)據(jù)時,翻譯裝置2基于附加 單詞型翻譯文檔的圖像數(shù)據(jù)和翻譯替換文檔的圖像數(shù)據(jù)輸出附加單 詞型翻譯文檔的圖像和翻譯替換文檔的圖像(S112)。例如,翻譯 裝置2在顯示器50上顯示這些圖像或者借助于打印機打印出這些圖 像。這里,翻譯裝置2可以在步驟S112中僅輸出翻譯替換文檔的圖 像。如上所述,已經(jīng)說明了由翻譯裝置2進行的具體處理。當原始文 檔具有多頁紙張時,翻譯裝置2對每一頁進行從S101到S112的處 理。
本發(fā)明的實施例并不局限于上述實施例。
也就是說,本發(fā)明可以應用于第一和第二語言的種類以外的任 何語言。例如,本發(fā)明可應用于將法語翻譯成德語的情況或者將古語 翻譯成現(xiàn)代日語的情況。另外,例如本發(fā)明甚至可應用于將關西方言 翻譯成關東方言的情況。
本發(fā)明不僅可應用于原始文檔包括沿水平方向書寫的語句的情 況,而且也可應用于原始文檔包括沿豎直方向書寫的語句的情況。
翻譯裝置2可在步驟S109中判斷至少一個行間區(qū)域的高度(當 沿水平方向?qū)懭朐颊Z句時)是否小于行間隔TH2。另外,當至少 一個行間區(qū)域的高度小于行間隔TH2時,進行步驟Slll中的處理。作為另一種選擇,當每個行間區(qū)域的高度都不小于行間隔TH2 (即, 在行間隔TH2以上)時,可以進行步驟S110中的處理。在這種情況 下,翻譯裝置2不必計算重疊率。
翻譯裝置2可以將比率P1、比率P2以及比率P3中之一設定為 重疊率。
例如,翻譯裝置2計算出比率Pl,當所計算出的比率P1大于 預定閾值TH31時將比率Pl設定為重疊率,或者當比率Pl不大于預 定閾值TH31時計算出比率P2。另外,當所計算出的比率P2大于預 定閾值TH32時翻譯裝置2將比率P2設定為重疊率,或者當比率P2 不大于預定閾值TH32時計算出比率P3,并將所計算出的比率P3設 定為重疊率。這樣,可以確定重疊率。
在翻譯對象原始文檔包括含有語句(或單詞)的圖片的情況下 (參見圖14),翻譯裝置2可以通過在步驟Slll中另外進行如圖 15所示流程圖的各步驟,從而可在不用翻譯語句替換包含在圖片中 的語句的情況下生成翻譯替換文檔的圖像數(shù)據(jù)。
也就是說,在步驟S301之后,翻譯裝置2利用公知的方法指定 原始文檔圖像中圖片區(qū)域的位置/范圍(S401)。例如,翻譯裝置2 生成所復制的原始文檔圖像的雙值圖像,并對該雙值圖像進行標記處 理。翻譯裝置2對于通過標記處理所提取的每個連接組分設定外接矩 形。然后,翻譯裝置2對于每個連接組分而計算連接組分相對于外接 矩形的占有率,然后將占有率高的區(qū)域設定為圖片區(qū)域。這樣,翻譯 裝置2指定圖片區(qū)域。
翻譯裝置2判斷目標語句區(qū)域是否處于圖片區(qū)域的外部(S402), 然后當目標語句區(qū)域處于圖片區(qū)域的外部時(S402中判斷結(jié)果為是) 轉(zhuǎn)入步驟S302,或者當目標語句區(qū)域處于圖片區(qū)域的內(nèi)部時(S402 中判斷結(jié)果為否)選擇其它的目標語句區(qū)域以再次進行步驟S402中 的處理。這樣,翻譯裝置2在步驟S302之后僅對圖片區(qū)域外部的語 句區(qū)域進行處理。
在上述實施例中,翻譯裝置2以圖像數(shù)據(jù)形式生成附加單詞型 翻譯文檔(第一翻譯文檔),但是也可以其它數(shù)據(jù)形式生成該附加單
詞型翻譯文檔。例如,翻譯裝置2可將附加單詞型翻譯文檔生成為包 括描繪位置、描繪尺寸、描繪顏色等的描繪數(shù)據(jù)。在這種情況下,翻 譯裝置2基于描繪數(shù)據(jù)通過描繪原始文檔圖像的各行間區(qū)域中的翻 譯語句來輸出附加單詞型翻譯文檔的圖像。
通過相同的方式,翻譯裝置2可以以圖像數(shù)據(jù)以外的其它數(shù)據(jù) 形式生成翻譯替換文檔(第二翻譯文檔)。例如,翻譯裝置2可將附
加單詞型翻譯文檔生成為翻譯文檔的各語句相對于背景圖像(將原始 文檔圖像的各語句區(qū)域涂繪成背景顏色的圖像)的包括描繪位置、描
繪尺寸、描繪顏色等的描繪數(shù)據(jù)。在這種情況下,翻譯裝置2基于描 繪數(shù)據(jù)通過描繪背景圖像的各行間區(qū)域中的翻譯語句來輸出翻譯替 換文檔的圖像。
以上提供了對本發(fā)明示例性實施例的說明,其目的在于舉例和 說明。這并不意味上述實施例為窮舉的或?qū)⒈景l(fā)明局限于所公開的確 切形式。顯然,很多變型和變更對于本領域的普通技術人員來說是顯 而易見的。選擇和說明上述示例性實施例旨在更好地解釋本發(fā)明的原 理及其實際應用,從而使本領域的其他技術人員能夠理解本發(fā)明的各 種實施例以及適用于預期的特定應用的各種變型。本發(fā)明的范圍由所 附權利要求書及其等同內(nèi)容限定。
權利要求
1.一種翻譯裝置,包括圖像獲取單元,其獲取從包括有第一語言的原始語句的原始文檔中所讀取的原始文檔圖像;翻譯單元,其將包含在所述原始文檔圖像中的所述原始語句翻譯成第二語言;行間區(qū)域指定單元,其指定包含在所述原始文檔圖像中的所述原始語句的各行的行間區(qū)域;第一翻譯文檔生成單元,其通過將翻譯語句布置在所述原始文檔圖像的各行間區(qū)域中來生成第一翻譯文檔;第二翻譯文檔生成單元,其通過將所述原始文檔圖像中的所述原始語句替換成所述翻譯語句來生成第二翻譯文檔;判斷單元,其基于各行間區(qū)域判斷是否滿足非干涉條件,其中所述非干涉條件用于判斷所述原始語句是否與所述翻譯語句相干涉;以及輸出單元,在滿足所述非干涉條件的情況下所述輸出單元輸出所述第一翻譯文檔,或者在不滿足所述非干涉條件的情況下所述輸出單元輸出所述第二翻譯文檔。
2. 根據(jù)權利要求l所述的翻譯裝置,其中, 所述判斷單元根據(jù)所述各行間區(qū)域之間的間隔是否在預定閾值以上來判斷是否滿足所述非干涉條件。
3. 根據(jù)權利要求2所述的翻譯裝置,其中, 所述判斷單元根據(jù)所述第一翻譯文檔中與小于所述預定閾值的行間隔相對應的行間區(qū)域中所布置的翻譯語句的字符數(shù)目來判斷是 否滿足所述非干涉條件。
4. 根據(jù)權利要求3所述的翻譯裝置,其中, 在與小于所述預定閾值的行間隔相對應的行間區(qū)域中所布置的 翻譯語句的字符數(shù)目與所述翻譯語句的字符總數(shù)的比率不大于預定 比率的情況下,所述判斷單元判斷為滿足所述非干涉條件。
5. 根據(jù)權利要求2所述的翻譯裝置,還包括閾值確定單元,其根據(jù)所述第一語言與所述第二語言的組合來 確定所述預定閾值。
6. 根據(jù)權利要求l所述的翻譯裝置,其中,所述判斷單元根據(jù)所述原始語句的字符是否與所述第一翻譯文 檔中所述翻譯語句的字符的外接矩形區(qū)域相干涉來判斷是否滿足所 述非干涉條件。
7. 根據(jù)權利要求6所述的翻譯裝置,其中, 所述判斷單元根據(jù)翻譯語句的字符中其外接矩形區(qū)域與所述原始語句的字符相干涉的字符數(shù)目來判斷是否滿足所述非干涉條件。
8. 根據(jù)權利要求7所述的翻譯裝置,其中, 在翻譯語句的字符中其外接矩形區(qū)域與所述原始語句的字符相干涉的字符數(shù)目與所述翻譯語句的字符總數(shù)的比率不大于預定比率 的情況下,所述判斷單元判斷為滿足所述非干涉條件。
9. 根據(jù)權利要求1所述的翻譯裝置,其中, 所述判斷單元根據(jù)所述原始語句的字符是否與所述第一翻譯文檔中所述翻譯語句的字符相干涉來判斷是否滿足所述非干涉條件。
10. 根據(jù)權利要求9所述的翻譯裝置,其中, 所述判斷單元根據(jù)所述翻譯語句的字符與所述原始語句的字符相干涉的部分的像素數(shù)目來判斷是否滿足所述非干涉條件。
11. 根據(jù)權利要求IO所述的翻譯裝置,其中,在所述翻譯語句的字符與所述原始語句的字符相干涉的部分的 像素數(shù)目與所述翻譯語句的字符的像素總數(shù)的比率不大于預定比率 的情況下,所述判斷單元判斷為滿足所述非干涉條件。
12. 根據(jù)權利要求l所述的翻譯裝置,其中,所述第一翻譯文檔生成單元在將各行間區(qū)域中的像素值平滑化 之后將所述翻譯語句布置在各行間區(qū)域中。
13.根據(jù)權利要求l所述的翻譯裝置,其中,所述第一翻譯文檔生成單元在將各行間區(qū)域中的像素值設定成 預定值之后將所述翻譯語句布置在各行間區(qū)域中。
14. 根據(jù)權利要求l所述的翻譯裝置,其中, 所述第一翻譯文檔生成單元根據(jù)所述行間區(qū)域的背景顏色來確定布置在各行間區(qū)域中的所述翻譯語句的字符顏色。
15. 根據(jù)權利要求l所述的翻譯裝置,其中, 所述原始文檔包括圖片,并且所述第二翻譯文檔生成單元指定所述原始文檔圖像中所述圖片 的圖片區(qū)域,并且在至少有一部分原始語句包含在所指定的區(qū)域中的 情況下,限制將所述至少一部分原始語句替換成翻譯語句。
16. —種翻譯方法,包括獲取從包括有第一語言的原始語句的原始文檔中所讀取的原始文檔圖像;將包含在所述原始文檔圖像中的所述原始語句翻譯成第二語曰;指定包含在所述原始文檔圖像中的所述原始語句的各行的行間區(qū)域; 通過將翻譯語句布置在所述原始文檔圖像的各行間區(qū)域中來生成第一翻譯文檔;通過將所述原始文檔圖像中的所述原始語句替換成所述翻譯語句來生成第二翻譯文檔;基于各行間區(qū)域判斷是否滿足非干涉條件,其中所述非干涉條 件用于判斷所述原始語句是否與所述翻譯語句相干涉;以及在滿足所述非干涉條件的情況下輸出所述第一翻譯文檔,或者 在不滿足所述非干涉條件的情況下輸出所述第二翻譯文檔。
全文摘要
本發(fā)明公開了一種翻譯裝置,該裝置包括圖像獲取單元,其獲取從包括有第一語言的原始語句的原始文檔中所讀取的原始文檔圖像;翻譯單元,其將所述原始語句翻譯成第二語言;行間區(qū)域指定單元,其指定所述原始語句的各行的行間區(qū)域;第一翻譯文檔生成單元,其通過將翻譯語句布置在所述原始文檔圖像的各行間區(qū)域中來生成第一翻譯文檔;第二翻譯文檔生成單元,其生成第二翻譯文檔;判斷單元,其基于各行間區(qū)域判斷是否滿足非干涉條件;以及輸出單元,在滿足所述非干涉條件的情況下所述輸出單元輸出所述第一翻譯文檔,或者在不滿足所述非干涉條件的情況下所述輸出單元輸出所述第二翻譯文檔。
文檔編號G06F17/28GK101373465SQ200810094518
公開日2009年2月25日 申請日期2008年4月18日 優(yōu)先權日2007年8月24日
發(fā)明者加藤雅弘 申請人:富士施樂株式會社