專利名稱:字幕翻譯引擎的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及字幕翻譯引擎。
背景技術(shù):
諸如視頻回放機(jī)器和計算機(jī)的現(xiàn)代電子系統(tǒng),通常采用只讀光盤(CDROM)介質(zhì)或DVD介質(zhì)來存儲大量的數(shù)據(jù),例如視頻或音頻數(shù)據(jù)。在本說明書的其余部分,縮寫CDROM和DVD將組合到一起,而共同稱為DVD,因為本公開的主題相同地適用于這兩種系統(tǒng)。
DVD是受歡迎的視頻盒式磁帶替代品。DVD相對于視頻盒式磁帶的一個特殊優(yōu)點是DVD允許在回放期間打開或關(guān)閉字幕。而且,DVD可以具有用字幕在電影中進(jìn)行疊加的多達(dá)32個子畫面流。但是,一些語言在DVD上不可用,因為電影制片廠沒有制作。這意味著某些國家的消費者不能以他們的母語來充分欣賞電影。作為替代,消費者嘗試?yán)斫馔庹Z電影。
DVD電影存儲在DVD盤上標(biāo)為“VIDEO_TS”的子目錄下的視頻對象文件(VOB文件)。VOB文件是基本的MPEG-2系統(tǒng)流。每個VOB文件是包含復(fù)用的MPEG-2視頻、音頻和子畫面(SPC)流的文件。VOB文件一般包含復(fù)用的杜比數(shù)字音頻和MPEG-2視頻。
字幕被直接編碼到DVD位流自身中,并通常被用戶從DVD菜單來選擇顯示,這與需要外置解碼器的隱藏字幕(Closed Caption)相反。有兩種硬編碼的字幕,開式和閉式的。開式字幕被沒有選擇地播出。也就是說,字幕出現(xiàn)在屏幕上,并且無法通過關(guān)閉DVD播放器中的字幕選項來消除。相反,閉式字幕可以通過DVD菜單或遙控設(shè)備來打開或者關(guān)閉,因此是可以消除的。大多數(shù)DVD和一些激光盤都只使用閉式字幕。
VOB文件中的SPC流通常對應(yīng)于電影的字幕。SPC流是具有壓縮字幕位流的格式化MPEG流。SPC流包含演示戳(Presentation Stamps,PTS)以及流標(biāo)識和子流標(biāo)識,類似于音頻流。在最終的復(fù)用期間,該SPC流與視頻和音頻流合并,以形成新的VOB流。SPC流疊加在主視頻流(電影)之上,并可以被打開或關(guān)閉。
DVD字幕并不記錄到TV畫面的可視部分中,而是作為單獨的視頻條、圖像或畫面文件而存儲在SPC流中?;胤艜r這些圖像就被混和到電影中。優(yōu)點是DVD播放器不需要字符生成器來反映這些圖像。而且,字幕的文字總是保持按發(fā)行者所希望的相同格式。缺點是這些圖像比純文本文件占用稍多一些的空間。在有字幕的回放期間,DVD播放器讀取并解碼來自SPC流的字幕并將這些字幕疊加在TV畫面上。
發(fā)明內(nèi)容
在第一優(yōu)選方面,提供了一種字幕翻譯引擎,用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,所述引擎包括字幕提取器,用于從所述視頻源提取第一語言的字幕內(nèi)容;和翻譯模塊,用于通過在語言詞典上進(jìn)行查詢,而將所述第一語言的所述被提取的字幕內(nèi)容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內(nèi)容。
所述視頻源可以是數(shù)字多功能光盤(DVD)、超級視頻光盤格式(SVCD)的,或者是其中視頻內(nèi)容和字幕作為單獨實體存儲的任何格式的。
所述語言詞典可以是查詢表和數(shù)據(jù)庫中的一種。所述語言詞典能夠被更新。所述語言詞典被用于在多于兩種語言之間的翻譯。所述引擎可以提供用戶接口以允許選擇第二語言。
所述字幕提取器包括光學(xué)字符識別(OCR)引擎,所述光學(xué)字符識別引擎將圖像格式的字幕內(nèi)容轉(zhuǎn)換成文本格式。
所述翻譯模塊在詞對詞或者短語對短語的基礎(chǔ)上翻譯文字。好處在于,因為在上下文中而非孤立地來翻譯更多的文字,所以翻譯變得更準(zhǔn)確。
所述第一語言可以是英語、法語、西班牙語、意大利語或者德語中的任何一種。所述第二語言可以是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
所述字幕翻譯引擎可以是獨立單元,并可以與數(shù)字多功能光盤播放器和電視屏幕連接以分別輸入和輸出。
所述字幕翻譯引擎可以包括在數(shù)字多功能光盤播放器中,或者作為軟件程序安裝到標(biāo)準(zhǔn)的桌面計算機(jī)上。
所述字幕翻譯引擎還可以包括畫面格式確定模塊,用于確定所述視頻源的視頻格式。
在第二方面中,提供了一種方法,用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內(nèi)容;以及通過在語言詞典上進(jìn)行查詢,而將所述第一語言的所述被提取的字幕內(nèi)容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內(nèi)容。
在第三方面中,提供了一種計算機(jī)程序產(chǎn)品,包括用于承載計算機(jī)可執(zhí)行指令的計算機(jī)可讀介質(zhì),所述計算機(jī)可執(zhí)行指令用于執(zhí)行所述方法。
在第四方面中,提供了一種經(jīng)翻譯的字幕流,由所述方法所產(chǎn)生。
在第五方面中,提供了一種視頻流,包括與所述的經(jīng)翻譯的字幕流復(fù)用的運動圖象專家組-2(MPEG-2)視頻流。
現(xiàn)在將參考附圖來描述本發(fā)明的例子,所述附圖中圖1是包括根據(jù)本發(fā)明的字幕翻譯引擎的家庭娛樂系統(tǒng)的框圖;以及圖2是將來自視頻源的字幕內(nèi)容翻譯成另一種語言的流程圖。
具體實施例方式
參考圖1,字幕翻譯引擎20是包括在典型的家庭娛樂系統(tǒng)10中的獨立單元20。字幕翻譯引擎20將來自DVD電影的字幕內(nèi)容翻譯成該DVD上沒有的另一種語言。家庭娛樂系統(tǒng)10包括DVD播放器11、諸如電視或監(jiān)視器12的顯示單元、高保真單元13和揚(yáng)聲器14。字幕翻譯引擎20連接到DVD播放器11的輸出端和電視12的輸入端。
字幕翻譯引擎20包括字幕提取模塊21和翻譯模塊22。還提供了畫面格式檢測器(未示出),以初始確定視頻格式是DVD,還是對于翻譯可兼容的另一種視頻格式。
參考圖2,在已經(jīng)檢測(51)到兼容的視頻格式之后,字幕提取模塊21從DVD提取(52)第一語言的字幕內(nèi)容,例如英語。字幕是從DVD播放器11的SPC流在其與視頻和音頻流復(fù)用之前提取的,并被字幕提取模塊21捕捉到?;蛘?,DVD播放器的視頻輸出被解復(fù)用成其組成流,并且SPC流被字幕提取模塊21捕捉到。字幕提取模塊21具有光學(xué)字符識別(OCR)引擎(未示出),來將圖像格式的字幕內(nèi)容轉(zhuǎn)換(53)成文本格式,也就是將嵌在圖像中的文字轉(zhuǎn)換成ASCII文本。一旦進(jìn)行了OCR,并且所提取的字幕是文本格式的,那就將其傳遞(54)到翻譯模塊22,以將此英語字幕翻譯成含義相同的例如漢語的第二語言。為了改進(jìn)OCR過程,預(yù)定義了各種字幕顯示風(fēng)格,并將已預(yù)先調(diào)整的OCR例程包括在OCR引擎中。
在翻譯模塊22中,使用英語字幕文本作為輸入來在語言詞典上進(jìn)行查詢。在此例子中,詞典(未示出)是電子英漢詞典,并包含詞對詞的翻譯(56)以及短語對短語的翻譯(55)。如果英語的短語在詞典中不能得到漢語同義語的確定的匹配(57),則對短語進(jìn)行詞對詞的翻譯。英語字幕被逐漸翻譯成漢語,直到已經(jīng)將所有可能的英語單詞翻譯(58)成漢語同義語。詞典可以被用戶更新或替換,如果有更新的版本可用的話。詞典經(jīng)由因特網(wǎng)下載或者從可安裝的CD-ROM盤來更新。例如在因特網(wǎng)上的詞典的中央拷貝,可以由一組人員來提供和維護(hù),以提高其準(zhǔn)確性或者增強(qiáng)該詞典的短語對短語的能力。
在已經(jīng)從英語字幕生成漢語字幕之后,生成(59)替代的SPC流以與視頻流復(fù)用(60),并輸出(61)到電視12的視頻輸入端。在電影回放期間以漢語輸出所提取的字幕內(nèi)容,其中來自該字幕翻譯過程的延遲很小或者沒有。對由字幕翻譯引擎20提取的下一個字幕重復(fù)此過程本身。
在用戶選擇了要顯示的字幕的語言之后,將字幕從一種語言翻譯到DVD上沒有的另一種語言,對用戶是無縫和透明的。
本發(fā)明可以應(yīng)用到SVCD。SVCD視頻格式疊加了字幕圖形。SVCD視頻流包含多達(dá)四個用于不同語言的獨立字幕通道。字幕被實時疊加在視頻圖像之上,并提供在獨立的軌上,它們可以按需要被打開和關(guān)閉。
雖然已經(jīng)參考DVD和SVCD格式描述了本發(fā)明,但可以想到分開存儲視頻內(nèi)容和字幕的其他視頻格式也是可能的。
雖然已經(jīng)參考獨立單元20描述了本發(fā)明,但可以想到安裝有軟件來執(zhí)行所描述的翻譯方法的標(biāo)準(zhǔn)計算機(jī)也是可能的。還可以想到可以改進(jìn)標(biāo)準(zhǔn)的DVD播放器來進(jìn)行所描述的翻譯方法。
本領(lǐng)域技術(shù)人員將認(rèn)識到,可以對具體實施例中所示的本發(fā)明進(jìn)行很多改變和/或改進(jìn),而不偏離廣泛描述的本發(fā)明的范圍和技術(shù)構(gòu)思。因此,這些實施例應(yīng)在所有方面都認(rèn)為是說明性的,而非限制性的。
權(quán)利要求
1.一種字幕翻譯引擎,用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,所述引擎包括字幕提取器,用于從所述視頻源提取第一語言的字幕內(nèi)容;和翻譯模塊,用于通過在語言詞典上進(jìn)行查詢,而將所述第一語言的所述被提取的字幕內(nèi)容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內(nèi)容。
2.如權(quán)利要求1所述的引擎,其中所述視頻源是數(shù)字多功能光盤、超級視頻光盤格式的,或者是其中視頻內(nèi)容和字幕作為單獨實體存儲的任何格式的。
3.如權(quán)利要求1所述的引擎,其中所述語言詞典是查詢表和數(shù)據(jù)庫中的一種。
4.如權(quán)利要求3所述的引擎,其中所述語言詞典能夠被更新。
5.如權(quán)利要求3所述的引擎,其中所述語言詞典被用于在多于兩種語言之間的翻譯。
6.如權(quán)利要求1所述的引擎,其中所述字幕提取器包括光學(xué)字符識別引擎,以將圖像格式的字幕內(nèi)容轉(zhuǎn)換成文本格式。
7.如權(quán)利要求1所述的引擎,其中所述翻譯模塊在詞對詞或者短語對短語的基礎(chǔ)上翻譯文字。
8.如權(quán)利要求1所述的引擎,其中所述第一語言是英語、法語、西班牙語、意大利語或者德語中的任何一種。
9.如權(quán)利要求1所述的引擎,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
10.如權(quán)利要求1所述的引擎,其中所述字幕翻譯引擎是獨立單元,用于與數(shù)字多功能光盤播放器和電視屏幕連接以分別輸入和輸出。
11.如權(quán)利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎包括在數(shù)字多功能光盤播放器中。
12.如權(quán)利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎是將要安裝到計算機(jī)上的軟件程序。
13.如權(quán)利要求1所述的引擎,還包括畫面格式確定模塊,用于確定所述視頻源的視頻格式。
14.一種方法,用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內(nèi)容;以及通過在語言詞典上進(jìn)行查詢,而將所述第一語言的所述被提取的字幕內(nèi)容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內(nèi)容。
15.如權(quán)利要求14所述的方法,包括初始步驟,在所述初始步驟中檢測所述視頻源的視頻格式以確定所述視頻源對于翻譯是否是可兼容的。
16.如權(quán)利要求14所述的方法,其中所述視頻源是數(shù)字多功能光盤、超級視頻光盤格式的,或者是其中視頻內(nèi)容和字幕作為單獨實體存儲的任何格式的。
17.如權(quán)利要求14所述的方法,其中所述語言詞典是查詢表和數(shù)據(jù)庫中的一種。
18.如權(quán)利要求17所述的方法,其中所述語言詞典能夠被更新。
19.如權(quán)利要求17所述的方法,其中所述語言詞典被用于在多于兩種語言之間的翻譯。
20.如權(quán)利要求14所述的方法,其中提供了光學(xué)字符識別引擎,用以將圖像格式的字幕內(nèi)容轉(zhuǎn)換成文本格式。
21.如權(quán)利要求14所述的方法,其中在詞對詞或者短語對短語的基礎(chǔ)上翻譯所述被提取字幕內(nèi)容的文字。
22.如權(quán)利要求14所述的方法,其中所述第一語言是英語、法語、西班牙語、意大利語或者德語中的任何一種。
23.如權(quán)利要求14所述的方法,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
24.一種計算機(jī)程序產(chǎn)品,包括用于承載計算機(jī)可執(zhí)行指令的計算機(jī)可讀介質(zhì),所述計算機(jī)可執(zhí)行指令用于執(zhí)行如權(quán)利要求14所述的方法。
25.一種經(jīng)翻譯的字幕流,由如權(quán)利要求14所述的方法所產(chǎn)生。
26.一種視頻流,包括與如權(quán)利要求25所述的經(jīng)翻譯的字幕流復(fù)用的運動圖象專家組-2視頻流。
全文摘要
本發(fā)明公開了一種字幕翻譯引擎(20),用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,所述引擎(20)包括字幕提取器(21),用于從所述視頻源提取第一語言的字幕內(nèi)容;和翻譯模塊(22),用于通過在語言詞典上進(jìn)行查詢,而將所述第一語言的所述被提取的字幕內(nèi)容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內(nèi)容。
文檔編號G09B19/06GK1697515SQ200410038308
公開日2005年11月16日 申請日期2004年5月14日 優(yōu)先權(quán)日2004年5月14日
發(fā)明者萬康, 劉志杰 申請人:創(chuàng)新科技有限公司