專利名稱:一種多語種雙向混排字幕的編輯系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及字幕制作的技術(shù)領(lǐng)域,特別是涉及一種多語種雙向混排字幕的編輯系 統(tǒng)。
背景技術(shù):
目前,隨著世界經(jīng)濟(jì)的發(fā)展,國際交流與合作的擴(kuò)大,作為最重要的信息載體的文 字必然受到影響。過去幾乎都是單一語種的文檔,而今的文檔往往以某一語種文字為主,同 時混排了其他的語種文字,最常見的莫過于中英文混排,當(dāng)然還有俄文、法文、日文、阿拉伯 文等其他語種的混排。在廣播、電視、電影等領(lǐng)域的國際節(jié)目制作中,對多語種混排字幕的 需求也越來越迫切。在視頻節(jié)目中多語種混排的字幕,不僅要求內(nèi)容正確,而且要求視覺效果,同時要 求制作的快捷簡便。然而,由于各語種的語言結(jié)構(gòu)、文字符號的復(fù)雜多樣性,多語種的混排 問題仍有很多。尤其是從右至左排列的阿拉伯語、希伯來語、波斯語等文字,與從左至右排 列的中、英等文字的混排中,操作極為復(fù)雜?,F(xiàn)有技術(shù)中,對于既含阿拉伯文等從右至左排列的文本、又含中英文等從左至右 排列的文本的混編字幕的制作,或者是單一小語種字幕(如阿拉伯語、希伯來語、波斯語或 烏爾都語)的制作,制作人員往往需要在不同的文本編輯框內(nèi)編輯單一語種文字,然后進(jìn) 行拼接;或者,需要采用不同的文本圖像編輯軟件制作存成圖片使用。并且一旦涉及在兩種 排列規(guī)則中通用的符號,還需要進(jìn)一步針對該通用符號進(jìn)行處理,因此工作量很大,效率很 低,無法滿足實際中國際節(jié)目的增多、直播節(jié)目的需求。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種多語種雙向混排字幕的編輯系統(tǒng),用以簡 化多語種字幕的編排,提高多語種字幕的制作效率。為了解決上述技術(shù)問題,本發(fā)明實施例公開了一種多語種雙向混排字幕的編輯系 統(tǒng),包括文本單元編排模塊,用于將一行內(nèi)連續(xù)且屬于同一語種的字幕文本字符分割為文 本單元,并在文本單元內(nèi)將所述字符按其語種的排列規(guī)則進(jìn)行編排;語種排列判斷模塊,用于判斷相鄰文本單元的語種是否對應(yīng)同樣的排列規(guī)則,若 是,則觸發(fā)順序編排模塊;若否,則觸發(fā)定位編排模塊;順序編排模塊,用于按照所述排列規(guī)則順序編排所述文本單元;定位編排模塊,用于依據(jù)所述排列規(guī)則將后一文本單元排入前一文本單元的特定 位置;通用字符編排模塊,用于在字幕文本中出現(xiàn)的通用符號時,通過關(guān)聯(lián)與其銜接的 前后文本單元進(jìn)行編排。優(yōu)選的,所述相鄰文本單元分別為中文、英文、數(shù)字和/或通用符號,所述順序編排模塊包括從左向右編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的右側(cè)。優(yōu)選的,所述相鄰文本單元分別為阿拉伯文、希伯來文、波斯文和/或烏爾都文, 所述順序編排模塊包括從右向左編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的左側(cè)。優(yōu)選的,所述通用字符排版模塊包括單向編排子模塊,用于當(dāng)前的單向排列規(guī)則將該通用符號排于相應(yīng)的前后文本單 元之間。優(yōu)選的,所述相鄰文本單元的排列規(guī)則分別為,前一文本單元為從右向左排列,后 一文本單元為從左向右排列,所述定位編排模塊包括右排子模塊,用于在本行內(nèi)將后一文本單元向右排,直至排于前一文本單元的左 側(cè)。優(yōu)選的,所述相鄰文本單元的排列規(guī)則分別為,前一文本單元為從左向右排列,后 一文本單元為從右向左排列,所述定位編排模塊包括左排子模塊,用于在本行內(nèi)將后一文本單元向左排,直至排于前一文本單元最遠(yuǎn) 端的左側(cè)。優(yōu)選的,所述通用字符排版模塊包括雙向混排子模塊,用于在本行內(nèi)將該符號向左排于前一文本單元最遠(yuǎn)端的左側(cè)。優(yōu)選的,所述最遠(yuǎn)端通過以下規(guī)則確定,在所述前一文本單元的前向相鄰文本單 元同為從左向右排列的文本單元時,繼續(xù)向前判定,直到獲得前向相鄰文本單元為從右向 左排列的文本單元為止,則當(dāng)前從左向右排列的文本單元為最遠(yuǎn)端。優(yōu)選的,所述通用字符排版模塊包括成組字符編排子模塊,用于在所述通用符號為成對出現(xiàn)的符號時,采用該組符號 內(nèi)文本單元的排列規(guī)則進(jìn)行排版。優(yōu)選的,所述字幕文本采用Unicode編碼。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點本發(fā)明以行為單位,并把一行內(nèi)的字幕文本按照其連續(xù)、同語種的特性分割為多 個文本單元,如一行內(nèi)的字幕文本為一組中文字符、一組英文字符和一組數(shù)字組成,并且, 文本單元內(nèi)的字符按其語種的排列規(guī)則進(jìn)行編排,在編排相鄰的兩個文本單元時,若二者 的語種具有一致的排列規(guī)則,如同為從左向右,或同為從右向左,則按照相應(yīng)的排列規(guī)則順 序編排這兩個相鄰文本單元。若二者的語種對應(yīng)不同的排列規(guī)則,如前一文本單元為從左 向右排列,后一文本單元為從右向左排列,則依據(jù)所述排列規(guī)則將后一文本單元排入前一 文本單元的特定位置。并且,在字幕文本中出現(xiàn)的通用符號時,還可以通過關(guān)聯(lián)與其銜接的 前后文本單元確定其排版方向。應(yīng)用本發(fā)明在對多語種的文本進(jìn)行處理時,無需針對各個語種分別編輯后再進(jìn)行 拼接,也無需處理成圖片,用戶只需要按照其輸入習(xí)慣輸入文本,就會依據(jù)該文本語種的排 列規(guī)則對文本進(jìn)行編排,從而有效簡化多語種雙向混排字幕的編輯系統(tǒng),提高多語種雙向 混排字幕的編輯系統(tǒng)效率。充分滿足了當(dāng)前國際節(jié)目的增多、直播節(jié)目的需求。
圖1是本發(fā)明的一種多語種雙向混排字幕的編輯系統(tǒng)的結(jié)構(gòu)框圖。
具體實施例方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如多處理器系統(tǒng)、服 務(wù)器、網(wǎng)絡(luò)PC、小型計算機(jī)、大型計算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計算環(huán)境等等。本發(fā)明可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本發(fā)明,在這些分布式計算環(huán)境中,由 通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以 位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。字幕一般指以文字形式顯示電視、電影、舞臺作品里面的對話等非影像內(nèi)容,也泛 指影視作品后期加工的文字。例如,影視作品的對話字幕,一般出現(xiàn)在屏幕下方;而戲劇作 品的字幕,則可能顯示于舞臺兩旁或上方。另外,還可以將節(jié)目的語音內(nèi)容以字幕方式顯 示,可以幫助聽力較弱的觀眾理解節(jié)目內(nèi)容。隨著電視事業(yè)的發(fā)展,字幕在電視中的作用越 來越大,日均播出次數(shù)增多,字幕播出的形式多樣,字幕制作也更加精美。參考圖1,示出了本發(fā)明的一種多語種雙向混排字幕的編輯系統(tǒng)實施例的結(jié)構(gòu)框 圖,具體可以包括以下模塊文本單元編排模塊101,用于將一行內(nèi)連續(xù)且屬于同一語種的字幕文本字符分割 為文本單元,并在文本單元內(nèi)將所述字符按其語種的排列規(guī)則進(jìn)行編排;語種排列判斷模塊102,用于判斷相鄰文本單元的語種是否對應(yīng)同樣的排列規(guī)則, 若是,則觸發(fā)順序編排模塊103 ;若否,則觸發(fā)定位編排模塊104 ;順序編排模塊103,用于按照所述排列規(guī)則順序編排所述文本單元;定位編排模塊104,用于依據(jù)所述排列規(guī)則將后一文本單元排入前一文本單元的 特定位置;通用字符編排模塊105,用于在字幕文本中出現(xiàn)的通用符號時,通過關(guān)聯(lián)與其銜接 的前后文本單元進(jìn)行編排。需要說明的是,所述字幕文本可以采用Unicode編碼。Unicode是國際組織制定 的可以容納世界上所有文字和符號的字符編碼方案,它為每種語言中的每個字符設(shè)定了統(tǒng) 一并且唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺進(jìn)行文本轉(zhuǎn)換、處理的要求。阿拉伯文包 含32個字母,每個字母因其在詞中的首中尾位置具有不同排列形式,但其Unicode編碼是 不變的。再者,在實際中,每種語言都提供有缺省的默認(rèn)字體,例如,中文字體包含中文字符 集,缺省黑體。英文缺省字體Arial。阿拉伯文字符也是字母,缺省也是Arial。在本發(fā)明的一種相鄰文本單元的語種對應(yīng)同樣排列規(guī)則的具體應(yīng)用中,若當(dāng)前行 內(nèi),所述相鄰文本單元分別為中文、英文、數(shù)字和/或通用符號,由于中文、英文、數(shù)字和通 用符號都是采用從左至右的排列規(guī)則,則可以依據(jù)從左至右的方向順序編排所述相鄰文本 單元,即所述順序編排模塊103可以包括如下子模塊
從左向右編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的右側(cè)。例如,假設(shè)某一行內(nèi)的字幕文本包括中文字符為cl c2,英文字符el e2,數(shù)字字符nl n2,則其編排結(jié)果可以為cl c2 el e2 nl n2上述下劃線指示的一組字符即對應(yīng)一個文本單元,在本例中,文本單元內(nèi)部的字 符是按其語種從左向右進(jìn)行排序,對于相鄰兩個文本單元而言,在編輯后一文本單元時,會 自動將其排入前一文本單元的右側(cè)。在本發(fā)明的另一種相鄰文本單元的語種對應(yīng)同樣排列規(guī)則的具體應(yīng)用中,若當(dāng)前 行內(nèi),所述相鄰文本單元分別為阿拉伯文、希伯來文、波斯文或烏爾都文,由于阿拉伯文、希 伯來文、波斯文或烏爾都文都是采用從右向左的排列規(guī)則,則可以依據(jù)從右至左的方向順 序編排所述相鄰文本單元,即所述順序編排模塊103可以包括如下子模塊從右向左編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的左側(cè)。例如,假設(shè)某一行內(nèi)的字幕文本包括阿拉伯文字符al a2,波斯文字符bl b2,烏爾都文wl w2。則其編排結(jié)果可以為w2 wl b2 bl a2 al同樣地,上述下劃線指示的一組字符即對應(yīng)一個文本單元,在本例中,文本單元內(nèi) 部的字符是按其語種從右向左進(jìn)行排序,對于相鄰兩個文本單元而言,在編輯后一文本單 元時,會自動將其排入前一文本單元的左側(cè)。相應(yīng)地,在上述兩種相鄰文本單元的語種對應(yīng)同樣排列規(guī)則的具體應(yīng)用中,所述 通用字符排版模塊105可以包括如下子模塊單向編排子模塊,用于當(dāng)前的單向排列規(guī)則將該通用符號排于相應(yīng)的前后文本單 元之間。以中英文混排字幕為例,因為中文和英文均采用從左向右的排列規(guī)則,通用符號 如“.”,“ ’”,“(”,“)”等直接按英文字符處理即可。例如,假設(shè)某一行內(nèi)的字幕文本包括中文字符cl c2,通用符號_,英文字符el e2,則其編排結(jié)果可以為cl c2~el e2以阿拉伯文為例,公知的是,阿拉伯文在Unicode中有基本阿拉伯語(U+0060 to U+006FF)和擴(kuò)充阿拉伯語(U+FE70 to U+FEFF)兩種格式,包含所有阿拉伯語字符和符號。 在此Unicode范圍內(nèi)的阿文符號直接按阿拉伯文處理,如
權(quán)利要求
1.一種多語種雙向混排字幕的編輯系統(tǒng),其特征在于,包括文本單元編排模塊,用于將一行內(nèi)連續(xù)且屬于同一語種的字幕文本字符分割為文本單 元,并在文本單元內(nèi)將所述字符按其語種的排列規(guī)則進(jìn)行編排;語種排列判斷模塊,用于判斷相鄰文本單元的語種是否對應(yīng)同樣的排列規(guī)則,若是,則 觸發(fā)順序編排模塊;若否,則觸發(fā)定位編排模塊;順序編排模塊,用于按照所述排列規(guī)則順序編排所述文本單元;定位編排模塊,用于依據(jù)所述排列規(guī)則將后一文本單元排入前一文本單元的特定位置;通用字符編排模塊,用于在字幕文本中出現(xiàn)的通用符號時,通過關(guān)聯(lián)與其銜接的前后 文本單元進(jìn)行編排。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述相鄰文本單元分別為中文、英文、數(shù)字 和/或通用符號,所述順序編排模塊包括從左向右編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的右側(cè)。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述相鄰文本單元分別為阿拉伯文、希伯來 文、波斯文和/或烏爾都文,所述順序編排模塊包括從右向左編排子模塊,用于將當(dāng)前文本單元排于相鄰前一文本單元的左側(cè)。
4.如權(quán)利要求2或3所述的系統(tǒng),其特征在于,所述通用字符排版模塊包括單向編排子模塊,用于當(dāng)前的單向排列規(guī)則將該通用符號排于相應(yīng)的前后文本單元之間。
5.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述相鄰文本單元的排列規(guī)則分別為,前一 文本單元為從右向左排列,后一文本單元為從左向右排列,所述定位編排模塊包括右排子模塊,用于在本行內(nèi)將后一文本單元向右排,直至排于前一文本單元的左側(cè)。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述相鄰文本單元的排列規(guī)則分別為,前一 文本單元為從左向右排列,后一文本單元為從右向左排列,所述定位編排模塊包括左排子模塊,用于在本行內(nèi)將后一文本單元向左排,直至排于前一文本單元最遠(yuǎn)端的 左側(cè)。
7.如權(quán)利要求5或6所述的系統(tǒng),其特征在于,所述通用字符排版模塊包括 雙向混排子模塊,用于在本行內(nèi)將該符號向左排于前一文本單元最遠(yuǎn)端的左側(cè)。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述最遠(yuǎn)端通過以下規(guī)則確定,在所述前一 文本單元的前向相鄰文本單元同為從左向右排列的文本單元時,繼續(xù)向前判定,直到獲得 前向相鄰文本單元為從右向左排列的文本單元為止,則當(dāng)前從左向右排列的文本單元為最 遠(yuǎn)端。
9.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述通用字符排版模塊包括成組字符編排子模塊,用于在所述通用符號為成對出現(xiàn)的符號時,采用該組符號內(nèi)文 本單元的排列規(guī)則進(jìn)行排版。
10.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述字幕文本采用Unicode編碼。
全文摘要
本發(fā)明公開了一種多語種雙向混排字幕的編輯系統(tǒng),包括文本單元編排模塊,用于將一行內(nèi)連續(xù)且屬于同一語種的字幕文本字符分割為文本單元,并在文本單元內(nèi)將所述字符按其語種的排列規(guī)則進(jìn)行編排;語種排列判斷模塊,用于判斷相鄰文本單元的語種是否對應(yīng)同樣的排列規(guī)則,若是,則觸發(fā)順序編排模塊;若否,則觸發(fā)定位編排模塊;順序編排模塊,用于按照所述排列規(guī)則順序編排所述文本單元;定位編排模塊,用于依據(jù)所述排列規(guī)則將后一文本單元排入前一文本單元的特定位置;通用字符編排模塊,用于在字幕文本中出現(xiàn)的通用符號時,通過關(guān)聯(lián)與其銜接的前后文本單元進(jìn)行編排。本發(fā)明可以簡化多語種字幕的編排,提高多語種字幕的制作效率。
文檔編號G06F17/24GK102103586SQ20091024196
公開日2011年6月22日 申請日期2009年12月16日 優(yōu)先權(quán)日2009年12月16日
發(fā)明者馮永, 沈季, 袁慧晶, 陳麗愛 申請人:新奧特(北京)視頻技術(shù)有限公司