專利名稱:交互式視頻設(shè)備及其字幕疊加方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種交互式視頻設(shè)備及其字幕疊加方法,更確切地說是涉及一種交互式視頻設(shè)備及其中采用的軟件字幕疊加方法,通過本發(fā)明的軟件字幕疊加方法,可以實(shí)現(xiàn)會(huì)議電視系統(tǒng)中字幕的簡(jiǎn)單生成和與圖像信號(hào)的合而為一發(fā)送。
顯然這種方式有以下缺陷需要額外的字幕疊加硬件設(shè)備,這就增加了系統(tǒng)的復(fù)雜程度,增加了系統(tǒng)成本;由于字幕疊加設(shè)備串在會(huì)議電視設(shè)備和電視機(jī)之間,疊加的字幕只能在本端的電視機(jī)上顯示,不能傳送至?xí)h電視系統(tǒng)的其他遠(yuǎn)端電視機(jī)顯示,使用不甚方便。
本發(fā)明的基本思想是采用字幕疊加軟件接收控制層傳來的欲生成字幕的信息,據(jù)此生成透明底色的字幕圖像,疊加在圖像上,生成合而為一的帶字幕圖像,送去顯示或傳輸。
根據(jù)本發(fā)明一個(gè)方面,提供了一種用于交互式視頻設(shè)備的字幕疊加方法,其采用控制層接收用戶對(duì)欲生成的字幕的設(shè)置,其特征在于進(jìn)一步包含以下步驟A、采用字幕生成模塊,接收控制層傳來的欲生成字幕的信息,據(jù)此生成透明底色的字幕圖像;B、采用字幕疊加模塊,將所述的字幕圖像疊加在數(shù)字業(yè)務(wù)圖像上,生成帶字幕的圖像在本端顯示或向遠(yuǎn)端傳輸。
較佳地,所述控制層傳給所述字幕生成模塊的欲生成字幕的信息包含字幕所有字符的區(qū)位碼、字幕位置信息、字幕大小信息、和字幕顏色信息。
較佳地,所述控制層傳給所述字幕生成模塊的欲生成字幕的信息包含欲生成字幕所有字符的區(qū)位碼,這些字符的區(qū)位碼通過以下步驟生成采用字庫(kù)生成工具,選用矢量字體,根據(jù)要顯示的字體大小,用程序?qū)⒆址粋€(gè)個(gè)在PC屏幕上顯示,然后把輸出的結(jié)果作為圖像點(diǎn)陣記錄下來,按照特定格式保存成字庫(kù)文件。
較佳地,所述控制層傳來的欲生成字幕的信息包含字幕顏色信息,所述的字幕生成模塊根據(jù)該字幕顏色信息,設(shè)置或改變字符的顏色,并保持字幕圖像的底色為透明不變。
較佳地,在步驟A中,字幕生成模塊接收控制層傳來的欲生成字幕的信息,根據(jù)控制層選擇的顯示位置和內(nèi)容,讀取所有字符的點(diǎn)陣,組合成一幅包含彩色字幕的透明底色的字幕圖像。
較佳地,控制層可以選擇字幕圖像在本端疊加或在遠(yuǎn)端疊加,并且在控制層選擇本端疊加的情況下,字幕圖像被疊加到解碼之后的本端接收業(yè)務(wù)圖像中,輸出至本端顯示;在控制層選擇遠(yuǎn)端疊加的情況下,字幕圖像被疊加到編碼之前的本端發(fā)送業(yè)務(wù)圖像中,編碼后發(fā)送到遠(yuǎn)端。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種交互式視頻設(shè)備,其采用控制層接收用戶對(duì)欲生成的字幕的設(shè)置,其特征在于包含字幕生成模塊和字幕疊加模塊,其中字幕生成模塊,接收控制層傳來的欲生成字幕的信息,據(jù)此生成透明底色的字幕圖像;字幕疊加模塊,將所述的字幕圖像疊加在數(shù)字業(yè)務(wù)圖像上,生成帶字幕的圖像在本端顯示或向遠(yuǎn)端傳輸。
較佳地,所述的字幕生成模塊接收控制層傳來的欲生成字幕的信息,根據(jù)控制層選擇的顯示位置和內(nèi)容,讀取所有字符的點(diǎn)陣,組合成一幅包含彩色字幕的透明底色的字幕圖像。
較佳地,所述的字幕疊加模塊設(shè)置在編解碼器中,位于圖像編解碼模塊之前;所述的字幕生成模塊設(shè)置在該編解碼器中,與該字幕疊加模塊連接。
較佳地,所述的字幕疊加模塊包含第一字幕疊加模塊和第二字幕疊加模塊,所述的字幕生成模塊包含第一字幕生成模塊和第二字幕生成模塊,其中第一字幕疊加模塊,設(shè)置在編碼器中,位于圖像編碼模塊之前的業(yè)務(wù)通道上;第一字幕生成模塊,設(shè)置在編碼器中,與該第一字幕疊加模塊連接;第二字幕疊加模塊,設(shè)置在解碼器中,位于圖像解碼模塊之后的業(yè)務(wù)通道上;第二字幕生成模塊,設(shè)置在解碼器中,與該第二字幕疊加模塊連接。
本發(fā)明具有以下優(yōu)點(diǎn)1、用字幕疊加軟件,取代了原來的字幕疊加設(shè)備顯然減少了硬件設(shè)備、降低了系統(tǒng)成本;2、本發(fā)明的方法,只需要在第一幀顯示時(shí)生成字幕圖像,在后面的幀里只需要一個(gè)簡(jiǎn)單的疊加過程,不需要對(duì)每幀掃描圖像,提高了處理速度,尤其是在全屏字幕的情況下;3、本發(fā)明疊加的字幕和圖像是組合生成一幅合而為一的帶字幕圖像進(jìn)行傳送,所以即是使用國(guó)外的終端設(shè)備也可以顯示中文字幕;4、字幕疊加軟件置放于會(huì)議電視終端的硬件平臺(tái)上,從而可以自由地選擇本端和遠(yuǎn)端疊加,徹底解決了不能傳送遠(yuǎn)端顯示的弊端。
圖3示出了本發(fā)明的單DSP平臺(tái)字幕疊加實(shí)施例框圖;圖4示出了本發(fā)明的雙DSP平臺(tái)的字幕疊加實(shí)施例框圖。
如圖2所示,字幕疊加軟件模塊產(chǎn)生的字幕圖像,經(jīng)過一個(gè)開關(guān)分別接到編碼器的字幕疊加或者解碼器的字幕疊加;選擇本端時(shí),開關(guān)接通解碼器,字幕圖像經(jīng)開關(guān)送到解碼器的字幕疊加,與解碼器解碼后的圖像疊加,送至電視機(jī)顯示;選擇遠(yuǎn)端時(shí),開關(guān)接通編碼器,字幕圖像經(jīng)開關(guān)送至編碼器,和攝像機(jī)送來的圖像疊加,疊加后的帶字幕的圖像送至編碼器編碼后,傳送道傳輸信道上,向遠(yuǎn)端傳送。
考慮到字體優(yōu)美和大字體,不直接采用一般使用的點(diǎn)陣字庫(kù),而采用矢量字庫(kù)來生成的辦法。根據(jù)需要選擇好字體(可以使用控制層WINDOWS使用的任何一種矢量字體)和要顯示的字體大小,用程序?qū)⒆址粋€(gè)個(gè)在PC屏幕上顯示,然后把輸出的結(jié)果作為圖像點(diǎn)陣記錄下來,存成自定義的格式,保存成字庫(kù)文件。用此方法只要改變參數(shù)就可以生成不同字體,不同大小的字庫(kù)。
根據(jù)控制層選定的顏色,直接改變字幕圖像的顏色,并保持底色為透明不變??刂茖优渲米帜活伾珪r(shí),可以使用調(diào)色板來選取顏色,顏色十分豐富。改變顏色軟件的實(shí)現(xiàn)也比較簡(jiǎn)單、靈活。
控制層把設(shè)置好的字幕內(nèi)碼和字幕顏色信息傳遞到該軟件模塊,該軟件模塊首先根據(jù)要疊加字幕字?jǐn)?shù)和大小,生成一個(gè)YUV420格式的圖像,大小正好包括字幕,填上透明色,再根據(jù)字幕內(nèi)容的點(diǎn)陣和設(shè)置的顏色在該圖像上依次打點(diǎn),生成一幅包含彩色字幕的透明底色的字幕圖像。如此生成一幅字幕圖像點(diǎn)陣,再疊加到輸入或輸出的數(shù)字圖像中。顯然只需要在第一幀顯示時(shí)生成字幕圖像,在后面的幀里只需要一個(gè)簡(jiǎn)單的疊加過程,不需要對(duì)每幀掃描字幕點(diǎn)陣,提高了處理速度,尤其是在全屏字幕的情況下更顯示出此方法的重要。由此疊加過程可以看出,采用本發(fā)明疊加的字幕是和圖像合而為一的,即使是使用國(guó)外的終端設(shè)備也可以觀看中文字幕(包括中文會(huì)場(chǎng)名)。
該軟件模塊在進(jìn)行字幕疊加的時(shí)候,可以選擇疊加在本端還是遠(yuǎn)端。如果選擇本端時(shí),字幕圖像傳送至解碼器,由解碼器來完成,字幕圖像被疊加在解碼后的圖像里,再輸出到電視機(jī)上顯示;選擇遠(yuǎn)端時(shí),字幕圖像傳送至編碼器,由編碼器完成字幕圖像和圖像的疊加,然后將合而為一的帶字幕圖像編碼發(fā)送到遠(yuǎn)端,從而使遠(yuǎn)端能顯示字幕。
圖3是一個(gè)應(yīng)用軟件字幕疊加的單DSP平臺(tái)的會(huì)議電視終端的框圖,圖4是一個(gè)應(yīng)用軟件字幕疊加的雙DSP平臺(tái)的會(huì)議電視終端框圖,基本原理相同。由于不涉及到本發(fā)明,圖3和圖4的框圖中未示出語(yǔ)音處理部分及數(shù)據(jù)處理部分。
單DSP平臺(tái)是指編解碼共用一個(gè)數(shù)字信號(hào)處理器DSP完成;雙DSP平臺(tái)是指編解碼分別各使用一個(gè)數(shù)字信號(hào)處理器DSP。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的權(quán)利要求范圍之內(nèi)。
權(quán)利要求
1.一種用于交互式視頻設(shè)備的字幕疊加方法,采用控制層接收用戶對(duì)欲生成的字幕的設(shè)置,其特征在于進(jìn)一步包含以下步驟A、采用字幕生成模塊,接收控制層傳來的欲生成字幕的信息,據(jù)此生成透明底色的字幕圖像;B、采用字幕疊加模塊,將所述的字幕圖像疊加在數(shù)字業(yè)務(wù)圖像上,生成帶字幕的圖像在本端顯示或向遠(yuǎn)端傳輸。
2.如權(quán)利要求1所述的一種用于交互式視頻設(shè)備的字幕疊加方法,其特征在于所述控制層傳給所述字幕生成模塊的欲生成字幕的信息包含字幕所有字符的區(qū)位碼、字幕位置信息、字幕大小信息、和字幕顏色信息。
3.如權(quán)利要求1所述的一種用于交互式視頻設(shè)備的字幕疊加方法,其特征在于,所述控制層傳給所述字幕生成模塊的欲生成字幕的信息包含欲生成字幕所有字符的區(qū)位碼,這些字符的區(qū)位碼通過以下步驟生成采用字庫(kù)生成工具,選用矢量字體,根據(jù)要顯示的字體大小,用程序?qū)⒆址粋€(gè)個(gè)在PC屏幕上顯示,然后把輸出的結(jié)果作為圖像點(diǎn)陣記錄下來,按照特定格式保存成字庫(kù)文件。
4.如權(quán)利要求1所述的一種用于交互式視頻設(shè)備的字幕疊加方法,其特征在于所述控制層傳來的欲生成字幕的信息包含字幕顏色信息,所述的字幕生成模塊根據(jù)該字幕顏色信息,設(shè)置或改變字符的顏色,并保持字幕圖像的底色為透明不變。
5.如權(quán)利要求1所述的一種用于交互式視頻設(shè)備的字幕疊加方法,其特征在于,在步驟A中,字幕生成模塊接收控制層傳來的欲生成字幕的信息,根據(jù)控制層選擇的顯示位置和內(nèi)容,讀取所有字符的點(diǎn)陣,組合成一幅包含彩色字幕的透明底色的字幕圖像。
6.如權(quán)利要求1所述的一種用于交互式視頻設(shè)備的字幕疊加方法,其特征在于,控制層可以選擇字幕圖像在本端疊加或在遠(yuǎn)端疊加,并且在控制層選擇本端疊加的情況下,字幕圖像被疊加到解碼之后的本端接收業(yè)務(wù)圖像中,輸出至本端顯示;在控制層選擇遠(yuǎn)端疊加的情況下,字幕圖像被疊加到編碼之前的本端發(fā)送業(yè)務(wù)圖像中,編碼后發(fā)送到遠(yuǎn)端。
7.一種交互式視頻設(shè)備,采用控制層接收用戶對(duì)欲生成的字幕的設(shè)置,其特征在于包含字幕生成模塊和字幕疊加模塊,其中字幕生成模塊,接收控制層傳來的欲生成字幕的信息,據(jù)此生成透明底色的字幕圖像;字幕疊加模塊,將所述的字幕圖像疊加在數(shù)字業(yè)務(wù)圖像上,生成帶字幕的圖像在本端顯示或向遠(yuǎn)端傳輸。
8.如權(quán)利要求7所述的一種交互式視頻設(shè)備,其特征在于所述的字幕生成模塊接收控制層傳來的欲生成字幕的信息,根據(jù)控制層選擇的顯示位置和內(nèi)容,讀取所有字符的點(diǎn)陣,組合成一幅包含彩色字幕的透明底色的字幕圖像。
9.如權(quán)利要求7所述的一種交互式視頻設(shè)備,其特征在于,所述的字幕疊加模塊設(shè)置在編解碼器中,位于圖像編解碼模塊之前;所述的字幕生成模塊設(shè)置在該編解碼器中,與該字幕疊加模塊連接。
10.如權(quán)利要求7所述的一種交互式視頻設(shè)備,其特征在于,所述的字幕疊加模塊包含第一字幕疊加模塊和第二字幕疊加模塊,所述的字幕生成模塊包含第一字幕生成模塊和第二字幕生成模塊,其中第一字幕疊加模塊,設(shè)置在編碼器中,位于圖像編碼模塊之前的業(yè)務(wù)通道上;第一字幕生成模塊,設(shè)置在編碼器中,與該第一字幕疊加模塊連接;第二字幕疊加模塊,設(shè)置在解碼器中,位于圖像解碼模塊之后的業(yè)務(wù)通道上;第二字幕生成模塊,設(shè)置在解碼器中,與該第二字幕疊加模塊連接。
全文摘要
本發(fā)明公開了一種交互式視頻設(shè)備及其字幕疊加方法,可以用于會(huì)議電視系統(tǒng)實(shí)現(xiàn)字幕生成和疊加。其使用字幕軟件模塊生成需要的字幕圖像,并疊加在圖像上;該字幕軟件根據(jù)控制層選定的字幕內(nèi)容、字體和顏色等字幕信息預(yù)先統(tǒng)一組合生成一幅字幕圖像點(diǎn)陣,選擇性地疊加在本端或遠(yuǎn)端的圖像信號(hào)上,并與圖像信號(hào)融合在一起。該技術(shù)可以在減少硬件設(shè)備、降低系統(tǒng)成本的同時(shí),更靈活、更方便地實(shí)現(xiàn)字幕疊加,并實(shí)現(xiàn)了字幕的遠(yuǎn)端傳送。
文檔編號(hào)H04N7/087GK1413028SQ0113629
公開日2003年4月23日 申請(qǐng)日期2001年10月15日 優(yōu)先權(quán)日2001年10月15日
發(fā)明者汪洪源, 龍彥波, 王靜 申請(qǐng)人:華為技術(shù)有限公司