專利名稱:面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
[0001]本實(shí)用新型主要涉及到廣播電視制作設(shè)備領(lǐng)域,特指一種字幕疊加系統(tǒng)。
背景技術(shù):
隨著電視技術(shù)的發(fā)展,電視字幕在電視節(jié)目制作中的作用也顯得越來越重要。早期的電視字幕是通過人手寫、手描,用黑白廣告色寫在黑紙上,然后用攝像機(jī)或飛點(diǎn)掃描幻燈機(jī)逐行、逐句拍攝,最后再把所拍的信號經(jīng)限幅處理疊加在圖像上,該種方式由于其步驟繁瑣且字幕疊加效果差,已漸漸被淘汰。伴隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,字幕疊加技術(shù)也得到了進(jìn)一步發(fā)展,變得越來越來自動化,疊加效果也愈來愈好,應(yīng)用范圍也變得廣泛。目前,在網(wǎng)絡(luò)電視的業(yè)務(wù)應(yīng)用中,通常會在機(jī)頂盒視頻播放期間往視頻上疊加提示性字幕,這種疊加常采用的方式是把需要顯示的字幕通過某種途徑發(fā)送到機(jī)頂盒,然后由機(jī)頂盒負(fù)責(zé)字幕實(shí)現(xiàn)的具體疊加過程。該種方法雖然成本不高,但由于需要機(jī)頂盒本身支持多種字庫、多種語言等,造成其在實(shí)現(xiàn)字幕疊加上具有很大的局限性,靈活性不夠;且該種方式下的字幕顯示方式比較簡單,疊加效果差,難以滿足用戶的實(shí)時(shí)字幕疊加的需求。有從業(yè)者提出以計(jì)算機(jī)為操作平臺的非線性編輯系統(tǒng),其由于編輯精度高,疊加效果好,不存在預(yù)卷、時(shí)基誤差等優(yōu)點(diǎn),受到各大電視臺的青睞,被廣泛應(yīng)用于電視節(jié)目的制作中。該非線性編輯系統(tǒng)通常由高性能的計(jì)算機(jī)、視頻壓縮卡和非編軟件等部件組成,其雖然具有編輯精度高、疊加效果好等優(yōu)點(diǎn),但由于其在正式編輯前,需要將錄像素材經(jīng)過數(shù)字壓縮后形成數(shù)據(jù)流先存儲到計(jì)算機(jī)的硬盤中,編輯時(shí)再按編導(dǎo)人員的創(chuàng)作意圖運(yùn)用非編軟件對所存儲的錄像素材進(jìn)行編輯、添加字幕等處理,最后再輸出;整個(gè)處理過程占用時(shí)間較長,在對實(shí)時(shí)音視頻流進(jìn)行字幕疊加方面存在一定局限。另一方面,由于非線性編輯系統(tǒng)在進(jìn)行存儲錄像素材時(shí),需要對錄像素材進(jìn)行數(shù)字壓縮,如果采用低壓縮比進(jìn)行壓縮后存儲,勢必需要更多的硬盤空間存儲錄像素材,增加硬件設(shè)備投入;而如果采用高壓縮比進(jìn)行壓縮存儲,則又會給圖像帶來一定損耗。由上可知,非線性編輯系統(tǒng)同樣也存在著字幕的實(shí)時(shí)疊加局限性較大、成本較高等不足。
實(shí)用新型內(nèi)容本實(shí)用新型要解決的技術(shù)問題就在于針對現(xiàn)有技術(shù)存在的技術(shù)問題,本實(shí)用新型提供一種結(jié)構(gòu)簡單緊湊、成本低廉、操作簡便、可以實(shí)現(xiàn)字幕的實(shí)時(shí)疊加、滿足了電視前端在任意時(shí)刻對首視頻流進(jìn)行字.置加需求的面向?qū)崟r(shí)首視頻流的字.置加系統(tǒng)。為解決上述技術(shù)問題,本實(shí)用新型采用以下技術(shù)方案一種面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),包括字幕內(nèi)容服務(wù)設(shè)備,用以對疊加的字幕信息腳本進(jìn)行制作;字幕機(jī),用以對實(shí)時(shí)音視頻流進(jìn)行字幕疊加;所述字幕內(nèi)容服務(wù)設(shè)備與字幕機(jī)相連并將制作好的字幕信息腳本發(fā)送給字幕機(jī);[0011]編碼模塊,與字幕機(jī)相連,用以對疊加字幕信息后的視頻流數(shù)據(jù)進(jìn)行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設(shè)備。作為本實(shí)用新型的進(jìn)一步改進(jìn)所述字幕機(jī)包括解碼模塊,用以對音視頻流進(jìn)行解碼并獲得每幀圖像數(shù)據(jù) ;字幕疊加模塊,包括解析單元和疊加單元,所述解析單元用以對字幕內(nèi)容服務(wù)設(shè)備發(fā)送來的字幕信息腳本進(jìn)行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;所述疊加單元用以將解析單元生成的字幕畫面疊加到視頻層上,并輸出至編碼模塊。所述解碼模塊中還包括一用以對前端傳送的音視頻流數(shù)據(jù)進(jìn)行解碼的解碼單元。所述解析單元還包括一用以存儲字幕信息腳本的存儲器。所述解碼模塊和字幕疊加模塊為機(jī)頂盒主芯片。與現(xiàn)有技術(shù)相比,本實(shí)用新型的優(yōu)點(diǎn)在于I、本實(shí)用新型面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),結(jié)構(gòu)簡單、成本低廉,不用對音視頻流進(jìn)行壓縮和存儲,直接在解碼后的視頻流上疊加字幕并編碼輸出,實(shí)現(xiàn)了字幕的實(shí)時(shí)疊加,滿足了電視前端在任意時(shí)刻對音視頻流進(jìn)行字幕疊加的需求;且這種對音視頻流不經(jīng)存儲直接實(shí)時(shí)疊加的方式還避免了存儲時(shí)造成的視頻圖像損耗和存儲設(shè)備投入;2、本實(shí)用新型中的字幕機(jī)可采用一個(gè)具有視頻解碼和字幕疊加功能的芯片完成子.置加功能,如機(jī)頂盒王芯片,成本相對降低;3、本實(shí)用新型將字幕信息融合在視頻流中,用戶端無需升級或更換設(shè)備,便可以直接顯示疊加字幕后的視頻信息,適用范圍廣。
圖I是本實(shí)用新型結(jié)構(gòu)的框架示意圖。圖2是本實(shí)用新型的執(zhí)行原理架構(gòu)示意圖。圖3是本實(shí)用新型在具體應(yīng)用實(shí)例中的工作流程示意圖。圖例說明10、字幕內(nèi)容服務(wù)設(shè)備;20、字幕機(jī);201、解碼模塊;202、字幕疊加模塊;2021、解析單元;2022、疊加單元;30、編碼模塊。
具體實(shí)施方式
以下將結(jié)合說明書附圖和具體實(shí)施例對本實(shí)用新型做進(jìn)一步詳細(xì)說明。如圖I所示,本實(shí)用新型的面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),包括字幕內(nèi)容服務(wù)設(shè)備10、字幕機(jī)20以及編碼模塊30。字幕內(nèi)容服務(wù)設(shè)備10用以對疊加的字幕信息腳本進(jìn)行制作,并將其發(fā)送給字幕機(jī)20。該字幕內(nèi)容服務(wù)設(shè)備10可以為具有字幕編輯功能的設(shè)備,本實(shí)施例中,其為裝載有字幕編輯軟件的計(jì)算機(jī)。字幕機(jī)20用以對實(shí)時(shí)音視頻流進(jìn)行字幕疊加,字幕機(jī)20包括解碼模塊201和字幕疊加模塊202。其中,解碼模塊201用以對音視頻流進(jìn)行解碼并獲得每幀圖像數(shù)據(jù);字幕疊加模塊202包括解析單元2021和疊加單元2022,解析單元2021用以對字幕內(nèi)容服務(wù)設(shè)備10發(fā)送來的字幕信息腳本進(jìn)行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;疊加單元2022用以將解析単元2021生成的字幕畫面疊加到視頻層上,即視頻圖像數(shù)據(jù)上,并輸出至編碼模塊30。編碼模塊30用以對字幕疊加后的每幀圖像數(shù)據(jù)進(jìn)行重新編碼,該編碼模塊30可以為碼流生成器或編碼器;例如本實(shí)施例中,其可采用北京世紀(jì)鼎點(diǎn)軟件有限公司推出的PowerSmart編碼器去對字幕疊加后的每幀圖像數(shù)據(jù)進(jìn)行重新編碼。本實(shí)施例中,解 碼模塊201中還包括一解碼單元(圖中未示),該解碼単元用以對前端傳送的音視頻流數(shù)據(jù)進(jìn)行解碼。本實(shí)施例中,解析單元2021還包括一用以存儲字幕信息腳本的存儲器(圖中未示)。本實(shí)施例中,解碼模塊201和字幕疊加模塊202可采用機(jī)頂盒主芯片實(shí)現(xiàn),例如,可采用海思的HI3100E芯片去實(shí)現(xiàn)對TS流中音視頻流數(shù)據(jù)的解碼,從而獲取到每幀視頻圖像數(shù)據(jù)以及進(jìn)而對解碼后每幀視頻圖像數(shù)據(jù)進(jìn)行字幕疊加等功能。由此可見,本實(shí)用新型為ー種通過利用機(jī)頂盒的OSD技術(shù),在電視前端實(shí)現(xiàn)對實(shí)時(shí)音視頻流進(jìn)行字幕疊加,且疊加速度快、成本低的字幕疊加系統(tǒng)。本實(shí)用新型相比于現(xiàn)有的非線性編輯系統(tǒng),在達(dá)到字幕疊加目的的同時(shí)已大大降低了設(shè)備成本。參見圖2,本實(shí)用新型在工作吋,將攜帶原始音視頻信息的TS流送入字幕機(jī)20 ;首先字幕機(jī)20會對TS流中的視頻流數(shù)據(jù)進(jìn)行解碼,以獲取每幀視頻圖像數(shù)據(jù),同時(shí),字幕機(jī)20中的字幕疊加模塊202對輸入的字幕信息腳本進(jìn)行解析并獲得字幕信息,且進(jìn)ー步將該字幕信息數(shù)據(jù)添加到OSD層上;其次,字幕疊加模塊202將添加字幕信息后的OSD層和視頻幀層相互疊加,進(jìn)ー步形成新的每幀視頻圖像數(shù)據(jù);最后重新將疊加后的每幀圖像數(shù)據(jù)進(jìn)行重新編碼,并將編碼后的視頻流數(shù)據(jù)與其他TS流信息通過電視信號混合器等設(shè)備組合成新的混合音視頻流進(jìn)行輸出。如圖3所示,為本實(shí)用新型在具體應(yīng)用過程中的流程示意圖,其包括以下步驟步驟401 :字幕內(nèi)容服務(wù)設(shè)備10對字幕信息腳本文件進(jìn)行制作,并通過網(wǎng)ロ(或串ロ)將定義好字幕顯示效果的字幕信息腳本文件發(fā)送給字幕機(jī)20 ;其中,字幕信息腳本定義了顯示信息和控制關(guān)鍵字描述信息,上述顯示信息包括字幕文本,控制關(guān)鍵字描述信息包括字幕顯示位置、字幕語言、字體顔色、背景顔色、字體樣式以及滾動方向等。步驟402 :字幕機(jī)20將自字幕內(nèi)容服務(wù)設(shè)備10處獲取的字幕信息腳本保存在存儲器中。進(jìn)一歩,字幕疊加模塊202將字幕信息疊加到實(shí)時(shí)音視頻流上,具體實(shí)現(xiàn)過程如下步驟403 :解析単元2021實(shí)時(shí)從存儲器中讀取字幕信息腳本并對其進(jìn)行解析,并將解析獲得的字幕信息添加到同屏顯示層上生成字幕畫面;步驟404 :疊加單元2022將解析単元2021生成的字幕畫面與經(jīng)解碼模塊201解碼獲得的視頻圖像數(shù)據(jù)進(jìn)行疊加;步驟405 ;編碼模塊30對疊加字幕信息后的視頻流數(shù)據(jù)進(jìn)行重新編碼,進(jìn)ー步該重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設(shè)備。以上僅是本實(shí)用新型的優(yōu)選實(shí)施方式,本實(shí)用新型的保護(hù)范圍并不僅局限于上述實(shí)施例,凡屬于本實(shí)用新型思路下的技術(shù)方案均屬于本實(shí)用新型的保護(hù)范圍。應(yīng)當(dāng)指出,對 于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本實(shí)用新型原理前提下的若干改進(jìn)和潤飾,應(yīng)視為本實(shí)用新型的保護(hù)范圍。
權(quán)利要求1.一種面向?qū)崟r(shí)首視頻流的子.置加系統(tǒng),其特征在于,包括 字幕內(nèi)容服務(wù)設(shè)備(10),用以對疊加的字幕信息腳本進(jìn)行制作; 字幕機(jī)(20),用以對實(shí)時(shí)音視頻流進(jìn)行字幕疊加;所述字幕內(nèi)容服務(wù)設(shè)備(10)與字幕機(jī)(20)相連并將制作好的字幕信息腳本發(fā)送給字幕機(jī)(20); 編碼模塊(30),與字幕機(jī)(20)相連,用以對疊加字幕信息后的視頻流數(shù)據(jù)進(jìn)行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設(shè)備。
2.根據(jù)權(quán)利要求I所述的面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),其特征在于,所述字幕機(jī)(20)包括 解碼模塊(201 ),用以對音視頻流進(jìn)行解碼并獲得每幀圖像數(shù)據(jù); 字幕疊加模塊(202),包括解析単元(2021)和疊加單元(2022),所述解析単元(2021)用以對字幕內(nèi)容服務(wù)設(shè)備(10)發(fā)送來的字幕信息腳本進(jìn)行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;所述疊加単元(2022)用以將解析単元(2021)生成的字幕畫面疊加到視頻層上,并輸出至編碼模塊(30)。
3.根據(jù)權(quán)利要求2所述的面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),其特征在于所述解碼模塊(201)中還包括一用以對前端傳送的音視頻流數(shù)據(jù)進(jìn)行解碼的解碼單元。
4.根據(jù)權(quán)利要求2所述的面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),其特征在于所述解析単元(2021)還包括一用以存儲字幕信息腳本的存儲器。
5.根據(jù)權(quán)利要求2所述的面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),其特征在于所述解碼豐旲塊(201)和子.置加ホ吳塊(202)為機(jī)頂盒王芯片。
專利摘要本實(shí)用新型公開了一種面向?qū)崟r(shí)音視頻流的字幕疊加系統(tǒng),包括字幕內(nèi)容服務(wù)設(shè)備,用以對疊加的字幕信息腳本進(jìn)行制作;字幕機(jī),用以對實(shí)時(shí)音視頻流進(jìn)行字幕疊加;所述字幕內(nèi)容服務(wù)設(shè)備與字幕機(jī)相連并將制作好的字幕信息腳本發(fā)送給字幕機(jī);編碼模塊,與字幕機(jī)相連,用以對疊加字幕信息后的視頻流數(shù)據(jù)進(jìn)行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設(shè)備。本實(shí)用新型具有結(jié)構(gòu)簡單緊湊、成本低廉、操作簡便,可以實(shí)現(xiàn)字幕的實(shí)時(shí)疊加,滿足了電視前端在任意時(shí)刻對音視頻流進(jìn)行字幕疊加的需求。
文檔編號H04N5/278GK202406198SQ201120558388
公開日2012年8月29日 申請日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者趙歡, 陳佐 申請人:湖南大學(xué)