專利名稱:視差數(shù)據(jù)傳輸和信號發(fā)送的制作方法
視差數(shù)據(jù)傳輸和信號發(fā)送相關(guān)文獻(xiàn)的交叉引用本申請要求以下申請的優(yōu)先權(quán)利益Mark Eyer等人的2010年11月22日提交的名為“Service Linkage to Caption Disparity Data Transport” 的美國臨時專利申請?zhí)?1/415,924 ;Mark Eyer等人的2010年11月19日提交的名為“Disparity DataSignaling and Transport for 3D Captioning,,的美國臨時專利申請?zhí)?61/415,457 ;Mark Eyer等人的2010年5月20日提交的名為“Disparity Data Transport”的美國臨時專利申請?zhí)?1/346,652 ;Mark Eyer等人的2010年3月12日提交的美國臨時專利申請?zhí)?61/313,612 ;Mark Eyer 等人的 2010 年 3 月 23 日提交的名為 “Extended CommandStream for CEA_708Captions”的美國專利申請?zhí)?61/316,733 ;Mark Eyer 等人的 2010 年8 月 31 日提交的名為“Efficient Transport of Frame-by-Frame Change in CaptioningDisparity Data”的美國臨時專利申請?zhí)?1/378,792 ;據(jù)此,通過引用將上述專利申請中的每一個的全部內(nèi)容并入在此。
版權(quán)通知本專利文件的部分公開包含受版權(quán)保護(hù)的主題的素材。當(dāng)本專利文件或本專利公開的拓制出現(xiàn)在專利商標(biāo)事務(wù)所的專利文檔或記錄中時,該版權(quán)擁有者對其沒有異議,但是在其它情況下該版權(quán)擁有者對其保留全部版權(quán)權(quán)利。
背景技術(shù):
閉合字幕用于電視節(jié)目播放中,為電視觀眾提供可視文本(通常是,語音和聲音的抄本)。閉合字幕(CO對聽力有障礙的人尤其有幫助。使用由各種技術(shù)標(biāo)準(zhǔn)定義的技術(shù)在電視節(jié)目播放中提供CC數(shù)據(jù),這些技術(shù)標(biāo)準(zhǔn)包括定義于技術(shù)標(biāo)準(zhǔn)CEA-608和CEA-708中的各種版本和實現(xiàn)方式。遺憾的是,隨著三維(3D)立體電視的出現(xiàn),傳統(tǒng)的技術(shù)不能夠提供用于觀眾在3DTV環(huán)境中觀看字幕的優(yōu)化機(jī)制,因為字幕相對于其它視頻對象通常出現(xiàn)在不便的Z軸位置(深度)中,而這些其它視頻對象可能會出現(xiàn)在字幕前方或者后方。
通過結(jié)合附圖參考以下詳細(xì)描述,可以更佳地理解闡述操作方法和組織的說明性的實施例及其目的和優(yōu)點(diǎn)。在附圖中圖I是說明根據(jù)本發(fā)明某些實施例的字幕視差數(shù)據(jù)的傳輸?shù)氖緢D。圖2是根據(jù)本發(fā)明某些實施例的示例編碼器。圖3是根據(jù)本發(fā)明某些實施例的示例解碼器。圖4是根據(jù)本發(fā)明某些實施例的示例電視接收機(jī)裝置。圖5是描述根據(jù)本發(fā)明某些實施例的處理器的各種操作的示例框圖。圖6是描述根據(jù)本發(fā)明某些實施例的表示被編寫的視差數(shù)據(jù)的示例曲線的曲線圖。
圖7是描述根據(jù)本發(fā)明某些實施例的視差曲線的分段線性近似的例子的曲線圖。圖8是根據(jù)本發(fā)明某些實施例的被編寫的視差數(shù)據(jù)的分段線性近似的例子。圖9是根據(jù)本發(fā)明某些實施例的方法的示例性實現(xiàn)方式的流程圖。圖10是根據(jù)本發(fā)明某些實施例的更加詳細(xì)的示例性實現(xiàn)方式的流程圖。
具體實施例本發(fā)明容許有許多不同形式的實施例,在附圖以及詳細(xì)的具體實施例中示出并描述了本發(fā)明,應(yīng)該理解,這些實施例的公開應(yīng)該被認(rèn)為是原理的示例,而并非意圖將本發(fā)明限制為在此示出和描述的具體實施例。在以下的描述中,貫穿附圖,類似的附圖標(biāo)記被用來描述相同的、類似的或?qū)?yīng)的部件。 如在本文中所使用的,術(shù)語“一個”或“一種”被定義為一個或多于一個。如在本文中所使用的,術(shù)語“多個”被定義為兩個或多于兩個。如在本文中所使用的,術(shù)語“另一個”被定義為至少第二個或更多。如在本文中所使用的,術(shù)語“包括”和/或“具有”被定義為含有(即,開放式語言)。如在本文中所使用的,術(shù)語“耦合”被定義為“連接”,雖然不一定是直接地,也不一定是機(jī)械地。如在本文中所使用的,術(shù)語“程序”或“計算機(jī)程序”或類似的術(shù)語被定義為是設(shè)計成在計算機(jī)系統(tǒng)上運(yùn)行的指令序列?!俺绦颉被颉坝嬎銠C(jī)程序”可以包括子程序、函數(shù)、程序模塊、腳本、過程、對象方法、對象實現(xiàn)、在可執(zhí)行應(yīng)用程序中、小應(yīng)用程序、小服務(wù)程序、源代碼、對象代碼、共享庫/動態(tài)加載庫、和/或設(shè)計成在計算機(jī)系統(tǒng)上運(yùn)行的其它指令序列。如在本文中所使用的,術(shù)語“節(jié)目”也可以被用于第二上下文中(上述定義是用于第一上下文中)。在第二上下文中,從“電視節(jié)目”的意義上來使用該術(shù)語。在該上下文中,該術(shù)語被用來表示音頻視頻內(nèi)容的任何相干序列,例如,那些可以被詮釋為單個電視節(jié)目并且在電子節(jié)目指南(EPG)中被報告為單個電視節(jié)目的音頻視頻內(nèi)容的相干序列,而無需考慮該內(nèi)容是電影、體育事件、多部分的電視節(jié)目系列的片斷、還是新聞廣播等。該術(shù)語還可以被詮釋為包含在電子節(jié)目指南中不被報告為節(jié)目的商業(yè)插播廣告和類似節(jié)目的內(nèi)容。貫穿全文,當(dāng)提及“一個實施例”、“某些實施例”、“實施例”、“實現(xiàn)方式”、“示例”或類似術(shù)語時,意味著結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,這類短語的出現(xiàn)或者貫穿本說明書在不同位置中的出現(xiàn)并不一定涉及相同的實施例。此外,在一個或者多個實施例中,這些特定特征、結(jié)構(gòu)或特性可以按照任何合適的方式進(jìn)行組合,而不受限制。如在本文中所使用的,術(shù)語“或”應(yīng)該被詮釋為是包含性的或者是指任何一個或任何組合。因此,“A、B或C,,是指“如下情況中的任何一種,即A;B;C;A和B ;A和C ;B和C ;A,B和C”。只有當(dāng)元件、功能、步驟或動作的組合在某種意義上固有地相互排斥時,才會出現(xiàn)上述定義的例外。根據(jù)本發(fā)明實施例的實現(xiàn)方式通常涉及用于在3D視頻上呈現(xiàn)閉合字幕的數(shù)據(jù)的傳輸和格式。當(dāng)在3D視頻節(jié)目的顯示中呈現(xiàn)閉合字幕時,如上所述,CC窗口及其相關(guān)聯(lián)的文本很可能被呈現(xiàn)在屏幕的平面中,除非采取措施來呈現(xiàn)該窗口和文本使得它們出現(xiàn)在不同的更加合適的感知深度處。3D內(nèi)容中的場景中的對象可以被表現(xiàn)為使得其對于觀眾看上去在顯示屏幕的平面的前方一定的距離。如果深度上定位在顯示的平面處的字幕窗口要被放置該對象的前方時,將出現(xiàn)“深度沖突”。在這種情況下,觀眾面臨相沖突的深度提示,即,弓丨起視覺疲勞和不舒適感的情況。如果字幕直接定位在屏幕平面上,該字幕在Z軸上可能會與場景中的內(nèi)容交叉,因此優(yōu)選地將字幕的介紹單獨(dú)地編寫成視頻演示的主題。為了完成這個,可以連同字幕一起發(fā)送額外的信息,來定義用于有效演示的包含字幕文本的窗口在Z軸上的感知放置(在屏幕平面的前方或后方的指定距離)并且避免與場景中的對象的干擾??梢韵氤鲈S多方法來提供這種信息,但是這些方法中很多存在缺點(diǎn)。3D立體電視涉及將分別用于左眼和右眼的單獨(dú)視圖遞送給顯示屏幕,外加允許觀眾的每一只眼睛只能看到針對該只眼睛的圖像的方法。當(dāng)針對給定對象左眼視圖和右眼視圖在該對象的放置的水平位置中不同時,實現(xiàn)了深度的錯覺。關(guān)于三維顯示系統(tǒng)的基本技術(shù)的概述在 Dr. Nick Holliman, Department of Computer Science, University ofDurham, Science Laboratories, South Road, Durham DH13LE, UK 的“3D Display Systems,,中(尤其,參見10-11頁以及附圖5)有所描述,該文獻(xiàn)的全部內(nèi)容通過引用并入在此。
如在本文中所使用的,術(shù)語“視差”可以更正式地指代“屏幕視差”(即,在屏幕上測量的)以區(qū)別于“視網(wǎng)膜視差”,并且被定義為是顯示在屏幕上的一對對準(zhǔn)的立體圖像中的右圖像和左圖像中的對應(yīng)點(diǎn)的物理X坐標(biāo)的差異。在本文中,出于簡潔的目的,將使用較不正式的術(shù)語“視差”。按照慣例,當(dāng)視差是負(fù)的時候(例如,當(dāng)左眼圖像在屏幕上被呈現(xiàn)在右眼圖像的右側(cè)時),對象被感知為在屏幕平面的前方。當(dāng)視差是正的時候(例如,當(dāng)左眼圖像在屏幕上被呈現(xiàn)在右眼圖像的左側(cè)時),對象被感知為在屏幕平面的后方。術(shù)語“視差數(shù)據(jù)”可以是任何指示用于呈現(xiàn)諸如字幕窗口及其相關(guān)聯(lián)的文本之類的給定圖形對象的視差值的數(shù)據(jù)。該術(shù)語也可以更廣泛地指反映當(dāng)前場景中對象的z軸位置的數(shù)據(jù)。可以將場景區(qū)繪制成具有不同區(qū)域的圖,其中,將每個區(qū)域中最靠近觀眾的對象的z軸位置在該圖中記錄為坐標(biāo)。這種圖可以被稱為“視差圖”或“深度圖”。視差圖可以逐幀地發(fā)生變化并且可以按照任何多種方式來表示該視差圖。注意,視差是對左眼和右眼圖像的水平偏移的測量,但是該偏移無需是像素的整數(shù),因為分?jǐn)?shù)像素偏移是完全可以接受的。在遞送3D視頻和CC內(nèi)容以供顯示的上下文中,視差通常被表示為伴隨視頻的寬度的一定百分比。因此,其是無量綱數(shù)。例如,信號發(fā)送方案可能會指定視差的一個單位等于視頻內(nèi)容的寬度的1/1920 (通常,該視頻內(nèi)容被呈現(xiàn)為匹配顯示屏幕的寬度)。但是,即使在1920的屏幕寬度下,1/1920的視差也不是實際視差中的最小增量。按照這種定義,7的視差指等于視頻內(nèi)容的寬度的7/1920的距離。再次,按照這種定義,在具有1920個像素的水平分辨率的屏幕的特殊情況下,計算出視差的一個全單位與一個顯示像素的寬度相同,但是這應(yīng)該被看作是特殊情況。如果顯示屏幕具有少于1920個的水平像素(例如,1600個水平像素),那么相應(yīng)地調(diào)整視差,并且7的視差等于(7/1920) (1600)=5. 83個像素。因此,視差可以被更加合適地看作是一對對準(zhǔn)的立體圖像中的左眼圖像和右眼圖像中的對應(yīng)點(diǎn)的沿X軸(水平)的在屏幕上的物理位置的差。值得注意的是,CC窗口通常是沿z軸定位的并且被感知為位于與顯示屏幕的平面平行的平面中的二維窗口。關(guān)于添加視差數(shù)據(jù)以使用CEA-708兼容語法針對特定CEA-708字幕窗口設(shè)置感知到的z軸或深度的方法,已經(jīng)向標(biāo)準(zhǔn)委員會提出了建議。一種方法是通過使用CEA-708中稱為ETXl法的命令擴(kuò)展法來提供針對任何特定CEA-708字幕窗口的視差數(shù)據(jù)。這種建議具有弊端,但是也可以設(shè)想出一些其它可能性,以用于視差數(shù)據(jù)的傳輸。在一個示例中,可以將字幕視差數(shù)據(jù)放置在單獨(dú)圖片uSer_data()包中,從而出于緩沖和定時的考慮而分離該字幕視差數(shù)據(jù),如果該字幕視差數(shù)據(jù)攜帶在字幕流內(nèi)部,則可能不得不面對這種緩沖和定時的考慮。這在圖I所示的示意圖中有所描述。圖I表示DTV比特流100,其作為攜帶用于傳輸不同元素的數(shù)據(jù)的“數(shù)據(jù)管道”,這些不同元素被用來將DTV信息通過物理信道傳送給接收數(shù)字電視接收機(jī)裝置(即,電視機(jī),機(jī)頂盒,等等)。在根據(jù)本發(fā)明的實施例的一個實現(xiàn)方式中,可以將字幕視差數(shù)據(jù)定義為另一種類型的use_data(),并且在該圖示中,其被示出為字幕視差數(shù)據(jù)110。這使得視差數(shù)據(jù)實質(zhì)上在DTVCC傳輸信道120的外部被傳輸,并且使得可以使用未分配給DTVCC字幕服務(wù)本身的額外帶寬?,F(xiàn)在,參考圖2,描述了諸如廣播公司之類的服務(wù)提供商的基本示意圖。一般來講,·單個服務(wù)提供商可以在一個或多個傳輸流上提供多個節(jié)目。音頻、視頻和字幕數(shù)據(jù)被提供給編碼器,該編碼器將這些數(shù)據(jù)編碼成適合于分發(fā)的包,包括如上所述的字幕數(shù)據(jù)包。如所示出的,編碼器202和204對節(jié)目A和節(jié)目B進(jìn)行編碼,編碼后的節(jié)目A和節(jié)目B然后被提供給傳輸流多路復(fù)用器210,該傳輸流多路復(fù)用器210提供能夠經(jīng)由諸如陸地、有線或衛(wèi)星廣播之類的物理信道介質(zhì)被分發(fā)的輸出。在本討論中,術(shù)語“節(jié)目”的使用與MPEG-2系統(tǒng)標(biāo)準(zhǔn)(IS0/IEC 13818-1)的使用一致。MPEG-2節(jié)目具有相關(guān)聯(lián)的基本流組件,例如一個視頻基本流和一個或多個音頻基本流。根據(jù)上述的實現(xiàn)方式,提供字幕視差數(shù)據(jù)110作為視頻基本流中的uSer_data(),但是這不應(yīng)該被看作是限制性的,因為此后將描述或參考在其它傳輸機(jī)制中攜帶字幕視差數(shù)據(jù)的其它實現(xiàn)方式。然而,應(yīng)該注意,可以使用目前的傳輸機(jī)制按照任何合適的方式編碼字幕視差數(shù)據(jù),而不受限制。類似地,在不受限制的情況下,可以使用任何合適的傳輸機(jī)制來傳輸將如隨后要描述的那樣被編碼的視差數(shù)據(jù)。如在圖3中所描述的,在電視接收機(jī)裝置(例如,電視機(jī)或機(jī)頂盒)處接收來自物理信道的被編碼的數(shù)據(jù)。傳輸流在傳輸流多路分配器304處被多路分配,以產(chǎn)生包括音頻、視頻(具有嵌入的字幕數(shù)據(jù))以及其它未示出的數(shù)據(jù)的一個或多個的基本流。視頻解析器308從視頻基本流提取壓縮的視頻數(shù)據(jù),并將提取的視頻數(shù)據(jù)發(fā)送給視頻解碼器314以供解碼。視頻解析器308從視頻基本流中提取user_data()塊,并將這些user_data()塊發(fā)送至用戶數(shù)據(jù)解析器310。傳輸流多路分配器304選擇音頻包并且將音頻包遞送給音頻解碼器312,以產(chǎn)生音頻數(shù)據(jù)作為輸出。當(dāng)使用上述傳輸機(jī)制時,用戶數(shù)據(jù)解析器310檢查視頻流的uSer_data()部分,并且分離出DTVCC傳輸信道和字幕視差數(shù)據(jù)。當(dāng)其它傳輸被用于DTVCC和視差數(shù)據(jù)時,使用匹配于傳輸?shù)暮线m的解析機(jī)制來解析出CC數(shù)據(jù)和視差。在字幕處理器316處處理閉合字幕相關(guān)數(shù)據(jù)。字幕處理器使用視差數(shù)據(jù)來呈現(xiàn)字幕文本,該視差數(shù)據(jù)定義左眼圖像和右眼圖像的X軸分離,以產(chǎn)生字幕文本及其相關(guān)聯(lián)的窗口的感知到的z軸位置。然后,在合成器320處將所得到的字幕圖像與視頻數(shù)據(jù)進(jìn)行合成,從而產(chǎn)生3D視頻,在該3D視頻中,字幕在x,y,和z平面中按照字幕數(shù)據(jù)包中的數(shù)據(jù)放置。這種數(shù)據(jù)可以將字幕按照靜態(tài)的方式放置(其中,在給定字幕段的顯示期間,z軸的位置保持恒定),或者可以根據(jù)字幕數(shù)據(jù)的編寫動態(tài)地放置字幕(其中,在顯示期間,z軸位置隨著時間移動)。然后,連同節(jié)目視頻一起可以將字幕數(shù)據(jù)呈現(xiàn)在視頻顯示器(未示出)上。
在圖4中更加詳細(xì)地描述了接收機(jī)裝置,其中,在接收機(jī)400的調(diào)諧器/解調(diào)器402處經(jīng)由諸如陸地廣播、有線或衛(wèi)星之類的任何合適的源來接收內(nèi)容。在多路分配器406處,將包括來 自調(diào)諧器/解調(diào)器402的字幕數(shù)據(jù)的傳輸流多路分配成音頻流和視頻流。音頻在音頻解碼器410處被解碼,而視頻在視頻解碼器414處被解碼。也可以經(jīng)由未壓縮A/V接口 418來接收未壓縮A/V數(shù)據(jù),其中,未壓縮A/V接口 418可以被選擇性地使用。也可以通過因特網(wǎng)422經(jīng)由網(wǎng)絡(luò)接口 426來接收A/V內(nèi)容,用于IP電視內(nèi)容解碼。另外,可以為非實時(NRT)存儲的內(nèi)容提供存儲器430。可以按照類似于其它內(nèi)容源的方式在406處通過多路分配來播放NRT內(nèi)容。接收機(jī)通常在諸如CPU438之類的處理器的控制下工作,處理器經(jīng)由一個或多個總線(例如,450)互連至工作存儲器440和節(jié)目存儲器442以及圖像子系統(tǒng)444。CPU438通過任何傳輸機(jī)制(例如,經(jīng)由如上所述的字幕數(shù)據(jù)包或者下面將參考的其它機(jī)制)接收來自多路分配器406的閉合字幕以及視差數(shù)據(jù),并且通過解析這些數(shù)據(jù)來確定左眼位置和右眼位置的哪個水平分離被用于創(chuàng)建z軸位置以及X和y位置的感知,從而定位字幕數(shù)據(jù)。這些信息被傳遞給圖形子系統(tǒng)444,并且圖像在合成器460處被合成以產(chǎn)生適合于在視頻顯示器上顯示的輸出。因此,一種用于將閉合字幕數(shù)據(jù)傳遞至電視接收機(jī)裝置的方法涉及在數(shù)字電視字幕信道數(shù)據(jù)包流中封裝閉合字幕文本;在數(shù)字電視用戶數(shù)據(jù)包流中傳輸和遞送視差數(shù)據(jù),其中,該視差數(shù)據(jù)針對與閉合字幕一起顯示的視頻的每一個幀定義閉合字幕文本的z軸位置;將數(shù)字電視字幕信道數(shù)據(jù)包流發(fā)送至電視接收機(jī)裝置,作為攜帶與閉合字幕文本相關(guān)聯(lián)的音頻/視頻數(shù)據(jù)的傳輸流的一部分;以及,在攜帶與閉合字幕文本相關(guān)聯(lián)的音頻/視頻數(shù)據(jù)的傳輸流的外部,將包含視差數(shù)據(jù)的數(shù)字電視用戶數(shù)據(jù)包流發(fā)送至電視接收機(jī)裝置。并且,一種用于在電視接收機(jī)裝置中處理閉合字幕數(shù)據(jù)的方法涉及接收作為攜帶與閉合字幕文本相關(guān)聯(lián)的音頻/視頻數(shù)據(jù)的傳輸流的一部分的至電視接收機(jī)裝置的數(shù)字電視字幕信道數(shù)據(jù)包流;接收在攜帶與閉合字幕文本相關(guān)聯(lián)的音頻/視頻數(shù)據(jù)的傳輸流的外部的至電視接收機(jī)裝置的包含視差數(shù)據(jù)的數(shù)字電視用戶數(shù)據(jù)包流;以及,將閉合字幕文本放置在閉合字幕窗口中,用于在三維視頻顯示器上顯示,其中,閉合字幕窗口沿z軸定位在視差數(shù)據(jù)定義的位置中。圖5描述了用來處理按照在此描述的方式提供的字幕數(shù)據(jù)的程序模塊的一種實現(xiàn)方式。在該示例實現(xiàn)方式中,在來自程序存儲器442的程序控制下工作并且使用工作存儲器440的CPU438 (經(jīng)由任何合適的傳輸機(jī)制)接收來自多路分配器406的多路分配的傳輸流,并且解析器模塊504在508處產(chǎn)生字幕數(shù)據(jù)(也就是,字幕文本和相關(guān)聯(lián)的命令以創(chuàng)建和定位字幕窗口),并將視差數(shù)據(jù)發(fā)送至視差數(shù)據(jù)處理模塊512,在視差數(shù)據(jù)處理模塊512處,視差數(shù)據(jù)被提取供字幕呈現(xiàn)器514使用,以用于處理。其它數(shù)據(jù)可以由解析器504解析至其它數(shù)據(jù)處理模塊,如由506所示。然后,在合成器460處將處理后的字幕數(shù)據(jù)與來自多路分配器406的視頻數(shù)據(jù)合成,從而產(chǎn)生用于顯示的數(shù)據(jù),其中,CC數(shù)據(jù)的位置按照在視差數(shù)據(jù)中規(guī)定的那樣定位。在根據(jù)本發(fā)明實施例的某些實現(xiàn)方式中,用于定義z軸的數(shù)據(jù)量可以被最小化,并且可以與DTV傳輸流的視頻部分和字幕文本一起被傳輸或如上所述在單獨(dú)的user_data ()數(shù)據(jù)包中被傳輸。當(dāng)在DTV傳輸信道外部遞送視差數(shù)據(jù)時,字幕視差數(shù)據(jù)不會影響DTVCC緩沖模型或數(shù)據(jù)率,并且可以按照與字幕數(shù)據(jù)分離的方式被多路復(fù)用成視頻。注意還存在定義于標(biāo)準(zhǔn)中的其它類型的用戶數(shù)據(jù),諸如有效格式描述(AFD)和條碼數(shù)據(jù)(Bar Data)。根據(jù)本發(fā)明的某些實施例,字幕視差數(shù)據(jù)可以作為一種類型的圖片用戶數(shù)據(jù)被傳輸。然而,這不應(yīng)該被看作是限制性的,因為上述傳輸機(jī)制只是用于傳輸按照后面將描述的方式編碼的視差數(shù)據(jù)的幾種機(jī)制中的一種。例如,可以使用在如下文獻(xiàn)中描述的技術(shù)來傳輸視差數(shù)據(jù),即,Eyer 的與本文同時提交的名為 “Service Linkage to Caption Disparity Transport” 的美國專利申請系列號13/022,828,或者Eyer的與本文同時提交的名為“Extended CommandStream for Closed Caption Disparity”的美國專利申請系列號13/022,810,通過引用將這兩個文獻(xiàn)均并入在此,并且可以在沒有限制的條件下使用。根據(jù)一些優(yōu)選的實施例,可以顯著地減少用于傳輸視差數(shù)據(jù)的數(shù)據(jù)量,從而最小化對用于字幕服務(wù)的可用帶寬的影響,而不管傳輸機(jī)制如何,如隨后將描述的。 為了如同在技術(shù)標(biāo)準(zhǔn)規(guī)范中描繪定義那樣地來定義數(shù)據(jù)結(jié)構(gòu),如下所述,提供了適合于ATSC A/72第I部分,AVC Video (針對ATSC)和A/53的架構(gòu)的示例數(shù)據(jù)結(jié)構(gòu)。這里,從A/72第I部分和A/53第4部分復(fù)制文本。在以下部分中描述針對本發(fā)明的該示例實現(xiàn)方式被修改成適合視差數(shù)據(jù)的呈現(xiàn)的規(guī)范的部分 表I符合A/72第I部分中的表6. 4 (2008); 表2符合A/72第I部分中的表6. 5 (2008); 表3符合A/52第4部分中的表6. 8 (2009); 表4符合A/52第4部分中的表6. 9(2009),這里添加了新的代碼點(diǎn)(user_data_type_code_value 0x07); 表5至表7是原始的; 表5之后并且與表5相關(guān)的所有定義(service_number, extended_service_number,等)都是原始的; 表6之后并且與表6相關(guān)的所有定義(disparity(i), offset_precision,等)都是原始的;記住這些改變,可以形成針對字幕數(shù)據(jù)的遞送的規(guī)范,其類似于下面作為樣品標(biāo)準(zhǔn)給出的規(guī)范,并且被用作根據(jù)以上論述的用于標(biāo)準(zhǔn)化字幕遞送的基礎(chǔ)示例I 一樣品標(biāo)準(zhǔn)文本表ISEI 語法
語法__位數(shù)_格式
Userdata regustered itu t_t35(){
itu__t__t35__country__cocle 8 bslbf itu_t_t35_provider_code 16 bslbf user identifier_[32_ bslbf_|
權(quán)利要求
1.一種用于解碼閉合字幕視差數(shù)據(jù)的方法,包括 在電視接收機(jī)裝置處,接收被編碼為一個或多個幀間隔/斜率變化對的序列的閉合字幕視差數(shù)據(jù),其中,表示應(yīng)用表示視差的每個線性函數(shù)的幀的指定數(shù)量的幀間隔與指示相對于前一段的斜率的斜率變化的值成對; 其中,視差值的序列中的第一段將斜率O假設(shè)為用于隨后的斜率變化的基準(zhǔn); 接收字幕數(shù)據(jù)包的序列,其中,字幕數(shù)據(jù)包的序列指定包含閉合字幕文本的閉合字幕顯示窗口,其中,在數(shù)字電視字幕信道包流中封裝閉合字幕數(shù)據(jù); 其中,在閉合字幕顯示的左眼視圖和右眼視圖的3D呈現(xiàn)中在每一幀中使用視差值,從而確定確立窗口的感知到的z軸位置的水平偏移; 接收確立針對閉合字幕顯示的固定視差的備用固定視差值,其中備用固定視差值連同編碼的三維閉合字幕視差數(shù)據(jù)一起被封裝以便作為備用的感知到的z軸位置被使用; 低通濾波編碼的三維視差數(shù)據(jù)從而使視差值的過渡平滑化;以及處理字幕文本和視差數(shù)據(jù)以產(chǎn)生適合于在由視差數(shù)據(jù)限定的感知到的Z軸位置處定義三維圖像在字幕文本的顯示上的呈現(xiàn)的輸出。
2.一種用于解碼閉合字幕視差數(shù)據(jù)的方法,包括 在電視接收機(jī)裝置處,接收被編碼為一個或多個幀間隔/斜率變化對的序列的閉合字幕視差數(shù)據(jù),其中,表示要在其上應(yīng)用表示視差的每個線性函數(shù)的幀的指定數(shù)量的幀間隔與指示相對于前一段的斜率的斜率變化的值成對; 其中,視差值的序列中的第一段將預(yù)定斜率假設(shè)為用于隨后的斜率變化的基準(zhǔn); 接收字幕數(shù)據(jù)包的序列,其中,字幕數(shù)據(jù)包的序列指定包含閉合字幕文本的閉合字幕顯示窗口 ;以及 其中,在每一幀中使用視差值,以確定閉合字幕顯示的左眼視圖和右眼視圖的水平偏移,其確立閉合字幕顯示窗口的感知到的Z軸位置。
3.根據(jù)權(quán)利要求2的方法,其中,預(yù)定斜率是O。
4.根據(jù)權(quán)利要求2的方法,其中,斜率變化作為表示在2N個幀上視差的變化的值被給定,其中N是整數(shù)。
5.根據(jù)權(quán)利要求4的方法,其中,N= 5。
6.根據(jù)權(quán)利要求2的方法,其中,斜率變化作為范圍在-16至+15之間的值被信號發(fā)送,該值指示要施加在指定的幀間隔上的斜率變化的量。
7.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括接收確立針對閉合字幕顯示的固定的感知到的z軸位置的備用固定視差值,其中,備用固定視差值連同編碼的三維閉合字幕視差數(shù)據(jù)一起被封裝,以作為備用的z軸位置被使用。
8.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括低通濾波編碼的三維視差數(shù)據(jù)以使視差值的過渡平滑化。
9.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括處理字幕文本和視差數(shù)據(jù)以產(chǎn)生適合于在由視差數(shù)據(jù)定義的感知到的z軸位置處定義三維圖像在字幕文本的顯示上的呈現(xiàn)的輸出。
10.一種用于存儲指令的計算機(jī)可讀電子存儲設(shè)備,其中當(dāng)在一個或多個編程的處理器上執(zhí)行這些指令時,這些指令執(zhí)行根據(jù)權(quán)利要求2的處理。
11.一種處理針對閉合字幕的視差數(shù)據(jù)的電視接收機(jī)裝置,包括解碼器,接收被編碼為一個或多個幀間隔/斜率變化對的序列的閉合字幕視差數(shù)據(jù),其中,表示要在其上應(yīng)用表示視差的每個線性函數(shù)的幀的指定數(shù)量的幀間隔與指示相對于前一段的斜率的斜率變化的值成對; 其中,視差值的序列中的第一段將預(yù)定斜率假設(shè)為用于隨后的斜率變化的基準(zhǔn); 解析器,解析來自一個或多個信號的視差數(shù)據(jù)和閉合字幕文本;以及合成器,接收視差數(shù)據(jù)和閉合字幕文本,并且生成包括包含閉合字幕文本的閉合字幕顯示窗口的視頻幀信號的序列,其中閉合字幕顯示窗口在由視差值定義的每個幀中具有感知到的Z軸位置。
12.根據(jù)權(quán)利要求11的裝置,其中,預(yù)定斜率是O。
13.根據(jù)權(quán)利要求11的裝置,其中,幀間隔作為2N個幀的預(yù)定值被給定,其中N是整數(shù)。
14.根據(jù)權(quán)利要求11的裝置,其中,斜率變化作為表示在32個幀上視差的變化的值被給定。
15.根據(jù)權(quán)利要求14的裝置,其中,斜率變化作為范圍在-16至+15之間的值被信號發(fā)送,該值指示要施加在指定的幀間隔上的斜率變化的量。
16.根據(jù)權(quán)利要求11的裝置,其中,斜率變化作為范圍在-16至+15之間的值被信號發(fā)送,該值指示要施加在指定的幀間隔上的斜率變化的量。
17.根據(jù)權(quán)利要求11的裝置,其中,解碼器進(jìn)一步地接收確立針對閉合字幕顯示的一部分的固定的z軸位置的備用固定視差值,其中,備用固定視差值連同編碼的閉合字幕視差數(shù)據(jù)一起被封裝,以作為備用的感知到的z軸位置被使用。
18.根據(jù)權(quán)利要求11的裝置,進(jìn)一步地包括處理編碼的三維視差數(shù)據(jù)以使視差值的過渡平滑化的低通濾波器。
19.根據(jù)權(quán)利要求11的裝置,其中,合成器進(jìn)一步地處理字幕文本和視差數(shù)據(jù)以產(chǎn)生適合于在由視差數(shù)據(jù)定義的感知到的z軸位置處定義三維圖像在字幕文本的顯示上的呈現(xiàn)的輸出。
20.一種用于解碼閉合字幕視差數(shù)據(jù)的方法,包括 在電視接收機(jī)裝置處,接收編碼的動態(tài)閉合字幕視差數(shù)據(jù),編碼的動態(tài)閉合字幕視差數(shù)據(jù)確定針對視頻幀的序列逐幀地變化的閉合字幕顯示窗口的感知到的z軸位置;以及在電視接收機(jī)裝置處,接收編碼的備用閉合字幕視差值,編碼的備用閉合字幕視差值設(shè)置針對視頻幀的序列靜止的閉合字幕顯示窗口的感知到的z軸位置;接收字幕數(shù)據(jù)包的序列,其中,字幕數(shù)據(jù)包的序列指定包含閉合字幕文本的閉合字幕顯示窗口 ;以及 其中,針對視頻幀的序列在每一幀中使用編碼的動態(tài)閉合字幕視差數(shù)據(jù)和備用視差值中的一種,以確定確立閉合字幕顯示窗口的感知到的Z軸位置的閉合字幕顯示的左眼視圖和右眼視圖的水平偏移。
21.根據(jù)權(quán)利要求20的方法,其中,編碼的動態(tài)閉合字幕視差數(shù)據(jù)被編碼為一個或多個幀間隔/斜率變化對的序列,其中,表示要在其上應(yīng)用表示視差的每個線性函數(shù)的幀的指定數(shù)量的幀間隔與指示相對于前一段的斜率的斜率變化的值成對;以及 其中,視差值的序列中的第一段將預(yù)定斜率假設(shè)為用于隨后的斜率變化的基準(zhǔn);
22.根據(jù)權(quán)利要求21的方法,其中,預(yù)定斜率是O。
23.根據(jù)權(quán)利要求20的方法,進(jìn)一步地包括低通濾波編碼的三維視差數(shù)據(jù)以使視差值的過渡平滑化。
24.根據(jù)權(quán)利要求20的方法,進(jìn)一步地包括處理字幕文本和視差數(shù)據(jù)以產(chǎn)生適合于在由視差數(shù)據(jù)定義的感知到的z軸位置處定義三維圖像在字幕文本的顯示上的呈現(xiàn)的輸出。
25.一種用于存儲指令的計算機(jī)可讀電子存儲設(shè)備,其中當(dāng)在一個或多個編程的處理器上執(zhí)行這些指令時,這些指令執(zhí)行根據(jù)權(quán)利要求20的處理。
全文摘要
一種用于解碼閉合字幕視差數(shù)據(jù)的方法,涉及TV接收機(jī)接收針對3D顯示的被編碼為一個或多個幀間隔/斜率變化對的序列的閉合字幕視差數(shù)據(jù),其中,表示其上要應(yīng)用表示視差的每個線性函數(shù)的幀的指定數(shù)量的幀間隔與指示相對于前一段的斜率的斜率變化的值成對。視差數(shù)據(jù)的序列中的第一段將預(yù)定斜率假設(shè)為用于隨后的斜率變化的基準(zhǔn)。字幕數(shù)據(jù)包的序列指定包含閉合字幕文本的閉合字幕顯示窗口。在每一幀中使用視差數(shù)據(jù),以確定閉合字幕顯示的左眼視圖和右眼視圖的水平偏移,該水平偏移確立閉合字幕顯示窗口的感知到的z軸位置。該摘要不應(yīng)該被認(rèn)為是限制性的,因為可以從在該摘要中描述的特征推導(dǎo)出其它實施例。
文檔編號H04N13/00GK102783159SQ201180012449
公開日2012年11月14日 申請日期2011年2月25日 優(yōu)先權(quán)日2010年3月12日
發(fā)明者M·K·厄伊爾, 塚越郁夫 申請人:索尼公司