專利名稱:編碼器系統(tǒng)級(jí)緩存器的管理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻和視頻信號(hào)的編碼,并特別涉及產(chǎn)生音頻和視頻素材段,這些素材段在運(yùn)作中能被結(jié)合在一起。
典型的情況是,當(dāng)要求兩個(gè)視頻片段一個(gè)接一個(gè)地播放時(shí),在解碼第二片段之前,解碼器需要復(fù)位到起始狀態(tài)。在此復(fù)位期間,用戶將會(huì)看到凍結(jié)在屏幕上的第一片段的最后幀,并伴以伴音的消失。這種不連續(xù)性能闖入用戶。
被要求的是一種無(wú)縫隙的連接,這里一個(gè)片段的結(jié)束與下一片段的開始之間的轉(zhuǎn)換,對(duì)解碼器來(lái)說(shuō)不明顯,從用戶的觀點(diǎn)來(lái)看意味著沒(méi)有觀賞幀可查覺(jué)的速率改變,并且聲音的持續(xù)性也不受阻撓。關(guān)于無(wú)縫隙視頻的應(yīng)用是數(shù)量巨大的。出自CD-i景象的例子是對(duì)于計(jì)算機(jī)生成的字符采用真實(shí)照片作為背景;使用此技術(shù)的例子是在MPEG編碼視頻序列前運(yùn)動(dòng)的動(dòng)畫字符。另外就是一系列資格用戶例如與交互式電影交互作用,通過(guò)選擇可得到的幾種變更方案觀眾有可能去影響故事情節(jié)發(fā)展。貫穿交互式電影沿著用戶選取的路徑,分岔處應(yīng)該看來(lái)無(wú)縫隙,否則用戶將失去通??措娪暗膽岩蓱夷罡惺堋?br>
一種不要求重新初始化解碼器的視頻段編碼方法,在申請(qǐng)?zhí)?424436.5(PHB 33950)題為“視頻編輯緩沖器管理(Video EditingBuffer Management)”,我們1994年12月2日申請(qǐng)的英國(guó)專利中做了說(shuō)明。該說(shuō)明使用解碼緩存器目標(biāo)準(zhǔn)線(targeting of decoder bufferlevels)以達(dá)到連續(xù)占用解碼緩存器,使每個(gè)視頻片段的尾和要與之相繼的片段可預(yù)測(cè)的每個(gè)段起始,在解碼緩存器中直接相連,而沒(méi)有上溢和下溢的風(fēng)險(xiǎn)。
上述方法在適合視頻幀序列的同時(shí)不考慮與它通常相伴隨的其它信息-例如音頻聲跡。此視頻經(jīng)常與其它信息交織成單一流,稱作系統(tǒng)流,它構(gòu)成將在解碼器/顯示設(shè)備上出現(xiàn)的數(shù)據(jù)。(例如從CD盤讀出或通過(guò)有線網(wǎng)絡(luò)遞送的數(shù)據(jù)流)。
因此,本發(fā)明的目的是提供系統(tǒng)流段的無(wú)縫隙連接,而且避免解碼緩存器的上溢和下溢。
按照本發(fā)明提供了一種編碼數(shù)字視頻信號(hào)的方法,以這種形式即每段包含兩個(gè)或更多的視頻幀,并且在一解碼設(shè)備中,該設(shè)備具有一編碼級(jí),一編碼緩存器,以及將編碼視頻信號(hào)至少和另外一種信號(hào)交織以形成系統(tǒng)流的裝置。對(duì)于每個(gè)段,此方法包括下列步驟根據(jù)預(yù)定的編碼方案相繼地編碼段中的各個(gè)幀;讀編碼幀送入緩存器;以基本上恒定的位率從緩存器讀出編碼的段;將緩存器輸出信號(hào)與一個(gè)或更多時(shí)間標(biāo)記交織在一起得到系統(tǒng)流;其特征在于編碼緩存器的占用被控制以具有第一預(yù)定準(zhǔn)線(level),前一段的最后幀此時(shí)刻正被讀入此位置,此占用準(zhǔn)線與解碼器緩存器的占用準(zhǔn)線有關(guān);以恒定位率填充解碼器緩存器到所說(shuō)解碼器緩存器占用準(zhǔn)線所需時(shí)間被得到;并且時(shí)間標(biāo)記被插到下面段的系統(tǒng)流中,指出在加載所說(shuō)下面段開始以后,這個(gè)段的第一個(gè)圖象此時(shí)將從解碼器緩沖器被讀出。
正如下面將要論證的,這引出的瞬間,此時(shí)解碼器應(yīng)當(dāng)開始解碼接收的段,使得在系統(tǒng)流的級(jí)別上平滑連接這些段,而且,由于解碼器緩存器的目標(biāo)準(zhǔn)線是根據(jù)編碼器緩存器內(nèi)容所計(jì)算的準(zhǔn)線,必須盡可能地填滿解碼器緩存器以后再開始解碼的傳統(tǒng)技術(shù)得以免除。
更可存地,一公共解碼器緩存器準(zhǔn)線(此后,時(shí)間標(biāo)記定位)被提供,依靠設(shè)定用于編碼第一段的各圖象的目標(biāo)位數(shù)可達(dá)到目的,而且,在段的尾部編碼以便到達(dá)所說(shuō)的編碼器緩存器占用準(zhǔn)線期間,可控制地改變每個(gè)圖象的位分配。
正如將要說(shuō)明的,為了確定解碼器緩存器準(zhǔn)線,最大編碼器緩存器占用準(zhǔn)線最好以解碼器緩存器占用準(zhǔn)線來(lái)指定,該解碼器緩存器占用準(zhǔn)線由編碼器最大準(zhǔn)線和第一段最后圖象已被讀入編碼器緩存器以后,一幀周期編碼器緩存器占用準(zhǔn)線之間的差來(lái)確定。
本發(fā)明還提供了一數(shù)字視頻信號(hào)編碼設(shè)備,它被配置用于編碼圖象段,這里每個(gè)段包含兩個(gè)或更多的圖象。該設(shè)備包括一編碼級(jí)安排來(lái)接收段的連續(xù)圖象,并按照預(yù)定的編碼方案將它們編碼;一緩存器連結(jié)用以接收來(lái)自編碼級(jí)的連續(xù)編碼圖象,并安排以基本恒定的位率輸出編碼的段;還有一多路轉(zhuǎn)換器連結(jié)用以接收緩存器的輸出和至少一種其它的信號(hào),并安排將它交織成為系統(tǒng)流;其特征在于編碼級(jí)以可控制的可變位數(shù)操作去編碼段中的圖象。此設(shè)備還包括目標(biāo)設(shè)定裝置,用來(lái)控制被編碼器使用的位數(shù),例如用于在第一段的最后圖象被讀進(jìn)緩存器的瞬間給出預(yù)定的編碼器緩存器占用。還有時(shí)間標(biāo)記裝置,可根據(jù)所說(shuō)的預(yù)定占用運(yùn)行,得出一定時(shí)值,并且將時(shí)間標(biāo)記插入到下面段的系統(tǒng)流中,指示下面段的第一個(gè)圖象緊接一個(gè)延時(shí)(delay)將從解碼器緩存器中被讀出,該延時(shí)從裝載所說(shuō)下面段到解碼器緩存器的開始點(diǎn)算起,延遲時(shí)間由上述定時(shí)值給定。
目標(biāo)設(shè)定裝置可適合于對(duì)如上所述段的最后K個(gè)圖象控制每個(gè)圖象的位數(shù),而編碼級(jí)可適合于提供零值的位填充,這里要求少于指定的位數(shù)去編碼圖象。
此外按照本發(fā)明還有一種由上面所述方法編碼的數(shù)字視頻圖象信號(hào),與光盤一起被提供。該光盤上以獨(dú)立可尋址段的形式包含了這樣的信號(hào)。
本發(fā)明其它的特點(diǎn)和優(yōu)點(diǎn),閱讀了下面的說(shuō)明與所附權(quán)利要求一起將會(huì)清楚,所公開的具體內(nèi)容以做參考。
僅作為示例并參照所附附圖,現(xiàn)將對(duì)優(yōu)選實(shí)施方案作出說(shuō)明,其中
圖1表示在連接兩個(gè)視頻片段時(shí)編碼和解碼視頻緩存器的內(nèi)容;圖2表示解碼器視頻和系統(tǒng)緩存器占用之間的關(guān)系;圖3到5表示在傳統(tǒng)的系統(tǒng)中,分別對(duì)應(yīng)目標(biāo)片段的開始和結(jié)尾解碼器視頻和系統(tǒng)緩存器的內(nèi)容;圖6到7表示分別對(duì)應(yīng)目標(biāo)音頻片段的開始和結(jié)尾音頻緩存器的內(nèi)容;以及圖8到9分別為編碼器和解碼器設(shè)備的原理圖示。
下面的說(shuō)明關(guān)系到編碼器和解碼器按照MPEG標(biāo)準(zhǔn)的操作,以及后面將要用到的這些標(biāo)準(zhǔn)的習(xí)慣名稱。然而有實(shí)際經(jīng)驗(yàn)的人都會(huì)認(rèn)可,本發(fā)明的使用并不限定于此MPEG標(biāo)準(zhǔn)。
任何編碼標(biāo)準(zhǔn)的開發(fā)必須帶有編碼器和解碼器如何相互接口的模型。當(dāng)編碼器運(yùn)行時(shí)它必須設(shè)想在解碼器中會(huì)碰到的情況,決不能使解碼器進(jìn)入非法狀態(tài)。同樣地,解碼器也必須支持與編碼器所使用的相同的模型,以便使本身維持在合法狀態(tài)并產(chǎn)生編碼器所希望的輸出。MPEG也無(wú)例外遵從這個(gè)規(guī)則。
起初,考慮產(chǎn)生能被無(wú)縫隙連結(jié)的純視頻數(shù)據(jù)段將是有用的,一優(yōu)選方法在上面提到的編號(hào)為9424436.5(PHB 33950)我們的英國(guó)申請(qǐng)中作了說(shuō)明,并參考圖1在下面對(duì)其進(jìn)行概述,圖1給出緩存器占用B對(duì)時(shí)間t的圖形,顯示了作為一個(gè)視頻幀(圖象)序列A的結(jié)尾和另一個(gè)B的開始,編碼器和解碼器緩存器的狀態(tài)情況。LA指示序列A的最后圖象;FB指示序列B的第一圖象。從序列A到序列B傳遞數(shù)據(jù)的改變由粗的緩存器占用線的變化來(lái)表示,而來(lái)自序列A的圖象由點(diǎn)劃線表示。在某時(shí)間tx,序列A的全部數(shù)據(jù)被傳遞完,而且VBV(視頻緩存器校驗(yàn)-MPEG解碼器模型)有Bx位的占用。從此時(shí)間起傳遞到緩存器的全部數(shù)據(jù)都是序列B的。然而,將會(huì)注意到,序列A尾部的某些圖象仍然還在緩存器中,當(dāng)緩存器有B1位的占用時(shí),在時(shí)間t1之前這些圖象被全部清除。
編碼器當(dāng)它試圖達(dá)到在VBV緩存器中某種程度占用時(shí)經(jīng)歷一稱做達(dá)標(biāo)(targeting)的過(guò)程。在達(dá)標(biāo)期間編碼器假定當(dāng)已編碼的第一圖象放入緩存器時(shí),VBV緩存器具有某個(gè)目標(biāo)占用,這就給了第一圖象尺寸的上限。在編碼進(jìn)行的結(jié)尾編碼器瞄準(zhǔn)這樣一個(gè)時(shí)間點(diǎn)上的VBV的占用,此時(shí)下一序列的第一圖象正好要從緩存器中被清除,即圖1中的Bt點(diǎn)。依靠改變最后圖象或后面幾幅圖象的尺寸,在編碼時(shí)達(dá)到此狀態(tài)。
在示于圖1的例子中編碼器瞄準(zhǔn)狀態(tài)Bt,此狀態(tài)表示在新序列第一圖象正好被移走之前這一時(shí)刻的VBV緩存器占用。當(dāng)編碼器運(yùn)行時(shí),由于通常沒(méi)有直接與解碼器連結(jié)上,是根據(jù)它的輸出緩存器而不是轉(zhuǎn)換VBV緩存器的狀態(tài)和來(lái)自VBV緩存器的狀態(tài)變化來(lái)管理圖象的尺寸。相應(yīng)地,下面的途徑將參考Btc和Bic(見圖上部編碼器占用值)。
當(dāng)達(dá)標(biāo)開始狀態(tài)時(shí),編碼器假定在它引入第一圖象這點(diǎn)上存在某種程度的占用。這個(gè)緩存器占用是Btc位,它表示前一序列末尾的殘留位。這些位的存在限制了第一圖象的最大尺寸為Bt位,并且繼續(xù)影響下面的圖象尺寸直到時(shí)間ttc以后全部殘留位被移去。
從編碼器角度來(lái)看開始狀態(tài)的達(dá)標(biāo)是非常簡(jiǎn)單的,因?yàn)槿恳笾皇窃O(shè)定其初始占用到Btc位而不是通??盏拈_始狀態(tài)。
當(dāng)編碼器接近序列的末端時(shí),它試圖通過(guò)強(qiáng)制最后圖象的大小到當(dāng)它放入該緩存器時(shí),占用將增加到Bic位,以達(dá)到點(diǎn)Bic的目標(biāo)。如果僅在最后圖象上進(jìn)行大程度的尺寸固定(sige fixing)則可能產(chǎn)生質(zhì)量非常差的圖象。為克服這些,編碼器最好有大量的位用于最后的GOP(圖象組)和大量的位用于GOP中的每個(gè)K圖象,以使編碼器大大靠近正確狀態(tài)。
現(xiàn)在轉(zhuǎn)到系統(tǒng)層,這是在多路轉(zhuǎn)換器結(jié)合視頻,音頻和其它基本流到一個(gè)系統(tǒng)流時(shí)產(chǎn)生的,系統(tǒng)流包含交織的基本流和以系統(tǒng)時(shí)鐘參照(SCR),顯示時(shí)間標(biāo)記(PTS)和解碼時(shí)間標(biāo)記(DTS)形式出現(xiàn)的定時(shí)信息。
多路轉(zhuǎn)換器的任務(wù)是保證從系統(tǒng)流中得到、進(jìn)入解碼緩存器的數(shù)據(jù)足夠快,以使緩存器從來(lái)不會(huì)完全空,而又足夠慢以使緩存器不會(huì)上溢。MPEG標(biāo)準(zhǔn)定義了一緩存器叫做系統(tǒng)目標(biāo)解碼器(STD),用來(lái)模擬從數(shù)字存貯介質(zhì)(DSM)到解碼器的數(shù)據(jù)傳遞。此緩存器的目的是屏蔽下述情況因?yàn)閿?shù)據(jù)的交織,傳遞到解碼器去的是以突發(fā)形式,而解碼器性能模擬假定的是恒定位率。多路轉(zhuǎn)換視頻和音頻流通常的策略按慣例是從盡可能滿地填充STD緩存器開始。最后包組裝的SCR被設(shè)置以使第一圖象在這個(gè)時(shí)刻從緩存器中移去。接著,前面那些包的SCR由于它們的到達(dá)時(shí)間上領(lǐng)先于這個(gè)包被設(shè)置到正確的值。最后,緩存器被保持得盡可能地滿,直到基本流中的數(shù)據(jù)全部用完。
多路轉(zhuǎn)換器的操作比這些要更為復(fù)雜,因?yàn)槎嗦忿D(zhuǎn)換器要判斷多重流。而且多路轉(zhuǎn)換器還需要支持其它的特點(diǎn),這些是為滿足系統(tǒng)流的特性所需要的,因?yàn)閷?duì)目標(biāo)平臺(tái)(target platform)已經(jīng)作了規(guī)定。
STD緩存器,如圖2所示能被考慮如同包圍住VBV緩存器。此圖給出了STD和VBV關(guān)系的簡(jiǎn)單表現(xiàn),在圖2中STD緩存器占用(粗線)顯示出包圍VBV緩存器。要說(shuō)的一點(diǎn)是STD緩存器線的斜率大于VBV線的,這是因?yàn)镈SM的位率高于編碼的視頻位率。同時(shí)還可以看到在時(shí)間段(參照符Q所表示的)中沒(méi)有數(shù)據(jù)傳遞到STD中。它的出現(xiàn)或者由于DSM的帶寬被其它基本流占據(jù),或者是緩存器管理的結(jié)果使多路轉(zhuǎn)換器決定不能送數(shù)據(jù)到STD。
圖3的圖形顯示在解碼正常流,也就是不是目標(biāo)流的開始,VBV和STD占用的情況。為了易于了解,在圖形中圖象從兩個(gè)緩存器中被移去的時(shí)間(按術(shù)語(yǔ)說(shuō)是系統(tǒng)時(shí)標(biāo))表示成相互同步的。VBV沒(méi)有數(shù)據(jù)傳遞開始時(shí)間的概念,只有根據(jù)VBV延時(shí)圖象的移去時(shí)間。為了圖形的對(duì)齊,在圖中一恒定的偏移被加在VBV的取樣時(shí)間上。
從圖3可以看到,多路轉(zhuǎn)換器和編碼器在片段的開始都遵循類似的策略。也就是說(shuō),它們的緩存器,如上所述,在第一圖象被移去之前已填充得盡可能的多些。此時(shí)還可以發(fā)現(xiàn),STD緩存器占線總是包含著VBV占用。此規(guī)律的例外是在起動(dòng)期間,因?yàn)镈SM的數(shù)據(jù)率高于VBV的,所以對(duì)STD的傳遞開始在VBV之下。
現(xiàn)在轉(zhuǎn)到能連結(jié)在一起的系統(tǒng)流的產(chǎn)生上,包含視頻的無(wú)縫隙系統(tǒng)流的產(chǎn)生將首先被考慮。再參考圖1,可以看到將序列A結(jié)尾的全部位移去所花費(fèi)的時(shí)間取決于對(duì)序列A的數(shù)據(jù)傳遞停止時(shí),有多少圖象存在在緩存器中。這個(gè)時(shí)間取決于源的素材和所用的編碼器,因此,時(shí)間tx的緩存器占用Bx片段和片段之間各不相同。從而多路轉(zhuǎn)換器無(wú)法計(jì)算tx和Bx應(yīng)該是多少,對(duì)一般情況根據(jù)知識(shí)通常這是可以得到的,即位率,幀率和原有的Bt。
為克服上面所說(shuō)未知的問(wèn)題,我們利用了這樣一個(gè)事實(shí),當(dāng)序列A的傳遞停止時(shí)緩存器中的數(shù)據(jù)是足夠支持一段時(shí)間,以恒定傳輸率傳遞Bt位所需花費(fèi)的時(shí)間。我們認(rèn)為在多路轉(zhuǎn)換的流的開始,允許設(shè)定最大的時(shí)間為傳遞Bt個(gè)位,即tt=Bt/R (1)這里tt如圖1所示,而R是傳遞率。
此時(shí)間對(duì)多路轉(zhuǎn)換器很重要,因?yàn)樗沟迷谠擖c(diǎn)上設(shè)置SCR時(shí)間,正是從這個(gè)點(diǎn)起第一圖象要從STD緩存器中移去。從而,多路轉(zhuǎn)換器被設(shè)定去填充STD緩存器至少到Bt位,同時(shí)設(shè)置SCR以便在這個(gè)時(shí)間第一圖象被移走。注意這不同于傳統(tǒng)技術(shù)在于,第一圖象被移走點(diǎn)緩存器要求填充到盡可能的多。
需要指出的是此處STD緩存器大于VBV緩存器。在受限制的系統(tǒng)參數(shù)(CSPS)情況下,STD緩存器對(duì)比于VBV的最大尺寸40K字節(jié),可高達(dá)46K字節(jié)。這多出的空間使多路轉(zhuǎn)換器去交織不同的基本流進(jìn)入單一系統(tǒng)流,避免零星傳輸?shù)浇獯a器。
圖4的曲線圖顯示目標(biāo)多路轉(zhuǎn)換操作開始時(shí)VBV和STD緩存器的情況。如同圖3,曲線表示相對(duì)于時(shí)間t(系統(tǒng)時(shí)標(biāo))(時(shí)鐘脈沖)的占用B(位)。它指出VBV和STD緩存器的占用,在第一圖象從緩存器移走這一點(diǎn)上是相等的。從這一點(diǎn)起STD緩存器的占用開始超過(guò)VBV緩存器的占用,這是由于數(shù)據(jù)傳遞率較高。
多路轉(zhuǎn)換器對(duì)STD緩存器的末尾狀態(tài)控制非常弱。末尾狀態(tài)取決于仍然在緩存器中的圖象的大小,這是受編碼器控制的。最好多路轉(zhuǎn)換器試圖盡可能快地傳遞數(shù)據(jù)到STD以防范所謂的SCR重迭問(wèn)題。當(dāng)來(lái)自第一片段的數(shù)據(jù)并非全部被交付,那里的數(shù)據(jù)變成屬于下面片段的了。對(duì)此建議的多路轉(zhuǎn)換器策略是對(duì)數(shù)據(jù)打包,只要STD緩存器能接受數(shù)據(jù)而不管如何的小。
圖5顯示在片段末尾VBV和STD狀態(tài)的曲線。從而可以看出對(duì)STD的數(shù)據(jù)傳遞停止得早于VBV,這是因?yàn)镾TD緩存器較大而且接收的位率較高。朝向片段的末端此兩條曲線重新會(huì)聚在一起。在此時(shí)間點(diǎn)上對(duì)兩個(gè)緩存器的數(shù)據(jù)傳遞均已停止,它們持有的僅是構(gòu)成片段末尾的圖象。末尾圖象從這些緩存器移走所花費(fèi)的時(shí)間是以下一片段的數(shù)據(jù),在該片段第一圖象移走之前填充這些緩存器可用的時(shí)間,此填充時(shí)間在圖1中以時(shí)間tt表示。
現(xiàn)轉(zhuǎn)到音頻信號(hào),對(duì)于音頻沒(méi)有與VBV緩存器的對(duì)應(yīng)物,這就使得得到無(wú)縫隙的音頻比視頻簡(jiǎn)單得多。其原因是音頻以恒定的瞬時(shí)位率編碼,換句話說(shuō),全部類似編碼的音頻幀是同樣尺寸,不超出一個(gè)字節(jié),而視頻幀的尺寸變化取決于幀的類型和復(fù)雜程度。然而,多路轉(zhuǎn)換器可以瞄準(zhǔn)這一時(shí)間STD緩存器的狀態(tài),此時(shí)以類似于視頻時(shí)的辦法音頻的第一幀被移走。
圖6顯示目標(biāo)音頻多路轉(zhuǎn)換操作開始時(shí)的曲線。此時(shí)多路轉(zhuǎn)換器瞄準(zhǔn)2048字節(jié)(16384位)處STD的狀態(tài),在此時(shí)刻第一音頻幀被移去,填充時(shí)間是相似于圖1中的tt并且具有類似的特性,即該時(shí)間必須不大于在緩存器中當(dāng)數(shù)據(jù)傳遞停止時(shí)由音頻幀數(shù)代表的時(shí)間。當(dāng)多路轉(zhuǎn)換器達(dá)到其目標(biāo)并且第一音頻幀已被移走,它遵循保持STD緩存器盡可能滿的策略。曲線斜率的大增表明了音頻包的傳輸。在此情況下,音頻包的大小約為2K字節(jié),因?yàn)樗迷贑D-i的回放多路轉(zhuǎn)換,而CD-i的扇區(qū)大小約為2K字節(jié)。
圖7顯示音頻片段尾部STD情況的曲線。表示從數(shù)據(jù)停止傳遞時(shí)開始,緩存器中音頻幀占用的有規(guī)律逐步下降。這些剩余的音頻幀掩蓋了從一個(gè)音頻片段的結(jié)束到另一個(gè)之間的變化。它們持續(xù)的有限時(shí)間取決于幀數(shù)但參考圖6可見,填充STD緩存器到其目標(biāo)的時(shí)間,相對(duì)于被剩余幀掩蓋的時(shí)間是非常短的,這使STD不發(fā)生下溢,這里假定了DSM位率大體上高于音頻位率。我們的經(jīng)驗(yàn)表明,對(duì)音頻STD緩存器定標(biāo)到50%滿可給出可接受的結(jié)果。
圖8所示編碼設(shè)備它具有分別對(duì)視頻V和音頻A信號(hào)分離的編碼器級(jí)10和12。還有一個(gè)用作幀參考信號(hào)的輸入,它標(biāo)識(shí)視頻信號(hào)中的各個(gè)幀(例如用相對(duì)于序列中第一和最后圖象的相對(duì)位置),被連到目標(biāo)設(shè)定級(jí)14。該級(jí)指定序列中圖象的位分配。要說(shuō)明的是對(duì)音頻解碼器沒(méi)有對(duì)應(yīng)的目標(biāo)級(jí)。由于如上所述編碼的音頻幀是恒定大小的,對(duì)此沒(méi)有需要。
每個(gè)編碼器級(jí)10,12的輸出被顯示為送到各自的緩存器16,18(盡管實(shí)際上這些將構(gòu)成編碼器級(jí)的部分)。從視頻編碼器級(jí)10的輸出到目標(biāo)設(shè)定單元14的反饋通路20,能夠檢查是否此設(shè)定的目標(biāo)具有在編碼的組中每圖象所要求的位數(shù)的結(jié)果。
被緩存了的輸出被多路轉(zhuǎn)換器22交織(它還插入時(shí)間標(biāo)記),以形成單個(gè)數(shù)據(jù)流DS(系統(tǒng)流)而后它可被傳送到解碼器或存貯在合適的介質(zhì),例如CD盤上。
在解碼器方面(圖9),多路分配器24通過(guò)檢測(cè)器26監(jiān)示輸入流將流DS分到視頻及音頻通道。被分開的視頻及音頻流送到各自的緩存器28,30并從這到各自的解碼器級(jí)32,34以提供解碼輸出信號(hào)Vout,Aout。雖然這些緩存器實(shí)際上是形成各自解碼器級(jí)的部分。它們被分開表示是為更清楚地說(shuō)明STD模塊。
由于閱讀了本發(fā)明的內(nèi)容,對(duì)于熟悉專業(yè)的人其它的改變都是明白的,這些改變可能包括另外的特點(diǎn),在編輯音頻和/或視頻信號(hào)的方法和設(shè)備以及其部件中,這些特點(diǎn)是已經(jīng)知道的。這些特點(diǎn)可被用來(lái)替代或者附加到已經(jīng)在此說(shuō)明過(guò)的特點(diǎn)上。盡管權(quán)利要求書已按特定的特征組合提出申請(qǐng),應(yīng)當(dāng)懂得本發(fā)明申請(qǐng)公開的范圍還包括新的特征或者任何以隱含的、明顯的或其一般通則公開的新的特征組合,無(wú)論是否與現(xiàn)行申請(qǐng)的任何權(quán)利要求項(xiàng)的同樣發(fā)明有關(guān),以及是否如本發(fā)明所做的,去調(diào)節(jié)某些或所有類似技術(shù)問(wèn)題。申請(qǐng)人特此予以通知,在本申請(qǐng)或由此導(dǎo)出的任何進(jìn)一步的申請(qǐng)的實(shí)施期間,對(duì)于這些特征和/或這些特征的組合,新的權(quán)利要求書可能被系統(tǒng)地提出。
權(quán)利要求
1.一種編碼數(shù)字視頻信號(hào)的方法,以每段包含兩個(gè)或更多圖象的形式,并且在一解碼設(shè)備中,該設(shè)備具有一編碼級(jí),一編碼緩存器,以及將編碼視頻信號(hào)至少和另外一種信號(hào)交織以形成系統(tǒng)流的裝置,對(duì)于每個(gè)段,此方法包括下列步驟-根據(jù)預(yù)定的編碼方案相繼地編碼段中的各個(gè)圖象;-讀編碼圖象送入緩存器;-以基本上恒定的位率從緩存器讀出編碼的段;和-將緩存器輸出信號(hào)交織得到系統(tǒng)流;其特征在于編碼緩存器的占用被控制以具有第一預(yù)定準(zhǔn)線(level),第一段的最后圖象此時(shí)刻已被讀入此位置,此占用準(zhǔn)線與解碼器緩存器的占用準(zhǔn)線有關(guān),其特征還在于得到以恒定位率填充解碼器緩存器到所說(shuō)解碼器緩存器占用準(zhǔn)線所需的時(shí)間;還在于插一時(shí)間標(biāo)記到下面段的系統(tǒng)流中,指出這個(gè)段的第一圖象在加載下面段開始以后,將從解碼器緩存器中讀出。
2.按照權(quán)利要求1所要求的一種方法,其中用于編碼第一段圖象的目標(biāo)位數(shù)被可控制地改變例如達(dá)到所說(shuō)的編碼器緩存器占用準(zhǔn)線。
3.按照權(quán)利要求1所要求的一種方法,其中,最大編碼器緩存器占用準(zhǔn)線被指定,并且解碼器緩存器占用準(zhǔn)線被定義為所說(shuō)最大準(zhǔn)線和在第一段最后圖象已被讀入編碼器緩存器之后,一幀周期編碼器緩存器占用準(zhǔn)線之間的差。
4.按照權(quán)利要求2的方法,其中對(duì)段的最后K個(gè)圖象中每個(gè)的目標(biāo)位數(shù)各自被指定,這里K為整數(shù)。
5.按照權(quán)利要求1的方法,其中段中的圖象按MPEG標(biāo)準(zhǔn)被編碼。
6.一種為編碼圖象段而配置的數(shù)字視頻信號(hào)編碼器設(shè)備,這里每個(gè)段包含兩個(gè)或更多視頻圖象,此設(shè)備包括-編碼級(jí)安排來(lái)接收段的連續(xù)圖象,并按照預(yù)定的編碼方案將它們編碼;-緩存器連結(jié)用以接收來(lái)自編碼級(jí)的連續(xù)編碼圖象,并安排以基本恒定的位率輸出編碼的段;和-多路轉(zhuǎn)換器連結(jié)用以接收緩存器輸出和至少一種其它信號(hào),并安排將它們交織成為系統(tǒng)流;其特征在于編碼級(jí)以可控制的可變位數(shù)操作去編碼段中的圖象,此設(shè)備還包括目標(biāo)設(shè)定裝置,用于控制由編碼器使用的位數(shù),例如,在第一段的最后圖象被讀入緩存器的瞬間給出預(yù)定的編碼器緩存器占用,還包括時(shí)間標(biāo)記裝置,根據(jù)所說(shuō)的預(yù)定的占用操作,得出一定時(shí)值,并插入時(shí)間標(biāo)記到下面段的系統(tǒng)流中,指示下面段的第一圖象,在開始裝載所說(shuō)下面段進(jìn)入解碼器緩存器的點(diǎn)起,延遲由定時(shí)值給出的時(shí)間,將從解碼器緩存器中被讀出。
7.根據(jù)權(quán)利要求6的設(shè)備,其中目標(biāo)設(shè)定裝置的操作,為段的最后K個(gè)圖象(這里K為整數(shù))去控制每個(gè)圖象的位數(shù)。
8.一種數(shù)字視頻圖象信號(hào)包含有大量根據(jù)權(quán)利要求1的方法編碼的數(shù),每段包含按照預(yù)定的編碼方案編碼的圖象序列,其中段的每個(gè)最后K個(gè)圖象(這里K為整數(shù))被按各自的位數(shù)編碼,這樣,當(dāng)編碼段以基本恒定的位率讀進(jìn)解碼器緩存器時(shí),相繼的圖象為以實(shí)時(shí)顯示率解碼而被移走,在段的最后圖象的數(shù)據(jù)已經(jīng)讀進(jìn)解碼器緩存器的瞬間,預(yù)定的解碼器緩存器占用出現(xiàn),而且每個(gè)段的系統(tǒng)流包含時(shí)間標(biāo)記,指示下面的加載及段從緩存器讀出的點(diǎn),由時(shí)間標(biāo)記指定的延時(shí)與所說(shuō)預(yù)定解碼器緩存器占用有關(guān)。
9.載有視頻信號(hào)的一種光盤,該視頻信號(hào)包含如權(quán)利要求8所要求的大量編碼段,其中全部段提供一公共的解碼器緩存器預(yù)定占用準(zhǔn)線。
全文摘要
用于編碼視頻數(shù)據(jù)片段并與相關(guān)的音頻和控制數(shù)據(jù)多路轉(zhuǎn)換成系統(tǒng)級(jí)流的系統(tǒng)被提供。通過(guò)得到編碼器和解碼器之間的關(guān)系,考慮緩存器填充率,多路轉(zhuǎn)換器瞄準(zhǔn)解碼視頻緩存(MPEGVBV)視頻系統(tǒng)層緩存(MPEGSTD)的起始占用。根據(jù)填充率的知識(shí),解碼器緩存器在為解碼讀出片段之前只需要填充到預(yù)定的水平,而不是完全填充此緩存器,并且無(wú)縫隙的視頻片段連接能簡(jiǎn)單地實(shí)現(xiàn),此技術(shù)尤其適用于交互式多媒體系統(tǒng),那里需求不間斷的顯示。
文檔編號(hào)H04N7/52GK1144026SQ95192059
公開日1997年2月26日 申請(qǐng)日期1995年11月29日 優(yōu)先權(quán)日1994年12月2日
發(fā)明者S·布蘭查德 申請(qǐng)人:菲利浦電子有限公司