用于對數字視頻數據進行編碼和解碼的設備和方法

文檔序號：7569537閱讀：330來源：國知局

專利名稱：用于對數字視頻數據進行編碼和解碼的設備和方法
技術領域：
本發(fā)明涉及用于對數字視頻數據進行編碼和解碼的設備和方法，尤其是涉及能夠低速率和高速率地再現可變速率編碼的數字視頻數據的數字視頻數據編碼和解碼的設備和方法，本發(fā)明還涉及其上存儲有可變速率編碼的數字視頻數據尤其是能夠低速率和高速率再現特定數據結構的記錄介質。
正如公知的，MPEG壓縮數字視頻數據包括幀內編碼數字視頻數據(“I幀”)和幀間編碼數字視頻數據，后者包括正向預測編碼數據(“P幀”)和雙向預測編碼數據(“B幀”)。通常，I幀不采用其它幀的數據解碼，而P和B幀要采用其它幀解碼。
MPEG壓縮數字視頻數據的位流一般分為多個圖象組(GOP)，每一GOP以I幀開始。當數字視頻數據是按固定的速率進行MPEG壓縮時，例如，當GOP的幀圖象(pattem)是固定的時，I幀在位流中的已知位置上周期性地產生，因此通過僅再現I幀而高速率地再現視頻數據是可能的，因為每一I幀的總體位置是已知的。但是，當數字視頻數據是按可變速率進行MPEG壓縮時(例如，GOP的幀圖象是可變的)，I幀在位流中不是按已知間隔產生的，因此僅通過再現I幀難以高速率地再現視頻數據。
為了以比正常速率更高的速率再現MPEG壓縮數字視頻數據，一種技術是在包括位于GOP的起始部分的I幀的每一區(qū)段中記錄一個標記，此標記指示I幀的存在，并且在此區(qū)段(sector)中記錄包括I幀的相鄰區(qū)段的區(qū)段地址(即位置)。因此，通過再現位流中的相鄰的I圖象可以實現較低的搜索速率。
與上述技術相關的一個問題是不能在高速搜索模式下從記錄介質上再現視頻數據，而在高速搜索模式下極希望連續(xù)地再現按較高的時間間隔(例如1、2、4秒等)在位流中產生的I幀。
因此，本發(fā)明的一個目的是提供用于對數字視頻數據進行編碼和解碼的設備和方法，該設備和方法克服了上述的再現技術的缺點。
本發(fā)明的另一目的是提供用于對數字視頻數據進行編碼的和解碼的設備和方法，該設備和方法能實現壓縮數字視頻數據的低速率和高速率的再現。
本發(fā)明的再一目的是提供一種記錄和再現技術，該技術能實現可變速率的壓縮數字視頻數據的高速率和低速率再現。
本發(fā)明的又一目的是提供這樣一種技術，它允許再現按預定的固定時間間隔瞬時產生的I幀。
本發(fā)明的進一步的目的是要提供一種記錄介質，其上存儲有可以按低速率和高速率再現的壓縮數字視頻數據。
本發(fā)明的另外一個目的是要低速率和高速率地再現壓縮的數字靜止圖象和音頻數據。
根據本發(fā)明的一個實施例，本發(fā)明的設備和方法能按可變速率對數字視頻數據進行編碼(即，幀內編碼和幀間編碼)；標識選擇的編碼視頻數據的多個入口點，這些入口點代表產生于視頻圖象中的預定時間間隔(例如1、2和4秒)的視頻幀的相應位置；產生標識入口點的位置的入口點數據；將入口點數據加至編碼視頻數據；將具有附加的入口點數據的編碼視頻數據記錄至記錄介質上。
作為本發(fā)明的一個方面，入口點數據標識在視頻圖象的預定時間間隔產生的幀內編碼的幀的入口點。
作為這一方面的一特征，入口點數據標識了幀內編碼的幀的入口點，即，在時間上位于最靠近一個預定時間間隔產生的幀但其不是一幀內編碼的幀。
作為本發(fā)明的另一方面，相應的入口點數據加至每一幀內編碼的幀，它標識在相應入口點數據加至幀內編碼幀之前和之后在預定時間間隔中產生的幀內編碼的幀的入口點。
根據本發(fā)明的另一實施例，本發(fā)明的設備和方法能從記錄介質上再現可變速率編碼的數字視頻數據，此數據代表多個連續(xù)的視頻幀并包括標識編碼視頻數據的入口點的位置的入口點數據，這些入口點位置代表產生于視頻圖象中的預定時間間隔的視頻幀的相應位置；從再現數據中拾取入口點數據；將所拾取的入口點數據存儲于存儲器中；根據存儲在存儲裝置中的入口點數據控制編碼數據的再現，以再現特定的視頻幀；對再現的數據進行可變速率解碼，以產生解碼的視頻數據。
作為這個實施例的一個方面，再現的數據包括幀內編碼幀和幀間編碼幀，每一再現的幀內編碼幀包括標識幀內編碼幀的入口點的相應入口點數據，這些幀內編碼幀產生于從包括相應入口點數據的幀內編碼幀起的預定時間間隔中。在一個幀內編碼幀再現之后，再現由包含在再現的幀內編碼幀中的入口點數據標識的幀內編碼幀之一。
根據本發(fā)明的再一個方面，本發(fā)明的記錄介質包括多個長度可變的視頻數據區(qū)，在這些區(qū)中存儲可變編碼數字視頻數據，其中編碼數字視頻數據包括多個幀內編碼幀和幀間編碼幀，其中每一個存儲于相應的一個視頻數據區(qū)中；多個入口點數據區(qū)，在這些區(qū)中存儲入口點數據，其中入口點數據標識所述編碼數字視頻數據的入口點位置，這些入口點位置代表存儲幀內編碼幀的視頻數據區(qū)的相應位置，這些幀內編碼幀產生于視頻圖象中的預定時間間隔中。
根據本發(fā)明的又一個實施例，本發(fā)明的設備和方法能可變速率編碼數字靜止圖象和音頻數據；標識代表靜止圖象在編碼數據中的相應位置的入口點；產生確定所標識的入口點在編碼數據中的位置的入口點數據；將入口點數據加至編碼數據；將具有附加的入口點數據的編碼數據記錄至記錄介質上。
根據本發(fā)明的另外一個方面，本發(fā)明的設備和方法能從記錄介質上再現可變速率編碼的數字靜止圖象數據，它包括標識編碼數據的入口點的位置的入口點數據，這些入口點代表靜止圖象在編碼數據中的相應位置；從再現的編碼數據中拾取入口點數據；將所拾取的入口點數據存儲于存儲器中；根據存儲在存儲裝置中的入口點數據控制再現編碼數據，以再現編碼的靜止圖象；和可變速率解碼再現的編碼的靜止圖象，以產生解碼的靜止圖象。
通過以下的詳細說明并結合附圖，可以最好地理解本發(fā)明，這種說明是借助于實施例給出的，但本發(fā)明并不局限于這些實施例，附圖中相同的參考數字代表相同的組件和部分。
附圖簡要說明

圖1是根據本發(fā)明的用于對數字視頻數據進行編碼的設備的方框圖；圖2示出根據本發(fā)明的數據包的數據結構；圖3示出根據本發(fā)明的入口包的數據結構；圖4示意性地示出I幀及選擇的入口點在按不同時間間隔瞬時產生的數據流中的位置；
圖5是一個根據本發(fā)明的用于檢測和記錄選擇的標識幀的位置的流程圖；圖6示出根據本發(fā)明的數據包的另一種數據結構；圖7是入口區(qū)段的程序流目錄表；圖8是入口區(qū)段的程序流映象表；圖9是根據本發(fā)明的另一實施例的用于對數字視頻數據進行編碼的設備的方框圖；圖10是根據本發(fā)明的用于對數字視頻數據進行解碼的設備的方框圖；圖11示出入口點數據的數據結構；圖12是根據本發(fā)明用于對從記錄介質上再現的數字視頻數據進行解碼的設備的方框圖；圖13示意性地示出根據本發(fā)明的由入口點數據標識的靜止圖象和音頻數據在數據流中位置的優(yōu)選實施例的詳細說明圖14示意性地示出根據本發(fā)明的由入口點數據標識的音頻數據位置的另一實施例。
參照附圖，尤其是圖1，圖1中示出了根據本發(fā)明的用于對數字視頻數據進行編碼的設備(以下稱編碼設備)的方框圖。所示的編碼設備包括視頻編碼器1、音頻編碼器2、多路復用電路3和數字存儲器(DSM)10。施加于視頻輸入端子的數字視頻信號供給視頻編碼器1，視頻編碼器1以本領域公知的方法對視頻信號進行壓縮編碼(即，幀內編碼和幀間編碼)，并將編碼的視頻數據供給多路復用電路3中的視頻入口點(entry point)檢測電路。施加于音頻輸入端子的數字音頻信號供給音頻編碼器2，音頻編碼器2以本領域公知的方法對音頻數據進行編碼而形成音頻數據包，并將音頻數據包供給多路復用電路3中的編碼緩沖器5。
根據本發(fā)明，視頻編碼器1在每次輸出視頻數據的I幀(幀內編碼幀)時向控制器8提供入口點ID(識別)信號。
多路復用電路3由編碼緩沖器4和5、開關電路6、首標附加電路7、控制器8、多路復用系統(tǒng)時鐘發(fā)生器9、視頻入口點檢測電路31(以下稱入口點檢測器31)、入口區(qū)段(sector)產生電路32和入口點存儲器33組成。入口點檢測器31檢測所施加的比特流中的I幀的產生并將指示I幀產生的另一入口點ID信號供給控制器8。雖然從視頻編碼器1和入口點檢測器31供給控制器8的入口點ID信號是冗余信號，但在一定條件下，視頻編碼器1將不能產生入口點ID信號，例如，當施加預先編碼的視頻數據時，或者，視頻編碼器1不能向控制器8提供入口點ID信號。在每一種情況下，在從入口點檢測器31輸出并供給編碼緩沖器4的比特流中的每一I幀的產生是已知的。
編碼緩沖器4存儲所供給的位流數據并將存儲的數據輸出至開關6的端子E1。相應地，編碼緩沖器5存儲其中的音頻數據包并將存儲的音頻數據輸出至開關6的端子E2。控制器8的功能是控制開關6在端子E1和E2之間轉換，以便按時分方式多路復用視頻和音頻數據的包。此外，響應于由入口點ID信號指示的I幀從電路1或者31的產生，控制器8控制入口區(qū)段產生電路32產生入口包數據(后面將要討論)，并且控制開關6轉換至端子E3，以便有效地將所產生的入口包數據緊靠在I幀之前插入位流中。系統(tǒng)時鐘發(fā)生器9產生系統(tǒng)時鐘信號，此信號供給控制器8，控制器8采用所供給的信號控制開關6在其輸入端子E1-E3之間轉換。
開關6向首標附加電路7提供時分多路復用數據，首標附加電路7響應于來自于控制器8的控制信號，將視頻包首標加至每一視頻數據包的開始部分，將音頻包首標加至每一音頻數據包的開始部分，并將包(pack)首標加至每一數據包。首標附加電路7還將一個后首標(back header)加至每一數據包，這樣每一數據包為2048字節(jié)長，首標附加電路7將之后形成的信號供給其中存儲數字數據的數字存儲器DSM。
入口點存儲器33存儲與所檢測的入口點相關的位置數據，即，所選擇的從編碼緩沖器4輸出的I幀的位置。入口存儲器33還要在下面討論。
圖2示出存儲于DSM10中的數據包的數據結構。如圖中所示，數據包包括順序排列的包首標、視頻包首標、視頻數據、入口包、另一視頻包首標、視頻數據、音頻包首標和音頻數據。包首標包括各種信息，包括包起始碼、SCR數據、多路復用速率數據等。緊位于包首標之后的第一視頻包首標和視頻數據代表其中不包括I幀的視頻數據的包，因為入口包沒有插入第一視頻包首標之前。不過，入口包(也稱為入口數據包)位于下一個視頻包首標之前，因此下一視頻數據包括I幀。
圖3示出入口包的數據結構。此入口包包括順序排列的包起始碼前綴、Oxbf(十六進制)的位流ID數據、標識連續(xù)包的長度(即數據量)的長度數據、標識入口包確定于特定專用(person)的“****”ID數據(缺省為FFh)、標識分類類型的“****”包類型(如果入口包為特定入口專用的話)、標識在下一入口區(qū)段之前產生的數據區(qū)段數的“當前#數據流”數據、標識在下一入口區(qū)段之前產生的視頻區(qū)段數的“當前#視頻流”數據、以及標識在下一入口區(qū)段之前產生的音頻區(qū)段數的“當前#音頻流”數據。
入口包還包括“-3”、“-2”、“-1”、“+1”、“+2”和“+3”入口包數據，這些數據標識與數據流中的6個不同的I幀的開始位置相應的6個不同“入口點”的位置。參照圖4，此圖示出了在編碼的比特流中的連續(xù)的I幀(為方便起見未示出P幀和B幀)，其中與每一I幀一起(緊位于其前面)存儲的入口包標識6個不同的I幀的位置。根據本發(fā)明，“-3”、“-2”、和“-1”入口包數據標識在存儲入口包的I幀之前產生在3個不同的預定時間間隔中的3個I幀的開始位置。此外，“+1”、“+2”、和“+3”入口包數據標識在存儲入口包的I幀之后產生在3個不同的預定時間間隔中的3個I幀的開始位置。如果這3個不同的預定時間間隔例如分別是1秒、2秒和4秒，那么由I幀109存儲的入口包標識I幀100、103、106、112、114和117的相對位置(相對于I幀109)，如圖4所示。如圖中所看到的，幀100產生于I幀109之前4秒，幀103產生于I幀109之前2秒，幀106產生于I幀109之前1秒，幀112產生于I幀109之后1秒，幀114產生于I幀109之后2秒，幀117產生于I幀109之后4秒。相似地，由I幀110存儲的入口包標識分別產生于I幀110之前1、2和4秒的I幀108、105和101，還標識分別產生于I幀110之后1、2和4秒的I幀113、116和119。每一入口包數據“-3”、“-2”、……、“+3”標識當前I幀與各標識I幀的入口點(見圖2)之間的區(qū)段數。預定的不同時間間隔可以與圖4中所示的情況不同。例如，可以采用1、3和9秒的時間間隔。另外，時間間隔可以根據視頻圖象的各種特性而變化并可在視頻圖象內改變。例如，對于活動性強的圖象組時間間隔可以較短，而對于活動性弱的圖象組時間間隔可以較大。
可以看出，通過標識代表位于一個給定的I幀(之前和之后)的3個不同時間間隔的I幀的入口點，可以實現，低速搜索和高速搜索(以及中速搜索)，正如下面將要討論的。此外，隨著再現速度按指數增加，例如，再現速度從10x至100x，最好采用這樣的入口點(即I幀)，它位于距給定的I幀按指數增加的時間間隔中。例如，在100x的再現模式中，選擇約4秒的預定時間間隔。在每秒30幀的幀速率下，4秒中有120幀，它足夠接近所希望的100x的再現速度。但是，若要求更高的精確性，可以采用3.3秒的時間間隔。另一方面，對于很低的再現搜索速度，例如，在2x再現模式下，I幀的順序解碼是可行的，因此不必采用入口點。
返回來參照圖1，正如前面所討論的，包括圖3中所示的數據的入口區(qū)段(即入口包)是由入口區(qū)段發(fā)生器32響應于I幀(即當前I幀)的產生而產生的。在產生入口包時，可以產生入口包數據-3、-2和-1，因為位于當前幀之前的I幀的位置是已知的(即它們已經產生在位流中)。入口點存儲器33在位流中存儲每一入口點的絕對位置(即每一I幀的開始部分)，而入口區(qū)段發(fā)生器32采用存儲在存儲器33中的I幀的絕對位置和已知的當前幀的位置產生相對位置數據，此數據標識在當前幀之前產生的3個I幀。
但是，在當前幀供給開關6時(即當它在位流中產生時)，與在當前幀之后產生的I幀的開始位置相應的入口點的位置是不知道的。因此，在入口區(qū)段發(fā)生器32中隨入口包數據+1、+2和+3建立了虛數據，包括-視頻和音頻數據的位流以及每一入口包(其中具有虛數據)被存儲在DSM10中。在位流的末端(即在所有的視頻、音頻和入口包存儲在DSM10中之后)，控制器8采用存儲在存儲器33中的每一入口點(即I幀)的位置確認對應于每一入口包的入口包數據+1、+2和+3的值，并將每一入口包的入口包數據+1、+2和+3存儲在DSM10中的適當位置中。
如上所述，數字視頻數據可以是可變比特(Variable-bit)編碼的(例如，GOP的幀圖形是可變的)。在這種情況下，I幀在位流中可以不按恒定間隔產生，因此，如果所希望的時間間隔是例如1秒，本發(fā)明的編碼設備不能這樣假定在相隔約1秒的I幀之間產生相同數量的幀(I、P和B幀)。因此必須確保當前幀的入口包數據參照的每一I幀盡可能地接近所希望的時間間隔。
圖5是控制器8的工作原理流程圖，控制器8用于根據本發(fā)明標識每一入口包數據參照的合適的I幀。應當指出的是，控制器8工作時兩次執(zhí)行圖5的流程圖，第一次是在位流從視頻編碼器1中輸出并接著存儲于DSM10中時，以確認位于當前幀之前的I幀的入口點的位置，第二次是在完全存儲于DSM10中之后，以確認每一當前幀之后的I幀的入口點的位置。
現在說明第一次執(zhí)行圖5的流程圖時的情況。當一個I幀(即當前幀)產生時，步驟S101中確認所選幀的位置(PCT)，此幀比當前幀超前30幀，它對應于在當前幀之前1秒產生的一幀。由于入口點僅參照I幀，詢問步驟S102確定所選幀是否是I幀。如果所選幀是I幀，在步驟S104中，所選幀相對于當前幀的開始位置(即入口點)被存儲為入口包的入口包數據-1，它與當前幀一起(即緊位于其前面)被存儲，不過，如果所選幀不是I幀，在步驟S103中，在位流中與所選幀相鄰(位于其前面或后面)的幀的位置被選作新的所選幀，而后在詢問步驟S102中確定新的所選幀是否是I幀。步驟102和103的結果是選擇在時間上距當前幀最接近所希望的1秒時間間隔的I幀。
下一步，在步驟S105中確認所選的第二幀的位置(PCT)，此幀比當前幀超前60幀，它對應于在當前幀之前2秒產生的一個幀。與詢問步驟102和步驟103相似，詢問步驟S106確定所選的第二幀是否是I幀，并且在步驟S107中在比特流中與所選的第二幀相鄰的幀的位置被選作新的所選的第二幀。當所選的第二幀是I幀時，在步驟S108中，所選的第二幀相對于當前幀的開始位置被存儲為當前幀的入口包的入口包數據-2。
步驟S109-S112的工作方式與步驟S101-S104和步驟S105-S108相似，不同的是初始地所選的I幀比當前幀超前120幀，它對應于在當前幀之前約4秒產生的一個幀。在步驟S112中，所選的第三幀相對于當前幀的開始位置被存儲為當前幀的入口包的入口包數據-3。
在位流完全存儲于DSM10中之后重復圖5的流程圖的工作過程，以確認在當前幀之后產生的I幀的入口點的位置。
雖然圖5的流程圖在詢問步驟S103、S107和S111中提供了幀的重復選擇過程，但如果I幀仍未選出，本發(fā)明認為，在距當前幀一定的時間間隔(此間隔明顯不同于所希望的時間間隔)產生的I幀的最終選擇是不希望的。因此，在本發(fā)明的一個實施例中，比當前I幀超前或者滯后一定時間(此時間與所希望的時間間隔的差異大于10％)產生的I幀不能參照當前I幀的入口點數據。例如，對于所希望的1、3和9秒的時間間隔，在距當前I幀少于900毫秒(ms)、2700毫秒和9000毫秒的時間產生的I幀不能參照當前幀的入口包數據。
如果下一個入口點是一個GOP(圖象組)的第一I圖象，此GOP的開始部分由包含于此GOP中的組起始碼檢測。最先出現的I幀變?yōu)橄乱蝗肟邳c。
圖6示出根據本發(fā)明的另一實施例的入口區(qū)段即包含I幀的數據包的數據結構。如圖所示，入口區(qū)段包括一個包首標，后者包括包起始碼、SCR數據和MUX速率數據。包首標之后為程序流(stream)目錄、程序流映象(map)、包(非視頻包)、視頻包首標、包括I幀的視頻數據、音頻包首標和音頻數據。在此實施例中，數據是按從區(qū)段的開始部分起預設的順序產生的，因此便于數據處理。
程序流目錄具有按MPEG標準確定的數據結構，并用于在數據流中規(guī)定可存取的位置。程序流目錄如圖7所示。在此流中的環(huán)“A”要反復7次，以記錄3個“正向”I幀和3個“反向”I幀以及“反向”I幀的入口點?！罢颉盜幀和“反向”I幀是指在當前幀的數據包中標識的I幀。程序流映象如圖8所示，其中環(huán)B和C包括用于容納多種信息數據的說明符“()”。信息數據包含在說明符中，例如流的數目或基本單元流的信息。
圖9是根據本發(fā)明的另一實施例的用于對數字視頻數據進行編碼的設備的方框圖，其中在多路復用電路3中包括一映象信息存儲裝置35，多路復用電路3從外部入口裝置(未示出)接收信息。除裝置35之外，圖9的設備中的所有部件均包含在圖1的編碼設備中，因此在此省略其說明。存儲在裝置35中的信息被閱讀并作為入口區(qū)段存儲，每一次它構成一個入口區(qū)段。如果該信息使用未來的入口區(qū)段位置，在全部比特流存儲在DSM10中后該入口區(qū)段位置從裝置33中讀出。
圖10是根據本發(fā)明的用于對數字視頻數據進行解碼的設備的方框圖。圖10的解碼設備對存儲在DSM10中的具有圖2所示的數據結構的數據進行解碼。該解碼設備包括分離裝置21、視頻解碼器25和音頻解碼器26。響應于由控制器24供給的控制信號，編碼的數字數據從DSM10中讀出并供給首標分離電路22，首標分離電路22從讀出的數據中分離出每一包首標、每一分包首標和每一入口包，并將分離的數據供給控制器24。首標分離電路22還將時分多路復用數據供給開關電路23的輸入端子G，開關電路23通過向端子H1提供視頻數據和向端子H2提供音頻數據而多路分解此數據(響應于來自于控制器24的控制信號)。視頻數據供給視頻解碼器25，音頻數據供給音頻解碼器26，解碼器25和26以本領域公知的方法對相應數據進行解碼。
控制器24向入口點存儲器41提供入口包數據，存儲器41存儲所提供的數據。DSM10向控制器24提供讀出的位置信息，此信息在位流中標識提供給首標分離電路24的數據的位置。
現在說明圖10的解碼設備在搜索模式下的工作原理。主控制器(未示出)向控制器24、視頻解碼器25和音頻解碼器26提供合適的控制信號，以便它們工作于特定的搜索模式。當在搜索模式下再現時，如果可能的話，控制器24控制DSM10讀出由存儲在裝置41中的數據標識的最接近的I幀。在搜索模式下再現之前，所有入口點可以預先存儲(例如通過上電(upon power-up))在裝置41中(通過再現整個位流)。如前面所討論的，入口包緊位于每一I幀之前，因此I幀容易得到。
DSM10讀出包括剛存儲的入口包的I幀。分離裝置2I和視頻解碼器25對I幀進行解碼并在視頻輸出端提供解碼的圖象數據。在該解碼設備處于搜索模式時，音頻解碼器26的輸出是靜噪的。在對讀出的I幀進行解碼時，控制器24確認要讀出的下一I幀在DSM10中的位置。如前面所討論的，入口包相對于當前讀出的I幀位置包含6個不同的I幀的位置，根據所選擇的搜索模式，在控制器24中確認這6個不同的I幀中的一個位置。
在低速正向搜索模式中，要再現的下一I幀的位置存儲在入口包數據+1中。在高速正向搜索模式中，要再現的下一I幀的位置存儲在入口包數據+3中。此外，可以實現低、中和高速反向搜索，因為要再現的下一I幀的位置分別存儲在入口包數據-1、-2和-3中。圖11示出根據本發(fā)明的另一實施例從DSM10中再現入口包的數據結構。
下面參照圖12，其中示出了根據本發(fā)明的另一實施例的用于對從光盤上再現的數字視頻數據進行解碼的設備的方框圖。響應于由跟蹤伺服裝置70提供的控制信號，拾取裝置61從光盤60拾取數字數據?？刂破?7向驅動控制電路69提供控制命令，驅動控制電路69產生驅動信號并將驅動信號供給跟蹤伺服裝置70。數據包從光盤上讀出并被供給解調電路62，解調電路62對該信號進行解調并將解調的信號供給ECC電路63，后者檢測和校正所供給的信號中的錯誤。此信號隨后供給多路分解器64，多路分解器64將視頻數據供給視頻解碼器65、將音頻數據供給音頻解碼器66并將TOC信息供給控制器67。TOC信息通常存儲在第一再現區(qū)段中?？刂破?7將TOC信息提供給TOC存儲裝置68，存儲裝置68存儲TOC信息。另外，控制器67使顯示器(未示出)向用戶指示TOC數據加載。
當圖12中所示的再現設備(響應于合適的控制信號)開始再現視頻數據時，驅動控制器69通過跟蹤伺服電路70驅動拾取裝置61從光盤60再現由用戶指定的位置上的數據。同時，控制器67控制視頻解碼器65和音頻解碼器66作解碼準備。
數據以本領域公知的方法從光盤60再現，再現的數據在電路62中解調，并供給ECC電路63，以在此校正錯誤。經過錯誤校正的數據供給多路分解器64，正如前面所述的，多路分解器64分解數據并將其中的視頻和音頻數據提供給視頻和音頻解碼器65和66，解碼器65和66對相應的數據進行解碼并輸出。
此外，解調電路62向入口點檢測電路90提供解調的再現數據，檢測電路90提取入口點數據例如一入口包并將所提取的數據供給子碼CRC電路91，后者校正數據中的錯誤。在入口點數據中標識的I幀的入口點位置存儲在入口點緩沖器92中。
控制器67從入口點緩沖器92中讀出下一入口點的數據，并將讀出的信息供給入口點存儲裝置93，入口點存儲裝置93存儲數據?？刂破?2從驅動控制器69接收當前讀出位置上的信息，因此下一入口點的位置和內容可以相關聯(lián)地存儲在裝置93中。
現在說明圖12的再現和解碼設備在搜索模式下的工作原理。控制器67控制視頻解碼器65和音頻解碼器66，使它們工作于特定的搜索模式。在搜索模式下再現時，控制器67控制驅動控制器69，使拾取裝置61靠近當前讀出位置的入口點讀出，正如裝置93在所標識的那樣。拾取裝置61再現來自于入口點的數據并通過各種電路將再現的數據供給多路分解器64。多路分解器64將視頻數據供給視頻解碼器65，后者對所供給的數據進行解碼并輸出。當圖12的再現和解碼設備處于搜索模式時，音頻解碼器66的輸出是靜噪的。
入口點位置由入口點檢測電路90的數據中分離出來并被存儲于入口點緩沖器92中，以便由控制器67檢索。正如前面所述的，由于再現開始于入口點，確保視頻信號是I幀，它很快地被解碼和輸出。
正如前面所討論的，入口包相對于當前讀出的幀的位置包括6個不同I幀的位置，并且取決于搜索模式，在控制器24中確認這6個幀之一的位置。這個過程與前面參照圖10描述的情況相似。
在上面討論的實施例中，活動圖象和音頻數據均包含在位流中。但是，本發(fā)明并不局限于活動圖象和音頻數據，本發(fā)明也包括包含靜止圖象和音頻數據的位流或者僅包含音頻數據的位流。圖13示出根據本發(fā)明由入口點數據標識的靜止圖象和音頻數據在數據流中的位置。兩個不同的入口點A和B分別標識靜止圖象數據和音頻數據開始位置。入口包(A)緊靠在每一靜止圖象之前存儲，而入口包(B)在預定的音頻數據的時間間隔之前存儲于位流中。例如，入口區(qū)段B插在位流中代表450-550ms的音頻時間間隔。另外，如果入口區(qū)段A是與入口區(qū)段B等間隔的，入口區(qū)段B可以省略。
入口區(qū)段A具有由3個入口組成的程序流目錄數據，這些入口分別表示最近的在前靜止圖象、最近的在后靜止圖象和下一在后靜止圖象。如果最近的在前靜止圖象和下一在后靜止圖象不存在，則在程序流目錄數據中記錄為零。最近的在后靜止圖象是不能缺少的，這樣就必需記錄偏移(offset)。另一方面，入口區(qū)段B具有由2個入口組成的程序流目錄數據，這兩個入口表示最近的在前靜止圖象和下一在后靜圖象。
在上述的實施例中，視頻靜止圖象和音頻數據在位流中傳輸，并可由前面所述圖1所示的編碼設備進行編碼，正如前面所討論的。但是，在此實施例中每一靜止圖象在圖1的設備中是作為I幀處理的。
返回來參照圖1，控制器8接收來自于視頻編碼器1或者來自于視頻入口點檢測電路31的入口點產生信號，并促使對應于靜止圖象的類型的入口區(qū)段A產生并且直接存儲在位流中靜止圖象的前面。
如果已經過450-550ms而沒有由區(qū)段產生電路32產生入口點，與靜止圖象不相關的入口區(qū)段B則會產生并多路復用至位流中。此時，在程序流目錄數據中包含的入口的數目變?yōu)椴煌摹?br> 入口區(qū)段A包括3個入口區(qū)段的位置，它們分別緊位于3個靜止圖象的數據之前。這些位置對應于當前圖象前的一個靜止圖象和兩個在后的靜止圖象。但是，與靜止圖象不對應的該類型的入口區(qū)段A包括位于兩個靜止圖象之前的兩個入口區(qū)段的位置，這兩個靜止圖象中的一個是在當前圖象之前，另一個是在當前圖象之后。此數據作為程序流目錄數據存儲。
與前面討論的I幀的位置相似，在前入口區(qū)段的位置是已知的，因此可以存儲在存儲裝置33中。然而，在后的入口區(qū)段位置是知道的。因此，全部入口點位置均存儲在存儲裝置33中，并且在位流完全存儲于DSM10中之后，直接位于每一入口區(qū)段的前面和后面的下一入口點的入口區(qū)段的位置被讀出并供給DSM10，以記錄于其上。
由于有幾個靜止圖象記錄在記錄介質上，再現設備必需能夠清楚地標識圖象記錄的位置。例如，如果再現開始于圖13中的位置P2，而與存儲在位置P2的音頻數據相關的視頻數據處在位置P1，再現設備就需進入位置P1，以便讀出靜止圖象數據并且隨后為再現音頻數據而返回位置P2。
此時，再現設備工作在這樣的狀態(tài)，即，它從為開始再現指定的位置起搜索最接近的入口區(qū)段。入口區(qū)段以包首標開始，隨后為程序流目錄數據，如圖6所示。再現設備從指定的再現位置起檢測數據內容，當發(fā)現特性一致的入口區(qū)段時，它讀出入口區(qū)段的內容。爾后再現設備停止工作。
如果存在3個PSD入口，緊接著會有一個靜止圖象，再現繼續(xù)。如果有兩個PSD入口，此前會有相關的靜止圖象，這樣必需對此相關的靜止圖象進行閱讀和解碼。再現設備采用來自于讀出的PSD的緊位于前面的靜止圖象接入。在圖13的實施例中，再現設備從位置P2跳至位置P1。在為開始進行音頻解碼而返回位置P2之前，再現設備對相應的靜止圖象進行讀出、解碼和存儲。按此方式，可以在包含靜止圖象和音頻數據的位流中實現正確關聯(lián)的再現。
采用記錄在每一入口區(qū)段中的在前靜止圖象和在后靜止圖象的位置，可實現靜止圖象的特定再現。即，在特定的正向再現模式中，再現設備跳至由記錄在每一入口區(qū)段中的PSD數據標識的緊隨在后的靜止圖象的位置。在特定的反向再現模式中，再現設備跳至緊接在前的靜止圖象的位置。
圖14示出僅包含音頻數據的位流。音頻入口區(qū)段B在此音頻位流中以450-550ms的間隔存儲。入口區(qū)段包括程序流目錄數據，但其中未給定視頻數據。因此，程序流目錄數據的存在僅表明這樣的事實，即，此區(qū)段是一個入口區(qū)段。再現開始允許點實質上存在于每一區(qū)段中。因此，這不意味著記錄入口點，因而也就沒有PSD入口。但是，為理解流狀態(tài)，需要程序流映象數據的信息。所以，再現一般開始于入口區(qū)段，并且再現是在詢問程序流映象數據的信息之后開始。
盡管已結合優(yōu)選實施例對本發(fā)明作了具體地顯示和說明，但本領域的技術人員將能容易地理解，在不超出本發(fā)明的構思和范圍的情況下可以作出各種改變。例如，這里公開的時間間隔是1、2和4秒以及1、3和9秒，但本發(fā)明中也可采用其它時間間隔和其它時間間隔數，例如，4個不同的時間間隔。
因此，應將所附權利要求理解為包含這里描述的實施例、上述改變和所有等同情況。
權利要求
1.一種對數字視頻數據進行編碼的設備，包括可變速率編碼裝置，用于對數字視頻數據進行編碼，以產生可變速率的編碼視頻數據；標識裝置，用于標識選擇的所述編碼視頻數據的多個入口點，這些入口點代表所述數字視頻數據的視頻幀的相應位置，所述視頻幀產生于由所述數字視頻數據代表的視頻圖象中的預定時間間隔；產生裝置，用于產生確定所標識的入口點在所述數字視頻數據中的位置的入口點數據；附加裝置，用于將所產生的入口點數據加至所述的編碼視頻數據；和記錄裝置，用于將具有附加了產生的入口點數據的編碼視頻數據記錄至記錄介質上。
2.根據權利要求1的設備，其中，所述可變速率編碼裝置對數字視頻數據進行幀內編碼和幀間編碼，以產生包括幀內編碼幀和幀間編碼幀的所述可變速率編碼視頻數據；和所述標識裝置標識產生于視頻圖象中的預定時間間隔的幀內編碼幀的入口點。
3.根據權利要求2的設備，其中，所述標識裝置標識幀內編碼幀的入口點此幀在編碼的視頻數據中就時間而言最靠近在所述的視頻圖象中的預定時間間隔之一上產生的一幀，并且產生于所述的預定時間間隔的所述幀不是幀內編碼幀。
4.根據權利要求2的設備，其中，所述附加裝置將相應的入口點數據加至每一幀內編碼幀，所述的相應的入口點數據標識從所述的相應入口點數據加至相應幀內編碼幀起在多個預定時間間隔中產生的幀內編碼幀的入口點。
5.根據權利要求4的設備，其中，所述附加裝置將所述入口點數據加至每一幀內編碼幀的起始部分。
6.根據權利要求4的設備，其中，相應的入口點數據標識位于附加相應入口點數據的幀內編碼幀之前的一個幀內編碼幀的入口點和之后的一個幀內編碼幀的入口點。
7.根據權利要求4的設備，其中，相應的入口點數據標識在所述的相應入口點數據附加的相應幀內編碼幀之后在所述的多個預定的不同時間間隔中產生的幀內編碼幀的入口點。
8.根據權利要求7的設備，其中，相應的入口點數據還標識在所述的相應入口點數據附加的相應幀內編碼幀之前在所述的多個預定的不同時間間隔中產生的幀內編碼幀的入口點。
9.根據權利要求4的設備，其中，所述的多個不同的預定時間間隔對應于1、2和4秒的時間間隔。
10.根據權利要求4的設備，其中，所述的多個不同的預定時間間隔對應于1、3和9秒的時間間隔。
11.根據權利要求4的設備，其中，所述附加裝置將相應的入口點數據加至選擇的幀內編碼幀，所述的相應的入口點數據標識從所述的相應入口點數據附加的相應幀內編碼幀起在多個第一預定時間間隔中產生的幀內編碼幀的入口點，并且將相應的入口點數據加至其它幀內編碼幀，所述的相應的入口點數據標識從所述的相應入口點數據附加的相應幀內編碼幀起在多個第二預定時間間隔中產生的幀內編碼幀的入口點。
12.根據權利要求1的設備，其中，所述標識裝置標識多個入口點，這些入口點代表視頻圖象中在按指數變化的時間間隔上產生的視頻幀的相應起始部分。
13.一種對數字視頻數據進行編碼的方法，包括以下步驟可變速率編碼數字視頻數據，以產生可變速率的編碼視頻數據；標識選擇的所述編碼視頻數據的多個入口點，這些入口點代表所述數字視頻數據的視頻幀的相應位置，所述視頻幀產生于由所述數字視頻數據代表的視頻圖象中的預定時間間隔；產生確定所標識的入口點在所述數字視頻數據中的位置的入口點數據；將所產生的入口點數據附加至所述的編碼視頻數據；和將具有附加產生的入口點數據的編碼視頻數據記錄至記錄介質上。
14.根據權利要求13的方法，其中，所述可變速率編碼步驟是通過對數字視頻數據進行幀內編碼和幀間編碼實現的，以產生包括幀內編碼幀和幀間編碼幀的所述可變速率編碼視頻數據；和所述標識步驟是通過標識產生于視頻圖象中的預定時間間隔的幀內編碼幀的入口點實現的。
15.根據權利要求14的方法，其中，所述標識步驟是通過標識幀內編碼幀的入口點實現的，此幀在編碼的視頻數據中就時間而言最靠近在所述的視頻圖象中的預定時間間隔之一上產生的一幀，并且產生于所述的預定時間間隔的所述幀不是幀內編碼幀。
16.根據權利要求14的方法，其中，所述附加步驟是通過將相應的入口點數據加至每一幀內編碼幀實現的，所述的相應的入口點數據標識從所述附加相應入口點數據的相應幀內編碼幀起在多個預定時間間隔中產生的幀內編碼幀的入口點。
17.根據權利要求16的方法，其中，所述附加步驟是通過將所述入口點數據加至每一幀內編碼幀的起始部分實現的。
18.根據權利要求16的方法，其中，相應的入口點數據標識位于附加相應入口點數據的幀內編碼幀之前的一個幀內編碼幀的入口點和之后的一個幀內編碼幀的入口點。
19.根據權利要求16的方法，其中，相應的入口點數據標識在所述的附加相應入口點數據的相應幀內編碼幀之后在所述的多個預定的不同時間間隔中產生的幀內編碼幀的入口點。
20.根據權利要求19的方法，其中，相應的入口點數據還標識在所述的附加相應入口點數據的相應幀內編碼幀之前在所述的多個預定的不同時間間隔中產生的幀內編碼幀的入口點。
21.根據權利要求16的方法，其中，所述的多個不同的預定時間間隔對應于1、2和4秒的時間間隔。
22.根據權利要求16的方法，其中，所述的多個不同的預定時間間隔對應于1、3和9秒的時間間隔。
23.根據權利要求16的方法，其中，所述附加步驟是這樣實現的將相應的入口點數據加至選擇的幀內編碼幀，所述的相應的入口點數據標識從所述的附加相應入口點數據的相應幀內編碼幀起在多個第一預定時間間隔中產生的幀內編碼幀的入口點，并且將相應的入口點數據加至其它幀內編碼幀，所述的相應的入口點數據標識從所述的附加相應入口點數據的相應幀內編碼幀起在多個第二預定時間間隔中產生的幀內編碼幀的入口點。
24.根據權利要求13的方法，其中，所述標識步驟是通過標識多個入口點實現的，這些入口點代表視頻圖象中在按指數變化的時間間隔上產生的視頻幀的相應起始部分。
25.一種用于對從記錄介質上再現的可變速率編碼的數字視頻數據進行解碼的設備，包括再現裝置，用于從記錄介質上再現可變速率編碼的數字視頻數據，此數據代表多個連續(xù)的視頻幀并包括標識所述編碼視頻數據的入口點位置的入口點數據，這些入口點數據代表產生于由所述編碼數字視頻數據代表的視頻圖象中的預定時間間隔產生的視頻幀的相應位置；拾取裝置，用于從再現的編碼數字視頻數據中拾取入口點數據；存儲裝置，用于存儲所拾取的入口點數據；控制裝置，用于控制所述再現裝置，以根據存儲在存儲裝置中的入口點數據再現視頻幀；可變速率解碼裝置，用于對再現的可變速率編碼數字視頻數據進行可變速率解碼，以產生解碼的視頻數據；
26.根據權利要求25的設備，其中，所述控制裝置控制所述再現裝置，以連續(xù)地再現視頻幀，這些視頻幀產生于所述視頻圖象中的預定時間間隔中，正如由存儲在存儲裝置中的入口點數據所標識的。
27.根據權利要求25的設備，其中，所述的從所述記錄介質上再現的可變速率編碼數字視頻數據包括幀內編碼幀和幀間編碼幀，每一幀內編碼幀包括標識幀內編碼幀的入口點的相應入口點數據，這些幀內編碼幀產生于從包括所述的相應入口點數據的相應幀內編碼幀起的多個預定時間間隔中；并且所述控制裝置控制所述再現裝置，以再現所述幀內編碼幀之一，并隨后再現由包括在再現的第一幀內編碼幀中的入口點數據標識的所述幀內編碼幀之一。
28.一種用于對從記錄介質上再現的可變速率編碼的數字視頻數據進行解碼的方法，包括以下步驟從記錄介質上再現可變速率編碼的數字視頻數據，此數據代表多個連續(xù)的視頻幀并包括標識所述編碼視頻數據的入口點位置的入口點數據，這些入口點數據代表產生于由所述編碼數字視頻數據代表的視頻圖象中的預定時間間隔的視頻幀的相應位置；從再現的編碼數字視頻數據中拾取入口點數據；將所拾取的入口點數據存儲于存儲器中；根據存儲在存儲裝置中的入口點數據控制所述的可變速率編碼數字視頻數據的再現，以再現特定的視頻幀；和對再現的可變速率編碼數字視頻數據進行可變速率解碼，以產生解碼的視頻數據；
29.根據權利要求28的方法，其中，所述再現步驟是通過連續(xù)地再現視頻幀實現的，這此視頻幀產生于所述視頻圖象中的預定時間間隔中，正如由存儲在存儲裝置中的入口點數據所標識的。
30.根據權利要求28的方法，其中，所述從所述記錄介質上再現的可變速率編碼數字視頻數據包括幀內編碼幀和幀間編碼幀，每一幀內編碼幀包括標識幀內編碼幀的入口點的相應入口點數據，這些幀內編碼幀產生于從包括所述的相應入口點數據的相應幀內編碼幀起的多個預定時間間隔中；并且所述再現步驟是這樣實現的，再現所述幀內編碼幀之一，并隨后再現由包括在再現的第一幀內編碼幀中的入口點數據標識的所述幀內編碼幀之一。
31.一種記錄介質，包括多個長度可變的視頻數據區(qū)，在這些區(qū)中存儲可變的編碼數字視頻數據，所述編碼數字視頻數據包括多個幀內編碼幀和幀間編碼幀，其中每一個存儲于相應的一個視頻數據區(qū)中；和多個入口點數據區(qū)，在這些區(qū)中存儲入口點數據，所述入口點數據標識所述編碼數字視頻數據的入口點位置，這些入口點位置代表存儲幀內編碼幀的視頻數據區(qū)的相應位置，所述幀內編碼幀產生于由所述編碼數字視頻數據代表的視頻圖象中的預定時間間隔中。
32.根據權利要求31的記錄介質，其中，在記錄介質上，各個所述的入口點數據區(qū)緊位于存儲幀內編碼幀的每一所述視頻數據區(qū)之前；所述入口點數據標識幀內編碼幀的入口點，這些幀內編碼幀產生于從位于所述相應各入口點數據之前的幀內編碼幀起的預定時間間隔中。
33.根據權利要求32的記錄介質，其中，相應入口點數據標識視頻數據區(qū)的位置，這些視頻數據區(qū)已存儲了位于緊隨存儲相應入口點數據的入口點數據區(qū)的視頻數據區(qū)之前的一個幀內編碼幀和之后的一個幀內編碼幀。
34.根據權利要求32的記錄介質，其中，相應入口點數據標識視頻數據區(qū)的位置，這些視頻數據區(qū)已存儲了位于緊隨存儲相應入口點數據的入口點數據區(qū)的視頻數據區(qū)中的幀內編碼幀之后產生于所述的多個不同預定時間間隔中的幀內編碼幀。
35.根據權利要求34的記錄介質，其中，相應入口點數據還標識視頻數據區(qū)的位置，這些視頻數據區(qū)已存儲了緊隨存儲相應入口點數據的入口點數據區(qū)的視頻數據區(qū)中的幀內編碼幀之前產生于所述的多個不同預定時間間隔中的幀內編碼幀。
36.一種用于對數字靜止圖象和音頻數據進行編碼的設備，包括可變速率編碼裝置，用于對數字靜止圖象和音頻數據進行編碼，以產生可變速率的編碼視頻數據；標識裝置，用于標識代表靜止圖象在所述編碼數據中的相應位置的入口點；產生裝置，用于產生確定所標識的入口點在所述編碼數據中的位置的入口點數據；附加裝置，用于將所產生的入口點數據加至所述的編碼數據；和記錄裝置，用于將具有附加了產生的入口點數據的編碼數據記錄至記錄介質上。
37.根據權利要求36的設備，其中，所述標識裝置在所述編碼數據中標識音頻入口點，這些入口點代表在預定時間間隔中產生的音頻數據的位置；所述產生裝置產生音頻入口點數據，此數據代表所標識的音頻入口點在所述編碼數據中的位置；和所述附加裝置將所產生的音頻入口點數據加至所述編碼數據。
38.一種用于對數字靜止圖象和音頻數據進行編碼的方法，包括以下步驟可變速率編碼數字靜止圖象和音頻數據，以產生可變速率的編碼數據；標識代表靜止圖象在所述編碼數據中的相應位置的入口點；產生確定所標識的入口點在所述編碼數據中的位置的入口點數據；將所產生的入口點數據加至所述的編碼數據；和將具有附加了產生的產生的入口點數據的編碼數據記錄至記錄介質上。
39.根據權利要求38的方法，其中，所述標識步驟是通過在所述編碼數據中標識音頻入口點實現的，這些入口點代表在預定時間間隔中產生的音頻數據的位置；所述產生步驟是通過產生音頻入口點數據實現的，此數據代表所標識的音頻入口點在所述編碼數據中的位置；和所述附加步驟是通過將所產生的音頻入口點數據加至所述編碼數據實現的。
40.一種用于對可變速率編碼的數字靜止圖象數據進行解碼的設備，包括再現裝置，用于從記錄介質上再現可變速率編碼的數字靜止圖象數據，并包括標識編碼數據的入口點的位置的入口點數據，這些入口點代表靜止圖象在編碼數據中的相應位置；拾取裝置，用于從再現的編碼數據中拾取入口點數據；存儲裝置，用于存儲所拾取的入口點數據；控制裝置，用于控制所述再現裝置，以根據存儲在存儲裝置中的入口點數據再現編碼的靜止圖象；和可變速率解碼裝置，用于對再現的編碼靜止圖象進行解碼，以產生解碼的靜止圖象。
41.一種用于對可變速率編碼的數字靜止圖象數據進行解碼的方法，包括以下步驟從記錄介質上再現可變速率編碼的數字靜止圖象數據，并包括標識編碼數據的入口點的位置的入口點數據，這些入口點數據代表靜止圖象在編碼數據中的相應位置；從再現的編碼數據中拾取入口點數據；將所拾取的入口點數據存儲于存儲器中；控制再現編碼數據根據存儲在存儲裝置中的入口點數據再現編碼的靜止圖象；和可變速率解碼再現的編碼靜止圖象，以產生解碼的靜止圖象。
全文摘要
數字視頻數據編碼器和解碼器能夠以低和高速率地再現可變速率編碼數字視頻數據，在編碼器中，數字視頻數據是可變速率編碼的，選擇的編碼視頻數據的入口點(即起始部分)被標識，其代表在視頻圖象中按預定時間間隔產生的視頻幀，標識這些位置的入口點數據產生并在視頻數據記錄在記錄介質之前附加至編碼視頻數據中，當編碼數據從記錄介質上再現時，入口點數據被拾取和存儲，由所拾取的入口點數據標識的連續(xù)的幀內編碼幀被再現和解碼。
文檔編號H04N7/24GK1152243SQ96112178
公開日1997年6月18日申請日期1996年8月2日優(yōu)先權日1995年8月2日
發(fā)明者藤波靖, 米滿潤, 河村真, 矢ク崎陽一申請人:索尼公司

完整全部詳細技術資料下載