本申請是申請?zhí)枮?01380033192.x的發(fā)明專利申請(國際申請?zhí)枺簆ct/jp2013/060730,申請日:2013年04月09日,發(fā)明名稱:動態(tài)圖像預測編碼及解碼裝置、方法和程序)的分案申請。
本發(fā)明涉及動態(tài)圖像預測編碼裝置、方法和程序以及動態(tài)圖像預測解碼裝置、方法和程序,特別涉及在隨機訪問中有效的畫面間預測的動態(tài)圖像預測編碼裝置、方法和程序以及動態(tài)圖像預測解碼裝置、方法和程序。
背景技術:
為了高效地進行動態(tài)圖像數據的傳送和蓄積使用了壓縮編碼技術。在動態(tài)圖像的情況下,廣泛使用mpeg1~4或h.261~h.264的方式。
在這些編碼方式中,在將作為編碼對象的圖像分割成多個塊后進行編碼/解碼處理。為了提高編碼效率,使用下述的預測編碼方法。在畫面內的預測編碼中,使用位于與對象塊相同的畫面內的相鄰的已再現的圖像信號(對過去已壓縮的圖像數據進行復原后的圖像信號)生成預測信號后,對從對象塊的信號中減去該預測信號而得到的差分信號進行編碼。在畫面間的預測編碼中,參照位于與對象塊不同的畫面內的已再現的圖像信號,檢索信號的位移,對其運動量進行補償而生成預測信號,對從對象塊的信號中減去該預測信號而得到的差分信號進行編碼。將為了進行運動的檢索和補償而參照的已再現的圖像稱為參照圖像。
并且,在雙方向畫面間預測中,有時不僅參照輸出時間順序中位于過去的圖像,還一并參照在對象圖像之后輸出的未來圖像(但是,該未來圖像需要在對象圖像之前編碼并預先再現)。通過對從過去圖像和未來圖像取得的預測信號進行平均化,在隱藏的新出現的物體的信號預測中是有效的,同時,具有減輕兩個預測信號中包含的噪音的效果。
進而,在h.264的畫面間預測編碼中,關于針對對象塊的預測信號,參照過去編碼后進行再現的多個參照圖像,進行運動檢索并選擇誤差最小的圖像信號作為最佳預測信號。求出對象塊的像素信號與該最佳預測信號的差分,實施離散余弦轉換,在進行量化后進行熵編碼。同時,一并對與從哪個參照圖像的哪個區(qū)域取得針對對象塊的最佳預測信號有關的信息(分別稱為參照索引和運動矢量)進行編碼。在h.264中,再現后的4張或5張圖像作為參照圖像存儲在幀存儲器或再現圖像緩存器(decodedpicturebuffer)中。
在畫面間預測編碼中,雖然能夠靈活且高效地對圖像間的相關度進行壓縮編碼,但是,為了能夠通過切換電視頻道而從中途視聽影像節(jié)目,需要切斷畫面間的依存性。在動態(tài)圖像的壓縮比特流中,將畫面間的不存在依存性的部位稱為隨機訪問點(randomaccesspoint)。除了頻道的切換以外,在編集動態(tài)圖像或連接不同動態(tài)圖像的壓縮數據的情況下,也需要隨機訪問點,但是,在現有技術中,設置“完全隨機訪問點(cleanrandomaccesspoint)”作為隨機訪問點。完全隨機訪問點由nalunittype的完全隨機訪問圖片(cleanrandomaccesspicture)(以下稱為cra圖片(crapicture))確定。在一個比特流中,可以包含多個cra圖片,動態(tài)圖像預測解碼裝置可以從某個完全隨機訪問點開始進行解碼。
為了公開發(fā)明,如下定義與cra圖片相關聯的圖片的圖片類型(picturetype)(參照圖10)。
a)過去圖片(pastpicture):在cra圖片之前解碼、且在cra圖片之前輸出的圖片
b)滯后圖片(laggingpicture):在cra圖片之前解碼、但是在cra圖片之后輸出的圖片
c)超前圖片(leadingpicture):在cra圖片之后解碼、但是在cra圖片之前輸出的圖片
d)正常圖片(normalpicture):在.cra圖片之后解碼、且在cra圖片之后輸出的圖片
由于cra圖片定義為僅畫面內預測的圖片,所以,解碼所需要的信息完整,不參照其他圖片就能夠正確解碼。將接在cra圖片之后的全部正常圖片定義為不能根據過去圖片、滯后圖片或超前圖片進行畫面間預測。
在從cra圖片中解碼比特流時,保證以沒有畫面間預測錯誤的方式正確解碼cra圖片和正常圖片。但是,超前圖片在cra圖片之后解碼,不能保證以沒有畫面間預測錯誤的方式正確解碼。即,存在正確解碼的超前圖片,另一方面,也可能存在未正確解碼的超前圖片。
另外,這里,“正確解碼”意味著,解碼后的圖片與不從cra圖片解碼而從比特流始端解碼的情況下得到的圖片相同。在從cra圖片解碼時,在解碼順序中先于該cra圖片的圖片(例如滯后圖片)未解碼,不存在于再現圖像緩存中。因此,將在解碼順序中先于該cra圖片的圖片直接或間接地用于畫面間預測的后續(xù)圖片可能包含解碼錯誤。
現有技術文獻
非專利文獻
非專利文獻1:benjaminbrosset.al.,"highefficiencyvideocoding(hevc)textspecificationdraft7",jointcollaborativeteamonvideocoding(jct-vc)ofitu-tsg16wp3andiso/iecjtc1/sc29/wg11,9thmeeting:geneva,ch,27april-7may2012
技術實現要素:
發(fā)明要解決的課題
如上所述,在動態(tài)圖像預測解碼裝置從隨機訪問點開始進行解碼時,可能存在無法正確解碼的圖片,該無法正確解碼的圖片無法用于以后的解碼。另一方面,也存在能夠正確解碼的圖片,該能夠正確解碼的圖片能夠用于以后的解碼。在現有技術中,沒有用于確定丟棄解碼順序中接著隨機訪問點的哪個圖片的方法,所以,全部超前圖片作為無法正確解碼的圖片而被丟棄。但是,這些圖片中的一部分實際上能夠解碼,能夠有助于改善后續(xù)圖片的預測性能,因此,將全部超前圖片作為無法正確解碼的圖片而丟棄的方法不是優(yōu)選的方法。
因此,本發(fā)明的目的在于,能夠判別可解碼的圖片,由此,能夠利用可解碼的圖片作為后續(xù)圖片的參照圖片,有助于改善預測性能。
用于解決課題的手段
本發(fā)明的一個側面的動態(tài)圖像預測編碼裝置的特征在于,該動態(tài)圖像預測編碼裝置具有:輸入單元,其輸入構成動態(tài)圖像的多個圖像;編碼單元,其利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息和與各圖像的圖片類型有關的信息進行編碼;復原單元,其對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制單元,其判定所述圖片類型,根據判定結果對所述圖像存儲單元進行控制,
所述控制單元對所述圖像賦予標簽,作為以下共計3個類型的圖片中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的一個側面的動態(tài)圖像預測編碼方法由動態(tài)圖像預測編碼裝置執(zhí)行,其特征在于,該動態(tài)圖像預測編碼方法具有以下步驟:輸入步驟,輸入構成動態(tài)圖像的多個圖像;編碼步驟,利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息和與各圖像的圖片類型有關的信息進行編碼;復原步驟,對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲步驟,存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制步驟,判定所述圖片類型,根據判定結果對所述圖像存儲步驟進行控制,
在所述控制步驟中,所述動態(tài)圖像預測編碼裝置對所述圖像賦予標簽作為以下共計3個類型的圖片的中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的一個側面的動態(tài)圖像預測編碼程序的特征在于,該動態(tài)圖像預測編碼程序使計算機作為以下單元發(fā)揮功能:輸入單元,其輸入構成動態(tài)圖像的多個圖像;編碼單元,其利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息和與各圖像的圖片類型有關的信息進行編碼;復原單元,其對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制單元,其判定所述圖片類型,根據判定結果對所述圖像存儲單元進行控制,
所述控制單元對所述圖像賦予標簽作為以下共計3個類型的圖片中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的一個側面的動態(tài)圖像預測解碼裝置的特征在于,該動態(tài)圖像預測解碼裝置具有:輸入單元,其輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據、以及表示各圖像的輸出順序和各圖像的圖片類型的編碼數據;復原單元,其對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像、輸出順序信息、圖片類型信息;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制單元,其根據所述圖片類型對所述復原單元進行控制,
各圖像被賦予標簽而使所述圖片類型成為以下共計3個類型中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼,
在從cra圖片開始進行編碼數據的解碼的情況下,所述復原單元在直到即將進行下一個cra圖片的處理之前的期間內,持續(xù)進行如下這樣的解碼處理:對作為類型2圖片而賦予標簽的圖像進行解碼,跳過作為類型1圖片而賦予了標簽的圖像的解碼。
本發(fā)明的一個側面的動態(tài)圖像預測解碼方法由動態(tài)圖像預測解碼裝置執(zhí)行,其特征在于,該動態(tài)圖像預測解碼方法具有以下步驟:輸入步驟,輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據、以及表示各圖像的輸出順序和各圖像的圖片類型的編碼數據;復原步驟,對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像、輸出順序信息、圖片類型信息;圖像存儲步驟,存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制步驟,根據所述圖片類型對所述復原步驟進行控制,
各圖像被賦予標簽而使所述圖片類型成為以下共計3個類型中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼,
在所述復原步驟中,所述動態(tài)圖像預測解碼裝置在從cra圖片開始進行編碼數據的解碼的情況下,在直到即將進行下一個cra圖片的處理之前的期間內持續(xù)進行如下這樣的解碼處理:對作為類型2圖片而被賦予標簽的圖像進行解碼,跳過作為類型1圖片而被賦予標簽的圖像的解碼。
本發(fā)明的一個側面的動態(tài)圖像預測解碼程序的特征在于,該動態(tài)圖像預測解碼程序使計算機作為以下單元發(fā)揮功能:輸入單元,其輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據、以及表示各圖像的輸出順序和各圖像的圖片類型的編碼數據;復原單元,其對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像、輸出順序信息、圖片類型信息;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制單元,其根據所述圖片類型對所述復原單元進行控制,
各圖像被賦予標簽而使所述圖片類型成為以下共計3個類型中的一個:
1)cra圖片:它的特征是,在從cra圖片開始解碼的情況下,能夠正確解碼接著所述cra圖片的類型2圖片;
2)類型1圖片:其是在與該圖片相關聯的cra圖片之后解碼、在所述cra圖片之前輸出的圖片,為了進行畫面間預測,該類型1圖片具有包含作為類型1圖片而被賦予標簽的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)類型2圖片:其是為了進行畫面間預測而具有參照圖片的列表的圖片,它的特征是,位于該參照圖片的列表中的全部參照圖片作為類型2圖片或cra圖片而被賦予標簽,在與該圖片相關聯的cra圖片以后被解碼,
在從cra圖片開始進行編碼數據的解碼的情況下,所述復原單元在直到即將進行下一個cra圖片的處理之前的期間內持續(xù)進行如下這樣的解碼處理:對作為類型2圖片而被賦予標簽的圖像進行解碼,跳過作為類型1圖片而被賦予標簽的圖像的解碼。
進而,本發(fā)明的動態(tài)圖像預測編碼裝置、方法和程序以及動態(tài)圖像預測解碼裝置、方法和程序也可以采用以下方式。
本發(fā)明的另一個側面的動態(tài)圖像預測編碼裝置的特征在于,該動態(tài)圖像預測編碼裝置具有:輸入單元,其輸入構成動態(tài)圖像的多個圖像;編碼單元,其利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息進行編碼;復原單元,其對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制單元,其對所述圖像存儲單元進行控制,
所述控制單元將所述圖像分類為以下共計3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后解碼,在所述相關聯的cra圖片之前輸出,跳過所述復原單元的解碼處理,不存儲在所述圖像存儲單元中且不輸出,為了進行畫面間預測,該圖片具有包含跳過所述復原單元的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原單元被解碼,根據需要被存儲在所述圖像存儲單元中用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原單元解碼,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的另一個側面的動態(tài)圖像預測編碼方法由動態(tài)圖像預測編碼裝置執(zhí)行,其特征在于,該動態(tài)圖像預測編碼方法具有以下步驟:輸入步驟,輸入構成動態(tài)圖像的多個圖像;編碼步驟,利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息進行編碼;復原步驟,對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲步驟,存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制步驟,對所述圖像存儲步驟進行控制,
在所述控制步驟中,所述動態(tài)圖像預測編碼裝置將所述圖像分類為以下共計3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后被解碼,在所述相關聯的cra圖片之前被輸出,跳過所述復原步驟的解碼處理,在所述圖像存儲步驟中不存儲且不輸出,該圖片為了進行畫面間預測而具有包含跳過所述復原步驟的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原步驟被解碼,根據需要在所述圖像存儲步驟中被存儲用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原步驟解碼,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的另一個側面的動態(tài)圖像預測編碼程序的特征在于,該動態(tài)圖像預測編碼程序使計算機作為以下單元發(fā)揮功能:輸入單元,其輸入構成動態(tài)圖像的多個圖像;編碼單元,其利用畫面內預測或畫面間預測中的任意一個方法對所述圖像進行編碼,生成包含作為隨機訪問點的圖像的壓縮圖像數據,并且,對各圖像的輸出順序信息進行編碼;復原單元,其對所述壓縮圖像數據進行解碼,將其復原為再現圖像;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行編碼的參照圖像;以及控制單元,其對所述圖像存儲單元進行控制,
所述控制單元將所述圖像分類為以下3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后解碼,在所述相關聯的cra圖片之前輸出,跳過所述復原單元的解碼處理,不存儲在所述圖像存儲單元中且不輸出,該圖片為了進行畫面間預測而具有包含跳過所述復原單元的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原單元被解碼,根據需要被存儲在所述圖像存儲單元中用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原單元被解碼,在與該圖片相關聯的cra圖片以后被解碼。
本發(fā)明的另一個側面的動態(tài)圖像預測解碼裝置的特征在于,該動態(tài)圖像預測解碼裝置具有:輸入單元,其輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據以及表示各圖像的輸出順序的編碼數據;復原單元,其對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像和輸出順序信息;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制單元,其對所述復原單元進行控制,
所述控制單元將所述圖像分類為以下3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后解碼,在所述相關聯的cra圖片之前輸出,跳過所述復原單元的解碼處理,不存儲在所述圖像存儲單元中且不輸出,為了進行畫面間預測,該圖片具有包含跳過所述復原單元的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原單元被解碼,根據需要存儲在所述圖像存儲單元中用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原單元被解碼,在與該圖片相關聯的cra圖片以后被解碼,
在與該圖片相關聯的cra圖片處開始進行編碼數據的解碼的情況下,所述復原單元判定位于與該圖片有關的參照圖片的列表中的全部參照圖片是否存儲在所述圖像存儲單元中,在直到即將進行下一個cra圖片的處理之前的期間內,持續(xù)進行如下這樣的解碼處理:如果存儲了位于參照圖片的列表中的全部參照圖片則對該圖片進行解碼,如果未存儲位于參照圖片的列表中的1個以上的參照圖片則跳過該圖片的解碼。
本發(fā)明的另一個側面的動態(tài)圖像預測解碼方法由動態(tài)圖像預測解碼裝置執(zhí)行,其特征在于,該動態(tài)圖像預測解碼方法具有以下步驟:輸入步驟,輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據以及表示各圖像的輸出順序的編碼數據;復原步驟,對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像和輸出順序信息;圖像存儲步驟,存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制步驟,對所述復原步驟進行控制,
在所述控制步驟中,所述動態(tài)圖像預測解碼裝置將所述圖像分類為以下3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后解碼,在所述相關聯的cra圖片之前輸出,跳過所述復原步驟的解碼處理,在所述圖像存儲步驟中不存儲且不輸出,為了進行畫面間預測,該圖片具有包含跳過所述復原步驟的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原步驟被解碼,根據需要在所述圖像存儲步驟中進行存儲以用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原步驟被解碼,在與該圖片相關聯的cra圖片以后被解碼,
在所述復原步驟中,在與該圖片相關聯的cra圖片處開始進行編碼數據的解碼的情況下,所述動態(tài)圖像預測解碼裝置判定在所述圖像存儲步驟中是否存儲了位于與該圖片有關的參照圖片的列表中的全部參照圖片,在直到即將進行下一個cra圖片的處理之前的期間內持續(xù)進行如下這樣的解碼處理:如果存儲了位于參照圖片的列表中的全部參照圖片則對該圖片進行解碼,如果未存儲位于參照圖片的列表中的1個以上的參照圖片則跳過該圖片的解碼。
本發(fā)明的另一個側面的動態(tài)圖像預測解碼程序的特征在于,該動態(tài)圖像預測解碼程序使計算機作為以下單元發(fā)揮功能:輸入單元,其輸入通過對構成動態(tài)圖像的多個圖像進行基于畫面內預測或畫面間預測中的任意一方的編碼而得到的包含隨機訪問圖像的壓縮圖像數據以及表示各圖像的輸出順序的編碼數據;復原單元,其對所述壓縮圖像數據和所述編碼數據進行解碼,將其復原為再現圖像和輸出順序信息;圖像存儲單元,其存儲1個以上的所述再現圖像作為用于對后續(xù)圖像進行解碼的參照圖像;以及控制單元,其對所述復原單元進行控制,
所述控制單元將所述圖像分類為以下共計3種圖片并進行控制:
1)cra圖片,從該cra圖片開始編碼數據的解碼;
2)這樣的圖片:該圖片在與該圖片相關聯的cra圖片之后解碼,在所述相關聯的cra圖片之前輸出,跳過所述復原單元的解碼處理,不存儲在所述圖像存儲單元中且不輸出,為了進行畫面間預測,該圖片具有包含跳過所述復原單元的解碼處理的至少1個參照圖片或在解碼順序中先于所述相關聯的cra圖片的至少1個參照圖片在內的參照圖片的列表;
3)這樣的圖片:該圖片通過所述復原單元被解碼,根據需要被存儲在所述圖像存儲單元中用于進行參照,該圖片的特征是,該圖片為了進行畫面間預測而具有參照圖片的列表,位于該參照圖片的列表中的全部參照圖片通過所述復原單元被解碼,在與該圖片相關聯的cra圖片以后被解碼,
在與該圖片相關聯的cra圖片處開始進行編碼數據的解碼的情況下,所述復原單元判定位于與該圖片有關的參照圖片的列表中的全部參照圖片是否存儲在所述圖像存儲單元中,在直到即將進行下一個cra圖片的處理之前的期間內持續(xù)進行如下這樣的解碼處理:如果存儲了位于參照圖片的列表中的全部參照圖片則對該圖片進行解碼,如果未存儲位于參照圖片的列表中的1個以上的參照圖片則跳過該圖片的解碼。
本發(fā)明提供一種一種動態(tài)圖像預測解碼裝置,其特征在于,該動態(tài)圖像預測解碼裝置具有:
輸入單元,其輸入包含具有nal單元類型的信息的壓縮圖像數據在內的比特流,所述nal單元類型的信息用于針對每個圖片將該圖片識別為包含隨機訪問圖片、ras超前圖片、non-ras超前圖片在內的多個圖片類型中的一個,所述圖片是用于構成動態(tài)圖像的多個圖片的壓縮圖像數據,ras超前圖片即隨機訪問跳過超前圖片,non-ras超前圖片即非隨機訪問跳過超前圖片;
復原單元,其根據所述圖片類型,對所述壓縮圖像數據進行解碼,將其復原為再現圖像;以及
輸出單元,其輸出所述再現圖像,
關于所述隨機訪問圖片,當從所述比特流的任意隨機訪問圖片開始的解碼過程是從該隨機訪問圖片開始的情況下,所述隨機訪問圖片是解碼順序中的所述比特流的最初圖片;
所述ras超前圖片是在輸出順序中先于相關聯的隨機訪問圖片的圖片,且是當相關聯的隨機訪問圖片在解碼順序中為所述比特流的最初圖片的情況下無法解碼的圖片;
所述non-ras超前圖片是在輸出順序中先于相關聯的隨機訪問圖片的圖片,且是能夠解碼的圖片,
在第2隨機訪問圖片在第1隨機訪問圖片之后被解碼的情況下,所述第2隨機訪問圖片的參考圖片組也不包含在解碼順序中先于所述第1隨機訪問圖片的任意圖片,
在相關聯的隨機訪問圖片是解碼順序中的所述比特流的最初圖片的情況下,不輸出ras超前圖片。
本發(fā)明提供一種一種由動態(tài)圖像預測解碼裝置執(zhí)行的動態(tài)圖像預測解碼方法,其特征在于,該動態(tài)圖像預測解碼方法包括以下步驟:
輸入步驟,輸入包含具有nal單元類型的信息的壓縮圖像數據在內的比特流,所述nal單元類型的信息用于針對每個圖片將該圖片識別為包含隨機訪問圖片、ras超前圖片、non-ras超前圖片在內的多個圖片類型中的一個,所述圖片是用于構成動態(tài)圖像的多個圖片的壓縮圖像數據,ras超前圖片即隨機訪問跳過超前圖片,non-ras超前圖片即非隨機訪問跳過超前圖片;
復原步驟,根據所述圖片類型,對所述壓縮圖像數據進行解碼,將其復原為再現圖像;以及
輸出步驟,輸出所述再現圖像,
關于所述隨機訪問圖片,當從所述比特流的任意隨機訪問圖片開始的解碼過程是從該隨機訪問圖片開始的情況下,所述隨機訪問圖片是解碼順序中的所述比特流的最初圖片;
所述ras超前圖片是在輸出順序中先于相關聯的隨機訪問圖片的圖片,且是當相關聯的隨機訪問圖片在解碼順序中為所述比特流的最初圖片的情況下無法解碼的圖片;
所述non-ras超前圖片是在輸出順序中先于相關聯的隨機訪問圖片的圖片,且是能夠解碼的圖片,
在第2隨機訪問圖片在第1隨機訪問圖片之后被解碼的情況下,所述第2隨機訪問圖片的參考圖片組也不包含在解碼順序中先于所述第1隨機訪問圖片的任意圖片,
在相關聯的隨機訪問圖片是解碼順序中的所述比特流的最初圖片的情況下,不輸出ras超前圖片。
發(fā)明效果
根據本發(fā)明,能夠判別可解碼的圖片,由此,能夠利用可解碼的圖片作為后續(xù)圖片的參照圖片,有助于改善預測性能。更詳細地講,動態(tài)圖像預測解碼裝置在從比特流的開頭的cra圖片開始解碼的情況下,(通過利用標簽或與參考圖片組進行核對)能夠檢測是否能夠正確解碼某個圖片。因此,在動態(tài)圖像預測解碼裝置中,代替丟棄全部超前圖片,可以僅選擇無法解碼的圖片進行丟棄,能夠將可解碼的圖片用作后續(xù)圖片的參照圖片,有助于改善預測性能。
附圖說明
圖1是示出本發(fā)明的實施方式的動態(tài)圖像預測編碼裝置的框圖。
圖2是示出本發(fā)明的實施方式的動態(tài)圖像預測解碼裝置的框圖。
圖3是用于說明本發(fā)明的實施方式的語法要素(syntaxelement)的圖。
圖4是示出本發(fā)明的實施方式的動態(tài)圖像預測編碼方法的流程圖。
圖5是示出本發(fā)明的實施方式的動態(tài)圖像預測解碼方法的流程圖。
圖6是示出用于執(zhí)行記錄介質中記錄的程序的計算機的硬件結構的圖。
圖7是用于執(zhí)行記錄介質中記錄的程序的計算機的概觀圖。
圖8是示出動態(tài)圖像預測編碼程序的結構例的框圖。
圖9是示出動態(tài)圖像預測解碼程序的結構例的框圖。
圖10是用于說明本發(fā)明的背景的圖。
具體實施方式
下面,使用圖1~圖9對本發(fā)明的實施方式進行說明。
[動態(tài)圖像預測編碼裝置]
圖1是示出本實施方式的動態(tài)圖像預測編碼裝置100的結構的功能框圖。如圖1所示,作為功能性結構,動態(tài)圖像預測編碼裝置100具有輸入端子101、塊分割器102、預測信號生成器103、幀存儲器104、減法器105、轉換器106、量化器107、逆量化器108、逆轉換器109、加法器110、熵編碼器111、輸出端子112、輸入端子113和幀存儲器管理器(或者也稱為緩存管理器)114。各功能塊的動作在后述動態(tài)圖像預測編碼裝置100的動作中進行說明。另外,轉換器106和量化器107對應于編碼單元,逆量化器108、逆轉換器109和加法器110對應于解碼單元。
下面,敘述如上所述構成的動態(tài)圖像預測編碼裝置100的動作。由多張圖像構成的動態(tài)圖像的信號被輸入到輸入端子101。利用塊分割器102將作為編碼處理對象的圖像分割成多個區(qū)域。在本實施方式中,分割成由8×8像素構成的塊,但是,也可以分割成除此以外的塊的大小或形狀。接著,針對作為編碼處理對象的區(qū)域(以下稱為“對象塊”)生成預測信號。在本實施方式中,使用2種預測方法。即,畫面間預測和畫面內預測。
在畫面間預測中,將過去編碼后進行了復原的再現圖像作為參照圖像,根據該參照圖像求出給出相對于對象塊的誤差最小的預測信號的運動信息。該處理被稱為運動檢測。并且,根據情況,也可以對對象塊進行再分割,針對再分割后的小區(qū)域來決定畫面間預測方法。該情況下,從各種分割方法中決定相對于對象塊全體的效率最高的分割方法和各自的運動信息。在本發(fā)明的實施方式中,由預測信號生成器103來進行,經由線l102輸入對象塊,經由l104輸入參照圖像。作為參照圖像,使用過去被編碼并復原的多個圖像作為參照圖像。詳細情況與作為現有技術的mpeg-2、4、h.264中的任意一個方法相同。這樣決定的運動信息和小區(qū)域的分割方法經由線l112被送到熵編碼器111進行編碼后,從輸出端子112被送出。并且,與從多個參照圖像中的哪個參照圖像取得預測信號有關的信息(參考索引(referenceindex))也經由線l112被送出到熵編碼器111。另外,在本發(fā)明的實施方式中,將4張或5張再現圖像存儲在幀存儲器104中用作參照圖像。在預測信號生成器103中,根據與小區(qū)域的分割方法和各個小區(qū)域對應的參照圖像和運動信息,從幀存儲器104取得參照圖像信號并生成預測信號。這樣生成的畫面間預測信號經由線l103送到減法器105。
在畫面內預測中,使用空間上與對象塊相鄰的已再現的像素值生成畫面內預測信號。具體而言,在預測信號生成器103中,從幀存儲器104取得位于相同畫面內的已再現的像素信號,通過對這些信號進行外插,生成畫面內預測信號。與外插方法有關的信息經由線l112被送到熵編碼器111進行編碼后,從輸出端子112送出。這樣生成的畫面內預測信號被送到減法器105。預測信號生成器103中的畫面內預測信號的生成方法與作為現有技術的h.264的方法相同。針對如上所述求出的畫面間預測信號和畫面內預測信號,選擇誤差最小的信號并送到減法器105。
關于第一張圖像,由于之前不存在圖像,所以,通過畫面內預測對全部對象塊進行處理。并且,在電視頻道的切換中,定期通過畫面內預測對作為隨機訪問點的對象塊進行畫面內預測。這種圖像被稱為內幀,在h.264中稱為idr圖片。
利用減法器105從對象塊的信號(經由線l102)中減去預測信號(經由線l103),生成殘差信號。利用轉換器106對該殘差信號進行離散余弦轉換,利用量化器107對其各系數進行量化。最后,利用熵編碼器111對量化后的轉換系數進行編碼,與和預測方法有關的信息一起由輸出端子112送出。
為了對后續(xù)對象塊進行畫面內預測或畫面間預測,對壓縮后的對象塊的信號進行逆處理并復原。即,利用逆量化器108對量化后的轉換系數進行逆量化后,利用逆轉換器109進行逆離散余弦轉換,對殘差信號進行復原。利用加法器110對復原后的殘差信號和從線l103送來的預測信號進行相加,對對象塊的信號進行再現,將其存儲在幀存儲器104中。在本實施方式中使用轉換器106和逆轉換器109,但是,也可以代替這些轉換器而使用其他轉換處理。根據情況,也可以不具有轉換器106和逆轉換器109。
幀存儲器104是有限的,不可能存儲全部再現圖像。僅將后續(xù)圖像的編碼所使用的再現圖像存儲在幀存儲器104中。幀存儲器管理器114對該幀存儲器104進行控制。幀存儲器管理器114經由線l115進行控制,以使得能夠從位于幀存儲器104內的n張(這里n=4,但是也可以是預先決定的整數)再現圖像中刪除不需要的再現圖像(例如最早的再現圖像),存儲用作參照圖像的最近的再現圖像。從輸入端子113經由線l112輸入各圖像的輸出順序信息、對圖像進行編碼的類型(畫面內預測編碼、畫面間預測編碼、雙方向預測編碼)以及參考索引,幀存儲器管理器114根據這些信息進行動作。
同時,根據需要,各圖像的輸出順序信息、后述nal單元類型的信息經由線l114送到熵編碼器111進行編碼后,與壓縮后的圖像數據一起輸出。輸出順序信息附加在各圖像中,可以是表示圖像順序的信息或輸出圖像的時刻,也可以是圖像的輸出參照時間(暫時參考)。在本實施方式中,將輸出順序信息的值直接轉換為二值編碼。本實施方式的幀存儲器管理器114的動作在后面敘述。
[動態(tài)圖像預測解碼裝置]
接著,對本發(fā)明的動態(tài)圖像預測解碼裝置進行說明。圖2是示出本實施方式的動態(tài)圖像預測解碼裝置200的結構的功能框圖。如圖2所示,作為功能性結構,動態(tài)圖像預測解碼裝置200具有輸入端子201、數據解析器202、逆量化器203、逆轉換器204、加法器205、預測信號生成器208、幀存儲器207、輸出端子206、幀存儲器管理器209、控制器210和切換器211。各功能塊的動作在后述動態(tài)圖像預測解碼裝置200的動作中進行說明。逆量化器203和逆轉換器204對應于解碼單元。另外,作為解碼的單元,不限于逆量化器203和逆轉換器204,也可以使用它們以外的部件。并且,解碼的單元也可以不具有逆轉換器204而僅由逆量化器203構成。
下面敘述動態(tài)圖像預測解碼裝置200的動作。從輸入端子201輸入由動態(tài)圖像預測編碼裝置100利用上述方法進行壓縮編碼后的壓縮數據。在該壓縮數據中包含有對將圖像分割成多個塊而得到的對象塊進行預測并編碼的殘差信號和與預測信號的生成相關聯的信息。作為與預測信號的生成相關聯的信息,在畫面間預測的情況下,包含有與塊分割有關的信息(塊的尺寸)、運動信息、與上述參考索引和nal單元類型有關的信息,在畫面內預測的情況下,包含有與從周邊的已再現的像素進行外插的外插方法有關的信息。
利用數據解析器202,從壓縮數據中提取對象塊的殘差信號、與預測信號的生成相關聯的信息、量化參數、圖像的輸出順序信息。利用逆量化器203,根據量化參數(經由線l202和l211)對對象塊的殘差信號進行逆量化。利用逆轉換器204對其結果進行逆離散余弦轉換。
接著,經由線l206b將與預測信號的生成相關聯的信息送到預測信號生成器208。在預測信號生成器208中,根據與預測信號的生成相關聯的信息訪問幀存儲器207,從多個參照圖像中取得參照信號(經由線l207),生成預測信號。該預測信號經由線l208送到加法器205,與復原后的殘差信號進行相加,對對象塊信號進行再現,經由線l205從輸出端子206被輸出,同時被存儲在幀存儲器207中。
在幀存儲器207中存儲有后續(xù)圖像的解碼/再現中使用的再現圖像。幀存儲器管理器209經由線l209a控制幀存儲器207。幀存儲器207進行控制,以使得能夠從所存儲的n張(這里n=4,但是也可以是預先決定的整數)再現圖像中刪除不需要的再現圖像(例如最早的再現圖像),存儲用作參照圖像的最近的再現圖像。
控制器210根據經由線l206a送來的對象圖像的輸出順序信息、圖像的編碼類型和與nal單元類型有關的信息進行動作?;蛘?,根據經由線l206a送來的參考索引和經由線l209b送來的幀存儲器中存儲的幀的信息進行動作。本發(fā)明的控制器210的動作在后面敘述。
從控制器210經由線l210控制切換器211,該切換器211以根據條件而跳過特定幀的解碼的方式進行動作。本發(fā)明的切換器211的動作在后面敘述。
圖3示出比特流的語法要素500。比特流的語法要素500由一個圖片(510、520等)的解碼所需要的多個語法要素構成。在圖片的語法中,關注以下的3個要素。
1)網絡適配層單元類型(nut)或nal單元類型(530)
2)圖片輸出計數(poc)(540)
3)參考圖片組(rps)(550)
1)nut包含與圖片類型有關的信息。在本發(fā)明中,希望留意到還可以使用對圖片類型進行信號化的其他單元。在本實施方式中,各圖片作為3種nal單元類型中的一方被賦予標簽。nal單元類型是指以下所述的ras、cra、non-ras。
作為ras(隨機訪問跳過(randomaccessskip))圖片而賦予標簽的圖片在從與該ras圖片相關聯的cra圖片開始解碼時跳過而不輸出。另一方面,在所述cra圖片不是比特流的最初圖片的情況下(或者不是從所述cra圖片開始解碼的情況下),動態(tài)圖像預測解碼裝置200將ras圖片視為non-ras圖片,根據該圖片的輸出指示進行解碼并輸出。
作為cra(完全隨機訪問)圖片而賦予標簽的圖片表示,在從該cra圖片開始進行比特流的解碼的情況下,能夠沒有錯誤地對與所述cra圖片相關聯的ras圖片以外的圖片進行解碼。
作為non-ras圖片而賦予標簽的圖片被動態(tài)圖像預測解碼裝置200解碼,根據圖片的輸出指示進行輸出。只要沒有特別說明,則cra圖片視為non-ras圖片。
2)poc包含所輸出的圖片的順序信息。
3)rps包含當前圖片的畫面間預測中使用的參照圖片的信息。對于當前圖片或任意一個圖片來說,rps中不存在的再現圖像緩存(dpb)中的參照圖片無法用作預測解碼用的參照圖片。
在本實施方式中,在從cra圖片開始進行比特流的解碼的情況下,保證能夠正確解碼全部non-ras圖片,所以,rps具有以下特征。
特征1:關于超前圖片所利用的rps,一個以上的參照圖片(或至少一個參照圖片)為ras圖片,或者,在解碼順序中先于相關聯的cra圖片的情況下,設該超前圖片為ras圖片。
特征2:位于non-ras圖片所利用的rps中的全部參照圖片是作為non-ras圖片的參照圖片、并且是相關聯的cra圖片以后解碼的參照圖片。
在本實施方式中,由于正常圖片作為non-ras圖片進行處理,所以,不滿足特征1和2的圖片在比特流中是不容許的。但是,本發(fā)明不限于特征1所述的超前圖片,能夠等效應用于全部圖片。關于特征2,本發(fā)明還能夠應用于參照圖片僅限制為超前圖片的情況。
[動態(tài)圖像預測編碼裝置100中的特征性動作]
使用圖4,對用于生成具有本發(fā)明點即所述特征的比特流的動態(tài)圖像預測編碼裝置100的動作進行說明。動態(tài)圖像預測編碼裝置100為了實現隨機訪問而以一定周期插入cra圖片。在插入下一個cra圖片之前的期間中,編碼順序中接著該插入的cra圖片的全部圖片與該插入的cra圖片相關聯,根據以下步驟進行編碼。
在步驟620中,判定該圖片的rps中包含的1張以上的參照圖片是否是ras圖片。在該圖片的rps中包含的1張以上的參照圖片是ras圖片的情況下(是),進入步驟650,不是這樣的情況下(否),進入步驟630。
在步驟630中,判定該圖片的rps中包含的1張以上的參照圖片是否在編碼順序中先于與該圖片相關聯的cra圖片。在該圖片的rps中包含的1張以上的參照圖片在編碼順序中先于與該圖片相關聯的cra圖片的情況下(是),進入步驟650,不是這樣的情況下(否),進入步驟640。
在步驟650中,通過對該圖片的poc和與該圖片相關聯的cra圖片的poc進行比較,檢查該圖片是否是超前圖片。在該圖片的poc小于與該圖片相關聯的cra圖片的poc的情況下,判定為該圖片是超前圖片(是),進入步驟670。不是這樣的情況下,判定為該圖片不是超前圖片(否),但是,步驟620和步驟630的判定僅針對超前圖片為(是),該圖片不是超前圖片(否)這樣的判定結果是異常的,所以,進入步驟660,輸出錯誤消息,進入步驟680。另外,也可以在步驟660中輸出錯誤消息后,設圖4的處理異常結束。
在步驟670中,該圖片作為ras圖片進行編碼,對該圖片是ras圖片這樣的信息(nal單元類型:ras)進行編碼。然后進入步驟680。
在步驟640中,將該圖片作為non-ras圖片進行編碼,對該圖片是non-ras圖片這樣的信息(nal單元類型:non-ras)進行編碼。然后進入步驟680。這里,只要沒有特別說明,則cra圖片包含在non-ras圖片中。
在步驟640和670中,不是必須對該圖片是ras圖片還是non-ras圖片這樣的信息進行編碼,代替對該信息進行編碼,也可以通過對各圖片的參照圖片列表和幀存儲器104中存儲的圖片進行核對,判定該圖片是ras圖片還是non-ras圖片。
在步驟680中,動態(tài)圖像預測編碼裝置100判定是否還存在要編碼的圖片,在存在的情況下(是),返回步驟620,重復進行處理,另一方面,在不存在的情況下(否),結束圖4的處理。
上述一連串處理相當于圖1的動態(tài)圖像預測編碼裝置100整體的處理,但是,特別是步驟620、630、650的判定處理由幀存儲器管理器114進行。
[動態(tài)圖像預測解碼裝置200中的特征性動作]
在本實施方式的動態(tài)圖像預測解碼裝置200中,在作為比特流的最初圖片而從cra圖片開始解碼過程的情況下、以及比特流的最初圖片不是cra圖片的情況下,動作不同。在下一個cra圖片的解碼時,該解碼過程返回通常的解碼過程。
使用圖5,說明用于對具有本發(fā)明點即所述特征的比特流進行解碼的動態(tài)圖像預測解碼裝置200的動作。
在步驟710中,動態(tài)圖像預測解碼裝置200根據nal單元類型來判定比特流的最初圖片(即開始進行比特流的解碼的最初圖片)是否是cra圖片。在最初圖片不是cra圖片的情況下(否),進入步驟780,動態(tài)圖像預測解碼裝置200如通常那樣對各圖片進行解碼。即,在該步驟780中,ras圖片被視為non-ras圖片,如通常那樣根據圖片內的指示進行解碼并輸出。另一方面,在步驟710中比特流的最初圖片是cra圖片的情況下(是),進入步驟720。
在下一個cra圖片的解碼開始之前的期間內,針對全部圖片反復執(zhí)行步驟720~步驟770的處理,然后,在步驟780中返回通常的解碼處理。下面,敘述步驟720~步驟770的處理。
在步驟720中,動態(tài)圖像預測解碼裝置200在該圖片的解碼開始時判定是否正確解碼該圖片。由于本實施方式中的比特流具有所述特征1、2,所以,動態(tài)圖像預測解碼裝置200能夠使用以下2個方法中的至少1個方法來判定是否能夠正確解碼該圖片。第1方法是觀察該圖片的nal單元類型的標簽的方法。如果該圖片作為ras圖片而賦予標簽,則可以判定為無法正確解碼該圖片。第2方法是由動態(tài)圖像預測解碼裝置200對dpb中存在的參照圖片和該圖片的rps的參照圖片列表進行核對。如果位于該圖片的rps中的參照圖片中的任意一方不存在于dpb中,則可以判定為無法正確解碼該圖片。使用以上的第1、第2方法中的至少1個方法,動態(tài)圖像預測解碼裝置200在判定為能夠正確解碼該圖片的情況下(是),進入步驟730,在判定為無法正確解碼該圖片的情況下(否),進入步驟750。
在步驟730中,動態(tài)圖像預測解碼裝置200根據該圖片內的指示,對該圖片進行解碼并輸出。這也應用于cra圖片。然后進入步驟740。
在步驟750中,通過對該圖片的poc和與該圖片相關聯的cra圖片的poc進行比較,判定該圖片是否是超前圖片。在該圖片的poc小于與該圖片相關聯的cra圖片的poc的情況下(是),判定為該圖片是超前圖片,進入后述步驟770。在不是這樣的情況下(否),該圖片不是超前圖片,產生錯誤,所以進入步驟760,動態(tài)圖像預測解碼裝置200輸出錯誤消息,進入步驟740。另外,也可以在步驟760中輸出錯誤消息后,設圖5的處理異常結束。并且,如上所述,希望留意的是,只在特征1僅限定為超前圖片的情況下需要進行步驟750的判定。
在步驟770中,動態(tài)圖像預測解碼裝置200跳過該圖片的解碼,進行以下的必要的內務(housekeeping)處理。這里,作為必要的內務處理,例如舉出針對跳過的該圖片賦予表示“不能用作參照圖片,不輸出”的標簽的處理等。然后進入步驟740。
在步驟740中,動態(tài)圖像預測解碼裝置200判定下一個解碼的圖片是否是cra圖片,在下一個圖片不是cra圖片的情況下(否),返回步驟720,重復進行處理。另一方面,在下一個圖片是cra圖片的情況下(是),下一個cra圖片以后不需要本發(fā)明的解碼過程(隨機訪問解碼過程),所以進入步驟780,轉移到通常的解碼過程(對全部圖片進行解碼并根據輸出指示信息進行輸出的處理)。
上述一連串處理相當于圖2的動態(tài)圖像預測解碼裝置200整體的處理,但是,特別是步驟720、750的判定和步驟730、770的控制由控制器210進行。
根據以上的本實施方式,動態(tài)圖像預測解碼裝置200在從比特流的開頭的cra圖片開始解碼的情況下,(通過利用標簽或與參考圖片組進行核對)能夠檢測是否能夠正確解碼某個圖片。因此,在動態(tài)圖像預測解碼裝置200中,代替丟棄全部超前圖片,能夠僅選擇無法解碼的圖片進行丟棄,可解碼的圖片可以用作后續(xù)圖片的參照圖片,有助于改善預測性能。
另外,在對圖片分配ras這樣的nal單元類型時,動態(tài)圖像預測編碼裝置100生成能夠正確解碼的圖片和無法正確解碼的圖片。另一方面,動態(tài)圖像預測解碼裝置200不輸出無法正確解碼的圖片。由此,在所輸出的圖片中產生時間上的間隙(gap),有可能對幀的輸出率造成影響。對于系統(tǒng)來說,在輸出中存在間隙是不期望的。在本實施方式中,作為追加信息,動態(tài)圖像預測編碼裝置100通過cra圖片標題或視頻可用語法(videousabilitysyntax)(yui)中的標志對動態(tài)圖像預測解碼裝置200指示這些ras圖片中是否存在間隙。接收到該標志的動態(tài)圖像預測解碼裝置200可以選擇是否輸出能夠正確解碼但是存在間隙的超前圖片。
并且,作為與上述不同的手段,也可以進一步對比特流設置限制,以使得在輸出順序中先于cra圖片的ras圖片中不產生間隙。即,可以連續(xù)輸出比特流,以使得在ras圖片中不產生間隙。
進而,作為不同的手段,動態(tài)圖像預測解碼裝置200也可以不依存于來自動態(tài)圖像預測編碼裝置100的其他追加信息或圖片的輸出指示信息,而決定對non-ras的超前圖片進行解碼,但是不輸出。
在本實施方式中,通過動態(tài)圖像預測解碼裝置200檢測并使用nal單元類型(ras、cra、non-ras)的標簽,但是,在網絡內的其他裝置(例如服務器、適當的網絡要素等)中,也可以在從隨機訪問點開始解碼時,為了執(zhí)行丟棄ras圖片的處理而檢測并使用nal單元類型的標簽。由此,能夠節(jié)約網絡帶寬。
在本實施方式中,比特流可以分別包含多個cra圖片,存在與各個cra圖片相關聯的ras圖片。在解碼順序中第2個cra圖片接著第1個cra圖片之后的情況下,不容許所述第2個cra圖片的rps包含在第1個cra圖片之前解碼的參照圖片。由此,在第1個cra圖片是比特流的最初圖片的情況下,保證第2個cra圖片的ras圖片被解碼。
[動態(tài)圖像預測編碼程序、動態(tài)圖像預測解碼程序]
動態(tài)圖像預測編碼裝置100的發(fā)明可以掌握為用于使計算機作為動態(tài)圖像預測編碼裝置100發(fā)揮功能的動態(tài)圖像預測編碼程序的發(fā)明。同樣,動態(tài)圖像預測解碼裝置200的發(fā)明可以掌握為用于使計算機作為動態(tài)圖像預測解碼裝置200發(fā)揮功能的動態(tài)圖像預測解碼程序的發(fā)明。
動態(tài)圖像預測編碼程序和動態(tài)圖像預測解碼程序例如存儲在記錄介質中來提供。另外,作為記錄介質,例示了軟盤、cd-rom、usb存儲器、dvd、半導體存儲器等。
圖8示出用于使計算機作為動態(tài)圖像預測編碼裝置100發(fā)揮功能的動態(tài)圖像預測編碼程序的模塊。如圖8所示,動態(tài)圖像預測編碼程序p100具有輸入模塊p101、編碼模塊p102、復原模塊p103、圖像存儲模塊p104和控制模塊p105。
并且,圖9示出用于使計算機作為動態(tài)圖像預測解碼裝置200發(fā)揮功能的動態(tài)圖像預測解碼程序的模塊。如圖9所示,動態(tài)圖像預測解碼程序p200具有輸入模塊p201、復原模塊p202、圖像存儲模塊p203和控制模塊p204。
如上所述構成的動態(tài)圖像預測編碼程序p100和動態(tài)圖像預測解碼程序p200能夠存儲在圖6和圖7所示的記錄介質10中,由后述計算機30執(zhí)行。
圖6是示出用于執(zhí)行記錄介質中記錄的程序的計算機的硬件結構的圖,圖7是用于執(zhí)行記錄介質中記錄的程序的計算機的概觀圖。作為計算機,包含具有cpu且進行基于軟件的處理和控制的dvd播放器、機頂盒、便攜電話等。
如圖6所示,計算機30具有軟盤驅動裝置、cd-rom驅動裝置、dvd驅動裝置等讀取裝置12、使操作系統(tǒng)常駐的作業(yè)用存儲器(ram)14、存儲記錄介質10中存儲的程序的存儲器16、稱為顯示器的顯示裝置18、作為輸入裝置的鼠標20和鍵盤22、用于進行數據等的收發(fā)的通信裝置24、以及對程序的執(zhí)行進行控制的cpu26。當記錄介質10插入讀取裝置12中時,計算機30能夠從讀取裝置12訪問記錄介質10中存儲的動態(tài)圖像預測編碼程序,通過執(zhí)行該動態(tài)圖像預測編碼程序,能夠作為本發(fā)明的動態(tài)圖像預測編碼裝置進行動作。同樣,當記錄介質10插入讀取裝置12中時,計算機30能夠從讀取裝置12訪問記錄介質10中存儲的動態(tài)圖像預測解碼程序,通過執(zhí)行該動態(tài)圖像預測解碼程序,能夠作為本發(fā)明的動態(tài)圖像預測解碼裝置進行動作。
如圖7所示,動態(tài)圖像預測編碼程序或動態(tài)圖像預測解碼程序也可以作為重疊在載波中的計算機數據信號40而經由網絡來提供。該情況下,計算機30能夠將通過通信裝置24接收到的動態(tài)圖像預測編碼程序或動態(tài)圖像預測解碼程序存儲在存儲器16中,來執(zhí)行該動態(tài)圖像預測編碼程序或該動態(tài)圖像預測解碼程序。
標號說明
10:記錄介質;30:計算機;100:動態(tài)圖像預測編碼裝置;101:輸入端子;102:塊分割器;103:預測信號生成器;104:幀存儲器;105:減法器;106:轉換器;107:量化器;108:逆量化器;109:逆轉換器;110:加法器;111:熵編碼器;112:輸出端子;113:輸入端子;114:幀存儲器管理器;200:動態(tài)圖像預測解碼裝置;201:輸入端子;202:數據解析器;203:逆量化器;204:逆轉換器;205:加法器;206:輸出端子;207:幀存儲器;208:預測信號生成器;209:幀存儲器管理器;210:控制器;p100:動態(tài)圖像預測編碼程序;p101:輸入模塊;p102:編碼模塊;p103:復原模塊;p104:圖像存儲模塊;p105:控制模塊;p200:動態(tài)圖像預測解碼程序;p201:輸入模塊;p202:復原模塊;p203:圖像存儲模塊;p204:控制模塊。