專利名稱:圖像編碼裝置、圖像解碼裝置及它們的方法
技術領域:
本發(fā)明涉及一種動態(tài)圖像的編碼裝置及解碼裝置,特別涉及到采用加權系數(shù)來進行運動預測的編碼裝置、圖像解碼裝置及它們的方法。
背景技術:
近些年,正在迎來對聲音、圖像及其它內容等進行統(tǒng)一處理的多媒體時代,以通過單一的終端可以得到或傳送出自以往的信息媒體也就是報紙、雜志、電視、廣播及電話等的信息。一般而言,所謂多媒體指的是不僅是字符還有圖形、聲音特別是圖像等相關聯(lián)表達的設備,而為了將上述以往的信息媒體作為多媒體的對象,其必要條件是使該信息變成數(shù)據(jù)形式加以表現(xiàn)。
可是,將上述各信息媒體具有的信息量作為數(shù)字信息量得知,在字符的場合下每1字符的信息量是1~2字節(jié),與此相對在聲音的場合下每1秒需要64Kbits(電話質量),并且對于動態(tài)圖像來說每1秒需要100Mbits(目前電視接收質量)以上的信息量,因此通過上述信息媒體以數(shù)字形式對該龐大的信息按原狀態(tài)進行處理是不現(xiàn)實的。例如,雖然電視電話通過具有64Kbits/s~1.5Mbits/s傳送速度的綜合業(yè)務數(shù)字網(wǎng)(ISDNIntegreted Services Digital Network)業(yè)已實用化,但是按原狀態(tài)通過ISDN傳送電視或攝像機的影像是不可能的。
因此,一直需要的是信息壓縮技術,例如在電視電話的場合下動態(tài)圖像壓縮技術已被使用,該壓縮技術是由ITU-T(國際電信聯(lián)盟電信標準化部門)進行國際標準化后的H.261和H.263標準。另外,根據(jù)MPEG-1標準的信息壓縮技術,也可以與聲音信息一起向一般的音樂用CD(小型光盤)裝入圖像信息。
在此,所謂MPEG(Moving Picture Experts Group)是動態(tài)圖像信號壓縮的國際標準,MPEG-1是將動態(tài)圖像信號壓縮至1.5Mbps也就是將電視信號的信息直至壓縮到約百分之一的標準。另外,因為以MPEG-1標準為對象的傳送速度主要限制為約1.5Mbps,所以按照為滿足新的高畫面質量化要求并且已被標準化的MPEG-2,動態(tài)圖像信號被壓縮到2~15Mbps。再者,就現(xiàn)實狀況而言,憑借MPEG-1、MPEG-2和不斷推進標準化的工作組(ISO/IEC JTC1/SC29/WG11)MPEG-4已被標準化(例如,參照ISO(國際標準化組織)的MPEG-1、MPEG-2及MPEG-4的標準協(xié)議),該MPEG-4可達到超過MPEG-1、MPEG-2的壓縮率并進一步以物體為單位進行編碼、解碼和操作,實現(xiàn)多媒體時代所需要的新功能。根據(jù)MPEG-4,不僅可以用低比特率實現(xiàn)高效率的編碼,還引入即使產(chǎn)生傳送路徑誤差也可以減小畫面質量惡化的強大的容錯技術。另外,根據(jù)ISO/IEC和ITU,作為下一代圖像編碼方式正在共同推進MPEG-4 AVC/ITU H.264的標準化。
一般情況下,就動態(tài)圖像編碼而言是通過減少時間方向及空間方向的冗余度來進行信息量壓縮的。因此,關于以減少時間上的冗余度為目的的畫面間預測編碼,參照前方或后方的畫面(picture)以塊(block)為單位來進行運動檢測及預測圖像制作,對所得到的預測圖像和編碼對象畫面之間的差分值進行編碼。在此,所謂畫面是表現(xiàn)1幅畫面的專用語,在順序圖像中意味著幀,在交錯圖像中意味著場(field)。在此,所謂交錯(interlace)圖像是1個幀由時刻不同的2個場構成的圖像。在交錯圖像的編碼和解碼處理過程中,可以以幀的原狀態(tài)對1個幀進行處理,或作為2個場進行處理,或者在幀內的每個塊中作為幀結構或場結構進行處理。
圖1表示的是畫面種類和參照關系的一個示例。在圖1中,畫出斜陰影線的畫面表示,為了被其它畫面參照而保存于存儲器中的畫面。圖1中的箭頭表示,從被參照畫面到參照畫面的方向。另外,畫面的排列按照顯示順序予以表示。
I0(Picture 0)是圖片內編碼畫面(I畫面),與其它畫面相獨立(也就是無需參照其它畫面)進行編碼。P4(Picture 4)及P7(Picture7)是前方預測編碼畫面(P畫面),通過參照在時間上位于過去的I畫面或其它P畫面來進行預測編碼。B1~B3(Picture1~Picture3)、B5(Picture5)及B6(Picture6)是雙方向預測編碼畫面(B畫面),通過參照在時間上位于前后的其它畫面來進行預測編碼。
圖2表示的是畫面種類和參照關系的其它示例。圖2與圖1的不同之處是,B畫面所參照畫面的時間位置不一定限定于在時間上位于前后的畫面。例如,如果是B5(Picture5)的場合,則可以參照I0(Picture0)、P3(Picture3)及P6(Picture6)之中任意的2幅畫面。也就是說,可以參照在時間上位于過去的I0及P3。有關這種參照方法,在2001年9月時的MPEG-4 AVC/H.264標準議案中已被認定。據(jù)此同以往相比,選擇更為恰當?shù)念A測圖像所需的范圍有所擴大,可以謀求壓縮率的提高。
圖3表示的是圖像數(shù)據(jù)流結構的一個示例。如圖3所示,數(shù)據(jù)流由標題等通用信息區(qū)域和GOP(Group Of Picture)區(qū)域構成。GOP區(qū)域由標題等通用信息區(qū)域和多幅畫面(picture)區(qū)域構成。畫面區(qū)域由標題等通用信息區(qū)域和多個切片(slice)數(shù)據(jù)區(qū)域構成。切片數(shù)據(jù)區(qū)域由標題等通用信息區(qū)域和多個宏塊(macro block)數(shù)據(jù)區(qū)域構成。
另外,在畫面通用信息區(qū)域中,進行下述的加權預測所用的加權系數(shù)按照參照畫面被分別描述。
另外,數(shù)據(jù)流不是連續(xù)的比特流,在采用作為細小數(shù)據(jù)單位的數(shù)據(jù)包等進行傳送的場合下也可以使標題部分和標題以外的數(shù)據(jù)部分相分離加以分別傳送。那種場合下如同圖3那樣,將不出現(xiàn)標題部分和數(shù)據(jù)部分成為1個比特流的情況。但是,在數(shù)據(jù)包的場合下即使標題部分和數(shù)據(jù)部分所傳送的順序不連續(xù),也只是采用另外的數(shù)據(jù)包來傳送與對應的數(shù)據(jù)部分相應的標題部分,并且即使不成為1個比特流在概念上也與圖3所說明的比特流的情況相同。
下面,對有關以往圖像編碼方法中的加權預測處理,予以說明。
圖4是以幀為單位進行加權預測處理時的模式圖。
如圖4(a)所示,在參照1個幀的場合下,與當前編碼對象塊對應的預測圖像像素值Q可以將所參照的第i個幀(Framei)中的參照對象塊像素值設為P0,通過下述公式(1)所示的那種加權預測式來計算。另外,如圖4(b)所示在參照2個幀的場合下,預測圖像的像素值Q可以將所參照的第i個及第j個幀(Frame i及Frame j)中的參照對象塊像素值設為P0、P1,通過下述公式(2)所示的那種加權預測式來計算。
Q=(P0×W0+D)/W2 (1) Q=(P0×W0+P1×W1+D)/W2(2) 在此,W0及W1是加權系數(shù),D是偏差成分(DC成分),W2是規(guī)格化系數(shù)。
圖5是以場為單位進行加權預測處理時的模式圖。
如圖5(a)所示,在參照1個幀(也就是2個場)的場合下,與當前編碼對象塊對應的預測圖像像素值Qa、Qb可以將所參照的構成第i個幀(Frame i)的場2×i+1、2×i各自中的參照對象塊像素值設為P0a、P0b,通過下述公式(3)及下述公式(4)所示的那種加權預測式來計算。另外,如圖5(b)所示在參照2個幀的場合下,預測圖像的像素值Qa、Qb可以將所參照的構成第i個及第j個幀(Frame i及Frame j)的場2×i+1、2×i、2×j+1及2×j各自中的參照對象塊像素值設為P0a、P0b、P1a及P1b,通過下述公式(5)及下述公式(6)所示的那種加權預測式來計算。
Qa=(P0a×W0a+Da)/W2a (3) Qb=(P0b×W0b+Db)/W2b (4) Qa=(P0a×W0a+P1a×W1a+Da)/W2a(5) Qb=(P0b×W0b+P1b×W1b+Db)/W2b(6) 在此,W0a、W0b、W1a及W1b是加權系數(shù),Da、Db是偏差成分,W2a、W2b是規(guī)格化系數(shù)。
圖6是表示以往圖像編碼裝置100功能結構的框圖。該圖像編碼裝置100用來進行所輸入圖像信號Vin的壓縮編碼(例如可變長度編碼)并對通過該壓縮編碼所變換的作為比特流的圖像編碼信號Str進行輸出,該裝置具備運動檢測單元ME、運動補償單元MC、減法單元Sub、正交變換單元T、量化單元Q、逆量化單元IQ、逆正交變換單元IT、加法單元Add、畫面存儲器PicMem、開關SW及可變長度編碼單元VLC。
圖像信號Vin被輸入到減法單元Sub及運動檢測單元ME中。減法單元Sub對所輸入的圖象信號Vin和預測圖像的差分值進行計算,輸出給正交變換單元T。正交變換單元T將差分值變換成頻率系數(shù),輸出給量化單元Q。量化單元Q對所輸入的頻率系數(shù)進行量化,將量化值輸出給可變長度編碼單元VLC。
逆量化單元IQ對量化值進行逆量化還原成頻率系數(shù),輸出給逆正交變換單元IT。逆正交變換單元IT從頻率系數(shù)逆頻率變換成像素差分值,輸出給加法單元Add。加法單元Add對像素差分值和從運動補償單元MC所輸出的預測圖像進行加法運算而作為解碼畫面。開關SW在發(fā)出該解碼畫面保存指令的場合下變成「ON」,使解碼畫面保存到畫面存儲器PicMem中。
另一方面,圖像信號Vin以宏塊為單位被輸入運動檢測單元ME,將畫面存儲器PicMem中所存儲的解碼畫面作為搜索對象,通過檢測出與輸入圖像信號最接近的圖像區(qū)域來對指示其位置的運動矢量MV加以決定。運動矢量的檢測是以進一步分割宏塊后的塊為單位進行的。此時,為了能夠將多幅畫面作為參照畫面加以使用,而對每個塊需要識別號碼(畫面號碼Index),該識別號碼用來指定所參照的畫面。采用畫面號碼Index,可以通過取得存儲器PicMem中各畫面所具有畫面號碼之間的相關性來指定參照畫面。
運動補償單元MC采用由上述處理所檢測出的運動矢量及畫面號碼Index,從存儲于畫面存儲器PicMem中的解碼畫面取出預測圖像生成所需要的圖像區(qū)域。針對所得到的圖像區(qū)域像素值,運動補償單元MC通過實施由加權預測而產(chǎn)生的內插處理等像素值變換處理來確定最終的預測圖像,該加權預測采用與畫面號碼Index相關聯(lián)的加權系數(shù)。
圖7是表示上述圖6的以往圖像編碼裝置100中可變長度編碼單元VLC功能結構概略的框圖??勺冮L度編碼單元VLC具備MV編碼部101、量化值編碼部102、加權系數(shù)編碼部103、索引編碼部104、AFF識別信息編碼部105及多路化部106。
MV編碼部101用來對運動矢量進行編碼,量化值編碼部102用來對量化值Qcoef進行編碼。另外,加權系數(shù)編碼部103用來對加權系數(shù)Weight進行編碼,索引編碼部104用來對畫面號碼Index進行編碼。AFF識別信息編碼部105用來對AFF識別信號AFF進行編碼(有關AFF識別信號AFF將在下面予以說明)。多路化部106用來對從MV編碼部101、量化值編碼部102、加權系數(shù)編碼部103、索引編碼部104及AFF識別信息編碼部105所輸出的各編碼信號進行多路化,輸出圖像編碼信號Str。
圖8是表示以往圖像解碼裝置200功能結構的框圖。
圖像解碼裝置200可以對上述圖像編碼裝置100所編碼的圖像編碼信號Str進行解碼,該裝置具備可變長度解碼單元VLD、運動補償單元MC、加法單元Add、畫面存儲器PicMem、逆量化單元IQ及逆正交變換單元IT。
若輸入圖像編碼信號Str,則可變長度解碼單元VLD從所輸入的圖像編碼信號Str分離出已編碼的運動差分矢量MV、表示畫面號碼的索引及加權系數(shù)Weight,輸出給運動補償單元MC。再者,可變長度解碼單元VLD對所輸入的圖像編碼信號Str中含有的已編碼量化值Qcoef進行解碼,輸出給逆量化單元IQ。
運動補償單元MC采用從可變長度解碼單元VLD所輸出的運動矢量及畫面號碼Index,由存儲于畫面存儲器PicMem中的解碼畫面取出預測圖像的生成所需的圖像區(qū)域。采用與該所得到的圖像對應的加權系數(shù)Weight,實施由加權預測而產(chǎn)生的內插處理等像素值變換處理,以此生成預測圖像。
逆量化單元IQ對量化值進行逆量化還原成頻率系數(shù),輸出給逆正交變換單元IT。逆正交變換單元IT從頻率系數(shù)逆頻率變換成像素差分值,輸出給加法單元Add。加法單元Add對像素差分值和從運動補償單元MC所輸出的預測圖像進行加法運算而作為解碼畫面。該解碼畫面在此后畫面間預測中用于參照的場合下,存儲到畫面存儲器PicMem中。另外,該解碼畫面作為解碼畫面信號Vout被輸出到外部。
圖9是表示上述圖8以往圖像解碼裝置200中可變長度解碼單元VLD功能結構概略的框圖。
可變長度解碼單元VLD具備分離部201、MV解碼部202、量化值解碼部203、加權系數(shù)解碼部204、索引解碼部205及AFF識別信號解碼部206。
若圖像編碼信號Str被輸入到可變長度解碼單元VLD中,則分離部201分離出所輸入的圖像編碼信號Str,將已編碼的量化值Qcoef、已編碼的加權系數(shù)Weight、已編碼的畫面號碼Index及已編碼的AFF識別信號AFF(在下面的說明中簡稱為「AFF」)分別輸出給量化值解碼部203、加權系數(shù)解碼部204、索引解碼部205及AFF識別信號解碼部206。
MV解碼部202用來對已編碼的差分矢量進行解碼,輸出運動矢量MV。
同樣,量化值解碼部203、加權系數(shù)解碼部204、索引解碼部205及AFF識別信號解碼部206分別用來對量化值、加權系數(shù)Weight、畫面號碼Index及AFF進行解碼加以輸出。
可是,就以往的加權預測編碼而言雖然以畫面為單位進行編碼,但是只是假設出塊總是對于相同的畫面(幀或場的一方)進行編碼或解碼。因而,加權系數(shù)按照畫面只有1組被編碼/解碼。
為此,雖然通過以塊為單位來轉換場和幀而有可能提高運動預測的效率,但是由于以往以畫面為單位只發(fā)送1個加權系數(shù),因而即使以塊為單位轉換場和幀,預測效率也不佳而不能使壓縮率得到提高。
發(fā)明內容
因此,有關本發(fā)明是鑒于上述問題而做出的,本發(fā)明目的在于提供一種圖像解碼裝置,以塊為單位對編碼信號進行解碼,該編碼信號是對由幀或場構成的畫面以塊為單位進行編碼得到的,本發(fā)明具備 塊解碼裝置,對編碼差分信號進行解碼,生成塊的差分值,該編碼差分信號是對包含在上述編碼信號中的輸入圖像和預測圖像的差分值進行編碼得到的; 預測圖像生成裝置,在上述塊被幀編碼的情況下,用參考幀的像素值和幀加權系數(shù)生成預測圖像,在上述塊被場編碼的情況下,用參考場的像素值和場加權系數(shù)生成預測圖像; 再現(xiàn)圖像生成裝置,根據(jù)生成的上述塊的差分值和生成的上述預測圖像,生成上述塊的再現(xiàn)圖像; 上述預測圖像生成裝置, (1)在上述畫面由幀構成,并且構成上述畫面的所有的塊被幀編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像; (2)在上述畫面由場構成,并且構成上述畫面的所有的塊被場編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為場加權系數(shù),生成上述預測圖像; (3)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被幀編碼時,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像; (4)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被場編碼時,用從上述編碼信號提取到的加權系數(shù)生成場加權系數(shù),用生成的場加權系數(shù)生成上述預測圖像。
另外,為了達到上述目的,本發(fā)明提供一種圖像解碼方法,以塊為單位對編碼信號進行解碼,該編碼信號是對由幀或場構成的畫面以塊為單位進行編碼得到的,本發(fā)明的方法具備 解碼步驟,對編碼差分信號進行解碼,生成塊的差分值,該編碼差分信號是對包含在上述編碼信號中的輸入圖像和預測圖像的差分值進行編碼得到的; 預測圖像生成步驟,在上述塊被幀編碼的情況下,用參考幀的像素值和幀加權系數(shù)生成預測圖像,在上述塊被場編碼的情況下,用參考場的像素值和場加權系數(shù)生成預測圖像; 再現(xiàn)圖像生成步驟,根據(jù)生成的上述塊的差分值和生成的上述預測圖像,生成上述塊的再現(xiàn)圖像; 上述預測圖像生成步驟, (1)在上述畫面由幀構成,并且構成上述畫面的所有的塊被幀編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像; (2)在上述畫面由場構成,并且構成上述畫面的所有的塊被場編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為場加權系數(shù),生成上述預測圖像; (3)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被幀編碼時,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像; (4)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被場編碼時,用從上述編碼信號提取到的加權系數(shù)生成場加權系數(shù),用生成的場加權系數(shù)生成上述預測圖像。
圖1表示的是畫面種類和參照關系的一個示例。
圖2表示的是畫面種類和參照關系的其它示例。
圖3表示的是圖像數(shù)據(jù)流結構的一個示例。
圖4(a)是參照1幅幀來進行加權預測處理時的模式圖。
圖4(b)是參照2幅幀來進行加權預測處理時的模式圖。
圖5(a)是參照與各自對應的第1或第2場來進行加權預測處理時的模式圖。
圖5(b)是參照2幅與各自對應的第1或第2場來進行加權預測處理時的模式圖。
圖6是表示以往圖像編碼裝置功能結構的框圖。
圖7是表示以往圖像編碼裝置中的可變長度編碼單元功能結構概略的框圖。
圖8是表示以往圖像解碼裝置功能結構的框圖。
圖9是表示以往圖像解碼裝置中的可變長度解碼單元功能結構概略的框圖。
圖10是表示實施方式1中的可變長度編碼單元功能結構概略的框圖。
圖11是表示實施方式1中的可變長度解碼單元功能結構概略的框圖。
圖12(a)是實施方式1中畫面區(qū)域的通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構一個示例。
圖12(b)是沒有「AFF」而作為「畫面加權系數(shù)」只發(fā)送「場加權系數(shù)」時的示例。
圖12(c)是因「畫面幀編碼信息」為「1」并且「AFF」為「0」而不能以塊為單位轉換場和幀時的示例。
圖13是表示在實施方式1中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時可變長度解碼單元中與加權系數(shù)有關的編碼處理過程的流程圖。
圖14(a)是實施方式1變形例中畫面區(qū)域的通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構一個示例。
圖14(b)是因「畫面幀編碼信息」為「0」并且總是場編碼而沒有「AFF」作為「畫面加權系數(shù)」只發(fā)送「場加權系數(shù)」時的示例。
圖14(c)是因「畫面幀編碼信息」為「1」且「AFF」為「0」而不能以塊為單位轉換場和幀時的示例。
圖15是表示在實施方式1變形例中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時可變長度解碼單元中與加權系數(shù)有關的編碼處理過程的流程圖。
圖16是表示在圖11的可變長度解碼單元中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時與加權系數(shù)有關的解碼處理過程的流程圖。
圖17(a)是實施方式2中畫面區(qū)域的通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構一個示例,是對「AFF」設定「1」并對「Field系數(shù)有無信息」設定「1」的示例。
圖17(b)與(a)相同,是對「AFF」設定「1」并對「Field系數(shù)有無信息」設定「0」的示例。
圖17(c)是因對「AFF」設定「0」而不以塊為單位進行場和幀轉換的示例。
圖18是表示在實施方式2中可變長度編碼單元與加權系數(shù)有關的編碼處理過程的流程圖。
圖19是表示在實施方式2中可變長度解碼單元與加權系數(shù)有關的解碼處理過程的流程圖。
圖20(a)表示的是在實施方式3中畫面區(qū)域的數(shù)據(jù)結構示例,是對「AFF」設定「1」并對「Frame系數(shù)有無信息」設定「1」的示例。
圖20(b)與(a)相同,是對「AFF」設定「1」并對「Frame系數(shù)有無信息」設定「0」的示例。
圖20(c)是因對「AFF」設定「0」而不以塊為單位進行場和幀轉換的示例。
圖21是表示在實施方式3中可變長度編碼單元與加權系數(shù)有關的編碼處理過程的流程圖。
圖22是表示在實施方式3中可變長度解碼單元與加權系數(shù)有關的解碼處理過程的流程圖。
圖23是采用軟盤等記錄媒體中所記錄的程序并通過計算機系統(tǒng)來實施上述實施方式1、2及3的圖像編碼方法及圖像解碼方法時的說明圖。
(a)是表示作為記錄媒體主體的軟盤物理格式示例的說明圖。
(b)是表示出從軟盤正面所看到的外觀、剖面結構及軟盤的說明圖。
(c)是表示出在軟盤FD中進行上述程序的記錄再生所需的結構的說明圖。
圖24表示的是實現(xiàn)內容傳輸服務的內容提供系統(tǒng)整體結構的框圖。
圖25表示的是攜帶電話的一個示例。
圖26是表示攜帶電話內部結構的框圖。
圖27是表示數(shù)字廣播用系統(tǒng)整體結構的框圖。
具體實施例方式 下面,有關本發(fā)明所涉及的實施方式,通過參照附圖予以詳細說明。
(實施方式1) 實現(xiàn)本實施方式所涉及圖像編碼方法的圖像編碼裝置功能結構除去可變長度編碼單元VLC之外,與上述以往的圖像編碼裝置100相同。另外,實現(xiàn)本實施方式所涉及圖像解碼方法的圖像解碼裝置功能結構除去可變長度解碼單元VLD之外,與上述以往的圖像解碼裝置200相同。
為此,下面將有關與以往不同的可變長度編碼單元VLC及可變長度解碼單元VLD,加以重點說明。
圖10是表示在本實施方式中可變長度編碼單元VLC功能結構概略的框圖。如圖10所示,可變長度編碼單元VLC具備MV編碼部101、量化值編碼部102、場加權系數(shù)編碼部11、幀加權系數(shù)編碼部12、索引編碼部104、加權系數(shù)模式判定部13、AFF識別信息編碼部105、開關14、15及多路化部106。還有,下面有關與上述以往可變長度編碼單元VLC相同的功能結構,將附加同一符號以省略其說明。
開關14、15用于根據(jù)加權系數(shù)模式判定部13的判定結果,對于使所輸入的加權系數(shù)Weight發(fā)送目標為場加權系數(shù)編碼部11還是為幀加權系數(shù)編碼部12,進行ON/OFF的控制。
場加權系數(shù)編碼部11用來以所輸入的加權系數(shù)Weight作為場加權系數(shù)進行編碼。幀加權系數(shù)編碼部1 2用來以所輸入的加權系數(shù)Weight作為幀加權系數(shù)進行編碼。
加權系數(shù)模式判定部13用于根據(jù)AFF的值及加權系數(shù)Weight的值,進行場/幀的判定并將其判定結果通知給開關14、15及多路化部106。
圖11是表示本實施方式中可變長度解碼單元VLD功能結構概要的框圖。如圖11所示,可變長度解碼單元VLD具備分離部21、MV解碼部202、量化值解碼部203、場加權系數(shù)解碼部22、幀加權系數(shù)解碼部23、加權系數(shù)生成部24、索引解碼部205、AFF識別信息解碼部206及開關26~28。還有,下面有關與上述以往可變長度解碼單元VLD相同的功能結構,將附加同一符號以省略其說明。
分離部21用來分離所輸入的圖像編碼信號Str,并將已編碼的運動矢量MV、已編碼的量化值Qcoef、已編碼的加權系數(shù)Weight、已編碼的畫面號碼Index以及已編碼的AFF分別輸出給MV解碼部202、量化值解碼部203、場加權系數(shù)解碼部22或幀加權系數(shù)解碼部23和加權系數(shù)生成部24、索引解碼部205以及AFF識別信息解碼部206。
場加權系數(shù)解碼部22用來以所輸入的加權系數(shù)Weight作為場加權系數(shù)進行解碼。幀加權系數(shù)解碼部23用來以所輸入的加權系數(shù)Weight作為幀加權系數(shù)進行解碼。
加權系數(shù)生成部24按照需要根據(jù)幀加權系數(shù)生成場加權系數(shù)。例如,以塊為單位進行幀/場轉換的場合,以及因場加權系數(shù)未被編碼而有必要根據(jù)幀加權系數(shù)生成場加權系數(shù)的場合。
圖12表示的是本實施方式中畫面區(qū)域的數(shù)據(jù)結構示例。圖12(a)是畫面區(qū)域中通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構一個示例。在圖12(a)的示例中,「header」具有「畫面幀編碼信息」,表示畫面是幀單位還是場單位。在「畫面幀編碼信息」為「1」的場合下,進一步具有「AFF」這種表示是否以塊為單位轉換場和幀的標志。例如,在「AFF」為「1」的場合下,表示以塊為單位轉換場和幀。如圖12(a)所示,在「AFF」為「1」的場合下,發(fā)送「場加權系數(shù)」和「幀加權系數(shù)」的全部。還有,在「場加權系數(shù)」中包含有「第1場加權系數(shù)」和「第2場加權系數(shù)」。
在「畫面幀編碼信息」為「0」的場合下,畫面以場為單位被編碼,不能以塊為單位轉換場和幀。因而,如圖12(b)所示,沒有「AFF」,而作為「畫面加權系數(shù)」只發(fā)送「場加權系數(shù)」。圖12(c)是「畫面幀編碼信息」為「1」并且「AFF」為「0」的情形,不能以塊為單位轉換場和幀。因而,作為「畫面加權系數(shù)」只發(fā)送「幀加權系數(shù)」。
圖13是表示在本實施方式中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時可變長度解碼單元VLD中與加權系數(shù)有關的編碼處理過程的流程圖。
首先,在「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S10是),對表示“有塊單位的轉換”的AFF進行編碼(S13),并對幀加權系數(shù)及場加權系數(shù)進行編碼(S14、S15)。
另一方面,在「AFF」的值為「0」且不以塊為單位進行幀/場轉換的場合下(S10否),對表示“沒有塊單位的轉換”的「AFF 」的值「0」進行編碼(S11),并對畫面的加權系數(shù)進行編碼(S12)。
(變形例) 圖14表示的是本實施方式變形例中畫面區(qū)域的數(shù)據(jù)結構示例。圖14(a)是在畫面區(qū)域中的通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構一個示例。在圖14(a)的示例中,「header」具有「畫面幀編碼信息」,表示畫面是幀單位還是場單位。例如,在「畫面幀編碼信息」為「1」(也就是,畫面是幀單位)的場合下,進一步具有「AFF」這種表示是否以塊為單位轉換場和幀的標志。例如,在「AFF」為「1」的場合下,表示出以塊為單位轉換場和幀。如圖14(a)所示,在「AFF」為「1」的場合下,發(fā)送「幀加權系數(shù)」并且「場加權系數(shù)」改用「幀加權系數(shù)」。
在「畫面幀編碼信息」為「0」的場合下,表示畫面以場為單位被編碼。這種場合下,不以塊為單位進行幀/場的轉換。因而,如圖14(b)所示,在沒有「AFF」的場合下,意味著作為「畫面加權系數(shù)」只發(fā)送「場加權系數(shù)」。圖14(c)是「畫面幀編碼信息」為「1」且「AFF」為「0」的情形,不以塊為單位進行幀/場的轉換而總是采用幀進行編碼。因而,作為「畫面加權系數(shù)」只發(fā)送「幀加權系數(shù)」。
圖15是表示在本實施方式變形例中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時可變長度編碼單元VLC中與加權系數(shù)有關的編碼處理過程的流程圖。
首先,在「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S10是),對表示“有塊單位的轉換”的AFF進行編碼(S13),并對幀加權系數(shù)進行編碼(S15)。
另一方面,在「AFF」的值為「0」且不以塊為單位進行幀/場轉換的場合下(S10否),對表示“沒有塊單位的轉換”的「AFF」值「0」進行編碼(S11),根據(jù)畫面幀編碼信息將在「場加權系數(shù)」或「幀加權系數(shù)」的任一方中與塊編碼單位相一致的作為「畫面加權系數(shù)」進行編碼(S12)。
圖16是表示在圖11的可變長度解碼單元VLD中「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼時與加權系數(shù)有關的解碼處理過程的流程圖。另外,圖16是與上述圖15編碼處理對應的解碼處理所涉及的流程圖。
首先,可變長度解碼單元VLD對「AFF」進行解碼(S20)。據(jù)此,在表示「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S21是),對幀加權系數(shù)進行解碼(S23),根據(jù)幀加權系數(shù)(例如,改用幀加權系數(shù))生成場加權系數(shù)(S24)。
另一方面,在「AFF」的值為「0」且未以塊為單位進行幀/場轉換的場合下(S21否),對作為「畫面加權系數(shù)」的「場加權系數(shù)」或「幀加權系數(shù)」的任一個進行解碼(S22)。
如上所述,通過采用本實施方式所涉及的圖像編碼方法及圖像解碼方法,而能夠以塊為單位實現(xiàn)場/幀轉換并改善預測效率,最終使壓縮率得以提高。再者,即使在「場加權系數(shù)」未被編碼的場合下,也在可變長度解碼單元VLD中根據(jù)「幀加權系數(shù)」生成「場加權系數(shù)」,因此可以在沒有阻礙的狀況下進行上述塊單位的場/幀轉換。
(實施方式2) 在本實施方式中,將有關在上述實施方式1中畫面區(qū)域數(shù)據(jù)結構不同時的示例,予以說明。
圖17表示的是在本實施方式中畫面區(qū)域數(shù)據(jù)結構的示例。該圖17表示的是畫面區(qū)域中的通用信息區(qū)域內「header」的詳細數(shù)據(jù)結構。在本實施方式中,作為「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼的情形,將有關可省略場加權系數(shù)時的「header」結構示例予以說明。
如圖17(a)及圖17(b)所示,「header」除「AFF」之外還具有「Field系數(shù)有無信息」。該「Field系數(shù)有無信息」是表示有沒有場加權系數(shù)的標志。例如,在有場加權系數(shù)的場合下設定為「1」,在省略場加權系數(shù)的場合下設定為「0」。
圖17(a)是對「AFF」設定「1」并對上述「Field系數(shù)有無信息」設定「0」的示例,表示對于場加權系數(shù)也進行發(fā)送的情形。還有,在「場加權系數(shù)中」與上述實施方式1的情形相同,包含有「第1場加權系數(shù)」和「第2場加權系數(shù)」。
圖17(b)是對「AFF」設定「1」并對上述「Field系數(shù)有無信息」設定「0」的示例。
圖17(c)是因對「AFF」設定「0」而不以塊為單位進行場和幀轉換的示例。
圖18是表示在本實施方式中可變長度編碼單元VLC與加權系數(shù)有關的編碼處理過程的流程圖。
首先,在「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S10是),對表示有塊單位轉換的「AFF」進行編碼(S31)。
再者,對場加權系數(shù)可否根據(jù)幀加權系數(shù)生成進行判定(S32),在可能的場合下,對下述信息及幀加權系數(shù)進行編碼(S36、S37),該信息表示生成場加權系數(shù)。還有,在場加權系數(shù)不根據(jù)幀加權系數(shù)生成的場合下,對表示有沒有場加權系數(shù)的信息、幀加權系數(shù)及場加權系數(shù)進行編碼(S33~S35)。
另一方面,在「AFF」的值為「0」且不以塊為單位進行幀/場轉換的場合下(S10否),與上述圖15的流程圖相同(S11、S12)。
圖19是表示在圖11的可變長度解碼單元VLD中與加權系數(shù)有關的解碼處理過程的流程圖。另外,圖19是與上述圖18編碼處理對應的解碼處理所涉及的流程圖。
首先,可變長度解碼單元VLD對「AFF」進行解碼(S20),在表示「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S21是),對表示場加權系數(shù)有無的信息進行解碼(S41)。
接著,判定有沒有場加權系數(shù)(S42),在沒有場加權系數(shù)的場合下對幀加權系數(shù)進行解碼(S45),根據(jù)幀加權系數(shù)生成場加權系數(shù)(S46)。還有,在有場加權系數(shù)的場合下,對幀加權系數(shù)及場加權系數(shù)進行解碼(S43、S44)。
另一方面,在表示「AFF」的值為「0」且未以塊為單位進行幀/場轉換的場合下(S21否),對畫面加權系數(shù)進行解碼(S22)。
如上所述,通過采用本實施方式所涉及的圖像編碼方法及圖像解碼方法,而以塊為單位實現(xiàn)場/幀轉換。再者,即使在「場加權系數(shù)」被省略的場合下,也可以通過幀加權系數(shù)予以生成。
(實施方式3) 在本實施方式中,將有關上述實施方式1中畫面區(qū)域數(shù)據(jù)結構不同時的示例,予以說明。
圖20表示的是在本實施方式中畫面區(qū)域數(shù)據(jù)結構的示例。該圖20作為畫面區(qū)域中的通用信息區(qū)域內「畫面幀編碼信息」為「1」且畫面以幀為單位被編碼的情形,表示「header」的詳細數(shù)據(jù)結構。在本實施方式中,將有關可省略幀加權系數(shù)時的「header」結構示例,予以說明。
如圖20(a)及圖20(b)所示,「header」除「AFF」之外還具有「Frame系數(shù)有無信息」。該「Frame系數(shù)有無信息」是表示有沒有幀加權系數(shù)的標志。例如,在有幀加權系數(shù)的場合下設定為「1」,在省略幀加權系數(shù)的場合下設定為「0」。
圖20(a)是對「AFF」設定「1」并對上述「Frame系數(shù)有無信息」設定「1」的示例,表示對于幀加權系數(shù)也進行發(fā)送的情形。圖20(b)是對「AFF」設定「1」并對上述「Frame系數(shù)有無信息」設定「0」的示例。圖20(c)是因對「AFF」設定「0」而不以塊為單位進行場和幀轉換的示例。
圖21是表示在本實施方式中可變長度編碼單元VLC與加權系數(shù)有關的編碼處理過程的流程圖。
首先,在「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S10是),對表示有塊單位轉換的「AFF」進行編碼(S51)。
再者,對是否根據(jù)場加權系數(shù)生成幀加權系數(shù)進行判定(S52),在生成的場合下,對下述信息及場加權系數(shù)進行編碼(S56、S57),該信息表示生成幀加權系數(shù)。還有,在不根據(jù)場加權系數(shù)生成幀加權系數(shù)的場合下(S52否),對表示有沒有幀加權系數(shù)的信息、場加權系數(shù)及幀加權系數(shù)進行編碼(S53~S55)。
另一方面,在「AFF」的值為「0」且不以塊為單位進行幀/場轉換的場合下(S10否),與上述圖15的流程圖相同進行編碼(S11、S12)。
圖22是表示在上述圖11的可變長度解碼單元VLD中與加權系數(shù)有關的解碼處理過程的流程圖。另外,圖22是與上述圖21編碼處理過程對應的解碼處理所涉及的流程圖。
首先,可變長度解碼單元VLD對「AFF」進行解碼(S20),在表示「AFF」的值為「1」且以塊為單位進行幀/場轉換的場合下(S21是),對表示幀加權系數(shù)有無的信息進行解碼(S61)。
接著,判定有沒有幀加權系數(shù)(S62),在沒有幀加權系數(shù)的場合下(S62是),對場加權系數(shù)進行解碼(S65),根據(jù)場加權系數(shù)生成幀加權系數(shù)(S66)。還有,在有幀加權系數(shù)的場合下(S62否),對場加權系數(shù)及幀加權系數(shù)進行解碼(S63、S64)。
另一方面,在表示「AFF」的值為「0」且未以塊為單位進行幀/場轉換的場合下(S21否),對畫面加權系數(shù)進行解碼(S22)。
如上所述,通過采用本實施方式所涉及的圖像編碼方法及圖像解碼方法,而以塊為單位實現(xiàn)場/幀的轉換。再者,即使在幀加權系數(shù)被省略的場合下,也可以通過場加權系數(shù)予以生成。
(實施方式4) 再者,通過將實現(xiàn)上述各實施方式所示的圖像編碼方法及圖像解碼方法所需的程序記錄到軟盤等存儲媒體中,可以在獨立的計算機系統(tǒng)中簡單地實施上述各實施方式所示的處理。
圖23是采用軟盤等記錄媒體中所記錄的程序通過計算機系統(tǒng)來實施上述各實施方式的圖像編碼方法及圖像解碼方法時的說明圖。
圖23(b)表示從軟盤的正面所看到的外觀、剖面結構及軟盤,圖23(a)表示出作為記錄媒體主體的軟盤物理格式示例。軟盤FD內置于卡盒F內,在該磁盤的表面上按同心圓狀從外圓向內圓形成多個磁道Tr,并且各磁道按角度方向被分割成16個扇區(qū)Se。因而,對于存儲有上述程序的軟盤而言,在上述軟盤FD上所分配的區(qū)域內記錄有上述程序。
另外,圖23(c)表示在軟盤FD上進行上述程序記錄再現(xiàn)所需的結構。在將實現(xiàn)圖像編碼方法及圖像解碼方法的上述程序記錄到軟盤FD中的場合下,通過軟盤驅動器從計算機系統(tǒng)Cs寫入上述程序。另外,在將由軟盤內的程序來實現(xiàn)圖像編碼方法及圖像解碼方法的上述圖像編碼方法及圖像解碼方法建立到計算機系統(tǒng)中的場合下,通過軟盤驅動器從軟盤讀出程序,傳送到計算機系統(tǒng)中。
還有,在上述說明中雖然作為記錄媒體采用軟盤已做出說明,但是采用光盤也可以同樣進行。另外,記錄媒體不限于此,IC卡、ROM盒等只要是能記錄程序的裝置,都可以同樣地加以實施。
(實施方式5) 再者此處,將說明上述實施方式所示的圖像編碼方法和圖像解碼方法的應用示例以及對其使用的系統(tǒng)。
圖24是表示實現(xiàn)內容傳輸服務的內容提供系統(tǒng)ex100整體結構的框圖。將通信服務的提供區(qū)域分割成所希望的大小,在各單元內設置有各自作為固定無線電臺的基站ex107~ex110。
該內容提供系統(tǒng)ex100例如在因特網(wǎng)ex101上通過因特網(wǎng)業(yè)務提供設備ex102、電話網(wǎng)ex104及基站ex107~ex110,來連接計算機ex111、PDA(personal digital assistant)ex112、攝像機ex113、攜帶電話ex114及帶攝像機的攜帶電話ex115等的各種設備。
但是,內容提供系統(tǒng)ex100并不限定于圖24的那種組合,而也可以組合連接任一個。另外,不用通過作為固定無線電臺的基站ex107~ex110,各設備也可以與電話網(wǎng)ex104直接連接。
攝像機ex113是數(shù)字視頻攝像機等的可進行動態(tài)圖像攝影的設備。另外,攜帶電話是下述方式的攜帶電話機或是PHS(PersonalHandyphone System)等全都可以,上述方式包括PDC(Personal DigitalCommunications)方式、CDMA(Code Division Multiple Access)方式、W-CDMA(Wideband-Code Division Multiple Access)方式或者GSM(Global System for Mobile Communications)方式。
另外,流(stream)服務器ex103通過基站ex109及電話網(wǎng)ex104被攝像機ex113所連接,采用攝像機ex113可以進行用戶所發(fā)送并根據(jù)編碼處理后數(shù)據(jù)的實況傳輸?shù)?。所拍攝到數(shù)據(jù)的編碼處理既可以通過攝像機ex113來進行,也可以通過進行數(shù)據(jù)發(fā)送處理的服務器等來進行。另外,由攝像機ex116所拍攝到的動態(tài)圖像數(shù)據(jù)也可以通過計算機ex111發(fā)送給流服務器ex103。攝像機ex116是數(shù)字攝像機等的可拍攝靜止圖像、動態(tài)圖像的設備。這種場合下,動態(tài)圖像數(shù)據(jù)的編碼通過攝像機ex116或通過計算機ex111都可以進行。另外,編碼處理是在計算機ex111和攝像機ex116所具有的LSIex117中進行的。還有,也可以將圖像編碼或解碼用的軟件裝入某些儲存媒體(CD-ROM、軟盤、硬盤等)中,該存儲媒體是通過計算機ex111等可讀取的記錄媒體。再者,也可以通過帶攝像機的攜帶電話ex115來發(fā)送動態(tài)圖像數(shù)據(jù)。此時的動態(tài)圖像數(shù)據(jù)是通過攜帶電話ex115所具有的LSI加以編碼處理后的數(shù)據(jù)。
關于該內容提供系統(tǒng)ex100,與上述實施方式相同對用戶使用攝像機ex113、攝像機ex116等所拍攝到的內容(例如,拍攝音樂實況的影像等)進行編碼處理并發(fā)送給流服務器ex103,而另一方面流服務器ex103對發(fā)出請求的客戶機利用數(shù)據(jù)流傳輸上述內容數(shù)據(jù)。作為客戶機,有可以對上述編碼處理后的數(shù)據(jù)進行解碼的計算機ex111、PDAex112、攝像機ex113及攜帶電話ex114等。這樣一來,內容提供系統(tǒng)ex100就可以在客戶機中對編碼后的數(shù)據(jù)進行接收及再現(xiàn),并進一步通過在客戶機中對其進行實時接收、解碼及再現(xiàn),還能夠實現(xiàn)個人廣播。
在構成該系統(tǒng)的各設備編碼、解碼過程中,可以采用上述各實施方式所示的圖像編碼裝置或圖像解碼裝置。
作為其一個示例,將有關攜帶電話予以說明。
圖25表示的是采用由上述實施方式所說明的圖像編碼方法及圖像解碼方法的攜帶電話ex115。攜帶電話ex115具有天線ex201,用來在與基站ex110之間發(fā)送并接收電波;攝像部ex203,是CCD攝像機等可拍攝影像、靜止圖像的攝像機;顯示部ex202,是對由攝像部ex203所拍攝到的影像以及由天線ex201所接收到的影像等被解碼后的數(shù)據(jù)進行顯示的液晶顯示器等;主體部,由操作鍵ex204群構成;聲音輸出部ex208,是進行聲音輸出所用的揚聲器等;聲音輸入部ex205,是進行聲音輸入所用的傳聲器等;存儲媒體ex207,用來保存所拍攝到的動態(tài)圖像或靜止圖像數(shù)據(jù)、所接收到的郵件數(shù)據(jù)及動態(tài)圖像數(shù)據(jù)或靜止圖像數(shù)據(jù)等編碼后的數(shù)據(jù)或者解碼后的數(shù)據(jù);插槽部ex206,用于將存儲媒體ex207安裝到攜帶電話ex115。存儲媒體ex207是在SD卡等塑料盒內裝入閃存元件后的部件,該閃存元件是電可擦除的非易失性存儲器并且是EEPROM(Electrically Erasable andProgrammable Read Only Mernory)的一種。
再者,有關攜帶電話ex115將采用圖26予以說明。攜帶電話ex115對于下述的主控制部ex311通過同步總線ex313相互連接有電源電路部ex310、操作輸入控制部ex304、圖像編碼部ex312、攝像機接口部ex303、LCD(Liquid Crystal Display)控制部ex302、圖像解碼部ex309、多路分離部ex308、記錄再現(xiàn)部ex307、調制解調電路部ex306及聲音處理部ex305,上述主控制部ex311用來對具備有顯示部ex202及操作鍵ex204的主體部各部進行總括控制。
電源電路部ex310用于,若因用戶的操作而使會話結束及電源鍵變成開啟狀態(tài),則通過從電池組對各部提供電源,而使帶攝像機的數(shù)字攜帶電話ex115起動,成為可工作的狀態(tài)。
攜帶電話ex115根據(jù)由CPU、ROM及RAM等構成的主控制部ex311的控制,通過聲音處理部ex305將在聲音通話方式時由聲音輸入部ex205所采集的聲音信號變換成數(shù)字聲音數(shù)據(jù),由調制解調電路部ex306對其進行擴頻處理,在通過收發(fā)電路部ex301施以數(shù)字模擬變換處理及頻率變換處理之后,通過天線ex201進行發(fā)送。另外,攜帶電話機ex115對在聲音通話方式時由天線ex201所接收到的接收信號進行放大并施以頻率變換處理及模擬數(shù)字變換處理,通過調制解調電路部ex306進行逆擴頻處理,在采用聲音處理部ex305變換成模擬聲音數(shù)據(jù)之后通過聲音輸出部ex208將其輸出。
再者,在數(shù)據(jù)通信方式時發(fā)送電子郵件的場合下,由主體部操作鍵ex204操作所輸入的電子郵件正文數(shù)據(jù),通過操作輸入控制部ex304發(fā)到主控制部ex311。主控制部ex311通過調制解調電路部ex306對正文數(shù)據(jù)進行擴頻處理,在采用收發(fā)電路部ex301施以數(shù)字模擬變換處理及頻率變換處理之后,通過天線ex201發(fā)送到基站ex110。
在數(shù)據(jù)通信方式時發(fā)送圖像數(shù)據(jù)的場合下,通過攝像機接口部ex303將由攝像部ex203所拍攝到的圖像數(shù)據(jù)提供到圖像編碼部ex312。另外,在不發(fā)送圖像數(shù)據(jù)的場合下,也可以通過攝像機接口部ex303及LCD控制部ex302將由攝像部ex203所拍攝到的圖像數(shù)據(jù)直接顯示在顯示部ex202上。
圖像編碼部ex312的結構具備有本申請發(fā)明所說明的圖像編碼裝置,采用上述實施方式所示的用于圖像編碼裝置的編碼方法進行壓縮編碼,以此將通過攝像部ex203所提供的圖像數(shù)據(jù)變換成編碼圖像數(shù)據(jù),將其發(fā)到多路分離部ex308。另外,與此同時攜帶電話機ex115通過聲音處理部ex305,將在采用攝像部ex203進行拍攝過程中由聲音輸入部ex205所采集的聲音作為數(shù)字的聲音數(shù)據(jù),發(fā)到多路分離部ex308。
多路分離部ex308以指定方式對由圖像編碼部ex312所提供的編碼圖像數(shù)據(jù)和由聲音處理部ex305所提供的聲音數(shù)據(jù)進行多路化,通過調制解調電路部ex306對其結果所得到的多路化數(shù)據(jù)進行擴頻處理,在采用收發(fā)電路部ex301施以數(shù)字模擬變換處理及頻率變換處理之后,通過天線ex201進行發(fā)送。
在數(shù)據(jù)通信方式時接收與主頁等所連接的動態(tài)圖像文件數(shù)據(jù)的場合下,由調制解調電路部ex306對通過天線ex201從基站ex110所接收到的接收信號進行逆擴頻處理,并將其結果所得到的多路化數(shù)據(jù)發(fā)到多路分離部ex308。
另外,為了對通過天線ex201所接收到的多路化數(shù)據(jù)進行解碼,多路分離部ex308通過分離多路化數(shù)據(jù),而分成編碼圖像數(shù)據(jù)和聲音數(shù)據(jù),并通過同步總線ex313將該編碼圖像數(shù)據(jù)提供到圖像解碼部ex309,與此同時將該聲音數(shù)據(jù)提供到聲音處理部ex305。
再者,圖像解碼部ex309的結構具備有本申請發(fā)明所說明的圖像解碼裝置,采用與上述實施方式所示的與編碼方法對應的解碼方法對編碼圖像數(shù)據(jù)進行解碼,以此生成再現(xiàn)動態(tài)圖像,通過LCD控制部ex302將其提供到顯示部ex202,據(jù)此顯示如與主頁所連接的動態(tài)圖像文件中包含的動態(tài)圖像數(shù)據(jù)。與此同時,聲音處理部ex305在將聲音數(shù)據(jù)變換成模擬聲音數(shù)據(jù)之后,將其提供到聲音輸出部ex208,據(jù)此再現(xiàn)如與主頁所連接的動態(tài)圖像文件中包含的聲音數(shù)據(jù)。
還有,不局限于上述系統(tǒng)的示例,最近人們正在探討采用衛(wèi)星、地面波的數(shù)字廣播,并且如圖27所示在數(shù)字廣播用的系統(tǒng)中也可以至少安裝上述實施方式的圖像編碼裝置或圖像解碼裝置的任一個。具體而言,在發(fā)射臺ex409上影像信息的編碼比特流通過電波傳送給通信或廣播衛(wèi)星ex410。收到該電波的廣播衛(wèi)星ex410發(fā)出廣播用的電波,并通過具有衛(wèi)星廣播接收設備的家庭天線ex406來接收該電波,采用電視(接收機)ex401或者機頂盒(STB)ex407等的裝置對編碼比特流進行解碼將其再現(xiàn)。另外,在讀取下述編碼比特流并進行解碼的再現(xiàn)裝置ex403中也可以安裝上述實施方式所示的圖像解碼裝置,上述編碼比特流記錄于作為記錄媒體的存儲媒體ex402中。這種場合下,所再現(xiàn)的影像信號顯示于監(jiān)視器ex404上。另外,還考慮到這樣的結構,即將圖像解碼裝置安裝在與有線電視用的電纜ex405或者衛(wèi)星/地面波廣播的天線ex406相連接的機頂盒ex407內,通過電視的監(jiān)視器ex408對其進行再現(xiàn)。此時,也可以不是機頂盒,而在電視內裝入圖像編碼裝置。另外,也可以通過具有天線ex411的汽車ex412從衛(wèi)星ex410或者從基站ex107等接收信號,并在汽車ex412所具有的汽車導航ex413等顯示裝置上對動態(tài)圖像進行再現(xiàn)。
再者,也可以通過上述實施方式所示的圖像編碼裝置對圖像信號進行編碼,記錄到記錄媒體中。作為具體示例,有將圖像信號記錄到DVD光盤ex421中的DVD記錄器和記錄于硬盤中的磁盤記錄器等記錄器ex420。再者,也可以記錄到SD卡ex422中。記錄器ex420如果具備上述實施方式所示的圖像解碼裝置,則可以對記錄于DVD光盤ex421和SD卡ex422中的圖像信號進行再現(xiàn),通過監(jiān)視器ex408加以顯示。
再者,可以考慮汽車導航ex413的結構例如為在圖26所示的結構中除去攝像部ex203及攝像機接口部ex303,并且就計算機ex111和電視(接收機)ex401等來說也可以做出同樣的考慮。
另外,考慮到上述攜帶電話ex114等的終端除具有編碼器和解碼器雙方的收發(fā)型終端之外,還有只有編碼器的發(fā)送終端、只有解碼器的接收終端的3種組裝形式。
這樣,可以將上述實施方式所示的圖像編碼方法或圖像解碼方法使用于上述的任一設備或系統(tǒng)中,據(jù)此能夠獲得上述實施方式所說明的效果。
再者,本發(fā)明并不限定于上述這種實施方式,而在不脫離本發(fā)明的范圍內可以進行各種的變形或者修改。
如上所述,根據(jù)本發(fā)明所涉及的圖象編碼方法及圖像解碼方法,能夠以塊為單位實現(xiàn)場/幀轉換并改善預測效率使壓縮率得到提高。
另外,根據(jù)本發(fā)明所涉及的圖像編碼方法及圖像解碼方法,由于根據(jù)幀加權系數(shù)生成場加權系數(shù),因而可以省略場加權系數(shù)進行發(fā)送,能夠使傳送效率得到改善。因此,其實用價值較高。
產(chǎn)業(yè)上的可利用性 本發(fā)明可以應用于以塊為單位轉換幀/場來進行運動預測的圖像編碼裝置、圖像解碼裝置及其方法,尤其是在采用加權系數(shù)進行運動預測的上述圖像編碼裝置中等是有用的。
權利要求
1.一種圖像解碼裝置,以塊為單位對編碼信號進行解碼,該編碼信號是對由幀或場構成的畫面以塊為單位進行編碼得到的,其特征在于具備
塊解碼裝置,對編碼差分信號進行解碼,生成塊的差分值,該編碼差分信號是對包含在上述編碼信號中的輸入圖像和預測圖像的差分值進行編碼得到的;
預測圖像生成裝置,在上述塊被幀編碼的情況下,用參考幀的像素值和幀加權系數(shù)生成預測圖像,在上述塊被場編碼的情況下,用參考場的像素值和場加權系數(shù)生成預測圖像;
再現(xiàn)圖像生成裝置,根據(jù)生成的上述塊的差分值和生成的上述預測圖像,生成上述塊的再現(xiàn)圖像;
上述預測圖像生成裝置,
(1)在上述畫面由幀構成,并且構成上述畫面的所有的塊被幀編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像;
(2)在上述畫面由場構成,并且構成上述畫面的所有的塊被場編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為場加權系數(shù),生成上述預測圖像;
(3)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被幀編碼時,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像;
(4)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被場編碼時,用從上述編碼信號提取到的加權系數(shù)生成場加權系數(shù),用生成的場加權系數(shù)生成上述預測圖像。
2.一種圖像解碼方法,以塊為單位對編碼信號進行解碼,該編碼信號是對由幀或場構成的畫面以塊為單位進行編碼得到的,其特征在于具備
解碼步驟,對編碼差分信號進行解碼,生成塊的差分值,該編碼差分信號是對包含在上述編碼信號中的輸入圖像和預測圖像的差分值進行編碼得到的;
預測圖像生成步驟,在上述塊被幀編碼的情況下,用參考幀的像素值和幀加權系數(shù)生成預測圖像,在上述塊被場編碼的情況下,用參考場的像素值和場加權系數(shù)生成預測圖像;
再現(xiàn)圖像生成步驟,根據(jù)生成的上述塊的差分值和生成的上述預測圖像,生成上述塊的再現(xiàn)圖像;
上述預測圖像生成步驟,
(1)在上述畫面由幀構成,并且構成上述畫面的所有的塊被幀編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像;
(2)在上述畫面由場構成,并且構成上述畫面的所有的塊被場編碼的情況下,將從上述編碼信號提取到的加權系數(shù)作為場加權系數(shù),生成上述預測圖像;
(3)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被幀編碼時,將從上述編碼信號提取到的加權系數(shù)作為幀加權系數(shù),生成上述預測圖像;
(4)在上述畫面由幀構成,并且可自適應轉換對構成上述畫面的塊進行幀編碼或是場編碼而編碼的情況下,當上述塊被場編碼時,用從上述編碼信號提取到的加權系數(shù)生成場加權系數(shù),用生成的場加權系數(shù)生成上述預測圖像。
全文摘要
本發(fā)明提供一種動態(tài)圖像的編碼裝置及解碼裝置,特別涉及到采用加權系數(shù)來進行運動預測的編碼裝置、圖像解碼裝置及它們的方法。加權系數(shù)模式判定部13根據(jù)表示是否以塊為單位轉換場和幀的標志「AFF」的值,來判別是場模式還是幀模式,并通知給開關14、15及多路化部106。開關14、15按照所通知的模式進行場/幀的選擇。場加權系數(shù)編碼部11或幀加權系數(shù)編碼部12在選擇出的場合下,進行各自的加權系數(shù)編碼。
文檔編號G06T9/00GK101188762SQ20071018094
公開日2008年5月28日 申請日期2003年9月22日 優(yōu)先權日2002年10月1日
發(fā)明者角野真也, 近藤敏志, 安倍清史 申請人:松下電器產(chǎn)業(yè)株式會社