專利名稱:圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法及媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法以及可以被用于傳送和存儲圖象的媒體。
背景技術(shù):
當(dāng)對圖象進行合成時,存在這種情況,除了目標的亮度外還附加稱為α值的信息,表示目標的重疊區(qū)和透明度。確定每個象素的α值,α值為1表示完全不透明或遮斷,α值為0表示完全透明或不遮斷。當(dāng)目標圖象重疊在背景圖象上時α值變?yōu)楸夭豢缮?。以下將僅由這種α值表示的圖象稱為α平面。
在云、毛玻璃等情況中,可以采用介于
之間的α值來表示圖象,但是,存在用兩個值{0,1}就足夠的情況。
對應(yīng)傳統(tǒng)的二值α平面的編碼,可以采用傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼技術(shù),如MR和MMR,或者用JPEG進行標準化的編碼技術(shù)。這種編碼方案通常稱為二值靜止圖象編碼。在二值靜止圖象編碼中,通過在掃描方向上從高階象素預(yù)測低階象素以及對它們之間的差值進行熵編碼能夠?qū)崿F(xiàn)有效的編碼。
在二值活動圖象中,如活動圖象的兩個順次α平面,可以利用順次幀之間的相關(guān)性。即,通過從以前獲得的具有高度相關(guān)性的二值圖象中預(yù)測待編碼的象素和對它們之間的差值進行編碼,而不是在掃描方向上從高階象素預(yù)測低階象素和對它們之間的差值進行編碼,能夠?qū)崿F(xiàn)有效的編碼。
然而,即使在編碼器或者解碼器上獲得與待編碼或解碼二值圖象具有高度相關(guān)性的二值圖象時,以現(xiàn)有技術(shù)進行的二值靜止圖象編碼僅利用了掃描方向上高階與低階象素之間的相關(guān)性,因此,現(xiàn)有技術(shù)一直存在需要大量代碼位數(shù)的問題。
對于傳統(tǒng)α平面的編碼,采用波形編碼,象以JPEG編碼方案進行的那樣。
然而,許多α平面具有絕大部分是均勻的而中間值沿邊界分布的特性。
由于這種α平面包含沿邊界的高頻成分,采用現(xiàn)有技術(shù)進行的波形編碼一直存在難以實現(xiàn)有效編碼的問題。
發(fā)明的公開考慮到現(xiàn)有技術(shù)的上述問題,本發(fā)明的一個目的是提供圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法以及其上記錄了使計算機執(zhí)行這些處理操作的程序的媒體,這里,從以前獲得的具有高度相關(guān)性的二值圖象中對待編碼的象素進行預(yù)測并對其差值進行編碼,由此能夠?qū)崿F(xiàn)比利用現(xiàn)有技術(shù)中所采用的二值圖象編碼和解碼技術(shù)更有效的編碼和解碼。
考慮到上述問題,本發(fā)明的再一個目的是提供圖象編碼裝置及其相應(yīng)的解碼裝置、圖象編碼方法及其相應(yīng)的圖象解碼方法以及存儲它們執(zhí)行程序的媒體,這里,對例如中間值的分布進行分析,對近似該分布的平滑函數(shù)和僅有兩個值(最大值和最小值)的二值基本圖象分別進行編碼,由此實現(xiàn)比現(xiàn)有技術(shù)所能實現(xiàn)的更有效的編碼。
本發(fā)明權(quán)利要求1是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;異或塊構(gòu)成裝置,通過依次地對所述目標塊和所述參考塊進行掃描和通過對所述兩個塊之間象素值進行異或而構(gòu)成異或塊;以及異或編碼裝置,產(chǎn)生代表所述異或結(jié)果的代碼序列并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求2是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;異或解碼裝置,通過對經(jīng)權(quán)利要求1圖象編碼裝置編碼的編碼數(shù)據(jù)進行解碼而恢復(fù)所述異或塊;以及目標塊構(gòu)成裝置,通過將所述異或塊與所述參考塊進行組合而構(gòu)成目標塊。
本發(fā)明權(quán)利要求9是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型選擇裝置,基于所述參考塊中參考象素周圍的象素的狀態(tài)從多個統(tǒng)計模型中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的目標塊;以及熵編碼裝置,基于所述的所選統(tǒng)計模型對所述目標象素進行熵編碼并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求12是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型選擇裝置,基于所述參考塊中參考象素周圍的象素的狀態(tài)從多個統(tǒng)計模型中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的目象素;以及熵解碼裝置,根據(jù)所述所選統(tǒng)計模型通過對權(quán)利要求9圖象編碼裝置輸出的編碼數(shù)據(jù)進行熵解碼而恢復(fù)所述目標塊。
本發(fā)明權(quán)利要求14是一種依照權(quán)利要求9的圖象編碼裝置,進一步包括運動估計裝置,通過所述參考二值圖象搜索與所述目標塊最相似的塊,從所述搜索結(jié)果獲得運動信息,這里,所述分塊裝置2是運動補償分塊裝置2,它利用所述運動信息將運動補償施加到所述參考二值圖象上而獲得參考塊,所述運動信息也是從所述圖象編碼裝置輸出的。
本發(fā)明權(quán)利要求15是一種依照權(quán)利要求12的圖象解碼裝置,這里,所述分塊裝置2是運動補償分塊裝置2,它利用從權(quán)利要求14圖象編碼裝置輸出的運動信息將運動補償施加到所述以前獲得的參考二值圖象上而獲得參考塊。
本發(fā)明權(quán)利要求16是一種依照權(quán)利要求9的圖象編碼裝置,進一步包括參考塊采用確定裝置,將所述目標塊與所述參考塊進行比較,根據(jù)所述比較的結(jié)果確定所述參考塊是否被采用,由此切換各個裝置之間其余的處理;以及目標象素編碼裝置,產(chǎn)生代表所述目標塊中象素值的代碼序列并將其輸出為編碼數(shù)據(jù),這里,當(dāng)所述參考塊采用確定裝置確定所述參考塊被采用時,所述熵編碼裝置和所述統(tǒng)計模型選擇裝置這樣操作,即輸出所述熵編碼裝置的所述編碼數(shù)據(jù),而另一方面,當(dāng)確定所述參考塊不被采用時,所述目標象素編碼裝置這樣操作,即輸出所述目標象素編碼裝置的所述編碼數(shù)據(jù),確定所述參考塊是否被采用的結(jié)果作為參考塊采用確定信號而輸出。
本發(fā)明權(quán)利要求18是一種依照權(quán)利要求12的圖象解碼裝置,進一步包括參考塊采用控制裝置,根據(jù)從權(quán)利要求16或17圖象編碼裝置輸出的參考塊采用確定信號確定所述參考塊是否被采用,由此切換各個裝置之間其余的處理;以及目標象素解碼裝置,通過對所述圖象編碼裝置輸出的所述編碼數(shù)據(jù)進行解碼而恢復(fù)所述目標塊,這里,當(dāng)所述參考塊采用控制裝置確定所述參考塊被采用時,所述熵解碼裝置和所述統(tǒng)計模型選擇裝置這樣操作,即從所述熵解碼裝置輸出所述目標塊,而另一方面,當(dāng)確定所述參考塊不被采用時,所述目標象素解碼裝置這樣操作,即從所述目標象素解碼裝置輸出所述目標塊。
本發(fā)明權(quán)利要求20是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型產(chǎn)生裝置,從所述參考塊產(chǎn)生目標象素的統(tǒng)計模型;以及熵編碼裝置,基于所述產(chǎn)生的統(tǒng)計模型對所述目標象素進行熵編碼并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求21是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型產(chǎn)生裝置,從所述參考塊產(chǎn)生目標象素的統(tǒng)計模型;以及熵解碼裝置,根據(jù)所述產(chǎn)生的統(tǒng)計模型通過對權(quán)利要求20圖象編碼裝置輸出的編碼數(shù)據(jù)進行熵解碼而恢復(fù)所述目標塊。
本發(fā)明權(quán)利要求26是一種圖象編碼方法,包括步驟取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;通過依次地對所述目標塊和所述參考塊進行掃描和通過對所述兩個塊之間象素值進行異或而構(gòu)成異或塊;以及產(chǎn)生代表所述異或結(jié)果的代碼序列并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求27是一種圖象解碼方法,包括步驟通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;取由權(quán)利要求26圖象編碼方法編碼的編碼數(shù)據(jù)為輸入,通過對所述編碼數(shù)據(jù)進行解碼而恢復(fù)所述異或塊;以及通過將所述異或塊與所述參考塊進行組合而構(gòu)成目標塊。
本發(fā)明權(quán)利要求28是一種圖象編碼方法,包括分塊步驟1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊步驟2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型選擇步驟,基于所述參考塊中參考象素周圍的象素的狀態(tài)從多個統(tǒng)計模型中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的目標塊;以及熵編碼步驟,基于所述的所選統(tǒng)計模型對所述目標象素進行熵編碼并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求29是一種圖象解碼方法,包括分塊步驟2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統(tǒng)計模型選擇步驟,基于所述參考塊中參考象素周圍的象素的狀態(tài)從多個統(tǒng)計模型中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的目標塊;以及熵解碼步驟,根據(jù)所述所選統(tǒng)計模型通過對按照權(quán)利要求28圖象編碼方法輸出的編碼數(shù)據(jù)進行熵解碼而恢復(fù)所述目標塊。
本發(fā)明權(quán)利要求30是一種依照權(quán)利要求28的圖象編碼方法,進一步包括運動估計步驟,通過所述參考二值圖象搜索與所述目標塊最相似的塊,以及從所述搜索的結(jié)果獲得運動信息,這里,所述分塊步驟2是指運動補償分塊步驟2,它利用所述運動信息將運動補償施加到所述參考二值圖象上而獲得參考塊,所述運動信息也是由所述圖象編碼方法輸出的。
本發(fā)明權(quán)利要求31是一種依照權(quán)利要求29的圖象解碼方法,這里,所述分塊步驟2是指運動補償分塊步驟2,它利用按照權(quán)利要求30圖象編碼方法輸出的運動信息將運動補償施加到所述以前獲得的參考二值圖象上而獲得參考塊。
本發(fā)明權(quán)利要求32是一種依照權(quán)利要求28的圖象編碼方法,進一步包括參考塊采用確定步驟,將所述目標塊與所述參考塊進行比較,根據(jù)所述比較的結(jié)果確定所述參考塊是否被采用,由此切換接下來步驟的執(zhí)行;以及目標象素編碼步驟,產(chǎn)生代表所述目標塊中象素值的代碼序列并將其輸出為編碼數(shù)據(jù),這里,當(dāng)在所述參考塊采用確定步驟中確定所述參考塊被采用時,執(zhí)行所述熵編碼步驟和所述統(tǒng)計模型選擇步驟,從而由所述熵編碼步驟輸出所述編碼數(shù)據(jù),而另一方面,當(dāng)確定所述參考塊不被采用時,執(zhí)行所述目標象素編碼步驟,從而由所述目標象素編碼步驟輸出所述編碼數(shù)據(jù),所述參考塊是否被采用的確定結(jié)果作為參考塊采用確定信號而輸出。
本發(fā)明權(quán)利要求34是一種依照權(quán)利要求29的圖象解碼方法,進一步包括參考塊采用控制步驟,根據(jù)按照權(quán)利要求32或33圖象編碼方法輸出的參考塊采用確定信號確定所述參考塊是否被采用,由此切換接下來步驟的執(zhí)行;以及目標象素解碼步驟,通過對按照所述圖象編碼方法輸出的所述編碼數(shù)據(jù)進行解碼而恢復(fù)所述目標塊,這里,當(dāng)在所述參考塊采用控制步驟中確定所述參考塊被采用時,執(zhí)行所述熵解碼步驟和所述統(tǒng)計模型選擇步驟,從而從所述熵解碼步驟輸出所述目標塊,而另一方面,當(dāng)確定所述參考塊不被采用時,執(zhí)行所述目標象素解碼步驟,從而從所述目標象素解碼步驟輸出所述目標塊。
本發(fā)明權(quán)利要求36是一種圖象編碼方法,包括步驟取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;從所述參考塊產(chǎn)生目標象素的統(tǒng)計模型;以及基于所述產(chǎn)生的統(tǒng)計模型對所述目標象素進行熵編碼并將其輸出為編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求37是一種圖象解碼方法,包括步驟通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;從所述參考塊產(chǎn)生目標象素的統(tǒng)計模型;以及根據(jù)所述產(chǎn)生的統(tǒng)計模型通過對按照權(quán)利要求36圖象編碼方法輸出的編碼數(shù)據(jù)進行熵解碼而恢復(fù)所述目標塊。
本發(fā)明權(quán)利要求40是一種圖象編碼裝置,包括多值至二值轉(zhuǎn)換裝置,取待編碼的目標多值圖象和平滑函數(shù)作為輸入,基于所述平滑函數(shù)由所述多值圖象產(chǎn)生二值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);以及平滑函數(shù)編碼裝置,對所述平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù),這里,所述平滑函數(shù)是指一種這樣調(diào)節(jié)功能,即如果將所述平滑函數(shù)運用到所述二值圖象上能夠有效地再現(xiàn)原始的多值圖象。
本發(fā)明權(quán)利要求42是一種圖象編碼裝置,包括平滑函數(shù)估計裝置,由待編碼的目標多值圖象估計平滑函數(shù);多值至二值轉(zhuǎn)換裝置,基于確定與所述所估計平滑函數(shù)相匹配的多值至二值轉(zhuǎn)換準則將所述多值圖象轉(zhuǎn)換為二值圖象并將其輸出為二值圖象編碼數(shù)據(jù);二值圖象編碼裝置,對所述二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);以及平滑函數(shù)編碼裝置,對所述平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求43是一種圖象編碼裝置,包括多值至二值轉(zhuǎn)換裝置,由待編碼的目標多值圖象產(chǎn)生二值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);平滑函數(shù)產(chǎn)生裝置,由所述二值圖象和所述目標多值圖象產(chǎn)生平滑函數(shù);以及平滑函數(shù)編碼裝置,對所述平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求44是一種依照權(quán)利要求43的圖象編碼裝置,這里,所述平滑函數(shù)是利用由相鄰象素的二值化圖案和對應(yīng)于所述圖案的替換值構(gòu)成的一個或多個表來表示的。
本發(fā)明權(quán)利要求45是一種依照權(quán)利要求43的圖象編碼裝置,進一步包括二值至多值轉(zhuǎn)換裝置,利用所述平滑函數(shù)通過對所述二值圖象進行平滑而產(chǎn)生多值圖象;以及剩余成分編碼裝置,對由所述二值至多值轉(zhuǎn)換裝置產(chǎn)生的多值圖象與由所述多值至二值轉(zhuǎn)換裝置輸入進行轉(zhuǎn)換的所述目標多值圖象之間存在的剩余成分進行編碼。
本發(fā)明權(quán)利要求46是一種圖象編碼裝置,包括多值至二值轉(zhuǎn)換裝置,基于確定與所述多值相匹配的多值至二值轉(zhuǎn)換準則將多值圖象,即待編碼的目標圖象轉(zhuǎn)換為二值圖象;平滑函數(shù)估計裝置,這樣估計平滑函數(shù),即如果將所述平滑函數(shù)運用到所述二值圖象上能夠有效地再現(xiàn)原始的多值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);以及平滑函數(shù)編碼裝置,對所述所估計平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。
本發(fā)明權(quán)利要求48是一種圖象解碼裝置,包括接收由權(quán)利要求40、42、43或46圖象編碼裝置所編碼的各種編碼數(shù)據(jù)作為其輸入的裝置;二值圖象解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)所述二值圖象;平滑函數(shù)解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)所述平滑函數(shù);以及二值至多值轉(zhuǎn)換裝置,通過用所述已解碼的平滑函數(shù)對所述已解碼二值圖象進行平滑而恢復(fù)所述多值圖象。
本發(fā)明權(quán)利要求49是一種圖象解碼裝置,包括接收由權(quán)利要求47圖象編碼裝置所編碼的各種編碼數(shù)據(jù)作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)所述二值圖象;平滑函數(shù)解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)所述平滑函數(shù);動態(tài)范圍解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)所述動態(tài)范圍;以及二值至多值轉(zhuǎn)換裝置,通過用所述已解碼的平滑函數(shù)對所述已解碼二值圖象進行平滑和用所述已解碼的動態(tài)范圍對所述象素值進行轉(zhuǎn)換而恢復(fù)所述多值圖象。
本發(fā)明權(quán)利要求50是一種圖象解碼裝置,包括接收由權(quán)利要求44圖象編碼裝置所編碼的各種編碼數(shù)據(jù)作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)所述二值圖象;平滑函數(shù)解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)所述平滑函數(shù);以及二值至多值轉(zhuǎn)換裝置,通過用所述已解碼的平滑函數(shù)對所述已解碼二值圖象進行平滑而恢復(fù)所述多值圖象,這里,所述已解碼的平滑函數(shù)是利用由相鄰象素的二值化圖案和對應(yīng)于所述圖案的替換值構(gòu)成的一個或多個表來表示的。
本發(fā)明權(quán)利要求52是一種圖象解碼裝置,包括接收由權(quán)利要求45圖象編碼裝置所編碼的各種編碼數(shù)據(jù)作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)所述二值圖象;平滑函數(shù)解碼裝置,通過對所述編碼數(shù)據(jù)當(dāng)中的所述平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)所述平滑函數(shù);二值至多值轉(zhuǎn)換裝置,通過用所述已解碼的平滑函數(shù)對所述已解碼二值圖象進行平滑而恢復(fù)所述多值圖象;以及剩余成分解碼裝置,對所述剩余成分進行解碼,這里,輸出圖象是通過將所述已解碼的剩余成分加在所述二值至多值轉(zhuǎn)換裝置的輸出上而獲得的。
附圖簡述
圖1是本發(fā)明第A1實施例的圖象編碼裝置的方框圖。
圖2是本發(fā)明第A2實施例的圖象解碼裝置的方框圖。
圖3是本發(fā)明第A3實施例的圖象編碼裝置的方框圖。
圖4是本發(fā)明第A4實施例的圖象解碼裝置的方框圖。
圖5是本發(fā)明第A5實施例的圖象編碼裝置的方框圖。
圖6是本發(fā)明第A6實施例的圖象解碼裝置的方框圖。
圖7是本發(fā)明第A7實施例的圖象編碼裝置的方框圖。
圖8是本發(fā)明第A8實施例的圖象解碼裝置的方框圖。
圖9是本發(fā)明第A9實施例的圖象編碼裝置的方框圖。
圖10是本發(fā)明第A10實施例的圖象解碼裝置的方框圖。
圖11是本發(fā)明第A11實施例的圖象編碼裝置的方框圖。
圖12是本發(fā)明第A12實施例的圖象解碼裝置的方框圖。
圖13是本發(fā)明第A13實施例的圖象編碼裝置的方框圖。
圖14是本發(fā)明第A14實施例的圖象解碼裝置的方框圖。
圖15是本發(fā)明第A15實施例的圖象編碼裝置的方框圖。
圖16是本發(fā)明第A16實施例的圖象解碼裝置的方框圖。
圖17是本發(fā)明第A17實施例的圖象編碼裝置的方框圖。
圖18是本發(fā)明第A18實施例的圖象解碼裝置的方框圖。
圖19是表明掩膜運動圖象中參考圖象和目標圖象的圖。
圖20是說明如何構(gòu)成異或塊的圖。
圖21是說明算術(shù)編碼原理的圖。
圖22是算術(shù)編碼的方框圖。
圖23是表明一部分統(tǒng)計模型表的圖。
圖24是表明一部分統(tǒng)計模型表的圖。
圖25是表明一部分統(tǒng)計模型表的圖。
圖26是表明一部分統(tǒng)計模型表的圖。
圖27是說明外推參考塊的圖。
圖28是說明統(tǒng)計模型表中指數(shù)的圖。
圖29是頻度-產(chǎn)生幾率轉(zhuǎn)換圖的說明圖。
圖30是本發(fā)明另一實施例的圖象編碼裝置的方框圖。
圖31是根據(jù)同一實施例的圖象解碼裝置的方框圖。
圖32是本發(fā)明又一實施例的圖象編碼裝置的方框圖。
圖33是根據(jù)同一實施例的圖象解碼裝置的方框圖。
圖34是本發(fā)明再一實施例的圖象編碼裝置的方框圖。
圖35是根據(jù)同一實施例的圖象解碼裝置的方框圖。
圖36是本發(fā)明第B1實施例的圖象編碼裝置的方框圖。
圖37是表明同一實施例中所使用的多值圖象的圖。
圖38是沿圖37中A-B線的象素值的分布圖。
圖39是根據(jù)第B1實施例的平滑函數(shù)估計裝置的方框圖。
圖40是本實施例中所使用的非最大值抑制的說明圖。
圖41表明歸一化平均梯度與第B1實施例平滑濾波之間的對應(yīng)關(guān)系。
圖42是根據(jù)第B1實施例的平滑濾波器的說明圖。
圖43是說明根據(jù)第B1實施例的平滑濾波步驟響應(yīng)的圖。
圖44是說明本實施例中所使用的閾值化的圖。
圖45是本發(fā)明第B2實施例的圖象解碼裝置的方框圖。
圖46是本實施例中所使用的象素值轉(zhuǎn)換的圖。
圖47是本發(fā)明第B3實施例的圖象編碼裝置的方框圖。
圖48是根據(jù)第B3實施例的平滑函數(shù)估計裝置的方框圖。
圖49表明歸一化平均梯度與根據(jù)第B3實施例平滑濾波之間的對應(yīng)關(guān)系。
圖50是說明第B1實施例的平滑濾波器的圖。
圖51是說明根據(jù)第B1實施例的平滑濾波步驟響應(yīng)的圖。
圖52是說明本實施例中形態(tài)濾波器的圖。
圖53是本發(fā)明第B4實施例的圖象解碼裝置的方框圖。
圖54是本發(fā)明第B5實施例的圖象編碼裝置的方框圖。
圖55是根據(jù)第B5實施例的平滑函數(shù)估計裝置的方框圖。
圖56是說明第B5實施例的平滑濾波器的圖。
圖57是本發(fā)明第B6實施例的圖象解碼裝置的方框圖。
圖58是本發(fā)明第B7實施例的圖象編碼裝置的方框圖。
圖59是本發(fā)明第B8實施例的圖象解碼裝置的方框圖。
圖60是說明第B7、B8、B9和B10實施例中平滑圖案的圖。
圖61是說明第B7、B8、B9和B10實施例中多級平滑的圖。
圖62是本發(fā)明第B9實施例的圖象編碼裝置的方框圖。
圖63是本發(fā)明第B10實施例的圖象解碼裝置的方框圖。
圖64是本發(fā)明第B11實施例的圖象解碼裝置的方框圖。
圖65是第B1實施例的改進例中圖象編碼裝置的方框圖。
圖66是本發(fā)明另一實施例的圖象編碼裝置的方框圖。
圖67是圖66所示實施例的改進例中圖象編碼裝置的方框圖。
圖68是第B11實施例的改進例中圖象編碼裝置的方框圖。
圖69是本發(fā)明另一實施例的圖象編碼裝置的方框圖。
(參考標號的說明)101分塊裝置1102分塊裝置2103異或塊構(gòu)成裝置104異或編碼裝置
201異或解碼裝置202分塊裝置2203目標塊構(gòu)成裝置301分塊裝置1302運動補償分塊裝置2303異或塊構(gòu)成裝置304異或編碼裝置305運動估計裝置401異或解碼裝置402運動補償分塊裝置2403目標塊構(gòu)成裝置501分塊裝置1502分塊裝置2503異或塊構(gòu)成裝置504異或編碼裝置505參考塊采用確定裝置506目標象素編碼裝置601異或解碼裝置602分塊裝置2603目標塊構(gòu)成裝置604參考塊采用控制裝置605目標象素解碼裝置701分塊裝置1702分塊裝置2703統(tǒng)計模型估計裝置704統(tǒng)計模型705熵編碼裝置801熵解碼裝置802分塊裝置2803統(tǒng)計模型估計裝置
804統(tǒng)計模型901分塊裝置1902運動補償分塊裝置903統(tǒng)計模型估計裝置904統(tǒng)計模型905熵編碼裝置906運動估計裝置1001熵解碼裝置1002運動補償分塊裝置21003統(tǒng)計模型選擇裝置1004統(tǒng)計模型表1101分塊裝置11102分塊裝置21103統(tǒng)計模型選擇裝置1104統(tǒng)計模型表1105熵編碼裝置1106參考塊采用確定裝置1107目標象素編碼裝置1201熵解碼裝置1202分塊裝置21203統(tǒng)計模型選擇裝置1204統(tǒng)計模型表1205參考塊采用控制裝置1206目標象素解碼裝置1301分塊裝置11302分塊裝置21303統(tǒng)計模型估計裝置1304統(tǒng)計模型1305熵編碼裝置1401熵解碼裝置
1402分塊裝置21403統(tǒng)計模型估計裝置1404統(tǒng)計模型1501分塊裝置11502運動補償分塊裝置21503熵編碼裝置1504統(tǒng)計模型估計裝置1505統(tǒng)計模型1506運動估計裝置1601熵解碼裝置1602運動補償分塊裝置21603統(tǒng)計模型估計裝置1604統(tǒng)計模型1701分塊裝置11702分塊裝置21703統(tǒng)計模型估計裝置1704統(tǒng)計模型1705熵估計裝置1706參考塊采用確定裝置1707目標象素編碼裝置1801熵解碼裝置1802分塊裝置21803統(tǒng)計模型估計裝置1804統(tǒng)計模型1805參考塊采用控制裝置1806目標象素解碼裝置1901掩膜運動圖象1902參考圖象1903目標圖象1904參考塊圖象
1905目標塊圖象2001參考塊2002目標塊2003異或塊2101數(shù)值線2102范圍2103二進制小數(shù)2104產(chǎn)生幾率模型2105符號串2201開始2202對范圍進行初始化2203輸入符號2204限制范圍2205是結(jié)束符號嗎?2206輸出二進制小數(shù)2207結(jié)束2301統(tǒng)計模型表2401參考塊2402外推參考塊2403外推參考塊2501參考塊2502目標塊2503參考掩膜2504目標掩膜2601轉(zhuǎn)換圖10101動態(tài)范圍估計裝置10102平滑函數(shù)估計裝置10103多值-二值轉(zhuǎn)換裝置10104二值圖象編碼裝置10105動態(tài)范圍編碼裝置
10106平滑函數(shù)編碼裝置10201多值圖象10301 X-方向濾波10302 Y-方向濾波10303梯度檢測10304梯度方向檢測10305非最大值抑制10306平均梯度檢測10307平滑函數(shù)選擇10601濾波器110602濾波器210603濾波器310604濾波器410901二值圖象解碼裝置10902平滑函數(shù)解碼裝置10903動態(tài)范圍解碼裝置10904二值-多值轉(zhuǎn)換裝置10905二值掩膜應(yīng)用裝置11101動態(tài)范圍估計裝置11102平滑函數(shù)估計裝置11103多值-二值轉(zhuǎn)換裝置11104二值圖象編碼裝置11105動態(tài)范圍編碼裝置11106平滑函數(shù)編碼裝置11201 X-方向濾波11202 Y-方向濾波11203梯度檢測11204梯度方向檢測11205非最大值抑制11206平均梯度檢測
11207平滑函數(shù)構(gòu)成11401平滑濾波步驟211402平滑濾波步驟311403平滑濾波步驟411404平滑濾波系數(shù)表11601形態(tài)濾波111602形態(tài)濾波211603形態(tài)濾波311701二值圖象解碼裝置11702平滑函數(shù)解碼裝置11703動態(tài)范圍解碼裝置11704二值-多值轉(zhuǎn)換裝置11801動態(tài)范圍估計裝置11802平滑函數(shù)估計裝置11803多值-二值轉(zhuǎn)換裝置11804二值圖象編碼裝置11805動態(tài)范圍編碼裝置11806平滑函數(shù)系數(shù)編碼裝置11901 X-方向濾波11902 Y-方向濾波11903梯度檢測11904梯度方向檢測11905非最大值抑制11906平均梯度檢測11907平滑函數(shù)產(chǎn)生12101二值圖象解碼裝置12102平滑函數(shù)系數(shù)解碼裝置12103動態(tài)范圍解碼裝置12104二值-多值轉(zhuǎn)換裝置12201多值-二值轉(zhuǎn)換裝置
12202二值圖象編碼裝置12203平滑函數(shù)估計裝置12204平滑函數(shù)編碼裝置12301二值圖象解碼裝置12302平滑函數(shù)解碼裝置12303二值-多值轉(zhuǎn)換裝置12601多值-二值轉(zhuǎn)換裝置12602二值圖象編碼裝置12603平滑函數(shù)估計裝置12604平滑函數(shù)編碼裝置12605二值-多值轉(zhuǎn)換裝置12606差分計算器12607剩余編碼裝置12701二值圖象解碼裝置12702平滑函數(shù)解碼裝置12703二值-多值轉(zhuǎn)換裝置12704剩余解碼裝置12705加法器實現(xiàn)本發(fā)明的最佳方式以下將參考附圖描述本發(fā)明的實施例。
(實施例A1)圖1是表明本發(fā)明一個實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。
在圖1中,分塊裝置1(101)是將待編碼的目標圖象作為輸入并將輸入圖象劃分成多個各由多個象素組成的塊的裝置。分塊裝置2(102)是將以前獲得的參考圖象劃分成多個各由多個象素組成的塊的裝置。異或塊構(gòu)成裝置(103)是通過對由分塊裝置1(101)劃分的圖象所獲取的目標塊和由分塊裝置2(102)劃分的圖象所獲取的參考塊進行掃描以及對它們之間的象素值進行異或而構(gòu)成一個異或塊的裝置。異或編碼裝置(104)是對異或塊進行編碼并輸出編碼數(shù)據(jù)的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作以及按照本發(fā)明一個實施例的圖象編碼方法的操作。
這里,將如圖19所示的人的運動掩膜圖象(1901)的第(t+1)幀作為目標二值圖象,將第t幀(1902)作為參考二值圖象。在以下所述的附圖中,值1代表黑,值0代表白。目標二值圖象(1903)被分塊裝置1(101)劃分為8×8象素的目標塊,如目標塊圖象(1905)所示。然而,分塊裝置1(101)中的圖象分塊不限于8×8象素或16×16象素的塊。同樣,參考二值圖象(1902)被劃分為參考塊,如參考塊圖象(1904)所示。
參考二值圖象(1902)被分塊裝置2(102)劃分為8×8象素的參考塊,如參考塊圖象(204)中所示。然而,分塊裝置2(102)中的圖象分塊不限于8×8象素或16×16象素的塊。
圖20中所示的目標塊(2002)是從目標塊圖象(1905)中獲得的一個塊。參考塊(2001)是從參考塊圖象(1904)中獲得的與目標塊(2001)相匹配的一個塊。異或塊構(gòu)成裝置(103)從左上到右下對目標塊(2002)和參考塊(2001)進行掃描,對它們之間的象素值進行異或,由此而構(gòu)成異或塊(2003)。異或編碼裝置(104)采用通常稱為算術(shù)編碼的技術(shù)對由0和1組成的異或塊(2003)進行編碼。下面將簡要地描述一下算術(shù)編碼(參考Hiroshi Yasuda,“多媒體編碼的國際標準”,第3章算術(shù)編碼,Maruzen出版)。
圖21是說明算術(shù)編碼原理的圖。在算術(shù)編碼中,利用符號串(2105)和符號產(chǎn)生幾率模型(2104),從0到1的數(shù)值線(2101)逐次限制來自符號串(2105)的每個符號輸入,不管下一個將是什么,將不超出所獲范圍(2102)的最短二進制小數(shù)(2103)輸出為編碼數(shù)據(jù)。
圖22示出了算術(shù)編碼的流程圖。在2201中,開始進行算術(shù)編碼。在2202中,將范圍初始化為由0和1限制的間隔。在2203中,輸入符號。在2204中,將產(chǎn)生幾率模型指定為當(dāng)前范圍并將輸入符號的幾率范圍設(shè)定為新范圍。在2205中,如果符號是結(jié)束符號,那么,在2206中由被輸出的二進制小數(shù)表示范圍,在2207中終止算術(shù)編碼。如果在2205中符號不是結(jié)束符號,那么,在2203中輸入下一個符號。如果符號的數(shù)目是預(yù)定的,那么可以省略結(jié)束符號。
通過確定來自二進制小數(shù)的符號串而進行解碼。眾所周知,算術(shù)編碼具有符號與符號的產(chǎn)生幾率模型匹配得越好,符號產(chǎn)生幾率偏移越大,對符號串進行編嗎的代碼位越少的特點。人們還知道,即使在編碼期間改變了產(chǎn)生幾率模型,如果改變模型的方法是已知的,也能夠進行解碼。
利用上述算術(shù)編碼和將(0,0.9)作為符號0和(0.9,1.0)作為符號1的產(chǎn)生幾率模型,異或塊編碼裝置(104)產(chǎn)生由0和1符號串組成的異或塊的編碼序列并將其輸出為編碼數(shù)據(jù)。
如上所述,在本實施例中,利用在掩膜運動圖象等的情況中由目標塊和參考塊的異或以約9∶1比率得到符號0和符號1的產(chǎn)生幾率的特點,以及通過將異或與算術(shù)編碼相結(jié)合,能夠?qū)崿F(xiàn)具有較少代碼位數(shù)的有效編碼。
(實施例A2)圖2是表明本發(fā)明一個實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在本圖中,異或解碼裝置(201)是將編碼數(shù)據(jù)作為輸入并對其進行解碼以恢復(fù)異或塊的裝置。分塊裝置2(202)是將以前獲得的參考圖象劃分成多個各由多個象素組成的參考塊的裝置。目標塊構(gòu)成裝置(203)是從異或解碼裝置(201)提供的異或塊和分塊裝置(202)提供的參考塊中恢復(fù)目標塊的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作以及按照本發(fā)明一個實施例的圖象解碼方法的操作。
異或解碼裝置(201)是算術(shù)編碼的解碼器,其產(chǎn)生幾率模型象異或編碼裝置(104)一樣的將(0,0.9)作為符號0和(0.9,1.0)作為符號1。異或塊是象編碼數(shù)據(jù)和產(chǎn)生幾率模型一樣通過從二進制小數(shù)產(chǎn)生的符號串并按掃描方向排列這些符號而構(gòu)成的。
在操作中,分塊裝置2(202)等效于分塊裝置2(102)。目標塊構(gòu)成裝置(203)通過對異或塊和參看塊進行掃描以及將參考塊中其值在異或塊中為1的象素的象素值反轉(zhuǎn)構(gòu)成目標塊。
如上所述,在本實施例中,利用在掩膜運動圖象等的情況中由目標塊和參考塊的異或以約9∶1比率得到符號0和符號1的產(chǎn)生幾率的特點,以及通過將異或與算術(shù)編碼相結(jié)合,能夠?qū)崿F(xiàn)具有較少代碼位數(shù)的有效解碼。
(實施例A3)圖3是表明本發(fā)明一個實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在本圖中,分塊裝置1(301)是將待編碼的目標圖象作為輸入并將輸入圖象劃分成多個各由多個象素組成的塊的裝置。運動估計裝置(305)是通過參考圖象搜索同目標塊相似的塊并產(chǎn)生該塊的運動矢量的裝置。運動補償分塊裝置2(302)是將參考圖象和運動信息作為輸入并根據(jù)運動信息將輸入?yún)⒖紙D象劃分成多個各由多個象素組成的塊的裝置。異或塊構(gòu)成裝置(303)是通過對由分塊裝置1(301)劃分的圖象所獲取的目標塊和由運動補償分塊裝置2(302)劃分的圖象所獲取的參考塊進行掃描以及對它們之間的象素值進行異或而構(gòu)成一個異或塊的裝置。異或編碼裝置(304)是對異或塊進行編碼并輸出編碼數(shù)據(jù)的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作以及按照本發(fā)明一個實施例的圖象編碼方法的操作。
在操作中,分塊裝置1(301)等效于分塊裝置1(101)。當(dāng)待估計的運動矢量由v表示、目標塊中的象素數(shù)目由m表示、圖象中每個象素的位置由u_i(i=1至m)表示、目標圖象中位置x上的象素值由A(x)表示、參考圖象中位置x上的象素值由B(x)表示時,運動估計裝置(305)在預(yù)定范圍內(nèi)檢測使相似性S(v)(方程式A1)到達最小的v并將v輸出為運動矢量。
(方程式A1)S(v)=Σj=1m|a(u_i+v)-B(u_i)|----(1)]]>運動補償分塊裝置(302)通過運動矢量使從參考圖象獲取的塊移動并產(chǎn)生輸出的參考塊。在操作中,異或塊構(gòu)成裝置(303)等效于異或塊構(gòu)成裝置(103)。異或編碼裝置(304)等效于異或編碼裝置(104)。
如上所述,根據(jù)本實施例,利用運動估計裝置和運動補償分塊裝置,以使得產(chǎn)生幾率的比率更接近9∶1的這種方式將運動補償運用于在異或塊中符號0和符號1的產(chǎn)生幾率遠不同于9∶1比率的塊上,能夠?qū)崿F(xiàn)具有較少代碼位數(shù)的有效編碼。
(實施例A4)圖4是表明本發(fā)明一個實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在本圖中,異或解碼裝置(401)是將編碼數(shù)據(jù)作為輸入并對其進行解碼以恢復(fù)異或塊的裝置。運動補償分塊裝置2(402)是將參考圖象和運動信息作為輸入并根據(jù)該運動信息將輸入?yún)⒖紙D象劃分成多個各由多個象素組成的塊的裝置。目標塊構(gòu)成裝置(403)是從異或解碼裝置(401)提供的異或塊和運動補償分塊裝置(402)提供的參考塊恢復(fù)目標塊的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作以及按照本發(fā)明一個實施例的圖象解碼方法的操作。
在操作中,異或塊解碼裝置(401)等效于異或塊解碼裝置(201)。運動補償分塊裝置2(402)等效于運動補償分塊裝置2(302)。目標塊構(gòu)成裝置(403)等效于目標塊構(gòu)成裝置(203)。
如上所述,根據(jù)本實施例,利用運動估計裝置和運動補償分塊裝置,以使得產(chǎn)生幾率的比率更接近9∶1的這種方式將運動補償運用于在異或塊中符號0和符號1的產(chǎn)生幾率遠不同于9∶1比率的塊上,能夠?qū)崿F(xiàn)具有較少代碼位數(shù)的有效解碼。
(實施例A5)圖5是表明本發(fā)明一個實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在本圖中,分塊裝置1(501)是將待編碼的目標圖象作為輸入并將輸入圖象劃分成多個各由多個象素組成的塊的裝置。分塊裝置2(502)是將參考圖象劃分成多個各由多個象素組成的塊的裝置。異或塊構(gòu)成裝置(503)是通過對由分塊裝置1(501)劃分的圖象所獲取的目標塊和由分塊裝置2(502)劃分的圖象所獲取的參考塊進行掃描以及通過對它們之間的象素值進行異或而構(gòu)成一個異或塊的裝置。異或編碼裝置(504)是對異或塊進行編碼并輸出編碼數(shù)據(jù)的裝置。參考塊采用確定裝置(505)是將目標塊與參考塊進行比較以及輸出參考塊采用確定信號以切換下一步處理的裝置。目標象素編碼裝置(506)是對目標塊進行編碼并輸出編碼數(shù)據(jù)的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作以及按照本發(fā)明一個實施例的圖象編碼方法的操作。
在操作中,分塊裝置1(501)等效于分塊裝置1(101),分塊裝置2(502)等效于分塊裝置2(102)。如果絕對差之和大于或等于閾值則利用目標象素編碼裝置(506)進行編碼,如果絕對差之和小于閾值則利用異或塊構(gòu)成裝置(503)和異或編碼裝置(504)進行編碼,參考塊采用確定裝置(505)以這種方式,根據(jù)目標塊與參考塊之間的絕對差之和(SAD)輸出參考塊采用確定信號,進行處理的切換。這里,5用作閾值。在操作中,異或塊構(gòu)成裝置(503)等效于異或塊構(gòu)成裝置(103),異或編碼裝置(504)等效于異或編碼裝置(104)。目標象素編碼裝置(506)大體上等效于異或編碼裝置(504),是一個將目標塊作為輸入的算術(shù)編碼器,其產(chǎn)生幾率模型取
]>在梯度方向檢測(10304)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過對下列方程式B2的計算,對梯度方向θ(i,j)進行檢測,這里(i,j)是圖象上的坐標。
(方程式B2)θ=tan-1dydx----(2)]]>在非最大值抑制(10305)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產(chǎn)生圖象,即如果在窗口中參考點上的梯度值是最大值,那么給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(10306)中,對于由非最大值抑制(10305)所獲得的二值圖象中的取1值的象素,通過計算梯度檢測(10303)中所檢測到梯度的平均值可獲得平均梯度d’ave。此外,利用動態(tài)范圍估計裝置(10101)所檢測的最大象素值Dmax和最小象素值Dmin,由以下的方程式B3重新計算歸一化的平均梯度,得到dave。
(方程式B3)dave=255Dmax-Dmind'ave----(3)]]>如圖41所示,平滑函數(shù)選擇裝置(10307)根據(jù)平均梯度dave選擇一個平滑濾波器。圖42示出圖41中平滑濾波器1的詳細情況。在圖42中,劃圓圈的位置表示接受平滑的象素的位置。在對圖象掃描時,分別計算與濾波器1的卷積結(jié)果(10601)、與濾波器2的卷積結(jié)果(10602)、與濾波器3的卷積結(jié)果(10603)和與濾波器4的卷積結(jié)果(10604),取四個濾波器的最小值為平滑濾波器1的結(jié)果。在圖42中,a、b、c、d、e、f、g和h各為0.5。平滑濾波器2是在應(yīng)用平滑濾波器1之后應(yīng)用平滑濾波器1的濾波器。
平滑濾波器3是在應(yīng)用平滑濾波器2之后應(yīng)用平滑濾波器1的濾波器。當(dāng)dave大于191時,由于圖象的梯度被認為是代表階躍邊緣,所以不應(yīng)用平滑濾波器進行平滑。另一方面,當(dāng)dave小于10時,由于被認為不存在圖象梯度,所以不應(yīng)用平滑濾波器進行平滑。
考慮到平滑函數(shù)估計裝置(10102)所估計的平滑函數(shù)的特征,多值至二值轉(zhuǎn)換轉(zhuǎn)換裝置(10103)將多值圖象轉(zhuǎn)換為僅具有兩個象素值255和0的二值圖象。圖43示出平滑濾波器1、平滑濾波器2和平滑濾波器3對一維階躍的響應(yīng),于是,對應(yīng)于平滑濾波器1、平滑濾波器2和平滑濾波器3的多值至二值的轉(zhuǎn)換是諸如圖44所示的閾值化。因此,多值至二值轉(zhuǎn)換裝置(10103)將圖44所示的閾值化運用到多值圖象上。
二值圖象編碼裝置(10104)利用二值圖象編碼方案MMR(在傳真系統(tǒng)常用的CCITT國際標準中所定義的)對二值圖象進行編碼并輸出編碼數(shù)據(jù)。
平滑函數(shù)編碼裝置(10106)對平滑函數(shù)估計裝置(10102)所估計的平滑函數(shù)進行編碼并輸出編碼數(shù)據(jù)。在本實施例中,由于平滑函數(shù)是從三個平滑函數(shù)中選出的,所以對所選平滑函數(shù)的識別號進行編碼,將其輸出為編碼數(shù)據(jù)。
動態(tài)范圍編碼裝置(10105)分別對動態(tài)范圍估計裝置(10101)所獲得的Dmax和Dmin進行編碼并將其輸出為編碼數(shù)據(jù)。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有一致的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及將結(jié)果輸出為編碼數(shù)據(jù),能夠?qū)崿F(xiàn)有效的編碼。
(實施例B2)圖45是表明本發(fā)明第B2實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,二值圖象解碼裝置(10901)是通過對二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)二值圖象的裝置。
平滑函數(shù)解碼裝置(10902)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù)的裝置。
動態(tài)范圍解碼裝置(10903)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)動態(tài)范圍的裝置。
二值至多值轉(zhuǎn)換裝置(10904)是通過利用平滑函數(shù)解碼裝置(10902)所恢復(fù)的平滑函數(shù)對二值圖象進行平滑以及通過利用動態(tài)范圍解碼裝置(10903)所恢復(fù)的動態(tài)范圍進行亮度轉(zhuǎn)換而恢復(fù)多值圖象的裝置。
二值掩膜應(yīng)用裝置(10905)是通過用二值圖象解碼裝置(10901)所恢復(fù)的二值圖象把掩膜化應(yīng)用到多值圖象上而獲得新的多值圖象的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(10901)通過對利用傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼方案MMR進行編碼的二值圖象編碼數(shù)據(jù)進行解碼,恢復(fù)僅具有兩個象素值0和255的二值圖象。
平滑函數(shù)解碼裝置(10902)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù)。
動態(tài)范圍解碼裝置(10903)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)最大象素值Dmax和最小象素值Dmin。
二值至多值轉(zhuǎn)換裝置(10904)實際上應(yīng)用平滑函數(shù)解碼裝置(10902)所恢復(fù)的平滑濾波器。(對于應(yīng)用平滑濾波器的方法,參考平滑函數(shù)選擇裝置(10307)和圖42的描述)。此外,利用動態(tài)范圍解碼裝置(10903)所恢復(fù)的最大象素值Dmax和最小象素值Dmin,進行如圖46所示的線性轉(zhuǎn)換,恢復(fù)多值圖象。在二值掩膜應(yīng)用裝置(10905)中,利用二值圖象解碼裝置(10901)所恢復(fù)的二值圖象,與二值圖象中0值象素相對應(yīng)的多值圖象中象素的值被強迫改變?yōu)镈min,從而使編碼的多值圖象中具有最小象素值的象素不會取最小象素值以外的其它任何值。當(dāng)需要限制Dmin的位置以維持與紋理數(shù)據(jù)的匹配時,二值掩膜應(yīng)用裝置(10905)是特別有效的,但是,如果沒有這樣的需要,則可以省略該裝置。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及對編碼數(shù)據(jù)進行解碼并輸出,能夠?qū)崿F(xiàn)具有較少代碼位的有效解碼。
(實施例B3)圖47是表明本發(fā)明第B3實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,動態(tài)范圍估計裝置(11101)是取目標多值圖象作為輸入、提取多值圖象中最大面積的象素值和次最大面積的象素值的裝置。
平滑函數(shù)估計裝置(11102)是取多值圖象和動態(tài)范圍作為輸入以及通過對多值圖象中亮度梯度的分析而估計平滑函數(shù)的裝置。
多值至二值轉(zhuǎn)換裝置(11103)是利用動態(tài)范圍、平滑函數(shù)和多值圖象產(chǎn)生二值圖象,從而在利用動態(tài)范圍進行亮度轉(zhuǎn)換和利用平滑函數(shù)進行平滑時能夠很好地接近多值圖象的裝置。
動態(tài)范圍編碼裝置(11104)是對動態(tài)范圍進行編碼和輸出編碼數(shù)據(jù)的裝置。
平滑函數(shù)編碼裝置(11105)是對平滑函數(shù)進行編碼和輸出編碼數(shù)據(jù)的裝置。
二值圖象編碼裝置(11106)是對二值圖象進行編碼和輸出編碼數(shù)據(jù)的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作。
動態(tài)范圍估計裝置(11101)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多個多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,最大象素值Dmax和最小象素值Dmin是通過對目標多值圖象的掃描提取的。
圖48示出平滑函數(shù)估計裝置(11102)。
在x-方向濾波(11201)中,應(yīng)用x-方向濾波器(10401)在圖象上掃描,沿x-方向?qū)D象中的梯度進行檢測。在y-方向濾波(11202)中,應(yīng)用y-方向濾波器(10402)在圖象上掃描,沿y-方向?qū)D象中的梯度進行檢測。
在梯度檢測(11203)中,利用x-方向濾波(11201)獲得的x-方向梯度dx(i,j)和y-方向濾波(11202)獲得的y-方向梯度dy(i,j),通過方程式B1的計算,對梯度d(i,j)進行檢測,這里(i,j)是圖象上的坐標。
在梯度方向檢測(11204)中,利用x-方向濾波(11201)獲得的x-方向梯度dx(i,j)和y-方向濾波(11202)獲得的y-方向梯度dy(i,j),通過方程式B2的計算,對梯度方向θ(i,j)進行檢測,這里(i,j)是圖象上的坐標。
在非最大值抑制(11205)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產(chǎn)生圖象,即如果在窗口中參考點上的梯度值是最大值,那么給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(11206)中,對于由非最大值抑制(11205)所獲得的二值圖象中的取1值的象素,通過計算梯度檢測(11203)中所檢測到梯度的平均值,可獲得平均梯度d’ave。此外,利用動態(tài)范圍估計裝置(11101)所檢測的最大象素值Dmax和最小象素值Dmin,由方程式B3重新計算歸一化的平均梯度,得到dave。
在平滑函數(shù)構(gòu)成(11207)中,根據(jù)歸一化的平均梯度dave構(gòu)成平滑濾波器,如圖49所示。構(gòu)成平滑濾波器的步驟的次數(shù)是根據(jù)梯度而變化的,如圖49所示。圖50示出圖49中平滑濾波器的詳細情況。在該圖中,分別用11401、11402和11403表示平滑濾波器2、平滑濾波器3和平滑濾波器4。該圖還示出平滑濾波器系數(shù)表11404。當(dāng)dave大于191時,由于圖象的梯度被認為是代表階躍邊緣,所以不應(yīng)用平滑濾波器進行平滑。另一方面,當(dāng)dave小于10時,由于認為不存在圖象梯度,所以不應(yīng)用平滑濾波器進行濾波。
考慮到平滑函數(shù)估計裝置(11102)所估計的平滑函數(shù)的特征,多值至二值轉(zhuǎn)換轉(zhuǎn)換裝置(11103)將多值圖象轉(zhuǎn)換為僅具有兩個象素值255和0的二值圖象。圖51示出平滑濾波步驟2、平滑濾波步驟3和平滑濾波器步驟4對一維階躍的響應(yīng),于是,對應(yīng)于平滑濾波步驟2(11401)、平滑濾波步驟3(11402)和平滑濾波步驟4(11403)的多值至二值轉(zhuǎn)換涉及到如圖44所示的閾值化,接著用諸如圖52所示的形態(tài)濾波器進行形態(tài)濾波。即,這樣進行處理,當(dāng)構(gòu)成平滑濾波步驟2時,利用形態(tài)濾波器1(11601)以濾波器窗口中的最小值取代參考點;當(dāng)構(gòu)成平滑濾波步驟3(11603)時,利用形態(tài)濾波器2(11602)以濾波器窗口中的最小值取代參考點;當(dāng)構(gòu)成平滑濾波步驟4時,利用形態(tài)濾波器3以濾波器窗口中的最小值取代參考點。
因此,多值至二值轉(zhuǎn)換裝置(11103)在進行圖44所示的閾值化后,利用按照圖52所示構(gòu)造的平滑濾波器將形態(tài)處理運用到多值圖象上。
二值圖象編碼裝置(11104)利用二值圖象編碼方案MMR(在傳真系統(tǒng)常用的CCITT國際標準中所定義的)對二值圖象進行編碼并輸出編碼數(shù)據(jù)。
平滑函數(shù)編碼裝置(11105)對平滑函數(shù)估計裝置(11102)所估計的平滑函數(shù)進行編碼并輸出編碼數(shù)據(jù)。
動態(tài)范圍編碼裝置(11106)對動態(tài)范圍估計裝置(11101)所獲得的Dmax和Dmin進行編碼并輸出為編碼數(shù)據(jù)。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及將結(jié)果輸出為編碼數(shù)據(jù),能夠?qū)崿F(xiàn)有效的編碼。
(實施例B4)圖53是表明本發(fā)明第B4實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,二值圖象解碼裝置(11701)是通過對二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)二值圖象的裝置。
平滑函數(shù)解碼裝置(11702)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù)的裝置。
動態(tài)范圍解碼裝置(11703)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)動態(tài)范圍的裝置。
二值至多值轉(zhuǎn)換裝置(11704)是通過利用平滑函數(shù)解碼裝置(11702)所恢復(fù)的平滑函數(shù)對二值圖象進行平滑以及通過利用動態(tài)范圍解碼裝置(11703)所恢復(fù)的動態(tài)范圍進行亮度轉(zhuǎn)換而恢復(fù)多值圖象的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(11701)通過對利用傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼方案MMR進行編碼的二值圖象編碼數(shù)據(jù)進行解碼,恢復(fù)僅具有兩個象素值0和255的二值圖象。
平滑函數(shù)解碼裝置(11702)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù)。
動態(tài)范圍解碼裝置(11703)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)最大象素值Dmax和最小象素值Dmin。二值至多值轉(zhuǎn)換裝置(11704)實際上應(yīng)用平滑函數(shù)解碼裝置(11702)所恢復(fù)的平滑濾波器。(對于應(yīng)用平滑濾波器的方法,參考平滑函數(shù)構(gòu)成裝置(11207)和圖50的描述)。此外,利用動態(tài)范圍解碼裝置(10903)所恢復(fù)的最大象素值Dmax和最小象素值Dmin,如圖46所示,進行線性轉(zhuǎn)換,恢復(fù)多值圖象。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及對編碼數(shù)據(jù)進行解碼并輸出,能夠?qū)崿F(xiàn)具有較少代碼位的有效解碼。
(實施例B5)圖54是表明本發(fā)明第B5實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,動態(tài)范圍估計裝置(11801)是取目標多值圖象作為輸入、以及提取多值圖象中最大面積的象素值和次最大面積的象素值的裝置。
平滑函數(shù)估計裝置(11802)是取多值圖象和動態(tài)范圍作為輸入以及通過對多值圖象中亮度梯度的分析而估計平滑函數(shù)的裝置。多值至二值轉(zhuǎn)換裝置(11803)是利用動態(tài)范圍、平滑函數(shù)和多值圖象產(chǎn)生二值圖象,從而在利用動態(tài)范圍進行亮度轉(zhuǎn)換和利用平滑函數(shù)進行平滑時能夠很好地接近多值圖象的裝置。
動態(tài)范圍編碼裝置(11804)是對動態(tài)范圍進行編碼和輸出編碼數(shù)據(jù)的裝置。
平滑函數(shù)編碼裝置(11805)是對平滑函數(shù)進行編碼和輸出編碼數(shù)據(jù)的裝置。二值圖象編碼裝置(11806)是對二值圖象進行編碼和輸出編碼數(shù)據(jù)的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作。
動態(tài)范圍估計裝置(11801)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多個多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,最大象素值Dmax和最小象素值Dmin是通過對目標多值圖象的掃描提取的。
圖55示出平滑函數(shù)估計裝置(11802)。在x-方向濾波(11901)中,應(yīng)用x-方向濾波器(10401)在圖象上掃描,沿x-方向?qū)D象中的梯度進行檢測。
在y-方向濾波(11902)中,應(yīng)用y-方向濾波器(10402)在圖象上掃描,沿y-方向?qū)D象中的梯度進行檢測。在梯度檢測(11903)中,利用x-方向濾波(11901)獲得的x-方向梯度dx(i,j)和y-方向濾波(11902)獲得的y-方向梯度dy(i,j),通過方程式B1的計算,對梯度d(i,j)進行檢測,這里(i,j)是圖象上的坐標。
在梯度方向檢測(11904)中,利用x-方向濾波(11901)獲得的x-方向梯度dx(i,j)和y-方向濾波(11902)獲得的y-方向梯度dy(i,j),通過方程式B2的計算,對梯度方向θ(i,j)進行檢測,這里(i,j)是圖象上的坐標。在非最大值抑制(11905)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產(chǎn)生圖象,即如果在窗口中參考點上的梯度值是最大值,那么給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在逐個方向平均梯度檢測(11906)中,對于通過非最大值抑制(11905)所獲得的二值圖象中取1值的象素,通過計算梯度檢測(11903)中所檢測到梯度的平均值,根據(jù)梯度方向(11904)中檢測到梯度方向,可獲得兩個方向中每個方向,即水平方向和垂直方向的平均梯度。此外,利用動態(tài)范圍估計裝置(11801)所檢測的最大象素值Dmax和最小象素值Dmin,由方程式B2重新計算歸一化的平均梯度,得到垂直方向的平均梯度dave_1和水平方向的平均梯度dave_2。
在平滑函數(shù)構(gòu)成(11907)中,根據(jù)平均梯度dave_1和dave_2,通過估計平滑濾波器系數(shù)產(chǎn)生平滑濾波器。在本實施例中,估計圖56所示的步驟次數(shù)3的平滑濾波器的系數(shù)。這里,通過方程式B4進行限制,但是,根據(jù)圖象可以對每個系數(shù)進行加權(quán)。
(方程式B4)a=1(4)b=f,c=h (5)g=i=e=d=h+f2----(6)]]>j=a+b+c+d+e+f+g+h+i(7)利用dave_1,通過方程式B5估計c。然而,當(dāng)dave_1大于200時,圖象的梯度被認為是代表階躍邊緣,所以將c設(shè)定為0。另一方面,當(dāng)dave_1小于50時,認為不存在圖象梯度,所以將c設(shè)定為0。
(方程式B5)b=255-dave12dave1----(8)]]>利用dave_2,通過方程式B6估計b。然而,當(dāng)dave_2大于200時,圖象的梯度被認為是代表階躍邊緣,所以將b設(shè)定為0。另一方面,當(dāng)dave_2小于50時,認為不存在圖象梯度,所以將b設(shè)定為0。
(方程式B6)b=255-dave22dave2----(9)]]>如上所述,利用方程式B4、B5和B6估計濾波器系數(shù)和標度??紤]到平滑函數(shù)估計裝置(11902)所估計的平滑函數(shù)的特征,多值至二值轉(zhuǎn)換轉(zhuǎn)換裝置(11903)將多值圖象轉(zhuǎn)換為僅具有兩個象素值255和0的二值圖象。在本實施例中,閾值是根據(jù)濾波器系數(shù)估計的,二值圖象是通過利用估計的閾值對多值圖象進行閾值化而獲得的。閾值γ是通過方程式B7估計的。
(方程式B7)γ=255(a+2b4j+2+2h4j)----(10)]]>二值圖象編碼裝置(11904)利用傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼方案MMR對二值圖象進行編碼并輸出編碼數(shù)據(jù)。
平滑函數(shù)系數(shù)編碼裝置(11905)對平滑函數(shù)估計裝置(11902)所估計的平滑函數(shù)的每個系數(shù)和標度進行編碼并輸出編碼數(shù)據(jù)。動態(tài)范圍編碼裝置(11906)分別對動態(tài)范圍估計裝置(11801)所獲得的Dmax和Dmin進行編碼并輸出編碼數(shù)據(jù)。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及將結(jié)果輸出為編碼數(shù)據(jù),能夠?qū)崿F(xiàn)有效的編碼。
(實施例B6)圖57是表明本發(fā)明第B6實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,二值圖象解碼裝置(12101)是通過對二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)二值圖象的裝置。
平滑函數(shù)系數(shù)解碼裝置(12102)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù)的裝置。
動態(tài)范圍解碼裝置(12103)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)動態(tài)范圍的裝置。
二值至多值轉(zhuǎn)換裝置(12104)是通過利用平滑函數(shù)解碼裝置(12102)所恢復(fù)的平滑函數(shù)對二值圖象進行平滑以及通過利用動態(tài)范圍解碼裝置(12103)所恢復(fù)的動態(tài)范圍進行亮度轉(zhuǎn)換而恢復(fù)多值圖象的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(12101)通過對利用傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼方案MMR編碼的二值圖象編碼數(shù)據(jù)進行解碼,恢復(fù)僅具有兩個象素值0和255的二值圖象。
平滑函數(shù)系數(shù)解碼裝置(12102)是通過對平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑濾波器系數(shù)和標度,以及因此恢復(fù)平滑函數(shù)。動態(tài)范圍解碼裝置(12103)是通過對動態(tài)范圍編碼數(shù)據(jù)進行解碼而恢復(fù)最大象素值Dmax和最小象素值Dmin。
二值至多值轉(zhuǎn)換裝置(12104)采用與平滑函數(shù)系數(shù)解碼裝置(12102)所恢復(fù)的平滑濾波器的卷積。此外,利用動態(tài)范圍解碼裝置(12103)所恢復(fù)的最大象素值Dmax和最小象素值Dmin,進行如圖46所示的線性轉(zhuǎn)換,恢復(fù)多值圖象。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計,以及對與所估計平滑函數(shù)相對應(yīng)的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值基本圖象分別進行編碼以及對編碼數(shù)據(jù)進行解碼并輸出,能夠?qū)崿F(xiàn)具有較少代碼位的有效解碼。
(實施例B7)圖58是表明本發(fā)明第B7實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,多值至二值轉(zhuǎn)換裝置(12201)是取目標圖象(取值范圍在0至255之間,每個取值為整數(shù))作為輸入,通過給0值的象素分配0值而給其它值的象素分配255值而對輸入目標圖象進行二值化的裝置。
二值圖象編碼裝置(12202)是對取值為{0,255}的二值圖象進行編碼和輸出編碼數(shù)據(jù)的裝置。平滑函數(shù)估計裝置(12203)是確定平滑函數(shù)的裝置。平滑函數(shù)編碼裝置(12204)是對如此確定的功能進行編碼的裝置。這里,平滑函數(shù)估計裝置(12203)對應(yīng)于本發(fā)明的平滑函數(shù)發(fā)生裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作。
通過二值圖象編碼裝置(12202)對由多值至二值圖象轉(zhuǎn)換裝置(12201)作過二值化的二值圖象進行編碼。對于這種編碼,采用了傳真等系統(tǒng)常用的CCITT國際標準中所定義的二值圖象編碼方案MMR,0值為白,255值為黑。
另一方面,利用平滑函數(shù)估計裝置(12203)將二值化的圖象與輸入多值圖象進行比較,確定平滑函數(shù)。以下將參考圖60和61說明這一點。
正如在背景技術(shù)中所描述的,許多α平面具有絕大部分是均勻的和中間值沿邊界分布的特性。為了再現(xiàn)沿邊界分布的中間值,考慮平滑操作,這里,根據(jù)垂直(b3,b0)和水平(b2,b1)相鄰象素的值是否為255,對于中心象素值x作出替換。
由于通過給0值的象素分配0和給其它值的象素分配255對目標多值圖象進行二值化,只有在目標象素的值為255時才進行替換。因此,取值為255的象素的四個相鄰象素的二值化圖案是由四個位(16個圖案)表示的。
平滑函數(shù)估計裝置(12203)對圖象進行掃描,通過尋找取值為255的象素的四個相鄰象素的16圖案中每個圖案的平均值獲得替換值。表1示出一個例子。
(表1)
于是,在邊界處的象素值從0變?yōu)?55的情況下,例如,如圖61中第一平滑級所示,將象素值替換為128。如果在輪廓上或者附近存在兩個具有中間值的象素,那么,對于取值為255的象素,以遞歸方式重復(fù)進行尋找取值為255的象素的四個相鄰象素的16個圖案中每個圖案的平均值的操作。表2示出第二操作的結(jié)果。以這種方式,能夠表示對應(yīng)于圖61中第二平滑級的具有中間值的邊界。
(表2)
獲得平滑函數(shù)估計裝置(12203)的輸出,作為平滑級的數(shù)目(在所示的例子中,是2級,最大可能數(shù)目是8級)和對應(yīng)于級數(shù)目的(b3、b2、b1、b0)圖案的象素值表。這里,級的數(shù)目是指以遞歸方式重復(fù)進行平滑操作的重復(fù)次數(shù)。平滑函數(shù)編碼裝置(12204)將平滑級的數(shù)目編碼為三個位數(shù)和將(b3、b2、b1、b0)圖案的象素值表編碼為8位×15(包括所有象素值為255圖案在內(nèi)的圖案的數(shù)目)×級的數(shù)目。
(實施例B8)圖59是表明本發(fā)明第B8實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。將第七實施例圖象編碼裝置的輸出提供作為本實施例圖象解碼裝置的輸入。二值圖象解碼裝置(12301)是取二值圖象編碼裝置(12202)的輸出作為輸入并從二值圖象編碼數(shù)據(jù)中恢復(fù){0,255}二值圖象的裝置。平滑函數(shù)解碼裝置(12302)是對平滑函數(shù)編碼裝置(12204)的輸出進行解碼的解碼裝置。二值至多值轉(zhuǎn)換裝置(12303)是取平滑函數(shù)和二值圖象為輸入和重構(gòu)多值圖象的裝置。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(12301)采用MMR解碼方案。對于與級數(shù)目相對應(yīng)的圖案,平滑函數(shù)解碼裝置對平滑級的數(shù)目和替換象素值表進行解碼。假設(shè)在圖象解碼裝置例子中所采用的解碼表是兩個表,即表1和表2。二值至多值轉(zhuǎn)換裝置(12303)在取值為255的每個象素上進行轉(zhuǎn)換,通過參考其四個相鄰象素利用表1和2以兩級對其值進行轉(zhuǎn)換,如圖61所示。
如上所述,在第七和第八實施例中,通過利用圖象中幾乎所有的象素都具有均勻的二值以及中間值沿邊界分布的多值圖象的特性,對中間值的分布狀態(tài)進行分析,對中間值分布提供良好近似的平滑函數(shù)進行估計。由于平滑函數(shù)是由多級表示的,即使中間值的寬度大于或等于兩個象素,對應(yīng)最高為8個象素,能夠表示任何平滑圖案。這里,任何平滑圖案是指邊界上的升/降特性。
(實施例B9)圖62是表明本發(fā)明第B9實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。在該圖中,多值至二值轉(zhuǎn)換裝置(12601)是取目標圖象(取值范圍為0至255,每個取值為整數(shù))作為輸入,通過給0值的象素分配0值和給其它值的象素分配255值對輸入目標圖象進行二值化的裝置。二值圖象編碼裝置(12602)是對取值為{0,255}的二值圖象進行編碼和輸出編碼數(shù)據(jù)的裝置。平滑函數(shù)估計裝置(12603)是確定平滑函數(shù)的裝置。
平滑函數(shù)編碼裝置(12604)是對如此確定的功能進行編碼的裝置。二值至多值轉(zhuǎn)換裝置(12605)是取平滑函數(shù)和二值圖象作為輸入并重構(gòu)多值圖象的裝置。差分計算器(12606)是獲得二值至多值轉(zhuǎn)換裝置(12605)輸出與目標多值圖象之間差值的裝置。剩余編碼裝置(12607)是對差值進行編碼的裝置。
以下將描述由此構(gòu)成的本實施例的圖象編碼裝置的操作。
標號2601至2605表示的方塊與以前參考圖58和59所述的相同名稱的方塊的構(gòu)造和操作是相同的。在本實施例中,采用第七實施例中所示的圖象編碼裝置作為預(yù)測器,即取二值至多值轉(zhuǎn)換裝置(12605)的輸出作為預(yù)測圖象,通過差分計算器(12606)獲得預(yù)測圖象的差值,然后,由剩余編碼裝置(12607)對差值進行編碼。
對于差值的編碼,采用活動圖象編碼H.261的CCITT國際標準所定義的幀間編碼模式(離散余弦變換編碼)。
(實施例B10)圖63是表明本發(fā)明第B10實施例的圖象解碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。將第九實施例圖象編碼裝置的輸出提供作為本實施例圖象解碼裝置的輸入。
在該圖中,二值圖象解碼裝置(12701)是取二值圖象編碼裝置(12602)的輸出作為輸入并從二值圖象編碼數(shù)據(jù)中恢復(fù){0,255}二值圖象的裝置。平滑函數(shù)解碼裝置(12702)是對平滑函數(shù)編碼裝置(12604)的輸出進行解碼的解碼裝置。二值至多值轉(zhuǎn)換裝置(12703)是取平滑函數(shù)和二值圖象為輸入和重構(gòu)多值圖象的裝置。剩余解碼裝置(12704)是取剩余編碼裝置(12607)的輸出作為輸入和獲得剩余的裝置。加法器(12705)將二值至多值轉(zhuǎn)換裝置(12703)的輸出與剩余解碼裝置(12704)相加。
以下將描述由此構(gòu)成的本實施例的圖象解碼裝置的操作。
標號2701至2705表示的方塊與以前參考圖58和59所述的相同名稱的方塊的構(gòu)造和操作是相同的。剩余解碼裝置(12704)采用活動圖象編碼H.261中所定義的幀間解碼模式,與剩余編碼裝置(12607)的輸出相對應(yīng)。因此重構(gòu)差值信號,代表圖41中目標多值圖象與通過對二值圖象進行平滑而獲得的圖象之間的差值,在加法器(12705)中加上差值信號,重構(gòu)多值圖象。
在第九和第十實施例中,采用第七和第八實施例中所示的圖象編碼方法進行預(yù)測,對預(yù)測的剩余成分分別進行編碼、發(fā)送和存儲,由此實現(xiàn)目標多值圖象的更準確的再現(xiàn)。具體地說,通過預(yù)測邊界上象素值的突然變換,能夠從剩余信號中去除高頻成分,因此而能夠提高離散余弦變換編碼的效率。
(實施例B11)圖64是表明本發(fā)明第B11實施例的圖象編碼裝置結(jié)構(gòu)的方框圖。以下將參考該圖描述本實施例的結(jié)構(gòu)。
在該圖中,動態(tài)范圍估計裝置(20101)是取目標多值圖象作為輸入、提取多值圖象中最大面積的象素值和次最大面積的象素值以及將它們作為動態(tài)范圍而輸出的裝置。
多值至二值轉(zhuǎn)換裝置(20103)是利用動態(tài)范圍進行亮度轉(zhuǎn)換以及利用預(yù)定的閾值進行閾值化,產(chǎn)生二值圖象的裝置。
平滑函數(shù)估計裝置(20102)是通過考慮多值至二值轉(zhuǎn)換裝置(20103)中進行的閾值化對多值圖象中亮度梯度進行分析并估計平滑函數(shù)的裝置。
動態(tài)范圍編碼裝置(20105)是對動態(tài)范圍進行編碼和輸出編碼數(shù)據(jù)的裝置。
平滑函數(shù)編碼裝置(20106)是對平滑函數(shù)進行編碼和輸出編碼數(shù)據(jù)的裝置。
二值圖象編碼裝置(20104)是對二值圖象進行編碼和輸出編碼數(shù)據(jù)的裝置。
以下將參考圖40、49等描述由此構(gòu)成的本發(fā)明的圖象編碼裝置的操作以及按照本發(fā)明一個實施例的圖象編碼方法的操作。
動態(tài)范圍估計裝置(20101)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,通過對目標的多值圖象的掃描可提取最大象素值Dmax和最小象素值Dmin。
多值至二值轉(zhuǎn)換裝置(20103)進行線性轉(zhuǎn)換,如圖40所示,并利用閾值128對每個象素值進行閾值化,將最大值Dmax設(shè)定為255和將最小值Dmin設(shè)定為0。
平滑函數(shù)估計裝置(20102)通過多值至二置轉(zhuǎn)換裝置(20103)所進行的閾值化和圖象中象素值的平均梯度,對平滑函數(shù)進行估計。在本實施例中,由于閾值化是利用多值至二值轉(zhuǎn)換裝置(20103)中閾值128進行的,采用了參考點在其中心處的平均濾波器。
平均濾波器的大小是由圖象中象素值的平均梯度確定的。
圖象中象素值的平均梯度dave是以以下方式計算的。
在x-方向濾波(10301)中,應(yīng)用x-方向濾波器(10401)在圖象上掃描,沿圖象中的x-方向?qū)μ荻冗M行檢測。
在y-方向濾波(10302)中,應(yīng)用y-方向濾波器(10402)在圖象上掃描,沿圖象中的y-方向?qū)μ荻冗M行檢測。
在梯度檢測(10303)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過在第1實施例中給出的方程式B1的計算,對梯度d(i,j)進行檢測,這里(i,j)是圖象上的坐標。
在梯度方向檢測(10304)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過在第1實施例中給出的方程式B2的計算,對梯度方向θ(i,j)進行檢測,這里(i,j)是圖象上的坐標。
在非最大值抑制(10305)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產(chǎn)生圖象,即如果在窗口中參考點上的梯度值是最大值,那么給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(10306)中,對于由非最大值抑制(10305)所獲得的二值圖象中取1值的象素,通過計算梯度檢測(10303)中所檢測到梯度的平均值可獲得平均梯度d’ave。此外,利用動態(tài)范圍估計裝置(20101)所檢測的最大象素值Dmax和最小象素值Dmin,由第1實施例中給出的方程式B3重新計算歸一化的平均梯度,得到dave。
平均濾波器的大小是根據(jù)歸一化的平均梯度dave并參考圖49而確定的。
二值圖象編碼裝置(20104)利用二值圖象編碼方案MMR(在傳真系統(tǒng)常用的CCITT國際標準中所定義的)對二值圖象進行編碼并輸出編碼數(shù)據(jù)。
平滑函數(shù)編碼裝置(20106)對平滑函數(shù)估計裝置(20102)所估計的平滑函數(shù)進行編碼并輸出編碼數(shù)據(jù)。在本實施例情況中,對平均濾波器的大小進行編碼,將其輸出為編碼數(shù)據(jù)。
動態(tài)范圍編碼裝置(20105)分別對動態(tài)范圍估計裝置(20101)所獲得的Dmax和Dmin進行編碼并輸出編碼數(shù)據(jù)。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態(tài)進行分析,以及對中間值分布提供良好近似的平滑函數(shù)進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數(shù)和估計的二值圖象分別進行編碼以及將結(jié)果輸出為編碼數(shù)據(jù),能夠?qū)崿F(xiàn)有效的編碼。
在任一上述實施例中,可以產(chǎn)生擁有由計算機執(zhí)行以上所述全部或部分裝置功能的程序的磁性記錄媒體或光學(xué)記錄媒體,這些程序能夠在計算機上運行,以執(zhí)行上述的操作。
在以上的實施例中已經(jīng)對本發(fā)明的圖象編碼裝置作了描述,它包括動態(tài)范圍估計裝置及其編碼裝置,但是,這并不是必要條件,例如,在許多情況中由于Dmax為255和Dmin為0,上述這兩個裝置可以被省略。在這種情況下,如圖65所示,圖象編碼裝置包括平滑函數(shù)估計裝置(10102),從目標多值圖象(這是待編碼的圖象)估計平滑函數(shù);多值至二值轉(zhuǎn)換裝置(10103),按照確定與估計平滑函數(shù)匹配的多值至二值轉(zhuǎn)換準則將多值圖象轉(zhuǎn)換為二值圖象;二值圖象編碼裝置(10104),對二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);平滑函數(shù)編碼裝置(10106),對估計的平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。根據(jù)這種結(jié)構(gòu),從待編碼的目標多值圖象估計平滑函數(shù);按照確定與估計平滑函數(shù)匹配的多值至二值轉(zhuǎn)換準則將多值圖象轉(zhuǎn)換為二值圖象;對二值圖象進行編碼并輸出為二值圖象編碼數(shù)據(jù);對估計的平滑函數(shù)進行編碼并輸出為平滑函數(shù)編碼數(shù)據(jù)。此外,在這種情況下,能夠獲得同第一種所述結(jié)構(gòu)中所實現(xiàn)的相同效果。
此外,在以上的實施例中已經(jīng)對本發(fā)明的圖象編碼裝置作了描述,它包括平滑函數(shù)估計裝置,但是,這并不是必要條件,例如,不包括平滑函數(shù)估計裝置的結(jié)構(gòu)也是可以的。在這種情況下,如圖66所示,圖象編碼裝置包括多值至二值轉(zhuǎn)換裝置,取待編碼的目標多值圖象和平滑函數(shù)作為輸入和基于平滑函數(shù)從多值圖象產(chǎn)生二值圖象;二值圖象編碼裝置,對二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);平滑函數(shù)編碼裝置,對平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。平滑函數(shù)是這么進行調(diào)節(jié)的預(yù)定功能,即如果將平滑函數(shù)運用到二值圖象上,能夠有效地或者以逼近方式再現(xiàn)原始多值圖象。根據(jù)這種結(jié)構(gòu),輸入待編碼的目標多值圖象和平滑函數(shù);基于平滑函數(shù)從多值圖象產(chǎn)生二值圖象;對二值圖象進行編碼并輸出為二值圖象編碼數(shù)據(jù);對平滑函數(shù)進行編碼并輸出為平滑函數(shù)編碼數(shù)據(jù)。此外,在這種情況下,能夠獲得同第一種所述結(jié)構(gòu)中所實現(xiàn)的大致相同效果。
在圖66所示的實施例中已經(jīng)對本發(fā)明的圖象編碼裝置作了描述,它不包括動態(tài)范圍估計裝置等,但是,這并不是必要條件,例如,包括動態(tài)范圍估計裝置的結(jié)構(gòu)也是可以的。在這種情況下,圖象編碼裝置除了圖66中所示的元件外還包括從目標多值圖象中獲得動態(tài)范圍的動態(tài)范圍估計裝置和對動態(tài)范圍進行編碼并將其輸出為動態(tài)范圍編碼數(shù)據(jù)的動態(tài)范圍編碼裝置,如圖67所示。在這種結(jié)構(gòu)中,多值至二值轉(zhuǎn)換裝置還通過考慮動態(tài)范圍產(chǎn)生二值圖象。在操作中,這種結(jié)構(gòu)除了涉及到聯(lián)系圖66結(jié)構(gòu)所描述的操作外還涉及到從目標多值圖象獲得動態(tài)范圍、對動態(tài)范圍進行編碼并將其輸出為動態(tài)范圍編碼數(shù)據(jù)。
此外,在圖64所示的實施例中已經(jīng)對本發(fā)明的圖象編碼裝置作了描述,它包括動態(tài)范圍估計裝置等,但是,這并不是必要條件,例如,不包括動態(tài)范圍估計裝置的結(jié)構(gòu)也是可以的。在這種情況下,如圖68所示,圖象編碼裝置包括多值至二值轉(zhuǎn)換裝置(20103),按照確定與多值圖象匹配的多值至二值轉(zhuǎn)換準則將多值圖象(待編碼的圖象)轉(zhuǎn)換為二值圖象;平滑函數(shù)估計裝置(20102),這樣估計平滑函數(shù),即如果將相同的平滑函數(shù)運用到二值圖象上,能夠有效地或者以逼近方式再現(xiàn)原始多值圖象;二值圖象編碼裝置(20104),對二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù);以及平滑函數(shù)編碼裝置(20106),對估計的平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)。根據(jù)這種結(jié)構(gòu),按照確定與估計待編碼目標多值圖象匹配的多值至二值轉(zhuǎn)換準則將多值圖象轉(zhuǎn)換為二值圖象;對平滑函數(shù)進行估計,如果被運用到二值圖象上,它能夠有效地或者以逼近方式再現(xiàn)原始多值圖象;對二值圖象進行編碼并輸出為二值圖象編碼數(shù)據(jù);以及對估計的平滑函數(shù)進行編碼并輸出為平滑函數(shù)編碼數(shù)據(jù)。此外,在這種情況下,能夠獲得同第一種所述結(jié)構(gòu)中所實現(xiàn)的相同效果。
在以上的實施例中已經(jīng)對本發(fā)明的圖象解碼裝置作了描述,它包括動態(tài)范圍解碼裝置等,但是,這并不是必要條件,例如,不包括動態(tài)范圍解碼裝置的結(jié)構(gòu)也是可以的。在這種情況下,圖象解碼裝置具有接受圖58、65、66或68中所示圖象編碼裝置輸出的多種的編碼數(shù)據(jù)的結(jié)構(gòu),如圖69所示,它包括二值圖象解碼裝置,通過對編碼數(shù)據(jù)之中的二值圖象編碼數(shù)據(jù)進行解碼而恢復(fù)二值圖象;平滑函數(shù)解碼裝置,通過對編碼數(shù)據(jù)之中的平滑函數(shù)編碼數(shù)據(jù)進行解碼而恢復(fù)平滑函數(shù);以及二值至多值轉(zhuǎn)換裝置,利用已解碼的平滑函數(shù)通過對已解碼的二值圖象進行平滑而恢復(fù)多值圖象。根據(jù)這種結(jié)構(gòu),輸入從任何一個圖象編碼裝置輸出的多種編碼數(shù)據(jù);在編碼數(shù)據(jù)之中,對二值圖象編碼數(shù)據(jù)進行解碼,恢復(fù)二值圖象;在編碼數(shù)據(jù)之中,對平滑函數(shù)編碼數(shù)據(jù)進行解碼,恢復(fù)平滑函數(shù);利用已解碼的平滑函數(shù)通過對已解碼的二值圖象進行平滑而恢復(fù)多值圖象。此外,在這種情況中,能夠獲得同所述第一結(jié)構(gòu)中實現(xiàn)的效果大致相同的效果。
如上所述,由于下面給出的原因,利用本發(fā)明的圖象編碼裝置、圖象解碼裝置、圖象編碼方法和圖象解碼方法能夠?qū)崿F(xiàn)比利用現(xiàn)有多值圖象編碼技術(shù)更有效的編碼和解碼。
1.在多值圖象中,對中間值沿占據(jù)圖象中主要部分的最大值區(qū)域與也占據(jù)圖象中主要部分的最小值區(qū)域之間邊界的分布進行分析,確定提供該分布良好近似的平滑函數(shù)。
2.基于在1中所確定的平滑函數(shù),產(chǎn)生僅有兩個值(最大值和最小值)的二值圖象。
3.采用1中所確定的平滑函數(shù)以及在2中產(chǎn)生的二值圖象表示多值圖象進行相應(yīng)的編碼。
4.在解碼器上,對已編碼的平滑函數(shù)和二值圖象進行解碼,重構(gòu)多值圖象。
從以上的描述中顯而易見,本發(fā)明的優(yōu)點在于能夠?qū)崿F(xiàn)比現(xiàn)有技術(shù)所能實現(xiàn)的更有效的編碼和解碼。
工業(yè)應(yīng)用性如上所述,根據(jù)本發(fā)明,通過從以前獲得的具有高度相關(guān)性的二值圖象中對待編碼的象素進行預(yù)測以及通過對其差值進行編碼,能夠?qū)崿F(xiàn)比利用現(xiàn)有二值圖象編碼和解碼技術(shù)更有效的編碼和解碼。此外,根據(jù)本發(fā)明,對例如中間值的分布進行分析,分別對近似該分布的平滑函數(shù)和僅有兩個值(最大值和最小值)的二值基本圖象進行編碼,然后進行解碼,由此實現(xiàn)比現(xiàn)有技術(shù)所能實現(xiàn)的更有效的編碼和解碼。
權(quán)利要求
1.一種圖象解碼裝置,用于對通過對每個塊上二值圖象編碼所獲得的編碼數(shù)據(jù)進行解碼,以恢復(fù)所述二值圖象的目標塊,所述圖象解碼裝置包括參考圖象構(gòu)成裝置,用于從比包含所述目標塊的目標幀在更早時間編碼的幀獲得參考二值圖象;分塊裝置,用于從所述參考二值圖象獲得含有多個象素的參考塊;統(tǒng)計模型選擇裝置,用于基于所述參考塊中一個參考象素周圍的象素的狀態(tài),從多個統(tǒng)計模型之中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的一個目標象素;和算術(shù)解碼裝置,用于利用所述所選模型通過對所述編碼數(shù)據(jù)解碼而恢復(fù)所述目標塊。
2.如權(quán)利要求1所述的圖象解碼裝置,其特征在于所述參考塊中所述參考像素周圍的所述像素是定位在與所述參考像素相距一個像素距離中的像素。
3.如權(quán)利要求1所述的圖象解碼裝置,其特征在于所述參考塊中所述參考像素周圍的所述像素是直接位于所述參考像素之上、之下、之左和之右的四個像素。
4.如權(quán)利要求1、2或3所述的圖象解碼裝置,其特征在于所述統(tǒng)計模型選擇裝置用于進一步基于所述目標像素周圍的像素的狀態(tài)從多個統(tǒng)計模型當(dāng)中選擇一個統(tǒng)計模型。
5.如權(quán)利要求4所述的圖象解碼裝置,其特征在于所述目標像素周圍的所述像素直接定位在所述目標像素之上、之下、之左和之右。
6.一種圖象解碼方法,用于對通過對每個塊上二值圖象編碼所獲得的編碼數(shù)據(jù)進行解碼,以恢復(fù)所述二值圖象的目標塊,所述圖象解碼方法包括步驟從比包含所述目標塊的目標幀在更早時間編碼的幀獲得參考二值圖象;從所述參考二值圖象獲得含有多個象素的參考塊;基于所述參考塊中一個參考象素周圍的象素的狀態(tài),從多個統(tǒng)計模型之中選擇一個統(tǒng)計模型,所述參考象素對應(yīng)于所述目標塊中的一個目標象素;和利用所述所選模型通過對所述編碼數(shù)據(jù)算術(shù)解碼而恢復(fù)所述目標塊。
7.如權(quán)利要求6所述的圖象解碼方法,其特征在于所述參考塊中所述參考像素周圍的所述像素是定位在與所述參考像素相距一個像素距離中的像素。
8.如權(quán)利要求6所述的圖象解碼方法,其特征在于所述參考塊中所述參考像素周圍的所述像素是直接位于所述參考像素之上、之下、之左和之右的四個像素。
9.如權(quán)利要求6、7或8所述的圖象解碼方法,其特征在于所述所選統(tǒng)計模型進一步基于所述目標像素周圍的像素的狀態(tài)。
10.如權(quán)利要求9所述的圖象解碼方法,其特征在于所述目標像素周圍的所述像素被直接定位在所述目標像素之上、之下、之左和之右。
全文摘要
一種圖象編碼裝置,包括:獲得待編碼目標多值圖象動態(tài)范圍的動態(tài)范圍估計裝置10101;對動態(tài)范圍進行編碼并將其輸出為動態(tài)范圍編碼數(shù)據(jù)的動態(tài)范圍編碼裝置10105;估計目標多值圖象的平滑函數(shù)的平滑函數(shù)估計裝置10102;基于確定為平滑函數(shù)匹配的多值至二值轉(zhuǎn)換準則將多值圖象轉(zhuǎn)換為二值圖象的多值至二值轉(zhuǎn)換裝置10103;對二值圖象進行編碼并將其輸出為二值圖象編碼數(shù)據(jù)的二值圖象編碼裝置10104;對平滑函數(shù)進行編碼并將其輸出為平滑函數(shù)編碼數(shù)據(jù)的平滑函數(shù)編碼裝置10106。這種結(jié)構(gòu)可實現(xiàn)多值圖象的有效編碼。
文檔編號H04N7/50GK1339914SQ01121158
公開日2002年3月13日 申請日期1997年7月25日 優(yōu)先權(quán)日1996年7月31日
發(fā)明者畑幸一, 栄藤稔, 安慶武志 申請人:松下電器產(chǎn)業(yè)株式會社