本公開的實施例總體上涉及視頻處理技術(shù),并且更具體地,涉及幾何劃分模式(gpm)。
背景技術(shù):
1、如今,數(shù)字視頻功能正被應用于人們生活的各個方面。針對視頻編碼/解碼,已經(jīng)提出了多種類型的視頻壓縮技術(shù),諸如mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4第10部分高級視頻編解碼(avc)、itu-t?h.265高效視頻編解碼(hevc)標準、通用視頻編解碼(vvc)標準。然而,視頻編解碼技術(shù)的編解碼效率和編解碼質(zhì)量通常期望被進一步提高。
技術(shù)實現(xiàn)思路
1、本公開的實施例提供了一種用于視頻處理的解決方案。
2、在第一方面,一種用于視頻處理的方法被提出。該方法包括:針對視頻的當前視頻塊與視頻的比特流之間的轉(zhuǎn)換,獲取用于混合區(qū)域在一方向上的度量的值,混合區(qū)域被包括在與當前視頻塊相關(guān)聯(lián)的目標區(qū)域中,值是從針對度量的多個預定值中被確定的,用于混合區(qū)域的樣本的值是基于用于目標區(qū)域的第一部分的樣本的值和用于目標區(qū)域的第二部分的樣本的值而被確定的;以及基于用于度量的值執(zhí)行轉(zhuǎn)換。
3、根據(jù)本公開的第一方面的方法,用于混合區(qū)域的度量(諸如寬度)的值從針對度量的多個預定值中被確定。與用于度量的值是固定的傳統(tǒng)解決方案相比,所提出的方法可以有利地支持混合區(qū)域的自適應大小。由此,編解碼效率和編解碼質(zhì)量可以被提高。
4、在第二方面,一種用于視頻處理的裝置被提出。該裝置包括處理器和在其上具有指令的非暫態(tài)存儲器。該指令在由處理器執(zhí)行時使處理器執(zhí)行根據(jù)本公開的第一方面的方法。
5、在第三方面,一種非暫態(tài)計算機可讀存儲介質(zhì)被提出。該非暫態(tài)計算機可讀存儲介質(zhì)存儲指令,該指令使處理器執(zhí)行根據(jù)本公開的第一方面的方法。
6、在第四方面,另一種非暫態(tài)計算機可讀記錄介質(zhì)被提出。該非暫態(tài)計算機可讀記錄介質(zhì)存儲視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流。該方法包括:獲取用于混合區(qū)域在一方向上的度量的值,混合區(qū)域被包括在與視頻的當前視頻塊相關(guān)聯(lián)的目標區(qū)域中,值是從針對度量的多個預定值中被確定的,用于混合區(qū)域的樣本的值是基于用于目標區(qū)域的第一部分的樣本的值和用于目標區(qū)域的第二部分的樣本的值而被確定的;以及基于用于度量的值生成比特流。
7、在第五方面,一種用于存儲視頻的比特流的方法被提出。該方法包括:獲取用于混合區(qū)域在一方向上的度量的值,混合區(qū)域被包括在與視頻的當前視頻塊相關(guān)聯(lián)的目標區(qū)域中,值是從針對度量的多個預定值中被確定的,用于混合區(qū)域的樣本的值是基于用于目標區(qū)域的第一部分的樣本的值和用于目標區(qū)域的第二部分的樣本的值而被確定的;基于用于度量的值生成比特流;以及將比特流存儲在非暫態(tài)計算機可讀記錄介質(zhì)中。
8、提供本
技術(shù)實現(xiàn)要素:
部分是為了以簡化的形式介紹以下具體實施方式中進一步描述的概念的選擇。本發(fā)明內(nèi)容部分不旨在標識所要求保護的主題的關(guān)鍵特征或基本特征,也不旨在用于限制所要求保護主題的范圍。
1.一種用于視頻處理的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中所述度量是所述混合區(qū)域的兩個側(cè)邊之間的寬度。
3.根據(jù)權(quán)利要求1至2中任一項所述的方法,其中所述第一部分或所述第二部分包括以下一項:
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中用于所述混合區(qū)域的樣本的值被確定為用于所述第一部分的樣本的值和用于所述第二部分的樣本的值的加權(quán)和。
5.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中用于所述混合區(qū)域的樣本的值等于用于所述第一部分的樣本的值或用于所述第二部分的樣本的值。
6.根據(jù)權(quán)利要求1至5中任一項所述的方法,其中成本是基于所述目標區(qū)域被確定的。
7.根據(jù)權(quán)利要求6所述的方法,其中基于所述成本,運動矢量(mv)從針對所述當前視頻塊的多個mv中被確定。
8.根據(jù)權(quán)利要求6所述的方法,其中基于所述成本,參考圖片從針對所述當前視頻塊的多個參考圖片中被確定。
9.根據(jù)權(quán)利要求6所述的方法,其中基于所述成本,劃分模式從針對所述當前視頻塊的多個劃分模式中被確定。
10.根據(jù)權(quán)利要求6所述的方法,其中基于所述成本,幾何劃分模式(gpm)混合方案從針對所述當前視頻塊的多個gpm混合方案中被確定。
11.根據(jù)權(quán)利要求1至10中任一項所述的方法,其中所述混合區(qū)域是基于用于所述度量的所述值來被確定的。
12.根據(jù)權(quán)利要求1至11中任一項所述的方法,其中所述目標區(qū)域包括以下一項:
13.根據(jù)權(quán)利要求1至12中任一項所述的方法,其中所述當前視頻塊包括多于一個劃分。
14.根據(jù)權(quán)利要求1至13中任一項所述的方法,其中所述當前視頻塊利用基于gpm的模式或多假設預測而被編解碼。
15.根據(jù)權(quán)利要求1至14中任一項所述的方法,其中所述當前視頻塊為所述視頻的另一視頻塊的參考視頻塊,所述另一視頻塊不同于所述當前視頻塊且利用基于gpm的模式而被編解碼。
16.根據(jù)權(quán)利要求14至15中任一項所述的方法,其中所述基于gpm的模式包括以下一項:
17.根據(jù)權(quán)利要求1至13中任一項所述的方法,其中所述當前視頻塊利用基于模板的編解碼工具而被編解碼。
18.根據(jù)權(quán)利要求1至13中任一項所述的方法,其中所述當前視頻塊沒有利用基于模板的編解碼工具被編解碼。
19.根據(jù)權(quán)利要求1至18中任一項所述的方法,其中所述第一部分為所述當前視頻塊的第一模板,所述第二部分為所述當前視頻塊的第二模板,所述混合區(qū)域在所述第一模板與所述第二模板之間的劃分線周圍,并且基于所述混合區(qū)域的所述寬度,加權(quán)混合過程被應用于所述第一模板和所述第二模板。
20.根據(jù)權(quán)利要求19所述的方法,其中基于所述當前視頻塊的分割方式,以下至少一項被分到所述第一模板和所述第二模板中:
21.根據(jù)權(quán)利要求19所述的方法,其中所述第一模板或所述第二模板包括與所述當前視頻塊鄰近的多于一個樣本。
22.根據(jù)權(quán)利要求19所述的方法,其中所述第一模板或所述第二模板包括以下至少一項:
23.根據(jù)權(quán)利要求19所述的方法,其中所述第一模板或所述第二模板包括與所述當前視頻塊鄰近的多于一行的樣本、或與所述當前視頻塊鄰近的多于一列的樣本。
24.根據(jù)權(quán)利要求19所述的方法,其中所述第一模板包括與所述當前視頻塊的第一劃分相鄰的樣本。
25.根據(jù)權(quán)利要求19所述的方法,其中所述第二模板包括與所述當前視頻塊的不同于所述第一劃分的第二劃分相鄰的樣本。
26.根據(jù)權(quán)利要求1至25中任一項所述的方法,其中針對用于混合模板樣本的混合區(qū)域的所述度量的值與針對用于混合塊樣本的混合區(qū)域的所述度量的值相同,或者
27.根據(jù)權(quán)利要求1至25中任一項所述的方法,其中針對用于混合模板樣本的混合區(qū)域的所述度量的值不同于針對用于混合塊樣本的混合區(qū)域的所述度量的值,或者
28.根據(jù)權(quán)利要求1至27中任一項所述的方法,其中用于所述度量的所述值不同于在與所述視頻的另一視頻塊相關(guān)聯(lián)的另一目標區(qū)域中的混合區(qū)域的所述度量的值,所述另一視頻塊不同于所述當前視頻塊。
29.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
30.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
31.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
32.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
33.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
34.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中獲取用于所述度量的所述值包括:
35.根據(jù)權(quán)利要求1至34中任一項所述的方法,其中所述多個預定值被存儲在查找表中。
36.根據(jù)權(quán)利要求1至35中任一項所述的方法,其中所述多個預定值被包括在第一組預定值中。
37.根據(jù)權(quán)利要求36所述的方法,其中獲取用于所述度量的所述值包括:
38.根據(jù)權(quán)利要求37所述的方法,其中所述第一語法元素在高于塊級別的級別處被指示。
39.根據(jù)權(quán)利要求37至38中任一項所述的方法,其中所述多組預定值中的一組預定值包括多于一個值。
40.根據(jù)權(quán)利要求37至38中任一項所述的方法,其中所述多組預定值中的一組預定值包括至少一個值。
41.根據(jù)權(quán)利要求1至40中任一項所述的方法,其中用于所述度量的所述值針對以相同模式編解碼的視頻塊被固定。
42.根據(jù)權(quán)利要求1至41中任一項所述的方法,其中所述目標區(qū)域為所述當前視頻塊的模板,并且所述當前視頻塊的模板成本是基于所述模板的樣本值被確定的。
43.根據(jù)權(quán)利要求1至42中任一項所述的方法,其中指示用于所述度量的所述值的第二語法元素被包括在所述比特流中。
44.根據(jù)權(quán)利要求43所述的方法,其中所述第二語法元素在所述當前視頻塊的級別處被指示。
45.根據(jù)權(quán)利要求43至44中任一項所述的方法,其中固定長度編解碼或可變長度編解碼被用于所述第二語法元素的二值化。
46.根據(jù)權(quán)利要求43至45中任一項所述的方法,其中所述第二語法元素的第一二元位指示非零混合寬度是否被用于所述當前視頻塊,并且所述第二語法元素的另一二元位指示用于所述當前視頻塊的非零混合寬度。
47.根據(jù)權(quán)利要求43至45中任一項所述的方法,其中所述第二語法元素的至少一個二元位是被上下文編解碼的。
48.根據(jù)權(quán)利要求47所述的方法,其中上下文模型取決于所述當前視頻塊的左側(cè)鄰近視頻塊或上方鄰近視頻塊的編解碼信息。
49.根據(jù)權(quán)利要求43至45中任一項所述的方法,其中所述第二語法元素的至少一個二元位是被旁路編解碼的。
50.根據(jù)權(quán)利要求1至28中任一項所述的方法,其中基于針對所述多個預定值中的至少一部分被確定的模板成本,用于所述度量的所述值從所述多個預定值中被確定。
51.根據(jù)權(quán)利要求50所述的方法,其中具有最低模板成本的值被確定為用于所述度量的所述值。
52.根據(jù)權(quán)利要求1至51中任一項所述的方法,其中基于以下至少一項,在基于gpm的編解碼工具中使用的用于所述度量的所述值、所述混合區(qū)域或混合方案被確定:
53.根據(jù)權(quán)利要求1至51中任一項所述的方法,其中關(guān)于基于所述比特流中包括的第一信息或者所述比特流中不存在的第二信息確定在基于gpm的編解碼工具中使用的所述混合區(qū)域和/或混合方案的信息是基于以下至少一項被確定的:
54.根據(jù)權(quán)利要求52至53中任一項所述的方法,其中所述基于gpm的編解碼工具包括以下一項:gpm、gmvd、gpm-tm、幀間-幀內(nèi)gpm或gpm模式重新排序。
55.根據(jù)權(quán)利要求52至54中任一項所述的方法,其中所述第一信息在以下一項中被指示:
56.根據(jù)權(quán)利要求52至55中任一項所述的方法,其中所述第二信息包括以下至少一項:
57.根據(jù)權(quán)利要求53至56中任一項所述的方法,其中所述第三信息在以下一項中被指示:
58.根據(jù)權(quán)利要求53至57中任一項所述的方法,其中所述第四信息包括以下至少一項:
59.根據(jù)權(quán)利要求53至58中任一項所述的方法,其中如果所述寬度大于或等于第一閾值且所述高度大于或等于第二閾值,則基于所述第一信息或所述第二信息,所述混合區(qū)域和/或所述混合方案被確定。
60.根據(jù)權(quán)利要求53至58中任一項所述的方法,其中如果所述寬度小于或等于第一閾值且所述高度小于或等于第二閾值,則基于所述第一信息或所述第二信息,所述混合區(qū)域和/或所述混合方案被確定。
61.根據(jù)權(quán)利要求53至58中任一項所述的方法,其中如果所述寬度大于或等于第一閾值或所述高度大于或等于第二閾值,則基于所述第一信息或所述第二信息,所述混合區(qū)域和/或所述混合方案被確定。
62.根據(jù)權(quán)利要求53至58中任一項所述的方法,其中如果所述寬度小于或等于第一閾值或所述高度小于或等于第二閾值,則基于所述第一信息或所述第二信息,所述混合區(qū)域和/或所述混合方案被確定。
63.根據(jù)權(quán)利要求52至62中任一項所述的方法,其中所述第一信息或所述第三信息的信令規(guī)則取決于在所述比特流中不存在的第五信息。
64.根據(jù)權(quán)利要求63所述的方法,其中所述第五信息包括以下至少一項:
65.根據(jù)權(quán)利要求52至64中任一項所述的方法,其中以與所述當前視頻塊的不同于第一分量的第二分量相同的方式,用于所述當前視頻塊的所述第一分量的所述混合方案被確定。
66.根據(jù)權(quán)利要求52至64中任一項所述的方法,其中以與所述當前視頻塊的不同于第一分量的第二分量不同的方式,用于所述當前視頻塊的所述第一分量的所述混合方案被確定。
67.根據(jù)權(quán)利要求52至64中任一項所述的方法,其中用于所述當前視頻塊的第一分量的所述混合方案以自適應方式被確定,并且用于所述當前視頻塊的與所述第一分量不同的第二分量的所述混合方案以固定方式被確定。
68.根據(jù)權(quán)利要求65至67中任一項所述的方法,其中所述第一分量為亮度分量且所述第二分量為色度分量,或者
69.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值取決于以下一項:混合方案、所述混合區(qū)域或用于所述度量的所述值。
70.根據(jù)權(quán)利要求69所述的方法,其中用于所述度量的所述值的混合權(quán)重的最大值小于用于所述度量的比所述值大的另一值的混合權(quán)重的最大值。
71.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中基于自適應混合寬度是否被用于所述視頻的另一視頻塊,混合權(quán)重的最大值被確定,所述混合權(quán)重用于確定所述另一視頻塊的混合區(qū)域的樣本的值。
72.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中基于關(guān)于自適應混合寬度是否在高于所述當前視頻塊的級別的目標級別處被允許的信息,用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值被確定。
73.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中基于在高于所述當前視頻塊的級別的目標級別處在所述比特流中指示的語法元素,用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值被確定,所述語法元素指示自適應混合寬度是否在所述目標級別處被允許。
74.根據(jù)權(quán)利要求72至73中任一項所述的方法,其中所述目標級別包括以下一項:
75.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中如果固定混合寬度被用于所述視頻的另一視頻塊,則用于確定用于所述另一視頻塊的混合區(qū)域的樣本的值的混合權(quán)重的最大值等于第一值,并且
76.根據(jù)權(quán)利要求75所述的方法,其中所述第一值小于所述第二值。
77.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值是自適應的。
78.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值取決于在所述比特流中指示的索引或參數(shù)。
79.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中基于所述視頻的編解碼信息,用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值被確定。
80.根據(jù)權(quán)利要求1至68中任一項所述的方法,其中用于確定用于所述混合區(qū)域的樣本的所述值的混合權(quán)重的最大值等于固定值。
81.根據(jù)權(quán)利要求1至80中任一項所述的方法,其中所述當前視頻塊利用多假設編解碼模式被編解碼,并且關(guān)于如何存儲所述當前視頻塊的運動信息和/或幀內(nèi)模式信息的信息取決于用于所述度量的所述值。
82.根據(jù)權(quán)利要求81所述的方法,其中所述多假設編解碼模式包括以下一項:
83.根據(jù)權(quán)利要求1至82中任一項所述的方法,其中如果用于所述度量的所述值大于第一預定義值,則針對所述目標區(qū)域內(nèi)的子塊,經(jīng)混合的運動、經(jīng)組合的運動或經(jīng)雙向預測的運動被存儲。
84.根據(jù)權(quán)利要求1至80中任一項所述的方法,其中所述當前視頻塊利用幀間-幀內(nèi)編解碼模式被編解碼,并且關(guān)于如何存儲用于所述當前視頻塊的幀內(nèi)模式信息或幀間模式信息的信息取決于用于所述度量的所述值。
85.根據(jù)權(quán)利要求84所述的方法,其中所述幀間-幀內(nèi)編解碼模式包括gpm幀間-幀內(nèi)或ciip。
86.根據(jù)權(quán)利要求1至85中任一項所述的方法,其中如果用于所述度量的所述值大于第二預定義值,則生成的模式針對所述目標區(qū)域內(nèi)的子塊被存儲。
87.根據(jù)權(quán)利要求1至86中任一項所述的方法,其中如果在編解碼工具中使用的候選基于優(yōu)先級、選擇率或概率被重新排序,指示所述候選之一的第三語法元素利用哥倫布-萊斯編解碼被編解碼。
88.根據(jù)權(quán)利要求1至86中任一項所述的方法,其中所述第三語法元素為所述候選之一的索引,所述候選包括以下一項:
89.根據(jù)權(quán)利要求1至88中任一項所述的方法,其中如果參考圖片重新采樣被啟用,則以下編解碼工具中的至少一個編解碼工具被禁用:
90.根據(jù)權(quán)利要求89所述的方法,其中與所述幀內(nèi)模板匹配相關(guān)的編解碼工具包括以下至少一項:
91.根據(jù)權(quán)利要求89至90中任一項所述的方法,其中所述與dmvr相關(guān)的編解碼工具包括以下至少一項:
92.根據(jù)權(quán)利要求89至91中任一項所述的方法,其中所述至少一個編解碼工具利用語法標志被禁用。
93.根據(jù)權(quán)利要求89至91中任一項所述的方法,其中所述至少一個編解碼工具通過將用于參數(shù)的值設置為預定值而被禁用。
94.根據(jù)權(quán)利要求1至93中任一項所述的方法,其中圖片邊界填充在至少一個方向上被應用。
95.根據(jù)權(quán)利要求94所述的方法,其中所述至少一個方向包括水平方向和垂直方向。
96.根據(jù)權(quán)利要求1至93中任一項所述的方法,其中圖片邊界填充在單一方向上被應用。
97.根據(jù)權(quán)利要求96所述的方法,其中所述單一方向為水平方向或垂直方向。
98.根據(jù)權(quán)利要求1至97中任一項所述的方法,其中所述轉(zhuǎn)換包括將所述當前視頻塊編碼到所述比特流中。
99.根據(jù)權(quán)利要求1至97中任一項所述的方法,其中所述轉(zhuǎn)換包括從所述比特流中解碼所述當前視頻塊。
100.一種用于視頻處理的裝置,包括處理器和在其上具有指令的非暫態(tài)存儲器,其中所述指令在由所述處理器執(zhí)行時使所述處理器執(zhí)行根據(jù)權(quán)利要求1至99中任一項所述的方法。
101.一種非暫態(tài)計算機可讀存儲介質(zhì),存儲指令,所述指令使處理器執(zhí)行根據(jù)權(quán)利要求1至99中任一項所述的方法。
102.一種非暫態(tài)計算機可讀記錄介質(zhì),存儲視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流,其中所述方法包括:
103.一種用于存儲視頻的比特流的方法,包括: