使用偶數(shù)-奇數(shù)整數(shù)變換后臺的視頻和數(shù)據(jù)處理的制作方法
【專利摘要】公開了用于對數(shù)據(jù)(例如殘留視頻數(shù)據(jù))進行變換的整數(shù)變換、和/或整數(shù)變換操作的方法、設備以及系統(tǒng)。在這些方法、設備以及系統(tǒng)中,設備中可以包括處理器和存儲器。該存儲器包括一組變換矩陣、以及能夠由所述處理器執(zhí)行以使用所述一組變換矩陣中的任意變換矩陣來對數(shù)據(jù)(例如殘留視頻數(shù)據(jù))進行變換的指令。所述一組變換矩陣中的每個變換矩陣可以是正交的,或可替換地可以是近似正交的并可以被完全因式分解。所述一組變換矩陣中的每個變換矩陣可以具有不同數(shù)量的元素。各個數(shù)量的元素中的每個元素是整數(shù)。每個變換矩陣的基本向量的范數(shù)之間的差值滿足給定的閾值;并且所述基本向量接近離散余弦變換(DCT)矩陣的對應基本向量。
【專利說明】使用偶數(shù)-奇數(shù)整數(shù)變換后臺的視頻和數(shù)據(jù)處理
【背景技術(shù)】
[0001] 數(shù)字視頻能力可以合并到多種設備中,包括數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系 統(tǒng)、個人數(shù)字助理(PDA)、便攜式電腦或臺式機、數(shù)碼相機、數(shù)字錄像設備、視頻游戲設備、 視頻游戲控制臺、移動電話、衛(wèi)星或其他無線電電話等等。許多數(shù)字視頻設備實施視頻壓 縮技術(shù)來更高效地傳送和接收數(shù)字視頻信息,該視頻壓縮技術(shù)包括例如由移動圖像專家組 (MPGA)(諸如 MPEG-2、MPEG-4)、以及國際電信聯(lián)盟(ITU)(諸如 ITU-T H. 263,或者 ITU-T H. 264/MPEG-4第十部分高級視頻編碼(AVC))、以及這些標準的擴展定義的標準中所描述 的視頻壓縮技術(shù)。
[0002] 視頻壓縮技術(shù)可以執(zhí)行空間預測和/或時間預測(temporal prediction)來減少 或去除視頻序列內(nèi)在的冗余。對于基于塊的視頻編碼,可以將視頻幀或片分成塊("視頻 塊")。根據(jù)不同的編碼技術(shù),幀內(nèi)編碼(intra-coded) (I)的幀或片中的視頻塊通過使用相 對于相鄰塊的空間預測而被編碼。幀間編碼(inter-coded) (P或B)中的幀或片中的視頻 塊可以使用相對于同一幀或片中的相鄰視頻塊的空間預測、或者相對于其他參考幀中的視 頻塊的時間預測。
【發(fā)明內(nèi)容】
[0003] 公開了用于對數(shù)據(jù)(例如殘留(residual)視頻數(shù)據(jù))進行變換的整數(shù)變換、和/ 或整數(shù)變換操作的方法、設備以及系統(tǒng)。在這些方法、設備以及系統(tǒng)中,設備中可以包括處 理器和存儲器。該存儲器可以包括一組變換矩陣、以及能夠由所述處理器執(zhí)行以使用所述 一組變換矩陣中的任意矩陣來對數(shù)據(jù)(例如殘留視頻數(shù)據(jù))進行變換的指令。所述一組變 換矩陣中的每個變換矩陣是正交的,并且具有不同數(shù)量的元素。各個數(shù)量的元素中的每個 元素是整數(shù)。每個變換矩陣的基本向量的范數(shù)(norm)之間的差值滿足給定的閾值;并且所 述基本向量大致對應于離散余弦變換(DCT)矩陣的基本向量。
[0004] 可替換地,所述一組變換矩陣中的每個變換矩陣可以近似正交,具有不同數(shù)量的 元素并且可被完全因式分解(factorization)。
[0005] 在所述方法、設備以及系統(tǒng)中,還可以包括一種使用N階整數(shù)變換來處理殘留視 頻數(shù)據(jù)的方法。該方法可以包括:在第一預處理(preconditioning)單元處接收視頻數(shù)據(jù) (例如殘留視頻數(shù)據(jù))的向量,并且在第一預處理單元處對視頻數(shù)據(jù)(例如殘留視頻數(shù)據(jù)) 的向量進行處理以形成用于變換的第一和第二中間輸出向量。該方法還可以包括:在第 一變換單元處接收第一中間輸出向量,并且在第一變換單元處對第一中間輸出向量進行變 換,以使用N/2階整數(shù)偶數(shù)部分變換矩陣和N/2階整數(shù)奇數(shù)部分矩陣的基本向量來形成偶 數(shù)索引的變換系數(shù)。該方法還可以包括:在第二變換單元處接收第二中間輸出向量,并且在 第二變換單元處對第二中間輸出向量進行變換,以通過對通過連續(xù)的N/2階整數(shù)矩陣的第 二中間輸出向量進行處理來形成奇數(shù)索引的變換系數(shù)。N/2階整數(shù)矩陣可以一起對N階變 換矩陣的奇數(shù)部分進行因式分解。
【專利附圖】
【附圖說明】
[0006] 可從以下描述中獲取更詳細的理解,這些描述是結(jié)合附圖通過舉例給出的。類似 于詳細的描述,這些附圖中的圖都是示例。因此,附圖和詳細描述中不能被看作是限制,而 其它同樣有效的實施例也是可能的和可行的。此外,在圖中相同的參考數(shù)字表示相同的元 件,其中:
[0007] 圖1A是示出一個示例性視頻編碼和解碼系統(tǒng)的框圖,在該系統(tǒng)中可以執(zhí)行和/或 實施一個或多個實施方式;
[0008] 圖1B是示出用于與視頻編碼和/或解碼系統(tǒng)(例如如1A的系統(tǒng))一起使用的一 個示例性視頻編碼器單元的框圖;
[0009] 圖1C是示出用于與視頻編碼器單元(例如如1A-1B的視頻編碼器單元)一起使 用的一個示例性視頻編碼器的框圖;
[0010] 圖1D是示出用于與視頻編碼器單元(例如如1A-1B的視頻編碼器單元)一起使 用的一個示例性視頻解碼器的框圖;
[0011] 圖2示出了根據(jù)一個非限制性實施方式的示例性32階變換矩陣;
[0012] 圖3A-3B是示出用于執(zhí)行K階變換的部分因式分解的示例性結(jié)構(gòu)的框圖;
[0013] 圖4A-4B是示出用于執(zhí)行32階變換的部分因式分解的示例性結(jié)構(gòu)的框圖;
[0014] 圖5A-5B是示出用于執(zhí)行8階變換的完全因式分解的示例性結(jié)構(gòu)的框圖;
[0015] 圖6A-6B是示出用于執(zhí)行16階變換的完全因式分解的示例性結(jié)構(gòu)的框圖;
[0016] 圖7A-7B是示出用于執(zhí)行32階變換的完全因式分解的示例性結(jié)構(gòu)的框圖;
[0017] 圖8示出了根據(jù)一個非限制性實施方式的通信系統(tǒng);
[0018] 圖9A是一個示例性通信系統(tǒng)的系統(tǒng)圖,在該通信系統(tǒng)中可以實施所公開的一個 或多個實施方式;
[0019] 圖9B是可以在圖9A所示的通信系統(tǒng)中使用的一個示例性無線發(fā)射/接收單元 (WTRU)的系統(tǒng)圖;以及
[0020] 圖9C-9E是可以在圖9A所示的通信系統(tǒng)中使用的一個示例性無線電接入網(wǎng)和示 例性核心網(wǎng)的系統(tǒng)圖。
【具體實施方式】
[0021] 在下面的詳細描述中,列出了許多具體細節(jié)來提供對所公開的實施方式和/或示 例的透徹理解。但是,可以理解的是可以在不使用這里列出的一些或所有特定細節(jié)的情況 下實施這些實施方式和示例。在其他實例中,沒有詳細描述公知的方法、過程、組件以及電 路,從而不會使得下面的描述不清楚。另外,這里沒有具體描述的實施方式和示例可以代替 或結(jié)合這里所公開的實施方式和其他示例。
[0022] 示例性系統(tǒng)架構(gòu)
[0023] 圖1A是示出一個示例性視頻編碼和解碼系統(tǒng)10的框圖,在該系統(tǒng)10中可以執(zhí)行 和/或?qū)嵤┮粋€或多個實施方式。系統(tǒng)10可以包括源設備12,該源設備12經(jīng)由通信信道 16來傳送編碼后的視頻信息給目的設備14。
[0024] 源設備12和目的設備14可以是多種設備中的任意一種。在一些實施方式中,源 設備12和目的設備14可以包括無線發(fā)射和/或接收單元(WTRU),例如可以通過通信信道 16來傳送視頻信息(在這種情況下,通信信道16包括無線鏈路)的無線手持設備或任意 無線設備。但是,在這里描述的、公開的或以其他方式顯性、隱性地、固有地提供的(統(tǒng)稱為 "提供的")方法、設備以及系統(tǒng)不必限為無線應用或設置。例如,這些技術(shù)可以應用于空中 電視廣播、有線電視傳輸、衛(wèi)星電視傳輸、因特網(wǎng)視頻傳輸、在存儲介質(zhì)上編碼的編碼后的 數(shù)字視頻、或者其他情況。因此,通信信道16可以包括和/或可以是適于傳輸編碼后的視 頻數(shù)據(jù)的無線或有線媒介的任意組合。
[0025] 源設備12可以包括視頻編碼器單元18、發(fā)射和/或接收(Tx/Rx)單元20以及Tx/ Rx元件22。如圖所示,可選地,源設備12可以包括視頻源24。目的設備14可以包括Τχ/ Rx元件26、Tx/Rx單元28以及視頻解碼器單元30。Tx/Rx單元20、28中的每一個可以是 或者包括發(fā)射機、接收機、或者發(fā)射機和接收機的組合(例如收發(fā)信機或發(fā)射機-接收機)。 Tx/Rx元件22、26中的每一個可以是例如天線。根據(jù)所公開的內(nèi)容,源設備12的視頻編碼 器單元18和/或目的設備的視頻解碼器單元30可以被配置為和/或適于(統(tǒng)稱為適合) 應用這里提供的編碼技術(shù)。
[0026] 源和目的設備12、14可以包括其他元件/組件或裝置。例如,源設備12可以適于 接收來自外部視頻源的視頻數(shù)據(jù)。并且,目的設備14可以與外部顯示設備(未示出)連接, 而不是包括和/或使用(例如集成的)顯示設備32。在一些實施方式中,可以將由視頻編 碼器單元18產(chǎn)生的數(shù)據(jù)流傳遞給其他設備而無需將數(shù)據(jù)調(diào)制到載波信號上,例如通過直 接數(shù)據(jù)傳遞,其中所述其他設備可以調(diào)制或不調(diào)制數(shù)據(jù)以進行傳輸。
[0027] 圖1示出的系統(tǒng)10僅僅是一個示例。這里提供的技術(shù)可以由數(shù)字視頻編碼和/ 或解碼設備執(zhí)行。雖然這里提供的技術(shù)一般可以由單獨的視頻編碼和/或視頻解碼設備執(zhí) 行,但是所述技術(shù)還可以由組合的視頻編碼器/解碼器(通常稱為編解碼器(CODEC))來執(zhí) 行。此外,這里提供的技術(shù)還可以由視頻預處理器等等執(zhí)行。源設備12和目的設備14僅 僅是這種編碼設備的示例:在該編碼設備中,源設備12產(chǎn)生(和/或接收視頻數(shù)據(jù)和產(chǎn)生) 編碼后的視頻信息以用于傳輸給目的設備14。在一些實施方式中,設備12、14可以按照基 本對稱的方式操作,從而設備12、14中的每一個包括視頻編碼和解碼組件和/或元件(統(tǒng) 稱為"元件")。因此,系統(tǒng)10可以支持設備12、14之間的單向和雙向視頻傳輸中的任意一 種,例如視頻流、視頻回放、視頻廣播、視頻電話以及視頻會議中的任意一種。在一些實施方 式中,源設備12可以是例如適于產(chǎn)生(和/或接收視頻數(shù)據(jù)和產(chǎn)生)編碼后的視頻信息以 用于一個或多個目的設備14的流服務器,其中目的設備可以通過有線和/或無線通信系統(tǒng) 與源設備12通信。
[0028] 外部視頻源和/或所述視頻源24可以是和/或包括視頻采集設備,例如視頻攝像 機、包含先前采集的視頻和或從視頻內(nèi)容提供商供應的視頻的視頻存檔。可替換地,外部視 頻源和/或所述視頻源24可以產(chǎn)生基于計算機圖形的數(shù)據(jù)作為源視頻、或者直播視頻、存 檔視頻以及計算機產(chǎn)生的視頻的組合。在一些實施方式中,如果視頻源24是視頻攝像機, 源設備12和目的設備14可以是可拍照手機或視頻手機,或者由可拍照手機或視頻手機實 現(xiàn)。但是,如上所述,這里提供的技術(shù)可應用于通常的視頻編碼,并且可應用于無線和/或 有線應用。在任意情況下,視頻編碼器單元18可以對所采集的、預先采集的、計算機產(chǎn)生的 視頻、供應的視頻、或其他類型的視頻數(shù)據(jù)(統(tǒng)稱為"未編碼的視頻")進行編碼,以形成編 碼后的視頻信息。
[0029] Tx/Rx單元20可以調(diào)制編碼后的視頻信息,例如根據(jù)通信標準來進行調(diào)制,從而 形成運載編碼后的視頻信息的一個或多個調(diào)制信號。Tx/Rx單元20還可以將調(diào)制信號傳遞 給其發(fā)射機以進行傳輸。該發(fā)射機可以經(jīng)由Tx/Rx元件22來將調(diào)制信號傳送給目的設備 14。
[0030] 在目的設備14處,Tx/Rx單元28可以經(jīng)由Tx/Rx元件26接收來自通過信道16的 調(diào)制信號。Tx/Rx單元28可以對調(diào)制信號進行解調(diào)以獲得編碼后的視頻信息。Tx/Rx單元 28可以將編碼后的視頻信息傳送給視頻解碼器單元30。
[0031] 視頻解碼器單元30可以對編碼后的視頻信息進行解碼以獲得解碼后的視頻數(shù) 據(jù)。編碼后的視頻信息可以包括由視頻編碼器單元18定義的語法信息。語法信息可以包 括一個或多個元素("語法元素;一些或所有元素可用于對編碼后的視頻信息進行解碼。 語法元素可以包括例如編碼后的視頻信息的特征。語法元素還可以包括用于形成編碼后的 視頻信息的未編碼的視頻的特征和/或描述對其進行的處理。
[0032] 視頻解碼器單元30可以輸出解碼后的視頻數(shù)據(jù)以用于稍后的存儲和/或顯示在 外部顯示器(未示出)上??商鎿Q地,視頻解碼器單元30可以將解碼后的視頻數(shù)據(jù)輸出給 顯示設備32。顯示設備32可以是和/或包括適于向用戶顯示解碼后的視頻數(shù)據(jù)的多種顯 示設備中的單個、多個、其組合、多個的組合。這些顯示設備的示例包括液晶顯示器(LCD)、 等離子顯示器、有機發(fā)光二極管(0LED)顯示器、陰極射線管(CRT)等等。
[0033] 通信信道16可以是任意無線或有線通信媒介,例如射頻(RF)頻譜、或者一個或多 個物理傳輸線,或者是無線和有線媒介的任意組合。通信信道16可以形成基于分組的網(wǎng)絡 (例如局域網(wǎng))、廣域網(wǎng)、或者全球網(wǎng)絡(例如因特網(wǎng))的一部分。通信信道16通常代表任 意合適的通信媒介、或者不同通信媒介的集合,以用于將來自源設備12的視頻數(shù)據(jù)傳送給 目的設備14,包括有線或無線媒介的任意合適的組合。通信信道16可以包括路由器、交換 機、基站、或者可用于促進從源設備12到目的設備14的通信的任意其他設備。下面參考圖 8、9A-9E提供了可以促進設備12、14之間的這種通信的一個示例性通信系統(tǒng)的細節(jié)。下面 也提供了可代表12、14的設備的細節(jié)。
[0034] 視頻編碼器單元18和視頻解碼器單元30可以根據(jù)一種或多種標準和/或規(guī)范 (例如 MPEG-2、H. 261、H. 263、H. 264、H. 264/AVC、H. 264 根據(jù) SVC 擴展而擴展的("H. 264/ SVC")等來運行。但是,可以理解,這里提供的方法、設備以及系統(tǒng)可應用于根據(jù)(和/或 兼容)不同標準實施的其他視頻編碼器、解碼器和/或編解碼器(CODEC),或者應用于專用 視頻編碼器、解碼器和/或編解碼器,包括將來還要開發(fā)的視頻編碼器、解碼器和/或編解 碼器。但是,這里公開的技術(shù)還不限于任意特定的編碼標準。
[0035] 上面提及的H. 264/AVC的相關(guān)部分可以從國際電信聯(lián)盟得到,稱為ITU-T建議 H. 264,或者更特別地," ITU-T Rec. H. 264 以及 IS0/IEC14496-10 (MPEG4-AVC),2010 年 3 月 的 'Advanced Video Coding for Generic Audiovisual Services (用于通用視聽服務的高級 視頻編碼)'版本5",其在這里被合并引用,并且在這里可以稱為Η. 264標準或Η. 264規(guī)范、 或者H. 264/AVC標準或規(guī)范。H. 264/AVC標準是由ITU-T視頻編碼專家組(VCEG)與ISO/ IEC MPEG-起制定的合作關(guān)系(稱為聯(lián)合視頻組(JVT))的產(chǎn)物。根據(jù)一些方面,這里提供 的技術(shù)可應用于一般符合H. 264標準的設備。JVT繼續(xù)為擴展H. 264/AVC標準而努力。
[0036] 在ITU-T的各種論壇中,如關(guān)鍵【技術(shù)領域】(KTA)論壇,已開展了推進H. 264/AVC標 準的工作。至少一些論壇已經(jīng)部分地推進了顯示了比H. 264/AVC標準顯示的編碼效率更高 的編碼效率的編碼技術(shù)。例如,ISO/IEC MPEG與ITU-T的VCEG已經(jīng)建立了關(guān)于視頻編碼 (JCT-VC)的聯(lián)合協(xié)作小組,其已經(jīng)開始開發(fā)下一代視頻編碼和/或壓縮標準,稱為高效視 頻編碼(HEVC)標準。根據(jù)一些方面,這里提供的技術(shù)可以提供相對于和/或根據(jù)H. 264/ AVC和/或HEVC (當前起草的)標準的編碼改進。
[0037] 雖然在圖1A-1D中沒有示出,但是根據(jù)一些方面,視頻編碼器和視頻解碼器單元 18、30中的每一個可以包括音頻編碼器和/或解碼器或者與其集成(如果合適)。視頻編 碼器和視頻解碼器單元18、30可以包括合適的復用-解復用(MUX-DEMUX)單元、或者其他 硬件和/或軟件,以處理以普通的數(shù)據(jù)流或可替換地單獨的數(shù)據(jù)流的形式的音頻和視頻的 編碼。如果可應用,則復用-解復用單元可以符合例如ITU-T建議H. 223復用器協(xié)議、或者 例如用戶數(shù)據(jù)報協(xié)議(UDP)之類的其他協(xié)議。
[0038] 視頻編碼器和視頻解碼器單元18、30中的每一個或多個可以包括在一個或多個 編碼器或解碼器中;任意一個可以集成為編解碼器的一部分,并且可以與各自的相機、計 算機、移動設備、用戶設備、廣播設備、機頂盒、服務器等等集成或以其他方式合并在一起。 此外,視頻編碼器單元18和視頻解碼器單元30可以分別實施為多種合適編碼器和解碼 器電路中的任意一者,例如一個或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路 (ASIC)、現(xiàn)場可編程門陣列(ASIC)、離散邏輯、軟件、硬件、固件或其任意組合??商鎿Q地,視 頻編碼器和視頻解碼器單元18、30中的任一者或兩者可以基本以軟件實施,并且從而,視 頻編碼器單元18和/或視頻解碼器單元30的元件的運行可以由合適軟件指令執(zhí)行,該軟 件指令由一個或多個處理器(未示出)執(zhí)行。另外,除了處理器之外,該實施方式還可以包 含片外(off-chip)組件,例如外部存儲器(例如以非易失性存儲器的形式)、輸入/輸出接 口等等。
[0039] 在其他實施方式中,視頻編碼器單元18和視頻解碼器單元30中的每一個的一些 元件可以實施為硬件,而其他元件可以使用合適的軟件指令來實施,該軟件指令由一個或 多個處理器(未示出)執(zhí)行。在視頻編碼器和/或視頻解碼器單元18、30的元件的運行可 以由一個或多個處理器執(zhí)行的軟件指令來執(zhí)行的任意實施方式中,這種軟件指令可以維持 在計算機可讀媒介上,該計算機可讀媒介包括磁盤、光盤、以及CPU可讀的任意其他易失性 (例如隨機接入存儲器(RAM))或非易失性(例如只讀存儲器(ROM))大容量存儲系統(tǒng)。計 算機存儲介質(zhì)可以包括合作或互連的計算機可讀媒介,其排他性地在處理系統(tǒng)上存在,或 者分布可處于處理系統(tǒng)本地或遠程的多個互連的處理系統(tǒng)之間。
[0040] 圖1B是示出用于與視頻編碼和/或解碼系統(tǒng)(例如如1A的系統(tǒng)10) -起使用的 一個示例性視頻編碼器單元18的框圖。視頻編碼器單元18可以包括視頻編碼器33、輸出緩 沖器34以及系統(tǒng)控制器36。類似于視頻編碼器單元18,作為一個整體,視頻編碼器33 (或 者其一個或多個元件)可以根據(jù)一個或多個標準和/或規(guī)范來實施,例如H. 261、H. 263、 H. 264、H. 264/AVC、H. 264/SVC、HEVC等等。但是,應當理解這里提供的方法、設備以及系統(tǒng) 可應用于根據(jù)不同標準實施的其他視頻編碼器、或者專用編解碼器,包括將來還要開發(fā)的 編解碼器。
[0041] 視頻編碼器33可以接收從視頻源(諸如視頻源24和/或外部的視頻源)提供的 視頻信號。該視頻信號可以包括未編碼的信號。視頻編碼器33可以對未編碼的視頻進行 編碼,并在其輸出提供編碼后的(即壓縮的)視頻比特流(BS)。
[0042] 可以將編碼后的視頻比特流BS提供給輸出緩沖器34。輸出緩沖器34可以緩沖編 碼后的視頻比特流BS,并提供該編碼后的視頻比特流BS作為緩沖的比特流(BBS)以經(jīng)由通 信信道16進行傳輸。
[0043] 可以將從輸出緩沖器34輸出的緩沖的比特流BBS提供給存儲設備(未示出)以 進行稍后的觀看或傳輸??商鎿Q地,視頻編碼器單元18可以被配置用于可視通信,在該可 視通信種,緩沖的比特流BBS可以經(jīng)由通信信道16在規(guī)定的時刻和/或可變的比特率(例 如具有很低或最小的延遲)而被傳送。
[0044] 編碼后的視頻比特流BS以及相應的緩沖的比特流BBS可以運載編碼后的視頻信 息的比特。緩沖的比特流BBS的比特可以被整理為編碼后的視頻幀流。編碼后的視頻幀可 以是如本領域技術(shù)人員可以理解的幀內(nèi)編碼幀(例如I幀)、間編碼幀(例如B幀或P幀) 等等。編碼后的視頻幀流可以被整理為例如一系列G0P,其中每個G0P的編碼后的視頻幀 以特定順序排列。一般地,每個G0P以幀內(nèi)編碼幀(例如I幀)開始,隨后是一個或多個幀 間編碼幀(例如P幀和/或B幀)。每個G0P通常僅包括單個的幀內(nèi)編碼幀;但是任意G0P 可以包括多個幀內(nèi)編碼幀。注意傳統(tǒng)的B幀不能用于實時的、低延遲的應用(這是因為,舉 例來說,與例如單向預測(P幀)相比,雙向預測通常引起額外的編碼延遲)。如本領域技術(shù) 人員可以理解的,可以支持另外和/或其他幀類型,并且可以修改特定排序的編碼后的視 頻幀。
[0045] 每個G0P可以包括語法數(shù)據(jù)("G0P語法數(shù)據(jù)")。G0P語法數(shù)據(jù)可以部署在G0P的 報頭中、G0P的一個或多個幀的報頭中、或者其他位置。G0P語法數(shù)據(jù)可以指示各個G0P的 編碼后的視頻幀的排序、數(shù)量和/或類型,和/或以其他方式描述。每個編碼后的視頻幀可 以包括語法數(shù)據(jù)("編碼后的幀語法數(shù)據(jù)")。編碼后的幀語法數(shù)據(jù)可以指示或以其他方式 描述用于各個編碼后的視頻幀的編碼模式。
[0046] 系統(tǒng)控制器36可以監(jiān)視不同的參數(shù)和/或與信道16相關(guān)聯(lián)的限制、視頻編碼器 單元18的可計算能力、用戶的需求等等,并且可以建立目標參數(shù)以提供適用于規(guī)定的限制 和/或信道16的條件的參與體驗質(zhì)量(QoE)??梢愿鶕?jù)規(guī)定的限制和/或信道條件來不 時地調(diào)整一個或多個目標參數(shù)。舉例來說,可以使用用于評估視頻質(zhì)量的一個或多個度量 (包括例如統(tǒng)稱為編碼后的視頻序列的相對感知質(zhì)量的度量)來從數(shù)量上估計。測量的編 碼后的視頻序列的相對感知(perc印tive)質(zhì)量(例如通過使用峰值信噪比("PSNR")度 量)由編碼后的比特流BS的比特率(BR)來控制??梢哉{(diào)整一個或多個目標參數(shù)(包括例 如量化參數(shù)(QP))來在與編碼后的比特流BS的比特率BR相關(guān)聯(lián)的限制下最大化視頻的相 對感知質(zhì)量。
[0047] 圖1C是示出用于與視頻編碼器單元(例如如1A-1B的視頻編碼器單元18) -起使 用的一個示例性視頻編碼器33的框圖。視頻編碼器33可以包括輸入38、模式?jīng)Q定和編碼 器控制器單元40、空間預測單元42、運動/時間預測單元44、第一加法器46、變換單元48、 量化單元50、熵(entropy)編碼單元52、反量化單元54、反變換單元56、第二加法器58、濾 波器60、參考圖片存儲器62以及輸出64。視頻編碼器33可以包括另外的元件和/或不同 元件。為了簡潔和清楚,沒有示出這些元件。
[0048] 此外,圖1C中示出的以及在這里提供的視頻編碼器33的細節(jié)僅僅用于說明,而真 正的實施可以不同。真正的實施可以包括例如更多的、更少的和/或不同的元件,和/或與 圖1C所示的布置不同地布置。例如,雖然變換單元48與量化單元50被分開示出,但是在 一些真正的實施中,例如在使用H. 264標準的核心變換的實施中,可以高度集成所述變換 單元48與量化單元50的一些或所有功能。類似地,反量化單元54和反變換單元56在一 些真正實施(例如,H. 264標準兼容實施)中可以高度集成,但是為了概念目的同樣可以分 開示出。
[0049] 如上所示,視頻編碼器33可以在其輸入38處接收視頻信號。視頻編碼器33可以 從所接收到的未編碼的視頻產(chǎn)生編碼后的視頻信息,并從該視頻編碼器33的輸出64將編 碼后的視頻信息(例如任意幀內(nèi)或幀間)以編碼后的視頻比特流BS的形式輸出。視頻編 碼器33可以例如作為混合視頻編碼器來運行,并使用基于塊的編碼過程來對未編碼的視 頻進行編碼。當執(zhí)行該編碼過程時,視頻編碼器33通常針對未編碼視頻的單獨幀、圖片、圖 像(統(tǒng)稱為"未編碼的圖片")進行操作。
[0050] 為了促進基于塊的編碼過程,視頻編碼器33可以在其輸入38處將每個未編碼的 圖片分片、分割、分開或者以其他方式分段(統(tǒng)稱為"分段")為多個未編碼的視頻塊。在 一些實例中,視頻編碼器33可以首先將未編碼的圖片分段為多個未編碼的視頻分段(例如 片),并且然后將每個未編碼的視頻分段分段為未編碼的視頻塊。視頻編碼器33可以將未 編碼的視頻塊傳遞、供應、發(fā)送或以其他方式提供給空間預測單元42、運動/時間預測單元 44和/或第一加法器46。如下面詳細描述的,可以逐塊地提供未編碼的視頻塊。
[0051] 空間預測單元42可以接收未編碼的視頻塊,并將該視頻塊以幀內(nèi)模式 (intra-mode)編碼。巾貞內(nèi)模式指的是基于空間的壓縮的若干個模式中的任意一種,并且在 幀內(nèi)模式中編碼是嘗試提供對未編碼的圖片的基于空間的壓縮?;诳臻g的壓縮(如果存 在)可以是減少或移除未編碼的圖片內(nèi)的視頻信息的空間冗余的結(jié)果。在形成預測塊的過 程中,空間預測單元42可以相對于已經(jīng)被編碼("編碼的視頻塊")和/或重新構(gòu)建("重 新構(gòu)建的視頻塊")的未編碼的圖片的一個或多個視頻塊來執(zhí)行每個未編碼視頻塊的空間 預測(或"幀內(nèi)預測")。編碼后的視頻塊和/或重新構(gòu)建的視頻塊可以鄰近、接近、或非常 靠近未編碼的視頻塊。
[0052] 運行/時間預測單元44可以接收來自輸入38的未編碼的視頻塊,并將該未編碼 的視頻塊以幀間模式(inter-mode)編碼。幀間模式指的是基于時間的壓縮的幾種模式中 的任意一種,包括例如P模式(單向預測)或B模式(雙向預測)。在幀間模式中編碼是嘗 試提供對未編碼的圖片的基于時間的壓縮?;跁r間的壓縮(如果存在)可以是減少或移 除未編碼的圖片與一個或多個參考(例如相鄰)圖片之間的視頻信息的時間冗余的結(jié)果。 運行/時間預測單元44可以相對于參考圖片的一個或多個視頻塊("參考視頻塊")來執(zhí) 行每個未編碼視頻塊的時間預測(或"幀間預測")。執(zhí)行的時間預測可以是單向預測(例 如對于P模式)或者可替換地雙向預測(例如對于B模式)。
[0053] 在單向預測的情況下,參考視頻塊可以來自先前編碼和/或重新構(gòu)建的圖片,并 且在一些情況下,來自僅一個先前編碼和/或重新構(gòu)建的圖片。編碼后的圖片和/或重新 構(gòu)建的圖片可以鄰近、接近、或非??拷淳幋a的圖片。
[0054] 在雙向預測的情況下,參考視頻塊可以來自一個或多個先前編碼和/或重新構(gòu)建 的圖片、以及視頻流的一個或多個其他未編碼的圖片。編碼后的圖片和/或重新構(gòu)建的圖 片和其他未編碼的圖片可以鄰近、接近、或非常靠近未編碼的圖片。
[0055] 如果支持多個參考圖片(這符合最近的視頻編碼標準例如H. 264/AVC或HEVC的 情況),則對于每個視頻塊,可以將其參考圖片索引發(fā)送給熵編碼單元52,以用于隨后的輸 出和/或傳輸。參考索引可以用于標識時間預測來自參考圖片存儲器62中的哪個或哪些 參考圖片。
[0056] 雖然用于運動估計和運動補償?shù)倪\動/時間預測單元44的功能通常是高度集中 的,但是其還可以由分開的實體或單元(未示出)來實現(xiàn)??梢詧?zhí)行運動估計相對于參考 圖片視頻塊來估計每個未編碼視頻塊的運動,并且可以包括產(chǎn)生未編碼的視頻塊的運動向 量。運動向量可以指示預測塊相對于正被編碼的未編碼視頻塊的移位。該預測塊是根據(jù)像 素差值發(fā)現(xiàn)非常匹配正被編碼的未編碼的視頻塊的參考圖片視頻塊。所述匹配可以由絕對 差值的和(SAD)、平方差的和(SSD)、或者其他差值度量來確定。運動補償可以包括基于由 運動估計確定的運動向量來取得或產(chǎn)生預測塊。
[0057] 運動/時間預測單元44可以通過比較未編碼的視頻塊與來自存儲在參考圖片存 儲器64中的參考圖片的參考視頻塊,來計算未編碼的視頻塊的運動向量。運動/時間預測 單元44可以計算包括在參考圖片存儲器62中的參考圖片的部分像素位置的值。在一些 情況下,加法器58或視頻編碼器33的另一單元可以計算重新構(gòu)建的視頻塊的部分像素位 置值,并且然后將重新構(gòu)建的視頻塊和部分像素位置的計算的值存儲在參考圖片存儲器62 中。運動/時間預測單元44還可以插入?yún)⒖紙D片(例如I幀或P幀的參考圖片)的亞整 數(shù)像素(sub-intergal pixel) 〇
[0058] 運動/時間預測單元44可以被配置為相對于選擇的運動預測算子(predictor) 來對運動向量進行編碼。由運動/時間預測單元44選擇的運動預測算子可以是例如等于已 被編碼的相鄰塊的運動向量的平均值的向量。為了對未編碼視頻塊的運動向量進行編碼, 運動/時間預測單元44可以計算運動向量與運動預測算子之間的差值以形成運動向量差 值。
[0059] H. 264將一組可能的參考幀稱為"列表"。存儲在參考圖片存儲器62中的一組參 考圖片可以對應于這種參考幀列表。運動/時間預測單元44可以比較來自參考圖片存儲 器62的參考圖片的參考視頻塊與未編碼的視頻塊(例如P幀或B幀的視頻塊)。當參考 圖片存儲器62中的參考圖片包括亞整數(shù)像素的值,由運動/時間預測單元44計算的運動 向量可以指參考圖片的亞整數(shù)像素位置。運動/時間預測單元44可以發(fā)送所計算的運動 向量給熵編碼單元52以及運動/時間預測單元44的運動補償功能。運動/時間預測單元 44(或其運動補償功能)可以相對于正被編碼的未編碼視頻塊來計算預測塊的差錯值。運 動/時間預測單元44可以基于預測塊來計算預測數(shù)據(jù)。
[0060] 模式?jīng)Q定和編碼器控制器單元40可以選擇一種編碼模式:幀內(nèi)模式或幀間模式。 模式?jīng)Q定和編碼器控制器單元40可以基于例如速率失真優(yōu)化方法和/或每種模式中產(chǎn)生 的錯誤結(jié)果來選擇編碼模式。
[0061] 視頻編碼器33可以通過從正被編碼的未編碼視頻塊中減去從運動/時間預測單 元42提供的預測數(shù)據(jù)來形成殘留塊("殘留視頻塊")。加法器46代表執(zhí)行該減去操作的 一個或多個元件。
[0062] 變換單元48可以對殘留視頻塊應用變換以將該殘留視頻塊從像素值域變換到變 換域,例如頻域。該變換可以是例如這里提及的任意一種變換:離散余弦變換(DCT)、或類 似概念的變換。其他變換的例子包括H. 264中定義的那些:小波變換、整數(shù)變換、子帶變換 等等。在任意情況下,由變換單元48對殘留視頻塊應用變換會產(chǎn)生殘留視頻塊的變換系數(shù) 的相應塊("殘留變換系數(shù)")。這些殘留變換系數(shù)可以表示殘留視頻塊的頻率分量的量級。 變換單元48可以將殘留變換系數(shù)和運動向量轉(zhuǎn)發(fā)給量化單元50。
[0063] 量化單元50可以量化殘留變換系數(shù)以進一步減小編碼后的比特率。量化過程可 以例如減小與一些或所有殘留變換系數(shù)相關(guān)聯(lián)的比特深度(bit d印th)。在一些情況下,量 化單元50可以將殘留變換系數(shù)的值除以與QP對應的量化水平,以形成量化后的變換系數(shù) 塊。量化的程度可以通過調(diào)整QP值來修改。一般地,量化單元50應用量化以使用期望個 數(shù)的量化步長來表示殘留變換系數(shù);使用的步長的個數(shù)(或相應地,量化水平的值)可以確 定用于表示殘留視頻塊的編碼后的視頻比特數(shù)。量化單元50可以從比特控制器(未示出) 獲得QP值。在量化之后,量化單元50可以提供量化后的變換系數(shù)和運動向量給熵編碼單 元50和反量化單元54。
[0064] 熵編碼單元52可以對量化后的變換系數(shù)應用熵編碼以形成熵編碼系數(shù)(即比特 流)。熵編碼單元52可以使用自適應可變長度編碼(CAVLC)、上下文自適應二進制算術(shù)編 碼(CABAC)或另一種熵編碼技術(shù)來形成熵編碼系數(shù)。如本領域技術(shù)人員的理解,CABAC需 要上下文信息("上下文")的輸入。該上下文可以基于例如相鄰視頻塊。
[0065] 熵編碼單元52可以按照粗(raw)編碼視頻比特流的形式提供熵編碼系數(shù)和運動 向量給內(nèi)比特流格式器(未示出)。該比特流格式器可以通過將另外的信息添加到粗編碼 視頻比特流來形成提供給輸出緩沖器34(圖1B)的編碼后的視頻比特流BS,所述另外的信 息包括報頭、和/或使得視頻解碼器30能夠從粗編碼視頻比特流解碼編碼后的視頻塊的其 他信息。在熵編碼之后,從熵編碼單元52提供給輸出緩沖器34的編碼后的視頻比特流BS 可以經(jīng)由信道16而被傳送給目的設備14或者存檔以用于稍后的傳輸或獲取。
[0066] 在一些實施方式中,除了熵編碼之外,熵編碼單元52或視頻編碼器33的另一單 元還可以被配置為執(zhí)行其他編碼功能。例如,熵編碼單元52可以被配置為確定視頻塊的 CBP值。另外,在一些實施方式中,熵編碼單元52可以執(zhí)行視頻塊中的量化變換系數(shù)的運 行(run)長度編碼。例如,熵編碼單元52可以應用鍋齒掃描(zigzag scan)或其他掃描模 式以安排視頻塊中的量化變換系數(shù)并對零的運行進行編碼以用于進一步壓縮。熵編碼單元 52還可以用合適的語法元素來構(gòu)建報頭信息以用于編碼后的視頻比特流BS中的傳輸。 [0067] 反量化單元54和反變換單元56可以分別應用反量化和反變換以在像素域中重新 構(gòu)建殘留視頻塊,例如從而稍后用作參考視頻塊的一個(例如參考圖片列表中的參考圖片 的一個內(nèi))。
[0068] 模式?jīng)Q定和編碼器控制器單元40可以通過將重新構(gòu)建的殘留視頻塊添加到參考 圖片存儲器62中存儲的參考圖片的一個的預測塊來計算參考視頻塊。模式?jīng)Q定和編碼器 控制器單元40還可以將一個或多個插入濾波器應用到重新構(gòu)建的殘留視頻塊以計算亞整 數(shù)像素值(例如對于半像素位置)以用于運動估計。
[0069] 加法器58可以將重新構(gòu)建的殘留視頻塊添加到運動補償預測視頻塊以產(chǎn)生重新 構(gòu)建的視頻塊,從而存儲在參考圖片存儲器62中。運動/時間預測單元44 (或其運動估計 功能和/或其運動補償功能)可以將重新構(gòu)建(像素值域)的視頻塊用作參考塊的一個, 以用于對隨后的未編碼視頻中的未編碼視頻塊進行間編碼。
[0070] 濾波器60可以包括解塊(deblock)濾波器。解塊濾波器可以操作來去除可能出 現(xiàn)在重新構(gòu)建的宏塊(macro-block)中的視覺偽像(visual artifact)。這些偽像可能是 在編碼過程中由于例如使用不同的編碼模式(例如I型、P型或B型)而引入的。偽像可 能出現(xiàn)在例如接收到的視頻塊的邊界處和/或邊緣處,并且解塊濾波器可以操作來使得視 頻塊的邊界處和/或邊緣處平滑以改進視覺質(zhì)量。如果需要,解塊濾波器通常會對加法器 58的輸出進行濾波。
[0071] 圖1D是示出用于與視頻解碼器單元(例如如1A-1B的視頻解碼器單元30) -起使 用的一個示例性視頻解碼器35的框圖。視頻解碼器35可以包括輸入66、熵解碼單元68、運 動補償預測單元70、空間預測單元72、反量化單元74、反變換單元76、參考圖片存儲器80、 濾波器82、加法器78以及輸出84。視頻解碼器35可以執(zhí)行解碼處理,即一般與關(guān)于視頻 編碼器33 (圖1C)提供的編碼過程是相對的。所述解碼過程可以如下執(zhí)行。
[0072] 運動補償預測單元70可以基于從熵解碼單元68接收到的運動向量來產(chǎn)生預測數(shù) 據(jù)。運動向量可以相對于對應于該被編碼的運動向量的視頻塊的運動預測算子被編碼。運 動補償預測單元70可以確定運動預測算子,例如確定為鄰近將要被解碼的視頻塊的塊的 運動向量的中值。在確定運動預測算子之后,運動補償預測單元70可以通過從編碼后的視 頻比特流BS提取運動向量差值、以及將運動預測算子加上運動向量差值來對編碼后的運 動向量進行解碼。運動補償預測單元70可以將運動預測算子量化到與編碼后的運動向量 相同的分辨率(resolution)??商鎿Q地,運動補償預測單元70可以為所有編碼后的運動預 測算子使用相同的精度。可替換地,運動補償預測單元70可以被配置為使用上述方法中的 任意一種,并通過分析包括在從編碼后的視頻比特流BS獲得的序列參數(shù)集合、分片參數(shù)集 合、或圖片參數(shù)集合中的數(shù)據(jù)來確定要使用哪種方法。
[0073] 在對運動向量進行解碼之后,運動補償預測單元70可以從參考圖片存儲器80的 參考圖片中提取由運動向量標識的預測視頻塊。如果運動向量指向部分像素位置,例如半 像素,則運動補償預測單元70可以為部分像素位置插入值。運動補償預測單元70可以使 用自適應插入濾波器或固定的插入濾波器來插入這些值。此外,運動補償預測單元70可以 從接收到的編碼后的視頻比特流BS獲得要使用濾波器82中的哪個濾波器的指示以及(在 一些實施方式中)針對濾波器82的系數(shù)。
[0074] 空間預測單元72可以使用在編碼后的視頻比特流BS中接收到的幀內(nèi)預測模式來 從空間上鄰近的塊形成預測視頻塊。反量化單元74可以對在編碼后的視頻比特流BS中提 供且由熵解碼單元68解碼的量化塊系數(shù)進行反量化,即去量化。反量化過程可以包括常規(guī) 的過程,例如由H. 264定義的過程。反量化過程還可以包括為每個視頻塊使用由視頻編碼 器33計算的量化參數(shù)QP來確定量化的程度,并且同樣地確定可以應用的反量化的程度。 [0075] 反變換單元76可以將反變換(例如這里提供的變換中的任意一種的反變換:反 DCT、反整數(shù)變換、或者概念上類似的反變換過程)應用到變換系數(shù)來在像素域中產(chǎn)生殘留 視頻塊。運動補償預測單元70可以產(chǎn)生運動補償塊,可能基于插入濾波器執(zhí)行插入。要用 于具有亞像素精度的運動估計的插入濾波器的標識符可以包括在視頻塊的語法元素中。運 動補償預測單元70可以使用視頻編碼器33在對視頻塊進行編碼期間使用的插入濾波器來 計算用于參考塊的亞整數(shù)像素的插入值。運動補償預測單元70可以根據(jù)接收到的語法信 息來確定由視頻編碼器33使用的插入濾波器,并使用該插入濾波器來產(chǎn)生預測塊。
[0076] 運動補償預測單元70可以使用一些語法信息來確定用于編碼編碼后的視頻序列 的一個或多個圖片的視頻塊的大小、描述如何分割編碼后的視頻序列的幀的每個視頻塊的 分割信息、指示如何對每個分割進行編碼的模式、用于每個幀間編碼視頻塊的一個或多個 參考圖片、以及用于對編碼后的視頻序列進行解碼的其他信息。
[0077] 加法器78可以對由運動補償預測單元70或空間預測單元72產(chǎn)生的殘留塊和相 應的預測塊進行求和以形成解碼后的視頻塊。在需要的情況下,還可以應用解塊濾波器 (例如濾波器82)對解碼后的視頻塊進行濾波以去除塊效應(blockiness)偽像。然后解碼 后的視頻塊被存儲在參考圖片存儲器80中,其提供參考視頻塊來用于隨后的運動補償,并 且還產(chǎn)生解碼后的視頻來在顯示設備上呈現(xiàn)(例如圖1的顯示設備34)。
[0078] 在每個視頻塊經(jīng)歷編碼和/或解碼過程時,該視頻塊的視頻信息可以不同地表 示。例如,視頻塊可以包括:(i )像素域中的像素數(shù)據(jù);(? )表示未編碼視頻塊與預測 塊之間的像素差的殘留數(shù)據(jù)("殘留")變換域中的變換系數(shù)(例如,在應用變換之 后);以及(iv)量化變換域中的量化變換系數(shù)。
[0079] 每個視頻塊可以具有給定的尺寸或者統(tǒng)稱為"大小"。視頻塊大小可以取決于編 碼標準。例如,H. 264標準支持不同視頻塊大小的幀內(nèi)預測,例如用于亮度(luma)分量的 16xl6、8x8或4x4、和用于色度分量的8x8,并且支持不同塊大小的幀間預測,例如用于亮度 分量的16xl6、16x8、8xl6、8x8、8x4、4x8以及4x4、和用于色度分量的相應縮放的大小。在 H. 264標準中,尺寸為16像素乘16像素的視頻塊一般稱為宏塊(MB),而尺寸小于16像素 乘16像素的視頻塊一般稱為部分MB( "MB部分")。在HEVC中,稱為"編碼單元"或"⑶" 的視頻塊可以用于更有效地壓縮高分辨率(例如1080p及以上)的視頻信號。在HEVC中, CU大小在參數(shù)序列集合中設定,并且可以設定為最大為64x64像素或最小為4x4像素。還 可以將CU分割為預測單元(PU),對于該分割可以應用單獨的預測方法。每個視頻塊(MB、 ⑶、TO等)可以通過使用空間預測單元42和/或運動/時間預測單元44來處理。
[0080] 如這里使用的,"NxN"和"N乘N"可互換使用以指代在堅直和水平尺寸中的分量 (例如像素、殘留、變換系數(shù)、量化變換系數(shù)等)方面的塊大小,例如16x16元素或16乘16 元素。一般地,16x16視頻塊將在堅直方向具有16個元素 (y = 16)且在水平方向具有16 個元素(x= 16)。類似地,NxN塊一般在堅直方向具有N個元素且在水平方向具有N個元 素,其中N代表非負整數(shù)值。視頻塊中的元素可以按照行和列來布置。此外,視頻塊可以在 水平方向和堅直方向具有相同或不同數(shù)量的像素。例如,視頻塊可以包括NxM個像素,其中 Μ不必等于N。
[0081] H. 264/AVC標準規(guī)定了 4階和8階整數(shù)變換,稱為Τ4和Τ8,如下給出:
[0082]
【權(quán)利要求】
1. 一種設備,該設備包括處理器和存儲器,其中該存儲器包括一組變換矩陣、以及能夠 由所述處理器執(zhí)行以使用所述一組變換矩陣中的任意變換矩陣來對數(shù)據(jù)進行變換的指令, 其中: 所述一組變換矩陣中的每個變換矩陣是正交的,并且具有不同數(shù)量的元素; 各個數(shù)量的元素中的每個元素是整數(shù); 每個變換矩陣的基本向量的范數(shù)之間的差值滿足給定的閾值;以及 所述基本向量接近離散余弦變換(DCT)矩陣的對應基本向量。
2. -種設備,該設備包括處理器和存儲器,其中該存儲器包括一組變換矩陣、以及能夠 由所述處理器執(zhí)行以使用所述一組變換矩陣中的任意變換矩陣來對數(shù)據(jù)進行變換的指令, 其中: 所述一組變換矩陣中的每個變換矩陣近似正交,具有不同數(shù)量的元素并能夠被完全因 式分解; 各個數(shù)量的元素中的每個元素是整數(shù); 每個變換矩陣的基本向量的范數(shù)之間的差值滿足給定的閾值;以及 所述基本向量接近離散余弦變換(DCT)矩陣的對應基本向量。
3. 根據(jù)權(quán)利要求1和2中任一項權(quán)利要求所述的設備,其中所述存儲器還包括:能夠 由所述處理器執(zhí)行以產(chǎn)生所述一組變換矩陣并將該組變換矩陣存儲在所述存儲器中的指 令。
4. 根據(jù)權(quán)利要求1和2中任一項權(quán)利要求所述的設備,其中所述給定的閾值包括以下 閾值:當滿足該閾值時,指示所述基本向量的范數(shù)大致相等。
5. 根據(jù)權(quán)利要求1和2中任一項權(quán)利要求所述的設備,其中根據(jù)失真的測量,所述基本 向量接近離散余弦變換(DCT)矩陣的對應基本向量。
6. 根據(jù)權(quán)利要求1和2中任一項權(quán)利要求所述的設備,其中根據(jù)失真的測量所述基本 向量接近離散余弦變換(DCT)矩陣的對應基本向量包括根據(jù)該失真的測量滿足預定義的 閾值。
7. 根據(jù)權(quán)利要求5和6中任一項權(quán)利要求所述的設備,其中所述失真的測量是基于所 述DCT矩陣的。
8. 根據(jù)權(quán)利要求5-7中任一項權(quán)利要求所述的設備,其中所述失真的測量是基于至少 所述基本向量以及所述DCT矩陣的對應基本向量的一部分的。
9. 根據(jù)前述權(quán)利要求中任一項權(quán)利要求所述的設備,其中所述一組變換矩陣中的每個 變換矩陣能夠分解成偶數(shù)部分和奇數(shù)部分。
10. 根據(jù)前述權(quán)利要求中任一項權(quán)利要求所述的設備,其中所述一組變換矩陣中的每 個變換矩陣包括2NX 2N個元素,并且其中N是正整數(shù)。
11. 根據(jù)權(quán)利要求10所述的設備,其中所述一組變換矩陣中的每個變換矩陣能夠分解 成偶數(shù)部分和奇數(shù)部分,并且其中所述偶數(shù)部分和奇數(shù)部分中的每一者包括2 ΜΧ2Η個元 素。
12. 根據(jù)權(quán)利要求11所述的設備,其中所述偶數(shù)部分由因數(shù)Μ縮放,并且其中Μ是正整 數(shù)。
13. 根據(jù)權(quán)利要求11所述的設備,其中根據(jù)所述奇數(shù)部分進行變換包括將2Ν-2階變換 應用到從一層小波分解得到的每個子帶所得到的結(jié)果。
14. 根據(jù)權(quán)利要求13所述的設備,其中所述結(jié)果由因數(shù)Μ縮放,并且其中Μ是正整數(shù)。
15. 根據(jù)權(quán)利要求14所述的設備,其中所述小波變換是哈爾變換。
16. 根據(jù)前述權(quán)利要求中任一項權(quán)利要求所述的設備,其中所述設備是以下任意一者: 視頻編碼器、視頻解碼器、以及無線發(fā)射和/或接收單元(WTRU)。
17. -種用于使用Ν階整數(shù)變換處理殘留視頻數(shù)據(jù)的方法,該方法包括: 在預處理單元處,接收殘留視頻數(shù)據(jù)的向量; 在所述預處理單元處,處理所述殘留視頻數(shù)據(jù)的向量,以形成用于變換的第一中間輸 出向量和第二中間輸出向量; 在第一變換單元處,接收所述第一中間輸出向量; 在所述第一變換單元處,對所述第一中間輸出向量進行變換,以使用Ν/2階整數(shù)偶數(shù) 部分變換矩陣和Ν/2階整數(shù)奇數(shù)部分矩陣的基礎向量來形成偶數(shù)索引的變換系數(shù); 在第二變換單元處,接收所述第二中間輸出向量;以及 在所述第二變換單元處,對所述第二中間輸出向量進行變換,以通過連續(xù)的Ν/2階整 數(shù)矩陣處理所述第二中間輸出向量來形成奇數(shù)索引的變換系數(shù),其中所述Ν/2階整數(shù)矩陣 一起對所述Ν階整數(shù)變換矩陣的奇數(shù)部分進行因式分解。
18. 根據(jù)權(quán)利要求17所述的方法,其中所述連續(xù)的Ν/2階整數(shù)矩陣基于Ν/4階奇數(shù)部 分矩陣,且其中通過連續(xù)Ν/2階整數(shù)矩陣處理所述第二中間輸出向量包括: 生成所述第二中間輸出向量的第一子帶和第二子帶;以及 將所述Ν/4階奇數(shù)部分矩陣應用到所述第一子帶和第二子帶的每一者。
19. 根據(jù)權(quán)利要求17所述的方法,其中所述Ν階整數(shù)變換是8階整數(shù)變換,且其中所述 連續(xù)Ν/2階整數(shù)矩陣包括三個連續(xù)的4階整數(shù)矩陣。
20. 根據(jù)權(quán)利要求19所述的方法,其中第一個連續(xù)4階整數(shù)矩陣包括沿一條對角線的 偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱,其中第二個連續(xù)4階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的零對稱,且其中第三個連續(xù)4階整數(shù)矩陣包括沿一條對角 線的偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱。
21. 根據(jù)權(quán)利要求17所述的方法,其中所述Ν階整數(shù)變換是16階整數(shù)變換,且其中所 述連續(xù)Ν/2階整數(shù)矩陣包括四個連續(xù)8階整數(shù)矩陣。
22. 根據(jù)權(quán)利要求21所述的方法,其中第一個連續(xù)8階整數(shù)矩陣包括沿一條對角線的 偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱,其中第二個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的零對稱,其中第三個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的零對稱,以及第四個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱。
23. 根據(jù)權(quán)利要求17所述的方法,其中所述Ν階整數(shù)變換是8階整數(shù)變換,其中通過連 續(xù)Ν/2階整數(shù)矩陣處理所述第二中間輸出向量包括: 通過第一個4階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個4階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元素; 以及 通過第三個4階整數(shù)矩陣處理所述第二組中間變換元素以形成所述奇數(shù)索引的變換 系數(shù)。
24. 根據(jù)權(quán)利要求17所述的方法,其中所述N階整數(shù)變換是16階整數(shù)變換,其中通過 連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出向量包括: 通過第一個8階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個8階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元素; 通過第三個8階整數(shù)矩陣處理所述第二組中間變換元素以形成第三組中間變換元素; 以及 通過第四個8階整數(shù)矩陣處理所述第三組中間變換元素以形成所述奇數(shù)索引的變換 系數(shù)。
25. 根據(jù)權(quán)利要求17所述的方法,其中所述N階整數(shù)變換是32階整數(shù)變換,其中通過 連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出向量包括: 通過第一個16階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個16階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元 素; 通過第三個16階整數(shù)矩陣處理所述第二組中間變換元素以形成第三組中間變換元 素; 通過第四個16階整數(shù)矩陣處理所述第三組中間變換元素以將所述第三組中間變換元 素分解成用于根據(jù)各自4階整數(shù)矩陣進行變換的四個向量;以及 將所述四個向量的每一個向量應用到所述各自的4階整數(shù)矩陣以形成奇數(shù)索引的變 換系數(shù)。
26. -種用于使用N階整數(shù)變換處理殘留視頻數(shù)據(jù)的設備,該設備包括預處理單元、第 一變換單元以及第二變換單元,其中 : 所述預處理單元適用于接收殘留視頻數(shù)據(jù)的向量; 所述預處理單元適用于處理所述殘留視頻數(shù)據(jù)的向量以形成用于變換的第一中間輸 出向量和第二中間輸出向量; 所述第一變換單元適用于接收所述第一中間輸出; 所述第一變換單元適用于對所述第一中間輸出向量進行變換以使用N/2階整數(shù)偶數(shù) 部分變換矩陣和N/2階整數(shù)奇數(shù)部分矩陣的基本向量來形成偶數(shù)索引的變換系數(shù); 所述第二變換單元適用于接收所述第二中間輸出向量;以及 所述第二變換單元適用于對所述第二中間輸出向量進行變換以通過連續(xù)N/2階整數(shù) 矩陣處理所述第二中間輸出向量來形成奇數(shù)索引的變換系數(shù),其中所述N/2階整數(shù)矩陣一 起對所述N階整數(shù)變換矩陣的奇數(shù)部分進行因式分解。
27. 根據(jù)權(quán)利要求26所述的設備,其中所述連續(xù)N/2階整數(shù)矩陣基于N/4階奇數(shù)部分 矩陣,且其中所述第二變換單元適用于在通過連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出 向量時,生成所述第二中間輸出向量的第一子帶和第二子帶并將所述N/4階奇數(shù)部分矩陣 應用于所述第一子帶和第二子帶的每一者。
28. 根據(jù)權(quán)利要求26所述的設備,其中所述N階整數(shù)變換是8階整數(shù)變換,且其中所述 連續(xù)N/2階整數(shù)矩陣包括三個連續(xù)的4階整數(shù)矩陣。
29. 根據(jù)權(quán)利要求28所述的設備,其中其中第一個連續(xù)4階整數(shù)矩陣包括沿一條對角 線的偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱,其中第二個連續(xù)4階整數(shù)矩陣包括沿一條對 角線的偶數(shù)對稱和沿另一條對角線的零對稱,且其中第三個連續(xù)4階整數(shù)矩陣包括沿一條 對角線的偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱。
30. 根據(jù)權(quán)利要求26所述的設備,其中所述N階整數(shù)變換是16階整數(shù)變換,且其中所 述連續(xù)N/2階整數(shù)矩陣包括四個連續(xù)4階整數(shù)矩陣。
31. 根據(jù)權(quán)利要求30所述的設備,其中第一個連續(xù)8階整數(shù)矩陣包括沿一條對角線的 偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱,其中第二個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的零對稱,其中第三個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的零對稱,以及第四個連續(xù)8階整數(shù)矩陣包括沿一條對角線 的偶數(shù)對稱和沿另一條對角線的奇數(shù)對稱。
32. 根據(jù)權(quán)利要求26所述的設備,其中所述N階整數(shù)變換是8階整數(shù)變換,其中當通過 連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出向量時,所述第二變換單元適用于: 通過第一個4階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個4階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元素; 以及 通過第三個4階整數(shù)矩陣處理所述第二組中間變換元素以形成所述奇數(shù)索引的變換 系數(shù)。
34. 根據(jù)權(quán)利要求26所述的設備,其中所述N階整數(shù)變換是16階整數(shù)變換,其中當通 過連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出向量時,所述第二變換單元適用于: 通過第一個8階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個8階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元素; 通過第三個8階整數(shù)矩陣處理所述第二組中間變換元素以形成第三組中間變換元素; 以及 通過第四個8階整數(shù)矩陣處理所述第三組中間變換元素以形成所述奇數(shù)索引的變換 系數(shù)。
35. 根據(jù)權(quán)利要求26所述的設備,其中所述N階整數(shù)變換是32階整數(shù)變換,其中當通 過連續(xù)N/2階整數(shù)矩陣處理所述第二中間輸出向量時,所述第二變換單元適用于: 通過第一個16階整數(shù)矩陣處理所述第二中間輸出向量以形成第一組中間變換元素; 通過第二個16階整數(shù)矩陣處理所述第一組中間變換元素以形成第二組中間變換元 素; 通過第三個16階整數(shù)矩陣處理所述第二組中間變換元素以形成第三組中間變換元 素; 通過第四個16階整數(shù)矩陣處理所述第三組中間變換元素以將所述第三組中間變換元 素分解成用于根據(jù)各自4階整數(shù)矩陣進行變換的四個向量;以及 將所述四個向量的每一個向量應用到所述各自的4階整數(shù)矩陣以形成奇數(shù)索引的變 換系數(shù)。
【文檔編號】H04N19/61GK104067621SQ201280054519
【公開日】2014年9月24日 申請日期:2012年11月6日 優(yōu)先權(quán)日:2011年11月7日
【發(fā)明者】董潔, 葉琰 申請人:Vid拓展公司