專利名稱:用于快速視頻幀和場編碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及視頻編碼器,更具體地說,涉及用于快速視頻幀和場編碼的方法和裝置。
背景技術(shù):
JVT/H.264/MPEG AVC(“JVT”)標準允許對漸進的和經(jīng)交錯視頻序列二者進行編碼,并且支持三種不同的圖片編碼模式。參考圖1A到圖1C,H.264內(nèi)的圖片編碼類型總地由標號110、120和130指示。具體而言,幀編碼類型總地由標號110指示,場編碼類型總地由標號120指示,而宏塊(MB)自適應(yīng)幀/場編碼類型總地由標號130指示。
在基于幀的編碼110中,圖片是通過使最高和最低兩條線交錯而被創(chuàng)建的。在基于場的編碼120中,經(jīng)交錯幀被分離成最高和最低的場,并且每個場被分別編碼。該標準還支持被稱作宏塊自適應(yīng)幀/場編碼(MBAFF)模式的副幀模式,其中幀被劃分成16×32個超級宏塊。這些劃分本質(zhì)上包括2個宏塊(MB),這2個宏塊都要么以場模式要么以幀模式被編碼。還可以將兩種幀圖片編碼模式中的任一種(通常的或MBAFF)與場圖片組合,這在編碼器處提供了額外的靈活性和提高的性能。但是,這編碼器具有自適應(yīng)地選擇將使用何種圖片編碼模式(圖片自適應(yīng)幀/場編碼-PAFF)的能力。
通常,對于快速運動的交錯幀,獨立地壓縮每個場可能更有效。相反,如果幀既包括運動區(qū)域又包括靜止區(qū)域,則利用MBAFF編碼以場模式編碼運動區(qū)域并且以幀模式編碼靜止區(qū)域通常更有效。
圖片級別幀和場編碼(PAFF)和宏塊級別幀和場編碼(MBAFF)工具被H.264視頻編碼標準采納到主要的和擴展的簡檔中,用于提高對經(jīng)交錯序列的編碼效率。PAFF判決被用來決定包括兩個互補的場的當前交錯幀是應(yīng)當作為單個幀被編碼(幀模式)還是作為兩個獨立的經(jīng)編碼場(場模式)。相反,MBAFF判決被用在包括16×32個超級宏塊(super-MB)(即,一對垂直相鄰的宏塊)的特定結(jié)構(gòu)化的幀模式中,來決定super-MB是以場模式還是幀模式被編碼。
因此,用于編碼經(jīng)交錯序列的多種組合可用。更具體地說,每個幀可以在未經(jīng)super-MB劃分的情況下作為單個非經(jīng)交錯幀被編碼,或者作為兩個互補場(PAFF模式)被編碼。第二種選擇是以MBAFF模式編碼整個序列,其中每個幀作為包括一幀場超級MB劃分的單個幀被編碼(MBAFF模式)。最后,也可以將上述兩種判決組合,其中一個幀可以作為包括幀或場super-MB劃分的單個幀被編碼或者作為兩個互補場被編碼(PAFF+MBAFF)。
在JVT參考軟件中,多遍方法被用來決定編碼模式。如果PAFF被使用,則幀將首先以幀和場模式二者被編碼。導(dǎo)致最小拉格朗日失真J=D+λR的模式將被選擇為最終模式,其中D是失真,R是速率,而λ是拉格朗日乘數(shù)。類似地,如果MBAFF被使用,則每個super-MB劃分(即,一組2個垂直相鄰的MB)將首先以幀和場模式二者被編碼。同樣,具有最小拉格朗日失真的模式被選擇為用于該super-MB的最終模式。最后,如果PAFF+MBAFF二者都被考慮,則編碼過程可以被看作是上述PAFF和MBAFF編碼方法的組合,即,幀在利用MBAFF的幀模式中首先被編碼,其中每個super-MB將基于先前描述的MBAFF判決以場或者幀模式被編碼。同一個幀也將作為兩個分離的場被編碼,并且將基于PAFF判決決定最終編碼模式(MBAFF幀對場)。
采用這些工具提供了編碼經(jīng)交錯幀的靈活性,盡管也相當大地增加了復(fù)雜性。
因此,希望具有一種方法和裝置用于快速并且/或者更低復(fù)雜度的PAFF和MBAFF判決,并且這種方法和裝置是非常有益的。
發(fā)明內(nèi)容
本發(fā)明解決了現(xiàn)有技術(shù)的這些和其他缺陷和缺點,本發(fā)明涉及一種方法和裝置,用于快速視頻幀和場編碼。
根據(jù)本發(fā)明一個方面,提供了一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的視頻編碼器。該視頻編碼器包括利用被垂直應(yīng)用到該圖像的帶通/高通濾波器,將圖像中的super-MB分類成幀模式或場模式之一的編碼器。
根據(jù)本發(fā)明的另一個方面,提供了一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的視頻編碼器。該視頻編碼器包括利用被垂直應(yīng)用到super-MB中的每個super-MB以分別將super-MB中的每個super-MB分類成圖像中的運動區(qū)域或不運動區(qū)域的帶通/高通濾波器,來執(zhí)行圖片自適應(yīng)幀場(PAFF)判決的編碼器。其中PAFF判決基于圖像中被分類成運動區(qū)域的super-MB的百分比。
根據(jù)本發(fā)明的另一個方面,提供了一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的視頻編碼器。該視頻編碼器包括利用預(yù)分析判決的編碼器,所述預(yù)分析判決針對場模式或幀模式對所述圖像中的單獨的super-MB進行分類,以用于圖片自適應(yīng)幀場(PAFF)模式選擇和宏塊自適應(yīng)幀場(MBAFF)模式選擇二者。
根據(jù)本發(fā)明又一個方面,提供了一種用于對圖像的視頻數(shù)據(jù)進行編碼的方法。該方法包括利用被垂直應(yīng)用到該圖像的帶通/高通濾波器,將該圖像中的超級宏塊(super-MB)分類成幀模式或場模式之一。
根據(jù)本發(fā)明的又一個方面,提供了一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的方法。該方法包括利用被垂直應(yīng)用到super-MB以分別將super-MB中的每個super-MB分類成所述圖像中的運動區(qū)域或不運動區(qū)域的帶通/高通濾波器,來執(zhí)行圖片自適應(yīng)幀場(PAFF)判決的步驟。其中PAFF判決基于圖像中被分類成運動區(qū)域的super-MB的百分比。
根據(jù)本發(fā)明的附加方面,提供了一種用于對圖像的視頻數(shù)據(jù)進行編碼的方法。該方法包括使用預(yù)分析判決的步驟,該預(yù)分析判決針對場模式或幀模式對所述圖像中的單獨的super-MB進行分類,以用于圖片自適應(yīng)幀場(PAFF)模式選擇和宏塊自適應(yīng)幀場(MBAFF)模式選擇二者。
結(jié)合附圖閱讀下面對示例性實施方式的詳細描述,本發(fā)明的其他方面、特征和優(yōu)點將變清楚。
根據(jù)下面的示例性附圖,可以更好地理解本發(fā)明,在附圖中圖1A-1C是示出了H.264中的圖片編碼類型的圖,這些圖片編碼類型適于根據(jù)本發(fā)明的原理使用;圖2示出了根據(jù)本發(fā)明原理的視頻編碼器的框圖,該視頻編碼器具有快速圖片幀和場編碼(PAFF)或PAFF和宏塊幀場編碼(MBAFF)判決;圖3示出了根據(jù)本發(fā)明原理的方法的流程圖,該方法用于執(zhí)行快速圖片幀和場編碼(PAFF)判決;圖4示出了根據(jù)本發(fā)明原理的方法的流程圖,該方法用于執(zhí)行快速宏塊幀場編碼(MBAFF);以及圖5示出了根據(jù)本發(fā)明原理的方法的流程圖,該方法用于執(zhí)行快速圖片幀和場編碼(PAFF)和快速宏塊幀場編碼(MBAFF)判決。
具體實施例方式
本發(fā)明涉及用于快速視頻幀和場編碼的方法和裝置。該方法和裝置可以在預(yù)分析階段實現(xiàn)。
本說明解釋了本發(fā)明的原理。因此,將意識到本領(lǐng)域技術(shù)人員將能夠設(shè)計出各種布置來體現(xiàn)本發(fā)明的原理,盡管未在這里明確地描述和示出,但是它們都被包括本發(fā)明的精神和范圍內(nèi)。
這里所描述的所有示例和條件語言都是要幫助讀者理解本發(fā)明的原理和發(fā)明人對現(xiàn)有技術(shù)作出貢獻的概念,并且應(yīng)當被理解為不是對這種專門描述的示例和條件的限制。
此外,這里描述本發(fā)明的原理、方面和實施方式及其特定示例的所有陳述都是要包括其結(jié)構(gòu)和功能等同物二者。另外,這種等同物包括當前已知的等同物以及將來開放的等同物,即,開發(fā)來執(zhí)行相同功能的任何元件,而不管結(jié)構(gòu)如何。
因此,例如,本領(lǐng)域技術(shù)人員將意識到這里給出的框圖代表體系本發(fā)明原理的說明性電路的概念視圖。類似地,將意識到任何流程表、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等都代表各種過程,這些過程基本上可以表現(xiàn)在計算機可讀介質(zhì)中,并且由計算機或處理器執(zhí)行,不管這種計算機或處理器是否被明確示出。
圖中所示的各個元件的功能可以通過使用與適當?shù)能浖嚓P(guān)聯(lián)的專用硬件和能夠執(zhí)行軟件的硬件提供。當由處理器提供時,這些功能可由單個專用處理器提供、由單個共享處理器提供、或者由多個獨立的處理器提供(其中的一些是可以被共享)。此外,明確地使用術(shù)語“處理器”或“控制器”不應(yīng)當被解釋為排他地指代能夠執(zhí)行軟件的硬件,而是也可以非限制地包括數(shù)字信號處理器(“DSP”)硬件、用于存儲軟件的只讀存儲器(“ROM”)、隨機訪問存儲器(“RAM”)和非易失性存儲設(shè)備。
還可以包括其他傳統(tǒng)的和/或?qū)S玫挠布?。類似地,圖中示出的任何開關(guān)都僅是概念性的。它們的功能可以通過程序邏輯的運行、通過專用邏輯、通過程序控制和專用邏輯的交互,或者甚至手動執(zhí)行,實現(xiàn)者可選擇的具體技術(shù)可從上下文具體理解。
在本發(fā)明的權(quán)利要求中,作為用于執(zhí)行指定功能的裝置表述的任何元件包括執(zhí)行該功能的任何方式,包括例如a)執(zhí)行該功能的電路元件的組合,或者b)與適當?shù)碾娐方M合的任何形式的軟件(因此包括固件、微代碼等),其中該電路用于執(zhí)行軟件來執(zhí)行該功能。這樣的權(quán)利要求所限定的發(fā)明在于這樣的事實各種所述裝置所提供的功能以權(quán)利要求所限定的方式被組合并結(jié)合到一起。因此認為可以提供那些功能的任何裝置都等同于這里示出的那些。
下面將給出對本發(fā)明的總地描述,然后更詳細地描述本發(fā)明的各個方面。
參見圖2,該圖示出了具有快速圖片幀和場編碼(PAFF)或PAFF和宏塊幀場編碼(MBAFF)判決的視頻編碼器,該編碼器由標號200總地示出。
到視頻編碼器視頻編碼器200的輸入以信號通信的方式被與運動活動探測器210的輸入相連接。運動活動探測器210的第一輸出以信號通信的方式被與幀模式或者MBAFF幀模式編碼器230的第一輸入以及PAFF判決模塊220的輸入相連接。取決于PAFF判決模塊220的輸出,PAFF判決模塊220的輸出能夠以信號通信的方式被與幀模式或者MBAFF幀模式編碼器230的第二輸入以及場模式編碼器240的第一輸入相連接。幀模式或者MBAFF幀模式編碼器230的輸出或場模式編碼器240的輸出可以用作視頻編碼器200的輸出。
在本發(fā)明的一個說明性實施方式中,帶通/高通濾波器被應(yīng)用到圖像來檢測圖像中的運動區(qū)域?;趫D像內(nèi)的被分類成運動區(qū)域的super-MB的百分比,PAFF判決被執(zhí)行。類似地,基于相應(yīng)的super-MB是否也被分類成對應(yīng)于運動區(qū)域,MBAFF判決被執(zhí)行。在檢測運動邊沿期間,自適應(yīng)閾值被應(yīng)用。
在本發(fā)明的實施方式中隱含的基本假設(shè)在于總地來說運動區(qū)域通常利用場編碼被最佳編碼而靜止區(qū)域則相反以幀模式被較好編碼。
現(xiàn)在將給出對本發(fā)明的上述實施例進一步描述??梢哉J為本發(fā)明包括下面的三個步驟。
第一步驟包括對圖像應(yīng)用帶通/高通濾波器來檢測圖像中的運動區(qū)域。帶通/高通濾波器通過例如考慮這種濾波器對圖像內(nèi)的交錯偽像(運動邊沿)的影響來檢測圖像中的運動區(qū)域。帶通/高通濾波器可以是用于邊沿檢測的濾波器、邊沿探測器和/或能夠檢測圖像中的運動區(qū)域或者其部分的任何其他元件,但是不限于此。優(yōu)選但不一定,帶通/高通濾波器被垂直應(yīng)用到圖像上。
第二步驟包括針對每個super-MB創(chuàng)建掩碼?;趕uper-MB的經(jīng)濾波器像素的值,如果super-MB是運動super-MB,則掩碼被設(shè)置為1,如果super-MB不是運動super-MB,則被設(shè)置為0。
第三步驟可以認為包括2個部分(或者子步驟),這2個部分可以獨立地(即,僅一個被執(zhí)行)或者組合地(即,都被執(zhí)行)被執(zhí)行。
第三步驟的第一部分在PAFF判決將被使用時被執(zhí)行。在這種情形中,運動super-MB的數(shù)目也被計數(shù),并且當百分比大于閾值T1時,幀以場模式被編碼。否則,幀以幀模式被編碼。
第三步驟的第二部分在MBAFF判決將被使用時被執(zhí)行。在這種情形中,當當前super-MB的掩碼等于1時,當前super-MB以場模式被編碼。否則,當前super-MB以幀模式被編碼。
如上所述,第三步驟的第一部分和第二部分可以被組合用于兩步PAFF+MBAFF判決,其中PAFF判決首先被執(zhí)行,并且如果幀被PAFF判決選擇,則MBAFF判決被執(zhí)行。
參見圖3,用于執(zhí)行快速圖片幀和場編碼(PAFF)判決的方法由標號300總地示出。方法300包括開始框302,其將控制傳遞到功能框304。功能框304對圖像垂直應(yīng)用高通/帶通濾波器,然后將控制傳遞到功能框306。功能框306將閾值應(yīng)用到該圖像,并且將控制傳遞到循環(huán)限制框308。循環(huán)限制框308開始循環(huán),循環(huán)變量i從0到superMBs_in_pic-1,然后將控制傳遞到功能框310。功能框310基于super-MBi中的閾值圖像的值的和,計算super-MBi的掩碼值MASK(i),然后將控制傳遞到判決框312。判決框312確定掩碼值MASK(i)是否等于1。如果掩碼值MASK(i)不等于1,則控制被傳遞到循環(huán)限制框314。否則,如果掩碼值MASK(i)等于1,則控制被傳遞到功能框322。
結(jié)束循環(huán)框314結(jié)束該循環(huán),然后將控制傳遞到判決框316。判決框316確定計數(shù)器變量是否大于預(yù)先指定的閾值。如果計數(shù)器變量不大于預(yù)先指定的閾值,則控制被傳遞到功能框318。否則,如果計數(shù)器變量大于預(yù)先指定的閾值,則控制被傳遞到功能框324。
功能框318以幀圖片模式執(zhí)行編碼,然后將控制傳遞到結(jié)束框320。
功能框322將計數(shù)器遞增1,然后將控制傳遞到循環(huán)限制框314。
功能框324以場圖片模式執(zhí)行編碼,然后將控制傳遞到結(jié)束框320。
參考圖4,用于執(zhí)行快速宏塊幀場編碼(MBAFF)判決的方法由標號400總地示出。方法400包括開始框402,其將控制傳遞到功能框404。功能框404對圖像垂直應(yīng)用高通/帶通濾波器,然后將控制傳遞到功能框406。功能框406將閾值應(yīng)用到圖像,然后將控制傳遞到循環(huán)限制框408。循環(huán)限制框408開始循環(huán),循環(huán)變量i從0到superMBs_in_pic-1,然后將控制傳遞到功能框410。功能框410基于super-MBi中的閾值圖像的值的和,計算super-MBi的掩碼值MASK(i),然后將控制傳遞到判決框412。判決框412確定掩碼值MASK(i)是否等于1。如果掩碼值MASK(i)不等于1,則控制被傳遞到循環(huán)限制框414。否則,如果掩碼值MASK(i)等于1,則控制被傳遞到功能框420。
功能框414以幀super-MB模式執(zhí)行編碼,然后將控制傳遞到循環(huán)限制框416。循環(huán)限制框416結(jié)束循環(huán),然后將控制傳遞到結(jié)束框418。
功能框420以場super-MB模式執(zhí)行編碼,然后將控制傳遞到循環(huán)限制框416。
參考圖5,用于執(zhí)行快速圖片幀和場編碼(PAFF)和快速宏塊幀場編碼(MBAFF)判決的方法由標號500總地示出。方法500包括開始框502,其將控制傳遞到功能框504。功能框504對圖像垂直應(yīng)用高通/帶通濾波器,然后將控制傳遞到功能框506。功能框506將閾值應(yīng)用到圖像,然后將控制傳遞到循環(huán)限制框508。循環(huán)限制框508開始循環(huán),循環(huán)變量i從0到superMBs_in_pic-1,然后將控制傳遞到功能框510。功能框510基于super-MBi中的閾值圖像的值的和,計算super-MBi的掩碼值MASK(i),然后將控制傳遞到判決框512。判決框512確定掩碼值MASK(i)是否等于1。如果掩碼值MASK(i)不等于1,則控制被傳遞到循環(huán)限制框514。否則,如果掩碼值MASK(i)等于1,則控制被傳遞到功能框530。
循環(huán)限制框514結(jié)束循環(huán),然后將控制傳遞到判決框516。判決框516確定計數(shù)器變量是否大于預(yù)先指定的閾值。如果計數(shù)器變量不大于預(yù)先指定的閾值,則控制被傳遞到功能框518。否則,如果計數(shù)器變量大于預(yù)先指定的閾值,則控制被傳遞到功能框532。
功能框518以幀圖片模式執(zhí)行編碼,然后將控制傳遞到循環(huán)限制框520。循環(huán)限制框520開始循環(huán),循環(huán)變量i從0到superMBs_in_pic-1,然后將控制傳遞到判決框522。
判決框522基于510中的預(yù)先計算的數(shù)據(jù),確定掩碼值MASK(i)是否等于1。如果掩碼值MASK(i)不等于1,則控制被傳遞到功能框524。否則,如果掩碼值MASK(i)等于1,則控制被傳遞到功能框534。
功能框524以幀super-MB模式執(zhí)行編碼,然后將控制傳遞到循環(huán)限制框526。循環(huán)限制框526結(jié)束循環(huán),然后將控制傳遞到結(jié)束框528。
功能框530將計數(shù)器遞增1,然后將控制傳遞到循環(huán)限制框514。循環(huán)限制框514結(jié)束循環(huán),然后將控制傳遞到判決框516。
功能框532以場圖片模式執(zhí)行編碼,然后將控制傳遞到結(jié)束框528。
功能框534以場super-MB模式執(zhí)行編碼,然后將控制傳遞到循環(huán)限制框526。
現(xiàn)在將給出關(guān)于前述本發(fā)明的各個方面的進一步描述。
現(xiàn)在將給出關(guān)于帶通濾波器kBP的進一步描述。如果考慮一個對象在背景前水平運動的情形,則沿著該對象的邊沿可以觀察到交錯偽像(即,運動邊沿),這是由于每個奇數(shù)場總是在其前的偶數(shù)場晚剛好一場被捕捉到。通過檢測這種交錯偽像,可以確定該對象是否正在運動??梢袁F(xiàn)解,如這里所使用的,短語“帶通濾波器”包括高通濾波器和能夠檢測這里所述的交錯偽像的任何其他類型的濾波器。這些濾波器可以沿當前幀的垂直軸被應(yīng)用。
在對當前幀應(yīng)用了帶通濾波器后,要判斷運動邊沿是否出現(xiàn)在圖像中。假定在濾波器后,經(jīng)濾波器的輸出為IBP(x,y)。
現(xiàn)在將給出關(guān)于針對super-MB創(chuàng)建掩碼的進一步描述。
通過對IBP(x,y)取絕對值并將其值與閾值T1相比較,生成閾值處理后的圖像M(x,y),即 (等式1)
super-MB E的掩碼被設(shè)置為 (等式2)一種用于判定super-MB E的掩碼的替換方法是將閾值(T能量)與經(jīng)濾波器像素的絕對值的和相比較,如下所示 (等式3)對于PAFF判決,如果hist_edge=Σi∈BMASK(i)>T3,]]>則幀以場模式被編碼,否則,幀以幀模式被編碼,其中B是super-MB的集合。至于MBAFF判決,如果MASK(E)=1,則super-MB E以場模式被編碼,否則,super-MB以幀模式被編碼。
盡管等式1和等式2的公式對于運動super-MB的檢測看起來足夠,但是未考慮對宏塊或塊內(nèi)的像素的實際位置(x,y)的編碼期間的影響。例如,對于這種比較,塊邊沿像素的重要性與塊中央的像素相比可能較低,這尤其是由于循環(huán)解塊濾波器的影響所致。另一方面,取決于相鄰像素直接的相關(guān)性,重要性可以增大或減小。因此,用于計算MASK(E)的可能替換是 (等式4)其中a(x,y)是取決于位置(x,y)和在該位置與其鄰居處的值IBP(.)的相關(guān)性的值。例如,對于4×4的塊a=142332344334432332]]>邊沿檢測濾波器可以檢測經(jīng)交錯偽像(運動邊沿)和真正的邊沿。為了減少這種假陽性檢測的可能性,等式1中的閾值T1基于幀中的第一場(假定為最頂上的場)的特性被自適應(yīng)地選擇。相同的濾波器KBP被處置應(yīng)用到該場。閾值被選擇,其中在該場中邊沿的比率小于T4,即,∑M(x,y)<T4*W*H/2 (等式5),其中W是幀的寬度,H是幀的高度。閾值可以基于幀、基于圖片組(GOP)或者基于場景被決定。這里所使用的術(shù)語“GOP”指其后跟隨P和B圖片的I圖片。此外,這里所使用的“基于場景”指場景改變中-之間的圖片。其他閾值可以根據(jù)經(jīng)驗決定。一個示例是設(shè)置T2=0,T3=0.5,并且T4=0.1。當然,本發(fā)明不限于前述值,因此在維持本發(fā)明的范圍的情況下也可以使用其他的值。
上面的判決可以與其他標準一起被應(yīng)用,例如當前幀和其前面的參考幀之間的絕對差(稱作avgdiff)、或者幀類型(即,image_type)、或者宏塊特性(例如,平面的、邊沿的或紋理的)、幀或MB變量,同時這些量度也可以允許必要的閾值的自動適應(yīng)。PAFF判決的一個示例可以例如是,if (image_type==I_SLICE){if (hist edge<0.5)Code as frame mode;elseCode as field mode;}else if (image_type=B.SLICE){if (hist_edge<0.6)Code as frame mode;elseCode as field mode;}else //P_slice{if (hist_edge)>0.5)|(hist_edge>0.3|&&(avgdiff>4.5)&&(avgdiff<0.01)Code as field mode;elseCode as frame mode;}本發(fā)明也可以適用于圖片組(GOP)級幀/場判決。例如,這里描述的PAFF判決可以被應(yīng)用到當前GOP中的所有幀。如果要以場模式編碼的幀的數(shù)目大于某一百分比,則僅場模式編碼可被用于整個GOP,否則幀模式被使用。
現(xiàn)在將給出對本發(fā)明的許多伴隨的優(yōu)點/特征中的一些的描述。例如,一個優(yōu)點/特征是利用垂直帶通濾波器例如在預(yù)分析階段執(zhí)行圖片級自適應(yīng)幀或場判決(PAFF)的編碼器。PAFF判決基于圖像中的被分類成運動區(qū)域的super-MB的百分比被執(zhí)行。另一個優(yōu)點/特征是上述編碼器,其中帶通濾波器是邊沿檢測濾波器。有一個優(yōu)點/特征是上述編碼器,其中帶通濾波器使用被選擇來從真實邊沿區(qū)分運動邊沿的自適應(yīng)閾值,并且其中所述閾值可以是可適應(yīng)逐幀的、逐GOP的、或者逐場景的。又一個優(yōu)點/特征是具有上述自適應(yīng)閾值的編碼器,其中帶通濾波器還被應(yīng)用到一個場圖像,并且該自適應(yīng)閾值被選擇,其中該場圖像中的邊沿像素的數(shù)目低于另一個閾值。另外,另一個優(yōu)點/特征是具有上述自適應(yīng)閾值和其他閾值的編碼器,其中邊沿像素在閾值處理之前,根據(jù)在塊內(nèi)的位置和/或與相鄰像素的相關(guān)性而首先被加權(quán)。此外,另一個優(yōu)點/特征是上述編碼器,其中模式判決被與其他標準組合,所述其他標準例如是幀類型、當前圖片和先前的參考圖片之間的絕對差、宏塊特性(平面的、邊沿的或者紋理的),幀和/或MB變量。此外,另一個優(yōu)點/特征是上述編碼器,其中模式判決在圖片群組級別被執(zhí)行,其中上述第一PAFF判決針對當前GOP中的所有幀被執(zhí)行,使得如果被判定要以場模式被編碼的幀的數(shù)目大于一定的百分比,則場模式被用于整個GOP。否則,幀模式被使用。又一個優(yōu)點/特征是利用帶通濾波器將super-MB分類成幀或場的編碼器。又一個優(yōu)點/特征是執(zhí)行上述分類的編碼器,其中MBAFF判決是基于帶通濾波器結(jié)果的。另外,又一個優(yōu)點/特征是執(zhí)行上述分類的編碼器,其中閾值被應(yīng)用到super-MB中的每個像素來分類為邊沿像素,然后邊沿像素的數(shù)目被求和并與閾值相比較,來確定該MB是場還是幀。此外,另一個特征/優(yōu)點是執(zhí)行上述分類的編碼器,其中經(jīng)濾波器像素的絕對值的和被相加并與閾值相比較,來確定該MB被分類成場還是幀。此外,又一個優(yōu)點/特征是一種編碼器,其中用于將獨立的super-MB分類成場或幀的預(yù)分析判決被用于PAFF和MBAFF模式判決。
本領(lǐng)域技術(shù)人員基于這里的教導(dǎo),容易確認本發(fā)明的這些和其他特征和優(yōu)點。應(yīng)當理解,本發(fā)明的教導(dǎo)可以以硬件、軟件、固件、專用處理器或者它們的組合等各種形式實現(xiàn)。
最優(yōu)選地,本發(fā)明的教導(dǎo)被實現(xiàn)為硬件和軟件的組合。此外,軟件優(yōu)選地被實現(xiàn)為有形地包含在程序存儲單元上的應(yīng)用程序。應(yīng)用程序可以被上傳到包括任何適當體系結(jié)構(gòu)的機器并且由該機器執(zhí)行。優(yōu)選地,該機器被實現(xiàn)在計算機平臺上,該計算機平臺具有例如一個或多個中央處理單元(“CPU”)、隨機訪問存儲器(“RAM”)和輸入/輸出(“I/O”)接口之類的硬件。計算機平臺還可以包括操作系統(tǒng)和微指令代碼。這里所述的各種工程和功能可以是微指令代碼的一部分或者應(yīng)用程序的一部分,或者它們的任何組合,其可由CPU執(zhí)行。另外,各種其他外圍單元可以被連接到計算機平臺,例如附加的數(shù)據(jù)存儲單元和打印單元。
還應(yīng)當理解,因為在附圖中示出的構(gòu)成系統(tǒng)組件和方法中的一些優(yōu)選以軟件實現(xiàn),系統(tǒng)組件或過程功能塊之間的實際連接取決于本發(fā)明被編程的方式而可能不同。給定這里的教導(dǎo),本領(lǐng)域技術(shù)人員將能夠設(shè)想本發(fā)明的這些和類似的實現(xiàn)方式或配置。
盡管這里已參考附圖描述了說明性實施例,但是應(yīng)當理解本發(fā)明不限于這些具體實施例,在不脫離本發(fā)明的范圍和精神的情況下,本領(lǐng)域技術(shù)人員可以實現(xiàn)各種改變和修改。所有這種改變和修改都是要被包括在所附權(quán)利要求書所闡述的本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種用于對可分割成宏塊的圖像的視頻數(shù)據(jù)進行編碼的裝置,其中多個宏塊可被指派成宏塊組,所述裝置包括運動活動探測器(210);以及編碼器(200),用于響應(yīng)于將所述視頻數(shù)據(jù)應(yīng)用到所述運動活動探測器(210),指派所述宏塊組用于以幀模式或場模式之一進行編碼。
2.如權(quán)利要求1所述的裝置,其中所述宏塊組是超級宏塊(super-MB)。
3.如權(quán)利要求2所述的裝置,其中所述運動活動探測器(210)是帶通/高通濾波器。
4.如權(quán)利要求3所述的裝置,其中宏塊自適應(yīng)幀場(MBAFF)判決是響應(yīng)于將所述帶通/高通濾波器應(yīng)用到所述圖像的。
5.如權(quán)利要求3所述的裝置,其中所述super-MB包括多個像素,并且所述編碼器(200)利用所述帶通/高通濾波器的自適應(yīng)閾值將所述多個像素中的至少一些分類成邊沿像素,通過將多個邊沿像素相加確定出總和,并且將所述總和與另一個預(yù)先指定的閾值相比較來確定所述super-MB是針對所述幀模式還是針對所述場模式來分類的。
6.一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的裝置,包括編碼器(200),用于利用帶通/高通濾波器來執(zhí)行圖片自適應(yīng)幀場(PAFF)判決,其中所述帶通/高通濾波器被垂直應(yīng)用到所述super-MB以分別將所述super-MB中的多個super-MB分類成所述圖像中的運動區(qū)域或不運動區(qū)域,其中所述PAFF判決基于所述圖像中被分類成運動區(qū)域的super-MB的百分比。
7.如權(quán)利要求6所述的裝置,其中所述帶通/高通濾波器使用可適應(yīng)閾值,該可適應(yīng)閾值被選擇用于將真實邊沿與運動邊沿區(qū)分開來。
8.如權(quán)利要求7所述的裝置,其中所述閾值是逐幀、逐圖片組(GOP)、或者逐場景可適應(yīng)的。
9.如權(quán)利要求7所述的裝置,其中所述帶通/高通濾波器被應(yīng)用到一場圖像,并且所述可適應(yīng)閾值被選擇為其中所述一場圖像中的邊沿像素的數(shù)目低于另一個閾值。
10.如權(quán)利要求8所述的裝置,其中所述編碼器(200)還用于在進行閾值處理之前根據(jù)super-MB中的位置和與相鄰像素的相關(guān)性中的至少一個對所述邊沿像素進行屬性加權(quán)。
11.如權(quán)利要求6所述的裝置,其中所述PAFF判決被與其他標準組合,所述其他標準包括從下述群組中選出的至少一個幀類型、當前圖片和先前的參考圖片的絕對差、宏塊特性、幀變量、以及宏塊變量。
12.如權(quán)利要求6所述的裝置,其中所述PAFF判決對于當前GOP中的所有幀,在圖片組(GOP)級別上被執(zhí)行,使得當判定為要以所述場模式被編碼的幀的數(shù)目大于預(yù)先指定的百分比時,所述場模式被用于所述當前GOP,否則所述幀模式被用于所述當前GOP。
13.一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的視頻編碼器,其包括利用預(yù)分析判決的編碼器(200),所述預(yù)分析判決針對場模式或幀模式對單獨的super-MB進行分類,以用于圖片自適應(yīng)幀場(PAFF)模式選擇和宏塊自適應(yīng)幀場(MBAFF)模式選擇二者。
14.一種用于對可分割成宏塊的圖像的視頻數(shù)據(jù)進行編碼的方法,其中多個宏塊可被指派成宏塊組,所述方法包括對于所述宏塊組的多個部分檢測(304-306,404-406和504-506)超出閾值的運動;以及響應(yīng)于在所述檢測步驟中檢測出超出閾值的運動,指派所述宏塊組用于以幀模式或者場模式之一進行編碼。
15.一種用于對圖像的視頻數(shù)據(jù)進行編碼的方法,包括利用垂直應(yīng)用到所述圖像的帶通/高通濾波器,將所述圖像中的超級宏塊(super-MB)分類(420,414和404)到幀模式或場模式之一的步驟。
16.如權(quán)利要求15所述的方法,還包括利用(404、420和414)通過所述帶通/高通濾波器獲得的分類進行宏塊自適應(yīng)幀場(MBAFF)判決的步驟。
17.如權(quán)利要求15所述的方法,其中所述super-MB包括多個像素,并且所述分類步驟包括以下步驟利用所述帶通/高通濾波器的自適應(yīng)閾值,將所述多個像素中的至少一些分類(406)成邊沿像素;通過將多個邊沿像素相加來確定(410)出總和;以及將所述總和與另一個預(yù)先指定的閾值相比較來確定所述super-MB被分類成所述幀模式還是所述場模式。
18.一種用于對可分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼的方法,包括利用被垂直應(yīng)用到所述super-MB以分別將所述super-MB中的每個super-MB分類成所述圖像中的運動區(qū)域或不運動區(qū)域的帶通/高通濾波器,來執(zhí)行(304、310、316、324和318)圖片自適應(yīng)幀場(PAFF)判決,并且其中所述PAFF判決基于所述圖像中被分類成運動區(qū)域的super-MB的百分比。
19.如權(quán)利要求18所述的方法,其中所述帶通/高通濾波器是邊沿探測濾波器。
20.如權(quán)利要求18所述的方法,其中所述帶通濾波器/高通濾波器使用可適應(yīng)閾值,該可適應(yīng)閾值被選擇用于將運動邊沿與真實邊沿區(qū)分開來。
21.如權(quán)利要求20所述的方法,其中所述閾值是逐幀、逐圖片組(GOP)、或者逐場景可適應(yīng)的。
22.如權(quán)利要求20所述的方法,其中所述帶通/高通濾波器被應(yīng)用到一場圖像,并且所述可適應(yīng)閾值被選擇為其中所述一場圖像中的邊沿像素的數(shù)目低于另一個閾值。
23.如權(quán)利要求21所述的方法,其中所述方法還包括在進行閾值處理之前根據(jù)super-MB中的位置和與相鄰像素的相關(guān)性中的至少一個對所述邊沿像素進行屬性加權(quán)的步驟。
24.如權(quán)利要求18所述的方法,其中所述PAFF判決被與其他標準組合,所述其他標準包括從下述群組中選出的至少一個幀類型、當前圖片和先前的參考圖片的絕對差、宏塊特性、幀變量、以及宏塊變量。
25.如權(quán)利要求18所述的方法,其中所述PAFF判決對于當前GOP中的所有幀,在圖片組(GOP)級別上被執(zhí)行,使得當判定為要以所述場模式被編碼的幀的數(shù)目大于預(yù)先指定的百分比時,所述場模式被用于所述當前GOP,否則所述幀模式被用于所述當前GOP。
26.一種用于對圖像的視頻數(shù)據(jù)進行編碼的方法,包括利用(504、532、518、534和524)預(yù)分析判決的步驟,所述預(yù)分析判決針對場模式或幀模式對所述圖像中的單獨的超級宏塊(super-MB)進行分類,以用于圖片自適應(yīng)幀場(PAFF)模式選擇和宏塊自適應(yīng)幀場(MBAFF)模式選擇二者。
全文摘要
提供了視頻編碼器和相應(yīng)的方法,用于對可被分割成超級宏塊(super-MB)的圖像的視頻數(shù)據(jù)進行編碼。視頻編碼器包括編碼器(200),用于利用被垂直應(yīng)用到該圖像的帶通/高通濾波器,將圖像中的super-MB分類成幀模式或場模式之一。
文檔編號H04N7/26GK101023679SQ200580031214
公開日2007年8月22日 申請日期2005年9月14日 優(yōu)先權(quán)日2004年9月16日
發(fā)明者尹鵬, 吉爾·麥克唐納·伯恩斯, 亞歷山德羅斯·邁克爾·圖阿皮斯 申請人:湯姆遜許可證公司