專利名稱:利用區(qū)域檢測的資源自適應(yīng)視頻編碼系統(tǒng)及其使用的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在諸如視頻編碼器/編解碼器的設(shè)備內(nèi)使用的編碼。
背景技術(shù):
視頻編碼已經(jīng)成為現(xiàn)代視頻處理設(shè)備的重要問題。健壯的編碼算法允許以減少的帶寬傳輸視頻信號并且以更少的存儲器存儲視頻信號。然而,這些編碼方法的準確性面臨正在變得習(xí)慣于更高分辨率和更好圖形質(zhì)量的用戶的詳細審查。已經(jīng)頒布了許多編碼方法的標(biāo)準,包括還被稱為MPEG-4部分10或高級視頻編碼(AVC)的H. 264標(biāo)準。雖然該標(biāo)準提出了許多強有力的技術(shù),可能有改進這些方法的實現(xiàn)的性能和速度的進一步改進。通過對這些系統(tǒng)和本發(fā)明進行比較,本領(lǐng)域技術(shù)人員將明了常規(guī)和傳統(tǒng)方法的其它限制和缺點。
圖1給出了根據(jù)本發(fā)明的實施例的視頻處理設(shè)備125的方框圖表示;圖2給出了根據(jù)本發(fā)明的實施例的區(qū)域標(biāo)識信號產(chǎn)生器150的方框圖表示;圖3給出了根據(jù)本發(fā)明的另一實施例的區(qū)域檢測模塊320的方框圖表示;圖4給出了根據(jù)本發(fā)明的另一實施例的區(qū)域檢測模塊320'的方框圖表示;圖5給出了根據(jù)本發(fā)明的實施例的視頻編碼系統(tǒng)102的方框圖表示;圖6給出了根據(jù)本發(fā)明的實施例的視頻分發(fā)系統(tǒng)175的方框圖表示;圖7給出了根據(jù)本發(fā)明的實施例的視頻存儲系統(tǒng)179的方框圖表示;和圖8給出了根據(jù)本發(fā)明的實施例的方法的流程圖表示。
具體實施例方式圖1給出了根據(jù)本發(fā)明的實施例的視頻處理設(shè)備125的方框圖表示。特別地,視頻處理設(shè)備125包括接收模塊100,諸如機頂盒、電視接收機、個人計算機、有線電視接收機、衛(wèi)星廣播接收機、寬帶調(diào)制解調(diào)器、3G收發(fā)器或能夠從諸如廣播纜線系統(tǒng)、廣播衛(wèi)星系統(tǒng)、hternet、數(shù)字視頻盤播放器、數(shù)字視頻記錄器或其它視頻源之類的一個或多個源接收視頻信號110的其它信息接收器或收發(fā)器。視頻編碼系統(tǒng)102耦接到接收模塊100以對一個或多個視頻信號110進行編碼、速率轉(zhuǎn)換(transrate)和/或轉(zhuǎn)碼(transcode)以便形成經(jīng)處理的視頻信號112。在本發(fā)明的實施例中,視頻信號110可以包括廣播視頻信號,諸如電視信號、高清晰度電視信號、增強高清晰度電視信號或直接或通過一個或多個衛(wèi)星或其它中繼站通過無線介質(zhì)或通過纜線網(wǎng)絡(luò)、光網(wǎng)絡(luò)或其它傳輸網(wǎng)絡(luò)傳輸?shù)钠渌鼜V播視頻信號。另外,可以從存儲的視頻文件產(chǎn)生視頻信號110、從記錄介質(zhì)一諸如磁帶、磁盤或光盤一回放視頻信號110,并且視頻信號110可以包括在公共或私有網(wǎng)絡(luò)一諸如局域網(wǎng)、廣域網(wǎng)、城域網(wǎng)或 Internet——上傳輸?shù)牧饕曨l信號。視頻信號110可以包括具有若干視頻格式中的任意一種格式的模擬視頻信號,所述視頻格式包括國家電視系統(tǒng)委員會制式(NTSC)、逐行倒相制式(PAL)或順序傳送與存儲彩色電視系統(tǒng)制式(SECAM)。經(jīng)處理的視頻信號112符合數(shù)字視頻編解碼器標(biāo)準,諸如 H. 264.MPEG-4部分10高級視頻編碼(AVC),或其它數(shù)字格式,諸如運動圖像專家組(MPEG) 格式(諸如 MPEGl、MPEG2 或 MPEG4)、Quicktime 格式、Real Media 格式、Windows Media Video(WMV)或音視頻交錯格式(AVI)、或標(biāo)準或?qū)S械牧硪粩?shù)字視頻格式。視頻編碼系統(tǒng)102包括區(qū)域標(biāo)識信號產(chǎn)生器150和編碼工具75。特別地,區(qū)域標(biāo)識信號產(chǎn)生器150可以通過運動檢測、聚類、統(tǒng)計模式識別、句法模式識別或通過其它檢測方法操作,以檢測視頻信號110的特定圖像(幀或場)或圖像組中關(guān)注的空間區(qū)域或時間區(qū)域,諸如視頻信號110中圖像序列內(nèi)的一時間段。另外,作為對其的響應(yīng),區(qū)域標(biāo)識信號產(chǎn)生器150產(chǎn)生標(biāo)識檢測到的關(guān)注區(qū)域的區(qū)域標(biāo)識信號。視頻編碼系統(tǒng)102的編碼器部分操作多個編碼工具75以通過量化和數(shù)字化產(chǎn)生具有特定圖像質(zhì)量的經(jīng)處理的視頻信號112。當(dāng)檢測到關(guān)注區(qū)域時,編碼工具被調(diào)整到更高質(zhì)量。例如,可以調(diào)整編碼工具75以與至少一個圖像的在關(guān)注區(qū)域之外的部分相比,給關(guān)注區(qū)域分配更小量化、更高分辨率或其它更高質(zhì)量,以便與該圖像的在該區(qū)域之外的部分相對比,在編碼該區(qū)域時提供更高質(zhì)量的圖像。另外,視頻編碼系統(tǒng)102可以調(diào)整編碼工具75以便在對關(guān)注區(qū)域編碼時使用比在未檢測到并且標(biāo)識出關(guān)注區(qū)域時所使用的更高的分辨率、量化等。以這種方式,當(dāng)與視頻信號110的其它區(qū)域相比時,視頻編碼系統(tǒng)102可以在關(guān)注區(qū)域,諸如視覺重要性更大的區(qū)域,中分配更多可用計算資源和/或產(chǎn)生更高視頻質(zhì)量。例如,可以檢測人的頭部和肩部,并且可以在這些區(qū)域內(nèi)利用更多資源以便產(chǎn)生更高質(zhì)量的編碼。在另一個例子中,還可以檢測表現(xiàn)出更大程度的運動或更大復(fù)雜性的時間段,并且可以在這些時間段期間利用更多資源以便產(chǎn)生更高質(zhì)量編碼。除了視覺質(zhì)量改進之外,本發(fā)明可用于最佳地分配CPU能力以便滿足實時要求。例如,當(dāng)對復(fù)雜序列編碼時,處理可能比實時慢。當(dāng)區(qū)域標(biāo)識信號產(chǎn)生器150檢測到視頻編碼系統(tǒng)102的運行比某個實時安全極限慢時,可以產(chǎn)生使得編碼器調(diào)整一個或多個編碼工具75的編碼質(zhì)量參數(shù)的區(qū)域標(biāo)識信號, 以便降低關(guān)注的空間或時間區(qū)域之外的質(zhì)量,從而省出計算資源。將結(jié)合下面結(jié)合圖2-8描述的許多可選功能和特征更詳細地描述區(qū)域標(biāo)識信號產(chǎn)生器150和編碼工具75。圖2給出了根據(jù)本發(fā)明的實施例的區(qū)域標(biāo)識信號產(chǎn)生器150的方框圖表示。特別地,區(qū)域標(biāo)識信號產(chǎn)生器150包括用于檢測至少一個圖像中的檢測區(qū)域322的區(qū)域檢測模塊320,其中所述區(qū)域基于該檢測區(qū)域。在操作中,區(qū)域檢測模塊320可以檢測可能需要更高圖像質(zhì)量的特定圖案或其它關(guān)注區(qū)域的存在。這種圖案的例子是人臉或其它臉,然而,可以同樣地實現(xiàn)其它圖案,包括符號、文本、重要圖像和特定于應(yīng)用的圖案以及其它圖案。區(qū)域標(biāo)識信號產(chǎn)生器150可選擇地包括區(qū)域清理模塊324,該區(qū)域清理模塊3M諸如通過形態(tài)操作,基于檢測區(qū)域322產(chǎn)生干凈區(qū)域326。區(qū)域標(biāo)識信號產(chǎn)生器150還可以包括區(qū)域生長模塊328,該區(qū)域生長模塊3 擴展干凈區(qū)域326以便產(chǎn)生區(qū)域標(biāo)識信號330,該區(qū)域標(biāo)識信號330標(biāo)識該區(qū)域包含關(guān)注圖案。例如,考慮圖像310包括人臉并且區(qū)域標(biāo)識信號產(chǎn)生器150產(chǎn)生對應(yīng)于人臉的區(qū)域的情況,區(qū)域檢測模塊320可以基于對與面部特征相對應(yīng)的像素顏色值——諸如膚色——的檢測而產(chǎn)生檢測區(qū)域322。區(qū)域清理模塊可以產(chǎn)生包含這些面部特征的更連續(xù)區(qū)域,并且區(qū)域生長模塊可以使該區(qū)域生長,以便包括周圍的頭發(fā)和其它圖像部分,以便確保整個臉部被包括在由區(qū)域標(biāo)識信號330標(biāo)識的區(qū)域內(nèi)。編碼部分可以使用區(qū)域標(biāo)識信號 330操作,以便強化面部區(qū)域的質(zhì)量,同時潛在地削弱圖像的其它部分的質(zhì)量。應(yīng)當(dāng)注意,如果臉部有更高的感光度和辨識性,對于觀看者來說整個圖像可能具有更高質(zhì)量。圖3給出了根據(jù)本發(fā)明的另一實施例的區(qū)域檢測模塊320的方框圖表示。在這個實施例中,區(qū)域檢測模塊320通過檢測圖像310中的顏色操作。顏色偏差校正模塊340從圖像310產(chǎn)生顏色偏差校正圖像342。顏色空間變換模塊344從顏色偏差校正圖像342產(chǎn)生顏色變換圖像346。顏色檢測模塊根據(jù)顏色變換圖像346的顏色,產(chǎn)生檢測區(qū)域322。例如,根據(jù)結(jié)合圖4討論的檢測人臉的例子,顏色檢測模塊348可以操作來在變換空間——諸如變換YCb(;空間的Cb(;子空間——中使用橢圓皮膚模型來檢測顏色變換圖像346中對應(yīng)于膚色的顏色。特別地,可以基于高斯膚色分布的假設(shè)來構(gòu)造對應(yīng)于恒定Mahalanobis距離的輪廓的參數(shù)橢圓,以基于Cb(;子空間內(nèi)的二維投影來標(biāo)識檢測區(qū)域 322。作為例子,可以出于這個目的使用與來自Heinrich-Hertz研究所圖像數(shù)據(jù)庫的膚色片對應(yīng)的853,571個像素,然而,在本發(fā)明的更寬范圍內(nèi)可以同樣使用其它例子。在一種簡化的方法中,可以使用基于實際圖像的樣本產(chǎn)生的查找表來近似上面描述的建模方法。以此方式,可以在單個步驟中確定檢測結(jié)果,諸如對檢測區(qū)域322的標(biāo)識。圖4給出了根據(jù)本發(fā)明的另一實施例的區(qū)域檢測模塊320'的方框圖表示。在這個實施例中,諸如圖像310的圖像被變換到另一個域內(nèi)的變換圖像311。由區(qū)域檢測模塊 500在圖像310的原始域內(nèi)執(zhí)行檢測,并且還由區(qū)域檢測模塊504在變換圖像311的變換域內(nèi)執(zhí)行檢測。由比較模塊510比較檢測判定506和508,以便確定檢測區(qū)域322。在本發(fā)明的實施例中,區(qū)域檢測模塊500在YUV域中以與區(qū)域檢測模塊320類似的方式對圖像310進行操作。圖像變換模塊502將圖像310變換到RGB域,并且區(qū)域檢測模塊504在RGB域中操作。如果區(qū)域檢測模塊500或區(qū)域檢測模塊504做出這種檢測,則比較模塊510可以用信號表示區(qū)域包含關(guān)注圖案。以這種方式,可以通過替換域,諸如RGB 域,內(nèi)的平行檢測來補償YUV建模中可能的性能損失。圖5給出了根據(jù)本發(fā)明的實施例的視頻編碼系統(tǒng)102的方框圖表示。特別地,視頻編碼系統(tǒng)102根據(jù)H. 264標(biāo)準、MPEG-4標(biāo)準、VC-I (SMPTE標(biāo)準421M)或其它標(biāo)準的許多功能和特征操作,以便對通過信號接口 198接收的視頻輸入信號110進行編碼、速率變換和轉(zhuǎn)碼。
視頻編碼系統(tǒng)102包括具有信號接口 198的編碼器部分103、處理模塊230、運動補償模塊對0、存儲器模塊232和編碼模塊236??梢允褂脝蝹€處理設(shè)備或多個處理設(shè)備實現(xiàn)處理模塊230。這種處理設(shè)備可以是微處理器、協(xié)處理器、微控制器、數(shù)字信號處理器、微型計算機、中央處理單元、現(xiàn)場可編程門陣列、可編程邏輯器件、狀態(tài)機、邏輯電路、模擬電路、數(shù)字電路和/或基于存儲在存儲器(諸如存儲器模塊20 內(nèi)的操作指令處理信號(模擬的和/或數(shù)字的)的任意設(shè)備。存儲器模塊232可以是單個存儲器設(shè)備或多個存儲器設(shè)備。這種存儲器設(shè)備可以包括硬盤驅(qū)動器或其它盤驅(qū)動器、只讀存儲器、隨機存取存儲器、 易失性存儲器、非易失性存儲器、靜態(tài)存儲器、動態(tài)存儲器、閃存、高速緩存存儲器和/或存儲數(shù)字信息的任意設(shè)備。注意,當(dāng)處理模塊通過狀態(tài)機、模擬電路、數(shù)字電路和/或邏輯電路實現(xiàn)其一個或多個功能時,存儲對應(yīng)操作指令的存儲器可以嵌入在包含該狀態(tài)機、模擬電路、數(shù)字電路和/或邏輯電路的電路內(nèi)或在其之外。處理模塊230和存儲器模塊232可以通過總線250耦接到信號接口 198和多個其它模塊,諸如區(qū)域標(biāo)識信號產(chǎn)生器150、運動補償模塊240和編碼模塊236。根據(jù)處理模塊 230的特定實現(xiàn),視頻編碼器102的模塊可以以軟件、固件或硬件實現(xiàn)。還應(yīng)當(dāng)注意,本發(fā)明的軟件實現(xiàn)可被存儲在有形存儲介質(zhì)上,所述介質(zhì)諸如磁盤或光盤、只讀存儲器或隨機存取存儲器,并且還可被生產(chǎn)為一件制品。雖然示出了特定的總線體系結(jié)構(gòu),但是根據(jù)本發(fā)明同樣可以實現(xiàn)使用一個或多個模塊之間的直接連接和/或附加總線的可替換體系結(jié)構(gòu)。運動補償模塊240在視頻流的每個幀或場的多個宏塊內(nèi)操作,以產(chǎn)生與每個宏塊的最終運動矢量對應(yīng)的殘余亮度和/或色度像素值。編碼模塊236通過將殘余像素值變換編碼并且量化為量化變換系數(shù)而產(chǎn)生經(jīng)處理的視頻信號112,該量化變換系數(shù)可以諸如通過熵編碼中的熵編碼而被進一步編碼,由去塊化過濾器過濾,并且作為經(jīng)處理的視頻信號 112而被傳輸和/或存儲。在由編碼器102接收數(shù)字視頻流的轉(zhuǎn)碼應(yīng)用中,在進一步編碼、 變換速率或轉(zhuǎn)碼之前,可以可選擇地全部或部分地解碼進入的視頻信號。在操作中,運動補償模塊240和編碼模塊236包括多個編碼工具7 和75b,這些編碼工具操作以從一個或多個視頻信號Iio產(chǎn)生壓縮視頻流。編碼工具7 可以包括運動補償模塊240的基于編碼質(zhì)量參數(shù)操作的部分,所述參數(shù)諸如運動搜索范圍、宏塊模式、子像素精度和/或其它運動搜索參數(shù)、運動細化參數(shù)、模式判定參數(shù)或影響運動補償處理的質(zhì)量和計算復(fù)雜度的其它運動補償參數(shù)。編碼工具7 可以進一步包括編碼模塊236的基于編碼質(zhì)量參數(shù)操作以產(chǎn)生經(jīng)處理的視頻信號112的部分,所述參數(shù)諸如量化參數(shù)(QP)、 量化矩陣和/或參考圖像頻率或編碼模塊236使用的其它編碼參數(shù)。如前所述,當(dāng)區(qū)域標(biāo)識信號產(chǎn)生器150產(chǎn)生指示檢測到關(guān)注的空間或時間區(qū)域的區(qū)域標(biāo)識信號,諸如區(qū)域標(biāo)識信號330時,編碼器部分103調(diào)整編碼工具7 和75b的一個或多個編碼質(zhì)量參數(shù),以與關(guān)注區(qū)域之外的部分相比,在關(guān)注區(qū)域內(nèi)產(chǎn)生更高質(zhì)量的編碼。圖6給出了根據(jù)本發(fā)明的實施例的視頻分發(fā)系統(tǒng)175的方框圖表示。特別地,經(jīng)處理的視頻信號112通過傳輸路徑122被傳輸?shù)揭曨l解碼器104。視頻解碼器104又可以操作以便對經(jīng)處理的視頻信號解碼,以便在諸如電視機10、計算機20或其它顯示設(shè)備的顯不設(shè)備上顯不。傳輸路徑122可以包括根據(jù)無線局域網(wǎng)協(xié)議——諸如802. 11協(xié)議、WIMAX協(xié)議、 藍牙協(xié)議等——操作的無線路徑。另外,傳輸路徑可以包括根據(jù)有線協(xié)議——諸如通用串
7行總線協(xié)議、以太網(wǎng)協(xié)議或其它高速協(xié)議——操作的有線路徑。圖7給出了根據(jù)本發(fā)明的實施例的視頻存儲系統(tǒng)179的方框圖表示。特別地,設(shè)備11是具有內(nèi)置數(shù)字視頻記錄器功能的機頂盒、獨立的數(shù)字視頻記錄器、DVD記錄器/播放器或存儲經(jīng)處理的視頻信號112以便在諸如電視機12的視頻顯示設(shè)備上顯示的其它設(shè)備。雖然視頻編碼器102被示出為單獨設(shè)備,但是其還可被結(jié)合在設(shè)備11內(nèi)。雖然示出了這些特定設(shè)備,但是視頻存儲系統(tǒng)179可以包括硬盤驅(qū)動器、閃存設(shè)備、計算機、DVD刻錄機或能夠根據(jù)結(jié)合此處描述的本發(fā)明的特征和功能描述的方法和系統(tǒng)產(chǎn)生、存儲、解碼和/ 或顯示組合視頻流220的任意其它設(shè)備。圖8給出了根據(jù)本發(fā)明的實施例的方法的流程圖表示。特別地,給出了一種結(jié)合根據(jù)圖1-8所描述的一個或多個功能和特征使用的方法。在步驟400,基于多個編碼工具的操作產(chǎn)生經(jīng)處理的視頻信號,每個編碼工具具有至少一個編碼器質(zhì)量參數(shù)。在步驟402,該方法確定在至少一個圖像中是否檢測到關(guān)注區(qū)域。在步驟404,當(dāng)檢測到關(guān)注圖案時產(chǎn)生區(qū)域標(biāo)識信號。在步驟406,響應(yīng)于區(qū)域標(biāo)識信號調(diào)整多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)。在本發(fā)明的實施例中,步驟406包括調(diào)整多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù),以便與至少一個圖像的在關(guān)注區(qū)域之外的部分相比,在關(guān)注區(qū)域內(nèi)產(chǎn)生更高質(zhì)量的編碼。步驟406還可以包括響應(yīng)于區(qū)域標(biāo)識信號調(diào)整多個編碼工具中每一個的至少一個編碼質(zhì)量參數(shù)。在一種操作模式中,所述至少一個圖像包括圖像序列,并且關(guān)注區(qū)域包括跨所述圖像序列內(nèi)的多個圖像的時間段。所述多個編碼質(zhì)量參數(shù)可以包括量化參數(shù)、量化矩陣、運動搜索范圍、宏塊模式、子像素精度和/或參考圖片頻率。如前所述,視頻編碼系統(tǒng)的編碼器部分,諸如編碼器系統(tǒng)102,通過量化和數(shù)字化產(chǎn)生具有特定圖像質(zhì)量的經(jīng)處理的視頻信號。當(dāng)檢測到關(guān)注區(qū)域時,與所述一個或多個圖像在該區(qū)域之外的部分相比,給關(guān)注區(qū)域分配更小量化、更高分辨率或其它更高的質(zhì)量。與所述圖像的在該區(qū)域之外的部分相對比,在對該區(qū)域編碼時,這提供了更高質(zhì)量的圖像。例如,當(dāng)對所述區(qū)域內(nèi)的宏塊編碼時,編碼器部分使用比在沒有檢測到所述圖案并且沒有標(biāo)識所述區(qū)域時通常使用的更高的分辨率、量化等??梢酝ㄟ^不同方式實現(xiàn)這種質(zhì)量變化。例如,在比特分配方法中,可以基于圖像的一部分在關(guān)注區(qū)域之內(nèi)還是在關(guān)注區(qū)域之外,調(diào)整量化參數(shù)和速率。還可以使用其它方法。例如,可以分配計算能力,以便與所述區(qū)域之外的編碼相比偏重所述區(qū)域內(nèi)的編碼。在這種方法中,可以調(diào)整編碼參數(shù),諸如預(yù)先定義的運動估計搜索范圍、子像素運動估計精度、參考幀數(shù)目和宏塊模式候選數(shù)目,以便增加在關(guān)注區(qū)域內(nèi)使用的計算量,和/或減少在關(guān)注區(qū)域之外使用的計算量??梢詫嵤┍景l(fā)明,例如,以便使用更少比特實現(xiàn)類似的視覺質(zhì)量,或使用相同數(shù)目的比特以便實現(xiàn)更高的視覺質(zhì)量。另外,可以更快地執(zhí)行編碼處理以便實現(xiàn)類似的視覺質(zhì)量,或可以采用類似的處理時間以便實現(xiàn)更高的視覺質(zhì)量。以此方式,編碼處理可以著重于用戶關(guān)心的圖像區(qū)域。在優(yōu)選實施例中,使用0. 35微米或更小的CMOS技術(shù)實現(xiàn)各種電路組件。然而在本發(fā)明的寬泛范圍內(nèi),可以使用集成或非集成的其它電路技術(shù)。
雖然此處已經(jīng)明確描述了本發(fā)明的各種功能和特征的特定組合,但是可以有這些特征和功能的其它組合,其不受此處公開的特定示例的限制,并且被明確地包括在本發(fā)明的范圍內(nèi)。本領(lǐng)域的技術(shù)人員將明了,此處可能使用的術(shù)語“大體”或“近似地”給其對應(yīng)項和/或項之間的相對性提供工業(yè)可接受容限。這種工業(yè)可接受容限的范圍從小于百分之一到百分之二十,并且相應(yīng)于但不限于組件值、集成電路處理變化、溫度變化、上升和下降時間和/或熱噪聲。這種項之間的相對性的范圍從百分之幾的不同到量級的不同。本領(lǐng)域的普通技術(shù)人員還將明了,此處可能使用的術(shù)語“耦接”包括直接耦接和通過另一個組件、元件、電路或模塊的間接耦接,其中對于間接耦接,中間組件、元件、電路或模塊不改變信號的信息,而是可以調(diào)整其電流電平、電壓電平和/或功率電平。本領(lǐng)域的普通技術(shù)人員還將明了,推導(dǎo)耦接(即,根據(jù)推導(dǎo)一個元件耦接到另一個元件)包括兩個元件之間以與“耦接”相同的方式的直接和間接耦接。本領(lǐng)域的普通技術(shù)人員還將明了,此處可能使用的術(shù)語“滿意地比較”指兩個或多個元件、項、信號等之間的比較提供所希望的關(guān)系。例如,當(dāng)所希望的關(guān)系是信號1的幅度大于信號2的幅度時,那么當(dāng)信號1的幅度大于信號2的幅度時或當(dāng)信號2的幅度小于信號1的幅度時,實現(xiàn)滿意的比較。由于在本發(fā)明的各個實施例的描述中使用了術(shù)語模塊,模塊包括執(zhí)行一個或多個功能(諸如處理輸入信號以便產(chǎn)生輸出信號)的以硬件、軟件和/或固件實現(xiàn)的功能塊。如此處使用的,模塊可以包括自身是模塊的子模塊。因此,此處已經(jīng)描述了一種用于實現(xiàn)視頻編碼系統(tǒng)的裝置和方法,以及包括優(yōu)選實施例的若干實施例。此處描述的本發(fā)明的各個實施例具有使得本發(fā)明區(qū)別于現(xiàn)有技術(shù)的特征。本領(lǐng)域的技術(shù)人員將明了,可以按照多種方法修改公開的發(fā)明,并且可以采取上面特別提出和描述的優(yōu)選形式之外的許多實施例。因此,旨在以所附權(quán)利要求覆蓋本發(fā)明的落在本發(fā)明的真實精神和范圍內(nèi)的所有修改。
9
權(quán)利要求
1.一種用于將視頻流編碼為經(jīng)處理的視頻信號的系統(tǒng),所述視頻流包括至少一個圖像,所述系統(tǒng)包括區(qū)域標(biāo)識信號產(chǎn)生器,用于檢測至少一個圖像中的關(guān)注區(qū)域,并且當(dāng)檢測到所述關(guān)注區(qū)域時產(chǎn)生區(qū)域標(biāo)識信號;和耦接到所述區(qū)域標(biāo)識信號產(chǎn)生器的編碼器部分,所述編碼器部分基于多個編碼工具的操作產(chǎn)生所述經(jīng)處理的視頻信號,每個編碼工具具有至少一個編碼質(zhì)量參數(shù),其中所述編碼器部分響應(yīng)于所述區(qū)域標(biāo)識信號調(diào)整所述多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)。
2.如權(quán)利要求1所述的系統(tǒng),其中當(dāng)所述區(qū)域標(biāo)識信號指示檢測到所述關(guān)注區(qū)域時, 所述編碼器部分調(diào)整所述多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)以與所述至少一個圖像在所述關(guān)注區(qū)域之外的部分相比,在所述關(guān)注區(qū)域內(nèi)產(chǎn)生更高質(zhì)量的編碼。
3.如權(quán)利要求1所述的系統(tǒng),其中所述編碼器部分響應(yīng)于所述區(qū)域標(biāo)識信號調(diào)整所述多個編碼工具的至少一個編碼質(zhì)量參數(shù)。
4.如權(quán)利要求1所述的系統(tǒng),其中所述至少一個圖像包括圖像序列,并且所述關(guān)注區(qū)域包括跨所述圖像序列內(nèi)的多個圖像的時間段。
5.如權(quán)利要求4所述的系統(tǒng),其中所述區(qū)域標(biāo)識信號產(chǎn)生器包括 用于檢測所述圖像序列內(nèi)的運動量的運動檢測模塊。
6.如權(quán)利要求1所述的系統(tǒng),其中所述區(qū)域標(biāo)識信號產(chǎn)生器包括 用于檢測所述至少一個圖像中的臉部的區(qū)域檢測模塊。
7.如權(quán)利要求1所述的系統(tǒng),其中所述多個編碼質(zhì)量參數(shù)包括下列中的至少一個量化參數(shù)和量化矩陣。
8.如權(quán)利要求1所述的系統(tǒng),其中所述多個編碼質(zhì)量參數(shù)包括下列中的至少一個 運動搜索范圍、宏塊模式和子像素精度。
9.如權(quán)利要求1所述的系統(tǒng),其中所述多個編碼質(zhì)量參數(shù)包括參考圖片頻率。
10.一種用于將視頻流編碼為經(jīng)處理的視頻信號的方法,所述視頻流包括至少一個圖像,所述方法包括基于多個編碼工具的操作而產(chǎn)生所述經(jīng)處理的視頻信號,其中每個編碼工具具有至少一個編碼質(zhì)量參數(shù);檢測所述至少一個圖像內(nèi)的關(guān)注區(qū)域; 當(dāng)檢測到所述關(guān)注區(qū)域時,產(chǎn)生區(qū)域標(biāo)識信號;和響應(yīng)于所述區(qū)域標(biāo)識信號,調(diào)整所述多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)。
11.如權(quán)利要求10所述的方法,其中調(diào)整至少一個編碼質(zhì)量參數(shù)包括調(diào)整所述多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)以與所述至少一個圖像在所述關(guān)注區(qū)域之外的部分相比,在所述關(guān)注區(qū)域內(nèi)產(chǎn)生更高質(zhì)量的編碼。
12.如權(quán)利要求10所述的方法,其中調(diào)整至少一個編碼質(zhì)量參數(shù)包括 響應(yīng)于所述區(qū)域標(biāo)識信號調(diào)整所述多個編碼工具的至少一個編碼質(zhì)量參數(shù)。
13.如權(quán)利要求10所述的方法,其中所述至少一個圖像包括圖像序列,并且所述關(guān)注區(qū)域包括跨所述圖像序列內(nèi)的多個圖像的時間段。
14.如權(quán)利要求10所述的方法,其中所述多個編碼質(zhì)量參數(shù)包括下列中的至少一個量化參數(shù)和量化矩陣。
15.如權(quán)利要求10所述的方法,其中所述多個編碼質(zhì)量參數(shù)包括下列中的至少一個 運動搜索范圍、宏塊模式和子像素精度。
16.如權(quán)利要求10所述的方法,其中所述多個編碼質(zhì)量參數(shù)包括參考圖片頻率。
全文摘要
本公開利用區(qū)域檢測的資源自適應(yīng)視頻編碼系統(tǒng)及其使用的方法。用于將包括至少一個圖像的視頻流編碼為壓縮視頻信號的系統(tǒng)包括區(qū)域標(biāo)識信號產(chǎn)生器,用于檢測至少一個圖像中的關(guān)注區(qū)域,并且當(dāng)檢測到所述關(guān)注區(qū)域時產(chǎn)生區(qū)域標(biāo)識信號。編碼器部分基于多個編碼工具的操作產(chǎn)生所述經(jīng)處理的視頻信號,每個編碼工具具有至少一個編碼質(zhì)量參數(shù)。所述編碼器部分響應(yīng)于所述區(qū)域標(biāo)識信號調(diào)整所述多個編碼工具中的至少一個編碼工具的至少一個編碼質(zhì)量參數(shù)。
文檔編號H04N7/26GK102340665SQ20111016805
公開日2012年2月1日 申請日期2011年6月22日 優(yōu)先權(quán)日2010年7月20日
發(fā)明者劉洋, 潘峰 申請人:Vixs系統(tǒng)公司