專利名稱:圖像處理設(shè)備、圖像處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像處理設(shè)備、圖像處理方法和程序。更具體地,本發(fā)明涉及一種
用于處理圖像的圖像處理設(shè)備和圖像處理方法,以及一種在所述圖像處理設(shè)備中使用的程
序。本專利申請在此以引用方式并入以下日本專利申請的內(nèi)容(如果適用)2008年3月25 日提交的No. 2008-078636、2008年3月25日提交的No. 2008_078641、2008年3月31提交的 No. 2008-091562和2008年4月4日提交的No. 2008-098600。本專利申請要求以下日本專利 申請的優(yōu)先權(quán)并將其內(nèi)容以引用方式并入此處2007年7月20日提交的No. 2007-190149、 2007年9月10日提交的No. 2007-234756、2008年6月5日提交的No. 2008-148576和2008 年6月5日提交的No. 2008-148584。
背景技術(shù):
例如,日本專利No. 2828977中公開的一種已知的運動圖像編碼設(shè)備將已編碼的 屏幕圖像與要編碼的屏幕圖像進行比較,以標識屏幕內(nèi)的改變區(qū)域;將要編碼的屏幕圖像 分為多個圖像塊;并且對包括改變區(qū)域在內(nèi)的圖像塊進行編碼。在對包括改變區(qū)域在內(nèi) 的圖像塊進行編碼時,同分配給包含改變區(qū)域中其余區(qū)域在內(nèi)的圖像塊的信息比特數(shù)目 相比,該運動圖像編碼設(shè)備將較大數(shù)目的信息比特分配給包含改變區(qū)域中另一限制區(qū)域 在內(nèi)的圖像塊。此外,例如在日本專利申請公開No. 2003-250132中公開了 一種已知的數(shù) 字圖像產(chǎn)生方法,產(chǎn)生與數(shù)字圖像的主體的重要性相關(guān)的附加信息和與主體相對應的背 景區(qū)域,并且以與該附加信息相關(guān)聯(lián)的方式來保存通過對數(shù)字圖像進行壓縮而得到的壓 縮數(shù)字圖像。有一種已知的視頻記錄器/播放器,根據(jù)數(shù)據(jù)的重要性來動態(tài)改變對輸入 數(shù)據(jù)進行壓縮的水平,并以較低的壓縮水平來存儲重要數(shù)據(jù)(參見例如日本專利申請公 開No. 2003-189242)。此外,還有一種已知的運動圖像壓縮器,即使在從監(jiān)視攝像機提供 的圖像數(shù)據(jù)包含較大運動的情況下,也能使監(jiān)視器的屏幕上顯示的被監(jiān)視對象的圖像保 持清晰,以允許觀看者對所監(jiān)視區(qū)域的情形進行充分觀察(參見例如日本專利申請公開 No.10-70716)。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題 然而,上述專利文獻中公開的技術(shù)不能根據(jù)區(qū)域的特征來對多個區(qū)域中的每一個
進行壓縮。日本專利申請公開No. 2003-189242的發(fā)明基于運動區(qū)域的位移矢量來確定運
動矢量。日本專利申請公開No. 10-70716的發(fā)明可以增大運動區(qū)域的量化粗糙度。然而,
日本專利申請公開No. 2003-189242和日本專利申請公開No. 10-70716的技術(shù)不能以合適
的壓縮率來壓縮圖像,這是由于這些技術(shù)不能以適配于對象的方式對運動區(qū)域中的任何對
象進行壓縮和編碼。 解決問題的技術(shù)方案 為了解決上述問題,本發(fā)明的第一實施例提供了一種圖像處理設(shè)備,包括特征區(qū)
7域檢測部分,檢測圖像中的多個特征區(qū)域;條件存儲部分,在其上存儲根據(jù)特征區(qū)域的特征 而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的壓縮強度;壓縮部分,分別對多 幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特征區(qū)域的圖像;以及壓縮 控制部分,參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的特征,對壓縮部分分 別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。 特征區(qū)域檢測部分可以檢測運動圖像中包括的多幅運動圖像分量圖像中的多個
特征區(qū)域。壓縮控制部分可以參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的
特征,來對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。 條件存儲部分可以在其上存儲根據(jù)特征區(qū)域的類型而不同的條件。壓縮控制部分
可以參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的類型,來對壓縮部分分別
對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。 特征區(qū)域檢測部分可以檢測多幅運動圖像分量圖像中具有不同類型特征的多個 特征區(qū)域,壓縮部分可以分別對多幅特征區(qū)域運動圖像進行壓縮,其中每一幅特征區(qū)域運 動圖像包括所述多幅運動圖像分量圖像中具有相同類型特征的多幅特征區(qū)域圖像。壓縮控 制部分可以參照條件存儲部分上存儲的條件,根據(jù)特征區(qū)域運動圖像中包括的多幅特征區(qū) 域圖像的特征類型,對壓縮部分對所述多幅特征區(qū)域運動圖像中每一幅進行壓縮的壓縮強 度進行控制。 條件存儲部分可以在其上存儲根據(jù)特征區(qū)域的類型而不同的圖像質(zhì)量降低量;壓 縮部分可以包括圖像質(zhì)量降低部分,降低多幅特征區(qū)域運動圖像的圖像質(zhì)量,其中每一幅 特征區(qū)域運動圖像包括所述多幅運動圖像分量圖像中具有相同類型特征的多幅特征區(qū)域 圖像;以及壓縮控制部分可以參照條件存儲部分上存儲的圖像質(zhì)量降低量,根據(jù)特征區(qū)域 運動圖像中包括的多幅特征區(qū)域圖像的特征類型,對圖像質(zhì)量降低部分將所述多幅特征區(qū) 域運動圖像中每一幅的圖像質(zhì)量降低的圖像質(zhì)量降低量進行控制。 本發(fā)明的第二實施例提供了一種圖像處理方法,包括檢測圖像中的多個特征區(qū) 域;存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的 壓縮強度;對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特征區(qū)域的 圖像;以及參照存儲步驟中存儲的條件,根據(jù)所述多個特征區(qū)域的特征,對壓縮步驟中分別 對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。 本發(fā)明的第三實施例提供了一種與圖像處理設(shè)備一起使用的程序。所述程序使圖 像處理設(shè)備用作特征區(qū)域檢測部分,檢測圖像中的多個特征區(qū)域;條件存儲部分,在其上 存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的壓縮 強度;壓縮部分,分別對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特 征區(qū)域的圖像;以及壓縮控制部分,參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū) 域的特征,對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
根據(jù)本發(fā)明的第四方面,提供了一種圖像處理設(shè)備,包括特征區(qū)域檢測部分,從 圖像中檢測多個特征區(qū)域;以及壓縮部分,根據(jù)所述多個特征區(qū)域中包括的對象的特征的 量,以不同的編碼方式分別對所述多個特征區(qū)域的圖像進行壓縮。所述圖像處理設(shè)備還可 以包括編碼方式存儲部分,以與對象的特征的量相關(guān)聯(lián)的方式來存儲編碼方式,并且所述 壓縮部分可以以編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的特征的量相
8關(guān)聯(lián)的方式而存儲的編碼方式,分別對所述多個特征區(qū)域的圖像進行壓縮。 編碼方式存儲部分可以以與對象的類型相關(guān)聯(lián)的方式來存儲編碼方式,并且壓縮
部分可以以編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方
式而存儲的編碼方式,分別對所述多個特征區(qū)域的圖像進行壓縮。特征區(qū)域檢測部分可以
從運動圖像(即前述圖像)中包括的多幅運動圖像組成圖像中的每一幅中檢測多個特征區(qū)
域,并且壓縮部分可以以編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型
相關(guān)聯(lián)的方式而存儲的編碼方式,分別對所述多幅運動圖像組成圖像中每一幅中的多個特
征區(qū)域的圖像進行壓縮。 根據(jù)本發(fā)明的第五方面,提供了一種圖像處理方法,包括從圖像中檢測多個特征區(qū)域;以及根據(jù)所述多個特征區(qū)域中包括的對象的特征的量,以不同的編碼方式分別對所述多個特征區(qū)域的圖像進行壓縮。根據(jù)本發(fā)明的第六方面,提供了一種用于圖像處理設(shè)備的程序,所述程序控制圖像處理設(shè)備用作特征區(qū)域檢測部分,從圖像中檢測多個特征區(qū)域;以及壓縮部分,根據(jù)所述多個特征區(qū)域中包括的對象的特征的量,以不同的編碼方式分別對所述多個特征區(qū)域的圖像進行壓縮。 這里,在發(fā)明內(nèi)容中未列出本發(fā)明的所有必要特征。這些特征的子組合可以形成本發(fā)明。
圖1示意了與本發(fā)明的實施例相關(guān)的圖像處理系統(tǒng)2010的示例。 圖2示意了圖像處理設(shè)備2120的示例模塊配置。 圖3示意了圖像處理設(shè)備2170的示例模塊配置。 圖4示意了圖像處理設(shè)備2120執(zhí)行的操作的示例流程。 圖5示出了作為示例的特征區(qū)域運動圖像的圖像質(zhì)量和背景區(qū)域運動圖像的圖像質(zhì)量。 圖6示意了圖像處理設(shè)備2170執(zhí)行的操作的示例流程。 圖7示意了圖像處理設(shè)備2120中包括的壓縮控制單元2700的示例配置。 圖8示意了條件存儲部分2750上存儲的數(shù)據(jù)的示例。 圖9示意了條件存儲部分2750上存儲的數(shù)據(jù)的不同示例。 圖10示意了信息量計算部分2720上存儲的數(shù)據(jù)的示例。 圖11示意了壓縮強度確定部分2740執(zhí)行的確定壓縮強度的示例操作。 圖12示意了作為示例的信息量計算部分2720所計算的信息量隨時間的變化。 圖13示意了作為示例的ROI的邊界區(qū)域。 圖14示意了圖像處理設(shè)備2120的另一示例模塊配置。 圖15A示意了級間差異壓縮部分2282a和2282b的示例模塊配置。 圖15B示意了運動分析部分2285a和差異處理部分2287a的示例模塊配置。 圖15C示意了運動分析部分2285b和差異處理部分2287b的示例模塊配置。 圖16示意了與不同實施例相關(guān)的圖像處理系統(tǒng)2020的示例配置。 圖17示意了圖像處理設(shè)備2120和2170的示例硬件配置。 圖18示出了根據(jù)實施例的圖像處理系統(tǒng)3010的一個示例。
圖19示出了圖像處理設(shè)備3120的一示例模塊配置。 圖20A示出了級間差異壓縮部分3282a和3282b的一示例模塊配置。 圖20B示出了級間差異壓縮部分3282a中包括的運動分析部分3285a和差異處理
部分3287a的一示例模塊配置。 圖20C示出了級間差異壓縮部分3282b中包括的運動分析部分3285b和差異處理部分3287b的一示例模塊配置。 圖21示出了壓縮控制部分3250的一示例模塊配置。 圖22示出了根據(jù)另一實施例的圖像處理設(shè)備3120的一示例模塊配置。 圖23示出了編碼部分3231的一示例模塊配置。 圖24示出了圖像處理設(shè)備3170的一示例模塊配置。 圖25是示出了編碼方式存儲部分3410中存儲的示例數(shù)據(jù)的表。 圖26示出了編碼方式存儲部分3410中存儲的示例量化步長校正值。 圖27示出了校正前的碼量的比值與量化校正量Q之間的關(guān)系。 圖28是示出了編碼方式存儲部分3410中存儲的另一示例數(shù)據(jù)的表。 圖29示出了用于確定差異獲得目標區(qū)域的差異獲得目標區(qū)域確定部分3294的示
例確定方法。 圖30示出了圖像處理系統(tǒng)3020的示例。 圖31示出了圖像處理設(shè)備3120和圖像處理設(shè)備3170的一示例硬件配置。
具體實施例方式
以下將描述本發(fā)明的一些實施例。這些實施例不限制根據(jù)權(quán)利要求的本發(fā)明,并且對本發(fā)明的各方面所提供的手段而言,實施例中描述的特征的全部組合不一定是必不可少的。 圖1示意了與本發(fā)明的實施例相關(guān)的圖像處理系統(tǒng)2010的示例。圖像處理系統(tǒng)
2010被設(shè)計為維持特征主體的圖像的高質(zhì)量,并且可以降低整幅圖像的數(shù)據(jù)量。 圖像處理系統(tǒng)2010包括多個圖像捕捉設(shè)備2100a至2100c (以下統(tǒng)稱為圖像捕
捉設(shè)備2100),用于捕捉被監(jiān)視空間2150的圖像;多個圖像處理設(shè)備2120a至2120c (以下
統(tǒng)稱為圖像處理設(shè)備2120),用于處理圖像;圖像處理設(shè)備2170 ;通信網(wǎng)絡(luò)2110 ;圖像數(shù)據(jù)
庫2175和多個顯示設(shè)備2180a至2180c (以下統(tǒng)稱為顯示設(shè)備2180)。 圖像處理設(shè)備2120a連接至圖像捕捉設(shè)備2100a。圖像處理設(shè)備2120b連接至圖
像捕捉設(shè)備2100b。圖像處理設(shè)備2120c連接至圖像捕捉設(shè)備2100c。圖像處理設(shè)備2170
和顯示設(shè)備2180在與被監(jiān)視空間2150不同的空間2160內(nèi)提供。 以下描述圖像捕捉設(shè)備2100a、圖像處理設(shè)備2120a、圖像處理設(shè)備2170和顯示設(shè)備2180a的操作。圖像捕捉設(shè)備2100a捕捉被監(jiān)視空間2150的圖像,對捕捉運動圖像進行MPEG編碼以產(chǎn)生捕捉運動圖像數(shù)據(jù),并將產(chǎn)生的捕捉運動圖像數(shù)據(jù)輸出至圖像捕捉設(shè)備2100a所連接的圖像處理設(shè)備2120a。 這里,圖像捕捉設(shè)備2100a包括圖像捕捉部分2102a和捕捉運動圖像壓縮部分2104a。圖像捕捉部分2102a對被監(jiān)視空間2150進行圖像捕捉,以產(chǎn)生捕捉運動圖像中包括的多幅運動圖像分量圖像。圖像捕捉部分2102a可以以RAW格式來產(chǎn)生運動圖像分量圖像。捕捉運動圖像壓縮部分2104a對圖像捕捉部分2102a產(chǎn)生的具有RAW格式的運動圖像分量圖像執(zhí)行顏色估計(重合)處理以獲得包括多幅運動圖像分量圖像在內(nèi)的捕捉運動圖像,并且使用如MPEG編碼之類的技術(shù)對捕捉運動圖像進行壓縮。按照這種方式,捕捉運動圖像壓縮部分2104a產(chǎn)生捕捉運動圖像數(shù)據(jù)。 圖像處理設(shè)備2120a獲得圖像捕捉設(shè)備2100a產(chǎn)生的捕捉運動圖像數(shù)據(jù)。圖像處理設(shè)備2120a對從圖像捕捉設(shè)備2100a獲得的捕捉運動圖像數(shù)據(jù)進行解碼以所產(chǎn)生的捕捉
運動圖像,并且檢測捕捉運動圖像中的多個特征區(qū)域。這里,特征區(qū)域包含不同類型的特征,包括人2130和運動物體2140 (如車輛)?;诓蹲竭\動圖像,圖像處理設(shè)備2120a產(chǎn)生與不同類型的特征一一對應的多幅特征區(qū)域運動圖像。在每幅特征區(qū)域運動圖像中,特征區(qū)域中相應的一個具有比其余區(qū)域更高的圖像質(zhì)量。圖像處理設(shè)備2120a還產(chǎn)生背景區(qū)域運動圖像,該背景區(qū)域運動圖像是捕捉運動圖像中除特征區(qū)域之外的背景區(qū)域的運動圖像。背景區(qū)域運動圖像具有比特征區(qū)域運動圖像更低的圖像質(zhì)量。 圖像處理設(shè)備2120a對特征區(qū)域運動圖像和背景區(qū)域運動圖像分別進行編碼,以產(chǎn)生多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)。同時,圖像處理設(shè)備2120a將多份特征區(qū)域運動圖像數(shù)據(jù)與一份背景區(qū)域運動圖像數(shù)據(jù)互相關(guān)聯(lián),并將互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)經(jīng)由通信網(wǎng)絡(luò)2110發(fā)送至圖像處理設(shè)備2170。 圖像處理設(shè)備2170對從圖像處理設(shè)備2120a接收到的、互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)分別進行解碼,以獲得多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像。圖像處理設(shè)備2170將特征區(qū)域運動圖像與背景區(qū)域運動圖像進行組合,以產(chǎn)生單幅組合運動圖像,并將該組合運動圖像提供給顯示設(shè)備2180a。顯示設(shè)備2180a顯示從圖像處理設(shè)備2170提供的運動圖像。 圖像處理設(shè)備2170可以將組合運動圖像或從圖像處理設(shè)備2120a獲得的捕捉運動圖像數(shù)據(jù)記錄在圖像數(shù)據(jù)庫2175上。圖像處理設(shè)備2170可以響應于顯示設(shè)備2180a發(fā)出的請求,將圖像數(shù)據(jù)庫2175上記錄的組合運動圖像提供給顯示設(shè)備2180a。如上所述,圖像處理設(shè)備2170可以對圖像數(shù)據(jù)庫2175上記錄的捕捉運動圖像數(shù)據(jù)進行解碼,并響應于顯示設(shè)備2180a發(fā)出的請求,將得到的運動圖像提供給顯示設(shè)備2180a。圖像數(shù)據(jù)庫2175可以具有非易失性記錄介質(zhì)(如硬盤),并在記錄介質(zhì)上記錄從圖像處理設(shè)備2170提供的組合運動圖像。 圖像捕捉設(shè)備2100b和2100c分別包括具有與圖像捕捉設(shè)備2100a的組件相同功能的組件。圖像捕捉設(shè)備2100c和2100b具有與圖像捕捉設(shè)備2100a相同的功能和操作,但是圖像捕捉設(shè)備2100b和2100c分別將捕捉運動圖像數(shù)據(jù)提供給圖像處理設(shè)備2120b和2120c。因此,這里不對圖像捕捉設(shè)備2100b和2100c進行解釋。注意,以下描述可能將圖像捕捉部分2102a至2102c稱為圖像捕捉部分2102,并且可能將捕捉運動圖像壓縮部分2104a至2104c稱為捕捉運動圖像壓縮部分2104。 圖像處理設(shè)備2120b和2120c可以具有與圖像處理設(shè)備2120a相同的功能和操作,但是圖像處理設(shè)備2120b和2120c分別從圖像捕捉設(shè)備2100b和2100c獲得捕捉運動圖像數(shù)據(jù)。因此,這里不對圖像處理設(shè)備2120b和2120c進行解釋。圖像處理設(shè)備2170基于從圖像處理設(shè)備2120b和2120c中的每一個接收到的、互相關(guān)聯(lián)的多個特征區(qū)域運動圖
11像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)來產(chǎn)生單幅運動圖像,并將該單幅運動圖像提供給顯示設(shè)備2180b和2180c中相應的一個。顯示設(shè)備2180b和2180c分別顯示從圖像處理設(shè)備2170提供的運動圖像。 當例如用作監(jiān)視系統(tǒng)時,與本實施例相關(guān)的圖像處理系統(tǒng)2010能夠保持人、運動物體和要監(jiān)視的其他特征主體的高質(zhì)量圖像。此外,與本實施例相關(guān)的圖像處理系統(tǒng)2010能夠減少運動圖像的數(shù)據(jù)量。 圖2示意了圖像處理設(shè)備2120的示例模塊配置。圖像處理設(shè)備2120包括壓縮運動圖像獲得部分2201、壓縮運動圖像擴展部分2202、特征區(qū)域檢測部分2203、圖像劃分部分2204、圖像產(chǎn)生部分2205、值固定單元2210、降低單元2220、編碼單元2230、關(guān)聯(lián)部分2206和輸出部分2207。 值固定單元2210包括多個值固定部分2211a至2211c(以下統(tǒng)稱為值固定部分2211)。降低單元2220包括多個圖像質(zhì)量降低部分2221a至2221d(以下統(tǒng)稱為圖像質(zhì)量降低部分2221)。 編碼單元2230包括背景區(qū)域運動圖像編碼部分2231a和多個特征區(qū)域運動圖像編碼部分2231b至2231d(以下統(tǒng)稱為特征區(qū)域運動圖像編碼部分2231)。這里,背景區(qū)域運動圖像編碼部分2231a和特征區(qū)域運動圖像編碼部分2231b至2231d可以統(tǒng)稱為編碼部分2231。 圖像質(zhì)量降低部分2221a和背景區(qū)域運動圖像編碼部分2231a—起用作壓縮部分2240a。圖像質(zhì)量降低部分2221b和特征區(qū)域運動圖像編碼部分2231b —起用作壓縮部分2240b。圖像質(zhì)量降低部分2221c和特征區(qū)域運動圖像編碼部分2231c —起用作壓縮部分2240c。圖像質(zhì)量降低部分2221d和特征區(qū)域運動圖像編碼部分2231d —起用作壓縮部分2240d。這些壓縮部分2240a至2240d統(tǒng)稱為壓縮部分2240。 壓縮運動圖像獲得部分2201獲得壓縮運動圖像。具體而言,壓縮運動圖像獲得部分2201獲得由圖像捕捉設(shè)備2100產(chǎn)生的捕捉運動圖像數(shù)據(jù)。壓縮運動圖像擴展部分2202對壓縮運動圖像獲得部分2201獲得的運動圖像進行解壓,以產(chǎn)生運動圖像中包括的運動圖像分量圖像。具體而言,壓縮運動圖像擴展部分2202對壓縮運動圖像獲得部分2201獲得的捕捉運動圖像數(shù)據(jù)進行解碼,以產(chǎn)生運動圖像中包括的運動圖像分量圖像。運動圖像分量圖像可以是幀圖像、場圖像等等。 特征區(qū)域檢測部分2203檢測運動圖像中包括的運動圖像分量圖像中的特征區(qū)
域。圖像劃分部分2204將每個運動圖像分量圖像劃分為特征區(qū)域和背景區(qū)域。 圖像產(chǎn)生部分2205從運動圖像分量圖像中提取特征區(qū)域圖像,以產(chǎn)生多幅特征
區(qū)域壓縮運動圖像。這里,每一幅特征區(qū)域壓縮運動圖像包括多幅特征區(qū)域圖像。具體而
言,圖像產(chǎn)生部分2205通過復制運動圖像來產(chǎn)生用于產(chǎn)生多幅特征區(qū)域運動圖像的多幅
特征區(qū)域壓縮運動圖像和用于產(chǎn)生背景區(qū)域運動圖像的背景區(qū)域壓縮運動圖像。 值固定部分2211將每一幅特征區(qū)域壓縮運動圖像中包括的運動圖像分量圖像中
不同于特征區(qū)域的區(qū)域(以下稱為非特征區(qū)域)的像素值設(shè)置為固定值。例如,值固定部
分2211將特征區(qū)域壓縮運動圖像中非特征區(qū)域的像素值設(shè)置為預定值(例如將亮度值設(shè)
置為0)。然后,壓縮部分2240以根據(jù)特征區(qū)域壓縮運動圖像的特征量而確定的強度,對包
括其中非特征區(qū)域的像素值被設(shè)為固定值的運動圖像分量圖像在內(nèi)的每一幅特征區(qū)域壓
12縮運動圖像進行壓縮。如上所述,壓縮部分2240以根據(jù)壓縮運動圖像的特征量而確定的強
度,對特征區(qū)域壓縮運動圖像和背景區(qū)域壓縮運動圖像獨立地進行壓縮。 如上所述,特征區(qū)域檢測部分2203檢測圖像中的特征區(qū)域。圖像劃分部分2204
將每幅圖像劃分為特征區(qū)域和背景區(qū)域。壓縮部分2240以不同的強度對示出特征區(qū)域的
特征區(qū)域圖像和示出背景區(qū)域的背景區(qū)域圖像獨立地進行壓縮。壓縮部分2240以不同的
強度對每幅包括多幅特征區(qū)域圖像的特征區(qū)域運動圖像和每幅包括多幅背景區(qū)域圖像的
背景區(qū)域運動圖像分別進行壓縮。 壓縮部分2240b、2240c和2240d中的每一個被配置為對預定類型的特征區(qū)域運動圖像進行壓縮。壓縮部分2240b、2240c和2240d中的每一個對示出預定類型特征的特征區(qū)域運動圖像進行壓縮。這里,以與特征類型相關(guān)聯(lián)的方式,預先確定對示出不同類型特征的特征區(qū)域運動圖像進行壓縮的壓縮強度。壓縮部分2240b、2240c和2240d中的每一個以與預定特征類型相關(guān)聯(lián)的預定壓縮強度來對示出預定類型特征的特征區(qū)域運動圖像進行壓縮。按照這種方式,壓縮部分2240使用以與圖像劃分部分2204定義的圖像區(qū)域一一對應的方式提供的壓縮器來并行壓縮多個區(qū)域。 壓縮部分2240可以由單一壓縮器來實現(xiàn)。在這種情況下,壓縮部分2240可以在時間上依次壓縮特征區(qū)域運動圖像和背景區(qū)域運動圖像。備選地,壓縮部分2240可以通過以針對特征類型和區(qū)域背景預先確定的壓縮率對圖像劃分部分2204定義的區(qū)域進行壓縮,來對壓縮運動圖像擴展部分2202的解碼操作獲得的捕捉運動圖像進行壓縮。按照這種方式,壓縮部分2240可以產(chǎn)生份運動圖像數(shù)據(jù)。 注意,特征區(qū)域檢測部分2203在運動圖像中包括的多幅運動圖像分量圖像中檢測到具有不同類型特征的多個特征區(qū)域。圖像劃分部分2204將每幅運動圖像分量圖像劃分為多個特征區(qū)域和背景區(qū)域。壓縮部分2240以根據(jù)運動圖像的特征量而確定的強度,對多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像分別進行壓縮。在此,這里的特征量指示主體類型、對象大小、運動物體的運動速度和特征區(qū)域大小中的任一項。 具體而言,對于特征區(qū)域運動圖像和背景區(qū)域運動圖像,圖像質(zhì)量降低部分2221通過根據(jù)它們的相應的特征量降低它們的圖像質(zhì)量,來對它們進行壓縮。更具體地,對于特征區(qū)域運動圖像和背景區(qū)域運動圖像,圖像質(zhì)量降低部分2221通過根據(jù)它們的相應的特征量降低幀率的分辨率,來對它們進行壓縮。對于特征區(qū)域運動圖像和背景區(qū)域運動圖像,編碼部分2231通過使用根據(jù)它們的相應的特征量而設(shè)置的值對運動圖像進行編碼,來對它們進行壓縮。例如,對于特征區(qū)域運動圖像和背景區(qū)域運動圖像,編碼部分2231通過使用根據(jù)它們的相應的特征量而分配的碼量對運動圖像進行編碼,來對它們進行壓縮。
關(guān)聯(lián)部分2206將多個壓縮部分2240通過對特征區(qū)域運動圖像和背景區(qū)域運動圖像進行壓縮而產(chǎn)生的多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)互相關(guān)聯(lián)。例如,這種關(guān)聯(lián)是通過添加標記信息來實現(xiàn)的。輸出部分2207將由關(guān)聯(lián)部分2206互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)發(fā)送至通信網(wǎng)絡(luò)2110。
根據(jù)圖2所示的配置,圖像處理設(shè)備2120中包括的壓縮部分2240以一一對應的方式對特征區(qū)域圖像和背景區(qū)域圖像進行壓縮。然而,根據(jù)不同的配置,圖像處理設(shè)備2120可以包括單一壓縮部分2240,該單一壓縮部分2240可以以不同的強度對特征區(qū)域圖像和背景區(qū)域圖像分別進行壓縮。例如,可以以時間共享的方式,將特征區(qū)域圖像和背景區(qū)域圖像依次提供給單一壓縮部分2240,并且單一壓縮部分2240可以以不同的強度依次對特征區(qū)域圖像和背景區(qū)域圖像分別進行壓縮。 備選地,單一壓縮部分2240可以通過分別以不同的量化系數(shù)對特征區(qū)域的多條
圖像信息和背景區(qū)域的一條圖像信息分別進行量化,來以不同的強度對特征區(qū)域圖像和背
景區(qū)域圖像分別進行壓縮。此外,可以將特征區(qū)域圖像和背景區(qū)域圖像轉(zhuǎn)換為具有不同圖
像質(zhì)量的圖像,并且可以將得到的圖像提供給單一壓縮部分2240。單一壓縮部分2240可以
對從特征區(qū)域圖像和背景區(qū)域圖像獲得的所提供的圖像分別進行壓縮。 在單一壓縮部分2240以不同的量化系數(shù)對每個區(qū)域的圖像進行量化或者對具有
不同圖像質(zhì)量的每個區(qū)域的圖像進行壓縮的上述實施例中,單一壓縮部分2240可以對單
一整幅圖像或者圖像劃分部分2204定義的圖像的每個部分區(qū)域進行壓縮(如參照圖2所
述)。當單一壓縮部分2240對單一整幅圖像進行壓縮時,圖像劃分部分2204執(zhí)行的圖像劃
分操作和值固定部分2211執(zhí)行的值固定操作不是必要的。因此,圖像處理設(shè)備2120可以
被配置為不具有圖像劃分部分2204和值固定單元2210。 圖3示意了圖像處理設(shè)備2170的示例模塊配置。圖像處理設(shè)備2170包括壓縮運動圖像獲得部分2301、關(guān)聯(lián)分析部分2302、壓縮運動圖像擴展單元2310、組合部分2303和輸出部分2304。壓縮運動圖像擴展單元2310包括多個壓縮運動圖像擴展部分2311a至2311d(以下統(tǒng)稱為壓縮運動圖像擴展部分2311)。 壓縮運動圖像獲得部分2301獲得從輸出部分2207輸出的、互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)。例如,關(guān)聯(lián)分析部分2302對添加的標記信息進行分析,以檢索壓縮運動圖像獲得部分2301獲得的、互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)。 壓縮運動圖像擴展部分2311對多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)進行解碼。具體而言,壓縮運動圖像擴展部分2311a對背景區(qū)域運動圖像數(shù)據(jù)進行解碼。壓縮運動圖像擴展部分2311b至2311d中的每一個對特征區(qū)域運動圖像數(shù)據(jù)中的一份進行解碼。按照這種方式,壓縮運動圖像擴展部分2311a至2311d獲得背景區(qū)域運動圖像和多幅特征區(qū)域運動圖像。這里,以與多個不同類型特征一一對應的方式提供壓縮運動圖像擴展部分2311b至2311d,壓縮運動圖像擴展部分2311b至2311d中的每一個對一種類型的一份特征區(qū)域運動圖像數(shù)據(jù)進行解碼。 組合部分2303將通過壓縮運動圖像擴展部分2311的解碼操作而獲得的運動圖像分量圖像組合在一起。具體而言,組合部分2303通過將從壓縮運動圖像擴展部分2311b至2311d的解碼操作得到的特征區(qū)域運動圖像中包括的運動圖像分量圖像重疊至背景區(qū)域運動圖像中包括的運動圖像分量圖像上,來產(chǎn)生運動圖像分量圖像。輸出部分2304將包括組合部分2303所產(chǎn)生的運動圖像分量圖像在內(nèi)的運動圖像提供給顯示設(shè)備2180。這里,輸出部分2304可以將包括組合部分2303所產(chǎn)生的運動圖像分量圖像在內(nèi)的運動圖像記錄在圖像數(shù)據(jù)庫2175上。圖像處理設(shè)備2170可以將從輸出部分2207輸出的、互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)記錄在圖像數(shù)據(jù)庫2175上。在這種情況下,壓縮運動圖像獲得部分2301可以從圖像數(shù)據(jù)庫2175獲得互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)。 根據(jù)本實施例,壓縮運動圖像擴展單元2310包括多個壓縮運動圖像擴展部分
142311,其數(shù)目與特征類型的數(shù)目相對應。然而,在其他實施例中,壓縮運動圖像擴展單元2310可以包括單一壓縮運動圖像擴展部分2311,該單一壓縮運動圖像擴展部分2311可以依次對一份背景區(qū)域運動圖像數(shù)據(jù)和多份特征區(qū)域運動圖像數(shù)據(jù)進行解碼。當圖像處理設(shè)備2120向圖像處理設(shè)備2170提供單份運動圖像數(shù)據(jù)時,單一壓縮運動圖像擴展部分2311可以對所提供的單份運動圖像數(shù)據(jù)進行解碼,并且輸出部分2304可以輸出解碼操作所獲得的運動圖像。 圖4示意了圖像處理設(shè)備2120執(zhí)行的操作的示例流程。在步驟2401中,壓縮運動圖像獲得部分2201獲得捕捉運動圖像數(shù)據(jù)。壓縮運動圖像擴展部分2202通過對捕捉運動圖像數(shù)據(jù)進行解碼來產(chǎn)生多幅幀圖像2410。在步驟2402中,特征區(qū)域檢測部分2203基于每幅幀圖像2410或多份幀圖像2410所示的內(nèi)容來檢測感興趣的區(qū)域(ROI) ,ROI被示為特征區(qū)域的示例。 特征區(qū)域檢測部分2203檢測包含人臉、人體和運動物體的區(qū)域,作為不同類型的ROI。例如,特征區(qū)域檢測部分2203通過模式匹配技術(shù)等來檢測包含以高于預定匹配度的匹配度與人臉的預定圖案相匹配的對象在內(nèi)的區(qū)域,并將檢測到的臉部區(qū)域指定為ROI。此外,特征區(qū)域檢測部分2203通過模式匹配技術(shù)等來檢測包含以高于預定匹配度的匹配度與人體圖案相匹配的對象在內(nèi)的區(qū)域,并將檢測到的區(qū)域指定為ROI。這里,特征區(qū)域檢測部分2203可以檢測臉部區(qū)域附近的身體區(qū)域。 特征區(qū)域檢測部分2203基于多幅幀圖像所示的內(nèi)容來標識包含運動物體在內(nèi)的運動區(qū)域。例如,特征區(qū)域檢測部分2203將在幀圖像之間像素值變化大于預定值的區(qū)域標識為運動區(qū)域。此外,特征區(qū)域檢測部分2203使用邊緣提取技術(shù)等從幀圖像中提取對象。特征區(qū)域檢測部分2203可以依次標識以高于預定匹配度的匹配度互相匹配并且在不同幀圖像中位于不同位置的對象,并且將包含所標識對象在內(nèi)的區(qū)域標識為運動區(qū)域。
如上所述,特征區(qū)域檢測部分2203將滿足與圖像內(nèi)容相關(guān)的預定條件的區(qū)域檢測為ROI。具體而言,特征區(qū)域檢測部分2203將包含滿足預定條件的對象在內(nèi)的區(qū)域檢測為ROI。例如,特征區(qū)域檢測部分2203將包含以高于預定匹配度的匹配度與預定形狀相匹配的對象在內(nèi)的區(qū)域檢測為ROI。此外,特征區(qū)域檢測部分2203將圖像變化比預定變化更為顯著的區(qū)域檢測為ROI。例如,特征區(qū)域檢測部分2203將幀圖像之間像素值變化大于預定變化的區(qū)域檢測為ROI。 除了上述列出的人臉和人體之外,特征區(qū)域檢測部分2203可以將示出人的頭部的一部分、人體的一部分(如手)或不同于人的活體對象的至少一部分的區(qū)域檢測為ROI。注意,活體對象包括活體對象內(nèi)的特定組織,例如腫瘤組織或血管。此外,除了活體對象之外,特征區(qū)域檢測部分2203可以將示出貨幣、卡(如現(xiàn)金卡)、車輛或車輛的牌照的區(qū)域檢測為ROI。 除了包括模板匹配技術(shù)在內(nèi)的模式匹配技術(shù)之外,特征區(qū)域檢測部分2203可以使用例如日本專利申請公開No. 2007-188419中公開的機器學習(例如adaboost)的結(jié)果來檢測ROI。例如,特征區(qū)域檢測部分2203基于從預定主體的圖像中提取的圖像特征量和從不同于預定主體的主體的圖像中提取的圖像特征量,來學習從預定主體的圖像中提取的圖像特征量的獨特性。特征區(qū)域檢測部分2203可以將從中提取了具有與所學習的獨特性相匹配的獨特性的圖像特征量的區(qū)域檢測為ROI。按照這種方式,特征區(qū)域檢測部分2203可以將示出預定主體的區(qū)域檢測為ROI。特征區(qū)域檢測部分2203可以檢測具有任何形狀 (例如矩形)的ROI。 特征區(qū)域檢測部分2203可以使用在日本專利申請No. 2008-078641中公開的方法 來檢測特征區(qū)域。例如,特征區(qū)域檢測部分2203以單一或多個預定速率來丟棄要在其中檢 測對象的所捕捉的圖像中的一些像素。按照這種方式,特征區(qū)域檢測部分2203產(chǎn)生由所捕 捉的圖像和一個或多個像素丟棄后的圖像組成的圖像組。特征區(qū)域檢測部分2203將第一 濾波器應用至第一圖像來計算評估值。這里,在所產(chǎn)生的圖像組中包括的圖像中,第一圖像 具有相對較小的大小,并且,第一濾波器作用于圖像上的二維區(qū)域,并產(chǎn)生表示該區(qū)域內(nèi)存 在特定類型對象的可能性的評估值。第一濾波器可以從分別作用于不同大小的區(qū)域的濾波 器組中選擇,并且被設(shè)計為作用于相對較小的區(qū)域,其中,根據(jù)圖像上區(qū)域的大小,每個濾 波器具有預定數(shù)目的像素。特征區(qū)域檢測部分2203從第一圖像中提取主候選區(qū)域,該主候 選區(qū)域產(chǎn)生超過預定第一閾值的評估值。 然后,特征區(qū)域檢測部分2203將第二濾波器應用至第二圖像中與主候選區(qū)域相 對應的區(qū)域,以計算評估值,其中,第二圖像所具有的像素比第一圖像多預定數(shù)目,第二濾 波器是從所述濾波器組中選擇的并被設(shè)計為作用于比第一濾波器所作用的區(qū)域大預定大 小的區(qū)域。按照這種方式,特征區(qū)域檢測部分2203提取次候選區(qū)域,該次候選區(qū)域產(chǎn)生超 過預定第二閾值的評估值。 特征區(qū)域檢測部分2203將被設(shè)計為作用于不同大小的區(qū)域的上述濾波器組應用 至圖像組中包括的相應大小的區(qū)域,以重復上述提取候選區(qū)域的提取操作。這里,特征區(qū)域 檢測部分2203以如下方式重復執(zhí)行提取操作從應用被設(shè)計為作用于相對較小區(qū)域的濾 波器的提取操作開始,依次增大所應用的濾波器所作用的區(qū)域的大小。具體而言,特征區(qū)域 檢測部分2203以如下方式重復并依次執(zhí)行提取操作從將被設(shè)計為作用于相對較小區(qū)域 的濾波器應用至相對較小圖像的提取操作開始,以將被設(shè)計為作用于相對較大區(qū)域的濾波 器應用至相對較大圖像的提取操作結(jié)束。特征區(qū)域檢測部分2203重復執(zhí)行兩個或更多提 取操作,以提取最終候選區(qū)域。按照這種方式,特征區(qū)域檢測部分2203檢測特定類型的對 象。然后,特征區(qū)域檢測部分2203將其中存在該特定類型對象的區(qū)域檢測為特征區(qū)域。如 上所述,特征區(qū)域檢測部分2203將濾波器的應用限制于恰在之前的提取操作中提取的區(qū) 域。換言之,相應提取操作依次判斷對象是否存在。因此,特征區(qū)域檢測部分2203可以精 確地檢測特征區(qū)域。此外,由于上述方法使用較小區(qū)域來大致檢測特征區(qū)域,因此特征區(qū)域 檢測部分2203可以在較短時間內(nèi)檢測特征區(qū)域。 備選地,特征區(qū)域檢測部分2203可以通過使用日本專利申請No. 2008-078636中 公開的方法來檢測特征區(qū)域。例如,特征區(qū)域檢測部分2203通過多個濾波器來檢測特征區(qū) 域,每個濾波器被設(shè)計為作用于所捕捉的圖像中具有預定大小的二維區(qū)域并計算與特定類 型的對象的輪廓和所占面積相關(guān)的不同的特征量之一。具體而言,特征區(qū)域檢測部分2203 將這些濾波器應用至要在其中檢測對象的所捕捉的圖像上具有預定大小的區(qū)域,以計算多 個特征量。這里,每個濾波器與濾波器所計算的特征量與表示存在特定類型對象的可能性 的主評估值之間的關(guān)系相關(guān)聯(lián)。特征區(qū)域檢測部分2203參照這種關(guān)系,并獲得與所計算的 特征量相關(guān)的主評估值。然后,特征區(qū)域檢測部分2203將與這些濾波器相對應的主評估 值相結(jié)合,以獲得表示區(qū)域中存在特定類型對象的可能性的次評估值。特征區(qū)域檢測部分
162203將次評估值與閾值進行比較,以提取產(chǎn)生超過閾值的次評估值并且其中非??赡艽嬖?特定類型對象的區(qū)域。按照上述方式,特征區(qū)域檢測部分2203將所提取的區(qū)域檢測為其中 存在特定類型對象的特征區(qū)域。如上所述,特征區(qū)域檢測部分2203將提取與對象輪廓和所 占面積的各種特征相關(guān)的特征量的多個濾波器進行組合。因此,與僅參照例如對象的輪廓 形狀來執(zhí)行的特征區(qū)域檢測操作相比,特征區(qū)域檢測部分2203可以更精確地提取特征區(qū) 域。 特征區(qū)域檢測部分2203可以將日本專利申請No. 2008-078636和No. 2008-078641 中公開的方法進行組合,來檢測特征區(qū)域。具體而言,與日本專利申請No. 2008-078636中 公開的方法相關(guān)的上述濾波器可以包括多個濾波器集合,其中每個濾波器集合與特定大小 的區(qū)域相對應。每個集合中的濾波器具有預定數(shù)目的像素。每個濾波器可以與上述特征量 與主評估值之間的上述關(guān)系相關(guān)聯(lián)。特征區(qū)域檢測部分2203可以以單一或多個預定速率 來丟棄要在其中檢測對象的所捕捉的圖像中的一些像素。按照這種方式,特征區(qū)域檢測部 分2203產(chǎn)生由所捕捉的圖像和一個或多個像素丟棄后的圖像組成的圖像組。特征區(qū)域檢 測部分2203將多個第一濾波器應用至第一圖像來計算多個特征量。這里,在圖像組中包括 的圖像中,第一圖像具有相對較小的大小,并且,第一濾波器被設(shè)計為作用于相對較小的區(qū) 域。基于相應地與第一濾波器相關(guān)聯(lián)的關(guān)系,特征區(qū)域檢測部分2203獲得與所計算的特征 量相對應的主評估值。然后,特征區(qū)域檢測部分2203將主評估值相結(jié)合以獲得表示區(qū)域中 存在特定類型對象的可能性的次評估值。特征區(qū)域檢測部分2203將所獲得的次評估值與 第一閾值進行比較,以提取產(chǎn)生超過第一閾值的次評估值并且其中非常可能存在特定類型 對象的主候選區(qū)域。 特征區(qū)域檢測部分2203將多個第二濾波器應用至第二圖像中與主候選區(qū)域相對 應的區(qū)域,以計算多個特征量。這里,第二圖像包括在該圖像組中,并具有比第一圖像多預 定數(shù)目的像素,第二濾波器被設(shè)計為作用于比第一濾波器所作用的區(qū)域大預定大小的區(qū) 域?;谂c第二濾波器相關(guān)聯(lián)的關(guān)系,特征區(qū)域檢測部分2203獲得與所計算的特征量相對 應的主評估值。然后,特征區(qū)域檢測部分2203將與第二濾波器相對應的主評估值相結(jié)合, 以獲得表示與主候選區(qū)域相對應的區(qū)域中存在特定類型對象的可能性的次評估值。特征區(qū) 域檢測部分2203將所獲得的次評估值與第二閾值相比較,以提取產(chǎn)生超過第二閾值的次 評估值并且其中非??赡艽嬖谔囟愋蛯ο蟮拇魏蜻x區(qū)域。 特征區(qū)域檢測部分2203通過將上述多個濾波器集合(其中每個集合被設(shè)計為作 用于不同大小的區(qū)域)應用至圖像組中相應不同大小的區(qū)域,來重復執(zhí)行提取候選區(qū)域的 提取操作。這里,特征區(qū)域檢測部分2203以如下方式重復執(zhí)行提取操作從應用被設(shè)計為 作用于相對較小區(qū)域的濾波器的提取操作開始,依次增大所應用的濾波器所作用的區(qū)域的 大小。具體而言,特征區(qū)域檢測部分2203以如下方式重復并依次執(zhí)行提取操作從將被設(shè) 計為作用于相對較小區(qū)域的濾波器應用至相對較小圖像的提取操作開始,以將被設(shè)計為作 用于相對較大區(qū)域的濾波器應用至相對較大圖像的提取操作結(jié)束。特征區(qū)域檢測部分2203
重復執(zhí)行兩個或更多提取操作,以提取最終候選區(qū)域。按照這種方式,特征區(qū)域檢測部分 2203檢測特定類型的對象。然后,特征區(qū)域檢測部分2203將其中存在該特定類型對象的區(qū) 域檢測為特征區(qū)域。特征區(qū)域檢測部分2203可以使用日本專利申請No. 2008-098600中公開的方法來
17檢測特征區(qū)域。例如,特征區(qū)域檢測部分2203從多個圖像捕捉設(shè)備2100捕捉運動圖像中 包括的多幅所捕捉的圖像中檢測特征區(qū)域。例如,假定圖像捕捉設(shè)備2100a和2100b捕捉 相同場景的圖像。例如,圖像捕捉設(shè)備2100a和2100b可以用作立體攝像機。在以下描述 中,圖像對表示由圖像捕捉設(shè)備2100a捕捉的第一捕捉圖像和圖像捕捉設(shè)備2100b捕捉的 第二捕捉圖像組成的對。特征區(qū)域檢測部分2203檢測該圖像對中特定類型的對象,并且將 其中存在所檢測的特定類型對象的區(qū)域檢測為特征區(qū)域。 特征區(qū)域檢測部分2203在形成圖像對的第一和第二捕捉圖像中的每一個中提取 其中示出特定類型對象的區(qū)域。這里,特征區(qū)域檢測部分2203可以檢測其中以低精度示 出特定類型對象的區(qū)域。特征區(qū)域檢測部分2203然后通過檢測第一和第二捕捉圖像上所 提取區(qū)域中的一對對應區(qū)域,來檢測特定類型的對象。例如,特征區(qū)域檢測部分2203參照 這一對區(qū)域圖像來計算圖像捕捉設(shè)備2100a和2100b與這些區(qū)域中所示主體的距離。特征 區(qū)域檢測部分2203使用基于與對象的距離而獲得的主體的三維形狀來檢測特定類型的對 象。 當檢測這對對應區(qū)域時,特征區(qū)域檢測部分2203將從形成圖像對的第一和第二 捕捉圖像中檢測到的、其中示出特定類型對象的每個區(qū)域劃分為多個子區(qū)域。特征區(qū)域檢 測部分2203計算表征每個子區(qū)域中的部分圖像的特征量,然后計算表示子區(qū)域的特征量 的矢量。這里,特征量可以示例為像素值,矢量可以示例為梯度矢量(例如像素值梯度矢 量)。特征區(qū)域檢測部分2203計算第一圖像上的區(qū)域的所計算的矢量與第二圖像上的區(qū)域 的所計算的矢量之間的邏輯距離。特征區(qū)域檢測部分2203將其間的邏輯距離短于預定值 的一對區(qū)域檢測為這對對應區(qū)域。這里,邏輯距離可以示例為矢量的分量之間的差的平方 和的平方根。按照上述方式,特征區(qū)域檢測部分2203可以精確地從圖像對中提取這對對應 區(qū)域,從而精確計算與主體的距離。因此,特征區(qū)域檢測部分2203可以精確識別主體的三 維形狀,并且可以精確地檢測特定類型的對象。 特征區(qū)域檢測部分2203可以使用日本專利申請No. 2008-091562中公開的方法來 檢測特征區(qū)域。例如,特征區(qū)域檢測部分2203從運動圖像中包括的每一幅所捕捉的圖像中 提取與特定類型的主體類似的主體類似形狀,以及主體類似形狀的尺寸和在圖像捕捉設(shè)備 2100的視角下主體類似形狀的位置信息。該視角下的位置信息可以示例為所捕捉的圖像內(nèi) 的圖像區(qū)域的位置。特征區(qū)域檢測部分2203判斷所提取的主體類似形狀是否表示特定類 型的主體,然后提取特定類型的主體。例如,特征區(qū)域檢測部分2203可以對包括具有主體 類似形狀的主體在內(nèi)的預定搜索區(qū)域中具有主體類似形狀并具有與所提取的主體類似形 狀相同尺寸的主體的數(shù)目進行計數(shù),并在計數(shù)大于或等于閾值的情況下提取具有主體類似 形狀的主體作為特定類型的主體。特征區(qū)域檢測部分2203可以將包含特定類型主體在內(nèi) 的區(qū)域檢測為特征區(qū)域。按照這種方式,特征區(qū)域檢測部分2203可以將其中檢測到具有與 預定尺寸相似尺寸的大量主體的圖像區(qū)域中存在的具有主體類似形狀的主體檢測為特定 類型的主體。這里,可以防止特征區(qū)域檢測部分2203將不同于該圖像區(qū)域的區(qū)域中存在的 具有主體類似形狀的主體檢測為特定類型的主體。因此,特征區(qū)域檢測部分2203被配置為 不太可能錯誤地將不同于上述圖像區(qū)域的區(qū)域中存在的具有主體類似形狀的主體檢測為 特定類型的主體。 當圖像捕捉設(shè)備2100具有可變視角時,上述視角下的位置信息可以示例為圖像捕捉設(shè)備2100在捕捉圖像時所面對的方向和所捕捉的圖像上的位置。當可以使用多個圖 像捕捉設(shè)備2100來捕捉比使用單一圖像捕捉設(shè)備2100時更大連續(xù)場的圖像時,上述視角 下的位置信息可以示例為相應圖像捕捉設(shè)備2100在捕捉圖像時所面對的方向和圖像捕捉 設(shè)備2100分別捕捉的所捕捉圖像上的位置。 在步驟2403中,基于以上述方式檢測的ROI,圖像處理設(shè)備2120產(chǎn)生壓縮運動圖 像。具體而言,圖像劃分部分2204將每幅幀圖像劃分為ROI和其余區(qū)域。隨后,圖像產(chǎn)生部 分2205通過復制幀圖像2410,產(chǎn)生特征區(qū)域運動圖像2430、特征區(qū)域運動圖像2440、特征 區(qū)域運動圖像2450和背景區(qū)域運動圖像2420。具體而言,圖像產(chǎn)生部分2205通過復制幀 圖像2410,產(chǎn)生針對臉部區(qū)域的特征區(qū)域運動圖像2450、針對人區(qū)域的特征區(qū)域運動圖像 2440、針對運動區(qū)域的特征區(qū)域運動圖像2430和針對背景區(qū)域的背景區(qū)域運動圖像2420。
然后,在步驟2404a、2404b、2404c和2404d中,圖像處理設(shè)備2120使用值固定部 分2211和圖像質(zhì)量降低部分2221來降低特征區(qū)域運動圖像2430、2440和2450以及背景 區(qū)域運動圖像2420的圖像質(zhì)量。具體而言,在特征區(qū)域運動圖像2430、2440和2450中每 一幅中包括的幀圖像中,值固定部分2211維持圖像劃分部分2404所定義的ROI中對應的 一個ROI中的像素值,并將不同于該對應ROI的區(qū)域中的像素值設(shè)置為預定值(例如將亮 度值設(shè)為0)。這里,值固定部分2211可以將不同于該ROI的區(qū)域中的像素值設(shè)置為與該 ROI相鄰的區(qū)域的平均像素值。 按照上述方式,圖像產(chǎn)生部分2205和值固定部分2211產(chǎn)生特征區(qū)域運動圖像 2430、2440和2450以及背景區(qū)域運動圖像2420,其中每幅圖像包括具有相同視角的多幅幀 圖像。如以后更詳細所述,圖像處理設(shè)備2170通過將其中非R01區(qū)域的值被設(shè)置為固定值 的運動圖像(例如特征區(qū)域運動圖像2430、2440和2450)重疊在背景區(qū)域運動圖像2420 上來產(chǎn)生運動圖像。因此,背景區(qū)域運動圖像2420和特征區(qū)域運動圖像2430、2440和2450 可以分別被視為背景層、運動區(qū)域?qū)?、人區(qū)域?qū)雍湍槻繀^(qū)域?qū)印?在特征區(qū)域運動圖像2430、2440和2450中每一幅中包括的幀圖像中,圖像質(zhì)量降 低部分2221根據(jù)特征類型降低ROI中圖像的圖像質(zhì)量。具體而言,由包括分辨率、灰度級 數(shù)和顏色數(shù)目在內(nèi)的至少一個參數(shù)預先對臉部、人和運動區(qū)域的圖像質(zhì)量進行定義。例如, 預先指定臉部、人和運動區(qū)域以分辨率的降序來布置。 圖像質(zhì)量降低部分2221根據(jù)特征類型,將特征區(qū)域運動圖像2430、2440和2450 中每一幅中包括的幀圖像中ROI的圖像改變?yōu)榫哂蓄A定分辨率、灰度級數(shù)和顏色數(shù)目的圖 像。圖像質(zhì)量降低部分2221還將背景區(qū)域運動圖像中包括的幀圖像的圖像質(zhì)量設(shè)置為低 于ROI中的圖像的圖像質(zhì)量。例如,圖像質(zhì)量降低部分2221將背景區(qū)域運動圖像中包括的 幀圖像的分辨率設(shè)置為低于ROI中圖像的分辨率。 圖像質(zhì)量降低部分2221降低背景區(qū)域運動圖像2420和特征區(qū)域運動圖像2430、 2440和2450的幀率。例如,每種特征類型,即臉部,人和運動區(qū)域中的每一個與預定幀率相 關(guān)聯(lián)。圖像質(zhì)量降低部分2221通過根據(jù)與特征類型相關(guān)聯(lián)的預定幀率,以預定間隔來丟棄 特征區(qū)域運動圖像2430、2440和2450中每一幅中包括的一些幀圖像,來降低特征區(qū)域運動 圖像2430、2440和2450中每一幅的幀率。圖像質(zhì)量降低部分2221還通過根據(jù)預定幀率來 丟棄背景區(qū)域運動圖像2420中包括的一些幀圖像,來降低背景區(qū)域運動圖像2420的幀率。
這里,圖像質(zhì)量降低部分2221a降低背景區(qū)域運動圖像2420的圖像質(zhì)量。圖像質(zhì)
19量降低部分2221b、2221c和2221d分別降低特征區(qū)域運動圖像2430、2440和2450的圖像質(zhì)量。 隨后,在步驟2405a、2405b、2405c和2405d中,背景區(qū)域運動圖像編碼部分2231a 和特征區(qū)域運動圖像編碼部分2231b至2231d分別對圖像質(zhì)量已被圖像質(zhì)量降低部分2221 降低的相應運動圖像進行編碼。例如,背景區(qū)域運動圖像編碼部分2231a和特征區(qū)域運動 圖像編碼部分2231b至2231d對圖像質(zhì)量已被圖像質(zhì)量降低部分2221降低的相應運動圖 像進行MPEG編碼。 例如,背景區(qū)域運動圖像編碼部分2231a根據(jù)針對背景區(qū)域運動圖像的編碼設(shè) 置,對背景區(qū)域運動圖像進行MPEG編碼。特征區(qū)域運動圖像編碼部分2231b、2231c和2231d 根據(jù)分別針對運動、人和臉部區(qū)域運動圖像的編碼設(shè)置,對相應特征區(qū)域運動圖像分別進 行MPEG編碼。這里,編碼設(shè)置包括設(shè)置例如用于MPEG編碼的量化表。編碼設(shè)置將參照圖 5來描述。 在步驟406中,關(guān)聯(lián)部分2206通過添加標記信息,將通過背景區(qū)域運動圖像編碼 部分2231a和特征區(qū)域運動圖像編碼部分2231b至2231d的編碼操作而獲得的一份背景區(qū) 域運動圖像數(shù)據(jù)和多份特征區(qū)域運動圖像數(shù)據(jù)互相關(guān)聯(lián),并且輸出部分2207將一份背景 區(qū)域運動圖像數(shù)據(jù)和多份特征區(qū)域運動圖像數(shù)據(jù)輸出至圖像處理設(shè)備2170。這里,關(guān)聯(lián)部 分2206可以將定時信息添加至標記信息,其中定時信息是例如時間戳并包括指示背景區(qū) 域運動圖像和特征區(qū)域運動圖像中包括的幀圖像的顯示定時的信息。關(guān)聯(lián)部分2206可以 將指示每個特征區(qū)域的范圍的特征區(qū)域信息、標識產(chǎn)生捕捉運動圖像數(shù)據(jù)(從其中產(chǎn)生背 景區(qū)域運動圖像和特征區(qū)域運動圖像)的圖像捕捉設(shè)備100的標識信息以及其他信息添加 至標記信息。 如上所述,特征區(qū)域檢測部分2203從運動圖像中包括的多幅運動圖像分量圖像 中,檢測示出不同類型主體的多個特征區(qū)域。壓縮部分2240以根據(jù)主體類型而確定的強 度,對多幅特征區(qū)域運動圖像分別進行壓縮。在本實施例中,不同類型的主體包括例如人臉 和人體。然而在其他實施例中,不同類型的主體可以包括汽車的牌照和汽車中不同于牌照 的不同部分。 不同類型的主體可以包括人臉的前視圖和側(cè)視圖。不同類型的主體可以包括靜止 和運動的主體。特征區(qū)域檢測部分2203可以將包含位置與圖像捕捉設(shè)備2100相距不同距 離的多個主體在內(nèi)的多個區(qū)域檢測為具有不同類型特征的多個特征區(qū)域。
壓縮部分2240對特征區(qū)域運動圖像進行壓縮的壓縮強度可以以運動區(qū)域、人體、 人臉側(cè)視圖和人臉正視圖(這些是示例性的不同類型的特征)的順序降序排列。由于圖像 處理系統(tǒng)2010用作本實施例中的監(jiān)視系統(tǒng),圖像處理系統(tǒng)2010被配置為將包含人臉的區(qū) 域檢測為ROI,并將所檢測的ROI的圖像質(zhì)量設(shè)置為高于非ROI區(qū)域的圖像質(zhì)量。然而,圖 像處理系統(tǒng)2010可以用于例如捕捉街道的圖像。當用于這種目的時,圖像處理系統(tǒng)2010 可以將包含人臉的區(qū)域檢測為ROI,并且將所檢測的ROI的圖像質(zhì)量設(shè)置為低于非ROI區(qū)域 的圖像質(zhì)量,以保護個人信息。例如,壓縮部分2240對特征區(qū)域運動圖像和背景區(qū)域運動 圖像進行壓縮的壓縮強度可以以人臉正視圖、人臉側(cè)視圖、人體、運動區(qū)域和背景區(qū)域的順 序降序排列。特征區(qū)域檢測部分2203可以從多幅幀圖像中檢測包含以不同速度運動的主體在
20內(nèi)的多個特征區(qū)域。在這種情況下,隨著對象的速度增大,圖像質(zhì)量降低部分2221通過轉(zhuǎn)換特征區(qū)域運動圖像而獲得的運動圖像的幀率增大。這就是說,壓縮部分2240可以以根據(jù)特征區(qū)域運動圖像的主體速度而確定的強度,對其分別進行壓縮。 如上所述,圖像處理設(shè)備2120將特征區(qū)域運動圖像中分別包括的幀圖像中的非ROI區(qū)域中的值設(shè)置為固定值,并產(chǎn)生均具有相同視角的多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像。因此,圖像處理設(shè)備2120能夠使用通用編碼器,以高壓縮率來對特征區(qū)域運動圖像進行壓縮,而不使用專門設(shè)計的編碼器。例如,當如在MPEG編碼技術(shù)中那樣通過運動矢量來對特征區(qū)域運動圖像進行編碼時,在值被設(shè)為固定值的非ROI區(qū)域內(nèi)的宏塊中,像素值可能通常具有為0的差分值。因此,上述值固定操作能夠降低圖像處理設(shè)備2120的制造成本,并且可以維持高壓縮率。 在以上描述中,壓縮部分2240對包括其中非R0I區(qū)域的值被設(shè)置為固定值的幀圖像在內(nèi)的特征區(qū)域運動圖像進行壓縮。壓縮部分2240可以對來自特征區(qū)域運動圖像中包括的幀圖像的ROI內(nèi)的圖像進行剪裁,對剪裁的圖像進行壓縮,并輸出壓縮圖像作為特征區(qū)域運動圖像。 當特征區(qū)域檢測部分2203未檢測到R01時,輸出部分2207將從壓縮部分2240a輸出的背景區(qū)域運動圖像數(shù)據(jù)輸出至圖像處理設(shè)備2170。在這種情況下,圖像產(chǎn)生部分2205可能不需要產(chǎn)生特征區(qū)域運動圖像2430、2440和2450。在特征區(qū)域檢測部分2203檢測到ROI的情況下,圖像產(chǎn)生部分2205產(chǎn)生特征區(qū)域運動圖像2430、2440和2450,并且輸出部分2207將以上述方式獲得的多份特征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)輸出至圖像處理部分2170。在此期間,壓縮部分2240a可以繼續(xù)以預定背景區(qū)域壓縮率來對背景區(qū)域運動圖像2420進行壓縮。 在特征區(qū)域檢測部分2203未檢測到ROI時,壓縮部分2240可以以預定無ROI壓縮率來對背景區(qū)域運動圖像進行壓縮,該預定無ROI壓縮率低于上述背景區(qū)域壓縮率且高于針對特征區(qū)域運動圖像的壓縮率。在特征區(qū)域檢測部分2203檢測到R01的情況下,壓縮部分2240可以以上述背景區(qū)域壓縮率來對背景區(qū)域運動圖像進行壓縮。這里,壓縮部分2240可以以低于無ROI壓縮率的壓縮率來對特征區(qū)域運動圖像進行壓縮。 直到特征區(qū)域檢測部分2203檢測到ROI后過去預定時段之前,壓縮部分2240可以以無ROI壓縮率對背景區(qū)域運動圖像進行壓縮,并且在過去預定時段之后,以背景區(qū)域壓縮率對背景區(qū)域運動圖像進行壓縮。使用這種配置,即使在特征區(qū)域檢測部分2203未將原先期望被檢測為ROI的區(qū)域檢測為ROI的情況下,圖像處理設(shè)備2120也能夠以合理的高圖像質(zhì)量來提供背景區(qū)域運動圖像。壓縮部分2240可以以以下方式以不同壓縮率對相應區(qū)域進行壓縮。特征區(qū)域檢測部分2203檢測幀圖像中的ROI,并且使用所檢測的ROI的位置來估計不同幀圖像中的ROI。在不同的幀圖像中,包含該ROI的區(qū)域具有高于非ROI區(qū)域的圖像質(zhì)量。 圖5示出了作為示例的特征區(qū)域運動圖像的圖像質(zhì)量和背景區(qū)域運動圖像的圖像質(zhì)量。為了簡化說明,假定壓縮運動圖像獲得部分2201所獲得的捕捉運動圖像數(shù)據(jù)具有16fps的幀率,并且捕捉運動圖像數(shù)據(jù)中包括的幀圖像具有72dpi的分辨率。
圖像質(zhì)量降低之后背景區(qū)域運動圖像420中包括的幀圖像的分辨率與捕捉運動圖像中包括的幀圖像410的分辨率的分辨率比被預先設(shè)置為1/8。圖像質(zhì)量降低部分2221通過在圖像質(zhì)量降低之前丟棄背景區(qū)域運動圖像2420中包括的幀圖像的一些像素,來產(chǎn) 生9-dpi幀圖像,其中,9dpi的分辨率是由圖像產(chǎn)生部分2205通過復制捕捉運動圖像而產(chǎn) 生的圖像質(zhì)量降低之前的背景區(qū)域運動圖像2420中包括的幀圖像的分辨率的1/8。此外, 圖像質(zhì)量降低之后背景區(qū)域運動圖像2420的幀率與捕捉運動圖像的幀率的幀率比預先被 設(shè)置為1/8。圖像質(zhì)量降低部分2221通過在圖像質(zhì)量降低之前丟棄背景區(qū)域運動圖像2420 中包括的一些幀圖像來產(chǎn)生2-fps背景區(qū)域運動圖像2420,其中2fps的幀率是圖像質(zhì)量降 低之前背景區(qū)域運動圖像2420的幀率的1/8。 類似地,以與相應特征區(qū)域運動圖像相關(guān)聯(lián)的方式,預先指定分辨率比和幀率比。 例如,針對特征區(qū)域運動圖像2430,分辨率比和幀率比被設(shè)置為1/4 ;針對特征區(qū)域運動圖 像2440,分辨率比和幀率比被設(shè)置為1/2 ;針對特征區(qū)域運動圖像2450,分辨率比和幀率比 被設(shè)置為1/1。在這種情況下,圖像質(zhì)量降低部分2221b產(chǎn)生具有4fps的幀率和18dpi的 幀圖像分辨率的特征區(qū)域運動圖像2430。圖像質(zhì)量降低部分2221c產(chǎn)生具有8fps的幀率 和36dpi的幀圖像分辨率的特征區(qū)域運動圖像2440。圖像質(zhì)量降低部分2221d產(chǎn)生具有 16fps的幀率和72dpi的幀圖像分辨率的特征區(qū)域運動圖像2450。 在上述示例情況下,圖像質(zhì)量降低部分2221通過丟棄特征區(qū)域運動圖像和背景 區(qū)域運動圖像中包括的幀圖像的一些像素來降低幀圖像的圖像質(zhì)量。備選地,圖像質(zhì)量降 低部分2221可以通過使用濾波器來降低幀圖像的圖像質(zhì)量,其中每個濾波器允許通過預 定頻帶(例如低通濾波器)。如果是這種情況,則與每種特征相關(guān)聯(lián)的濾波器可以具有預定 屬性,其中不同類型的特征包括背景區(qū)域、運動區(qū)域、人區(qū)域和臉部區(qū)域,濾波器屬性包括 通過每個濾波器的頻帶和通過程度。 除了圖像質(zhì)量降低部分2221執(zhí)行的圖像質(zhì)量降低之外,或者作為其替代,編碼部 分2231可以降低幀圖像的圖像質(zhì)量。例如,編碼部分2231可以通過增大用于MPEG編碼的 量化表的值來降低圖像質(zhì)量。每個量化表的值可以根據(jù)不同特征類型中對應的一種來預 先設(shè)置。例如,背景區(qū)域運動圖像編碼部分2231a和特征區(qū)域運動圖像編碼部分2231b至 2231d可以使用具有預定值的量化表來對相應運動圖像進行編碼。參照量化表,值與頻率分 量相關(guān)聯(lián)。這種值可以根據(jù)不同特征類型來預先進行不同的設(shè)置。 圖像質(zhì)量降低部分2221也可以對背景區(qū)域運動圖像中包括的多幅幀圖像進行平 均。按照這種方式,當幀圖像中包括表示運動物體的對象時,圖像質(zhì)量降低部分2221可以 獲得將表示運動物體的對象進行平均的幀圖像。當連續(xù)顯示這種平均后的幀圖像時,觀看 者可以享受到觀看運動物體的平滑運動。 根據(jù)上述實施例,圖像產(chǎn)生部分2205對捕捉運動圖像進行復制,以產(chǎn)生特征區(qū)域 運動圖像和背景區(qū)域運動圖像,并且壓縮部分2240通過丟棄一些幀圖像和像素來壓縮所 產(chǎn)生的特征區(qū)域運動圖像和背景區(qū)域運動圖像。備選地,圖像產(chǎn)生部分2205可以通過根據(jù) 幀率比來丟棄捕捉運動圖像中包括的一些幀圖像,來產(chǎn)生具有降低幀率的特征區(qū)域運動圖 像和背景區(qū)域運動圖像。此后,值固定部分2211執(zhí)行值固定操作,圖像質(zhì)量降低部分2221 降低分辨率以降低特征區(qū)域運動圖像和背景區(qū)域運動圖像的圖像質(zhì)量。
圖6示意了圖像處理設(shè)備2170執(zhí)行的操作的示例流程。在步驟2601中,壓縮運 動圖像獲得部分2301從圖像處理設(shè)備2120獲得互相關(guān)聯(lián)的多份特征區(qū)域運動圖像數(shù)據(jù)和 一份背景區(qū)域運動圖像數(shù)據(jù),并且參照所添加的標記信息,獲得定時信息、標識圖像捕捉設(shè)
22備2100的標識信息和其他信息。在步驟2602a中,壓縮運動圖像擴展部分2311對多份特 征區(qū)域運動圖像數(shù)據(jù)和一份背景區(qū)域運動圖像數(shù)據(jù)進行解碼,以產(chǎn)生表示背景層的背景區(qū) 域運動圖像2610。同時,在步驟2602b、2602c和2602d中,壓縮運動圖像擴展部分2311產(chǎn) 生表示運動區(qū)域?qū)拥奶卣鲄^(qū)域運動圖像2620、表示人區(qū)域?qū)拥奶卣鲄^(qū)域運動圖像2630和 表示臉部區(qū)域?qū)拥奶卣鲄^(qū)域運動圖像2640。 在步驟2603中,組合部分2303將背景區(qū)域運動圖像2610和特征區(qū)域運動圖像 2620、2630和2640中包括的幀圖像組合在一起。這里,組合部分2303根據(jù)背景區(qū)域運動圖 像2610和特征區(qū)域運動圖像2620、2630和2640中包括的幀圖像的相應分辨率,以相應幀 圖像中的相同主體互相重疊的方式對其進行放大,并將放大后的幀圖像層疊以產(chǎn)生組合的 幀圖像。 組合部分2303對來自特征區(qū)域運動圖像2620、2630和2640中包括的幀圖像的特 征區(qū)域的圖像進行剪裁,并將剪裁后的圖像覆蓋在背景區(qū)域運動圖像2610中包括的幀圖 像上。按照這種方式,組合部分2303產(chǎn)生組合的幀圖像。當背景區(qū)域運動圖像2610和特 征區(qū)域運動圖像2620、2630和2640具有不同幀率時,組合部分2303將背景區(qū)域運動圖像 2610和特征區(qū)域運動圖像2620、2630和2640中最新的幀圖像組合在一起。
按照上述方式,組合部分2303產(chǎn)生組合的幀圖像。組合部分2303還產(chǎn)生包括多 幅組合幀圖像在內(nèi)的組合的運動圖像2650。在步驟2604中,輸出部分2304參照由壓縮運 動圖像獲得部分2301獲得的標記信息來選擇要顯示組合運動圖像的顯示設(shè)備2180,并將 組合的運動圖像提供給所選擇的顯示設(shè)備2180。 圖7示意了圖像處理設(shè)備2120中還包括的壓縮控制單元2700的示例配置。壓縮 控制單元2700包括邊界區(qū)域標識部分2710、信息量計算部分2720、相同主體區(qū)域標識部 分2730、壓縮強度確定部分2740、條件存儲部分2750、條件獲得部分2752和壓縮控制部分 2760。 條件存儲部分2750存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征 區(qū)域的特征來分配不同的壓縮強度。具體而言,條件存儲部分2750存儲根據(jù)特征區(qū)域的類 型而不同的條件。 參照條件存儲部分2750上存儲的條件,壓縮控制部分2760根據(jù)特征區(qū)域的特征 來控制壓縮部分2240對特征區(qū)域圖像進行壓縮的壓縮強度。具體而言,參照條件存儲部分 2750上存儲的條件,壓縮控制部分2760根據(jù)特征區(qū)域的特征來控制壓縮部分2240對特征 區(qū)域圖像進行壓縮的壓縮強度。更具體地,參照條件存儲部分2750上存儲的條件,壓縮控 制部分2760根據(jù)特征區(qū)域的類型來控制壓縮部分2240對特征區(qū)域圖像進行壓縮的壓縮強 度。 壓縮部分2240對多幅特征區(qū)域運動圖像進行壓縮,其中每一幅包括多幅運動圖 像分量圖像中具有相同類型特征的多幅特征區(qū)域圖像。這里,壓縮控制部分2760根據(jù)特征 區(qū)域運動圖像中包括的特征區(qū)域圖像的特征類型,參照條件存儲部分2750上存儲的條件, 控制壓縮部分2240對特征區(qū)域運動圖像進行壓縮的壓縮強度。 條件存儲部分2750可以存儲根據(jù)特征區(qū)域的類型而不同的圖像質(zhì)量降低量。圖 像質(zhì)量降低部分2221可以降低特征區(qū)域運動圖像的圖像質(zhì)量,其中每一幅特征區(qū)域運動 圖像包括運動圖像分量圖像中具有相同類型特征的特征區(qū)域圖像。這里,壓縮控制部分2760可以根據(jù)特征區(qū)域運動圖像中包括的特征區(qū)域圖像的特征類型,參照條件存儲部分 2750上存儲的圖像質(zhì)量降低量,來控制圖像質(zhì)量降低部分2221將圖像質(zhì)量降低的圖像質(zhì) 量降低量。 壓縮控制部分2760可以根據(jù)特征區(qū)域運動圖像中包括的特征區(qū)域圖像的特征類 型,參照條件存儲部分2750上存儲的條件,來控制壓縮部分2240對特征區(qū)域運動圖像進行 壓縮的壓縮強度。這里,壓縮運動圖像獲得部分2201獲得從不同位置捕捉的多幅運動圖 像。例如,壓縮運動圖像獲得部分2201獲得圖像捕捉設(shè)備2100a至2100c所捕捉的多幅運 動圖像。 相同主體區(qū)域標識部分2730對從被配置為獲得運動圖像的運動圖像獲得部分所
獲得的運動圖像之一中包括的運動圖像分量圖像中提取的并且包含與從所獲得的運動圖
像中不同的一幅運動圖像中包括的運動圖像分量圖像中提取的特征區(qū)域所包含的相同主
體的特征區(qū)域進行標識。具體而言,相同主體區(qū)域標識部分2730參照壓縮運動圖像擴展部
分2202通過對壓縮運動圖像獲得部分2201獲得的壓縮運動圖像數(shù)據(jù)進行擴展而獲得的運
動圖像,并對從所參照的運動圖像之一中包括的運動圖像分量圖像中提取的并且包含與從
所參照的運動圖像中不同的一幅運動圖像中包括的運動圖像分量圖像中提取的特征區(qū)域
所包含的相同主體的特征區(qū)域進行標識。壓縮控制部分2760根據(jù)特征區(qū)域的特征,參照條
件存儲部分2750上存儲的條件,來控制壓縮部分2240對被相同主體區(qū)域標識部分2730標
識為包括相同主體的特征區(qū)域中至少一個特征區(qū)域的特征區(qū)域圖像進行壓縮的壓縮強度,
并且將壓縮部分2240對不同特征區(qū)域的特征區(qū)域圖像進行壓縮的壓縮強度設(shè)置為高于壓
縮部分2240對上述至少一個特征區(qū)域的特征區(qū)域圖像進行壓縮的壓縮率。 邊界區(qū)域標識部分2710對位于特征區(qū)域和非特征區(qū)域之間的邊界附近的邊界區(qū)
域進行標識。壓縮強度確定部分2740確定對邊界區(qū)域的圖像進行壓縮的壓縮強度,其中,
用于邊界區(qū)域的壓縮強度落入對特征區(qū)域的圖像進行壓縮的壓縮強度與對背景區(qū)域的圖
像進行壓縮的壓縮強度之間。壓縮部分2240以壓縮強度確定部分2740所確定的壓縮強度
對邊界區(qū)域的圖像進行壓縮。如上所述,壓縮部分2240以不同的強度對特征區(qū)域、背景區(qū)
域和邊界區(qū)域的圖像進行壓縮。 壓縮強度確定部分2740使對特征區(qū)域附近給定區(qū)域的圖像進行壓縮的壓縮強度 隨著給定區(qū)域更接近于特征區(qū)域而更接近于對特征區(qū)域的圖像進行壓縮的壓縮強度。壓縮 部分2240以壓縮強度確定部分2740根據(jù)邊界區(qū)域的位置而確定的壓縮強度,對邊界區(qū)域 的圖像進行壓縮。 壓縮強度確定部分2740根據(jù)特征區(qū)域的特征類型來確定特征區(qū)域的圖像壓縮后 的圖像質(zhì)量,將背景區(qū)域的圖像的壓縮后的圖像質(zhì)量確定為低于特征區(qū)域的圖像的壓縮后 的圖像質(zhì)量,并將邊界區(qū)域的圖像的壓縮后的圖像質(zhì)量確定為落入特征區(qū)域的圖像的壓縮 后的圖像質(zhì)量與背景區(qū)域的圖像的壓縮后的圖像質(zhì)量之間。圖像質(zhì)量降低部分2221將特 征區(qū)域、背景區(qū)域和邊界區(qū)域的圖像的圖像質(zhì)量降低為壓縮強度確定部分2740所確定的 圖像質(zhì)量。 更具體地,壓縮強度確定部分2740根據(jù)特征區(qū)域的特征類型來確定特征區(qū)域的 圖像的壓縮后的分辨率,將背景區(qū)域的圖像的壓縮后的分辨率確定為低于特征區(qū)域的圖像 的壓縮后的分辨率,并將邊界區(qū)域的圖像的壓縮后的分辨率確定為落入特征區(qū)域的圖像的
24壓縮后的分辨率與背景區(qū)域的圖像的壓縮后的分辨率之間。圖像質(zhì)量降低部分2221將特 征區(qū)域、背景區(qū)域和邊界區(qū)域的圖像的分辨率降低為壓縮強度確定部分2740所確定的分辨率。 信息量計算部分2720計算特征區(qū)域中包含的主體提供的信息量。例如,在ROI是 臉部區(qū)域的情況下,ROI中的對象具有與人臉相關(guān)的信息,并且信息量計算部分2720計算 該信息的量。例如,信息量可以是指示在該圖像中識別出人臉的容易程度的值。在這種情 況下,信息量可以是人臉的面積或表示人臉的圖像區(qū)域中包括的像素數(shù)目。
壓縮部分2240對特征區(qū)域圖像進行壓縮。這里,隨著信息量的增大,壓縮強度確 定部分2740增大壓縮部分2240對特征區(qū)域圖像進行壓縮的壓縮強度。當人臉在ROI中顯 得足夠大時,ROI通常仍具有足夠高的圖像質(zhì)量,從而即使在以較高強度對ROI進行壓縮之 后也能分辨出臉部,因此其圖像質(zhì)量略微降低。因此,當將與本實施例相關(guān)的圖像處理設(shè)備 2120用于實際使用時,例如在人臉在ROI中顯得足夠大的情況下,以高壓縮率來壓縮ROI。 因此,圖像處理設(shè)備2120能夠防止圖像的數(shù)據(jù)量不必要的增大。 特征區(qū)域檢測部分2203可以將包含以高于預定值的程度滿足預定條件的對象在 內(nèi)的區(qū)域檢測為特征區(qū)域。特征區(qū)域檢測部分2203可以將包含以高于預定值的程度滿足 與圖像所示內(nèi)容相關(guān)的預定條件的對象在內(nèi)的區(qū)域檢測為特征區(qū)域,其中所述預定條件用 于判斷該對象是否是人2130的頭部。 在這種情況下,信息量計算部分2720所計算的信息量可以隨著特征區(qū)域中包含 的對象滿足條件的程度增大而增大。隨著滿足程度的增大,壓縮強度確定部分2740可以增 大壓縮部分2240對特征區(qū)域進行壓縮的壓縮強度。 特征區(qū)域檢測部分2203可以將包含圖案以高于預定匹配度的匹配度與預定圖案 相匹配的對象在內(nèi)的區(qū)域檢測為特征區(qū)域。在這種情況下,信息量計算部分2720所計算的 信息量可以隨著匹配度的增大而增大。隨著匹配度的增大,壓縮強度確定部分2740可以增 大壓縮部分2240對特征區(qū)域進行壓縮的壓縮強度。 信息量計算部分2720可以標識捕捉圖像的圖像捕捉設(shè)備2100與特征區(qū)域中包含 的主體之間的距離。在這種情況下,信息量計算部分2720所計算的信息量可以隨著所標識 距離的減小而增大。此外,信息量計算部分2720所計算的信息量可以隨著特征區(qū)域大小的 增大而增大。 當特征區(qū)域檢測部分2203從圖像檢測具有不同類型特征的多個特征區(qū)域時,信 息量計算部分2720可以分別計算這些特征區(qū)域中包含的主體的信息量。壓縮強度確定部 分2740可以以壓縮率隨信息量增大而增大的方式,針對特征區(qū)域圖像分別確定壓縮強度。 壓縮部分2240可以以壓縮強度確定部分2740所確定的壓縮率來對特征區(qū)域圖像進行壓 縮。 當特征區(qū)域檢測部分2203從運動圖像中包括的每一幅運動圖像分量圖像中檢測 特征區(qū)域時,信息量計算部分2720可以計算每幅運動圖像分量圖像中多個特征區(qū)域中包 含的主體的信息量。壓縮強度確定部分2740可以以壓縮強度隨信息量增大而增大的方式, 確定壓縮部分2240對相應運動圖像分量圖像的特征區(qū)域圖像進行壓縮的壓縮強度。壓縮 部分2240可以以壓縮強度確定部分2740所確定的壓縮強度,對相應運動圖像分量圖像的 特征區(qū)域圖像進行壓縮。
25
相同主體區(qū)域標識部分2730從相應運動圖像分量圖像的特征區(qū)域中,標識包含 相同主體的多個特征區(qū)域。具體而言,相同主體區(qū)域標識部分2730從多幅幀圖像中標識包 含相同人的ROI。 壓縮強度確定部分2740確定用于特征區(qū)域的信息量落入預定信息量范圍內(nèi)的一 幅或更多運動圖像分量圖像中的特征區(qū)域圖像的壓縮強度,相同主體區(qū)域標識部分2730 所標識的特征區(qū)域的信息量中的最大信息量落入所述預定信息量范圍內(nèi),其中,所確定的 壓縮強度低于用于至少一幅不同的運動圖像分量圖像中的特征區(qū)域圖像的壓縮強度。使用 這種配置,例如當運動圖像的一些幀圖像包含許多關(guān)于主體的信息時,以高圖像質(zhì)量來記 錄這些幀圖像,而可以以更高的強度來對包含相同主體的其他幀圖像進行壓縮。因此,與本 實施例相關(guān)的圖像處理系統(tǒng)2010能夠以高圖像質(zhì)量記錄在所需定時捕捉的主體的圖像, 并且可以有效降低運動圖像的數(shù)據(jù)量。 條件獲得部分2752從圖像處理設(shè)備2120外部的源獲得要存儲在條件存儲部分 2750上的信息。具體而言,條件獲得部分2752可以獲得根據(jù)特征區(qū)域的特征而不同的分配 條件,以便根據(jù)特征區(qū)域的特征來分配不同的壓縮強度。具體而言,條件獲得部分2752可 以獲得根據(jù)特征區(qū)域的類型而不同的分配條件。例如,條件獲得部分2752可以獲得根據(jù)特 征區(qū)域的類型而不同的圖像質(zhì)量降低量,即根據(jù)特征區(qū)域的類型而不同的空間分辨率的降 低量、根據(jù)特征區(qū)域的類型而不同的時間分辨率的降低量等等。條件存儲部分2750可以存 儲由條件獲得部分2752獲得的、根據(jù)特征區(qū)域的類型而不同的圖像質(zhì)量降低量。按照這種 方式,條件存儲部分2750可以存儲條件獲得部分2752獲得的分配條件。
條件獲得部分2752可以獲得根據(jù)特征區(qū)域所指示的區(qū)域的特征而不同的分配條 件。具體而言,條件獲得部分2752可以獲得根據(jù)特征區(qū)域的數(shù)目、大小或位置而不同的分 配條件。此外,條件獲得部分2752可以獲得根據(jù)特征區(qū)域圖像中包含的對象的特征而不同 的分配條件。具體而言,條件獲得部分2752可以獲得根據(jù)特征區(qū)域圖像中包含的對象的形 狀、面對方向、運動方向或已運動距離而不同的分配條件。 條件獲得部分2752可以經(jīng)由通信網(wǎng)絡(luò)2110,從圖像處理設(shè)備2170或顯示設(shè)備 2180獲得上述分配條件。例如,圖像處理設(shè)備2170可以向圖像處理設(shè)備2120發(fā)送指示根 據(jù)圖像數(shù)據(jù)庫2175的記錄介質(zhì)的剩余空間而確定的圖像質(zhì)量等級的信息。例如,隨著剩余 空間的減少,圖像處理設(shè)備2170可以降低要發(fā)送至圖像處理設(shè)備2120的信息所指示的圖 像質(zhì)量等級。 圖8使用表示意了條件存儲部分2750上存儲的數(shù)據(jù)的示例。條件存儲部分2750 以與每個參數(shù)相關(guān)聯(lián)的方式存儲空間分辨率索引,所述參數(shù)包括表示所檢測ROI的數(shù)目 的ROI數(shù)目、表示所檢測ROI的面積的ROI面積、表示所檢測ROI的位置的ROI位置、表示 ROI中人臉所朝向的方向的面對方向、以及表示ROI中被識別為臉部對象的對象數(shù)目的臉 部元素數(shù)目。這里,臉部元素數(shù)目可以表示以高于預定匹配度的匹配度與預期臉部中包括 的對象(如眼、口和鼻)相匹配的對象的數(shù)目。 空間分辨率索引可以指示壓縮后的幀圖像的圖像質(zhì)量。具體而言,空間分辨率索 引可以指示壓縮后的幀圖像的分辨率、灰度級數(shù)和顏色數(shù)目中的至少一項,以及指示編碼 單元2230的量化程度的量化系數(shù)。如上所述,空間分辨率索引包括真實空間的分辨率和顏 色空間的分辨率。這里,圖像質(zhì)量隨著空間分辨率索引的增大而提高。
26
參照圖8所示條件存儲部分2750上存儲的數(shù)據(jù),空間分辨率索引可以隨著ROI數(shù) 目的減小而增大。此外,空間分辨率索引可以隨著ROI面積的減小而增大。此外,當R0I位 置指示幀圖像上預定位置與ROI的中心之間的距離時,空間分辨率索引可以隨著該距離的 減小而增大。在這種情況下,隨著ROI的位置變得更接近于預期出現(xiàn)臉部的預定位置,空間 分辨率索引增大。 此外,空間分辨率索引隨著ROI中包含的對象所指示的臉部變?yōu)槌蚋酉蚯皟A 斜的方向而增大。空間分辨率索引可以隨著臉部變?yōu)槌蚋酉蚝蟮姆较蚨鴾p小。此外, 空間分辨率索引可以隨著臉部元素數(shù)目的增大而增大。 當特征區(qū)域檢測部分2203檢測到作為臉部區(qū)域的ROI時,壓縮強度確定部分2740
針對作為臉部區(qū)域的所檢測的ROI,計算如ROI數(shù)目、ROI面積、ROI位置、面對方向和臉部
元素數(shù)目之類的參數(shù)。然后,壓縮強度確定部分2740參考條件存儲部分2750上存儲的數(shù)
據(jù),以計算指示空間分辨率等級的空間分辨率索引。例如,壓縮強度確定部分2740提取條
件存儲部分2750上以與所計算的ROI數(shù)目、ROI面積、R01位置、面對方向和臉部元素數(shù)目
相關(guān)聯(lián)的方式存儲的空間分辨率索引,并計算所提取的空間分辨率索引之和。 壓縮強度確定部分2740隨著該和的增大而增大空間分辨率。壓縮強度確定部分
2740可以參照將分辨率索引之和與空間分辨率相關(guān)聯(lián)的預定表來確定空間分辨率。 作為空間分辨率索引的替代,條件存儲部分2750可以直接存儲分辨率、灰度級
數(shù)、顏色數(shù)目或指示編碼單元2230執(zhí)行的量化程度的量化系數(shù)??臻g分辨率索引可以指示
空間頻帶,在所述空間頻帶內(nèi),預期壓縮后的幀圖像具有顯著的頻率分量。 圖9使用表來示意條件存儲部分2750上存儲的數(shù)據(jù)的不同示例。條件存儲部分
2750以與ROI的運動速度相關(guān)聯(lián)的方式來存儲時間分辨率索引。這里,時間分辨率索引可
以指示壓縮后的運動圖像的時間分辨率。具體而言,時間分辨率索引可以指示壓縮后的運
動圖像的幀率或比特率。這里,時間分辨率可以隨著時間分辨率索引的增大而增大。從圖
9所示的條件存儲部分2750上存儲的數(shù)據(jù)可以看出,時間分辨率索引可以隨著運動速度的
增大而增大。 當特征區(qū)域檢測部分2203從每幅幀圖像中檢測作為臉部區(qū)域的ROI時,壓縮強度 確定部分2740基于每幅幀圖像中ROI的位置來計算ROI的運動速度。壓縮強度確定部分 2740然后提取條件存儲部分2750上以與所計算的運動速度相關(guān)聯(lián)的方式存儲的時間分辨 率索引。然后,壓縮強度確定部分2740根據(jù)所提取的時間分辨率索引來確定時間分辨率。 作為時間分辨率索引的替代,條件存儲部分2750可以直接存儲壓縮后的幀率或比特率。
根據(jù)圖8和9,條件存儲部分2750上存儲的示例圖像質(zhì)量索引值被分配給臉部區(qū) 域ROI。然而,條件存儲部分2750還可以針對人區(qū)域和運動區(qū)域ROI存儲與類似于上述的 參數(shù)相關(guān)聯(lián)的空間分辨率索引和時間分辨率索引。這就是說,以與ROI中預期要包含的每 個對象相關(guān)聯(lián)的方式來指定空間分辨率索引和時間分辨率索引。因此,可以針對幀圖像中 ROI的圖像來分別確定圖像質(zhì)量等級。 如上所述,條件存儲部分2750可以以與每種對象類型相關(guān)聯(lián)的方式,存儲壓縮后 ROI的圖像質(zhì)量或碼量。因此,條件存儲部分2750可以以與每種對象類型相關(guān)聯(lián)的方式,存 儲表示ROI的圖像質(zhì)量、ROI之間壓縮后的碼量之比等等的優(yōu)先級順序。
如上所述,壓縮強度確定部分2740根據(jù)特征區(qū)域的特征,來確定對特征區(qū)域的圖像進行壓縮的壓縮強度。具體而言,壓縮強度確定部分2740根據(jù)特征區(qū)域的特征類型,來 確定對特征區(qū)域的圖像進行壓縮的壓縮強度。壓縮強度確定部分2740將對背景區(qū)域的圖 像進行壓縮的壓縮強度設(shè)置為高于用于特征區(qū)域的圖像的壓縮強度。 條件存儲部分2750存儲根據(jù)特征區(qū)域的類型而不同的空間分辨率降低量,或者 根據(jù)特征區(qū)域的類型而不同的時間分辨率降低量。壓縮控制部分2760根據(jù)特征區(qū)域運動 圖像中包括的特征區(qū)域圖像的特征類型,參照條件存儲部分2750上存儲的空間分辨率降 低量與時間分辨率降低量中的至少一個,來控制圖像質(zhì)量降低部分2221實現(xiàn)的空間或時 間分辨率降低量。 條件存儲部分2750存儲根據(jù)特征區(qū)域所指示的區(qū)域的特征而不同的條件。壓縮 控制部分2760根據(jù)特征區(qū)域所指示的區(qū)域的特征,參照條件存儲部分2750上存儲的條件, 來控制壓縮部分2240分別對特征區(qū)域圖像進行壓縮的壓縮強度。 具體而言,條件存儲部分2750存儲根據(jù)特征區(qū)域的數(shù)目、特征區(qū)域的大小或者特 征區(qū)域的位置而不同的條件。壓縮控制部分2760根據(jù)特征區(qū)域所指示的區(qū)域的數(shù)目、大小 或位置,參照條件存儲部分2750上存儲的條件,來控制壓縮部分2240對相應特征區(qū)域圖像 進行壓縮的壓縮強度。 條件存儲部分2750存儲根據(jù)特征區(qū)域圖像中包含的對象的特征而不同的條件。 壓縮控制部分2760根據(jù)特征區(qū)域圖像中包含的對象的特征,參照條件存儲部分2750上存 儲的條件,來控制壓縮部分2240對相應特征區(qū)域圖像進行壓縮的壓縮強度。
條件存儲部分2750可以存儲根據(jù)特征區(qū)域圖像中包含的對象的形狀、對象的面 對方向、對象的運動方向或者對象的已運動距離而不同的條件。壓縮控制部分2760可以根 據(jù)特征區(qū)域圖像中包含的對象的形狀、對象的面對方向、對象的運動方向或者對象的已運 動距離,參照條件存儲部分2750上存儲的條件,來控制壓縮部分2240對相應特征區(qū)域圖像 進行壓縮的壓縮強度。 圖10使用表示意了信息量計算部分2720上存儲的數(shù)據(jù)的示例。信息量計算部分 2720以與面對方向和臉部元素匹配度相關(guān)聯(lián)的方式來存儲信息量,其中,面對方向表示人 臉朝向的方向,臉部元素匹配度表示ROI中包含的對象與人臉中應當存在的對象相匹配的 程度。 信息量計算部分2720基于表示臉部區(qū)域ROI中包含的人臉的對象的圖像所示的 內(nèi)容來標識面對方向。例如,信息量計算部分2720基于表示人頭部的對象中表示眼、鼻和 口的對象的位置來標識面對方向。信息量計算部分2720隨所標識的面對方向更加向前傾 斜而增大信息量,并且隨所標識的面對方向更加向后而減小信息量。 信息量計算部分2720例如使用模式匹配技術(shù)來計算表示人臉的對象的輪廓與預 定人臉圖案之間的匹配度。信息量計算部分2720隨所計算的匹配度的增大而增大信息量。
如上所述,信息量計算部分2720隨特征區(qū)域中包含的對象滿足預定條件的程度 增大而增大信息量,其中所述預定條件與圖像所示內(nèi)容相關(guān),并且指示特征區(qū)域中包含的 對象是人2130的臉部中應當存在的對象。信息量計算部分2720標識由以高于預定值的程 度滿足預定條件的對象所表示的人2130的頭部的面對方向,并隨所標識的頭部面對方向 與預定方向之間匹配度的增大而增大信息量。 圖11示意了壓縮強度確定部分2740執(zhí)行的確定壓縮強度的示例操作。參照圖
28ll,以下通過坐標軸表示臉部元素匹配度和身體元素匹配度的空間來描述其中壓縮強度確 定部分2740控制壓縮強度的域。這里,身體元素匹配度可以是例如幀圖像中包含的對象的 輪廓與人體的預定圖案之間的匹配度。 特征區(qū)域檢測部分2203針對幀圖像中包含的對象來計算身體元素匹配度和臉部 元素匹配度。這里,定義了連接身體元素匹配度的坐標軸上的點(指示值a)和臉部元素 匹配度的坐標軸上的點(指示值13)的線。關(guān)于這條線,定義不包括空間原點在內(nèi)的域。 當針對該對象而計算的身體元素匹配度和臉部元素匹配度包括在該域內(nèi)時,特征區(qū)域檢測 部分2203將包含該對象的區(qū)域檢測為ROI。關(guān)于圖11描述的方法僅僅是ROI檢測方法之 一。特征區(qū)域檢測部分2203可以使用不同方法來檢測ROI。 針對臉部元素匹配度低于預定值Y的對象,隨著臉部元素匹配度的降低,壓縮強 度確定部分2740減小壓縮強度。備選地,針對臉部元素匹配度大于或等于預定值Y的對 象,隨著臉部元素匹配度的降低,壓縮強度確定部分2740減小壓縮強度。
如上所述,壓縮強度確定部分2740針對包含極可能是人但是極不可能是人臉的 對象在內(nèi)的區(qū)域,確定低壓縮強度。按照這種方式,壓縮強度確定部分2740針對人臉顯得 不夠清晰的ROI,確定低壓縮強度。因此,本實施例能夠避免以高強度來壓縮這種ROI并且 變得更加難以分辨出臉部的情況。在以上關(guān)于圖11的描述中,為使表述簡單,壓縮強度確 定部分2740使用臉部元素匹配度(其為指示信息量的索引之一)來確定壓縮強度。壓縮 強度確定部分2740可以使用不同于臉部元素匹配度的其他信息量索引來確定壓縮強度。
圖12示意了作為示例的信息量計算部分2720所計算的信息量隨時間的變化。參 考標號PI至P15分別與多幅幀圖像相對應。被分配以參考標號PI至P15的每個點指示從 幀圖像P1至P15中相應的一幅檢測到的ROI中包含的相同主體的信息量。從圖12可以看 到,信息量隨著時間的逝去而增大,并且信息量在幀圖像P7中包含的ROI處達到局部最大 值。此后,信息量減小。 當信息量以上述方式變化時,壓縮強度確定部分2740確定用于從幀圖像P1至P15 中檢測到的ROI的壓縮率,以使得通過對從幀圖像P6、P7和P8中檢測到的每個ROI進行壓 縮而獲得的數(shù)據(jù)的信息量超過通過對從其他幀圖像Pl至P5和P9至P15中檢測到的每個 ROI進行壓縮而獲得的數(shù)據(jù)的信息量,其中應當注意,幀圖像P6和P8是在捕捉幀圖像P7的 定時附近的定時捕捉的。此外,壓縮強度確定部分2740確定用于R01的壓縮強度,以使得 在通過對從幀圖像Pl至P5和P9至P15中檢測到的每個ROI進行壓縮而獲得的數(shù)據(jù)中,信 息量實質(zhì)上相同。 具體而言,壓縮強度確定部分2740針對從幀圖像P6至P8中檢測到的ROI確定預 定低壓縮率,使得這些ROI的壓縮以相對不明顯的方式使信息量退化。此外,壓縮強度確定 部分2740針對從不同于幀圖像P6至P8的幀圖像中檢測到的ROI中信息量等于或低于預 定值的ROI (從幀圖像Pl至P3和P12至P15中檢測到的ROI)確定低壓縮率,使得這些ROI 的壓縮以相對不明顯的方式使信息量退化。此外,壓縮強度確定部分2740針對從不同于幀 圖像P6至P8的幀圖像中檢測到的ROI中信息量高于該預定值的ROI (從幀圖像P4、P5、P9、 PlO和Pll中檢測到的ROI)確定高于低壓縮率的中等壓縮率,使得通過對這些ROI中的每 一個進行壓縮而獲得的數(shù)據(jù)的信息量實質(zhì)上等于通過對從幀圖像Pl至P3和P12至P15中 檢測到的每個ROI進行壓縮而獲得的數(shù)據(jù)的信息量。
29
如圖12所示,例如,當人從較遠位置移動至更接近于圖像捕捉設(shè)備2100,然后移 動遠離圖像捕捉設(shè)備2100時,信息量可以隨時間改變。在這種情況下,圖像處理設(shè)備2120 能夠通過以低壓縮率對從幀圖像P6、P7和P8中檢測到的ROI進行壓縮,來記錄人的高質(zhì)量 可靠圖像,并且合理地降低其他幀圖像的圖像質(zhì)量。使用這種配置,圖像處理設(shè)備2120能 夠減少運動圖像的數(shù)據(jù)量,并且可以記錄人的高質(zhì)量圖像。 圖13示意了 ROI的邊界區(qū)域的示例。如上所述,壓縮強度確定部分2740根據(jù)如 ROI類型和ROI數(shù)目之類的參數(shù)來確定ROI的壓縮強度。例如,壓縮強度確定部分2740確 定ROI的分辨率。此外,壓縮強度確定部分2740控制ROI與背景區(qū)域之間的邊界區(qū)域的分辨率。 這里,特征區(qū)域檢測部分2203將由區(qū)域2810、2811和2812組成的區(qū)域檢測為臉 部區(qū)域ROI。特征區(qū)域檢測部分2203還將該臉部區(qū)域附近由區(qū)域2820、2821和2822組成 的區(qū)域檢測為人區(qū)域ROI。按照以上關(guān)于圖1至12所述的方式,壓縮強度確定部分2740確 定用于臉部區(qū)域ROI的分辨率A、用于人區(qū)域R01的分辨率B和用于背景區(qū)域的分辨率C。
在這種情況下,邊界區(qū)域標識部分2710將沿臉部區(qū)域R0I的外圍具有預定寬度的 區(qū)域和沿人區(qū)域ROI的外圍具有預定寬度的區(qū)域標識為邊界區(qū)域。邊界區(qū)域標識部分2710 可以標識ROI之內(nèi)或之外的邊界區(qū)域。備選地,邊界區(qū)域標識部分2710可以標識同時占據(jù) ROI內(nèi)外區(qū)域的邊界區(qū)域。壓縮強度確定部分2740根據(jù)包括邊界區(qū)域在內(nèi)的R01的分辨率 和不同ROI或背景區(qū)域的分辨率來確定背景區(qū)域的分辨率。 具體而言,壓縮強度確定部分2740將分辨率A和B之間的平均分辨率確定為臉部 區(qū)域ROI和人區(qū)域ROI之間的邊界區(qū)域2812和2822的分辨率。此外,壓縮強度確定部分 2740將分辨率A和C之間的平均分辨率確定為臉部區(qū)域ROI和背景區(qū)域之間的邊界區(qū)域 2811的分辨率。此外,壓縮強度確定部分2740將分辨率B和C之間的平均分辨率確定為人 區(qū)域R0I和背景區(qū)域之間的邊界區(qū)域2821的分辨率。注意,壓縮強度確定部分2740可以 針對邊界區(qū)域的分辨率確定以預定梯度逐漸變化的分辨率。 如上所述,邊界區(qū)域標識部分2710將特征區(qū)域與非特征區(qū)域之間的邊界附近的 特征區(qū)域內(nèi)的區(qū)域標識為邊界區(qū)域。這里,邊界區(qū)域標識部分2710可以隨著特征區(qū)域大小 的增大來增大邊界區(qū)域的大小。邊界區(qū)域標識部分2710可以隨著用于特征區(qū)域的圖像的 壓縮強度與用于背景區(qū)域的圖像的壓縮強度之間的差異的增大來增大邊界區(qū)域的大小。
對于彼此位于對方附近的特征區(qū)域,邊界區(qū)域標識部分2710將這些特征區(qū)域之 間的邊界附近的區(qū)域標識為邊界區(qū)域。然后,壓縮強度確定部分2740將用于這些特征區(qū)域 之間的邊界附近的邊界區(qū)域的圖像的壓縮強度確定為落入用于特征區(qū)域之一的圖像的壓 縮強度與用于另一特征區(qū)域的圖像的壓縮強度之間的范圍內(nèi)。壓縮部分2240以壓縮強度 確定部分2740所確定的壓縮強度來對特征區(qū)域之間的邊界附近的邊界區(qū)域的圖像進行壓 縮。 如上所述,壓縮強度確定部分2740將邊界區(qū)域的分辨率設(shè)置為落入ROI的分辨率 與背景區(qū)域的分辨率之間的范圍內(nèi)。使用這種配置,本實施例能夠在由圖像處理設(shè)備2170 產(chǎn)生的組合運動圖像中包括的幀圖像中,使得ROI的分辨率與背景區(qū)域的分辨率之間的差 異不明顯。圖14示意了圖像處理設(shè)備2120的另一示例模塊配置。圖像處理設(shè)備2120包 括壓縮運動圖像獲得部分2201、壓縮運動圖像擴展部分2202、特征區(qū)域檢測部分2203、壓
30縮部分2240、壓縮控制單元2700、關(guān)聯(lián)部分2206和輸出部分207。壓縮部分2240包括圖像 質(zhì)量控制部分2280、圖像質(zhì)量降低部分2281 、多個級間差異(inter-grade difference)壓 縮部分2282a至2282d(以下統(tǒng)稱為級間差異壓縮部分2282)。 壓縮運動圖像獲得部分2201、壓縮運動圖像擴展部分2202、特征區(qū)域檢測部分 2203、壓縮控制單元2700、關(guān)聯(lián)部分2206和輸出部分2207具有與參照圖2至13所述的壓 縮運動圖像獲得部分2201、壓縮運動圖像擴展部分2202、特征區(qū)域檢測部分2203、壓縮控 制單元2700、關(guān)聯(lián)部分2206和輸出部分2207實質(zhì)上相同的功能和操作。因此,以下不解釋 這些組件,除非它們與參照圖2至13描述的其對等物有所差別。 圖像質(zhì)量控制部分2280根據(jù)特征區(qū)域的特征量,控制壓縮運動圖像擴展部分 2202產(chǎn)生的每一幅運動圖像分量圖像中特征區(qū)域的圖像質(zhì)量和非特征區(qū)域的圖像質(zhì)量。
圖像質(zhì)量降低部分2281降低運動圖像的圖像質(zhì)量,并產(chǎn)生具有預定的不同圖像 質(zhì)量的多幅運動圖像。圖像質(zhì)量降低部分2281將所產(chǎn)生的具有不同圖像質(zhì)量的運動圖像 提供給級間差異壓縮部分2282。具體而言,圖像質(zhì)量降低部分2281通過降低運動圖像的 幀率,或降低運動圖像中包括的運動圖像分量圖像的分辨率,來產(chǎn)生具有不同圖像質(zhì)量的 運動圖像。級間差異壓縮部分2282從圖像質(zhì)量降低部分2281分別獲得具有預定的不同圖 像質(zhì)量的運動圖像,并對所獲得的運動圖像進行壓縮。這里,每個級間差異壓縮部分2282 對具有不同圖像質(zhì)量的運動圖像進行壓縮。注意,與特征區(qū)域圖像(其為提供給級間差異 壓縮部分2282b至2282d的運動圖像中包括的運動圖像分量圖像)相比,提供給級間差異 壓縮部分2282a的運動圖像中包括的運動圖像分量圖像具有較低的圖像質(zhì)量。這就是說, 圖像質(zhì)量降低部分2281產(chǎn)生具有比提供給級間差異壓縮部分2282b至2282d的特征區(qū)域 圖像更低圖像質(zhì)量的低圖像質(zhì)量圖像,并將這些低圖像質(zhì)量圖像提供給級間差異壓縮部分 2282a。 如上所述,級間差異壓縮部分2282a從圖像質(zhì)量降低部分2281獲得具有比級間差 異壓縮部分2282b至2282d中任一個所接收的運動圖像分量圖像更低分辨率的運動圖像 分量圖像,并對所獲得的運動圖像分量圖像進行壓縮。級間差異壓縮部分2282b至2282d 從圖像質(zhì)量降低部分2281獲得運動圖像分量圖像并對所獲得的運動圖像分量圖像進行壓 縮。這里,運動圖像分量圖像的分辨率以級間差異壓縮部分2282b、2282c和2282d的順序 依次變高。 級間差異壓縮部分2282b對經(jīng)過級間差異壓縮部分2282a壓縮的運動圖像分量圖 像進行擴展,并將得到的運動圖像分量圖像放大至與從圖像質(zhì)量降低部分2281獲得的運 動圖像分量圖像具有相同的分辨率。級間差異壓縮部分2282b對放大的運動圖像分量圖像 與從圖像質(zhì)量降低部分2281獲得的運動圖像分量圖像之間的差分圖像進行壓縮。這里,級 間差異壓縮部分2282b產(chǎn)生在特征區(qū)域中具有差分值但在非特征區(qū)域中不具有差分值的 差分圖像,并對所產(chǎn)生的差異圖像進行壓縮。 級間差異壓縮部分2282c對經(jīng)過級間差異壓縮部分2282b壓縮的運動圖像分量圖 像進行擴展,并將得到的運動圖像分量圖像放大至與從圖像質(zhì)量降低部分2281獲得的運 動圖像分量圖像具有相同的分辨率。級間差異壓縮部分2282c對放大的運動圖像分量圖像 與從圖像質(zhì)量降低部分2281獲得的運動圖像分量圖像之間的差分圖像進行壓縮。這里,級 間差異壓縮部分2282c產(chǎn)生在至少一些特征區(qū)域中具有差分值但在不同于上述一些特征
31區(qū)域的區(qū)域中不具有差分值的差分圖像,并對所產(chǎn)生的差分圖像進行壓縮。這里,上述一些 特征區(qū)域是根據(jù)特征區(qū)域的特征量來選擇的。 級間差異壓縮部分2282d對經(jīng)過級間差異壓縮部分2282c壓縮的運動圖像分量圖 像進行擴展,并將得到的運動圖像分量圖像放大至與從圖像質(zhì)量控制部分2280獲得的運 動圖像分量圖像具有相同的分辨率。級間差異壓縮部分2282d對放大的運動圖像分量圖像 與從圖像質(zhì)量控制部分2280獲得的運動圖像分量圖像之間的差分圖像進行壓縮。這里,級 間差異壓縮部分2282d產(chǎn)生在至少一些特征區(qū)域中具有差分值但在不同于上述一些特征 區(qū)域的區(qū)域中不具有差分值的差分圖像,并對所產(chǎn)生的差分圖像進行壓縮,其中,上述一些 特征區(qū)域是根據(jù)特征量來選擇的。 如上所述,級間差異壓縮部分2282b至2282d中的每一個通過計算從圖像質(zhì)量控 制部分2280或圖像質(zhì)量降低部分2281接收到的運動圖像分量圖像與通過對具有較低分 辨率的運動圖像分量圖像進行放大而獲得的運動圖像分量圖像之間的差異,來產(chǎn)生差分圖 像。關(guān)聯(lián)部分2206將通過級間差異壓縮部分2282a至2282d的壓縮操作而獲得的包括運 動圖像分量圖像在內(nèi)的壓縮運動圖像數(shù)據(jù)與標識特征區(qū)域的信息相關(guān)聯(lián)。輸出部分2207 向圖像處理設(shè)備2170輸出由關(guān)聯(lián)部分2206與標識特征區(qū)域的信息相關(guān)聯(lián)的壓縮運動圖像 數(shù)據(jù)。因此,圖像處理設(shè)備2120可以提供已根據(jù)特征區(qū)域的特征量進行了可縮放壓縮和編 碼的運動圖像。 圖15A示意了級間差異壓縮部分2282a和2282b的示例模塊配置。圖15B示意了 運動分析部分2285a和差異處理部分2287a的示例模塊配置。圖15C示意了運動分析部分 2285b和差異處理部分2287b的示例模塊配置。級間差異壓縮部分2282a包括運動分析部分 2285a、運動編碼部分2286a、差異處理部分2287a和編碼部分2288a。運動分析部分2285a 包括差異目標區(qū)域確定部分2294a和位置差信息產(chǎn)生部分2295a。差異處理部分2287a包 括差分像素圖像產(chǎn)生部分2296a、空間頻率域變換部分2297a和量化部分2298a。
級間差異壓縮部分2282b包括運動分析部分2285b、運動編碼部分2286b、差異處 理部分2287b、圖像放大部分2293b、圖像解碼部分2292b、像素值改變部分2291b和編碼部 分2288b。運動分析部分2285b包括差異目標區(qū)域確定部分2294b和位置差信息產(chǎn)生部 分2295b。差異處理部分2287b包括差分像素圖像產(chǎn)生部分2296b、空間頻率域變換部分 2297b、量化部分2298b和頻域圖像質(zhì)量轉(zhuǎn)換部分2299b。注意,級間差異壓縮部分2282c和 2282d具有與級間差異壓縮部分2282b實質(zhì)上相同的組件,因此這里不再說明。
以下描述級間差異壓縮部分2282a的組件的功能和操作。運動分析部分2285a從 圖像質(zhì)量降低部分2281接收運動圖像分量圖像,基于所接收的運動圖像分量圖像所示的 內(nèi)容來分析多幅運動圖像分量圖像之間的運動,并參照所分析的運動來確定運動圖像分量 圖像中要壓縮的部分區(qū)域。 具體而言,差異目標區(qū)域確定部分2294a參照該部分區(qū)域中運動圖像分量圖像的 像素值,并且在運動圖像分量圖像是通過計算其與不同運動圖像分量圖像的差異來壓縮的 情況下,確定該不同運動圖像分量圖像中的該部分區(qū)域,,該不同運動圖像分量圖像是要進 行比較以計算差異的差異目標圖像。差異目標區(qū)域確定部分2294a將要壓縮的運動圖像分 量圖像的該部分區(qū)域的像素信息和差異目標圖像的該部分區(qū)域的像素信息提供給差異處 理部分2287a。
位置差信息產(chǎn)生部分2295a產(chǎn)生位置差信息,指示要壓縮的該部分區(qū)域與差異目標圖像中該部分區(qū)域之間的位置差異。具體而言,位置差信息產(chǎn)生部分2295a產(chǎn)生與運動補償技術(shù)一起使用的運動矢量。位置差信息產(chǎn)生部分2295a將產(chǎn)生的位置差信息提供給運動編碼部分2286a。 運動編碼部分2286a對從位置差信息產(chǎn)生部分2295a提供的位置差信息進行編
碼,并將編碼的位置差信息提供給關(guān)聯(lián)部分2206。例如,運動編碼部分2286a對多條相鄰部
分區(qū)域的位置差信息之間的差異進行編碼,并將結(jié)果提供給關(guān)聯(lián)部分2206。 差異處理部分2287a基于從運動分析部分2285a接收到的要壓縮的部分區(qū)域的像
素信息和差異目標圖像中該部分區(qū)域的像素信息間的差,對要壓縮的部分區(qū)域的圖像進行
壓縮。具體而言,差分像素圖像產(chǎn)生部分2296a基于要壓縮的部分區(qū)域的像素信息與差異
目標圖像中該部分區(qū)域的像素信息之間的差異,來產(chǎn)生差分像素圖像。 空間頻率域變換部分2297a將每個部分區(qū)域的差分像素圖像變換至空間頻率域。
具體而言,空間頻率域變換部分2297a使用離散余弦變換(DCT),將每個部分區(qū)域的差分像
素圖像變換至空間頻率域。這里,空間頻率域變換部分2297a可以使用包括哈達瑪變換和
小波變換在內(nèi)的各種頻率變換技術(shù),將每個部分區(qū)域的差分像素圖像變換至空間頻率域。 當運動分析部分2285a判定運動圖像分量圖像中的部分區(qū)域不是使用其與不同
運動圖像分量圖像中的部分區(qū)域的差異來壓縮時,差異處理部分2287a將要壓縮的部分區(qū)
域的像素信息提供給空間頻率域變換部分2297a??臻g頻率域變換部分2297a如上所述將
每個部分區(qū)域的像素信息變換至空間頻率域。 量化部分2298a對由于空間頻率域變換部分2297a所執(zhí)行的變換至空間頻率域的操作而獲得的變換系數(shù)進行量化。編碼部分2288a對量化部分2298a所獲得的量化的變換系數(shù)進行編碼,以對量化的變換系數(shù)進行壓縮。例如,編碼部分2288a通過熵編碼(如霍夫曼編碼和算術(shù)編碼)來對量化部分2298a所獲得的量化的變換系數(shù)進行編碼。編碼部分2288a將編碼的運動圖像提供給關(guān)聯(lián)部分2206。 以下描述級間差異壓縮部分2282b的組件的功能和操作。這里,級間差異壓縮部分2282b的一些組件被分配以與級間差異壓縮部分2282a的組件相同的參考標號,并具有與級間差異壓縮部分2282a中其對應組件類似的功能和操作。因此以下不描述這種組件,除非其有所區(qū)別。 對于從圖像質(zhì)量降低部分2281接收的每一幅運動圖像分量圖像,與差異目標區(qū)域確定部分2294a類似,差異目標區(qū)域確定部分2294b標識不同運動圖像分量圖像中要進行比較以計算其與要壓縮的運動圖像分量圖像中的部分區(qū)域的差異的部分區(qū)域。如上所述,針對特征區(qū)域圖像中的部分區(qū)域,差異目標區(qū)域確定部分2294b確定由不同運動圖像分量圖像產(chǎn)生的特征區(qū)域圖像中包括的并且要進行比較以計算其與該特征區(qū)域圖像中的該部分區(qū)域的差異的部分區(qū)域。差異目標區(qū)域確定部分2294b將要壓縮的部分區(qū)域的像素信息和差異目標圖像中該部分區(qū)域的像素信息提供給像素值改變部分2291b。
圖像解碼部分2292b從編碼部分2288a獲得運動圖像分量圖像,并且從運動編碼部分2286a獲得位置差信息。圖像解碼部分2292b根據(jù)從運動編碼部分2286a獲得的位置差信息,對從編碼部分2288a獲得的運動圖像分量圖像進行解碼。圖像解碼部分2292b可以獲得已經(jīng)由量化部分2298a量化的運動圖像分量圖像,并對所獲得的運動圖像分量圖像
33進行解碼,或者可以獲得已經(jīng)由編碼部分2288a編碼的運動圖像分量圖像,并對所獲得的運動圖像分量圖像進行解碼。 圖像放大部分2293b對已經(jīng)由圖像解碼部分2292b解碼的運動圖像分量圖像進行放大,以產(chǎn)生放大圖像。像素值改變部分2291b將未包含在特征區(qū)域中的部分區(qū)域的像素值替換為放大圖像中部分區(qū)域的像素值,而不改變包含特征區(qū)域的部分區(qū)域的像素值,其中,兩個部分區(qū)域均由差異目標區(qū)域確定部分2294b來確定。按照這種方式,像素值改變部分2291b基于所接收的運動圖像分量圖像來產(chǎn)生特征區(qū)域圖像,特征區(qū)域圖像中非特征區(qū)域的像素值已經(jīng)被放大圖像的像素值所替代。 差異處理部分2287b從像素值改變部分2291b接收要壓縮的特征區(qū)域圖像、作為該特征區(qū)域圖像中包含的部分區(qū)域的差異目標的部分區(qū)域的圖像信息、以及放大圖像。差異處理部分2287b隨后針對要壓縮的特征區(qū)域圖像中包含的每個部分區(qū)域,選擇以下三種編碼技術(shù)之一,其中這三種編碼技術(shù)包括幀內(nèi)編碼、幀間編碼和級間編碼。幀內(nèi)編碼使用包含該部分區(qū)域的特征區(qū)域圖像的像素信息來對該部分區(qū)域進行編碼。幀間編碼根據(jù)該部分區(qū)域與不同運動圖像分量圖像中包含的差異目標部分區(qū)域之間的差異來對該部分區(qū)域進行編碼。級間編碼根據(jù)該部分區(qū)域與放大圖像之間的差異來對該部分區(qū)域進行編碼。在進行選擇時,差異處理部分2287b對實現(xiàn)最小碼量的編碼方法給予優(yōu)先。注意,差異處理部分2287b針對非特征區(qū)域選擇級間編碼,這是由于非特征區(qū)域中的像素值被替換為沒有差異。因此,以下首先描述級間編碼,隨后解釋幀間編碼和幀內(nèi)編碼。 當差異處理部分2287b選擇級間編碼時,差分像素圖像產(chǎn)生部分2296b產(chǎn)生表示特征區(qū)域圖像與放大圖像之間的像素值差異的差分像素圖像。具體而言,差分像素圖像產(chǎn)生部分2296b基于其中非特征區(qū)域中的像素值被替換的特征區(qū)域圖像與放大圖像之間的差異來產(chǎn)生差分像素圖像。由于特征區(qū)域圖像的非特征區(qū)域中的像素值被替換為放大圖像的像素值,因此差分像素圖像產(chǎn)生部分2296b可以產(chǎn)生在特征區(qū)域中具有表示特征區(qū)域圖像與放大圖像之間的像素值差異的差分值并且在非特征區(qū)域中不具有這種差分值的差分像素圖像。 當差異處理部分2287b選擇幀間編碼時,差分像素圖像產(chǎn)生部分2296b計算像素值改變部分2291b基于運動圖像分量圖像產(chǎn)生的特征區(qū)域圖像與像素值改變部分2291b基于不同運動圖像分量圖像產(chǎn)生的特征區(qū)域圖像之間的差異。具體而言,差分像素圖像產(chǎn)生部分2296b計算特征區(qū)域中包含的部分區(qū)域的圖像與差異目標區(qū)域確定部分2294b針對該部分區(qū)域所確定的差異目標部分區(qū)域的圖像之間的差異。由于特征區(qū)域圖像中非特征區(qū)域中的像素值被替換為放大圖像的像素值,差分像素圖像產(chǎn)生部分2296b可以產(chǎn)生在特征區(qū)域中包含的部分區(qū)域中具有表示該部分區(qū)域與由差異目標區(qū)域確定部分2294b所確定的部分區(qū)域之間的像素值差異的差分值并且在非特征區(qū)域中具有表示非特征區(qū)域與由差異目標區(qū)域確定部分2294b所確定的部分區(qū)域之間的像素值差異的差分值的差分像素圖像。
當差異處理部分2287b選擇幀內(nèi)編碼時,差分像素圖像產(chǎn)生部分2296b通過計算每幅特征區(qū)域圖像中包含的該部分區(qū)域的圖像與特征區(qū)域圖像的不同區(qū)域之間的像素值差異,或者每幅特征區(qū)域圖像中包含的該部分區(qū)域的圖像與特征區(qū)域圖像的相同部分區(qū)域之間的像素值差異,來產(chǎn)生差分像素圖像。 空間頻率域變換部分2297b將每個部分區(qū)域的差分像素圖像變換至空間頻率域。
34具體而言,與空間頻率域變換部分2297a類似,空間頻率域變換部分2297b使用DCT、哈達瑪變換或小波變換,將每個部分區(qū)域的差分像素圖像所表示的差分值變換至空間頻率域。與量化部分2298b類似,量化部分2298b對由于空間頻率域變換部分2297b執(zhí)行的至空間頻率域的變換而獲得的變換系數(shù)進行量化。 頻域圖像質(zhì)量改變部分2299b從通過空間頻率域變換部分2297b執(zhí)行的空間頻率
域變換而獲得的相應部分區(qū)域的空間頻率分量中減少包含非特征區(qū)域在內(nèi)的至少一些部
分區(qū)域的空間頻率分量的數(shù)據(jù)量,來產(chǎn)生特征區(qū)域差異圖像。具體而言,頻域圖像質(zhì)量改變
部分2299b減少指示高于預定頻率的頻率分量的變換系數(shù)的值。頻域圖像質(zhì)量改變部分
2299b可以將指示高于預定頻率的頻率分量的變換系數(shù)的值設(shè)置為0。 如上所述,差異處理部分2287b產(chǎn)生在特征區(qū)域中具有通過將特征區(qū)域圖像與放
大圖像之間的差異變換至空間頻率域而獲得的空間頻率分量并且在非特征區(qū)域中具有數(shù)
據(jù)量減少的空間頻率分量的特征區(qū)域差異圖像。編碼部分2288b對差異處理部分2287b產(chǎn)
生的特征區(qū)域差異圖像進行編碼。 同樣如上所述,差異處理部分2287b產(chǎn)生表示特征區(qū)域圖像中特征區(qū)域的圖像與
低圖像質(zhì)量圖像中特征區(qū)域的圖像之間的差分圖像的特征區(qū)域差異圖像。具體而言,差異
處理部分2287b產(chǎn)生表示特征區(qū)域圖像中特征區(qū)域的圖像與通過對低圖像質(zhì)量圖像中特
征區(qū)域的圖像進行放大而獲得的圖像之間的差異的特征區(qū)域差異圖像。 根據(jù)以上描述,像素值改變部分2291b將非特征區(qū)域的像素值替換為放大圖像的
像素值,從而差分像素圖像在至少非特征區(qū)域中具有為0的差分值,其中非特征區(qū)域不同
于具有預定類型特征的特征區(qū)域,也不同于具有期望具有高于特征區(qū)域的分辨率的特定類
型特征的特征區(qū)域。然而,像素值改變部分2291b可以使用不同的方法將差分像素圖像中
的差分值設(shè)置為O。 例如,像素值改變部分2291b可以將從圖像質(zhì)量降低部分2281獲得的運動圖像分量圖像中非特征區(qū)域的像素值改變?yōu)轭A定像素值,并且將放大圖像中相同圖像區(qū)域的像素值改變?yōu)樵擃A定像素值。這種備選方法還產(chǎn)生了以下效果差分像素圖像在非特征區(qū)域中具有為0的差分值,從而實質(zhì)上減少了非特征區(qū)域的信息量。 如上所述,像素值改變部分2291b通過將運動圖像分量圖像中非特征區(qū)域的像素值替換為預定值,并將放大圖像中非特征區(qū)域的像素值替換為該預定值,來產(chǎn)生特征區(qū)域圖像。差分像素圖像產(chǎn)生部分2296b通過計算特征區(qū)域圖像與放大圖像之間的差異來產(chǎn)生差分像素圖像,在特征區(qū)域圖像和放大圖像中,非特征區(qū)域中的像素值已經(jīng)被替換。
像素值改變部分2291b可以將從圖像質(zhì)量降低部分2281獲得的運動圖像分量圖像的非特征區(qū)域的像素值替換為通過對提供給較低級的級間差異壓縮部分2282 (例如級間差異壓縮部分2282a)的運動圖像分量圖像進行放大而獲得的圖像中相同區(qū)域的像素值。這種備選方法也使差分像素圖像能夠在非特征區(qū)域中具有實質(zhì)上為0的差分值,從而實質(zhì)上減少了非特征區(qū)域的信息量。 位置差信息產(chǎn)生部分2295b產(chǎn)生指示非特征區(qū)域中包含的差異目標部分區(qū)域的位置差異的位置差信息。具體而言,與位置差信息產(chǎn)生部分2295a類似,位置差信息產(chǎn)生部分2295b產(chǎn)生指示要通過計算差異來壓縮的部分區(qū)域與要進行比較以計算差異的差異目標部分區(qū)域之間的位置差異的位置差信息。這里,位置差信息包括與運動補償一起使用的運動矢量。 位置差信息改變部分2290b改變位置差信息,使得位置差信息指示非特征區(qū)域中包含的部分區(qū)域與相同位置的部分區(qū)域進行比較以計算差異。具體而言,位置差信息改變部分2290b將非特征區(qū)域中包含的該部分區(qū)域的位置差信息改變?yōu)橹甘静淮嬖谖恢貌町惖奈恢貌钚畔?。位置差信息改變部?290b從運動編碼部分2286a獲得位置差信息,并將非特征區(qū)域中包含的該部分區(qū)域的位置差信息改變?yōu)橹甘静淮嬖谖恢貌町惖男畔?。具體而言,位置差信息改變部分2290b將非特征區(qū)域的運動矢量的值設(shè)置為0。例如,位置差信息改變部分2290b將從位置差信息產(chǎn)生部分2295b接收到的非特征區(qū)域的運動矢量的值設(shè)置為0,并將從運動編碼部分2286a接收到的非特征區(qū)域的運動矢量的值設(shè)置為0。
運動編碼部分2286b對位置差信息進行編碼。具體而言,與運動編碼部分2286a類似,運動編碼部分2286b對多條相鄰部分區(qū)域的位置差信息之間的差異進行編碼。運動編碼部分2286b將編碼的位置差信息提供給關(guān)聯(lián)部分2206。 在本實施例中,位置差信息改變部分2290改變非特征區(qū)域的位置差信息。位置差信息改變部分2290b可以通過運動編碼部分2286b使用的編碼格式來改變非特征區(qū)域的位置差信息。這就是說,位置差信息改變部分2290b可以改變已經(jīng)由運動編碼部分2286編碼的位置差信息,使得改變后的位置差信息指示非特征區(qū)域中包含的部分區(qū)域與相同位置的部分區(qū)域進行比較以計算差異。 編碼部分2288b可以產(chǎn)生在非特征區(qū)域中不具有差異信息的編碼數(shù)據(jù)。具體而言,編碼部分2288b可以產(chǎn)生在非特征區(qū)域中包含的部分區(qū)域中不具有差異信息的編碼數(shù)據(jù)。運動編碼部分2286b可以產(chǎn)生針對非特征區(qū)域中包含的部分區(qū)域不具有位置差信息的編碼數(shù)據(jù)。如上所述,編碼部分2288b和運動編碼部分2286b產(chǎn)生編碼數(shù)據(jù),該編碼數(shù)據(jù)通過不具有差異信息和位置差信息來指示該非特征區(qū)域示出了與不同運動圖像分量圖像中相同區(qū)域相同的圖像。例如,編碼部分2288b和運動編碼部分2286b可以產(chǎn)生包括部分區(qū)域類型的編碼數(shù)據(jù),部分區(qū)域類型指示該非特征區(qū)域中包含的部分區(qū)域示出了與不同運動圖像分量圖像中相同區(qū)域相同的圖像。 例如,編碼部分2288b和運動編碼部分2286b可以產(chǎn)生包括部分區(qū)域類型的編碼數(shù)據(jù),部分區(qū)域類型指示了非特征區(qū)域中包含的部分區(qū)域是使用基于簡單幀間預測編碼并不具有轉(zhuǎn)換系數(shù)的編碼模式來編碼的。例如,部分區(qū)域類型可以與MPEG編碼技術(shù)的非MC不編碼(Non MC Not Coded)模式相對應。如上所述,由于編碼部分2288b和運動編碼部分2286b產(chǎn)生編碼數(shù)據(jù),該編碼數(shù)據(jù)沒有指示運動矢量的值和差異信息被設(shè)為0的信息,因此,本實施例可以進一步減少編碼的運動圖像分量圖像的碼量。這里,在確定包括上述編碼模式的預測模式時,級間差異壓縮部分2282b可以基于不定乘數(shù)的拉格朗日方法來選擇可以將率失真代價最小化的預測模式。 級間差異壓縮部分2282c和2282d均包括與級間差異壓縮部分2282b的組件具有相同功能的組件。在以下描述中,級間差異壓縮部分2282c和2282d中具有與級間差異壓縮部分2282b的對應組件相同名稱的組件被分配以相同參考標號,其中將字母b、 c和d添加至參考標號以表示級間差異壓縮部分2282b、2282c和2282d中相應組件的所屬關(guān)系。
例如,運動分析部分2285c是級間差異壓縮部分2282c的組件之一,運動分析部分2285d是級間差異壓縮部分2282d的組件之一。在以下描述中,不帶字母的參考標號指代級
36間差異壓縮部分2282b至2282d的所有對應組件。例如,像素值改變部分2291表示像素值改變部分2291b至2291d。 在操作和功能方面,級間差異壓縮部分2282c和2282d與級間差異壓縮部分2282b在以下方面有所差異。級間差異壓縮部分2282c和2282d從圖像質(zhì)量降低部分2281獲得與從級間差異壓縮部分2282b所獲得的運動圖像相比具有不同圖像質(zhì)量的運動圖像,并對所獲得的運動圖像進行處理,位置差信息改變部分2290c和2290d以及圖像解碼部分2292c和2292d從被設(shè)計用于處理具有較低圖像質(zhì)量的運動圖像的不同級間差異壓縮部分282獲得位置差信息和運動圖像分量圖像以用于差分處理。 更具體地,位置差信息改變部分2290c從運動編碼部分2286b獲得位置差信息,并改變所獲得的位置差信息。圖像解碼部分2292c從運動編碼部分2286b獲得位置差信息,從編碼部分2288b獲得運動圖像分量圖像,并使用所獲得的位置差信息來對所獲得的運動圖像分量圖像進行解碼。位置差信息改變部分2290d從運動編碼部分2286c獲得位置差信息,并改變所獲得的位置差信息。圖像解碼部分2292d從運動編碼部分2286c獲得位置差信息,從編碼部分2288c獲得運動圖像分量圖像,并使用所獲得的位置差信息來對所獲得的運動圖像分量圖像進行解碼。特征區(qū)域檢測部分2203從輸入的運動圖像分量圖像中檢測具有多種特征類型的多個特征區(qū)域。在這種情況下,圖像質(zhì)量降低部分2281通過降低具有特定類型特征的特征區(qū)域的分辨率來由輸入的運動圖像分量圖像產(chǎn)生特征區(qū)域圖像,并由輸入的運動圖像分量圖像產(chǎn)生在具有不同類型特征的特征區(qū)域中具有高于上述特征區(qū)域圖像的分辨率的不同特征區(qū)域圖像。級間差異壓縮部分2282b至2282d以一一對應的方式與特征類型相關(guān)聯(lián)。級間差異壓縮部分2282b至2282d中每一個對特征區(qū)域圖像進行壓縮,該特征區(qū)域圖像中至少具有預定類型特征的特征區(qū)域具有與非特征區(qū)域不同的分辨率。
具體而言,級間差異壓縮部分2282b對在所有特征區(qū)域中具有最低分辨率的低分辨率特征區(qū)域圖像進行處理。級間差異壓縮部分2282c對在預定特征類型的特征區(qū)域中具有高于低分辨率特征區(qū)域圖像的分辨率的中等分辨率特征區(qū)域圖像進行處理。級間差異壓縮部分2282d對在不同預定特征類型的特征區(qū)域中具有高分辨率的高分辨率特征區(qū)域圖像進行處理。 如上所述,差異處理部分2287產(chǎn)生在具有特定類型特征的特征區(qū)域和具有不同類型特征的特征區(qū)域中具有通過將特征區(qū)域圖像與放大圖像之間的差異變換至空間頻率域而獲得的空間頻率分量并且在其余區(qū)域中具有數(shù)據(jù)量減少的空間頻率分量的特征區(qū)域差異圖像。 如上所述,差異處理部分2287產(chǎn)生在具有特定類型特征的特征區(qū)域中具有通過將特征區(qū)域圖像與放大圖像之間的差異變換至空間頻率域而獲得的空間頻率分量并且在其余區(qū)域中具有數(shù)據(jù)量減少的空間頻率分量的特征區(qū)域差異圖像,并產(chǎn)生在具有不同類型特征的特征區(qū)域中具有通過將不同特征區(qū)域圖像與通過對不同特征區(qū)域圖像中的特征區(qū)域進行放大而獲得的圖像之間的差異變換至空間頻率域而獲得的空間頻率分量并且在其余區(qū)域中具有數(shù)據(jù)量減少的空間頻率分量的特征區(qū)域間差異圖像。 編碼部分2288對特征區(qū)域差異圖像、特征區(qū)域間差異圖像和低圖像質(zhì)量圖像進行編碼。關(guān)聯(lián)部分2206將運動編碼部分2286a至2286d編碼的位置差信息和編碼部分2288a至2288d編碼的運動圖像分量圖像(例如低圖像質(zhì)量圖像、特征區(qū)域差異圖像、特征
37區(qū)域間差異圖像)與標識特征區(qū)域的信息相關(guān)聯(lián)。 如上所述,級間差異壓縮部分2282a產(chǎn)生在包括特征區(qū)域在內(nèi)的整個區(qū)域中圖像質(zhì)量降低的運動圖像分量圖像,換言之,產(chǎn)生包含輸入的運動圖像分量圖像的低空間頻率分量的運動圖像分量圖像。級間差異壓縮部分2282b產(chǎn)生的運動圖像分量圖像所具有的頻率分量高于級間差異壓縮部分2282a的頻率分量并且低于級間差異壓縮部分2282c的頻率分量。級間差異壓縮部分2282b產(chǎn)生其中表示運動圖像分量圖像與由級間差異壓縮部分2282a產(chǎn)生的運動圖像分量圖像之間的差異的差分值在非特征區(qū)域中減小的運動圖像分量圖像。 類似地,級間差異壓縮部分2282c產(chǎn)生的運動圖像分量圖像所具有的頻率分量高于級間差異壓縮部分2282b的頻率分量并且低于級間差異壓縮部分2282d的頻率分量。級間差異壓縮部分2282d產(chǎn)生的運動圖像分量圖像的頻率分量高于級間差異壓縮部分2282c。級間差異壓縮部分2282c和2282d產(chǎn)生其中表示運動圖像分量圖像與由級間差異壓縮部分2282b和2282c產(chǎn)生的運動圖像分量圖像之間的相應差異的差分值在非特征區(qū)域中的運動圖像分量圖像。 如上所述,級間差異壓縮部分2282b、2282c和2282d中的每一個對其中具有預定類型特征的特征區(qū)域具有高于其余區(qū)域的圖像質(zhì)量的運動圖像進行處理。因此,級間差異壓縮部分2282b、2282c和2282d可以向外提供圖像質(zhì)量根據(jù)特征類型而不同的運動圖像。這里,級間差異壓縮部分2282b、2282c和2282d中的每一個可以通過對其運動圖像分量圖像與由級間差異壓縮部分2282b、2282c和2282d中不同的一個處理的、具有較低圖像質(zhì)量的運動圖像分量圖像之間的差異進行壓縮,來高效地壓縮運動圖像。 在檢測每個特征區(qū)域的特征量時,特征區(qū)域檢測部分2203可以針對每個特征區(qū)
域來計算指示該特征區(qū)域有多可靠的可靠性程度。級間差異壓縮部分2282b、2282c和
2282d中的每一個對分辨率根據(jù)特征區(qū)域的特征量和可靠性程度而調(diào)整的特征區(qū)域的圖像
進行壓縮。例如,圖像質(zhì)量降低部分2281可以根據(jù)特征區(qū)域的特征量和可靠性程度,對每
個特征區(qū)域的圖像的分辨率進行調(diào)整,并將調(diào)整后的圖像提供給級間差異壓縮部分2282
中相應的一個。例如,圖像質(zhì)量降低部分2281可以隨著可靠性程度的降低而提高每幅特征
區(qū)域圖像的圖像分辨率,其中調(diào)整后的分辨率高于根據(jù)特征量的預定分辨率。 如上所述,圖像處理設(shè)備2120通過對具有不同分辨率的不同級的圖像之間的差
異進行編碼,來執(zhí)行分級編碼。從這種配置中顯而易見,圖像處理設(shè)備2120使用的壓縮方
法部分包括H. 264/SVC的壓縮方法。在對這種分級布置的壓縮運動圖像進行擴展時,圖像
處理設(shè)備2170逐一對多份相應級的運動圖像數(shù)據(jù)進行解碼,以獲得多幅與每一級相關(guān)聯(lián)
的運動圖像分量圖像。然后,圖像處理設(shè)備2170將所獲得的、使用級間差異來編碼的運動
圖像分量圖像的區(qū)域和與用于比較以計算級間差異的不同級相關(guān)聯(lián)的運動圖像分量圖像
的區(qū)域相加在一起。按照這種方式,圖像處理設(shè)備2170可以針對每一級產(chǎn)生運動圖像中包
含的多幅運動圖像分量圖像。 圖16示意了與不同實施例相關(guān)的圖像處理系統(tǒng)2020的示例配置。與本實施例相關(guān)的圖像處理系統(tǒng)2020以與圖1所示的圖像處理系統(tǒng)2010相同的方式配置,但是使用圖像捕捉設(shè)備2100a至2100c中包括的圖像處理部分2604a至2604c (以下統(tǒng)稱為圖像處理部分2604)來替換圖像處理設(shè)備2120a至2120c。
38
圖像處理部分2604包括圖像處理設(shè)備2120的組件,除壓縮運動圖像獲得部分2201和壓縮運動圖像擴展部分2202以外。圖像處理部分2604的組件可以具有與圖像處理設(shè)備2120的相應組件實質(zhì)上相同的功能和操作,但是圖像處理部分2604的組件處理圖像捕捉部分2102捕捉的捕捉運動圖像,而圖像處理設(shè)備2120的組件處理通過壓縮運動圖像擴展部分2202的擴展操作而獲得的捕捉運動圖像。具有上述配置的圖像處理系統(tǒng)2020可以產(chǎn)生與關(guān)于圖1至15所述的圖像處理系統(tǒng)2010相同的效果。 圖像捕捉設(shè)備2100中包括的條件獲得部分2752可以從圖像捕捉設(shè)備2100的用戶而不是從圖像處理設(shè)備2170獲得上述分配條件。例如,圖像捕捉設(shè)備2100可以具有用于顯示設(shè)置屏幕的顯示設(shè)備,并且該顯示設(shè)備可以顯示用于設(shè)置分配條件的設(shè)置屏幕,以便根據(jù)相應對象來分配不同的圖像質(zhì)量。條件獲得部分2752可以通過該設(shè)置屏幕從用戶獲得分配條件。例如,條件獲得部分2752可以通過在設(shè)置屏幕仍顯示在顯示設(shè)備上時獲取用戶操作產(chǎn)生的信息,來獲得分配條件。 圖像處理部分2604可以從圖像捕捉部分2102獲得包括具有RAW格式的多幅運動圖像分量圖像在內(nèi)的捕捉運動圖像。圖像處理部分2604可以檢測具有RAW格式的每幅運動圖像分量圖像中的一個或多個特征區(qū)域。圖像處理部分2604可以在不改變RAW格式的情況下,對獲得的捕捉運動圖像中包括的具有RAW格式的運動圖像分量圖像進行壓縮。這里,圖像處理部分2604可以使用參照圖1至15關(guān)于圖像處理設(shè)備2120的操作而描述的壓縮方法來對捕捉運動圖像進行壓縮。 圖像處理設(shè)備2170可以通過對從圖像處理部分2604獲得的壓縮運動圖像進行擴展,來獲得具有RAW格式的運動圖像分量圖像。圖像處理設(shè)備2170可以例如逐區(qū)域地對通過擴展獲得的具有RAW格式的運動圖像分量圖像執(zhí)行顏色估計(重合)處理,其中這些區(qū)域包括非特征區(qū)域和包含特征區(qū)域在內(nèi)的區(qū)域。這里,圖像處理設(shè)備2170可以對特征區(qū)域執(zhí)行比對非特征區(qū)域更加精確的同步操作。 圖像處理設(shè)備2170可以對通過對運動圖像分量圖像進行同步而獲得的特征區(qū)域的圖像執(zhí)行超分辨率(super-resolution)處理。圖像處理設(shè)備2170執(zhí)行的超分辨率處理可以示例為日本專利申請公開No. 2006-350498中公開的基于主要分量分析的超分辨率處理,或者日本專利申請公開No. 2004-88615中公開的基于主體運動的超分辨率處理。
這里,圖像處理設(shè)備2170可以對特征區(qū)域中包含的每個對象進行超分辨率處理。例如,當特征區(qū)域包含人臉的圖像時,圖像處理設(shè)備2170可以對作為對象示例示出的每個臉部元素(例如眼、鼻、口等)執(zhí)行超分辨率處理。在這種情況下,圖像處理設(shè)備2170可以存儲每個臉部元素(例如眼、鼻、口等)的學習數(shù)據(jù),其中學習數(shù)據(jù)是例如日本專利申請公開No. 2006-350498中公開的基于主要分量分析的模型。圖像處理設(shè)備2170可以使用與臉部元素關(guān)聯(lián)選擇的學習數(shù)據(jù),對特征區(qū)域中包括的每個臉部元素的圖像進行超分辨率處理。 如上所述,圖像處理設(shè)備2170可以使用主要分量分析來重構(gòu)特征區(qū)域的圖像。除了主要分量分析(PCA)之外,圖像處理設(shè)備2170進行的圖像重構(gòu)和用于圖像重構(gòu)的學習可以通過局部性預留投影(LPP)、線性判別式分析(LDA)、獨立分量分析(ICA)、多維縮放(MDS)、支持矢量機(支持矢量回歸)、神經(jīng)網(wǎng)絡(luò)、隱式馬爾科夫模型、貝葉斯估計、最大后驗(MAP)估計、迭代返回投影(IBP)、小波變換、局部線性嵌入(LLE)、馬爾科夫隨機場(MRF)等來實現(xiàn)。 除了日本專利申請公開No. 2006-350498中公開的模型之外,學習數(shù)據(jù)可以包括對象圖像的低頻分量和高頻分量,這些分量是從對象的大量采樣圖像中提取的。這里,可以使用K-means方法或其他方法將多個不同類型對象中每一個的圖像的低頻分量聚集為多個群集。每個群集可以與代表性低頻分量(例如重心的值)相關(guān)聯(lián)。 圖像處理設(shè)備2170從運動圖像分量圖像中的特征區(qū)域中包含的對象的圖像中提取低頻分量。然后,圖像處理設(shè)備2170從由對象(其類型與所提取對象的類型相同)的采樣圖像中提取的低頻分量的群集中標識代表性低頻分量與所提取的低頻分量相匹配的群集。然后,圖像處理設(shè)備2170標識與所標識的群集中包括的低頻分量相關(guān)聯(lián)的高頻分量的群集。按照上述方式,圖像處理設(shè)備2170可以標識與從運動圖像分量圖像中包含的對象中提取的低頻分量相關(guān)的高頻分量的群集。 圖像處理設(shè)備2170可以使用表示所標識的高頻分量的群集的高頻分量,將對象的圖像轉(zhuǎn)換為具有較高圖像質(zhì)量的高圖像質(zhì)量圖像。例如,圖像處理設(shè)備2170可以將與對象關(guān)聯(lián)選擇的高頻分量添加至每個對象的圖像,其中權(quán)值根據(jù)從對象中心至表面上的處理位置的距離而確定。這里,每個群集的代表性高頻分量可以使用閉環(huán)訓練方法產(chǎn)生。如上所述,圖像處理設(shè)備2170可以針對每個對象,從通過學習對象而產(chǎn)生的多份學習數(shù)據(jù)中選擇所需學習數(shù)據(jù),并使用所選擇的學習數(shù)據(jù)。因此,圖像處理設(shè)備2170能夠更精確地增強對象圖像的圖像質(zhì)量。注意,當包括在參照圖1至15描述的圖像處理系統(tǒng)2010中時,圖像處理設(shè)備2170可以對特征區(qū)域的圖像執(zhí)行上述超分辨率處理。 根據(jù)日本專利申請公開No. 2006-350498中公開的基于主要分量分析而進行的超分辨率處理,使用主要分量矢量和加權(quán)因子來表示物體的圖像。加權(quán)因子和主要分量矢量的數(shù)據(jù)量明顯小于物體的圖像的像素數(shù)據(jù)的數(shù)據(jù)量。因此,在對從圖像捕捉部分2102獲得的運動圖像分量圖像的特征區(qū)域的圖像進行壓縮時,圖像處理部分2604可以由特征區(qū)域中包含的物體的圖像計算上述加權(quán)因子。換言之,圖像處理部分2604可以通過使用主要分量矢量和加權(quán)因子來表示圖像,從而對特征區(qū)域中包含的物體的圖像進行壓縮。圖像處理部分2604可以將主要分量矢量和加權(quán)因子發(fā)送至圖像處理設(shè)備2170。
在這種情況下,圖像處理設(shè)備2170可以使用從圖像處理部分2604獲得的主要分量矢量和加權(quán)因子來重構(gòu)特征區(qū)域中包含的物體的圖像。這里,圖像處理部分2604也可以使用利用與日本專利申請公開No. 2006-350498中公開的基于主要分量分析的模型不同的各種其他特征參數(shù)來表示物體的模型,來對特征區(qū)域中包含的物體的圖像進行壓縮。
圖17示意了圖像處理設(shè)備2120和2170的示例硬件配置。圖像處理設(shè)備2120和2170均由CPU外圍部分、輸入/輸出(I/O)部分和傳統(tǒng)I/0部分構(gòu)成。CPU外圍部分包括通過主機控制器2582互相連接的CPU 2505、RAM 2520、圖形控制器2575和顯示設(shè)備2580。I/O部分包括通過I/O控制器2584連接至主機控制器2582的通信接口 2530、硬盤驅(qū)動器2540和CD-ROM驅(qū)動器2560。傳統(tǒng)I/O部分包括連接至I/O控制器2584的ROM 2510、軟盤驅(qū)動器2550和I/O芯片2570。 主機控制器2582將RAM 2520與以高傳輸速率訪問RAM 2520的CPU 2505和圖形控制器2575連接。CPU 2505根據(jù)ROM 2510和RAM 2520上存儲的程序進行操作,以控制這些組件。圖形控制器2575在RAM 2520內(nèi)提供的幀緩沖器上獲得CPU 2505等產(chǎn)生的圖像
40數(shù)據(jù),并使顯示設(shè)備2580顯示所獲得的圖像數(shù)據(jù)。備選地,圖形控制器2575中可以包括用于將CPU 2505等產(chǎn)生的圖像數(shù)據(jù)存儲在其上的幀緩沖器。 I/O控制器2584將作為以相對高速率操作的I/O設(shè)備的硬盤驅(qū)動器2540、通信接口 2530和CD-ROM驅(qū)動器2560連接至主機控制器2582。硬盤驅(qū)動器2540上存儲CPU 2505要使用的程序和數(shù)據(jù)。通信接口 2530耦合至網(wǎng)絡(luò)通信設(shè)備2598以發(fā)送/接收程序或數(shù)據(jù)。CD-ROM驅(qū)動器2560從CD-ROM 2595中讀取程序或數(shù)據(jù),并將所讀取的程序或數(shù)據(jù)經(jīng)由RAM2520提供給硬盤驅(qū)動器2540和通信接口 2530。 1/0控制器2584也連接至作為以相對低速率操作的1/0設(shè)備的ROM 2510、軟盤驅(qū)動器2550和I/O芯片2570。 ROM 2510上存儲圖像處理設(shè)備2120和2170在啟動時執(zhí)行的引導程序、依賴于圖像處理設(shè)備2120和2170的硬件的程序等等。軟盤驅(qū)動器2550從軟盤2590中讀取程序或數(shù)據(jù),并經(jīng)由RAM 2520將所讀取的程序或數(shù)據(jù)提供給硬盤驅(qū)動器2540和通信接口 2530。 I/O芯片2570用于經(jīng)由例如并行端口、串行端口、鍵盤端口、鼠標端口等來連接各種1/0設(shè)備,如軟盤驅(qū)動器2550。 CPU 2505要執(zhí)行的程序在被存儲在如軟盤2590、CD-R0M 2595和IC卡之類的記錄介質(zhì)的狀態(tài)下由用戶提供。程序可以在壓縮或未壓縮的狀態(tài)下存儲在記錄介質(zhì)上。程序從記錄介質(zhì)安裝到硬盤驅(qū)動器2540上,由RAM 2520讀取,并由CPU 2505來執(zhí)行。CPU 2505執(zhí)行的程序使圖像處理設(shè)備2120用作參照圖1至16所描述的壓縮運動圖像獲得部分2201、壓縮運動圖像擴展部分2202、特征區(qū)域檢測部分2203、圖像劃分部分2204、圖像產(chǎn)生部分2205、值固定部分2211、圖像質(zhì)量降低部分2221、編碼部分2231、關(guān)聯(lián)部分2206、輸出部分2207、邊界區(qū)域標識部分2710、信息量計算部分2720、相同主體區(qū)域標識部分2730、壓縮強度確定部分2740、條件存儲部分2750、條件獲得部分2752和壓縮控制部分2760。 CPU 2505執(zhí)行的程序也使圖像處理設(shè)備2170用作參照圖1至16所描述的壓縮運動圖像獲得部分2301、關(guān)聯(lián)分析部分2302、壓縮運動圖像擴展部分2311、組合部分2303和輸出部分2304。
上述程序可以存儲在外部記錄介質(zhì)上。除了軟盤2590和CD-R0M2595之外,記錄介質(zhì)是例如光記錄介質(zhì)(如DVD和PD)、磁-光記錄介質(zhì)(如MD)、磁帶介質(zhì)、半導體存儲器(如IC卡等)。記錄介質(zhì)可以是在連接至專用通信網(wǎng)絡(luò)或因特網(wǎng)的服務器系統(tǒng)中提供的存儲設(shè)備(如硬盤或RAM),程序可以經(jīng)由網(wǎng)絡(luò)提供給圖像處理設(shè)備2120和2170。
圖18示出了根據(jù)實施例的圖像處理系統(tǒng)3010的一個示例。圖像處理系統(tǒng)3010的目的在于,在保持特征對象的高圖像質(zhì)量的同時,減小圖像的數(shù)據(jù)量。
圖像處理系統(tǒng)3010包括多個圖像捕捉設(shè)備3100a至3100c(以下統(tǒng)稱為圖像捕捉設(shè)備3100),用于捕捉被監(jiān)視區(qū)域3150的圖像;多個圖像處理設(shè)備3120a至3120c(以下統(tǒng)稱為圖像處理設(shè)備3120),用于處理圖像;圖像處理設(shè)備3170 ;通信網(wǎng)絡(luò)3110、圖像數(shù)據(jù)庫(DB) 3175 ;以及多個顯示設(shè)備3180a至3180c (以下統(tǒng)稱為顯示設(shè)備3180)。
圖像處理設(shè)備3120a連接至圖像捕捉設(shè)備3100a。圖像處理設(shè)備3120b連接至圖像捕捉設(shè)備3100b。圖像處理設(shè)備3120c連接至圖像處理設(shè)備3100c。圖像處理設(shè)備3170和顯示設(shè)備3180在與被監(jiān)視區(qū)域3150不同的區(qū)域3160中提供。 以下解釋圖像捕捉設(shè)備3100a、圖像處理設(shè)備3120a、圖像處理設(shè)備3170和顯示設(shè)備3180a的操作。圖像捕捉設(shè)備3100a捕捉被監(jiān)視區(qū)域3150的圖像,根據(jù)MPEG方案對獲取的所捕捉的圖像進行編碼以產(chǎn)生捕捉運動圖像數(shù)據(jù),并將該數(shù)據(jù)輸出至圖像捕捉設(shè)備
413100a所連接的圖像處理設(shè)備3120a。 具體地,圖像捕捉設(shè)備3100a包括圖像捕捉部分3102a和捕捉運動圖像壓縮部分3104a。圖像捕捉部分3102a捕捉被監(jiān)視區(qū)域3150的圖像,并產(chǎn)生捕捉運動圖像中包括的多幅運動圖像組成圖像。圖像捕捉部分3102a可以以RAW格式來產(chǎn)生運動圖像組成圖像。捕捉運動圖像壓縮部分3104a對圖像捕捉部分3102a產(chǎn)生的具有RAW格式的運動圖像組成圖像執(zhí)行顏色估計(重合處理),并根據(jù)MPEG編碼等對包括通過顏色估計(重合處理)得到的多幅運動圖像組成圖像在內(nèi)的捕捉運動圖像進行壓縮,從而產(chǎn)生捕捉運動圖像數(shù)據(jù)。
圖像處理設(shè)備3120a獲取圖像捕捉設(shè)備3100a產(chǎn)生的捕捉運動圖像數(shù)據(jù)。圖像處理設(shè)備3120通過對從圖像捕捉設(shè)備3100獲取的捕捉運動圖像數(shù)據(jù)進行解碼來產(chǎn)生捕捉運動圖像,并且從產(chǎn)生的捕捉運動圖像中檢測包括互不相同類型特征(例如包括人3130和運動物體3140(如汽車)等)的多個特征區(qū)域。圖像處理設(shè)備3120a通過產(chǎn)生多幅運動圖像,由捕捉運動圖像產(chǎn)生與多幅特征區(qū)域運動圖像,在每幅特征區(qū)域運動圖像中,相應類型特征的特征區(qū)域的圖像質(zhì)量高于運動圖像中的其余區(qū)域。圖像處理設(shè)備3120a產(chǎn)生背景區(qū)域運動圖像,該背景區(qū)域運動圖像以比特征區(qū)域運動圖像更低的圖像質(zhì)量示出了特征區(qū)域的背景區(qū)域。 圖像處理設(shè)備3120a對多幅所產(chǎn)生的特征區(qū)域運動圖像和所產(chǎn)生的背景區(qū)域運動圖像進行編碼,以產(chǎn)生多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)。同時,圖像處理設(shè)備3120a將通過編碼獲得的多個特征區(qū)域運動圖像數(shù)據(jù)與同樣通過編碼獲得的背景區(qū)域運動圖像數(shù)據(jù)相關(guān)聯(lián),并將每個互相關(guān)聯(lián)的數(shù)據(jù)經(jīng)由通信網(wǎng)絡(luò)3110發(fā)送至圖像處理設(shè)備3170。 圖像處理設(shè)備3170對從圖像處理設(shè)備3120a發(fā)送的多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)中的每一個進行解碼,以獲得多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像。圖像處理設(shè)備3170將多幅特征區(qū)域運動圖像與背景區(qū)域運動圖像進行組合,以產(chǎn)生合成運動圖像,并將所產(chǎn)生的合成運動圖像提供給顯示設(shè)備3180a。顯示設(shè)備3180a顯示從圖像處理設(shè)備3170提供的運動圖像。 圖像處理設(shè)備3170可以將所產(chǎn)生的合成運動圖像或從圖像處理設(shè)備3120a獲得的捕捉運動圖像數(shù)據(jù)記錄在圖像DB 3175中。圖像處理設(shè)備3170可以針對來自顯示設(shè)備3180a的請求,將圖像DB 3175中記錄的合成運動圖像提供給顯示設(shè)備3180a。圖像處理設(shè)備3170可以按上述解碼方式對圖像DB 3175中記錄的捕捉運動圖像數(shù)據(jù)進行解碼,并針對來自顯示設(shè)備3180a的請求,將其提供給顯示設(shè)備3180a。圖像DB 3175可以包括例如非易失性記錄介質(zhì)(如硬盤),并在記錄介質(zhì)中記錄從圖像處理設(shè)備3170提供的合成運動圖像。 圖像捕捉設(shè)備3100b和3100c包括具有與圖像捕捉設(shè)備3100a中包括的組件相同功能的組件。圖像捕捉設(shè)備3100b和3100c具有與圖像捕捉設(shè)備3100a相同的功能和操作,因此這里不再解釋,但是圖像捕捉設(shè)備3100b和3100c分別將捕捉運動圖像數(shù)據(jù)提供給圖像處理設(shè)備3120b和3120c。注意,在以下解釋中,可能有時將圖像捕捉部分3102a至3102c統(tǒng)稱為圖像捕捉部分3102,并且可能有時將捕捉運動圖像壓縮部分3104a至3104c統(tǒng)稱為捕捉運動圖像壓縮部分3104。 圖像處理設(shè)備3120b和圖像處理設(shè)備3120c可以具有與圖像處理設(shè)備3120a相同
42的功能和操作,但是圖像處理設(shè)備3120c和3120c分別從圖像捕捉設(shè)備3100b和3100c獲取 捕捉運動圖像數(shù)據(jù)。因此,這里不對圖像處理設(shè)備3120b和3120c的功能和操作進行解釋。 圖像處理設(shè)備3170根據(jù)從圖像捕捉設(shè)備3100b或圖像捕捉設(shè)備3100c獲取的、互相關(guān)聯(lián)的 多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)來產(chǎn)生一幅運動圖像,并將所產(chǎn)生的 運動圖像提供給顯示設(shè)備3180b或顯示設(shè)備3180c。顯示設(shè)備3180b和顯示設(shè)備3180c顯 示從圖像處理設(shè)備3170提供的運動圖像。 當例如用作監(jiān)督系統(tǒng)時,根據(jù)本實施例的圖像處理系統(tǒng)3010能夠獲取如人、運動 物體等突出的任何合適的監(jiān)督目標對象的高質(zhì)量圖像。此外,圖像處理系統(tǒng)3010能夠減少 運動圖像的數(shù)據(jù)量。 圖19示出了圖像處理設(shè)備3120的一示例模塊配置。圖像處理設(shè)備3120包括壓 縮運動圖像獲取部分3201、壓縮運動圖像解壓部分3202、條件存儲部分3260、壓縮控制部 分3250、壓縮部分3240和輸出部分3207。壓縮部分3240包括輸入運動圖像質(zhì)量控制部分 3280、圖像質(zhì)量退化部分3281和級間差異壓縮部分3282a至3282d(以下統(tǒng)稱為級間差異 壓縮部分3282)。 壓縮運動圖像獲取部分3201獲得壓縮的運動圖像。具體而言,壓縮運動圖像獲取 部分3201獲得編碼后的、由圖像捕捉設(shè)備3100產(chǎn)生的捕捉運動圖像數(shù)據(jù)。壓縮運動圖像 解壓部分3202從壓縮運動圖像獲取部分3201獲取的數(shù)據(jù)中恢復運動圖像,以產(chǎn)生運動圖 像中包括的多幅運動圖像組成圖像。 具體而言,壓縮運動圖像解壓部分3202對壓縮運動圖像獲取部分3201獲取的捕 捉運動圖像數(shù)據(jù)進行解碼,以產(chǎn)生運動圖像中包括的多幅運動圖像組成圖像。運動圖像組 成圖像包括幀圖像和場圖像。運動圖像組成圖像是根據(jù)本發(fā)明的輸入圖像的一個示例。
特征區(qū)域檢測部分3203從運動圖像中包括的多幅運動圖像組成圖像中檢測特征 區(qū)域。壓縮部分3240對壓縮運動圖像解壓部分3202產(chǎn)生的多幅運動圖像組成圖像進行壓 縮。例如,壓縮部分3240根據(jù)特征區(qū)域檢測部分3203檢測到的特征區(qū)域的特征的量,來對 運動圖像組成圖像進行壓縮。 例如,壓縮部分3240根據(jù)多個特征區(qū)域中分別包括的對象的特征的量,以不同的 編碼方式分別對多個特征區(qū)域的圖像進行壓縮。具體地,壓縮控制部分3250將指示特征區(qū) 域檢測部分3203所檢測的特征區(qū)域的信息提供給壓縮部分3240,并控制壓縮部分3240對 多幅運動圖像組成圖像進行壓縮的編碼方式。以下將描述壓縮部分3240的每個組件的功 能和操作。壓縮控制部分3250的功能和操作將參照圖21來進行解釋。
輸入運動圖像質(zhì)量控制部分3280根據(jù)壓縮運動圖像解壓部分3202所產(chǎn)生的多幅 運動圖像組成圖像中包括的特征區(qū)域的特征的量,控制特征區(qū)域的圖像質(zhì)量和不同于特征 區(qū)域的區(qū)域的圖像質(zhì)量。輸入運動圖像質(zhì)量控制部分3280的功能和操作將參照圖22來詳 細解釋。 圖像質(zhì)量退化部分3281通過對運動圖像的圖像質(zhì)量進行退化,產(chǎn)生具有預定的 互不相同圖像質(zhì)量的多幅運動圖像。圖像質(zhì)量退化部分3281將所產(chǎn)生的具有不同圖像質(zhì) 量的運動圖像提供給級間差異壓縮部分3282。具體地,圖像質(zhì)量退化部分3281通過降低運 動圖像的幀率,或降低運動圖像中包括的運動圖像組成圖像的分辨率或分級,來產(chǎn)生具有 不同圖像質(zhì)量的運動圖像。級間差異壓縮部分3282從圖像質(zhì)量退化部分3281獲取具有預定圖像質(zhì)量的運動圖像,并對所獲取的運動圖像進行壓縮。每個級間差異壓縮部分3282對 具有不同圖像質(zhì)量的運動圖像中不同的一幅運動圖像進行壓縮。 圖像質(zhì)量退化部分3281提供給級間差異壓縮部分3282a的運動圖像中包括的運 動圖像組成圖像可以是通過降低接收的運動圖像組成圖像的圖像質(zhì)量而獲得的低質(zhì)量圖 像的一個示例。圖像質(zhì)量退化部分3281或輸入運動圖像質(zhì)量控制部分3280提供給級間差 異壓縮部分3282b至3282d的運動圖像中包括的運動圖像組成圖像可以是特征區(qū)域圖像的 一個示例,在所述特征區(qū)域圖像中,特征區(qū)域的圖像質(zhì)量高于低質(zhì)量圖像的圖像質(zhì)量。在這 種情況下,圖像質(zhì)量退化部分3281和輸入運動圖像質(zhì)量控制部分3280用作產(chǎn)生低質(zhì)量圖 像的圖像產(chǎn)生部分。 級間差異壓縮部分3282a從圖像質(zhì)量退化部分3281獲取具有比級間差異壓縮部 分3282b至3282d中任一個所接收的運動圖像組成圖像更低分辨率的運動圖像組成圖像, 并對所獲取的圖像進行壓縮。級間差異壓縮部分3282b、級間差異壓縮部分3282c和級間差 異壓縮部分3282d從圖像質(zhì)量退化部分3281或輸入運動圖像質(zhì)量控制部分3280獲取具有 升序排列的分辨率的運動圖像組成圖像,并對所獲取的圖像分別進行壓縮。
級間差異壓縮部分3282b對級間差異壓縮部分3282a壓縮的運動圖像組成圖像進 行解壓,并將解壓的運動圖像組成圖像放大至與其從圖像質(zhì)量退化部分3281獲取的運動 圖像組成圖像的分辨率相同的分辨率。級間差異壓縮部分3282b對包括放大的運動圖像組 成圖像與從圖像質(zhì)量退化部分3281獲取的運動圖像組成圖像之間的任何差異的差分圖像 進行壓縮。注意,級間差異壓縮部分3282b產(chǎn)生在特征區(qū)域中具有差異但在任何其他區(qū)域 中不具有差異的差分圖像,并對所產(chǎn)生的差分圖像進行壓縮。 級間差異壓縮部分3282c對級間差異壓縮部分3282b壓縮的運動圖像組成圖像進
行解壓,并將解壓的運動圖像組成圖像放大至與其從圖像質(zhì)量退化部分3281獲取的運動
圖像組成圖像的分辨率相同的分辨率。級間差異值壓縮部分3282c對包括放大的運動圖像
組成圖像與從圖像質(zhì)量退化部分3281獲取的運動圖像組成圖像之間的任何差異的差分圖
像進行壓縮。注意,級間差異壓縮部分3282c產(chǎn)生根據(jù)特征區(qū)域的特征的量在多個特征區(qū)
域中的至少一個特征區(qū)域中具有差異值但在包括多個特征區(qū)域中的其他特征區(qū)域在內(nèi)的
任何其他區(qū)域中不具有差異值的差分圖像,并對所產(chǎn)生的差分圖像進行壓縮。 級間差異壓縮部分3282d對級間差異壓縮部分3282c壓縮的運動圖像組成圖像進
行解壓。級間差異壓縮部分3282d將解壓的運動圖像組成圖像放大至與其從輸入運動圖像
質(zhì)量控制部分3280獲取的運動圖像組成圖像的分辨率相同的分辨率。級間差異壓縮部分
3282d對包括放大的運動圖像組成圖像與從輸入運動圖像質(zhì)量控制部分3280獲取的運動
圖像組成圖像之間的任何差異的差分圖像進行壓縮。注意,級間差異壓縮部分3282d產(chǎn)生
根據(jù)特征區(qū)域的特征的量在多個特征區(qū)域中的至少一個特征區(qū)域中具有差異值但在包括
多個特征區(qū)域中的其他特征區(qū)域在內(nèi)的任何其他區(qū)域中不具有差異值的差分圖像,并對所
產(chǎn)生的差分圖像進行壓縮。 按照這種方式,級間差異壓縮部分3282b至3282d對通過導出從輸入運動圖像質(zhì) 量控制部分3280或圖像質(zhì)量退化部分3281獲得的運動圖像組成圖像與具有較低分辨率的 運動圖像組成圖像的放大版本之間的差異而獲得的差分圖像進行壓縮。輸出部分3207對 通過相應級間差異壓縮部分3282的壓縮而得到的運動圖像進行復用和輸出。具體地,輸出
44部分3207將通過級間差異壓縮部分3282的壓縮而得到的運動圖像發(fā)送至圖像處理設(shè)備 3170。按照這種方式,圖像處理設(shè)備3120可以提供根據(jù)特征區(qū)域的特征的量來可縮放地壓 縮和編碼的運動圖像。 圖20A至20C示出了級間差異壓縮部分3282a和3282b的一示例模塊配置。級間 差異壓縮部分3282a包括運動分析部分3285a、運動編碼部分3286a、差異處理部分3287a 和編碼部分3288a。運動分析部分3285a包括差異獲得目標區(qū)域確定部分3294a和位置差 信息產(chǎn)生部分3295a。差異處理部分3287a包括差分像素圖像產(chǎn)生部分3296a、空間頻率域 變換部分3297a和量化部分3298a。 級間差異壓縮部分3282b包括運動分析部分3285b、運動編碼部分3286b、差異處 理部分3287b、圖像放大部分3293b、圖像解碼部分3292b和編碼部分3288b。運動分析部 分3285b包括差異獲得目標區(qū)域確定部分3294b和位置差信息產(chǎn)生部分3295b。差異處理 部分3287b包括差分像素圖像產(chǎn)生部分3296b、空間頻率域變換部分3297b、量化部分3298b 和頻域圖像質(zhì)量改變部分3299b。級間差異壓縮部分3282c和3282d具有與級間差異壓縮 部分3282b實質(zhì)上相同的組件,因此這里不再說明。 以下描述級間差異壓縮部分3282a的每個組件的功能和操作。對于從圖像質(zhì)量退 化部分3281接收的多幅運動圖像組成圖像,運動分析部分3285a基于這些組成圖像的圖像 內(nèi)容,來分析貫穿多幅運動圖像組成圖像出現(xiàn)的任何運動,從而確定基于其對運動圖像組 成圖像執(zhí)行基于運動的壓縮的部分區(qū)域。 具體地,差異獲得目標區(qū)域確定部分3294a基于貫穿多幅運動圖像組成圖像的任 何部分區(qū)域所取的像素值,在運動圖像組成圖像是要基于其與該參考運動圖像組成圖像的 差異來進行編碼的情況下,確定被稱為差異獲得目標的給定運動圖像組成圖像中的部分區(qū) 域。差異獲得目標區(qū)域確定部分3294a將作為壓縮目標的部分區(qū)域的像素信息和作為差異 獲得目標的這樣的所確定的部分區(qū)域的像素信息提供給差異處理部分3287a。
位置差信息產(chǎn)生部分3295a產(chǎn)生位置差信息,指示要以差分方式壓縮的部分區(qū)域 與被稱為差異獲得目標的部分區(qū)域之間的位置差。具體地,位置差信息產(chǎn)生部分3295a產(chǎn) 生用于運動補償?shù)倪\動矢量。位置差信息產(chǎn)生部分3295a將產(chǎn)生的位置差信息提供給運動 編碼部分3286a。 運動編碼部分3286a對從位置差信息產(chǎn)生部分3295a提供的位置差信息進行編 碼,并將編碼的信息提供給輸出部分3207。例如,運動編碼部分3286a對一個部分區(qū)域的位 置差信息與相鄰部分區(qū)域的位置差信息之間的差異進行編碼,并將編碼的差異提供給輸出 部分3207。 差異處理部分3287a基于從運動分析部分3285a獲取的壓縮目標部分區(qū)域的像 素信息和差異獲得目標部分區(qū)域的像素信息間的差異,對壓縮目標部分區(qū)域的圖像進行壓 縮。具體地,差分像素圖像產(chǎn)生部分3296a基于壓縮目標部分區(qū)域的像素信息與差異獲得 目標部分區(qū)域的像素信息之間的差異,來產(chǎn)生差分像素圖像。 空間頻率域變換部分3297a以逐部分區(qū)域的方式,將差分像素圖像變換至空間頻 率域。具體地,空間頻率域變換部分3297a使用離散余弦變換(DCT),將差分像素圖像中的 每個部分區(qū)域變換至空間頻率域??臻g頻率域變換部分3297a可以使用如哈達瑪變換和小 波變換等各種頻率變換方式,將差分像素圖像中的每個部分區(qū)域變換至空間頻率域。
45
當運動分析部分3285a確定壓縮將不基于從另一運動圖像組成圖像的部分區(qū)域 計算的差異時,差異處理部分3287a將壓縮目標部分區(qū)域的像素信息提供給空間頻率域變 換部分3297a。空間頻率域變換部分3297a以如上所述的方式,以逐部分區(qū)域的方式將像素 信息變換至空間頻率域。 量化部分3298a對由于空間頻率域變換部分3297a所執(zhí)行的變換至空間頻率域的 操作而獲得的變換系數(shù)進行量化。編碼部分3288a通過對量化部分3298a量化的變換系數(shù) 進行編碼來執(zhí)行壓縮。例如,編碼部分3288通過熵編碼(如霍夫曼編碼和算術(shù)編碼等)來 對量化部分3298a量化的變換系數(shù)進行編碼。編碼部分3288a將編碼得到的運動圖像提供 給輸出部分3207。 以下描述級間差異壓縮部分3282b中包括的每個組件的功能和操作。在級間差異 壓縮部分3282b中包括的組件中,以與級間差異壓縮部分3282a中包括的組件的參考標號 相同的參考標號來標記的組件具有與級間差異壓縮部分3282a中包括的組件相同的功能 和操作,因此以下僅解釋其間的任何差異。 對于從圖像質(zhì)量退化部分3281獲取的多幅運動圖像組成圖像中的每一幅,與差 異獲得目標區(qū)域確定部分3294a類似,差異獲得目標區(qū)域確定部分3294b指定另一運動圖 像組成圖像中的部分區(qū)域(應當獲得該部分區(qū)域與所涉及的運動圖像組成圖像中包括的 壓縮目標部分區(qū)域之間的差異)。按照這種方式,差異獲得目標區(qū)域確定部分3294b確定差 異獲得目標部分區(qū)域,該差異獲得目標部分區(qū)域是由運動圖像組成圖像產(chǎn)生的特征區(qū)域圖 像中的部分區(qū)域(應當獲得該特征區(qū)域圖像與另一特征區(qū)域圖像之間的差異)。差異獲得 目標區(qū)域確定部分3294b將壓縮目標部分區(qū)域的像素信息和差異獲得目標部分區(qū)域的像 素信息提供給像素值改變部分329 lb 。 圖像解碼部分3292b從編碼部分3288a獲取運動圖像組成圖像,并且從運動編碼 部分3286a獲取位置差信息。圖像解碼部分3292b基于從運動編碼部分3286a獲取的位置 差信息,對從編碼部分3288a獲取的運動圖像組成圖像進行解碼。圖像解碼部分3292b可 以獲取由量化部分3298a量化的運動圖像組成圖像,并對所獲取的運動圖像組成圖像進行 解碼,或者可以獲取編碼部分3288a編碼的運動圖像組成圖像,并對所獲取的運動圖像組 成圖像進行解碼。通過圖像解碼部分3292b解碼得到的運動圖像組成圖像可以是根據(jù)本發(fā) 明的低質(zhì)量圖像的一個示例。在這種情況下,級間差異壓縮部分3282a用作產(chǎn)生根據(jù)本發(fā) 明的低質(zhì)量圖像的圖像產(chǎn)生部分。 圖像放大部分3293b通過對圖像解碼部分3292b解碼的運動圖像組成圖像進行放
大來產(chǎn)生放大圖像。在差異獲得目標區(qū)域確定部分3294b確定的部分區(qū)域中,像素值改變
部分3291b保持特征區(qū)域中包括的部分區(qū)域具有不變的像素值,而將特征區(qū)域中未包括的
部分區(qū)域改變?yōu)榫哂斜环糯髨D像中包括的部分區(qū)域的像素值替換的像素值。 按照這種方式,像素值改變部分3291b由輸入運動圖像組成圖像產(chǎn)生特征區(qū)域圖
像,所述特征區(qū)域圖像中不同于特征區(qū)域的區(qū)域的像素值已經(jīng)被替換為放大圖像中的像素
值。注意,像素值改變部分3291b可以用作產(chǎn)生特征區(qū)域圖像的圖像產(chǎn)生部分,所述特征區(qū)
域圖像中不同于特征區(qū)域的區(qū)域的像素值已經(jīng)被替換為放大圖像中的像素值。 差異處理部分3287b從像素值改變部分3291b接收作為壓縮目標的特征區(qū)域圖
像、部分區(qū)域(應當獲得其與壓縮目標特征區(qū)域圖像中包括的部分區(qū)域之間的差異)的圖像信息、以及放大圖像。差異處理部分3287b針對壓縮目標特征區(qū)域圖像中包括的多個部 分區(qū)域中的每一個,確定應當采用幀內(nèi)編碼、幀間編碼和級間編碼中的哪一個。這里,幀內(nèi) 編碼要使用相同特征區(qū)域圖像內(nèi)的像素信息來對圖像進行編碼。幀間編碼要基于與另一運 動圖像組成圖像中包括的差異獲得目標部分區(qū)域的差異來對圖像進行編碼。級間編碼要基 于與放大圖像的差異來對圖像進行編碼。此時,差異處理部分3287b優(yōu)先選擇在編碼的圖 像中產(chǎn)生較小碼量的編碼方式。以下描述首先解釋選擇級間編碼的情況,應當選擇級間編 碼是由于已經(jīng)對像素值進行了替換,使得不同于特征區(qū)域的區(qū)域不具有差異。此后解釋選 擇幀間編碼和幀內(nèi)編碼的情況。 當選擇級間編碼時,差分像素圖像產(chǎn)生部分3296b產(chǎn)生指示特征區(qū)域圖像與放大 圖像之間的像素值差異的差分像素圖像。具體地,差分像素圖像產(chǎn)生部分3296b基于其中 不同于特征區(qū)域的區(qū)域中的像素值被替換了的特征區(qū)域圖像與放大圖像之間的差異,來產(chǎn) 生差分像素圖像。由于特征區(qū)域圖像中不同于特征區(qū)域的區(qū)域的像素值已經(jīng)被替換為放大 圖像中的像素值,因此差分像素圖像產(chǎn)生部分3296b可以產(chǎn)生差分像素圖像,其中每個特 征區(qū)域具有特征區(qū)域圖像的像素值與放大圖像的像素值之間的差異,并且不同于特征區(qū)域 的區(qū)域不具有像素值差異。 當選擇幀間編碼時,差分像素圖像產(chǎn)生部分3296b獲得像素值改變部分3291b產(chǎn) 生的特征區(qū)域圖像與像素值改變部分3291b由另一運動圖像組成圖像產(chǎn)生的特征區(qū)域圖 像之間的差異。具體地,差分像素圖像產(chǎn)生部分3296b獲得特征區(qū)域中包括的任何部分區(qū) 域的圖像與差異獲得目標區(qū)域確定部分3294b針對該部分區(qū)域所確定的差異獲得目標部 分區(qū)域的圖像之間的差異。由于特征區(qū)域圖像中不同于特征區(qū)域的區(qū)域的像素值被替換為 放大圖像中的像素值,差分像素圖像產(chǎn)生部分3296b產(chǎn)生差分像素圖像,其中特征區(qū)域中 包括的部分區(qū)域具有與由差異獲得目標區(qū)域確定部分3294b所確定的部分區(qū)域的像素值 差異,并且不同于特征區(qū)域的區(qū)域具有與由差異獲得目標區(qū)域確定部分3294b所確定的部 分區(qū)域的像素值差異。 當選擇幀內(nèi)編碼時,差分像素圖像產(chǎn)生部分3296b通過獲得每幅特征區(qū)域圖像中 包括的每個部分區(qū)域與相同特征區(qū)域圖像中另一區(qū)域之間的像素值差異,或者通過獲得給 定部分區(qū)域中的像素值與相同部分區(qū)域中的像素值之間的差異,來產(chǎn)生差分像素圖像。
空間頻率域變換部分3297b以逐部分區(qū)域的方式,將差分像素圖像變換至空間頻 率域。具體地,與空間頻率域變換部分3297a類似,空間頻率域變換部分3297b使用離散余 弦變換(DCT)、哈達瑪變換、小波變換等,將每個部分區(qū)域變換至空間頻率域。與量化部分 3298b類似,量化部分3298b對由于空間頻率域變換部分3297b執(zhí)行的至空間頻率域的變換 而獲得的變換系數(shù)進行量化。 頻域圖像質(zhì)量改變部分3299b從通過空間頻率域變換部分3297b執(zhí)行的至空間頻 率域的變換而獲得的相應部分區(qū)域的空間頻率分量中,減少包括不同于特征區(qū)域的區(qū)域在 內(nèi)的至少一個部分區(qū)域的空間頻率分量的數(shù)據(jù)量,來產(chǎn)生特征區(qū)域差異圖像或特征區(qū)域間 差異圖像。具體地,頻域圖像質(zhì)量改變部分3299b減少指示高于預定頻率的頻率分量的任 何變換系數(shù)的幅度。頻域圖像質(zhì)量改變部分3299b可以將指示高于預定頻率的頻率分量的 變換系數(shù)改變?yōu)镺。 按照這種方式,差異處理部分3287b產(chǎn)生特征區(qū)域差異圖像,其中每個特征區(qū)域
47具有通過將特征區(qū)域圖像與放大圖像之間的差異變換至空間頻率域而獲得的空間頻率分 量,并且不同于特征區(qū)域的區(qū)域具有數(shù)據(jù)量減少的空間頻率分量。編碼部分3288b對差異 處理部分3287b產(chǎn)生的特征區(qū)域差異圖像進行編碼。 如上所述,差異處理部分3287b產(chǎn)生的特征區(qū)域差異圖像表示特征區(qū)域圖像中每 個特征區(qū)域的圖像與低質(zhì)量圖像中每個特征區(qū)域的圖像之間的差分圖像。具體地,差異處 理部分387b產(chǎn)生的特征區(qū)域差異圖像指示特征區(qū)域圖像中每個特征區(qū)域的圖像與低質(zhì)量 圖像中每個特征區(qū)域的放大圖像之間的差異。 在以上解釋中,像素值改變部分3291b將不同于特征區(qū)域的區(qū)域中的像素值替換 為放大圖像中的像素值,使得差分像素圖像中不同于特征區(qū)域的區(qū)域中差異將為O,S卩,使 得不是具有預定類型特征的特征區(qū)域,也不是具有應當被給予高于前述特征區(qū)域的分辨率
的預定類型特征的特征區(qū)域的區(qū)域中的差異將為o。然而,可以使用任何其他方式來使差分
像素圖像中的差異為O。 例如,像素值改變部分3291b可以將從圖像質(zhì)量退化部分3281獲取的運動圖像組 成圖像中不同于特征區(qū)域的區(qū)域的像素值改變?yōu)轭A定像素值,并且將放大圖像中不同于特 征區(qū)域的對應區(qū)域的像素值改變?yōu)橄嗤念A定像素值。按照這種方式,也可以使差分像素 圖像中不同于特征區(qū)域的區(qū)域中的差異為O,從而實質(zhì)上減少不同于特征區(qū)域的區(qū)域的信 按照這種方式,像素值改變部分3291b由運動圖像組成圖像,產(chǎn)生特征區(qū)域圖像 (其中不同于特征區(qū)域的區(qū)域的像素值被替換為預定值)和放大圖像(其中不同于特征區(qū) 域的區(qū)域的像素值被替換為預定值)。然后,差分像素圖像產(chǎn)生部分3296基于特征區(qū)域圖 像與放大圖像之間的差異來產(chǎn)生差分像素圖像,在特征區(qū)域圖像和放大圖像中,不同于特 征區(qū)域的區(qū)域中的像素值已經(jīng)被替換。 像素值改變部分3291b可以將從圖像質(zhì)量退化部分3281獲取的運動圖像組成圖 像中不同于特征區(qū)域的區(qū)域的像素值替換為提供給下級的級間差異壓縮部分3282(例如 級間差異壓縮部分3282a)的運動圖像組成圖像的放大版本中對應區(qū)域的像素值。按照這 種方式,也可以使差分像素圖像中的差異實質(zhì)上為O,從而實質(zhì)上減少了不同于特征區(qū)域的 區(qū)域的信息量。 位置差信息產(chǎn)生部分3295b產(chǎn)生指示不同于特征區(qū)域的區(qū)域中包括的部分區(qū)域 與應當獲得與其的差異的部分區(qū)域之間的位置差的位置差信息。具體地,與位置差信息產(chǎn) 生部分3295a類似,位置差信息產(chǎn)生部分3295b產(chǎn)生指示要以差分方式壓縮的部分區(qū)域與 差異獲得目標部分區(qū)域(應當獲得與其的差異)之間的位置差的位置差信息。注意,位置 差信息包括用于運動補償?shù)倪\動矢量。 位置差信息改變部分3290b改變位置差信息,使得位置差信息將指示應當從在相 同位置處的部分區(qū)域獲得不同于特征區(qū)域的區(qū)域中包括的部分區(qū)域的差異。具體地,位置 差信息改變部分3290b將不同于特征區(qū)域的區(qū)域中包括的部分區(qū)域的位置差信息改變?yōu)?指示不存在位置差異的信息。此外,位置差信息改變部分3290b從運動編碼部分3286a獲 取位置差信息,并將不同于特征區(qū)域的區(qū)域中包括的部分區(qū)域的位置差信息改變?yōu)橹甘静?存在位置差的信息。具體地,位置差信息改變部分3290b將不同于特征區(qū)域的區(qū)域的運動 矢量的長度改變?yōu)?。具體地,位置差信息改變部分3290b將從位置差信息產(chǎn)生部分3295b
48獲取的運動矢量的長度改變?yōu)?,并將從運動編碼部分3286a獲取的運動矢量的長度改變 為0。 然后,運動編碼部分3286b對位置差信息進行編碼。具體地,與運動編碼部分 3286a類似,運動編碼部分3286b對一個部分區(qū)域的位置差信息與相鄰部分區(qū)域的位置 差信息之間的差異進行編碼。將運動編碼部分3286b編碼的位置差信息提供給輸出部分 3207。 在本實施例中,位置差信息改變部分3290改變不同于特征區(qū)域的區(qū)域的位置差 信息,但是,位置差信息改變部分3290b可以改變運動編碼部分3286b編碼得到的編碼圖像 中不同于特征區(qū)域的區(qū)域的位置差信息。這就是說,位置差信息改變部分3290b可以改變 運動編碼部分3286編碼的位置差信息,使得該信息指示應當從在相同位置處的部分區(qū)域 獲得不同于特征區(qū)域的部分區(qū)域的差異。 編碼部分3288b可以產(chǎn)生在不同于特征區(qū)域的區(qū)域中不包括差異信息的編碼數(shù) 據(jù)。具體地,編碼部分3288b可以產(chǎn)生在不同于特征區(qū)域的區(qū)域中包括的部分區(qū)域中不具 有差異信息的編碼數(shù)據(jù)。運動編碼部分3286b可以產(chǎn)生在不同于特征區(qū)域的區(qū)域中包括的 部分區(qū)域中不具有位置差信息的編碼數(shù)據(jù)。按照這種方式,編碼部分3288b和運動編碼部 分3286b產(chǎn)生編碼數(shù)據(jù),該編碼數(shù)據(jù)通過不包括差異信息也不包括位置差信息來指示不同 于特征區(qū)域的區(qū)域中的圖像內(nèi)容與另一運動圖像組成圖像中對應區(qū)域中的圖像內(nèi)容相同。 例如,編碼部分3288b和運動編碼部分3286b可以產(chǎn)生包括一類部分區(qū)域的編碼數(shù)據(jù),指示 不同于特征區(qū)域的區(qū)域中包括的所涉及的部分區(qū)域的圖像內(nèi)容與另一運動圖像組成圖像 中對應區(qū)域的圖像內(nèi)容相同。 例如,編碼部分3288b和運動編碼部分3286b可以產(chǎn)生包括一類部分區(qū)域的編碼 數(shù)據(jù),指示不同于特征區(qū)域的區(qū)域中包括的所涉及的部分區(qū)域是以簡單幀間預測編碼模式 來編碼的,因此不具有轉(zhuǎn)換系數(shù)。例如,這些部分區(qū)域的類型可以與MPEG編碼中的非MC不 編碼等效。通過產(chǎn)生包括指示運動矢量的長度的信息和差異信息均為O的編碼數(shù)據(jù),編碼 部分3288b和運動編碼部分3286b可以進一步減少編碼后的運動圖像組成圖像的碼量。在 確定包括上述編碼模式的預測模式時,級間差異壓縮部分3282b可以基于不定乘數(shù)的拉格 朗日方法來選擇可以將率失真代價最小化的預測模式。 級間差異壓縮部分3282c和級間差異壓縮部分3282d包括與級間差異壓縮部分 3282b的組件具有相同功能的組件。在以下解釋中,級間差異壓縮部分3282c和級間差異壓 縮部分3282d中具有與級間差異壓縮部分3282的組件相同名稱的組件以相同的參考標號 表示。組件的參考標號的最后的字母(b、c、d)指示了這些組件被包括在級間差異壓縮部分 3282b至2282d中的哪一個。 例如,運動分析部分3285c是級間差異壓縮部分3282c的組件,運動分析部分 3285d是級間差異壓縮部分3282d的組件。在以下描述中,沒有結(jié)尾字母的任何參考標號可 以指示級間差異壓縮部分3282b至3282d中包括的以該參考標號標記的所有組件。例如, "像素值改變部分3291"可以指示像素值改變部分3291b至3291d中的每一個。
級間差異壓縮部分3282c和級間差異壓縮部分3282d的功能和操作與級間差異壓 縮部分3282b的功能和操作在以下方面有所差異級間差異壓縮部分3282c和3282d對從 圖像質(zhì)量退化部分3281和輸入運動圖像質(zhì)量控制部分3280獲取的具有不同圖像質(zhì)量的
49運動圖像分別進行處理;位置差信息改變部分3290c和3290d以及圖像解碼部分3292c和 3292d從用于處理具有較低圖像質(zhì)量的運動圖像的另一級間差異壓縮部分3282獲取用于 差異獲得目的的位置差信息和用于差異獲得目的的運動圖像組成圖像。
具體地,位置差信息改變部分3290c從運動編碼部分3286b獲取位置差信息,并改 變所獲取的位置差信息。圖像解碼部分3292c從運動編碼部分3286b獲取位置差信息,從編 碼部分3288b獲取運動圖像組成圖像,并基于所獲取的位置差信息來對所獲取的運動圖像 組成圖像進行解碼。位置差信息改變部分3290d從運動編碼部分3286c獲取位置差信息,并 改變所獲取的位置差信息。圖像解碼部分3292d從運動編碼部分3286c獲取位置差信息, 從編碼部分3288c獲取運動圖像組成圖像,并基于所獲取的位置差信息來對所獲取的運動 圖像組成圖像進行解碼。 特征區(qū)域檢測部分203從輸入運動圖像組成圖像中檢測具有互不相同類型的多 個特征區(qū)域。具體地,條件存儲部分3260以與每種特征區(qū)域類型相關(guān)聯(lián)的方式,存儲該類 型的特征區(qū)域的運動矢量或變換系數(shù)應當滿足的條件。例如,條件存儲部分3260可以存儲 以下條件運動矢量的空間方向不均勻性應當小于預定值。條件存儲部分3260可以存儲以 下條件在推定的特征區(qū)域中,指示該區(qū)域的空間頻率分量的變換系數(shù)(如DCT系數(shù))的頻 率級分布應當以高于預定符合度的符合度,與針對任何類型特征區(qū)域而預定的這種分量的 頻率級分布相符合。 特征區(qū)域檢測部分203將具有滿足條件存儲部分3260中存儲的條件的運動矢量 和變換系數(shù)的區(qū)域檢測為特征區(qū)域。按照這種方式,特征區(qū)域檢測部分3203將具有滿足預 定條件的變換系數(shù)的區(qū)域檢測為特征區(qū)域??梢允褂萌缛毡緦@暾埞_No. 2007-188419 中公開的機器學習(如adaboost)來檢測特征區(qū)域。已知該方法要使用預定對象的圖像的 變換系數(shù)和不同于預定對象的任何位置的圖像的變換系數(shù)來學習預定對象的圖像的變換 系數(shù)的特征。條件存儲部分260存儲預定對象的圖像的變換系數(shù)所滿足的條件,該條件是 基于學習來產(chǎn)生的。 取代使用變換系數(shù)來檢測特征區(qū)域,或者除了使用變換系數(shù)來檢測特征區(qū)域之 外,特征區(qū)域檢測部分3203可以基于圖像的像素值來檢測特征區(qū)域。甚至基于像素值來檢 測特征區(qū)域的方法可以使用通過上述機器學習來進行的檢測。特征區(qū)域檢測部分3203可 以使用模板匹配來檢測特征區(qū)域,模板匹配涉及與表示預定對象的模板圖像進行比較。
注意,預定對象可以是人臉的至少一部分、人體的一部分(如頭、手等)、整個人、 硬幣、卡(如現(xiàn)金卡等)、汽車和汽車的一部分(如汽車登記牌照)。預定對象可以是不同 于人體的活體。預定對象可以是包括人體在內(nèi)的活體中存在的特定組織,如包括人體在內(nèi) 的活體中的腫瘤組織、血管等等。特征區(qū)域檢測部分3203可以使用各種檢測方法(如模板 匹配、機器學習等),將包括所捕捉的預定對象的圖像在內(nèi)的區(qū)域檢測為特征區(qū)域。特征區(qū) 域檢測部分3203可以檢測具有任何形狀(如矩形)的特征區(qū)域。 特征區(qū)域檢測部分3203可以使用在日本專利申請公開No. 2008-078641中公開的 方法來檢測特征區(qū)域。例如,特征區(qū)域檢測部分3203以預定的稀疏比率,使從中檢測到對 象的所捕捉的圖像變稀疏,或者以該稀疏比率逐步使這樣稀疏的圖像進一步變稀疏,從而 產(chǎn)生包括所捕捉的圖像和一個或更多稀疏圖像在內(nèi)的圖像集合。然后,特征區(qū)域檢測部分 3203將第一濾波器應用至所產(chǎn)生的圖像集合中相對較小的第一圖像,從而計算評估值。這
50里,第一濾波器作用于圖像中的二維區(qū)域,并產(chǎn)生表示該區(qū)域內(nèi)可能存在特定類型對象的 概率的百分比的評估值。在分別作用于不同大小的區(qū)域(其中,與每個區(qū)域的大小相對應 的、區(qū)域中包括的像素數(shù)目以預定比率不同,或者以預定比率逐步不同)的至少兩個濾波 器中,第一濾波器可以是作用于相對較窄區(qū)域的濾波器。特征區(qū)域檢測部分3203從第一圖 像中提取從中獲得大于預定第一閾值的評估值的區(qū)域作為主候選區(qū)域。
然后,特征區(qū)域檢測部分3203將這些濾波器中的第二濾波器應用至第二圖像中 與主候選區(qū)域相對應的區(qū)域,并計算評估值。第二圖像包括的像素數(shù)目比第一圖像中的像 素數(shù)目大一個步長。第二濾波器作用于比第一濾波器應當應用至的區(qū)域?qū)捯粋€步長的區(qū) 域。特征區(qū)域檢測部分3203提取從中獲得大于預定第二閾值的評估值的區(qū)域作為次候選 區(qū)域。 特征區(qū)域檢測部分3203重復將為不同大小的區(qū)域分別準備的多個濾波器中任一 濾波器應用至圖像集合中具有相應大小的區(qū)域的提取操作,以提取候選區(qū)域。此時,特征區(qū) 域檢測部分3203按照執(zhí)行針對較窄區(qū)域應用濾波器的提取過程和針對較寬區(qū)域應用濾波 器的提取過程的順序來執(zhí)行提取過程。具體地,特征區(qū)域檢測部分3203按照執(zhí)行將為較窄 區(qū)域準備的濾波器應用至較小圖像的提取過程和將為較寬區(qū)域準備的濾波器應用至較大 圖像的提取過程的順序來執(zhí)行提取過程。特征區(qū)域檢測部分3203重復提取過程2次或更 多次,并提取最終候選區(qū)域,從而檢測預定類型的對象。特征區(qū)域檢測部分3203將其中存 在預定類型對象的區(qū)域檢測為特征區(qū)域。這里,在給定提取過程中,特征區(qū)域檢測部分3203 僅將濾波器應用至在恰在之前的提取過程中已經(jīng)提取的區(qū)域。相應地,通過重復的提取過 程,重復地鑒別之后的圖像中存在還是不存在先前圖像中存在的對象,實現(xiàn)了特征區(qū)域的 更精確檢測。此外,由于首先對較小圖像進行了針對特征區(qū)域的粗略濾波,可以更快地檢測 特征區(qū)域。 特征區(qū)域檢測部分3203可以通過使用日本專利申請公開No. 2008-078636中公開 的方法來檢測特征區(qū)域。例如,特征區(qū)域檢測部分3203通過使用多個濾波器來檢測特征區(qū) 域,所述多個濾波器作用于所捕捉的圖像中具有預定大小的相同二維區(qū)域,以計算預定類 型的對象的輪廓和內(nèi)部區(qū)域的任意特征(該特征不同于多個濾波器中的任何其他濾波器 所計算的特征)的量。具體地,特征區(qū)域檢測部分3203通過將多個濾波器應用至所捕捉的 圖像上要從中檢測對象的具有預定大小的區(qū)域,以計算多個特征的量。多個濾波器中的每 一個與主評估值相關(guān)聯(lián),濾波器所計算的特征的量與主評估值進行比較以獲得所涉及的特 征可能屬于預定類型對象的概率的百分比?;谶@種關(guān)聯(lián),特征區(qū)域檢測部分3203鑒別與 每個所計算的特征的量相對應的主評估值。特征區(qū)域檢測部分3203將針對多個濾波器而 分別鑒別的多個主評估值相加,從而獲得次評估值,次評估值表示所濾波區(qū)域中可能存在 預定類型對象的概率的百分比。特征區(qū)域檢測部分3203將次評估值與閾值進行比較,并且 在該區(qū)域中可能存在預定類型對象的概率的百分比高于該閾值的情況下,提取其中存在預 定類型對象的區(qū)域作為特征區(qū)域。通過將提取對象的輪廓和內(nèi)部區(qū)域的各種特征的量的 多個濾波器進行組合,同僅基于例如輪廓的形狀來提取特征區(qū)域相比,特征區(qū)域檢測部分 3203可以更精確地提取特征區(qū)域。 特征區(qū)域檢測部分3203可以將日本專利申請公開No. 2008-078636中描述的方法 和日本專利申請公開No. 2008-078641中描述的方法進行組合,來檢測特征區(qū)域。具體地,2008-078636中描述的方法相結(jié)合來解釋的多個濾波器可以包括 多個濾波器組,其中每個濾波器組是為特定大小的區(qū)域而準備的,即多個濾波器組分別作 用于具有不同大小的區(qū)域,在這些區(qū)域中,每個區(qū)域中包括的像素的數(shù)目以預定比率不同 于或以預定比率逐步不同于其他區(qū)域中的像素數(shù)目。如上所述,每個濾波器可以與合適的 評估值相關(guān)聯(lián)。通過以預定的稀疏比率,使從中檢測到對象的所捕捉的圖像變稀疏,或者以 該稀疏比率逐步使這樣稀疏的圖像進一步變稀疏,特征區(qū)域檢測部分3203產(chǎn)生包括所捕 捉的圖像和一個或更多稀疏圖像在內(nèi)的圖像集合。特征區(qū)域檢測部分3203通過將針對較 窄區(qū)域的多個第一濾波器應用至所產(chǎn)生的圖像集合中相對較小的第一圖像來計算多個特 征的量。特征區(qū)域檢測部分3203基于針對多個第一濾波器中的每一個給出的關(guān)聯(lián),針對所 計算的多個特征中的每一個的量,來鑒別主評估值。特征區(qū)域檢測部分3203將多個主評估 值相加,從而獲得次評估值,該次評估值表示在所濾波區(qū)域中可能存在預定類型對象的概 率的百分比。特征區(qū)域檢測部分3203將所獲得的次評估值與第一閾值進行比較,并且在該 區(qū)域中可能存在預定類型對象的概率的百分比高于該第一閾值的情況下,提取該區(qū)域作為 主候選區(qū)域。 特征區(qū)域檢測部分3203通過將多個第二濾波器應用至圖像集合中的第二圖像中 與主候選區(qū)域相對應的區(qū)域來計算多個特征的量,其中多個第二濾波器針對比多個第一濾 波器所作用于的區(qū)域?qū)捯粋€步長的區(qū)域,所述圖像集合包括比第一圖像中的像素數(shù)目大一 個步長的像素數(shù)目。特征區(qū)域檢測部分3203基于針對多個第二濾波器中的每一個給出的 關(guān)聯(lián),針對所計算的多個特征中的每一個的量,來鑒別主評估值。特征區(qū)域檢測部分3203 將分別與多個第二濾波器相對應的多個主評估值相加,從而獲得次評估值,該次評估值表 示在與主候選區(qū)域相對應的區(qū)域中可能存在預定類型對象的概率的百分比。特征區(qū)域檢測 部分3203將所獲得的次評估值與第二閾值進行比較,并且在該區(qū)域中可能存在預定類型 對象的概率的百分比高于該第二閾值的情況下,提取該區(qū)域作為次候選區(qū)域。
特征區(qū)域檢測部分3203重復將為不同大小的區(qū)域分別準備的多個濾波器組中的 每一個應用至圖像集合中具有相應大小的區(qū)域的提取操作,以提取候選區(qū)域。此時,特征區(qū) 域檢測部分3203按照執(zhí)行針對較窄區(qū)域應用濾波器組的提取過程和針對較寬區(qū)域應用另 一濾波器組的提取過程的順序來執(zhí)行提取過程。具體地,特征區(qū)域檢測部分3203按照執(zhí)行 將為較窄區(qū)域準備的濾波器組應用至較小圖像的提取過程和將為較寬區(qū)域準備的另一濾 波器組應用至較大圖像的提取過程的順序來執(zhí)行提取過程。特征區(qū)域檢測部分3203重復 提取過程2次或更多次,并提取最終候選區(qū)域,從而檢測預定類型的對象。特征區(qū)域檢測部 分3203將其中存在預定類型對象的區(qū)域檢測為特征區(qū)域。 特征區(qū)域檢測部分3203可以使用日本專利申請公開No. 2008-098600中描述的方 法來檢測特征區(qū)域。例如,特征區(qū)域檢測部分3203從多個圖像捕捉設(shè)備3100捕捉運動圖 像中包括的多幅所捕捉的圖像中檢測特征區(qū)域。例如,假定圖像捕捉設(shè)備3100a和圖像捕 捉設(shè)備3100b捕捉與對方所捕捉的相同場景。例如,圖像捕捉設(shè)備3100a和3100b可以用 作立體攝像機。在以下解釋中,可以將圖像捕捉設(shè)備3100a獲得的第一捕捉圖像和圖像捕 捉設(shè)備3100b獲得的第二捕捉圖像稱為成對圖像。特征區(qū)域檢測部分3203從成對圖像中 檢測成對圖像中捕捉的預定類型的對象,并且將其中存在所檢測的預定類型對象的區(qū)域檢 測為特征區(qū)域。
52
特征區(qū)域檢測部分3203從成對的第一和第二捕捉圖像中的每一個中提取其中捕 捉了預定類型對象的區(qū)域。特征區(qū)域檢測部分3203可以以粗略的檢測精度來檢測其中捕 捉了預定類型對象的區(qū)域。特征區(qū)域檢測部分3203通過從第一捕捉圖像中所提取區(qū)域中 以及從第二捕捉圖像中所提取的區(qū)域中檢測一對對應區(qū)域,來檢測預定類型的對象。例如, 特征區(qū)域檢測部分3203計算從成對的對應區(qū)域中的每一個到在所提取區(qū)域中捕捉的對象 的距離。特征區(qū)域檢測部分3203可以基于由所計算的與對象的距離獲得的對象的三維形 狀,來檢測預定類型的對象。 當檢測一對對應區(qū)域時,特征區(qū)域檢測部分3203將從成對的第一和第二捕捉圖 像中的每一幅中提取的、在其中捕捉了預定類型對象的區(qū)域劃分為多個子區(qū)域。特征區(qū)域 檢測部分3203計算表征每個子區(qū)域中的部分圖像的特征量的跨過一些子區(qū)域的矢量。特 征量可以是例如像素值??邕^一些子區(qū)域的矢量可以是例如梯度矢量(例如像素值梯度矢 量)。特征區(qū)域檢測部分3203計算第一圖像中所計算的矢量與第二圖像中所計算的矢量之 間的邏輯距離。如果矢量之間的邏輯距離小于預定值,則特征區(qū)域檢測部分3203將第一圖 像中由矢量所跨過的子區(qū)域組成的區(qū)域和第二圖像中由矢量所跨過的子區(qū)域組成的區(qū)域 檢測為一對對應區(qū)域。邏輯距離可以是例如一個矢量的各個分量與另一矢量的對應分量之 間的差的平方和的平方根。特征區(qū)域檢測部分3203可以以高精度從成對圖像中提取一對 對應區(qū)域,從而可以以高精度計算與對象的距離。因此,特征區(qū)域檢測部分3203可以以高 精度識別對象的三維形狀,并且因此可以以高精度檢測預定類型的對象。
特征區(qū)域檢測部分3203可以使用日本專利申請公開No. 2008-091562中描述的方 法來檢測特征區(qū)域。例如,特征區(qū)域檢測部分3203從運動圖像中包括的多幅所捕捉的圖像 中提取與預定類型的對象類似的推定對象形狀,以及推定對象形狀的尺寸和以圖像捕捉設(shè) 備3100的場角來指示推定對象形狀的位置的位置信息。以該場角表示的位置信息可以例 如是每幅所捕捉的圖像中圖像區(qū)域中的位置。特征區(qū)域檢測部分3203確定所提取的推定 對象形狀所表示的物體是否是預定類型的對象,從而提取預定類型的對象。例如,特征區(qū)域 檢測部分3203可以對從環(huán)繞由推定對象形狀表示的物體的預定搜索區(qū)域中搜索到由推定 對象形狀表示的、具有相同尺寸的物體的次數(shù)進行計數(shù),并可以在計數(shù)大于或等于閾值的 情況下,提取推定對象形狀表示的物體作為預定類型的對象。特征區(qū)域檢測部分3203可以 將包括預定類型對象在內(nèi)的區(qū)域檢測為特征區(qū)域。因此,特征區(qū)域檢測部分3203可以將從 中密集搜索到具有與預定尺寸接近尺寸的物體的圖像區(qū)域中存在的由推定對象形狀表示 的物體檢測為預定類型的對象。特征區(qū)域檢測部分3203不需要將不同于所涉及的圖像區(qū) 域的任何位置中存在的具有推定對象形狀的物體檢測為預定類型的對象。因此,特征區(qū)域 檢測部分3203可以降低錯誤地將不同于所涉及的圖像區(qū)域的任何位置中存在的具有推定 對象形狀的物體檢測為預定類型的對象的可能性。 如果圖像捕捉設(shè)備3100可以以可變場角來捕捉圖像,則以場角表示的前述位置 信息可以例如是圖像捕捉設(shè)備3100捕捉圖像的方向和所捕捉的圖像中位置。如果可以通 過使用多個圖像捕捉設(shè)備3100來捕捉比一個圖像捕捉設(shè)備3100所捕捉的場深度更大的連 續(xù)深度的場,則以場角表示的位置信息可以例如是每個圖像捕捉設(shè)備3100捕捉圖像的方 向,以及每個圖像捕捉設(shè)備3100所捕捉的捕捉圖像中的位置。 當特征區(qū)域檢測部分3203從輸入的運動圖像組成圖像中檢測不同類型的多個特
53征區(qū)域時,圖像質(zhì)量退化部分3281通過降低一種類型的特征區(qū)域的分辨率來由輸入圖像 產(chǎn)生一幅特征區(qū)域圖像,并產(chǎn)生其中另一類型的特征區(qū)域的分辨率高于前述特征區(qū)域圖像 中的分辨率的另一特征區(qū)域圖像。級間差異壓縮部分3286b至3286d對分別與特定類型的 特征區(qū)域相對應的特征區(qū)域圖像進行處理,其中至少預定類型的特征區(qū)域具有與圖像中該 區(qū)域的其余部分不同的分辨率。 具體而言,級間差異壓縮部分3282b對在包括所有特征區(qū)域的區(qū)域中具有最低分 辨率的低分辨率特征區(qū)域圖像進行處理。級間差異壓縮部分3282c對其中預定類型的特征 區(qū)域具有高于低分辨率特征區(qū)域圖像的分辨率的中等分辨率特征區(qū)域圖像進行處理。級間 差異壓縮部分3282d對其中另一預定類型的特征區(qū)域具有高分辨率的高分辨率特征區(qū)域 圖像進行處理。 差異處理部分3287產(chǎn)生特征區(qū)域差異圖像,其中(1) 一種類型的特征區(qū)域和另一 類型的特征區(qū)域均具有空間頻率分量,該空間頻率分量是被變換至空間頻率域的一幅特征 區(qū)域圖像與其對應的放大圖像之間的差異并且(2)不同于該一種類型的特征區(qū)域和該另 一類型的特征區(qū)域的區(qū)域具有數(shù)據(jù)量減少的空間頻率分量。 差異處理部分3287產(chǎn)生特征區(qū)域差異圖像,其中(a) —種類型的特征區(qū)域具有空 間頻率分量,該空間頻率分量是被變換至空間頻率域的一幅特征區(qū)域圖像與其對應的放大 圖像之間的差異,并且(b)不同于該一種類型的特征區(qū)域的區(qū)域具有數(shù)據(jù)量減少的空間頻 率分量,或者產(chǎn)生特征區(qū)域間差異圖像,其中(i)另一類型的特征區(qū)域具有空間頻率分量, 該空間頻率分量是被變換至空間頻率域的另一特征區(qū)域圖像與其中將該另一特征區(qū)域圖 像中的特征區(qū)域放大的放大圖像之間的差異,并且(ii)不同于該另一類型的特征區(qū)域的 區(qū)域具有數(shù)據(jù)量減少的空間頻率分量。 編碼部分3288對特征區(qū)域差異圖像、特征區(qū)域間差異圖像和低質(zhì)量圖像分別進 行編碼。輸出部分3207對運動編碼部分3286a至3286d編碼的位置差信息和編碼部分 3288a至3288d編碼的運動圖像組成圖像(例如低質(zhì)量圖像、特征區(qū)域差異圖像和特征區(qū)域 間差異圖像)進行復用,并輸出復用的數(shù)據(jù)。 從上述解釋顯而易見地,級間差異壓縮部分3282a產(chǎn)生在包括特征區(qū)域在內(nèi)的整 個圖像區(qū)域具有低圖像質(zhì)量的運動圖像組成圖像,即產(chǎn)生具有輸入的運動圖像組成圖像的 低空間頻率分量的運動圖像組成圖像。級間差異壓縮部分3282b產(chǎn)生的運動圖像組成圖像 所具有的頻率分量高于級間差異壓縮部分3282a所產(chǎn)生的圖像的頻率分量并且低于級間 差異壓縮部分3282c所產(chǎn)生的圖像的頻率分量。在級間差異壓縮部分3282b產(chǎn)生的運動圖 像壓縮圖像中,不同于特征區(qū)域的區(qū)域的、與級間差異壓縮部分3282a所產(chǎn)生的運動圖像 組成圖像的差異減小。 類似地,級間差異壓縮部分3282c產(chǎn)生的運動圖像組成圖像所具有的頻率分量高 于級間差異壓縮部分3282b所產(chǎn)生的圖像的頻率分量并且低于級間差異壓縮部分3282d所 產(chǎn)生的圖像的頻率分量。級間差異壓縮部分3282d產(chǎn)生的運動圖像組成圖像的頻率分量高 于級間差異壓縮部分3282c所產(chǎn)生的圖像的頻率分量。在級間差異壓縮部分3282c和級間 差異壓縮部分3282d產(chǎn)生的運動圖像壓縮圖像中,不同于特征區(qū)域的區(qū)域的、與級間差異 壓縮部分3282b和級間差異壓縮部分3282c所產(chǎn)生的運動圖像組成圖像的差異減小。
級間差異壓縮部分3282b至3282d中的每一個可以通過對其中預定類型的特征區(qū)域具有高于其他區(qū)域的圖像質(zhì)量的運動圖像進行處理,來向外提供圖像質(zhì)量根據(jù)特征區(qū)域 的類型而不同的運動圖像。此時,級間差異壓縮部分3282b至3282d可以基于與另一個級 間差異壓縮部分3282所處理的低質(zhì)量運動圖像組成圖像的差異來進行壓縮,因此壓縮變 得高效。 在特征區(qū)域檢測部分3203檢測多個特征區(qū)域中每一個特征區(qū)域的特征的量時, 它可以針對多個特征區(qū)域中的每一個來計算指示所檢測的特征屬于特征區(qū)域的確定程度 的可靠性程度。級間差異壓縮部分3282b至3282d對分辨率根據(jù)特征的量和其可靠性程度 (均是針對多個特征區(qū)域中的每一個而獲得的)而調(diào)整了的特征區(qū)域的圖像進行壓縮。例 如,圖像質(zhì)量退化部分3281可以根據(jù)針對每個特征區(qū)域而獲得的特征的量和可靠性程度, 對多個特征區(qū)域的圖像的分辨率進行調(diào)整,并可以將調(diào)整后的圖像提供給級間差異壓縮部 分3282。例如,圖像質(zhì)量退化部分3281可以將多個特征區(qū)域的圖像改變?yōu)楸雀鶕?jù)特征的量
而預定的分辨率高的分辨率(可靠性程度越低,高的量越大)。 圖像處理設(shè)備3120通過對具有不同分辨率的不同級的多幅圖像之間的差異進行 編碼,來執(zhí)行分級編碼。由此顯而易見,圖像處理設(shè)備3120使用的壓縮方法包括H. 264/SVC 的壓縮方法。 壓縮運動圖像解壓部分3202可以對編碼的運動圖像組成圖像的一些區(qū)域進行解 碼。例如,壓縮運動圖像解壓部分3202可以將編碼的圖像中被幀內(nèi)編碼的這種區(qū)域解碼為 像素值。特征區(qū)域檢測部分3203可以基于壓縮運動圖像解壓部分3202解碼獲得的像素值 來檢測編碼的圖像中的特征區(qū)域。編碼的運動圖像組成圖像是編碼的圖像的一個示例。
具體地,壓縮運動圖像解壓部分3202將編碼的運動圖像組成圖像中的I畫面解碼 為像素值。壓縮運動圖像解壓部分3202可以將運動矢量所參考的區(qū)域和被幀內(nèi)編碼的區(qū) 域解碼為像素值。特征區(qū)域檢測部分3202可以基于壓縮運動圖像解壓部分3202解碼獲得 的像素值來檢測編碼的圖像中的特征區(qū)域。 壓縮部分3240可以使用通過壓縮運動圖像解壓部分3202解碼得到的編碼的數(shù)據(jù)
來對運動圖像組成圖像進行壓縮。具體地,級間差異壓縮部分3282使用編碼的圖像中包括
的編碼的數(shù)據(jù),將不同的圖像質(zhì)量給予特征區(qū)域的圖像和不同于特征區(qū)域的區(qū)域的圖像。
具體地,級間差異壓縮部分3282使用編碼的圖像中包括的編碼的數(shù)據(jù),來將同被給予不同
于特征區(qū)域的區(qū)域的圖像的圖像質(zhì)量相比,較高的圖像質(zhì)量給予特征區(qū)域的圖像。 壓縮運動圖像獲取部分3201獲取多幅編碼的圖像,這些圖像是編碼后的、運動圖
像中包括的多幅運動圖像組成圖像。這里,編碼的圖像可以是MPEG、 H. 264或運動JPEG編
碼的運動圖像中包括的運動圖像組成圖像。級間差異壓縮部分3282使用多個編碼的圖像
中包括的編碼的數(shù)據(jù),來將同被給予不同于特征區(qū)域的區(qū)域的圖像的圖像質(zhì)量相比,較高
的圖像質(zhì)量給予特征區(qū)域的圖像。 壓縮運動圖像解壓部分3202對編碼的圖像的一些部分進行解碼,以獲取編碼的 圖像中至少一些區(qū)域的像素信息和與該像素信息的編碼相關(guān)的編碼信息。特征區(qū)域檢測部 分3203基于像素信息和編碼信息中的至少一個來檢測特征區(qū)域。輸入運動圖像質(zhì)量控制 部分3280和圖像質(zhì)量退化部分3281對像素信息和編碼信息中的至少一個進行處理,并且 將同被給予不同于特征區(qū)域的區(qū)域的圖像的圖像質(zhì)量相比,較高的圖像質(zhì)量給予特征區(qū)域 的圖像。級間差異壓縮部分3282基于編碼信息來對像素信息進行編碼。
55
壓縮運動圖像獲取部分3201獲取多幅編碼的圖像,這些圖像是由運動矢量編碼的多幅運動圖像組成圖像。壓縮運動圖像解壓部分3202對編碼的圖像的一些部分進行解碼,以獲取像素信息和運動矢量。特征區(qū)域檢測部分3203基于像素信息和運動矢量中的至少一個來檢測編碼的圖像中的特征區(qū)域。輸入運動圖像質(zhì)量控制部分3280和圖像質(zhì)量退化部分3281對像素信息和編碼信息中的至少一個進行處理,并且將同被給予不同于特征區(qū)域的區(qū)域的圖像的圖像質(zhì)量相比,較高的圖像質(zhì)量給予特征區(qū)域的圖像。級間差異壓縮部分3282基于運動矢量來對像素信息進行編碼。 壓縮運動圖像獲取部分3201獲取編碼的圖像,這些圖像是基于通過將像素數(shù)據(jù)變換至空間頻率域而獲得的變換系數(shù)并基于運動矢量來編碼的。壓縮運動圖像解壓部分3202對編碼的圖像的一些部分進行解碼,以獲取變換系數(shù)和運動矢量。級間差異壓縮部分3282通過減少指示空間頻率大于預定頻率的頻率分量的變換系數(shù)的信息量,來將同被給予不同于特征區(qū)域的區(qū)域的圖像的圖像質(zhì)量相比,較高的圖像質(zhì)量給予特征區(qū)域的圖像。
壓縮運動圖像獲取部分3201獲取編碼的圖像,這些圖像是基于運動矢量起始的區(qū)域與運動矢量所參考的部分區(qū)域之間圖像的差異來編碼的。特征區(qū)域檢測部分3203將其中包括運動對象的運動圖像中的區(qū)域檢測為特征區(qū)域。級間差異壓縮部分3282將運動矢量與不同于特征區(qū)域的區(qū)域的圖像之間的差異改變?yōu)橹甘静煌谔卣鲄^(qū)域的區(qū)域具有與另一運動圖像組成圖像中的部分區(qū)域相同圖像內(nèi)容的值。具體地,如上所述,級間差異壓縮部分3282b至3282d將不同于特征區(qū)域的區(qū)域的運動矢量改變?yōu)?,并將不同于特征區(qū)域的區(qū)域的圖像的差異信息改變?yōu)?。 圖21示出了壓縮控制部分3250的一示例模塊配置。壓縮控制部分3250包括編碼方式存儲部分3410、編碼方式獲取部分3412、編碼方式選擇部分3420、位置差計算部分3440和相同對象區(qū)域標識部分3430。 編碼方式存儲部分3410以與對象的特征的量相關(guān)聯(lián)的方式存儲編碼方式。具體地,編碼方式存儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲編碼方式。編碼方式選擇部分3420選擇編碼方式存儲部分3410中以與特征區(qū)域檢測部分3203所檢測的特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式來存儲的編碼方式。 壓縮部分3240使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的編碼方式,來對多個特征區(qū)域的圖像進行壓縮。具體地,壓縮部分3240使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的編碼方式,來對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。 更具體地,編碼方式存儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲或為幀內(nèi)編碼或為幀間編碼的編碼方式。壓縮部分3240使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的幀內(nèi)編碼方式或幀間編碼方式,來對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。 編碼方式存儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲指示用于幀內(nèi)編碼的幀內(nèi)預測方向的編碼方式。壓縮部分3240通過按照編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的方向來執(zhí)行幀內(nèi)預測,對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。
編碼方式存儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲指示用于幀間編碼的運動預測單元的編碼方式。壓縮部分3240通過使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的運動預測單元來執(zhí)行運動預測,對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。 編碼方式存儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲要被用作對運動圖像組成圖像進行編碼的編碼單元的部分區(qū)域的大小。壓縮部分3240通過將特征區(qū)域中包括的每個對象的圖像劃分為具有編碼方式存儲部分3410中以與對象的類型相關(guān)聯(lián)的方式存儲的大小的部分區(qū)域,來對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。 編碼方式存儲部分3410以與對象大小相關(guān)聯(lián)的方式存儲要被用作對運動圖像組成圖像進行編碼的編碼單元的部分區(qū)域的大小。壓縮部分3240通過將特征區(qū)域中包括的每個對象的圖像劃分為具有編碼方式存儲部分3410中以與對象的大小相關(guān)聯(lián)的方式存儲的大小的部分區(qū)域,來對多幅運動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。 如上所述,壓縮部分3240使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的特征的量相關(guān)聯(lián)的方式存儲的編碼方式,來對多個特征區(qū)域的圖像分別進行壓縮。編碼方式存儲部分3410可以以與對象的類型相關(guān)聯(lián)的方式來存儲設(shè)置目標碼量的編碼方式。在這種情況下,壓縮部分3240使用編碼方式存儲部分3410中以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的編碼方式,來對圖像中多個特征區(qū)域的圖像分別進行壓縮。 具體地,編碼方式存儲部分3410以與對象的類型相關(guān)聯(lián)的方式,存儲指示量化步長的編碼方式。壓縮部分3240通過使用編碼方式存儲部分3410以與多個特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的量化步長來對圖像中的多個特征區(qū)域的圖像進行量化,以分別對其進行壓縮。 相同對象區(qū)域標識部分3430從另一運動圖像組成圖像中,對包括與多幅運動圖像組成圖像中的一幅運動圖像組成圖像的特征區(qū)域中包括的對象相同的對象的特征區(qū)域進行標識。位置差計算部分3440計算位置差,該位置差是相同對象區(qū)域標識部分3430所標識的該另一運動圖像組成圖像中的特征區(qū)域的位置與該一幅運動圖像組成圖像中特征區(qū)域的位置之間的差異。 對于相同對象區(qū)域標識部分3430所標識的該另一運動圖像組成圖像中的特征區(qū)域的至少部分區(qū)域的圖像,壓縮部分3240通過將至少該部分區(qū)域的圖像與該一幅運動圖像組成圖像中與該部分區(qū)域的位置相距所計算的位置差的位置周圍的區(qū)域的圖像進行比較,來對至少該部分區(qū)域的圖像進行壓縮。具體地,運動分析部分3285通過將相同對象區(qū)域標識部分3430所標識的、該另一運動圖像組成圖像中的特征區(qū)域的至少該部分區(qū)域的圖像與該一幅運動圖像組成圖像中與該部分區(qū)域的位置相距所計算的位置差的位置周圍的區(qū)域的圖像進行比較,來計算該一幅運動圖像組成圖像與該另一運動圖像組成圖像之間的圖像內(nèi)容的改變量。運動分析部分3285將該另一運動圖像組成圖像中的特征區(qū)域中包括的多個部分區(qū)域中每一個部分區(qū)域的圖像與該一幅運動圖像組成圖像中與該部分區(qū)域的位置相距所計算的位置差的位置周圍的部分區(qū)域的圖像進行比較,從而計算多個部分區(qū)
57域中的每一個部分區(qū)域中組成圖像之間圖像內(nèi)容的改變量。 在這種情況下,差異獲得目標區(qū)域確定部分3294針對該另一運動圖像組成圖像
中的特征區(qū)域中包括的一個部分區(qū)域和另一部分區(qū)域中的每一個,基于圖像內(nèi)容的改變量
來確定比較目標部分區(qū)域,該比較目標部分區(qū)域是該一幅運動圖像組成圖像中與該另一運
動圖像組成圖像中的該一個部分區(qū)域或該另一部分區(qū)域相距所計算的位置差的位置周圍
的部分區(qū)域。差異處理部分3287通過將該一個部分區(qū)域和該另一部分區(qū)域的圖像與差異
獲得目標區(qū)域確定部分3294分別針對這些部分區(qū)域而確定的比較目標部分區(qū)域的圖像進
行比較,來對該一個部分區(qū)域和該另一部分區(qū)域的圖像進行壓縮。運動編碼部分3286對指
示該一個部分區(qū)域的位置與針對該一個部分區(qū)域所確定的比較目標部分區(qū)域的位置之間
的差異的部分區(qū)域位置差進行壓縮,并對指示該另一部分區(qū)域的位置與針對該另一部分區(qū)
域所確定的比較目標部分區(qū)域的位置之間的差異的部分區(qū)域位置差進行壓縮。 注意,差異獲得目標區(qū)域確定部分3294針對該一個部分區(qū)域和該另一部分區(qū)域
中的至少一個來確定比較目標部分區(qū)域,以使得與該一個部分區(qū)域相關(guān)的部分區(qū)域位置差
和與該另一部分區(qū)域相關(guān)的部分區(qū)域位置差之間的差異變得小于預定值。運動編碼部分
3286通過將與該一個部分區(qū)域相關(guān)的部分區(qū)域位置差同與該另一部分區(qū)域相關(guān)的部分區(qū)
域位置差進行比較,來對與該一個部分區(qū)域相關(guān)的部分區(qū)域位置差進行壓縮。如上所述,運
動編碼部分3286基于部分區(qū)域位置差之間的差異來對其進行壓縮,因此可以通過更多地
減小部分區(qū)域位置差來更多地壓縮數(shù)據(jù)。 差異處理部分3287通過獲得每個部分區(qū)域與差異獲得目標區(qū)域確定部分3294針 對該部分區(qū)域而確定的比較目標部分區(qū)域之間的差異,來對該一個部分區(qū)域和該另一部分 區(qū)域的圖像進行壓縮。運動編碼部分3286通過獲得與該一個部分區(qū)域相關(guān)的部分區(qū)域位 置差和與該另一部分區(qū)域相關(guān)的部分區(qū)域位置差之間的差異,來對與該一個部分區(qū)域相關(guān) 的部分區(qū)域位置差進行壓縮。 相同對象區(qū)域標識部分3430從多幅運動圖像組成圖像中標識包括相同對象的特 征區(qū)域。位置差計算部分3440針對相同對象區(qū)域標識部分3430所標識的多幅運動圖像組 成圖像中每種類型的特征區(qū)域來計算位置差。運動分析部分3285針對相同對象區(qū)域標識 部分3430從其中標識出特征區(qū)域的多幅運動圖像組成圖像中的每一幅,通過將包括相同 對象的該特征區(qū)域的至少部分區(qū)域的圖像與另一運動圖像組成圖像中與至少該部分區(qū)域 的位置相距所計算的位置差的位置周圍的區(qū)域的圖像進行比較,來計算該運動圖像組成圖 像與另一運動圖像組成圖像之間圖像內(nèi)容的改變量。壓縮部分3240基于圖像內(nèi)容的改變 量來壓縮至少該部分區(qū)域的圖像。具體地,壓縮部分3240基于圖像內(nèi)容的改變量來對多個 部分區(qū)域中每一個的圖像進行壓縮。 相同對象區(qū)域標識部分3430從應當被幀間編碼的多幅運動圖像組成圖像中,標
識包括相同對象的特征區(qū)域。具體地,相同對象區(qū)域標識部分3430從應當被編碼為P畫面
或B畫面的多幅運動圖像組成圖像中,標識包括相同對象的特征區(qū)域。 根據(jù)本發(fā)明的差異獲得目標區(qū)域確定部分3294和運動編碼部分3286分別用作確
定上述比較目標部分區(qū)域的比較目標區(qū)域確定部分和對上述部分區(qū)域位置差進行壓縮的
運動壓縮部分。運動分析部分3285用作計算上述圖像內(nèi)容的改變量的改變計算部分。位
置差信息改變部分3290、運動編碼部分3286、圖像解碼部分3292、圖像放大部分3293、像素值改變部分3291、差異處理部分3287和編碼部分3288用作基于圖像內(nèi)容的改變量來壓縮 圖像的圖像壓縮部分。 在以上解釋中,運動分析部分3285計算運動矢量,作為圖像內(nèi)容的改變量的一個 示例。圖像內(nèi)容的改變量不僅可以是例如運動矢量表示的、部分區(qū)域的平行位移量,也可以 是圖像放大/縮減量、圖像旋轉(zhuǎn)量和圖像失真量中的至少一個。壓縮部分3240可以基于圖 像放大/縮減量、圖像旋轉(zhuǎn)量和圖像失真量來壓縮運動圖像組成圖像。例如,壓縮部分3240 可以與上述基于運動補償來標識比較目標圖像(要獲得與其的差異)相同的方式,基于圖 像放大/縮減量、圖像旋轉(zhuǎn)量和圖像失真量中的至少一個,來產(chǎn)生比較目標圖像(要獲得與 其的差異)。 編碼方式獲取部分3412從圖像處理設(shè)備3120外部獲取信息以存儲在編碼方式存 儲部分3410中。具體地,編碼方式獲取部分3412以與對象的特征的量相關(guān)聯(lián)的方式來獲 取編碼方式。編碼方式獲取部分3412可以以與對象的特征的量相關(guān)聯(lián)的方式,獲取多種編 碼方式和選擇這些編碼方式的順序。編碼方式存儲部分3410可以以與對象的特征的量相 關(guān)聯(lián)的方式來存儲編碼方式獲取部分3412以與對象的特征的量相關(guān)聯(lián)的方式獲取的編碼 方式。 如上所述,對象的特征的量可以是例如對象的類型、對象的大小等等。例如,編碼 方式可以是幀內(nèi)編碼或幀間編碼、幀內(nèi)預測的方向、運動預測的單元、要用作編碼單元的部 分區(qū)域的大小、目標碼量和量化步長等等。編碼方式獲取部分3412可以經(jīng)由通信網(wǎng)絡(luò)3110 從圖像處理設(shè)備3170或顯示設(shè)備3180獲取包括這些編碼方式的信息。例如,圖像處理設(shè) 備3170可以經(jīng)由通信網(wǎng)絡(luò)3110向圖像處理設(shè)備3120發(fā)送適于未使用并且在圖像DB 3175 中包括的記錄介質(zhì)中可用的存儲器容量的編碼方式。例如,圖像處理設(shè)備3170可以向圖像 處理設(shè)備3120發(fā)送指定在未使用的存儲器容量不足時可以將數(shù)據(jù)編碼為較小碼量的編碼 方式的信息。 圖22示出了根據(jù)另一實施例的圖像處理設(shè)備3120的一示例模塊配置。圖像處理 設(shè)備3120包括壓縮運動圖像獲取部分3201、壓縮運動圖像解壓部分3202、特征區(qū)域檢測部 分3203、圖像劃分部分3204、圖像產(chǎn)生部分3205、值固定單元3210、退化單元3220、編碼單 元3230、壓縮控制部分3250、關(guān)聯(lián)處理部分3206、條件存儲部分3260和輸出部分3207。
壓縮運動圖像獲取部分3201、壓縮運動圖像解壓部分3202、特征區(qū)域檢測部分 3203、圖像劃分部分3204、圖像產(chǎn)生部分3205和條件存儲部分3260的每個組件的功能和操 作與參照圖19至21所解釋的、由相同參考標號表示的組件的功能和操作總體相同。因此 不再解釋這些組件。 值固定單元3210包括多個值固定部分3211a至3211c(以下可以統(tǒng)稱為值固定部 分3211)。退化單元3220包括多個圖像質(zhì)量退化部分3221a至3221d(以下可以統(tǒng)稱為圖 像質(zhì)量退化部分3221)。 編碼單元3230包括背景區(qū)域運動圖像編碼部分3231a和多個特征區(qū)域運動圖像 編碼部分3231b至3231d(以下可以統(tǒng)稱為特征區(qū)域運動圖像編碼部分3231)。注意,背景 區(qū)域運動圖像編碼部分3231a和特征區(qū)域運動圖像編碼部分3231b至3231d有時可以統(tǒng)稱 為編碼部分3231。 圖像質(zhì)量退化部分3221a和背景區(qū)域運動圖像編碼部分3231a用作壓縮部分
593240a。圖像質(zhì)量退化部分3221b和特征區(qū)域運動圖像編碼部分3231b用作壓縮部分 3240b。類似地,圖像質(zhì)量退化部分3221c和特征區(qū)域運動圖像編碼部分3231c用作壓縮 部分3240c。圖像質(zhì)量退化部分3221d和特征區(qū)域運動圖像編碼部分3231d用作壓縮部分 3240d。多個壓縮部分3240a至3240d可以統(tǒng)稱為壓縮部分3240。 壓縮運動圖像獲取部分3201獲取壓縮的運動圖像。具體地,壓縮運動圖像獲取部 分3201獲取由圖像捕捉設(shè)備3100產(chǎn)生的捕捉運動圖像的編碼后的數(shù)據(jù)。壓縮運動圖像解 壓部分3202恢復壓縮運動圖像獲取部分3201獲取的運動圖像,以產(chǎn)生運動圖像中包括的 多幅運動圖像組成圖像。具體地,壓縮運動圖像解壓部分3202對壓縮運動圖像獲取部分 3201獲取的捕捉運動圖像數(shù)據(jù)進行解碼,以產(chǎn)生運動圖像中包括的多幅運動圖像組成圖 像。運動圖像組成圖像包括幀圖像和場圖像。 特征區(qū)域檢測部分3203從運動圖像中包括的多幅運動圖像組成圖像中檢測特征 區(qū)域。圖像劃分部分3204將多幅運動圖像組成圖像中的每一幅劃分為特征區(qū)域和背景區(qū) 域。 圖像產(chǎn)生部分3205從多幅運動圖像組成圖像中提取特征區(qū)域圖像,從而產(chǎn)生多 幅特征區(qū)域壓縮用運動圖像,其中每一幅特征區(qū)域壓縮用運動圖像包括多幅所提取的特征 區(qū)域圖像中不同的一幅。具體地,圖像產(chǎn)生部分3205拷貝所獲取的運動圖像來產(chǎn)生多幅特 征區(qū)域壓縮用運動圖像(其中每一幅是要壓縮的相應特征區(qū)域運動圖像的基礎(chǔ))和背景區(qū) 域壓縮用運動圖像(其為要壓縮的背景區(qū)域運動圖像的基礎(chǔ))。 值固定部分3211中的每一個對相應特征區(qū)域壓縮用運動圖像中包括的多幅運動 圖像組成圖像中不同于特征區(qū)域圖像的區(qū)域中的像素值給予固定值。例如,值固定部分 3211將不同于特征區(qū)域圖像的區(qū)域中的像素值設(shè)置為預定值(例如亮度值為0)。壓縮部分 3240中的每一個以與對應特征區(qū)域壓縮用運動圖像的特征的量相對應的強度,對包括其中 不同于特征區(qū)域圖像的區(qū)域中的像素值被設(shè)為固定值的多幅運動圖像組成圖像在內(nèi)的對 應特征區(qū)域壓縮用運動圖像進行壓縮。按照這種方式,壓縮部分3240以與相應運動圖像的 特征的量相對應的強度,對多幅特征區(qū)域壓縮用運動圖像和背景區(qū)域壓縮用運動圖像進行 壓縮。 如上所述,特征區(qū)域檢測部分3203從圖像中檢測特征區(qū)域。圖像劃分部分3204 將圖像劃分為特征區(qū)域和不同于特征區(qū)域的背景區(qū)域。壓縮部分3240以不同的強度對表 示特征區(qū)域的特征區(qū)域圖像和表示背景區(qū)域的背景區(qū)域圖像分別進行壓縮。每一個壓縮部 分3240以對應的強度對包括多幅運動圖像組成圖像(其中包括對應的特征區(qū)域圖像)的 對應特征區(qū)域運動圖像和包括多幅運動圖像組成圖像(其中包括背景區(qū)域圖像)的背景區(qū) 域運動圖像進行壓縮。 壓縮部分3240b、壓縮部分3240c和壓縮部分3240d被預先分配以特征區(qū)域運動圖 像的類型以進行壓縮,因此壓縮部分3240b、壓縮部分3240c和壓縮部分3240d分別對預先 分配給它們的類型的特征區(qū)域運動圖像進行壓縮。針對相應特征類型,預先確定對特征區(qū) 域運動圖像進行壓縮的壓縮強度,并且壓縮部分3240b、壓縮部分3240c和壓縮部分3240d 以針對這些類型預定的壓縮強度,對預先分配給它們的類型的特征區(qū)域運動圖像進行壓 縮。按照這種方式,壓縮部分3240對多個區(qū)域同時進行壓縮,其中壓縮器是針對圖像劃分 部分3204所劃分的圖像區(qū)域分別準備的。
壓縮部分3240可以由一個壓縮器來實現(xiàn),使得可以依次地一次一個地壓縮多幅 特征區(qū)域運動圖像和背景區(qū)域運動圖像。在另一示例中,壓縮部分3240可以通過針對圖像 劃分部分3204劃分的每個區(qū)域使用針對特征區(qū)域的類型或針對背景預定的壓縮率,對壓 縮運動圖像解壓部分3202解碼的捕捉運動圖像進行壓縮,來產(chǎn)生一運動圖像數(shù)據(jù)。
特征區(qū)域檢測部分3203從運動圖像中包括的多幅運動圖像組成圖像中檢測不同 類型的多個特征區(qū)域。圖像劃分部分3204將多幅運動圖像組成圖像劃分為多個特征區(qū)域 和不同于多個特征區(qū)域的背景區(qū)域。壓縮部分3240以與圖像的特征的量相對應的強度,對 多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像進行壓縮。特征的量包括對象類型、對象大小、 運動對象運動的速度和特征區(qū)域的大小。 具體地,對于多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像,圖像質(zhì)量退化部分 3221通過根據(jù)其特征的量對運動圖像的圖像質(zhì)量進行退化,來對其進行壓縮。更具體地, 對于多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像,圖像質(zhì)量退化部分3221通過根據(jù)其特 征的量降低分辨率或幀率,來對其進行壓縮。對于多幅特征區(qū)域運動圖像和背景區(qū)域運動 圖像,編碼部分3231通過使用與其特征的量相對應的設(shè)置值對其進行編碼,來對其進行壓 縮。例如,對于多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像,編碼部分3231通過使用針對 其特征的量而分配的碼量對其進行編碼,來分別對其進行壓縮。 特征區(qū)域檢測部分3203針對多個特征區(qū)域中的每一個,計算在檢測特征區(qū)域的 特征的量時獲得的可靠性程度。對于多幅特征區(qū)域運動圖像,壓縮部分3240以與其特征的 量和可靠性程度相對應的強度來對其進行壓縮。例如,對于多幅特征區(qū)域運動圖像,圖像 質(zhì)量退化部分3221通過根據(jù)其特征的量和可靠性程度降低分辨率或幀率,來對其進行壓 縮。對于多幅特征區(qū)域運動圖像,編碼部分3231通過使用與其特征的量和可靠性程度相對 應的設(shè)置值對其進行編碼,來對其進行壓縮。例如,對于多幅特征區(qū)域運動圖像,壓縮部分 3240可以以比與其特征的量相對應的強度低的強度(可靠性程度越低,低的量越大)來對 其進行壓縮。 關(guān)聯(lián)處理部分3206將通過對多幅特征區(qū)域運動圖像和背景區(qū)域運動圖像進行壓 縮而產(chǎn)生的多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)互相關(guān)聯(lián)(例如附加添 加標記信息等)。輸出部分3207將由關(guān)聯(lián)處理部分3206關(guān)聯(lián)的多個特征區(qū)域運動圖像數(shù) 據(jù)和背景區(qū)域運動圖像數(shù)據(jù)發(fā)送至通信網(wǎng)絡(luò)3110。 在圖22的配置中,圖像處理設(shè)備3120中包括的多個壓縮部分3240對多個特征區(qū)
域的圖像和背景區(qū)域的圖像分別進行壓縮,而在另一配置中,圖像處理設(shè)備3120可以包括
一個壓縮部分3240,使得該一個壓縮部分3240可以使用不同的編碼方式對多個特征區(qū)域
的圖像和背景區(qū)域的圖像分別進行壓縮。例如,可以以時分方式,將多個特征區(qū)域的圖像和
背景區(qū)域的圖像依次提供給該一個壓縮部分3240,并且該一個壓縮部分3240可以使用不
同的編碼方式,依次對多個特征區(qū)域的圖像和背景區(qū)域的圖像分別進行壓縮。 例如,該一個壓縮部分3240可以以不同的量化系數(shù)對多個特征區(qū)域的圖像信息
和背景區(qū)域的圖像信息分別進行量化。備選地,可以將已被改變?yōu)榫哂谢ゲ幌嗤瑘D像質(zhì)量
的多個特征區(qū)域的圖像和背景區(qū)域的圖像提供給該一個壓縮部分3240,并且該一個壓縮部
分3240可以使用不同的編碼方式,對所提供的多個特征區(qū)域和背景區(qū)域的圖像分別進行壓縮。
在一個壓縮部分3240以不同的量化系數(shù)對相應區(qū)域進行量化或者對被改變?yōu)榫?有不同圖像質(zhì)量的相應區(qū)域的圖像進行壓縮的上述實施例中,該一個壓縮部分3240可以 對單一圖像進行壓縮,或者可以對圖像劃分部分3204劃分的圖像進行壓縮(如參照圖22 所述)。當一個壓縮部分3240對單一圖像進行壓縮時,圖像劃分部分3204和值固定部分 3211不需要執(zhí)行其圖像劃分和值固定操作。因此,圖像處理設(shè)備3120不一定必須包括圖像 劃分部分3204和值固定單元3210。 圖23示出了編碼部分3231的一示例模塊配置。每個編碼部分3231包括運動分析 部分3285、差異處理部分3287、運動編碼部分3286和編碼部分3288。運動分析部分3285 包括差異獲得目標區(qū)域確定部分3294和位置差信息產(chǎn)生部分3295。差異處理部分3287包 括差分像素圖像產(chǎn)生部分3296、空間頻率域變換部分3297和量化部分3298。圖23所示的 組件的功能和操作與參照圖20A至20C解釋的由相同參考標號表示的組件的功能和操作總 體相同。因此不再解釋這些組件,除非存在任何差異。 差分像素圖像產(chǎn)生部分3296基于作為壓縮目標的部分區(qū)域的像素信息與作為差 異獲得目標區(qū)域確定部分3294所確定的差異獲得目標的部分區(qū)域的像素信息之間的差 異,來產(chǎn)生差分像素圖像。編碼部分3288通過對量化部分3298量化的變換系數(shù)進行編碼來 壓縮圖像。運動編碼部分3286對位置差信息產(chǎn)生部分3295提供的位置差信息進行編碼, 并將編碼的位置差信息提供給輸出部分3207。差異獲得目標區(qū)域確定部分3294基于壓縮 控制部分3250提供的特征區(qū)域信息,來確定運動圖像組成圖像(其圖像質(zhì)量被圖像質(zhì)量退 化部分3221退化)的差異獲得目標區(qū)域。 圖24示出了圖像處理設(shè)備3170的一示例模塊配置。圖像處理設(shè)備3170包括壓縮 運動圖像獲取部分3301、關(guān)聯(lián)分析部分3302、壓縮運動圖像解壓單元3310、組合部分3303 和輸出部分3304。壓縮運動圖像解壓單元3310包括多個壓縮運動圖像解壓部分3311a至 3311d(以下可以統(tǒng)稱為壓縮運動圖像解壓部分3311)。以下要解釋的是用于對從參照圖21 至圖23解釋的圖像處理設(shè)備3120獲取的運動圖像數(shù)據(jù)進行處理的圖像處理設(shè)備3170的 每個組件的功能和操作。 壓縮運動圖像獲取部分3301獲取輸出部分3207輸出的、互相關(guān)聯(lián)的多個特征區(qū) 域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)。例如,關(guān)聯(lián)分析部分3302對附加的標記信息進 行分析,以檢索壓縮運動圖像獲取部分3301獲取的、互相關(guān)聯(lián)的多個特征區(qū)域運動圖像數(shù) 據(jù)和背景區(qū)域運動圖像數(shù)據(jù)。 壓縮運動圖像解壓部分3311對多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像 數(shù)據(jù)分別進行解碼。具體地,壓縮運動圖像解壓部分3311a對背景區(qū)域運動圖像數(shù)據(jù)進行 解碼。壓縮運動圖像解壓部分3311b至3311d中的每一個對多個特征區(qū)域運動圖像數(shù)據(jù)中 的一個特征區(qū)域運動圖像進行解碼。從而,獲得多幅特征區(qū)域運動圖像和背景區(qū)域運動圖 像。針對特征的類型分別提供壓縮運動圖像解壓部分3311b至3311d,壓縮運動圖像解壓部 分3311b至3311d中的每一個對一種類型的特征區(qū)域運動圖像數(shù)據(jù)進行解碼。
組合部分3303將通過壓縮運動圖像解壓部分3311解碼而獲得的運動圖像組成圖 像組合在一起。具體地,組合部分3303產(chǎn)生運動圖像組成圖像,其中將從壓縮運動圖像解 壓部分3311b至3311d解碼得到的多幅特征區(qū)域運動圖像中包括的運動圖像組成圖像中 特征區(qū)域的圖像覆蓋至背景區(qū)域運動圖像中包括的運動圖像組成圖像上。輸出部分3304將組合部分3303所產(chǎn)生的包括多幅運動圖像組成圖像在內(nèi)的運動圖像提供給顯示設(shè)備 3180。輸出部分3304可以將組合部分2303所產(chǎn)生的包括多幅運動圖像組成圖像在內(nèi)的運 動圖像記錄在圖像DB3175中。圖像處理設(shè)備3170可以將輸出部分3207輸出的多個特征區(qū) 域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)關(guān)聯(lián)地記錄在圖像DB 3175中。在這種情況下, 壓縮運動圖像獲取部分3301可以獲取圖像DB3175中記錄的、互相關(guān)聯(lián)的多個特征區(qū)域運 動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)。 根據(jù)本實施例,壓縮運動圖像解壓單元3310包括多個壓縮運動圖像解壓部分 3311,而在另一實施例中,壓縮運動圖像解壓單元3310中包括的一個壓縮運動圖像解壓部 分3311可以依次對背景區(qū)域運動圖像數(shù)據(jù)和多個特征區(qū)域運動圖像數(shù)據(jù)進行解碼。當圖 像處理設(shè)備3120將多個特征區(qū)域運動圖像數(shù)據(jù)和背景區(qū)域運動圖像數(shù)據(jù)作為單一運動圖 像數(shù)據(jù)來提供時,該一個壓縮運動圖像解壓部分3311可以對該單一運動圖像數(shù)據(jù)進行解 碼,并且輸出部分3304可以輸出解碼操作所獲得的運動圖像。 當圖像處理設(shè)備3170對參照圖19至圖21來解釋的圖像處理設(shè)備3120所產(chǎn)生的 運動圖像數(shù)據(jù)進行處理時,圖像處理設(shè)備3170獲取級間差異壓縮部分3282a至3282d分別 壓縮的多個運動圖像組成圖像集合。圖像處理設(shè)備3170對所獲取的多個運動圖像組成圖 像集合中的每一個進行解碼。圖像處理設(shè)備3170將通過解碼獲得的多個運動圖像組成圖 像集合中的對應圖像疊加在一起,以產(chǎn)生組合圖像。圖像處理設(shè)備3170將包括所產(chǎn)生的組 合圖像作為其組成圖像的運動圖像提供給顯示設(shè)備3180。 圖25是示出了編碼方式存儲部分3140中存儲的示例數(shù)據(jù)的表。編碼方式存儲 部分3410存儲對象類型、編碼模式、幀內(nèi)預測的方向、運動補償?shù)膯卧?、宏塊大小和量化步 長。 對象類型可以是用于標識運動圖像組成圖像中所捕捉的對象的類型的信息。編碼 模式可以是用于標識部分區(qū)域應當是幀內(nèi)編碼還是幀間編碼的信息。 幀內(nèi)預測的方向指示在要對塊進行幀內(nèi)編碼時的預測方向。例如,幀內(nèi)預測的方 向可以是用于標識對幀內(nèi)塊中的像素值進行預測的預測模式(預測模式是根據(jù)例如H. 264 方案的方法)的信息。例如,幀內(nèi)預測的方向可以是指示是否要基于塊中的平均來預測像 素值的信息,或者可以是指示像素的信息(參考該像素的像素值和位置來預測相同塊中像 素的像素值)。 運動補償?shù)膯卧梢允侵甘緣K中運動矢量的精度的信息。宏塊大小可以是指示宏 塊大小的信息。宏塊大小可以是特征區(qū)域的按單位面積計算的宏塊大小。在這種情況下, 當特征區(qū)域的面積較大時,壓縮部分3240可以使用較大的宏塊大小。量化步長可以是指示 量化步長的校正值的信息。將參照圖26和圖27來解釋量化步長。 優(yōu)選地,編碼方式存儲部分3410存儲適于對象類型所標識的對象所擁有的特征 空間頻率分量的幀內(nèi)預測的方向。例如,編碼方式存儲部分3410可以以與預期包括更多垂 直邊緣的對象的類型相關(guān)聯(lián)的方式,存儲基于上方像素的像素值來預測像素的像素值的預 測模式O作為幀內(nèi)預測的方向。 編碼方式存儲部分3410可以以與預期包括更多水平邊緣的對象的類型相關(guān)聯(lián)的 方式,存儲基于左側(cè)像素的像素值來預測像素的像素值的預測模式1作為幀內(nèi)預測的方 向。編碼方式存儲部分3410可以以與預期包括更多低頻分量的對象的類型相關(guān)聯(lián)的方式,
63或者以與預期包括許多顏色的對象的類型相關(guān)聯(lián)的方式,存儲基于平均來預測像素的像素 值的預測模式2作為幀內(nèi)預測的方向。 編碼方式選擇部分3420可以根據(jù)在檢測特征區(qū)域時獲得的可靠性程度,確定是 否基于對象類型來選擇任何編碼方式。例如,在檢測中的可靠性程度高于預定值的條件下, 編碼方式選擇部分3420可以基于對象類型來選擇任何編碼方式。 圖26示出了編碼方式存儲部分3410中存儲的示例量化步長校正值。編碼方式存 儲部分3410存儲用于對量化部分3298所使用的量化表的每個字段處的量化步長值進行校 正的校正值。在圖26的示例中,該表示出了用于要應用至4X4宏塊的量化步長的校正值 △quv。這里,u禾口 v = 0, 1,2禾口 3。 該表中左上角字段中的值A(chǔ)q。。指示用于對要應用至指示DC分量的空間頻率域值 的量化步長進行校正的校正值。向右和向下字段上的值A(chǔ)quv指示用于要應用至更高空間 頻率分量值的量化步長的校正值。 適應于對象類型、圖像復雜度和編碼差異,編碼方式存儲部分3410可以存儲各種 頻率分量的量化步長校正值A(chǔ)quv。圖像復雜度索引可以是針對宏塊中包括的每個像素而 計算的、所涉及的像素的像素值與宏塊中包括的像素的平均像素值之間的差異的絕對值之 和。備選地,圖像復雜度索引可以是通過使用高通濾波器(如拉普拉斯濾波器)來處理宏 塊中的圖像而獲得的、宏塊中圖像的高頻分量的大小。 編碼方式存儲部分3410可以針對較高圖像復雜度存儲較大的量化步長校正值 Aquv。因此,較大的量化步長用于更復雜的圖像內(nèi)容??梢灶A期,當圖像更加復雜時,指示 高頻分量的空間頻率域值將更大。由于編碼方式存儲部分3410針對更復雜的圖像存儲較 大的量化步長校正值A(chǔ)quv,因此將以較大的量化步長來處理更復雜的圖像,這將造成減少 了量化后的圖像的信息量。 編碼方式存儲部分3410可以針對較大的編碼差異來存儲較小的量化步長校正值 Aquv。編碼差異可以是指示經(jīng)歷有損編碼之前的圖像和經(jīng)歷有損編碼之后的圖像之間的差 異量的值。例如,編碼差異可以是至少編碼前后之間的編碼差異,或者是量化前后之間的量 化差異。可以預期,隨著編碼差異越大,圖像質(zhì)量越低,而編碼方式存儲部分3410以與較大 編碼差異相關(guān)聯(lián)的方式存儲較小的量化步長校正值A(chǔ)quv。因此,可以針對較大的編碼差異 選擇較小的量化步長,這將造成增加了編碼后的圖像的信息量。按照這種方式,根據(jù)對象類 型、圖像復雜度和編碼差異來確定量化步長。 量化差異可以是量化部分3298量化之前的圖像信號與量化后的圖像信號之間的 差異。例如,量化差異可以是針對圖像信號中的每個像素值計算的、量化前的像素值與量化 后的像素值之間的差異的絕對值之和。量化差異可以是針對圖像信號中的每個像素值計算 的、量化前的像素值與量化后的像素值之間的差異的平方和。編碼差異可以是編碼前的圖 像信號與編碼后的圖像信號之間的差異。例如,編碼差異可以是針對圖像信號中的每個像 素值計算的、編碼前的像素值與編碼后的像素值之間的差異的絕對值之和。編碼差異可以 是針對圖像信號中的每個像素值計算的、編碼前的像素值與編碼后的像素值之間的差異的 平方和。這里,編碼包括空間頻率域變換部分3297執(zhí)行的至空間頻率分量的變換,以及量 化部分3298執(zhí)行的量化。 使用編碼方式存儲部分3410中存儲的根據(jù)圖像復雜度和編碼差異的量化步長校正值A(chǔ)quv,可以減少由于復雜圖像導致的信息量增加,或者減少由于涉及空間頻率變換或 量化的編碼而導致的圖像質(zhì)量的降低。圖26已經(jīng)解釋了以宏塊為單位來減少信息量的增 加,而圖27將解釋減少整幅圖像中信息量的波動。除了圖26中所示的用于4X4宏塊的量 化步長校正值A(chǔ)quv之外,編碼方式存儲部分3410還可以存儲用于各種宏塊(包括8X8、 16X16等)的量化步長校正值A(chǔ)quv。 圖27示出了校正前的碼量的比值與量化校正量Q之間的關(guān)系。線3910指示了特
征區(qū)域上對量化量的校正量。線3920指示了背景區(qū)域上對量化量的校正量。 校正前碼量的比值是在特征區(qū)域的圖像質(zhì)量和背景區(qū)域的圖像質(zhì)量未經(jīng)量化部
分3298調(diào)整時,特征區(qū)域中的碼量與整個圖像區(qū)域中的碼量的比值。特征區(qū)域中的碼量可
以是針對特征區(qū)域中包括的每個宏塊而計算的、宏塊的圖像復雜度與宏塊上的量化量之間
的乘積之和。整個圖像區(qū)域中的碼量可以是針對整個圖像區(qū)域中包括的每個宏塊而計算
的、宏塊的圖像復雜度與宏塊上的量化量之間的乘積之和。 量化量指示量化的程度。這就是說,量化步長越小,量化量越大。量化校正量Q指 示當量化步長是以量化步長校正值A(chǔ)quv來校正時,量化量的增加量。校正前的量化量是根 據(jù)緩沖器中被占用的存儲器量、圖像復雜度和目標碼量來確定的。 碼量的索引可以是量化量。如果基于圖像復雜度來調(diào)整量化量,則基于由量化量 索引的碼量來計算的校正前碼量的比值預期實質(zhì)上等于上述基于這種圖像復雜度和量化 量來加權(quán)的校正前碼量的比值。備選地,碼量可以僅僅由面積來進行索引。同樣使用這種 索引,只要特征區(qū)域的圖像復雜度與背景區(qū)域的圖像復雜度相等,基于由面積索引的碼量 來計算的校正前碼量的比值預期實質(zhì)上等于上述基于這種圖像復雜度和量化量來加權(quán)的 校正前碼量的比值。根據(jù)上述解釋,為了便于解釋,基于以圖像復雜度為基礎(chǔ)來加權(quán)的校正 前碼量的比值,來確定特征區(qū)域和不同于特征區(qū)域的區(qū)域上的量化的校正量。類似地,可以 基于以參照圖26所解釋的編碼差異為基礎(chǔ)來加權(quán)的校正前碼量的比值,來確定特征區(qū)域 和不同于特征區(qū)域的區(qū)域上的量化的校正量。 使用這種過程,可以根據(jù)通過提高特征區(qū)域的圖像質(zhì)量而導致的碼量增加,來減 少背景區(qū)域中的碼量。因此,可以通過對特征區(qū)域和背景區(qū)域之間的圖像質(zhì)量進行平衡,來 防止碼量增加。優(yōu)選地,編碼方式存儲部分3410存儲滿足上述關(guān)系的量化步長校正值A(chǔ)q。 壓縮部分3240可以通過將時域低通濾波器應用至根據(jù)圖像復雜度、編碼差異和對象類型 而計算的量化校正量,每單位時間將量化校正量的波動量保存為等于或低于預定量。
圖28是示出了編碼方式存儲部分3410中存儲的另一示例數(shù)據(jù)的表。編碼方式存 儲部分3410以與對象類型相關(guān)聯(lián)的方式存儲幀內(nèi)預測的方向和優(yōu)先程度。幀內(nèi)預測的方 向已經(jīng)參照圖25解釋過,因此這里不再解釋。優(yōu)先程度指示根據(jù)其選擇幀內(nèi)預測的方向的 優(yōu)先程度。 編碼方式存儲部分3410以與特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式,存儲 多個編碼方式和選擇多個編碼方式的順序。編碼方式選擇部分3420按照該順序,針對多個 特征區(qū)域中的每一個,選擇編碼方式存儲部分3410中以與特征區(qū)域中包括的對象的類型 相關(guān)聯(lián)的方式存儲的編碼方式。 如果編碼方式可以將特征區(qū)域的圖像壓縮至與圖像質(zhì)量平衡的壓縮量(該量高 于預定壓縮率),則編碼方式選擇部分3420選擇該編碼方式作為要被用于對特征區(qū)域的圖
65像進行壓縮的方式。壓縮部分3240使用編碼方式選擇部分3420選擇的編碼方式,對運動 圖像組成圖像中多個特征區(qū)域的圖像進行壓縮。 如上所述,編碼方式選擇部分3420針對要壓縮的多幅運動圖像組成圖像中的每 一幅,從多個編碼方式中優(yōu)選選擇可以實現(xiàn)與圖像質(zhì)量平衡的較高壓縮量的編碼方式。因 此,通過以與對象類型相匹配的優(yōu)先順序來測試編碼方式,編碼方式選擇部分3420可以降 低可能對任何不必要的編碼模式進行測試的概率。因此,編碼方式選擇部分3420有時可以 快速指定適于對象類型的幀內(nèi)預測的方向。 編碼方式存儲部分3410可以以與對象類型相關(guān)聯(lián)的方式,存儲多個編碼方式的 各種組合。在這種情況下,編碼方式選擇部分3420針對要壓縮的多幅運動圖像組成圖像 中的每一幅,從多個編碼方式中優(yōu)選選擇可以實現(xiàn)與圖像質(zhì)量平衡的較高壓縮量的編碼方 式。 針對多個特征區(qū)域中的每一個,編碼方式選擇部分3420從編碼方式存儲部分 3410以與特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的多個編碼方式中,優(yōu)選選擇可 以實現(xiàn)與特征區(qū)域的圖像中的圖像質(zhì)量平衡的較高壓縮量的編碼方式。
壓縮部分3240使用編碼方式選擇部分3420選擇的編碼方式,對多幅運動圖像組 成圖像中的每一幅中的多個特征區(qū)域中的每一個特征區(qū)域的圖像進行壓縮。按照這種方 式,編碼方式選擇部分3420有時也可以快速地指定適于對象類型的幀內(nèi)預測的方向。
圖29示出了用于確定差異獲得目標區(qū)域的差異獲得目標區(qū)域確定部分3294的一 個示例確定方法。假定相同對象區(qū)域標識部分3430標識了分別包括對象3904和對象3214 的特征區(qū)域3902和特征區(qū)域3212,對象3904和對象3214是分別來自運動圖像組成圖像 3200和運動圖像組成圖像3810的相同對象。在這種情況下,位置差計算部分3440計算特 征區(qū)域的位置之間的位置差,該位置差是特征區(qū)域3902的左上角坐標與特征區(qū)域3212的 左上角坐標之間的差異。 在圖29的示例中,位置差計算部分3440導出位置差(xl-xO, yl-yO)。差異獲得 目標區(qū)域確定部分3294確定運動圖像組成圖像3200中的差異獲得目標區(qū)域,以通過幀間 編碼來對特征區(qū)域3212中包括的宏塊3216進行編碼。當宏塊3216的左上角坐標為(x2, y2)并且宏塊3216的右下角坐標為(x3, y3)時,差異獲得目標區(qū)域確定部分3294確定矩 形區(qū)域3906中的差異獲得目標區(qū)域,在運動圖像組成圖像3200中,矩形區(qū)域3906的相對 角是(x2-(xl-xO)-A , y2-(yl-yO)-A)禾P (x3+(xl—xO) + A , y3+(yl—yO) + A )。這里,原點 在運動圖像組成圖像3200和運動圖像組成圖像3810的左上角位置。 要在其中確定差異獲得目標區(qū)域的跟蹤范圍的面積由A來定義。值A(chǔ)可以是預 定的像素數(shù)目。備選地,值A(chǔ)可以是根據(jù)特征區(qū)域3902和3212中包括的對象的類型來預 定義的。例如,差異獲得目標區(qū)域確定部分3294可以針對預期以較高速度運動的對象類 型,使用較大的A值來確定差異獲得目標區(qū)域。按照這種方式,對于相同對象區(qū)域標識部 分3430所標識的另一運動圖像組成圖像中的特征區(qū)域的至少部分區(qū)域的圖像,壓縮部分 3240通過將至少該部分區(qū)域的圖像與以下范圍內(nèi)的區(qū)域的圖像進行比較,來對至少該部分 區(qū)域的圖像進行壓縮所述范圍與一幅運動圖像組成圖像中與該部分區(qū)域的位置相距所計 算的位置差的位置相距預定像素數(shù)目。 差異獲得目標區(qū)域確定部分3294可以根據(jù)在檢測特征區(qū)域時獲得的可靠性程度來確定是否要基于特征區(qū)域之間的位置差來確定差異獲得目標區(qū)域。例如,差異獲得目標 區(qū)域確定部分3294可以在可靠性程度高于預定值的條件下,基于特征區(qū)域之間的位置差 來確定差異獲得目標區(qū)域。 如上所述,差異獲得目標區(qū)域確定部分3294可以通過使用特征區(qū)域之間的位置 差來縮窄在其中跟蹤運動矢量的范圍。因此,差異獲得目標區(qū)域確定部分3294可以快速計 算運動矢量。特征區(qū)域3212可以防止其內(nèi)的運動矢量在方向上不均勻。因此,當運動編碼 部分3286基于相鄰宏塊中的運動矢量之間的差異來對運動矢量進行編碼時,該差異可以 變得更小。因此,圖像處理設(shè)備3170可以以較高壓縮率來對運動矢量進行壓縮。
圖30示出了根據(jù)另一實施例的圖像處理系統(tǒng)3020的一個示例。根據(jù)本實施例相 關(guān)的圖像處理系統(tǒng)3020具有與參照圖1解釋的圖像處理系統(tǒng)3010相同的配置,但是去除 了圖像處理設(shè)備3120,取而代之地,圖像捕捉設(shè)備3100a至3100d包括圖像處理部分3604a 至3604d(以下可以統(tǒng)稱為圖像處理部分3604)。 圖像處理部分3604包括圖像處理設(shè)備3120的組件,除壓縮運動圖像獲取部分 3201和壓縮運動圖像解壓部分3202以外。圖像處理部分3604中包括的相應組件的功能和 操作可以與圖像處理設(shè)備3120中包括的組件的功能和操作實質(zhì)上相同,但是圖像處理部 分3604的組件處理圖像捕捉部分3102捕捉的捕捉運動圖像,而不像圖像處理設(shè)備3120的 組件處理通過壓縮運動圖像解壓部分3202解壓得到的捕捉運動圖像。具有這種配置的圖 像處理系統(tǒng)3020也可以實現(xiàn)與參照圖18至圖29的圖像處理系統(tǒng)3010相結(jié)合來解釋的效 果相似的效果。 圖像捕捉設(shè)備3100中包括的編碼方式獲取部分3412可以從圖像處理設(shè)備3170 或從圖像捕捉設(shè)備3100的用戶獲取上述編碼方式。例如,圖像捕捉設(shè)備3100可以具有在 其上顯示設(shè)置屏幕的顯示設(shè)備。該顯示設(shè)備可以顯示設(shè)置屏幕,從該設(shè)置屏幕來設(shè)置適于 特征區(qū)域的特征的量的編碼方式。編碼方式獲取部分3412可以經(jīng)由設(shè)置屏幕從用戶獲取 編碼方式。例如,編碼方式獲取部分3412可以通過在顯示設(shè)備上顯示設(shè)置屏幕時獲取指示 用戶操作的信息,來獲取編碼方式。 圖像處理部分3604可以從圖像捕捉部分3102獲取包括以RAW格式表示的多幅運 動圖像組成圖像在內(nèi)的捕捉運動圖像。圖像處理部分3604可以從以RAW格式表示的多幅 運動圖像組成圖像中的每一幅中檢測一個或多個特征區(qū)域。圖像處理部分3604可以對獲 取的捕捉運動圖像中包括的以RAW格式表示的運動圖像組成圖像進行壓縮,這是由于這些 圖像具有RAW格式。此時,圖像處理部分3604可以使用參照圖18至圖29結(jié)合圖像處理設(shè) 備3120的操作而解釋的壓縮方法來對捕捉運動圖像進行壓縮。 圖像處理設(shè)備3170可以通過對從圖像處理部分3604獲取的壓縮運動圖像進行解 壓,來獲得以RAW格式表示的多幅運動圖像組成圖像。圖像處理設(shè)備3170可以以區(qū)域為單 位(即分別以不同于特征區(qū)域的每個區(qū)域為單位和以多個特征區(qū)域中的每一個為單位), 對通過解壓獲得的具有RAW格式的多幅運動圖像組成圖像執(zhí)行顏色估計(重合處理)。此 時,圖像處理設(shè)備3170可以對特征區(qū)域以比對不同于特征區(qū)域的區(qū)域更高的精度來執(zhí)行 顏色估計(重合處理)。 圖像處理設(shè)備3170可以對通過同步得到的運動圖像組成圖像中的特征區(qū)域的圖 像應用超分辨率(super-resolution)處理。圖像處理設(shè)備3170執(zhí)行的超分辨率處理可以
67是日本專利申請公開No. 2006-350498中描述的基于主要分量分析的處理,或者日本專利 申請公開No. 2004-88615中描述的基于對象運動的處理。 圖像處理設(shè)備3170可以對特征區(qū)域中的每個對象分別應用超分辨率處理。例如, 當特征區(qū)域包括人臉的圖像時,圖像處理設(shè)備3170可以對均作為對象示例的每個臉部部 分(例如眼、鼻、口等)應用超分辨率處理。在這種情況下,圖像處理設(shè)備3170存儲每個臉 部部分(例如眼、鼻、口等)的學習數(shù)據(jù),如日本專利申請公開No. 2006-350498中描述的基 于主要分量分析(PCA)的模型。圖像處理設(shè)備3170可以使用針對臉部部分來選擇的學習
數(shù)據(jù),對特征區(qū)域中包括的每個臉部部分的圖像分別應用超分辨率處理。 按照這種方式,圖像處理設(shè)備3170可以使用主要分量分析(PCA)來重配置特征區(qū)
域的圖像。除了主要分量分析(PCA)的學習和圖像重配置之外,圖像處理設(shè)備3170可以使
用局部性預留投影(LPP)、線性判別式分析(LDA)、獨立分量分析(ICA)、多維縮放(MDS)、
支持矢量機(支持矢量回歸)、神經(jīng)網(wǎng)絡(luò)、隱式馬爾科夫模型、貝葉斯推論、最大后驗概率估
計、迭代返回投影、小波變換、局部線性嵌入(LLE)、馬爾科夫隨機場(MRF)等來作為圖像重
配置技術(shù)和用于圖像重配置技術(shù)的學習技術(shù)。 除了日本專利申請公開No. 2006-350498中描述的模型之外,學習數(shù)據(jù)可以包括
對象的圖像的低頻分量和高頻分量,這些分量是從為該類型的對象準備的許多采樣圖像中
提取的。這里,針對多種類型的對象中的每一種,可以使用K-means方法或類似方法對對象
的圖像中的低頻分量進行聚集,使得可以將每種類型的對象的圖像中的低頻分量聚集為多
個群集。可以針對每個群集來確定代表性低頻分量,如群集的中值點的值。 圖像處理設(shè)備3170從運動圖像組成圖像中的特征區(qū)域中包括的對象的圖像中提
取低頻分量。圖像處理設(shè)備3170從為相應類型的對象準備的采樣圖像中提取的低頻分量
的群集中,指定所確定的代表性低頻分量是與所提取的低頻分量中的任一個相匹配的值的
任何群集。圖像處理設(shè)備3170指定與所指定的群集中包括的低頻分量相關(guān)聯(lián)的高頻分量
的群集。按照這種方式,圖像處理設(shè)備3170可以指定與從運動圖像組成圖像中包括的對象
中提取的低頻分量相關(guān)的高頻分量的群集。 圖像處理設(shè)備3170可以使用所指定的高頻分量群集的代表性高頻分量,將對象 的圖像改變?yōu)榫哂休^高圖像質(zhì)量的圖像。例如,圖像處理設(shè)備3170可以基于與從對象中心 至表面上的處理目標的位置的距離相對應的權(quán)值,將為對象選擇的高頻分量添加至每個對 象的圖像。代表性高頻分量可以使用閉環(huán)學習來產(chǎn)生。由于圖像處理設(shè)備3170可以使用 針對每個對象從通過關(guān)于對象的學習而產(chǎn)生的學習數(shù)據(jù)中選擇的所需學習數(shù)據(jù),圖像處理 設(shè)備3170有時可以以更高精度使對象成為高質(zhì)量圖像。此外,在參照圖18至圖29解釋的 圖像處理系統(tǒng)3010中,圖像處理設(shè)備3170可以對特征區(qū)域的圖像應用上述超分辨率處理。
在日本專利申請公開No. 2006-350498中描述的基于主要分量分析的超分辨率處 理中,使用主要分量矢量和加權(quán)系數(shù)來表示對象的圖像。加權(quán)系數(shù)和主要分量矢量的數(shù)據(jù) 量明顯小于對象的圖像中包括的像素數(shù)據(jù)的數(shù)據(jù)量。因此,在對從圖像捕捉部分3102獲取 的多幅運動圖像組成圖像中特征區(qū)域的圖像進行壓縮的過程中,圖像處理部分3604可以 由特征區(qū)域中包括的對象的圖像來計算加權(quán)系數(shù)。這就是說,圖像處理部分3604可以通 過使用主要分量矢量和加權(quán)系數(shù)來表示圖像,從而對特征區(qū)域中包括的對象的圖像進行壓 縮。圖像處理部分3604可以將主要分量矢量和加權(quán)系數(shù)發(fā)送至圖像處理設(shè)備3170。
68
在這種情況下,圖像處理設(shè)備3170可以使用從圖像處理部分3604獲取的主要分 量矢量和加權(quán)系數(shù)來重配置特征區(qū)域中包括的對象的圖像。不言自明,圖像處理部分3604 可以使用各種特征參數(shù)來表示對象的模型,而不使用日本專利申請公開No. 2006-350498 中描述的基于主要分量分析的模型,來對特征區(qū)域中包括的對象的圖像進行壓縮。
圖31示出了圖像處理設(shè)備3120和3170的一示例硬件配置。圖像處理設(shè)備3120 和3170包括由CPU外圍部分、輸入/輸出部分和傳統(tǒng)輸入/輸出部分。CPU外圍部分包括 通過主機控制器3582互相連接的CPU 3505、RAM 3520、圖形控制器3575和顯示設(shè)備3580。 輸入/輸出部分包括通過輸入/輸出控制器3584連接至主機控制器3582的通信接口 3530、 硬盤驅(qū)動器3540和CD-ROM驅(qū)動器3560。傳統(tǒng)輸入/輸出部分包括連接至輸入/輸出控制 器3584的ROM 3510、軟盤驅(qū)動器3550和輸入/輸出芯片3570。 主機控制器3582將以高傳輸速率訪問RAM 3520的CPU 3505和圖形控制器3575 連接至RAM 3520。 CPU 3505基于ROM 3510和RAM3520上存儲的程序進行操作,以控制每 個組件。圖形控制器3575在RAM 3520中提供的幀緩沖器上獲取CPU 3505等產(chǎn)生的圖像 數(shù)據(jù),并在顯示設(shè)備3580上顯示圖像。取而代之地,圖形控制器3575中可以包括用于存儲 CPU 3505等產(chǎn)生的圖像數(shù)據(jù)的幀緩沖器。 輸入/輸出控制器3584將作為相對高速率輸入/輸出設(shè)備的硬盤驅(qū)動器3540、通 信接口 3530和CD-ROM驅(qū)動器3560連接至主機控制器3582。硬盤驅(qū)動器3540上存儲CPU 3505要使用的程序和數(shù)據(jù)。通信接口 3530與網(wǎng)絡(luò)通信設(shè)備3598連接以發(fā)送或接收程序或 數(shù)據(jù)。CD-ROM驅(qū)動器3560從CD-ROM 3595中讀出程序或數(shù)據(jù),并將其經(jīng)由RAM 3520提供 給硬盤驅(qū)動器3540和通信接口 3530。 ROM 3510和相對低速率的輸入/輸出設(shè)備(如軟盤驅(qū)動器3550和輸入/輸出芯 片3570連接至輸入/輸出控制器3584。 ROM 3510存儲圖像處理設(shè)備3120和圖像處理設(shè)備 3170激活時執(zhí)行的引導程序、或者符合圖像處理設(shè)備3120和圖像處理設(shè)備3170的硬件的 程序。軟盤驅(qū)動器3550從軟盤3590中讀出程序或數(shù)據(jù),并經(jīng)由RAM 3520將其提供給硬盤 驅(qū)動器3540或通信接口 3530。輸入/輸出芯片3570是通過軟盤驅(qū)動器3550、并行端口 、 串行端口 、鍵盤端口 、鼠標端口等來連接各種輸入/輸出設(shè)備的連接接口 。
CPU 3505執(zhí)行的程序在如軟盤3590、 CD-ROM 3595和IC卡等記錄介質(zhì)中由用戶 提供。存儲在記錄介質(zhì)中的程序可以壓縮也可以不壓縮。記錄介質(zhì)中的程序安裝到硬盤驅(qū) 動器3540上,讀出至RAM 3520并由CPU 3505來執(zhí)行。CPU 3505執(zhí)行的程序使圖像處理 設(shè)備3120用作參照圖18至圖30解釋的圖像處理設(shè)備3120。程序還使圖像處理設(shè)備3170 用作參照圖18至30解釋的圖像處理設(shè)備3170。 程序可以存儲在外部記錄介質(zhì)中。記錄介質(zhì)可以是軟盤3590和CD-ROM 3595,或 者備選地,可以是光記錄介質(zhì)(如DVD和PD)、磁-光記錄介質(zhì)(如MD)、磁帶介質(zhì)、半導體 存儲器(如IC卡)。在連接至專用通信網(wǎng)絡(luò)或因特網(wǎng)的服務器系統(tǒng)上安裝的存儲器設(shè)備 (如硬盤、RAM等)可以用作記錄介質(zhì),使得程序可以經(jīng)由網(wǎng)絡(luò)提供給圖像處理設(shè)備3120和 和圖像處理設(shè)備3170。 盡管通過示例實施例描述了本發(fā)明的一些方面,但是應當理解,本領(lǐng)域技術(shù)人員 在不背離僅由所附權(quán)利要求限定的本發(fā)明的精神和范圍的前提下,可以做出許多改變和替 換。
69
權(quán)利要求
一種圖像處理設(shè)備,包括特征區(qū)域檢測部分,檢測圖像中的多個特征區(qū)域;條件存儲部分,在其上存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的壓縮強度;壓縮部分,分別對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特征區(qū)域的圖像;以及壓縮控制部分,參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的特征,對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
2. 如權(quán)利要求l所述的圖像處理設(shè)備,其中特征區(qū)域檢測部分檢測運動圖像中包括的多幅運動圖像分量圖像中的多個特征區(qū)域,以及壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的特征,來對 壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
3. 如權(quán)利要求2所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域的類型而不同的條件,以及 壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的類型,來對 壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
4. 如權(quán)利要求3所述的圖像處理設(shè)備,其中特征區(qū)域檢測部分檢測多幅運動圖像分量圖像中具有不同類型特征的多個特征區(qū)域, 壓縮部分分別對多幅特征區(qū)域運動圖像進行壓縮,其中每一幅特征區(qū)域運動圖像包括所述多幅運動圖像分量圖像中具有相同類型特征的多幅特征區(qū)域圖像,以及壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)特征區(qū)域運動圖像中包括的多幅特征區(qū)域圖像的特征類型,對壓縮部分對所述多幅特征區(qū)域運動圖像中每一幅進行壓縮的壓縮強度進行控制。
5. 如權(quán)利要求4所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域的類型而不同的圖像質(zhì)量降低量; 壓縮部分包括圖像質(zhì)量降低部分,降低多幅特征區(qū)域運動圖像的圖像質(zhì)量,其中每一幅特征區(qū)域運動圖像包括所述多幅運動圖像分量圖像中具有相同類型特征 的多個特征區(qū)域;以及壓縮控制部分參照條件存儲部分上存儲的圖像質(zhì)量降低量,根據(jù)特征區(qū)域運動圖像中 包括的多幅特征區(qū)域圖像的特征類型,對圖像質(zhì)量降低部分將所述多幅特征區(qū)域運動圖像 中每一幅的圖像質(zhì)量降低的圖像質(zhì)量降低量進行控制。
6. 如權(quán)利要求5所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域的類型而不同的空間分辨率降低量,或根據(jù)特 征區(qū)域的類型而不同的時間分辨率降低量,以及壓縮控制部分參照條件存儲部分上存儲的空間或時間分辨率的降低量,根據(jù)特征區(qū)域 運動圖像中包括的多幅特征區(qū)域圖像的特征類型,對圖像質(zhì)量降低部分將所述多幅特征區(qū) 域運動圖像中每一幅的圖像質(zhì)量降低的空間或時間分辨率降低量進行控制。
7. 如權(quán)利要求5所述的圖像處理設(shè)備,還包括條件獲得部分,獲得根據(jù)特征區(qū)域的類型而不同的圖像質(zhì)量降低量,其中 條件存儲部分在其上存儲由條件獲得部分獲得的、根據(jù)特征區(qū)域的類型而不同的圖像 質(zhì)量降低量。
8. 如權(quán)利要求2所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域所指示的區(qū)域的特征而不同的條件,以及 壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域所指示的區(qū)域 的特征,來對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
9. 如權(quán)利要求8所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域所指示的區(qū)域的數(shù)目、大小或位置而不同的條 件,以及壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域所指示的區(qū)域 的數(shù)目、大小或位置,來對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進 行控制。
10. 如權(quán)利要求2所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域的特征區(qū)域圖像中包含的對象的特征而不同 的條件,以及壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多幅特征區(qū)域圖像中包含的 對象的特征,來對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
11. 如權(quán)利要求10所述的圖像處理設(shè)備,其中條件存儲部分在其上存儲根據(jù)特征區(qū)域圖像中包含的對象的形狀、面對方向、運動方 向或已運動距離而不同的條件,以及壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)所述多幅特征區(qū)域圖像中包含的 對象的形狀、面對方向、運動方向或已運動距離,來對壓縮部分分別對所述多幅特征區(qū)域圖 像進行壓縮的壓縮強度進行控制。
12. 如權(quán)利要求4所述的圖像處理設(shè)備,還包括圖像產(chǎn)生部分,通過復制運動圖像來產(chǎn)生具有不同類型特征的多幅特征區(qū)域運動圖 像,其中壓縮控制部分參照條件存儲部分上存儲的條件,根據(jù)特征區(qū)域運動圖像中包括的多幅 特征區(qū)域圖像的特征類型,對壓縮部分對所述多幅特征區(qū)域運動圖像中每一幅進行壓縮的 壓縮強度進行控制。
13. 如權(quán)利要求2所述的圖像處理設(shè)備,還包括 運動圖像獲得部分,獲得從不同位置捕捉的多幅運動圖像;以及相同主體區(qū)域標識部分,標識由運動圖像獲得部分所獲得的多幅運動圖像中的一幅運 動圖像中包括的運動圖像分量圖像中的特征區(qū)域和所述多幅運動圖像中不同的一幅運動 圖像中包括的運動圖像分量圖像中的特征區(qū)域,所述特征區(qū)域包含相同的主體,其中參照條件存儲部分上存儲的條件,壓縮控制部分(i)根據(jù)特征區(qū)域的特征,控制壓縮 部分對由相同主體區(qū)域標識部分所標識的特征區(qū)域中的至少一個特征區(qū)域的特征區(qū)域圖 像進行壓縮的壓縮強度,以及(ii)將壓縮部分對所標識的特征區(qū)域中不同的一個特征區(qū)域的特征區(qū)域圖像進行壓縮的壓縮強度設(shè)置為高于壓縮部分對所述至少一個特征區(qū)域的 特征區(qū)域圖像進行壓縮的壓縮強度。
14. 一種圖像處理方法,包括 檢測圖像中的多個特征區(qū)域;存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的 壓縮強度;對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特征區(qū)域的圖像;以及參照存儲步驟中存儲的條件,根據(jù)所述多個特征區(qū)域的特征,來對分別對所述多幅特 征區(qū)域圖像進行壓縮的壓縮強度進行控制。
15. —種與圖像處理設(shè)備一起使用的程序,所述程序使圖像處理設(shè)備用作 特征區(qū)域檢測部分,檢測圖像中的多個特征區(qū)域;條件存儲部分,在其上存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū) 域的特征來分配不同的壓縮強度;壓縮部分,分別對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特 征區(qū)域的圖像;以及壓縮控制部分,參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的特征,對壓 縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。
16. —種圖像處理設(shè)備,包括特征區(qū)域檢測部分,從圖像中檢測多個特征區(qū)域;以及壓縮部分,根據(jù)所述多個特征區(qū)域中包括的對象的特征的量,以不同的編碼方式分別 對所述多個特征區(qū)域的圖像進行壓縮。
17. 如權(quán)利要求16所述的圖像處理設(shè)備,還包括編碼方式存儲部分,以與對象的特征 的量相關(guān)聯(lián)的方式來存儲編碼方式,其中,壓縮部分按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的特征 的量相關(guān)聯(lián)的方式而存儲的編碼方式,分別對所述多個特征區(qū)域的圖像進行壓縮。
18. 如權(quán)利要求17所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式來存儲編碼方式,以及 壓縮部分按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型相關(guān) 聯(lián)的方式而存儲的編碼方式,分別對所述多個特征區(qū)域的圖像進行壓縮。
19. 如權(quán)利要求18所述的圖像處理設(shè)備,其中,特征區(qū)域檢測部分從運動圖像中包括的多幅運動圖像組成圖像中的每一幅中檢 測多個特征區(qū)域,所述運動圖像為所述圖像,以及壓縮部分按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型相關(guān) 聯(lián)的方式而存儲的編碼方式,分別對所述多幅運動圖像組成圖像中每一幅中的多個特征區(qū) 域的圖像進行壓縮。
20. 如權(quán)利要求19所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲或為幀內(nèi)編碼類型或為 幀間編碼類型的編碼方式,以及壓縮部分按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型相關(guān) 聯(lián)的方式而存儲的幀內(nèi)編碼方式或幀間編碼方式,分別對所述多幅運動圖像組成圖像中每 一幅中的多個特征區(qū)域的圖像進行壓縮。
21. 如權(quán)利要求20所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲指示幀內(nèi)編碼的幀內(nèi)預 測方向的編碼方式,以及壓縮部分通過按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型 相關(guān)聯(lián)的方式而存儲的方向來執(zhí)行幀內(nèi)預測,分別對所述多幅運動圖像組成圖像中每一幅 中的多個特征區(qū)域的圖像進行壓縮。
22. 如權(quán)利要求20所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲指示幀間編碼的運動預 測單元的編碼方式,以及壓縮部分通過按照編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型 相關(guān)聯(lián)的方式而存儲的運動預測單元來執(zhí)行運動預測,分別對所述多幅運動圖像組成圖像 中每一幅中的多個特征區(qū)域的圖像進行壓縮。
23. 如權(quán)利要求20所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲要被用作對運動圖像組 成圖像進行編碼的編碼單元的部分區(qū)域的大小,以及壓縮部分通過將特征區(qū)域中包括的每個對象的圖像劃分為具有編碼方式存儲部分中 以與該特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的大小的部分區(qū)域,對所述多幅運 動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。
24. 如權(quán)利要求17所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的大小相關(guān)聯(lián)的方式,存儲要被用作對運動圖像組 成圖像進行編碼的編碼單元的部分區(qū)域的大小,以及壓縮部分通過將特征區(qū)域中包括的每個對象的圖像劃分為具有編碼方式存儲部分中 以與該特征區(qū)域中包括的對象的大小相關(guān)聯(lián)的方式存儲的大小的部分區(qū)域,對所述多幅運 動圖像組成圖像中每一幅中的多個特征區(qū)域的圖像進行壓縮。
25. 如權(quán)利要求18所述的圖像處理設(shè)備,還包括編碼方式選擇部分,針對多幅運動圖 像組成圖像中的每一幅,從多種編碼方式中,優(yōu)先選擇能夠?qū)崿F(xiàn)與圖像質(zhì)量平衡的較高壓 縮量的編碼方式,作為要用于對該運動圖像組成圖像進行壓縮的編碼方式,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式來存儲多種編碼方式的不同組合,編碼方式選擇部分針對所述多個特征區(qū)域中的每一個,從編碼方式存儲部分中以與該 特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的多種編碼方式中,優(yōu)先選擇能夠?qū)崿F(xiàn)與 該特征區(qū)域的圖像中的圖像質(zhì)量平衡的較高壓縮量的編碼方式,以及壓縮部分使用編碼方式選擇部分選擇的編碼方式,對多幅運動圖像組成圖像中每一幅 中的多個特征區(qū)域的圖像進行壓縮。
26. 如權(quán)利要求18所述的圖像處理設(shè)備,還包括編碼方式選擇部分,針對多幅運動圖 像組成圖像中的每一幅,從多種編碼方式中,優(yōu)先選擇能夠?qū)崿F(xiàn)與圖像質(zhì)量平衡的較高壓縮量的編碼方式,作為要用于對該運動圖像組成圖像進行壓縮的編碼方式,其中,編碼方式存儲部分以與特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式來存儲多種編碼方式和選擇所述編碼方式應當依據(jù)的順序,如果所選的編碼方式能夠?qū)⒃撎卣鲄^(qū)域的圖像壓縮至與圖像質(zhì)量平衡的、高于預定壓縮率的壓縮量,編碼方式選擇部分針對所述多個特征區(qū)域中的每一個,按照所述順序來選擇編碼方式存儲部分中以與該特征區(qū)域中包括的對象的類型相關(guān)聯(lián)的方式存儲的編碼方式,作為要用于對該特征區(qū)域的圖像進行壓縮的編碼方式,以及壓縮部分使用編碼方式選擇部分選擇的編碼方式,對每幅運動圖像組成圖像中的多個特征區(qū)域的圖像進行壓縮。
27. 如權(quán)利要求18所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲指示目標碼量的編碼方 式,以及壓縮部分使用編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型相關(guān) 聯(lián)的方式存儲的編碼方式,對所述圖像中多個特征區(qū)域的圖像進行壓縮。
28. 如權(quán)利要求27所述的圖像處理設(shè)備,其中,編碼方式存儲部分以與對象的類型相關(guān)聯(lián)的方式,存儲指示量化步長的編碼方 式,以及壓縮部分通過使用編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的類型 相關(guān)聯(lián)的方式存儲的量化步長對圖像進行量化,來對所述圖像中多個特征區(qū)域的圖像進行 壓縮。
29. 如權(quán)利要求17所述的圖像處理設(shè)備,還包括編碼方式獲取部分,以與對象的特征 的量相關(guān)聯(lián)的方式來獲取編碼方式,其中,編碼方式存儲部分以與對象的特征的量相關(guān)聯(lián)的方式,存儲編碼方式獲取部分 以與對象的特征的量相關(guān)聯(lián)的方式獲取的編碼方式。
30. —種圖像處理方法,包括 從圖像中檢測多個特征區(qū)域;以及根據(jù)所述多個特征區(qū)域中包括的對象的特征的量,以不同的編碼方式分別對所述多個 特征區(qū)域的圖像進行壓縮。
31. —種用于圖像處理設(shè)備的程序,所述程序控制圖像處理設(shè)備用作 特征區(qū)域檢測部分,從圖像中檢測多個特征區(qū)域;以及壓縮部分,根據(jù)所述多個特征區(qū)域中包括的對象的特征的量,以不同的編碼方式分別 對所述多個特征區(qū)域的圖像進行壓縮。
全文摘要
本發(fā)明提供了一種圖像處理設(shè)備,包括特征區(qū)域檢測部分,檢測圖像中的多個特征區(qū)域;條件存儲部分,在其上存儲根據(jù)特征區(qū)域的特征而不同的分配條件,以便根據(jù)特征區(qū)域的特征來分配不同的壓縮強度;壓縮部分,分別對多幅特征區(qū)域圖像進行壓縮,所述多幅特征區(qū)域圖像是所述多個特征區(qū)域的圖像;以及壓縮控制部分,參照條件存儲部分上存儲的條件,根據(jù)所述多個特征區(qū)域的特征,對壓縮部分分別對所述多幅特征區(qū)域圖像進行壓縮的壓縮強度進行控制。本發(fā)明還提供了一種圖像處理設(shè)備,包括編碼方式存儲部分,以與對象的特征的量相關(guān)聯(lián)的方式來存儲編碼方式;特征區(qū)域檢測部分,從圖像中檢測多個特征區(qū)域;以及壓縮部分,以編碼方式存儲部分中以與所述多個特征區(qū)域中包括的對象的特征的量相關(guān)聯(lián)的方式而存儲的編碼方式,分別對所述多個特征區(qū)域的圖像進行壓縮。
文檔編號H04N7/26GK101755461SQ20088002540
公開日2010年6月23日 申請日期2008年7月16日 優(yōu)先權(quán)日2007年7月20日
發(fā)明者龜山祐和 申請人:富士膠片株式會社