用于處理壓縮視頻圖像中陰影的系統(tǒng)及方法

文檔序號(hào)：7928989閱讀：119來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：用于處理壓縮視頻圖像中陰影的系統(tǒng)及方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于檢測(cè)在壓縮視頻圖像中移動(dòng)對(duì)象區(qū)域以及去除的移動(dòng)對(duì)象相關(guān)聯(lián)陰影的系統(tǒng)及方法。
背景技術(shù)：
多媒體技術(shù)(包含用于視頻以及圖像相關(guān)的應(yīng)用的技木)廣泛使用在安全監(jiān)控、醫(yī)療診斷、教育、娛樂以及商業(yè)展現(xiàn)等各種領(lǐng)域。例如，高分辨率視頻越來越普遍使用在安全監(jiān)控應(yīng)用中，使得重要的安全信息得以實(shí)時(shí)地以改進(jìn)的分辨率(例如，每圖像一百萬像素或更高)捕捉。在高分辨率安全監(jiān)控系統(tǒng)中，通常通過攝像機(jī)記錄視頻，且在將視頻文件傳輸?shù)交虼鎯?chǔ)在存儲(chǔ)裝置或安全監(jiān)控中心之前，壓縮所記錄的原始視頻數(shù)據(jù)(raw videodata)。然后，視頻文件可由處理裝置進(jìn)行分析。在安全監(jiān)控應(yīng)用中移動(dòng)對(duì)象受到顯著關(guān)注。例如，可分析在私人建筑物(privatebuilding)的入口處獲得的監(jiān)控視頻以識(shí)別是否有未經(jīng)批準(zhǔn)的人企圖進(jìn)入建筑物。例如，監(jiān)控系統(tǒng)可識(shí)別移動(dòng)對(duì)象的移動(dòng)軌跡(trajectory)。如果軌跡指示人已到達(dá)某位置，那么可觸發(fā)警報(bào)或者可通知警衛(wèi)。因此，檢測(cè)移動(dòng)對(duì)象并識(shí)別其軌跡可提供有用的信息來用于保證受監(jiān)控場所的安全。然而，許多照明條件會(huì)造成攝像機(jī)在視頻圖像中記錄下移動(dòng)對(duì)象的陰影。為了識(shí)別準(zhǔn)確的移動(dòng)軌跡，需要從所記錄的視頻圖像中移除與移動(dòng)對(duì)象相關(guān)聯(lián)的陰影。否則，可觸發(fā)錯(cuò)誤警報(bào)，或者可導(dǎo)致計(jì)算錯(cuò)誤。傳統(tǒng)的圖像處理方法要求在對(duì)攝像機(jī)所傳輸?shù)膲嚎s視頻數(shù)據(jù)進(jìn)行陰影檢測(cè)和移除之前先進(jìn)行解壓縮。然而，對(duì)高分辨率視頻數(shù)據(jù)進(jìn)行解壓縮通常耗時(shí)，且有時(shí)需要花費(fèi)昂貴的計(jì)算資源。因此，有需要提供一種處理壓縮視頻圖像和/或在壓縮視頻圖像的程序中檢測(cè)與移動(dòng)對(duì)象相關(guān)聯(lián)的陰影的系統(tǒng)和/或方法。

發(fā)明內(nèi)容
在一實(shí)施例中，本揭露提供一種用于處理壓縮視頻圖像的方法。所述方法從壓縮視頻圖像中檢測(cè)候選對(duì)象區(qū)域。候選對(duì)象區(qū)域包含移動(dòng)對(duì)象以及與移動(dòng)對(duì)象相關(guān)聯(lián)的陰影。針對(duì)在候選對(duì)象區(qū)域中的每ー數(shù)據(jù)塊，所述方法計(jì)算用以編碼相應(yīng)數(shù)據(jù)塊中的時(shí)間變化的編碼數(shù)據(jù)量。然后，所述方法在由數(shù)據(jù)塊組成的候選對(duì)象區(qū)域中識(shí)別陰影，每ー數(shù)據(jù)塊具有低于閾值的編碼數(shù)據(jù)量。在另ー實(shí)施例中，本揭露還提供用于處理壓縮視頻圖像的內(nèi)陰影去除的方法。所述方法從壓縮視頻圖像中檢測(cè)表示移動(dòng)對(duì)象的對(duì)象圖像區(qū)域。此對(duì)象圖像區(qū)域包含與移動(dòng)對(duì)象相關(guān)聯(lián)的陰影。然后，所述方法基于所檢測(cè)的對(duì)象圖像區(qū)域來確定假想移動(dòng)對(duì)象(hypothetical moving object)。所述方法進(jìn)ー步形成在其中獲得壓縮視頻圖像的環(huán)境模型，且基于環(huán)境模型確定假想移動(dòng)對(duì)象的假想陰影。應(yīng)了解的是，上述的一般描述和下文的詳細(xì)描述都是示范性和解釋性的，且希望、提供如所主張的本揭露的進(jìn)ー步解釋。

圖I繪示本揭露ー實(shí)施例的示范性監(jiān)控系統(tǒng)。圖2繪示本揭露ー實(shí)施例的用于檢測(cè)壓縮圖像域中移動(dòng)對(duì)象的陰影的示范性過程的流程圖。圖3繪示本揭露ー實(shí)施例的具有移動(dòng)對(duì)象及其相關(guān)聯(lián)陰影的示范性視頻圖像。圖4繪示本揭露ー實(shí)施例的用于檢測(cè)H. 264壓縮視頻圖像中陰影的示范性過程的流程圖。圖5繪示本揭露ー實(shí)施例的移動(dòng)對(duì)象及其相關(guān)聯(lián)陰影的示范性編碼。
圖6繪示本揭露ー實(shí)施例的用于基于環(huán)境模擬檢測(cè)陰影的示范性過程的流程圖。圖7繪示本揭露ー實(shí)施例的在環(huán)境模型中的示范性假想移動(dòng)對(duì)象。圖8繪示本揭露ー實(shí)施例的用于陰影捜索的示范性過程的流程圖。附圖標(biāo)記100:監(jiān)控系統(tǒng)101 :視頻處理和監(jiān)控系統(tǒng)102 :監(jiān)控相機(jī)103:通信接ロ110:處理器120 :存儲(chǔ)器模塊121 :操作系統(tǒng)122 :視頻處理軟件123 :數(shù)據(jù)庫130 :輸入裝置140 :顯示裝置150:通信接ロ301、302、303、304、305、306 :圖像311 :靜止對(duì)象312 :移動(dòng)對(duì)象313:陰影400 :過程501 :移動(dòng)對(duì)象502:陰影510、520 :譜
具體實(shí)施例方式圖I繪示監(jiān)控系統(tǒng)100的范例。在本揭露的一實(shí)施例中，監(jiān)控系統(tǒng)100可安裝在各種地方以監(jiān)控在這些地方發(fā)生的活動(dòng)。例如，監(jiān)控系統(tǒng)100可安裝在銀行機(jī)構(gòu)、政府建筑物、博物館、超級(jí)市場、醫(yī)院或具有受管制的場所。
在某些實(shí)施例中，監(jiān)控系統(tǒng)100可包含視頻處理和監(jiān)控系統(tǒng)101、多個(gè)監(jiān)控相機(jī)102以及通信接ロ 103。例如，可將監(jiān)控相機(jī)102分布在整個(gè)監(jiān)控場所中，且視頻處理和監(jiān)控系統(tǒng)101可配置在所述場所上或遠(yuǎn)離所述場所。視頻處理和監(jiān)控系統(tǒng)101和監(jiān)控相機(jī)102可經(jīng)由通信接ロ 103進(jìn)行通信。通信接ロ 103可為有線通信網(wǎng)絡(luò)或無線通信網(wǎng)絡(luò)。在ー些實(shí)施例中，通信接ロ 103可具有足以實(shí)時(shí)地將視頻圖像從監(jiān)控相機(jī)102傳輸?shù)揭曨l處理和監(jiān)控系統(tǒng)101的帶寬。監(jiān)控相機(jī)102 可為模擬閉路電視(analog closed-circuit television, CCTV)相機(jī)或因特網(wǎng)協(xié)議(internet protocol, IP)相機(jī)等攝像機(jī),其經(jīng)配置以捕捉ー個(gè)或ー個(gè)以上監(jiān)控區(qū)域的視頻圖像。例如，攝像機(jī)可安裝在銀行分行的入口上方或緊靠ATM機(jī)。在ー些實(shí)施例中，監(jiān)控相機(jī)102可連接到例如中心網(wǎng)絡(luò)視頻記錄器(未圖示)等記錄裝置，其經(jīng)配置以記錄視頻圖像。在其它ー些實(shí)施例中，監(jiān)控相機(jī)102可具有內(nèi)建的記錄功能，且可因此直接記錄到數(shù)字存儲(chǔ)介質(zhì)，例如，快閃碟(flash drive)、硬盤(hard disk drive)或網(wǎng)絡(luò)附接存儲(chǔ)器(network attached storageノ。
由監(jiān)控相機(jī)102獲得的視頻數(shù)據(jù)可在被傳輸?shù)揭曨l處理和監(jiān)控系統(tǒng)101之前進(jìn)行壓縮。在本揭露中，視頻壓縮指代減少用以表示數(shù)字視頻圖像的數(shù)據(jù)量。因此，假定在通信接ロ 103上有預(yù)先確定的帶寬，那么壓縮視頻數(shù)據(jù)可比原始/未壓縮的視頻數(shù)據(jù)更快地傳輸。因此，視頻圖像可實(shí)時(shí)地在視頻處理和監(jiān)控系統(tǒng)101上進(jìn)行顯示。視頻壓縮可作為空間上圖像壓縮(spatial image compression)和時(shí)間上運(yùn)動(dòng)補(bǔ)償(temporal motion compensation)的組合來實(shí)施?？墒褂酶鞣N視頻壓縮方法來壓縮視頻數(shù)據(jù)，例如，離散余弦變換(discrete cosine transform,DCT)、離散小波變換(discretewavelet transform,DWT)、碎形壓縮(fractural compression)、匹配追蹤等。特別是許多基于DCT所開發(fā)出來的視頻壓縮標(biāo)準(zhǔn)，包含H. 120、H. 261、MPEG-I、H. 262/MPEG-2、H. 263、MPEG-4以及H. 264/MPEG-4AVC。H. 264是目前用于記錄、壓縮和傳播高清晰度視頻最常用的格式中的ー個(gè)。因此，本揭露討論與H. 264標(biāo)準(zhǔn)下壓縮的視頻數(shù)據(jù)相關(guān)聯(lián)的本揭露的實(shí)施例。然而，本揭露仍可應(yīng)用于用其它壓縮標(biāo)準(zhǔn)或方法壓縮的視頻數(shù)據(jù)。如在圖I中所繪示，視頻處理和監(jiān)控系統(tǒng)101可包含處理器110、存儲(chǔ)器模塊120、用戶輸入裝置130、顯示裝置140以及通信裝置150。處理器110可為中央處理單元(,central processing unit, CPU)或圖形處理單兀(graphic processing unit, GPU)。依據(jù)所使用的硬件的類型，處理器110可包含ー個(gè)或ー個(gè)以上的印刷電路板和/或微處理器芯片。處理器110可執(zhí)行計(jì)算機(jī)程序指令的序列，以執(zhí)行將在下文更詳細(xì)地闡釋的各種方法。在許多實(shí)施例中，處理器Iio可為H. 264解碼器，其經(jīng)配置以解壓縮使用H. 264標(biāo)準(zhǔn)下壓縮的視頻圖像數(shù)據(jù)。存儲(chǔ)器模塊120尤其可為隨機(jī)存取存儲(chǔ)器(random access memory, “RAM”)和只讀存儲(chǔ)器(read-only memory，“ROM”)。可從ROM或其它適合的存儲(chǔ)器位置中存取且讀取計(jì)算機(jī)程序指令，并加載到RAM中供處理器110執(zhí)行。例如，處理器110可存儲(chǔ)ー個(gè)或ー個(gè)以上應(yīng)用軟件(software application)。存儲(chǔ)在存儲(chǔ)器模塊120中的應(yīng)用軟件可包括常見用于計(jì)算機(jī)系統(tǒng)以及軟件控制裝置的操作系統(tǒng)121。另外，存儲(chǔ)器模塊可存儲(chǔ)可由處理器110執(zhí)行的應(yīng)用軟件的整個(gè)或一部分。在一些實(shí)施例中，存儲(chǔ)器模塊120可存儲(chǔ)視頻處理軟件122，其可由處理器110執(zhí)行。例如，視頻處理軟件122可被執(zhí)行以將陰影從壓縮視頻圖像中移除。還可預(yù)期的是，視頻處理軟件122或其部分可存儲(chǔ)在可裝卸計(jì)算機(jī)可讀媒體(例如，硬盤驅(qū)動(dòng)器、計(jì)算機(jī)磁盤、CD-ROM、DVD ROM、CD土RW或DVD土RW、USB閃存驅(qū)動(dòng)器、記憶棒、或其它任何適合的媒體)上，且可在視頻處理和監(jiān)控系統(tǒng)101的任何適合的組件上運(yùn)行。舉例來說，用以執(zhí)行視頻處理的應(yīng)用程序的一部分可駐存在可裝卸計(jì)算機(jī)可讀媒體上，且由處理器110使用已復(fù)制到存儲(chǔ)器120的例程來讀取并采取行動(dòng)。在一些實(shí)施例中，存儲(chǔ)器模塊120還可存儲(chǔ)主數(shù)據(jù)(master data)、用戶數(shù)據(jù)(user data)、應(yīng)用程序數(shù)據(jù)(application data)和 / 或程序代碼(program code)。例如，存儲(chǔ)器模塊120可存儲(chǔ)數(shù)據(jù)庫123，其中具有從監(jiān)控相機(jī)102傳輸來的各種壓縮視頻數(shù)據(jù)。在一些實(shí)施例中，輸入裝置130和顯示裝置140可通過適當(dāng)?shù)慕榻与娐?interfacing circuitry)而稱合到處理器110。在一些實(shí)施例中，輸入裝置130可為硬件鍵盤、小鍵盤(keypad)或觸摸屏(touch screen),例如警衛(wèi)等授權(quán)用戶(authorized user)即可將信息輸入到視頻處理和監(jiān)控系統(tǒng)101。顯示裝置140可包含ー個(gè)或ー個(gè)以上的顯示屏，其可顯示視頻圖像或與用戶相關(guān)的任何信息。通信裝置150可提供通信連接，使得視頻處理和監(jiān)控系統(tǒng)101可與例如視頻相機(jī)102等外部裝置交換數(shù)據(jù)。在一些實(shí)施例中，通信裝置150可包含網(wǎng)絡(luò)接ロ(未圖示)，其經(jīng)配置以接收來自通信接ロ 103的壓縮視頻數(shù)據(jù)。監(jiān)控系統(tǒng)100中的ー個(gè)或ー個(gè)以上組件可用來實(shí)施與視頻處理相關(guān)的過程。例如，圖2繪示用于檢測(cè)壓縮圖像域中移動(dòng)對(duì)象的陰影的示范性過程200的流程圖。在接收壓縮視頻流時(shí)開始過程200 (步驟201)。例如，視頻數(shù)據(jù)可由監(jiān)控相機(jī)102使用H. 264標(biāo)準(zhǔn)記錄并壓縮，且經(jīng)由通信接ロ 103傳輸?shù)揭曨l處理和監(jiān)控系統(tǒng)101。視頻數(shù)據(jù)表示一連串視頻圖像，其中記錄不同時(shí)間點(diǎn)處的受監(jiān)控區(qū)域信息。在一些實(shí)施例中，視頻流可包含以宏塊(macroblock)形式編碼的視頻數(shù)據(jù)。宏塊通常由兩個(gè)或兩個(gè)以上像素塊組成。塊的尺寸可取決于編解碼器(codec)，且通常為4的倍數(shù)。例如，在例如H. 263和H. 264等現(xiàn)代編解碼器中，宏觀的宏塊尺寸(overarchingmacroblock size)可固定為16 X 16像素，但可分解為4、8、12或16像素乘4、8、12或16像素的較小塊或分割區(qū)塊。顏色和亮度信息也可編碼在宏塊中。例如，宏塊可含有4Y(亮度)塊、ICb(藍(lán)色差)塊、ICr (紅色差)塊。在8X8宏塊的實(shí)例中，亮度可以8X8的像素尺寸編碼，而紅色差和藍(lán)色差信息可各自以2 X 2尺寸編碼。在一些實(shí)施例中，宏塊可進(jìn)ー步包含描述編碼的標(biāo)頭信息(header information)。例如,其可包含ADDR單元,其指示塊在視頻圖像中的地址；TYPE単元，其識(shí)別宏塊的類型(例如，幀內(nèi)、幀間、雙向幀間)；QUANT単元，其指示用以改變量化的量化值；VECT0R單元，其存儲(chǔ)運(yùn)動(dòng)向量；CBP單元，其存儲(chǔ)可指示塊在宏塊中匹配程度的位屏蔽。視頻圖像?？烧故救舾蓪?duì)象，包含靜止對(duì)象(static object)以及移動(dòng)對(duì)象(moving objects) 0由于發(fā)光源的存在，視頻圖像也可展示這些對(duì)象的陰影。特別是，與移動(dòng)對(duì)象相關(guān)聯(lián)的陰影的形狀、尺寸和方位可隨時(shí)間變化。例如，圖3為具有移動(dòng)對(duì)象和陰影的示范性視頻圖像。圖像301展示靜止對(duì)象311 (例如,樹)。圖像301進(jìn)ー步展示移動(dòng)對(duì)象312 (例如，人)以及移動(dòng)對(duì)象312的陰影313。移動(dòng)對(duì)象312和陰影313可在圖像中在不同時(shí)間點(diǎn)及不同位置出現(xiàn)。圖像301展示其在時(shí)間點(diǎn)t-2、t-1和t處的位置。在過程200的步驟202中，可在壓縮視頻圖像中檢測(cè)到對(duì)應(yīng)于ー個(gè)或ー個(gè)以上移動(dòng)對(duì)象以及其相應(yīng)陰影的候選對(duì)象區(qū)域。在一些實(shí)施例中，可基于尚未將其解壓縮到原始數(shù)據(jù)域中的壓縮視頻數(shù)據(jù)來檢測(cè)候選對(duì)象區(qū)域。圖3的圖像302展示分別在時(shí)間點(diǎn)t-2、t-1和t處所檢測(cè)的候選對(duì)象區(qū)域。在一些實(shí)施例中，候選圖像區(qū)域可包含移動(dòng)對(duì)象以及其陰影兩者。在一些實(shí)施例中，可使用多種圖像分割方法來檢測(cè)候選對(duì)象區(qū)域。其中，處理器110部分譯碼用以編碼相對(duì)應(yīng)數(shù)據(jù)塊中的時(shí)間變化的直流(明暗度)與交流(圖像紋理)成份的數(shù)據(jù)量，然后在由數(shù)據(jù)塊組成的候選對(duì)象區(qū)域中，通過陰影區(qū)域直流與交流成份編碼的數(shù)據(jù)量的特性，識(shí)別候選對(duì)象中的移動(dòng)對(duì)象及此移動(dòng)對(duì)象相關(guān)聯(lián)的陰影區(qū)域。例如，處理器110可聚集時(shí)間上鄰近的視頻圖像，并計(jì)算在所聚集的圖像中的每一“塊”的運(yùn)動(dòng)向量(motion vector)。因?yàn)檫\(yùn)動(dòng)向量表示的是塊內(nèi)的時(shí)間變化,所以具有較大運(yùn)動(dòng)向量的塊可被識(shí)別為候選對(duì)象區(qū)域的一部分。此外或替代地，處理器110也可基于亮度、顔色和位移向量等經(jīng)編碼的圖像特征來計(jì)算時(shí)間上鄰近的兩張視頻圖像之間的差異?；谒?jì)算的差異，處理器110可進(jìn)ー步識(shí)別塊是否屬于候選對(duì)象區(qū)域或背景。處理器110可進(jìn)ー步將所識(shí)別的塊“連接”到連續(xù)區(qū)域(continuous region)中。例如,處理器110可將候選圖像區(qū)域確定為覆蓋所識(shí)別的塊的連續(xù)區(qū)域。在一些實(shí)施例中，處理器110可在候選圖像區(qū)域中標(biāo)記塊。在過程200的步驟203中，可在候選對(duì)象區(qū)域中檢測(cè)陰影。在一些實(shí)施例中，可基于H. 264宏塊來進(jìn)行檢測(cè)。例如，圖4繪示用于檢測(cè)在H. 264壓縮視頻圖像中的陰影的示范性過程400的流程圖。在步驟401中，可將H. 264壓縮視頻數(shù)據(jù)部分解碼以獲得宏塊的信息。在步驟402中，可分析在候選圖像區(qū)域中的宏塊。例如，針對(duì)候選對(duì)象區(qū)域中的每一宏塊，處理器110可計(jì)算用以編碼對(duì)應(yīng)視頻數(shù)據(jù)的DC編碼位(步驟403)和AC編碼位(步驟404)。圖5說明移動(dòng)對(duì)象501和陰影502的示范性編碼。針對(duì)基于DCT的壓縮方法，DC編碼位通常用來編碼亮度上的均勻改變，而AC編碼位通常用來編碼圖像樣式、紋理或顔色上的改變。由于移動(dòng)對(duì)象501的移動(dòng)可造成樣式、紋理或顔色上的較不均勻的改變，所以其可需要比陰影502更多的編碼位。如圖5所繪示，陰影502的信息主要以DC編碼位進(jìn)行編碼(見譜520)，而移動(dòng)對(duì)象501的信息通常以DC編碼位和AC編碼位兩者進(jìn)行編碼(見譜510)。因此，在步驟405中，處理器110可基于每一宏塊的編碼數(shù)據(jù)的譜分布來估計(jì)在候選圖像區(qū)域內(nèi)的移動(dòng)對(duì)象501或陰影502的位置。在一些實(shí)施例中，在步驟403和步驟404中，處理器110可計(jì)算用以編碼宏塊的時(shí)間變化信息的編碼數(shù)據(jù)量(例如，由DC和AC編碼位攜帯的信息量)。因此，在步驟405中，處理器110可自候選對(duì)象區(qū)域識(shí)別所估計(jì)的陰影區(qū)，其是由具有較小量AC編碼數(shù)據(jù)的宏塊組成。例如，處理器110可將每一宏塊的編碼數(shù)據(jù)量與預(yù)定閾值進(jìn)行比較。如果超過閾值，那么將宏塊標(biāo)記為移動(dòng)對(duì)象501的一部分。否則，將宏塊標(biāo)記為陰影502的一部分。在其它實(shí)施例中，在步驟403和步驟404中，處理器110可計(jì)算用于每一宏塊的編碼數(shù)據(jù)的值。例如，處理器110可計(jì)算DC和AC編碼位。由于移動(dòng)對(duì)象501的AC編碼位傾向于具有高于陰影502的AC編碼位的值，所以在步驟405中，處理器110可識(shí)別由具有較大值的AC編碼位的那些宏塊組成的圖像區(qū)域，以做為估計(jì)對(duì)象的真實(shí)位置。基于在步驟405中對(duì)陰影位置的估計(jì)，處理器110可在候選圖像區(qū)域內(nèi)確定移動(dòng)對(duì)象501與陰影502之間的邊界(步驟406)。例如，候選對(duì)象區(qū)域可被邊界分成兩個(gè)部分陰影圖像區(qū)域以及對(duì)象圖像區(qū)域。處理器110可基于兩個(gè)圖像區(qū)域的運(yùn)動(dòng)熵(motion entropy)來進(jìn)ー步精細(xì)化(refine)邊界。壓縮視頻數(shù)據(jù)中的每一宏塊可與一運(yùn)動(dòng)向量相關(guān)聯(lián)，所述運(yùn)動(dòng)向量為用于幀間預(yù)測(cè)的ニ維向量，所述預(yù)測(cè)可提供視頻圖像中坐標(biāo)與參考圖像中坐標(biāo)的偏移(offset)。與移動(dòng)對(duì)象中宏塊相關(guān)聯(lián)的運(yùn)動(dòng)向量可共用類似的或相同的移動(dòng)方向，而與在移動(dòng)陰影(moving shadow)中宏塊相關(guān)聯(lián)的運(yùn)動(dòng)向量可展示多種移動(dòng)方向。因此,與陰影的宏塊相關(guān)聯(lián)的運(yùn)動(dòng)向量的運(yùn)動(dòng)熵通?？筛吒膳c移動(dòng)對(duì)象相關(guān)聯(lián)的運(yùn)動(dòng)向量。因此，在將陰影圖像區(qū)域的運(yùn)動(dòng)熵與對(duì)象圖像區(qū)域的運(yùn)動(dòng)熵之間的差異最大化時(shí)，可準(zhǔn)確地設(shè)定移動(dòng)對(duì)象501與陰影502之間的邊界。在一些實(shí)施例中，可使用迭代(iterative)的方法來精細(xì)化邊界。例如，在步驟407中，處理器110可計(jì)算由步驟406中所確定的邊界分離的陰影圖像區(qū)域和對(duì)象圖像區(qū)域中的每ー者的運(yùn)動(dòng)熵。處理器110可進(jìn)ー步確定陰影圖像區(qū)域的運(yùn)動(dòng)熵與對(duì)象圖像區(qū)域的運(yùn)動(dòng)熵之間的差異。處理器110然后回到步驟406以稍微調(diào)整邊界，并再次執(zhí)行步驟407以確定運(yùn)動(dòng)熵中的另ー差異。步驟406和步驟407可重復(fù)執(zhí)行直到運(yùn)動(dòng)熵中的差異被最大化為止。基于在步驟403和步驟404中所計(jì)算的編碼位、在步驟407中所計(jì)算的運(yùn)動(dòng)熵，以及在步驟406中所確定的精細(xì)化的邊界，處理器110可使用本領(lǐng)域技術(shù)中已知的各種圖像分割和數(shù)據(jù)融合方法(例如，馬爾科夫隨機(jī)場(Markov Random Field, MRF)分類方法)來識(shí)別陰影502的位置(步驟408)。然后，過程400在步驟408之后終止。回到圖2，在過程200的步驟204中基于宏塊檢測(cè)對(duì)象圖像(步驟203)之后，可基于環(huán)境模型進(jìn)行進(jìn)一歩預(yù)測(cè)陰影位置。在一些實(shí)施例中，可模擬在其下獲得視頻圖像的環(huán)境配置。例如，圖6繪示基于環(huán)境模擬來檢測(cè)陰影的示范性過程600的流程圖。在步驟601中，可基于在步驟203中所檢測(cè)的對(duì)象圖像區(qū)域來確定假想移動(dòng)對(duì)象。例如，圖3的圖像303繪示與所檢測(cè)對(duì)象圖像區(qū)域重疊的假想移動(dòng)對(duì)象。在一些實(shí)施例中，假想移動(dòng)對(duì)象可呈三維幾何模型的形式，例如，圓柱體、立方體、金字塔形等。例如，圖7繪示示范性假想移動(dòng)對(duì)象701和702。假想移動(dòng)對(duì)象701經(jīng)模型化為立方體，且假想移動(dòng)對(duì)象702經(jīng)模型化為圓柱體。在步驟602中，可形成環(huán)境模型。在一些實(shí)施例中，處理器110可在真實(shí)的監(jiān)控環(huán)境中接收發(fā)光源的位置信息的輸入。然后，處理器110可形成包含發(fā)光源和假想移動(dòng)對(duì)象的環(huán)境模型。在步驟603中，處理器110可模擬從發(fā)光源的位置到假想移動(dòng)對(duì)象上的光投影(light projections)。因此,在步驟604中，處理器110可估計(jì)假想移動(dòng)對(duì)象的陰影位置(例如，假想陰影710和720)，如圖7所繪示。因?yàn)橐苿?dòng)對(duì)象在受監(jiān)控區(qū)域中移動(dòng)，所以移動(dòng)對(duì)象的陰影的尺寸和形狀可在不同時(shí)間點(diǎn)處改變。例如，圖3的圖像304繪示在不同時(shí)間點(diǎn)處的圓柱形假想移動(dòng)對(duì)象的假想陰影。過程600可在步驟604之后終止?；氐綀D2，在基于宏塊檢測(cè)陰影位置(步驟203)和基于環(huán)境模型預(yù)測(cè)陰影位置(步驟204)之后，可在步驟205中執(zhí)行從壓縮視頻圖像中搜索陰影。其中，處理器110可基于環(huán)境光照模型計(jì)算移動(dòng)對(duì)象所產(chǎn)生的陰影區(qū)域，并將此計(jì)算所得的陰影區(qū)域與前項(xiàng)基于宏區(qū)塊所檢測(cè)的陰影位置融合計(jì)算，以獲得真實(shí)移動(dòng)對(duì)象的區(qū)域。例如，圖8繪示用于陰影搜索的示范性過程800的流程圖。在步驟801和802中，可由處理器110接收基于H. 264宏塊所檢測(cè)的陰影位置和基于環(huán)境模型所斷言的陰影位置，并將這些陰影位置聚集在一起(步驟 803)。例如，圖3的圖像305展示移動(dòng)對(duì)象在不同時(shí)間點(diǎn)t_2、t-1和t所聚集的陰影位置。在步驟804中，處理器110可計(jì)算陰影位置的定界框(bounding box)。在ー些實(shí)施例中，定界框可為覆蓋所聚集陰影位置的開端的矩形框。例如，圖3的圖像306繪示在不同時(shí)間點(diǎn)處的陰影位置的定界框。盡管在此是以矩形的定界框?yàn)槔稣f明，但此定界框也可為其它適合的形狀，例如，圓形、橢圓形、三角形等。過程800可在步驟804之后終止。回到圖2，在步驟206中，陰影即可被移除。在一些實(shí)施例中，處理器110可使用背景視頻數(shù)據(jù)來代替在定界框內(nèi)的宏塊的視頻數(shù)據(jù)。例如，處理器110可使用剛好在定界框的外部的相鄰宏塊的視頻數(shù)據(jù)。圖3的圖像306繪示在移除陰影之后僅具有移動(dòng)對(duì)象的視頻圖像。在一些實(shí)施例中，作為步驟206的部分，處理器110可進(jìn)ー步計(jì)算移動(dòng)對(duì)象的移動(dòng)軌跡。過程200在步驟206之后終止。雖然本發(fā)明已以實(shí)施例掲示如上，然其并非用以限定本發(fā)明，任何所屬技術(shù)領(lǐng)域的普通技術(shù)人員，當(dāng)可作些許更動(dòng)與潤飾，而不脫離本發(fā)明的精神和范圍。
權(quán)利要求
1.一種用于處理壓縮視頻圖像的方法，其包括由處理器從所述壓縮視頻圖像中檢測(cè)候選對(duì)象區(qū)域，其中所述候選對(duì)象區(qū)域包含移動(dòng)對(duì)象以及與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影；針對(duì)在所述候選對(duì)象區(qū)域中的每ー數(shù)據(jù)塊，由所述處理器部分解碼用以編碼所述相應(yīng)數(shù)據(jù)塊中的時(shí)間變化的ー編碼數(shù)據(jù)量；以及由所述處理器在由數(shù)據(jù)塊組成的所述候選對(duì)象區(qū)域中識(shí)別所述陰影，每ー數(shù)據(jù)塊具有低于閾值的編碼數(shù)據(jù)量。
2.根據(jù)權(quán)利要求I所述的方法，其特征在于用H.264壓縮方法對(duì)所述壓縮視頻圖像進(jìn)行壓縮。
3.根據(jù)權(quán)利要求I所述的方法，其特征在于檢測(cè)所述候選對(duì)象區(qū)域包括從所述壓縮視頻圖像中識(shí)別多個(gè)圖像區(qū)域，其中所述圖像區(qū)域具有預(yù)定的編碼特征；以及確定覆蓋所述多個(gè)圖像區(qū)域的連續(xù)區(qū)域。
4.根據(jù)權(quán)利要求I所述的方法，其特征在于所述編碼數(shù)據(jù)量為由所述相應(yīng)的數(shù)據(jù)塊的DC編碼位以及AC編碼位攜帯的一信息量。
5.根據(jù)權(quán)利要求4所述的方法，其進(jìn)ー步包括針對(duì)每一數(shù)據(jù)塊，計(jì)算所述DC編碼位以及所述AC編碼位的值。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于識(shí)別所述陰影包含識(shí)別具有大于預(yù)定閾值的所述AC編碼位的值的所述數(shù)據(jù)塊。
7.根據(jù)權(quán)利要求I所述的方法，其特征在于識(shí)別所述陰影包含確定在表示所述移動(dòng)對(duì)象的數(shù)據(jù)塊與表示所述陰影的數(shù)據(jù)塊之間的邊界。
8.根據(jù)權(quán)利要求7所述的方法，其特征在于確定所述邊界包含計(jì)算用于表示所述移動(dòng)對(duì)象的所述數(shù)據(jù)塊的運(yùn)動(dòng)向量的第一熵值；計(jì)算用于表示所述陰影的所述數(shù)據(jù)塊的所述運(yùn)動(dòng)向量的第二熵值；以及確定所述第一熵值與所述第二熵值之間的差。
9.根據(jù)權(quán)利要求8所述的方法，其特征在于識(shí)別所述陰影包含識(shí)別表示所述陰影的所述數(shù)據(jù)塊，使得將所述差最大化。
10.根據(jù)權(quán)利要求I所述的方法，其進(jìn)ー步包括通過用背景視頻數(shù)據(jù)代替所述陰影中的數(shù)據(jù)塊來從所述壓縮視頻圖像中移除所述陰影。
11.根據(jù)權(quán)利要求I所述的方法，其進(jìn)ー步包括由該處理器基于所檢測(cè)的對(duì)象圖像區(qū)域來決定ー假想移動(dòng)對(duì)象；由該處理器形成在其中獲得所述壓縮視頻圖像的ー環(huán)境模型；由該處理器基于該環(huán)境模型來決定用于所述假想移動(dòng)對(duì)象的一假想陰影；以及由該處理器聚集在所述候選對(duì)象區(qū)域中所識(shí)別的陰影以及基于環(huán)境模型所預(yù)測(cè)的假想陰影。
12.一種用于處理壓縮視頻圖像的方法，其包括由處理器從所述壓縮視頻圖像中檢測(cè)表示移動(dòng)對(duì)象的對(duì)象圖像區(qū)域，其中所述壓縮視頻圖像包含與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影；由所述處理器基于所檢測(cè)的對(duì)象圖像區(qū)域來確定假想移動(dòng)對(duì)象；由所述處理器形成在其中獲得所述壓縮視頻圖像的環(huán)境模型；以及由所述處理器基于所述環(huán)境模型來確定用于所述假想移動(dòng)對(duì)象的假想陰影。
13.根據(jù)權(quán)利要求12所述的方法，其進(jìn)ー步包括接收在其下獲得所述壓縮視頻圖像的發(fā)光源的位置信息；以及將來自所述發(fā)光源的光投射到所述假想移動(dòng)對(duì)象上。
14.根據(jù)權(quán)利要求12所述的方法，其進(jìn)ー步包括從所述壓縮視頻圖像中搜索最匹配所述假想陰影的陰影圖像區(qū)域。
15.根據(jù)權(quán)利要求14所述的方法，其進(jìn)ー步包括基于所述陰影圖像區(qū)域形成定界框；以及通過用背景視頻數(shù)據(jù)代替所述定界框中的數(shù)據(jù)塊來移除所述陰影。
16.根據(jù)權(quán)利要求12所述的方法，其進(jìn)ー步包括針對(duì)所述候選對(duì)象區(qū)域中的每ー數(shù)據(jù)塊，由該處理器部分譯碼用以編碼相應(yīng)數(shù)據(jù)塊中一時(shí)間變化的ー編碼數(shù)據(jù)量；由該處理器在由多個(gè)數(shù)據(jù)塊組成的候選對(duì)象區(qū)域中識(shí)別該陰影，每ー數(shù)據(jù)塊具有低于ー閾值的編碼數(shù)據(jù)量；以及由該處理器聚集在所述候選對(duì)象區(qū)域中所識(shí)別的陰影以及基于環(huán)境模型所預(yù)測(cè)的假想陰影。
17.ー種用于處理壓縮視頻圖像的系統(tǒng)，其包括存儲(chǔ)裝置，其經(jīng)配置以存儲(chǔ)所述壓縮視頻圖像，其中所述壓縮視頻圖像包含移動(dòng)對(duì)象以及與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影；以及處理器，其與所述存儲(chǔ)裝置耦合且經(jīng)配置以從所述壓縮視頻圖像中檢測(cè)候選對(duì)象區(qū)域，其中所述候選對(duì)象區(qū)域包含所述移動(dòng)對(duì)象以及與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影；針對(duì)在所述候選對(duì)象區(qū)域中的每ー數(shù)據(jù)塊，計(jì)算用以編碼所述相應(yīng)數(shù)據(jù)塊中的時(shí)間變化的ー編碼數(shù)據(jù)量；以及在由數(shù)據(jù)塊組成的所述候選對(duì)象區(qū)域中識(shí)別所述陰影，每ー數(shù)據(jù)塊具有低于閾值的所述編碼數(shù)據(jù)量。
18.根據(jù)權(quán)利要求17所述的系統(tǒng)，其特征在于所述處理器為H.264解碼器。
19.ー種用于處理壓縮視頻圖像的系統(tǒng)，其包括存儲(chǔ)裝置，其經(jīng)配置以存儲(chǔ)所述壓縮視頻圖像，其中所述壓縮視頻圖像包含移動(dòng)對(duì)象以及與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影；以及處理器，其與所述存儲(chǔ)裝置耦合且經(jīng)配置以從所述壓縮視頻圖像中檢測(cè)表示所述移動(dòng)對(duì)象的對(duì)象圖像區(qū)域；基于所述所檢測(cè)的對(duì)象圖像區(qū)域來確定假想移動(dòng)對(duì)象；形成在其中獲得所述壓縮視頻圖像的環(huán)境模型；以及基于所述環(huán)境模型來確定用于所述假想移動(dòng)對(duì)象的假想陰影。
全文摘要
一種用于處理壓縮視頻圖像的方法及系統(tǒng)。處理器從壓縮視頻圖像中檢測(cè)候選對(duì)象區(qū)域。候選對(duì)象區(qū)域包含移動(dòng)對(duì)象以及與所述移動(dòng)對(duì)象相關(guān)聯(lián)的陰影。針對(duì)在候選對(duì)象區(qū)域中的每一數(shù)據(jù)塊，處理器部分解碼用以編碼相對(duì)應(yīng)數(shù)據(jù)塊中時(shí)間變化的直流與交流數(shù)據(jù)量。然后，處理器在由數(shù)據(jù)塊組成的候選對(duì)象區(qū)域中，通過陰影區(qū)塊直流與交流編碼數(shù)據(jù)量的特性，識(shí)別候選對(duì)象中的移動(dòng)對(duì)象及此移動(dòng)對(duì)象相關(guān)聯(lián)的陰影區(qū)域。
文檔編號(hào)H04N7/26GK102761737SQ20111029956
公開日2012年10月31日申請(qǐng)日期2011年9月30日優(yōu)先權(quán)日2011年4月28日
發(fā)明者樊恩戎, 白宏益, 蔣岳珉, 藍(lán)坤銘, 連振昌申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：連振昌;樊恩戎;蔣岳珉;白宏益;藍(lán)坤銘
技術(shù)所有人：財(cái)團(tuán)法人工業(yè)技術(shù)研究院
我是此專利的發(fā)明人

上一篇：一種安全高效的數(shù)據(jù)融合方法
上一篇：一種呼叫內(nèi)線接入號(hào)碼的方法及系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

小波變換用于圖像壓縮相關(guān)技術(shù)

圖像有陰影相關(guān)技術(shù)

圖像去陰影算法相關(guān)技術(shù)

圖像陰影去除相關(guān)技術(shù)

圖像陰影檢測(cè)相關(guān)技術(shù)

圖像去陰影相關(guān)技術(shù)

ps圖像陰影相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于處理壓縮視頻圖像中陰影的系統(tǒng)及方法