亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種視頻感興趣區(qū)域快速標(biāo)定方法與裝置與流程

文檔序號(hào):12365567閱讀:417來(lái)源:國(guó)知局
一種視頻感興趣區(qū)域快速標(biāo)定方法與裝置與流程

本發(fā)明涉及一種視頻數(shù)據(jù)處理方法,尤其涉及一種視頻感興趣區(qū)域快速標(biāo)定方法與裝置。



背景技術(shù):

隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的不斷完善,以及蜂窩移動(dòng)通信網(wǎng)絡(luò)的升級(jí)換代,人們?cè)谏詈凸ぷ髦性絹?lái)越多地使用視頻電話或視頻通話作為遠(yuǎn)距離溝通交流的手段。但是由于諸如網(wǎng)絡(luò)帶寬不足、網(wǎng)絡(luò)傳輸負(fù)荷過(guò)大、視頻圖像分辨率不斷提升等多方面因素的影響,傳統(tǒng)的視頻編碼技術(shù)無(wú)法保證用戶獲得高質(zhì)量的視頻圖像。視頻編碼技術(shù)經(jīng)過(guò)多年的發(fā)展,也逐步接近壓縮率的極限,如何在相對(duì)穩(wěn)定的壓縮比基礎(chǔ)上,進(jìn)一步獲得讓觀看者主觀感知上更高質(zhì)量的視頻圖像,是當(dāng)前視頻壓縮技術(shù)領(lǐng)域的難點(diǎn)之一。

顏色空間也稱色彩模型(又稱色彩空間或色彩系統(tǒng)),它的用途是在某些標(biāo)準(zhǔn)下用通??山邮艿姆绞綄?duì)顏色加以描述。顏色空間有許多種,常用有RGB、YUV、HSI等。RGB(紅綠藍(lán))是依據(jù)人眼識(shí)別的顏色定義出的空間,可表示大部分顏色。但因?yàn)镽GB模型將色調(diào),亮度,飽和度三個(gè)量放在一起表示,很難分開(kāi),難以進(jìn)行數(shù)字化的細(xì)節(jié)調(diào)整,所以在工程及科研中,一般不直接使用RGB模型,而是將RGB模型轉(zhuǎn)換為YUV或HSI等其他色彩模型再進(jìn)行后續(xù)處理。

YUV色彩模型是將RGB模型的R、G、B分量經(jīng)過(guò)矩陣變換得到亮度信號(hào)Y和兩個(gè)色差信號(hào)B-Y(即U)、R-Y(即V),最后發(fā)送端將亮度和色差三個(gè)信號(hào)分別進(jìn)行編碼,用同一信道發(fā)送出去。其中“Y”表示明亮度(Luminance或Luma),也就是灰階值;而“U”和“V”表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用于指定像素的顏色,分別用Cr和Cb來(lái)表示。其中,Cr反映了RGB輸入信號(hào)紅色部分與RGB信號(hào)亮度值之間的差異,而Cb反映的是RGB輸入信號(hào)藍(lán)色部分與RGB信號(hào)亮度值之間的差異。YUV色彩模型的亮度信號(hào)Y和色度信號(hào)U、V是分離的,非常適合進(jìn)行增強(qiáng)、壓縮等圖像處理。

HSI〔Hue-Saturation-Intensity(Lightness),HSI或HSL〕顏色模型用H、S、I三參數(shù)描述顏色特性,其中H定義顏色的波長(zhǎng),稱為色調(diào);S表示顏色的深淺程度,稱為飽和度;I表示強(qiáng)度或亮度。當(dāng)人觀察一個(gè)彩色物體時(shí),用色調(diào)、飽和度、亮度來(lái)描述物體的顏色。色調(diào)是描述純色的屬性(純黃色、橘黃或者紅色);飽和度給出一種純色被白光稀釋的程度的度量;亮度是一個(gè)主觀的描述,實(shí)際上,它是不可以測(cè)量的,體現(xiàn)了無(wú)色的強(qiáng)度概念,并且是描述彩色感覺(jué)的關(guān)鍵參數(shù)。而強(qiáng)度(灰度)是單色圖像最有用的描述子,這個(gè)量是可以測(cè)量且很容易解釋。則將提出的這個(gè)模型稱作為HSI(色調(diào)、飽和度、強(qiáng)度)彩色模型,該模型可在彩色圖像中從攜帶的彩色信息(色調(diào)和飽和度)里消去強(qiáng)度分量的影響,使得HSI模型成為開(kāi)發(fā)基于彩色描述的圖像處理方法的良好工具,而這種彩色描述對(duì)人來(lái)說(shuō)是自然而直觀的。

HSI模型是美國(guó)色彩學(xué)家孟塞爾(H.A.Munseu)于1915年提出的,它反映了人的視覺(jué)系統(tǒng)感知彩色的方式,以色調(diào)、飽和度和強(qiáng)度三種基本特征量來(lái)感知顏色。

感興趣區(qū)域(ROI,Range of Interesting)視頻編碼是目前應(yīng)對(duì)以上難題的有效解決方案之一,由于人眼具有視覺(jué)感興趣區(qū)的特性,即人眼對(duì)一副圖像不同區(qū)域感興趣的程度不同,這就意味著人眼對(duì)一幅圖像不同區(qū)域的質(zhì)量損失可察覺(jué)度也相應(yīng)不同,因此,基于感興趣區(qū)域的視頻編碼方法,可充分利用視頻圖像接收者的這一主觀特性,對(duì)圖像中不同區(qū)域采用不同的編碼策略,可以有效地在不增加編碼碼率的同時(shí)顯著提升圖像等的主觀感受質(zhì)量。為了實(shí)現(xiàn)感興趣區(qū)域視頻編碼這一技術(shù),當(dāng)前主流的視頻編解碼算法標(biāo)準(zhǔn)均提供了相應(yīng)的建議實(shí)現(xiàn)方案,例如國(guó)際標(biāo)準(zhǔn)化組織/國(guó)際電工委員會(huì)(ISO/IEC)運(yùn)動(dòng)圖像專家組-2(MPEG-2)標(biāo)準(zhǔn)、ISO/IEC運(yùn)動(dòng)圖像專家組-4(MPEG-4)第10部分高級(jí)視頻編碼標(biāo)準(zhǔn)(AVC)、國(guó)際電信聯(lián)盟(ITU)H.264標(biāo)準(zhǔn),均提供了在圖像特定區(qū)域獲得比其它區(qū)域更高質(zhì)量的機(jī)制,允許發(fā)送端通過(guò)分析待編碼圖像的特性區(qū)分出感興趣區(qū)域,通過(guò)對(duì)感興趣區(qū)域分配更多編碼比特以保留更多細(xì)節(jié),來(lái)獲得更高的感知質(zhì)量。

而對(duì)于一般的ROI提取問(wèn)題,流行的方法是建立可計(jì)算的視覺(jué)關(guān)注模型,這是一種涉及視覺(jué)生理,認(rèn)知心理,記憶機(jī)制,圖像信息等等方面的復(fù)雜模型,一般難以得到快速標(biāo)定方法,特別是對(duì)于動(dòng)態(tài)圖像。另外一些處理特定的從動(dòng)態(tài)圖像中標(biāo)定人臉區(qū)域的方法因?yàn)檫^(guò)多關(guān)注于人臉的形狀或人臉上特定部位的性質(zhì),往往引入了復(fù)雜的算法,也不適用于動(dòng)態(tài)圖像中人臉區(qū)域的快速標(biāo)定。符合H264規(guī)范的軟件編碼器如OPENH264編碼器,由于算法的復(fù)雜性本身會(huì)占用處理器的一部分處理資源,因此在其中嵌入人臉區(qū)域標(biāo)定的算法必須是簡(jiǎn)單快速而又有效的,且由于H264中壓縮處理的基本單元是宏塊(MB),因此人臉區(qū)域標(biāo)定應(yīng)該以MB為該區(qū)域的基本單元。

關(guān)于從圖像對(duì)人臉區(qū)域進(jìn)行標(biāo)定,目前有多種算法:基于知識(shí)的算法利用對(duì)人臉先驗(yàn)的知識(shí)指定規(guī)則進(jìn)行識(shí)別;基于特征的算法先找到人臉的穩(wěn)定特征然后在圖像中進(jìn)行匹配驗(yàn)證這種特征是否存在;還有基于統(tǒng)計(jì)和概率模型的算法?;谌四樃鱾€(gè)部分的膚色特征進(jìn)行分割處理,并考慮各部分的形狀特征以及相互之間的位置關(guān)系特征,這是一種屬于基于特征的算法,與其他種類算法一樣,它也具有相當(dāng)大的復(fù)雜性,不適用于快速標(biāo)定。

現(xiàn)有技術(shù)的缺點(diǎn)主要體現(xiàn)在計(jì)算的復(fù)雜性上,大部分視頻相關(guān)應(yīng)用都是動(dòng)態(tài)視頻,有相當(dāng)?shù)膶?shí)時(shí)性要求,另一方面,承載視頻應(yīng)用的設(shè)備,比如通常的移動(dòng)終端,處理器能力有限,也不允許太多的計(jì)算復(fù)雜性。



技術(shù)實(shí)現(xiàn)要素:

為了解決現(xiàn)有技術(shù)中視頻感興趣區(qū)域標(biāo)定方式計(jì)算方式復(fù)雜不適用于處理器能力有限的終端或情境的問(wèn)題,本發(fā)明提供了一種視頻感興趣區(qū)域快速標(biāo)定方法與裝置。

本發(fā)明提供了一種視頻感興趣區(qū)域快速標(biāo)定方法,包括:

確定視頻數(shù)據(jù)中的目標(biāo)幀圖像;

確定目標(biāo)幀圖像中第一分量圖像數(shù)據(jù)、第二分量圖像數(shù)據(jù);

計(jì)算所述第一分量圖像數(shù)據(jù)的閾值TH并計(jì)算所述第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值閾值DTH;

根據(jù)所述閾值TH、所述差值閾值DTH、所述目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊,將所述宏塊的集合作為所述目標(biāo)幀圖像的感興趣域區(qū)域。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述根據(jù)所述閾值TH、所述差值閾值DTH、所述目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊包括:

所述閾值TH的值大于或等于第一TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于所述第二TH值且小于第一TH值的像素為目標(biāo)像素;

所述閾值TH的值小于所述第一TH值且大于或等于第二TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第二TH值且小于所述第一TH值且所述第一分量的值與第二分量的值的差值的絕對(duì)值大于所述差值閾值DTH的像素為目標(biāo)像素;

所述閾值TH的值小于所述第二TH值且大于或等于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于所述第三TH值且所述第一分量的值與第二分量的值的差值的絕對(duì)值大于所述差值閾值DTH的像素為目標(biāo)像素;

所述閾值TH的值小于所述第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第三TH值且小于所述第一TH值的像素為目標(biāo)像素;

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于所述宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊;

其中,所述第一TH值、所述第二TH值、所述第三TH值依次降低。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述根據(jù)所述閾值TH、所述差值閾值DTH、所述目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊包括:

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

所述閾值TH的值大于或等于第一TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于所述第二TH值且小于第一TH值的像素為目標(biāo)像素;

所述閾值TH的值小于第一TH值且大于或等于第二TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第一閾值且小于所述第一TH值且所述第一分量的值與第二分量的值的差值的絕對(duì)值大于所述差值閾值DTH的像素為目標(biāo)像素;第一閾值小于所述第二TH值;

所述閾值TH的值小于所述第二TH值且大于或等于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于所述閾值TH且大于第二閾值且第一分量的值與第二分量的值的差值的絕對(duì)值大于所述差值閾值DTH的像素為目標(biāo)像素;

所述閾值TH的值小于所述第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于所述閾值TH且大于第三閾值且小于所述第一TH值的像素為目標(biāo)像素;

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于所述宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊;

其中,所述第一TH值、所述第二TH值、所述第三TH值依次降低;所述第一閾值、所述第二閾值、所述第三閾值依次降低且均大于所述第二TH值且小于所述第二TH值。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述第一分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的濃度分量圖像數(shù)據(jù),所述第二分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的色度分量圖像數(shù)據(jù);所述X的值為1,所述第一TH值為160、所述第二TH值為145、所述第二TH值為120。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述第一分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的濃度分量圖像數(shù)據(jù),所述第二分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的色度分量圖像數(shù)據(jù);所述X的值為1,所述第一TH值為160、所述第二TH值為145、所述第二TH值為120、所述第一閾值為140,所述第二閾值為135、所述第三閾值為130。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述第一分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的色調(diào)分量圖像數(shù)據(jù),所述第二分量圖像數(shù)據(jù)是所述目標(biāo)幀圖像中的飽和度分量圖像數(shù)據(jù);所述X的值為π,所述第一TH值為1.2π、所述第二TH值為1.1π、所述第三TH值為π、所述第一閾值為1.05π,所述第二閾值為1.02π、所述第三閾值為1.01π。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

第一比例為1/10。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述計(jì)算所述第一分量圖像數(shù)據(jù)的二值化閾值TH和所述第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值的二值化閾值DTH包括:根據(jù)最大類間方差方法計(jì)算所述第一分量圖像數(shù)據(jù)的二值化閾值TH和所述第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值的二值化閾值DTH。

上述視頻感興趣區(qū)域快速標(biāo)定方法還具有以下特點(diǎn):

所述確定視頻數(shù)據(jù)中的目標(biāo)幀圖像包括:以相同間隔幀數(shù)選取所述視頻數(shù)據(jù)中的目標(biāo)幀圖像;或者,根據(jù)所述視頻數(shù)據(jù)中相鄰幀中宏塊的運(yùn)動(dòng)信息確定目標(biāo)幀圖像。

本發(fā)明還提供了一種視頻感興趣區(qū)域快速標(biāo)定裝置,包括:

目標(biāo)幀圖像確定模塊,用于確定視頻數(shù)據(jù)中的目標(biāo)幀圖像;

分量圖像數(shù)據(jù)確定模塊,用于確定目標(biāo)幀圖像中第一分量圖像數(shù)據(jù)、第二分量圖像數(shù)據(jù);

閾值計(jì)算模塊,用于計(jì)算所述第一分量圖像數(shù)據(jù)的閾值TH、所述第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值閾值DTH;

感興趣區(qū)域確定模塊,用于根據(jù)所述閾值TH、所述差值閾值DTH、所述目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊,將所述宏塊的集合作為所述目標(biāo)幀圖像的感興趣域區(qū)域。

本發(fā)明提供了一種準(zhǔn)確又簡(jiǎn)單快速的標(biāo)定視頻感興趣區(qū)域的方法,用于在動(dòng)態(tài)視頻中標(biāo)定人臉區(qū)域,尤其適用于處理器能力有限的終端和應(yīng)用情境。

附圖說(shuō)明

構(gòu)成本發(fā)明的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:

圖1是實(shí)施例中視頻感興趣區(qū)域快速標(biāo)定方法的流程圖;

圖2是實(shí)施例中視頻感興趣區(qū)域快速標(biāo)定裝置的結(jié)構(gòu)圖。

具體實(shí)施方式

以下結(jié)合說(shuō)明書附圖及具體實(shí)施例進(jìn)一步說(shuō)明本發(fā)明的技術(shù)方案。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,并不用于限定本發(fā)明。

圖1是實(shí)施例中視頻感興趣區(qū)域快速標(biāo)定方法的流程圖,此方法包括:

步驟101,確定視頻數(shù)據(jù)中的目標(biāo)幀圖像;

步驟102,確定目標(biāo)幀圖像中第一分量圖像數(shù)據(jù)、第二分量圖像數(shù)據(jù);

步驟103,計(jì)算第一分量圖像數(shù)據(jù)的閾值TH、第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值閾值DTH;

步驟104,根據(jù)閾值TH、差值閾值DTH、目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊,將所述宏塊的集合作為目標(biāo)幀圖像的感興趣域區(qū)域。

其中,步驟101中確定視頻數(shù)據(jù)中的目標(biāo)幀圖像的方式包括以下兩種:以相同間隔幀數(shù)選取視頻數(shù)據(jù)中的目標(biāo)幀圖像;或者,根據(jù)視頻數(shù)據(jù)中相鄰幀中宏塊的運(yùn)動(dòng)信息確定目標(biāo)幀圖像,在相鄰幀中宏塊的運(yùn)動(dòng)范圍較小時(shí),以較小的間隔幀數(shù)確定目標(biāo)幀圖像,在相鄰幀中宏塊的運(yùn)動(dòng)范圍較大時(shí),以較大的間隔幀數(shù)確定目標(biāo)幀圖像。本發(fā)明對(duì)于處理能力較差的設(shè)備,很容易通過(guò)放棄一小部分人臉區(qū)域標(biāo)定的性能,等效的提升本發(fā)明提出的算法的速度,具體如下:利用連續(xù)的圖像幀之間的相關(guān)性,可以使用大于1的幀數(shù),比如以2或3幀為周期做人臉區(qū)域標(biāo)定而不是每1幀都作為目標(biāo)幀,周期內(nèi)的幀認(rèn)為人臉區(qū)域不變。在視頻流的圖像內(nèi)容變化不快的情況下,這樣做幾乎不會(huì)損失標(biāo)定的性能。

步驟103中,根據(jù)最大類間方差計(jì)算第一分量圖像數(shù)據(jù)的閾值TH以及第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值的閾值DTH。

下面通過(guò)使用視頻圖像中濃度分量V和色度分量U的兩個(gè)示例說(shuō)明本發(fā)明的實(shí)現(xiàn)方法。步驟102中的目標(biāo)幀圖像的圖像格式不是YUV格式時(shí),需先將目標(biāo)幀圖像轉(zhuǎn)換為YUV圖像格式再執(zhí)行下述操作。

實(shí)現(xiàn)方法一

本實(shí)現(xiàn)方法二中采用YUV空間進(jìn)行ROI的快速標(biāo)定。其中,第一分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的濃度分量V圖像數(shù)據(jù),第二分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的色度分量U圖像數(shù)據(jù)。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

TH的值大于或等于第一TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第二TH值且小于第一TH值的像素為目標(biāo)像素;

TH的值小于第一TH值且大于或等于第二TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第二TH值且小于第一TH值且第一分量的值與第二分量的值的差值的絕對(duì)值大于差值閾值DTH的像素為目標(biāo)像素;

TH的值小于第二TH值且大于或等于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第三TH值且第一分量的值與第二分量的值的差值的絕對(duì)值大于差值閾值DTH的像素為目標(biāo)像素;

TH的值小于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第三TH值且小于第一TH值的像素為目標(biāo)像素;

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊。

其中,第一TH值、第二TH值、第三TH值依次降低。

針對(duì)此方法一的具體示例如下:

目標(biāo)幀圖像中的濃度分量V圖像數(shù)據(jù)的閾值為V_TH,第一分量V圖像數(shù)據(jù)和第二分量U圖像數(shù)據(jù)的差值閾值為DVU_TH。第一TH值為160、第二TH值為145、第三TH值為120。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

V_TH≥160時(shí),確定每個(gè)宏塊的各像素中V>145且V<160的像素為目標(biāo)像素;

V_TH≥145并且V_TH<160時(shí),確定每個(gè)宏塊的各像素中V>145且V<160且|V-U|>DVU_TH的像素為目標(biāo)像素;

V_TH≥120并且V_TH<145時(shí),確定每個(gè)宏塊的各像素中V>120且|V-U|>DVU_TH的像素為目標(biāo)像素;

V_TH<120時(shí),確定每個(gè)宏塊的各像素中V>120且V<160的像素為目標(biāo)像素。

實(shí)現(xiàn)方法二

本實(shí)現(xiàn)方法二中采用YUV空間進(jìn)行ROI的快速標(biāo)定。其中,第一分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的濃度分量V圖像數(shù)據(jù),第二分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的色度分量U圖像數(shù)據(jù)。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

閾值TH的值大于或等于第一TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第二TH值且小于第一TH值的像素為目標(biāo)像素;

閾值TH的值小于第一TH值且大于或等于第二TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第一閾值且小于第一TH值且第一分量的值與第二分量的值的差值的絕對(duì)值大于差值閾值DTH的像素為目標(biāo)像素;第一閾值小于第二TH值;

閾值TH的值小于第二TH值且大于或等于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于閾值TH且大于第二閾值且第一分量的值與第二分量的值的差值的絕對(duì)值大于差值閾值DTH的像素為目標(biāo)像素;

閾值TH的值小于所述第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于閾值TH且大于第三閾值且小于第一TH值的像素為目標(biāo)像素;

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊。

其中,第一TH值、第二TH值、第三TH值依次降低。第一閾值、第二閾值、第三閾值依次降低且均大于第二TH值且小于第二TH值。

針對(duì)此方法二的具體示例如下:

目標(biāo)幀圖像中的濃度分量V圖像數(shù)據(jù)的閾值為V_TH,第一分量V圖像數(shù)據(jù)和第二分量U圖像數(shù)據(jù)的差值閾值為DVU_TH。第一TH值為160、第二TH值為145、第三TH值為120、第一閾值為140、第二閾值為135、第三閾值為130。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

V_TH≥160時(shí),確定每個(gè)宏塊的各像素中V>145且V<160的像素為目標(biāo)像素;

V_TH≥145并且V_TH<160時(shí),確定每個(gè)宏塊的各像素中V>140且V<160且|V-U|>DVU_TH的像素為目標(biāo)像素;

V_TH≥120并且V_TH<145時(shí),確定每個(gè)宏塊的各像素中V>V_TH且V>135且|V-U|>DVU_TH的像素為目標(biāo)像素;

V_TH<120時(shí),確定每個(gè)宏塊的各像素中V>V_TH且V>130且V<160的像素為目標(biāo)像素。

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊。

實(shí)現(xiàn)方法三

本實(shí)現(xiàn)方法三中使用HSI空間進(jìn)行ROI的快速標(biāo)定。其中,第一分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的色調(diào)分量H,第二分量圖像數(shù)據(jù)是目標(biāo)幀圖像中的飽和度分量S。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

閾值TH的值大于或等于第一TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第一TH值且小于第一TH值的像素為目標(biāo)像素;

閾值TH的值小于第一TH值且大于或等于第二TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于第一閾值且小于第一TH值且第一分量的值與第二分量的值的差值的絕對(duì)值大于閾值DTH的像素為目標(biāo)像素;第一閾值小于第二TH值;

閾值TH的值小于第二TH值且大于或等于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于閾值TH值且大于第二閾值且第一分量的值與第二分量的值的差值的絕對(duì)值大于差值二值化閾值DTH的像素為目標(biāo)像素;

閾值TH的值小于第三TH值時(shí),確定每個(gè)宏塊的各像素中第一分量的值大于閾值TH值且大于第三閾值且小于第一TH值的像素為目標(biāo)像素;

其中,第一TH值、第二TH值、第三TH值依次降低;

第一閾值、第二閾值、第三閾值依次降低。

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊。

針對(duì)此實(shí)現(xiàn)方法三的具體示例如下:

目標(biāo)幀圖像中的色調(diào)分量H圖像數(shù)據(jù)的閾值為H_TH,第一分量H圖像數(shù)據(jù)和第二分量S圖像數(shù)據(jù)的π倍的差值的閾值為DHS_TH。第一TH值為1.2π、第二TH值為1.1π、第三TH值為π、第一閾值為1.05π,第二閾值為1.02π、第三閾值為1.01π。

針對(duì)每個(gè)目標(biāo)幀圖像執(zhí)行以下操作:

H_TH≥1.2*π時(shí),確定每個(gè)宏塊的各像素中H>1.1π且H<1.2π的像素為目標(biāo)像素;

H_TH≥1.1π并且H_TH<1.2π時(shí),確定每個(gè)宏塊的各像素中H>1.1π且H<1.2π且|H-S*π|>DHS_TH的像素為目標(biāo)像素;

H_TH≥π并且H_TH<1.1π時(shí),確定每個(gè)宏塊的各像素中H>H_TH且H>1.02π且|H-S*π|>DHS_TH的像素為目標(biāo)像素;

H_TH<π時(shí),確定每個(gè)宏塊的各像素中V>H_TH且V>1.01π且V<1.2π的像素為目標(biāo)像素。

確定各宏塊中目標(biāo)像素個(gè)數(shù)大于宏塊中像素個(gè)數(shù)的第一比例的宏塊為處于人臉或皮膚區(qū)域的宏塊。

此方法中,第一比例優(yōu)選但不限于1/10,宏塊為16X16宏塊時(shí)確定各宏塊中目標(biāo)像素個(gè)數(shù)大于16的宏塊為處于人臉或皮膚區(qū)域的宏塊。

本方法中基于膚色模型和最大類間方差法(OSTU)的在圖像中進(jìn)行人臉區(qū)域標(biāo)定的快速方法,與基于人臉各個(gè)部分膚色特征進(jìn)行分割的方法不同,它不需要考慮幾何形狀以及這些形狀之間的位置關(guān)系,而只是在簡(jiǎn)單的統(tǒng)計(jì)計(jì)算之后得到幾個(gè)閥值,然后通過(guò)檢查MB中的像素的UV值與這些閥值之間的關(guān)系,即可相當(dāng)準(zhǔn)確的標(biāo)定一個(gè)MB是否在人臉區(qū)域或暴露的皮膚區(qū)域內(nèi)。

本發(fā)明不局限于使用YUV空間的UV分量的方式和HIS空間的HS分量的方式,還可以是RGB空間中的分量,還可以是其它圖像格式或其它顏色空間中的分量,使用其它圖像格式或其它顏色空間的分量時(shí)相應(yīng)閾值需根據(jù)圖像格式或顏色空間進(jìn)行相應(yīng)的改變。

本發(fā)明還提供了對(duì)應(yīng)于圖1的視頻感興趣區(qū)域快速標(biāo)定方法的視頻感興趣區(qū)域快速裝置。圖2是實(shí)施例中視頻感興趣區(qū)域快速標(biāo)定裝置,參考圖2,視頻感興趣區(qū)域快速標(biāo)定裝置包括:

目標(biāo)幀圖像確定模塊201,用于確定視頻數(shù)據(jù)中的目標(biāo)幀圖像;

分量圖像數(shù)據(jù)確定模塊202,用于確定目標(biāo)幀圖像中第一分量圖像數(shù)據(jù)、第二分量圖像數(shù)據(jù);

閾值計(jì)算模塊203,用于計(jì)算第一分量圖像數(shù)據(jù)的閾值TH、第一分量圖像數(shù)據(jù)和X倍的第二分量圖像數(shù)據(jù)的差值閾值DTH;

感興趣區(qū)域確定模塊204,用于根據(jù)閾值TH、差值閾值DTH、目標(biāo)幀圖像中每個(gè)宏塊中像素的第一分量的值和第二分量的值確定處于人臉或皮膚區(qū)域的宏塊,將所述宏塊的集合作為目標(biāo)幀圖像的感興趣域區(qū)域。

上述各模塊的功能的具體實(shí)現(xiàn)方式與上述方法中描述的方式相同,此處不再重復(fù)描述。

本發(fā)明的方法簡(jiǎn)單快速且準(zhǔn)確有效,可以全部用軟件實(shí)現(xiàn),實(shí)施的時(shí)候很靈活,幾乎沒(méi)有成本,非常適合于在視頻圖像處理特別是互聯(lián)網(wǎng)視頻應(yīng)用中使用:一旦人臉區(qū)域被標(biāo)定,后續(xù)針對(duì)該區(qū)域的特殊處理就稱為可能。比如:在使用H.264編碼時(shí),可以提升人臉區(qū)域的質(zhì)量,同時(shí)適當(dāng)降低圖像的其他部分的質(zhì)量,總體保持編碼率不變,這樣,即使在網(wǎng)絡(luò)帶寬受限的情況下,壓縮碼流被解碼后,也能得到人臉清晰的圖像,而不是整個(gè)都模糊的圖像。

本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過(guò)程序來(lái)指令相關(guān)硬件完成,所述程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如只讀存儲(chǔ)器、磁盤或光盤等??蛇x地,上述實(shí)施例的全部或部分步驟也可以使用一個(gè)或多個(gè)集成電路來(lái)實(shí)現(xiàn),相應(yīng)地,上述實(shí)施例中的各模塊/單元可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。

上面描述的內(nèi)容可以單獨(dú)地或者以各種方式組合起來(lái)實(shí)施,而這些變型方式都在本發(fā)明的保護(hù)范圍之內(nèi)。

需要說(shuō)明的是,在本文中,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括……”限定的要素,并不排除在包括所述要素的物品或者設(shè)備中還存在另外的相同要素。

以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,僅僅參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明。本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的精神和范圍,均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1