一種視頻中人臉檢測區(qū)域的定位方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻中人臉檢測區(qū)域的定位方法及裝置,能夠從整幀視頻圖像中有效過濾掉不包含人臉的區(qū)域,使人臉的檢測范圍大大縮小,從而有效提升視頻中人臉檢測的準確性和效率。視頻中人臉檢測區(qū)域的定位方法,包括:從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像;針對每次提取的三幀連續(xù)的視頻圖像,執(zhí)行如下操作:根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,所述歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡;對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
【專利說明】—種視頻中人臉檢測區(qū)域的定位方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識別和計算機視覺領(lǐng)域,尤其涉及一種視頻中人臉檢測區(qū)域的定位方法及裝置。
【背景技術(shù)】
[0002]人臉檢測是指從指定圖像中標定出所有人臉的位置和尺寸。作為智能信息處理中的一項關(guān)鍵技術(shù),人臉檢測近年來已成為模式識別和計算機視覺領(lǐng)域內(nèi)一項受到普遍重視、研究十分活躍的課題。
[0003]人臉檢測是人臉識別系統(tǒng)中的一個重要環(huán)節(jié),也可以獨立應(yīng)用于視頻監(jiān)控。隨著視頻監(jiān)控系統(tǒng)的普及化及龐大化,在視頻監(jiān)控中對人臉檢測就成為了當前研究的一個熱點問題。視頻中人臉檢測由于需要考慮人臉檢測的實時性問題,因此視頻中人臉檢測的準確性和效率顯得尤為重要。
[0004]傳統(tǒng)的人臉檢測方法需要全局掃描整幀視頻圖像,效率低,不能達到實時性的要求?,F(xiàn)有技術(shù)中,提供了兩種人臉檢測效率改進方法:基于膚色特征的區(qū)域提取方法和基于幀差法的運動區(qū)域提取方法。其中:
[0005]基于膚色特征的區(qū)域提取方法,通過將一幀視頻圖像中所有近膚色的區(qū)域提取出來實現(xiàn)人臉檢測。該方法適應(yīng)性差,受光線、人種、背景等的影響較大,導(dǎo)致人臉檢測的準確性較低。
[0006]基于幀差法的運動區(qū)域提取方法,通過計算兩幀視頻圖像之間的像素差值提取出運動區(qū)域從而實現(xiàn)人臉檢測。該方法不能有效提取出完整的區(qū)域,使人臉檢測的漏檢率和誤檢率大大提聞。
[0007]因此,如何有效提升視頻中人臉檢測的準確性和效率成為現(xiàn)有技術(shù)中亟待解決的技術(shù)問題之一。
【發(fā)明內(nèi)容】
[0008]本發(fā)明實施例提供一種視頻中人臉檢測區(qū)域的定位方法及裝置,能夠從整幀視頻圖像中有效過濾掉不包含人臉的區(qū)域,使人臉的檢測范圍大大縮小,從而有效提升視頻中人臉檢測的準確性和效率。
[0009]本發(fā)明實施例提供的視頻中人臉檢測區(qū)域的定位方法,包括:
[0010]從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像;
[0011]針對每次提取的三幀連續(xù)的視頻圖像,執(zhí)行如下操作:
[0012]根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,所述歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡;
[0013]對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
[0014]本發(fā)明實施例提供的一種視頻中人臉檢測區(qū)域的定位裝置,包括:[0015]提取模塊,用于從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像;
[0016]構(gòu)建模塊,用于針對每次提取的三幀連續(xù)的視頻圖像,根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,所述歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡;
[0017]定位模塊,用于對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
[0018]本發(fā)明實施例提供的視頻中人臉檢測區(qū)域的定位方法及裝置,從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像,每次執(zhí)行如下操作:首先構(gòu)建當前幀歷史運動圖像,對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。能夠?qū)κ芄庹沼绊懙膮^(qū)域進行有效去除,使人臉檢測區(qū)域范圍大幅度縮減,消除了背景干擾,大大降低了人臉誤檢率,并且有效解決因為運動幅度太小和包含人臉的區(qū)域突然靜止導(dǎo)致的當前幀視頻圖像中前景檢測丟失的問題,基于本發(fā)明實施例提供的視頻中人臉檢測區(qū)域的定位方法及裝置,使得人臉檢測的準確性和效率有了很大的提升。
[0019]本申請的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本申請而了解。本申請的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
【專利附圖】
【附圖說明】
[0020]附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0021]圖1為本發(fā)明實施例中視頻中人臉檢測區(qū)域的定位方法流程圖;
[0022]圖2為本發(fā)明實施例中針對任意一次提取的三幀連續(xù)的視頻圖像執(zhí)行人臉檢測區(qū)域定位的方法流程圖;
[0023]圖3為本發(fā)明實施例中人臉檢測區(qū)域的定位裝置框圖;
[0024]圖4為本發(fā)明實施例中構(gòu)建模塊的一種可能的結(jié)構(gòu)框圖。
[0025]圖5為本發(fā)明實施例中定位模塊的一種可能的結(jié)構(gòu)框圖。
【具體實施方式】
[0026]本發(fā)明實施例提供一種視頻中人臉檢測區(qū)域的定位方法及裝置,能夠從整幀視頻圖像中有效過濾掉不包含人臉的區(qū)域,使人臉的檢測范圍大大縮小,從而有效提升視頻中人臉檢測的準確性和效率。以下結(jié)合說明書附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。并且在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
[0027]本發(fā)明實施例提供的視頻中人臉檢測區(qū)域的定位方法,如圖1所示,包括如下步驟:
[0028]SlOU從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像。
[0029]舉例進行說明,從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像是指第一次從視頻圖像序列中提取第一幀、第二幀、第三幀視頻圖像,第二次從視頻圖像序列中提取第二幀、第三幀、第四幀視頻圖像,第三次從視頻圖像序列中提取第三幀、第四幀、第五幀視頻圖像,以此類推,直至視頻圖像序列中所有幀視頻圖像全部提取完成。
[0030]具體實施中,為了提高存取效率,可以預(yù)先為buffer (緩沖器)分配大于三幀視頻圖像的存儲空間,例如五幀視頻圖像的存儲空間,從而對輸入數(shù)據(jù)進行buffer輪轉(zhuǎn),使得數(shù)據(jù)的讀取和寫入可以并行處理,提升數(shù)據(jù)處理效率,具體包括如下步驟:
[0031]根據(jù)為buffer分配的大于三幀視頻圖像的存儲空間,從視頻圖像序列中提取相應(yīng)中貞數(shù)的連續(xù)的視頻圖像寫入到buffer中;
[0032]每次從buffer中讀取前三幀連續(xù)的視頻圖像;以及
[0033]從buffer中讀取前三幀連續(xù)的視頻圖像后,將buffer中第一幀視頻圖像移除,并從視頻圖像序列中提取下一幀視頻圖像寫入到buffer中。
[0034]S102、針對每次提取的三幀連續(xù)的視頻圖像,通過執(zhí)行如下操作定位出當前幀人臉檢測區(qū)域:
[0035]步驟a、根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像(MotionHistory Image),構(gòu)建當前幀歷史運動圖像,其中,歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡。
[0036]步驟b、對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
[0037]下面以針對任意一次提取的三幀連續(xù)的視頻圖像執(zhí)行操作的具體流程為例進行詳細說明。如圖2所示,包括如下步驟:
[0038]S201、從視頻圖像序列中提取三幀連續(xù)的視頻圖像。
[0039]具體實施中,假設(shè)當前提取的三幀連續(xù)的視頻圖像分別為:t_l時刻、t時刻、t+1時刻的三幀視頻圖像。
[0040]S202、對當前提取的三幀視頻圖像中,每相鄰兩幀視頻圖像分別進行差分運算,并對得到的兩個差分圖像進行邏輯與運算,得到當前幀運動目標輪廓圖像。
[0041]具體實施中,運算方法如公式[I]所示:
[0042]St (x, y) = I Ft (x, y) -Ft^1 (x, y) Π Ft+1 (χ, y) -Ft (χ, y) [I]
[0043]其中,(x,y)表示視頻圖像中像素點的坐標位置,St (x, y)表示當前幀運動目標輪廓圖像,F(xiàn)t (χ, y)表示t時刻的一幀視頻圖像,F(xiàn)t^1 (x, y)表示t_l時刻的一幀視頻圖像,F(xiàn)t+1 (x, y)表示t+1時刻的一幀視頻圖像, ?表示邏輯與運算符。
[0044]S203、對當前幀運動目標輪廓圖像進行二值化處理,得到當前幀二值化圖像,其中,二值化圖像中非零像素點為運動區(qū)域的像素點。
[0045]具體實施中,運算方法如公式[2]所示:
【權(quán)利要求】
1.一種視頻中人臉檢測區(qū)域的定位方法,其特征在于,包括: 從視頻圖像序列中依次提取二幀連續(xù)的視頻圖像; 針對每次提取的三幀連續(xù)的視頻圖像,執(zhí)行如下操作: 根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,所述歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡; 對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,具體包括: 對當前提取的三幀視頻圖像中,每相鄰兩幀視頻圖像分別進行差分運算,并對得到的兩個差分圖像進行邏輯與運算,得到當前幀運動目標輪廓圖像; 對當前幀運動目標輪廓圖像進行二值化處理,得到當前幀二值化圖像,所述二值化圖像中非零像素點為運動區(qū)域的像素點; 對當前幀二值化圖像進行遍歷,并基于上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像。
3.如權(quán)利要求2所 述的方法,其特征在于,所述對當前幀二值化圖像進行遍歷,并基于上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,具體包括: 將當前幀二值化圖像中的非零像素點的像素值設(shè)置為當前系統(tǒng)時間; 針對當前幀二值化圖像中的零像素點: 如果上一幀歷史運動圖像中同一坐標位置上像素點的像素值小于當前系統(tǒng)時間與設(shè)定的歷史持續(xù)時長之差,則將像素值設(shè)置為O,所述歷史持續(xù)時長根據(jù)視頻的幀率確定; 如果上一幀歷史運動圖像中同一坐標位置上像素點的像素值大于等于當前系統(tǒng)時間與設(shè)定的歷史持續(xù)時長之差,則將像素值設(shè)置為上一幀歷史運動圖像中同一坐標位置上像素點的像素值。
4.如權(quán)利要求2所述的方法,其特征在于,所述對當前幀運動目標輪廓圖像進行二值化處理,得到當前幀二值化圖像,具體通過如下公式實現(xiàn):
5.如權(quán)利要求1所述的方法,其特征在于,所述對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,具體通過如下公式實現(xiàn):
6.如權(quán)利要求1或5所述的方法,其特征在于,所述將不符合人臉特征的連通區(qū)域去除,具體包括:將不超過預(yù)設(shè)的人臉閾值的連通區(qū)域、以及嵌套區(qū)域所占比值超過預(yù)設(shè)的百分比閾值的連通區(qū)域去除。
7.如權(quán)利要求1所述的方法,其特征在于,所述從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像,具體包括: 根據(jù)為緩沖器buffer分配的大于三幀視頻圖像的存儲空間,從視頻圖像序列中提取相應(yīng)幀數(shù)的連續(xù)的視頻圖像寫入到buffer中; 每次從所述buffer中讀取前三幀連續(xù)的視頻圖像;以及 從所述buffer中讀取前三幀連續(xù)的視頻圖像后,將所述buffer中第一幀視頻圖像移除,并從視頻圖像序列中提取下一幀視頻圖像寫入到buffer中。
8.一種視頻中人臉檢測區(qū)域的定位裝置,其特征在于,包括: 提取模塊,用于從視頻圖像序列中依次提取三幀連續(xù)的視頻圖像; 構(gòu)建模塊,用于針對每次提取的三幀連續(xù)的視頻圖像,根據(jù)當前提取的三幀視頻圖像、以及上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像,所述歷史運動圖像是指在一段時間內(nèi)運動目標連續(xù)運動的軌跡; 定位模塊,用于對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,并將不符合人臉特征的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
9.如權(quán)利要求8所述的 裝置,其特征在于,所述構(gòu)建模塊,具體包括: 差分運算子模塊,用于對當前提取的三幀視頻圖像中,每相鄰兩幀視頻圖像分別進行差分運算,得到兩個差分圖像; 邏輯與運算子模塊,用于對差分運算子模塊得到的兩個差分圖像進行邏輯與運算,得到當前幀運動目標輪廓圖像; 二值化子模塊,用于對當前幀運動目標輪廓圖像進行二值化處理,得到當前幀二值化圖像,所述二值化圖像中非零像素點為運動區(qū)域的像素點; 構(gòu)建子模塊,用于對當前幀二值化圖像進行遍歷,并基于上一幀歷史運動圖像,構(gòu)建當前幀歷史運動圖像。
10.如權(quán)利要求8所述的裝置,其特征在于,所述定位模塊,具體包括: 漫水填充子模塊,用于所述對當前幀歷史運動圖像進行運動分割以及區(qū)域連通,得到當前幀連通區(qū)域序列,具體通過如下公式實現(xiàn):? Co, M,(x1, v') - Lo _ Threshold < M1 (.v, v) < M1 (V, v') + Up _ Threshold= k莫他—.......,其中,Cnt(x, y)表示當前幀連通區(qū)域序列,U' ,y')表示坐標位置為(x,y)的像素點的鄰域點的坐標位置,Mt (X,y)表示當前幀歷史運動圖像,Co表示預(yù)設(shè)的填充顏色值,Lo_Threshold表示預(yù)設(shè)的漫水填充下限值,Up_Threshold表示預(yù)設(shè)的漫水填充上限值; 定位子模塊,用于從漫水填充子模塊得到的當前幀連通區(qū)域序列中,將不超過預(yù)設(shè)的人臉閾值的連通區(qū)域、以及嵌套區(qū)域所占比值超過預(yù)設(shè)的百分比閾值的連通區(qū)域去除,定位出當前幀人臉檢測區(qū)域。
【文檔編號】G06K9/00GK103793703SQ201410076946
【公開日】2014年5月14日 申請日期:2014年3月5日 優(yōu)先權(quán)日:2014年3月5日
【發(fā)明者】于曉靜 申請人:北京君正集成電路股份有限公司