本申請(qǐng)涉涉及一種對(duì)視頻圖像中的人頭進(jìn)行檢測的方法和裝置,能夠選擇具有適當(dāng)尺寸的檢測窗的hog檢測器來提高對(duì)圖片中的人頭進(jìn)行檢測和計(jì)數(shù)的精度。
背景技術(shù):
隨著社會(huì)的不斷進(jìn)步,視頻監(jiān)控系統(tǒng)的應(yīng)用范圍越來越廣。在超市、商場、體育館以及機(jī)場車站等場所的出入口常安裝有監(jiān)控?cái)z像機(jī),以便保安人員和管理者對(duì)這些場所的出入口進(jìn)行監(jiān)控。另一方面,超市、商場、體育館以及機(jī)場車站等場所進(jìn)出的人流量對(duì)于上述場所的經(jīng)營者或管理者來說有著重要的意義,其中,人流量是指按一定方向流動(dòng)的人數(shù),本文中特指按進(jìn)入/離開兩個(gè)方向流動(dòng)的人數(shù)。
現(xiàn)有的視頻監(jiān)控中,人流量統(tǒng)計(jì)主要是通過監(jiān)控人員人工清點(diǎn)來實(shí)現(xiàn)。這種人工統(tǒng)計(jì)人流量的方法在監(jiān)控時(shí)間短、人流量稀疏的情況下比較可靠,但由于人眼生物特性的限制,當(dāng)監(jiān)控時(shí)間較長,人流量密集時(shí),統(tǒng)計(jì)的準(zhǔn)確性將大大下降,而且人工統(tǒng)計(jì)的方式需要耗費(fèi)大量的人力成本。
基于視頻分析的人流量統(tǒng)計(jì)方法可以實(shí)現(xiàn)人流量的自動(dòng)統(tǒng)計(jì),解決人工統(tǒng)計(jì)帶來的各種問題。目前,基于視頻分析的流量統(tǒng)計(jì)方法主要有三類:
一是基于特征點(diǎn)跟蹤的方法,該方法首先跟蹤一些運(yùn)動(dòng)的特征點(diǎn),然后對(duì)特征點(diǎn)的軌跡進(jìn)行聚類分析,從 而得到人流量信息;基于特征點(diǎn)跟蹤的方法需要跟蹤一些運(yùn)動(dòng)的特征點(diǎn),然后對(duì)特征點(diǎn)的軌跡進(jìn)行聚類分析,從而得到人流量信息,該方法的缺點(diǎn)是特征點(diǎn)本身難以穩(wěn)定地跟蹤,計(jì)數(shù)精度較差。
二是基于人體分割和跟蹤的方法,該方法首先需要提取出運(yùn)動(dòng)目標(biāo)塊,然后對(duì)運(yùn)動(dòng)目標(biāo)塊進(jìn)行分割得到單個(gè)人體目標(biāo),最后跟蹤各個(gè)人體目標(biāo)實(shí)現(xiàn)人流量的統(tǒng)計(jì);基于人體分割和跟蹤的方法首先需要提取處運(yùn)動(dòng)目標(biāo)塊,然后對(duì)運(yùn)動(dòng)目標(biāo)塊進(jìn)行分割得到單個(gè)人體目標(biāo),最后跟蹤得到各個(gè)人體的軌跡,從而實(shí)現(xiàn)人流量的統(tǒng)計(jì)。該方法的缺點(diǎn)是當(dāng)人體存在遮擋時(shí),人體分割的準(zhǔn)確性難以得到保證,影響統(tǒng)計(jì)精度。
三是基于人頭或頭肩檢測和跟蹤的方法,該方法在視頻中檢測人頭或頭肩,通過對(duì)人頭或頭肩的跟蹤進(jìn)行人流量的統(tǒng)計(jì)?;谌祟^數(shù)檢測和跟蹤的方法是在視頻中檢測人頭,通過對(duì)人頭的跟蹤進(jìn)行人流量的統(tǒng)計(jì),當(dāng)攝像機(jī)角度適當(dāng)時(shí),人頭出現(xiàn)遮擋的情況較少,因此基于人頭數(shù)檢測的方法較前兩種方法準(zhǔn)確性有所提高。
在對(duì)人頭進(jìn)行檢測的現(xiàn)有技術(shù)中,提出了一種采用圖像的梯度方向直方圖(hog)特征進(jìn)行人頭檢測的方法,利用hog特征進(jìn)行人頭檢測具有極強(qiáng)的魯棒性。hog主要是對(duì)局部區(qū)域的梯度方向進(jìn)行計(jì)算,然后用直方圖來描述,即,其是一種圖像局部重疊區(qū)域的特征描述符。相較于其它特征描述,如顏色特征、類haar小波特征等,hog有其獨(dú)特的優(yōu)勢。首先,hog特征描述在較小的空間域上能有效克服圖像的光學(xué)形變和幾何形變,因?yàn)閔og是對(duì)圖像局部區(qū)域單元的直方圖統(tǒng)計(jì)。其次,在區(qū)域重疊計(jì)算及局部區(qū)域的歸一化等條件下,即使相似圖像在形狀也會(huì)發(fā)生細(xì)微的變化,這些細(xì)微的差別并不會(huì)嚴(yán)重影響檢測效果。
在例如對(duì)公交車乘客的人頭進(jìn)行檢測時(shí),可以預(yù)先從捕獲的公交車客流視頻圖像數(shù)據(jù)中人工采集多種不同尺寸的只包括乘客人頭信息的圖像作為正樣本,采集對(duì)應(yīng)尺寸的不包括人頭信息的圖像作為負(fù)樣本,由正樣本和負(fù)樣本構(gòu)成訓(xùn)練樣本集,利用該訓(xùn)練樣本集進(jìn)行分類模型離線訓(xùn)練,可以得到用于檢測人頭的hog檢測器。利用該hog檢測器可以對(duì)圖像中的公交車乘客的人頭進(jìn)行檢測。最后,使用surf可以對(duì)檢測到的人頭進(jìn)行計(jì)數(shù)。這里,surf是計(jì)算機(jī)視覺領(lǐng)域用于目標(biāo)跟蹤的一種特征提取方式,相比其他的特征提取方式,surf有區(qū)分度高、運(yùn)算速度快的優(yōu)點(diǎn),有旋轉(zhuǎn)和尺度不變性的特點(diǎn)。
在這樣的人頭檢測方法中,利用不同尺寸的人頭圖像的正樣本和對(duì)應(yīng)尺寸的負(fù)樣本來進(jìn)行分類模型離線訓(xùn)練,可以得到具有不同尺寸的檢測窗的hog檢測器。在檢測具有較少人數(shù)的圖片時(shí),如果使用具有較大尺寸的檢測窗的hog檢測器,由于具有較大尺寸的檢測窗的hog檢測器包含較多的信息,因此可以較為精確地檢測到人頭。但是,對(duì)于人數(shù)較多的圖片,由于人頭由于會(huì)挨得較近而發(fā)生沖突,因此使用具有較大尺寸的檢測窗的hog檢測器會(huì)發(fā)生誤檢測,因此需要使用具有較小尺寸的檢測窗的hog檢測器來對(duì)人頭進(jìn)行檢測來防止上述誤檢測的發(fā)生。另一方面,如果對(duì)于人數(shù)較少的圖片采用具有較小尺寸的檢測窗的hog檢測器來對(duì)人頭進(jìn)行檢測,則由于該hog檢測器所包含的信息極小,因此相對(duì)于使用具有較大尺寸的檢測窗的hog檢測器,檢測精度會(huì)相當(dāng)?shù)?。因此,需要提出一種能夠選擇具有適當(dāng)尺寸的檢測窗的hog檢測器來提高對(duì)圖片中的人頭進(jìn)行檢測和計(jì)數(shù)的精度。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)的上述缺陷提出了本發(fā)明。因此,本發(fā)明的目的之一是提供一種對(duì)視頻圖像中的人頭進(jìn)行檢測的方法和人頭數(shù)檢測裝置,能夠選擇具有適當(dāng)尺寸的檢測窗的hog檢測器來提高對(duì)圖片中的人頭進(jìn)行檢測和計(jì)數(shù)的精度。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明,提出了一種對(duì)視頻圖像中的人頭進(jìn)行檢測的方法,包括:選擇不同尺寸的人頭圖像的正樣本和對(duì)應(yīng)尺寸的負(fù)樣本,通過進(jìn)行分類模型離線訓(xùn)練,得到多個(gè)具有不同尺寸的檢測框的人頭檢測器;從視頻圖像中提取待檢測圖像;從多個(gè)所述人頭檢測器中選擇用于對(duì)待檢測圖像進(jìn)行人頭檢測的人頭檢測器;以及利用所選擇的人頭檢測器對(duì)待檢測圖像進(jìn)行人頭檢測,并對(duì)所檢測到的人頭的數(shù)量進(jìn)行計(jì)數(shù)。
優(yōu)選地,根據(jù)利用粗檢測而計(jì)數(shù)出的人頭的數(shù)量占所述待檢測圖像的最多可檢測人數(shù)的比例,從多個(gè)具有不同尺寸的檢測框的所述人頭檢測器中選擇具有特定尺寸的檢測框的人頭檢測器。
優(yōu)選地,所述粗檢測是利用從多個(gè)所述人頭檢測器中任意選擇的一個(gè)人頭檢測器來進(jìn)行的。
優(yōu)選地,根據(jù)待檢測圖像相當(dāng)于前一幀圖像發(fā)生變化的像素個(gè)數(shù)占待檢測圖像的所有像素?cái)?shù)的比例,從多個(gè)具有不同尺寸的檢測框的所述人頭檢測器中選擇具有特定尺寸的檢測框的人頭檢測器。
另外,還提出了一種對(duì)視頻圖像中的人頭進(jìn)行檢測的裝置,包括:選擇不同尺寸的人頭圖像的正樣本和對(duì)應(yīng)尺寸的負(fù)樣本,通過進(jìn)行分類模型離線訓(xùn)練,得到多個(gè)具有不同尺寸的檢測框的人頭檢測器的單元;從視頻圖像中提取待檢測圖像的單元;從多個(gè)所述人頭檢測器中選擇用于對(duì)待檢測圖像進(jìn)行人頭檢測的人頭檢測器的單元;以及利用所選擇的人頭檢測器對(duì)待檢測圖像進(jìn) 行人頭檢測,并對(duì)所檢測到的人頭的數(shù)量進(jìn)行計(jì)數(shù)的單元。
根據(jù)本發(fā)明的方法和裝置,能夠選擇具有適當(dāng)尺寸的檢測窗的hog檢測器來提高對(duì)圖片中的人頭進(jìn)行檢測和計(jì)數(shù)的精度。
附圖說明
圖1是示出了根據(jù)本發(fā)明的對(duì)hog檢測器進(jìn)行訓(xùn)練和生成的示意圖。
圖2是示出了對(duì)具有不同人數(shù)的圖片進(jìn)行檢測時(shí)采用具有適當(dāng)尺寸的檢測窗的hog檢測器的示意圖。
圖3是示出了根據(jù)本發(fā)明的對(duì)視頻圖像中的人頭進(jìn)行檢測的方法的流程圖。
具體實(shí)施方式
下面將參考附圖描述本發(fā)明的優(yōu)選實(shí)施例。在附圖中,相同的元件將由相同的參考符號(hào)或數(shù)字表示。此外,在本發(fā)明的下列描述中,將省略對(duì)已知功能和配置的具體描述,以避免使本發(fā)明的主題不清楚。
圖1是示出了根據(jù)本發(fā)明的對(duì)hog檢測器進(jìn)行訓(xùn)練和生成的示意圖。
如圖1所示,將從捕獲的視頻圖像數(shù)據(jù)中人工采集多種不同尺寸的只包括人頭信息的圖像作為正樣本,采集對(duì)應(yīng)尺寸的不包括人頭信息的圖像作為負(fù)樣本,由正樣本和負(fù)樣本構(gòu)成訓(xùn)練樣本集,利用該訓(xùn)練樣本集進(jìn)行分類模型離線訓(xùn)練,可以得到用于檢測人頭的hog檢測器。利用該hog檢測器可以對(duì)圖像中存在的人員的人頭進(jìn)行檢測。當(dāng)然,本發(fā)明并不局限于hog檢測器,而可以是通過離線訓(xùn)練得到的能夠?qū)θ祟^進(jìn)行檢測的任何類型的檢測器。
圖2是示出了對(duì)具有不同人數(shù)的圖片進(jìn)行檢測時(shí)采用具有適當(dāng)尺寸的檢測窗的hog檢測器的示意圖。
如前面所描述過的,在通常的人頭檢測方法中,利用不同尺寸的人頭圖像的正樣本和對(duì)應(yīng)尺寸的負(fù)樣本來進(jìn)行分類模型離線訓(xùn)練,可以得到具有不同尺寸的檢測窗的hog檢測器。在檢測具有較少人數(shù)的圖片時(shí),如果使用具有較大尺寸的檢測窗的hog檢測器,由于具有較大尺寸的檢測窗的hog檢測器包含較多的信息,因此可以較為精確地檢測到人頭。但是,對(duì)于人數(shù)較多的圖片,由于人頭由于會(huì)挨得較近而發(fā)生沖突,因此使用具有較大尺寸的檢測窗的hog檢測器會(huì)發(fā)生誤檢測,因此需要使用具有較小尺寸的檢測窗的hog檢測器來對(duì)人頭進(jìn)行檢測來防止上述誤檢測的發(fā)生。另一方面,如果對(duì)于人數(shù)較少的圖片采用具有較小尺寸的檢測窗的hog檢測器來對(duì)人頭進(jìn)行檢測,則由于該hog檢測器所包含的信息極小,因此相對(duì)于使用具有較大尺寸的檢測窗的hog檢測器,檢測精度會(huì)相當(dāng)?shù)汀?/p>
如圖2所示,作為示例,對(duì)人數(shù)較少的圖片a,采用具有較大尺寸的檢測窗的人頭檢測器進(jìn)行檢測時(shí)精度會(huì)較好;對(duì)人數(shù)中等的圖片a,采用具有中等尺寸的檢測窗的人頭檢測器進(jìn)行檢測時(shí)精度會(huì)較好;而對(duì)人數(shù)較多的圖片a,采用具有較小尺寸的檢測窗的人頭檢測器進(jìn)行檢測時(shí)精度會(huì)較好。
圖3是示出了根據(jù)本發(fā)明的對(duì)視頻圖像中的人頭進(jìn)行檢測的方法的流程圖。
在步驟301,利用不同尺寸的人頭圖像的正樣本和對(duì)應(yīng)尺寸的負(fù)樣本來進(jìn)行hog離線訓(xùn)練,得到具有不同尺寸的檢測窗的hog檢測器。
這里,為了簡化說明,假定得到了具有m種(m為大于1的自然數(shù))不同尺寸的檢測窗的hog檢測器。每種尺 寸的檢測窗的寬度w相同,而高度不同,分別設(shè)為h1、h2、hi、hm。另外,可以假定h1>h2>…>hm且hi-hi+1=定值。也就是,對(duì)檢測窗的尺寸從大到小進(jìn)行了排序。
然后,在步驟303,從攝像頭拍攝的視頻圖像捕獲待檢測圖像。
在步驟305,從上述具有不同尺寸的檢測框的hog檢測器選擇用于對(duì)待檢測圖像進(jìn)行人頭檢測的適當(dāng)?shù)膆og檢測器,適當(dāng)?shù)膆og檢測器的具體選擇方法將在后面描述。
最后,在步驟307,利用所選擇的hog檢測器對(duì)待檢測圖像中的人頭進(jìn)行檢測,并對(duì)所檢測到的人頭的數(shù)量進(jìn)行計(jì)數(shù)。
下面將描述在步驟305中對(duì)hog檢測器進(jìn)行選擇的兩個(gè)示例。
示例1
選擇諸如檢測框高度hmin的hog檢測器dmin,對(duì)待檢測圖像中的人頭進(jìn)行粗檢測,并對(duì)粗檢測到的人頭數(shù)進(jìn)行計(jì)數(shù),假定經(jīng)過粗檢測并計(jì)數(shù)后的人頭數(shù)為n。這里,hmin是h1、h2、hi、hm中的最小高度,根據(jù)上述假定,hmin即為hm。但是,需要指出的是,本發(fā)明不限于利用檢測框高度hmin的hog檢測器dmin來進(jìn)行粗檢測,而是可以采用具有任意檢測框高度hi的hog檢測器di來進(jìn)行粗檢測,這可以由操作員來指定。
接下來,根據(jù)粗檢測得到的人數(shù)n的大小選擇用于對(duì)待檢測圖像進(jìn)行人頭檢測的hog檢測器的具體過程如下:
■根據(jù)hog檢測器dmin所對(duì)應(yīng)的樣本大小w*hmin,計(jì)算待檢測圖像a中最多可檢測的人員個(gè)數(shù)n:
n=[wa*ha/w*hmin]
其中,wa表示待檢測圖像a的高度,ha表示待檢測圖 像a的寬度,[]表示取整函數(shù),hmin表示最小的檢測框高度。
■然后,按照以下公式計(jì)算人數(shù)步長:
nstep=n/m;
■接下來,按照以下公式來選擇編號(hào)為j的hog檢測器,即,選擇hog檢測器dj。
j=[n/nstep],
其中,[]表示取整函數(shù)。
在示例1中,根據(jù)利用粗檢測而檢測并計(jì)數(shù)出的人頭的數(shù)量占待檢測圖像的最多可檢測人數(shù)的比例來從按照檢測窗尺寸從大到小的方式排序后的檢測器中選擇相應(yīng)的適當(dāng)排位處的檢測器來進(jìn)行精確的人頭檢測和計(jì)數(shù)。
示例2
計(jì)算出待檢測圖像a相對(duì)于前一幀圖像發(fā)生變化的像素個(gè)數(shù)n;
然后,根據(jù)n的大小選擇用于對(duì)待檢測圖像進(jìn)行人頭檢測的hog檢測器的具體過程如下:
■計(jì)算待檢測圖像a中的所有像素?cái)?shù):
n’=wa*ha
按照以下公式計(jì)算像素步長:
nstep’=n’/m;
然后,按照以下公式來選擇編號(hào)為j的hog檢測器,即,選擇hog檢測器dj。
j=[n/nstep],
其中,[]表示取整函數(shù)。
在示例2中,根據(jù)利用待檢測圖像相對(duì)于前一幀圖像發(fā)生變化的像素個(gè)數(shù)占待檢測圖像的所有像素?cái)?shù)的比例來從按照檢測窗尺寸從大到小的方式排序后的檢測 器中選擇相應(yīng)的適當(dāng)排位處的檢測器來進(jìn)行精確的人頭檢測和計(jì)數(shù)。
以上列舉了若干具體實(shí)施例來詳細(xì)闡明本發(fā)明,這些個(gè)例僅用于說明本發(fā)明的原理及其實(shí)施方法,而非對(duì)本發(fā)明的限制,在不脫離本發(fā)明的精神和范圍的情況下,本領(lǐng)域的技術(shù)人員還可以做出各種變形和改進(jìn)。因此,本發(fā)明不應(yīng)由上述實(shí)施例來限定,而應(yīng)由所附權(quán)利要求及其等價(jià)物來限定。