本發(fā)明涉及一種基于gmm背景差分與聯(lián)合特征的行人檢測方法,屬于視頻監(jiān)控與識別技術(shù)領(lǐng)域。
背景技術(shù):
行人作為交通及日常視頻場景中出現(xiàn)最多的對象之一,對于視頻自動識別技術(shù)的研究至關(guān)重要,所以近年來行人檢測技術(shù)成為研究熱點(diǎn),在智能交通和智能安防等領(lǐng)域發(fā)展迅速。但是經(jīng)過近十幾年的發(fā)展行人檢測技術(shù)雖然取得了一定的成績,但是目前還沒有一種行人檢測系統(tǒng)能夠在任何環(huán)境和背景之下通用。
近年來基于機(jī)器學(xué)習(xí)與特征設(shè)計(jì)的行人檢測方法已經(jīng)成為行人檢測領(lǐng)域的主流研究方向,設(shè)計(jì)的特征包括角點(diǎn)特征(haar),lbp(局部二值模式),edgelet(邊緣特征),梯度方向直方圖(hog)等,而機(jī)器學(xué)習(xí)算法則主要采用支持向量機(jī)(svm)和級聯(lián)分類器(adaboost),現(xiàn)有的行人檢測技術(shù)有著檢測速度慢,檢出率不高,誤檢率較高等問題。
當(dāng)前視頻序列中運(yùn)動物體的檢測主要有幀差法和背景差法,而gmm背景差方法正是應(yīng)用混合高斯模型方法為圖像中的每個像素建立高斯背景模型展會,使用視頻序列中出現(xiàn)概率較大點(diǎn)組成背景圖像,具有背景清晰,運(yùn)算速度能滿足實(shí)時性等優(yōu)點(diǎn)。
梯度方向直方圖(histogramoforientedgradient,hog)是一種在計(jì)算機(jī)視覺和圖像處理領(lǐng)域中用來進(jìn)行物體檢測的特征描述子,他通過計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度直方圖來構(gòu)成特征。hog描述子最早由法國科學(xué)家dalal提出,但是hog描述子結(jié)合svm機(jī)器學(xué)習(xí)算法訓(xùn)練的分類器對于圖片的正確檢出率不高,且在檢測時檢測效率較低,不能滿足視頻中實(shí)時性的要求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種基于gmm背景差分與聯(lián)合特征的行人檢測方法,該方法針對傳統(tǒng)的機(jī)器學(xué)習(xí)+特征描述子訓(xùn)練的分類器對于視頻序列檢測速度較慢的問題,檢測正確率低,提出了一種結(jié)合視頻圖像物體運(yùn)動信息的行人檢測方法,先使用混合高斯模型對視頻圖像的背景建模,得到背景圖像之后與視頻當(dāng)前幀做差分運(yùn)算,得出運(yùn)動前景物體的位置,確定圖像的待檢測區(qū)域,再使用聯(lián)合特征訓(xùn)練的分類器對待檢測區(qū)域進(jìn)行檢測,最后得到行人的框圖。
所述方法的具體步驟如下:
step1、采集視頻序列圖像;
step2、對步驟step1中采集的序列圖像應(yīng)用混合高斯模型方法進(jìn)行背景建模,得到背景圖像;
step3、將當(dāng)前幀圖像與背景幀圖像做差分運(yùn)算,得出差異圖像區(qū)域,并對該差異區(qū)域做腐蝕,膨脹,最大化操作,對聯(lián)通的區(qū)域進(jìn)行最大化矩形區(qū)域得出一個矩形區(qū)域,將矩形區(qū)域的位置映射至當(dāng)前幀圖像,映射后當(dāng)前幀的位置也就是行人待檢測窗口;
step4、使用基于hog與lbp聯(lián)合特征并采用支持向量機(jī)svm方法訓(xùn)練的行人檢測分類器以步驟step3中得出的窗口位置為roi,在當(dāng)前幀圖像上進(jìn)行檢測;
step5、對當(dāng)前幀中的行人待檢測窗口進(jìn)行多尺度檢測,檢出行人圖像,并使用矩形框標(biāo)出。
所述步驟step2的背景圖像提取的方法使用的是基于混合高斯模型的背景差分算法。
所述步驟step3中對差異圖像區(qū)域進(jìn)行腐蝕膨脹操作后,在最大化操作中設(shè)定補(bǔ)償值,將腐蝕后的區(qū)域進(jìn)行聯(lián)通,對接近的差異圖像區(qū)域連通,即將滿足補(bǔ)償值的相鄰差異圖像區(qū)域進(jìn)行聯(lián)通。
所述的步驟step3中,相鄰區(qū)域的連通條件為,左右,上下相鄰像素的距離均小于補(bǔ)償值0.03(x+y),其中x為視頻圖像的像素寬度,y為視頻圖像的像素長度。
所述步驟step4中,svm方法訓(xùn)練出來的模型的檢測原理為目標(biāo)圖像的roi,即感興趣區(qū)域。
所述的步驟step5中,對圖像的檢測結(jié)果最終在原圖像中呈現(xiàn)。
本發(fā)明的有益效果是:
1、相對于先前的單獨(dú)使用模型對靜態(tài)圖片進(jìn)行檢測,本方法通過使用運(yùn)動信息對行人大致位置進(jìn)行判定,縮小窗口掃描的區(qū)域,大大減小檢測時間,提高行人檢測系統(tǒng)的效率;
2、相對于先前單獨(dú)使用混合高斯方法檢測運(yùn)動目標(biāo),本方法直接判別出行人分類,進(jìn)一步提高運(yùn)動目標(biāo)檢測的針對性;
3、相對于先前單獨(dú)使用混合高斯模型方法會將整片區(qū)域群行人目標(biāo)不加辨別的提取出來,本方法對群行人的單個行人目標(biāo)分別給出具體的位置;
4、相對于傳統(tǒng)方法增加了檢測的準(zhǔn)確度,在公共數(shù)據(jù)集的測試中提升約兩個百分點(diǎn);
5、本發(fā)明的單幀測試速度達(dá)到60ms,在不影響檢測準(zhǔn)確率的情況下基本滿足實(shí)時性的要求。
附圖說明
圖1為本發(fā)明中的流程圖;
圖2為本發(fā)明得到的效果圖。
具體實(shí)施方式
實(shí)施例1:如圖1-2所示,一種基于gmm背景差分與聯(lián)合特征的行人檢測方法,
先使用混合高斯模型對視頻圖像的背景建模,得到背景圖像之后與視頻當(dāng)前幀做差分運(yùn)算,得出運(yùn)動前景物體的位置,確定圖像的待檢測區(qū)域,再使用聯(lián)合特征訓(xùn)練的分類器對待檢測區(qū)域進(jìn)行檢測,最后得到行人的框圖。
所述方法的具體步驟如下:
step1、采集視頻序列圖像;
step2、對步驟step1中采集的序列圖像應(yīng)用混合高斯模型方法進(jìn)行背景建模,得到背景圖像;
step3、將當(dāng)前幀圖像與背景幀圖像做差分運(yùn)算,得出差異圖像區(qū)域,并對該差異區(qū)域做腐蝕,膨脹,最大化操作,對聯(lián)通的區(qū)域進(jìn)行最大化矩形區(qū)域得出一個矩形區(qū)域,將矩形區(qū)域的位置映射至當(dāng)前幀圖像,映射后當(dāng)前幀的位置也就是行人待檢測窗口;
step4、使用基于hog與lbp聯(lián)合特征并采用支持向量機(jī)svm方法訓(xùn)練的行人檢測分類器以步驟step3中得出的窗口位置為roi,在當(dāng)前幀圖像上進(jìn)行檢測;
step5、對當(dāng)前幀中的行人待檢測窗口進(jìn)行多尺度檢測,檢出行人圖像,并使用矩形框標(biāo)出。
作為本發(fā)明的優(yōu)選方案,所述步驟step2的背景圖像提取的方法使用的是基于混合高斯模型的背景差分算法。
作為本發(fā)明的優(yōu)選方案,所述步驟step3中對差異圖像區(qū)域進(jìn)行腐蝕膨脹操作后,在最大化操作中設(shè)定補(bǔ)償值,將腐蝕后的區(qū)域進(jìn)行聯(lián)通,對接近的差異圖像區(qū)域連通,即將滿足補(bǔ)償值的相鄰差異圖像區(qū)域進(jìn)行聯(lián)通。
作為本發(fā)明的優(yōu)選方案,所述的步驟step3中,相鄰區(qū)域的連通條件為,左右,上下相鄰像素的距離均小于補(bǔ)償值0.03(x+y),其中x為視頻圖像的像素寬度,y為視頻圖像的像素長度。
作為本發(fā)明的優(yōu)選方案,所述步驟step4中,svm方法訓(xùn)練出來的模型的檢測原理為目標(biāo)圖像的roi,即感興趣區(qū)域。
作為本發(fā)明的優(yōu)選方案,所述的步驟step5中,對圖像的檢測結(jié)果最終在原圖像中呈現(xiàn)。
實(shí)施例2:如圖1-2所示,一種基于gmm背景差分與聯(lián)合特征的行人檢測方法,如圖1-2所示:所述的gmm背景建模差分與聯(lián)合特征的行人檢測方法,算法主要分為兩個部分,一部分是提取視頻中運(yùn)動目標(biāo)的運(yùn)動特征作為待檢測區(qū)域,一部分針對待檢測區(qū)域使用聯(lián)合特征訓(xùn)練的分類器進(jìn)行檢測,確定運(yùn)動物體是否為行人。
如圖1-2所示:所述的gmm背景建模差分與聯(lián)合特征的行人檢測方法,使用背景差分模型進(jìn)行行人運(yùn)動特征提取:使用gmm方法對背景進(jìn)行實(shí)時建模,得到背景圖像,背景圖像能夠相隔時間進(jìn)行更新,以減弱光線變化和圖像中微小擾動的影響。
如圖1-2所示:所述的gmm背景建模差分與聯(lián)合特征的行人檢測方法,使用聯(lián)合特征訓(xùn)練分類器進(jìn)行待檢測區(qū)域的檢測,訓(xùn)練的特征分類器訓(xùn)練樣本采用包括行人的正樣本和不包括行人的負(fù)樣本,使用支持向量機(jī)的方法對樣本進(jìn)行訓(xùn)練,得出分類器模型。
如圖1-2所示:所述的gmm背景建模差分與聯(lián)合特征的行人檢測方法在提取運(yùn)動特征過程中具體步驟為,當(dāng)前幀與背景幀差分之后得到差分圖像,對差分圖像進(jìn)行閾值化操作,在使用形態(tài)學(xué)閉操作對圖像的斷續(xù)處處理,得到不完全的矩形區(qū)域,對矩形區(qū)域進(jìn)行補(bǔ)償最終得到行人待檢測區(qū)域。
如圖1-2所示:所述的gmm背景建模差分與聯(lián)合特征的行人檢測方法的實(shí)現(xiàn)效果可以對相重合區(qū)域行人進(jìn)行檢測,有效縮小圖片中的檢索區(qū)域,提高檢測速度。
表1四種不同方法的準(zhǔn)確率對比
表2四種方法的運(yùn)算速度對比
本發(fā)明能夠有效地縮小分類器滑動窗口的檢索區(qū)域與減少分類器的檢索次數(shù),在確定運(yùn)動目標(biāo)的前提下迅速得到行人的具體位置,針對群行人目標(biāo)也有較好的檢測效果,實(shí)驗(yàn)證明相對之前的方法達(dá)到了更好的效果。
上面結(jié)合附圖對本發(fā)明的具體實(shí)施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下作出各種變化。