本發(fā)明涉及一種視頻圖像中的人體識(shí)別方法,屬于圖像處理和模式識(shí)別的
技術(shù)領(lǐng)域:
。
背景技術(shù):
:隨著獲取視頻設(shè)備以及寬帶網(wǎng)絡(luò)的迅猛發(fā)展,視頻已經(jīng)作為信息的主要載體。大多數(shù)視頻都是記錄的人的活動(dòng),所以不論是從安全、監(jiān)控和娛樂,還是個(gè)人信息存儲(chǔ)的角度,對(duì)視頻中的人體動(dòng)作進(jìn)行識(shí)別的研究就具有了十分重要的學(xué)術(shù)價(jià)值和應(yīng)用前景。從本質(zhì)上來說,人體行為識(shí)別就是對(duì)分割出來的行人目標(biāo)提取出感興趣的特征,然后對(duì)提取出的特征數(shù)據(jù)進(jìn)行分類操作。目前,常用的人體行為識(shí)別方法可以分為基于模板匹配的方法以及基于狀態(tài)空間的方法?;谀0迤ヅ涞姆椒ㄊ菍⒖既梭w行為的序列圖像模板存放在數(shù)據(jù)庫中,之后將待測(cè)圖像與數(shù)據(jù)庫中存放的參考序列圖像進(jìn)行匹配,從而找得到相似度最高的參考序列圖像,進(jìn)而確定待測(cè)試的人體行為類別?;谀0宓娜梭w行為識(shí)別方法復(fù)雜度較低,可是沒有考慮到人體行為在視頻序列中的動(dòng)態(tài)特性,并且對(duì)噪聲干擾十分敏感。基于狀態(tài)空間的方法通過描述人體運(yùn)動(dòng)的特征,把人體行為的基本姿態(tài)當(dāng)作成一個(gè)狀態(tài),通過某種概率關(guān)系在這些狀態(tài)之間推進(jìn),其中應(yīng)用最多的是隱馬爾可夫模型。不過人體行為識(shí)別目前還存在很多需要克服的難題,人體是非剛性目標(biāo),而且每個(gè)人做相同的動(dòng)作都存在差異性,這就給行為識(shí)別的一般性帶來難度,況且某些人體動(dòng)作之間也存在著相似性并且動(dòng)作種類繁多,這都是在設(shè)計(jì)行為識(shí)別方法時(shí)要考慮的問題。目前,智能監(jiān)控對(duì)于實(shí)時(shí)性和準(zhǔn)確性的要求越來越高,而傳統(tǒng)方法難以滿足當(dāng)今實(shí)際應(yīng)用的需求。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供了一種視頻圖像中的人體動(dòng)作識(shí)別方法,解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低,抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的技術(shù)問題。為解決上述技術(shù)問題,本發(fā)明提供了一種視頻圖像中的人體動(dòng)作識(shí)別方法,其特征是,包括以下步驟:步驟一,對(duì)各幀輸入圖像進(jìn)行預(yù)處理得到前景區(qū)域,對(duì)前景區(qū)域進(jìn)行篩選得到目標(biāo)區(qū)域;步驟二,根據(jù)目標(biāo)區(qū)域獲取目標(biāo)輪廓;步驟三,獲得X和Y方向的輪廓能量變化直方圖;步驟四,對(duì)輪廓能量變化直方圖進(jìn)行歸一化處理;步驟五,訓(xùn)練階段:對(duì)輪廓能量變化直方圖形成的訓(xùn)練集進(jìn)行動(dòng)作分類,得到人體行為模型并賦予權(quán)值;步驟六,在識(shí)別階段:將待測(cè)幀的輪廓能量直方圖與訓(xùn)練階段得到的人體行為模型匹配,完成動(dòng)作識(shí)別。進(jìn)一步的,在所述步驟一中,預(yù)處理采用背景減除法,篩選采用最小外接矩形框法。進(jìn)一步的,在所述步驟三中,獲取輪廓能量變化直方圖方法為:31)獲取相鄰兩幀圖像的邊緣圖像Iedge和Ilast_edge,使用10×10窗口按列遍歷邊緣圖像Iedge;32)遍歷時(shí),當(dāng)窗口內(nèi)存在邊緣像素時(shí),在前一幀圖像Ilast_edge中的相同區(qū)域?qū)ふ遗c之歐式距離最小的邊緣像素相匹配,并將歐式距離的大小作為該點(diǎn)邊緣像素能量變化的值;33)遍歷完成后,將列號(hào)作為直方圖的橫坐標(biāo),每列對(duì)應(yīng)的能量變化值作為直方圖的縱坐標(biāo),得到輪廓能量變化直方圖。進(jìn)一步的,在所述步驟四中,歸一化處理過程為,先對(duì)直方圖縱坐標(biāo)進(jìn)行歸一化處理,使其值處于0到1之間,然后將直方圖映射到一個(gè)橫坐標(biāo)為固定大小的直方圖。進(jìn)一步的,在所述步驟五中,分類方法為:51)利用k-means聚類方法獲取聚類質(zhì)心集,對(duì)行為進(jìn)行大類劃分,得到的各劃分類別Ci,其中,1≤i≤n,n是行為類別數(shù);52)利用歐式距離對(duì)各Ci進(jìn)行兩兩對(duì)比,得到基尼不純度Gi,基尼不純度Gi作為類別Ci的權(quán)值。進(jìn)一步的,在所述步驟六中,待測(cè)行為的在識(shí)別的具體過程為:61)對(duì)于待測(cè)行為Sq={K1,K2,K3,.......,Kl}進(jìn)行步驟一至三處理得到其輪廓能量變化直方圖,判斷圖像Kt的直方圖與各個(gè)類別的質(zhì)心的歐式距離,選取歐式距離最小的類別作為圖像Kt所屬的類別Ci,其中,1≤t≤l;62)將Sq屬于各模板動(dòng)作行為的可能性設(shè)為Aq={A1,A2,A3,......,An},其中可能性Ai是根據(jù)基尼不純度Gi對(duì)Ci進(jìn)行優(yōu)化得到,Ai=Gi/Ci;63)根據(jù)各幀圖像所屬類別Ai,選擇最大值A(chǔ)max從而確定Sq的動(dòng)作類型。與現(xiàn)有技術(shù)相比,本發(fā)明所達(dá)到的有益效果是:本發(fā)明通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖,利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類,通過基尼不純度給分類結(jié)果賦予權(quán)值,提高了準(zhǔn)確率和魯棒性,同時(shí)能夠保證實(shí)時(shí)性,解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低,抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的問題。附圖說明圖1是本發(fā)明方法的流程圖。圖2是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中boxing行為的圖像。圖3是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中handclapping行為的圖像。圖4是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中handwaving行為的圖像。圖5是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中jogging行為的圖像。圖6是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中running行為的圖像。圖7是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中walking行為的圖像。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明的保護(hù)范圍。如圖1所示,本發(fā)明的一種視頻圖像中的人體動(dòng)作識(shí)別方法,其特征是,包括以下步驟:步驟一,對(duì)各幀輸入圖像進(jìn)行預(yù)處理得到前景區(qū)域,對(duì)前景區(qū)域進(jìn)行篩選得到目標(biāo)區(qū)域;行為訓(xùn)練集S={S1,S2,S3,......,Sn}(n是行為類別數(shù)),其中,行為Si(其中,1≤i≤n),行為Si={K1,K2,K3,.......,Km}(m是圖像幀數(shù)),Kj(其中,1≤j≤m)為組成行為Si的各幀圖像,對(duì)一個(gè)視頻中各幀輸入圖像采用背景減除法得到前景區(qū)域,其具體過程參見現(xiàn)有技術(shù),再通過最小外接矩形框來包含前景區(qū)域,從而判斷是否為人體目標(biāo)區(qū)域,篩選出目標(biāo)區(qū)域。步驟二,根據(jù)目標(biāo)區(qū)域獲取目標(biāo)輪廓;獲取目標(biāo)輪廓的方法為,先對(duì)輸入圖像采用2D高斯濾波模板進(jìn)行濾波,然后利用canny算子逐幀提取人體姿態(tài)二值輪廓,再對(duì)圖像中的每個(gè)邊緣像素通過Sobel算子計(jì)算其梯度的大小和方向。步驟三,獲得X和Y方向的輪廓能量變化直方圖;通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖,獲取輪廓能量變化直方圖的具體過程為:31)獲取相鄰兩幀圖像的邊緣圖像Iedge和Ilast_edge,使用10×10窗口按列遍歷邊緣圖像Iedge;32)遍歷時(shí),當(dāng)窗口內(nèi)存在邊緣像素時(shí),在前一幀圖像Ilast_edge中的相同區(qū)域?qū)ふ遗c之歐式距離最小的邊緣像素相匹配,并將歐式距離的大小作為該點(diǎn)邊緣像素能量變化的值;33)遍歷完成后,將列號(hào)作為直方圖的橫坐標(biāo),每列對(duì)應(yīng)的能量變化值作為直方圖的縱坐標(biāo),得到輪廓能量變化直方圖。步驟四,對(duì)輪廓能量變化直方圖進(jìn)行歸一化處理;歸一化處理過程為,先對(duì)直方圖縱坐標(biāo)進(jìn)行歸一化處理,使其值處于0到1之間,然后將直方圖映射到一個(gè)橫坐標(biāo)為固定大小的直方圖。步驟五,訓(xùn)練階段:對(duì)輪廓能量變化直方圖形成的訓(xùn)練集進(jìn)行動(dòng)作分類,得到人體行為模型并賦予權(quán)值;利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類,分類的具體過程為:51)在由輪廓變化能量直方圖組成的訓(xùn)練集中隨機(jī)選擇k個(gè)對(duì)象,每個(gè)對(duì)象代表一個(gè)聚類的質(zhì)心;其中k的值依據(jù)經(jīng)驗(yàn)選取3≤k≤n;52)對(duì)于其余的每個(gè)對(duì)象,根據(jù)該對(duì)象與各聚類質(zhì)心之間的距離,把它分配到與之最相似的聚類中;53)計(jì)算每個(gè)聚類的新質(zhì)心;54)重復(fù)上述51)-53)過程,直到準(zhǔn)則函數(shù)會(huì)聚;55)依據(jù)以上獲得的聚類質(zhì)心集Rn,對(duì)行為S進(jìn)行大類劃分,得到的各劃分類為Ci;56)利用歐式距離對(duì)Ci進(jìn)行兩兩對(duì)比,得到基尼不純度Gi,基尼不純度Gi作為類別Ci的權(quán)值;其中獲取基尼不純度的過程參見現(xiàn)有技術(shù)。步驟六,在識(shí)別階段:將待測(cè)幀的輪廓能量直方圖與訓(xùn)練階段得到的人體行為模型匹配,完成動(dòng)作識(shí)別。待測(cè)行為的在識(shí)別的具體過程為:61)對(duì)于待測(cè)行為Sq={K1,K2,K3,.......,Kl}進(jìn)行步驟一至三處理得到其輪廓能量變化直方圖,判斷圖像Kt(其中,1≤t≤l)的直方圖與各個(gè)類別的質(zhì)心的歐式距離,選取歐式距離最小的類別作為圖像Kt所屬的類別Ci,62)將Sq屬于各模板動(dòng)作行為的可能性設(shè)為Aq={A1,A2,A3,......,An},其中可能性Ai是根據(jù)基尼不純度Gi對(duì)Ci進(jìn)行優(yōu)化得到,Ai=Gi/Ci;Ai值越大,代表Sq屬于第i動(dòng)作類別的可能性越大,采用比值來優(yōu)化,可以提高不同類之間的區(qū)分度;63)根據(jù)各幀圖像所屬類別的可能性Ai,選擇最大值A(chǔ)max從而確定Sq的動(dòng)作類型。實(shí)施例一本發(fā)明使用留一法(假設(shè)有N個(gè)樣本,將每一個(gè)樣本作為測(cè)試樣本,其它N-1個(gè)樣本作為訓(xùn)練樣本)對(duì)方法進(jìn)行交叉驗(yàn)證,測(cè)試樣本采用KTH人體行為數(shù)據(jù)庫,該數(shù)據(jù)庫包括6類行為:boxing,jogging,running,boxing,handwaving,handclapping,是由25個(gè)不同的人執(zhí)行的,分別在四個(gè)場(chǎng)景下(室外背景,鏡頭拉近拉遠(yuǎn),攝像機(jī)輕微運(yùn)動(dòng),室內(nèi)背景),一共有599段視頻。圖2至圖7分別為KTH數(shù)據(jù)庫中boxing、handclapping、handwaving、jogging、running和walking行為的圖像?,F(xiàn)有技術(shù)中進(jìn)行人體動(dòng)作識(shí)別采用方法有Schindler、Ahmad、Jhuang、Rodriguez和Mikolajczyk?;贙TH人體行為數(shù)據(jù)庫中6類行為圖像,本實(shí)施例中將本發(fā)明方法與現(xiàn)有技術(shù)采用的方法分別進(jìn)行測(cè)試,其中Schindler、Ahmad、Jhuang和Rodriguez方法采用拆分法,本發(fā)明方法和Mikolajczyk方法采用留一法。各方法的測(cè)試結(jié)果如表1所示,本發(fā)明的方法對(duì)于各行為的平均識(shí)別率達(dá)到93.3%,超過了其他方法的識(shí)別率,具有較高的識(shí)別率。表1:KTH數(shù)據(jù)庫中的各方法識(shí)別率方法評(píng)價(jià)方案識(shí)別率(%)本發(fā)明方法留一法93.3Schindler拆分法90.73Ahmad拆分法87.63Jhuang拆分法91.68Rodriguez拆分法88.66Mikolajczyk留一法93.17綜上所述,本發(fā)明具有以下有益效果:通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖,利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類,通過基尼不純度給分類結(jié)果賦予權(quán)值的方法能夠提高識(shí)別的準(zhǔn)確率和魯棒性,同時(shí)能夠保證實(shí)時(shí)性,解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低,抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的問題。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和變型,這些改進(jìn)和變型也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁1 2 3