一種視頻圖像中的人體動(dòng)作識(shí)別方法與流程

文檔序號(hào)：12365487閱讀：1493來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及一種視頻圖像中的人體識(shí)別方法，屬于圖像處理和模式識(shí)別的
技術(shù)領(lǐng)域：
。
背景技術(shù)：
：隨著獲取視頻設(shè)備以及寬帶網(wǎng)絡(luò)的迅猛發(fā)展，視頻已經(jīng)作為信息的主要載體。大多數(shù)視頻都是記錄的人的活動(dòng)，所以不論是從安全、監(jiān)控和娛樂，還是個(gè)人信息存儲(chǔ)的角度，對(duì)視頻中的人體動(dòng)作進(jìn)行識(shí)別的研究就具有了十分重要的學(xué)術(shù)價(jià)值和應(yīng)用前景。從本質(zhì)上來說，人體行為識(shí)別就是對(duì)分割出來的行人目標(biāo)提取出感興趣的特征，然后對(duì)提取出的特征數(shù)據(jù)進(jìn)行分類操作。目前，常用的人體行為識(shí)別方法可以分為基于模板匹配的方法以及基于狀態(tài)空間的方法?；谀０迤ヅ涞姆椒ㄊ菍⒖既梭w行為的序列圖像模板存放在數(shù)據(jù)庫中，之后將待測(cè)圖像與數(shù)據(jù)庫中存放的參考序列圖像進(jìn)行匹配，從而找得到相似度最高的參考序列圖像，進(jìn)而確定待測(cè)試的人體行為類別?；谀０宓娜梭w行為識(shí)別方法復(fù)雜度較低，可是沒有考慮到人體行為在視頻序列中的動(dòng)態(tài)特性，并且對(duì)噪聲干擾十分敏感。基于狀態(tài)空間的方法通過描述人體運(yùn)動(dòng)的特征，把人體行為的基本姿態(tài)當(dāng)作成一個(gè)狀態(tài)，通過某種概率關(guān)系在這些狀態(tài)之間推進(jìn)，其中應(yīng)用最多的是隱馬爾可夫模型。不過人體行為識(shí)別目前還存在很多需要克服的難題，人體是非剛性目標(biāo)，而且每個(gè)人做相同的動(dòng)作都存在差異性，這就給行為識(shí)別的一般性帶來難度，況且某些人體動(dòng)作之間也存在著相似性并且動(dòng)作種類繁多，這都是在設(shè)計(jì)行為識(shí)別方法時(shí)要考慮的問題。目前，智能監(jiān)控對(duì)于實(shí)時(shí)性和準(zhǔn)確性的要求越來越高，而傳統(tǒng)方法難以滿足當(dāng)今實(shí)際應(yīng)用的需求。技術(shù)實(shí)現(xiàn)要素：本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足，提供了一種視頻圖像中的人體動(dòng)作識(shí)別方法，解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低，抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的技術(shù)問題。為解決上述技術(shù)問題，本發(fā)明提供了一種視頻圖像中的人體動(dòng)作識(shí)別方法，其特征是，包括以下步驟：步驟一，對(duì)各幀輸入圖像進(jìn)行預(yù)處理得到前景區(qū)域，對(duì)前景區(qū)域進(jìn)行篩選得到目標(biāo)區(qū)域；步驟二，根據(jù)目標(biāo)區(qū)域獲取目標(biāo)輪廓；步驟三，獲得X和Y方向的輪廓能量變化直方圖；步驟四，對(duì)輪廓能量變化直方圖進(jìn)行歸一化處理；步驟五，訓(xùn)練階段：對(duì)輪廓能量變化直方圖形成的訓(xùn)練集進(jìn)行動(dòng)作分類，得到人體行為模型并賦予權(quán)值；步驟六，在識(shí)別階段：將待測(cè)幀的輪廓能量直方圖與訓(xùn)練階段得到的人體行為模型匹配，完成動(dòng)作識(shí)別。進(jìn)一步的，在所述步驟一中，預(yù)處理采用背景減除法，篩選采用最小外接矩形框法。進(jìn)一步的，在所述步驟三中，獲取輪廓能量變化直方圖方法為：31)獲取相鄰兩幀圖像的邊緣圖像Iedge和Ilast_edge,使用10×10窗口按列遍歷邊緣圖像Iedge；32)遍歷時(shí)，當(dāng)窗口內(nèi)存在邊緣像素時(shí)，在前一幀圖像Ilast_edge中的相同區(qū)域?qū)ふ遗c之歐式距離最小的邊緣像素相匹配，并將歐式距離的大小作為該點(diǎn)邊緣像素能量變化的值；33)遍歷完成后，將列號(hào)作為直方圖的橫坐標(biāo)，每列對(duì)應(yīng)的能量變化值作為直方圖的縱坐標(biāo)，得到輪廓能量變化直方圖。進(jìn)一步的，在所述步驟四中，歸一化處理過程為，先對(duì)直方圖縱坐標(biāo)進(jìn)行歸一化處理，使其值處于0到1之間，然后將直方圖映射到一個(gè)橫坐標(biāo)為固定大小的直方圖。進(jìn)一步的，在所述步驟五中，分類方法為：51)利用k-means聚類方法獲取聚類質(zhì)心集，對(duì)行為進(jìn)行大類劃分，得到的各劃分類別Ci，其中，1≤i≤n，n是行為類別數(shù)；52)利用歐式距離對(duì)各Ci進(jìn)行兩兩對(duì)比，得到基尼不純度Gi，基尼不純度Gi作為類別Ci的權(quán)值。進(jìn)一步的，在所述步驟六中，待測(cè)行為的在識(shí)別的具體過程為：61)對(duì)于待測(cè)行為Sq＝{K1,K2,K3,.......,Kl}進(jìn)行步驟一至三處理得到其輪廓能量變化直方圖，判斷圖像Kt的直方圖與各個(gè)類別的質(zhì)心的歐式距離，選取歐式距離最小的類別作為圖像Kt所屬的類別Ci，其中，1≤t≤l；62)將Sq屬于各模板動(dòng)作行為的可能性設(shè)為Aq＝{A1,A2,A3,......,An}，其中可能性Ai是根據(jù)基尼不純度Gi對(duì)Ci進(jìn)行優(yōu)化得到，Ai＝Gi/Ci；63)根據(jù)各幀圖像所屬類別Ai，選擇最大值A(chǔ)max從而確定Sq的動(dòng)作類型。與現(xiàn)有技術(shù)相比，本發(fā)明所達(dá)到的有益效果是：本發(fā)明通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖，利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類，通過基尼不純度給分類結(jié)果賦予權(quán)值，提高了準(zhǔn)確率和魯棒性，同時(shí)能夠保證實(shí)時(shí)性，解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低，抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的問題。附圖說明圖1是本發(fā)明方法的流程圖。圖2是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中boxing行為的圖像。圖3是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中handclapping行為的圖像。圖4是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中handwaving行為的圖像。圖5是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中jogging行為的圖像。圖6是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中running行為的圖像。圖7是本發(fā)明實(shí)施例KTH數(shù)據(jù)庫中walking行為的圖像。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案，而不能以此來限制本發(fā)明的保護(hù)范圍。如圖1所示，本發(fā)明的一種視頻圖像中的人體動(dòng)作識(shí)別方法，其特征是，包括以下步驟：步驟一，對(duì)各幀輸入圖像進(jìn)行預(yù)處理得到前景區(qū)域，對(duì)前景區(qū)域進(jìn)行篩選得到目標(biāo)區(qū)域；行為訓(xùn)練集S＝{S1,S2,S3,......,Sn}(n是行為類別數(shù))，其中，行為Si(其中，1≤i≤n)，行為Si＝{K1,K2,K3,.......,Km}(m是圖像幀數(shù))，Kj(其中，1≤j≤m)為組成行為Si的各幀圖像，對(duì)一個(gè)視頻中各幀輸入圖像采用背景減除法得到前景區(qū)域，其具體過程參見現(xiàn)有技術(shù)，再通過最小外接矩形框來包含前景區(qū)域,從而判斷是否為人體目標(biāo)區(qū)域，篩選出目標(biāo)區(qū)域。步驟二，根據(jù)目標(biāo)區(qū)域獲取目標(biāo)輪廓；獲取目標(biāo)輪廓的方法為，先對(duì)輸入圖像采用2D高斯濾波模板進(jìn)行濾波，然后利用canny算子逐幀提取人體姿態(tài)二值輪廓，再對(duì)圖像中的每個(gè)邊緣像素通過Sobel算子計(jì)算其梯度的大小和方向。步驟三，獲得X和Y方向的輪廓能量變化直方圖；通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖，獲取輪廓能量變化直方圖的具體過程為：31)獲取相鄰兩幀圖像的邊緣圖像Iedge和Ilast_edge,使用10×10窗口按列遍歷邊緣圖像Iedge；32)遍歷時(shí)，當(dāng)窗口內(nèi)存在邊緣像素時(shí)，在前一幀圖像Ilast_edge中的相同區(qū)域?qū)ふ遗c之歐式距離最小的邊緣像素相匹配，并將歐式距離的大小作為該點(diǎn)邊緣像素能量變化的值；33)遍歷完成后，將列號(hào)作為直方圖的橫坐標(biāo)，每列對(duì)應(yīng)的能量變化值作為直方圖的縱坐標(biāo)，得到輪廓能量變化直方圖。步驟四，對(duì)輪廓能量變化直方圖進(jìn)行歸一化處理；歸一化處理過程為，先對(duì)直方圖縱坐標(biāo)進(jìn)行歸一化處理，使其值處于0到1之間，然后將直方圖映射到一個(gè)橫坐標(biāo)為固定大小的直方圖。步驟五，訓(xùn)練階段：對(duì)輪廓能量變化直方圖形成的訓(xùn)練集進(jìn)行動(dòng)作分類，得到人體行為模型并賦予權(quán)值；利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類，分類的具體過程為：51)在由輪廓變化能量直方圖組成的訓(xùn)練集中隨機(jī)選擇k個(gè)對(duì)象，每個(gè)對(duì)象代表一個(gè)聚類的質(zhì)心；其中k的值依據(jù)經(jīng)驗(yàn)選取3≤k≤n；52)對(duì)于其余的每個(gè)對(duì)象，根據(jù)該對(duì)象與各聚類質(zhì)心之間的距離，把它分配到與之最相似的聚類中；53)計(jì)算每個(gè)聚類的新質(zhì)心；54)重復(fù)上述51)-53)過程，直到準(zhǔn)則函數(shù)會(huì)聚；55)依據(jù)以上獲得的聚類質(zhì)心集Rn，對(duì)行為S進(jìn)行大類劃分，得到的各劃分類為Ci；56)利用歐式距離對(duì)Ci進(jìn)行兩兩對(duì)比，得到基尼不純度Gi，基尼不純度Gi作為類別Ci的權(quán)值；其中獲取基尼不純度的過程參見現(xiàn)有技術(shù)。步驟六，在識(shí)別階段：將待測(cè)幀的輪廓能量直方圖與訓(xùn)練階段得到的人體行為模型匹配，完成動(dòng)作識(shí)別。待測(cè)行為的在識(shí)別的具體過程為：61)對(duì)于待測(cè)行為Sq＝{K1,K2,K3,.......,Kl}進(jìn)行步驟一至三處理得到其輪廓能量變化直方圖，判斷圖像Kt(其中，1≤t≤l)的直方圖與各個(gè)類別的質(zhì)心的歐式距離，選取歐式距離最小的類別作為圖像Kt所屬的類別Ci，62)將Sq屬于各模板動(dòng)作行為的可能性設(shè)為Aq＝{A1,A2,A3,......,An}，其中可能性Ai是根據(jù)基尼不純度Gi對(duì)Ci進(jìn)行優(yōu)化得到，Ai＝Gi/Ci；Ai值越大，代表Sq屬于第i動(dòng)作類別的可能性越大，采用比值來優(yōu)化，可以提高不同類之間的區(qū)分度；63)根據(jù)各幀圖像所屬類別的可能性Ai，選擇最大值A(chǔ)max從而確定Sq的動(dòng)作類型。實(shí)施例一本發(fā)明使用留一法(假設(shè)有N個(gè)樣本,將每一個(gè)樣本作為測(cè)試樣本,其它N-1個(gè)樣本作為訓(xùn)練樣本)對(duì)方法進(jìn)行交叉驗(yàn)證，測(cè)試樣本采用KTH人體行為數(shù)據(jù)庫，該數(shù)據(jù)庫包括6類行為：boxing,jogging,running,boxing,handwaving,handclapping,是由25個(gè)不同的人執(zhí)行的，分別在四個(gè)場(chǎng)景下(室外背景，鏡頭拉近拉遠(yuǎn)，攝像機(jī)輕微運(yùn)動(dòng)，室內(nèi)背景)，一共有599段視頻。圖2至圖7分別為KTH數(shù)據(jù)庫中boxing、handclapping、handwaving、jogging、running和walking行為的圖像?，F(xiàn)有技術(shù)中進(jìn)行人體動(dòng)作識(shí)別采用方法有Schindler、Ahmad、Jhuang、Rodriguez和Mikolajczyk?；贙TH人體行為數(shù)據(jù)庫中6類行為圖像，本實(shí)施例中將本發(fā)明方法與現(xiàn)有技術(shù)采用的方法分別進(jìn)行測(cè)試，其中Schindler、Ahmad、Jhuang和Rodriguez方法采用拆分法，本發(fā)明方法和Mikolajczyk方法采用留一法。各方法的測(cè)試結(jié)果如表1所示，本發(fā)明的方法對(duì)于各行為的平均識(shí)別率達(dá)到93.3％，超過了其他方法的識(shí)別率，具有較高的識(shí)別率。表1：KTH數(shù)據(jù)庫中的各方法識(shí)別率方法評(píng)價(jià)方案識(shí)別率(％)本發(fā)明方法留一法93.3Schindler拆分法90.73Ahmad拆分法87.63Jhuang拆分法91.68Rodriguez拆分法88.66Mikolajczyk留一法93.17綜上所述，本發(fā)明具有以下有益效果：通過歐式距離來計(jì)算相鄰幀中目標(biāo)輪廓的變化得到輪廓能量變化直方圖，利用k-means聚類方法對(duì)各幀圖像得到的輪廓能量變化直方圖進(jìn)行無監(jiān)督分類，通過基尼不純度給分類結(jié)果賦予權(quán)值的方法能夠提高識(shí)別的準(zhǔn)確率和魯棒性，同時(shí)能夠保證實(shí)時(shí)性，解決了傳統(tǒng)基于模型匹配方法中模型泛化能力低，抗噪聲能力差以及基于狀態(tài)空間方法中動(dòng)作類別相似性的問題。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式，應(yīng)當(dāng)指出，對(duì)于本
技術(shù)領(lǐng)域：
的普通技術(shù)人員來說，在不脫離本發(fā)明技術(shù)原理的前提下，還可以做出若干改進(jìn)和變型，這些改進(jìn)和變型也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉一宸;劉惠義;
技術(shù)所有人：河海大學(xué);
我是此專利的發(fā)明人

上一篇：一種自拍圖像的優(yōu)化方法、裝置和拍攝終端與流程
上一篇：軸承輔助安裝裝置及軸承安裝方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人體動(dòng)作姿態(tài)識(shí)別綜述相關(guān)技術(shù)

圖像識(shí)別方法相關(guān)技術(shù)

圖像識(shí)別的方法相關(guān)技術(shù)

cnn圖像識(shí)別方法相關(guān)技術(shù)

穿墻透視器人體圖像相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種視頻圖像中的人體動(dòng)作識(shí)別方法與流程