基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法
【專利摘要】本發(fā)明涉及一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法。目前現(xiàn)有的人體識別技術(shù)及應(yīng)用有以下幾個方面的不足,人體骨架本身就是一個復(fù)雜的結(jié)構(gòu)體,不同人的動作習(xí)慣,其動作方式也不同,這就造成了識別人體普遍性的困難。本發(fā)明包括如下步驟:首先是描述人體目標(biāo)的尺寸、顏色、邊緣、輪廓、形狀和深度的整體信息,為動作識別提供有用線索,從視頻序列中提取出有效的運動特征,在遠(yuǎn)景情況下,利用目標(biāo)的運動軌跡進(jìn)行軌跡分析;近景情況下,則需利用從圖像序列中提取的信息對目標(biāo)的四肢與軀干進(jìn)行二維或三維的建模。本發(fā)明用于基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法。
【專利說明】
基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法
[0001 ]
技術(shù)領(lǐng)域: 本發(fā)明涉及動作識別領(lǐng)域,具體涉及一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識 別方法。
[0002]
【背景技術(shù)】: 目前現(xiàn)有的人體識別技術(shù)及應(yīng)用有以下幾個方面的不足,人體骨架本身就是一個復(fù)雜 的結(jié)構(gòu)體,不同人的動作習(xí)慣,其動作方式也不同,這就造成了識別人體普遍性的困難。其 次被識別目標(biāo)位置局限和強制性,被識別目標(biāo)必須調(diào)整自己的位置,使其正面對準(zhǔn)攝像頭, 側(cè)面都可能無法識別,再者是響應(yīng)速度和效率,對于連續(xù)的人體動作,幀與幀之前的數(shù)據(jù)存 在冗余,不僅占的存儲空間大,還增加了計算量。
[0003] 動作識別技術(shù)是基于人的動作特征,對輸入的人體視頻流,首先判斷其是否存在 人類,如果存在人類,則進(jìn)一步的給出每個人的位置、大小和各個主要關(guān)節(jié)標(biāo)志點的位置信 息,并依據(jù)這些信息,進(jìn)一步提取每個人動作中所蘊涵的動作特征,并將其與已知的動作特 征進(jìn)行對比,從而識別每個人正在進(jìn)行的動作,動作識別技術(shù)具有廣泛的應(yīng)用,如危險動作 識別報警、人機互動、輔助醫(yī)療行為矯正、影視制作等等。
[0004] 為了快速的獲取和識別人體行為,克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種 基于計算機深度學(xué)習(xí)的識別方法,該方法可以實時的、動態(tài)的、快速的、大范圍的提取和識 別人體動作,可以更好的應(yīng)用于企業(yè)、學(xué)校、政府機關(guān)的危險動作告警、影視制作等系統(tǒng),降 低硬件需求,傳統(tǒng)方法在動作識別中對于硬件需求相當(dāng)嚴(yán)格,在對萬人級別的識別中,普通 計算機根本無法滿足運算需求,本方法通過單浮點,雙浮點運算有效的解決了硬件占用過 大的問題,在十萬人隨機抽取篩選測試中,對人的識別只需極短可以做到實時識別。
[0005]
【發(fā)明內(nèi)容】
: 本發(fā)明的目的是提供一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法。
[0006] 上述的目的通過以下的技術(shù)方案實現(xiàn): 一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,首先是描述人體目標(biāo)的尺寸、 顏色、邊緣、輪廓、形狀和深度的整體信息,為動作識別提供有用線索,從視頻序列中提取出 有效的運動特征,在遠(yuǎn)景情況下,利用目標(biāo)的運動軌跡進(jìn)行軌跡分析;近景情況下,則需利 用從圖像序列中提取的信息對目標(biāo)的四肢與軀干進(jìn)行二維或三維的建模。
[0007] 所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,通過搜索人體尺寸、顏 色、邊緣、輪廓、形狀等特征,確定移動物體為人類,之后通過篩選截取人體圖像,然后在人 身上主要關(guān)節(jié)位置或者更多的位置上設(shè)置可以進(jìn)行識別和追蹤的標(biāo)志點,通過攝像機拍攝 同一個人體的動作,然后根據(jù)空間幾何參數(shù),結(jié)合一些人體運動的數(shù)字模型,可以推算出人 身上每個標(biāo)志點在每個時刻的位置,多個標(biāo)志點位置的組合就構(gòu)成了人體的整體位置,進(jìn) 行連續(xù)的位置識別從而識別出人體動作。
[0008] 所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,對所述的攝像機的攝 像頭采集的圖像進(jìn)行實時處理,首先采集分辨出圖像中的人,將行人所在區(qū)域框選出來,然 后將該區(qū)域的每一幀與其前一幀和后一幀進(jìn)行對比,計算出三幀中像素點的移動變化,通 過計算像素移動的OpticalFlow,表示出像素點移動的位移向量(Fx, Fy),接下來,將該向 量分解,使得:,經(jīng)過高斯濾波器濾波后,就得到了所關(guān)注行人動作的特征表示。
[0009] 有益效果: 1.本發(fā)明是一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,主要是提供了一 種基于計算機深度學(xué)習(xí)的識別方法,該方法可以實時的、動態(tài)的、快速的、大范圍的提取和 識別人體動作,可以更好的應(yīng)用于企業(yè)、學(xué)校、政府機關(guān)的危險動作告警、影視制作等系統(tǒng), 降低硬件需求,傳統(tǒng)方法在動作識別中對于硬件需求相當(dāng)嚴(yán)格,在對萬人級別的識別中,普 通計算機根本無法滿足運算需求。
[0010] 本發(fā)明通過單浮點,雙浮點運算有效的解決了硬件占用過大的問題,在十萬人隨 機抽取篩選測試中,對人的識別只需極短可以做到實時識別。
[0011]
【附圖說明】: 附圖1是本發(fā)明的神經(jīng)網(wǎng)絡(luò)的動作識別技術(shù)示意圖。
[0012] 附圖2是本發(fā)明的動作特征圖。
[0013]
【具體實施方式】: 實施例1: 一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,首先是描述人體目標(biāo)的尺寸、 顏色、邊緣、輪廓、形狀和深度的整體信息,為動作識別提供有用線索,從視頻序列中提取出 有效的運動特征,在遠(yuǎn)景情況下,利用目標(biāo)的運動軌跡進(jìn)行軌跡分析;近景情況下,則需利 用從圖像序列中提取的信息對目標(biāo)的四肢與軀干進(jìn)行二維或三維的建模。
[0014] 實施例2: 根據(jù)實施例1所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,通過搜索人體 尺寸、顏色、邊緣、輪廓、形狀等特征,確定移動物體為人類,之后通過篩選截取人體圖像,然 后在人身上主要關(guān)節(jié)位置或者更多的位置上設(shè)置可以進(jìn)行識別和追蹤的標(biāo)志點,通過攝像 機拍攝同一個人體的動作,然后根據(jù)空間幾何參數(shù),結(jié)合一些人體運動的數(shù)字模型,可以推 算出人身上每個標(biāo)志點在每個時刻的位置,多個標(biāo)志點位置的組合就構(gòu)成了人體的整體位 置,進(jìn)行連續(xù)的位置識別從而識別出人體動作。
[0015] 實施例3: 根據(jù)實施例1或2所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,對所述的 攝像機的攝像頭采集的圖像進(jìn)行實時處理,首先采集分辨出圖像中的人,將行人所在區(qū)域 框選出來,然后將該區(qū)域的每一幀與其前一幀和后一幀進(jìn)行對比,計算出三幀中像素點的 移動變化,通過計算像素移動的OpticalFlow,表示出像素點移動的位移向量(Fx, Fy),接 下來,將該向量分解,使得:,經(jīng)過高斯濾波器濾波后,就得到了所關(guān)注行人動作的特征表 示; 動作特征圖像參見附圖2 特征計算公式:
【主權(quán)項】
1. 一種基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,其特征是:首先是描述人體 目標(biāo)的尺寸、顏色、邊緣、輪廓、形狀和深度的整體信息,為動作識別提供有用線索,從視頻 序列中提取出有效的運動特征,在遠(yuǎn)景情況下,利用目標(biāo)的運動軌跡進(jìn)行軌跡分析;近景情 況下,則需利用從圖像序列中提取的信息對目標(biāo)的四肢與軀干進(jìn)行二維或Ξ維的建模。2. 根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,其特征 是:通過捜索人體尺寸、顏色、邊緣、輪廓、形狀等特征,確定移動物體為人類,之后通過篩選 截取人體圖像,然后在人身上主要關(guān)節(jié)位置或者更多的位置上設(shè)置可W進(jìn)行識別和追蹤的 標(biāo)志點,通過攝像機拍攝同一個人體的動作,然后根據(jù)空間幾何參數(shù),結(jié)合一些人體運動的 數(shù)字模型,可W推算出人身上每個標(biāo)志點在每個時刻的位置,多個標(biāo)志點位置的組合就構(gòu) 成了人體的整體位置,進(jìn)行連續(xù)的位置識別從而識別出人體動作。3. 根據(jù)權(quán)利要求1或2所述的基于深度學(xué)習(xí)的快速動態(tài)人體動作提取、識別方法,其特 征是:對所述的攝像機的攝像頭采集的圖像進(jìn)行實時處理,首先采集分辨出圖像中的人,將 行人所在區(qū)域框選出來,然后將該區(qū)域的每一帖與其前一帖和后一帖進(jìn)行對比,計算出Ξ 帖中像素點的移動變化,通過計算像素移動的化ticalFlow,表示出像素點移動的位移向量 (Fx,巧),接下來,將該向量分解,使得:經(jīng)過高斯濾波 器濾波后,就得到了所關(guān)注行人動作的特征表示。
【文檔編號】G06T7/20GK106096518SQ201610387248
【公開日】2016年11月9日
【申請日】2016年6月2日 公開號201610387248.7, CN 106096518 A, CN 106096518A, CN 201610387248, CN-A-106096518, CN106096518 A, CN106096518A, CN201610387248, CN201610387248.7
【發(fā)明人】姚一鳴
【申請人】哈爾濱多智科技發(fā)展有限公司