亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于視覺詞袋的人體動作識別方法與流程

文檔序號:12365475閱讀:571來源:國知局

本發(fā)明屬于計算機視覺領(lǐng)域,尤其涉及其中的人體動作視頻圖像處理和識別。

2.

背景技術(shù):

人體動作識別是指計算機基于視頻圖像采集設(shè)備采集的數(shù)據(jù),分析識別人體姿態(tài)和運動模式的過程。它涉及到機器學習、人工智能、圖像處理等諸多學科,是計算機視覺領(lǐng)域重要的研究方向,在日常生活中也有著廣泛和重要的應用。銀行安全監(jiān)控系統(tǒng),老人看護系統(tǒng),智能家居等新需求新應用不斷產(chǎn)生,人體動作識別技術(shù)逐漸融入社會生活的各個角落,成為動作識別領(lǐng)域的研究熱點。

近年來監(jiān)控系統(tǒng)廣泛應用在各個單位和公共場所,但是絕大多數(shù)監(jiān)控系統(tǒng)僅僅是將圖像采集設(shè)備采集到的實時圖像通過網(wǎng)絡(luò)傳輸?shù)胶笈_,事件發(fā)生時通過肉眼才能發(fā)現(xiàn),事后也僅僅提供視頻倒查的功能。這種傳統(tǒng)的方法導致其實時監(jiān)控的的難度越來越大,且工作量日益增大。如何解決這個問題,引入人工智能技術(shù)和視頻圖像處理和識別技術(shù),取代人工來完成上述工作是未來的發(fā)展趨勢。本發(fā)明提出自己的研究思路,以期提供一種新的方法。尤其是提出了基于視覺詞袋的人體動作識別方法,根據(jù)實時監(jiān)控視頻提取人體動作行為特征,分析監(jiān)控區(qū)域內(nèi)人體的姿態(tài)和運動模式,與模型數(shù)據(jù)庫中的特征進行比對,識別異常行為并發(fā)出報警。本方法可以降低監(jiān)控系統(tǒng)對人工的依賴性,使得監(jiān)控系統(tǒng)變得更加智能和高效。

3.

技術(shù)實現(xiàn)要素:

本發(fā)明是根據(jù)上述思路設(shè)計的一種基于視覺詞袋的人體動作自動識別方法。

本發(fā)明的技術(shù)方案是提供一種基于視覺詞袋的人體動作識別方法,其特征在于:其包括以下幾個步驟:

(1)對原始視頻圖像進行預處理,檢測運動目標。

(2)對運動目標進行圖像特征提取和分類建模。

(3)利用標準動作圖像庫對人體動作進行分類識別,并根據(jù)正常行為模型和異常行為模型對異常行為進行識別和判定。

在上述步驟(1)之前還包括以下步驟:

(a)采集人體標準動作視頻,包括正常行為和異常行為,正常行為包括站立、行走、慢跑、坐下等,異常行為包括快速奔跑、抱打、群聚,摔倒等。

(b)提取人體動作特征,構(gòu)建視覺詞袋模型,建立標準動作圖像庫。

本發(fā)明提出了基于視覺詞袋模型的人體動作特征提取方法,包括以下幾個部分:

(1)人體動作特征分析

視頻提取出的圖像表現(xiàn)出極大的不確定性,無論是光照變化,角度變化,還是人體動作幅度變化,都很難捕捉到穩(wěn)定的特征。基于全局圖像特征的提取和計算并不可取,本方法對圖像中運動目標所在區(qū)域進行局部分析,研究人體動作特征和關(guān)鍵點變化,保證提取特征的有效性。

(2)根據(jù)視覺詞袋模型進行圖像特征提取

圖像可以類比為文檔,即若干個“視覺詞匯”的集合,圖像中的詞匯可以定義為一個圖像塊的特征向量,視覺詞匯相互之間沒有順序,視覺詞袋模型即是“圖像中所有圖像塊的特征向量得到的直方圖”。本發(fā)明利用SIFT變換提取出視覺詞袋的特征矩陣。計算關(guān)鍵點周圍的16*16的窗口中每一個像素的梯度,而且使用高斯下降函數(shù)降低遠離中心的權(quán)重。這樣就可以對每個特征形成一個4*4*8=128維的描述子。

(3)生成圖像特征金字塔進行標準動作圖像分類

用K-means算法對上一步驟獲取的特征矩陣進行聚類,將圖像詞袋特征聚類生成視覺詞典,使用視覺詞典生成特征金字塔。使用詞典表的中詞匯表示圖像,生成直方圖。

本發(fā)明的基于視覺詞袋的人體動作識別方法利用視覺詞典進行預先分類,針對不同的樣本具有較好的識別率,并且計算速度快,可以快速進行大量的人體動作的分類和識別,可用于復雜的人體動作識別系統(tǒng)。

4.附圖說明

圖1是應用本發(fā)明的系統(tǒng)的結(jié)構(gòu)框圖。

5.具體實施方式

下面對本發(fā)明的具體實施方式作進一步詳細的描述。

如圖1所示,本發(fā)明的一種基于視覺詞袋的人體動作識別方法對應的系統(tǒng)包括:圖像預處理,圖像特征提取,視覺詞袋模型構(gòu)建,標準動作圖像庫建立、動作分類和識別。

圖像預處理是把視頻文件進行分幀處理,保留含有關(guān)鍵動作的圖像,提取分類器訓練和最終識別判斷的重要指標。

圖像特征提取采用SIFT變換對預處理過的圖像進行變換,計算出每個點上的特征向量,結(jié)合圖像中的多個關(guān)鍵點,得到圖像的局部不變特征。

視覺詞袋模型構(gòu)建是利用圖像中所有圖像塊的特征向量的直方圖得到的。

標準動作圖像庫建立是根據(jù)不同圖像之間特征矩陣的歐氏距離,把距離最相近的圖像歸為一類,識別的動作有幾類就生成幾個聚類中心,得到幾個標準動作模型。每個動作模型中,包含該動作分類的所有角度的運動圖像。

動作分類和識別包括檢測運動目標、支持向量機建模分類和動作識別。利用提取HOG特征的方法和差分法獲得視頻中是否有人存在并確定人體所在位置,獲得包含目標人體的連續(xù)圖像。支持向量機將提取出的人體姿態(tài)特征映射到高維空間中,支持向量機屬于線性分類器,特點是能夠同時最小化經(jīng)驗誤差與最大化幾何邊緣區(qū)。最終識別結(jié)果是在以上檢測出關(guān)鍵動作序列和標準動作圖像庫基礎(chǔ)上,基于KNN分類算法實現(xiàn)的。

以上實施例僅為本發(fā)明其中的一種實施方式,其描述較為具體,但并不能因此而理解為對本發(fā)明專利范圍的限制。對于本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權(quán)利要求為準。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1