一種用于建立動(dòng)作識(shí)別模型的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)動(dòng)作分析領(lǐng)域,具體涉及一種用于建立動(dòng)作識(shí)別模型的方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 從圖像序列中識(shí)別出人體動(dòng)作是模式識(shí)別、人機(jī)交互領(lǐng)域的一個(gè)基礎(chǔ)問題,近些 年得到了越來越多的關(guān)注并且取得了巨大的進(jìn)展。人體動(dòng)作識(shí)別在人機(jī)交互、醫(yī)療保健、視 頻監(jiān)控和娛樂設(shè)備等方面具有非常廣泛的應(yīng)用。根據(jù)輸入數(shù)據(jù)的不同,現(xiàn)有的動(dòng)作識(shí)別算 法可以分為基于深度圖的算法和基于3D骨架的算法。
[0003] 基于深度圖的算法以場(chǎng)景的深度圖序列作為輸入數(shù)據(jù)進(jìn)行動(dòng)作識(shí)別。對(duì)深度圖進(jìn) 行前景分割得到人體部分,通過對(duì)人體深度圖提取特征進(jìn)行模式匹配,從而識(shí)別人體動(dòng)作。 然而該算法的識(shí)別準(zhǔn)確率嚴(yán)重依賴于深度圖的精度和完整性,如果深度信息噪聲太大或者 人體部分有缺失,則會(huì)嚴(yán)重影響識(shí)別的準(zhǔn)確率。同時(shí),由于該算法需要在深度圖上進(jìn)行特征 提取,其時(shí)間復(fù)雜度會(huì)很高。
[0004] 基于3D骨架的算法則采用了人體骨架的3D位置作為輸入數(shù)據(jù)進(jìn)行動(dòng)作識(shí)別。人 體骨架是由人體的多個(gè)關(guān)節(jié)點(diǎn)(如肩、手肘、膝蓋等)及其連接構(gòu)成的人體模型,而人體動(dòng) 作可以通過骨架的3D位置運(yùn)動(dòng)來精確地描述。目前人體骨架已經(jīng)可以通過姿勢(shì)識(shí)別算法 實(shí)時(shí)可靠地從深度圖中提取出來。由于骨架的有效性和簡(jiǎn)潔性,基于3D骨架的算法可以大 大減小噪聲的影響,同時(shí)也降低了時(shí)間復(fù)雜度。對(duì)基于3D骨架所提取的特征,有些算法使 用最近鄰方法來進(jìn)行模式匹配。其缺點(diǎn)是沒有考慮幀序列的時(shí)間關(guān)系,從而使得動(dòng)作的識(shí) 別準(zhǔn)確率較低。
[0005] 近些年,圖模型被廣泛應(yīng)用在模式識(shí)別的各個(gè)領(lǐng)域,由于其可以將動(dòng)作的狀態(tài)跳 轉(zhuǎn)建模為有向圖的結(jié)點(diǎn)及邊,對(duì)于動(dòng)作的描述非常有效,所以被應(yīng)用在動(dòng)作識(shí)別領(lǐng)域。與此 同時(shí),很多算法在提取特征時(shí)沒有考慮動(dòng)作的局部性,將骨架的全部關(guān)節(jié)點(diǎn)用于特征提取, 從而導(dǎo)致對(duì)于相似動(dòng)作的識(shí)別準(zhǔn)確率較低。有技術(shù)人員在《光學(xué)儀器與技術(shù)》國(guó)際會(huì)議上 提出一種層級(jí)模型的算法。該算法將骨架節(jié)點(diǎn)分為5個(gè)部件,根據(jù)動(dòng)作與5個(gè)部件的相關(guān) 程度手動(dòng)地將動(dòng)作劃分為幾個(gè)大類,從而將動(dòng)作識(shí)別轉(zhuǎn)化為兩層的決策過程。其中第一層 決定動(dòng)作所屬大類,第二層再最終判定動(dòng)作類別,并且在第二層中只從相關(guān)的關(guān)節(jié)點(diǎn)提取 特征,因此識(shí)別準(zhǔn)確率有所提高。但該算法是通過人工干預(yù)進(jìn)行聚類,不具有推廣性。
【發(fā)明內(nèi)容】
[0006] 針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供了一種用于建立動(dòng)作識(shí)別模型的方法及系 統(tǒng),該方法通過獲取每個(gè)動(dòng)作個(gè)體的特征向量,以實(shí)現(xiàn)所有動(dòng)作樣本的自動(dòng)聚類,具有推廣 性尚的優(yōu)點(diǎn)。
[0007] 本發(fā)明提出了一種用于建立動(dòng)作識(shí)別模型的方法,其特征在于,包括:
[0008] 獲取動(dòng)作樣本的骨架位置序列,根據(jù)所述骨架位置序列獲取每個(gè)動(dòng)作個(gè)體中各節(jié) 點(diǎn)的坐標(biāo),所述骨架位置序列中包括多個(gè)節(jié)點(diǎn);
[0009] 根據(jù)各節(jié)點(diǎn)的坐標(biāo)獲取每個(gè)動(dòng)作個(gè)體的特征向量,并根據(jù)所述特征向量,獲取多 個(gè)動(dòng)作大類以及各動(dòng)作大類的動(dòng)作特征;
[0010] 根據(jù)所述動(dòng)作特征,建立各動(dòng)作大類的動(dòng)作識(shí)別模型。
[0011] 可選的,所述根據(jù)每個(gè)動(dòng)作個(gè)體的特征向量,獲取多個(gè)動(dòng)作大類以及各動(dòng)作大類 的動(dòng)作特征,包括:
[0012] 根據(jù)所述特征向量,對(duì)所有動(dòng)作個(gè)體進(jìn)行聚類,獲取多個(gè)動(dòng)作大類;
[0013] 根據(jù)所述特征向量,獲取與每個(gè)動(dòng)作個(gè)體相關(guān)的節(jié)點(diǎn),并根據(jù)與每個(gè)動(dòng)作個(gè)體相 關(guān)的節(jié)點(diǎn)的坐標(biāo),獲取各動(dòng)作大類的動(dòng)作特征。
[0014] 可選的,所述根據(jù)所述動(dòng)作特征,建立各動(dòng)作大類的動(dòng)作識(shí)別模型,包括:
[0015] 根據(jù)所述動(dòng)作特征,對(duì)各動(dòng)作大類中的所有動(dòng)作個(gè)體進(jìn)行聚類,獲取各動(dòng)作大類 的多個(gè)動(dòng)作狀態(tài);
[0016] 并根據(jù)各動(dòng)作大類的所有動(dòng)作狀態(tài)建立各動(dòng)作大類的動(dòng)作識(shí)別模型。
[0017] 可選的,在根據(jù)所述動(dòng)作特征,建立各動(dòng)作大類的動(dòng)作識(shí)別模型之后,還包括:
[0018] 獲取待識(shí)別動(dòng)作的骨架位置序列,根據(jù)所述骨架位置序列獲取各節(jié)點(diǎn)的坐標(biāo);
[0019] 根據(jù)各節(jié)點(diǎn)的坐標(biāo)獲取所述待識(shí)別動(dòng)作的特征向量和動(dòng)作特征;
[0020] 根據(jù)所述特征向量,在所述動(dòng)作識(shí)別模型中獲取與所述待識(shí)別動(dòng)作對(duì)應(yīng)的動(dòng)作識(shí) 別模型,并根據(jù)所述動(dòng)作特征和所述動(dòng)作識(shí)別模型,獲取所述待識(shí)別動(dòng)作的動(dòng)作種類。
[0021] 可選的,所述根據(jù)所述動(dòng)作特征和所述動(dòng)作識(shí)別模型,獲取所述待識(shí)別動(dòng)作的動(dòng) 作種類,包括:
[0022] 根據(jù)所述動(dòng)作特征,通過所述動(dòng)作識(shí)別模型,對(duì)所述待識(shí)別動(dòng)作與所述動(dòng)作大類 中的所有動(dòng)作個(gè)體進(jìn)行模型匹配,并根據(jù)匹配結(jié)果獲取與所述待識(shí)別動(dòng)作匹配度最高的動(dòng) 作個(gè)體以及所述動(dòng)作個(gè)體的動(dòng)作種類。
[0023] 本發(fā)明還提供了一種用于建立動(dòng)作識(shí)別模型的系統(tǒng),其特征在于,包括:
[0024] 第一獲取模塊,用于獲取動(dòng)作樣本的骨架位置序列,根據(jù)所述骨架位置序列獲取 每個(gè)動(dòng)作個(gè)體中各節(jié)點(diǎn)的坐標(biāo),所述骨架位置序列中包括多個(gè)節(jié)點(diǎn);
[0025] 第二獲取模塊,用于根據(jù)各節(jié)點(diǎn)的坐標(biāo)獲取每個(gè)動(dòng)作個(gè)體的特征向量,并根據(jù)所 述特征向量,獲取多個(gè)動(dòng)作大類以及各動(dòng)作大類的動(dòng)作特征;
[0026] 建立模塊,用于根據(jù)所述動(dòng)作特征,建立各動(dòng)作大類的動(dòng)作識(shí)別模型。
[0027] 可選的,所述第二獲取模塊還用于:
[0028] 根據(jù)所述特征向量,對(duì)所有動(dòng)作個(gè)體進(jìn)行聚類,獲取多個(gè)動(dòng)作大類;
[0029] 根據(jù)所述特征向量,獲取與每個(gè)動(dòng)作個(gè)體相關(guān)的節(jié)點(diǎn),并根據(jù)與每個(gè)動(dòng)作個(gè)體相 關(guān)的節(jié)點(diǎn)的坐標(biāo),獲取各動(dòng)作大類的動(dòng)作特征。
[0030] 可選的,所述建立模塊還用于:
[0031] 根據(jù)所述動(dòng)作特征,對(duì)各動(dòng)作大類中的所有動(dòng)作個(gè)體進(jìn)行聚類,獲取各動(dòng)作大類 的多個(gè)動(dòng)作狀態(tài);
[0032] 并根據(jù)各動(dòng)作大類的所有動(dòng)作狀態(tài)建立各動(dòng)作大類的動(dòng)作識(shí)別模型。
[0033] 可選的,還包括:
[0034] 第三獲取模塊,用于在建立各動(dòng)作大類的動(dòng)作識(shí)別模型之后,獲取待識(shí)別動(dòng)作的 骨架位置序列,根據(jù)所述骨架位置序列獲取各節(jié)點(diǎn)的坐標(biāo);
[0035] 第四獲取模塊,用于根據(jù)各節(jié)點(diǎn)的坐標(biāo)獲取所述待識(shí)別動(dòng)作的特征向量和動(dòng)作特 征;
[0036] 第五獲取模塊,用于根據(jù)所述特征向量,在所述動(dòng)作識(shí)別模型中獲取與所述待識(shí) 別動(dòng)作對(duì)應(yīng)的動(dòng)作識(shí)別模型,并根據(jù)所述動(dòng)作特征和所述動(dòng)作識(shí)別模型,獲取所述待識(shí)別 動(dòng)作的動(dòng)作種類。
[0037] 可選的,所述第五獲取模塊還用于:
[0038] 根據(jù)所述動(dòng)作特征,通過所述動(dòng)作識(shí)別模型,對(duì)所述待識(shí)別動(dòng)作與所述動(dòng)作大類 中的所有動(dòng)作個(gè)體進(jìn)行模型匹配,并根據(jù)匹配結(jié)果獲取與所述待識(shí)別動(dòng)作匹配度最高的動(dòng) 作個(gè)體以及所述動(dòng)作個(gè)體的動(dòng)作種類。
[0039] 由上述技術(shù)方案可知,本發(fā)明提出的用于建立動(dòng)作識(shí)別模型的方法通過獲取每個(gè) 動(dòng)作個(gè)體的特征向量,以實(shí)現(xiàn)所有動(dòng)作樣本的自動(dòng)聚類,與現(xiàn)有技術(shù)的人工干預(yù)進(jìn)行聚類 相比,具有提高推廣性的優(yōu)點(diǎn)。
【附圖說明】
[0040] 通過參考附圖會(huì)更加清楚的理解本發(fā)明的特征和優(yōu)點(diǎn),附圖是示意性的而不應(yīng)理 解為對(duì)本發(fā)明進(jìn)行任何限制,在附圖中:
[0041] 圖1示出了本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的流程示意圖;
[0042] 圖2示出了本發(fā)明另一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的流程示意圖;
[0043] 圖3示出了本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的人體骨架圖;
[0044] 圖4示出了本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的聚類結(jié)果;
[0045] 圖5示出了本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的動(dòng)作識(shí)別模型示 意圖。
[0046] 圖6示出了本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的系統(tǒng)的結(jié)構(gòu)示意圖;
[0047] 圖7示出了本發(fā)明另一實(shí)施例提供的用于建立動(dòng)作識(shí)別的系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0048] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明的一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人 員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0049] 圖1為本發(fā)明一實(shí)施例提供的用于建立動(dòng)作識(shí)別的方法的流程示意圖