本發(fā)明涉及手勢識別領(lǐng)域,尤其是一種手勢識別方法和系統(tǒng)。
背景技術(shù):
手勢識別是指從包含手勢的單幀圖像或圖像序列中識別手勢類型的過程。通過手勢,不僅可以有效傳遞信息,還可以與環(huán)境進(jìn)行交互。手勢識別廣泛應(yīng)用于人機(jī)交互、手語交互、虛擬現(xiàn)實(shí)、教育輔助等場合。
目前,根據(jù)手勢識別所使用的傳感器形態(tài),手勢識別方法可分為:基于慣性傳感器的識別方法,基于圖像傳感器的識別方法,基于深度信息傳感器的識別方法等。
慣性傳感器在手勢識別中的不足:傳感器輸出為空間三個(gè)方向的重力加速度和角度,但是多種因素均會(huì)影響慣性傳感器的輸出,使之具有相似的輸出,難以區(qū)分。比如,除手掌和前臂之外,身體其他部位的動(dòng)作,也會(huì)產(chǎn)生與手勢相似的傳感器輸出,手勢識別準(zhǔn)確度低。
深度信息傳感器在手勢識別中的不足:1、目前市面上缺少高精度的深度傳感器;2、成本相對其他模態(tài)傳感器成本較高。
而基于圖像傳感器的識別方法,一般是利用手勢圖像序列進(jìn)行手勢識別,手勢圖像序列反映了手勢內(nèi)容和變化過程,但是,通常圖像序列的采集頻率較手勢的變換頻率高出很多,這使得采集得到圖像序列較為冗余,圖像幀之間相似程度較高,運(yùn)算量巨大,處理負(fù)擔(dān)較重;而且利用手勢圖像序列進(jìn)行手勢識別也存在以下難點(diǎn):
A、軌跡時(shí)空分割的不確定性,也即如何界定手勢的起始幀、終止幀和手勢進(jìn)行過程中關(guān)鍵幀;
B、軌跡的時(shí)空變化性,也即同一人在不同時(shí)刻,不同人在不同時(shí)刻做的同一手勢存在幅度、持續(xù)時(shí)長、距離傳感器遠(yuǎn)近不一的特點(diǎn)。
因此,基于圖像傳感器的識別方法實(shí)現(xiàn)比較困難。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種利用圖像序列關(guān)鍵幀實(shí)現(xiàn)高效率手勢識別的手勢識別方法和系統(tǒng)。
本發(fā)明所采用的技術(shù)方案是:一種手勢識別方法,包括以下步驟:
S1、分別對不同手勢的手勢圖像序列進(jìn)行處理,獲取所述手勢圖像序列的多個(gè)關(guān)鍵幀圖像,所述多個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,得到對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合;
S2、根據(jù)所述對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合設(shè)計(jì)分類器;
S3、獲取待識別手勢的手勢圖像序列的關(guān)鍵幀集合,并利用所述分類器對其進(jìn)行手勢識別。
進(jìn)一步地,所述手勢圖像序列的多個(gè)關(guān)鍵幀圖像的獲取方法包括以下步驟:
獲取手勢圖像序列中每幀圖像的信息熵,并將其映射到一個(gè)二維空間坐標(biāo)平面上,構(gòu)成手勢圖像序列的信息熵序列;
從所述二維空間坐標(biāo)平面上的信息熵序列中獲取多個(gè)局部極值點(diǎn),所述局部極值點(diǎn)包括局部極大值和局部極小值;
進(jìn)行密度聚類,獲取所述多個(gè)局部極值點(diǎn)的局部密度,并獲取每個(gè)局部極值點(diǎn)與局部密度比其大的局部極值點(diǎn)之間的最小距離;
獲取所述最大的N個(gè)最小距離所對應(yīng)的圖像幀為關(guān)鍵幀圖像,所述N個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,所述N為預(yù)設(shè)特定數(shù)目。
進(jìn)一步地,所述步驟S2包括以下步驟:
S21、利用特征描述子分別對多個(gè)關(guān)鍵幀集合的多個(gè)關(guān)鍵幀圖像進(jìn)行統(tǒng)一描述實(shí)現(xiàn)特征提取,得到多個(gè)關(guān)鍵幀特征圖集合;
S22、對所述多個(gè)關(guān)鍵幀特征圖集合進(jìn)行編碼;
S23、根據(jù)多個(gè)編碼后的關(guān)鍵幀特征圖集合設(shè)計(jì)分類器。
進(jìn)一步地,所述特征描述子包括SIFT特征描述子、SURF特征描述子、VLBP特征描述子、LBP-TOP特征描述子、SIFT-3D特征描述子、HOG特征描述子、角點(diǎn)描述子或邊緣描述子。
進(jìn)一步地,所述步驟S22中的編碼方法包括詞袋模型。
進(jìn)一步地,所述步驟S23包括以下步驟:
S231、建立手勢類別標(biāo)簽與多個(gè)編碼后的關(guān)鍵幀特征圖集合的對應(yīng)關(guān)系,所述手勢類別標(biāo)簽與多個(gè)編碼后的關(guān)鍵幀特征圖集合構(gòu)成手勢識別訓(xùn)練集;
S232、分類器根據(jù)手勢識別訓(xùn)練集進(jìn)行參數(shù)學(xué)習(xí)以獲取分類器的模型參數(shù)實(shí)現(xiàn)分類器設(shè)計(jì)。
進(jìn)一步地,所述分類器包括支持向量機(jī)分類器、最近鄰分類器或隨機(jī)森林分類器。
本發(fā)明所采用的一種實(shí)施方案是:一種手勢識別系統(tǒng),包括
關(guān)鍵幀集合獲取裝置,用于分別對不同手勢的手勢圖像序列進(jìn)行處理,獲取所述手勢圖像序列的多個(gè)關(guān)鍵幀圖像,所述多個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,得到對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合;
分類器獲取裝置,用于根據(jù)所述對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合設(shè)計(jì)分類器;
手勢識別裝置,用于獲取待識別手勢的手勢圖像序列的關(guān)鍵幀集合,并利用所述分類器對其進(jìn)行手勢識別。
進(jìn)一步地,所述關(guān)鍵幀集合獲取裝置包括
信息熵獲取與映射單元,用于獲取手勢圖像序列中每幀圖像的信息熵,并將其映射到一個(gè)二維空間坐標(biāo)平面上,構(gòu)成手勢圖像序列的信息熵序列;
局部極值點(diǎn)獲取單元,用于從所述二維空間坐標(biāo)平面上的信息熵序列中獲取多個(gè)局部極值點(diǎn),所述局部極值點(diǎn)包括局部極大值和局部極小值;
局部密度與最小距離獲取單元,用于進(jìn)行密度聚類,獲取所述多個(gè)局部極值點(diǎn)的局部密度,并獲取每個(gè)局部極值點(diǎn)與局部密度比其大的局部極值點(diǎn)之間的最小距離;
關(guān)鍵幀集合獲取單元,用于獲取所述最大的N個(gè)最小距離所對應(yīng)的圖像幀為關(guān)鍵幀圖像,所述N個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,所述N為預(yù)設(shè)特定數(shù)目。
進(jìn)一步地,所述分類器獲取裝置包括
關(guān)鍵幀圖像特征提取單元,用于利用特征描述子分別對多個(gè)關(guān)鍵幀集合的多個(gè)關(guān)鍵幀圖像進(jìn)行統(tǒng)一描述實(shí)現(xiàn)特征提取,得到多個(gè)關(guān)鍵幀特征圖集合;
關(guān)鍵幀圖像特征編碼單元,用于對所述多個(gè)關(guān)鍵幀特征圖集合進(jìn)行編碼;
分類器獲取單元,用于根據(jù)多個(gè)編碼后的關(guān)鍵幀特征圖集合設(shè)計(jì)分類器。
本發(fā)明的有益效果是:本發(fā)明一種手勢識別方法和系統(tǒng),利用關(guān)鍵幀集合代替整個(gè)手勢圖像序列進(jìn)行手勢識別,可以極大的降低手勢識別時(shí)需要處理的數(shù)據(jù)量,便于處理和存儲(chǔ);進(jìn)而便于后續(xù)環(huán)節(jié)處理,極大的減小了手勢識別時(shí)的計(jì)算量,提高了手勢識別時(shí)整體的處理效率和實(shí)時(shí)性。
另外,由于使用了信息熵,從信息論的角度看,這個(gè)過程對于原始數(shù)據(jù)的信息量并沒有較明顯的降低,以盡可能小的數(shù)據(jù)量保留了盡可能大的信息量,從而加快了識別的處理過程。
附圖說明
下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式作進(jìn)一步說明:
圖1是本發(fā)明中一種手勢識別方法的步驟流程圖;
圖2是本發(fā)明中一種手勢識別系統(tǒng)的示意圖。
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。
一種手勢識別方法,參考圖1,圖1是本發(fā)明中一種手勢識別方法的步驟流程圖,包括以下步驟:
S1、分別對不同手勢的手勢圖像序列進(jìn)行處理,獲取手勢圖像序列的多個(gè)關(guān)鍵幀圖像,多個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,得到對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合;
S2、根據(jù)對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合設(shè)計(jì)分類器;
S3、獲取待識別手勢的手勢圖像序列的關(guān)鍵幀集合,并利用分類器對其進(jìn)行手勢識別。
關(guān)鍵幀集合是指能夠最大程度的表示該圖像序列內(nèi)容的圖像幀構(gòu)成的集合,其能夠反映手勢運(yùn)動(dòng)過程重要節(jié)點(diǎn)和主要內(nèi)容,它包含了手勢運(yùn)動(dòng)過程中的速度變化、停頓、換向、手型旋轉(zhuǎn)等具有代表性的狀態(tài)變化。本發(fā)明一種手勢識別方法,利用關(guān)鍵幀集合代替整個(gè)手勢圖像序列進(jìn)行手勢識別,可以極大的降低手勢識別時(shí)需要處理的數(shù)據(jù)量,便于處理和存儲(chǔ);進(jìn)而便于后續(xù)環(huán)節(jié)處理,極大的減小了手勢識別時(shí)的計(jì)算量,提高了手勢識別時(shí)整體的處理效率和實(shí)時(shí)性。另外,選擇圖像傳感器實(shí)現(xiàn)手勢識別,圖像傳感器的成本低;而且相比于慣性和深度信息傳感器,圖像相關(guān)的處理方法較為成熟,手勢識別的可靠性高。
作為技術(shù)方案的進(jìn)一步改進(jìn),手勢圖像序列的多個(gè)關(guān)鍵幀圖像的獲取方法包括以下步驟:
首先,獲取手勢圖像序列中每幀圖像的信息熵,并將其映射到一個(gè)二維空間坐標(biāo)平面上,構(gòu)成手勢圖像序列的信息熵序列。假設(shè)一個(gè)包含n幀的手勢圖像序列V中的每一幀圖像可以用fi來表示,其中i=1,2,...,n,關(guān)鍵幀集合可表示為:SKeyframes=fKeyframes(V),其中fKeyframes表示關(guān)鍵幀集合的提取操作。由于信息熵依賴于上下文的測量,因此信息熵能夠代表一組數(shù)據(jù)的雜質(zhì)或者不可預(yù)知性。對于單一的一幀圖像fi,它的灰度分布可以表示成p={p1,p2,...,pn},這幀圖像的信息熵定義為:其中為通過歸一化灰色像素強(qiáng)度直方圖得到的fi的概率密度分布函數(shù);根據(jù)上述方法得到手勢圖像序列的多個(gè)信息熵,將多個(gè)信息熵E(fi)映射到一個(gè)二維空間坐標(biāo)平面上。由于使用了信息熵,從信息論的角度看,這個(gè)過程對于原始數(shù)據(jù)的信息量并沒有較明顯的降低,以盡可能小的數(shù)據(jù)量保留了盡可能大的信息量,從而加快了識別的處理過程。
接著,從上述的二維空間坐標(biāo)平面上的信息熵序列中獲取多個(gè)局部極值點(diǎn),局部極值點(diǎn)包括局部極大值和局部極小值。局部極大值可以通過下面公式得到:同樣,局部極小值可以通過下面公式得到:其中i=1,2,...,n。將多個(gè)局部極大值和多個(gè)局部極小值聯(lián)合起來,得到多個(gè)局部極值點(diǎn)Pextreme:Pextreme=Pmax∪Pmin。
接著,進(jìn)行密度聚類,獲取多個(gè)局部極值點(diǎn)的局部密度,并獲取每個(gè)局部極值點(diǎn)與局部密度比其大的局部極值點(diǎn)之間的最小距離。
用于密度聚類的數(shù)據(jù)具有以下分布特點(diǎn):1、聚類中心被一群比它密度低的點(diǎn)群包圍;2、密度相對較高的點(diǎn)與另外密度相對較高的點(diǎn)之間的距離相對較遠(yuǎn)。密度聚類相比于傳統(tǒng)的聚類方法(比如Kmeans)能夠更好的捕獲二維空間的數(shù)據(jù)結(jié)構(gòu)。這種數(shù)據(jù)分布的特點(diǎn)正好符合上述局部極值點(diǎn)分布的特點(diǎn)。對于每個(gè)局部極值點(diǎn)Pextreme,接下來用Pk代表某一局部極值點(diǎn),分別計(jì)算兩個(gè)量,一個(gè)是局部極值點(diǎn)Pk的局部密度以及局部極值點(diǎn)Pk與比它局部密度大的局部極值點(diǎn)之間的最小距離
局部極值點(diǎn)Pk的局部密度定義為:其中,時(shí),其他情況,dc表示截?cái)嗑嚯x,Pl表示除局部極值點(diǎn)Pk之外的其他局部極值點(diǎn)。實(shí)際上,截?cái)嗑嚯xdc作為閾值,用于界定所處的范圍,在dc之內(nèi)的局部極值點(diǎn)構(gòu)成一個(gè)集合,在dc之外的局部極值點(diǎn)構(gòu)成另一個(gè)集合,這兩個(gè)集合的邊界是根據(jù)dc決定的。在實(shí)際使用中,dc的取值根據(jù)實(shí)驗(yàn)效果和經(jīng)驗(yàn)決定,通常不大于20?;旧希植繕O值點(diǎn)Pk的局部密度等于離局部極值點(diǎn)Pk的距離接近dc的局部極值點(diǎn)的個(gè)數(shù);該算法僅僅對不同局部極值點(diǎn)Pk的局部密度的相對大小敏感,局部密度實(shí)際上是一個(gè)統(tǒng)計(jì)值,它統(tǒng)計(jì)了所有小于dc的局部極值點(diǎn)個(gè)數(shù),經(jīng)過局部密度計(jì)算,所有局部極值點(diǎn)增加了各自的局部密度屬性。僅僅通過計(jì)算局部極值點(diǎn)Pk與其他任意比Pk局部密度高的局部極值點(diǎn)之間的最小距離來衡量,經(jīng)過計(jì)算所有數(shù)據(jù)點(diǎn)又增加了一種屬性和這兩個(gè)量僅僅依賴于局部極值點(diǎn)之間的距離
最后,獲取最大的N個(gè)最小距離所對應(yīng)的圖像幀為關(guān)鍵幀圖像,N個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,N為預(yù)設(shè)特定數(shù)目。根據(jù)各個(gè)局部極值點(diǎn)的選擇最大的N個(gè)所對應(yīng)的局部極值點(diǎn)構(gòu)成集合,這個(gè)集合所對應(yīng)的圖像幀集合即是手勢圖像序列的關(guān)鍵幀集合。
進(jìn)一步地,采用上述的圖像序列的多個(gè)關(guān)鍵幀圖像的獲取方法,得到對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合,接著利用多個(gè)關(guān)鍵幀集合設(shè)計(jì)分類器,具體包括以下步驟:
S21、利用特征描述子分別對多個(gè)關(guān)鍵幀集合的多個(gè)關(guān)鍵幀圖像進(jìn)行統(tǒng)一描述實(shí)現(xiàn)特征提取,得到多個(gè)關(guān)鍵幀特征圖集合;關(guān)鍵幀圖像的特征提取用于建立對關(guān)鍵幀圖像的描述,選取感興趣區(qū)域,利用特征描述子對這些區(qū)域進(jìn)行統(tǒng)一描述,得到關(guān)鍵幀圖像對應(yīng)的特征圖;可以采用的特征描述子包括SIFT特征描述子、SURF特征描述子、VLBP特征描述子、LBP-TOP特征描述子、SIFT-3D特征描述子、HOG特征描述子、角點(diǎn)描述子或邊緣描述子;
S22、對多個(gè)關(guān)鍵幀特征圖集合進(jìn)行編碼;關(guān)鍵幀圖像的特征編碼用于將經(jīng)過特征描述子描述的關(guān)鍵幀特征圖轉(zhuǎn)化為統(tǒng)一格式的編碼形式,方便后續(xù)環(huán)節(jié)統(tǒng)一開展分類器學(xué)習(xí)和識別;常用的編碼方法包括但不限于詞袋模型(Bag of words);
S23、根據(jù)多個(gè)編碼后的關(guān)鍵幀特征圖集合設(shè)計(jì)分類器。
進(jìn)一步地,步驟S23包括以下步驟:
S231、建立手勢類別標(biāo)簽與多個(gè)編碼后的關(guān)鍵幀特征圖集合的對應(yīng)關(guān)系,手勢類別標(biāo)簽與多個(gè)編碼后的關(guān)鍵幀特征圖集合構(gòu)成手勢識別訓(xùn)練集;
S232、分類器根據(jù)手勢識別訓(xùn)練集進(jìn)行參數(shù)學(xué)習(xí)以獲取分類器的模型參數(shù)實(shí)現(xiàn)分類器設(shè)計(jì)。
進(jìn)一步地,上述分類器包括支持向量機(jī)分類器、最近鄰分類器或隨機(jī)森林分類器。
下面以支持向量機(jī)(SVM,Support Vector Machine)分類器為例,具體說明分類器的設(shè)計(jì)過程和手勢識別的過程:
在實(shí)驗(yàn)數(shù)據(jù)的采集過程中,記錄當(dāng)前被試的不同手勢類型(畫直線、畫圓圈、畫波浪線,畫對勾、畫叉號等)對應(yīng)的手勢圖像序列,并建立實(shí)驗(yàn)數(shù)據(jù)即不同手勢圖像序列與手勢類別標(biāo)簽之間的對應(yīng)關(guān)系,手勢類別標(biāo)簽可以為0、1、2、3、4…;可以進(jìn)行多人多次重復(fù)實(shí)驗(yàn),根據(jù)手勢圖像序列得到相應(yīng)的關(guān)鍵幀集合,關(guān)鍵幀集合經(jīng)過特征提取和特征編碼后的數(shù)據(jù)連同手勢類別標(biāo)簽一起構(gòu)成手勢識別訓(xùn)練集,用于訓(xùn)練SVM分類器,得到SVM分類器的模型參數(shù)。具體訓(xùn)練SVM分類器的過程如下:1)將實(shí)驗(yàn)數(shù)據(jù)提取的特征進(jìn)行歸一化操作,即關(guān)鍵幀集合獲取、特征提取和特征編碼;2)連同手勢類別標(biāo)簽一起送入SVM分類器進(jìn)行參數(shù)學(xué)習(xí)用以得到手勢識別分類器的具體模型參數(shù)。本發(fā)明使用的LIBSVM軟件進(jìn)行SVM分類器學(xué)習(xí)和手勢識別,得到的模型參數(shù)被自動(dòng)存儲(chǔ)為train.scale.model文件,該文件包含利用LIBSVM軟件進(jìn)行手勢預(yù)測所需要的參數(shù):nr_class代表訓(xùn)練樣本集包含的類別個(gè)數(shù),rho是判決函數(shù)的常數(shù)項(xiàng)b,nr_sv是各個(gè)類中落在邊界上的向量個(gè)數(shù),obj是對SVM問題的優(yōu)化目標(biāo)函數(shù)的值,nSV是支持向量的個(gè)數(shù),nBSV是邊界支持向量的個(gè)數(shù)。
得到SVM分類器的模型參數(shù)之后,對于待識別的手勢圖像序列,先獲取待識別的手勢圖像序列的關(guān)鍵幀集合,再進(jìn)行特征提取和特征編碼后,送入SVM分類器進(jìn)行識別,SVM分類器根據(jù)上述獲取得到的模型參數(shù),對待識別的手勢進(jìn)行手勢類別標(biāo)簽預(yù)測。
一種手勢識別系統(tǒng),參考圖2,圖2是本發(fā)明中一種手勢識別系統(tǒng)的示意圖,包括
關(guān)鍵幀集合獲取裝置,用于分別對不同手勢的手勢圖像序列進(jìn)行處理,獲取手勢圖像序列的多個(gè)關(guān)鍵幀圖像,多個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,得到對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合;
分類器獲取裝置,用于根據(jù)對應(yīng)不同手勢的多個(gè)關(guān)鍵幀集合設(shè)計(jì)分類器;
手勢識別裝置,用于獲取待識別手勢的手勢圖像序列的關(guān)鍵幀集合,并利用分類器對其進(jìn)行手勢識別。
本發(fā)明一種手勢識別系統(tǒng),利用關(guān)鍵幀集合代替整個(gè)手勢圖像序列進(jìn)行手勢識別,可以極大的降低手勢識別時(shí)需要處理的數(shù)據(jù)量,便于處理和存儲(chǔ);進(jìn)而便于后續(xù)環(huán)節(jié)處理,極大的減小了手勢識別時(shí)的計(jì)算量,提高了手勢識別時(shí)整體的處理效率和實(shí)時(shí)性。另外,選擇圖像傳感器實(shí)現(xiàn)手勢識別,圖像傳感器的成本低;而且相比于慣性和深度信息傳感器,圖像相關(guān)的處理方法較為成熟,手勢識別的可靠性高。手勢識別系統(tǒng)的具體工作過程如上述手勢識別方法的具體描述,不再贅述。
進(jìn)一步地,關(guān)鍵幀集合獲取裝置包括
信息熵獲取與映射單元,用于獲取手勢圖像序列中每幀圖像的信息熵,并將其映射到一個(gè)二維空間坐標(biāo)平面上,構(gòu)成手勢圖像序列的信息熵序列;由于使用了信息熵,從信息論的角度看,這個(gè)過程對于原始數(shù)據(jù)的信息量并沒有較明顯的降低,以盡可能小的數(shù)據(jù)量保留了盡可能大的信息量,從而加快了手勢識別系統(tǒng)的處理過程;
局部極值點(diǎn)獲取單元,用于從二維空間坐標(biāo)平面上的信息熵序列中獲取多個(gè)局部極值點(diǎn),局部極值點(diǎn)包括局部極大值和局部極小值;
局部密度與最小距離獲取單元,用于進(jìn)行密度聚類,獲取多個(gè)局部極值點(diǎn)的局部密度,并獲取每個(gè)局部極值點(diǎn)與局部密度比其大的局部極值點(diǎn)之間的最小距離;
關(guān)鍵幀集合獲取單元,用于獲取最大的N個(gè)最小距離所對應(yīng)的圖像幀為關(guān)鍵幀圖像,N個(gè)關(guān)鍵幀圖像組成關(guān)鍵幀集合,N為預(yù)設(shè)特定數(shù)目。
關(guān)鍵幀集合獲取裝置的具體工作過程如上述關(guān)鍵幀集合的獲取方法的具體描述,不再贅述。
進(jìn)一步地,分類器獲取裝置包括
關(guān)鍵幀圖像特征提取單元,用于利用特征描述子分別對多個(gè)關(guān)鍵幀集合的多個(gè)關(guān)鍵幀圖像進(jìn)行統(tǒng)一描述實(shí)現(xiàn)特征提取,得到多個(gè)關(guān)鍵幀特征圖集合;
關(guān)鍵幀圖像特征編碼單元,用于對多個(gè)關(guān)鍵幀特征圖集合進(jìn)行編碼;
分類器獲取單元,用于根據(jù)多個(gè)編碼后的關(guān)鍵幀特征圖集合設(shè)計(jì)分類器。
分類器獲取裝置的具體工作過程如上述設(shè)計(jì)分類器的實(shí)現(xiàn)方法的具體描述,不再贅述。
以上是對本發(fā)明的較佳實(shí)施進(jìn)行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實(shí)施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權(quán)利要求所限定的范圍內(nèi)。