一種基于加速度傳感器的手勢識別方法
【專利摘要】一種基于加速度傳感器的手勢識別方法,包括下述操作步驟:自動采集手勢加速度數(shù)據(jù)、預(yù)處理、計算所有手勢樣本數(shù)據(jù)的相似度來得到相似度矩陣、提取手勢模板、利用手勢模板構(gòu)建手勢字典、采用MSAMP算法對待識別手勢樣本數(shù)據(jù)進行稀疏重構(gòu)和手勢分類。本發(fā)明將壓縮感知技術(shù)與傳統(tǒng)DTW算法相結(jié)合,提高了手勢識別對不同手勢習(xí)慣的適應(yīng)性;其中的多種預(yù)處理方法,提高了本發(fā)明手勢識別方法實用性。另外,還提出了手勢加速度數(shù)據(jù)的自動采集算法,免除了傳統(tǒng)手勢采集的額外操作,提高用戶體驗。本發(fā)明不需專用傳感器,在搭載有加速度傳感器的終端上都能使用,硬件適應(yīng)性能良好,增強了識別方法的實用性。且坐標(biāo)系統(tǒng)一,能夠適應(yīng)多種不同的手勢習(xí)慣。
【專利說明】一種基于加速度傳感器的手勢識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于運動傳感器的手勢識別技術(shù),確切地說,涉及一種基于加速度傳感器的手勢識別方法,屬于模式識別與人機交互的【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]人機交互是研究人和計算機及其兩者之間相互影響的技術(shù),研究人與計算機通過人機界面進行某種形式的信息交流、以完成特定任務(wù)的過程。隨著計算機硬件的快速發(fā)展,機器的計算能力越來越強大,可用資源也越來越豐富,人的體態(tài)與心理感受都已經(jīng)成了設(shè)計需要考慮的重要問題。人機交互正在逐漸擺脫以計算機為中心的交互模式,而向以人為中心的交互模式發(fā)展;利于用戶自然、自由地交互方式,已成為人機交互的發(fā)展趨勢。
[0003]手勢是一種人們經(jīng)常使用的交流方式,在人機交互方面,相較于傳統(tǒng)的鍵盤和鼠標(biāo),手勢的動作與其設(shè)計更加自由,使用上也更加靈活、直觀,在用戶體驗上更加符合人類的交流習(xí)慣。因此,手勢識別技術(shù)已經(jīng)成為人機交互領(lǐng)域中興起方艾的前沿研究方向之一。
[0004]在人機交互中,基于手勢的交互模式具有以下幾點優(yōu)勢:1、手勢識別直接以人手的自然動作作為輸入,與語音識別等交互手段相比較,省卻了中間媒介,降低了背景環(huán)境對識別效果的影響。2、豐富了手持設(shè)備的應(yīng)用場景,可以與虛擬現(xiàn)實技術(shù)相結(jié)合。3、為智能機器人的設(shè)計提供了一種創(chuàng)新思路。
[0005]現(xiàn)在的手勢識別技術(shù)根據(jù)其不同的輸入設(shè)備可以分為兩種:基于視覺圖像的識別技術(shù)和基于運動傳感器的識別技術(shù)。其中,基于視覺圖像的手勢識別主要通過攝像頭等設(shè)備采集人手動作的圖像信息,該技術(shù)起步早,理論研究比較成熟,其識別的成功率和算法的復(fù)雜度都比較理想;但是,其缺點是對設(shè)備要求高、資金投入大、對環(huán)境的依賴性較高,需要充足均勻的背景光源,從而使得基于圖像的手勢識別不能應(yīng)用于復(fù)雜環(huán)境中,實際應(yīng)用效果不佳。
[0006]基于運動傳感器的手勢識別主要通過加速度傳感器、三軸陀螺儀、磁場傳感器或方向傳感器等多種傳感器采集人手的空中姿態(tài)及其運動數(shù)據(jù),再通過建立模型、匹配模板、構(gòu)建神經(jīng)網(wǎng)絡(luò)等算法完成對手勢的分類識別?;谶\動傳感器的手勢識別技術(shù)由于其具有受外部環(huán)境(光線、背景)的影響較小,魯棒性較好等優(yōu)點,得到了愈來愈多的關(guān)注。
[0007]基于加速度傳感器的手勢識別技術(shù)具有重要的意義,該技術(shù)豐富了人機交互領(lǐng)域的內(nèi)容,改善了用戶的操作體驗,有效促進了人和機器間自由、自然的交互方式。
[0008]下面簡要說明手勢識別相關(guān)【技術(shù)領(lǐng)域】中的術(shù)語涵義:
[0009]DTff(Dynamic Time Warping):動態(tài)時間規(guī)整,該算法通過指定的非線性規(guī)整函數(shù)對時域波形建模,再利用彎曲其中一個模型的時間軸,使其與另一個模型達到最大程度的重疊,從而消除兩個模型間的時域長度差異。
[0010]AP (Affinity Propagation):親和傳播,2007 年由 Dueck 等人發(fā)表于 Science 期刊上的一種新的聚類算法,其基本思想是:將所有訓(xùn)練樣本都視為潛在的模板,通過樣本間相互傳遞“消息”尋找最優(yōu)樣本集合,使得所有樣本到達其最近模板的相似度之和最大。[0011]壓縮感知理論:2006年,華裔科學(xué)家T.Tao等人在相關(guān)研究的基礎(chǔ)上正式提出的一種新的信息獲取理論,該理論突破了奈奎斯特采樣定理所要求的采樣頻率必須不低于信號帶寬2倍的限制,在原始信號是可壓縮或稀疏的前提下,可以用遠(yuǎn)低于上述要求的采樣速率進行數(shù)據(jù)采樣,并采用合適的重構(gòu)算法以極高的概率精確恢復(fù)出原始信號。壓縮感知理論已經(jīng)在生物傳感、醫(yī)療成像和人臉識別等【技術(shù)領(lǐng)域】展現(xiàn)出廣闊的應(yīng)用前景。
[0012]SAMP (Sparsity Adaptive Matching Pursuit):稀疏度自適應(yīng)匹配追蹤,該算法是一種匹配追蹤系列算法,其最大特點是對信號稀疏度的自適應(yīng)性,能夠在待還原信號的準(zhǔn)確稀疏度尚未獲知時,通過固定步長的增長來逼近原始信號的稀疏表示。
[0013]MSAMP (Modified Sparsity Adaptive Matching Pursuit):改進的稀疏度自適應(yīng)正交匹配追蹤,該算法是本發(fā)明基于現(xiàn)有的SAMP算法,針對手勢識別的特點,對支撐集增長步長、支撐集挑選原則和迭代終止條件進行改進而提出的一種更適合手勢識別的改進算法。
[0014]失真補償:本發(fā)明針對加速度傳感器采樣幅值上限所引起的波形失真問題,提出的一種補償還原方法。
[0015]平滑濾波:用于對一組非平穩(wěn)的數(shù)據(jù),在適當(dāng)長度的小區(qū)間上可視為接近平穩(wěn)的處理方法;在該區(qū)間里,對數(shù)據(jù)做局部平均,以減少人手抖動等問題造成的隨機噪聲。再以這種小區(qū)間為窗口在整組數(shù)據(jù)上進行移動,不斷進行局部平均,就能夠得到較為平滑的數(shù)據(jù)曲線。
[0016]重采樣:根據(jù)一類象元的信息內(nèi)插得到另一類象元信息的過程,常見的方法有線性內(nèi)插法、最鄰近內(nèi)插法和三次卷積法內(nèi)插等。本發(fā)明采用線性內(nèi)插法,其基本思想是:假設(shè)兩個已知數(shù)據(jù)間的變化規(guī)律是線性的,根據(jù)這兩點間的線性關(guān)系計算需要內(nèi)插的點。
[0017]歸一化:一種簡化計算的方式,即通過某種變換將有量綱的表達式化為無量綱的表達式,成為純量。
[0018]再介紹與本發(fā)明手勢識別方法相關(guān)的幾種技術(shù)的涵義和狀況:
[0019](I)模板匹配:一種簡單的識別技術(shù),其核心思想是將輸入的待識別數(shù)據(jù)和預(yù)先存儲的模板(即核心樣本)進行匹配,通過測量兩者之間的相似度來完成識別任務(wù)。常用的計算模板之間相似度的算法有:對數(shù)距離法、歐氏距離法、加權(quán)歐氏距離法、相關(guān)系數(shù)法和動態(tài)時間規(guī)整(DTW)法。
[0020](2)隱馬爾可夫模型:一種馬爾可夫鏈,也是馬爾可夫模型的擴展。馬爾可夫模型是描述一個隨機過程與狀態(tài)之間的轉(zhuǎn)移。隱馬爾可夫模型是描述兩個隨機過程:一個隨機過程描述輸出與狀態(tài)間的概率關(guān)系,另一個隨機過程描述狀態(tài)間的轉(zhuǎn)移關(guān)系。隱馬爾可夫模型的狀態(tài)不能直接觀察到,其狀態(tài)轉(zhuǎn)移過程是隱藏的,但是,觀察者能通過觀測輸出序列對狀態(tài)轉(zhuǎn)移進行估計。
[0021](3)人工神經(jīng)網(wǎng)絡(luò):一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進行信息處理的數(shù)學(xué)模型,它通過借鑒人腦神經(jīng)元的結(jié)構(gòu)與連接機制,把大量的簡單處理單元廣泛連接起來,構(gòu)成一種復(fù)雜的信息處理網(wǎng)絡(luò)。這種網(wǎng)絡(luò)具有與人腦相類似的學(xué)習(xí)記憶能力、知識概括能力和對信息特征的抽取能力。經(jīng)過多年的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)形成很多模型,例如模糊神經(jīng)網(wǎng)絡(luò)和BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)。目前使用比較廣泛的是以反向傳播學(xué)習(xí)算法為基礎(chǔ)的BP神經(jīng)網(wǎng)絡(luò)。[0022](4)機器學(xué)習(xí):用于研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu),使之不斷改善自身的性能。常見的基于機器學(xué)習(xí)的方法有:K-最近鄰法KNN(k_Nearest Neighbor)和支持向量機法。
[0023]在常見的手勢識別算法中,DTW算法的結(jié)構(gòu)簡單,所需訓(xùn)練樣本也最少,但是其對不同手勢習(xí)慣的適應(yīng)性較差。隱馬爾科夫模型能夠識別復(fù)雜手勢,但訓(xùn)練量大,計算復(fù)雜。神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)魯棒性較好,但同樣存在訓(xùn)練量大,計算開銷大的問題。因此,本發(fā)明是在DTW算法的基礎(chǔ)上,引入壓縮感知理論解決其適應(yīng)性較差的問題。
[0024]自20世紀(jì)90年代,國外一些研究機構(gòu)就開始了基于傳感器的人機交互研究。早在1996年,IBM公司就推出一種能自動感知運動狀態(tài)的慣性感知設(shè)備,可以應(yīng)用于玩具和日常工具中。同年,Rekimoto J在裝有傳感器的小屏幕上,通過特定按鍵實現(xiàn)了使用手勢傾斜的方式對該設(shè)備進行輸入的功能。1998年,Harrison B等人對使用傳感器作為用戶操作接口的可行性進行了探討。2000年,Hinckley K等人將距離傳感器、壓力傳感器和傾斜傳感器集成到Cassiopeia E105掌上電腦內(nèi),利用手勢實現(xiàn)了改變屏幕顯示方向等功能。Compaq公司的Itsy系統(tǒng)使用加速度傳感器,通過將設(shè)備傾斜就能夠?qū)崿F(xiàn)圖片的翻滾。2001年,Rekimoto J開發(fā)了適用于可穿戴的輸入設(shè)備GestrueWrist和GesturePad,用于與外界的交互。2002年,Pirhonen T利用手勢和語音改善了手機中音樂播放的接口,用戶不用關(guān)注播放屏幕、即可進行各種操作。2003年,Helene B等人研究發(fā)現(xiàn):在有噪聲的情況下,使用傳感器可以提高手勢識別的精度,并建立了一個手語識別系統(tǒng)作為手機交互的輔助技術(shù)。2004年,Jang I J和Park W B對手持設(shè)備中的加速度信號處理問題進行了研究,為了準(zhǔn)確識別用戶的手勢,將測量的加速度分為靜態(tài)和動態(tài)兩種,并分別提供了識別方法。2005年,Juha K等人定義了手勢接口的基本概念,并對不同方法進行比較,設(shè)計了手勢識別系統(tǒng)Smart Design Studio。2006年,Baek J等人描述了如何識別用戶連續(xù)的動作和姿勢,通過分析兩軸加速度數(shù)值的變化來判斷手機的運動狀態(tài)。2007年,Ferscha A和ResmritaS將手勢的概念泛化,根據(jù)手勢的語法規(guī)則將手勢分為原子手勢和復(fù)雜手勢,并建立了手勢庫Glib,可供基于加速度傳感器的系統(tǒng)使用。2008年,Shiqi Zhang等人基于3D加速度傳感器,采用HMM來識別用手勢表示的阿拉伯?dāng)?shù)字,基于加速度傳感器的手勢識別逐步由簡單動作發(fā)展到復(fù)雜手勢。同年,Tomas Schlomer等人利用Wii Controller來實現(xiàn)手勢識另O,標(biāo)志著手勢識別逐步脫離專用的加速度傳感器設(shè)備而轉(zhuǎn)向大眾普及型設(shè)備。2009年,Sandip Agrawal等人描述了如何利用手機通過加速度傳感器采集手部動作,實現(xiàn)阿拉伯?dāng)?shù)字和簡單圖形的書寫;同年,Jiayang Liu等人基于智能手機的加速度傳感器,通過量化采集的數(shù)據(jù),采用DTW算法進行模板匹配,達到手勢識別的效果。2010年,Nicholas等人對手機終端進行調(diào)查分析,指出其具備豐富的傳感器等硬件基礎(chǔ),同時具有很好的應(yīng)用支撐,提出如何在資源仍然受限的手機終端實現(xiàn)數(shù)據(jù)采集、并將有效數(shù)據(jù)反饋給用戶的方法。2011年,Sandip Agrawal等人在09年工作基礎(chǔ)上更進一步,基于手機上的加速度傳感器采集用戶的手寫輸入,通過定義基本筆畫,將用戶的手勢輸入分解為基本筆畫,再將用戶的筆畫輸入識別為字母,通過字母識別、筆畫更正等技術(shù)提高識別精度,并在Nokia N95智能手機上實現(xiàn)了原型系統(tǒng),標(biāo)志著基于加速度傳感器的手勢識別向著更高層次發(fā)展。
[0025]從上述研究工作現(xiàn)狀可以看出:近年來,基于加速度傳感器的手勢識別技術(shù)不斷地得到改善和發(fā)展,但是,仍然存在以下不足:1、絕大多數(shù)研究工作都基于專門設(shè)計的傳感器裝置,這些裝置價格昂貴、功能單一,不利于普及推廣。2、用戶在做手勢時,需要操作額外按鈕,即人工標(biāo)定手勢的起始和結(jié)束。這種額外操作降低了用戶體驗,不符合人機交互自由與自然的目標(biāo)。3、抗干擾能力較差,當(dāng)加速度傳感器采樣幅值上限較小時,容易造成手勢波形失真。4、對不同用戶的使用習(xí)慣適應(yīng)性較差,特別當(dāng)用戶沒有參與訓(xùn)練時,手勢識別效率下滑明顯。
【發(fā)明內(nèi)容】
[0026]有鑒于此,本發(fā)明的目的是提供一種基于加速度傳感器的手勢識別方法,用于解決現(xiàn)有技術(shù)中存在的缺點。本發(fā)明方法不需要另行專門設(shè)計傳感裝置,只需要使用通用的加速度傳感器就能夠?qū)崿F(xiàn)手勢識別,并能適應(yīng)不同加速度傳感器間的差異。另外,本發(fā)明的手勢數(shù)據(jù)的采集方法是一種自然的操作過程,沒有額外的操作。還增強了對不同手勢習(xí)慣的適應(yīng)性,即提高識別方法的魯棒性。
[0027]為了達到上述目的,本發(fā)明提供了一種基于加速度傳感器的手勢識別方法,適用于包括:搭載有加速度傳感器的手機、平板電腦pad和數(shù)碼相機的多種終端;其特征在于:所述方法包括下列操作階段:
[0028]手勢數(shù)據(jù)準(zhǔn)備階段:采集有效的手勢加速度數(shù)據(jù)后,利用失真補償、統(tǒng)一坐標(biāo)系、平滑濾波、重采樣和歸一化的方法,對所采集的原始數(shù)據(jù)進行處理,形成數(shù)據(jù)格式規(guī)整和統(tǒng)一的手勢樣本數(shù)據(jù),以保證后續(xù)手勢訓(xùn)練和手勢識別算法的有效性;
[0029]手勢訓(xùn)練階段:采用動態(tài)時間規(guī)整DTW(Dynamic Time Warping)算法計算手勢樣本數(shù)據(jù)間的相似度,利用近鄰傳播AP (Affinity Propagation)聚類算法提取手勢模板,作為手勢識別分類的基礎(chǔ);
[0030]手勢識別階段:采用DTW算法,對待識別手勢和手勢模板進行匹配計算,依據(jù)二者的相似度值篩選出合適的手勢聚類,并以此構(gòu)建用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典;采用快速傅里葉變換FFT估算待識別手勢樣本數(shù)據(jù)的稀疏度,并在手勢字典基礎(chǔ)上,利用改進的稀疏度自適應(yīng)正交匹配追蹤MSAMP (Modified Sparsity Adaptive MatchingPursuit)算法對待識別手勢進行稀疏重構(gòu);最后根據(jù)稀疏重構(gòu)的手勢樣本數(shù)據(jù)與原待識別手勢樣本數(shù)據(jù)之間的逼近誤差特征,對待識別手勢進行識別分類。
[0031]所述方法包括下列操作步驟:
[0032](I)自動采集手勢加速度數(shù)據(jù):通過加速度傳感器接口實時獲取手勢加速度數(shù)據(jù),并判斷當(dāng)前時刻的手勢加速度數(shù)據(jù)能量是否超過啟動閾值,如果是,則判定手勢運動已經(jīng)啟動,開始記錄手勢加速度數(shù)據(jù);否則,結(jié)束該流程;
[0033]在啟動采集手勢加速度數(shù)據(jù)后,判斷所采集的手勢加速度數(shù)據(jù)能量在設(shè)定時間內(nèi)是否小于停止閾值,同時判斷相鄰的手勢加速度數(shù)據(jù)之間的歐式距離是否也小于波動閾值;如果兩者都是,則判定手勢運動結(jié)束,停止數(shù)據(jù)采集;否則,繼續(xù)采集手勢加速度數(shù)據(jù),且當(dāng)獲取的加速度數(shù)據(jù)組的長度大于預(yù)設(shè)長度門限時,則判定該組數(shù)據(jù)有效;否則,判定該組數(shù)據(jù)無效,直接丟棄之;
[0034](2)預(yù)處理:從不同角度對采集到的原始加速度數(shù)據(jù)進行預(yù)處理,以使處理后的加速度數(shù)據(jù)波形平滑、規(guī)整和統(tǒng)一,用作手勢樣本數(shù)據(jù),以提高手勢識別分類的準(zhǔn)確度,提升系統(tǒng)的實用價值;[0035](3)計算所有手勢樣本數(shù)據(jù)的相似度,得到相似度矩陣:因手勢持續(xù)時長隨機,即同一類手勢的不同樣本數(shù)據(jù)長度往往不同,不能直接使用包括歐式距離的差異度計算方法,故采用DTW算法去除手勢樣本數(shù)據(jù)的長度差異;所述DTW算法是采用設(shè)定的非線性規(guī)整函數(shù)對時域波形建模,再彎曲其中一個模型的時間軸,使其與另一模型達到最大程度的重疊,消除兩個模型之間的時域長度差異;
[0036](4)提取手勢模板:采用AP聚類算法在相似度矩陣基礎(chǔ)上進行迭代運算,提取最有代表性的手勢樣本數(shù)據(jù)作為手勢模板;所述手勢模板是預(yù)先提取出來、最能代表某類手勢特征的手勢樣本數(shù)據(jù);所述AP聚類算法思路是:將所有手勢樣本數(shù)據(jù)都視為潛在模板,通過手勢樣本數(shù)據(jù)之間的相互傳遞“消息”,找出最優(yōu)手勢樣本數(shù)據(jù)集合作為手勢模板,并使得所有手勢樣本數(shù)據(jù)到其最近的手勢模板的相似度之和最大;
[0037](5)利用手勢模板構(gòu)建用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典:為減小計算開銷和提高手勢識別精度,將DTW算法與壓縮感知理論相結(jié)合,根據(jù)DTW運算結(jié)果對由手勢模板構(gòu)成的手勢字典進行精簡:通過先驗知識排除無用的手勢聚類集合,縮小手勢字典規(guī)模,減小后續(xù)計算壓力;所述用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典是由手勢模板所構(gòu)成的、用于對待識別手勢樣本數(shù)據(jù)進行稀疏重構(gòu)的矩陣,該矩陣中的一列元素稱為手勢字典的一個原子;
[0038](6)采用MSAMP算法對待識別手勢樣本數(shù)據(jù)進行稀疏重構(gòu):所述MSAMP算法具體操作是:計算待識別手勢樣本數(shù)據(jù)與重構(gòu)字典原子的內(nèi)積,選取其中最大的多個數(shù)值所對應(yīng)的原子構(gòu)成候選原子集,再利用候選原子集生成支撐原子集,利用支撐原子集重構(gòu)待識別手勢樣本數(shù)據(jù);當(dāng)相鄰兩次迭代操作所得出的兩個殘差向量之間的歐氏距離小于設(shè)定的步長閾值時,減小增長步長,擴大支撐原子集和候選原子集的規(guī)模,繼續(xù)稀疏重構(gòu)的迭代計算;當(dāng)相鄰兩次迭代操作所得出的兩個殘差向量之間的歐氏距離小于設(shè)定的停止閾值時,停止重構(gòu)的迭代計算,并輸出稀疏重構(gòu)結(jié)果;
[0039](7)手勢分類:利用待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)后的結(jié)果系數(shù)與手勢字典原子的對應(yīng)關(guān)系,以手勢類別作為劃分條件,從該稀疏重構(gòu)結(jié)果的系數(shù)中提取與手勢類別相對應(yīng)的系數(shù)向量;再利用各個手勢類別的系數(shù)向量計算每個手勢類別的判決系數(shù);需要注意的是:待識別手勢樣本數(shù)據(jù)的三個軸的加速度數(shù)據(jù)都應(yīng)按照該步驟分別計算判決系數(shù),并選取判決系數(shù)之和最小的手勢類別作為待識別手勢樣本數(shù)據(jù)的分類結(jié)果。
[0040]本發(fā)明利用手勢采集算法提取有效的手勢加速度數(shù)據(jù),采用失真補償、統(tǒng)一坐標(biāo)系、平滑濾波、重采樣和歸一化的方法,對已采集原始數(shù)據(jù)進行預(yù)處理,使數(shù)據(jù)格式規(guī)整、統(tǒng)一;采用動態(tài)時間規(guī)整DTW算法計算訓(xùn)練樣本間的相似度,再利用親和傳播聚類算法提取手勢模板;再采用動態(tài)時間規(guī)整DTW算法,對待識別手勢和手勢模板進行匹配計算,通過二者的相似度篩選手勢聚類,構(gòu)建重構(gòu)字典;采用快速傅里葉變換FFT估算待識別手勢稀疏度,在重構(gòu)字典的基礎(chǔ)上,利用一種改進的稀疏度自適應(yīng)正交匹配追蹤對待識別手勢進行稀疏重構(gòu);根據(jù)重構(gòu)結(jié)果的殘差特征,對待識別手勢進行分類。本發(fā)明方法適用于搭載有加速度傳感器的終端,如搭載有加速度傳感器的手機、pad和相機等設(shè)備。
[0041]本發(fā)明方法的關(guān)鍵技術(shù)是:將壓縮感知技術(shù)與傳統(tǒng)DTW算法相結(jié)合,提高了手勢識別對不同手勢習(xí)慣的適應(yīng)性。本發(fā)明提供的一系列預(yù)處理方法,提高了本發(fā)明手勢識別方法的實用性。另外,還提出了手勢加速度數(shù)據(jù)的自動采集算法,提高了用戶體驗。[0042]本發(fā)明方法的特點與效果是:根據(jù)手勢的加速度特征,提出自動采集手勢加速度數(shù)據(jù)的算法,免除了傳統(tǒng)手勢采集的額外操作,提高了用戶體驗。本發(fā)明方法不需要特別設(shè)計專用傳感器,在搭載有加速度傳感器的終端上都能夠使用,擁有良好的硬件適應(yīng)性。而且,對坐標(biāo)系進行統(tǒng)一,在單純使用加速度傳感器的情況下,一定程度上解決了傳感器空中姿態(tài)對識別效果的影響。引入壓縮感知理論,利用稀疏重構(gòu)識別手勢,提高了對不同手勢習(xí)慣的適應(yīng)性,增強了識別方法的實用性??傊景l(fā)明具有很好的推廣應(yīng)用前景。
【專利附圖】
【附圖說明】
[0043]圖1是手勢識別方法的整體流程示意圖.[0044]圖2是預(yù)處理流程不意圖。
[0045]圖3 (a)、(b)分別是失真的手勢加速度波形示意圖和失真補償后的手勢加速度波形示意圖。
[0046]圖4是歐拉角的定義圖
[0047]圖5是DTW計算的幾何示意圖
[0048]圖6是AP聚類提取手勢模板的流程圖
[0049]圖7是稀疏重構(gòu)結(jié)果的殘差分布圖,圖中的手勢5為手勢識別結(jié)果。 [0050]圖8是本發(fā)明手勢識別方法實施例測試使用的十種手勢定義圖。
[0051]圖9 (a)、(b)分別是本發(fā)明手勢識別方法實施例中分別在用戶相關(guān)情況下和用戶非相關(guān)情況下的測試結(jié)果示意圖。
【具體實施方式】
[0052]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明作進一步的詳細(xì)描述。
[0053]本發(fā)明基于加速度傳感器的手勢識別方法,其適用場景包括:搭載有加速度傳感器的手機、平板電腦pad和數(shù)碼相機的多種終端;該方法包括下述三個操作階段:
[0054]手勢數(shù)據(jù)準(zhǔn)備階段:采集有效的手勢加速度數(shù)據(jù)后,利用失真補償、統(tǒng)一坐標(biāo)系、平滑濾波、重采樣和歸一化的方法,對所采集的原始數(shù)據(jù)進行處理,形成數(shù)據(jù)格式規(guī)整和統(tǒng)一的手勢樣本數(shù)據(jù),以保證后續(xù)手勢訓(xùn)練和手勢識別算法的有效性;
[0055]手勢訓(xùn)練階段:采用動態(tài)時間規(guī)整DTW(Dynamic Time Warping)算法計算手勢樣本數(shù)據(jù)間的相似度,利用近鄰傳播AP (Affinity Propagation)聚類算法提取手勢模板,作為手勢識別分類的基礎(chǔ);
[0056]手勢識別階段:采用DTW算法,對待識別手勢和手勢模板進行匹配計算,依據(jù)二者的相似度值篩選出合適的手勢聚類,并以此構(gòu)建用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典;采用快速傅里葉變換FFT估算待識別手勢樣本數(shù)據(jù)的稀疏度,并在手勢字典基礎(chǔ)上,利用改進的稀疏度自適應(yīng)正交匹配追蹤MSAMP (Modified Sparsity Adaptive MatchingPursuit)算法對待識別手勢進行稀疏重構(gòu);最后根據(jù)稀疏重構(gòu)的手勢樣本數(shù)據(jù)與原待識別手勢樣本數(shù)據(jù)之間的逼近誤差特征,對待識別手勢進行識別分類。
[0057]參見圖1,介紹將本發(fā)明方法的上述三個操作階段進行更具體的細(xì)分而組成的下述七個操作步驟:[0058]步驟1,自動采集手勢加速度數(shù)據(jù):通過加速度傳感器接口實時獲取手勢加速度數(shù)據(jù),并判斷當(dāng)前時刻的手勢加速度數(shù)據(jù)能量是否超過啟動閾值,如果是,則判定手勢運動已經(jīng)啟動,開始記錄手勢加速度數(shù)據(jù);否則,結(jié)束該流程。
[0059]在啟動采集手勢加速度數(shù)據(jù)后,判斷所采集的手勢加速度數(shù)據(jù)能量在設(shè)定時間內(nèi)是否小于停止閾值,同時判斷相鄰的手勢加速度數(shù)據(jù)之間的歐式距離是否也小于波動閾值;如果兩者都是,則判定手勢運動結(jié)束,停止數(shù)據(jù)采集;否則,繼續(xù)采集手勢加速度數(shù)據(jù),且當(dāng)獲取的加速度數(shù)據(jù)組的長度大于預(yù)設(shè)長度門限時,則判定該組數(shù)據(jù)有效;否則,判定該組數(shù)據(jù)無效,直接丟棄之。
[0060]本發(fā)明方法的實施例中,分別設(shè)置手勢加速度數(shù)據(jù)的啟動閾值為2.5m/s2、停止閾值為lm/s2、波動閾值為0.8m/s2、停止步長為10,以及長度門限為20。
[0061]步驟2,預(yù)處理:從不同角度對采集到的原始加速度數(shù)據(jù)進行預(yù)處理(參見圖2),以使處理后的加速度數(shù)據(jù)波形平滑、規(guī)整和統(tǒng)一,用作手勢樣本數(shù)據(jù),以提高手勢識別分類的準(zhǔn)確度,提升系統(tǒng)的實用價值。該步驟包括下述具體操作內(nèi)容:
[0062](21)失真補償:當(dāng)加速度傳感器的采樣幅值上限較小,而手勢加速度較大時,手勢加速度數(shù)據(jù)波形的波峰和波谷部分會被“削平”而產(chǎn)生波形失真,失真波形如圖3(a)所示,此時使得正常手勢樣本數(shù)據(jù)與失真手勢樣本數(shù)據(jù)之間的相似度減小,從而干擾識別。故采用失真補償算法對手勢加速度數(shù)據(jù)波形進行失真還原,以便合理解決由傳感器采樣幅值上限引起的波形失真。
[0063]失真補償?shù)奶幚硭悸肥?假定加速度數(shù)據(jù)波形失真部分的斜率變化均勻,故在失真前后的正常加速度數(shù)據(jù)基礎(chǔ)上,利用斜率對失真數(shù)據(jù)進行估計補償,以使最終得到正確的加速度波形。
[0064]假設(shè)在某個坐標(biāo)軸上、數(shù)據(jù)長度為N的手勢原始加速度數(shù)據(jù)集合為A = {&1) a2,…,ai;…,aN},式中,自然數(shù)i是按采集順序排列的時間序號,其最大值為N,%為A中第i個加速度數(shù)據(jù);因數(shù)字信號的加速度數(shù)據(jù)的時間計算單位為1,故A中第i個加速度數(shù)據(jù)%的斜率K的計算公式為:ki = a1-a^o
[0065]設(shè)第i個采樣的原始加速度數(shù)據(jù)的失真補償值比的補償公式為:
【權(quán)利要求】
1.一種基于加速度傳感器的手勢識別方法,適用于包括:搭載有加速度傳感器的手機、平板電腦pad和數(shù)碼相機的多種終端;其特征在于:所述方法包括下列操作階段: 手勢數(shù)據(jù)準(zhǔn)備階段:采集有效的手勢加速度數(shù)據(jù)后,利用失真補償、統(tǒng)一坐標(biāo)系、平滑濾波、重采樣和歸一化的方法,對所采集的原始數(shù)據(jù)進行處理,形成數(shù)據(jù)格式規(guī)整和統(tǒng)一的手勢樣本數(shù)據(jù),以保證后續(xù)手勢訓(xùn)練和手勢識別算法的有效性; 手勢訓(xùn)練階段:采用動態(tài)時間規(guī)整DTW(Dynamic Time Warping)算法計算手勢樣本數(shù)據(jù)間的相似度,利用近鄰傳播AP (Affinity Propagation)聚類算法提取手勢模板,作為手勢識別分類的基礎(chǔ); 手勢識別階段:采用DTW算法,對待識別手勢和手勢模板進行匹配計算,依據(jù)二者的相似度值篩選出合適的手勢聚類,并以此構(gòu)建用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典;采用快速傅里葉變換FFT估算待識別手勢樣本數(shù)據(jù)的稀疏度,并在手勢字典基礎(chǔ)上,利用改進的稀疏度自適應(yīng)正交匹配追蹤MSAMP (Modified Sparsity Adaptive MatchingPursuit)算法對待識別手勢進行稀疏重構(gòu);最后根據(jù)稀疏重構(gòu)的手勢樣本數(shù)據(jù)與原待識別手勢樣本數(shù)據(jù)之間的逼近誤差特征,對待識別手勢進行識別分類。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述方法包括下列操作步驟: (1)自動采集手勢加速度數(shù)據(jù):通過加速度傳感器接口實時獲取手勢加速度數(shù)據(jù),并判斷當(dāng)前時刻的手勢加速度數(shù)據(jù)能量是否超過啟動閾值,如果是,則判定手勢運動已經(jīng)啟動,開始記錄手勢加速度數(shù)據(jù);否則,結(jié)束該流程; 在啟動采集手勢加速度數(shù)據(jù)后,判斷所采集的手勢加速度數(shù)據(jù)能量在設(shè)定時間內(nèi)是否小于停止閾值,同時判斷相鄰的手勢加速度數(shù)據(jù)之間的歐式距離是否也小于波動閾值;如果兩者都是,則判定手勢運動結(jié)束,停止數(shù)據(jù)采集;否則,繼續(xù)采集手勢加速度數(shù)據(jù),且當(dāng)獲取的加速度數(shù)據(jù)組的長度大于預(yù)設(shè)長度門限時,則判定該組數(shù)據(jù)有效;否則,判定該組數(shù)據(jù)無效,直接丟棄之; (2)預(yù)處理:從不同角度對采集到的原始加速度數(shù)據(jù)進行預(yù)處理,以使處理后的加速度數(shù)據(jù)波形平滑、規(guī)整和統(tǒng)一,用作手勢樣本數(shù)據(jù),以提高手勢識別分類的準(zhǔn)確度,提升系統(tǒng)的實用價值; (3)計算所有手勢樣本數(shù)據(jù)的相似度,得到相似度矩陣:因手勢持續(xù)時長隨機,即同一類手勢的不同樣本數(shù)據(jù)長度往往不同,不能直接使用包括歐式距離的差異度計算方法,故采用DTW算法去除手勢樣本數(shù)據(jù)的長度差異;所述DTW算法是采用設(shè)定的非線性規(guī)整函數(shù)對時域波形建模,再彎曲其中一個模型的時間軸,使其與另一模型達到最大程度的重疊,消除兩個模型之間的時域長度差異; (4)提取手勢模板:采用AP聚類算法在相似度矩陣基礎(chǔ)上進行迭代運算,提取最有代表性的手勢樣本數(shù)據(jù)作為手勢模板;所述手勢模板是預(yù)先提取出來、最能代表某類手勢特征的手勢樣本數(shù)據(jù);所述AP聚類算法思路是:將所有手勢樣本數(shù)據(jù)都視為潛在模板,通過手勢樣本數(shù)據(jù)之間的相互傳遞“消息”,找出最優(yōu)手勢樣本數(shù)據(jù)集合作為手勢模板,并使得所有手勢樣本數(shù)據(jù)到其最近的手勢模板的相似度之和最大; (5)利用手勢模板構(gòu)建用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典:為減小計算開銷和提高手勢識別精度,將DTW算法與壓縮感知理論相結(jié)合,根據(jù)DTW運算結(jié)果對由手勢模板構(gòu)成的手勢字典進行精簡:通過先驗知識排除無用的手勢聚類集合,縮小手勢字典規(guī)模,減小后續(xù)計算壓力;所述用于待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典是由手勢模板所構(gòu)成的、用于對待識別手勢樣本數(shù)據(jù)進行稀疏重構(gòu)的矩陣,該矩陣中的一列元素稱為手勢字典的一個原子; (6)采用MSAMP算法對待識別手勢樣本數(shù)據(jù)進行稀疏重構(gòu):所述MSAMP算法具體操作是:計算待識別手勢樣本數(shù)據(jù)與重構(gòu)字典原子的內(nèi)積,選取其中最大的多個數(shù)值所對應(yīng)的原子構(gòu)成候選原子集,再利用候選原子集生成支撐原子集,利用支撐原子集重構(gòu)待識別手勢樣本數(shù)據(jù);當(dāng)相鄰兩次迭代操作所得出的兩個殘差向量之間的歐氏距離小于設(shè)定的步長閾值時,減小增長步長,擴大支撐原子集和候選原子集的規(guī)模,繼續(xù)稀疏重構(gòu)的迭代計算;當(dāng)相鄰兩次迭代操作所得出的兩個殘差向量之間的歐氏距離小于設(shè)定的停止閾值時,停止重構(gòu)的迭代計算,并輸出稀疏重構(gòu)結(jié)果; (7)手勢分類:利用待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)后的結(jié)果系數(shù)與手勢字典原子的對應(yīng)關(guān)系,以手勢類別作為劃分條件,從該稀疏重構(gòu)結(jié)果的系數(shù)中提取與手勢類別相對應(yīng)的系數(shù)向量;再利用各個手勢類別的系數(shù)向量計算每個手勢類別的判決系數(shù);需要注意的是:待識別手勢樣本數(shù)據(jù)的三個軸的加速度數(shù)據(jù)都應(yīng)按照該步驟分別計算判決系數(shù),并選取判決系數(shù)之和最小的手勢類別作為待識別手勢樣本數(shù)據(jù)的分類結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(2)包括下述操作內(nèi)容: (21)失真補償:當(dāng)加速度傳感器的采樣幅值上限較小,而手勢加速度較大時,手勢加速度數(shù)據(jù)波形的波峰和波谷部分會被“削平”而產(chǎn)生波形失真,使得正常手勢樣本數(shù)據(jù)與失真手勢樣本數(shù)據(jù)之間的相似度減小,從而干擾識別;故采用失真補償算法對手勢加速度數(shù)據(jù)波形進行失真還原,以便合理解決由傳感器采樣幅值上限引起的波形失真; 失真補償?shù)奶幚硭悸肥?假定加速度數(shù)據(jù)波形失真部分的斜率變化均勻,故在失真前后的正常加速度數(shù)據(jù)基礎(chǔ)上,利用斜率對失真數(shù)據(jù)進行估計補償,以使最終得到正確的加速度波形; 假設(shè)在某個坐標(biāo)軸上、數(shù)據(jù)長度為N的手勢原始加速度數(shù)據(jù)集合為A = {&1) a2,…,ai;…,aN},式中,自然數(shù)i是按采集順序排列的時間序號,其最大值為N,%為A中第i個加速度數(shù)據(jù);因數(shù)字信號的加速度數(shù)據(jù)的時間計算單位為1,故A中第i個加速度數(shù)據(jù)%的斜率K的計算公式為:ki = ; 設(shè)第i個采樣的原始加速度數(shù)據(jù)的失真補償值h的補償公式為:h嚴(yán)ΙυΚ—?χρ ;其中,P是加速度失真段的斜率變化率;對于波峰而言,在失真段上升沿或下降沿,失真補償值h數(shù)值分別等于失真段起始點斜率除以上升沿或下降沿的橫坐標(biāo)時長Ag為上一個采樣的原始加速度數(shù)據(jù)補償值,h0為失真段起始點加速度數(shù)據(jù); (22)統(tǒng)一坐標(biāo)系:因加速度傳感器采集的數(shù)據(jù)坐標(biāo)是其本體坐標(biāo)系,當(dāng)搭載有傳感器的終端發(fā)生空中姿態(tài)改變時,其加速度數(shù)據(jù)會在三個軸上發(fā)生偏移,故采用歐拉角轉(zhuǎn)換矩 [cos^O -sin -sin^xsin^ cos^將加速度數(shù)據(jù)轉(zhuǎn)換到統(tǒng)一坐標(biāo)系中,其中,Θ、
cos Θ^?ηφ sin θ cos Θ x cos φ和η分別是俯仰角、翻滾角和航向角;且因只使用加速度傳感器和硬件限制,將n始終視為0° ;這樣,在靜止?fàn)顟B(tài)下,俯仰角θ和翻滾角-的計算公式分別為:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(3)包括下述操作內(nèi)容: (31)分別設(shè)置輸入的待識別手勢樣本數(shù)據(jù)的三軸加速度數(shù)據(jù)集合O和與其進行匹配計算的手勢模板的三軸加速度數(shù)據(jù)集合B為:
O— { (Oxl, oyl, ozl), (ox2, oy2, Oz2),…,(oxi, Oyi, Ozi),…,(oxN, oyN, ozN)}和B= {(bxl, byl, bzl), (bx2, by2, bz2),...,(bxJ, byJ, bzJ),..., (bxM, byM, bzM)},其中,自然數(shù) i 和j分別是其時間序號,其最大值分別為N和M,且i e [l,N],j e [I, M] ;x、y、z分別為該待識別手勢樣本數(shù)據(jù)所歸屬的三個坐標(biāo)軸; (32)將兩個集合O和B組成一個直角二維坐標(biāo)系,該坐標(biāo)系的橫坐標(biāo)軸為待識別手勢樣本O中加速度數(shù)據(jù)的時序軸,縱坐標(biāo)軸為手勢模板B中加速度數(shù)據(jù)的時序軸,再將橫軸與縱軸的坐標(biāo)連接成為網(wǎng)格,則網(wǎng)格的每個交點代表O和B某兩個加速度數(shù)據(jù)的差異度; (33)根據(jù)歐氏距離計算公式
5.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(4)中的AP聚類算法包括下述操作內(nèi)容: (41)根據(jù)手勢相似度矩陣和下述公式分別計算吸引度q(I,J)和可用度w(I,J):
6.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(5)包括下述操作內(nèi)容: (51)設(shè)置手勢模板集合為E,則E中第f個手勢模板式中,自然數(shù)^是手勢模板序號,其取值范圍取決于提取的手勢模板數(shù)量,利用DTW算法計算待識別手勢樣本U和某個手勢模板氣之間的相似度5(仏氣.); (52)判斷只1/4)>?是否成立,若是,則將該手勢模板所代表的手勢聚類集合中的手勢樣本數(shù)據(jù)挑選出來,所有被選擇出來的手勢樣本數(shù)據(jù)以列向量形式構(gòu)成矩陣,作為用來實現(xiàn)待識別手勢樣本數(shù)據(jù)稀疏重構(gòu)的手勢字典;其中,判定閾值α的計算公式為:?=“!1^(5({/,1)),其中,比例系數(shù)13的取值范圍為[1,2];若否,則結(jié)束該流程操作; (53)因手勢的加速度數(shù)據(jù)長度隨機不等,故在用手勢樣本數(shù)據(jù)構(gòu)建手勢字典時,首先按照下述方法補齊手勢加速度數(shù)據(jù)長度:找出手勢字典D中數(shù)據(jù)最長的一列,并以該長度為標(biāo)準(zhǔn),以補零方式將其它列的加速度數(shù)據(jù)都補齊至相同長度。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(6)包括下述操作內(nèi)容: (61)構(gòu)建候選原子集C:計算稀疏重構(gòu)操作時的殘差向量r與手勢字典D原子的內(nèi)積;再從所計算得到的各列內(nèi)積值中選取最大的多個內(nèi)積值所對應(yīng)的原子構(gòu)成候選原子集C,即用這些原子構(gòu)建一個新的矩陣; (62)構(gòu)建支撐原子集F:計算候選原子集C的廣義逆矩陣C+與待識別手勢U中的某個軸加速度數(shù)據(jù)u的內(nèi)積,選取其中最大的多個內(nèi)積值所對應(yīng)的原子生成支撐原子集F ; (63)更新殘差向量:利用新生成的支撐原子集F及其廣義逆矩陣F+更新稀疏重構(gòu)操作時的殘差向量r ; (64)判斷上述步驟(63)和(61)的各自稀疏重構(gòu)結(jié)果的兩個殘差向量的二范數(shù)之差是否不大于零;若是,則執(zhí)行步驟(65);若否,則繼續(xù)執(zhí)行本階段的迭代計算:返回執(zhí)行步驟(61);(65)判斷上一階段最小殘差向量的二范數(shù)R與本階段操作步驟(61)中的殘差向量的二范數(shù)之差是否小于停止閾值,若否,則執(zhí)行步驟(66);若是,則停止迭代運算,并輸出稀疏重構(gòu)結(jié)果?; (66)判斷上一階段最小殘差向量的二范數(shù)R與本階段操作步驟(61)中的殘差向量的二范數(shù)之差是否小于步長閾值,若是,則減小增長步長,擴大支撐原子集和候選原子集規(guī)模,進入下一階段的迭代計算:返回執(zhí)行步驟(61);若否,則不改變增長步長,按原增長步長擴大支撐原子集和候選原子集規(guī)模,進入下一階段的迭代計算:返回執(zhí)行步驟(61)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于:因待識別的手勢的稀疏度數(shù)值未知,故先選擇一個數(shù)值較小的稀疏度s作為增長步長;但若增長步長的取值太小,將大幅增加重構(gòu)計算時間,影響手勢識別的實時性,故采用下述快速離散傅里葉變換FFT方法估算待識別手勢的稀疏度:對待識別手勢的各軸加速度數(shù)據(jù)執(zhí)行FFT變換,得到加速度數(shù)據(jù)在頻域上的系數(shù)集合V,再尋找頻域系數(shù)集合V中的最大值ν_,并將V中大于0.3.Vmax的元素挑選出來,構(gòu)成新的系數(shù)集合V',則稀疏度s等于V'中的元素個數(shù)。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于:因待識別手勢樣本有三個軸的數(shù)據(jù),故要采用MSAMP算法分別對每個軸的加速度數(shù)據(jù)向量分別進行稀疏重構(gòu),所述MSAMP算法稀疏重構(gòu)每軸的加速度數(shù)據(jù)向量的操作內(nèi)容如下: (a)初始化設(shè)置下述各個參數(shù):稀疏重構(gòu)數(shù)據(jù)的殘差向量h= u,i = 0,第1次迭代計算的稀疏重構(gòu)支撐原子集6 =0 ?第1次迭代計算的候選原子集? =0,支撐原子集規(guī)模、即支撐集的列或原子的個數(shù)L = S,迭代操作階段序號K = O,其中,迭代操作階段是指在同一支撐原子集規(guī)模下執(zhí)行的多次迭代計算,同一支撐原子集規(guī)模下的迭代計算都屬于同一階段的操作;1為迭代次數(shù),此時I = O,且上一階段的最小殘差向量的二范數(shù)R = O,步長閾值Ttl = O,停止閾值T1 = O ; (b)更新候選集:計算手勢字典D的轉(zhuǎn)置矩陣Dt與前一次迭代、即(1-1)次迭代計算得到的稀疏重構(gòu)數(shù)據(jù)的殘差向量IV1的乘積DtXivi,再從中選取L個最大值所對應(yīng)的手勢字典的原子存入臨時原子集合Ψ,用于更新候選原子集C1 = F1^1 U Ψ,即本次迭代候選原子集是上一次迭代支撐原子集與臨時原子集合的并集;(c)更新殘差向量:計算候選原子集(^的廣義逆矩陣C/和待識別手勢加速度數(shù)據(jù)向量u的乘積C/ x? ?再從中選取最大的L個值所對應(yīng)的原子存入臨時備用的支撐原子集F',用于更新殘差向量r = U-F' XF' +Xu; (d)判斷是否結(jié)束本階段迭代計算:判斷本次迭代計算的殘差向量的二范數(shù)IIr1I |2是否不小于前次迭代計算的殘差向量二范數(shù)I Iiv1I I2,即不等式I Ir1I I2≤I Iiv1I I2是否成立;若是,則執(zhí)行后續(xù)步驟(e);否則,繼續(xù)本階段的迭代計算:更新支撐原子集F1 = F' ,T1=r, I = 1+1,返回執(zhí)行步驟(b)。(e)判斷是否輸出結(jié)果:判斷上一階段最小殘差向量的二范數(shù)R與本階段前次迭代計算的殘差向量的二范數(shù)I IiV1I |2之差是否小于停止閾值1\,即不等式R-| Iiv1I I2CT1是否成立,若是,則停止迭代計算,并輸出稀疏重構(gòu)的結(jié)果? =疒+x?;否則,執(zhí)行后續(xù)步驟(f); (f)判斷是否改變增長步長:判斷上一階段最小殘差向量的二范數(shù)R與本階段前次迭代計算的殘差向量的二范數(shù)I Iiv1I I2之差否小于步長閾值Ttl、即不等式R-1 Iiv1I IZTtl是否成立;若是,則執(zhí)行后續(xù)步驟(g);否則,跳轉(zhuǎn)執(zhí)行步驟(h); (g)改變增長步長:將稀疏度S減小一半,再更新支撐原子集的規(guī)模,使得L=L+S,然后,初始化設(shè)置下述各個參數(shù)-.T1 = U、F1 =0、 C1 =0和I = O,并更新Tci =.0.5.Il Iv1112, T1 = 0.1.11 Iv1112, R = 11 ^v1112后,開始執(zhí)行下一階段迭代計算操作、即設(shè)置K = K+1后,返回執(zhí)行步驟(b); (h)不改變增長步長:更新支撐原子集規(guī)模L= L+S,初始化設(shè)置下述各個參數(shù):ι =U、F; = 0、C1 =0和 I = O,更新 T0 = 0.5.I Iiv11 I2, T1 = 0.1.I T1^1 I2, R = I T1^1112,執(zhí)行下一階段迭代計算操作,即設(shè)置K = K+1后,返回執(zhí)行步驟(b)。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述步驟(7)包括下述操作內(nèi)容: (71)按照手勢類別重新劃分稀疏重構(gòu)的結(jié)果向量:待識別手勢某個軸加速度數(shù)據(jù)的稀疏重構(gòu)結(jié)果為?,其理想狀態(tài)是? = {0,05...,1,...,()},即在稀疏重構(gòu)結(jié)果中只有一個加速度數(shù)據(jù)是非零系數(shù),其余系數(shù)皆為O ;同時,?中的系數(shù)與手勢字典D中的原子一一對應(yīng),則非零系數(shù)對應(yīng)的原子所屬的手勢類別就是手勢識別結(jié)果;但因?qū)嶋H操作中往往有多個非零系數(shù),利用i中的系數(shù)與重構(gòu)字典D中的原子的對應(yīng)關(guān)系,設(shè)置有Θ種手勢類型,根據(jù)不同原子所屬手勢類別的不同,從?中重新劃分出?個列向量:5其中,列向量I為第τ類手勢的手勢模板所對應(yīng)的稀疏重構(gòu)的結(jié)果系數(shù),其長度與^相同; (72)計算每種手勢類別的判決系數(shù):設(shè)βτ代表第τ類手勢的判決系數(shù),該系數(shù)越小說明待識別手勢樣本越接近該類手勢,β τ的計算公式為:
【文檔編號】G06K9/62GK103984416SQ201410254283
【公開日】2014年8月13日 申請日期:2014年6月10日 優(yōu)先權(quán)日:2014年6月10日
【發(fā)明者】王海嬰, 李正山 申請人:北京郵電大學(xué)