本發(fā)明涉及模式識別領(lǐng)域,具體涉及一種人體行為特征提取方法。
背景技術(shù):
人體行為識別主要是指對人體的動作類別、行為模式進(jìn)行分析和識別,并對其加以描述,具有廣闊的應(yīng)用前景和可觀的經(jīng)濟(jì)價值。它通過獲取人體的運(yùn)動信息,對這些信息進(jìn)行有效的處理,不僅可以判斷其所處的地理環(huán)境,得知其執(zhí)行的行為動作,并推測其潛在意圖,還可以根據(jù)需求為其提供智能化的服務(wù)。但人體行為是非剛體運(yùn)動,是一個十分復(fù)雜的運(yùn)動系統(tǒng),具有高度的自由性和明顯的非線性特征。鑒于加速度現(xiàn)象在日常生活中無處不在,直接反映了各種人體活動信息。不論是日?;顒?,例如:行走、跳躍、慢跑、刷牙、吃飯等,還是異常行為,比如:摔跤、爬行、暈倒等,都伴隨著各種加速度、角速度等變化。因此,通過慣性傳感器來實(shí)現(xiàn)人體行為的模式識別,越來越受到各國學(xué)者的廣泛關(guān)注。
2)本文用于提取特征的經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法,是由N.E.Huang等人于1998年創(chuàng)新性地提出的一種自適應(yīng)信號時頻處理方法,并被證明是處理非線性、非平穩(wěn)信號的強(qiáng)有力工具。它是基于信號的局部特征時間尺度,通過一個“篩選”過程將被分析信號分解為其本身固有的一族內(nèi)稟模態(tài)函數(shù)(IntrinsicModeFunctions,IMF),這些IMF均是原始信號的分量,并且其中每一個IMF分量均與其他IMF分量正交。除此之外,每一個IMF分量可以是線性的或非線性的,平穩(wěn)的或非平穩(wěn)的,但I(xiàn)MF必須具有下列兩個特性:
(1)在整個信號序列中,極值點(diǎn)與過零點(diǎn)的個數(shù)必須相同或至多相差1個;
(2)在信號記錄的任意點(diǎn)處,由局部極大值點(diǎn)確定的上包絡(luò)線以及由極小值點(diǎn)確定的下包絡(luò)線的均值為零。
3)非趨勢波動分析(detrended fluctuation analysis,DFA)方法是C K Peng等人提出的一種時間序列長程相關(guān)性標(biāo)度指數(shù)計算方法,其優(yōu)點(diǎn)在于可以將各種不同階的外來趨勢從時間序列中清除,從而準(zhǔn)確地觀察到時間序列本身所具有的統(tǒng)計行為特征,該方法適合于非平穩(wěn)信號的分析。
4)基于信號局部特征時間尺度的EEMD方法就是一種可以將原始信號分解成多種不同尺度的信號(IMF),每種尺度信號都攜帶著原始信號的一些固有特征,另外DFA方法一種時間序列長程相關(guān)性標(biāo)度指數(shù)計算方法,可以準(zhǔn)確地觀察到時間序列本身所具有的統(tǒng)計行為特征,更適合于非平穩(wěn)信號的分析。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在解決以上現(xiàn)有技術(shù)的問題。提出了一種降低運(yùn)算復(fù)雜度、快速準(zhǔn)確的基于慣性傳感器的人體行為識別系統(tǒng)下EEMD-DFA特征提取方法。本發(fā)明的技術(shù)方案如下:
一種基于慣性傳感器的人體行為識別系統(tǒng)下EEMD-DFA特征提取方法,其包括以下步驟:
步驟1:獲取人體行為數(shù)據(jù)包括三軸加速度數(shù)據(jù)、三軸角速度共六維原始數(shù)據(jù),并對該六維原始數(shù)據(jù)進(jìn)行EEMD分解,經(jīng)EEMD分解后,每一維數(shù)據(jù)會得到多個尺度的固有模態(tài)IMF函數(shù),挑選每軸分解的IMF函數(shù)的前n1個;
步驟2:將每軸挑選的n1個IMF函數(shù)與該軸原始數(shù)據(jù)結(jié)合,每軸就形成了(n1+1)維數(shù)據(jù),這樣6軸就形成了6(n1+1)維數(shù)據(jù),然后采用n2*6(n1+1)作為一個采樣樣本,相鄰樣本間采用50%的重疊率進(jìn)行滑動加窗得到所有樣本數(shù)據(jù);
步驟3:將步驟二中得到的所有分窗樣本數(shù)據(jù)進(jìn)行特征提取,提取時域特征、頻域特征及非趨勢波動系數(shù)DFA特征,組成多維特征集;
步驟4:對提取的多維特征集進(jìn)行Relief-F特征選擇方法進(jìn)行數(shù)據(jù)的降維,然后使用K近鄰分類器進(jìn)行數(shù)據(jù)的分類,得到分類行為的識別準(zhǔn)確率。
進(jìn)一步的,所述n1取值為5,n2取值為500。
進(jìn)一步的,所述步驟3的時域特征包括均值、方差、四分位、相關(guān)系數(shù)在內(nèi)的時域特征,所述頻域特征包括頻域能量信號、頻域熵在內(nèi)的頻域特征。
進(jìn)一步的,所述步驟1三軸加速度數(shù)據(jù)、三軸角速度共六維原始數(shù)據(jù)的獲取是從人體攜帶在身上的慣性傳感器獲得。
進(jìn)一步的,所述步驟1中對六維原始數(shù)據(jù)進(jìn)行EEMD分解,經(jīng)EEMD分解后,每一維數(shù)據(jù)會得到多個尺度的固有模態(tài)IMF函數(shù)具體包括步驟:S1、對單個樣本窗序列s(t),向s(t)添加高斯白噪聲序列n(t),構(gòu)成s1(t)
S2、調(diào)用EMD(經(jīng)驗?zāi)B(tài)分解)函數(shù)對添加噪聲后的信號進(jìn)行EMD分解得到IMF;
S3、重復(fù)步驟S2若干次,每次加入不同的高斯白噪聲;
S4、判斷是否達(dá)到設(shè)定次數(shù),若是則停止并保存所有IMF,并將每次分解得到的IMF對應(yīng)求平均值。
進(jìn)一步的,所述步驟4對提取的多維特征集進(jìn)行Relief-F特征選擇方法進(jìn)行數(shù)據(jù)的降維,然后使用K近鄰分類器進(jìn)行數(shù)據(jù)的分類的具體步驟包括:以下為Relief-F特征選擇方法的偽代碼:
本發(fā)明的優(yōu)點(diǎn)及有益效果如下:
本方法采用的是先對原始數(shù)據(jù)進(jìn)行EEMD分解后在進(jìn)行分窗特征提取,之所以沒有采用傳統(tǒng)的方式即先對原始提取的數(shù)據(jù)進(jìn)行分窗后再進(jìn)行特征提取進(jìn)而得到特征集,EEMD方法雖然在能提取優(yōu)秀的分類特征,但其運(yùn)算復(fù)雜度比較高,運(yùn)算時間較長,如果先進(jìn)行分成多個樣本窗,之后每窗都要進(jìn)行EEMD分解,這樣運(yùn)算時間會成本增加,進(jìn)而降低了EEMD特征提取方法的優(yōu)勢。基于慣性傳感器的人體行為識別系統(tǒng)中,由于慣性傳感器(加速度計、陀螺儀)提取的三軸加速度信號與三軸角速度信號均為非線性、非平穩(wěn)信號,所以在人體動作識別過程中嘗試采用適合于處理非線性非平穩(wěn)信號的特征提取方法是必要的,而基于信號局部特征時間尺度的EEMD方法就是這樣一種方法,可以將原始信號分解成多種不同尺度的信號(IMF),每種尺度信號都攜帶著原始信號的一些固有特征,另外DFA方法一種時間序列長程相關(guān)性標(biāo)度指數(shù)計算方法,可以準(zhǔn)確地觀察到時間序列本身所具有的統(tǒng)計行為特征,更適合于非平穩(wěn)信號的分析。結(jié)合二者優(yōu)勢通過使用KNN分類器來實(shí)現(xiàn)更加精確的人體行為分類。本發(fā)明對某些相似行為有良好的區(qū)分能力,并且相對于只提取時域頻域特征的分類準(zhǔn)確率有所提高。
附圖說明
圖1是本發(fā)明提供優(yōu)選實(shí)施例整體行為分類實(shí)現(xiàn)流程圖;
圖2是本發(fā)明的實(shí)現(xiàn)流程圖;
圖3是EMD分解流程圖;
圖4是本發(fā)明提供優(yōu)選實(shí)施例EEMD分解流程圖;
圖5是未使用本專利提出的特征提取方法的分類混淆矩陣仿真圖;
圖6是使用本專利提出的特征提取方法的分類混淆矩陣仿真圖;
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、詳細(xì)地描述。所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例。
本發(fā)明解決上述技術(shù)問題的技術(shù)方案是,
結(jié)合圖2說明本實(shí)施方式,本實(shí)施方式步驟如下:
步驟一:將佩戴于腰間的慣性傳感器提取的三軸加速度數(shù)據(jù)與三軸角速度人體行為數(shù)據(jù)共六維原始數(shù)據(jù)進(jìn)行EEMD分解,每一維數(shù)據(jù)會得到多個尺度的IMF函數(shù)(固有模態(tài)函數(shù)),挑選每軸分解的IMF函數(shù)的前5個,其中EEMD分解方法(如圖4)是EMD分解方法(如圖3)的改進(jìn)方法,此方法可以有效避免模態(tài)混疊的現(xiàn)象。
步驟二:將每軸挑選的5個IMF函數(shù)與該軸原始數(shù)據(jù)結(jié)合,每軸就形成了6維數(shù)據(jù),這樣6軸就形成了36維數(shù)據(jù),然后采用每500*36作為一個采樣樣本,相鄰樣本間采用50%的重疊率進(jìn)行滑動加窗得到所有樣本數(shù)據(jù)。
步驟三:將步驟二中得到的所有分窗樣本數(shù)據(jù)進(jìn)行特征提取,除了提取常見的時域特征(均值、方差、四分位、相關(guān)系數(shù)等),頻域特征(頻域能量信號、頻域熵等),然后還要提取非趨勢波動系數(shù)(DFA)特征,組成多維特征集。
步驟四:對提取的多維特征集進(jìn)行Relief-F特征選擇方法進(jìn)行數(shù)據(jù)的降維,然后使用K近鄰(KNN)分類器進(jìn)行數(shù)據(jù)的分類,進(jìn)而得到分類行為的識別準(zhǔn)確率。
以下為說明書附圖說明:
圖1是基于慣性傳感器的人體行為分類通用模式實(shí)現(xiàn)流程圖,主要過程包括:首先需要對人體行為數(shù)據(jù)進(jìn)行采集,然后將采集的數(shù)據(jù)建立基本數(shù)據(jù)庫,并將每種人體行為動作信號進(jìn)行分窗,接著對獲取的窗樣本提取特征并進(jìn)行特征選擇,最后進(jìn)行分類識別。
圖2是本發(fā)明的實(shí)現(xiàn)流程圖,具體包括:首先使用慣性傳感器提取數(shù)據(jù),然后對傳感器提取的多維數(shù)據(jù)的每一維進(jìn)行EEMD分解得到多個固有模態(tài)函數(shù)信號(IMF)并篩選出前5個IMF信號,接著對篩選的IMF信號以及原信號進(jìn)行分窗并提取提取特征,并采用Relief-F特征選擇算法進(jìn)行特征降維,最后使用KNN分類器進(jìn)行分類。
圖3是EMD分解流程圖,具體包括,EMD方法的步驟如下:
1)求出原始時間序列s(t)的所有局部極值點(diǎn),然后用3次樣條插值得到上包絡(luò)線和下包絡(luò)線,求上下包絡(luò)線的平均值m(t)。
2)令h1(t)=s(t)-m(t)(1)
若h1(t)不滿足IMF的2個條件,則將h1(t)作為待處理的時間序列,重復(fù)步驟(1)、(2),直至h1(t)為一個基本模式分量,記為c1(t)=h1(t)。
3)從s(t)中去掉第一個IMF,得:r1(t)=s(t)-c1(t)(2)
4)將r1(t)作為新的原始時間序列,重復(fù)(1)、(2)、(3)求出第二個IMF,記為c2(t)。
5)重復(fù)上述步驟可依次分解得到:
r3(t)=r2(t)-c3(t)
r4(t)=r3(t)-c4(t)
rn(t)=rn-1(t)-cn(t) (3)
直至滿足篩選停止條件(Sd通常取0.2~0.3):
最后剩余的rn(t)即為原始信號的殘差。信號s(t)可表示如下:
圖4是本發(fā)明提供優(yōu)選實(shí)施例EEMD分解流程圖,具體步驟如下:
1)向待分析信號s(t)中加入高斯白噪聲序列σn(t),則有:
s1(t)=s(t)+σn(t) (6)
2)對s1(t)進(jìn)行EMD分解,得到IMF分量C1j(t)(j=1,2,…,n)和余項r1n(t),則:
3)重復(fù)步驟1N次,每次加入不同的高斯白噪聲序列;
4)重復(fù)步驟2,對加入高斯白噪聲序列的信號進(jìn)行EMD分解,則有:
5)將上述每次分解得到的IMF對應(yīng)求平均,由于白噪聲的不相關(guān)性,其統(tǒng)計平均值為0,因此最終得到的IMF為:
圖5和圖6分別是未使用和使用本專利提出的特征提取方法的分類混淆矩陣仿真圖,從兩張仿真圖可以明顯看出使用本專利所提的特征提取方法,使大多數(shù)分類行為的識別準(zhǔn)確率都有較大的提高,特別是對步行、上樓和下樓三種易混淆的行為,即圖中的第7,8,9三類,都有很好的區(qū)分作用。
以上這些實(shí)施例應(yīng)理解為僅用于說明本發(fā)明而不用于限制本發(fā)明的保護(hù)范圍。在閱讀了本發(fā)明的記載的內(nèi)容之后,技術(shù)人員可以對本發(fā)明作各種改動或修改,這些等效變化和修飾同樣落入本發(fā)明權(quán)利要求所限定的范圍。