本發(fā)明涉及普適計算中的人類運動識別領域,更具體的說是一種基于lstm模型的運動行為識別方法。
背景技術:
普適計算又稱普存計算、普及計算,這一概念強調和環(huán)境融為一體的計算,而計算機本身則從人們的視線里消失。在普適計算的模式下,人們能夠在任何時間、任何地點、以任何方式進行信息的獲取與處理。間斷連接與輕量計算(即計算資源相對有限)是普適計算最重要的兩個特征。普適計算的軟件技術就是要實現(xiàn)在這種環(huán)境下的事務和數(shù)據(jù)處理。
早期的運動識別主要是基于視覺方式的,給定一段圖像序列或者一個視頻片段,識別出人物的運動類型。基于視覺的方法具有交互自然,提取的特征信息豐富等優(yōu)點,但該方法在實際應用中也有一些局限性,需要克服很多問題。如環(huán)境中的光照條件,人物在攝像機前的位置,場地的大小等。
隨著運動手環(huán)和智能手表的普及,基于傳感器的運動識別變得越發(fā)引人關注。傳感器具有價格便宜,攜帶方便,不受場地限制等優(yōu)點,隨著這些設備的發(fā)展,運動識別又被帶入了一片新的研究領域,補充了傳統(tǒng)基于視覺的運動識別方法在實際應用中的不足,促使了運動識別在日常生活中的應用。在運動行為領域中占主導地位的技術方法包括用身體佩帶的傳感器,手動設計特征提取程序,以及各種(監(jiān)督)分類方法。傳統(tǒng)識別方法往往需要人工提取特征,而不同的運動往往會提取不同的特征。因此在實際應用中會帶來諸多不便。而隨著深度神經網絡的興起,由于其對原始數(shù)據(jù)的要求較少,為上述在傳統(tǒng)識別中存在的問題的帶來了新的解決思路。
技術實現(xiàn)要素:
本發(fā)明主要解決的技術問題是提供一種基于lstm模型的運動行為識別方法,能夠用相對較少的數(shù)據(jù)取得良好識別準確率,同時克服了當前分類算法中需要人工提取特征的不足,使之能夠在實際中廣泛應用。
為解決上述技術問題,本發(fā)明涉及普適計算中的人類運動識別領域,更具體的說是一種基于lstm模型的運動行為識別方法,該方法包括以下步驟:
步驟s1:通過戴在人手部的傳感器手環(huán)采集到不同人的有關多組運動的時間序列數(shù)據(jù);
步驟s2:對采集到的多維原始數(shù)據(jù)標注出其對應的運動類型,保證接下來監(jiān)督學習的進行;
步驟s3:對訓練數(shù)據(jù)進行必要的處理,然后將其作為輸入數(shù)據(jù)傳入到lstm型模型進行訓練,獲取最佳的神經網絡參數(shù),作為最終識別模型;
步驟s4:對待識別的運動行為數(shù)據(jù)進行預處理,并將其作為lstm型模型的輸入,計算輸出層概率最大的運動序列,將所述結果作為最終識的運動類別。
作為本技術方案的進一步優(yōu)化,本發(fā)明一種基于lstm模型的運動行為識別方法所述的步驟s1具體為:用運動手環(huán)獲取人的運動時的時間序列數(shù)據(jù),包括心率、三軸加速度傳感器數(shù)據(jù)。
作為本技術方案的進一步優(yōu)化,本發(fā)明一種基于lstm模型的運動行為識別方法所述的步驟s2具體為:將收集到的不同測試對象的數(shù)據(jù)按照其當時的運動類別進行標注,形成一個可用于監(jiān)督學習維度為f的完整數(shù)據(jù)集。
作為本技術方案的進一步優(yōu)化,本發(fā)明一種基于lstm模型的運動行為識別方法所述的步驟s3具體為:對收集到的數(shù)據(jù)按照下述步驟進行預處理,首先去掉過渡狀態(tài)運動狀態(tài)的數(shù)據(jù),填充缺失值,去掉時間標記,然后根據(jù)傳感器采樣頻率fhz,設計一個窗口大小為2f,步長為f的滑動窗口對時間序列數(shù)據(jù)進行分割;隨后將分割好的數(shù)據(jù)進行歸一化處理,使其符合sigmoid函數(shù)的形式;最后將處理好的數(shù)據(jù)傳入lstm型模型進行訓練,其中損失函數(shù)為categoricalcross-entropy,優(yōu)化器為rmsprop,學習率為0.001;通過訓練模型獲得不同運動類別對應的權重參數(shù)。
本發(fā)明一種基于lstm模型的運動行為識別方法的有益效果為:
本發(fā)明一種基于lstm模型的運動行為識別方法,能夠用相對較少的數(shù)據(jù)取得良好識別準確率,同時克服了當前分類算法中需要人工提取特征的不足,使之能夠在實際中廣泛應用。
附圖說明
下面結合附圖和具體實施方法對本發(fā)明做進一步詳細的說明。
圖1為本發(fā)明一種基于lstm模型的運動行為識別方法的數(shù)據(jù)收集、處理與lstm模型構建的流程圖。
圖2為本發(fā)明一種基于lstm模型的運動行為識別方法搭建的lstm模型圖。
圖3為本發(fā)明一種基于lstm模型的運動行為識別方法的lstm單元展開示意圖。
圖4為本發(fā)明一種基于lstm模型的運動行為識別方法的lstm單元內部詳解示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
步驟s1具體為:用運動手環(huán)獲取人的運動時的時間序列數(shù)據(jù),具體為心率監(jiān)測器收集到的心率、三軸加速度傳感器收集的xyz方向上的加速度。
步驟s2具體為:將收集到的不同測試對象的數(shù)據(jù)按照其當時的運動類別進行標注,形成一個可用于監(jiān)督學習維度為f的完整數(shù)據(jù)集。
如圖1所示,所述步驟s3具體為:對收集到的數(shù)據(jù)按照進行預處理。首先去掉過渡狀態(tài)運動狀態(tài)的數(shù)據(jù),填充缺失值,去掉時間標記,然后根據(jù)傳感器采樣頻率fhz,設計一個窗口大小為2f,步長為f的滑動窗口對時間序列數(shù)據(jù)進行分割。隨后將分割好的數(shù)據(jù)進行歸一化處理,使其符合sigmoid函數(shù)的形式。最后將處理好的數(shù)據(jù)傳入設計好的lstm型模型進行訓練,其中損失函數(shù)為categoricalcross-entropy,優(yōu)化器為rmsprop,學習率為0.001。通過訓練模型獲得不同運動類別對應的權重參數(shù)。
如圖2所示,所述的lstm型模型包括輸入層、隱藏層、斷開層和輸出層,輸入層的輸入為時間步數(shù)為t的滑動窗口,輸出層的輸出為輸入所對應的運動類別序列a1、a2、a3…am,激活函數(shù)為softmax函數(shù),隱藏層包括多個lstm單元,斷開層的斷開率為50%,以防止過擬合。時間步長為t,維度為f。
如圖3所示,為了研究移動數(shù)據(jù)的時序依賴,我們使用了遞歸數(shù)據(jù)網絡,它基于vanilla變型的lstm單元。當網絡中的一些連接形成定向循環(huán)時,該結構是遞歸的,其中當前的時間t會考慮到前面時間t-1的網絡狀態(tài)。當錯誤的衍生物通過遞歸網絡中的很多層“通過時間”進行反向傳播時,lstm單元用于抑制梯度下降。每一個lstm單元(聯(lián)合)都會持續(xù)追蹤代表他“記憶”的內部狀態(tài)。隨著時間的推移,該單元學會,輸出,覆蓋,或者基于當前的輸出和過去的內部狀態(tài)清空他們的內存,從而使一個系統(tǒng)保留數(shù)百個時間步長的信息。
如圖4所示,lstm單元包括3個控制門(inputgate,outputgate,forgetgate),用于控制輸入、輸出及跨越時間步驟自身的內部狀態(tài)三者之間的關聯(lián)。其中ft=σ(wf·[ht-1,xt]+bf);it=σ(wi·[ht-1,xt]+bi);
所述步驟具體為使用收集來的測試數(shù)據(jù)生產lstm模型最終對所述待識別時間序列進行識別,即首先對原始數(shù)據(jù)進行預處理,使其成為模型可以識別的數(shù)據(jù)集,然后通過模型進行預測,以生成運動類別結果。
當然,上述說明并非對本發(fā)明的限制,本發(fā)明也不僅限于上述舉例,本技術領域的普通技術人員在本發(fā)明的實質范圍內所做出的變化、改型、添加或替換,也屬于本發(fā)明的保護范圍。