一種基于陀螺儀的手寫數(shù)字識別方法與流程

文檔序號：11865343閱讀：820來源：國知局

本發(fā)明屬于手勢識別領域，具體涉及一種基于陀螺儀的手寫數(shù)字識別方法。

背景技術：

隨著科學技術的發(fā)展，人民大眾的生活和娛樂逐漸朝著智能、便捷的方向發(fā)展。手勢是人們經(jīng)常使用的操作與交流方式，使用先進的傳感設備和模式識別技術，對手勢進行識別，可以實現(xiàn)交流與遠程操控。尤其對于行動不便人群，利用手勢進行遠程操控成為了迫切的需求。

阿拉伯數(shù)字是一類具有確定規(guī)范筆畫的符號，為大部分人所知曉，易于操作、方便記憶，而且大部分設備集成了以阿拉伯數(shù)字為輸入的控制接口(如：電視機)。將手寫數(shù)字軌跡作為交互手勢，與用戶的日常使用習慣和心智模型相符。

目前的手勢識別方法還存在幾個明顯的缺點：1)手勢識別主要有兩種技術：基于計算機視覺的手勢識別和基于傳感器的手勢識別。基于計算機視覺的手勢識別受外部干擾較大(如光照條件變化)，并且受行為者外形的影響(如行為者著裝或攜帶重物)，甚至活動范圍也受到攝像頭的限制。2)各種傳感器被用于手勢識別，但是仍然很難解決舒適度差、識別范圍受限、識別率低、價格昂貴、傳感器數(shù)量多而導致的高功耗等問題。3)算法復雜度高，難以在硬件受限的條件下進行運算。

技術實現(xiàn)要素：

本發(fā)明要解決的技術問題是：提供一種基于陀螺儀的手寫數(shù)字識別方法，具有可穿戴效果好、成本低、無需其他的傳感器、功耗低的優(yōu)點。

本發(fā)明為解決上述技術問題所采取的技術方案為：一種基于陀螺儀的手寫數(shù)字識別方法，其特征在于：它包括以下步驟：

S1、通過佩戴在手腕上的陀螺儀采集角速度，其中每個采樣點對應一組角速度組，每組角速度組包括x軸角速度、y軸角速度和z軸角速度，x軸為人體的水平向右方向，z軸為重力方向，y軸人體的水平向前方向；分別計算每個采樣點的合成角速度；

S2、有效手勢數(shù)據(jù)的截?。翰捎萌撝档南蚯跋蚝笏阉鞯姆椒?，對合成角速度的值ω按時間進行截取，判斷有效手勢的起點與終點，截取若干段有效手勢數(shù)據(jù)段；每段有效手勢數(shù)據(jù)段包含若干個連續(xù)采樣點及其對應的角速度組和合成角速度；

S3、特征量的選取：

在有效手勢數(shù)據(jù)段中，每個軸的角速度均由3類子段組成：正段、負段和零段；正段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值均大于0，且最大值高于第一閾值；負段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值均小于0，且最小值低于第二閾值；零段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值在第一閾值和第二閾值之間變化；

選取以下5個特征量：(1)有效手勢數(shù)據(jù)段采樣點的數(shù)目T₁，即為從該段有效手勢數(shù)據(jù)段中，有效手勢的開始采樣點到終止采樣點的總個數(shù)；(2)x軸角速度ω_x的分段數(shù)T₂，為x軸角速度的正段、負段、零段的總數(shù)目；(3)z軸角速度ω_z的分段數(shù)T₃，為z軸角速度的正段、負段、零段的總數(shù)目；(4)x軸角速度的零段的位置T₄，根據(jù)x軸角速度的零段出現(xiàn)的位置為首段、尾段、中間段還是沒有零段，分別進行標識；(5)z軸角速度的零段的位置T₅，根據(jù)z軸角速度的零段出現(xiàn)的位置為首段、尾段、中間段還是沒有零段，分別進行標識；

S4、特征量的計算：

根據(jù)各特征量的定義，從S2得到的有效手勢數(shù)據(jù)段中分別計算；

S5、手寫數(shù)字的識別：

將計算的特征量與預設的0-9這10個數(shù)字的手勢數(shù)據(jù)進行比較，判斷有效手勢數(shù)據(jù)段對應書寫的是哪個數(shù)字。

按上述方法，所述的S5具體包含以下步驟：

S5-1、決策方法的建立：

建立6種決策方法，用計算的特征向量順序依次表示為：W₁＝[T₂,T₄,T₃,T₅]，W₂＝[T₃,T₅,T₂,T₄]，W₃＝[T₂,T₃,T₅,T₄]，W₄＝[T₂,T₃,T₄,T₅]，W₅＝[T₃,T₂,T₄,T₅]，W₆＝[T₃,T₂,T₅,T₄]；

S5-2、決策方法的動態(tài)選擇：

將預設的0-9這10個數(shù)字的手勢數(shù)據(jù)分為4類，分別為S₁＝{1}，S₂＝{0,6,7}，S₃＝{2,3,9}，S₄＝{4,5,8}；這4類對應的決策方法分別為：S₁對應任意決策方法，S₂對應W₁，S₃對應W₂，S₄對應W₂；

利用T₁的均值、T₁的中位數(shù)Q₂、T₁的第一四分位數(shù)Q₁、T₁的第三四分位數(shù)Q₃這四個屬性，依據(jù)這四個屬性進行模糊聚類，根據(jù)最大隸屬度原則，認為待識別對象T₁相對隸屬于S₁-S₄中哪一類，選擇該類對應的決策方法；

S5-3、按照所選擇的決策方法，依次計算特征向量，與預設的0-9這10個數(shù)字的手勢數(shù)據(jù)進行比較，判斷有效手勢數(shù)據(jù)段對應書寫的是哪個數(shù)字。

按上述方法，所述的S2中：有效手勢的起點的判斷：選取3個從小到大的閾值通過進行手勢運動開始的判定，選取大于的第一個采樣點，得到采樣點A_b；然后向前搜索小于的第一個采樣點，得到采樣點A_s；如果A_b與A_s這兩個采樣點的距離小于距離閾值D_A，則判定As為效手勢的起點；否則，從A_b開始向前搜索小于的第一個采樣點，得到時間點A_m，將A_m設為有效手勢的起點；

有效手勢的終點的判斷：選取3個從小到大的閾值選取滿足與其后N個采樣點的合成角速度和的平均值小于閾值的時間點B_s；然后從點B_s向前搜索大于較大閾值的第一個采樣點，得到采樣點B_b；如果B_s與B_b的距離小于距離閾值D_B，則將B_s設為有效手勢的終點；否則，從B_b開始向后搜索小于的第一個采樣點，得到采樣點B_m，將B_m設為有效手勢的終點。

按上述方法，所述的x軸角速度的零段的位置T₄，當x軸角速度的零段出現(xiàn)在首段，T₄標識為1；當x軸角速度的零段出現(xiàn)在尾段，T₄標識為-1；當x軸角速度的零段出現(xiàn)在中間段，T₄標識為0；當x軸角速度沒有零段，T₄標識為2；

所述的z軸角速度的零段的位置T₅標識方法與x軸角速度的零段的位置T₄相同。

按上述方法，所述的T₂的計算方法如下：

①尋找近似零點：先利用零點兩側(cè)數(shù)值的符號不同，尋找零點存在的采樣點區(qū)間，取該采樣點區(qū)間的兩個區(qū)間點中絕對值較小的點作為近似零點，將所有近似零點按照采樣時間順序排序，得到近似零點序列；

②去除首尾零點：分別從近似零點序列的首尾進行搜索，去除相距小于5的近似零點，更新近似零點序列；

③尋找非零段區(qū)間的零段：首先對近似零點序列的每個相鄰近似零點組成的區(qū)間進行搜索，若存在某個點的x軸角速度絕對值大于閾值Ω_t，則該區(qū)間為非零段區(qū)間，令該非零段區(qū)間為[a,b]；首段的角速度絕對值連續(xù)小于閾值Ω_t的點數(shù)為n₁，尾端的角速度絕對值連續(xù)小于閾值Ω_t的點數(shù)為n₂，若n₁>n₂并且n₁大于閾值N，則零段位于首段，且分段點為a+n₁；若n₁<n₂并且n₂大于閾值N，則零段位于尾段，分段點為b-n₂；否則該非零段區(qū)間不存在零段；將分段點補充到近似零點序列中，再次更新近似零點序列；

④去除連續(xù)零段分離段：若有連續(xù)的零段，去除其間的分段點，使其合為一段，并從近似零點序列中刪除相應的分段點；

⑤最終的近似零點序列中的點的個數(shù)減1，即為T₂；

所述的T₃的計算方法與T₂相同。

本發(fā)明的有益效果為：

1、利用本發(fā)明方法，只需要在手腕佩戴陀螺儀即可，具有可穿戴效果好、成本低、無需其他的傳感器、功耗低的優(yōu)點。

2、進一步的，通過決策樹的方法進行手勢識別，首先根據(jù)統(tǒng)計分析建立決策方法，然后根據(jù)模糊聚類方法進行模糊識別，選擇對應的決策方法進行識別，從而可以盡可能的使用耗時最短的方法對數(shù)字手勢進行識別，有利于實時性的提高，解決了算法復雜而導致的實時性差和電腦依賴性嚴重的問題。

附圖說明

圖1為本發(fā)明一實施例的運行總體流程圖。

圖2為本發(fā)明一實施例的有效手勢截取的示意圖。

圖3為本發(fā)明一實施例的有效手勢截取的程序流程圖。

圖4為本發(fā)明一實施例的有效手勢段的分類示意圖。

圖5為本發(fā)明一實施例的特征提取算法示意圖。

圖6為本發(fā)明一實施例的特征T₂與T₃的程序流程圖。

具體實施方式

下面結(jié)合具體實例和附圖對本發(fā)明做進一步說明。

本發(fā)明提高一種基于陀螺儀的手寫數(shù)字識別方法，如圖1所示，包括以下步驟：

S1、通過佩戴在手腕上的陀螺儀采集角速度，其中每個采樣點對應一組角速度組，每組角速度組包括x軸角速度、y軸角速度和z軸角速度，x軸為人體的水平向右方向，z軸為重力方向，y軸人體的水平向前方向；分別計算每個采樣點的合成角速度。

S2、有效手勢數(shù)據(jù)的截?。翰捎萌撝档南蚯跋蚝笏阉鞯姆椒?，對合成角速度的值ω按時間進行截取，判斷有效手勢的起點與終點，截取若干段有效手勢數(shù)據(jù)段；每段有效手勢數(shù)據(jù)段包含若干個連續(xù)采樣點及其對應的角速度組和合成角速度。

細化的，如圖2和圖3所示，所述的S2中：有效手勢的起點的判斷：選取3個從小到大的閾值通過進行手勢運動開始的判定，選取大于的第一個采樣點，得到采樣點A_b；然后向前搜索小于的第一個采樣點，得到采樣點A_s；如果A_b與A_s這兩個采樣點的距離小于距離閾值D_A，則判定As為效手勢的起點；否則，說明手勢開始時，人手的抖動誤差較大，從A_b開始向前搜索小于的第一個采樣點，得到時間點A_m，將A_m設為有效手勢的起點；

有效手勢的終點的判斷：選取3個從小到大的閾值選取滿足與其后N個采樣點的合成角速度和的平均值小于閾值的時間點B_s；然后從點B_s向前搜索大于較大閾值的第一個采樣點，得到采樣點B_b；如果B_s與B_b的距離小于距離閾值D_B，則將B_s設為有效手勢的終點；否則，說明手勢結(jié)束時，人手的抖動誤差較大，從B_b開始向后搜索小于的第一個采樣點，得到采樣點B_m，將B_m設為有效手勢的終點。

S3、特征量的選?。?/p>

如圖4所示，為了能夠分析數(shù)據(jù)，進行手勢數(shù)據(jù)的采集。經(jīng)分析發(fā)現(xiàn)，在有效手勢數(shù)據(jù)段中，每個軸的角速度均由3類子段組成：正段、負段和零段；正段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值均大于0，且最大值高于第一閾值；負段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值均小于0，且最小值低于第二閾值；零段的定義為：在該數(shù)據(jù)段中，數(shù)據(jù)的值在第一閾值和第二閾值之間變化。

選取以下5個特征量：(1)有效手勢數(shù)據(jù)段采樣點的數(shù)目T₁，即為從該段有效手勢數(shù)據(jù)段中，有效手勢的開始采樣點到終止采樣點的總個數(shù)；由于存在限制手勢速度的規(guī)定，所以有效手勢數(shù)據(jù)段采樣點的數(shù)目在一定程度上能夠反映出手勢的長短。(2)x軸角速度ω_x的分段數(shù)T₂，為x軸角速度的正段、負段、零段的總數(shù)目。(3)z軸角速度ω_z的分段數(shù)T₃，為z軸角速度的正段、負段、零段的總數(shù)目。(4)x軸角速度的零段的位置T₄，根據(jù)x軸角速度的零段出現(xiàn)的位置為首段、尾段、中間段還是沒有零段，分別進行標識。(5)z軸角速度的零段的位置T₅，根據(jù)z軸角速度的零段出現(xiàn)的位置為首段、尾段、中間段還是沒有零段，分別進行標識。

本實施例中，所述的x軸角速度的零段的位置T₄，當x軸角速度的零段出現(xiàn)在首段，T₄標識為1；當x軸角速度的零段出現(xiàn)在尾段，T₄標識為-1；當x軸角速度的零段出現(xiàn)在中間段，T₄標識為0；當x軸角速度沒有零段，T₄標識為2。

所述的z軸角速度的零段的位置T₅標識方法與x軸角速度的零段的位置T₄相同。

S4、特征量的計算：

根據(jù)各特征量的定義，從S2得到的有效手勢數(shù)據(jù)段中分別計算。

其中，T₁的計算可由截取后的有效數(shù)據(jù)中得到。記從有效數(shù)據(jù)段獲取其采樣點數(shù)目的平均時間長度為t₁。

如圖5和圖6所示，所述的T₂的計算方法如下：

①尋找近似零點：由于采樣點是離散的，所以并不能保證存在某一采樣點為零點。然而，可以先利用零點兩側(cè)數(shù)值的符號不同，尋找零點存在的采樣點區(qū)間，取該采樣點區(qū)間的兩個區(qū)間點中絕對值較小的點作為近似零點，將所有近似零點按照采樣時間順序排序，得到近似零點序列。

舉例說明，圖5中近似零點序列為：{14,23,25,46,60,62}。為了計算方便，則增加手勢數(shù)據(jù)首尾點進入近似零點序列，得到：{1,14,23,25,46,60,62,63}。

②去除首尾零點：由于截取有效手勢時，難免會存在誤差，所以對首尾的近似零點進行檢驗。分別從近似零點序列的首尾進行搜索，去除相距小于5的近似零點，更新近似零點序列。在圖5中，去除點62和點63，更新后的近似零點序列為{1,14,23,25,46,60}。

③尋找非零段區(qū)間的零段：由于零段分段點并不一定是上述序列中的某一點，所以首先對近似零點序列的每個相鄰近似零點組成的區(qū)間進行搜索，若存在某個點的x軸角速度絕對值大于閾值Ω_t，則該區(qū)間為非零段區(qū)間，令該非零段區(qū)間為[a,b]；首段的角速度絕對值連續(xù)小于閾值Ω_t的點數(shù)為n₁，尾端的角速度絕對值連續(xù)小于閾值Ω_t的點數(shù)為n₂，若n₁>n₂并且n₁大于閾值N，則零段位于首段，且分段點為a+n₁；若n₁<n₂并且n₂大于閾值N，則零段位于尾段，分段點為b-n₂；否則該非零段區(qū)間不存在零段；將分段點補充到近似零點序列中，再次更新近似零點序列。

在圖5中，取N＝5，Ω_t＝20,區(qū)間[25,46]為非零段，且該區(qū)間的前半部分存在零段，零段分段點為36，將其添加到近似零點序列中，再次更新后的近似零點序列為{1,14,23,25,36,46,60}。

④去除連續(xù)零段分離段：由于零段符號的不確定性，所以以上得到的近似零點序列可能會把連續(xù)的零段分離開。若有連續(xù)的零段，去除其間的分段點，使其合為一段，并從近似零點序列中刪除相應的分段點。

在圖5中，[14,23],[23,25],[25,36]為零段，所以去除分段點23和25，得到近似零點序列為{1,14,36,46,60}。

⑤最終的近似零點序列中的點的個數(shù)減1，即為T₂。本實施例中，T₂為5-1＝4。

所述的T₃的計算方法與T₂相同。

記上述計算T₂與T₃的各個步驟的一共耗費的平均時間長度分別為t₂和t₃，t₂≈t₃。

由④獲得的相鄰分段點組成的區(qū)間，檢測每個區(qū)間是否符合零段的要求，即每個點的絕對值是否小于閾值Ω_t，可以獲得零段的位置，并根據(jù)零段的位置對其進行標識。圖5中，第2段為零段。記從T₂與T₃的計算方法中，得到T₄與T₅的平均耗費時間長分別為t₄和t₅，其中，t₄≈t₅。

S5、手寫數(shù)字的識別：

將計算的特征量與預設的0-9這10個數(shù)字的手勢數(shù)據(jù)進行比較，判斷有效手勢數(shù)據(jù)段對應書寫的是哪個數(shù)字。

優(yōu)選的，為了能夠通過動態(tài)的選擇決策方法，跳過冗余特征量的計算，盡可能的使用耗時最短的方法對數(shù)字手勢進行識別，所述的S5具體包含以下步驟：

S5-1、決策方法的建立：

建立6種決策方法，用計算的特征向量順序依次表示為：W₁＝[T₂,T₄,T₃,T₅]，W₂＝[T₃,T₅,T₂,T₄]，W₃＝[T₂,T₃,T₅,T₄]，W₄＝[T₂,T₃,T₄,T₅]，W₅＝[T₃,T₂,T₄,T₅]，W₆＝[T₃,T₂,T₅,T₄]。

S5-2、決策方法的動態(tài)選擇：

上述決策方法的建立原理如下：

由上述5個特征量組成了特征向量T＝[T₁,T₂,T₃,T₄,T₅]。但是，經(jīng)統(tǒng)計分析發(fā)現(xiàn)，并非所有的數(shù)字手勢需要這五個特征量才能識別出來。記能夠最快識別該數(shù)字的特征向量為T_f，所需時間為t_f。下表統(tǒng)計出了這十個數(shù)字的T₂,T₃,T₄,T₅,T_f的值。

由于T₂與T₄、T₃與T₅的依賴性的限制，進行手寫數(shù)字識別分為六種決策方法，記為W_i(i＝1～6)。分別用計算的特征向量順序的表示為[T₂,T₄,T₃,T₅],[T₃,T₅,T₂,T₄],[T₂,T₃,T₅,T₄]，[T₂,T₃,T₄,T₅],[T₃,T₂,T₄,T₅],[T₃,T₂,T₅,T₄]。記使用每種方法識別各個數(shù)字的花費時間為t_wi(i＝1～6)，記t_wi與t_f之差為Δt_wi(i＝1～6)。

每種方法中都有一些數(shù)字在識別過程中，計算了多余的特征量，導致實時性較差并且能耗增加。所以可以采用動態(tài)選擇的方法，事先對手勢數(shù)據(jù)進行判別，獲取大致范圍后，再確定該計算的特征量。

利用T₁的均值、中位數(shù)Q₂、第一四分位數(shù)Q₁、第三四分位數(shù)Q₃這四個屬性，依據(jù)這四個屬性進行模糊聚類。將10個數(shù)字的手勢數(shù)據(jù)分為4類，分別為{1}，{0,6,7},{2,3,9},{4,5,8}分別用S₁～S₄表示。可以由T₁通過計算所屬各類的隸屬度，模糊地判斷所做手勢的類別。根據(jù)最大隸屬度原則，認為待識別對象T₁相對隸屬于類S_k，選擇該類的決策方法W_k。然后，確定每類的決策方法。以每類中數(shù)字的Δt_w1和最小為原則，S₁可選用任意一種，S₂選用W₁，S₃選用W₂,S₄選用W₂。通過動態(tài)地選擇決策方法，可以盡可能地使用耗時最短的方法對數(shù)字手勢進行識別，有利于實時性的提高。

具體的，圖5為手勢“4”的數(shù)據(jù)曲線圖。手勢的數(shù)據(jù)長度T₁為64，根據(jù)最大隸屬度原則，將該手勢分到S₄類，然后將S₄類的特征量計算順序W₂＝[T₃,T₅,T₂,T₄]進行計算。按照該方法，識別出手勢“4”，僅需要計算特征量T₃和T₅，節(jié)省了計算T₂和T₄的消耗時間。

以上實施例僅用于說明本發(fā)明的設計思想和特點，其目的在于使本領域內(nèi)的技術人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實施，本發(fā)明的保護范圍不限于上述實施例。所以，凡依據(jù)本發(fā)明所揭示的原理、設計思路所作的等同變化或修飾，均在本發(fā)明的保護范圍之內(nèi)。

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：李文鋒;姚丙盟;殷平寶;楊怡;
技術所有人：武漢理工大學;
我是此專利的發(fā)明人

上一篇：一種具有識別功能的移動終端的制作方法與工藝
上一篇：一種具有識別功能的智能機器人的制作方法與工藝

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于陀螺儀的手寫數(shù)字識別方法與流程