專利名稱:手勢識別裝置及識別方法
手勢識別裝置及識別方法技術(shù)領(lǐng)域:
本發(fā)明涉及手勢識別領(lǐng)域,尤其涉及一種手勢識別裝置及識別方法。背景技術(shù):
隨著個人電子產(chǎn)品的不斷發(fā)展,人與電子設備交互的方式也在不斷變化,從一開始的鍵盤輸入,到觸摸輸入,現(xiàn)在又出現(xiàn)了新的非接觸式的手勢識別人際交互模式。
目前流行的手勢識別的方式有基于視頻的手勢識別以及基于語音的手勢識別?;谝曨l的手勢識別具有計算量大、誤判率高、對光照有要求等缺點。而基于語音的手勢識別通過捕獲例如關(guān)鍵詞的講話過程獲得的一組語音的信息,這樣就要求人的發(fā)音準確性以及需要記住語音命令等缺陷。
因此,有必要提供一種新型的手勢識別裝置及識別方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種手勢識別裝置及識別方法,具有計算量小、誤判率低、 無需依賴光的特點,并且可以在個人電腦、筆記本電腦、平板電腦以及其它移動設備上通過揚聲器和麥克風實現(xiàn)對電腦的非接觸式指令輸出。
一種手勢識別裝置,該裝置包括左聲源和右聲源,所述左聲源和右聲源水平向間隔設置,用于向手勢探測區(qū)域發(fā)出聲音信號;信號采集模塊,所述信號采集模塊置于所述左聲源和右聲源的連線的中垂線上,用于接收左聲源和右聲源發(fā)出的聲音信號并將聲音信號轉(zhuǎn)化為音頻信號;手勢分析模塊,接收信號采集模塊輸出的音頻信號,對音頻信號進行處理得到二值化的頻移曲線,根據(jù)所述頻移曲線得出手勢的狀態(tài)序列,將手勢的狀態(tài)序列與模板序列作比較,確定手勢并輸出指令。
優(yōu)選的,所述左聲源和右聲源之間的間距為3(T60cm。
優(yōu)選的,所述手勢探測區(qū)域位于左聲源和右聲源的前方,并且離左聲源和右聲源的距離為l(T40cm。
一種手勢識別方法,該方法包括如下步驟S1,左聲源和右聲源分別向手勢探測區(qū)域發(fā)出聲音信號;S2,信號采集模塊接收左聲源和右聲源發(fā)出的聲音信號并將聲音信號轉(zhuǎn)化為音頻信號,所述音頻信號包括直接由左聲源和右聲源發(fā)出且不經(jīng)過手勢探測區(qū)域反射的基準信號和經(jīng)過手勢探測區(qū)域反射回來的頻移信號;S3,手勢分析模塊接收并分析信號采集模塊輸出的音頻信號,確定手勢并輸出指令,其具體步驟下S31,對音頻信號進行加窗處理,漢明窗的系數(shù)公式為N
其中,所述N=L-1,L為漢明窗長度,漢明窗長度與FFT的長度一致;S32,將音頻信號從時域轉(zhuǎn)化為頻域,分離音頻信號中的基準信號和頻移信號,并提取頻移信號;S33,將頻移信號除以基準信號的幅值,得到歸一化的頻移信號;S34,分別對音頻信號的藍移與紅移η
w(n)=0.54 — 0.46 csc(2tt—),O < η <的能量求和,所述藍移或紅移能量和的公式為
權(quán)利要求
1.一種手勢識別裝置,其特征在于,該裝置包括 左聲源和右聲源,所述左聲源和右聲源水平向間隔設置,用于向手勢探測區(qū)域發(fā)出聲音信號; 信號采集模塊,所述信號采集模塊置于所述左聲源和右聲源的連線的中垂線上,用于接收左聲源和右聲源發(fā)出的聲音信號并將聲音信號轉(zhuǎn)化為音頻信號; 手勢分析模塊,接收信號采集模塊輸出的音頻信號,對音頻信號進行處理得到二值化的頻移曲線,根據(jù)所述頻移曲線得出手勢的狀態(tài)序列,將手勢的狀態(tài)序列與模板序列作比較,確定手勢并輸出指令。
2.根據(jù)權(quán)利要求1所述的手勢識別裝置,其特征在于所述左聲源和右聲源之間的間距為30 60cm。
3.根據(jù)權(quán)利要求1或2所述的手勢識別裝置,其特征在于所述手勢探測區(qū)域位于左聲源和右聲源的前方,并且離左聲源和右聲源的距離為l(T40cm。
4.一種手勢識別方法,其特征在于,該方法包括如下步驟 S 1,左聲源和右聲源分別向手勢探測區(qū)域發(fā)出聲音信號; S2,信號采集模塊接收左聲源和右聲源發(fā)出的聲音信號并將聲音信號轉(zhuǎn)化為音頻信號,所述音頻信號包括直接由左聲源和右聲源發(fā)出且不經(jīng)過手勢探測區(qū)域反射的基準信號和經(jīng)過手勢探測區(qū)域反射回來的頻移信號; S3,手勢分析模塊接收并分析信號采集模塊輸出的音頻信號,確定手勢并輸出指令,其具體步驟如下 S31,對音頻信號進行加窗處理,漢明窗的系數(shù)公式為
5.根據(jù)權(quán)利要求4所述的手勢識別方法,其特征在于所述左聲源和右聲源輸出的聲音信號都為單頻信號,其頻率范圍為18kHz 22kHz。
6.根據(jù)權(quán)利要求5所述的手勢識別方法,其特征在于所述左聲源和右聲源分別輸出的聲音信號的頻率之差不小于IOOOHz。
7.根據(jù)權(quán)利要求4所述的手勢識別方法,其特征在于在步驟S3中,所述漢明窗的長度L的取值范圍為4096 8192。
8.根據(jù)權(quán)利要求4所述的手勢識別方法,其特征在于在步驟S34中,在對音頻信號的藍移與紅移的能量求和時,需要預先設定基準頻率的帶寬Be和頻移頻率的帶寬Bs。
9.根據(jù)權(quán)利要求4所述的手勢識別方法,其特征在于在步驟S35中,正閥值的取值范圍為O. 00005^0. 0005,負閥值的取值范圍為-O. 00005^-0. 0005。
全文摘要
本發(fā)明涉及了一種手勢識別裝置及識別方法,該裝置包括左聲源和右聲源,所述左聲源和右聲源水平向間隔設置,用于向手勢探測區(qū)域發(fā)出聲音信號;信號采集模塊,所述信號采集模塊置于所述左聲源和右聲源的連線的中垂線上,用于接收左聲源和右聲源發(fā)出的聲音信號并將聲音信號轉(zhuǎn)化為音頻信號;手勢分析模塊,接收并分析信號采集模塊輸出的音頻信號,確定手勢并輸出指令。本發(fā)明提供的手勢識別裝置及識別方法,具有計算量小、誤判率低、無需依賴光的特點,并且可以在個人電腦、筆記本電腦、平板電腦以及其它移動設備上通過揚聲器和麥克風實現(xiàn)對電腦的非接觸式指令輸出。
文檔編號G06F3/16GK102981615SQ20121043580
公開日2013年3月20日 申請日期2012年11月5日 優(yōu)先權(quán)日2012年11月5日
發(fā)明者王小軍, 唐琪 申請人:瑞聲聲學科技(深圳)有限公司, 瑞聲科技(南京)有限公司, 瑞聲聲學科技(常州)有限公司