超聲波手勢(shì)識(shí)別方法及系統(tǒng)與流程

文檔序號(hào)：11951945閱讀：1533來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于人機(jī)交互領(lǐng)域，尤其涉及非接觸式手勢(shì)識(shí)別方法。
背景技術(shù)：
：隨著諸如智能手機(jī)、手表、手環(huán)等可穿戴智能移動(dòng)終端的普及，手勢(shì)識(shí)別在人機(jī)交互領(lǐng)域扮演著越來越重要的角色。智能手表、手環(huán)等可穿戴設(shè)備由于設(shè)備屏幕小或者不配備顯示屏，導(dǎo)致傳統(tǒng)的按鍵或觸摸屏式的手勢(shì)識(shí)別方法難以直接應(yīng)用，非接觸式手勢(shì)識(shí)別方法應(yīng)運(yùn)而生。傳統(tǒng)的非接觸式手勢(shì)識(shí)別方法主要基于計(jì)算機(jī)視覺、數(shù)據(jù)手套、運(yùn)動(dòng)傳感器等，存在對(duì)光照敏感、計(jì)算復(fù)雜度高、操作不方便、操作范圍有限等問題。超聲波手勢(shì)識(shí)別方法是一種新型的非接觸式手勢(shì)識(shí)別方法，具有對(duì)光照不敏感、算法復(fù)雜度低、耗費(fèi)資源少、感應(yīng)范圍廣以及對(duì)設(shè)備硬件要求低等優(yōu)點(diǎn)，更適合于可穿戴智能移動(dòng)設(shè)備。近年來，超聲波手勢(shì)識(shí)別隨著智能可穿戴設(shè)備的發(fā)展越來越受到國(guó)內(nèi)外研究人員的關(guān)注。超聲波手勢(shì)識(shí)別方法通常是通過監(jiān)測(cè)手部運(yùn)動(dòng)引發(fā)的超聲波多普勒效應(yīng)來識(shí)別手勢(shì)。但日常生活中手部運(yùn)動(dòng)很靈活，而且誤操作發(fā)生的可能性較大，現(xiàn)有的超聲波手勢(shì)識(shí)別方法的識(shí)別準(zhǔn)確率并不理想。技術(shù)實(shí)現(xiàn)要素：因此，本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺陷，提供一種新的超聲波手勢(shì)識(shí)別方法，其兼顧手部運(yùn)動(dòng)發(fā)生時(shí)的情境因素，利用情境信息排除手部誤操作的影響以提高手勢(shì)識(shí)別的準(zhǔn)確率和魯棒性。本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的：一方面，本發(fā)明提供了一種超聲波手勢(shì)識(shí)別方法，包括：a)發(fā)射超聲波信號(hào)；b)采集超聲波信號(hào)并同時(shí)采集與當(dāng)前情境相關(guān)的情境信息，其中所述情境信息包括影響手勢(shì)發(fā)生的一個(gè)或多個(gè)情境因素；c)基于發(fā)射的和采集的超聲波信號(hào)獲取手勢(shì)特征；d)利用預(yù)先訓(xùn)練好的手勢(shì)分類模型獲取該手勢(shì)特征的手勢(shì)概率向量，所述手勢(shì)概率向量由所述手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率構(gòu)成；e)基于所采集的情境信息和預(yù)定的情境特征矩陣來確定與所述手勢(shì)特征相關(guān)的情境概率向量，其中所述情境特征矩陣由所述預(yù)設(shè)的各種手勢(shì)在各個(gè)情境因素下發(fā)生的概率構(gòu)成，所述情境概率向量由預(yù)設(shè)的各種手勢(shì)在當(dāng)前情境下發(fā)生的概率構(gòu)成；f)基于所述手勢(shì)概率向量和所述情境概率向量確定在當(dāng)前情境中所述手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率并將其中最大概率對(duì)應(yīng)的手勢(shì)識(shí)別為與所采集的超聲波信號(hào)對(duì)應(yīng)的手勢(shì)。在一個(gè)實(shí)施例中，在步驟f)還可包括判斷該最大概率是否在所識(shí)別的手勢(shì)對(duì)應(yīng)的置信區(qū)間中，如果在，則對(duì)該手勢(shì)進(jìn)行響應(yīng)。在一個(gè)實(shí)施例中，該方法還可包括訓(xùn)練手勢(shì)分類模型的步驟，所述手勢(shì)分類模型采用基于機(jī)器學(xué)習(xí)的方法來實(shí)現(xiàn)，所述手勢(shì)分類模型的輸入為手勢(shì)特征，輸出為手勢(shì)概率向量。在一個(gè)實(shí)施例中，所述置信區(qū)間可以通過下列步驟得到的：確定用來進(jìn)行訓(xùn)練的樣本數(shù)據(jù)集，所述樣本數(shù)據(jù)集中包括手勢(shì)特征樣本，與該手勢(shì)特征樣本相關(guān)的情境信息；對(duì)于樣本數(shù)據(jù)集中的每個(gè)手勢(shì)特征樣本：根據(jù)預(yù)定的各種手勢(shì)給該手勢(shì)特征樣本標(biāo)注其所屬的手勢(shì)種類，利用預(yù)先訓(xùn)練好的手勢(shì)分類模型獲取該手勢(shì)特征樣本的手勢(shì)概率向量，基于與該手勢(shì)特征樣本相關(guān)的情境信息和預(yù)定的情境特征矩陣來確定與該手勢(shì)特征樣本相關(guān)的情境概率向量，該情境概率向量由預(yù)設(shè)的各種手勢(shì)在采集該手勢(shì)特征樣本時(shí)的情境下發(fā)生的概率構(gòu)成；基于所述手勢(shì)概率向量和所述情境概率向量得到所述手勢(shì)特征在其相關(guān)情境中屬于預(yù)設(shè)的各種手勢(shì)的概率；以及基于各個(gè)手勢(shì)特征樣本所得到的概率及其所標(biāo)注的手勢(shì)種類來設(shè)置并調(diào)整各種手勢(shì)對(duì)應(yīng)的置信區(qū)間。又一方面，本發(fā)明提供了一種超聲波手勢(shì)識(shí)別系統(tǒng)，包括：超聲波收發(fā)裝置，用于采集和發(fā)射超聲波信號(hào)；情境信息采集裝置，用于采集與當(dāng)前情境相關(guān)的情境信息，其中所述情境信息包括影響手勢(shì)發(fā)生的一個(gè)或多個(gè)情境因素；手勢(shì)分類裝置，用于基于發(fā)射的和采集的超聲波信號(hào)獲取手勢(shì)特征，以及利用預(yù)先訓(xùn)練好的手勢(shì)分類模型獲取該手勢(shì)特征的手勢(shì)概率向量，所述手勢(shì)概率向量由所述手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率構(gòu)成；情境映射裝置，用于基于所采集的情境信息和預(yù)定的情境特征矩陣來確定與所述手勢(shì)特征相關(guān)的情境概率向量，其中所述情境特征矩陣由所述預(yù)設(shè)的各種手勢(shì)在各個(gè)情境因素下發(fā)生的概率構(gòu)成，所述情境概率向量由預(yù)設(shè)的各種手勢(shì)在當(dāng)前情境下發(fā)生的概率構(gòu)成；手勢(shì)識(shí)別裝置，用于基于所述手勢(shì)概率向量和所述情境概率向量確定在當(dāng)前情境中所述手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率并將其中最大概率對(duì)應(yīng)的手勢(shì)識(shí)別為與所采集的超聲波信號(hào)對(duì)應(yīng)的手勢(shì)。與現(xiàn)有技術(shù)相比，本發(fā)明的優(yōu)點(diǎn)在于：將手勢(shì)信號(hào)與情境信息相融合，使用情境信息過濾用戶的誤操作手勢(shì)、修正識(shí)別錯(cuò)誤的手勢(shì)，減少無效甚至錯(cuò)誤的響應(yīng)，從而提高了手勢(shì)識(shí)別的準(zhǔn)確率和魯棒性，增強(qiáng)了人機(jī)交互體驗(yàn)。附圖說明以下參照附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步說明，其中：圖1為根據(jù)本發(fā)明實(shí)施例的超聲波手勢(shì)識(shí)別方法的流程示意圖；圖2為根據(jù)本發(fā)明實(shí)施例的訓(xùn)練融合情境信息的手勢(shì)識(shí)別模型的流程示意圖；圖3a為安靜環(huán)境下根據(jù)本發(fā)明實(shí)施例的手勢(shì)識(shí)別方法與傳統(tǒng)無情境信息的手勢(shì)識(shí)別方法的識(shí)別準(zhǔn)確率對(duì)比示意圖；圖3b為標(biāo)準(zhǔn)環(huán)境下根據(jù)本發(fā)明實(shí)施例的手勢(shì)識(shí)別方法與傳統(tǒng)無情境信息的手勢(shì)識(shí)別方法的識(shí)別準(zhǔn)確率對(duì)比示意圖；圖3c為喧鬧環(huán)境下根據(jù)本發(fā)明實(shí)施例的手勢(shì)識(shí)別方法與傳統(tǒng)無情境信息的手勢(shì)識(shí)別方法的識(shí)別準(zhǔn)確率對(duì)比示意圖。具體實(shí)施方式為了使本發(fā)明的目的，技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下結(jié)合附圖通過具體實(shí)施例對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例僅用以解釋本發(fā)明，并不用于限定本發(fā)明。人們的行為表現(xiàn)往往會(huì)受其所處的情境的影響，相同手勢(shì)在不同情境下發(fā)生概率可能不同。而現(xiàn)有的超聲波識(shí)別方法只關(guān)注于手部運(yùn)動(dòng)，采集到相關(guān)手勢(shì)數(shù)據(jù)即進(jìn)行識(shí)別，而并不考慮當(dāng)前手勢(shì)是否適合用戶當(dāng)前所處的環(huán)境，忽略了用戶的真正意圖，由此經(jīng)常導(dǎo)致無效甚至錯(cuò)誤的響應(yīng)。在本發(fā)明中，提供了一種融合情境感知信息的超聲波手勢(shì)識(shí)別方法，同時(shí)采集手勢(shì)數(shù)據(jù)和當(dāng)前情境信息，融合兩者作為手勢(shì)識(shí)別的輸入信息，利用情境信息過濾誤操作手勢(shì)、修正識(shí)別錯(cuò)誤的手勢(shì)等，以盡量減少無效或錯(cuò)誤響應(yīng)，識(shí)別出符合用戶真正意圖的手勢(shì)。以播放音樂的應(yīng)用為例，當(dāng)前的環(huán)境聲音和音樂播放音量都會(huì)影響用戶調(diào)整音量的行為。例如，當(dāng)環(huán)境聲音較大、播放音量較低時(shí)，調(diào)高播放音量的可能性較大；反之，調(diào)低播放音量的可能性較大。而如果當(dāng)前環(huán)境很安靜并且當(dāng)前播放音量較高，但檢測(cè)到用戶的手部運(yùn)動(dòng)為調(diào)高音量的手勢(shì)，那么可以不對(duì)該手勢(shì)進(jìn)行響應(yīng)，因?yàn)樵撌謩?shì)可能是由于手部無意識(shí)的運(yùn)動(dòng)產(chǎn)生的誤操作。對(duì)于超聲波手勢(shì)識(shí)別方法的不同應(yīng)用場(chǎng)景，所設(shè)定的手勢(shì)種類以及影響手勢(shì)發(fā)生的相關(guān)情境因素有很大差異。本發(fā)明的方法對(duì)于具體的手勢(shì)種類以及影響手勢(shì)發(fā)生的情境因素不進(jìn)行任何限制，本領(lǐng)域技術(shù)人員可以根據(jù)具體的應(yīng)用場(chǎng)景來對(duì)此進(jìn)行相應(yīng)的選擇和設(shè)置。圖1給出了根據(jù)本發(fā)明一個(gè)實(shí)施例的超聲波手勢(shì)識(shí)別方法的流程示意。該方法實(shí)際上可以分為在線實(shí)時(shí)手勢(shì)識(shí)別和離線訓(xùn)練手勢(shì)識(shí)別模型兩個(gè)階段。如圖1所示，在線實(shí)時(shí)手勢(shì)識(shí)別主要包括(1)發(fā)射超聲波以及采集超聲波信號(hào)與當(dāng)前情境相關(guān)的情境信息；(2)提取手勢(shì)特征和情境特征；(3)基于所提取的手勢(shì)特征和情境特征進(jìn)行手勢(shì)識(shí)別。更具體地，首先采集超聲波信號(hào)并同時(shí)采集與當(dāng)前情境相關(guān)的情境信息，這里，情境信息可以包括影響手勢(shì)發(fā)生的一個(gè)或多個(gè)情境因素，其隨具體應(yīng)用場(chǎng)景而不同。在不同情境下，用戶可能的手勢(shì)集合不同，相同手勢(shì)發(fā)生的概率也不相同。在特定情境下，如果一個(gè)手勢(shì)符合情境信息的要求，那么這種手勢(shì)發(fā)生的概率較大；反之，這種手勢(shì)發(fā)生的概率較小。在特定情境下，影響手勢(shì)發(fā)生的情境因素可能有一個(gè)，也可能有多個(gè)。為說明方便，下面假定有M種手勢(shì)和L個(gè)情境因素，可以根據(jù)具體應(yīng)用場(chǎng)景和具體的情境因素來預(yù)先確定各種手勢(shì)在各情境因素下發(fā)生的概率。這里為描述方便，以矩陣的方式來表示這些概率，假定情境特征矩陣A為由各種手勢(shì)在各情境因素下發(fā)生的概率構(gòu)成的矩陣，可記為(amk)M×L，其中amk＝pmk(ck)表示第m種手勢(shì)在第k個(gè)情境因素ck下發(fā)生的概率(1≤m≤M，1≤k≤L)。具體概率計(jì)算方式可以依具體應(yīng)用場(chǎng)景和具體的情境因素不同。這里為方便，仍以播放音樂的應(yīng)用為例，假定有“前伸”和“后拉”兩種手勢(shì)，分別對(duì)應(yīng)“調(diào)高播放音量”和“調(diào)低播放音量”兩種用戶調(diào)整音量的行為。在音樂播放活動(dòng)中，當(dāng)前的環(huán)境聲音和音樂播放音量都會(huì)影響用戶調(diào)整音量的行為。例如，當(dāng)環(huán)境聲音較大、播放音量較低時(shí)，調(diào)高播放音量的可能性較大；反之，調(diào)低播放音量的可能性較大。這里將用戶所處的環(huán)境音量、當(dāng)前播放音量設(shè)定為影響手勢(shì)產(chǎn)生的兩個(gè)情境因素。其中，對(duì)于環(huán)境音量，對(duì)應(yīng)安靜(聲音低于20dB)、標(biāo)準(zhǔn)(聲音處于20dB-40dB)、喧鬧(聲音高于40dB)共3種環(huán)境。在標(biāo)準(zhǔn)環(huán)境中調(diào)高和調(diào)低音量的可能性相差不大。在一個(gè)示例中，可以選擇適當(dāng)?shù)母怕屎瘮?shù)來設(shè)置各種手勢(shì)在各情境因素下發(fā)生的概率。例如假設(shè)“前伸”和“后拉”兩種手勢(shì)在典型標(biāo)準(zhǔn)環(huán)境音28dB情況下發(fā)生的概率均為0.5，那么如果檢測(cè)到當(dāng)前環(huán)境音量為15dB，則調(diào)低音量的可能性增加而調(diào)高音量的可能性減小，“前伸”手勢(shì)在當(dāng)前環(huán)境中發(fā)生的概率例如可以為0.5-0.5*15/28，而“后拉”手勢(shì)在當(dāng)前環(huán)境中發(fā)生的概率例如可以為0.5+0.5*15/28。在又一示例中，也可以通過分段函數(shù)的方式來指定各種手勢(shì)在各情境因素下發(fā)生的概率。例如，將環(huán)境聲音的取值范圍分段，不同的范圍設(shè)置不同的概率。例如，當(dāng)環(huán)境聲音處于20dB-25dB時(shí)，將“前伸”手勢(shì)發(fā)生的概率設(shè)定為0.45，當(dāng)環(huán)境聲音處于25db-30db之間時(shí)，將“前伸”手勢(shì)發(fā)生的概率設(shè)置為0.5，可以此類推。上述概率計(jì)算方法僅是舉例說明而非進(jìn)行任何限制。具體的概率設(shè)置可以實(shí)際需求和具體應(yīng)用場(chǎng)景和情境因素等而具體確定。繼續(xù)參考圖1，在采集到超聲波信號(hào)之后，從發(fā)射的超聲波和接收的超聲波信號(hào)的多普勒頻移獲取表征該采集的超聲波信號(hào)的手勢(shì)特征，典型的手勢(shì)特征包括但不限于最大值、最小值、均值、標(biāo)準(zhǔn)方差、過零率、百分位數(shù)、關(guān)聯(lián)系數(shù)、功率譜密度、頻域熵、譜峰位置等。同時(shí)，基于采集的當(dāng)前情境的情境信息和上述設(shè)定的情境特征矩陣來獲取與該手勢(shì)特征相關(guān)的情境特征，該情境特征可以采用由預(yù)設(shè)的各種手勢(shì)在當(dāng)前情境下發(fā)生的概率構(gòu)成的向量來表示，也可以稱為情境概率向量。假設(shè)當(dāng)前采集的情境信息記為c＝(c1,c2,…,ck,…cL)，ck表示影響當(dāng)前采集的第k個(gè)情境因素，那么通過預(yù)先確定的情境特征矩陣A可以獲得預(yù)定的M種手勢(shì)在當(dāng)前情境c下發(fā)生的概率，這些概率組成了一個(gè)M維的向量，即得到與當(dāng)前采集的超聲波的手勢(shì)特征相關(guān)的情境概率向量C＝[p1(c),…,pm(c),…,pM(c)]，其中pm(c)表示第m種手勢(shì)在當(dāng)前情境c下發(fā)生的概率，即pm(c)＝p(c1,c2,…,ck,…cL),其概率值例如為p1(c1)·p2(c2)·…·pM(cL)?？梢钥闯觯c該手勢(shì)特征相關(guān)的情境概率向量C由表示預(yù)定的各種手勢(shì)在采集該手勢(shì)數(shù)據(jù)時(shí)的當(dāng)前情境c下發(fā)生的概率構(gòu)成。然后，將所提取的手勢(shì)特征作為預(yù)先訓(xùn)練好的手勢(shì)分類模型的輸入，通過該手勢(shì)分類模型可得到該手勢(shì)的手勢(shì)概率向量，該手勢(shì)概率向量由所述手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率構(gòu)成，其可記為G＝[G1，G2，…,Gi，…GM]T，其中M表示預(yù)先設(shè)定的手勢(shì)類別數(shù),Gi表示所采集的超聲波信號(hào)被識(shí)別為第i種手勢(shì)的概率(1≤i≤M)。而至于手勢(shì)分類模型可以采用多種基于機(jī)器學(xué)習(xí)的分類模型來的訓(xùn)練，例如貝葉斯模型、決策樹、極速學(xué)習(xí)機(jī)(ELM)等等，只要確定用于訓(xùn)練的手勢(shì)特征和待識(shí)別的手勢(shì)類別即可，具體的訓(xùn)練過程會(huì)在下文中進(jìn)行簡(jiǎn)單介紹。這樣，最終所識(shí)別的手勢(shì)是基于該手勢(shì)特征的手勢(shì)概率向量及與其相關(guān)的情境概率向量來確定的。在如上文介紹的，得到該手勢(shì)特征屬于預(yù)設(shè)的各種手勢(shì)的概率和各種手勢(shì)在當(dāng)前情境下發(fā)生的概率之后，便可以計(jì)算得出該手勢(shì)特征在當(dāng)前情境中屬于預(yù)設(shè)的各種手勢(shì)的概率，其中最大概率對(duì)應(yīng)的手勢(shì)可被確定為最終識(shí)別的與所采集的超聲波信號(hào)對(duì)應(yīng)的手勢(shì)。可以看出，該識(shí)別方法不僅考慮了手勢(shì)數(shù)據(jù)本身還兼顧了采集該手勢(shì)數(shù)據(jù)時(shí)的情境信息，如果一個(gè)手勢(shì)符合情境，那么這個(gè)手勢(shì)在手勢(shì)概率向量和情境概率向量中對(duì)應(yīng)的概率都很大，相乘之后得到的概率將較大，而如果一個(gè)手勢(shì)不符合情境，那么該手勢(shì)在手勢(shì)概率向量和情境概率向量中對(duì)應(yīng)的概率相乘會(huì)得到較小的值，這就體現(xiàn)了情境信息對(duì)識(shí)別錯(cuò)誤的手勢(shì)的修正作用。仍以播放音樂的應(yīng)用為例，假定通過手勢(shì)分類模型判斷所采集的超聲波信號(hào)為“前伸”手勢(shì)(即調(diào)高音量)的概率最大，而檢測(cè)的當(dāng)前環(huán)境音非常低，即“前伸”手勢(shì)在當(dāng)前環(huán)境音的條件下發(fā)生的概率很小，那么綜合這兩個(gè)概率得到的所采集的超聲波信號(hào)在當(dāng)前環(huán)境音的條件下為“前伸”手勢(shì)的概率會(huì)被修正為相對(duì)較小。優(yōu)選地，為了進(jìn)一步減少無效或錯(cuò)誤的響應(yīng)，該方法還包括判斷上述最終識(shí)別出的手勢(shì)是否有效的步驟，如果無效則不對(duì)該手勢(shì)進(jìn)行響應(yīng)，如果有效，則對(duì)該手勢(shì)進(jìn)行響應(yīng)。例如可以通過判定最終識(shí)別出的手勢(shì)對(duì)應(yīng)的概率是否在預(yù)先訓(xùn)練好的該手勢(shì)對(duì)應(yīng)的置信區(qū)間(其在下文離線訓(xùn)練階段中會(huì)有詳細(xì)介紹)中，如果在，則對(duì)該手勢(shì)進(jìn)行響應(yīng)。這樣可以進(jìn)一步避免對(duì)誤操作手勢(shì)的錯(cuò)誤響應(yīng)。下面參考圖2來介紹離線訓(xùn)練手勢(shì)識(shí)別模型的階段。參考圖2，手勢(shì)識(shí)別模型包括手勢(shì)分類、情境分析和決策輸出三個(gè)模塊，離線訓(xùn)練階段與上文介紹的在線識(shí)別過程基本上類似，主要包括下列步驟：1，獲取樣本數(shù)據(jù)可利用可穿戴智能移動(dòng)設(shè)備(如智能手機(jī)、手表、手環(huán)等)內(nèi)置的麥克風(fēng)和揚(yáng)聲器來獲取樣本數(shù)據(jù)，其中揚(yáng)聲器用于發(fā)射超聲波聲音信號(hào)，麥克風(fēng)用于采集聲音信號(hào)?？墒褂酶鞣N設(shè)備內(nèi)置的或附加的傳感器采集特定情境下影響手勢(shì)識(shí)別的相關(guān)情境因素。由不同的用戶在各種情境下執(zhí)行預(yù)定的各類手勢(shì)，從而采集足夠豐富的樣本數(shù)據(jù)。2，手勢(shì)分類從所采集的超聲波數(shù)據(jù)中提取手勢(shì)特征作為手勢(shì)樣本，并為各個(gè)手勢(shì)樣本標(biāo)注其所屬的手勢(shì)類別號(hào)，利用這些標(biāo)注后的手勢(shì)樣本作為訓(xùn)練數(shù)據(jù)集來訓(xùn)練手勢(shì)分類模型，如上文所介紹的，這里可采用多種基于機(jī)器學(xué)習(xí)的分類模型來作為手勢(shì)分類模型。對(duì)任意手勢(shì)樣本xj，該手勢(shì)分類模型輸出的手勢(shì)概率向量為Gj＝[Gj1,Gj2,…,Gjm]T∈Rm，m是手勢(shì)類別數(shù)，R表示實(shí)數(shù)。圖2給出是利用極限學(xué)習(xí)機(jī)ELM實(shí)現(xiàn)的手勢(shì)分類模型的示例。假設(shè)有N個(gè)任意手勢(shì)樣本(xi，ti)，其中xi是一個(gè)n維的手勢(shì)輸入向量，xi＝[xi1,xi2,…,xin]T∈Rn，ti是m維的目標(biāo)向量，ti＝[ti1,ti2,…,tim]T∈Rm。一個(gè)有L個(gè)隱層節(jié)點(diǎn)的單隱層前饋神經(jīng)網(wǎng)絡(luò)表示為:fL(xj)=Σi=1LβiG(ai,bi,xj),j=1,...,N---(1)]]>其中，ai和bi是輸入層到隱層節(jié)點(diǎn)之間的學(xué)習(xí)參數(shù)，βi是連接第i個(gè)隱層節(jié)點(diǎn)和輸出節(jié)點(diǎn)之間的權(quán)重，G(ai,bi,xj)為激活函數(shù)。該手勢(shì)分類模型的學(xué)習(xí)目標(biāo)是使輸出誤差最小，即存在ai,bi,βi使得：fL(xj)=Σi=1LβiG(ai,bi,xj)=tj,j=1,...,N---(2)]]>通過上述過程求解出β。那么對(duì)于特定的手勢(shì)樣本xj，和xj相對(duì)應(yīng)的實(shí)際手勢(shì)輸出yj表示為：yj=Σi=1LβiG(ai,bi,xj),j=1,...,N---(3)]]>最后，通過公式(4)對(duì)yj進(jìn)行置信度向量求解：Gj=norm(1abs(yj-1))---(4)]]>其中，norm函數(shù)表示歸一化，abs函數(shù)表示取絕對(duì)值。3，情境分析在特定情境下，如果一個(gè)手勢(shì)符合情境信息的要求，那么這種手勢(shì)發(fā)生的概率較大；反之，這種手勢(shì)發(fā)生的概率較小。在特定情境下，影響手勢(shì)發(fā)生的情境因素可能有一個(gè)，也可能有多個(gè)。情境信息是指影響手勢(shì)發(fā)生的相關(guān)情境因素。如上文介紹的，假定有M種用戶手勢(shì)和L個(gè)情境因素，那么可以確定情境特征矩陣A，記為(amk)M×L，其中amk＝pmk(ck)表示第m種手勢(shì)在第k個(gè)情境因素ck下發(fā)生的概率(1≤m≤M，1≤k≤L)。如上文討論的，具體概率函數(shù)p依具體應(yīng)用場(chǎng)景和具體的情境因素而定。假設(shè)采集手勢(shì)樣本xj時(shí)同時(shí)采集的情境信息記為cj＝(cj1,cj2,…,cjk,…cjL)，cjk表示影響手勢(shì)樣本xj的第k個(gè)情境因素，那么通過預(yù)先確定的情境特征矩陣A可以獲得預(yù)定的各種手勢(shì)在當(dāng)前情境cj下發(fā)生的概率，這些概率組成了一個(gè)m維的向量，即得到與手勢(shì)樣本xj相關(guān)的情境概率向量Cj＝[p1(cj),…,pm(cj),…,pM(cj)],其中pm(cj)表示第m種手勢(shì)在當(dāng)前情境cj下發(fā)生的概率，即pm(cj)＝pm(cj1,cj2,…,cjk,…cjL),其概率值例如為p1(c1)·p2(c2)·…·pM(cL)。4，決策輸出在得到手勢(shì)樣本xj對(duì)應(yīng)的手勢(shì)概率向量Gj和情境概率向量Cj就可以得到手勢(shì)樣本xj在當(dāng)前情境cj下作為預(yù)定的各種手勢(shì)發(fā)生的概率向量Pj＝Gj·Cj。這樣得到的概率向量Pj中最大概率對(duì)應(yīng)的手勢(shì)就是針對(duì)該手勢(shì)樣本xj所識(shí)別的手勢(shì)，將該識(shí)別結(jié)果與該手勢(shì)樣本xj所標(biāo)注的手勢(shì)類別相比較則可判斷出本次識(shí)別結(jié)果是正確還是錯(cuò)誤。其中對(duì)于誤操作手勢(shì)，通常被識(shí)別成任何類別的手勢(shì)的概率都差不多，其在手勢(shì)分類模型輸出中對(duì)應(yīng)的最大概率接近均分概率，在和情境概率向量中相應(yīng)概率相乘后的值通常居中，即位于一定區(qū)間中。因此對(duì)于訓(xùn)練樣本集中各個(gè)手勢(shì)樣本及其對(duì)應(yīng)情境信息樣本通過上述識(shí)別過程得到的各識(shí)別結(jié)果進(jìn)行統(tǒng)計(jì)分析，根據(jù)實(shí)驗(yàn)觀察值得出誤操作手勢(shì)區(qū)間的上下限統(tǒng)計(jì)結(jié)果，記為thresholdlow和thresholdhigh。這樣，經(jīng)訓(xùn)練后得到的手勢(shì)識(shí)別模型如公式(5)表示，對(duì)于任一手勢(shì)樣本xj，該手勢(shì)識(shí)別模型的決策輸出結(jié)果Oj如下：其中，“·”運(yùn)算表示向量對(duì)應(yīng)元素相乘，Oj＝0表示不響應(yīng)當(dāng)前的用戶手勢(shì)；當(dāng)經(jīng)上述過程得到的最大概率大于thresholdhigh時(shí)，輸出該最大概率值對(duì)應(yīng)的第k種手勢(shì)作為所識(shí)別的手勢(shì)并對(duì)其進(jìn)行響應(yīng)(這里也可以理解為經(jīng)訓(xùn)練該第k種手勢(shì)的置信區(qū)間為(thresholdhigh,1])。這是因?yàn)樗R(shí)別的符合情境的手勢(shì)，其對(duì)應(yīng)概率相對(duì)較大，而不符合情境的手勢(shì)被修正后，其對(duì)應(yīng)概率相對(duì)較小。因此，該方法在一定程度上修正手勢(shì)識(shí)別錯(cuò)誤的影響?；蛘?，在優(yōu)選的實(shí)施例中，經(jīng)訓(xùn)練后得到的手勢(shì)識(shí)別模型如公式(6)表示，對(duì)于任一手勢(shì)樣本xj，該手勢(shì)識(shí)別模型的決策輸出結(jié)果Oj如下：其中，“·”運(yùn)算表示向量對(duì)應(yīng)元素相乘，Oj＝0表示不響應(yīng)當(dāng)前的用戶手勢(shì)；如果上述過程得到的最大概率大于thresholdhigh時(shí)，輸出該最大概率值對(duì)應(yīng)的第k種手勢(shì)作為所識(shí)別的手勢(shì)并對(duì)其進(jìn)行響應(yīng)。并且當(dāng)經(jīng)上述過程得到的最大概率小于thresholdlow時(shí)，也會(huì)輸出該最大概率值對(duì)應(yīng)的第k種手勢(shì)作為所識(shí)別的手勢(shì)并對(duì)其進(jìn)行響應(yīng)，這主要是考慮了下面的因素：如果手勢(shì)識(shí)別出的手勢(shì)不符合情境，那么手勢(shì)概率和情境概率點(diǎn)乘得到的概率向量的最大值通常小于thresholdlow。例如，如果手勢(shì)分類模型將本應(yīng)屬于第2種手勢(shì)的超聲波信號(hào)識(shí)別為屬于第3種手勢(shì)(即在手勢(shì)概率向量中第3種手勢(shì)對(duì)應(yīng)的概率最大)，而同時(shí)該第3種手勢(shì)由于不符合情境，所以在情境概率向量中對(duì)應(yīng)的概率會(huì)很小，那么其手勢(shì)概率與情境概率的乘積可能不會(huì)是最大的。但是，如果一個(gè)手勢(shì)不符合情境，但它的手勢(shì)概率很大，乘以情境概率可能還是最大的，那么可以估計(jì)這是用戶有意為之，是允許發(fā)生的和進(jìn)行響應(yīng)的。為了進(jìn)一步說明本發(fā)明的效果，發(fā)明人進(jìn)行了下列實(shí)驗(yàn)：具體應(yīng)用設(shè)置為在安靜、標(biāo)準(zhǔn)、喧鬧等3種環(huán)境下的播放音樂，利用智能可穿戴設(shè)備內(nèi)置的麥克風(fēng)和揚(yáng)聲器作為超聲波的收發(fā)裝置，通過多普勒效應(yīng)獲得超聲波手勢(shì)識(shí)別信息；同時(shí)，對(duì)用戶所處的環(huán)境音量、當(dāng)前播放音量以及用戶調(diào)整音量的行為進(jìn)行感知。在該實(shí)驗(yàn)中定義了“前伸”和“后拉”兩種手勢(shì)，分別對(duì)應(yīng)“調(diào)高播放音量”和“調(diào)低播放音量”兩種用戶調(diào)整音量的行為；將安靜、標(biāo)準(zhǔn)、喧鬧3種環(huán)境分別設(shè)置為表示聲音低于20dB的環(huán)境、聲音處于20dB-40dB的環(huán)境和聲音高于40dB的環(huán)境。在實(shí)驗(yàn)中發(fā)現(xiàn)，在上述三種環(huán)境下最舒適的音樂播放音量分別為2dB、6dB和10dB。在音樂播放活動(dòng)中，當(dāng)前的環(huán)境聲音和音樂播放音量都會(huì)影響用戶調(diào)整音量的行為。例如，當(dāng)環(huán)境聲音較大、播放音量較低時(shí)，調(diào)高播放音量的可能性較大；反之，調(diào)低播放音量的可能性較大。不同環(huán)境下用戶調(diào)整音量的手勢(shì)與環(huán)境聲音、音樂播放音量的具體對(duì)應(yīng)關(guān)系如表1所示。表1手勢(shì)類別調(diào)整音量行為環(huán)境聲音相關(guān)性播放音量相關(guān)性前伸手勢(shì)調(diào)高播放音量正相關(guān)負(fù)相關(guān)后拉手勢(shì)調(diào)低播放音量負(fù)相關(guān)正相關(guān)實(shí)驗(yàn)中邀請(qǐng)10位志愿者(7男3女)在上述3種聲音環(huán)境下進(jìn)行超聲波手勢(shì)識(shí)別實(shí)驗(yàn)。每次一個(gè)志愿者無干擾地進(jìn)行實(shí)驗(yàn)，實(shí)驗(yàn)過程實(shí)時(shí)錄像。實(shí)驗(yàn)中志愿者坐在椅子上，左手持智能設(shè)備，麥克風(fēng)和揚(yáng)聲器朝向志愿者，右手進(jìn)行手勢(shì)操作。每位志愿者在每種聲音環(huán)境下根據(jù)實(shí)際音樂播放音量需要進(jìn)行相應(yīng)的手勢(shì)操作，共采集60個(gè)手勢(shì)樣本，其中“前伸”、“后拉”、“誤操作”手勢(shì)各占約1/3，“誤操作”手勢(shì)指手部無意識(shí)的運(yùn)動(dòng)產(chǎn)生的手勢(shì)，而非用戶真正想表達(dá)的操作手勢(shì)。志愿者和研究人員分別對(duì)采集到的手勢(shì)數(shù)據(jù)進(jìn)行標(biāo)定，其中，志愿者按照自己的意圖對(duì)所做的手勢(shì)進(jìn)行標(biāo)定。實(shí)驗(yàn)中使用揚(yáng)聲器連續(xù)播放21kHz的超聲波信號(hào)，采樣頻率為48kHz，每4096個(gè)采樣點(diǎn)為一幀，平均手勢(shì)長(zhǎng)度為10幀。每一幀的時(shí)域信號(hào)經(jīng)海明窗處理后進(jìn)行4096個(gè)采樣點(diǎn)的快速傅里葉變換(FFT)。根據(jù)多普勒公式，在上述采樣條件下，超聲波頻率偏移范圍不超過[-489,500]，頻率分辨率為11.7Hz，故特征向量的維度為86。為減少誤差，向發(fā)射頻率左右兩側(cè)分別擴(kuò)展，最終特征向量的維度為101。在發(fā)射頻率兩側(cè)各選取50個(gè)頻率點(diǎn)，記為gt，gt∈R101。對(duì)手勢(shì)樣本xj得到10幀長(zhǎng)的特征矩陣作為情境特征的環(huán)境聲音狀態(tài)使用手勢(shì)特征提取過程中FFT之后低于20kHz的1706個(gè)頻率點(diǎn)進(jìn)行評(píng)估，記作wt，wt∈R1706，對(duì)手勢(shì)樣本xj得到環(huán)境聲音矩陣當(dāng)前環(huán)境聲音dj＝max(Wj)。本實(shí)驗(yàn)標(biāo)準(zhǔn)環(huán)境下環(huán)境聲音e＝28dB，將e設(shè)為基準(zhǔn)環(huán)境聲音。在標(biāo)準(zhǔn)狀態(tài)下，每種手勢(shì)隨機(jī)發(fā)生，不受環(huán)境聲音影響。當(dāng)環(huán)境變化時(shí)，符合環(huán)境聲音的手勢(shì)概率增加，不符合環(huán)境聲音的手勢(shì)概率減少，對(duì)任意手勢(shì)樣本xj表示為：其中，標(biāo)準(zhǔn)環(huán)境下dj＝e。在任意手勢(shì)樣本xj采集過程中同時(shí)記錄當(dāng)前的音樂播放音量vjdB。實(shí)驗(yàn)中首先利用手勢(shì)信號(hào)的低頻部分識(shí)別當(dāng)前環(huán)境聲音對(duì)應(yīng)的環(huán)境，從而選擇最舒適的音樂播放音量sdB。當(dāng)音樂播放音量低于sdB時(shí)，調(diào)高播放音量的概率增加；而當(dāng)音樂播放音量高于sdB時(shí)，調(diào)低播放音量的概率增加，對(duì)任意手勢(shì)樣本xj表示為：p(cj2)=ss+vj,vjs+vjT.]]>這樣，與手勢(shì)樣本xj對(duì)應(yīng)的情境概率向量Cj＝p(cj)＝p(cj1,cj2)＝p(cj1)·p(cj2)。將上述得到的手勢(shì)樣本xj的特征矩陣Vj和情境概率向量提供給上文介紹的訓(xùn)練好的手勢(shì)識(shí)別模型(即公式(6))，即可得到相應(yīng)的手勢(shì)識(shí)別結(jié)果。這里假設(shè)經(jīng)上述離線訓(xùn)練階段得到的手勢(shì)識(shí)別模型中的thresholdlow和thresholdhigh分別為0.2和0.31。本發(fā)明的融合情境感知信息的手勢(shì)識(shí)別方法(ContextAwareInformationFusedGestureRecognitionMethod)CAI-GRM的手勢(shì)分類模型由ELM算法實(shí)現(xiàn)，本實(shí)驗(yàn)中ELM算法的激活函數(shù)為Sigmoid函數(shù)，隱層節(jié)點(diǎn)的個(gè)數(shù)為500。CAI-GRM在3種環(huán)境下手勢(shì)識(shí)別的測(cè)試準(zhǔn)確率結(jié)果如表2所示。表2類別前伸手勢(shì)后拉手勢(shì)誤操作手勢(shì)全部手勢(shì)安靜環(huán)境100.00％100.00％90.18％96.73％標(biāo)準(zhǔn)環(huán)境100.00％100.00％96.98％98.99％喧鬧環(huán)境100.00％100.00％91.95％97.32％由表2可以看出CAI-GRM手勢(shì)識(shí)別方法在3種環(huán)境下整體識(shí)別準(zhǔn)確率都在96％以上，其中“前伸”、“后拉”兩種有效手勢(shì)的識(shí)別完全正確，對(duì)于誤操作手勢(shì)，識(shí)別的準(zhǔn)確率也在90％以上，這表明該方法能過濾大部分的誤操作手勢(shì)。為比較CAI-GRM與傳統(tǒng)無情境信息的手勢(shì)識(shí)別方法的識(shí)別準(zhǔn)確率，傳統(tǒng)無情境信息的手勢(shì)識(shí)別方法(附圖中標(biāo)記為ELM)使用ELM算法在相同的數(shù)據(jù)集上進(jìn)行無情境信息的手勢(shì)識(shí)別，結(jié)果如圖3a(安靜環(huán)境下測(cè)試結(jié)果)、3b(標(biāo)準(zhǔn)環(huán)境下測(cè)試結(jié)果)、3c(喧鬧環(huán)境下測(cè)試結(jié)果)所示。由圖3a-3c可以看出，CAI-GRM的識(shí)別準(zhǔn)確率普遍高于無情境信息的ELM手勢(shì)識(shí)別方法。對(duì)于“前伸”和“后拉”兩種手勢(shì)，CAI-GRM的識(shí)別準(zhǔn)確率都高于無情境信息的手勢(shì)識(shí)別方法，這表明CAI-GRM手勢(shì)識(shí)別方法能使用情境信息對(duì)識(shí)別錯(cuò)誤的手勢(shì)進(jìn)行修正，從而提高手勢(shì)識(shí)別的準(zhǔn)確率。對(duì)于“誤操作”手勢(shì)，CAI-GRM過濾掉絕大部分的誤操作手勢(shì)，對(duì)于判斷為誤操作的手勢(shì)CAI-GRM不予響應(yīng)，從而減少無效的操作，提高手勢(shì)識(shí)別的準(zhǔn)確率和魯棒性；而無情境信息的手勢(shì)識(shí)別方法對(duì)任意給定的手勢(shì)輸入都會(huì)產(chǎn)生相應(yīng)的輸出，對(duì)誤操作也會(huì)給出相應(yīng)的輸出手勢(shì)，完全不能過濾誤操作手勢(shì)，易導(dǎo)致無效甚至錯(cuò)誤的響應(yīng)。通過比較可以看出，融合情境感知信息的手勢(shì)識(shí)別方法能夠根據(jù)情境信息判斷當(dāng)前識(shí)別出的手勢(shì)的合理性，能夠較好地理解用戶的操作意圖、提高手勢(shì)識(shí)別的準(zhǔn)確率和魯棒性。雖然本發(fā)明已經(jīng)通過優(yōu)選實(shí)施例進(jìn)行了描述，然而本發(fā)明并非局限于這里所描述的實(shí)施例，在不脫離本發(fā)明范圍的情況下還包括所做出的各種改變以及變化。當(dāng)前第1頁(yè)1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳益強(qiáng);于漢超;鐘習(xí);楊曉東;胡子昂;
技術(shù)所有人：中國(guó)科學(xué)院計(jì)算技術(shù)研究所;
我是此專利的發(fā)明人

上一篇：一種行車中障礙物檢測(cè)方法與裝置與流程
上一篇：一種用于安防的人體識(shí)別系統(tǒng)的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

超聲波手勢(shì)識(shí)別相關(guān)技術(shù)

手勢(shì)識(shí)別系統(tǒng)相關(guān)技術(shù)

2017新的手勢(shì)識(shí)別系統(tǒng)相關(guān)技術(shù)

displair手勢(shì)識(shí)別系統(tǒng)相關(guān)技術(shù)

超聲波指紋識(shí)別相關(guān)技術(shù)

高通超聲波指紋識(shí)別相關(guān)技術(shù)

超聲波指紋識(shí)別技術(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

超聲波手勢(shì)識(shí)別方法及系統(tǒng)與流程