亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

超出詞匯的詞的增強(qiáng)的拒絕的制作方法

文檔序號:11431962閱讀:166來源:國知局
分案申請的相關(guān)信息本案是分案申請。該分案的母案是申請日為2008年08月20日、申請?zhí)枮?00880112388.7、發(fā)明名稱為“超出詞匯的詞的增強(qiáng)的拒絕”的發(fā)明專利申請案。相關(guān)申請的交叉引用本申請要求于2007年8月20日提交的美國臨時(shí)專利申請no.60/956,776和于2007年8月20日提交的美國臨時(shí)專利申請no.60/956,784的權(quán)益,兩者都通過引用并入此處。本公開內(nèi)容一般涉及交互裝置,并且至少一個(gè)具體實(shí)施方式涉及使用一組界定的手勢與移動裝置進(jìn)行交互。
背景技術(shù)
::諸如手機(jī)或個(gè)人數(shù)字助理(pda)的移動裝置具有一些功能,每個(gè)功能都可以通過對按鍵的獨(dú)特次序的用戶選擇或使用屏幕上的菜單來激活。隨著移動裝置獲得越來越多的特征,假定能在移動裝置上提供的有限數(shù)量的控制器(controls),訪問所有這些特征可能變得日益復(fù)雜。技術(shù)實(shí)現(xiàn)要素:根據(jù)一個(gè)一般實(shí)施方式,當(dāng)與詞匯的選擇的模擬(modeled)手勢的相應(yīng)狀態(tài)進(jìn)行比較時(shí),如果輸入手勢的狀態(tài)的數(shù)量不滿足預(yù)定的閾值,則由于輸入手勢超出詞匯(out-of-vocabulary)而被拒絕。使用隱馬爾可夫(hiddenmarkov)模型,選擇模擬手勢作為與輸入手勢最匹配的詞匯手勢。而其它因素,例如輸入手勢的狀態(tài)的次序是否與所選擇的模擬手勢的狀態(tài)的相應(yīng)次序相匹配,可以作為由于該輸入手勢是“詞匯內(nèi)”(in-vocabulary)或“超出詞匯”手勢而接收或拒絕該輸入手勢的基礎(chǔ)(basis)。根據(jù)另一個(gè)一般實(shí)施方式,計(jì)算機(jī)實(shí)施的處理包括:基于將輸入手勢應(yīng)用于共同地(collectively)模擬訓(xùn)練手勢的詞匯的隱馬爾可夫模型,確定輸入手勢與每個(gè)訓(xùn)練手勢匹配的可能性,以及與模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配的輸入手勢的狀態(tài)的數(shù)量,該模擬訓(xùn)練手勢被確定為具有最大可能性。該處理還包括:如果所確定的數(shù)量不滿足閾值,則拒絕輸入手勢。實(shí)施方式可以包括一個(gè)或多個(gè)以下特征。例如,如果所確定的數(shù)量滿足閾值,則可以識別該輸入手勢,并且基于該識別的輸入手勢可以控制應(yīng)用。如果所確定的數(shù)量滿足閾值數(shù)量,則可以確定與模擬訓(xùn)練手勢相關(guān)聯(lián)的輸入命令,該模擬訓(xùn)練手勢被確定為具有最大可能性??梢源_定與第二模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配的被拒絕的輸入手勢的狀態(tài)的第二數(shù)量,該第二模擬訓(xùn)練手勢被確定為具有第二最大可能性,如果所確定的第二數(shù)量不滿足閾值,則該被拒絕的輸入手勢可以被拒絕。界定輸入手勢的觀察符號可以應(yīng)用于隱馬爾可夫模型。如果輸入手勢的狀態(tài)的次序與被確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)狀態(tài)的次序不匹配,則可以拒絕該輸入手勢。在另外的例子中,如果輸入手勢的第一狀態(tài)或最后狀態(tài)分別與被確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)第一狀態(tài)或最后狀態(tài)不匹配,則可以拒絕該輸入手勢。使用維特比(viterbi)算法可以確定可能性和狀態(tài)改變的次序。如果所確定的數(shù)量不滿足閾值,則該輸入手勢由于超出詞匯而可以被拒絕。可以訓(xùn)練隱馬爾可夫模型以識別訓(xùn)練手勢的詞匯??梢蕴崛∨c輸入手勢相關(guān)聯(lián)的一組狀態(tài)改變,其中從提取的一組狀態(tài)改變中可以確定輸入手勢的狀態(tài)的數(shù)量。在其它例子中,確定與模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配的輸入手勢的狀態(tài)的數(shù)量,該模擬訓(xùn)練手勢被確定為具有最大可能性,還可以包括:確定這樣的狀態(tài)的數(shù)量:對于被確定為具有最大可能性的模擬訓(xùn)練手勢的一組訓(xùn)練采樣,在每個(gè)狀態(tài)中所述輸入手勢的提取的中值大于或等于在相應(yīng)狀態(tài)中提取的中值中的最小值,或者確定這樣的狀態(tài)的數(shù)量:對于被確定為具有最大可能性的模擬訓(xùn)練手勢的一組訓(xùn)練采樣,在每個(gè)狀態(tài)中所述輸入手勢的提取的中值比在相應(yīng)狀態(tài)中提取的中值中的最小值大非零的調(diào)整參數(shù)ε或相等。閾值可以表達(dá)為相應(yīng)狀態(tài)的數(shù)量。輸入手勢可以被規(guī)格化(normalized)。根據(jù)另一個(gè)一般實(shí)施方式,裝置包括處理器,該處理器配置成基于將輸入手勢應(yīng)用于共同地模擬訓(xùn)練手勢詞匯的隱馬爾可夫模型,確定輸入手勢與每個(gè)訓(xùn)練手勢匹配的可能性,以及與模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配的輸入手勢的狀態(tài)的數(shù)量,該模擬訓(xùn)練手勢被確定為具有最大可能性。該處理器還配置成如果所確定的數(shù)量不滿足閾值,則拒絕該輸入手勢。在示例性的實(shí)施方式中,裝置還可以包括配置成接收輸入手勢的輸入模塊,其中該輸入模塊可以是包括相機(jī)的交互屏幕。根據(jù)另一個(gè)一般實(shí)施方式,編碼有計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)程序包括這樣的指令,當(dāng)執(zhí)行時(shí)運(yùn)行以使得計(jì)算機(jī)執(zhí)行操作,該操作包括:基于將輸入手勢應(yīng)用于共同地模擬訓(xùn)練手勢的詞匯的隱馬爾可夫模型,確定輸入手勢與每個(gè)訓(xùn)練手勢匹配的可能性,和與模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配的輸入手勢的狀態(tài)的數(shù)量,該模擬訓(xùn)練手勢被確定為具有最大可能性。該操作還包括如果所確定的數(shù)量不滿足閾值,則拒絕輸入手勢。根據(jù)另一個(gè)一般實(shí)施方式,代替選擇在移動裝置上控制器,用戶可以通過界定手勢的一系列動作移動該移動裝置,以調(diào)用與該手勢相關(guān)聯(lián)的移動裝置上一定的功能性。這樣做時(shí),可以不需要使用物理按鈕或用戶界面控制器而實(shí)施功能,這允許移動裝置能夠制作得更小,并且實(shí)現(xiàn)(effecting)功能性選擇時(shí)精確性的增加。根據(jù)另一個(gè)一般實(shí)施方式,計(jì)算機(jī)實(shí)施的處理包括:使用圖像數(shù)據(jù)感測裝置的動作,以及識別所感測的裝置的動作相應(yīng)的手勢。該處理還包括:確定與所識別的手勢相應(yīng)的裝置功能性,以及調(diào)用該功能性。實(shí)施方式可以包括一個(gè)或多個(gè)以下特征。例如,動作可以包括沿第一軌跡的第一動作、以及沿不同的第二軌跡的第二動作。識別手勢還可以包括識別通過感測的裝置的動作界定的字符形狀、幾何形狀或圖案(pattern)。感測裝置的動作還可以包括檢測裝置的用戶的下意識身體運(yùn)動,并且調(diào)用的功能性可以與下意識身體運(yùn)動相關(guān)聯(lián)。該處理還可以包括分別在第一時(shí)間和第二時(shí)間檢測第一用戶輸入和第二用戶輸入,其中感測裝置的動作還包括感測在第一時(shí)間和第二時(shí)間之間發(fā)生的裝置的動作。在另外的例子中,第一輸入可以是搖動用戶輸入、控制器選擇用戶輸入、或保持靜態(tài)用戶輸入。識別手勢還可以包括基于將感測的動作與模擬的手勢詞匯進(jìn)行比較來選擇手勢。該處理還可以包括:規(guī)格化所感測的裝置的動作,將規(guī)格化的感測的動作與模擬的手勢詞匯進(jìn)行比較,以及基于將所感測的動作與規(guī)格化的動作進(jìn)行比較來確定參數(shù)?;谠搮?shù)可以確定功能性。參數(shù)可以輸入到調(diào)用的功能性。在另外的例子中,手勢的詞匯可以使用任意數(shù)量的隱馬爾可夫模型(hmm)或基于規(guī)則的(rule-based)模型來模擬。該處理還可以包括選擇性地激活手勢詞匯中少于所有可用手勢的手勢(fewerthanallavailablegestures),其中基于將所感測的動作與激活的手勢進(jìn)行比較來選擇手勢?;谥圃焐淘O(shè)置、用戶設(shè)置或應(yīng)用設(shè)置,可以使能(enabled)少于所有可用手勢的手勢。該處理還可以包括訓(xùn)練裝置以識別特定手勢,以及將該特定手勢增加到手勢詞匯中。調(diào)用功能性還可以包括執(zhí)行應(yīng)用、操作圖像、或輸入字符。在其它例子中,感測裝置的動作可以包括分別在第一時(shí)間和第二時(shí)間檢測第一用戶輸入和第二用戶輸入,第一時(shí)間出現(xiàn)在第二時(shí)間之前,在第一時(shí)間之前感測沿第一軌跡的第一動作,在第二時(shí)間之后感測沿不同的第二軌跡的第二動作,結(jié)合第一動作和第二動作,以及將結(jié)合的第一動作和第二動作輸出,作為所感測的動作。調(diào)用功能性還可以包括:在虛擬環(huán)境中導(dǎo)航(navigating)、操作圖像、輸入字符、執(zhí)行應(yīng)用或調(diào)用媒體集線器功能性。根據(jù)另一個(gè)一般實(shí)施方式,裝置包括傳感器和處理器。傳感器配置成對動作進(jìn)行感測。處理器配置成識別與所感測的動作相應(yīng)的手勢,以確定與識別的手勢相應(yīng)的功能性,以及調(diào)用該功能性,其中所感測的動作由傳感器來感測。在示例性的實(shí)施方式中,傳感器可以是相機(jī),并且可以使用光流(opticalflow)來感測動作。根據(jù)另一個(gè)一般實(shí)施方式,計(jì)算機(jī)可讀介質(zhì)編碼有計(jì)算機(jī)程序。計(jì)算機(jī)程序包括這樣的指令,當(dāng)執(zhí)行時(shí)運(yùn)行以使得計(jì)算機(jī)執(zhí)行操作,該操作包括:使用圖像數(shù)據(jù)感測裝置的動作,識別與所感測的裝置的動作相應(yīng)的手勢,確定與所識別的手勢相應(yīng)的裝置的功能性,以及調(diào)用該功能性。任何上述技術(shù)的實(shí)施方式可以包括方法、處理、系統(tǒng)、裝置、設(shè)備、交互界面、存儲在計(jì)算機(jī)可讀介質(zhì)中的指令、或編碼有計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì)。在下面的附圖和說明書中闡明了一個(gè)或多個(gè)實(shí)施方式的細(xì)節(jié)。從說明書和附圖以及從權(quán)利要求中,其它特征將更加清楚。附圖說明圖1是表明手勢識別和拒絕的上下文示意圖。圖2是裝置的框圖。圖3表明響應(yīng)于手勢識別調(diào)用裝置功能性。圖4表明手勢結(jié)合。圖5示出了手勢規(guī)格化。圖6示出了手勢訓(xùn)練。圖7示出了下意識手勢。圖8示出了示例性的手勢詞匯。圖9是示例性處理的流程圖。圖10示出了用于手勢訓(xùn)練的環(huán)境。圖11示出了用于手勢配置的環(huán)境。圖12示出了用于選擇手勢激活的用戶界面。圖13是示例性處理的流程圖。圖14示出了示例性手勢。圖15示出了用于識別手勢的各種方法。圖16示出了示例性的計(jì)算裝置。自始至終相似的附圖標(biāo)記表示相應(yīng)的部件。具體實(shí)施方式根據(jù)一個(gè)一般實(shí)施方式,當(dāng)與詞匯的所選擇的模擬手勢的相應(yīng)狀態(tài)進(jìn)行比較時(shí),如果輸入手勢的狀態(tài)數(shù)量不滿足預(yù)定的閾值,則輸入手勢由于超出詞匯而被拒絕。使用隱馬爾可夫模型,選擇模擬手勢作為與輸入手勢最匹配的詞匯的手勢。而其它因素,例如輸入手勢的狀態(tài)次序是否與經(jīng)選擇的模擬手勢的相應(yīng)狀態(tài)次序相匹配,可以作為由于該輸入手勢是“詞匯內(nèi)”或“超出詞匯”手勢而接收或拒絕該輸入手勢的基礎(chǔ)。因此,并且代替在移動裝置上或在用戶界面上選擇控制器,用戶可以通過界定手勢的一系列動作而移動(例如,移動他們的手或其它身體部位,或移動移動裝置),以調(diào)用與該手勢相關(guān)聯(lián)的一定功能性。這樣做時(shí),可以不需要使用物理按鈕或用戶界面控制器而實(shí)施功能,這使得移動裝置能夠更小,用戶界面更小,并且實(shí)現(xiàn)功能性選擇中增加的精確性。在一個(gè)例子中,用戶通過執(zhí)行一組界定的手勢而與諸如移動裝置的裝置進(jìn)行交互。因?yàn)橐苿友b置可能較小且被拿在一個(gè)人的手中,因此用戶在拿著移動裝置的同時(shí)還可以打手勢。用戶可以使用除了移動移動裝置之外的方法來打手勢,例如用他們的手或筆(stylus)在觸摸屏或平板電腦上書寫。提供了這樣的增強(qiáng)方法,其中輸入手勢被應(yīng)用于共同地模擬訓(xùn)練手勢的詞匯的隱馬爾可夫模型,并且其中基于確定的可能性和/或確定的匹配狀態(tài)數(shù)量是否滿足閾值來識別或拒絕該輸入手勢。如這里自始至終使用的,“手勢”(gestures)意指一種以人體部分進(jìn)行的非口頭交流的形式,并且與諸如講話的口頭交流形成對照。例如,手勢可以通過在第一位置、姿勢(pose)或表情(expression)以及第二姿勢、位置或表情之間的移動、改變或變換來界定。日常談話中使用的定制手勢包括例如:“空中引用(airquote)”手勢、鞠躬、屈膝禮、面頰親吻、手指或手動作、跪拜、頭部搖動或移動、擊掌、點(diǎn)頭、悲傷的面部、舉起的拳頭、敬禮、豎起大拇指的動作、拼擠手勢、手或身體扭曲或手指指向手勢。使用相機(jī),例如通過分析用戶的圖像,使用傾斜傳感器,例如通過檢測用戶保持或傾斜裝置的角度,感測裝置的動作或通過任何其它方法,可以檢測手勢。通過以特定圖案或方式執(zhí)行一系列動作可以形成手勢。通過改變身體部位的位置(也就是搖擺動作),用戶可以做出手勢(也就是可以“打手勢”或“用姿勢示意”(gesticulate)),或用戶可以打手勢而不改變身體部位的位置(也就是通過做出緊握拳頭手勢,或通過保持身體部位靜止一段時(shí)間)。盡管該增強(qiáng)的方法例如使用手、手臂或手指的手勢,但是也可以使用其它類型的手勢。圖1是表明手勢識別和拒絕的上下文示意圖。例如通過用手指或筆在平板電腦105上畫,可以做出第一輸入手勢104。作為手勢輸入的另一例子,用戶106通過按特定圖案移動裝置110而在空中創(chuàng)建第二輸入手勢108。裝置110可以是移動電話、音頻播放器、時(shí)鐘或其它裝置,并且可以感測裝置110的動作(例如使用傳感器)。第一輸入手勢104和第二輸入手勢108可以表示為輸入手勢圖案,例如作為一組觀察符號用于輸入到隱馬爾可夫模型,或作為格子上的基點(diǎn)、像素或點(diǎn),其表明手勢在空間中經(jīng)過的兩維或三維位置。其它方法也可以用于表示手勢,例如將手勢表示為矢量集合,或作為一組運(yùn)動指示(例如,“水平地向右移動”,然后“向上移動并移動到左側(cè)”)。與第一輸入手勢104和第二輸入手勢108相關(guān)聯(lián)的輸入手勢圖案可以與模擬訓(xùn)練手勢的詞匯112進(jìn)行比較。例如,詞匯112包括分別地與數(shù)字8、6、2和3相應(yīng)的訓(xùn)練手勢114a至114d。使用大量的隱馬爾可夫模型(hmm)可以識別時(shí)間次序,例如手勢移動的次序。使用hmm用于識別目的包括具有一組hmm(例如,與詞匯112中的手勢的數(shù)量一樣多),以及用一組這些手勢的訓(xùn)練采樣來訓(xùn)練它們。對于給定的輸入手勢,能夠采用經(jīng)訓(xùn)練的模型,以產(chǎn)生這樣的可能性:給定的輸入手勢是詞匯中訓(xùn)練的手勢中的一個(gè)。諸如訓(xùn)練手勢114a的訓(xùn)練手勢可以劃分成一個(gè)或多個(gè)手勢部分或狀態(tài)。例如,數(shù)字“8”可以表示為第一手勢部分116a、隨后的第二手勢部分116b、隨后的第三手勢部分116c以及隨后的第四手勢部分116d,其中第一手勢部分116a相應(yīng)于“8”從右上起點(diǎn)118開始向下到“8”的左下的部分,第二手勢部分116b相應(yīng)于“8”的底部部分,第三手勢部分116c相應(yīng)于“8”的右下到左上部分,第四手勢部分116d相應(yīng)于“8”的頂部部分。手勢部分可以相應(yīng)于手勢狀態(tài)。隱馬爾可夫模型可以包括一組狀態(tài)和狀態(tài)過渡(transitions)。使用拓?fù)?20可以示出手勢狀態(tài),在該例子中,拓?fù)?20包括分別相應(yīng)于手勢部分116a至116d的狀態(tài)122a至122d。拓?fù)?20示出了狀態(tài)過渡。例如,當(dāng)執(zhí)行手勢部分116a時(shí)可以輸入第一狀態(tài)122a。當(dāng)執(zhí)行手勢部分116b時(shí)可以輸入第二狀態(tài)122b,如箭頭124a所示。對于每個(gè)訓(xùn)練手勢114a至114d,使用一組共同地模擬詞匯112的隱馬爾可夫模型可以確定這樣的可能性,其表明輸入手勢(例如,手勢104、108)與具體訓(xùn)練手勢114a至114d匹配的可能性。對于具有所確定的最大可能性的訓(xùn)練手勢,可以確定匹配狀態(tài)的數(shù)量。匹配狀態(tài)的數(shù)量可以表明與被確定為具有大(或最大)可能性的模擬訓(xùn)練手勢的相應(yīng)狀態(tài)相匹配的輸入手勢的狀態(tài)的數(shù)量。例如,對于每個(gè)訓(xùn)練手勢114a至114d,可以確定這樣的可能性:表明各個(gè)訓(xùn)練手勢與輸入手勢104匹配的可能性。在該例子中,訓(xùn)練手勢114a(例如,數(shù)字“8”)具有所確定的最大可能性。指示器130a表明第一輸入手勢104與訓(xùn)練手勢114a的第一狀態(tài)122a匹配,指示器130b表明第一輸入手勢104與訓(xùn)練手勢114a的第二狀態(tài)122b匹配,指示器130c表明第一輸入手勢104與訓(xùn)練手勢114a的第三狀態(tài)122c不匹配,并且指示器130d表明第一輸入手勢104與訓(xùn)練手勢114a的第四狀態(tài)122d不匹配??梢源_定數(shù)量130(例如,在該例子中是“2”),該數(shù)量130表明與訓(xùn)練手勢114a的相應(yīng)狀態(tài)相匹配的輸入手勢104的狀態(tài)的數(shù)量。所確定的數(shù)量130可以與閾值132進(jìn)行比較,并且如果所確定的數(shù)量130不滿足閾值132,則可以拒絕輸入手勢104(例如,由于超出詞匯112而拒絕)。如該例子所示,第一輸入手勢104與訓(xùn)練手勢114a的兩個(gè)狀態(tài)相匹配,這不滿足閾值132,導(dǎo)致輸入手勢104因?yàn)槌鲈~匯而被拒絕。還可以對每個(gè)訓(xùn)練手勢114a至114d確定可能性,其表明各個(gè)訓(xùn)練手勢與輸入手勢108相匹配的可能性。在該例子中,訓(xùn)練手勢114a再次具有所確定的最大可能性。指示器140a至140c表明第二輸入手勢108與訓(xùn)練手勢114a的第一狀態(tài)122a至第三狀態(tài)122c相匹配。指示器140d表明第二輸入手勢108與訓(xùn)練手勢114a的第四狀態(tài)122d不匹配??梢源_定數(shù)量150(例如,在該例子中是“3”),該數(shù)量150表明與訓(xùn)練手勢114a的相應(yīng)狀態(tài)相匹配的輸入手勢108的狀態(tài)的數(shù)量。所確定的數(shù)量150可以與閾值152進(jìn)行比較,并且如果所確定的數(shù)量150滿足閾值152,則可以接受輸入手勢108。如該例子所示,輸入手勢108與訓(xùn)練手勢114a的三個(gè)狀態(tài)相匹配,這滿足閾值152,導(dǎo)致接受(也就是識別)該輸入手勢108,作為詞匯內(nèi)手勢。響應(yīng)所識別的手勢可以控制應(yīng)用。例如,響應(yīng)于將輸入手勢108識別為與訓(xùn)練手勢114a相匹配,可以訪問表格或其它數(shù)據(jù)結(jié)構(gòu),以確定要調(diào)用的功能或命令。例如,可以確定(例如使用查找表)“呼叫鮑勃”功能154被映射到訓(xùn)練手勢114a,并且響應(yīng)于將輸入手勢108識別為訓(xùn)練手勢114a的可接受的匹配,可以調(diào)用該功能154。圖2是裝置200的框圖。裝置200可以是移動電話,和/或可以是或包括個(gè)人計(jì)算機(jī)(pc)或游戲系統(tǒng)、便攜式電腦、掌上或平板電腦、個(gè)人數(shù)字助理(“pda”)或其它類型的嵌入系統(tǒng)的組件,例如計(jì)算機(jī)鍵盤或遙控器。裝置200還可以是ipod裝置或其它便攜的音樂播放器、呼叫器或其它通信裝置,或用于游戲、通信、計(jì)時(shí)和/或數(shù)據(jù)組織的掌上或便攜電子裝置。在一些實(shí)施方式中,裝置200附著到或穿在用戶身上。裝置200包括動作傳感器202、處理器204、介質(zhì)206和用戶界面208。當(dāng)裝置200移動時(shí),動作傳感器202可以進(jìn)行檢測,并且可以檢測運(yùn)動的方向和幅度。動作傳感器202可以是配置成檢測或?qū)ρb置200的動作或位置進(jìn)行感測的任何類型的組件或設(shè)備。例如,動作傳感器202可以是一個(gè)或多個(gè)相機(jī)、一個(gè)或多個(gè)陀螺儀、一個(gè)或多個(gè)gps(全球定位系統(tǒng))追蹤器,或這些裝置的結(jié)合。動作傳感器202可以以各種位置和方向位于裝置200的外部或內(nèi)部。處理器204可以接受來自用戶界面208的輸入,并且可以分析由動作傳感器202捕捉的數(shù)據(jù)。處理器可以執(zhí)行在裝置200上運(yùn)行的應(yīng)用程序和操作系統(tǒng)。裝置200可以包括多個(gè)處理器(或其它控制電路),并且可以包括存儲器(或其它計(jì)算機(jī)可讀存儲介質(zhì)),其存儲應(yīng)用程序、操作系統(tǒng)、用戶輸入程序以及由應(yīng)用程序、操作系統(tǒng)和用戶輸入程序使用的數(shù)據(jù)。介質(zhì)206存儲和記錄信息或數(shù)據(jù),并且可以是光存儲介質(zhì)、磁存儲介質(zhì)、閃存或任何其它存儲介質(zhì)類型。介質(zhì)206包括詞匯210、訓(xùn)練模塊212、手勢識別模塊214、以及選擇性激活模塊216。詞匯210包括關(guān)于裝置200可以識別的手勢的信息。例如,詞匯210可以包括手勢規(guī)定(definitions),對于每個(gè)識別的手勢,該手勢規(guī)定描述包括在手勢中的一組軌跡或運(yùn)動。在其它例子中,包括在詞匯210中的手勢規(guī)定可以包括手勢運(yùn)動邊界和/或界定手勢運(yùn)動圖案的多組點(diǎn)。手勢規(guī)定還可以包括用于定義隱馬爾可夫模型的信息。訓(xùn)練模塊212允許用戶定制手勢。例如,用戶可以使用訓(xùn)練界面重復(fù)地執(zhí)行手勢以界定手勢的邊界。該訓(xùn)練界面還可以允許用戶手動地改變手勢邊界的大小或延長手勢邊界。手勢識別模塊214接收來自動作傳感器202的動作數(shù)據(jù),并且將所接收的動作數(shù)據(jù)與存儲在詞匯210中的動作數(shù)據(jù)進(jìn)行比較,以確定是否已經(jīng)執(zhí)行了可識別的手勢。例如,手勢識別模式可以使用隱馬爾可夫模型,以將所確定的匹配狀態(tài)的數(shù)量與接受閾值進(jìn)行比較。選擇性激活模塊216用于選擇性地激活和解除激活(deactivate)詞匯210中的手勢。在每個(gè)用戶、每個(gè)應(yīng)用和/或每個(gè)裝置的基礎(chǔ)上,可以對手勢進(jìn)行激活和解除激活。例如,對于使用有效文本輸入的應(yīng)用(例如,電子郵件編輯器),可以對“2”字符手勢和“z”字符手勢這兩者進(jìn)行激活。對于具有很少或沒有文本輸入的應(yīng)用和相對少量的命令,可以對“2”或“z”字符手勢中的一個(gè)進(jìn)行激活,但是不是對這兩者都激活,因?yàn)槿绻麤]有同時(shí)激活類似形狀的手勢,手勢識別可以更加有效或精確。圖3至圖12提供了示例性的處理和用于輸入手勢的裝置,基于圖13中描述的示例性處理可以接受或拒絕該手勢。通過圖13中以及上文中描述的處理,也可以使用用于輸入手勢的其它方法,例如使用圖15中描述的裝置。例如,圖3示范了響應(yīng)于手勢識別的裝置功能性的調(diào)用。用戶302用裝置304在空中創(chuàng)建z形狀手勢(也就是,用戶302沿向右方向(從讀者的視覺)然后沿向下且向左的方向,最后沿基本上與第一向右方向平行的第二向右方向移動裝置304)。在裝置304上正播放著音樂或其它音頻。該裝置304可以感測用戶302的動作(例如,使用傳感器),識別與所感測的動作相應(yīng)的手勢,確定與所識別的手勢相應(yīng)的功能性,并調(diào)用所確定的功能性,該裝置304可以是移動電話、聲頻播放器或其它裝置。例如,裝置304可以將用戶302的運(yùn)動表現(xiàn)為在此示出為一系列點(diǎn)的輸入手勢圖案306。該輸入手勢圖案306可以與這樣的手勢規(guī)定進(jìn)行比較,該手勢規(guī)定包括在存儲在裝置304上的詞匯中。例如,表格308示出了詞匯,該詞匯包括用于分別表示字符“z”、“o”、“p”和“2”的手勢310a至310d的手勢規(guī)定。還可以定義更少的或更多的手勢規(guī)定。詞匯還可以包括邊界,例如邊界312a至312d,這些邊界包括在手勢規(guī)定中或與之相關(guān)聯(lián)。例如,“z”字符手勢310a可以與邊界312a相關(guān)聯(lián),“o”字符手勢310b可以與邊界312b相關(guān)聯(lián),“p”字符手勢310c可以與邊界312c相關(guān)聯(lián),并且“2”字符手勢310d可以與邊界312d相關(guān)聯(lián)。邊界(或模板)可以界定手勢的規(guī)格化或標(biāo)準(zhǔn)化(standardized)形式,這樣由用戶執(zhí)行的動作與所述邊界進(jìn)行比較以確定是否執(zhí)行了特定手勢。盡管邊界示出為視覺邊界,但是每個(gè)手勢可以表現(xiàn)為一組可接受的矢量、動作或界定手勢的加速度,或界定手勢的隱馬爾可夫模型。另外,手勢規(guī)定可能需要一些動作沿一定的方向出現(xiàn),或需要組成手勢的動作以特定的次序出現(xiàn)。用戶執(zhí)行的輸入的手勢圖案可以與每個(gè)詞匯手勢規(guī)定進(jìn)行比較,以確定輸入手勢圖案是否可以包括在一個(gè)或多個(gè)詞匯手勢的邊界中。例如,輸入手勢圖案306(也就是,“z”形狀圖案)可以與每個(gè)邊界312a至312d進(jìn)行比較。輸入手勢圖案306與“o”形狀邊界312b內(nèi)部或與“p”形狀邊界312c內(nèi)部不相符合。然而,輸入手勢圖案306可以與“z”形狀邊界312a內(nèi)部或與“2”形狀邊界312d內(nèi)部相符合。因此,手勢310a和310d被識別為候選手勢。另外,通過將輸入手勢圖案應(yīng)用于一個(gè)或多個(gè)隱馬爾可夫模型可以出現(xiàn)比較。因?yàn)閳?zhí)行的手勢落入多于一個(gè)的邊界或規(guī)定內(nèi)是可以預(yù)料的,因此通過用戶或應(yīng)用可以使詞匯內(nèi)一些手勢無效(或解除激活),以減少在解決沖突中的計(jì)算代價(jià)并增加準(zhǔn)確性。因此,對于詞匯手勢可以激活或解除激活。例如,表格308示出了“z”字符手勢310a、“o”字符手勢310b和“p”字符手勢310c是激活的,而在“2”字符手勢310d是未激活的??梢栽诿總€(gè)裝置或每個(gè)應(yīng)用的基礎(chǔ)上對手勢可以進(jìn)行激活或解除激活,并且可以通過終端用戶、通過制造商和/或通過應(yīng)用開發(fā)者對手勢進(jìn)行激活以及解除激活。為了識別手勢的效率,一組相似手勢中的一個(gè)手勢可以是激活的,而該組中的其它手勢是未激活的。例如,“2”和“z”字符形狀相似,因此僅僅相關(guān)聯(lián)手勢中的一個(gè)是激活的。因?yàn)樵谠摾又?,只有候選手勢310a和310d中的一個(gè)是激活的,所以響應(yīng)于用戶302的運(yùn)動識別出“z”字符手勢310a。裝置功能可以映射到手勢,使得如果識別出手勢,則響應(yīng)于手勢的執(zhí)行來調(diào)用所映射的功能性。例如,表格308示出了“調(diào)高音量”功能314a被映射到“z”字符手勢310a,“讀取郵件”功能314b被映射到“o”字符手勢310b,“映射程序”功能314c被映射到“p”字符手勢310c,并且“呼叫特定人”功能314d(例如,呼叫“鮑勃”)被映射到“2”字符手勢310d。響應(yīng)于激活的“z”字符手勢的識別,確認(rèn)(identified)和調(diào)用“調(diào)高音量”功能,導(dǎo)致在裝置304上播放的音頻的音量增大。如上所述,如果輸入手勢圖案位于由詞匯手勢規(guī)定界定的邊界的內(nèi)部,則可以識別該手勢。其它方法也可以用于識別手勢。例如,可以將詞匯手勢界定為一組運(yùn)動的單方向或多方向描述。例如,“z”字符手勢310a可以表示(也就是描述)為“水平地向右移動”、“向下且向左移動”、“與第一移動平行地水平向右移動”。如果輸入手勢的運(yùn)動與由詞匯手勢規(guī)定界定的運(yùn)動相匹配,則可以識別該輸入手勢。作為識別手勢的另一例子,詞匯手勢可以界定為占據(jù)格子上的一組點(diǎn),并且如果輸入手勢的運(yùn)動“越過”同樣的點(diǎn)(或一定百分比的點(diǎn)),則可以識別該輸入手勢。當(dāng)使用裝置打手勢時(shí),在一些情況下可能物理上妨礙用戶完成手勢,例如,如果墻、桌、另外的人或一些其它物理目標(biāo)阻擋用戶的運(yùn)動路徑。用戶可以在中途停止或暫停部分完成的手勢,重新確定裝置的位置(例如,通過重新確定手臂的位置),并重新開始裝置的運(yùn)動以完成該手勢。用戶可以通過執(zhí)行行動來指出他們希望開始打手勢,例如推動裝置上的按鈕、搖動裝置或在短暫的時(shí)間(例如一秒)內(nèi)使裝置保持靜態(tài)。如圖3所示,作為手勢的第一運(yùn)動,用戶可以將裝置從第一位置402向右移動到第二位置404。用戶可能期望向下移動以繼續(xù)該手勢,但是物理上可能妨礙這樣做。用戶可以執(zhí)行行動來表明將暫停當(dāng)前的手勢,例如搖動裝置、使裝置保持靜態(tài)或推動裝置上的按鈕。裝置處于暫停狀態(tài)時(shí),用戶可以通過將裝置從位置404移動到位置406來重新定位裝置。用戶可以執(zhí)行行動來表明將恢復(fù)該手勢,例如搖動裝置、使裝置保持靜態(tài)或推動裝置上的按鈕。通過將裝置從位置406向下移動到位置408,用戶可以完成該手勢。手勢表現(xiàn)410a至410d示出了這樣的可能手勢:從裝置在位置402和408之間的運(yùn)動可以識別該手勢。手勢表現(xiàn)410a示出了水平和垂直運(yùn)動結(jié)合成連續(xù)的手勢,如上所述。表現(xiàn)410b示出了兩個(gè)斷開的手勢的識別。表現(xiàn)410c示出了僅僅第二個(gè)垂直手勢的識別,例如如果僅僅接受或識別最后的手勢,并且刪除、過濾掉或忽略之前的手勢(例如第一個(gè)水平手勢)。表現(xiàn)410d示出了從位置404到位置406的弧線運(yùn)動的識別,例如如果手勢開始邊界在位置404處開始,并且手勢終止邊界在位置406處結(jié)束。用戶或應(yīng)用可以確定這些表現(xiàn)中的哪一個(gè)表現(xiàn)是期望的表現(xiàn)。圖5示出了手勢規(guī)格化。手勢規(guī)定可以包括可以用于形狀規(guī)格化的高度與寬度比。例如,對于形狀類似于“o”字符的手勢,可以存儲1比1(也就是1:1)的高度與寬度比,以界定這樣的正常(normal)“o”形狀:該“o”形狀是完美的圓形,或者可以存儲諸如1.2:1的另外比率,以界定這樣的正?!皁”形狀:該“o”形狀的高度與其寬度相比稍大。當(dāng)識別手勢時(shí),可以確定所檢測的手勢的高度和寬度,并且可以計(jì)算所檢測的手勢的高度與寬度比,以及與存儲在手勢規(guī)定中的高度與寬度比進(jìn)行比較。如果計(jì)算的比率與存儲在手勢規(guī)定中的比率不同,則可以對所檢測的手勢進(jìn)行調(diào)整(scaled)或規(guī)格化到存儲在手勢規(guī)定中的比率。例如,對于“o”形狀手勢,“o”形狀502界定可接受的邊界。“o”形狀502具有1:1的規(guī)格化高度與寬度比。用戶可以執(zhí)行不是處于1:1比率的“o”形狀手勢,例如,具有2:1高度與寬度比的“高瘦o”形狀504,具有1:2高度與寬度比的“矮胖o”形狀506,或具有2:2高度與寬度比的“大o”形狀508。用戶可以執(zhí)行不具有1:1比率的“o”形狀手勢,例如小的“o”形狀510。不管形狀,如果識別出“o”形狀手勢,例如形狀504至510中的一個(gè),則所檢測的高度與寬度比可以與規(guī)格化形狀502的高度與寬度比進(jìn)行比較,并且如果比較的比率不同,則可以調(diào)整所檢測的手勢。用于規(guī)格化手勢的調(diào)整量可以用于確定將調(diào)用的功能。例如,如表格511所示,如果識別出具有2:1比率512a的手勢(例如,與正常手勢相比較),則可以調(diào)用“呼叫鮑勃”功能514a。與1:1比率相比,2:1比率可以導(dǎo)致50%的垂直調(diào)整(scaling)和0%的水平調(diào)整。作為另一例子,識別具有2:2比率512b(導(dǎo)致50%的垂直調(diào)整和50%的水平調(diào)整)的手勢的執(zhí)行可以導(dǎo)致調(diào)用“讀取電子郵件”功能514b。2:2比率512b表示具有2距離單位高度乘以2距離單位寬度的維度的動作,當(dāng)用50%的垂直調(diào)整和50%的水平調(diào)整進(jìn)行調(diào)整時(shí),將導(dǎo)致具有1:1比率(也就是1距離單位高度乘以1距離單位寬度)的運(yùn)動或手勢。繼續(xù)該例子,識別具有1:1比率512c(也就是沒有調(diào)整)的手勢的執(zhí)行可以導(dǎo)致調(diào)用“關(guān)機(jī)”功能514c。作為最后一個(gè)例子,識別具有1:2比率512d(導(dǎo)致50%的垂直調(diào)整和50%的水平調(diào)整)的手勢的執(zhí)行可以導(dǎo)致調(diào)用“調(diào)低音量”功能514d。調(diào)整量或比率還可以用作將調(diào)用的功能的輸入?yún)?shù)。例如,裝置可以配置成使得如果識別“o”手勢,則可以調(diào)用特定功能,例如“運(yùn)行程序y”(runprogramy)516。功能(例如,“運(yùn)行程序y”函數(shù)516)可以接收一個(gè)或多個(gè)可以用作功能輸入的參數(shù)。在該例子中,一個(gè)名為“變量_x”(variable_x)的參數(shù)518用作對功能516的輸入。通過所識別的手勢的所檢測的比率,可以確定參數(shù)518的值。例如,如表格519所示,如果識別到具有2:1比率520a的手勢,則參數(shù)518可以呈現(xiàn)“變量a”(variablea)522a值。作為另一例子,如果識別到具有2:2比率520b的手勢,則參數(shù)518可以呈現(xiàn)“變量b”(variableb)522b值。繼續(xù)該例子,如果識別到具有1:1比率520c的手勢,則參數(shù)518可以呈現(xiàn)“變量c”(variablec)522c值。作為最后的例子,如果識別到具有1:2比率520d的手勢,則參數(shù)518可以呈現(xiàn)“變量d”(variabled)522d值。總之,手勢可以配置成使得響應(yīng)于手勢的執(zhí)行來執(zhí)行特定功能,而提供給所調(diào)用的功能的參數(shù)值(例如,輸入值)可以通過所執(zhí)行的手勢的所檢測的高度與寬度比率來確定?;谳斎氲氖謩莸奶卣骺梢源_定多于一個(gè)的參數(shù)值。例如,手勢可以配置成使得響應(yīng)于手勢的執(zhí)行來調(diào)用音頻調(diào)整(adjust-audio)功能524。音頻調(diào)整功能524可以接受可以用于影響高音(treble)音頻設(shè)置的調(diào)整的參數(shù)526,以及可以用于影響基礎(chǔ)(base)音頻設(shè)置的調(diào)整的參數(shù)528。通過輸入的手勢的所檢測的高度與寬度比,可以確定參數(shù)526和528的值。例如,如表格529所示,如果檢測到具有2:1比率530a的手勢,則“100%”532a的值可以用作參數(shù)526的值,而“0%”534a的值可以用作參數(shù)528的值。換句話說,如果所檢測的輸入手勢比正常手勢高兩倍,則解釋為高音設(shè)置可以增加100%(也就是,加倍),并且如果所檢測的輸入手勢與正常手勢的寬度相同,則基礎(chǔ)設(shè)置可以保持不受影響(也就是,增加0%)。作為另一例子,如果檢測到具有2:2比率530b的手勢,則“100%”532b的值可以用作參數(shù)526的值,并且“100%”534b的值可以用作參數(shù)528的值(也就是,如果輸入手勢是正常手勢的兩倍高和兩倍寬,則高音設(shè)置和基礎(chǔ)設(shè)置這兩者都應(yīng)該加倍(增加100%))。作為最后的例子,如果檢測到具有1:2比率530c的手勢,則“0%”532c的值可以用作參數(shù)526的值(表明高音設(shè)置沒有改變),并且“100%”534c的值可以用作參數(shù)528的值(表明基礎(chǔ)設(shè)置應(yīng)該加倍)。圖6示出了手勢訓(xùn)練。手勢表現(xiàn)602a至602h表示由一個(gè)或多個(gè)用戶提供的各種訓(xùn)練手勢輸入重復(fù)地執(zhí)行“z”形狀的手勢。每個(gè)手勢表現(xiàn)602a至602h都示出為一組這樣的點(diǎn),該些點(diǎn)表示用戶在執(zhí)行各個(gè)手勢時(shí)的運(yùn)動。手勢表現(xiàn)602a至602h彼此重疊以形成z字符形狀604的邊界(也就是,一旦界定z字符形狀604,如果用戶的運(yùn)動在z字符形狀604的邊界內(nèi),則可以識別該z字符手勢)。以相似的方式,手勢訓(xùn)練可以用于生成隱馬爾可夫模型。裝置可以包括預(yù)先存在的(pre-existing)詞匯606,該詞匯606包括一組界定的手勢。z字符形狀604可以插入到預(yù)先存在的詞匯606中,使得可以識別由用戶執(zhí)行的后來的z形狀的手勢。手勢由制造商和/或用戶界定。制造商可以使用一個(gè)或多個(gè)測試用戶來訓(xùn)練裝置,導(dǎo)致形成包括在裝置的預(yù)定義詞匯中的字符的可識別邊界或其它形狀。用戶可以將定制手勢添加到裝置的詞匯中,訓(xùn)練裝置以識別用戶在執(zhí)行手勢時(shí)使用的專用運(yùn)動。圖7示出了下意識手勢。例如,佩戴手表裝置704的用戶702搖動“鮑勃”706的手。手表裝置704識別握手(handshake)手勢708,該握手手勢界定為一組隔開緊密握在一起的上下運(yùn)動。響應(yīng)于該握手手勢708的識別,手表裝置704啟動錄音機(jī)以在檢測到握手手勢708之后在短暫的時(shí)期(例如,兩秒)內(nèi)進(jìn)行錄音。例如,手表裝置704可以記錄由鮑勃706說出的聲音片段“嗨,我是鮑勃”710。稍后,例如通過手表裝置704上的揚(yáng)聲器712,用戶702可以播放錄制的聲音。表格714示出了其它示例性下意識手勢,以及響應(yīng)于識別執(zhí)行的下意識手勢而功能性調(diào)用的伴隨裝置。例如,響應(yīng)于識別窒息手勢,可以撥打911緊急電話(例如通過移動電話裝置)。作為另一例子,如果識別到用戶神經(jīng)緊張,則可以播放舒緩的音樂,或可以提示用戶玩娛樂視頻游戲。作為再一個(gè)例子,如果移動電話裝置檢測到“將電話移動到耳朵”手勢,則可以啟動計(jì)時(shí)器。裝置可以是手表裝置、移動電話或其它便攜裝置,或可以并入或用作耐用項(xiàng)目。圖8示出了示例性的手勢詞匯800。例如,詞匯800可以包括示例性的手勢表現(xiàn)802a至802o。手勢可以是字母(例如,802a、802d)或數(shù)字(例如,802c)或可以是其它類型的符號。例如,手勢可以包括波狀或螺紋線(例如,802g、802j)。手勢可以是表示真實(shí)世界項(xiàng)目的符號(例如,表現(xiàn)802e表示信封并且表現(xiàn)802m表示八邊形或停止標(biāo)志)。其它的例子示出了手勢可以是一般的直線(例如,802n)或可以是多邊形(例如,802d、802m)。通過連接的運(yùn)動可以形成手勢,或手勢可以包括不連貫的動作或軌跡(例如,802h)。通過連續(xù)的運(yùn)動可以形成手勢,或手勢可以包括不連貫的運(yùn)動(例如,802k,或表示字母“t”的手勢(未示出))。手勢可以包括交叉線(例如,802e、802l)。其它示例性手勢也是可能的,例如三維手勢(例如,802o)和由握手形成的緊密運(yùn)動構(gòu)成的手勢(例如,802i)。手勢可以表示在手寫識別技術(shù)中使用的字符,例如unistrokes、quikwriting和graffiti。手寫識別技術(shù)可以包括字符規(guī)定,該字符規(guī)定使得用戶能夠不用拿筆就書寫字符。例如,表現(xiàn)802b表示graffiti中的字符“t”,并且表現(xiàn)802f表示unistrokes中的字符“f”。手勢還可以表示詞(words)。例如,表現(xiàn)802l可以表示quikwriting中的詞“the”。圖9是示出計(jì)算機(jī)實(shí)施的處理900的流程圖,該處理響應(yīng)于所識別的手勢使功能性調(diào)用起作用。簡要地,計(jì)算機(jī)實(shí)施的處理900包括感測裝置的動作,識別相應(yīng)于所感測的裝置動作的手勢,確定相應(yīng)于所識別的手勢的裝置的功能性,以及調(diào)用所確定的功能性。更詳細(xì)地,當(dāng)處理900開始(s901)時(shí),感測裝置的動作(s902)。例如,傳感器可以檢測裝置的動作。該傳感器可以是配置成檢測或感測裝置的動作或位置的任何類型的部件或設(shè)備。例如,傳感器可以是一個(gè)或多個(gè)內(nèi)置相機(jī)、一個(gè)或多個(gè)陀螺儀,或一個(gè)或多個(gè)全球定位系統(tǒng)(gps)跟蹤器。所述裝置可以配備有這些裝置中的任何裝置或這些裝置的組合?;趤碜詡鞲衅鞯妮斎耄幚砥骺梢詸z測裝置的動作。例如,在裝置包括相機(jī)的實(shí)施方式中,通過分析由相機(jī)捕捉的一系列或一連串圖像,處理器可以檢測移動裝置的動作。在該例子中,通過在由相機(jī)捕捉的圖像上執(zhí)行光流處理,處理器可以檢測裝置的動作。在裝置包括陀螺儀的實(shí)施方式中,通過分析陀螺儀提供的數(shù)據(jù),處理器可以檢測裝置的動作。在這些實(shí)施方式中,通過由陀螺儀產(chǎn)生的動作矢量,可以由處理器檢測運(yùn)動的軌跡。在裝置包括gps跟蹤器或接收器的實(shí)施方式中,通過分析gps跟蹤器或接收器提供的數(shù)據(jù),處理器可以檢測裝置的動作。在這些實(shí)施方式中,通過記錄和分析整個(gè)運(yùn)動期間裝置的相對位置,處理器可以確定動作矢量。在一些實(shí)施方式中,裝置可以配備有位置檢測/跟蹤設(shè)備,例如固定的(onset)或可拆除的(offset)無線位置跟蹤工具。任何這樣的裝置或設(shè)備可以用于檢測裝置的動作,該裝置或設(shè)備根據(jù)裝置的獨(dú)特運(yùn)動顯示(reveal)獨(dú)特的軌跡。例如,處理器檢測的動作可以是所檢測的裝置的動作軌跡或圖案。響應(yīng)于檢測裝置的動作,識別與所感測的裝置動作相應(yīng)的手勢(s904)。處理器可以訪問手勢詞匯。例如,處理器可以從與裝置相關(guān)聯(lián)的電子存儲器中訪問界定手勢詞匯的數(shù)據(jù)。一組軌跡可以界定為詞匯。通過在空中移動裝置來畫出期望的軌跡,可以執(zhí)行這些手勢。如上所述,處理器可以檢測期望的軌跡或動作的圖案。手勢詞匯可以包括界定對應(yīng)于由裝置識別的手勢的裝置的動作。基于所檢測的裝置動作和所訪問的動作數(shù)據(jù),處理器可以確定手勢。例如,大量的處理器可以用于處理從介質(zhì)或傳感器接收的輸入,以識別手的手勢(handgestures),特別用于識別手畫的軌跡。在一些實(shí)施方式中,可以采用點(diǎn)匹配例程、隱馬爾可夫模型和其它圖案識別處理,以識別手勢詞匯中界定的手勢。在確定手勢中,處理器還可以拒絕詞匯中沒有界定的手勢。拒絕手勢可能是重要的,因?yàn)樘幚砥骺梢詫⒉黄谕怯脩糨斎朊畹膭幼髋c期望是用戶輸入命令的動作區(qū)分開?;陔[馬爾可夫模型(hmm)可以拒絕手勢。例如,用于識別手的手勢的基于hmm的拒絕方法可以用于拒絕隨意運(yùn)動。在一些實(shí)施方式中,處理器可以比較裝置的所檢測動作與包括在手勢詞匯中的動作數(shù)據(jù)。如果處理器找到匹配,則處理器確定裝置的動作相應(yīng)于與匹配的動作數(shù)據(jù)相關(guān)聯(lián)的手勢。如果處理器沒有找到匹配,則處理器繼續(xù)比較裝置的所檢測動作與這樣的動作數(shù)據(jù),該動作數(shù)據(jù)與手勢詞匯中的其它手勢相關(guān)聯(lián),直到找到匹配,或者處理器確定所檢測動作與任何手勢都不匹配。在比較所檢測動作數(shù)據(jù)與包括在手勢詞匯中的動作數(shù)據(jù)之前,處理器可以對所檢測動作數(shù)據(jù)進(jìn)行處理。替換地,未知手勢可以與詞匯中所有的模型進(jìn)行比較,并且可以選擇最可能匹配的單個(gè)候選手勢。該拒絕方法已經(jīng)發(fā)展為避免由于僅尋找最大可能性而可能導(dǎo)致的誤匹配。一般地,手勢意指表達(dá)想法、意見、情感、交流、命令、示范或表情的運(yùn)動、位置、姿勢或姿態(tài)(posture)。用戶可以在手握手持裝置的同時(shí)打手勢,或用戶在他們身體部位上佩戴裝置的同時(shí)可以使用一個(gè)或多個(gè)身體部位來打手勢。例如,用戶的手勢可以是單個(gè)或多個(gè)手指的手勢;單手手勢;單手和手臂的手勢;單手和手臂以及身體的手勢;雙手手勢;頭部姿勢或姿態(tài);眼睛位置;面部表情;身體姿勢或姿態(tài),或任何其它富有表現(xiàn)力的身體狀態(tài)。用戶的手勢可以表達(dá)允許或“約定”手勢。約定手勢可以是保持預(yù)定時(shí)間量的姿勢表達(dá)的具體的手的姿勢或手動作次序。一個(gè)示例性的約定手勢是用戶將手持裝置保持穩(wěn)定三秒鐘。另一例子是在保持手持裝置的同時(shí),通過用戶在他們的面部前面伸展他們的手臂,并且在他們頭前呈圓形地移動手臂而完成的圓形手動作。作為另一例子,約定手勢可以是用戶搖動裝置。大體上,約定手勢向裝置指定了用戶準(zhǔn)備好出現(xiàn)進(jìn)一步輸入。為了減少誤差,約定手勢可以是非典型的手勢,例如在正常談話期間用身體語言不會下意識地做出的手勢,或在正常人類活動的通常執(zhí)行中不會做出的手勢。手勢可以來自于界定用戶的想法、意見、情感、交流、命令、示范或表情。例如,用戶的手勢可以是單個(gè)或多個(gè)手指的手勢;單個(gè)手勢;單手和手臂的姿勢;單手和手臂以及身體的姿勢;雙手手勢;頭部姿勢或姿態(tài)的改變;眼睛位置的改變;面部表情的改變;在握著裝置時(shí)的手的運(yùn)動;身體姿勢或姿態(tài)的改變,或任何其它富有表現(xiàn)力的身體狀態(tài)的轉(zhuǎn)變。為了簡潔,用于執(zhí)行相關(guān)手勢的身體部分或多個(gè)身體部分通常稱為“控制目標(biāo)”。例如,用戶可以使用他們的整個(gè)身體或用其他身體目標(biāo)表達(dá)命令,在此情況下,他們的整個(gè)身體或其他身體目標(biāo)可以是控制目標(biāo)。通過眨他們的眼睛、通過張開他們的鼻孔或通過擺動手指,用戶可以更加巧妙地表達(dá)命令,在此情況下,眼瞼、鼻子或手指可以是控制目標(biāo)??刂颇繕?biāo)還可以是物理裝置,列舉幾個(gè)例子,例如紅外手指光、移動裝置、手表裝置、反向反射器或遙控裝置。存在從動作數(shù)據(jù)中確定用戶手勢的許多方式。例如,通過使用手、手臂、身體、頭部或其它目標(biāo)位置信息的手勢分析和檢測處理,可以檢測“在空中畫圓圈”或“將手揮到一側(cè)”的手勢。盡管手勢可以包括兩維或三維位置移置,例如做揮動手勢時(shí),但是在其它情況下手勢包括沒有伴隨的位置移置的轉(zhuǎn)變。例如,如果手以五個(gè)伸出的手指和手掌向前而發(fā)出“停止”的信號,則如果所有五個(gè)手指縮回成球并且手掌保持向前,即使手或手臂的整體位置保持靜止,用戶的手勢仍改變。使用啟發(fā)式(heuristic)技術(shù)可以檢測手勢,例如通過確定手或裝置位置信息是否通過規(guī)則的明確設(shè)定。例如,如果滿足下面的手勢檢測規(guī)則:(1)經(jīng)過小于預(yù)定限制的時(shí)間間隔,水平位置的改變大于預(yù)定距離;(2)經(jīng)過該時(shí)間間隔,水平位置單調(diào)地改變;(3)經(jīng)過該時(shí)間間隔,垂直位置的改變小于預(yù)定距離;以及(4)在該時(shí)間間隔結(jié)束時(shí)的位置比在該時(shí)間間隔開始時(shí)的位置更靠近手檢測區(qū)域的邊界(或在手檢測區(qū)域的邊界上),則可以識別“將手揮到一側(cè)”的手勢。一些手勢采用以明確的次序被執(zhí)行且滿足的多個(gè)這樣的規(guī)則集合:其中規(guī)則集合的滿足致使系統(tǒng)改變到采用不同的規(guī)則集合的狀態(tài)。該系統(tǒng)可能不能夠檢測微妙的手勢,在此情況下可以使用隱馬爾可夫模型,因?yàn)檫@些模型使得能夠檢測一系列具體動作,并且還考慮動作充分地適合手勢的整體可能性。為了能夠輸入復(fù)雜的命令以及增加輸入選擇的數(shù)量,用于識別用戶手勢的處理還可以包括識別沿第一方向的第一位移,識別沿第二方向的第二位移,以及將這些多個(gè)位移組合為單個(gè)手勢。另外,用戶手勢的識別可以確定用戶手勢的幅度和方向。響應(yīng)于識別手勢,確定與所識別的手勢相應(yīng)的裝置的功能性(s906)。例如,處理器可以訪問與所識別手勢相關(guān)聯(lián)的功能數(shù)據(jù)。例如,處理器可以從與裝置相關(guān)聯(lián)的電子存儲器中訪問與經(jīng)確定手勢相關(guān)聯(lián)的功能數(shù)據(jù)。在該例子中,與經(jīng)確定手勢相關(guān)聯(lián)的功能數(shù)據(jù)可以存儲在手勢詞匯中。例如,手勢詞匯可以包括使所識別手勢與特定功能或用戶輸入命令相關(guān)聯(lián)或相關(guān)的數(shù)據(jù)。手勢詞匯可以界定為使得每個(gè)手勢分配給裝置中的功能。例如,在空中畫z的手勢可以分配給移動電話裝置的“打開語音信箱”功能;畫圓圈的手勢可以分配給“重?fù)堋惫δ埽划嫲雸A的手勢可以分配給旋轉(zhuǎn)在裝置的顯示器上顯示的圖像或圖標(biāo)的“旋轉(zhuǎn)”功能等。在已經(jīng)確定功能性之后,調(diào)用該功能性(s908),從而結(jié)束該處理900(s910)。例如,處理器可以運(yùn)行這樣的指令,該指令執(zhí)行所確定的功能性。由裝置執(zhí)行的功能可以打開語音信箱的收件箱,撥打具體的電話號碼,旋轉(zhuǎn)與裝置相關(guān)聯(lián)的顯示器上顯示的圖像,移動與裝置相關(guān)聯(lián)的顯示器上顯示的圖標(biāo)或目標(biāo)等。圖10示出了用于手勢訓(xùn)練的環(huán)境1000。用戶1002執(zhí)行訓(xùn)練手勢,在該例子中以圓形動作移動裝置1004。用戶1002可以是裝置1004的最終用戶(也就是消費(fèi)者),定制該裝置1004用于他們自己使用,或者用戶1002可以是測試用戶,訓(xùn)練裝置1004作為制造商的一部分設(shè)計(jì)和/或裝置1004的拓展。制造商可以使用多個(gè)測試用戶來訓(xùn)練裝置1004。在計(jì)算裝置1008的顯示器1007上示出的用戶界面1006顯示了執(zhí)行的手勢的表現(xiàn),以及在先執(zhí)行的手勢的表現(xiàn)(在這里顯示為一系列的點(diǎn))。用戶1002可以選擇按鈕1011以輸入其它的訓(xùn)練手勢。用戶1002可以輸入跟所期望的一樣多的訓(xùn)練手勢。由于用戶1002重復(fù)地執(zhí)行訓(xùn)練手勢,因此計(jì)算裝置1008繞輸入的手勢的表現(xiàn)1010設(shè)置邊界1012。邊界1012界定運(yùn)動范圍,一旦該運(yùn)動范圍被界定就可以與后來用戶運(yùn)動進(jìn)行比較,以識別界定的手勢。用戶1002可以移動(例如,選擇或拖拉)一個(gè)或多個(gè)尺寸(sizing)調(diào)整手柄1014a至1014d,以精煉(例如,改變尺寸、位置、方向)該邊界1012。用戶1002可以選擇按鈕1016,以刪除與最近輸入的訓(xùn)練手勢相關(guān)的信息。用戶1002可以選擇按鈕1018,以接受由接受的輸入模擬的手勢規(guī)定。可以示出其它的用戶界面元素,例如用于取消當(dāng)前手勢規(guī)定的創(chuàng)建的按鈕(未示出)。用戶界面1006可以用于模擬多個(gè)手勢。用戶界面1006可以用于界定新的手勢規(guī)定,和/或可以用于調(diào)整或精煉現(xiàn)有的或之前界定的手勢規(guī)定。例如,消費(fèi)者用戶可以使用該用戶界面1006以擴(kuò)大之前界定的手勢的邊界。計(jì)算裝置1008可以是臺式個(gè)人計(jì)算機(jī)、便攜式計(jì)算機(jī)、移動電話、個(gè)人數(shù)字助理(pda)、游戲裝置或包括顯示器的其它裝置。裝置1004可以經(jīng)由一個(gè)或多個(gè)有線的或無線的網(wǎng)絡(luò)和/或連接與計(jì)算裝置1008通信。在一些實(shí)施方式中,裝置1004和計(jì)算裝置1008是相同的裝置(也就是,用戶使用裝置1004執(zhí)行訓(xùn)練手勢,然后與在裝置1004上顯示的用戶界面1006交互)。圖11示出了用于手勢構(gòu)造的環(huán)境1100。環(huán)境1100包括用戶界面1101。例如在已經(jīng)訓(xùn)練手勢之后可以顯示用戶界面1101。用戶界面1101可以由最終用戶(例如,消費(fèi)者)啟動,或由為制造商或應(yīng)用開發(fā)者工作的測試用戶啟動。用戶界面1101可以在計(jì)算裝置1103的顯示器1102上示出。計(jì)算裝置1103可以是臺式個(gè)人計(jì)算機(jī)、便攜式計(jì)算機(jī)、移動電話、個(gè)人數(shù)字助理(pda),游戲裝置或包括顯示器的其它裝置。計(jì)算裝置1103可以經(jīng)由一個(gè)或多個(gè)有線的或無線的網(wǎng)絡(luò)和/或連接與移動裝置1004通信。在一些實(shí)施方式中,移動裝置1004和計(jì)算裝置1003是相同的裝置。使用用戶界面1101可以輸入和/或編輯手勢名稱1105。通過拖曳和移動一個(gè)或多個(gè)尺寸調(diào)整手柄1107a至1107d,用戶可以調(diào)整手勢的邊界1106。使用用戶界面1101,功能性可以指定到手勢。復(fù)選框1108可以用于指出指定的功能性可以是依賴數(shù)量的。例如,手勢可以配置成使得如果執(zhí)行具有2:1寬度比1110a的手勢(也就是,執(zhí)行的手勢的寬度是界定的正常手勢的寬度的兩倍),則可以調(diào)用“打開郵箱a”功能1112a。另外,可以進(jìn)行下面的示例性配置:1)如果執(zhí)行具有1:1寬度比1110b的手勢,則可以調(diào)用“打開郵箱b”功能1112b;2)如果執(zhí)行具有3:1高度比1110c的手勢,則可以調(diào)用“映射應(yīng)用”功能1112c;以及3)如果執(zhí)行具有4:1高度比1110d的手勢,則可以調(diào)用“呼叫鮑勃”功能1112d。可以界定默認(rèn)情況,使得如果執(zhí)行這樣的手勢,則可以調(diào)用默認(rèn)的“關(guān)機(jī)”功能1116,該手勢與界定的正常手勢相比具有1:1寬度對高度比。作為手勢配置的例子,如果用戶1118使用移動裝置1104執(zhí)行“瘦高的”橢圓形手勢1120,則移動裝置1104可以識別手勢1120,并且通過比較所識別的手勢1120的高度與界定的正常手勢的高度,可以確定4:1的高度比。移動裝置1104還可以確定功能1112d(“呼叫鮑勃”)已經(jīng)指定為4:1高度比1110d,并且響應(yīng)于識別手勢1120,可以調(diào)用“呼叫鮑勃”功能1112d??梢赃M(jìn)行其它的手勢配置。例如,功能性指定可以取決于除了手勢高度和寬度之外的因素。例如,功能性指定可以取決于手勢速度(例如,第一功能可以配置成響應(yīng)于緩慢執(zhí)行的手勢而調(diào)用,并且第二功能可以配置成響應(yīng)于該手勢的較快執(zhí)行而調(diào)用)。圖12示出了用于選擇性手勢激活的用戶界面1200。該用戶界面1200可以用于選擇性地激活或取消激活包括在裝置詞匯內(nèi)的手勢。例如,裝置詞匯1202包括手勢1204a至1204f,這些手勢分別表示字符“o”、“p”、“d”、“r”、“q”和“f”?;诿總€(gè)應(yīng)用,可以選擇性地使能或激活手勢1204a至1204f。例如,雖然對于映射應(yīng)用1205而言,手勢1204c、1204d、1204e和1204f是廢能的(disabled)(也就是,取消激活),但是對于映射應(yīng)用1205而言手勢1204a和1204b是使能的(如對號1206a和1206b所示)。對于一些應(yīng)用,例如對于映射應(yīng)用1205,可以使能相似形狀手勢集合中的一個(gè)手勢,同時(shí)廢能該集合中的其它手勢,以避免在說明和識別手勢時(shí)混淆。例如,由于手勢1204c和1204e(分別是“d”和“q”形狀)在形狀上與手勢1204a的“o”形狀類似,因此可以廢能手勢1204c和1204e。類似地,由于手勢1204d和1204f(分別是“r”和“f”形狀)在形狀上與手勢1204b的“p”形狀類似,因此可以廢能手勢1204d和1204f。作為另一例子,對于電子郵件編輯應(yīng)用1208以及對于網(wǎng)頁瀏覽器應(yīng)用1210,使能所有的手勢1204a至1204f,因?yàn)閷τ谶@些應(yīng)用1208和1210,用戶可能需要輸入文本(例如,電子郵件信息正文,網(wǎng)站地址),因此可能期望的是使能全部字符手勢。手勢的激活和取消激活還可以是基于制造商設(shè)置或基于字符之間過去的混淆。圖13是示出計(jì)算機(jī)執(zhí)行的處理1300的流程圖,該處理基于所確定的可能性和所確定的匹配狀態(tài)數(shù)量來拒絕輸入手勢。簡要地,計(jì)算機(jī)執(zhí)行的處理1300包括:基于將輸入手勢應(yīng)用于共同地模擬訓(xùn)練手勢詞匯的隱馬爾可夫模型,確定輸入手勢與每個(gè)訓(xùn)練手勢匹配的可能性;確定輸入手勢這樣的狀態(tài)的數(shù)量:該輸入手勢的狀態(tài)與確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配;以及如果所確定的數(shù)量不滿足閾值,則拒絕該輸入手勢。更詳細(xì)地,當(dāng)開始處理1300(s1301)時(shí),基于將輸入手勢應(yīng)用于共同地模擬訓(xùn)練手勢詞匯的隱馬爾可夫模型,確定輸入手勢與訓(xùn)練手勢集合中的每個(gè)訓(xùn)練手勢匹配的可能性(s1302)。例如,可以將單個(gè)隱馬爾可夫模型分配給訓(xùn)練手勢集合中的每個(gè)手勢。使用訓(xùn)練和識別階段期間每個(gè)水平和垂直采樣的均值和標(biāo)準(zhǔn)差,可以規(guī)格化手勢的尺寸。通過訓(xùn)練hmm,可以提取每個(gè)模型的參數(shù)。λi=(ai,bi,πi)表示分配給第i個(gè)手勢的示例性隱馬爾可夫模型λ,其中,π表示在一段時(shí)間開始(例如,t=1)時(shí),處于特殊狀態(tài)的可能性的矢量,a表示狀態(tài)過渡矩陣,并且b表示觀察矩陣,在該觀察矩陣中給出了處于特殊狀態(tài)且觀察符號的可能性。v={v1,v2,...,vm}表示可能的觀察符號的集合。因此,訓(xùn)練手勢集合中手勢的采樣可以用一系列的觀察符號表示。為了產(chǎn)生合適的置信水平,可以提取狀態(tài)改變次序。對于手勢g的訓(xùn)練采樣k,如果每個(gè)hmm具有n個(gè)狀態(tài)(n≥2),則根據(jù)方程式(1)和(2)使用維特比(viterbi)處理可以提取狀態(tài)的次序:og,k={og,k,1,og,k,2,...,og,k,p}(2)1≤g≤g在方程式2中,og,k,j表示在手勢g的第k個(gè)訓(xùn)練采樣中第j個(gè)觀察的符號。在方程式(1)中,為了簡單已經(jīng)排除了標(biāo)記g和k??梢砸赃@樣的方式界定hmm,使得當(dāng)離開狀態(tài)時(shí),在處理給定次序的剩余部分中沒有方法返回到該狀態(tài)。在這些實(shí)施方式中,對于觀察符號的給定次序,每個(gè)狀態(tài)可以滿足一次,而不管在該狀態(tài)中所花費(fèi)的時(shí)間。同樣地,φ可以界定為訓(xùn)練采樣的集合,由下面的方程式(3)反映:φ={ω1,ω2,...,ωg}(3)在方程式(3)中,g表示詞匯中詞(例如,手勢)的數(shù)量(例如,在關(guān)于圖1描述的例子中g(shù)=4)。ωg={og,1,og,2,...,og,r}(4)方程式(4)表示手勢g的所有訓(xùn)練采樣的集合?;谟^察矩陣bg的元素可以界定函數(shù)f。b={b1,b2,...,bg}(5)δg,n,r=f(bg,n(og,r))(6)在方程式(6)中,bg,n(og,r)表示對于第r個(gè)訓(xùn)練采樣,對于在狀態(tài)n中的給定觀察集合og,r,處于狀態(tài)n的手勢g的觀察矩陣b的元素的集合。函數(shù)f可以界定為上述集合的中值或其它函數(shù)。函數(shù)f的其它界定可以包括均值、最小值、最大值等。因此,在函數(shù)f界定為中值的實(shí)施方式中,δg,n,r是由bg,n(og,r)表示的集合的元素的中值。對于詞匯中的給定詞(例如,手勢)經(jīng)過δs集合可以界定第二函數(shù)h:δg,n={δg,n,1,δg,n,2,...,δg,n,r}(7)τg,n=h(δg,n)(8)在方程式(7)中,r是手勢g的訓(xùn)練采樣的數(shù)量,并且方程式(8)中的h界定為給定集合的最小值。還可以使用h的其它界定。鑒于這些界定,τg,n表示使用手勢g的訓(xùn)練采樣集合提取的,在狀態(tài)n中該手勢g的觀察矩陣b的元素的中值的最小值。如果每個(gè)hmm具有n個(gè)狀態(tài):tg={τg,1,τg,2,...,τg,n}n≥2(9)在方程式(9)中界定的集合可以是界定hmm的一部分參數(shù):ψg=(ag,bg,πg(shù),tg)(10)因此,對于給定的輸入?yún)?shù),使用經(jīng)訓(xùn)練的hmm,以產(chǎn)生給定的手勢是詞匯內(nèi)經(jīng)訓(xùn)練詞中的一個(gè)的可能性。選擇產(chǎn)生最大可能性的hmm作為最佳匹配。給定經(jīng)訓(xùn)練的隱馬爾可夫模型集合,表示輸入手勢的數(shù)據(jù)可以提供給所有的模型,并且使用維特比處理可以計(jì)算執(zhí)行的手勢或運(yùn)動與任何經(jīng)訓(xùn)練的模型匹配的可能性。產(chǎn)生最大可能性的模型是與給定手勢相匹配的最可能候選者。為了估計(jì)該手勢可以確定為與由經(jīng)選擇的模型表示的手勢相同的可靠性,可以選擇該模型以估計(jì)給定的手勢。繼續(xù)該處理1300,確定輸入手勢這樣的狀態(tài)的數(shù)量:該輸入手勢的狀態(tài)與確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)狀態(tài)匹配(s1304)。對于選擇的hmm,可以提取狀態(tài)改變的集合(參見方程式(11))。σ={σ1,σ2,...}(11)δu,n=f(bg,n(ou))(12)在方程(12)中,bg,n(ou)表示對于在狀態(tài)n中的給定觀察集合ou,處于狀態(tài)n的觀察矩陣bg的元素的集合。函數(shù)f可以具有與方程式(6)相同的泛函性。對于每種狀態(tài)給定提取的值,可以對給定次序(例如,手勢)已經(jīng)通過建立的hmm的狀態(tài)進(jìn)行計(jì)數(shù)。使用如下界定的方程可以對狀態(tài)數(shù)量進(jìn)行計(jì)數(shù):d(x,y)=x-y+ε-1≤ε≤1(15)在方程式(13)中,z是方程式(14)中界定的單位階躍函數(shù),并且方程式(15)中的ε界定為可調(diào)整值。假設(shè)ε=0,c可以解釋為這樣的狀態(tài)的數(shù)量:對于該狀態(tài),對于給定手勢提取的中值大于或等于對于選擇的模型的訓(xùn)練采樣集合提取的中值的最小值。方程式(13)對狀態(tài)進(jìn)行計(jì)數(shù)而不論它們的次序。在其它實(shí)施方式中,我們可以具有如下的替換規(guī)定:qn=z(d(δu,n,τg,n))·qn-1,q0=1(16)方程式(17)對處于由hmm界定的正確次序的狀態(tài)的數(shù)量進(jìn)行計(jì)數(shù)。繼續(xù)該處理1300,如果所確定的數(shù)量不能滿足閾值,則拒絕輸入手勢(s1306),從而結(jié)束該處理1300(s1308)。例如,基于給定手勢已經(jīng)通過的狀態(tài)的數(shù)量,來自方程式(13)和(17)的c或c′,可以做出建立的模型是否可靠地或精確地匹配給定輸入手勢的決定。閾值可以表達(dá)為數(shù)量或相應(yīng)狀態(tài)的總數(shù)量的百分比。閾值是可配置的,例如由制造商或應(yīng)用開發(fā)者進(jìn)行配置。在一些實(shí)施方式中,兩個(gè)可調(diào)變量ε和可接受的值c或c′給該處理提供了靈活性,以基于手勢與詞匯中最可能的經(jīng)訓(xùn)練手勢的所有部分匹配的接近程度來接受或拒絕手勢。參數(shù)ε調(diào)整觀察的符號的中值與訓(xùn)練階段期間提取的符號的經(jīng)訓(xùn)練的中值之間的可接受距離。將ε設(shè)置為零意味著觀察的中值必須等于或大于對于匹配的hmm的給定狀態(tài)進(jìn)行訓(xùn)練期間觀察的中值的最小值。c或c′的值表示已經(jīng)確定為已經(jīng)成功滿足的狀態(tài)的數(shù)量。雖然如果將給予手勢一些靈活性,則較小的值可能是可以接受的,但是限制性的標(biāo)準(zhǔn)可能需要所有的狀態(tài)得以滿足。因?yàn)閏′可能需要在前狀態(tài)已經(jīng)成功地通過,使得考慮由hmm界定的狀態(tài)的次序,因此,c′比c可能是更加具有限制性的。如果輸入手勢的狀態(tài)次序與通過相應(yīng)的hmm確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)狀態(tài)的次序不相匹配,則可以拒絕輸入手勢。例如,用戶可以畫“2”,與表示“2”的模擬訓(xùn)練手勢的所有部分相匹配,但是可以向后畫“2”,或以與用于訓(xùn)練手勢的hmm中限定的次序相反的次序。由于狀態(tài)次序的不匹配,可以拒絕該“向后的2”。作為另一例子,通過在第二個(gè)圓的頂部畫或表示一個(gè)圓,用戶可以創(chuàng)建“8”,可與表示“8”的訓(xùn)練手勢的所有部分相匹配,但是可能與由訓(xùn)練手勢界定的次序不匹配。如下文更詳細(xì)地描述,如果輸入手勢的第一狀態(tài)或最后狀態(tài)與確定為具有最大可能性的模擬訓(xùn)練手勢的相應(yīng)第一狀態(tài)或最后狀態(tài)不匹配,則可以拒絕該輸入手勢。如果拒絕輸入手勢作為具有所確定的最大可能性的訓(xùn)練手勢的相配物,則在決定最終拒絕該輸入手勢之前,可以考慮第二最可能手勢(以及可能的另外手勢)作為潛在的相配物。例如,可以確定第二模擬訓(xùn)練手勢具有第二最大可能性??梢源_定與第二模擬訓(xùn)練手勢的相應(yīng)狀態(tài)相匹配輸入手勢狀態(tài)的第二數(shù)量。如果所確定的第二數(shù)量不能滿足閾值,則可以拒絕該輸入手勢。例如,如果用戶打手勢表示“s”形狀,則該輸入手勢可以與表示“8”的最大可能性的訓(xùn)練手勢進(jìn)行比較,并且如果確定該輸入手勢與“8”不匹配,則該輸入手勢可以與表示“5”的第二最大可能性的訓(xùn)練手勢進(jìn)行比較。人員或用戶可以在交互桌面(interactivetable)上執(zhí)行大量的手勢,其中桌面屏幕下方的相機(jī)對用戶手指的位置成像并追蹤該位置以識別手勢。在一些實(shí)施方式中,阿拉伯?dāng)?shù)字“0”至“9”以及運(yùn)算符“加”、“減”和“等于”可以界定為詞匯中的手勢集合。單獨(dú)的4-狀態(tài)hmm可以分配給每個(gè)手勢,并且使用特定數(shù)量的訓(xùn)練采樣(例如,三十)、前后處理以及上述的處理,可以訓(xùn)練該hmm。使用訓(xùn)練和識別階段期間每個(gè)水平和垂直采樣的均值和標(biāo)準(zhǔn)差,可以規(guī)格化手勢的尺寸。使用經(jīng)訓(xùn)練的模型,可以執(zhí)行四十六個(gè)手勢的集合,該集合主要包括在詞匯中沒有界定的手勢。然而,在詞匯中界定的大量手勢也包括在該集合中,以為了檢查處理的準(zhǔn)確性。手勢可以界定為原始的、沒有規(guī)格化的手的運(yùn)動。原始數(shù)據(jù)在送到識別處理之前可以進(jìn)行規(guī)格化。圖14示出了示例性的手勢1401至1412。每個(gè)手勢下方的第一個(gè)數(shù)字(例如,手勢1401下方的“8”1414)表示hmm識別為最匹配的手勢,并且第二個(gè)數(shù)字(例如,手勢1401下方的“1110”1416)是以二進(jìn)制數(shù)字序列表達(dá)的這樣的指示:該指示示出了手勢的四個(gè)狀態(tài)中哪些狀態(tài)與示例性處理中解釋的標(biāo)準(zhǔn)相匹配。例如,“1011”意味著第一、第三和第四狀態(tài)通過,但是第二狀態(tài)沒有通過。在該例子中,調(diào)整觀察的符號的中值與訓(xùn)練階段期間提取的符號的經(jīng)訓(xùn)練的中值之間的可接受距離的參數(shù)(ε)假設(shè)為零(ε=0)。手勢1401示出了這樣的手勢:除了最后狀態(tài)之外,該手勢類似于數(shù)字“8”。使用示例性處理1300,第一至第三狀態(tài)滿足是關(guān)于數(shù)字8的手勢的標(biāo)準(zhǔn),但是最后狀態(tài)不滿足界定的標(biāo)準(zhǔn)。該處理示出了對于手勢1402而言,第一至第三狀態(tài)已經(jīng)通過,該手勢1402識別為關(guān)于數(shù)字5的手勢。手勢1402在某些方面類似于關(guān)于數(shù)字5的手勢,然而該手勢1402的結(jié)束不類似于數(shù)字5。除了最后狀態(tài)之外,手勢1403類似于數(shù)字8的狀態(tài)。使用該示例性的處理,第一至第三狀態(tài)滿足是關(guān)于數(shù)字8的手勢的標(biāo)準(zhǔn),但是最后狀態(tài)不滿足界定的標(biāo)準(zhǔn)。除了開始狀態(tài)之外,手勢1404類似于數(shù)字3。使用該示例性的處理,第一至第三狀態(tài)不滿足是關(guān)于數(shù)字3的手勢的標(biāo)準(zhǔn),但是最后狀態(tài)滿足標(biāo)準(zhǔn)。手勢1405和1406這兩者識別為與關(guān)于數(shù)字9的手勢最相似。然而,在手勢1405中,手勢的開始與數(shù)字9的開始完全不同。手勢1405通過第三和第四狀態(tài)。在手勢1406中,手勢開始類似于數(shù)字9,接著與數(shù)字9不類似,然后變得再次與關(guān)于數(shù)字9的手勢相類似,直到運(yùn)動結(jié)束。手勢1406的第一、第三和第四狀態(tài)滿足界定的標(biāo)準(zhǔn),但是第二狀態(tài)不滿足。手勢1407與任何界定的手勢都不相似,但是識別為與數(shù)字4最相似。使用該示例性處理,任何狀態(tài)都不滿足是關(guān)于數(shù)字4的手勢的標(biāo)準(zhǔn)。手勢1408類似于數(shù)字6的開始,但是朝向手勢的結(jié)束與數(shù)字6不同。使用該示例性處理,第一狀態(tài)滿足是關(guān)于數(shù)字6的手勢的標(biāo)準(zhǔn),但是最后三個(gè)狀態(tài)都不滿足該標(biāo)準(zhǔn)。手勢1409至1412示出了類似于界定的數(shù)字手勢的運(yùn)動。如所示,對于手勢1409至1412而言,所有的四個(gè)狀態(tài)都滿足界定的標(biāo)準(zhǔn)。可以界定閾值,該閾值可以用作用于接受和拒絕手勢的基礎(chǔ)。如果手勢通過由閾值界定的最少狀態(tài)數(shù)量,則可以接受該手勢。如果手勢沒有通過由閾值界定的最少狀態(tài)數(shù)量,則可以拒絕該手勢。例如,如果界定閾值為3,則因?yàn)槭謩?401至1403、1406以及1409至1412已經(jīng)通過最少3個(gè)狀態(tài),因此可以接受這些手勢。因?yàn)槭謩?404、1405、1407和1408沒有通過最少3個(gè)狀態(tài),因此可以拒絕它們。另外地或替換地,如果手勢沒有通過開始狀態(tài)和/或結(jié)束狀態(tài),則可以拒絕該手勢。例如,即使手勢1401至1403已經(jīng)通過3個(gè)狀態(tài)并且已經(jīng)通過第一狀態(tài),但是因?yàn)樗鼈儧]有通過結(jié)束狀態(tài),因此可以拒絕這些手勢。作為另一例子,盡管手勢1404的一部分看起來像“3”,但是因?yàn)樵撌謩輿]有通過第一狀態(tài),因此可以拒絕該手勢。如上所述且如圖15所示,用戶1502可以使用裝置1506在空中形成手勢1504。用戶還可以使用各種其它方法形成手勢。例如,用戶可以使用手指或筆在平板計(jì)算機(jī)1510上形成手勢1508。用戶1512還可在觸摸屏1516上產(chǎn)生手勢1514,例如如果觸摸屏1516包括在亭子1518中。作為另一例子,用戶1520可以在交互桌面1524上產(chǎn)生手勢1522,其中手勢1522由相機(jī)1526識別,該相機(jī)可以定位在桌面1524的下方。圖16是可以用于實(shí)施在此描述的系統(tǒng)、方法和處理的計(jì)算裝置1600、1650的框圖,該計(jì)算裝置作為客戶端或作為服務(wù)器或多個(gè)服務(wù)器。計(jì)算裝置1600打算表示各種形式的數(shù)字計(jì)算機(jī),例如:筆記本電腦、臺式機(jī)、工作站、個(gè)人數(shù)字助理、服務(wù)器、刀片服務(wù)器、大型機(jī)和其它合適的計(jì)算機(jī)。計(jì)算裝置1650打算表示各種形式的移動裝置,例如:個(gè)人數(shù)字助理、蜂窩電話、智能手機(jī)和其它類似的計(jì)算裝置。在此示出的部件,它們的連接和關(guān)系以及它們的功能僅僅意味著是示例性的,并且不意味著限制在該文件中描述的和/或要求的實(shí)施方式。計(jì)算裝置1600包括處理器1602、存儲器1604、存儲裝置1606、連接到存儲器1604和高速擴(kuò)展端口1610的高速界面1608,以及連接到低速總線1614和存儲裝置1606的低速界面1612。每個(gè)部件1602、1604、1606、1608、1610和1612使用各種總線互連,并且可以安裝在共同的主板上或酌情以其它方式安裝。處理器1602可以處理用于在計(jì)算裝置1600內(nèi)執(zhí)行的指令,包括存儲在存儲器1604或存儲裝置1606中的指令,以顯示用于外部輸入/輸出裝置上的gui的圖形信息,例如接合到高速界面1608的顯示器1616。在其它實(shí)施方式中,根據(jù)情況連同多個(gè)存儲器和存儲器的種類一起,可以使用多個(gè)處理器和/或多條總線。另外,多個(gè)計(jì)算裝置1600可以與提供部分必需操作的每個(gè)裝置連接(例如,作為服務(wù)器銀行、一組刀片服務(wù)器或多個(gè)處理器系統(tǒng))。存儲器1604存儲計(jì)算裝置1600內(nèi)的信息。在一個(gè)實(shí)施方式中,存儲器1604是計(jì)算機(jī)可讀介質(zhì)。在一個(gè)實(shí)施方式中,存儲器1604是一個(gè)或多個(gè)易失性存儲器單元。在另外的實(shí)施方式中,存儲器1604是一個(gè)或多個(gè)非易失性存儲器單元。存儲裝置1606能夠?yàn)橛?jì)算裝置1600提供大量存儲。在一個(gè)實(shí)施方式中,存儲裝置1606是計(jì)算機(jī)可讀介質(zhì)。在各種不同的實(shí)施方式中,存儲裝置1606可以是軟盤驅(qū)動器、硬盤設(shè)備、光盤設(shè)備或磁帶機(jī)、閃存存儲器或其他類似的固態(tài)存儲器裝置,或裝置陣列,包括存儲區(qū)域網(wǎng)絡(luò)或其它構(gòu)造中的裝置。在一個(gè)實(shí)施方式中,計(jì)算機(jī)程序產(chǎn)品確實(shí)地包括在信息載體中。計(jì)算機(jī)程序產(chǎn)品包括這樣的指令:當(dāng)運(yùn)行時(shí)執(zhí)行一個(gè)或多個(gè)方法,例如上文所述的那些方法。信息載體是計(jì)算機(jī)或機(jī)器可讀介質(zhì),例如存儲器1604、存儲裝置1606、處理器1602上的存儲器或傳播信號。高速控制器1608管理計(jì)算裝置1600的帶寬密集操作,同時(shí)低速控制器1612管理較低帶寬密集操作。責(zé)任的這樣分配僅僅是示例性的。在一個(gè)實(shí)施方式中,高速控制器1608結(jié)合存儲器1604、顯示器1616(例如,通過圖形處理器或加速器)以及可以接受各種擴(kuò)展卡(未示出)的高速擴(kuò)展端口1610。在實(shí)施方式中,低速控制器1612結(jié)合到存儲裝置1606和低速擴(kuò)展端口1614??梢园ǜ鞣N通信端口(例如,usb、藍(lán)牙、以太網(wǎng)、無線以太網(wǎng))的低速擴(kuò)展端口例如通過網(wǎng)絡(luò)適配器可以結(jié)合一個(gè)或多個(gè)輸入/輸出裝置,例如鍵盤、指向裝置、掃描器或諸如開關(guān)或路由器的網(wǎng)絡(luò)設(shè)備。計(jì)算裝置1600可以以大量的不同形式來實(shí)施,如圖所示。例如,該計(jì)算裝置可以實(shí)施為標(biāo)準(zhǔn)服務(wù)器1620,或多組這樣的服務(wù)器。該計(jì)算裝置還可以實(shí)施為一部分的機(jī)架服務(wù)器系統(tǒng)1624。另外,該計(jì)算裝置可以在諸如筆記本電腦1622的個(gè)人計(jì)算機(jī)中實(shí)施。替換地,來自計(jì)算裝置1600的部件可以與諸如裝置1650的移動裝置(未示出)中的其它部件相結(jié)合。每個(gè)這樣的裝置可以包括一個(gè)或多個(gè)計(jì)算裝置1600、1650,并且整個(gè)系統(tǒng)可以由彼此通信的多個(gè)計(jì)算裝置1600、1650組成。計(jì)算裝置1600可以包括一個(gè)或多個(gè)傳感器(未示出),例如陀螺儀、相機(jī)或gps(全球定位衛(wèi)星)追蹤器,該傳感器配置成對計(jì)算裝置1600的位置或動作進(jìn)行檢測或感測。除了其它部件之外,計(jì)算裝置1650包括處理器1652、存儲器1664、諸如顯示器1654的輸入/輸出裝置、通信界面1666和收發(fā)器1668。裝置1650還可以被提供有存儲裝置,例如微驅(qū)動器或其它裝置,以提供附加存儲器。每個(gè)部件1650、1652、1664、1654、1666和1668使用各種總線互連,并且?guī)讉€(gè)部件可以安裝在共同的主板上或酌情以其它方式安裝。計(jì)算裝置1650可以包括一個(gè)或多個(gè)傳感器(未示出),例如陀螺儀、相機(jī)或gps(全球定位衛(wèi)星)追蹤器,該傳感器配置成對計(jì)算裝置1600的位置或動作進(jìn)行檢測或感測。處理器1652可以處理用于在計(jì)算裝置1650內(nèi)執(zhí)行的指令,包括存儲在存儲器1664中的指令。該處理器還可以包括分開的模擬和數(shù)字處理器。例如,對于裝置1650的其它部件的協(xié)調(diào),例如用戶界面的控制器,處理器可以提供由裝置1650運(yùn)行的應(yīng)用以及裝置1650的無線通信。處理器1652可以通過結(jié)合顯示器1654的控制界面1658和顯示節(jié)目1656與用戶進(jìn)行通信。顯示器1654例如可以是tftlcd顯示器或oled顯示器,或其它合適的顯示技術(shù)。顯示界面1656可以包括用于驅(qū)動顯示器1654的合適電路,以給用戶呈現(xiàn)圖形和其它信息??刂平缑?658可以接收來自用戶的命令,并且將它們轉(zhuǎn)化以提供給處理器1652。另外,外部界面1662可以設(shè)置成與處理器1652通信,以使得裝置1650能夠與其它裝置近范圍通信。例如外部界面1662可以提供有線通信(例如,經(jīng)由對接程序),或者提供無線通信(例如,經(jīng)由藍(lán)牙或其它這樣的技術(shù))。存儲器1664存儲計(jì)算裝置1650內(nèi)的信息。在一個(gè)實(shí)施方式中,存儲器1664是計(jì)算機(jī)可讀介質(zhì)。在一個(gè)實(shí)施方式中,存儲器1664是一個(gè)或多個(gè)易失性存儲器單元。在另外的實(shí)施方式中,存儲器1664是一個(gè)或多個(gè)非易失性存儲器單元。還可以提供擴(kuò)展存儲器1674,并且擴(kuò)展存儲器1674通過擴(kuò)展接口1672可以與裝置1650連接,該擴(kuò)展接口1672例如可以包括simm卡接口。這樣的擴(kuò)展存儲器1674可以給裝置1650提供額外的存儲空間,或還可以存儲裝置1650的應(yīng)用或其它信息。具體地,擴(kuò)展存儲器1674可以包括指令以執(zhí)行或補(bǔ)充上述的處理,并且還可以包括安全信息。因此,例如擴(kuò)展存儲器1674可以作為安全模塊提供給裝置1650,并且可以編有允許安全使用裝置1650的指令。另外,經(jīng)由simm卡可以提供安全應(yīng)用以及另外的信息,例如以非可黑方式(non-hackablemanner)將識別信息置于simm卡上。存儲器例如可以包括閃存存儲器和/或mram存儲器,如下文所述。在一個(gè)實(shí)施方式中,計(jì)算機(jī)程序產(chǎn)品確實(shí)地包括在信息載體中。計(jì)算機(jī)程序產(chǎn)品包括這樣的指令:當(dāng)運(yùn)行時(shí)執(zhí)行一個(gè)或多個(gè)方法,例如上文所述的那些方法。信息載體是計(jì)算機(jī)或機(jī)器可讀介質(zhì),例如存儲器1664、擴(kuò)展存儲器1674、處理器1652上的存儲器或傳播信號。裝置1650通過通信接口1666可以無線通信,該通信接口在需要時(shí)可以包括數(shù)字信號處理電路。通信接口1666在各種模式或協(xié)議下可以提供通信,例如gsm語音呼叫、sms、ems或mms信息,cdma、tdma、pdc、wcdma、cdma2000或gprs。例如通過射頻收發(fā)器1668可以出現(xiàn)這樣的通信。另外,例如使用藍(lán)牙、wifi或其它這樣的收發(fā)器(未示出)可以出現(xiàn)短范圍的通信。另外,gps接收模塊1670可以給裝置1650提供另外的無線數(shù)據(jù),根據(jù)情況在裝置1650上運(yùn)行的應(yīng)用可以使用該無線數(shù)據(jù)。使用音頻編解碼器1660,裝置1650還可以進(jìn)行聽得見的通信,該音頻編解碼器1660可以接收來自用戶的說話信息,并將該說話信息轉(zhuǎn)換成可使用的數(shù)字信息。同樣地,音頻編解碼器1660可以生成對應(yīng)用戶而言聽得見的聲音,例如通過裝置1650的聽筒中的揚(yáng)聲器。這樣的聲音可以包括來自語音電話呼叫的聲音,可以包括記錄的聲音(例如,語音信息、音樂文件等),并且還可以包括由裝置1650上運(yùn)行的應(yīng)用生成的聲音。計(jì)算裝置1650可以以許多不同的形式來實(shí)施,如圖所示。例如,該計(jì)算裝置可以實(shí)施為蜂窩電話1680。該計(jì)算裝置還可以實(shí)施為部分智能手機(jī)1682、個(gè)人數(shù)字助理或其它類似的移動裝置。在此描述的系統(tǒng)和技術(shù)的各種實(shí)施方式可以在數(shù)字電子電路、集成電路、專門設(shè)計(jì)的asic(應(yīng)用專用集成電路)、計(jì)算機(jī)硬件、固件、軟件和/或其組合中實(shí)現(xiàn)(realized)。這些各種實(shí)施方式可以包括在一個(gè)或多個(gè)計(jì)算機(jī)程序中的實(shí)施方式,其中該計(jì)算機(jī)程序在可編程系統(tǒng)上可運(yùn)行和/或可編譯,該可編程系統(tǒng)包括至少一個(gè)專用或通用目的的可編程處理器、至少一個(gè)輸入裝置以及至少一個(gè)輸出裝置,該可編程處理器結(jié)合成接收來自存儲系統(tǒng)的數(shù)據(jù)和指令,以及將數(shù)據(jù)和指令傳送給存儲系統(tǒng)。這些計(jì)算機(jī)程序(還已知為程序、軟件、軟件應(yīng)用或代碼)包括可編程處理器的機(jī)器指令,并且可以以高水平程序和/或面向?qū)ο缶幊陶Z言,和/或以匯編/機(jī)器語言執(zhí)行。如在此使用的,術(shù)語“機(jī)器可讀介質(zhì)”、“計(jì)算機(jī)可讀介質(zhì)”涉及用于給可編程處理器提供機(jī)器指令和/或數(shù)據(jù)的任何計(jì)算機(jī)程序產(chǎn)品、設(shè)備和/或裝置(例如,磁盤、光盤、存儲器、可編程邏輯器件(pld)),包括接收機(jī)器指令作為機(jī)器可讀信號的計(jì)算機(jī)可讀介質(zhì)。術(shù)語“機(jī)器可讀信號”涉及用于給可編程處理器提供機(jī)器指令和/或數(shù)據(jù)的任何信號。為了提供與用戶交互,在此描述的系統(tǒng)和技術(shù)可以在這樣的計(jì)算機(jī)上實(shí)施:該計(jì)算機(jī)具有用于給用戶顯示信息的顯示裝置(例如,crt(陰極射線管)或lcd(液晶顯示器)監(jiān)控器),以及鍵盤和指向裝置(例如,鼠標(biāo)或軌跡球),通過鍵盤和指向裝置用戶可以給計(jì)算機(jī)提供輸入。其它類型的裝置也可以用于提供與用戶交互;例如,提供給用戶的反饋可以是任何形式的感官反饋(例如,視覺反饋、聽覺反饋或觸覺反饋);并且可以以任何形式接收來自用戶的輸入,包括聽覺、口頭或觸覺輸入。在此描述的系統(tǒng)和技術(shù)可以在這樣的計(jì)算系統(tǒng)中實(shí)施:該計(jì)算系統(tǒng)包括后端部件(例如,作為數(shù)據(jù)服務(wù)器),或包括中間部件(例如,應(yīng)用服務(wù)器),或包括前端部件(例如,具有圖形用戶界面或網(wǎng)頁瀏覽器的客戶端計(jì)算機(jī),通過圖形用戶界面或網(wǎng)頁瀏覽器用戶可以與在此描述的系統(tǒng)和技術(shù)的實(shí)施方式交互),或這樣的后端、中間或前端部件的任何組合。系統(tǒng)的部件可以通過任何形式或數(shù)字?jǐn)?shù)據(jù)通信的介質(zhì)(例如,通信網(wǎng)絡(luò))而互連。通信網(wǎng)絡(luò)的例子包括局域網(wǎng)(“l(fā)an”)、廣域網(wǎng)(“wan”)和因特網(wǎng)。計(jì)算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器一般彼此遠(yuǎn)離,并且典型地通過通信網(wǎng)絡(luò)而交互。客戶端和服務(wù)器的關(guān)系依靠在各自計(jì)算機(jī)上運(yùn)行且具有客戶端-服務(wù)器彼此關(guān)系的計(jì)算機(jī)程序而產(chǎn)生。已經(jīng)描述了大量的實(shí)施方式。然而,應(yīng)理解在不脫離本公開內(nèi)容的精神和范圍的情況下可以得到各種修改。因而,其它實(shí)施方式都在所附權(quán)利要求的范圍內(nèi)。當(dāng)前第1頁12當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1