快速姿勢檢測器的制造方法
【專利摘要】本發(fā)明呈現(xiàn)用于在一源圖像序列中確定是否執(zhí)行手勢的方法及設(shè)備。在一些實(shí)施例中,一種方法包含使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的手勢。所述方法還可包含從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模型,優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序以用于在所述源圖像序列中搜索所述手勢,及使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列以確定是否執(zhí)行所述手勢。在執(zhí)行所述手勢的情況下,所述方法可在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行所述手勢之前結(jié)束掃描。
【專利說明】快速姿勢檢測器
【背景技術(shù)】
[0001] 本發(fā)明涉及所記錄圖像中的手勢檢測。更具體來說,本發(fā)明論述用于改善在檢測 第一圖像及一圖像序列中的手勢時(shí)的速度、精確度及消耗的資源的有效的方法及設(shè)備。所 屬領(lǐng)域中已知用于檢測手勢的數(shù)種技術(shù),例如手姿勢、臂運(yùn)動及其類似者。然而,許多技術(shù) 可能依賴于僅可見于大型耗電機(jī)器中的高性能處理器。手勢檢測方法可能不會非常有效, 從而使得此類方法難W用于較小移動裝置中,及/或用于恒定的實(shí)時(shí)圖像記錄中。因而需 要實(shí)施不太耗時(shí)且功率更有效的手勢檢測方法。
【發(fā)明內(nèi)容】
[0002] 可根據(jù)本文所描述的各種實(shí)施例來解決該些問題及其它問題。
[0003] 在一些實(shí)施例中,呈現(xiàn)一種用于確定是否在一源圖像序列中執(zhí)行手勢的方法。所 述方法可包含使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一 者中的手勢。所述方法可進(jìn)一步包含從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所 檢測到的手勢的第一手勢模型,優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手 勢模型進(jìn)行優(yōu)先級排序W用于在所述源圖像序列中搜索所述手勢,及使用所述經(jīng)優(yōu)先級排 序的第一手勢模型掃描所述源圖像序列W確定是否執(zhí)行所述手勢。在執(zhí)行所述手勢的情況 下,所述方法還可包含在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行所述手勢 之前結(jié)束掃描。
[0004] 在一些實(shí)施例中,所述參考圖像包含所述源圖像序列中的先前圖像。在一些實(shí)施 例中,所述多個(gè)手勢模型包含手姿勢。在一些實(shí)施例中,所述多個(gè)手勢模型包含面部表情。 在一些實(shí)施例中,所述多個(gè)手勢模型包含左手?jǐn)傞_的手模型、右手?jǐn)傞_的手模型或拳頭模 型。
[0005] 在一些實(shí)施例中,所述方法進(jìn)一步包含優(yōu)先于其它位置對所述一或多個(gè)參考圖像 中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先級排序W用于在所述源圖像序列中搜索所述手 勢,及使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置掃描所述源圖像序列W確定是 否執(zhí)行所述手勢。
[0006] 在一些實(shí)施例中,所述方法進(jìn)一步包含優(yōu)先于其它比例對所述一或多個(gè)參考圖像 中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先級排序W用于在所述源圖像序列中搜索所述手 勢,及使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的比例掃描所述源圖像序列W確定是 否執(zhí)行所述手勢。
[0007] 在一些實(shí)施例中,所述方法進(jìn)一步包含優(yōu)先于其它位置對所述一或多個(gè)參考圖像 中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先級排序W用于在所述源圖像序列中搜索所述手 勢,優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先級 排序W用于在所述源圖像序列中搜索所述手勢,及使用所述所檢測到的手勢的所述經(jīng)優(yōu)先 級排序的位置、所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的比例及所述經(jīng)優(yōu)先級排序的第 一手勢模型的組合掃描所述源圖像序列W確定是否執(zhí)行所述手勢。
[0008] 在一些實(shí)施例中,所述方法進(jìn)一步包含在于所述源圖像序列中檢測到預(yù)定數(shù)目個(gè) 手勢的情況下,在完成對所述源圖像序列的完全掃描之前結(jié)束對所述源圖像序列中的所述 手勢的掃描。
[0009] 在一些實(shí)施例中,所述方法進(jìn)一步包含確定與所述手勢相比較來說不太可能在所 述一或多個(gè)參考圖像中檢測到第二手勢。所述方法還可包含在檢測到所述手勢之后基于確 定不太可能檢測到所述第二手勢而檢測所述一或多個(gè)參考圖像W查找所述第二手勢。
[0010] 在一些實(shí)施例中,所述方法進(jìn)一步包含在按級的連續(xù)編號排序的多個(gè)級聯(lián)級中掃 描所述一或多個(gè)參考圖像W查找所述手勢,及改進(jìn)對所述一或多個(gè)參考圖像的用W查找所 述手勢的所述掃描。所述級聯(lián)級中的每一級可包含掃描所述圖像中的周期性編號的像素W 檢測所述手勢。所述周期性編號的像素可與所述周期性編號的像素中的每隔一個(gè)像素相距 恒定的垂直及水平距離,且任一級中的像素的所述周期性編號可小于或等于前一級中的像 素的所述周期性編號。所述方法還可包含通過確定所述連續(xù)編號的級中的最后一級是否檢 測到所述手勢的至少一部分識別所述手勢。
[0011] 在一些實(shí)施例中,呈現(xiàn)一種用于確定是否在一源圖像序列中執(zhí)行手勢的設(shè)備。所 述設(shè)備可包含存儲器,所述存儲器經(jīng)配置W存儲一或多個(gè)參考圖像及所述圖像序列。所述 設(shè)備還可包含通信地禪合到所述存儲器的處理器。所述處理器可經(jīng)配置W;使用多個(gè)手勢 模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的手勢;從所述一或多個(gè) 手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模型;優(yōu)先于所述多個(gè)手勢 模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序W用于在所述源圖像序列中 搜索所述手勢;使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列W確定是否執(zhí) 行所述手勢;及在執(zhí)行所述手勢的情況下,在使用另一手勢模式之前結(jié)束掃描。
[0012] 在一些實(shí)施例中,呈現(xiàn)一種設(shè)備。所述設(shè)備可包含;用于使用多個(gè)手勢模型中的一 或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的手勢的裝置;用于從所述一或多個(gè) 手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模型的裝置;用于優(yōu)先于所 述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序W用于在所述源 圖像序列中搜索所述手勢的裝置;用于使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源 圖像序列W確定是否執(zhí)行所述手勢的裝置;及在執(zhí)行所述手勢的情況下,用于在使用所述 多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行所述手勢之前結(jié)束掃描的裝置。
[0013] 在一些實(shí)施例中,呈現(xiàn)一種非暫時(shí)性處理器可讀媒體。所述非暫時(shí)性處理器可讀 媒體可包含經(jīng)配置W致使處理器進(jìn)行W下操作的處理器可讀指令;使用多個(gè)手勢模型中的 一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的手勢;從所述一或多個(gè)手勢模型 中選擇最接近地匹配所述所檢測到的手勢的第一手勢模型;優(yōu)先于所述多個(gè)手勢模型中 的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序W用于在一源圖像序列中搜索所述 手勢;使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列W確定是否執(zhí)行所述手 勢;及在執(zhí)行所述手勢的情況下,在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí) 行所述手勢之前結(jié)束掃描。
[0014] 在一些實(shí)施例中,呈現(xiàn)用W檢測例如手姿勢等一或多個(gè)手勢的方法及設(shè)備。在一 些實(shí)施例中,方法包含檢測攤開的手掌,例如,在攝像機(jī)或視覺裝置前方伸展的攤開的手 掌。然而,該些實(shí)施例并非限制性的,且所屬領(lǐng)域的技術(shù)人員將認(rèn)識到,下文所描述的實(shí)施 例可用W檢測其它姿勢及/或手勢或運(yùn)動。在一些實(shí)施例中,級聯(lián)的弱分類器用于檢測姿 勢或手勢。在一些實(shí)施例中,所述檢測方法可為循環(huán)密集型,例如,檢測可集中于多比例視 頻中貞上及每一峽的每一像素上。
[0015] 在一些實(shí)施例中,所述所呈現(xiàn)的方法可為手跟蹤器算法中的第一步驟。舉例來說, 在一些實(shí)施例中,可提供初始約定位置或重新約定位置及/或相對于所述初始約定位置的 當(dāng)前位置的跟蹤。在一些實(shí)施例中,如果在一段時(shí)間內(nèi)(例如,500毫砂)姿勢為靜止的,那 么辨識約定。在一些實(shí)施例中,甚至在用于查看的裝置處于待用模式從而使得可辨識手勢 用于接通所述裝置時(shí),所述方法也可運(yùn)行。另外,一些方法可按低周期性運(yùn)行W從假及/或 丟失跟蹤恢復(fù)(重新約定)。
[0016] 在一些實(shí)施例中,方法可包含至少四個(gè)部分:按比例調(diào)整、預(yù)先處理、響應(yīng)計(jì)算及 矩形結(jié)果處理。
【專利附圖】
【附圖說明】
[0017] 可通過參考W下各圖來實(shí)現(xiàn)對各種實(shí)施例的性質(zhì)及優(yōu)點(diǎn)的理解。在附圖中,類似 組件或特征可W具有相同參考標(biāo)簽。另外,可通過在參考標(biāo)簽之后跟著短劃線及在類似組 件當(dāng)中進(jìn)行區(qū)分的第二標(biāo)簽來區(qū)分相同類型的各種組件。如果說明書中只使用第一參考標(biāo) 簽,那么描述適用于具有相同的第一參考標(biāo)簽的類似組件中的任一者,與第二參考標(biāo)簽無 關(guān)。
[0018] 圖1為根據(jù)一些實(shí)施例的實(shí)例裝置的說明。
[0019] 圖2A及2B為由根據(jù)一些實(shí)施例的圖像記錄裝置檢測到的手勢的實(shí)例情境。
[0020] 圖3說明根據(jù)一些實(shí)施例的實(shí)例手勢及手勢模型。
[0021] 圖4說明根據(jù)一些實(shí)施例的示例性過程流程。
[0022] 圖5說明根據(jù)一些實(shí)施例的用于檢測手勢的示例性流程圖。
[0023] 圖6說明根據(jù)一些實(shí)施例的用于檢測手勢的另一示例性流程圖。
[0024] 圖7說明根據(jù)一些實(shí)施例的實(shí)例級聯(lián)級樣本分布。
[0025] 圖8說明根據(jù)一些實(shí)施例的視頻峽上的實(shí)例模型滑動。
[0026] 圖9A及9B說明根據(jù)一些實(shí)施例的示例性流程圖。
[0027] 圖10說明可在其中實(shí)施本發(fā)明的一或多個(gè)方面的實(shí)例計(jì)算系統(tǒng)。
【具體實(shí)施方式】
[002引詞語"示例性"在本文中用W意味著"充當(dāng)實(shí)例、例子或說明"。本文中描述為"示 例性"的任何實(shí)施例或設(shè)計(jì)未必應(yīng)被解釋為比其它實(shí)施例或設(shè)計(jì)優(yōu)選或有利。
[0029] 如本文所使用,"手勢"可指通過人體的部分做出的非口頭通信的形式,且與例如 話語等口頭通信形成對比。舉例來說,可通過第一位置、姿勢或表情與第二姿勢、位置或表 情之間的移動、改變或變換來定義手勢。如本文所使用,"手勢"還可包含通過人體的部分做 出的靜態(tài)姿勢。舉例來說,"手勢"可包含僅展示所做出的運(yùn)動的部分的靜態(tài)姿勢。日常言 語中所使用的常見手勢可包含(例如)"兔耳"手勢、鞠躬手勢、屈膝禮、頰吻、手指或手運(yùn) 動、屈膝、搖頭或移動、舉手擊掌、點(diǎn)頭、愁容、舉起拳頭、敬禮、豎起大拇指運(yùn)動、捏夾手勢、 攤開的手掌、握拳、搖動拳頭、指著的手指、"和平"標(biāo)志,或任何手或身體扭轉(zhuǎn)運(yùn)動??墒褂?攝像機(jī)(例如,通過分析用戶的圖像)、使用傾斜傳感器(例如,通過檢測用戶握持或傾斜裝 置的角度)或通過任何其它方法來檢測手勢。如所屬領(lǐng)域的技術(shù)人員將從上述描述及下文 的進(jìn)一步描述了解,例如,手勢可包括非觸摸、不觸摸或無觸摸手勢,例如在半空中執(zhí)行的 手移動。例如,在一些實(shí)施例中,此類非觸摸、不觸摸或無觸摸手勢可區(qū)分于可能通過在觸 摸屏上繪制圖案來執(zhí)行的各種"手勢"。在一些實(shí)施例中,可在握持裝置的同時(shí)在半空中執(zhí) 行手勢,且可使用裝置中的一或多個(gè)傳感器(例如,加速度計(jì))來檢測手勢。
[0030] 用戶可通過改變身體部分的位置(即,揮手運(yùn)動)來做出手勢(或"打手勢"),或 可在保持身體部分處于恒定位置的同時(shí)打手勢(即,通過做出握緊拳頭手勢)。在一些布置 中,可使用手及臂手勢來經(jīng)由攝像機(jī)輸入控制功能性,而在其它布置中,可另外或替代地使 用其它類型的手勢。另外或替代地,可在做出一或多個(gè)手勢中移動手及/或其它身體部分 (例如,臂、頭、面部、軀體、腿、腳等)。舉例來說,一些手勢可通過移動一或多個(gè)手來執(zhí)行, 而其它手勢可通過結(jié)合一或多個(gè)臂、一或多個(gè)腿等移動一或多個(gè)手來執(zhí)行。在一些實(shí)施例 中,手勢可包括在闊值時(shí)間量內(nèi)維持某一姿勢(例如,手或身體姿勢)。
[0031] 呈現(xiàn)用于鑒于成像裝置有效地檢測目標(biāo)的手勢或姿勢的方法及設(shè)備。檢測目標(biāo)的 手勢或姿勢的步驟可為使用傳統(tǒng)方法進(jìn)行的處理器及存儲器密集型方法。舉例來說,當(dāng)試 圖跟蹤單個(gè)手時(shí),使用手勢算法及方法的一些可供使用的手勢裝置為CPU極密集型。歸因 于高CPU使用情況,試圖使用手勢檢測方法的移動裝置可能為用戶提供不良體驗(yàn)。高CPU使 用率可導(dǎo)致手勢檢測的較低峽速率,從而可能導(dǎo)致緩慢的不可用的且甚至不可靠的跟蹤結(jié) 果、高電池消耗及過熱裝置。然而,根據(jù)各種實(shí)施例,檢測手勢或姿勢可消耗較少功率且成 功地在較少時(shí)間內(nèi)檢測到手勢或姿勢。舉例來說,實(shí)施例可能能夠使用30%的較少時(shí)間在 176X144像素峽中檢測到用戶的右手的攤開的手掌運(yùn)動,而準(zhǔn)確度與傳統(tǒng)方法相比較未減 少。
[0032] 在一些實(shí)施例中,可使用姿勢或手勢的模型來更有效地檢測姿勢或手勢。舉例來 說,在與所討論的當(dāng)前圖像(被稱為源圖像)相關(guān)的先前參考圖像中,可使用更緩慢或處理 器更密集型圖像辨識技術(shù)來識別姿勢或手勢??山又R別在參考圖像中檢測到的姿勢或手 勢的模型。本文中的發(fā)明可將此模型稱作手勢模型。手勢模型可為所述相同姿勢或手勢 的數(shù)百個(gè)或數(shù)千個(gè)圖像的復(fù)合。在一些實(shí)施例中,手勢模型為基于所述相同姿勢或手勢的 數(shù)百個(gè)或數(shù)千個(gè)圖像的理想姿勢或手勢??山又褂盟R別的手勢模型來在源圖像中檢 測所述相同類型的手勢或姿勢。在一些實(shí)施例中,此技術(shù)可節(jié)省50%的資源,該是因?yàn)樵?許多情況下,在參考圖像中檢測到的手勢或姿勢很可能與在源圖像中檢測到的手勢或姿勢 相同。在一些實(shí)施例中,可針對一源圖像序列發(fā)生使用手勢模型及所描述的技術(shù)進(jìn)行的檢 巧IJ。舉例來說,在一些實(shí)施例中,一旦選擇了手勢模型,便可在比較圖像的部分與其它模型 之前,通過比較圖像的那些部分與整個(gè)手勢模型或手勢模型的特征來掃描源圖像。舉例來 說,如果比較的類似性上升到高于某一闊值,或比較屬于預(yù)定義的約束內(nèi),那么該些比較可 確定在圖像中執(zhí)行所述手勢。所述比較可與用W使用手勢模型檢測參考圖像中的手勢的技 術(shù)類型相同。然而,用經(jīng)優(yōu)先級排序的手勢模型掃描源圖像時(shí)的一個(gè)優(yōu)點(diǎn)在于:經(jīng)優(yōu)先級排 序的手勢模型更有可能匹配源圖像中的手勢,且因此可通過不必從其它模型開始掃描圖像 來節(jié)省資源。
[0033] 參看圖1,說明可實(shí)施本發(fā)明的一或多個(gè)方面的實(shí)例裝置。舉例來說,計(jì)算裝置 100可為個(gè)人計(jì)算機(jī)、機(jī)頂盒、攝像機(jī)、電子游戲控制臺裝置、膝上型計(jì)算機(jī)、智能電話、平板 計(jì)算機(jī)、個(gè)人數(shù)字助理,或裝備有一或多個(gè)傳感器(所述傳感器允許計(jì)算裝置100俘獲運(yùn)動 及/或其它所感測到的狀況作為一種形式的用戶輸入)的其它移動裝置。舉例來說,計(jì)算 裝置100可裝備有W下各者、通信地禪合到W下各者及/或另外包含W下各者:一或多個(gè)攝 像機(jī)、麥克風(fēng)、接近度傳感器、巧螺儀、加速度計(jì)、壓力傳感器、手握傳感器、觸摸屏及/或其 它傳感器。除包含一或多個(gè)傳感器之外,計(jì)算裝置100還可包含一或多個(gè)處理器、存儲器單 元及/或其它硬件組件,如下文更詳細(xì)描述。在一些實(shí)施例中,將裝置100并入到汽車中, 例如,并入到汽車的中央控制臺中。
[0034] 在一或多個(gè)布置中,計(jì)算裝置100可獨(dú)自地或組合地使用該些傳感器中的任一者 及/或全部W辨識由裝置的一或多個(gè)用戶執(zhí)行的手勢,例如,可能不包含用戶觸摸裝置100 的手勢。舉例來說,計(jì)算裝置100可使用一或多個(gè)攝像機(jī)(例如,攝像機(jī)110)來俘獲由用 戶執(zhí)行的手及/或臂移動,例如揮手或滑動運(yùn)動,W及其它可能的移動。另外,例如,同樣可 通過一或多個(gè)攝像機(jī)(及/或其它傳感器)來俘獲更復(fù)雜及/或大比例的移動,例如由用 戶執(zhí)行的整個(gè)身體移動(例如,步行、跳舞等),且隨后通過計(jì)算裝置100將所述移動辨識為 手勢。在又一實(shí)例中,計(jì)算裝置100可使用一或多個(gè)觸摸屏(例如,觸摸屏120)來俘獲由 用戶提供的基于觸摸的用戶輸入,例如夾捏、滑動及旋轉(zhuǎn)扭曲W及其它可能的移動。雖然此 處將該些樣本移動(所述樣本移動可獨(dú)自被視為手勢及/或可與其它移動或動作組合W形 成更復(fù)雜手勢)作為實(shí)例加W描述,但同樣可通過實(shí)施本發(fā)明的一或多個(gè)方面的計(jì)算裝置 (例如,計(jì)算裝置100)來接收運(yùn)動、移動、動作或其它傳感器俘獲的用戶輸入的任何其它排 序作為手勢輸入及/或?qū)⑵浔孀R為手勢。
[0035] 在一些實(shí)施例中,例如,可使用例如深度攝像機(jī)等攝像機(jī)基于對手勢的辨識或用 戶的手勢的改變來控制計(jì)算機(jī)或媒體中也。不同于可能遭受指紋的有害的混淆效果的一些 觸摸屏系統(tǒng),基于攝像機(jī)的手勢輸入可允許基于用戶固有的身體移動或姿勢清楚地顯示或 W其它方式輸出照片、視頻或其它圖像。記住此優(yōu)點(diǎn),可辨識允許用戶觀察、平移(即,移 動)、設(shè)定大小、旋轉(zhuǎn)及對圖像目標(biāo)執(zhí)行其它操縱的手勢。
[0036] 深度攝像機(jī)(例如,結(jié)構(gòu)光攝像機(jī)或飛行時(shí)間攝像機(jī))可包含紅外線發(fā)射器及傳 感器。深度攝像機(jī)可產(chǎn)生紅外光脈沖且隨后測量光行進(jìn)到目標(biāo)且返回到傳感器所花費(fèi)的時(shí) 間。可基于行進(jìn)時(shí)間計(jì)算距離。如下文更詳細(xì)描述,可使用其它輸入裝置及/或傳感器來 檢測或接收輸入及/或輔助檢測手勢。
[0037] 參看圖2A及2B,實(shí)例情境展示根據(jù)一些實(shí)施例的記錄用戶做出手勢的圖像記錄 裝置200。圖像記錄裝置可與圖1中的描述及裝置100-致。在圖2A中,在記錄時(shí),用戶正 朝向攝像機(jī)200做出手勢210。舉例來說,手勢210可為用戶的左手指向攝像機(jī)的指向運(yùn) 動。攝像機(jī)200可僅記錄用戶做出手勢的單個(gè)圖像,或可記錄用戶舉起手做出手勢210的 圖像序列。在記錄之后或在記錄期間,攝像機(jī)200可執(zhí)行根據(jù)一些實(shí)施例的用于檢測用戶 是否執(zhí)行手勢210的方法。
[0038] 在圖2B中,用戶做出不同手勢220,此時(shí)舉起其右手。用戶可舉起臂并按攤開的手 掌運(yùn)動向攝像機(jī)200展示其右手。在其它情況下,圖2B中的用戶可能用其右手向攝像機(jī)揮 手。根據(jù)一些實(shí)施例的方法可能能夠區(qū)分用右手做出的手勢與用左手做出的手勢。根據(jù)一 些實(shí)施例的方法可檢測用戶的手勢是何手勢。圖2A及2B僅為手勢的類型的單個(gè)實(shí)例。
[0039] 用于檢測一圖像序列中的手勢210或220的實(shí)例過程可如下。在一些實(shí)施例中,可 在一或多個(gè)參考圖像中檢測第一手勢。參考圖像可為一圖像序列的第一圖像,例如,在通過 攝像機(jī)200記錄的一圖像序列的第一圖像中檢測的手勢210。在一些實(shí)施例中,下文更多地 描述用于有效地檢測第一手勢的方法。在其它情況下,可根據(jù)所屬領(lǐng)域中已知的用于單個(gè) 圖像的手勢檢測方法來執(zhí)行用于檢測參考圖像中的第一手勢的方法。在確定第一手勢(例 女口,左手指向攝像機(jī))之后,在一些實(shí)施例中,選擇最接近地匹配所確定的第一手勢的手勢 模型。模型手勢可為基于所述相同類型的手勢的數(shù)百個(gè)或數(shù)千個(gè)樣本圖像或姿勢的合成圖 像或模型。舉例來說,左手指向的手勢模型可基于做出指向運(yùn)動的數(shù)百個(gè)或數(shù)千個(gè)不同的 左手??山又褂米罱咏仡愃朴谟脩舻氖謩?10的手勢模型來更有效地檢測所述圖像序 列中的稍后圖像中的手勢。舉例來說,在通過圖2A中的攝像機(jī)200記錄的所述圖像序列中, 方法可開始掃描剩余圖像W查找看起來類似或相同于左手指向的手勢模型的手勢??蓛?yōu)先 于用于檢測剩余圖像中的手勢的其它手勢模型,對左手指向的手勢模型進(jìn)行優(yōu)先級排序使 其作為第一手勢模型,W用于與所述圖像序列進(jìn)行比較。通過對在參考圖像中選定的手勢 模型進(jìn)行優(yōu)先級排序,根據(jù)一些實(shí)施例的用于檢測手勢的方法可通過更迅速地檢測所述圖 像序列中的剩余圖像中的手勢而節(jié)省能量及時(shí)間。
[0040] 在一些實(shí)施例中,使用其它類型的優(yōu)先級排序來進(jìn)一步改善性能及效率。實(shí)例優(yōu) 先級排序包含對第二手勢模型進(jìn)行優(yōu)先級排序使其在第一手勢模型之后,基于其中檢測到 手勢的參考圖像中的位置對后續(xù)圖像上的位置進(jìn)行優(yōu)先級排序,基于在參考圖像中檢測到 的手勢的大小對后續(xù)圖像的大小進(jìn)行優(yōu)先級排序,及使用統(tǒng)計(jì)分析確定哪些類型的手勢與 其它手勢相比較更有可能被檢測到。下文將更多地論述所述方法。
[0041] 參看圖3,根據(jù)一些實(shí)施例,可使用模型手勢的數(shù)據(jù)庫300來更有效地檢測手勢。 此處,存儲在數(shù)據(jù)庫300中的實(shí)例手勢302、204、306、308、310、312、314、216、318、及320僅 說明根據(jù)一些實(shí)施例的可檢測的手勢的許多模型中的幾個(gè)。如上文所提及,在一些實(shí)施例 中,數(shù)據(jù)庫300可由手勢模型組成,其中每一手勢模型可為不同類型的手勢(例如,手勢302 到320)的基于相同類型的手勢的數(shù)百個(gè)或數(shù)千個(gè)不同圖像的理想化復(fù)合。在一些實(shí)施例 中,模型手勢可包含不只是手姿勢的模型。舉例來說,模型手勢可包含臂姿勢、面部表情、整 個(gè)人的姿勢及由一姿勢序列組成的運(yùn)動的理想化復(fù)合。實(shí)施例不限于此。
[0042] 在一些實(shí)施例中,對與模型相同的手勢的搜索可簡單地為更有效地檢測手勢的第 一技術(shù)。如果此技術(shù)未能檢測到手勢,那么可使用下文所論述的其它技術(shù)。因此,在一些實(shí) 施例中,優(yōu)先于其它技術(shù)對此模型使用情況技術(shù)進(jìn)行優(yōu)先級排序。在一些實(shí)施例中,優(yōu)先于 使用其它模型進(jìn)行的檢測對使用手勢模型進(jìn)行的檢測進(jìn)行優(yōu)先級排序。在一些實(shí)施例中, 可使用其它類型的優(yōu)先級排序技術(shù)來更有效地檢測手勢。下文更多地論述一些實(shí)例。
[0043] 在一些實(shí)施例中,可使用數(shù)據(jù)庫或查找表(LUT)來存儲待在跟蹤目標(biāo)時(shí)進(jìn)行比較 的不同模型。舉例來說,左手?jǐn)傞_的手掌可具有不同于右手?jǐn)傞_的手掌的所存儲圖像。
[0044] 在一些實(shí)施例中,可使用從先前峽中的先前檢測獲得的信息來對針對關(guān)于當(dāng)前峽 的特征的某些搜索進(jìn)行優(yōu)先級排序。對于跟蹤器約定,姿勢及位置可為靜止的。此情形可 提供深入了解基于先前信息進(jìn)行的操作模式優(yōu)先級排序的機(jī)會。如果先前檢測到左手?jǐn)傞_ 的手掌,那么可在類似右手?jǐn)傞_的手掌等任何其它模式響應(yīng)之前執(zhí)行對左手?jǐn)傞_的手掌的 搜索。類似地,可選擇其中矩形含有匹配的位置作為用于后續(xù)搜索的開始點(diǎn)。另外,可選擇 先前具有匹配的比例作為開始點(diǎn)。
[0045] 在一些實(shí)施例中,可將預(yù)定像素塊指明為用于模型的模型大?。ɡ?,確定右手 攤開的手掌的模型大小為40 X 40像素)??墒褂么四P痛笮∽鳛榇怪钡丶八降卦趰{上滑 動W更好地檢測手勢或姿勢的塊。在一些實(shí)施例中,可接著將在源圖像中識別的手勢或姿 勢進(jìn)行按比例調(diào)整W匹配模型大小,W便適當(dāng)?shù)嘏c手勢模型進(jìn)行比較。
[0046] 在一些實(shí)施例中,利用來自先前峽的檢測W便輔助了解當(dāng)前峽中最有可能的手勢 或姿勢在何處。舉例來說,可接著對其中檢測到先前手勢或姿勢的像素的位置進(jìn)行優(yōu)先級 排序。因此可節(jié)省處理及存儲器使用情況。在一些實(shí)施例中,可對先前檢測到手勢所用的 給定比例內(nèi)的位置進(jìn)行優(yōu)先級排序。舉例來說,可選擇環(huán)繞此位置的某一百分比區(qū)域(例 女口,10%) W考慮小目標(biāo)運(yùn)動??蓪⒆詈蟮哪繕?biāo)限界框按比例調(diào)整到不同比例且執(zhí)行搜索。 此情形可避免一些比例被消除。
[0047] 在一些實(shí)施例中,可在對當(dāng)前源圖像的搜索中對先前所檢測到的手勢或姿勢的比 例或大小進(jìn)行優(yōu)先級排序。舉例來說,如果先前檢測到大小為40X40像素的攤開的手掌, 那么第一次可在當(dāng)前源圖像中搜索大小為40X40像素的攤開的手掌的尺寸。舉例來說,接 下來可對大小接近40X40像素的攤開的手掌進(jìn)行優(yōu)先級排序。此技術(shù)可被稱作比例優(yōu)先 級排序。
[0048] 在一些實(shí)施例中,可對先前準(zhǔn)確地檢測到手勢的比例進(jìn)行優(yōu)先級排序。提供對給 定比例的匹配的矩形的數(shù)目及/或參照含有手勢的矩形的矩形位置可用作用于此情形的 措施。可允許高于及低于所選比例的一個(gè)比例(例如)W允許檢測/跟蹤目標(biāo)的小運(yùn)動 (沿著攝像機(jī)軸線)。
[0049] 在一些實(shí)施例中,可實(shí)施概率使用情況統(tǒng)計(jì)W更迅速地確定更有可能的手勢或姿 勢。舉例來說,如果概率使用情況統(tǒng)計(jì)展示右手?jǐn)傞_的手掌比左手?jǐn)傞_的手掌更有可能顯 現(xiàn),那么第一次可搜索右手?jǐn)傞_的手掌手勢或姿勢。
[0050] 通常手持式裝置為單個(gè)用戶裝置。且用戶可具有與使用情況相關(guān)聯(lián)的特定統(tǒng)計(jì)性 質(zhì),使用情況類似左手/右手、從某一距離操作裝置及/或攤開的手掌的大小。可在執(zhí)行更 廣泛搜索之前針對該些特性對所描述的過程進(jìn)行優(yōu)先級排序。此模型可從概率上使用于針 對每一約定執(zhí)行的第一次目標(biāo)檢測的處理時(shí)間最小化。
[0051] 可將針對用戶的每一特性的概率模型維持在裝置上??稍诿看问褂弥蟾赂怕?模型。舉例來說,如果用戶對大于50 %的約定使用右手?jǐn)傞_的手掌,那么在搜索左手?jǐn)傞_的 手掌之前搜索右手?jǐn)傞_的手掌。使用攤開的手掌大小或按比例調(diào)整等級概率,可對比例等 級進(jìn)行優(yōu)先級排序W進(jìn)行搜索。
[0052] 在一些實(shí)施例中,可將對手勢或姿勢的搜索指明為在已經(jīng)檢測到預(yù)定數(shù)目個(gè)手勢 或姿勢之前結(jié)束。舉例來說,一旦在峽中找到3個(gè)攤開的手掌圖像,跟蹤設(shè)備便可停止掃 描。此過程可通過無需掃描峽的其余部分而節(jié)省處理及存儲器使用情況。
[0053] 舉例來說,在手的最大數(shù)目經(jīng)指定為1的情況下,檢測器可能一找到匹配就返回。 在一些實(shí)施例中,在移動裝置中的手勢辨識的情況下,約定可包含僅尋找一個(gè)手勢。舉例來 說,對于TV應(yīng)用程序,所檢測的及跟蹤的手的數(shù)目可高達(dá)10。在一些實(shí)施例中,可檢測及/ 或跟蹤不同數(shù)目個(gè)手。
[0054] 可使用待檢測的手勢的優(yōu)先級排序及最大數(shù)目的組合、用于峽的搜索像素位置及 /或遵循其中獲得第一模型匹配的峽,(例如)W減少處理及/或節(jié)省功率。在一些實(shí)施例 中,目標(biāo)檢測器可執(zhí)行過多計(jì)算,直到其中針對約定及/或重新約定情境檢測到目標(biāo)/模型 的第一峽為止。第一峽處理時(shí)間可取決于使用情況統(tǒng)計(jì)或用戶的習(xí)慣。實(shí)際上,第一檢測 處理負(fù)荷可隨時(shí)間降低(例如,當(dāng)充分的使用情況統(tǒng)計(jì)可供使用時(shí))。
[00巧]如果對所有比例的檢測的數(shù)目小于闊值,那么可執(zhí)行完全搜索而不是經(jīng)優(yōu)先級排 序的搜索。另外,如果隨時(shí)間存在矩形的數(shù)目的減少(例如,在多個(gè)峽內(nèi)),那么當(dāng)符合闊值 時(shí),可執(zhí)行完全搜索。此情形可避免歸因于目標(biāo)移位或定向改變產(chǎn)生的假否定??蓹z測到 多個(gè)矩形,該是因?yàn)樵诿恳槐壤目臻g鄰域上可能存在許多匹配且另外可能存在來自多個(gè) 相鄰比例的匹配??赏ㄟ^優(yōu)先級搜索來避免搜索已經(jīng)被搜索到的位置。
[0056] 類似地,如果肯定搜索結(jié)果大于闊值,那么可執(zhí)行優(yōu)先級搜索而不是完全搜索。
[0057] 在一些實(shí)施例中,可實(shí)施該些優(yōu)先級排序中的任一者或全部的組合W更有效地檢 測圖像中的目標(biāo)的手勢或姿勢。舉例來說,在一些實(shí)施例中,可使用經(jīng)優(yōu)先級排序的手勢模 型、經(jīng)優(yōu)先級排序的位置及經(jīng)優(yōu)先級排序的比例的組合來確定是否在所述源圖像序列中執(zhí) 行手勢。舉例來說,所述組合可包含所有H種類型的優(yōu)先級排序或僅H種類型中的兩種類 型。舉例來說,當(dāng)使用優(yōu)先級排序的組合確定是否執(zhí)行手勢時(shí),可首先使用第一手勢模型掃 描源圖像,按經(jīng)優(yōu)先級排序的比例對源圖像進(jìn)行按比例調(diào)整,及在經(jīng)優(yōu)先級排序的位置的 位置處掃描源圖像。替代地,例如,如果組合僅包含第一手勢模型及經(jīng)優(yōu)先級排序的比例, 那么可使用第一手勢模型,按經(jīng)優(yōu)先級排序的比例設(shè)定大小,且可在某一默認(rèn)位置處(例 女口,源圖像的左上角)開始掃描。所屬領(lǐng)域的技術(shù)人員將容易理解,可如何使用其它組合來 確定是否在源圖像中執(zhí)行手勢。
[0058] 參看圖4,框圖400說明根據(jù)一些實(shí)施例的用于檢測參考圖像中的手勢的實(shí)例方 法流程。本文中所展示的樣本技術(shù)可為最初用于檢測手勢的過程,在所述過程之后,上文描 述的模型優(yōu)先級排序或其它類型的優(yōu)先級排序可基于所述過程來檢測后續(xù)圖像中的手勢。 此實(shí)例流程可包含如所展示的四個(gè)過程;按比例調(diào)整、預(yù)先處理、響應(yīng)計(jì)算,及矩形結(jié)果處 理。按比例調(diào)整可處置對不同大小的攤開的手掌或其它手勢或控制的檢測??蓪Ρ灰暈?手勢的圖像的部分的檢測按比例調(diào)整為更大或更小W適應(yīng)用于進(jìn)行比較的預(yù)定大小的手 勢模型或其它類型的數(shù)據(jù)庫圖像。預(yù)先處理級可產(chǎn)生特征,例如皺紋、陰影及做出手勢的身 體部分所共同的其它線。第H級可計(jì)算對特定分類器級的所選定特征的響應(yīng)。最后一級可 消除任何假檢測及/或重復(fù)檢測。前兩級可為用于(例如)使用存在于SIMD DSP及GPU中 的數(shù)學(xué)硬件單元進(jìn)行加速的候選者。在一些實(shí)施例中,第H級(例如,級聯(lián)分類器)可包含 經(jīng)定向的過多數(shù)據(jù)提取且可消耗大部分處理功率及存儲器帶寬。下文更多地論述第H級。 使用快速存儲器及高速緩沖存儲器預(yù)先提取可使與數(shù)據(jù)提取相關(guān)的CPU停滯最小化。最后 一級包含將所檢測到的手勢矩形位置分群,且可消除假/重復(fù)矩形并提供含有手勢的最后 的矩形位置??蓪?shí)施此級W便在CPU及存儲器使用情況方面較低。
[0059] 實(shí)施例可在各種設(shè)備內(nèi)執(zhí)行圖4中所描述的方法。舉例來說,輸入可包括視頻峽 或其它圖像,例如,如通過手勢檢測系統(tǒng)的攝像機(jī)俘獲的視頻峽或其它圖像。舉例來說,可 通過圖1的設(shè)備或圖2的攝像機(jī)來實(shí)施圖4。并且,可將某一運(yùn)動或姿勢用作約定手勢。用 戶可執(zhí)行可通過一些實(shí)施例的設(shè)備來檢測的各種手勢、運(yùn)動或姿勢。設(shè)備可接著進(jìn)行本文 中所描述的方法中的至少一些方法。
[0060] 參看圖5,框圖500展示用于計(jì)算響應(yīng)的過程的示例性過程流程。舉例來說,此框 圖500可為用于實(shí)施圖4中的響應(yīng)計(jì)算器塊的實(shí)例過程。一般來說,框圖500說明用于確 定手勢是否在圖像中的方法。圖5可描述用于使用兩級方法檢測手勢的有效方法。第二級 可涉及細(xì)節(jié)等級比第一級增加的跟蹤。舉例來說,第一級檢測涉及水平地及垂直地每n個(gè) 像素搜索一個(gè)像素(例如,在(x+/-4,y+/-4)型樣中,巾貞的每4個(gè)像素搜索一次)。此情形 展示在框505及510中???10進(jìn)行闊值測試W確定根據(jù)計(jì)算響應(yīng)函數(shù)的手勢檢測分析是 否檢測到用戶的手或其它身體部分的標(biāo)志。過程流程500可對每個(gè)闊值大小的區(qū)域(例 如,4X4像素區(qū)域、3X3像素區(qū)域等)中的像素循環(huán)進(jìn)行框505及510,直到對于每一區(qū)域 獲得響應(yīng)為止。
[0061] 第二級可僅集中于其中檢測到所要手勢或姿勢的區(qū)域或像素,借此減少所需的掃 描的次數(shù)。因此,第二級可按增加等級的細(xì)節(jié)在更集中的區(qū)域中搜索,例如,每2個(gè)像素 (X+/-2, y+/-2)或每單個(gè)像素(X+/-1,y+/-l)。框515及520表示涉及另一迭代循環(huán)的此 分析。此處,僅在第一級中檢測到手勢的像素周圍使用更精細(xì)等級的手勢檢測。W此方式, 第二級具有更精細(xì)等級的細(xì)節(jié),但僅集中在來自第一級的圖像的一部分上(此情形導(dǎo)致肯 定檢測)。在框520處,如果確定計(jì)算響應(yīng)函數(shù)大于某一最大闊值,從而指示對身體的一部 分的肯定檢測,那么可在框525處推斷:在經(jīng)掃描的像素處執(zhí)行手勢。
[0062] 在一些實(shí)施例中,可使用多級級聯(lián)過程。舉例來說,可使用8級級聯(lián)過程,其中級1 到4每4個(gè)像素搜索一次,級5到6僅在級1到4中具有肯定檢測的像素周圍每2個(gè)像素 搜索一次,且級7到8僅在級5到6中具有肯定檢測的像素周圍每一像素搜索一次。接著, 如果最后的級聯(lián)級導(dǎo)致某些像素處的肯定檢測,那么可確定:在所述某些像素處,所要手勢 或姿勢存在于峽中。因?yàn)槊恳患壈丛黾拥燃壍募?xì)節(jié)僅集中在具有高置信度的手勢/姿勢檢 測的那些像素周圍,所W通過對于其中未檢測到手勢或姿勢的像素不跟蹤高級細(xì)節(jié)來節(jié)省 處理及時(shí)間。
[0063] 參看圖6,圖600說明利用根據(jù)本文中所描述的多級級聯(lián)過程的級聯(lián)算法的一些 實(shí)施例的示例性過程流程。舉例來說,如果對于級聯(lián)級0及1可每4個(gè)位置執(zhí)行一次計(jì)算 響應(yīng),那么與對每個(gè)像素執(zhí)行級0及1計(jì)算時(shí)的情形相比較,可節(jié)省大約72%的循環(huán)。在圖 6中,在一些實(shí)施例中,可按第一步長(例如,步長為4)對每一像素執(zhí)行框605、610及615。 在一些實(shí)施例中,可接著按第二步長(例如,步長為2)對每一像素執(zhí)行框605、610及615, 且在某些實(shí)施例中,可接著按第H步長(例如,步長為1)執(zhí)行框605、610及615。
[0064] 在圖6中,多個(gè)步長可包括4、2、1,(例如)如上文所論述。在一些實(shí)施例中,步長 包括8、4、2、1。在一些實(shí)施例中,可使用其它步長。在一些實(shí)施例中,與用于相同檢測準(zhǔn)確 度的傳統(tǒng)方法相比較,利用搜索步長4、2、1提供大約30%的加速。
[0065] 在本發(fā)明方法中,可保持或改善檢測準(zhǔn)確度,該是因?yàn)殡S著級聯(lián)分類器上關(guān)于存 在可能的攤開的手掌或目標(biāo)的置信度增加,步長逐漸減小。舉例來說,傳回真正否定的前兩 級可保持最大步長,例如,在4-2-1搜索的情況下,最大步長為4。也就是說,當(dāng)在前兩級上 傳回位置時(shí),跳過3個(gè)位置W用于進(jìn)行進(jìn)一步搜索。如果級聯(lián)分類器使得進(jìn)行到級3到8, 那么可在使得進(jìn)行到級3到8的位置周圍執(zhí)行+/-2搜索。最后,如果從檢測器檢測到手勢, 那么可將搜索位置改進(jìn)為其中檢測到目標(biāo)的位置周圍的+/-1。因此,在目標(biāo)或攤開的手掌 之外的區(qū)域中,搜索步長可為4,借此避免過多計(jì)算。另外,應(yīng)注意,在含有被檢測到的手勢 的區(qū)域中,可搜索每個(gè)像素位置。W此方式,與傳統(tǒng)手勢檢測方法相比較,圖6中所說明的 過程可保持檢測準(zhǔn)確度,同時(shí)將循環(huán)節(jié)省30%。
[0066] 在一些實(shí)施例中,存在8個(gè)級聯(lián)級。先前級聯(lián)級使所有攤開的手掌矩形及其它矩 形通過W供下一級來處理。隨著級進(jìn)展,假肯定的量減少。并且,當(dāng)最后一級完成時(shí),如果 存在手勢,那么傳回所檢測到的手勢。在任何像素位置處,所有級可退出,借此指示圖像并 不具有手勢。
[0067] 另外,可縮減步長W適應(yīng)視頻峽的四個(gè)邊界上的峽邊界。舉例來說,如果步長為4 將超出作用中像素區(qū)域之外,那么可縮減步長W將搜索像素位置保持到作用中區(qū)中的最后 的可能像素。此情形可改善對邊界框邊緣接近于作用中像素區(qū)域邊界的目標(biāo)的檢測準(zhǔn)確 度。
[0068] 參看圖7,曲線圖700說明可在每一級聯(lián)級處發(fā)生的處理的實(shí)例量。在此實(shí)例中, 對于一些實(shí)施例,在級0上傳回86%的像素位置,從而指示未檢測到攤開的手掌。在此情 況下,經(jīng)掃描的圖像含有單個(gè)手勢、攤開的手掌。在級1上傳回另外10%的像素位置,從而 指示所述位置并不具有攤開的手掌。剩余的級2到級7傳回較小數(shù)目個(gè)位置,無攤開的手 掌。當(dāng)所有級通過攤開的手掌時(shí),在X軸標(biāo)簽8上顯示傳回?cái)傞_的手掌位置的位置。如圖 7展示,因?yàn)榧?處的大部分像素并不具有所要姿勢的任何標(biāo)志,所W不需要在那些像素周 圍搜索,從而節(jié)省處理及時(shí)間。圖7給出一種想法;大部分時(shí)間花費(fèi)在級0及級1上,該是 因?yàn)樗黾壧幚碜疃鄶?shù)目的像素位置(40 X 40維度的矩形)??赡苄枰獪p少通過級0及1 處理的像素的量,而不影響檢測準(zhǔn)確度,借此節(jié)省循環(huán)。一些實(shí)施例實(shí)施用變窄的步長搜索 或進(jìn)行模型匹配的想法。
[0069] 參看圖8,圖800展示水平地及垂直地在視頻峽上滑動的40X40模型維度塊810。 在一些實(shí)施例中,塊(40X40)可表示在級聯(lián)級中的第一級檢測中使用的增量區(qū)域。模型維 度塊810可通過垂直地及水平地跨越圖像滑動而遞增地掃描圖像W查找手勢。一旦塊810 在其維度內(nèi)檢測到手勢,便可執(zhí)行在塊810找到所述手勢的位置內(nèi)的具更精細(xì)分辨率的掃 描。此掃描可與上文所描述的級聯(lián)級一致。舉例來說,塊810可僅執(zhí)行級0掃描,直到塊 810找到手勢820為止。當(dāng)塊810垂直地及水平地滑動到攤開的手掌手勢820所位于的位 置時(shí),可執(zhí)行更高級掃描W更準(zhǔn)確地確定手勢事實(shí)上位于所述位置。在一些實(shí)施例中,為了 匹配模型維度,可將視頻峽歸一化W使得視頻中的攤開的手掌大小匹配通過模型表示的攤 開的手掌。
[0070] 根據(jù)各種實(shí)施例的方法及設(shè)備可提供W下優(yōu)點(diǎn):
[0071] 1.通過4、2、1步長適應(yīng)及改進(jìn),使用級聯(lián)分類器的響應(yīng),實(shí)現(xiàn)超出30%的循環(huán)及 帶寬節(jié)省,而檢測準(zhǔn)確度并不降低。
[0072] 2.在第一目標(biāo)檢測之后,其中約定包含在一段時(shí)間內(nèi)(例如,500毫砂)目標(biāo)為靜 止的,循環(huán)、帶寬及功率節(jié)省可超出90%。
[0073] 3.從先前使用情況/約定統(tǒng)計(jì)來看,第一次目標(biāo)檢測性能得W改善。取決于用戶 特性,處理時(shí)間可減少高達(dá)50%。
[0074] 4.實(shí)施例對于硬件開發(fā)及平行處理來說為友好的。
[00巧]5.實(shí)施例快速且使得手勢辨識在移動電池操作裝置上為可行的。
[0076] 參看圖9A,流程圖900說明根據(jù)一些實(shí)施例的示例性方法。在框902處開始,在一 些實(shí)施例中,可使用來自多個(gè)手勢模型的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每 一者中的手勢。舉例來說,所述檢測可通過上文所描述的過程中的任一者來執(zhí)行。所述一 或多個(gè)手勢模型可為圖2或3中所描述的實(shí)例手勢或基于任何數(shù)目個(gè)手勢的任何其它類型 的手勢模型中的任一者???02中的檢測可通過比較所述一或多個(gè)參考圖像中經(jīng)掃描的手 勢與多個(gè)手勢模型來使用所述一或多個(gè)手勢模型。舉例來說,如果參考圖像中記錄右手?jǐn)?開的手掌,那么可首先將經(jīng)掃描的手勢與左手?jǐn)傞_的手掌的模型進(jìn)行比較,接著與左握拳 的模型進(jìn)行比較,接著與右手?jǐn)傞_的手掌的模型進(jìn)行比較,等等,直到找到最佳匹配手勢模 型為止。在一些實(shí)施例中,可首先將參考圖像中經(jīng)掃描的手勢按比例調(diào)整到手勢模型的相 當(dāng)?shù)拇笮?,W便執(zhí)行適當(dāng)比較。框902可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0077] 在框904處,可選擇最接近地匹配框902中的所檢測到的手勢的第一手勢模型。 第一手勢模型可為所述一或多個(gè)手勢模型當(dāng)中供在框902中進(jìn)行比較的手勢模型。舉例來 說,可選擇右手?jǐn)傞_的手掌手勢模型作為用于為右手?jǐn)傞_的手掌的所檢測到的手勢的第一 手勢模型???04可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0078] 在框906處,可優(yōu)先于其它手勢模型對第一手勢模型進(jìn)行優(yōu)先級排序W用于在所 述圖像序列中搜索手勢。一旦在所述一或多個(gè)參考圖像中檢測到手勢,那么在框904中選 擇的第一手勢模型便可為供在源圖像中搜索手勢時(shí)進(jìn)行比較的第一模型。在一些實(shí)施例 中,所述一或多個(gè)參考圖像為所述源圖像序列中的先前圖像。舉例來說,所述一或多個(gè)參考 圖像可為視頻的初始峽,且視頻的剩余峽可為經(jīng)受手勢檢測的后續(xù)圖像。因此,在參考圖像 中檢測到的手勢更有可能為存在于后續(xù)源圖像中的手勢,從而使得對第一手勢模型的優(yōu)先 級排序高度有效???06可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0079] 在框908處,可使用第一手勢模型掃描所述源圖像序列W確定是否在源圖像中執(zhí) 行手勢。換句話說,因?yàn)榈谝皇謩菽P褪莾?yōu)先于其它手勢模型進(jìn)行優(yōu)先級排序,所W使用第 一手勢模型掃描所述源圖像序列???08可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0080] 在框910處,如果確定在所述源圖像序列中執(zhí)行手勢,那么可在使用另一手勢模 型進(jìn)行手勢檢測之前結(jié)束掃描。在一些實(shí)施例中,如果根據(jù)第一手勢模型未檢測到手勢,那 么掃描可繼續(xù)???10可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0081] 參看圖9B,流程圖950說明根據(jù)一些實(shí)施例的另一示例性方法。框952、954及956 可分別與關(guān)于框902、904及906論述的描述一致。框952、954及956可由(例如)裝置 100或攝像機(jī)200來實(shí)施。
[0082] 在一些實(shí)施例中,還可對所述一或多個(gè)參考圖像中的所檢測到的手勢的其它特性 進(jìn)行優(yōu)先級排序??扇Q于實(shí)施例而實(shí)施該些優(yōu)先級排序中的一些、全部或無一者,且實(shí)施 例不限于此。舉例來說,在框958處,可優(yōu)先于圖像中的其它位置對所述一或多個(gè)參考圖像 中的所檢測到的手勢的位置進(jìn)行優(yōu)先級排序。舉例來說,當(dāng)開始掃描源圖像W查找手勢時(shí), 可首先優(yōu)先于其它位置掃描所述一或多個(gè)參考圖像中其中檢測到手勢的位置???58可由 (例如)裝置100或攝像機(jī)200來實(shí)施。
[0083] 在框960處,可優(yōu)先于源圖像中的其它比例對所述一或多個(gè)參考圖像中的所檢測 到的手勢的比例進(jìn)行優(yōu)先級排序。舉例來說,如果所述一或多個(gè)參考圖像中的所檢測到的 手勢的大小近似為40X40像素,那么當(dāng)掃描源圖像W查找手勢時(shí),首先可使用40X40比 例???60可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0084] 在框962處,可在第一手勢模型之后但優(yōu)先于其它手勢模型對第二手勢模型進(jìn)行 優(yōu)先級排序。舉例來說,如果第一手勢模型為右手?jǐn)傞_的手掌,那么可將第二手勢模型指明 為右手握拳。第二手勢模型的選擇可基于統(tǒng)計(jì)方法或分析、基于在某一初始手勢之后接下 來將顯現(xiàn)的最有可能的手勢。舉例來說,在其它情況下,可選擇第二手勢為先前已記錄或檢 測到的、在參考圖像的不同位置中找到的或基于用戶輸入的手勢。在第一手勢模型之后但 優(yōu)先于其它手勢模型的第二手勢模型的優(yōu)先級排序可指示:在第一手勢模型在檢測手勢中 不成功的情況下,使用第二手勢模型來搜索手勢???62可由(例如)裝置100或攝像機(jī) 200來實(shí)施。
[0085] 在框964處,可使用優(yōu)先級排序(例如,框956、958、960或962)中的任一者掃描 所述源圖像序列W確定是否在所述源圖像序列中執(zhí)行手勢。此外,可使用該些優(yōu)先級排序 中的一些、全部或無一者。可使用與該些掲露內(nèi)容中所論述的描述中的任一者一致的其它 優(yōu)先級排序,該是因?yàn)樵撔﹥?yōu)先級排序僅為幾個(gè)實(shí)例???64可由(例如)裝置100或攝 像機(jī)200來實(shí)施。
[0086] 在決策框966處,方法可確定是否在所述源圖像序列中檢測到手勢。所述檢測可 基于框964中所論述的優(yōu)先級排序,及基于該些掲露內(nèi)容中所論述的檢測方法中的任一者 (例如,級聯(lián)級等)。在一些實(shí)施例中,可結(jié)合本文所論述的優(yōu)先級排序使用所屬領(lǐng)域中已 知的其它檢測方法。決策框966可由(例如)裝置100或攝像機(jī)200來實(shí)施。
[0087] 如果框966處的確定為是,那么在框968處,可在使用另一手勢模型進(jìn)行手勢檢測 之前結(jié)束掃描。在框970處,如果確定為否,那么可使用第二手勢模型掃描所述源圖像序列 W確定是否執(zhí)行手勢。舉例來說,右手握拳可為用W掃描所述源圖像序列W查找手勢的第 二手勢模型。另外,還可結(jié)合第二手勢模型使用其它優(yōu)先級排序。在其它情況下,可能不使 用例如位置優(yōu)先級排序、比例優(yōu)先級排序等其它優(yōu)先級排序,或可修改所述其它優(yōu)先級排 序W對不同位置或比例進(jìn)行優(yōu)先級排序,等等。所屬領(lǐng)域的技術(shù)人員將了解,根據(jù)本文的掲 露內(nèi)容,優(yōu)先級排序的許多組合是可能的,且實(shí)施例不限于此。
[0088] 上文所論述的方法、系統(tǒng)及裝置為實(shí)例。各種實(shí)施例可在適當(dāng)時(shí)省略、取代或添加 各種程序或組件。舉例來說,在替代配置中,所描述的方法可W不同于所描述的次序來執(zhí) 行,及/或可添加、省略及/或組合各級。并且,可在各種其它實(shí)施例中組合關(guān)于某些實(shí)施 例描述的特征。可W類似方式組合實(shí)施例的不同方面及元件。并且,技術(shù)演進(jìn)且,因此,許 多元件為實(shí)例,其并不將本發(fā)明的范圍限于那些特定實(shí)例。
[0089] 在描述中給出特定細(xì)節(jié)W提供對實(shí)施例的透徹理解。然而,可在沒有該些特定細(xì) 節(jié)的情況下實(shí)踐實(shí)施例。舉例來說,在沒有不必要的細(xì)節(jié)的情況下展示熟知電路、過程、算 法、結(jié)構(gòu)及技術(shù)W便避免混淆所述實(shí)施例。此描述僅提供實(shí)例實(shí)施例,且不希望限制本發(fā)明 的范圍、適用性或配置。確切地說,實(shí)施例的前述描述將為所屬領(lǐng)域的技術(shù)人員提供用于實(shí) 施本發(fā)明的實(shí)施例的啟迪性描述??稍诓幻撾x本發(fā)明的精神及范圍的情況下對元件的功能 及布置做出各種改變。
[0090] 并且,將一些實(shí)施例描述為W流程圖或框圖形式描繪的過程。盡管每一流程圖或 框圖可能將操作描述為順序過程,但許多操作可并行地或同時(shí)地來執(zhí)行。另外,可W重新布 置操作的次序。過程可具有不包含在圖中的額外步驟。此外,可通過硬件、軟件、固件、中間 件、微碼、硬件描述語言或其任何組合來實(shí)施方法的實(shí)施例。當(dāng)W軟件、固件、中間件或微碼 來實(shí)施時(shí),用W執(zhí)行相關(guān)聯(lián)任務(wù)的程序代碼或代碼段可存儲在例如存儲媒體等計(jì)算機(jī)可讀 媒體中。處理器可執(zhí)行相關(guān)聯(lián)任務(wù)。
[0091] 在不脫離本發(fā)明的精神的情況下可使用各種修改、替代構(gòu)造及等效物。舉例來說, W上元件可僅為較大系統(tǒng)的組件,其中其它規(guī)則可優(yōu)先于本發(fā)明的應(yīng)用或W其它方式修改 本發(fā)明的應(yīng)用。并且,可在考慮W上元件之前、期間或之后進(jìn)行數(shù)個(gè)步驟。因此,W上描述 并不限制本發(fā)明的范圍。
[0092] 上文已描述多個(gè)方面,現(xiàn)在可關(guān)于圖10描述可在其中實(shí)施此類方面的計(jì)算系統(tǒng) 的實(shí)例。根據(jù)一或多個(gè)方面,如圖10中所說明的計(jì)算機(jī)系統(tǒng)可作為計(jì)算裝置的部分而并 入,所述計(jì)算裝置可實(shí)施、執(zhí)行及/或?qū)嵭斜疚乃枋龅奶卣?、方法?或方法步驟中的任 一者及/或全部。舉例來說,處理器1010、存儲器1035及通信子系統(tǒng)1030中的一或多者 可用W實(shí)施如圖4、5、6、9A及9B中所展示的框中的任一者或全部。舉例來說,計(jì)算機(jī)系統(tǒng) 1000可表示手持式裝置的組件中的一些組件。手持式裝置可為具有輸入感官單元(例如, 攝像機(jī)及/或顯示單元)的任何計(jì)算裝置。手持式裝置的實(shí)例包含(但不限于)視頻游戲 控制臺、平板計(jì)算機(jī)、智能電話及移動裝置。在一些實(shí)施例中,系統(tǒng)1000經(jīng)配置W實(shí)施上文 所描述的裝置100或200。圖10提供計(jì)算機(jī)系統(tǒng)1000的一個(gè)實(shí)施例的示意性說明,所述 計(jì)算機(jī)系統(tǒng)1000可執(zhí)行如本文所描述的通過各種其他實(shí)施例提供的方法,及/或可充當(dāng)主 控計(jì)算機(jī)系統(tǒng)、遠(yuǎn)程查詢一體機(jī)/終端、銷售點(diǎn)裝置、移動裝置、機(jī)頂盒及/或計(jì)算機(jī)系統(tǒng)。 圖10僅希望提供對各種組件的一般化說明,可在適當(dāng)時(shí)利用所述組件中的任一者及/或全 部。因此,圖10廣泛地說明可如何W相對分離或相對更集成的方式實(shí)施個(gè)別系統(tǒng)元件。
[0093] 展示計(jì)算機(jī)系統(tǒng)1000包括可經(jīng)由總線1005電禪合(或可另外在適當(dāng)時(shí)進(jìn)行通 信)的硬件元件。硬件元件可包含;一或多個(gè)處理器1010,包含(但不限于)一或多個(gè)通用 處理器及/或一或多個(gè)專用處理器(例如,數(shù)字信號處理芯片、圖形加速處理器,及/或其 類似者);一或多個(gè)輸入裝置1015,其可包含(但不限于)攝像機(jī)、鼠標(biāo)、鍵盤及/或其類似 者;及一或多個(gè)輸出裝置1020,其可包含(但不限于)顯示單元、打印機(jī)及/或其類似者。
[0094] 計(jì)算機(jī)系統(tǒng)1000可進(jìn)一步包含W下各者(及/或與W下各者通信);一或多個(gè)非 暫時(shí)性存儲裝置1025,所述非暫時(shí)性存儲裝置1025可包括(但不限于)本地及/或網(wǎng)絡(luò)可 存取的存儲裝置,及/或可包含(但不限于)磁盤驅(qū)動器、驅(qū)動陣列、光學(xué)存儲裝置、例如隨 機(jī)存取存儲器("RAM")及/或只讀存儲器("ROM")等固態(tài)存儲裝置,其可為可編程的、 可快閃更新的及/或其類似者。此類存儲裝置可經(jīng)配置W實(shí)施任何適當(dāng)數(shù)據(jù)存儲裝置,包 含(但不限于)各種文件系統(tǒng)、數(shù)據(jù)庫結(jié)構(gòu)及/或其類似者。
[0095] 計(jì)算機(jī)系統(tǒng)1000還可能包含通信子系統(tǒng)1030,其可包含(但不限于)調(diào)制解調(diào) 器、網(wǎng)卡(無線或有線)、紅外線通信裝置、無線通信裝置及/或芯片組(例如,Bluetoo化度 裝置、802. 11裝置、WiFi裝置、WiMax裝置、蜂窩式通信設(shè)施等)及/或其類似者。通信子 系統(tǒng)1030可準(zhǔn)許與網(wǎng)絡(luò)(例如,作為一個(gè)實(shí)例,下文所描述的網(wǎng)絡(luò))、其它計(jì)算機(jī)系統(tǒng)及/ 或本文中所描述的任何其它裝置交換數(shù)據(jù)。在許多實(shí)施例中,計(jì)算機(jī)系統(tǒng)1000可進(jìn)一步包 括非暫時(shí)性工作存儲器1035,其可包含RAM或ROM裝置,如上文所描述。
[0096] 計(jì)算機(jī)系統(tǒng)1000還可包括展示為當(dāng)前位于工作存儲器1035內(nèi)的軟件元件,包含 操作系統(tǒng)1040、裝置驅(qū)動器、可執(zhí)行庫及/或例如一或多個(gè)應(yīng)用程序1045等其它代碼,其可 包括通過各種實(shí)施例提供及/或可經(jīng)設(shè)計(jì)W實(shí)施方法及/或配置系統(tǒng)、通過其它實(shí)施例提 供的計(jì)算機(jī)程序,如本文中所描述。僅W實(shí)例說明,關(guān)于上文所論述的方法描述的一或多個(gè) 程序(例如,如關(guān)于圖4、5、6、9A及9B描述的程序)可能實(shí)施為可由計(jì)算機(jī)(及/或計(jì)算 機(jī)內(nèi)的處理器)執(zhí)行的代碼及/或指令;在一方面中,接著,可使用此類代碼及/或指令來 配置及/或調(diào)適通用計(jì)算機(jī)(或其它裝置)W執(zhí)行根據(jù)所描述方法的一或多個(gè)操作。
[0097] 一組該些指令及/或代碼可能存儲在計(jì)算機(jī)可讀存儲媒體(例如,上文所描述的 存儲裝置1025)上。在一些情況下,存儲媒體可能并入于計(jì)算機(jī)系統(tǒng)(例如,計(jì)算機(jī)系統(tǒng) 1000)內(nèi)。在其它實(shí)施例中,存儲媒體可能與計(jì)算機(jī)系統(tǒng)(例如,可卸除式媒體(例如,壓 縮光盤))分離,及/或提供于安裝包中,使得存儲媒體可用W編程、配置及/或調(diào)適其上存 儲有指令/代碼的通用計(jì)算機(jī)。該些指令可能呈可由計(jì)算機(jī)系統(tǒng)1000執(zhí)行的可執(zhí)行代碼 形式,及/或可能呈源及/或可安裝代碼的形式,所述源及/或可安裝代碼在于計(jì)算機(jī)系統(tǒng) 1000上編譯及/或安裝于計(jì)算機(jī)系統(tǒng)1000上(例如,使用多種大體可用編譯程序、安裝程 序、壓縮/解壓縮公用程序等中的任一者)后,接著呈可執(zhí)行代碼的形式。
[0098] 可根據(jù)特定要求做出實(shí)質(zhì)性變化。舉例來說,還可能使用定制硬件,及/或可能將 特定元件實(shí)施于硬件、軟件(包含便攜式軟件,例如小程序等)或兩者中。另外,可使用到 其它計(jì)算裝置(例如,網(wǎng)絡(luò)輸入/輸出裝置)的連接。
[0099] 一些實(shí)施例可使用計(jì)算機(jī)系統(tǒng)(例如,計(jì)算機(jī)系統(tǒng)1000)來執(zhí)行根據(jù)本發(fā)明的方 法。舉例來說,所描述方法的程序中的一些程序或全部可由計(jì)算機(jī)系統(tǒng)1000響應(yīng)于處理器 1010執(zhí)行工作存儲器1035中所含有的一或多個(gè)指令(其可能并入到操作系統(tǒng)1040及/或 其它代碼中,例如,應(yīng)用程序1045)的一或多個(gè)序列來執(zhí)行??蓪⒋祟愔噶顝牧硪挥?jì)算機(jī)可 讀媒體讀取到工作存儲器1035中,另一計(jì)算機(jī)可讀媒體例如存儲裝置1025中的一或多者。 僅W實(shí)例說明,工作存儲器1035中所含有的所述序列的指令的執(zhí)行可能致使處理器1010 執(zhí)行本文中所描述的方法的一或多個(gè)程序,例如,關(guān)于圖4、5、6、9A及9B中的任一者描述的 方法的元件中的一或多者。
[0100] 如本文中所使用,術(shù)語"機(jī)器可讀媒體"及"計(jì)算機(jī)可讀媒體"是指參與提供致使 機(jī)器W特定方式操作的數(shù)據(jù)的任何媒體。在使用計(jì)算機(jī)系統(tǒng)1000實(shí)施的實(shí)施例中,在將指 令/代碼提供到處理器1010 W用于執(zhí)行中可能涉及各種計(jì)算機(jī)可讀媒體,及/或各種計(jì)算 機(jī)可讀媒體可能用W存儲及/或攜載此類指令/代碼(例如,作為信號)。在許多實(shí)施方案 中,計(jì)算機(jī)可讀媒體為物理及/或有形存儲媒體。此類媒體可呈許多形式,包含(但不限于) 非易失性媒體、易失性媒體及傳輸媒體。非易失性媒體包含(例如)光盤及/或磁盤,例如 存儲裝置1025。易失性媒體包含(但不限于)例如工作存儲器1035等動態(tài)存儲器。傳輸 媒體包含(但不限于)同軸電纜、銅線及光纖,包含包括總線1005的電線,W及通信子系統(tǒng) 1030的各種組件(及/或通信子系統(tǒng)1030借W提供與其它裝置的通信的媒體)。因此,傳 輸媒體還可呈波的形式(包含(但不限于)無線電、聲波及/或光波,例如,在無線電-波 及紅外線數(shù)據(jù)通信期間產(chǎn)生的那些波)。
[0101] 在一或多個(gè)實(shí)例中,所描述功能可W硬件、軟件、固件或其任何組合來實(shí)施。如果 實(shí)施于軟件中,那么可將功能作為一或多個(gè)指令或代碼存儲在計(jì)算機(jī)可讀媒體上或經(jīng)由計(jì) 算機(jī)可讀媒體進(jìn)行傳輸。計(jì)算機(jī)可讀媒體可包含計(jì)算機(jī)數(shù)據(jù)存儲媒體。數(shù)據(jù)存儲媒體可 W是可由一或多個(gè)計(jì)算機(jī)或一或多個(gè)處理器存取W檢索用于實(shí)施本發(fā)明中描述的技術(shù)的 指令、代碼及/或數(shù)據(jù)結(jié)構(gòu)的任何可用媒體。如本文所使用的"數(shù)據(jù)存儲媒體"是指制成 品且并不指暫時(shí)性傳播信號。W實(shí)例說明而非限制,此類計(jì)算機(jī)可讀媒體可包括RAM、ROM、 EEPROM、CD-ROM或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置、快閃存儲器或 可用來存儲呈指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序代碼并且可由計(jì)算機(jī)存取的任何其它媒 體。如本文所使用的磁盤及光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字影音光盤 值VD)、軟磁盤及藍(lán)光光盤,其中磁盤通常是W磁性方式再現(xiàn)數(shù)據(jù),而光盤是用激光W光學(xué) 方式再現(xiàn)數(shù)據(jù)。上述各者的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
[0102] 代碼可W由一或多個(gè)處理器執(zhí)行,所述一或多個(gè)處理器例如一或多個(gè)數(shù)字信號處 理器值SP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA)、或其它等 效的集成或離散邏輯電路。因此,如本文中所使用的術(shù)語"處理器"可指上述結(jié)構(gòu)或適合于 實(shí)施本文中所描述的技術(shù)的任何其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所描述的 功能性可W提供于經(jīng)配置W用于編碼及解碼的專用硬件及/或軟件模塊內(nèi),或者并入于組 合編碼解碼器中。并且,可將所述技術(shù)完全實(shí)施于一或多個(gè)電路或邏輯元件中。
[0103] 本發(fā)明的技術(shù)可W在廣泛多種裝置或設(shè)備中實(shí)施,包含無線手持機(jī)、集成電路 (IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元是為了強(qiáng)調(diào)經(jīng)配置W 執(zhí)行所掲示技術(shù)的裝置的功能方面,但未必需要通過不同硬件單元實(shí)現(xiàn)。確切地說,如上文 所描述,各種單元可組合在編碼解碼器硬件單元中或由可交互操作硬件單元的集合(包含 如上文所描述的一或多個(gè)處理器)結(jié)合存儲在計(jì)算機(jī)可讀媒體上的合適的軟件及/或固件 來提供。
[0104] 已描述各種實(shí)例。該些及其它實(shí)例在所附權(quán)利要求書的范圍內(nèi)。
【權(quán)利要求】
1. 一種用于確定是否在一源圖像序列中執(zhí)行手勢的方法,所述方法包括: 使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的所 述手勢; 從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模 型; 優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序以 用于在所述源圖像序列中搜索所述手勢; 使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列以確定是否執(zhí)行所述手 勢;以及 在執(zhí)行所述手勢的情況下,在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行 所述手勢之前結(jié)束掃描。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述一或多個(gè)參考圖像包括所述源圖像序列中的 先前圖像。
3. 根據(jù)權(quán)利要求2所述的方法,其中所述多個(gè)手勢模型包括手姿勢。
4. 根據(jù)權(quán)利要求2所述的方法,其中所述多個(gè)手勢模型包括面部表情。
5. 根據(jù)權(quán)利要求2所述的方法,其中所述多個(gè)手勢模型包括左手?jǐn)傞_的手模型、右手 攤開的手模型或拳頭模型。
6. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置掃描所述源圖像序列以確定是 否執(zhí)行所述手勢。
7. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的比例掃描所述源圖像序列以確定是 否執(zhí)行所述手勢。
8. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢; 優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置、所述所檢測到的手勢的所述經(jīng) 優(yōu)先級排序的比例及所述經(jīng)優(yōu)先級排序的第一手勢模型的組合掃描所述源圖像序列以確 定是否執(zhí)行所述手勢。
9. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括在于所述源圖像序列中檢測到預(yù)定數(shù)目 個(gè)手勢的情況下,在完成對所述源圖像序列的完全掃描之前結(jié)束對所述源圖像序列中的所 述手勢的掃描。
10. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括確定與所述手勢相比較來說不太可能 在所述一或多個(gè)參考圖像中檢測到第二手勢;以及 在檢測到所述手勢之后基于確定不太可能檢測到所述第二手勢而掃描所述一或多個(gè) 參考圖像以查找所述第二手勢。
11. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 掃描所述一或多個(gè)參考圖像以查找所述手勢; 改進(jìn)在按級的連續(xù)編號排序的多個(gè)級聯(lián)級中對所述一或多個(gè)參考圖像的用以查找所 述手勢的所述掃描,其中所述級聯(lián)級中的每一級包括掃描所述源圖像序列中的至少一個(gè)圖 像中的周期性編號的像素以檢測所述手勢,所述周期性編號的像素與所述周期性編號的像 素中的每隔一個(gè)像素相距恒定的垂直及水平距離,且其中任一級中的像素的所述周期性編 號小于或等于前一級中的像素的所述周期性編號;以及 通過確定所述連續(xù)編號的級中的最后一級是否檢測到所述手勢的至少一部分識別所 述手勢。
12. -種用于確定是否在一源圖像序列中執(zhí)行手勢的設(shè)備,所述設(shè)備包括: 存儲器,其經(jīng)配置以存儲一或多個(gè)參考圖像及所述源圖像序列;以及 處理器,其通信地耦合到所述存儲器且經(jīng)配置以: 使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的所 述手勢; 從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模 型; 優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序以 用于在所述源圖像序列中搜索所述手勢; 使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列以確定是否執(zhí)行所述手 勢;以及 在執(zhí)行所述手勢的情況下,在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行 所述手勢之前結(jié)束掃描。
13. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述一或多個(gè)參考圖像包括所述源圖像序列中 的先前圖像。
14. 根據(jù)權(quán)利要求13所述的設(shè)備,其中所述多個(gè)手勢模型包括手姿勢。
15. 根據(jù)權(quán)利要求13所述的設(shè)備,其中所述多個(gè)手勢模型包括面部表情。
16. 根據(jù)權(quán)利要求13所述的設(shè)備,其中所述多個(gè)手勢模型包括左手?jǐn)傞_的手模型、右 手?jǐn)傞_的手模型或拳頭模型。
17. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以: 優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置掃描所述源圖像序列以確定是 否執(zhí)行所述手勢。
18. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以: 優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的比例掃描所述源圖像序列以確定是 否執(zhí)行所述手勢。
19. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以: 優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢; 優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行優(yōu)先 級排序以用于在所述源圖像序列中搜索所述手勢;以及 使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置、所述所檢測到的手勢的所述經(jīng) 優(yōu)先級排序的比例及所述經(jīng)優(yōu)先級排序的第一手勢模型的組合掃描所述源圖像序列以確 定是否執(zhí)行所述手勢。
20. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以在于所述源圖像序 列中檢測到預(yù)定數(shù)目個(gè)手勢的情況下,在完成對所述源圖像序列的完全掃描之前結(jié)束對所 述源圖像序列中的所述手勢的掃描。
21. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以: 確定與所述手勢相比較來說不太可能在所述一或多個(gè)參考圖像中檢測到第二手勢;以 及 在檢測到所述手勢之后基于確定不太可能檢測到所述第二手勢而掃描所述一或多個(gè) 參考圖像以查找所述第二手勢。
22. 根據(jù)權(quán)利要求12所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以: 掃描所述一或多個(gè)參考圖像以查找所述手勢; 改進(jìn)在按級的連續(xù)編號排序的多個(gè)級聯(lián)級中對所述一或多個(gè)參考圖像的用以查找所 述手勢的所述掃描,其中所述級聯(lián)級中的每一級包括掃描所述源圖像序列中的至少一個(gè)圖 像中的周期性編號的像素以檢測所述手勢,所述周期性編號的像素與所述周期性編號的像 素中的每隔一個(gè)像素相距恒定的垂直及水平距離,且其中任一級中的像素的所述周期性編 號小于或等于前一級中的像素的所述周期性編號;以及 通過確定所述連續(xù)編號的級中的最后一級是否檢測到所述手勢的至少一部分識別所 述手勢。
23. -種用于確定是否在一源圖像序列中執(zhí)行手勢的設(shè)備,所述設(shè)備包括: 用于使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中 的所述手勢的裝置; 用于從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢 模型的裝置; 用于優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排 序以用于在所述源圖像序列中搜索所述手勢的裝置; 用于使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列以確定是否執(zhí)行所 述手勢的裝置;以及 用于在執(zhí)行所述手勢的情況下在使用所述多個(gè)手勢模型中的另一手勢模型確定是否 執(zhí)行所述手勢之前結(jié)束掃描的裝置。
24. 根據(jù)權(quán)利要求23所述的設(shè)備,其中所述一或多個(gè)參考圖像包括所述源圖像序列中 的先前圖像。
25. 根據(jù)權(quán)利要求24所述的設(shè)備,其中所述多個(gè)手勢模型包括手姿勢。
26. 根據(jù)權(quán)利要求24所述的設(shè)備,其中所述多個(gè)手勢模型包括面部表情。
27. 根據(jù)權(quán)利要求24所述的設(shè)備,其中所述多個(gè)手勢模型包括左手?jǐn)傞_的手模型、右 手?jǐn)傞_的手模型或拳頭模型。
28. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括: 用于優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行 優(yōu)先級排序以用于在所述源圖像序列中搜索所述手勢的裝置;以及 用于使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置掃描所述源圖像序列以確 定是否執(zhí)行所述手勢的裝置。
29. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括: 用于優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行 優(yōu)先級排序以用于在所述源圖像序列中搜索所述手勢的裝置;以及 用于使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的比例掃描所述源圖像序列以確 定是否執(zhí)行所述手勢的裝置。
30. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括: 用于優(yōu)先于其它位置對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的位置進(jìn)行 優(yōu)先級排序以用于在所述源圖像序列中搜索所述手勢的裝置; 用于優(yōu)先于其它比例對所述一或多個(gè)參考圖像中的所述所檢測到的手勢的比例進(jìn)行 優(yōu)先級排序以用于在所述源圖像序列中搜索所述手勢的裝置;以及 用于使用所述所檢測到的手勢的所述經(jīng)優(yōu)先級排序的位置、所述所檢測到的手勢的所 述經(jīng)優(yōu)先級排序的比例及所述經(jīng)優(yōu)先級排序的第一手勢模型的組合掃描所述源圖像序列 以確定是否執(zhí)行所述手勢的裝置。
31. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括用于在于所述源圖像序列中檢測到預(yù) 定數(shù)目個(gè)手勢的情況下,在完成對所述源圖像序列的完全掃描之前結(jié)束對所述源圖像序列 中的所述手勢的掃描的裝置。
32. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括: 用于確定與所述手勢相比較來說不太可能在所述一或多個(gè)參考圖像中檢測到第二手 勢的裝置;以及 用于在檢測到所述手勢之后基于確定不太可能檢測到所述第二手勢而掃描所述一或 多個(gè)參考圖像以查找所述第二手勢的裝置。
33. 根據(jù)權(quán)利要求23所述的設(shè)備,其進(jìn)一步包括: 用于掃描所述一或多個(gè)參考圖像以查找所述手勢的裝置; 用于改進(jìn)在按級的連續(xù)編號排序的多個(gè)級聯(lián)級中對所述一或多個(gè)參考圖像的用以查 找所述手勢的所述掃描的裝置,其中所述級聯(lián)級中的每一級包括掃描所述源圖像序列中的 至少一個(gè)圖像中的周期性編號的像素以檢測所述手勢,所述周期性編號的像素與所述周期 性編號的像素中的每隔一個(gè)像素相距恒定的垂直及水平距離,且其中任一級中的像素的所 述周期性編號小于或等于前一級中的像素的所述周期性編號;以及 用于通過確定所述連續(xù)編號的級中的最后一級是否檢測到所述手勢的至少一部分識 別所述手勢的裝置。
34. -種非暫時(shí)性處理器可讀媒體,其包括處理器可讀指令,所述處理器可讀指令經(jīng)配 置以致使處理器進(jìn)行以下操作: 使用多個(gè)手勢模型中的一或多個(gè)手勢模型檢測一或多個(gè)參考圖像中的每一者中的手 勢; 從所述一或多個(gè)手勢模型中選擇最接近地匹配所述所檢測到的手勢的第一手勢模 型; 優(yōu)先于所述多個(gè)手勢模型中的其它手勢模型對所述第一手勢模型進(jìn)行優(yōu)先級排序以 用于在一源圖像序列中搜索所述手勢; 使用所述經(jīng)優(yōu)先級排序的第一手勢模型掃描所述源圖像序列以確定是否執(zhí)行所述手 勢;以及 在執(zhí)行所述手勢的情況下,在使用所述多個(gè)手勢模型中的另一手勢模型確定是否執(zhí)行 所述手勢之前結(jié)束掃描。
【文檔編號】G06K9/00GK104350509SQ201380029750
【公開日】2015年2月11日 申請日期:2013年5月20日 優(yōu)先權(quán)日:2012年6月8日
【發(fā)明者】菲茨杰拉德·約翰·阿奇博爾德, 弗朗西斯·B·麥克杜格爾 申請人:高通股份有限公司