基于單目攝像頭的手勢(shì)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明設(shè)計(jì)圖像識(shí)別技術(shù)領(lǐng)域,特別涉及一種基于單目攝像頭的手勢(shì)識(shí)別方法。
【背景技術(shù)】
[0002]現(xiàn)有的肢體識(shí)別技術(shù),通常是利用雙目攝像頭采集用戶(hù)的肢體圖像。由于用戶(hù)的肢體圖像是夾雜在大量的背景圖像之中,從背景圖像中分離出用戶(hù)的肢體圖像比較困難。此外,由于用戶(hù)在操控設(shè)備等情況下,通常是采用手勢(shì)進(jìn)行表達(dá),因此準(zhǔn)確的從背景圖像中分離出手勢(shì)圖像,對(duì)于解決實(shí)際問(wèn)題更有意義。并且,現(xiàn)有的圖像采集設(shè)備通常為雙目圖像采集設(shè)備。
[0003]如何利用單目圖像采集設(shè)備且準(zhǔn)確從背景圖像中識(shí)別分離出手勢(shì)圖像,是當(dāng)前圖像識(shí)別技術(shù)中需要解決的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的旨在至少解決所述技術(shù)缺陷之一。
[0005]為此,本發(fā)明的目的在于提出一種基于單目攝像頭的手勢(shì)識(shí)別方法,通過(guò)單目攝像頭采集用戶(hù)的手掌位置區(qū)域信息,實(shí)現(xiàn)手勢(shì)智能識(shí)別,并利用回調(diào)函數(shù)調(diào)用手勢(shì)對(duì)應(yīng)操作,進(jìn)行交互輸出,具有識(shí)別精度高、硬件設(shè)備結(jié)構(gòu)簡(jiǎn)單的特點(diǎn)。
[0006]為了實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)施例提供一種基于單目攝像頭的手勢(shì)識(shí)別方法,包括如下步驟:
[0007]步驟S1,利用單目攝像頭拍攝視頻,獲取所述單目攝像頭采集的視頻幀;
[0008]步驟S2,對(duì)所述視頻幀進(jìn)行圖像特征分析,以判斷所述視頻幀中是否存在手掌部區(qū)域圖片;
[0009]步驟S3,如果存在所述手掌部區(qū)域圖片,則獲取當(dāng)前時(shí)刻下的所述手掌部區(qū)域位置,并存儲(chǔ)至全局緩存內(nèi),重復(fù)步驟S1至步驟S3,獲取預(yù)設(shè)時(shí)長(zhǎng)內(nèi)多個(gè)時(shí)刻的所述手掌部區(qū)域位置,將每個(gè)時(shí)刻及對(duì)應(yīng)的手掌部區(qū)域位置存儲(chǔ)至所述全局緩存內(nèi);
[0010]步驟S4,對(duì)所述多個(gè)時(shí)刻的所述手掌部區(qū)域位置進(jìn)行分析,獲取所述預(yù)設(shè)時(shí)長(zhǎng)內(nèi)手掌部區(qū)域的相對(duì)位置,根據(jù)所述手掌部區(qū)域的相對(duì)位置識(shí)別出對(duì)應(yīng)的手勢(shì)操作;
[0011]步驟S5,將識(shí)別得到的手勢(shì)操作與多個(gè)預(yù)定義手勢(shì)進(jìn)行比較,獲取相匹配的預(yù)定義手勢(shì),調(diào)用所述匹配的預(yù)定義手勢(shì)對(duì)應(yīng)的回調(diào)函數(shù),以完成相應(yīng)的控制動(dòng)作,其中,每個(gè)預(yù)定義手勢(shì)、回調(diào)函數(shù)和控制動(dòng)作一一對(duì)應(yīng)。
[0012]進(jìn)一步,在所述步驟S1中,在所述單目攝像頭拍攝視頻之前,對(duì)所述單目攝像頭進(jìn)行初始化,設(shè)定所述單目攝像頭的分辨率。
[0013]進(jìn)一步,在所述步驟S2中,對(duì)所述視頻幀進(jìn)行圖像特征分析,包括如下步驟:
[0014]提取所述視頻幀的圖像特征;
[0015]利用分類(lèi)器對(duì)所述圖像特征進(jìn)行分類(lèi)篩選,根據(jù)篩選結(jié)果判斷所述視頻中是否存在手掌部區(qū)域圖片,如果存在,則執(zhí)行步驟S3,否則丟棄該視頻幀。
[0016]進(jìn)一步,還包括如下步驟:在所述分類(lèi)器對(duì)所述圖像特征進(jìn)行分類(lèi)篩選之前,獲取樣本數(shù)據(jù),訓(xùn)練所述樣本數(shù)據(jù)以選取所述分類(lèi)器,并對(duì)所述分類(lèi)器進(jìn)行初始化,其中,所述樣本數(shù)據(jù)包括正樣本圖片和負(fù)樣本圖片,所述正樣本圖片為包括手掌區(qū)域的圖片樣本,所述負(fù)樣本圖片為不包括手掌區(qū)域的圖片樣本。
[0017]進(jìn)一步,獲取所述正樣本圖片,包括如下步驟:由人工從預(yù)選樣本圖片集合中篩選出包括手掌區(qū)域的圖片,并在所述圖片上標(biāo)注手掌所在的區(qū)域,保存標(biāo)注信息,得到正樣本圖片。
[0018]進(jìn)一步,獲取所述負(fù)樣本圖片,包括如下步驟:
[0019]由人工從預(yù)選樣本圖片集合中篩選出不包括手掌區(qū)域且實(shí)際應(yīng)用中的背景圖片;
[0020]對(duì)所述背景圖片進(jìn)行分割以滿(mǎn)足所述正樣本圖片的尺寸;
[0021]對(duì)所述背景圖片中重復(fù)的特征進(jìn)行去除,得到負(fù)樣本圖片。
[0022]進(jìn)一步,訓(xùn)練所述樣本數(shù)據(jù)以選取所述分類(lèi)器,包括如下步驟:
[0023]分別提取所述正樣本圖片和負(fù)樣本圖片的圖像特征;
[0024]將所述正樣本圖片和負(fù)樣本圖片的圖像特征合并生成訓(xùn)練樣本集;
[0025]對(duì)所述訓(xùn)練樣本集進(jìn)行抽取以得到檢測(cè)樣本集;
[0026]利用訓(xùn)練樣本集對(duì)分類(lèi)器進(jìn)行訓(xùn)練,并利用所述檢測(cè)樣本集對(duì)訓(xùn)練后的分類(lèi)器進(jìn)行測(cè)試得到當(dāng)前分類(lèi)器的準(zhǔn)確率;
[0027]迭代設(shè)置訓(xùn)練參數(shù)得到多個(gè)分類(lèi)器的準(zhǔn)確率,并選取準(zhǔn)確率最高的分類(lèi)器作為所述步驟S2中采用的所述分類(lèi)器。
[0028]進(jìn)一步,還包括如下步驟:對(duì)所述全局緩存中的數(shù)據(jù)進(jìn)行定期更新和刪除。
[0029]進(jìn)一步,在所述步驟S3中,復(fù)制對(duì)所述手掌部區(qū)域位置對(duì)應(yīng)的手掌部區(qū)域圖片至所述全局緩存內(nèi),并為所述手掌部區(qū)域圖片生成唯一的全局UUID,作為該手掌部區(qū)域圖片名稱(chēng)。
[0030]根據(jù)本發(fā)明實(shí)施例的基于單目攝像頭的手勢(shì)識(shí)別方法,通過(guò)單目攝像頭采集用戶(hù)的手掌位置區(qū)域信息,實(shí)現(xiàn)手勢(shì)智能識(shí)別,并利用回調(diào)函數(shù)調(diào)用手勢(shì)對(duì)應(yīng)操作,進(jìn)行交互輸出,具有識(shí)別精度高、硬件設(shè)備結(jié)構(gòu)簡(jiǎn)單的特點(diǎn)。本發(fā)明實(shí)現(xiàn)運(yùn)用攝像機(jī)和計(jì)算機(jī)視覺(jué)算法來(lái)翻譯身體語(yǔ)言,借此豐富機(jī)器與人之間的溝通橋梁,手勢(shì)識(shí)別技術(shù)容許人不需要額外的工具就可以與機(jī)器溝通。
[0031]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【附圖說(shuō)明】
[0032]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0033]圖1為根據(jù)本發(fā)明實(shí)施例的基于單目攝像頭的手勢(shì)識(shí)別方法的流程框圖;
[0034]圖2為根據(jù)本發(fā)明實(shí)施例的基于單目攝像頭的手勢(shì)識(shí)別方法的流程圖;
[0035]圖3為根據(jù)本發(fā)明實(shí)施例的初始化攝像頭和分類(lèi)器的流程圖;
[0036]圖4為根據(jù)本發(fā)明實(shí)施例的獲取視頻幀的圖像特征及分類(lèi)器篩選的流程圖;
[0037]圖5為根據(jù)本發(fā)明實(shí)施例的手勢(shì)判斷的流程圖;
[0038]圖6為根據(jù)本發(fā)明實(shí)施例的手部區(qū)域圖片取樣保存流程圖;
[0039]圖7為根據(jù)本發(fā)明實(shí)施例的正樣本圖片獲取流程圖;
[0040]圖8為根據(jù)本發(fā)明實(shí)施例的負(fù)樣本圖片獲取流程圖;
[0041]圖9為根據(jù)本發(fā)明實(shí)施例的正負(fù)樣本特征提取流程圖;
[0042]圖10為根據(jù)本發(fā)明實(shí)施例的分類(lèi)器訓(xùn)練流程圖。
【具體實(shí)施方式】
[0043]下面詳細(xì)描述本發(fā)明的實(shí)施例,實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0044]下面參考圖1至圖10對(duì)本發(fā)明實(shí)施例的基于單目攝像頭的手勢(shì)識(shí)別方法進(jìn)行說(shuō)明。
[0045]如圖1所示,本發(fā)明實(shí)施例的基于單目攝像頭的手勢(shì)識(shí)別方法,包括如下步驟:
[0046]步驟S1,利用單目攝像頭拍攝視頻,獲取單目攝像頭采集的視頻幀。
[0047]本發(fā)明采用單目攝像頭作為人機(jī)接口,通過(guò)單目攝像頭讀取用戶(hù)手勢(shì)進(jìn)行交互輸入。
[0048]在單目攝像頭拍攝視頻之前,首先對(duì)單目攝像頭進(jìn)行初始化,設(shè)定單目攝像頭的分辨率。
[0049]圖3為根據(jù)本發(fā)明實(shí)施例的初始化攝像頭和分類(lèi)器的流程圖。
[0050]步驟S301,加載配置文件。
[0051 ]啟動(dòng)程序從配置文件讀取配置產(chǎn)生。
[0052]步驟S302,判斷是否加載成功,如果是,則執(zhí)行步驟S304和步驟S305,否則執(zhí)行步驟 S303。
[0053]步驟S303,提示加載配置文件失敗。
[0054]提示初始化失敗并報(bào)對(duì)應(yīng)錯(cuò)誤.。步驟S304,初始化攝像頭。
[0055]通過(guò)配置參數(shù)初始化攝像頭,配置攝像頭的分辨率。
[0056]步驟S305,初始化分類(lèi)器。
[0057]用戶(hù)可以距離單目攝像頭一定距離,進(jìn)行手勢(shì)揮動(dòng)操作。由