本技術涉及圖像識別,具體為一種基于手勢識別的玩具機器人點讀控制方法。
背景技術:
1、手勢識別技術在玩具機器人中的應用,是人機交互(human–computerinteraction,hci)領域的一個創(chuàng)新方向,它利用計算機視覺和機器學習算法,使得機器人能夠理解并響應人類的手勢動作,從而實現(xiàn)更加自然和直觀的控制方式。玩具機器人作為兒童或者成人的娛樂、教育工具,通過集成手勢識別技術,可以大幅提升用戶體驗,增加互動性和趣味性。
2、目前的機器人的手勢識別主要依賴于計算機視覺和機器學習算法,通過訓練手勢識別的深度學習模型對交互手勢進行識別分析,并進一步控制機器人執(zhí)行相應的指令。但是對于玩具機器人來說,其搭載的處理器性能通常較低,直接對采集的圖像進行分割、識別可能會造成處理時間過長,且對于復雜背景下,直接進行識別可能會造成誤識別或漏識別等情況。
技術實現(xiàn)思路
1、本技術的目的在于提供一種基于手勢識別的玩具機器人點讀控制方法,以解決在處理器性能被限制的應用場景下如何精準地對交互手勢進行識別的技術問題。
2、為實現(xiàn)上述目的,本技術提供如下技術方案:
3、一種基于手勢識別的玩具機器人點讀控制方法,包括:
4、獲取多個時序手勢識別圖像;
5、基于各個時序手勢識別圖像,獲取多個超像素塊;
6、基于多個超像素塊,獲取與各個超像素塊一一對應的手勢信息系數(shù);所述手勢信息系數(shù)至少用于表示對應的超像素塊中具有手勢的概率;
7、基于所述手勢信息系數(shù),由多個超像素塊,獲取多個連通域;
8、基于多個連通域,獲取第一連通域;所述第一連通域為各個連通域中的各個超像素塊的手勢信息系數(shù)平均值最高的連通域;
9、基于所述第一連通域,獲取當前手勢識別圖像;
10、基于當前手勢識別圖像,控制所述玩具機器人。
11、作為本技術技術方案中一個具體的方案,所述基于多個超像素塊,獲取與各個超像素塊一一對應的手勢信息系數(shù),包括:
12、基于多個超像素塊,獲取第一超像素塊和第一時序手勢識別圖像;其中,所述第一超像素塊為各個超像素塊中的任意一個超像素塊;所述第一時序手勢識別圖像為與所述第一超像素塊相對應的時序手勢識別圖像;
13、基于所述第一超像素塊,獲取第一質心坐標;
14、基于所述第一時序手勢識別圖像,獲取圖像中心坐標;
15、基于所述第一質心坐標和所述圖像中心坐標,獲取第一距離;
16、基于所述第一距離,獲取與各個超像素塊一一對應的手勢信息系數(shù)。
17、作為本技術技術方案中一個具體的方案,所述基于所述第一距離,獲取與各個超像素塊一一對應的手勢信息系數(shù),包括:
18、基于各個時序手勢識別圖像,獲取預設時間內且時序位于所述第一時序手勢識別圖像之后的多個第二時序手勢識別圖像;
19、基于多個第二時序手勢識別圖像,獲取與各個第二時序手勢識別圖像一一對應的第二超像素塊;所述第二超像素塊為對應的第二時序手勢識別圖像中與所述第一超像素塊結構相似度最高的超像素塊;
20、基于多個第二超像素塊,獲取與各個第二超像素塊一一對應的第二質心坐標;
21、基于所述第一質心坐標和各個第二質心坐標,獲取多個線段;每個線段的起點為所述第一質心坐標,終點為各個第二質心坐標中的任意一個第二質心坐標;
22、基于多個線段,獲取多個斜率;
23、基于多個斜率,獲取斜率方差;
24、基于所述斜率方差和所述第一距離,獲取第一系數(shù);所述第一系數(shù)至少用于表示所述第一超像素塊所對應的物體為非直線運動物體的概率;
25、基于所述第一系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù)。
26、作為本技術技術方案中一個具體的方案,所述基于所述斜率方差和所述第一距離,獲取第一系數(shù)的計算公式如下:
27、;
28、其中,表示第一系數(shù);表示第一距離;表示斜率方差;表示用于將括號內的數(shù)值映射至[0,1]區(qū)間范圍內的映射函數(shù);b為大于0的正數(shù)。
29、作為本技術技術方案中一個具體的方案,所述基于所述第一系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù),包括:
30、基于所述第一時序手勢識別圖像,獲取多個第三超像素塊;所述第三超像素塊為所述第一時序手勢識別圖像中任意一個超像素塊;
31、將各個第三超像素塊按照第一系數(shù)由大到小進行排列;
32、基于各個第三超像素塊,獲取平均方差和第四超像素塊;所述平均方差為各個第三超像素塊中像素值方差的平均值;所述第四超像素塊為排序靠前,并且對應的像素值方差大于所述平均方差的任意一個第三超像素塊;
33、基于所述第四超像素塊,獲取第一像素均值和第一方差;所述第一像素均值為所述第四超像素塊中各個像素點中r通道像素值的平均值;所述第一方差為所述第四超像素塊中各個像素點中v通道像素值的方差;
34、基于所述第一像素均值和所述第一方差,獲取第二系數(shù);
35、基于所述第二系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù)。
36、作為本技術技術方案中一個具體的方案,所述基于所述第二系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù),包括:
37、基于邊緣算法由所述第四超像素塊,獲取多個紋理像素點;
38、基于各個紋理像素點,獲取多個第二方差;所述第二方差為各個紋理像素點坐標的方差;
39、基于所述第二方差和所述第二系數(shù),獲取第三系數(shù);
40、基于所述第三系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù)。
41、作為本技術技術方案中一個具體的方案,所述基于所述第二方差和所述第二系數(shù),獲取第三系數(shù)的計算公式如下:
42、;
43、其中,表示第三系數(shù);表示第一像素均值;表示第一方差;表示第二方差。
44、作為本技術技術方案中一個具體的方案,所述基于所述第三系數(shù),獲取與各個超像素塊一一對應的手勢信息系數(shù),包括:
45、基于各個第三系數(shù),獲取系數(shù)平均值;所述系數(shù)平均值為各個第三系數(shù)中最大值和最小值的平均值;
46、基于所述第一超像素塊,獲取固定系數(shù);所述固定系數(shù)為與所述第一超像素塊對應的第三系數(shù);
47、基于所述系數(shù)平均值和固定系數(shù),獲取與所述第一超像素塊對應的手勢信息系數(shù)。
48、作為本技術技術方案中一個具體的方案,所述基于所述系數(shù)平均值和固定系數(shù),獲取與所述第一超像素塊對應的手勢信息系數(shù)的計算公式如下:
49、;
50、其中,表示與所述第一超像素塊對應的手勢信息系數(shù);表示系數(shù)平均值;表示所述第一超像素塊的固定系數(shù);表示求絕對值;為大于0的正數(shù)。
51、作為本技術技術方案中一個具體的方案,所述基于所述手勢信息系數(shù),由多個超像素塊,獲取多個連通域,包括:
52、基于各個超像素塊,獲取多個第五超像素塊;所述第五超像素塊為各個超像素塊中手勢信息系數(shù)由大到小進行排序,序號位于前50%的超像素塊;
53、基于多個第五超像素塊,獲取多個連通域;
54、所述基于多個連通域,獲取第一連通域,包括:
55、基于各個連通域,獲取多個第二連通域;所述第二連通域為各個連通域中任意具有所述第四超像素塊的連通域;
56、基于多個第二連通域,獲取第三連通域和第四連通域;所述第三連通域為各個第二連通域中任意一個連通域;所述第四連通域為各個第二連通域中與所述第三連通域不同的任意連通域;
57、基于所述第三連通域和所述第四連通域,選取切線圍成范圍內的超像素塊進行組合,直至獲取所述第一連通域。
58、與現(xiàn)有技術相比,本技術的有益效果是:
59、本技術獲取多幀時序手勢識別圖像并對其進行分塊后,利用幀差法結合手部運動的特征,分析關鍵手部區(qū)域(也即第四超像素塊),然后通過評估手心和手背的圖像特征,對其他超像素塊中包含的手心和手背特征進行評估,并與第四超像素塊的圖像特征進行對比,提取時序手勢識別圖像中的手部信息區(qū)域(也即第一連通域),并輸入識別模型,輸出點讀控制信息。與現(xiàn)有技術相比,分割過程降低了復雜光照和背景的干擾,避免了提前錄入手部特征,在不同采像條件下無法識別分割的情況發(fā)生,也即提升了在復雜背景下的識別精準度,減少了手勢識別的時耗。