本發(fā)明涉及一種頭部的控制系統(tǒng),尤其涉及到一種智能機(jī)器人頭部的控制系統(tǒng),主要用于服務(wù)、娛樂(lè)和人工智能互動(dòng)領(lǐng)域。
背景技術(shù):
目前,具有各式各樣的機(jī)器人頭部的控制方法,但一般都是具備一些基本和常見(jiàn)的功能,如語(yǔ)音識(shí)別,人臉識(shí)別和語(yǔ)音播放等基本應(yīng)用功能。多任務(wù)處理方式單一,這樣并無(wú)法真正地體現(xiàn)人與人工智能的互動(dòng),現(xiàn)有的互動(dòng)大多數(shù)也僅是停留在基本動(dòng)作上,互動(dòng)方式有所局限。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于解決如何讓人與人工智能更好進(jìn)行互動(dòng)的問(wèn)題,讓人工智能更貼近我們的生活,提高精神生活的質(zhì)量,提高控制系統(tǒng)的運(yùn)行效率。現(xiàn)提供一種基于智能機(jī)器人頭部的控制方法,解決人與人工智能互動(dòng)局限和效率的控制方式問(wèn)題。
本發(fā)明的目的通過(guò)如下技術(shù)方案實(shí)現(xiàn):
一種基于智能機(jī)器人頭部的控制系統(tǒng),包括:
控制模塊,用于輸出控制指令激活與控制智能機(jī)器人頭部的電機(jī)轉(zhuǎn)速和傳感器,控制機(jī)器人頭部運(yùn)動(dòng),實(shí)現(xiàn)機(jī)器人頭部的視覺(jué)和語(yǔ)音互動(dòng);
視覺(jué)處理模塊,用于對(duì)攝像頭采集的視頻信息進(jìn)行人體姿態(tài)識(shí)別和人臉識(shí)別,并向控制模塊發(fā)送相應(yīng)識(shí)別數(shù)據(jù);
語(yǔ)音處理模塊,用于對(duì)麥克風(fēng)采集的音頻信息進(jìn)行語(yǔ)音合成與識(shí)別和節(jié)奏識(shí)別,并向控制模塊發(fā)送相應(yīng)識(shí)別數(shù)據(jù);
麥克風(fēng)控制模塊,用于初始化麥克風(fēng)采集音頻信息;
攝像頭控制模塊,用于初始化攝像頭采集視頻信息。
進(jìn)一步地,所述控制模塊在激活與控制電機(jī)和傳感器時(shí),首先對(duì)睡眠的電機(jī)和傳感器進(jìn)行激活喚醒,初始化電機(jī)的配置和開(kāi)啟各項(xiàng)傳感器,然后結(jié)合傳感器解算得到的數(shù)據(jù),最終換算成PWM輸入量對(duì)電機(jī)進(jìn)行控制,再結(jié)合PID控制算法進(jìn)行控制優(yōu)化。
進(jìn)一步地,所述的傳感器包含陀螺儀、加速度計(jì)、壓力傳感器和溫度傳感器,其中,所述陀螺儀和加速度計(jì)用于結(jié)合計(jì)算出頭部運(yùn)轉(zhuǎn)的角度和速度,同時(shí)通過(guò)壓力傳感器和溫度傳感器,實(shí)現(xiàn)觸摸傳感,使動(dòng)作達(dá)到與人的仿真效果。
進(jìn)一步地,所述的視覺(jué)處理模塊采用Kinect深度圖像采集和Opencv幀差法相結(jié)合的方式,提高人體姿態(tài)和人臉識(shí)別率、識(shí)別范圍,實(shí)現(xiàn)姿態(tài)模仿、識(shí)別跟蹤和表情識(shí)別的效果。
進(jìn)一步地,所述的語(yǔ)音處理模塊采用多麥克風(fēng)陣列,結(jié)合語(yǔ)音合成與識(shí)別技術(shù),實(shí)現(xiàn)全方位語(yǔ)音信號(hào)采集,并能通過(guò)聲源定位來(lái)確定聲源的方向。
進(jìn)一步地,所述的語(yǔ)音處理模塊通過(guò)音樂(lè)能力波形轉(zhuǎn)換為電信號(hào)輸出進(jìn)行節(jié)奏識(shí)別,實(shí)現(xiàn)電機(jī)PWM輸入量隨音樂(lè)節(jié)奏而變化。
進(jìn)一步地,所述麥克風(fēng)模塊還用于檢測(cè)麥克風(fēng)設(shè)備的健康狀態(tài);
進(jìn)一步地,所述攝像頭模塊還用于檢測(cè)攝像頭設(shè)備的健康狀態(tài)。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明具有如下優(yōu)點(diǎn)和技術(shù)效果:
1)本發(fā)明結(jié)合人工智能識(shí)別技術(shù)和控制算法,實(shí)現(xiàn)姿態(tài)模仿、識(shí)別跟蹤和表情識(shí)別互動(dòng)效果。
2)本發(fā)明結(jié)合麥克風(fēng)陣列語(yǔ)音識(shí)別技術(shù)和聲源定位技術(shù),實(shí)現(xiàn)語(yǔ)音互動(dòng)效果。
3)本發(fā)明創(chuàng)新地運(yùn)用節(jié)奏識(shí)別技術(shù),實(shí)現(xiàn)電機(jī)的轉(zhuǎn)動(dòng)速度隨音樂(lè)節(jié)奏的快慢進(jìn)行變化。
4)本發(fā)明的各模塊可靈活地利用多線程的方式進(jìn)行處理,可實(shí)現(xiàn)在單個(gè)程序中同時(shí)運(yùn)行多個(gè)線程完成不同的工作。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例控制流程圖。
圖2為本發(fā)明實(shí)施例的系統(tǒng)原理示意圖。
具體實(shí)施方式
為更好地理解本發(fā)明,下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施作進(jìn)一步說(shuō)明。
如圖2所示,一種基于智能機(jī)器人頭部的控制系統(tǒng),包括:
控制模塊,用于輸出控制指令激活與控制智能機(jī)器人頭部的電機(jī)轉(zhuǎn)速和傳感器,控制機(jī)器人頭部運(yùn)動(dòng),實(shí)現(xiàn)機(jī)器人頭部的視覺(jué)和語(yǔ)音互動(dòng);
視覺(jué)處理模塊,用于對(duì)攝像頭采集的視頻信息進(jìn)行人體姿態(tài)識(shí)別和人臉識(shí)別,并向控制模塊發(fā)送相應(yīng)識(shí)別數(shù)據(jù);
語(yǔ)音處理模塊,用于對(duì)麥克風(fēng)采集的音頻信息進(jìn)行語(yǔ)音合成與識(shí)別和節(jié)奏識(shí)別,并向控制模塊發(fā)送相應(yīng)識(shí)別數(shù)據(jù);
麥克風(fēng)控制模塊,用于初始化麥克風(fēng)采集音頻信息;
攝像頭控制模塊,用于初始化攝像頭采集視頻信息。
具體而言,本實(shí)施例的所述控制模塊在激活與控制電機(jī)轉(zhuǎn)速和傳感器時(shí),首先對(duì)睡眠的電機(jī)和傳感器進(jìn)行激活喚醒,初始化電機(jī)的配置和開(kāi)啟各項(xiàng)傳感器,然后結(jié)合傳感器解算得到的數(shù)據(jù),最終換算成PWM輸入量對(duì)電機(jī)進(jìn)行控制,再結(jié)合PID控制算法進(jìn)行控制優(yōu)化。換言之,電機(jī)和傳感器等設(shè)備先經(jīng)過(guò)初始化配置后等待控制命令,接收到控制命令,執(zhí)行相應(yīng)的動(dòng)作,若沒(méi)有接到控制命令,繼續(xù)處于睡眠狀態(tài)(見(jiàn)圖1)。
具體而言,本實(shí)施例的所述傳感器包含陀螺儀、加速度計(jì)、壓力傳感器和溫度傳感器,其中,所述陀螺儀和加速度計(jì)用于結(jié)合計(jì)算出頭部運(yùn)轉(zhuǎn)的角度和速度,同時(shí)通過(guò)壓力傳感器和溫度傳感器,實(shí)現(xiàn)觸摸傳感,使動(dòng)作達(dá)到與人的仿真效果。
具體而言,本實(shí)施例的所述視覺(jué)處理模塊采用Kinect深度圖像采集和Opencv幀差法相結(jié)合的方式,提高人體姿態(tài)和人臉識(shí)別率、識(shí)別范圍,實(shí)現(xiàn)姿態(tài)模仿、識(shí)別跟蹤和表情識(shí)別的效果。所述視覺(jué)處理模塊結(jié)合人工智能識(shí)別技術(shù)和控制算法,以人臉識(shí)別技術(shù)為主,實(shí)現(xiàn)攝像頭跟隨識(shí)別對(duì)象進(jìn)行運(yùn)動(dòng)的效果。
具體而言,本實(shí)施例的所述的語(yǔ)音處理模塊采用多麥克風(fēng)陣列,結(jié)合語(yǔ)音合成與識(shí)別技術(shù),實(shí)現(xiàn)全方位語(yǔ)音信號(hào)采集,并能通過(guò)聲源定位來(lái)確定聲源的方向。
具體而言,本實(shí)施例的所述的語(yǔ)音處理模塊通過(guò)音樂(lè)能力波形轉(zhuǎn)換為電信號(hào)輸出進(jìn)行節(jié)奏識(shí)別,實(shí)現(xiàn)電機(jī)PWM輸入量隨音樂(lè)節(jié)奏而變化。
具體而言,本實(shí)施例的所述麥克風(fēng)模塊還用于檢測(cè)麥克風(fēng)設(shè)備的健康狀態(tài),實(shí)現(xiàn)對(duì)麥克風(fēng)健康狀態(tài)的及時(shí)監(jiān)控,保證智能機(jī)器人頭部對(duì)音頻信息的正常采集。
具體而言,本實(shí)施例的所述攝像頭模塊還用于檢測(cè)攝像頭設(shè)備的健康狀態(tài),實(shí)現(xiàn)對(duì)攝像頭健康狀態(tài)的及時(shí)監(jiān)控,保證智能機(jī)器人頭部對(duì)視頻信息的正常采集。
如圖2所示,以上功能的實(shí)現(xiàn),基于電機(jī)、各種傳感器和各種算法的結(jié)合實(shí)現(xiàn)與人的仿真效果。其中,利用陀螺儀、加速度計(jì)、壓力傳感器和溫度傳感器等,通過(guò)數(shù)據(jù)的解算,實(shí)現(xiàn)動(dòng)作仿真與人的動(dòng)作一樣的效果。視頻和音頻算法包括PID控制算法、Kinect深度圖像采集算法、Opencv幀差算法、節(jié)奏識(shí)別算法等,同時(shí)結(jié)合傅里葉變換和AR模型等進(jìn)行解算。各模塊的運(yùn)行各線程同時(shí)運(yùn)行并完成不同的任務(wù),相互之間容錯(cuò)進(jìn)行采用多線程的方式,相互之間容錯(cuò)進(jìn)行。
本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所做的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。