本發(fā)明涉及計算機技術(shù)領(lǐng)域,具體涉及機器人技術(shù)領(lǐng)域,尤其涉及機器人交互控制方法、服務(wù)器和機器人。
背景技術(shù):
機器人(Robot)是能夠自動執(zhí)行工作的機器裝置的統(tǒng)稱,是涉及多個學(xué)科門類的人類智慧結(jié)晶,其中具備一定程度自主意識的智能機器人更是受到廣泛關(guān)注。
現(xiàn)有技術(shù)中,機器人通常具有指令接收單元、信息處理單元和執(zhí)行單元,可以通過預(yù)設(shè)或自主模式執(zhí)行指令。在工業(yè)生產(chǎn)的生產(chǎn)線上,這樣的機器人人們對其已經(jīng)是司空見慣,然而融入百姓生活和家庭的,能夠與家庭成員順利溝通的機器人,還未見報端,這其中需要攻克的技術(shù)難題還有很多?,F(xiàn)有技術(shù)中的機器人幾乎都是根據(jù)預(yù)設(shè)指令完成預(yù)設(shè)動作的,與用戶進行交互時,需要依靠人機交互組件或者人機交互界面進行,這類交互組件或交互界面作為一個硬件組成部分設(shè)置于機器人上,通過接收到用戶給出的指令或者輸入的指令信息來完成相應(yīng)的預(yù)設(shè)動作。而想要做到自主應(yīng)對用戶臨時信息或命令,比如與人僅做交流性溝通或者處理臨時性指令,現(xiàn)在的機器人就無法做到。再者,由于現(xiàn)有的機器人仍然存在應(yīng)對動作指令方式單一、無法隨機應(yīng)變的問題,因此想要使機器人在某一應(yīng)用領(lǐng)域具備一定程度人的能力,使其順利進入人們的家庭,比如在陪護兒童、老人伴侶等應(yīng)用領(lǐng)域中,還不能夠很好實現(xiàn)。
技術(shù)實現(xiàn)要素:
基于此,本發(fā)明的首要目的旨在解決上述至少一個問題,提供一種機器人交互控制方法,并相應(yīng)提供服務(wù)器和機器人以運行前一目標(biāo)所述的方法。
為實現(xiàn)本發(fā)明的上述目的,采取如下技術(shù)方案:
本發(fā)明的一種機器人交互控制方法,包括以下步驟:
接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
進一步地,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息;
將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。
在其中一個實施例中,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中視頻數(shù)據(jù)的視頻特征幀信息;
將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。
進一步的,所述視頻特征幀信息由記載行為動作的圖片信息組成,預(yù)定時間內(nèi)連續(xù)的若干數(shù)量所述圖片信息即為所述視頻特征幀信息。
在其中一個實施例中,所述依據(jù)傳感器數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;
將所述特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。
進一步地,所述傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取所述地理信息傳感器數(shù)據(jù)中的地理信息數(shù)據(jù),將所述地理信息數(shù)據(jù)與預(yù)存地理信息數(shù)據(jù)相匹配,據(jù)以確定所述地理信息傳感器數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。
進一步地,所述傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。
在其中一個實施例中,所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù)表,和與預(yù)設(shè)行為類型數(shù)據(jù)表具有映射關(guān)系的機器行為指令表;所述從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令的具體步驟為:
以所述行為類型為關(guān)鍵詞檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。
在其中一個實施例中,所述機器行為指令包括:
語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或
視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或
動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。
在其中一個實施例中,在接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到機器人上傳的生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。
進一步地,所述生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。
在其中一個實施例中,所述預(yù)設(shè)行為類型庫和/或所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫由云端服務(wù)器或與云端服務(wù)器關(guān)聯(lián)的用戶設(shè)定或更新。
在其中一個實施例中,所述上傳方式為實時上傳。
本發(fā)明還提供了一種機器人交互控制方法,包括以下步驟:
獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
依據(jù)所述行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
進一步地,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息;
將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。
在其中一個實施例中,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中視頻數(shù)據(jù)的視頻特征幀信息;
將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。
在其中一個實施例中,所述依據(jù)傳感器數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;
將所述特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。
進一步地,所述傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取所述地理信息傳感器數(shù)據(jù)中的地理信息數(shù)據(jù),將所述地理信息數(shù)據(jù)與預(yù)存地理信息數(shù)據(jù)相匹配,據(jù)以確定所述地理信息傳感器數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。
進一步地,所述傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。
在其中一個實施例中,所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù)表,和與預(yù)設(shè)行為類型數(shù)據(jù)表具有映射關(guān)系的機器行為指令表;所述從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令的具體步驟為:
以所述行為類型為關(guān)鍵詞檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。
在其中一個實施例中,所述機器行為指令包括:
語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或
視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或
動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。
在其中一個實施例中,在獲取到屬于攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。
在其中一個實施例中,所述生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。
在其中一個實施例中,所述預(yù)設(shè)行為類型庫和/或所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫由用戶設(shè)定或下載自云端服務(wù)器。
進一步地,所述下載通過藍牙、Wi-Fi網(wǎng)絡(luò)、移動數(shù)據(jù)網(wǎng)絡(luò)或有線網(wǎng)絡(luò)進行。
本發(fā)明提供了一種機器人交互服務(wù)器,包括:
接收模塊,用于接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
解析模塊,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
數(shù)據(jù)生成模塊,用于從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令;
發(fā)送模塊,用于發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
本發(fā)明還提供了一種機器人,包括:
獲取模塊,用于獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
分析模塊,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型,再從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
執(zhí)行模塊,用于依據(jù)所述行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
本發(fā)明提供的方法和設(shè)備大幅度提高了機器人的智能水平,使得機器人與人的交互更加便利、形式更加豐富,依靠機器人自身的音頻、視頻或者傳感器設(shè)備分析其監(jiān)視對象的某些動作、語言,甚至是表情,就能夠做出對應(yīng)的反饋行為,從而使人能夠通過多種形式與機器人實現(xiàn)交互。而且,機器人的反饋行為也更為豐富,不僅可以通過聲音、視頻或者二者相結(jié)合,也可以通過動作來反饋人的某些行為,使得即使是兒童和老人,也能夠與機器人方便交互,做到機器人對兒童和老人的陪護,使得機器人進入人們的家庭成為現(xiàn)實的可能。
附圖說明
圖1為本發(fā)明一實施例機器人交互控制方法流程圖;
圖2為本發(fā)明一實施例機器人交互服務(wù)器結(jié)構(gòu)示意圖;
圖3為本發(fā)明另一實施例機器人交互控制方法流程圖;
圖4為本發(fā)明一實施例機器人的結(jié)構(gòu)示意圖。
具體實施方式
下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進一步理解的是,本發(fā)明的說明書中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個或多個其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當(dāng)我們稱元件被“連接”或“耦接”到另一元件時,它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無線連接或無線耦接。這里使用的措辭“和/或”包括一個或更多個相關(guān)聯(lián)的列出項的全部或任一單元和全部組合。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(包括技術(shù)術(shù)語和科學(xué)術(shù)語),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語,應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會用理想化或過于正式的含義來解釋。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,這里所使用的“終端”、“終端設(shè)備”既包括無線信號接收器的設(shè)備,其僅具備無發(fā)射能力的無線信號接收器的設(shè)備,又包括接收和發(fā)射硬件的設(shè)備,其具有能夠在雙向通信鏈路上,進行雙向通信的接收和發(fā)射硬件的設(shè)備。這種設(shè)備可以包括:蜂窩或其他通信設(shè)備,其具有單線路顯示器或多線路顯示器或沒有多線路顯示器的蜂窩或其他通信設(shè)備;PCS(Personal Communications Service,個人通信系統(tǒng)),其可以組合語音、數(shù)據(jù)處理、傳真和/或數(shù)據(jù)通信能力;PDA(Personal Digital Assistant,個人數(shù)字助理),其可以包括射頻接收器、尋呼機、互聯(lián)網(wǎng)/內(nèi)聯(lián)網(wǎng)訪問、網(wǎng)絡(luò)瀏覽器、記事本、日歷和/或GPS(Global Positioning System,全球定位系統(tǒng))接收器;常規(guī)膝上型和/或掌上型計算機或其他設(shè)備,其具有和/或包括射頻接收器的常規(guī)膝上型和/或掌上型計算機或其他設(shè)備。這里所使用的“終端”、“終端設(shè)備”可以是便攜式、可運輸、安裝在交通工具(航空、海運和/或陸地)中的,或者適合于和/或配置為在本地運行,和/或以分布形式,運行在地球和/或空間的任何其他位置運行。這里所使用的“終端”、“終端設(shè)備”還可以是通信終端、上網(wǎng)終端、音樂/視頻播放終端,例如可以是PDA、MID(Mobile Internet Device,移動互聯(lián)網(wǎng)設(shè)備)和/或具有音樂/視頻播放功能的移動電話,也可以是智能電視、機頂盒等設(shè)備。
機器人一般由執(zhí)行機構(gòu)、驅(qū)動裝置、檢測裝置和控制系統(tǒng)和復(fù)雜機械等組成,能自動控制,可重復(fù)編程,多功能,有幾個自由度,可固定或運動,用于相關(guān)自動化系統(tǒng)中。
本發(fā)明一實施例提供一種機器人交互控制方法,如圖1所示,該交互控制方法包括下列步驟:
S110:接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù)。
作為實現(xiàn)交互的第一步,首先需要獲取盡量豐富的原始信息,這些原始信息包括使用者各種行為或者指令,也即機器人監(jiān)視對象的各種行為或者指令,包括通過機器人身上安裝的攝像頭獲取到的音視頻內(nèi)容,表現(xiàn)在機器設(shè)備上則是音視頻流,作為擬人化的描述則是機器人“聽到”的聲音和“看到”的圖像,例如機器人上安裝的話筒收錄到監(jiān)視對象的語音,或者安裝的攝像機記錄到一段有關(guān)監(jiān)視對象的動作連續(xù)圖像等,而相關(guān)的傳感器數(shù)據(jù)則是機器人上安裝的各類傳感器采集到的數(shù)據(jù),比如距離傳感器、溫度傳感器、加速度傳感器或氣味傳感器等等,根據(jù)不同的使用場合或者功能,對這些傳感器會有根據(jù)的進行選擇,對應(yīng)地,這些傳感器相當(dāng)于機器人的“感覺”器官,獲得的傳感器數(shù)據(jù)則為其“感覺”。當(dāng)機器人獲取到這些原始數(shù)據(jù)之后,將其上傳交給云端服務(wù)器進行進一步的處理,借助云端服務(wù)器強大的數(shù)據(jù)處理能力以及大數(shù)據(jù)資源,這一處理能夠更加迅速而準(zhǔn)確地進行。優(yōu)選的,機器人上傳數(shù)據(jù)到云端服務(wù)器的方式為實時上傳,對于實際應(yīng)用的機器人,網(wǎng)絡(luò)狀態(tài)良好是可以推測到的基本環(huán)境因素,實時上傳可以實現(xiàn)機器人與云端服務(wù)器的快速溝通機制,使機器人擁有良好的信息處理能力和快速的反應(yīng)性能。
S120:依據(jù)從音視頻流或傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型。
云端服務(wù)器獲取到音視頻流或傳感器數(shù)據(jù)之后對其進行解析處理,分析確定出音視頻流或傳感器數(shù)據(jù)所代表的被監(jiān)視對象表達出的行為模式。每種數(shù)據(jù)信息中總是包括有最根本的特征數(shù)據(jù),據(jù)以區(qū)別不同的行為,這些特征數(shù)據(jù)根據(jù)相關(guān)領(lǐng)域人員的總結(jié)歸納可以形成相關(guān)特征數(shù)據(jù)庫,某種行為由某一種特征數(shù)據(jù)或者某幾種特征數(shù)據(jù)共同構(gòu)成,一些情況下甚至存在包含有同樣種類數(shù)量的特征數(shù)據(jù),而這些特征數(shù)據(jù)的排列先后次序不同,也會使其表示的行為模式不同。將每種行為具備的特征數(shù)據(jù)歸類并將各種行為組合在同一個數(shù)據(jù)庫中形成預(yù)定行為類型庫,當(dāng)云端服務(wù)器解析出音視頻流或傳感器數(shù)據(jù)中的特征數(shù)據(jù),再根據(jù)這些特征數(shù)據(jù)在預(yù)定行為類型庫中查找匹配,找到匹配的特征數(shù)據(jù)相對應(yīng)的行為,即可確定音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型??梢岳斫獾?,某些行為動作包括不止一個特征數(shù)據(jù),而且特征數(shù)據(jù)越多越完善,則描述行為動作越準(zhǔn)確,所以預(yù)定行為類型庫中每一種行為的特征數(shù)據(jù)應(yīng)當(dāng)是不斷更新完善的,同時云端服務(wù)器解析原始數(shù)據(jù)的能力也是不斷精確、細(xì)化和完善的。
優(yōu)選的,依據(jù)從音視頻流中提取的特征數(shù)據(jù)并進一步從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息,將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。一段語音信息中包含有時間、地點、人物、對象或原因等一種或多種關(guān)鍵詞信息,還能夠包括聲音頻率、音調(diào)、音色等音頻特征信息,本領(lǐng)域技術(shù)人員可以做到從音視頻流中的音頻數(shù)據(jù)中妥善分析出這些音頻特征信息或關(guān)鍵詞信息。當(dāng)分析得出這些音頻特征信息或關(guān)鍵詞信息,接下來將其與預(yù)存在云端服務(wù)器中的預(yù)存數(shù)據(jù)相對比,也即在預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息中查找,一旦找出匹配項,就確定出這些預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息對應(yīng)的預(yù)存行為類型,從而云端服務(wù)器也就確定出與音頻數(shù)據(jù)對應(yīng)的行為類型。這一技術(shù)方案使得即使是不知道如何操作計算機的老人或小孩,只要能夠發(fā)出聲音,就能夠向機器人發(fā)出指令,實現(xiàn)與機器人的溝通交互。
優(yōu)選的,依據(jù)從音視頻流中提取的特征數(shù)據(jù)并進一步從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取音視頻流中視頻數(shù)據(jù)的視頻特征幀信息,將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。視頻是一定時間內(nèi)由眾多靜止的畫面組成的,原理上每一副畫面即為一幀,連續(xù)的幀就形成視頻。每一副圖像都有其特征特點,例如其中的基本圖形位置,線條形狀,明暗分布等等,分析畫面特征的技術(shù)即為圖像識別技術(shù),因此通過圖像識別技術(shù)提取出視頻數(shù)據(jù)中的視頻特征幀信息,該視頻特征幀信息由記載行為動作的圖片信息組成,用于記載多種具有典型特征的行為類型,如人的行走、奔跑、站起、坐下、面部表情或者手勢等,每一視頻特征幀信息為記載著一種行為類型中的某一個動作的畫面,包含有表示該動作畫面的基本圖形位置、線條形狀或明暗分部等計算機可識別信息,這樣的視頻特征幀信息往往是多幀信息,并且使在預(yù)定時間內(nèi)連續(xù)的若干數(shù)量,例如一秒鐘內(nèi)的連續(xù)十張,或者0.1秒內(nèi)的連續(xù)十張,時間越短并且數(shù)量越多,則視頻特征幀信息越準(zhǔn)確。在云端服務(wù)器的數(shù)據(jù)庫中有一個是預(yù)設(shè)行為類型庫,預(yù)設(shè)行為類型庫存在著多種行為類型,每個行為類型目錄下包括若干預(yù)存視頻特征幀信息(可以知道,預(yù)存視頻特征幀信息越多,對應(yīng)預(yù)設(shè)行為類型越準(zhǔn)確),預(yù)存視頻特征幀信息即是預(yù)先采集并存儲到計算機中或者網(wǎng)絡(luò)當(dāng)中的視頻特征幀信息,當(dāng)云端服務(wù)器檢測到從音視頻流中提取的視頻特征幀信息與某個行為類型目錄下的預(yù)存視頻特征幀信息相匹配,則確定出該音視頻流中視頻數(shù)據(jù)對應(yīng)的行為類型,當(dāng)然,這種匹配并不是視頻特征信息與預(yù)存視頻特征幀信息百分百相同,而是存在一定的模糊度,依靠計算機圖像識別中的模糊算法來實現(xiàn)這種匹配,更加詳細(xì)具體的方法由與計算機圖像識別相關(guān)的技術(shù)人員通過相關(guān)技術(shù)手段能夠?qū)崿F(xiàn)。這一技術(shù)方案使得即使是不知道如何操作計算機的老人或小孩,也能夠通過動作向機器人發(fā)出指令,實現(xiàn)與機器人的溝通交互。
作為另一個優(yōu)選的方案,依據(jù)從傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;將特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。傳感器數(shù)據(jù)中包含著多種類型的數(shù)據(jù),以不同時段來講,就有空閑段數(shù)據(jù)(傳感器處于待機狀態(tài)的數(shù)據(jù))和工作段數(shù)據(jù),工作段數(shù)據(jù)中必然包含時間數(shù)據(jù)、檢測內(nèi)容數(shù)據(jù)和強度數(shù)據(jù)(衡量檢測內(nèi)容的表現(xiàn)程度,如力的大小、速度快慢)等。根據(jù)一定的算法或處理方法,從傳感器數(shù)據(jù)中提取出特定數(shù)據(jù)字段或信息含義,對于具體的算法或處理方法,有關(guān)傳感器數(shù)據(jù)處理的技術(shù)人員能夠完成。預(yù)定行為類型庫中包含有眾多行為類型,每個行為類型下包括有一個或多個對應(yīng)的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義,云端服務(wù)器依據(jù)傳感器數(shù)據(jù)中提取的數(shù)據(jù)字段或信息含義在預(yù)存數(shù)據(jù)字段或預(yù)存信息含義中檢索,找到匹配項,即能確定出傳感器數(shù)據(jù)對應(yīng)的行為類型。根據(jù)不同的功能需求,機器人上安裝有不同種類的傳感器,例如在家庭當(dāng)中,可能需要檢測室溫或家庭成員的體溫,因此需要有溫度傳感器;也可能需要檢測廚房中是否有天然氣泄漏,因此可以安裝氣體檢測傳感器;也可能需要機器人伴隨某一個家庭成員,實現(xiàn)照看功能,就需要跟隨該家庭成員,因此至少需要用到地理信息傳感器。
S130:從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令。
通過步驟S120確定出音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型之后,依據(jù)該行為類型在云端服務(wù)器數(shù)據(jù)庫中查找,查找對象為預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫。預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括行為類型以及與行為類型對應(yīng)的機器行為指令。當(dāng)匹配出預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中的某種行為類型,即可得出相應(yīng)的機器行為指令并進行下一步的操作。優(yōu)選的,預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù),眾多預(yù)設(shè)行為類型數(shù)據(jù)組合在一起形成預(yù)設(shè)行為類型數(shù)據(jù)表,每一個預(yù)設(shè)行為類型數(shù)據(jù)都對應(yīng)一個機器行為指令表,即預(yù)設(shè)行為類型數(shù)據(jù)與機器行為指令之間具有映射關(guān)系,當(dāng)然這種映射關(guān)系并不是一一映射關(guān)系,可能多個不同的行為類型都對應(yīng)同一個機器行為指令,比如語音行為“拿杯子”,和用手勢表示相同的意思,最終的機器行為指令都可能是為了實現(xiàn)“拿來杯子”。從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令的具體步驟為:以行為類型為關(guān)鍵詞,檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。當(dāng)然,這里確定的方式也可以是計算得出,通過機器人對關(guān)鍵詞信息的判斷,對相關(guān)信息進行對應(yīng)處理獲得機器行為指令,例如“遞杯子給我”這一行為,機器人獲知“杯子”這一具體物,以及杯子的位置,獲知“我”這一對象的含義,以及“我”的位置,通過自身位置判斷,以及各種情景對象所在環(huán)境的地理信息,計算得出機器行為指令,并可以通過執(zhí)行該機器行為指令完成相關(guān)的任務(wù)。當(dāng)預(yù)設(shè)行為類型或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫越豐富,機器人能夠反饋的行為就越豐富,因此預(yù)設(shè)行為類型庫和/或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫需要有不斷的更新和補充,更新和補充的方式要么可以直接在云端服務(wù)器上進行相關(guān)的設(shè)定、補充或者更新,也可以通過與云端服務(wù)器關(guān)聯(lián)的用戶進行設(shè)定或者更新,使得預(yù)設(shè)行為類型數(shù)據(jù)庫和/或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫的數(shù)據(jù)來源更加豐富,也能夠更加貼近實際,這一技術(shù)方案使得相關(guān)技術(shù)人員利用互聯(lián)網(wǎng)大數(shù)據(jù)充分分析人類行為的細(xì)節(jié),不斷完善預(yù)設(shè)行為類型數(shù)據(jù)庫,使機器人的智能化充分提高,使其擬人化的程度也更加充分。
優(yōu)選的,及其行為指令包括:語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。面對人類多種表達方式,機器人也應(yīng)當(dāng)具有多種行為表現(xiàn)方式,或者以聲音表達,比如當(dāng)人類提出讓機器人播放某一段聲音時,向機器人發(fā)出指令“學(xué)一下鴨子叫”,然后機器人接收該指令并上傳,經(jīng)過云端服務(wù)器處理后,輸出機器指令“播放鴨子的叫聲”,該指令驅(qū)動機器人開啟發(fā)聲單元播放對應(yīng)音頻?;蛘邫C器人捕捉到人的某些表情,比如微笑,經(jīng)過上傳到服務(wù)器,服務(wù)器分析處理獲得相對應(yīng)的機器指令,能夠驅(qū)動機器人相對應(yīng)的視頻播放接口播放一段歡快的視頻,或者顯示出笑臉的表情,亦或是得出相對應(yīng)的動作執(zhí)行指令,能夠驅(qū)動機器人運動單元,比如手,指示手臂、手掌相關(guān)機器部件形成拍手動作。這些類型的機器指令即可能單獨運行,也可以同時運行,比如當(dāng)人對機器人說出“我們跳一段舞蹈吧”,然后機器人將該語音信息數(shù)據(jù)上傳給服務(wù)器,服務(wù)器做出判斷后,發(fā)出機器行為指令,該機器行為指令可以使機器人的音響系統(tǒng)播放音樂,也使視頻播放接口比如顯示屏播放對應(yīng)的舞蹈畫面,或者做出表情,并且可以驅(qū)動機器人相關(guān)運動單元,比如腿部運動單元和手部運動單元一起隨音樂運動。這些機器行為指令的內(nèi)容是相關(guān)領(lǐng)域技術(shù)人員通過編程可以實現(xiàn)的。
S140:發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
機器行為指令產(chǎn)生后仍然在云端服務(wù)器,最終目的是要使機器人反饋其監(jiān)視對象的某種行為,因此云端服務(wù)器處理得出的行為指令需要立即傳輸?shù)綑C器人上,機器人根據(jù)該機器行為指令執(zhí)行相應(yīng)的輸出行為,向其監(jiān)視對象表現(xiàn)出相應(yīng)的反饋。行為指令的執(zhí)行有直接依據(jù)詳細(xì)的行為指令所包含的代碼來進行,例如簡單的播放一段音樂指令,或者播放一段視頻的行為指令,也能夠通過機器人本身的計算處理能力,依據(jù)該行為指令通過內(nèi)置計算機計算出實際的各部件可執(zhí)行代碼,例如當(dāng)行為指令是“拿一本書”時,機器人根據(jù)自身的位置,書柜的位置,所處房間的布局,以及這些對象之間的距離等計算判斷并執(zhí)行。
作為一種優(yōu)選的方案,當(dāng)傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù)時,云端服務(wù)器對地理信息傳感器數(shù)據(jù)的處理如下:當(dāng)傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取其中的地理信息數(shù)據(jù),將地理信息數(shù)據(jù)與預(yù)存在服務(wù)器中的預(yù)存地理信息數(shù)據(jù)相匹配,確定出該地理信息數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,而所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。例如,當(dāng)需要機器人成為家庭成員中某一個人的伙伴時(通常為老人或兒童),就設(shè)定該機器人常伴在其設(shè)定監(jiān)視對象的一定距離范圍內(nèi),當(dāng)該監(jiān)視對象運動時,機器人也會相應(yīng)的運動,并且仍然與該監(jiān)視對象重新保持設(shè)定的距離范圍。當(dāng)監(jiān)視對象移動之后,超出了該設(shè)定的距離范圍,機器人身上的地理信息傳感器會獲取到監(jiān)視對象的地理信息,比如間距、經(jīng)緯度、有無障礙物、或者相對坐標(biāo)等,上傳這些信息到云端服務(wù)器之后,云端服務(wù)器進行相應(yīng)處理或計算,得出機器人需要執(zhí)行的對應(yīng)機器行為指令,這些行為指令包括有需要移動的速率、移動的方向和移動的距離或者路徑等等內(nèi)容,最終實現(xiàn)隨監(jiān)視對象的移動改變其自身的地理信息(相對于監(jiān)視對象的位置或距離等),繼續(xù)保持與監(jiān)視對象的距離在一定范圍之內(nèi),完成對監(jiān)視對象的陪伴。
作為另一優(yōu)選的方案,傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。通過在機器人上設(shè)置觸屏傳感器,如現(xiàn)在的觸控屏就是一種很典型的觸控傳感器設(shè)備,在其上設(shè)置若干常用的指令選項,當(dāng)機器人的監(jiān)視對象對觸控屏上的某一指令進行選擇后,機器人將選擇信息上傳到云端服務(wù)器,云端服務(wù)器提取出其中代表的觸控操作信息并生成對應(yīng)的行為類型,之后再根據(jù)該行為類型確定出相對應(yīng)的機器行為指令并交由機器人執(zhí)行。此技術(shù)方案可以降低指令執(zhí)行難度,減輕云端服務(wù)器處理負(fù)擔(dān),使云端服務(wù)器處理數(shù)據(jù)速度更快,指令輸出更加準(zhǔn)確,也最終使得機器人更快反饋被監(jiān)視對象的指令。
優(yōu)選的,通常機器人是一種貴重的設(shè)備,身份識別是其往往需要具備的功能,從機器人被開發(fā)出來到應(yīng)用,其接觸的對象有許多,例如在組裝完成后的調(diào)試階段,需要接觸研發(fā)人員、調(diào)試人員等,而在使用時,又會遇到不同身份的使用者,這些人員相對于機器人應(yīng)當(dāng)有不同的權(quán)限級別,在相應(yīng)的權(quán)限級別內(nèi)會相應(yīng)具有這一級別允許的指令修改權(quán)限、系統(tǒng)更新權(quán)限或者使用權(quán)限等,因此,在接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到機器人上傳的生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。在機器人接收音視頻流或相關(guān)傳感器數(shù)據(jù)并進行相應(yīng)操作的行為之前設(shè)置一步身份驗證操作,使得機器人識別出其監(jiān)視對象的身份,待確認(rèn)對應(yīng)的權(quán)限后再進行后續(xù)操作。例如,面對家庭成員,機器人會按照預(yù)存生物特征信息的身份權(quán)限聽取命令并執(zhí)行動作,而對于臨時客人,機器人則識別出其預(yù)存生物特征信息中并不包括該臨時客人的生物特征信息,將不會聽取該臨時客人的指令,或者依據(jù)臨時客人對應(yīng)的指令執(zhí)行動作,比如問好。優(yōu)選的,生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。通過生物特征信息能夠獲得準(zhǔn)確的身份驗證操作,而且這些生物特征信息的采集都十分方便。
適應(yīng)前述的方法,基于模塊化思維,本發(fā)明的一實施例提供一種機器人交互服務(wù)器,如圖2所示,包括:
接收模塊110,用于接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù)。待機器人通過自身的攝像錄音接口以及各項傳感器獲取到數(shù)據(jù)之后,將其通過接收模塊110上傳到云端服務(wù)器當(dāng)中。
解析模塊120,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型。云端服務(wù)器通過接收模塊110獲取到音視頻流或傳感器數(shù)據(jù)之后對其進行解析處理,分析確定出音視頻流或傳感器數(shù)據(jù)所代表的被監(jiān)視對象表達出的行為模式。每種數(shù)據(jù)信息中總是包括有最根本的特征數(shù)據(jù),據(jù)以區(qū)別不同的行為,這些特征數(shù)據(jù)根據(jù)相關(guān)領(lǐng)域人員的總結(jié)歸納可以形成相關(guān)特征數(shù)據(jù)庫,某種行為由某一種特征數(shù)據(jù)或者某幾種特征數(shù)據(jù)共同構(gòu)成,一些情況下甚至存在包含有同樣種類數(shù)量的特征數(shù)據(jù),而這些特征數(shù)據(jù)的排列先后次序不同,也會使其表示的行為模式不同。將每種行為具備的特征數(shù)據(jù)歸類并將各種行為組合在同一個數(shù)據(jù)庫中形成預(yù)定行為類型庫,當(dāng)云端服務(wù)器解析出音視頻流或傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),再根據(jù)這些特征數(shù)據(jù)在預(yù)定行為類型庫中查找匹配,找到匹配的特征數(shù)據(jù)相對應(yīng)的行為,即可確定音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型。
數(shù)據(jù)生成模塊130,用于從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令。通過解析模塊120確定出音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型之后,數(shù)據(jù)生成模塊130依據(jù)該行為類型在云端服務(wù)器數(shù)據(jù)庫中查找,查找對象為預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫。預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括行為類型以及與行為類型對應(yīng)的機器行為指令。當(dāng)匹配出預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中的某種行為類型,數(shù)據(jù)生成模塊130即可得出相應(yīng)的機器行為指令并進行下一步的操作。
發(fā)送模塊140,用于發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。機器行為指令產(chǎn)生后仍然在云端服務(wù)器,最終目的是要使機器人反饋其監(jiān)視對象的某種行為,因此云端服務(wù)器處理得出的行為指令需要立即傳輸?shù)綑C器人上,然后機器人根據(jù)該機器行為指令執(zhí)行相應(yīng)的輸出行為,向其監(jiān)視對象表現(xiàn)出相應(yīng)的反饋。
本發(fā)明一實施例提供的機器人交互控制方法以及服務(wù)器使得機器人的智能水平大幅度提高,讓人與機器的交互更加便利,依靠機器人自身的音頻、視頻或者傳感器設(shè)備分析其監(jiān)視對象的某些動作、語言,甚至是表情,就能夠做出對應(yīng)的反饋行為,從而使人能夠通過多種形式與機器人實現(xiàn)交互。
本發(fā)明另一實施例提供了一種機器人交互控制方法,如圖3所示,該交互控制方法包括下列步驟:
S210:獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù)。
現(xiàn)今計算機技術(shù)發(fā)展讓人瞠目結(jié)舌,體積小而性能強大的芯片層出不窮,因而可以逐步使機器人自身直接作為信息接收、信息處理和信息執(zhí)行的統(tǒng)一體,而將云端服務(wù)器作為一種補充,能夠使信息處理的效率大幅度提高。在本實施例中,作為實現(xiàn)交互的第一步,首先需要機器人獲取盡量豐富的原始信息,這些原始信息包括使用者各種行為或者指令,也即機器人監(jiān)視對象的各種行為或者指令,包括通過機器人身上安裝的攝像頭獲取到的音視頻內(nèi)容,表現(xiàn)在機器設(shè)備上則是音視頻流,作為擬人化的描述則是機器人“聽到”的聲音和“看到”的圖像,例如機器人上安裝的話筒收錄到監(jiān)視對象的語音,或者安裝的攝像機記錄到一段有關(guān)監(jiān)視對象的動作連續(xù)圖像等,而相關(guān)的傳感器數(shù)據(jù)則是機器人上安裝的各類傳感器采集到的數(shù)據(jù),比如距離傳感器、溫度傳感器、加速度傳感器或氣味傳感器等等,根據(jù)不同的使用場合或者功能,對這些傳感器會有根據(jù)的進行選擇,對應(yīng)地,這些傳感器相當(dāng)于機器人的“感覺”器官,獲得的傳感器數(shù)據(jù)則為其“感覺”。當(dāng)機器人獲取到這些原始數(shù)據(jù)之后,將其傳輸?shù)狡渌幚砟K進行進一步的處理,借助自身攜帶的計算機的強大數(shù)據(jù)處理能力,這一處理能夠迅速而準(zhǔn)確地進行。
S220:依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型。
機器人獲取到音視頻流或傳感器數(shù)據(jù)之后對其進行解析處理,分析確定出音視頻流或傳感器數(shù)據(jù)所代表的被監(jiān)視對象表達出的行為模式。每種數(shù)據(jù)信息中總是包括有最根本的特征數(shù)據(jù),據(jù)以區(qū)別不同的行為,這些特征數(shù)據(jù)根據(jù)相關(guān)領(lǐng)域人員的總結(jié)歸納可以形成相關(guān)特征數(shù)據(jù)庫,某種行為由某一種特征數(shù)據(jù)或者某幾種特征數(shù)據(jù)共同構(gòu)成,一些情況下甚至存在包含有同樣種類數(shù)量的特征數(shù)據(jù),而這些特征數(shù)據(jù)的排列先后次序不同,也會使其表示的行為模式不同。將每種行為具備的特征數(shù)據(jù)歸類并將各種行為組合在同一個數(shù)據(jù)庫中形成預(yù)定行為類型庫,當(dāng)機器人解析出音視頻流或傳感器數(shù)據(jù)中的特征數(shù)據(jù),再根據(jù)這些特征數(shù)據(jù)在預(yù)定行為類型庫中查找匹配,找到匹配的特征數(shù)據(jù)相對應(yīng)的行為,即可確定音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型??梢岳斫獾?,某些行為動作包括不止一個特征數(shù)據(jù),而且特征數(shù)據(jù)越多越完善,則描述行為動作越準(zhǔn)確,所以預(yù)定行為類型庫中每一種行為的特征數(shù)據(jù)應(yīng)當(dāng)是不斷更新完善的,同時機器人解析原始數(shù)據(jù)的能力也是不斷精確、細(xì)化和完善的。
優(yōu)選的,依據(jù)從音視頻流中提取的特征數(shù)據(jù)并進一步從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息,將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。一段語音信息中包含有時間、地點、人物、對象或原因等一種或多種關(guān)鍵詞信息,還能夠包括聲音頻率、音調(diào)、音色等音頻特征信息,本領(lǐng)域技術(shù)人員可以做到從音視頻流中的音頻數(shù)據(jù)中妥善分析出這些音頻特征信息或關(guān)鍵詞信息。當(dāng)分析得出這些音頻特征信息或關(guān)鍵詞信息,接下來將其與預(yù)存在云端服務(wù)器中的預(yù)存數(shù)據(jù)相對比,也即在預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息中查找,一旦找出匹配項,就確定出這些預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息對應(yīng)的預(yù)存行為類型,從而機器人也就確定出與音頻數(shù)據(jù)對應(yīng)的行為類型。例如,機器人聽到所監(jiān)視對象發(fā)出的聲音“幫我把桌子上的杯子遞給我”,機器人會提取出關(guān)鍵信息“把桌子上的杯子遞給我”,或者更進一步為服務(wù)對象“我”、操作對象“杯子”、操作對象位置信息“桌子”、操作內(nèi)容“遞”等等,實際音頻特征信息或關(guān)鍵詞信息提取并不局限于這一方式,可以根據(jù)實際需要進行更恰當(dāng)?shù)牟僮鳎缓髾C器人根據(jù)這些關(guān)鍵詞在預(yù)定行為類型庫中查找,找到與之對應(yīng)的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息,從而確定出行為類型為“向‘我’傳遞杯子”。本技術(shù)方案使得即使是不知道如何操作計算機的老人或小孩,也能夠通過自身的某些動作向機器人發(fā)出指令,實現(xiàn)與機器人的交互溝通。
優(yōu)選的,依據(jù)從音視頻流中提取的特征數(shù)據(jù)并進一步從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取音視頻流中視頻數(shù)據(jù)的視頻特征幀信息,將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。視頻是一定時間內(nèi)由眾多靜止的畫面組成的,原理上每一副畫面即為一幀,連續(xù)的幀就形成視頻。每一副圖像都有其特征特點,例如其中的基本圖形位置,線條形狀,明暗分布等等,分析畫面特征的技術(shù)即為圖像識別技術(shù),因此通過圖像識別技術(shù)提取出視頻數(shù)據(jù)中的視頻特征幀信息,這樣的視頻特征幀信息往往是多幀信息。在云端服務(wù)器的數(shù)據(jù)庫中有一個是預(yù)設(shè)行為類型庫,預(yù)設(shè)行為類型庫存在著多種行為類型,每個行為類型目錄下包括若干預(yù)存視頻特征幀信息(可以知道,預(yù)存視頻特征幀信息越多,對應(yīng)預(yù)設(shè)行為類型越準(zhǔn)確),當(dāng)云端服務(wù)器檢測到從音視頻流中提取的視頻特征幀信息與某個行為類型目錄下的預(yù)存視頻特征幀信息相匹配,則確定出該音視頻流中視頻數(shù)據(jù)對應(yīng)的行為類型。例如,當(dāng)機器人的攝像頭捕捉到其監(jiān)視對象——兒童哭泣的畫面,機器人則分析這一包含兒童哭泣內(nèi)容的視頻流,提取其中的視頻特征幀信息,該視頻特征幀信息可能包括一幅幅兒童面部流眼淚或者哭泣表情的畫面,將其與機器人自身數(shù)據(jù)庫中預(yù)存的視頻特征幀信息相對比,匹配到這一兒童帶有哭泣面部特征的預(yù)存視頻特征幀信息,就對應(yīng)判斷到該兒童處于哭泣狀態(tài)?;蛘呃?,某一機器人監(jiān)視對象向機器人發(fā)出手掌橫放手指并攏并且向左的手勢,機器人捕捉到這一信息,分析出帶有手掌橫放手指并攏并且向左的手勢的視頻特征幀信息,在自身預(yù)存行為類型庫中查找,找到“向左行走”這一預(yù)存行為類型目錄下預(yù)存的具有同樣特征的視頻特征幀信息,從而對應(yīng)判斷出監(jiān)視對象希望其向左運動的行為類型。綜上所述,這一技術(shù)方案使得即使是不知道如何操作計算機的老人或小孩,也能夠通過自身的某些動作向機器人發(fā)出指令,實現(xiàn)與機器人的溝通交互。
作為另一個優(yōu)選的方案,依據(jù)從傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的具體方法為:提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;將特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。傳感器數(shù)據(jù)中包含著多種類型的數(shù)據(jù),以不同時段來講,就有空閑段數(shù)據(jù)(傳感器處于待機狀態(tài)的數(shù)據(jù))和工作段數(shù)據(jù),工作段數(shù)據(jù)中必然包含時間數(shù)據(jù)、檢測內(nèi)容數(shù)據(jù)和強度數(shù)據(jù)(衡量檢測內(nèi)容的表現(xiàn)程度,如力的大小、速度快慢)等。根據(jù)一定的算法或處理方法,從傳感器數(shù)據(jù)中提取出特定數(shù)據(jù)字段或信息含義,對于具體的算法或處理方法,有關(guān)傳感器數(shù)據(jù)處理的技術(shù)人員能夠完成。預(yù)定行為類型庫中包含有眾多行為類型,每個行為類型下包括有一個或多個對應(yīng)的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義,機器人依據(jù)傳感器數(shù)據(jù)中提取的數(shù)據(jù)字段或信息含義在預(yù)存數(shù)據(jù)字段或預(yù)存信息含義中檢索,找到匹配項,即能確定出傳感器數(shù)據(jù)對應(yīng)的行為類型。根據(jù)不同的功能需求,機器人上安裝有不同種類的傳感器,例如在家庭當(dāng)中,可能需要檢測室溫或家庭成員的體溫,因此需要有溫度傳感器;也可能需要檢測廚房中是否有天然氣泄漏,因此可以安裝氣體檢測傳感器;也可能需要機器人伴隨某一個家庭成員,實現(xiàn)照看功能,就需要跟隨該家庭成員,因此至少需要用到地理信息傳感器。
S230:從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令。
通過步驟S220確定出音視頻流或傳感器數(shù)據(jù)對應(yīng)的行為類型之后,依據(jù)該行為類型在機器人數(shù)據(jù)庫中查找,查找對象為預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫。預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括行為類型以及與行為類型對應(yīng)的機器行為指令。當(dāng)匹配出預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中的某種行為類型,即可得出相應(yīng)的機器行為指令并進行下一步的操作。優(yōu)選的,預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù),眾多預(yù)設(shè)行為類型數(shù)據(jù)組合在一起形成預(yù)設(shè)行為類型數(shù)據(jù)表,每一個預(yù)設(shè)行為類型數(shù)據(jù)都對應(yīng)一個機器行為指令表,即預(yù)設(shè)行為類型數(shù)據(jù)與機器行為指令之間具有映射關(guān)系,當(dāng)然這種映射關(guān)系并不是一一映射關(guān)系,可能多個不同的行為類型都對應(yīng)同一個機器行為指令,比如語音行為“拿杯子”,和用手勢表示相同的意思,最終的機器行為指令都可能是為了實現(xiàn)“拿來杯子”。從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令的具體步驟為:以行為類型為關(guān)鍵詞,檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。當(dāng)然,這里確定的方式也可以是計算得出,通過機器人對關(guān)鍵詞信息的判斷,對相關(guān)信息進行對應(yīng)處理獲得機器行為指令,例如“遞杯子給我”這一行為,機器人獲知“杯子”這一具體物,以及杯子的位置,獲知“我”這一對象的含義,以及“我”的位置,通過自身位置判斷,以及各種情景對象所在環(huán)境的地理信息,計算得出機器行為指令,并可以通過執(zhí)行該機器行為指令完成相關(guān)的任務(wù),更深程度的實現(xiàn)方法本技術(shù)領(lǐng)域的技術(shù)人員通過編程可以實現(xiàn)。當(dāng)預(yù)設(shè)行為類型或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫越豐富,機器人能夠反饋的行為就越豐富,因此預(yù)設(shè)行為類型庫和/或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫需要有不斷的更新和補充,更新和補充的方式要么可以直接由用戶在機器人上提供的界面中進行相關(guān)的設(shè)定、補充或者更新,也可以通過與云端服務(wù)器相聯(lián)并進行下載更新,使得預(yù)設(shè)行為類型數(shù)據(jù)庫和/或預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫的數(shù)據(jù)來源更加豐富,也能夠更加貼近實際,這一技術(shù)方案使得相關(guān)技術(shù)人員利用互聯(lián)網(wǎng)大數(shù)據(jù)充分分析人類行為的細(xì)節(jié),不斷完善預(yù)設(shè)行為類型數(shù)據(jù)庫,使機器人的智能化充分提高,使其擬人化的程度也更加充分。
優(yōu)選的,及其行為指令包括:語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。面對人類多種表達方式,機器人也應(yīng)當(dāng)具有多種行為表現(xiàn)方式,或者以聲音表達,比如當(dāng)人類提出讓機器人播放某一段聲音時,向機器人發(fā)出指令“我們一起唱國歌”,然后機器人接收該指令,經(jīng)過處理后,輸出機器指令“播放國歌”,該指令驅(qū)動機器人開啟發(fā)聲單元播放對應(yīng)音頻?;蛘邫C器人捕捉到人的某些表情,比如微笑,經(jīng)過分析處理獲得相對應(yīng)的機器指令,能夠驅(qū)動機器人相對應(yīng)的視頻播放接口播放一段歡快的視頻,或者顯示出笑臉的表情,亦或是得出相對應(yīng)的動作執(zhí)行指令,能夠驅(qū)動機器人運動單元,比如手,指示手臂、手掌相關(guān)機器部件形成拍手動作。這些類型的機器指令即可能單獨運行,也可以同時運行,比如當(dāng)人對機器人說出“我們跳一段舞蹈吧”,然后機器人針對該語音信息數(shù)據(jù)做出判斷后,發(fā)出機器行為指令,該機器行為指令可以使機器人的音響系統(tǒng)播放音樂,也使視頻播放接口比如顯示屏播放對應(yīng)的舞蹈畫面,或者做出表情,并且可以驅(qū)動機器人相關(guān)運動單元,比如腿部運動單元和手部運動單元一起隨音樂運動。這些機器行為指令的內(nèi)容是相關(guān)領(lǐng)域技術(shù)人員通過編程可以實現(xiàn)的。
S240:依據(jù)所述機器行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
機器人確定出機器行為指令之后,還需要傳輸?shù)狡渥陨砀鱾€部件上去執(zhí)行,比如聲音播放接口、視頻播放接口和/或相關(guān)的運動部件(如各種伺服電機)。行為指令的執(zhí)行有直接依據(jù)詳細(xì)的行為指令所包含的代碼來進行,例如簡單的播放一段音樂指令,或者播放一段視頻的行為指令,也能夠通過機器人本身的計算處理能力,依據(jù)該行為指令通過內(nèi)置計算機計算出實際的各部件可執(zhí)行代碼,例如當(dāng)行為指令是“到臥室的桌子旁邊去”時,機器人根據(jù)自身的位置,臥室的位置,臥室桌子的位置,所處整個房間的布局,以及這些對象之間的距離等計算判斷并執(zhí)行。
作為一種優(yōu)選的方案,當(dāng)傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù)時,機器人對地理信息傳感器數(shù)據(jù)的處理如下:當(dāng)傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取其中的地理信息數(shù)據(jù),將地理信息數(shù)據(jù)與預(yù)存在機器人中的預(yù)存地理信息數(shù)據(jù)相匹配,確定出該地理信息數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,而所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。例如,當(dāng)需要機器人成為家庭成員中某一個人的伙伴時(通常為老人或兒童),就設(shè)定該機器人常伴在其設(shè)定監(jiān)視對象的一定距離范圍內(nèi),當(dāng)該監(jiān)視對象運動時,機器人也會相應(yīng)的運動,并且仍然與該監(jiān)視對象重新保持設(shè)定的距離范圍。當(dāng)監(jiān)視對象移動之后,超出了該設(shè)定的距離范圍,機器人身上的地理信息傳感器會獲取到監(jiān)視對象的地理信息,比如間距、經(jīng)緯度、有無障礙物、或者相對坐標(biāo)等,機器人進行相應(yīng)處理或計算,得出機器人需要執(zhí)行的對應(yīng)機器行為指令,這些行為指令包括有需要移動的速率、移動的方向和移動的距離或者路徑等等內(nèi)容,最終實現(xiàn)隨監(jiān)視對象的移動改變其自身的地理信息(相對于監(jiān)視對象的位置或距離等),繼續(xù)保持與監(jiān)視對象的距離在一定范圍之內(nèi),完成對監(jiān)視對象的陪伴。
作為另一優(yōu)選的方案,傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。通過在機器人上設(shè)置觸屏傳感器,如現(xiàn)在的觸控屏就是一種很典型的觸控傳感器設(shè)備,在其上設(shè)置若干常用的指令選項,當(dāng)機器人的監(jiān)視對象對觸控屏上的某一指令進行選擇后,機器人提取出其中代表的觸控操作信息并生成對應(yīng)的行為類型,之后再根據(jù)該行為類型確定出相對應(yīng)的機器行為指令并交由機器人相關(guān)部件執(zhí)行。此技術(shù)方案可以降低指令執(zhí)行難度,減輕機器人內(nèi)置計算機的負(fù)擔(dān),使機器人處理數(shù)據(jù)速度更快,指令輸出更加準(zhǔn)確,也最終使得機器人更快反饋被監(jiān)視對象的指令。
優(yōu)選的,通常機器人是一種貴重的設(shè)備,身份識別是其往往需要具備的功能,從機器人被開發(fā)出來到應(yīng)用,其接觸的對象有許多,例如在組裝完成后的調(diào)試階段,需要接觸研發(fā)人員、調(diào)試人員等,而在使用時,又會遇到不同身份的使用者,這些人員相對于機器人應(yīng)當(dāng)有不同的權(quán)限級別,在相應(yīng)的權(quán)限級別內(nèi)會相應(yīng)具有這一級別允許的指令修改權(quán)限、系統(tǒng)更新權(quán)限或者使用權(quán)限等,因此,在接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到機器人上傳的生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。在機器人接收音視頻流或相關(guān)傳感器數(shù)據(jù)并進行相應(yīng)操作的行為之前設(shè)置一步身份驗證操作,使得機器人識別出其監(jiān)視對象的身份,待確認(rèn)對應(yīng)的權(quán)限后再進行后續(xù)操作。例如,面對家庭成員,機器人會按照預(yù)存生物特征信息的身份權(quán)限聽取命令并執(zhí)行動作,而對于臨時到來的客人,機器人則識別出其預(yù)存生物特征信息中并不包括該臨時客人的生物特征信息,將不會聽取該客人的指令,或者依據(jù)與客人對應(yīng)的預(yù)設(shè)指令執(zhí)行動作,比如問好等。優(yōu)選的,生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。通過生物特征信息能夠獲得準(zhǔn)確的身份驗證操作,而且這些生物特征信息的采集都十分方便。
適應(yīng)前述的方法,基于模塊化思維,本發(fā)明的另一實施例提供一種機器人,如圖4所示,包括:
獲取模塊210,用于獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù)。
分析模塊220,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型,再從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令。
執(zhí)行模塊230,用于依據(jù)所述行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
本發(fā)明的另一實施例提供的機器人交互方法及機器人可以更好實現(xiàn)人與機器人的交互,使其不僅保證機器人具有更高的智能化水平,而且處理問題的效率更快,使機器人擬人化程度也更高。另外,機器人合理利用云端大數(shù)據(jù)的優(yōu)勢,不斷更新自身對行為判斷以及應(yīng)對的數(shù)據(jù)類別和數(shù)量,使其能夠應(yīng)對的問題更加廣泛、更加深入和準(zhǔn)確,最終實現(xiàn)人與機器人的良好交互。
為便于本領(lǐng)域技術(shù)人員更容易理解本發(fā)明的實現(xiàn)方式,以下示例敘述實際場景中如何完成人與機器人的交互。
情景之一:在網(wǎng)絡(luò)狀態(tài)良好的家庭中,小孩子對伴隨其身邊的機器人說:“我想喝水。”,機器人通過安裝在其頭部的麥克風(fēng)捕捉到這一語音信息,立即通過網(wǎng)絡(luò)將此語音信息發(fā)送到云端服務(wù)器,云端服務(wù)器向機器人發(fā)送出給小孩子倒一杯水的行為指令,機器人獲取到之后,按照這一行為指令驅(qū)動自身各種運動部件運轉(zhuǎn),最終到飲水機或飲水瓶出獲取到一杯水,送到小孩子身邊。
情景之二:在網(wǎng)絡(luò)狀態(tài)良好的家庭中,小孩子從臥室的椅子上下來,走到客廳的沙發(fā),作為其伴隨者的機器人獲取到小孩子位置的變化,其與小孩子的間距超過了一定的范圍,于是機器人將此信息立即發(fā)送到云端服務(wù)器,服務(wù)器經(jīng)過處理后判斷小孩子的位置在變動,向機器人發(fā)出行為指令,機器人各部件依據(jù)該行為指令運動,跟隨上小孩子,如果小孩是跑著到的客廳,那么機器人行進速度相對較大,而如果是爬著去的,則其行進速度相對較小,直到二者間距重新符合一定的范圍。
情景之三:在網(wǎng)絡(luò)狀態(tài)良好的家庭中,家中一天突然來了客人,作為家庭成員的機器人通過攝像頭捕捉到該客人的面部影像,并立即將此面部影像上傳到服務(wù)器,服務(wù)器通過對比識別出該客人的身份,向機器人發(fā)出行為指令,如果該客人是熟人,則行為指令中包括招待的動作,指引該客人到指定區(qū)域休息,如果該客人是陌生人,則行為指令中包括禮貌招呼用語并通過音頻播放接口播放,同時開始記錄該陌生人的一系列動作信息。
或者是這樣的過程:
在家庭中,機器人是小孩子的伙伴,當(dāng)小孩子在戶外的時候,機器人通過測量與小孩子的間距以及小孩子的運動速度,確定自己的運動速度以及與小孩子的間距,當(dāng)小孩子指著一朵花問“這是什么花?”,機器人身上的麥克風(fēng)獲取到這一聲音信息,并判斷出小孩子想要獲取信息的行為,再通過其身上的攝像單元觀察到小孩子的指向,并確定小孩子詢問的對象,進一步在自身數(shù)據(jù)庫中查找出與該對象相關(guān)的信息,并通過語音播放的形式向小孩子講解其所指花朵的相關(guān)信息,比如名稱、品種等。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以用計算機程序指令來實現(xiàn)這些結(jié)構(gòu)圖和/或框圖和/或流圖中的每個框以及這些結(jié)構(gòu)圖和/或框圖和/或流圖中的框的組合。本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以將這些計算機程序指令提供給通用計算機、專業(yè)計算機或其他可編程數(shù)據(jù)處理方法的處理器來實現(xiàn),從而通過計算機或其他可編程數(shù)據(jù)處理方法的處理器來執(zhí)行本發(fā)明公開的結(jié)構(gòu)圖和/或框圖和/或流圖的框或多個框中指定的方案。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的步驟、措施、方案可以被交替、更改、組合或刪除。進一步地,具有本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。進一步地,現(xiàn)有技術(shù)中的具有與本發(fā)明中公開的各種操作、方法、流程中的步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。
以上所述僅是本發(fā)明的部分實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。綜上所述,本發(fā)明所提供的技術(shù)方案如下所述:
A1、一種機器人交互控制方法,包括以下步驟:
接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
發(fā)送所述機器行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
A2、根據(jù)A1所述的機器人交互控制方法,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息;
將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。
A3、根據(jù)1所述的機器人交互控制方法,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中視頻數(shù)據(jù)的視頻特征幀信息;
將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。
A4、根據(jù)A3所述的機器人交互控制方法,所述視頻特征幀信息由記載行為動作的圖片信息組成,預(yù)定時間內(nèi)連續(xù)的若干數(shù)量所述圖片信息即為所述視頻特征幀信息。
A5、根據(jù)A1所述的機器人互動方法,所述依據(jù)傳感器數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;
將所述特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。
A6、根據(jù)A5所述的機器人交互控制方法,所述傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取所述地理信息傳感器數(shù)據(jù)中的地理信息數(shù)據(jù),將所述地理信息數(shù)據(jù)與預(yù)存地理信息數(shù)據(jù)相匹配,據(jù)以確定所述地理信息傳感器數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。
A7、根據(jù)A5所述的機器人交互控制方法,所述傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。
A8、根據(jù)A1所述的機器人互動方法,所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù)表,和與預(yù)設(shè)行為類型數(shù)據(jù)表具有映射關(guān)系的機器行為指令表;所述從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令的具體步驟為:
以所述行為類型為關(guān)鍵詞檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。
A9、根據(jù)A1所述的機器人交互控制方法,所述機器行為指令包括:
語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或
視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或
動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。
A10、根據(jù)A1所述的機器人交互方法,在接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到機器人上傳的生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。
A11、根據(jù)A10所述的機器人交互方法,所述生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。
A12、根據(jù)A1所述的機器人交互控制方法,所述預(yù)設(shè)行為類型庫和/或所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫由云端服務(wù)器或與云端服務(wù)器關(guān)聯(lián)的用戶設(shè)定或更新。
A13、根據(jù)A1所述的機器人交互控制方法,所述上傳方式為實時上傳。
B14、一種機器人交互控制方法,包括以下步驟:
獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
依據(jù)所述機器行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
B15、根據(jù)B14所述的機器人交互控制方法,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中音頻數(shù)據(jù)的音頻特征信息或關(guān)鍵詞信息;
將所述特征信息或關(guān)鍵詞信息與預(yù)定行為類型庫中的預(yù)存音頻特征信息或預(yù)存關(guān)鍵詞信息相匹配,據(jù)以確定所述音頻數(shù)據(jù)對應(yīng)的行為類型。
B16、根據(jù)B14所述的機器人交互控制方法,所述依據(jù)從所述音視頻流中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述音視頻流中視頻數(shù)據(jù)的視頻特征幀信息;
將所述視頻特征幀信息與預(yù)定行為類型庫中的預(yù)存視頻特征幀信息相匹配,據(jù)以確定所述視頻數(shù)據(jù)對應(yīng)的行為類型。
B17、根據(jù)B14所述的機器人交互控制方法,所述依據(jù)傳感器數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型的步驟包括:
提取所述傳感器數(shù)據(jù)中的特定數(shù)據(jù)字段或信息含義;
將所述特定數(shù)據(jù)字段或所述信息含義與預(yù)定行為類型庫中的預(yù)存數(shù)據(jù)字段或預(yù)存信息含義相匹配,據(jù)以確定所述傳感器數(shù)據(jù)對應(yīng)的行為類型。
B18、根據(jù)B17所述的機器人交互控制方法,所述傳感器數(shù)據(jù)為地理信息傳感器數(shù)據(jù),提取所述地理信息傳感器數(shù)據(jù)中的地理信息數(shù)據(jù),將所述地理信息數(shù)據(jù)與預(yù)存地理信息數(shù)據(jù)相匹配,據(jù)以確定所述地理信息傳感器數(shù)據(jù)表征的行為類型,從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令,所述機器行為指令包括速率信息、方向信息和路程信息,發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人執(zhí)行相應(yīng)的輸出行為,改變機器人相對于其監(jiān)視對象的地理信息。
B19、根據(jù)B17所述的機器人交互控制方法,所述傳感器數(shù)據(jù)為觸屏傳感器數(shù)據(jù),提取所述觸屏傳感器數(shù)據(jù)中的觸控操作信息并將其與預(yù)定行為類型庫中的預(yù)存觸控操作信息相匹配,據(jù)以確定所述觸屏傳感器數(shù)據(jù)對應(yīng)的行為類型。
B20、根據(jù)B14所述的機器人交互控制方法,所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中包括預(yù)設(shè)行為類型數(shù)據(jù)表,和與預(yù)設(shè)行為類型數(shù)據(jù)表具有映射關(guān)系的機器行為指令表;所述從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令的具體步驟為:
以所述行為類型為關(guān)鍵詞檢索對應(yīng)關(guān)系數(shù)據(jù)庫中的預(yù)設(shè)行為類型數(shù)據(jù)表,確定出匹配的預(yù)設(shè)行為類型,根據(jù)所述預(yù)設(shè)行為類型的映射關(guān)系映射生成機器行為指令。
B21、根據(jù)B14所述的機器人交互控制方法,所述機器行為指令包括:
語音指令,以驅(qū)動機器人語音播放接口輸出語音,和/或
視頻指令,以驅(qū)動機器人視頻播放接口輸出視頻,和/或
動作執(zhí)行指令,以驅(qū)動機器人運動單元輸出動作。
B22、根據(jù)B14所述的機器人交互控制方法,在獲取到屬于攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感數(shù)據(jù)的步驟之前還包括,接收到生物特征信息傳感器數(shù)據(jù),當(dāng)所述生物特征信息傳感器數(shù)據(jù)與預(yù)存生物特征信息匹配,確定所述生物特征信息傳感器數(shù)據(jù)對應(yīng)的使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限生成相對應(yīng)的預(yù)設(shè)反饋指令。
B23、根據(jù)權(quán)利要B22所述的機器人交互控制方法,其特征在于,所述生物特征信息傳感器數(shù)據(jù)包括指紋信息數(shù)據(jù)、虹膜信息數(shù)據(jù)或聲音信息數(shù)據(jù)中的至少一種,據(jù)以與預(yù)設(shè)身份權(quán)限信息對比確定使用者的身份權(quán)限,響應(yīng)于所述身份權(quán)限開放相對應(yīng)的預(yù)設(shè)反饋權(quán)限。
B24、根據(jù)B14所述的機器人交互控制方法,所述預(yù)設(shè)行為類型庫和/或所述預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫由用戶設(shè)定或下載自云端服務(wù)器。
B25、根據(jù)B24所述的機器人交互控制方法,所述下載通過藍牙、Wi-Fi網(wǎng)絡(luò)、移動數(shù)據(jù)網(wǎng)絡(luò)或有線網(wǎng)絡(luò)進行。
C26、一種機器人交互服務(wù)器,包括:
接收模塊,用于接收到機器人上傳的屬于其攝像單元獲取的其監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
解析模塊,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型;
數(shù)據(jù)生成模塊,用于從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)機器行為指令;
發(fā)送模塊,用于發(fā)送所述行為指令至機器人以驅(qū)動該機器人執(zhí)行該機器行為指令,使該機器人做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。
D27、一種機器人,包括:
獲取模塊,用于獲取到屬于攝像單元獲取的對監(jiān)視對象的音視頻流或相關(guān)傳感器數(shù)據(jù);
分析模塊,用于依據(jù)從所述音視頻流或所述傳感器數(shù)據(jù)中提取的特征數(shù)據(jù),從預(yù)定行為類型庫中匹配出相對應(yīng)的行為類型,再從預(yù)設(shè)對應(yīng)關(guān)系數(shù)據(jù)庫中確定與該行為類型相對應(yīng)的機器行為指令;
執(zhí)行模塊,用于依據(jù)所述行為指令驅(qū)動機器人相關(guān)接口或單元做出相應(yīng)的輸出行為,作為對其監(jiān)視對象的反饋。