執(zhí)行人形機器人與用戶之間的多模式對話的方法、用于實施所述方法的計算機程序產品和人形機器人與流程

文檔序號：12282914閱讀：來源：國知局

技術特征：

1.一種執(zhí)行人形機器人(R)與至少一個用戶(U)之間的對話的方法，包括由所述人形機器人反復執(zhí)行的以下步驟：

ⅰ)從相應的傳感器(c1，c2)獲得多個輸入信號(s1，s2)，至少一個所述傳感器是聲音傳感器，并且至少一個另一種傳感器是運動傳感器或圖像傳感器；

ⅱ)解釋所獲得的信號以識別由所述用戶產生的多個事件(EVI)，所述多個事件(EVI)選自于包括以下各項的組：說出至少詞或句子、語音的語調、手勢、身體姿勢、面部表達；

ⅲ)確定所述人形機器人的響應，所述響應包括至少一個事件(EVO)，所述至少一個事件(EVO)選自于包括以下各項的組：說出至少詞或句子、語音的語調、手勢、身體姿勢、面部表達，通過應用一組規(guī)則來執(zhí)行所述確定，每個所述規(guī)則使一組輸入事件與所述機器人的響應相關聯；

ⅳ)由所述人形機器人產生所述事件或每個所述事件；

其特征在于，在所述步驟ⅲ)應用的所述規(guī)則中的至少一些規(guī)則使響應與由所述用戶共同產生并且在所述步驟ⅱ)識別出的至少兩個事件的組合相關聯，所述至少兩個事件中的至少一個事件不是由所述用戶說出的詞或句子。

2.根據權利要求1所述的方法，其中，在所述步驟ⅲ)應用的所述規(guī)則中的至少一些規(guī)則確定包括由所述人形機器人共同產生的至少兩個事件的響應，所述至少兩個事件中的至少一個事件不是說出詞或句子。

3.根據前述權利要求中的一項所述的方法，其中，在所述步驟ⅲ，基于選自于：對話語境(CTX)、所述用戶的身份、所述人形機器人的內部狀態(tài)(RIS)的至少一個參數來確定人形機器人的所述響應。

4.根據權利要求3所述的方法，還包括根據在所述步驟ⅱ)識別出的或在所述步驟ⅲ)中確定的所述至少一個事件來修改所述參數或至少一個所述參數的值的步驟。

5.根據前述權利要求中的一項所述的方法，其中，所述步驟ⅱ)包括對所獲得的信號與屬于存儲在所述人形機器人的存儲器中或能夠由所述人形機器人進行訪問的預期事件的列表的事件之間的匹配進行搜索，通過連續(xù)地使用具有增加的復雜度的多個匹配方法(MM1-MM4)來執(zhí)行所述搜索，直到識別有比預定值大的置信度分數的事件，或在具有復雜度的最高識別方法被使用之后。

6.根據權利要求5所述的方法，其中，根據對話的語境來選擇所使用的匹配方法。

7.根據權利要求5或權利要求6所述的方法，其中，所述匹配方法按照復雜度增加的順序包括：對明確匹配的搜索、對近似匹配的搜索、只在語音識別的情況下對語音對應性的搜索、以及對語義對應性的搜索。

8.根據權利要求7所述的方法，其中，對語音對應性進行搜索的所述方法包括：

-由聲音傳感器獲得的一組聲音的語音轉錄的步驟；

-使由此產生的語音轉錄簡化和平滑化的步驟；

-計算所述簡化和平滑化的語音轉錄與多個條目之間的編輯距離，通過以自然的語言使預定組的詞簡化和平滑化來獲得所述多個條目；以及

-對應于具有離所述簡化和平滑化的語音轉錄的最小編輯距離的條目，選擇所述預定組的自然語言詞。

9.根據權利要求8所述的方法，其中，所述簡化和平滑化包括：

-用單音素代替易于混淆的音素；

-去除除了詞的開頭處的元音和鼻元音以外的元音；以及

-去除詞之間的停頓。

10.根據權利要求5到9中的一項所述的方法，其中，根據對話語境來在多個所述列表當中選擇預期事件的所述列表。

11.根據前述權利要求中的一項所述的方法，其中，所述步驟ⅲ)包括通過應用屬于預定子集(PRO)的、被稱為前攝規(guī)則的規(guī)則來確定對一組事件的響應，所述事件包括由所述用戶說出的詞或所識別的手勢的缺乏。

12.根據前述權利要求中的一項所述的方法，還包括如果在步驟ⅲ)期間確定的所述響應是或包括說出至少詞或句子，那么執(zhí)行步驟ⅲ-a)：執(zhí)行要說出的所述詞或句子的語言分析并且根據所述分析來確定伴隨所述響應的動畫。

13.根據權利要求12所述的方法，其中，所述步驟ⅲ-a包括以下子步驟：

α)識別要被動畫化的所述響應的至少一個詞；

β)確定與要被動畫化的所述詞或每個所述詞相關聯的概念和表現力，所述表現力被稱為一次性表現力；

γ)基于所述概念和所述一次性表現力來從動畫的列表(ALST)中進行選擇，所述動畫存儲在所述人形機器人的存儲器中或能夠由所述人形機器人進行訪問。

14.根據權利要求13所述的方法，其中，所述子步驟α包括執(zhí)行要說出的句子的句法分析以根據要被動畫化的每個詞或所述詞在所述句子的結構內的功能來確定要被動畫化的所述每個詞或所述詞。

15.根據權利要求13或14中的一項所述的方法，其中，在所述子步驟β中，基于選自于：所述詞的表現力、與所述詞有關的一個或多個其它詞的表現力、以及整個響應的整體表現力的至少一個參數來確定所述一次性表現力。

16.根據權利要求13到15中的一項所述的方法，其中，所述列表的每個動畫與一個或多個概念相關聯并且具有具體的表現力，所述子步驟γ包括在所述列表內選擇與所述子步驟β中所確定的所述概念相關聯并且具有最接近所述一次性表現力的具體表現力的動畫。

17.根據權利要求16所述的方法，還包括以下子步驟：

δ)基于所述具體表現力和所述一次性表現力來確定被稱為最終表現力的表現力。

18.根據權利要求13到17中的一項所述的方法，其中，所述一次性表現力或所述最終表現力確定在所述動畫的至少一個手勢的速度和幅度當中選擇的至少一個參數。

19.根據前述權利要求中的一項所述的方法，還包括由所述機器人反復地、且與所述步驟ⅰ)到ⅳ)同時地實施的以下步驟：

A)確定所述用戶(U)的身體的至少一部分相對于固定到所述機器人(R)的參考系的位置；

B)驅動所述機器人的至少一個執(zhí)行器以將所述機器人或所述機器人的元件與所述用戶的所述至少一個身體部分或所述身體部分之間的距離維持在預定值的范圍內。

20.根據權利要求19所述的方法，其中，所述步驟B)還包括驅動所述機器人的至少一個執(zhí)行器以將所述機器人相對于所述用戶的取向維持在預定的角度范圍內。

21.根據權利要求19或20中的一項所述的方法，還包括以下步驟：

C)驅動所述執(zhí)行器或至少一個所述執(zhí)行器以引起所述機器人的所述偽隨機移位，同時將所述距離維持在值的預定范圍內，并且在適當的情況下，將所述取向維持在所述預定的角度范圍內。

22.根據權利要求19到21中的一項所述的方法，還包括以下步驟：

D)執(zhí)行所述用戶與所述人形機器人之間正在進行的對話的語義分析，并且根據所述分析，改變所述預定的距離值的范圍，并且在適當的情況下，改變所述預定的角度范圍。

23.根據權利要求19到22中的一項所述的方法，其中，所述步驟A)包括確定所述用戶的下身相對于固定到所述機器人的所述參考系的位置。

24.一種包括程序代碼指令的計算機程序產品，所述程序代碼指令用于在所述程序由嵌入在人形機器人(R)上的至少一個處理器執(zhí)行時執(zhí)行根據前述權利要求中的一項所述的方法，所述機器人包括：多個傳感器(c1，c2)，其操作地連接到所述處理器或至少一個處理器并且包括至少一個聲音傳感器和至少一個圖像傳感器或運動傳感器，以獲得相應的輸入信號；語言合成模塊，其由所述處理器或至少一個所述處理器控制以說出詞或句子；以及一組執(zhí)行器(A1，A2，A3)，其由所述處理器或至少一個所述處理器驅動，從而使所述機器人能夠執(zhí)行多個運動或手勢。

25.一種人形機器人(R)，包括：

-至少一個嵌入式處理器；

-傳感器組件(c1，c2)，其操作地連接到所述處理器或至少一個所述處理器并且包括至少一個聲音傳感器和至少一個圖像傳感器或運動傳感器，以獲得相應的輸入信號；

-語言合成模塊，其由所述處理器或至少一個所述處理器控制以說出詞或句子；以及

-一組執(zhí)行器(A1，A2，A3)，其由所述處理器或至少一個所述處理器驅動，從而使所述機器人能夠執(zhí)行多個運動或手勢；

其特征在于，所述處理器或至少一個所述處理器被編程或被配置為執(zhí)行根據權利要求1到23中的一項所述的方法。

26.根據權利要求25所述的人形機器人，還包括用于連接到至少一個遠程服務器的設備，所述處理器或至少一個所述處理器被編程或被配置為與所述遠程服務器或至少一個所述遠程服務器協作以實行根據權利要求1到23中的一項所述的方法。

完整全部詳細技術資料下載

當前第2頁1 2 3

相關技術