機(jī)器人與用戶的交互方法及裝置的制造方法

文檔序號：10725480閱讀：461來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

機(jī)器人與用戶的交互方法及裝置的制造方法
【專利摘要】本發(fā)明適用于人機(jī)交互領(lǐng)域，提供了一種機(jī)器人與用戶的交互方法及裝置。所述方法包括：接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位；將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像；檢測獲取的圖像是否存在人臉；在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶；在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。通過上述方法能夠提高機(jī)器人執(zhí)行指令的精確性。
【專利說明】
機(jī)器人與用戶的交互方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明實施例屬于人機(jī)交互領(lǐng)域，尤其涉及一種機(jī)器人與用戶的交互方法及裝置。
【背景技術(shù)】
[0002] 機(jī)器人是自動執(zhí)行工作的機(jī)器裝置，它既可以接受人類指揮，又可以運(yùn)行預(yù)先編排的程序，還可以根據(jù)以人工智能技術(shù)制定的原則綱領(lǐng)行動。
[0003] 現(xiàn)有的機(jī)器人中，當(dāng)檢測到用戶的聲音信號時，根據(jù)聲源定位技術(shù)估算出用戶的位置方向，當(dāng)接收到用戶發(fā)出的前進(jìn)指令后，控制自身往估算的位置方向轉(zhuǎn)動。但由于發(fā)出指令的用戶可能并不是該機(jī)器人的主人，因此，機(jī)器人可能執(zhí)行非主人發(fā)出的指令，從而導(dǎo) 致指令執(zhí)行錯誤。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明實施例提供了一種機(jī)器人與用戶的交互方法及裝置，旨在解決現(xiàn)有機(jī)器人僅根據(jù)接收的指令執(zhí)行動作，可能執(zhí)行到非主人發(fā)出的指令，從而導(dǎo)致指令執(zhí)行錯誤的問題。
[0005] 本發(fā)明實施例是這樣實現(xiàn)的，一種機(jī)器人與用戶的交互方法，所述方法包括：
[0006] 接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位；
[0007] 將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像；
[0008] 檢測獲取的圖像是否存在人臉；
[0009] 在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶；
[0010]在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。
[0011] 本發(fā)明實施例的另一目的在于提供一種機(jī)器人與用戶的交互裝置，所述裝置包括：
[0012] 語音信號接收單元，用于接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位；
[0013] 圖像獲取單元，用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像；
[0014] 人臉檢測單元，用于檢測獲取的圖像是否存在人臉；
[0015] 合法用戶判斷單元，用于在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶；
[0016] 人機(jī)交互單元，用于在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。
[0017] 在本發(fā)明實施例中，由于只有在判斷出人臉對應(yīng)的用戶為合法的用戶時，才與所述合法的用戶進(jìn)行交互，因此，保證機(jī)器人執(zhí)行的指令都為其主人發(fā)出的指令，從而提高了執(zhí)行指令的精確性。
【附圖說明】
[0018] 圖1是本發(fā)明第一實施例提供的一種機(jī)器人與用戶的交互方法的流程圖；
[0019] 圖2是本發(fā)明第一實施例提供的確定發(fā)出語音信號對應(yīng)的具體位置的示意圖；
[0020] 圖3是本發(fā)明第一實施例提供的根據(jù)獲取的人臉在獲取的圖像的位置確定需調(diào)整的角度的示意圖；
[0021 ]圖4是本發(fā)明第二實施例提供的一種機(jī)器人與用戶的交互裝置。
【具體實施方式】
[0022]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下結(jié)合附圖及實施例，對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解，此處所描述的具體實施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。
[0023]本發(fā)明實施例中，接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位，將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像，檢測獲取的圖像是否存在人臉，在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶，在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。
[0024]為了說明本發(fā)明所述的技術(shù)方案，下面通過具體實施例來進(jìn)行說明。
[0025] 實施例一:
[0026] 圖1示出了本發(fā)明第一實施例提供的一種機(jī)器人與用戶的交互方法的流程圖，詳述如下：
[0027] 步驟S11，接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0028] 該步驟中，當(dāng)接收到語音信號后，根據(jù)聲源定位技術(shù)估算出所述語音信號對應(yīng)的初始方位，例如，當(dāng)接收的語音信號有多個時，根據(jù)定位技術(shù)估算出最強(qiáng)的語音信號對應(yīng)的初始方位。
[0029] 可選地，為了避免干擾，節(jié)省電量，所述步驟S11具體包括：
[0030] A1、接收到語音信號后，判斷所述語音信號是否為喚醒指令。具體地，識別語音信號包含的詞句含義，若語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時，判定所述語音信號為喚醒指令，否則，判定所述語音信號不為喚醒指令。進(jìn)一步地，語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時，繼續(xù)判斷所述語音信號對應(yīng)的音頻和/或音色等與預(yù)存的音頻和/或音色是否相同，若相同，判定所述語音信號為喚醒指令。
[0031] A2、在所述語音信號為喚醒指令時，確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0032] 具體地，通過聲源定位技術(shù)估算出語音信號對應(yīng)的初始方位。當(dāng)然，若需要確定發(fā) 出語音信號對應(yīng)的具體位置，則可利用接收到語音信號的時間差確定。例如，在機(jī)器人的身上設(shè)置4個麥克風(fēng)，該4個麥克風(fēng)的陣列采用四元十字陣列方式，且四個麥克風(fēng)按照十字的方式擺布在一個平面之內(nèi)，其中S代表聲源的位置，11，12，1314分別為四元十字陣列中四個陣元（即麥克風(fēng)）的位置，如圖2所示。其中，目標(biāo)方位角為Φ，聲源仰角為0(?與Μ組成的夾角），r為目標(biāo)聲源(即點(diǎn)S)到坐標(biāo)原點(diǎn)0的距離，兩個麥克風(fēng)姐與吣接收到聲音的時間差用表示，則通過下式可以確定發(fā)出所述語音信號對應(yīng)的初始方位以及位置：
[0034] 步驟S12,將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像。
[0035] 當(dāng)確定了初始方位后，若機(jī)器人的當(dāng)前方位與所述初始方位不同，則將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并通過圖像獲取裝置，如攝像頭、高清彩色攝像機(jī)等獲取所述方位對應(yīng)的圖像，獲取的圖像可為2D圖像，也可為3D圖像。
[0036] 步驟S13,檢測獲取的圖像是否存在人臉。
[0037] 具體地，通過人臉檢測算法檢測獲取的圖像算法存在人臉。
[0038] 步驟S14,在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶。
[0039] 可選地，所述步驟S14具體包括：
[0040] B1、獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像。該步驟中，獲取的人臉對應(yīng) 的用戶的語音信號可為確定初始方位對應(yīng)的語音信號，也可通過提示用戶再次發(fā)出語音而獲得的語音信號，同理，獲取的人臉對應(yīng)的用戶的圖像可為機(jī)器人在初始方位獲得的人臉的圖像，也可為再次拍攝獲取的人臉的圖像。
[0041] B2、在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同時，判定所述人臉對應(yīng)的用戶為合法的用戶，否則，判定所述人臉對應(yīng)的用戶為非法的用戶。具體地，通過預(yù)設(shè)一個或多個語音信號和/或預(yù)設(shè)一個或多個圖像，當(dāng)獲取的語音信號和/或圖像與預(yù)設(shè)的語音信號和/或圖像相同時，判定所述人臉對應(yīng)的用戶為合法的用戶。當(dāng)然，在判斷兩個語音信號是否相同時，可通過判斷語音信號中的音頻和/或音色等是否相同來判斷。
[0042] 可選地，為了使得機(jī)器人與用戶的交流更自然和更逼真，可通過調(diào)整一定的角度使得機(jī)器人正面面對用戶交流，增加了人機(jī)交互的智能性，此時，在所述識別所述人臉對應(yīng) 的用戶是否為合法的用戶時，包括：
[0043] 根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度;根據(jù)所述需調(diào)整的角度進(jìn) 行相應(yīng)的調(diào)整。
[0044] 具體地，首先確定根據(jù)哪個人臉在獲取的圖像的位置確定需調(diào)整的角度:在獲取的圖像存在人臉時，判斷人臉的個數(shù)是否大于1;在人臉的個數(shù)大于1時，選擇深度最小的人臉，并根據(jù)所述深度最小的人臉在獲取的圖像的位置確定需調(diào)整的角度;在人臉的個數(shù)等于1時，根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。當(dāng)獲取的圖像存在多個人臉時，選擇深度最小的人臉，并根據(jù)深度最小的人臉在獲取的圖像的位置確定需調(diào)整的角度。由于深度越小，其與機(jī)器人的距離越近，而與機(jī)器人的距離越近的用戶為該機(jī)器人的主人的概率越大，因此，根據(jù)人臉的深度大小確定需調(diào)整的角度也越準(zhǔn)確。由于在獲取的圖像只包括一個人臉時，該人臉通常為該機(jī)器人的主人，因此，只需根據(jù)該人臉在獲取的圖像的位置確定需調(diào)整的角度即可。
[0045] 其次，確定需調(diào)整的角度：
[0046] 確定人臉與獲取的圖像的中心點(diǎn)的距離c，以及，確定獲取的圖像的寬度a;根據(jù)下
[0047] 其中，α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角，b為機(jī)器人與獲取的圖像的中心點(diǎn)的距離，β為需調(diào)整的角度，γ為機(jī)器人的視角。
[0048] 如圖3所示，Β是機(jī)器人臉部的位置，Ρ是用戶的臉部位置，γ為機(jī)器人的視角，0Ρ代表人臉與畫面中心點(diǎn)的距離，長度用c表示。當(dāng)機(jī)器人獲取圖像后，其能夠確定c和a的值，再根據(jù)上述公式，則能夠得到機(jī)器人的臉部和人的臉部的夾角β，在圖3中，機(jī)器人需要向右轉(zhuǎn) 邱勺角度才能確保機(jī)器人和用戶的臉是面對面的。當(dāng)然，如果Ρ點(diǎn)在〇和C之間，則機(jī)器人就需要向左轉(zhuǎn)動β的角度。
[0049] 步驟S15,在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。
[0050] 該步驟中，只與合法的用戶交互能夠節(jié)省機(jī)器人的資源，也能夠避免機(jī)器人被非法的用戶操控，從而提高機(jī)器人的安全性。
[0051] 為了進(jìn)一步地提高機(jī)器人的安全性，在所述人臉對應(yīng)的用戶為非法的用戶時，獲取所述非法的用戶的人臉圖像，并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶，比如發(fā)送至指定用戶的移動終端等。進(jìn)一步地，當(dāng)發(fā)送至指定的用戶之后，發(fā)出提示，以使用戶及時查看。其中，該指定的用戶通常為合法的用戶。由于將非法的用戶的人臉圖像發(fā) 送至指定的用戶（如發(fā)送至機(jī)器人的主人），因此，使得指定的用戶能夠及時獲知非法的用戶正在嘗試操作機(jī)器人，從而能夠及時阻止非法的用戶的動作。
[0052]本發(fā)明第一實施例中，接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位，將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像，檢測獲取的圖像是否存在人臉，在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶，在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。由于只有在判斷出人臉對應(yīng)的用戶為合法的用戶時，才與所述合法的用戶進(jìn)行交互，因此，保證機(jī)器人執(zhí) 行的指令都為其主人發(fā)出的指令，從而提高了執(zhí)行指令的精確性。
[0053]應(yīng)理解，在本發(fā)明實施例中，上述各過程的序號的大小并不意味著執(zhí)行順序的先后，各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定，而不應(yīng)對本發(fā)明實施例的實施過程構(gòu) 成任何限定。
[0054] 實施例二:
[0055]圖4示出了本發(fā)明第二實施例提供的一種機(jī)器人與用戶的交互裝置的結(jié)構(gòu)圖，該機(jī)器人與用戶的交互裝置可用于各種機(jī)器人中。為了便于說明，僅示出了與本發(fā)明實施例相關(guān)的部分。
[0056] 該機(jī)器人與用戶的交互裝置包括:語音信號接收單元41、圖像獲取單元42、人臉檢測單元43、合法用戶判斷單元44、人機(jī)交互單元45。其中：
[0057] 語音信號接收單元41，用于接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0058] 當(dāng)接收到語音信號后，根據(jù)聲源定位技術(shù)估算出所述語音信號對應(yīng)的初始方位，例如，當(dāng)接收的語音信號有多個時，根據(jù)定位技術(shù)估算出最強(qiáng)的語音信號對應(yīng)的初始方位。
[0059] 可選地，為了避免干擾，節(jié)省電量，所述語音信號接收單元41具體包括：
[0060] 喚醒指令判斷模塊，用于接收到語音信號后，判斷所述語音信號是否為喚醒指令。具體地，識別語音信號包含的詞句含義，若語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時，判定所述語音信號為喚醒指令，否則，判定所述語音信號不為喚醒指令。進(jìn)一步地，語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時，繼續(xù)判斷所述語音信號對應(yīng)的音頻和/ 或音色等與預(yù)存的音頻和/或音色是否相同，若相同，判定所述語音信號為喚醒指令。
[0061] 初始方位確定模塊，用于在所述語音信號為喚醒指令時，確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0062] 具體地，通過聲源定位技術(shù)估算出語音信號對應(yīng)的初始方位。當(dāng)然，若需要確定發(fā) 出語音信號對應(yīng)的具體位置，則可利用接收到語音信號的時間差確定。例如，在機(jī)器人的身上設(shè)置4個麥克風(fēng)，該4個麥克風(fēng)的陣列采用四元十字陣列方式，且四個麥克風(fēng)按照十字的方式擺布在一個平面之內(nèi)，其中S代表聲源的位置，11，12，1314分別為四元十字陣列中四個陣元（即麥克風(fēng))的位置，如圖2所示。其中，目標(biāo)方位角為Φ，聲源仰角為Θ(沉組成的夾角），r為目標(biāo)聲源(即點(diǎn)S)到坐標(biāo)原點(diǎn)0的距離，兩個麥克風(fēng)姐與吣接收到聲音的時間差用表示，則通過下式可以確定發(fā)出所述語音信號對應(yīng)的初始方位以及位置：
[0064] 圖像獲取單元42,用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像。
[0065] 當(dāng)確定了初始方位后，若機(jī)器人的當(dāng)前方位與所述初始方位不同，則將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并通過圖像獲取裝置，如攝像頭、高清彩色攝像機(jī)等獲取所述方位對應(yīng)的圖像，獲取的圖像可為2D圖像，也可為3D圖像。
[0066] 人臉檢測單元43,用于檢測獲取的圖像是否存在人臉。
[0067] 合法用戶判斷單元44,用于在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶。
[0068] 可選地，所述合法用戶判斷單元44包括：
[0069]用戶信息獲取模塊，用于獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像。其中，獲取的人臉對應(yīng)的用戶的語音信號可為確定初始方位對應(yīng)的語音信號，也可通過提示用戶再次發(fā)出語音而獲得的語音信號，同理，獲取的人臉對應(yīng)的用戶的圖像可為機(jī)器人在初始方位獲得的人臉的圖像，也可為再次拍攝獲取的人臉的圖像。
[0070] 用戶的合法性判定模塊，用于在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同時，判定所述人臉對應(yīng)的用戶為合法的用戶，否則，判定所述人臉對應(yīng)的用戶為非法的用戶。具體地，通過預(yù)設(shè)一個或多個語音信號和/或預(yù)設(shè)一個或多個圖像，當(dāng)獲取的語音信號和/或圖像與預(yù)設(shè)的語音信號和/或圖像相同時，判定所述人臉對應(yīng) 的用戶為合法的用戶。當(dāng)然，在判斷兩個語音信號是否相同時，可通過判斷語音信號中的音頻和/或音色等是否相同來判斷。
[0071] 可選地，為了使得機(jī)器人與用戶的交流更自然和更逼真，可通過調(diào)整一定的角度使得機(jī)器人正面面對用戶交流，增加了人機(jī)交互的智能性，此時，該機(jī)器人與用戶的交互裝置包括：
[0072] 調(diào)整的角度確定單元，用于根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。
[0073] 具體地，所述調(diào)整的角度確定單元包括：
[0074] 圖像的信息確定模塊，用于確定人臉與獲取的圖像的中心點(diǎn)的距離c，以及，確定獲取的圖像的寬度a。
[0077] 其中，α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角，b為機(jī)器人與獲取的圖像的中心點(diǎn)的距離，β為需調(diào)整的角度，γ為機(jī)器人的視角。
[0078] 此外，在確定需調(diào)整的角度之前，所述調(diào)整的角度確定單元包括:確定根據(jù)哪個人臉在獲取的圖像的位置確定需調(diào)整的角度。具體地，在獲取的圖像存在人臉時，判斷人臉的個數(shù)是否大于1;在人臉的個數(shù)大于1時，選擇深度最小的人臉，并根據(jù)所述深度最小的人臉在獲取的圖像的位置確定需調(diào)整的角度;在人臉的個數(shù)等于1時，根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。
[0079]人機(jī)交互單元45,用于在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。
[0080] 為了進(jìn)一步地提高機(jī)器人的安全性，該機(jī)器人與用戶的交互裝置包括：
[0081] 非法的用戶圖像獲取單元，用于在所述人臉對應(yīng)的用戶為非法的用戶時，獲取所述非法的用戶的人臉圖像，并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶。進(jìn) 一步地，當(dāng)發(fā)送至指定的用戶之后，發(fā)出提示，以使用戶及時查看。其中，該指定的用戶通常為合法的用戶。由于將非法的用戶的人臉圖像發(fā)送至指定的用戶（如發(fā)送至機(jī)器人的主人），因此，使得指定的用戶能夠及時獲知非法的用戶正在嘗試操作機(jī)器人，從而能夠及時阻止非法的用戶的動作。
[0082] 本發(fā)明第二實施例中，由于只有在判斷出人臉對應(yīng)的用戶為合法的用戶時，才與所述合法的用戶進(jìn)行交互，因此，保證機(jī)器人執(zhí)行的指令都為其主人發(fā)出的指令，從而提高了執(zhí)行指令的精確性。
[0083] 本領(lǐng)域普通技術(shù)人員可以意識到，結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟，能夠以電子硬件、或者計算機(jī)軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行，取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能，但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
[0084] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到，為描述的方便和簡潔，上述描述的系統(tǒng)、裝置和單元的具體工作過程，可以參考前述方法實施例中的對應(yīng)過程，在此不再贅述。
[0085] 在本申請所提供的幾個實施例中，應(yīng)該理解到，所揭露的系統(tǒng)、裝置和方法，可以通過其它的方式實現(xiàn)。例如，以上所描述的裝置實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現(xiàn)時可以有另外的劃分方式，例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng)，或一些特征可以忽略，或不執(zhí)行。另一點(diǎn)，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，裝置或單元的間接耦合或通信連接，可以是電性，機(jī)械或其它的形式。
[0086]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0087] 另外，在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨(dú)物理存在，也可以兩個或兩個以上單元集成在一個單元中。
[0088] 所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時，可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解，本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中，包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(R0M，Read-0nly Memory)、隨機(jī)存取存儲器(RAM，Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0089] 以上所述，僅為本發(fā)明的【具體實施方式】，但本發(fā)明的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此，本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項】
1. 一種機(jī)器人與用戶的交互方法，其特征在于，所述方法包括：接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位；將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像；檢測獲取的圖像是否存在人臉；在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶；在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述識別所述人臉對應(yīng)的用戶是否為合法的用戶，具體包括：獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像；在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同時，判定所述人臉對應(yīng)的用戶為合法的用戶，否則，判定所述人臉對應(yīng)的用戶為非法的用戶。3. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述在所述識別所述人臉對應(yīng)的用戶是否為合法的用戶時，包括：根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度；根據(jù)所述需調(diào)整的角度進(jìn)行相應(yīng)的調(diào)整。4. 根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度，具體包括：確定人臉與獲取的圖像的中屯、點(diǎn)的距離C，W及，確定獲取的圖像的寬度a;其中，α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角，b為機(jī)器人與獲取的圖像的中屯、點(diǎn)的距離，β為需調(diào)整的角度，丫為機(jī)器人的視角。5. 根據(jù)權(quán)利要求1至4任一項所述的方法，其特征在于，在所述人臉對應(yīng)的用戶為非法的用戶時，獲取所述非法的用戶的人臉圖像，并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶。6. -種機(jī)器人與用戶的交互裝置，其特征在于，所述裝置包括：語音信號接收單元，用于接收到語音信號后，確定發(fā)出所述語音信號對應(yīng)的初始方位；圖像獲取單元，用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位，并獲取所述初始方位對應(yīng)的圖像；人臉檢測單元，用于檢測獲取的圖像是否存在人臉；合法用戶判斷單元，用于在獲取的圖像存在人臉時，識別所述人臉對應(yīng)的用戶是否為合法的用戶；人機(jī)交互單元，用于在所述人臉對應(yīng)的用戶為合法的用戶時，與所述合法的用戶進(jìn)行交互。7. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述合法用戶判斷單元包括：用戶信息獲取模塊，用于獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像；用戶的合法性判定模塊，用于在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同時，判定所述人臉對應(yīng)的用戶為合法的用戶，否則，判定所述人臉對應(yīng)的用戶為非法的用戶。8. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述裝置包括：調(diào)整的角度確定單元，用于根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。9. 根據(jù)權(quán)利要求8所述的裝置，其特征在于，所述調(diào)整的角度確定單元包括：圖像的信息確定模塊，用于確定人臉與獲取的圖像的中屯、點(diǎn)的距離c，W及，確定獲取的圖像的寬度a; 角度計算模塊，用于根據(jù)下??其中，α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角，b為機(jī)器人與獲取的圖像的中屯、點(diǎn)的距離，β為需調(diào)整的角度，丫為機(jī)器人的視角。10. 根據(jù)權(quán)利要求6至9任一項所述的裝置，其特征在于，所述裝置包括：非法的用戶圖像獲取單元，用于在所述人臉對應(yīng)的用戶為非法的用戶時，獲取所述非法的用戶的人臉圖像，并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶。
【文檔編號】G06F21/32GK106096373SQ201610480936
【公開日】2016年11月9日
【申請日】2016年6月27日
【發(fā)明人】林綠德, 莊永軍
【申請人】旗瀚科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：林綠德;莊永軍;
技術(shù)所有人：旗瀚科技股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

交互機(jī)器人相關(guān)技術(shù)

智能交互機(jī)器人相關(guān)技術(shù)

語音交互機(jī)器人相關(guān)技術(shù)

機(jī)器人語音交互技術(shù)相關(guān)技術(shù)

交互式機(jī)器人相關(guān)技術(shù)

智能機(jī)器人語音交互相關(guān)技術(shù)

機(jī)器人人機(jī)交互技術(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

機(jī)器人與用戶的交互方法及裝置的制造方法