機(jī)器人與用戶的交互方法及裝置的制造方法
【專利摘要】本發(fā)明適用于人機(jī)交互領(lǐng)域,提供了一種機(jī)器人與用戶的交互方法及裝置。所述方法包括:接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位;將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的圖像;檢測獲取的圖像是否存在人臉;在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的用戶;在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。通過上述方法能夠提高機(jī)器人執(zhí)行指令的精確性。
【專利說明】
機(jī)器人與用戶的交互方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明實施例屬于人機(jī)交互領(lǐng)域,尤其涉及一種機(jī)器人與用戶的交互方法及裝 置。
【背景技術(shù)】
[0002] 機(jī)器人是自動執(zhí)行工作的機(jī)器裝置,它既可以接受人類指揮,又可以運(yùn)行預(yù)先編 排的程序,還可以根據(jù)以人工智能技術(shù)制定的原則綱領(lǐng)行動。
[0003] 現(xiàn)有的機(jī)器人中,當(dāng)檢測到用戶的聲音信號時,根據(jù)聲源定位技術(shù)估算出用戶的 位置方向,當(dāng)接收到用戶發(fā)出的前進(jìn)指令后,控制自身往估算的位置方向轉(zhuǎn)動。但由于發(fā)出 指令的用戶可能并不是該機(jī)器人的主人,因此,機(jī)器人可能執(zhí)行非主人發(fā)出的指令,從而導(dǎo) 致指令執(zhí)行錯誤。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供了一種機(jī)器人與用戶的交互方法及裝置,旨在解決現(xiàn)有機(jī)器人 僅根據(jù)接收的指令執(zhí)行動作,可能執(zhí)行到非主人發(fā)出的指令,從而導(dǎo)致指令執(zhí)行錯誤的問 題。
[0005] 本發(fā)明實施例是這樣實現(xiàn)的,一種機(jī)器人與用戶的交互方法,所述方法包括:
[0006] 接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位;
[0007] 將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的圖像;
[0008] 檢測獲取的圖像是否存在人臉;
[0009] 在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的用戶;
[0010]在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。
[0011] 本發(fā)明實施例的另一目的在于提供一種機(jī)器人與用戶的交互裝置,所述裝置包 括:
[0012] 語音信號接收單元,用于接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始 方位;
[0013] 圖像獲取單元,用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始 方位對應(yīng)的圖像;
[0014] 人臉檢測單元,用于檢測獲取的圖像是否存在人臉;
[0015] 合法用戶判斷單元,用于在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是 否為合法的用戶;
[0016] 人機(jī)交互單元,用于在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶 進(jìn)行交互。
[0017] 在本發(fā)明實施例中,由于只有在判斷出人臉對應(yīng)的用戶為合法的用戶時,才與所 述合法的用戶進(jìn)行交互,因此,保證機(jī)器人執(zhí)行的指令都為其主人發(fā)出的指令,從而提高了 執(zhí)行指令的精確性。
【附圖說明】
[0018] 圖1是本發(fā)明第一實施例提供的一種機(jī)器人與用戶的交互方法的流程圖;
[0019] 圖2是本發(fā)明第一實施例提供的確定發(fā)出語音信號對應(yīng)的具體位置的示意圖;
[0020] 圖3是本發(fā)明第一實施例提供的根據(jù)獲取的人臉在獲取的圖像的位置確定需調(diào)整 的角度的示意圖;
[0021 ]圖4是本發(fā)明第二實施例提供的一種機(jī)器人與用戶的交互裝置。
【具體實施方式】
[0022]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實施例,對 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0023]本發(fā)明實施例中,接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位,將 機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的圖像,檢測獲取的圖 像是否存在人臉,在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的用戶, 在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。
[0024]為了說明本發(fā)明所述的技術(shù)方案,下面通過具體實施例來進(jìn)行說明。
[0025] 實施例一:
[0026] 圖1示出了本發(fā)明第一實施例提供的一種機(jī)器人與用戶的交互方法的流程圖,詳 述如下:
[0027] 步驟S11,接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0028] 該步驟中,當(dāng)接收到語音信號后,根據(jù)聲源定位技術(shù)估算出所述語音信號對應(yīng)的 初始方位,例如,當(dāng)接收的語音信號有多個時,根據(jù)定位技術(shù)估算出最強(qiáng)的語音信號對應(yīng)的 初始方位。
[0029] 可選地,為了避免干擾,節(jié)省電量,所述步驟S11具體包括:
[0030] A1、接收到語音信號后,判斷所述語音信號是否為喚醒指令。具體地,識別語音信 號包含的詞句含義,若語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時,判定所述語音 信號為喚醒指令,否則,判定所述語音信號不為喚醒指令。進(jìn)一步地,語音信號包含的詞句 含義與預(yù)設(shè)的詞句含義相同時,繼續(xù)判斷所述語音信號對應(yīng)的音頻和/或音色等與預(yù)存的 音頻和/或音色是否相同,若相同,判定所述語音信號為喚醒指令。
[0031] A2、在所述語音信號為喚醒指令時,確定發(fā)出所述語音信號對應(yīng)的初始方位。
[0032] 具體地,通過聲源定位技術(shù)估算出語音信號對應(yīng)的初始方位。當(dāng)然,若需要確定發(fā) 出語音信號對應(yīng)的具體位置,則可利用接收到語音信號的時間差確定。例如,在機(jī)器人的身 上設(shè)置4個麥克風(fēng),該4個麥克風(fēng)的陣列采用四元十字陣列方式,且四個麥克風(fēng)按照十字的 方式擺布在一個平面之內(nèi),其中S代表聲源的位置,11,12,1314分別為四元十字陣列中四 個陣元(即麥克風(fēng))的位置,如圖2所示。其中,目標(biāo)方位角為Φ,聲源仰角為0(?與Μ組成 的夾角),r為目標(biāo)聲源(即點(diǎn)S)到坐標(biāo)原點(diǎn)0的距離,兩個麥克風(fēng)姐與吣接收到聲音的時間差 用表示,則通過下式可以確定發(fā)出所述語音信號對應(yīng)的初始方位以及位置:
[0034] 步驟S12,將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的 圖像。
[0035] 當(dāng)確定了初始方位后,若機(jī)器人的當(dāng)前方位與所述初始方位不同,則將機(jī)器人從 當(dāng)前方位調(diào)整至所述初始方位,并通過圖像獲取裝置,如攝像頭、高清彩色攝像機(jī)等獲取所 述方位對應(yīng)的圖像,獲取的圖像可為2D圖像,也可為3D圖像。
[0036] 步驟S13,檢測獲取的圖像是否存在人臉。
[0037] 具體地,通過人臉檢測算法檢測獲取的圖像算法存在人臉。
[0038] 步驟S14,在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的用 戶。
[0039] 可選地,所述步驟S14具體包括:
[0040] B1、獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像。該步驟中,獲取的人臉對應(yīng) 的用戶的語音信號可為確定初始方位對應(yīng)的語音信號,也可通過提示用戶再次發(fā)出語音而 獲得的語音信號,同理,獲取的人臉對應(yīng)的用戶的圖像可為機(jī)器人在初始方位獲得的人臉 的圖像,也可為再次拍攝獲取的人臉的圖像。
[0041] B2、在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同 時,判定所述人臉對應(yīng)的用戶為合法的用戶,否則,判定所述人臉對應(yīng)的用戶為非法的用 戶。具體地,通過預(yù)設(shè)一個或多個語音信號和/或預(yù)設(shè)一個或多個圖像,當(dāng)獲取的語音信號 和/或圖像與預(yù)設(shè)的語音信號和/或圖像相同時,判定所述人臉對應(yīng)的用戶為合法的用戶。 當(dāng)然,在判斷兩個語音信號是否相同時,可通過判斷語音信號中的音頻和/或音色等是否相 同來判斷。
[0042] 可選地,為了使得機(jī)器人與用戶的交流更自然和更逼真,可通過調(diào)整一定的角度 使得機(jī)器人正面面對用戶交流,增加了人機(jī)交互的智能性,此時,在所述識別所述人臉對應(yīng) 的用戶是否為合法的用戶時,包括:
[0043] 根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度;根據(jù)所述需調(diào)整的角度進(jìn) 行相應(yīng)的調(diào)整。
[0044] 具體地,首先確定根據(jù)哪個人臉在獲取的圖像的位置確定需調(diào)整的角度:在獲取 的圖像存在人臉時,判斷人臉的個數(shù)是否大于1;在人臉的個數(shù)大于1時,選擇深度最小的人 臉,并根據(jù)所述深度最小的人臉在獲取的圖像的位置確定需調(diào)整的角度;在人臉的個數(shù)等 于1時,根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。當(dāng)獲取的圖像存在多個人臉 時,選擇深度最小的人臉,并根據(jù)深度最小的人臉在獲取的圖像的位置確定需調(diào)整的角度。 由于深度越小,其與機(jī)器人的距離越近,而與機(jī)器人的距離越近的用戶為該機(jī)器人的主人 的概率越大,因此,根據(jù)人臉的深度大小確定需調(diào)整的角度也越準(zhǔn)確。由于在獲取的圖像只 包括一個人臉時,該人臉通常為該機(jī)器人的主人,因此,只需根據(jù)該人臉在獲取的圖像的位 置確定需調(diào)整的角度即可。
[0045] 其次,確定需調(diào)整的角度:
[0046] 確定人臉與獲取的圖像的中心點(diǎn)的距離c,以及,確定獲取的圖像的寬度a;根據(jù)下
[0047] 其中,α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角,b為機(jī)器人與獲取的圖 像的中心點(diǎn)的距離,β為需調(diào)整的角度,γ為機(jī)器人的視角。
[0048] 如圖3所示,Β是機(jī)器人臉部的位置,Ρ是用戶的臉部位置,γ為機(jī)器人的視角,0Ρ代 表人臉與畫面中心點(diǎn)的距離,長度用c表示。當(dāng)機(jī)器人獲取圖像后,其能夠確定c和a的值,再 根據(jù)上述公式,則能夠得到機(jī)器人的臉部和人的臉部的夾角β,在圖3中,機(jī)器人需要向右轉(zhuǎn) 邱勺角度才能確保機(jī)器人和用戶的臉是面對面的。當(dāng)然,如果Ρ點(diǎn)在〇和C之間,則機(jī)器人就需 要向左轉(zhuǎn)動β的角度。
[0049] 步驟S15,在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。
[0050] 該步驟中,只與合法的用戶交互能夠節(jié)省機(jī)器人的資源,也能夠避免機(jī)器人被非 法的用戶操控,從而提高機(jī)器人的安全性。
[0051] 為了進(jìn)一步地提高機(jī)器人的安全性,在所述人臉對應(yīng)的用戶為非法的用戶時,獲 取所述非法的用戶的人臉圖像,并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用 戶,比如發(fā)送至指定用戶的移動終端等。進(jìn)一步地,當(dāng)發(fā)送至指定的用戶之后,發(fā)出提示,以 使用戶及時查看。其中,該指定的用戶通常為合法的用戶。由于將非法的用戶的人臉圖像發(fā) 送至指定的用戶(如發(fā)送至機(jī)器人的主人),因此,使得指定的用戶能夠及時獲知非法的用 戶正在嘗試操作機(jī)器人,從而能夠及時阻止非法的用戶的動作。
[0052]本發(fā)明第一實施例中,接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方 位,將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的圖像,檢測獲取 的圖像是否存在人臉,在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的 用戶,在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。由于只有在判 斷出人臉對應(yīng)的用戶為合法的用戶時,才與所述合法的用戶進(jìn)行交互,因此,保證機(jī)器人執(zhí) 行的指令都為其主人發(fā)出的指令,從而提高了執(zhí)行指令的精確性。
[0053]應(yīng)理解,在本發(fā)明實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先 后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu) 成任何限定。
[0054] 實施例二:
[0055]圖4示出了本發(fā)明第二實施例提供的一種機(jī)器人與用戶的交互裝置的結(jié)構(gòu)圖,該 機(jī)器人與用戶的交互裝置可用于各種機(jī)器人中。為了便于說明,僅示出了與本發(fā)明實施例 相關(guān)的部分。
[0056] 該機(jī)器人與用戶的交互裝置包括:語音信號接收單元41、圖像獲取單元42、人臉檢 測單元43、合法用戶判斷單元44、人機(jī)交互單元45。其中:
[0057] 語音信號接收單元41,用于接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初 始方位。
[0058] 當(dāng)接收到語音信號后,根據(jù)聲源定位技術(shù)估算出所述語音信號對應(yīng)的初始方位, 例如,當(dāng)接收的語音信號有多個時,根據(jù)定位技術(shù)估算出最強(qiáng)的語音信號對應(yīng)的初始方位。
[0059] 可選地,為了避免干擾,節(jié)省電量,所述語音信號接收單元41具體包括:
[0060] 喚醒指令判斷模塊,用于接收到語音信號后,判斷所述語音信號是否為喚醒指令。 具體地,識別語音信號包含的詞句含義,若語音信號包含的詞句含義與預(yù)設(shè)的詞句含義相 同時,判定所述語音信號為喚醒指令,否則,判定所述語音信號不為喚醒指令。進(jìn)一步地,語 音信號包含的詞句含義與預(yù)設(shè)的詞句含義相同時,繼續(xù)判斷所述語音信號對應(yīng)的音頻和/ 或音色等與預(yù)存的音頻和/或音色是否相同,若相同,判定所述語音信號為喚醒指令。
[0061] 初始方位確定模塊,用于在所述語音信號為喚醒指令時,確定發(fā)出所述語音信號 對應(yīng)的初始方位。
[0062] 具體地,通過聲源定位技術(shù)估算出語音信號對應(yīng)的初始方位。當(dāng)然,若需要確定發(fā) 出語音信號對應(yīng)的具體位置,則可利用接收到語音信號的時間差確定。例如,在機(jī)器人的身 上設(shè)置4個麥克風(fēng),該4個麥克風(fēng)的陣列采用四元十字陣列方式,且四個麥克風(fēng)按照十字的 方式擺布在一個平面之內(nèi),其中S代表聲源的位置,11,12,1314分別為四元十字陣列中四 個陣元(即麥克風(fēng))的位置,如圖2所示。其中,目標(biāo)方位角為Φ,聲源仰角為Θ(沉組成 的夾角),r為目標(biāo)聲源(即點(diǎn)S)到坐標(biāo)原點(diǎn)0的距離,兩個麥克風(fēng)姐與吣接收到聲音的時間差 用表示,則通過下式可以確定發(fā)出所述語音信號對應(yīng)的初始方位以及位置:
[0064] 圖像獲取單元42,用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初 始方位對應(yīng)的圖像。
[0065] 當(dāng)確定了初始方位后,若機(jī)器人的當(dāng)前方位與所述初始方位不同,則將機(jī)器人從 當(dāng)前方位調(diào)整至所述初始方位,并通過圖像獲取裝置,如攝像頭、高清彩色攝像機(jī)等獲取所 述方位對應(yīng)的圖像,獲取的圖像可為2D圖像,也可為3D圖像。
[0066] 人臉檢測單元43,用于檢測獲取的圖像是否存在人臉。
[0067] 合法用戶判斷單元44,用于在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶 是否為合法的用戶。
[0068] 可選地,所述合法用戶判斷單元44包括:
[0069]用戶信息獲取模塊,用于獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像。其中, 獲取的人臉對應(yīng)的用戶的語音信號可為確定初始方位對應(yīng)的語音信號,也可通過提示用戶 再次發(fā)出語音而獲得的語音信號,同理,獲取的人臉對應(yīng)的用戶的圖像可為機(jī)器人在初始 方位獲得的人臉的圖像,也可為再次拍攝獲取的人臉的圖像。
[0070] 用戶的合法性判定模塊,用于在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信 號和/或預(yù)設(shè)的圖像相同時,判定所述人臉對應(yīng)的用戶為合法的用戶,否則,判定所述人臉 對應(yīng)的用戶為非法的用戶。具體地,通過預(yù)設(shè)一個或多個語音信號和/或預(yù)設(shè)一個或多個圖 像,當(dāng)獲取的語音信號和/或圖像與預(yù)設(shè)的語音信號和/或圖像相同時,判定所述人臉對應(yīng) 的用戶為合法的用戶。當(dāng)然,在判斷兩個語音信號是否相同時,可通過判斷語音信號中的音 頻和/或音色等是否相同來判斷。
[0071] 可選地,為了使得機(jī)器人與用戶的交流更自然和更逼真,可通過調(diào)整一定的角度 使得機(jī)器人正面面對用戶交流,增加了人機(jī)交互的智能性,此時,該機(jī)器人與用戶的交互裝 置包括:
[0072] 調(diào)整的角度確定單元,用于根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角 度。
[0073] 具體地,所述調(diào)整的角度確定單元包括:
[0074] 圖像的信息確定模塊,用于確定人臉與獲取的圖像的中心點(diǎn)的距離c,以及,確定 獲取的圖像的寬度a。
[0077] 其中,α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角,b為機(jī)器人與獲取的圖 像的中心點(diǎn)的距離,β為需調(diào)整的角度,γ為機(jī)器人的視角。
[0078] 此外,在確定需調(diào)整的角度之前,所述調(diào)整的角度確定單元包括:確定根據(jù)哪個人 臉在獲取的圖像的位置確定需調(diào)整的角度。具體地,在獲取的圖像存在人臉時,判斷人臉的 個數(shù)是否大于1;在人臉的個數(shù)大于1時,選擇深度最小的人臉,并根據(jù)所述深度最小的人臉 在獲取的圖像的位置確定需調(diào)整的角度;在人臉的個數(shù)等于1時,根據(jù)所述人臉在獲取的圖 像的位置確定需調(diào)整的角度。
[0079]人機(jī)交互單元45,用于在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用 戶進(jìn)行交互。
[0080] 為了進(jìn)一步地提高機(jī)器人的安全性,該機(jī)器人與用戶的交互裝置包括:
[0081] 非法的用戶圖像獲取單元,用于在所述人臉對應(yīng)的用戶為非法的用戶時,獲取所 述非法的用戶的人臉圖像,并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶。進(jìn) 一步地,當(dāng)發(fā)送至指定的用戶之后,發(fā)出提示,以使用戶及時查看。其中,該指定的用戶通常 為合法的用戶。由于將非法的用戶的人臉圖像發(fā)送至指定的用戶(如發(fā)送至機(jī)器人的主 人),因此,使得指定的用戶能夠及時獲知非法的用戶正在嘗試操作機(jī)器人,從而能夠及時 阻止非法的用戶的動作。
[0082] 本發(fā)明第二實施例中,由于只有在判斷出人臉對應(yīng)的用戶為合法的用戶時,才與 所述合法的用戶進(jìn)行交互,因此,保證機(jī)器人執(zhí)行的指令都為其主人發(fā)出的指令,從而提高 了執(zhí)行指令的精確性。
[0083] 本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單 元及算法步驟,能夠以電子硬件、或者計算機(jī)軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟 以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員 可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出 本發(fā)明的范圍。
[0084] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、 裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
[0085] 在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以 通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件 可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或 討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦 合或通信連接,可以是電性,機(jī)械或其它的形式。
[0086]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0087] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。
[0088] 所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以 存儲在一個計算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說 對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計 算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個 人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。 而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(R0M,Read-0nly Memory)、隨機(jī)存取存 儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0089] 以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項】
1. 一種機(jī)器人與用戶的交互方法,其特征在于,所述方法包括: 接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位; 將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位對應(yīng)的圖像; 檢測獲取的圖像是否存在人臉; 在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為合法的用戶; 在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行交互。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述識別所述人臉對應(yīng)的用戶是否為合法 的用戶,具體包括: 獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像; 在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號和/或預(yù)設(shè)的圖像相同時,判定 所述人臉對應(yīng)的用戶為合法的用戶,否則,判定所述人臉對應(yīng)的用戶為非法的用戶。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在所述識別所述人臉對應(yīng)的用戶是否 為合法的用戶時,包括: 根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度; 根據(jù)所述需調(diào)整的角度進(jìn)行相應(yīng)的調(diào)整。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述人臉在獲取的圖像的位置確 定需調(diào)整的角度,具體包括: 確定人臉與獲取的圖像的中屯、點(diǎn)的距離C,W及,確定獲取的圖像的寬度a;其中,α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角,b為機(jī)器人與獲取的圖像的 中屯、點(diǎn)的距離,β為需調(diào)整的角度,丫為機(jī)器人的視角。5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,在所述人臉對應(yīng)的用戶為非法 的用戶時,獲取所述非法的用戶的人臉圖像,并將獲取的所述非法的用戶的人臉圖像發(fā)送 至指定的用戶。6. -種機(jī)器人與用戶的交互裝置,其特征在于,所述裝置包括: 語音信號接收單元,用于接收到語音信號后,確定發(fā)出所述語音信號對應(yīng)的初始方位; 圖像獲取單元,用于將機(jī)器人從當(dāng)前方位調(diào)整至所述初始方位,并獲取所述初始方位 對應(yīng)的圖像; 人臉檢測單元,用于檢測獲取的圖像是否存在人臉; 合法用戶判斷單元,用于在獲取的圖像存在人臉時,識別所述人臉對應(yīng)的用戶是否為 合法的用戶; 人機(jī)交互單元,用于在所述人臉對應(yīng)的用戶為合法的用戶時,與所述合法的用戶進(jìn)行 交互。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述合法用戶判斷單元包括: 用戶信息獲取模塊,用于獲取所述人臉對應(yīng)的用戶的語音信號和/或圖像; 用戶的合法性判定模塊,用于在所述人臉對應(yīng)的用戶的語音信號與預(yù)設(shè)的語音信號 和/或預(yù)設(shè)的圖像相同時,判定所述人臉對應(yīng)的用戶為合法的用戶,否則,判定所述人臉對 應(yīng)的用戶為非法的用戶。8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置包括: 調(diào)整的角度確定單元,用于根據(jù)所述人臉在獲取的圖像的位置確定需調(diào)整的角度。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述調(diào)整的角度確定單元包括: 圖像的信息確定模塊,用于確定人臉與獲取的圖像的中屯、點(diǎn)的距離c,W及,確定獲取 的圖像的寬度a; 角度計算模塊,用于根據(jù)下??其中,α為獲取的圖像的最左邊或最右邊與機(jī)器人的夾角,b為機(jī)器人與獲取的圖像的 中屯、點(diǎn)的距離,β為需調(diào)整的角度,丫為機(jī)器人的視角。10. 根據(jù)權(quán)利要求6至9任一項所述的裝置,其特征在于,所述裝置包括: 非法的用戶圖像獲取單元,用于在所述人臉對應(yīng)的用戶為非法的用戶時,獲取所述非 法的用戶的人臉圖像,并將獲取的所述非法的用戶的人臉圖像發(fā)送至指定的用戶。
【文檔編號】G06F21/32GK106096373SQ201610480936
【公開日】2016年11月9日
【申請日】2016年6月27日
【發(fā)明人】林綠德, 莊永軍
【申請人】旗瀚科技股份有限公司