智能玩偶及智能玩偶的動(dòng)作控制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能電子設(shè)備領(lǐng)域,尤其涉及一種智能玩偶及智能玩偶的動(dòng)作控制方法。
【背景技術(shù)】
[0002]傳統(tǒng)的智能玩偶在進(jìn)行語音交互時(shí),可以播放預(yù)制的語音并配合指定的動(dòng)作,也就是,將預(yù)制的語音與對(duì)應(yīng)的肢體動(dòng)作的腳本內(nèi)置于智能玩偶中,使得指定的語音配合指定的肢體動(dòng)作。該傳統(tǒng)的智能玩偶所能支配的肢體動(dòng)作是預(yù)制的與指定語音配合的,對(duì)于隨機(jī)獲取的非預(yù)制語音,則無法配合肢體動(dòng)作。
【發(fā)明內(nèi)容】
[0003]本發(fā)明解決的技術(shù)問題之一是提供可以根據(jù)隨機(jī)語音配合身體動(dòng)作的智能玩偶,使得智能玩偶在進(jìn)行語音交互過程更加生動(dòng)。
[0004]根據(jù)本發(fā)明一方面的一個(gè)實(shí)施例,提供了一種智能玩偶,包括:
[0005]獲取設(shè)備,用于獲取待播放音頻的音量的大?。?br>[0006]動(dòng)作參數(shù)確定設(shè)備,用于根據(jù)所述音量確定動(dòng)作參數(shù)值;
[0007]動(dòng)作控制設(shè)備,用于根據(jù)所述動(dòng)作參數(shù)值控制智能玩偶的身體動(dòng)作。
[0008]可選地,還包括:
[0009]待播放音頻提供設(shè)備,用于提供所述待播放音頻給獲取設(shè)備。
[0010]可選地,所述動(dòng)作參數(shù)值包括:
[0011]表情動(dòng)作參數(shù)值和/或肢體動(dòng)作參數(shù)值,其中,
[0012]表情動(dòng)作參數(shù)值至少包括:嘴巴動(dòng)作幅度參數(shù)值;
[0013]肢體動(dòng)作參數(shù)值至少包括:頭部搖動(dòng)幅度參數(shù)值。
[0014]可選地,所述動(dòng)作參數(shù)確定設(shè)備根據(jù)所述音量確定動(dòng)作參數(shù)值,包括:
[0015]動(dòng)作參數(shù)確定設(shè)備先確定所述音量所屬的區(qū)間,再確定所述音量所屬的區(qū)間對(duì)應(yīng)的預(yù)設(shè)動(dòng)作參數(shù)值。
[0016]可選地,動(dòng)作參數(shù)確定設(shè)備根據(jù)所述音量確定動(dòng)作參數(shù)值包括:
[0017]音量的絕對(duì)值越大,則動(dòng)作參數(shù)確定設(shè)備所確定的動(dòng)作參數(shù)值越大。
[0018]可選地,所述動(dòng)作控制設(shè)備用于:
[0019]在所述待播放音頻被音頻播放設(shè)備播放的同時(shí)控制智能玩偶的身體動(dòng)作,且保持所播放音頻與身體動(dòng)作同步。
[0020]根據(jù)本發(fā)明另一方面的一個(gè)實(shí)施例,提供了一種智能玩偶的動(dòng)作控制方法,包括:
[0021]獲取待播放音頻的音量的大小;
[0022]根據(jù)所述音量確定動(dòng)作參數(shù)值;
[0023]根據(jù)所述動(dòng)作參數(shù)值控制智能玩偶的身體動(dòng)作。
[0024]可選地,獲取待播放音頻的音量的大小包括:
[0025]從所述智能玩偶本地獲取所述待播放音頻的PCM振幅值作為表示音量大小的參數(shù)。
[0026]可選地,所述動(dòng)作參數(shù)值包括:
[0027]表情動(dòng)作參數(shù)值和/或肢體動(dòng)作參數(shù)值,其中,
[0028]表情動(dòng)作參數(shù)值至少包括:嘴巴動(dòng)作幅度參數(shù)值;
[0029]肢體動(dòng)作參數(shù)值至少包括:頭部搖動(dòng)幅度參數(shù)值。
[0030]可選地,所述根據(jù)所述音量確定動(dòng)作參數(shù)值,包括:
[0031]確定所述音量所屬的區(qū)間;
[0032]確定所述音量所屬的區(qū)間對(duì)應(yīng)的預(yù)設(shè)動(dòng)作參數(shù)值。
[0033]可選地,所述根據(jù)所述音量確定動(dòng)作參數(shù)值包括:
[0034]音量的絕對(duì)值越大,則所確定的動(dòng)作參數(shù)值越大。
[0035]可選地,根據(jù)所述動(dòng)作參數(shù)值控制智能玩偶的身體動(dòng)作,包括:
[0036]在播放所述待播放音頻的同時(shí)控制智能玩偶的身體動(dòng)作,且保持所播放音頻與身體動(dòng)作同步。
[0037]本申請實(shí)施例可以根據(jù)音量的大小確定智能玩偶動(dòng)作參數(shù)值,并進(jìn)一步根據(jù)該動(dòng)作參數(shù)值控制智能玩偶的身體動(dòng)作,實(shí)現(xiàn)了根據(jù)任意音頻即可配合身體動(dòng)作,而不局限于與預(yù)制的特定語音對(duì)應(yīng)的特定的動(dòng)作,使得智能玩偶在進(jìn)行語音交互過程更加生動(dòng)。
[0038]本領(lǐng)域普通技術(shù)人員將了解,雖然下面的詳細(xì)說明將參考圖示實(shí)施例、附圖進(jìn)行,但本發(fā)明并不僅限于這些實(shí)施例。而是,本發(fā)明的范圍是廣泛的,且意在僅通過后附的權(quán)利要求限定本發(fā)明的范圍。
【附圖說明】
[0039]通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0040]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的智能玩偶結(jié)構(gòu)示意圖。
[0041]圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的智能玩偶結(jié)構(gòu)示意圖。
[0042]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的智能玩偶動(dòng)作控制方法流程圖。
[0043]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0044]由于現(xiàn)有的智能玩偶只能配合預(yù)制的語音做出指定的肢體動(dòng)作,對(duì)于隨機(jī)獲取的非預(yù)制語音,則無法配合相應(yīng)動(dòng)作?;诖耍旧暾垖?shí)施例提供一種可以配合隨機(jī)語音做出相應(yīng)身體動(dòng)作的智能玩偶,其通過確定音量大小來進(jìn)行動(dòng)作控制,例如,通過識(shí)別語音的PCM(Pulse Code Modulat1n,脈沖編碼調(diào)制)振幅值來確定音量大小,具體實(shí)施方法將在下文詳述。
[0045]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0046]圖1是根據(jù)本申請一個(gè)實(shí)施例的智能玩偶結(jié)構(gòu)示意圖,需要說明的是,本實(shí)施例以及以下實(shí)施例對(duì)智能玩偶的外型、材料及種類不做具體限制,所述智能玩偶可以為毛絨玩偶,木質(zhì)玩偶或金屬制玩偶等等;如圖1中所示,本實(shí)施例所述智能玩偶主要包括:獲取設(shè)備10、動(dòng)作參數(shù)確定設(shè)備11、以及動(dòng)作控制設(shè)備12。
[0047]其中,所述獲取設(shè)備10,主要用于獲取待播放音頻的音量大小(以下簡稱音量);獲取設(shè)備10獲取待播放音頻的振幅值需先獲取待播放音頻,本申請實(shí)施例對(duì)該獲取設(shè)備10獲取待播放音頻的時(shí)機(jī)不做具體限制,其可以在該待播放音頻被播放前任意時(shí)刻獲取該待播放音頻,只要保證該待播放音頻播放時(shí)已經(jīng)根據(jù)該音量確定相應(yīng)動(dòng)作的動(dòng)作參數(shù)值,并可以配合相應(yīng)動(dòng)作即可。
[0048]獲取設(shè)備10獲取待播放音頻后,即可獲取該待播放音頻的音量,本實(shí)施例提供的該獲取設(shè)備10獲取待播放音頻的音量的方法包括但不限于以下方法I)?方法4)中任一種:
[0049]方法I)獲取待播放音頻每一時(shí)刻的音量。
[0050]方法2)獲取待播放音頻固定時(shí)間間隔后對(duì)應(yīng)時(shí)刻的音量。例如,每隔I秒,或每隔2秒獲取一個(gè)音量,獲取的音量作為該固定時(shí)間間隔內(nèi)的音量的代表值。
[0051 ] 方法3)獲取待播放音頻固定時(shí)間間隔后特定時(shí)間段內(nèi)的音量。例如,每隔I秒獲取1.5秒鐘內(nèi)的音量,或每隔2秒獲取2秒鐘內(nèi)的音量。
[0052]方法4)按照待播放音頻播放順序隨機(jī)并連續(xù)獲取待播放音頻任意時(shí)刻或任意時(shí)間段內(nèi)的音量。
[0053]本申請實(shí)施例中,該獲取設(shè)備10可從所述智能玩偶本地獲取該待播放音頻的音量,也可通過所述智能玩偶的網(wǎng)絡(luò)接口從互聯(lián)網(wǎng)獲取該待播放音頻的音量。
[0054]所述動(dòng)作參數(shù)確定設(shè)備11,主要用于根據(jù)所述音量確定動(dòng)作參數(shù)值。本申請實(shí)施例所述動(dòng)作參數(shù)值包括但不限于:表情動(dòng)作參數(shù)值和/或肢體動(dòng)作參數(shù)值,其中,表情動(dòng)作參數(shù)值至少包括:嘴巴動(dòng)作幅度參數(shù)值,還可包括眼睛動(dòng)作幅度參數(shù)值等。所述嘴巴動(dòng)作幅度參數(shù)值可以為嘴巴張開時(shí)上下嘴唇間最大距離值。同理,眼睛動(dòng)作幅度參數(shù)值可以為眼睛張開時(shí)上下眼瞼間最大距離值。所述肢體動(dòng)作參數(shù)值至少包括:頭部搖動(dòng)幅度參數(shù)值,還可包括身體晃動(dòng)幅度參數(shù)值和/或手臂動(dòng)作參數(shù)值等等,所述頭部搖動(dòng)幅度參數(shù)值可以為以頭部上的選定點(diǎn)為圓心朝任一方向擺動(dòng)的角度值或振幅值。同理,身體晃動(dòng)幅度參數(shù)值可以為以身體上的一個(gè)指定點(diǎn)為圓心朝任一方向擺動(dòng)的角度值或振幅值,手臂動(dòng)作參數(shù)值可以為以手臂上的一個(gè)特定點(diǎn)為基點(diǎn)朝任一方向移動(dòng)的距離值。
[0055]一般情況下,可以用音頻的振幅值作為音量大小的參數(shù),音頻的振幅值越大說明音量越大,則可認(rèn)為說話者越興奮,則對(duì)應(yīng)的身體動(dòng)作幅度就越大,因此,本申請實(shí)施例所述的動(dòng)作參數(shù)確定設(shè)備11在根據(jù)振幅值確定動(dòng)作參數(shù)值時(shí),可遵照如下原則,即:振幅值的絕對(duì)值越大,則所確定的動(dòng)作參數(shù)值越大,即所確定的表情動(dòng)作參數(shù)值以及肢體動(dòng)作參數(shù)值越大。例如,振幅值的絕對(duì)值大,則所確定的表情動(dòng)作參數(shù)值中的嘴巴動(dòng)作幅度參數(shù)值大,同時(shí),根據(jù)該振幅值確定的肢體動(dòng)作參數(shù)值中的頭部搖動(dòng)幅度參數(shù)值大。
[0056]具體的,本申請實(shí)施例的動(dòng)作參數(shù)確定設(shè)備11根據(jù)振幅值確定動(dòng)作參數(shù)值的方法可以包括:先確定所述振幅值所屬的區(qū)間,再確定所述振幅值所屬的區(qū)間對(duì)應(yīng)的預(yù)設(shè)動(dòng)作參數(shù)值。也就是