專(zhuān)利名稱(chēng):根據(jù)吠聲的特征分析判斷狗的情緒的設(shè)備及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種根據(jù)聲音的特征分析判斷情緒的設(shè)備,更具體地說(shuō),涉及一種根據(jù)對(duì)吠叫聲音的特征分析判斷狗的情緒的設(shè)備。
背景技術(shù):
動(dòng)物,特別是狗,長(zhǎng)期以來(lái)與人類(lèi)有密切的關(guān)系,扮演著重要的角色,不僅作為警衛(wèi)、救助目的的狗,而且作為寵物成為家庭的一員。因此,毫不夸張地說(shuō),與狗溝通是人類(lèi)長(zhǎng)期的夢(mèng)想,并作出了各種努力。發(fā)明名稱(chēng)為“了解動(dòng)物的思想的方法和了解動(dòng)物的思想的裝置”,公開(kāi)號(hào)為JP特開(kāi)平10-3479的發(fā)明專(zhuān)利公開(kāi)文獻(xiàn),公開(kāi)了一種了解動(dòng)物的思想的方法和裝置,接收寵物和家畜等動(dòng)物發(fā)出的聲音,并且把它轉(zhuǎn)變成聲音信號(hào),接收由這些動(dòng)物的動(dòng)作形成的攝像,并且把它轉(zhuǎn)變成視頻信號(hào),把這些聲音信號(hào)和視頻信號(hào)與已經(jīng)進(jìn)行過(guò)動(dòng)物行為學(xué)的行為分析的聲音和動(dòng)作的數(shù)據(jù)作比較。依靠這種技術(shù),根據(jù)狗的吠聲和動(dòng)作,可以了解狗的思想,但是沒(méi)有公開(kāi)具體的相應(yīng)于狗的情緒的具體聲音和動(dòng)作的數(shù)據(jù)。
象這樣,基于明確地把握狗的具體情緒和具有這種情緒的狗發(fā)出的有特色的吠聲之間的關(guān)系,設(shè)定與那種情緒相對(duì)應(yīng)的基準(zhǔn)聲音模式,根據(jù)把狗的吠聲與其基準(zhǔn)聲音模式比較進(jìn)行的聲音的特征分析而客觀(guān)地判斷狗的情緒的裝置不存在。因此,具體地說(shuō),現(xiàn)在根據(jù)吠聲客觀(guān)地判斷狗的情緒事實(shí)上是不可能的。本發(fā)明是為了解決現(xiàn)有技術(shù)中的上述諸問(wèn)題作出的,其目的是提供一種情緒判斷設(shè)備,通過(guò)設(shè)定相應(yīng)于狗的各種情緒的基準(zhǔn)聲音模式,把它們與狗吠的聲音模式相比較,根據(jù)狗的吠聲客觀(guān)地判斷具體狗的情緒。
發(fā)明內(nèi)容
根據(jù)權(quán)利要求1所述的本發(fā)明,包括變換裝置,其把狗的吠聲轉(zhuǎn)換成電音頻信號(hào);輸入聲音模式提取裝置,其提取所述聲音信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式;情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置,其存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式;比較裝置,其把所述輸入聲音模式與所述情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較;情緒判斷裝置,其通過(guò)所述比較,判斷與所述輸入聲音模式最相關(guān)的情緒;其特征在于,所述情緒區(qū)別基準(zhǔn)聲音模式,至少包括下列基準(zhǔn)聲音模式中的一種,相應(yīng)于寂寞的情緒的基準(zhǔn)聲音模式,其具有5000Hz左右重要的頻率成份,沒(méi)有小于3000Hz的頻率成份,沒(méi)有高次諧波成份,并且持續(xù)0.2-0.3秒時(shí)間;相應(yīng)于失落的情緒的基準(zhǔn)聲音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次諧波的聲音持續(xù)0.3-1秒后,沒(méi)有250-8000Hz的明確的基音和高次諧波,并且具有1000Hz附近重要頻率成份的聲音持續(xù);相應(yīng)于威嚇的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,和在具有1000Hz左右重要頻率成份的聲音之后具有240-360Hz的基音,到1500Hz具有明確的高次諧波,和到8000Hz具有高次諧波的聲音持續(xù)0.8-1.5秒;相應(yīng)于自信的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的頻率成份;相應(yīng)于快樂(lè)的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確的基音和高次諧波,和在具有1000Hz附近重要的頻率成份的聲音之后,具有200-300Hz的基音,具有到1500Hz的高次諧波的聲音持續(xù);相應(yīng)于渴望的情緒的基準(zhǔn)聲音模式,其具有250-500Hz的基音,和到8000Hz是具有高次諧波的聲音,基音的頻率變化。
根據(jù)權(quán)利要求2所述的本發(fā)明,包括,把狗的吠聲轉(zhuǎn)換成電音頻信號(hào)的步驟,提取所述音頻信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式的步驟,存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式的步驟,把所述輸入聲音模式與所述情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較的步驟,通過(guò)所述比較,判斷與所述輸入聲音模式最相關(guān)的情緒的步驟;其特征在于,所述情緒區(qū)別基準(zhǔn)聲音模式,至少包括下列基準(zhǔn)聲音模式中的一種,相應(yīng)于寂寞的情緒的基準(zhǔn)聲音模式,其具有5000Hz左右重要的頻率成份,沒(méi)有小于3000Hz的頻率成份,沒(méi)有高次諧波成份,并且持續(xù)0.2-0.3秒時(shí)間;相應(yīng)于失落的情緒的基準(zhǔn)聲音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次諧波的聲音持續(xù)0.3-1秒后,沒(méi)有250-8000Hz的明確的基音和高次諧波,并且具有1000Hz附近重要頻率成份的聲音持續(xù);相應(yīng)于威嚇的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,和在具有1000Hz左右重要頻率成份的聲音之后具有240-360Hz的基音,到1500Hz具有明確的高次諧波,和到8000Hz具有高次諧波的聲音持續(xù)0.8-1.5秒;相應(yīng)于自信的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的頻率成份;相應(yīng)于快樂(lè)的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確的基音和高次諧波,和在具有1000Hz附近重要的頻率成份的聲音之后,具有200-300Hz的基音,具有到1500Hz的高次諧波的聲音持續(xù);相應(yīng)于渴望的情緒的基準(zhǔn)聲音模式,其具有250-500Hz的基音,和到8000Hz是具有高次諧波的聲音,基音的頻率變化。
圖1是表示本發(fā)明的一實(shí)施方式的系統(tǒng)的構(gòu)成圖。
圖2是表示相應(yīng)于“寂寞”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.05秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖3是表示相應(yīng)于“失落”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.025秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖4是表示相應(yīng)于“威嚇”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.05秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖5是表示相應(yīng)于“自信”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.02秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖6是表示相應(yīng)于“決樂(lè)”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.05秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖7是表示相應(yīng)于“渴望”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖(橫軸的每個(gè)刻度是0.1秒,縱軸的每個(gè)刻度是250Hz。特征部分被圈起來(lái))。
圖8是表示情緒區(qū)別基準(zhǔn)聲音模式的實(shí)際記錄情況例子的圖。
具體實(shí)施例方式
下面參照
本發(fā)明的實(shí)施形式。圖1是表示構(gòu)成本發(fā)明的基于吠聲聲音的特征分析的狗的情緒判斷設(shè)備1(下文中簡(jiǎn)稱(chēng)為情緒判斷設(shè)備)的方框圖。情緒判斷設(shè)備1由變換裝置2、輸入聲音模式提取裝置3、情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置4、比較裝置5、情緒判斷裝置6、和情緒輸出裝置7構(gòu)成。
變換裝置2是把狗吠聲變換成表示它的數(shù)字音頻信號(hào)的構(gòu)件。雖然沒(méi)有單獨(dú)地圖示,變換裝置2由麥克風(fēng)、A/D轉(zhuǎn)換器等構(gòu)成。麥克風(fēng)接收狗的吠聲,把它轉(zhuǎn)換成電信號(hào)。A/D轉(zhuǎn)換器把該電信號(hào)數(shù)字化,產(chǎn)生音頻信號(hào)。而且,麥克風(fēng)可以為無(wú)線(xiàn)麥克風(fēng)而獨(dú)立,能夠形成較小的尺寸,以便容易裝在吠聲分析的狗上。
輸入聲音模式提取裝置3是從音頻信號(hào)中提取特征模式的構(gòu)件。雖然沒(méi)有單獨(dú)地圖示,輸入聲音模式提取裝置3由CPU(也可以為DSP)、存儲(chǔ)使得CPU作為輸入聲音模式提取裝置3運(yùn)行的程序的ROM、用于工作區(qū)域的RAM等構(gòu)成。聲音模式一般利用聲音信號(hào)的時(shí)間與頻率成份的關(guān)系圖形式表示。關(guān)系圖以橫軸為時(shí)間、縱軸為頻率而表示聲音之時(shí)間的頻率分布,其最好利用以一定的時(shí)間間隔和一定的頻率間隔分割的每個(gè)網(wǎng)格內(nèi)的聲音能量分布的形式表示。通過(guò)象這樣表示關(guān)系圖,可以包括和定量處理聲音信號(hào)。具體地說(shuō),關(guān)系圖把頻率帶分割成多個(gè)頻段,能把每個(gè)頻段內(nèi)的聲音能量分布數(shù)值化。帶寬和頻段數(shù)量可以確定為合適的值。最好,對(duì)聲音能量進(jìn)行合適的數(shù)學(xué)處理,這樣能更明確表示時(shí)間的特征等。這種數(shù)學(xué)處理可以使用各種運(yùn)算。例如,通過(guò)實(shí)施適當(dāng)?shù)拇翱诤瘮?shù)的選擇,適當(dāng)?shù)臒o(wú)控制作用區(qū)的設(shè)定,適當(dāng)?shù)腇FT變換單位的設(shè)定、適當(dāng)?shù)尼尫艞l件的設(shè)定、適當(dāng)?shù)膮⒖挤绞降脑O(shè)定、適當(dāng)?shù)倪M(jìn)攻條件的設(shè)定、和適當(dāng)?shù)膮⒖键c(diǎn)條件的設(shè)定等,可以使關(guān)系圖更適應(yīng)目的。在確定后面所述的情緒區(qū)別基準(zhǔn)聲音模式的時(shí)候進(jìn)行與這些數(shù)學(xué)處理相同的處理。象這樣,實(shí)施情緒區(qū)別基準(zhǔn)聲音模式的數(shù)學(xué)處理與實(shí)施輸入聲音模式的數(shù)學(xué)處理相同,所以如后面所述,通過(guò)比較裝置5可以簡(jiǎn)單地實(shí)施輸入聲音模式與情緒區(qū)別基準(zhǔn)聲音模式的比較處理。
情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置4是存儲(chǔ)相應(yīng)于各種情緒的基準(zhǔn)聲音模式的構(gòu)件。作為典型方式,情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置4是存儲(chǔ)所述情緒區(qū)別基準(zhǔn)聲音模式的ROM。ROM可以是可重寫(xiě)的FLASHROM,相應(yīng)于將來(lái)基準(zhǔn)聲音模式的更新、情緒數(shù)量的增加等,可以重寫(xiě)數(shù)據(jù)。通常,基準(zhǔn)聲音模式表現(xiàn)為聲音信號(hào)的時(shí)間與頻率成份之間的關(guān)系圖的形式。關(guān)系圖以橫軸為時(shí)間、縱軸為頻率表示聲音之時(shí)變頻率分布,最好,利用以一定的時(shí)間間隔和一定的頻率間隔分割成的每個(gè)網(wǎng)格內(nèi)的聲音能量分布的形式表示之。另外,基準(zhǔn)聲音模式可以是這樣的模式,其中關(guān)系圖的共同的顯著部分被特別強(qiáng)調(diào)。通過(guò)這樣,在把輸入聲音模式與基準(zhǔn)聲音模式比較的時(shí)候,盡管有多種輸入聲音模式,只要其中具有相應(yīng)于情緒的一般性顯著的部分,就可以與對(duì)應(yīng)于任一種情緒的基準(zhǔn)聲音模式匹配,可以提高情緒判斷的準(zhǔn)確度。具體地說(shuō),最好,在確定基準(zhǔn)聲音模式的時(shí)候?qū)嵤┑奶幚恚c利用所述輸入聲音模式提取裝置3生成輸入聲音模式的關(guān)系圖時(shí)實(shí)施的數(shù)學(xué)處理相同。圖8是存儲(chǔ)在情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置4中的基準(zhǔn)聲音模式的一例子。頻率帶被分割成5個(gè)頻段。在每個(gè)頻段存儲(chǔ)著通過(guò)進(jìn)行向聲音能量附加時(shí)間因素等的適當(dāng)?shù)臄?shù)學(xué)處理而得到的值。對(duì)于那些值,例如可以象(αx、βx、γx、δx、εx)那樣表示第x號(hào)的值的組。而且那些值不限于標(biāo)量,也可以是矢量。另外,由于狗的吠聲音調(diào)根據(jù)狗的品種、狗的大小等變化,在本例子中,通過(guò)對(duì)每種狗,如A種狗、B種狗、......,確定基準(zhǔn)聲音模式,可進(jìn)一步提高情緒判斷的精度。對(duì)于每個(gè)狗種,基準(zhǔn)聲音模式具有相應(yīng)于每種情緒(情緒a-f)的數(shù)據(jù)。另外,對(duì)于特定狗種的特定情緒,例如狗種A的情緒a,也具有如a1、a2、......這樣的多個(gè)典型的數(shù)據(jù)。通過(guò)這樣,即使特定狗種的狗具有特定情緒時(shí)產(chǎn)生的吠聲有多種,仍能正確判斷情緒。
在確定相應(yīng)于狗的各種情緒的基準(zhǔn)聲音模式的時(shí)候,有各種情緒時(shí)狗發(fā)出的吠聲的數(shù)據(jù)是針對(duì)多個(gè)狗而采集的。采集吠聲時(shí)狗的情緒基于動(dòng)物行為學(xué),通過(guò)那時(shí)狗的行動(dòng)、舉止而判斷。采集的多個(gè)吠聲數(shù)據(jù)按情緒區(qū)別分類(lèi),將與那些情緒區(qū)別的吠聲數(shù)據(jù)共同的聲音模式定義為相應(yīng)于那種情緒的基準(zhǔn)聲音模式。而且,對(duì)于這種基準(zhǔn)聲音模式,象上述那樣,特別強(qiáng)調(diào)共同的顯著部分。作為基本的情緒,采用“寂寞”、“失落”、“威嚇”、“自信”、“快樂(lè)”、和“渴望”6種情緒。狗的行動(dòng)和舉止與情緒,基于動(dòng)物行為學(xué)象下述這樣相對(duì)應(yīng)?!凹拍钡那榫w,對(duì)應(yīng)于,靜靜的,鼻子上抬,發(fā)出嗚嗚聲,注視著一點(diǎn)這樣的行為。“失落”的情緒,對(duì)應(yīng)于,感到憤怒,發(fā)出低沉的聲音,不知道干什么這樣的行為?!巴槨钡那榫w,對(duì)應(yīng)于,對(duì)于人、物體,既不向前也不離開(kāi)的夸張地吠叫這樣的行為。“自信”的情緒,對(duì)應(yīng)于,連續(xù)地高聲叫想引起注意這樣的行為。“快樂(lè)”的情緒,對(duì)應(yīng)于,嬉戲地跳向它們的主人,同時(shí)亂蹦亂跳地吠叫這樣的行為?!翱释钡那榫w,對(duì)應(yīng)于,在進(jìn)餐和散步期間,向人吠叫顯示不能再等、催促這樣的行為。下面相應(yīng)于每種情緒,說(shuō)明聲音模式的特征。
相應(yīng)于“寂寞”的情緒,對(duì)應(yīng)于這樣的聲音模式,具有5000Hz左右重要的頻率成份,沒(méi)有小于3000Hz的頻率成份,沒(méi)有高次諧波成份,和持續(xù)0.2-0.3秒時(shí)間。這種聲音模式聽(tīng)起來(lái)更像嘶叫聲(“ク-ン”、“キュ-ン”)。圖2是表示相應(yīng)于“寂寞”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
相應(yīng)于“失落”的情緒,對(duì)應(yīng)于這樣的聲音模式,具有160-240Hz的基音,并且在具有到1500Hz的高次諧波的聲音持續(xù)0.3-1秒后,沒(méi)有250-8000Hz的明確的基音和高次諧波,并且具有1000Hz附近重要頻率成份的聲音持續(xù)。這種聲音模式聽(tīng)起來(lái)更像“嗚嗚嗚、哇”聲(“グルルルルル、ワン”)。圖3是表示相應(yīng)于“失落”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
相應(yīng)于“威嚇”的情緒,對(duì)應(yīng)于這樣的聲音模式,不具有250-8000Hz的明確基音和高次諧波,和在具有1000Hz左右重要頻率成份的聲音之后具有240-360Hz的基音,到1500Hz具有明確的高次諧波,和到8000Hz具有高次諧波的聲音持續(xù)0.8-1.5秒。這種聲音模式聽(tīng)起來(lái)更像“哇、哽唔哽唔哽唔”聲(“ワン、ギャゥ----”)。圖4是表示相應(yīng)于“威嚇”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
相應(yīng)于“自信”的情緒,對(duì)應(yīng)于這樣的聲音模式,不具有250-8000Hz的明確基音和高次諧波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的頻率成份。這種聲音模式聽(tīng)起來(lái)更像“キャン”聲。圖5是表示相應(yīng)于“自信”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
相應(yīng)于“快樂(lè)”的情緒,對(duì)應(yīng)于這樣的聲音模式,不具有250-8000Hz的明確的基音和高次諧波,和在具有1000Hz附近重要的頻率成份的聲音之后,具有200-300Hz的基音,具有到1500Hz的高次諧波的聲音持續(xù)。這種聲音,聽(tīng)起來(lái)更像“ヮン、グ---”聲。圖6是表示相應(yīng)于“快樂(lè)”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
相應(yīng)于“渴望”的情緒,對(duì)應(yīng)于這樣的聲音模式,其具有250-500Hz的基音,和到8000Hz是具有高次諧波的聲音,基音的頻率變化。這種聲音聽(tīng)起來(lái)更像“ギュ---”聲。圖7是表示相應(yīng)于“渴望”的情緒的典型聲音模式的“時(shí)間-頻率成份關(guān)系圖”的圖。
比較裝置5是把輸入聲音模式與情緒區(qū)別基準(zhǔn)聲音模式比較的構(gòu)件。雖然沒(méi)有單獨(dú)地圖示,比較裝置5由CPU(也可以為DSP)、存儲(chǔ)使CPU作為比較裝置5的程序的ROM、用于工作區(qū)域的RAM等構(gòu)成。比較可以通過(guò)加重平衡處理為特征之模式的模式匹配的方法等來(lái)進(jìn)行。比較的結(jié)果作為相關(guān)的高或低而輸出。例如,在使用圖8所示形式的基準(zhǔn)聲音模式的情況下,相對(duì)于輸入聲音模式(αm、βm、γm、δm、εm),比較裝置5計(jì)算與各個(gè)基準(zhǔn)聲音模式的數(shù)據(jù)(αx、βx、γx、δx、εx)之間的距離Xm=αm-αx+βm-βx+γm-γx+δm-δx+8m-εx。距離Xm是表示輸入聲音模式和與之相比較的基準(zhǔn)聲音模式之間相關(guān)程度的指標(biāo)。與距離Xm為最小的數(shù)據(jù)(αm0、βm0、γm0、δm0、εm0)相對(duì)應(yīng)的情緒,稱(chēng)為與輸入聲音模式最相關(guān)的情緒。這時(shí)的距離Xm=αm-αm0+βm-βm0+γm-γm0+δm-δm0+εm-εm0變?yōu)樽钚【嚯x。在圖8的例子中,由于狗種B的基準(zhǔn)聲音模式a1是(αm0、βm0、γm0、δm0、εm0),在這里距離Xm為最小,情緒a是與輸入聲音模式相對(duì)應(yīng)的情緒。而且在這種情況下,比較裝置5也可以直接地把輸入聲音模式與基準(zhǔn)聲音模式的數(shù)據(jù)進(jìn)行比較,而不管狗的種類(lèi)。另外,比較裝置5也可以事先輸入狗的種類(lèi),在該狗的種類(lèi)范圍,通過(guò)把輸入聲音模式與基準(zhǔn)聲音模式相比較,參考附加的狗之種類(lèi),正確判斷情緒。
情緒判斷裝置6是,通過(guò)比較裝置5對(duì)輸入聲音模式與情緒區(qū)別基準(zhǔn)聲音模式的比較,把與判定最相關(guān)的基準(zhǔn)聲音模式相對(duì)應(yīng)的情緒與該狗的情緒之間進(jìn)行判斷的構(gòu)件。雖然沒(méi)有單獨(dú)地圖示,情緒判斷裝置6由CPU(也可以為DSP)、存儲(chǔ)使CPU作為情緒判斷裝置6運(yùn)行的程序的ROM、用于工作區(qū)域的RAM等構(gòu)成。
情緒輸出裝置7是把利用感情判斷裝置6判斷出的情緒向外部輸出的構(gòu)件。情緒輸出裝置7可以是顯示文字、圖形等的諸如液晶顯示屏和其驅(qū)動(dòng)電路的顯示裝置,可以是諸如揚(yáng)聲器和聲音輸出電路這樣的音頻裝置等。另外,情緒輸出裝置7,也可以以數(shù)字?jǐn)?shù)據(jù)形式輸出判斷出的情緒,使得接收這些數(shù)據(jù)的其它儀器進(jìn)行特定的動(dòng)作。例如,也可向狗形機(jī)器人的動(dòng)作控制單元輸入那種情緒數(shù)據(jù),使狗形機(jī)器人作出相應(yīng)于該情緒的特定的動(dòng)作。即情緒輸出裝置7還能夠?qū)⑴袛喑龅那榫w作為機(jī)器人等的動(dòng)作而輸出。
下面說(shuō)明情緒判斷設(shè)備1的動(dòng)作流程。首先,變換裝置2把進(jìn)行判斷情緒的狗的吠聲變換成數(shù)字電音頻信號(hào)。然后,輸入聲音模式提取裝置3從變換后的聲音信號(hào)提取特有的聲音模式。聲音模式以關(guān)系圖的形式提取,分配給RAM。然后,比較裝置5讀取與存儲(chǔ)在情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置4中的各種情緒相對(duì)應(yīng)的基準(zhǔn)聲音模式,把它們與分配給RAM的輸入聲音模式相比較。比較可以通過(guò)加重平衡處理為特征之模式的模式匹配的方法等來(lái)進(jìn)行。通過(guò)這種比較,對(duì)輸入聲音模式與各種情緒之間的相關(guān)度進(jìn)行數(shù)值化處理。然后,情緒判斷裝置6將最相關(guān)的數(shù)值大的情緒判定為那個(gè)狗的情緒。最后,情緒輸出裝置7把判斷出的情緒利用文字、聲音、數(shù)字?jǐn)?shù)據(jù)、和動(dòng)作等形式輸出。
權(quán)利要求1和2所記載的發(fā)明具有這樣的效果,把狗的吠聲轉(zhuǎn)換成電音頻信號(hào),提取所述音頻信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式,存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式,把輸入聲音模式與情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較,通過(guò)該種比較,判斷與所述輸入聲音模式最相關(guān)的情緒,由于該情緒區(qū)別基準(zhǔn)聲音模式與“寂寞”、“失落”、“威嚇”、“自信”、“快樂(lè)”、和“渴望”情緒相對(duì)應(yīng),故能基于狗的吠聲客觀(guān)地判斷具體的狗的情緒。
權(quán)利要求
1.基于吠聲聲音的特征分析的狗的情緒判斷設(shè)備,該設(shè)備包括,變換裝置,其把狗的吠聲轉(zhuǎn)換成電音頻信號(hào),輸入聲音模式提取裝置,其提取所述聲音信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式;情緒區(qū)別基準(zhǔn)聲音模式存儲(chǔ)裝置,存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式;比較裝置,其把所述輸入聲音模式與所述情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較;情緒判斷裝置,通過(guò)所述比較,判斷與所述輸入聲音模式最相關(guān)的情緒。其特征在于所述情緒區(qū)別基準(zhǔn)聲音模式,至少包括下列基準(zhǔn)聲音模式中的一種,相應(yīng)于寂寞的情緒的基準(zhǔn)聲音模式,其具有5000Hz左右重要的頻率成份,沒(méi)有小于3000Hz的頻率成份,沒(méi)有高次諧波成份,并且持續(xù)0.2-0.3秒時(shí)間;相應(yīng)于失落的情緒的基準(zhǔn)聲音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次諧波的聲音持續(xù)0.3-1秒后,沒(méi)有250-8000Hz的明確的基音和高次諧波,并且具有1000Hz附近重要頻率成份的聲音持續(xù);相應(yīng)于威嚇的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,和在具有1000Hz左右重要頻率成份的聲音之后具有240-360Hz的基音,到1500Hz具有明確的高次諧波,和到8000Hz具有高次諧波的聲音持續(xù)0.8-1.5秒;相應(yīng)于自信的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的頻率成份;相應(yīng)于快樂(lè)的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確的基音和高次諧波,和在具有1000Hz附近重要的頻率成份的聲音之后,具有200-300Hz的基音,具有到1500Hz的高次諧波的聲音持續(xù);相應(yīng)于渴望的情緒的基準(zhǔn)聲音模式,其具有250-500Hz的基音,和到8000Hz是具有高次諧波的聲音,基音的頻率變化。
2.基于吠聲聲音的特征分析的狗的情緒判斷方法,該方法包括,把狗的吠聲轉(zhuǎn)換成電音頻信號(hào)的步驟;提取所述音頻信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式的步驟;存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式的步驟;把所述輸入聲音模式與所述情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較的步驟;通過(guò)所述比較,判斷與所述輸入聲音模式最相關(guān)的情緒的步驟。其特征在于,所述情緒區(qū)別基準(zhǔn)聲音模式,至少包括下列基準(zhǔn)聲音模式中的一種,相應(yīng)于寂寞的情緒的基準(zhǔn)聲音模式,其具有5000Hz左右重要的頻率成份,沒(méi)有小于3000Hz的頻率成份,沒(méi)有高次諧波成份,并且持續(xù)0.2-0.3秒時(shí)間;相應(yīng)于失落的情緒的基準(zhǔn)聲音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次諧波的聲音持續(xù)0.3-1秒后,沒(méi)有250-8000Hz的明確的基音和高次諧波,并且具有1000Hz附近重要頻率成份的聲音持續(xù);相應(yīng)于威嚇的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,和在具有1000Hz左右重要頻率成份的聲音之后具有240-360Hz的基音,到1500Hz具有明確的高次諧波,和到8000Hz具有高次諧波的聲音持續(xù)0.8-1.5秒;相應(yīng)于自信的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確基音和高次諧波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的頻率成份;相應(yīng)于快樂(lè)的情緒的基準(zhǔn)聲音模式,其不具有250-8000Hz的明確的基音和高次諧波,和在具有1000Hz附近重要的頻率成份的聲音之后,具有200-300Hz的基音,具有到1500Hz的高次諧波的聲音持續(xù);相應(yīng)于渴望的情緒的基準(zhǔn)聲音模式,其具有250-500Hz的基音,和到8000Hz是具有高次諧波的聲音,基音的頻率變化。
全文摘要
本發(fā)明基于狗的吠聲客觀(guān)地判斷具體狗的情緒。把狗的吠聲轉(zhuǎn)換成電音頻信號(hào),提取所述音頻信號(hào)的時(shí)間和頻率成份的關(guān)系圖的特征作為輸入聲音模式,存儲(chǔ)針對(duì)每種情緒而表示狗以吠聲特征表示各種情緒的聲音的時(shí)間與頻率成份之間的關(guān)系圖的特征的情緒區(qū)別基準(zhǔn)聲音模式,把輸入聲音模式與情緒區(qū)別基準(zhǔn)聲音模式來(lái)比較,通過(guò)那種比較,判斷與所述輸入聲音模式最相關(guān)的情緒,該情緒區(qū)別基準(zhǔn)聲音模式與“寂寞”、“失落”、“威嚇”、“自信”、“快樂(lè)”、和“渴望”情緒相對(duì)應(yīng)。
文檔編號(hào)G10L17/00GK1478269SQ02803255
公開(kāi)日2004年2月25日 申請(qǐng)日期2002年2月6日 優(yōu)先權(quán)日2001年8月6日
發(fā)明者鈴木松美 申請(qǐng)人:株式會(huì)社索引網(wǎng), 株式會(huì)社特佳麗