專利名稱:語音識別裝置、響應裝置、響應選擇裝置以及采用這些裝置的響應玩具的制作方法
技術領域:
本發(fā)明涉及一種語音響應裝置以及其他一些裝置。
充有氦氣的氣球通常包括其驅(qū)動裝置一推進器和馬達,和一個無線發(fā)射機,操作人員通過操縱帶有一個無線發(fā)射機的本地遙控器上的操縱桿來指揮氣球前后、左右和上下移動。
但是,由于是通過遙控器的操縱桿進行控制,氣球是被作為一個無生命物來對待的,從而犧牲了氣球本身固有的活性。
這個問題可以采用下列裝置加以解決。
這種結(jié)構(gòu)包括一個語音選擇裝置,用于從一組語音中選擇和輸出用一隨機數(shù)標志的某一語音作為一個輸入信號;一個具有若干麥克風的方向探測裝置,從這些麥克風中確定其中輸入的語音能量最大的那個麥克風的方向作為所探測的方向;一個帶有方位測量儀的方向選擇裝置,用于根據(jù)該方位測量儀所指示的方向確定下一個移動方向;和一個語音識別裝置。
本發(fā)明還涉及一種包括一個循環(huán)存儲器的語音別裝置,用于在一定時間里循環(huán)儲存包含在所發(fā)出的語音中的聲音;一個用于探測聲音結(jié)束點的語音結(jié)束點探測裝置;一個語音探測裝置,用于從循環(huán)存儲器中剪切直到語音結(jié)束點部分所發(fā)的語音;一個特征量提取裝置,用于提取特征量,如語音的零交叉值;和一個用于測量發(fā)出的語音中發(fā)音時間的語音持續(xù)時間探測裝置;其中需要存儲的語音特征量和發(fā)音時間已經(jīng)預先儲存作為數(shù)據(jù)庫,需要識別的語音特征量則利用特征量提取裝置來確定,發(fā)聲時間利用語音持續(xù)時間探測裝置來確定,然后確定語音特征量和數(shù)據(jù)庫中語音發(fā)出時間的差別,將所得到的數(shù)據(jù)庫中最接近的語音作為識別的結(jié)果。
本發(fā)明還涉及一種包括充有氦氣或類似氣體的反重力裝置的響應裝置,和用于拉出一根或多根繩索的繩索驅(qū)動裝置,其中繩索和反重力裝置的某一部分相連,反重力裝置的機械響應,諸如變形、移動、和動作都是由繩索驅(qū)動裝置控制的。
下面描述本發(fā)明的工作方式。
由語音識別裝置識別語音,然后由一個語音選擇裝置利用從為每一識別結(jié)果準備的一組語音中以隨機數(shù)標志的一個語音輸出。并且根據(jù)識別的結(jié)果,按照語音規(guī)程驅(qū)動一個動力裝置工作?;蛘?,利用識別的結(jié)果,由方向探測裝置確定下一個移動方向,從而利用動力裝置沿所確定的方向移動。另一方面,用方向探測裝置探測語音發(fā)出的方向,再根據(jù)這個方向用方向選擇裝置確定下一個移動方向,并在動力裝置的推動下,按照設計沿所確定的方向移動。作為選擇,還可以把所說方向探測裝置探測到的方向輸入動力裝置,則氣球也將沿著所探測到的方向移動。
圖1為語音選擇裝置的結(jié)構(gòu)示意圖;圖2為語音選擇裝置中輸入和輸出狀態(tài)的示意圖;圖3為語音選擇裝置的結(jié)構(gòu)示意圖;圖4為方向探測裝置的結(jié)構(gòu)示意圖;圖5為語音波形和幀幅的示意圖;圖6為將偏移量作為輸入值的方向選擇裝置結(jié)構(gòu)示意圖7為將絕對值作為輸入值的方向選擇裝置結(jié)構(gòu)示意圖;圖8為說明語音波形、能量、和循環(huán)存儲器的示意圖;圖9為說明語音結(jié)束點檢測方法的示意圖;圖10為說明語音檢測方法的示意圖;圖11為語音識別裝置的結(jié)構(gòu)示意圖;圖12為包括語音識別裝置和語音選擇裝置的語音響應裝置結(jié)構(gòu)示意圖;圖13為包括方向探測裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖;圖14為包括語音識別裝置、方向選擇裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖;圖15為包括方向檢測裝置、方向選擇裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖;圖16為包括語音識別裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖;圖17為可用遙控器操縱的語音響應裝置結(jié)構(gòu)示意圖;圖18為說明一個使用了語音響應裝置的玩具的示意圖;圖19為表示本發(fā)明的語音識別裝置工作方式的流程圖;圖20是表示詞語的時間長度的圖示;圖21是表示本發(fā)明的反重力裝置一個實例的響應玩具的示意圖;圖22是表示本發(fā)明的反重力裝置一個實例的響應玩具的功能結(jié)構(gòu)示意圖;圖23是具有本發(fā)明的反重力裝置的接觸檢測功能的響應玩具的功能結(jié)構(gòu)示意圖24是表示本發(fā)明的反重力裝置一個實例的響應玩具接觸檢測功能的電路示意圖;圖25為表示本發(fā)明的反重力裝置一個實例的響應玩具貓示意圖;圖26為表示本發(fā)明的反重力裝置一個實例的響應玩具經(jīng)過改進的功能圖;圖27為表示本發(fā)明的反重力裝置實例響應玩具的另一個實施例示意圖。
下面參照附圖,描述本發(fā)明的實施例。先描述基本裝置,如語音選擇裝置,方向檢測裝置和方向選擇裝置,再描述與語音識別有關的裝置,如語音結(jié)束點檢測裝置,語音探測裝置,特征量提取裝置,和語音識別裝置,最后描述由它們結(jié)合構(gòu)成的裝置。
語音選擇裝置102包括一個輸入和輸出狀態(tài)105,由在狀態(tài)s的輸入值x(非負整數(shù))和n(s)段輸出語音信號sp(x,i)(0≤i<n(s))構(gòu)成;一個隨機數(shù)發(fā)生裝置101,和一個輸入和輸出狀態(tài)存儲器103(參見圖1)。首先假設將圖2中的初始狀態(tài)201儲存在輸入和輸出狀態(tài)存儲器103中。這里,在輸入值為x的情況下,選擇相應的一組輸出語音信號sp(x,i),并由一個隨機數(shù)發(fā)生裝置101r(n(s))(其中0≤r(n(s))<n(s))從中確定i值,然后輸出語音。這時,狀態(tài)轉(zhuǎn)換裝置104監(jiān)測輸出結(jié)果,并改變該輸入和輸出狀態(tài)存儲器。例如,若在初始狀態(tài)201輸出“你好嗎?”,則與此輸出對應、借助輸入和輸出狀態(tài)105改變到狀態(tài)202。這樣,還能建立一個簡單的對話系統(tǒng)?;蛘?,按照圖3所示的簡單結(jié)構(gòu),只作出一個響應。
如圖4所示,方向探測裝置401包括許多麥克風402。例如,在有四個麥克風的情況下,從麥克風m(i)進入的語音s(m(i),t)(0≤i<4)被分成若干幀f(m(i),j)501(0≤j,間隔如16ms)(見圖5)。在所劃分的幀幅中,確定語音能量e(m(n),j)。將這種能量值e(m(n),j)依次存入長度為1(例如,長度為100)的循環(huán)存儲器中。每次確定各幀幅的能量,就求出在每個麥克風的上一個幀幅中的能量之和,再確定一個最大的能量和。如果該最大值大于預先通過試驗確定的閾值“The”,則認為測量出最大值的麥克風的方向是語音產(chǎn)生的方向,并輸出它的麥克風序號i。
如圖6所示,根據(jù)輸入值x(x是一個非負整數(shù)),利用偏差計算裝置求出與當前方向的偏差,并將此偏差量加入由方位測量儀602測得的方向中,從而將下一個移動方向存儲在目標方向存儲器603中。偏差計算裝置601建立一個輸入值x的偏差表,并在偏差值為x的情況下輸出一個相應的偏差值?;蛘?,如圖7所示,對于輸入值x(x是一個非負整數(shù)),利用一個方向計算裝置701確定一個絕對方向,并將此絕對方向存入該目標方向存儲器603中。此方向計算裝置701也可以象偏差計算裝置601一樣,通過將對應于輸入值x的方向值建立一個表來實現(xiàn)。當整個裝置移動時,在確定目標方向之后,接著由方位測量儀測量其方向,輸出所測得的方向與存儲在目標方向存儲器603中的方向之間的偏差,并通過反饋控制,可使整個裝置沿著目標方向移動。
下面描述與語音識別有關的裝置。也就是描述語音結(jié)束點探測裝置,語音檢測裝置和特征量提取裝置。首先將麥克風輸入的語音s(t)分成若干幀f(i)(i是一個非負整數(shù),幀間距比如為16ms),并將幀幅中的能量假設為e(i)802(見圖8)。這里,每次輸入幀幅單位的語音,都確定在一定周期內(nèi)經(jīng)歷的幀幅能量偏差值,如果這個變化值超過預先從較大一側(cè)到較小一側(cè)確定的試驗閾值Thv,就可求出語音結(jié)束點。下面描述從在一定周期內(nèi)的每一幀幅中確定能量偏差值的方法。首先,在采用循環(huán)存儲器的方法中,從每一幀幅得到的能量被依次存入長度為1的循環(huán)存儲器803中。每次確定幀幅能量,都從循環(huán)存儲器中提取一定周期內(nèi)的過去能量值,并求出其偏差值。在另一種方法中,不使用循環(huán)存儲器。在保有過去能量的平均值m(i-1)和偏差值v(i-1)的同時,再求出新確定能量e(i)的平均值和過去能量的加權(quán)和,以此作為新能量平均值m(i),并求出過去的偏差值v(i-1)與|e(i)-m(i)|的加權(quán)和,以此作為新偏差值v(i),從而確定一個寄生能量偏差值。這里,將衰減因子α用為權(quán)重因子,由下面所示的公式求出偏差值。α的值為1.02。m(i)=m(i-1)a+a-1ae(i)]]>v(i)=v(i-1)a+a-1a|e(i)-m(i)|]]>按照這種方式,就不需要循環(huán)存儲器,可以省去這個存儲器,并且每次確定新能量值時還可以省略求出一定周期內(nèi)的能量之和的工作,從而可以縮短處理時間。
圖10為語音檢測方法的示意圖,圖11為語音識別裝置的結(jié)構(gòu)示意圖。
安裝一個用于能量值的循環(huán)存儲器Me803和一個用于修勻能量值的循環(huán)存儲器Mse902,每次確定幀幅能量時,將能量802存入存儲器Me中,修勻能量901存入存儲器Mse中。當求取結(jié)束點902時,將能量值記錄留在這些循環(huán)存儲器中;如果循環(huán)存儲器的長度足夠長(例如,相當于2秒的長度),則留下一個單詞的能量值。在此,從這個存儲器中提取發(fā)音部分。作為提取這個部分的方法,確定某一閾值Th,在觀測循環(huán)存儲器Me中的能量值時,求出從過去至今第一次超過該閾值的點,并以此點作為語音的開始點。當從語音的終點返回到過去時,超過該閾值的點為語音的結(jié)束點,在該開始點和結(jié)束點之間的部分就是該發(fā)音部分。這里,為了確定閾值Th,在檢測語音結(jié)束點時,求得存儲器Me中的最大值max1001和存儲器Mse中修勻能量的最小值min1002,并將下式所示的值確定為閾值Th。Th=min+β(max-min)β是大約為0.07的值。作為修勻方法,可以使用特定窗口中的中間值,但并不限于此,例如,可以使用平均值。因此在確定閾值時,將此能量用為最大值,因為在修勻能量的情況下,當詞語長度變化時,最大值偏差較大,所以閾值也發(fā)生改變,從而無法得到令人滿意的語音檢測結(jié)果。
其次是從探測到的語音中提取特征量。與能量值一樣,從每一幀幅中確定特征量,并將之存儲在循環(huán)存儲器中。這種特征量是由三個分量組成的特征矢量,三個分量是原始信號的零交叉數(shù)值、原始信號的微分信號的零交叉數(shù)值、和各幀幅的原始信號的對數(shù)結(jié)果之差。
圖11為語音識別裝置的結(jié)構(gòu)示意圖。
將利用語音結(jié)束點探測裝置1101、語音探測裝置1102、和特征量提取裝置1103得到特征量矢量,在一個距離計算裝置1104中與一個預先存儲的語音特征量矢量數(shù)據(jù)庫1105比較,再將最接近的值作為識別結(jié)果輸出。按照這種比較方法,能夠容易得到矢量之間的歐幾里德距離;或者,也可以采用DP匹配方法。
下面描述本發(fā)明所用的操作裝置。所數(shù)操作裝置包括,譬如三個帶推進器的馬達和一個馬達驅(qū)動裝置,當輸入下一個移動方向指令時,三個馬達受到控制,致使整個應用裝置可以沿著該方向移動。
圖12為由語音識別裝置和語音選擇裝置構(gòu)成的語音響應裝置結(jié)構(gòu)示意圖。
下面描述一個采用這些裝置的應用裝置。先描述包括這樣的語音識別裝置1201和語音選擇裝置1 202的語音響應裝置1203(圖12)。所數(shù)語音識別裝置1201中可存儲許多語音,并輸出與輸入的語音最接近的存儲語音。作為這個輸出,比如對每個被存儲的語音都設置一個存儲序號。另一方面,在語音選擇裝置1202中,許多語音都存儲成存儲序號。當輸入某一存儲序號時,從這多個語音中隨機選擇一個,并將其輸出??傊?,當輸入某個語音時,就輸出相應的語音,而且,對于同樣的輸入,該裝置作出各種不同的響應。例如,對于“早上好”而言,就有兩種響應語音“早上好”和“你好嗎?”;一旦識別出“早上好”,即可隨機地發(fā)出這些響應語音。
圖13為一個采用方向檢測裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖。
第二個實例是一個包括方向探測裝置1301和動力裝置1302的語音響應裝置1303,其中像上面所表示的確那樣,將方向檢測裝置1301所得的方向輸入到動力裝置1302中,于是整個裝置沿著該方向移動。
圖14為包括語音識別裝置、方向選擇裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖。
第三個實例是一個包括語音識別裝置1201、方向選擇裝置1401和動力裝置1302的語音響應裝置1402,其中將語音識別裝置1201的結(jié)果輸入至方向選擇裝置1401中,再將它的輸出輸入至動力裝置1302中,以致在把當前方向與目標方向比較時,整個裝置移動到目標方向上。例如,假設正北方向為0度和轉(zhuǎn)向東為正方向時,若整個裝置向著0度方向,并且在語音識別裝置識別出“向右”語音的情況下,通過給單詞“向右”賦予+90度的量值,則整個裝置的確最終方向為0+90=90度,從而動力裝置動作,沿此目標方向移動。這時,隨著整個裝置移動,將當前的方向與其目標方向進行比較,同時動力裝置操縱馬達,以便沿著目標方向移動。在本申請中,不使用表示相對方向的詞語,如右和左,而使用表示絕對方向如北和東南這樣的詞語,當目標方向為北時,方向值為0度,而當目標方向為東南時,方向值為-135度。在本申請中,目標方向的范圍從-180到+180度。
圖15是一個采用方向檢測裝置、方向選擇裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖。
第四個實例涉及一個語音響應裝置1501,該裝置包括方向檢測裝置1301、方向選擇裝置1401和動力裝置1302。與語音響應裝置1402的第三實例相同,在該裝置中,將方向檢測裝置1301的檢測結(jié)果輸入到方向選擇裝置1401中,再將它的輸出輸入到動力裝置1302中,當把整個裝置的當前方向與目標方向進行比較時,整個裝置就沿著目標方向移動。
圖16是采用語音識別裝置和動力裝置的語音響應裝置結(jié)構(gòu)示意圖。
第五個實例涉及一個語音響應裝置1601,該裝置包括語音識別裝置1201和動力裝置1302,與在語音響應裝置1402中一樣,在語音響應裝置1601中,將語音識別裝置1201的識別結(jié)果輸入到動力裝置1302中,整個裝置沿著目標方向移動。
圖17為一個可通過遙控操縱的語音響應裝置的結(jié)構(gòu)示意圖。
在這五種語音響應裝置中,那些包括語音識別裝置1201的裝置中另在語音識別裝置一側(cè)增加一個信號發(fā)送器1701,并在設置在各種結(jié)構(gòu)中語音識別裝置的后部的語音選擇裝置1202、方向選擇裝置1401或動力裝置1302中增加了一個信號接收器1702,從而只有語音識別裝置可以用一個本地遙控器在一定距離內(nèi)進行控制。在本發(fā)明中,在信號發(fā)送和接收過程中可以采用紅外線或無線裝置。
將這樣的語音響應裝置安裝到氣球上,就可以與氣球?qū)υ捇蛘呖刂圃摎馇?,并且可以得到利用氣球固有活性的玩具?br>
圖18為采用語音識別裝置的玩具示意圖。
準備兩個氣球,它們各有一個包含這樣的語音識別裝置和語音選擇裝置的語音響應裝置1203,并且讓兩個語音響應裝置互相對話,代替操縱者與語音響應裝置對話,就能制成一個自由對話的玩具。另外,可以準備多個帶語音響應裝置的氣球,并讓它們彼此對話。這時,若在語音識別程序中設置一個濾阻功能,則在每個帶語音響應裝置的氣球中,就可以只對特定的詞語有響應,也可以只允許一個氣球?qū)μ囟ǖ陌l(fā)聲有響應。例如,可以給每個氣球起名,于是就可以只使被呼名字的起名氣球有響應。在所數(shù)濾阻方法中,當識別該裝置時,由內(nèi)部指令計算出距離,并以試驗方式確定閾值,如超過該閾值,就設計成拒收該信號。
這類玩具并不僅僅限于氣球,而可用于諸如玩偶和畫片。還可以應用于顯示中的動畫。
圖19為按照本發(fā)明權(quán)利要求25語音識別裝置的一個實施例結(jié)構(gòu)示意圖。此實施例是通過在圖11的語音識別裝置中增加一個循環(huán)存儲器1901和一個語音持續(xù)時間檢測器1902而實現(xiàn)的。也就是說,循環(huán)存儲器1901用于在一定的時間里循環(huán)儲存包含在輸入的發(fā)聲中的語音。語音持續(xù)時間檢測器1902用于檢測由語音檢測裝置1102測得之語音的持續(xù)時間。在數(shù)據(jù)庫1105中,除了語音的特征量以外,還儲存了語音發(fā)音的持續(xù)時間。
以下介紹該實施例的工作方式。
循環(huán)存儲器1901存儲在一定時間里循環(huán)輸入的語音。語音結(jié)束點檢測裝置1101根據(jù)存儲在循環(huán)存儲器1901中的語音檢測語音的結(jié)束點。在語音結(jié)束點檢測裝置探測語音的結(jié)束點時,語音檢測裝置1102從循環(huán)存儲器1901中提取語音發(fā)音部分。語音持續(xù)時間檢測器1902檢測與此語音發(fā)音部分長度對應的語音持續(xù)時間。特征量提取裝置1103利用所測得的語音檢測用于識別的特征量。在如此得到的語音特征量和語音持續(xù)時間的基礎上,借助于數(shù)據(jù)庫1105和距離計算器1104,將最接近的語音值作為識別結(jié)果輸出。
本實施例中,根據(jù)如此得到的語音特征量和語音持續(xù)時間,借助于數(shù)據(jù)庫1105和距離計算器1104,將最接近的語音值作為識別結(jié)果輸出,但并不限于此,例如,可將存儲在數(shù)據(jù)庫1105中的詞語按語音持續(xù)時間分成若干組,識別時,先識別語音持續(xù)時間為特定的一組,并將該組中特征量最接近的語音值作為識別結(jié)果輸出。圖20為表示按語音持續(xù)時間將數(shù)據(jù)庫1105中所存詞語分組的示意圖。也就是說,A和B屬于同一語音組。C和D屬于同一組,但是這一組與A和B構(gòu)成的組不同。
以下參見圖21,描述本發(fā)明的其他情況響應裝置的實施例。
在該示意圖中,所述響應裝置包括充有氦氣或者類似氣體的球形反重力裝置2101,作為放出或卷繞細繩索2102的繩索驅(qū)動裝置一部分的皮帶輪2103,用于旋轉(zhuǎn)和驅(qū)動皮帶輪2103的電機2104,和一個將電機2104的轉(zhuǎn)矩傳送到皮帶輪2103上用的傳送帶2105。細繩索2102與反重力裝置2101的某一部分相連,該反重力裝置2101的機械響應,如變形、移動和動作都通過皮帶輪2103和電機2104起作用。
該響應裝置還具有麥克風2106,用于探測人的語音;包含CPU和ROM的控制電路2107識別從麥克風2106中輸入的語音,并向各個部分發(fā)出特定輸出信號;以及一個作為響應動作用于傳遞聲音的揚聲器2108。所述反重力裝置2101的表面,畫有一個帶有興奮表情的人臉。
安裝諸如皮帶輪2103、電機2104、麥克風2106和控制電路2107等部分的主體2109有一平坦的底部,從而使其能夠安裝在地板上。主體2109上部有一個孔,繩索2102通過該孔上下運動。
在如此構(gòu)成的實施例中,其工作方式如下所述。
根據(jù)從麥克風2106輸入的人的語音,利用控制電路2107的作用,從揚聲器2108中輸出一個語音。在發(fā)出輸出語音的同時,電機2104開始轉(zhuǎn)動。
舉例來說,通過讓電機2104交替地順時針和逆時針轉(zhuǎn)動,該反重力裝置2101就可以作出點頭的動作。
這時,如果轉(zhuǎn)動電機2104,使繩索2102完全放開,則反重力裝置2102慢慢地向上飄浮,在接近上限的時刻,電機2104反向旋轉(zhuǎn)將繩索2102回繞,致使該反重力裝置2101突然下降,于是可以形成一個非常有趣的動作。
特別是,由于外部條件,如風的影響,反重力裝置2101的這種動作可以表現(xiàn)為出乎預料的運動,并且可以作出非常擬人的和熱情的動作。這種效果是用固定的機械動作所無法得到的。
本發(fā)明所用的繩索并不是指狹義的繩索,而是包括纜帶、軟金屬線和其他廣義的繩索。
上述實施例中采用如圖21所示的響應裝置,但是并不局限于此,譬如可采用如圖27所示的結(jié)構(gòu)。
這就是,采用一對鞋形固定部分2701a、2701b,用撓性紙制成的相當于腿的伸縮軟管形部分2702a、2702b從這兩個鞋形部分向上延伸。在腿部2702a、2702b的上面裝有球形反重力裝置2703,作為對應于身體上半部的部分。反重力裝置中充有氦氣或者類似的氣體,一根細繩索2705與其下部相連。作為對應于胳膊的部分2704a、2704b,從反重力裝置2703兩側(cè),向左和向右傾斜向下延伸。固定部分2701a中安裝有麥克風、揚聲器、控制電路和其他部件。固定部分2701b中,安裝有電機、皮帶輪和其他部件。繩索2705的一端與該皮帶輪相連。借助電機的旋轉(zhuǎn)動作,反重力裝置2703作出點頭和其他動作,這與上述實施例基本相同。本圖顯示了兩條腿的伸展狀態(tài)。
以下參見一個表,描述本發(fā)明在不同情況下的一個響應選擇裝置的實施例。
該響應選擇裝置具有一組輸入,和由與各個輸入對應的多個語音響應和多個機械反應構(gòu)成的多個輸入和輸出狀態(tài),其中選擇一個語音響應和機械響應,并對應于一個輸入而輸出,將此狀態(tài)改變到多個輸入和輸出狀態(tài)中的一種,并根據(jù)輸入和輸出的過去經(jīng)歷確定下一個輸入和輸出。
基本工作情況與在圖1到圖3的實施例中所做的說明是一樣的。
下面參照該表說明與上述裝置的主要不同點。
<初始狀態(tài)>
輸入 輸出語音機械響應0早上好 早上好 模式0很好 模式11你好嗎?下午好 模式0很好 模式12Smiley?什么? 模式2這里,模式0表示對“早上好”和“你好嗎?”響應的慢動作,模式1表示對于“你好嗎?”響應的快動作。模式2表示更快的動作。
以圖21中所示的響應裝置為例加以說明。這個響應裝置名叫Smiley。
也就是說,在初始狀態(tài)下,人們說“你好嗎?”問候Smiley,Smiley將這個語音輸入控制電路,并發(fā)出一個輸出語音“很好”。這時的動作規(guī)定為模式1,表現(xiàn)為一個快速動作。
在Smiley答復“很好”之后,動作滿足下表中所示輸入、輸出語音,以及機械響應間的關系。
<與“很好”相應的輸入和輸出狀態(tài)>輸入輸出語音機械反應0 我們?nèi)ツ膬??模?我們干什么?模式11 你們干得怎么樣?模式2加油 模式1歇一會兒怎么樣?模式3
現(xiàn)在參照圖22描述本發(fā)明其他情況的一個響應玩具的一個實施例。
如圖所示,這個實施例中的響應玩具包括充有以氦氣為主的反重力裝置(未畫出)、語音識別裝置2201、用于接收識別結(jié)果并確定語音響應及機械響應的響應選擇裝置2202,用于發(fā)出語音響應結(jié)果的語音輸出裝置2203,和根據(jù)機械響應結(jié)果驅(qū)動所述反重力裝置的響應裝置2204。
圖25中表示本實施例的一個特別應用實例。
如圖所示,主體2501為一個形狀象貓的反重力裝置,它充有氦氣。圖22中所示響應玩具的控制及驅(qū)動裝置2502被置于主體2501的腹部。
如圖25所示,控制及驅(qū)動裝置2502有繩索A,用于開啟和關閉設在主體2501的嘴部的嘴,繩索B用于移動尾部的尾巴,還有繩索C、D、E、F用于驅(qū)動腳爪部分的腳爪。
在這種結(jié)構(gòu)中,當人們對主體2501講話時,由語音識別裝置2201對此語音進行識別,再由響應選擇裝置2202選擇輸出語音,如“早上好”,并從語音輸出裝置2203中發(fā)出這個聲音。在發(fā)出語音的同時,貓主體的各個部分根據(jù)機械響應模式移動。
圖25是表示與本發(fā)明權(quán)利要求30一致的響應玩具實施例的確示意圖。圖23是與該響應玩具有關裝置的結(jié)構(gòu)示意圖。圖25中所示的貓主體2501是一個充有氦氣的反重力裝置。圖23中響應玩具的裝置被存放于圖25中的區(qū)域2502中。響應玩具的裝置2502是在圖22中所示的裝置中增加了一個接觸探測器2301的結(jié)構(gòu)。接觸探測器2301是一個設置在主體2501整體或者局部的鍍鋁或用樹脂涂覆的觸摸傳感器。如圖24所示,當人觸摸這個包覆著觸摸傳感器的貓(它是一個反重力裝置)時,該接觸就被測知。
當人對響應玩具講話和/或觸摸此響應玩具時,該響應玩具的響應的實例被表示如下。
語音輸入觸摸輸入輸出語音機械響應0 早上好 模式0你好嗎?模式11 下午好 模式0你好嗎?模式12 什么? 模式20 喵 模式31 嗚 模式1當人對該響應玩具講話時,這對應于一組語音輸入。例如,當語音輸入0為“早上好”時,語音識別裝置2201識別該語音,響應選擇裝置2202選擇語音“早上好”,并從語音輸出裝置將此聲音傳送出去。與輸出這個聲音的同時,對應于“早上好”的語音輸入,選擇裝置2202選擇與此響應裝置相應的機械響應模式。所述機械響應模式體現(xiàn)為貓?zhí)囟ú糠謩幼鞯乃俣群?或幅度。在圖25所示的實施例中,這些特定部分為A、B、C、D、E和F。也就是說,當搖尾巴時,繩索B動作,當張開或閉上嘴巴時,繩索A動作。
當人觸摸該響應玩具時,對應于一組觸摸輸入。例如,觸摸輸入0是在貓的頸部,此觸摸位置被接觸探測器2301檢測出來,同時響應選擇裝置選擇語音“喵”,并從語音輸出裝置2203中傳送出來。與輸出語音的同時,對應于此觸摸輸入,選擇裝置2202選擇與此響應裝置對應的機械響應。在這種情況下,比如貓搖它的尾巴。
本實施例的語音識別裝置也可以用權(quán)利要求25或26中的語音識別裝置實現(xiàn)。
此外,如圖26所示,語音識別裝置2201可以裝備一個語音檢測裝置2601和一個能量檢測裝置2602,可以根據(jù)輸入語音的語音能量改變機械響應的模式。因此,通過大聲命令“別動”,則尾巴的搖動就會停止,同時圖25中的繩索B就會被拉動,使尾巴位于后爪處,從而能夠?qū)崿F(xiàn)更象動物的表現(xiàn)。
通過預置權(quán)利要求1所述的多種輸入和輸出狀態(tài),以及根據(jù)輸入和輸出的過去經(jīng)歷改變這種輸入和輸出狀態(tài),可以實現(xiàn)簡單的對話?;蛘咄ㄟ^對于一種輸入預置多種輸出,一種輸入可以對應多種響應,而不總是同一種響應。
通過包括權(quán)利要求4所述的多個麥克風,并通過檢測接收最大能量的麥克風,可以檢測出語音發(fā)出的方向。
通過裝備權(quán)利要求5所述的方位測量儀,可將整個裝置正確地定向到輸入方向。
通過采用權(quán)利要求8所述的特征量,權(quán)利要求9所述的語音識別裝置利用權(quán)利要求6所述的語音結(jié)束點檢測裝置首先確定語音的結(jié)束點,再利用權(quán)利要求7所述的語音探測裝置自動確定閾值,并提取語音部分來識別語音。在本申請中,閾值是利用語音檢測裝置根據(jù)循環(huán)存儲器中能量的最大值和修勻能量的最小值確定的,而這個閾值是用來與發(fā)聲部分的長度對應的。
權(quán)利要求10所述的語音響應裝置通過將權(quán)利要求l所述的語音識別裝置和語音選擇裝置相結(jié)合而形成人-機對話界面,在這個界面中,人說話,機器應答。
通過結(jié)合權(quán)利要求11所述的方向探測裝置和動力裝置,整個裝置可以對應于語音而移動,從而可以建立裝置對于語音的響應。
如權(quán)利要求12所述,通過結(jié)合語音識別裝置、方向選擇裝置和動力裝置,整個裝置能夠沿著語音內(nèi)容中指定的方向正確移動。
如權(quán)利要求13所述,通過結(jié)合方向探測裝置、方向選擇裝置和動力裝置,整個裝置能夠沿著語音的方向正確移動。
如權(quán)利要求14所述,通過結(jié)合語音識別裝置和動力裝置,整個裝置可沿著由語音內(nèi)容所指定的方向移動。
通過在語音識別裝置中增加一個信號發(fā)送器,在各個裝置中的語音識別裝置后面的裝置中增加一個信號接收裝置,權(quán)利要求15、16、17中的語音響應裝置可用遙控器控制。
如權(quán)利要求18和19所述,準備兩個或多個權(quán)利要求10所述的語音響應裝置,并將它們面對面設置,就可以制造出自動對話的玩具。
如權(quán)利要求20、21、22、23、24所述,通過將權(quán)利要求10、11、12、13、14所述的語音響應裝置附在氣球上,就可以制成一個具有氣球的固有熱情的講話玩具。此外,通過配置一個時鐘,在預定的時間傳送一個適當?shù)恼Z音,就可以制成一個由機器講話,而不是由人講話的裝置。
在權(quán)利要求25和26中,由于考慮了詞語持續(xù)時間長度,語音識別非常容易。
在權(quán)利要求27到33中,由于使用了比如繩索,所以能夠?qū)崿F(xiàn)更加自然的動作。
權(quán)利要求
1.一種包括多個輸入和輸出狀態(tài)的語音選擇裝置,這些狀態(tài)由一組輸入和與各輸入對應的多種語音組成,該裝置選擇并輸出一種輸入對應的語音,然后轉(zhuǎn)換到所說多個輸入和輸出狀態(tài)中的一個狀態(tài),并根據(jù)輸入和輸出的過去經(jīng)歷確定下一個輸入和輸出狀態(tài)。
2.一種如權(quán)利要求1所述的語音選擇裝置,其特征在于只有一種輸入和輸出狀態(tài),并根據(jù)輸入從多種語音中選擇并輸出一種語音。
3.一種如權(quán)利要求1所述的語音選擇裝置,其特征在于在從多種語音中選擇一種語音的方法中采用隨機數(shù)。
4.一種方向探測裝置,它包括多個麥克風,其特征在于多個麥克風中輸入語音能量最大的一個麥克風的方向被作為探測的方向。
5.一種方向選擇裝置,它包括一個方位測量儀,其特征在于通過順序地輸出一個正在改變其方向的裝置的目標方向與由該方位測量儀所指示的方向之間的偏差而引導該裝置正確地移向目標方向。
6.一種語音結(jié)束點檢測裝置,用于接收語音,將語音劃分成多個幀幅,確定由每個幀幅中的能量組成的能量序列,當該能量序列的變化量小于通過試驗預設的一個閾值時,確定此語音的一個結(jié)束點。
7.一種語音探測裝置,它包括一個用于檢測語音結(jié)束點的語音結(jié)束點檢測裝置和一個關于規(guī)定時間的循環(huán)存儲器,其特征在于將每一幀幅的能量順序地存儲在所述循環(huán)存儲器中,當語音結(jié)束點檢測裝置測得語音結(jié)束點時,確定存儲在循環(huán)存儲器中一個能量序列中的最大值并通過修勻所說能量序列而得到的一個修勻能量序列中的最小值,從該最大值和最小值得出一個閾值,再對照此能量序列,確定一個從第一部分到最后部分大于該閾值的部分作為一個語音發(fā)音部分。
8.一種特征量提取裝置,它包括一個語音檢測裝置,其特征在于在所測得之語音的每一幀幅中,將原始信號的零交叉值、原始信號微分信號的零交叉值和原始信號能量確定作為該幀幅的特征量矢量。
9.一種語音識別裝置,它包括一個如權(quán)利要求6所述的語音結(jié)束點檢測裝置,一個如權(quán)利要求7所述的語音檢測裝置,和一個如權(quán)利要求8所述的特征量提取裝置,其特征在于利用所述特征量提取裝置將需要存儲的語音特征量作為數(shù)據(jù)庫預先存儲,利用所說特征量提取裝置確定需要識別的語音特征量,確定所得到的特征量到數(shù)據(jù)庫中的特征量的距離,將數(shù)據(jù)庫中最接近的語音確定為識別結(jié)果。
10.一種語音響應裝置,它包括如權(quán)利要求1所述的一個語音識別裝置和一個語音選擇裝置,其特征在于對一個輸入的語音產(chǎn)生一個響應。
11.一種語音響應裝置,它包括如權(quán)利要求4所述的一個方向檢測裝置,和一個動力裝置,其特征在于所述動力裝置根據(jù)所述方向檢測裝置的結(jié)果而被驅(qū)動。
12.一種語音響應裝置,它包括一個語音識別裝置、一個如權(quán)利要求5所述的方向選擇裝置,和一個動力裝置,其特征在于所述語音識別裝置的輸出被用作所述方向選擇裝置的輸入,并且根據(jù)該方向選擇裝置的輸出驅(qū)動所述動力裝置。
13.一種語音響應裝置,它包括如權(quán)利要求4所述的一個方向檢測裝置,如權(quán)利要求5所述的一個方向選擇裝置,和一個動力裝置,其特征在于所述方向探測裝置的輸出被用作所述方向選擇裝置的輸入,并且根據(jù)所述方向選擇裝置的輸出驅(qū)動所述動力裝置。
14.一種語音響應裝置,它包括一個語音識別裝置和一個動力裝置,其特征在于根據(jù)所述語音識別裝置的輸出驅(qū)動所述動力裝置。
15.一種如權(quán)利要求10所述的語音響應裝置,其特征在于在所述語音識別裝置中設置一個信號發(fā)送裝置,在所述語音選擇裝置中設置一個信號接收裝置,從而能夠進行遙控。
16.一種如權(quán)利要求12所述的語音響應裝置,其特征在于在所述語音識別裝置中設置一個信號發(fā)送裝置,在所述方向選擇裝置中設置一個信號接收裝置,從而能夠進行遙控。
17.一種如權(quán)利要求14所述的語音響應裝置,其特征在于在所述語音識別裝置中設置一個信號發(fā)送裝置,在所述動力裝置中設置一個信號接收裝置,從而能夠進行遙控。
18.一種玩具,它包括兩個如權(quán)利要求10所述的語音響應裝置,其特征在于所說的兩個語音響應裝置彼此對話。
19.一種玩具,它包括多個如權(quán)利要求10所述的語音響應裝置,其特征在于其他語音響應裝置中的一部分語音響應裝置對由一個語音響應裝置發(fā)出的語音作出響應,因此所述多個語音響應裝置彼此對話。
20.一種玩具,它包括一個如權(quán)利要求10所述的語音響應裝置和一個氣球,其特征在于對于一個輸入語音作出響應。
21.一種玩具,它包括一個如權(quán)利要求11所述的語音響應裝置和一個氣球,其特征在于它沿著語音發(fā)出的方向移動。
22.一種玩具,它包括一個如權(quán)利要求12所述的語音響應裝置和一個氣球,其特征在于它沿著由輸入語音指示的方向移動。
23.一種玩具,它包括一個如權(quán)利要求13所述的語音響應裝置和一個氣球,其特征在于它沿著語音發(fā)出的方向移動。
24.一種玩具,它包括一個如權(quán)利要求14所述的語音響應裝置和一個氣球,其特征在于它沿著由輸入語音指示的方向移動。
25.一種語音識別裝置,它包括一個循環(huán)存儲器,用于在規(guī)定的時間里循環(huán)存儲包含發(fā)音的語音,一個用于檢測所說語音的結(jié)束點的語音結(jié)束點探測裝置,一個用于從所說的循環(huán)存儲器中剪切一個語音發(fā)音部分直到所說的結(jié)束點的語音檢測裝置,一個用于提取特征量如語音零交叉值的特征量提取裝置,和一個語音持續(xù)時間檢測裝置,用于測量在所說語音發(fā)音部分中的語音發(fā)音時間,其特征在于將需存儲的語音特征量和語音發(fā)出時間預先存儲為一個數(shù)據(jù)庫,由特征量提取裝置確定需被識別的語音特征量,由語音發(fā)音時間檢測裝置確定語音發(fā)音時間,確定所述語音特征量與所述數(shù)據(jù)庫中語音發(fā)音時間之間的距離,然后將得到的數(shù)據(jù)庫中最接近的語音作為識別結(jié)果。
26.一種如權(quán)利要求25所述的語音識別裝置,其特征在于將存儲在所述數(shù)據(jù)庫中的多個詞語劃分成語音發(fā)音時間的特定時間不同的詞語組,識別語音時先檢測語音發(fā)音時間,再選擇對應于已測得時間的詞語組,繼而,在同一詞語組的各詞語中,選擇由特征量提取裝置提取的特征量不同的一個詞語。
27.一種響應裝置,它包括充有氦氣或類似氣體的反重力裝置,和用于引導一根或多根繩索的繩索驅(qū)動裝置,其特征在于所述繩索與所述反重力裝置的某一部分相連,由所述繩索驅(qū)動裝置控制所述反重力裝置的機械響應,如變形、移動和動作等。
28.一種響應選擇裝置,它具有(1)一組輸入,(2)包括與所述各輸入對應的多個語音響應的多種輸入和輸出狀態(tài),和(3)多個機械響應,其特征在于對于一個輸入選擇一個語音響應和一個機械響應,并輸出之,將所述狀態(tài)變換成所述多個輸入和輸出狀態(tài)中的一個狀態(tài),并根據(jù)輸入和輸出的過去經(jīng)歷確定下一個輸入和輸出。
29.一種響應玩具,它包括充有氦氣或類似氣體的反重力裝置,一個語音識別裝置,一個如權(quán)利要求28所述的響應選擇裝置,用于接收識別結(jié)果并確定一個語音響應和一個機械響應,用于發(fā)出所確定的語音響應的語音輸出裝置,和一個如權(quán)利要求27所述的響應裝置,用于根據(jù)所確定的機械響應驅(qū)動所述反重力裝置。
30.一種響應玩具,它包括充有氦氣或類似氣體的反重力裝置,一個語音識別裝置,一個具有觸摸傳感器的接觸探測裝置,所述觸摸傳感器設置在所述反重力裝置的整個表面或者一部分表面上,用于輸出手或類似部分的觸摸檢測,一個如權(quán)利要求28所述的響應選擇裝置,用于接收識別結(jié)果和觸摸檢測結(jié)果并確定語音響應和機械響應,用于發(fā)出語音響應結(jié)果的語音輸出裝置,和一個如權(quán)利要求27所述的響應裝置,用于根據(jù)機械響應的結(jié)果驅(qū)動反重力裝置。
31.一種如權(quán)利要求29所述的響應玩具,其特征在于所述語音識別裝置是一個如權(quán)利要求25或權(quán)利要求26所述的語音識別裝置。
32.一種如權(quán)利要求30所述的響應玩具,其特征在于所述語音識別裝置是一個如權(quán)利要求25或26所述的語音識別裝置。
33.一種如權(quán)利要求31或32所述的響應玩具,其特征在于所述語音識別裝置包括用于檢測發(fā)出的語音能量的能量檢測裝置,所述響應裝置控制機械響應的幅度以使其相應于所發(fā)語音的能量。
全文摘要
一種響應裝置,具有充有氦氣的反重力裝置,和用于引導多根繩索的繩索驅(qū)動裝置,所述繩索與所述反重力裝置的某一部分相連,所述反重力裝置的機械響應如變形、移動和動作等都由該繩索驅(qū)動裝置控制。
文檔編號G10L15/22GK1140295SQ96106098
公開日1997年1月15日 申請日期1996年3月31日 優(yōu)先權(quán)日1995年3月31日
發(fā)明者萱島一弘, 松川善彥, 松井謙二, 前川英嗣 申請人:松下電器產(chǎn)業(yè)株式會社