專利名稱:具有話音識別功能和話音識別系統(tǒng)的數(shù)據(jù)終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及具有話音識別功能和話音識別系統(tǒng)的數(shù)據(jù)終端,更具體地說,涉及一種具有話音識別功能的手提數(shù)據(jù)終端和話音識別系統(tǒng)。
近來,手提電話機中采用了話音識別功能,無需操作10個按鍵。話音識別是通過話筒叫出對方目的地的地名進行的。
在這種手提電話機中,待識別的話音預(yù)先通過話筒存入。產(chǎn)生經(jīng)識別與所寄存的相同的話音時,就根據(jù)這個話音進行通話或類似的操作。
這類手提電話機可在任何作為其服務(wù)區(qū)的地方使用,因而可用于嘈雜的地方或噪聲電平高的地方。在這種情況下,進行通話或其它同類的操作時,環(huán)境噪聲或噪聲可能加入從話筒輸入的話音中,這可能會導(dǎo)致檢測不出所輸入的話音是否與預(yù)先存入的話音一致或錯誤判斷所輸入的話音與不同的話音一致。
解決這個問題可能的作法是在噪聲電平高的地方存入有待話音識別的字,也可以在判斷出有噪聲輸入時終止話音識別操作。
用上述其中一個方法,即使在環(huán)境噪聲電平高的情況下也能避免錯誤識別話音。但起動話音識別操作之后在嘈雜的情況下要避免錯誤識別話音是不可能的,這是要把手提電話機的話筒再移近嘴巴些或?qū)P聲器觸及耳朵以聆聽揚聲器發(fā)出的話音造成的后果。在后一種情況下,需要進行話音識別啟動操作,再次啟動話音識別操作。
本發(fā)明的目的是解決上述問題,提供一種話音識別功能提高的手提數(shù)據(jù)終端和話音識別系統(tǒng)。
本發(fā)明的另一個目的是提供一種能改善話音錯誤識別可能性的手提數(shù)據(jù)終端和話音識別系統(tǒng)。
本發(fā)明還有另外一個目的,即提供一種能避免因突然出現(xiàn)噪聲或因重新抓住終端而產(chǎn)生的噪聲而引起的錯誤識別話音的手提數(shù)據(jù)終端和話音識別系統(tǒng)。
按照本發(fā)明的一個實施例,本發(fā)明提供的手提數(shù)據(jù)端包括一個話筒,供輸入話音;一個存儲器,供事先存儲話音識別字;和話音識別裝置,供對話筒輸入的話音進行話音識別并讀出所輸入話音相應(yīng)的話音識別字;話音識別過程中檢測出不是話音的噪聲時,話音識別操作就受阻。
手提數(shù)據(jù)終端還包括寄存裝置,供預(yù)先寄存準(zhǔn)備在噪聲中提取的模式。
手提數(shù)據(jù)終端還包括通知裝置,供檢測出非話音的噪聲時通知禁止話音識別操作。
在本發(fā)明的手提數(shù)據(jù)終端中,非話音噪聲的檢測是從話音識別開始的時刻起在預(yù)定時間內(nèi)進行的。
按照本發(fā)明的另一個實施例,本發(fā)明提供的識別所輸入的話音的話音識別系統(tǒng),其中待識別的字和預(yù)定的噪聲是作為識別主題和噪聲預(yù)先寄存的,當(dāng)識別出所輸入的話音為所述噪聲時,就不進行話音識別,或忽略不計識別結(jié)果。
按照本發(fā)明的另一個實施例,本發(fā)明提供的識別所輸入的話音的話音識別系統(tǒng),其中待識別的字和預(yù)定的噪聲是作為識別主題和噪聲預(yù)先寄存的,識別操作是在經(jīng)過預(yù)定時間之后進行的,當(dāng)識別出所輸入的話音為所述噪聲時,就不進行話音識別或者忽略不計識別結(jié)果。
在這種話音識別系統(tǒng)中,當(dāng)識別出所輸入的話音為所述噪聲時,再次進行識別操作,而當(dāng)識別出所輸入的話音為所述噪聲時,識別結(jié)果就顯示出來,或以話音的形式發(fā)出。
在這種話音識別系統(tǒng)中,話音識別是在預(yù)定時間內(nèi)進行的。
下面參看
,從這個說明可以清楚地看到本發(fā)明的其它目的和特點。
圖1是作為本發(fā)明典型手提數(shù)據(jù)終端的手提電話機的結(jié)構(gòu)圖。
圖2是本發(fā)明一個實施例的操作流程圖。
圖3是本發(fā)明另一個實施例的操作流程圖。
現(xiàn)在參看
本發(fā)明的一些最佳實施例。
圖1是作為本發(fā)明典型手提數(shù)據(jù)終端的手提電話機的結(jié)構(gòu)圖。本發(fā)明并不局限于手提電話機,它適用于任何可在流動狀態(tài)下使用、具話音識別功能的終端,例如,適用于PHS、傳呼機和電子筆記本。
參看圖1。從圖中看到,本發(fā)明由以下各部分組成無線電部分11,給基地臺(圖中未示出)發(fā)送無線電信號,和從基地臺接收無線電信號;操作部分12,促使手提電話機工作,并啟動話音識別操作;顯示部分13,供顯示數(shù)字、字符等;主CPU14,控制整個手提電話機并控制話音識別LSI;話音識別部分15;模/數(shù)轉(zhuǎn)換器16,就話音識別部分15的話音數(shù)據(jù)進行模/數(shù)變換;話筒17;和場聲器18,在話音識別開始時產(chǎn)生開始信號,并以話音形式產(chǎn)生識別結(jié)果。
話音識別是通過按壓操作部分12中的一個話音識別啟動按鍵啟動的。按壓操作部分12中的話音識別啟動按鍵時,主CPU14就檢測此話音識別啟動按鍵受按壓的情況,并給話音識別部分15發(fā)送話音識別啟動指令。話音識別部分15收到主CPU14來的啟動指令時,對話筒17來的話音進行話音識別操作。話筒17來的話音信號在模/數(shù)轉(zhuǎn)換器16中轉(zhuǎn)換成數(shù)字,然后輸入話音識別部分15中進行話音識別。作為話音識別用的識別字,用戶借助按鍵操作部分往操作部分12中輸入想使用的字,不然也可從話筒以話音的形式輸入。
除用戶寄存的想使用的識別字外,檢測噪聲引起的誤操作用的識別字則由主CPU14寄存入話音識別部分15中。這個寄存操作最好在手提電話機裝運之前進行??赡芤疱e誤識別的噪聲有突然產(chǎn)生的諸如碰撞聲(例如“乒乓”聲)之類的碰撞聲,和為在緊接話音識別開始之后從話筒輸入話音而移動或重新抓住手提電話機時而產(chǎn)生的噪聲或搬動聲。在這類噪聲中提取的字模式事先作為識別字寄存。識別話音時識別出這些噪聲時,錯誤識別用戶產(chǎn)生的話音的可能性極大。因此,在此情況下,發(fā)出通知,表明不能進行話音識別。
具體地說,在識別話音時突然有噪聲從話筒輸入時,防止(檢測)噪聲引起的誤操作的識別字經(jīng)過識別,通過識別出噪聲的信息就從顯示部分13輸出。前面說過,在緊接話音識別開始之后為從話筒輸入話音而移動或重新抓住手提電話機而產(chǎn)生的搬動聲或噪聲可能會引起誤操作。因此,從話音識別開始的時刻起的幾秒鐘內(nèi)識別出防止噪聲引起的誤操作的識別字時,就沒有識別結(jié)果輸出給顯示部分13。取而代之的是CPU14再次給話音識別部分15發(fā)送出話音識別啟動指令啟動話音識別操作的程序。這樣,就再次啟動對話筒17輸入來的話音進行話音識別的操作,這為的避免緊接話音識別開始之后產(chǎn)生的噪聲引起的誤操作。
現(xiàn)在參看圖1和圖2說明本發(fā)明適當(dāng)實施例的操作過程。按壓操作部分12中的話音輸入按鍵時,主CPU14檢測出話音輸入按鍵受按壓就給話音識別部分15發(fā)出話音識別開始指令。這里,話音識別部分15中識別的識別字是那些由用戶從操作部分12輸入的字、那些由用戶按需要設(shè)定和從話筒17輸入的字和那些由CPU14存入的防止噪聲引起的誤操作的字。話音識別開始時(步驟21),計時器就開始計時(步驟22)。
計時器測定出T秒的時間過去時(步驟23),就進行話音識別的正常操作(步驟28),即對從話筒17輸入的話音進行識別。話音識別結(jié)果經(jīng)檢定合格時就輸出給顯示部分13和揚聲器18,從而以話音形式宣布話音識別結(jié)果。
當(dāng)識別出防止噪聲引起的誤操作的識別字時,顯示部分13上就顯示出識別出非那些寄存在識別詞典中的識別字的信息。當(dāng)在計時器測定出的時間T秒過去之前話音識別結(jié)果經(jīng)檢定合格時(步驟24),CPU14就進行檢測,看話音識別結(jié)果是用戶按要求寄存的字或防止噪聲引起的誤操作的字(步驟25)。
當(dāng)話音識別字為用戶按要求寄存的字時,就將話音識別結(jié)果發(fā)布出去,即將其輸出給顯示部分13顯示出來,并輸出給揚聲器18以話音形式宣布結(jié)果(步驟27)。當(dāng)話音識別結(jié)果為防止噪聲引起的誤操作的字時,主CPU14就再次給話音識別部分15發(fā)出話音識別開始指令,從而再次啟動話音識別操作(步驟26)。
當(dāng)計時器在話音識別開始之后開始計時在計出的時間T過去之前識別出防止噪聲引起的誤操作的字時,話音識別就繼續(xù)再開始下去直到用戶按要求設(shè)定的話音識別字經(jīng)檢定為話音識別結(jié)果為止。這樣就能避免重新抓住手提電話機或緊接著話音識別開始之后移動手提電話機產(chǎn)生的搬動噪聲或噪聲引起的誤操作。
現(xiàn)在參看圖3說明本發(fā)明的第二實施例。按壓操作部分12中的話音輸入按鍵時,主CPU14檢測出話音輸入按鍵受按壓就給話音識別部分15發(fā)出話音識別開始指令。話音識別開始時(步驟31),計時器開始計時(步驟32)。計時器計出的T秒時間過去時(步驟33),就進行話音識別的正常操作(步驟38),即對從話筒17輸入的話音進行識別。
識別結(jié)果經(jīng)檢定合格時輸出給顯示部分13和揚聲器18顯示出來并以話音的形式宣布識別結(jié)果。當(dāng)識別出防止噪聲引起的誤操作的識別字時,顯示部分13上就顯示出識別出非那些寄存在識別詞典中的識別字的信息。計時器計出的T秒時間過去之前話音識別結(jié)果就檢定合格時(步驟34),CPU14就進行檢驗,看話音識別結(jié)果為用戶按需要寄存的字或防止噪聲引起的誤操作的字(步驟35)。當(dāng)話音識別結(jié)果為用戶按需要寄存的字時,就確認(rèn)話音識別結(jié)果,即給顯示部分13和揚聲器18輸出識別結(jié)果,將結(jié)果發(fā)布出去(步驟38)。
當(dāng)話音識別結(jié)果為防止噪聲引起的誤操作的字時,就通知用戶再啟動話音識別操作(步驟36)。為此,顯示部分13上就顯示出通知重新啟動話音識別操作的信息,并使揚聲器18發(fā)出重新啟動話音識別操作的話音。主CPU還再次給話音識別部分15發(fā)出話音識別開始指令,從而重新啟動話音識別操作(步驟37)。
計時器在緊接著話音識別開始之后開始計時計出的T秒時間過去之前識別出防止噪聲引起的誤操作的字時,就通知用戶再次啟動話音識別操作,于是話音識別操作重新啟動,進行話音識別操作直到檢驗出用戶按需要設(shè)定的話音識別字為話音識別結(jié)果為止。這樣就能避免因重新抓住手提電話機或緊接著話音識別開始之后移動手提電話機產(chǎn)生的搬動聲或噪聲引起的誤操作。
在上述實施例中,可以顯示出通知識別出那些非寄存在話音識別詞典中的字的信息。
前面說過,按照本發(fā)明,防止噪聲引起的誤操作的字和那些由用戶按需要寄存的字一樣,都寄存起來。當(dāng)緊接著話音識別開始之后識別出防止噪聲引起的誤操作的字時,話音識別操作就自動再次啟動起來,這為的是防止緊接著話音識別啟動之后的錯誤識別。這樣就能避免緊接著話音識別開始之后錯誤識別話音,從而可以提高識別效能并進一步方便了話音識別操作。
此外,按照本發(fā)明,由于識別出防止噪聲引起的誤操作的話音識別字而在話音識別開始之后重新啟動話音識別操作時,就通知用戶再次啟動話音識別操作,因而重新啟動話音識別操作時,可將此舉通知用戶,從而可在話音識別操作重新開始時檢測出字的最前部,從而提高重新啟動時的識別效能。
在不脫離本發(fā)明范圍的前提下,本技術(shù)領(lǐng)域的一般技術(shù)人員是可以在結(jié)構(gòu)上進行修改并提出各種不同的修改方案和實施方案。上述說明和附圖中提到的內(nèi)容僅僅是舉例說明而已,因此上述說明應(yīng)視為舉例說明而不是對本發(fā)明的限制。
權(quán)利要求
1.一種手提數(shù)據(jù)終端,包括一個話筒,供輸入話音;一個存儲器,供事先寄存話音識別字;和一個話音識別裝置,供對從話筒輸入的話音進行話音識別,并讀出所輸入話音相應(yīng)的話音識別字;在進行話音識別時檢測出不是話音的噪聲時,話音識別操作受阻。
2.如權(quán)利要求1所述的手提數(shù)據(jù)終端,其特征在于,還包括一個寄存裝置,供預(yù)先寄存在噪聲中提取的模式。
3.如權(quán)利要求1或2中的一項所述的手提數(shù)據(jù)終端,其特征在于,還包括一個通知裝置,供檢測不是話音的噪聲時通知話音識別受阻。
4.如權(quán)利要求1至3中任一項權(quán)利要求所述的手提數(shù)據(jù)終端,其特征在于,不是話音的噪聲的檢測是在話音識別開始的時刻起的預(yù)定時間內(nèi)進行的。
5.一種話音識別系統(tǒng),供識別輸入的話音,其中待識別的字和預(yù)定的噪聲作為識別主題和噪聲預(yù)先寄存起來,當(dāng)識別出所輸入的話音為噪聲時,就不進行識別或忽略不計識別結(jié)果。
6.一種話音識別系統(tǒng),供識別輸入的話音,其中待識別的字和預(yù)定的噪聲作為識別主題和噪聲預(yù)先寄存起來,識別操作是在過了預(yù)定時間之后進行的,當(dāng)識別出所輸入的話音為噪聲時,就不進行識別或忽略不計識別結(jié)果。
7.如權(quán)利要求5或6中的一項所述的話音識別系統(tǒng),其特征在于,識別出輸入的話音為噪聲時,再次進行識別操作。
8.如權(quán)利要求5或6中的一項所述的話音識別系統(tǒng),其特征在于,識別出輸入的話音為噪聲時,顯示出識別結(jié)果或以話音形式宣布識別結(jié)果。
9.如權(quán)利要求5或6中的一項所述的話音識別系統(tǒng),其特征在于,噪聲識別在預(yù)定時間內(nèi)進行。
全文摘要
通過在操作部分12操作開始話音識別,即識別從話筒17輸入的話音。該操作由話音識別部分15進行。識別結(jié)果經(jīng)檢驗合格就在顯示部分13顯示出來,且使揚聲器18以話音的形式輸出識別結(jié)果。為避免移動手提電話機產(chǎn)生噪聲時誤操作,在通過在操作部分中操作啟動話音識別操作之后從話筒17輸入通過重新抓住手提電話機產(chǎn)生的搬動聲,寄存為避免噪聲引起的誤操作的識別字,而在識別開始之后識別出防止噪聲引起的識別字時,再次自動啟動話音識別。
文檔編號H04B15/00GK1256571SQ9912481
公開日2000年6月14日 申請日期1999年11月12日 優(yōu)先權(quán)日1998年11月12日
發(fā)明者鹽野勝美 申請人:日本電氣株式會社