亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音控制外語翻譯設(shè)備用的方法和裝置的制作方法

文檔序號(hào):2829596閱讀:249來源:國知局
專利名稱:語音控制外語翻譯設(shè)備用的方法和裝置的制作方法
背景技術(shù)
I.發(fā)明領(lǐng)域本發(fā)明涉及通信和電信設(shè)備。尤其是,本發(fā)明涉及能夠?qū)⒈镜卣Z言的短語翻譯成一套預(yù)定的外語短語的語音控制設(shè)備的一種新穎改進(jìn)方法和裝置。
II.相關(guān)技術(shù)的描述對(duì)于在外國旅行的個(gè)人而言,不能有效地用當(dāng)?shù)卣Z言進(jìn)行交流會(huì)帶來各種嚴(yán)重的困難。當(dāng)然,最好的解決方法是這個(gè)人精通外語。但是,情況并不總是如此。利用假期旅行的人常??赡茉谕鈬艉苌俚臅r(shí)間。期望假期旅行者因?yàn)橛邢薜囊淮渭倨诼眯卸莆找环N或幾種外語是不合理的。同樣,急忙要求商業(yè)推銷員到國外各地推銷,時(shí)間也有限。。
幫助到外國旅行的人解決交流問題的方法很有限。旅行者可以嘗試在旅行之前學(xué)習(xí)一些關(guān)鍵的短語。如果旅行者能夠在需要時(shí)及時(shí)回想起這些短語,那么,這個(gè)方法會(huì)有極大的幫助。當(dāng)旅行者不能回想起合適的短語時(shí),交流的困難則會(huì)繼續(xù)存在。當(dāng)旅行者通過多個(gè)地區(qū)而每個(gè)地區(qū)都要求一種不同的外語時(shí),有關(guān)回想的問題會(huì)進(jìn)一步復(fù)雜化。
解決交流問題的另一種流行的方法是采用外語短語書籍。當(dāng)要求外國短語時(shí),旅行者在短語書籍中查找其翻譯,然后說出該短語。這種方法存在的問題是查找某個(gè)特殊的短語需要花費(fèi)時(shí)間。但是,因查找短語而延遲些時(shí)間總比無法交流要好。短語書籍是學(xué)習(xí)少量預(yù)定外語短語的恰當(dāng)配套解決手段。
數(shù)字處理能力方面的進(jìn)步使高度復(fù)雜的任務(wù)綜合到便攜式設(shè)備成為可能。無線電話的發(fā)展就展示了先進(jìn)的處理能力被有效地綜合入用戶方便的便攜式設(shè)備。
現(xiàn)代的無線電話在小得足以放在襯衫口袋里的形狀系數(shù)范圍內(nèi)綜合大量復(fù)雜任務(wù)。為了使用戶方便,無線電話中實(shí)現(xiàn)了許多特性。通過結(jié)合顯示器使用電話數(shù)字按鍵鍵盤來進(jìn)行一系列菜單選擇,可以使用這些特性。不同的菜單為各種特性提供分門別類的、方便的分等級(jí)的方法。一些無線電話實(shí)現(xiàn)語音識(shí)別特性。語音識(shí)別允許用戶使用一套預(yù)定的語音命令來操作電話。這使用戶能夠激活特性,而無需手工操縱菜單。但是,電話也被配置成可以使用語音命令來操縱菜單。使用語音命令可獲得的特性包括被叫號(hào)碼撥號(hào)、電子電話簿中的號(hào)碼存儲(chǔ)、根據(jù)姓名從電子電話簿中檢索號(hào)碼和來話應(yīng)答。
存在兩種形式的語音識(shí)別。這兩種形式是說話者有關(guān)語音識(shí)別和說話者無關(guān)語音識(shí)別。說話者無關(guān)語音識(shí)別需要較長的處理時(shí)間和較大的語音數(shù)據(jù)庫。通過將語音輸入與說話者的語音樣品進(jìn)行比較,說話者有關(guān)語音識(shí)別使處理時(shí)間最短且語音數(shù)據(jù)庫規(guī)模最小化。在說話者有關(guān)語音識(shí)別中,用戶在使用語音識(shí)別功能之前必須輸入培訓(xùn)菜單并運(yùn)行培訓(xùn)例行程序。在培訓(xùn)例行程序中,要求用戶說出預(yù)定的命令詞匯,以便使語音識(shí)別特性能夠?qū)W會(huì)識(shí)別用戶語音命令。一旦培訓(xùn)完預(yù)定的詞匯,用戶就能夠使用語音識(shí)別特性了。
無線電話的語音識(shí)別特性考慮電話菜單操縱以外的各種有用的可能性。但是,語音識(shí)別和信號(hào)處理的能力并不是無限的。
需要一種可攜帶的外國短語翻譯器,該翻譯器能夠提供對(duì)本地語言的短語的即時(shí)訪問并將其翻譯成外語短語。這種設(shè)備用作學(xué)習(xí)一小套外語短語的支持解決手段,或者可以為不懂外語短語的旅行者提供一種基本的交流方法。
發(fā)明概述本發(fā)明是用于將說出的本地語言的短語翻譯成外語短語的一種新穎改進(jìn)方法和裝置。在被配置時(shí),該設(shè)備響應(yīng)于用戶所說的本地語言的短語來播放外語短語。
為用戶提供預(yù)定的外語短語集。該集可以是一套單種外語的短語,也可以包括幾套外語短語。該集可以根據(jù)外語來分組,或者,也可以根據(jù)意思來分組。短語集可已在翻譯設(shè)備中實(shí)施后提供給用戶,也可以以某種形式的非易失性存儲(chǔ)器提供給用戶。如果外語短語集以非易失性存儲(chǔ)器的形式(例如,磁盤或CDROM)提供給用戶,則要指導(dǎo)用戶如何將所需的外國短語載入翻譯設(shè)備。
一旦所需的外語短語和對(duì)應(yīng)的本地語言同義詞被載入翻譯設(shè)備,用戶就能夠通過滾動(dòng)設(shè)備用戶接口上的菜單來訪問每個(gè)短語。在說話者有關(guān)語音識(shí)別中,用戶在將設(shè)備的語音識(shí)別特性用作翻譯器之前必須對(duì)其加以培訓(xùn)。用戶必須啟動(dòng)培訓(xùn)例行程序,以便用戶說出本地語言的短語并將所說的本地語言的短語分配給一個(gè)特定的外語短語。語音識(shí)別培訓(xùn)程序通常要求用戶至少將本地語言的短語重復(fù)一次。
被保存在存儲(chǔ)器中的那套外語短語是可擴(kuò)展的。用戶可以為那套外語短語添加從非易失性存儲(chǔ)器裝載的短語,或者,可以使用設(shè)備用戶接口來輸入新的外國短語及其對(duì)應(yīng)的本地語言翻譯。
在培訓(xùn)短語之后,用戶能夠使用翻譯特性。語音識(shí)別特性必須首先起作用。然后,用戶能夠說出本地語言的短語并讓設(shè)備重復(fù)外語短語。
在該較佳實(shí)施例中,無線電話被用作翻譯設(shè)備。現(xiàn)代的無線電話小得足以始終方便攜帶。一些無線電話具有內(nèi)置其中的語音識(shí)別能力。語音識(shí)別被用來允許用戶撥號(hào)、檢索電話簿條目、存儲(chǔ)電話簿條目和使用語音命令來操縱電話菜單。翻譯器特性可以被加到這些無線電話中,而電話內(nèi)的硬件數(shù)量不會(huì)有很大的增加。一些無線電話可以要求額外的存儲(chǔ)器來存儲(chǔ)本地語言的短語和外語短語,而其他的無線電話已擁有充分的內(nèi)存能力,只要求進(jìn)行軟件更新。其他的無線電話可能需要比當(dāng)前電話中的揚(yáng)聲器更強(qiáng)有力的揚(yáng)聲器。電話機(jī)需要較強(qiáng)的揚(yáng)聲器,以提供較響的可聞?shì)敵觥?br> 附圖簡述通過以下陳述的詳細(xì)內(nèi)容并結(jié)合附圖,本發(fā)明的特點(diǎn)、目的和優(yōu)點(diǎn)將更加明顯。在所有附圖中,類似的參考字符進(jìn)行對(duì)應(yīng)的識(shí)別,其中

圖1A-1E是實(shí)現(xiàn)翻譯例行程序的用戶界面的流程圖;圖2是本發(fā)明實(shí)現(xiàn)的無線電話的方框圖;圖3是實(shí)現(xiàn)設(shè)備中的語音識(shí)別執(zhí)行的方框圖;圖4A-4B是設(shè)備用戶界面和翻譯器功能的方框圖。
較佳實(shí)施例的詳細(xì)描述在該較佳實(shí)施例中,包含語音識(shí)別能力的無線電話實(shí)現(xiàn)翻譯特性。用戶通過一個(gè)小套預(yù)定的詞匯集來使用語音識(shí)別特性。必須在使用翻譯特性之前激活語音識(shí)別特性。
參考圖1A,通過首先為電話通電或通過結(jié)束有效的電話通話,用戶啟動(dòng)101用戶接口。在那些用戶動(dòng)作中的任何一個(gè)動(dòng)作之后,電話進(jìn)入備用狀態(tài)102。在備用狀態(tài)102中,電話能夠接受打入的電話或播叫的留言,并能夠打出電話。在備用狀態(tài)102中,用戶也能夠操縱用戶接口菜單。菜單通常被顯示在電話顯示器上,該電話顯示器所具有的菜單選項(xiàng)經(jīng)常提供對(duì)附加菜單的使用。在具有語音識(shí)別特性的電話中,用戶也能夠在備用狀態(tài)102中啟動(dòng)語音識(shí)別例行程序。狀態(tài)103中展示了語音識(shí)別例行程序的啟動(dòng)。通過按數(shù)字按鍵鍵盤上的一個(gè)預(yù)定的按鈕或通過說出和重復(fù)一個(gè)預(yù)定的命令術(shù)語,用戶能夠開始語音識(shí)別特性。在狀態(tài)103中,按數(shù)字按鍵鍵盤上的“結(jié)束”按鈕或兩次說出術(shù)語“喚醒”將啟動(dòng)語音識(shí)別例行程序。應(yīng)該注意,當(dāng)語音識(shí)別特性首次被初始化時(shí),由于還沒有培訓(xùn)語音識(shí)別軟件來認(rèn)出用戶語音命令,用戶必須利用數(shù)字按鍵鍵盤來使用語音識(shí)別特性。
在用戶已經(jīng)使用語音識(shí)別特性之后,例行程序進(jìn)行到狀態(tài)104,其中,語音識(shí)別例行程序進(jìn)行檢查,看看是否已進(jìn)行初始培訓(xùn)。首先要證實(shí)培訓(xùn),因?yàn)檎Z音識(shí)別軟件無法識(shí)別還沒有被培訓(xùn)的用戶命令。如果還沒有完成初始培訓(xùn),則語音識(shí)別軟件將無法識(shí)別任何用戶命令。所以,如果初始培訓(xùn)還沒有完成,則例行程序進(jìn)行到培訓(xùn)菜單900。
但是,如果已完成初始培訓(xùn),則例行程序進(jìn)行到狀態(tài)108。在狀態(tài)108中,語音識(shí)別例行程序通過說“通話、重?fù)?、語音本或休眠”來提示用戶。提示中所用的每個(gè)關(guān)鍵術(shù)語——“通話、重?fù)?、語音本和休眠”是對(duì)應(yīng)于語音控制功能的可用用戶語音命令。但是,該提示只提及了通常所使用的各種命令。用戶也可以使用其他的語音命令。一旦例行程序?qū)⒙牭靡姷奶崾咎峁┙o用戶,例行程序就進(jìn)行到點(diǎn)A111。點(diǎn)A111只用來將圖1A中的流程圖與圖1B中的流程圖鏈接。該點(diǎn)在實(shí)際的語音識(shí)別例行程序內(nèi)沒有功能。
繼續(xù)參考圖1B,從點(diǎn)A111出發(fā),例行程序前進(jìn)到狀態(tài)112,其中,例行程序進(jìn)行檢查,看看在超時(shí)之前是否有任何用戶語音。如果例行程序在用戶語音輸入之前超時(shí),則例行程序?qū)⒂脩舭l(fā)送到狀態(tài)110,狀態(tài)110使用戶返回到圖1A中的點(diǎn),例行程序在該點(diǎn)提示用戶進(jìn)行語音輸入。但是,如果檢測(cè)到語音輸入,則對(duì)語音命令的內(nèi)容進(jìn)行分析。
語音識(shí)別例行程序依靠使用戶語音命令與以前培訓(xùn)過的詞匯集內(nèi)的單詞相關(guān)聯(lián)的能力。如果相關(guān)性超過預(yù)定的門限,則語音輸入符合以前培訓(xùn)過的詞匯集。語音識(shí)別技術(shù)領(lǐng)域的普通技術(shù)人員能夠確定使語音輸入與以前培訓(xùn)過的詞匯集匹配的具體細(xì)節(jié)。語音識(shí)別的領(lǐng)域不是本發(fā)明的基礎(chǔ),所以,沒有詳述語音識(shí)別的過程。
當(dāng)要求用戶語音輸入時(shí),語音識(shí)別例行程序利用證實(shí)有效的語音命令的一項(xiàng)功能。此外,如果不理解該命令,則該功能可能會(huì)提示用戶重復(fù)語音輸入。語音命令驗(yàn)證功能通常將處于要求用戶語音輸入的任何狀態(tài)(例如,狀態(tài)112)。但是,圖1A-1E中沒有描繪這項(xiàng)功能。語音命令驗(yàn)證功能的存在沒有改變本發(fā)明的操作,所以沒有被示出。
處于狀態(tài)112時(shí),用戶可以輸入幾個(gè)語音命令中的一個(gè)語音命令。如果用戶說“翻譯”——狀態(tài)122,則語音識(shí)別例行程序前進(jìn)到翻譯功能——狀態(tài)200。圖1C中詳細(xì)示出翻譯功能200。
如果在狀態(tài)112中用戶說“記錄”——狀態(tài)118,則語音識(shí)別例行程序前進(jìn)到記錄器功能500。記錄器功能500允許用戶手工輸入新的外語短語,它們不在由設(shè)備制造商提供的外國短語集之內(nèi)。圖1F中詳細(xì)示出記錄器功能500。
圖1B中所示的所有其他的命令展示了利用語音命令可獲得的各種電話功能。如果在狀態(tài)112中用戶說出以前已培訓(xùn)并存儲(chǔ)在存儲(chǔ)器中的一個(gè)名稱124,則語音識(shí)別功能進(jìn)行到名稱功能300。名稱功能300允許用戶通過說出以前保存的被呼叫方名稱來對(duì)該方打出電話。
在狀態(tài)112中,如果用戶說“呼叫”126,則語音識(shí)別例行程序進(jìn)行到呼叫功能400。呼叫功能400與名稱功能300很類似它允許用戶使用語音命令進(jìn)行啟呼。但是,在呼叫功能400中,通過說出以前保存的被呼叫方名稱或通過說出要撥打的各數(shù)字,用戶可以進(jìn)行啟呼。
并非所有的用戶語音命令都涉及啟呼。如果用戶在狀態(tài)112中說“語音本”128,則語音識(shí)別例行程序進(jìn)行到語音本功能500。語音本功能500使用戶能夠使用語音命令來將名稱和有關(guān)的電話號(hào)碼保存在語音電話簿中。然后,通過語音命令,可以獲得語音電話簿中的名稱??梢岳妹Q功能300或通話功能400來訪問被存儲(chǔ)的名稱。
在狀態(tài)112中,用戶可以獲得補(bǔ)充的語音命令。根據(jù)語音命令而被激活的這些補(bǔ)充的功能由狀態(tài)130來表現(xiàn)。補(bǔ)充的命令包括退出語音識(shí)別模式的命令、啟動(dòng)培訓(xùn)功能的命令和啟動(dòng)末次被叫號(hào)碼重?fù)艿拿睢?br> 圖1C表現(xiàn)了圖1B中所示的翻譯功能200的流程圖。當(dāng)用戶發(fā)出語音命令來啟動(dòng)翻譯功能200時(shí),圖1C中所展示的例行程序開始201。翻譯功能200首先進(jìn)行檢查,看看是否有任何外語短語被保存在存儲(chǔ)器中——狀態(tài)202。在外語短語以CDROM或軟盤的形式被提供給用戶的設(shè)備中,要求用戶輸入所需的那套外語短語。這種方法很靈活,因?yàn)樗试S將許多套的外語短語提供給用戶。然后,用戶只需要裝載所需的那套外語短語。通過不要求對(duì)將被永遠(yuǎn)存儲(chǔ)在設(shè)備中的外語短語進(jìn)行全面的編輯,可以使設(shè)備的硬件要求最少。
如果在狀態(tài)202中例行程序目前在存儲(chǔ)器中沒有發(fā)現(xiàn)任何外語短語,則例行程序進(jìn)行到狀態(tài)204,其中,指導(dǎo)用戶裝載外國短語。這時(shí),還為用戶提供了退出語音識(shí)別功能的機(jī)會(huì)(未示出)。
一旦用戶已將外國短語載入存儲(chǔ)器,或者,如果語音識(shí)別例行程序檢測(cè)到已經(jīng)被載入存儲(chǔ)器的外國短語,則語音識(shí)別例行程序進(jìn)行到狀態(tài)210,來進(jìn)行檢查,看看外語短語是否已培訓(xùn)。如果外語短語還沒有培訓(xùn),則語音識(shí)別例行程序進(jìn)行到培訓(xùn)菜單700。但是,如果外語短語已經(jīng)培訓(xùn),則語音識(shí)別例行程序進(jìn)行到狀態(tài)220,其中,等候用戶說本地語言的短語。可能允許狀態(tài)220無限期地繼續(xù)下去,直到被用戶取消,或該狀態(tài)具有與其有關(guān)的超時(shí)。
一旦用戶說出一個(gè)本地語言的短語,語音識(shí)別例行程序就進(jìn)行到狀態(tài)230,使用戶短語與被存儲(chǔ)在存儲(chǔ)器中的以前培訓(xùn)過的短語相關(guān)。如果語音識(shí)別例行程序不能使用戶短語與被存儲(chǔ)在存儲(chǔ)器中的以前培訓(xùn)過的短語相關(guān),則例行程序進(jìn)行到狀態(tài)232,其中,電話播放出錯(cuò)消息。然后,語音識(shí)別例行程序返回到狀態(tài)220,以等候用戶語音輸入。允許用戶重復(fù)一個(gè)短語的次數(shù)可以由語音識(shí)別例行程序來控制。最好允許用戶能夠無限次地進(jìn)行重試。如果重試的次數(shù)不受限制,那么,將允許用戶輸入,直到發(fā)現(xiàn)匹配或直到用戶決定退出翻譯功能。或者,語音識(shí)別例行程序可能只允許次數(shù)有限的失敗的語音命令。如果重試的次數(shù)有限,則翻譯功能將在達(dá)到界限時(shí)終止。
如果在狀態(tài)230中用戶輸入與以前培訓(xùn)過的短語相關(guān),則語音識(shí)別功能進(jìn)行到狀態(tài)240。在狀態(tài)240中,語音識(shí)別功能播放對(duì)應(yīng)于以前培訓(xùn)短語的外語短語。用戶短語與以前培訓(xùn)短語取相關(guān)的成功,會(huì)使電話播放外語短語?;蛘?,語音識(shí)別功能可以將外語短語顯示在顯示器上。電話有效地將用戶輸入的本地語言的短語翻譯成外語短語。
圖1D是培訓(xùn)菜單900的方框圖。如果用戶從未執(zhí)行任何語音培訓(xùn),那么,可以從高層次菜單110獲得培訓(xùn)菜單900或自動(dòng)使用培訓(xùn)菜單900。當(dāng)啟動(dòng)培訓(xùn)菜單時(shí)901,電話進(jìn)行到狀態(tài)902,其中,電話顯示各種詞匯集選項(xiàng)。詞匯集選項(xiàng)通常會(huì)包括對(duì)應(yīng)于數(shù)字的詞匯集、命令單詞的詞匯集和對(duì)應(yīng)于翻譯功能的詞匯集。然后,電話等用戶選擇要培訓(xùn)的一個(gè)詞匯集。一旦用戶選擇一個(gè)詞匯集——狀態(tài)910,例行程序進(jìn)行到狀態(tài)912,其中,電話顯示對(duì)應(yīng)于所選詞匯集的各種可用的培訓(xùn)選項(xiàng)。
為用戶提供培訓(xùn)詞匯集或重新培訓(xùn)詞匯集的選項(xiàng)。如果用戶從未嘗試培訓(xùn)特殊的詞匯集,則使用培訓(xùn)選項(xiàng)。如果用戶希望完全重新培訓(xùn)詞匯集中的所有單詞,則也使用培訓(xùn)選項(xiàng)。如果用戶以前已培訓(xùn)過詞匯集并希望只重新培訓(xùn)詞匯的一部分,則使用重新培訓(xùn)選項(xiàng)。還為用戶提供了退出培訓(xùn)菜單的選項(xiàng)。
如果用戶選擇培訓(xùn)選項(xiàng)914,則例行程序進(jìn)行到所選詞匯集700的初始培訓(xùn)功能。圖1E提供了有關(guān)翻譯功能的培訓(xùn)功能的詳細(xì)的流程圖。
如果用戶選擇重新培訓(xùn)選項(xiàng)916,則例行程序進(jìn)行到所選詞匯集800的重新培訓(xùn)功能。除了重新培訓(xùn)功能允許用戶跳過不需要被重新培訓(xùn)的詞匯集中的單詞以外,重新功能十分類似于初始培訓(xùn)功能。
為用戶提供的最后的選項(xiàng)是退出菜單924。如果用戶選擇退出菜單924,則例行程序可以使用戶返回到高層次菜單110或退出語音識(shí)別功能。
圖1E是流程圖,詳述了對(duì)應(yīng)于翻譯功能的初始培訓(xùn)功能。初始培訓(xùn)功能開始于狀態(tài)710,其中,語音識(shí)別例行程序(被縮寫為VR)通過說“遵循語音指令,開始培訓(xùn)”來提示用戶。然后,例行程序進(jìn)行到狀態(tài)712,其中,提示用戶“說術(shù)語(短語)”。提示中的術(shù)語(短語)代表用戶目前正在培訓(xùn)的本地語言的短語。裝載對(duì)應(yīng)于外語短語的本地語言的短語,同時(shí),外國短語設(shè)置被載入電話?;蛘撸娫掞@示器會(huì)示出外語短語,并會(huì)清除提示陳述本地語言的短語的部分。但是,不推薦這個(gè)替換的實(shí)施例,因?yàn)橛脩綦S后必須知道外語短語的翻譯,以便說出正確的本地語言的短語。這有可能導(dǎo)致本地語言的短語和外語短語發(fā)生錯(cuò)誤配對(duì)。
一旦語音識(shí)別例行程序?yàn)橛脩籼峁┨崾?,例行程序就進(jìn)行到狀態(tài)716,以等候用戶語音輸入。如果用戶在超時(shí)之前沒有作出響應(yīng),則例行程序返回到狀態(tài)712,以重復(fù)用戶提示。如要求用戶輸入的前面的各種狀態(tài)中那樣,狀態(tài)716允許在終止功能之前發(fā)生數(shù)量有限的超時(shí)。如果用戶在狀態(tài)716中提供語音輸入,則語音識(shí)別功能進(jìn)行到狀態(tài)720,并說“再來一次”,以提示用戶重復(fù)短語。
然后,語音識(shí)別例行程序進(jìn)行到狀態(tài)724,以等候在超時(shí)之前來自用戶的語音輸入。如果超時(shí)發(fā)生在用戶語音輸入之前,則例行程序返回到狀態(tài)720,重復(fù)進(jìn)行提示。與前面一樣,只為用戶提供數(shù)量有限的機(jī)會(huì),以便在例行程序終止之前提供輸入。如果用戶在超時(shí)之前提供語音輸入,則例行程序進(jìn)行到狀態(tài)726并決定兩個(gè)用戶輸入是否匹配。
如果第二個(gè)用戶語音輸入與第一個(gè)用戶語音輸入不匹配,則例行程序進(jìn)行到狀態(tài)740,其中,語音識(shí)別功能告訴用戶“匹配失敗”。匹配失敗有各種各樣的原因。如果用戶沒有用相同的方法來重復(fù)短語,則首先假設(shè)不匹配。此外,如果用戶沒有在允許的輸入窗口內(nèi)提供完全的短語,則不捕獲輸入的一個(gè)部分。這導(dǎo)致了兩個(gè)用戶輸入的匹配失敗。由于不能確定匹配失敗的根本原因,因此,用戶必須再次培訓(xùn)短語。例行程序返回到狀態(tài)712,以重復(fù)當(dāng)前短語的培訓(xùn)。
如果語音識(shí)別例行程序確定兩個(gè)用戶輸入相匹配,則短語被保存在存儲(chǔ)器中,例行程序進(jìn)行到狀態(tài)728。在狀態(tài)728中,語音識(shí)別例行程序進(jìn)行檢查,看看所有短語是否已被培訓(xùn)。如果并非所有短語已被培訓(xùn),則例行程序進(jìn)行到狀態(tài)732并從詞匯集中檢索下一個(gè)短語。然后,例行程序返回到狀態(tài)712,以提示用戶培訓(xùn)短語。
一旦已培訓(xùn)所有的短語,狀態(tài)728將例行程發(fā)送回高層次菜單110。然后,用戶能夠使用翻譯功能。
記錄器功能500允許用戶將外語短語輸入由設(shè)備制造商提供的外語短語的設(shè)置。一旦記錄器功能500被啟動(dòng)501,例行程序就進(jìn)行到狀態(tài)502,其中,例行程序提示用戶一個(gè)本地語言的短語。該提示可以是向用戶播放的聲音提示、在設(shè)備顯示器上示出的可見提示或兩者的組合。將要求用戶輸入本地語言的短語。利用數(shù)字按鍵鍵盤來輸入本地語言的短語。這使用戶能夠?yàn)楸镜卣Z言的短語和由設(shè)備制造商提供的預(yù)定的本地語言的短語編目錄?;蛘撸崾居脩粽f本地語言的短語,用戶語音輸入被保存在設(shè)備中。一旦用戶已輸入本地語言的短語,例行程序就進(jìn)行到狀態(tài)504,其中,例行程序通過說“說外語短語”來提示用戶。然后,例行程序前進(jìn)到狀態(tài)510,以等候用戶輸入。如果在超時(shí)時(shí)期之前沒有用戶輸入,則例行程序返回到狀態(tài)504,以再次提示用戶說外國短語。如果用戶在超時(shí)之前提供外語短語,則例行程序前進(jìn)到狀態(tài)512,其中,例行程序通過說“再來一次”來提示用戶重復(fù)外語短語。然后,例行程序進(jìn)行到狀態(tài)520,其中,例行程序等候用戶輸入。如果用戶在超時(shí)之前沒有提供任何輸入,則例行程序返回到狀態(tài)512,以提示用戶重復(fù)外語短語。雖然在流程圖中未示出,但是,在退出例行程序之前,例行程序通常將只允許輸入超時(shí)發(fā)生兩次。如果用戶在超時(shí)之前重復(fù)外語短語,則例行程序進(jìn)行到狀態(tài)530,以進(jìn)行檢查,看看外語短語的兩次發(fā)音是否匹配。雖然例行程序?qū)⒉粫?huì)通過使用語音識(shí)別來使用戶輸入與外語短語相匹配,但是,例行程序使兩次發(fā)音相匹配,以確保輸入一致。有關(guān)用戶記錄的外語短語的一個(gè)缺點(diǎn)是被存儲(chǔ)的外語短語的發(fā)音。制造商提供的外語短語發(fā)音正確,明確地對(duì)應(yīng)于本地語言的短語。對(duì)比而言,用戶輸入的外語短語可能會(huì)遇到用戶口音方面的困難。最壞的情況是由用戶輸入的外語短語可能不與用戶認(rèn)為要翻譯的本地語言的短語相對(duì)應(yīng)。
如果例行程序決定用戶說出的兩個(gè)外語短語不匹配,則例行程序返回到狀態(tài)504,以再次提示用戶說外語短語。一旦例行程序確定外語短語的兩次發(fā)音相互匹配,例行程序就返回到“高層次菜單”——狀態(tài)110。和任何制造商所提供的外語短語一樣,在使用新的外語短語之前,用戶必須培訓(xùn)設(shè)備。
圖2中的方框圖展示了實(shí)現(xiàn)該較佳實(shí)施例所需的硬件。實(shí)現(xiàn)該較佳實(shí)施例的所有要素已存在于有些無線電話內(nèi)。圖2展示了實(shí)現(xiàn)較佳實(shí)施例的無線電話600的方框圖。
天線602用作無線電話600硬件與電磁輻射之間的過渡。天線602接收電磁輻射并將信號(hào)轉(zhuǎn)移到RF收發(fā)機(jī)610。同樣,RF收發(fā)機(jī)610將發(fā)送信號(hào)提供給天線602,以便向基站播送。
在接收信號(hào)路徑中,RF收發(fā)機(jī)610過濾并放大所接收的信號(hào)。然后,將所接收的信號(hào)下變頻為基帶信號(hào)。將這個(gè)基帶信號(hào)提供給基帶處理器620。數(shù)字處理器630與基帶處理器620協(xié)同工作,來提取并形成所接收信號(hào)中的信息。然后,數(shù)字處理器將提取并形成的信息提供給合適的硬件。通過從存儲(chǔ)器640檢索預(yù)定的振鈴聲并在振鈴器上播放它,數(shù)字處理器630處理來話通知。電話顯示器654上示出電話所接收的本文信息。語音信號(hào)被發(fā)送給揚(yáng)聲器658,以便向用戶播放。其他信息被發(fā)送給合適的接口設(shè)備652。
在發(fā)送路徑中,電話通過數(shù)字按鍵鍵盤656或接口設(shè)備(例如,話筒660)來接收用戶輸入。數(shù)字處理器630協(xié)同基帶處理器620對(duì)輸入信號(hào)進(jìn)行調(diào)節(jié)和格式化。然后,基帶信號(hào)被提供給RF收發(fā)機(jī)610,其中,基帶信號(hào)被向上變頻為發(fā)送頻率,并通過天線602播送。
電話內(nèi)的存儲(chǔ)器640保存有電話操作軟件。用戶界面表示操作軟件的一個(gè)部分。語音識(shí)別算法也作為軟件被存儲(chǔ)在電話內(nèi)的存儲(chǔ)器640中,這些電話所提供的語音識(shí)別作為最理想的用戶界面。在本發(fā)明的一個(gè)實(shí)施例中,預(yù)定的一套外語短語被存儲(chǔ)在存儲(chǔ)器644的一個(gè)部分中。電話存儲(chǔ)器640可以由幾塊存儲(chǔ)器芯片構(gòu)成。如果電話存儲(chǔ)器640使用多塊存儲(chǔ)器芯片,則外語短語被存儲(chǔ)在第一個(gè)存儲(chǔ)器器件中。
在另一個(gè)實(shí)施例中,利用某種類型的非易失性存儲(chǔ)器格式(例如,軟盤或CDROM)為用戶提供幾套外語短語。這幾套外語短語根據(jù)外語加以分離。然后,用戶選擇一套外語短語,并利用通過數(shù)據(jù)電纜連接到電話機(jī)的個(gè)人計(jì)算機(jī)來將信息下載到電話。然后,外語短語被保存在電話存儲(chǔ)器644內(nèi)。第二個(gè)實(shí)施例的優(yōu)點(diǎn)是使用戶能夠挑選將把哪個(gè)外語短語載入電話。缺點(diǎn)是需要額外的勞力和硬件。
一旦外國短語已被載入電話存儲(chǔ)器644,用戶就必須培訓(xùn)語音識(shí)別例行程序,以識(shí)別本地語言的短語。用戶無法使用翻譯特性,直到已完成語音識(shí)別培訓(xùn)。上面的圖1中提供了語音識(shí)別培訓(xùn)例行程序的細(xì)節(jié)。在語音識(shí)別培訓(xùn)期間,電話將用戶的本地語言語音輸入保存在存儲(chǔ)器的另一個(gè)部分642中。當(dāng)電話存儲(chǔ)器640由多塊存儲(chǔ)器芯片構(gòu)成時(shí),本地語言的短語被保存在第二個(gè)存儲(chǔ)器器件中。每個(gè)被保存的本地語言的短語對(duì)應(yīng)于以前被保存的外語短語中的一個(gè)外語短語。
一旦已完成語音識(shí)別培訓(xùn),用戶就能夠使用翻譯特性。為了使用翻譯特性,用戶首先要使用電話內(nèi)的語音識(shí)別能力。通過按預(yù)定順序按數(shù)字按鍵鍵盤656上的鍵,或通過說一個(gè)以前培訓(xùn)過的語音命令,可以實(shí)現(xiàn)這一點(diǎn)。用戶語音命令利用話筒660輸入到電話并在數(shù)字處理器630中加以處理,該數(shù)字處理器運(yùn)行保存在存儲(chǔ)器640中的語音識(shí)別軟件。一旦已啟動(dòng)語音識(shí)別例行程序,用戶必須操縱翻譯特性。用戶可以通過一系列按鍵或語音命令來實(shí)現(xiàn)這一點(diǎn)。一旦用戶使用翻譯特性,就可以獲得外語短語。用戶將一個(gè)本地語言的短語語音輸入提供給話筒660,數(shù)字處理器630利用保存在電話存儲(chǔ)器640中的語音識(shí)別軟件來處理話筒660。如果語音輸入與保存在電話存儲(chǔ)器642中的一個(gè)本地語言的短語相關(guān),則數(shù)字處理器檢索一個(gè)產(chǎn)生的短語,以輸出給用戶。通常,產(chǎn)生的短語是對(duì)應(yīng)于本地語言的短語的、來自存儲(chǔ)器644的外語短語。數(shù)字處理器檢查該外語短語并在揚(yáng)聲器658上播放它。在一個(gè)替換實(shí)施例中,產(chǎn)生的短語是對(duì)應(yīng)于本地語言的短語的外語短語的文本。在這種情況下,外語短語的文本被顯示在電話顯示器654上。用戶說出本地語言的短語,電話利用語音識(shí)別答出外語短語。電話有效地將本地語言的短語翻譯成外語短語。
圖3示出語音識(shí)別功能的更加詳細(xì)的方框圖。用戶界面/語音服務(wù)應(yīng)用程序1302被用來使到語音服務(wù)1 310的用戶界面方便。語音“應(yīng)用程序編程界面(API)”用于將用戶界面1302與語音識(shí)別應(yīng)用程序的剩余部分連接起來。語音服務(wù)1310控制各種語音識(shí)別任務(wù)的分配。語音服務(wù)1310也監(jiān)視與語音識(shí)別有關(guān)的重放、培訓(xùn)、識(shí)別與控制功能。當(dāng)要保存或從存儲(chǔ)器接收語音信息時(shí),語音數(shù)據(jù)庫(DB)1340執(zhí)行所需的各種控制功能。存儲(chǔ)器管理器1344執(zhí)行有關(guān)將實(shí)際的存儲(chǔ)器硬件連接到其余的軟件例行程序的各種任務(wù)。聲音1312功能被用來合成和播放語音服務(wù)所需的聲音。這些聲音包括信號(hào)音、提醒音,以及通過語音數(shù)據(jù)庫1340從存儲(chǔ)器檢索到的語音聲音。聲碼器驅(qū)動(dòng)器1314和聲碼器DSP1320例行程序用于使語音輸入信號(hào)格式化并對(duì)它們進(jìn)行處理,以便它們可以被用于“語音識(shí)別引擎1330”中。它們也對(duì)語音輸出數(shù)據(jù)進(jìn)行格式化,并通過揚(yáng)聲器來重放語音數(shù)據(jù)。VR引擎1330的功能是執(zhí)行實(shí)際的語音識(shí)別。VR引擎1330采用已在聲碼器DSP1320中被處理過的語音輸入,并將它與通過語音數(shù)據(jù)庫1340從存儲(chǔ)器檢索到的各種語音模板進(jìn)行比較。向語音服務(wù)1310指出匹配或拒絕,語音服務(wù)1310監(jiān)督VR引擎1330的操作。
圖4A進(jìn)一步詳述用戶界面1302。用戶界面1302由許多處理程序構(gòu)成,以選定所需各種用戶輸入和輸出的地址。例如,有一種處理程序用于將鍵盤接到應(yīng)用程序。一旦處理程序1402已將用戶輸入轉(zhuǎn)換成合適的事件,該事件就被發(fā)送到合適的狀態(tài)機(jī)1410。電話內(nèi)的所有功能的特征能以狀態(tài)機(jī)的形式表現(xiàn)。表現(xiàn)由軟件執(zhí)行的電話內(nèi)的所有任務(wù)的總狀態(tài)機(jī)1410由執(zhí)行特殊應(yīng)用程序的許多個(gè)性化的狀態(tài)機(jī)S1 1412~Sn 1416構(gòu)成。個(gè)性化的狀態(tài)機(jī)之一是翻譯器1414。翻譯器1414狀態(tài)機(jī)控制翻譯用戶界面應(yīng)用程序的流程。
在狀態(tài)機(jī)中得到處理的信息在發(fā)送給語音服務(wù)1310或語音數(shù)據(jù)庫1340之前在外部接口管理器1420中進(jìn)行調(diào)節(jié)。在類似于狀態(tài)機(jī)1410的結(jié)構(gòu)中,外部接口管理器1420由管理與應(yīng)用程序的接口的許多單獨(dú)的管理器E1 1422~En 1426構(gòu)成?!罢Z音服務(wù)(VS)”管理器1424被用來在翻譯器1414狀態(tài)機(jī)與語音服務(wù)1310或語音數(shù)據(jù)庫1340應(yīng)用程序之間進(jìn)行連接。
用戶界面1302中所有的例行程序可獲得各種公用1430應(yīng)用程序。公用程序1430對(duì)于任何一個(gè)例行程序而言并不是專用的,而是在用戶界面1302的所有例行程序中共用的。
圖4B是詳述翻譯器狀態(tài)機(jī)1414的方框圖。翻譯器狀態(tài)機(jī)1414由三個(gè)較小的狀態(tài)機(jī)——培訓(xùn)器1510、翻譯器1512和記錄器1514構(gòu)成。每個(gè)較小的狀態(tài)機(jī)控制翻譯器狀態(tài)機(jī)1414的那個(gè)部分的功能。翻譯器狀態(tài)機(jī)1414與外部接口管理器1420、語音服務(wù)1310和語音數(shù)據(jù)庫1340的關(guān)系與圖4A所示的相同。
所提供的有關(guān)較佳實(shí)施例的前述內(nèi)容使精通該技術(shù)領(lǐng)域的任何人都能夠創(chuàng)作或使用本發(fā)明。精通該技術(shù)領(lǐng)域的人將容易了解這些實(shí)施例的各種修改,這里所定義的各種一般的原理可以應(yīng)用于其他實(shí)施例,而無需使用發(fā)明人員。因此,本發(fā)明并非意在局限于這里所示的實(shí)施例,而是具有與這里所揭示的原理和新穎的特點(diǎn)相一致的最廣泛的范圍。
權(quán)利要求
1.將本地語言的短語翻譯成外語短語的一種方法,其特征在于包括將多個(gè)外語短語保存在第一個(gè)存儲(chǔ)器位置中;將多個(gè)本地語言的短語保存在第二個(gè)存儲(chǔ)器位置中,每個(gè)本地語言的短語對(duì)應(yīng)于多個(gè)外語短語中的一個(gè)外語短語;接收一個(gè)說出的短語;使說出的短語與保存在第二個(gè)存儲(chǔ)器位置中的本地語言的短語相關(guān);如果說出的短語與保存在第二個(gè)存儲(chǔ)器位置中的本地語言的短語之一之間的相關(guān)性超出預(yù)定的門限,則輸出產(chǎn)生的外語短語。
2.權(quán)利要求1的方法,其特征在于其中,通過在揚(yáng)聲器上播放產(chǎn)生的短語,來輸出產(chǎn)生的外語短語。
3.權(quán)利要求1的方法,其特征在于其中,通過在顯示器上顯示產(chǎn)生的短語,來輸出產(chǎn)生的外語短語。
4.權(quán)利要求1的方法,其特征在于其中,第一個(gè)存儲(chǔ)器位置和第二個(gè)存儲(chǔ)器位置位于單個(gè)存儲(chǔ)器器件的各不相同的部分內(nèi)。
5.用于將本地語言的短語翻譯成外語短語的一種裝置,其特征在于包括存儲(chǔ)預(yù)定的多個(gè)外語短語的第一個(gè)存儲(chǔ)器器件;存儲(chǔ)多個(gè)本地語言的短語的第二個(gè)存儲(chǔ)器器件,每個(gè)本地語言的短語對(duì)應(yīng)于多個(gè)外語短語中的一個(gè)外語短語;一個(gè)語音識(shí)別設(shè)備,它接收語音輸入,將語音輸入與保存在第二個(gè)存儲(chǔ)器中的本地語言的短語進(jìn)行比較,并且,如果本地語言的短語與語音輸入的相關(guān)性超出預(yù)定的門限,則輸出對(duì)應(yīng)于本地語言的短語的外語短語。
6.權(quán)利要求5的裝置,其特征在于其中,通過在揚(yáng)聲器上播放外語短語,來輸出外語短語。
7.權(quán)利要求5的裝置,其特征在于其中,通過在顯示器上顯示外語短語,來輸出外語短語。
8.權(quán)利要求5的裝置,其特征在于其中,第一個(gè)存儲(chǔ)器器件和第二個(gè)存儲(chǔ)器器件是相同器件的不同部分。
9.權(quán)利要求5的裝置,其特征在于其中,保存在第二個(gè)存儲(chǔ)器器件中的本地語言的短語是保存在第一個(gè)存儲(chǔ)器器件中的外語短語的本地語言翻譯。
10.權(quán)利要求5的裝置,其特征在于其中,本地語言的短語是對(duì)培訓(xùn)例行程序所呈現(xiàn)的各種提示的用戶響應(yīng)。
12.權(quán)利要求5的裝置,其特征在于其中,多個(gè)外語短語代表多種外語。
13.權(quán)利要求5的裝置,其特征在于其中,輸出的外語短語對(duì)應(yīng)于多種外語中的一種外語。
14.權(quán)利要求5的裝置,其特征在于其中,用戶能夠?qū)⒀a(bǔ)充的外語短語記錄并且存儲(chǔ)在第一個(gè)存儲(chǔ)器器件內(nèi)。
全文摘要
在設(shè)備中實(shí)現(xiàn)的一種語音控制外語翻譯器(600),使用戶可以用其本地語言說一個(gè)短語,而翻譯器將用外語重復(fù)該短語。為用戶提供預(yù)定的外國短語集(644)。這些短語存儲(chǔ)在設(shè)備存儲(chǔ)器(640)中。用戶可以使用每個(gè)單獨(dú)的短語。如果實(shí)現(xiàn)說話者有關(guān)語音識(shí)別,則用戶必須在使用翻譯特性之前培訓(xùn)設(shè)備,以便使本地語言的短語和外語短語相關(guān)。設(shè)備內(nèi)的數(shù)字處理器(630)運(yùn)行的語音識(shí)別軟件對(duì)用戶語音輸入進(jìn)行處理。一旦用戶已培訓(xùn)設(shè)備,該設(shè)備就可以用于翻譯模式中。在翻譯模式中,用戶說出多個(gè)預(yù)先培訓(xùn)過的本地語言的短語中的一個(gè)短語,設(shè)備則利用語音識(shí)別來輸出對(duì)應(yīng)的外國短語。通常在設(shè)備中的揚(yáng)聲器(658)上播放輸出。
文檔編號(hào)G10L15/00GK1425158SQ00818512
公開日2003年6月18日 申請(qǐng)日期2000年11月21日 優(yōu)先權(quán)日1999年11月23日
發(fā)明者G·C·史 申請(qǐng)人:高通股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1