專利名稱:基于按鍵和語音識別的文字輸入方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種利用按鍵輸入和語音識別技術(shù)進(jìn)行文字輸入的方法和裝置。特別是一種將使用按鍵的字符輸入法與語音識別技術(shù)結(jié)合以進(jìn)行漢語和英語綜合輸入的方法和裝置。
背景技術(shù):
目前,移動電話的短消息已逐漸成為一種很方便的信息傳送、交流方式。但隨著移動電話的尺寸越做越小,按鍵的尺寸、鍵盤布局、硬件容量等的限制,通過移動電話進(jìn)行漢字、英語單詞的輸入還存在著不便之處。人們常常會為輸入某些常見的漢字、英語單詞而頻繁按鍵選擇。這一方面大大限制了信息輸入的速度,另一方面也促使人們在不斷努力尋求更好的輸入方法,以便以盡量少的按鍵達(dá)到盡量大的目標(biāo)命中率。
應(yīng)用于移動電話的較為流行的漢字輸入法主要是普通的拼音輸入(即,逐個準(zhǔn)確地輸入拼音字母)、T9拼音輸入和筆畫輸入。較為流行的英語單詞輸入法主要是普通單詞法(即,逐個準(zhǔn)確地輸入相應(yīng)字母)、T9單詞輸入。這其中,T9輸入法因其簡單易用和相對高的命中率,同時帶有后續(xù)詞的聯(lián)想功能而逐漸受到多數(shù)用戶的青睞。但即便如此,T9輸入法在多數(shù)情況下仍需要用戶的多次搜索尋找,尤其是在相應(yīng)漢字的拼音相對簡單的情況下。
另一方面,隨著語音識別技術(shù)的發(fā)展,其適用領(lǐng)域也越來越廣泛。應(yīng)用于PDA(個人數(shù)字助理)的限定語句集的漢語語句識別率已可達(dá)到90%左右的命中率。這使得語音識別技術(shù)很適合應(yīng)用在一些特定的領(lǐng)域,如航空售票、旅館服務(wù)等。在這些領(lǐng)域中,一般都有比較固定的交流用語集。但在非限定范圍的應(yīng)用中,利用語音識別技術(shù)進(jìn)行漢字輸入還很難達(dá)到很高的準(zhǔn)確率,在識別過程中往往還需要使用者的交互輸入來進(jìn)行相似發(fā)音字、詞的選擇。這還是在基于PC這種大容量、高運(yùn)算率的設(shè)備基礎(chǔ)上。對移動電話短信而言,一方面因短信內(nèi)容的開放性,另一方面因移動電話自身硬件條件的限制,直接利用語音來進(jìn)行聽寫式的短信輸入還很難達(dá)到很理想的水平。就是說,在真正使用的時候,不可避免地需要用戶在眾多語音識別無法準(zhǔn)確命中的被選字、詞中進(jìn)行選擇。相對于T9的高命中率,目前純粹利用語音識別來進(jìn)行短信輸入還很難達(dá)到用戶滿意的程度。
另外,短信交流內(nèi)容也逐漸成為一種個人隱私,很難想象用戶會在一些寂靜或者嘈雜的公共場合,會單獨(dú)采用語音識別方法來進(jìn)行短信輸入。
因此,需要一種綜合利用T9輸入法和語音識別技術(shù)來進(jìn)行可應(yīng)用于嵌入式設(shè)備的漢語、英語綜合輸入的方法和裝置。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種利用按鍵輸入法和語音識別技術(shù)結(jié)合的文字輸入方法和裝置,能夠利用按鍵輸入法和語音識別技術(shù)各自的優(yōu)點而提供一種適合于嵌入式設(shè)備的漢語、英語輸入方法。
本發(fā)明的另一個目的是提供一種利用按鍵輸入法和語音識別技術(shù)結(jié)合的文字輸入方法和裝置,能夠利用T9輸入法和語音識別技術(shù)各自的優(yōu)點而提供一種適合于嵌入式設(shè)備的漢語、英語輸入方法。
根據(jù)本發(fā)明的一個方面,提供一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入生成包括目標(biāo)字的候選字;利用語音讀入目標(biāo)字的讀音;將生成的所述候選字的至少一個讀音與語音讀入的所述目標(biāo)字的讀音進(jìn)行匹配,以篩選出所生成的所述目標(biāo)字;和顯示經(jīng)篩選出的目標(biāo)字。
根據(jù)本發(fā)明的另一個方面,提供一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入目標(biāo)字的漢字拼音和/或英文字母,以生成包括目標(biāo)字的候選字;讀入目標(biāo)字的語音;將生成的所述候選字的至少一個讀音與讀入的所述目標(biāo)字的語音進(jìn)行匹配,以篩選出所生成的所述目標(biāo)字;和顯示經(jīng)篩選出的目標(biāo)字。
根據(jù)本發(fā)明的另一個方面,提供一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入法給語音識別求解集進(jìn)行限制;利用語音識別進(jìn)行準(zhǔn)確和進(jìn)一步的目標(biāo)字命中。
根據(jù)本發(fā)明的另一個方面,提供一種按鍵輸入與語音識別相結(jié)合的文字輸入裝置,包括按鍵輸入處理裝置,用于處理通過按鍵輸入的漢字拼音和/或英文字母;有效字符組合存儲裝置,用于存儲根據(jù)按鍵輸入產(chǎn)生的有效字符;語音輸入處理單元,用于處理讀入的目標(biāo)字的語音;語音匹配裝置,用于將有效字符組合存儲裝置存儲的有效字符讀音與語音輸入處理單元輸出的對應(yīng)目標(biāo)字讀音進(jìn)行匹配以篩選出候選字;和備選字存儲單元裝置,用于存儲與按鍵輸入對應(yīng)的備選漢字和/或英語單詞,和由語音匹配裝置篩選出的候選字。
根據(jù)本發(fā)明的再一個方面,提供一種裝配有按鍵輸入與語音識別相結(jié)合的文字輸入裝置的移動電話,所述文字輸入裝置包括按鍵輸入處理裝置,用于處理通過按鍵輸入的漢字拼音和/或英文字母;有效字符組合存儲裝置,用于存儲根據(jù)按鍵輸入產(chǎn)生的有效字符;語音輸入處理單元,用于處理讀入的目標(biāo)字的語音;語音匹配裝置,用于將有效字符組合存儲裝置存儲的有效字符讀音與語音輸入處理單元輸出的對應(yīng)目標(biāo)字讀音進(jìn)行匹配以篩選出候選字;和備選字存儲單元裝置,用于存儲與按鍵輸入對應(yīng)的備選漢字和/或英語單詞,和由語音匹配裝置篩選出的候選字。
本發(fā)明的核心是首先利用T9輸入法給語音識別求解集進(jìn)行限制,進(jìn)而利用語音識別進(jìn)行準(zhǔn)確和進(jìn)一步的命中。
通過閱讀和理解下面參考附圖所做的詳細(xì)描述,將使本發(fā)明的這些和其它優(yōu)點對本領(lǐng)域技術(shù)人員變得顯而易見。其中圖1是標(biāo)準(zhǔn)的移動電話按鍵的布局示意圖;圖2是表示利用T9輸入法按動按鍵后在移動電話屏幕上顯示的候選字的一個實例的示意圖;圖3是表示利用T9輸入法按動按鍵后在移動電話屏幕上顯示的候選字的另一個實例的示意圖;圖4是利用根據(jù)本發(fā)明的輸入法在移動電話的顯示屏上得到的候選字的一個實例的示意圖;圖5是表示根據(jù)本發(fā)明實施例執(zhí)行輸入法的文字輸入裝置的結(jié)構(gòu)方框圖;和圖6是表示執(zhí)行根據(jù)本發(fā)明實施例的輸入法的流程圖。
具體實施例方式
有關(guān)本發(fā)明的前述及其它技術(shù)內(nèi)容、特點與功效,通過以下結(jié)合附圖對優(yōu)選實施例的詳細(xì)說明,將會更加清楚。在描述過程中省略了對于本發(fā)明來說是不必要的細(xì)節(jié)和功能,以防止對本發(fā)明的理解造成混淆。
下面首先介紹T9輸入法?,F(xiàn)在移動電話最常用的輸入法都是T9輸入法。T9實際上是“Texton9Keys(9鍵輸入文字)”的縮寫,這里的9鍵泛指移動電話、雙向?qū)ず魴C(jī)、信息家電、移動計算設(shè)備等小型電子產(chǎn)品上的標(biāo)準(zhǔn)按鍵。該技術(shù)采用了與語言數(shù)據(jù)庫相集成的專用軟件,利用標(biāo)準(zhǔn)的9按鍵,可以以直觀、簡捷的方法快速輸入簡短文字信息。
通常移動電話上的每個按鍵代表多個字母,例如“5”字鍵可以代表J、K或L三個字母。在輸入英文單詞時,包含了語言數(shù)據(jù)庫的T9算法能夠根據(jù)字母組合的可能性,自動篩選出輸入的不同字母,即時拼寫出正確的詞語。它還可以輸入標(biāo)點符號,并提供了包含大部分姓名的名字庫。
目前,T9可以支持漢語、英語、法語、德語、日語、韓語、意大利語等17種語言,其它主要語言的版本正在開發(fā)中。T9的文字輸入軟件的中文版可輸入繁體和簡體漢字。
對英語輸入而言,當(dāng)移動電話調(diào)到T9模式后,要鍵入“how”這個單詞只需按三次鍵4-6-9,而且在按鍵過程中不需要停頓。每個字母只需按一次鍵,就像使用計算機(jī)鍵盤一樣,T9就會顯示出所需的內(nèi)容。T9能夠知道與4-6-9這三個按鍵組合相應(yīng)的最常用的詞是“how”,那也就是T9在顯示屏上顯示出來的結(jié)果。
下面以T9輸入法為例對本發(fā)明的輸入法進(jìn)行詳細(xì)描述。應(yīng)該指出,本發(fā)明不限于T9輸入法,也可以應(yīng)用于其它輸入法。
首先說明漢字輸入的情況。圖1示出了標(biāo)準(zhǔn)的移動電話按鍵的布局示意圖。當(dāng)用戶利用T9輸入法按下標(biāo)有‘4ghi’、‘2abc’、‘6mno’鍵(每個鍵僅按下一次)時,移動電話屏幕顯示如圖2所示的內(nèi)容。在圖2所示的屏幕顯示中,移動電話的顯示屏幕被劃分為輸入信息顯示區(qū)和輸入選擇行。圖2中僅在輸入選擇區(qū)中示出了首選行。從圖2中可以看出,當(dāng)用戶輸入上述三個鍵時,位于這三個鍵上的字母可形成如下四種有效拼音組合hao,gao,gan,han。由于無法通過其他方式將它們再進(jìn)行有效篩選,所以T9輸入法只能在“輸入選擇區(qū)”中交替顯示符合這四種拼音組合的漢字。一般的移動電話顯示屏幕每行只能顯示八個左右的漢字,而漢字的同音字很多,符合條件的漢字只能分行顯示,所以用戶只能通過移動電話的導(dǎo)航鍵上下滾行和左右移動光標(biāo)來選擇所需要的漢字。
以上面的按鍵輸入為例,在T9輸入法中,除了圖2所示的輸入?yún)^(qū)中所示的首選八個漢字外,其余的候選漢字排列順序如圖3所示。如果用戶所要選擇字的恰好是“好”、“漢”、“敢”等在首選行的漢字,則其只要輸入相應(yīng)的拼音或通過光標(biāo)就可順利選擇。但如果用戶所要輸入的是如圖3中所示的位于第5選擇行的“尷”、“旱”,則用戶在輸入相應(yīng)拼音后,還需要連續(xù)向下按四次滾行鍵,再左右移動光標(biāo)3次左右才能完成一個漢字的選擇,這無疑大大影響了漢字的輸入速度。
針對上述問題,本發(fā)明提出了如下的方法。在用戶輸入‘4ghi’、‘2abc’、‘6mno’鍵時,移動電話的屏幕上顯示如圖2所示的狀況時,用戶通過語音讀入來進(jìn)行進(jìn)一步的選擇。例如,當(dāng)用戶要選擇“好”時,用戶可以讀入“hao”的讀音。在理想的情況下,移動電話就可將T9輸入法中列出的“gao”、“gan”、“han”等拼音選項排除,只顯示讀音為“hao”的漢字,這樣候選漢字的排列順序就會如圖4所示,在屏幕上顯示“好號毫豪浩耗嚎郝皓”。這樣不僅候選漢字大大減少,而且相應(yīng)目標(biāo)漢字的順序也大大提前。
例如,如果用戶要輸入目標(biāo)字“皓”字,如果單獨(dú)采用T9輸入法,如圖3所示,“皓”字位于第五選擇行。而在利用T9輸入法的基礎(chǔ)上通過語音讀入“hao”來進(jìn)行進(jìn)一步的選擇,如圖4所示,目標(biāo)字“皓”字位于首行,這樣用戶在同樣按‘4ghi’、‘2abc’、‘6mno’三鍵的情況下,通過同步的語音輸入,不用按滾行鍵就可輸入目標(biāo)漢字。因為按鍵輸入和語音輸入幾乎可同步進(jìn)行,與純粹的T9輸入法相比,本方法可以大大加快漢字的輸入速度。
即使語音識別技術(shù)在“hao”“gao”“gan”“han”范圍內(nèi),仍無法準(zhǔn)確分辨“hao”、“gao”這兩個易混音,但它已經(jīng)可以排除拼音是“gan”、“han”的漢字。與上述同樣的原理,目標(biāo)漢字的排列位置仍可大幅提前。在最差的情況下,假設(shè)語音識別結(jié)果對幾個候選拼音的打分沒有明顯差別,那它就可以直接采用T9輸入法所給出的候選漢字排列方式。與單獨(dú)采用語音識別技術(shù)來進(jìn)行漢字輸入相比,在同樣的語音識別技術(shù)水平下,本方法顯然能給出更為可靠和有效的結(jié)果。
綜上所述,采用本方法在嵌入式設(shè)備中輸入漢字,在同樣的按鍵速度下,本方法顯然能提供更高的目標(biāo)漢字命中率和更快的命中速度。
另外,本發(fā)明同樣可以應(yīng)用于英文單詞的輸入。T9輸入方法同樣在嵌入式設(shè)備的英語單詞輸入過程中得到大量采用。因為T9輸入法對漢字和英文的輸入選擇原理基本類似,而語音識別技術(shù)也可同樣應(yīng)用于漢字和英文,只要采取不同的聲學(xué)模型即可。所以本發(fā)明的方法所述的混合輸入過程也可同樣應(yīng)用于對英文單詞的選擇。在某些情況下(或者在大多數(shù)情況下),其語音識別結(jié)果比漢字更為理想。
例如,當(dāng)用戶輸入‘4ghi’、‘6mno’、‘6mno’、和‘3def’時四個按鍵時,由它們組成的有效英文單詞為“good”、“home”、“gone”、“hood”、“hoof”、“hone”、“goof”七個單詞,由于英文單詞的特殊性,T9輸入法只能通過按一次“滾行鍵”顯示一個單詞的方法來讓用戶作最終的選擇。這樣,在最壞的情況下,如果用戶所要輸入的單詞是“goof”那么他就要再按六次“滾行鍵”才能得到所要的結(jié)果。而如果在這種情況下介入語音識別技術(shù),因上述單詞相互間的發(fā)音差別較大,理想的情況下,二者綜合即可立即得到所需的單詞。本發(fā)明的方法應(yīng)用于英語單詞的輸入可能更為理想的原因主要在于按照目前鍵盤布局和T9輸入法得到的英文單詞間的讀音要比漢字間的讀音差別更大,該結(jié)論可從窮舉統(tǒng)計的方法得到。
根據(jù)T9輸入法的原理,鍵入的按鍵越多(即,漢字的拼音越復(fù)雜,英語單詞所含的字母越多),目標(biāo)命中率越高。例如,如果輸入‘6mno’、‘6mno’、‘6mno’、和‘4ghi’四個鍵,則有效的拼音組合只有“nong”這一種。當(dāng)然,這時就不需用戶通過語音輸入進(jìn)行進(jìn)一步的選擇了。另外,目前的T9輸入法都帶有后續(xù)字的聯(lián)想功能。在這種情況下,后續(xù)詞的輸入也不需采用用戶讀入的方式。這樣,用戶在輸入短信的時候,采用本方法就不需要像單用語音輸入方法那樣整句整句地讀入,在提高命中率和識別速率的情況下,也有效地保護(hù)了用戶的隱私。
下面參考圖5描述根據(jù)本發(fā)明的T9輸入法與語音輸入結(jié)合的字符輸入裝置的結(jié)構(gòu)方框圖。根據(jù)本實施例,本發(fā)明的輸入裝置包括按鍵輸入處理單元1,漢語拼音表2,漢字字庫存儲單元3,有效字組合存儲單元4,備選字存儲單元5,顯示單元6,語音輸入處理單元7,和語音匹配單元8。
另外,漢語拼音表2中還可以存儲英語字典,有效字組合存儲單元4中存儲根據(jù)按鍵輸入產(chǎn)生的有效字拼音,有效字可以是拼音或英語單詞。備選字存儲單元5可以存儲與按鍵的按動對應(yīng)的備選英語單詞或漢字。語音輸入處理單元7中具有語音識別單元。
下面參考圖5描述本發(fā)明的按鍵和語音識別技術(shù)的文字輸入裝置的操作。用戶通過移動電話或者嵌入式設(shè)備的鍵盤進(jìn)行按鍵輸入,按鍵輸入處理單元1接收用戶輸入,同時結(jié)合漢語拼音表(英語字典)2進(jìn)行有效拼音(單詞)的篩選,并將生成的候選字存儲在有效字組合存儲單元4中。
如果用戶通過按鍵輸入英語單詞,按鍵輸入處理單元1則對英語字典表2進(jìn)行有效的單詞篩選,以得到候選的英語單詞,將其存儲在備選字存儲單元5中,同時通過顯示單元6進(jìn)行顯示,供用戶進(jìn)行進(jìn)一步的選擇目標(biāo)字。
如果用戶進(jìn)行的是漢字輸入,則需要根據(jù)當(dāng)前得到的有效字組合存儲單元4和漢字字庫存儲單元3來篩選出備選漢字,并將備選漢字存儲在備選字存儲單元5中,進(jìn)而通過顯示單元6顯示,以供用戶進(jìn)行進(jìn)一步的選擇目標(biāo)字。
以上描述的操作基本上是T9漢語拼音/英語單詞輸入的處理過程(圖中虛線框內(nèi)的部分)。
根據(jù)本發(fā)明,在用戶進(jìn)行按鍵輸入的同時,可以通過移動電話及其它嵌入式設(shè)備的語音輸入設(shè)備(內(nèi)置或者外接的麥克風(fēng))來進(jìn)行相應(yīng)拼音或者單詞的語音輸入。由語音輸入處理單元7對用戶輸入的語音進(jìn)行處理和識別。語音匹配單元8對語音識別的結(jié)果和有效字組合存儲單元4中存儲的,先前得到的有效拼音(或單詞)進(jìn)行比較,保留相似度較高的那個(那些)有效組合,刪除相似度較低的那些(那個)有效組合。例如,比較閥值可以以50%為限,但本發(fā)明不限于此,也可以更高,或者可以由用戶進(jìn)行調(diào)節(jié)、設(shè)置。語音輸入處理單元7可以設(shè)置有各種語音識別模型,對用戶輸入的語音進(jìn)行語音識別,選出與用戶輸入的語音對應(yīng)的漢字或英文單詞。
利用語音匹配單元8得到的比較結(jié)果,對備選字存儲單元5種存儲的,先前得到的備選漢字或英語單詞再進(jìn)行進(jìn)一步的篩選,此后將二次篩選出的結(jié)果通過顯示單元6進(jìn)行顯示,以供用戶進(jìn)行進(jìn)一步的選擇。
如前所述,經(jīng)過了本發(fā)明所述的二次篩選之后,顯示設(shè)備6中所顯示的漢字或者英語單詞就會很容易直接命中用戶所需的目標(biāo)字(詞)。其中二次篩選剔除了大量的非目標(biāo)字(詞),從而大大提高用戶通過移動電話或者其它嵌入式設(shè)備輸入漢字或者英語單詞的速度,為用戶帶來很大的方便。
下面參考圖6描述執(zhí)行本發(fā)明實施例的T9輸入法和語音識別結(jié)合輸入流程。首先,在步驟S601,將移動電話或嵌入式設(shè)備切換到字符輸入模式,以便在此模式下輸入文字或字母。在步驟S602,按動按鍵,采用T9輸入法進(jìn)行漢字或者英文單詞的輸入,移動電話或嵌入式設(shè)備在顯示單元上顯示所有漢字或英文候選字。然后,在步驟S603判斷顯示的候選字的首行中是否有要輸入的目標(biāo)字。如果步驟S603的判斷結(jié)果為否定,即,首行中顯示了用戶要輸入的目標(biāo)字,流程則轉(zhuǎn)到步驟S608,確定目標(biāo)詞,再進(jìn)行新目標(biāo)詞的輸入。如果步驟S603的判斷結(jié)果為否定,即,首行字中沒有目標(biāo)字,流程則進(jìn)行到步驟S604,用戶利用語音讀入相應(yīng)的目標(biāo)字(詞)。此后,在步驟S605,語音輸入處理單元7和語音匹配單元8采用相應(yīng)語言模型,將用戶利用語音讀入的音節(jié)與利用T9輸入法所提供的幾種有效候選組合進(jìn)行匹配比較,將相似度低于預(yù)定閥值的組合排除,同時在T9輸入法所提供的候選字詞中選出與讀音對應(yīng)的漢字或者單詞,提供經(jīng)過過濾后的字詞排列顯示給用戶。此后,在步驟S606,如果T9輸入法所提供的幾種有效組合與用戶語音識別結(jié)果的相似度都比較低,則直接選用T9輸入法所提供的候選字詞排列順序。然后,在步驟S607,用戶在經(jīng)篩選出后的候選字詞中選擇目標(biāo)字詞。通常,目標(biāo)字詞會出現(xiàn)在首行或者首詞位置。需要的時候,再按“滾行鍵”來選擇一些不常用的字詞。最后,在步驟S608,確定目標(biāo)詞,再進(jìn)行新目標(biāo)詞的輸入。
本發(fā)明中所述的嵌入式設(shè)備包括諸如移動電話,雙向?qū)ず魴C(jī)、信息家電、移動計算設(shè)備,PDA之類的小型電子產(chǎn)品。
至此已結(jié)合優(yōu)選實施例對本發(fā)明進(jìn)行了詳細(xì)描述。應(yīng)該指出,本發(fā)明的按鍵輸入法不限于T9輸入法,也可應(yīng)用其它按鍵輸入法。
根據(jù)本發(fā)明的輸入法可以通過硬件實現(xiàn)。也可以由設(shè)置在設(shè)備中的處理器通過執(zhí)行具有相應(yīng)功能的程序來實現(xiàn)。所述程序可記錄在諸如軟盤,硬盤,閃盤,CD-ROM,DVD-ROM之類的計算機(jī)可讀的記錄介質(zhì)上。
雖然參考優(yōu)選實施例對本發(fā)明進(jìn)行了描述,本發(fā)明并不局限于此,而僅由所附權(quán)利要求限定,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明精神的情況下可對本發(fā)明的實施例進(jìn)行各種改變和改進(jìn)。
權(quán)利要求
1.一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入生成包括目標(biāo)字的候選字;利用語音讀入目標(biāo)字的讀音;將生成的所述候選字的至少一個讀音與語音讀入的所述目標(biāo)字的讀音進(jìn)行匹配,以篩選出所生成的所述目標(biāo)字;和顯示經(jīng)篩選出的目標(biāo)字。
2.根據(jù)權(quán)利要求1所述的方法,其中所述按鍵輸入采用9鍵輸入文字法(T9輸入法)。
3.一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入目標(biāo)字的漢字拼音和/或英文字母,以生成包括目標(biāo)字的候選字;讀入目標(biāo)字的語音;將生成的所述候選字的至少一個讀音與讀入的所述目標(biāo)字的語音進(jìn)行匹配,以篩選出所生成的所述目標(biāo)字;和顯示經(jīng)篩選出的目標(biāo)字。
4.根據(jù)權(quán)利要求3所述的方法,其中所述按鍵輸入采用9鍵輸入文字法(T9輸入法)。
5.根據(jù)權(quán)利要求3或4所述的方法,其中進(jìn)一步包括當(dāng)所述按鍵輸入生成的候選字的首行中顯示了目標(biāo)字時,通過導(dǎo)航鍵選定所述目標(biāo)字的步驟。
6.根據(jù)權(quán)利要求3或4所述的方法,其中所述將生成的所述候選字的讀音與讀入的所述目標(biāo)字的語音進(jìn)行匹配的步驟進(jìn)一步包括刪除所述候選字的讀音中和所述目標(biāo)字的語音之間的匹配度小于預(yù)定閾值的讀音的步驟。
7.根據(jù)權(quán)利要求3或4所述的方法,其中進(jìn)一步包括如果按鍵輸入所提供的候選字的讀音與語音識別結(jié)果的相似度都低于預(yù)定閾值,則直接依據(jù)按鍵輸入所提供的候選字進(jìn)行下一步的選擇。
8.根據(jù)權(quán)利要求3所述的方法,其中進(jìn)一步包括如果按鍵輸入生成的首行候選字中包括了目標(biāo)字,則直接確定目標(biāo)字的步驟。
9.根據(jù)權(quán)利要求3所述的方法,其中進(jìn)一步包括根據(jù)按鍵輸入的漢字拼音選出備選漢字,并存儲備選漢字的步驟。
10.一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入法給語音識別求解集進(jìn)行限制;利用語音識別進(jìn)行準(zhǔn)確和進(jìn)一步的目標(biāo)字命中。
11.根據(jù)權(quán)利要求10所述的方法,其中所述按鍵輸入采用9鍵輸入文字法(T9輸入法)。
12.一種按鍵輸入與語音識別相結(jié)合的文字輸入裝置,包括按鍵輸入處理裝置,用于處理通過按鍵輸入的漢字拼音和/或英文字母;有效字符組合存儲裝置,用于存儲根據(jù)按鍵輸入產(chǎn)生的有效字符;語音輸入處理單元,用于處理讀入的目標(biāo)字的語音;語音匹配裝置,用于將有效字符組合存儲裝置存儲的有效字符的讀音與語音輸入處理單元輸出的對應(yīng)目標(biāo)字讀音進(jìn)行匹配以篩選出候選字;和備選字存儲單元裝置,用于存儲與按鍵輸入對應(yīng)的備選漢字和/或英語單詞,和由語音匹配裝置篩選出的候選字。
13.根據(jù)權(quán)利要求12所述的裝置,其中進(jìn)一步包括漢語拼音表和/或字典,用于存儲漢字拼音和/或英語字典。
14.根據(jù)權(quán)利要求12所述的裝置,其中進(jìn)一步包括漢字字庫存儲裝置,用于存儲漢字。
15.根據(jù)權(quán)利要求12所述的裝置,其中進(jìn)一步包括用于顯示生成的候選字和目標(biāo)字的顯示裝置。
16.根據(jù)權(quán)利要求12所述的裝置,其中語音輸入處理單元具有語音識別單元。
17.根據(jù)權(quán)利要求14所述的裝置,其中有效字符組合存儲單元和漢字字庫存儲單元根據(jù)按鍵輸入的漢字拼音選出備選漢字,并將備選漢字存儲在備選字存儲單元中。
18.根據(jù)權(quán)利要求12所述的輸入裝置,其中所述按鍵輸入處理裝置處理使用T9輸入法。
19.一種裝配有按鍵輸入與語音識別相結(jié)合的文字輸入裝置的移動電話,所述文字輸入裝置包括按鍵輸入處理裝置,用于處理通過按鍵輸入的漢字拼音和/或英文字母;有效字符組合存儲裝置,用于存儲根據(jù)按鍵輸入產(chǎn)生的有效字符;語音輸入處理單元,用于處理讀入的目標(biāo)字的語音;語音匹配裝置,用于將有效字符組合存儲裝置存儲的有效字符讀音與語音輸入處理單元輸出的對應(yīng)目標(biāo)字讀音進(jìn)行匹配以篩選出候選字;和備選字存儲單元裝置,用于存儲與按鍵輸入對應(yīng)的備選漢字和/或英語單詞,和由語音匹配裝置篩選出的候選字。
20.根據(jù)權(quán)利要求20所述的移動電話,其中所述按鍵輸入處理裝置處理使用T9輸入法。
全文摘要
本發(fā)明揭示了一種按鍵輸入與語音識別相結(jié)合的文字輸入方法,包括步驟利用按鍵輸入目標(biāo)字的漢字拼音和/或英文字母,以生成包括目標(biāo)字的候選字;讀入目標(biāo)字的語音;將生成的所述候選字的至少一個讀音與讀入的所述目標(biāo)字的語音進(jìn)行匹配,以篩選出所生成的所述目標(biāo)字;和顯示經(jīng)篩選出的目標(biāo)字。本發(fā)明還揭示了一種按鍵輸入與語音識別相結(jié)合的文字輸入裝置,以及使用該輸入裝置的移動電話。
文檔編號G06F3/16GK1755589SQ200410083189
公開日2006年4月5日 申請日期2004年9月29日 優(yōu)先權(quán)日2004年9月29日
發(fā)明者王愛俊 申請人:松下電器產(chǎn)業(yè)株式會社