一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法

文檔序號：6463423閱讀：146來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法
技術(shù)領(lǐng)域：
本發(fā)明公開的是一種用于手機(jī)的語音輸入的方法，具體地說涉及一種基于詞匯輸入的，并且是限定輸入詞匯范圍的一種方法。
背景技術(shù)：
手機(jī)已經(jīng)越來越成為人們生活中必備的產(chǎn)品了。它使得人們的溝通更加順暢。對于手機(jī)的輸入方法，目前最常見的兩種是鍵盤輸入法和手寫輸入法。這兩種輸入法己經(jīng)能夠滿足大部分人群的輸入需求。但是，也分別有一定的局限性。例如，鍵盤輸入法主要包括的拼音輸入法，對于不熟悉拼音的人，或者發(fā)音不標(biāo)準(zhǔn)的人來說，會有很大的困難。筆畫法也存在一些筆畫拆分的困難及人腦與發(fā)音不協(xié)調(diào)的障礙，所以沒有得到廣泛應(yīng)用。而且對于一些沒有鍵盤或只有幾個簡單按鍵的手機(jī)來說，就無法使用鍵盤輸入法了。手寫輸入的優(yōu)點是只要會寫字，就可以輸入，但必須會寫字，由于文化水平的差異，還存在很多字大家不會寫。另外，對于沒有觸摸屏的手機(jī)，手寫的方法就沒用了。看到了上面兩種方法，人們往往會提出是否可以做到用戶只要對著手機(jī) 說出自己要輸入的語言，手機(jī)通過識別算法，將其轉(zhuǎn)化成文本。這樣只要手機(jī)有麥克，就沒有其它限制了。而且做得好的話，還會對方言進(jìn)行類似的識別。不過，這個想法，我們需要先看看可行性有多大？同一個想法，最簡單的比較就是目前發(fā)展更快的計算機(jī)，因為計算機(jī)的運行速度遠(yuǎn)遠(yuǎn)高于手機(jī)，主要原因手機(jī)是手持設(shè)備，需要在功耗及攜帶方便性上做文章。所以在計算機(jī)上無法完成的事情，很難在手機(jī)這種處理能力相對低下的平臺上實現(xiàn)。記得2008年初，微軟曾經(jīng)提到了計算機(jī)發(fā)展的下一代，將能夠進(jìn)行語音輸入。但那是下一代，需要算法和芯片處理能力同歩大幅提高才行。所以言外之意就是目前技術(shù)，無法實現(xiàn)真正的語音輸入。所以手機(jī)上也是不能的。中文語音輸入的研究工作早已展開，并且有了很大的進(jìn)展，盡管離識別人的自然說話還有很大差距。但目前的技術(shù)可以對限定的條目的語音片段進(jìn) 行特征提取并在有限的條目集合中去比對選擇概率最高的結(jié)果?，F(xiàn)在的技術(shù) 能夠?qū)⒂邢薜臈l目集合做得越來越大，當(dāng)然是在保證相應(yīng)速度的前提下。另外，通過對人常輸入的詞匯來進(jìn)行研究，當(dāng)然有更專業(yè)的研究機(jī)構(gòu)，大概的情況是目前人們常用的詞匯有三千個左右，這三千個詞能夠覆蓋一般語料的86%，五千個常用詞可以覆蓋91%，八千個則可以覆蓋95%。這是十分振奮人心的統(tǒng)計。我們可以通過這個，來降低語音識別的難度，又不太大地降低識別的質(zhì)量?；谏鲜隹紤]，想到了語音識別技術(shù)中，非特定人的限定范圍的輸入方法。這是一個理念，就像人們要實現(xiàn)語音識別一樣，早就有人想過，但如何實現(xiàn)，基本上沒人去做。本發(fā)明正是從這個公開的理論思路出發(fā)，選擇了適當(dāng)?shù)暮喕?，來達(dá)到在手機(jī)這樣處理能力不強(qiáng)的設(shè)備上，完成人們大部分常用詞語的輸入。這項技術(shù)，在國外，尤其是大公司，可能過多地考慮識別率的問題，所以沒有真正研究并實用到手機(jī)上。這也是本發(fā)明的主要局限性，即會有一定的識別率問題。目前能夠達(dá)到的水平在90%左右，基本能夠滿足大部分人的需要，尤其是無法使用鍵盤和手寫輸入時。另外，不能輸入所有的詞，也是本方法的局限。但結(jié)合著手機(jī)其它輸入方法，這種語音輸入方法能夠起到非常好的作用。而且速度上要比鍵盤和手寫要快，當(dāng)然不一定能和鍵盤發(fā)燒友相比了。發(fā)明內(nèi)容為解決這個問題，本發(fā)明提出了一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法，從而引入了一種非常方便有效的輸入法。在手機(jī)中需要進(jìn)行文本輸入的地方，用戶按某一專用鍵啟動語音識別系統(tǒng)，手機(jī)提示用戶讀出要輸入的文本，用戶語音輸入完成后，系統(tǒng)對輸入的語音提取特征，然后與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對，找到最相近的一個條目，并將其相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方，反饋給用戶。如果相差甚遠(yuǎn)，可以反饋查找失敗。
以上過程中，要進(jìn)行文本輸入的地方，是指手機(jī)中包括短信，彩信，Email，記事本，日程表等功能的進(jìn)行文本輸入的地方。
以上所述的語音識別系統(tǒng)的啟動，是用戶在文本輸入的地方，按了一個專用鍵之后進(jìn)行的。專用鍵可以是手機(jī)上的任何一個按鍵，包括但不限于方向鍵，確認(rèn)鍵，側(cè)面的按鍵，數(shù)字鍵，功能鍵，左右軟鍵等。
以上所述的提示用戶讀出要輸入的文本，其提示的方式可以是用語音提示或者用顯示文本進(jìn)行提示。
以上所述的系統(tǒng)對輸入的語音提取特征，這是一個相對寬泛的概念，即目前在語音識別及人工智能等領(lǐng)域可能使用的特征提取的方法，來將用戶的語音抽象成特征。
以上所述的手機(jī)中已有的特定詞，是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在手機(jī)中的特定詞以及用戶在購得手機(jī)后輸入的有別于廠家預(yù)置的詞。而且所
述的特定詞，是有個數(shù)限制的，個數(shù)的限制主要考慮了下面兩個方面首先，
基于目前手機(jī)處理芯片的處理速度及識別算法的優(yōu)化程度；其次，基于語言學(xué)中對常用詞匯的統(tǒng)計。本發(fā)明要求的個數(shù)的上限限制在2000到6000范圍內(nèi)。即特定詞的個數(shù)上限為2000到6000。本方法中的特定詞的個數(shù)沒有下限。而且個數(shù)越少，識別率越高。另外，所述的特定詞，是有文字個數(shù)限制的，本發(fā)明要求對于每一個特定詞，其中文文字的個數(shù)為最大不超過4。
以上所述的找到最相近的一個條目，是指語音特征值最相近的一個，但如果最相近的特征值的差異超出一定范圍，也可以返回查找失敗，提示用戶找不到。當(dāng)然了，如果相近的幾個都差異不大的話，還可以提供用戶更多的候選項供選擇。
以上所述的反饋在手機(jī)進(jìn)行文本輸入的地方，是指既可以用顯示屏來顯示結(jié)果，也可以通過語音朗讀的方式，將識別的詞匯文本朗讀出來。

圖1是本發(fā)明的整體流程示意圖；具體實施方式
下面結(jié)合實例與附圖進(jìn)一步說明本發(fā)明的實施方式。本發(fā)明的整體流程示意圖，如附圖1所示。具體實施歩驟如下歩驟一，用戶進(jìn)入手機(jī)中需要進(jìn)行文本輸入的地方，例如短信，彩信，Email,記事本，日程表等功能的進(jìn)行文本輸入的地方。歩驟二，用戶按某一專用鍵啟動語音識別系統(tǒng)，專用鍵可以是手機(jī)上的任何一個按鍵，包括但不限于方向鍵，確認(rèn)鍵，側(cè)面的按鍵，數(shù)字鍵，功能鍵，左右軟鍵等。步驟三，手機(jī)提示用戶讀出要輸入的文本。提示的方式可以是用語音提示或者用顯示文本進(jìn)行提示。歩驟四，用戶語音輸入完成后，系統(tǒng)對輸入的語音提取特征，這是一個相對寬泛的概念，即目前在語音識別及人工智能等領(lǐng)域可能使用的特征提取的方法，來將用戶的語音抽象成特征。步驟五，與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對。手機(jī)中已有的特定詞，是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在手機(jī)中的特定詞以及用戶在購得手機(jī)后輸入的有別于廠家預(yù)置的詞。而且所述的特定詞，是有個數(shù)限制的，個數(shù)的限制主要考慮了下面兩個方面首先，基于目前手機(jī)處理芯片的處理速度及識別算法的優(yōu)化程度；其次，基于語言學(xué)中對常用詞匯的統(tǒng)計。本發(fā) 明要求的個數(shù)的上限限制在2000到6000范圍內(nèi)。即特定詞的個數(shù)上限為 2000到6000。本方法中的特定詞的個數(shù)沒有下限。而且個數(shù)越少，識別率越高。另外，所述的特定詞，是有文字個數(shù)限制的，本發(fā)明要求對于每一個特定詞，其中文文字的個數(shù)為最大不超過4。歩驟六，找到最相近的一個條目，即語音特征值最相近的一個，并將其相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方，反饋給用戶。但如果最相近的特征值的差異超出一定范圍，也可以返回查找失敗，提示用戶找不到。反饋可以用顯示屏來顯示結(jié)果，也可以通過語音朗讀的方式，將識別的詞匯文本朗讀出來。當(dāng)然了，如果相近的幾個都差異不大的話，還可以提供用戶更多的候選項供選擇。
權(quán)利要求
1. 一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法，其特征在于在手機(jī)中需要進(jìn)行文本輸入的地方，用戶按某一專用鍵啟動語音識別系統(tǒng)，手機(jī)提示用戶讀出要輸入的文本，用戶語音輸入完成后，系統(tǒng)對輸入的語音提取特征，然后與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對，找到最相近的一個條目，并將其相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方，反饋給用戶。如果相差甚遠(yuǎn)，可以反饋查找失敗。
2、根據(jù)權(quán)利要求1所述的方法，其特征在于所述的需要進(jìn)行文本輸入的地方，是指手機(jī)中包括短信，彩信，Email, 記事本，日程表等功能的進(jìn)行文本輸入的地方。
3、根據(jù)權(quán)利要求1所述的方法，其特征在于所述的語音識別系統(tǒng)的啟動，是用戶在文本輸入的地方，按了一個專用鍵之后進(jìn)行的。專用鍵可以是手機(jī)上的任何一個按鍵，包括但不限于方向鍵，確認(rèn)鍵，側(cè)面的按鍵，數(shù)字鍵，功能鍵，左右軟鍵等。
4、根據(jù)權(quán)利要求1所述的方法，其特征在于所述的提示用戶讀出要輸入的文本，其提示的方式可以是用語音提示或者用顯示文本進(jìn)行提示。
5、根據(jù)權(quán)利要求1所述的方法，其特征在于所述的系統(tǒng)對輸入的語音提取特征，這是一個相對寬泛的概念，即目前在語音識別及人工智能等領(lǐng)域可能使用的特征提取的方法，來將用戶的語音抽象成特征。
6、根據(jù)權(quán)利要求l所述的方法，其特征在于所述的手機(jī)中已有的特定詞，是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在手機(jī)中的特定詞以及用戶在購得手機(jī)后輸入的有別于廠家預(yù)置的詞。
7、根據(jù)權(quán)利要求1和6所述的特定詞，其特征在于所述的特定詞，是有個數(shù)限制的，本發(fā)明要求的個數(shù)限制在2000到 6000范圍內(nèi)。即特定詞的個數(shù)上限為2000到6000。本方法中的特定詞的個數(shù)沒有下限。而且個數(shù)越少，識別率越高。
8、根據(jù)權(quán)利要求1和6所述的特定詞，其特征在于所述的特定詞，是有文字個數(shù)限制的。本發(fā)明要求對于每一個特定詞，其中文文字的個數(shù)為最大不超過4。
9、根據(jù)權(quán)利要求l所述的方法，其特征在于所述的找到最相近的一個條目，是指語音特征值最相近的一個，但如果最相近的特征值的差異超出一定范圍，也可以返回查找失敗，提示用戶找不到。當(dāng)然了，如果相近的幾個都差異不大的話，還可以提供用戶更多的候選項供選擇。
10、根據(jù)權(quán)利要求1所述的方法，其特征在于所述的反饋在手機(jī)進(jìn)行文本輸入的地方，是指既可以用顯示屏來顯示結(jié)果，也可以通過語音朗讀的方式，將識別的詞匯文本朗讀出來。
全文摘要
本發(fā)明提供一種用于手機(jī)的語音輸入方法。獨到之處在于，第一，語音輸入是基于詞匯的，而非基于句子。第二，精心選擇有限的常用詞匯集合來預(yù)置在手機(jī)中，作為輸入的限制，只有語音輸入這些預(yù)先選擇的詞匯，手機(jī)識別系統(tǒng)才會正確辨識用戶的語音而轉(zhuǎn)化成相應(yīng)的文本。第三，這個精選的詞匯集合是手機(jī)出廠前就已經(jīng)預(yù)置好的了，不需要用戶自己創(chuàng)建，但用戶可以將自己額外常用的詞匯添加進(jìn)去。這樣的發(fā)明，方便了用戶信息的輸入，并且提高了整個輸入的速度。
文檔編號G06F3/023GK101282379SQ20081010570
公開日2008年10月8日申請日期2008年4月30日優(yōu)先權(quán)日2008年4月30日
發(fā)明者劍王申請人:飛圖科技(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王劍
技術(shù)所有人：飛圖科技（北京）有限公司
我是此專利的發(fā)明人

上一篇：數(shù)字媒體文件的加解密方法及裝置的制作方法
上一篇：一種確保操作環(huán)境安全的系統(tǒng)和方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

不用于進(jìn)行時的動詞相關(guān)技術(shù)

不能用于進(jìn)行時的動詞相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法