亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法

文檔序號:6463423閱讀:146來源:國知局
專利名稱:一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法
技術(shù)領(lǐng)域
本發(fā)明公開的是一種用于手機(jī)的語音輸入的方法,具體地說涉及一種基 于詞匯輸入的,并且是限定輸入詞匯范圍的一種方法。
背景技術(shù)
手機(jī)已經(jīng)越來越成為人們生活中必備的產(chǎn)品了。它使得人們的溝通更加 順暢。對于手機(jī)的輸入方法,目前最常見的兩種是鍵盤輸入法和手寫輸入法。 這兩種輸入法己經(jīng)能夠滿足大部分人群的輸入需求。但是,也分別有一定的 局限性。例如,鍵盤輸入法主要包括的拼音輸入法,對于不熟悉拼音的人, 或者發(fā)音不標(biāo)準(zhǔn)的人來說,會有很大的困難。筆畫法也存在一些筆畫拆分的 困難及人腦與發(fā)音不協(xié)調(diào)的障礙,所以沒有得到廣泛應(yīng)用。而且對于一些沒 有鍵盤或只有幾個簡單按鍵的手機(jī)來說,就無法使用鍵盤輸入法了。手寫輸 入的優(yōu)點是只要會寫字,就可以輸入,但必須會寫字,由于文化水平的差異, 還存在很多字大家不會寫。另外,對于沒有觸摸屏的手機(jī),手寫的方法就沒 用了。看到了上面兩種方法,人們往往會提出是否可以做到用戶只要對著手機(jī) 說出自己要輸入的語言,手機(jī)通過識別算法,將其轉(zhuǎn)化成文本。這樣只要手 機(jī)有麥克,就沒有其它限制了。而且做得好的話,還會對方言進(jìn)行類似的識 別。不過,這個想法,我們需要先看看可行性有多大?同一個想法,最簡單的比較就是目前發(fā)展更快的計算機(jī),因為計算機(jī)的 運行速度遠(yuǎn)遠(yuǎn)高于手機(jī),主要原因手機(jī)是手持設(shè)備,需要在功耗及攜帶方便 性上做文章。所以在計算機(jī)上無法完成的事情,很難在手機(jī)這種處理能力相對低下的平臺上實現(xiàn)。記得2008年初,微軟曾經(jīng)提到了計算機(jī)發(fā)展的下一代, 將能夠進(jìn)行語音輸入。但那是下一代,需要算法和芯片處理能力同歩大幅提 高才行。所以言外之意就是目前技術(shù),無法實現(xiàn)真正的語音輸入。所以手機(jī)上也是不能的。中文語音輸入的研究工作早已展開,并且有了很大的進(jìn)展,盡管離識別 人的自然說話還有很大差距。但目前的技術(shù)可以對限定的條目的語音片段進(jìn) 行特征提取并在有限的條目集合中去比對選擇概率最高的結(jié)果?,F(xiàn)在的技術(shù) 能夠?qū)⒂邢薜臈l目集合做得越來越大,當(dāng)然是在保證相應(yīng)速度的前提下。另外,通過對人常輸入的詞匯來進(jìn)行研究,當(dāng)然有更專業(yè)的研究機(jī)構(gòu), 大概的情況是目前人們常用的詞匯有三千個左右,這三千個詞能夠覆蓋一般語料的86%,五千個常用詞可以覆蓋91%,八千個則可以覆蓋95%。這是十分 振奮人心的統(tǒng)計。我們可以通過這個,來降低語音識別的難度,又不太大地 降低識別的質(zhì)量?;谏鲜隹紤],想到了語音識別技術(shù)中,非特定人的限定范圍的輸入方 法。這是一個理念,就像人們要實現(xiàn)語音識別一樣,早就有人想過,但如何 實現(xiàn),基本上沒人去做。本發(fā)明正是從這個公開的理論思路出發(fā),選擇了適 當(dāng)?shù)暮喕?,來達(dá)到在手機(jī)這樣處理能力不強(qiáng)的設(shè)備上,完成人們大部分常用 詞語的輸入。這項技術(shù),在國外,尤其是大公司,可能過多地考慮識別率的 問題,所以沒有真正研究并實用到手機(jī)上。這也是本發(fā)明的主要局限性,即 會有一定的識別率問題。目前能夠達(dá)到的水平在90%左右,基本能夠滿足大 部分人的需要,尤其是無法使用鍵盤和手寫輸入時。另外,不能輸入所有的 詞,也是本方法的局限。但結(jié)合著手機(jī)其它輸入方法,這種語音輸入方法能 夠起到非常好的作用。而且速度上要比鍵盤和手寫要快,當(dāng)然不一定能和鍵 盤發(fā)燒友相比了。發(fā)明內(nèi)容為解決這個問題,本發(fā)明提出了一種用于手機(jī)的可以對特定詞進(jìn)行語音 輸入的方法,從而引入了 一種非常方便有效的輸入法。在手機(jī)中需要進(jìn)行文本輸入的地方,用戶按某一專用鍵啟動語音識別系 統(tǒng),手機(jī)提示用戶讀出要輸入的文本,用戶語音輸入完成后,系統(tǒng)對輸入的 語音提取特征,然后與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對,找到最相 近的一個條目,并將其相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方,反饋給用戶。如果相差甚遠(yuǎn),可以反饋查找失敗。
以上過程中,要進(jìn)行文本輸入的地方,是指手機(jī)中包括短信,彩信,Email, 記事本,日程表等功能的進(jìn)行文本輸入的地方。
以上所述的語音識別系統(tǒng)的啟動,是用戶在文本輸入的地方,按了一個 專用鍵之后進(jìn)行的。專用鍵可以是手機(jī)上的任何一個按鍵,包括但不限于方 向鍵,確認(rèn)鍵,側(cè)面的按鍵,數(shù)字鍵,功能鍵,左右軟鍵等。
以上所述的提示用戶讀出要輸入的文本,其提示的方式可以是用語音提 示或者用顯示文本進(jìn)行提示。
以上所述的系統(tǒng)對輸入的語音提取特征,這是一個相對寬泛的概念,即 目前在語音識別及人工智能等領(lǐng)域可能使用的特征提取的方法,來將用戶的 語音抽象成特征。
以上所述的手機(jī)中已有的特定詞,是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在 手機(jī)中的特定詞以及用戶在購得手機(jī)后輸入的有別于廠家預(yù)置的詞。而且所
述的特定詞,是有個數(shù)限制的,個數(shù)的限制主要考慮了下面兩個方面首先,
基于目前手機(jī)處理芯片的處理速度及識別算法的優(yōu)化程度;其次,基于語言 學(xué)中對常用詞匯的統(tǒng)計。本發(fā)明要求的個數(shù)的上限限制在2000到6000范圍 內(nèi)。即特定詞的個數(shù)上限為2000到6000。本方法中的特定詞的個數(shù)沒有下 限。而且個數(shù)越少,識別率越高。另外,所述的特定詞,是有文字個數(shù)限制 的,本發(fā)明要求對于每一個特定詞,其中文文字的個數(shù)為最大不超過4。
以上所述的找到最相近的一個條目,是指語音特征值最相近的一個,但 如果最相近的特征值的差異超出一定范圍,也可以返回查找失敗,提示用戶 找不到。當(dāng)然了,如果相近的幾個都差異不大的話,還可以提供用戶更多的 候選項供選擇。
以上所述的反饋在手機(jī)進(jìn)行文本輸入的地方,是指既可以用顯示屏來顯 示結(jié)果,也可以通過語音朗讀的方式,將識別的詞匯文本朗讀出來。


圖1是本發(fā)明的整體流程示意圖;具體實施方式
下面結(jié)合實例與附圖進(jìn)一步說明本發(fā)明的實施方式。 本發(fā)明的整體流程示意圖,如附圖1所示。具體實施歩驟如下 歩驟一,用戶進(jìn)入手機(jī)中需要進(jìn)行文本輸入的地方,例如短信,彩信,Email,記事本,日程表等功能的進(jìn)行文本輸入的地方。歩驟二,用戶按某一專用鍵啟動語音識別系統(tǒng),專用鍵可以是手機(jī)上的任何一個按鍵,包括但不限于方向鍵,確認(rèn)鍵,側(cè)面的按鍵,數(shù)字鍵,功能鍵,左右軟鍵等。步驟三,手機(jī)提示用戶讀出要輸入的文本。提示的方式可以是用語音提 示或者用顯示文本進(jìn)行提示。歩驟四,用戶語音輸入完成后,系統(tǒng)對輸入的語音提取特征,這是一個 相對寬泛的概念,即目前在語音識別及人工智能等領(lǐng)域可能使用的特征提取 的方法,來將用戶的語音抽象成特征。步驟五,與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對。手機(jī)中已有的特 定詞,是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在手機(jī)中的特定詞以及用戶在購得 手機(jī)后輸入的有別于廠家預(yù)置的詞。而且所述的特定詞,是有個數(shù)限制的, 個數(shù)的限制主要考慮了下面兩個方面首先,基于目前手機(jī)處理芯片的處理 速度及識別算法的優(yōu)化程度;其次,基于語言學(xué)中對常用詞匯的統(tǒng)計。本發(fā) 明要求的個數(shù)的上限限制在2000到6000范圍內(nèi)。即特定詞的個數(shù)上限為 2000到6000。本方法中的特定詞的個數(shù)沒有下限。而且個數(shù)越少,識別率越 高。另外,所述的特定詞,是有文字個數(shù)限制的,本發(fā)明要求對于每一個特 定詞,其中文文字的個數(shù)為最大不超過4。歩驟六,找到最相近的一個條目,即語音特征值最相近的一個,并將其 相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方,反饋給用戶。但如果最 相近的特征值的差異超出一定范圍,也可以返回查找失敗,提示用戶找不到。 反饋可以用顯示屏來顯示結(jié)果,也可以通過語音朗讀的方式,將識別的詞匯 文本朗讀出來。當(dāng)然了,如果相近的幾個都差異不大的話,還可以提供用戶 更多的候選項供選擇。
權(quán)利要求
1. 一種用于手機(jī)的可以對特定詞進(jìn)行語音輸入的方法,其特征在于在手機(jī)中需要進(jìn)行文本輸入的地方,用戶按某一專用鍵啟動語音識別系統(tǒng),手機(jī)提示用戶讀出要輸入的文本,用戶語音輸入完成后,系統(tǒng)對輸入的語音提取特征,然后與手機(jī)中已有的特定詞的特征逐一進(jìn)行比對,找到最相近的一個條目,并將其相對應(yīng)的詞匯文本反饋在手機(jī)進(jìn)行文本輸入的地方,反饋給用戶。如果相差甚遠(yuǎn),可以反饋查找失敗。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于 所述的需要進(jìn)行文本輸入的地方,是指手機(jī)中包括短信,彩信,Email, 記事本,日程表等功能的進(jìn)行文本輸入的地方。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于 所述的語音識別系統(tǒng)的啟動,是用戶在文本輸入的地方,按了一個專 用鍵之后進(jìn)行的。專用鍵可以是手機(jī)上的任何一個按鍵,包括但不限 于方向鍵,確認(rèn)鍵,側(cè)面的按鍵,數(shù)字鍵,功能鍵,左右軟鍵等。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于 所述的提示用戶讀出要輸入的文本,其提示的方式可以是用語音提示 或者用顯示文本進(jìn)行提示。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于 所述的系統(tǒng)對輸入的語音提取特征,這是一個相對寬泛的概念,即目 前在語音識別及人工智能等領(lǐng)域可能使用的特征提取的方法,來將用 戶的語音抽象成特征。
6、 根據(jù)權(quán)利要求l所述的方法,其特征在于所述的手機(jī)中已有的特定詞,是指手機(jī)廠家在手機(jī)出廠前就預(yù)置在手 機(jī)中的特定詞以及用戶在購得手機(jī)后輸入的有別于廠家預(yù)置的詞。
7、 根據(jù)權(quán)利要求1和6所述的特定詞,其特征在于 所述的特定詞,是有個數(shù)限制的,本發(fā)明要求的個數(shù)限制在2000到 6000范圍內(nèi)。即特定詞的個數(shù)上限為2000到6000。本方法中的特定 詞的個數(shù)沒有下限。而且個數(shù)越少,識別率越高。
8、 根據(jù)權(quán)利要求1和6所述的特定詞,其特征在于所述的特定詞,是有文字個數(shù)限制的。本發(fā)明要求對于每一個特定詞,其中文文字的個數(shù)為最大不超過4。
9、 根據(jù)權(quán)利要求l所述的方法,其特征在于 所述的找到最相近的一個條目,是指語音特征值最相近的一個,但如 果最相近的特征值的差異超出一定范圍,也可以返回查找失敗,提示 用戶找不到。當(dāng)然了,如果相近的幾個都差異不大的話,還可以提供 用戶更多的候選項供選擇。
10、 根據(jù)權(quán)利要求1所述的方法,其特征在于 所述的反饋在手機(jī)進(jìn)行文本輸入的地方,是指既可以用顯示屏來顯示 結(jié)果,也可以通過語音朗讀的方式,將識別的詞匯文本朗讀出來。
全文摘要
本發(fā)明提供一種用于手機(jī)的語音輸入方法。獨到之處在于,第一,語音輸入是基于詞匯的,而非基于句子。第二,精心選擇有限的常用詞匯集合來預(yù)置在手機(jī)中,作為輸入的限制,只有語音輸入這些預(yù)先選擇的詞匯,手機(jī)識別系統(tǒng)才會正確辨識用戶的語音而轉(zhuǎn)化成相應(yīng)的文本。第三,這個精選的詞匯集合是手機(jī)出廠前就已經(jīng)預(yù)置好的了,不需要用戶自己創(chuàng)建,但用戶可以將自己額外常用的詞匯添加進(jìn)去。這樣的發(fā)明,方便了用戶信息的輸入,并且提高了整個輸入的速度。
文檔編號G06F3/023GK101282379SQ20081010570
公開日2008年10月8日 申請日期2008年4月30日 優(yōu)先權(quán)日2008年4月30日
發(fā)明者劍 王 申請人:飛圖科技(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1