專利名稱:語音辨識功能啟動系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音辨識功能啟動系統(tǒng)及方法,特別是涉及一種可以依據(jù)聲音的
變異度決定是否啟動語音辨識功能的系統(tǒng)及方法。
背景技術(shù):
近年來,電子裝置,如計算機與便攜式裝置變得越來越高階且變得更多功能化。由
于這些裝置與應(yīng)用的便利,也使得這些裝置逐漸成為人們的生活必需品之一。 為了提供更便利的輸入與操作方式,部分電子裝置可以提供語音辨識系統(tǒng)。使用
者可以利用語音完成輸入與操作電子裝置。另外,當使用者處于不適合利用手動輸入與操
作的環(huán)境中,如在開車的時候,語音辨識系統(tǒng)亦提供使用者更便捷與安全的輸入與操作方
式。雖然通過語音可以輸入與操作電子裝置與/或汽車系統(tǒng)。然而,如何啟動語音辨識系
統(tǒng)成為設(shè)計者的重要關(guān)鍵。 由于環(huán)境中充滿各式各樣的聲音,如果讓語音辨識系統(tǒng)持續(xù)地辨識聲音,常常會 產(chǎn)生許多錯誤的辨識。因此,通常會額外設(shè)計一個按鈕來啟動語音辨識系統(tǒng)。由于使用者 必須手動按下此按鈕來啟動語音辨識系統(tǒng),因此,對于使用者而言是不便的,且在特殊狀況 下,如行車中,此行為是缺乏安全性的。 為了克服前述問題,一種已知技術(shù)開發(fā)來啟動語音辨識系統(tǒng)。在此已知技術(shù)中,系 統(tǒng)會持續(xù)檢測聲音中是否包括一關(guān)鍵字。當檢測到關(guān)鍵字時,則啟動語音辨識系統(tǒng),以進行 完整的語音辨識功能。在此已知技術(shù)中,使用者無須手動按下任何按鈕便可啟動語音辨識 系統(tǒng)。然而,由于系統(tǒng)仍然是持續(xù)地檢測聲音中是否含有關(guān)鍵字。若在聲音源不單純或較 為吵雜的環(huán)境中,可能形成錯誤的辨識亦是非常驚人的。因此,利用關(guān)鍵字來啟動語音辨識 系統(tǒng)的技術(shù)亦鮮見實作于產(chǎn)品上。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供語音辨識功能啟動系統(tǒng)及方法。 本發(fā)明實施例的一種語音辨識功能啟動系統(tǒng)包括一收音單元與一處理模塊。處理
模塊取得收音單元檢測得到的一第一期間的一第一聲音,且計算第一期間內(nèi)第一聲音的一
第一變異度。處理模塊判斷第一變異度是否小于一第一設(shè)定值。當?shù)谝蛔儺惗刃∮诘谝辉O(shè)
定值時,處理模塊取得收音單元檢測得到的一第二期間的一第二聲音,且判斷第二聲音中
是否包括一關(guān)鍵字。當?shù)诙曇糁邪P(guān)鍵字時,處理模塊啟動一語音辨識功能。當語音
辨識功能啟動時,收音單元檢測得到的一第三聲音中的每一文字將被檢測。 本發(fā)明實施例的一種語音辨識功能啟動方法。首先,取得一第一期間的一第一聲
音,且計算第一期間內(nèi)第一聲音的一第一變異度。判斷第一變異度是否小于一第一設(shè)定值。
當?shù)谝蛔儺惗刃∮诘谝辉O(shè)定值時,取得一第二期間的一第二聲音。判斷第二聲音中是否包
括一關(guān)鍵字。當?shù)诙曇糁邪P(guān)鍵字時,啟動一語音辨識功能。當語音辨識功能啟動時,
一第三聲音中的每一文字將被檢測。
本發(fā)明的上述方法可以通過程序碼方式存在。當程序碼被機器載入且執(zhí)行時,機器變成用以實行本發(fā)明的裝置。 為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉實施例,并結(jié)合附圖
詳細說明如下。 圖式簡單說明
圖1為一示意圖是顯示依據(jù)本發(fā)明實施例的語音辨識功能啟動系統(tǒng)。 圖2為一流程圖是顯示依據(jù)本發(fā)明實施例的語音辨識功能啟動方法。 附圖符號說明 100 語音辨識功能啟動系統(tǒng); 110 收音單元; 120 顯示單元; 130 處理模塊; S202、S204、. 、S220 步驟。
具體實施例方式圖1顯示依據(jù)本發(fā)明實施例的語音辨識功能啟動系統(tǒng)。 語音辨識功能啟動系統(tǒng)100可以是一電子裝置,如計算機系統(tǒng)、汽車系統(tǒng)、與便攜式裝置,如多媒體播放器、個人數(shù)字助理、全球衛(wèi)星定位裝置、觸控式手機、智慧型手機或移動電話等的手持式裝置。語音辨識功能啟動系統(tǒng)IOO包括一收音單元110、一顯示單元120與一處理模塊130。收音單元110可以是一麥克風用以接收環(huán)境中的聲音。顯示單元120可以是一螢?zāi)换蚴且粺籼?,用以顯示關(guān)鍵字檢測圖示。處理模塊130依據(jù)收音單元110接收的聲音執(zhí)行本案的語音辨識功能啟動方法,其細節(jié)將于后說明。
圖2顯示依據(jù)本發(fā)明實施例的語音辨識功能啟動方法。 如步驟S202,通過收音單元110接收一期間的聲音,且如步驟S204,計算期間內(nèi)聲音的變異度(Variance)。值得注意的是,計算變異度的方法是數(shù)值分析領(lǐng)域熟習的技術(shù),在此不再贅述。如步驟S206,判斷此期間聲音的變異度是否小于一第一設(shè)定值,且維持一既定時間。注意的是,第一設(shè)定值與既定時間可以依據(jù)不同需求彈性設(shè)計。當此期間聲音的變異度并未小于第一設(shè)定值或持續(xù)既定時間時(步驟S206的否),流程回到步驟S202。當此期間聲音的變異度小于第一設(shè)定值且持續(xù)既定時間時(步驟S206的是),如步驟S208,通過顯示單元120顯示一關(guān)鍵字檢測圖示。關(guān)鍵字檢測圖示的顯示可以提示使用者進行關(guān)鍵字的輸入。值得注意的是,步驟S206中判斷變異度是否小于第一設(shè)定值既定時間是用以避免瞬間聲音變化與/或不同聲音源造成的誤判。然而,在一些實施例中,步驟S206亦可僅判斷變異度是否小于第一設(shè)定值即可。 如步驟S210,通過收音單元110持續(xù)接收另一期間的聲音,且如步驟S212,計算此期間內(nèi)聲音的變異度。如步驟S214,判斷此期間聲音的變異度是否大于一第二設(shè)定值。當此期間聲音的變異度并未大于第二設(shè)定值時(步驟S214的否),流程回到步驟S210。當此期間聲音的變異度大于第二設(shè)定值時(步驟S214的是),如步驟S216,判斷聲音中是否包括一內(nèi)定的關(guān)鍵字。類似地,步驟S212與S214中計算與判斷此期間聲音的變異度是否大于第二設(shè)定值用以避免瞬間聲音變化和/或不同聲音源造成的誤判。然而,在一些實施例
4中,步驟S212與S214可以省略,而直接進行步驟S216的判斷。若聲音中并未包括內(nèi)定的關(guān)鍵字(步驟S216的否),如步驟S218,取消在顯示單元120中相應(yīng)關(guān)鍵字檢測圖示的顯示,并回到步驟S202。若聲音中包括內(nèi)定的關(guān)鍵字(步驟S216的是),如步驟S220,啟動一語音辨識功能。注意的是,當語音辨識功能啟動時,接收的聲音中每一文字都將會被檢測。
因此,本申請的語音辨識功能啟動系統(tǒng)及方法可以依據(jù)環(huán)境中聲音的變異度自動啟動語音辨識功能。當期間內(nèi)聲音的變異度小于設(shè)定值時,啟動關(guān)鍵字檢測,且在檢測到關(guān)鍵字的后自動啟動語音辨識功能,從而在便捷與安全性的考量下,啟動語音辨識功能。
本發(fā)明的方法,或特定型態(tài)或其部份,可以以程序碼的型態(tài)存在。程序碼可以包含于實體媒體,如軟盤、光盤片、硬盤、或是任何其他機器可讀取(如計算機可讀取)儲存媒體,亦或不限于外在形式的計算機程序產(chǎn)品,其中,當程序碼被機器,如計算機載入且執(zhí)行時,此機器變成用以參與本發(fā)明的裝置。程序碼也可以通過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態(tài)進行傳送,其中,當程序碼被機器,如計算機接收、載入且執(zhí)行時,此機器變成用以參與本發(fā)明的裝置。當在一般用途處理單元實作時,程序碼結(jié)合處理單元提供一操作類似于應(yīng)用特定邏輯電路的獨特裝置。 雖然本發(fā)明已以較佳實施例揭示如上,然其并非用以限定本發(fā)明,本領(lǐng)域的技術(shù)人員在不脫離本發(fā)明的精神和范圍的前提下可做若干的更動與潤飾,因此本發(fā)明的保護范圍以本發(fā)明的權(quán)利要求為準。
權(quán)利要求
一種語音辨識功能啟動系統(tǒng),包括一收音單元;以及一處理模塊,取得該收音單元檢測得到的一第一期間的一第一聲音,計算該第一期間內(nèi)該第一聲音的一第一變異度,且判斷該第一變異度是否小于一第一設(shè)定值,當該第一變異度小于該第一設(shè)定值時,取得該收音單元檢測得到的一第二期間的一第二聲音,且判斷該第二聲音中是否包括一關(guān)鍵字,當該第二聲音中包括該關(guān)鍵字時,啟動一語音辨識功能,其中,當該語音辨識功能啟動時,該收音單元檢測得到的一第三聲音中的每一文字將被檢測。
2. 如權(quán)利要求1所述的語音辨識功能啟動系統(tǒng),其中該處理模塊還判斷該第一變異度 是否小于該第一設(shè)定值一既定時間,當該第一變異度小于該第一設(shè)定值該既定時間時,方 取得該第二聲音。
3. 如權(quán)利要求1所述的語音辨識功能啟動系統(tǒng),還包括一顯示單元,用以當該第一變 異度小于該第一設(shè)定值時,顯示一關(guān)鍵字檢測圖示。
4. 如權(quán)利要求3所述的語音辨識功能啟動系統(tǒng),其中當該第二聲音中并未包括該關(guān)鍵 字時,該顯示單元取消該關(guān)鍵字檢測圖示的顯示。
5. 如權(quán)利要求1所述的語音辨識功能啟動系統(tǒng),其中該處理模塊還計算該第二聲音的 一第二變異度,且判斷該第二變異度是否大于一第二設(shè)定值,當該第二變異度大于該第二 設(shè)定值時,方判斷該第二聲音中是否包括該關(guān)鍵字。
6. —種語音辨識功能啟動方法,包括下列步驟 取得一第一期間的一第一聲音; 計算該第一期間內(nèi)該第一聲音的一第一變異度; 判斷該第一變異度是否小于一第一設(shè)定值;當該第一變異度小于該第一設(shè)定值時,取得一第二期間的一第二聲音; 判斷該第二聲音中是否包括一關(guān)鍵字;以及 當該第二聲音中包括該關(guān)鍵字時,啟動一語音辨識功能, 其中,當該語音辨識功能啟動時,一第三聲音中的每一文字將被檢測。
7. 如權(quán)利要求6所述的語音辨識功能啟動方法,還包括下列步驟 判斷該第一變異度是否小于該第一設(shè)定值一既定時間;以及 當該第一變異度小于該第一設(shè)定值該既定時間時,方取得該第二聲音。
8. 如權(quán)利要求6所述的語音辨識功能啟動方法,還包括當該第一變異度小于該第一設(shè) 定值時,顯示一關(guān)鍵字檢測圖示。
9. 如權(quán)利要求8所述的語音辨識功能啟動方法,還包括當該第二聲音中并未包括該關(guān) 鍵字時,取消該關(guān)鍵字檢測圖示的顯示。
10. 如權(quán)利要求6所述的語音辨識功能啟動方法,還包括下列步驟計算該第二聲音的一第二變異度; 判斷該第二變異度是否大于一第二設(shè)定值;以及當該第二變異度大于該第二設(shè)定值時,方判斷該第二聲音中是否包括該關(guān)鍵字。
全文摘要
一種語音辨識功能啟動系統(tǒng)及方法。首先,取得一第一期間的一第一聲音,且計算第一期間內(nèi)第一聲音的一第一變異度。判斷第一變異度是否小于一第一設(shè)定值。當?shù)谝蛔儺惗刃∮诘谝辉O(shè)定值時,取得一第二期間的一第二聲音。判斷第二聲音中是否包括一關(guān)鍵字。當?shù)诙曇糁邪P(guān)鍵字時,啟動一語音辨識功能。當語音辨識功能啟動時,一第三聲音中的每一文字將被檢測。
文檔編號G10L15/26GK101714355SQ20081016168
公開日2010年5月26日 申請日期2008年10月6日 優(yōu)先權(quán)日2008年10月6日
發(fā)明者周燕麗, 周福強 申請人:宏達國際電子股份有限公司