專利名稱:基于語音識別的索引菜單的方法、裝置及其終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動通訊領(lǐng)域,特別涉及一種基于語音識別的索引菜單的方法、裝置及其終端。
背景技術(shù):
隨著移動通信領(lǐng)域技術(shù)的不斷發(fā)展和成熟,在日益普及的移動終端中,特別是智能終端中軟件功能越來越豐富,用戶的個性化需求越來越多。但隨著移動操作系統(tǒng)和硬件平臺的日趨統(tǒng)一,軟件功能的同質(zhì)化也日趨嚴重。不斷創(chuàng)新引入語音識別等新的交互方式成為保持終端產(chǎn)品競爭力的重要途徑。語音識別作為一種新的、重要的用戶交互技術(shù)在移動終端中的應(yīng)用越來越廣泛。隨著語音識別技術(shù)的不斷發(fā)展和云端語音服務(wù)器的引入,語音識別率有了很大提升,但從目前移動終端中已推出的語音產(chǎn)品的實際性能看,使用效果并不理想,技術(shù)還沒有完全成熟。語音識別技術(shù)的應(yīng)用主要包括兩種方式本地化的直接命令式語音和依靠云端服務(wù)器的自然語言解析兩種方式。直接命令式語音存在可擴展性差問題,需要提前預(yù)設(shè)固定范圍的詞匯庫。也存在因為用戶使用習(xí)慣、地域的不同,語言發(fā)音不用,國別不同等識別誤差范圍較大,準(zhǔn)確率不高的問題。用戶需要記憶每個命令式,命令長度相對較長,沒有統(tǒng)一的格式,沒有通用的規(guī)則可以助記。依靠云端語音服務(wù)器的自然語言解析方式,接近用戶的使用習(xí)慣,但該功能依賴于網(wǎng)絡(luò),需要大量的數(shù)據(jù)交互操作,會引起用戶網(wǎng)絡(luò)流量的費用問題。同時當(dāng)網(wǎng)絡(luò)狀態(tài)不好時,識別率會很低,用戶使用場景受限。還有因為用戶使用習(xí)慣、地域的不同,語言發(fā)音不用,國別不同等使得語音識別誤差范圍較大,識別準(zhǔn)確率不足。此外,語音識別需要大量的計算,所以語音識別的速度和設(shè)備的能耗也會受語音命令的長度影響。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)中的問題,本發(fā)明提供一種基于語音識別的索引菜單的方法、裝置及其終端,以解決直接命令式的語音識別存在可擴展性差的問題。本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案如下根據(jù)本發(fā)明的一個方面,提供的一種基于語音識別的索引菜單的方法包括以下步驟A、啟動語音識別引擎服務(wù);B、接收用戶語音,并根據(jù)接收的語音遍歷體感動作特征庫,獲取與接收的語音相匹配的語音特征文件,通過語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;C、通過預(yù)設(shè)的索引菜單映射表查找到文本字符對應(yīng)的菜單項;
D、調(diào)用菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。優(yōu)選地,上述方法之后還包括步驟E、判斷是否還進行下一級索引操作,如果是,則轉(zhuǎn)到步驟B繼續(xù)執(zhí)行索引菜單操作,否則結(jié)束流程。優(yōu)選地,啟動語音識別引擎服務(wù)包括在開機過程中或者接收到用戶通過快捷方式的命令后啟動語音識別引擎服務(wù);啟動語音識別引擎服務(wù)之后還包括將語音識別服務(wù)當(dāng)前的狀態(tài)通過狀態(tài)欄圖標(biāo)或者通知欄通知消息提示用戶。優(yōu)選地,語音特征庫包含各個基本字符的語音特征文件,基本字符包括字母A-Z、數(shù)字O 9、和/或特殊符號*、#、+。優(yōu)選地,索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中預(yù)設(shè)應(yīng)用索引菜單映射表中設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中,每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)第三方應(yīng)用程序的一級索引菜單映射表,通過第三方應(yīng)用程序安裝和卸載時進行配置管理。根據(jù)本發(fā)明的另一個方面,提供的一種基于語音識別的索引菜單的裝置包括以下模塊啟動模塊,用于啟動語音識別引擎服務(wù);語音識別引擎服務(wù),用于接收用戶語音,并根據(jù)接收的語音遍歷體感動作特征庫,獲取與接收的語音相匹配的語音特征文件,通過語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;查找模塊,用于通過預(yù)設(shè)的索引菜單映射表查找到文本字符對應(yīng)的菜單項;執(zhí)行模塊,用于調(diào)用菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。優(yōu)選地,索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中預(yù)設(shè)應(yīng)用索引菜單映射表設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中,每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)第三方應(yīng)用程序的一級索引菜單映射表,通過應(yīng)用程序安裝和卸載時進行配置管理。優(yōu)選地,啟動模塊具體用于在開機過程中或者接收到用戶通過快捷方式的命令后啟動語音識別引擎服務(wù);還用于啟動語音識別引擎服務(wù)后,將語音識別服務(wù)當(dāng)前的狀態(tài)通過狀態(tài)欄圖標(biāo)或者通知欄通知消息提示用戶。優(yōu)選地,上述裝置還包括休眠模塊,休眠模塊用于當(dāng)菜單被操作后超過預(yù)定的時間沒有接收到下一次操作時,休眠或關(guān)閉語音識別引擎服務(wù)。根據(jù)本發(fā)明的再一個方面,還提供了一種終端,該終端包括上述技術(shù)方案中的基于語音識別的索引菜單的裝置。根據(jù)本發(fā)明的實施例,利用語音識別技術(shù)中對各個語言基本字符的識別高效、準(zhǔn)確和多種語言通用化的特點,利用語音識別技術(shù)識別出用戶讀出的各個基本字符組合的語音,進而轉(zhuǎn)譯成基本字符組合文本,并通過查找預(yù)設(shè)規(guī)則索引菜單映射表,實現(xiàn)語音識別索引菜單操作,使得語音特征庫只需要提供基本字符的語音特征文件,通過自由組合可以實現(xiàn)所有菜單操作命令,滿足復(fù)雜的語音識別才能完成的菜單操作,提高了靈活性和可擴展性。
圖1為本發(fā)明提供的一種基于語音識別的索引菜單的方法流程圖;圖2為本發(fā)明實施例提供的一種菜單的邏輯結(jié)構(gòu)示意圖;圖3為本發(fā)明實施例提供的一種索引菜單映射表的數(shù)據(jù)結(jié)構(gòu)示意圖;圖4為本發(fā)明提供的一種基于語音識別的索引菜單的裝置模塊結(jié)構(gòu)圖;圖5為本發(fā)明實施例提供的應(yīng)用于號碼查找的方法流程圖。
具體實施例方式以下結(jié)合附圖和實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。實施例一如圖1所示是本發(fā)明提供一種基于語音識別的索引菜單實現(xiàn)方法,該方法包括以下步驟S101、啟動語音識別引擎服務(wù);具體來說,該步驟中啟動語音識別引擎服務(wù)的方式包括但不限于在開機過程中或者接收到用戶通過快捷方式的命令后啟動;優(yōu)選地,為了讓用戶確認當(dāng)前是否支持語音識別索引菜單的功能,在啟動語音識別引擎服務(wù)之后,可以通過將語音識別服務(wù)當(dāng)前的狀態(tài)狀態(tài)欄圖標(biāo)或者通知欄通知消息提不用戶。S102、接收用戶語音,并根據(jù)接收的語音遍歷體感動作特征庫,獲取與接收的語音相匹配的語音特征文件,通過語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;具體來說,語音特征庫包含基本字符集中各個基本字符的語音特征文件,其中基本字符集包括字母A-Z、數(shù)字O 9、和/或特殊符號*、#、+。語音特征文件中包含能夠識別語音的特征信息。比如A字符的特征信息,當(dāng)接收到用戶語音后,會將用戶語音與特征文件中的信息進行匹配,并會依據(jù)匹配的相似度,輸出相應(yīng)的一個或多個候選字符集。優(yōu)選地,基本字符集同當(dāng)前選擇的語言相對應(yīng),由當(dāng)前語言包含的基本字符集決定,用戶可以根據(jù)實際需求配置裁剪。組成基本字符組合的字符個數(shù)理論上不受限制,但為了保證索引菜單命令的簡單性,組成索引菜單的基本字符的個數(shù)最好小于或者等于3個。特殊符號可以用于通用菜單操作命令的定義。比如返回操作、選擇操作、返回待機操作等。S103、通過預(yù)設(shè)的索引菜單映射表查找到上述文本字符對應(yīng)的菜單項;具體來說,索引菜單映射表是通過一定的預(yù)設(shè)規(guī)則建立基本字符組合和各個菜單操作的映射關(guān)系配置表,基本字符組合作為映射的菜單操作的索引。
索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中預(yù)設(shè)應(yīng)用索引菜單映射表設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中,每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)第三方應(yīng)用程序的一級索引菜單映射表,通過第三方應(yīng)用程序安裝和卸載時進行配置管理。為了克服索引映射表方式不是用戶習(xí)慣的自然語言交互方式,需要依據(jù)預(yù)設(shè)規(guī)則記憶命令集,語音識別菜單的索引不能太多太復(fù)雜,層級不能太深,建議層級小于或等于3個。S104、調(diào)用菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。具體來說,接口函數(shù)就是指菜單對應(yīng)執(zhí)行相應(yīng)動作的命令函數(shù),同一類別的菜單操作有相同的命令函數(shù)。在同一類別的菜單操作命令中,通過輸入?yún)?shù)來區(qū)分不同的執(zhí)行方式或狀態(tài)。比如電話本應(yīng)用創(chuàng)建,可以通過輸入?yún)?shù)來區(qū)分是否支持后臺啟動,或者目標(biāo)界面的區(qū)分等。輸入?yún)?shù)默認為0,就是默認的方式。優(yōu)選地,當(dāng)菜單項還有下一級操作時,該方法之后還包括判斷是否還進行下一級索引操作,如果是,則轉(zhuǎn)到步驟S102繼續(xù)執(zhí)行索引菜單操作,否則結(jié)束流程。優(yōu)選地,語音識別引擎服務(wù)會對能耗造成影響,為了節(jié)省能耗,還可以考慮使用場景的設(shè)定和超時處理。該方法之后還包括步驟當(dāng)超過預(yù)定的時間沒有接收到下一次索引操作時,休眠或關(guān)閉語音識別引擎服務(wù),類似屏幕背光的處理,時間長度可以由用戶根據(jù)實際需求分等級設(shè)定。實施例二如圖2和圖3所示分別為本實施例的索引菜單的邏輯結(jié)構(gòu)圖和索引菜單映射表的數(shù)據(jù)結(jié)構(gòu)示意圖,圖中菜單的邏輯結(jié)構(gòu)為樹狀結(jié)構(gòu),從樹狀結(jié)構(gòu)的根節(jié)點到葉節(jié)點,每一個層級對應(yīng)一級索引,每一級索引對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項。下一級子節(jié)點索引菜單的操作取決于上一級父節(jié)點索引菜單的作用域范圍。根索引映射為待機的菜單操作,一級索引映射為從待機進入某個功能界面的菜單操作,其數(shù)據(jù)結(jié)構(gòu)包括一級索引菜單名稱、應(yīng)用ID和應(yīng)用名稱、參數(shù)信息;二級索引映射為某個應(yīng)用內(nèi)部的菜單操作或者啟動/返回其他非待機應(yīng)用的操作,其數(shù)據(jù)結(jié)構(gòu)包括二級索引菜單名稱、應(yīng)用ID、應(yīng)用動作和參數(shù)信息;低級別索引對應(yīng)更細化的菜單操作任務(wù)。其中,參數(shù)信息用于在同一類別的菜單操作命令中區(qū)分不同的執(zhí)行方式或狀態(tài),參數(shù)默認為0,即默認的啟動方式。同級別的索引可以同名,高級別的同名索引在低級別同名索引的作用域內(nèi)不可見。當(dāng)上一級父索引無效時,下一級的所有子索引均無效。優(yōu)選地,為了滿足編譯時的可配置性,索引菜單映射表的配置可以通過腳本語言定義實現(xiàn)。優(yōu)選地,索引菜單名稱生成的預(yù)設(shè)規(guī)則是預(yù)設(shè)應(yīng)用名稱的首字母。當(dāng)首字母沖突時,索引菜單定位為前兩個字母。如果前三個字母都相同,則加數(shù)字編號。由于是基本字符范圍內(nèi)的語音識別,所以通用性相對較好,比如在只有英文字母的語音特征庫時,同樣可以實現(xiàn)對漢語中拼音的識別和使用。這對實現(xiàn)基于語音識別的查找或排序也提供了便利。優(yōu)選地,為了保證簡單易用性,索引菜單映射表的建立可包含預(yù)設(shè)應(yīng)用和第三方應(yīng)用兩種方式。兩種方式的索引菜單映射表是相互獨立的,其中預(yù)設(shè)應(yīng)用的方式可以定義多級的索引菜單操作;第三方應(yīng)用的方式只能定義一級索引菜單操作,其索引菜單映射表在第三方應(yīng)用程序安裝和卸載時進行配置管理。通過本實施例中索引映射表的引入,使得語音特征庫只需要提供基本字符的語音特征文件,用戶通過基本字符的自由組合作為菜單操作命令集的索引,滿足復(fù)雜的語音識別才能完成的菜單操作,提高了靈活性,禰補了直接命令式語音操作的可擴展性差的問題。實施例三如圖4所示為本發(fā)明提供的一種基于語音識別的索引菜單的裝置模塊結(jié)構(gòu)圖。圖中該裝置包括啟動模塊410,語音識別引擎服務(wù)420,查找模塊430,執(zhí)行模塊440,其中啟動模塊410,用于啟動語音識別引擎服務(wù)420;該模塊具體可以在開機過程中或者接收到用戶通過快捷方式的命令后啟動語音識別弓I擎服務(wù)420。優(yōu)選的,為了讓用戶確認當(dāng)前是否支持語音識別索引菜單的功能,該模塊還用于啟動語音識別引擎服務(wù)420后,將語音識別服務(wù)420當(dāng)前的狀態(tài)通過狀態(tài)欄圖標(biāo)或者通知欄通知消息提示用戶。語音識別引擎服務(wù)420,用于接收用戶語音,并根據(jù)接收的語音遍歷體感動作特征庫,獲取與接收的語音相匹配的語音特征文件,通過語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;查找模塊430,用于通過預(yù)設(shè)的索引菜單映射表查找到文本字符對應(yīng)的菜單項;具體來說,索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中預(yù)設(shè)應(yīng)用索引菜單映射表設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中,每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)第三方應(yīng)用程序的一級索引菜單映射表,通過應(yīng)用程序安裝和卸載時進行配置管理。執(zhí)行模塊440,用于調(diào)用菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。優(yōu)選地,上述裝置中還包括休眠模塊450,休眠模塊用于當(dāng)索引菜單被操作后超過預(yù)定的時間沒有接收到下一次操作時,休眠或關(guān)閉語音識別引擎服務(wù)420。此外,本發(fā)明還提供了一種終端,該終端上包括了上述基于語音識別的索引菜單的裝置。比如移動終端、游戲機和電腦。在移動終端中各級索引對應(yīng)的菜單操作類別描述說明如下根索引映射為返回待機的菜單操作。一級索引映射為從待機進入某個功能界面的菜單操作。二級索引映射為某個應(yīng)用內(nèi)部的菜單操作或者啟動/返回其他非待機應(yīng)用的操作。低級別索引對應(yīng)更細化的菜單操作任務(wù)。
在其他應(yīng)用領(lǐng)域以此類推。應(yīng)用實例下面結(jié)合圖3和圖5以電話本應(yīng)用的號碼查找BCB的聯(lián)系人為例進一步說明索引菜單的分級索引。圖3中示出了電話本的索引菜單映射表的數(shù)據(jù)結(jié)構(gòu),電話本的一級索引菜單對應(yīng)的索引字符為“C”,“查找”為二級索引菜單中對應(yīng)的索引字符“B”。圖5中為該聯(lián)系人的號碼查找方法流程圖,該方法包括S501、接收并識別出用戶通過語音輸入的C,進入電話本界面;S502、接收并識別出用戶通過語音輸入的B ;S503、索引菜單成功后,進入電話本聯(lián)系人列表界面;S504、接收并識別出用戶通過語音輸入的B ;S505、輸出經(jīng)過模糊匹配的首字母為B的聯(lián)系人列表;S506、接收并識別出用戶通過語音輸入的C ;S507、輸出經(jīng)過模糊匹配的前兩個字母為BC的聯(lián)系人列表,S508、接收并識別出用戶通過語音再次輸入的C ;S509、輸出經(jīng)過模糊匹配的第三個字母為C的聯(lián)系人列表,查找到名字為BCB的聯(lián)系人,執(zhí)行其他的操作。需要說明的是,在電話本列表操作界面下,電話本的一級索引菜單C作為當(dāng)前界面二級索引菜單查找聯(lián)系人的前綴,所有的索引操作都是在C菜單作用域內(nèi)的。以上參照
了本發(fā)明的優(yōu)選實施例,并非因此局限本發(fā)明的權(quán)利范圍。本領(lǐng)域技術(shù)人員不脫離本發(fā)明的范圍和實質(zhì),可以有多種變型方案實現(xiàn)本發(fā)明,如作為一個實施例的特征可用于另一實施例以得到又一實施例。凡運用本發(fā)明說明書及附圖內(nèi)容所作的等效變化,均應(yīng)在本發(fā)明的權(quán)利范圍之內(nèi)。
權(quán)利要求
1.一種基于語音識別的索引菜單的方法,其特征在于,所述方法包括以下步驟A、啟動語音識別引擎服務(wù);B、接收用戶語音,并根據(jù)所述語音遍歷體感動作特征庫,獲取與所述語音相匹配的語音特征文件,通過所述語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;C、通過預(yù)設(shè)的索引菜單映射表查找到所述文本字符對應(yīng)的菜單項;D、調(diào)用所述菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法之后還包括步驟E、判斷是否還進行下一級索引操作,如果是,則轉(zhuǎn)到步驟B繼續(xù)執(zhí)行索引菜單操作,否則結(jié)束流程。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述啟動語音識別引擎服務(wù)包括在開機過程中或者接收到用戶通過快捷方式的命令后啟動語音識別引擎服務(wù);所述啟動語音識別引擎服務(wù)之后還包括將所述語音識別服務(wù)當(dāng)前的狀態(tài)通過狀態(tài)欄圖標(biāo)或者通知欄通知消息提示用戶。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音特征庫包含各個基本字符的語音特征文件,所述基本字符包括字母A-Z、數(shù)字O 9、和/或特殊符號*、#、+。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中所述預(yù)設(shè)應(yīng)用索引菜單映射表中設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中,每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;所述第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)所述第三方應(yīng)用程序的一級索引菜單映射表,通過所述第三方應(yīng)用程序安裝和卸載時進行配置管理。
6.一種基于語音識別的索引菜單的裝置,其特征在于,所述裝置包括啟動模塊,用于啟動語音識別引擎服務(wù);語音識別引擎服務(wù),接收用戶語音,并根據(jù)所述語音遍歷體感動作特征庫,獲取與所述語音相匹配的語音特征文件,通過所述語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;查找模塊,用于通過預(yù)設(shè)的索引菜單映射表查找到所述文本字符對應(yīng)的菜單項;執(zhí)行模塊,用于調(diào)用所述菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述索引菜單映射表包括預(yù)設(shè)應(yīng)用索引菜單映射表和/或第三方應(yīng)用索引菜單映射表,其中所述預(yù)設(shè)應(yīng)用索引菜單映射表設(shè)置為從菜單的樹狀邏輯結(jié)構(gòu)的根節(jié)點到葉節(jié)點中, 每一個層級對應(yīng)一個索引菜單映射表,每一個節(jié)點對應(yīng)一個菜單項,通過腳本語言進行配置;所述第三方應(yīng)用索引菜單映射表設(shè)置為對應(yīng)所述第三方應(yīng)用程序的一級索引菜單映射表,通過所述應(yīng)用程序安裝和卸載時進行配置管理。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述啟動模塊具體用于在開機過程中或者接收到用戶通過快捷方式的命令后啟動語音識別引擎服務(wù);還用于啟動語音識別引擎服務(wù)后,將所述語音識別服務(wù)當(dāng)前的狀態(tài)通過狀態(tài)欄圖標(biāo)或者通知欄通知消息提示用戶。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括休眠模塊,所述休眠模塊用于當(dāng)所述菜單被操作后超過預(yù)定的時間沒有接收到下一次操作時,休眠或關(guān)閉所述語音識別引擎服務(wù)。
10.一種終端,其特征在于,所述終端包括如權(quán)利要求6-9任意一項權(quán)利要求所述的裝置。
全文摘要
本發(fā)明公開了一種基于語音識別的索引菜單的方法、裝置及其終端,屬于移動通信領(lǐng)域。所述方法包括以下步驟啟動語音識別引擎服務(wù);接收用戶語音,并根據(jù)接收的語音遍歷體感動作特征庫,獲取與接收的語音相匹配的語音特征文件,通過語音特征文件將接收的語音轉(zhuǎn)譯成文本字符;通過預(yù)設(shè)的索引菜單映射表查找到文本字符對應(yīng)的菜單項;調(diào)用菜單項對應(yīng)的接口函數(shù)執(zhí)行菜單操作。通過本發(fā)明,利用語音識別技術(shù)中對各個語言基本字符的識別高效、準(zhǔn)確和多種語言通用化的特點,使得語音特征庫只需要提供基本字符的語音特征文件,通過自由組合可以實現(xiàn)所有菜單操作命令,滿足復(fù)雜的語音識別才能完成的菜單操作,提高了靈活性和可擴展性。
文檔編號G06F17/30GK103049571SQ201310000639
公開日2013年4月17日 申請日期2013年1月4日 優(yōu)先權(quán)日2013年1月4日
發(fā)明者柏鳳佳, 海茜, 潘啟蒙 申請人:深圳市中興移動通信有限公司