專(zhuān)利名稱(chēng):一種語(yǔ)音識(shí)別控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體技術(shù)領(lǐng)域,特別涉及一種語(yǔ)音識(shí)別控制方法。
技術(shù)背景
隨著科學(xué)技術(shù)的不斷進(jìn)步,人們使用電子設(shè)備而出現(xiàn)的人機(jī)交互輸入技術(shù)也在不斷的發(fā)展,從普通的鼠標(biāo)、鍵盤(pán),到新近比較流行的軌跡球、觸摸屏等技術(shù),不一而足。這些技術(shù)以其良好的使用性能和輸入速度,得到很好的普及和推廣,在或?qū)⒃谝欢魏荛L(zhǎng)的時(shí)間里在人機(jī)交互輸入技術(shù)上占據(jù)重要的位置。
然而以上這些技術(shù)都有一個(gè)共同的特點(diǎn),就是用人的手的敲擊,滑動(dòng)來(lái)實(shí)現(xiàn)人與機(jī)器或人與遠(yuǎn)端人的交互,顯然這并不符合在通常情況下人與人溝通交流的方式。技術(shù)發(fā)展的腳步是在不斷的往前走的,近十幾、二十年來(lái),人們發(fā)明并推動(dòng)了一些和人與人溝通交流方式相符的人機(jī)交互技術(shù),譬如基于圖像識(shí)別技術(shù)的肢體控制技術(shù)和以語(yǔ)音為載體的語(yǔ)音合成輸出技術(shù)和語(yǔ)音識(shí)別輸入技術(shù)。
本專(zhuān)利申請(qǐng)涉及的就是基于語(yǔ)音識(shí)別的人機(jī)交互輸入控制技術(shù)。近些年來(lái),在計(jì)算機(jī)和手機(jī)等多媒體電子設(shè)備上已經(jīng)出現(xiàn)了語(yǔ)音識(shí)別功能,主要實(shí)現(xiàn)替代鍵盤(pán)功能的文本輸入功能和替代鼠標(biāo)等功能的控制命令功能。
但是,現(xiàn)有的多媒體電子設(shè)備上的語(yǔ)音控制功能具有如下有待改進(jìn)的地方現(xiàn)有多媒體電子設(shè)備上的語(yǔ)音控制功能在應(yīng)用調(diào)用方面具有較大的限制,一般只能在某個(gè)特定的系統(tǒng)功能界面下,或某個(gè)開(kāi)啟的應(yīng)用程序界面下,才能使用語(yǔ)音識(shí)別功能,并只能啟動(dòng)系統(tǒng)默認(rèn)預(yù)置的或者有限數(shù)量的應(yīng)用程序,而對(duì)后安裝的應(yīng)用程序無(wú)法實(shí)現(xiàn)語(yǔ)音控制調(diào)用功能;另外即使語(yǔ)音控制進(jìn)入到應(yīng)用程序中,還是需要繼續(xù)使用鼠標(biāo)或觸摸屏來(lái)操作,無(wú)法使用語(yǔ)音控制功能在程序內(nèi)部進(jìn)一步的控制。發(fā)明內(nèi)容
本發(fā)明提供了一種語(yǔ)音識(shí)別控制方法,該方法使得用戶(hù)能通過(guò)語(yǔ)音控制在多媒體設(shè)備的應(yīng)用程序功能間任意快速的切換,減少了手動(dòng)控制,提高了用戶(hù)的體驗(yàn)。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別控制方法,該方法應(yīng)用于多媒體電子設(shè)備,在多媒體電子設(shè)備上配置語(yǔ)音功能控制器、語(yǔ)音控制條目操作接口、識(shí)別結(jié)果觸發(fā)接口以及語(yǔ)音控制條目保存介質(zhì);該方法包括
語(yǔ)音功能控制器通過(guò)系統(tǒng)應(yīng)用程序編程接口 API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目并保存到語(yǔ)音控制條目保存介質(zhì)中;
以及,系統(tǒng)程序和應(yīng)用程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器發(fā)送語(yǔ)音控制條目操作指令,語(yǔ)音功能控制器根據(jù)所述指令進(jìn)行語(yǔ)音控制條目的操作,并將操作結(jié)果保存到語(yǔ)音控制條目保存介質(zhì)中;
當(dāng)用戶(hù)發(fā)出語(yǔ)音控制信息時(shí),語(yǔ)音功能控制器獲取多媒體電子設(shè)備的語(yǔ)音輸入接口接收到的語(yǔ)音控制信息,調(diào)用多媒體電子設(shè)備的語(yǔ)音識(shí)別引擎根據(jù)所述語(yǔ)音控制信息識(shí)別出對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中對(duì)應(yīng)的語(yǔ)音控制條目;
語(yǔ)音功能控制器或者將語(yǔ)音控制條目對(duì)應(yīng)的控制功能信息通過(guò)識(shí)別結(jié)果觸發(fā)接口發(fā)送給對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序,由對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序根據(jù)所述控制功能信息執(zhí)行對(duì)應(yīng)的操作;或者,語(yǔ)音功能控制器根據(jù)語(yǔ)音控制條目直接調(diào)用對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序。
由上述可見(jiàn),本發(fā)明這種,在語(yǔ)音功能控制器通過(guò)API獲取已安裝程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目,以及,程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器進(jìn)行語(yǔ)音控制條目的自定義的前提下當(dāng)用戶(hù)發(fā)出語(yǔ)音控制信息時(shí),語(yǔ)音功能控制器獲取該語(yǔ)音控制信息,并識(shí)別出對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中保存的對(duì)應(yīng)的語(yǔ)音控制條目,將對(duì)應(yīng)語(yǔ)音控制條目中的控制功能信息發(fā)送給對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序,或直接調(diào)用對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序的技術(shù)方案,由于通過(guò)語(yǔ)音功能控制器主動(dòng)獲取以及程序自定義兩種方式生成語(yǔ)音控制條目,使得對(duì)包括原有程序的以及后安裝程序的所有的程序都能自動(dòng)生成相應(yīng)的語(yǔ)音控制條目,使得用戶(hù)可以通過(guò)語(yǔ)音控制在程序功能間任意快速地切換,大大提高了用戶(hù)的體驗(yàn)。
圖1是本發(fā)明實(shí)施例中的一種語(yǔ)音識(shí)別控制方法的示意圖2是本發(fā)明實(shí)施例中基于電視應(yīng)用的語(yǔ)音輸入接口的示意圖3是本發(fā)明實(shí)施例中的一個(gè)具有麥克風(fēng)輸入的小型鍵盤(pán)的示意圖4為語(yǔ)音輸入提示界面的示意圖5是本發(fā)明實(shí)施例中的語(yǔ)音控制條目的示意圖6是本發(fā)明實(shí)施例中的語(yǔ)音控制幫助界面的示意圖7是本發(fā)明實(shí)施例中的屏蔽性定義的示意圖8為在語(yǔ)音控制幫助界面上對(duì)語(yǔ)音控制條目實(shí)時(shí)修改示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
圖1是本發(fā)明實(shí)施例中的一種語(yǔ)音識(shí)別控制方法的示意圖。該方法應(yīng)用于多媒體電子設(shè)備。這里,所述的多媒體電子設(shè)備包括具有多媒體功能的電視、手機(jī)、筆記本、臺(tái)式電腦、多媒體播放器及其他所有具有屏幕顯示和語(yǔ)音輸入接口的設(shè)備。
如圖1所示,為了實(shí)現(xiàn)提高用戶(hù)體驗(yàn)的語(yǔ)音識(shí)別控制,在多媒體設(shè)備上配置了 語(yǔ)音功能控制器101、語(yǔ)音控制條目保存介質(zhì)105,并提供了語(yǔ)音控制條目操作接口 106、屏蔽性定義接口 107和識(shí)別結(jié)果觸發(fā)接口 108。本發(fā)明的方案還需要利用到多媒體電子設(shè)備原有的語(yǔ)音識(shí)別引擎104和語(yǔ)音輸入接口 112。此外圖1中還示意出了本發(fā)明的方案涉及的語(yǔ)音輸入提示界面102和語(yǔ)音控制幫助界面103,以及多媒體電子設(shè)備的系統(tǒng)程序和應(yīng)用程序109、系統(tǒng)API 110和系統(tǒng)應(yīng)用程序管理器111。
在本發(fā)明的實(shí)施例中,語(yǔ)音輸入接口 112既包括多媒體電子設(shè)備主體上的麥克風(fēng)輸入、麥克風(fēng)矩陣輸入、外接有線(xiàn)麥克風(fēng)(矩陣)輸入,也包括藍(lán)牙、FM、WiFi等無(wú)線(xiàn)音頻輸入,以及所有其他能讓多媒體電子設(shè)備獲取人聲的技術(shù)和接口設(shè)備。
參見(jiàn)圖1,語(yǔ)音功能控制器101通過(guò)系統(tǒng)應(yīng)用程序編程接口 API 110,從系統(tǒng)應(yīng)用程序管理器111獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序109的程序名信息, 生成對(duì)應(yīng)的語(yǔ)音控制條目并保存到語(yǔ)音控制條目保存介質(zhì)105中;并根據(jù)系統(tǒng)程序和應(yīng)用程序109的重新安裝和卸載情況對(duì)對(duì)應(yīng)的語(yǔ)音控制條目進(jìn)行修改和刪除操作。
以及,系統(tǒng)程序和應(yīng)用程序109通過(guò)語(yǔ)音控制條目操作接口 106向語(yǔ)音功能控制器101發(fā)送語(yǔ)音控制條目操作指令,語(yǔ)音功能控制器101根據(jù)所述指令進(jìn)行語(yǔ)音控制條目的操作,并將操作結(jié)果保存到語(yǔ)音控制條目保存介質(zhì)105中;所述進(jìn)行語(yǔ)音控制條目的操作包括添加語(yǔ)音控制條目、修改語(yǔ)音控制條目和刪除語(yǔ)音控制條目;
當(dāng)用戶(hù)語(yǔ)音觸發(fā)語(yǔ)音輸入提示界面102,或者當(dāng)用戶(hù)通過(guò)按鍵方式觸發(fā)語(yǔ)音輸入提示界面102時(shí),語(yǔ)音功能控制器101在多媒體電子設(shè)備的屏幕上顯示輸出語(yǔ)音輸入提示界面;用戶(hù)可以根據(jù)語(yǔ)音輸入提示界面發(fā)出語(yǔ)音控制信息,語(yǔ)音輸入接口獲取這些語(yǔ)音控制信息;
當(dāng)用戶(hù)發(fā)出語(yǔ)音控制信息時(shí),語(yǔ)音功能控制器101獲取語(yǔ)音輸入接口 112接收到的語(yǔ)音控制信息,并調(diào)用語(yǔ)音識(shí)別引擎104根據(jù)所述語(yǔ)音控制信息識(shí)別出的對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中保存的對(duì)應(yīng)的語(yǔ)音控制條目。語(yǔ)音功能控制器101或者將對(duì)應(yīng)語(yǔ)音控制條目中的控制功能信息通過(guò)識(shí)別結(jié)果觸發(fā)接口 108發(fā)送給對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序,由對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序根據(jù)所述控制功能信息執(zhí)行對(duì)應(yīng)的操作;或者,語(yǔ)音功能控制器101根據(jù)語(yǔ)音控制條目直接調(diào)用對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序。
可見(jiàn),通過(guò)語(yǔ)音功能控制器主動(dòng)獲取以及程序自定義兩種方式生成語(yǔ)音控制條目,使得對(duì)包括原有程序的以及后安裝程序的所有的程序都能自動(dòng)生成相應(yīng)的語(yǔ)音控制條目,使得用戶(hù)可以通過(guò)語(yǔ)音控制在程序功能間任意快速地切換,大大提高了用戶(hù)的體驗(yàn)。
圖2是本發(fā)明實(shí)施例中基于電視應(yīng)用的語(yǔ)音輸入接口的示意圖。如圖2所示,200 為一臺(tái)具有屏幕顯示和語(yǔ)音輸入接口的電視;201、202、203、204是電視邊框上的四個(gè)麥克風(fēng)輸入接口,在一起形成麥克風(fēng)矩陣,麥克風(fēng)矩陣采集到的聲音經(jīng)過(guò)一定的音頻降噪算法, 可獲得比較清晰的遠(yuǎn)端人的聲音。麥克風(fēng)矩陣的麥克風(fēng)數(shù)量可為2,4,6,8等實(shí)際應(yīng)用中合理的數(shù)目,并可放置在電視表面的任何合理位置。麥克風(fēng)矩陣是語(yǔ)音輸入接口的一種具體實(shí)施方式
,在這種實(shí)施方式下,站在遠(yuǎn)端的人可通過(guò)直接語(yǔ)音輸入一個(gè)系統(tǒng)預(yù)置的詞條——語(yǔ)音控制觸發(fā)詞條,如“語(yǔ)音”或“識(shí)別”等來(lái)觸發(fā)語(yǔ)音控制功能。
用戶(hù)觸發(fā)語(yǔ)音輸入提示界面的方式可以有以下兩種(1)用戶(hù)語(yǔ)音輸入一個(gè)系統(tǒng)預(yù)置并可以修改的詞條——語(yǔ)音控制觸發(fā)詞條,作為觸發(fā)語(yǔ)音輸入提示界面的語(yǔ)音控制信息,語(yǔ)音功能控制器獲取語(yǔ)音輸入接口接收到的語(yǔ)音控制信息,并調(diào)用語(yǔ)音識(shí)別引擎根據(jù)所述語(yǔ)音控制信息識(shí)別出對(duì)應(yīng)的詞條名,如該詞條名為語(yǔ)音控制觸發(fā)詞條,則直接啟動(dòng)語(yǔ)音輸入提示界面( 用戶(hù)通過(guò)按鍵方式啟動(dòng)語(yǔ)音輸入提示界面,例如可以是多媒體電子設(shè)備相關(guān)輸入設(shè)備的一個(gè)按鍵的一種按壓模式(比如,短按,長(zhǎng)按,雙擊等)或組合按鍵功能。
圖3是本發(fā)明實(shí)施例中的一個(gè)具有麥克風(fēng)輸入的小型鍵盤(pán)的示意圖。如圖3所示, 這是語(yǔ)音輸入接口的另一種具體實(shí)施方式
,301為麥克風(fēng)輸入接口,302為一個(gè)語(yǔ)音控制功能鍵,可為單獨(dú)設(shè)計(jì)的一個(gè)按鍵,也可為一個(gè)復(fù)用了語(yǔ)音控制功能和其他功能的按鍵。小型鍵盤(pán)300與電視200可通過(guò)任何無(wú)線(xiàn)或有線(xiàn)方式連接。用戶(hù)可以拿著該小型鍵盤(pán)300,按動(dòng)語(yǔ)音控制功能鍵302,并通過(guò)麥克風(fēng)輸入接口 301輸入音頻。在這種實(shí)施方式下,也可以不用語(yǔ)音控制功能鍵302,而直接語(yǔ)音輸入語(yǔ)音控制觸發(fā)詞條來(lái)觸發(fā)語(yǔ)音控制功能。
圖4為語(yǔ)音輸入提示界面的示意圖。在多媒體電子設(shè)備200上可通過(guò)單擊語(yǔ)音控制功能鍵302或直接語(yǔ)音輸入語(yǔ)音控制觸發(fā)詞條來(lái)觸發(fā)語(yǔ)音輸入提示界面102的彈出。語(yǔ)音輸入提示界面102可由如圖的標(biāo)題文字411,提示文字412和語(yǔ)音輸入音量提示413組成。語(yǔ)音輸入音量提示413根據(jù)語(yǔ)音輸入音量的大小做黑白兩部分的上下波動(dòng),提示用戶(hù)語(yǔ)音輸入是否正常。
語(yǔ)音輸入提示界面的作用是提示基于當(dāng)前程序上下文的語(yǔ)音識(shí)別輸入,所以可為如圖4所示對(duì)話(huà)框形式,也可以是一個(gè)滿(mǎn)屏而有透明度的界面,及其他所有從視覺(jué)上可以獲知當(dāng)前語(yǔ)音輸入提示界面出現(xiàn)之前的所在界面的信息的所有呈現(xiàn)方式。語(yǔ)音輸入提示界面可在任意系統(tǒng)程序界面和應(yīng)用程序界面被觸發(fā)而彈出。
可見(jiàn),用戶(hù)可以通過(guò)兩種方式實(shí)現(xiàn)語(yǔ)音控制功能。
方式一為
步驟11,用戶(hù)直接語(yǔ)音輸入語(yǔ)音控制觸發(fā)詞條(麥克風(fēng)矩陣(201,202,203,204) 或麥克風(fēng)輸入接口 301 —直打開(kāi));
步驟12,語(yǔ)音輸入提示界面102彈出;
步驟13,用戶(hù)輸入語(yǔ)音控制信息(詞條名);
步驟14,語(yǔ)音功能控制器101調(diào)用語(yǔ)音識(shí)別引擎104進(jìn)行識(shí)別;
步驟15,語(yǔ)音功能控制器101將識(shí)別結(jié)果的詞條名所對(duì)應(yīng)的控制功能信息(功能字串和功能序號(hào))返回給所對(duì)應(yīng)程序名的程序(為自定義條目時(shí)),或直接調(diào)用該程序(為程序名條目時(shí));
步驟16,語(yǔ)音輸入提示界面102退出;
步驟17,所對(duì)應(yīng)程序名的程序針對(duì)接收到的控制功能信息(功能字串和功能序號(hào))執(zhí)行相應(yīng)操作。
方式二為
步驟21,用戶(hù)按動(dòng)語(yǔ)音控制功能鍵302 ;
步驟22,麥克風(fēng)矩陣(201,202,203,204)或麥克風(fēng)輸入接口 301打開(kāi);
步驟23,語(yǔ)音輸入提示界面102彈出;
步驟M,用戶(hù)輸入語(yǔ)音控制信息(詞條名);
步驟25,語(yǔ)音功能控制器101調(diào)用語(yǔ)音識(shí)別引擎104進(jìn)行識(shí)別;
步驟沈,麥克風(fēng)矩陣(201,202,203,204)或麥克風(fēng)輸入接口 301關(guān)閉;
步驟27,語(yǔ)音功能控制器101將識(shí)別結(jié)果的詞條名所對(duì)應(yīng)的控制信息(功能字串和功能序號(hào))返回給所對(duì)應(yīng)程序名的系統(tǒng)程序或應(yīng)用程序(為自定義條目時(shí)),或直接調(diào)用該系統(tǒng)程序或應(yīng)用程序(為程序名條目時(shí));
步驟觀,語(yǔ)音輸入提示界面102退出;
步驟四,所對(duì)應(yīng)程序名的程序針對(duì)接收到的控制功能信息(功能字串和功能序號(hào))執(zhí)行相應(yīng)操作。
上文所述的語(yǔ)音輸入提示界面使用戶(hù)在沒(méi)有很多手動(dòng)控制的情況,輕松快速的在應(yīng)用程序功能間任意切換。例如,用戶(hù)輸入語(yǔ)音詞條“日歷”,可進(jìn)入日歷應(yīng)用程序。
參見(jiàn)圖1,多媒體電子設(shè)備的系統(tǒng)程序和應(yīng)用程序109分別通過(guò)語(yǔ)音控制條目操作接口 106、屏蔽性定義接口 107和識(shí)別結(jié)果觸發(fā)接口 108與語(yǔ)音功能控制器101進(jìn)行交互。語(yǔ)音功能控制器101通過(guò)系統(tǒng)API 110與系統(tǒng)應(yīng)用程序管理器111通信,獲取多媒體電子設(shè)備上已安裝的所有系統(tǒng)程序和應(yīng)用程序的程序名信息。語(yǔ)音控制條目操作接口 106 是一個(gè)所有系統(tǒng)程序和應(yīng)用程序都可操作自定義語(yǔ)音控制條目的接口。
圖5是本發(fā)明實(shí)施例中的語(yǔ)音控制條目的示意圖。如圖5所示,語(yǔ)音控制條目包括類(lèi)型、程序名、源注冊(cè)界面名、被注冊(cè)界面名、詞條名、控制功能名稱(chēng)、控制功能信息和有效范圍;控制功能信息包括功能字串和功能序號(hào);
其中,在每個(gè)語(yǔ)音控制條目中,所述類(lèi)型為程序名條目或自定義條目;若語(yǔ)音功能控制器通過(guò)API,從系統(tǒng)應(yīng)用程序管理器獲取系統(tǒng)程序和應(yīng)用程序的程序名信息,所生成對(duì)應(yīng)的語(yǔ)音控制條目的類(lèi)型為程序名條目;若系統(tǒng)程序和應(yīng)用程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器發(fā)送語(yǔ)音控制條目操作指令,語(yǔ)音功能控制器根據(jù)所述指令進(jìn)行語(yǔ)音控制條目的操作,語(yǔ)音功能控制器將操作結(jié)果保存的語(yǔ)音控制條目的類(lèi)型為自定義條目;
在每個(gè)語(yǔ)音控制條目中,所述有效范圍為系統(tǒng)級(jí)、應(yīng)用級(jí)或界面級(jí)。
參見(jiàn)圖5,條目一的類(lèi)型為程序名詞條,條目二、條目三、條目四的類(lèi)型為自定義條目。條目一是語(yǔ)音功能控制器通過(guò)系統(tǒng)API從系統(tǒng)應(yīng)用程序管理器獲取的關(guān)于程序名為 "Angry Birds”的軟件的信息,其詞條名為“Angry Birds, Angry, Birds”,后兩個(gè)詞條為語(yǔ)音功能控制器自動(dòng)根據(jù)程序名自動(dòng)進(jìn)行拆分添加的。程序名詞條的有效范圍默認(rèn)為系統(tǒng)級(jí)。可見(jiàn),在本發(fā)明的實(shí)施例中,語(yǔ)音功能控制器獲取系統(tǒng)程序和應(yīng)用程序的程序名后,將程序名作為本語(yǔ)音控制條目中的詞條名,并對(duì)程序名進(jìn)行拆分,將拆分后的詞條也作為本語(yǔ)音控制條目中的詞條名。
這相對(duì)于現(xiàn)有多媒體電子設(shè)備上的語(yǔ)音控制功能要求用戶(hù)輸入的語(yǔ)音比較固定, 沒(méi)有彈性來(lái)說(shuō),大大提高了靈活性。例如,在觀看電視節(jié)目的應(yīng)用中,有“中央電視臺(tái)五套” 的詞條,一般的語(yǔ)音控制功能就要求用戶(hù)每次觀看該節(jié)目時(shí)都要把整個(gè)詞條說(shuō)全,顯得很僵硬;而其實(shí)“中央5”,“中央5套”,“央視5”反而是比較簡(jiǎn)潔而日常使用頻率較高的詞條。 在某些多媒體電子設(shè)備的語(yǔ)音控制功能中,也有提供實(shí)現(xiàn)某一特定功能的多個(gè)詞條,包括標(biāo)準(zhǔn)說(shuō)法和簡(jiǎn)化說(shuō)法,但一般都是預(yù)置的,不提供用戶(hù)添加和修改的能力,缺乏足夠的靈活度。本發(fā)明的方案則可以解決該問(wèn)題。
這里以一個(gè)程序名為“有線(xiàn)節(jié)目,,的程序?yàn)槔?,其有“電視?jié)目列表”、“控制列表” 和“視頻播放”三個(gè)界面?!半娨暪?jié)目列表”主要用于列出所有的電視節(jié)目;“控制列表”主要用于顯示所有可用的控制選項(xiàng);“視頻播放”是真正的視頻播放界面。
條目二是程序名為“有線(xiàn)節(jié)目,,的程序的源注冊(cè)界面名為“電視節(jié)目列表”的界面為自己注冊(cè)的詞條名為“電視列表”,功能名稱(chēng)為“打開(kāi)電視節(jié)目列表”的語(yǔ)音控制條目。其有效范圍為系統(tǒng)級(jí),用戶(hù)在系統(tǒng)的任何位置,只要不受屏蔽性定義影響,都可以通過(guò)語(yǔ)音控制功能直接來(lái)到該“電視節(jié)目列表”界面。
條目三是程序名為“有線(xiàn)節(jié)目,,的程序的源注冊(cè)界面名為“電視節(jié)目列表”的界面為被注冊(cè)界面名為“視頻播放”的界面注冊(cè)的功能名稱(chēng)為“中央電視臺(tái)五套”的語(yǔ)音控制條目,其詞條名有兩個(gè),分別為“中央電視臺(tái)5”和“中央5”,當(dāng)用戶(hù)說(shuō)出詞條名為“中央電視臺(tái) 5”或“中央5”時(shí),語(yǔ)音功能控制器將會(huì)通過(guò)識(shí)別結(jié)果觸發(fā)接口將條目三中的功能字串和功能序號(hào)發(fā)給程序名為“有線(xiàn)節(jié)目,,的程序和/或該程序中的被注冊(cè)界面名為“視頻播放”的界面,由該“有線(xiàn)節(jié)目”程序或“視頻播放,,界面執(zhí)行程序,播放功能名稱(chēng)為“中央電視臺(tái)五套”的電視節(jié)目。條目三的有效范圍為“應(yīng)用級(jí)”,表明用戶(hù)只能在程序名為“有線(xiàn)節(jié)目”的程序中使用該語(yǔ)音控制條目,當(dāng)然也可以將其設(shè)置為“系統(tǒng)級(jí)”,讓用戶(hù)可在多媒體電子設(shè)備的任意當(dāng)前位置通過(guò)語(yǔ)音控制功能直接播放“中央電視臺(tái)五套”的電視節(jié)目。
條目四是程序名同為“有線(xiàn)節(jié)目,,的程序的另一源注冊(cè)界面名為“控制列表”的界面為被注冊(cè)界面名為“視頻播放”的界面注冊(cè)的功能名稱(chēng)為“靜音”的語(yǔ)音控制條目,其詞條名為“靜音”;該有效范圍為“界面級(jí)”,表明用戶(hù)只能在處于“有線(xiàn)節(jié)目”程序中的被注冊(cè)界面名為“視頻播放”的界面中,才可使用該語(yǔ)音控制條目,也可根據(jù)實(shí)際情況將其設(shè)置為 “應(yīng)用級(jí)”。當(dāng)然對(duì)語(yǔ)音控制條目有效范圍的限制,對(duì)避免與其他程序的語(yǔ)音控制條目重名, 提高使用體驗(yàn)是有好處的。
通過(guò)語(yǔ)音控制條目操作接口對(duì)語(yǔ)音控制條目所做的操作,包括添加、修改和刪除語(yǔ)音控制條目和條目屬性定義等操作。修改操作即對(duì)圖5中所示的語(yǔ)音控制條目的程序名、源注冊(cè)界面名、被注冊(cè)界面名、詞條名、控制功能名稱(chēng)、控制功能字串和控制功能序號(hào)的修改和調(diào)整。所述的條目屬性定義是指對(duì)語(yǔ)音控制條目有效范圍的定義,包括系統(tǒng)級(jí)、應(yīng)用級(jí)和界面級(jí);系統(tǒng)級(jí)表示所操作語(yǔ)音控制條目在系統(tǒng)的任意位置都是有效的;應(yīng)用級(jí)表示所操作語(yǔ)音控制條目只在本應(yīng)用程序內(nèi)是有效的;界面級(jí)表示所操作語(yǔ)音控制條目只在本應(yīng)用程序內(nèi)的某一界面是有效的。
所述的語(yǔ)音控制條目是詞條及其對(duì)應(yīng)功能及其他關(guān)聯(lián)信息的一個(gè)集合。所述的詞條為用于傳給語(yǔ)音識(shí)別引擎的用于匹配輸入語(yǔ)音的短語(yǔ)??梢葬槍?duì)某一特定功能定義單一詞條,也可以定義多個(gè)詞條(包括簡(jiǎn)化詞條或別名詞條)。所述的語(yǔ)音控制條目分為程序名語(yǔ)音控制條目(簡(jiǎn)稱(chēng)程序名條目)和自定義語(yǔ)音控制條目(簡(jiǎn)稱(chēng)自定義條目)。程序名條目由語(yǔ)音控制功能通過(guò)系統(tǒng)信息獲得;而自定義條目由系統(tǒng)程序和應(yīng)用程序通過(guò)上述語(yǔ)音控制條目操作接口進(jìn)行操作。
仍參見(jiàn)圖1,下面對(duì)屏蔽性定義接口 107進(jìn)行說(shuō)明屏蔽性定義接口 107是所有系統(tǒng)程序和應(yīng)用程序109可根據(jù)自身對(duì)語(yǔ)音識(shí)別控制功能需求的情況在某些特定情況下,對(duì)應(yīng)用程序內(nèi)屏蔽所有非本應(yīng)用程序的系統(tǒng)級(jí)語(yǔ)音控制條目(稱(chēng)為程序屏蔽性),或可對(duì)應(yīng)用程序內(nèi)的某一界面,屏蔽所有非本界面的系統(tǒng)級(jí)和應(yīng)用級(jí)語(yǔ)音控制條目(稱(chēng)為界面屏蔽性)而使用的接口。所述的某些特定情況,舉例如在自身語(yǔ)音控制條目過(guò)多的情況下,為了提高語(yǔ)音識(shí)別的準(zhǔn)確率,而去屏蔽其他程序或界面的語(yǔ)音控制條目。在默認(rèn)情況下,屏蔽性定義都為否。
具體來(lái)說(shuō)系統(tǒng)程序和應(yīng)用程序109通過(guò)屏蔽性定義接口 107向語(yǔ)音功能控制器 101進(jìn)行本程序或本程序內(nèi)的指定界面的屏蔽性定義操作;語(yǔ)音功能控制器101保存屏蔽性定義操作的結(jié)果;
所述屏蔽性定義操作包括在本程序內(nèi)屏蔽所有非本程序的系統(tǒng)級(jí)語(yǔ)音控制條目;和/或,在本程序內(nèi)的指定界面,屏蔽所有非本界面的系統(tǒng)級(jí)和應(yīng)用級(jí)語(yǔ)音控制條目;
有了屏蔽性定義之后,語(yǔ)音功能控制器101獲取語(yǔ)音輸入接口 112接收到的語(yǔ)音控制信息,并調(diào)用語(yǔ)音識(shí)別引擎104根據(jù)所述語(yǔ)音控制信息進(jìn)行識(shí)別,語(yǔ)音識(shí)別引擎104根據(jù)所述保存的屏蔽性定義操作結(jié)果進(jìn)行識(shí)別時(shí),自動(dòng)忽略那些被定義了屏蔽的語(yǔ)音控制條目,而是在沒(méi)有被屏蔽的語(yǔ)音控制條目中進(jìn)行所述語(yǔ)音控制信息的匹配。
現(xiàn)有多媒體電子設(shè)備上的語(yǔ)音控制功能的用戶(hù)幫助信息很有限。一般的語(yǔ)音控制功能界面僅僅只是提供一個(gè)語(yǔ)音輸入圖標(biāo)和輸入音量大小的提示,少數(shù)也有關(guān)于功能分類(lèi)的說(shuō)明,大致是說(shuō)什么類(lèi)型的句子,可以實(shí)現(xiàn)某一種特定功能,例如,“打開(kāi)......”實(shí)現(xiàn)打開(kāi)某應(yīng)用程序的功能。但一般用戶(hù)從中并沒(méi)有得到足夠的信息,經(jīng)常是要手動(dòng)退出該語(yǔ)音控制功能界面,了解清楚應(yīng)用程序列表中每個(gè)程序的命名后,再回到語(yǔ)音控制功能界面進(jìn)行語(yǔ)音控制輸入操作,而這樣的過(guò)程在實(shí)際使用過(guò)程中是要頻繁出現(xiàn)很多次的,大大的降低了該語(yǔ)音控制功能的用戶(hù)體驗(yàn)。
而本發(fā)明中的語(yǔ)音控制幫助界面可以大大改進(jìn)用戶(hù)的體驗(yàn)。下面對(duì)此進(jìn)行說(shuō)明。
當(dāng)用戶(hù)觸發(fā)語(yǔ)音控制幫助界面時(shí),語(yǔ)音功能控制器101在多媒體電子設(shè)備的屏幕上顯示語(yǔ)音控制幫助界面;語(yǔ)音功能控制器101基于當(dāng)前多媒體電子設(shè)備所處的程序上下文環(huán)境,在語(yǔ)音控制幫助界面上呈現(xiàn)當(dāng)前可用詞條及其控制功能。
圖6是本發(fā)明實(shí)施例中的語(yǔ)音控制幫助界面的示意圖。圖6中示意出了語(yǔ)音控制幫助界面103。該語(yǔ)音控制幫助界面103具有和語(yǔ)音輸入提示界面類(lèi)似的操作屬性和呈現(xiàn)方式,在多媒體電子設(shè)備上可通過(guò)雙擊或長(zhǎng)按語(yǔ)音控制功能鍵或直接語(yǔ)音輸入語(yǔ)音幫助觸發(fā)詞條(如“語(yǔ)音幫助”)來(lái)觸發(fā)語(yǔ)音控制幫助界面120的彈出。語(yǔ)音控制幫助界面120由于是基于程序上下文環(huán)境來(lái)顯示的,所以可為如圖6所示的對(duì)話(huà)框形式,也可以是一個(gè)滿(mǎn)屏而有透明度的界面,及其他所有從視覺(jué)上可以獲知當(dāng)前語(yǔ)音控制幫助界面出現(xiàn)之前的所在界面的信息的所有呈現(xiàn)方式。該語(yǔ)音控制幫助界面120可在任意系統(tǒng)程序界面和應(yīng)用程序界面被觸發(fā)而彈出。
具體來(lái)說(shuō),當(dāng)用戶(hù)通過(guò)語(yǔ)音觸發(fā)語(yǔ)音控制幫助界面,或者當(dāng)用戶(hù)通過(guò)按鍵方式觸發(fā)語(yǔ)音控制幫助界面時(shí),語(yǔ)音功能控制器101在多媒體電子設(shè)備的屏幕上顯示輸出語(yǔ)音控制幫助界面。其中,語(yǔ)音功能控制器101在屏幕上輸出對(duì)話(huà)框形式的語(yǔ)音控制幫助界面,或在屏幕上輸出具有透明度的語(yǔ)音控制幫助界面。
參見(jiàn)圖6,語(yǔ)音功能控制器101將基于當(dāng)前多媒體電子設(shè)備所處的程序上下文環(huán)境,語(yǔ)音控制幫助界面103上呈現(xiàn)當(dāng)前可用詞條及其具體信息。語(yǔ)音控制幫助界面103可有語(yǔ)音控制幫助界面標(biāo)題“語(yǔ)音控制幫助”626。語(yǔ)音控制幫助界面103上呈現(xiàn)當(dāng)前可用條目的詞條名及其控制功能。所述的當(dāng)前可用條目包括當(dāng)前界面條目621、當(dāng)前程序條目 622、所有程序名條目623和全局程序自定義條目6M ;具體顯示的信息625的格式為,當(dāng)為程序名條目時(shí),顯示格式為-“詞條名,,一 >打開(kāi)“程序名”;當(dāng)為自定義條目時(shí),顯示格式為-“詞條名” 一 > “程序名”中的“功能名稱(chēng)”。
當(dāng)前界面條目621列出當(dāng)前所在程序的所在界面被注冊(cè)的可用語(yǔ)音控制條目信息及用來(lái)調(diào)用當(dāng)前程序所需要的程序名條目信息(第一個(gè));當(dāng)前程序條目622列出除當(dāng)前界面條目621外當(dāng)前所在程序被注冊(cè)的可用語(yǔ)音控制條目信息;所有程序名條目623列出除了當(dāng)前程序外的其他所有多媒體電子設(shè)備上安裝的系統(tǒng)程序和應(yīng)用程序被調(diào)用時(shí)所需要的程序名條目信息;全局程序自定義條目6M列出除了當(dāng)前程序外的其他所有系統(tǒng)程序和應(yīng)用程序注冊(cè)的程序內(nèi)語(yǔ)音控制條目的信息。
詞條的可用性及其是否呈現(xiàn),由語(yǔ)音控制條目的有效范圍和當(dāng)前所處程序和程序界面的屏蔽性定義決定。即詞條的可用性及其是否呈現(xiàn)在語(yǔ)音控制幫助界面103上,由前文所述的語(yǔ)音控制條目的屬性定義(有效范圍)和當(dāng)前所處程序和程序界面的屏蔽性定義決定。當(dāng)用戶(hù)觸發(fā)語(yǔ)音控制幫助界面時(shí),語(yǔ)音功能控制器基于語(yǔ)音控制條目的有效范圍、當(dāng)前所處程序和程序界面的屏蔽性定義,在語(yǔ)音控制幫助界面上呈現(xiàn)當(dāng)前可用詞條及其控制功能。
圖7是本發(fā)明實(shí)施例中的屏蔽性定義的示意圖。圖7示意出了在不同屏蔽性定義和不同語(yǔ)音控制條目有效范圍下,語(yǔ)音控制條目是否會(huì)顯示在語(yǔ)音控制幫助界面上的情況。當(dāng)前界面被注冊(cè)的語(yǔ)音控制條目是不考慮屏蔽性定義的情況,一定會(huì)顯示在語(yǔ)音控制幫助界面103的當(dāng)前界面條目621頁(yè)的;當(dāng)前程序內(nèi)非當(dāng)前界面被注冊(cè)的界面級(jí)語(yǔ)音控制條目、其他程序被注冊(cè)的界面級(jí)語(yǔ)音控制條目及應(yīng)用級(jí)語(yǔ)音控制條目是不考慮屏蔽性定義的情況,不會(huì)顯示在語(yǔ)音控制幫助界面103的;而當(dāng)前程序內(nèi)非當(dāng)前界面被注冊(cè)的應(yīng)用級(jí)和系統(tǒng)級(jí)語(yǔ)音控制條目只有當(dāng)當(dāng)前界面的屏蔽性定義為否時(shí),才會(huì)在語(yǔ)音控制幫助界面 103的當(dāng)前程序條目622頁(yè)顯示;而其他程序被注冊(cè)的系統(tǒng)級(jí)語(yǔ)音控制條目只有當(dāng)當(dāng)前界面的屏蔽性定義和當(dāng)前程序的屏蔽性定義都為否時(shí),才能在語(yǔ)音控制幫助界面103的全局程序自定義條目6M頁(yè)顯示。
此外,語(yǔ)音功能控制器101還在語(yǔ)音控制幫助界面上呈現(xiàn)對(duì)語(yǔ)音控制條目進(jìn)行操作的功能按鈕;當(dāng)用戶(hù)通過(guò)該功能按鈕進(jìn)行語(yǔ)音控制條目的操作時(shí),由語(yǔ)音功能控制器 101進(jìn)行相應(yīng)語(yǔ)音控制條目的操作,并保存操作結(jié)果。
圖8為在語(yǔ)音控制幫助界面上對(duì)語(yǔ)音控制條目實(shí)時(shí)修改示意圖。參見(jiàn)圖8,用戶(hù)可通過(guò)單擊語(yǔ)音控制幫助界面103上的可用詞條具體信息625,例如圖8中的擬6項(xiàng),在其下方出現(xiàn)對(duì)該擬6項(xiàng)多個(gè)詞條可修改的項(xiàng)目827。項(xiàng)目827有顯示擬6項(xiàng)三個(gè)詞條的三個(gè)可修改文本框828,和一個(gè)添加詞條的按鍵829。用戶(hù)可以通過(guò)文本框828修改和刪除現(xiàn)有詞條,也可以通過(guò)按鍵8 添加一個(gè)新詞條,可再加上一個(gè)“最?lèi)?ài)看的”的詞條。對(duì)詞條的修改,刪除,添加操作將立即生效。
在本發(fā)明的實(shí)施例中,語(yǔ)音功能控制器101為多媒體電子設(shè)備系統(tǒng)開(kāi)機(jī)就啟動(dòng)的系統(tǒng)后臺(tái)程序,也可為語(yǔ)音控制功能被使用或語(yǔ)音控制功能上述接口被首次調(diào)用時(shí)就啟動(dòng)并一直運(yùn)行的后臺(tái)服務(wù)程序。語(yǔ)音識(shí)別引擎104從語(yǔ)音功能控制器101獲取當(dāng)前所要識(shí)別的所有詞條名,并對(duì)輸入語(yǔ)音進(jìn)行識(shí)別,將所識(shí)別的結(jié)果詞條返回給語(yǔ)音功能控制器101。 語(yǔ)音控制條目保存介質(zhì)105可為數(shù)據(jù)庫(kù)或獨(dú)立文件,及其他合理的數(shù)據(jù)保存介質(zhì),用于將系統(tǒng)程序和應(yīng)用程序109在語(yǔ)音功能控制器101注冊(cè)的語(yǔ)音控制條目保存起來(lái),以便語(yǔ)音功能控制器101重啟或多媒體電子設(shè)備重啟后的直接獲取。
在本發(fā)明的實(shí)施例中,所述語(yǔ)音功能控制器通過(guò)系統(tǒng)API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息具體可以為(1)語(yǔ)音功能控制器定期通過(guò)系統(tǒng)API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息;(2)或者,當(dāng)有程序被卸載或有新的程序被安裝時(shí),由系統(tǒng)應(yīng)用程序管理器通知語(yǔ)音功能控制器,語(yǔ)音功能控制器收到通知后,刪除被卸載程序的語(yǔ)音控制條目(不僅包括程序名語(yǔ)音控制條目,也包括自定義語(yǔ)音控制條目),或通過(guò)系統(tǒng) API從系統(tǒng)應(yīng)用程序管理器獲取新安裝程序的程序名信息。
由上述可見(jiàn),本發(fā)明這種,在語(yǔ)音功能控制器通過(guò)API獲取已安裝程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目,以及,程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器進(jìn)行語(yǔ)音控制條目的自定義的前提下當(dāng)用戶(hù)發(fā)出語(yǔ)音控制信息時(shí),語(yǔ)音功能控制器獲取該語(yǔ)音控制信息,并識(shí)別出對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中保存的對(duì)應(yīng)的語(yǔ)音控制條目,將對(duì)應(yīng)語(yǔ)音控制條目中的控制功能信息發(fā)送給對(duì)應(yīng)的程序或直接調(diào)用對(duì)應(yīng)的程序的技術(shù)方案,由于通過(guò)語(yǔ)音功能控制器主動(dòng)獲取以及程序自定義兩種方式生成語(yǔ)音控制條目,使得對(duì)包括原有程序的以及后安裝程序的所有的程序都能自動(dòng)生成相應(yīng)的語(yǔ)音控制條目,使得用戶(hù)可以通過(guò)語(yǔ)音控制在程序功能間任意快速地切換,大大提高了用戶(hù)的體驗(yàn)。
本發(fā)明的技術(shù)方案還提供對(duì)多詞條語(yǔ)音控制條目的良好支持。上文所述的語(yǔ)音控制幫助界面可呈現(xiàn)同一語(yǔ)音控制條目的多個(gè)詞條,該多個(gè)詞條可由所屬程序通過(guò)上文所述語(yǔ)音控制條目操作接口添加;也可由語(yǔ)音控制功能自動(dòng)通過(guò)單詞拆分功能實(shí)現(xiàn),例如 "Angry Birds"可生成“Angry”和“Birds”兩個(gè)簡(jiǎn)化詞條。另外所述的語(yǔ)音控制幫助界面也給用戶(hù)提供對(duì)同一語(yǔ)音控制條目的多個(gè)詞條的操作功能,包括現(xiàn)有詞條的修改和刪除以及新詞條的添加,例如在“中央電視臺(tái)五套”功能的詞條“中央電視臺(tái)五套”和“中央五” “中央體育”的基礎(chǔ)上,可再加上一個(gè)“最?lèi)?ài)看的”的詞條。可見(jiàn),所述的語(yǔ)音控制幫助界面為用戶(hù)提供了方便且清晰的語(yǔ)音控制幫助和自定義化語(yǔ)音輸入詞條功能。
本發(fā)明提出的語(yǔ)音識(shí)別控制方法,使用戶(hù)能在應(yīng)用程序功能間任意快速的切換, 并提供方便且清晰的語(yǔ)音控制幫助和自定義化語(yǔ)音輸入詞條功能。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音識(shí)別控制方法,該方法應(yīng)用于多媒體電子設(shè)備,其特征在于,在多媒體電子設(shè)備上配置語(yǔ)音功能控制器、語(yǔ)音控制條目操作接口、識(shí)別結(jié)果觸發(fā)接口以及語(yǔ)音控制條目保存介質(zhì);該方法包括語(yǔ)音功能控制器通過(guò)系統(tǒng)應(yīng)用程序編程接口 API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目并保存到語(yǔ)音控制條目保存介質(zhì)中;以及,系統(tǒng)程序和應(yīng)用程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器發(fā)送語(yǔ)音控制條目操作指令,語(yǔ)音功能控制器根據(jù)所述指令進(jìn)行語(yǔ)音控制條目的操作,并將操作結(jié)果保存到語(yǔ)音控制條目保存介質(zhì)中;當(dāng)用戶(hù)發(fā)出語(yǔ)音控制信息時(shí),語(yǔ)音功能控制器獲取多媒體電子設(shè)備的語(yǔ)音輸入接口接收到的語(yǔ)音控制信息,調(diào)用多媒體電子設(shè)備的語(yǔ)音識(shí)別引擎根據(jù)所述語(yǔ)音控制信息識(shí)別出的對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中對(duì)應(yīng)的語(yǔ)音控制條目;語(yǔ)音功能控制器或者將語(yǔ)音控制條目對(duì)應(yīng)的控制功能信息通過(guò)識(shí)別結(jié)果觸發(fā)接口發(fā)送給對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序,由對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序根據(jù)所述控制功能信息執(zhí)行對(duì)應(yīng)的操作;或者,語(yǔ)音功能控制器根據(jù)語(yǔ)音控制條目直接調(diào)用對(duì)應(yīng)的系統(tǒng)程序或應(yīng)用程序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在語(yǔ)音功能控制器獲取多媒體電子設(shè)備的語(yǔ)音輸入接口接收到的語(yǔ)音控制信息之前,該方法還包括用戶(hù)通過(guò)語(yǔ)音方式或按鍵方式觸發(fā)語(yǔ)音輸入提示界面或觸發(fā)語(yǔ)音控制幫助界面。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述語(yǔ)音控制條目包括類(lèi)型、程序名、詞條名、控制功能名稱(chēng)和有效范圍;其中,在每個(gè)語(yǔ)音控制條目中,所述類(lèi)型為程序名條目或自定義條目;若語(yǔ)音功能控制器通過(guò)API,從系統(tǒng)應(yīng)用程序管理器獲取系統(tǒng)程序和應(yīng)用程序的程序名信息,所生成對(duì)應(yīng)的語(yǔ)音控制條目的類(lèi)型為程序名條目;若系統(tǒng)程序和應(yīng)用程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器發(fā)送語(yǔ)音控制條目操作指令,語(yǔ)音功能控制器根據(jù)所述指令進(jìn)行語(yǔ)音控制條目的操作,語(yǔ)音功能控制器將操作結(jié)果進(jìn)行保存的語(yǔ)音控制條目的類(lèi)型為自定義條目;在每個(gè)語(yǔ)音控制條目中,所述有效范圍為系統(tǒng)級(jí)、應(yīng)用級(jí)或界面級(jí)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法還包括在多媒體電子設(shè)備上配置屏蔽性定義接口;系統(tǒng)程序和應(yīng)用程序通過(guò)屏蔽性定義接口向語(yǔ)音功能控制器進(jìn)行本程序或本程序內(nèi)的指定界面的屏蔽性定義操作;語(yǔ)音功能控制器保存屏蔽性定義操作的結(jié)果;所述屏蔽性定義操作包括在本程序內(nèi)屏蔽所有非本程序的系統(tǒng)級(jí)語(yǔ)音控制條目;和 /或,在本程序內(nèi)的指定界面,屏蔽所有非本界面的系統(tǒng)級(jí)和應(yīng)用級(jí)語(yǔ)音控制條目。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,語(yǔ)音識(shí)別引擎根據(jù)所述語(yǔ)音控制信息識(shí)別出對(duì)應(yīng)的詞條名包括語(yǔ)音識(shí)別引擎根據(jù)所述保存的屏蔽性定義操作結(jié)果進(jìn)行識(shí)別,忽略被定義了屏蔽性的語(yǔ)音控制條目,在沒(méi)有被定義屏蔽性的語(yǔ)音控制條目中進(jìn)行所述語(yǔ)音控制信息的匹配。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,當(dāng)用戶(hù)觸發(fā)語(yǔ)音控制幫助界面時(shí),語(yǔ)音功能控制器基于語(yǔ)音控制條目的有效范圍、當(dāng)前所處程序和程序界面的屏蔽性定義,在語(yǔ)音控制幫助界面上呈現(xiàn)當(dāng)前可用詞條及其控制功能。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,該方法還包括在語(yǔ)音控制幫助界面上呈現(xiàn)對(duì)語(yǔ)音控制條目進(jìn)行操作的功能按鈕;當(dāng)用戶(hù)對(duì)該功能按鈕進(jìn)行語(yǔ)音控制條目的操作時(shí),由語(yǔ)音功能控制器進(jìn)行相應(yīng)語(yǔ)音控制條目的操作,并保存操作結(jié)果。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語(yǔ)音功能控制器通過(guò)API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目包括語(yǔ)音功能控制器獲取系統(tǒng)程序和應(yīng)用程序的程序名后,將程序名作為本語(yǔ)音控制條目中的詞條名,并對(duì)程序名進(jìn)行拆分,將拆分后的詞條也作為本語(yǔ)音控制條目中的詞條名。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其特征在于,所述語(yǔ)音功能控制器通過(guò)系統(tǒng)API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息包括語(yǔ)音功能控制器定期通過(guò)系統(tǒng)API,從系統(tǒng)應(yīng)用程序管理器獲取多媒體電子設(shè)備上已安裝的系統(tǒng)程序和應(yīng)用程序的程序名信息;或者,當(dāng)有程序被卸載或有新的程序被安裝時(shí),由系統(tǒng)應(yīng)用程序管理器通知語(yǔ)音功能控制器,語(yǔ)音功能控制器收到通知后,刪除被卸載程序的語(yǔ)音控制條目,或通過(guò)系統(tǒng)API從系統(tǒng)應(yīng)用程序管理器獲取新安裝程序的程序名信息。
10.根據(jù)權(quán)利要求1或7所述的方法,其特征在于,對(duì)語(yǔ)音控制條目進(jìn)行的操作包括 添加語(yǔ)音控制條目、修改語(yǔ)音控制條目和刪除語(yǔ)音控制條目。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別方法。在該方法中,語(yǔ)音功能控制器通過(guò)API獲取已安裝程序的程序名信息,生成對(duì)應(yīng)的語(yǔ)音控制條目,以及,程序通過(guò)語(yǔ)音控制條目操作接口向語(yǔ)音功能控制器進(jìn)行語(yǔ)音控制條目的自定義,當(dāng)用戶(hù)觸發(fā)語(yǔ)音控制功能,語(yǔ)音功能控制器獲取該語(yǔ)音控制信息,并識(shí)別出對(duì)應(yīng)的詞條名,根據(jù)詞條名查找語(yǔ)音控制條目保存介質(zhì)中保存的對(duì)應(yīng)的語(yǔ)音控制條目,將對(duì)應(yīng)語(yǔ)音控制條目中的控制功能信息發(fā)送給對(duì)應(yīng)的程序或直接調(diào)用對(duì)應(yīng)的程序。本發(fā)明的技術(shù)方案,對(duì)包括原有程序的以及后安裝程序的所有的程序都能自動(dòng)生成相應(yīng)的語(yǔ)音控制條目,使得用戶(hù)可以通過(guò)語(yǔ)音控制在程序功能間任意快速地切換,大大提高了用戶(hù)的體驗(yàn)。
文檔編號(hào)G06F3/01GK102520788SQ20111036303
公開(kāi)日2012年6月27日 申請(qǐng)日期2011年11月16日 優(yōu)先權(quán)日2011年11月16日
發(fā)明者劉新愛(ài), 姜斌斌, 孟策, 曾小波, 王恬, 王重樂(lè), 高強(qiáng) 申請(qǐng)人:歌爾聲學(xué)股份有限公司