亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音操控方法、移動終端裝置及語音操控系統(tǒng)與流程

文檔序號:12730359閱讀:259來源:國知局

技術領域
:本發(fā)明涉及一種語音操控方法,特別是涉及一種通過語音操控應用程序的語音操控方法、移動終端裝置及語音操控系統(tǒng)。
背景技術
::隨著科技的發(fā)展,具有語音系統(tǒng)的移動終端裝置已日漸普及。上述的語音系統(tǒng)是通過語音理解技術,讓使用者與移動終端裝置進行溝通。舉例來說,使用者只要對上述的移動終端裝置講出某項要求,例如想要查車次、查天氣或是欲撥打電話等,系統(tǒng)便會依據(jù)使用者的語音信號,采取對應的動作?;谡Z音理解技術的實用性,目前許多開發(fā)者已推出語音軟件開發(fā)包(SpeechSoftwareDevelopmentKit,SDK)來執(zhí)行上述語音理解技術,例如實現(xiàn)從語音中識別出漢字,進行語音合成,實現(xiàn)語音朗讀等等。通過語音軟件開發(fā)包,開發(fā)者或使用者需將會被使用到的功能函數(shù)或應用程序加入語音軟件開發(fā)包,而語音軟件開發(fā)包便可根據(jù)使用者的語音信號來執(zhí)行對應的動作。雖然使用者可通過語音軟件開發(fā)包來操控移動終端裝置,然而對于未加入語音軟件開發(fā)包的功能函數(shù)或應用程序,則會失去與使用者進行語音交互的能力。換言之,倘若應用程序未被加入語音軟件開發(fā)包,則使用者將無法通過語音來操控應用程序執(zhí)行對應的動作,故對于使用者來說將造成許多的不便?;耍绾胃倪M上述的這些缺點,成為亟待解決的議題。技術實現(xiàn)要素:本發(fā)明提供一種語音操控方法、移動終端裝置以及語音操控系統(tǒng),其可讓使用者通過語音的方式來操控移動終端裝置中的應用程序,藉以提升使用移動終端裝置的便利性。本發(fā)明提出一種語音操控方法,用于移動終端裝置,其中移動終端裝置具有第一應用程序。在語音操控方法中,第一應用程序提供至少一操作參數(shù)至語音軟件開發(fā)模塊。接收語音信號并傳送至語音軟件開發(fā)模塊,語音軟件開發(fā)模塊解析語音信號以獲得語音識別結(jié)果,當語音識別結(jié)果符合操作參數(shù)時,語音軟件開發(fā)模塊根據(jù)語音識別結(jié)果提供操作指令至應用程序。應用程序接收操作指令并執(zhí)行對應操作。本發(fā)明還提出一種語音操控方法,用于語音軟件開發(fā)模塊。在語音操控方法中,自應用程序接收至少一操作參數(shù)。接收并解析語音信號,以獲得語音識別結(jié)果。判斷語音識別結(jié)果是否符合操作參數(shù)。當語音識別結(jié)果符合操作參數(shù)時,根據(jù)語音識別結(jié)果,提供操作指令至應用程序。本發(fā)明還提出一種語音操控方法,用于移動終端裝置與語音軟件開發(fā)模塊,其中移動終端裝置具有應用程序。在語音操控方法中,應用程序提供至少一操作參數(shù)至語音軟件開發(fā)模塊。語音軟件開發(fā)模塊通過語音接收單元接收語音信號并解析語音信號,以獲得語音識別結(jié)果。語音軟件開發(fā)模塊判斷語音識別結(jié)果是否符合操作參數(shù)。當語音識別結(jié)果符合操作參數(shù)時,語音軟件開發(fā)模塊根據(jù)語音識別結(jié)果,提供操作指令至應用程序。本發(fā)明還提出一種語音操控系統(tǒng),其包括移動終端裝置以及伺服器。移動終端裝置包括語音接收單元以及應用程序模塊。語音接收單元用以接收語音信號,而應用程序模塊用以提供應用程序。伺服器適與移動終端裝置連線,且伺服器具有語音軟件開發(fā)模塊。其中,應用程序提供至少一操作參數(shù)至語音軟件開發(fā)模塊。語音軟件開發(fā)模塊通過語音接收單元接收語音信號,并解析語音信號以獲得語音識別結(jié)果。語音軟件開發(fā)模塊判斷語音識別結(jié)果是否符合操作參數(shù)。當語音識別結(jié)果符合操作參數(shù)時,語音軟件開發(fā)模塊根據(jù)語音識別結(jié)果,提供操作指令至應用程序。本發(fā)明還提出一種移動終端裝置,其連線于語音軟件開發(fā)模塊。移動終端裝置包括語音接收單元以及應用程序模塊。語音接收單元用以接收語音信號。應用程序模塊用以提供應用程序。其中,應用程序提供至少一操作參數(shù)至語音軟件開發(fā)模塊。語音軟件開發(fā)模塊自語音接收單元接收語音信號并解析語音信號,以獲得語音識別結(jié)果。語音軟件開發(fā)模塊判斷語音識別結(jié)果是否符合操作參數(shù)。當語音識別結(jié)果符合操作參數(shù)時,語音軟件開發(fā)模塊根據(jù)語音識別結(jié)果,提供操作指令至應用程序?;谏鲜?,在本發(fā)明的語音操控方法、移動終端裝置以及語音操控系統(tǒng)中,應用程序會提供操作參數(shù)至語音軟件開發(fā)模塊,而語音軟件開發(fā)模塊會解析來自使用者的語音信號而獲得語音識別結(jié)果。當語音軟件開發(fā)模塊判斷語音識別結(jié)果符合操作參數(shù)時,語音軟件開發(fā)模塊則會提供操作指令至所述應用程序。藉此,本發(fā)明可讓使用者以語音的方式來操控應用程序,藉以提升移動終端裝置的使用便利性。為使本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并結(jié)合附圖詳細說明如下。附圖說明圖1是依照本發(fā)明一實施例所繪示的語音操控系統(tǒng)的方塊圖。圖2是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。圖3是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。圖4是依照本發(fā)明一實施例所繪示的語音操控方法的方塊圖。圖5是依照本發(fā)明一實施例所繪示的移動終端裝置的流程圖。附圖符號說明100、500:移動終端裝置110、510:語音接收單元120、520:應用程序模塊122、124、126、522、524、526:應用程序130、530:語音軟件開發(fā)模塊132、532:呼叫接口134、534:通知接口136、536:語義數(shù)據(jù)庫40:伺服器4000:語音操控系統(tǒng)P1、P2、P3:操作參數(shù)S:操作指令S202、S204、S206、S302、S304、S306、S308、S310、S402、S404、S406、S408、S410、S412、S414:語音操控方法的各步驟具體實施方式雖然現(xiàn)今的移動終端裝置已可提供語音系統(tǒng),以讓使用者發(fā)出語音來和移動終端裝置溝通,但若應用程序本身不具有語音理解功能,則使用者無法通過語音的方式來操控應用程序執(zhí)行對應的操作功能。為此,本發(fā)明提出一種語音操控方法、移動終端裝置及語音操控系統(tǒng),讓使用者能夠更便捷地通過語音的方式來操控移動終端裝置中的應用程序,以提升使用移動終端裝置的便利性。為了使本發(fā)明的內(nèi)容更為明了,以下特舉實施例作為本發(fā)明確實能夠據(jù)以實施的范例。圖1是依照本發(fā)明一實施例所繪示的語音操控系統(tǒng)1000的方塊圖。請參照圖1,語音操控系統(tǒng)1000具有移動終端裝置100以及伺服器10,且移動終端裝置100可連線于伺服器10。伺服器10例如是云端伺服器,而伺服器10包括語音軟件開發(fā)模塊130。移動終端裝置100例如為移動電話(Cellphone)、個人數(shù)字助理(PersonalDigitalAssistant,PDA)手機、智能型手機(Smartphone),或是安裝有通訊軟件的掌上型計算機(PocketPC)、平板型計算機(TabletPC)或筆記型計算機等等。移動終端裝置100可以是任何具備通訊功能的便攜式(Portable)移動裝置,在此并不限制其范圍。此外,移動終端裝置100包括語音接收單元110以及應用程序模塊120。在語音操控系統(tǒng)1000中,一個或多個操作參數(shù)由移動終端裝置100傳送至伺服器10的語音軟件開發(fā)模塊130。當移動終端裝置100通過語音接收單元110接收到來自使用者的語音信號時,移動終端裝置100可將此語音信號傳送至伺服器10中的語音軟件開發(fā)模塊130,而語音軟件開發(fā)模塊130便可對此語音信號進行解析而獲得語音識別結(jié)果。此時,語音軟件開發(fā)模塊130可根據(jù)語音識別結(jié)果,判斷此語音識別結(jié)果是否符合上述的操作參數(shù),若是,語音軟件開發(fā)模塊130便會發(fā)送對應的操作指令至移動終端裝置100中的應用程序模塊120,使得應用程序模塊120啟動對應此操作指令的應用程序,或使此應用程序執(zhí)行對應的操作功能。下面將詳述上述模塊的功能。語音接收單元110用以接收來自使用者的語音信號,此語音接收單元110例如為麥克風(Microphone)等接收音訊的裝置。應用程序模塊120用以提供一個或多個應用程序。應用程序例如桌面應用程序、瀏覽器應用程序、文書處理應用程序或影像擷取應用程序等,不限于上述。圖1繪示應用程序122、124及126為例,但本實施例并不限制應用程序的數(shù)量。語音軟件開發(fā)模塊130例如為語音軟件開發(fā)工具包(softwaredevelopmentkit,SDK)。語音軟件開發(fā)模塊130可提供語音識別(SpeechRecognition)、語音合成(SpeechSynthesis)或其他語音編譯等功能。需說明的是,上述的應用程序模塊120與語音軟件開發(fā)模塊130可由一個或數(shù)個邏輯門組合而成的硬件電路來實作,亦可以是以計算機程序碼來實作,并藉由移動終端裝置100的中央處理器來執(zhí)行。伺服器10中的語音軟件開發(fā)模塊130用以根據(jù)語音信號而產(chǎn)生操作指令。詳細而言,語音軟件開發(fā)模塊130可提供呼叫接口132、通知接口134以及語義數(shù)據(jù)庫136。其中,呼叫接口132用以接收來自應用程序122、124及126的多個操作參數(shù)。通知接口134用以輸出操作指令至應用程序122、124及126,使應用程序122、124及126依據(jù)操作指令來執(zhí)行對應的操作功能。語音軟件開發(fā)模塊130可根據(jù)語義數(shù)據(jù)庫136而解析出語音信號中的請求信息。具體來說,應用程序122、124及126會提供操作參數(shù)至語音軟件開發(fā)模塊130,而語音軟件開發(fā)模塊130可將語音接收單元110所接收的語音信號根據(jù)語義數(shù)據(jù)庫136進行解析,而獲得語音識別結(jié)果,并且判斷此語音識別結(jié)果是否符合應用程序122、124及126所提供的操作參數(shù)。倘若此語音識別結(jié)果符合操作參數(shù),則語音軟件開發(fā)模塊130會通過通知接口134來輸出對應于語音識別結(jié)果的操作指令至應用程序122、124及126。其中,操作指令具有對應于音信號中的請求信息的命令,因此應用程序122、124及126接收操作指令,可執(zhí)行對應的操作功能。舉例來說,當語音軟件開發(fā)模塊130所產(chǎn)生的操作指令為「Previous」時,表示控制應用程序執(zhí)行翻上一頁的動作?;蛘撸敳僮髦噶顬椤窯oto,3」時,表示控制應用程序執(zhí)行翻到第“3”頁的動作?;蛘?,當操作指令為「Brighter」時,表示控制應用程序執(zhí)行將顯示器的亮度調(diào)亮一點的動作。或者,當操作指令為「Darker」時,表示控制應用程序執(zhí)行將顯示器的亮度調(diào)暗一點的動作?;蛘撸敳僮髦噶顬椤窩olorful」時,表示控制應用程序執(zhí)行將顯示器的亮度調(diào)鮮艷一點的動作。上述的操作指令為舉例說明,本實施例的操作指令并不限于此。在此說明的是,上述的操作指令例如是應用程序122、124及126可執(zhí)行的文件或程序檔,例如是具有「*exe」、「*lib」或「*obj」文檔格式的文檔。因此,當語音識別結(jié)果符合應用程序122、124及126至少其中之一所提供的操作參數(shù)時,語音軟件開發(fā)模塊130可根據(jù)此語音識別結(jié)果產(chǎn)生對應的操作指令,并傳送至移動終端裝置100中對應的應用程序,使得此應用程序載入并執(zhí)行這個操作指令,藉以控制這個應用程序。值得一提的是,開發(fā)者或使用者也可自行定義語音軟件開發(fā)模塊130的功能函數(shù),來對移動終端裝置100進行語音命令控制或?qū)υ挕T诖?,開發(fā)者可定義語音軟件開發(fā)模塊130依據(jù)語音識別結(jié)果,通過通知接口134傳送定義的操作指令至應用程序模塊120,使得應用程序模塊120啟動對應于定義的操作指令的應用程序。舉例來說,開發(fā)者可使語音軟件開發(fā)模塊130根據(jù)具有相同請求信息的語音識別結(jié)果,來輸出一個特定的操作指令至應用程序模塊120,以啟動此特定的操作指令所對應的應用程序,并且使此應用程序執(zhí)行對應于特定的操作指令的操作功能。例如,當使用者說「我看完了」、「換頁」、「下張」或「下一頁」等用以命令瀏覽器應用程序進行切換網(wǎng)頁頁面的語音信號時,語音軟件開發(fā)模塊130可解析出上述的語音信號是包括具有「命令瀏覽器應用程序進行切換頁面」這個請求信息的語音識別結(jié)果,則語音軟件開發(fā)模塊130會產(chǎn)生一個特定的操作指令(例如「Next」)(亦即,對應于「命令瀏覽器應用程序進行切換頁面」的這個操作指令)。并且,語音軟件開發(fā)模塊130會將此操作指令傳送至應用程序模塊120中的瀏覽器應用程序,以使瀏覽器應用程序進行切換頁面。又例如,當使用者說「第一頁」、「第一張」、「第一首」等用以命令媒體播放應用程序播放第一個影音文檔時,語音軟件開發(fā)模塊130可解析出上述的語音信號是包括具有「媒體播放應用程序播放第一個影音文檔」這個請求信息的語音識別結(jié)果,則語音軟件開發(fā)模塊130會產(chǎn)生一個特定的操作指令(例如「First」)(亦即,對應于「命令媒體播放應用程序播放第一個影音文檔」的這個操作指令)。并且,語音軟件開發(fā)模塊130會將此操作指令傳送至應用程序模塊120中的媒體播放應用程序,以使媒體播放應用程序播放第一個影音文檔。也就是說,當使用者以多種語音信號來表達同一種請求信息時,語音軟件開發(fā)模塊130便可傳送單一個特定的操作命令至對應的應用程序,而此對應的應用程序可根據(jù)這個特定操作命令來執(zhí)行對應的操作功能。故本實施例的應用程序本身可不需提供語音理解的功能(例如語音識別或語音合成等),而當使用者欲通過語音來操控應用程序時,語音軟件開發(fā)模塊130會解析使用者的語音,藉以判斷是否輸出對應的指令至應用程序。如此一來,當應用程序接收到來自語音軟件開發(fā)模塊130的操作指令時,應用程序可進而執(zhí)行對應的操作功能。換言之,雖然應用程序本身可具備或不具備接收(或解析)語音信號功能,但應用程序載入語音軟件開發(fā)模塊130所產(chǎn)生的操作指令之后,便如同一個具有接收(或解析)語音信號功能的應用程序,藉此,使用者可便利地通過語音的方式來操控應用程序。以下即結(jié)合上述的語音操控系統(tǒng)1000來說明語音操控方法,其中以應用程序122為例來進行說明。圖2是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。請同時參照圖1及圖2,于步驟S202中,應用程序122會提供至少一操作參數(shù)P1至語音軟件開發(fā)模塊130。在本實施例中,應用程序122可通過提供操作參數(shù)P1來呼叫語音軟件開發(fā)模塊130,而當語音軟件開發(fā)模塊130接收到語音信號后可開始進行語音理解。此外,應用程序開發(fā)者可自行設定使用者可能會使用到的應用程序122的操作參數(shù),使得應用程序122依據(jù)所述設定的操作參數(shù)來提供至語音軟件開發(fā)模塊130。上述操作參數(shù)P1例如是應用程序122用以表示其可接收到的命令、文字序列或物件的位置信息等輸入值,例如命令、字串參數(shù)以及位置參數(shù),不限于此。因此,語音軟件開發(fā)模塊130根據(jù)應用程序122所提供的操作參數(shù)P1,可判斷出應用程序122所需要的輸入值是屬于命令、文字序列或位置信息。舉例來說,假設應用程序122為瀏覽器應用程序,則應用程序122所提供的操作參數(shù)P1例如是對應于「上一頁」、「下一頁」、「放大頁面」或「縮小頁面」等命令,不限于此。假設應用程序122為筆記本應用程序,則應用程序122所提供的操作參數(shù)P1例如是對應于「新增筆記」、「刪除筆記」等命令,或者是對應于讀取文字序列的字串參數(shù),不限于此。此外,假設應用程序122為郵件應用程序,則應用程序122所提供的操作參數(shù)P1例如是對應于「新增郵件」等命令、對應于讀取文字序列的字串參數(shù),或者是上載文檔時所需的文檔的位置參數(shù),不限于此。接著,于步驟S204中,移動終端裝置100會通過語音接收單元110接收語音信號,并傳送至語音軟件開發(fā)模塊130。其中語音軟件開發(fā)模塊130會解析語音信號以獲得語音識別結(jié)果,且當語音識別結(jié)果符合操作參數(shù)P1時,語音軟件開發(fā)模塊130根據(jù)語音識別結(jié)果提供操作指令S。上述的語音信號例如是來自使用者所說的語音,且語音信號具有使用者的請求信息。具體而言,來自使用者的語音信號可以是命令句或詢問句等,例如「看上一頁」、「放大第三行第四列」、「聲音稍微大一點」、「把照片發(fā)送到我的微博」、「把這條簡訊發(fā)送給王大同」或「今天會不會下雨?」等等。最后,于步驟S206中,應用程序122會接收操作指令S。在此,由于語音軟件開發(fā)模塊130依據(jù)語音識別結(jié)果中所符合的操作參數(shù)P1來產(chǎn)生不同的操作指令S,藉以控制應用程序122,因此應用程序122載入語音軟件開發(fā)模塊130所產(chǎn)生的操作指令S之后,便如同一個具有接收(或解析)語音信號功能的應用程序122,藉此,使用者可便利地通過語音的方式來操控應用程序122。下面再舉一實施例來詳細說明本實施例的語音操控方法。以下仍結(jié)合上述的語音操控系統(tǒng)1000來說明語音操控方法,其中仍以應用程序122為例來進行說明。圖3是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。請同時參照圖1及圖3,于步驟S302中,語音軟件開發(fā)模塊130會自應用程序122接收至少一操作參數(shù)P1。于步驟S304中,語音軟件開發(fā)模塊130會接收并解析語音信號,以獲得語音識別結(jié)果。在本實施例中,語音軟件開發(fā)模塊130會解析來自使用者的語音信號而獲得語音信號的一個或多個特征語義,并且語音軟件開發(fā)模塊130會根據(jù)這些特征語義來產(chǎn)生語音識別結(jié)果。具體而言,特征語義例如是語音軟件開發(fā)模塊130解析語音信號后所得到的關鍵詞等,而語音軟件開發(fā)模塊130根據(jù)特征語義可獲得使用者的請求信息。舉例來說,當語音信號為「看上一頁」時,語音軟件開發(fā)模塊130經(jīng)解析所獲得的特征語義例如是「『看』、『上一頁』」。又例如,當語音信號為「聲音稍微大一點」時,語音軟件開發(fā)模塊130經(jīng)解析所獲得的特征語義例如是「『聲音』、『稍微』、『大一點』」。或者,當語音信號為「把照片發(fā)送到我的微博」時,語音軟件開發(fā)模塊130經(jīng)解析所獲得的特征語義例如是「『照片』、『發(fā)送到』、『我的微博』」。進一步地說,語音軟件開發(fā)模塊130可依據(jù)特征語義自語義數(shù)據(jù)庫136查詢此特征語義對應的類別,其中類別例如是命令、物件、時間、文字序列或位置信息等。更具體而言,語義數(shù)據(jù)庫136可記錄有特征語義與對應的類別的關系。因此,語音軟件開發(fā)模塊130可根據(jù)語義數(shù)據(jù)庫136而解析出語音信號中的請求信息,據(jù)以做為語音識別結(jié)果。舉例來說,當語音信號為「看上一頁」時,語音軟件開發(fā)模塊130會先解析出特征語義分別為「『看』、『上一頁』」,接著,語音軟件開發(fā)模塊130可根據(jù)語義數(shù)據(jù)庫136而判斷出「『看』、『上一頁』」是使移動終端裝置100執(zhí)行「將網(wǎng)頁回到上一頁」的命令。又例如,當語音信號為「聲音稍微大一點」時,語音軟件開發(fā)模塊130會先解析出特征語義分別為「『聲音』、『稍微』、『大一點』」,且語音軟件開發(fā)模塊130可根據(jù)語義數(shù)據(jù)庫136而判斷出此語音信號,是使移動終端裝置100執(zhí)行「調(diào)升音量」的命令。接后,于步驟S306中,語音軟件開發(fā)模塊130會判斷語音識別結(jié)果是否符合操作參數(shù)P1。具體來說,本實施例的語義數(shù)據(jù)庫136也可儲存特征語義所對應的類別與操作參數(shù)之間的關系,例如,語義數(shù)據(jù)庫136可記錄特征語義所對應的類別是對應于哪一種操作參數(shù)。因此,語音軟件開發(fā)模塊130便可藉由查詢語義數(shù)據(jù)庫136,來判斷出語音識別結(jié)果是否符合操作參數(shù)P1。舉例來說,當應用程序122提供給語音軟件開發(fā)模塊130的操作參數(shù)P1包括「調(diào)升音量」、「調(diào)降音量」、「靜音」、「調(diào)升亮度」或「調(diào)降亮度」,而語音識別結(jié)果為使移動終端裝置100執(zhí)行「調(diào)升音量」的命令時,語音軟件開發(fā)模塊130則會判斷「調(diào)升音量」這個命令,是否符合「調(diào)升音量」、「調(diào)降音量」、「靜音」、「調(diào)升亮度」或「調(diào)降亮度」這些操作參數(shù)P1的其中之一。當語音軟件開發(fā)模塊130判斷語音識別結(jié)果符合操作參數(shù)時,則如步驟S308所示,語音軟件開發(fā)模塊130會根據(jù)語音識別結(jié)果,提供操作指令S至應用程序122。詳細而言,由于語音軟件開發(fā)模塊130可提供不同的功能函數(shù),而這些功能函數(shù)可接收不同的輸入值以產(chǎn)生對應的輸出,因此依據(jù)不同的語音識別結(jié)果中所符合的操作參數(shù)P1,語音軟件開發(fā)模塊130會產(chǎn)生不同的操作指令S。在本實施例中,語音軟件開發(fā)模塊130所提供的功能函數(shù)可根據(jù)開發(fā)者或使用者而被定義,亦即,開發(fā)者或使用者可定義語音軟件開發(fā)模塊130依據(jù)不同的語音識別結(jié)果,而產(chǎn)生語音識別結(jié)果所對應的操作指令S。藉此,當語音識別結(jié)果符合操作參數(shù)P1時,語音軟件開發(fā)模塊130可將所產(chǎn)生的操作指令S,傳送至提供操作參數(shù)P1的應用程序122,進而通過操作指令S來操控應用程序122。在本實施例中,應用程序接收到操作指令S之后,可依據(jù)操作指令S而執(zhí)行對應的操作功能。由于操作功能是對應于應用程序所提供的操作參數(shù),因此語音軟件開發(fā)模塊130會通過操作指令S來操控應用程序122,使應用程序122執(zhí)行對應于操作參數(shù)P1的操作功能。舉例而言,當語音識別結(jié)果為使移動終端裝置100執(zhí)行「調(diào)升音量」的命令,且此命令符合操作參數(shù)P1時,移動終端裝置100則會產(chǎn)生對應于「調(diào)升音量」的操作指令S,并將此操作指令S傳送至應用程序122,使應用程序122進行音量的調(diào)升。值得一提的是,應用程序122接收到操作指令S之后,可依據(jù)應用程序122目前的狀態(tài),以判斷是否進行操作指令S所對應的操作功能。舉例而言,倘若應用程序判斷移動終端裝置100目前的音量已達最大值,則應用程序122不會依據(jù)操作指令S而對音量進行調(diào)升。返回步驟S306,當語音軟件開發(fā)模塊130判斷語音識別結(jié)果不符合操作參數(shù)P1時,則如步驟S310所示,語音軟件開發(fā)模塊130會依據(jù)語音識別結(jié)果傳送預設指令至應用程序模塊124,使其依據(jù)預設指令啟動另一應用程序并接收此預設指令。舉例來說,當語音信號為「明天會下雨嗎?」(其語音識別結(jié)果例如是使移動終端裝置100執(zhí)行查詢天氣的命令),倘若應用程序122未提供對應于「查詢天氣」的操作參數(shù)P1至語音軟件開發(fā)模塊130,則語音軟件開發(fā)模塊130便會判斷語音識別結(jié)果不符合操作參數(shù)P1。在此,語音軟件開發(fā)模塊130會傳送預設指令至應用程序模塊124,而應用程序模塊124便會啟動搜尋引擎應用程序(例如在移動終端裝置100的屏幕上顯示搜尋引擎應用程序),以查詢明天的天氣。如此一來,若使用者所啟動的應用程序122未提供符合語音識別結(jié)果的操作參數(shù)P1,移動終端裝置100可自動傳送預設指令至符合語音識別結(jié)果的應用程序。為了詳細說明本實施例的語音操控方法,下面舉一實施例來詳細說明。假設使用者啟動應用程序122,此應用程序122例如為瀏覽器應用程序。首先,應用程序122會提供「看上一頁」、「看下一頁」、「放大頁面」或「縮小頁面」等類別為命令的操作參數(shù)P1至語音軟件開發(fā)模塊130。接著,若使用者的語音信號為「看上一頁」,則語音軟件開發(fā)模塊130解析此語音信號后,可判斷出這個語音信號是使應用程序122執(zhí)行回到上一個網(wǎng)頁的命令(即語音識別結(jié)果)。由于此語音識別結(jié)果符合「看上一頁」這個操作參數(shù)P1,因此語音軟件開發(fā)模塊130會傳送操作指令S至應用程序122,其中操作指令S用以操控應用程序122執(zhí)行回到上一個網(wǎng)頁的動作。如此一來,使用者可通過語音的方式,來操控應用程序122返回上一個網(wǎng)頁。在另一實施例中,語音軟件開發(fā)模塊130在提供操作指令S至應用程序122時,還可將語音信號中所對應的文字序列傳送至應用程序122,使得應用程序122讀取語音信號中所對應的文字序列,并使應用程序122依據(jù)此文字序列來執(zhí)行對應于操作指令S的操作功能。下面即結(jié)合圖1的語音操控系統(tǒng)1000與圖3的語音操控方法各步驟,并以應用程序122為例來進行說明。首先,語音軟件開發(fā)模塊130會自應用程序122接收至少一操作參數(shù)P1(步驟S302)。接著,語音軟件開發(fā)模塊130會接收并解析此語音信號,以獲得語音識別結(jié)果(步驟S304)。語音軟件開發(fā)模塊130在判斷語音識別結(jié)果是否符合操作參數(shù)P1時(步驟S306),語音軟件開發(fā)模塊130可進一步判斷應用程序122所提供的操作參數(shù)P1是否具有字串參數(shù),亦即判斷應用程序122所需要的輸入值是否屬于文字序列。詳細而言,當應用程序122所提供的操作參數(shù)P1具有字串參數(shù)時,語音軟件開發(fā)模塊130可將解析后的語音信號視為文字序列,并依據(jù)此文字序列提供操作指令S至應用程序122。此外,于一實施例中,語音軟件開發(fā)模塊130可進一步判斷語音識別結(jié)果中是否具有對應于字串參數(shù)的文字序列。在此,倘若語音軟件開發(fā)模塊130判斷語音識別結(jié)果中有對應于字串參數(shù)的文字序列,則語音軟件開發(fā)模塊130在提供操作指令S至應用程序122時(步驟S308),會將語音識別結(jié)果中的文字序列傳送至提供的應用程序122。另一方面,倘若語音軟件開發(fā)模塊130判斷語音識別結(jié)果不具有對應于字串參數(shù)的文字序列,語音軟件開發(fā)模塊130不會將此文字序列傳送至應用程序122?;蛘撸斦Z音軟件開發(fā)模塊130判斷語音識別結(jié)果不符操作參數(shù)P1時,語音軟件開發(fā)模塊130不會傳送操作指令S至應用程序,或者傳送預設指令至另一應用程序(步驟S310)。如此一來,使用者不僅可通過語音來操控應用程序,且亦可操控應用程序122讀取語音中對應的文字序列。舉例來說,假設應用程序122為筆記本應用程序,則當使用者啟動應用程序122時(例如點選應用程序122或者通過語音方式來喚醒應用程序122),應用程序122會提供「新增筆記」、「刪除筆記」、「修改筆記」、「標記筆記」等類別為命令的操作參數(shù)P1以及類別為字串參數(shù)的操作參數(shù)P1至語音軟件開發(fā)模塊130。上述操作參數(shù)P1為舉例說明,并不限于此。此時,若語音接收單元110接收到使用者的語音信號為「新增筆記,內(nèi)容為『明天下午一點開會』」,則語音軟件開發(fā)模塊130會將語音接收單元110所接收的語音信號進行解析而獲得「『新增』、『筆記』、『內(nèi)容為』、『明天』、『下午』、『一點』、『開會』」這些特征語義。在此,語音軟件開發(fā)模塊130會判斷「『新增』、『筆記』、『內(nèi)容為』」這些特征語義是類別為命令的操作參數(shù)P1(即「新增筆記」),且語音軟件開發(fā)模塊130可判斷出現(xiàn)在「內(nèi)容為」之后的語音信號(即「明天下午一點開會」)為對應于字串參數(shù)的文字序列,即語音識別結(jié)果符合類別為字串參數(shù)的操作參數(shù)P1。之后,語音軟件開發(fā)模塊130會依據(jù)語音識別結(jié)果中相符合的操作參數(shù)P1(即「新增筆記」)傳送操作指令S,以及傳送語音識別結(jié)果中的文字序列(即「明天下午一點開會」)至應用程序122。由于操作指令S是對應于「新增筆記」這個操作參數(shù),因此應用程序122會新增一個筆記數(shù)據(jù),并且在此筆記中記錄「明天下午一點開會」這個文字序列。如此一來,使用者可直接通過語音的方式,命令應用程序122讀取使用者說的語音所對應的文字序列。在另一實施例中,上述語音軟件開發(fā)模塊130在提供操作指令S至應用程序122時,還可將語音信號中所指的物件的位置信息傳送給應用程序122,使得應用程序122可取得此物件所在的物件路徑。下面即結(jié)合圖1的語音操控系統(tǒng)1000與圖3的語音操控方法各步驟,并以應用程序122為例來進行說明。首先,語音軟件開發(fā)模塊130會自應用程序122接收至少一操作參數(shù)P1(步驟S302)。接著,語音軟件開發(fā)模塊130會接收并解析此語音信號,以獲得語音識別結(jié)果(步驟S304)。語音軟件開發(fā)模塊130在判斷語音識別結(jié)果是否符合操作參數(shù)P1時(步驟S306),可進一步判斷應用程序122所提供的操作參數(shù)P1是否具有位置參數(shù),亦即判斷應用程序122所需要的輸入值是否屬于路徑(例如地址或網(wǎng)址等)。并且,語音軟件開發(fā)模塊130會進一步判斷語音識別結(jié)果中所解析出的特征語義是否具有位置信息。在此說明的是,若語音軟件開發(fā)模塊130解析語音信號而識別出物件,則上述所指的位置信息指的是表示此物件相對于應用程序122的位置。舉例來說,若應用程序122為影像瀏覽應用程序,則其位置信息可以是指應用程序122顯示當前的影像的位置(例如應用程序122的顯示畫面中的中間區(qū)域)。又例如,位置信息可以是指應用程序122顯示部分區(qū)域的位置,不限上述。在本實施例中,語音軟件開發(fā)模塊130解析語音信號時,可查詢語義數(shù)據(jù)庫136來獲取位置信息。具體來說,本實施例的語義數(shù)據(jù)庫136中可記錄位置關鍵詞與位置信息的關系,其中位置關鍵詞例如是使用者指稱此物件時所說的關鍵詞。例如,若使用者正在操作影像瀏覽應用程序并開啟多個影像,則上述的位置關鍵詞例如是「這張」、「全部」或「左上角」等。在此,語義數(shù)據(jù)庫136可記錄哪些位置關鍵詞是對應于應用程序122所指的哪個位置。例如,當位置關鍵詞為「這張」時,語義數(shù)據(jù)庫136會記錄「這張」是對應于應用程序122在其顯示畫面當前所顯示的影像,而此影像例如是位于應用程序122的顯示畫面中的中間區(qū)域。又例如,當位置關鍵詞為「左上角」時,語義數(shù)據(jù)庫136會記錄「左上角」是對應于應用程序122在其顯示畫面的左上角所顯示的影像。藉此,根據(jù)語音信號中所述物件的位置關鍵詞,語音軟件開發(fā)模塊130可判斷出語音信號中所指的物件是位在相對于應用程序122的哪個位置(即物件的位置信息)。在本實施例中,當語音識別結(jié)果具有位置信息,則語音軟件開發(fā)模塊130會依據(jù)位置信息取得物件的物件路徑。物件路徑是表示此物件的位置來源(例如物件所在的地址或網(wǎng)址等)。舉例來說,對于儲存在移動終端裝置100的物件來說,其物件路徑例如是物件的文檔路徑。對于因特網(wǎng)中的物件來說,其物件路徑例如是開啟此物件的網(wǎng)址。換言之,語音軟件開發(fā)模塊130可根據(jù)位置信息而取得應用程序122中的物件的物件路徑。如此一來,當應用程序122所提供的操作參數(shù)P1具有位置參數(shù),且語音軟件開發(fā)模塊130判斷語音識別結(jié)果符合應用程序122所提供的操作參數(shù)P1時(即語音識別結(jié)果中具有對應于位置參數(shù)的位置信息),語音軟件開發(fā)模塊130會提供操作指令S至應用程序122,使應用程序122取得對應于位置信息的物件路徑,并根據(jù)物件路徑取得物件。值得一提的是,由于語音軟件開發(fā)模塊130解析語音信號后,可獲得不同的特征語義,因此依據(jù)特征語義,語音軟件開發(fā)模塊130可判斷語音信號中所指的目標信息,其中目標信息中具有目標端的信息。藉此,語音軟件開發(fā)模塊130可提供操作指令S至應用程序122,使得應用程序122根據(jù)上述物件路徑取得物件,以及依據(jù)目標信息將此物件傳送至目標端。下面再舉一例來進行說明。假設應用程序122為影像瀏覽應用程序,則使用者在啟動此應用程序122來瀏覽影像時,應用程序122會將「新增影像」、「刪除影像」、「傳送影像」或「編輯影像」等這些操作參數(shù)P1傳送至語音軟件開發(fā)模塊130。若使用者所說的語音信號為「把當前的照片傳送到我的微博」,語音軟件開發(fā)模塊130可從語音信號解析出「『當前的』、『照片』、『傳送到』、『我的微博』」這些特征語義。在此,由于語義數(shù)據(jù)庫136中可記錄特征語義所對應的關鍵詞與命令、位置信息或目標信息等之間的關系,因此語音軟件開發(fā)模塊130會根據(jù)特征語義所對應的關鍵詞,而解析出哪些特征語義是對應于命令、哪些特征語義是對應于物件的位置信息,或者哪些特征語義是對應于目標信息的這些語音識別結(jié)果。故對于上述的語音信號而言,語音軟件開發(fā)模塊130可解析出「當前的」為位置信息,「照片」為物件,「傳送到」為命令,以及「我的微博」為目標信息。亦即,語音軟件開發(fā)模塊130解析語音信號所得到的語音識別結(jié)果符合應用程序122所提供的操作參數(shù)P1(即「傳送影像」),且語音識別結(jié)果中所解析出的特征語義是對應于物件、位置信息以及目標信息。接著,語音軟件開發(fā)模塊130可傳送操作指令S至應用程序122(步驟S308),其中操作指令S具有上述命令、物件的位置信息以及目標信息。因此,應用程序122會依據(jù)位置信息(即「當前的」)取得物件的物件路徑(例如是照片儲存在移動終端裝置100的文檔路徑,或者應用程序122開啟此照片的網(wǎng)址),并將物件傳送到目標端(即「我的微博」)。如此一來,使用者可直接通過語音的方式,命令應用程序122取得物件的物件路徑,藉以執(zhí)行應用程序122的操作功能。值得一提的是,當語音軟件開發(fā)模塊130判斷語音識別結(jié)果不符合操作參數(shù)時,語音軟件開發(fā)模塊130可根據(jù)語音識別結(jié)果,提供操作指令S至符合語音識別結(jié)果的另一應用程序,進而操控所述另一應用程序執(zhí)行對應于操作指令S的操作功能。下面再舉一實施例來進行說明。圖4是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。請同時參照圖1、圖3與圖4,本實施例的語音操控方法與圖3的步驟相似(圖4的步驟S402~S408對應于圖3的步驟S302~S308),其不同之處在于:于圖4的步驟S406中,當語音軟件開發(fā)模塊130判斷語音識別結(jié)果不符合操作參數(shù)P1時,則如步驟S410所示,語音軟件開發(fā)模塊130會判斷語音識別結(jié)果是否符合其他應用程序(例如為應用程序124)所提供的操作參數(shù)P2,其中應用程序124例如是已被使用者啟動而在背景模式中執(zhí)行。當語音軟件開發(fā)模塊130判斷語音識別結(jié)果符合應用程序124所提供的操作參數(shù)P2時,則如步驟S412所示,語音軟件開發(fā)模塊130會提供操作指令S至應用程序124,進而使應用程序124執(zhí)行對應的操作功能。反之,當語音軟件開發(fā)模塊130判斷語音識別結(jié)果不符合應用程序122、124及其他應用程序所提供的操作參數(shù)時,則如步驟S414所示,語音軟件開發(fā)模塊130會自因特網(wǎng)下載符合語音識別結(jié)果的應用程序(例如為應用程序126),其中應用程序126可提供符合語音識別結(jié)果的操作參數(shù)P3。并且,語音軟件開發(fā)模塊130會提供操作指令S至應用程序126,使應用程序126執(zhí)行對應的操作功能。下面再舉一例來進行說明。在此,假設使用者所說的語音信號為「把當前的照片傳送到我的微博」,其中語音軟件開發(fā)模塊130解析語音信號所獲得的語音識別結(jié)果具有「傳送到」這個命令。并且,假設應用程序122提供至語音軟件開發(fā)模塊130的操作參數(shù)P1不具有對應于「傳送到」這個操作參數(shù)。在本實施例中,語音軟件開發(fā)模塊130會判斷其他應用程序所提供的操作參數(shù)是否具有對應于「傳送到」這個命令的這個操作參數(shù)。倘若應用程序124已被使用者啟動而已提供符合「傳送到」這個命令的操作參數(shù)P2至語音軟件開發(fā)模塊130,則語音軟件開發(fā)模塊130會提供操作指令S至應用程序124。另一方面,倘若應用程序122、124或其他應用程序未提供對應于「傳送到」這個命令的這個操作參數(shù)至語音軟件開發(fā)模塊130,則語音軟件開發(fā)模塊130會依據(jù)「傳送到」這個命令,自因特網(wǎng)下載可提供符合「傳送到」的操作參數(shù)的應用程序126。藉此,語音軟件開發(fā)模塊130便可提供操作指令S至應用程序126。如此一來,語音軟件開發(fā)模塊130可依據(jù)解析語音信號所獲得的語音識別結(jié)果,自動判斷符合語音識別結(jié)果的操作參數(shù)所對應的應用程序,并將操作指令傳送至應用程序,藉以讓使用者可更方便的通過語音的方式來操控應用程序。需說明的是,上諸實施例中的語音軟件開發(fā)模塊130也可配置于移動終端裝置上,據(jù)以實現(xiàn)本發(fā)明的語音操控方法。下面再舉一實施例來進行說明。圖5是依照本發(fā)明一實施例所繪示的移動終端裝置500的方塊圖。請參照圖5與圖1,移動終端裝置500與圖1的移動終端裝置100相似,惟不同之處在于:語音軟件開發(fā)模塊530是配置于移動終端裝置500中。本實施例的移動終端裝置500亦可執(zhí)行圖2的步驟S202~S206、圖3的步驟S302~S310與圖4的步驟S402~S414,故其詳細內(nèi)容在此不再贅述。值得一提的是,上諸實施例中的語音軟件開發(fā)模塊也可結(jié)合其他具有應用程序的電子裝置進行運作,或者配置于此電子裝置中,而此電子裝置例如是電器設備,例如:洗衣機、洗碗機、冷機機、吸塵器、電視機、冰箱等等,不限于上述。也就是說,使用者可直接通過語音來控制電子裝置執(zhí)行對應的操作功能。具體而言,上述電子裝置提供一個語音接收裝置,比如麥克風;一個網(wǎng)絡連接裝置以及一個存儲有應用程序的存儲裝置即可。其中的應用程序可提供操作參數(shù)至語音軟件開發(fā)模塊(例如,語音軟件開發(fā)模塊可以伺服器端,通過WiFi(WirelessFidelity)通訊協(xié)定與電子裝置連接,或者直接置于上述電子裝置的上述存儲裝置中),而當使用者提供語音信號時,語音軟件開發(fā)模塊便可接收并解析此語音信號以獲得語音識別結(jié)果。倘若語音軟件開發(fā)模塊判斷此語音識別結(jié)果符合應用程序所提供的操作參數(shù),則可產(chǎn)生操作指令并傳送至對應的應用程序,進而使應用程序執(zhí)行對應的操作功能。舉例來說,對于冷氣機而言,冷氣機中的應用程序可提供對應于「調(diào)高溫度」這個操作參數(shù)至語音軟件開發(fā)模塊,而當使用者說「溫度調(diào)高一點」這個語音信號時,語音軟件開發(fā)模塊便可判斷此語音信號是對應于「調(diào)高溫度」這個操作參數(shù),故會產(chǎn)生對應的操作指令至冷氣機中的應用程序,而冷氣機中的應用程序載入此操作參數(shù)之后,便可會將冷氣機的設定溫度調(diào)升。如此一來,對于一般具有簡易功能或特殊功能的電器設備而言,電器設備只需要接收語音軟件開發(fā)模塊所產(chǎn)生的操作指令,便可根據(jù)使用者的語音來運作。藉此,使用者可方便地通過語音的方式來操控電器設備。綜上所述,在本發(fā)明的語音操控方法、移動終端裝置以及語音操控系統(tǒng)中,應用程序會提供操作參數(shù)至語音軟件開發(fā)模塊,而語音軟件開發(fā)模塊會解析來自使用者的語音信號而獲得語音識別結(jié)果。在此,語音軟件開發(fā)模塊會判斷語音識別結(jié)果是否符合操作參數(shù),因此當語音識別結(jié)果符合時,語音軟件開發(fā)模塊則會提供操作指令至所述應用程序。其中,語音軟件開發(fā)模塊可依據(jù)語音識別結(jié)果中的命令、文字序列、物件的位置信息等請求訊息傳送至所述應用程序,使此應用程序執(zhí)行對應于操作指令的操作功能。由于語音軟件開發(fā)模塊會進行語音識別,據(jù)以提供指令來操控應用程序,因此應用程序在不進行語音理解(例如語音識別或者語音合成)的情況下,亦可執(zhí)行使用者的語音信號所對應的操作功能。如此一來,通過語音軟件開發(fā)模塊,本發(fā)明可讓使用者以語音的方式來操控應用程序,進而可執(zhí)行各種應用程序所提供的動作與工作,藉以提升使用移動終端裝置的便利性。雖然本發(fā)明已以實施例揭示如上,然其并非用以限定本發(fā)明,本領域技術人員,在不脫離本發(fā)明的精神和范圍的前提下,可作些許的更動與潤飾,故本發(fā)明的保護范圍是以本發(fā)明的權利要求為準。當前第1頁1 2 3 當前第1頁1 2 3 
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1