一種語音控制方法和裝置與流程

文檔序號(hào)：12128591閱讀：236來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及語音控制技術(shù)領(lǐng)域，尤其涉及一種語音控制方法和裝置。

背景技術(shù)：

語音控制廣泛應(yīng)用于手機(jī)等電子設(shè)備。例如，中國發(fā)明專利申請(qǐng)CN201410318412.X即公開了一種用手機(jī)語音控制軟件對(duì)應(yīng)用程序進(jìn)行具體控制的方法，包括：打開語音控制軟件，對(duì)手機(jī)說出語音控制命令，語音識(shí)別模塊通過互聯(lián)網(wǎng)的云平臺(tái)對(duì)聲音進(jìn)行識(shí)別是否為可識(shí)別的語音，命令識(shí)別模塊識(shí)別是否為命令庫中經(jīng)學(xué)習(xí)并保存的語音控制命令，命令控制模塊執(zhí)行該語音控制命令操作相應(yīng)的手機(jī)應(yīng)用程序。

然而，雖然現(xiàn)有的語音控制系統(tǒng)和方法很多，但都需要聯(lián)網(wǎng)達(dá)到智能語音控制的目的，例如蘋果的siri，用戶發(fā)出打開照片或者打開相冊(cè)的語音命令，設(shè)備收到語音后，將這些語音編碼，并轉(zhuǎn)換成一個(gè)壓縮數(shù)字文件，被轉(zhuǎn)入用戶所使用移動(dòng)運(yùn)營(yíng)商的基站當(dāng)中，然后再通過一系列固定電線發(fā)送至用戶的互聯(lián)網(wǎng)服務(wù)供應(yīng)商(ISP)。該ISP擁有云計(jì)算服務(wù)器，通過內(nèi)置的系列模塊，將通過技術(shù)手段來識(shí)別用戶剛才說過的內(nèi)容。計(jì)算機(jī)將根據(jù)所識(shí)別詞匯的可信度級(jí)別，而創(chuàng)建一個(gè)用戶所說內(nèi)容的列表，從而具體分析用戶語音表述中最有可能會(huì)表達(dá)何種意思。如果上述分析和判斷結(jié)果已具有足夠的可信度，那么計(jì)算機(jī)將能理解用戶所說的內(nèi)容：比如計(jì)算機(jī)得出結(jié)論，用戶是要求手機(jī)發(fā)送短信或查找聯(lián)系人列表中的某個(gè)聯(lián)系人。在經(jīng)過上述一系列后臺(tái)處理后，用戶將會(huì)看到手機(jī)屏幕上出現(xiàn)所需的內(nèi)容，而不必進(jìn)行手動(dòng)操作。在此過程中，如果用戶的語音含義過于模糊，計(jì)算機(jī)就會(huì)詢問用戶，以了解用戶希望查找的聯(lián)系人究竟是，例如，埃里卡·奧爾森(Erica Olssen)，還是埃里卡·施密特(Erica Schmidt)。

以上是siri的智能語音操作原理，但由于過程復(fù)雜常常無法達(dá)到預(yù)期效果。而且，語音指令完成后就無法繼續(xù)進(jìn)行進(jìn)一步地語音控制操作，例如，用戶輸入“siri打開地圖”的語音指令，手機(jī)能很開的打開地圖app，但之后無法在繼續(xù)其他語音控制操作，即之后的操作只能是手動(dòng)操作，很不方便。

其次，日常使用終端設(shè)備都是利用觸屏，用戶很熟悉操作方法，而利用語音操作，智能語音系統(tǒng)往往無法完成一些簡(jiǎn)單的操作。例如，微信APP中，瀏覽朋友圈時(shí)，只需打開微信，點(diǎn)擊發(fā)現(xiàn)，再點(diǎn)擊朋友圈即可。然而，現(xiàn)有的智能語音系統(tǒng)均無法實(shí)現(xiàn)該功能。智能語音系統(tǒng)若想實(shí)現(xiàn)對(duì)所有應(yīng)用程序各種功能的操作需要龐大的云計(jì)算服務(wù)器，這基本是不可能的。此外，對(duì)于智能語音系統(tǒng)現(xiàn)有的較為成熟的功能，比如“打電話給誰、打開某個(gè)程序等”，平時(shí)很少有人用，用的時(shí)候也不一定成功，所以實(shí)用性不強(qiáng)。

技術(shù)實(shí)現(xiàn)要素：

有鑒于此,本發(fā)明提供一種語音控制方法及控制裝置，解決現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。

根據(jù)本發(fā)明的第一方面，提供一種用于終端設(shè)備的語言控制方法，包括：語音指令識(shí)別步驟，接收并識(shí)別語音指令；語音指令解析步驟，根據(jù)所識(shí)別的語音指令，通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較，將識(shí)別的所述語音指令分解為操作和對(duì)象要素；以及指令執(zhí)行步驟，根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象，在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行；其中，所述操作指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。

進(jìn)一步地，語音指令解析步驟中，將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比，如果語音指令中包含有所述預(yù)設(shè)的指令操作，就將語音指令分解為操作和對(duì)象要素。

進(jìn)一步地，所述指令執(zhí)行步驟包括：

第一判斷步驟，判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中，是否包括對(duì)象要素；以及

操作執(zhí)行步驟，存在對(duì)象要素時(shí)，在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象，并對(duì)搜索到的對(duì)象執(zhí)行所述操作。

進(jìn)一步地，所述操作執(zhí)行步驟具體包括：

搜索步驟，在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象；

第二判斷步驟，判斷搜索到的對(duì)象是否唯一；以及

提示步驟，當(dāng)搜索到的對(duì)象不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。

進(jìn)一步地，語音指令解析步驟中，進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素，所述限定為對(duì)所述內(nèi)容進(jìn)行限定，該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分；

所述操作執(zhí)行步驟中，當(dāng)存在對(duì)象要素時(shí)，進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素，在當(dāng)前頁面中搜索所述內(nèi)容，并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。

搜索步驟中，在該頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容；

在第二判斷步驟中，判斷搜索到的所述內(nèi)容是否唯一；以及

提示步驟中，當(dāng)搜索到的內(nèi)容不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。

進(jìn)一步地，所述操作執(zhí)行步驟還包括：

操作執(zhí)行子步驟，當(dāng)搜索到的內(nèi)容唯一時(shí)，在當(dāng)前頁面針對(duì)該搜索到的內(nèi)容執(zhí)行所述操作。

進(jìn)一步地，當(dāng)用戶給出進(jìn)一步的語音指令時(shí)，則返回所述語音指令識(shí)別步驟，再次進(jìn)行該語音命令的處理，以執(zhí)行所述更具體的語音指令。

進(jìn)一步地，所述操作執(zhí)行子步驟還包括：第三判斷步驟，在存在所述對(duì)象要素時(shí)，進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素；

所述操作執(zhí)行子步驟中，在第三判斷步驟的判斷結(jié)果為是的情況下，在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容，并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。

進(jìn)一步地，所述操作執(zhí)行步驟還包括，不存在對(duì)象要素時(shí)，在該頁面直接執(zhí)行所述操作。

根據(jù)本發(fā)明的第二方面，提供一種用于終端設(shè)備的語言控制裝置，包括：語音指令識(shí)別模塊，用于接收并識(shí)別語音指令；語音指令解析模塊，用于根據(jù)所識(shí)別的語音指令，通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較，將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素；以及指令執(zhí)行模塊，用于根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象，在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行；其中，所述操作指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。

進(jìn)一步地，所述語音指令解析模塊將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比，如果語音指令中包含有所述預(yù)設(shè)的指令操作，就將語音指令分解為操作和對(duì)象要素。

進(jìn)一步地，所述指令執(zhí)行模塊包括：

第一判斷模塊，用于判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中，是否包括對(duì)象要素；以及

操作執(zhí)行模塊，用于存在對(duì)象要素時(shí)，在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象，并對(duì)搜索到的對(duì)象執(zhí)行所述操作。

進(jìn)一步地，所述操作執(zhí)行模塊具體包括：

搜索模塊，用于在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象；

第二判斷模塊，用于判斷搜索到的對(duì)象是否唯一；以及

提示模塊，用于當(dāng)搜索到的對(duì)象不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。

進(jìn)一步地，語音指令解析模塊進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素，所述限定為對(duì)所述內(nèi)容進(jìn)行限定，該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分；

當(dāng)存在對(duì)象要素時(shí)，所述操作執(zhí)行模塊進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素，在當(dāng)前頁面中搜索所述內(nèi)容，并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。

搜索模塊在該頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容；

第二判斷模塊判斷搜索到的所述內(nèi)容是否唯一；以及

當(dāng)搜索到的內(nèi)容不唯一時(shí)，提示模塊提示用戶給出進(jìn)一步的語音指令。

進(jìn)一步地，所述操作執(zhí)行模塊還包括：

操作執(zhí)行子模塊，當(dāng)搜索到的內(nèi)容唯一時(shí)，在當(dāng)前頁面針對(duì)該搜索到的內(nèi)容執(zhí)行所述操作。

進(jìn)一步地，當(dāng)用戶給出進(jìn)一步的語音指令時(shí)，則所述語音指令識(shí)別模塊再次接收并識(shí)別該更具體的語音指令，以執(zhí)行所述更具體的語音指令。

進(jìn)一步地，所述操作執(zhí)行子模塊還包括：第三判斷模塊，在存在所述對(duì)象要素時(shí)，進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素；

所述操作執(zhí)行子模塊在第三判斷模塊的判斷結(jié)果為是的情況下，在當(dāng)前頁面中對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。

進(jìn)一步地，不存在對(duì)象要素時(shí)，所述操作執(zhí)行模塊在該頁面直接執(zhí)行所述操作。

根據(jù)本發(fā)明的上述方案，根據(jù)本發(fā)明的上述方案，通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素，并在當(dāng)前頁面中執(zhí)行分解的所述語音指令，從而本發(fā)明的語音控制方法由于指令少，并結(jié)合搜索功能，可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作，方便快捷，解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。

以下結(jié)合附圖及具體實(shí)施方式對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步詳細(xì)的描述，本發(fā)明的有益效果將進(jìn)一步明確。

附圖說明

此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解，構(gòu)成本發(fā)明的一部分，用于解釋本發(fā)明，并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。

圖1示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制方法的流程圖。

圖2示出了所述語音控制方法中操作執(zhí)行步驟的流程圖。

圖3示出了本發(fā)明語音控制方法的一優(yōu)選實(shí)施例的流程圖。

圖4示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制裝置的結(jié)構(gòu)框圖。

圖5示出了本發(fā)明語音控制裝置中操作執(zhí)行模塊結(jié)構(gòu)框圖。

具體實(shí)施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明具體實(shí)施例及相應(yīng)的附圖對(duì)本發(fā)明技術(shù)方案進(jìn)行清楚、完整地描述。顯然，所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

首先結(jié)合圖1、圖2以及圖3說明根據(jù)本發(fā)明的語音控制方法。圖1示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制方法的流程圖；圖2示出了根據(jù)本發(fā)明的語音控制方法中操作執(zhí)行步驟的具體流程。圖3示出了本發(fā)明所述語音控制方法的一優(yōu)選的具體實(shí)施例的流程圖。

本發(fā)明的所述語音控制方法用于終端設(shè)備，例如手機(jī)等，如圖1所述，該方法包括：語音指令識(shí)別步驟S1、語音指令解析步驟S2、以及指令執(zhí)行步驟S3。語音指令識(shí)別步驟S1，接收并識(shí)別，例如，用戶發(fā)出的語音指令。語音指令解析步驟S2，根據(jù)所識(shí)別的語音指令，通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較，將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素。指令執(zhí)行步驟S3，根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象，在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。其中，所述操作指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。其中，所述終端設(shè)備預(yù)設(shè)的操作可以包括終端設(shè)備出廠預(yù)設(shè)的對(duì)應(yīng)的觸屏操作，還可包括后期用戶個(gè)性設(shè)置的語音對(duì)應(yīng)操作。

進(jìn)一步地，所述對(duì)象要素可進(jìn)一步被分解為內(nèi)容和限定二個(gè)要素，所述限定為對(duì)所述內(nèi)容進(jìn)行限定，該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分。根據(jù)該限定要素，所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。

以及進(jìn)一步地，所述限定可以為空，或者所述內(nèi)容和所述限定同時(shí)可以為空。

上述語音控制方法可在終端設(shè)備的后臺(tái)運(yùn)行，使用過程中可不彈出其他窗口，在整個(gè)操作過程中都可以接收和處理語音指令。當(dāng)然，也可以在終端的設(shè)備中控制關(guān)閉或打開此語音指令的接收和處理功能，或者設(shè)置打開的時(shí)間段。另外，喚醒所述功能的方式也是可選擇的，可以選擇無需喚醒，也可以選擇聽到某個(gè)聲音后喚醒，這個(gè)聲音可以用戶個(gè)性化設(shè)置，也可以利用重力感應(yīng)喚醒等。

根據(jù)本發(fā)明的上述方案，通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素，并在當(dāng)前頁面中執(zhí)行分解的所述語音指令，從而指令簡(jiǎn)單，易于實(shí)現(xiàn)，無需聯(lián)網(wǎng)即實(shí)現(xiàn)了用戶輸入的指令的語音控制，從而利用語音指令代替手指觸控操作。

以下對(duì)各步驟逐一進(jìn)行描述。

所述語音指令識(shí)別步驟S1，接收并識(shí)別，例如用戶發(fā)出的語音指令。用戶利用終端設(shè)備，例如手機(jī)的麥克風(fēng)輸入語音指令，所述語音指令識(shí)別步驟S1中，接收該語音指令，并對(duì)該語音指令進(jìn)行識(shí)別。具體地，可以下載離線語言包用于語音的識(shí)別，將用戶輸入的語音指令與該語言包中的語音模板進(jìn)行比較，將匹配度最高的作為識(shí)別的結(jié)果。此外，本發(fā)明的該方法中，還可使用除了本機(jī)麥克風(fēng)以外其他語音指令，例如電話、微信等通信軟件的語音。

本發(fā)明中，由于語音指令簡(jiǎn)單，僅在終端設(shè)備上即可完成語音識(shí)別，而無需利用聯(lián)網(wǎng)來實(shí)現(xiàn)語音識(shí)別，從而語音控制簡(jiǎn)便易行。

語音指令解析步驟S2，根據(jù)所識(shí)別的語音指令，將其分解為操作、以及對(duì)象兩個(gè)要素。具體地，將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比，如果語音指令中包含有所述預(yù)設(shè)的指令操作，就將語音指令分解為操作和限定兩部分。如上文所述，其中，所述操作指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。并且進(jìn)一步地，所述語音指令解析步驟S2還包括將所述對(duì)象要素進(jìn)一步分解為內(nèi)容和限定兩個(gè)要素，所述限定為對(duì)所述內(nèi)容進(jìn)行限定，當(dāng)存在與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分時(shí)，就將所述對(duì)象分解為內(nèi)容和限定兩個(gè)要素。根據(jù)該限定要素，所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。所述終端設(shè)備利用數(shù)據(jù)庫存儲(chǔ)所述預(yù)設(shè)的操作、限定等數(shù)據(jù)。并且所述數(shù)據(jù)庫可以通過網(wǎng)絡(luò)更新，主要是各種觸控指令，例如，單擊、拖拽等。并且，包括這些操作的同意表達(dá)方式，也可以通過用戶個(gè)性設(shè)置。類似的，其中所包含的各種限定也可以通過網(wǎng)絡(luò)更新，或由用戶設(shè)置。

操作要素包括“點(diǎn)擊、長(zhǎng)按、滑動(dòng)、多點(diǎn)觸控、多向滑動(dòng)、雙擊、拖拽”等等；內(nèi)容要素包括“文字內(nèi)容、顏色、方位”等等；以及限定要素包括“第一個(gè)、第二個(gè)、第n個(gè)、最上面的、最下面的、黑色的、白色的”等等。舉例而言，語音指令“長(zhǎng)按第一個(gè)確認(rèn)”中，“長(zhǎng)按”為該語音指令要執(zhí)行的動(dòng)作，若為與終端設(shè)備中預(yù)設(shè)的操作相匹配的部分，則被分解為所述操作要素，“第一個(gè)確認(rèn)”則為對(duì)象要素，指示“長(zhǎng)按”的動(dòng)作對(duì)象。進(jìn)一步地，在該對(duì)象要素中，若“第一個(gè)”與終端設(shè)備中預(yù)設(shè)的限定相匹配，則被分解為所述限定要素，剩余部分“確定”則為所述內(nèi)容要素。再例如，語音指令“點(diǎn)擊返回”中，“點(diǎn)擊”為該語音指令中要執(zhí)行的動(dòng)作，若與終端設(shè)備預(yù)設(shè)的操作相匹配，則被分解為所述操作要素，“返回”則為對(duì)象要素。進(jìn)一步地，“返回”被分解為所述內(nèi)容要素，則該語音指令中限定要素為空。又例如，語音指令“滑動(dòng)”中，“滑動(dòng)”為該語音指令要執(zhí)行的動(dòng)作，若為與終端設(shè)備中預(yù)設(shè)的操作相匹配的部分，則被分解為所述操作要素。則該指令中，內(nèi)容要素和限定要素，即所述對(duì)象要素為空。

指令執(zhí)行步驟S3，根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象，在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。具體的，在一個(gè)優(yōu)選實(shí)施例中，所述指令執(zhí)行步驟S3包括：第一判斷步驟S31，判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中，是否包括對(duì)象要素；以及操作執(zhí)行步驟S32，存在對(duì)象要素時(shí)，在該頁面中搜索所述對(duì)象，并對(duì)搜索到的對(duì)象執(zhí)行所述操作。

需要指出的是，所有的所述操作都與觸控操作相對(duì)應(yīng)，并模擬觸控操作反饋的信號(hào)給處理器，并且，本發(fā)明中的語音控制，由于所述操作與常規(guī)觸控操作方法相同，從而用戶更加熟悉。

由以上描述可知，本發(fā)明的語音控制方法由于指令少，并結(jié)合上述搜索功能，可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作，方便快捷。并且，由于所述語音指令的分解過程為與終端設(shè)備中預(yù)設(shè)的操作和對(duì)象等匹配的部分，故無需聯(lián)網(wǎng)進(jìn)行語音識(shí)別和分解等相關(guān)操作，從而語音控制簡(jiǎn)單易行，解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。

如圖2所示，所述操作執(zhí)行步驟S32具體包括：搜索步驟S321，在當(dāng)前頁面搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象；第二判斷步驟S322，判斷搜索到的對(duì)象是否唯一；以及提示步驟S323，當(dāng)搜索到的對(duì)象不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。具體地，當(dāng)搜索結(jié)果不唯一時(shí)，可以高亮所有搜索結(jié)果，和/或語音提示“搜索到n個(gè)相同內(nèi)容”。此時(shí)，等待用戶再次輸入更具體的語音指令，則返回到步驟S1，再次進(jìn)行該語音命令的處理，以執(zhí)行所述更具體的語音指令。例如，用戶輸入“點(diǎn)擊返回”，當(dāng)當(dāng)前頁面存在多個(gè)“返回”時(shí)，高亮顯示多個(gè)搜索到的“返回”，用戶再次輸入更具體的語音命令，例如“點(diǎn)擊第一個(gè)返回”或“點(diǎn)擊返回到桌面”，則返回步驟S1，重新開始該更具體的語音指令的執(zhí)行。所述操作執(zhí)行步驟S32還包括，操作執(zhí)行子步驟S324，用于當(dāng)搜索到的對(duì)象唯一時(shí)，對(duì)所述對(duì)象執(zhí)行所述操作。

進(jìn)一步優(yōu)選地，所述執(zhí)行步驟S32中，當(dāng)存在對(duì)象要素時(shí)，進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素，搜索步驟S321中，在當(dāng)前頁面中搜索所述內(nèi)容，并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。并且，第二判斷步驟S322中，判斷搜索到的所述內(nèi)容是否唯一；以及提示步驟S323中，當(dāng)搜索到的內(nèi)容不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。

更進(jìn)一步地，操作執(zhí)行子步驟S324還包括第三判斷步驟(未示出)，在存在所述對(duì)象要素時(shí)，進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素，是的話則操作執(zhí)行子步驟S324，在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容，并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。以上，搜索到多個(gè)對(duì)象(內(nèi)容)時(shí)，高亮顯示可使用不同顏色，或?qū)Χ鄠€(gè)對(duì)象(內(nèi)容)編序號(hào)，方便用戶進(jìn)一步明確語音指令。

進(jìn)一步地，所述操作執(zhí)行步驟S32還包括，不存在對(duì)象要素時(shí)，在該頁面直接執(zhí)行所述操作。

下面結(jié)合圖3說明本發(fā)明所述語音控制方法的一具體實(shí)施例。如圖3所示，設(shè)用戶輸入的語音指令包括操作、內(nèi)容以及限定三要素。在步驟S1當(dāng)中，接收并識(shí)別該語音指令。在步驟S2中，將所述語音指令分解為操作、限定和內(nèi)容三個(gè)部分。在指令執(zhí)行步驟S3中，根據(jù)所述內(nèi)容要素，在屏幕，即終端設(shè)備的當(dāng)前頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容，并判斷該搜索到的內(nèi)容是否唯一，是的話，則在當(dāng)前頁面中對(duì)所述內(nèi)容所在位置執(zhí)行所述操作。否的話，則高亮搜索到的所有內(nèi)容，并提示用戶給出進(jìn)一步的語音指令，之后返回步驟S1，重新接收并識(shí)別該進(jìn)一步的語音指令，從而對(duì)其進(jìn)行執(zhí)行，由此實(shí)現(xiàn)全過程的語音控制。

以下結(jié)合圖4、圖5說明的語音控制裝置。圖4示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制裝置的結(jié)構(gòu)框圖。圖5示出了根據(jù)本發(fā)明的語音控制裝置中操作執(zhí)行模塊的結(jié)構(gòu)框圖。

本發(fā)明的所述語音控制裝置用于終端設(shè)備，例如手機(jī)等，如圖4所述，該裝置包括：語音指令識(shí)別模塊1、語音指令解析模塊2、以及指令執(zhí)行模塊3。語音指令識(shí)別模塊1用于接收并識(shí)別，例如用戶發(fā)出的語音指令。語音指令解析模塊2用于根據(jù)所識(shí)別的語音指令，將其分解為操作和對(duì)象兩個(gè)要素。指令執(zhí)行模塊3用于根據(jù)所識(shí)別的語音指令，通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較，將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素。其中，所述操作要素指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象要素為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。其中，所述終端設(shè)備預(yù)設(shè)的操作可以包括終端設(shè)備出廠預(yù)設(shè)的對(duì)應(yīng)的觸屏操作，還可包括后期用戶個(gè)性設(shè)置的語音對(duì)應(yīng)操作。

以及進(jìn)一步地，所述限定可以為空，或者所述內(nèi)容和所述限定同時(shí)可以為空。

以下對(duì)各模塊逐一進(jìn)行描述。

所述語音指令識(shí)別模塊1用于接收并識(shí)別，例如用戶發(fā)出的語音指令。用戶利用終端設(shè)備，例如手機(jī)的麥克風(fēng)輸入語音指令，所述語音指令識(shí)別模塊1接收該語音指令，并對(duì)該語音指令進(jìn)行識(shí)別。具體地，可以下載離線語言包用于語音的識(shí)別，將用戶輸入的語音指令與該語言包中的語音模板進(jìn)行比較，將匹配度最高的作為識(shí)別的結(jié)果。此外，本發(fā)明的該方法中，還可使用除了本機(jī)麥克風(fēng)以外其他語音指令，例如電話、微信等通信軟件的語音。本發(fā)明中，由于語音指令簡(jiǎn)單，僅在終端設(shè)備上即可完成語音識(shí)別，而無需利用聯(lián)網(wǎng)來實(shí)現(xiàn)語音識(shí)別，從而語音控制簡(jiǎn)便易行。

語音指令解析模塊2用于根據(jù)所識(shí)別的語音指令，將其分解為操作、以及對(duì)象兩個(gè)要素。具體地，將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比，如果語音指令中包含有所述預(yù)設(shè)的指令操作，就將語音指令分解為操作和限定兩部分。如上文所述，其中，所述操作指示所述語音指令所要執(zhí)行的動(dòng)作，其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分；所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。并且進(jìn)一步地，所述語音指令解析模塊2還用于將所述對(duì)象要素進(jìn)一步分解為內(nèi)容和限定兩個(gè)要素，所述限定為對(duì)所述內(nèi)容進(jìn)行限定，當(dāng)存在與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分時(shí)，就將所述對(duì)象分解為內(nèi)容和限定兩個(gè)要素。根據(jù)該限定要素，所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。所述終端設(shè)備利用數(shù)據(jù)庫存儲(chǔ)所述預(yù)設(shè)的操作、限定等數(shù)據(jù)。并且所述數(shù)據(jù)庫可以通過網(wǎng)絡(luò)更新，主要是各種觸控指令，例如，單擊、拖拽等。并且，包括這些操作的同意表達(dá)方式，也可以通過用戶個(gè)性設(shè)置。類似的，其中所包含的各種限定也可以通過網(wǎng)絡(luò)更新，或由用戶設(shè)置。所述操作、對(duì)象(內(nèi)容、限定)要素，同上文的描述，此處不再贅述

指令執(zhí)行模塊3用于根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象，在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作，從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。具體的，在一個(gè)優(yōu)選實(shí)施例中，所述指令執(zhí)行模塊3包括：第一判斷模塊31用于判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中，是否包括對(duì)象要素；以及操作執(zhí)行模塊32用于存在對(duì)象要素時(shí)，在該頁面中搜索所述對(duì)象，并對(duì)搜索到的對(duì)象執(zhí)行所述操作。

需要指出的是，所有的所述操作都與觸控操作相對(duì)應(yīng)，并模擬觸控操作反饋的信號(hào)給處理器，并且，本發(fā)明中的語音控制，由于所述操作與常規(guī)觸控操作方法相同，從而用戶更加熟悉。并且，由以上描述克制，本發(fā)明的語音控制方法由于指令少，并結(jié)合上述搜索功能，可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作，方便快捷。

如圖5所示，所述操作執(zhí)行模塊32具體包括：搜索模塊321，在該頁面搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象；第二判斷模塊322，用于判斷搜索到的對(duì)象是否唯一；以及提示模塊323，當(dāng)搜索到的對(duì)象不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。具體地，可以當(dāng)搜索結(jié)果不唯一時(shí)，可以高亮所有搜索結(jié)果，和/或語音提示“搜索到n個(gè)相同內(nèi)容”。此時(shí)，等待用戶再次輸入更具體的語音指令，則由語音指令識(shí)別模塊1接收并識(shí)別該具體的語音指令，以便再次進(jìn)行該語音命令的處理，以執(zhí)行所述更具體的語音指令。所述操作執(zhí)行模塊32還包括，操作執(zhí)行子模塊324，用于當(dāng)搜索到的對(duì)象唯一時(shí)，對(duì)所述對(duì)象執(zhí)行所述操作。

進(jìn)一步優(yōu)選地，當(dāng)存在對(duì)象要素時(shí)，所述操作執(zhí)行模塊32進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素，搜索模塊321,在當(dāng)前頁面中搜索所述內(nèi)容，并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。并且，第二判斷模塊322判斷搜索到的所述內(nèi)容是否唯一；以及提示模塊323中，當(dāng)搜索到的內(nèi)容不唯一時(shí)，提示用戶給出進(jìn)一步的語音指令。

更進(jìn)一步地，所述操作執(zhí)行子模塊324還包括第三判斷模塊(未示出)，用于在存在所述對(duì)象要素時(shí)，進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素，是的話，則操作執(zhí)行子模塊324在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容，并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。如上文所述，搜索到多個(gè)對(duì)象(內(nèi)容)時(shí)，高亮顯示可使用不同顏色，或?qū)Χ鄠€(gè)對(duì)象(內(nèi)容)編序號(hào)，方便用戶進(jìn)一步明確語音指令。

進(jìn)一步地，不存在對(duì)象要素時(shí)，所述操作執(zhí)行模塊32在該頁面直接執(zhí)行所述操作。

以上，對(duì)本發(fā)明的語音控制方法和控制裝置進(jìn)行了描述。根據(jù)本發(fā)明的上述方案，根據(jù)本發(fā)明的上述方案，通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素，并在當(dāng)前頁面中執(zhí)行分解的所述語音指令，從而本發(fā)明的語音控制方法由于指令少，并結(jié)合搜索功能，可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作，方便快捷，解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例，并不用于限制本發(fā)明，對(duì)于本領(lǐng)域技術(shù)人員而言，本發(fā)明可以有各種改動(dòng)和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3