本發(fā)明涉及語音控制技術(shù)領(lǐng)域,尤其涉及一種語音控制方法和裝置。
背景技術(shù):
語音控制廣泛應(yīng)用于手機(jī)等電子設(shè)備。例如,中國發(fā)明專利申請(qǐng)CN201410318412.X即公開了一種用手機(jī)語音控制軟件對(duì)應(yīng)用程序進(jìn)行具體控制的方法,包括:打開語音控制軟件,對(duì)手機(jī)說出語音控制命令,語音識(shí)別模塊通過互聯(lián)網(wǎng)的云平臺(tái)對(duì)聲音進(jìn)行識(shí)別是否為可識(shí)別的語音,命令識(shí)別模塊識(shí)別是否為命令庫中經(jīng)學(xué)習(xí)并保存的語音控制命令,命令控制模塊執(zhí)行該語音控制命令操作相應(yīng)的手機(jī)應(yīng)用程序。
然而,雖然現(xiàn)有的語音控制系統(tǒng)和方法很多,但都需要聯(lián)網(wǎng)達(dá)到智能語音控制的目的,例如蘋果的siri,用戶發(fā)出打開照片或者打開相冊(cè)的語音命令,設(shè)備收到語音后,將這些語音編碼,并轉(zhuǎn)換成一個(gè)壓縮數(shù)字文件,被轉(zhuǎn)入用戶所使用移動(dòng)運(yùn)營(yíng)商的基站當(dāng)中,然后再通過一系列固定電線發(fā)送至用戶的互聯(lián)網(wǎng)服務(wù)供應(yīng)商(ISP)。該ISP擁有云計(jì)算服務(wù)器,通過內(nèi)置的系列模塊,將通過技術(shù)手段來識(shí)別用戶剛才說過的內(nèi)容。計(jì)算機(jī)將根據(jù)所識(shí)別詞匯的可信度級(jí)別,而創(chuàng)建一個(gè)用戶所說內(nèi)容的列表,從而具體分析用戶語音表述中最有可能會(huì)表達(dá)何種意思。如果上述分析和判斷結(jié)果已具有足夠的可信度,那么計(jì)算機(jī)將能理解用戶所說的內(nèi)容:比如計(jì)算機(jī)得出結(jié)論,用戶是要求手機(jī)發(fā)送短信或查找聯(lián)系人列表中的某個(gè)聯(lián)系人。在經(jīng)過上述一系列后臺(tái)處理后,用戶將會(huì)看到手機(jī)屏幕上出現(xiàn)所需的內(nèi)容,而不必進(jìn)行手動(dòng)操作。在此過程中,如果用戶的語音含義過于模糊,計(jì)算機(jī)就會(huì)詢問用戶,以了解用戶希望查找的聯(lián)系人究竟是,例如,埃里卡·奧爾森(Erica Olssen),還是埃里卡·施密特(Erica Schmidt)。
以上是siri的智能語音操作原理,但由于過程復(fù)雜常常無法達(dá)到預(yù)期效果。而且,語音指令完成后就無法繼續(xù)進(jìn)行進(jìn)一步地語音控制操作,例如,用戶輸入“siri打開地圖”的語音指令,手機(jī)能很開的打開地圖app,但之后無法在繼續(xù)其他語音控制操作,即之后的操作只能是手動(dòng)操作,很不方便。
其次,日常使用終端設(shè)備都是利用觸屏,用戶很熟悉操作方法,而利用語音操作,智能語音系統(tǒng)往往無法完成一些簡(jiǎn)單的操作。例如,微信APP中,瀏覽朋友圈時(shí),只需打開微信,點(diǎn)擊發(fā)現(xiàn),再點(diǎn)擊朋友圈即可。然而,現(xiàn)有的智能語音系統(tǒng)均無法實(shí)現(xiàn)該功能。智能語音系統(tǒng)若想實(shí)現(xiàn)對(duì)所有應(yīng)用程序各種功能的操作需要龐大的云計(jì)算服務(wù)器,這基本是不可能的。此外,對(duì)于智能語音系統(tǒng)現(xiàn)有的較為成熟的功能,比如“打電話給誰、打開某個(gè)程序等”,平時(shí)很少有人用,用的時(shí)候也不一定成功,所以實(shí)用性不強(qiáng)。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供一種語音控制方法及控制裝置,解決現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。
根據(jù)本發(fā)明的第一方面,提供一種用于終端設(shè)備的語言控制方法,包括:語音指令識(shí)別步驟,接收并識(shí)別語音指令;語音指令解析步驟,根據(jù)所識(shí)別的語音指令,通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較,將識(shí)別的所述語音指令分解為操作和對(duì)象要素;以及指令執(zhí)行步驟,根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象,在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行;其中,所述操作指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。
進(jìn)一步地,語音指令解析步驟中,將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比,如果語音指令中包含有所述預(yù)設(shè)的指令操作,就將語音指令分解為操作和對(duì)象要素。
進(jìn)一步地,所述指令執(zhí)行步驟包括:
第一判斷步驟,判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中,是否包括對(duì)象要素;以及
操作執(zhí)行步驟,存在對(duì)象要素時(shí),在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象,并對(duì)搜索到的對(duì)象執(zhí)行所述操作。
進(jìn)一步地,所述操作執(zhí)行步驟具體包括:
搜索步驟,在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象;
第二判斷步驟,判斷搜索到的對(duì)象是否唯一;以及
提示步驟,當(dāng)搜索到的對(duì)象不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。
進(jìn)一步地,語音指令解析步驟中,進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分;
所述操作執(zhí)行步驟中,當(dāng)存在對(duì)象要素時(shí),進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素,在當(dāng)前頁面中搜索所述內(nèi)容,并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,語音指令解析步驟中,進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分;
搜索步驟中,在該頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容;
在第二判斷步驟中,判斷搜索到的所述內(nèi)容是否唯一;以及
提示步驟中,當(dāng)搜索到的內(nèi)容不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。
進(jìn)一步地,所述操作執(zhí)行步驟還包括:
操作執(zhí)行子步驟,當(dāng)搜索到的內(nèi)容唯一時(shí),在當(dāng)前頁面針對(duì)該搜索到的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,當(dāng)用戶給出進(jìn)一步的語音指令時(shí),則返回所述語音指令識(shí)別步驟,再次進(jìn)行該語音命令的處理,以執(zhí)行所述更具體的語音指令。
進(jìn)一步地,所述操作執(zhí)行子步驟還包括:第三判斷步驟,在存在所述對(duì)象要素時(shí),進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素;
所述操作執(zhí)行子步驟中,在第三判斷步驟的判斷結(jié)果為是的情況下,在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容,并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,所述操作執(zhí)行步驟還包括,不存在對(duì)象要素時(shí),在該頁面直接執(zhí)行所述操作。
根據(jù)本發(fā)明的第二方面,提供一種用于終端設(shè)備的語言控制裝置,包括:語音指令識(shí)別模塊,用于接收并識(shí)別語音指令;語音指令解析模塊,用于根據(jù)所識(shí)別的語音指令,通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較,將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素;以及指令執(zhí)行模塊,用于根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象,在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行;其中,所述操作指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。
進(jìn)一步地,所述語音指令解析模塊將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比,如果語音指令中包含有所述預(yù)設(shè)的指令操作,就將語音指令分解為操作和對(duì)象要素。
進(jìn)一步地,所述指令執(zhí)行模塊包括:
第一判斷模塊,用于判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中,是否包括對(duì)象要素;以及
操作執(zhí)行模塊,用于存在對(duì)象要素時(shí),在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象,并對(duì)搜索到的對(duì)象執(zhí)行所述操作。
進(jìn)一步地,所述操作執(zhí)行模塊具體包括:
搜索模塊,用于在該頁面中搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象;
第二判斷模塊,用于判斷搜索到的對(duì)象是否唯一;以及
提示模塊,用于當(dāng)搜索到的對(duì)象不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。
進(jìn)一步地,語音指令解析模塊進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分;
當(dāng)存在對(duì)象要素時(shí),所述操作執(zhí)行模塊進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素,在當(dāng)前頁面中搜索所述內(nèi)容,并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,語音指令解析模塊進(jìn)一步將所述對(duì)象要素分解為內(nèi)容和限定要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分;
搜索模塊在該頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容;
第二判斷模塊判斷搜索到的所述內(nèi)容是否唯一;以及
當(dāng)搜索到的內(nèi)容不唯一時(shí),提示模塊提示用戶給出進(jìn)一步的語音指令。
進(jìn)一步地,所述操作執(zhí)行模塊還包括:
操作執(zhí)行子模塊,當(dāng)搜索到的內(nèi)容唯一時(shí),在當(dāng)前頁面針對(duì)該搜索到的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,當(dāng)用戶給出進(jìn)一步的語音指令時(shí),則所述語音指令識(shí)別模塊再次接收并識(shí)別該更具體的語音指令,以執(zhí)行所述更具體的語音指令。
進(jìn)一步地,所述操作執(zhí)行子模塊還包括:第三判斷模塊,在存在所述對(duì)象要素時(shí),進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素;
所述操作執(zhí)行子模塊在第三判斷模塊的判斷結(jié)果為是的情況下,在當(dāng)前頁面中對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。
進(jìn)一步地,不存在對(duì)象要素時(shí),所述操作執(zhí)行模塊在該頁面直接執(zhí)行所述操作。
根據(jù)本發(fā)明的上述方案,根據(jù)本發(fā)明的上述方案,通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素,并在當(dāng)前頁面中執(zhí)行分解的所述語音指令,從而本發(fā)明的語音控制方法由于指令少,并結(jié)合搜索功能,可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作,方便快捷,解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。
以下結(jié)合附圖及具體實(shí)施方式對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步詳細(xì)的描述,本發(fā)明的有益效果將進(jìn)一步明確。
附圖說明
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。
圖1示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制方法的流程圖。
圖2示出了所述語音控制方法中操作執(zhí)行步驟的流程圖。
圖3示出了本發(fā)明語音控制方法的一優(yōu)選實(shí)施例的流程圖。
圖4示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制裝置的結(jié)構(gòu)框圖。
圖5示出了本發(fā)明語音控制裝置中操作執(zhí)行模塊結(jié)構(gòu)框圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明具體實(shí)施例及相應(yīng)的附圖對(duì)本發(fā)明技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
首先結(jié)合圖1、圖2以及圖3說明根據(jù)本發(fā)明的語音控制方法。圖1示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制方法的流程圖;圖2示出了根據(jù)本發(fā)明的語音控制方法中操作執(zhí)行步驟的具體流程。圖3示出了本發(fā)明所述語音控制方法的一優(yōu)選的具體實(shí)施例的流程圖。
本發(fā)明的所述語音控制方法用于終端設(shè)備,例如手機(jī)等,如圖1所述,該方法包括:語音指令識(shí)別步驟S1、語音指令解析步驟S2、以及指令執(zhí)行步驟S3。語音指令識(shí)別步驟S1,接收并識(shí)別,例如,用戶發(fā)出的語音指令。語音指令解析步驟S2,根據(jù)所識(shí)別的語音指令,通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較,將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素。指令執(zhí)行步驟S3,根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象,在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。其中,所述操作指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。其中,所述終端設(shè)備預(yù)設(shè)的操作可以包括終端設(shè)備出廠預(yù)設(shè)的對(duì)應(yīng)的觸屏操作,還可包括后期用戶個(gè)性設(shè)置的語音對(duì)應(yīng)操作。
進(jìn)一步地,所述對(duì)象要素可進(jìn)一步被分解為內(nèi)容和限定二個(gè)要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分。根據(jù)該限定要素,所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。
以及進(jìn)一步地,所述限定可以為空,或者所述內(nèi)容和所述限定同時(shí)可以為空。
上述語音控制方法可在終端設(shè)備的后臺(tái)運(yùn)行,使用過程中可不彈出其他窗口,在整個(gè)操作過程中都可以接收和處理語音指令。當(dāng)然,也可以在終端的設(shè)備中控制關(guān)閉或打開此語音指令的接收和處理功能,或者設(shè)置打開的時(shí)間段。另外,喚醒所述功能的方式也是可選擇的,可以選擇無需喚醒,也可以選擇聽到某個(gè)聲音后喚醒,這個(gè)聲音可以用戶個(gè)性化設(shè)置,也可以利用重力感應(yīng)喚醒等。
根據(jù)本發(fā)明的上述方案,通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素,并在當(dāng)前頁面中執(zhí)行分解的所述語音指令,從而指令簡(jiǎn)單,易于實(shí)現(xiàn),無需聯(lián)網(wǎng)即實(shí)現(xiàn)了用戶輸入的指令的語音控制,從而利用語音指令代替手指觸控操作。
以下對(duì)各步驟逐一進(jìn)行描述。
所述語音指令識(shí)別步驟S1,接收并識(shí)別,例如用戶發(fā)出的語音指令。用戶利用終端設(shè)備,例如手機(jī)的麥克風(fēng)輸入語音指令,所述語音指令識(shí)別步驟S1中,接收該語音指令,并對(duì)該語音指令進(jìn)行識(shí)別。具體地,可以下載離線語言包用于語音的識(shí)別,將用戶輸入的語音指令與該語言包中的語音模板進(jìn)行比較,將匹配度最高的作為識(shí)別的結(jié)果。此外,本發(fā)明的該方法中,還可使用除了本機(jī)麥克風(fēng)以外其他語音指令,例如電話、微信等通信軟件的語音。
本發(fā)明中,由于語音指令簡(jiǎn)單,僅在終端設(shè)備上即可完成語音識(shí)別,而無需利用聯(lián)網(wǎng)來實(shí)現(xiàn)語音識(shí)別,從而語音控制簡(jiǎn)便易行。
語音指令解析步驟S2,根據(jù)所識(shí)別的語音指令,將其分解為操作、以及對(duì)象兩個(gè)要素。具體地,將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比,如果語音指令中包含有所述預(yù)設(shè)的指令操作,就將語音指令分解為操作和限定兩部分。如上文所述,其中,所述操作指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。并且進(jìn)一步地,所述語音指令解析步驟S2還包括將所述對(duì)象要素進(jìn)一步分解為內(nèi)容和限定兩個(gè)要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,當(dāng)存在與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分時(shí),就將所述對(duì)象分解為內(nèi)容和限定兩個(gè)要素。根據(jù)該限定要素,所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。所述終端設(shè)備利用數(shù)據(jù)庫存儲(chǔ)所述預(yù)設(shè)的操作、限定等數(shù)據(jù)。并且所述數(shù)據(jù)庫可以通過網(wǎng)絡(luò)更新,主要是各種觸控指令,例如,單擊、拖拽等。并且,包括這些操作的同意表達(dá)方式,也可以通過用戶個(gè)性設(shè)置。類似的,其中所包含的各種限定也可以通過網(wǎng)絡(luò)更新,或由用戶設(shè)置。
操作要素包括“點(diǎn)擊、長(zhǎng)按、滑動(dòng)、多點(diǎn)觸控、多向滑動(dòng)、雙擊、拖拽”等等;內(nèi)容要素包括“文字內(nèi)容、顏色、方位”等等;以及限定要素包括“第一個(gè)、第二個(gè)、第n個(gè)、最上面的、最下面的、黑色的、白色的”等等。舉例而言,語音指令“長(zhǎng)按第一個(gè)確認(rèn)”中,“長(zhǎng)按”為該語音指令要執(zhí)行的動(dòng)作,若為與終端設(shè)備中預(yù)設(shè)的操作相匹配的部分,則被分解為所述操作要素,“第一個(gè)確認(rèn)”則為對(duì)象要素,指示“長(zhǎng)按”的動(dòng)作對(duì)象。進(jìn)一步地,在該對(duì)象要素中,若“第一個(gè)”與終端設(shè)備中預(yù)設(shè)的限定相匹配,則被分解為所述限定要素,剩余部分“確定”則為所述內(nèi)容要素。再例如,語音指令“點(diǎn)擊返回”中,“點(diǎn)擊”為該語音指令中要執(zhí)行的動(dòng)作,若與終端設(shè)備預(yù)設(shè)的操作相匹配,則被分解為所述操作要素,“返回”則為對(duì)象要素。進(jìn)一步地,“返回”被分解為所述內(nèi)容要素,則該語音指令中限定要素為空。又例如,語音指令“滑動(dòng)”中,“滑動(dòng)”為該語音指令要執(zhí)行的動(dòng)作,若為與終端設(shè)備中預(yù)設(shè)的操作相匹配的部分,則被分解為所述操作要素。則該指令中,內(nèi)容要素和限定要素,即所述對(duì)象要素為空。
指令執(zhí)行步驟S3,根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象,在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。具體的,在一個(gè)優(yōu)選實(shí)施例中,所述指令執(zhí)行步驟S3包括:第一判斷步驟S31,判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中,是否包括對(duì)象要素;以及操作執(zhí)行步驟S32,存在對(duì)象要素時(shí),在該頁面中搜索所述對(duì)象,并對(duì)搜索到的對(duì)象執(zhí)行所述操作。
需要指出的是,所有的所述操作都與觸控操作相對(duì)應(yīng),并模擬觸控操作反饋的信號(hào)給處理器,并且,本發(fā)明中的語音控制,由于所述操作與常規(guī)觸控操作方法相同,從而用戶更加熟悉。
由以上描述可知,本發(fā)明的語音控制方法由于指令少,并結(jié)合上述搜索功能,可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作,方便快捷。并且,由于所述語音指令的分解過程為與終端設(shè)備中預(yù)設(shè)的操作和對(duì)象等匹配的部分,故無需聯(lián)網(wǎng)進(jìn)行語音識(shí)別和分解等相關(guān)操作,從而語音控制簡(jiǎn)單易行,解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。
如圖2所示,所述操作執(zhí)行步驟S32具體包括:搜索步驟S321,在當(dāng)前頁面搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象;第二判斷步驟S322,判斷搜索到的對(duì)象是否唯一;以及提示步驟S323,當(dāng)搜索到的對(duì)象不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。具體地,當(dāng)搜索結(jié)果不唯一時(shí),可以高亮所有搜索結(jié)果,和/或語音提示“搜索到n個(gè)相同內(nèi)容”。此時(shí),等待用戶再次輸入更具體的語音指令,則返回到步驟S1,再次進(jìn)行該語音命令的處理,以執(zhí)行所述更具體的語音指令。例如,用戶輸入“點(diǎn)擊返回”,當(dāng)當(dāng)前頁面存在多個(gè)“返回”時(shí),高亮顯示多個(gè)搜索到的“返回”,用戶再次輸入更具體的語音命令,例如“點(diǎn)擊第一個(gè)返回”或“點(diǎn)擊返回到桌面”,則返回步驟S1,重新開始該更具體的語音指令的執(zhí)行。所述操作執(zhí)行步驟S32還包括,操作執(zhí)行子步驟S324,用于當(dāng)搜索到的對(duì)象唯一時(shí),對(duì)所述對(duì)象執(zhí)行所述操作。
進(jìn)一步優(yōu)選地,所述執(zhí)行步驟S32中,當(dāng)存在對(duì)象要素時(shí),進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素,搜索步驟S321中,在當(dāng)前頁面中搜索所述內(nèi)容,并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。并且,第二判斷步驟S322中,判斷搜索到的所述內(nèi)容是否唯一;以及提示步驟S323中,當(dāng)搜索到的內(nèi)容不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。
更進(jìn)一步地,操作執(zhí)行子步驟S324還包括第三判斷步驟(未示出),在存在所述對(duì)象要素時(shí),進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素,是的話則操作執(zhí)行子步驟S324,在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容,并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。以上,搜索到多個(gè)對(duì)象(內(nèi)容)時(shí),高亮顯示可使用不同顏色,或?qū)Χ鄠€(gè)對(duì)象(內(nèi)容)編序號(hào),方便用戶進(jìn)一步明確語音指令。
進(jìn)一步地,所述操作執(zhí)行步驟S32還包括,不存在對(duì)象要素時(shí),在該頁面直接執(zhí)行所述操作。
下面結(jié)合圖3說明本發(fā)明所述語音控制方法的一具體實(shí)施例。如圖3所示,設(shè)用戶輸入的語音指令包括操作、內(nèi)容以及限定三要素。在步驟S1當(dāng)中,接收并識(shí)別該語音指令。在步驟S2中,將所述語音指令分解為操作、限定和內(nèi)容三個(gè)部分。在指令執(zhí)行步驟S3中,根據(jù)所述內(nèi)容要素,在屏幕,即終端設(shè)備的當(dāng)前頁面中搜索與所述內(nèi)容要素對(duì)應(yīng)的內(nèi)容,并判斷該搜索到的內(nèi)容是否唯一,是的話,則在當(dāng)前頁面中對(duì)所述內(nèi)容所在位置執(zhí)行所述操作。否的話,則高亮搜索到的所有內(nèi)容,并提示用戶給出進(jìn)一步的語音指令,之后返回步驟S1,重新接收并識(shí)別該進(jìn)一步的語音指令,從而對(duì)其進(jìn)行執(zhí)行,由此實(shí)現(xiàn)全過程的語音控制。
以下結(jié)合圖4、圖5說明的語音控制裝置。圖4示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的語音控制裝置的結(jié)構(gòu)框圖。圖5示出了根據(jù)本發(fā)明的語音控制裝置中操作執(zhí)行模塊的結(jié)構(gòu)框圖。
本發(fā)明的所述語音控制裝置用于終端設(shè)備,例如手機(jī)等,如圖4所述,該裝置包括:語音指令識(shí)別模塊1、語音指令解析模塊2、以及指令執(zhí)行模塊3。語音指令識(shí)別模塊1用于接收并識(shí)別,例如用戶發(fā)出的語音指令。語音指令解析模塊2用于根據(jù)所識(shí)別的語音指令,將其分解為操作和對(duì)象兩個(gè)要素。指令執(zhí)行模塊3用于根據(jù)所識(shí)別的語音指令,通過與終端設(shè)備中預(yù)設(shè)的操作部分進(jìn)行比較,將識(shí)別的所述語音指令分解為操作和對(duì)象兩個(gè)要素。其中,所述操作要素指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象要素為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。其中,所述終端設(shè)備預(yù)設(shè)的操作可以包括終端設(shè)備出廠預(yù)設(shè)的對(duì)應(yīng)的觸屏操作,還可包括后期用戶個(gè)性設(shè)置的語音對(duì)應(yīng)操作。
進(jìn)一步地,所述對(duì)象要素可進(jìn)一步被分解為內(nèi)容和限定二個(gè)要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,該限定為與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分。根據(jù)該限定要素,所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。
以及進(jìn)一步地,所述限定可以為空,或者所述內(nèi)容和所述限定同時(shí)可以為空。
以下對(duì)各模塊逐一進(jìn)行描述。
所述語音指令識(shí)別模塊1用于接收并識(shí)別,例如用戶發(fā)出的語音指令。用戶利用終端設(shè)備,例如手機(jī)的麥克風(fēng)輸入語音指令,所述語音指令識(shí)別模塊1接收該語音指令,并對(duì)該語音指令進(jìn)行識(shí)別。具體地,可以下載離線語言包用于語音的識(shí)別,將用戶輸入的語音指令與該語言包中的語音模板進(jìn)行比較,將匹配度最高的作為識(shí)別的結(jié)果。此外,本發(fā)明的該方法中,還可使用除了本機(jī)麥克風(fēng)以外其他語音指令,例如電話、微信等通信軟件的語音。本發(fā)明中,由于語音指令簡(jiǎn)單,僅在終端設(shè)備上即可完成語音識(shí)別,而無需利用聯(lián)網(wǎng)來實(shí)現(xiàn)語音識(shí)別,從而語音控制簡(jiǎn)便易行。
語音指令解析模塊2用于根據(jù)所識(shí)別的語音指令,將其分解為操作、以及對(duì)象兩個(gè)要素。具體地,將識(shí)別的語音指令與所述終端設(shè)備中預(yù)設(shè)的操作相互對(duì)比,如果語音指令中包含有所述預(yù)設(shè)的指令操作,就將語音指令分解為操作和限定兩部分。如上文所述,其中,所述操作指示所述語音指令所要執(zhí)行的動(dòng)作,其為與所述終端設(shè)備預(yù)設(shè)的操作相匹配的部分;所述對(duì)象為所述操作所指示的動(dòng)作的執(zhí)行對(duì)象。并且進(jìn)一步地,所述語音指令解析模塊2還用于將所述對(duì)象要素進(jìn)一步分解為內(nèi)容和限定兩個(gè)要素,所述限定為對(duì)所述內(nèi)容進(jìn)行限定,當(dāng)存在與所述終端設(shè)備預(yù)設(shè)的限定相匹配的部分時(shí),就將所述對(duì)象分解為內(nèi)容和限定兩個(gè)要素。根據(jù)該限定要素,所述操作執(zhí)行以所述限定要素限定的所述內(nèi)容,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。所述終端設(shè)備利用數(shù)據(jù)庫存儲(chǔ)所述預(yù)設(shè)的操作、限定等數(shù)據(jù)。并且所述數(shù)據(jù)庫可以通過網(wǎng)絡(luò)更新,主要是各種觸控指令,例如,單擊、拖拽等。并且,包括這些操作的同意表達(dá)方式,也可以通過用戶個(gè)性設(shè)置。類似的,其中所包含的各種限定也可以通過網(wǎng)絡(luò)更新,或由用戶設(shè)置。所述操作、對(duì)象(內(nèi)容、限定)要素,同上文的描述,此處不再贅述
指令執(zhí)行模塊3用于根據(jù)對(duì)所述語音指令分解所得到的所述操作和所述對(duì)象,在終端設(shè)備的當(dāng)前頁面執(zhí)行所述操作,從而實(shí)現(xiàn)對(duì)所述語音指令的執(zhí)行。具體的,在一個(gè)優(yōu)選實(shí)施例中,所述指令執(zhí)行模塊3包括:第一判斷模塊31用于判斷對(duì)所述語音指令進(jìn)行分解所得到的要素中,是否包括對(duì)象要素;以及操作執(zhí)行模塊32用于存在對(duì)象要素時(shí),在該頁面中搜索所述對(duì)象,并對(duì)搜索到的對(duì)象執(zhí)行所述操作。
需要指出的是,所有的所述操作都與觸控操作相對(duì)應(yīng),并模擬觸控操作反饋的信號(hào)給處理器,并且,本發(fā)明中的語音控制,由于所述操作與常規(guī)觸控操作方法相同,從而用戶更加熟悉。并且,由以上描述克制,本發(fā)明的語音控制方法由于指令少,并結(jié)合上述搜索功能,可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作,方便快捷。
如圖5所示,所述操作執(zhí)行模塊32具體包括:搜索模塊321,在該頁面搜索與所述對(duì)象要素對(duì)應(yīng)的對(duì)象;第二判斷模塊322,用于判斷搜索到的對(duì)象是否唯一;以及提示模塊323,當(dāng)搜索到的對(duì)象不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。具體地,可以當(dāng)搜索結(jié)果不唯一時(shí),可以高亮所有搜索結(jié)果,和/或語音提示“搜索到n個(gè)相同內(nèi)容”。此時(shí),等待用戶再次輸入更具體的語音指令,則由語音指令識(shí)別模塊1接收并識(shí)別該具體的語音指令,以便再次進(jìn)行該語音命令的處理,以執(zhí)行所述更具體的語音指令。所述操作執(zhí)行模塊32還包括,操作執(zhí)行子模塊324,用于當(dāng)搜索到的對(duì)象唯一時(shí),對(duì)所述對(duì)象執(zhí)行所述操作。
進(jìn)一步優(yōu)選地,當(dāng)存在對(duì)象要素時(shí),所述操作執(zhí)行模塊32進(jìn)一步針對(duì)該對(duì)象要素中的內(nèi)容要素,搜索模塊321,在當(dāng)前頁面中搜索所述內(nèi)容,并對(duì)搜索到的內(nèi)容執(zhí)行所述操作。并且,第二判斷模塊322判斷搜索到的所述內(nèi)容是否唯一;以及提示模塊323中,當(dāng)搜索到的內(nèi)容不唯一時(shí),提示用戶給出進(jìn)一步的語音指令。
更進(jìn)一步地,所述操作執(zhí)行子模塊324還包括第三判斷模塊(未示出),用于在存在所述對(duì)象要素時(shí),進(jìn)一步判斷是否同時(shí)存在內(nèi)容要素和限定要素,是的話,則操作執(zhí)行子模塊324在當(dāng)前頁面中搜索由所述限定要素限定的所述內(nèi)容,并對(duì)搜索到的由所述限定要素限定的內(nèi)容執(zhí)行所述操作。如上文所述,搜索到多個(gè)對(duì)象(內(nèi)容)時(shí),高亮顯示可使用不同顏色,或?qū)Χ鄠€(gè)對(duì)象(內(nèi)容)編序號(hào),方便用戶進(jìn)一步明確語音指令。
進(jìn)一步地,不存在對(duì)象要素時(shí),所述操作執(zhí)行模塊32在該頁面直接執(zhí)行所述操作。
以上,對(duì)本發(fā)明的語音控制方法和控制裝置進(jìn)行了描述。根據(jù)本發(fā)明的上述方案,根據(jù)本發(fā)明的上述方案,通過與設(shè)備預(yù)存的操作進(jìn)行對(duì)比而將所述語音指令解析為所述操作和對(duì)象兩個(gè)要素,并在當(dāng)前頁面中執(zhí)行分解的所述語音指令,從而本發(fā)明的語音控制方法由于指令少,并結(jié)合搜索功能,可以不用聯(lián)網(wǎng)就實(shí)現(xiàn)語音操作,方便快捷,解決了現(xiàn)有技術(shù)中的語音控制系統(tǒng)實(shí)用性差、必須聯(lián)網(wǎng)才能使用的缺陷。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域技術(shù)人員而言,本發(fā)明可以有各種改動(dòng)和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。