專利名稱:指令處理方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù),尤其涉及一種指令處理方法、裝置和系統(tǒng)。
背景技術(shù):
語音控制技術(shù)作為一種相對更加簡易、人性化的控制方式,已逐漸被業(yè)界所認可,越來越多的電子設(shè)備,如智能手機(Smart Phone)、平板電腦(Tablet)、智能電視(SmartTV)等,都將具有語音控制功能,并將會同時出現(xiàn)在人們的日常生活中;可以預見,語音控制功能將越來越多樣化,且將出現(xiàn)越來越多的支持語音控制的消費電子設(shè)備、辦公設(shè)備等。隨著終端設(shè)備計算能力的增強以及智能化的趨勢,一些終端設(shè)備所能支持的功能越來越豐富,且可能出現(xiàn)重疊,如用戶可以通過Smart Phone>Smart TV等上Twitter。此外,隨著家庭自動化的普及,通過各種智能終端均可以控制家庭網(wǎng)絡(luò)中的其他設(shè)備,如在Moto的4HomeService中,用戶可以用手機遠程控制各種家用電器。因此,語音控制技術(shù)不僅將成為一種 重要的人機交互方式,而且可以被不同的智能終端所理解和執(zhí)行。目前的語音命令技術(shù)主要包括傳統(tǒng)語音控制技術(shù)和智能語音控制技術(shù),傳統(tǒng)語音控制技術(shù)中用戶需要依據(jù)特定的語法和命令詞匯來發(fā)布命令,智能語音控制技術(shù)中用戶可以通過自然語言自由發(fā)布命令。相比之下,傳統(tǒng)語音控制技術(shù)實現(xiàn)機制相對簡單、準確度高,但用戶體驗相對較差,智能語音控制技術(shù)實現(xiàn)機制復雜,但用戶體驗相對較好。但目前業(yè)界普遍認為智能語音控制技術(shù)的發(fā)展前景更為廣闊,如Apple、G00gle等公司都在加大這方面的研究和開發(fā)。對于智能語音控制技術(shù),由于其計算開銷大,通常采用云端處理的模式,不僅可以降低設(shè)備本地處理的復雜度,還可以減少能量消耗。在現(xiàn)有技術(shù)中,語音控制的一種執(zhí)行方式為在電子設(shè)備的后臺一直運行監(jiān)聽的語音控制,例如Samsung的Smart Interaction TV實時監(jiān)聽用戶的操作指令,以快速執(zhí)行用戶的操作指令。然而,用戶發(fā)出的同一條語音命令有可能被多個設(shè)備同時監(jiān)聽到,例如,當用戶對設(shè)備A發(fā)出指令“降低設(shè)備B的音量一格”時,該命令可能同時被設(shè)備B監(jiān)聽到,則設(shè)備B會執(zhí)行設(shè)備A下發(fā)的指令和從用戶直接接收到的指令,使得設(shè)備B的音量被重復降兩次,從而導致語音命令的重復執(zhí)行,甚至出現(xiàn)控制錯誤。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種指令處理方法、裝置和系統(tǒng),避免多個語音控制設(shè)備重復執(zhí)行同時采集到的一條語音命令,消除命令重復執(zhí)行帶來的控制錯誤。本發(fā)明實施例的第一方面是提供一種指令處理方法,包括接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的;分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;
當所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。在第一方面的第一種可能的實現(xiàn)方式中,所述多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容;所述分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令包括根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊;根據(jù)所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復;當所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。 結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式 中,所述方法還包括當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息;將所述新的語音指令的采集時間與之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;將所述新的語音指令與所述相關(guān)語音指令作為所述多條語音指令。結(jié)合第一方面的第一種可能的實現(xiàn)方式或第一方面的第二種可能的實現(xiàn)方式,在第一方面的第三種可能的實現(xiàn)方式中,所述根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊包括根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊;或者,根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。結(jié)合第一方面、第一方面的第一種可能的實現(xiàn)方式、第一方面的第二種可能的實現(xiàn)方式或第一方面的第三種可能的實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,所述多條語音指令中還分別攜帶各所述語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù);所述方法還包括根據(jù)語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令;所述當所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令包括
當所述多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。結(jié)合第一方面、第一方面的第一種可能的實現(xiàn)方式、第一方面的第二種可能的實現(xiàn)方式、第一方面的第三種可能的實現(xiàn)方式或第一方面的第四種可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式中,本發(fā)明實施例的指令處理方法還包括當接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。結(jié)合第一方面,在第一方面的第六種可能的實現(xiàn)方式中,本發(fā)明實施例的指令處理方法還包括
所述語音解析服務(wù)器與各語音控制設(shè)備進行時間同步;所述語音解析服務(wù)器分別接收所述各語音控制設(shè)備發(fā)送的所述源語音命令。結(jié)合第一方面,在第一方面的第七種可能的實現(xiàn)方式中,本發(fā)明實施例的指令處理方法還包括本地語音控制網(wǎng)關(guān)與各語音控制設(shè)備進行時間同步;所述本地語音控制網(wǎng)關(guān)分別接收所述各語音控制設(shè)備發(fā)送的所述源語音命令,并將各所述源語音命令發(fā)送到所述語音解析服務(wù)器。本發(fā)明實施例的第二方面是提供一種指令處理裝置,包括接收模塊,用于接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的;判斷模塊,用于分別判斷所述接收模塊接收到的所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;冗余指令處理模塊,用于當所述判斷模塊的判斷結(jié)果為所述多條語音指令中有兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。在第二方面的第一種可能的實現(xiàn)方式中,所述接收模塊接收到的所述多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容;所述判斷模塊包括第一判斷單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊;第二判斷單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復;相似指令確定單元,用于當所述第一判斷單元和第二判斷單元的判斷結(jié)果為所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式中,所述裝置還包括記錄模塊,用于當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息;語音指令確定模塊,用于將所述新的語音指令的采集時間與所述記錄模塊之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;并將所述新的語音指令與所述相關(guān)語音指令作為所述多條語首指令。結(jié)合第二方面的第一種可能的實現(xiàn)方式或第二方面的第二種可能的實現(xiàn)方式,在第二方面的第三種可能的實現(xiàn)方式中,所述第一判斷單元包括第一判斷子單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊;或者,
第二判斷子單元,用于所述接收模塊接收到的根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。結(jié)合第二方面、第二方面的第一種可能的實現(xiàn)方式、第二方面的第二種可能的實現(xiàn)方式或第二方面的第三種可能的實現(xiàn)方式,在第二方面的第四種可能的實現(xiàn)方式中,所述接收模塊接收到的所述多條語音指令中還分別攜帶所述多條語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù);所述裝置還包括獲取模塊,用于根據(jù)所述接收模塊接收到的語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令;所述冗余指令處理模塊具體用于當所述判斷模塊的判斷結(jié)果為所述多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。結(jié)合第二方面、第二方面的第一種可能的實現(xiàn)方式、第二方面的第二種可能的實現(xiàn)方式、第二方面的第三種可能的實現(xiàn)方式或第二方面的第四種可能的實現(xiàn)方式,在第二方面的第五種可能的實現(xiàn)方式中,所述冗余指令處理模塊還用于當所述接收模塊接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。本發(fā)明實施例的第三方面是提供一種指令處理系統(tǒng),包括語音解析服務(wù)器、多個語音控制設(shè)備和上述的指令處理裝置;所述多個語音控制設(shè)備分別用于采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述語音解析服務(wù)器;所述語音解析服務(wù)器用于接收所述多個語音控制設(shè)備發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并將所述多個語音指令分別發(fā)送到所述指令處理裝置。
在第三方面的第一種可能的實現(xiàn)方式中,所述語音解析服務(wù)器還用于與所述多個語音控制設(shè)備進行時間同步。本發(fā)明實施例的第四方面是提供一種指令處理系統(tǒng),包括語音解析服務(wù)器、多個語音控制設(shè)備和本地語音控制網(wǎng)關(guān),所述本地語音控制網(wǎng)關(guān)包括上述的指令處理裝置;所述多個語音控制設(shè)備用于分別采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述本地語音控制網(wǎng)關(guān);所述語音解析服務(wù)器用于分別接收所述本地語音控制網(wǎng)關(guān)發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并分別將所述多個語音指令返回到所述本地語音控制網(wǎng)關(guān)。在第四方面的第一種可能的實現(xiàn)方式中,所述本地語音控制網(wǎng)關(guān)還用于與所述多 個語音控制設(shè)備進行時間同步。本發(fā)明實施例的技術(shù)效果是通過接收語音解析服務(wù)器發(fā)送的多條語音指令,分別判斷多條語音指令中任意兩條語音指令是否為相似指令,相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當兩條語音指令為相似指令時,丟棄其中一條語音指令。本實施例避免了多個語音控制設(shè)備重復執(zhí)行同時采集到的一條語音命令,消除了命令重復執(zhí)行帶來的控制錯誤。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明指令處理方法實施例一的流程圖;圖2為本發(fā)明指令處理方法實施例二的流程圖;圖3為本發(fā)明指令處理方法實施例二中的系統(tǒng)架構(gòu)示意圖;圖4為本發(fā)明指令處理方法實施例三的信令圖;圖5為本發(fā)明指令處理方法實施例三中的系統(tǒng)架構(gòu)示意圖;圖6為本發(fā)明指令處理裝置實施例一的結(jié)構(gòu)示意圖;圖7為本發(fā)明指令處理裝置實施例二的結(jié)構(gòu)示意圖;圖8為本發(fā)明指令處理裝置實施例三的結(jié)構(gòu)示意圖;圖9為本發(fā)明計算機系統(tǒng)實施例的結(jié)構(gòu)示意圖;圖10為本發(fā)明指令處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖;圖11為本發(fā)明指令處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖。
具體實施例方式為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖I為本發(fā)明指令處理方法實施例一的流程圖,如圖I所示,本實施例提供了一種指令處理方法,可以具體包括如下步驟步驟101,接收語音解析服務(wù)器發(fā)送的多條語音指令。本實施例提出了一種冗余語音指令識別和處理(Redundant voicE Commandidentification and Handling ;以下簡稱RECH)機制,具體可以在現(xiàn)有的語音控制系統(tǒng)中增加一個RECH功能實體,該RECH功能實體可以為一個獨立的設(shè)備,也可以為集成在現(xiàn)有的設(shè)備中的一個模塊。具體地,本實施例中的RECH功能實體可以與網(wǎng)絡(luò)側(cè)的語音解析服務(wù)器設(shè)置在一起,或者直接作為一個模塊設(shè)置在語音解析服務(wù)器中;也可以設(shè)置在本地,即與本地語音控制網(wǎng)關(guān)設(shè)置在一起,或者直接作為一個模塊設(shè)置在本地語音控制網(wǎng)關(guān)中。本步驟為RECH功能實體接收語音解析服務(wù)器發(fā)送的多條語音指令,多條語音指令可以為語音解析服務(wù)器依次發(fā)送的,其可以為語音解析服務(wù)器在一個預設(shè)的時間段內(nèi)生成并發(fā)送的。此處設(shè)置預設(shè)的時間段的目的是為了對在不同時刻接收到的語音指令進行不同處理,當接收到的兩個語音指令的時間差較大時,則可以直接將在先接收到的語音指令 返回給相應(yīng)的語音控制設(shè)備,而不會等到接收到在后的語音指令,并對二者進行相似性判斷后才處理;因此,本實施例可以具體設(shè)置預設(shè)的時間段,并對預設(shè)的時間段內(nèi)接收到的各語音指令進行兩兩的相似性判斷。其中,多條語音指令為語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的。在本實施例中,需要進行相似性判斷的兩個語音指令為分別來自不同語音控制設(shè)備的語音指令,而無需對來自同一語音控制設(shè)備的語音指令進行相似性判斷。各語音指令為語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的,語音解析服務(wù)器對每一個源語音命令進行解析,生成每一個源語音命令對應(yīng)的語音指令。步驟102,分別判斷所述多條各語音指令中任意兩條語音指令是否為相似指令,如果是,則執(zhí)行步驟103,否則執(zhí)行步驟104。在接收到語音指令后,分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令,此處的相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令。具體地,當本實施例可以對各語音指令中的任意兩條語音指令進行相似性判斷,分別判斷每兩條指令是否為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令,如果是,即其中有兩條語音指令為相似指令,則執(zhí)行步驟103,否貝U,即其中任意兩條語音指令均不為相似指令,則執(zhí)行步驟104。具體地,在進行相似性判斷時,可以根據(jù)對應(yīng)的源語音命令的采集時間信息判斷兩個語音指令在時間上是否重疊,以及根據(jù)語音指令的指令內(nèi)容判斷兩個語音指令在內(nèi)容上是否滿足重復。具體地,本實施例中上述步驟101接收的多條語音指令是指滿足預設(shè)的時間條件的語音指令,此處的預設(shè)的時間條件用于對進行相似性判斷的語音指令對應(yīng)的源語音命令的采集時間進行限定,如只需對采集時間間隔較近的語音指令進行相似性判斷,而采集時間間隔較遠(如2分鐘以上)的語音指令基本上不可能是相似指令。在上述步驟101之后,本實施例還可以包括如下步驟當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息;將所述新的語音指令的采集時間與之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;將所述新的語音指令與所述相關(guān)語音指令作為所述多條語音指令。其中,語音指令的采集時間為該語音指令對應(yīng)的源語音命令的起始時間戳。相應(yīng)地,本實施例可以設(shè)置一個指令時間表,將接收到的語音指令的采集時間記錄在該指令時間表中。本實施例還可以為該指令時間表設(shè)置一個定時器,該定時器用于對其中存儲的采集時間信息進行計時,當采集時間信息在指令時間表中存儲的時間大于一個預設(shè)時間,如5分鐘時,表明該采集時間信息對應(yīng)的語音指令已超時,其基本上不可能與后續(xù)接收到的其他語音指令為相似指令,則便可以將該指令時間信息從指令時間表中刪除,后續(xù)便不會從指令時間表中獲取到對應(yīng)的已超時的語音指令。本實施例為了避免因?qū)λ姓Z音指令進行相似性判斷而造成的較大計算量,對需要進行相似性判斷的語音指令進行采集時間的限定,即通過指令時間表中存儲的各語音指令的采集時間來判定某兩條語音指令是否需要進行相似性判斷。此處具體根據(jù)指令時間表獲取采集時間與新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令,此處獲取的相關(guān)語音指令以及新的語音指令便是當前需要進行相似性判斷的多條語音指令。步驟103,丟棄兩條相似的語音指令中的一條語音指令。
經(jīng)過上述相似性判斷,當其中兩條語音指令為相似指令時,可以從這兩條相似的語音指令中選擇一條語音指令進行丟棄處理,從而避免出現(xiàn)冗余指令,有效避免了相同命令的重復執(zhí)行。同時,將另外一條語音指令發(fā)送給該語音指令對應(yīng)的語音控制設(shè)備,語音控制設(shè)備在接收到各自的語音指令后,便可以執(zhí)行該語音指令所指示的操作,以響應(yīng)用戶發(fā)出的源語首命令。具體地,本實施例也可以根據(jù)這兩條相似的語音指令對應(yīng)的源語音命令的優(yōu)先級對這兩條語音指令進行冗余處理,其中,語音指令的優(yōu)先級可以根據(jù)默認設(shè)置的源語音命令的優(yōu)先級來獲取,也可以在語音指令中攜帶源語音命令的優(yōu)先級參數(shù),該優(yōu)先級參數(shù)可以根據(jù)實際情況來設(shè)定,如設(shè)置語音控制設(shè)備接收到源語音命令的音量值作為優(yōu)先級參數(shù),音量值越高,則對應(yīng)的語音指令的優(yōu)先級越高。具體為將這兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,此處對應(yīng)的語音控制設(shè)備具體為向語音解析服務(wù)器發(fā)送該語音指令對應(yīng)的源語音命令的設(shè)備,語音控制設(shè)備在接收到各自的語音指令后,便可以執(zhí)行該語音指令所指示的操作,以響應(yīng)用戶發(fā)出的源語音命令。同時,將其中優(yōu)先級低的語音指令進行丟棄處理,同時可以向該優(yōu)先級低的語音指令對應(yīng)的語音控制設(shè)備發(fā)送冗余指令指示,以通知其監(jiān)聽到的源語音命令為冗余命令,從而有效避免了相同命令的重復執(zhí)行。步驟104,將各語音指令分別返回給對應(yīng)的語音控制設(shè)備。經(jīng)過上述相似性判斷,當多條語音指令中不存在相似指令時,可以直接將各語音指令分別返回給對應(yīng)的語音控制設(shè)備,此處對應(yīng)的語音控制設(shè)備具體為向語音解析服務(wù)器發(fā)送該語音指令對應(yīng)的源語音命令的設(shè)備,每個語音指令分別對應(yīng)一個語音控制設(shè)備,語音控制設(shè)備在接收到各自的語音指令后,便可以執(zhí)行該語音指令所指示的操作,以響應(yīng)用戶發(fā)出的源語音命令。本實施例提供了一種指令處理方法,通過接收語音解析服務(wù)器發(fā)送的多條語音指令,分別判斷多條語音指令中任意兩條語音指令是否為相似指令,相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當兩條語音指令為相似指令時,丟棄其中一條語音指令。本實施例避免了多個語音控制設(shè)備重復執(zhí)行同時采集到的一條語音命令,消除了命令重復執(zhí)行帶來的控制錯誤。圖2為本發(fā)明指令處理方法實施例二的信令圖,如圖2所示,本實施例提供了一種指令處理方法,本實施例具體為將RECH功能實體設(shè)置在網(wǎng)絡(luò)側(cè),圖3為本發(fā)明指令處理方法實施例二中的系統(tǒng)架構(gòu)示意圖,如圖3所示,假設(shè)設(shè)備A和設(shè)備B為兩個語音控制設(shè)備,二者均具有語音控制功能,本實施例以網(wǎng)絡(luò)中存在這兩個語音控制設(shè)備為例來對本發(fā)明的方案進行說明,RECH功能實體為與語音解析服務(wù)器相獨立的一個設(shè)備,當然該RECH功能實體也可以集成在語音解析服務(wù)器中。具體地,本實施例提供的指令處理方法可以具體包括如下步驟步驟201,設(shè)備A與語音解析服務(wù)器進行時間同步。步驟202,設(shè)備B與語音解析服務(wù)器進行時間同步。上述步驟為先將具有語音控制功能的設(shè)備A和設(shè)備B分別與位于網(wǎng)絡(luò)側(cè)的語音解 析服務(wù)器進行時間同步,以使得后續(xù)語音解析服務(wù)器能夠準確獲取到在源語音命令中攜帶的采集時間信息。 需要指出的是,本實施例中的上述步驟201和步驟202之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟203,設(shè)備A向語音解析服務(wù)器發(fā)送源語音命令A。當設(shè)備A監(jiān)聽并采集到用戶發(fā)出的源語音命令后,源語音命令可以為“將設(shè)備B的音量降低一格”,設(shè)備A在執(zhí)行該源語音命令之前,需要先將其發(fā)送到語音解析服務(wù)器進行解析處理,本步驟為設(shè)備A向語音解析服務(wù)器發(fā)送源語音命令A。此處的源語音命令A具體指設(shè)備A上報的源語音命令,在該源語音命令A中攜帶源語音命令A的起始時間戮(initial time stamp A)、截止時間戮(end time stamp A)和優(yōu)先權(quán)參數(shù)(priorityre-value A),源語音命令A的起始時間戳用于表示設(shè)備A監(jiān)聽到的該源語音命令的起始時間,源語音命令A的截止時間戳用于表示設(shè)備A監(jiān)聽到的該源語音命令的截止時間,優(yōu)先權(quán)參數(shù)為用戶或設(shè)備設(shè)定的用于在出現(xiàn)相似指令時標識設(shè)備或命令優(yōu)先權(quán)的參數(shù)。步驟204,語音解析服務(wù)器對設(shè)備A進行身份驗證與鑒權(quán)。語音解析服務(wù)器在接收到設(shè)備A上報的源語音命令后,先對該設(shè)備A進行身份驗證與鑒權(quán),身份驗證與鑒權(quán)通過之后,才執(zhí)行后續(xù)的解析處理。步驟205,設(shè)備B向語音解析服務(wù)器發(fā)送源語音命令B。當設(shè)備B監(jiān)聽并采集到用戶發(fā)出的源語音命令后,源語音命令可以為“將設(shè)備B的音量降低一格”,設(shè)備B在執(zhí)行該源語音命令之前,需要先將其發(fā)送到語音解析服務(wù)器進行解析處理,本步驟為設(shè)備B向語音解析服務(wù)器發(fā)送源語音命令B。此處的源語音命令B具體指設(shè)備B上報的源語音命令,在該源語音命令B中攜帶源語音命令B的起始時間戮(initial time stamp B)、截止時間戮(end time stamp B)和優(yōu)先權(quán)參數(shù)(priorityre-value B),源語音命令B的起始時間戳用于表示設(shè)備B監(jiān)聽到的該源語音命令的起始時間,源語音命令A的截止時間戳用于表示設(shè)備B監(jiān)聽到的該源語音命令的截止時間,優(yōu)先權(quán)參數(shù)為用戶設(shè)定的用于在出現(xiàn)相似指令時標識設(shè)備或命令優(yōu)先權(quán)的參數(shù)。步驟206,語音解析服務(wù)器對設(shè)備B進行身份驗證與鑒權(quán)。語音解析服務(wù)器在接收到設(shè)備B上報的源語音命令后,先對該設(shè)備B進行身份驗證與鑒權(quán),身份驗證與鑒權(quán)通過之后,才執(zhí)行后續(xù)的解析處理。
需要指出的是,本實施例中的上述步驟204和步驟206之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟207,語音解析服務(wù)器向RECH功能實體發(fā)送對源語音命令A解析后生成的語首指令A。語音解析服務(wù)器在接收到設(shè)備A上報的源語音命令A,并對設(shè)備A完成身份驗證與鑒權(quán)后,語音解析服務(wù)器對該源語音命令A進行解析處理,通過解析處理生成設(shè)備能夠理解并執(zhí)行的語音指令A,該語音指令A與源語音命令A相對應(yīng)。語音解析服務(wù)器將解析后生成的語音指令A發(fā)送到RECH功能實體,在該語音指令A中攜帶語音指令A對應(yīng)的源語音命令A的起始時間戳、截止時間戳和優(yōu)先權(quán)參數(shù),由RECH功能實體對該語音指令A與其他語音指令進行相似性判斷。步驟208,語音解析服務(wù)器向RECH功能實體發(fā)送對源語音命令B解析后生成的語首指令B。
語音解析服務(wù)器在接收到設(shè)備B上報的源語音命令B,并對設(shè)備B完成身份驗證與鑒權(quán)后,語音解析服務(wù)器對該源語音命令B進行解析處理,通過解析處理生成設(shè)備能夠理解并執(zhí)行的語音指令B,該語音指令B與源語音命令B相對應(yīng)。語音解析服務(wù)器將解析后生成的語音指令B發(fā)送到RECH功能實體,在該語音指令B中攜帶語音指令B對應(yīng)的源語音命令B的起始時間戳、截止時間戳和優(yōu)先權(quán)參數(shù),由RECH功能實體對該語音指令B與其他語音指令進行相似性判斷。需要指出的是,本實施例中的上述步驟207和步驟208之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟209,RECH功能實體根據(jù)語音指令A、語音指令B分別對應(yīng)的源語音命令的起始時間戳和截止時間戳,判斷語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間是否重疊,如果是,則執(zhí)行步驟210,否則執(zhí)行步驟214。RECH功能實體在從語音解析服務(wù)器接收到語音指令A和語音指令B后,根據(jù)其中攜帶的采集時間信息,該采集時間信息可以包括起始時間戳和截止時間戳,來判斷語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間是否重疊,即進行時間相似性判斷。具體地,在進行時間相似性判斷時,RECH功能實體可以判斷源語音命令A的起始時間戳與源語音命令B的起始時間戳的差值是否小于預設(shè)的門限值,且判斷源語音命令A的截止時間戳與源語音命令B的截止時間戳的差值是否小于預設(shè)的門限值,如果二者的起始時間戳的差值和截止時間戳的差值均小于預設(shè)的門限值,則表明語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間重疊,則執(zhí)行步驟210 ;如果二者的起始時間戳或截止時間戳的差值大于或等于預設(shè)的門限值,則表明語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間不重疊,則執(zhí)行步驟214?;蛘撸谶M行時間相似性判斷時,RECH功能實體也可以根據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取語音指令A、語音指令B的持續(xù)時間,判斷語音指令A的持續(xù)時間與語音指令B的持續(xù)時間是否有重疊部分,如果二者的持續(xù)時間存在重疊部分,則表明語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間重疊,則執(zhí)行步驟210 ;如果二者的持續(xù)時間不存在重疊部分,則表明語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間不重疊,則執(zhí)行步驟214。進一步地,在本實施例中,在上述步驟209之前,RECH功能實體還可以先判斷語音指令A的起始時間戳與語音指令B的起始時間戳的差值是否大于預設(shè)的時間閾值,如果是,再執(zhí)行步驟209,否則可以結(jié)束本流程。步驟210,RECH功能實體根據(jù)語音指令A、語音指令B的指令內(nèi)容,判斷語音指令A和語音指令B在內(nèi)容上是否重復,如果是,則執(zhí)行步驟211,否則執(zhí)行步驟214。經(jīng)過上述判斷步驟,當RECH功能實體確定語音指令A與語音指令B在時間上重疊時,RECH功能實體根據(jù)語音指令A、語音指令B的指令內(nèi)容,進一步判斷語音指令A和語音指令B在內(nèi)容上是否重復,具體可以對用戶的語音特征進行比較,從而判斷這兩個語音指令對應(yīng)的源語音命令是否由同一個用戶發(fā)出。如果二者的指令內(nèi)容出現(xiàn)的重疊部分較多,例如可以設(shè)定一個閾值,若二者的指令內(nèi)容中重疊內(nèi)容部分的百分比大于這個閾值,則表明語音指令A和語音指令B在內(nèi)容上重復,語音指令A和語音指令B為相似指令,并執(zhí)行步 驟211 ;如果二者的指令內(nèi)容不相同,則表明語音指令A和語音指令B在內(nèi)容上不重復,語音指令A和語音指令B不為相似指令,并執(zhí)行步驟214。需要指出的是,也可以先判斷語音指令A和語音指令B是否在內(nèi)容上重復,當不滿足時執(zhí)行步驟214,當滿足內(nèi)容上重復時,再判斷語音指令A和語音指令對應(yīng)的源語音命令的采集時間是否重疊,當采集時間不重疊時執(zhí)行步驟214,當采集時間重疊時,執(zhí)行步驟211。步驟211,RECH功能實體根據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的優(yōu)先級參數(shù),獲取語音指令A、語音指令B的優(yōu)先級。通過上述時間相似性判斷和內(nèi)容相似性判斷的判斷過程,當確定語音指令A和語音指令B為相似指令時,RECH功能實體根據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的優(yōu)先級參數(shù),分別獲取語音指令A、語音指令B的優(yōu)先級。例如,當設(shè)定優(yōu)先級參數(shù)為設(shè)備接收到源語音命令的音量值時,通過比較設(shè)備A接收到源語音命令A的音量值與設(shè)備B接收到源語音命令B的音量值,音量值大的意味著其離用戶更近,則可能是用戶面向的設(shè)備;此處可以將音量值大的設(shè)備當作優(yōu)先級高的設(shè)備,即將其定義為主要源語音命令采集終端,將將音量值小的設(shè)備當作優(yōu)先級低的設(shè)備;相應(yīng)地,優(yōu)先級高的設(shè)備對應(yīng)的語音指令的優(yōu)先級也高,優(yōu)先級低的設(shè)備對應(yīng)的語音指令的優(yōu)先級也低。本實施例中假設(shè)語音指令A的優(yōu)先級高于語音指令B的優(yōu)先級。步驟212,RECH功能實體將優(yōu)先級高的語音指令A返回給設(shè)備A,并丟棄優(yōu)先級低的語音指令B。 當獲取到語音指令A和語音指令B的優(yōu)先級后,在本實施例中,優(yōu)先級高的語音指令A認為是源語音命令采集終端發(fā)出的,優(yōu)先級低的語音指令B認為是冗余指令,則RECH功能實體將優(yōu)先級高的語音指令A直接返回給設(shè)備A,并丟棄優(yōu)先級低的語音指令B。步驟213, RECH功能實體向設(shè)備B發(fā)送冗余指令指示。在本實施例中,RECH功能實體還可以向設(shè)備B發(fā)送冗余指令指示,以通知設(shè)備B其監(jiān)聽到的源語音命令為冗余命令,無需執(zhí)行該源語音命令。步驟214,RECH功能實體將語音指令A返回給設(shè)備A,將語音指令B返回給設(shè)備B。通過上述判斷,如果語音指令A與語音指令B不滿足時間相似性條件,或者不滿足內(nèi)容相似性條件時,表明語音指令A與語音指令B不為相似性指令,則RECH功能實體直接將語音指令A返回給設(shè)備A,將語音指令B返回給設(shè)備B,由設(shè)備A和設(shè)備B分別執(zhí)行語音指令A和語首指令B。在本實施例中,當完成上述各個步驟的執(zhí)行后,若RECH功能實體從語音解析服務(wù)器接收到一個新的語音指令,則RECH功能實體還可以將該新的語音指令與已返給其他語音控制設(shè)備的語音指令進行相似性判斷。例如,當RECH功能實體向設(shè)備A返回語音指令A后,若RECH功能實體又從語音解析服務(wù)器接收到一個來自設(shè)備B的新的語音指令,則RECH功能實體還可以將該新的語音指令與已返給設(shè)備A的語音指令A進行相似性判斷。當該新的語音指令與語音指令A為相似指令時,則無需將該新的指令返回給設(shè)備B,而直接將其進行丟棄處理。本實施例提供了一種指令處理方法,RECH功能實體接收語音解析服務(wù)器發(fā)送的語音指令A和語音指令B,根據(jù)語音指令A和語音指令B對應(yīng)的源語音命令的起始時間戳和截止時間戳,以及語音指令A和語音指令B的指令內(nèi)容,判斷語音指令A與語音指令B是否為相似指令;當語音指令A與語音指令B為相似指令時,根據(jù)語音指令A和語音指令B對應(yīng)的 源語音命令的優(yōu)先級參數(shù),將優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。本實施例避免了多個語音控制設(shè)備重復執(zhí)行同時采集到的一條語音命令,消除了命令重復執(zhí)行帶來的控制錯誤。圖4為本發(fā)明指令處理方法實施例三的信令圖,如圖4所示,本實施例提供了一種指令處理方法,本實施例具體為將RECH功能實體設(shè)置在本地,圖5為本發(fā)明指令處理方法實施例三中的系統(tǒng)架構(gòu)示意圖,如圖5所示,假設(shè)設(shè)備A和設(shè)備B為兩個語音控制設(shè)備,二者均具有語音控制功能,本實施例以網(wǎng)絡(luò)中存在這兩個語音控制設(shè)備為例來對本發(fā)明的方案進行說明,RECH功能實體為集成在本地語音控制網(wǎng)關(guān)中的一個模塊,當然該RECH功能實體也可以為設(shè)置在本地的與本地語音控制網(wǎng)關(guān)相獨立的一個設(shè)備。具體地,本實施例提供的指令處理方法可以具體包括如下步驟步驟401,設(shè)備A與本地語音控制網(wǎng)關(guān)進行時間同步。步驟402,設(shè)備B與本地語音控制網(wǎng)關(guān)進行時間同步。上述步驟為先將具有語音控制功能的設(shè)備A和設(shè)備B分別與位于本地的本地語音控制網(wǎng)關(guān)進行時間同步,以使得后續(xù)本地語音控制網(wǎng)關(guān)能夠準確獲取到在源語音命令中攜帶的采集時間信息。需要指出的是,本實施例中的上述步驟401和步驟402之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟403,設(shè)備A向本地語音控制網(wǎng)關(guān)發(fā)送源語音命令A。當設(shè)備A監(jiān)聽并采集到用戶發(fā)出的源語音命令后,源語音命令可以為“將設(shè)備B的音量降低一格”,本步驟為設(shè)備A向本地語音控制網(wǎng)關(guān)發(fā)送源語音命令A。此處的源語音命令A具體指設(shè)備A上報的源語音命令,在該源語音命令A中攜帶源語音命令A的起始時間戮(initial time stamp A)、截止時間戮(end time stamp A)和優(yōu)先權(quán)參數(shù)(priorityre-value A),源語音命令A的起始時間戳用于表示設(shè)備A監(jiān)聽到的該源語音命令的起始時間,源語音命令A的截止時間戳用于表示設(shè)備A監(jiān)聽到的該源語音命令的截止時間,優(yōu)先權(quán)參數(shù)為用戶設(shè)定的用于在出現(xiàn)相似指令時標識設(shè)備或命令優(yōu)先權(quán)的參數(shù)。
步驟404,本地語音控制網(wǎng)關(guān)對設(shè)備A進行身份驗證與鑒權(quán)。本地語音控制網(wǎng)關(guān)在接收到設(shè)備A上報的源語音命令后,先對該設(shè)備A進行身份驗證與鑒權(quán),身份驗證與鑒權(quán)通過之后,才執(zhí)行后續(xù)的處理。步驟405,設(shè)備B向本地語音控制網(wǎng)關(guān)發(fā)送源語音命令B。當設(shè)備B監(jiān)聽并采集到用戶發(fā)出的源語音命令后,源語音命令可以為“將設(shè)備B的音量降低一格”,本步驟為設(shè)備B向本地語音控制網(wǎng)關(guān)發(fā)送源語音命令B。此處的源語音命令B具體指設(shè)備B上報的源語音命令,在該源語音命令B中攜帶源語音命令B的起始時間戮(initial time stamp B)、截止時間戮(end time stamp B)和優(yōu)先權(quán)參數(shù)(priorityre-value B),源語音命令B的起始時間戳用于表示設(shè)備B監(jiān)聽到的該源語音命令的起始時間,源語音命令A的截止時間戳用于表示設(shè)備B監(jiān)聽到的該源語音命令的截止時間,優(yōu)先權(quán)參數(shù)為用戶設(shè)定的用于在出現(xiàn)相似指令時標識設(shè)備或命令優(yōu)先權(quán)的參數(shù)。
步驟406,本地語音控制網(wǎng)關(guān)對設(shè)備B進行身份驗證與鑒權(quán)。本地語音控制網(wǎng)關(guān)在接收到設(shè)備B上報的源語音命令后,先對該設(shè)備B進行身份驗證與鑒權(quán),身份驗證與鑒權(quán)通過之后,才執(zhí)行后續(xù)的處理。 需要指出的是,本實施例中的上述步驟404和步驟406之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟407,本地語音控制網(wǎng)關(guān)將源語音命令A發(fā)送到語音解析服務(wù)器。步驟408,本地語音控制網(wǎng)關(guān)將源語音命令B發(fā)送到語音解析服務(wù)器。需要指出的是,本實施例中的上述步驟407和步驟408之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟409,語音解析服務(wù)器向本地語音控制網(wǎng)關(guān)發(fā)送對源語音命令A解析后生成的語音指令A。語音解析服務(wù)器在接收到設(shè)備A上報的源語音命令A,并對設(shè)備A完成身份驗證與鑒權(quán)后,語音解析服務(wù)器對該源語音命令A進行解析處理,通過解析處理生成設(shè)備能夠理解并執(zhí)行的語音指令A,該語音指令A與源語音命令A相對應(yīng)。語音解析服務(wù)器將解析后生成的語音指令A發(fā)送到本地語音控制網(wǎng)關(guān),在該語音指令A中攜帶語音指令A對應(yīng)的源語音命令A的起始時間戳、截止時間戳和優(yōu)先權(quán)參數(shù),由本地語音控制網(wǎng)關(guān)中的RECH功能實體對該語音指令A與其他語音指令進行相似性判斷。步驟410,語音解析服務(wù)器向本地語音控制網(wǎng)關(guān)發(fā)送對源語音命令B解析后生成的語音指令B。語音解析服務(wù)器在接收到設(shè)備B上報的源語音命令B,并對設(shè)備B完成身份驗證與鑒權(quán)后,語音解析服務(wù)器對該源語音命令B進行解析處理,通過解析處理生成設(shè)備能夠理解并執(zhí)行的語音指令B,該語音指令B與源語音命令B相對應(yīng)。語音解析服務(wù)器將解析后生成的語音指令B發(fā)送到本地語音控制網(wǎng)關(guān),在該語音指令B中攜帶語音指令B對應(yīng)的源語音命令B的起始時間戳、截止時間戳和優(yōu)先權(quán)參數(shù),由本地語音控制網(wǎng)關(guān)中的RECH功能實體對該語音指令B與其他語音指令進行相似性判斷。需要指出的是,本實施例中的上述步驟409和步驟410之間不存在時序限定關(guān)系,即這兩個步驟可以同時執(zhí)行,也可以以任意順序執(zhí)行。步驟411,本地語音控制網(wǎng)關(guān)根據(jù)語音指令A、語音指令B分別對應(yīng)的源語音命令的起始時間戳和截止時間戳,判斷語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間是否重疊,如果是,則執(zhí)行步驟412,否則執(zhí)行步驟416。本地語音控制網(wǎng)關(guān)在從語音解析服務(wù)器接收到語音指令A和語音指令B后,根據(jù)其中攜帶的采集時間信息,該采集時間信息可以包括起始時間戳和截止時間戳,來判斷語音指令A對應(yīng)的源語音命令A和語音指令B對應(yīng)的源語音命令B的采集時間是否重疊,即進行時間相似性判斷。具體地,在進行時間相似性判斷時,本地語音控制網(wǎng)關(guān)中的RECH功能實體可以判斷源語音命令A的起始時間戳與源語音命令B的起始時間戳的差值是否小于預設(shè)的門限值,且判斷源語音命令A的截止時間戳與源語音命令B的截止時間戳的差值是否小于預設(shè)的門限值,如果二者的起始時間戳的差值和截止時間戳的差值均小于預設(shè)的門限值,則表明源語音命令A和源語音命令B的采集時間重疊,則執(zhí)行步驟412 ;如果二者的起始時間戳或截止時間戳的差值大于或等于預設(shè)的門限值,則表明源語音命令A和源語音命令B的采集時間不重疊,則執(zhí)行步驟416。或者,在進行時間相似性判斷時,本地語音控制網(wǎng)關(guān)中的RECH功能實體也可以根 據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取語音指令A、語音指令B的持續(xù)時間,判斷語音指令A的持續(xù)時間與語音指令B的持續(xù)時間是否有重疊部分,如果二者的持續(xù)時間存在重疊部分,則表明源語音命令A和源語音命令B的采集時間重疊,則執(zhí)行步驟412 ;如果二者的持續(xù)時間在時間上不重疊,則表明語音指令A和語音指令B不滿足時間相似性條件,則執(zhí)行步驟416。進一步地,在本實施例中,在上述步驟411之前,RECH功能實體還可以先判斷語音指令A的起始時間戳與語音指令B的起始時間戳的差值是否大于預設(shè)的時間閾值,如果是,再執(zhí)行步驟411,否則可以結(jié)束本流程。步驟412,本地語音控制網(wǎng)關(guān)中的RECH功能實體根據(jù)語音指令A、語音指令B的指令內(nèi)容,判斷語音指令A和語音指令B在內(nèi)容上是否重復,如果是,則執(zhí)行步驟413,否則執(zhí)行步驟416。經(jīng)過上述判斷步驟,當本地語音控制網(wǎng)關(guān)中的RECH功能實體確定語音指令A對應(yīng)的源語音命令A與語音指令B對應(yīng)的源語音命令B的采集時間重疊時,RECH功能實體根據(jù)語音指令A、語音指令B的指令內(nèi)容判斷語音指令A和語音指令B在內(nèi)容上是否重復,具體可以對用戶的語音特征進行比較,從而判斷這兩個語音指令對應(yīng)的源語音命令是否由同一個用戶發(fā)出。如果二者的指令內(nèi)容出現(xiàn)的重疊部分較多,例如可以設(shè)定一個閾值,若二者的指令內(nèi)容中重疊內(nèi)容部分的百分比大于這個閾值,則表明語音指令A和語音指令B在內(nèi)容上重復,語音指令A和語音指令B為相似指令,并執(zhí)行步驟413 ;如果二者的指令內(nèi)容不相同,則表明語音指令A和語音指令B在內(nèi)容上不重復,語音指令A和語音指令B不為相似指令,并執(zhí)彳了步驟416。需要指出的是,也可以先判斷語音指令A和語音指令B是否在內(nèi)容上重復,當不滿足時執(zhí)行步驟416,當滿足內(nèi)容上重復時,再判斷語音指令A和語音指令B對應(yīng)的源語音命令的采集時間是否重疊,當采集時間不重疊時執(zhí)行步驟416,當采集時間重疊時,執(zhí)行步驟413。步驟413,本地語音控制網(wǎng)關(guān)中的RECH功能實體根據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的優(yōu)先級參數(shù),獲取語音指令A、語音指令B的優(yōu)先級。
通過上述時間相似性判斷和內(nèi)容相似性判斷的判斷過程,當確定語音指令A和語音指令B為相似指令時,本地語音控制網(wǎng)關(guān)中的RECH功能實體根據(jù)語音指令A、語音指令B對應(yīng)的源語音命令的優(yōu)先級參數(shù),分別獲取語音指令A、語音指令B的優(yōu)先級。例如,當設(shè)定優(yōu)先級參數(shù)為設(shè)備接收到源語音命令的音量值時,通過比較設(shè)備A接收到源語音命令A的音量值與設(shè)備B接收到源語音命令B的音量值,音量值大的意味著其離用戶更近,則可能是用戶面向的設(shè)備;此處可以將音量值大的設(shè)備當作優(yōu)先級高的設(shè)備,即將其定義為主要源語音命令采集終端,將將音量值小的設(shè)備當作優(yōu)先級低的設(shè)備;相應(yīng)地,優(yōu)先級高的設(shè)備對應(yīng)的語音指令的優(yōu)先級也高,優(yōu)先級低的設(shè)備對應(yīng)的語音指令的優(yōu)先級也低。本實施例中假設(shè)語音指令A的優(yōu)先級高于語音指令B的優(yōu)先級。步驟414,本地語音控制網(wǎng)關(guān)將優(yōu)先級高的語音指令A返回給設(shè)備A,并丟棄優(yōu)先級低的語音指令B。當獲取到語音指令A和語音指令B的優(yōu)先級后,在本實施例中,優(yōu)先級高的語音指令A認為是源語音命令采集終端發(fā)出的,優(yōu)先級低的語音指令B認為是冗余指令,則本地語音控制網(wǎng)關(guān)將優(yōu)先級高的語音指令A直接返回給設(shè)備A,并丟棄優(yōu)先級低的語音指令B。 步驟415,本地語音控制網(wǎng)關(guān)向設(shè)備B發(fā)送冗余指令指示。在本實施例中,本地語音控制網(wǎng)關(guān)還可以向設(shè)備B發(fā)送冗余指令指示,以通知設(shè)備B其監(jiān)聽到的源語音命令為冗余命令,無需執(zhí)行該源語音命令。步驟416,本地語音控制網(wǎng)關(guān)將語音指令A返回給設(shè)備A,將語音指令B返回給設(shè)備B。通過上述判斷,如果語音指令A與語音指令B不滿足時間相似性條件,或者不滿足內(nèi)容相似性條件時,表明語音指令A與語音指令B不為相似性指令,則本地語音控制網(wǎng)關(guān)直接將語音指令A返回給設(shè)備A,將語音指令B返回給設(shè)備B,由設(shè)備A和設(shè)備B分別執(zhí)行語音指令A和語音指令B。在本實施例中,當完成上述各個步驟的執(zhí)行后,若本地語音控制網(wǎng)關(guān)從語音解析服務(wù)器接收到一個新的語音指令,則本地語音控制網(wǎng)關(guān)中的RECH功能實體還可以將該新的語音指令與已返給其他語音控制設(shè)備的語音指令進行相似性判斷。例如,當RECH功能實體向設(shè)備A返回語音指令A后,若RECH功能實體又從語音解析服務(wù)器接收到一個來自設(shè)備B的新的語音指令,則RECH功能實體還可以將該新的語音指令與已返給設(shè)備A的語音指令A進行相似性判斷。當該新的語音指令與語音指令A為相似指令時,則無需將該新的指令返回給設(shè)備B,而直接將其進行丟棄處理。本實施例提供了一種指令處理方法,RECH功能實體接收語音解析服務(wù)器發(fā)送的語音指令A和語音指令B,根據(jù)語音指令A和語音指令B對應(yīng)的源語音命令的起始時間戳和截止時間戳,以及語音指令A和語音指令B的指令內(nèi)容,判斷語音指令A與語音指令B是否為相似指令;當語音指令A與語音指令B為相似指令時,根據(jù)語音指令A和語音指令B對應(yīng)的源語音命令的優(yōu)先級參數(shù),將優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。本實施例避免了多個語音控制設(shè)備重復執(zhí)行同時采集到的一條語音命令,消除了命令重復執(zhí)行帶來的控制錯誤。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質(zhì)包括ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。圖6為本發(fā)明指令處理裝置實施例一的結(jié)構(gòu)示意圖,如圖6所示,本實施例提供了一種指令處理裝置,可以具體執(zhí)行上述方法實施例一中的各個步驟,此處不再贅述。本實施例提供的指令處理裝置可以具體包括接收模塊601、判斷模塊602和冗余指令處理模塊603。其中,接收模塊601用于接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的。判斷模塊602用于分別判斷接收模塊601接收到的所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令。冗余指令處理模塊603用于當判斷模塊602的判斷結(jié)果為多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。圖7為本發(fā)明指令處理裝置實施例二的結(jié)構(gòu)示意圖,如圖7所示,本實施例提供了一種指令處理裝置,可以具體執(zhí)行上述方法實施例二或?qū)嵤├械母鱾€步驟,此處不再贅述。本實施例提供的指令處理裝置在上述圖6所示的基礎(chǔ)之上,接收模塊601接收到的 所述多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容。判斷模塊602可以具體包括第一判斷單元612、第二判斷單元622和相似指令確定單元632。其中,第一判斷單元612用于根據(jù)接收模塊601接收到的所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊。第二判斷單元622用于根據(jù)接收模塊601接收到的所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復。相似指令確定單元632用于當?shù)谝慌袛鄦卧?12和第二判斷單元622的判斷結(jié)果為所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。進一步地,本實施例提供的指令處理裝置還可以包括記錄模塊604和語音指令確定模塊605。記錄模塊604用于當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息。語音指令確定模塊605用于將所述新的語音指令的采集時間與記錄模塊604之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;并將所述新的語音指令與所述相關(guān)語音指令作為所述多條語音指令。具體地,第一判斷單元612可以具體包括第一判斷子單元6121和第二判斷子單元6122。其中,第一判斷子單元6121用于根據(jù)接收模塊601接收到的所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。第二判斷子單元6122用于根據(jù)接收模塊601接收到的根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。
更進一步地,本實施例中的接收模塊601接收到的所述多條語音指令中還分別攜帶所述多條語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù)。該指令處理裝置還可以包括獲取模塊606。獲取模塊606用于根據(jù)接收模塊601接收到的語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定所述兩條相似的語音指令中的優(yōu)先級高的語音指令,以及所述兩條相似的語音指令中的優(yōu)先級低的語音指令。冗余指令處理模塊603具體用于當判斷模塊602的判斷結(jié)果為多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。更進一步地,該指令處理裝置中的冗余指令處理模塊603還用于當接收模塊601接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。本實施例提供了一種指令處理裝置,通過接收語音解析服務(wù)器發(fā)送的多條語音指令,分別判斷多條語音指令中任意兩條語音指令是否為相似指令,相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當兩條語音指令為相似指令時,丟棄其中一條語音指令。本實施例避免了多個語音控制設(shè)備重復執(zhí)行同時采集 到的一條語音命令,消除了命令重復執(zhí)行帶來的控制錯誤。圖8為本發(fā)明指令處理裝置實施例三的結(jié)構(gòu)示意圖,如圖8所示,本實施例提供的指令處理裝置可以具體包括,存儲器801、接收器802和處理器803。其中,接收器802用于接收語音解析服務(wù)器發(fā)送的多條語音指令;所述多條語音指令為所述解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的。存儲器801用于存儲程序指令。處理器803與存儲器801和接收器802耦合。處理器803被配置為根據(jù)存儲器801中的程序指令,分別判斷接收器802接收的所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。具體地,接收器802接收的多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容。處理器803被配置具體用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊;根據(jù)所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復;當所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。進一步地,處理器803還被配置用于當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息;將所述新的語音指令的采集時間與之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;將所述新的語音指令與所述相關(guān)語音指令作為所述多條語首指令。更具體地,處理器803被配置用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。或者,處理器803被配置用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。進一步地,接收器802接收的多條語音指令中還分別攜帶各所述語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù)。處理器803還被配置用于根據(jù)語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令;當多條語音指令中存在相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。更進一步地,處理器803還被配置用于當接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。圖9為本發(fā)明計算機系統(tǒng)實施例的結(jié)構(gòu)示意圖,如圖9所示,本實施例提供了一種 計算機系統(tǒng),該計算機系統(tǒng)可以具體為微處理器計算機,諸如通用目的的PC、定制的PC、例如臺式計算機或智能電話等便攜式設(shè)備,但本發(fā)明的范圍并不局限于這些例子。該計算機系統(tǒng)包括處理器901、輸入設(shè)備902和輸出設(shè)備903,輸入設(shè)備902和輸出設(shè)備903 f禹合于該處理器901。處理器901可以為通用目的的CPU、專用集成電路(Application SpecificIntegrated Circuit ;以下簡稱ASIC)或者一個或多個集成電路,其被配置用于控制執(zhí)行本發(fā)明的程序。輸入設(shè)備902包括鍵盤和鼠標、鍵區(qū)、觸屏輸入設(shè)備、語音輸入模塊等。輸出設(shè)備903包括屏幕顯示單元和語音模塊。計算機系統(tǒng)還包括存儲器904,該存儲器904也可以包括一個或多個下述存儲設(shè)備只讀內(nèi)存(Read-Only Memory ;以下簡稱ROM)、隨機存儲器(Random Access Memory ;以下簡稱RAM)和硬盤。存儲器通過信號總線905與處理器相耦合。該計算機系統(tǒng)還包括用于與通信網(wǎng)絡(luò),諸如以太網(wǎng)(Ethernet)、無線接入網(wǎng)(Radio Access Network ;以下簡稱RAN)、無線局域網(wǎng)(Wireless Local Area Network ;以下簡稱WLAN)等進行通信的通信接口 906。上述存儲器904 (諸如RAM)中存儲有操作系統(tǒng)914、應(yīng)用軟件924、程序934等,其中,操作系統(tǒng)914為控制處理器所執(zhí)行的處理過程的應(yīng)用程序,應(yīng)用軟件924可以為word處理器、email程序等,用以將輸出設(shè)備上的數(shù)據(jù)顯示給用戶,程序934可以具體為本發(fā)明提供的指令處理方法所對應(yīng)的程序。該計算機系統(tǒng)還包括接收器907,被配置用于接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的。本實施例中的處理器901被配置為執(zhí)行存儲在所述存儲器904中的指令,其中,所述處理器901被配置為用于分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。
具體地,接收器907接收的多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容。處理器901被配置具體用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊;根據(jù)所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復;當所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。具體地,處理器901還被配置用于當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息;將所述新的語音指令的采集時間與之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;將所述新的語音指令與所述相關(guān)語音指令作為所述多條語首指令。更具體地,處理器901被配置用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命 令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊?;蛘?,處理器901被配置用于根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。進一步地,接收器907接收的多條語音指令中還分別攜帶各所述語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù)。處理器901還被配置用于根據(jù)語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令;當多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。更進一步地,處理器901還被配置用于當接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。圖10為本發(fā)明指令處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖,如圖10所示,本實施例提供的指令處理系統(tǒng)可以具體包括語音解析服務(wù)器I、多個語音控制設(shè)備2和指令處理裝置3。其中,指令處理裝置3可以具體如上述圖6、圖7或圖8所示的指令處理裝置,該圖中指令處理裝置3為與語音解析服務(wù)器I相獨立的設(shè)備,該指令處理裝置3還可以根據(jù)實際情況設(shè)置在語音解析服務(wù)器I中(圖中未示出)。多個語音控制設(shè)備2分別用于采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述語音解析服務(wù)器I。語音解析服務(wù)器I用于接收多個語音控制設(shè)備2發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并將所述多個語音指令分別發(fā)送到所述指令處理裝置3。本實施例中的語音解析服務(wù)器I還用于與多個語音控制設(shè)備2進行時間同步。
圖11為本發(fā)明指令處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖,如圖11所示,本實施例提供的指令處理系統(tǒng)可以具體包括語音解析服務(wù)器I、多個語音控制設(shè)備2和本地語音控制網(wǎng)關(guān)4。本地語音控制網(wǎng)關(guān)4可以包括上述圖6、圖7或圖8所示的指令處理裝置3。多個語音控制設(shè)備2用于分別采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述本地語音控制網(wǎng)關(guān)3。語音解析服務(wù)器I用于分別接收本地語音控制網(wǎng)關(guān)4發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并分別將所述多個語音指令返回到所述本地語音控制網(wǎng)關(guān)4。本實施例中的本地語音控制網(wǎng)關(guān)4還用于與所述多個語音控制設(shè)備2進行時間同
止/J/ O最后應(yīng)說明的是以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分或者全部技術(shù)特征 進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。
權(quán)利要求
1.一種指令處理方法,其特征在于,包括 接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的; 分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令; 當所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容; 所述分別判斷所述多條語音指令中任意兩條語音指令是否為相似指令包括 根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊; 根據(jù)所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復; 當所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括 當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語音指令的采集時間信息; 將所述新的語音指令的采集時間與之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令; 將所述新的語音指令與所述相關(guān)語音指令作為所述多條語音指令。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述根據(jù)所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊包括 根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊;或者, 根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。
5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,所述多條語音指令中還分別攜帶各所述語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù); 所述方法還包括 根據(jù)語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令;所述當所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令包括 當所述多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。
6.根據(jù)權(quán)利要求1-5任一所述的方法,其特征在于,還包括 當接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 所述語音解析服務(wù)器與各語音控制設(shè)備進行時間同步; 所述語音解析服務(wù)器分別接收所述各語音控制設(shè)備發(fā)送的所述源語音命令。
8.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 本地語音控制網(wǎng)關(guān)與各語音控制設(shè)備進行時間同步; 所述本地語音控制網(wǎng)關(guān)分別接收所述各語音控制設(shè)備發(fā)送的所述源語音命令,并將各所述源語音命令發(fā)送到所述語音解析服務(wù)器。
9.一種指令處理裝置,其特征在于,包括 接收模塊,用于接收語音解析服務(wù)器發(fā)送的多條語音指令,所述多條語音指令為所述語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的; 判斷模塊,用于分別判斷所述接收模塊接收到的所述多條語音指令中任意兩條語音指令是否為相似指令,所述相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令; 冗余指令處理模塊,用于當所述判斷模塊的判斷結(jié)果為所述多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述接收模塊接收到的所述多條語音指令中分別攜帶各語音指令對應(yīng)的源語音命令的采集時間信息和各語音指令的指令內(nèi)容; 所述判斷模塊包括 第一判斷單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令對應(yīng)的源語音命令的采集時間信息,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間是否重疊; 第二判斷單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令的指令內(nèi)容,分別判斷所述多條語音指令中任意兩條語音指令在內(nèi)容上是否重復; 相似指令確定單元,用于當所述第一判斷單元和第二判斷單元的判斷結(jié)果為所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的采集時間重疊,且在內(nèi)容上重復時,確定所述兩條語音指令為相似指令。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括 記錄模塊,用于當從所述語音解析服務(wù)器接收到一條新的語音指令時,記錄所述新的語首指令的米集時間 目息; 語音指令確定模塊,用于將所述新的語音指令的采集時間與所述記錄模塊之前記錄的語音指令的采集時間進行比較,確定采集時間與所述新的語音指令的采集時間的差值小于預定閾值的相關(guān)語音指令;并將所述新的語音指令與所述相關(guān)語音指令作為所述多條語音指令。
12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述第一判斷單元包括 第一判斷子單元,用于根據(jù)所述接收模塊接收到的所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別判斷所述多條語音指令中任意兩條語音指令對應(yīng)的源語音命令的起始時間戳的差值,以及截止時間戳的差值是否均小于預設(shè)的門限值;若所述起始時間戳的差值以及所述截止時間戳的差值均小于預設(shè)的門限值,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊;或者, 第二判斷子單元,用于所述接收模塊接收到的根據(jù)所述多條語音指令對應(yīng)的源語音命令的起始時間戳和截止時間戳,分別獲取多條語音指令的持續(xù)時間,判斷所述多條語音指令中任意兩條語音指令的持續(xù)時間是否有重疊部分;若所述持續(xù)時間有重疊部分,則確定所述多條語音指令中的任意兩條指令對應(yīng)的源語音命令的采集時間重疊。
13.根據(jù)權(quán)利要求9-12中任一項所述的裝置,其特征在于,所述接收模塊接收到的所述多條語音指令中還分別攜帶所述多條語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù); 所述裝置還包括 獲取模塊,用于根據(jù)所述接收模塊接收到的語音指令對應(yīng)的源語音命令的優(yōu)先級參數(shù),確定兩條相似的語音指令中的優(yōu)先級高的語音指令,以及兩條相似的語音指令中的優(yōu)先級低的語音指令; 所述冗余指令處理模塊具體用于當所述判斷模塊的判斷結(jié)果為所述多條語音指令中存在兩條語音指令為相似指令時,將兩條相似的語音指令中優(yōu)先級高的語音指令返回給對應(yīng)的語音控制設(shè)備,將優(yōu)先級低的語音指令進行丟棄處理。
14.根據(jù)權(quán)利要求9-13任一所述的裝置,其特征在于,所述冗余指令處理模塊還用于當所述接收模塊接收到的一條新的語音指令與已返回給其他語音控制設(shè)備的語音指令為相似指令時,對所述新的語音指令進行丟棄處理。
15.一種指令處理系統(tǒng),其特征在于,包括語音解析服務(wù)器、多個語音控制設(shè)備和權(quán)利要求9-14中任一項所述的指令處理裝置; 所述多個語音控制設(shè)備分別用于采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述語音解析服務(wù)器; 所述語音解析服務(wù)器用于接收所述多個語音控制設(shè)備發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并將所述多個語音指令分別發(fā)送到所述指令處理裝置。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述語音解析服務(wù)器還用于與所述多個語音控制設(shè)備進行時間同步。
17.一種指令處理系統(tǒng),其特征在于,包括語音解析服務(wù)器、多個語音控制設(shè)備和本地語音控制網(wǎng)關(guān),所述本地語音控制網(wǎng)關(guān)包括權(quán)利要求9-14中任一項所述的指令處理裝置; 所述多個語音控制設(shè)備用于分別采集多個源語音命令,并分別將所述多個源語音命令發(fā)送到所述本地語音控制網(wǎng)關(guān); 所述語音解析服務(wù)器用于分別接收所述本地語音控制網(wǎng)關(guān)發(fā)送的多個源語音命令,對所述多個源語音命令分別進行解析后生成所述多個源語音命令對應(yīng)的多個語音指令,并分別將所述多個語音指令返回到所述本地語音控制網(wǎng)關(guān)。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述本地語音控制網(wǎng)關(guān)還用于與所述多個語音控制設(shè)備進行時間同步。
全文摘要
本發(fā)明實施例提供一種指令處理方法、裝置和系統(tǒng),方法包括接收語音解析服務(wù)器發(fā)送的多條語音指令,多條語音指令為語音解析服務(wù)器對來自不同語音控制設(shè)備的源語音命令進行解析后生成的;分別判斷多條語音指令中任意兩條語音指令是否為相似指令,相似指令為不同語音控制設(shè)備對同一語音信息進行采集得到的源語音命令對應(yīng)的語音指令;當多條語音指令中存在兩條語音指令為相似指令時,丟棄兩條相似的語音指令中的一條語音指令。本發(fā)明實施例還提供了一種指令處理裝置和系統(tǒng)。本實施例消除了命令重復執(zhí)行帶來的控制錯誤。
文檔編號G10L19/00GK102831894SQ201210282268
公開日2012年12月19日 申請日期2012年8月9日 優(yōu)先權(quán)日2012年8月9日
發(fā)明者梅敬青, 薛國棟 申請人:華為終端有限公司