本發(fā)明涉及車載技術(shù)領(lǐng)域,尤其涉及一種語音識(shí)別處理方法及裝置。
背景技術(shù):
隨著車載智能系統(tǒng)的發(fā)展,如今大多數(shù)的車載智能系統(tǒng)都可以實(shí)現(xiàn)如dvd(digitalversatiledisc,數(shù)字通用光盤)播放、音樂播放、收音、導(dǎo)航、sd(securedigitalmemorycard,安全數(shù)字存儲(chǔ)卡)卡讀取、usb(universalserialbus,通用串行總線)讀取、倒車后視、藍(lán)牙連接、wi-fi(wireless-fidelity,無線網(wǎng))連接、2g/3g(secondgeneration/3rd-generation,第二代移動(dòng)通訊技術(shù)/第三代移動(dòng)通訊技術(shù))無線上網(wǎng)等功能,目前的車載智能系統(tǒng)可以給到用戶許多便捷的服務(wù)。
為了進(jìn)一步方便用戶對(duì)車載系統(tǒng)的控制,還可以在車載系統(tǒng)中設(shè)置聲控系統(tǒng),例如,通過用戶聲音控制車輛啟動(dòng)或熄火。但現(xiàn)有的車載聲控系統(tǒng)都是只能基于用戶當(dāng)前的聲音內(nèi)容進(jìn)行識(shí)別控制,即現(xiàn)有的車載聲控系統(tǒng)是無法根據(jù)多方面因素進(jìn)行識(shí)別的,從而降低了對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種語音識(shí)別處理方法及裝置,可提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
本發(fā)明第一方面提供了一種語音識(shí)別處理方法,包括:
獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;
識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;
當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),根據(jù) 所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。
本發(fā)明第二方面提供了一種語音識(shí)別處理裝置,包括:
內(nèi)容獲取模塊,用于獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;
類型識(shí)別獲取模塊,用于識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;
生成執(zhí)行模塊,用于當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),根據(jù)所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。
本發(fā)明實(shí)施例通過獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容,其中,至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;再識(shí)別目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型,并當(dāng)至少一個(gè)候選車載場景類型中包含目標(biāo)車載場景類型時(shí),根據(jù)至少一個(gè)歷史語音內(nèi)容生成目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,由此可見,本發(fā)明實(shí)施例不僅僅可以對(duì)當(dāng)前的目標(biāo)語音內(nèi)容進(jìn)行識(shí)別,還可以結(jié)合至少一個(gè)歷史語音內(nèi)容對(duì)目標(biāo)語音內(nèi)容進(jìn)行分析,從而可以提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種語音識(shí)別處理方法的流程示意圖;
圖2是本發(fā)明實(shí)施例提供的另一種語音識(shí)別處理方法的流程示意圖;
圖3是本發(fā)明實(shí)施例提供的一種語音識(shí)別處理裝置的結(jié)構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例提供的一種類型識(shí)別獲取模塊的結(jié)構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例提供的一種生成執(zhí)行模塊的結(jié)構(gòu)示意圖;
圖6是本發(fā)明實(shí)施例提供的另一種語音識(shí)別處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參見圖1,是本發(fā)明實(shí)施例提供的一種語音識(shí)別處理方法的流程示意圖,所述方法可以包括:
s101,獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;
具體的,車載系統(tǒng)中的語音識(shí)別處理裝置可以通過麥克風(fēng)等收音器獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,此時(shí),所述語音識(shí)別處理裝置還可以進(jìn)一步獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;其中,所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,即所述至少一個(gè)歷史語音內(nèi)容中每相鄰時(shí)刻的兩個(gè)歷史語音內(nèi)容所對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系。例如,若已存儲(chǔ)有3個(gè)時(shí)間相鄰的歷史語音內(nèi)容a、b、c(獲取到a的歷史時(shí)刻<獲取到b的歷史時(shí)刻<獲取到c的歷史時(shí)刻,c為基于所述當(dāng)前時(shí)刻的上一時(shí)刻的語音內(nèi)容),且a對(duì)應(yīng)的歷史車載場景類型與b對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,同時(shí)b對(duì)應(yīng)的歷史車載場景類型與c對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,則所述語音識(shí)別處理裝置可以獲取歷史語音內(nèi)容a、b、c,并將歷史語音內(nèi)容a、b、c作為基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容。
其中,各種所述映射關(guān)系是在預(yù)設(shè)的多個(gè)車載場景類型之間預(yù)先設(shè)置的,所述語音識(shí)別處理裝置可以根據(jù)預(yù)先設(shè)置的各種所述映射關(guān)系形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;其中,每個(gè)所述關(guān)系鏈均由至少一個(gè)車載場景類型之間的映射關(guān)系構(gòu)成。兩個(gè)車載場景類型之間的映射關(guān) 系可以表示這兩個(gè)車載場景類型對(duì)應(yīng)的語音內(nèi)容之間具備關(guān)聯(lián)性。例如,若預(yù)設(shè)的多個(gè)車載場景類型包括音樂、社交、導(dǎo)航、視頻等等,則可以設(shè)置音樂與社交之間有映射關(guān)系,音樂與音樂之間有映射關(guān)系,導(dǎo)航與社交之間有映射關(guān)系等等,并根據(jù)這些映射關(guān)系形成多條不同的關(guān)系鏈,如可以形成關(guān)系鏈:音樂-音樂-社交-導(dǎo)航。因此,通過查找所述場景關(guān)系鏈表即可知道所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間是否具有映射關(guān)系。
s102,識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;
具體的,所述語音識(shí)別處理裝置可以進(jìn)一步識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,識(shí)別目標(biāo)車載場景類型的具體過程可以為:對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型。例如,若所述目標(biāo)語音內(nèi)容為“收聽xx的歌”,則在語音識(shí)別后可以獲取到對(duì)應(yīng)的場景關(guān)鍵詞“收聽”和“歌”,根據(jù)“收聽”和“歌”可以確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為音樂。其中,每種車載場景類型都對(duì)應(yīng)有多個(gè)預(yù)設(shè)的場景關(guān)鍵詞,因此,通過匹配所述場景關(guān)鍵詞即可確定出其對(duì)應(yīng)的車載場景類型。
所述語音識(shí)別處理裝置還可以進(jìn)一步從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;例如,若至少一個(gè)所述歷史車載場景類型為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種映射關(guān)系分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則可以從所述場景關(guān)系鏈表中獲取到與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型包括音樂、社交、視頻。
s103,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),根據(jù)所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作;
具體的,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),說明所述目標(biāo)車載場景類型與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系,即所述目標(biāo)語音內(nèi)容與所述至少一個(gè)歷史語音內(nèi)容之間具有關(guān)聯(lián)性,此時(shí), 所述語音識(shí)別處理裝置可以將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容,并生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述語音識(shí)別處理裝置可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”,并生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,所述業(yè)務(wù)執(zhí)行指令為基于社交應(yīng)用的音頻數(shù)據(jù)發(fā)送指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,即通過調(diào)用社交應(yīng)用以將歌曲xx分享給社交應(yīng)用中的a朋友。由此可見,通過結(jié)合所述至少一個(gè)歷史語音內(nèi)容對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行分析,可以更加準(zhǔn)確的識(shí)別出用戶的真正意圖,避免車載聲控系統(tǒng)僅對(duì)所述目標(biāo)語音內(nèi)容“分享給a朋友”進(jìn)行識(shí)別和分析而導(dǎo)致識(shí)別錯(cuò)誤。在執(zhí)行對(duì)應(yīng)的業(yè)務(wù)操作后,所述語音識(shí)別處理裝置還可以進(jìn)一步將所述目標(biāo)語音內(nèi)容作為新的歷史語音內(nèi)容,以便于在下一刻進(jìn)行語音識(shí)別和分析時(shí)可以一并結(jié)合分析該新的歷史語音內(nèi)容,以保證語音識(shí)別的準(zhǔn)確性。
本發(fā)明實(shí)施例通過獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容,其中,至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;再識(shí)別目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型,并當(dāng)至少一個(gè)候選車載場景類型中包含目標(biāo)車載場景類型時(shí),根據(jù)至少一個(gè)歷史語音內(nèi)容生成目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,由此可見,本發(fā)明實(shí)施例不僅僅可以對(duì)當(dāng)前的目標(biāo)語音內(nèi)容進(jìn)行識(shí)別,還可以結(jié)合至少一個(gè)歷史語音內(nèi)容對(duì)目標(biāo)語音內(nèi)容進(jìn)行分析,從而可以提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
請(qǐng)參見圖2,是本發(fā)明實(shí)施例提供的另一種語音識(shí)別處理方法的流程示意圖,所述方法可以包括:
s201,在預(yù)設(shè)的多個(gè)車載場景類型之間設(shè)置多個(gè)不同的映射關(guān)系,以形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;
具體的,車載系統(tǒng)中的語音識(shí)別處理裝置可以在預(yù)設(shè)的多個(gè)車載場景類型之間設(shè)置多個(gè)不同的映射關(guān)系,以形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;其中,每個(gè)所述關(guān)系鏈均由至少一個(gè)車載場景類型之間 的映射關(guān)系構(gòu)成。兩個(gè)車載場景類型之間的映射關(guān)系可以表示這兩個(gè)車載場景類型對(duì)應(yīng)的語音內(nèi)容之間具備關(guān)聯(lián)性。例如,若預(yù)設(shè)的多個(gè)車載場景類型包括音樂、社交、導(dǎo)航、視頻等等,則可以設(shè)置音樂與社交之間有映射關(guān)系,音樂與音樂之間有映射關(guān)系,導(dǎo)航與社交之間有映射關(guān)系等等,并根據(jù)這些映射關(guān)系形成多條不同的關(guān)系鏈,如可以形成關(guān)系鏈:音樂-社交-導(dǎo)航,該關(guān)系鏈表示音樂與社交之間有映射關(guān)系,同時(shí)社交與導(dǎo)航之間有映射關(guān)系。
s202,獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;
具體的,所述語音識(shí)別處理裝置可以通過麥克風(fēng)等收音器獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,此時(shí),所述語音識(shí)別處理裝置還可以進(jìn)一步獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;其中,所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,即所述至少一個(gè)歷史語音內(nèi)容中每相鄰時(shí)刻的兩個(gè)歷史語音內(nèi)容所對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系。例如,若已存儲(chǔ)有3個(gè)時(shí)間相鄰的歷史語音內(nèi)容a、b、c(獲取到a的歷史時(shí)刻<獲取到b的歷史時(shí)刻<獲取到c的歷史時(shí)刻,c為基于所述當(dāng)前時(shí)刻的上一時(shí)刻的語音內(nèi)容),且a對(duì)應(yīng)的歷史車載場景類型與b對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,同時(shí)b對(duì)應(yīng)的歷史車載場景類型與c對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,則所述語音識(shí)別處理裝置可以獲取歷史語音內(nèi)容a、b、c,并將歷史語音內(nèi)容a、b、c作為基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容。
s203,對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型;
具體的,所述語音識(shí)別處理裝置可以對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型。例如,若所述目標(biāo)語音內(nèi)容為“收聽xx的歌”,則在語音識(shí)別后可以獲取到對(duì)應(yīng)的場景關(guān)鍵詞“收聽”和“歌”,根據(jù)“收聽”和“歌”可以確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為音樂。其中,每種車載場景類型都對(duì)應(yīng)有多個(gè)預(yù)設(shè)的場景關(guān)鍵詞,因此,通過匹配所述場景關(guān)鍵詞即可確定出其對(duì)應(yīng)的車載場景類型,如可以預(yù)設(shè)為音樂的車載場景類型所對(duì)應(yīng)的場景關(guān)鍵詞包括“收聽”、“歌”、“歌手”等等。
s204,在預(yù)設(shè)的場景關(guān)系鏈表中查找與至少一個(gè)所述歷史車載場景類型對(duì)應(yīng)的歷史關(guān)系鏈;
具體的,所述語音識(shí)別處理裝置進(jìn)一步在預(yù)設(shè)的場景關(guān)系鏈表中查找與至少一個(gè)所述歷史車載場景類型對(duì)應(yīng)的歷史關(guān)系鏈,所述歷史關(guān)系鏈?zhǔn)侵钢辽僖粋€(gè)所述歷史車載場景類型之間具有一定順序的映射關(guān)系鏈。例如,至少一個(gè)所述歷史車載場景類型包括音樂、社交、導(dǎo)航,其中,識(shí)別出音樂的時(shí)刻<識(shí)別出社交的時(shí)刻<識(shí)別出導(dǎo)航的時(shí)刻,則所述語音識(shí)別處理裝置可以在所述場景關(guān)系鏈表中獲取到對(duì)應(yīng)的歷史關(guān)系鏈為:音樂-社交-導(dǎo)航,即音樂與社交具有映射關(guān)系,同時(shí)社交與導(dǎo)航具有映射關(guān)系。
s205,在所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端相連接的至少一個(gè)候選車載場景類型;
具體的,所述語音識(shí)別處理裝置還可以進(jìn)一步在所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端相連接的至少一個(gè)候選車載場景類型,所述至少一個(gè)候選車載場景類型均與所述歷史關(guān)系鏈的末端的歷史車載場景類型具有映射關(guān)系。例如,若所述歷史關(guān)系鏈為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種關(guān)系鏈分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則可以從所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端的歷史車載場景類型相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻。
s206,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容;
具體的,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),說明所述目標(biāo)車載場景類型與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系,即所述目標(biāo)語音內(nèi)容與所述至少一個(gè)歷史語音內(nèi)容之間具有關(guān)聯(lián)性,此時(shí),所述語音識(shí)別處理裝置可以將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述語音識(shí)別處理裝置可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”。
s207,生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作;
具體的,得到所述合并語音內(nèi)容后,所述語音識(shí)別處理裝置可以生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述語音識(shí)別處理裝置可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”,并生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,所述業(yè)務(wù)執(zhí)行指令為基于社交應(yīng)用的音頻數(shù)據(jù)發(fā)送指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,即通過調(diào)用社交應(yīng)用以將歌曲xx分享給社交應(yīng)用中的a朋友。由此可見,通過結(jié)合所述至少一個(gè)歷史語音內(nèi)容對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行分析,可以更加準(zhǔn)確的識(shí)別出用戶的真正意圖,避免車載聲控系統(tǒng)僅對(duì)所述目標(biāo)語音內(nèi)容“分享給a朋友”進(jìn)行識(shí)別和分析而導(dǎo)致識(shí)別錯(cuò)誤。在執(zhí)行對(duì)應(yīng)的業(yè)務(wù)操作后,所述語音識(shí)別處理裝置還可以進(jìn)一步將所述目標(biāo)語音內(nèi)容作為新的歷史語音內(nèi)容,以便于在下一刻進(jìn)行語音識(shí)別和分析時(shí)可以一并結(jié)合分析該新的歷史語音內(nèi)容,以保證語音識(shí)別的準(zhǔn)確性。
可選的,當(dāng)所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型時(shí),所述語音識(shí)別處理裝置可以刪除所述至少一個(gè)歷史語音內(nèi)容,并生成所述目標(biāo)語音信息對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若所述歷史關(guān)系鏈為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種關(guān)系鏈分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則可以從所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端的歷史車載場景類型相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻,而當(dāng)前的所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為導(dǎo)航,則說明所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型,此時(shí),可以將兩個(gè)歷史語音內(nèi)容刪除,并僅根據(jù)所述目標(biāo)語音內(nèi)容執(zhí)行對(duì)應(yīng)的導(dǎo)航業(yè)務(wù)操作,并且所述語音識(shí)別處理裝置也可以進(jìn)一步將所述目標(biāo)語音內(nèi)容作為新的歷史語音內(nèi)容。又例如,存有一個(gè)歷史語音內(nèi)容為“收聽xx歌曲”,而當(dāng)前的目標(biāo)語音內(nèi)容為“導(dǎo)航到地點(diǎn)a”,其中,歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型為音樂,且與音樂 相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻,而目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為導(dǎo)航,說明所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型,此時(shí),可以刪除歷史語音內(nèi)容為“收聽xx歌曲”,并僅對(duì)所述目標(biāo)語音內(nèi)容為“導(dǎo)航到地點(diǎn)a”進(jìn)行識(shí)別和分析,以調(diào)用車載導(dǎo)航應(yīng)用并對(duì)地點(diǎn)a進(jìn)行導(dǎo)航操作。
本發(fā)明實(shí)施例通過獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容,其中,至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;再識(shí)別目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型,并當(dāng)至少一個(gè)候選車載場景類型中包含目標(biāo)車載場景類型時(shí),根據(jù)至少一個(gè)歷史語音內(nèi)容生成目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,由此可見,本發(fā)明實(shí)施例不僅僅可以對(duì)當(dāng)前的目標(biāo)語音內(nèi)容進(jìn)行識(shí)別,還可以結(jié)合至少一個(gè)歷史語音內(nèi)容對(duì)目標(biāo)語音內(nèi)容進(jìn)行分析,從而可以提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
請(qǐng)參見圖3,是本發(fā)明實(shí)施例提供的一種語音識(shí)別處理裝置的結(jié)構(gòu)示意圖,所述語音識(shí)別處理裝置1可以包括:內(nèi)容獲取模塊10、類型識(shí)別獲取模塊20、生成執(zhí)行模塊30;
所述內(nèi)容獲取模塊10,用于獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;
具體的,所述內(nèi)容獲取模塊10可以通過麥克風(fēng)等收音器獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,此時(shí),所述內(nèi)容獲取模塊10還可以進(jìn)一步獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;其中,所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,即所述至少一個(gè)歷史語音內(nèi)容中每相鄰時(shí)刻的兩個(gè)歷史語音內(nèi)容所對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系。例如,若已存儲(chǔ)有3個(gè)時(shí)間相鄰的歷史語音內(nèi)容a、b、c(獲取到a的歷史時(shí)刻<獲取到b的歷史時(shí)刻<獲取到c的歷史時(shí)刻,c為基于所述當(dāng)前時(shí)刻的上一時(shí)刻的語音內(nèi)容),且a對(duì)應(yīng)的歷史車載場景類型與b對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,同時(shí)b對(duì)應(yīng)的歷史車載場景類型與c對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系,則所述內(nèi)容獲取模塊10可以獲取歷史語音內(nèi)容a、 b、c,并將歷史語音內(nèi)容a、b、c作為基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容。
所述類型識(shí)別獲取模塊20,用于識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;
具體的,所述類型識(shí)別獲取模塊20可以進(jìn)一步識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,識(shí)別目標(biāo)車載場景類型的具體過程可以為:對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型。例如,若所述目標(biāo)語音內(nèi)容為“收聽xx的歌”,則所述類型識(shí)別獲取模塊20在語音識(shí)別后可以獲取到對(duì)應(yīng)的場景關(guān)鍵詞“收聽”和“歌”,根據(jù)“收聽”和“歌”可以確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為音樂。其中,每種車載場景類型都對(duì)應(yīng)有多個(gè)預(yù)設(shè)的場景關(guān)鍵詞,因此,通過匹配所述場景關(guān)鍵詞即可確定出其對(duì)應(yīng)的車載場景類型。
所述類型識(shí)別獲取模塊20還可以進(jìn)一步從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;例如,若至少一個(gè)所述歷史車載場景類型為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種映射關(guān)系分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則所述類型識(shí)別獲取模塊20可以從所述場景關(guān)系鏈表中獲取到與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型包括音樂、社交、視頻。
所述生成執(zhí)行模塊30,用于當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),根據(jù)所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作;
具體的,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),說明所述目標(biāo)車載場景類型與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系,即所述目標(biāo)語音內(nèi)容與所述至少一個(gè)歷史語音內(nèi)容之間具有關(guān)聯(lián)性,此時(shí),所述生成執(zhí)行模塊30可以將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容,并生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行 指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述生成執(zhí)行模塊30可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”,并生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,所述業(yè)務(wù)執(zhí)行指令為基于社交應(yīng)用的音頻數(shù)據(jù)發(fā)送指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,即通過調(diào)用社交應(yīng)用以將歌曲xx分享給社交應(yīng)用中的a朋友。由此可見,通過結(jié)合所述至少一個(gè)歷史語音內(nèi)容對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行分析,可以更加準(zhǔn)確的識(shí)別出用戶的真正意圖,避免車載聲控系統(tǒng)僅對(duì)所述目標(biāo)語音內(nèi)容“分享給a朋友”進(jìn)行識(shí)別和分析而導(dǎo)致識(shí)別錯(cuò)誤。在執(zhí)行對(duì)應(yīng)的業(yè)務(wù)操作后,所述語音識(shí)別處理裝置1還可以進(jìn)一步將所述目標(biāo)語音內(nèi)容作為新的歷史語音內(nèi)容,以便于在下一刻進(jìn)行語音識(shí)別和分析時(shí)可以一并結(jié)合分析該新的歷史語音內(nèi)容,以保證語音識(shí)別的準(zhǔn)確性。
進(jìn)一步的,如圖3所示,所述語音識(shí)別處理裝置1還可以包括:設(shè)置存儲(chǔ)模塊40;
所述設(shè)置存儲(chǔ)模塊40,用于在預(yù)設(shè)的多個(gè)車載場景類型之間設(shè)置多個(gè)不同的映射關(guān)系,以形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;
具體的,所述設(shè)置存儲(chǔ)模塊40可以在預(yù)設(shè)的多個(gè)車載場景類型之間設(shè)置多個(gè)不同的映射關(guān)系,以形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;其中,每個(gè)所述關(guān)系鏈均由至少一個(gè)車載場景類型之間的映射關(guān)系構(gòu)成。兩個(gè)車載場景類型之間的映射關(guān)系可以表示這兩個(gè)車載場景類型對(duì)應(yīng)的語音內(nèi)容之間具備關(guān)聯(lián)性。例如,若預(yù)設(shè)的多個(gè)車載場景類型包括音樂、社交、導(dǎo)航、視頻等等,則所述設(shè)置存儲(chǔ)模塊40可以設(shè)置音樂與社交之間有映射關(guān)系,音樂與音樂之間有映射關(guān)系,導(dǎo)航與社交之間有映射關(guān)系等等,并根據(jù)這些映射關(guān)系形成多條不同的關(guān)系鏈,如可以形成關(guān)系鏈:音樂-社交-導(dǎo)航,該關(guān)系鏈表示音樂與社交之間有映射關(guān)系,同時(shí)社交與導(dǎo)航之間有映射關(guān)系。
可選的,所述生成執(zhí)行模塊30,還用于當(dāng)所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型時(shí),刪除所述至少一個(gè)歷史語音內(nèi)容,并生成所述目標(biāo)語音信息對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若所述歷史關(guān)系鏈為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的 歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種關(guān)系鏈分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則可以從所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端的歷史車載場景類型相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻,而當(dāng)前的所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為導(dǎo)航,則說明所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型,此時(shí),所述生成執(zhí)行模塊30可以將兩個(gè)歷史語音內(nèi)容刪除,并僅根據(jù)所述目標(biāo)語音內(nèi)容執(zhí)行對(duì)應(yīng)的導(dǎo)航業(yè)務(wù)操作,并且所述語音識(shí)別處理裝置1也可以進(jìn)一步將所述目標(biāo)語音內(nèi)容作為新的歷史語音內(nèi)容。又例如,存有一個(gè)歷史語音內(nèi)容為“收聽xx歌曲”,而當(dāng)前的目標(biāo)語音內(nèi)容為“導(dǎo)航到地點(diǎn)a”,其中,歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型為音樂,且與音樂相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻,而目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為導(dǎo)航,說明所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型,此時(shí),所述生成執(zhí)行模塊30可以刪除歷史語音內(nèi)容為“收聽xx歌曲”,并僅對(duì)所述目標(biāo)語音內(nèi)容為“導(dǎo)航到地點(diǎn)a”進(jìn)行識(shí)別和分析,以調(diào)用車載導(dǎo)航應(yīng)用并對(duì)地點(diǎn)a進(jìn)行導(dǎo)航操作。
進(jìn)一步的,再請(qǐng)參見圖4,是本發(fā)明實(shí)施例提供的一種類型識(shí)別獲取模塊20的結(jié)構(gòu)示意圖,所述類型識(shí)別獲取模塊20可以包括:識(shí)別確定單元201、查找單元202、獲取單元203;
所述識(shí)別確定單元201,用于對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型;
具體的,所述識(shí)別確定單元201可以對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型。例如,若所述目標(biāo)語音內(nèi)容為“收聽xx的歌”,則所述識(shí)別確定單元201在語音識(shí)別后可以獲取到對(duì)應(yīng)的場景關(guān)鍵詞“收聽”和“歌”,根據(jù)“收聽”和“歌”可以確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型為音樂。其中,每種車載場景類型都對(duì)應(yīng)有多個(gè)預(yù)設(shè)的場景關(guān)鍵詞,因此,通過匹配所述場景關(guān)鍵詞即可確定出其對(duì)應(yīng)的車載場景類型,如可以預(yù)設(shè)為音樂的車載場景類型所對(duì)應(yīng)的場景關(guān)鍵詞包括“收聽”、“歌”、“歌手”等等。
所述查找單元202,用于在預(yù)設(shè)的場景關(guān)系鏈表中查找與至少一個(gè)所述歷史車載場景類型對(duì)應(yīng)的歷史關(guān)系鏈;所述歷史關(guān)系鏈包括至少一個(gè)所述歷史車載場景類型之間的映射關(guān)系;
具體的,所述查找單元202進(jìn)一步在預(yù)設(shè)的場景關(guān)系鏈表中查找與至少一個(gè)所述歷史車載場景類型對(duì)應(yīng)的歷史關(guān)系鏈,所述歷史關(guān)系鏈?zhǔn)侵钢辽僖粋€(gè)所述歷史車載場景類型之間具有一定順序的映射關(guān)系鏈。例如,至少一個(gè)所述歷史車載場景類型包括音樂、社交、導(dǎo)航,其中,識(shí)別出音樂的時(shí)刻<識(shí)別出社交的時(shí)刻<識(shí)別出導(dǎo)航的時(shí)刻,則所述查找單元202可以在所述場景關(guān)系鏈表中獲取到對(duì)應(yīng)的歷史關(guān)系鏈為:音樂-社交-導(dǎo)航,即音樂與社交具有映射關(guān)系,同時(shí)社交與導(dǎo)航具有映射關(guān)系。
所述獲取單元203,用于在所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端相連接的至少一個(gè)候選車載場景類型;所述至少一個(gè)候選車載場景類型均與所述歷史關(guān)系鏈的末端的歷史車載場景類型具有映射關(guān)系;
具體的,所述獲取單元203可以進(jìn)一步在所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端相連接的至少一個(gè)候選車載場景類型,所述至少一個(gè)候選車載場景類型均與所述歷史關(guān)系鏈的末端的歷史車載場景類型具有映射關(guān)系。例如,若所述歷史關(guān)系鏈為:音樂-音樂(即兩個(gè)歷史語音內(nèi)容對(duì)應(yīng)的歷史車載場景類型均為音樂,且音樂和音樂之間具有映射關(guān)系),且在所述場景關(guān)系鏈表中存在多種關(guān)系鏈分別為:音樂-音樂-音樂、音樂-音樂-社交、音樂-音樂-視頻,則所述獲取單元203可以從所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端的歷史車載場景類型相連接的至少一個(gè)候選車載場景類型包括音樂、社交、視頻。
進(jìn)一步的,再請(qǐng)參見圖5,是本發(fā)明實(shí)施例提供的一種生成執(zhí)行模塊30的結(jié)構(gòu)示意圖,所述生成執(zhí)行模塊30可以包括:分析單元301、生成執(zhí)行單元302;
所述分析單元301,用于當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容;
具體的,當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),說明所述目標(biāo)車載場景類型與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系,即所述目標(biāo)語音內(nèi)容與所述至少一個(gè)歷史語音內(nèi)容之間具有關(guān)聯(lián)性,此時(shí), 所述分析單元301可以將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述分析單元301可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”。
所述生成執(zhí)行單元302,用于生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作;
具體的,得到所述合并語音內(nèi)容后,所述生成執(zhí)行單元302可以生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。例如,若有一個(gè)歷史語音內(nèi)容為“收聽歌曲xx”,當(dāng)前的所述目標(biāo)語音內(nèi)容為“分享給a朋友”,則所述分析單元301可以將所述歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,得到合并語音內(nèi)容為“將歌曲xx分享給a朋友”,并由所述生成執(zhí)行單元302生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,所述業(yè)務(wù)執(zhí)行指令為基于社交應(yīng)用的音頻數(shù)據(jù)發(fā)送指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,即通過調(diào)用社交應(yīng)用以將歌曲xx分享給社交應(yīng)用中的a朋友。
本發(fā)明實(shí)施例通過獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容,其中,至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;再識(shí)別目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型,并當(dāng)至少一個(gè)候選車載場景類型中包含目標(biāo)車載場景類型時(shí),根據(jù)至少一個(gè)歷史語音內(nèi)容生成目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,由此可見,本發(fā)明實(shí)施例不僅僅可以對(duì)當(dāng)前的目標(biāo)語音內(nèi)容進(jìn)行識(shí)別,還可以結(jié)合至少一個(gè)歷史語音內(nèi)容對(duì)目標(biāo)語音內(nèi)容進(jìn)行分析,從而可以提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
請(qǐng)參見圖6,是本發(fā)明實(shí)施例提供的另一種語音識(shí)別處理裝置的結(jié)構(gòu)示意圖。如圖6所示,所述語音識(shí)別處理裝置1000可以包括:至少一個(gè)處理器1001,例如cpu,至少一個(gè)網(wǎng)絡(luò)接口1004,用戶接口1003,存儲(chǔ)器1005,至少一個(gè)通信總線1002。其中,通信總線1002用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(display)、鍵盤(keyboard),可選用戶接口1003 還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如wi-fi接口)。存儲(chǔ)器1005可以是高速ram存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)器。存儲(chǔ)器1005可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器1001的存儲(chǔ)裝置。如圖6所示,作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及設(shè)備控制應(yīng)用程序。
在圖6所示的語音識(shí)別處理裝置1000中,用戶接口1003主要用于為用戶提供輸入的接口,獲取用戶輸出的音頻數(shù)據(jù);而處理器1001可以用于調(diào)用存儲(chǔ)器1005中存儲(chǔ)的設(shè)備控制應(yīng)用程序,并具體執(zhí)行以下步驟:
獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于所述當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容;所述至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;
識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型;
當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),根據(jù)所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。
在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行識(shí)別所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)所述歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型時(shí),具體執(zhí)行以下步驟:
對(duì)所述目標(biāo)語音內(nèi)容進(jìn)行語音識(shí)別,以獲取對(duì)應(yīng)的場景關(guān)鍵詞,并根據(jù)所述場景關(guān)鍵詞確定所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型;
在預(yù)設(shè)的場景關(guān)系鏈表中查找與至少一個(gè)所述歷史車載場景類型對(duì)應(yīng)的歷史關(guān)系鏈;所述歷史關(guān)系鏈包括至少一個(gè)所述歷史車載場景類型之間的映射關(guān)系;
在所述場景關(guān)系鏈表中獲取與所述歷史關(guān)系鏈的末端相連接的至少一個(gè)候選車載場景類型;所述至少一個(gè)候選車載場景類型均與所述歷史關(guān)系鏈的末端的歷史車載場景類型具有映射關(guān)系。
在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行當(dāng)所述至少一個(gè)候選車載場景類 型中包含所述目標(biāo)車載場景類型時(shí),根據(jù)所述至少一個(gè)歷史語音內(nèi)容生成所述目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作時(shí),具體執(zhí)行以下步驟:
當(dāng)所述至少一個(gè)候選車載場景類型中包含所述目標(biāo)車載場景類型時(shí),將所述至少一個(gè)歷史語音內(nèi)容與所述目標(biāo)語音內(nèi)容進(jìn)行結(jié)合分析,以得到合并語音內(nèi)容;
生成所述合并語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。
在一個(gè)實(shí)施例中,所述處理器1001還執(zhí)行以下步驟:
在預(yù)設(shè)的多個(gè)車載場景類型之間設(shè)置多個(gè)不同的映射關(guān)系,以形成多條不同的關(guān)系鏈,并將所有關(guān)系鏈存儲(chǔ)于場景關(guān)系鏈表中;
其中,每個(gè)所述關(guān)系鏈均由至少一個(gè)車載場景類型之間的映射關(guān)系構(gòu)成。
在一個(gè)實(shí)施例中,所述處理器1001還執(zhí)行以下步驟:
當(dāng)所述至少一個(gè)候選車載場景類型中不包含所述目標(biāo)車載場景類型時(shí),刪除所述至少一個(gè)歷史語音內(nèi)容,并生成所述目標(biāo)語音信息對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)所述業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作。
本發(fā)明實(shí)施例通過獲取當(dāng)前時(shí)刻的目標(biāo)語音內(nèi)容,并獲取預(yù)先存儲(chǔ)的基于當(dāng)前時(shí)刻的至少一個(gè)歷史語音內(nèi)容,其中,至少一個(gè)歷史語音內(nèi)容分別對(duì)應(yīng)的歷史車載場景類型之間具有映射關(guān)系;再識(shí)別目標(biāo)語音內(nèi)容對(duì)應(yīng)的目標(biāo)車載場景類型,并從預(yù)設(shè)的場景關(guān)系鏈表中獲取與至少一個(gè)歷史車載場景類型具有映射關(guān)系的至少一個(gè)候選車載場景類型,并當(dāng)至少一個(gè)候選車載場景類型中包含目標(biāo)車載場景類型時(shí),根據(jù)至少一個(gè)歷史語音內(nèi)容生成目標(biāo)語音內(nèi)容對(duì)應(yīng)的業(yè)務(wù)執(zhí)行指令,并根據(jù)業(yè)務(wù)執(zhí)行指令執(zhí)行對(duì)應(yīng)業(yè)務(wù)操作,由此可見,本發(fā)明實(shí)施例不僅僅可以對(duì)當(dāng)前的目標(biāo)語音內(nèi)容進(jìn)行識(shí)別,還可以結(jié)合至少一個(gè)歷史語音內(nèi)容對(duì)目標(biāo)語音內(nèi)容進(jìn)行分析,從而可以提高對(duì)用戶的聲音內(nèi)容的識(shí)別準(zhǔn)確度。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存儲(chǔ)記憶體(randomaccessmemory,ram)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。