亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音交互方法及裝置與流程

文檔序號:12864801閱讀:421來源:國知局
語音交互方法及裝置與流程

本發(fā)明涉及語音信號處理領(lǐng)域,具體涉及一種語音交互方法及裝置。



背景技術(shù):

隨著人工智能相關(guān)技術(shù)的日益成熟,人們的生活開始走向智能化,各種智能設(shè)備逐漸進(jìn)入人們的日常生活中,如智能車機(jī)。語音作為智能設(shè)備應(yīng)用中主流的交互方式之一,其方便快捷的優(yōu)勢有目共睹。

在進(jìn)行語音交互時(shí),用戶輸入的語音被轉(zhuǎn)寫成文本后會經(jīng)過語義理解,客戶端根據(jù)語義理解的結(jié)果,對相應(yīng)的事件進(jìn)行響應(yīng)。然而,不同于手機(jī)等移動終端的近距離語音交互,在智能家居或汽車等應(yīng)用環(huán)境中,用戶離麥克風(fēng)的距離相對較遠(yuǎn),加之吵鬧環(huán)境下的噪音、車載環(huán)境下的胎噪、空調(diào)噪聲、副駕駛和后排乘客的人聲干擾等因素,使得環(huán)境變得非常復(fù)雜。這樣即使在用戶沒有交互意圖時(shí),由于噪聲的影響,識別和語義產(chǎn)生誤觸發(fā),給出了語義理解的結(jié)果,從而導(dǎo)致客戶端做出了對應(yīng)的響應(yīng)的情況時(shí)有發(fā)生。這不僅會給用戶帶來較差的用戶體驗(yàn),還會由于語義的誤觸發(fā)而影響后續(xù)語義理解的正確性,尤其是在考慮歷史信息的語音交互過程中。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種語音交互方法及裝置,避免識別和語義產(chǎn)生誤觸發(fā),以提高對人機(jī)交互語義理解的正確率,提升用戶體驗(yàn)。

為此,本發(fā)明提供如下技術(shù)方案:

一種語音交互方法,所述方法包括:

接收語音識別文本;

將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解;

基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果;

對所述置信度最高的語義理解結(jié)果做出響應(yīng)。

優(yōu)選地,進(jìn)行語義理解包括:

獲取所述語音識別文本中各子片段的語義槽;

將所述語音識別文本中存在語義槽的各子片段替換成對應(yīng)的語義槽,得到所述語音識別文本的語義匹配路徑;

根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑。

優(yōu)選地,所述根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑包括:

預(yù)先設(shè)定表示句首或句尾無意義字符的通配的第一符號、表示句中無意義字符的通配的第二符號和表示有意義字符的完全匹配的第三符號;

將所述語音識別文本的各子片段與當(dāng)前業(yè)務(wù)所支持的句式進(jìn)行匹配,確定各子片段對應(yīng)的符號,該符號為第一符號、第二符號或第三符號中的一種;

將所述語音識別文本的各子片段替換為對應(yīng)的符號,得到所述語音識別文本的文本匹配路。

優(yōu)選地,所述基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序包括:

預(yù)先構(gòu)建排序模型,所述排序模型的輸入包括:文本的詞向量、語義匹配路徑、文本匹配路徑,以及客戶端所處應(yīng)用狀態(tài),所述排序模型的輸出為輸入的文本屬于各業(yè)務(wù)的概率;

基于所述排序模型得到所述語音識別文本屬于各業(yè)務(wù)的概率;

根據(jù)上述概率的值或者上述概率的值及閾值門限進(jìn)行排序。

優(yōu)選地,所述基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果包括:

基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)、歷史狀態(tài)、以及與搜索數(shù)據(jù)相似度進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,其中,所述與搜索數(shù)據(jù)相似度為基于候選語義理解結(jié)果搜索的數(shù)個(gè)相似度最高的搜索數(shù)據(jù)與該候選語義理解結(jié)果的文本相似度,所述候選語義理解結(jié)果為當(dāng)前業(yè)務(wù)得到的輸入文本的語義理解結(jié)果;

所述排序模型的輸入還包括:與搜索數(shù)據(jù)相似度、歷史狀態(tài),所述歷史狀態(tài)包括上一時(shí)刻語義理解結(jié)果。

優(yōu)選地,所述方法還包括:

在接收語音識別文本之后,對所述語音識別文本進(jìn)行語言模型拒識;

所述將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中包括:

將未被拒識的語音識別文本分別分發(fā)到各業(yè)務(wù)中。

優(yōu)選地,所述方法還包括:

在接收語音識別文本之后,對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù);

所述將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中包括:

將所述語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中;或者

將未被拒識的語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中。

優(yōu)選地,所述對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù)包括:

對于每一個(gè)業(yè)務(wù),預(yù)先構(gòu)建該業(yè)務(wù)的預(yù)分類模型,所述預(yù)分類模型的輸入為文本的詞向量,輸出為該文本屬于該業(yè)務(wù)的概率;以及預(yù)先構(gòu)建每一個(gè)業(yè)務(wù)包括的特定句式和關(guān)鍵詞的模板的庫;

利用所述預(yù)分類模型獲取所述語音識別文本或未被拒識的語音識別文本分別屬于各業(yè)務(wù)的概率;

如果該概率的值≥設(shè)定閾值,則對應(yīng)的各業(yè)務(wù)作為預(yù)分類業(yè)務(wù);

如果該概率的值<設(shè)定閾值,則將當(dāng)前概率對應(yīng)的語音識別文本或未被拒識的語音識別文本在當(dāng)前概率對應(yīng)的各業(yè)務(wù)的庫中與進(jìn)行匹配,如果匹配成功,則該庫所屬的業(yè)務(wù)作為預(yù)分類業(yè)務(wù)。

優(yōu)選地,所述方法還包括:

在進(jìn)行置信度排序之前,根據(jù)當(dāng)前語音交互采集的語音信號的信噪比調(diào)整所述閾值門限,其中,隨著信噪比的增加,所述閾值門限降低。

優(yōu)選地,所述排序模型的輸入還包括:信噪比;

所述排序模型的參數(shù)包括:原始文本的權(quán)重,其中,該原始文本的權(quán)重隨著信噪比的變小而變大。

相應(yīng)地,本發(fā)明還提供了一種語音交互裝置,所述裝置包括:

文本接收模塊,用于接收語音識別文本;

語義理解模塊,用于將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解;

置信度排序模塊,用于基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果;

響應(yīng)模塊,用于對所述置信度最高的語義理解結(jié)果做出響應(yīng)。

優(yōu)選地,所述語義理解模塊包括:

語義槽獲取單元,用于獲取所述語音識別文本中各子片段的語義槽;

語義匹配路徑獲取單元,用于將所述語音識別文本中存在語義槽的各子片段替換成對應(yīng)的語義槽,得到所述語音識別文本的語義匹配路徑;

文本匹配路徑獲取單元,用于根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑。

優(yōu)選地,所述文本匹配路徑獲取單元包括:

句式匹配子單元,用于將所述語音識別文本的各子片段與當(dāng)前業(yè)務(wù)所支持的句式進(jìn)行匹配,確定各子片段對應(yīng)的符號,該符號為第一符號、第二符號或第三符號中的一種;

符號替換子單元,用于將所述語音識別文本的各子片段替換為對應(yīng)的符號,得到所述語音識別文本的文本匹配路。

優(yōu)選地,所述裝置還包括:

排序模型構(gòu)建模塊,用于預(yù)先構(gòu)建排序模型,所述排序模型的輸入包括:文本的詞向量、語義匹配路徑、文本匹配路徑,以及客戶端所處應(yīng)用狀態(tài),所述排序模型的輸出為輸入的文本屬于各業(yè)務(wù)的概率;

所述置信度排序模塊包括:

業(yè)務(wù)概率獲取單元,用于基于所述排序模型得到所述語音識別文本屬于各業(yè)務(wù)的概率;

排序單元,用于根據(jù)上述概率的值或者上述概率的值及閾值門限進(jìn)行排序。

優(yōu)選地,所述置信度排序模塊具體用于基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)、歷史狀態(tài)、以及與搜索數(shù)據(jù)相似度進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,其中,所述與搜索數(shù)據(jù)相似度為基于候選語義理解結(jié)果搜索的數(shù)個(gè)相似度最高的搜索數(shù)據(jù)與該候選語義理解結(jié)果的文本相似度,所述候選語義理解結(jié)果為當(dāng)前業(yè)務(wù)得到的輸入文本的語義理解結(jié)果;

所述排序模型的輸入還包括:與搜索數(shù)據(jù)相似度、歷史狀態(tài),所述歷史狀態(tài)包括上一時(shí)刻語義理解結(jié)果。

優(yōu)選地,所述裝置還包括:

語言模型拒識模塊,用于在接收語音識別文本之后,對所述語音識別文本進(jìn)行語言模型拒識;

所述語義理解模塊具體用于將未被拒識的語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解。

優(yōu)選地,所述裝置還包括:

業(yè)務(wù)預(yù)分類模塊,用于在接收語音識別文本之后,對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù);

所述語義理解模塊具體用于將所述語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中,并分別進(jìn)行語義理解;或者將未被拒識的語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中,并分別進(jìn)行語義理解。

優(yōu)選地,所述裝置還包括:

預(yù)分類模型構(gòu)建模塊,用于對于每一個(gè)業(yè)務(wù),預(yù)先構(gòu)建該業(yè)務(wù)的預(yù)分類模型,所述預(yù)分類模型的輸入為文本的詞向量,輸出為該文本屬于該業(yè)務(wù)的概率;

句式和關(guān)鍵詞模板庫構(gòu)建模塊,用于預(yù)先構(gòu)建每一個(gè)業(yè)務(wù)包括的特定句式和關(guān)鍵詞的模板的庫;

所述業(yè)務(wù)預(yù)分類模塊包括:

業(yè)務(wù)概率獲取單元,用于利用所述預(yù)分類模型獲取所述語音識別文本或未被拒識的語音識別文本分別屬于各業(yè)務(wù)的概率;

預(yù)分類業(yè)務(wù)獲取單元,用于如果該概率的值≥設(shè)定閾值,則對應(yīng)的各業(yè)務(wù)作為預(yù)分類業(yè)務(wù);如果該概率的值<設(shè)定閾值,則將當(dāng)前概率對應(yīng)的語音識別文本或未被拒識的語音識別文本在當(dāng)前概率對應(yīng)的各業(yè)務(wù)的庫中與進(jìn)行匹配,如果匹配成功,則該庫所屬的業(yè)務(wù)作為預(yù)分類業(yè)務(wù)。

優(yōu)選地,所述裝置還包括:

信噪比獲取模塊,用于采集當(dāng)前信噪比信息;

閾值門限調(diào)整模塊,用于在進(jìn)行置信度排序之前,根據(jù)當(dāng)前語音交互采集的語音信號的信噪比調(diào)整所述閾值門限,其中,隨著信噪比的增加,所述閾值門限降低。

優(yōu)選地,所述排序模型的輸入還包括:信噪比;

所述排序模型的參數(shù)包括:原始文本的權(quán)重,其中,該原始文本的權(quán)重隨著信噪比的變小而變大。

本發(fā)明實(shí)施例提供的語音交互方法及裝置,在接收語音識別文本之后,將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解,然后基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,對所述置信度最高的語義理解結(jié)果做出響應(yīng)。由于基于多維度的信息進(jìn)行語義理解結(jié)果的置信度排序,不僅考慮了語義理解結(jié)果與各業(yè)務(wù)的匹配度,還同時(shí)考慮了客戶端所處應(yīng)用的狀態(tài),例如是否處于導(dǎo)航狀態(tài)或聽音樂狀態(tài),客戶端所處應(yīng)用及應(yīng)用狀態(tài)可能就是語音交互所要處理的對象,因此,基于多維度的信息進(jìn)行語義理解可以有效提升判斷其業(yè)務(wù)所屬的準(zhǔn)確度,進(jìn)而避免識別和語義產(chǎn)生誤觸發(fā),以提高對人機(jī)交互語義理解的正確率,可以對置信度最高的語義理解結(jié)果做出響應(yīng),提升用戶體驗(yàn)。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,在進(jìn)行語義理解時(shí)獲取了語音識別文本的語義匹配路徑和文本匹配路徑,來判斷不同業(yè)務(wù)匹配路徑的優(yōu)劣,有助于提升人機(jī)交互語義理解的正確率。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,通過預(yù)先構(gòu)建的排序模型來確定輸入的文本屬于各業(yè)務(wù)的概率,該排序模型可以是離線訓(xùn)練好的,便于直接利用其獲取語音識別文本在各業(yè)務(wù)的語義理解結(jié)果的置信度排序。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,在接收語音識別文本之后,對所述語音識別文本進(jìn)行語言模型拒識。由于各種環(huán)境噪聲和人聲干擾很容易被識別成文本,但經(jīng)過大數(shù)據(jù)分析發(fā)現(xiàn),這些識別文本往往不符合人們正常說話和交互的語言邏輯,因此可以通過語言模型拒識部分環(huán)境噪聲和人聲干擾,降低識別和語義產(chǎn)生誤觸發(fā)的概率。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,在接收語音識別文本之后,對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,這樣可以在一定程度上起到無效語義的拒識作用,例如,系統(tǒng)支持10種交互意圖的業(yè)務(wù),通過業(yè)務(wù)預(yù)分類分發(fā)到了6個(gè)業(yè)務(wù),則減小了其他四個(gè)業(yè)務(wù)對最終結(jié)果的干擾,且能提升后續(xù)數(shù)據(jù)處理效率。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,還給出了業(yè)務(wù)預(yù)分類的具體實(shí)現(xiàn)步驟,通過模型加規(guī)則的方法對語音識別文本進(jìn)行預(yù)分類,本發(fā)明不但可以減小非目標(biāo)業(yè)務(wù)對最終結(jié)果的干擾,同時(shí),還可以防止應(yīng)分發(fā)的業(yè)務(wù)沒有分發(fā)到,可以盡可能的提高召回率。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,還可以利用前端聲學(xué)信號處理的信噪比等信息,自適應(yīng)調(diào)整所述閾值門限,如信噪比高的環(huán)境,設(shè)定較低的閾值門限,提升系統(tǒng)交互成功率,在信噪比低的環(huán)境下,提高閾值門限,減少誤吸收。

進(jìn)一步地,本發(fā)明實(shí)施例提供的語音交互方法及裝置,還可以利用前端聲學(xué)信號處理的信噪比等信息自適應(yīng)調(diào)整所述排序模型的參數(shù),如信噪比低時(shí),文本層面的誤吸收影響更大,相應(yīng)的調(diào)高原始文本的權(quán)重,以提升語音識別準(zhǔn)確率。

附圖說明

為了更清楚地說明本申請實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實(shí)施例語音交互方法的第一種流程圖;

圖2是本發(fā)明實(shí)施例進(jìn)行語義理解的一種流程圖;

圖3是本發(fā)明實(shí)施例進(jìn)行置信度排序的第一種流程圖;

圖4是本發(fā)明實(shí)施例語音交互方法的第二種流程圖;

圖5是本發(fā)明實(shí)施例語音交互方法的第三種流程圖;

圖6是本發(fā)明實(shí)施例獲取預(yù)分類業(yè)務(wù)的一種流程圖;

圖7是本發(fā)明實(shí)施例進(jìn)行置信度排序的第二種流程圖;

圖8是本發(fā)明實(shí)施例語音交互裝置的第一種結(jié)構(gòu)示意圖;

圖9是本發(fā)明實(shí)施例語音交互裝置的第二種結(jié)構(gòu)示意圖;

圖10是本發(fā)明實(shí)施例語音交互裝置的第三種結(jié)構(gòu)示意圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施方式對本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說明。

目前在車載及智能家居語音交互中,多是只利用輸入文本進(jìn)行語義理解得到最終的語義理解結(jié)果,利用信息較少,在復(fù)雜場景下,達(dá)不到很好的語義拒識效果。為了增強(qiáng)語義拒識效果,現(xiàn)有技術(shù)進(jìn)行了改進(jìn),例如:1.如對每個(gè)業(yè)務(wù)語義理解得分設(shè)置固定閾值門限,只有高于該門限才輸出,否則給予拒識;2.設(shè)置業(yè)務(wù)優(yōu)先級,在多個(gè)業(yè)務(wù)得分相同的情況下,通過人為設(shè)定的業(yè)務(wù)優(yōu)先級,使優(yōu)先級高的優(yōu)先給出;3.為了防止不同業(yè)務(wù)間說法的誤吸收,從資源的層面進(jìn)行裁剪某業(yè)務(wù)支持的說法范圍,從而降低誤吸收的概率。如“我想去xxx”,該說法容易在火車、航班、導(dǎo)航三個(gè)業(yè)務(wù)中產(chǎn)生誤吸收,現(xiàn)有技術(shù)方案通常做法為使火車和航班業(yè)不支持該類說法,用戶只有說帶有“火車”、“火車票”等強(qiáng)句式的說法才能進(jìn)入火車業(yè)務(wù)。但是上述方法需要在交互效果和誤吸收上面做權(quán)衡,過高的閾值會明顯降低效果,而過低的閾值又起不到拒識的作用。也就是說,以上改進(jìn)方式并不能從根本上解決問題,尤其是在復(fù)雜的語音交互環(huán)境下。

如圖1所示,是本發(fā)明實(shí)施例語音交互方法的第一種流程圖,包括以下步驟:

步驟101,接收語音識別文本。

在本實(shí)施例中,僅涉及語義理解及拒識部分,前端聲學(xué)信號處理和語音識別不在此闡述。具體地,可以首先通過麥克風(fēng)拾取音頻,然后經(jīng)過前端聲學(xué)信號處理和語音識別,得到識別文本。

步驟102,將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解。

在本實(shí)施例中,將語音識別文本分發(fā)到各業(yè)務(wù),然后通過文法、模型貼弧等方式分別做語義理解,當(dāng)然,現(xiàn)有技術(shù)中其它語義理解方式也適用,在此不做限定。各業(yè)務(wù)進(jìn)行語義理解時(shí)互不干擾,若該業(yè)務(wù)有語義理解的結(jié)果,則轉(zhuǎn)下一步驟,否則該業(yè)務(wù)被拒識。具體地,所述語義理解技術(shù)可以為:通過文法、模型貼弧等方式抽取語義槽,并生成語義匹配路徑和文本匹配路徑。

其中,基于文法的語義理解為傳統(tǒng)的語義理解方法,通過在文法資源中支持特定的句式和說法實(shí)現(xiàn),在此不再贅述。

步驟103,基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果.

在實(shí)施例中,通過步驟102的多個(gè)業(yè)務(wù)的語義理解,得到多個(gè)業(yè)務(wù)的語義理解結(jié)果,此時(shí)需要根據(jù)一些有效信息對結(jié)果進(jìn)行排序,并最終給出一個(gè)正確的響應(yīng)。

由于人機(jī)之間的交互,尤其是在人與應(yīng)用目的性很強(qiáng)的車載、智能家居等交互中,用戶表達(dá)真實(shí)交互意圖時(shí),說法句式往往是帶有較強(qiáng)的意圖,與日常閑聊和誤識別文本相比,其更符合語言規(guī)范,而且用戶也會傾向性的去說一些交互系統(tǒng)推薦的句式說法。因此,可以從語義匹配路徑、文本匹配路徑和客戶端所處應(yīng)用的狀態(tài)等多個(gè)維度出發(fā),計(jì)算一個(gè)交互文本所屬業(yè)務(wù)的概率,并根據(jù)概率值的大小進(jìn)行排序,并將概率最大的語義理解的結(jié)果作為響應(yīng)的對象。

具體地,根據(jù)語義匹配路徑和文本匹配路徑判斷不同業(yè)務(wù)匹配路徑的優(yōu)劣。例如,在導(dǎo)航業(yè)務(wù)中,“導(dǎo)航到startdate”這類語義匹配路徑不合理,應(yīng)予以拒識。在根據(jù)語義匹配路徑排序的過程中,也會用到文本匹配路徑信息。

為了提升語義理解的結(jié)果的可信度,本發(fā)明基于接收的語音識別文本的文本詞向量、語義匹配路徑、文本匹配路徑、當(dāng)前客戶端所處應(yīng)用的狀態(tài)等進(jìn)行多維度語義排序。例如,預(yù)先構(gòu)建以上述信息作為模型輸入的排序模型,通過排序模型預(yù)測輸入的語音識別文本所述業(yè)務(wù)的概率。其中,當(dāng)前客戶端所處應(yīng)用的狀態(tài)如:在音樂業(yè)務(wù)的暫停狀態(tài)、在導(dǎo)航業(yè)務(wù)的導(dǎo)航中狀態(tài)、空調(diào)的制冷中狀態(tài)等,交互系統(tǒng)的各功能模塊所具備的各種狀態(tài)。優(yōu)選地,該排序模型利用大量文本和標(biāo)注數(shù)據(jù)進(jìn)行離線訓(xùn)練。

步驟104,對所述置信度最高的語義理解結(jié)果做出響應(yīng)。

本發(fā)明實(shí)施例提供的語音交互方法,基于各業(yè)務(wù)得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,由于基于多維度的信息進(jìn)行語義理解結(jié)果的置信度排序,不僅考慮了語義理解結(jié)果與各業(yè)務(wù)的匹配度,還同時(shí)考慮了客戶端所處應(yīng)用狀態(tài),例如是否處于導(dǎo)航狀態(tài)或聽音樂狀態(tài),客戶端所處應(yīng)用及應(yīng)用狀態(tài)可能就是語音交互所要處理的對象,因此,基于多維度的信息進(jìn)行語義理解可以有效提升判斷其業(yè)務(wù)所屬的準(zhǔn)確度,進(jìn)而避免識別和語義產(chǎn)生誤觸發(fā),以提高對人機(jī)交互語義理解的正確率,可以對置信度最高的語義理解結(jié)果做出響應(yīng),提升用戶體驗(yàn)。

如圖2所示,是本發(fā)明實(shí)施例進(jìn)行語義理解的一種流程圖。在本實(shí)施中,進(jìn)行語義理解可以包括以下步驟:

步驟201,獲取所述語音識別文本中各子片段的語義槽。

具體地,可以通過文法、模型貼弧等方法獲取輸入的語音交互文本的語義槽,當(dāng)然,其他可以獲取文本的語義槽的方法也適用,在此不做限定。

基于文法獲取輸入文本的語義槽可以同現(xiàn)有技術(shù),在此不再贅述。

與文法不同的是,模型貼弧的方法是基于神經(jīng)網(wǎng)絡(luò)模型預(yù)測輸入文本中語義槽。例如,首先對大量文本進(jìn)行語義槽標(biāo)注,并基于標(biāo)注數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,如rnn(循環(huán)神經(jīng)網(wǎng)絡(luò)),在語義理解時(shí),通過訓(xùn)練好的模型預(yù)測輸入文本中各子片段能被貼上語義槽(標(biāo)簽)的概率,并給概率大于設(shè)定閾值的對應(yīng)片段貼上語義槽(標(biāo)簽)。所述語義槽(標(biāo)簽)跟業(yè)務(wù)密切相關(guān),一般由大量實(shí)驗(yàn)和/或經(jīng)驗(yàn)確定,以導(dǎo)航業(yè)務(wù)為例,其語義槽包括但不限于:statrloc(起始地)、endloc(目的地)、vialoc(途徑地)、avoidloc(規(guī)避地)、landmark(周邊)等,各語義槽對應(yīng)的標(biāo)識符可以采用本領(lǐng)域通用的標(biāo)識符,當(dāng)然也可以自行設(shè)定,在此僅為示例性說明。

以下以語音識別文本為“萬達(dá)附近的酒店”為例進(jìn)行說明,模型預(yù)測萬達(dá)為landmark,酒店為endloc。

步驟202,將所述語音識別文本中存在語義槽的各子片段替換成對應(yīng)的語義槽,得到所述語音識別文本的語義匹配路徑。

在本實(shí)施例中,語義匹配路徑是基于獲取的語義槽將語音識別文本中被貼上語義槽的各子片段替換成語義槽名,未被貼上語義槽的各子片段仍用原始文本。如“快幫我查一下明天合肥去北京的機(jī)票好不好”,在flight業(yè)務(wù)中,“明天”、“合肥”、“北京”分別被賦予了startdate、startloc和endloc語義,則其語義匹配路徑為“快幫我查一下startdatestartloc去endloc的機(jī)票好不好”。

步驟203,根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑。

語義匹配路徑能有效的區(qū)分哪些文本片段被賦予了語義,但是這樣表達(dá)的信息不全面,因?yàn)閮H依靠語義匹配路徑不能區(qū)分沒有被賦予語義的文本片段所表達(dá)的信息,例如,不同的業(yè)務(wù)通常具有固定的句式說法,而未被賦予語義的文本片段無法通過語義匹配路徑反映出其是否符合各業(yè)務(wù)的句式說法。因此,需要加入文本匹配路徑的信息來表示文本中每個(gè)單字在文法中的匹配情況。

在本實(shí)施例中,所述根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑可以包括以下步驟:

步驟2031,預(yù)先設(shè)定表示句首或句尾無意義字符的通配的第一符號、表示句中無意義字符的通配的第二符號和表示有意義字符的完全匹配的第三符號。

具體采用什么符號可以自行設(shè)定,在此不做限定。在一個(gè)具體實(shí)施例中,#表示首或句尾無意義字符的通配,-表示有意義字符的完全匹配。*表示句中無意義字符的通配。需要說明的是,第一符號和第二符號也可以不進(jìn)行區(qū)別表示,也就是說,無意義字符的通配也可以全部采用一種符號進(jìn)行表示,具體根據(jù)需求而定。

步驟2032,將所述語音識別文本的各子片段與當(dāng)前業(yè)務(wù)所支持的句式進(jìn)行匹配,確定各子片段對應(yīng)的符號,該符號為第一符號、第二符號或第三符號中的一種。

在此,繼續(xù)以“快幫我查一下明天合肥去北京的機(jī)票好不好”為例進(jìn)行說明:“明天”、“合肥”、“北京”能夠完全匹配flight業(yè)務(wù)所支持的句式說法,并被賦予了有效語義,即對應(yīng)第三符號“-”;其中的“幫我查一下”、“去”、“的”也能完全匹配flight業(yè)務(wù)所支持的句式說法,但是沒有表達(dá)用戶意圖的關(guān)鍵信息,沒有賦予語義,即對應(yīng)第二符號“*”;而句首的“快”和句尾的“好不好”為語氣詞,沒有任何含義,即對應(yīng)第一符號“#”。

步驟2033,將所述語音識別文本的各子片段替換為對應(yīng)的符號,得到所述語音識別文本的文本匹配路。

例如,“快幫我查一下明天合肥去北京的機(jī)票好不好”的文本匹配路徑為“#*****----*--*--###”。

本發(fā)明實(shí)施例提供的語音交互方法,在進(jìn)行語義理解時(shí)獲取了語音識別文本的語義匹配路徑和文本匹配路徑,來判斷不同業(yè)務(wù)匹配路徑的優(yōu)劣,有助于提升人機(jī)交互語義理解的正確率。

如圖3所示,是本發(fā)明實(shí)施例進(jìn)行置信度排序的第一種流程圖。

在本實(shí)施例中,所述基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序包括:

步驟301,預(yù)先構(gòu)建排序模型,所述排序模型的輸入包括:文本的詞向量、語義匹配路徑、文本匹配路徑,以及客戶端所處應(yīng)用狀態(tài),所述排序模型的輸出為輸入的文本屬于各業(yè)務(wù)的概率。

例如,可以基于輸入的語音識別文本及對應(yīng)的標(biāo)注信息預(yù)先訓(xùn)練排序模型,排序模型可以為神經(jīng)網(wǎng)絡(luò),如cnn(卷積神經(jīng)網(wǎng)絡(luò))、dnn(深度神經(jīng)網(wǎng)絡(luò))、rnn(循環(huán)神經(jīng)網(wǎng)絡(luò))等。此外,還可以為svm(支持向量機(jī))等,在此不做限定。

在一個(gè)具體實(shí)施例中,該排序模型的具體構(gòu)建過程如下步驟:

(1)確定排序模型的拓?fù)浣Y(jié)構(gòu)。

以下以cnn為例進(jìn)行說明,將語音識別文本的文本詞向量、語義匹配路徑、文本匹配路徑、當(dāng)前客戶端所處應(yīng)用的狀態(tài)作為排序模型的輸入特征向量,經(jīng)過卷積、特征映射、池化、降維等步驟,得到語音識別文本屬于每個(gè)業(yè)務(wù)的得分概率。

(2)收集大量交互語音數(shù)據(jù)的識別文本作為訓(xùn)練數(shù)據(jù),并對所述訓(xùn)練數(shù)據(jù)進(jìn)行所屬業(yè)務(wù)標(biāo)注。

(3)提取所述訓(xùn)練數(shù)據(jù)的文本詞向量、語義匹配路徑、文本匹配路徑、當(dāng)前客戶端所處應(yīng)用的狀態(tài)。

(4)利用上述特征及標(biāo)注信息訓(xùn)練得到模型參數(shù)。

步驟302,基于所述排序模型得到所述語音識別文本屬于各業(yè)務(wù)的概率。

步驟303,根據(jù)上述概率的值或者上述概率的值及閾值門限進(jìn)行排序。

需要說明的是,可以僅根據(jù)各概率值的大小進(jìn)行排序,得到置信度最高的語義理解結(jié)果;為了進(jìn)一步保證獲取的語義結(jié)果的置信度滿足交互要求,還可以根據(jù)概率的值及閾值門限進(jìn)行排序,這樣,當(dāng)?shù)玫降淖罡吒怕嗜孕∮陂撝甸T限時(shí),則表明該語義理解的結(jié)果仍然不可信,需要進(jìn)行拒識,以避免識別和語義產(chǎn)生誤觸發(fā),提高對人機(jī)交互語義理解的正確率。

在其它實(shí)施例中,所述基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果包括:基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)、歷史狀態(tài)、以及與搜索數(shù)據(jù)相似度進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,其中,所述與搜索數(shù)據(jù)相似度為基于候選語義理解結(jié)果搜索的數(shù)個(gè)相似度最高的搜索數(shù)據(jù)與該候選語義理解結(jié)果的文本相似度,所述候選語義理解結(jié)果為當(dāng)前業(yè)務(wù)得到的輸入文本的語義理解結(jié)果。

相應(yīng)地,所述排序模型的輸入還包括:與搜索數(shù)據(jù)相似度、歷史狀態(tài),所述歷史狀態(tài)包括上一時(shí)刻語義理解結(jié)果。

需要特別指出的是,雖然本輪中各業(yè)務(wù)語義理解互不干擾,但是會與歷史語義中的業(yè)務(wù)產(chǎn)生關(guān)聯(lián)。如“導(dǎo)航到南京”->“那兒的天氣怎么樣”,當(dāng)前一句分發(fā)到天氣業(yè)務(wù)時(shí),與分發(fā)到的其他業(yè)務(wù)不影響,但是會繼承上一輪結(jié)果導(dǎo)航業(yè)務(wù)中的信息(南京)。

本發(fā)明實(shí)施例提供的語音交互方法,通過預(yù)先構(gòu)建的排序模型來確定輸入的文本屬于各業(yè)務(wù)的概率,該排序模型是基于多維度離線訓(xùn)練好的,便于直接利用其獲取語音識別文本在各業(yè)務(wù)的語義理解結(jié)果的置信度排序。

如圖4所示,是本發(fā)明實(shí)施例語音交互方法的第二種流程圖。

在本實(shí)施例中,所述方法還包括以下步驟:

步驟401,在接收語音識別文本之后,對所述語音識別文本進(jìn)行語言模型拒識。

具體地,考慮到車載、家居等環(huán)境非常復(fù)雜,各種環(huán)境噪聲和人聲干擾很容易被識別成文本,但經(jīng)過大數(shù)據(jù)分析發(fā)現(xiàn),這些識別文本往往不符合人們正常說話和交互的語言邏輯。因此,與傳統(tǒng)的語義理解不同的是,本實(shí)施例中引入了語言模型的思想,在多業(yè)務(wù)語義理解前先判斷輸入文本為一句符合正常語言邏輯的概率,如果概率高于某個(gè)閾值(閾值大小的設(shè)置可基于經(jīng)驗(yàn)值或大數(shù)據(jù)分析得到),則繼續(xù)后續(xù)處理,否則該句文本被拒識。如“我想聽劉德華的歌”的概率明顯高于“我想吃劉德華的歌”,后者應(yīng)予以拒識。

相應(yīng)地,所述將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中包括:將未被拒識的語音識別文本分別分發(fā)到各業(yè)務(wù)中。

如圖5所示,是本發(fā)明實(shí)施例語音交互方法的第三種流程圖。

在本實(shí)施例中,所述方法還包括以下步驟以進(jìn)一步提升語義理解效果:

步驟501,在接收語音識別文本之后,對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù)。

具體地,可以通過模型進(jìn)行業(yè)務(wù)預(yù)分類,也可以通過規(guī)則的方法進(jìn)行業(yè)務(wù)預(yù)分類,當(dāng)然,也可以綜合多種方法進(jìn)行業(yè)務(wù)預(yù)分類,在此不做限定。考慮到業(yè)務(wù)的預(yù)分類過程只是一個(gè)粗拒識過程,需要盡可能的提高召回率,優(yōu)選采用模型加規(guī)則的方法進(jìn)行業(yè)務(wù)預(yù)分類。

如圖6所示,是本發(fā)明實(shí)施例獲取預(yù)分類業(yè)務(wù)的一種流程圖。所述對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù)包括:

步驟601,對于每一個(gè)業(yè)務(wù),預(yù)先構(gòu)建該業(yè)務(wù)的預(yù)分類模型,所述預(yù)分類模型的輸入為文本的詞向量,輸出為該文本屬于該業(yè)務(wù)的概率;以及預(yù)先構(gòu)建每一個(gè)業(yè)務(wù)包括的特定句式和關(guān)鍵詞的模板的庫。

步驟602,利用所述預(yù)分類模型獲取所述語音識別文本或未被拒識的語音識別文本分別屬于各業(yè)務(wù)的概率。

步驟603,如果該概率的值≥設(shè)定閾值,則對應(yīng)的各業(yè)務(wù)作為預(yù)分類業(yè)務(wù)。

步驟604,如果該概率的值<設(shè)定閾值,則將當(dāng)前概率對應(yīng)的語音識別文本或未被拒識的語音識別文本在當(dāng)前概率對應(yīng)的各業(yè)務(wù)的庫中與進(jìn)行匹配,如果匹配成功,則該庫所屬的業(yè)務(wù)作為預(yù)分類業(yè)務(wù)。

在一個(gè)具體實(shí)施例中,首先對于每個(gè)業(yè)務(wù),利用大量文本,基于詞向量特征離線訓(xùn)練預(yù)分類模型,其中,該預(yù)分類模型可以為svm(支持向量機(jī)),還可以為cnn(卷積神經(jīng)網(wǎng)絡(luò))、dnn(深度神經(jīng)網(wǎng)絡(luò))、rnn(循環(huán)神經(jīng)網(wǎng)絡(luò))等,以下以svm模型為例進(jìn)行說明。在預(yù)分類時(shí),文本經(jīng)過每個(gè)業(yè)務(wù)的svm模型進(jìn)行預(yù)測,如果概率值大于某閾值(如0.5),則分發(fā)到該業(yè)務(wù);同時(shí),對于未分發(fā)到的業(yè)務(wù),通過預(yù)先設(shè)定的符合特定句式和關(guān)鍵詞的模板進(jìn)行匹配,如果匹配上,則分發(fā)。所有分發(fā)到的業(yè)務(wù)作為預(yù)分類業(yè)務(wù),做多業(yè)務(wù)語義理解。該步驟在一定程度上也起到了無效語義拒識的作用,舉例來說,系統(tǒng)支持10種交互意圖的業(yè)務(wù),通過業(yè)務(wù)預(yù)分類分發(fā)到了6個(gè)業(yè)務(wù),則減小了其他四個(gè)業(yè)務(wù)對最終結(jié)果的干擾。

相應(yīng)地,所述將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中包括:將所述語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中;或者將未被拒識的語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中。

如圖7所示,是本發(fā)明實(shí)施例進(jìn)行置信度排序的第二種流程圖。在本實(shí)施例中,所述方法還包括:

步驟701,在進(jìn)行置信度排序之前,根據(jù)當(dāng)前語音交互采集的語音信號的信噪比調(diào)整所述閾值門限,其中,隨著信噪比的增加,所述閾值門限降低。

由于在車載、家居環(huán)境中進(jìn)行交互時(shí),車輛和智能家居的特性使得不僅可以獲取到上述語義理解的結(jié)構(gòu)和置信度排序的結(jié)果,還可以獲取錄音數(shù)據(jù)和前端聲學(xué)信號處理的信息及結(jié)果。因此與傳統(tǒng)語義理解系統(tǒng)設(shè)定固定閾值門限不同的是,本案利用車機(jī)前端聲學(xué)信號處理的信噪比等信息,根據(jù)環(huán)境自適應(yīng)調(diào)整門限,如信噪比高的環(huán)境,設(shè)定較低的閾值,提升系統(tǒng)交互成功率,在信噪比低的環(huán)境下,提高閾值門限,減少誤吸收。

相應(yīng)地,所述排序模型的輸入還可以包括:信噪比;所述排序模型的參數(shù)包括:原始文本的權(quán)重,其中,該原始文本的權(quán)重隨著信噪比的變小而變大。也就是說,如果將信噪比參數(shù)作為排序模型的一維特征輸入,可以根據(jù)信噪比的大小自適應(yīng)調(diào)整排序模型參數(shù),如信噪比低時(shí),文本層面的誤吸收影響更大,我們相應(yīng)的調(diào)高原始文本的權(quán)重。

相應(yīng)地,本發(fā)明還提供了一種語音交互裝置,如圖8所示,是本發(fā)明實(shí)施例語音交互裝置的第一種結(jié)構(gòu)示意圖。

在本實(shí)施例中,該語音交互裝置可以包括:

文本接收模塊801,用于接收語音識別文本。

語義理解模塊802,用于將所述語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解。

置信度排序模塊803,用于基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果。

響應(yīng)模塊804,用于對所述置信度最高的語義理解結(jié)果做出響應(yīng)。

其中,所述語義理解模塊802可以包括:

語義槽獲取單元,用于獲取所述語音識別文本中各子片段的語義槽。

語義匹配路徑獲取單元,用于將所述語音識別文本中存在語義槽的各子片段替換成對應(yīng)的語義槽,得到所述語音識別文本的語義匹配路徑。

文本匹配路徑獲取單元,用于根據(jù)預(yù)先確定的文法規(guī)則對所述語音識別文本進(jìn)行匹配,得到所述語音識別文本的文本匹配路徑。

優(yōu)選地,所述文本匹配路徑獲取單元可以包括:

句式匹配子單元,用于將所述語音識別文本的各子片段與當(dāng)前業(yè)務(wù)所支持的句式進(jìn)行匹配,確定各子片段對應(yīng)的符號,該符號為第一符號、第二符號或第三符號中的一種。

符號替換子單元,用于將所述語音識別文本的各子片段替換為對應(yīng)的符號,得到所述語音識別文本的文本匹配路。

此外,所述裝置還可以包括:

排序模型構(gòu)建模塊805,用于預(yù)先構(gòu)建排序模型,所述排序模型的輸入包括:文本的詞向量、語義匹配路徑、文本匹配路徑,以及客戶端所處應(yīng)用狀態(tài),所述排序模型的輸出為輸入的文本屬于各業(yè)務(wù)的概率。

所述置信度排序模塊803包括:

業(yè)務(wù)概率獲取單元,用于基于所述排序模型得到所述語音識別文本屬于各業(yè)務(wù)的概率。

排序單元,用于根據(jù)上述概率的值或者上述概率的值及閾值門限進(jìn)行排序。

進(jìn)一步地,所述排序模型的輸入還可以包括:信噪比。

所述排序模型的參數(shù)包括:原始文本的權(quán)重,其中,該原始文本的權(quán)重隨著信噪比的變小而變大。

相應(yīng)地,所述置信度排序模塊803具體用于基于得到的語義理解結(jié)果、客戶端所處應(yīng)用狀態(tài)、歷史狀態(tài)、以及與搜索數(shù)據(jù)相似度進(jìn)行置信度排序,獲取置信度最高的語義理解結(jié)果,其中,所述與搜索數(shù)據(jù)相似度為基于候選語義理解結(jié)果搜索的數(shù)個(gè)相似度最高的搜索數(shù)據(jù)與該候選語義理解結(jié)果的文本相似度,所述候選語義理解結(jié)果為當(dāng)前業(yè)務(wù)得到的輸入文本的語義理解結(jié)果。

所述排序模型的輸入還包括:與搜索數(shù)據(jù)相似度、歷史狀態(tài),所述歷史狀態(tài)包括上一時(shí)刻語義理解結(jié)果。

如圖9所示,是本發(fā)明實(shí)施例語音交互裝置的第二種結(jié)構(gòu)示意圖。

在本實(shí)施例中,所述裝置還可以包括:

語言模型拒識模塊901,用于在接收語音識別文本之后,對所述語音識別文本進(jìn)行語言模型拒識。

所述語義理解模塊802具體用于將未被拒識的語音識別文本分別分發(fā)到各業(yè)務(wù)中,并分別進(jìn)行語義理解。

本發(fā)明實(shí)施例提供的語音交互裝置,通過語言模型拒識模塊901對所述語音識別文本進(jìn)行語言模型拒識。由于各種環(huán)境噪聲和人聲干擾很容易被識別成文本,但經(jīng)過大數(shù)據(jù)分析發(fā)現(xiàn),這些識別文本往往不符合人們正常說話和交互的語言邏輯,因此可以通過語言模型拒識部分環(huán)境噪聲和人聲干擾,降低識別和語義產(chǎn)生誤觸發(fā)的概率。

如圖10所示,是本發(fā)明實(shí)施例語音交互裝置的第三種結(jié)構(gòu)示意圖。

在本實(shí)施例中,所述裝置還可以包括:

業(yè)務(wù)預(yù)分類模塊1001,用于在接收語音識別文本之后,對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,得到所述語音識別文本的預(yù)分類業(yè)務(wù)。

所述語義理解模塊802具體用于將所述語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中,并分別進(jìn)行語義理解;或者將未被拒識的語音識別文本分別分發(fā)到各預(yù)分類業(yè)務(wù)中,并分別進(jìn)行語義理解。

進(jìn)一步地,所述裝置還可以包括:

預(yù)分類模型構(gòu)建模塊1002,用于對于每一個(gè)業(yè)務(wù),預(yù)先構(gòu)建該業(yè)務(wù)的預(yù)分類模型,所述預(yù)分類模型的輸入為文本的詞向量,輸出為該文本屬于該業(yè)務(wù)的概率。

句式和關(guān)鍵詞模板庫構(gòu)建模塊1003,用于預(yù)先構(gòu)建每一個(gè)業(yè)務(wù)包括的特定句式和關(guān)鍵詞的模板的庫。

所述業(yè)務(wù)預(yù)分類模塊1001包括:

業(yè)務(wù)概率獲取單元,用于利用所述預(yù)分類模型獲取所述語音識別文本或未被拒識的語音識別文本分別屬于各業(yè)務(wù)的概率。

預(yù)分類業(yè)務(wù)獲取單元,用于如果該概率的值≥設(shè)定閾值,則對應(yīng)的各業(yè)務(wù)作為預(yù)分類業(yè)務(wù);如果該概率的值<設(shè)定閾值,則將當(dāng)前概率對應(yīng)的語音識別文本或未被拒識的語音識別文本在當(dāng)前概率對應(yīng)的各業(yè)務(wù)的庫中與進(jìn)行匹配,如果匹配成功,則該庫所屬的業(yè)務(wù)作為預(yù)分類業(yè)務(wù)。

本發(fā)明實(shí)施例提供的語音交互裝置,通過業(yè)務(wù)預(yù)分類模塊1001對所述語音識別文本進(jìn)行業(yè)務(wù)預(yù)分類,這樣可以在一定程度上起到無效語義拒識的作用,例如,系統(tǒng)支持10種交互意圖的業(yè)務(wù),通過業(yè)務(wù)預(yù)分類分發(fā)到了6個(gè)業(yè)務(wù),則減小了其他四個(gè)業(yè)務(wù)對最終結(jié)果的干擾,且能提升后續(xù)數(shù)據(jù)處理效率。

本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。

以上對本發(fā)明實(shí)施例進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體實(shí)施方式對本發(fā)明進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及裝置;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1