1.一種交互式語音應答方法,包括:
對用戶的語音輸入執(zhí)行語音識別;
從語音識別結果確定目標業(yè)務;
比較所述語音識別結果的置信度和執(zhí)行所述目標業(yè)務所需要的置信度范圍;以及
基于置信度比較結果控制所述目標業(yè)務的執(zhí)行。
2.如權利要求1所述的交互式語音應答方法,其特征在于,所述基于置信度比較結果控制所述目標業(yè)務的執(zhí)行包括:
至少響應于所述語音識別結果的置信度高于所述目標業(yè)務所需置信度的上限執(zhí)行所述目標業(yè)務。
3.如權利要求2所述的交互式語音應答方法,其特征在于,所述至少響應于所述語音識別結果的置信度高于所述目標業(yè)務所需置信度的上限執(zhí)行所述目標業(yè)務包括:
響應于所述語音識別結果的置信度高于所述目標業(yè)務所需置信度的上限,判斷所述目標業(yè)務是否屬于強制確認類型;
響應于所述目標業(yè)務屬于強制確認類型,向用戶執(zhí)行業(yè)務確認,若用戶確認所述目標業(yè)務,則執(zhí)行所述目標業(yè)務。
4.如權利要求1所述的交互式語音應答方法,其特征在于,所述基于置信度比較結果控制所述目標業(yè)務的執(zhí)行包括:
響應于所述語音識別結果的置信度介于所述目標業(yè)務所需置信度的上限與下限之間,向用戶執(zhí)行業(yè)務確認,若用戶確認所述目標業(yè)務,則執(zhí)行所述目標業(yè)務。
5.如權利要求3或4所述的交互式語音應答方法,其特征在于,若用戶未確認所述目標業(yè)務,則向用戶輸出要求用戶重新輸入語音指示的話術語音。
6.如權利要求3或4所述的交互式語音應答方法,其特征在于,所述執(zhí)行業(yè)務確認包括:
向用戶輸出要求用戶確認所述目標業(yè)務的話術語音;
對用戶的再次語音輸入執(zhí)行語音識別;以及
從所述再次的語音識別結果確定用戶是否確認所述目標業(yè)務。
7.如權利要求6所述的交互式語音應答方法,其特征在于,所述對用戶的再次語音輸入執(zhí)行語音識別包括:
采用針對確認需要定制的語言模型對用戶的語音輸入執(zhí)行語音識別。
8.如權利要求1所述的交互式語音應答方法,其特征在于,所述基于置信度比較結果控制所述目標業(yè)務的執(zhí)行包括:
響應于所述語音識別結果的置信度低于所述目標業(yè)務所需置信度的下限,采用全量語言模型對所述語音輸入進行識別。
9.如權利要求8所述的交互式語音應答方法,其特征在于,還包括:
基于全量語言模型的語音識別結果執(zhí)行相應應答。
10.如權利要求1所述的交互式語音應答方法,其特征在于,所述對用戶的語音輸入執(zhí)行語音識別包括:
采用針對業(yè)務需要定制的語言模型對用戶的語音輸入執(zhí)行語音識別。
11.一種交互式語音應答系統(tǒng),包括:
語音識別模塊,用于對用戶的語音輸入執(zhí)行語音識別;
語義識別模塊,用于從語音識別結果確定目標業(yè)務;以及
控制模塊,用于比較所述語音識別結果的置信度和執(zhí)行所述目標業(yè)務所需要的置信度范圍,并基于置信度比較結果控制所述目標業(yè)務的執(zhí)行。
12.如權利要求11所述的交互式語音應答系統(tǒng),其特征在于,所述控制模塊至少響應于所述語音識別結果的置信度高于所述目標業(yè)務所需置信度的上限控制業(yè)務操作模塊執(zhí)行所述目標業(yè)務。
13.如權利要求12所述的交互式語音應答系統(tǒng),其特征在于,所述控制模塊響應于所述語音識別結果的置信度高于所述目標業(yè)務所需置信度的上限,判斷所述目標業(yè)務是否屬于強制確認類型,并且響應于所述目標業(yè)務屬于強制確認類型控制輸出模塊向用戶執(zhí)行業(yè)務確認,若用戶確認所述目標業(yè)務,則執(zhí)行所述目標業(yè)務。
14.如權利要求11所述的交互式語音應答系統(tǒng),其特征在于,所述控制模塊響應于所述語音識別結果的置信度介于所述目標業(yè)務所需置信度的上限與下限之間,控制輸出模塊向用戶執(zhí)行業(yè)務確認,若用戶確認所述目標業(yè)務,則執(zhí)行所述目標業(yè)務。
15.如權利要求13或14所述的交互式語音應答系統(tǒng),其特征在于,若用戶未確認所述目標業(yè)務,則所述控制模塊控制所述輸出模塊向用戶輸出要求用戶重新輸入語音指示的話術語音。
16.如權利要求13或14所述的交互式語音應答系統(tǒng),其特征在于,所述輸出模塊向用戶輸出要求用戶確認所述目標業(yè)務的話術語音,所述語音識別模塊對用戶的再次語音輸入執(zhí)行語音識別,所述語義識別模塊從所述再次的語音識別結果確定用戶是否確認所述目標業(yè)務。
17.如權利要求16所述的交互式語音應答系統(tǒng),其特征在于,所述語音識別模塊采用針對確認需要定制的語言模型對用戶的所述再次語音輸入執(zhí)行語音識別。
18.如權利要求11所述的交互式語音應答系統(tǒng),其特征在于,所述控制模塊響應于所述語音識別結果的置信度低于所述目標業(yè)務所需置信度的下限控制所述語音識別模塊采用全量語言模型對所述語音輸入進行識別。
19.如權利要求18所述的交互式語音應答系統(tǒng),其特征在于,還包括:
應答模塊,用于基于全量語言模型的語音識別結果執(zhí)行相應應答。
20.如權利要求11所述的交互式語音應答系統(tǒng),其特征在于,所述語音識別模塊采用針對業(yè)務需要定制的語言模型對用戶的語音輸入執(zhí)行語音識別。