本發(fā)明涉及智能外呼,具體為一種ai智能外呼系統(tǒng)的對話管理方法及系統(tǒng)。
背景技術:
1、隨著人工智能技術的快速發(fā)展,ai智能外呼系統(tǒng)已經(jīng)成為企業(yè)與客戶進行高效溝通的重要工具,傳統(tǒng)的外呼系統(tǒng)主要依賴于人工操作,存在效率低下、成本高昂等問題,而ai智能外呼系統(tǒng)則能夠利用自然語言處理、語音識別、機器學習等先進技術,實現(xiàn)自動化的呼叫、對話及數(shù)據(jù)管理,大大提高了企業(yè)的客戶服務效率和營銷效果。
2、在申請公布號為cn111104502a的中國發(fā)明申請中,公開了一種外呼系統(tǒng)的對話管理方法、系統(tǒng)、電子設備和存儲介質(zhì),所述對話管理方法包括:獲取語義信息;根據(jù)所述語義信息更新當前的對話狀態(tài);將所述對話狀態(tài)輸入到預存的狀態(tài)機中進行狀態(tài)跳轉(zhuǎn);所述外呼系統(tǒng)根據(jù)所述狀態(tài)機跳轉(zhuǎn)后的狀態(tài)進行輸出問答,同時也使用強化學習提升對話系統(tǒng)泛化性能。
3、在申請公布號為cn115048500a的中國發(fā)明申請中,公開了一種基于機器學習的外呼對話管理智能選擇方法及系統(tǒng),該方法包括:根據(jù)用戶特征建立業(yè)務分類模型,利用機器學習算法預訓練所述業(yè)務分類模型,生成業(yè)務分類結(jié)果;根據(jù)所述業(yè)務分類結(jié)果,選擇不同的對話管理模塊,送入ai外呼裝置;利用所述ai外呼裝置,根據(jù)所選擇的對話管理模塊執(zhí)行不同的外呼對話策略,運行相應的外呼任務。
4、結(jié)合以上發(fā)明申請,現(xiàn)有技術存在以下不足:
5、1、現(xiàn)有技術往往只停留在對單一階數(shù)的差異系數(shù)進行簡單的計算和比較,缺乏更深入的分析和處理,這導致智能外呼系統(tǒng)無法準確地反映語音信號的特征變化,也無法有效地適應不同用戶的語音特點和習慣,尤其是在處理復雜或多樣化的語音輸入時,智能外呼系統(tǒng)可能會出現(xiàn)識別錯誤或理解偏差;
6、2、智能外呼系統(tǒng)可能只關注語音信號的某些方面,如信噪比或清晰度,而忽略了其他重要因素,如語音的流暢性、自然度或情感表達等,難以準確判斷語音信號的質(zhì)量是否滿足要求,當遇到低質(zhì)量的語音信號時,智能外呼系統(tǒng)可能無法及時做出正確的響應,導致誤解或無法識別的問題發(fā)生。
技術實現(xiàn)思路
1、(一)解決的技術問題
2、針對現(xiàn)有技術的不足,本發(fā)明提供了一種ai智能外呼系統(tǒng)的對話管理方法及系統(tǒng),將語音信號經(jīng)過快速傅里葉變換得到頻譜,使用高斯函數(shù)近似濾波器的頻率響應,進行點乘操作,并求和得到濾波器的能量,通過計算相鄰濾波器能量對數(shù)之間的差值獲得一階差異系數(shù),進行遞歸計算獲得多階差異系數(shù),計算獲得每階差異系數(shù)的差異系數(shù)波動指數(shù),將差異系數(shù)波動指數(shù)最小值所在的階數(shù)作為多階差異系數(shù)的階數(shù),計算語音峰值強度與噪聲強度之間的差值,并求和計算獲得清晰度指數(shù),通過多階差異系數(shù)計算多階差異系數(shù)的標準差,結(jié)合清晰度指數(shù)以及信噪比,計算獲得語音質(zhì)量評估值,當語音質(zhì)量評估值小于質(zhì)量閾值時,切換人工外呼,解決了背景技術中提到的問題。
3、(二)技術方案
4、為實現(xiàn)以上目的,本發(fā)明通過以下技術方案予以實現(xiàn):一種ai智能外呼系統(tǒng)的對話管理方法,包括以下步驟:
5、對語音信號進行采樣,將若干個樣本的語音信號經(jīng)過快速傅里葉變換得到語音信號的頻譜,使用高斯函數(shù)近似濾波器的頻率響應,將快速傅里葉變換結(jié)果與濾波器的頻率響應進行點乘操作,并求和以得到每個濾波器的能量;
6、對若干個濾波器的能量進行對數(shù)變換,通過計算相鄰濾波器能量對數(shù)之間的差值獲得一階差異系數(shù),通過計算相鄰一階差異系數(shù)之間的差值獲得二階差異系數(shù),進行遞歸計算獲得多階差異系數(shù);
7、通過對每一階的差異系數(shù)進行分析,計算獲得差異系數(shù)波動指數(shù),計算獲得每階差異系數(shù)的差異系數(shù)波動指數(shù),選擇差異系數(shù)波動指數(shù)最小值所在的階數(shù),作為多階差異系數(shù)的階數(shù);
8、對每個濾波器,計算語音峰值強度與噪聲強度之間的差值,并求和計算獲得清晰度指數(shù),通過多階差異系數(shù)計算多階差異系數(shù)的標準差,結(jié)合清晰度指數(shù)以及信噪比,計算獲得語音質(zhì)量評估值,當語音質(zhì)量評估值小于質(zhì)量閾值時,切換人工外呼。
9、進一步的,對采樣得到的若干個樣本的語音信號進行快速傅里葉變換,將時域中的語音信號轉(zhuǎn)換到頻域中,得到語音信號的頻譜,計算公式如下:
10、
11、其中,x[k]表示快速傅里葉變換結(jié)果,k表示頻率索引,k=1,2...,n,n為正整數(shù),x[n]是時域中的第n個樣本,n=1,2...,n,n為正整數(shù),j是虛數(shù)單位,且j2=-1。
12、進一步的,使用高斯函數(shù)近似gammatone濾波器的頻率響應,計算公式如下:
13、
14、其中,hm[k]表示濾波器的頻率響應,f[k]表示頻率數(shù)組中的第k個頻率點,fc是濾波器的中心頻率,σ是高斯函數(shù)的標準差。
15、進一步的,將快速傅里葉變換結(jié)果與gammatone濾波器的頻率響應進行點乘操作,并求和以得到每個濾波器的能量,計算公式如下:
16、
17、其中,em表示第m個gammatone濾波器的能量,x[k]表示快速傅里葉變換結(jié)果,hm[k表示gammatone濾波器的頻率響應,k表示頻率索引,k=1,2…,n,n為正整數(shù)。
18、進一步的,對若干個濾波器的能量進行對數(shù)變換,通過計算相鄰濾波器能量對數(shù)之間的差值獲得一階差異系數(shù),通過計算相鄰一階差異系數(shù)之間的差值獲得二階差異系數(shù),計算公式如下:
19、
20、其中,δlogem表示一階差異系數(shù),δ2logem表示二階差異系數(shù),em表示第m個gammatone濾波器的能量。
21、進一步的,進行遞歸計算獲得多階差異系數(shù),計算公式如下:
22、δp?logem=δp-1logem+1-δp-1logem
23、其中,δplogem表示多階差異系數(shù),p表示階數(shù)。
24、進一步的,通過對每一階的差異系數(shù)進行分析,計算獲得差異系數(shù)波動指數(shù),計算公式如下:
25、
26、其中,mdv表示差異系數(shù)波動指數(shù),δp?logem表示第m個p階差異系數(shù),m=1,2,…,m,m為正整數(shù),μ表示m個p階差異系數(shù)的均值;
27、計算獲得每一階差異系數(shù)的差異系數(shù)波動指數(shù),選擇差異系數(shù)波動指數(shù)最小值所在的階數(shù),作為多階差異系數(shù)的階數(shù)。
28、進一步的,對每個濾波器,測量語音峰值和噪聲的強度,計算語音峰值強度與噪聲強度之間的差值,并求和計算獲得清晰度指數(shù),計算公式如下:
29、
30、其中,ci表示清晰度指數(shù),pm表示第m個濾波器的語音峰值強度,nim表示第m個濾波器的噪聲強度,m=1,2,…,m,m為正整數(shù)。
31、進一步的,獲取確定了階數(shù)的多階差異系數(shù)并計算多階差異系數(shù)的標準差,結(jié)合清晰度指數(shù)以及信噪比,計算獲得語音質(zhì)量評估值,計算公式如下:
32、
33、其中,vq表示語音質(zhì)量評估值,δp?logem表示第m個p階差異系數(shù),μ表示p階差異系數(shù)的均值,ci表示清晰度指數(shù),snr表示信噪比,k1、k2以及k3表示權(quán)重系數(shù),0<k1<1,0<k2<1,0<k3<1。
34、一種ai智能外呼系統(tǒng)的對話管理系統(tǒng),包括:語音信號處理模塊、多階差異系數(shù)生成模塊、差異系數(shù)選擇模塊以及語音質(zhì)量評估模塊;其中,
35、語音信號處理模塊,對語音信號進行采樣,將若干個樣本的語音信號經(jīng)過快速傅里葉變換得到語音信號的頻譜,使用高斯函數(shù)近似濾波器的頻率響應,將快速傅里葉變換結(jié)果與濾波器的頻率響應進行點乘操作,并求和以得到每個濾波器的能量;
36、多階差異系數(shù)生成模塊,對若干個濾波器的能量進行對數(shù)變換,通過計算相鄰濾波器能量對數(shù)之間的差值獲得一階差異系數(shù),通過計算相鄰一階差異系數(shù)之間的差值獲得二階差異系數(shù),進行遞歸計算獲得多階差異系數(shù);
37、差異系數(shù)選擇模塊,通過對每一階的差異系數(shù)進行分析,計算獲得差異系數(shù)波動指數(shù),計算獲得每階差異系數(shù)的差異系數(shù)波動指數(shù),選擇差異系數(shù)波動指數(shù)最小值所在的階數(shù),作為多階差異系數(shù)的階數(shù);
38、對話管理模塊,對每個濾波器,計算語音峰值強度與噪聲強度之間的差值,并求和計算獲得清晰度指數(shù),通過多階差異系數(shù)計算多階差異系數(shù)的標準差,結(jié)合清晰度指數(shù)以及信噪比,計算獲得語音質(zhì)量評估值,當語音質(zhì)量評估值小于質(zhì)量閾值時,切換人工外呼。
39、(三)有益效果
40、本發(fā)明提供了一種ai智能外呼系統(tǒng)的對話管理方法及系統(tǒng),具備以下有益效果:
41、(1)通過對語音信號進行采樣和快速傅里葉變換,可以得到語音信號的頻譜,有助于更好地理解和分析語音信號的特性,進一步使用高斯函數(shù)近似gammatone濾波器的頻率響應,可以更精確地模擬人耳對聲音的感知特性,從而提取出更為關鍵和有效的語音特征,用于后續(xù)的語音識別、語音合成等任務,提高系統(tǒng)的性能和準確性。
42、(2)通過對濾波器能量進行對數(shù)變換和差異系數(shù)的計算,可以有效地消除數(shù)據(jù)中的非平穩(wěn)性,使數(shù)據(jù)更加穩(wěn)定,這對于ai智能外呼系統(tǒng)的對話管理尤為重要,因為穩(wěn)定的數(shù)據(jù)有助于系統(tǒng)更準確地識別和分析對話中的關鍵信息。
43、(3)通過對每一階的差異系數(shù)進行深入分析,并計算其差異系數(shù)波動指數(shù),找到能夠最穩(wěn)定、最準確地反映語音信號特性的階數(shù),差異系數(shù)波動指數(shù)越小,意味著該階數(shù)的差異系數(shù)變化范圍越小,穩(wěn)定性越高,因此更適合作為多階差異系數(shù)的階數(shù),有助于減少ai智能外呼系統(tǒng)的誤差和不確定性,從而提升系統(tǒng)的整體穩(wěn)定性和可靠性。
44、(4)通過結(jié)合多階差異系數(shù)、清晰度指數(shù)和信噪比等多個指標對語音質(zhì)量進行精確評估,能夠更加準確地判斷何時需要切換到人工外呼,通過結(jié)合多種語音質(zhì)量評估指標和自動切換機制,ai智能外呼系統(tǒng)的智能水平得到了提升,能夠更好地應對復雜多變的語音環(huán)境,為用戶提供更加智能、高效的服務。