專利名稱:利用語音進(jìn)行座席篩選的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明關(guān)于移動通信技術(shù)領(lǐng)域,特別是關(guān)于語音信號處理技術(shù),具體的講是一種利用語音進(jìn)行座席篩選的方法及系統(tǒng)。
背景技術(shù):
語音綜合信息門戶為用戶提供餐飲、娛樂、交通、旅游 、便民等各類信息查詢,諸如餐館預(yù)訂、鮮花代訂等各類代訂類服務(wù),以及機票預(yù)訂和酒店預(yù)訂等商旅服務(wù)。目前語音綜合信息門戶一般采用全人工語音接入的服務(wù)方式,或提供IVR (Interactive VoiceResponse,交互式語音應(yīng)答)分層菜單形式供用戶選擇不同的呼叫座席進(jìn)行服務(wù)。根據(jù)話務(wù)員所負(fù)責(zé)的方向和業(yè)務(wù)的不同,一般分為查號座席、查位置座席、訂餐座席、訂機票座席等。語音門戶系統(tǒng)根據(jù)用戶的按鍵選擇,將用戶接入到不同的座席,提供不同的服務(wù)。有些語音門戶,為了滿足用戶多樣性的需求,還提供英語、法語等多種外語,以及維語、藏語、粵語等少數(shù)民族語言和方言的座席服務(wù),用戶同樣需要通過按鍵來選擇接入何種語言的人工座席。現(xiàn)有技術(shù)里在通過提供多種IVR菜單供用戶選擇的方式中,為了接入到需要的座席,用戶往往需要多次進(jìn)行按鍵選擇,其造成用戶等待時間較長的問題。同時,在用戶選擇等待過程中,對用戶不進(jìn)行計費,對系統(tǒng)資源也造成了浪費。如果不提供IVR菜單的選擇,則需要大量的座席話務(wù)員來響應(yīng)用戶不同的需求,需要增加人力成本。此外,現(xiàn)有技術(shù)中一般只提供語言和服務(wù)種類的選擇,沒有考慮到用戶的年齡、性別、當(dāng)前的情緒等多種細(xì)分需求,降低了用戶體驗。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種利用語音進(jìn)行座席篩選的方法及系統(tǒng),通過對用戶語音進(jìn)行分析,提取語義信息、身份信息、情緒特征、語言信息、年齡、性別特征,并根據(jù)此信息選擇座席,無須使用IVR菜單進(jìn)行用戶手動選擇座席,提升了用戶對業(yè)務(wù)的使用體驗,減少了等待時間,同時也減少了系統(tǒng)資源的浪費。本發(fā)明的目的之一是,提供一種利用語音進(jìn)行座席篩選的方法,所述的方法包括接收用戶傳送的語音信息;從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù);根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。本發(fā)明的目的之一是,提供一種利用語音進(jìn)行座席篩選的系統(tǒng),所述的系統(tǒng)包括呼叫中心,用于接收用戶傳送的語音信息;語音分析裝置,用于從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù);篩選裝置,用于根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。本發(fā)明的有益效果在于,通過對用戶語音進(jìn)行分析,提取用戶語義信息、身份信息、情緒特征、語言信息、年齡、性別特征,并根據(jù)此信息選擇語音綜合信息門戶的座席,無須使用IVR菜單進(jìn)行用戶手動選擇座席,提升了用戶對業(yè)務(wù)的使用體驗,減少了等待時間,同時也減少了信息門戶系統(tǒng)資源的浪費。此外,本提案根據(jù)語音中的多種信息為用戶提供豐富多樣的座席,達(dá)到了對用戶細(xì)分的目的,可以為用戶提供更加個性化和周到的座席服務(wù)。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式一的流 程圖;圖2為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式二的流程圖;圖3為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式三的流程圖;圖4為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式四的流程圖;圖5為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式一的結(jié)構(gòu)框圖;圖6為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式二的結(jié)構(gòu)框圖;圖7為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式三的結(jié)構(gòu)框圖;圖8為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式四的結(jié)構(gòu)框圖;圖9為高斯混合模型與觀察特征矢量匹配示意圖;圖10為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)的組網(wǎng)結(jié)構(gòu)圖;圖11為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法的業(yè)務(wù)流程圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。對于不同的座席,需要事先定義其屬性,根據(jù)維度的不同可以將座席屬性定義如下座席{性別,年齡,情緒,身份,語言,內(nèi)容}。該種定義方式僅為舉例,當(dāng)然也可以有其他定義方式,此處不再贅述。座席的各個屬性是指其服務(wù)對象的屬性,如年齡項可以分為30歲以上和30歲以下,指該座席的服務(wù)對象是30歲以上人群還是30歲以下;內(nèi)容項可以是訂票、訂酒店等,指該座席專門進(jìn)行訂票或訂酒店的服務(wù)。根據(jù)上述的座席緯度可以定義座席1{男,30歲以上,高興,使用過業(yè)務(wù),英語,訂機票},考慮到性別有兩類(男女),年齡兩類(30以下,30以上),情緒四類(悲傷,生氣、平靜、高興),身份兩類(使用過業(yè)務(wù),未使用過業(yè)務(wù)),語言四類(中,英,蒙,藏),內(nèi)容四類(查詢、訂機票、訂酒店、投訴),共有2*2*4*2*4*4=512種座席類型,在實際使用中可以將部分座席合并,或同一座席擔(dān)負(fù)多種座席屬性。座席I可以表示為座席 1{0,1,3,0,1,1}。圖I為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式一的流程圖,由圖I可知,所述的方法包括SlOl :接收用戶傳送的語音信息。用戶通過手機、網(wǎng)絡(luò)等方式呼入語音綜合信息門戶,用戶傳送的語音信息中包括了當(dāng)前用戶需要查詢的內(nèi)容等信息。S102 :從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù)。S103:根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的·語音信息對應(yīng)的座席。圖2為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式二的流程圖,由圖2可知,在實施方式二中,步驟S101、S102與步驟S201、S202相同,該方法還包括S203:根據(jù)所述的短時能量、基音、譜參數(shù)識別出所述的語音信息對應(yīng)的語義信息、情緒信息、語言信息、年齡信息以及性別信息。其中,語義信息指用戶所要表達(dá)的內(nèi)容,根據(jù)語義中的關(guān)鍵字,可以判斷用戶想要查詢哪方面的問題。身份信息指用戶是誰,若用戶此前使用過語音門戶服務(wù),可根據(jù)以前的錄音數(shù)據(jù)判斷是哪個用戶,以得到用戶以前的使用偏好。情緒信息指用戶當(dāng)時所處的情緒狀態(tài),如平靜、憤怒、恐懼、高興和悲傷等,根據(jù)情緒狀態(tài)判斷是否需要送到特殊座席,如用戶在憤怒的情況下是否需要送到特殊心情服務(wù)座
庶坐
I'm 寸 o語言信息指用戶所使用的語言種類,識別出是英語、法語等多種外語,還是維語、藏語、粵語等少數(shù)民族語言或方言,以便送到不同的語言座席進(jìn)行服務(wù)。年齡指用戶的年齡段,對不同年齡段的用戶可以細(xì)分到不同的座席或者推薦不同的服務(wù)。性別指男女性別,對不同性別的用戶可以細(xì)分到不同的座席或者推薦不同的服務(wù)。S204:根據(jù)所述的語義信息、情緒信息、語言信息、年齡信息以及性別信息從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息最接近的座席。若當(dāng)如語首信息對應(yīng)的語義/[目息、情緒"[目息、語目"[目息、年齡"[目息以及性別彳目息形成一矢量,矢量的各維分別是性別,年齡,情緒,身份,語言,內(nèi)容,若矢量是{0,1,3,0,1,1},則從預(yù)先設(shè)定的座席集中篩選出座席1{0,1,3,0,1,1}與該矢量的距離最為接近,選擇座席I進(jìn)行服務(wù)。在實際操作過程中,存在部分座席合并,或同一座席擔(dān)負(fù)多種座席屬性的情況,往往語音信息形成的矢量不會和座席完全匹配。該種情況下,可通過座席匹配選擇算法實現(xiàn)篩選設(shè)語音信息對應(yīng)的矢量為X={xl,x2,x3,x4,x5},座席i為Yi={yil, yi2, yi3, yi4, yi5},權(quán)重K= {kl, k2, k3, k4, k5},此處引入權(quán)重主要是考慮到每類矢量對座席的重要性的不同,最后座席的選擇為i = arg min {/:, |.v, -_v/; | + k2 \x2 - yi21 + k' |x; - yi,| + k. Ixl - v/4| + k, |a% -yK|}即選擇和識別結(jié)果根據(jù)權(quán)重累加后最為接近的座席。圖3為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式三的流程圖,由圖3可知,在實施方式三中,步驟S101、S102與步驟S301、S302相同,該方法還包括S303 :采用高斯混合模型的方式將預(yù)先設(shè)定的座席集進(jìn)行訓(xùn)練。在實施方式三中,篩選座席前需要針對不同的座席特征訓(xùn)練出相應(yīng)的座席模型,然后將語音特征和座席模型 進(jìn)行匹配。座席模型此處采用高斯混合模型,因為從統(tǒng)計理論的角度考慮,無限多個高斯分布的組合可以擬合一個任意形式的分布,因此當(dāng)GMM的混合度M足夠高時,從理論上說就可以足夠精細(xì)的逼近特征矢量的空間分布。一個GMM通??梢杂上铝袇?shù)描述⑴M,模型中的高斯密度函數(shù)的數(shù)目。(2)描述每個高斯密度函數(shù)的參數(shù)均值矢量U i,協(xié)方差矩陣E it)(3)每個高斯密度函數(shù)的權(quán)重,Wit5如此,可以記一個GMM的模型參數(shù)為\ = {M, {wj,{> J,{ E J }。通常GMM的混合度是事先選定的,因此模型參數(shù)中需要估計的為Am= {{wj, {Uj, { E J}0模型的訓(xùn)練采用最大似然準(zhǔn)則。GMM的基本結(jié)構(gòu)以及觀察特征矢量與模型匹配的基本示意圖如圖9所示。模型訓(xùn)練時,需要對語音數(shù)據(jù)根據(jù)座席的緯度進(jìn)行分類。對某個座席模型,根據(jù)性另IJ,年齡,情緒,身份,語言,內(nèi)容五個不同的緯度,可以定義該座席的座席特征,如對座席I模型而言,其特征是座席I {男,30歲以上,高興,使用過業(yè)務(wù),英語,訂機票},對事先收集到的語音數(shù)據(jù),為了訓(xùn)練座席I的模型,需要對數(shù)據(jù)進(jìn)行標(biāo)記,挑選出“30歲以上男性使用英語以高興的語氣預(yù)訂機票”的數(shù)據(jù),而且該男性原來是使用過本業(yè)務(wù)的。對該類原始語言數(shù)據(jù)進(jìn)行音頻處理后,對高斯混合模型進(jìn)行訓(xùn)練,同時在訓(xùn)練時考慮到各業(yè)務(wù)權(quán)重的不同。這樣就能夠用GMM來模擬座席I模型的特征在空間上的分布。其他模型采用類似方法依次訓(xùn)練得到。S304:根據(jù)所述的短時能量、基音、譜參數(shù)與訓(xùn)練后的座席集中的各個座席進(jìn)行匹配,得到各個座席對應(yīng)的對數(shù)評分。座席模型的匹配是指用戶語音特征和各座席模型進(jìn)行匹配,得到最佳的座席為用戶進(jìn)行服務(wù)。對于屬于的語音序列ot (t=l,…,T),和某一個座席GMM模型Xi進(jìn)行匹配的結(jié)果是一個對數(shù)評分4=ii{k)g[m|為)]}
i i=l該語音序列和所有的GMM模型匹配后,得到各個座席模型的對數(shù)評分。S305 :將所述的各個對數(shù)評分進(jìn)行識別,篩選出與所述的語音信息對應(yīng)的座席。
將各評分進(jìn)行識別評分比較,若某座席模型和語音序列在空間上的距離最小,該模型即為所要選擇的座席模型。圖4為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的方法實施方式四的流程圖,由圖4可知,在實施方式四中,步驟SlOU S102、S103與步驟S401、S402、S403相同,該方法還包括S404 :所述的語音信息對應(yīng)的座席受理所述用戶的需求。S405 :所述的座席在預(yù)設(shè)的中央信息庫中查詢所述用戶的需求信息;S406 :若查詢成功,則將所述的查詢結(jié)果傳送至所述的用戶。
圖10為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的組網(wǎng)結(jié)構(gòu)圖,由圖10可知,在該實施例中,主要包括語音分析裝置、呼叫中心、座席、信息庫、MSC、HLR。其中,呼叫中心是綜合信息服務(wù)門戶業(yè)務(wù)在各省的語音接入點,用戶撥打接入號碼后接入到省呼叫中心。座席,用于完成綜合信息服務(wù)門戶的語音人工接入和呼出,為用戶提供信息查詢服務(wù)。信息庫是綜合信息服務(wù)門戶業(yè)務(wù)的數(shù)據(jù)中心,主要是信息數(shù)據(jù)庫。MSC負(fù)責(zé)將呼叫路由到呼叫中心。另外,MSC還需要通過接口,將用戶的語音傳遞給語音分析模塊,以得到用戶所選擇的座席。HLR歸屬位置寄存器,用存儲于移動用戶有關(guān)信息的數(shù)據(jù)庫。每個移動用戶都應(yīng)在其歸屬位置寄存器中注冊登記有關(guān)的移動業(yè)務(wù)能力。圖11為圖10的組網(wǎng)結(jié)構(gòu)的業(yè)務(wù)流程圖,主要包括I、用戶呼入到省呼叫中心;2、呼叫中心提示用戶說出查詢內(nèi)容,并將查詢內(nèi)容送至語音分析模塊進(jìn)行語音分析。3、語音分析模塊將分析結(jié)果傳給呼叫中心,選擇相應(yīng)的服務(wù)座席。4、座席受理用戶需求。5、座席通過中央信息庫查詢用戶需求信息。6、如果查詢不成功,座席判斷用戶是否需要繼續(xù)查詢,如用戶需要繼續(xù)查詢,轉(zhuǎn)入信息查詢過程,否則受理結(jié)束.7、如果查詢成功,座席將查詢結(jié)果告知用戶。圖5為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式一的結(jié)構(gòu)框圖,由圖5可知,所述的系統(tǒng)包括呼叫中心100,用于接收用戶傳送的語音信息。用戶通過手機、網(wǎng)絡(luò)等方式呼入語音綜合信息門戶,用戶傳送的語音信息中包括了當(dāng)前用戶需要查詢的內(nèi)容等信息。語音分析裝置200,用于從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù);篩選裝置300,用于根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。圖6為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式二的結(jié)構(gòu)框圖,由圖6可知,在實施方式二中,篩選裝置300包括
識別模塊301,用于根據(jù)所述的短時能量、基音、譜參數(shù)識別出所述的語音信息對應(yīng)的語義息、情緒息、語目息、年齡息以及性別息。其中,語義信息指用戶所要表達(dá)的內(nèi)容,根據(jù)語義中的關(guān)鍵字,可以判斷用戶想要查詢哪方面的問題。身份信息指用戶是誰,若用戶此前使用過語音門戶服務(wù),可根據(jù)以前的錄音數(shù)據(jù)判斷是哪個用戶,以得到用戶以前的使用偏好。情緒信息指用戶當(dāng)時所處的情緒狀態(tài),如平靜、憤怒、恐懼、高興和悲傷等,根據(jù)情緒狀態(tài)判斷是否需要送到特殊座席,如用戶在憤怒的情況下是否需要送到特殊心情服務(wù)座
席等o語言信息指用戶所使用的語言種類,識別出是英語、法語等多種外語,還是維語、藏語、粵語等少數(shù)民族語言或方言,以便送到不同的語言座席進(jìn)行服務(wù)。年齡指用戶的年齡段,對不同年齡段的用戶可以細(xì)分到不同的座席或者推薦不同的服務(wù)。性別指男女性別,對不同性別的用戶可以細(xì)分到不同的座席或者推薦不同的服務(wù)。第一篩選模塊302,用于根據(jù)所述的語義信息、情緒信息、語言信息、年齡信息以及性別信息從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息最接近的座席。若當(dāng)如語首/[目息對應(yīng)的語義/[目息、情緒"[目息、語目"[目息、年齡"[目息以及性別彳目息形成一矢量,矢量的各維分別是性別,年齡,情緒,身份,語言,內(nèi)容,若矢量是{0,1,3,0,1,1},則從預(yù)先設(shè)定的座席集中篩選出座席1{0,1,3,0,1,1}與該矢量的距離最為接近,選擇座席I進(jìn)行服務(wù)。在實際操作過程中,存在部分座席合并,或同一座席擔(dān)負(fù)多種座席屬性的情況,往往語音信息形成的矢量不會和座席完全匹配。該種情況下,可通過座席匹配選擇算法實現(xiàn)篩選設(shè)語音信息對應(yīng)的矢量為X={xl,x2,x3,x4,x5},座席i為Yi={yil, yi2, yi3, yi4, yi5},權(quán)重K= {kl, k2, k3, k4, k5},此處引入權(quán)重主要是考慮到每類矢量對座席的重要性的不同,最后座席的選擇為1 二 arg min {X-, |x, - j-v; | + k2 \x2 - y/21 + k' |x; - .vv, | + X,4 |x4 - vv4| + k, \x, -
i即選擇和識別結(jié)果根據(jù)權(quán)重累加后最為接近的座席。圖7為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式三的結(jié)構(gòu)框圖,由圖7可知,在實施方式三中,篩選裝置300包括訓(xùn)練模塊303,用于采用高斯混合模型的方式將預(yù)先設(shè)定的座席集進(jìn)行訓(xùn)練。在實施方式三中,篩選座席前需要針對不同的座席特征訓(xùn)練出相應(yīng)的座席模型,然后將語音特征和座席模型進(jìn)行匹配。座席模型此處采用高斯混合模型,因為從統(tǒng)計理論的角度考慮,無限多個高斯分布的組合可以擬合一個任意形式的分布,因此當(dāng)GMM的混合度M足夠高時,從理論上說就可以足夠精細(xì)的逼近特征矢量的空間分布。一個GMM通??梢杂上铝袇?shù)描述⑴M,模型中的高斯密度函數(shù)的數(shù)目。(2)描述每個高斯密度函數(shù)的參數(shù)均值矢量U i,協(xié)方差矩陣E it)(3)每個高斯密度函數(shù)的權(quán)重,Wit5
如此,可以記一個GMM的模型參數(shù)為\ = {M, {wj,{> J,{ E J }。通常GMM的混合度是事先選定的,因此模型參數(shù)中需要估計的為Am= {{wj, {Uj, { E J}0模型的訓(xùn)練采用最大似然準(zhǔn)則。GMM的基本結(jié)構(gòu)以及觀察特征矢量與模型匹配的基本示意圖如圖9所示。模型訓(xùn)練時,需要對語音數(shù)據(jù)根據(jù)座席的緯度進(jìn)行分類。對某個座席模型,根據(jù)性另IJ,年齡,情緒,身份,語言,內(nèi)容五個不同的緯度,可以定義該座席的座席特征,如對座席I模型而言,其特征是座席I {男,30歲以上,高興,使用過業(yè)務(wù),英語,訂機票},對事先收集到的語音數(shù)據(jù),為了訓(xùn)練座席I的模型,需要對數(shù)據(jù)進(jìn)行標(biāo)記,挑選出“30歲以上男性使用英語以高興的語氣預(yù)訂機票”的數(shù)據(jù),而且該男性原來是使用過本業(yè)務(wù)的。對該類原始語言數(shù)據(jù)進(jìn)行音頻處理后,對高斯混合模型進(jìn)行訓(xùn)練,同時在訓(xùn)練時考慮到各業(yè)務(wù)權(quán)重的不同。這樣就能夠用GMM來模擬座席I模型的特征在空間上的分布。其他模型采用類似方法依次訓(xùn)練得到。匹配模塊304,用于根據(jù)所述的短時能量、基音、譜參數(shù)與訓(xùn)練后的座席集中 的各個座席進(jìn)行匹配,得到各個座席對應(yīng)的對數(shù)評分。座席模型的匹配是指用戶語音特征和各座席模型進(jìn)行匹配,得到最佳的座席為用戶進(jìn)行服務(wù)。對于屬于的語音序列ot(t=l, T),和某一個座席GMM模型入,進(jìn)行匹配的結(jié)果是一個對數(shù)評分該語音序列和所有的GMM模型匹配后,得到各個座席模型的對數(shù)評分。第二篩選模塊305,用于將所述的各個對數(shù)評分進(jìn)行識別,篩選出與所述的語音信息對應(yīng)的座席。將各評分進(jìn)行識別評分比較,若某座席模型和語音序列在空間上的距離最小,該模型即為所要選擇的座席模型。圖8為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的系統(tǒng)實施方式四的結(jié)構(gòu)框圖,由圖8可知,在實施方式四種,該系統(tǒng)還包括座席400,用于受理用戶的需求,為用戶提供信息查詢服務(wù)。中央信息庫500,用于存儲信息數(shù)據(jù)。圖10為本發(fā)明實施例提供的一種利用語音進(jìn)行座席篩選的組網(wǎng)結(jié)構(gòu)圖,由圖10可知,在該實施例中,主要包括語音分析裝置、呼叫中心、座席、信息庫、MSC、HLR。其中,呼叫中心是綜合信息服務(wù)門戶業(yè)務(wù)在各省的語音接入點,用戶撥打接入號碼后接入到省呼叫中心。座席,用于完成綜合信息服務(wù)門戶的語音人工接入和呼出,為用戶提供信息查詢服務(wù)。信息庫是綜合信息服務(wù)門戶業(yè)務(wù)的數(shù)據(jù)中心,主要是信息數(shù)據(jù)庫。MSC負(fù)責(zé)將呼叫路由到呼叫中心。另外,MSC還需要通過接口,將用戶的語音傳遞給語音分析模塊,以得到用戶所選擇的座席。HLR歸屬位置寄存器,用存儲于移動用戶有關(guān)信息的數(shù)據(jù)庫。每個移動用戶都應(yīng)在其歸屬位置寄存器中注冊登記有關(guān)的移動業(yè)務(wù)能力。圖11為圖10的組網(wǎng)結(jié)構(gòu)的業(yè)務(wù)流程圖,主要包括
I、用戶呼入到省呼叫中心;2、呼叫中心提示用戶說出查詢內(nèi)容,并將查詢內(nèi)容送至語音分析模塊進(jìn)行語音分析。3、語音分析模塊將分析結(jié)果傳給呼叫中心,選擇相應(yīng)的服務(wù)座席。4、座席受理用戶需求。5、座席通過中央信息庫查詢用戶需求信息。6、如果查詢不成功,座席判斷用戶是否需要繼續(xù)查詢,如用戶需要繼續(xù)查詢,轉(zhuǎn)入信息查詢過程,否則受理結(jié)束.7、如果查詢成功,座席將查詢結(jié)果告知用戶。 綜上所述,本發(fā)明提供的一種利用語音進(jìn)行座席篩選的方法及裝置,通過對用戶語音進(jìn)行分析,提取用戶語義信息、身份信息、情緒特征、語言信息、年齡、性別特征,并根據(jù)此信息選擇座席,無須使用IVR菜單進(jìn)行用戶手動選擇座席,提升了用戶對業(yè)務(wù)的使用體驗,減少了等待時間,同時也減少了系統(tǒng)資源的浪費。另外,本發(fā)明根據(jù)語音中的多種信息為用戶提供豐富多樣的座席,達(dá)到了對用戶細(xì)分的目的,可以為用戶提供更加個性化和周到的座席服務(wù)。本發(fā)明中應(yīng)用了具體實施例對本發(fā)明的原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種利用語音進(jìn)行座席篩選的方法,其特征是,所述的方法包括 接收用戶傳送的語音信息; 從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù); 根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。
2.根據(jù)權(quán)利要求I所述的方法,其特征是,根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席具體包括 根據(jù)所述的短時能量、基音、譜參數(shù)識別出所述的語音信息對應(yīng)的語義信息、情緒信息、語目彳目息、年齡 目息以及性別 目息; 根據(jù)所述的語義信息、情緒信息、語言信息、年齡信息以及性別信息從預(yù)先設(shè)定的座席 集中篩選出與所述的語音信息最接近的座席。
3.根據(jù)權(quán)利要求I所述的方法,其特征是,根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席具體包括 采用高斯混合模型的方式將預(yù)先設(shè)定的座席集進(jìn)行訓(xùn)練; 根據(jù)所述的短時能量、基音、譜參數(shù)與訓(xùn)練后的座席集中的各個座席進(jìn)行匹配,得到各個座席對應(yīng)的對數(shù)評分; 將所述的各個對數(shù)評分進(jìn)行識別,篩選出與所述的語音信息對應(yīng)的座席。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征是,所述的方法還包括 所述的語音信息對應(yīng)的座席受理所述用戶的需求。
5.根據(jù)權(quán)利要求4所述的方法,其特征是,所述的語音信息對應(yīng)的座席受理所述用戶的需求具體包括 所述的座席在預(yù)設(shè)的中央信息庫中查詢所述用戶的需求信息; 若查詢成功,則將所述的查詢結(jié)果傳送至所述的用戶。
6.一種利用語音進(jìn)行座席篩選的系統(tǒng),其特征是,所述的系統(tǒng)包括 呼叫中心,用于接收用戶傳送的語音信息; 語音分析裝置,用于從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù); 篩選裝置,用于根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征是,所述的篩選裝置具體包括 識別模塊,用于根據(jù)所述的短時能量、基音、譜參數(shù)識別出所述的語音信息對應(yīng)的語義 息、情緒 目息、語目 目息、年齡息以及性別/[目息; 第一篩選模塊,用于根據(jù)所述的語義信息、情緒信息、語言信息、年齡信息以及性別信息從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息最接近的座席。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征是,所述的篩選裝置具體包括 訓(xùn)練模塊,用于采用高斯混合模型的方式將預(yù)先設(shè)定的座席集進(jìn)行訓(xùn)練; 匹配模塊,用于根據(jù)所述的短時能量、基音、譜參數(shù)與訓(xùn)練后的座席集中的各個座席進(jìn)行匹配,得到各個座席對應(yīng)的對數(shù)評分; 第二篩選模塊,用于將所述的各個對數(shù)評分進(jìn)行識別,篩選出與所述的語音信息對應(yīng)的座席。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征是,所述的系統(tǒng)還包括座席,用于受理用戶的需求,為用戶提供信息查詢服務(wù)。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征是,所述的系統(tǒng)還包括中央信息庫,用于存儲信息數(shù)據(jù)。
全文摘要
本發(fā)明實施例提供了一種利用語音進(jìn)行座席篩選的方法及系統(tǒng),所述的方法包括接收用戶傳送的語音信息;從所述的語音信息中提取對應(yīng)的短時能量、基音、譜參數(shù);根據(jù)所述的短時能量、基音、譜參數(shù)從預(yù)先設(shè)定的座席集中篩選出與所述的語音信息對應(yīng)的座席。通過對用戶語音進(jìn)行分析,提取語義信息、身份信息、情緒特征、語言信息、年齡、性別特征,并根據(jù)此信息選擇座席,無須使用IVR菜單進(jìn)行用戶手動選擇座席,提升了用戶對業(yè)務(wù)的使用體驗,減少了等待時間,同時也減少了系統(tǒng)資源的浪費。
文檔編號H04W88/18GK102802114SQ20121021094
公開日2012年11月28日 申請日期2012年6月20日 優(yōu)先權(quán)日2012年6月20日
發(fā)明者解焱陸, 張勁松 申請人:北京語言大學(xué)