實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置,該方法包括:獲取客戶與座席的語音流;對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;基于分類模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序;根據(jù)排序結(jié)果確定來電原因結(jié)果。利用本發(fā)明,可以減輕座席的記憶負(fù)擔(dān)和檢索負(fù)擔(dān),提升來電原因記錄的準(zhǔn)確性和全面性。
【專利說明】實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工智能【技術(shù)領(lǐng)域】,具體涉及一種實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置。
【背景技術(shù)】
[0002]隨著呼叫中心業(yè)務(wù)的不斷發(fā)展,客服服務(wù)總量越來越大,客戶對(duì)服務(wù)的質(zhì)量要求也越來越高。為了提升自身服務(wù)質(zhì)量,呼叫中心要求座席記錄每通電話的客戶來電原因,從而實(shí)現(xiàn)客戶需求的精準(zhǔn)定位,以便后續(xù)的經(jīng)營分析,優(yōu)化業(yè)務(wù)辦理流程,發(fā)現(xiàn)公司產(chǎn)品、營銷案設(shè)計(jì)缺陷等。
[0003]目前,通話來電原因的記錄主要通過座席根據(jù)客戶的問題關(guān)聯(lián)公司業(yè)務(wù)點(diǎn)進(jìn)行來電原因歸類點(diǎn)擊。具體地,一通電話結(jié)束后,呼叫中心的座席系統(tǒng)會(huì)彈出一棵來電原因樹,座席通過回憶總結(jié)本通電話客戶的來電內(nèi)容,層層點(diǎn)擊選擇樹上來電原因節(jié)點(diǎn)記錄客戶的來電原因,但由于來電原因樹體系復(fù)雜,通常運(yùn)營商來電原因樹的層級(jí)結(jié)構(gòu)會(huì)達(dá)到八層左右,節(jié)點(diǎn)數(shù)通常也有數(shù)千個(gè),座席在較短時(shí)間內(nèi)選擇來電原因,添加了太多主觀性,普遍存在點(diǎn)擊錯(cuò)誤問題。如果一通來電中客戶會(huì)涉及到多個(gè)問題,這樣就給座席帶來巨大的記憶負(fù)擔(dān),會(huì)出現(xiàn)來電原因點(diǎn)擊不全問題。點(diǎn)擊錯(cuò)誤問題和點(diǎn)擊不全問題,導(dǎo)致客戶來電原因數(shù)據(jù)記錄存在很大偏差,基礎(chǔ)數(shù)據(jù)的偏差將直接導(dǎo)致運(yùn)營分析結(jié)果的失真。此外,每通電話都要層層點(diǎn)擊選擇來電原因,影響座席的工作效率,降低單位時(shí)間內(nèi)接聽電話數(shù)量,增加呼叫中心的運(yùn)營成本。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供一種實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置,以減輕座席的記憶負(fù)擔(dān)和檢索負(fù)擔(dān),提升來電原因記錄的準(zhǔn)確性和全面性。
[0005]為此,本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0006]一種實(shí)現(xiàn)來電原因自動(dòng)分類的方法,包括:
[0007]獲取客戶與座席的語音流;
[0008]對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;
[0009]提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;
[0010]以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;
[0011 ] 基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序;
[0012]根據(jù)排序結(jié)果確定來電原因結(jié)果。
[0013]優(yōu)選地,所述獲取客戶與座席的語音流包括:
[0014]直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,得到座席的語音流;
[0015]設(shè)置虛擬聲卡,通過對(duì)所述虛擬聲卡上輸出的客戶的語音流進(jìn)行錄音,得到客戶的語音流。
[0016]優(yōu)選地,所述對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本包括:
[0017]利用預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的聲學(xué)模型和/或預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的語言模型分別對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到各自對(duì)應(yīng)的文本片段;
[0018]根據(jù)各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
[0019]優(yōu)選地,所述提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息包括:
[0020]抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞;
[0021]對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧;
[0022]獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
[0023]優(yōu)選地,所述根據(jù)排序結(jié)果確定來電原因結(jié)果包括:
[0024]選擇排在首位的預(yù)估結(jié)果作為來電原因結(jié)果;或者
[0025]依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
[0026]優(yōu)選地,所述方法還包括:
[0027]向應(yīng)用系統(tǒng)提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
[0028]一種實(shí)現(xiàn)來電原因自動(dòng)分類的裝置,包括:
[0029]語音獲取模塊,用于獲取客戶與座席的語音流;
[0030]語音識(shí)別模塊,用于對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;
[0031]信息提取模塊,用于提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;
[0032]檢索模塊,用于以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;
[0033]排序模塊,用于基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序;
[0034]選擇模塊,用于根據(jù)排序結(jié)果確定來電原因結(jié)果。
[0035]優(yōu)選地,所述語音獲取模塊包括:
[0036]座席語音流獲取單元,用于直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,得到座席的語音流;
[0037]客戶語音流獲取單元,用于通過對(duì)設(shè)置的虛擬聲卡上輸出的客戶的語音流進(jìn)行錄音,得到客戶的語音流。
[0038]優(yōu)選地,所述語音識(shí)別模塊包括:
[0039]識(shí)別單元,用于利用預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的聲學(xué)模型分別對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到各自對(duì)應(yīng)的文本片段;
[0040]合并單元,用于根據(jù)所述識(shí)別單元得到的各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
[0041 ] 優(yōu)選地,所述信息提取模塊包括:
[0042]關(guān)鍵詞抽取單元,用于抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞;
[0043]規(guī)整單元,用于對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧;
[0044]語義標(biāo)簽獲取單元,用于獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
[0045]優(yōu)選地,所述選擇模塊將排在首位的預(yù)估結(jié)果作為來電原因結(jié)果;或者所述選擇模塊依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的多個(gè)預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
[0046]優(yōu)選地,所述裝置還包括:
[0047]提交模塊,用于向應(yīng)用系統(tǒng)提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
[0048]本發(fā)明實(shí)施例提供的實(shí)現(xiàn)來電原因自動(dòng)分類的方法及裝置,對(duì)客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;通過提取對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;并以該語義標(biāo)簽信息作為索引,搜索得到與對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;然后基于分類模型對(duì)這些預(yù)估結(jié)果進(jìn)行排序,并根據(jù)排序結(jié)果確定來電原因結(jié)果。一方面可以避免座席通過記憶造成來電原因的錯(cuò)選或者漏選,減輕座席的記憶負(fù)擔(dān)和檢索負(fù)擔(dān),并提升來電原因記錄的準(zhǔn)確性和全面性;另一方面可以縮短座席的通話處理時(shí)長,降低呼叫中心的運(yùn)營成本。
【專利附圖】
【附圖說明】
[0049]為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1是本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的方法的流程圖;
[0051]圖2是本發(fā)明實(shí)施例中排序模型的構(gòu)建流程圖;
[0052]圖3是本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的裝置的一種結(jié)構(gòu)示意圖;
[0053]圖4是本發(fā)明實(shí)施例中信息提取模塊的一種結(jié)構(gòu)示意圖;;
[0054]圖5是本發(fā)明實(shí)施例中排序模型構(gòu)建模塊的一種結(jié)構(gòu)示意圖;
[0055]圖6是本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的裝置的另一種結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0056]為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說明。
[0057]如圖1所示,是本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的方法的流程圖,包括以下步驟:
[0058]步驟101,獲取客戶與座席的語音流。
[0059]具體地,可以通過對(duì)座席的客戶端設(shè)備進(jìn)行分聲道實(shí)時(shí)錄音,獲取座席通道和客戶通道的語音流,其中對(duì)于座席聲道,可以直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,客戶聲道語音流可以借助虛擬聲卡中轉(zhuǎn)獲得,比如,在所述客戶端設(shè)備上安裝虛擬聲卡驅(qū)動(dòng),通過配置虛擬聲卡,將客戶的語音流經(jīng)過虛擬聲卡中轉(zhuǎn),一方面輸出到音頻設(shè)備,另一方面可以從中轉(zhuǎn)器上輸出客戶的語音流,然后對(duì)該客戶的語音流進(jìn)行錄音,這樣就完成客戶和座席雙通道的錄音。當(dāng)然,如果所述音頻設(shè)備具有對(duì)外接口,也可以不用借助虛擬聲卡,直接對(duì)音頻設(shè)備輸出的語音流進(jìn)行錄音。
[0060]步驟102,對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本。
[0061]需要說明的是,上述獲取客戶與座席的語音流及對(duì)所述語音流進(jìn)行語音識(shí)別的過程可以是在每通通話結(jié)束后進(jìn)行,也可以定時(shí)或定段進(jìn)行,也可以是實(shí)時(shí)進(jìn)行,對(duì)此本發(fā)明實(shí)施例不做限定。
[0062]具體地,如果實(shí)時(shí)進(jìn)行,可以分別對(duì)客戶語音流及座席語音流進(jìn)行端點(diǎn)檢測(cè),得到多個(gè)語音片段,然后將每個(gè)語音片段進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的文本片段,最后再根據(jù)各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
[0063]上述語音識(shí)別的過程可以利用通用的語言模型和聲學(xué)模型,采用現(xiàn)有的語音識(shí)別方法,對(duì)此本發(fā)明不做限定。特別地,為了進(jìn)一步提高語音識(shí)別的準(zhǔn)確度,在實(shí)際應(yīng)用中,可以針對(duì)不同的應(yīng)用區(qū)域,結(jié)合客戶涉及的各地、各區(qū)域地方口音適配,來訓(xùn)練優(yōu)化語音識(shí)別過程中所使用的聲學(xué)模型和/或語言模型,具體地,可以在聲學(xué)模型和語言模型的訓(xùn)練過程中使用大量該口音的樣本進(jìn)行訓(xùn)練。另外,還可以結(jié)合業(yè)務(wù)知識(shí)和熱線服務(wù)范圍,進(jìn)行語言模型優(yōu)化。
[0064]步驟103,提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息。
[0065]語義標(biāo)簽信息的提取可以概括為以下三個(gè)過程:
[0066](I)抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞。
[0067]比如,可以預(yù)先建立業(yè)務(wù)關(guān)鍵詞表,對(duì)所述對(duì)話文本中的各文本片段進(jìn)行分詞,得到各分詞單元,將各分詞單元分別與業(yè)務(wù)關(guān)鍵詞表中的業(yè)務(wù)關(guān)鍵詞進(jìn)行匹配,即可確定所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞。再比如,可以利用統(tǒng)計(jì)方法并結(jié)合上下文信息構(gòu)建業(yè)務(wù)關(guān)鍵詞樹,其中,每個(gè)葉節(jié)點(diǎn)對(duì)應(yīng)一個(gè)業(yè)務(wù)關(guān)鍵詞,利用該業(yè)務(wù)關(guān)鍵詞樹及相應(yīng)的查找策略,抽取得到所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞。
[0068](2)對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧。
[0069]消歧的目的是對(duì)獲得的業(yè)務(wù)關(guān)鍵詞進(jìn)行規(guī)整,比如,對(duì)其中包括的同義詞、近義詞等進(jìn)行合并處理,以避免一些詞義相近的關(guān)鍵詞造成重復(fù),并減少運(yùn)算量,提高語義標(biāo)簽信息的抽取效率。
[0070](3)獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
[0071]所述語義標(biāo)簽信息可以包括業(yè)務(wù)關(guān)鍵詞的詞性、詞類等語義信息。具體地,可以預(yù)先采用統(tǒng)計(jì)方式,建立語義標(biāo)簽信息表,該語義標(biāo)簽信息表包括業(yè)務(wù)關(guān)鍵詞及其對(duì)應(yīng)的語義信息。通過查表即可得到消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
[0072]由于同一個(gè)關(guān)鍵詞在不同的上下文環(huán)境中可能會(huì)有不同的詞性、詞類等語義信息,因此,為了進(jìn)一步提高獲取的各業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息的準(zhǔn)確性,還可以結(jié)合業(yè)務(wù)關(guān)鍵詞的上下文,訓(xùn)練得到上下文相關(guān)的關(guān)鍵詞網(wǎng)絡(luò)模型,基于該模型確定各業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。關(guān)鍵詞網(wǎng)絡(luò)模型的訓(xùn)練可采用一些常規(guī)方式,對(duì)此本發(fā)明實(shí)施例不做限定。
[0073]步驟104,以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果。
[0074]所述來電原因索引庫是基于大數(shù)據(jù)挖掘構(gòu)建的,該庫的建立需要用戶提供每個(gè)來電原因?qū)?yīng)的原始通話數(shù)據(jù),比如,每條來電原因?qū)?yīng)200條左右的對(duì)話文本,對(duì)含有來電原因分類標(biāo)簽的對(duì)話文本進(jìn)行語義抽取,建立來電原因索引庫。
[0075]以業(yè)務(wù)關(guān)鍵詞的詞性、詞類等語義標(biāo)簽信息作為搜索條件,在來電原因索引庫中進(jìn)行搜索,得到與當(dāng)前對(duì)話文本最接近的η個(gè)來電原因預(yù)估結(jié)果,比如η的取值范圍可以為50 ?200。
[0076]步驟105,基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序。
[0077]本發(fā)明實(shí)施例的排序模型,利用機(jī)器學(xué)習(xí)的方法學(xué)習(xí)出參數(shù)權(quán)重,實(shí)現(xiàn)基于統(tǒng)計(jì)的排序方法,對(duì)上述多個(gè)預(yù)估結(jié)果與本次對(duì)話文本之間的相關(guān)度進(jìn)行排序。
[0078]排序模型的構(gòu)建及基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序的具體過程將在后面詳細(xì)描述。
[0079]步驟106,根據(jù)排序結(jié)果確定來電原因結(jié)果。
[0080]具體地,可以選擇排在首位的預(yù)估結(jié)果作為來電原因結(jié)果。
[0081]當(dāng)然,為了進(jìn)一步保證選擇的正確性,還可以由人工輔助來確定。比如,依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的預(yù)估結(jié)果進(jìn)行選擇,即在顯示界面上彈出本通電話的來電原因列表,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
[0082]需要說明的是,在實(shí)際應(yīng)用中,本發(fā)明實(shí)施例的方法還可以向應(yīng)用系統(tǒng)(比如座席系統(tǒng))提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
[0083]如圖2所示,是本發(fā)明實(shí)施例中排序模型的構(gòu)建流程圖,,包括以下步驟:
[0084]步驟201,收集訓(xùn)練數(shù)據(jù)。
[0085]訓(xùn)練數(shù)據(jù)可以來自于海量的用戶日志,也可以是由人工標(biāo)注得到的訓(xùn)練數(shù)據(jù)。
[0086]步驟202,對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行來電原因標(biāo)注,得到訓(xùn)練樣本。
[0087]步驟203,對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行語義解析,得到語義解析結(jié)果。
[0088]步驟204,提取所述語義解析結(jié)果的相關(guān)度特征。
[0089]該相關(guān)度特征反映了語義解析結(jié)果與標(biāo)注的來電原因的通話的相關(guān)度,具體可以是以下任意一種或多種:語義解析結(jié)果所能理解的詞數(shù)、核心元素?cái)?shù)、核心元素內(nèi)容的熱度。其中:所述詞數(shù)表示所述語義解析結(jié)果與所述訓(xùn)練數(shù)據(jù)針對(duì)同一來電原因共同出現(xiàn)的詞數(shù);
[0090]所述核心元素?cái)?shù)表示所述語義解析結(jié)果與所述訓(xùn)練數(shù)據(jù)針對(duì)同一來電原因共同出現(xiàn)的核心元素?cái)?shù);
[0091]所述核心元素內(nèi)容的熱度表示核心元素內(nèi)容在來電原因通話下的熱門程度。
[0092]當(dāng)然,還可以有其它用于反映語義解析結(jié)果與標(biāo)注的來電原因的通話的相關(guān)度的特征,對(duì)此本發(fā)明實(shí)施例不做限定。
[0093]步驟205,利用所述訓(xùn)練樣本及所述相關(guān)度特征訓(xùn)練得到排序模型。
[0094]具體地,可以采用Learning To Rank(基于機(jī)器學(xué)習(xí)的排序方法,L2R)的方式,選擇合適的算法訓(xùn)練模型,例如Ranking SVM(基于支持向量機(jī)的排序?qū)W習(xí)算法)、RankBoost、RankNet 等。
[0095]本發(fā)明實(shí)施例中的排序模型可以采用包含大量用戶實(shí)際說法的、覆蓋多種意圖和參數(shù)組合的大規(guī)模訓(xùn)練數(shù)據(jù)通過離線訓(xùn)練得到,該大規(guī)模數(shù)據(jù)能較為真實(shí)地反映客戶語音流在語義方面的特征,從而使得該排序模型能夠全面、準(zhǔn)確地體現(xiàn)各語義解析結(jié)果與不同來電原因通話的相關(guān)度。
[0096]基于上述排序模型,在對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序時(shí),可以將各預(yù)估結(jié)果的相關(guān)度特征與排序模型進(jìn)行匹配計(jì)算,得到一個(gè)置信度得分。然后選擇排置信度最高的預(yù)估結(jié)果作為來電原因結(jié)果;或者依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
[0097]例如,假設(shè)來電原因索引庫中來電原因有“充話費(fèi)”、“加流量”、“改彩鈴”等幾種,每一種來電原因在通話中會(huì)涉及到一些不同的關(guān)鍵詞,比如來電原因?yàn)椤俺湓捹M(fèi)”時(shí),可能出現(xiàn)“欠費(fèi)”、“銀行卡”等關(guān)鍵詞,這些關(guān)鍵詞可以通過語音信號(hào)中的一些具體特征體現(xiàn),構(gòu)建排序模型時(shí),提取這些特征,訓(xùn)練構(gòu)建排序模型。不同的來電原因的特征參數(shù)是不一樣的。在識(shí)別階段,會(huì)對(duì)客戶與座席的通話文本的這些特征進(jìn)行提取,并將這些特征與每個(gè)來電原因的語義模型進(jìn)行匹配,匹配度最高的即為第一候選來電原因,依次類推。比如客戶與座席的通話文本中出現(xiàn)“話費(fèi)”、“流量”、“銀行卡”等關(guān)鍵詞,那么提取出的特征參數(shù)與來電原因?yàn)椤俺湓捹M(fèi)”的模型匹配程度應(yīng)該最高,作為來電原因第一候選,與“加流量”的模型匹配程度次高,作為第二候選。
[0098]可見,本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的方法,對(duì)獲取的客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;通過提取對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;并以該語義標(biāo)簽信息作為索引,搜索得到與對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;然后基于分類模型對(duì)這些預(yù)估結(jié)果進(jìn)行排序,并根據(jù)排序結(jié)果確定來電原因結(jié)果。一方面可以避免座席通過記憶造成來電原因的錯(cuò)選或者漏選,減輕座席的記憶負(fù)擔(dān)和檢索負(fù)擔(dān),并提升來電原因記錄的準(zhǔn)確性和全面性;另一方面可以縮短座席的通話處理時(shí)長,降低呼叫中心的運(yùn)營成本。
[0099]相應(yīng)地,本發(fā)明實(shí)施例還提供一種實(shí)現(xiàn)來電原因自動(dòng)分類的裝置,如圖3所示,是該裝置的一種結(jié)構(gòu)示意圖。
[0100]在該實(shí)施例中,所述裝置包括:
[0101]語音獲取模塊301,用于獲取客戶與座席的語音流;
[0102]語音識(shí)別模塊302,用于對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本;
[0103]信息提取模塊303,用于提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息;
[0104]檢索模塊304,用于以所述語義標(biāo)簽信息作為索引,在來電原因索引庫300中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果;
[0105]排序模塊305,用于基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序;
[0106]選擇模塊306,用于根據(jù)排序結(jié)果確定來電原因結(jié)果。
[0107]需要說明的是,上述語音獲取模塊301獲取客戶與座席的語音流及語音識(shí)別模塊302對(duì)所述語音流進(jìn)行語音識(shí)別的過程可以是在每通通話結(jié)束后進(jìn)行,也可以定時(shí)或定段進(jìn)行,也可以是實(shí)時(shí)進(jìn)行,對(duì)此本發(fā)明實(shí)施例不做限定。
[0108]比如,上述語音獲取模塊可以采用多種方式獲取客戶與座席的語音流,比如該模塊可以包括:座席語音流獲取單元和客戶語音流獲取單元。其中:
[0109]所述座席語音流獲取單元用于直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,得到座席的語音流;
[0110]所述客戶語音流獲取單元用于通過對(duì)設(shè)置的虛擬聲卡上輸出的客戶的語音流進(jìn)行錄音,得到客戶的語音流。
[0111]另外,上述語音識(shí)別模塊302可以利用通用的語言模型和聲學(xué)模型,采用現(xiàn)有的語音識(shí)別方法進(jìn)行語音識(shí)別,對(duì)此本發(fā)明不做限定。特別地,為了進(jìn)一步提高語音識(shí)別的準(zhǔn)確度,在實(shí)際應(yīng)用中,可以針對(duì)不同的應(yīng)用區(qū)域,結(jié)合客戶涉及的各地、各區(qū)域地方口音適配,來訓(xùn)練優(yōu)化語音識(shí)別過程中所使用的聲學(xué)模型和/或語言模型,比如,上述語音識(shí)別模塊的一種具體結(jié)構(gòu)包括:識(shí)別單元和合并單元。其中:
[0112]所述識(shí)別單元用于利用預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的聲學(xué)模型和/或預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的語言模型分別對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到各自對(duì)應(yīng)的文本片段;
[0113]所述合并單元用于根據(jù)所述識(shí)別單元得到的各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
[0114]如圖4所示,是本發(fā)明實(shí)施例中信息提取模塊的一種結(jié)構(gòu)示意圖。
[0115]該信息提取模塊包括:
[0116]關(guān)鍵詞抽取單元401,用于抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞;
[0117]規(guī)整單元402,用于對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧;
[0118]語義標(biāo)簽獲取單元403,用于獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
[0119]上述選擇模塊306具體可以將排在首位的預(yù)估結(jié)果作為來電原因結(jié)果;或者依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的多個(gè)預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
[0120]需要說明的是,在實(shí)際應(yīng)用中,所述排序模型可以采用離線的方式預(yù)先訓(xùn)練,具體可以由其它系統(tǒng)訓(xùn)練,也可以在本發(fā)明實(shí)施例的裝置中設(shè)置相應(yīng)的排序模型構(gòu)建模塊(未圖示)來構(gòu)建該排序模型。
[0121]如圖5所示,是本發(fā)明實(shí)施例中排序模型構(gòu)建模塊的一種結(jié)構(gòu)示意圖。
[0122]所述排序模型構(gòu)建模塊包括:
[0123]訓(xùn)練數(shù)據(jù)獲取單元501,用于收集訓(xùn)練數(shù)據(jù)。
[0124]標(biāo)注單元502,用于對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行來電原因標(biāo)注,,得到訓(xùn)練樣本。
[0125]語義解析單元503,用于對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行語義解析,得到語義解析結(jié)果。
[0126]特征提取單元504,用于提取所述語義解析結(jié)果的相關(guān)度特征。所述相關(guān)度特征反映了語義解析結(jié)果與標(biāo)注的來電原因的通話的相關(guān)度,具體可參照前面的描述。
[0127]訓(xùn)練單元505,用于利用所述訓(xùn)練樣本及所述相關(guān)度特征訓(xùn)練得到排序模型。
[0128]上述各單元的功能的具體實(shí)現(xiàn)過程可以參見前面本發(fā)明方法實(shí)施例中的描述,在此不再贅述。
[0129]本發(fā)明實(shí)施例中的排序模型可以采用包含大量用戶實(shí)際說法的、覆蓋多種意圖和參數(shù)組合的大規(guī)模訓(xùn)練數(shù)據(jù)通過離線訓(xùn)練得到,該大規(guī)模數(shù)據(jù)能較為真實(shí)地反映客戶語音流在語義方面的特征,從而使得該排序模型能夠全面、準(zhǔn)確地體現(xiàn)各語義解析結(jié)果與不同來電原因通話的相關(guān)度。
[0130]需要說明的是,為了進(jìn)一步保證選擇的正確性,還可以由人工輔助來確定。相應(yīng)地,如圖6所示,在本發(fā)明裝置的另一實(shí)施例中,所述裝置還可進(jìn)一步包括:提交模塊307,用于向應(yīng)用系統(tǒng)提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
[0131]與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例實(shí)現(xiàn)來電原因自動(dòng)分類的裝置具有以下優(yōu)點(diǎn):
[0132](I)來電原因記錄的準(zhǔn)確性,融入語義特征的來電原因排序模型,來電原因識(shí)別準(zhǔn)確率更尚;
[0133](2)來電原因記錄的全面性,基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù)給出每通電話的多個(gè)來電原因,來電原因記錄更加全面;
[0134](3)來電原因記錄的高效性,通過本發(fā)明的實(shí)時(shí)語音轉(zhuǎn)寫、實(shí)時(shí)來電原因識(shí)別等處理,實(shí)現(xiàn)來電原因自動(dòng)給出,極大地減少了客服的工作量,提升效率。
[0135]本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0136]以上對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及設(shè)備;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種實(shí)現(xiàn)來電原因自動(dòng)分類的方法,其特征在于,包括: 獲取客戶與座席的語音流; 對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本; 提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息; 以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果; 基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序; 根據(jù)排序結(jié)果確定來電原因結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取客戶與座席的語音流包括: 直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,得到座席的語音流; 設(shè)置虛擬聲卡,通過對(duì)所述虛擬聲卡上輸出的客戶的語音流進(jìn)行錄音,得到客戶的語音流。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本包括: 利用預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的聲學(xué)模型和/或預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的語言模型分別對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到各自對(duì)應(yīng)的文本片段; 根據(jù)各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息包括: 抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞; 對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧; 獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)排序結(jié)果確定來電原因結(jié)果包括: 選擇排在首位的預(yù)估結(jié)果作為來電原因結(jié)果;或者 依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述方法還包括: 向應(yīng)用系統(tǒng)提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
7.一種實(shí)現(xiàn)來電原因自動(dòng)分類的裝置,其特征在于,包括: 語音獲取模塊,用于獲取客戶與座席的語音流; 語音識(shí)別模塊,用于對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到對(duì)話文本; 信息提取模塊,用于提取所述對(duì)話文本對(duì)應(yīng)的語義標(biāo)簽信息; 檢索模塊,用于以所述語義標(biāo)簽信息作為索引,在來電原因索引庫中進(jìn)行搜索,得到與所述對(duì)話文本最接近的多個(gè)預(yù)估結(jié)果; 排序模塊,用于基于排序模型對(duì)所述多個(gè)預(yù)估結(jié)果進(jìn)行排序; 選擇模塊,用于根據(jù)排序結(jié)果確定來電原因結(jié)果。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語音獲取模塊包括: 座席語音流獲取單元,用于直接從物理聲卡中錄音座席麥克風(fēng)輸入的語音流,得到座席的語音流; 客戶語音流獲取單元,用于通過對(duì)設(shè)置的虛擬聲卡上輸出的客戶的語音流進(jìn)行錄音,得到客戶的語音流。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語音識(shí)別模塊包括: 識(shí)別單元,用于利用預(yù)先結(jié)合各區(qū)域地方口音適配訓(xùn)練得到的聲學(xué)模型分別對(duì)所述客戶與座席的語音流進(jìn)行語音識(shí)別,得到各自對(duì)應(yīng)的文本片段; 合并單元,用于根據(jù)所述識(shí)別單元得到的各文本片段對(duì)應(yīng)的語音流的時(shí)間點(diǎn),對(duì)所述文本片段進(jìn)行合并,得到所述對(duì)話文本。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述信息提取模塊包括: 關(guān)鍵詞抽取單元,用于抽取所述對(duì)話文本中的業(yè)務(wù)關(guān)鍵詞; 規(guī)整單元,用于對(duì)所述業(yè)務(wù)關(guān)鍵詞進(jìn)行詞義消歧; 語義標(biāo)簽獲取單元,用于獲取消歧后的業(yè)務(wù)關(guān)鍵詞的語義標(biāo)簽信息。
11.根據(jù)權(quán)利要求1所述的裝置,其特征在于, 所述選擇模塊將排在首位的預(yù)估結(jié)果作為來電原因結(jié)果;;或者 所述選擇模塊依次選擇排在前面的多個(gè)預(yù)估結(jié)果進(jìn)行顯示,以使座席對(duì)顯示的多個(gè)預(yù)估結(jié)果進(jìn)行選擇,并將座席選擇的預(yù)估結(jié)果作為來電原因結(jié)果。
12.根據(jù)權(quán)利要求7至11任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 提交模塊,用于向應(yīng)用系統(tǒng)提交所述來電原因結(jié)果,以使所述應(yīng)用系統(tǒng)保存所述來電原因結(jié)果。
【文檔編號(hào)】G06F17/30GK104462600SQ201410853688
【公開日】2015年3月25日 申請(qǐng)日期:2014年12月31日 優(yōu)先權(quán)日:2014年12月31日
【發(fā)明者】何綿濤, 劉江, 王平華, 梅珂, 吳玲, 喬玉平, 李釗輝, 榮幸 申請(qǐng)人:科大訊飛股份有限公司