亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

人機(jī)對(duì)話異常檢測(cè)系統(tǒng)及方法與流程

文檔序號(hào):12609368閱讀:674來源:國(guó)知局
人機(jī)對(duì)話異常檢測(cè)系統(tǒng)及方法與流程

本發(fā)明涉及的是一種信息處理領(lǐng)域的技術(shù),具體是一種人機(jī)對(duì)話異常檢測(cè)系統(tǒng)及方法。



背景技術(shù):

自從Siri在iPhone4s及iPad3問世以來,人機(jī)對(duì)話系統(tǒng)迅速吸引了大眾的注意力,從一開始的好奇、試用、調(diào)戲,到對(duì)其回答不了問題或者答非所問后的失望和放棄。盡管體驗(yàn)不能讓人滿意,Siri推出后市場(chǎng)的劇烈反響,體現(xiàn)出大眾對(duì)人工智能的期望很高,蘋果、Google、微軟、亞馬遜等國(guó)際巨頭相繼投入大量資源研究與Siri相似的產(chǎn)品。

人機(jī)對(duì)話系統(tǒng)的核心在于機(jī)器能夠在建好的系統(tǒng)框架下,根據(jù)事先的數(shù)據(jù)訓(xùn)練或?qū)W習(xí),自動(dòng)對(duì)用戶提出的問題進(jìn)行理解和分析,并給出有意義的回復(fù)。限于現(xiàn)有語音及語義理解技術(shù)的發(fā)展水平,機(jī)器尚無法通過訓(xùn)練或?qū)W習(xí)完全達(dá)到和人一樣的理解和表達(dá)能力。所以,現(xiàn)階段比較有實(shí)際應(yīng)用價(jià)值的應(yīng)用在于任務(wù)型對(duì)話系統(tǒng),即限定在某一個(gè)或多個(gè)垂直領(lǐng)域,同時(shí)進(jìn)行異常檢測(cè),在機(jī)器無法正?;貜?fù)用戶的情況下調(diào)整回復(fù)策略和內(nèi)容。

隨著語音處理及自然語言理解技術(shù)的發(fā)展,目前的人機(jī)對(duì)話系統(tǒng)已經(jīng)顯示出一定的智能性,但仍然不具備與人完全自然交流的能力,經(jīng)常聽不懂用戶的提問,或者答非所問。因此,我們發(fā)明了一種人機(jī)對(duì)話系統(tǒng)中的異常檢測(cè)方法,能夠在機(jī)器無法回答用戶問題時(shí)給出反饋,并切換到人工回復(fù)模式,由人來回答問題用戶問題,實(shí)現(xiàn)會(huì)話任務(wù)。同時(shí),保持檢測(cè)狀態(tài),在機(jī)器可以自動(dòng)回答的情況下再切回到自動(dòng)回復(fù)模式,從而在保障較好用戶體驗(yàn)的情況下實(shí)現(xiàn)對(duì)話交互,完成會(huì)話任務(wù)。

現(xiàn)有人機(jī)對(duì)話系統(tǒng)的問題主要有:

1、不可靠,在現(xiàn)有人機(jī)對(duì)話系統(tǒng)里,不能判斷機(jī)器的回答何時(shí)會(huì)在什么樣的條件下出現(xiàn)什么樣的問題,不具備可靠性,從而無法在有準(zhǔn)確性要求的任務(wù)場(chǎng)景下使用。

2、用戶體驗(yàn)差,即使在對(duì)準(zhǔn)確性沒有苛刻要求的場(chǎng)景下使用,機(jī)器回答答非所問,而又沒有任何干預(yù)或補(bǔ)救措施,會(huì)大大降低用戶體驗(yàn),甚至被棄用。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明針對(duì)現(xiàn)有技術(shù)存在的上述不足,提出一種人機(jī)對(duì)話異常檢測(cè)系統(tǒng)及方法,能夠在檢測(cè)到機(jī)器無法正?;貜?fù)用戶(即出現(xiàn)異常)的情況下,調(diào)整回復(fù)策略和內(nèi)容,從而完成對(duì)話任務(wù)。

本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:

本發(fā)明涉及一種人機(jī)對(duì)話異常檢測(cè)系統(tǒng)包括:語音識(shí)別模塊(ASR模塊)、語音合成模塊(TTS模塊)、語義識(shí)別模塊(SLU模塊)、對(duì)話狀態(tài)跟蹤模塊(DST模塊)、對(duì)話決策模塊(DM模塊)、數(shù)據(jù)庫查詢模塊(DATA模塊)、自然語言生成模塊(NLG模塊)、異常檢測(cè)模塊(DAD模塊)及異常處理模塊,其中:ASR模塊將用戶輸入統(tǒng)一為字符數(shù)據(jù)后輸出至SLU模塊,SLU模塊通過對(duì)字符數(shù)據(jù)中的語義進(jìn)行提取后輸出提取結(jié)果至DST模塊,DST模塊結(jié)合對(duì)話上文估計(jì)用戶的意圖并將最可能的用戶意圖傳至DATA模塊進(jìn)行數(shù)據(jù)庫查詢,DATA模塊將查詢的結(jié)果返回給DST模塊,DST模塊將估計(jì)的用戶意圖和數(shù)據(jù)庫查詢結(jié)果傳給DM模塊,DM生成語義級(jí)用戶回復(fù)并傳給NLG模塊,NLG模塊將語義級(jí)回復(fù)轉(zhuǎn)換為自然語言回復(fù)并傳給異常檢測(cè)模塊,異常檢測(cè)模塊獲取之前各個(gè)模塊(ASR、SLU、DST、DM、NLG)的輸出并進(jìn)行異常檢測(cè),在檢測(cè)到異常時(shí),異常檢測(cè)模塊首先向TTS模塊報(bào)警,TTS模塊根據(jù)異常發(fā)生與否輸出對(duì)應(yīng)的語音提示,同將將將音頻及ASR、DST、NLG三個(gè)模塊的的輸出傳給異常處理模塊;如果沒有檢測(cè)到異常,則直接將NLG的結(jié)果傳給TTS模塊。

所述的異常處理模塊包括:用戶意圖校正模塊(H-DST模塊)及用戶回復(fù)校正模塊(H-NLG模塊)。具體校正過程如下:

1)H-DST模塊:人工客服首先根據(jù)對(duì)對(duì)話歷史判斷DST的對(duì)話狀態(tài)跟蹤的結(jié)果是否正確,如果正確,則進(jìn)入H-NLG步驟,否則進(jìn)行修改意圖并重新查詢數(shù)據(jù)庫;

2)H-NLG模塊:如果H-DST步驟中客服更改了用戶意圖,則系統(tǒng)重新生成自動(dòng)回復(fù)候選。客服判斷NLG自動(dòng)生成的回復(fù)候選是否合理,如果合理,則確認(rèn)后將其發(fā)送給TTS模塊;如果不合理,客服進(jìn)行修改,將修改后的消息發(fā)給TTS模塊。

本發(fā)明涉及上述系統(tǒng)的人機(jī)對(duì)話異常檢測(cè)方法,可以是基于規(guī)則的檢測(cè)方法;也可以是基于機(jī)器學(xué)習(xí)的方法,該方法首先通過收集歷史對(duì)話數(shù)據(jù)并進(jìn)行標(biāo)注,利用標(biāo)注好的數(shù)據(jù)對(duì)異常檢測(cè)模型進(jìn)行訓(xùn)練,在收到實(shí)時(shí)對(duì)話數(shù)據(jù)時(shí)利用訓(xùn)練好的異常檢測(cè)模型進(jìn)行異常檢測(cè)并獲得結(jié)果。

所述的基于規(guī)則的方法中預(yù)設(shè)規(guī)則包括但不限于:檢測(cè)到預(yù)設(shè)的關(guān)鍵詞、對(duì)話時(shí)長(zhǎng)超過限制。

所述的基于機(jī)器學(xué)習(xí)的異常檢測(cè)模型,通過以下方式進(jìn)行建立:

1)收集歷史對(duì)話數(shù)據(jù):收集包括文字信息、語音識(shí)別模塊(ASR模塊)、語義解析模塊(SLU模塊)、對(duì)話狀態(tài)跟蹤模塊(DST模塊)、對(duì)話決策模塊(DM模塊)、自然語言生成模塊(NLG模塊)的歷史對(duì)話數(shù)據(jù)。

2)制定數(shù)據(jù)標(biāo)注規(guī)則:分別標(biāo)注用戶輸入和系統(tǒng)的回復(fù)中任一是否有異常,當(dāng)任何一個(gè)產(chǎn)生異常,則判定該交互回合異常。優(yōu)選地,當(dāng)用戶的話是異常的時(shí)候,系統(tǒng)的回復(fù)一般都為異常,但是,當(dāng)系統(tǒng)的回復(fù)還算合理的話,系統(tǒng)的回復(fù)就不標(biāo)注為異常。

3)進(jìn)行數(shù)據(jù)標(biāo)注:采用通用的數(shù)據(jù)標(biāo)注方法進(jìn)行標(biāo)注。

4)對(duì)標(biāo)注出的異常數(shù)據(jù)進(jìn)行特征提取,用于異常檢測(cè)的特征包括:ASR特征、SLU特征、DM對(duì)話狀態(tài)特征、DM對(duì)話決策特征、NLG特征。

所述的對(duì)異常檢測(cè)模型進(jìn)行訓(xùn)練是指:通過將異常檢測(cè)問題最終歸結(jié)為二分類問題(1代表有異常,0代表沒有異常),并利用機(jī)器學(xué)習(xí)模型,例如支持向量機(jī)(SVM)或者神經(jīng)網(wǎng)絡(luò),訓(xùn)練一個(gè)二分類器,即異常檢測(cè)模型。

附圖說明

圖1為本發(fā)明異常檢測(cè)方法示意圖;

圖2為本發(fā)明系統(tǒng)示意圖。

具體實(shí)施方式

如圖1所示,本實(shí)施例涉及一種人機(jī)對(duì)話異常檢測(cè)系統(tǒng),包括:語音識(shí)別模塊(ASR模塊)、語音合成模塊(TTS模塊)、語義識(shí)別模塊(SLU模塊)、對(duì)話狀態(tài)跟蹤模塊(DST模塊)、對(duì)話決策模塊(DM模塊)、數(shù)據(jù)庫查詢模塊(DATA模塊)、自然語言生成模塊(NLG模塊)以及異常檢測(cè)模塊(DAD模塊)及異常處理模塊,其中:ASR模塊將用戶輸入統(tǒng)一為字符數(shù)據(jù)后輸出至SLU模塊,SLU模塊通過對(duì)字符數(shù)據(jù)中的語義進(jìn)行提取后輸出提取結(jié)果至DST模塊,DST模塊結(jié)合對(duì)話上文估計(jì)用戶的意圖并將最可能的用戶意圖傳至DATA模塊進(jìn)行數(shù)據(jù)庫查詢,DATA模塊將查詢的結(jié)果返回給DST模塊,DST模塊將估計(jì)的用戶意圖和數(shù)據(jù)庫查詢結(jié)果傳給DM模塊,DM生成語義級(jí)用戶回復(fù)并傳給NLG模塊,NLG模塊將語義級(jí)回復(fù)轉(zhuǎn)換為自然語言回復(fù)并傳給異常檢測(cè)模塊,異常檢測(cè)模塊獲取之前各個(gè)模塊(ASR、SLU、DST、DM、NLG)的輸出并進(jìn)行異常檢測(cè),在檢測(cè)到異常時(shí),異常檢測(cè)模塊向TTS模塊報(bào)警,TTS模塊根據(jù)異常發(fā)生與否輸出對(duì)應(yīng)的語音提示,同將將將音頻及ASR、DST、NLG三個(gè)模塊的的輸出傳給異常處理模塊;如果沒有檢測(cè)到異常,則直接將NLG的結(jié)果傳給TTS模塊。

所述的異常檢測(cè)模塊與NLG模塊、TTS模塊及異常處理模塊相連;異常處理模塊與TTS模塊及異常檢測(cè)模塊相連。

所述的異常處理模塊包括:用戶意圖校正模塊(H-DST模塊)及用戶回復(fù)校正模塊(H-NLG模塊)。具體校正過程如下:

1)H-DST模塊:人工客服首先根據(jù)對(duì)對(duì)話歷史判斷DST的對(duì)話狀態(tài)跟蹤的結(jié)果是否正確,如果正確,則進(jìn)入H-NLG步驟,否則進(jìn)行修改意圖并重新查詢數(shù)據(jù)庫;

2)H-NLG模塊:如果H-DST步驟中客服更改了用戶意圖,則系統(tǒng)重新生成自動(dòng)回復(fù)候選??头袛郚LG自動(dòng)生成的回復(fù)候選是否合理,如果合理,則確認(rèn)后將其發(fā)送給TTS模塊;如果不合理,客服進(jìn)行修改,將修改后的消息發(fā)給TTS模塊。

如圖2所示,本實(shí)施例涉及上述系統(tǒng)的人機(jī)對(duì)話異常檢測(cè)方法,可以是基于規(guī)則的檢測(cè)方法;也可以是基于機(jī)器學(xué)習(xí)的方法,包括:首先通過收集歷史對(duì)話數(shù)據(jù)并進(jìn)行標(biāo)注,利用標(biāo)注好的數(shù)據(jù)對(duì)異常檢測(cè)模型進(jìn)行訓(xùn)練,在收到實(shí)時(shí)對(duì)話數(shù)據(jù)時(shí)利用訓(xùn)練好的異常檢測(cè)模型進(jìn)行異常檢測(cè)并獲得結(jié)果。

所述的基于規(guī)則的方法中預(yù)設(shè)規(guī)則包括但不限于:檢測(cè)到預(yù)設(shè)的關(guān)鍵詞、對(duì)話時(shí)長(zhǎng)超過限制。

所述的基于機(jī)器學(xué)習(xí)的異常檢測(cè)模型,通過以下方式進(jìn)行建立:

1)收集歷史對(duì)話數(shù)據(jù):收集包括文字信息、語音識(shí)別模塊(ASR模塊)、語義解析模塊(SLU模塊)、對(duì)話狀態(tài)跟蹤模塊(DST模塊)、對(duì)話決策模塊(DM模塊)、自然語言生成模塊(NLG模塊)的歷史對(duì)話數(shù)據(jù)。

2)制定數(shù)據(jù)標(biāo)注規(guī)則:分別標(biāo)注用戶輸入和系統(tǒng)的回復(fù)中任一是否有異常,當(dāng)任何一個(gè)產(chǎn)生異常,則判定該交互回合異常。優(yōu)選地,當(dāng)用戶的話是異常的時(shí)候,系統(tǒng)的回復(fù)一般都為異常,但是,當(dāng)系統(tǒng)的回復(fù)還算合理的話,系統(tǒng)的回復(fù)就不標(biāo)注為異常。

3)進(jìn)行數(shù)據(jù)標(biāo)注:采用通用的數(shù)據(jù)標(biāo)注方法進(jìn)行標(biāo)注。

4)對(duì)標(biāo)注出的異常數(shù)據(jù)進(jìn)行特征提?。河糜诋惓z測(cè)的特征包括:ASR特征、SLU特征、DST對(duì)話狀態(tài)特征、DM對(duì)話決策特征、NLG特征,其中:

i)ASR特征是指:將ASR結(jié)果中候選文本按置信度從大到小排序,取前N個(gè)候選,提取特征:文本的平均長(zhǎng)度、N個(gè)置信度(共N+1種特征)。

ii)SLU特征是指:將SLU結(jié)果中候選對(duì)話動(dòng)作按置信度從大到小排序,取前N個(gè)候選,提取特征:每種對(duì)話動(dòng)作出現(xiàn)在候選列表中的置信度、每種語義槽出現(xiàn)在候選列表中的置信度。

iii)DM對(duì)話狀態(tài)特征是指:將DST的結(jié)果中每種語義槽的候選值列表按置信度從大到小排列,對(duì)于每個(gè)語義槽提取特征:取前M個(gè)置信度。

iv)DM對(duì)話決策特征是指:從DM的輸出提取的特征包括:系統(tǒng)的回復(fù)的對(duì)話動(dòng)作中各種動(dòng)作類型及語義槽是否出現(xiàn),如果出現(xiàn)就為1,否則就為0;當(dāng)前的對(duì)話輪次(turn)

v)NLG特征是指:從NLG的輸出提取的特征包括:系統(tǒng)的回復(fù)是否和上一次重復(fù),如果重復(fù)則為1,否則為0。

所述的對(duì)異常檢測(cè)模型進(jìn)行訓(xùn)練是指:通過將異常檢測(cè)問題最終歸結(jié)為二分類問題(1代表有異常,0代表沒有異常),并利用機(jī)器學(xué)習(xí)模型,例如支持向量機(jī)(SVM)或者神經(jīng)網(wǎng)絡(luò)訓(xùn)練一個(gè)二分類器,即異常檢測(cè)模型。

上述具體實(shí)施可由本領(lǐng)域技術(shù)人員在不背離本發(fā)明原理和宗旨的前提下以不同的方式對(duì)其進(jìn)行局部調(diào)整,本發(fā)明的保護(hù)范圍以權(quán)利要求書為準(zhǔn)且不由上述具體實(shí)施所限,在其范圍內(nèi)的各個(gè)實(shí)現(xiàn)方案均受本發(fā)明之約束。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1