本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種聊天機(jī)器人及其自動(dòng)聊天方法。
背景技術(shù):
現(xiàn)今,各行業(yè)需要承擔(dān)的用戶咨詢/反饋解答的工作越來越多,如,在互聯(lián)網(wǎng)行業(yè)中的售后或者客服服務(wù)。隨著用戶數(shù)量的爆炸式增長(zhǎng),無法再采用人工的方式對(duì)所有用戶的咨詢進(jìn)行一一回答,此外,用戶的問題大多集中在某些特定的知識(shí)點(diǎn)上,人工回復(fù)很多時(shí)候都是在進(jìn)行重復(fù)性地勞動(dòng),嚴(yán)重浪費(fèi)人力,以此,基于客服服務(wù)的聊天機(jī)器人應(yīng)運(yùn)而生,用以輔助人工進(jìn)行問題的回復(fù)。
自動(dòng)問答(questionanswering,qa)是指根據(jù)用戶使用自然語言提出的問題找到一個(gè)明確的答案。傳統(tǒng)的自動(dòng)問答系統(tǒng),如圖1所示,主要包括:接口單元、預(yù)處理單元和知識(shí)庫,在工作過程中,接口單元將用戶用自然語言提問的問題發(fā)送給預(yù)處理單元,預(yù)處理單元對(duì)問題進(jìn)行解析得到問題的結(jié)構(gòu)化表達(dá)及關(guān)鍵字,以此推理單元根據(jù)問題的結(jié)構(gòu)化表達(dá)式、本體知識(shí)技術(shù)及語言知識(shí)技術(shù)從知識(shí)庫中匹配獲得問題模板,之后利用自然語言處理技術(shù)、獲得的應(yīng)答內(nèi)容及獲得的問題模板,完成知識(shí)推理并最終生成答案。
現(xiàn)有的聊天機(jī)器人一般都是基于上述自動(dòng)問答系統(tǒng)的,在知識(shí)庫的構(gòu)建階段,需要從輸入的新問答對(duì)中挖掘問題模板,構(gòu)建出模板庫,以供推理單元查詢獲得問題模板,采用語言知識(shí)技術(shù)對(duì)輸入的新知識(shí)進(jìn)行處理以獲得與關(guān)鍵字對(duì)應(yīng)的應(yīng)答,或?qū)斎氲男聠柎疬M(jìn)行知識(shí)解析以獲得與關(guān)鍵字對(duì)應(yīng)的應(yīng)答。知識(shí)庫中保存的知識(shí)即為與關(guān)鍵字對(duì)應(yīng)的應(yīng)答。
但是,在聊天機(jī)器人中,知識(shí)庫的構(gòu)建需要人為編寫完成,這使得管理人員的工作量巨大,而且人為編寫的知識(shí)庫很難做到覆蓋所有用戶可能會(huì)問的問題。當(dāng)然,目前也有問答系統(tǒng)能夠支持知識(shí)庫的批量形成,其雖然可以減少管理人員的工作量,但是批量形成的知識(shí)庫可靠性不高,且不具備邏輯性,只能涉及一問一答的方式回復(fù)用戶的問題。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)上述問題,本發(fā)明提供了一種聊天機(jī)器人及其自動(dòng)聊天方法,有效解決了現(xiàn)有聊天機(jī)器人可靠性不高的技術(shù)問題。
本發(fā)明提供的技術(shù)方案如下:
一種聊天機(jī)器人,包括:
知識(shí)庫,存儲(chǔ)的數(shù)據(jù)包括邏輯行為自然常識(shí)、詞匯庫、對(duì)話信息蘊(yùn)含的關(guān)鍵字段及與之匹配的反饋?zhàn)侄?,所述關(guān)鍵字段由多個(gè)關(guān)鍵字組成;
問答庫,存儲(chǔ)的數(shù)據(jù)包括詞匯庫、對(duì)話信息中蘊(yùn)含的問答對(duì)及其對(duì)應(yīng)的關(guān)鍵字;
交互平臺(tái),用于與用戶進(jìn)行信息交互;
預(yù)處理模塊,用于對(duì)通過交互平臺(tái)獲取的用戶聊天信息進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段;
反饋查詢模塊,用于根據(jù)預(yù)處理模塊得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄危⒏鶕?jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至交互平臺(tái);
相似度運(yùn)算模塊,用于根據(jù)反饋查詢模塊的查詢結(jié)果運(yùn)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相應(yīng)問題對(duì)應(yīng)的反饋信息反饋至交互平臺(tái)。
在本技術(shù)方案中,在該聊天機(jī)器人中既包括高可靠性和高邏輯性的知識(shí)庫,又包括大批量生產(chǎn)的問答庫,這樣,在與用戶進(jìn)行對(duì)話的過程中,首先利用知識(shí)庫進(jìn)行問題匹配,若匹配到了則返回相應(yīng)的反饋信息;若沒有匹配到則利用問答庫得出相似度最高的反饋信息反饋至用戶,以此保證了聊天機(jī)器人的可靠性。
進(jìn)一步優(yōu)選地,在所述預(yù)處理模塊中包括:
拆分單元,用于將通過交互平臺(tái)獲取的用戶聊天信息拆分成若干分詞;
語素識(shí)別單元,用于對(duì)拆分單元拆分得到的分詞進(jìn)行語素識(shí)別;
整理單元,用于根據(jù)語素識(shí)別單元的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段。
在本技術(shù)方案中,對(duì)用戶聊天信息進(jìn)行拆分之后,進(jìn)行語素識(shí)別,以此根據(jù)詞匯庫將停用詞等去掉,以此提高反饋查詢模塊的查詢效率和準(zhǔn)確度。
進(jìn)一步優(yōu)選地,在所述整理單元中:根據(jù)預(yù)設(shè)規(guī)則和語素識(shí)別單元的識(shí)別結(jié)果保留相應(yīng)的分詞,并根據(jù)問答庫中的詞匯庫對(duì)保留的分詞進(jìn)行語義擴(kuò)展得到關(guān)鍵字/關(guān)鍵字段。
在本技術(shù)方案中,對(duì)關(guān)鍵詞進(jìn)行語義擴(kuò)展之后計(jì)算其與存儲(chǔ)問題之間的相似度,以此提高計(jì)算結(jié)果的準(zhǔn)確度。
進(jìn)一步優(yōu)選地,在所述相似度運(yùn)算模塊中包括:
計(jì)算單元,用于計(jì)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度;
判斷單元,用于根據(jù)計(jì)算單元的計(jì)算結(jié)果,判斷與用戶聊天信息相似度最高的存儲(chǔ)問題;
反饋單元,用于將判斷單元判斷的相似度最高的存儲(chǔ)問題對(duì)應(yīng)的反饋信息反饋至交互平臺(tái)。
在本技術(shù)方案中,將用戶聊天信息逐一與存儲(chǔ)的問題進(jìn)行相似度計(jì)算,將相似度最高的問題對(duì)應(yīng)的答案作為反饋信息反饋至用戶,最大程度保證反饋信息的準(zhǔn)確性。
進(jìn)一步優(yōu)選地,所述聊天機(jī)器人中還包括用戶反饋模塊,用于在通過交互平臺(tái)將反饋信息反饋至用戶之后,獲取用戶對(duì)反饋信息的滿意度。
進(jìn)一步優(yōu)選地,所述聊天機(jī)器人中還包括知識(shí)庫更新模塊,用于綜合多個(gè)用戶反饋的滿意度將交互平臺(tái)中相應(yīng)的問答對(duì)更新至知識(shí)庫中。
在本技術(shù)方案中,根據(jù)用戶對(duì)反饋信息的滿意度將對(duì)話更新至知識(shí)庫中,以此實(shí)現(xiàn)知識(shí)庫的自動(dòng)更新,大大減少了工作人員的工作量;且綜合多個(gè)用戶反饋的滿意度進(jìn)行知識(shí)庫的更新,有效排除有些用戶惡意差評(píng)的情況,提高系統(tǒng)的可信度。
本發(fā)明還提供了一種聊天機(jī)器人自動(dòng)聊天方法,所述聊天機(jī)器人中包括一,存儲(chǔ)有邏輯行為自然常識(shí)、對(duì)話信息蘊(yùn)含的關(guān)鍵字段及與之匹配的反饋?zhàn)侄蔚闹R(shí)庫及一存儲(chǔ)有詞匯庫、對(duì)話信息中蘊(yùn)含的問答對(duì)及其對(duì)應(yīng)的關(guān)鍵字的問答庫,所述自動(dòng)聊天方法中包括:
s1與用戶進(jìn)行信息交互獲取用戶聊天信息;
s2對(duì)獲取的用戶聊天信息進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段;
s3根據(jù)得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄危?/p>
s4若在知識(shí)庫中查詢到匹配關(guān)鍵字,根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至用戶;
s5若在知識(shí)庫中未查詢到匹配關(guān)鍵字,運(yùn)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相應(yīng)問題對(duì)應(yīng)的反饋信息反饋至用戶。
在本技術(shù)方案中,在該聊天機(jī)器人中既包括高可靠性和高邏輯性的知識(shí)庫,又包括大批量生產(chǎn)的問答庫,這樣,在與用戶進(jìn)行對(duì)話的過程中,首先利用知識(shí)庫進(jìn)行問題匹配,若匹配到了則返回相應(yīng)的反饋信息;若沒有匹配到則利用問答庫得出相似度最高的反饋信息反饋至用戶,以此保證了聊天機(jī)器人的可靠性。
進(jìn)一步優(yōu)選地,在步驟s2中具體包括:
將獲取的用戶聊天信息拆分成若干分詞;
對(duì)拆分單元拆分得到的分詞進(jìn)行語素識(shí)別;
根據(jù)語素識(shí)別單元的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段。
在本技術(shù)方案中,對(duì)用戶聊天信息進(jìn)行拆分之后,進(jìn)行語素識(shí)別,以此根據(jù)詞匯庫將停用詞等去掉,以此提高反饋查詢模塊的查詢效率和準(zhǔn)確度。
進(jìn)一步優(yōu)選地,在步驟s5中具體包括:
計(jì)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度;
根據(jù)計(jì)算單元的計(jì)算結(jié)果,判斷與用戶聊天信息相似度最高的存儲(chǔ)問題;
將相似度最高的存儲(chǔ)問題對(duì)應(yīng)的反饋信息反饋至用戶。
在本技術(shù)方案中,將用戶聊天信息逐一與存儲(chǔ)的問題進(jìn)行相似度計(jì)算,將相似度最高的問題對(duì)應(yīng)的答案作為反饋信息反饋至用戶,最大程度保證反饋信息的準(zhǔn)確性。
進(jìn)一步優(yōu)選地,在步驟s5之后,所述自動(dòng)聊天方法中還包括:
s6獲取用戶對(duì)反饋信息的滿意度;
s7根據(jù)滿意度將相應(yīng)的問答對(duì)更新至知識(shí)庫中。
在本技術(shù)方案中,根據(jù)用戶對(duì)反饋信息的滿意度將對(duì)話更新至知識(shí)庫中,以此實(shí)現(xiàn)知識(shí)庫的自動(dòng)更新,大大減少了工作人員的工作量;且綜合多個(gè)用戶反饋的滿意度進(jìn)行知識(shí)庫的更新,有效排除有些用戶惡意差評(píng)的情況,提高系統(tǒng)的可信度。
附圖說明
下面將以明確易懂的方式,結(jié)合附圖說明優(yōu)選實(shí)施方式,對(duì)上述特性、技術(shù)特征、優(yōu)點(diǎn)及其實(shí)現(xiàn)方式予以進(jìn)一步說明。
圖1為現(xiàn)有技術(shù)中問答系統(tǒng)工作流程示意圖;
圖2為本發(fā)明中聊天機(jī)器人一種實(shí)施方式示意圖;
圖3為本發(fā)明中預(yù)處理模塊示意圖;
圖4為本發(fā)明中相似度運(yùn)算模塊示意圖;
圖5為本發(fā)明中聊天機(jī)器人另一種實(shí)施方式示意圖;
圖6為本發(fā)明中聊天機(jī)器人另一種實(shí)施方式示意圖;
圖7為本發(fā)明中聊天機(jī)器人自動(dòng)聊天方法一種實(shí)施方式流程示意圖;
圖8為本發(fā)明中聊天機(jī)器人自動(dòng)聊天方法一種實(shí)施方式流程示意圖。
附圖標(biāo)記:
100-聊天機(jī)器人,110-知識(shí)庫,120-問答庫,130-交互平臺(tái),140-預(yù)處理模塊,141-拆分單元,142-語素識(shí)別單元,143-整理單元,150-反饋查詢模塊,160-相似度運(yùn)算模塊,161-計(jì)算單元,162-判斷單元,163-反饋單元,170-用戶反饋模塊,180-知識(shí)庫更新模塊。
具體實(shí)施方式
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)照附圖說明本發(fā)明的具體實(shí)施方式。顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖,并獲得其他的實(shí)施方式。
如圖2所示為本發(fā)明提供的聊天機(jī)器人一種實(shí)施方式示意圖,從圖中可以看出,在該聊天機(jī)器人100中包括:知識(shí)庫110、問答庫120、交互平臺(tái)130、預(yù)處理模塊140、反饋查詢模塊150以及相似度運(yùn)算模塊160,其中,預(yù)處理模塊140與交互平臺(tái)130連接,反饋查詢模塊150分別與預(yù)處理模塊140和知識(shí)庫110連接,相似度運(yùn)算模塊160分別與反饋查詢模塊150和問答庫120連接。
在本實(shí)施方式中,知識(shí)庫110中存儲(chǔ)有邏輯行為自然常識(shí)、詞匯庫、對(duì)話信息蘊(yùn)含的關(guān)鍵字段及與之匹配的反饋?zhàn)侄?,其中,關(guān)鍵字段由多個(gè)關(guān)鍵字組成;問答庫120中存儲(chǔ)有詞匯庫、對(duì)話信息中蘊(yùn)含的問答對(duì)及其對(duì)應(yīng)的關(guān)鍵字。在實(shí)際應(yīng)用中,在使用聊天機(jī)器人100進(jìn)行聊天服務(wù)之前,根據(jù)該聊天機(jī)器人100需要應(yīng)用的領(lǐng)域建立邏輯性強(qiáng)和高可靠性的知識(shí)庫110,在該知識(shí)庫110中除了包括邏輯行為自然常識(shí)和詞匯庫之外,還包括日常聊天對(duì)話。此外,基于大量一問一答形式的問答對(duì)批量生成問答庫120,并對(duì)其中的問題進(jìn)行關(guān)鍵字提取。在一實(shí)例中,假若該聊天機(jī)器人將服務(wù)于兒童服裝行業(yè),則針對(duì)兒童服裝行業(yè)建立知識(shí)庫,同時(shí)自動(dòng)生成問答庫存儲(chǔ)在聊天機(jī)器人中。
基于此,在工作過程中,當(dāng)聊天機(jī)器人通過交互平臺(tái)130獲取到用戶發(fā)送的聊天信息之后,隨即通過預(yù)處理模塊140對(duì)其進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段。得到關(guān)鍵字之后,反饋查詢模塊150根據(jù)得到的關(guān)鍵字在知識(shí)庫110中進(jìn)行嚴(yán)格的問題匹配,若匹配到相應(yīng)的問題,則找到該問題對(duì)應(yīng)的答案(匹配到的反饋?zhàn)侄?,并根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫110中的邏輯行為自然常識(shí)將反饋信息反饋至交互平臺(tái)130進(jìn)行顯示。若沒有匹配到相應(yīng)的問題,則相似度運(yùn)算模塊160計(jì)算用戶聊天信息與問答庫120中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相似度最高的反饋信息反饋至交互平臺(tái)130,以此保證了聊天機(jī)器人的可靠性。
在一實(shí)例中,知識(shí)庫中采用樹狀結(jié)構(gòu)的方式存儲(chǔ)關(guān)鍵字,反饋查詢模塊在查詢過程中根據(jù)在知識(shí)庫中查詢到相應(yīng)的關(guān)鍵字組成關(guān)鍵字段,以此得到相應(yīng)的反饋?zhàn)侄?。具體,假若用戶通過交互平臺(tái)詢問“今天是星期幾”,預(yù)處理模塊接收到該聊天信息之后,隨即對(duì)其進(jìn)行預(yù)處理進(jìn)行分詞得到關(guān)鍵詞“今天”、“是”、“星期幾”,此后,反饋查詢模塊根據(jù)得到的關(guān)鍵詞在知識(shí)庫中進(jìn)行查找,查找到根節(jié)點(diǎn)“今天”之后進(jìn)一步依次查找關(guān)鍵字“是”和“星期幾”,若查找到知識(shí)庫中包括該三個(gè)關(guān)鍵字并能夠組成關(guān)鍵字段,則反饋相應(yīng)關(guān)鍵字段對(duì)應(yīng)的反饋?zhàn)侄巍敖裉焓切瞧谝弧?。此外,若反饋查詢模塊根據(jù)邏輯行為自然常識(shí)判斷出“今天是星期五”,則反饋查詢模塊根據(jù)判斷結(jié)果生成反饋信息并將其反饋至交互平臺(tái),通知用戶。
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,該聊天機(jī)器人100中包括:知識(shí)庫110、問答庫120、交互平臺(tái)130、預(yù)處理模塊140、反饋查詢模塊150以及相似度運(yùn)算模塊160,其中,如圖3所示,預(yù)處理模塊140包括:拆分單元141、語素識(shí)別單元142以及整理單元143,其中,語素識(shí)別單元142分別與拆分單元141和整理單元143連接。
在工作過程中,預(yù)處理模塊140從交互平臺(tái)130中獲取了聊天信息之后,隨即通過拆分單元141對(duì)其進(jìn)行拆分得到分詞,之后通過語素識(shí)別單元142對(duì)其語素進(jìn)行識(shí)別,最后整理單元143根據(jù)語素識(shí)別單元142的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段。更進(jìn)一步來說,在整理單元143中,根據(jù)預(yù)設(shè)規(guī)則和語素識(shí)別單元142的識(shí)別結(jié)果保留相應(yīng)的分詞,將不需要的分詞去除,如停用詞,并根據(jù)問答庫120中的詞匯庫對(duì)保留的分詞進(jìn)行語義擴(kuò)展得到關(guān)鍵字/關(guān)鍵字段。要說明的是,在本實(shí)施方式中,語素識(shí)別單元142對(duì)識(shí)別的素詞類別根據(jù)實(shí)際需求進(jìn)行設(shè)定;整理單元143中根據(jù)語素識(shí)別單元142的識(shí)別結(jié)果對(duì)各分詞的保留去除同樣根據(jù)實(shí)際需求進(jìn)行設(shè)定,在此不做具體限定。
在一實(shí)例中,根據(jù)需求,語素識(shí)別單元識(shí)別聊天信息中的主語、謂語、賓語等,在識(shí)別完了之后,根據(jù)詞匯庫將其中包括的停用詞去除,在去除了停用詞之后,將剩余的分詞進(jìn)一步根據(jù)詞匯庫進(jìn)行擴(kuò)展得到關(guān)鍵字。假若用戶通過交互平臺(tái)詢問“今天空調(diào)的價(jià)格”,拆分單元將其拆分為“今天”、“空調(diào)”、“的”、“價(jià)格”之后,語素識(shí)別單元對(duì)其語素進(jìn)行識(shí)別,以此整理單元將停用詞“的”除去,根據(jù)詞匯庫將剩余的分詞“今天”、“空調(diào)”、“價(jià)格”其進(jìn)行語義擴(kuò)展,將“價(jià)格”擴(kuò)展為“多少錢”、“怎么賣”、“價(jià)錢”,得到關(guān)鍵字“今天”、“空調(diào)”、“價(jià)格”、“多少錢”、“怎么賣”、“價(jià)錢”。要說明的是,反饋查詢模塊在知識(shí)庫中查詢的過程中,根據(jù)擴(kuò)展之前的關(guān)鍵詞進(jìn)行查詢嚴(yán)格匹配,只有在知識(shí)庫中查詢到根據(jù)“今天”“空調(diào)”“價(jià)格”三個(gè)關(guān)鍵詞組成的關(guān)鍵字段,才將相應(yīng)的反饋?zhàn)侄芜M(jìn)行反饋,否則使用相似度運(yùn)算模塊根據(jù)語義擴(kuò)展之后的關(guān)鍵詞運(yùn)算其與各存儲(chǔ)問題之間的相似度,并根據(jù)計(jì)算結(jié)果得到反饋?zhàn)侄巍?/p>
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,該聊天機(jī)器人100中包括:知識(shí)庫110、問答庫120、交互平臺(tái)130、預(yù)處理模塊140、反饋查詢模塊150以及相似度運(yùn)算模塊160,其中,預(yù)處理模塊140包括:拆分單元141、語素識(shí)別單元142以及整理單元143,其中,語素識(shí)別單元142分別與拆分單元141和整理單元143連接。如圖4所示,在相似度運(yùn)算模塊160中包括:計(jì)算單元161、判斷單元162以及反饋單元163,其中判斷單元162分別與計(jì)算單元161和反饋單元連接163。
在本實(shí)施方式中,反饋查詢模塊150根據(jù)關(guān)鍵字在知識(shí)庫110中沒有查詢到相應(yīng)的關(guān)鍵字段之后,隨即通過計(jì)算單元161計(jì)算用戶聊天信息與問答庫120中存儲(chǔ)的問題之間的相似度;之后,判斷單元162根據(jù)計(jì)算單元161的計(jì)算結(jié)果,判斷與用戶聊天信息相似度最高的存儲(chǔ)問題;最后,反饋單元163將判斷單元162判斷的相似度最高的存儲(chǔ)問題對(duì)應(yīng)的反饋信息反饋至交互平臺(tái)130。在一實(shí)例中,計(jì)算單元計(jì)算聊天信息與問答庫中存儲(chǔ)的問題之間的余弦相似度,并根據(jù)計(jì)算的結(jié)果判斷與聊天信息相似度最高的存儲(chǔ)問題,以此反饋單元將其對(duì)應(yīng)的反饋?zhàn)侄巫鳛榉答佇畔⑦M(jìn)行反饋。在其他實(shí)例中,還可以采用其他方式計(jì)算聊天信息與存儲(chǔ)問題之間的相似度,在此不做限定,根據(jù)實(shí)際情況進(jìn)行設(shè)定。
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,如圖5所示,該聊天機(jī)器人100中除了包括上述知識(shí)庫110、問答庫120、交互平臺(tái)130、預(yù)處理模塊140、反饋查詢模塊150以及相似度運(yùn)算模塊160之外,還包括用戶反饋模塊170,用于在通過交互平臺(tái)130將反饋信息反饋至用戶之后,獲取用戶對(duì)反饋信息的滿意度。
在本實(shí)施方式中,反饋查詢模塊150將查詢到的反饋信息反饋至交互平臺(tái)130或相似度運(yùn)算模塊160將反饋信息反饋至交互平臺(tái)130之后,用戶反饋模塊170通過交互平臺(tái)130針對(duì)所做的問答獲取用戶的滿意度評(píng)分。具體,在評(píng)分的過程中,用戶反饋模塊170針對(duì)各問答對(duì)獲取用戶滿意度評(píng)分。在一實(shí)例中,假若某一用戶通過交互平臺(tái)130提問“今天星期幾”和“今天空調(diào)賣多少錢”,則得到反饋信息之后,用戶在交互平臺(tái)130中分別對(duì)兩個(gè)問題的反饋信息進(jìn)行評(píng)分,并通過用戶反饋模塊170對(duì)該用戶的評(píng)分進(jìn)行統(tǒng)計(jì)存儲(chǔ)。
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,如圖6所示,該聊天機(jī)器人100中除了包括上述知識(shí)庫110、問答庫120、交互平臺(tái)130、預(yù)處理模塊140、反饋查詢模塊150、相似度運(yùn)算模塊160以及用戶反饋模塊170之外,還包括知識(shí)庫更新模塊180,用于綜合多個(gè)用戶反饋的滿意度將交互平臺(tái)130中相應(yīng)的問答對(duì)更新至知識(shí)庫110中。
在本實(shí)施方式中,反饋查詢模塊150將查詢到的反饋信息反饋至交互平臺(tái)130或相似度運(yùn)算模塊160將反饋信息反饋至交互平臺(tái)130之后,用戶反饋模塊170通過交互平臺(tái)130針對(duì)所做的問答獲取用戶的滿意度評(píng)分,以此知識(shí)庫更新模塊180根據(jù)用戶反饋模塊170統(tǒng)計(jì)的滿意度將問答對(duì)更新至知識(shí)庫110中,大大減少了工作人員的工作量,且知識(shí)庫更新模塊180綜合多個(gè)用戶反饋的滿意度進(jìn)行知識(shí)庫110的更新,有效排除有些用戶惡意差評(píng)的情況,提高系統(tǒng)的可信度。
在一實(shí)例中,假若有10個(gè)用戶都通過交互平臺(tái)130提問“今天星期幾”和“今天空調(diào)賣多少錢”,在得到反饋信息之后,分別在交互平臺(tái)130中對(duì)兩個(gè)問題的反饋信息進(jìn)行評(píng)分,用戶反饋模塊170對(duì)該用戶的評(píng)分進(jìn)行統(tǒng)計(jì)之后發(fā)現(xiàn),10個(gè)用戶對(duì)“今天星期幾”的反饋信息平均滿意度大于預(yù)設(shè)值,如80%,但是對(duì)“今天空調(diào)賣多少錢”的反饋信息平均滿意度小于預(yù)設(shè)值,如80%,則知識(shí)庫更新模塊180將基于“今天星期幾”的問答對(duì)更新至知識(shí)庫110中,實(shí)現(xiàn)知識(shí)庫110的自動(dòng)擴(kuò)充。在其他實(shí)例中,還可以將上述預(yù)設(shè)值設(shè)定為其他值,如85%、90%等,在此不做具體限定。
本發(fā)明還提供了一種聊天機(jī)器人自動(dòng)聊天方法,聊天機(jī)器人中包括一,存儲(chǔ)有邏輯行為自然常識(shí)、對(duì)話信息蘊(yùn)含的關(guān)鍵字段及與之匹配的反饋?zhàn)侄蔚闹R(shí)庫及一存儲(chǔ)有詞匯庫、對(duì)話信息中蘊(yùn)含的問答對(duì)及其對(duì)應(yīng)的關(guān)鍵字的問答庫,如圖7所示,在該自動(dòng)聊天方法一種實(shí)施方式中包括:s1與用戶進(jìn)行信息交互獲取用戶聊天信息;s2對(duì)獲取的用戶聊天信息進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段;s3根據(jù)得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄?;s4若在知識(shí)庫中查詢到匹配關(guān)鍵字,根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至用戶;s5若在知識(shí)庫中未查詢到匹配關(guān)鍵字,運(yùn)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相應(yīng)問題對(duì)應(yīng)的反饋信息反饋至用戶。
在本實(shí)施方式中,知識(shí)庫中存儲(chǔ)有邏輯行為自然常識(shí)、詞匯庫、對(duì)話信息蘊(yùn)含的關(guān)鍵字段及與之匹配的反饋?zhàn)侄?,其中,關(guān)鍵字段由多個(gè)關(guān)鍵字組成;問答庫中存儲(chǔ)有詞匯庫、對(duì)話信息中蘊(yùn)含的問答對(duì)及其對(duì)應(yīng)的關(guān)鍵字。在實(shí)際應(yīng)用中,在使用聊天機(jī)器人進(jìn)行聊天服務(wù)之前,根據(jù)該聊天機(jī)器人需要應(yīng)用的領(lǐng)域建立邏輯性強(qiáng)和高可靠性的知識(shí)庫,在該知識(shí)庫中除了包括邏輯行為自然常識(shí)和詞匯庫之外,還包括日常聊天對(duì)話。此外,基于大量一問一答形式的問答對(duì)批量生成問答庫,并對(duì)其中的問題進(jìn)行關(guān)鍵字提取。
基于此,在工作過程中,當(dāng)聊天機(jī)器人通過交互平臺(tái)獲取到用戶發(fā)送的聊天信息之后,隨即通過對(duì)其進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段。得到關(guān)鍵字之后,根據(jù)得到的關(guān)鍵字在知識(shí)庫中進(jìn)行嚴(yán)格的問題匹配,若匹配到相應(yīng)的問題,則找到該問題對(duì)應(yīng)的答案(匹配到的反饋?zhàn)侄?,并根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至交互平臺(tái)進(jìn)行顯示。若沒有匹配到相應(yīng)的問題,則計(jì)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相似度最高的反饋信息反饋至交互平臺(tái),以此保證了聊天機(jī)器人的可靠性。
在一實(shí)例中,知識(shí)庫中采用樹狀結(jié)構(gòu)的方式存儲(chǔ)關(guān)鍵字,反饋查詢模塊在查詢過程中根據(jù)在知識(shí)庫中查詢到相應(yīng)的關(guān)鍵字組成關(guān)鍵字段,以此得到相應(yīng)的反饋?zhàn)侄?。具體,假若用戶通過交互平臺(tái)詢問“今天天氣怎么樣”,預(yù)處理模塊接收到該聊天信息之后,隨即對(duì)其進(jìn)行預(yù)處理進(jìn)行分詞得到關(guān)鍵詞“今天”、“天氣”、“怎么樣”,此后,反饋查詢模塊根據(jù)得到的關(guān)鍵詞在知識(shí)庫中進(jìn)行查找,查找到根節(jié)點(diǎn)“今天”之后進(jìn)一步依次查找關(guān)鍵字“天氣”和“怎么樣”,若在知識(shí)庫中查找不到包括該三個(gè)關(guān)鍵字的關(guān)鍵字段,則相似度運(yùn)算模塊進(jìn)一步計(jì)算該聊天信息計(jì)算其與問答庫中各問題之間的余弦相似度,經(jīng)過計(jì)算后發(fā)現(xiàn),問答庫中與該聊天信息相似度最高的問題為“今天天氣如何”,則反饋相應(yīng)問題對(duì)應(yīng)的反饋?zhàn)侄巍敖裉焓乔缣臁保煞答佇畔⑵浞答佒两换テ脚_(tái),通知用戶。
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,在該自動(dòng)聊天方包括:s1與用戶進(jìn)行信息交互獲取用戶聊天信息;s21將獲取的用戶聊天信息拆分成若干分詞;s22對(duì)拆分單元拆分得到的分詞進(jìn)行語素識(shí)別;s23根據(jù)語素識(shí)別單元的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段;s3根據(jù)得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄危籹4若在知識(shí)庫中查詢到匹配關(guān)鍵字,根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至用戶;s5若在知識(shí)庫中未查詢到匹配關(guān)鍵字,運(yùn)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相應(yīng)問題對(duì)應(yīng)的反饋信息反饋至用戶。
在本實(shí)施方式中,從交互平臺(tái)中獲取了聊天信息之后,隨即對(duì)其進(jìn)行拆分得到分詞,之后對(duì)其語素進(jìn)行識(shí)別,最后根據(jù)語素識(shí)別單元的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段。更進(jìn)一步來說,在整理過程中,根據(jù)預(yù)設(shè)規(guī)則和語素識(shí)別單元的識(shí)別結(jié)果保留相應(yīng)的分詞,將不需要的分詞去除,如停用詞,并根據(jù)問答庫中的詞匯庫對(duì)保留的分詞進(jìn)行語義擴(kuò)展得到關(guān)鍵字/關(guān)鍵字段。
在一實(shí)例中,假若用戶通過交互平臺(tái)詢問“今天空調(diào)的價(jià)格”,拆分得到“今天”、“空調(diào)”、“的”、“價(jià)格”之后,隨即對(duì)其語素進(jìn)行識(shí)別,并根據(jù)需求將停用詞“的”除去,最后根據(jù)詞匯庫將剩余的分詞“今天”、“空調(diào)”、“價(jià)格”其進(jìn)行語義擴(kuò)展,將“價(jià)格”擴(kuò)展為“多少錢”、“怎么賣”、“價(jià)錢”,得到關(guān)鍵字“今天”、“空調(diào)”、“價(jià)格”、“多少錢”、“怎么賣”、“價(jià)錢”。要說明的是,在知識(shí)庫中查詢的過程中,根據(jù)擴(kuò)展之前的關(guān)鍵詞進(jìn)行查詢嚴(yán)格匹配,只有在知識(shí)庫中查詢到根據(jù)“今天”“空調(diào)”“價(jià)格”三個(gè)關(guān)鍵詞組成的關(guān)鍵字段,才將相應(yīng)的反饋?zhàn)侄芜M(jìn)行反饋,否則使用語義擴(kuò)展之后的關(guān)鍵詞運(yùn)算其與各存儲(chǔ)問題之間的相似度,并根據(jù)計(jì)算結(jié)果得到反饋?zhàn)侄巍?/p>
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,在該自動(dòng)聊天方包括:s1與用戶進(jìn)行信息交互獲取用戶聊天信息;s21將獲取的用戶聊天信息拆分成若干分詞;s22對(duì)拆分單元拆分得到的分詞進(jìn)行語素識(shí)別;s23根據(jù)語素識(shí)別單元的識(shí)別結(jié)果整理得到關(guān)鍵字/關(guān)鍵字段;s3根據(jù)得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄?;s4若在知識(shí)庫中查詢到匹配關(guān)鍵字,根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至用戶;s51計(jì)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度;s52根據(jù)計(jì)算單元的計(jì)算結(jié)果,判斷與用戶聊天信息相似度最高的存儲(chǔ)問題;s53將相似度最高的存儲(chǔ)問題對(duì)應(yīng)的反饋信息反饋至用戶。
在本實(shí)施方式中,根據(jù)關(guān)鍵字在知識(shí)庫中沒有查詢到相應(yīng)的關(guān)鍵字段之后,隨即通過計(jì)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度;之后,根據(jù)計(jì)算結(jié)果,判斷與用戶聊天信息相似度最高的存儲(chǔ)問題;最后,將判斷的相似度最高的存儲(chǔ)問題對(duì)應(yīng)的反饋信息反饋至交互平臺(tái)。在一實(shí)例中,計(jì)算聊天信息與問答庫中存儲(chǔ)的問題之間的余弦相似度,并根據(jù)計(jì)算的結(jié)果判斷與聊天信息相似度最高的存儲(chǔ)問題,以此反饋單元將其對(duì)應(yīng)的反饋?zhàn)侄巫鳛榉答佇畔⑦M(jìn)行反饋。在其他實(shí)例中,還可以采用其他方式計(jì)算聊天信息與存儲(chǔ)問題之間的相似度,在此不做限定,根據(jù)實(shí)際情況進(jìn)行設(shè)定。
對(duì)上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,在本實(shí)施方式中,如圖8所示,在該自動(dòng)聊天方法中包括:s1與用戶進(jìn)行信息交互獲取用戶聊天信息;s2對(duì)獲取的用戶聊天信息進(jìn)行預(yù)處理,包括分詞得到其中蘊(yùn)含的關(guān)鍵字/關(guān)鍵字段;s3根據(jù)得到的關(guān)鍵字在知識(shí)庫中查詢匹配的反饋?zhàn)侄?;s4若在知識(shí)庫中查詢到匹配關(guān)鍵字,根據(jù)查詢到的反饋?zhàn)侄魏椭R(shí)庫中的邏輯行為自然常識(shí)將反饋信息反饋至用戶;s5若在知識(shí)庫中未查詢到匹配關(guān)鍵字,運(yùn)算用戶聊天信息與問答庫中存儲(chǔ)的問題之間的相似度,并根據(jù)運(yùn)算結(jié)果將相應(yīng)問題對(duì)應(yīng)的反饋信息反饋至用戶;s6獲取用戶對(duì)反饋信息的滿意度;s7根據(jù)滿意度將相應(yīng)的問答對(duì)更新至知識(shí)庫中。
在本實(shí)施方式中,將在知識(shí)庫中查詢到的反饋信息反饋至交互平臺(tái)或?qū)柎饚熘胁樵兊降姆答佇畔⒎答佒两换テ脚_(tái)之后,通過交互平臺(tái)針對(duì)所做的問答獲取用戶的滿意度評(píng)分。具體,在評(píng)分的過程中,針對(duì)各問答分別獲取用戶滿意度評(píng)分并進(jìn)行統(tǒng)計(jì),以此根據(jù)用戶反饋模塊統(tǒng)計(jì)的滿意度將問答對(duì)更新至知識(shí)庫中,大大減少了工作人員的工作量,且知識(shí)庫更新模塊綜合多個(gè)用戶反饋的滿意度進(jìn)行知識(shí)庫的更新,有效排除有些用戶惡意差評(píng)的情況,提高系統(tǒng)的可信度。
在一實(shí)例中,假若有10個(gè)用戶都通過交互平臺(tái)提問“今天星期幾”和“今天空調(diào)賣多少錢”,在得到反饋信息之后,分別在交互平臺(tái)中對(duì)兩個(gè)問題的反饋信息進(jìn)行評(píng)分,對(duì)該用戶的評(píng)分進(jìn)行統(tǒng)計(jì)之后發(fā)現(xiàn),10個(gè)用戶對(duì)“今天星期幾”和“今天空調(diào)賣多少錢”的反饋信息平均滿意度均大于預(yù)設(shè)值,如80%,則將兩個(gè)問題的問答對(duì)都更新至知識(shí)庫中,實(shí)現(xiàn)知識(shí)庫的自動(dòng)擴(kuò)充。
應(yīng)當(dāng)說明的是,上述實(shí)施例均可根據(jù)需要自由組合。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。