本申請(qǐng)涉及信息自動(dòng)化處理技術(shù)領(lǐng)域,特別是涉及問答數(shù)據(jù)處理、自動(dòng)問答方法及裝置。
背景技術(shù):
電商系統(tǒng)作為網(wǎng)上交易的平臺(tái),通常會(huì)至少面對(duì)兩種用戶:買家與賣家,其中,買家包括使用電商平臺(tái)接口應(yīng)用購買商品的用戶,例如通過瀏覽器訪問電商網(wǎng)站,或使用電商移動(dòng)應(yīng)用等實(shí)施業(yè)務(wù)對(duì)象購買相關(guān)行為的用戶。賣家可以包括提供交易平臺(tái)的電商本身,以及在電商系統(tǒng)中租用一定資源來出售商品或服務(wù)的用戶。電商系統(tǒng)可以看作是買家與賣家之間的橋梁,在兩者之間提供商品服務(wù)信息的交互,是電商系統(tǒng)的一項(xiàng)基本功能。
在買家與賣家交互的信息中,包括大量對(duì)業(yè)務(wù)對(duì)象的咨詢信息,其中常常包括買家咨詢的問題,以及賣家給出的對(duì)應(yīng)解答,例如,業(yè)務(wù)對(duì)象售前對(duì)優(yōu)惠信息,功效,使用方法等的咨詢問答;業(yè)務(wù)對(duì)象售后對(duì)業(yè)務(wù)對(duì)象使用問題的咨詢問答等等。在現(xiàn)有技術(shù)中,電商系統(tǒng)大多為買賣雙方提供類似功能的服務(wù)信息交互工具,例如內(nèi)置于網(wǎng)頁中的在線交互工具等等,這些交互工具可以使雙方很方便的交流商品服務(wù)信息。但是,隨著用戶以及業(yè)務(wù)對(duì)象數(shù)量的迅速增加,商品服務(wù)器信息的咨詢數(shù)量也隨之增加,僅僅依靠人工回復(fù)的方式,很難滿足大量用戶對(duì)于商品服務(wù)信息的咨詢需求,當(dāng)信息咨詢量較大時(shí),人工回復(fù)很難滿足提供商品服務(wù)信息的時(shí)效性需求。
隨著計(jì)算機(jī)服務(wù)技術(shù)的發(fā)展,在一些應(yīng)用系統(tǒng)中出現(xiàn)了自動(dòng)問答系統(tǒng),這些自動(dòng)問答系統(tǒng)可以根據(jù)預(yù)置的問答數(shù)據(jù)庫,其中保存有多個(gè)知識(shí)點(diǎn),以及各自對(duì)應(yīng)的答案,這樣,對(duì)用戶提出的問題,可以自動(dòng)與知識(shí)點(diǎn)進(jìn)行匹配,并給出對(duì)應(yīng)的答案,這樣可以在一定程度上提高信息咨詢效率,降低賣家的人力成本。但其缺點(diǎn)在于,自動(dòng)問答系統(tǒng)只能在預(yù)置的問題范圍內(nèi)滿足用戶的咨詢需求,在電商系統(tǒng)中涉及業(yè)務(wù)對(duì)象的數(shù)量較大時(shí),需要維護(hù)的問答數(shù)據(jù)庫數(shù)據(jù)量巨大,尤其是對(duì)于一些諸如優(yōu)惠信息,產(chǎn)品更新信息等變化較為頻繁的信息, 其數(shù)據(jù)維護(hù)難度更高,最終導(dǎo)致自動(dòng)問答系統(tǒng)在業(yè)務(wù)對(duì)象咨詢的自動(dòng)化應(yīng)用中效率較低,難以滿足大量用戶以及大量業(yè)務(wù)對(duì)象條件下的咨詢需求。
綜上,需要本領(lǐng)域技術(shù)人員解決的問題就在于,如何更好的滿足用戶對(duì)于業(yè)務(wù)對(duì)象信息的咨詢需求。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)?zhí)峁┝藛柎饠?shù)據(jù)處理、自動(dòng)問答方法及裝置,有利于提高自動(dòng)問答系統(tǒng)的準(zhǔn)確性以及效率。
本申請(qǐng)?zhí)峁┝巳缦路桨福?/p>
一種問答數(shù)據(jù)處理方法,包括:
收集對(duì)業(yè)務(wù)對(duì)象的進(jìn)行咨詢過程中產(chǎn)生的問答數(shù)據(jù);
根據(jù)所述問答數(shù)據(jù)中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息,對(duì)所述問答數(shù)據(jù)進(jìn)行文本分析,確定可合并的問題;
根據(jù)所述可合并的問題確定合并后的知識(shí)點(diǎn),所述合并后的知識(shí)點(diǎn)文本包括合并后的問題以及對(duì)應(yīng)的答案;
根據(jù)所述可合并的問題、合并后的知識(shí)點(diǎn),向第二用戶端提供第一推薦信息,以便對(duì)所述問答數(shù)據(jù)庫進(jìn)行更新。
一種自動(dòng)問答方法,包括:
預(yù)先建立問答數(shù)據(jù)庫,所述問答數(shù)據(jù)庫中包括公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),所述公共知識(shí)點(diǎn)的問題中不帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述非公共知識(shí)點(diǎn)的問題中帶有業(yè)務(wù)對(duì)象標(biāo)簽;
接收第一用戶端的問題文本;
判斷所述問題文本中是否存在業(yè)務(wù)對(duì)象標(biāo)簽;
如果存在,則利用所述非公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配;
如果利用非公共知識(shí)點(diǎn)匹配失敗,將所述問題文本中的業(yè)務(wù)對(duì)象標(biāo)簽去掉, 與所述公共知識(shí)點(diǎn)進(jìn)行匹配;
如果與某公共知識(shí)點(diǎn)匹配成功,則提供該公共知識(shí)點(diǎn)對(duì)應(yīng)的答案。
一種問答數(shù)據(jù)處理裝置,包括:
問答數(shù)據(jù)收集單元,用于收集對(duì)業(yè)務(wù)對(duì)象的進(jìn)行咨詢過程中產(chǎn)生的問答數(shù)據(jù);
合并問題確定單元,用于根據(jù)所述問答數(shù)據(jù)中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息,對(duì)所述問答數(shù)據(jù)進(jìn)行文本分析,確定可合并的問題;
合并知識(shí)點(diǎn)確定單元,用于根據(jù)所述可合并的問題確定合并后的知識(shí)點(diǎn),所述合并后的知識(shí)點(diǎn)文本包括合并后的問題以及對(duì)應(yīng)的答案;
第一推薦信息提供單元,用于根據(jù)所述可合并的問題、合并后的知識(shí)點(diǎn),向第二用戶端提供第一推薦信息,以便對(duì)所述問答數(shù)據(jù)庫進(jìn)行更新。
一種自動(dòng)問答裝置,包括:
問答數(shù)據(jù)庫提供單元,用于預(yù)先建立問答數(shù)據(jù)庫,所述問答數(shù)據(jù)庫中包括公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),所述公共知識(shí)點(diǎn)的問題中不帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述非公共知識(shí)點(diǎn)的問題中帶有業(yè)務(wù)對(duì)象標(biāo)簽;
問題文本接收單元,用于接收第一用戶端的問題文本;
判斷單元,用于判斷所述問題文本中是否存在業(yè)務(wù)對(duì)象標(biāo)簽;
第一匹配單元,用于如果存在,則利用所述非公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配;
第二匹配單元,用于如果利用非公共知識(shí)點(diǎn)匹配失敗,將所述問題文本中的業(yè)務(wù)對(duì)象標(biāo)簽去掉,與所述公共知識(shí)點(diǎn)進(jìn)行匹配;
答案提供單元,用于如果與某公共知識(shí)點(diǎn)匹配成功,則提供該公共知識(shí)點(diǎn)對(duì)應(yīng)的答案。
根據(jù)本申請(qǐng)?zhí)峁┑木唧w實(shí)施例,本申請(qǐng)公開了以下技術(shù)效果:
通過本申請(qǐng)實(shí)施例,可以利用歷史問答記錄,向第二用戶提供用于對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化的推薦信息,具體的,可以將一些具有相同答案,只有標(biāo)簽不 同的問題進(jìn)行合并,生成合并后的知識(shí)點(diǎn),對(duì)于答案不同的知識(shí)點(diǎn)可以單獨(dú)進(jìn)行維護(hù),這樣,有利于減小問答數(shù)據(jù)庫的規(guī)模,提高自動(dòng)問答系統(tǒng)的準(zhǔn)確性以及效率。
當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
附圖說明
為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本申請(qǐng)實(shí)施例提供的方法的流程圖;
圖2是本申請(qǐng)實(shí)施例提供的另一種方法的流程圖;
圖3是本申請(qǐng)實(shí)施例提供的裝置的流程圖;
圖4是本申請(qǐng)實(shí)施例提供的另一裝置的示意圖。
具體實(shí)施方式
下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
在本申請(qǐng)實(shí)施例中,將交易平臺(tái)的用戶劃分為第一用戶以及第二用戶,其中,第一用戶主要是指買家用戶等,第二用戶主要是指賣家用戶或者商家用戶,等等。
實(shí)施例一
本申請(qǐng)發(fā)明人在實(shí)現(xiàn)本申請(qǐng)的過程中發(fā)現(xiàn),一個(gè)第二用戶一般售賣多種業(yè)務(wù)對(duì)象(而且可能會(huì)上新的業(yè)務(wù)對(duì)象),在第一用戶的咨詢中,大部分是關(guān)于業(yè)務(wù)對(duì)象怎么買(買一送一等),如何使用(吃),效果如何等等相關(guān)的問題,這一類的咨詢占咨詢的50%以上。第二用戶將第一用戶常見的問題維護(hù)成一個(gè) 個(gè)知識(shí)點(diǎn),一個(gè)知識(shí)點(diǎn)包括問題和對(duì)應(yīng)的回答。例如知識(shí)點(diǎn)1“維c主要有些什么功效呢”。當(dāng)客戶問題1“維c有些什么功效”,自動(dòng)問答系統(tǒng)就可以使用文本相似度技術(shù)發(fā)現(xiàn)知識(shí)點(diǎn)1“維c主要有些什么功效呢”跟客戶的問題很相似,于是就可以使用自動(dòng)問答技術(shù)幫助商家自動(dòng)回復(fù)客戶的咨詢。
但是,現(xiàn)有技術(shù)中這種僅依據(jù)文本相似度進(jìn)行判斷的方式,可能會(huì)產(chǎn)生錯(cuò)誤現(xiàn)象。例如,當(dāng)?shù)谝挥脩舻膯栴}為“維b主要有些什么功效呢”,因?yàn)榈谝挥脩舻膯栴}與前述知識(shí)點(diǎn)1中的問題只差一個(gè)字,所以也可能會(huì)匹配到知識(shí)點(diǎn)1,但顯然,維c的功效與維b的功效是不同的,以至于給出錯(cuò)誤的答案。
因此,為了避免上述這種情況的發(fā)生,現(xiàn)有技術(shù)中的問答數(shù)據(jù)庫,往往會(huì)針對(duì)各個(gè)業(yè)務(wù)對(duì)象分別設(shè)置對(duì)應(yīng)的知識(shí)點(diǎn),采用精確匹配的方式給出問題的答案,以至于現(xiàn)有的問答數(shù)據(jù)庫的規(guī)模非常大,需要占用大量的存儲(chǔ)資源,查詢、匹配等過程效率低下,需要耗費(fèi)較長的時(shí)間。
并且,本申請(qǐng)發(fā)明人發(fā)現(xiàn),實(shí)際上,對(duì)于同一第二用戶銷售的各個(gè)業(yè)務(wù)對(duì)象而言,大部分的業(yè)務(wù)對(duì)象使用、購買規(guī)則可能都是一樣的,只是某些特別的商品可能不一樣。例如,某第二用戶針對(duì)店內(nèi)的業(yè)務(wù)對(duì)象包括維生素b、維生素c以及維生素e等,其中大部分業(yè)務(wù)對(duì)象都有固定的營銷折扣,如,維b、維c、維e均享受買一送一的優(yōu)惠等。但是,現(xiàn)有的問答數(shù)據(jù)庫中,卻可能會(huì)分別為三種業(yè)務(wù)對(duì)象維護(hù)關(guān)于營銷折扣方面的知識(shí)點(diǎn),例如:
知識(shí)點(diǎn)1:問題為“維b折扣”,對(duì)應(yīng)答案為“買一送一”;
知識(shí)點(diǎn)2:問題為“維c折扣”,對(duì)應(yīng)答案為“買一送一”;
知識(shí)點(diǎn)3:問題為“維e折扣”,對(duì)應(yīng)答案為“買一送一”。
顯然,這部分知識(shí)點(diǎn)實(shí)際上是可以合并的,例如,統(tǒng)一合并為“折扣”,對(duì)應(yīng)答案為“買一送一”,等等。當(dāng)然,也可能有個(gè)別的業(yè)務(wù)對(duì)象,在銷售折扣上與其他業(yè)務(wù)對(duì)象不同,例如,假設(shè),維b與維e都是可以無條件享受買一送一的折扣,但是,維c則需要在符合某購買條件(比如一次購買量,或者購買時(shí)間等限制)的情況下才能享受該折扣。此時(shí),就不應(yīng)該將維c一起進(jìn)行合并,而是,可以獨(dú)立維護(hù)知識(shí)點(diǎn)2“維c折扣”,對(duì)應(yīng)答案為“一次購買滿某某元時(shí),買一送一”。
總之,本申請(qǐng)實(shí)施例中,可以將現(xiàn)有的問答數(shù)據(jù)庫進(jìn)行優(yōu)化,將其中能夠合并的知識(shí)點(diǎn)進(jìn)行合并,不能合并的單獨(dú)維護(hù),從而降低問答數(shù)據(jù)庫的規(guī)模,提高效率。
當(dāng)然,在具體實(shí)現(xiàn)時(shí),由于現(xiàn)有的自動(dòng)問答系統(tǒng)中已經(jīng)存在分別對(duì)應(yīng)各個(gè)第二用戶的問答數(shù)據(jù)庫,如果由第二用戶通過手動(dòng)的方式對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化,則意味著第二用戶可能需要消耗較多的人力成本。
因此,在本申請(qǐng)實(shí)施例中,可以首先提供一種第二用戶端的解決方案,在該方案中,可以自動(dòng)對(duì)咨詢過程中產(chǎn)生的問答數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從中得到一些可以合并的問題,并以此推薦給第二用戶端,這樣,第二用戶端就可以根據(jù)這種推薦信息,對(duì)其問答數(shù)據(jù)庫進(jìn)行優(yōu)化整理,包括對(duì)一些問題進(jìn)行合并,等等,使得問題系統(tǒng)能夠?yàn)榈谝挥脩籼峁└咝Ц鼫?zhǔn)確的咨詢服務(wù)。
具體的,該實(shí)施例一提供了一種問答數(shù)據(jù)處理方法,參見圖1,該方法可以包括以下步驟:
S101:收集對(duì)業(yè)務(wù)對(duì)象的進(jìn)行咨詢過程中產(chǎn)生的問答數(shù)據(jù);
第一用戶在使用瀏覽器、移動(dòng)終端應(yīng)用程序等對(duì)銷售平臺(tái)中的業(yè)務(wù)對(duì)象信息進(jìn)行瀏覽、購買等操作的過程中,如果有問題需要咨詢,例如,包括業(yè)務(wù)對(duì)象的功效、使用方法等等。在此過程中,如果第一用戶選擇使用自動(dòng)問答系統(tǒng),則可以通過預(yù)先建立的問答數(shù)據(jù)庫中包含的知識(shí)點(diǎn),與第一用戶提出的問題進(jìn)行匹配,給出對(duì)應(yīng)問題的答案。如果某第一用戶提出的問題沒有命中問答數(shù)據(jù)庫中的知識(shí)點(diǎn),則還可以由第二用戶的客服人員等針對(duì)該第一用戶的用戶做出相應(yīng)的解答,也即給出對(duì)應(yīng)的答案。
也就是說,在收集問答數(shù)據(jù)時(shí),收集到的問題數(shù)據(jù),一般主要可以包括第一用戶在咨詢過程中提出的問題,或者,還可以包括第二用戶的問答數(shù)據(jù)庫中各個(gè)知識(shí)點(diǎn)中包含的問題等;而收集到的答案數(shù)據(jù),可以包括在第一用戶提出的問題命中問答數(shù)據(jù)庫中某知識(shí)點(diǎn)時(shí),該問答數(shù)據(jù)庫自動(dòng)給出的答案,以及,在第一用戶提出的問題未命中問答數(shù)據(jù)庫中的知識(shí)點(diǎn)時(shí),由第二用戶手動(dòng)輸入的答案。
S102:根據(jù)所述問答數(shù)據(jù)中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息,對(duì)所述問答數(shù)據(jù)進(jìn) 行文本分析,確定可合并的問題;
在收集到問答數(shù)據(jù)后,可以對(duì)其進(jìn)行分析。在本申請(qǐng)實(shí)施例中,這種分析可以基于問答數(shù)據(jù)中包含的業(yè)務(wù)對(duì)象標(biāo)簽進(jìn)行。其中,所謂的業(yè)務(wù)對(duì)象標(biāo)簽,可以是指業(yè)務(wù)對(duì)象的名稱、類目、品牌等等??梢灶A(yù)先建立業(yè)務(wù)對(duì)象標(biāo)簽識(shí)別規(guī)則(例如,對(duì)銷售平臺(tái)在中劃分的業(yè)務(wù)對(duì)象類目、第二用戶銷售的常見業(yè)務(wù)對(duì)象品牌等進(jìn)行窮舉等)的方式,從收集到的問答數(shù)據(jù)中,識(shí)別業(yè)務(wù)對(duì)象標(biāo)簽,然后進(jìn)行后續(xù)的分析操作。
具體在進(jìn)行分析時(shí),首先可以針對(duì)第二用戶已有的問答數(shù)據(jù)庫中包含的知識(shí)點(diǎn)進(jìn)行分析。具體的,可以針對(duì)問答數(shù)據(jù)庫的知識(shí)點(diǎn),確定出相同/相似的答案對(duì)應(yīng)的不同問題,如果問題中均包含業(yè)務(wù)對(duì)象標(biāo)簽,則將問題中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息去掉,比較各問題中剩余部分的相似性,如果相似性符合預(yù)置條件,則將這些問題確定為可合并的問題。進(jìn)而,還可以根據(jù)問題中的剩余部分確定合并后的問題,并根據(jù)所述相同/相似的答案確定所述合并后的問題對(duì)應(yīng)的答案。例如,在某第二用戶的問答數(shù)據(jù)庫中,存在以下知識(shí)點(diǎn):
知識(shí)點(diǎn)1:{問題:維B優(yōu)惠活動(dòng);答案:買一送一}
知識(shí)點(diǎn)2:{問題:維C優(yōu)惠活動(dòng);答案:買一送一}
可見,上述知識(shí)點(diǎn)1與知識(shí)點(diǎn)2的答案是相同的,知識(shí)點(diǎn)1的問題中包括的業(yè)務(wù)對(duì)象標(biāo)簽為“維B”,知識(shí)點(diǎn)2的問題中包含的業(yè)務(wù)對(duì)象標(biāo)簽為“維C”,此時(shí),就可以將知識(shí)點(diǎn)1的問題中包含的“維B”去掉,知識(shí)點(diǎn)2的問題中包含的“維C”去掉,比較兩個(gè)問題中的剩余部分,由于均為“優(yōu)惠活動(dòng)”,相似性很高,因此,可以將這兩個(gè)問題確定為可合并的問題。合并之后得到一個(gè)新的知識(shí)點(diǎn),可以添加到問答數(shù)據(jù)庫中。其中,合并后的知識(shí)點(diǎn)中,問題可以為“優(yōu)惠活動(dòng)”,答案為“買一送一”,并且,還可以將前述知識(shí)點(diǎn)1以及知識(shí)點(diǎn)2從問答數(shù)據(jù)庫中刪除。
前文所述為對(duì)問答數(shù)據(jù)庫內(nèi)部的知識(shí)點(diǎn)進(jìn)行優(yōu)化,或者,在另一種情況下,還可以結(jié)合第二用戶手動(dòng)輸入的答案對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化。具體的,自動(dòng)問答系統(tǒng)可以利用業(yè)務(wù)對(duì)象標(biāo)簽精確匹配的方式給出問題的答案,也即,如果某第一用戶提出的問題中包含業(yè)務(wù)對(duì)象標(biāo)簽,則可以首先在問答數(shù)據(jù)庫中查找包 含有該業(yè)務(wù)對(duì)象標(biāo)簽的知識(shí)點(diǎn)問題,然后再進(jìn)行其他部分問題內(nèi)容的相似性比對(duì)。這樣,避免出現(xiàn)以下情況:在第一用戶提出關(guān)于業(yè)務(wù)對(duì)象A的問題時(shí),將用于回答關(guān)于業(yè)務(wù)對(duì)象B的答案提供給第一用戶。這樣,也就是說,如果某第一用戶提出的第一目標(biāo)問題未命中問答數(shù)據(jù)庫中的知識(shí)點(diǎn),則可以證明問答數(shù)據(jù)庫中尚未有關(guān)于該業(yè)務(wù)對(duì)象A在這方面的知識(shí)點(diǎn)。
進(jìn)而,針對(duì)上述情況,在第二用戶提供了手動(dòng)輸入的答案后,則可以將第二用戶手動(dòng)輸入的答案與所述問答數(shù)據(jù)庫中的各個(gè)答案進(jìn)行比對(duì),如果所述問答數(shù)據(jù)庫中存在相同/相似的答案,則可以將該第一目標(biāo)問題與問答數(shù)據(jù)庫中該答案對(duì)應(yīng)的第二目標(biāo)問題進(jìn)行比對(duì),具體的比對(duì)過程可以為:如果第一目標(biāo)問題以及第二目標(biāo)問題中均存在業(yè)務(wù)對(duì)象標(biāo)簽,則將業(yè)務(wù)對(duì)象標(biāo)簽去掉后,比對(duì)第一目標(biāo)問題與所述第二目標(biāo)問題剩余部分的相似性,如果相似性符合預(yù)置條件,則將該第一目標(biāo)問題與第二目標(biāo)問題確定為可合并的問題。
例如,某第一用戶提出的問題為“維C有何優(yōu)惠活動(dòng)”,問答數(shù)據(jù)庫中自動(dòng)問答系統(tǒng)在利用問答數(shù)據(jù)庫進(jìn)行比對(duì)后,沒有查找到與該問題相匹配的知識(shí)點(diǎn),于是通過手動(dòng)輸入答案的方式給出答案為“買一送一”。針對(duì)該問答情況,可以將該手動(dòng)輸入的答案“買一送一”與問答數(shù)據(jù)庫中各個(gè)知識(shí)點(diǎn)中的答案進(jìn)行比對(duì),取出與該答案相同的知識(shí)點(diǎn),例如,發(fā)現(xiàn)某知識(shí)點(diǎn)中答案也是“買一送一”,對(duì)應(yīng)的問題是“維B有何優(yōu)惠活動(dòng)”,并且,將其中的“維B”、“維C”等標(biāo)簽去掉之后,問題中的其他部分具有很高的相似性,因此,就可以將當(dāng)前第一用戶提出的問題“維C有何優(yōu)惠活動(dòng)”與問答數(shù)據(jù)庫中該知識(shí)點(diǎn)中的問題“維B有何優(yōu)惠活動(dòng)”進(jìn)行合并,合并后的問題可以為“優(yōu)惠活動(dòng)”,答案可以為“買一送一”,等等。
當(dāng)然,如果所述問答數(shù)據(jù)庫中不存在與所述第二用戶手動(dòng)輸入的答案相同/相似的答案,則可以將該目標(biāo)問題以及對(duì)應(yīng)的答案確定為該新知識(shí)點(diǎn),利用該新的知識(shí)點(diǎn)向第二用戶提供第二推薦信息。
S103:根據(jù)所述可合并的問題確定合并后的知識(shí)點(diǎn),所述合并后的知識(shí)點(diǎn)文本包括合并后的問題以及對(duì)應(yīng)的答案;
S104:根據(jù)所述可合并的問題、合并后的知識(shí)點(diǎn),向第二用戶端提供第一 推薦信息,以便對(duì)所述問答數(shù)據(jù)庫進(jìn)行更新。
對(duì)于合并后的問題以及答案,可以生成合并后的知識(shí)點(diǎn),并且可以作為推薦信息提供給第二用戶,在得到第二用戶的確認(rèn)后,可以替換問答數(shù)據(jù)庫中原來的知識(shí)點(diǎn)。
需要說明的是,在實(shí)際應(yīng)用中,上述對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化的過程可以是隨著第一用戶對(duì)問答系統(tǒng)的使用而不斷進(jìn)行的。并且,為了進(jìn)一步提高自動(dòng)問答系統(tǒng)的效率以及準(zhǔn)確性,還可以向第一用戶提供用于提交滿意度信息的操作選項(xiàng),這樣,第一用戶通過一段時(shí)間對(duì)自動(dòng)問答系統(tǒng)的使用,則可以將其滿意程度信息通過該操作選項(xiàng)上傳到服務(wù)器,這樣,服務(wù)器可以收集到這種信息,并對(duì)第一用戶不滿意的問答情況進(jìn)行聚類,并且可以將聚類的結(jié)果提供給第二用戶客戶端,第二客戶端可以基于這些反饋,對(duì)其問答數(shù)據(jù)庫進(jìn)行手動(dòng)的修改等操作。
總之,通過前述實(shí)施例一,可以利用歷史問答記錄,向第二用戶提供用于對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化的推薦信息,具體的,可以將一些具有相同答案,只有標(biāo)簽不同的問題進(jìn)行合并,生成合并后的知識(shí)點(diǎn),對(duì)于答案不同的知識(shí)點(diǎn)可以單獨(dú)進(jìn)行維護(hù),這樣,有利于減小問答數(shù)據(jù)庫的規(guī)模,提高自動(dòng)問答系統(tǒng)的準(zhǔn)確性以及效率。
實(shí)施例二
在使用前述方式對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化的基礎(chǔ)上,本申請(qǐng)實(shí)施例還提供了一種自動(dòng)問答方法,參見圖2,該方法可以包括以下步驟:
S201:預(yù)先建立問答數(shù)據(jù)庫,所述問答數(shù)據(jù)庫中包括公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),所述公共知識(shí)點(diǎn)的問題中不帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述非公共知識(shí)點(diǎn)的問題中帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述業(yè)務(wù)對(duì)象標(biāo)簽包括業(yè)務(wù)對(duì)象名稱、類目或品牌;
S202:接收第一用戶端的問題文本;
S203:判斷所述問題文本中是否存在第一業(yè)務(wù)對(duì)象標(biāo)簽;
S204:如果存在,則利用所述非公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配;
如果所述問題文本中不包括業(yè)務(wù)對(duì)象標(biāo)簽,則利用所述公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配。
S205:如果利用非公共知識(shí)點(diǎn)匹配失敗,將所述問題文本中的第一業(yè)務(wù)對(duì)象標(biāo)簽去掉,與所述公共知識(shí)點(diǎn)進(jìn)行匹配;
S206:如果與某公共知識(shí)點(diǎn)匹配成功,則提供該公共知識(shí)點(diǎn)對(duì)應(yīng)的答案。
其中,在述利用非公共知識(shí)點(diǎn)與問題文本進(jìn)行匹配時(shí),具體可以通過以下方式進(jìn)行:
首先,判斷第一業(yè)務(wù)對(duì)象標(biāo)簽與非公共知識(shí)點(diǎn)中包括的第二業(yè)務(wù)對(duì)象標(biāo)簽是否相同;如果相同,則利用所述問題文本以及所述非公共知識(shí)點(diǎn)中去掉業(yè)務(wù)對(duì)象標(biāo)簽的部分進(jìn)行相似性比較,如果符合預(yù)置條件,則匹配成功。
可見,在本申請(qǐng)實(shí)施例中,問題數(shù)據(jù)庫中可以包括公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),在將第一用戶的問題文本與問答數(shù)據(jù)庫中的知識(shí)點(diǎn)進(jìn)行比對(duì)時(shí),可以首先判斷問題文本中是否存在業(yè)務(wù)對(duì)象標(biāo)簽,如果存在,則首先利用非公共知識(shí)點(diǎn)與該問題文本進(jìn)行匹配,如果匹配成功,則利用該非公共知識(shí)點(diǎn)給出對(duì)應(yīng)的答案。否則,如果匹配不成功,則將問題文本中的業(yè)務(wù)對(duì)象標(biāo)簽去掉,之后再與公共知識(shí)點(diǎn)進(jìn)行匹配,如果與某公共知識(shí)點(diǎn)匹配成功,則可以利用該公共知識(shí)點(diǎn)提供對(duì)應(yīng)的答案。由于將問答數(shù)據(jù)庫中的知識(shí)點(diǎn)區(qū)分為公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),因此,可以使得問答數(shù)據(jù)庫的規(guī)模得到控制,提高系統(tǒng)的效率,并且,也有利于提高結(jié)果的準(zhǔn)確性。
與本申請(qǐng)實(shí)施例一提供的問答數(shù)據(jù)處理方法相對(duì)應(yīng),本申請(qǐng)實(shí)施例還提供了一種問答數(shù)據(jù)處理裝置,參見圖3,該裝置具體可以包括:
問答數(shù)據(jù)收集單元301,用于收集對(duì)業(yè)務(wù)對(duì)象的進(jìn)行咨詢過程中產(chǎn)生的問答數(shù)據(jù);
合并問題確定單元302,用于根據(jù)所述問答數(shù)據(jù)中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息,對(duì)所述問答數(shù)據(jù)進(jìn)行文本分析,確定可合并的問題;所述業(yè)務(wù)對(duì)象標(biāo)簽包 括業(yè)務(wù)對(duì)象名稱、類目或品牌;
合并知識(shí)點(diǎn)確定單元303,用于根據(jù)所述可合并的問題確定合并后的知識(shí)點(diǎn),所述合并后的知識(shí)點(diǎn)文本包括合并后的問題以及對(duì)應(yīng)的答案;
第一推薦信息提供單元304,用于根據(jù)所述可合并的問題、合并后的知識(shí)點(diǎn),向第二用戶端提供第一推薦信息,以便對(duì)所述問答數(shù)據(jù)庫進(jìn)行更新。
具體實(shí)現(xiàn)時(shí),所述問答數(shù)據(jù)收集單元包括:
在第一用戶提出的問題命中所述問答數(shù)據(jù)庫中某知識(shí)點(diǎn)時(shí),所述問答數(shù)據(jù)庫自動(dòng)給出的答案,以及,在第一用戶提出的問題未命中所述問答數(shù)據(jù)庫中的知識(shí)點(diǎn)時(shí),由第二用戶手動(dòng)輸入的答案。
其中,所述合并問題確定單元包括:
相似答案確定子單元,用于確定所述問答數(shù)據(jù)庫的知識(shí)點(diǎn)中,相同/相似的答案對(duì)應(yīng)的不同問題;
相似度比對(duì)子單元,用于如果所述問題中均包含業(yè)務(wù)對(duì)象標(biāo)簽,則將所述問題中包含的業(yè)務(wù)對(duì)象標(biāo)簽信息去掉,比較各問題中剩余部分的相似性;
問題確定子單元,用于如果相似性符合預(yù)置條件,則將所述問題確定為可合并的問題;
所述知識(shí)點(diǎn)合并單元具體用于:
根據(jù)所述問題中的剩余部分確定合并后的問題,并根據(jù)所述相同/相似的答案確定所述合并后的問題對(duì)應(yīng)的答案。
或者,在另一種實(shí)現(xiàn)方式下,所述合并問題確定單元包括:
答案比對(duì)子單元,用于如果第一用戶提出的第一目標(biāo)問題未命中所述問答數(shù)據(jù)庫中的知識(shí)點(diǎn),則將所述第二用戶手動(dòng)輸入的答案與所述問答數(shù)據(jù)庫中的各個(gè)答案進(jìn)行比對(duì);
問題比對(duì)子單元,用于如果所述問答數(shù)據(jù)庫中存在相同/相似的答案,則將該第一目標(biāo)問題與問答數(shù)據(jù)庫中該答案對(duì)應(yīng)的第二目標(biāo)問題進(jìn)行比對(duì);
其中,所述問題比對(duì)子單元具體用于:
如果所述第一目標(biāo)問題以及所述第二目標(biāo)問題中均存在業(yè)務(wù)對(duì)象標(biāo)簽,則將所述業(yè)務(wù)對(duì)象標(biāo)簽去掉后,比對(duì)第一目標(biāo)問題與所述第二目標(biāo)問題剩余部分的相似性;如果相似性符合預(yù)置條件,則將該第一目標(biāo)問題與所述第二目標(biāo)問題確定為可合并的問題;
所述知識(shí)點(diǎn)合并單元具體用于:
根據(jù)所述第一目標(biāo)問題文本與所述第二目標(biāo)問題中剩余部分的文本確定合并后的問題,并根據(jù)所述相同/相似的答案確定所述合并后的答案。
另外,該裝置還可以包括:
新知識(shí)點(diǎn)確定單元,用于如果所述問答數(shù)據(jù)庫中不存在與所述第二用戶手動(dòng)輸入的答案相同/相似的答案,則將該目標(biāo)問題以及對(duì)應(yīng)的答案確定為該新知識(shí)點(diǎn);
第二推薦信息提供單元,用于利用所述新的知識(shí)點(diǎn)提供第二推薦信息。
滿意度信息接收單元,用于接收第一用戶對(duì)問答過程的滿意程度信息;
聚類單元,用于針對(duì)不滿意的問答情況進(jìn)行聚類,并將聚類結(jié)果提供給所述第二用戶端,以便所述第二用戶端對(duì)所述問答數(shù)據(jù)庫進(jìn)行修改。
與實(shí)施例二提供的自動(dòng)問答方法相對(duì)應(yīng),本申請(qǐng)實(shí)施例還提供了一種自動(dòng)問答裝置,參見圖4,該裝置具體可以包括:
問答數(shù)據(jù)庫提供單元401,用于預(yù)先建立問答數(shù)據(jù)庫,所述問答數(shù)據(jù)庫中包括公共知識(shí)點(diǎn)以及非公共知識(shí)點(diǎn),所述公共知識(shí)點(diǎn)的問題中不帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述非公共知識(shí)點(diǎn)的問題中帶有業(yè)務(wù)對(duì)象標(biāo)簽,所述業(yè)務(wù)對(duì)象標(biāo)簽包括業(yè)務(wù)對(duì)象名稱、類目或品牌;
問題文本接收單元402,用于接收第一用戶端的問題文本;
判斷單元403,用于判斷所述問題文本中是否存在業(yè)務(wù)對(duì)象標(biāo)簽;
第一匹配單元404,用于如果存在,則利用所述非公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配;
第二匹配單元405,用于如果利用非公共知識(shí)點(diǎn)匹配失敗,將所述問題文 本中的業(yè)務(wù)對(duì)象標(biāo)簽去掉,與所述公共知識(shí)點(diǎn)進(jìn)行匹配;
答案提供單元406,用于如果與某公共知識(shí)點(diǎn)匹配成功,則提供該公共知識(shí)點(diǎn)對(duì)應(yīng)的答案。
其中,所述第一匹配單元包括:
標(biāo)簽判斷子單元,用于判斷所述問題文本中的業(yè)務(wù)對(duì)象標(biāo)簽與所述非公共知識(shí)點(diǎn)中包括的業(yè)務(wù)對(duì)象標(biāo)簽是否相同;
其他部分判斷子單元,用于如果相同,利用所述問題文本以及所述非公共知識(shí)點(diǎn)中去掉業(yè)務(wù)對(duì)象標(biāo)簽的部分進(jìn)行相似性比較,如果符合預(yù)置條件,則匹配成功。
另外,該裝置還可以包括:
第三匹配單元,用于如果所述問題文本中不包括業(yè)務(wù)對(duì)象標(biāo)簽,則利用所述公共知識(shí)點(diǎn)與所述問題文本進(jìn)行匹配。
通過前述實(shí)施例,可以利用歷史問答記錄,向第二用戶提供用于對(duì)問答數(shù)據(jù)庫進(jìn)行優(yōu)化的推薦信息,具體的,可以將一些具有相同答案,只有標(biāo)簽不同的問題進(jìn)行合并,生成合并后的知識(shí)點(diǎn),對(duì)于答案不同的知識(shí)點(diǎn)可以單獨(dú)進(jìn)行維護(hù),這樣,有利于減小問答數(shù)據(jù)庫的規(guī)模,提高自動(dòng)問答系統(tǒng)的準(zhǔn)確性以及效率。
通過以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn)?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)或系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的系統(tǒng)及 系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
以上對(duì)本申請(qǐng)所提供的問答數(shù)據(jù)處理、自動(dòng)問答方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。