本發(fā)明涉及人機(jī)交互技術(shù)領(lǐng)域,尤其涉及一種用于智能問答的信息處理系統(tǒng)及方法。
背景技術(shù):
人機(jī)交互是研究系統(tǒng)與用戶之間的交互關(guān)系的科學(xué)。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。例如,通過人機(jī)交互可以實(shí)現(xiàn)各種人工智能系統(tǒng),例如,智能客服系統(tǒng)、語音控制系統(tǒng)等等。
智能問答系統(tǒng)是人機(jī)交互的一種典型應(yīng)用,其中當(dāng)用戶提出問題后,智能問答系統(tǒng)給出該問題的答案。為此,智能問答系統(tǒng)中有一套知識(shí)庫,里面有大量的問題和與每個(gè)問題相對(duì)應(yīng)的答案。智能問答系統(tǒng)首先需要識(shí)別用戶所提出的問題,即從知識(shí)庫中找到與該用戶問題所對(duì)應(yīng)的問題,然后找出與該問題相匹配的答案。
知識(shí)庫的配置至關(guān)重要。針對(duì)不同項(xiàng)目的智能問答系統(tǒng)需要配置不同的知識(shí)庫,例如針對(duì)醫(yī)療行業(yè)和金融行業(yè)兩個(gè)完全不同的項(xiàng)目需要配置不同的知識(shí)庫?,F(xiàn)有技術(shù)中都是采用人工的方式向該項(xiàng)目知識(shí)庫中添加知識(shí)分類,即部署單獨(dú)環(huán)境,在各個(gè)環(huán)境中分別錄入所有所需的知識(shí)的方式來實(shí)現(xiàn)知識(shí)與所屬項(xiàng)目的對(duì)應(yīng),這種人工實(shí)現(xiàn)成本高,效率低,最終減慢整個(gè)項(xiàng)目的進(jìn)度。
技術(shù)實(shí)現(xiàn)要素:
以下給出一個(gè)或多個(gè)方面的簡(jiǎn)要概述以提供對(duì)這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認(rèn)出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡(jiǎn)化形式給出一個(gè)或多個(gè)方面的一些概念以為稍后給出的更加詳細(xì)的描述之序。
本發(fā)明提供了一種信息處理系統(tǒng)及方法,以解決不同項(xiàng)目知識(shí)庫錄入知識(shí)人工實(shí)現(xiàn)成本高,效率低的問題。
一方面,本發(fā)明提供了一種信息處理方法,包括:
將知識(shí)庫中的知識(shí)分組,以獲得多個(gè)知識(shí)集,每個(gè)知識(shí)集與一知識(shí)類別相關(guān)聯(lián),每個(gè)知識(shí)集的知識(shí)點(diǎn)包括問句和相關(guān)聯(lián)的答案,其中所述問句包括標(biāo)準(zhǔn)問及其擴(kuò)展問;以及
依據(jù)賬戶所需的知識(shí)類別為賬戶指派所述多個(gè)知識(shí)集中的至少一個(gè)知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
另一方面,本發(fā)明提供了一種信息處理系統(tǒng),包括:
知識(shí)庫,所述知識(shí)庫中的知識(shí)用于為用戶問句提供應(yīng)答;
分組模塊,用于將所述知識(shí)庫中的知識(shí)分組,以獲得多個(gè)知識(shí)集,每個(gè)知識(shí)集與一知識(shí)類別相關(guān)聯(lián),每個(gè)知識(shí)集的知識(shí)點(diǎn)包括問句和相關(guān)聯(lián)的答案,其中所述問句包括標(biāo)準(zhǔn)問及其擴(kuò)展問;以及
指派模塊,用于為賬戶指派所述多個(gè)知識(shí)集中的至少一個(gè)知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益技術(shù)效果為:通過將知識(shí)分為不同的知識(shí)類別的知識(shí)集,不同的項(xiàng)目可以使用公共的知識(shí)庫,只需要按需為之指派知識(shí)集即可,大大提高了效率。通過自定義知識(shí)集,改善了識(shí)別準(zhǔn)確率,因?yàn)橛脩糇约禾峁┑闹R(shí)點(diǎn)往往具有較高的準(zhǔn)確性和針對(duì)性,同時(shí)可以不斷完善智能問答系統(tǒng)。
附圖說明
在結(jié)合以下附圖閱讀本公開的實(shí)施例的詳細(xì)描述之后,能夠更好地理解本發(fā)明的上述特征和優(yōu)點(diǎn)。在附圖中,各組件不一定是按比例繪制,并且具有類似的相關(guān)特性或特征的組件可能具有相同或相近的附圖標(biāo)記。
圖1是示出了根據(jù)本發(fā)明的一方面的信息處理方法的流程圖;
圖2是示出了根據(jù)本發(fā)明的一方面的智能問答流程的流程圖;以及
圖3是示出了根據(jù)本發(fā)明的一方面的信息處理系統(tǒng)的框圖。
具體實(shí)施方式
以下結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作詳細(xì)描述。注意,以下結(jié)合附圖和具體實(shí)施例描述的諸方面僅是示例性的,而不應(yīng)被理解為對(duì)本發(fā)明的保護(hù)范圍進(jìn)行任何限制。
知識(shí)庫中的基本知識(shí)點(diǎn)最原始和最簡(jiǎn)單的形式就是平時(shí)常用的FAQ,一般的形式是“問-答”對(duì)。在本發(fā)明中,“標(biāo)準(zhǔn)問”是用來表示某個(gè)知識(shí)點(diǎn)的文字,主要目標(biāo)是表達(dá)清晰,便于維護(hù)。例如,“彩鈴的資費(fèi)”就是表達(dá)清晰的標(biāo)準(zhǔn)問描述。這里的“問”不應(yīng)被狹義地理解為“詢問”,而應(yīng)廣義地來理解一“輸入”,該“輸入”具有對(duì)應(yīng)的“輸出”。例如,對(duì)于用于控制系統(tǒng)的語義識(shí)別而言,用戶的一個(gè)指令,例如“打開收音機(jī)”也應(yīng)可以被理解為是一個(gè)“問”,此時(shí)對(duì)應(yīng)的“答”可以是用于執(zhí)行相應(yīng)控制的控制程序的調(diào)用。
用戶在向機(jī)器輸入時(shí),最理想的情況是使用標(biāo)準(zhǔn)問,則機(jī)器的智能語義識(shí)別系統(tǒng)馬上能夠理解用戶的意思。然而,用戶往往并非使用的是標(biāo)準(zhǔn)問,而是標(biāo)準(zhǔn)問的一些變形的形式。例如,若對(duì)于收音機(jī)的電臺(tái)切換的標(biāo)準(zhǔn)問形式是“換一個(gè)電臺(tái)”,那么用戶可能使用的命令是“切換一個(gè)電臺(tái)”,機(jī)器也需要能夠識(shí)別用戶表達(dá)的是同一個(gè)意思。
因此,對(duì)于智能語義識(shí)別而言,知識(shí)庫里需要有標(biāo)準(zhǔn)問的擴(kuò)展問,該擴(kuò)展問與標(biāo)準(zhǔn)問表達(dá)形式有略微差異,但是表達(dá)相同的含義。
進(jìn)一步,為了更準(zhǔn)確、高效地識(shí)別用戶問題,智能問答系統(tǒng)還發(fā)展出了抽象語義的概念。抽象語義是對(duì)本體類屬性的進(jìn)一步抽象。一個(gè)類別的抽象語義通過一組抽象語義表達(dá)式的集合來描述一類抽象語義的不同表達(dá),為表達(dá)更為抽象的語義,這些抽象語義表達(dá)式在組成元素上進(jìn)行了擴(kuò)充。當(dāng)這些擴(kuò)充的元素一旦被賦予了相應(yīng)的值就可以表達(dá)各種各樣的具體語義。
每一個(gè)抽象語義表達(dá)式主要可包括缺失語義成分和語義規(guī)則詞。缺失語義成分由語義成分符表示,當(dāng)這些缺失的語義成分被填充了相應(yīng)的值(即內(nèi)容)后可以表達(dá)各式各樣的具體語義。
抽象語義的語義成分符可包括:
[concept]:表示主體或客體成份的詞或短語。
比如:“彩鈴如何開通”中的“彩鈴”
[action]:表示動(dòng)作成分的詞或短語。
比如:“信用卡如何辦理”中的“辦理”
[attribute]:表示屬性成份的詞或短語。
比如:“iphone有哪些顏色”中的“顏色”
[adjective]:表示修飾成分的詞或短語。
比如:“冰箱哪個(gè)品牌便宜”中的“便宜”
一些主要的抽象語義類別示例有:
概念說明[concept]是什么
屬性構(gòu)成[concept]有哪些[attribute]
行為方式[concept]如何[action]
行為地點(diǎn)[concept]在什么地方[action]
行為原因[concept]為什么會(huì)[action]
行為預(yù)測(cè)[concept]會(huì)不會(huì)[action]
行為判斷[concept]有沒有[attribute]
屬性狀況[concept]的[attribute]是不是[adjective]
屬性判斷[concept]是不是有[attribute]
屬性原因[concept]的[attribute]為什么這么[adjective]
概念比較[concept1]和[concept2]的區(qū)別在哪里
屬性比較[concept1]和[concept2]的[attribute]有什么不同之處
問句在抽象語義層面的成份判斷可以通過詞性標(biāo)注來做一般的評(píng)判,concept對(duì)應(yīng)的詞性為名詞,action對(duì)應(yīng)的詞性為動(dòng)詞、attribute對(duì)應(yīng)的詞性為名詞、adjective對(duì)應(yīng)的是形容詞。
以類別為“行為方式”的抽象語義[concept]如何[action]為例,該類別的抽象語義集合下可包括多條抽象語義表達(dá)式:
抽象語義類別:行為方式
抽象語義表達(dá)式:
a.[concept][需要|應(yīng)該?][如何]<才[可以]?><進(jìn)行?>[action]
b.{[concept]~[action]}
c.[concept]<的?>[action]<方法|方式|步驟?>
d.<有哪些|有什么|有沒有><通過|用|在>[concept][action]<的?>[方法]
e.[如何][action]~[concept]
上述a、b、c、d四個(gè)抽象語義表達(dá)式都是用來描述“行為方式”這一抽象語義類別的。符號(hào)“|”表示“或”關(guān)系,符號(hào)“?”表示該成分可有可無。以上述抽象語義表達(dá)式c為例,可展開為以下的抽象語義表達(dá):
c1.[concept]<的>[action]<方法>
c2.[concept]<的>[action]<方式>
c3.[concept]<的>[action]<步驟>
c4.[concept]<的>[action]
c5.[concept][action]<方法>
c6.[concept][action]<方式>
c7.[concept][action]<步驟>
c8.[concept][action]
在上述抽象語義表達(dá)式中,除了作為缺失語義成分的抽象的語義成分符之外,其他出現(xiàn)的具體的詞如“如何”、“應(yīng)該”、“方法”等等,這些詞需要在抽象語義規(guī)則中被使用,所以可統(tǒng)稱為語義規(guī)則詞。
以上介紹了智能問答系統(tǒng)中的一些基本概念。
本發(fā)明中,在一個(gè)公共的知識(shí)庫中對(duì)知識(shí)進(jìn)行分類,使得不同應(yīng)用場(chǎng)景的項(xiàng)目按需調(diào)用相應(yīng)類別的知識(shí),從而實(shí)現(xiàn)不同應(yīng)用場(chǎng)景的項(xiàng)目之間對(duì)一個(gè)公共知識(shí)庫的共用。以此方式,運(yùn)營人員只需要對(duì)一個(gè)知識(shí)庫進(jìn)行部署和維護(hù),而不需要分別針對(duì)不同的項(xiàng)目單獨(dú)部署和維護(hù)不同的知識(shí)庫,大大節(jié)省了人力物力。另外,本發(fā)明還允許用戶自己定義知識(shí)點(diǎn)以制備專用于該用戶自己的自定義知識(shí)集,從而提升問答準(zhǔn)確率。
圖1是示出了根據(jù)本發(fā)明的一方面的信息處理方法100的流程圖。該信息處理方法100可用于智能問答系統(tǒng)的知識(shí)庫的部署和維護(hù)。
如圖1所示,信息處理方法100可包括以下步驟:
步驟102:將知識(shí)庫中的知識(shí)分組,以獲得多個(gè)知識(shí)集,每個(gè)知識(shí)集與一知識(shí)類別相關(guān)聯(lián)。每個(gè)知識(shí)集的知識(shí)點(diǎn)包括問句和相關(guān)聯(lián)的答案,其中問句包括標(biāo)準(zhǔn)問及其擴(kuò)展問。
知識(shí)的分組以知識(shí)的類別為基礎(chǔ),不同知識(shí)類別的知識(shí)點(diǎn)被分為不同的知識(shí)集。這里的“知識(shí)類別”可以是管理員希望用來對(duì)知識(shí)進(jìn)行區(qū)分的任何類別。作為示例,知識(shí)類別可以包括景點(diǎn)知識(shí)類、酒店知識(shí)類、公交線路知識(shí)類等等。
步驟104:依據(jù)賬戶所需的知識(shí)類別為賬戶指派這多個(gè)知識(shí)集中的至少一個(gè)知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
這里的“賬戶”與不同的應(yīng)用領(lǐng)域的應(yīng)用相對(duì)應(yīng),為每個(gè)應(yīng)用指派一個(gè)賬戶。例如針對(duì)為旅游局的項(xiàng)目開發(fā)的應(yīng)用,為其指派一個(gè)賬戶,針對(duì)為民政局的項(xiàng)目開發(fā)的應(yīng)用,為其指派一個(gè)賬戶。以此方式,可基于賬戶來管理不同應(yīng)用所用到的知識(shí)。這里的“應(yīng)用”可以是智能問答系統(tǒng)的具體應(yīng)用程序,該應(yīng)用可以是基于網(wǎng)頁版的網(wǎng)頁程序,也可以是用于移動(dòng)操作系統(tǒng)的APP。
知識(shí)庫中按照知識(shí)類別具有許多的知識(shí)集,不同的賬戶,即與該賬戶所對(duì)應(yīng)的應(yīng)用(例如,智能問答系統(tǒng))需要用到不同的知識(shí)。因此,基于該賬戶所需的知識(shí)類別為之指派知識(shí)庫中的至少一個(gè)知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
舉例而言,針對(duì)與旅游局項(xiàng)目相關(guān)聯(lián)的賬戶,為之指派與旅游相關(guān)的知識(shí)類別的知識(shí)集,例如知識(shí)集A、B、C、D。針對(duì)與民政局項(xiàng)目相關(guān)聯(lián)的賬戶,為之指派與民政設(shè)施相關(guān)的知識(shí)類別的知識(shí)集,例如知識(shí)集C、D、E、F。
這里,知識(shí)集A、B、C、D的知識(shí)類別可以是與旅游相關(guān)的,知識(shí)集C、D、E、F的知識(shí)類別可以是與民政設(shè)施相關(guān)的。
在本發(fā)明中,為不同賬戶所指派的知識(shí)集中可能有公共的知識(shí)集。例如,如前所述,為第一賬戶(旅游局項(xiàng)目)指派的知識(shí)集A、B、C、D與為第二賬戶(民政局項(xiàng)目)指派的知識(shí)集C、D、E、F之間存在公共的知識(shí)集C、D。
這是因?yàn)樵摴驳闹R(shí)集C、D的知識(shí)類別可能同時(shí)與這兩個(gè)賬戶的應(yīng)用領(lǐng)域相關(guān)。知識(shí)集C的知識(shí)類別可能為酒店知識(shí)類,知識(shí)集D的知識(shí)類別可能為公交線路類。這兩個(gè)知識(shí)類別的知識(shí)既屬于與旅游相關(guān)的信息,也屬于與地方政府的民政設(shè)施相關(guān)的信息。
往往不同的項(xiàng)目之間可能會(huì)用到相同的知識(shí),按照傳統(tǒng)方式,需要為每個(gè)項(xiàng)目部署獨(dú)立的知識(shí)庫,其中涉及大量知識(shí)的重復(fù)部署。在本發(fā)明中,通過將知識(shí)分為不同的知識(shí)類別的知識(shí)集,不同的項(xiàng)目可以使用公共的知識(shí)庫,只需要按需為之指派知識(shí)集即可,大大提高了效率。
根據(jù)本發(fā)明的另一方面,可基于由用戶針對(duì)一賬戶提供的知識(shí)點(diǎn)制備用于該賬戶的自定義知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。這提供了知識(shí)點(diǎn)的用戶自定義功能。
這里的“用戶”可以是該賬戶所對(duì)應(yīng)的應(yīng)用的權(quán)利所有人,也可以是該賬戶的直接使用者。例如,對(duì)于為旅游局開發(fā)的應(yīng)用(例如,一款與旅游相關(guān)的智能問答系統(tǒng)的APP),該“用戶”可以是這款應(yīng)用的權(quán)利所有人,即旅游局,也可以是這款應(yīng)用的使用者,即游客。無論是旅游局還是游客都可以自行提供知識(shí)點(diǎn),以不斷完善這款應(yīng)用。
可通過向用戶提供接口來接收用戶提供的知識(shí)點(diǎn),例如在應(yīng)用中提供一個(gè)專用于輸入知識(shí)點(diǎn)的用戶界面。用戶輸入的知識(shí)點(diǎn)可以是問句+答案的形式。
然而,用戶提供的知識(shí)點(diǎn)往往并不能直接被用于智能問答系統(tǒng)。標(biāo)準(zhǔn)的用于智能問答系統(tǒng)的知識(shí)點(diǎn)包括標(biāo)準(zhǔn)問及其擴(kuò)展問,如上所述的。因此,首先需要為用戶提供的每一知識(shí)點(diǎn)建立該知識(shí)點(diǎn)的標(biāo)準(zhǔn)問。標(biāo)準(zhǔn)問的建立可以通過對(duì)用戶提供的知識(shí)點(diǎn)中的問句進(jìn)行編輯而成。
制備自定義知識(shí)集的關(guān)鍵在于為建立的標(biāo)準(zhǔn)問擴(kuò)展出若干擴(kuò)展問。
在本發(fā)明中,擴(kuò)展問的生成借用了抽象語義表達(dá)式。為此,首先需要提供一個(gè)抽象語義數(shù)據(jù)庫,其中包括多個(gè)抽象語義表達(dá)式,抽象語義表達(dá)式包括缺失語義成份。
圖2示出了對(duì)標(biāo)準(zhǔn)問進(jìn)行擴(kuò)展的方法200的流程圖。如圖2所示,方法200可包括如下步驟。
步驟202,根據(jù)抽象語義數(shù)據(jù)庫對(duì)該標(biāo)準(zhǔn)問進(jìn)行抽象語義推薦處理,以獲得與該標(biāo)準(zhǔn)問對(duì)應(yīng)的一個(gè)或多個(gè)抽象語義表達(dá)式。
例如,一個(gè)標(biāo)準(zhǔn)問為:“怎么查違章”。
首先,需要找到抽象語義數(shù)據(jù)庫中與該標(biāo)準(zhǔn)問相對(duì)應(yīng)的抽象語義表達(dá)式。在一實(shí)例中,該抽象語義推薦首先對(duì)該標(biāo)準(zhǔn)問進(jìn)行分詞處理,得到若干單詞,該單詞為語義規(guī)則詞或非語義規(guī)則詞。
例如,“怎么查違章”可分為單詞“怎么”、“查”、“違章”。這些單詞中,“怎么”為語義規(guī)則詞,“查”和“違章”是非語義規(guī)則詞。
然后,分別對(duì)每個(gè)非語義規(guī)則詞進(jìn)行詞性標(biāo)注處理,例如“查”被標(biāo)注為動(dòng)詞,“違章”被標(biāo)注為名詞。
之后,對(duì)每個(gè)語義規(guī)則詞進(jìn)行詞類判斷處理,得到每個(gè)語義規(guī)則詞的詞類信息。詞類簡(jiǎn)單的理解即為一組有共性的詞,這些詞在語義上可以相似也可以不相似。
最后,根據(jù)這些詞性信息和詞類信息對(duì)抽象語義數(shù)據(jù)庫進(jìn)行搜索處理,得到與標(biāo)準(zhǔn)問“怎么查違章”匹配的抽象語義表達(dá)式。
實(shí)踐中,與用戶匹配的抽象語義表達(dá)式滿足以下條件:
1)抽象語義表達(dá)式的缺失語義成分對(duì)應(yīng)的詞性包括標(biāo)準(zhǔn)問對(duì)應(yīng)的填充內(nèi)容的詞性;
2)抽象語義表達(dá)式和標(biāo)準(zhǔn)問中對(duì)應(yīng)的語義規(guī)則詞相同或?qū)儆谕辉~類;
3)抽象語義表達(dá)式的順序與標(biāo)準(zhǔn)問的表達(dá)順序相同。
在上述抽象語義類別“行為方式”中,抽象語義表達(dá)式e的缺失語義成分action的詞性為動(dòng)詞,標(biāo)準(zhǔn)問“怎么查違章”對(duì)應(yīng)的填充內(nèi)容“查”也為動(dòng)詞,缺失語義成分concept的詞性為名詞,標(biāo)準(zhǔn)問“怎么查違章”對(duì)應(yīng)的填充內(nèi)容“違章”也為名詞,因此符合上述條件1)。
其次,抽象語義表達(dá)式e中的語義規(guī)則詞“如何”與標(biāo)準(zhǔn)問“怎么查違章”中對(duì)應(yīng)的語義規(guī)則詞“怎么”屬于同一詞類,因此符合上述條件2)。
最后,抽象語義表達(dá)式e的順序也與標(biāo)準(zhǔn)問的表達(dá)順序相同,符合上述條件3)。
因此,在抽象語義數(shù)據(jù)庫中,找到與標(biāo)準(zhǔn)問“怎么查違章”匹配的抽象語義表達(dá)式e,即[如何][action]~[concept]。該抽象語義表達(dá)式屬于“行為方式”類別,由于一個(gè)類別中的抽象語義表達(dá)式具有相同的表達(dá)含義,因此在本發(fā)明中,為上述標(biāo)準(zhǔn)問推薦“行為方式”這一類別的抽象語義表達(dá)式的集合。換言之,所匹配的抽象語義表達(dá)式所屬的類別中的所有抽象語義表達(dá)式皆被推薦為與該標(biāo)準(zhǔn)問相對(duì)應(yīng)的抽象語義表達(dá)式。
步驟204,從該標(biāo)準(zhǔn)問中提取與一個(gè)或多個(gè)抽象語義表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容,并將提取的內(nèi)容填充到對(duì)應(yīng)的缺失語義成分中以得到與該標(biāo)準(zhǔn)問對(duì)應(yīng)的一個(gè)或多個(gè)具體語義表達(dá)式。這些具體語義表達(dá)式作為該標(biāo)準(zhǔn)問的擴(kuò)展問。
以上述標(biāo)準(zhǔn)問“怎么查違章”為例,推薦如下的抽象語義表達(dá)式:
a.[concept][需要|應(yīng)該?][如何]<才[可以]?><進(jìn)行?>[action]
b.{[concept]~[action]}
c.[concept]<的?>[action]<方法|方式|步驟?>
d.<有哪些|有什么|有沒有><通過|用|在>[concept][action]<的?>[方法]
e.[如何][action]~[concept]
用上述抽象語義表達(dá)式對(duì)標(biāo)準(zhǔn)問“怎么查違章”進(jìn)行擴(kuò)充處理。
在一實(shí)例中,從標(biāo)準(zhǔn)問中提取與每一抽象語義表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容,并將提取的內(nèi)容填充至每一抽象語義表達(dá)式對(duì)應(yīng)的缺失語義成分中以得到與該標(biāo)準(zhǔn)問對(duì)應(yīng)的具體語義表達(dá)式。
以抽象語義表達(dá)式a:[concept][需要|應(yīng)該?][如何]<才[可以]?><進(jìn)行?>[action]為例,從“怎么”、“查”、“違章”中提取與該表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容:
concept對(duì)應(yīng)的內(nèi)容:“違章”
action對(duì)應(yīng)的內(nèi)容:“查”
因此,將“查”和“違章”違章填充至對(duì)應(yīng)的缺失語義成分得到一具體語義表達(dá)式:[違章][需要|應(yīng)該?][如何]<才[可以]?><進(jìn)行?>[查詢]。
以抽象語義表達(dá)式b.{[concept]~[action]}為例,從“怎么”、“查”、“違章”中提取與該表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容:
concept對(duì)應(yīng)的內(nèi)容:“違章”
action對(duì)應(yīng)的內(nèi)容:“查”
因此,將“查”和“違章”違章填充至對(duì)應(yīng)的缺失語義成分得到一具體語義表達(dá)式:[違章][查詢]。
以抽象語義表達(dá)式c.[concept]<的?>[action]<方法|方式|步驟?>為例,從“怎么”、“查”、“違章”中提取與該表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容:
concept對(duì)應(yīng)的內(nèi)容:“違章”
action對(duì)應(yīng)的內(nèi)容:“查”
因此,將“查”和“違章”違章填充至對(duì)應(yīng)的缺失語義成分得到一具體語義表達(dá)式:[違章]<的?>[查詢]<方法|方式|步驟?>。
以抽象語義表達(dá)式d.<有哪些|有什么|有沒有><通過|用|在>[concept][action]<的?>[方法]為例,從“怎么”、“查”、“違章”中提取與該表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容:
concept對(duì)應(yīng)的內(nèi)容:“違章”
action對(duì)應(yīng)的內(nèi)容:“查”
因此,將“查”和“違章”違章填充至對(duì)應(yīng)的缺失語義成分得到一具體語義表達(dá)式:<有哪些|有什么|有沒有><通過|用|在>[違章][查詢]<的?>[方法]。
上述描述了如何利用抽象語義數(shù)據(jù)庫對(duì)標(biāo)準(zhǔn)問進(jìn)行擴(kuò)展的過程。
在針對(duì)某一賬戶建立了自定義知識(shí)集后,針對(duì)來自該賬戶的用戶問句,當(dāng)首先利用該自定義知識(shí)集為其用戶問句執(zhí)行知識(shí)匹配以提供答案,若匹配失敗,再利用該用戶的所指派知識(shí)集為其用戶問句執(zhí)行知識(shí)匹配以提供答案。如果再次匹配失敗,則系統(tǒng)可以輸出預(yù)設(shè)的答案,例如“對(duì)不起,請(qǐng)重新輸入”。
通過自定義知識(shí)集,改善了識(shí)別準(zhǔn)確率,因?yàn)橛脩糇约禾峁┑闹R(shí)點(diǎn)往往具有較高的準(zhǔn)確性和針對(duì)性,同時(shí)可以不斷完善智能問答系統(tǒng)。
盡管為使解釋簡(jiǎn)單化將上述方法圖示并描述為一系列動(dòng)作,但是應(yīng)理解并領(lǐng)會(huì),這些方法不受動(dòng)作的次序所限,因?yàn)楦鶕?jù)一個(gè)或多個(gè)實(shí)施例,一些動(dòng)作可按不同次序發(fā)生和/或與來自本文中圖示和描述或本文中未圖示和描述但本領(lǐng)域技術(shù)人員可以理解的其他動(dòng)作并發(fā)地發(fā)生。
圖3是示出了根據(jù)本發(fā)明的一方面的信息處理系統(tǒng)300的框圖。
如圖3所示,信息處理系統(tǒng)300可包括知識(shí)庫301、分組模塊302、指派模塊303、知識(shí)制備模塊304、抽象語義數(shù)據(jù)庫305、匹配模塊306、以及輸出模塊307。
知識(shí)庫301中的知識(shí)可用于為用戶問句提供應(yīng)答。在本發(fā)明中,分組模塊302將知識(shí)庫301中的知識(shí)分組,以獲得多個(gè)知識(shí)集,每個(gè)知識(shí)集與一知識(shí)類別相關(guān)聯(lián)。指派模塊303為賬戶指派所述多個(gè)知識(shí)集中的至少一個(gè)知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
在一實(shí)例中,分組模塊302可為第一賬戶指派多個(gè)知識(shí)集中的第一預(yù)定數(shù)目個(gè)知識(shí)集,以及為第二賬戶指派多個(gè)知識(shí)集中的第二預(yù)定數(shù)目個(gè)知識(shí)集,該第一預(yù)定數(shù)目個(gè)知識(shí)集與該第二預(yù)定數(shù)目個(gè)知識(shí)集之間可具有公共的知識(shí)集。
在一實(shí)例中,知識(shí)制備模塊304可基于由用戶針對(duì)一賬戶提供的知識(shí)點(diǎn)制備用于該賬戶的自定義知識(shí)集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
往往不同的項(xiàng)目之間可能會(huì)用到相同的知識(shí),按照傳統(tǒng)方式,需要為每個(gè)項(xiàng)目部署獨(dú)立的知識(shí)庫,其中涉及大量知識(shí)的重復(fù)部署。在本發(fā)明中,通過將知識(shí)分為不同的知識(shí)類別的知識(shí)集,不同的項(xiàng)目可以使用公共的知識(shí)庫,只需要按需為之指派知識(shí)集即可,大大提高了效率。
具體而言,知識(shí)制備模塊304可為用戶提供的每一知識(shí)點(diǎn)建立該知識(shí)點(diǎn)的標(biāo)準(zhǔn)問,并進(jìn)一步為建立的標(biāo)準(zhǔn)問擴(kuò)展出若干擴(kuò)展問。擴(kuò)展問的生成可利用抽象語義數(shù)據(jù)庫305來完成。具體而言,知識(shí)制備模塊304可根據(jù)抽象語義數(shù)據(jù)庫305對(duì)標(biāo)準(zhǔn)問進(jìn)行抽象語義推薦處理,當(dāng)獲得與該標(biāo)準(zhǔn)問對(duì)應(yīng)的一個(gè)或多個(gè)抽象語義表達(dá)式時(shí),從該標(biāo)準(zhǔn)問中提取與一個(gè)或多個(gè)抽象語義表達(dá)式的缺失語義成分對(duì)應(yīng)的內(nèi)容,并將提取的內(nèi)容填充到對(duì)應(yīng)的缺失語義成分中以得到與該標(biāo)準(zhǔn)問對(duì)應(yīng)的一個(gè)或多個(gè)具體語義表達(dá)式。
針對(duì)來自預(yù)定賬戶的用戶問句,當(dāng)該預(yù)定賬戶有相關(guān)聯(lián)的自定義知識(shí)集時(shí),匹配模塊306首先利用其自定義知識(shí)集為該用戶問句執(zhí)行知識(shí)匹配以提供答案,若匹配失敗,則利用該用戶的所指派知識(shí)集為該用戶問句執(zhí)行知識(shí)匹配以提供答案。
在一實(shí)例中,匹配模塊306可包括語義相似度計(jì)算單元(圖中未示出),用于將該用戶問句與用于知識(shí)匹配的知識(shí)集中的問句執(zhí)行語義相似度計(jì)算,語義相似度高于閾值的問句中具有最高語義相似度的問句被確定為匹配問句。輸出模塊307將與該匹配問句相關(guān)聯(lián)的答案提供給用戶。
通過自定義知識(shí)集,改善了識(shí)別準(zhǔn)確率,因?yàn)橛脩糇约禾峁┑闹R(shí)點(diǎn)往往具有較高的準(zhǔn)確性和針對(duì)性,同時(shí)可以不斷完善智能問答系統(tǒng)。
本發(fā)明中信息處理系統(tǒng)的具體實(shí)現(xiàn)方式可參見信息處理方法實(shí)施例,在此不再贅述。
提供對(duì)本公開的先前描述是為使得本領(lǐng)域任何技術(shù)人員皆能夠制作或使用本公開。對(duì)本公開的各種修改對(duì)本領(lǐng)域技術(shù)人員來說都將是顯而易見的,且本文中所定義的普適原理可被應(yīng)用到其他變體而不會(huì)脫離本公開的精神或范圍。由此,本公開并非旨在被限定于本文中所描述的示例和設(shè)計(jì),而是應(yīng)被授予與本文中所公開的原理和新穎性特征相一致的最廣范圍。