專利名稱:人機(jī)接口系統(tǒng)知識(shí)庫(kù)及其構(gòu)建方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人機(jī)接口技術(shù)及自然語(yǔ)言處理領(lǐng)域,特別涉及人機(jī)接口系統(tǒng)知識(shí)庫(kù)及
其構(gòu)建方法。
背景技術(shù):
Jabberwacky和ALICEB0T等人機(jī)接口系統(tǒng),主要應(yīng)用于人機(jī)對(duì)話領(lǐng)域,通常稱為 聊天機(jī)器人(chatbot),聊天機(jī)器人主要旨在想方設(shè)法讓人與機(jī)器進(jìn)行對(duì)話。聊天機(jī)器人實(shí) 現(xiàn)與用戶對(duì)話的方法是將用戶的輸入與聊天機(jī)器人存儲(chǔ)的知識(shí)庫(kù)進(jìn)行規(guī)則匹配,再把匹配 結(jié)果立即返回給用戶。由于聊天機(jī)器人知識(shí)庫(kù)的匹配語(yǔ)句相當(dāng)廣泛,沒(méi)有對(duì)對(duì)話領(lǐng)域進(jìn)行 劃分,因此返回給用戶的對(duì)話內(nèi)容也相當(dāng)廣泛,很容易將用戶的注意力轉(zhuǎn)移到其他主題。
因此,有必要提供一種改進(jìn)的人機(jī)接口系統(tǒng)知識(shí)庫(kù)及其構(gòu)建方法來(lái)克服現(xiàn)有技術(shù) 的缺陷。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種人機(jī)接口系統(tǒng)知識(shí)庫(kù)及其構(gòu)建方法,能限定用戶與聊天 機(jī)器人的對(duì)話領(lǐng)域,。 為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種人機(jī)接口系統(tǒng)知識(shí)庫(kù)包括第一語(yǔ)料庫(kù)、第 二語(yǔ)料庫(kù)、返回語(yǔ)料提取單元、匹配處理單元以及反饋單元。所述第一語(yǔ)料庫(kù)用于存儲(chǔ)用 戶發(fā)起對(duì)話的語(yǔ)料;所述第二語(yǔ)料庫(kù)用于分領(lǐng)域存儲(chǔ)返回對(duì)話的語(yǔ)料;所述返回語(yǔ)料提取 單元與所述第二語(yǔ)料庫(kù)連接,用于根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,并將所 述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料發(fā)送至所述第二語(yǔ)料庫(kù);所述匹配處理單元與所述第一語(yǔ)料 庫(kù)和所述第二語(yǔ)料庫(kù)連接,用于將用戶發(fā)起對(duì)話的語(yǔ)料與所述第一語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹 配,獲取匹配的對(duì)話發(fā)起語(yǔ)料,并將所述對(duì)話發(fā)起語(yǔ)料與所述第二語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹 配,獲取匹配的對(duì)話返回語(yǔ)料;所述反饋單元與所述匹配處理單元連接,用于將所述匹配的 對(duì)話返回語(yǔ)料反饋給用戶。 在本發(fā)明的一個(gè)實(shí)施例中,所述人機(jī)接口系統(tǒng)知識(shí)庫(kù)還包括對(duì)話語(yǔ)料收集單元, 所述對(duì)話語(yǔ)料收集單元與所述第一語(yǔ)料庫(kù)連接,用于對(duì)用戶進(jìn)行對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì) 話發(fā)起語(yǔ)料,對(duì)使用頻率高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn)行形式化歸納,發(fā)送形式化 歸納后的對(duì)話發(fā)起語(yǔ)料至所述第一語(yǔ)料庫(kù)。 在本發(fā)明的另一實(shí)施例中,所述返回語(yǔ)料提取單元包括第一級(jí)返回語(yǔ)料提取單元
和第二級(jí)返回語(yǔ)料提取單元。所述第一級(jí)返回語(yǔ)料提取單元用于根據(jù)各領(lǐng)域知識(shí)文檔提取
對(duì)應(yīng)領(lǐng)域的句子;所述第二級(jí)返回語(yǔ)料提取單元與所述第一級(jí)返回語(yǔ)料提取單元和所述第
二語(yǔ)料庫(kù)連接,用于根據(jù)所述第一級(jí)返回語(yǔ)料提取單元提取的對(duì)應(yīng)領(lǐng)域的句子提取對(duì)應(yīng)領(lǐng)
域的單詞語(yǔ)料,并對(duì)所述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,發(fā)送形式化分類后
的單詞語(yǔ)料至所述第二語(yǔ)料庫(kù),所述形式化分類后的單詞語(yǔ)料為返回對(duì)話的語(yǔ)料。 在本發(fā)明的再一實(shí)施例中,所述形式化分類的類別為"名目"、"行為和動(dòng)作"、"修
4飾"、"方位與時(shí)間"以及"純語(yǔ)法",所述第二語(yǔ)料庫(kù)分類保存所述對(duì)應(yīng)領(lǐng)域的形式化分類后 的單詞語(yǔ)料。 在本發(fā)明的又一實(shí)施例中,所述人機(jī)接口系統(tǒng)知識(shí)庫(kù)還包括自然語(yǔ)言生成系統(tǒng), 所述自然語(yǔ)言生成系統(tǒng)與所述匹配處理單元以及所述反饋單元連接,用于將所述匹配的對(duì) 話返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言,并將所述轉(zhuǎn)換的結(jié)果反饋給用戶。 —種人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,包括如下步驟存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料; 根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料;分類存儲(chǔ)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,將 所述對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料作為返回對(duì)話的語(yǔ)料;將用戶發(fā)起對(duì)話的語(yǔ)料與所述存儲(chǔ)的用戶 發(fā)起對(duì)話的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話發(fā)起語(yǔ)料,并將所述對(duì)話發(fā)起語(yǔ)料與所述存儲(chǔ) 的返回對(duì)話語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話返回語(yǔ)料;將所述匹配的對(duì)話返回語(yǔ)料反饋給 用戶。 在本發(fā)明的一個(gè)實(shí)施例中,所述人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法還包括對(duì)用戶進(jìn) 行對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì)話發(fā)起語(yǔ)料,對(duì)使用頻率高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn) 行形式化歸納。所述存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料的步驟具體為存儲(chǔ)形式化歸納后的對(duì)話發(fā) 起語(yǔ)料。 在本發(fā)明的另一實(shí)施例中,所述根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料的 步驟具體為根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的句子;根據(jù)提取的對(duì)應(yīng)領(lǐng)域的句子提取 對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料;對(duì)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,所述形式化分類后 的單詞語(yǔ)料為返回對(duì)話的語(yǔ)料。 在本發(fā)明的再一實(shí)施例中,所述對(duì)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類的 步驟具體為根據(jù)"名目"、"行為和動(dòng)作"、"修飾"、"方位與時(shí)間"以及"純語(yǔ)法"類別對(duì)提取 的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類。所述存儲(chǔ)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料的步驟具體 為分類保存所述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞語(yǔ)料。 在本發(fā)明的又一實(shí)施例中,所述將所述匹配的對(duì)話返回語(yǔ)料反饋給用戶的步驟具 體為將所述匹配的對(duì)話返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言;將所述轉(zhuǎn)換的結(jié)果反饋給用戶。
與現(xiàn)有技術(shù)相比,本發(fā)明人機(jī)接口系統(tǒng)知識(shí)庫(kù)的第二語(yǔ)料庫(kù)是分領(lǐng)域的,所以用 戶與聊天機(jī)器人對(duì)話時(shí)具有專一性,能將對(duì)話話題控制在一個(gè)較為專門的領(lǐng)域內(nèi),從而盡 可能地將領(lǐng)域內(nèi)的專業(yè)知識(shí)點(diǎn)通過(guò)對(duì)話的形式傳遞給用戶。 另外,本發(fā)明人機(jī)接口系統(tǒng)知識(shí)庫(kù)通過(guò)第一語(yǔ)料庫(kù)建立知識(shí)的形式,通過(guò)第二語(yǔ)
料庫(kù)建立知識(shí)的內(nèi)容,兩個(gè)語(yǔ)料庫(kù)共同形成知識(shí)庫(kù),達(dá)到形式與內(nèi)容相分離。 通過(guò)以下的描述并結(jié)合附圖,本發(fā)明將變得更加清晰,這些附圖用于解釋本發(fā)明
的實(shí)施例。
圖1為本發(fā)明人機(jī)接口系統(tǒng)知識(shí)庫(kù)的結(jié)構(gòu)框圖。
圖2為本發(fā)明人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法的流程圖。
具體實(shí)施例方式
現(xiàn)在參考附圖描述本發(fā)明的實(shí)施例,附圖中類似的元件標(biāo)號(hào)代表類似的元件。
5
本實(shí)施例人機(jī)接口系統(tǒng)知識(shí)庫(kù)包括第一語(yǔ)料庫(kù)20、對(duì)話語(yǔ)料收集單元10、第二語(yǔ) 料庫(kù)30、返回語(yǔ)料提取單元40、匹配處理單元50、反饋單元70以及自然語(yǔ)言生成系統(tǒng)60。
所述第一語(yǔ)料庫(kù)20,用于存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料; 所述對(duì)話語(yǔ)料收集單元10,與所述第一語(yǔ)料庫(kù)20連接,用于通過(guò)聊天工具例如聊
天機(jī)器人平臺(tái)、常問(wèn)問(wèn)題(FAQ,F(xiàn)requently asked question)、用戶問(wèn)巻等形式對(duì)用戶進(jìn)行
對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì)話發(fā)起語(yǔ)料,對(duì)使用頻率高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn)行
形式化歸納,發(fā)送形式化歸納后的對(duì)話發(fā)起語(yǔ)料至所述第一語(yǔ)料庫(kù)20。其中,對(duì)用戶進(jìn)行實(shí)
驗(yàn)時(shí),試驗(yàn)的人數(shù)越多,保留的對(duì)話語(yǔ)料越多,后面匹配的成功率就越高。 所述第二語(yǔ)料庫(kù)30,用于分領(lǐng)域存儲(chǔ)返回對(duì)話的語(yǔ)料。 所述返回語(yǔ)料提取單元40,與所述第二語(yǔ)料庫(kù)30連接,用于根據(jù)各領(lǐng)域知識(shí)文 檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,并將所述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料發(fā)送至所述第二語(yǔ)料庫(kù)
30 ; 其中,所述返回語(yǔ)料提取單元40包括第一級(jí)返回語(yǔ)料提取單元和第二級(jí)返回語(yǔ) 料提取單元。第一級(jí)返回語(yǔ)料提取單元用于根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的句子;第 二級(jí)返回語(yǔ)料提取單元與所述第一級(jí)返回語(yǔ)料提取單元和所述第二語(yǔ)料庫(kù)30連接,用于 根據(jù)所述第一級(jí)返回語(yǔ)料提取單元提取的對(duì)應(yīng)領(lǐng)域的句子提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,并對(duì) 所述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,發(fā)送形式化分類后的單詞語(yǔ)料至所述第 二語(yǔ)料庫(kù)30,所述形式化分類后的單詞語(yǔ)料為返回對(duì)話的語(yǔ)料。其中,所述形式化分類是給 提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料添加附加信息頭字符。 由上可知,所述返回語(yǔ)料提取單元40將各領(lǐng)域知識(shí)文檔的成篇描述化整為零變 成對(duì)話的句子,再化整為零,將句子中符合上述分類的單詞語(yǔ)料提取出來(lái),并且進(jìn)行形式化 分類,然后發(fā)送到所述第二語(yǔ)料庫(kù)30中存儲(chǔ)。 其中,所述形式化分類的類別為"名目"、"行為和動(dòng)作"、"修飾"、"方位與時(shí)間"以 及"純語(yǔ)法",所述第二語(yǔ)料庫(kù)30分類保存所述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞語(yǔ)料。
所述匹配處理單元50與所述第一語(yǔ)料庫(kù)20和所述第二語(yǔ)料庫(kù)30連接,用于將 用戶發(fā)起對(duì)話的語(yǔ)料與所述第一語(yǔ)料庫(kù)20中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話發(fā)起語(yǔ)料, 并將所述對(duì)話發(fā)起語(yǔ)料與所述第二語(yǔ)料庫(kù)30中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話返回語(yǔ) 料。所述匹配處理單元50通過(guò)XML(Extensible MarkupLanguage,可擴(kuò)展標(biāo)記語(yǔ)言)以及 RegExp (Regular Expression,正則表達(dá)式)建立匹配規(guī)則,并基于所述建立的匹配規(guī)則進(jìn) 行匹配。 所述自然語(yǔ)言生成系統(tǒng)60與所述匹配處理單元50連接,用于將所述匹配的對(duì)話
返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言,并將所述轉(zhuǎn)換的結(jié)果發(fā)送至所述反饋單元70。 所述反饋單元70與所述自然語(yǔ)言生成系統(tǒng)60連接,用于將所述自然語(yǔ)言生成系
統(tǒng)60轉(zhuǎn)換的結(jié)果反饋給用戶。 由上可知,本發(fā)明人機(jī)接口系統(tǒng)知識(shí)庫(kù)采用兩個(gè)分離的語(yǔ)料庫(kù)-第一語(yǔ)料庫(kù)和第 二語(yǔ)料庫(kù)分別存儲(chǔ)發(fā)起對(duì)話的形式語(yǔ)料(對(duì)話發(fā)起語(yǔ)料)和對(duì)話過(guò)程所蘊(yùn)含知識(shí)的內(nèi)容 (對(duì)話返回語(yǔ)料)。具體地,本發(fā)明通過(guò)第一語(yǔ)料庫(kù)20建立知識(shí)表達(dá)的形式,通過(guò)第二語(yǔ)料 庫(kù)30建立知識(shí)的內(nèi)容,兩個(gè)語(yǔ)料庫(kù)共同形成知識(shí)庫(kù),達(dá)到形式與內(nèi)容相分離。
另外,本系統(tǒng)知識(shí)庫(kù)的第二語(yǔ)料庫(kù)30是分領(lǐng)域的,所以用戶與聊天機(jī)器人對(duì)話時(shí)
6具有專一性,能將對(duì)話話題控制在一個(gè)較為專門的領(lǐng)域內(nèi),從而盡可能地將領(lǐng)域內(nèi)的專業(yè)
知識(shí)點(diǎn)通過(guò)對(duì)話的形式傳遞給用戶??梢岳斫獾?,本發(fā)明建立的知識(shí)庫(kù)可以快速開發(fā)各種
應(yīng)用,例如問(wèn)答學(xué)習(xí)系統(tǒng)、廣告推介系統(tǒng)等。不同于一般的聊天機(jī)器人,該發(fā)明生成的知
識(shí)庫(kù)僅適用于一個(gè)專門的領(lǐng)域,只針對(duì)專門的主題,因此,用戶無(wú)法將注意力分散到其他地
方,防止了用戶由學(xué)習(xí)知識(shí)變成了無(wú)目的的閑聊。而且,由于知識(shí)庫(kù)的內(nèi)容分領(lǐng)域搜集,因
此,不同領(lǐng)域的知識(shí)可以后期不斷添加。因此,該知識(shí)庫(kù)模型具有可擴(kuò)充性。
如圖2所示,一種人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法包括如下步驟 步驟S10,通過(guò)聊天工具例如聊天機(jī)器人平臺(tái)、常問(wèn)問(wèn)題(FAQ, Frequentlyasked
question)、用戶問(wèn)巻等形式對(duì)用戶進(jìn)行對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì)話發(fā)起語(yǔ)料,對(duì)使用頻率
高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn)行形式化歸納; 步驟S20,存儲(chǔ)形式化歸納后的對(duì)話發(fā)起語(yǔ)料; 步驟S30,根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的句子; 步驟S40,根據(jù)提取的對(duì)應(yīng)領(lǐng)域的句子提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料; 步驟S50,根據(jù)"名目"、"行為和動(dòng)作"、"修飾"、"方位與時(shí)間"以及"純語(yǔ)法"類別
對(duì)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,保存所述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞
語(yǔ)料,將所述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞語(yǔ)料作為返回對(duì)話的語(yǔ)料; 步驟S60,將用戶發(fā)起對(duì)話的語(yǔ)料與所述存儲(chǔ)的用戶發(fā)起對(duì)話的語(yǔ)料進(jìn)行匹配,獲
取匹配的對(duì)話發(fā)起語(yǔ)料,并將所述對(duì)話發(fā)起語(yǔ)料與所述存儲(chǔ)的返回對(duì)話語(yǔ)料進(jìn)行匹配,獲
取匹配的對(duì)話返回語(yǔ)料; 步驟S70,將所述匹配的對(duì)話返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言,即基于第一語(yǔ)料庫(kù)中的對(duì) 話形式和在第二語(yǔ)料庫(kù)中匹配的知識(shí)內(nèi)容構(gòu)造自然語(yǔ)句;
步驟S80,將所述轉(zhuǎn)換的結(jié)果反饋給用戶。 以上結(jié)合最佳實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,但本發(fā)明并不局限于以上揭示的實(shí)施 例,而應(yīng)當(dāng)涵蓋各種根據(jù)本發(fā)明的本質(zhì)進(jìn)行的修改、等效組合。
權(quán)利要求
一種人機(jī)接口系統(tǒng)知識(shí)庫(kù),包括第一語(yǔ)料庫(kù),用于存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料;第二語(yǔ)料庫(kù),用于分領(lǐng)域存儲(chǔ)返回對(duì)話的語(yǔ)料;返回語(yǔ)料提取單元,與所述第二語(yǔ)料庫(kù)連接,用于根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,并將所述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料發(fā)送至所述第二語(yǔ)料庫(kù);匹配處理單元,與所述第一語(yǔ)料庫(kù)和所述第二語(yǔ)料庫(kù)連接,用于將用戶發(fā)起對(duì)話的語(yǔ)料與所述第一語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話發(fā)起語(yǔ)料,并將所述對(duì)話發(fā)起語(yǔ)料與所述第二語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話返回語(yǔ)料;以及反饋單元,與所述匹配處理單元連接,用于將所述匹配的對(duì)話返回語(yǔ)料反饋給用戶。
2. 如權(quán)利要求1所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù),其特征在于,還包括 對(duì)話語(yǔ)料收集單元,與所述第一語(yǔ)料庫(kù)連接,用于對(duì)用戶進(jìn)行對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì)話發(fā)起語(yǔ)料,對(duì)使用頻率高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn)行形式化歸納,發(fā)送形式化 歸納后的對(duì)話發(fā)起語(yǔ)料至所述第一語(yǔ)料庫(kù)。
3. 如權(quán)利要求1所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù),其特征在于,所述返回語(yǔ)料提取單元包括第一級(jí)返回語(yǔ)料提取單元,用于根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的句子; 第二級(jí)返回語(yǔ)料提取單元,與所述第一級(jí)返回語(yǔ)料提取單元和所述第二語(yǔ)料庫(kù)連接, 用于根據(jù)所述第一級(jí)返回語(yǔ)料提取單元提取的對(duì)應(yīng)領(lǐng)域的句子提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料, 并對(duì)所述提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,發(fā)送形式化分類后的單詞語(yǔ)料至所 述第二語(yǔ)料庫(kù),所述形式化分類后的單詞語(yǔ)料為返回對(duì)話的語(yǔ)料。
4. 如權(quán)利要求3所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù),其特征在于,所述形式化分類的類別為 "名目"、"行為和動(dòng)作"、"修飾"、"方位與時(shí)間"以及"純語(yǔ)法",所述第二語(yǔ)料庫(kù)分類保存所 述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞語(yǔ)料。
5. 如權(quán)利要求1所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù),其特征在于,還包括 自然語(yǔ)言生成系統(tǒng),與所述匹配處理單元以及所述反饋單元連接,用于將所述匹配的對(duì)話返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言,并將所述轉(zhuǎn)換的結(jié)果反饋給用戶。
6. —種人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,包括如下步驟 存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料;根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料;分類存儲(chǔ)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,將所述對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料作為返回對(duì)話的語(yǔ)料;將用戶發(fā)起對(duì)話的語(yǔ)料與所述存儲(chǔ)的用戶發(fā)起對(duì)話的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話 發(fā)起語(yǔ)料,并將所述對(duì)話發(fā)起語(yǔ)料與所述存儲(chǔ)的返回對(duì)話語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話 返回語(yǔ)料;以及將所述匹配的對(duì)話返回語(yǔ)料反饋給用戶。
7. 如權(quán)利要求6所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,其特征在于,還包括 對(duì)用戶進(jìn)行對(duì)話實(shí)驗(yàn),收集實(shí)驗(yàn)的對(duì)話語(yǔ)料,對(duì)使用頻率高于規(guī)定閥值頻率的對(duì)話發(fā)起語(yǔ)料進(jìn)行形式化歸納,貝U,所述存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料的步驟具體為存儲(chǔ)形式化歸納后的對(duì)話發(fā)起語(yǔ)料。
8. 如權(quán)利要求6所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,其特征在于,所述根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料的步驟具體為 根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的句子; 根據(jù)提取的對(duì)應(yīng)領(lǐng)域的句子提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料;對(duì)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,所述形式化分類后的單詞語(yǔ)料為返回 對(duì)話的語(yǔ)料。
9. 如權(quán)利要求8所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,其特征在于,所述對(duì)提取的對(duì) 應(yīng)領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類的步驟具體為根據(jù)"名目"、"行為和動(dòng)作"、"修飾"、"方位與時(shí)間"以及"純語(yǔ)法"類別對(duì)提取的對(duì)應(yīng) 領(lǐng)域的單詞語(yǔ)料進(jìn)行形式化分類,貝U,所述存儲(chǔ)提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料的步驟具體為 分類保存所述對(duì)應(yīng)領(lǐng)域的形式化分類后的單詞語(yǔ)料。
10. 如權(quán)利要求6所述的人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法,其特征在于,所述將匹配的對(duì) 話返回語(yǔ)料反饋給用戶的步驟具體為將匹配的對(duì)話返回語(yǔ)料轉(zhuǎn)換成自然語(yǔ)言; 將所述轉(zhuǎn)換的結(jié)果反饋給用戶。
全文摘要
本發(fā)明公開了一種人機(jī)接口系統(tǒng)知識(shí)庫(kù),其中第一語(yǔ)料庫(kù)用于存儲(chǔ)用戶發(fā)起對(duì)話的語(yǔ)料;第二語(yǔ)料庫(kù)用于分領(lǐng)域存儲(chǔ)返回對(duì)話的語(yǔ)料;返回語(yǔ)料提取單元用于根據(jù)各領(lǐng)域知識(shí)文檔提取對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料,并將提取的對(duì)應(yīng)領(lǐng)域的單詞語(yǔ)料發(fā)送至第二語(yǔ)料庫(kù);匹配處理單元用于將用戶發(fā)起對(duì)話的語(yǔ)料與第一語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話發(fā)起語(yǔ)料,并將對(duì)話發(fā)起語(yǔ)料與第二語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行匹配,獲取匹配的對(duì)話返回語(yǔ)料;反饋單元用于將匹配的對(duì)話返回語(yǔ)料反饋給用戶。本發(fā)明能實(shí)現(xiàn)用戶與聊天機(jī)器人對(duì)話的專一性,將對(duì)話話題控制在一個(gè)較為專門的領(lǐng)域內(nèi),并且兩個(gè)語(yǔ)料庫(kù)共同形成知識(shí)庫(kù),達(dá)到形式與內(nèi)容相分離。本發(fā)明同時(shí)提供了一種人機(jī)接口系統(tǒng)知識(shí)庫(kù)構(gòu)建方法。
文檔編號(hào)G06F17/30GK101789008SQ20101010372
公開日2010年7月28日 申請(qǐng)日期2010年1月26日 優(yōu)先權(quán)日2010年1月26日
發(fā)明者毛雪濤 申請(qǐng)人:武漢理工大學(xué)