專利名稱:信息檢索系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索系統(tǒng)中所包含的裝置、應(yīng)用于信息檢索系統(tǒng)的 方法、以及存儲(chǔ)了程序的存儲(chǔ)介質(zhì)。
背景技術(shù):
隨著信息化社會(huì)的發(fā)展,從存在于網(wǎng)絡(luò)上的大量且多樣的信息中査 找必要信息的信息解析技術(shù)、信息檢索技術(shù)不限于信息產(chǎn)業(yè),而成為與 通信、媒介、廣告、內(nèi)容、流通等靈活應(yīng)用信息的所有產(chǎn)業(yè)強(qiáng)化競(jìng)爭(zhēng)力 直接聯(lián)系的重要課題。
作為檢索存在于網(wǎng)絡(luò)上的信息的信息解析/信息檢索系統(tǒng),例如,谷
歌(Google,注冊(cè)商標(biāo))和雅虎(Yahoo,注冊(cè)商標(biāo))等各種系統(tǒng)已經(jīng)實(shí) 用化。
在這些信息解析/信息檢索系統(tǒng)中, 一般從所輸入的關(guān)鍵字的命中件 數(shù)多的信息開始從上到下順序介紹。因此,用戶為了檢索希望的信息, 需要正確地輸入信息關(guān)鍵字,但是,有時(shí)不清楚輸入什么樣的關(guān)鍵字更 好。
因此,作為解決這種課題的技術(shù),例如考慮采用關(guān)鍵字自動(dòng)擴(kuò)展技 術(shù)和推薦系統(tǒng)等,其中,該關(guān)鍵字自動(dòng)擴(kuò)展技術(shù)顯示與輸入關(guān)鍵字一起 使用的關(guān)鍵字,該推薦系統(tǒng)根據(jù)大多數(shù)用戶口頭相傳的信息來例如介紹 商品。
但是,上述這種技術(shù)介紹大多數(shù)用戶推薦的代表性的信息,不一定 能介紹各個(gè)用戶的個(gè)性化的具體信息。
因此,提出了如下的信息解析/信息檢索技術(shù)其能夠與用戶之間相
互對(duì)話,在該對(duì)話中反復(fù)進(jìn)行逐漸深入的詢問,由此提取出用戶真正希 望的需要和價(jià)值觀,來檢索該用戶潛在意向的信息。這里所謂的潛在意
11向是指,人自身沒有明確地意識(shí)到,也無法明確地對(duì)他人進(jìn)行說明,但 是卻模糊地存在著的希望、要求或期待,也可稱為潛在要求或真正的希 望。
如上所述,在對(duì)用戶的潛在意向進(jìn)行解析來檢索與該潛在意向?qū)?yīng) 的信息的系統(tǒng)中,需要從與用戶相互的對(duì)話中,正確地提取與系統(tǒng)的屬 性信息相匹配的用戶潛在意向信息。
在日本特開2003-036271號(hào)公報(bào)中記載了涉及對(duì)話型信息檢索方法 的技術(shù),在該方法中,蓄積具有由多個(gè)屬性及其屬性值構(gòu)成的數(shù)據(jù)結(jié)構(gòu) 的數(shù)據(jù),輸入用戶希望取得的目標(biāo)屬性、用于縮小數(shù)據(jù)范圍的關(guān)鍵屬性、 以及關(guān)鍵屬性的屬性值,使用關(guān)鍵屬性和關(guān)鍵屬性的屬性值來檢索目標(biāo) 屬性的屬性值,輸出檢索結(jié)果。
而且,日本特開2003-036271號(hào)公報(bào)記載的技術(shù)在檢索目標(biāo)屬性的 屬性值之前,根據(jù)所輸入的關(guān)鍵屬性和關(guān)鍵屬性的屬性值,計(jì)算目標(biāo)屬 性的屬性值的分布程度,進(jìn)行控制以使僅在分布程度收斂于規(guī)定范圍內(nèi) 的情況下輸出檢索結(jié)果。
但是,在現(xiàn)在提出的信息解析/信息檢索技術(shù)中,從與用戶的對(duì)話中 提取用戶的潛在意向,所以,需要反映與用戶之間的對(duì)話結(jié)果和檢索對(duì) 象數(shù)據(jù)之間的匹配結(jié)果,來決定之后應(yīng)該提問什么樣的內(nèi)容(屬性)。
但是,日本特開2003-036271號(hào)公報(bào)記載的技術(shù)在檢索目標(biāo)屬性的 屬性值之前,計(jì)算目標(biāo)屬性的屬性值的分布程度,所以,雖然在檢索前 進(jìn)行某種程度的縮小輸入條件,但是,由于不參照關(guān)鍵屬性的屬性值和 目標(biāo)屬性的屬性值之間的匹配結(jié)果,所以,無法將匹配結(jié)果反映給之后 的提問。其結(jié)果是,產(chǎn)生在對(duì)話中無法推薦不匹配的其他屬性(檢索對(duì) 象數(shù)據(jù))的問題。并且,產(chǎn)生無法考慮針對(duì)某個(gè)屬性的用戶的優(yōu)先級(jí)和 決斷狀況的問題。
因此,尋求如下的信息檢索裝置、方法以及程序匹配管理裝置能 夠在與用戶的對(duì)話中,準(zhǔn)確地判斷用戶的優(yōu)先級(jí)和當(dāng)前的匹配狀況,取 得最佳的匹配結(jié)果,能夠參照該匹配結(jié)果,獲得準(zhǔn)確的檢索結(jié)果。
在日本特開2000-276487號(hào)公報(bào)中記載了現(xiàn)有的關(guān)于對(duì)話型信息檢索系統(tǒng)的技術(shù)。在日本特開2000-276487號(hào)公報(bào)中記載了如下技術(shù)當(dāng)對(duì) 話次數(shù)變多時(shí),縮小范圍所需要的時(shí)間變多,且誤識(shí)別變多,所以對(duì)對(duì) 話次數(shù)進(jìn)行優(yōu)化。
但是,現(xiàn)在提出的信息解析/信息檢索技術(shù)如上所述,以檢索用戶潛 在意向的信息為目的,所以需要探聽出用戶本來潛在意向的內(nèi)容。
該情況下,如果僅從用戶探聽出信息檢索所需要的信息,則無法探 出本來的用戶潛在意向。例如,在某人和與其會(huì)話的人之間建立了信賴 關(guān)系的情況下,某人才說出心里話。并且,當(dāng)在展開會(huì)話的過程中換到 其他話題時(shí),才會(huì)坦率地說出之前話題的潛在意向。
為了在上述系統(tǒng)中進(jìn)行這種行動(dòng),在與用戶的對(duì)話中存在如下問題
如何進(jìn)行對(duì)話?提出什么樣的話題?與用戶之間如何形成信賴感和安全 感?
因此,尋求如下的對(duì)話管理裝置、方法、程序、以及潛在意向提取
系統(tǒng)能夠在用戶和系統(tǒng)之間順暢地展開對(duì)話,且能夠在展開對(duì)話的過
程中,給用戶帶來安全感和信賴感,由此提取用戶本來的潛在意向。
在日本特開2000-276487號(hào)公報(bào)中記載了如下技術(shù)蓄積過去發(fā)生 的事例,從所蓄積的事例中檢索與本次發(fā)生的事例類似的事例。
但是,上述日本特開2000-276487號(hào)公報(bào)記載的技術(shù)參照區(qū)域本體 (ontology),根據(jù)事例語句的類似度進(jìn)行聚類(cluster)并蓄積事例語句, 求出與所輸入的檢索語句類似的事例語句的類似度,根據(jù)該類似度來檢 索聚類后的類似的事例語句。其中,在該區(qū)域本體中存儲(chǔ)有蓄積事例和 與存在于作為檢索對(duì)象的區(qū)域中的術(shù)語和術(shù)語之間的關(guān)系有關(guān)的知識(shí)。
艮卩,在上述日本特開2000-276487號(hào)公報(bào)記載的技術(shù)中,僅公開了
一種從所蓄積的過去的事例語句中檢索與當(dāng)前的檢索語句類似的事例語 句的方法,所以,在從與用戶展開的豐富多彩的對(duì)話中進(jìn)行信息提取的 情況下,產(chǎn)生無法進(jìn)行適當(dāng)?shù)男畔⑻崛〉膯栴}。
因此,尋求能夠從與用戶展開的豐富多彩的對(duì)話中提取適當(dāng)信息的 信息挺取裝置、方法以及程序。
以往,作為對(duì)人類的發(fā)話(speech)進(jìn)行解析來識(shí)別(提取)謂語和與其對(duì)應(yīng)的語格要素并使用他們進(jìn)行應(yīng)答的裝置,有日本特開
2007-206888號(hào)公報(bào)記載的應(yīng)答生成裝置。在該現(xiàn)有裝置中,針對(duì)用戶的 發(fā)話"……制作了居室的全部,包括餐具柜等。",實(shí)現(xiàn)系統(tǒng)(裝置)的 發(fā)話"制作了餐具柜?"這樣的應(yīng)答。在日本特開2007-206888號(hào)公報(bào)記 載的裝置中,系統(tǒng)的發(fā)話候選準(zhǔn)備多個(gè),所以,能夠隨機(jī)選擇,或者(針 對(duì)根據(jù)發(fā)話候選的生成方法而分類的組)自由設(shè)定優(yōu)先級(jí)來選擇。此外, 這里所謂的"發(fā)話"不僅包括用戶發(fā)出聲音進(jìn)行交談,還包括從鍵盤的 輸入。可以是通過麥克風(fēng)等輸入單元所輸入的用戶說出的語句,或是用 戶通過鍵盤等輸入單元輸入的語句、自然語言(用戶所說的完整的語句) 以及書面語言(由用戶輸入的不完整的語句)中的任一種。對(duì)于"對(duì)話"、 "回答"等也同樣,涵蓋了用戶發(fā)聲的交談以及鍵盤輸入式的對(duì)話和回 答等。
但是,作為對(duì)話型的信息檢索裝置,專利申請(qǐng)人研究、開發(fā)了階梯 (laddering)型檢索裝置。即,研究、開發(fā)了如下裝置該裝置在與用戶 的對(duì)話中,反復(fù)進(jìn)行逐漸深入的詢問,由此引出用戶的需要和價(jià)值觀, 來查找出與所引出的信息相匹配的服務(wù)和內(nèi)容等。為了適當(dāng)?shù)匾鲇脩?的需要和價(jià)值觀,要求利用自然的對(duì)話使用戶抱有親近感(親切感)。
但是,上述現(xiàn)有裝置是識(shí)別(提取)謂語和與其對(duì)應(yīng)的語格要素并 使用他們進(jìn)行應(yīng)答的方法,應(yīng)答的生成方法是限制性的,無法有效地表 現(xiàn)出親近感。
并且,在現(xiàn)有裝置中,謂語和語格要素僅保留中心語,在應(yīng)答中不 使用修飾語句。與謂語組合的語格要素在一個(gè)候選中僅使用一個(gè)。因此, 無法充分地保證對(duì)話的自然性。
并且,在階梯型檢索裝置中,準(zhǔn)備幾個(gè)以獲得來自用戶的信息為目 的的發(fā)話(對(duì)用戶詢問的類別),需要系統(tǒng)主導(dǎo)性地改變?cè)掝},但是,在 現(xiàn)有裝置中,來自系統(tǒng)的發(fā)話是"對(duì)來自用戶的發(fā)話進(jìn)行承接的應(yīng)答" 或"單純的附和",對(duì)怎樣使系統(tǒng)主導(dǎo)性地改變?cè)掝}沒有公開也未給出啟 示。
并且,在現(xiàn)有裝置中,僅利用用戶使用過的詞匯,應(yīng)答變得單調(diào)。
14并且,在現(xiàn)有裝置中,當(dāng)既不存在謂語也不存在語格要素時(shí),單獨(dú) 出現(xiàn)單純的附和("噢"或"真的?"),親近感的表現(xiàn)并不強(qiáng)烈。
因此,尋求能夠充分地表現(xiàn)出對(duì)人的親近感并能夠?qū)崿F(xiàn)自然的對(duì)話 (應(yīng)答)的對(duì)話系統(tǒng)、方法以及程序。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)方式涉及信息檢索裝置、方法以及存儲(chǔ)了程序的存儲(chǔ) 介質(zhì),例如可以應(yīng)用于在對(duì)話型的信息檢索系統(tǒng)中,利用匹配結(jié)果來決 定與之后進(jìn)行的對(duì)話有關(guān)的應(yīng)答的信息檢索裝置、方法以及存儲(chǔ)了程序 的存儲(chǔ)介質(zhì)。
本發(fā)明的一個(gè)方式涉及對(duì)話管理裝置、方法、存儲(chǔ)了程序的存儲(chǔ)介 質(zhì)以及潛在意向提取系統(tǒng),例如可以應(yīng)用于在信息檢索系統(tǒng)中,從用戶 和系統(tǒng)的對(duì)話中提取用戶潛在意向的對(duì)話管理裝置、方法、存儲(chǔ)了程序 的存儲(chǔ)介質(zhì)以及潛在意向提取系統(tǒng)。
本發(fā)明的一個(gè)方式涉及信息提取裝置、方法以及存儲(chǔ)了程序的存儲(chǔ) 介質(zhì),例如可以應(yīng)用于在信息檢索系統(tǒng)中,從輸入信息中提取規(guī)定的信 息的信息提取系統(tǒng)。
本發(fā)明的一個(gè)方式涉及對(duì)話系統(tǒng)、方法以及程序,例如可以應(yīng)用于 對(duì)話型的信息檢索系統(tǒng)。
本發(fā)明的第1方式是一種信息檢索裝置,該信息檢索裝置包含
用戶發(fā)話解析單元,其通過與用戶的對(duì)話,針對(duì)多個(gè)屬性分別向用 戶提出提問語句,根據(jù)用戶針對(duì)該提問語句的回答語句,對(duì)針對(duì)各個(gè)所 述屬性的屬性值進(jìn)行解析;
用戶數(shù)據(jù)保持單元,其保持用戶數(shù)據(jù),作為所述用戶發(fā)話解析單元 的解析結(jié)果,在所述用戶數(shù)據(jù)中將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的
用戶的屬性值對(duì)應(yīng)起來;
匹配單元,其參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答 得到的所述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù) 中選出與該用戶數(shù)據(jù)的各個(gè)所述屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象數(shù)據(jù)候選;以及
對(duì)話控制單元,其向用戶側(cè)輸出由所述匹配單元選出的各個(gè)所述對(duì) 象數(shù)據(jù)候選。
本發(fā)明的第2方式是一種信息檢索方法,該信息檢索方法包含
(a) 通過與用戶的對(duì)話,針對(duì)多個(gè)屬性分別向用戶提出提問語句,
根據(jù)用戶針對(duì)該提問語句的回答語句,對(duì)針對(duì)各個(gè)所述屬性的屬性值進(jìn)
行解析;
(b) 保持用戶數(shù)據(jù),作為(a)中的解析結(jié)果,在所述用戶數(shù)據(jù)中 將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的用戶的屬性值對(duì)應(yīng)起來;
(c) 參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答得到的所 述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù)中選出與 該用戶數(shù)據(jù)的所述各個(gè)屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象數(shù) 據(jù)候選;以及
(d) 向用戶側(cè)輸出在(c)中選出的各個(gè)所述對(duì)象數(shù)據(jù)候選。 本發(fā)明的第3方式是一種計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包
含可以使計(jì)算機(jī)執(zhí)行信息檢索指令的程序,其中,該指令包含
(a) 通過與用戶的對(duì)話,針對(duì)多個(gè)屬性分別向用戶提出提問語句, 根據(jù)用戶針對(duì)所述提問語句的回答語句,對(duì)針對(duì)各個(gè)所述屬性的屬性值 進(jìn)行解析;
(b) 保持將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的用戶的屬性值對(duì)應(yīng) 起來的用戶數(shù)據(jù),作為(a)中的解析結(jié)果;
(c) 參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答得到的所 述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù)中選出與 所述用戶數(shù)據(jù)的各個(gè)所述屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象 數(shù)據(jù)候選;以及
(d) 向用戶側(cè)輸出在(c)中選出的各個(gè)所述對(duì)象數(shù)據(jù)候選。 本發(fā)明的第4方式是一種對(duì)話管理裝置,該對(duì)話管理裝置包含 對(duì)話方案數(shù)據(jù)庫,其存儲(chǔ)多個(gè)對(duì)話方案;
方案選擇單元,其從所述對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元所請(qǐng)求的信息有關(guān)的對(duì)話方案;
應(yīng)答生成單元,其根據(jù)由所述方案選擇單元所選擇的所述對(duì)話方案, 生成與所述所請(qǐng)求的信息有關(guān)的應(yīng)答語句,將該應(yīng)答語句提供給用戶終 端;
行動(dòng)決定單元,其從回答語句解析單元接受屬性和針對(duì)所述屬性的 屬性值作為回答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì) 話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè) 所述對(duì)話方案決定之后的行動(dòng),其中,回答語句解析單元對(duì)針對(duì)所述應(yīng) 答語句的用戶回答語句進(jìn)行解析;以及
對(duì)話控制單元,其按照由所述行動(dòng)決定單元所決定的之后的行動(dòng), 進(jìn)行與用戶之間的對(duì)話控制。
本發(fā)明的第5方式是一種對(duì)話管理方法,該對(duì)話管理方法包含
(a) 從對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元所請(qǐng)求的信息有關(guān) 的對(duì)話方案;
(b) 根據(jù)在(a)中所選擇的所述對(duì)話方案,生成與所述所請(qǐng)求的 信息有關(guān)的應(yīng)答語句,將所述應(yīng)答語句提供給用戶終端;
(c) 從回答語句解析單元接受屬性和針對(duì)所述屬性的屬性值作為回 答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì)話方案數(shù)據(jù)庫 中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè)所述對(duì)話方案 決定之后的行動(dòng),其中,所述回答語句解析單元對(duì)針對(duì)所述應(yīng)答語句的 用戶回答語句進(jìn)行解析;以及
(d) 按照在(c)中所決定的之后的行動(dòng),進(jìn)行與用戶之間的對(duì)話 控制。'
本發(fā)明的第6方式是一種計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包 含可以使計(jì)算機(jī)執(zhí)行對(duì)話管理指令的程序,其中,該指令包含-
(a) 從對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元所請(qǐng)求的信息有關(guān) 的對(duì)話方案;
(b) 根據(jù)在(a)中所選擇的所述對(duì)話方案,生成與所述所請(qǐng)求的 信息有關(guān)的應(yīng)答語句,將所述應(yīng)答語句提供給用戶終端;(C)從對(duì)針對(duì)所述應(yīng)答語句的用戶回答語句進(jìn)行解析的回答語句解 析單元接受屬性和針對(duì)所述屬性的屬性值作為回答語句解析結(jié)果,根據(jù) 所述屬性和所述屬性值,從所述對(duì)話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的 至少一個(gè)所述對(duì)話方案,按照各個(gè)所述對(duì)話方案決定之后的行動(dòng);以及
(d)按照在(C)中所決定的之后的行動(dòng),進(jìn)行與用戶之間的對(duì)話控制。
本發(fā)明的第7方式是一種潛在意向提取系統(tǒng),其根據(jù)與用戶之間相
互的對(duì)話信息來提取用戶的潛在意向,該潛在意向提取系統(tǒng)包含
對(duì)話管理裝置,其對(duì)用戶的用戶終端提供應(yīng)答語句,接受針對(duì)所述
應(yīng)答語句的回答語句,按照規(guī)定的對(duì)話方案進(jìn)行與用戶的對(duì)話;
回答語句解析裝置,其對(duì)從所述用戶終端接受的用戶回答語句進(jìn)行
解析;以及
對(duì)話信息蓄積裝置,其按照每個(gè)用戶蓄積每個(gè)所述對(duì)話方案的對(duì)話
梓自
I B尼、,
其中,所述對(duì)話管理裝置包含 對(duì)話方案數(shù)據(jù)庫,其存儲(chǔ)多個(gè)對(duì)話方案;
方案選擇單元,其從所述對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元
所請(qǐng)求的信息有關(guān)的對(duì)話方案;
應(yīng)答生成單元,其根據(jù)由所述方案選擇單元所選擇的所述對(duì)話方案,
生成與所述所請(qǐng)求的信息有關(guān)的應(yīng)答語句,將該應(yīng)答語句提供給用戶終
午山 頓;
行動(dòng)決定單元,其從回答語句解析單元接受屬性和針對(duì)所述屬性的 屬性值作為回答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì) 話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè) 所述對(duì)話方案決定之后的行動(dòng),其中,回答語句解析單元對(duì)針對(duì)所述應(yīng) 答語句的用戶回答語句進(jìn)行解析;以及
對(duì)話控制單元,其按照由所述行動(dòng)決定單元所決定的之后的行動(dòng), 進(jìn)行與用戶之間的對(duì)話控制。
本發(fā)明的第8方式是一種信息提取裝置,該信息提取裝置包含知識(shí)數(shù)據(jù)庫,其系統(tǒng)地對(duì)多個(gè)領(lǐng)域的多個(gè)術(shù)語的關(guān)系進(jìn)行分類; 輸入單元,其取入輸入信息;
信息提取單元,當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性 時(shí),所述信息提取單元使用所述知識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域
的知識(shí),提取所述輸入信息中包含的針對(duì)所述屬性的屬性值;以及
提取信息存儲(chǔ)單元,其將由所述信息提取單元提取出的所述屬性和
該屬性的所述屬性值對(duì)應(yīng)起來進(jìn)行存儲(chǔ)。
本發(fā)明的第9方式是一種信息提取方法,該信息提取方法包含
(a) 取入輸入信息;
(b) 當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性時(shí),使用知 識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域的知識(shí),提取所述輸入信息中包含 的針對(duì)所述屬性的屬性值;以及
(c) 將在(b)中提取出的所述屬性和該屬性的所述屬性值對(duì)應(yīng)起 來進(jìn)行存儲(chǔ)。
本發(fā)明的第10方式是一種計(jì)寞機(jī)可讀取的存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包 含可以使計(jì)算機(jī)執(zhí)行信息提取指令的程序,其中,該指令包含
(a) 取入輸入信息;
(b) 當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性時(shí),使用知 識(shí)數(shù)據(jù)庫中的所述屬性的領(lǐng)域的知識(shí),提取所述輸入信息中包含的針對(duì) 所述屬性的屬性值;以及
(c) 將在(b)中所提取的所述屬性和所述屬性的所述屬性值對(duì)應(yīng) 起來進(jìn)行存儲(chǔ)。
本發(fā)明的第11方式是一種對(duì)話系統(tǒng),其在人和作為與人之間的界面 的裝置之間接收和發(fā)送自然語言語句的數(shù)據(jù),來進(jìn)行與人的對(duì)話,所述 對(duì)話系統(tǒng)包含
解析部,其對(duì)人的發(fā)話進(jìn)行解析;
對(duì)象部位認(rèn)定部,其利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提 取系統(tǒng)發(fā)話用的要素的對(duì)象部位;以及
提取部,其根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使系統(tǒng)發(fā)話成為適當(dāng)?shù)拈L(zhǎng)度。
本發(fā)明的第12方式是一種在對(duì)話系統(tǒng)和作為與人之間的界面裝置 之間接收和發(fā)送自然語言語句的數(shù)據(jù),來進(jìn)行與人的對(duì)話的對(duì)話方法,
所述對(duì)話系統(tǒng)包括解析部、對(duì)象部位認(rèn)定部、以及提取部,
所述對(duì)話方法包含
所述解析部對(duì)人類的發(fā)話進(jìn)行解析;
所述對(duì)象部位認(rèn)定部利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提 取系統(tǒng)發(fā)話用的要素的對(duì)象部位;以及
所述提取部根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使系統(tǒng) 發(fā)話成為適當(dāng)?shù)拈L(zhǎng)度。
本發(fā)明的第13方式是一種計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包
含可以使計(jì)算機(jī)執(zhí)行對(duì)話指令的程序,其中,該指令包含
對(duì)人的發(fā)話進(jìn)行解析;
利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提取所述計(jì)算機(jī)發(fā)話用
的要素的對(duì)象部位;以及
根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使所述計(jì)算機(jī)發(fā)話 成為適當(dāng)?shù)拈L(zhǎng)度。
根據(jù)本發(fā)明的第1方式 第3方式,在與用戶的對(duì)話中,能夠準(zhǔn)確
地判斷用戶優(yōu)先級(jí)和當(dāng)前的匹配狀況,能夠取得最佳的匹配結(jié)果,參照 該匹配結(jié)果,能夠獲得準(zhǔn)確的檢索結(jié)果。
根據(jù)本發(fā)明的第4 第7方式,在用戶和系統(tǒng)之間順利地展開對(duì)話, 在對(duì)話的擴(kuò)展中,給用戶帶來安心感和信賴感,能夠提取用戶本來的潛 在意向。
根據(jù)本發(fā)明的第8 第IO方式,能夠從與用戶之間展開的豐富多彩 的對(duì)話中提取適當(dāng)?shù)男畔ⅰ?br>
根據(jù)第11 第13方式的發(fā)明,根據(jù)人的發(fā)話中的表達(dá)等,來變更重
復(fù)回復(fù)中利用部位的選定和重復(fù)回復(fù)的長(zhǎng)度(詞語數(shù)量)等,所以,能 夠充分的表現(xiàn)出對(duì)人的親近感,能夠?qū)崿F(xiàn)自然的對(duì)話(應(yīng)答)。
圖1是示出本發(fā)明的第1實(shí)施方式的匹配管理裝置的內(nèi)部結(jié)構(gòu)的結(jié) 構(gòu)圖。
圖2是示出本發(fā)明的第1實(shí)施方式的階梯型檢索系統(tǒng)的整體結(jié)構(gòu)的 結(jié)構(gòu)圖。
圖3是示出本發(fā)明的第1實(shí)施方式的階梯檢索引擎的結(jié)構(gòu)的結(jié)構(gòu)圖。 圖4A和圖4B是示出本發(fā)明的第1實(shí)施方式的用戶數(shù)據(jù)的結(jié)構(gòu)的結(jié) 構(gòu)圖。
圖5A和圖5B是示出本發(fā)明的第1實(shí)施方式的對(duì)象數(shù)據(jù)的結(jié)構(gòu)的結(jié) 構(gòu)圖。
圖6A和圖6B是示出本發(fā)明的第1實(shí)施方式的領(lǐng)域知識(shí)的結(jié)構(gòu)的結(jié) 構(gòu)圖。
圖7是示出本發(fā)明的第1實(shí)施方式的匹配管理處理的流程圖。 圖8是示出本發(fā)明的第1實(shí)施方式的提問語句的顯示例的圖。 圖9是示出本發(fā)明的第1實(shí)施方式的提問語句的顯示例的圖。 圖10A到圖10C是說明本發(fā)明的第1實(shí)施方式的屬性判定規(guī)則的說 明圖。
圖11是在本發(fā)明的第1實(shí)施方式的提問語句的顯示例中顯示發(fā)話解 析和顯示匹配結(jié)果的顯示例的圖?!?br>
圖12是示出本發(fā)明的第2實(shí)施方式的對(duì)話控制單元的內(nèi)部結(jié)構(gòu)的結(jié)構(gòu)圖。
圖13是示出本發(fā)明的第2實(shí)施方式的對(duì)話控制單元的內(nèi)部結(jié)構(gòu)的結(jié) 構(gòu)圖。
圖14是示出本發(fā)明的第2實(shí)施方式的對(duì)話方案數(shù)據(jù)庫的結(jié)構(gòu)的結(jié)構(gòu)圖。
圖15A和圖15B是示出本發(fā)明的第2實(shí)施方式的對(duì)話控制處理的流 程圖。
圖16A和圖16B是示出本發(fā)明的第2實(shí)施方式的行動(dòng)決定處理的流 程圖。圖17是示出本發(fā)明的第2實(shí)施方式的對(duì)話語句的結(jié)構(gòu)例的圖。
圖18A和圖18B是示出本發(fā)明的第2實(shí)施方式的方案結(jié)構(gòu)的結(jié)構(gòu)圖。 圖19A和圖19B是示出本發(fā)明的第2實(shí)施方式的方案結(jié)構(gòu)的結(jié)構(gòu)圖。 圖20是說明本發(fā)明的第2實(shí)施方式的通過階梯對(duì)話引擎進(jìn)行的階梯
對(duì)話的概略過程的說明圖。
圖21A和圖21B是顯示在本發(fā)明的第2實(shí)施方式的用戶終端(瀏覽
器)上的顯示畫面例。.
圖22是示出本發(fā)明的第3實(shí)施方式的信息提取裝置的內(nèi)部結(jié)構(gòu)的結(jié)構(gòu)圖。
圖23A和圖23B是說明本發(fā)明的第3實(shí)施方式的本體的結(jié)構(gòu)的結(jié)構(gòu)圖。
圖24是示出本發(fā)明的第3實(shí)施方式的檢索對(duì)象數(shù)據(jù)的信息提取處理 的流程圖。
圖25A和圖25B是示出本發(fā)明的第3實(shí)施方式的檢索對(duì)象數(shù)據(jù)的結(jié) 構(gòu)例的圖。
圖26是示出本發(fā)明的第3實(shí)施方式的用戶輸入語句的信息提取處理 的流程圖。
圖27是示出本發(fā)明的第3實(shí)施方式的用戶輸入語句的結(jié)構(gòu)例的圖。 圖28是示出本發(fā)明的第3實(shí)施方式的屬性和所參照的本體之間的關(guān) 系的圖。
圖29是示出第4實(shí)施方式的對(duì)話系統(tǒng)的主要結(jié)構(gòu)的功能框圖。 圖30是示出第4實(shí)施方式的對(duì)話系統(tǒng)的動(dòng)作的流程圖。 圖31是示出針對(duì)用戶發(fā)話"人t接^《力56自分力;人間i Lt:成長(zhǎng)
c $ 3仕事力;L t ^ (想從事與人接觸同時(shí)能夠使自己作為社會(huì)人成長(zhǎng) 的工作)"的語素解析結(jié)果的說明圖。
圖32是示出針對(duì)用戶發(fā)話"人i接^《力、'6自分力;人間t ^t:成長(zhǎng) C昏3仕事力、'L t L、(想從事與人接觸同時(shí)能夠使自己作為社會(huì)人成長(zhǎng)
的工作)"的句法解析結(jié)果(句法樹)的說明圖。
圖33是示出第4實(shí)施方式的對(duì)象部位認(rèn)定部?jī)?nèi)置的認(rèn)定用特殊表現(xiàn)列表的說明圖。
圖34是示出第4實(shí)施方式的提取部?jī)?nèi)置的提取用特殊表現(xiàn)列表的說
明圖。.
圖35是示出第5實(shí)施方式的對(duì)話系統(tǒng)的主要結(jié)構(gòu)的功能框圖。 圖36是示出第6實(shí)施方式的對(duì)話系統(tǒng)的主要結(jié)構(gòu)的功能框圖。 圖37是示出第7實(shí)施方式的對(duì)話系統(tǒng)的主要結(jié)構(gòu)的功能框圖。 圖38是示出第8實(shí)施方式的對(duì)話系統(tǒng)的主要結(jié)構(gòu)的功能框圖。
具體實(shí)施方式
(A)第1實(shí)施方式
下面,參照附圖,詳細(xì)地說明本發(fā)明的信息檢索裝置、方法以及程 序的第1實(shí)施方式。
在第1實(shí)施方式中,例示出應(yīng)用于如下的信息解析/信息檢索系統(tǒng)的 情況該信息解析/信息檢索系統(tǒng)利用本發(fā)明的信息檢索裝置、方法以及 程序,_例如采用階梯型檢索服務(wù),從用戶潛在意向的信息和檢索對(duì)象信 息中提取規(guī)定的屬性和屬性值,檢索并介紹與用戶潛在意向的信息相匹 配的信息。這里所謂的潛在意向仍然是指,人自身沒有明確地意識(shí)到, 也無法明確地對(duì)他人進(jìn)行說明,但是卻模糊地存在著的希望、要求或期 待,也可稱為潛在要求或真正的希望。 (A-l)第l實(shí)施方式的結(jié)構(gòu) (A-l-l)階梯型檢索系統(tǒng)的整體結(jié)構(gòu)的說明
首先,以下參照
應(yīng)用本發(fā)明的信息檢索裝置、方法以及程 序的階梯型檢索系統(tǒng)的整體概況。
圖2是說明第1實(shí)施方式的階梯型檢索系統(tǒng)9的整體概況的整體概 況圖。并且,圖3是示出實(shí)現(xiàn)階梯型檢索系統(tǒng)9的階梯檢索引擎1的結(jié) 構(gòu)的結(jié)構(gòu)圖。
在圖2中,第1實(shí)施方式的階梯型檢索系統(tǒng)9構(gòu)成為具有具備階 梯對(duì)話引擎1的階梯型檢索服務(wù)站點(diǎn)3;提供各種服務(wù)的服務(wù)站點(diǎn)2(2-1 2-n: n為正整數(shù));以及存在于網(wǎng)絡(luò)上的Web信息4,三者能夠通過網(wǎng)絡(luò)連接在一起。
用戶界面(UI)單元90具有Web服務(wù)器901,該Web服務(wù)器901 能夠訪問用戶Ul操作的用戶終端(瀏覽器),并提供階梯型檢索服務(wù)。 并且,用戶界面(UI)單元90根據(jù)需要具有語音合成/識(shí)別部卯2,在來 自用戶U1的信息是語音信息的情況下,能夠利用語音實(shí)現(xiàn)對(duì)話。
階梯對(duì)話引擎1對(duì)用戶Ul提問,并解析用戶Ul針對(duì)該各問題的回 答,由此來進(jìn)行與用戶U1之間的對(duì)話,解析用戶Ul真正希望的潛在意 向。
并且,階梯對(duì)話引擎1取得服務(wù)站點(diǎn)2提供的信息或Web信息4作 為檢索對(duì)象信息,從這些服務(wù)站點(diǎn)2的信息或Web信息4中提取屬性和 與該屬性對(duì)應(yīng)的屬性值,檢索具有與來自用戶Ul的應(yīng)答信息對(duì)應(yīng)的屬性 值的信息,對(duì)用戶Ul介紹具有與用戶Ul的潛在意向?qū)?yīng)的屬性值的信 自
必o
這里,階梯(laddering)是指,在與對(duì)方的對(duì)話中,通過反復(fù)進(jìn)行 逐漸深入的詢問,來引出對(duì)方的需要和價(jià)值觀的手法。
作為階梯對(duì)話引擎1進(jìn)行的與用戶之間的對(duì)話的種類,例如可以應(yīng) 用如下的詢問類型等系統(tǒng)針對(duì)用戶使其回答"YES/NO"的形式、"從 選擇項(xiàng)中選擇"的形式的提問類型;使用戶自由回答的提問類型;同意 用戶的回答或改變說法由此來促使用戶自發(fā)發(fā)言的提問類型。
在圖2中,階梯對(duì)話引擎l具有知識(shí)獲得功能部12,其通過網(wǎng)絡(luò) 獲得用于從服務(wù)站點(diǎn)2或Web信息4中查找進(jìn)行對(duì)話用的信息或用戶Ul 的潛在意向的知識(shí)信息;以及術(shù)語知識(shí)/領(lǐng)域知識(shí)DB (數(shù)據(jù)庫)13,其 存儲(chǔ)由該知識(shí)獲得功能部12獲得的知識(shí)信息。
并且,階梯對(duì)話引擎1具有不同領(lǐng)域?qū)υ挿桨窪B 14,該不同領(lǐng)域 對(duì)話方案DB 14根據(jù)可以通過網(wǎng)絡(luò)連接的服務(wù)站點(diǎn)2的種類,按照各個(gè)
領(lǐng)域存儲(chǔ)進(jìn)行對(duì)話用的方案。
并且,階梯對(duì)話引擎l具有階梯對(duì)話控制功能部ll,該階梯對(duì)話控 制功能部11 一邊參照術(shù)語知識(shí)/領(lǐng)域知識(shí)DB 13和不同領(lǐng)域?qū)υ挿桨窪B 14, 一邊進(jìn)行與用戶U1之間的對(duì)話。此時(shí),階梯對(duì)話控制功能部11進(jìn)行"深入"、"改變說法"、"信息提 供"、"概括"等處理,其中,"深入"是指為了明確用戶的潛在意向而提 出更深入的問題,或者進(jìn)行用于確認(rèn)用戶的潛在意向的提問等的問話; "改變說法"是指對(duì)用戶的回答改變說法,或者進(jìn)行為了促動(dòng)用戶發(fā)言 而發(fā)出帶有感情色彩的問話;"信息提供"是指為了給用戶帶來滿足感和 期待感而對(duì)用戶提供各種信息;"概括"是指概括過去聽到的信息而再次 利用。
并且,階梯對(duì)話引擎1具有檢索對(duì)象分析功能部15,該檢索對(duì)象分 析功能部15根據(jù)各服務(wù)站點(diǎn)2的檢索對(duì)象數(shù)據(jù)21來分析檢索對(duì)象數(shù)據(jù), 階梯對(duì)話引擎1具有檢索對(duì)象分析結(jié)果DB 16,該檢索對(duì)象分析結(jié)果DB 16存儲(chǔ)經(jīng)該檢索對(duì)象分析功能部15分析的檢索對(duì)象分析結(jié)果。
階梯對(duì)話引擎1從檢索對(duì)象分析結(jié)果DB 16中,提取與經(jīng)階梯對(duì)話 控制功能部11解析的用戶Ul的回答解析結(jié)果(從用戶Ul引出的信息) 相匹配的信息,并把該匹配狀況提供給階梯對(duì)話控制功能部11。
各種服務(wù)站點(diǎn)2-l 2-ti是通過網(wǎng)絡(luò)對(duì)用戶提供各種信息的服務(wù)站 點(diǎn)。'
作為各種服務(wù)站點(diǎn)2-l 2-n,有各種各樣的企業(yè)/團(tuán)體等的服務(wù)領(lǐng)域 (service domain),例如有面向轉(zhuǎn)職者的職業(yè)介紹領(lǐng)域、住宅信息介紹領(lǐng) 域、各種購物站點(diǎn)的領(lǐng)域、旅行計(jì)劃/個(gè)人導(dǎo)航領(lǐng)域、廣播/電影等的內(nèi)容 產(chǎn)業(yè)領(lǐng)域等企業(yè)提供的領(lǐng)域站點(diǎn)(domain site);以及例如所謂的博客或 SNS (社會(huì)網(wǎng)絡(luò)站點(diǎn))等社區(qū)站點(diǎn);行政機(jī)關(guān)等領(lǐng)域站點(diǎn);調(diào)查/咨導(dǎo)(例 如醫(yī)療、保健、福利和問巻調(diào)查等)的企業(yè)/團(tuán)體提供的領(lǐng)域站點(diǎn)等。
Web信息4是存在于網(wǎng)絡(luò)上的Web信息,是階梯對(duì)話引擎1可以通 過網(wǎng)絡(luò)訪問的信息。
接著,參照?qǐng)D3說明階梯對(duì)話引擎1的內(nèi)部結(jié)構(gòu)。
在圖3中,階梯對(duì)話引擎l至少具有對(duì)話管理單元IO、匹配單元 20、匹配對(duì)象分析單元30、方案管理單元50、對(duì)譯結(jié)果概括單元60、領(lǐng) 域知識(shí)獲得單元70、用戶發(fā)話解析單元80以及用戶界面(UI)單元90。
對(duì)話管理單元10控制階梯對(duì)話引擎1中的處理。對(duì)話管理單元10對(duì)希望進(jìn)行檢索的用戶Ul反復(fù)提出各種問題,蓄積用戶對(duì)這些提問的回 答(對(duì)話內(nèi)容),并且,匯總該所蓄積的對(duì)話記錄,由此,引出用戶真正 潛在意向的信息,檢索與該潛在意向的信息相匹配的信息和內(nèi)容,向用 戶U1進(jìn)行介紹。
作為對(duì)話管理單元10的主要功能,至少具有對(duì)話控制部101,其 對(duì)用戶Ul提問,根據(jù)來自用戶Ul的回答的解析結(jié)果,進(jìn)行之后的對(duì)話,
來執(zhí)行對(duì)話控制;行動(dòng)決定部102,其根據(jù)對(duì)話涉及的方案對(duì)用戶Ul提 問,根據(jù)來自用戶U1的回答進(jìn)行方案的變更等;方案選擇部103,其針 對(duì)與用戶Ul的對(duì)話,從方案管理單元50中選擇沒有不諧調(diào)感的方案;
以及應(yīng)答生成部104,其根據(jù)由方案選擇部103選擇出的方案,生成針對(duì) 來自用戶Ul的回答的應(yīng)答語句。
匹配單元20從對(duì)話管理單元IO接受由對(duì)話管理單元IO解析的用戶 Ul的回答解析結(jié)果(從用戶Ul引出的信息),與從服務(wù)站點(diǎn)2取得的信 息進(jìn)行匹配。
作為匹配單元20的主要功能,至少具有分配器201,其對(duì)匹配器 202提供從對(duì)話控制部101接受的用戶Ul的回答解析結(jié)果,對(duì)領(lǐng)域知識(shí) 獲得單元70提供由匹配器202匹配的信息;匹配器202,其進(jìn)行對(duì)象數(shù) 據(jù)和個(gè)人登記數(shù)據(jù)之間的匹配處理、以及用戶Ul的回答解析結(jié)果和服務(wù) 站點(diǎn)2的檢索信息之間的匹配處理;以及設(shè)定器203,其根據(jù)用戶U1的 回答解析結(jié)果來決定從服務(wù)站點(diǎn)2檢索的對(duì)象。
匹配對(duì)象分析單元30將匹配對(duì)象數(shù)據(jù)(即與用于向用戶Ul提問的 屬性相關(guān)的信息)和個(gè)人登記數(shù)據(jù)轉(zhuǎn)換為規(guī)定的數(shù)據(jù)格式,并且,使用 對(duì)話結(jié)果和領(lǐng)域知識(shí)等,對(duì)該匹配對(duì)象數(shù)據(jù)和個(gè)人登記數(shù)據(jù)進(jìn)行擴(kuò)展處 理。 —
作為匹配對(duì)象分析單元30的主要功能,至少具有:對(duì)象數(shù)據(jù)DB 303, 其存儲(chǔ)表示屬性的匹配對(duì)象的對(duì)象數(shù)據(jù);個(gè)人登記數(shù)據(jù)DB304,其存儲(chǔ) 用戶U1的個(gè)人登記數(shù)據(jù);轉(zhuǎn)換器301,其將存儲(chǔ)在對(duì)象數(shù)據(jù)DB 303和 個(gè)人登記數(shù)據(jù)DB 304中的對(duì)象數(shù)據(jù)和個(gè)人登記數(shù)據(jù)轉(zhuǎn)換為規(guī)定的數(shù)據(jù) 格式;以及增強(qiáng)器302,其根據(jù)領(lǐng)域知識(shí)和對(duì)話結(jié)果的記錄信息,將由轉(zhuǎn)換器301轉(zhuǎn)換為規(guī)定數(shù)據(jù)格式后的數(shù)據(jù),轉(zhuǎn)換為擴(kuò)展為類似的數(shù)據(jù)或關(guān) 聯(lián)數(shù)據(jù)等的數(shù)據(jù)。
領(lǐng)域知識(shí)獲得單元70通過Web從服務(wù)站點(diǎn)2或其他Web信息4, 取得在服務(wù)站點(diǎn)2上提供的領(lǐng)域信息或知識(shí)信息。
領(lǐng)域知識(shí)獲得單元70具有領(lǐng)域知識(shí)編輯器701 ,其通過Web取得 與檢索對(duì)象的領(lǐng)域有關(guān)的領(lǐng)域知識(shí)信息(即術(shù)語),將該所取得的領(lǐng)域知 識(shí)信息(以下也簡(jiǎn)稱為領(lǐng)域知識(shí))提供給匹配對(duì)象分析單元30,并將其 轉(zhuǎn)換為規(guī)定的數(shù)據(jù)格式;以及領(lǐng)域知識(shí)DB702,其將被轉(zhuǎn)換為規(guī)定的數(shù) 據(jù)格式的領(lǐng)域知識(shí),存儲(chǔ)為系統(tǒng)的集合體(以下也稱為本體(ontology))。
方案管理單元50參照領(lǐng)域知識(shí)DB 702,生成各個(gè)領(lǐng)域的方案并進(jìn) 行管理。方案管理單元50具有方案編輯器501,該方案編輯器501參照 領(lǐng)域知識(shí)DB 702,生成用于與用戶U1之間進(jìn)行對(duì)話的方案,根據(jù)對(duì)話 管理單元10的行動(dòng)決定部102的控制,變更方案或進(jìn)行方案的編集。該 方案編輯器501能夠針對(duì)與用戶之間交互的對(duì)話方案,與匹配對(duì)象分析 單元30的增強(qiáng)器302協(xié)作,生成基于擴(kuò)展后內(nèi)容的對(duì)象數(shù)據(jù)的對(duì)話方案。 并且,通過方案選擇部103來選擇方案編輯器501生成的對(duì)話方案。
對(duì)話結(jié)果概括單元60具有記錄DB601,其存儲(chǔ)在系統(tǒng)和用戶U1 的對(duì)話中交換的記錄;記錄器602,其接受對(duì)話控制部IOI的控制,讀出 存儲(chǔ)在記錄DB601中的記錄信息,將其提供給對(duì)話控制部101;以及概 括器603,其使用擴(kuò)展/對(duì)象數(shù)據(jù)和擴(kuò)展/個(gè)人數(shù)據(jù),進(jìn)行針對(duì)用戶Ul的 回答的概括處理。
用戶發(fā)話解析單元80通過對(duì)話控制部101輸入用戶Ul的回答,根 據(jù)該所輸入的用戶Ul的回答信息,對(duì)用戶潛在意向的信息進(jìn)行解析。并 且,用戶發(fā)話解析單元80將解析后的用戶潛在意向的解析信息提供給對(duì) 話控制部101。
如圖3所示,作為用戶發(fā)話解析單元80的主要功能,至少具有潛 在意向解析部801、表達(dá)標(biāo)準(zhǔn)化部802、句法解析部803、語素解析部804、 辭典轉(zhuǎn)換器805、潛在意向解析用辭典806以及翻譯用辭典807。
潛在意向解析用辭典806存儲(chǔ)潛在意向解析所需要的各種信息。在圖3中,為了便于說明,示出潛在意向解析用辭典806為單一辭典的情
況,但是,潛在意向解析用辭典806有意地存儲(chǔ)潛在意向解析所需要的 信息,例如語素(對(duì)日語的語素也稱形態(tài)素)信息、句法信息、標(biāo)準(zhǔn)化 信息等。并且,翻譯用辭典807存儲(chǔ)翻譯信息。
辭典轉(zhuǎn)換器805參照翻譯用辭典807和潛在意向解析用辭典806, 根據(jù)需要對(duì)存儲(chǔ)在潛在意向解析用辭典806中的信息進(jìn)行翻譯處理。
語素解析部804從對(duì)話控制部101取得用戶Ul的應(yīng)答信息或服務(wù)站 點(diǎn)2等的檢索對(duì)象信息,參照潛在意向解析用辭典,對(duì)這些用戶U1的應(yīng) 答信息或服務(wù)站點(diǎn)2等的檢索對(duì)象信息進(jìn)行語素解析。
句法解析部803參照潛在意向解析用辭典806,根據(jù)語素解析部804 的語素解析結(jié)果,對(duì)用戶Ul的回答信息或服務(wù)站點(diǎn)2等的檢索對(duì)象信息 進(jìn)行句法解析。
表達(dá)標(biāo)準(zhǔn)化部802參照潛在意向解析用辭典806和領(lǐng)域知識(shí)DB 702,對(duì)句法解析部803進(jìn)行的句法解析結(jié)果進(jìn)行標(biāo)準(zhǔn)表達(dá)化。
潛在意向解析部801參照潛在意向解析用辭典806和領(lǐng)域知識(shí)DB 702,提取用戶Ul的應(yīng)答信息中所包含的用戶潛在意向的潛在意向信息。 由該潛在意向解析部801提取出的用戶的潛在意向信息經(jīng)由對(duì)話控制部 101 ,.存儲(chǔ)在匹配對(duì)象分析單元30的個(gè)人登記數(shù)據(jù)DB 304中。 (A-l-2)關(guān)于匹配管理裝置
接著,參照附圖,詳細(xì)地說明第1實(shí)施方式的匹配管理裝置。
并且,'以下以服務(wù)站點(diǎn)2是面向轉(zhuǎn)職者的職業(yè)介紹領(lǐng)域站點(diǎn)的情況 為例,進(jìn)行說明。
第1實(shí)施方式的匹配管理裝置優(yōu)選作為如下功能來實(shí)現(xiàn)在上述階 梯對(duì)話引擎l中,以匹配單元20為中心,使對(duì)話管理單元IO、用戶發(fā)話 解析單元80和匹配對(duì)象分析單元30協(xié)作。
當(dāng)然,在上述階梯對(duì)話引擎l中,對(duì)話管理單元10通過軟件處理來 實(shí)現(xiàn)與各種單元20 90的協(xié)作, 一邊基于階梯手法與用戶相互對(duì)話,一 邊介紹與用戶潛在意向?qū)?yīng)的信息,所以,后述的匹配管理處理的實(shí)現(xiàn) 部位沒有特別限定。圖1是示出第1實(shí)施方式的匹配管理裝置18的結(jié)構(gòu)的結(jié)構(gòu)圖。在圖 1中,第1實(shí)施方式的匹配管理裝置18如下這樣實(shí)現(xiàn):至少使匹配器202、
評(píng)價(jià)值計(jì)算單元21、屬性選擇單元22、對(duì)話管理單元IO、用戶發(fā)話解析 單元80、對(duì)象數(shù)據(jù)數(shù)據(jù)庫(DB) 303、個(gè)人登記數(shù)據(jù)數(shù)據(jù)庫(DB) 304、 領(lǐng)域知識(shí)數(shù)據(jù)庫(DB) 702協(xié)作。
并且,匹配器202、評(píng)價(jià)值計(jì)算單元21、屬性選擇單元22相當(dāng)于上 述階梯對(duì)話引擎l的匹配單元20的功能結(jié)構(gòu),例如,優(yōu)選評(píng)價(jià)值計(jì)算單 元21和屬性選擇單元22發(fā)揮分配器201的功能。
個(gè)人登記數(shù)據(jù)DB 304是保持用戶的個(gè)人登記數(shù)據(jù)的數(shù)據(jù)庫。圖4A 和圖4B是示出保持在個(gè)人登記數(shù)據(jù)DB 304中的用戶數(shù)據(jù)的結(jié)構(gòu)例的結(jié) 構(gòu)圖。如圖4A和圖4B所示,用戶數(shù)據(jù)的項(xiàng)目由"屬性名"、"屬性值"、 "方案優(yōu)先級(jí)"以及"用戶優(yōu)先級(jí)"構(gòu)成。
"屬性名"是用于進(jìn)行信息檢索的屬性的名稱,"屬性值"是針對(duì)該 屬性的用戶的屬性值。"方案優(yōu)先級(jí)"示出在進(jìn)行對(duì)話的對(duì)話方案中所設(shè) 定的對(duì)用戶提問的順序。在圖4A和圖4B中,數(shù)字越大優(yōu)先級(jí)越高。"用 戶優(yōu)先級(jí)"是從用戶的回答得到的其屬性的優(yōu)先級(jí)。在圖4A和圖4B中, 數(shù)字越大用戶的優(yōu)先級(jí)越高。并且,在用戶數(shù)據(jù)中嵌入有通過與用戶的 對(duì)話而取得的屬性值。對(duì)象數(shù)據(jù)DB 303是保持通過網(wǎng)絡(luò)從服務(wù)站點(diǎn)2取得的檢索對(duì)象數(shù)據(jù)
的數(shù)據(jù)庫。
圖5A和圖5B是示出保持在對(duì)象數(shù)據(jù)DB 303中的對(duì)象數(shù)據(jù)的結(jié)構(gòu) 例的結(jié)構(gòu)圖。在圖5A和圖5B中,是作為轉(zhuǎn)職信息的對(duì)象數(shù)據(jù)的結(jié)構(gòu)例, 作為其結(jié)構(gòu),例如由用于識(shí)別對(duì)象數(shù)據(jù)的"ID"、"工作地點(diǎn)"、"職業(yè)種 類"、'"行業(yè)種類"等構(gòu)成。
領(lǐng)域知識(shí)DB 702是保持領(lǐng)域知識(shí)的數(shù)據(jù)庫。圖6A和圖6B是示出 保持在領(lǐng)域知識(shí)DB 702中的領(lǐng)域知識(shí)的結(jié)構(gòu)例的結(jié)構(gòu)圖。如圖6A和圖 6B所示,領(lǐng)域知識(shí)由系統(tǒng)地對(duì)與多個(gè)術(shù)語有關(guān)的知識(shí)進(jìn)行分類的本體構(gòu) 成。
例如,圖6A是工作地點(diǎn)本體的例子,圖6B是行業(yè)種類本體的例子。在圖6A中,例如關(guān)于屬性"工作地點(diǎn)",示出在作為上位概念的"日本
(國(guó))"的下位概念中鏈接"關(guān)西(地方)"和"關(guān)東(地方)"的情況。 并且,示出將"關(guān)西(地方)"作為上位概念,鏈接"京都府(都道府縣)"
和"大阪府(都道府縣)"作為其下位概念的情況。這樣,在圖6A和圖 6B中保持的知識(shí)構(gòu)成為,利用親子關(guān)系鏈接上位概念的術(shù)語和下位概念 的術(shù)語。
評(píng)價(jià)值計(jì)算單元21根據(jù)匹配器202的匹配結(jié)果,計(jì)算評(píng)價(jià)值。作為 該評(píng)價(jià)值計(jì)算單元21計(jì)算評(píng)價(jià)值的方法,計(jì)算在用戶數(shù)據(jù)中設(shè)置了屬性 值的比例(用戶的特性比例),作為評(píng)價(jià)值。
屬性選擇單元22根據(jù)匹配器202的匹配結(jié)果、用戶數(shù)據(jù)和評(píng)價(jià)值, 決定最適當(dāng)?shù)乜s小數(shù)據(jù)范圍所需要的用戶希望條件的項(xiàng)目,將該決定出 的項(xiàng)目提供給對(duì)話管理單元IO。由此,對(duì)話管理單元10能夠?qū)τ脩暨M(jìn)行 與由屬性選擇單元22所決定的項(xiàng)目有關(guān)的提問。這里,通過動(dòng)作來詳細(xì) 說明屬性選擇單元22決定項(xiàng)目的方法。
屬性選擇單元22參照用戶數(shù)據(jù),例如在用戶數(shù)據(jù)中沒有嵌入屬性值 的情況下,將沒有嵌入屬性值的屬性中優(yōu)先級(jí)高的屬性名提供給對(duì)話管 理單元10。能夠針對(duì)該優(yōu)先級(jí)高的屬性名對(duì)用戶進(jìn)行提問,能夠取得屬 性值。并且,作為優(yōu)先級(jí),有方案優(yōu)先級(jí)和用戶優(yōu)先級(jí),但是方案優(yōu)先 級(jí)優(yōu)先。
并且,屬性選擇單元22參照用戶數(shù)據(jù),在用戶數(shù)據(jù)中嵌入有某種程 度的屬性值的情況下,將用戶數(shù)據(jù)中子孫最多的屬性名提供給對(duì)話管理 單元10。
并且,在匹配的對(duì)象數(shù)據(jù)少的情況下,屬性選擇單元22以可以有一 個(gè)不匹配的對(duì)象數(shù)據(jù)這樣的條件進(jìn)行匹配,將評(píng)價(jià)值最高的對(duì)象數(shù)據(jù)中 不匹配的屬性名提供給對(duì)話管理單元10。通過動(dòng)作來詳細(xì)說明該處理。 (A-2)第l實(shí)施方式的動(dòng)作
接著,參照
第1實(shí)施方式的匹配管理處理。圖7是示出第 1實(shí)施方式的匹配管理處理的流程圖。
首先,屬性選擇單元22向?qū)υ捁芾韱卧?0請(qǐng)求希望取得的屬性(步驟S101)。此時(shí),關(guān)于屬性選擇單元22對(duì)對(duì)話管理單元10請(qǐng)求的初始屬
性,可以是作為默認(rèn)值預(yù)先設(shè)定的屬性,或者,也可以是參照領(lǐng)域知識(shí)
DB 702隨機(jī)選擇的本體的屬性。
對(duì)話管理單元10接受來自屬性選擇單元22的請(qǐng)求,為了從用戶取 得與所請(qǐng)求的屬性有關(guān)的屬性值,生成提問該屬性的屬性值的提問語句, 對(duì)用戶提出該提問語句(步驟S102)。
圖8是在用戶的瀏覽器(用戶終端上)顯示來自對(duì)話管理單元10的 提問語句時(shí)的顯示例501A。在圖8中,例示出向用戶提問的屬性是"工 作地點(diǎn)"的情況。
在圖8的提問語句的顯示例501A中,至少具有提問語句502A、回 答按鈕503A、工作地點(diǎn)選擇顯示部504A、意圖顯示部505A、優(yōu)先級(jí)賦 予顯示部506A、以及匹配結(jié)果顯示部507A。
提問語句502A是顯示從階梯對(duì)話引擎1提供的提問語句的部分,用 戶對(duì)該提問語句進(jìn)行回答。在用戶進(jìn)行回答的情況下,從顯示在工作地 點(diǎn)選擇顯示部504A上的工作地點(diǎn)中選擇期望的工作地點(diǎn)。這里,示出選 擇了 "大阪市"的情況。
并且,在顯示例501A中具有意圖顯示部505A和優(yōu)先級(jí)提供給顯示 部506A,以在檢索轉(zhuǎn)職目的地時(shí),把握該屬性(即"工作地點(diǎn)")對(duì)用 戶的重要程度如何的潛在意向。
在該意圖顯示部505A中顯示例如"不確定"、"都可以"等用于了解 用戶對(duì)該屬性的潛在意向的信息。并且,在優(yōu)先級(jí)賦予顯示部506A中, 用戶能夠針對(duì)該屬性選擇優(yōu)先級(jí)。另外,優(yōu)先級(jí)的設(shè)定方法沒有特別限 定,可以應(yīng)用各種方法,但是,這里,例如優(yōu)先級(jí)"3"是"普通水平", 值越大,在檢索轉(zhuǎn)職目的地時(shí),該屬性的優(yōu)先級(jí)越高。
并且,圖9是與圖8不同的提問語句的顯示例。在圖9所示的顯示 例701A中,具有用戶針對(duì)提問語句702A輸入自然語言的輸入部703A。 該情況下,用戶在輸入部703A中輸入針對(duì)提問語句702A的回答后,選 擇回答按鈕704A,由此,回送回答語句。另夕卜,在圖9所示的顯示例中, 具有發(fā)話解析結(jié)果顯示部705A和匹配結(jié)果顯示部706A。當(dāng)用戶對(duì)圖8或圖9所例示的提問語句進(jìn)行回答后,該回答語句被
提供給對(duì)話管理單元10 (步驟S103)。進(jìn)而,將回答語句從對(duì)話管理單 元10提供給用戶發(fā)話解析單元80,通過用戶發(fā)話解析單元80進(jìn)行回答 語句解析(步驟S104)。由此,將回答語句中所包含的屬性和該屬性的屬 性值對(duì)應(yīng)起來存儲(chǔ)在用戶數(shù)據(jù)中(步驟S105)。
將屬性和該屬性的屬性值存儲(chǔ)在用戶數(shù)據(jù)中后,屬性選擇單元22參 照用戶數(shù)據(jù)(步驟S106),判斷存儲(chǔ)在該用戶數(shù)據(jù)中的屬性值的比例是否 在閾值以上(步驟S107)。
當(dāng)存儲(chǔ)在用戶數(shù)據(jù)中的屬性值的比例小于閾值的情況下,屬性選擇 單元22參照屬性判定規(guī)則222,進(jìn)行與存儲(chǔ)在用戶數(shù)據(jù)中的屬性值的評(píng) 價(jià)值相對(duì)應(yīng)的屬性選擇處理(步驟S108)。
圖10A到圖10C是說明屬性判定規(guī)則222的說明圖。圖IOA示出屬 性判定規(guī)則222的結(jié)構(gòu)例,圖10B是屬性判定規(guī)則222的檢驗(yàn)項(xiàng)目的定 義內(nèi)容,并且,圖10C是屬性判定規(guī)則222的執(zhí)行處理的定義內(nèi)容。
在圖10A中,規(guī)則是在符合條件1 條件9這9個(gè)條件的情況下, 分別成行對(duì)應(yīng)的執(zhí)行處理(處理1 處理6)。在圖10A中,"〇"是符合 檢驗(yàn)項(xiàng)目的情況,"X"是不符合檢驗(yàn)項(xiàng)目的情況,"一"表示不確定的 情況。 '
作為屬性判定規(guī)則222的檢驗(yàn)項(xiàng)目,如圖10B所示,由C1 C6這 6種構(gòu)成。Cl是指設(shè)置了屬性值的用戶的特性比例在閾值 (filed_property—ratio )以上,C2是指匹配的目標(biāo)數(shù)在閾值 (matched—targrt—count)以上,C3是指用戶數(shù)據(jù)中方案的優(yōu)先級(jí)在規(guī)定 優(yōu)先級(jí)(property_priority)以上、狀態(tài)在規(guī)定水平(statusJLevel)以下 的特性,C4是指FIXED以外的所有用戶數(shù)據(jù)的屬性值不具有子孫,C5 是指狀態(tài)水平(status—Level)在1以下,C6是指規(guī)定優(yōu)先級(jí) (property_priority).為1。
并且,作為執(zhí)行處理,如圖10C所示,由處理1 處理6這6種構(gòu) 成。處理1是進(jìn)行希望條件的填空的處理,其內(nèi)容是如下處理從用戶 數(shù)據(jù)中選擇狀態(tài)水平(status—Level)在1以下的、方案的優(yōu)先級(jí)最高的特性。處理2是進(jìn)行希望條件的縮小范圍的處理,其內(nèi)容是如下處理-在用戶數(shù)據(jù)中選擇具有子孫最多的屬性值的特性。處理3是進(jìn)行希望條 件的放寬的處理,其內(nèi)容是如下處理增加不匹配的屬性的數(shù)量
(unmatched Count),再次調(diào)出數(shù)據(jù)匹配功能,選擇評(píng)價(jià)值最高的目標(biāo)數(shù) 據(jù)中的不匹配的特性。處理4是對(duì)于模糊的回答再次進(jìn)行提問的處理, 其內(nèi)容是如下處理增加狀態(tài)水平(status—Level)而再次進(jìn)行參照屬性 判定規(guī)則222的判定處理。處理5是還考慮優(yōu)先級(jí)低的屬性的處理,其 內(nèi)容是如下處理減少優(yōu)先級(jí)(property_priority)而再次進(jìn)行參照屬性 判定規(guī)則222的判定處理。處理6是無法進(jìn)行縮小范圍的處理,其內(nèi)容 是如下處理重新進(jìn)行與用戶的對(duì)話。
在步驟S108中進(jìn)行屬性選擇單元22執(zhí)行的屬性選擇處理,當(dāng)選擇 了屬性時(shí)(步驟S109),返回步驟S101,對(duì)用戶提出與所選擇的屬性有 關(guān)的提問語句。
另一方面,當(dāng)在步驟S107中設(shè)置在用盧數(shù)據(jù)中的屬性值的比例在閾 值以上的情況下,通過匹配器202,從對(duì)象數(shù)據(jù)DB 303中檢索與用戶數(shù) 據(jù)相匹配的對(duì)象數(shù)據(jù)(步驟SllO)。
當(dāng)通過匹配器202進(jìn)行匹配時(shí),對(duì)話管理單元IO參照記錄在用戶數(shù) 據(jù)中的用戶優(yōu)先級(jí),選擇與用戶優(yōu)先級(jí)高的屬性相匹配的匹配結(jié)果,將 該匹配結(jié)果優(yōu)先提供給用戶進(jìn)行顯示(步驟Slll)。
用戶從所顯示的匹配結(jié)果中選擇期望的對(duì)象數(shù)據(jù)。然后,對(duì)話管理 單元1'0從對(duì)象數(shù)據(jù)DB 303中調(diào)出由用戶選擇的對(duì)象數(shù)據(jù)的詳細(xì)數(shù)據(jù), 將該對(duì)象數(shù)據(jù)提供給用戶進(jìn)行顯示(步驟S112)。
例如,圖11是與圖9所例示的顯示例對(duì)應(yīng)的顯示例。在圖11的發(fā) 話解析結(jié)果顯示部805A中,是針對(duì)用戶以自然語言輸入的"如果可能, 希望是關(guān)西。"這樣的輸入(參照?qǐng)D9)的發(fā)話解析結(jié)果。即,在圖11中, 針對(duì)圖9的回答即"如果可能"這樣的輸入,屬性選擇單元22解析為其 用戶優(yōu)先級(jí)為2,在發(fā)話解析顯示部805A上顯示該解析結(jié)果。
并且,在匹配結(jié)果顯示部806A中,顯示檢索到21件匹配的對(duì)象數(shù) 據(jù),其中,按照用戶優(yōu)先級(jí)從高到低的順序顯示為A株式會(huì)社、B株式會(huì)社、株式會(huì)社D、……。
(A-3)第1實(shí)施方式的效果
如上所述,根據(jù)第1實(shí)施方式,能夠發(fā)揮以下效果。
根據(jù)第1實(shí)施方式,能夠可靠地判斷用戶優(yōu)先級(jí)和當(dāng)前的匹配狀況, 以少量的提問數(shù)得到最佳的匹配結(jié)果。
根據(jù)第l實(shí)施方式,即使目標(biāo)數(shù)據(jù)沒有完全與條件相匹配,但只要 適合率高,則也能夠詢問用戶在該條件下是否也可以,能夠得到用戶意 想不到的良好結(jié)果。
根據(jù)第1實(shí)施方式,通過在階層型知識(shí)數(shù)據(jù)庫中提出上位概念、下 位概念和類似概念,能夠自由地進(jìn)行條件的縮小范圍和放寬,能夠調(diào)整 匹配結(jié)果。
根據(jù)第1實(shí)施方式,用戶可以對(duì)某些條件回答"不確定"、"都可以" 等,能夠考慮該條件發(fā)現(xiàn)準(zhǔn)確的候選。 (A-4)其他實(shí)施方式
(A-4-l)在第l實(shí)施方式中,作為服務(wù)站點(diǎn)的一例,例示了面向轉(zhuǎn) 職者的職業(yè)介紹站點(diǎn),但是不限于此,能夠廣泛應(yīng)用存在于網(wǎng)絡(luò)上的信 阜
加、o
此外,作為網(wǎng)絡(luò)上的信息,可以將文本數(shù)據(jù)、圖像數(shù)據(jù)、動(dòng)態(tài)圖像 數(shù)據(jù)、;音頻數(shù)據(jù)等作為檢索對(duì)象數(shù)據(jù)。
(A-4-2)第1實(shí)施方式中說明的階梯檢索引擎、匹配管理裝置所實(shí) 現(xiàn)的各種結(jié)構(gòu)要件的功能通過軟件處理來實(shí)現(xiàn)。例如,作為硬件結(jié)構(gòu), 構(gòu)成為例如具有CPU、 ROM、 RAM等,通過使CPU使用處理所需要的 數(shù)據(jù)來執(zhí)行存儲(chǔ)在ROM中的處理程序,由此實(shí)現(xiàn)各種結(jié)構(gòu)要件的功能。
(A-4-3)第1實(shí)施方式中說明的匹配管理裝置不限于搭載在物理上 的同一裝置上,各種結(jié)構(gòu)要件也可以搭載在分散的裝置上。即,可以分 散配置各種結(jié)構(gòu)要件。
(B)第2實(shí)施方式 下面,參照附圖,詳細(xì)地說明本發(fā)明的對(duì)話管理裝置、方法、程序 以及潛在意向提取系統(tǒng)的第2實(shí)施方式。在第2實(shí)施方式中,例示出應(yīng)用于如下的信息解析/信息檢索系統(tǒng)的 情況該信息解析/信息檢索系統(tǒng)利用本發(fā)明的對(duì)話管理裝置、方法、程 序以及潛在意向提取系統(tǒng),例如釆用階梯型檢索服務(wù),從用戶潛在意向 的信息和檢索對(duì)象信息中提取規(guī)定屬性和屬性值,檢索并介紹與用戶潛 在意向的信息相匹配的信息。
(B-l)第2實(shí)施方式的結(jié)構(gòu)
(B-l-l)階梯型檢索系統(tǒng)的整體結(jié)構(gòu)的說明
關(guān)于應(yīng)用了本發(fā)明的對(duì)話管理裝置、方法、程序以及潛在意向提取 系統(tǒng)的階梯型檢索系統(tǒng),在第1實(shí)施方式中進(jìn)行了說明。下面,對(duì)與第1 實(shí)施方式相同的結(jié)構(gòu),標(biāo)注相同的參照標(biāo)號(hào)并省略說明。
(B-l-2)關(guān)于對(duì)話管理裝置 接著,參照附圖詳細(xì)地說明第2實(shí)施方式的對(duì)話管理裝置。并且, 以下以服務(wù)站點(diǎn)2是面向轉(zhuǎn)職者的職業(yè)介紹領(lǐng)域站點(diǎn)的情況為例,進(jìn)行 說明。
第2實(shí)施方式的對(duì)話管理裝置優(yōu)選在上述階梯型檢索系統(tǒng)9中,作 為對(duì)話管理單元10的功能來實(shí)現(xiàn)。
當(dāng)然,在上述階梯型檢索系統(tǒng)9中,對(duì)話管理單元IO通過軟件處理 來實(shí)現(xiàn)與各種單元20 90的協(xié)作, 一邊基于階梯手法與用戶相互對(duì)話, 一邊介紹與用戶的潛在意向?qū)?yīng)的信息,所以,后述的信息提取處理的 實(shí)現(xiàn)部位沒有特別限定。
圖12和圖13是示出第2實(shí)施方式的對(duì)話管理單元10的結(jié)構(gòu)的結(jié)構(gòu) 圖。圖12是對(duì)話管理單元10A在外部具有用戶個(gè)人信息時(shí)的結(jié)構(gòu)圖,圖 13是對(duì)話管理單元10B在內(nèi)部具有用戶個(gè)人信息時(shí)的結(jié)構(gòu)圖。以下,在 無特別區(qū)分時(shí),把對(duì)話管理單元IOA和10B統(tǒng)稱為對(duì)話管理單元10。
如圖12和圖13所示,第2實(shí)施方式的對(duì)話管理裝置10至少具有 對(duì)話控制部101、行動(dòng)決定部102、方案選擇部103以及應(yīng)答生成部104。
圖12所示的對(duì)話管理裝置10A至少與Web服務(wù)器901、輸入語句 解析模塊(用戶發(fā)話解析單元)80B、對(duì)話記錄(記錄DB) 601以及匹 配單元20協(xié)作。并且,圖13所示的對(duì)話管理裝置10B至少與Web服務(wù)器901、輸入語句解析模塊(用戶發(fā)話解析單元)80B、對(duì)話記錄601協(xié) 作。
對(duì)話控制部101對(duì)對(duì)話管理裝置10實(shí)現(xiàn)的功能進(jìn)行控制,并控制與 外部模塊(例如Web服務(wù)器卯l、輸入語句解析模塊80B、對(duì)話記錄601、 匹配單元20等)之間的協(xié)作處理。對(duì)話控制部101基本上在行動(dòng)決定部 102、方案選擇部103、應(yīng)答生成部104與外部模塊之間進(jìn)行信息的接收 和發(fā)送。
具體而言,對(duì)話控制部101針對(duì)方案選擇部103進(jìn)行基于請(qǐng)求信息 或回答語句判定的方案請(qǐng)求處理;針對(duì)應(yīng)答生成部104進(jìn)行應(yīng)答語句生 成的請(qǐng)求處理;針對(duì)輸入語句解析模塊80B進(jìn)行輸入語句解析請(qǐng)求處理; 針對(duì)行動(dòng)決定部102進(jìn)行回答語句判定的請(qǐng)求處理;針對(duì)應(yīng)答生成部104 進(jìn)行對(duì)話寫入的請(qǐng)求處理。
方案選擇部103從匹配單元20接受匹配單元20希望取得的信息的 請(qǐng)求時(shí),從對(duì)話方案1031中選擇用于取得該信息的方案(以下也稱為最 佳方案)。
并且,方案選擇部103將所選擇的方案提供給對(duì)話控制部101。此 時(shí),對(duì)話控制部101將從方案選擇部103取得的方案保持為當(dāng)前方案 1011,并且,將該方案提供給應(yīng)答生成部104。
這里,關(guān)于從用戶取得與哪個(gè)屬性有關(guān)的信息的判斷,設(shè)為例如在 匹配單元20中,根據(jù)檢索對(duì)象數(shù)據(jù)和用戶的回答數(shù)據(jù)之間的匹配結(jié)果來 進(jìn)行判斷。
在對(duì)話方案1031中,例如針對(duì)匹配單元20請(qǐng)求的所有信息,預(yù)先 設(shè)定用于取得該信息的方案。并且,該對(duì)話方案1031可以應(yīng)用相當(dāng)于圖 3所示的方案管理單元50所具有的對(duì)話方案的方案。
圖14是示出存儲(chǔ)多個(gè)對(duì)話方案1031的對(duì)話方案DB 518的結(jié)構(gòu)的結(jié) 構(gòu)圖。如圖14所示,對(duì)話方案DB518具有通常方案組51、特別方案組 52和應(yīng)答語句組53。
通常方案組51是用于在與用戶U1的對(duì)話中引出用戶希望要件的方 案的集合體。在該通常方案組51中,預(yù)先設(shè)定有針對(duì)與檢索對(duì)象有關(guān)的領(lǐng)域的所有屬性的方案。
特別方案組52是用于在與用戶之間的階梯對(duì)話中應(yīng)對(duì)來自用戶的 不規(guī)則的發(fā)話(例如,用戶進(jìn)行了與方案的發(fā)話有關(guān)的提問的情況等)、 或流暢地進(jìn)行與用戶之間的對(duì)話的方案的集合體。例如有"說明方案"、
"確認(rèn)方案"、以及用戶"貼近方案"、用戶"確認(rèn)方案"等。并且,還 存在當(dāng)用戶發(fā)話的動(dòng)作不存在于通常方案中的情況下所執(zhí)行的"默認(rèn)方 案"。.
應(yīng)答語句組53是在通常方案、特別方案中利用的應(yīng)答語句例,也稱
為應(yīng)答語句種子。應(yīng)答語句組53預(yù)先設(shè)定有進(jìn)行應(yīng)答的應(yīng)答語句,或設(shè)
定有具有變量的模板。
另外,對(duì)話方案DB 518記敘了以存儲(chǔ)在圖3所示的領(lǐng)域知識(shí)DB 702 中的信息為基礎(chǔ)的信息的方案。
并且,對(duì)話方案DB 518內(nèi)的方案可以利用由增強(qiáng)器302等擴(kuò)展信息 后的擴(kuò)展/個(gè)人數(shù)據(jù)的內(nèi)容,來生成應(yīng)答語句。即,可以保持置換為類似 術(shù)語等的方案。
應(yīng)答生成部104經(jīng)由對(duì)話控制部101接受方案后,根據(jù)該方案的應(yīng) 答語句種子,生成對(duì)用戶進(jìn)行應(yīng)答的應(yīng)答語句。
這里,作為應(yīng)答生成部104生成應(yīng)答語句的方法,例如,可以應(yīng)用 參照?qǐng)D14的應(yīng)答語句組53并按照該應(yīng)答語句組53來生成應(yīng)答語句的方 法。此時(shí),在應(yīng)答語句由具有變量的模板構(gòu)成的情況下,將從用戶取得 的實(shí)際數(shù)據(jù)代入變量來完成應(yīng)答語句。
并且,應(yīng)答生成部104將所生成的應(yīng)答語句提供給對(duì)話控制部101。 此時(shí),對(duì)話控制部101將所生成的應(yīng)答語句提供給Web服務(wù)器901,發(fā) 送到角戶U1。
行動(dòng)決定部102經(jīng)由對(duì)話控制部101接受來自用戶的回答即用戶輸 入語句解析結(jié)果后,根據(jù)該輸入解析結(jié)果,決定之后的對(duì)話行動(dòng),將該 所決定的之后的行動(dòng)提供給對(duì)話控制部101。此時(shí),對(duì)話控制部101進(jìn)行 控制,以按照由行動(dòng)決定部102決定的行動(dòng)來進(jìn)行之后的行動(dòng)。
這里,作為行動(dòng)決定部102決定的行動(dòng),有以下3個(gè)行動(dòng)。第1,對(duì)匹配單元20提供信息,結(jié)束當(dāng)前方案1011。第2,繼續(xù)當(dāng)前方案1011。 第3,執(zhí)行階梯特別處理。
作為該階梯特別處理,是指如下的處理在由于來自用戶的不規(guī)則 的發(fā)話(例如,用戶進(jìn)行與方案的發(fā)話有關(guān)的提問的情況等)而使通常 的方案難以繼續(xù)的情況下,或在為了順利地進(jìn)行與用戶之間的對(duì)話希望 特別的應(yīng)答而不是當(dāng)前方案(用于收集用戶需要的信息的方案)的情況 下,選擇與當(dāng)前方案不同的方案,來繼續(xù)對(duì)話。
(B-2)第2實(shí)施方式的動(dòng)作
接著,參照
第2實(shí)施方式的對(duì)話管理處理。圖15A和圖15B 是示出第2實(shí)施方式的對(duì)話管理處理的流程圖。圖12、圖15A和圖15B 中所示的步驟編號(hào)是分別對(duì)應(yīng)的編號(hào)。
首先,從匹配單元20將希望取得的信息的請(qǐng)求提供給對(duì)話控制部 101后(步驟Sl),對(duì)話控制部101對(duì)方案選擇部103進(jìn)行基于請(qǐng)求信息 的方案請(qǐng)求(步驟S2)。
此時(shí),將存儲(chǔ)在對(duì)話方案DB 518中的對(duì)話方案1031讀入方案存儲(chǔ) 器1021。
例如,在匹配單元20請(qǐng)求的信息是"希望職業(yè)種類"的情況下,方 案選擇部103從對(duì)話方案1031中選擇與"希望職業(yè)種類"有關(guān)的方案, 將該方案提供給對(duì)話控制部101 (步驟S3)。
將由方案選擇部103選擇的方案提供給對(duì)話控制部101后,對(duì)話控 制部101將該方案保持為當(dāng)前方案1011,并且,將當(dāng)前方案的應(yīng)答語句 種子提供給應(yīng)答生成部104,進(jìn)行應(yīng)答語句生成請(qǐng)求(步驟S4)。
在應(yīng)答生成部104中,根據(jù)該請(qǐng)求信息的方案內(nèi)的應(yīng)答語句種子, 生成應(yīng)答語句,將該所生成的應(yīng)答語句提供給對(duì)話控制部101 (步驟S5)。
例如,此時(shí),作為與"希望職業(yè)種類"有關(guān)的應(yīng)答語句,應(yīng)答生成 部104根據(jù)應(yīng)答語句種子,生成"有希望的職業(yè)種類嗎?"這樣的應(yīng)答 語句。
然后,對(duì)話控制部101將由應(yīng)答生成部104生成的應(yīng)答語句提供給 Web服務(wù)器901 (步驟S6),對(duì)用戶Ul的用戶終端提問。之后,從用戶Ul經(jīng)由Web服務(wù)器901將針對(duì)詢問的回答語句提供 給對(duì)話控制部101后(步驟S7),對(duì)話控制部101將來自該用戶Ul的回 答語句和當(dāng)前方案提供給輸入語句解析模塊80B,進(jìn)行該回答語句的解 析請(qǐng)求(步驟S8)。
在輸入語句解析模塊80B中,對(duì)所輸入的用戶Ul的回答語句進(jìn)行 解析,將其解析結(jié)果提供給對(duì)話控制部101 (步驟S9)。
另外,關(guān)于輸入語句解析模塊80B中的輸入語句解析方法,例如利 用系統(tǒng)地對(duì)信息的知識(shí)進(jìn)行分類后的領(lǐng)域知識(shí)(本體)來進(jìn)行。例如, 在用戶Ul針對(duì)應(yīng)答語句的回答語句是"沒有特別希望的"的情況下,輸 入語句解析模塊80B將"沒有"這樣的解析結(jié)果提供給對(duì)話控制部101。
從輸入語句解析模塊80B接受回答語句解析結(jié)果后,對(duì)話控制部101 將該回答語句解析結(jié)果和當(dāng)前方案提供給行動(dòng)決定部102,請(qǐng)求回答語句 判定(步驟SIO)。
于是,在行動(dòng)決定部102中,根據(jù)回答語句解析結(jié)果和當(dāng)前方案來 決定之后的行動(dòng),將該所決定的行動(dòng)提供給對(duì)話控制部101 (步驟Sll)。 即,行動(dòng)決定部102決定是對(duì)匹配單元20提供信息并結(jié)束當(dāng)前方案,還 是繼續(xù)進(jìn)行方案,或是進(jìn)行階梯特別處理。
這里,參照附圖詳細(xì)說明行動(dòng)決定部102的行動(dòng)決定處理。
圖16A和圖16B是示出行動(dòng)決定部102的行動(dòng)決定處理的流程圖。 并且,圖17例示出用戶Ul和系統(tǒng)之間的階梯對(duì)話的內(nèi)容。
如圖17所示,假設(shè)對(duì)話管理單元10為了對(duì)用戶引出"轉(zhuǎn)職理由", 對(duì)用戶提問"為什么希望轉(zhuǎn)職?"這樣的應(yīng)答語句,作為其回答,得到 了 "公司倒閉了。"這樣的回答。然后,從輸入語句解析模塊80B向行動(dòng) 決定部102提供給"轉(zhuǎn)職理由(屬性名)公司倒閉(屬性值)",作為回 答解析結(jié)果。
在圖16A和圖16B中,在系統(tǒng)起動(dòng)時(shí),在方案存儲(chǔ)器1021上安裝 圖14所示的對(duì)話方案DB518的對(duì)話方案1031。
然后,將回答解析結(jié)果提供給行動(dòng)決定部102后,行動(dòng)決定部102 根據(jù)所接受的回答解析結(jié)果,從方案存儲(chǔ)器1021中檢索特別方案(步驟S301)。
這樣,行動(dòng)決定部102在通常方案的檢索前進(jìn)行特別方案的檢索, 由此,可以選擇給用戶帶來信賴感和安全感的特別方案("貼近方案"), 或者,.可以選擇與用戶突然進(jìn)行了無關(guān)的提問的情況對(duì)應(yīng)的特別方案 ("說明方案")。
在存在與回答解析結(jié)果相匹配的特別方案的情況下(步驟S302), 選擇該匹配的特別方案,行動(dòng)決定部102將該特別方案提供給對(duì)話控制 部IOI。由此,通過對(duì)話控制部IOI的控制,執(zhí)行該匹配的特別方案的應(yīng) 答語句動(dòng)作(步驟S303)。
這里,具體說明行動(dòng)決定部102的方案的進(jìn)行處理。
圖18A和圖18B是特別方案的例子。另夕卜,圖18A是貼近方案的例 子,圖18B是確認(rèn)方案的例子。
如圖18A和圖18B所示,各方案構(gòu)成為具有"方案關(guān)鍵"、"優(yōu)先級(jí)"、 "應(yīng)答語句條件"、"應(yīng)答語句動(dòng)作"。
這里,在圖18A和圖18B中,對(duì)一個(gè)方案定義一組或多組的"應(yīng)答 語句條件"和"應(yīng)答語句動(dòng)作"。而且,將"應(yīng)答語句條件"和"應(yīng)答語 句動(dòng)作"分別對(duì)應(yīng)起來,在符合某個(gè)"應(yīng)答語句條件"的情況下,執(zhí)行 與該應(yīng)答語句條件對(duì)應(yīng)的應(yīng)答語句動(dòng)作。 "方案關(guān)鍵"是方案的識(shí)別信息。
"應(yīng)答語句動(dòng)作"定義了符合"應(yīng)答語句條件"的情況下的動(dòng)作。 在圖18A和圖18B中,作為動(dòng)作例,示出定義了以預(yù)先設(shè)定的一個(gè)應(yīng)答 語句進(jìn)行應(yīng)答的情況。但是,不限于該情況,還定義了多個(gè)應(yīng)答語句的 應(yīng)答,定義了使用過去從用戶取得的用戶個(gè)人數(shù)據(jù)的、由帶變量的模板 構(gòu)成的應(yīng)答語句,定義了用于使用戶選擇選擇項(xiàng)的帶選擇項(xiàng)的應(yīng)答語句, 定義了是繼續(xù)應(yīng)答還是到此結(jié)束的應(yīng)答語句繼續(xù)信息,定義了在到此結(jié) 束的情況下之后調(diào)出的其他方案的信息,定義了方案的優(yōu)先順序的變更 和匹配的重要度的變更。
"應(yīng)答語句條件"'是用于執(zhí)行應(yīng)答語句動(dòng)作的條件。在圖18A和圖 18B中,例示了與用戶的屬性值對(duì)應(yīng)的情況。但是不限于此,也可以將從其他方案中調(diào)出的情況作為條件,或者將過去取得的用戶個(gè)人數(shù)據(jù)或 擴(kuò)展后的信息是否符合屬性值作為條件,而不將本次從用戶取得的信息 是否符合屬性值作為條件。
通常方案的"優(yōu)先級(jí)"決定在請(qǐng)求了匹配單元20所請(qǐng)求的多個(gè)信息
(屬性名)的情況下、或不存在匹配單元20的情況下所執(zhí)行的屬性名方
案的優(yōu)先順序。
例如,圖19A的轉(zhuǎn)職理由方案的優(yōu)先級(jí)為10, (B)希望的職業(yè)種類 方案的優(yōu)先級(jí)為8。該情況下,如果沒有來自匹配單元的信息請(qǐng)求,則在 希望的職業(yè)種類方案之前執(zhí)行轉(zhuǎn)職理由方案。這樣,能夠在方案內(nèi)定義 以什么樣的順序?qū)τ脩暨M(jìn)行提問。(進(jìn)而,如(B) -1的例子那樣,能夠 在應(yīng)答語句動(dòng)作內(nèi)改寫優(yōu)先級(jí)。)
另一方面,特別方案的"優(yōu)先級(jí)"決定在特別方案內(nèi)以哪個(gè)特別方 案的順序進(jìn)行發(fā)話。(在通常方案和特別方案中,"優(yōu)先級(jí)"的定義不同。)
例如,在圖18A和圖18B的情況下,作為系統(tǒng)發(fā)話,先生成貼近方 案,然后生成確認(rèn)方案。(成為"那真遺憾。所以你才考慮轉(zhuǎn)職的吧。" 這樣的方案發(fā)話。)
例如,將回答語句解析結(jié)果"轉(zhuǎn)職理由(屬性名)公司倒閉(屬性 值)"提供給行動(dòng)決定部102后,行動(dòng)決定部102檢索將屬性名"轉(zhuǎn)職 理由"、屬性值"公司倒閉"作為應(yīng)答語句條件的特別方案。這里,設(shè)為 檢索到圖18A和圖18B所例示的2個(gè)特別方案(貼近方案、確認(rèn)方案)
(圖16A和圖16B的S41)。于是,行動(dòng)決定部102向?qū)υ捒刂撇?01通 知2個(gè)特別方案。
對(duì)話控制部101接受特別方案后,按照基于該特別方案的優(yōu)先級(jí)的 優(yōu)先順序,將特別方案的應(yīng)答語句種子提供給應(yīng)答生成部104 (圖l、圖 15A和圖15B的S13)。
應(yīng)答生成部104根據(jù)來自對(duì)話控制部101的應(yīng)答語句種子生成應(yīng)答 語句,將該應(yīng)答語句提供給對(duì)話控制部101 (圖1的S14)。然后,通過 執(zhí)行貼近方案,對(duì)用戶Ul提出"那真遺憾。"這樣的應(yīng)答語句,并且, 通過執(zhí)行確認(rèn)方案,對(duì)用戶Ul提出"所以你才考慮轉(zhuǎn)職的吧。"這樣的應(yīng)答語句(S42)。
另一方面,在步驟S302中在沒有與回答解析結(jié)果相匹配的特別方案 的情況下,或者在執(zhí)行特別方案的應(yīng)答語句動(dòng)作后,行動(dòng)決定部102檢 索是否具有與屬性名X (在該例子中為轉(zhuǎn)職理由)相匹配的通常方案(步 驟S304)。
然后,在存在與回答解析結(jié)果相匹配的通常方案的情況下(步驟 S305),選擇該匹配的通常方案,行動(dòng)決定部102將該通常方案提供給對(duì) 話控制部101。由此,通過對(duì)話控制部101的控制,執(zhí)行該匹配的通常方 案的應(yīng)答語句動(dòng)作(步驟S306)。
這里,說明通常方案的方案進(jìn)行處理。圖19A和圖19B是通常方案 的例子。各方案構(gòu)成為具有"優(yōu)先級(jí)"、"應(yīng)答語句條件"、"應(yīng)答語句動(dòng) 作"。并且,這是以從方案(A)跳到另一方案(B)時(shí)的方案結(jié)構(gòu)為例 而示出的。
例如,行動(dòng)決定部102檢索將屬性名"轉(zhuǎn)職理由"、屬性值"公司倒 閉"作為應(yīng)答語句條件的通常方案。這里,設(shè)為檢索到圖19A所例示的 通常方案。于是,行動(dòng)決定部102向?qū)υ捒刂撇?01通知圖19A所示的 通常方案的應(yīng)答語句動(dòng)作為"跳到希望的職業(yè)種類方案"。
于是,對(duì)話控制部101對(duì)方案選擇部103請(qǐng)求"希望的職業(yè)種類" 方案(圖1的S15)。然后,方案選擇部103將"希望的職業(yè)種類"方案 提供給對(duì)話控制部101后,將"希望的職業(yè)種類"方案保持為當(dāng)前方案, 并且,將新的跳后方案的應(yīng)答語句種子提供給應(yīng)答生成部104,通過執(zhí)行 深入方案,向用戶Ul提出"以前從事什么樣的工作?"這樣的應(yīng)答語句 (S43)。
如圖19A所示,通過從用戶的發(fā)話得到的屬性值,進(jìn)一步跳到針對(duì) 該內(nèi)容進(jìn)行深入挖掘的另一方案,由此,能夠?qū)崿F(xiàn)"深入"。
另一方面,在步驟S305中當(dāng)不存在與回答解析結(jié)果相匹配的屬性名 "X (轉(zhuǎn)職理由)"的通常方案的情況下,行動(dòng)決定部102針對(duì)所有的屬 性名,檢索是否存在與應(yīng)答語句條件相匹配的通常方案(步驟S307)。
然后,在存在與回答解析結(jié)果相匹配的通常方案的情況下(步驟S30S),選擇該匹配的通常方案,行動(dòng)決定部102將該通常方案提供給對(duì) 話控制部101。由此,通過對(duì)話控制部101的控制,進(jìn)行從屬性名為"X
(轉(zhuǎn)職理由)"的通常方案向?qū)傩悦麨?Y"的另一通常方案轉(zhuǎn)變的處理
(步驟S309)。
另一方面,在步驟S308中當(dāng)不存在與回答解析結(jié)果相匹配的通常方 案的情況下,或者執(zhí)行了步驟S306的通常方案的動(dòng)作的應(yīng)答語句動(dòng)作后, 行動(dòng)決定部102將作為默認(rèn)方案設(shè)定的特別方案提供給對(duì)話控制部101 (步驟S310)。
該情況下,根據(jù)行動(dòng)決定部102所決定的默認(rèn)的特別方案,對(duì)話控 制部101與方案選擇部103和應(yīng)答生成部104協(xié)作,向用戶Ul發(fā)送例如 "非常抱歉,請(qǐng)從以下的選擇項(xiàng)中選擇。"這樣的應(yīng)答語句(S45)。
由此,在沒有完全適用的方案等情況下,將特別方案作為默認(rèn)方案, 由此,能夠提出某些回應(yīng),或轉(zhuǎn)移到其他的提問。
另外,在行動(dòng)決定部102中,在符合表示結(jié)束的方案的應(yīng)答語句條 件的情況下,將表示該意思的內(nèi)容提供給對(duì)話控制部101,將與該方案有 關(guān)的應(yīng)答語句和回答語句寫入對(duì)話記錄601,結(jié)束該方案(步驟S12)。 另外,在對(duì)話記錄601中,在每個(gè)方案結(jié)束時(shí)進(jìn)行寫入。因此,即使在 從某個(gè)方案跳到其他方案的情況下,也能夠?qū)懭胫暗姆桨傅膽?yīng)答語句 和回答語句。
另外,在上述中,如圖1所示例示了個(gè)人信息數(shù)據(jù)存在于對(duì)話管理 裝置10外部的情況,但是,在如圖13所示個(gè)人信息數(shù)據(jù)存在于對(duì)話管 理裝置10內(nèi)部的情況下,也同樣動(dòng)作。
但是,如圖13所示,在個(gè)人信息數(shù)據(jù)存在于對(duì)話管理裝置10內(nèi)部 的情況下,對(duì)向?qū)υ捒刂撇?01請(qǐng)求的信息(即引出屬性值的數(shù)據(jù))標(biāo) 注優(yōu)選順序,按照該優(yōu)選順序,對(duì)對(duì)話控制部101進(jìn)行請(qǐng)求。
圖20是說明階梯對(duì)話引擎1進(jìn)行的階梯對(duì)話的概略進(jìn)行的說明圖。
如圖20所示,在用戶和系統(tǒng)之間的對(duì)話中,對(duì)最初的提問Q1 (關(guān) 于性格)、提問Q2 (關(guān)于經(jīng)歷)、…、提問Qn (n為正整數(shù))(關(guān)于將來) 的內(nèi)容進(jìn)行展開,由此,能夠獲得主要提問的回答以外的個(gè)人數(shù)據(jù)(S51、S52),通過引出用戶U1的潛在意向信息,在用戶U1的擴(kuò)展個(gè)人數(shù)據(jù)314 中嵌入各屬性的屬性值(S53)。由此,進(jìn)行個(gè)人的屬性值和雇人側(cè)要求 的屬性值之間的匹配,能夠輸出匹配度高的雇人數(shù)據(jù)(S54)。并且,通 過概括器603,根據(jù)擴(kuò)展個(gè)人數(shù)據(jù)生成簡(jiǎn)歷作為職務(wù)履歷書(S55)。
圖21A和圖21B是顯示在用戶Ul的用戶終端(瀏覽器)上的顯示 畫面例。如圖21A和圖21B所示,在顯示畫面中,在提問顯示部91上 顯示從階梯對(duì)話引擎1給出的當(dāng)前的提問,在回答顯示部92上顯示用戶 Ul回答的內(nèi)容。在對(duì)話記錄顯示部93上顯示在此之前相互對(duì)話的內(nèi)容。 并且,在工作條件顯示部94上顯示在階梯對(duì)話中由對(duì)話引擎1檢測(cè)出的 條件、即用戶U1輸入的條件。而且,在雇人列表顯示部95上顯示由階 梯對(duì)話引擎1檢索到的雇人需求。
另外,圖21A和圖21B所示的顯示畫面是例示,除了圖21A和圖 21B所示的顯示畫面以外,例如可以進(jìn)行如下的顯示。
(a) 如果用戶對(duì)所顯示的公司名不滿意,則追溯對(duì)話記錄進(jìn)行消除 來顯示。例如,當(dāng)用戶附加標(biāo)記并點(diǎn)擊時(shí),標(biāo)記以后的對(duì)話被取消,而 再次從標(biāo)記位置迸行對(duì)話。
(b) 當(dāng)點(diǎn)擊所顯示的公司名時(shí),作為該公司雇人條件的用戶數(shù)據(jù)被 強(qiáng)調(diào)顯示。例如,在該公司的雇人條件為"職業(yè)種類SE"、用戶數(shù)據(jù)為
"希望職業(yè)種類SE"的情況下,用戶數(shù)據(jù)的希望職業(yè)種類被強(qiáng)調(diào)顯示。 即,能夠簡(jiǎn)單地知道各公司的雇人條件。
(c) 還具有"放寬條件"按鈕,用戶觀看當(dāng)前所顯示的公司列表, 在條件縮小得過于嚴(yán)格的情況下,按壓該按鈕。按壓該按鈕后,系統(tǒng)進(jìn) 行放寬條件的提問。
在上述中說明了 "深入"、"確認(rèn)"、"貼近"的例子,但是,也可以 如下所述進(jìn)行"改變說法"、"信息提供"和"概括"。
例如在執(zhí)行"改變說法"的情況下,領(lǐng)域知識(shí)例如是"提升職業(yè)技 能(上位概念)"-"希望取得資格(下位概念)"的結(jié)構(gòu)的情況下,當(dāng)從 用戶的發(fā)話中取得"希望取得資格"這樣的屬性值時(shí),參照該上位概念 的值,應(yīng)答"希望提升職業(yè)技能,是嗎?",由此能夠?qū)崿F(xiàn)"改變說法"。并且,例如在執(zhí)行"信息提供"的情況下,像領(lǐng)域知識(shí)為"巡回銷
售(route sales):訪問確定顧客的企業(yè)"那樣,能夠?qū)Ω髦涤洈⑵浜x。 而且,例如,在用戶進(jìn)行了 "巡回銷售是什么樣的工作?"這樣的發(fā)話 的情況下,對(duì)"是什么樣的工作 "進(jìn)行發(fā)話解析,發(fā)話解析向?qū)υ捒?br>
制轉(zhuǎn)交"說明要求巡回銷售"這樣的結(jié)果,由此,執(zhí)行特別方案的說
明方案,取得在本體中記述的巡回銷售的含義,進(jìn)行"巡回銷售是訪問 確定顧客的銷售。"這樣的應(yīng)答,由此能夠?qū)崿F(xiàn)"信息提供"。
并且,例如在執(zhí)行"概括"的情況下,能夠保持用戶的發(fā)話履歷并 進(jìn)行概括。在對(duì)話中途引用并出示其結(jié)果,由此能夠順利地進(jìn)行對(duì)話。
(B-3)第2實(shí)施方式的效果 如上所述,根據(jù)第2實(shí)施方式,具有對(duì)話控制部、行動(dòng)決定部、方 案選擇部和應(yīng)答生成部,這些結(jié)構(gòu)要件實(shí)現(xiàn)協(xié)作,由此,能夠在用戶和 系統(tǒng)之間的階梯對(duì)話中,展開根據(jù)用戶的回答來探出潛在意向的對(duì)話。
(B-4)其他實(shí)施方式
(B-4-l)在第2實(shí)施方式中,作為服務(wù)站點(diǎn)的一例,例示了面向轉(zhuǎn) 職者的職業(yè)介紹站點(diǎn),但是不限于此,能夠廣泛應(yīng)用存在于網(wǎng)絡(luò)上的信
息o
并且,作為網(wǎng)絡(luò)上的信息,可以將文本數(shù)據(jù)、圖像數(shù)據(jù)、動(dòng)態(tài)圖像 數(shù)據(jù)、音頻數(shù)據(jù)等作為檢索對(duì)象數(shù)據(jù)。
(B-4-2)第2實(shí)施方式中說明的階梯檢索引擎、對(duì)話管理裝置所實(shí)
現(xiàn)的各種結(jié)構(gòu)要件的功能通過軟件處理來實(shí)現(xiàn)。例如,作為硬件結(jié)構(gòu), 構(gòu)成為例如具有CPU、 ROM和RAM等,通過使CPU使用處理所需要 的數(shù)據(jù)來執(zhí)行存儲(chǔ)在ROM中的處理程序,由此實(shí)現(xiàn)各種結(jié)構(gòu)要件的功 能。
(B-4-3)第2實(shí)施方式中說明的對(duì)話管理裝置不限于搭載在物理上 上的同一裝置上,各種結(jié)構(gòu)要件也可以搭載在分散的裝置上。即,可以 分散配置各種結(jié)構(gòu)要件。
(C)第3實(shí)施方式 下面,參照附圖,詳細(xì)地說明本發(fā)明的信息提取裝置、方法以及程序的第3實(shí)施方式。 -
在第3實(shí)施方式中,例示出應(yīng)用于如下的信息解析/信息檢索系統(tǒng)的情況該信息解析/信息檢索系統(tǒng)利用本發(fā)明的信息提取裝置、方法以及程序,例如采用階梯型檢索服務(wù),從用戶潛在意向的信息和檢索對(duì)象信息中提取規(guī)定屬性和屬性值,檢索并介紹與用戶潛在意向的信息相匹配的f言息。
(C-l)第3實(shí)施方式的結(jié)構(gòu)
(C-l-l)階梯型檢索系統(tǒng)的整體結(jié)構(gòu)的說明
關(guān)于應(yīng)用了本發(fā)明的信息提取裝置、方法以及程序的階梯型檢索系統(tǒng),在第1實(shí)施方式中進(jìn)行了說明。下面,對(duì)與第1實(shí)施方式相同的結(jié)構(gòu),標(biāo)注相同的參照標(biāo)號(hào)并省略說明。
對(duì)話管理單元10控制階梯檢索引擎1中的處理。對(duì)話管理單元10對(duì)希望進(jìn)行檢索的用戶Ul反復(fù)提出各種問題,根據(jù)用戶Ul對(duì)該問題的回答,引出用戶真正潛在意向的信息,同時(shí),檢索與該潛在意向的信息
相匹配的信息和內(nèi)容,向用戶U1進(jìn)行介紹。(C-l-2)關(guān)于信息提取處理接著,參照附圖詳細(xì)地說明第3實(shí)施方式的信息提取裝置。并且,以下以服務(wù)站點(diǎn)2是面向轉(zhuǎn)職者的職業(yè)介紹領(lǐng)域站點(diǎn)的情況為例,進(jìn)行說明。
第3實(shí)施方式的信息提取處理是如下的處理:取得服務(wù)站點(diǎn)2或Web信息4提供的信息(以下也稱為檢索對(duì)象數(shù)據(jù)),從該檢索對(duì)象數(shù)據(jù)中把屬性和該屬性的屬性值作為組進(jìn)行提取,并且取得用戶U1的應(yīng)答信息,從該用戶Ul的應(yīng)答信息中提取屬性和該屬性的屬性值的組。
第3實(shí)施方式的信息提取裝置優(yōu)選在上述階梯檢索引擎1中,作為用戶發(fā)話解析單元80和領(lǐng)域知識(shí)獲得單元70的功能來實(shí)現(xiàn)。
當(dāng)然,在上述階梯檢索引擎l中,對(duì)話管理單元10通過軟件處理來實(shí)現(xiàn)與各種單元20 90的協(xié)作, 一邊基于階梯手法與用戶相互對(duì)話,一邊介紹與用戶的潛在意向?qū)?yīng)的信息,所以,后述的信息提取處理的實(shí)現(xiàn)部位沒有特別限定。圖22是示出第3實(shí)施方式的信息提取裝置1100的結(jié)構(gòu)的結(jié)構(gòu)圖。
如圖22所示,第3實(shí)施方式的信息提取裝置1100構(gòu)成為至少具有:檢索對(duì)象數(shù)據(jù)1110、用戶輸入語句1120、輸入單元1130、信息提取方法切換單元1140、信息提取單元1150、領(lǐng)域知識(shí)DB 1160、信息存儲(chǔ)單元1170、對(duì)象數(shù)據(jù)DB 1180以及個(gè)人登記數(shù)據(jù)DB 1190。
檢索對(duì)象數(shù)據(jù)1110是通過網(wǎng)絡(luò)從服務(wù)站點(diǎn)2作為檢索對(duì)象取得的信息和從Web上取得的檢索對(duì)象的Web信息4。該檢索對(duì)象數(shù)據(jù)1110可以是開始與用戶Ul的對(duì)話后從服務(wù)站點(diǎn)2等取得的數(shù)據(jù),或者也可以是預(yù)先存儲(chǔ)在數(shù)據(jù)庫中的數(shù)據(jù)。
用戶輸入語句1120是通過對(duì)話管理單元10的控制對(duì)用戶Ul提出的詢問信息、和用戶Ul針對(duì)該詢問信息的應(yīng)答信息。用戶輸入語句1120從用戶終端取得并由對(duì)話控制部101提供。另外,也可以臨時(shí)存儲(chǔ)在存儲(chǔ)單元中。
輸入單元1130取入檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120,將其提供給信息提取方法切換單元1140。檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120例如一句一句地被取入輸入單元1130, 一句一句地進(jìn)行后述的信息提取處理。當(dāng)然,也可以將多個(gè)語句取入輸入單元1130,連續(xù)對(duì)多個(gè)語句進(jìn)行信息提取處理。
信息提取方法切換單元1140從輸入單元1130接受檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120后,根據(jù)該所輸入的檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120,決定信息提取方法。
這里,'作為信息提取方法,能夠應(yīng)用以下3種方法。
第1種信息提取方法使用存儲(chǔ)在領(lǐng)域知識(shí)DB 1160中的領(lǐng)域知識(shí)信息,基于字符串匹配或語素解析后的匹配。
第2種信息提取方法是,進(jìn)行句法解析處理,在是規(guī)定的語句結(jié)構(gòu)的情況下,根據(jù)該語句結(jié)構(gòu)進(jìn)行解析而提取信息。例如,在來自用戶U1的應(yīng)答信息為"工作地點(diǎn)(主格)考慮東京(賓格)"那樣,處于"(主格)=(賓格)"的關(guān)系的語句結(jié)構(gòu)的情況下,僅提取該語句結(jié)構(gòu)。由此,能夠?qū)?工作地點(diǎn)(主格)"和"東京(賓格)"對(duì)應(yīng)起來。第3種信息提取方法是,例如在提問語句是否定句或疑問句的情況下,提取回答語句中所包含的"是(YES)"、"不(NO)"、"哪個(gè)都不是"、"哪個(gè)都可以"、"什么都可以"等、表示用戶針對(duì)詢問的意圖的信息。
并且,作為決定信息提取方法的方法,能夠應(yīng)用以下3個(gè)模式。另外,關(guān)于以下3個(gè)模式的決定方法,不是固定地設(shè)定在信息提取方法切換單元1140中,而是在一個(gè)語句的信息提取處理中,根據(jù)屬性和屬性值的結(jié)構(gòu)來切換信息提取方法。
第1模式是預(yù)先決定與屬性對(duì)應(yīng)的信息提取方法的方法。該情況下,信息提取方法切換單元1140從所輸入的檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120中檢測(cè)屬性,根據(jù)該屬性來決定信息提取方法。
第2模式是預(yù)先將某個(gè)信息提取方法決定為默認(rèn)方法的方法。該情況下,信息提取方法切換單元1140對(duì)所有屬性決定默認(rèn)的信息提取方法。
第3模式是通過屬性值的結(jié)構(gòu)要素來決定信息提取方法的方法。該情況下,信息提取方法切換單元1140判斷從所輸入的檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120提取出的屬性值的結(jié)構(gòu)要素,根據(jù)該屬性值的結(jié)構(gòu)要素來決定信息提取方法。并且,在信息提取方法切換單元1140起初以第1模式或第2模式進(jìn)行動(dòng)作的情況下,也可以根據(jù)屬性值的結(jié)構(gòu)要素的判斷結(jié)果決定為第3模式。
信息提取單元1150通過由信息提取方法切換單元1140決定的信息提取方法,參照存儲(chǔ)在領(lǐng)域知識(shí)DB 1160中的本體,同時(shí)從所輸入的檢索對(duì)象數(shù)據(jù)1110或用戶輸入語句1120中提取屬性和屬性值。并且,信息提取單元1150根據(jù)提取的屬性的種類,決定要參照的本體,使用該本體提取屬性值。
并且,信息提取單元1150也可以與增強(qiáng)器302協(xié)作,提取擴(kuò)展后的信息。即,信息提取單元1150可以還針對(duì)作為提取對(duì)象的屬性和屬性值,提取類似的字符串或關(guān)聯(lián)的字符串等的擴(kuò)展后的字符串。
并且,信息提取單元1150雖然能夠從用戶輸入語句1120中提取屬性值,但是,在不清楚該屬性值所屬的屬性的情況下,判斷為具有模糊性,將表示該意思的內(nèi)容提供給對(duì)話控制部101。對(duì)話控制部101接受到表示該意思的內(nèi)容后,能夠生成詢問用戶Ul該屬性值屬于哪個(gè)屬性的詢 問,并向用戶U1發(fā)送。
領(lǐng)域知識(shí)DB 1160相當(dāng)于上述的領(lǐng)域知識(shí)DB 702,將多個(gè)領(lǐng)域知識(shí) 作為本體的集合體進(jìn)行存儲(chǔ)。
圖23A和圖23B例示出領(lǐng)域知識(shí)的本體的集合體的結(jié)構(gòu)。例如,圖 23A是"地名本體"的例子,圖23B是"制度本體"的例子。
圖23A的"地名本體"將"地名"作為最上位概念,作為其下位概 念的字符串,鏈接有"關(guān)西地方"."關(guān)東地方I首都圈"、"中部地方", "地名"和"關(guān)西地方"、"關(guān)東地方I首都圈"、"中部地方"為親子關(guān) 系。進(jìn)而,在"關(guān)西地方"的下位概念的字符串上鏈接有"大阪府","關(guān) 西地方"和"大阪府"為親子關(guān)系。這里,"關(guān)東地方I首都圈"的表述 意味著"關(guān)東地方"和"首都圈"是同等的字符串。其他字符串的關(guān)系 也同樣通過鏈接來構(gòu)成親子關(guān)系。
信息存儲(chǔ)單元1170將通過信息提取單元1150從檢索對(duì)象數(shù)據(jù)中提 取出的屬性和屬性值存儲(chǔ)在對(duì)象數(shù)據(jù)DB 1180中,將從用戶輸入語句 1120中提取出的屬性和屬性值存儲(chǔ)在個(gè)人登記數(shù)據(jù)DB 1190中。
對(duì)象數(shù)據(jù)DB 1180相當(dāng)于上述匹配對(duì)象分析單元30的對(duì)象數(shù)據(jù)DB 303。并且,個(gè)人登記數(shù)據(jù)DB 1190相當(dāng)于匹配對(duì)象分析單元30的個(gè)人 登記數(shù)據(jù)DB304。
(C-2)第3實(shí)施方式的動(dòng)作
接著,參照附圖詳細(xì)說明第3實(shí)施方式的信息提取處理的動(dòng)作。
圖24是示出第3實(shí)施方式的信息提取裝置1100從檢索對(duì)象數(shù)據(jù)中 提取屬性和屬性值時(shí)的處理的流程圖。
在圖24中,首先,通過輸入單元1130讀入檢索對(duì)象數(shù)據(jù)1110后(步 驟S1010),信息提取方法切換單元1140根據(jù)所輸入的檢索對(duì)象數(shù)據(jù)1110 來決定信息提取方法。
信息提取方法切換單元1140檢測(cè)所輸入的檢索對(duì)象數(shù)據(jù)1110中包 含的開始標(biāo)簽(步驟S1020)。另外,在沒有檢測(cè)出開始標(biāo)簽的情況下, 在檢索對(duì)象數(shù)據(jù)1110是最后的數(shù)搪時(shí),結(jié)束處理,在除此之外時(shí),返回步驟SIOIO,進(jìn)行處理(步驟S1030)。
當(dāng)在步驟S1020中檢測(cè)出開始標(biāo)簽時(shí),信息提取方法切換單元1140 針對(duì)該開始標(biāo)簽以后的數(shù)據(jù)進(jìn)行語素解析處理、句法解析處理、表達(dá)標(biāo) 準(zhǔn)化處理,檢測(cè)是否包含屬性(步驟S1040)。
其中,語素解析處理、句法解析處理和表達(dá)標(biāo)準(zhǔn)化處理可以應(yīng)用基 于用戶發(fā)話解析單元8—0的語素解析部804、句法解析部803和表達(dá)標(biāo)準(zhǔn) 化部802的處理。另外,語素解析處理、句法解析處理和表達(dá)標(biāo)準(zhǔn)化處 理可以廣泛應(yīng)用現(xiàn)有技術(shù),這里省略說明。
然后,在檢測(cè)出屬性后,信息提取方法切換單元1140根據(jù)該屬性決 定信息提取方法(步驟S1050)。
這里,信息提取方法切換單元1140可以根據(jù)上述3個(gè)模式的信息提 取方法的決定模式,來決定信息提取方法。
例如,圖25A和圖25B示出檢索對(duì)象數(shù)據(jù)的例子,是由面向轉(zhuǎn)職者 的職業(yè)介紹站點(diǎn)提供的信息。該情況下,屬性例如有"企業(yè)名"、"工作 內(nèi)容"、"工作地點(diǎn)"、"工作時(shí)間"、"休息日/假日"、"工資/獎(jiǎng)金"、"待遇 /福利"等左欄的記載事項(xiàng)。作為這些屬性的屬性值,有"XXX株式會(huì) 社"、"伴隨事業(yè)擴(kuò)大、保有權(quán)增強(qiáng)……"等右欄的記載事項(xiàng)。
例如,在根據(jù)提政出的屬性而設(shè)定了信息提取方法的情況下,例如 檢測(cè)出屬性"工作地點(diǎn)"時(shí),信息提取方法切換單元U40決定預(yù)先在該 屬性"工作地點(diǎn)"中設(shè)定的字符串匹配和語素解析結(jié)果的匹配方法。
于是,信息提取單元1150通過由信息提取方法切換單元1140所決 定的信息提取方法,從檢索對(duì)象數(shù)據(jù)1110中將針對(duì)屬性的屬性值作為組 進(jìn)行提取(步驟S1060),將該屬性和屬性值的組存儲(chǔ)在對(duì)象數(shù)據(jù)DB 1180 中(步驟S1070)。
如j如,在使用了圖25A和圖25B的上述例子的情況下,針對(duì)屬性"工 作地點(diǎn)",通過匹配提取出"東京都內(nèi)"、"虎門"、"八王子等",將各個(gè) 屬性值"東京都內(nèi)"、"虎門"、"八王子等"分別與屬性"工作地點(diǎn)"對(duì) 應(yīng)起來,并存儲(chǔ)在對(duì)象數(shù)據(jù)DB1180中。
在檢測(cè)出結(jié)束標(biāo)簽為止(步驟S1080),讀入檢索對(duì)象數(shù)據(jù)1110 (步驟S1090),反復(fù)進(jìn)行屬性值的提取處理。并且,檢測(cè)出結(jié)束標(biāo)簽后(步
驟S1080),暫時(shí)清除要提取的屬性和信息提取方法(步驟S1095),返回 步驟SIOIO,反復(fù)進(jìn)行處理。
接著,說明第3實(shí)施方式的信息提取裝置1100從用戶輸入語句1120 中提取屬性和屬性值時(shí)的處理。
圖26是示出信息提取裝置1100從用戶輸入語句1120中提取屬性和 屬性值時(shí)的處理的流程圖。另外,在圖26中,示出用戶輸入語句1120 為一句時(shí)的處理,但是,針對(duì)所有用戶輸入語句1120,重復(fù)同樣的處理。
在圖26中,首先,通過輸入單元1130讀入用戶輸入語句1120 (步 驟S2010)。
此時(shí),在該用戶輸入語句1120是針對(duì)問題的應(yīng)答信息的情況下,該 問題旨在向用戶打聽某個(gè)屬性,對(duì)話管理單元IO可以對(duì)信息提取方法切 換單元1140提供是針對(duì)哪個(gè)屬性的問題的應(yīng)答信息(即屬性指定)。
在存在該屬性指定的情況下(步驟S2020),信息提取方法切換單元 1140決定由對(duì)話管理單元10所指定的屬性(步驟S2030),決定與該屬 性對(duì)應(yīng)的信息提取方法(步驟S2040)。該情況下,信息提取方法切換單 元1140能夠根據(jù)上述3個(gè)模式的信息提取方法的決定模式,來決定信息 提取方法。
另一方面,在沒有屬性指定的情況下(步驟S2020),信息提取方法 切換單元1140設(shè)置為所有的屬性為提取對(duì)象(步驟S2050),提取用戶輸 入語句1120中所包含的屬性,決定默認(rèn)的信息提取方法(步驟S2060)。
作為該屬性的提取方法,例如可以應(yīng)用如下的方法在用戶輸入語 句1120中包含標(biāo)簽的情況下,通過檢測(cè)該標(biāo)簽來判斷屬性,或者,針對(duì) 用戶輸入語句1120中所包含的屬性,通過字符串匹配等匹配處理來判斷 屬性。
并且,在圖26的步驟S2060中,例示了使用默認(rèn)的信息提取方法的 情況,但是,也可以設(shè)置全部3個(gè)模式的信息提取方法,還可以按照規(guī) 定的順序設(shè)置要使用的信息提取方法,直到提取出屬性。
信息提取單元1150根據(jù)由信息提取方法切換單元1140決定的信息提取方法,來提取屬性值(步驟S2070)。
此時(shí),信息提取單元1150根據(jù)提取出的屬性的種類,決定參照的本 體,使用該本體來提取屬性值。
圖27是示出用戶輸入語句1120的例子的圖。圖28是示出信息提取 單元1150參照的本體和屬性之間的關(guān)系的圖。
例如,在圖27中,Q3是屬性"待遇/福利"的提問,A3是其應(yīng)答。 該情況下,信息提取單元1150根據(jù)圖28的關(guān)系,參照與屬性"待遇/福 利"對(duì)應(yīng)的"制度本體"(圖23B)。
然后,信息提取單元1150根據(jù)A3的"希望雙休日。"的用戶Ul的 應(yīng)答信息,參照?qǐng)D23B所示的"制度本體",提取與字符串"雙休日"相 匹配的"完全雙休日制"作為屬性值。
這樣,信息提取單元1150參照與屬性對(duì)應(yīng)的本體,提取屬性值。
在上述例子中,信息提取方法以使用字符串的匹配或語素解析結(jié)果 的匹配為例示出,這里還例示其他例子。
例如,在圖27中,Q4是屬性"希望的職業(yè)種類"的提問,A4是其 應(yīng)答。信息提取單元1150參照與屬性"希望的職業(yè)種類"對(duì)應(yīng)的"職業(yè) 種類本體"。
該情況下,信息提取方法切換單元1140對(duì)A4的"感興趣的工作是 與專利有關(guān)的工作。"進(jìn)行解析后,識(shí)別到包含名詞和動(dòng)詞的語句結(jié)構(gòu)。 因此,對(duì)A4進(jìn)行句法解析,在A4是規(guī)定的語句結(jié)構(gòu)(例如,"(主格) 是(賓格)"這樣的語句結(jié)構(gòu))的情況下,信息提取方法切換單元1140 將信息提取方法從字符串等的匹配方法切換為使用了句法解析結(jié)果的方 法。信息提取單元1150接受該切換后,根據(jù)A4的語句結(jié)構(gòu),解析為"感 興趣的工作(主格)"="與專利有關(guān)的工作(賓格)",提取與賓格的字 符串"與專利有關(guān)"相匹配的"專利關(guān)聯(lián)"作為屬性值。
并且,例如,在圖27中,Q5是針對(duì)屬性"希望的職業(yè)種類"的深 入的提問,A5是其應(yīng)答。
Q5是"希望是專利許可交涉么?"這樣的疑問句。該情況下,信息 提取單元1150提取作為A5的應(yīng)答的"不",關(guān)于屬性"希望的職業(yè)種類",在"專利關(guān)聯(lián)"中選擇"專利許可交涉"以外的職業(yè)種類,作為用戶U1 的意圖。
并且,信息提取單元1150對(duì)不清楚符合哪個(gè)屬性的屬性值的模糊的 屬性值,判斷為其具有模糊性(步驟S2080),并將該具有模糊性的信息 提供給對(duì)話管理單元10。由此,能夠通過對(duì)話管理單元10的控制,向用 戶Ul.呈現(xiàn)具有模糊性的信息,由用戶Ul來選擇(步驟S2090)。
例如,在圖27中,Q6和A6是在此之前的對(duì)話中用戶Ul進(jìn)行了"東 京"這樣的應(yīng)答的情況。該情況下,用戶Ul應(yīng)答了屬性值"東京",但 是并不清楚該"東京"是指"工作地點(diǎn)"還是指"住址"。
因此,信息提取單元1150向?qū)υ捁芾韱卧?0通知該"東京"是具 有模糊性的屬性值。對(duì)話管理單元10接受該通知,提出Q6那樣"之前 提到的東京是現(xiàn)在的工作地點(diǎn)還是住址"的、詢問屬性值"東京"的屬 性的詢問。然后,信息提取單元1150從針對(duì)Q6的詢問的應(yīng)答A6"是當(dāng) 前的工作地點(diǎn)"中,提取屬性"工作地點(diǎn)",由此,取得屬性"工作地點(diǎn)" 和屬性值"東京"的組。
如上所述,信息存儲(chǔ)單元i170將信息提取單元1150提取出的用戶 輸入語句1120的屬性和屬性值的組存儲(chǔ)在個(gè)人登記數(shù)據(jù)DB 1190中(步 驟S2100)。
如上所述,通過信息提取裝置1100,將從檢索對(duì)象數(shù)據(jù)1110和用戶 輸入語句1120提取出的屬性和屬性值的組分別存儲(chǔ)在對(duì)象數(shù)據(jù)DB 1180 和個(gè)入登記數(shù)據(jù)DB 1190中。然后,接受對(duì)話管理單元10的控制,通過 匹配單元20進(jìn)行匹配處理,由此能夠檢索用戶Ul潛在意向的對(duì)象信息, 并向用戶Ul介紹該檢索信息。
(C-3)第3實(shí)施方式的效果
如上所述,根據(jù)第3實(shí)施方式,通過具有信息提取方法切換單元, 由此能夠適當(dāng)?shù)厍袚Q與輸入信息的結(jié)構(gòu)對(duì)應(yīng)的信息提取方法。因此,通 過該與輸入信息的結(jié)構(gòu)對(duì)應(yīng)的信息提取方法,即使是豐富多彩地展開的 對(duì)話,也能夠適當(dāng)?shù)靥崛?duì)話所包含的信息。 (C-4)其他實(shí)施方式(C-4-l)在第3實(shí)施方式中,作為服務(wù)站點(diǎn)的一例,例示了面向轉(zhuǎn) 職者的職業(yè)介紹站點(diǎn),但是不限于此,能夠廣泛應(yīng)用于存在于網(wǎng)絡(luò)上的 信息。
并且,作為網(wǎng)絡(luò)上的信息,可以將文本數(shù)據(jù)、圖像數(shù)據(jù)、動(dòng)態(tài)圖像 數(shù)據(jù)、音頻數(shù)據(jù)等作為檢索對(duì)象數(shù)據(jù)。
(C-4-2)第3實(shí)施方式中說明的階梯檢索引擎、信息提取裝置所實(shí) 現(xiàn)的各種結(jié)構(gòu)要件的功能通過軟件處理來實(shí)現(xiàn)。例如,作為硬件結(jié)構(gòu), 構(gòu)成為例如具有CPU、 ROM、 RAM等,通過使CPU使用處理所需要的 數(shù)據(jù)來執(zhí)行存儲(chǔ)在ROM中的處理程序,由此實(shí)現(xiàn)各種結(jié)構(gòu)要件的功能。 (C-4-3)第3實(shí)施方式中說明的信息提取裝置不限于物理上搭載于 同一裝置上,各種結(jié)構(gòu)要件也可以搭載在分散的裝置上。即,可以分散 配置各種結(jié)構(gòu)要件。
并且,語言不限于日語,可以廣泛地應(yīng)用于英語、中文等外語。
(D)第4實(shí)施方式 下面,參照附圖詳細(xì)地說明本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的第 4實(shí)施方式。關(guān)于可以應(yīng)用本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的階梯型檢 索系統(tǒng),在第l實(shí)施方式中進(jìn)行了說明。 (D-l)第4實(shí)施方式的結(jié)構(gòu)
圖29是示出第4實(shí)施方式的對(duì)話系統(tǒng)3010的主要結(jié)構(gòu)的功能框圖。 圖29示出將用戶發(fā)話作為輸入而生成系統(tǒng)發(fā)話的結(jié)構(gòu)部分。
對(duì)話系統(tǒng)3010例如可以構(gòu)筑為階梯型檢索裝置等更大型裝置的一 部分。并且,對(duì)話系統(tǒng)3010也可以通過在PC (個(gè)人計(jì)算機(jī))或服務(wù)器 等通用的信息處理裝置中安裝對(duì)話程序(包含固定數(shù)據(jù)等)來構(gòu)筑。無 論如何,在功能上都可以用圖29的結(jié)構(gòu)表示。對(duì)話程序的安裝不限于基 于經(jīng)由通信網(wǎng)絡(luò)下載的方法,也可以是經(jīng)由計(jì)算機(jī)可讀取記錄介質(zhì)的方 法。例如,如果是用作具有檢索并提供轉(zhuǎn)職公司的功能的階梯型檢索裝 置的一部分的情況,則在提供站點(diǎn)的Web服務(wù)器上搭載對(duì)話系統(tǒng)3010, 其中,該站點(diǎn)用于提供轉(zhuǎn)職公司。
在圖29中,第4實(shí)施方式的對(duì)話系統(tǒng)3010具有解析部3011、對(duì)
54象部位認(rèn)定部3012、提取部3013以及變形部3014。對(duì)象部位認(rèn)定部3012、 提取部3013以及變形部3014構(gòu)成重復(fù)回復(fù)應(yīng)答生成部3015。
在對(duì)話系統(tǒng)3010中輸入有由自然語言語句構(gòu)成的用戶發(fā)話。例如, 用戶將顯示在用戶終端即個(gè)>^計(jì)算機(jī)上的Web網(wǎng)頁上的、輸入到發(fā)話語 句輸入用區(qū)域中的自然語言語句(文本)輸入到對(duì)話系統(tǒng)3010中。并且, 例如,該對(duì)話系統(tǒng)3010的搭載裝置也可以具有鍵盤等的輸入裝置,來取 入用戶發(fā)話。并且,例如,也可以對(duì)用戶終端的麥克風(fēng)或該對(duì)話系統(tǒng)3010 的搭載裝置的麥克風(fēng)捕捉到的語音(語音信號(hào))進(jìn)行識(shí)別處理,來取入 用戶發(fā)話。
解析部3011對(duì)用戶發(fā)話進(jìn)行語素解析和句法解析,按照單詞(語素) 進(jìn)行區(qū)分,弄清語句的結(jié)構(gòu)。語素解析和句法解析可以應(yīng)用已知的解析 方法。
對(duì)象部位認(rèn)定部3012認(rèn)定在用戶發(fā)話中可以判斷為適合進(jìn)行重復(fù) 回復(fù)的部位。在后述的動(dòng)作說明中說明了判斷基準(zhǔn)和判斷方法,如下列 舉幾個(gè)判斷基準(zhǔn)。將用戶發(fā)話中靠近末尾的"謂語+其目的語或主語"作 為對(duì)象部位(的候選)。將用戶發(fā)話中靠近末尾的"名詞+其修飾語"作 為對(duì)象部位(的候選)。將用戶發(fā)話中的包含"無理(難以辦到)"、"困 6 (為難)"、"L & ^ (想)"、香& ^ (不能)"等的意思/主觀表達(dá)或 與其類似的表達(dá)的幾個(gè)詞語作為對(duì)象部位(的候選)。將不是意思/主觀表 達(dá)本身而記載了 "困S (為難)"、"L^V (想)"的內(nèi)容的部位作為對(duì) 象部位(的候選)。在存在多個(gè)對(duì)象部位(的候選)的情況下,對(duì)象部位 認(rèn)定部3012按照預(yù)先確定的規(guī)則,將其縮小范圍到1個(gè)對(duì)象部位。通過
動(dòng)作說明來理解具體方法。
提取部3013從對(duì)象部位認(rèn)定部3012認(rèn)定的用戶發(fā)話中的對(duì)象部位
及其附近,提取(選擇)由于重復(fù)回復(fù)而成為自然長(zhǎng)度的部分(句法樹 中的子樹)。如由動(dòng)作說明中后述那樣,沒有大幅偏離由表達(dá)的種類所決 定的標(biāo)準(zhǔn)長(zhǎng)度(例如3個(gè)詞語)的詞語數(shù)量(4個(gè)詞語或2個(gè)詞語)是被 允許的。另外,也可以設(shè)定上限的詞語數(shù)量而不是標(biāo)準(zhǔn)長(zhǎng)度,來保證重 復(fù)回復(fù)的自然長(zhǎng)度(在短的情況下,不執(zhí)行不合理地增加)。在提取部3013
55提取出的部分(句法樹中的子樹)長(zhǎng)且是不能允許的長(zhǎng)度的情況下,進(jìn) 行縮短。在縮短中,按照規(guī)定的規(guī)則,刪除目的語或主語,或者刪除修 飾語。
在提取部3013獲得的重復(fù)回復(fù)用部分符合規(guī)定規(guī)則的情況下,變形 部3014對(duì)表達(dá)進(jìn)行變形(或整形)。例如,變換時(shí)態(tài)或變換為敬語表達(dá)。 并且,如果在提取出名詞(句子)的情況下,附加"t十& (是…… 吧?)"或""c t &。(是……吧。)"。
經(jīng)變形部3014處理后的重復(fù)回復(fù)用部分(自然語言語句)成為系統(tǒng) 發(fā)話。系統(tǒng)發(fā)話例如加在顯示在用戶終端即個(gè)人計(jì)算機(jī)上的Web網(wǎng)頁上 進(jìn)行顯示。并且,例如該對(duì)話系統(tǒng)3010的搭載裝置也可以具有顯示裝置, 來顯示系統(tǒng)發(fā)話。此外,例如也可以對(duì)由文本數(shù)據(jù)構(gòu)成的系統(tǒng)發(fā)話實(shí)施 語音合成,從用戶終端的揚(yáng)聲器或該對(duì)話系統(tǒng)3010的搭載裝置的揚(yáng)聲器 發(fā)出系統(tǒng)發(fā)話的語音(語音信號(hào))。
另外,解析部3011、對(duì)象部位認(rèn)定部3012、提取部3013以及變形 部3014例如由如下硬件資源來實(shí)現(xiàn)該硬件資源包含專用的控制設(shè)備、 或執(zhí)行程序的處理器(CPU)、存儲(chǔ)由該處理器執(zhí)行的程序和數(shù)據(jù)的RAM (Random Access Memory,隨機(jī)存取存儲(chǔ)器)、ROM、 HDD等存儲(chǔ)設(shè)備。
并且,在上述說明中,按照不同功能進(jìn)行了說明,但是并不需要按 照各部分明確地分離和獨(dú)立地準(zhǔn)備要實(shí)現(xiàn)的硬件的物理結(jié)構(gòu)。例如,存 儲(chǔ)對(duì)象部位認(rèn)定部3012的程序的HDD可以與存儲(chǔ)解析部3011的解析用 辭典數(shù)據(jù)的HDD共用,此外也可以利用實(shí)現(xiàn)其他功能的裝置的一部分。 此外,構(gòu)成該對(duì)話系統(tǒng)3010的一部分也可以配置在利用網(wǎng)絡(luò)連接的其他 場(chǎng)所。
(D-2)第4實(shí)施方式的動(dòng)作
接著,參照
具有以上各部的第4實(shí)施方式的對(duì)話系統(tǒng)3010 的動(dòng)作(第4實(shí)施方式的對(duì)話方法)。圖30是示出第4實(shí)施方式的對(duì)話 系統(tǒng)3010的動(dòng)作的流程圖。
第4實(shí)施方式的對(duì)話系統(tǒng)3010在輸入用戶發(fā)話后,開始圖30所示 的處理,依次執(zhí)行由解析部3011進(jìn)行的語素解析/句法解析(S3100)、由對(duì)象部位認(rèn)定部3012進(jìn)行的對(duì)象部位認(rèn)定(S3101)、由提取部3013進(jìn)行 的提取(S3102)、由變形部3014進(jìn)行的變形(整形)(S3103),來形成系 統(tǒng)發(fā)話。以下,詳細(xì)敘述各步驟S3100、 S3101、 S3102、 S3103的處理。
解析部3011通過公知的解析方法進(jìn)行語素解析和句法解析 (S3100)。圖31示出針對(duì)用戶發(fā)話"人i接L&力、'6自分力、'人間t LT 成長(zhǎng)T多S仕事力、'L亡'。、(想從事與人接觸同時(shí)能夠使自己作為社會(huì)人 成長(zhǎng)的工作)"的語素解析結(jié)果,圖32示出針對(duì)該語素解析結(jié)果的句法 解析結(jié)果(句法樹)。
對(duì)象部位認(rèn)定部3012利用內(nèi)置的圖33所示的認(rèn)定用特殊表達(dá)列表 來認(rèn)定重復(fù)回復(fù)的對(duì)象部位(S3101)。
如圖33所示,認(rèn)定用特殊表達(dá)列表規(guī)定了小組名稱、具體的特殊表 達(dá)和提取中心。
關(guān)于第1行L3011,在用戶發(fā)話中包含有"^ ^ ^ (想)"、"希望十 S (希望)"、……等特殊表達(dá)(在列表中以現(xiàn)在形、原形等記述,但是, 以其他形式包含在用戶發(fā)話中也符合;其他行也同樣)的情況下,屬于 "意思表達(dá)"的小組,表示將該以"L & ^、(想)"、"希望十3 (希望)" 等作為謂語的主要部分的核心名詞處于提取中心。圖32的解析結(jié)果例包 含"L ;t u (想)",所以,符合該情況,將主要部分的核心名詞即"仕 事(工作)"作為提取中心。
關(guān)于第2行L3012,在用戶發(fā)話中包含有"困3 (為難)"、"無理(難 以辦到)"、""eS3 (能夠)"、……等特殊表達(dá)的情況下,屬于"主觀表 達(dá)"的小組,表示該"困3 (為難)"、"無理(難以辦到)"、"f § 6 (能 夠)"等之前的相關(guān)要素中的核心名詞處于提取中心。圖32的解析結(jié)果 例包含""CS6 (能夠)",所以,符合該情況,將之前的相關(guān)要素中的
核心名詞即"成長(zhǎng)(成長(zhǎng))"作為提取中心。并且,如果用戶發(fā)話為"… 殘業(yè)力;少^ l、 i :: 3 "C《。i困"法卞(……不是加班少的地方就會(huì)很
為難)",則將"t : 3 (地方)"作為提取中心。
關(guān)于第3行L3013,在用戶發(fā)話中包含有"気^ 〈(注意)"、"経験 亍6 (經(jīng)驗(yàn))"、……等特殊表達(dá)的情況下,屬于"活動(dòng)表達(dá)"的小組,表示該"気。' < (注意)"、"経験十3 (經(jīng)驗(yàn))"等特殊表達(dá)(核心用語) 本身處于提取中心。例如,如果用戶發(fā)話為"…活力'甘3仕事^。T気 ^ ^ &九^ t (……已經(jīng)注意到這是充分利用我的經(jīng)驗(yàn)的工作)",則將 "気^ < (注意)"作為提取中心。
關(guān)于第4行L3014,在用戶發(fā)話中包含有(有)"、"-^ (沒 有)"、……等特殊表達(dá)的情況下,屬于"有無表達(dá)"的小組,表示將該 "為3 (有)"、"&^ (沒有)"等特殊表達(dá)作為謂語的主要部分的核心 名詞處于提取中心。例如,如果用戶發(fā)話為"…伸""C 。i 3 i3 ^方 力、'社內(nèi)o勢(shì)^力、'A 。子3 (……因?yàn)椴粩喟l(fā)展的人在公司內(nèi)部有
氣勢(shì))",則將"勢(shì)L、(氣勢(shì))"作為提取中心。
對(duì)象部位認(rèn)定部3012確認(rèn)在圖33的認(rèn)定用特殊表達(dá)列表中的"具 體的特殊表達(dá)"中所記載的表達(dá)是否存在于上述解析結(jié)果中。在存在的 情況下,對(duì)象部位認(rèn)定部3012將相當(dāng)于特殊表達(dá)列表中的相應(yīng)行的"提 取中心"的解析結(jié)果(用戶發(fā)話)的部位認(rèn)定為對(duì)象部位。在存在多個(gè)所 認(rèn)定的對(duì)象部位的情況下,在句法解析結(jié)果中,選擇離主句的謂語部最近 的部位。即,鑒于句法解析結(jié)果中的距離來進(jìn)行選擇,而不是根據(jù)所出現(xiàn) 的文字串的距離來進(jìn)行選擇。在圖32的句法解析結(jié)果中,在與特殊表達(dá) 列表的核對(duì)中,存在特殊表達(dá)"^ ^ (想)"所涉及的對(duì)象部位"仕事(工 作)"和特殊表達(dá)"《'嘗6 (能夠)"所涉及的對(duì)象部位"成長(zhǎng)(成長(zhǎng))", 但是,由圖32可知,與主句的謂語部"Lt^ (想)"距離短的對(duì)象部位 是"仕事(工作)",所以,對(duì)象部位"仕事(工作)"占據(jù)提取中心。
提取部3013利用內(nèi)置的圖34所示的提取用特殊表達(dá)列表,來提取 重復(fù)回復(fù)中利用的用戶發(fā)話部分(S3102)?;旧?,提取部3013取出將 對(duì)象部位認(rèn)定部3012認(rèn)定的、對(duì)象部位的提取中心的詞語(組)作為根 的子樹(作為句法解析結(jié)果形成的樹狀的一組),由此來提取重復(fù)回復(fù)中 利用的用戶發(fā)話部分。提取部3013判別所取出的用戶發(fā)話部分是否在上 限詞語數(shù)量以內(nèi),其中,該上限詞語數(shù)量是基于提取用特殊表達(dá)列表中 的后述的詞語數(shù)量標(biāo)準(zhǔn)而確定的,在處于該上限詞語數(shù)量以內(nèi)的情況下, 直接將所取出的用戶發(fā)話部分作為提取結(jié)果,當(dāng)不在該上限詞語數(shù)量以內(nèi)的情況下,按照提取用特殊表達(dá)列表中的后述的提取(要素選擇)規(guī) 則,從所取出的用戶發(fā)話部分中削減一部分表達(dá),使其成為上限詞語數(shù) 量以下,將削減后的用戶發(fā)話部分作為提取結(jié)果。
如圖34所示,提取用特殊表達(dá)列表規(guī)定了小組名稱、詞語數(shù)量標(biāo)準(zhǔn) 和提取規(guī)則。
第1行L3021記述了,屬于"意思表達(dá)"小組的規(guī)定部位的詞語數(shù) 量標(biāo)準(zhǔn)為5,在所取出的用戶發(fā)話部分(子樹)的詞語數(shù)量比基于該詞語 數(shù)量標(biāo)準(zhǔn)而確定的上限個(gè)數(shù)多的情況下,如下所述進(jìn)行詞語數(shù)量削減。 削減應(yīng)用如下的方法第1,刪除針對(duì)提取中心(參照?qǐng)D33)的修飾要 素中遠(yuǎn)離(提取中心)的修飾要素;第2,在遠(yuǎn)近相同的情況下,刪除主 格、賓格等語格要素以外的詞語;第3,在語格要素方面也相同的情況下, 刪除出現(xiàn)字符串上的遠(yuǎn)的一方。以單詞或子樹的枝作為最小單位來進(jìn)行 這里所述的刪除,按照第1 3的規(guī)則反復(fù)進(jìn)行削減,直到處于上限個(gè)數(shù) 以內(nèi)。例如,當(dāng)設(shè)上限個(gè)數(shù)為詞語數(shù)量標(biāo)準(zhǔn)+1詞語時(shí),"意思表達(dá)"小組 的上限詞語數(shù)量為6個(gè)詞語。
針對(duì)圖32的句法解析結(jié)果,如上所述,"仕事(工作〉"為提取中心 并成為根,所以,在重復(fù)回復(fù)用的用戶發(fā)話部分(子樹)的取出中,取 出"自分^人間i L《成長(zhǎng)T^3仕事(能夠使自己作為社會(huì)人成長(zhǎng)的 工作)"(7個(gè)詞語)。超過作為上限個(gè)數(shù)的6個(gè),所以,進(jìn)行一部分的刪 除。這里,"自分力、'(自己)"和"人間& ^ t (作為社會(huì)人)"相對(duì)于"仕 事(工作)"的遠(yuǎn)近處于相同水平,但是,通過刪除語格要素以外的要素 這樣的第2規(guī)則,保留力;格(主格)的"自分力;(自己)",刪除"人間 i L t (作為社會(huì)人)"。由此,詞語數(shù)量為5,在作為上限個(gè)數(shù)的6以內(nèi), 所以,將進(jìn)行了該刪除后的階段作為提取結(jié)果。即,"自分力;成長(zhǎng)^§ S 仕事(能夠使自己成長(zhǎng)的工作)"成為提取結(jié)果。該提取結(jié)果不是用戶發(fā) 話的連續(xù)的一部分,而是連接了2個(gè)部位的結(jié)果。
以上,假設(shè)了無法允許偏離詞語數(shù)量標(biāo)準(zhǔn)的情況中的詞語個(gè)數(shù)多的 情況,在少于詞語數(shù)量標(biāo)準(zhǔn)的情況下,也可以進(jìn)行追加(對(duì)圖34的各行 均同樣)。追加規(guī)則與刪除時(shí)的規(guī)則對(duì)稱即可。例如應(yīng)用如下方法第l,追加針對(duì)提取中心(參照?qǐng)D33)的修飾要素中接近(提取中心)的修飾
要素;第2,在遠(yuǎn)近相同的情況下,優(yōu)先追加主格、賓格等語格要素;第 3,在語格要素方面也相同的情況下,追加出現(xiàn)字符串上近的一方。
提取用特殊表達(dá)列表的第2行L3022記述了,屬于"主觀表達(dá)"小 組的規(guī)定部位的詞語數(shù)量標(biāo)準(zhǔn)為2,在所取出的用戶發(fā)話部分(子樹)的 詞語數(shù)量比基于該詞語數(shù)量標(biāo)準(zhǔn)而確定的上限個(gè)數(shù)多的情況下,刪除針 對(duì)提取中心(參照?qǐng)D33)的修飾要素中遠(yuǎn)離(提取中心)的修飾要素。 但是,以下兩種情況為例外。在修飾要素中存在用言的情況下,例外地 不刪除相當(dāng)于其主格和賓格的要素。在刪除的結(jié)果為僅有核心名詞的情 況下,不進(jìn)行刪除,保持詞語數(shù)量超出的狀態(tài),將其作為提取結(jié)果。
如果用戶發(fā)話為"…殘業(yè)力;少^ 。 i 二 3"C,/ ^ t困0法t (…… 不是加班少的地方就會(huì)很為難)",則如上所述,將"& : 3 (地方)"作 為提取中心,首先取出"殘業(yè)力《少《^ i : ^ (加班少的地方)"(4個(gè)詞 語)作為重復(fù)回復(fù)用的用戶發(fā)話部分(子樹)。子樹的詞語數(shù)量超過上限 個(gè)數(shù),所以,由于"殘業(yè)力(加班)"遠(yuǎn)而要?jiǎng)h除,但是相對(duì)于"殘業(yè)力;
(加班)",存在"少^f (少)"這樣的用言,所以,不刪除"殘業(yè)^ (加 班)"。為了在基于詞語數(shù)量而確定的上限數(shù)量以內(nèi),只能將"殘業(yè)力{少 & ^ (加班少)"全部刪除,但是,這樣成為僅有核心名詞"i : 3 (地 方)",所以,準(zhǔn)許該超出詞語數(shù)量的情況,將"殘業(yè)力;少《L、 i 二 3 (加 班少的地方)"作為最終的提取結(jié)果。
提取用特殊表達(dá)列表的第3行L3023記述了,屬于"活動(dòng)表達(dá)"小 組的規(guī)定部位的詞語數(shù)量標(biāo)準(zhǔn)為l',僅將被認(rèn)定為提取中心(參照?qǐng)D33) 的核心用言作為提取結(jié)果。
例如,在用戶發(fā)話為"…活^dS仕事^ot:気5^;^/uTt (…
…已經(jīng)注意到這是充分利用我的經(jīng)驗(yàn)的工作)",并將"気^< (注意)" 作為提取中心的情況下,無法特意分割"気力'〈(注意)",所以,僅將 該核心用言作為提取結(jié)果,不執(zhí)行削減。
提取用特殊表達(dá)列表的第4行L3024記述了,屬于"有無表達(dá)"小 組的規(guī)定部位的詞語數(shù)量標(biāo)準(zhǔn)為2,在所取出的用戶發(fā)話部分(子樹)的
60詞語數(shù)量比基于該詞語數(shù)量標(biāo)準(zhǔn)而確定的上限個(gè)數(shù)多的情況下,刪除針 對(duì)提取中心(參照?qǐng)D33)的修飾要素中遠(yuǎn)離(提取中心)的修飾要素。
例如,如果用戶發(fā)話為"…伸W《L、 6 i : 3 。方力;社內(nèi)O勢(shì)。力; A "9《,d 6 (……因?yàn)椴粩喟l(fā)展的人在公司內(nèi)部似乎有氣勢(shì)",并將 "勢(shì)^ (氣勢(shì))"作為提取中心,則取出"社內(nèi)o勢(shì)v、(公司內(nèi)部的氣勢(shì))" (3個(gè)詞語)作為重復(fù)回復(fù)用的用戶發(fā)話部分(子樹)。"社內(nèi)。勢(shì)。(公 司內(nèi)部的氣勢(shì))"(3個(gè)詞語)在上限個(gè)數(shù)(3個(gè)詞語)以內(nèi),所以,原樣 將"社內(nèi)o勢(shì)^ (公司內(nèi)部的氣勢(shì))"作為提取結(jié)果。另外,沒有記載句 法樹,但是,"伸"《。3 t3 o方力、'(不斷發(fā)展的人)"與0子 々(似乎有……)"有直接關(guān)系,所以,從提取中心"勢(shì)^ (氣勢(shì))"來 看,"伸t/'T t、 3 t :: 3 o方力、'(不斷發(fā)展的人)"在提取對(duì)象以外。
變形部3014按照以下的內(nèi)部記錄的變形規(guī)則等,對(duì)提取部3013所 提取的提取結(jié)果的字符串進(jìn)行變形(整形)(S3103)。例如,預(yù)先準(zhǔn)備用 于變換為敬語的對(duì)應(yīng)表,在標(biāo)題匹配時(shí)進(jìn)行變形(變換)。作為例子,準(zhǔn) 備并應(yīng)用將"気。' < (注意)"變換為"気力'力> 札6 (注意)"(尊敬語), 將"自分(自己)"變換為"自分(自己)"(禮貌語)這種對(duì)應(yīng)表。除 此之外,例如在提取結(jié)果以名詞(句子)結(jié)束的情況下,附加"f十ta (是……吧?)"或"^t。。(是……吧。)"。最后,實(shí)施一般的語素生 成(與語素解析相反的步驟),以應(yīng)用不會(huì)使人感到奇怪的自然的日語形 式輸出。
另外,當(dāng)對(duì)象部位認(rèn)定部3012和提取部3013的處理結(jié)束時(shí),在無 法提取的情況下,不進(jìn)行重復(fù)回復(fù)應(yīng)答的系統(tǒng)發(fā)話。 (D-3)第4實(shí)施方式的效果
根據(jù)第4實(shí)施方式,預(yù)先準(zhǔn)備認(rèn)定用特殊表達(dá)列表,探尋用戶發(fā)話 中的意思/主觀表達(dá),優(yōu)先在應(yīng)答(系統(tǒng)發(fā)話)中利用意思/主觀表達(dá)或其 周邊的要素,所以,能夠有效地表現(xiàn)出對(duì)用戶的親近感。
此外,根據(jù)第4實(shí)施方式,與現(xiàn)有裝置不同,不僅提取謂語和語格 要素的中心語,還判斷優(yōu)先利用的部位,決定在應(yīng)答中利用哪個(gè)詞語或 其周邊要素,在此之上,刪除(追加)要素以符合事前設(shè)定的標(biāo)準(zhǔn)的長(zhǎng)度,所以,系統(tǒng)應(yīng)答的長(zhǎng)度為自然的長(zhǎng)度,能夠保證對(duì)話的自然度。
此外,根據(jù)第4實(shí)施方式,通過變形部3014對(duì)從用戶發(fā)話中取出的 部分應(yīng)用變形(換說法處理),使其成為最終的重復(fù)回復(fù)的系統(tǒng)發(fā)話,所 以,能夠防止應(yīng)答單調(diào)或不自然。
如上所述,有效地表現(xiàn)出親近感,并且,保證了對(duì)話的自然度,其 結(jié)果是,對(duì)話很活躍,容易從用戶收集信息。 (E)第5實(shí)施方式
接著,參照附圖詳細(xì)地說明本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的第 5實(shí)施方式。
圖35是示出第5實(shí)施方式的對(duì)話系統(tǒng)3010A的主要結(jié)構(gòu)的功能框 圖,對(duì)與第4實(shí)施方式的圖29相同、對(duì)應(yīng)的部分標(biāo)注相同標(biāo)號(hào)進(jìn)行表示。
第5實(shí)施方式的對(duì)話系統(tǒng)3010A在第4實(shí)施方式的對(duì)話系統(tǒng)3010 的結(jié)構(gòu)的基礎(chǔ)上,還具有下一話題選擇部3020和話題數(shù)據(jù)庫3021。
在話題數(shù)據(jù)庫(話題DB) 3021中存儲(chǔ)有對(duì)話方案信息和系統(tǒng)發(fā)話 等。例如,在介紹轉(zhuǎn)職公司的檢索裝置中組裝了對(duì)話系統(tǒng)3010A的情況 下,針對(duì)各項(xiàng)目,分層存儲(chǔ)與工作希望地點(diǎn)、希望年收入、工作時(shí)間(包 含可允許的加班時(shí)間)、星期幾工作等多個(gè)項(xiàng)目有關(guān)的系統(tǒng)發(fā)話(例如, 針對(duì)詢問工作希望地點(diǎn)的系統(tǒng)發(fā)話,如果用戶發(fā)話中希望關(guān)東地方,則 轉(zhuǎn)移到在更小區(qū)域中引出希望的系統(tǒng)發(fā)話),并且,存儲(chǔ)某個(gè)項(xiàng)目?jī)?nèi)的系 統(tǒng)發(fā)話的轉(zhuǎn)移方法(對(duì)話方案)、以及當(dāng)某個(gè)項(xiàng)目的信息收集結(jié)束時(shí),轉(zhuǎn) 移到哪個(gè)項(xiàng)目的系統(tǒng)發(fā)話的轉(zhuǎn)移方法(對(duì)話方案)等。
在第5實(shí)施方式中,對(duì)象部位認(rèn)定部3012在無法認(rèn)定對(duì)象部位的情 況下,向下一話題選擇部3020通知表示該意思的內(nèi)容,并且,在提取部 3013也無法進(jìn)行提取的情況下,向下一話題選擇部3020通知表示該意思 的內(nèi)容。下一話題選擇部3020在對(duì)象部位認(rèn)定或提取沒有成功的情況下, 按照話題數(shù)據(jù)庫3021的存儲(chǔ)內(nèi)容,取出系統(tǒng)發(fā)話(下一話題)并輸出。
根據(jù)第5實(shí)施方式,能夠發(fā)揮與第4實(shí)施方式相同的效果,并且還 發(fā)揮能夠通過系統(tǒng)的主導(dǎo)來轉(zhuǎn)換話題的效果。換言之,在僅有重復(fù)回復(fù) 應(yīng)答時(shí),可能出現(xiàn)不轉(zhuǎn)換封其他話題的情況,但是,該第5實(shí)施方式能夠避免該情況。
(F) 第6實(shí)施方式
接著,參照附圖詳細(xì)地說明本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的第 6實(shí)施方式。
圖36.是示出第6實(shí)施方式的對(duì)話系統(tǒng)3010B的主要結(jié)構(gòu)的功能框 圖,對(duì)與第4實(shí)施方式的圖29相同、對(duì)應(yīng)的部分標(biāo)注相同標(biāo)號(hào)進(jìn)行表示。
第6實(shí)施方式的對(duì)話系統(tǒng)3010B在第4實(shí)施方式的對(duì)話系統(tǒng)3010 的結(jié)構(gòu)的基礎(chǔ)上,在重復(fù)回復(fù)應(yīng)答生成部3015B內(nèi)具有換說法部3030。
換說法部3030內(nèi)置同義語句辭典,如果提取出的用戶發(fā)話部分的全 部或一部分語句能夠替換為其他的表達(dá),則進(jìn)行替換,將提取出的用戶 發(fā)話部分置換為內(nèi)容相同的其他表達(dá)。同義語句辭典例如是使某個(gè)語句 和其換說法語句成對(duì)的數(shù)據(jù)庫。例如,是將"^ * <回6 (順利進(jìn)行)" 作為索引,能夠獲得"》A — ^ (:進(jìn)tr (順利進(jìn)行)"作為替換語句的數(shù) 據(jù)庫。通過査找該數(shù)據(jù)庫,在從用戶發(fā)話中提取出"仕事力、'^玄 < 回3 (工作順利進(jìn)行)"這樣的短句的情況下,對(duì)其改變說法,成為"仕事" 7,厶--7 (二進(jìn)/u "C 。 3 (工作順利進(jìn)行)"。
變形部3014在換說法部3030沒有動(dòng)作的情況下,對(duì)提取部3013的 提取結(jié)果執(zhí)行變形處理,在換說法部3030動(dòng)作的情況下,對(duì)從換說法部 3030輸出的作為提取結(jié)果的換說法字符串執(zhí)行變形處理。
根據(jù)第6實(shí)施方式,能夠發(fā)揮與第4實(shí)施方式相同的效果,并且,
還能夠?qū)τ脩羰褂玫谋磉_(dá)進(jìn)行改變說法來形成系統(tǒng)發(fā)話,能夠防止重復(fù) 回復(fù)應(yīng)答的單調(diào)。
(G) 第7實(shí)施方式
接著,參照附圖詳細(xì)地說明本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的第 7實(shí)施方式。
圖37是示出第7實(shí)施方式的對(duì)話系統(tǒng)3010C的主要結(jié)構(gòu)的功能框 圖,對(duì)與第4實(shí)施方式的圖29相同、對(duì)應(yīng)的部分標(biāo)注相同標(biāo)號(hào)進(jìn)行表示。
第7實(shí)施方式的對(duì)話系統(tǒng)3010C在第4實(shí)施方式的對(duì)話系統(tǒng)3010 的結(jié)構(gòu)的基礎(chǔ)上,在重復(fù)回復(fù)應(yīng)答生成部3015C內(nèi)具有短句附加部3040。短句附加部3040內(nèi)置用于取出附加用短句(隨聲附和)的數(shù)據(jù)庫, 根據(jù)提取部3013的提取結(jié)果的內(nèi)容(或原本的用戶發(fā)話內(nèi)容),從"子 5 卞力> (是嗎)"、",b fe t & (好難過啊)"、"大変"C L & ft (不 得了)"、 " J:力、。& 1 tt (好棒啊)"等附加用短句中選擇適當(dāng)?shù)亩叹洹?例如,"尋5 t:'t力'(是嗎)"作為不考慮感情而附加的通用的短句來利 用。例如,將""C § (無法)"、" 6 M 。(……不能)"等詞條 和"o ^ t ft (好難過啊)"這樣的短句成對(duì)地保存在數(shù)據(jù)庫中,如 果在提取部3013提取出的結(jié)果中存在該數(shù)據(jù)庫的詞條,則選擇與其成對(duì) 的短句并發(fā)送到變形部3014C。并且,例如,也可以在圖33的認(rèn)定用特 殊表達(dá)列表中的小組中設(shè)置子組(如果是主觀表達(dá),則"^會(huì)3 (能夠)" 是相應(yīng)的肯定主觀表達(dá);"困3 (為難)"、"無理(難以辦到)"是相應(yīng)的 否定主觀表達(dá)),在用于取出附加用短句(隨聲附和)的數(shù)據(jù)庫的標(biāo)題側(cè) 利用子組名。
在短句附加部3040中的用于取出附加用短句(隨聲附和)的數(shù)據(jù)庫 中,還存儲(chǔ)附加位置信息,該附加位置信息規(guī)定是在附加對(duì)象的重復(fù)回 復(fù)應(yīng)答的前面附加還是在附加對(duì)象的重復(fù)回復(fù)應(yīng)答的末尾附加,短句附 加部3040將選擇短句和附加位置信息發(fā)送到變形部3014C。例如,"子 》t t力> (是嗎)"規(guī)定為在重復(fù)回復(fù)應(yīng)答的前面附加,",6 ^ "C t ti (好難過啊)"規(guī)定為在重復(fù)回復(fù)應(yīng)答的末尾附加。
變形部3014C在變形處理后的重復(fù)回復(fù)應(yīng)答的前面或末尾添加從短 句附加部3040發(fā)送來的短句(隨聲附和),作為系統(tǒng)發(fā)話輸出。
根據(jù)第7實(shí)施方式,能夠發(fā)揮與第4實(shí)施方式相同的效果,并且能 夠?qū)亩喾N短句中選擇的短句(隨聲附和)放入重復(fù)回復(fù)應(yīng)答中,所以, 能夠更強(qiáng)烈地發(fā)揮親近感。 (H)第8實(shí)施方式
接著,參照附圖詳細(xì)地說明本發(fā)明的對(duì)話系統(tǒng)、方法以及程序的第 8實(shí)施方式。
圖38是示出第8實(shí)施方式的對(duì)話系統(tǒng)3010D的主要結(jié)構(gòu)的功能框 圖,)^J"與第4實(shí)施方式的圖29相同、對(duì)應(yīng)的部分標(biāo)注相同標(biāo)號(hào)進(jìn)行表示。第8實(shí)施方式的對(duì)話系統(tǒng)3010D在第4實(shí)施方式的對(duì)話系統(tǒng)3010 的結(jié)構(gòu)的基礎(chǔ)上,在重復(fù)回復(fù)應(yīng)答生成部3015D內(nèi)具有系統(tǒng)發(fā)話確認(rèn)部 3050。并且,第8實(shí)施方式的對(duì)話系統(tǒng)3010D的構(gòu)成要素還有系統(tǒng)發(fā)話 履歷數(shù)據(jù)庫(系統(tǒng)發(fā)話履歷DB) 3051。
系統(tǒng)發(fā)話履歷數(shù)據(jù)庫3051至少存儲(chǔ)剛才的系統(tǒng)發(fā)話。例如,能夠?qū)?存儲(chǔ)對(duì)話(系統(tǒng)發(fā)話和用戶發(fā)話)履歷的數(shù)據(jù)庫用作第8實(shí)施方式的系 統(tǒng)發(fā)話履歷數(shù)據(jù)庫3051。
從對(duì)象部位認(rèn)定部3012D向系統(tǒng)發(fā)話確認(rèn)部3050提供要被認(rèn)定為對(duì) 象部位的要素詞語(參照?qǐng)D33的提取中心)的信息。系統(tǒng)發(fā)話確認(rèn)部3050 確認(rèn)要被認(rèn)定為對(duì)象部位的要素詞語是否與存在于系統(tǒng)發(fā)話履歷數(shù)據(jù)庫 3051中的剛才的系統(tǒng)發(fā)話所包含的詞語一致。在剛才的系統(tǒng)發(fā)話中包含 有要被認(rèn)定為對(duì)象部位的要素詞語的情況下,系統(tǒng)發(fā)話確認(rèn)部3050向?qū)?象部位認(rèn)定部3012D進(jìn)行通知,將該要素詞語從對(duì)象部位的認(rèn)定候選中 排除。
例如,在要被認(rèn)定為對(duì)象部位的要素詞語的候選為1個(gè)的情況下, 當(dāng)從對(duì)象部位的認(rèn)定候選中排除該要素詞語時(shí),針對(duì)本次的用戶發(fā)話不 進(jìn)行重復(fù)回復(fù)應(yīng)答。并且,例如,在要被認(rèn)定為對(duì)象部位的要素詞語的 候選為多個(gè)的情況下,當(dāng)從對(duì)象部位的認(rèn)定候選中排除一部分要素詞語 時(shí),從剩余的認(rèn)定候選中選擇一個(gè)。
根據(jù)第8實(shí)施方式,能夠發(fā)揮與第4實(shí)施方式相同的效果,并且將 重復(fù)回復(fù)應(yīng)答的候選與過去的系統(tǒng)發(fā)話進(jìn)行比較,所以,能夠防止由于 重復(fù)回復(fù)應(yīng)答而使相同內(nèi)容的系統(tǒng)發(fā)話重復(fù),能夠?qū)崿F(xiàn)自然的對(duì)話。 (I)其他實(shí)施方式
在所述實(shí)施方式的說明中言及了各種變形實(shí)施方式,但是,可以進(jìn) 一步列舉以下所例示的變形實(shí)施方式。
所述各實(shí)施方式的技術(shù)特征如果可以組合起來應(yīng)用,則也可以組合 起來應(yīng)用。
在第4實(shí)施方式中,示出利用包含圖33所示的具體的特殊表達(dá)在內(nèi) 的認(rèn)定用特殊表達(dá)列表,同時(shí)認(rèn)定重復(fù)回復(fù)的對(duì)象部位的情況,但是,除此之外,也可以利用屬性和屬性值等來認(rèn)定重復(fù)回復(fù)的對(duì)象部位。例 如,可以利用屬于時(shí)間屬性或地域?qū)傩缘谋磉_(dá)來認(rèn)定重復(fù)回復(fù)的對(duì)象部
位。在用戶發(fā)話為"殘業(yè)tt 2時(shí)間以內(nèi)t:-a願(yuàn)L、 L t t (希望加班在2 小時(shí)以內(nèi))"或"30分以內(nèi)o殘業(yè)力;良^"C t (可以加班30分鐘以內(nèi))" 時(shí),可以利用時(shí)間屬性來認(rèn)定對(duì)象部位,使得"2時(shí)間以內(nèi)(2小時(shí)以內(nèi))"、 "30分以內(nèi)(30分鐘以內(nèi))"成為重復(fù)回復(fù)的對(duì)象部位的認(rèn)定候選。關(guān) 于屬性值,也可以預(yù)先確定圖33那樣的提取中心、圖34那樣的詞語數(shù) 量標(biāo)準(zhǔn)和提取規(guī)則。
在第5實(shí)施方式中,示出在沒有得到重復(fù)回復(fù)的情況下將系統(tǒng)發(fā)話 切換為下一話題的情況,但是,在得到重復(fù)回復(fù)的情況下,也可以將系 統(tǒng)發(fā)話切換為下一話題。例如,可以對(duì)重復(fù)回復(fù)應(yīng)答的連續(xù)次數(shù)進(jìn)行計(jì) 數(shù),當(dāng)連續(xù)次數(shù)達(dá)到規(guī)定次數(shù)時(shí),將下一次的系統(tǒng)發(fā)話切換為下一話題。 該情況下,可以在下一話題之前附加重復(fù)回復(fù)應(yīng)答,作為系統(tǒng)發(fā)話。
在第6實(shí)施方式中,示出改變說法的候選為1個(gè)的情況,但是,也 可以對(duì)同一改變說法前的詞語準(zhǔn)備多個(gè)改變說法詞語的候選。該情況下, 改變說法時(shí)應(yīng)用最早進(jìn)行的改變說法詞語的候選即可。
在第7實(shí)施方式中,示出在短句附加條件成立時(shí)一直附加短句的情 況,但是,也可以根據(jù)附加的連續(xù)次數(shù)和附加比例等,來決定在短句附 加條件成立時(shí)是否附加短句。例如,在連續(xù)進(jìn)行了 2次短句的附加后的 下一次的系統(tǒng)發(fā)話中不附加短句。
在第8實(shí)施方式中,示出在對(duì)象部位的要素詞語候選包含于剛才的 系統(tǒng)發(fā)話中的情況下將該要素詞語從候選中排除的情況,但是,也可以 在該要素詞語包含于過去幾次系統(tǒng)發(fā)話中的情況下,從候選中排除該要 素詞語。
在所述實(shí)施方式中,對(duì)使用日語的情況進(jìn)行了說明,但是,本發(fā)明 不限于此,例如也可以應(yīng)用英語等其他語言。
在所述實(shí)施方式中,使用日本的地名等,但是,本發(fā)明不限于此, 例如也可以應(yīng)用美國(guó)等其他國(guó)家的地名。
檢索系統(tǒng)可以包含第1 第8實(shí)施方式的至少2個(gè)實(shí)施方式。
權(quán)利要求
1. 一種信息檢索裝置,該信息檢索裝置包含用戶發(fā)話解析單元,其通過與用戶的對(duì)話,針對(duì)多個(gè)屬性分別向用戶提出提問語句,根據(jù)用戶針對(duì)該提問語句的回答語句,對(duì)針對(duì)各個(gè)所述屬性的屬性值進(jìn)行解析;用戶數(shù)據(jù)保持單元,其保持用戶數(shù)據(jù),作為所述用戶發(fā)話解析單元的解析結(jié)果,在所述用戶數(shù)據(jù)中將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的用戶的屬性值對(duì)應(yīng)起來;匹配單元,其參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答得到的所述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù)中選出與該用戶數(shù)據(jù)的各個(gè)所述屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象數(shù)據(jù)候選;以及對(duì)話控制單元,其向用戶側(cè)輸出由所述匹配單元選出的各個(gè)所述對(duì)象數(shù)據(jù)候選。
2. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中, 所述匹配單元包括評(píng)價(jià)值計(jì)算部,其在所述屬性值的取得比例小于規(guī)定值的情況下, 計(jì)算所述用戶數(shù)據(jù)中的針對(duì)所述所有屬性的各個(gè)所述屬性值的評(píng)價(jià)值; 以及屬性選擇部,其參照規(guī)定的屬性判定規(guī)則,進(jìn)行與所述評(píng)價(jià)值計(jì)算 部的評(píng)價(jià)值計(jì)算結(jié)果對(duì)應(yīng)的屬性選擇處理。
3. 根據(jù)權(quán)利要求2所述的信息檢索裝置,其中, 所述屬性選擇部從進(jìn)行優(yōu)先級(jí)高的屬性開始依次選擇進(jìn)行與用戶之間的對(duì)話的對(duì)話方案。
4. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中, 所述對(duì)話控制單元從與所述用戶的輸出優(yōu)先級(jí)高的屬性相匹配的所述對(duì)象數(shù)據(jù)候選開始依次進(jìn)行輸出。
5. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中,通過對(duì)話管理裝置進(jìn)行與用戶的對(duì)話,該對(duì)話管理裝置包含對(duì)話方案數(shù)據(jù)庫,其存儲(chǔ)多個(gè)對(duì)話方案;方案選擇單元,其從所述對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元 所請(qǐng)求的信息有關(guān)的對(duì)話方案;應(yīng)答生成單元,其根據(jù)由所述方案選擇單元所選擇的所述對(duì)話方案, 生成與所述所請(qǐng)求的信息有關(guān)的應(yīng)答語句,將該應(yīng)答語句提供給用戶終端;行動(dòng)決定單元,其從回答語句解析單元接受屬性和針對(duì)所述屬性的 屬性值作為回答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì) 話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè) 所述對(duì)話方案決定之后的行動(dòng),其中,回答語句解析單元對(duì)針對(duì)所述應(yīng) 答語句的用戶回答語句進(jìn)行解析;以及對(duì)話控制單元,其按照由所述行動(dòng)決定單元所決定的之后的行動(dòng), 進(jìn)行與用戶之間的對(duì)話控制。
6. 根據(jù)權(quán)利要求5所述的信息檢索裝置,其中,在對(duì)話管理裝置中,各個(gè)所述對(duì)話方案具有通常方案,其引出與 所述屬性有關(guān)的用戶的屬性值;以及特別方案,其用于在與用戶的對(duì)話 中應(yīng)對(duì)來自用戶的不規(guī)則發(fā)話、或順利地進(jìn)行與用戶的對(duì)話。
7. 根據(jù)權(quán)利要求5所述的信息檢索裝置,其中, 在對(duì)話管理裝置中,各個(gè)所述對(duì)話方案對(duì)所述屬性、所述應(yīng)答條件、表示符合所述應(yīng)答條件時(shí)隨后執(zhí)行的動(dòng)作的應(yīng)答動(dòng)作進(jìn)行定義。
8. 根據(jù)權(quán)利要求6所述的信息檢索裝置,其中, 在對(duì)話管理裝置中,各個(gè)所述對(duì)話方案的應(yīng)答動(dòng)作包含應(yīng)答語句繼續(xù)信息,該應(yīng)答語句繼續(xù)信息具有用于繼續(xù)或結(jié)束該對(duì)話方案的應(yīng)答、 或者調(diào)出其他對(duì)話方案的信息。
9. 根據(jù)權(quán)利要求5所述的信息檢索裝置,其中,在對(duì)話管理裝置中,所述行動(dòng)決定單元根據(jù)所述屬性和所述屬性值 從所述對(duì)話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案 時(shí),從所述特別方案中進(jìn)行檢索,然后從所述通常方案中進(jìn)行檢索。
10. 根據(jù)權(quán)利要求5所述的信息檢索裝置,其中,在對(duì)話管理裝置中,對(duì)所述對(duì)話方案的各個(gè)所述應(yīng)答動(dòng)作賦予優(yōu)先 級(jí),在所述行動(dòng)決定單元檢索了多個(gè)所述對(duì)話方案的情況下,所述對(duì)話 控制單元按照賦予所述應(yīng)答動(dòng)作的所述優(yōu)先級(jí),執(zhí)行所述各對(duì)話方案的 所述應(yīng)答動(dòng)作。
11. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中,通過潛在意向提 取系統(tǒng)根據(jù)與用戶之間相互的對(duì)話信息來提取用戶的潛在意向,所述潛 在意向提取系統(tǒng)包含-對(duì)話管理裝置,其對(duì)用戶的用戶終端提供應(yīng)答語句,接受針對(duì)所述應(yīng)答語句的回答語句,按照規(guī)定的對(duì)話方案進(jìn)行與用戶的對(duì)話;回答語句解析裝置,其對(duì)從所述用戶終端接受的用戶回答語句進(jìn)行解析;以及對(duì)話信息蓄積裝置,其按照每個(gè)用戶蓄積每個(gè)所述對(duì)話方案的對(duì)話 信息,其中,所述對(duì)話管理裝置包含.-對(duì)話方案數(shù)據(jù)庫,其存儲(chǔ)多個(gè)對(duì)話方案;方案選擇單元,其從所述對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元 所請(qǐng)求的信息有關(guān)的對(duì)話方案;應(yīng)答生成單元,其根據(jù)由所述方案選擇單元所選擇的所述對(duì)話方案, 生成與所述所請(qǐng)求的信息有關(guān)的應(yīng)答語句,將該應(yīng)答語句提供給用戶終4山頓;行動(dòng)決定單元,其從回答語句解析單元接受屬性和針對(duì)所述屬性的 屬性值作為回答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì) 話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè) 所述對(duì)話方案決定之后的行動(dòng),其中,回答語句解析單元對(duì)針對(duì)所述應(yīng) 答語句的用戶回答語句進(jìn)行解析;以及對(duì)話控制單元,其按照由所述行動(dòng)決定單元所決定的之后的行動(dòng), 進(jìn)行與用戶之間的對(duì)話控制。
12. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中,通過信息提取裝置根據(jù)來自用戶的回答語句得到屬性,所述信息提取裝置包含-知識(shí)數(shù)據(jù)庫,其系統(tǒng)地對(duì)多個(gè)領(lǐng)域的多個(gè)術(shù)語的關(guān)系進(jìn)行分類; 輸入單元,其取入輸入信息;信息提取單元,當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性 時(shí),所述信息提取單元使用所述知識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域 的知識(shí),提取所述輸入信息中包含的針對(duì)所述屬性的屬性值;以及提取信息存儲(chǔ)單元,其將由所述信息提取單元提取出的所述屬性和 該屬性的所述屬性值對(duì)應(yīng)起來進(jìn)行存儲(chǔ)。
13. 根據(jù)權(quán)利要求12所述的信息檢索裝置,其中,在所述的信息提取裝置中,所述信息提取單元具有信息提取方法決 定部,所述信息提取方法決定部根據(jù)規(guī)定的指定信息來決定從所述輸入 信息中提取所述屬性值的提取方法。
14. 根據(jù)權(quán)利要求13所述的信息檢索裝置,其中, 在所述的信息提取裝置中,所述信息提取單元通過所述知識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域知識(shí)和構(gòu)成所述輸入信息的字符串或形態(tài)解 析結(jié)果之間的匹配,來提取針對(duì)所述屬性的所述屬性值。
15. 根據(jù)權(quán)利要求13所述的信息檢索裝置,其中, 在所述的信息提取裝置中,在所述輸入信息是由具有所述屬性和所述屬性值的對(duì)應(yīng)關(guān)系的規(guī)定語句結(jié)構(gòu)構(gòu)成的情況下,所述信息提取單元 通過所述輸入信息的句法解析,提取所述規(guī)定的語句結(jié)構(gòu)。
16. 根據(jù)權(quán)利要求13所述的信息檢索裝置,其中, 在所述信息提取裝置中,所述信息提取單元提取所述輸入信息中所包含的表示用戶的意圖的信息。
17. 根據(jù)權(quán)利要求1所述的信息檢索裝置,其中,通過對(duì)話系統(tǒng)進(jìn) 行與用戶的對(duì)話,該對(duì)話系統(tǒng)在人和作為與人之間的界面的裝置之間接 收和發(fā)送自然語言語句的數(shù)據(jù),來進(jìn)行與人的對(duì)話,所述對(duì)話系統(tǒng)包含解析部,其對(duì)人的發(fā)話進(jìn)行解析;對(duì)象部位認(rèn)定部,其利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提 取系統(tǒng)發(fā)話用的要素的對(duì)象部位;以及提取部,其根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使系統(tǒng) 發(fā)話成為適當(dāng)?shù)拈L(zhǎng)度。,
18. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中,所述對(duì)話系統(tǒng)還包含變形部,所述變形部將所提取的人的發(fā)話要素 變形為自然的形式,作為系統(tǒng)發(fā)話。
19. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 在對(duì)話系統(tǒng)中,根據(jù)人的發(fā)話中所使用的特定表達(dá)的種類的不同,所述對(duì)象部位認(rèn)定部認(rèn)定的對(duì)象部位不同。
20. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 在對(duì)話系統(tǒng)中,根據(jù)人的發(fā)話中所使用的特定表達(dá)的種類的不同,所述提取部的提取方法不同。
21. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 所述對(duì)話系統(tǒng)還包含下一話題選擇部,所述下一話題選擇部在所述對(duì)象部位認(rèn)定部的對(duì)象部位認(rèn)定未成功的情況下,或所述提取部的提取 未成功的情況下,從話題數(shù)據(jù)庫中取出與下一話題有關(guān)的系統(tǒng)發(fā)話并輸 出。
22. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 所述對(duì)話系統(tǒng)還包含換說法部,所述換說法部將由所述提取部提取出的要素詞語變換為其他表達(dá)。
23. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 所述對(duì)話系統(tǒng)還包含短句附加部,在由所述提取部提取出的要素詞語或人的發(fā)話中包含成為隨聲附和的觸發(fā)的詞語的情況下,所述短句附 加部生成與其相稱的隨聲附和的短句,其中,在根據(jù)所述提取部的提取結(jié)果而確定的系統(tǒng)應(yīng)答中附加隨聲 附和短句,作為最終的系統(tǒng)應(yīng)答。
24. 根據(jù)權(quán)利要求17所述的信息檢索裝置,其中, 所述對(duì)話系統(tǒng)還包含系統(tǒng)發(fā)話確認(rèn)部,所述系統(tǒng)發(fā)話確認(rèn)部確認(rèn)所述對(duì)象部位認(rèn)定部要認(rèn)定的對(duì)象部位的詞語是否與之前幾次的系統(tǒng)發(fā)話 中所包含的詞語一致,其中,所述對(duì)象部位認(rèn)定部在認(rèn)定對(duì)象部位時(shí),詢問所述系統(tǒng)發(fā)話 確認(rèn)部,在與之前幾次的系統(tǒng)發(fā)話中所包含的詞語一致的情況下,不將 其作為對(duì)象部位。
25. —種信息檢索系統(tǒng),所述信息檢索系統(tǒng)包含信息檢索裝置;對(duì)話管理裝置;信息提取裝置;以及對(duì)話系統(tǒng),其中,所述信息檢索裝置包含-用戶發(fā)話解析單元,其通過與用戶之間的對(duì)話,針對(duì)多個(gè)屬性分別 向用戶提出提問語句,根據(jù)用戶針對(duì)該提問語句的回答語句,對(duì)針對(duì)各 個(gè)所述屬性的屬性值進(jìn)行解析;用戶數(shù)據(jù)保持單元,其保持用戶數(shù)據(jù),作為所述用戶發(fā)話解析單元 的解析結(jié)果,在所述用戶數(shù)據(jù)中將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的 用戶的屬性值對(duì)應(yīng)起來;匹配單元,其參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答得到的所述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù) 中選出與該用戶數(shù)據(jù)的各個(gè)所述屬性和各個(gè)所述屬性值相匹配的至少一 個(gè)對(duì)象數(shù)據(jù)候選;以及對(duì)話控制單元,其向用戶側(cè)輸出由所述匹配單元選出的各個(gè)所述對(duì) 象數(shù)據(jù)候選,所述對(duì)話管理裝置包含對(duì)話方案數(shù)據(jù)庫,其存儲(chǔ)多個(gè)對(duì)話方案;方案選擇單元,其從所述對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元 所請(qǐng)求的信息有關(guān)的對(duì)話方案;應(yīng)答生成單元,其根據(jù)由所述方案選擇單元所選擇的所述對(duì)話方案, 生成與所述所請(qǐng)求的信息有關(guān)的應(yīng)答語句,將該應(yīng)答語句提供給用戶終 端;行動(dòng)決定單元,其從回答語句解析單元接受屬性和針對(duì)所述屬性的 屬性值作為回答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì) 話方案數(shù)據(jù)庫中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè) 所述對(duì)話方案決定之后的行動(dòng),其中,回答語句解析單元對(duì)針對(duì)所述應(yīng) 答語句的用戶回答語句進(jìn)行解析;以及對(duì)話控制單元,其按照由所述行動(dòng)決定單元所決定的之后的行動(dòng), 進(jìn)行與用戶之間的對(duì)話控制,所述信息提取裝置包含知識(shí)數(shù)據(jù)庫,其系統(tǒng)地對(duì)多個(gè)領(lǐng)域的多個(gè)術(shù)語的關(guān)系進(jìn)行分類; 輸入單元,其取入輸入信息;信息提取單元,當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性 時(shí),所述信息提取單元使用所述知識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域 的知識(shí),提取所述輸入信息中包含的針對(duì)所述屬性的屬性值;以及提取信息存儲(chǔ)單元,其將由所述信息提取單元提取出的所述屬性和 該屬性的所述屬性值對(duì)應(yīng)起來進(jìn)行存儲(chǔ),所述對(duì)話系統(tǒng)包含解析部,其對(duì)人的發(fā)話進(jìn)行解析;對(duì)象部位認(rèn)定部,其利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提 取系統(tǒng)發(fā)話用的要素的對(duì)象部位;以及提取部,其根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使系統(tǒng) 發(fā)話成為適當(dāng)?shù)拈L(zhǎng)度。
26. —種信息檢索方法,該信息檢索方法包含(a) 通過與用戶的對(duì)話,針對(duì)多個(gè)屬性分別向用戶提出提問語句,根據(jù)用戶針對(duì)該提問語句的回答語句,對(duì)針對(duì)各個(gè)所述屬性的屬性值進(jìn)行解析;(b) 保持用戶數(shù)據(jù),作為(a)中的解析結(jié)果,在所述用戶數(shù)據(jù)中 將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的用戶的屬性值對(duì)應(yīng)起來;(c) 參照所述用戶數(shù)據(jù),針對(duì)所有屬性,在從用戶的回答得到的所 述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù)中選出與該用戶數(shù)據(jù)的所述各個(gè)屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象數(shù)據(jù)候選;以及(d)向用戶側(cè)輸出在(c)中選出的各個(gè)所述對(duì)象數(shù)據(jù)候選。
27. 根據(jù)權(quán)利要求26所述的信息檢索方法,其中,通過以下的對(duì)話 管理方法進(jìn)行與用戶的對(duì)話,所述對(duì)話管理方法包含-(a) 從對(duì)話方案數(shù)據(jù)庫中選擇與從信息請(qǐng)求單元所請(qǐng)求的信息有關(guān) 的對(duì)話方案;(b) 根據(jù)在(a)中所選擇的所述對(duì)話方案,生成與所述所請(qǐng)求的 信息有關(guān)的應(yīng)答語句,將所述應(yīng)答語句提供給用戶終端;(c) 從回答語句解析單元接受屬性和針對(duì)所述屬性的屬性值作為回 答語句解析結(jié)果,根據(jù)所述屬性和所述屬性值,從所述對(duì)話方案數(shù)據(jù)庫 中檢索符合應(yīng)答條件的至少一個(gè)所述對(duì)話方案,按照各個(gè)所述對(duì)話方案 決定之后的行動(dòng),其中,所述回答語句解析單元對(duì)針對(duì)所述應(yīng)答語句的 用戶回答語句進(jìn)行解析;以及(d) 按照在(c)中所決定的之后的行動(dòng),進(jìn)行與用戶之間的對(duì)話控制。
28. 根據(jù)權(quán)利要求26所述的信息檢索方法,其中,通過信息提取方 法根據(jù)來自用戶的回答語句得到屬性,所述信息提取方法包含(a) 取入輸入信息;(b) 當(dāng)檢測(cè)出所述輸入信息中所包含的提取對(duì)象的屬性時(shí),使用知 識(shí)數(shù)據(jù)庫中的與所述屬性有關(guān)的領(lǐng)域的知識(shí),提取所述輸入信息中包含 的針對(duì)所述屬性的屬性值;以及(c) 將在(b)中提取出的所述屬性和該屬性的所述屬性值對(duì)應(yīng)起 來進(jìn)行存儲(chǔ)。
29. 根據(jù)權(quán)利要求26所述的信息檢索方法,其中,通過對(duì)話方法在 對(duì)話系統(tǒng)和作為與人之間的界面裝置之間接收和發(fā)送自然語言語句的數(shù) 據(jù),來進(jìn)行與人的對(duì)話,所述對(duì)話系統(tǒng)包括解析部、對(duì)象部位認(rèn)定部、以及提取部,所述對(duì)話方法包含所述解析部對(duì)人類的發(fā)話進(jìn)行解析;所述對(duì)象部位認(rèn)定部利用所述解析結(jié)果,認(rèn)定用于從人的發(fā)話中提 取系統(tǒng)發(fā)話用的要素的對(duì)象部位;以及所述提取部根據(jù)所述對(duì)象部位,從人的發(fā)話中提取要素,以使系統(tǒng) 發(fā)話成為適當(dāng)?shù)拈L(zhǎng)度。
全文摘要
本發(fā)明提供信息檢索系統(tǒng)。用戶發(fā)話解析單元針對(duì)多個(gè)屬性分別向用戶提出提問語句,根據(jù)來自用戶的回答語句,對(duì)針對(duì)各個(gè)所述屬性的屬性值進(jìn)行解析。用戶數(shù)據(jù)保持單元保持將所述多個(gè)屬性和針對(duì)各個(gè)所述屬性的用戶的屬性值對(duì)應(yīng)起來的用戶數(shù)據(jù),作為解析結(jié)果。匹配單元針對(duì)所有屬性,在從用戶的回答得到的所述屬性值的取得比例在規(guī)定值以上的情況下,從多個(gè)對(duì)象數(shù)據(jù)中選出與各個(gè)所述屬性和各個(gè)所述屬性值相匹配的至少一個(gè)對(duì)象數(shù)據(jù)候選。對(duì)話控制單元向用戶側(cè)輸出所選出的各個(gè)所述對(duì)象數(shù)據(jù)候選。
文檔編號(hào)G06F17/30GK101510197SQ200810176359
公開日2009年8月19日 申請(qǐng)日期2008年11月20日 優(yōu)先權(quán)日2008年2月15日
發(fā)明者下畑紗遙利, 介弘達(dá)哉, 北村美穗子, 山本剛史, 村田稔樹, 池野篤司, 福島直士 申請(qǐng)人:沖電氣工業(yè)株式會(huì)社