專利名稱:詢問應答系統(tǒng)及詢問應答方法
技術領域:
本發(fā)明涉及對用戶輸入的詢問輸出應答的詢問應答系統(tǒng)。
背景技術:
以因特網(wǎng)的檢索引擎為代表的檢索適合用戶檢索要求的文件并進行歸類的文件檢索技術正廣為普及。但在文件檢索中,“想閱讀有關……的新聞報道”、“想查閱有關……的萬維網(wǎng)頁”之類的檢索要求雖可滿足,而對于“○×公司的經(jīng)理是誰?”、“富士山高幾許?”、“鯨魚是否將要滅絕?”這類的詢問,則不能應答。這就是說,文件檢索不過是對文件或文件中的一節(jié)作出應答,用戶還必須根據(jù)文件檢索的輸出結果,自己探索應答。
作為對于輸入的詢問輸出應答的機構已有詢問應答系統(tǒng)。詢問應答系統(tǒng),例如對于“○×公司的經(jīng)理是誰?”這類問題并不輸出○×公司主頁等有關○×公司的文件,而是輸出○×公司的經(jīng)理姓名的應答。此外,對于“富士山高幾許”這種詢問,則輸出“富士山高3776m”的應答。詢問應答系統(tǒng)例如非特許文獻1Wendy G.Lehnert“TheProcess of Question Answering-A Computer Simulation ofCognition”,Lawrence Erlbaum Associates,Publishers,HillsdateNew Jersey,1978所示,過去都是作為擴展系統(tǒng)的一種進行研究,但近年來則作為信息檢索與信息提取等研究的發(fā)展形式重新受到注意。
例如接受日語詢問,應用日語知識源生成應答的單語言詢問應答系統(tǒng),通過利用已有的信息檢索技術(探索出包含特定單詞的文本的技術)與信息提取技術(例如提取出人名、地名、數(shù)值等特定種類信息的技術)的組合,能夠在某種程度上容易實現(xiàn)。但是在應用單語言知識源生成應答的單語言詢問系統(tǒng)中存在下述問題。
第一個問題是,為了制成對應于詢問的應答,必要的信息量不充分,而這將關系到應答覆蓋率與可靠性的降低。例如為了應答日語的詢問,有時必要的信息雖于英語的萬維網(wǎng)頁上有記載但在日語的萬維網(wǎng)頁上卻沒有記述,因而不能在實際中應用這種英語信息,而日語單語言詢問系統(tǒng)在構成應答時是失敗的。這就是覆蓋率的問題。又例如,對于“○×社の社長は誰か?”這樣的詢問,對于從日語知識源可以檢索到“○×社の社長はA氏である”與“○×社の社長はB氏である”這樣兩種應答候選而從英語知識源只能檢索到“The presidentof ○× Corporation is Mr.A”這樣一種應答候選的情形,只能有效利用日語知識源的日語單語言詢問應答系統(tǒng),就不能判定應答A氏與B氏哪一個的可靠性高。但在實際中可以認為,作為綜合了日語知識與英語知識的A氏的應答,其可靠性高。再有,與詢問應答系統(tǒng)不同的技術,已知有這樣的信息檢索裝置(例如參考特許文獻1特開平11-219368號公報),它能在即使檢索對象數(shù)據(jù)庫的描述語言與輸入關鍵詞的描述語言不同的情形,也可對于輸入的關鍵詞獲得確實的檢索結果的輸出。
第二個問題是,為了構成對應于詢問的應答,所需的信息在本質上會有偏見。例如對于“鯨魚是否將要滅絕?”的詢問,當作為知識源只利用由進行捕鯨的國家的語言所寫成的萬維網(wǎng)頁上,就只能得到“鯨魚并非將要滅絕,而是某種鯨魚正在增殖”這樣內容的應答,相反,當只把禁止捕鯨或反對捕鯨的國家語言所寫成的萬維網(wǎng)頁用作知識源時,則僅僅能獲得“鯨魚由于捕鯨國的濫捕正處于滅絕中”這樣的內容回答。這樣,若將語言限定,就有可能將原本為多樣性的觀點加以限制。
第三個問題是,每種語言知識源的充實度相異。由于知識源的充實度不同,在許多情形下,會對于某個特定的詢問最好是利用對這種詢問的應答有充實性的語言A的知識源,而對于另一特定的詢問則最好不利用語言A而利用對于此詢問的應答充實的語言B的知識源。例如對于有關伊麗莎白女王的詢問,英語的萬維網(wǎng)頁也許是最充實的知識源,而有關相撲的詢問則日語的萬維網(wǎng)頁或許是最充實的知識源。在這類情形下,不能處理此種充實度不同的單語言詢問應答系統(tǒng),取決于詢問,應答在實質上有很大的偏離。
發(fā)明內容
本發(fā)明是在考慮到上述問題后而提出的,目的是在對于用戶輸入的詢問輸出應答的詢問應答系統(tǒng)中,有效地利用語言不同的許多知識源,由此來提高應答的覆蓋率、可靠性、多樣性與穩(wěn)定性。
本發(fā)明的詢問應答系統(tǒng)是包括對于用戶以第一語言輸入的詢問,應用具有此第一語言知識源的第一知識數(shù)據(jù)庫和具有第二語言知識源的第二知識數(shù)據(jù)庫求得應答的詢問應答系統(tǒng),其特征在于此系統(tǒng)具有對于上述詢問檢索上述第一知識數(shù)據(jù)庫求得第一語言的應答候選的單元;將上述詢問機械翻譯成第二語言的單元;對于翻譯成上述第二語言的詢問,檢索上述第二知識數(shù)據(jù)庫求得第二語言的應答候選的單元;將上述第二語言的應答候選機械翻譯成第一語言的單元;以及將上述第一語言的應答候選與上述第二語言的應答候選機械翻譯成第一語言的結果全都依據(jù)預定基準排序的單元。
在上述詢問應答系統(tǒng)的結構中,還具有基于上述排序從上述應答候選中確定其中之一應答的單元。
也可以將上述第一與第二數(shù)據(jù)庫中檢索命中件數(shù)的多少作為上述基準。
還具備有通過字句處理確定上述各個應答候選的簡明性或網(wǎng)羅度的單元,而也可將此簡明性或網(wǎng)羅度作為上述基準。
本發(fā)明的詢問應答方法是包括對于用戶以第一語言輸入的詢問,應用具有此第一語言知識源的第一數(shù)據(jù)庫和具有第二語言知識源的第二知識數(shù)據(jù)庫求得應答的詢問應答方法。其特征在于此方法具有對于上述詢問檢索上述第一知識數(shù)據(jù)庫求得第一語言的應答候選的步驟;將上述詢問機械翻譯成第二語言的步驟;對于翻譯成上述第二語言的詢問,檢查上述第二知識數(shù)據(jù)庫求得第二語言的應答候選的步驟;將上述第二語言的應答候選機械翻譯成第一語言的步驟;以及將上述第一語言的應答候選與上述第二語言的應答候選機械翻譯成第一語言的結果全都依據(jù)預定基準排列順序的步驟。
在上述詢問應答方法中,還具有基于上述順序從上述應答候選中確定其中之一應答的步驟。
也可以將上述第一與第二數(shù)據(jù)庫中檢索命中件數(shù)的多少作為上述基準。
還具備有通過字句處理確定上述各個應答候選簡明性或網(wǎng)羅度的步驟,而也可將此簡明性或網(wǎng)羅度作為上述基準。
本發(fā)明的詢問應答程序是包括對于用戶以第一語言輸入的詢問,應用具有此第一語言知識源的第一數(shù)據(jù)庫和具有第二語言知識源的第二知識數(shù)據(jù)庫求得應答的詢問應答程序,其特征在于此程序包括對于上述詢問檢索上述第一知識數(shù)據(jù)庫求得第一語言的應答候選的過程;將上述詢問機械翻譯成第二語言的過程;對于翻譯成上述第二語言的詢問,檢查上述第二知識數(shù)據(jù)庫求得第二語言的應答候選的過程;將上述第二語言的應答候選機械翻譯成第一語言的過程;以及將上述第一語言的應答候選與上述第二語言的應答候選機械翻譯成第一語言的結果全都依據(jù)預定基準排列順序的過程。
在上述詢問應答程序中,還具有基于上述排列順序從上述應答候選中確定其中之一應答的過程。
還具備有通過字句處理確定上述各個應答候選簡明性或網(wǎng)羅度的過程,而也可將此簡明性或網(wǎng)羅度作為上述基準。
如上所述,根據(jù)本發(fā)明的對于用戶輸入的詢問而輸出應答的詢問應答系統(tǒng),可以有效地利用語言不同的多個知識源,能夠因此提高應答的覆蓋率、可靠性、多樣性與穩(wěn)定性。
圖1是概示本發(fā)明一實施形式的詢問應答系統(tǒng)結構的框圖。
圖2是例示實施形式的信息提取單元中處理步驟的流程圖。
圖3是例示實施形式的檢索單元中處理步驟的流程圖。
圖4是例示實施形式的翻譯單元中處理步驟的流程圖。
圖5是例示實施形式的應答構成單元中處理步驟的流程圖。
圖6示明由實施形式的詢問應答系統(tǒng)求得的應答候選的輸出方法的一例。
圖7示明由實施形式的詢問應答系統(tǒng)求得的應答候選的輸出方法的另一例。
具體實施形式下面參照
本發(fā)明的實施形式。
圖1是概示本發(fā)明一實施形式的詢問應答系統(tǒng)結構的框圖。這種詢問應答系統(tǒng)例如可用通用計算機以及于此計算機上工作的軟件實現(xiàn)。而且包括由輸入單元與輸出單元組成的用戶接口4、檢索單元10、信息提取單元15、應答生成單元與翻譯單元19。用戶接口4采用鍵盤或鼠標等輸入裝置、顯示器等輸出裝置與硬件、檢索單元10、信息提取單元15、應答生成單元18、翻譯單元19能作為在通用操作系統(tǒng)下工作的計算機程序模塊實現(xiàn)。
本發(fā)明雖然包含處理任意多種語言知識源的情形,但在實施形式的說明中,為方便起見,設定處理語言1與語言2組成的兩種語言的知識源,例如語言1假設為“日語”,語言2假設為“英語”。
下面首先說明本系統(tǒng)的整體處理步驟,然后詳述主要模塊的具體處理步驟。
整體處理步驟圖1中以虛線箭頭示明關于詢問的信息流,以實線箭頭示明關于應答的信息流。
信息提取單元15首先從以多種語言描述的文件16、17中進行信息提取,對每一種語言形成知識數(shù)據(jù)庫13、14。
當用戶從輸入單元6輸入語言1(在此為日語)的詢問后,此輸入的詢問即轉送給輸入單元6檢索單元10與翻譯單元19。翻譯單元19將此詢問翻譯成語言2(在此為英語)的詢問,轉送給檢索單元10。
檢索單元10對于輸入單元6轉送來的詢問檢索語言1(日語)的知識數(shù)據(jù)庫(下面稱作“日語知識數(shù)據(jù)庫”)13,再對由翻譯單元19翻譯成英語的詢問檢索語言2(英語)的知識數(shù)據(jù)庫(下面稱作英語知識數(shù)據(jù)庫)14。將這樣求得的日語知識數(shù)據(jù)庫13的檢索結果(語言1的應答候選)轉送給應答生成單元18,而將英語知識數(shù)據(jù)庫14的檢索結果(語言2的應答候選)轉送給翻譯單元19。然后翻譯單元19將語言2的應答候選翻譯成語言1轉送給應答生成單元18。也即將英語描述的應答候選譯成日語而轉送給應答生成單元18。
從以上所述,應答生成單元18得到了統(tǒng)一到語言1(日語)的應答候選。此應答生成單元18于應答候選間進行比較,判定應答的順序,將應答信息傳送給輸出單元8。在以上處理中,與已有詢問應答系統(tǒng)不同的主要之處是,將作為檢索結果取得的不同語言的回答候選之中至少一種語言的應答候選,通過翻譯單元19進行機械翻譯,在應答候選統(tǒng)一到另一種語言同時,對于此進行了語言統(tǒng)一的回答候選組,由應答生成部18進行比較處理。
下面對于上述問題按照信息提取單元15、檢索單元10、翻譯單元19、生成單元18各個的處理順序,作詳細說明。
信息提取單元的處理步驟圖2是例示信息提取單元15的處理的流程圖。
信息提取單元15讀入以語言i(i=1,2,…)寫成的第j文件(j=1,2,…),利用已有的信息提取技術從該文件提取信息,將其結果登錄于語言i的知識數(shù)據(jù)庫中。
這里,作為信息提取的具體方法例如有語形學和模式匹配等方法。舉例來說,當知識源為日語而文件16中包括“○×社(社長○×太郎)”這種表示時,將其進行語形學分析得到以下分析結果“/○×社<專有名詞>/(<符號>/社長<普通名詞>/<符號>/○×太郎<專有名詞>/)<符號>”這里的“/”表示詞類的分割。
在此假定,通過采用將“/X<專有名詞>/(<符號>/社長<普通名詞>/<符號>/Y<專有名詞>/)<符號>”這種語形的排列改寫為“ X[PRESIDENT==Y]”這樣的知識表示的信息提取規(guī)則,可以得到
“○×社[PRESIDENT==○×太郎]”這樣的知識。
又例如通過采用將“/X<專有名詞>/の<助詞>/Y<專有名詞>/社長<普通名詞>”這種語形的排列改寫為“X[PRESIDENT==Y]”這樣的知識表示的信息提取規(guī)則,同樣能從“○×社の○×太郎社長…”獲得“○×社”PRESIDENT==○×太郎”的知識。
再有,例如當知識源為英語時,通過進行詞類檢測(Part-of-Speech tagging)來代替語形分析,可以從文件17中的“Taro ○×,president of ○× Corporation,…”這種表示,獲得例如“○×__Corporation[PRESIDENT==Toro__○×]”這樣的表現(xiàn)形式的知識。
此外,在上述這種表現(xiàn)形識的知識中,也可附加作為源的文件的識別號。這樣,就能在以后階段掌握能由哪種文件文本獲得各種知識數(shù)據(jù)。
信息提取單元15將以上求得的各種知識按每種語言登錄于知識數(shù)據(jù)庫13、14中。
檢索單元的處理圖3是例示檢索單元10的處理的流程圖。
檢索單元10首先從輸入單元6接收用戶的詢問(步驟S11),再由翻譯單元19接收該詢問的翻譯結果(步驟S12)。然后對于由語言i(i=1,2,…)寫成的各詢問生成檢索條件。例如將“○×社の社長は?”的日語詢問由檢索單元10變換為“○×社[PRESIDENT==*]”這樣表現(xiàn)形式的檢索條件(步驟13)。這里的符號“*”表示字分割。檢索單元10應用生成的檢索條件檢索日語知識數(shù)據(jù)庫13(步驟15)。由此,例如進行“○×社[PRESIDENT==○×太郎]這種數(shù)據(jù)的匹配,作為應答候選能得到”“○×太郎”。一般可以得到多個應答候選。
檢索單元10對于日語以外的詢問也進行同樣的處理。具體地說,例如對于英語的詢問“Who is the president of ○× Corporation?”,可將其變換為“○×_Corporation[PRESIDENT==*]”這樣的檢索條件(步驟S14),應用它檢索英語知識數(shù)據(jù)庫14(步驟S15),由此作為應答候得到“Taro_○×”。
檢索單元10于步驟S16判定現(xiàn)在處理中的詢問的語言是否與用戶輸入的詢問語言相同?根據(jù)此判定結果將應答候選再接轉送給應答生成單元18(步驟17)或是翻譯單元19(步驟18)。例如用戶詢問的輸入語言是日語時,則通過日語知識數(shù)據(jù)庫13的檢索求得的應答候選原樣地轉送給應答生成單元18,而通過英語知識數(shù)據(jù)庫14的檢索取得的應答候選則傳送給用戶翻譯成日語的翻譯單元19。
翻譯單元的處理圖4(a)例示翻譯單元19的詢問處理程序的流程圖,圖4(b)例示翻譯單元19的應答處理程序的流程圖。翻譯單元19對詢問進行機械翻譯轉送給檢索單元10。此外將應答候選進行機械翻譯轉送給應答生成單元18。
例如當從輸入單元6接收到“○×社の社長は?”(步驟S21),翻譯單元即將其機械翻譯成“Who is the president of ○×Corporation?”(步驟S22),將該機械翻譯的結果轉送給檢索單元10(步驟S23)。另一方面,當從檢索單元10接收到“Taro_○×”這樣的應答候選字符串(步驟S24)后,翻譯單元19將其機械翻譯成“○×太郎”(步驟2 5),并將此翻譯結果轉送給應答生成單元18(步驟S26)。
應答生成單元的處理步驟圖5是例示本實施形式的應答生成單元18的處理步驟的流程圖。
應答生成單元18首先從檢索單元10接收應答候選(步驟S27),然后還從翻譯單元19接收應答候選(步驟S28)。如上所述,從檢索單元10接收的應答候選的語言與從翻譯單元19接收的應答候選語言是相同的。例如用戶以日語詢問時,從檢索單元1 0接收的應答候選乃是從日語知識數(shù)據(jù)庫13的檢索取得的日語的應答候選本身,另一方面由翻譯單元19接收的應答候選,則是將檢索單元10檢索英語知識數(shù)據(jù)庫14所得的英語的應答候選翻譯成日語的結果。這樣,應答生成單元18只處理一種語言。
應答生成單元18對應答候選進行相互比較處理(步驟S29)。由此確定應答的順序,將最佳應答或附有順序的應答轉送給輸出部8(步驟30)。下面詳述應答的順序的判定方法。
應答順序的確定方法再次考慮假設輸入“○×社の社長は?”這樣的日語詢問的情形,而在此利用“信息提取單元的處理步驟”所述的,將“/X<專有名詞>/の<助詞>/Y<專有名詞>/社長<普通名詞>”這樣的語形排列改寫為“X[PRESIPENT==Y]這樣的知識表示的信息提取規(guī)則,同時假定在日語知識數(shù)據(jù)庫13的形成中所用的日語文件16內包含有(a)“○×社の○×太郎社長”(b)“○×社の○×社長”(c)“○×社は…△△社ヘの出資を決あた。 ○×社の△△社長に対する期待は大きい?!边@樣的表示。
作為應答候選,可得到“○×太郎”、“○×”與“△△”等。這里“△△”的應答候選,在上述(c)的“○×社の△△社長(に対する期待は大きい)”的表示中,雖可由于信息提取規(guī)則的匹配得到,但在實際中假定其作為應答是不妥的(此外,即使信息提取的精度高,但由于還要考慮到在原始文件本身中也會有寫得不真實的情形,一般在應答候選中混雜有不妥當內容的可能性不小)。
在此,檢索日語知識數(shù)據(jù)庫13的結果,假設得到“○×太郎”這樣的應答候補3件,“○×”這樣的應答候選1件,“△△”這樣的應答候選1件。在把“○×社の社長は?”這樣的日語詢問翻譯成英語,再基于此詢問譯成英語的結果來檢索英語知識數(shù)據(jù)庫14時,設將由此檢索的應答候選翻譯成日語的結果得到了“○×太郎”這樣的應答候選2件,“○×”這樣的回答候選1件。在以上情形下,例如可以依據(jù)單純的多數(shù)決定法決定應答的順序。
圖6例示由本實施形式的詢問應答系統(tǒng)求得的應答候選的輸出方法。這里的多個應答(候選)1~3(“○×太郎”、“○×”、“△△”),在從日語知識數(shù)據(jù)庫13的檢索結果與從英語知識數(shù)據(jù)庫14的檢索結果中,按命中的順序分類(202)。圖6中,由黑圓點“●”所示的標記204表示命中的知識數(shù)據(jù)。此種標記204在表203中按知識源不同進行區(qū)分顯示,用戶據(jù)此可判斷知識數(shù)據(jù)的語言類別。上述這種標記顯示只不過是一個例子。例如取代標記204也可示以文件ID等。此外,也可對標記204設置為可點來,根據(jù)用戶的單擊指示,顯示知識源文件中的相應處所。
在圖6的顯示例中,應答2“○×”與應答3“△△”的日語知識數(shù)據(jù)庫13中的命中件數(shù)都是1。在采用已有的單一語言知識源的詢問應答系統(tǒng)中不能判斷采用哪種回答為佳。但在本發(fā)明的實施形式中,由于應答2“○×”不僅能從日語知識源而且也能從英語知識源求得,故可判定其比只能從日語知識源得到的應答3“△△”的可靠性高。
在圖6的顯示例中,為使用戶能選擇應答候選的輸出方法,設有復迭框201,在此選擇的是“多數(shù)決定”。
作為輸出方法的其他選擇方式,與多數(shù)決定的形式相反,有以應答候選的獨特性(珍稀性)為基準附以順序顯示的“唯一性”,有以應答候選的網(wǎng)羅性(詳盡度)為基準排序顯示的“網(wǎng)羅性”,有以應答的簡明性為基準附以順序顯示的“簡明性”等。此外,也可以不以單純地將命中件數(shù)的多寡作為基準分類,例如可進行這樣的排序使日語知識數(shù)據(jù)庫13與英語知識數(shù)據(jù)庫14各命中1次(命中數(shù)總計為2)的應答候選,優(yōu)先于于日語知識數(shù)據(jù)庫13中兩次命中的應答候選。
又例如,應答候選“○×”是“○×太郎”的部分字符串一事,容易基于字句處理判定。因此也可以將信息量更多的“○×太郎”一方優(yōu)先地顯示。
根據(jù)網(wǎng)羅性或簡明性觀點來確定應答候選順序的另一例子示明于圖7中。這里的詢問“酵素つて何?”是要求把所用詞的定義作為應答的日語詢問(300)。在處理上述詢問300的情形,信息提取部15例如將包含“…は…の一種です”這樣的表示的文本(例如語句或段落)視作所用詞的定義,而預先將其提取出。此外,例如對于英語的知識源,則把包含“…is a kind of…”或“…is a type of…”這類慣用表示的文本視作定義,預先提取出。
如圖7例示,假定對于日語知識數(shù)據(jù)庫13的定義表示的檢索,作為應答得到了例如下述的文本A1“酵素は、觸媒の一種です。觸媒とは、化學反応を速ある…”A2“酵素は觸媒の一種。”再有,通過將日語的“酵素つて何?”作機械翻譯則得到“What is anenzyme?”這樣的英語詢問,通過對英語知識數(shù)據(jù)庫14的定義表示的檢索,假定作為應答得到了“An enzyme is a kind of catalyst”這樣的文本。
將上述英語的應答通過機械翻譯翻譯成日語后,例如得到A2′“酵素は觸媒の一種です?!睋?jù)此,應答生成單元18從檢索單元18接收到上述應答A1與A2而從翻譯單元19接收到A2′。
在上述情形下,應答生成部18例如對A1、A2與A2′的各個進行語形分析,求出單詞的“不同”,以此為基礎,進行應答候選的整理與排定優(yōu)先順序。
具體地說,根據(jù)應答A1,得到不同的單詞“酵素、觸媒、一種、化學、反応”;根據(jù)A2與A2′則得到不同的單詞“酵素、觸媒、一種”。由此可知,A2與A2′作為應答是等價的,而A1比A2與A2′的網(wǎng)羅性(詳細度)高。將上述結論示明于圖7中。按照網(wǎng)羅性高的順序排列給用戶以提示。
相反,在用戶追求“簡潔性”的原則,則可按照圖7所示相反的順序進行顯示。
在以上的說明中是對于應答候選是排序,將據(jù)此分類的結果提示給用戶,但也可將上述順序只顯示1件最大的。
通過在文件檢索中利用機械翻譯等的例如用日語檢索要求來實現(xiàn)英語文件檢索的交叉語言信息檢索(cross-language informationretrieval)這種技術,已是周知的,但這終究是為了對文件進行排序而來計算檢索要求與各個文件的類似度,這同除進行機械翻譯外還進行應答候選相互間比較以選定最佳應答的本發(fā)明的實施形式是不同的。
權利要求
1.一種詢問應答系統(tǒng),它是對于用戶以第一語言輸入的詢問應用具有此第一語言知識源的第一知識數(shù)據(jù)庫和具有第二語言知識源的第二知識數(shù)據(jù)庫求得應答的詢問應答系統(tǒng),其特征在于此系統(tǒng)具有對于上述詢問,檢索上述第一知識數(shù)據(jù)庫,求得第一語言的應答候選的單元;將上述詢問機械翻譯成第二語言的單元;對于翻譯成上述第二語言的詢問,檢索上述第二知識數(shù)據(jù)庫,求得第二語言的應答候選的單元;將上述第二語言的應答候選機械翻譯成第一語言的單元;以及將上述第一語言的應答候選與上述第二語言的應答候選機械翻譯成第一語言的結果全都依據(jù)預定基準排序的單元。
2.權利要求1所述的詢問應答系統(tǒng),其特征在于,此系統(tǒng)還具有基于上述排序從上述應答候選中確定其中之一個應答的單元。
3.權利要求1所述的詢問應答系統(tǒng),其特征在于,以將上述第一與第二數(shù)據(jù)庫中檢索命中件數(shù)的多少作為上述基準。
4.權利要求1所述的詢問應答系統(tǒng),其特征在于,它還具備有通過字句處理確定上述各個應答候選的簡明性或網(wǎng)羅度的單元,并將此簡明性或網(wǎng)羅度作為上述基準。
5.一種詢問應答方法,它是對于用戶以第一語言輸入的詢問,應用具有此第一語言知識源的第一數(shù)據(jù)庫和具有第二語言知識源的第二知識數(shù)據(jù)庫求得應答的詢問應答方法。其特征在于此方法具有對于上述詢問檢索上述第一知識數(shù)據(jù)庫求得第一語言的應答候選的步驟;將上述詢問機械翻譯成第二語言的步驟;對于翻譯成上述第二語言的詢問,檢查上述第二知識數(shù)據(jù)庫求得第二語言的應答候選的步驟;將上述第二語言的應答候選機械翻譯成第一語言的步驟;以及將上述第一語言的應答候選與上述第二語言的應答候選機械翻譯成第一語言的結果全都依據(jù)預定基準排序的步驟。
6.權利要求5所述的詢問應答方法,其特征在于,此詢問應答方法還具有基于上述排序從上述應答候選中確定其中之一個應答的步驟。
7.權利要求5所述的詢問應答方法,其特征在于,以將上述第一與第二數(shù)據(jù)庫中檢索命中件數(shù)的多少作為上述基準。
8.權利要求5所述的詢問應答方法,其特征在于,它還具備有通過字句處理確定上述各個應答候選的簡明性或網(wǎng)羅度的步驟,并將此簡明性或網(wǎng)羅度作為上述基準。
全文摘要
本發(fā)明提供詢問應答系統(tǒng)及詢問應答方法。對于用戶以第一語言輸入的詢問應用具有此第一語言知識源的第一知識數(shù)據(jù)庫和具有第二語言知識源的數(shù)據(jù)庫而求得應答,其中對于此詢問檢索第一知識數(shù)據(jù)庫求得第一語言的應答候選,將此詢問機械翻譯成第二語言檢索第二知識數(shù)據(jù)庫得到第二語言的應答候選,將第二語言的應答候選機械翻譯成第一語言,將第一語言的應答候選與第二語言的應答候選機械翻譯成第一語言的結果全按預定基準排序提示給用戶。
文檔編號G06F17/27GK1492367SQ0315987
公開日2004年4月28日 申請日期2003年9月26日 優(yōu)先權日2002年9月27日
發(fā)明者酒井哲也 申請人:株式會社東芝