提供信息差距的指示的問(wèn)答系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供用于標(biāo)識(shí)電子內(nèi)容中的信息差距的機(jī)制。這些機(jī)制接收待分析的電子內(nèi)容并且分析電子內(nèi)容以標(biāo)識(shí)電子內(nèi)容內(nèi)的主題或者問(wèn)題中的至少一項(xiàng)以產(chǎn)生與電子內(nèi)容關(guān)聯(lián)的主題或者問(wèn)題中的至少一項(xiàng)的匯集。這些機(jī)制還將匯集與電子內(nèi)容進(jìn)行比較以及與先前分析的電子內(nèi)容的全集進(jìn)行比較以產(chǎn)生電子內(nèi)容中的信息差距集合。另外,機(jī)制向與電子內(nèi)容關(guān)聯(lián)的用戶輸出對(duì)信息差距集合的通知。
【專利說(shuō)明】提供信息差距的指示的問(wèn)答系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)主要地涉及一種改進(jìn)的數(shù)據(jù)處理裝置和方法,并且更具體地涉及用于在問(wèn)答系統(tǒng)中提供信息差距的指示的機(jī)制。
【背景技術(shù)】
[0002]隨著計(jì)算網(wǎng)絡(luò)、比如因特網(wǎng)的使用增加,人類目前被來(lái)自各種結(jié)構(gòu)化和無(wú)結(jié)構(gòu)來(lái)源的可用于它們的信息量淹沒(méi)和壓倒。然而在用戶試圖拼湊他們可以在對(duì)于關(guān)于各種主題的信息的搜索期間發(fā)現(xiàn)的、他們認(rèn)為相關(guān)的信息時(shí)充斥信息差距。為了輔助這樣的搜索,近來(lái)研究已經(jīng)引向生成問(wèn)答(QA)系統(tǒng),這些QA系統(tǒng)可以取得輸入問(wèn)題、分析它并且返回指示對(duì)輸入問(wèn)題的最可能回答的結(jié)果。QA系統(tǒng)提供用于搜索內(nèi)容來(lái)源、例如電子文檔的大型集合的機(jī)制,并且關(guān)于輸入問(wèn)題來(lái)分析它們以確定對(duì)問(wèn)題的回答和關(guān)于回答用于回答輸入問(wèn)題有多么準(zhǔn)確的置信度測(cè)量。
[0003]一個(gè)這樣的系統(tǒng)是可從紐約阿芒克的國(guó)際商業(yè)機(jī)器(IBM)公司獲得的稱為Watson?系統(tǒng)。Watson?系統(tǒng)是高級(jí)自然語(yǔ)言處理、信息獲取、知識(shí)表示和推理以及機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于開(kāi)放范疇問(wèn)答領(lǐng)域。在用于假設(shè)生成、規(guī)模證據(jù)收集、分析和打分的IBM的DeepQA?技術(shù)上構(gòu)建Watson?系統(tǒng)。DeepQA?取得輸入問(wèn)題、分析它、將問(wèn)題分解成組成部分、基于分解的問(wèn)題和回答來(lái)源的主要搜索的結(jié)果生成一個(gè)或者多個(gè)假設(shè)、基于從證據(jù)來(lái)源取回證據(jù)執(zhí)行假設(shè)和證據(jù)打分、執(zhí)行一個(gè)或者多個(gè)假設(shè)的合成并且基于訓(xùn)練的模型執(zhí)行最終合并和排行以將對(duì)輸入問(wèn)題的回答與置信度測(cè)量一起輸出。
[0004]各種美國(guó)專利申請(qǐng)公開(kāi)文獻(xiàn)描述各種類型的問(wèn)答系統(tǒng)。
【發(fā)明者】J·H·詹金斯, D·C·斯坦梅茨, W·W·扎德羅茲尼 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司