專利名稱:用于檢索一個(gè)事件數(shù)據(jù)庫的基于事件的推理系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般來說涉及專家系統(tǒng),特別來說,涉及基于事件的推理系統(tǒng)。更特別說,本發(fā)明涉及一個(gè)基于事件的推理系統(tǒng),該系統(tǒng)壓縮一個(gè)事件數(shù)據(jù)庫中選擇的數(shù)據(jù)為一個(gè)標(biāo)記化的視圖(tokenized view),以便提高該事件數(shù)據(jù)庫的檢索引擎(search engine)的效率。
基于事件的推理(CBR)系統(tǒng)通常指的是一個(gè)計(jì)算機(jī)系統(tǒng),它通過檢查類似的、先前遇到的問題的說明及其相關(guān)的解決方案,匹配當(dāng)前問題與一個(gè)或多個(gè)類似的、先前遇到的問題,并使用匹配的先前遇到的問題的相關(guān)解決方案提議對當(dāng)前問題的解決方案,以此來確定對當(dāng)前問題的解決方案。在接收到對一個(gè)當(dāng)前問題的說明時(shí),常規(guī)CBR系統(tǒng)使用檢索引擎從事件數(shù)據(jù)庫中檢索最接近的匹配事件,并反復(fù)提示用戶輸入另外的說明信息,直到檢索到的事件或由檢索引擎確定的多個(gè)事件足夠類似當(dāng)前問題而被認(rèn)為是一個(gè)可能的解決方案。如果后來被確認(rèn)是一個(gè)新解決方案(先前未存儲在該事件數(shù)據(jù)庫中),則該被確認(rèn)的解決方案可以輸入事件數(shù)據(jù)庫中用來解決將來的問題。
當(dāng)然,CBR系統(tǒng)對輸入問題提供解決方案的能力是有限的,部分是由于存儲在事件數(shù)據(jù)庫中的事件數(shù)目和說明每一事件所使用的屬性數(shù)目有限所致。因此,隨著更多說明另外經(jīng)驗(yàn)的事件存儲到事件數(shù)據(jù)庫中,以及可以與每一事件相關(guān)的屬性數(shù)目的增加,由CBR系統(tǒng)產(chǎn)生的解決方案的質(zhì)量通常將會改善。因?yàn)橐粋€(gè)相對完備開發(fā)的事件數(shù)據(jù)庫可以包括數(shù)百或數(shù)千唯一事件,它們各自可以包括例如50個(gè)不同的屬性,因此,如果CBR系統(tǒng)要高效地準(zhǔn)確確定對當(dāng)前問題最好的匹配事件的話,用以檢索事件數(shù)據(jù)庫尋找最緊密匹配當(dāng)前問題的事件的技術(shù)必須是高效的。
因此十分明顯,從性能觀點(diǎn)來說,希望提供一個(gè)改進(jìn)的檢索事件數(shù)據(jù)庫的CBR系統(tǒng)。
因此,本發(fā)明的一個(gè)目的是提供一個(gè)改進(jìn)的專家系統(tǒng)。
本發(fā)明的另一個(gè)目的是提供一個(gè)改進(jìn)的基于事件的推理系統(tǒng)。
本發(fā)明的再一個(gè)目的是提供一個(gè)基于事件的推理系統(tǒng),該系統(tǒng)將一個(gè)事件數(shù)據(jù)庫中選擇的數(shù)據(jù)壓縮為一個(gè)標(biāo)記化的視圖,以便提高該事件數(shù)據(jù)庫的檢索引擎的效率。
上述目的可以實(shí)現(xiàn),現(xiàn)在予以敘述。給一個(gè)基于事件的推理系統(tǒng)配備一個(gè)事件數(shù)據(jù)庫,它可以存儲多個(gè)事件,每一事件包括一個(gè)或多個(gè)屬性。在該基于事件的推理系統(tǒng)中的視圖發(fā)生器產(chǎn)生事件數(shù)據(jù)庫的一個(gè)視圖,它通過用一個(gè)或者多個(gè)統(tǒng)一長度的視圖標(biāo)記(view token)描述事件數(shù)據(jù)庫中多個(gè)事件的至少一個(gè)選擇子集中的每一事件而實(shí)現(xiàn)。在基于事件的推理系統(tǒng)中的一個(gè)輸入分析程序提供一個(gè)輸入事件的一個(gè)標(biāo)記化描述,其包括一個(gè)或者多個(gè)輸入標(biāo)記?;谑录耐评硐到y(tǒng)進(jìn)一步包括一個(gè)檢索引擎,它比較輸入標(biāo)記與視圖標(biāo)記,以確定在該視圖內(nèi)的一個(gè)或多個(gè)最接近的匹配事件。通過檢索該視圖,而不是直接檢索事件數(shù)據(jù)庫,可以高效地確定與輸入最緊密匹配的事件。
閱讀下面詳細(xì)的說明書,本發(fā)明的上述以及其它的目的、特征和優(yōu)點(diǎn)將十分明顯。
被認(rèn)為是本發(fā)明的新穎特征在所附權(quán)利要求中說明。然而要最好地理解本發(fā)明自身及其最佳使用方式,其進(jìn)一步的目的和優(yōu)點(diǎn),需要參考下面對一個(gè)例示實(shí)施例的詳細(xì)說明,并結(jié)合閱讀相隨的附圖,其中
圖1表示根據(jù)本發(fā)明的一個(gè)基于事件的推理(CBR)系統(tǒng)的示意實(shí)施例;圖2表示示于圖1的事件數(shù)據(jù)庫內(nèi)容的更詳細(xì)的描述;圖3表示一個(gè)數(shù)據(jù)處理系統(tǒng)的示意實(shí)施例,該系統(tǒng)可以用于實(shí)現(xiàn)本發(fā)明的CBR系統(tǒng);圖4是一個(gè)邏輯流程圖,表示根據(jù)本發(fā)明的基于事件的推理過程;圖5是一個(gè)邏輯流程圖,表示根據(jù)本發(fā)明產(chǎn)生一個(gè)事件數(shù)據(jù)庫的壓縮視圖的方法;圖6表示在該事件數(shù)據(jù)庫的一個(gè)壓縮視圖內(nèi)一個(gè)視圖標(biāo)記的優(yōu)選實(shí)施例。
現(xiàn)在參考附圖,特別是附圖1,圖中表示根據(jù)本發(fā)明的一個(gè)基于事件的推理(CBR)系統(tǒng)的一個(gè)示意實(shí)施例。如圖所示,CBR系統(tǒng)10包括事件數(shù)據(jù)庫12,它是一個(gè)存儲稱為事件的經(jīng)驗(yàn)屬性的數(shù)據(jù)庫。在事件數(shù)據(jù)庫12中匯集的事件可以從任何根據(jù)對過去相似場合的相關(guān)經(jīng)驗(yàn)來確定對當(dāng)前問題的解決方案或建議的行動的嘗試中收集。因此,事件數(shù)據(jù)庫12中存儲的事件可以例如相關(guān)于求助臺支持、銷售支持、客戶服務(wù)、醫(yī)療診斷、工程設(shè)計(jì)、執(zhí)行信息系統(tǒng)等等。事件數(shù)據(jù)庫12中存儲的事件可以根據(jù)用以說明這些事件的屬性類型和不同事件之間的邏輯關(guān)系以不同方式組織和標(biāo)引。例如,一種方法是在事件數(shù)據(jù)庫12中以使用一個(gè)歸納算法構(gòu)建的樹形數(shù)據(jù)結(jié)構(gòu)存儲事件。另一種稱為“最鄰近索引(nearest neighbor indexing)”的常規(guī)方法為每一事件的每一屬性使用開發(fā)者特定值,然后使用為每一存儲的事件的公式計(jì)算事件之間的接近程度。第三種方法是使用一個(gè)標(biāo)準(zhǔn)事件層次樹。根據(jù)這一方法,定義一個(gè)根事件類,然后在該根事件類和特定事件范例之間構(gòu)建多層抽象類。最后可以使用稱為“知識指導(dǎo)標(biāo)引(knowledge-guided indexing)”的方法,根據(jù)由一個(gè)規(guī)則推理引擎(rule inference engine)實(shí)現(xiàn)的多條推理規(guī)則建立事件子集。熟悉本技術(shù)領(lǐng)域的人會認(rèn)識到,事件數(shù)據(jù)庫組織的不同模式可能比依賴于在事件數(shù)據(jù)庫12中存儲的事件類型以及可用的軟件工具的能力的其它模式更具有優(yōu)點(diǎn)。
不管其物理組織如何,可以把事件數(shù)據(jù)庫12視為一個(gè)多維數(shù)據(jù)庫陣列,其中每一事件形成一個(gè)記錄,而每一事件屬性是一個(gè)記錄中的一個(gè)字段。這種視圖示于圖2。如圖2所示,事件數(shù)據(jù)庫12存儲有N個(gè)事件,每一事件可以包括直到M個(gè)屬性。在圖示實(shí)施例中,事件的每一屬性由一對特征值說明,其中,特征相應(yīng)于有關(guān)一種經(jīng)驗(yàn)的類別或問題,而該值提供該特征的經(jīng)驗(yàn)值或?qū)τ稍撎卣魉硎镜膯栴}的回答。當(dāng)然,在另外的實(shí)現(xiàn)方案中,每一屬性可以包括一個(gè)或者多個(gè)說明項(xiàng)。如圖2所示,允許事件數(shù)據(jù)庫12中N個(gè)事件中的每一個(gè)具有數(shù)目不等的相異無序特征,這些特征的每一個(gè)可以具有一個(gè)或者多個(gè)值相關(guān)。與N個(gè)事件中的每一個(gè)相關(guān)聯(lián),事件數(shù)據(jù)庫12為每一屬性存儲權(quán)重和分?jǐn)?shù)信息,其用于給一個(gè)輸入事件或“事件(incident)”與事件數(shù)據(jù)庫12中的事件的接近程度評分。根據(jù)不同的實(shí)現(xiàn)方案,權(quán)重和分?jǐn)?shù)信息可以為每一屬性、為每一事件個(gè)別設(shè)定、或?yàn)橐粋€(gè)特別屬性的每一事件總體設(shè)定。
回到圖1,CBR系統(tǒng)10進(jìn)一步包括視圖發(fā)生器14(其在下面詳細(xì)敘述),它產(chǎn)生事件數(shù)據(jù)庫12的內(nèi)容的緊湊視圖,并把這些視圖存儲在視圖存儲器16中。這里所用的“視圖”這一術(shù)語指的是在事件數(shù)據(jù)庫12中的駐留的一個(gè)選擇的事件子集的一個(gè)或多個(gè)屬性的壓縮表示。從下面提供的說明中可明顯看出,檢索視圖發(fā)生器14產(chǎn)生的視圖檢索起來比事件數(shù)據(jù)庫12有效得多,允許迅速確定事件數(shù)據(jù)庫12中一個(gè)或多個(gè)最匹配一事件的事件。
另外,CBR系統(tǒng)10包括一個(gè)用戶輸入接口15,它允許用戶輸入對一個(gè)事件的說明。用戶輸入接口可以包括例如圖形用戶接口、常規(guī)結(jié)構(gòu)化查詢語言(SQL)接口、或請求用戶響應(yīng)一系列菜單或問題輸入的文字接口。用戶輸入接口15接收的輸入傳送到輸入分析程序20,它參考同義詞表22分析說明一事件的用戶輸入。由輸入分析程序20產(chǎn)生的被分析過的用戶輸入傳送到事件管理程序18和檢索引擎24兩者。事件管理程序18使用從輸入分析程序20接收的被分析過的輸入從視圖存儲器16選擇一個(gè)特定的視圖。然后,把選擇的視圖傳送給檢索引擎24,它檢索該選擇的視圖以確定最匹配該事件的一個(gè)或多個(gè)事件。視圖中通過檢索引擎24給每一視圖評分而確定的一個(gè)或多個(gè)最匹配事件從事件數(shù)據(jù)庫12中取出,傳送給解決方案管理程序28以便處理。解決方案管理程序28格式化從事件數(shù)據(jù)庫12檢索出的事件,將輸出事件作為對該事件一個(gè)可能的解決方案或動作提交。如果CBR系統(tǒng)10不能在事件數(shù)據(jù)庫12中確定足夠接近對該事件的匹配的話,則事件維護(hù)機(jī)構(gòu)26保存該事件,并在分解后,格式化該事件,將其輸入到事件數(shù)據(jù)庫12中作為一個(gè)新事件。
CBR系統(tǒng)10可以在使用硬件和軟件結(jié)合的許多不同的數(shù)據(jù)處理系統(tǒng)中實(shí)現(xiàn)。圖3示出可以用來實(shí)現(xiàn)CBR系統(tǒng)10的一個(gè)示例數(shù)據(jù)處理系統(tǒng)的高層方框圖。如圖3所示,計(jì)算機(jī)系統(tǒng)30包括至少一個(gè)中央處理單元(CPU)32,它響應(yīng)CPU32可以從操作員/顯示器接口34接收的操作員命令和數(shù)據(jù)操作,接口34通過系統(tǒng)總線36與CPU32連接。CPU32也可以接收來自主存儲器38的操作員命令和數(shù)據(jù),主存儲器38也通過系統(tǒng)總線36與CPU相連。雖然主存儲器38作為一個(gè)單一實(shí)體表示。但是熟悉本技術(shù)領(lǐng)域的人理解,主存儲器38可以包括隨機(jī)存取存儲器(RAM)、硬磁盤驅(qū)動器、光盤驅(qū)動器、和包括邏輯分段存儲位置的其它存儲設(shè)備的結(jié)合。
主存儲器38包括各種數(shù)據(jù)結(jié)構(gòu),包括應(yīng)用程序40、對象42、數(shù)據(jù)44和操作系統(tǒng)46。操作系統(tǒng)46優(yōu)選支持面向?qū)ο蟮木幊汰h(huán)境,例如由C++編程語言提供的面向?qū)ο蟮木幊汰h(huán)境。應(yīng)用程序40由用戶通過操作員/顯示器接口34調(diào)用或啟動??梢园珻BR系統(tǒng)10多個(gè)部分的應(yīng)用程序40可以使用各種過程編程語言或者面向?qū)ο蟮木幊陶Z言,包括C++編寫。對象42是一種面向?qū)ο蟮木幊陶Z言例如C++的編程數(shù)據(jù)結(jié)構(gòu)。
計(jì)算機(jī)系統(tǒng)30還包括一個(gè)直接存取存儲設(shè)備(DASD)接口48,它連接系統(tǒng)總線36和DASD50。熟悉本技術(shù)領(lǐng)域的人理解,DASD50可以例如從集成電路芯片和機(jī)讀存儲設(shè)備,例如磁介質(zhì)盤,接收和閱讀計(jì)算機(jī)程序產(chǎn)品52,在這些芯片和存儲設(shè)備上記錄有程序指令,它的執(zhí)行可以實(shí)現(xiàn)CBR系統(tǒng)10。機(jī)讀存儲設(shè)備還可以包括例如光盤。計(jì)算機(jī)系統(tǒng)30還包括一個(gè)網(wǎng)絡(luò)接口54,它允許通過網(wǎng)絡(luò)58在CPU32和其它計(jì)算機(jī)系統(tǒng)56之間通信。計(jì)算機(jī)系統(tǒng)56可以包括例如在結(jié)構(gòu)上類似于示例計(jì)算機(jī)系統(tǒng)30的計(jì)算機(jī)系統(tǒng)。以這種方式,計(jì)算機(jī)系統(tǒng)30可以在通過一些公知的方法建立起這些計(jì)算機(jī)系統(tǒng)之間的通信后通過網(wǎng)絡(luò)58接收數(shù)據(jù)到主存儲器38。建立上述通信的方法為熟悉本技術(shù)領(lǐng)域的人所了解,不需進(jìn)一步解釋。
重要的是要注意,雖然本發(fā)明是在一個(gè)全功能的計(jì)算機(jī)系統(tǒng)的環(huán)境(context)中敘述(并將繼續(xù)敘述)的,但是熟悉本技術(shù)領(lǐng)域的人理解,本發(fā)明也能夠以各種形式的程序產(chǎn)品分布不管用以實(shí)際執(zhí)行該項(xiàng)分布的信號承載介質(zhì)的是什么特定類型,本發(fā)明同樣適用。信號承載介質(zhì)的例子包括可紀(jì)錄型介質(zhì)和傳輸型介質(zhì),前者例如軟磁盤和光盤,后者例如數(shù)字和模擬通信鏈路。
現(xiàn)在參考圖4,圖中示出根據(jù)本發(fā)明的基于事件的推理過程的一個(gè)高層邏輯流程圖。如圖所示,該過程開始于框70,之后前進(jìn)到方框72,它表示通過在主存儲器38中分配存儲器建立事件數(shù)據(jù)庫12。然后該過程前進(jìn)到方框74,這里表示給事件數(shù)據(jù)庫12添加獨(dú)特的事件。除定義每一事件的屬性之外(例如特征值對),還輸入權(quán)重和分?jǐn)?shù)信息,并與事件相關(guān)存儲,如圖2所示。接著,過程從方框74前進(jìn)到方框76,它表示由視圖發(fā)生器產(chǎn)生事件數(shù)據(jù)庫12的多個(gè)視圖。之所以產(chǎn)生視圖是因?yàn)殡m然可以直接檢索事件數(shù)據(jù)庫12,但是這樣的檢索通常效率不高,因?yàn)閷κ录?shù)據(jù)庫12的檢索是尋找接近的而不是精確匹配的事件。因此,產(chǎn)生事件數(shù)據(jù)庫12的多個(gè)簡潔的視圖,以便減少必須檢索的存儲器中的數(shù)據(jù)量,既加速數(shù)據(jù)從非易失存儲器加載到易失存儲器,也加速檢索本身。優(yōu)點(diǎn)是,事件數(shù)據(jù)庫12的視圖可以由視圖發(fā)生器14產(chǎn)生并在用戶請求檢索前存儲在視圖存儲器16中,以便加速事件數(shù)據(jù)庫的檢索。
參考圖5,圖中示出產(chǎn)生事件數(shù)據(jù)庫l2的一個(gè)視圖的一種方法的一個(gè)高層邏輯流程圖。如圖所示,該過程開始于框130,然后前進(jìn)到方框132。方框132表示在事件數(shù)據(jù)庫12內(nèi)選擇一個(gè)特別的事件和該選擇事件的特別屬性,用于包含在該視圖中。為包含在該視圖內(nèi)的事件和屬性的選擇依賴于被構(gòu)建的視圖的類型。事件數(shù)據(jù)庫12的頂層視圖可以包括在事件數(shù)據(jù)庫12中的所有N個(gè)事件的所有屬性的緊湊描述。另一方面,某子系統(tǒng)層視圖可能包括只涉及一個(gè)特別子系統(tǒng)或客體事項(xiàng)的事件的子集的所有屬性的描述。更低層的視圖可能被限制只包含涉及一個(gè)特別子系統(tǒng)或客體事項(xiàng)的事件子集的少數(shù)可能屬性。例如,如果事件數(shù)據(jù)庫12存儲涉及汽車修理的事件,則頂層視圖將包括事件數(shù)據(jù)庫12中存在的所有事件,某子系統(tǒng)層視圖可能只包含有關(guān)傳動系統(tǒng)的事件的所有屬性,某低層視圖可能只包括涉及傳動系統(tǒng)的事件的少數(shù)屬性,例如制造、型號、型號年代。
然后,過程從方框132前進(jìn)到方框134,它表示把選擇的事件的選擇屬性中間的每一未標(biāo)記化的特征或值變換為一個(gè)標(biāo)記標(biāo)識符。為實(shí)現(xiàn)這種變換,輸入分析程序20使用同義詞表22把輸入項(xiàng)映射為同義關(guān)鍵字。如果該關(guān)鍵字以標(biāo)記化的格式存儲在同義詞表22中的話,則使用同義詞表22中的關(guān)鍵字標(biāo)記作為標(biāo)記標(biāo)識符。如果該關(guān)鍵字未以標(biāo)記化的格式存儲在同義詞表22中的話,則輸入分析程序20使用另外的標(biāo)記表變換該關(guān)鍵字為標(biāo)記標(biāo)識符。在圖6所示的優(yōu)選實(shí)施例中,特征標(biāo)記標(biāo)識符和值標(biāo)記標(biāo)識符具有一致的長度,均為3字節(jié)。以這種方式,可以有超過16000000不同的標(biāo)記標(biāo)識符值。接著,在圖5的方框136,給每一特征標(biāo)記標(biāo)識符和值標(biāo)記標(biāo)識符附加一個(gè)控制字節(jié)180(參見圖6)以獲得4字節(jié)的標(biāo)記181。在方框136附加的控制字節(jié)180優(yōu)選具有一個(gè)匹配/失配位182、可以用于指定一種特定記分方法的兩位分?jǐn)?shù)信息184、表示匹配分?jǐn)?shù)(如果該標(biāo)記具有一個(gè)值標(biāo)記標(biāo)識符的話)或失配分?jǐn)?shù)(如果該標(biāo)記具有一個(gè)特征標(biāo)記標(biāo)識符的話)的5位186。如圖5方框140所示,一旦產(chǎn)生了一個(gè)視圖標(biāo)記,則該視圖標(biāo)記附加在先前處理的視圖標(biāo)記上,以產(chǎn)生一個(gè)視圖標(biāo)記串。
然后過程從方框140前進(jìn)到方框142,它表示把一個(gè)事件號碼ID加到視圖標(biāo)記串的開始,把一個(gè)視圖標(biāo)記串定界符加到該視圖標(biāo)記串的末尾。其它附加信息可以選擇地加到該視圖標(biāo)記串上,例如在方框150所示的事件映射信息。然后過程前進(jìn)到方框154,它表示視圖發(fā)生器14存儲視圖標(biāo)記串到視圖存儲器16中。然后在框160處確定,附加事件的屬性是否要包含在該視圖中。如果是,則過程返回到方框132,其已經(jīng)敘述。通過處理另外的事件而產(chǎn)生的任何另外的視圖標(biāo)記都用適當(dāng)事件ID和事件定界符附加在視圖標(biāo)記串上。然而,如果在框160處確定,所有要包含在該視圖中的事件都已被處理,則過程前進(jìn)到方框162,它表示視圖發(fā)生器14把一個(gè)視圖名以及可選把一個(gè)版本號碼與在視圖存儲器16中的該視圖關(guān)聯(lián)。之后,過程在框164結(jié)束,返回到圖4。
再次參考圖4,過程然后從方框76前進(jìn)到框80,它表示由輸入分析程序20確定是否已經(jīng)從用戶輸入接口15接收一個(gè)事件。用戶可以使用一些不同的方法,包括SQL查詢、回答由用戶輸入接口15提出的診斷問題、通過網(wǎng)絡(luò)接口54下載該事件、從軟盤52輸入該事件、或者通過其它手段,輸入具有與事件數(shù)據(jù)庫12中的事件同樣的一般屬性格式的事件。如果輸入分析程序20未檢測到輸入事件,則過程簡單地在框80重復(fù),直到由用戶輸入一個(gè)事件。然后,在檢測到一個(gè)輸入事件時(shí),過程從框80前進(jìn)到方框82,它表示輸入分析程序20通過參考同義詞表22分析該事件。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,輸入分析程序20首先把所有詞變換為大寫、去掉任何詞定界符、根據(jù)一個(gè)非用詞表去除非用詞(例如“a”“and”“the”和“to”),來分析一事件。用戶輸入中的任何說明性術(shù)語被變換為關(guān)鍵詞,它們作為3字節(jié)輸入標(biāo)記存儲在同義詞表22中。最后,把任何剩余的非說明性輸入,例如數(shù)值,變換為3字節(jié)輸入標(biāo)記。從輸入分析程序20的操作可以產(chǎn)生幾個(gè)優(yōu)點(diǎn)。首先,因?yàn)樗休斎腠?xiàng)都被變換為輸入標(biāo)記,因此,檢索引擎24只需要執(zhí)行在輸入標(biāo)記和該視圖標(biāo)記的標(biāo)記標(biāo)識符部分之間的精確的詞匹配,這是需執(zhí)行的一類最簡單的匹配操作。此外,因?yàn)樗休斎霕?biāo)記都具有一致的長度,優(yōu)選小于CPU32內(nèi)部寄存器的長度,因此,通過簡單的寄存器比較就可以執(zhí)行檢索。另一個(gè)優(yōu)點(diǎn)在于,可以使用同義詞表22支持多國語言翻譯。換句話說,可以用相應(yīng)于外語說明輸入的標(biāo)記化的英語關(guān)鍵詞加載同義詞表22。以這種方式,一個(gè)英語(或其它選擇的語言)事件數(shù)據(jù)庫12通過合適的一組同義詞表22可以支持世界上任何語言。
接著方框82,過程前進(jìn)到方框84。方框84表示基于規(guī)則的事件管理程序18使用輸入分析程序20分析的輸出從視圖存儲器16中選擇要被檢索的一個(gè)視圖。雖然事件管理程序18用以從事件存儲器16中選擇一個(gè)視圖的規(guī)則依賴于具體實(shí)現(xiàn),但是事件管理程序18最好至少部分根據(jù)在該事件中存在哪些屬性而選擇要被檢索的一個(gè)最佳視圖。使用由事件管理程序18選擇的該視圖,檢索引擎24比較輸入分析程序20的輸出中每一輸入標(biāo)記與被選擇的視圖中的視圖標(biāo)記,如方框86所示。最簡單的情況是,把每一輸入標(biāo)記與每一視圖標(biāo)記比較,把匹配的視圖標(biāo)記的匹配位置位。在使用附加控制位允許檢索引擎24確定是特征標(biāo)記還是值標(biāo)記的實(shí)施例中,通過只比較特征輸入標(biāo)記和特征視圖標(biāo)記、值輸入標(biāo)記和值視圖標(biāo)記能獲得額外的效能。
檢索引擎24通過給在該視圖中的每一事件打分完成在方框86所示的檢索。雖然可以使用多種方式(其可以由事件的視圖標(biāo)記的控制字節(jié)180中的兩位分?jǐn)?shù)信息184選擇)給視圖中事件對事件的接近程度記分,但是最好根據(jù)下述公式為一視圖的每一事件單獨(dú)記分Ps=(∑1(Wm*Pm)+∑2(Wu*Pu)+∑3(Wa*Pa))/∑4(Wmt*Pt)式中,Ps是該事件的總分?jǐn)?shù),∑1是對匹配一個(gè)特征輸入標(biāo)記并具有一個(gè)匹配相應(yīng)值輸入標(biāo)記的相關(guān)值視圖標(biāo)記的所有特征視圖標(biāo)記取和,∑2是對具有一個(gè)匹配特征輸入標(biāo)記的相關(guān)值視圖標(biāo)記而與相關(guān)值輸入標(biāo)記不匹配的所有值視圖標(biāo)記取和,∑3是對不具有匹配的所有特征輸入標(biāo)記取和,∑4是對該事件中的所有特征視圖標(biāo)記取和,Wm是與一個(gè)值視圖標(biāo)記相關(guān)的匹配權(quán)重,Pm是為匹配值視圖標(biāo)記的百分比貢獻(xiàn)項(xiàng),Wu是與一個(gè)特定值視圖標(biāo)記相關(guān)的失配權(quán)重,Pu是為該失配值視圖標(biāo)記的一個(gè)百分比貢獻(xiàn)項(xiàng),Wa是與一個(gè)特定特征輸入標(biāo)記相關(guān)的不出現(xiàn)權(quán)重,Pa是可適用于所有特征輸入標(biāo)記的一個(gè)總的不出現(xiàn)百分比貢獻(xiàn)項(xiàng),Wmt是每一特征視圖標(biāo)記的最大權(quán)重,Pt是在當(dāng)前事件中的每一特征視圖標(biāo)記的百分比貢獻(xiàn)。表Ⅰ包括一個(gè)示例數(shù)據(jù)庫12,和當(dāng)執(zhí)行使用事件“A1 B1”的特征匹配時(shí)每一事件的原始和調(diào)整(亦即標(biāo)準(zhǔn)化)的分?jǐn)?shù)。
表Ⅰ
表Ⅰ中的調(diào)整分?jǐn)?shù)根據(jù)公式(Ps+1)/2從原始分?jǐn)?shù)計(jì)算,以便把所有分?jǐn)?shù)標(biāo)準(zhǔn)化為在0和1之間的值。根據(jù)上述記分方法,最高分?jǐn)?shù)事件將表示該視圖中最接近的匹配事件。因此,作為一個(gè)精確匹配,事件2得到最高分?jǐn)?shù),事件1作為次佳匹配得到次高分。最好使用用戶定義的輸入來建立閾值和最大值參量,分別確定要返回的最低許可緊密匹配分?jǐn)?shù)和最高分?jǐn)?shù)事件的最大數(shù)目。雖然當(dāng)分?jǐn)?shù)事件屬性包含特征值對時(shí)優(yōu)選使用上述記分方法,但是在另外的實(shí)施例中可以優(yōu)選使用其它可選記分方法。這些可選記分方法在待審申請系列號08/中公開,其名稱為“為事件數(shù)據(jù)庫中的事件記分的基于事件的推理系統(tǒng)和方法”,與本申請同一天遞交,結(jié)合在這里作為參考文獻(xiàn)。
然后圖4所示過程前進(jìn)到方框90,它表示檢索引擎24把最高分?jǐn)?shù)事件的事件ID傳送到事件數(shù)據(jù)庫12,后者輸出該被確定的事件到解決方案管理程序28。如方框92所示,此時(shí),如果輸出事件的分?jǐn)?shù)指示輸出事件中沒有一個(gè)足夠接近該事件的話,則解決方案管理程序28可以提示用戶另外輸入;如果確定基本接近事件的數(shù)目不夠的話,則可以提示事件管理程序18選擇另一視圖檢索。如在詢問框100所示,如果在初始檢索以及另外精細(xì)的檢索結(jié)束時(shí),確定沒有事件準(zhǔn)確匹配該事件的話,則事件維護(hù)機(jī)構(gòu)26將正確地格式化該事件以及所提供的任何決定,并把該事件加入事件數(shù)據(jù)庫12。然而,如果確定檢索引擎24確定一個(gè)或多個(gè)最佳匹配事件時(shí),則解決方案管理程序28把一個(gè)或多個(gè)最佳事件作為一個(gè)解決方案或者要采取的建議行動提交給用戶。之后,圖4所示基于事件的推理過程在方框164結(jié)束。
如上所述,本發(fā)明提供一個(gè)改進(jìn)的CBR系統(tǒng),它產(chǎn)生一個(gè)事件數(shù)據(jù)庫的簡潔視圖。通過檢索該事件數(shù)據(jù)庫的視圖而不是事件數(shù)據(jù)庫自身,檢索引擎能夠在該事件數(shù)據(jù)庫中迅速確定最佳匹配一事件的一個(gè)或多個(gè)事件。
雖然本發(fā)明是特別參考一個(gè)優(yōu)選實(shí)施例表示和敘述的,但是熟悉本技術(shù)領(lǐng)域的人理解,可以對其中的形式和細(xì)節(jié)進(jìn)行各種改變,而不離開本發(fā)明的精神和范圍。
權(quán)利要求
1.一個(gè)基于事件的推理系統(tǒng),包括一個(gè)事件數(shù)據(jù)庫,能夠存儲分別具有一個(gè)或多個(gè)屬性的多個(gè)事件;一個(gè)視圖發(fā)生器,它通過以一個(gè)或多個(gè)視圖標(biāo)記來描述所述事件數(shù)據(jù)庫中所述多個(gè)事件中至少一個(gè)選擇的子集中的每一事件,產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)視圖,所述視圖中的所有視圖標(biāo)記具有一致的長度;一個(gè)輸入分析器,它提供一個(gè)輸入事件的標(biāo)記化表示,所述標(biāo)記化表示包括一個(gè)或多個(gè)輸入標(biāo)記;一個(gè)檢索引擎,它比較所述輸入標(biāo)記與所述視圖標(biāo)記,以確定所述視圖內(nèi)一個(gè)或多個(gè)緊密匹配事件,其中通過檢索所述視圖而不是直接檢索所述數(shù)據(jù)庫來有效地確定所述一個(gè)或者多個(gè)緊密匹配事件。
2.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,進(jìn)一步包括一個(gè)解決方案管理器,它把所述一個(gè)或者多個(gè)緊密匹配事件提交給用戶。
3.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,所述視圖發(fā)生器產(chǎn)生所述事件數(shù)據(jù)庫的多個(gè)視圖;所述基于事件的推理系統(tǒng)進(jìn)一步包括一個(gè)事件管理器,它選擇所述多個(gè)視圖中的一個(gè),作為由所述檢索引擎在檢索該多個(gè)視圖的任何其它視圖之前將要檢索的選擇視圖。
4.權(quán)利要求3的基于事件的推理系統(tǒng),其特征在于,由所述視圖發(fā)生器產(chǎn)生的所述事件數(shù)據(jù)庫的所述多個(gè)視圖包括一個(gè)第一視圖和一個(gè)第二視圖,前者包括所述事件數(shù)據(jù)庫至少一個(gè)子集中所有事件的所有屬性,后者包括比在所述子集中的所有事件的所有屬性少的屬性。
5.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,所述視圖發(fā)生器在接收到由所述輸入分析器輸入的所述事件之前產(chǎn)生所述視圖。
6.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,每一視圖標(biāo)記具有與其相關(guān)的分?jǐn)?shù)信息,其中,所述檢索引擎使用所述分?jǐn)?shù)信息為所述視圖中的每一事件計(jì)算一個(gè)分?jǐn)?shù),并根據(jù)所述分?jǐn)?shù)確定所述一個(gè)或者多個(gè)緊密匹配事件。
7.權(quán)利要求6的基于事件的推理系統(tǒng),其特征在于,所述視圖包括一個(gè)第一視圖;所述視圖發(fā)生器產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)第二視圖;所述檢索引擎在所述第一視圖中的任何事件的最高排位分?jǐn)?shù)低于一個(gè)選擇的閾值時(shí)檢索所述第二視圖。
8.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,所述檢索引擎只執(zhí)行在所述輸入標(biāo)記和所述視圖標(biāo)記之間的精確詞匹配。
9.權(quán)利要求1的基于事件的推理系統(tǒng),其特征在于,所述輸入分析器包括一個(gè)關(guān)聯(lián)文字輸入和關(guān)鍵詞的同義詞表,其中所述輸入分析器通過參考所述同義詞表變換所述文字輸入為關(guān)鍵詞。
10.權(quán)利要求9的基于事件的推理系統(tǒng),其特征在于,所述同義詞表中的每一所述關(guān)鍵詞包括一個(gè)具有一致長度的輸入標(biāo)記。
11.權(quán)利要求9的基于事件的推理系統(tǒng),其特征在于,所述每一屬性包括具有一個(gè)與其相關(guān)的一個(gè)或者多個(gè)值的特征。
12.一種基于事件的推理方法,所述方法包括在一個(gè)事件數(shù)據(jù)庫中存儲各包含一個(gè)或多個(gè)屬性的多個(gè)事件;通過以一個(gè)或多個(gè)視圖標(biāo)記來描述所述數(shù)據(jù)庫中所述多個(gè)事件中至少一個(gè)選擇的子集中的每一事件,產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)視圖,所述視圖中的所有視圖標(biāo)記具有一致的長度;提供一個(gè)輸入事件的標(biāo)記化的表示,所述標(biāo)記化表示包括一個(gè)或多個(gè)輸入標(biāo)記;比較所述輸入標(biāo)記與所述視圖標(biāo)記,以確定所述視圖內(nèi)一個(gè)或多個(gè)緊密匹配事件,其中通過檢索所述視圖而不是直接檢索所述事件數(shù)據(jù)庫有效確定所述一個(gè)或者多個(gè)緊密匹配事件。
13.權(quán)利要求12的方法,其特征在于,進(jìn)一步包括把所述一個(gè)或者多個(gè)緊密匹配事件提交給用戶。
14.權(quán)利要求12的方法,其特征在于,所述產(chǎn)生步驟包括產(chǎn)生所述事件數(shù)據(jù)庫的多個(gè)視圖,所述方法進(jìn)一步包括響應(yīng)所述輸入標(biāo)記,選擇所述多個(gè)視圖中的一個(gè)作為第一視圖處理。
15.權(quán)利要求14的方法,其特征在于,所述產(chǎn)生所述事件數(shù)據(jù)庫的多個(gè)視圖的步驟包括產(chǎn)生一個(gè)第一視圖和產(chǎn)生一個(gè)第二視圖,第一視圖包括所述至少一個(gè)子集中所有事件的所有特征,第二視圖包括比在所述至少一個(gè)子集中的所有所述事件的所有所述特征少的特征。
16.權(quán)利要求12的方法,其特征在于,所述產(chǎn)生步驟在所述提供步驟之前執(zhí)行。
17.權(quán)利要求12的方法,其特征在于,每一視圖標(biāo)記具有與之關(guān)聯(lián)的分?jǐn)?shù)信息,所述比較步驟包括使用所述分?jǐn)?shù)信息為所述視圖中的每一事件計(jì)算一個(gè)分?jǐn)?shù);根據(jù)所述視圖中的事件分?jǐn)?shù)確定一個(gè)或者多個(gè)緊密匹配事件。
18.權(quán)利要求17的方法,其特征在于,所述視圖包括一個(gè)第一視圖,其中所述產(chǎn)生步驟包括產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)第二視圖,所述方法進(jìn)一步包括如果在所述第一視圖中的任何事件的最高排位分?jǐn)?shù)低于一個(gè)選擇的閾值的話,比較所述輸入標(biāo)記與所述第二視圖中的所述視圖標(biāo)記,以確定所述第二視圖中一個(gè)或者多個(gè)緊密匹配事件。
19.權(quán)利要求12的方法,其特征在于,所述比較步驟包括僅執(zhí)行在所述輸入標(biāo)記和所述視圖標(biāo)記之間的詞的精確匹配。
20.權(quán)利要求12的方法,其特征在于,進(jìn)一步包括通過參考一個(gè)關(guān)聯(lián)文字輸入和關(guān)鍵詞的同義詞表變換文字輸入為關(guān)鍵詞。
21.權(quán)利要求20的方法,其特征在于,進(jìn)一步包括把所述每一關(guān)鍵詞以長度一致的輸入標(biāo)記存儲在所述同義詞表中。
22.權(quán)利要求12的方法,其特征在于,所述存儲步驟包括在一個(gè)事件數(shù)據(jù)庫中存儲包含一個(gè)或者多個(gè)屬性的多個(gè)事件,其中所述每一屬性包括有一個(gè)或者多個(gè)與其相關(guān)的值的一個(gè)特征。
23.一種程序產(chǎn)品,其可由一個(gè)數(shù)據(jù)處理系統(tǒng)使用,以實(shí)現(xiàn)一個(gè)基于事件的推理系統(tǒng),所述數(shù)據(jù)處理系統(tǒng)包括一個(gè)事件數(shù)據(jù)庫,它能夠存儲各具有一個(gè)或多個(gè)屬性的多個(gè)事件,所述程序產(chǎn)品的特征在于;一個(gè)視圖發(fā)生器,它使所述數(shù)據(jù)處理系統(tǒng)通過以一個(gè)或多個(gè)視圖標(biāo)記來描述所述事件數(shù)據(jù)庫中所述多個(gè)事件中至少一個(gè)選擇的子集中的每一事件,產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)視圖,所述視圖中的所有視圖標(biāo)記具有一致的長度;一個(gè)輸入分析程序,它使所述數(shù)據(jù)處理系統(tǒng)提供一個(gè)輸入事件的標(biāo)記化的表示,所述標(biāo)記化表示包括一個(gè)或多個(gè)輸入標(biāo)記;一個(gè)檢索引擎,它使所述數(shù)據(jù)處理系統(tǒng)比較所述輸入標(biāo)記與所述視圖標(biāo)記,以確定所述視圖內(nèi)一個(gè)或多個(gè)緊密匹配事件,其中通過檢索所述視圖而不是直接檢索所述事件數(shù)據(jù)庫來有效確定所述一個(gè)或者多個(gè)緊密匹配事件;承載所述視圖發(fā)生器、所述輸入分析程序、和所述檢索引擎的一個(gè)信號承載介質(zhì)。
24.權(quán)利要求23的程序產(chǎn)品,其特征在于,進(jìn)一步包括在所述信號承載介質(zhì)內(nèi)的一個(gè)解決方案管理程序,它使所述數(shù)據(jù)處理系統(tǒng)把所述一個(gè)或者多個(gè)緊密匹配事件提交給用戶。
25.權(quán)利要求23的程序產(chǎn)品,其特征在于所述視圖發(fā)生器產(chǎn)生所述事件數(shù)據(jù)庫的多個(gè)視圖;所述程序產(chǎn)品進(jìn)一步包括在信號承載介質(zhì)內(nèi)的一個(gè)事件管理程序,它使所述數(shù)據(jù)處理系統(tǒng)從所述多個(gè)視圖中選擇一個(gè)作為要由所述檢索引擎在檢索所述多個(gè)視圖中任何其它視圖之前要檢索的一個(gè)選擇的視圖。
26.權(quán)利要求25的程序產(chǎn)品,其特征在于,由所述視圖發(fā)生器產(chǎn)生的所述事件數(shù)據(jù)庫的所述多個(gè)視圖包括一個(gè)第一視圖和一個(gè)第二視圖,第一視圖包括至少所述子集中所有事件的所有特征,第二視圖包括比在至少所述子集中的所有所述事件的所有所述特征少的特征。
27.權(quán)利要求23的程序產(chǎn)品,其特征在于,所述視圖發(fā)生器使所述數(shù)據(jù)處理系統(tǒng)在接收到由所述輸入分析程序輸入的所述事件之前產(chǎn)生所述視圖。
28.權(quán)利要求23的程序產(chǎn)品,其特征在于,每一視圖標(biāo)記具有與之關(guān)聯(lián)的分?jǐn)?shù)信息,其中所述檢索引擎使所述數(shù)據(jù)處理系統(tǒng)使用所述分?jǐn)?shù)信息為在所述視圖中的每一個(gè)事件計(jì)算一個(gè)分?jǐn)?shù),并根據(jù)所述分?jǐn)?shù)確定一個(gè)或者多個(gè)緊密匹配事件。
29.權(quán)利要求28的程序產(chǎn)品,其特征在于所述視圖包括一個(gè)第一視圖;所述視圖發(fā)生器使所述數(shù)據(jù)處理系統(tǒng)產(chǎn)生所述事件數(shù)據(jù)庫的一個(gè)第二視圖;所述檢索引擎使所述數(shù)據(jù)處理系統(tǒng)在所述第一視圖中的任何事件的最高排位分?jǐn)?shù)低于一個(gè)選擇的閾值時(shí),檢索所述第二視圖。
30.權(quán)利要求23的程序產(chǎn)品,其特征在于,所述檢索引擎使所述數(shù)據(jù)處理系統(tǒng)僅執(zhí)行在所述輸入標(biāo)記和所述視圖標(biāo)記之間詞的精確匹配。
31.權(quán)利要求23的程序產(chǎn)品,其特征在于,所述程序產(chǎn)品包括一個(gè)關(guān)聯(lián)文字輸入和關(guān)鍵詞的同義詞表,其中所述輸入分析程序使所述數(shù)據(jù)處理系統(tǒng)參考所述同義詞表變換所述文字輸入為關(guān)鍵詞。
32.權(quán)利要求31的程序產(chǎn)品,其特征在于,所述同義詞表的每一個(gè)關(guān)鍵詞包括一個(gè)長度一致的輸入標(biāo)記。
全文摘要
一個(gè)基于事件的推理系統(tǒng)包括一個(gè)事件數(shù)據(jù)庫,它能夠存儲具有一個(gè)或多個(gè)屬性的多個(gè)事件。該基于事件的推理系統(tǒng)的一個(gè)視圖發(fā)生器通過以一個(gè)或多個(gè)具有一致長度的視圖標(biāo)記描述所述數(shù)據(jù)庫中多個(gè)事件中至少一個(gè)選擇的子集中的每一事件,產(chǎn)生該事件數(shù)據(jù)庫的一個(gè)視圖。該基于事件的推理系統(tǒng)的一個(gè)輸入分析程序提供一個(gè)輸入事件的標(biāo)記化的描述,它包括一個(gè)或多個(gè)輸入標(biāo)記。該基于事件的推理系統(tǒng)進(jìn)一步包括一個(gè)檢索引擎,它比較輸入標(biāo)記與視圖標(biāo)記,以確定所述視圖內(nèi)一個(gè)或多個(gè)緊密匹配事件。
文檔編號G06N5/04GK1221922SQ9812657
公開日1999年7月7日 申請日期1998年12月29日 優(yōu)先權(quán)日1997年12月30日
發(fā)明者D·D·科斯基, C·S·Y·穆恩, T·A·肖爾 申請人:國際商業(yè)機(jī)器公司