通過變換復(fù)雜三元組建立本體的制作方法
【專利摘要】提供一種用于建立本體的方案?;谡Z法,在語法上變換提取的復(fù)雜三元組以識(shí)別核心術(shù)語。在語義上將語法變換后的復(fù)雜三元組變換為簡(jiǎn)化的三元組,所述簡(jiǎn)化的三元組參照將核心形容詞、副詞和動(dòng)詞概念化的新術(shù)語并且將核心術(shù)語分派給參考本體中的相應(yīng)定義和鍵,由此保留復(fù)雜三元組的語義?;趨⒖急倔w的元模式,通過添加從簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的關(guān)系并且通過添加術(shù)語的參考本體定義的語義表示,來執(zhí)行簡(jiǎn)化的三元組的充實(shí)變換以創(chuàng)建簡(jiǎn)化和充實(shí)的三元組。簡(jiǎn)化和充實(shí)的三元組被存儲(chǔ)為本體,該本體代表提供提取出了復(fù)雜三元組的自由形式文本的應(yīng)用中的知識(shí)。
【專利說明】通過變換復(fù)雜三元組建立本體
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于知識(shí)管理的數(shù)據(jù)處理方法和系統(tǒng),更具體地講,涉及一種用于產(chǎn)生本體(ontology)的技術(shù)。
【背景技術(shù)】
[0002]本體是由一組概念和概念之間的關(guān)系實(shí)現(xiàn)的知識(shí)的表示,其中知識(shí)被包括在基于軟件的應(yīng)用內(nèi)。當(dāng)每個(gè)應(yīng)用具有它自己的本體時(shí),應(yīng)用之間的語義互操作性不是直接的,因?yàn)樵谝粋€(gè)本體的上下文中表示的任何請(qǐng)求在在另一本體的上下文中被處理之前必須被轉(zhuǎn)換。為了在已知系統(tǒng)中提供前述互操作性,映射本體的結(jié)構(gòu)(即,概念和概念之間的關(guān)系),并且使用本體映射來轉(zhuǎn)換請(qǐng)求和請(qǐng)求的應(yīng)答。本體之間的不匹配可能基于使用在其基元的語法、構(gòu)造或語義方面不同的語言的本體。為了避免本體之間的語言級(jí)的不匹配,每個(gè)本體可使用相同語言,諸如資源描述框架(RDF)。RDF基于具有主謂賓表達(dá)(稱為三元組或三聯(lián)組)的形式的語句。當(dāng)使用不同方法和技術(shù)創(chuàng)建本體時(shí),會(huì)出現(xiàn)其它不匹配。在這種情況下,相同概念能夠在不同本體中具有不同名稱,相同名稱能夠在不同本體中被用于不同概念,不同概念化方案能夠?qū)е虏煌谋硎?例如,類相對(duì)于性質(zhì)、以及類相對(duì)于子類)。
【發(fā)明內(nèi)容】
[0003]在第一實(shí)施例中,本發(fā)明提供一種建立本體的方法。該方法包括下述步驟:
[0004]計(jì)算機(jī)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語;
[0005]計(jì)算機(jī)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語、識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組;
[0006]計(jì)算機(jī)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來把所述多個(gè)語法變換后的復(fù)雜三元組分別語義變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義;
[0007]基于參考本體的元模式(meta-schema),計(jì)算機(jī)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系獲得的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的(enriched)三元組,其中所述定義被包括在參考本體中;以及
[0008]計(jì)算機(jī)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新的本體。
[0009]在第二實(shí)施例中,本發(fā)明提供一種用于建立本體的計(jì)算機(jī)系統(tǒng)。所述計(jì)算機(jī)系統(tǒng)包括:
[0010]中央處理單元(CPU);
[0011]存儲(chǔ)器,耦接到CPU;
[0012]計(jì)算機(jī)可讀的有形存儲(chǔ)裝置,耦接到CPU,該存儲(chǔ)裝置包含由CPU經(jīng)由存儲(chǔ)器執(zhí)行以實(shí)現(xiàn)建立本體的方法的指令,所述方法包括下述步驟:
[0013]計(jì)算機(jī)系統(tǒng)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語;
[0014]計(jì)算機(jī)系統(tǒng)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語、識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組;
[0015]計(jì)算機(jī)系統(tǒng)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義;
[0016]基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系獲得的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及
[0017]計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
[0018]在第三實(shí)施例中,本發(fā)明提供一種計(jì)算機(jī)程序產(chǎn)品,包括:
[0019]計(jì)算機(jī)可讀的有形存儲(chǔ)裝置;和
[0020]計(jì)算機(jī)可讀程序代碼,存儲(chǔ)在計(jì)算機(jī)可讀的有形存儲(chǔ)裝置中,該計(jì)算機(jī)可讀程序代碼包含由計(jì)算機(jī)系統(tǒng)的中央處理單元(CPU)執(zhí)行以實(shí)現(xiàn)建立本體的方法的指令,所述方法包括下述步驟:計(jì)算機(jī)系統(tǒng)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語;
[0021]計(jì)算機(jī)系統(tǒng)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語、識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與語法匹配的多個(gè)語法變換后的復(fù)雜三元組;
[0022]計(jì)算機(jī)系統(tǒng)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義;
[0023]基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系獲得的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及
[0024]計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
[0025]在第四實(shí)施例中,本發(fā)明提供一種用于支持計(jì)算基礎(chǔ)設(shè)施的處理。所述處理包括:為在包括處理器的計(jì)算機(jī)系統(tǒng)中創(chuàng)建、集成、容納、維護(hù)和部署計(jì)算機(jī)可讀代碼中的至少一種提供至少一種支持服務(wù),其中處理器執(zhí)行代碼中所包含的指令,使計(jì)算機(jī)系統(tǒng)執(zhí)行建立本體的方法,其中所述方法包括下述步驟:計(jì)算機(jī)系統(tǒng)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語;
[0026]計(jì)算機(jī)系統(tǒng)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語、識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組;
[0027]計(jì)算機(jī)系統(tǒng)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義;
[0028]基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系獲得的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及
[0029]計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
[0030]本發(fā)明的實(shí)施例產(chǎn)生在概念上正確并且適應(yīng)于跨本體對(duì)應(yīng)關(guān)系的自動(dòng)發(fā)現(xiàn)的結(jié)構(gòu)良好并且豐富的本體模式,由此提供基于軟件的應(yīng)用之間的自動(dòng)語義互操作性和語義集成。隨著時(shí)間過去,通過經(jīng)由重用來自參考本體的定義的語義模式和在參考模式中不存在的新概念的語義模式而提供的自動(dòng)充實(shí),這里提供的本體建立系統(tǒng)可變得更加高效。本發(fā)明的實(shí)施例是可適配的,并且能夠隨著時(shí)間過去通過允許知識(shí)工程師分析創(chuàng)造的術(shù)語的列表和使用預(yù)定義的結(jié)構(gòu)和關(guān)系的方式以便改進(jìn)語法、本體元模式和變換規(guī)則而演進(jìn)。本體元模式的適配是不會(huì)使利用元模式的以前版本建立的本體無效的改進(jìn)。另外,本發(fā)明的實(shí)施例接受任何級(jí)別的復(fù)雜度的復(fù)雜三元組,其中可由特定適配器從任何數(shù)據(jù)源產(chǎn)生復(fù)雜三元組。另外,本發(fā)明的實(shí)施例避免了當(dāng)不同方法和技術(shù)被用于創(chuàng)建本體時(shí)在當(dāng)前出現(xiàn)的不匹配,并且由此即使當(dāng)本體涉及不同專業(yè)領(lǐng)域時(shí)也能夠?qū)崿F(xiàn)本體的自動(dòng)合并。
【專利附圖】
【附圖說明】
[0031]圖1是根據(jù)本發(fā)明的實(shí)施例的用于通過變換復(fù)雜三元組來建立本體的系統(tǒng)的方框圖。
[0032]圖2是根據(jù)本發(fā)明的實(shí)施例的通過變換復(fù)雜三元組來建立本體的處理的流程圖,其中在圖1的系統(tǒng)中實(shí)現(xiàn)該處理。
[0033]圖3是根據(jù)本發(fā)明的實(shí)施例的圖2的處理中的變換復(fù)雜三元組的處理的流程圖。
[0034]圖4A-4F描述根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的復(fù)雜三元組的語法變換的處理的流程圖。
[0035]圖5是根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的語法變換后的復(fù)雜三元組的語義變換的處理的流程圖。
[0036]圖6是根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的簡(jiǎn)化的三元組的充實(shí)變換的處理的流程圖。
[0037]圖7是根據(jù)本發(fā)明的實(shí)施例的合并通過圖2的處理建立的本體的處理的流程圖。
[0038]圖8是根據(jù)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的方框圖,該計(jì)算機(jī)系統(tǒng)被包括在圖1的系統(tǒng)中并且實(shí)現(xiàn)圖2的處理。
【具體實(shí)施方式】
[0039]概述
[0040]本發(fā)明的實(shí)施例接收從任何給定的基于軟件的應(yīng)用的論域提取的復(fù)雜三元組,其中復(fù)雜三元組具有〈復(fù)合主語,復(fù)合謂語,復(fù)合賓語〉的形式,并且其中復(fù)雜三元組中的復(fù)合主語、謂語和賓語中的每一個(gè)能夠處于任何級(jí)別的復(fù)雜度。在一個(gè)實(shí)施例中,論域是一組自由形式文本(即,非結(jié)構(gòu)化文本)。復(fù)雜三元組不形成本體,因?yàn)閺?fù)雜三元組太復(fù)雜而無法提供概念和關(guān)系的清楚識(shí)別。這里公開的實(shí)施例通過將復(fù)雜三元組簡(jiǎn)化并且變換為簡(jiǎn)單三元組(例如,RDF三元組)來使用復(fù)雜三元組建立本體,所述簡(jiǎn)單三元組在語義上等同于初始復(fù)雜三元組并且比初始復(fù)雜三元組豐富。由本發(fā)明的實(shí)施例建立的本體結(jié)構(gòu)良好,在概念上正確,并且即使當(dāng)本體涉及不同專業(yè)領(lǐng)域時(shí)也適于跨本體對(duì)應(yīng)關(guān)系的自動(dòng)發(fā)現(xiàn)。
[0041]本發(fā)明的實(shí)施例建立與單個(gè)參考本體(即,上本體)強(qiáng)匹配的本體,其中在本體的建立階段期間執(zhí)行每個(gè)本體的匹配??赏ㄟ^將一組變換規(guī)則應(yīng)用于提取的復(fù)雜三元組來完成每個(gè)建立的本體與參考本體的匹配。本發(fā)明的實(shí)施例確保:當(dāng)且僅當(dāng)從第一本體獲得的第一概念和從第二本體獲得的第二概念在參考本體中具有相同參考識(shí)別鍵時(shí),第一概念和第二概念才是相同的,因?yàn)橐韵嗤椒ń⒈倔w并且本體參考相同的參考本體。在這里提供的實(shí)施例中,當(dāng)且僅當(dāng)概念具有相同鍵時(shí),兩個(gè)概念在本體之間映射。因此,兩個(gè)本體可在它們相同的概念上合并,由此方便語義搜索和推斷,并且還方便綜合任務(wù),諸如數(shù)據(jù)變換、查詢應(yīng)答、web服務(wù)構(gòu)成等。
[0042]用于通過變換復(fù)雜三元組來建立本體的系統(tǒng)
[0043]圖1是根據(jù)本發(fā)明的實(shí)施例的用于通過變換復(fù)雜三元組來建立本體的系統(tǒng)的方框圖。本體建立系統(tǒng)100包括N個(gè)計(jì)算機(jī)系統(tǒng)102-1...102-N,其中N是大于一的整數(shù)。計(jì)算機(jī)系統(tǒng)102-1...102-N經(jīng)由協(xié)作網(wǎng)絡(luò)103彼此通信和/或與其它計(jì)算機(jī)系統(tǒng)通信。協(xié)作網(wǎng)絡(luò)103是計(jì)算機(jī)網(wǎng)絡(luò),諸如互聯(lián)網(wǎng)或內(nèi)聯(lián)網(wǎng)。
[0044]計(jì)算機(jī)系統(tǒng)102-1運(yùn)行基于軟件的應(yīng)用104-1,并且包括基于軟件和硬件的本體建立器106。計(jì)算機(jī)系統(tǒng)102-1包括本體數(shù)據(jù)存儲(chǔ)庫108-1,由本體建立器106建立的本體被存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1中。本體建立器106包括基于軟件的復(fù)雜三元組變換工具110以及一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)庫,所述一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)庫存儲(chǔ)語法112(即,一組語法規(guī)則)、參考本體114和本體元模式116,本體元模式116包括參考本體114的元模式。
[0045]在一個(gè)實(shí)施例中,參考本體114必須至少包括下面的用于參考本體中的每個(gè)術(shù)語的信息:
[0046].術(shù)語的同義詞的列表
[0047].用于識(shí)別術(shù)語的唯一鍵
[0048].術(shù)語的簡(jiǎn)短定義(例如,一句話定義)
[0049].表示參考本體的版本的版本id
[0050].派生術(shù)語(即,從該術(shù)語派生的其它術(shù)語)的列表
[0051].術(shù)語的語法類別(例如,名詞、動(dòng)詞、副詞、或形容詞)
[0052]在一個(gè)實(shí)施例中,對(duì)于其語法類別是“形容詞”的術(shù)語,參考本體114至少包括下面的信息:
[0053].術(shù)語是否是同源詞(pertainym)(即,能夠被定義為另一詞語“的”或“關(guān)于”另一詞語的形容詞)。
[0054].從其派生出該術(shù)語的屬性
[0055]在一個(gè)實(shí)施例中,對(duì)于其語法類別是“副詞”的術(shù)語,參考本體114至少包括與該術(shù)語關(guān)聯(lián)的可能的同源詞的分級(jí)體系。
[0056]在一個(gè)實(shí)施例中,對(duì)于其語法類別是“名詞”的術(shù)語,參考本體114至少包括下面的信息:
[0057].術(shù)語是否是屬性
[0058].術(shù)語是否與一個(gè)形容詞群相關(guān)
[0059].可能的多個(gè)形容詞群中的每個(gè)中的類似形容詞的列表
[0060]?術(shù)語的可能的上位詞的分級(jí)體系。如果每個(gè)X是Y或一種Y,則Y是名詞X的上位詞(例如,犬科動(dòng)物是狗的上位詞)
[0061]?術(shù)語的可能的下位詞的分級(jí)體系。如果每個(gè)Y是X或一種X,則Y是名詞X的下位詞(例如,狗是犬科動(dòng)物的下位詞)。
[0062]在一個(gè)實(shí)施例中,對(duì)于其語法類別是“動(dòng)詞”的術(shù)語,參考本體114至少包括下面的信息:
[0063].與該動(dòng)詞相關(guān)的組的全部列表
[0064]?與該動(dòng)詞相關(guān)的伴隨物的全部列表。如果要做X就必須做Y,則X必須伴隨動(dòng)詞Y (例如,打鼾必須伴隨睡覺)
[0065]?與該動(dòng)詞相關(guān)的上位詞的全部列表。如果活動(dòng)X是Y或一種Y,則動(dòng)詞Y是動(dòng)詞X的上位詞(例如,感知是聽的上位詞)
[0066]?與該動(dòng)詞相關(guān)的方式詞(troponym)的全部列表。如果活動(dòng)Y是以某種方式做X,則動(dòng)詞Y是動(dòng)詞X的方式詞(例如,口齒不清地說是講話的方式詞)。
[0067]類似于計(jì)算機(jī)系統(tǒng)102-1,計(jì)算機(jī)系統(tǒng)102-N運(yùn)行基于軟件的應(yīng)用104-N,并且包括本體建立器106。計(jì)算機(jī)系統(tǒng)102-N還包括用于存儲(chǔ)由本體建立器106建立的本體的本體數(shù)據(jù)存儲(chǔ)庫108-N,本體建立器106被包括在計(jì)算機(jī)系統(tǒng)102-N中。雖然未示出,但計(jì)算機(jī)系統(tǒng)102-N中所包括的本體建立器106包括復(fù)雜三元組變換工具110和一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)庫,所述一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)庫用于存儲(chǔ)分別具有與語法112、參考本體114和本體元模式116的功能類似的功能的語法、參考本體和本體元模式。
[0068]在一個(gè)實(shí)施例中,一個(gè)或多個(gè)其它計(jì)算機(jī)系統(tǒng)(未示出)經(jīng)協(xié)作網(wǎng)絡(luò)103與計(jì)算機(jī)系統(tǒng)102-1和計(jì)算機(jī)系統(tǒng)102-N通信,并且所述一個(gè)或多個(gè)其它計(jì)算機(jī)系統(tǒng)中的每一個(gè)包括與計(jì)算機(jī)系統(tǒng)102-1和計(jì)算機(jī)系統(tǒng)102-N中所包括的部件類似的部件。在一個(gè)實(shí)施例中,協(xié)作網(wǎng)絡(luò)103的每個(gè)節(jié)點(diǎn)是計(jì)算機(jī)系統(tǒng),該計(jì)算機(jī)系統(tǒng)包括實(shí)現(xiàn)以下相對(duì)于圖2、圖3、圖4A-4F、圖5和圖6描述的相同的本體建立方法的相同的本體建立器106。
[0069]在替代實(shí)施例中,應(yīng)用104-1和/或本體數(shù)據(jù)存儲(chǔ)庫108-1被包括在位于計(jì)算機(jī)系統(tǒng)102-1外部的計(jì)算機(jī)系統(tǒng)中。
[0070]每個(gè)應(yīng)用104-1...104-N可以是任何種類的基于軟件的應(yīng)用。例如,應(yīng)用104_1可以是包括自由形式文本的最終用戶博客、消息發(fā)送系統(tǒng)、交互式游戲或任何種類的商業(yè)應(yīng)用。
[0071]使用計(jì)算機(jī)系統(tǒng)102-1...102-N中的本體建立器106,本發(fā)明的實(shí)施例以這種方式產(chǎn)生本體:允許跨越本體的概念(即,主語(subject)和賓語(object))和關(guān)系(S卩,謂語(predicate))之間的對(duì)應(yīng)關(guān)系的自動(dòng)識(shí)別。本發(fā)明的實(shí)施例能夠提供(且確實(shí)提供)關(guān)系之間的對(duì)應(yīng)關(guān)系,因?yàn)橹^語被概念化(即,名詞化),以下更詳細(xì)地對(duì)此進(jìn)行討論。在識(shí)別概念和關(guān)系之間的對(duì)應(yīng)關(guān)系之后,本體可被自動(dòng)地合并,能夠?qū)崿F(xiàn)應(yīng)用104-1...104-N之間的自動(dòng)語義互操作性或計(jì)算機(jī)系統(tǒng)102-1...102-N的最終用戶(未示出)之間的語義協(xié)作。在一個(gè)實(shí)施例中,應(yīng)用104-1...104-N獨(dú)立于彼此而被開發(fā)。本體建立器106處理來自每個(gè)應(yīng)用(例如,應(yīng)用104-1)的輸出以創(chuàng)建本體(例如,存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1中的本體)。因?yàn)橛捎?jì)算機(jī)系統(tǒng)102-1...102-N中的本體建立器106創(chuàng)建的每個(gè)本體使用相同方法,所以這些本體能夠彼此通信,由此能夠?qū)崿F(xiàn)應(yīng)用104-1…104-N之間的語義協(xié)作。
[0072]在以下相對(duì)于圖2、圖3、圖4A-4F、圖5和圖6提供的討論中描述計(jì)算機(jī)系統(tǒng)102_1的部件的功能。
[0073]用于通過變換復(fù)雜三元組來建立本體的處理
[0074]圖2是根據(jù)本發(fā)明的實(shí)施例的通過變換復(fù)雜三元組來建立本體的處理的流程圖,其中在圖1的系統(tǒng)中實(shí)現(xiàn)該處理。雖然圖2的處理中的步驟被討論為由計(jì)算機(jī)系統(tǒng)102-1 (參見圖1)的部件執(zhí)行,但對(duì)于本領(lǐng)域技術(shù)人員而言應(yīng)該清楚的是,圖2的步驟可由圖1中的系統(tǒng)100中所包括的任何其它計(jì)算機(jī)系統(tǒng)(例如,圖1中的計(jì)算機(jī)系統(tǒng)102-N)中的類似部件執(zhí)行。通過變換復(fù)雜三元組來建立本體的處理開始于步驟200。在步驟202中,本體建立器106 (參見圖1)接收由應(yīng)用104-1(參見圖1)提供的自由形式文本。
[0075]在步驟204中,本體建立器106 (參見圖1)從在步驟202中接收的自由形式文本提取復(fù)雜三元組。在一個(gè)實(shí)施例中,本體建立器106(參見圖1)中所包括的基于軟件的自然語言處理(NLP)提取工具在步驟202中接收自由形式文本,并且在步驟204中從自由形式文本創(chuàng)建或提取復(fù)雜三元組。在替代實(shí)施例中,位于本體建立器106(參見圖1)外部的基于軟件的提取工具在步驟202中接收由應(yīng)用104-1 (參見圖1)提供的自由形式文本,在步驟204中從自由形式文本提取復(fù)雜三元組,并且在步驟204和206之間將提取的復(fù)雜三元組發(fā)送給本體建立器106 (參見圖1)。提取工具的例子是由位于New York, Armonk的國(guó)際商用機(jī)器公司提供的Language Ware?。
[0076]在步驟206中,使用存儲(chǔ)在本體元模式116 (參見圖1)中的一組變換規(guī)則,復(fù)雜三元組變換工具110(參見圖1)將在步驟204中提取的復(fù)雜三元組變換為簡(jiǎn)化的標(biāo)準(zhǔn)三元組,隨后利用在語義上相關(guān)的信息充實(shí)簡(jiǎn)化的標(biāo)準(zhǔn)三元組。在步驟206中執(zhí)行的變換包括由復(fù)雜三元組變換工具110(參見圖1)執(zhí)行的一系列的三種不同過程:(I)語法變換;(2)語義變換;和(3)充實(shí)變換。
[0077]步驟206中的語法變換包括:根據(jù)由計(jì)算機(jī)系統(tǒng)102-1 (參見圖1)在圖2的處理之前定義和接收的語法112 (參見圖1)分析在步驟204中提取的復(fù)雜三元組。語法變換包括:變換復(fù)雜三元組以與語法112 (參見圖1)匹配,識(shí)別復(fù)雜三元組中需要語義變換的術(shù)語,并且使復(fù)雜三元組標(biāo)準(zhǔn)化以便為語義變換做準(zhǔn)備。
[0078]以下相對(duì)于圖3和圖4A-4F進(jìn)一步討論語法變換。
[0079]在語法變換之后執(zhí)行步驟206中的語義變換,并且語義變換包括:在保留復(fù)雜三元組的語義的同時(shí),簡(jiǎn)化通過語法變換而獲得的復(fù)雜三元組。也就是說,通過在步驟206中在語義上變換復(fù)雜三元組而獲得的一個(gè)或多個(gè)簡(jiǎn)化的三元組在語義上等同于變換的復(fù)雜三元組。
[0080]語義變換包括:使簡(jiǎn)化的三元組的不同核心術(shù)語與參考本體114(參見圖1)匹配。簡(jiǎn)化的三元組中的每個(gè)核心術(shù)語被分派一個(gè)且僅一個(gè)術(shù)語定義以及參考本體114(參見圖1)中所包括的一個(gè)且僅一個(gè)識(shí)別鍵。以下相對(duì)于圖3的討論來討論和定義核心術(shù)語。如果復(fù)雜三元組變換工具110 (參見圖1)確定簡(jiǎn)化的三元組中所需的術(shù)語不在參考本體114(參見圖1)中,則復(fù)雜三元組變換工具110(參見圖1)創(chuàng)造需要的術(shù)語。
[0081]通過步驟206獲得的每個(gè)三元組是簡(jiǎn)化的三元組,因?yàn)樗鼉H包含單個(gè)的術(shù)語并且實(shí)現(xiàn)二元關(guān)系。在一個(gè)實(shí)施例中,通過步驟206中的語義變換而獲得的簡(jiǎn)化的三元組具有形式(subject_term, predicate_term, object_term)(即,簡(jiǎn)化的三元組具有用于三元組的RDF格式)。
[0082]以下相對(duì)于圖3和圖5進(jìn)一步討論語義變換。
[0083]通過添加來自簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體114(參見圖1)的對(duì)應(yīng)關(guān)系的關(guān)系,并且通過添加由每個(gè)術(shù)語在參考本體114(參見圖1)中具有的定義給出的語義表示,步驟206中的充實(shí)變換充實(shí)了通過步驟206中所包括的語義變換而獲得的簡(jiǎn)化的三元組。為了執(zhí)行步驟206中的充實(shí)變換,復(fù)雜三元組變換工具110(參見圖1)需要參考本體114(參見圖1)的結(jié)構(gòu)的知識(shí)。前述參考本體114(參見圖1)的結(jié)構(gòu)的知識(shí)是參考本體的元模式。本體建立器106(參見圖1)將參考本體114(參見圖1)的元模式存儲(chǔ)為本體兀模式116 (參見圖1)的一部分。
[0084]以下相對(duì)于圖3和圖6進(jìn)一步討論充實(shí)變換。
[0085]在步驟208中,本體建立器106 (參見圖1)將簡(jiǎn)化和充實(shí)的標(biāo)準(zhǔn)三元組作為新建立的本體存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1(參見圖1)中。圖2的處理結(jié)束于步驟210。
[0086]在一個(gè)實(shí)施例中,在步驟208中,本體建立器106 (參見圖1)將簡(jiǎn)化和充實(shí)的標(biāo)準(zhǔn)三元組存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1(參見圖1)中所包括的本體數(shù)據(jù)庫中。在一個(gè)實(shí)施例中,在步驟208中,本體建立器106 (參見圖1)將新建立的本體與在步驟204中提取的復(fù)雜三元組一起存儲(chǔ)在在本體元模式116 (參見圖1)中指定的一組數(shù)據(jù)庫表中。前述一組數(shù)據(jù)庫表實(shí)現(xiàn)一組標(biāo)準(zhǔn)關(guān)系,包括:(I)復(fù)雜三元組中或簡(jiǎn)化和充實(shí)的三元組中的術(shù)語能夠具有的與參考本體114(參見圖1)的不同種類的關(guān)系;(2)在步驟204中提取的復(fù)雜三元組和從步驟206獲得的簡(jiǎn)化和充實(shí)的三元組之間的關(guān)系;和(3)由步驟206中所包括的語義變換產(chǎn)生的不同標(biāo)準(zhǔn)關(guān)系。
[0087]在一個(gè)實(shí)施例中,在圖1中的不同計(jì)算機(jī)系統(tǒng)處重復(fù)圖2的處理以建立多個(gè)本體,其中圖2的處理的每次執(zhí)行建立所述多個(gè)本體中的一個(gè)對(duì)應(yīng)本體。本發(fā)明的實(shí)施例可自動(dòng)地執(zhí)行所述多個(gè)可能跨領(lǐng)域的本體的語義集成,因?yàn)樗龆鄠€(gè)本體全都通過圖2的處理來建立。
[0088]變換復(fù)雜三元組
[0089]圖3是根據(jù)本發(fā)明的實(shí)施例的圖2的處理中的變換復(fù)雜三元組的處理的流程圖。在一個(gè)實(shí)施例中,圖3的處理被包括在步驟206(參見圖2)中。將復(fù)雜三元組變換為簡(jiǎn)化和充實(shí)的標(biāo)準(zhǔn)三元組的處理開始于步驟300。在步驟302中,復(fù)雜三元組變換工具110 (參見圖1)接收已在步驟302之前從自由形式文本提取的復(fù)雜三元組。
[0090]在步驟304中,復(fù)雜三元組變換工具110 (參見圖1)執(zhí)行在步驟302中接收的復(fù)雜三元組的語法變換以使復(fù)雜三元組的術(shù)語與在步驟302之前定義的語法112 (參見圖1)匹配。語法變換包括識(shí)別復(fù)雜三元組中所包括的核心術(shù)語和非核心術(shù)語,并且還包括識(shí)別要分析的復(fù)雜三元組中的術(shù)語的類型(即,語法類別),至少包括名詞、動(dòng)詞、形容詞和副詞。在另一實(shí)施例中,步驟304包括識(shí)別介詞。另外,步驟304中的語法變換包括:使復(fù)雜三元組標(biāo)準(zhǔn)化以將所獲得的復(fù)雜三元組準(zhǔn)備用于步驟306中的語義變換和步驟308中的充實(shí)變換。
[0091]如這里所使用的,核心術(shù)語被定義為作為由復(fù)雜三元組表示的語義的基礎(chǔ)的至少一部分的復(fù)雜三元組中的術(shù)語(即,核心術(shù)語是這樣的術(shù)語,即在沒有該術(shù)語的情況下,由三元組表示的語義將會(huì)丟失)。核心術(shù)語并不總是概念(即,主語或賓語)或關(guān)系(即,謂語);核心術(shù)語可以是副詞或形容詞,因?yàn)楦痹~和形容詞帶有重要的語義。
[0092]步驟304的結(jié)果包括語法變換后的復(fù)雜三元組。在一個(gè)實(shí)施例中,通過圖4A-4F中描述的處理來實(shí)現(xiàn)步驟304。
[0093]在步驟306中,復(fù)雜三元組變換工具110 (參見圖1)執(zhí)行從步驟304獲得的復(fù)雜三元組的語義變換。步驟306中的語義變換包括:通過使用存儲(chǔ)在本體元模式116(參見圖1)中的變換規(guī)則使每個(gè)識(shí)別的核心術(shù)語與參考本體114(參見圖1)中的各自定義匹配。步驟306中的語義變換包括:使未在參考本體114 (參見圖1)中找到的核心術(shù)語與各創(chuàng)造的術(shù)語匹配,所述各創(chuàng)造的術(shù)語與它們的對(duì)應(yīng)定義一起被存儲(chǔ)在本體元模式116(參見圖1)中。另外,步驟306中的語義變換可通過復(fù)雜三元組變換工具110(參見圖1)創(chuàng)造一個(gè)或多個(gè)新術(shù)語,所述一個(gè)或多個(gè)新術(shù)語隨后被存儲(chǔ)在本體元模式116(參見圖1)中。
[0094]步驟306的結(jié)果是一組簡(jiǎn)化的三元組(即,語義變換后的三元組),所述一組簡(jiǎn)化的三元組保留在步驟302中接收的復(fù)雜三元組的語義并且保留從步驟304獲得的語法變換后的三元組的語義。從步驟304獲得的每個(gè)復(fù)雜三元組可在步驟306中在語義上變換為一個(gè)或多個(gè)簡(jiǎn)化的三元組。從步驟306獲得的所述一組簡(jiǎn)化的三元組被包括在通過圖2的處理建立的本體中。
[0095]在一個(gè)實(shí)施例中,通過圖5中描述的處理來實(shí)現(xiàn)步驟306。
[0096]在步驟308中,復(fù)雜三元組變換工具110 (參見圖1)執(zhí)行從步驟306獲得的簡(jiǎn)化的三元組的充實(shí)變換。步驟308中的充實(shí)變換包括:通過將簡(jiǎn)化的三元組的核心術(shù)語與從參考本體114(參見圖1)獲得的核心術(shù)語的定義的對(duì)應(yīng)關(guān)系添加到本體,充實(shí)正在建立的本體。步驟308中的充實(shí)變換還包括:分析從參考本體114(參見圖1)獲得的定義以創(chuàng)建充實(shí)正在建立的本體的另外的小的模式。復(fù)雜三元組變換工具110 (參見圖1)通過檢索并且應(yīng)用存儲(chǔ)在本體元模式116 (參見圖1)中的規(guī)則來執(zhí)行步驟308。步驟308中的充實(shí)變換基于獲得的定義創(chuàng)建一組新的復(fù)雜三元組。
[0097]在一個(gè)實(shí)施例中,通過圖6中描述的處理來實(shí)現(xiàn)步驟308。
[0098]在步驟310中,復(fù)雜三元組變換工具110 (參見圖1)接收在步驟308中創(chuàng)建的所述一組新的復(fù)雜三元組。在步驟312中,復(fù)雜三元組變換工具110 (參見圖1)重復(fù)步驟304和306以執(zhí)行在310中接收的所述一組新的復(fù)雜三元組中的每個(gè)復(fù)雜三元組的語法和語義變換,由此針對(duì)獲得的定義創(chuàng)建新的簡(jiǎn)化的三元組(即,創(chuàng)建代表各定義的語義模式)。
[0099]在步驟314中,復(fù)雜三元組變換工具110 (參見圖1)確定是否已達(dá)到分析深度。如果已達(dá)到分析深度,則執(zhí)行步驟314的“是”分支并且執(zhí)行步驟316 ;否則,執(zhí)行步驟314的“否”分支并且圖3的處理循環(huán)回至步驟308,執(zhí)行從步驟312的最近執(zhí)行獲得的簡(jiǎn)化的三元組的充實(shí)變換。分析深度可由復(fù)雜三元組變換工具110 (參見圖1)在步驟314的第一次執(zhí)行之前接收。
[0100]在步驟316中,復(fù)雜三元組變換工具110 (參見圖1)輸出通過步驟304的語法變換、步驟306的語義變換和步驟308的充實(shí)變換而獲得的簡(jiǎn)化和充實(shí)的標(biāo)準(zhǔn)三元組。圖3的處理結(jié)束于步驟318。
[0101]作為一個(gè)例子,復(fù)雜三元組變換工具110 (參見圖1)接收初始化為開始于步驟308的循環(huán)的期望迭代次數(shù)的分析深度參數(shù)。復(fù)雜三元組變換工具110(參見圖1)在步驟312的第一次執(zhí)行之前接收初始化的分析深度參數(shù)。在這個(gè)例子中,復(fù)雜三元組變換工具110 (參見圖1)在步驟312之后并且在步驟314之前使分析深度參數(shù)減小一。如果復(fù)雜三元組變換工具110(參見圖1)在步驟314中確定減小的分析深度參數(shù)小于一,則分析深度參數(shù)指示已達(dá)到分析深度,并且執(zhí)行步驟314的“是”分支并且執(zhí)行步驟316。否則,復(fù)雜三元組變換工具110(參見圖1)在步驟314中確定減小的分析深度參數(shù)大于或等于一,這指示尚未達(dá)到分析深度(即,必須執(zhí)行開始于步驟308的循環(huán)中的步驟的至少一次迭代或更多次迭代),并且執(zhí)行步驟314的“否”分支以使得該處理循環(huán)回至步驟308。
[0102]對(duì)于本領(lǐng)域技術(shù)人員而言將會(huì)清楚的是,上述參數(shù)的初始化和遞減僅是例子,并且可在圖3的處理中采用另一初始化和參數(shù)更新的類型。作為另一例子,參數(shù)可被初始化為零值,可通過將參數(shù)增加一而被更新,并且步驟314可確定參數(shù)是否大于或等于閾值,所述閾值等于開始于步驟308的循環(huán)的期望迭代次數(shù)。
[0103]雖然在圖3中未示出,但該處理可包括提示用戶觀看和驗(yàn)證步驟304、步驟306和/或步驟308的結(jié)果并且從用戶接收結(jié)果的驗(yàn)證或結(jié)果的修改的步驟(未示出)。隨著時(shí)間過去,當(dāng)通過圖2和圖3的處理建立了更多本體時(shí),利用更好的語法112 (參見圖1)、本體元模式116(參見圖1)中的更好的變換規(guī)則和一組更好的創(chuàng)造的術(shù)語,更好地調(diào)整本體建立系統(tǒng)100 (參見圖1),由此允許該系統(tǒng)僅向用戶提示變換步驟的結(jié)果的驗(yàn)證或者完全避免提示用戶的需要。
[0104]語法變換
[0105]圖4A-4F描述根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的復(fù)雜三元組的語法變換的處理的流程圖。在一個(gè)實(shí)施例中,圖4A-4F的處理被包括在步驟304(參見圖3)中。圖4A-4F的處理開始于圖4A中的步驟400。在步驟402之前,復(fù)雜三元組變換工具110 (參見圖1)接收在步驟204(參見圖2)中提取的所述多個(gè)復(fù)雜三元組中的一個(gè)復(fù)雜三元組。以下,在圖4A-4F的討論中,在步驟402之前接收的復(fù)雜三元組被簡(jiǎn)稱為“復(fù)雜三元組”。在步驟402中,基于語法112 (參見圖1)和參考本體114 (參見圖1),復(fù)雜三元組變換工具110(參見圖1)識(shí)別復(fù)雜三元組中的復(fù)合主語。
[0106]在步驟404中,復(fù)雜三元組變換工具110 (參見圖1)確定在步驟402中識(shí)別的復(fù)合主語是否是單個(gè)術(shù)語。如果復(fù)雜三元組變換工具110 (參見圖1)在步驟404中確定識(shí)別的復(fù)合主語是單個(gè)術(shù)語,則執(zhí)行步驟404的“是”分支并且執(zhí)行步驟406。在步驟406中,復(fù)雜三元組變換工具110 (參見圖1)將作為單個(gè)術(shù)語的識(shí)別的復(fù)合主語指定為核心術(shù)語并且指定為名詞(即,將識(shí)別的復(fù)合主語指定為核心名詞)。
[0107]返回到步驟404,如果復(fù)雜三元組變換工具110 (參見圖1)確定識(shí)別的復(fù)合主語不是單個(gè)術(shù)語,則執(zhí)行步驟404的“否”分支并且執(zhí)行詢問步驟408。
[0108]如果復(fù)雜三元組變換工具110 (參見圖1)在步驟408中確定在步驟402中識(shí)別的復(fù)合主語僅包括一個(gè)能夠與參考本體114(參見圖1)中的名詞匹配的術(shù)語,則執(zhí)行步驟408的“是”分支并且執(zhí)行步驟410。在步驟410中,復(fù)雜三元組變換工具110(參見圖1)將能夠與名詞匹配的識(shí)別的復(fù)合主語中的前述一個(gè)術(shù)語指定為核心術(shù)語并且指定為名詞。
[0109]返回到步驟408,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟402中識(shí)別的復(fù)合主語并不僅包括一個(gè)能夠與參考本體114(參見圖1)中的名詞匹配的術(shù)語,則執(zhí)行步驟408的“否”分支并且執(zhí)行圖4B中的步驟412。步驟412 (參見圖4B)也跟在步驟410之后。
[0110]在步驟412的每次執(zhí)行中,復(fù)雜三元組變換工具110(參見圖1)處理識(shí)別的復(fù)合主語中的各術(shù)語。以下,針對(duì)圖4B中的步驟,正在由步驟412處理的術(shù)語被稱為“當(dāng)前術(shù)語”。在步驟412中,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟402 (參見4A)中識(shí)別的復(fù)合主語中的當(dāng)前術(shù)語能夠僅與參考本體114(參見圖1)中的形容詞匹配,則執(zhí)行步驟412的“是”分支并且執(zhí)行步驟414。
[0111]在步驟414中,復(fù)雜三元組變換工具110 (參見圖1)將能夠僅與參考本體114(參見圖1)中的形容詞匹配的當(dāng)前術(shù)語指定為形容詞。如果復(fù)雜三元組變換工具110(參見圖1)在步驟416中確定在步驟414中指定的形容詞直接聯(lián)系到一名詞,則執(zhí)行步驟416的“是”分支并且執(zhí)行步驟418。在一個(gè)實(shí)施例中,直接聯(lián)系到名詞的形容詞被定義為在沒有任何介詞的情況下聯(lián)系到名詞的形容詞。在步驟418中,復(fù)雜三元組變換工具110(參見圖1)將前述形容詞指定為核心術(shù)語。
[0112]返回到步驟416,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟414中指定的形容詞不直接聯(lián)系到名詞,則執(zhí)行步驟416的“否”分支并且執(zhí)行步驟420。在步驟420中,復(fù)雜三元組變換工具110(參見圖1)提示計(jì)算機(jī)系統(tǒng)102-1(參見圖1)的用戶并且從用戶接收指示前述形容詞是核心術(shù)語還是非核心術(shù)語的輸入。
[0113]返回到步驟412,如果復(fù)雜三元組變換工具110(參見圖1)確定前述復(fù)合主語中的當(dāng)前術(shù)語不能僅與參考本體114(參見圖1)中的形容詞匹配,則執(zhí)行步驟412的“否”分支并且執(zhí)行步驟424。
[0114]詢問步驟424跟在步驟412的“否”分支以及步驟418和420中的每一個(gè)之后。如果復(fù)雜三元組變換工具110 (參見圖1)在步驟424中確定在步驟402 (參見圖4A)中識(shí)別的復(fù)合主語包括還未由步驟412處理的另一術(shù)語,則執(zhí)行步驟424的“是”分支并且該處理循環(huán)回至步驟412,在步驟412,由步驟424確定為被包括在復(fù)合主語中的該另一術(shù)語相對(duì)于步驟412變?yōu)樾碌摹爱?dāng)前術(shù)語”。否則,如果復(fù)雜三元組變換工具110(參見圖1)在步驟424中確定在步驟402 (參見4A)中識(shí)別的復(fù)合主語不包括要由步驟412處理的其它術(shù)語,則執(zhí)行步驟424的“否”分支并且執(zhí)行圖4C中的步驟426。
[0115]在跟在步驟424 (參見圖4B)的“否”分支之后并且也跟在步驟406 (參見圖4A)之后的步驟426中,復(fù)雜三元組變換工具110(參見圖1)基于語法112(參見圖1)和參考本體114(參見圖1)識(shí)別復(fù)雜三元組中的復(fù)合謂語。
[0116]如果復(fù)雜三元組變換工具110(參見圖1)在步驟428中確定在步驟426中識(shí)別的謂語是單個(gè)術(shù)語,則執(zhí)行步驟428的“是”分支并且執(zhí)行步驟430。在步驟430中,復(fù)雜三元組變換工具110(參見圖1)將該單個(gè)術(shù)語指定為核心術(shù)語并且指定為動(dòng)詞。
[0117]返回到步驟428,如果復(fù)雜三元組變換工具110(參見圖1)確定在步驟426中識(shí)別的謂語不是單個(gè)術(shù)語,則執(zhí)行步驟428的“否”分支并且執(zhí)行詢問步驟432。在步驟432的每次執(zhí)行中,復(fù)雜三元組變換工具110(參見圖1)處理識(shí)別的復(fù)合謂語中的各術(shù)語。以下,針對(duì)步驟432和圖4C中的隨后的步驟,正在由步驟432處理的術(shù)語被稱為“當(dāng)前術(shù)語”。
[0118]如果復(fù)雜三元組變換工具110 (參見圖1)在步驟432中確定當(dāng)前術(shù)語能夠僅與參考本體114(參見圖1)中的副詞匹配,則執(zhí)行步驟432的“是”分支并且執(zhí)行步驟434。在步驟434中,復(fù)雜三元組變換工具110(參見圖1)將當(dāng)前術(shù)語指定為副詞。
[0119]如果復(fù)雜三元組變換工具110 (參見圖1)在步驟436中確定在步驟434中指定的副詞直接聯(lián)系到在步驟426中識(shí)別的復(fù)合謂語中的動(dòng)詞,則執(zhí)行步驟436的“是”分支并且執(zhí)行步驟438。在一個(gè)實(shí)施例中,直接聯(lián)系到動(dòng)詞的副詞被定義為在沒有任何介詞的情況下聯(lián)系到動(dòng)詞的副詞。在步驟438中,復(fù)雜三元組變換工具110(參見圖1)將前述副詞指定為核心術(shù)語。
[0120]返回到步驟436,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟434中指定的副詞不直接聯(lián)系到識(shí)別的復(fù)合謂語中的動(dòng)詞,則執(zhí)行步驟436的“否”分支并且執(zhí)行步驟440。在步驟440中,復(fù)雜三元組變換工具110(參見圖1)提示用戶并且從用戶接收指示前述副詞是核心術(shù)語還是非核心術(shù)語的輸入。
[0121]返回到步驟432,如果復(fù)雜三元組變換工具110 (參見圖1)確定當(dāng)前術(shù)語不能僅與參考本體114(參見圖1)中的副詞匹配,則執(zhí)行步驟432的“否”分支并且執(zhí)行步驟444。
[0122]詢問步驟444跟在步驟432的“否”分支以及步驟438和440中的每一個(gè)之后。如果復(fù)雜三元組變換工具110 (參見圖1)在步驟444中確定在步驟426中識(shí)別的謂語包括還未由步驟432處理的另一術(shù)語,則執(zhí)行步驟444的“是”分支并且該處理循環(huán)回至步驟432,被確定為還未由步驟432處理的該另一術(shù)語相對(duì)于步驟432變?yōu)椤爱?dāng)前術(shù)語”。
[0123]否則,如果復(fù)雜三元組變換工具110 (參見圖1)在步驟444中確定在步驟426中識(shí)別的復(fù)合謂語不包括要由步驟432處理的其它術(shù)語,則執(zhí)行步驟444的“否”分支并且執(zhí)行圖4D中的步驟446。
[0124]在跟在步驟444 (參見圖4C)的“否”分支之后并且也跟在步驟430 (參見圖4C)之后的圖4D中的步驟446中,復(fù)雜三元組變換工具110 (參見圖1)基于語法112 (參見圖1)和參考本體114(參見圖1)識(shí)別復(fù)雜三元組中的復(fù)合賓語。
[0125]在步驟448中,復(fù)雜三元組變換工具110 (參見圖1)確定在步驟446中識(shí)別的復(fù)合賓語是否是單個(gè)術(shù)語。如果復(fù)雜三元組變換工具I1 (參見圖1)在步驟448中確定識(shí)別的復(fù)合賓語是單個(gè)術(shù)語,則執(zhí)行步驟448的“是”分支并且執(zhí)行步驟450。在步驟450中,復(fù)雜三元組變換工具110 (參見圖1)將作為單個(gè)術(shù)語的識(shí)別的復(fù)合賓語指定為核心術(shù)語并且指定為名詞(即,將識(shí)別的復(fù)合賓語指定為核心名詞)。
[0126]返回到步驟448,如果復(fù)雜三元組變換工具110 (參見圖1)確定識(shí)別的復(fù)合賓語不是單個(gè)術(shù)語,則執(zhí)行步驟448的“否”分支并且執(zhí)行詢問步驟452。
[0127]如果復(fù)雜三元組變換工具110 (參見圖1)在步驟452中確定在步驟446中識(shí)別的復(fù)合賓語僅包括一個(gè)能夠與參考本體114(參見圖1)中的名詞匹配的術(shù)語,則執(zhí)行步驟452的“是”分支并且執(zhí)行步驟454。在步驟454中,復(fù)雜三元組變換工具110(參見圖1)將能夠與名詞匹配的識(shí)別的復(fù)合賓語中的前述一個(gè)術(shù)語指定為核心術(shù)語并且指定為名詞。
[0128]返回到步驟452,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟446中識(shí)別的復(fù)合賓語并不僅包括一個(gè)能夠與參考本體114(參見圖1)中的名詞匹配的術(shù)語,則執(zhí)行步驟452的“否”分支并且執(zhí)行圖4E中的步驟456。
[0129]在步驟456的每次執(zhí)行中,復(fù)雜三元組變換工具110(參見圖1)處理識(shí)別的復(fù)合賓語中的各術(shù)語。以下,針對(duì)圖4E中的步驟,正在由步驟456處理的術(shù)語被稱為“當(dāng)前術(shù)語”。在步驟456中,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟446 (參見4D)中識(shí)別的復(fù)合賓語中的當(dāng)前術(shù)語能夠僅與參考本體114(參見圖1)中的形容詞匹配,則執(zhí)行步驟456的“是”分支并且執(zhí)行步驟458。
[0130]在步驟458中,復(fù)雜三元組變換工具110 (參見圖1)將能夠僅與參考本體114 (參見圖1)中的形容詞匹配的當(dāng)前術(shù)語指定為形容詞。如果復(fù)雜三元組變換工具110(參見圖1)在步驟460中確定在步驟458中指定的形容詞直接聯(lián)系到名詞,則執(zhí)行步驟460的“是”分支并且執(zhí)行步驟462。在步驟462中,復(fù)雜三元組變換工具110 (參見圖1)將在步驟458中指定的前述形容詞指定為核心術(shù)語。
[0131]返回到步驟460,如果復(fù)雜三元組變換工具110 (參見圖1)確定在步驟458中指定的形容詞不直接聯(lián)系到名詞,則執(zhí)行步驟460的“否”分支并且執(zhí)行步驟464。在步驟464中,復(fù)雜三元組變換工具110(參見圖1)提示用戶并且從用戶接收指示在步驟458中指定的前述形容詞是核心術(shù)語還是非核心術(shù)語的輸入。
[0132]返回到步驟456,如果復(fù)雜三元組變換工具110 (參見圖1)確定前述復(fù)合賓語中的當(dāng)前術(shù)語不能僅與參考本體114(參見圖1)中的形容詞匹配,則執(zhí)行步驟456的“否”分支并且執(zhí)行步驟468。
[0133]詢問步驟468跟在步驟456的“否”分支以及步驟462和464中的每一個(gè)之后。如果復(fù)雜三元組變換工具110 (參見圖1)在步驟468中確定在步驟446 (參見圖4D)中識(shí)別的復(fù)合賓語包括還未由步驟456處理的另一術(shù)語,則執(zhí)行步驟468的“是”分支并且該處理循環(huán)回至步驟456,在步驟456,由步驟468確定為被包括在復(fù)合賓語中的該另一術(shù)語相對(duì)于步驟456變?yōu)樾碌摹爱?dāng)前術(shù)語”。否則,如果復(fù)雜三元組變換工具110(參見圖1)在步驟468中確定在步驟446 (參見4D)中識(shí)別的復(fù)合賓語不包括要由步驟456處理的其它術(shù)語,則執(zhí)行步驟468的“否”分支并且執(zhí)行圖4F中的步驟470。
[0134]在步驟470中,復(fù)雜三元組變換工具110(參見圖1)向用戶呈現(xiàn)由本體建立器106(參見圖1)在圖4A-4E的前面的步驟中確定的復(fù)雜三元組中包括的術(shù)語的類別(B卩,至少名詞、動(dòng)詞、形容詞和副詞的類別)和作用(即,核心術(shù)語或非核心術(shù)語)。
[0135]在步驟472中,復(fù)雜三元組變換工具110 (參見圖1)從用戶接收對(duì)復(fù)雜三元組中所包括的每個(gè)術(shù)語的類別和作用的接受或拒絕。
[0136]在步驟474中,復(fù)雜三元組變換工具110(參見圖1)提示用戶并且從用戶接收本體建立器106 (參見圖1)不能在圖4A-4E的步驟中為其確定類別或者在步驟472中接收到對(duì)其的拒絕的復(fù)雜三元組中所包括的每個(gè)術(shù)語的類別。
[0137]在步驟476中,復(fù)雜三元組變換工具110(參見圖1)提示用戶并且從用戶接收本體建立器106 (參見圖1)不能在圖4A-4E的步驟中為其確定作用或者在步驟472中接收到對(duì)其的拒絕的復(fù)雜三元組中所包括的每個(gè)術(shù)語的作用。每個(gè)非核心術(shù)語必須與核心術(shù)語關(guān)聯(lián)。在一個(gè)實(shí)施例中,如果復(fù)雜三元組的前述變換不能產(chǎn)生非核心術(shù)語和核心術(shù)語之間的關(guān)聯(lián),則最終用戶可使非核心術(shù)語與核心術(shù)語關(guān)聯(lián)。非核心術(shù)語和核心術(shù)語之間的關(guān)聯(lián)將會(huì)被轉(zhuǎn)換為將非核心術(shù)語聯(lián)系到核心術(shù)語的“has_characteristics”(具有特性)關(guān)系,如以下相對(duì)于步驟510 (參見圖5)所討論的。
[0138]在步驟478中,復(fù)雜三元組變換工具110 (參見圖1)使復(fù)雜三元組標(biāo)準(zhǔn)化以方便圖3中的步驟306和308中的變換。在步驟478中使復(fù)雜三元組標(biāo)準(zhǔn)化的規(guī)則的例子包括:
[0139].利用下面的變換使包括連詞的復(fù)雜三元組標(biāo)準(zhǔn)化:
[0140](subject_l AND subject_2, predicate, object)
[0141]變?yōu)?br>
[0142](subject_l, predicate, object)
[0143](subject_2, predicate, object)
[0144].通過將被動(dòng)形式變換為主動(dòng)形式使包括被動(dòng)形式的復(fù)雜三元組標(biāo)準(zhǔn)化:
[0145](subject_term, is_predicated, object_term)
[0146]變?yōu)?br>
[0147](object_term, predicate, subject_term)
[0148]例如,復(fù)雜三元組變換工具110(參見圖1)將被動(dòng)形式的動(dòng)詞變換為主動(dòng)形式的動(dòng)詞,同時(shí)保留動(dòng)詞的語義。
[0149]圖4A-4F的處理結(jié)束于步驟480。
[0150]雖然在圖4A-4F中未示出,但其它變換步驟可被添加到語法變換處理以在復(fù)雜三元組中施加非空值。例如,如果復(fù)雜三元組不包括賓語(例如,復(fù)雜謂語是不及物動(dòng)詞),則復(fù)雜三元組變換工具110(參見圖1)創(chuàng)建和并且添加賓語。如果復(fù)雜三元組不包括主語,則復(fù)雜三元組變換工具110 (參見圖1)創(chuàng)建并且添加主語。如果在沒有賓語的情況下復(fù)雜三元組包括描述主語的屬性,則復(fù)雜三元組變換工具110(參見圖1)變換該屬性和動(dòng)詞。以下提供另外的變換步驟的特定例子:
[0151]例子I:<fish, swim, 一> 變?yōu)?
[0152]<fish, swim, fish-swim>
[0153]〈fish-swim, is_a, swim〉
[0154]例子2:<It, froze,—> 變?yōu)?
[0155]〈it, perform, freeze)
[0156]例子3:<car, is, performant> 變?yōu)?
[0157]<car, has, performance)
[0158]在圖4A-4F的處理中指定的語法變換規(guī)則和上述另外的規(guī)則不構(gòu)成窮舉列表。不管語法變換規(guī)則的特定列表如何,在步驟304中(參見圖3)執(zhí)行的語法變換必須確保:復(fù)雜三元組符合語法112 (參見圖1),并且識(shí)別出復(fù)雜三元組中的每個(gè)術(shù)語的類別和作用。語義變換(即,圖3中的步驟306)應(yīng)用與以上相對(duì)于圖4A-4F描述的變換規(guī)則不同的變換規(guī)貝U,并且由語義變換應(yīng)用的變換規(guī)則可取決于要變換的術(shù)語的類別和作用。
[0159]在一個(gè)實(shí)施例中,在圖4A-4F的處理中使用的語法112(參見圖1)是良定義的語法,該語法指定:(I)包括名詞和零個(gè)或更多形容詞的復(fù)合主語;(2)包括動(dòng)詞和零個(gè)或更多副詞的復(fù)合謂語;(3)包括名詞和零個(gè)或更多形容詞的復(fù)合賓語;(4)包括核心術(shù)語和零個(gè)或更多非核心術(shù)語的名詞;(4)包括核心術(shù)語和零個(gè)或更多非核心術(shù)語的動(dòng)詞;(5)包括核心術(shù)語和零個(gè)或更多非核心術(shù)語的副詞;以及(6)包括核心術(shù)語和零個(gè)或更多非核心術(shù)語的形容詞。在這個(gè)段落中描述的實(shí)施例中,語法112(參見圖1)允許圖4A-4F的處理識(shí)別核心名詞、動(dòng)詞、形容詞和副詞。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,本發(fā)明能夠使用另一語法,或者可隨著時(shí)間過去基于由本體建立器106(參見圖1)建立的本體的分析修改語法,但使用的語法必須允許至少識(shí)別名詞、動(dòng)詞、形容詞和副詞。如果其它詞語類別被認(rèn)為相對(duì)于語義而言重要(例如,介詞),則語法也必須表示該其它詞語類別。在一個(gè)實(shí)施例中,語法112 (參見圖1)隨著時(shí)間過去而演進(jìn),使本體建立器106 (參見圖1)隨著時(shí)間過去而更加有效。例如,語法112(參見圖1)的第一版本僅可識(shí)別名詞、動(dòng)詞、形容詞和副詞,而隨后的版本還可識(shí)別介詞。
[0160]語義變換
[0161]圖5是根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的語法變換后的復(fù)雜三元組的語義變換的處理的流程圖。在一個(gè)實(shí)施例中,圖5的處理被包括在步驟306(參見圖3)中。語義變換的處理開始于步驟500。在步驟502中,復(fù)雜三元組變換工具110 (參見圖1)對(duì)通過在步驟304(參見圖3)中執(zhí)行的語法變換而獲得的復(fù)雜三元組(即,語法變換后的復(fù)雜三元組)中的每個(gè)核心術(shù)語消除歧義。在一個(gè)實(shí)施例中,步驟502包括:執(zhí)行詞語意思消除歧義,這包括識(shí)別在句子中使用詞語的哪個(gè)意思(即,含義)。在步驟502中對(duì)核心術(shù)語消除歧義包括:使核心術(shù)語與參考本體114(參見圖1)匹配,并且將由核心術(shù)語表示的概念的識(shí)別鍵分派給核心術(shù)語,其中識(shí)別鍵與參考本體114(參見圖1)中的概念關(guān)聯(lián)。為了在步驟502中對(duì)核心術(shù)語消除歧義,復(fù)雜三元組變換工具110 (參見圖1)可使用基于軟件的消除歧義工具(例如,SenseRelate算法)定位在WordNet?同匯數(shù)據(jù)庫中找到的核心術(shù)語的定義和識(shí)別鍵,并且向用戶提出這些定義和鍵以用于驗(yàn)證。SenseRelate算法通過使用語義相似性和相關(guān)性的量度來執(zhí)行詞語意思消除歧義。Sen--D-1Tte算法在Duluth的明尼蘇達(dá)大學(xué)開發(fā),并且由位于California的Mountain View ||'、」SourceForge?分銷。SourceForge 是由位于 Virginia, Fairfax 的 Geeknet 公司擁有的注冊(cè)商標(biāo)。WordNet?’詞匯數(shù)據(jù)庫由普林斯頓大學(xué)創(chuàng)建和維護(hù)。WordNet是由位于New Jersey, Princeton的普林斯頓大學(xué)的董事會(huì)擁有的注冊(cè)商標(biāo)。
[0162]在步驟504中,復(fù)雜三元組變換工具110(參見圖1)將每個(gè)形容詞變換為概念(即,概念化的形容詞;也稱為名詞化的形容詞)。在步驟504中變換的每個(gè)形容詞在語法變換后的復(fù)雜三元組中是核心術(shù)語,并且在語法變換后的復(fù)雜三元組中聯(lián)系到核心名詞。步驟504還包括:復(fù)雜三元組變換工具110 (參見圖1)確定和/或創(chuàng)建前述核心名詞和概念化的形容詞之間的標(biāo)準(zhǔn)關(guān)系。
[0163]在步驟506中,復(fù)雜三元組變換工具110 (參見圖1)將每個(gè)動(dòng)詞變換為概念(即,概念化的動(dòng)詞;也稱為名詞化的動(dòng)詞)。在步驟506中變換的每個(gè)動(dòng)詞在語法變換后的復(fù)雜三元組中是核心術(shù)語,并且在語法變換后的復(fù)雜三元組中聯(lián)系到賓語。步驟506還包括:復(fù)雜三元組變換工具110 (參見圖1)確定和/或創(chuàng)建概念化的動(dòng)詞和前述賓語之間的標(biāo)準(zhǔn)關(guān)系。
[0164]在步驟508中,復(fù)雜三元組變換工具110 (參見圖1)將每個(gè)副詞變換為概念(即,概念化的副詞;也稱為名詞化的副詞)。在步驟508中變換的每個(gè)副詞在語法變換后的復(fù)雜三元組中是核心術(shù)語,并且在語法變換后的復(fù)雜三元組中聯(lián)系到核心動(dòng)詞。步驟508還包括:復(fù)雜三元組變換工具110 (參見圖1)確定和/或創(chuàng)建概念化的副詞和概念化的動(dòng)詞之間的標(biāo)準(zhǔn)關(guān)系,其中步驟506將前述核心動(dòng)詞變換為該概念化的動(dòng)詞。
[0165]在步驟510中,通過使非核心術(shù)語變?yōu)樽址⑶沂褂脴?biāo)準(zhǔn)關(guān)系“has_characteristics”將該字符串聯(lián)系到正在通過圖2的處理建立的本體中的概念,復(fù)雜三元組變換工具110 (參見圖1)變換語法變換后的復(fù)雜三元組中的每個(gè)非核心術(shù)語。非核心術(shù)語不與參考本體114(參見圖1)匹配,并且它們?cè)诓襟E510中的變換不需要任何用戶交互。
[0166]圖5的處理結(jié)束于步驟512。重復(fù)圖5的處理以執(zhí)行每個(gè)其它語法變換后的復(fù)雜三元組的語義變換。
[0167]一個(gè)或多個(gè)步驟(未示出)可被添加到圖5的處理以將語法中112 (參見圖1)中的其它類型的術(shù)語變換為概念。
[0168]在一個(gè)實(shí)施例中,至少標(biāo)準(zhǔn)關(guān)系“has_value”、“has_attribute”、“is_attribute”、“has_property”和“is_a”必須被用在步驟504、506和508中的一個(gè)或多個(gè)步驟中,如以下提供的例子中所示。根據(jù)在圖5的處理中概念化的術(shù)語的類型,可能需要另外的標(biāo)準(zhǔn)關(guān)系。
[0169]復(fù)雜三元組變換工具110 (參見圖1)從參考本體114 (參見圖1)或從一組創(chuàng)造的術(shù)語為通過圖5的處理產(chǎn)生的每個(gè)新概念分派唯一識(shí)別鍵。每個(gè)新概念在從圖3中的步驟306獲得的簡(jiǎn)單三元組之一中起到主語、謂語或賓語的作用。
[0170]圖5的處理需要參考本體114的結(jié)構(gòu)的知識(shí),因?yàn)椴襟E504、506和508中的變換需要在參考本體中搜索在語義上聯(lián)系到正在變換的形容詞、動(dòng)詞和副詞的概念。復(fù)雜三元組變換工具I1 (參見圖1)可通過從本體元模式116 (參見圖1)檢索參考本體的元模式來檢索參考本體114(參見圖1)的結(jié)構(gòu)的知識(shí)。
[0171]雖然在圖5中未示出,但一個(gè)或多個(gè)另外的步驟可包括:復(fù)雜三元組變換工具110 (參見圖1)提示用戶驗(yàn)證由步驟504、506和508形成的概念,并且從用戶接收概念的驗(yàn)證。替代地,復(fù)雜三元組變換工具110 (參見圖1)可提示用戶選擇形容詞、動(dòng)詞和副詞所變換為的概念,其中用戶從參考本體114(參見圖1)中的潛在概念中選擇。
[0172]核心形容詞的語義變換的例子
[0173]圖5的語義變換將每個(gè)核心形容詞變換為屬性,其中屬性通過標(biāo)準(zhǔn)關(guān)系“has_attribute”而關(guān)聯(lián)到模式的已有名詞。通過“hasjalue”關(guān)系,核心形容詞本身(即,核心形容詞的語義變換之前的形容詞)變?yōu)閷傩缘闹怠?br>
[0174]用于對(duì)核心形容詞(adjective)進(jìn)行語義變換的一般方式包括:
[0175](terml, predicate, adjective+term2)
[0176]必須變?yōu)?
[0177](terml, predicate, term2)
[0178](term2, has_attribute, adjective_related noun)
[0179]adjective_related noun.has_value =值
[0180]“adjective_related noun”是與和term2關(guān)聯(lián)的形容詞相關(guān)的名詞。以上提供的用于對(duì)核心形容詞進(jìn)行語義變換的一般方式為了說明目的而被簡(jiǎn)化;在標(biāo)題為“語義變換和與參考本體匹配”的章節(jié)中描述的算法中給出確切的方式。
[0181]作為對(duì)核心形容詞進(jìn)行語義變換的一個(gè)例子,考慮WordNet?詞匯數(shù)據(jù)庫是參考本體114 (參見圖1),并且考慮下面的三元組:
[0182](body, is_streamlined_with, low drag)
[0183]語法變換將謂語變換為主動(dòng)形式:
[0184](low drag, streamline, body)
[0185]語法變換在1WordNet?詞匯數(shù)據(jù)庫中識(shí)別出“drag”不是形容詞并且因此確定“l(fā)ow”是形容詞(或者本體建立器106(參見圖1)可直接地詢問最終用戶什么必須被視為形容詞或名詞)。在WordNet?同匯數(shù)據(jù)庫中搜索術(shù)語之后,最終用戶為形容詞“l(fā)ow”選擇下面的定義:
[0186]less than normal in degree or intensity or amount ;〃low prices〃 ;〃thereservoir is low〃.
[0187]語義變換算法檢查形容詞是否與WordNet?同匯數(shù)據(jù)庫中的“屬性”相關(guān)。在形容詞“l(fā)ow”的情況下,該檢查揭示“l(fā)ow”與屬性“degree”相關(guān):
[0188]a posit1n on a scale of intensity or amount or quality ;“a moderategrade of intelligence,,;“a high level of care is required,,;“it is all a matterof degree,,
[0189]如果該形容詞在WordNet?詞匯數(shù)據(jù)庫中沒有屬性,則在WordNet?詞匯數(shù)據(jù)庫中的“派生相關(guān)形式(derivat1nally related form) ”組中搜索其它名詞。在形容詞“ low”的情況下,在“派生相關(guān)形式”組中找到“ lowness”:
[0190]a low or small degree of any quality (amount or force or temperatureetc.) ;“he took advantage of the lowness of interest rates,,.
[0191]如果在WordNet?同匯數(shù)據(jù)庫中不存在“l(fā)ow”的真實(shí)屬性,則“Lowness”能夠被用作“l(fā)ow”的屬性。
[0192]在WordNet?詞匯數(shù)據(jù)庫中不存在用于表示屬性的名詞的情況下,將會(huì)由語義變換算法通過將后綴‘_ness’添加到形容詞來創(chuàng)造名詞。新創(chuàng)造的詞語將不會(huì)在WordNet?同匯數(shù)據(jù)庫中被映射,但它能夠被用在其它模式中,因?yàn)閯?chuàng)造它的原因和方式很好控制。
[0193]返回到例子,初始三元組變?yōu)?
[0194](drag, streamline, body)
[0195](drag, has_attribute, degree)
[0196]degree.has_value =’ low,
[0197]術(shù)語“drag”、“body”和“degree”在1WordNet?詞匯數(shù)據(jù)庫中由鍵唯一地標(biāo)識(shí)。
[0198]在對(duì)核心形容詞進(jìn)行語義變換的第二個(gè)例子中,考慮三元組:
[0199](aerodynamic design, streamlined, body)
[0200]在WordNet?詞匯數(shù)據(jù)庫中發(fā)現(xiàn)“design”不是形容詞之后,語義變換算法將“aerodynamic”視為形容詞:
[0201]aerodynamic:designed or arranged to offer the least resistant to fluidflow
[0202]語義變換算法進(jìn)行搜索以確定形容詞“aerodynamic”是否聯(lián)系到WordNet?詞匯數(shù)據(jù)庫中的屬性。在發(fā)現(xiàn)“aerodynamic”不聯(lián)系到屬性之后,并且在發(fā)現(xiàn)在“aerodynamic”的WN集合(即,關(guān)聯(lián)的WordNet?術(shù)語的集合)中不存在表示名詞的類似WordNet?.術(shù)語之后,語義變換算法創(chuàng)建新術(shù)語“aerodynamic_ness”,該新術(shù)語被用于正在建立的本體并且被存儲(chǔ)在本體元模式116 (參見圖1)中以便未來由隨后建立的其它本體重用。新創(chuàng)建的術(shù)語中的字符“_”很重要,因?yàn)樗试S語義變換算法看到該術(shù)語被創(chuàng)建并且從新創(chuàng)建的術(shù)語追溯以找到初始術(shù)語。
[0203]在WordNet?同匯數(shù)據(jù)庫中搜索“design”的定義之后,語義變換算法選擇下面的定義:
[0204]the act of working out the form of something(as by making a sketch oroutline or plan) ;〃he contributed to the design of a new instrument".
[0205]語義變換算法將初始三元組變換為:
[0206](design, streamlined, body)
[0207](design, has_attribute, aerodynamic_ness)
[0208]aerodynamic_ness.has_value =,high’
[0209]“aerodynamic_ness”的值(即,‘high’ )可由最終用戶應(yīng)語義變換算法的請(qǐng)求而給出。替代地,如果語義變換算法必須提供值,則該值可被設(shè)置為‘yes’,創(chuàng)建的屬性的可能的默認(rèn)值被限制為‘yes’和‘no’。任何其它值也是可以的,但必須由最終用戶提供。
[0210]新術(shù)語“aerodynamic_ness” 可被定義為 “the attribute of beingaerodynamic (作為aerodynamic的屬性)”。新術(shù)語的定義能夠因此被存儲(chǔ)為:
[0211](aerodynamic_ness, is_attribute, aerodynamic)
[0212](design, has_attribute, aerodynamic_ness)
[0213]當(dāng)隨著時(shí)間過去隨后使用該新術(shù)語時(shí),能夠充實(shí)上述定義。
[0214]核心動(dòng)詞的語義變換的例子
[0215]圖5的語義變換通過以下面的方式利用名詞替換每個(gè)核心動(dòng)詞來變換每個(gè)謂語:
[0216](terml, predicate, term2)
[0217]必須變?yōu)?
[0218](terml, predicate, verb_related noun)
[0219](verb_related noun, has_property, term2)
[0220]以上提供的用于在語義上變換核心動(dòng)詞的一般方式為了說明目的而被簡(jiǎn)化;在標(biāo)題為“語義變換和與參考本體匹配”的章節(jié)中描述的算法中給出確切的方式。
[0221]作為例子,考慮下面的三元組:
[0222](car, move, road)
[0223]語義變換算法變換三元組,以使其變?yōu)?
[0224](car, move, movement)
[0225](movement, has_property, road)
[0226]核心副詞的語義變換的例子
[0227]圖5的語義變換處理通過根據(jù)下面的方式利用名詞替換核心動(dòng)詞和核心副詞來變換核心副詞(adverb):
[0228](terml, predicate+adverb, term2)
[0229]必須變?yōu)?
[0230](terml, predicate, verb_related noun)
[0231](verb_related noun, has_property, term2)
[0232](verb_related noun, has_attribute, adverb_related noun)
[0233]adverb_related noun, value =由最終用戶給出的值
[0234]以上提供的用于在語義上變換核心副詞的一般方式為了說明目的而被簡(jiǎn)化;在標(biāo)題為“語義變換和與參考本體匹配”的章節(jié)中描述的算法中給出確切的方式。
[0235]作為例子,考慮下面的三元組中的謂語和副詞:
[0236](car, consumes_with_efficiency, fuel)
[0237]語義變換算法搜索1WordNet?詞匯數(shù)據(jù)庫并且發(fā)現(xiàn)“consume”是動(dòng)詞而不是副詞。在1WordNet?詞匯數(shù)據(jù)庫中的“consume”的可能的定義之中,最終用戶選擇以下提供的一個(gè)定義:
[0238]use up (resources or materials) ;^this car consumes a lot of gas,,;“Weexhausted our savings,,;“They run through 20 bottles each week,,.
[0239]語義變換算法隨后使動(dòng)詞“consume”與WordNet?詞匯數(shù)據(jù)庫中的名詞(即,在以上提供的方式中提及的“verbjelated noun”)關(guān)聯(lián)。語義變換算法搜索在詞匯方面從動(dòng)詞派生的名詞(即,位于“派生相關(guān)形式”組中以及動(dòng)詞“consume”的“See Also (也參見)”術(shù)語中的名詞)。由本體建立器106(參見圖1)要求最終用戶選擇最相關(guān)的術(shù)語。在這個(gè)例子中,最終用戶選擇具有下面的定義的“deplet1n”:
[0240]the act of decreasing something markedly
[0241]語義變換算法隨后將“efficiency”視為副詞,因?yàn)榈谝粋€(gè)詞語“consumes”是動(dòng)詞。替代地,本體建立器106(參見圖1)可詢問最終用戶復(fù)合謂語中的什么術(shù)語必須被視為動(dòng)詞和副詞。
[0242]語義變換算法在1WordNet?詞匯數(shù)據(jù)庫中搜索關(guān)聯(lián)的名詞以找到在以上提供的方式中提及的“adverb_related noun”。
[0243]在WordNet?同匯數(shù)據(jù)庫中作為副詞搜索“efficiency”將會(huì)不成功。語義變換算法因此在1WordNet?詞匯數(shù)據(jù)庫中的名詞之中搜索定義。在這個(gè)例子中,語義變換算法為“efficiency”選擇下面的定義:
[0244]skillfulness in avoiding wasted time and effort ;“she did the work withgreat efficiency,,.
[0245]應(yīng)該汪意的是,如果謂語是“consumes_efficiently”,則語義變換算法將是相同的(即,在WordNet?詞匯數(shù)據(jù)庫中搜索與“efficiently”關(guān)聯(lián)的詞語)并且將會(huì)找到如以上所指示的“efficiency”的相同的定義,但該算法將經(jīng)過形容詞“efficient”。在WordNet?詞匯數(shù)據(jù)庫中,派生出副詞的所有形容詞被包括在副詞的WN集合中,如以下的例子中所指示:
[0246]efficiently, with efficiency ;in an efficient manner ;“he funct1nsefficiently,,
[0247]“efficiently”在它的同源詞集合中具有形容詞“efficient”:
[0248]efficient, being effective without wasting time or effort or expense ;“anefficient product1n manager,,"‘efficient engines save gas,,
[0249]“efficient”具有名詞“efficiency”作為其“派生相關(guān)形式”之一:
[0250]efficiency, skillfulness in avoiding wasted time and effort ;“she did thework with great efficiency,,.
[0251]在語義變換算法識(shí)別“adverb_related noun”之后,本體建立器106 (參見圖1)要求最終用戶為adverb_related noun分配值。
[0252]應(yīng)該注意的是,最終用戶可能對(duì)由語義變換算法提出的任何名詞定義不滿意。在這種情況下,語義變換算法在與名詞相關(guān)的下位詞、上位詞或姐妹術(shù)語的完全列表中提出定義。在這個(gè)例子中,最終用戶對(duì)名詞“d印let1n”不滿意,并且替代地選擇它的下位詞“consumpt1n”, “consumpt1n” 具有下面的定義:
[0253]the act of consuming something
[0254]如果最終用戶未看見任何相關(guān)的定義,則語義變換算法創(chuàng)造用于表示由最終用戶請(qǐng)求的概念的術(shù)語。
[0255]在圖5的處理中的語義變換之后,初始三元組變?yōu)?
[0256](car, consumes, consumpt1n)
[0257](consumpt1n, has_property, fuel)
[0258](consumpt1n, has_attribute, efficiency)
[0259]efficiency.has_value =由最終用戶給出的值,
[0260]術(shù)語“consumpt1n'“consume,,、“efficiency” 中的每一個(gè)在WordNet?詞匯數(shù)據(jù)庫中具有唯一識(shí)別鍵。
[0261]核心介詞的語義變換的例子
[0262]對(duì)于這個(gè)例子,假設(shè)語法112 (參見圖1)區(qū)分介詞與其它術(shù)語以使得能夠變換介詞。當(dāng)與動(dòng)詞相關(guān)時(shí),語義變換算法研究參考本體114(參見圖1)中的副詞。
[0263]作為一個(gè)例子,考慮下面的三元組:
[0264](fish, move through, water)
[0265]當(dāng)被視為副詞時(shí),語義變換算法對(duì)術(shù)語“through”給出下面的定義:
[0266](adv)through (over the whole distance)
[0267]像WordNet?詞匯數(shù)據(jù)庫中的所有其它介詞一樣,以上提供的“through”的定義不與WordNet?詞匯數(shù)據(jù)庫中的任何其它名詞相關(guān)。本體建立器106(參見圖1)提取術(shù)語“distance”以表示概念化的副詞,如以下提供的例子中所示:
[0268](fish, move through, water)
[0269]變換為:
[0270](fish, move, mot1n)
[0271](mot1n, has—property,water)
[0272](mot1n, has—property,distance)
[0273]distance.has_value =,unknown^
[0274]非核心術(shù)語的語義變換的例子
[0275]復(fù)雜三元組包含在圖4A-4F的處理中的語法變換期間識(shí)別的非核心術(shù)語。形容詞、動(dòng)詞或副詞可具有非核心術(shù)語。名詞可具有一個(gè)或多個(gè)從句,其中每個(gè)從句是非核心術(shù)語。
[0276]非核心術(shù)語是名詞的特性。語義變換算法將與形容詞關(guān)聯(lián)的非核心術(shù)語注釋為屬性與之相關(guān)的名詞的特性。作為與屬性關(guān)聯(lián)的特性的例子,考慮下面的例子:
[0277](ecologically aerodynamic design, streamline, body)
[0278]將變?yōu)?br>
[0279](design, streamline, body)
[0280](design, has_attribute,aerodynamic—ness)
[0281]aerodynamic—ness.has_value =,high^
[0282]aerodynamic—ness.has_characteristic =’ ecologically’
[0283]作為變換與名詞關(guān)聯(lián)的從句的例子,考慮下面的例子:
[0284](car with 4 wheels, has_a, consumpt1n)
[0285]變?yōu)?br>
[0286](car, has_a,consumpt1n)
[0287]car.has_characteristic with 4 wheels’
[0288]作為與副詞相關(guān)的非核心術(shù)語的例子,考慮下面的例子:
[0289](car, consume with good efficiency, fuel)
[0290]語義變換算法將非核心術(shù)語“good”注釋為“efficiency”的特性,這被表示為:
[0291]efficiency.has_characteristic =’ good’
[0292]作為與動(dòng)詞相關(guān)的非核心術(shù)語的例子,考慮:
[0293](car, consumes—with—efficiency every week-end, fuel)
[0294]變?yōu)?br>
[0295](car, consumes, consumpt1n)
[0296](consumpt1n, has_property, fuel)
[0297](consumpt1n, has_attribute, efficiency)
[0298]efficiency.has_value =由最終用戶給出的值
[0299]consumpt1n.has_characteristic =,every week-end’
[0300]如以上所示,語義變換算法將非核心術(shù)語變換為名詞的原始特性,并且不分派WordNet?詞匯數(shù)據(jù)庫中的任何定義。
[0301]語義變換算法將特性存儲(chǔ)在本體元模式116(參見圖1)中以由知識(shí)工程師進(jìn)一步分析來識(shí)別能夠在語法112 (參見圖1)的更新版本中描述的復(fù)現(xiàn)的結(jié)構(gòu)。
[0302]例如,語法112 (參見圖1)的另一版本可通過考慮形容詞來處理由多個(gè)術(shù)語構(gòu)成的復(fù)合副詞。在以上提供的例子中,語義變換算法可將“good”視為代表副詞的名詞的形容詞(即,“efficiency”的形容詞)。語義變換算法隨后將形容詞“good”視為屬性“quality”的值,如以下提供的例子中所示:
[0303](efficiency, has_attribute, quality)
[0304]quality.has_value =,good,
[0305]參考本體中的語義對(duì)應(yīng)關(guān)系的例子
[0306]在這個(gè)例子中,考慮參考本體114 (參見圖1)是WordNet?同匯數(shù)據(jù)庫。對(duì)于在變換處理(例如,在圖2、圖3、圖4A-4F、圖5和圖6中描述的處理)中選擇的WordNet?詞匯數(shù)據(jù)庫中的每個(gè)定義和以上提供的變換例子,必須由本體建立器106(參見圖1)順序地執(zhí)行下面的步驟:
[0307]步驟1:如果從WordNet?詞匯數(shù)據(jù)庫選擇的術(shù)語具有許多同義詞,則將WordNet?詞匯數(shù)據(jù)庫中的同義詞集(synset)中的第一個(gè)術(shù)語分派給在三元組中提供的概念。
[0308]例如,術(shù)語“automobile”具有下面的同義詞的有序列表:car、auto、automobile、machine、motorcar:
[0309]car, auto, automobile, machine, motorcar (具有四個(gè)輪子的機(jī)動(dòng)車輛;通常由內(nèi)燃機(jī)推進(jìn))
[0310]在這種情況下,必須使用術(shù)語“car”以替代“automobile”。
[0311]步驟2:在WordNet⑧同匯數(shù)據(jù)庫術(shù)語被分派給概念(或關(guān)系)之后,將該術(shù)語存儲(chǔ)在語義模式(即,正在建立的本體)中作為代表該概念(或關(guān)系)的標(biāo)準(zhǔn)術(shù)語。此外,檢索和存儲(chǔ)所有術(shù)語的關(guān)聯(lián)的WordNet?詞匯數(shù)據(jù)庫術(shù)語(即,同義詞、姐妹術(shù)語等…)作為與概念的對(duì)應(yīng)關(guān)系。這些檢索到的術(shù)語與概念相關(guān),并且可被用作與其它本體方案的匹配術(shù)語。與概念的對(duì)應(yīng)關(guān)系必須與該對(duì)應(yīng)關(guān)系與術(shù)語具有的關(guān)系的類型(例如,同義詞、下位詞等)一起存儲(chǔ)。
[0312]步驟3:在1WordNet?詞匯數(shù)據(jù)庫中,找到下面的對(duì)應(yīng)關(guān)系以便存儲(chǔ):
[0313].對(duì)于動(dòng)詞:相關(guān)的組、方式詞以及伴隨物和上位詞的分級(jí)體系
[0314]?對(duì)于名詞:同義詞(即,來自WordNet?詞匯數(shù)據(jù)庫中的同義詞集的術(shù)語)、整體詞(holonym)和部分詞(meronym)的相關(guān)分級(jí)體系以及它們的類型(即,部分、實(shí)質(zhì)或成員)、下位詞的分級(jí)體系和上位詞的分級(jí)體系
[0315].如果從形容詞建立名詞,則該名詞還被分派該名詞是否是屬性的指示、代表從其建立該名詞的形容詞的原始術(shù)語和所有可能的衛(wèi)星形容詞
[0316].如果從副詞建立名詞,則該名詞還被分派代表從其建立該名詞的副詞或形容詞的原始術(shù)語和所有可能的衛(wèi)星形容詞
[0317].如果創(chuàng)建術(shù)語,則利用與用于創(chuàng)建該創(chuàng)建的術(shù)語的根術(shù)語關(guān)聯(lián)的1WordNet?詞匯數(shù)據(jù)庫術(shù)語對(duì)該創(chuàng)建的術(shù)語進(jìn)行注釋
[0318].對(duì)于概念:派生相關(guān)形式、姐妹術(shù)語、上位詞、下位詞、整體詞、部分詞
[0319]例如,與WordNet?詞匯數(shù)據(jù)庫定義201689899關(guān)聯(lián)的謂語“streamlined”將對(duì)應(yīng)于 “contour” (作為直接上位詞)、“outline”、“draw”、“interpret,,、“re-create”、“make”(作為不同級(jí)別的上位詞)和“streamliner”(作為派生相關(guān)形式)?!皊treamlined”的ill述對(duì)應(yīng)關(guān)系被表不為:
[0320](streamline, has_hypernym_l, contour)
[0321](streamline, has_hypernym_2, outline)
[0322]…
[0323](streamline, has_derivat1n, streamliner)
[0324]步驟4:如果創(chuàng)建術(shù)語(例如“aerodynamic_ness”),則創(chuàng)建的術(shù)語必須與從其創(chuàng)建該創(chuàng)建的術(shù)語的根術(shù)語相關(guān)(例如,經(jīng)“標(biāo)準(zhǔn)關(guān)系” is_attribute),并且與和該根術(shù)語關(guān)聯(lián)的WordNet?詞匯數(shù)據(jù)庫中的術(shù)語相關(guān)。在以上提供的創(chuàng)建“aerodynamic_ness”的例子中,根術(shù)語是形容詞“aerodynamic”。創(chuàng)建的術(shù)語aerodynamic_ness的前述關(guān)系被表示為:
[0325](aerodynamic_ness, is_attribute, aerodynamic)
[0326](aerodynamic, is_similar, smooth)
[0327](aerodynamic, has_similar = rough)
[0328]參考本體定義的語義分析的例子
[0329]除了術(shù)語的定義之外,參考本體114 (參見圖1)還能夠被用于它在每個(gè)定義中提伊.的語義。在1WordNet?詞匯數(shù)據(jù)庫的情況下,定義較短并且僅包括一些能夠聯(lián)系到WordNet?詞匯數(shù)據(jù)庫中的其它定義的概念。
[0330]有益地,在執(zhí)行語義匹配之后(即,在識(shí)別定義之后),提取用在本體模式中的每個(gè)1WordNet?詞匯數(shù)據(jù)庫定義的語義模式。這些語義模式引入可能被用于確定本體之間的關(guān)聯(lián)的新的相關(guān)概念和關(guān)系。術(shù)語定義的語義模式的創(chuàng)建能夠由已有的文本分析器完成,但必須考慮在定義中給出的術(shù)語和它們與其它相關(guān)術(shù)語(即,通過同義詞、上位詞等相關(guān)的術(shù)語)的相似性。
[0331]例如,具有定義“thephenomenon of resistance to mot1n through a fluid”并且具有“resistance”作為一個(gè)上位詞的術(shù)語“drag”可被模式化為:
[0332](drag, is_a, phenomenon)
[0333](phenomenon, resist, fluid)
[0334](mot1n, has_property, fluid)
[0335]以上提供的用于參考本體定義的語義分析的例子為了說明目的而被簡(jiǎn)化;確切的變換必須符合在標(biāo)題為“語義變換和與參考本體匹配”的章節(jié)中描述的算法,這將提供下面的結(jié)果:
[0336](drag, is_a, drag-phenomenon)
[0337](drag-phenomenon, is_a, phenomenon)
[0338](drag-phenomenon, resist, fluid+mot1n)
[0339](fluid+mot1n, is_a, mot1n)
[0340](fluid+mot1n, has_property, fIuid+mot1n-fluid)
[0341](fIuid+mot1n-fluid, is_a, fluid)
[0342]f Iui d+mot 1n-fluid, value = unknown (未知)
[0343]fluid, value = unknown
[0344]WordNet?詞匯數(shù)據(jù)庫定義的語義分析涉及概念以及關(guān)系。對(duì)于由定義語義在模式中引入的每個(gè)新概念或關(guān)系,必須由本體建立器106(參見圖1)執(zhí)行匹配步驟(即,語法和語義變換)。
[0345]更一般地,每個(gè)WordNet?詞匯數(shù)據(jù)庫定義的語義模式的創(chuàng)建通常有助于這里描述的本發(fā)明的系統(tǒng)并且有助于語義網(wǎng)絡(luò)(Semantic Web)。本體建立器106(參見圖1)可自動(dòng)地產(chǎn)生前述語義模式,這些語義模式可在變?yōu)樾g(shù)語的正式語義模式之前被驗(yàn)證。
[0346]在針對(duì)特定本體將\VordNet?同匯數(shù)據(jù)庫中的定義模式化之后,本體建立器106 (參見圖1)將定義的模式存儲(chǔ)在本體元模式116 (參見圖1)中以便未來可能在其它本體中重用。
[0347]語義變換和與參考本體匹配
[0348]在語義變換(參見圖3中的步驟306并且參見圖5)中,本體建立器106 (參見圖1)根據(jù)標(biāo)準(zhǔn)方式變換每個(gè)三元組,并且使每個(gè)三元組與WordNet⑧詞匯數(shù)據(jù)庫匹配,如這個(gè)章節(jié)中所述。
[0349]直接匹配代表名詞或動(dòng)詞的核心術(shù)語:代表名詞或動(dòng)詞的核心術(shù)語直接(即,在沒有變換的情況下)與1WordNet?詞匯數(shù)據(jù)庫匹配。在一個(gè)實(shí)施例中,由本體建立器106 (參見圖1)提示最終用戶從由本體建立器106 (參見圖1)提出的一組定義之中選擇正確的1WordNet?詞匯數(shù)據(jù)庫定義。最終用戶和本體建立器106(參見圖1)之間的交互水平可取決于參數(shù)“automat1n level (自動(dòng)化水平)”的值。
[0350]當(dāng)最終用戶對(duì)任何提出的名詞或動(dòng)詞定義不滿意時(shí),語義變換算法在與名詞相關(guān)的下位詞、上位詞或姐妹術(shù)語的完全列表中提出定義,或者在與動(dòng)詞相關(guān)的伴隨物、方式詞、上位詞和組的完全列表中提出定義。
[0351]雖然不太可能,但在不能在WordNet?詞匯數(shù)據(jù)庫中找到相關(guān)定義的情況下,本體建立器106 (參見圖1)保存術(shù)語并且將其視為“創(chuàng)造的術(shù)語”,該創(chuàng)造的術(shù)語具有它自己的鍵。
[0352]變換謂語的核心術(shù)語:根據(jù)下面的方式變換謂語的核心術(shù)語:
[0353]<subject_term, predicate_term, object_term>
[0354]變?yōu)橄旅娴慕M:
[0355]〈sub ject—term,predicate—term,sub ject—term-nounified—predicate〉
[0356]〈subject—term—nounified—predicate,is—a,nounified—predicate〉
[0357]〈subject—term-nounified—predicate,has—property,object—term>
[0358]以上提供的用于變換謂語的核心術(shù)語的方式的一個(gè)例子是下面的例子:
[0359]〈car,move, road〉
[0360]變?yōu)?
[0361]〈car,move, car_movement>
[0362]〈car—movement,is_a,movement)
[0363]〈car—movement,has—property,road>
[0364]變換副詞的核心術(shù)語:根據(jù)下面的方式變換副詞的核心術(shù)語:
[0365]〈subject—term,predicate—term adverb—term,object—term>
[0366]變?yōu)橄旅娴慕M:
[0367]〈subject_term,predicate_term,subject_term+object_term_nounified_predicate)
[0368]〈subject—term+object—term—nounified—predicate,is—a,nounified—predicate〉
[0369]〈subject_term+object_term_nounified_predicate,has_property, object_term>
[0370]如果副詞聯(lián)系到具有屬性的形容詞,則根據(jù)下面的方式變換副詞:
[0371]<subject_term+object_term-nounified_predicate-nounified_adverb, is_a,nounified—adverb>
[0372]〈subject_term+object_term_nounified—predicate,has_attribute,subject_term+ob ject—term—nounified—predi cat e_nounified—adverb>
[0373]sub ject_term+ob ject_term-nounified_predicate-nounified_adverb.has_value=linked adjective (聯(lián)系的形容詞)
[0374]如果副詞實(shí)際上是名詞,則必須表示由名詞表示的概念,并且以上針對(duì)聯(lián)系到具有屬性的形容詞的副詞提供的方式的分派必須在副詞的變換中變?yōu)槿M,如下面的方式所示:
[0375]<subject_term+object_term-nounified_predicate-nounified_adverb,has_value, linked adjective)
[0376]如果副詞未聯(lián)系到屬性,則副詞的變換遵循以下提供的方式:
[0377]<subject_term+object_term-nounified_predicate-nounified_adverb, is_a,nounified—adverb>
[0378]〈subject_term+object_term_nounified_predicate,has_property, subject_term+ob ject—term—nounified—predi cat e_nounified—adverb>
[0379]sub ject—term+ob ject—term—nounified—predicate—nounified—adverb, value =默認(rèn)值或由最終用戶提供的值
[0380]由本體建立器106 (參見圖1)分派給“nounified—adverb”的默認(rèn)值是:
[0381],yes”,如果在初始三元組中代表副詞(即,具有副詞的作用)的術(shù)語真的是副詞(即,被映射到WordNet?同匯數(shù)據(jù)庫中的副詞)的話
[0382]Zunknown'如果在初始三元組中代表副詞(即,具有副詞的作用)的術(shù)語是名詞(即,被映射到WordNet?詞匯數(shù)據(jù)庫中的名詞而非副詞)的話
[0383]以下提供的例子示出副詞未聯(lián)系到具有屬性的形容詞的情況:
[0384](fish, swim efficiently, water)
[0385]變?yōu)?br>
[0386](fish, swim, fish+water-swimming),
[0387](fish+water-swimming, is_a,swimming),
[0388](fish+water-swimming, has—property,water),
[0389](fish+water-swimming, has—attribute,fish+water-swimming-efficiency),
[0390]fish+water-swimming-efficiency.has_value = ‘yes’
[0391]以下提供的例子示出副詞聯(lián)系到具有屬性的形容詞的情況:
[0392](fish, swim heavily, mud)
[0393]變?yōu)?br>
[0394](fish, swim, fish+swim+mud),
[0395](fish+swim+mud, is—a,swim),
[0396](fish+swim+mud, has—attribute,mud),
[0397](fish+swim+mud, has_attribute,weight),
[0398]fish+swim+mud.weight.has_value = ‘heavy’
[0399]根據(jù)下面的方式變換形容詞的核心術(shù)語:
[0400]〈adjective—term subject—term,predicate—term,object—term>
[0401]變?yōu)橄旅娴慕M:
[0402]〈adjective—term+subject—term,predicate—term,object—term>
[0403]<adjective_term+subject_term, is_a,subject_term>
[0404]如果形容詞具有屬性,則名詞化的形容詞是屬性,并且形容詞的變換遵循以下提供的方式:
[0405]<adjective_term+subject_term, has_attribute,adjective_term+subject_term-nounified—adjective〉
[0406]<adjective_term+subject_term-nounified_adjective, is_a,nounified_adjective)
[0407]adjective_term+subject_term-nounified—adjective.has_value = adjective
[0408]如果形容詞實(shí)際上是名詞,則必須表示由名詞表示的概念,并且以上針對(duì)具有屬性的形容詞提供的方式的分派必須在形容詞的變換中變?yōu)槿M,如下面的方式所示:
[0409]〈adjective_term+subject_term_nounified—adjective,has_value, adjective〉
[0410]如果形容詞沒有屬性,則變換遵循以下提供的方式:
[0411]<adjective_term+subject_term,has_property,adjective_term+subject_term-nounified—adjective〉
[0412]<adjective_term+subject_term-nounified_adjective, is_a,nounified_adjective)
[0413]adjective_term+subject_term_nounified—adjective.has_value =默認(rèn)值或由最終用戶提供的值
[0414]由本體建立器106 (參見圖1)分派給“nounified—adjective”的默認(rèn)值是:
[0415],yes”,如果在初始三元組中代表形容詞(S卩,具有形容詞的作用)的術(shù)語真的是形容詞(即,被映射到WordNet?詞匯數(shù)據(jù)庫中的形容詞)的話
[0416],Unknown'如果在初始三元組中代表形容詞(即,具有形容詞的作用)的術(shù)語是名詞(B卩,被映射到1WordNet?同匯數(shù)據(jù)庫中的名詞而非形容詞)的話
[0417]以下提供的例子示出形容詞具有屬性的情況:
[0418]〈red car, has, high performance)
[0419]變?yōu)?
[0420]<red+car, is—a,car〉
[0421 ]〈red+car,has—attribute,red+car_hue>
[0422]red+car-hue.has—value = red
[0423]<red+car-hue, is—a,hue〉
[0424]〈red+car,has,high performance)
[0425]并且最后的三元組變?yōu)?
[0426]〈red+car,has, high+performance>
[0427]〈high+performance,is—a,performance)
[0428]〈high+performance,has—attribute,high+performance_degree>
[0429]high+performance-degree.value = high
[0430]〈high+performance-degree,is—a,degree>
[0431]在一個(gè)實(shí)施例中,非核心術(shù)語被注釋為它們與之相關(guān)的核心術(shù)語的“特性”。以下提供非核心術(shù)語的三種變換方式:
[0432]1.〈subject—term,predicate—term,object—term non—core—terms>
[0433]變?yōu)橄旅娴慕M:
[0434]〈subject—term,predicate—term,subject—term-object—term>
[0435]〈subject—term-object—term,is—a,object—term>
[0436]subject—term-object—term, characteristic = non—core—terms
[0437]2.〈subject—term non—core—terms,predicate—term,object—term>
[0438]變?yōu)橄旅娴慕M:
[0439]〈object—term-subject—term,predicate—term,object—term>
[0440]〈object—term-subject—term,is—a,subject—term>
[0441]object—term-subject—term, characteristic = non—core—terms
[0442]3.〈subject—term,predicate—term non—core—terms,object—term>
[0443]變?yōu)橄旅娴慕M:
[0444]〈subject_term,predicate_term,subject_term+object_term_nounified_predicate)
[0445]〈sub ject—term+ob ject—term—nounified—predicate,is—a,nounified—predicate〉
[0446]〈subject_term+object_term_nounified_predicate,has_attribute,object_term>
[0447]subject_term+object_term-nounified_predicate.characteristic = non_core—terms
[0448]以下提供的三個(gè)例子示出根據(jù)以上提供的變換方式的非核心術(shù)語的變換:
[0449]1.〈car, run, road with asphalt〉
[0450]變換為:
[0451]〈car, run, car-road>
[0452]<car-road, is_a, road>
[0453]car-road.has_characteristic = ‘with asphalt’
[0454]2.<car with 4 wheels, run, road>
[0455]變換為:
[0456]<road-car, run, road〉
[0457]<road-car, is_a, car>
[0458]road-car.has_characteristic = ‘with 4 wheels’
[0459]3.〈car, run every week-end, road>
[0460]變換為:
[0461]〈car, run, car+road_running>
[0462]〈car+road-running, is_a, running)
[0463]〈car+road-running, has_attribute, road>
[0464]car+road-running.has_characteristic = ‘every week-end,
[0465]在一個(gè)實(shí)施例中,本體建立器106(參見圖1)執(zhí)行下面的步驟以使謂語名詞化(即,概念化):
[0466]1.本體建立器106 (參見圖1)向最終用戶提供在詞匯方面與“predicate_term”匹配的WordNet?詞匯數(shù)據(jù)庫中的動(dòng)詞的列表,并且提示最終用戶從WordNet?詞匯數(shù)據(jù)庫選擇提供給最終用戶的列表上的動(dòng)詞之一的定義。
[0467]2.本體建立器106 (參見圖1)向最終用戶提供與在步驟I中選擇其定義的動(dòng)詞關(guān)聯(lián)的“派生相關(guān)形式”組中的1WordNet?詞匯數(shù)據(jù)庫中的名詞的列表,并且提示最終用戶選擇提供給最終用戶的名詞的列表中的名詞之一。
[0468]3.本體建立器106(參見圖1)使用選擇的名詞作為nounified_predicate。
[0469]4.如果最終用戶未在名詞的列表中找到與最終用戶期望的含義匹配的任何名詞,則本體建立器106(參見圖1)確定被包括在^WordNet?同匯數(shù)據(jù)庫中并且與在步驟2中提供的名詞關(guān)聯(lián)的上位詞和下位詞。本體建立器106(參見圖1)隨后將上位詞和下位詞的列表提供給最終用戶。
[0470]5.如果最終用戶基于在步驟4中提供的上位詞和下位詞的列表仍然不能選擇名詞,貝1J本體建立器106 (參見圖1)創(chuàng)造名詞以代表nounified_predicate,并且將創(chuàng)造的名詞以及包括創(chuàng)造的名詞的三元組存儲(chǔ)在本體元模式中116 (參見圖1)中以便未來在建立其它本體模式時(shí)參考。
[0471]6.如果在步驟5中創(chuàng)造nounified_predicate,則從謂語和后綴“_ness”創(chuàng)建nounified—predicate。
[0472]在一個(gè)實(shí)施例中,本體建立器106(參見圖1)執(zhí)行下面的步驟以使副詞名詞化:
[0473]1.本體建立器106 (參見圖1)向最終用戶提供在詞匯方面與“adverb_term”匹配的WordNet?詞匯數(shù)據(jù)庫中的副詞的列表,并且提示最終用戶從WordNet?詞匯數(shù)據(jù)庫選擇提供給最終用戶的副詞的列表中的副詞之一的定義。
[0474]如果本體建立器106 (參見圖1)在^ΟΓ?ΙΝε--詞匯數(shù)據(jù)庫中未找到任何匹配的副詞,則本體建立器搜索并且找到在詞匯方面與“adverb_term”匹配的一組名詞,并且提示最終用戶從該組找到的名詞選擇一個(gè)名詞。例如,如果最終用戶已決定“with efficiency”代表三元組〈fish, swim with efficiency, water〉中的副詞,貝U可能出現(xiàn)未找到匹配的副詞的情況。
[0475]如果最終用戶在由本體建立器106(參見圖1)找到的一組名詞中選擇名詞,則在建議上層合并本體(Suggested Upper Merged Ontology, SUMO)中檢查選擇的名詞以查看選擇的名詞是否與SUMO屬性相關(guān)。SUMO是由位于California的San Francisco的Articulate Software?維護(hù)的上層本體。如果選擇的名詞不與SUMO屬性相關(guān),則該名詞被視為名詞化的副詞。如果選擇的名詞與SUMO屬性相關(guān),并且如果該屬性被最終用戶接受,則該SUMO屬性被視為名詞化的副詞,并且SUMO屬性必須與和WordNet?詞匯數(shù)據(jù)庫定義關(guān)聯(lián)的識(shí)別鍵匹配。如果副詞不能在用于使副詞名詞化的步驟中的步驟I中被名詞化,則必須應(yīng)用隨后的步驟(即,以下提供的步驟2至10)。
[0476]2.本體建立器106 (參見圖1)向最終用戶提供與選擇的副詞關(guān)聯(lián)的“同源詞”組中的WordNet?同匯數(shù)據(jù)庫中的形容詞的列表,并且提示最終用戶從提供給最終用戶的形容詞的列表選擇一個(gè)形容詞。
[0477]3.本體建立器106(參見圖1)向最終用戶提供與選擇的形容詞相關(guān)或者與和選擇的形容詞具有“類似于”關(guān)系的一組術(shù)語中的每個(gè)形容詞相關(guān)的來自WordNet?詞匯數(shù)據(jù)庫的屬性的列表。本體建立器106(參見圖1)還提示最終用戶從提供給最終用戶的屬性的列表選擇屬性。
[0478]4.如果在WordNet?詞匯數(shù)據(jù)庫中未找到屬性,則本體建立器106(參見圖1)搜索WordNet?詞匯數(shù)據(jù)庫以確定選擇的形容詞或“類似于”形容詞(即,通過“類似于”關(guān)系與選擇的形容詞相關(guān)的形容詞)是否與SUMO屬性類型相關(guān)。本體建立器106 (參見圖1)向最終用戶提供可能的SUMO屬性并且提示最終用戶選擇提供的SUMO屬性之一。如果最終用戶選擇了 SUMO屬性,則它必須與WordNet?同匯數(shù)據(jù)庫中的定義的識(shí)別鍵匹配。
[0479]5.如果最終用戶選擇了屬性,則本體建立器106 (參見圖1)將選擇的屬性指定為nounified—adverb ο
[0480]6.如果最終用戶未選擇屬性,則本體建立器106 (參見圖1)向最終用戶提供本體建立器在1WordNet?詞匯數(shù)據(jù)庫的“派生相關(guān)形式”組中找到的1WordNet?詞匯數(shù)據(jù)庫中的名詞的列表,其中“派生相關(guān)形式”組與選擇的形容詞關(guān)聯(lián)或與選擇的形容詞的“類似于”形容詞關(guān)聯(lián)。本體建立器106(參見圖1)隨后提示最終用戶選擇提供給最終用戶的列表中的名詞之一。
[0481]7.如果最終用戶未找到與最終用戶期望的含義匹配的任何名詞,則本體建立器106(參見圖1)向最終用戶提供本體建立器在1WordNet?同匯數(shù)據(jù)庫中找到的上位詞和下位詞的列表,其中上位詞和下位詞與在步驟6中找到的每個(gè)名詞關(guān)聯(lián)。
[0482]8.如果最終用戶已選擇名詞,則本體建立器106 (參見圖1)指定選擇的名詞代表nounified—adverb ο
[0483]9.如果最終用戶未能選擇名詞,則本體建立器106(參見圖1)創(chuàng)造名詞以代表noun if i e d_adverb ,并且將創(chuàng)造的名詞以及包括創(chuàng)造的名詞的三元組存儲(chǔ)在本體元模式116 (參見圖1)中以便未來在建立其它本體模式時(shí)參考。
[0484]10.如果本體建立器106 (參見圖1)創(chuàng)造nounified_adverb,則本體建立器從副詞和后綴 “_ness” 創(chuàng)建 nounified_adverb。
[0485]在一個(gè)實(shí)施例中,本體建立器106(參見圖1)執(zhí)行下面的步驟以使形容詞名詞化:
[0486]1.本體建立器106(參見圖1)向最終用戶提供在詞匯方面與“adjective—term” (即,正在被名詞化的形容詞)匹配的詞匯數(shù)據(jù)庫中的形容詞的列表,并且提示最終用戶選擇提供給最終用戶的列表中的形容詞之一的定義。
[0487]在本體建立器106(參見圖1)在1WordNet?詞匯數(shù)據(jù)庫中未找到與“adjective_term”匹配的形容詞的情況下,本體建立器106(參見圖1)在WordNet?詞匯數(shù)據(jù)庫中搜索并且找到在詞匯方面與“adjectivejerm”匹配的一組名詞并且提示最終用戶從被發(fā)現(xiàn)與“adjectivejerm”匹配的名詞選擇一個(gè)名詞。如果最終用戶在由本體建立器106 (參見圖1)找到的一組名詞中選擇名詞,則本體建立器106 (參見圖1)在SUMO中檢查選擇的名詞以確定選擇的名詞是否與SUMO屬性相關(guān)。如果選擇的名詞不與SUMO屬性相關(guān),則本體建立器106 (參見圖1)將選擇的名詞指定為名詞化的形容詞。如果選擇的名詞與SUMO屬性相關(guān),并且如果該屬性被最終用戶接受,則本體建立器106 (參見圖1)將SUMO屬性指定為名詞化的形容詞,并且SUMO屬性必須與1WordNet?同匯數(shù)據(jù)庫中的定義的識(shí)別鍵匹配。
[0488]如果形容詞未在用于使形容詞名詞化的步驟集中的步驟I中被名詞化,則本體建立器106(參見圖1)必須執(zhí)行隨后的步驟(即,以下提供的步驟2至8)。
[0489]2.本體建立器106(參見圖1)向最終用戶提供與選擇的形容詞相關(guān)或者與和選擇的形容詞具有“類似于”關(guān)系的形容詞相關(guān)的來自1WordNet?詞匯數(shù)據(jù)庫的屬性的列表。本體建立器106(參見圖1)還提示最終用戶從提供給最終用戶的屬性的列表選擇屬性。
[0490]3.如果最終用戶已選擇屬性,則本體建立器106 (參見圖1)將選擇的屬性指定為nounified—adjective。
[0491]4.如果最終用戶未選擇屬性,則本體建立器106 (參見圖1)向最終用戶提供本體建立器在1WordNet?詞匯數(shù)據(jù)庫的“派生相關(guān)形式”組中找到的WordNet?詞匯數(shù)據(jù)庫中的名詞的列表,其中“派生相關(guān)形式”組與選擇的形容詞關(guān)聯(lián)或與選擇的形容詞的“類似于”形容詞關(guān)聯(lián)。本體建立器106(參見圖1)隨后提示最終用戶選擇提供給最終用戶的名詞的列表中的名詞之一,并且被要求從提供給最終用戶的名詞的列表選擇一個(gè)名詞。
[0492]5.如果最終用戶已選擇名詞,則本體建立器106 (參見圖1)將選擇的名詞指定為nounified—adjective。
[0493]6.如果最終用戶未找到與最終用戶期望的含義匹配的任何名詞,則本體建立器106(參見圖1)向最終用戶提供本體建立器在1WordNet?同匯數(shù)據(jù)庫中找到的上位詞和下位詞的列表,其中上位詞和下位詞與在步驟4中找到的每個(gè)名詞關(guān)聯(lián)。
[0494]7.如果最終用戶仍然不能選擇名詞,則本體建立器106(參見圖1)創(chuàng)造名詞以代表nounified_adjective,并且將創(chuàng)造的名詞以及包括創(chuàng)造的名詞的三元組存儲(chǔ)在本體元模式116(參見圖1)中以便未來在建立其它本體模式時(shí)參考。
[0495]8.如果本體建立器106 (參見圖1)創(chuàng)造nounified_adjective,則本體建立器從形容詞和后綴 “_ness” 創(chuàng)建 nounified_adjective。
[0496]如果語法112(參見圖1)使得它辨別待處理的介詞,則這些介詞不能在WordNet?詞匯數(shù)據(jù)庫中匹配,因?yàn)?WordNet?詞匯數(shù)據(jù)庫沒有針對(duì)介詞的定義。因此,本體建立器106(參見圖1)在介詞與主語或賓語關(guān)聯(lián)時(shí)將介詞視為形容詞,并且在介詞與謂語關(guān)聯(lián)時(shí)將介詞視為副詞。
[0497]在詞匯方面等同于介詞的前述副詞和形容詞(即,小的副詞和小的形容詞)通常不聯(lián)系到1WordNet?詞匯數(shù)據(jù)庫中的其它術(shù)語。另一方面,這些小的副詞和形容詞在WordNet?詞匯數(shù)據(jù)庫中的定義非常短。在小的副詞或小的形容詞的情況下,本體建立器106(參見圖1)從WordNet?同匯數(shù)據(jù)庫中的定義提取和選擇主要名詞以代表小的副詞或小的形容詞。用于代表小的副詞或小的形容詞的主要名詞的選擇可使用與最終用戶的交互。
[0498]例如,考慮介詞“through”,其中“through”在三兀組〈fish, swim_through, water〉中被視為副詞并且在三元組〈fish, swim, through water〉中被視為形容詞。
[0499]當(dāng)“through”被視為副詞時(shí),下面的定義適用:
[0500](adv)through (over the whole distance)"this bus goes through to NewYork"
[0501]作為副詞的“through”的上述定義不與WordNet?同匯數(shù)據(jù)庫中的任何其它術(shù)語相關(guān)。本體建立器106(參見圖1)提取術(shù)語“distance”以代表名詞化的副詞:
[0502]〈fish, move_through, water>
[0503]變換為:
[0504]〈fish, move, fish+water-mot1n>
[0505]<fish+water-mot1n, is_a, mot1n〉
[0506]〈fish+water—mot1n, has_property, water>
[0507]〈fish+water—mot1n, has_property, fish+water—mot1n_distance>
[0508]fish+water-mot1n-di stance, value = unknown
[0509]<fish+water-mot1n-distance, is_a, distance)
[0510]應(yīng)該注意的是,在以上解釋中,為了清楚和性能原因,本體建立器106(參見圖1)在使副詞名詞化并且變換副詞之前使所有形容詞名詞化并且變換所述形容詞。
[0511]在副詞的名詞化期間,本體建立器106(參見圖1)使與副詞關(guān)聯(lián)的動(dòng)詞名詞化。在所需的所有動(dòng)詞的名詞化完成之后,本體建立器106(參見圖1)需要檢查(I)與名詞化的動(dòng)詞相同的謂語(即,“predicatel”)和(2)與名詞化的動(dòng)詞的主語相同的主語(即,“subjectl”)是否被用在一個(gè)或多個(gè)其它三元組中。如果該檢查確定在一個(gè)或多個(gè)其它三元組中使用了 predicatel和subjectl,則本體建立器106 (參見圖1)去除predicatel在它的主語和賓語之間代表的關(guān)系并且由名詞化的動(dòng)詞和predicatel的賓語之間的“has_property”關(guān)系替換去除的關(guān)系。例如,考慮三元組(fish, swims, swimming),其中“swimming”是名詞化的動(dòng)詞,并且另外考慮三元組(fish, swims, length),三元組(fish, swims, length)是包括謂語“swim”和主語“fish”的另一三元組。后一個(gè)三元組必須被去除并且變換為:(swimming, has_property, length)。
[0512]要注意,以下提供的例子引入代表語義約束所需的術(shù)語。
[0513]例如,考慮下面的三元組:
[0514]<car, move, car-movement>
[0515]〈car-movement, is_a, movement)
[0516]〈car-movement, has_property, road>
[0517]以上提供的例子中的三元組示出:僅當(dāng)movement (移動(dòng))是car (車)的移動(dòng)時(shí),“road(路)”才是movement的性質(zhì)。這些關(guān)系能夠被簡(jiǎn)化以便呈現(xiàn)并且由最終用戶處理。上述三元組可被簡(jiǎn)化為:
[0518]〈car, move, movement)
[0519]<-movement, has_property, road>
[0520]充實(shí)變換
[0521]圖6是根據(jù)本發(fā)明的實(shí)施例的圖3的處理中所包括的簡(jiǎn)化的三元組的充實(shí)變換的處理的流程圖。在一個(gè)實(shí)施例中,圖6的處理被包括在步驟308 (參見圖3)中。圖6的處理開始于步驟600。在步驟602中,復(fù)雜三元組變換工具110 (參見圖1)充實(shí)從圖5的處理中或步驟306 (參見圖3)中的語義變換獲得的簡(jiǎn)化的三元組(以下,簡(jiǎn)稱為“簡(jiǎn)化的三元組”)中的每個(gè)核心術(shù)語。由復(fù)雜三元組變換工具110(參見圖1)在步驟602中執(zhí)行的充實(shí)包括:將描述核心術(shù)語的分類關(guān)系的簡(jiǎn)單三元組添加到在參考本體114(參見圖1)中找到的新概念,由此指定核心術(shù)語和參考本體114(參見圖1)中的所有核心術(shù)語的語義對(duì)應(yīng)關(guān)系之間的關(guān)系。僅當(dāng)還未在正在通過圖2的處理建立的本體中表示前述分類關(guān)系時(shí),添加描述前述分類關(guān)系的簡(jiǎn)單三元組。因?yàn)槌鋵?shí)變換是迭代處理(參見圖3中的循環(huán))的一部分,所以一個(gè)或多個(gè)關(guān)系可能已經(jīng)存在于正在建立的本體中,并且因此不需要由在步驟602的當(dāng)前執(zhí)行中添加的簡(jiǎn)化的三元組描述。
[0522]步驟602需要復(fù)雜三元組變換工具110 (參見圖1)訪問本體元模式116以確定對(duì)于核心術(shù)語而言可存在什么關(guān)系,但不需要最終用戶交互。
[0523]在步驟604中,通過從參考本體114(參見圖1)獲得核心術(shù)語的定義,分析獲得的定義并且基于獲得的定義創(chuàng)建一組新的復(fù)雜三元組,復(fù)雜三元組變換工具110(參見圖1)充實(shí)簡(jiǎn)化的三元組中的每個(gè)核心術(shù)語。前述分析獲得的定義的步驟可由位于本體建立器106(參見圖1)外部或內(nèi)置在本體建立器106中的文本分析器執(zhí)行。
[0524]在步驟606中,復(fù)雜三元組變換工具110 (參見圖1)將新的簡(jiǎn)化的三元組和在步驟604中創(chuàng)建的所述一組新的復(fù)雜三元組存儲(chǔ)在本體元模式116中。通過存儲(chǔ)新的簡(jiǎn)化的三元組,存儲(chǔ)代表獲得的定義的語義模式,以使得在圖2的本體建立處理的未來執(zhí)行中可以重用這些語義模式中的一個(gè)或多個(gè)。
[0525]在步驟608中,復(fù)雜三元組變換工具110 (參見圖1)更新分析深度參數(shù)(例如,將分析深度參數(shù)減小一)。
[0526]圖6的處理結(jié)束于步驟610。
[0527]合并本體
[0528]圖7是根據(jù)本發(fā)明的實(shí)施例的合并通過圖2的處理建立的本體的處理的流程圖。圖7的處理開始于步驟700。在步驟702中,在第一計(jì)算機(jī)系統(tǒng)中運(yùn)行的本體建立器106 (參見圖1)通過圖2的處理的第一次執(zhí)行來建立第一本體。在第二計(jì)算機(jī)系統(tǒng)中運(yùn)行的本體建立器106(參見圖1)通過圖2的處理的第二次執(zhí)行來建立第二本體。在一個(gè)實(shí)施例中,第一和第二計(jì)算機(jī)系統(tǒng)是不同的(例如,圖1中的計(jì)算機(jī)系統(tǒng)102-1和102-N)并且經(jīng)由網(wǎng)絡(luò)103(參見圖1)協(xié)作。在另一實(shí)施例中,第一和第二計(jì)算機(jī)系統(tǒng)是同一計(jì)算機(jī)系統(tǒng)(例如,圖1中的計(jì)算機(jī)系統(tǒng)102-1)。
[0529]在步驟704中,在第一計(jì)算機(jī)系統(tǒng)中運(yùn)行的本體建立器106(參見圖1)通過識(shí)別參考本體114(參見圖1)中的識(shí)別鍵之間的對(duì)應(yīng)關(guān)系來識(shí)別第一本體中的第一概念和第二本體中的第二概念之間的對(duì)應(yīng)關(guān)系,其中識(shí)別鍵與第一和第二概念關(guān)聯(lián)。例如,本體建立器106 (參見圖1)確定:這兩個(gè)識(shí)別鍵(I)是相同的,(2)指定第一概念是第二概念的子類,或者(3)指定第二概念是第一概念的子類。
[0530]在步驟706中,如果本體建立器106 (參見圖1)確定識(shí)別了第一和第二本體中的概念之間的所有對(duì)應(yīng)關(guān)系,則執(zhí)行步驟706的“是”分支并且執(zhí)行步驟708。如果本體建立器106(參見圖1)在步驟706中確定未識(shí)別第一和第二本體中的概念之間的所有對(duì)應(yīng)關(guān)系,則執(zhí)行步驟706的“否”分支并且該處理循環(huán)回至步驟704,在步驟704中,處理更新的第一和/或第二概念。
[0531]在步驟708中,本體建立器106 (參見圖1)將通過在步驟704中識(shí)別的對(duì)應(yīng)關(guān)系聯(lián)系的來自第二本體的所有概念導(dǎo)入到存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1(參見圖1)中的第一本體中。
[0532]在步驟710中,本體建立器106 (參見圖1)將在步驟708中導(dǎo)入的概念之間的所有可能的關(guān)系導(dǎo)入到存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1(參見圖1)中的第一本體中。
[0533]在步驟712中,本體建立器106 (參見圖1)將第二本體的其余部分導(dǎo)入到存儲(chǔ)在本體數(shù)據(jù)存儲(chǔ)庫108-1(參見圖1)中的第一本體中,這完成在步驟702中建立的第一本體和第二本體的合并。
[0534]圖7的處理結(jié)束于步驟714。
[0535]適應(yīng)性
[0536]本發(fā)明的實(shí)施例提供一種本體建立系統(tǒng),通過在該系統(tǒng)被反復(fù)使用時(shí)隨著時(shí)間過去而變得更加高效,該本體建立系統(tǒng)是可適配的。如以上相對(duì)于圖6所討論的,系統(tǒng)可由來自參考本體114(參見圖1)的定義的語義模式以及由在參考本體114(參見圖1)中不存在并且由創(chuàng)造的術(shù)語代表的新概念的語義模式自動(dòng)地充實(shí)。前述語義模式變?yōu)榭稍陔S后的利用圖2的處理的本體建立期間重用。
[0537]通過由人類知識(shí)工程師進(jìn)行的適配,本體建立系統(tǒng)可隨著時(shí)間過去而演進(jìn)。該系統(tǒng)允許知識(shí)工程師分析創(chuàng)造的術(shù)語的列表和使用標(biāo)準(zhǔn)關(guān)系的方式,以便改進(jìn)本體元模式116 (參見圖1)、變換規(guī)則和語法112 (參見圖1),由此允許更復(fù)雜的結(jié)構(gòu)的分析。
[0538]由本體元模式116(參見圖1)描述的特性和屬性可由知識(shí)工程師分析以使語法112(參見圖1)和本體元模式116 (參見圖1)更完整,由此隨著時(shí)間過去而使該系統(tǒng)更加有效。
[0539]通常,特性的分析導(dǎo)致新的標(biāo)準(zhǔn)基礎(chǔ)結(jié)構(gòu)的識(shí)別,所述新的標(biāo)準(zhǔn)基礎(chǔ)結(jié)構(gòu)能夠與用于概念化的新的變換規(guī)則一起被包括在語法112 (參見圖1)的新版本中。
[0540]通常,屬性的分析導(dǎo)致可能的新的標(biāo)準(zhǔn)關(guān)系的識(shí)別。例如,下面的三元組:(swim, has_attribute, water)、(fly, has_attribute, air)…中的屬性的分析可導(dǎo)致新的標(biāo)準(zhǔn)關(guān)系“has_element”的創(chuàng)建并且導(dǎo)致使用新的標(biāo)準(zhǔn)關(guān)系所需的變換規(guī)則。
[0541]在“haS_attribUte”關(guān)系中作為賓語出現(xiàn)的創(chuàng)造的術(shù)語可被分析以發(fā)現(xiàn)新的屬性類型,諸如 “color (顏色)”、“size (大小)”、“quality (質(zhì)量)”、“l(fā)ocat1n (位置)”、“shape (形狀)”等。
[0542]新的標(biāo)準(zhǔn)關(guān)系以及具有新屬性的可能的值的列表的新屬性可被存儲(chǔ)在本體元模式116(參見圖1)中。利用由知識(shí)工程師完成的分析,可能的屬性值可隨著時(shí)間過去而演進(jìn)。
[0543]在一個(gè)實(shí)施例中,本體建立系統(tǒng)要求通過圖2的處理建立的每個(gè)語義模式必須參照當(dāng)建立該語義模式時(shí)使用的本體元模式的版本,由此允許版本管理?;谇笆鲆蟮膶?duì)元模式的版本的參照,本發(fā)明的實(shí)施例可自動(dòng)地升級(jí)已有本體以使已有本體與新的元模式版本兼容。因?yàn)榘姹竟芾恚倔w元模式116(參見圖1)的適配是不會(huì)使利用元模式的以前版本建立的本體無效的改進(jìn)。
[0544]計(jì)算機(jī)系統(tǒng)
[0545]圖8是根據(jù)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的方框圖,該計(jì)算機(jī)系統(tǒng)被包括在圖1的系統(tǒng)中并且實(shí)現(xiàn)圖2的處理。計(jì)算機(jī)系統(tǒng)102-1通常包括中央處理單元(CPU)802、存儲(chǔ)器804、輸入/輸出(I/O)接口 806和總線808。另外,計(jì)算機(jī)系統(tǒng)102-1耦接到I/O裝置810和計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812XPU 802執(zhí)行計(jì)算機(jī)系統(tǒng)102-1的計(jì)算和控制功能,包括執(zhí)行用于執(zhí)行通過變換復(fù)雜三元組來建立本體的方法的程序代碼814中所包括的指令,其中指令經(jīng)由存儲(chǔ)器804由CPU 802執(zhí)行。CPU 802可包括單個(gè)處理單元,或者分布在位于一個(gè)或多個(gè)位置(例如,位于客戶機(jī)和服務(wù)器上)的一個(gè)或多個(gè)處理單元上。在一個(gè)實(shí)施例中,程序代碼814包括被包括在本體建立器中106 (參見圖1)和復(fù)雜三元組變換工具110 (參見圖1)中的程序代碼。
[0546]存儲(chǔ)器804可包括以下描述的任何已知的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。在一個(gè)實(shí)施例中,存儲(chǔ)器804的高速緩存元件提供至少某程序代碼(例如,程序代碼814)的臨時(shí)存儲(chǔ)以便減少在執(zhí)行程序代碼的指令的時(shí)必須從大容量存儲(chǔ)器檢索代碼的次數(shù)。此外,類似于CPU802,存儲(chǔ)器804可位于單個(gè)物理位置(包括一個(gè)或多個(gè)類型的數(shù)據(jù)存儲(chǔ)器),或者分布在各種形式的多個(gè)物理系統(tǒng)上。另外,存儲(chǔ)器804能夠包括分布在例如局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)上的數(shù)據(jù)。
[0547]I/O接口 806包括用于與外部源交換信息的任何系統(tǒng)。I/O裝置810包括任何已知類型的外部裝置,包括顯示裝置(例如,監(jiān)視器)、鍵盤、鼠標(biāo)、打印機(jī)、揚(yáng)聲器、手持式裝置、傳真機(jī)等??偩€808提供計(jì)算機(jī)系統(tǒng)102-1中的各個(gè)部件之間的通信鏈路,并且可包括任何類型的傳輸鏈路,包括電、光學(xué)、無線傳輸鏈路等。
[0548]I/O接口 806還允許計(jì)算機(jī)系統(tǒng)102_1將信息(例如,數(shù)據(jù)或程序指令(諸如,程序代碼814))存儲(chǔ)在計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812或另一計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元(未示出)上,以及從其檢索信息。計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812可包括以下描述的任何已知的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。例如,計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812可以是非易失性數(shù)據(jù)存儲(chǔ)裝置,諸如磁盤驅(qū)動(dòng)器(即,硬盤驅(qū)動(dòng)器)或光盤驅(qū)動(dòng)器(例如,接收⑶-ROM盤的⑶-ROM驅(qū)動(dòng)器)。
[0549]存儲(chǔ)器804和/或存儲(chǔ)單元812可存儲(chǔ)計(jì)算機(jī)程序代碼814,計(jì)算機(jī)程序代碼814包括由CPU 802經(jīng)存儲(chǔ)器804執(zhí)行以通過變換復(fù)雜三元組來建立本體的指令。雖然圖8將存儲(chǔ)器804描述為包括程序代碼814,但本發(fā)明設(shè)想這樣的實(shí)施例:存儲(chǔ)器804并不同時(shí)包括所有的代碼814,而是替代地在一時(shí)刻僅包括代碼814的一部分。
[0550]另外,存儲(chǔ)器804可包括圖8中未示出的其它系統(tǒng),諸如在CPU 802上運(yùn)行并且提供對(duì)計(jì)算機(jī)系統(tǒng)102-1內(nèi)的各種部件和/或連接到計(jì)算機(jī)系統(tǒng)102-1的各種部件的控制的操作系統(tǒng)(例如,Linux)。
[0551]耦接到計(jì)算機(jī)系統(tǒng)102-1的存儲(chǔ)單元812和/或一個(gè)或多個(gè)其它計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元(未示出)可存儲(chǔ)語法112 (參見圖1)、參考本體114 (參見圖1)、本體元模式116 (參見圖1)和本體108-1...108-N(參見圖1)。
[0552]術(shù)領(lǐng)域技術(shù)人員將會(huì)理解,本發(fā)明可被實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的實(shí)施例的一方面可采用通常全部可在這里稱為“模塊”的完全硬件方面、完全軟件方面(包括固件、常駐軟件、微碼等)或組合軟件和硬件方面的方面的形式。另外,本發(fā)明的實(shí)施例可采用實(shí)現(xiàn)于包含或存儲(chǔ)計(jì)算機(jī)可讀程序代碼(例如,程序代碼814)的一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)(例如,存儲(chǔ)器804和/或計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812)的計(jì)算機(jī)程序產(chǎn)品的形式。
[0553]可使用一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)(例如,存儲(chǔ)器804和計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812)的任何組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)是計(jì)算機(jī)可讀存儲(chǔ)裝置或計(jì)算機(jī)可讀存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是例如但不限于電子、磁、光學(xué)、電磁、紅外或半導(dǎo)體系統(tǒng)、設(shè)備、裝置或者前述各項(xiàng)的任何合適的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子的非窮舉列表包括:具有一個(gè)或多個(gè)線的電氣連接、便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦除可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式壓縮盤只讀存儲(chǔ)器(CD-ROM)、光學(xué)存儲(chǔ)裝置、磁存儲(chǔ)裝置或前述各項(xiàng)的任何合適的組合。在本文的上下文中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是能夠包含或存儲(chǔ)由用于執(zhí)行指令的系統(tǒng)、設(shè)備或裝置使用或結(jié)合該系統(tǒng)、設(shè)備或裝置使用的程序(例如,程序814)的有形介質(zhì)。
[0554]計(jì)算機(jī)可讀信號(hào)介質(zhì)可包括例如基帶中或作為載波的一部分的包含計(jì)算機(jī)可讀程序代碼的傳播數(shù)據(jù)信號(hào)。這種傳播的信號(hào)可采用多種形式中的任何形式,包括但不限于電磁信號(hào)、光學(xué)信號(hào)或者它們的任何合適的組合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以是這樣的任何計(jì)算機(jī)可讀介質(zhì):該計(jì)算機(jī)可讀介質(zhì)不是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),并且能夠傳送、傳播或傳輸由用于執(zhí)行指令的系統(tǒng)、設(shè)備或裝置使用或結(jié)合該系統(tǒng)、設(shè)備或裝置使用的程序。
[0555]可使用任何合適的介質(zhì)(包括但不限于無線、有線、光纖纜、RF等或前述各項(xiàng)的任何合適的組合)傳輸計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼(例如,程序代碼814)。
[0556]可按照一種或多種編程語言的任何組合編寫用于執(zhí)行本發(fā)明的各方面的操作的計(jì)算機(jī)程序代碼(例如,程序代碼814),所述編程語言包括:面向?qū)ο蟮木幊陶Z言,諸如Java?、Smalltalk、C++等;和常規(guī)的過程編程語言,諸如“C”編程語言或類似編程語言。程序代碼的指令可完全在用戶的計(jì)算機(jī)上執(zhí)行、部分在用戶的計(jì)算機(jī)上執(zhí)行、作為獨(dú)立軟件包執(zhí)行、部分在用戶的計(jì)算機(jī)上并且部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行,其中前述用戶的計(jì)算機(jī)、遠(yuǎn)程計(jì)算機(jī)和服務(wù)器可以是例如計(jì)算機(jī)系統(tǒng)102-1或具有與圖8中所包括的計(jì)算機(jī)系統(tǒng)102-1的部件類似的部件的另一計(jì)算機(jī)系統(tǒng)(未示出)。在后一情形中,遠(yuǎn)程計(jì)算機(jī)可通過包括LAN或WAN的任何類型的網(wǎng)絡(luò)(未示出)連接到用戶的計(jì)算機(jī),或者可(例如,使用互聯(lián)網(wǎng)服務(wù)提供商(ISP)通過互聯(lián)網(wǎng))連接到外部計(jì)算機(jī)。
[0557]這里參照根據(jù)本發(fā)明的實(shí)施例的方法、設(shè)備(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖(例如,圖2、圖3、圖4A-4F、圖5、圖6和圖7)和/或方框圖(例如,圖1和圖8)描述了本發(fā)明的各方面。將會(huì)理解,流程圖和/或方框圖中的每個(gè)方框以及流程圖和/或方框圖中的方框的組合能夠由計(jì)算機(jī)程序指令(例如,程序代碼814)實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可被提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或者其它可編程數(shù)據(jù)處理設(shè)備的一個(gè)或多個(gè)硬件處理器(例如,CPU 802),以產(chǎn)生一機(jī)器,從而指令(經(jīng)由計(jì)算機(jī)或者其它可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行)產(chǎn)生用于實(shí)現(xiàn)流程圖和/或方框圖的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的
>j-U ρ?α裝直。
[0558]這些計(jì)算機(jī)程序指令也可被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)(例如,存儲(chǔ)器804或計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)單元812)中,能夠指示計(jì)算機(jī)(例如,計(jì)算機(jī)系統(tǒng)102-1)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置按照特定的方式發(fā)揮作用,從而存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令(例如,程序814)產(chǎn)生一種制造產(chǎn)品,所述制造產(chǎn)品包括實(shí)現(xiàn)流程圖和/或方框圖的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的指令。
[0559]計(jì)算機(jī)程序指令也可被加載到計(jì)算機(jī)(例如,計(jì)算機(jī)系統(tǒng)102-1)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置上,以使得在所述計(jì)算機(jī)、其它可編程設(shè)備或其它裝置上執(zhí)行一系列的操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過程,從而在所述計(jì)算機(jī)、其它可編程設(shè)備或其它裝置上執(zhí)行的指令(例如,程序814)提供用于實(shí)現(xiàn)流程圖和/或方框圖的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的過程。
[0560]本發(fā)明的實(shí)施例的任何部件能夠由針對(duì)通過變換復(fù)雜三元組來建立本體而提供部署或集成計(jì)算基礎(chǔ)設(shè)施的服務(wù)提供商部署、管理、服務(wù)等。因此,本發(fā)明的實(shí)施例公開一種用于支持計(jì)算機(jī)基礎(chǔ)設(shè)施的處理,其中該處理包括第一計(jì)算機(jī)系統(tǒng)為在包括一個(gè)或多個(gè)處理器(例如,CPU 802)的第二計(jì)算機(jī)系統(tǒng)(例如,計(jì)算機(jī)系統(tǒng)102-1)中集成、容納、維護(hù)和部署計(jì)算機(jī)可讀代碼(例如,程序代碼814)中的至少一種提供至少一種支持服務(wù),其中處理器執(zhí)行代碼中所包含的指令,使第二計(jì)算機(jī)系統(tǒng)通過變換復(fù)雜三元組來建立本體。
[0561]在另一實(shí)施例中,本發(fā)明提供一種在訂購、廣告和/或付費(fèi)基礎(chǔ)上執(zhí)行本發(fā)明的處理步驟的方法。也就是說,服務(wù)提供商(諸如,解決方案集成商)能夠?qū)νㄟ^變換復(fù)雜三元組來建立本體的處理進(jìn)行創(chuàng)建、維護(hù)、支持等。在這種情況下,服務(wù)提供商能夠?yàn)橐粋€(gè)或多個(gè)顧客對(duì)執(zhí)行本發(fā)明的處理步驟的計(jì)算機(jī)基礎(chǔ)設(shè)施進(jìn)行創(chuàng)建、維護(hù)、支持等。作為回報(bào),服務(wù)提供商能夠根據(jù)訂閱和/或付費(fèi)合同從顧客接收付費(fèi),和/或服務(wù)提供商能夠通過將廣告內(nèi)容銷售給一個(gè)或多個(gè)第三方來接收付費(fèi)。
[0562]圖2、圖3、圖4A-4F、圖5、圖6和圖7中的流程圖以及圖1和圖8中的方框圖示出根據(jù)本發(fā)明的各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)方式的架構(gòu)、功能和操作。在這個(gè)方面,流程圖或方框圖中的每個(gè)方框可代表包括用于實(shí)現(xiàn)規(guī)定的邏輯功能的一個(gè)或多個(gè)可執(zhí)行指令的代碼(例如,程序代碼814)的模塊、段或一部分。還應(yīng)該注意,在一些替代實(shí)現(xiàn)方式中,方框中標(biāo)注的功能可不按附圖中標(biāo)注的次序執(zhí)行。例如,事實(shí)上,根據(jù)涉及的功能,連續(xù)示出的兩個(gè)方框可基本上同時(shí)執(zhí)行,或者這些方框有時(shí)可按照相反的次序執(zhí)行。還應(yīng)該注意,方框圖和/或流程圖中的每個(gè)方框以及方框圖和/或流程圖中的方框的組合能夠由執(zhí)行規(guī)定的功能或動(dòng)作的基于專用硬件的系統(tǒng)或?qū)S糜布陀?jì)算機(jī)指令的組合實(shí)現(xiàn)。
[0563]盡管已在這里為了說明的目的描述了本發(fā)明的實(shí)施例,但對(duì)于本領(lǐng)域技術(shù)人員而言,許多修改和變化將會(huì)變得清楚。因此,所附權(quán)利要求旨在包括落在本發(fā)明的真正精神和范圍內(nèi)的所有這種修改和變化。
【權(quán)利要求】
1.一種建立本體的方法,該方法包括下述步驟: 計(jì)算機(jī)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語; 計(jì)算機(jī)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語,識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義; 基于參考本體的元模式,計(jì)算機(jī)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及 計(jì)算機(jī)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
2.如權(quán)利要求1所述的方法,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的術(shù)語是核心術(shù)語并且是形容詞;以及 確定該形容詞聯(lián)系到所述復(fù)雜三元組中所包括的核心名詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為形容詞的術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的一組簡(jiǎn)單三元組指定的概念化的形容詞;以及 產(chǎn)生核心名詞和概念化的形容詞之間的標(biāo)準(zhǔn)關(guān)系, 其中所述一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中所述一組簡(jiǎn)單三元組代表形容詞的語義。
3.如權(quán)利要求1所述的方法,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第一術(shù)語是核心術(shù)語并且是動(dòng)詞;以及 確定所述復(fù)雜三元組的第二術(shù)語是賓語, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為動(dòng)詞的第一術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的第一組簡(jiǎn)單三元組指定的概念化的動(dòng)詞;以及 產(chǎn)生概念化的動(dòng)詞和賓語之間的第一標(biāo)準(zhǔn)關(guān)系,以及 其中第一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語。
4.如權(quán)利要求3所述的方法,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第二術(shù)語是核心術(shù)語并且是副詞;以及 確定該副詞聯(lián)系到所述復(fù)雜三元組中所包括的動(dòng)詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為副詞的第二術(shù)語變換為由所述多個(gè)簡(jiǎn)單三元組中所包括的第二組簡(jiǎn)單三元組指定的概念化的副詞;以及 產(chǎn)生概念化的動(dòng)詞和概念化的副詞之間的第二標(biāo)準(zhǔn)關(guān)系,以及其中第二組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組分別包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中第二組簡(jiǎn)單三元組代表副詞的語義。
5.如權(quán)利要求1所述的方法,還包括: 計(jì)算機(jī)接收從由另一軟件應(yīng)用提供的另一自由形式文本提取的第二多個(gè)復(fù)雜三元組; 計(jì)算機(jī)執(zhí)行所述第二多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的第二多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)執(zhí)行所述第二多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為第二多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組; 基于參考本體的元模式,計(jì)算機(jī)通過添加從所述第二多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的第二關(guān)系并且通過添加所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的第二語義表示來執(zhí)行所述第二多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為第二多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義被包括在參考本體中; 計(jì)算機(jī)存儲(chǔ)所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供所述另一自由形式文本的第二軟件應(yīng)用內(nèi)所包括的知識(shí)的第二新本體; 計(jì)算機(jī)在語法上和在語義上將所述多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第一組新的簡(jiǎn)單三元組; 計(jì)算機(jī)在語法上和在語義上將所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第二組新的簡(jiǎn)單三元組;以及 通過計(jì)算機(jī)確定第一組新的三元組和第二組新的三元組之間的語義對(duì)應(yīng)關(guān)系,計(jì)算機(jī)確定新本體和第二新本體之間的跨本體對(duì)應(yīng)關(guān)系。
6.如權(quán)利要求1所述的方法,其中計(jì)算機(jī)執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 確定在所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的簡(jiǎn)化的三元組中需要名詞; 確定參考本體和參考本體的元模式不包括所述簡(jiǎn)化的三元組中所需的名詞的定義; 產(chǎn)生被確定為在所述簡(jiǎn)化的三元組中需要的名詞; 產(chǎn)生所述名詞的定義作為所述名詞和正在建立的新本體中的術(shù)語之間的關(guān)系; 將所述名詞和名詞的定義存儲(chǔ)在參考本體的元模式中;以及 部分地基于存儲(chǔ)的名詞和存儲(chǔ)的名詞的定義,建立第二新本體。
7.如權(quán)利要求1所述的方法,其中執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組的步驟包括產(chǎn)生代表所述多個(gè)簡(jiǎn)化的三元組中的核心術(shù)語的定義的語義的一組新的復(fù)雜三元組的步驟,并且 其中所述方法還包括下述步驟: 計(jì)算機(jī)接收期望分析深度并且初始化分析深度參數(shù); 基于所述語法,計(jì)算機(jī)在語法上將所述一組新的復(fù)雜三元組變換為一組新的語法變換后的復(fù)雜三元組; 計(jì)算機(jī)在語義上將所述一組新的語法變換后的復(fù)雜三元組變換為一組新的簡(jiǎn)化的三元組; 在在語法上變換和在語義上變換的步驟之后,計(jì)算機(jī)更新分析深度參數(shù);以及 在更新的分析深度參數(shù)未指示期望分析深度時(shí),計(jì)算機(jī): 對(duì)所述一組新的簡(jiǎn)化的三元組執(zhí)行充實(shí)變換以產(chǎn)生另一組新的復(fù)雜三元組;以及對(duì)于另一組新的簡(jiǎn)化的三元組,重復(fù)在語法上變換、在語義上變換和更新分析深度參數(shù)的步驟。
8.一種計(jì)算機(jī)系統(tǒng),包括: 中央處理單元(CPU); 存儲(chǔ)器,耦接到CPU; 計(jì)算機(jī)可讀的有形存儲(chǔ)裝置,耦接到CPU,該存儲(chǔ)裝置包含由CPU經(jīng)由存儲(chǔ)器執(zhí)行以實(shí)現(xiàn)建立本體的方法的指令,該方法包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語; 計(jì)算機(jī)系統(tǒng)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語,識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義; 基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及 計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
9.如權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的術(shù)語是核心術(shù)語并且是形容詞;以及 確定該形容詞聯(lián)系到復(fù)雜三元組中所包括的核心名詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為形容詞的術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的一組簡(jiǎn)單三元組指定的概念化的形容詞;以及 產(chǎn)生核心名詞和概念化的形容詞之間的標(biāo)準(zhǔn)關(guān)系, 其中所述一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中所述一組簡(jiǎn)單三元組代表形容詞的語義。
10.如權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第一術(shù)語是核心術(shù)語并且是動(dòng)詞;以及 確定復(fù)雜三元組的第二術(shù)語是賓語, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為動(dòng)詞的第一術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的第一組簡(jiǎn)單三元組指定的概念化的動(dòng)詞;以及 產(chǎn)生概念化的動(dòng)詞和賓語之間的第一標(biāo)準(zhǔn)關(guān)系,以及 其中第一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語。
11.如權(quán)利要求10所述的計(jì)算機(jī)系統(tǒng),其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第二術(shù)語是核心術(shù)語并且是副詞;以及 確定該副詞聯(lián)系到復(fù)雜三元組中所包括的動(dòng)詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為副詞的第二術(shù)語變換為由所述多個(gè)簡(jiǎn)單三元組中所包括的第二組簡(jiǎn)單三元組指定的概念化的副詞;以及 產(chǎn)生概念化的動(dòng)詞和概念化的副詞之間的第二標(biāo)準(zhǔn)關(guān)系,以及其中第二組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組分別包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中第二組簡(jiǎn)單三元組代表副詞的語義。
12.如權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中所述方法還包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收從由另一軟件應(yīng)用提供的另一自由形式文本提取的第二多個(gè)復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)執(zhí)行所述第二多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的第二多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)執(zhí)行所述第二多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為第二多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組; 基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述第二多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的第二關(guān)系并且通過添加所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的第二語義表示,來執(zhí)行所述第二多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為第二多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義被包括在參考本體中; 計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供所述另一自由形式文本的第二軟件應(yīng)用內(nèi)所包括的知識(shí)的第二新本體; 計(jì)算機(jī)系統(tǒng)在語法上和在語義上將所述多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第一組新的簡(jiǎn)單三元組; 計(jì)算機(jī)系統(tǒng)在語法上和在語義上將所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第二組新的簡(jiǎn)單三元組;以及 通過計(jì)算機(jī)系統(tǒng)確定第一組新的三元組和第二組新的三元組之間的語義對(duì)應(yīng)關(guān)系,計(jì)算機(jī)系統(tǒng)確定新本體和第二新本體之間的跨本體對(duì)應(yīng)關(guān)系。
13.如權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中計(jì)算機(jī)系統(tǒng)執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 確定在所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的簡(jiǎn)化的三元組中需要名詞; 確定參考本體和參考本體的元模式不包括簡(jiǎn)化的三元組中所需的名詞的定義; 產(chǎn)生被確定為在簡(jiǎn)化的三元組中需要的名詞; 產(chǎn)生所述名詞的定義作為該名詞和正在建立的新本體中的術(shù)語之間的關(guān)系; 將所述名詞和名詞的定義存儲(chǔ)在參考本體的元模式中;以及 部分地基于存儲(chǔ)的名詞和存儲(chǔ)的名詞的定義,建立第二新本體。
14.如權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組的步驟包括產(chǎn)生代表所述多個(gè)簡(jiǎn)化的三元組中的核心術(shù)語的定義的語義的一組新的復(fù)雜三元組的步驟,以及 其中所述方法還包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收期望分析深度并且初始化分析深度參數(shù); 基于所述語法,計(jì)算機(jī)系統(tǒng)在語法上將所述一組新的復(fù)雜三元組變換為一組新的語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)在語義上將所述一組新的語法變換后的復(fù)雜三元組變換為一組新的簡(jiǎn)化的三元組; 在在語法上變換和在語義上變換的步驟之后,計(jì)算機(jī)系統(tǒng)更新分析深度參數(shù);以及 在更新的分析深度參數(shù)未指示期望分析深度時(shí),計(jì)算機(jī)系統(tǒng): 對(duì)所述一組新的簡(jiǎn)化的三元組執(zhí)行充實(shí)變換以產(chǎn)生另一組新的復(fù)雜三元組;以及對(duì)于另一組新的簡(jiǎn)化的三元組,重復(fù)在語法上變換、在語義上變換和更新分析深度參數(shù)的步驟。
15.一種計(jì)算機(jī)程序產(chǎn)品,包括: 計(jì)算機(jī)可讀的有形存儲(chǔ)裝置;和 計(jì)算機(jī)可讀程序代碼,存儲(chǔ)在計(jì)算機(jī)可讀的有形存儲(chǔ)裝置中,該計(jì)算機(jī)可讀程序代碼包含由計(jì)算機(jī)系統(tǒng)的中央處理單元(CPU)執(zhí)行以實(shí)現(xiàn)建立本體的方法的指令,該方法包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收從由軟件應(yīng)用提供的自由形式文本提取的多個(gè)復(fù)雜三元組,每個(gè)復(fù)雜三元組包括復(fù)合主語、復(fù)合謂語和復(fù)合賓語; 計(jì)算機(jī)系統(tǒng)通過基于語法識(shí)別所述多個(gè)復(fù)雜三元組中的核心術(shù)語和非核心術(shù)語,識(shí)別所述多個(gè)復(fù)雜三元組中的包括名詞、動(dòng)詞、形容詞和副詞的語法元素并且使所述多個(gè)復(fù)雜三元組標(biāo)準(zhǔn)化,來執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)通過將多個(gè)簡(jiǎn)化的三元組中所包括的每個(gè)核心術(shù)語分派給正好一個(gè)術(shù)語定義并且分派給參考本體的正好一個(gè)識(shí)別鍵,來執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組,其中每個(gè)簡(jiǎn)化的三元組包括主語術(shù)語、謂語術(shù)語和賓語術(shù)語,并且其中所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的每一個(gè)保留各個(gè)語法變換后的復(fù)雜三元組的語義; 基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的關(guān)系并且通過添加所述多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的語義表示,來執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述定義被包括在參考本體中;以及 計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供自由形式文本的軟件應(yīng)用內(nèi)所包括的知識(shí)的新本體。
16.如權(quán)利要求15所述的程序產(chǎn)品,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的術(shù)語是核心術(shù)語并且是形容詞;以及 確定該形容詞聯(lián)系到復(fù)雜三元組中所包括的核心名詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為形容詞的術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的一組簡(jiǎn)單三元組指定的概念化的形容詞;以及 產(chǎn)生核心名詞和概念化的形容詞之間的標(biāo)準(zhǔn)關(guān)系, 其中所述一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中所述一組簡(jiǎn)單三元組代表形容詞的語義。
17.如權(quán)利要求15所述的程序產(chǎn)品,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第一術(shù)語是核心術(shù)語并且是動(dòng)詞;以及 確定復(fù)雜三元組的第二術(shù)語是賓語, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為動(dòng)詞的第一術(shù)語變換為由多個(gè)簡(jiǎn)單三元組中所包括的第一組簡(jiǎn)單三元組指定的概念化的動(dòng)詞;以及 產(chǎn)生概念化的動(dòng)詞和賓語之間的第一標(biāo)準(zhǔn)關(guān)系,以及 其中第一組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語。
18.如權(quán)利要求17所述的程序產(chǎn)品,其中執(zhí)行所述多個(gè)復(fù)雜三元組的語法變換的步驟包括: 確定所述多個(gè)復(fù)雜三元組中所包括的復(fù)雜三元組的第二術(shù)語是核心術(shù)語并且是副詞;以及 確定該副詞聯(lián)系到復(fù)雜三元組中所包括的動(dòng)詞, 其中執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為所述多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 將作為核心術(shù)語并且作為副詞的第二術(shù)語變換為由所述多個(gè)簡(jiǎn)單三元組中所包括的第二組簡(jiǎn)單三元組指定的概念化的副詞;以及 產(chǎn)生概念化的動(dòng)詞和概念化的副詞之間的第二標(biāo)準(zhǔn)關(guān)系, 其中第二組簡(jiǎn)單三元組中的每個(gè)簡(jiǎn)單三元組分別包括單個(gè)主語術(shù)語、單個(gè)謂語術(shù)語和單個(gè)賓語術(shù)語,并且其中第二組簡(jiǎn)單三元組代表副詞的語義。
19.如權(quán)利要求15所述的程序產(chǎn)品,其中所述方法還包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收從由另一軟件應(yīng)用提供的另一自由形式文本提取的第二多個(gè)復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)執(zhí)行所述第二多個(gè)復(fù)雜三元組的語法變換,其中執(zhí)行語法變換的步驟的結(jié)果是其術(shù)語與所述語法匹配的第二多個(gè)語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)執(zhí)行所述第二多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為第二多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組; 基于參考本體的元模式,計(jì)算機(jī)系統(tǒng)通過添加從所述第二多個(gè)簡(jiǎn)化的三元組中的每個(gè)術(shù)語具有的與參考本體的對(duì)應(yīng)關(guān)系得出的第二關(guān)系并且通過添加所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義的第二語義表示,來執(zhí)行所述第二多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為第二多個(gè)簡(jiǎn)化和充實(shí)的三元組,其中所述第二多個(gè)簡(jiǎn)化的三元組中的術(shù)語的定義被包括在參考本體中; 計(jì)算機(jī)系統(tǒng)存儲(chǔ)所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組作為代表提供所述另一自由形式文本的第二軟件應(yīng)用內(nèi)所包括的知識(shí)的第二新本體; 計(jì)算機(jī)系統(tǒng)在語法上和在語義上將所述多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第一組新的簡(jiǎn)單三元組; 計(jì)算機(jī)系統(tǒng)在語法上和在語義上將所述第二多個(gè)簡(jiǎn)化和充實(shí)的三元組變換為第二組新的簡(jiǎn)單三元組;以及 通過計(jì)算機(jī)系統(tǒng)確定第一組新的三元組和第二組新的三元組之間的語義對(duì)應(yīng)關(guān)系,計(jì)算機(jī)系統(tǒng)確定新本體和第二新本體之間的跨本體對(duì)應(yīng)關(guān)系。
20.如權(quán)利要求15所述的程序產(chǎn)品,其中計(jì)算機(jī)系統(tǒng)執(zhí)行所述多個(gè)語法變換后的復(fù)雜三元組的語義變換并且將其分別變換為多個(gè)簡(jiǎn)化的三元組中所包括的一個(gè)或多個(gè)簡(jiǎn)化的三元組的步驟包括: 確定在所述一個(gè)或多個(gè)簡(jiǎn)化的三元組中的簡(jiǎn)化的三元組中需要名詞; 確定參考本體和參考本體的元模式不包括簡(jiǎn)化的三元組中所需的名詞的定義; 產(chǎn)生被確定為在簡(jiǎn)化的三元組中需要的名詞; 產(chǎn)生所述名詞的定義作為該名詞和正在建立的新本體中的術(shù)語之間的關(guān)系; 將所述名詞和名詞的定義存儲(chǔ)在參考本體的元模式中;以及 部分地基于存儲(chǔ)的名詞和存儲(chǔ)的名詞的定義,建立第二新本體。
21.如權(quán)利要求15所述的程序產(chǎn)品,其中執(zhí)行所述多個(gè)簡(jiǎn)化的三元組的充實(shí)變換并且將其變換為所述多個(gè)簡(jiǎn)化和充實(shí)的三元組的步驟包括產(chǎn)生代表所述多個(gè)簡(jiǎn)化的三元組中的核心術(shù)語的定義的語義的一組新的復(fù)雜三元組的步驟,以及 其中所述方法還包括下述步驟: 計(jì)算機(jī)系統(tǒng)接收期望分析深度并且初始化分析深度參數(shù); 基于所述語法,計(jì)算機(jī)系統(tǒng)在語法上將所述一組新的復(fù)雜三元組變換為一組新的語法變換后的復(fù)雜三元組; 計(jì)算機(jī)系統(tǒng)在語義上將所述一組新的語法變換后的復(fù)雜三元組變換為一組新的簡(jiǎn)化的三元組; 在在語法上變換和在語義上變換的步驟之后,計(jì)算機(jī)系統(tǒng)更新分析深度參數(shù);以及 在更新的分析深度參數(shù)未指示期望分析深度時(shí),計(jì)算機(jī)系統(tǒng): 對(duì)所述一組新的簡(jiǎn)化的三元組執(zhí)行充實(shí)變換以產(chǎn)生另一組新的復(fù)雜三元組;以及對(duì)于另一組新的簡(jiǎn)化的三元組,重復(fù)在語法上變換、在語義上變換和更新分析深度參數(shù)的步驟。
【文檔編號(hào)】G06N5/04GK104205092SQ201380016700
【公開日】2014年12月10日 申請(qǐng)日期:2013年3月7日 優(yōu)先權(quán)日:2012年3月28日
【發(fā)明者】F·羅格, T·羅亞恩, M·潘特蘭德 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司