亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于本體匹配的本體詞法分析方法

文檔序號:6567169閱讀:217來源:國知局
專利名稱:一種用于本體匹配的本體詞法分析方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于本體匹配的本體詞法分析方法,屬于計算機(jī)技術(shù)領(lǐng)域,特別是屬于本體技術(shù)領(lǐng)域。
背景技術(shù)
本體(ontology)是共享概念模型的明確的形式化規(guī)范說明,使得計算機(jī)對知識能夠共享、重用、互操作,并在語義ffeb,知識數(shù)據(jù)工程,電子商務(wù)等領(lǐng)域中廣泛應(yīng)用。由于不同背景的知識工程師構(gòu)造和維護(hù)相似或相同域的本體,導(dǎo)致了本體之間的異構(gòu),這阻礙了知識的共享、重用、互操作,本體匹配(ontology matching)是解決該問題主要方法之一。本體匹配是指發(fā)現(xiàn)相似或相同域中不同本體中相同類型實體(entity)之間的匹配關(guān)系,實體包括概念(cone印ts)、屬性(properties)、個體(individuals)。目前,本體匹配系統(tǒng)多是利用實體標(biāo)簽和評論中單詞的單個詞義和本體中實體間的結(jié)構(gòu),計算實體間的相似性,從而得出匹配關(guān)系。由于這些本體匹配系統(tǒng)沒有有效利用本體的詞法信息,較少關(guān)注實體中的單詞詞義的擴(kuò)展,單詞詞義的組合方式,特殊含義單詞的處理等對匹配結(jié)果的影響,導(dǎo)致這些本體匹配系統(tǒng)的實際匹配結(jié)果并不好。因此如何有效分析和利用本體的詞法信息成為本體應(yīng)用過程中一個急需要解決的技術(shù)難題。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是發(fā)明一種有效的本體詞法信息分析方法,能直接用于本體匹配操作之中。為了達(dá)到上述目的,本發(fā)明提出了一種用于本體匹配的本體詞法分析方法,所述方法包括下列操作步驟(1)將待匹配的兩個本體分別定為源本體和目標(biāo)本體;(2)將源本體和目標(biāo)本體中所有實體標(biāo)簽里的字符串以及評論里的字符串切為單詞;(3)根據(jù)源本體的上下文找到源本體中單詞的合適詞義,根據(jù)目標(biāo)本體的上下文找到目標(biāo)本體中單詞的合適詞義;(4)對源本體和目標(biāo)本體中單詞的合適詞義進(jìn)行擴(kuò)展;(5)構(gòu)建詞義關(guān)系本體;(6)根據(jù)源本體和目標(biāo)本體中實體的標(biāo)簽和評論中的單詞的合適詞義及該詞義擴(kuò)展構(gòu)建所述源本體和目標(biāo)本體中的實體的詞法信息。所述步驟2的具體操作內(nèi)容是將源本體和目標(biāo)本體中實體標(biāo)簽和評論里的字符串分解成單詞,并處理單詞的復(fù)數(shù)、過去時、現(xiàn)在時等情況。所述步驟3的具體操作內(nèi)容是首先獲得本體中每個單詞在詞網(wǎng)WordNet中的所有詞義,檢查任何兩個來自不同單詞的詞義在詞網(wǎng)WordNet里的關(guān)系,如果它們被詞網(wǎng)WordNet里的任何關(guān)系相連接,將這兩個相連接的單詞詞義放到對應(yīng)單詞的相關(guān)詞義集合里,并記錄各單詞詞義被選進(jìn)對應(yīng)單詞的相關(guān)詞義集合的次數(shù),這說明在目前本體的上下文,單詞的相關(guān)詞義集合里的任何詞義都有可能是這個單詞的合適詞義;在得到單詞的相關(guān)詞義集合后,在這個集合中選取最有最大詞義值的詞義作為該單詞的合適詞義;詞義值計算方法如下
CV(SynsetA)=WC(SynsetA)x9+FS(SynsetA)其中CV(SynsetA)表示單詞的相關(guān)詞義集合里詞義SynsetA的詞義值; WC(SynsetA)是詞義SynsetA被選進(jìn)相關(guān)詞義集合的次數(shù);FS (SynsetA)是詞義SynsetA在詞網(wǎng)WordNet中的頻率分?jǐn)?shù),φ是一個表示權(quán)重值的實數(shù)。所述步驟4的具體操作內(nèi)容是將步驟3所得到的單詞的合適詞義擴(kuò)展到一組詞義,這組詞義中的每個元素都和該單詞的合適詞義在詞網(wǎng)WordNet中有特殊的關(guān)系,即形容詞起源pertainym關(guān)系、畐Ij詞起源derived_from_adj關(guān)系、誘導(dǎo)derivationally關(guān)系或相關(guān)related關(guān)系;單詞的合適詞義和擴(kuò)展詞義構(gòu)成單詞的可用詞義集合。單詞的擴(kuò)展詞義支持了實體間的潛在關(guān)系,這有助于在現(xiàn)存的上下文包括單詞的所有可能的詞義,并提高本體匹配過程的覆蓋率。所述步驟5的操作包括如下操作步驟(501)建造詞義關(guān)系本體,所述的詞義關(guān)系本體是指不包含任何概念、屬性和個體的本體;(502)得到源本體中單詞的列表,即源本體單詞列表WLS,該列表中的單詞包含其可用詞義集合;(503)得到目標(biāo)本體中單詞的列表,即目標(biāo)本體單詞列表mx該列表中的單詞包含其可用詞義集合;(504)取源本體單詞列表WLS中的單詞,即源單詞WS,并為源單詞WS定義空的信息詞義集合ISS ;(505)取源單詞WS的可用詞義集合中的詞義,即源詞義SS ;(506)取目標(biāo)本體單詞列表W^T中的單詞,即目標(biāo)單詞WT,并為WT定義空的信息詞義集合ISS ;(507)取目標(biāo)單詞WT的可用詞義集合中的詞義,即目標(biāo)詞義ST;(508)查詢源詞義SS與目標(biāo)詞義ST在詞網(wǎng)WordNet中的關(guān)系,如關(guān)系存在則建立相應(yīng)公理并插入詞義關(guān)系本體,否則轉(zhuǎn)到步驟509 ;如果源詞義SS未出現(xiàn)在源單詞WS的信息詞義集合ISS中,則添加源詞義SS到源單詞WS的信息詞義集合ISS ;如目標(biāo)詞義ST未出現(xiàn)在目標(biāo)單詞WT的信息詞義集合ISS中,則添加目標(biāo)詞義ST到目標(biāo)單詞WT的信息詞義集合ISS中;(509)轉(zhuǎn)到步驟507直到遍歷完目標(biāo)單詞WT的可用詞義集合中的詞義;(510)轉(zhuǎn)到步驟506直到遍歷完目標(biāo)本體單詞列表W^T中的單詞;(511)轉(zhuǎn)到步驟505直到遍歷完源單詞WS的可用詞義集合中的詞義;(512)轉(zhuǎn)到步驟504直到遍歷完源本體單詞列表W^S中的單詞。所述的步驟508中建立公理的具體方法是首先定義源詞義SS和目標(biāo)詞義ST為詞義關(guān)系本體中的概念;然后根據(jù)詞網(wǎng)WordNet關(guān)系和類公理之間的六條轉(zhuǎn)化規(guī)則定義源詞義SS和目標(biāo)詞義ST之間的類公理。所述的六條轉(zhuǎn)化規(guī)則具體是上位詞關(guān)系Hypemym-父類公理SupClassAxiom轉(zhuǎn)化規(guī)則、下位詞關(guān)系Hyponym-子類公理 SubClassAxiom轉(zhuǎn)化規(guī)則、整體部分關(guān)系Holonym-父類公理SupClassAxiom轉(zhuǎn)化規(guī)則、反義關(guān)系A(chǔ)ntonym-不相交公理DisjointClassAxiom轉(zhuǎn)化規(guī)則、近義關(guān)系Similarto-相等公理 EquivalentClassAxiom轉(zhuǎn)化規(guī)則、同級關(guān)系 Coordinate-不相交公理 Dis jointClassAxiom 轉(zhuǎn)化規(guī)則。所述步驟6中源本體和目標(biāo)本體中的實體的詞法信息的構(gòu)建操作具體包括以下步驟(611)得到本體中的實體列表EL,該實體列表EL中的實體包含其標(biāo)簽里的單詞和其評論里的單詞;(612)取實體列表EL中的一個實體EntityA,然后根據(jù)該實體EntityA標(biāo)簽里的單詞和評論里的單詞,按照下式定義實體EntityA的單詞組合方式W(EntityA),
W(EntityA) = je卜=La(EntityA) UCj1(Co(EntityA))^j上式中,La(EntityA)表示來自實體EntityA的標(biāo)簽里除停詞之外的所有單詞的集合;Co (EntityA)表示來自實體EntityA的評論里除停詞之外的所有單詞的集合,該集合的大小用η表示;Cj1 (Co (EntityA))表示一個集合,該集合中的每個元素是在Co(EntityA) 的η個元素中選i個得到的,其中i是一個大于等于O且小于等于η的整數(shù);符號I1J表示將兩個集合合并為一個集合;符號 表示形成一個新的集合,該集合的每個元素包含 La(EntityA)的所有元素和Σ〖UCj1 (Co(EntityA))中某個元素中的所有元素,并且刪掉重復(fù)的單詞;這樣W(EntityA)中的每個元素包括實體EntityA標(biāo)簽里的所有單詞和評論里的若干個單詞;所述的停詞(stop words)是指在本體上下文中沒有任何意義的單詞;(613)按照下式定義實體EntityA的詞法信息表示C (EntityA),
權(quán)利要求
1.一種用于本體匹配的本體詞法分析方法,其特征在于所述方法包括下列操作步驟(1)將待匹配的兩個本體分別定為源本體和目標(biāo)本體;(2)將源本體和目標(biāo)本體中所有實體標(biāo)簽里的字符串以及評論里的字符串切為單詞;(3)根據(jù)源本體的上下文找到源本體中單詞的合適詞義,根據(jù)目標(biāo)本體的上下文找到目標(biāo)本體中單詞的合適詞義;(4)對源本體和目標(biāo)本體中單詞的合適詞義進(jìn)行擴(kuò)展;(5)構(gòu)建詞義關(guān)系本體;(6)根據(jù)源本體和目標(biāo)本體中實體的標(biāo)簽和評論中的單詞的合適詞義及該詞義擴(kuò)展構(gòu)建所述源本體和目標(biāo)本體中的實體的詞法信息。
2.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于所述步驟2的具體操作內(nèi)容是將源本體和目標(biāo)本體中實體標(biāo)簽和評論里的字符串分解成單詞,并處理單詞的復(fù)數(shù)、過去時、現(xiàn)在時等情況。
3.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于所述步驟3的具體操作內(nèi)容是首先獲得本體中每個單詞在詞網(wǎng)WordNet中的所有詞義,檢查任何兩個來自不同單詞的詞義在詞網(wǎng)WordNet里的關(guān)系,如果它們被詞網(wǎng)WordNet里的任何關(guān)系相連接,將這兩個相連接的單詞詞義放到對應(yīng)單詞的相關(guān)詞義集合里,并記錄各單詞詞義被選進(jìn)對應(yīng)單詞的相關(guān)詞義集合的次數(shù),這說明在目前本體的上下文,單詞的相關(guān)詞義集合里的任何詞義都有可能是這個單詞的合適詞義;在得到單詞的相關(guān)詞義集合后,在這個集合中選取最有最大詞義值的詞義作為該單詞的合適詞義;詞義值計算方法如下CV(SynsetA)=WC(SynsetA)xcp+FS(SynsetA)其中CV(SynsetA)表示單詞的相關(guān)詞義集合里詞義SynsetA的詞義值;WC(SynsetA) 是詞義SynsetA被選進(jìn)相關(guān)詞義集合的次數(shù);FS (SynsetA)是詞義SynsetA在詞網(wǎng)WordNet 中的頻率分?jǐn)?shù),φ是一個表示權(quán)重值的實數(shù)。
4.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于所述步驟4的具體操作內(nèi)容是將步驟3所得到的單詞的合適詞義擴(kuò)展到一組詞義,這組詞義中的每個元素都和該單詞的合適詞義在詞網(wǎng)WordNet中有特殊的關(guān)系,即形容詞起源pertainym關(guān)系、畐Ij詞起源derived_from_adj關(guān)系、誘導(dǎo)derivationally關(guān)系或相關(guān) related關(guān)系;單詞的合適詞義和擴(kuò)展詞義構(gòu)成單詞的可用詞義集合;單詞的擴(kuò)展詞義支持了實體間的潛在關(guān)系,這有助于在現(xiàn)存的上下文包括單詞的所有可能的詞義,并提高本體匹配過程的覆蓋率。
5.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于所述步驟5的操作包括如下操作步驟(501)建造詞義關(guān)系本體,所述的詞義關(guān)系本體是指不包含任何概念、屬性和個體的本體;(502)得到源本體中單詞的列表,即源本體單詞列表WLS,該列表中的單詞包含其可用詞義集合;(503)得到目標(biāo)本體中單詞的列表,即目標(biāo)本體單詞列表WX該列表中的單詞包含其可用詞義集合;(504)取源本體單詞列表WLS中的單詞,即源單詞WS,并為源單詞WS定義空的信息詞義集合ISS ;(505)取源單詞WS的可用詞義集合中的詞義,即源詞義SS;(506)取目標(biāo)本體單詞列表W^T中的單詞,即目標(biāo)單詞WT,并為WT定義空的信息詞義集合ISS ;(507)取目標(biāo)單詞WT的可用詞義集合中的詞義,即目標(biāo)詞義ST;(508)查詢源詞義SS與目標(biāo)詞義ST在詞網(wǎng)WordNet中的關(guān)系,如關(guān)系存在則建立相應(yīng)公理并插入詞義關(guān)系本體,否則轉(zhuǎn)到步驟509 ;如果源詞義SS未出現(xiàn)在源單詞WS的信息詞義集合ISS中,則添加源詞義SS到源單詞WS的信息詞義集合ISS ;如目標(biāo)詞義ST未出現(xiàn)在目標(biāo)單詞WT的信息詞義集合ISS中,則添加目標(biāo)詞義ST到目標(biāo)單詞WT的信息詞義集合 ISS 中;(509)轉(zhuǎn)到步驟507直到遍歷完目標(biāo)單詞WT的可用詞義集合中的詞義;(510)轉(zhuǎn)到步驟506直到遍歷完目標(biāo)本體單詞列表^^中的單詞;(511)轉(zhuǎn)到步驟505直到遍歷完源單詞WS的可用詞義集合中的詞義;(512)轉(zhuǎn)到步驟504直到遍歷完源本體單詞列表WLS中的單詞;所述的步驟508中建立公理的具體方法是首先定義源詞義SS和目標(biāo)詞義ST為詞義關(guān)系本體中的概念;然后根據(jù)詞網(wǎng)WordNet關(guān)系和類公理之間的六條轉(zhuǎn)化規(guī)則定義源詞義 SS和目標(biāo)詞義ST之間的類公理;所述的六條轉(zhuǎn)化規(guī)則具體是上位詞關(guān)系Hypemym-父類公理SupClassAxiom轉(zhuǎn)化規(guī)則、下位詞關(guān)系Hyponym-子類公理SubClassAxiom轉(zhuǎn)化規(guī)則、 整體部分關(guān)系Holonym-父類公理SupClassAxiom轉(zhuǎn)化規(guī)則、反義關(guān)系A(chǔ)ntonym-不相交公理 DisjointClassAxiom 轉(zhuǎn)化規(guī)則、近義關(guān)系 Similarto-相等公理 EquivalentClassAxiom 轉(zhuǎn)化規(guī)則、同級關(guān)系Coordinate-不相交公理DisjointClassAxiom轉(zhuǎn)化規(guī)則。
6.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于所述步驟6中源本體和目標(biāo)本體中的實體的詞法信息的構(gòu)建操作具體包括以下步驟(611)得到本體中的實體列表EL,該實體列表EL中的實體包含其標(biāo)簽里的單詞和其評論里的單詞;(612)取實體列表EL中的一個實體EntityA,然后根據(jù)該實體EntityA標(biāo)簽里的單詞和評論里的單詞,按照下式定義實體EntityA的單詞組合方式W(EntityA),上式中,La (EntityA)表示來自實體EntityA的標(biāo)簽里除停詞之外的所有單詞的集合; Co(EntityA)表示來自實體EntityA的評論里除停詞之外的所有單詞的集合,該集合的大小用η表示;Cj1 (Co (EntityA))表示一個集合,該集合中的每個元素是在Co (EntityA)的η 個元素中選i個得到的,其中i是一個大于等于O且小于等于η的整數(shù);符號y表示將兩個集合合并為一個集合;符號 表示形成一個新的集合,該集合的每個元素包含La(EntityA) 的所有元素和Si1WCj1 (Co(EntityA))中某個元素中的所有元素,并且刪掉重復(fù)的單詞;這樣W(EntityA)中的每個元素包括實體EntityA標(biāo)簽里的所有單詞和評論里的若干個單詞; 所述的停詞(stop words)是指在本體上下文中沒有任何意義的單詞; (613)按照下式定義實體EntityA的詞法信息表示C (EntityA),
全文摘要
一種用于本體匹配的本體詞法分析方法,包括以下操作步驟(1)將待匹配的兩個本體分別定為源本體和目標(biāo)本體;(2)將源本體和目標(biāo)本體中所有實體標(biāo)簽里的字符串以及評論里的字符串切為單詞;(3)根據(jù)源本體的上下文找到源本體中單詞的合適詞義,根據(jù)目標(biāo)本體的上下文找到目標(biāo)本體中單詞的合適詞義;(4)對源本體和目標(biāo)本體中單詞的合適詞義進(jìn)行擴(kuò)展;(5)構(gòu)建詞義關(guān)系本體;(6)根據(jù)源本體和目標(biāo)本體中實體的標(biāo)簽和評論中的單詞的合適詞義及該詞義擴(kuò)展構(gòu)建所述源本體和目標(biāo)本體中的實體的詞法信息。本發(fā)明方法有助于發(fā)現(xiàn)潛在的實體匹配,提高了本體匹配的覆蓋率和準(zhǔn)確率。
文檔編號G06F17/27GK102508827SQ20111029091
公開日2012年6月20日 申請日期2011年9月29日 優(yōu)先權(quán)日2011年9月29日
發(fā)明者劉秀磊, 廖建新, 張樂劍, 張磊, 徐童, 朱曉民, 李煒, 樊利民, 沈奇威, 王敬宇, 王晶, 王純, 程莉 申請人:北京郵電大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1