亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于修復(fù)不確定本體的方法和設(shè)備的制作方法

文檔序號:6480744閱讀:260來源:國知局
專利名稱:用于修復(fù)不確定本體的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及知識管理、本體(ontology)以及本體的不確定性 (uncertainty)。更具體而言,本發(fā)明涉及用于修復(fù)不確定本體的方法和設(shè)備。
背景技術(shù)
本體是對真實世界中的實體以及實體之間的關(guān)系的描述。但是,在現(xiàn)實情況下,本 體中的很多知識和信息是不確定的。所謂“不確定的本體”意思是本體的正確性是不確定的。本體的不確定性主要來 自于以下原因(1)專家在建立本體時其主觀上具有不確定性,(2)當若干子本體被集成為 一新本體時,原始子本體具有不確定性,以及(3)當利用本體學(xué)習(xí)工具從文本或web學(xué)習(xí)本 體時,自動(或半自動)本體學(xué)習(xí)工具具有不確定性。通常,本體的不確定性越大,其不正 確的可能性越高。如果沒有用于表達不確定性的手段,用戶則無法說明其對本體的了解程度。因此, 在基于本體的應(yīng)用中,需要提供用于應(yīng)對本體不確定性的方法和工具。另外,由于在現(xiàn)實應(yīng)用中多個本體經(jīng)常被集成以構(gòu)造一新本體,因此需要解決多 個本體(尤其是集成的本體)的不確定性問題。在現(xiàn)有技術(shù)中已經(jīng)存在一些分析方法,可用于解決本體的不確定性問題。例如,Sik Chun (Joey) Lam、Jeff Ζ· Pan、Derek Sleeman、WambertoVasconcelos 所發(fā)表的文章"Ontology Inconsistency Handling :Ranking andRewriting and Axioms "(Technical Report AUCS/TR0603, 2006 年 6 月)(下稱“對比文獻 1”)中定義了一 種可信度函數(shù),用來處理不確定的本體。可信度值可以指示用戶對于本體中的公理(axiom) 的正確性的相信程度。可信度最低的公理被刪除而可信度較高的公理被保留。另夕卜,由 Markus Holi 禾口 Eero Hyviinen所發(fā)表的文章“A Method forModeling Uncertainty in Semantic Web Taxonomies”(胃2004,第 296_297 頁)(下稱“對比文獻 2”)也提出一種基于Bayesian網(wǎng)絡(luò)來利用不確定的RDF(S)和OWL本體進行描述和推理的 方法。但是,現(xiàn)有方法存在不可避免的缺陷。例如,上述對比文獻1所提出的方法雖然可 用于解決一個本體的不確定問題,但是其沒有考慮到多個本體的情況。如果兩個或更多個 本體被集成并且它們的公理都被輸入到系統(tǒng),簡單地刪除具有低可信度的公理的做法則不 能得到令人滿意的結(jié)果。這是因為不同的本體可能具有不同的可信度值計算方法,在此情 況下,針對不同本體元素的相同可信度值可能指示不同的可信程度。例如,如果第一本體的 公理具有高可信度值,而第二本體的公理具有低可信度值,那么即使兩種本體的可信度值 是利用不同方法計算出的,第二本體中的大多數(shù)公理也將會被刪除。再比如,假設(shè)公理1的 可信度值高于公理2的可信度值。一般而言,我們認為公理1比公理2更可信。但是,如果 知道公理1來自于僅僅具有初步本體相關(guān)知識的學(xué)生所建立的本體,而公理2來自于由在 本體構(gòu)造方面具有豐富經(jīng)驗的教授所建立的本體,則不能僅僅通過比較兩者的可信度值來直接判斷公理1和2的可信度。另外,對比文獻2利用Bayesian網(wǎng)絡(luò)來表示本體的不確定性。但是,這種方法僅 僅適用于概念級別上的應(yīng)用,尤其適合于表示概念之間的重疊和模糊分類。但是,這種方法 不適用于公理。由此可見,現(xiàn)有方法仍然存在諸多問題而無法很好地解決本體的不確定性問題。 因此,需要開發(fā)一種新型的不確定本體修復(fù)方法,該方法能夠解決多個本體的不確定性問 題,并且可以在概念和公理級別上適用。

發(fā)明內(nèi)容
本發(fā)明提出了用于解決多個本體的不確定性的方法和設(shè)備,通過該方法和設(shè)備, 不同本體的質(zhì)量可以被同時考慮到。根據(jù)本發(fā)明第一方面,提供了一種用于修復(fù)不確定本體的方法,該方法包括輸 入多個不確定本體。然后,針對每個所述不確定本體,獲取該本體的信任概率(trust probability, TP),所述TP用于指示該本體自身的可信程度;計算該本體中每個元素的可 信度因子(confidence factor,CF),所述CF用于指示該元素的可信程度;并且根據(jù)該本體 的TP調(diào)整該本體中每個元素的CF。然后,將多個不確定本體中的每個元素的調(diào)整后的CF 與一預(yù)定閾值相比較,如果一元素的調(diào)整后的CF小于該閾值,則刪除該元素。根據(jù)本發(fā)明第二方面,提供了一種用于修復(fù)不確定本體的設(shè)備,包括輸入裝置, 用于輸入多個不確定本體;元素可信度因子調(diào)整裝置,用于根據(jù)每個所述不確定本體的信 任概率(TP)來調(diào)整該本體中包含的每個元素的可信度因子(CF),其中所述TP用于指示本 體自身的可信程度,所述CF用于指示元素的可信程度;以及本體修復(fù)裝置,用于將多個不 確定本體中的每個元素的調(diào)整后的CF與一預(yù)定閾值相比較,如果一元素的調(diào)整后的CF小 于閾值,則刪除該元素。所述元素調(diào)整裝置可以包含信任概率獲取單元,用于獲取每個本 體的TP ;可信度因子計算單元,用于計算每個元素的CF ;和調(diào)整單元,用于根據(jù)元素所屬本 體的TP來調(diào)整該元素的CF。根據(jù)本發(fā)明,可信度因子CF被定義用于反映本體中的元素(公理或概念)的可信 程度或正確程度,而信任概率TP被定義用于反映本體自身的可信程度或正確程度。然后, 通過根據(jù)元素所屬本體的TP調(diào)整元素的CF,例如將元素的CF與其所屬本體的TP相乘,則 可以計算出該元素的調(diào)整后的CF。最終,考慮所有本體,調(diào)整后的CF低于一預(yù)定閾值的公 理(或概念)將被從本體中刪除。本發(fā)明所提出的不確定本體修復(fù)策略可用于解決多個本體的不確定性問題,這一 點是現(xiàn)有技術(shù)所不具備的優(yōu)勢。另外,本發(fā)明所提出的方法既可適用于概念級別,也可適用 于公理級別。從下面結(jié)合附圖的詳細描述中,可以看出本發(fā)明的其他特征和優(yōu)點。注意,本發(fā)明 并不限于圖中所示的示例或者任何具體的實施例。


結(jié)合附圖,從下面對本發(fā)明實施例的詳細描述,將更好地理解本發(fā)明,附圖中類似 的參考標注指示類似的部分,其中
圖1是示出根據(jù)本發(fā)明實施例的不確定本體修復(fù)設(shè)備100的內(nèi)部結(jié)構(gòu)的框圖;圖2是示出圖1所示不確定本體修復(fù)設(shè)備100的操作示例的流程圖;以及圖3是被用于實現(xiàn)本發(fā)明的計算機系統(tǒng)的示意性框圖。
具體實施例方式為了便于說明,以下先對本申請中所使用的術(shù)語進行簡要介紹。可信度因子(CF)是一種被用于表征本體及其包含的公理的正確性的可信程度的 得分。CF值越高,則表示公理正確的概率越高。CF值可以在專家建立本體時根據(jù)專家建議 獲得,或者利用某些預(yù)定算法來計算。例如,CF可以被表示為0和1之間的數(shù)字,即被表示 為CF=N- W,1],其中N表示本體中所有可能元素(概念或公理)的集合。信任概率(TP)被定義用于反映本體自身的可信程度或正確程度。例如,如果已知 本體T是由多個專家建立的,而本體S是由普通工程師建立的,則可以認為本體T的TP高 于本體S的TP。例如,TP也可以被表示為0和1之間的數(shù)字,即被表示為TP =P —
,其中P表示所有可能本體的集合。圖1是示出根據(jù)本發(fā)明實施例的不確定本體修復(fù)設(shè)備100的內(nèi)部結(jié)構(gòu)的框圖。在圖1中,不確定本體修復(fù)設(shè)備100可以包含輸入裝置101、元素CF調(diào)整裝置102、 元素合并裝置103 (可選的)、本體修復(fù)裝置104和CF存儲器105。另外,相配合地,圖1中 還示出了本體存儲器106、TP存儲器107和修復(fù)本體存儲器108。作為示例,在該實施例中, 元素CF調(diào)整裝置102可以包含可信度因子計算單元1021、信任概率獲取單元1022和調(diào)整 單元1023。圖2是示出圖1所示不確定本體修復(fù)設(shè)備100的操作示例的流程圖。圖2的過程200開始于步驟201,其中輸入裝置101可以從本體存儲器106輸入 多個不確定的本體0= {Α,02,03...}。然后,在步驟202中,首先針對一本體Oi進行操作。 在步驟203中,元素CF調(diào)整裝置102中的信任概率獲取單元1022首先從TP存儲器107獲 取該本體Oi的信任概率(TP》。然后,在步驟204中,元素CF調(diào)整裝置102中的可信度因 子計算單元1021可以計算出該本體Oi中的每個元素(例如概念或公理)的CF值。CF值 的計算方法根據(jù)本體源的不同而有所區(qū)別。有時,CF值可以由建立本體的專家預(yù)先給出, 或者可以根據(jù)自動(或半自動)本體學(xué)習(xí)工具利用某些預(yù)定算法來計算?,F(xiàn)有技術(shù)中已經(jīng) 提出多種方法可被用于計算本體元素的CF值,因此這里不作贅述。然后,在步驟205中,元素CF調(diào)整裝置102中的調(diào)整單元1023可以根據(jù)本體Oi 的TPi對其中包含的各個元素的CF值進行調(diào)整。例如,調(diào)整單元1023可以將每個元素的 CF值與其所屬本體Oi的TPi相乘。然后在步驟206中判斷是否還有未被處理的本體。如 果有,則返回步驟202以對下一本體重復(fù)上述處理。如果所有本體都已被處理過,則可以根 據(jù)各個元素的調(diào)整后的CF值對輸入的多個不確定本體進行修復(fù)。這里,圖1所示的不確定 本體修復(fù)設(shè)備100可以包括可選組件元素合并裝置103,其用于對可能屬于多個不同本體 的同一元素的CF值進行整合。例如,在圖2中,元素合并裝置103可以首先判斷是否存在 屬于不同本體的同一元素(步驟207)。如果有,則在步驟208中,這樣的元素可以被合并為 一個元素,并以該元素在不同本體中利用TP調(diào)整后的多個CF值的平均值(或最大值)作為合并后的元素的最終CF值。然后,在步驟209中,本體修復(fù)裝置104可以將輸入的多個 不確定本體中的所有元素的調(diào)整后的CF值與一預(yù)定閾值TH相比較。如果其CF值小于閾 值,則刪除該元素。CF閾值是預(yù)先確定的,該閾值過低會導(dǎo)致更多不確定的信息被保留,從 而更可能導(dǎo)致本體的不一致。因此,選擇一個“合適”的閾值是在信息量和信息正確程度之 間的一種折衷。然后,在步驟210中,修復(fù)后的各個本體被輸出到修復(fù)本體存儲器108以進 行存儲。圖3是被用于實現(xiàn)本發(fā)明的計算機系統(tǒng)300的示意性框圖。
如圖3所示,該計算機系統(tǒng)300包括CPU 301、用戶接口 302、外圍設(shè)備303、存儲器 305、永久存儲設(shè)備306以及將它們彼此相連的總線304。存儲器305中包含語義web應(yīng)用 3051、不確定本體修復(fù)模塊3052、本體編輯應(yīng)用3053、本體推理應(yīng)用3054、其他應(yīng)用3055和 操作系統(tǒng)(0S)3056等等。本發(fā)明的核心功能主要與不確定本體修復(fù)模塊3052相關(guān),其例 如是圖1所示的不確定本體修復(fù)設(shè)備100。存儲器305中的各個應(yīng)用可以并行運行,以提供 多種不同的功能。永久存儲設(shè)備306可以包含本發(fā)明所涉及的各種存儲器,例如本體存儲 器、TP存儲器、CF存儲器以及修復(fù)本體存儲器等等。上面已經(jīng)描述了根據(jù)本發(fā)明實施例的不確定本體修復(fù)設(shè)備及其操作流程。根據(jù)上 述描述可以看出,本發(fā)明具有以下效果本發(fā)明所提出的不確定本體修復(fù)策略可用于解決多個本體的不確定性問題。另 夕卜,本發(fā)明所提出的方法既可適用于概念級別,也可適用于公理級別。上面已經(jīng)參考附圖描述了根據(jù)本發(fā)明的具體實施例。但是,本發(fā)明并不限于圖中 示出的特定配置和處理。并且,為了簡明起見,這里省略對已知方法技術(shù)的詳細描述。在上 述實施例中,描述和示出了若干具體的步驟作為示例。但是,本發(fā)明的方法過程并不限于所 描述和示出的具體步驟,本領(lǐng)域的技術(shù)人員可以在領(lǐng)會本發(fā)明的精神之后,作出各種改變、 修改和添加,或者改變步驟之間的順序。本發(fā)明的元素可以實現(xiàn)為硬件、軟件、固件或者它們的組合,并且可以用在它們的 系統(tǒng)、子系統(tǒng)、部件或者子部件中。當以軟件方式實現(xiàn)時,本發(fā)明的元素是被用于執(zhí)行所需 任務(wù)的程序或者代碼段。程序或者代碼段可以存儲在機器可讀介質(zhì)中,或者通過載波中攜 帶的數(shù)據(jù)信號在傳輸介質(zhì)或者通信鏈路上傳送。“機器可讀介質(zhì)”可以包括能夠存儲或傳輸 信息的任何介質(zhì)。機器可讀介質(zhì)的例子包括電子電路、半導(dǎo)體存儲器設(shè)備、ROM、閃存、可擦 除ROM(EROM)、軟盤、CD-ROM、光盤、硬盤、光纖介質(zhì)、射頻(RF)鏈路,等等。代碼段可以經(jīng)由 諸如因特網(wǎng)、內(nèi)聯(lián)網(wǎng)等的計算機網(wǎng)絡(luò)被下載。本發(fā)明可以以其他的具體形式實現(xiàn),而不脫離其精神和本質(zhì)特征。例如,特定實施 例中所描述的算法可以被修改,而系統(tǒng)體系結(jié)構(gòu)并不脫離本發(fā)明的基本精神。因此,當前的 實施例在所有方面都被看作是示例性的而非限定性的,本發(fā)明的范圍由所附權(quán)利要求而非 上述描述定義,并且,落入權(quán)利要求的含義和等同物的范圍內(nèi)的全部改變從而都被包括在 本發(fā)明的范圍之中。
權(quán)利要求
一種用于修復(fù)不確定本體的方法,包括輸入多個不確定本體;針對每個所述不確定本體獲取該本體的信任概率,所述信任概率用于指示該本體自身的可信程度;計算該本體中每個元素的可信度因子,所述可信度因子用于指示該元素的可信程度;根據(jù)該本體的信任概率調(diào)整該本體中每個元素的可信度因子;以及將所述多個不確定本體中的每個元素的調(diào)整后的可信度因子與一預(yù)定閾值相比較,如果一元素的調(diào)整后的可信度因子小于所述閾值,則刪除該元素。
2.如權(quán)利要求1所述的方法,其中所述調(diào)整元素的可信度因子的步驟包括 將元素的可信度因子乘以該元素所屬本體的信任概率。
3.如權(quán)利要求1所述的方法,其中所述元素是概念或公理。
4.如權(quán)利要求1所述的方法,還包括判斷是否存在屬于不同本體的同一元素,如果存在,則對該元素根據(jù)不同本體的信任 概率分別調(diào)整后的各個可信度因子取平均值,作為該元素的最終調(diào)整后的可信度因子。
5.如權(quán)利要求1所述的方法,還包括判斷是否存在屬于不同本體的同一元素,如果存在,則選擇該元素根據(jù)不同本體的信 任概率分別調(diào)整后的各個可信度因子中的最大值,作為該元素的最終調(diào)整后的可信度因 子。
6.一種用于修復(fù)不確定本體的設(shè)備,包括 輸入裝置,用于輸入多個不確定本體;元素可信度因子調(diào)整裝置,用于根據(jù)每個所述不確定本體的信任概率來調(diào)整該本體中 包含的每個元素的可信度因子,其中所述信任概率用于指示本體自身的可信程度,所述可 信度因子用于指示元素的可信程度,所述元素調(diào)整裝置包含 信任概率獲取單元,用于獲取每個本體的所述信任概率; 可信度因子計算單元,用于計算每個元素的所述可信度因子;和 調(diào)整單元,用于根據(jù)元素所屬本體的信任概率來調(diào)整該元素的可信度因子;以及 本體修復(fù)裝置,用于將所述多個不確定本體中的每個元素的調(diào)整后的可信度因子與一 預(yù)定閾值相比較,如果一元素的調(diào)整后的可信度因子小于所述閾值,則刪除該元素。
7.如權(quán)利要求6所述的設(shè)備,其中所述調(diào)整單元被配置為將元素的可信度因子乘以該 元素所屬本體的信任概率。
8.如權(quán)利要求6所述的設(shè)備,還包括元素合并裝置,用于判斷是否存在屬于不同本體的同一元素,如果存在,則對該元素根 據(jù)不同本體的信任概率分別調(diào)整后的各個可信度因子取平均值,作為該元素的最終調(diào)整后 的可信度因子。
9.如權(quán)利要求6所述的設(shè)備,還包括元素合并裝置,用于判斷是否存在屬于不同本體的同一元素,如果存在,則選擇該元素 根據(jù)不同本體的信任概率分別調(diào)整后的各個可信度因子中的最大值,作為該元素的最終調(diào) 整后的可信度因子。
全文摘要
本發(fā)明提供了用于修復(fù)不確定本體的方法和設(shè)備。所述方法包括輸入多個不確定本體;針對每個不確定本體,獲取該本體的信任概率(TP),計算該本體中每個元素的可信度因子(CF),并根據(jù)該本體的TP調(diào)整該本體中每個元素的CF;以及將輸入的多個不確定本體中的每個元素的調(diào)整后的CF與一預(yù)定閾值相比較,如果一元素的調(diào)整后的CF小于閾值,則刪除該元素。本發(fā)明所提出的不確定本體修復(fù)策略可用于解決多個本體的不確定性問題,并且既可適用于概念級別,也可適用于公理級別。
文檔編號G06F17/30GK101807182SQ20091000654
公開日2010年8月18日 申請日期2009年2月17日 優(yōu)先權(quán)日2009年2月17日
發(fā)明者劉博 , 李建強, 趙彧 申請人:日電(中國)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1