亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法

文檔序號:6552162閱讀:1362來源:國知局
一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法
【專利摘要】本發(fā)明公開了一種本體模式與關(guān)系數(shù)據(jù)庫模式之間的映射方法,建立RS2O圖作為本體模式和關(guān)系模式的中間模型,將本體和關(guān)系數(shù)據(jù)庫模式均轉(zhuǎn)換為RS2O圖;結(jié)合本體的RS2O圖和關(guān)系數(shù)據(jù)庫模式的RS2O建立對偶連通圖,為對偶連通圖中的映射對加上反向邊構(gòu)建誘導(dǎo)傳播圖;對映射對的相似度進行不動點迭代計算并進行人工反饋,根據(jù)計算結(jié)果匹配得到關(guān)系數(shù)據(jù)庫模式元素與本體元素之間的映射關(guān)系。通過計算獲得候選匹配關(guān)系,經(jīng)人工驗證后,確認匹配關(guān)系,極大的降低了人工代價,在降低映射關(guān)系的獲取難度和時間花費的同時,又有效保證了最終獲得的映射關(guān)系的正確率總是為100%。適用于異構(gòu)關(guān)系數(shù)據(jù)庫之間的數(shù)據(jù)交換、共享和整合。
【專利說明】一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)集成領(lǐng)域,具體涉及一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法。
【背景技術(shù)】
[0002]數(shù)據(jù)庫是以一定方式儲存在一起、能為多個用戶共享、具有盡可能小的冗余度、與應(yīng)用程序彼此獨立的數(shù)據(jù)集合。數(shù)據(jù)庫中的數(shù)據(jù)是從全局觀點出發(fā)建立的,按一定的數(shù)據(jù)模型進行組織、描述和存儲,其結(jié)構(gòu)基于數(shù)據(jù)間的自然聯(lián)系,從而可提供一切必要的存取路徑,且數(shù)據(jù)不再針對某一應(yīng)用,而是面向全組織,具有整體的結(jié)構(gòu)化特征。而數(shù)據(jù)庫存放數(shù)據(jù)的模式也即數(shù)據(jù)模式,是某種特定數(shù)據(jù)模型的一種實現(xiàn),是基于選定的數(shù)據(jù)模型對數(shù)據(jù)進行“型”方面的刻畫,在數(shù)據(jù)庫設(shè)計階段由設(shè)計人員確定;而數(shù)據(jù)庫中存放的數(shù)據(jù)也即“實例”,則是對數(shù)據(jù)“值”方面的描述。當(dāng)前,典型的數(shù)據(jù)模型包括關(guān)系數(shù)據(jù)模型、XML數(shù)據(jù)模型、面向?qū)ο髷?shù)據(jù)模型等。
[0003]隨著信息技術(shù)的發(fā)展,各領(lǐng)域的合作越來越密切,數(shù)據(jù)的互操作性日顯重要。但由于各數(shù)據(jù)源數(shù)據(jù)的自治性,導(dǎo)致各數(shù)據(jù)源的數(shù)據(jù)異構(gòu),包括系統(tǒng)異構(gòu)、模式異構(gòu)和語義異構(gòu)。所謂系統(tǒng)異構(gòu)即數(shù)據(jù)所依賴的應(yīng)用系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)或操作系統(tǒng)之間的不同;模式異構(gòu)即數(shù)據(jù)在存儲模式上的不同;語義異構(gòu)是指對同一現(xiàn)實世界事物進行描述時,數(shù)據(jù)在表達方式或內(nèi)容上的不同。因此,要實現(xiàn)異構(gòu)數(shù)據(jù)庫之間的數(shù)據(jù)共享,需要在不同數(shù)據(jù)模式之間,通過模式匹配找到源數(shù)據(jù)模式與目標數(shù)據(jù)模式之間的關(guān)聯(lián),并利用這些關(guān)聯(lián)進行數(shù)據(jù)轉(zhuǎn)換或查詢。
[0004]隨著語義網(wǎng)的提出和發(fā)展,越來越多的研究人員將本體應(yīng)用于數(shù)據(jù)集成解決語義交互問題。本體的概念起源于哲學(xué)領(lǐng)域,在計算機領(lǐng)域中,引用最為廣泛的定義是Gruber提出的“本體是概念化的明確的規(guī)范說明”。本體的目標是捕獲相關(guān)的領(lǐng)域知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認可的概念術(shù)語,并利用形式化手段給出這些概念術(shù)語及其之間相互聯(lián)系的明確定義。本體構(gòu)成要素也即構(gòu)成本體的基本元素,包括個體也即實例、概念也即類、屬性以及關(guān)系,而關(guān)系通常包含定義域和值域兩部分,這兩部分限定了該關(guān)系所適用的范圍。利用數(shù)據(jù)模式與本體之間映射,一方面可以將數(shù)據(jù)庫中已經(jīng)存在的大量數(shù)據(jù)通過語義網(wǎng)技術(shù)進行發(fā)布和共享;另一方面,可以利用語義網(wǎng)技術(shù)對數(shù)據(jù)源進行語義包裝,為數(shù)據(jù)源提供上下文語義,這利于消除數(shù)據(jù)源之間語義異構(gòu)性,從而增強異構(gòu)數(shù)據(jù)源之間的交互性。
[0005]但本體典型地應(yīng)用場景是建模高級的語義信息,而關(guān)系模型用來描述低粒度水平的句法結(jié)構(gòu),因此,本體模式與關(guān)系數(shù)據(jù)庫模式之間的匹配存在阻抗失配的問題。進一步的講,數(shù)據(jù)庫采用封閉世界假設(shè),數(shù)據(jù)庫模式是針對特定的應(yīng)用而設(shè)計,數(shù)據(jù)庫模式中的約束主要是為了保障數(shù)據(jù)庫中數(shù)據(jù)的完整性,關(guān)系數(shù)據(jù)庫模式通常采用SQL語言進行描述,在關(guān)系數(shù)據(jù)庫模式的關(guān)系和屬性不具備具有繼承層次的表達能力,在數(shù)據(jù)庫中與模式相關(guān)的最重要的推理是查詢包含和依賴最小化;而本體采用開放世界假設(shè),一般用于說明特定領(lǐng)域的概念體系,不依賴于某個具體的應(yīng)用,本體中的約束是為了保障一致性和支持自動推理,本體一般采用基于邏輯的語言進行表達,本體中的概念和聯(lián)系都具有繼承層次的表達能力,本體中的推理主要是包含聯(lián)系推理和概念的可滿足性。
[0006]因此,目前,關(guān)系數(shù)據(jù)庫模式與本體之間映射大部分仍以人工定義方式為主。為了能夠更直觀地構(gòu)建數(shù)據(jù)庫與本體之間的映射,許多項目的研究中都開發(fā)了圖形化的映射工具,可以讓用戶以交互式方式構(gòu)建數(shù)據(jù)庫與本體之間的映射,典型的項目有C0G、DartGrid, VisAVis等,以及申請?zhí)枮?00710156361.5、發(fā)明名稱為本體模式與關(guān)系數(shù)據(jù)庫模式之間語義映射信息的編輯方法的發(fā)明專利。通過人工的方式構(gòu)建映射關(guān)系是最直接的方法,但是人工方法一般只在一些特定領(lǐng)域、特定情況下適用,如果數(shù)據(jù)庫和本體的規(guī)模較大,那么構(gòu)建映射的工作量太大,而且容易出錯。

【發(fā)明內(nèi)容】

[0007]本發(fā)明所要解決的技術(shù)問題是提供一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其能夠縮短建立關(guān)系數(shù)據(jù)庫模式與本體之間映射關(guān)系的難度和時間花費。
[0008]本發(fā)明解決技術(shù)問題所采用的技術(shù)方案是:一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,包括如下步驟:
[0009]建立RS20圖模型,RS20圖的定義為:G= (V, Iblv, ε,Ibl ε),其中,V代表節(jié)點集合,Iblv代表節(jié)點標記集合,ε代表邊集合,Ibl ε代表邊標記集合;
[0010]步驟I)將本體的信息轉(zhuǎn)化為RS20圖Α,其轉(zhuǎn)化包括以下內(nèi)容:
[0011]1-1)初始化RS20圖A,V初始化為{nT},Iblv初始化為{(ητ,Τ)},ε和Ibl ε均初始化為空集;其中ητ和T分別代表表示頂層本體的節(jié)點和節(jié)點標記;
[0012]1-2)為本體的每一個類創(chuàng)建類節(jié)點,類節(jié)點的節(jié)點標記包括其類名;為本體中的每一個屬性創(chuàng)建屬性節(jié)點,屬性節(jié)點的節(jié)點標記包括屬性名;
[0013]1-3)為本體各屬性的每一個定義域和值域創(chuàng)建有向邊;
[0014]對于定義域,有向邊的方向由代表該屬性定義域的類節(jié)點指向該屬性的屬性節(jié)點;對于值域,有向邊的方向由該屬性的屬性節(jié)點指向代表該屬性值域的類節(jié)點;若該屬性的值域為通用值域,則創(chuàng)建一條由該屬性的屬性節(jié)點指向ητ的有向邊;
[0015]若屬性為數(shù)據(jù)屬性,其邊標記包括“val”標記;若屬性為對象屬性,其邊標記包括“ref,,標記;
[0016]步驟2)將關(guān)系數(shù)據(jù)庫模式的信息轉(zhuǎn)化為RS20圖B,其轉(zhuǎn)化包括以下內(nèi)容:
[0017]2-1)初始化圖RS20圖B,其V、Iblv, ε和Ibl ε均初始化為空集;
[0018]2-2)為關(guān)系數(shù)據(jù)庫模式的每一個表創(chuàng)建表節(jié)點并以其表名作為該節(jié)點的節(jié)點標記;為表的每一個列創(chuàng)建列節(jié)點并以其列名作為該節(jié)點的節(jié)點標記;
[0019]2-3)在每一個列的列節(jié)點同其所屬表的表節(jié)點之間創(chuàng)建有向邊,有向邊的方向由代表該列的列節(jié)點指向其所屬表的表節(jié)點,并以“val”作為其邊標記;
[0020]2-4)為表結(jié)構(gòu)的每一個外鍵列創(chuàng)建鍵節(jié)點,并創(chuàng)建兩個邊標記為“ref”的有向邊,兩有向邊分別由代表該外鍵列的列節(jié)點指向該外鍵列所引用的兩個表的表節(jié)點;
[0021]步驟3)對RS20圖A和RS20圖B進行映射匹配:
[0022]3-1)結(jié)合本體的RS20圖A和關(guān)系數(shù)據(jù)庫模式的RS20圖B,建立對偶連通圖PCG,形成映射對和由映射對構(gòu)成的鄰居;
[0023]3-2)為對偶連通圖的鄰居映射對之間加上反向邊,并為每一條邊添加權(quán)值,形成誘導(dǎo)傳播圖,權(quán)值為傳播系數(shù)ω ;
[0024]3-3)在誘導(dǎo)傳播圖中,使用σ (X,y) > O代表映射對(X,y)的節(jié)點x和節(jié)點y之間的相似度,其中X e A,y e B ;基于σ值進行不動點迭代計算;
[0025]在不動點迭代計算過程中,每完成一次所有映射對的相似度不動點迭代計算后,首先對計算結(jié)果進行人工反饋,分別針對計算結(jié)果中接受的映射對和拒絕的映射對的相似度進行賦值;然后對計算結(jié)果進行判定,若計算結(jié)果收斂或達到迭代次數(shù)上限,則完成計算,否則進行下一次的不動點迭代計算;
[0026]完成所有映射對的相似度不動點迭代計算,得到關(guān)系數(shù)據(jù)庫模式元素與本體元素之間的一對一映射關(guān)系。
[0027]進一步的,傳播系數(shù)ω的計算公式如下:
[0028]設(shè)在誘導(dǎo)傳播圖中,邊e由映射對Ii1指向映射對n2,其傳播系數(shù)(60(]^,?)=(score (r^hscore (Ii2)Vout1,其中,Score(Ii1)為 Ii1 映射對節(jié)點間的相似度,score (n2)為n2映射對節(jié)點間的相似度,OUt1為圖中具有相同標記的有向邊的邊數(shù)。
[0029]進一步的,所述步驟3-3)包括如下步驟:
[0030]3-3.1)采用編輯距離算法計算節(jié)點X和節(jié)點I間的編輯距離,并采用最小編輯距離作為兩節(jié)點間的初始化相似度?!?;由?代表第i次迭代后的相似度,公式如下:
【權(quán)利要求】
1.一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其特征在于,包括如下步驟: 建立RS20圖模型,RS20圖的定義為:G= (V, Iblv, ε,Ibl ε),其中,V代表節(jié)點集合,Iblv代表節(jié)點標記集合,ε代表邊集合,Ibl ε代表邊標記集合; 步驟I)將本體的信息轉(zhuǎn)化為RS20圖Α,其轉(zhuǎn)化包括以下內(nèi)容: 1-1)初始化RS20圖Α,V初始化為{nT},Iblv初始化為{(ητ, Τ)},ε和Ibl ε均初始化為空集;其中ητ和T分別代表表示頂層本體的節(jié)點和節(jié)點標記; 1-2)為本體的每一個類創(chuàng)建類節(jié)點,類節(jié)點的節(jié)點標記包括其類名;為本體中的每一個屬性創(chuàng)建屬性節(jié)點,屬性節(jié)點的節(jié)點標記包括屬性名; 1-3)為本體各屬性的每一個定義域和值域創(chuàng)建有向邊; 對于定義域,有向邊的方向由代表該屬性定義域的類節(jié)點指向該屬性的屬性節(jié)點;對于值域,有向邊的方向由該屬性的屬性節(jié)點指向代表該屬性值域的類節(jié)點;若該屬性的值域為通用值域,則創(chuàng)建一條由該屬性的屬性節(jié)點指向ητ的有向邊; 若屬性為數(shù)據(jù)屬性,其邊標記包括“val”標記;若屬性為對象屬性,其邊標記包括“ref,,標記; 步驟2)將關(guān)系數(shù)據(jù)庫模式的信息轉(zhuǎn)化為RS20圖B,其轉(zhuǎn)化包括以下內(nèi)容: 2-1)初始化圖RS20圖B,其V、Iblv,ε和Ibl ε均初始化為空集; 2-2)為關(guān)系數(shù)據(jù)庫模式的每一個表創(chuàng)建表節(jié)點并以其表名作為該節(jié)點的節(jié)點標記;為表的每一個列創(chuàng)建列節(jié)點并以其列名作為該節(jié)點的節(jié)點標記; 2-3)在每一個列的列節(jié)點同其所屬表的表節(jié)點之間創(chuàng)建有向邊,有向邊的方向由代表該列的列節(jié)點指向其所屬表的表節(jié)點,并以“val”作為其邊標記; 2-4)為表結(jié)構(gòu)的每一個外鍵列創(chuàng)建鍵節(jié)點,并創(chuàng)建兩個邊標記為“ref”的有向邊,兩有向邊分別由代表該外鍵列的列節(jié)點指向該外鍵列所引用的兩個表的表節(jié)點; 步驟3)對RS20圖A和RS20圖B進行映射匹配: 3-1)結(jié)合本體的RS20圖A和關(guān)系數(shù)據(jù)庫模式的RS20圖B,建立對偶連通圖PCG,形成映射對和由映射對構(gòu)成的鄰居; 3-2)為對偶連通圖的鄰居映射對之間加上反向邊,并為每一條邊添加權(quán)值,形成誘導(dǎo)傳播圖,權(quán)值為傳播系數(shù)ω ; 3-3)在誘導(dǎo)傳播圖中,使用σ (X,y) ^ O代表映射對(X,y)的節(jié)點x和節(jié)點y之間的相似度,其中X e A,y e B ;基于σ值進行不動點迭代計算; 在不動點迭代計算過程中,每完成一次所有映射對的相似度不動點迭代計算后,首先對計算結(jié)果進行人工反饋,分別針對計算結(jié)果中接受的映射對和拒絕的映射對的相似度進行賦值;然后對計算結(jié)果進行判定,若計算結(jié)果收斂或達到迭代次數(shù)上限,則完成計算,否則進行下一次的不動點迭代計算; 完成所有映射對的相似度不動點迭代計算,得到關(guān)系數(shù)據(jù)庫模式元素與本體元素之間的一對一映射關(guān)系。
2.如權(quán)利要求1所述的一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其特征是在于傳播系數(shù)ω的計算公式如下: 設(shè)在誘導(dǎo)傳播圖中,邊e由映射對1^指向映射對H2,其傳播系數(shù)ω(ηι,η2)=(score (n) *score (Ii2)Vout1,其中,Score(Ii1)為 Ii1 映射對節(jié)點間的相似度,score (n2)為n2映射對節(jié)點間的相似度,OUt1為圖中具有相同標記的有向邊的邊數(shù)。
3.如權(quán)利要求1所述的一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其特征是在于:所述步驟3-3)包括如下步驟: 3-3.1)采用編輯距離算法計算節(jié)點X和節(jié)點y間的編輯距離,并采用最小編輯距離作為兩節(jié)點間的初始化相似度。° ;由Oi代表第i次迭代后的相似度,公式如下:
4.如權(quán)利要求1、2或3所述的一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其特征在于,所述步驟3)之后設(shè)置有步驟4):將關(guān)系數(shù)據(jù)庫模式的元素替換為與其存在映射關(guān)系的本體元素,得到本體化的關(guān)系數(shù)據(jù)庫模式。
5.如權(quán)利要求4所述的一種本體與關(guān)系數(shù)據(jù)庫模式之間的映射方法,其特征在于,在所述步驟4)中將得到的本體化的關(guān)系數(shù)據(jù)庫模式采用XML Schema Definit1n格式進行封裝。
【文檔編號】G06F17/30GK104036048SQ201410314898
【公開日】2014年9月10日 申請日期:2014年7月2日 優(yōu)先權(quán)日:2014年7月2日
【發(fā)明者】羅光春, 田玲, 秦科, 劉貴松, 于善龍 申請人:電子科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1