生成關(guān)系數(shù)據(jù)轉(zhuǎn)換為rdf格式數(shù)據(jù)的映射規(guī)則的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)庫,更具體地,涉及生成關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī) 則的方法和裝置。
【背景技術(shù)】
[0002] 語義網(wǎng)是由萬維網(wǎng)之父Tim Berners-Lee在1998年提出的一個概念。語義網(wǎng) 的核必是讓計算機能力理解文檔中的數(shù)據(jù)和數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,從而使得計算機可W 自動的處理語義網(wǎng)上的信息。語義網(wǎng)的愿景是將全球的數(shù)據(jù)發(fā)布并關(guān)聯(lián)起來。語義網(wǎng)采 用畑F(resource description framework,資源描述框架)來描述數(shù)據(jù)。畑F的基本思想 是:(1)將一切可W在Web上標(biāo)識的事物(具體的或抽象的,存在的或不存的)統(tǒng)稱為"資 源";似用URI (Universal Resource Identifier,通用資源標(biāo)識)來標(biāo)識資源;(3)用屬 性(propedy)和屬性值來描述資源。在RDF中任何表達(dá)式的基本結(jié)構(gòu)是一個Η元組的 集合,每個Η元組由主語,謂語和賓語構(gòu)成。主語對應(yīng)于資源,是可擁有URI的任何事物, 比如http://化pedia. org/resource/化ina ;謂語對應(yīng)于屬性,是擁有名稱的資源,比如 author, firstname ;賓語對應(yīng)于屬性值,可W是字符串或者另外一個資源,比如david或者 http://dbpeida. org/resource/United_States。
[0003] 隨著語義網(wǎng)的快速發(fā)展,越來越多的數(shù)據(jù)提供者和Web應(yīng)用開發(fā)者將數(shù)據(jù)發(fā)布成 RDF的形式,并且與其他數(shù)據(jù)源關(guān)聯(lián)起來,形成巨大的關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)化inked data)。比如 W化ipedia被發(fā)布成DBpedia,IMDB數(shù)據(jù)集,GeoSpacial數(shù)據(jù)集都被發(fā)布成畑F。迄今為止, linked data上共有6化illions的Η兀組。
[0004] 不僅僅是化blic Web,隨著企業(yè)2.0的到來,企業(yè)內(nèi)部也迫切需要越來越多的數(shù) 據(jù)與Web上的數(shù)據(jù)關(guān)聯(lián),從而構(gòu)建更好的應(yīng)用與服務(wù)。而現(xiàn)有的數(shù)據(jù),尤其是企業(yè)內(nèi)部的 數(shù)據(jù),大多數(shù)存在于關(guān)系型數(shù)據(jù)庫中,因此,我們需要一個工具將關(guān)系型數(shù)據(jù)發(fā)布成RDF數(shù) 據(jù)。目前已經(jīng)存在將關(guān)系數(shù)據(jù)發(fā)布成RDF數(shù)據(jù)的工具,例如D2R是使用最廣泛的工具,它包 括D2R服務(wù)器,D2RQ引擎和D2RQ映射語言,D2RQ映射語言的主要功能是定義將關(guān)系型數(shù)據(jù) 轉(zhuǎn)換成RDF格式的映射規(guī)則。然而,根據(jù)映射規(guī)則自動生成的URI沒有任何含義,不能表達(dá) 關(guān)系型數(shù)據(jù)的特征,需要人工手動修改映射規(guī)則,按照修改后的映射規(guī)則能夠表達(dá)關(guān)系型 數(shù)據(jù)的特征,然而對于復(fù)雜的關(guān)系型數(shù)據(jù)庫,通常包含上千個映射規(guī)則,修改映射規(guī)則通常 需要大量繁瑣的人工勞動。
[0005] 因此需要一種自動生成將關(guān)系數(shù)據(jù)轉(zhuǎn)換成RDF格式數(shù)據(jù)的映射規(guī)則的方法。
【發(fā)明內(nèi)容】
[0006] 根據(jù)本發(fā)明的一個方面,提供了生成關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī)則的 方法,包括:獲取第一關(guān)系型數(shù)據(jù)庫中的關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的第一映射規(guī)則,其 中所述第一映射規(guī)則的URI模式表達(dá)了第一關(guān)系型數(shù)據(jù)庫中的關(guān)系數(shù)據(jù)的特征;解析所述 第一映射規(guī)則的URI模式的生成規(guī)則;確定所述第二關(guān)系型數(shù)據(jù)庫的第二關(guān)系模型與所述 第一關(guān)系型數(shù)據(jù)庫的第一關(guān)系模型符合模式匹配;根據(jù)所述生成規(guī)則和所述第一關(guān)系模型 和第二關(guān)系模型的模式匹配的映射關(guān)系生成第二關(guān)系型數(shù)據(jù)庫的所述關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 格式數(shù)據(jù)的第二映射規(guī)則。
[0007] 根據(jù)本發(fā)明的另一個方面,提供了生成關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī)則 的裝置,包括:獲取模塊,被配置為獲取第一關(guān)系型數(shù)據(jù)庫中的關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù) 據(jù)的第一映射規(guī)則,其中所述第一映射規(guī)則的URI模式表達(dá)了第一關(guān)系型數(shù)據(jù)庫中的關(guān)系 數(shù)據(jù)的特征;解析模塊,被配置為解析所述第一映射規(guī)則的URI模式的生成規(guī)則;第一確定 模塊,被配置為確定所述第二關(guān)系型數(shù)據(jù)庫的第二關(guān)系模型與所述第一關(guān)系型數(shù)據(jù)庫的第 一關(guān)系模型符合模式匹配;生成模塊,被配置為根據(jù)所述生成規(guī)則和所述第一關(guān)系模型和 第二關(guān)系模型的模式匹配的映射關(guān)系生成第二關(guān)系型數(shù)據(jù)庫的所述關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 格式數(shù)據(jù)的第二映射規(guī)則。
[0008] 根據(jù)本發(fā)明實施例的生成關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī)則的方法和裝 置,自動生成的映射規(guī)則能夠表達(dá)由關(guān)系數(shù)據(jù)庫中的關(guān)系數(shù)據(jù)轉(zhuǎn)化的RDF格式數(shù)據(jù)的特 征,按照該映射規(guī)則生成的URI,用戶可W很容易的知道所對應(yīng)的RDF數(shù)據(jù)的關(guān)鍵特征和信 息。該映射規(guī)則更符合用戶期望的效果,減輕了用戶對自動生成的映射規(guī)則修改的工作。
【附圖說明】
[0009] 通過結(jié)合附圖對本公開示例性實施方式進(jìn)行更詳細(xì)的描述,本公開的上述W及其 它目的、特征和優(yōu)勢將變得更加明顯,其中,在本公開示例性實施方式中,相同的參考標(biāo)號 通常代表相同部件。
[0010] 圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務(wù)器12的框 圖。
[0011] 圖2示出根據(jù)本發(fā)明實施例的生成關(guān)系型數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī)則的 方法。
[0012] 圖3示出根據(jù)本發(fā)明實施例的解析所述第一映射規(guī)則的URI模式的生成規(guī)則的方 法。
[0013] 圖4示出根據(jù)本發(fā)明實施例的生成第二關(guān)系型數(shù)據(jù)庫的所述關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 格式數(shù)據(jù)的第二映射規(guī)則的方法。
[0014] 圖5示出根據(jù)本發(fā)明實施例的生成關(guān)系型數(shù)據(jù)轉(zhuǎn)換為RDF格式數(shù)據(jù)的映射規(guī)則的 裝置500。
【具體實施方式】
[0015] 下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實施方式。雖然附圖中顯示了本公開 的優(yōu)選實施方式,然而應(yīng)該理解,可W W各種形式實現(xiàn)本公開而不應(yīng)被送里闡述的實施方 式所限制。相反,提供送些實施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的 范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0016] 圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務(wù)器12的框 圖。圖1顯示的計算機系統(tǒng)/服務(wù)器12僅僅是一個示例,不應(yīng)對本發(fā)明實施例的功能和使 用范圍帶來任何限制。
[0017] 如圖1所示,計算機系統(tǒng)/服務(wù)器12 W通用計算設(shè)備的形式表現(xiàn)。計算機系統(tǒng) /服務(wù)器12的組件可W包括但不限于;一個或者多個處理器或者處理單元16,系統(tǒng)存儲器 28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
[0018] 總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器, 外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉 例來說,送些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)總線,微通道體系結(jié)構(gòu)(MAC) 總線,增強型ISA總線、視頻電子標(biāo)準(zhǔn)協(xié)會(VESA)局域總線W及外圍組件互連(PCI)總線。
[0019] 計算機系統(tǒng)/服務(wù)器12典型地包括多種計算機系統(tǒng)可讀介質(zhì)。送些介質(zhì)可W是 任何能夠被計算機系統(tǒng)/服務(wù)器12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動 的和不可移動的介質(zhì)。
[0020] 系統(tǒng)存儲器28可W包括易失性存儲器形式的計算機系統(tǒng)可讀介質(zhì),例如隨機存 取存儲器(RAM) 30和/或高速緩存存儲器32。計算機系統(tǒng)/服務(wù)器12可W進(jìn)一步包括其 它可移動/不可移動的、易失性/非易失性計算機系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34 可W用于讀寫不可移動的、非易失性磁介質(zhì)(圖1未顯示,通常稱為"硬盤驅(qū)動器")。盡管 圖1中未示出,可W提供用于對可移動非易失性磁盤(例如"軟盤")讀寫的磁盤驅(qū)動器, W及對可移動非易失性光盤(例如CD-ROM, DVD-ROM或者其它光介質(zhì))讀寫的光盤驅(qū)動器。 在送些情況下,每個驅(qū)動器可W通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18相連。存儲器28 可W包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,送些程序模 塊被配置W執(zhí)行本發(fā)明各實施例的功能。
[0021] 具有一組(至少一個)程序模塊42的程序/實用工具40,可W存儲在例如存儲器 28中,送樣的程序模塊42包括一但不限于一操作系統(tǒng)、一個或者多個應(yīng)用程序、其它 程序模塊W及程序數(shù)據(jù),送些示例中的每一個或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實現(xiàn)。程 序模塊42通常執(zhí)行本發(fā)明所描述的實施例中的功能和/或方法。
[0022] 計算機系統(tǒng)/服務(wù)器12也可W與一個或多個外部設(shè)備14 (例如鍵盤、指向設(shè)備、 顯示器24等)通信,還可與一個或者多個使得用戶能與該計算機系統(tǒng)/服務(wù)器12交互的 設(shè)備通信,和/或與使得該計算機系統(tǒng)/服務(wù)器12能與一個或多個其它計算設(shè)備進(jìn)行通信 的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。送種通信可W通過輸