本發(fā)明屬于計算機數(shù)據(jù)信息存儲技術(shù)領(lǐng)域,涉及一種基于多層級關(guān)系的分布式數(shù)據(jù)管理方法。
背景技術(shù):在信息系統(tǒng)中,面向的實體對象往往結(jié)構(gòu)復雜,數(shù)據(jù)龐大,呈現(xiàn)多層級,多節(jié)點關(guān)系的特點,而系統(tǒng)復雜性通常也使得系統(tǒng)采用多種、多數(shù)量、不同類型的數(shù)據(jù)庫分布式結(jié)構(gòu),這些特點使得數(shù)據(jù)管理上出現(xiàn)訪問數(shù)據(jù)殘缺,更新數(shù)據(jù)實時性差,數(shù)據(jù)權(quán)限管理漏洞多,數(shù)據(jù)使用效率低下等問題。為了提高復雜信息系統(tǒng)的使用效率,通常采用融合分布式數(shù)據(jù)庫的辦法,使多類型、多數(shù)量的數(shù)據(jù)庫形成統(tǒng)一標準規(guī)范下的整體數(shù)據(jù)庫,這樣就解決了數(shù)據(jù)庫在數(shù)據(jù)冗余與數(shù)據(jù)更新方面的問題,使得數(shù)據(jù)庫形成一個整體,并達到任意讀取的目的。但是數(shù)據(jù)融合后,系統(tǒng)不能體現(xiàn)分布式數(shù)據(jù)系統(tǒng)的特點,使系統(tǒng)的使用效率提升不大,為了使網(wǎng)絡(luò)效率更高,需要使系統(tǒng)數(shù)據(jù)呈現(xiàn)出明顯的結(jié)構(gòu)特征。因此,目前需要一種既能夠保持分布式數(shù)據(jù)庫系統(tǒng)的融合性,又能夠提升系統(tǒng)使用效率的分布式數(shù)據(jù)管理方法。
技術(shù)實現(xiàn)要素:有鑒于此,本發(fā)明的目的在于提供一種基于多層級關(guān)系的分布式數(shù)據(jù)管理方法,該方法采用數(shù)據(jù)庫融合技術(shù)和層次聚類算法對分布式數(shù)據(jù)庫進行處理,從而使復雜系統(tǒng)的數(shù)據(jù)使用效率更高,消除了冗余數(shù)據(jù),達到了更新數(shù)據(jù)準確,層級權(quán)限管理更加清晰的目的。為達到上述目的,本發(fā)明提供如下技術(shù)方案:一種基于多層級關(guān)系的分布式數(shù)據(jù)管理方法,包括以下步驟:步驟一:建立中介層,中介層分別與源數(shù)據(jù)庫和客服端連接;步驟二:將分布式的各源數(shù)據(jù)庫的訪問接口統(tǒng)一規(guī)范,封裝成統(tǒng)一的規(guī)范封裝接口包,在中介層中創(chuàng)建數(shù)據(jù)訪問模塊,將規(guī)范封裝接口包植入數(shù)據(jù)訪問模塊中;步驟三:根據(jù)源數(shù)據(jù)庫信息實現(xiàn)中介層的全局信息同步,在中介層中建立數(shù)據(jù)集成模塊,所述數(shù)據(jù)集成模塊將分布式數(shù)據(jù)庫中的源數(shù)據(jù)形成一體化的信息集成數(shù)據(jù)平臺,形成無間隙無冗余的融合數(shù)據(jù)體;步驟四:在中介層中建立邏輯分層模塊,所述邏輯分層模塊為聯(lián)系實際系統(tǒng)對象的物理分層及實際系統(tǒng)對象的功能邏輯分層;步驟五:在中介層中形成標準對外接口,規(guī)范其應用標準。進一步,步驟二中植入數(shù)據(jù)訪問模塊的規(guī)范封裝接口用于完成數(shù)據(jù)源的添加,刪除,各分布式數(shù)據(jù)源信息的查詢,對分布式數(shù)據(jù)系統(tǒng)的SQL語句查詢。進一步,經(jīng)SQL語句串對底層各數(shù)據(jù)源進行查詢,把結(jié)果集進行類型轉(zhuǎn)換,合并,建立集成規(guī)則,形成讀取數(shù)據(jù)融合協(xié)議,并把融合數(shù)據(jù)返回給用戶,數(shù)據(jù)訪問模塊通過讀取數(shù)據(jù)融合協(xié)議訪問分布式數(shù)據(jù)庫。進一步,步驟三中采用以下方式實現(xiàn)中介層的全局信息規(guī)范同步:在每個節(jié)點的節(jié)點注冊信息中登記數(shù)據(jù)庫待同步的源節(jié)點和目標節(jié)點;依據(jù)所述節(jié)點注冊信息完成源節(jié)點的數(shù)據(jù)庫與目標節(jié)點的數(shù)據(jù)庫之間的數(shù)據(jù)同步。進一步,依據(jù)所述節(jié)點注冊信息完成源節(jié)點的數(shù)據(jù)庫與目標節(jié)點的數(shù)據(jù)庫之間的數(shù)據(jù)同步的具體步驟包括:通過查找源節(jié)點的節(jié)點注冊信息來確定與源節(jié)點同步的目標節(jié)點;完成所述源節(jié)點的數(shù)據(jù)庫向目標節(jié)點的數(shù)據(jù)庫的數(shù)據(jù)同步。進一步,所述數(shù)據(jù)集成模塊用于維持融合數(shù)據(jù)空間和各局部異構(gòu)數(shù)據(jù)源之間的映射關(guān)系,并記錄各數(shù)據(jù)源的物理位置,以保證對分布的各數(shù)據(jù)源的正確訪問。進一步,數(shù)據(jù)集成模塊對各異構(gòu)數(shù)據(jù)表的集成規(guī)則如下:系統(tǒng)只按照表的名字對表進行集成分類,如果兩個數(shù)據(jù)源中具有同名表,那么就認為在融合數(shù)據(jù)系統(tǒng)中這是一個表,即用戶在融合數(shù)據(jù)庫系統(tǒng)中對這個表進行的操作將在底層被映射成對這兩個不同數(shù)據(jù)源同名表的操作。進一步,步驟四中邏輯分層模塊的建立具體包括:建立信息系統(tǒng)的拓撲結(jié)構(gòu)圖;建立拓撲結(jié)構(gòu)圖中節(jié)點;建立節(jié)點間有向關(guān)系邊;建立關(guān)系邊的權(quán)值。進一步,建立拓撲圖時采用多層級聚類算法:定義子圖之間的相似度;圖中每個節(jié)點初始為一個子圖,然后計算每個子圖之間的相似度,將相似度最高的子圖合并成一個子圖;新的子圖作為圖的第二層級結(jié)構(gòu);計算所有子圖的相似度,合并相似度更高的子圖,形成更高級的層級,不斷重復此過程,直到到達分層結(jié)束條件,由此獲得整個圖的多層級結(jié)構(gòu)。進一步,加入動態(tài)聚類的多層級算法,降低圖的層級間的耦合度,提高多層級結(jié)構(gòu)的適應性。本發(fā)明的有益效果在于:本發(fā)明提供的數(shù)據(jù)管理方法簡化了分布式數(shù)據(jù)的管理,降低了數(shù)據(jù)冗余,提高了訪問效率,建立起一種具有通用性,且可擴展的管理體系架構(gòu)。附圖說明為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進行說明:圖1為多層級關(guān)系的分布式數(shù)據(jù)管理系統(tǒng)結(jié)構(gòu)圖;圖2為本發(fā)明所述方法的設(shè)計流程圖。具體實施方式下面將結(jié)合附圖,對本發(fā)明的優(yōu)選實施例進行詳細的描述。圖1為多層級關(guān)系的分布式數(shù)據(jù)管理系統(tǒng)結(jié)構(gòu)圖,圖2為本發(fā)明所述方法的設(shè)計流程圖。本發(fā)明的基于多層級關(guān)系的分布式數(shù)據(jù)管理方法包括以下具體步驟:步驟一:建立中介層,中介層分別與源數(shù)據(jù)庫和客服端連接;步驟二:將分布式的各源數(shù)據(jù)庫的訪問接口統(tǒng)一規(guī)范,封裝成統(tǒng)一的規(guī)范封裝接口包,在中介層中創(chuàng)建數(shù)據(jù)訪問模塊,將規(guī)范封裝接口包植入數(shù)據(jù)訪問模塊中。步驟三:根據(jù)源數(shù)據(jù)庫信息實現(xiàn)中介層的全局信息同步,在中介層中建立數(shù)據(jù)集成模塊,所述數(shù)據(jù)集成模塊將分布式數(shù)據(jù)庫中的源數(shù)據(jù)形成一體化的信息集成數(shù)據(jù)平臺,形成無間隙無冗余的融合數(shù)據(jù)體。步驟四:在中介層中建立邏輯分層模塊,所述邏輯分層模塊為聯(lián)系實際系統(tǒng)對象的物理分層及實際系統(tǒng)對象的功能邏輯分層;步驟五:在中介層中形成標準對外接口,規(guī)范其應用標準。其中,步驟二中植入數(shù)據(jù)訪問模塊的規(guī)范封裝接口用于完成數(shù)據(jù)源的添加,刪除,各分布式數(shù)據(jù)源信息的查詢,對分布式數(shù)據(jù)系統(tǒng)的SQL語句查詢。經(jīng)SQL語句串對底層各數(shù)據(jù)源進行查詢,把結(jié)果集進行類型轉(zhuǎn)換,合并,建立集成規(guī)則,形成讀取數(shù)據(jù)融合協(xié)議,并把融合數(shù)據(jù)返回給用戶,數(shù)據(jù)訪問模塊通過讀取數(shù)據(jù)融合協(xié)議訪問分布式數(shù)據(jù)庫。步驟三中采用以下方式實現(xiàn)中介層的全局信息規(guī)范同步:在每個節(jié)點的節(jié)點注冊信息中登記數(shù)據(jù)庫待同步的源節(jié)點和目標節(jié)點;依據(jù)所述節(jié)點注冊信息完成源節(jié)點的數(shù)據(jù)庫與目標節(jié)點的數(shù)據(jù)庫之間的數(shù)據(jù)同步。依據(jù)所述節(jié)點注冊信息完成源節(jié)點的數(shù)據(jù)庫與目標節(jié)點的數(shù)據(jù)庫之間的數(shù)據(jù)同步的具體步驟包括:通過查找源節(jié)點的節(jié)點注冊信息來確定與源節(jié)點同步的目標節(jié)點;完成所述源節(jié)點的數(shù)據(jù)庫向目標節(jié)點的數(shù)據(jù)庫的數(shù)據(jù)同步。所述數(shù)據(jù)集成模塊用于維持融合數(shù)據(jù)空間和各局部異構(gòu)數(shù)據(jù)源之間的映射關(guān)系,并記錄各數(shù)據(jù)源的物理位置,以保證對分布的各數(shù)據(jù)源的正確訪問。數(shù)據(jù)集成模塊對各異構(gòu)數(shù)據(jù)表的集成規(guī)則如下:系統(tǒng)只按照表的名字對表進行集成分類,如果兩個數(shù)據(jù)源中具有同名表,那么就認為在融合數(shù)據(jù)系統(tǒng)中這是一個表,即用戶在融合數(shù)據(jù)庫系統(tǒng)中對這個表進行的操作將在底層被映射成對這兩個不同數(shù)據(jù)源同名表的操作。步驟四中邏輯分層模塊的建立具體包括:建立信息系統(tǒng)的拓撲結(jié)構(gòu)圖;建立拓撲結(jié)構(gòu)圖中節(jié)點;建立節(jié)點間有向關(guān)系邊;建立關(guān)系邊的權(quán)值。建立拓撲圖時采用多層級聚類算法:定義子圖之間的相似度;圖中每個節(jié)點初始為一個子圖,然后計算每個子圖之間的相似度,將相似度最高的子圖合并成一個子圖;新的子圖作為圖的第二層級結(jié)構(gòu);計算所有子圖的相似度,合并相似度更高的子圖,形成更高級的層級,不斷重復此過程,直到到達分層結(jié)束條件,由此獲得整個圖的多層級結(jié)構(gòu)。同時,在本方法中加入動態(tài)聚類的多層級算法,降低圖的層級間的耦合度,提高多層級結(jié)構(gòu)的適應性。最后說明的是,以上優(yōu)選實施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管通過上述優(yōu)選實施例已經(jīng)對本發(fā)明進行了詳細的描述,但本領(lǐng)域技術(shù)人員應當理解,可以在形式上和細節(jié)上對其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書所限定的范圍。