專利名稱:一種面向rfid物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及與異構(gòu)數(shù)據(jù)集成技術(shù)相關(guān)的網(wǎng)絡(luò)數(shù)據(jù)互聯(lián)技術(shù)領(lǐng)域,特別涉及一種面 向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng)及方法。
背景技術(shù):
設(shè)計人員在構(gòu)建平臺級系統(tǒng)的過程中,往往需要對已有的各種業(yè)務(wù)系統(tǒng)進行有效 地系統(tǒng)集成。由于已有系統(tǒng)之間所使用的數(shù)據(jù)標準和格式可能不一樣,因此,信息共享的關(guān) 鍵問題是如何實現(xiàn)原有系統(tǒng)間的信息交流或數(shù)據(jù)交換。為了有效地構(gòu)建物流公共信息平 臺,充分利用物流通關(guān)已有的信息系統(tǒng)的數(shù)據(jù)資源和服務(wù)資源,往往需要集成供應(yīng)鏈管理 系統(tǒng)、企業(yè)物流系統(tǒng)、倉儲管理系統(tǒng)、電子口岸信息系統(tǒng)以及電子政務(wù)應(yīng)用系統(tǒng)等,使得這 些采用不同數(shù)據(jù)標準的系統(tǒng)能夠方便地進行信息交流。同時,在實現(xiàn)系統(tǒng)集成時需遵循“三 不”原則“不影響企業(yè)的現(xiàn)有系統(tǒng)、不影響企業(yè)的業(yè)務(wù)流程和不影響企業(yè)的實際利益”。為了解決RFID物流行業(yè)中各個職能部門的異構(gòu)數(shù)據(jù)交換這一信息共享的基本 問題,業(yè)界提出了很多方案,較為傳統(tǒng)的解決方案包括采用FTP、EMAIL等傳統(tǒng)傳輸協(xié)議, 或編寫如Web上傳等專用傳輸接口。近年來提出采用分布式組件方式如DC0M/EJB(DC0M, Distributed Component Object Model,分布式組件對象模型;EJB,Enterprise Java Bean,JAVA商業(yè)應(yīng)用組件)、冊I (Remote Methodlnvocation,遠程方法調(diào)用),CORBA (Common Object Request BrokerArchitecture,公共對象請求代理體系結(jié)構(gòu))方式。而目前市面上 主流的關(guān)系型數(shù)據(jù)庫產(chǎn)品紛紛支持以XML(Extensible Markup Language,即可擴展標記語 言)表示的數(shù)據(jù)與數(shù)據(jù)庫數(shù)據(jù)之間的轉(zhuǎn)換和存儲。這些方案均在某一方面擁有獨特的優(yōu) 勢,但也不可避免的存在這樣和那樣的問題。其中都存在下述缺陷第一、系統(tǒng)耦合性強,不 適于松散系統(tǒng)的集成;第二、連接傳輸成本較高,多數(shù)方案需要專門配置以穿越網(wǎng)絡(luò)防火墻 實現(xiàn)互連,個別情況下甚至需要通過專用線路或者特殊連接方式如VPN才能實現(xiàn)互連,其 高昂的成本抑制了應(yīng)用范圍,特別是在異地環(huán)境下的應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的之一在于克服現(xiàn)有技術(shù)的缺點和不足,提供一種面向RFID物流應(yīng) 用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),該系統(tǒng)建立在XML (extensible MarkupLanguage)和Web Service技術(shù)之上,并應(yīng)用于物流行業(yè),它適用于松散系統(tǒng)的集成及信息共享,具有耦合性 低、擴展性好、數(shù)據(jù)轉(zhuǎn)換方式靈活、接入方式快捷低廉和準確性高等優(yōu)點。本發(fā)明的目的之二在于提供一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方 法。本發(fā)明的目的之一是通過下述技術(shù)方案實現(xiàn)的,一種面向RFID物流應(yīng)用的松散 性異構(gòu)數(shù)據(jù)交換系統(tǒng),包括相互連接的數(shù)據(jù)適配模塊和數(shù)據(jù)模式匹配模塊,其中數(shù)據(jù)適配模塊,用于讀取源數(shù)據(jù),把不需要進行關(guān)系模式匹配的數(shù)據(jù)直接轉(zhuǎn)換為用目標數(shù)據(jù)類型表示的數(shù)據(jù);或把需要進行關(guān)系模式匹配的數(shù)據(jù)轉(zhuǎn)換為用通用數(shù)據(jù)類型表 示的數(shù)據(jù),并發(fā)送到數(shù)據(jù)模式匹配模塊進行處理,把數(shù)據(jù)模式匹配模塊處理后的數(shù)據(jù)轉(zhuǎn)換 為用目標數(shù)據(jù)類型表示的數(shù)據(jù);數(shù)據(jù)模式匹配模塊,用于接收數(shù)據(jù)適配模塊發(fā)送的數(shù)據(jù),并對數(shù)據(jù)進行關(guān)系模式 匹配。為更好的實現(xiàn)本發(fā)明,所述數(shù)據(jù)適配模塊包括多個數(shù)據(jù)適配器,所述數(shù)據(jù)適配器 用于將特定類型的源數(shù)據(jù)轉(zhuǎn)換為用特定類型的目標數(shù)據(jù)類型(包含上述通用數(shù)據(jù)類型)表 示的數(shù)據(jù)。優(yōu)選的,所述數(shù)據(jù)模式匹配模塊包括關(guān)系模式樹存儲模塊,用于以通用數(shù)據(jù)類型預(yù)先存儲目標關(guān)系模式樹(即以其為 匹配標準的關(guān)系模式樹);數(shù)據(jù)字典,是預(yù)先定義的一張關(guān)于元數(shù)據(jù)信息的表,用于保存目標關(guān)系模式樹上 每一個標簽的近義詞;匹配度計算模塊,用于根據(jù)數(shù)據(jù)字典,計算源關(guān)系模式樹與目標關(guān)系模式樹的匹 配度,并對匹配的各表字段建立映射關(guān)系;數(shù)據(jù)導(dǎo)入模塊,用于依據(jù)映射關(guān)系,在源關(guān)系模式樹中,將與目標關(guān)系模式樹相匹 配的字段的值保留下來,將該字段值導(dǎo)入到與目標關(guān)系模式樹相應(yīng)的字段中;所述匹配度計算模塊分別與關(guān)系模式樹存儲模塊、數(shù)據(jù)字典和數(shù)據(jù)導(dǎo)入模塊相 連。本發(fā)明的目的之二是通過下述技術(shù)方案實現(xiàn)的,一種面向RFID物流應(yīng)用的松散 性異構(gòu)數(shù)據(jù)交換方法,如圖4所示,包括以下步驟Si.數(shù)據(jù)適配模塊讀取源數(shù)據(jù),進入步驟S2 ;S2.若用戶要求進行關(guān)系模式匹配,則數(shù)據(jù)適配模塊選擇相應(yīng)的數(shù)據(jù)適配器,將源 數(shù)據(jù)自動轉(zhuǎn)換為用通用數(shù)據(jù)類型表示的數(shù)據(jù),并把數(shù)據(jù)發(fā)送到數(shù)據(jù)模式匹配模塊,進入步 驟S3 ;若用戶不要求進行關(guān)系模式匹配,則跳轉(zhuǎn)至步驟S5 ;S3.數(shù)據(jù)模式匹配模塊接收數(shù)據(jù),并對源關(guān)系模式樹與目標關(guān)系模式樹進行關(guān)系 模式匹配,進入步驟S4;S4、若用戶要求將經(jīng)過步驟S3處理的數(shù)據(jù)做數(shù)據(jù)類型的轉(zhuǎn)換,則數(shù)據(jù)模式匹配模 塊將處理后的數(shù)據(jù)發(fā)送到數(shù)據(jù)適配模塊,進入步驟S5 ;否則,直接把數(shù)據(jù)發(fā)送給用戶,跳轉(zhuǎn) 至步驟S6 ;S5、數(shù)據(jù)適配模塊根據(jù)用戶要求,選擇相應(yīng)的數(shù)據(jù)適配器將數(shù)據(jù)轉(zhuǎn)換為用目標數(shù) 據(jù)類型表示的數(shù)據(jù),并發(fā)送給用戶,進入步驟S6 ;S6.異構(gòu)數(shù)據(jù)交換過程結(jié)束。為更好的實現(xiàn)本發(fā)明,所述通用數(shù)據(jù)類型為XML。優(yōu)選的,所述步驟S3具體包括以下步驟步驟S3. 1、計算源關(guān)系模式樹與目標關(guān)系模式樹字段結(jié)點的匹配度,進入步驟 S3. 2 ;步驟S3. 2、計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度,進入步驟 S3. 3 ;
步驟S3. 3、計算源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度,進入步驟 S3. 4 ;步驟S3. 4、若源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度大于或等于管理員 預(yù)設(shè)的閥值,則判斷它們所對應(yīng)的關(guān)系模式在一定程度上是匹配的,對匹配的各表的字段 建立映射關(guān)系,將源數(shù)據(jù)導(dǎo)入到與其相配匹的目標數(shù)據(jù)域中;若兩個關(guān)系模式樹根結(jié)點的 匹配度小于管理員預(yù)設(shè)的閥值,則提示兩個關(guān)系數(shù)據(jù)模式不匹配,不進行數(shù)據(jù)的交換。優(yōu)選的,所述管理員預(yù)設(shè)的閥值為0. 6。優(yōu)選的,所述匹配度的計算步驟具體包括設(shè)隊表示要進行匹配的源結(jié)點,Nt表示要進行匹配的目標結(jié)點,其中所述隊、隊同 為字段結(jié)點、表結(jié)點或數(shù)據(jù)庫的根結(jié)點;步驟a、計算結(jié)點分別在標簽維、屬性維、深度維和結(jié)構(gòu)維的匹配度計算結(jié)點Ns和Nt在標簽維上的匹配度QoMl 先比較他們的標簽是否相同,若相 同則匹配度為1 ;若不相同,則以Nt的標簽為索引去數(shù)據(jù)字典中查找Ns的標簽,若找到,則 說明兩個結(jié)點在標簽維上匹配,Qoi^為1 ;若找不到則說明兩個結(jié)點在標簽維沒有相關(guān)性, Qoml 為 o ;計算結(jié)點隊和隊在屬性維上的匹配度QoMp:屬性是指關(guān)系本體模式中包含的約束 信息,可以是數(shù)據(jù)類型、取值范圍、唯一性、可選性、關(guān)系類型和主(外)鍵約束等;兩個結(jié)點 屬性匹配是指結(jié)點元素的屬性一致;由于把屬性全都當成是字符串處理,所以在屬性維上 兩結(jié)點的匹配度都是1 ;計算結(jié)點Ns和Nt在深度維上的匹配度QoMh 深度是指結(jié)點在關(guān)系模式樹中的深 度,如果待比較的結(jié)點在關(guān)系模式樹中的深度相同,則匹配度為1 ;若不相同,則為O ;計算結(jié)點隊和隊在結(jié)構(gòu)維的匹配度QoMs:實質(zhì)上就是要比較以它們?yōu)楦淖訕涞?匹配度,對于葉子結(jié)點,它們沒有子結(jié)構(gòu),故其在結(jié)構(gòu)維的匹配度為1 ;對于非葉子結(jié)點,其 在結(jié)構(gòu)維的匹配度決定于“平均匹配度”和“配成比率”。結(jié)點的平均匹配度反映了其子結(jié)點匹配“好壞”的情況,通過下式計算
Y QoM (ns, η,)AMD(Ns,N1) = ^ -⑴其中Ns和Nt分別表示要進行匹配的源結(jié)點和目標結(jié)點,ns是Ns的子結(jié)點,它與Nt 的子結(jié)點nt的匹配度最大,且兩子結(jié)點的匹配度大于管理員預(yù)設(shè)的閥值,|Nt|則表示目標 結(jié)點中子結(jié)點的數(shù)目,結(jié)點的平均匹配度的取值范圍是W,l];結(jié)點的配成比率反映了子結(jié)點匹配數(shù)目的情況,通過下式計算
NctMK{Ns,Nt) = —(2)
N,|Λ7|表示目標結(jié)點的子結(jié)點匹配的個數(shù),|Nt|則表示目標結(jié)點中子結(jié)點的數(shù)目,結(jié)
點的配成比率的取值范圍是W,1];所以兩個結(jié)點在結(jié)構(gòu)維上的匹配度為QoMsiNs,N,嚴隊,卿⑷(3)
顯然,兩結(jié)點在結(jié)構(gòu)維上的匹配度的取值范圍是W,l];步驟b、根據(jù)步驟a的計算結(jié)果,計算兩個結(jié)點的匹配度QoM(Ns,Nt) = Wl*QoMl+Wp*QoMp+Ws*QoMs+Wh*QoMh (4)其中QoMl表示要進行匹配的兩個結(jié)點Ns和Nt在標簽維上的匹配度,QoMp表示要 進行匹配的兩個結(jié)點Ns和Nt在屬性維的匹配度,QoMs表示要進行匹配的兩個結(jié)點Ns和Nt 在結(jié)構(gòu)維的匹配度,QoMh表示要進行匹配的兩個結(jié)點Ns和Nt在深度維的匹配度,它們的取 值范圍均為W,l] ;W^表示在計算兩結(jié)點匹配度公式中標簽維度上所占的權(quán)重,Wp表示在計 算兩結(jié)點匹配度公式中屬性維度上所占的權(quán)重,Ws表示在計算兩結(jié)點匹配度公式中結(jié)構(gòu)維 度上所占的權(quán)重,Wh分別表示在計算兩結(jié)點匹配度公式中深度維度上所占的權(quán)重,所述I、 WP、WS、WH由管理員設(shè)置,取值范圍為
,且^、《、1的和為1。其中葉子結(jié)點對應(yīng)數(shù)據(jù)庫中的表的字段,在本異構(gòu)數(shù)據(jù)交換系統(tǒng)中直接關(guān)系到相 應(yīng)的數(shù)據(jù)的傳遞,所以計算匹配度時,分配給標簽維的權(quán)重相對較大。經(jīng)驗上,應(yīng)該分配標 簽維較大的權(quán)重,標簽維權(quán)重占0. 4 0. 6 ;結(jié)構(gòu)維、屬性維作為參考信息,為結(jié)點的匹配提 供輔助信息,兩者權(quán)重占0. 2 0. 3,比較理想;深度維權(quán)重占0. 1 0. 2,較為合適。而對于 根結(jié)點,標簽維的匹配度對結(jié)點匹配度的影響較小,而結(jié)構(gòu)維則顯得更重要一些。所以,在 計算根結(jié)點的匹配度的時候,應(yīng)將標簽維的權(quán)重減小,結(jié)構(gòu)維的權(quán)重加大。根據(jù)實際應(yīng)用中 各個維度的匹配度對結(jié)點匹配度計算的作用大小來設(shè)置權(quán)重,這就是“動態(tài)權(quán)重”的思想。優(yōu)選的,在計算字段或表的匹配度時,所述Wl、Wp、Ws、Wh的取值依次為0. 4,0. 2,0. 3 和 0. 1。優(yōu)選的,在計算數(shù)據(jù)庫根結(jié)點的匹配度時,所述Wl、WP、Ws、Wh的取值依次為0. 1、 0. 2、0· 5 和 0· 2。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果第一、耦合性低,適用于松散系統(tǒng)的集成及信息共享,具有高可用性;因為基于 RFID的物流信息共享涉及到生產(chǎn)、倉儲、運輸、貿(mào)易、保險、金融、稅務(wù)、檢驗檢疫、口岸、海事 和海關(guān)等單位和部門的業(yè)務(wù)數(shù)據(jù),屬于松散系統(tǒng)的集成。正因為如此,本發(fā)明系統(tǒng)采用的是 能夠在廣域網(wǎng)不同節(jié)點的應(yīng)用系統(tǒng)間進行數(shù)據(jù)交換的XML技術(shù)。第二、準確性高采用基于分塊結(jié)構(gòu)思想的動態(tài)權(quán)重的混合模式匹配算法(a hybrid matching algorithm based on block-dividing dynamic weight, HABDDW),由管 理員對四個維度的權(quán)重進行動態(tài)分配,能夠有效、準確地進行關(guān)系模式的匹配。第三、靈活的數(shù)據(jù)轉(zhuǎn)換方式,處理兩類異構(gòu)數(shù)據(jù)對于具有不同數(shù)據(jù)承載方式的異 構(gòu)數(shù)據(jù),可以通過開發(fā)相應(yīng)數(shù)據(jù)適配器來做數(shù)據(jù)類型的轉(zhuǎn)換,其中對于非結(jié)構(gòu)化數(shù)據(jù)(例 如文本數(shù)據(jù)),通過相應(yīng)的數(shù)據(jù)適配器直接將源數(shù)據(jù)類型轉(zhuǎn)換為目標數(shù)據(jù)類型;而對于結(jié) 構(gòu)化數(shù)據(jù),假設(shè)有η種不同數(shù)據(jù)類型的結(jié)構(gòu)化數(shù)據(jù),要實現(xiàn)任意兩種數(shù)據(jù)類型之間的轉(zhuǎn)換, 理論上需要設(shè)計η (η-1)種數(shù)據(jù)適配器,但考慮到XML作為一種通用的存儲和傳輸數(shù)據(jù)的數(shù) 據(jù)類型,可以先把源數(shù)據(jù)類型轉(zhuǎn)換成XML,再由XML轉(zhuǎn)換成目標數(shù)據(jù)類型,這樣就只需設(shè)計 2 (η-1)種數(shù)據(jù)適配器。對于數(shù)據(jù)間具有相同的承載方式,但結(jié)構(gòu)不同或內(nèi)容遵循不同行業(yè) 標準的異構(gòu)數(shù)據(jù),可以通過相應(yīng)的數(shù)據(jù)適配器將源數(shù)據(jù)轉(zhuǎn)換成XML類型,再對其進行關(guān)系 模式的匹配。第四、提供低廉、快捷的接入方式;傳統(tǒng)的技術(shù)在連接傳輸成本上較高,多數(shù)方案需要專門配置以穿越網(wǎng)絡(luò)防火墻實現(xiàn)互連,而Web服務(wù)技術(shù)可以建設(shè)不同網(wǎng)絡(luò)協(xié)同的工作 環(huán)境,并且XML能夠表示數(shù)據(jù)與數(shù)據(jù)庫數(shù)據(jù)之間的轉(zhuǎn)換和存儲,因而為人們尋找一種廉價、 簡單、有效的交換方式提供了技術(shù)基礎(chǔ)。第五、擴展性好;數(shù)據(jù)適配器模塊中的適配器可以根據(jù)需求來設(shè)計,方便添加。第六,采用B/S架構(gòu)設(shè)計,用戶通過客戶端瀏覽器來訪問本系統(tǒng)的服務(wù),實現(xiàn)客戶 端零維護。本發(fā)明的工作原理如下本發(fā)明所要解決的技術(shù)問題是通過異構(gòu)數(shù)據(jù)交換技術(shù)使得各企業(yè)間、不同系統(tǒng) 間的異構(gòu)數(shù)據(jù)實現(xiàn)交換和共享,異構(gòu)數(shù)據(jù)交換系統(tǒng)包括RFID無線射頻技術(shù)、數(shù)據(jù)庫技術(shù)、 XML技術(shù)、Web服務(wù)技術(shù)和網(wǎng)絡(luò)技術(shù)。這些異構(gòu)數(shù)據(jù)可以分為兩類第一類是具有不同 數(shù)據(jù)承載方式的,例如有的使用XML,有的使用普通文本格式,有的使用EDI (Electronic Data Interchange,電子數(shù)據(jù)交換)或者使用 CORBAR(Common Object Request Broker Architecture,公共對象請求代理體系結(jié)構(gòu))方式進行二進制數(shù)據(jù)交換。第二類是數(shù)據(jù)間 具有相同的承載方式,但是具體內(nèi)容具有不同的結(jié)構(gòu),或者是數(shù)據(jù)內(nèi)容遵循不同的行業(yè)標 準,例如都使用XML作為數(shù)據(jù)承載方式,但是里面的內(nèi)容并不具有同樣的結(jié)構(gòu),或者內(nèi)容遵 循不同的標準。例如有兩個書店A和B,書店A的數(shù)據(jù)庫設(shè)計對應(yīng)圖1(a)的關(guān)系模式樹,書 店B的數(shù)據(jù)庫設(shè)計對應(yīng)圖1 (b)的關(guān)系模式樹。由于業(yè)務(wù)擴展的需要書店A收購了書店B, 需要把書店B數(shù)據(jù)庫中的大量數(shù)據(jù)導(dǎo)入到自己的數(shù)據(jù)庫中。觀察圖1的兩個關(guān)系模式,它 們的不同之處在于,表“圖書”比表“出版物”少了一個標識圖書出版時間的名為“年份”的 字段,而表“雇員”則比表“員工”多了一個名為“薪金”的字段,而且兩個關(guān)系模式中雖然相 應(yīng)的字段的意義相同,但是它們的字段名卻不同。對于第一類異構(gòu)數(shù)據(jù),可以通過開發(fā)相應(yīng)的數(shù)據(jù)適配器來做數(shù)據(jù)類型的轉(zhuǎn)換。對 于具有不同數(shù)據(jù)承載方式的異構(gòu)數(shù)據(jù),可以通過開發(fā)相應(yīng)數(shù)據(jù)適配器來做數(shù)據(jù)類型的轉(zhuǎn) 換,其中對于非結(jié)構(gòu)化數(shù)據(jù)(例如文本數(shù)據(jù)),通過相應(yīng)的數(shù)據(jù)適配器直接將源數(shù)據(jù)類型轉(zhuǎn) 換為目標數(shù)據(jù)類型;而對于結(jié)構(gòu)化數(shù)據(jù),假設(shè)有η種不同數(shù)據(jù)類型的結(jié)構(gòu)化數(shù)據(jù),要實現(xiàn)任 意兩種數(shù)據(jù)類型之間的轉(zhuǎn)換,理論上需要設(shè)計n(n-l)種數(shù)據(jù)適配器。而考慮到XML作為一 種通用的存儲和傳輸數(shù)據(jù)的數(shù)據(jù)類型,可以先把源數(shù)據(jù)類型轉(zhuǎn)換成XML,再由XML轉(zhuǎn)換成目 標數(shù)據(jù)類型,這樣就只需設(shè)計2 (n-1)種數(shù)據(jù)適配器,如圖2所示。對于第二種類型的異構(gòu) 數(shù)據(jù),即具有不同結(jié)構(gòu)或行業(yè)標準的數(shù)據(jù)的轉(zhuǎn)換,是異構(gòu)數(shù)據(jù)交換的難點所在,也是本發(fā)明 要解決的技術(shù)問題。需要進行關(guān)系模式的匹配/轉(zhuǎn)換的數(shù)據(jù),可在處理第一類異構(gòu)數(shù)據(jù)的 基礎(chǔ)上,增加關(guān)系模式匹配模塊,對異構(gòu)數(shù)據(jù)的關(guān)系模式進行智能匹配,從而實現(xiàn)異構(gòu)數(shù)據(jù) 的自動交換。
圖1 (a)是書店A關(guān)系模式樹的結(jié)構(gòu)示意圖;圖1 (b)是書店B關(guān)系模式樹的結(jié)構(gòu)示意圖;圖2是數(shù)據(jù)適配模塊的工作原理圖;圖3是實施例一中一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng)的結(jié)構(gòu)示 意圖4是實施例一中一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法的工作流 程圖;圖5(a)是實施例一中的目標關(guān)系模式樹的結(jié)構(gòu)示意圖;圖5(b)是實施例一中的源關(guān)系模式樹的結(jié)構(gòu)示意圖;圖6(a)是實施例二中的目標關(guān)系模式樹的結(jié)構(gòu)示意圖;圖6(b)是實施例二中的源關(guān)系模式樹的結(jié)構(gòu)示意圖。
具體實施例方式下面結(jié)合實施例及附圖,對本發(fā)明作進一步地詳細說明,但本發(fā)明的實施方式不 限于此。實施例一物流企業(yè)通過RFID無線射頻技術(shù)采集到的產(chǎn)品信息存入數(shù)據(jù)庫中,然后通過網(wǎng) 絡(luò)技術(shù)共享到服務(wù)平臺。本實施例的一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng) 采用B/S的架構(gòu)設(shè)計,集成到上述物流服務(wù)平臺中,具有不同數(shù)據(jù)庫系統(tǒng)的各企業(yè)間通過 客戶端瀏覽器來訪問該服務(wù)平臺和查看有關(guān)產(chǎn)品信息,并可通過網(wǎng)頁上提供的相關(guān)操作來 調(diào)用本系統(tǒng)的服務(wù),實現(xiàn)與本地信息的融合和交換。上述一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),如圖3所示,包括數(shù)據(jù)適配模塊,用于讀取源數(shù)據(jù),把不需要進行關(guān)系模式匹配的數(shù)據(jù)直接轉(zhuǎn)換為 用目標數(shù)據(jù)類型表示的數(shù)據(jù),或把需要進行關(guān)系模式匹配的數(shù)據(jù)轉(zhuǎn)換為用通用數(shù)據(jù)類型表 示的數(shù)據(jù),并發(fā)送到數(shù)據(jù)模式匹配模塊進行處理,把數(shù)據(jù)模式匹配模塊處理后的數(shù)據(jù)轉(zhuǎn)換 為用目標數(shù)據(jù)類型表示的數(shù)據(jù);數(shù)據(jù)模式匹配模塊,用于接收數(shù)據(jù)適配模塊發(fā)送的數(shù)據(jù),并對數(shù)據(jù)進行關(guān)系模式 匹配。所述數(shù)據(jù)適配模塊與數(shù)據(jù)模式匹配模塊相連。所述數(shù)據(jù)適配模塊包括多個數(shù)據(jù)適配器,所述數(shù)據(jù)適配器用于將源數(shù)據(jù)轉(zhuǎn)換為用 目標數(shù)據(jù)類型表示的數(shù)據(jù)。所述數(shù)據(jù)模式匹配模塊是基于分塊結(jié)構(gòu)思想的動態(tài)權(quán)重的混合模式匹配算法設(shè) 計的,所述數(shù)據(jù)模式匹配模塊包括關(guān)系模式樹存儲模塊,用于以通用數(shù)據(jù)類型存儲目標關(guān)系模式樹(即作為匹配標 準的關(guān)系模式樹);匹配度計算模塊,用于根據(jù)數(shù)據(jù)字典,計算源關(guān)系模式樹與目標關(guān)系模式樹的匹 配度,并對匹配的各表字段建立映射關(guān)系;數(shù)據(jù)導(dǎo)入模塊,用于依據(jù)映射關(guān)系,在源關(guān)系模式樹中,將與目標關(guān)系模式樹相匹 配的字段的值保留下來,將該字段值導(dǎo)入到與目標關(guān)系模式樹相應(yīng)的字段中;數(shù)據(jù)字典,是預(yù)先定義的一張關(guān)于元數(shù)據(jù)信息的表,用于保存目標關(guān)系模式樹上 每一個標簽的近義詞。例如在表示貨物的實體中,“號碼”和“編號”同義,“名字”和“名稱” 同義。數(shù)據(jù)字典能為模式匹配提供十分有用的信息,它所構(gòu)建的信息應(yīng)盡量全面、詳細,關(guān) 于元數(shù)據(jù)的描述應(yīng)盡量遵從行業(yè)規(guī)范??紤]到自然語言的復(fù)雜性,數(shù)據(jù)字典在構(gòu)建過程中, 應(yīng)考慮以下情況
1)同義詞即幾個單詞表示同一意思,如“空氣”與“天空”之間;2) 一詞多義例如“書”可能表示“書籍”,也可能表示“書信”和“文書”;3)常用詞的縮寫以及特殊縮寫情況。所述匹配度計算模塊分別與關(guān)系模式樹存儲模塊、數(shù)據(jù)字典和數(shù)據(jù)導(dǎo)入模塊相 連。優(yōu)選的,本實施例采用的通用數(shù)據(jù)類型為XML。一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,如圖4所示,包括以下步 驟Si.數(shù)據(jù)適配模塊讀取源數(shù)據(jù),進入步驟S2 ;S2.若用戶要求進行關(guān)系模式匹配,則數(shù)據(jù)適配模塊選擇相應(yīng)的數(shù)據(jù)適配器將源 數(shù)據(jù)自動轉(zhuǎn)換為用通用數(shù)據(jù)類型表示的數(shù)據(jù),并把數(shù)據(jù)發(fā)送到數(shù)據(jù)模式匹配模塊,進入步 驟S3 ;若用戶不要求進行關(guān)系模式匹配,則跳轉(zhuǎn)至步驟S5 ;S3.數(shù)據(jù)模式匹配模塊接收數(shù)據(jù),并對源關(guān)系模式樹與目標關(guān)系模式樹進行關(guān)系 模式匹配,關(guān)系模式匹配過程如下如圖5所示,它們所對應(yīng)的關(guān)系模式數(shù)據(jù)庫都具有三層結(jié)構(gòu),從上至下分為數(shù)據(jù)
庫、表、字段三層結(jié)構(gòu)。考查關(guān)系模式樹,表現(xiàn)其模式的共有四維標簽(label)、結(jié)點的屬性 (properties)、結(jié)點的結(jié)構(gòu)(structure)及結(jié)點所處的深度(level)。其中,標簽、屬性和深 度維的值具有原子屬性,結(jié)構(gòu)維是結(jié)點的所有子結(jié)點的集合,具有復(fù)合值屬性。其中結(jié)構(gòu)維 和深度維反映了關(guān)系模式樹的結(jié)構(gòu),標簽維和屬性維反映了樹結(jié)點的語義。步驟S3. 1、計算源關(guān)系模式樹與目標關(guān)系模式樹字段結(jié)點的匹配度如圖5(a)和圖5(b)所示,計算左樹葉子結(jié)點“物品名稱”和右樹葉子結(jié)點“名稱” 的匹配度,它們對應(yīng)的關(guān)系數(shù)據(jù)庫中的字段。在數(shù)據(jù)字典中查找關(guān)鍵字“物品名稱”,假設(shè)存 在“名稱”這個同義詞,則這兩個結(jié)點在標簽維上的匹配度QoMJ物品名稱,名稱)=1.0; 在本系統(tǒng)中,所有結(jié)點的屬性都為字符串,所以屬性維上的匹配度為QoMp(物品名稱,名稱) =1.0 ;由于是葉子結(jié)點,不具有子結(jié)構(gòu),所以結(jié)構(gòu)維上的匹配度為QoMs(物品名稱,名稱) =1. 0 ;兩個葉子結(jié)點都處于關(guān)系模式樹的第三層,所以深度維上的匹配度為QoMh(物品名 稱,名稱)=1.0。各個維度上的權(quán)重分配,見表1 表 1 根據(jù)公式(4),這兩個結(jié)點的匹配度為QoM(物品名稱,名稱)=0. 4X1. 0+0. 3X1. 0+0. 2X1. 0+0. 1X1. 0 = 1. 0假設(shè)定義的閥值為0.6,若計算出的兩個結(jié)點的匹配度大于這個閥值,則表示匹 配,否則不匹配。由于它們的匹配度大于閥值0.6,所以葉子結(jié)點“物品名稱”和“名稱”是 相匹配的,其匹配度為1.0。
按同樣的方法,計算源關(guān)系模式樹與目標關(guān)系模式樹中各字段結(jié)點的匹配度后, 進入步驟S3. 2 ;步驟S3. 2、計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度如圖5所示,計算左樹結(jié)點“物品”和右樹結(jié)點“貨物”的匹配度,首先計算這兩個 結(jié)點在結(jié)構(gòu)維的匹配度。對于結(jié)點“物品”的子結(jié)點“物品名稱”,分別計算它與結(jié)點“貨物” 的所有子結(jié)點“名稱”、“編碼”、“產(chǎn)地”的匹配度,假設(shè)分別求得QoM(物品名稱,名稱)= 1.0,QoM(物品名稱,編碼)=0.4,QoM(物品名稱,產(chǎn)地)=0. 4,因為“物品名稱”與“名 稱”的匹配度最大,且大于閥值0.6,所以在“貨物”的所有子結(jié)點中,結(jié)點“名稱”與“物品 名稱”最為匹配。同理可求得與“物品”的其它子結(jié)點最為匹相配的“貨物”的子結(jié)點相應(yīng) 的匹配度QoM(編號,編碼)=0.94,QoM(出產(chǎn)地,產(chǎn)地)=0.94。根據(jù)公式(1)AMD (物品,貨物)=(1. 0+0. 94+0. 94) +3 = 0. 96根據(jù)公式(2)MR(物品,貨物)=3 + 3 = 1.0根據(jù)公式(3)QoMs(物品,貨物)=(0. 96+1)+2 = 0. 98在數(shù)據(jù)字典中查找關(guān)鍵字“物品”,假設(shè)存在“貨物”這個同義詞,則這兩個結(jié)點在 標簽維上的相似度為QoMJ物品,貨物)=1.0;在本系統(tǒng)中,所有結(jié)點的屬性都為字符串, 所以屬性維上的相似度為QoMp(物品,貨物)=1.0; “物品”與“貨物”這兩個結(jié)點同處于 第二層(對應(yīng)數(shù)據(jù)庫中的表),所以有QoMh(物品,貨物)=1. O ;根據(jù)公式(1),按照表1的 權(quán)重分配,計算這兩個結(jié)點的匹配度為QoM(物品,貨物)=0. 4X1. 0+0. 2X1. 0+0. 3X0. 98+0. 1X1. O = 0. 994由于它們的匹配度大于閥值0.6,所以結(jié)點“物品”和“貨物”是相匹配的,其匹配 度為0. 994。按同樣的方法,計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度,進入步 驟 S3. 3 ;步驟S3. 3、計算源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配如圖5所示,計算左樹根結(jié)點“通關(guān)物品”與右樹根結(jié)點“通關(guān)貨物”的匹配度,它 們分別對應(yīng)兩個不同的關(guān)系數(shù)據(jù)庫。首先計算這兩個結(jié)點在結(jié)構(gòu)維的匹配度,對于結(jié)點“通關(guān)物品”的子結(jié)點“物品”, 分別計算它與結(jié)點“通關(guān)貨物”的所有子結(jié)點“貨物”、“通關(guān)”、“通關(guān)請求”和“通關(guān)說明”的 匹配度,分別求得QoM(物品,貨物)=0. 994,QoM(物品,通關(guān))=0. 4,QoM(物品,通關(guān)請 求)=0.4,QoM(物品,通關(guān)說明)=0.4。因為“物品”與“貨物”的匹配度最大,且大于 閥值0.6,所以“通關(guān)貨物”的所有子結(jié)點中,結(jié)點“貨物”與“物品”最為匹配。同理可求得 “通關(guān)物品”中其它子結(jié)點與“通關(guān)貨物”最為匹配子結(jié)點的相應(yīng)的匹配度,即QoM(通關(guān)要 求,通關(guān)請求)=0.94,QoM(通關(guān)聲明,通關(guān)說明)=0.94。根據(jù)公式(2):AMD (通關(guān)物品,通關(guān)貨物)=(0. 994+0. 94+0. 94) + 5 = 0. 5748
根據(jù)公式(3)MR (通關(guān)物品,通關(guān)貨物)=3 + 5 = 0.6根據(jù)公式(4)QoMs (通關(guān)物品,通關(guān)貨物)=(0. 5742+0. 6) + 2 = 0. 5874在數(shù)據(jù)字典中查找關(guān)鍵字“通關(guān)物品”,假設(shè)不存在“通關(guān)貨物”這個同義詞,則這 兩個結(jié)點在標簽維上的相似度為QoMJ通關(guān)物品,通關(guān)貨物)=0 ;在本系統(tǒng)中,所有結(jié)點 的屬性都為字符串,所以屬性維上的相似度為QoMP(通關(guān)物品,通關(guān)貨物)=1. 0 ;“通關(guān)物 品”與“通關(guān)貨物”這兩個結(jié)點同處于第一層(對應(yīng)數(shù)據(jù)庫),所以有QoMh(通關(guān)物品,通關(guān) 貨物)=1.0。本實施例中,在計算根節(jié)點時,各維度上的權(quán)重分配,參見表2 表2 在此例中,根據(jù)公式(4),參照表2的權(quán)重分配計算這兩個結(jié)點的匹配度為QoM(通關(guān)物品,通關(guān)貨物)=0. 1X0+0. 2X1. 0+0. 5X0. 5874+0. 2X1. 0 = 0. 6937由于它們的匹配度大于閥值0.6,所以這兩個根結(jié)點是相匹配的,其匹配度為 0. 6937,進入下一步驟。步驟S3. 4、由于源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度大于管理員預(yù)設(shè) 的閥值,則判斷它們所對應(yīng)的關(guān)系模式在一定程度上是匹配的,對匹配的各表的字段建立 映射關(guān)系,將源數(shù)據(jù)導(dǎo)入到與其相配匹的目標數(shù)據(jù)域中;進入步驟S4。S4、若用戶要求將經(jīng)過步驟S3處理的數(shù)據(jù)做數(shù)據(jù)類型的轉(zhuǎn)換,則數(shù)據(jù)模式匹配模 塊把處理后數(shù)據(jù)發(fā)送至數(shù)據(jù)適配模塊,進入步驟S5 ;否則數(shù)據(jù)適配模塊將轉(zhuǎn)換后的數(shù)據(jù)直 接發(fā)送給用戶,跳轉(zhuǎn)至步驟S6。S5、數(shù)據(jù)適配模塊根據(jù)用戶需求選擇相應(yīng)的數(shù)據(jù)適配器將數(shù)據(jù)轉(zhuǎn)換為用目標數(shù)據(jù) 類型表示的數(shù)據(jù),并發(fā)送給用戶,進入步驟S6。S6、異構(gòu)數(shù)據(jù)交換過程結(jié)束。實施例二貨物在運輸過程中,要經(jīng)過不同地區(qū)的海關(guān)。通常,各個海關(guān)的關(guān)于貨物信息的數(shù) 據(jù)庫的關(guān)系模式會有所差異。通過網(wǎng)絡(luò)調(diào)用本系統(tǒng)的服務(wù),各海關(guān)之間可以實現(xiàn)數(shù)據(jù)的融 合和交換。一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),包括數(shù)據(jù)適配模塊,用于讀取源數(shù)據(jù),把不需要進行關(guān)系模式匹配的數(shù)據(jù)直接轉(zhuǎn)換為 用目標數(shù)據(jù)類型表示的數(shù)據(jù),或把需要進行關(guān)系模式匹配的數(shù)據(jù)轉(zhuǎn)換為用通用數(shù)據(jù)類型表 示的數(shù)據(jù),并發(fā)送到數(shù)據(jù)模式匹配模塊進行處理,把數(shù)據(jù)模式匹配模塊處理后的數(shù)據(jù)轉(zhuǎn)換 為用目標數(shù)據(jù)類型表示的數(shù)據(jù);
數(shù)據(jù)模式匹配模塊,用于接收數(shù)據(jù)適配模塊發(fā)送的數(shù)據(jù),并對數(shù)據(jù)進行關(guān)系模式 匹配。。所述數(shù)據(jù)適配模塊與數(shù)據(jù)模式匹配模塊相連。所述數(shù)據(jù)適配模塊包括多個數(shù)據(jù)適配器,所述數(shù)據(jù)適配器用于將源數(shù)據(jù)轉(zhuǎn)換為用 目標數(shù)據(jù)類型表示的數(shù)據(jù)。所述數(shù)據(jù)模式匹配模塊是基于分塊結(jié)構(gòu)思想的動態(tài)權(quán)重的混合模式匹配算法設(shè) 計的,所述數(shù)據(jù)模式匹配模塊包括關(guān)系模式樹存儲模塊,用于以通用數(shù)據(jù)類型存儲目標關(guān)系模式樹(即作為匹配標 準的關(guān)系模式樹);匹配度計算模塊,用于根據(jù)數(shù)據(jù)字典,計算源關(guān)系模式樹與目標關(guān)系模式樹的匹 配度,并對匹配的各表字段建立映射關(guān)系;數(shù)據(jù)導(dǎo)入模塊,用于依據(jù)映射關(guān)系,在源關(guān)系模式樹中,將與目標關(guān)系模式樹相匹 配的字段的值保留下來,將該字段值導(dǎo)入到與目標關(guān)系模式樹相應(yīng)的字段中;數(shù)據(jù)字典,是預(yù)先定義的一張關(guān)于元數(shù)據(jù)信息的表,用于保存目標關(guān)系模式樹上 每一個標簽的近義詞;所述匹配度計算模塊分別與關(guān)系模式樹存儲模塊、數(shù)據(jù)字典和數(shù)據(jù)導(dǎo)入模塊相 連。優(yōu)選的,本實用例采用的通用數(shù)據(jù)類型為XML。一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,包括以下步驟Si.數(shù)據(jù)適配模塊讀取源數(shù)據(jù),進入步驟S2 ;S2.若用戶要求進行關(guān)系模式匹配,則數(shù)據(jù)適配模塊選擇相應(yīng)的數(shù)據(jù)適配器將源 數(shù)據(jù)自動轉(zhuǎn)換為用通用數(shù)據(jù)類型表示的數(shù)據(jù),并把數(shù)據(jù)發(fā)送到數(shù)據(jù)模式匹配模塊,進入步 驟S3 ;若用戶不要求進行關(guān)系模式匹配,則跳轉(zhuǎn)至步驟S5 ;S3.數(shù)據(jù)模式匹配模塊接收數(shù)據(jù),并對源關(guān)系模式樹與目標關(guān)系模式樹進行關(guān)系 模式匹配,關(guān)系模式匹配過程如下如圖6所示,對目標關(guān)系模式樹a與源關(guān)系模式樹b進行關(guān)系模式匹配,過程如 下步驟S3. 1、計算源關(guān)系模式樹與目標關(guān)系模式樹各字段結(jié)點的匹配度如圖6所示,計算左樹葉子結(jié)點“海關(guān)名稱”和右樹葉子結(jié)點“ 口岸海關(guān)”的匹配 度,它們對應(yīng)的關(guān)系數(shù)據(jù)庫中的字段。在數(shù)據(jù)字典中查找關(guān)鍵字“海關(guān)名稱”,假設(shè)存在“口 岸海關(guān)”這個同義詞,則這兩個結(jié)點在標簽維上的相似度QoMJ海關(guān)名稱,口岸海關(guān))= 1.0;在本系統(tǒng)中,所有結(jié)點的屬性都為字符串,所以屬性維上的相似度為QoMp(海關(guān)名稱, 口岸海關(guān))=1.0 ;由于是葉子結(jié)點,不具有子結(jié)構(gòu),所以結(jié)構(gòu)維上的相似度為QoMs(海關(guān)名 稱,口岸海關(guān))=1.0;兩個葉子結(jié)點都處于關(guān)系模式樹的第三層,所以深度維上的相似度 為QoMh(海關(guān)名稱,口岸海關(guān))=1.0。各個維度上的權(quán)重分配,見表1。根據(jù)公式(4),這兩個結(jié)點的匹配度為QoM(海關(guān)名稱,口岸海關(guān))=0. 4X1. 0+0. 3X1. 0+0. 2X1. 0+0. 1X1.0 = 1.0假設(shè)定義的閥值為0.6,若計算出的兩個結(jié)點的匹配度大于這個閥值,則表示匹 配,否則不匹配。由于它們的匹配度大于閥值0.6,所以字段結(jié)點“海關(guān)名稱”和“口岸海關(guān)”是相匹配的,其匹配度為1.0。按同樣的方法,計算源關(guān)系模式樹與目標關(guān)系模式樹中各字段結(jié)點的匹配度后, 進入步驟S3. 2 ;步驟S3. 2、計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度計算結(jié)點“海關(guān)信息”和結(jié)點“通關(guān)貨物”的匹配度。首先計算這兩個結(jié)點在結(jié)構(gòu) 維的匹配度。對于結(jié)點“海關(guān)信息”的子結(jié)點“海關(guān)名稱”,分別計算它與結(jié)點“通關(guān)貨物” 的所有子結(jié)點的匹配度,假設(shè)求得QoM(海關(guān)名稱,口岸海關(guān))=1.0,其匹配度最大,且大于 閥值0.6,所以在結(jié)點“通關(guān)貨物”的所有子結(jié)點中,結(jié)點“ 口岸海關(guān)”與“海關(guān)名稱”最為匹 配。同理可求得結(jié)點“海關(guān)信息”的其它子結(jié)點與“通關(guān)貨物”中子結(jié)點最為匹相配的匹配 度QoM(電話,電話)=1.0。根據(jù)公式(1)AMD (海關(guān)信息,通關(guān)貨物)=(1. 0+1. 0) +5 = 0. 4根據(jù)公式(2)MR (海關(guān)信息,通關(guān)貨物)=2 + 5 = 0.4根據(jù)公式(3)QoMs(海關(guān)信息,通關(guān)貨物)=(0. 4+0. 4)^2 = 0.4在數(shù)據(jù)字典中查找關(guān)鍵字“海關(guān)信息”,假設(shè)不存在“通關(guān)貨物”這個同義詞,則這 兩個結(jié)點在標簽維上的相似度為QoMJ海關(guān)信息,通關(guān)貨物)=0 ;在本系統(tǒng)中,所有結(jié)點的 屬性都為字符串,所以屬性維上的相似度為QoMp(海關(guān)信息,通關(guān)貨物)=1.0 ;“海關(guān)信息” 與“通關(guān)貨物”這兩個結(jié)點同處于第二層(對應(yīng)數(shù)據(jù)庫中的表),所以有QoMH(海關(guān)信息,通 關(guān)貨物)=1. 0 ;根據(jù)公式(1),按照表1的權(quán)重分配,計算這兩個結(jié)點的匹配度為QoM(海關(guān)信息,通關(guān)貨物)=0. 4X0+0. 2X1. 0+0. 3X0. 4+0. 1X1. 0 = 0. 42由于它們的匹配度小于閥值0.6,所以結(jié)點“海關(guān)信息”和“通關(guān)貨物”不匹配的。按同樣的方法,計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度,進入步 驟 S3. 3 ;步驟S3. 3、計算源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度如圖6(a)和圖6(b)所示,計算左樹根結(jié)點“海關(guān)1”與右樹根結(jié)點“海關(guān)2”的匹 配度,它們分別對應(yīng)兩個不同的關(guān)系數(shù)據(jù)庫。首先計算這兩個結(jié)點在結(jié)構(gòu)維的匹配度,對于結(jié)點“海關(guān)1”的子結(jié)點“海關(guān)信息” 和“包裝箱”,分別計算它們與結(jié)點“海關(guān)2”的子結(jié)點“通關(guān)貨物”的匹配度,假設(shè)分別求得 QoM(海關(guān)信息,通關(guān)貨物)=0. 42,QoM(包裝箱,通關(guān)貨物)=0. 5,皆小于閥值0. 6。根據(jù)公式(2)AMD(海關(guān) 1,海關(guān) 2) = (0+0)+2 = 0根據(jù)公式(3)MR (海關(guān) 1,海關(guān) 2) = 0 + 5 = 0根據(jù)公式(4)QoM(海關(guān) 1,海關(guān) 2) = (0+0)+2 = 0在數(shù)據(jù)字典中查找關(guān)鍵字“海關(guān)1”,假設(shè)不存在“海關(guān)2”這個同義詞,則這兩個結(jié) 點在標簽維上的相似度為QoMJ海關(guān)1,海關(guān)2) = 0 ;在本系統(tǒng)中,所有結(jié)點的屬性都為字符串,所以屬性維上的相似度為QoMp(海關(guān)1,海關(guān)2) = 1.0; “海關(guān)1”與“海關(guān)2”這兩個 結(jié)點同處于第一層(對應(yīng)數(shù)據(jù)庫中的表),所以有QoMh(海關(guān)1,海關(guān)2) = 1.0。本實施例中,在計算根節(jié)點時,各維度上所占的權(quán)重,參見表2。在此例中,根據(jù)公 式(4),參照表2的權(quán)重分配計算這兩個結(jié)點的匹配度為QoM (海關(guān) 1,海關(guān) 2) = 0. 1 X 0+0. 2X1. 0+0. 5 X 0+0. 2 X 1. 0 = 0. 4步驟S3. 4、由于它們的匹配度小于閥值0.6,所以這兩個根結(jié)點不匹配,系統(tǒng)提示 其所對應(yīng)的兩個關(guān)系模式數(shù)據(jù)庫不匹配,不進行數(shù)據(jù)的交換,進入步驟S4 ;S4、若用戶要求將經(jīng)過步驟S3處理的數(shù)據(jù)做數(shù)據(jù)類型的轉(zhuǎn)換,則數(shù)據(jù)模式匹配模 塊把處理后數(shù)據(jù)發(fā)送至數(shù)據(jù)適配模塊,進入步驟S5 ;否則數(shù)據(jù)適配模塊將轉(zhuǎn)換后的數(shù)據(jù)直 接發(fā)送給用戶,跳轉(zhuǎn)至步驟S6;S5、數(shù)據(jù)適配模塊根據(jù)用戶需求選擇相應(yīng)的數(shù)據(jù)適配器將數(shù)據(jù)轉(zhuǎn)換為用目標數(shù)據(jù) 類型表示的數(shù)據(jù),并發(fā)送給用戶,進入步驟S6 ;S6、異構(gòu)數(shù)據(jù)交換過程結(jié)束。實施例三在企業(yè)的日常事務(wù)管理中,通常需要處理各種不同數(shù)據(jù)類型的數(shù)據(jù)。例如,有時 候需要將XML的數(shù)據(jù)文件轉(zhuǎn)換成EXCEL表單,或者是將WORD文檔轉(zhuǎn)換成PDF文檔,下面以 WORD文檔轉(zhuǎn)換成PDF文檔為例,采用本實施例中一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù) 交換系統(tǒng)進行說明。一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),包括數(shù)據(jù)適配模塊,用于讀取源數(shù)據(jù),把不需要進行關(guān)系模式匹配的數(shù)據(jù)直接轉(zhuǎn)換為 用目標數(shù)據(jù)類型表示的數(shù)據(jù),或把需要進行關(guān)系模式匹配的數(shù)據(jù)轉(zhuǎn)換為通用數(shù)據(jù)類型,并 發(fā)送到數(shù)據(jù)模式匹配模塊進行處理,把數(shù)據(jù)模式匹配模塊處理后的數(shù)據(jù)轉(zhuǎn)換為用目標數(shù)據(jù) 類型表示的數(shù)據(jù);數(shù)據(jù)模式匹配模塊,用于接收數(shù)據(jù)適配模塊發(fā)送的數(shù)據(jù),并對數(shù)據(jù)進行關(guān)系模式 匹配。所述數(shù)據(jù)適配模塊與數(shù)據(jù)模式匹配模塊相連。所述數(shù)據(jù)適配模塊包括多個數(shù)據(jù)適配器,所述數(shù)據(jù)適配器用于將源數(shù)據(jù)轉(zhuǎn)換為用 目標數(shù)據(jù)類型表示的數(shù)據(jù)。所述數(shù)據(jù)模式匹配模塊是基于分塊結(jié)構(gòu)思想的動態(tài)權(quán)重的混合模式匹配算法設(shè) 計的,所述數(shù)據(jù)模式匹配模塊包括關(guān)系模式樹存儲模塊,用于以通用數(shù)據(jù)類型存儲作為匹配標準的關(guān)系模式樹;匹配度計算模塊,用于根據(jù)數(shù)據(jù)字典,計算源關(guān)系模式樹與目標關(guān)系模式樹的匹 配度,并對匹配的各表字段建立映射關(guān)系;數(shù)據(jù)導(dǎo)入模塊,用于依據(jù)映射關(guān)系,在源關(guān)系模式樹中,將與目標關(guān)系模式樹相匹 配的字段的值保留下來,將該字段值導(dǎo)入到與目標關(guān)系模式樹相應(yīng)的字段中;數(shù)據(jù)字典,是預(yù)先定義的一張關(guān)于元數(shù)據(jù)信息的表,用于保存目標關(guān)系模式樹上 每一個標簽的近義詞;所述匹配度計算模塊分別與關(guān)系模式樹存儲模塊、數(shù)據(jù)字典和數(shù)據(jù)導(dǎo)入模塊相 連。
本實用例采用的通用數(shù)據(jù)類型為XML。上述一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng)的工作過程,包括以下 步驟Si.用戶通過網(wǎng)絡(luò)向本系統(tǒng)提交源數(shù)據(jù),所述源數(shù)據(jù)是以WORD文檔的數(shù)據(jù)類型表 示的數(shù)據(jù),進入步驟S2;S2.用戶選擇數(shù)據(jù)轉(zhuǎn)換方式,要求將WORD文檔轉(zhuǎn)換生PDF文檔,進入步驟S3 ;S3.系統(tǒng)在數(shù)據(jù)適配模塊中選擇相應(yīng)的數(shù)據(jù)適配器將WORD文檔數(shù)據(jù)轉(zhuǎn)換為以PDF 數(shù)據(jù)類型表示的數(shù)據(jù),將轉(zhuǎn)換得到的PDF文檔發(fā)送給客戶。上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受所述實施例的 限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化, 均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),其特征在于,包括相互連接的數(shù)據(jù)適配模塊和數(shù)據(jù)模式匹配模塊,其中數(shù)據(jù)適配模塊,用于讀取源數(shù)據(jù),把不需要進行關(guān)系模式匹配的數(shù)據(jù)直接轉(zhuǎn)換為用目標數(shù)據(jù)類型表示的數(shù)據(jù);或把需要進行關(guān)系模式匹配的數(shù)據(jù)轉(zhuǎn)換為用通用數(shù)據(jù)類型表示的數(shù)據(jù),并發(fā)送到數(shù)據(jù)模式匹配模塊進行處理,把數(shù)據(jù)模式匹配模塊處理后的數(shù)據(jù)轉(zhuǎn)換為用目標數(shù)據(jù)類型表示的數(shù)據(jù);數(shù)據(jù)模式匹配模塊,用于接收數(shù)據(jù)適配模塊發(fā)送的數(shù)據(jù),并對數(shù)據(jù)進行關(guān)系模式匹配。
2.根據(jù)權(quán)利要求1所述一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),其特征在 于,所述數(shù)據(jù)適配模塊包括多個數(shù)據(jù)適配器,所述數(shù)據(jù)適配器用于將源數(shù)據(jù)轉(zhuǎn)換為用目標 數(shù)據(jù)類型表示的數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),其特征在 于,所述數(shù)據(jù)模式匹配模塊包括關(guān)系模式樹存儲模塊,用于以通用數(shù)據(jù)類型預(yù)先存儲目標關(guān)系模式樹;數(shù)據(jù)字典,用于保存目標關(guān)系模式樹上每一個標簽的近義詞;匹配度計算模塊,用于根據(jù)數(shù)據(jù)字典,計算源關(guān)系模式樹與目標關(guān)系模式樹的匹配度, 并對匹配的各表字段建立映射關(guān)系;數(shù)據(jù)導(dǎo)入模塊,用于依據(jù)映射關(guān)系,在源關(guān)系模式樹中,將與目標關(guān)系模式樹相匹配的 字段的值保留下來,將該字段值導(dǎo)入到與目標關(guān)系模式樹相應(yīng)的字段中;所述匹配度計算模塊分別與關(guān)系模式樹存儲模塊、數(shù)據(jù)字典和數(shù)據(jù)導(dǎo)入模塊相連。
4.根據(jù)權(quán)利要求1至3中任一項所述一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換 系統(tǒng)實現(xiàn)面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于,包括以下步驟51.數(shù)據(jù)適配模塊讀取源數(shù)據(jù),進入步驟S2;52.若用戶要求進行關(guān)系模式匹配,則數(shù)據(jù)適配模塊選擇相應(yīng)的數(shù)據(jù)適配器,將源數(shù)據(jù) 轉(zhuǎn)換為用通用數(shù)據(jù)類型表示的數(shù)據(jù),并把數(shù)據(jù)發(fā)送到數(shù)據(jù)模式匹配模塊,進入步驟S3;若 用戶不要求進行關(guān)系模式匹配,則跳轉(zhuǎn)至步驟S5 ;53.數(shù)據(jù)模式匹配模塊接收數(shù)據(jù),并對源關(guān)系模式樹與目標關(guān)系模式樹進行關(guān)系模式 匹配,進入步驟S4 ;54、若用戶要求把經(jīng)過步驟S3處理的數(shù)據(jù)做數(shù)據(jù)類型的轉(zhuǎn)換,則數(shù)據(jù)模式匹配模塊把 處理后的數(shù)據(jù)發(fā)送至數(shù)據(jù)適配模塊,進入步驟S5 ;否則,直接把數(shù)據(jù)發(fā)送給用戶,跳轉(zhuǎn)至步 驟S6 ;55、數(shù)據(jù)適配模塊根據(jù)用戶要求,選擇相應(yīng)的數(shù)據(jù)適配器將數(shù)據(jù)轉(zhuǎn)換為用目標數(shù)據(jù)類 型表示的數(shù)據(jù),并發(fā)送給用戶,進入步驟S6 ;56、異構(gòu)數(shù)據(jù)交換過程結(jié)束。
5.根據(jù)權(quán)利要求4所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 所述通用數(shù)據(jù)類型為XML。
6.根據(jù)權(quán)利要求4所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 所述步驟S3具體包括以下步驟步驟S3. 1、計算源關(guān)系模式樹與目標關(guān)系模式樹字段結(jié)點的匹配度,進入步驟3. 2 ;步驟S3. 2、計算源關(guān)系模式樹與目標關(guān)系模式樹各表結(jié)點的匹配度,進入步驟3. 3 ;步驟S3. 3、計算源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度,進入步驟3. 4 ; 步驟S3. 4、若源關(guān)系模式樹與目標關(guān)系模式樹根結(jié)點的匹配度大于或等于預(yù)設(shè)的閥 值,則判斷它們所對應(yīng)的關(guān)系模式是匹配的,對匹配的各表的字段建立映射關(guān)系,將源數(shù)據(jù) 導(dǎo)入到與其相配匹的目標數(shù)據(jù)域中;若兩個關(guān)系模式樹根結(jié)點的匹配度小于預(yù)設(shè)的閥值, 則提示兩個關(guān)系數(shù)據(jù)模式不匹配,不進行數(shù)據(jù)的交換。
7.根據(jù)權(quán)利要求6所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 所述預(yù)設(shè)的閥值為0.6。
8.根據(jù)權(quán)利要求6所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 所述匹配度的計算步驟具體包括設(shè)隊表示要進行匹配的源結(jié)點,Nt表示要進行匹配的目標結(jié)點,其中所述Ns、Nt同為字 段結(jié)點、表結(jié)點或數(shù)據(jù)庫的根結(jié)點;步驟a、計算結(jié)點分別在標簽維、屬性維、深度維和結(jié)構(gòu)維的匹配度 計算結(jié)點Ns和Nt在標簽維上的匹配度QoM^比較他們的標簽是否相同,若相同則匹配 度為1 ;若不相同,則以Nt的標簽為索引去數(shù)據(jù)字典中查找Ns的標簽,若找到,則說明兩個 結(jié)點在標簽維上匹配,Qoi^為1 ;若找不到則說明兩個結(jié)點在標簽維沒有相關(guān)性,Qoi^為O ; 計算結(jié)點Ns和Nt在屬性維上的匹配度QoMp 由于把屬性全都當成是字符串處理,所以 在屬性維上兩結(jié)點的匹配度都是1 ;計算結(jié)點隊和隊在深度維上的匹配度QOMh:如果待比較的結(jié)點在關(guān)系模式樹中的深度 相同,則匹配度為1 ;若不相同,則為O ;計算結(jié)點隊和隊在結(jié)構(gòu)維的匹配度QoMs:對于葉子結(jié)點,它們沒有子結(jié)構(gòu),其在結(jié)構(gòu)維 的匹配度為1 ;對于非葉子結(jié)點,其在結(jié)構(gòu)維的匹配度決定于“平均匹配度”和“配成比率”; 結(jié)點的平均匹配度通過下式計算AMD(NS ,Nt) = ^~r—-Kl其中Ns和Nt分別表示要進行匹配的源結(jié)點和目標結(jié)點,ns是Ns的子結(jié)點,它與Nt的 子結(jié)點nt的匹配度最大,且兩子結(jié)點的匹配度大于預(yù)設(shè)的閥值,|Nt|則表示目標結(jié)點中子 結(jié)點的數(shù)目,結(jié)點的平均匹配度的取值范圍是W,l]; 結(jié)點的配成比率通過下式計算 N表示目標結(jié)點的子結(jié)點匹配的個數(shù),|Nt|則表示目標結(jié)點中子結(jié)點的數(shù)目,結(jié)點的配成比率的取值范圍是W,1];兩個結(jié)點在結(jié)構(gòu)維上的匹配度為兩結(jié)點在結(jié)構(gòu)維上的匹配度的取值范圍是W,1]; 步驟b、根據(jù)步驟a的計算結(jié)果,計算兩個結(jié)點的匹配度 QoM (Ns,Nt) = Wl*QoMl+Wp*QoMp+Ws*QoMs+Wh*QoMh3其中Qoi^表示要進行匹配的兩個結(jié)點Ns和Nt在標簽維上的匹配度,QoMp表示要進行 匹配的兩個結(jié)點Ns和Nt在屬性維的匹配度,QoMs表示要進行匹配的兩個結(jié)點Ns和Nt在結(jié) 構(gòu)維的匹配度,QoMh表示要進行匹配的兩個結(jié)點Ns和Nt在深度維的匹配度,它們的取值范 圍均為W,l] ;W^表示在計算兩結(jié)點匹配度公式中標簽維度上所占的權(quán)重,Wp表示在計算兩 結(jié)點匹配度公式中屬性維度上所占的權(quán)重,Ws表示在計算兩結(jié)點匹配度公式中結(jié)構(gòu)維度上 所占的權(quán)重,Wh分別表示在計算兩結(jié)點匹配度公式中深度維度上所占的權(quán)重,所述I、WP、 15、%是預(yù)先設(shè)置的,\^、11)、13、111的取值范圍均為
,且1、%、1、%的和為1。
9.根據(jù)權(quán)利要求8所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 在計算字段結(jié)點或表結(jié)點的匹配度時,所述l、WP、Ws、WH的取值依次為0. 4,0. 2,0. 3和0. 1。
10.根據(jù)權(quán)利要求8所述面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,其特征在于, 在計算數(shù)據(jù)庫根結(jié)點的匹配度時,所述1、1[)、13、111的取值依次為0. 1,0. 2,0. 5和0. 2。
全文摘要
本發(fā)明公開了一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換系統(tǒng),包括數(shù)據(jù)適配模塊和數(shù)據(jù)模式匹配模塊。本發(fā)明還公開了一種面向RFID物流應(yīng)用的松散性異構(gòu)數(shù)據(jù)交換方法,包括以下步驟S1.讀取源數(shù)據(jù);S2.若要進行關(guān)系模式匹配,數(shù)據(jù)適配模塊將源數(shù)據(jù)類型轉(zhuǎn)換為通用數(shù)據(jù)類型,并發(fā)至數(shù)據(jù)模式匹配模塊;若否,轉(zhuǎn)至S5;S3.數(shù)據(jù)模式匹配模塊對數(shù)據(jù)做關(guān)系模式匹配;S4.若要做數(shù)據(jù)類型轉(zhuǎn)換,數(shù)據(jù)模式匹配模塊把處理后的數(shù)據(jù)發(fā)至數(shù)據(jù)適配模塊;若否,轉(zhuǎn)至S6;S5.數(shù)據(jù)適配模塊將當前數(shù)據(jù)類型轉(zhuǎn)換為目標數(shù)據(jù)類型;S6.異構(gòu)數(shù)據(jù)交換過程結(jié)束。本發(fā)明具有耦合性低、擴展性好、轉(zhuǎn)換方式靈活、接入方式快捷低廉和準確性高等優(yōu)點。
文檔編號G06F17/30GK101930464SQ201010263019
公開日2010年12月29日 申請日期2010年8月25日 優(yōu)先權(quán)日2010年8月25日
發(fā)明者劉靖, 李科定, 林福娟, 栗粟, 胡春燕, 鄧輝舫, 陳寶云 申請人:華南理工大學(xué)