本發(fā)明涉及計(jì)算機(jī)
技術(shù)領(lǐng)域:
,特別是涉及一種數(shù)據(jù)自動(dòng)交換方法及裝置。
背景技術(shù):
:目前,企業(yè)在生產(chǎn)經(jīng)營(yíng)活動(dòng)中基于不同的業(yè)務(wù)需求通常構(gòu)建有多個(gè)不同的應(yīng)用系統(tǒng),如財(cái)務(wù)系統(tǒng)、企業(yè)生產(chǎn)管理系統(tǒng)等。為了充分利用存儲(chǔ)在不同應(yīng)用系統(tǒng)中的數(shù)據(jù),企業(yè)需要在不同應(yīng)用系統(tǒng)之間進(jìn)行數(shù)據(jù)交換,例如,財(cái)務(wù)系統(tǒng)(目標(biāo)應(yīng)用系統(tǒng))從企業(yè)生產(chǎn)管理系統(tǒng)(源應(yīng)用系統(tǒng))中獲取員工的業(yè)務(wù)數(shù)據(jù)以便計(jì)算該員工獎(jiǎng)金?,F(xiàn)有技術(shù)通常通過(guò)以下方式實(shí)現(xiàn)源應(yīng)用系統(tǒng)和目標(biāo)應(yīng)用系統(tǒng)之間的數(shù)據(jù)交換:首先,由技術(shù)人員預(yù)先對(duì)源應(yīng)用系統(tǒng)和目標(biāo)應(yīng)用系統(tǒng)所對(duì)應(yīng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)結(jié)構(gòu)、類(lèi)型、范圍等數(shù)據(jù)特征進(jìn)行識(shí)別分析,然后建立源應(yīng)用系統(tǒng)中各個(gè)字段的映射關(guān)系,最后,基于上述映射關(guān)系編寫(xiě)數(shù)據(jù)交換的程序,并通過(guò)運(yùn)行該程序?qū)崿F(xiàn)源應(yīng)用系統(tǒng)和目標(biāo)應(yīng)用系統(tǒng)之間的數(shù)據(jù)交換??梢钥闯觯鲜鰯?shù)據(jù)交換過(guò)程需要技術(shù)人員針對(duì)每項(xiàng)源應(yīng)用系統(tǒng)和目標(biāo)應(yīng)用系統(tǒng)進(jìn)行分析編程,當(dāng)技術(shù)人員需要在不同源應(yīng)用系統(tǒng)、目標(biāo)應(yīng)用系統(tǒng)之間進(jìn)行數(shù)據(jù)交換時(shí),就需要多次進(jìn)行上述分析編程過(guò)程,整個(gè)數(shù)據(jù)交換過(guò)程非常繁瑣、耗時(shí)。技術(shù)實(shí)現(xiàn)要素:有鑒于此,提出了本發(fā)明以便提供一種克服上述問(wèn)題或至少部分的解決上述問(wèn)題的一種數(shù)據(jù)自動(dòng)交換方法及裝置。根據(jù)本發(fā)明的一個(gè)方面,提供了一種數(shù)據(jù)自動(dòng)交換方法,主要包括:配置源數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源的數(shù)據(jù)源元數(shù)據(jù);根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集對(duì)應(yīng)的源數(shù)據(jù)集信息結(jié)構(gòu),以及所述源數(shù)據(jù)集中各個(gè)源數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及所述目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì);根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì);從源數(shù)據(jù)源中獲取待交換數(shù)據(jù);根據(jù)所述數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),將所述待交換數(shù)據(jù)加載到所述目標(biāo)數(shù)據(jù)源中。可選的,所述根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì)的步驟包括:按照所述源數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的源數(shù)據(jù)集特征向量;按照所述目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集特征向量;根據(jù)所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集的源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集的目標(biāo)數(shù)據(jù)集特征向量,確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集的相似度;將相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)。可選的,所述根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì)的步驟包括:按照所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定源數(shù)據(jù)項(xiàng)特征向量;按照所述目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定目標(biāo)數(shù)據(jù)項(xiàng)特征向量;根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)。可選的,所述將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)的步驟之前,還包括:識(shí)別所述源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng);將所述源數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)匹配映射對(duì)。可選的,所述數(shù)據(jù)源元數(shù)據(jù)包括:數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)項(xiàng)元數(shù)據(jù);所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyNt},其中key1-Nt為數(shù)據(jù)集信息結(jié)構(gòu)中分解出的Nt個(gè)實(shí)詞文本向量;所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyN,Type,Length},其中key1-Nt為數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)中分解出的N個(gè)實(shí)詞文本向量;所述Type為數(shù)據(jù)項(xiàng)類(lèi)型;所述Length為數(shù)據(jù)項(xiàng)長(zhǎng)度。依據(jù)本發(fā)明的另一方面,還提供了一種數(shù)據(jù)自動(dòng)交換裝置,主要包括:數(shù)據(jù)源元數(shù)據(jù)配置模塊,用于配置源數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源的數(shù)據(jù)源元數(shù)據(jù);第一設(shè)置模塊,用于根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集對(duì)應(yīng)的源數(shù)據(jù)集信息結(jié)構(gòu),以及所述源數(shù)據(jù)集中各個(gè)源數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);第二設(shè)置模塊,用于根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及所述目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);數(shù)據(jù)集匹配模塊,用于根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì);數(shù)據(jù)項(xiàng)匹配模塊,用于根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì);待交換數(shù)據(jù)獲取模塊,用于從源數(shù)據(jù)源中獲取待交換數(shù)據(jù);待交換數(shù)據(jù)加載模塊,用于根據(jù)所述數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),將所述待交換數(shù)據(jù)加載到所述目標(biāo)數(shù)據(jù)源中??蛇x的,所述數(shù)據(jù)集匹配模塊,具體用于按照所述源數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的源數(shù)據(jù)集特征向量;按照所述目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集特征向量;根據(jù)所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集的源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集的目標(biāo)數(shù)據(jù)集特征向量,確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集的相似度;將相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)。可選的,所述數(shù)據(jù)項(xiàng)匹配模塊具體用于按照所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定源數(shù)據(jù)項(xiàng)特征向量;按照所述目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定目標(biāo)數(shù)據(jù)項(xiàng)特征向量;根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)。可選的,所述數(shù)據(jù)項(xiàng)匹配模塊具體包括:第一匹配單元,用于識(shí)別所述源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng);將所述源數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)匹配映射對(duì);第二匹配單元,用于根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的除主鍵數(shù)據(jù)項(xiàng)之外各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)可選的,所述數(shù)據(jù)源元數(shù)據(jù)包括:數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)項(xiàng)元數(shù)據(jù);所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyNt},其中key1-Nt為數(shù)據(jù)集信息結(jié)構(gòu)中分解出的Nt個(gè)實(shí)詞文本向量;所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyN,Type,Length},其中key1-Nt為數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)中分解出的N個(gè)實(shí)詞文本向量;所述Type為數(shù)據(jù)項(xiàng)類(lèi)型;所述Length為數(shù)據(jù)項(xiàng)長(zhǎng)度。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):現(xiàn)有技術(shù)實(shí)現(xiàn)數(shù)據(jù)交換時(shí)需要技術(shù)人員預(yù)先分析源數(shù)據(jù)源和目標(biāo)數(shù)據(jù)源中數(shù)據(jù)集和數(shù)據(jù)項(xiàng)的特征,并通過(guò)編碼的方式將數(shù)據(jù)集和數(shù)據(jù)項(xiàng)之間的映射關(guān)系固化在程序代碼中,不僅耗時(shí)長(zhǎng),使用起來(lái)非常不便。本發(fā)明實(shí)施例通過(guò)設(shè)置數(shù)據(jù)集信息結(jié)構(gòu)和數(shù)據(jù)項(xiàng)信息結(jié)構(gòu),自動(dòng)匹配確定數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),然后將待交換數(shù)據(jù)按照確定的數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì)加載到目標(biāo)數(shù)據(jù)源中,該數(shù)據(jù)交換過(guò)程可無(wú)需技術(shù)人員參與,自動(dòng)完成數(shù)據(jù)的匹配和交換,為用戶節(jié)約了大量時(shí)間。附圖說(shuō)明圖1示出了本發(fā)明的一種數(shù)據(jù)自動(dòng)交換方法實(shí)施例一的步驟流程圖;圖2示出了本發(fā)明的一種數(shù)據(jù)自動(dòng)交換方法實(shí)施例二的步驟流程圖;圖3示出了本發(fā)明一種數(shù)據(jù)自動(dòng)交換裝置實(shí)施例的結(jié)構(gòu)框圖。具體實(shí)施方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。實(shí)施例一參照?qǐng)D1,示出了本發(fā)明的一種數(shù)據(jù)自動(dòng)交換方法實(shí)施例一的步驟流程圖,具體可以包括:步驟101、配置源數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源的數(shù)據(jù)源元數(shù)據(jù);其中,數(shù)據(jù)源是指數(shù)據(jù)的來(lái)源或載體,其具體可以是數(shù)據(jù)庫(kù)、Excel表格文件等,本發(fā)明實(shí)施例對(duì)數(shù)據(jù)源的類(lèi)型不作具體限制。在本發(fā)明實(shí)施例中,將數(shù)據(jù)的集合作為數(shù)據(jù)集,該數(shù)據(jù)集中包含多條獨(dú)立的數(shù)據(jù)記錄,每列為數(shù)據(jù)的公有屬性,該列所對(duì)應(yīng)的字段即數(shù)據(jù)項(xiàng),例如,數(shù)據(jù)庫(kù)中的表和視圖、Excel文件中的表格等。所述源數(shù)據(jù)源或目標(biāo)數(shù)據(jù)源可分別包括若干個(gè)數(shù)據(jù)集和對(duì)應(yīng)的數(shù)據(jù)項(xiàng)。所述數(shù)據(jù)源元數(shù)據(jù)用于描述源數(shù)據(jù)源或目標(biāo)數(shù)據(jù)源,具體可以包括:數(shù)據(jù)源類(lèi)型、數(shù)據(jù)源地址或端口、訪問(wèn)數(shù)據(jù)源所需的用戶名、密匙、數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)項(xiàng)元數(shù)據(jù)等。具體的,所述數(shù)據(jù)源類(lèi)型可以包括:關(guān)系數(shù)據(jù)庫(kù)類(lèi)型、非關(guān)系數(shù)據(jù)庫(kù)類(lèi)型、文件類(lèi)型、服務(wù)接口類(lèi)型。當(dāng)所述數(shù)據(jù)源類(lèi)型為關(guān)系型數(shù)據(jù)庫(kù)類(lèi)型時(shí),所述數(shù)據(jù)源具體可以為Oracle、Mysql等;當(dāng)所述數(shù)據(jù)源類(lèi)型為非關(guān)系型數(shù)據(jù)庫(kù)時(shí),所述數(shù)據(jù)源具體可以為Mongodb、Redis、Hbase等;當(dāng)所述數(shù)據(jù)源類(lèi)型為文件類(lèi)型時(shí),所述數(shù)據(jù)源具體可以為Excel文件、遠(yuǎn)程FTP文件、HDFS文件等;當(dāng)所述數(shù)據(jù)源類(lèi)型為服務(wù)接口類(lèi)型時(shí),所述數(shù)據(jù)源具體可以為WebService、Rest、Thrift等各類(lèi)服務(wù)接口。所述數(shù)據(jù)集元數(shù)據(jù)根據(jù)數(shù)據(jù)源類(lèi)型的不同具體可包括不同的內(nèi)容,例如,當(dāng)數(shù)據(jù)源為關(guān)系型數(shù)據(jù)庫(kù)時(shí),所述數(shù)據(jù)集元數(shù)據(jù)具體可包括數(shù)據(jù)表名、編碼、注釋說(shuō)明等;當(dāng)數(shù)據(jù)源類(lèi)型為Excel文件時(shí),所述數(shù)據(jù)集元數(shù)據(jù)具體可包括工作表(sheet)名等。所述數(shù)據(jù)項(xiàng)元數(shù)據(jù)具體可包括該數(shù)據(jù)項(xiàng)的數(shù)據(jù)項(xiàng)名稱、數(shù)據(jù)項(xiàng)標(biāo)識(shí)、主鍵/外鍵、數(shù)據(jù)項(xiàng)類(lèi)型、數(shù)據(jù)項(xiàng)長(zhǎng)度、數(shù)據(jù)項(xiàng)注釋說(shuō)明等。具體配置所述數(shù)據(jù)源元數(shù)據(jù)時(shí),當(dāng)所述數(shù)據(jù)源為關(guān)系型數(shù)據(jù)庫(kù)時(shí),可直接從關(guān)系型數(shù)據(jù)庫(kù)的元數(shù)據(jù)中獲取信息作為所述數(shù)據(jù)源元數(shù)據(jù);此外,本領(lǐng)域技術(shù)人員可根據(jù)實(shí)際需要使用其他方式設(shè)置數(shù)據(jù)源元數(shù)據(jù)的內(nèi)容,本發(fā)明對(duì)此不作限制。步驟102、根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集對(duì)應(yīng)的源數(shù)據(jù)集信息結(jié)構(gòu),以及所述源數(shù)據(jù)集中各個(gè)源數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);本發(fā)明實(shí)施例中,根據(jù)所述數(shù)據(jù)集元數(shù)據(jù)設(shè)置各個(gè)源/目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的源/目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)。優(yōu)選的,所述源/目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyNt},其中key1-Nt為數(shù)據(jù)集元數(shù)據(jù)中分解出的Nt個(gè)實(shí)詞文本向量,并且還可將所述Nt個(gè)實(shí)詞按首字排序。例如,假設(shè)Nt=3,key1為數(shù)據(jù)集名稱,key2為數(shù)據(jù)集編碼,key3為數(shù)據(jù)集描述信息。進(jìn)一步的,根據(jù)數(shù)據(jù)項(xiàng)元數(shù)據(jù)設(shè)置源/目標(biāo)數(shù)據(jù)集中各個(gè)源/目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源/目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)。優(yōu)選的,所述源/目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyN,Type,Length},其中key1-Nt為數(shù)據(jù)項(xiàng)元數(shù)據(jù)中分解出的N個(gè)實(shí)詞文本向量。優(yōu)選的,所述N個(gè)實(shí)詞文本向量按照首字排序。例如,假設(shè)Nt=3,key1為數(shù)據(jù)項(xiàng)名稱,key2為數(shù)據(jù)項(xiàng)編碼,key3為數(shù)據(jù)項(xiàng)描述信息,Type為數(shù)據(jù)項(xiàng)類(lèi)型,Length為數(shù)據(jù)項(xiàng)長(zhǎng)度。步驟103、根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及所述目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);具體的,可按照源數(shù)據(jù)集/項(xiàng)信息結(jié)構(gòu)的設(shè)置方式設(shè)置目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及該目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)。步驟104、根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì);具體的,可根據(jù)源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集之間的相似度,并將相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì)的步驟,具體包括:子步驟11、按照所述源數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的源數(shù)據(jù)集特征向量;子步驟12、按照所述目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集特征向量;子步驟13、根據(jù)所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集的源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集的目標(biāo)數(shù)據(jù)集特征向量,確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集的相似度;將相似度最大的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)。步驟105、根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì);在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì)的步驟,具體包括:子步驟21、按照所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定源數(shù)據(jù)項(xiàng)特征向量;子步驟22、按照所述目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定目標(biāo)數(shù)據(jù)項(xiàng)特征向量;子步驟23、根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;子步驟24、將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)。具體的,所述相似度滿足預(yù)設(shè)條件具體可以為相似度最大。步驟106、從源數(shù)據(jù)集中獲取待交換數(shù)據(jù);具體的,從源數(shù)據(jù)集中獲取增量數(shù)據(jù)并進(jìn)行映射轉(zhuǎn)換后作為待交換數(shù)據(jù),此外,也可以按照用戶指定的查詢/篩選條件從源數(shù)據(jù)集中獲取數(shù)據(jù)并進(jìn)行映射轉(zhuǎn)換后作為待交換數(shù)據(jù),本發(fā)明實(shí)施例對(duì)待交換數(shù)據(jù)的內(nèi)容不作具體限制。進(jìn)一步的,針對(duì)從源數(shù)據(jù)集中獲取的每一條源數(shù)據(jù)記錄,根據(jù)數(shù)據(jù)項(xiàng)映射匹配對(duì),對(duì)源數(shù)據(jù)記錄進(jìn)行數(shù)據(jù)映射轉(zhuǎn)換,然后,將轉(zhuǎn)換后的源數(shù)據(jù)記錄作為待交換數(shù)據(jù)。其中,所述對(duì)源數(shù)據(jù)記錄進(jìn)行數(shù)據(jù)映射轉(zhuǎn)換具體可包括:直接映射、數(shù)據(jù)類(lèi)型轉(zhuǎn)換、字符集編碼轉(zhuǎn)換、編碼轉(zhuǎn)換等。下面通過(guò)偽碼舉例說(shuō)明上述映射轉(zhuǎn)換過(guò)程:直接映射實(shí)現(xiàn)偽代碼為:t.name=s.name;表示將源數(shù)據(jù)項(xiàng)‘name’直接映射為目標(biāo)數(shù)據(jù)項(xiàng)‘name’;數(shù)據(jù)類(lèi)型轉(zhuǎn)換偽代碼為:t.age=atoi(s.age);其中,s.age表示源數(shù)據(jù)項(xiàng)為字符串類(lèi)型,t.age表示目標(biāo)數(shù)據(jù)項(xiàng)為整數(shù)類(lèi)型,atoi為提供的基本類(lèi)型匹配轉(zhuǎn)換函數(shù);字符編碼轉(zhuǎn)換偽代碼為:encode(s.name,t.name,“big5”,“utf8”);其中,s.name表示源數(shù)據(jù)項(xiàng)字符編碼名稱為GBK編碼,t.name表示目標(biāo)數(shù)據(jù)項(xiàng)的字符變?yōu)閁TF-8編碼,encode為提供的編碼轉(zhuǎn)換函數(shù)。步驟107、根據(jù)所述數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),將所述待交換數(shù)據(jù)加載到所述目標(biāo)數(shù)據(jù)源中。具體的,首先根據(jù)數(shù)據(jù)集映射匹配對(duì)確定當(dāng)前源數(shù)據(jù)集匹配的目標(biāo)數(shù)據(jù)集,然后將待交換數(shù)據(jù)加載到該匹配的目標(biāo)數(shù)據(jù)集中。具體實(shí)現(xiàn)時(shí),可根據(jù)數(shù)據(jù)源的類(lèi)型使用對(duì)應(yīng)的加載方式加載待交換數(shù)據(jù)。例如,當(dāng)數(shù)據(jù)源是關(guān)系型數(shù)據(jù)庫(kù)類(lèi)型時(shí),通過(guò)生成SQL指令將待交換數(shù)據(jù)加載到目標(biāo)數(shù)據(jù)集中;當(dāng)數(shù)據(jù)源類(lèi)型為文件時(shí),通過(guò)文件操作接口將所述待交換數(shù)據(jù)插入到目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的文件中。綜上,現(xiàn)有技術(shù)實(shí)現(xiàn)數(shù)據(jù)交換時(shí)需要技術(shù)人員預(yù)先分析源數(shù)據(jù)源和目標(biāo)數(shù)據(jù)源中數(shù)據(jù)集和數(shù)據(jù)項(xiàng)的特征,并通過(guò)編碼的方式將數(shù)據(jù)集和數(shù)據(jù)項(xiàng)之間的映射關(guān)系固化在程序代碼中,不僅耗時(shí)長(zhǎng),使用起來(lái)非常不便。本發(fā)明實(shí)施例通過(guò)設(shè)置數(shù)據(jù)集信息結(jié)構(gòu)和數(shù)據(jù)項(xiàng)信息結(jié)構(gòu),自動(dòng)匹配確定數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),然后將待交換數(shù)據(jù)按照確定的數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì)加載到目標(biāo)數(shù)據(jù)源中,該數(shù)據(jù)交換過(guò)程可無(wú)需技術(shù)人員參與,自動(dòng)完成數(shù)據(jù)的匹配和交換,為用戶節(jié)約了大量時(shí)間。實(shí)施例二參照?qǐng)D2,示出了本發(fā)明的一種數(shù)據(jù)自動(dòng)交換方法實(shí)施例二的步驟流程圖,該方法具體可以包括:步驟201、配置源數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源的數(shù)據(jù)源元數(shù)據(jù);其中,所述數(shù)據(jù)元數(shù)據(jù)包括:數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)項(xiàng)元數(shù)據(jù)。步驟202、根據(jù)源數(shù)據(jù)源的數(shù)據(jù)集元數(shù)據(jù)和數(shù)據(jù)項(xiàng)元數(shù)據(jù)設(shè)置源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集對(duì)應(yīng)的源數(shù)據(jù)集信息結(jié)構(gòu),以及所述源數(shù)據(jù)集中各個(gè)源數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);例如,假設(shè):源數(shù)據(jù)集“客戶基本信息表”,該源數(shù)據(jù)集的數(shù)據(jù)集名稱為“客戶基本信息表”,數(shù)據(jù)集編碼為“CUSTPRIMARYINFO”,數(shù)據(jù)集描述信息為“客戶基本信息,初級(jí)”,其數(shù)據(jù)集信息結(jié)構(gòu)R={key1,key2,...keyNt}Nt=3,當(dāng)key1為數(shù)據(jù)集名稱時(shí),則當(dāng)key2為數(shù)據(jù)集編碼時(shí),則key2={"CUST","PRAMARY","INFO"};當(dāng)key3為數(shù)據(jù)集描述時(shí),則進(jìn)一步的,設(shè)置源數(shù)據(jù)集“客戶基本信息表”中源數(shù)據(jù)項(xiàng)“客戶名稱”的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu):假設(shè),源數(shù)據(jù)項(xiàng)“客戶名稱”的數(shù)據(jù)項(xiàng)名稱為“客戶名稱”,數(shù)據(jù)項(xiàng)編碼為“CUSTNAME”,數(shù)據(jù)項(xiàng)描述信息為“客戶姓名全稱”,數(shù)據(jù)項(xiàng)類(lèi)型Type為char,數(shù)據(jù)項(xiàng)長(zhǎng)度Length為32,其數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)R={key1,key2,...keyN,Type,Length},N=3,key2={"CUST","NAME"};Type={"char"};Length={"32"}步驟203、根據(jù)目標(biāo)數(shù)據(jù)源的數(shù)據(jù)集元數(shù)據(jù)和數(shù)據(jù)項(xiàng)元數(shù)據(jù)設(shè)置目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及所述目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);步驟204、按照源/目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定源/目標(biāo)數(shù)據(jù)集特征向量;為了便于計(jì)算相似度,本發(fā)明實(shí)施例將源/目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)中的特征項(xiàng)keyx轉(zhuǎn)換為數(shù)值標(biāo)識(shí)的數(shù)據(jù)特征向量。假設(shè)源數(shù)據(jù)集信息特征ci和目標(biāo)數(shù)據(jù)集信息特征cj,其對(duì)應(yīng)的源、目標(biāo)數(shù)據(jù)集特征向量分別為Ci和Cj,其中特征向量在空間映射表示為:Ci=(Q1i,Q2i,…,Qli),Cj=(Q1j,Q2j,…,Qlj)其中,Q1i和Q1j分別為向量Ci和Cj在實(shí)詞詞典(大小為l)空間上的數(shù)據(jù)狀態(tài),取值為0或1。例如,假設(shè)實(shí)詞詞典大小l為10000,實(shí)詞詞典數(shù)據(jù)結(jié)構(gòu)如表1所示,其包括序號(hào)、詞語(yǔ)的數(shù)組表格,當(dāng)數(shù)據(jù)集名稱特征“客戶”、“基本”、“信息”在實(shí)詞詞典中編號(hào)為500、601、700,那么其特征向量為Q500i=1,Q601i=1,Q711i=1,不包含的詞語(yǔ)為Q為0。這時(shí)“客戶基本信息表”數(shù)據(jù)集名稱特征key1對(duì)應(yīng)向量為:C={Q1=0,...,Q500=1,0,...,Q601=1,…,Q700=1,...,Q10000=0}。表11姓名2年齡3消息……451基礎(chǔ)……500客戶……600全稱601基本……700信息…….10000住址優(yōu)選的,根據(jù)預(yù)先設(shè)置的同義詞詞典,可進(jìn)一步對(duì)Ci進(jìn)行同義詞處理,把具備的同義詞所在特征向量Qx設(shè)置為1,同義詞詞典數(shù)據(jù)結(jié)構(gòu)可以描述為一組同義詞組成的數(shù)組表格,如下表2所示:表2……451基本,基礎(chǔ)……步驟205、根據(jù)源/目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定源/目標(biāo)數(shù)據(jù)項(xiàng)特征向量;按照上述步驟204相同的原理確定源數(shù)據(jù)項(xiàng)特征向量Ti和目標(biāo)數(shù)據(jù)項(xiàng)特征向量Tj。步驟206、根據(jù)所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集的源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集的目標(biāo)數(shù)據(jù)集特征向量,確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集的相似度;將相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì);假設(shè),所述源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)集特征向量分別為Ci和Cj,兩者之間的距離d可通過(guò)公式1計(jì)算:其中,Nt為實(shí)詞個(gè)數(shù);disA(Ci,Cj)=fa*dis(Ci,Cj);其中,fa為權(quán)因子系數(shù),dis(Ci,Cj)在Ci=Cj時(shí),或者<Ci,Cj>為同義詞庫(kù)中的同義庫(kù)對(duì)時(shí)取1。其中,dis(Ci,Cj)通過(guò)余弦相似度計(jì)算表示如公式2:其中Ci=(Q1i,Q2i,…,Qli),Cj=(Q1j,Q2j,…,Qlj),l為所述近義詞詞典中實(shí)詞數(shù)。最后,將上述計(jì)算結(jié)果中距離d最小的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)。步驟207、針對(duì)數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng),識(shí)別所述源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng);將所述源數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)匹配映射對(duì);主鍵是能確定唯一一條記錄的唯一標(biāo)識(shí)。例如關(guān)系型數(shù)據(jù)庫(kù)中的用戶表(用戶名、密碼、登錄級(jí)別),該用戶表中每一條用戶記錄的‘用戶名’是唯一的,該‘用戶名’就是一個(gè)主鍵。具體實(shí)現(xiàn)時(shí):當(dāng)所述源/目標(biāo)數(shù)據(jù)源為關(guān)系型數(shù)據(jù)庫(kù),并且數(shù)據(jù)源元數(shù)據(jù)中包括了數(shù)據(jù)項(xiàng)元數(shù)據(jù),則可根據(jù)該數(shù)據(jù)項(xiàng)元數(shù)據(jù)識(shí)別確定源數(shù)據(jù)項(xiàng)中的主鍵和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵,并且將源/目標(biāo)主鍵數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)匹配映射對(duì);當(dāng)所述源/目標(biāo)數(shù)據(jù)源為非關(guān)系型數(shù)據(jù)庫(kù),或者所述數(shù)據(jù)源元數(shù)據(jù)中未包括數(shù)據(jù)項(xiàng)元數(shù)據(jù)時(shí),可利用從源/目標(biāo)數(shù)據(jù)源中獲取的數(shù)據(jù)樣本來(lái)分析得到該源/目標(biāo)數(shù)據(jù)源的主鍵數(shù)據(jù)項(xiàng),具體包括:首先對(duì)所述源/目標(biāo)數(shù)據(jù)集的源/目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)中的每個(gè)數(shù)據(jù)項(xiàng)的存儲(chǔ)空間值的大小進(jìn)行排序,去除數(shù)據(jù)項(xiàng)存儲(chǔ)空間較大的數(shù)據(jù)項(xiàng),例如大于64字節(jié)的數(shù)據(jù)項(xiàng),其次對(duì)數(shù)據(jù)項(xiàng)數(shù)值大小進(jìn)行一次散列(又稱hash)運(yùn)算,若每個(gè)值都只對(duì)應(yīng)有一條記錄,則該數(shù)據(jù)項(xiàng)可作為主鍵。當(dāng)?shù)谝淮紊⒘羞\(yùn)算查找中未找到符合要求的主鍵,則按照散列鏈最長(zhǎng)、數(shù)據(jù)值空間最小、沖突數(shù)據(jù)的平均次數(shù),沖突數(shù)據(jù)的均勻度對(duì)數(shù)據(jù)項(xiàng)排序;依次找到2個(gè)數(shù)據(jù)項(xiàng)作為聯(lián)合主鍵,若每個(gè)鍵值都只對(duì)應(yīng)有一條記錄,則將所述兩個(gè)數(shù)據(jù)項(xiàng)確定為聯(lián)合主鍵;當(dāng)2個(gè)數(shù)據(jù)項(xiàng)作為聯(lián)合主鍵不符合要求時(shí)采用3個(gè),依次類(lèi)推,直到找到最大數(shù)據(jù)項(xiàng)為止。步驟208,根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的除所述主鍵數(shù)據(jù)項(xiàng)之外的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì);假設(shè),數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)的源數(shù)據(jù)項(xiàng)特征向量為T(mén)i,目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)的目標(biāo)數(shù)據(jù)項(xiàng)特征向量為T(mén)j,任意兩個(gè)源/目標(biāo)數(shù)據(jù)項(xiàng)特征向量之間的距離可通過(guò)公式3表示為:其中,disA(Ti,Tj)=fa*dis(Ti,Tj);其中fa為權(quán)因子系數(shù),dis(Ti,Tj)在Ti=Tj時(shí),或者<Ti,Tj>為同義詞庫(kù)中的同義庫(kù)對(duì)時(shí)取1;disB(Ti,Tj)=fb*dis(Ti,Tj);其中fb為權(quán)因子系數(shù)dis(Ti,Tj)在Ti=Tj時(shí),或者<Ti,Tj>為同義詞庫(kù)中的同義庫(kù)對(duì)時(shí)取1;disC(Ti,Tj)=fc*(Ti+Tj-|Ti-Tj|)/(Ti+Tj)系數(shù)fc為權(quán)因子系數(shù)。其中dis(Ti,Tj)通過(guò)余弦相似度表示如公式4所示:其中Ti=(w1i,w2i,…,wli),Tj=(w1j,w2j,…,wlj),l為所述近義詞詞典中實(shí)詞數(shù)。一般fa>fb>fc,例如,fa=20.0,fb=10.0,fc=5.0。最后,根據(jù)上述計(jì)算結(jié)果,將距離d最小的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)。步驟209、從源數(shù)據(jù)集中獲取待交換數(shù)據(jù);步驟210、根據(jù)所述數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),將所述待交換數(shù)據(jù)加載到所述目標(biāo)數(shù)據(jù)源中。裝置實(shí)施例參照?qǐng)D3,示出了本發(fā)明一種數(shù)據(jù)自動(dòng)交換裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括:數(shù)據(jù)源元數(shù)據(jù)配置模塊310、第一設(shè)置模塊320、第二設(shè)置模塊330、數(shù)據(jù)集匹配模塊340、數(shù)據(jù)項(xiàng)匹配模塊350、待交換數(shù)據(jù)獲取模塊360和待交換數(shù)據(jù)加載模塊370,其中,數(shù)據(jù)源元數(shù)據(jù)配置模塊310,用于配置源數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源的數(shù)據(jù)源元數(shù)據(jù);第一設(shè)置模塊320,用于根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集對(duì)應(yīng)的源數(shù)據(jù)集信息結(jié)構(gòu),以及所述源數(shù)據(jù)集中各個(gè)源數(shù)據(jù)項(xiàng)對(duì)應(yīng)的源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);第二設(shè)置模塊330,用于根據(jù)所述數(shù)據(jù)源元數(shù)據(jù)設(shè)置目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),以及所述目標(biāo)數(shù)據(jù)集中各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu);數(shù)據(jù)集匹配模塊340,用于根據(jù)所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu),確定所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集之間的數(shù)據(jù)集映射匹配對(duì);數(shù)據(jù)項(xiàng)匹配模塊350,用于根據(jù)源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間的數(shù)據(jù)項(xiàng)映射匹配對(duì);待交換數(shù)據(jù)獲取模塊360,用于從源數(shù)據(jù)源中獲取待交換數(shù)據(jù);待交換數(shù)據(jù)加載模塊370,用于根據(jù)所述數(shù)據(jù)集映射匹配對(duì)和數(shù)據(jù)項(xiàng)映射匹配對(duì),將所述待交換數(shù)據(jù)加載到所述目標(biāo)數(shù)據(jù)源中??蛇x的,所述數(shù)據(jù)集匹配模塊,具體用于按照所述源數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的源數(shù)據(jù)集特征向量;按照所述目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)確定對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集特征向量;根據(jù)所述源數(shù)據(jù)源中各個(gè)源數(shù)據(jù)集的源數(shù)據(jù)集特征向量和目標(biāo)數(shù)據(jù)源中各個(gè)目標(biāo)數(shù)據(jù)集的目標(biāo)數(shù)據(jù)集特征向量,確定源數(shù)據(jù)集與目標(biāo)數(shù)據(jù)集的相似度;將相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集確定為數(shù)據(jù)集映射匹配對(duì)??蛇x的,所述數(shù)據(jù)項(xiàng)匹配模塊具體用于按照所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定源數(shù)據(jù)項(xiàng)特征向量;按照所述目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)確定目標(biāo)數(shù)據(jù)項(xiàng)特征向量;根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)??蛇x的,所述數(shù)據(jù)項(xiàng)匹配模塊具體包括:第一匹配單元,用于識(shí)別所述源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng);將所述源數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)中的主鍵數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)匹配映射對(duì);第二匹配單元,用于根據(jù)所述源數(shù)據(jù)項(xiàng)特征向量和目標(biāo)數(shù)據(jù)項(xiàng)特征向量,確定數(shù)據(jù)集映射匹配對(duì)中源數(shù)據(jù)集的除主鍵數(shù)據(jù)項(xiàng)之外各個(gè)源數(shù)據(jù)項(xiàng)與目標(biāo)數(shù)據(jù)集的各個(gè)目標(biāo)數(shù)據(jù)項(xiàng)之間相似度;將所述相似度滿足預(yù)設(shè)條件的源數(shù)據(jù)項(xiàng)和目標(biāo)數(shù)據(jù)項(xiàng)確定為數(shù)據(jù)項(xiàng)映射匹配對(duì)可選的,所述數(shù)據(jù)源元數(shù)據(jù)包括:數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)項(xiàng)元數(shù)據(jù);所述源數(shù)據(jù)集信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)集信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyNt},其中key1-Nt為數(shù)據(jù)集信息結(jié)構(gòu)中分解出的Nt個(gè)實(shí)詞文本向量;所述源數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)和目標(biāo)數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)具體可表示為:R={key1,key2,...keyN,Type,Length},其中key1-Nt為數(shù)據(jù)項(xiàng)信息結(jié)構(gòu)中分解出的N個(gè)實(shí)詞文本向量;所述Type為數(shù)據(jù)項(xiàng)類(lèi)型;所述Length為數(shù)據(jù)項(xiàng)長(zhǎng)度。對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的一種顯示控制裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、電子設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明實(shí)施例范圍的所有變更和修改。最后,還需要說(shuō)明的是,在本文中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者終端設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者終端設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者終端設(shè)備中還存在另外的相同要素。以上對(duì)本發(fā)明所提供的一種數(shù)據(jù)自動(dòng)交換方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。當(dāng)前第1頁(yè)1 2 3