專利名稱:利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法
技術領域:
本發(fā)明涉及信息技術領域,尤其涉及一種建立數(shù)據(jù)倉儲的方法。
背景技術:
兩個或多個不同醫(yī)藥制造企業(yè)并購過程中,信息系統(tǒng)異構數(shù)據(jù)源導致各個醫(yī)藥制造企業(yè)的數(shù)據(jù)無法有效整合,大大降低了企業(yè)信息系統(tǒng)整合效果,對并購過程和并購后的工作產生很多難題。目前解決這一問題都是通過手工匹配完成。對此,以前所作的研究大都集中在數(shù)據(jù)庫系統(tǒng)方面,特別是數(shù)據(jù)庫不同模式之間的轉換和匹配方面。然而,隨著INTERNET的發(fā)展,目前很多系統(tǒng)的數(shù)據(jù)都是在網絡上發(fā)布, 存在大數(shù)據(jù)量,數(shù)據(jù)動態(tài)等問題。除去結構化數(shù)據(jù)之外,很多數(shù)據(jù)都是半結構化或無結構地,而且數(shù)據(jù)量極為龐大。傳統(tǒng)的啟發(fā)式的,手動的模式匹配方式無論是在效率或是精度方面都無法滿足目前應用對數(shù)據(jù)集成的要求。數(shù)據(jù)模式的自動匹配一直是提高系統(tǒng)智能化的一個難點。尤其是醫(yī)藥行業(yè),目前信息化程度較弱,匹配的精度很難提高。因此,提高異構系統(tǒng)之間匹配精度,利用計算機系統(tǒng)對異構數(shù)據(jù)源進行匹配整合, 從而實現(xiàn)信息系統(tǒng)的有效整合是當前存在并急需解決的問題。
發(fā)明內容
為彌補現(xiàn)有技術的不足,本發(fā)明目的是提供一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法,提供靈活多變、安全穩(wěn)定的游戲環(huán)境。為了實現(xiàn)上述目的,本發(fā)明的技術方案如下一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法,其特征在于包含如下步驟建立醫(yī)藥行業(yè)的語義網絡,該建立醫(yī)藥行業(yè)的語義網絡的方法為將第一語義和第二語義轉換為標準模式的語義,建立語義對應關系;對于給定的第一語義,按照對應關系給出匹配的第二語義。所述對應關系包括標準模式與第一語義的對應關系,標準模式與第二語義的對應關系。所述將第一語義和第二語義轉換為標準模式的語義的過程為利用語義網絡,采用由上而下的,配以剪枝的方法盡快得到候選匹配結果列表。所述結果列表的排序按照匹配度的值從高到低排列。本發(fā)明的有益效果應用本發(fā)明可以使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構數(shù)據(jù)有效整合。
以下結合附圖和具體實施方式
來進一步說明本發(fā)明。
圖1為本發(fā)明方法流程示意圖;圖2為本發(fā)明建立醫(yī)藥行業(yè)的語義網絡的具體流程圖。
具體實施例方式為了使本發(fā)明實現(xiàn)的技術手段、創(chuàng)作特征、達成目的與功效易于明白了解,下面結合具體圖示,進一步闡述本發(fā)明。某個制藥企業(yè)的語義我們稱為第一語義,另外一個制藥企業(yè)的語義我們稱為第二語義,本發(fā)明的目標是提高第一語義和第二語義的匹配精度與速度。此處為了描述與理解本發(fā)明簡單化,僅以兩家制藥企業(yè)的兩種語義為例,更多語義采用相同的原理與方法。參見圖1,本發(fā)明一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法,包含步驟101,建立醫(yī)藥行業(yè)的語義網絡,存儲在數(shù)據(jù)庫中。因為醫(yī)藥行業(yè)的特點是專用術語數(shù)目龐大,但內容單一,所以建立語義網絡非常重要且可行。建立語義網絡的詳細方法為步驟a,將第一語義和第二語義轉換為標準模式的語義。本發(fā)明提供一個模式標準, 所有不同模式的(例如兩個不同的制藥企業(yè)的兩個模式。為了描述簡單化,我們僅用兩個模式為例。更多模式采用同樣的原理與方法。)語義均對應并轉換成同一個標準模式。步驟 b,建立語義對應關系,對應關系包括標準模式與第一語義的對應關系、標準模式與第二語義的對應關系。在轉換過程中,利用語義網絡,采用由上而下的,并配以剪枝的方法來盡快得到候選匹配結果列表,列表的排序按照匹配度的值從高到低排列??梢栽谌斯さ膸椭禄蚴峭ㄟ^機器學習的方法來進一步提高轉化的自動化程度和精度。步驟102,對于給定的第一語義,按照對應關系給出匹配的第二語義。應用本發(fā)明可以使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構數(shù)據(jù)有效整合,大大提高了企業(yè)信息系統(tǒng)的整合效果,對并購過程和并購后的工作順利展開提供支撐。
權利要求
1.一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法,其特征在于包含如下步驟建立醫(yī)藥行業(yè)的語義網絡,該建立醫(yī)藥行業(yè)的語義網絡的方法為將第一語義和第二語義轉換為標準模式的語義,建立語義對應關系;對于給定的第一語義,按照對應關系給出匹配的第二語義。
2.根據(jù)權利要求1所述的一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法, 其特征在于,所述對應關系包括標準模式與第一語義的對應關系,標準模式與第二語義的對應關系。
3.根據(jù)權利要求2所述的一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法, 其特征在于,所述將第一語義和第二語義轉換為標準模式的語義的過程為利用語義網絡, 采用由上而下的,配以剪枝的方法盡快得到候選匹配結果列表。
4.根據(jù)權利要求3所述的一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法, 其特征在于,所述結果列表的排序按照匹配度的值從高到低排列。
5.根據(jù)權利要求1所述的一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法, 其特征在于,還包含在人工的幫助下或是通過機器學習的方法來進一步提高轉化的自動化程度和精度。
全文摘要
本發(fā)明公開的是一種利用醫(yī)藥語義網絡提高異構系統(tǒng)之間匹配精度的方法,其包括建立醫(yī)藥行業(yè)的語義網絡,將第一語義和第二語義轉換為標準模式的語義并建立語義對應關系;對于給定的第一語義,按照對應關系給出匹配的第二語義。本發(fā)明提供了使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構數(shù)據(jù)有效整合的方法,大大提高了企業(yè)信息系統(tǒng)的整合效果,對企業(yè)并購過程和并購后的工作順利展開提供了有力支撐。
文檔編號G06F17/30GK102236671SQ20101016410
公開日2011年11月9日 申請日期2010年4月29日 優(yōu)先權日2010年4月29日
發(fā)明者劉卉, 王軼彤, 陸明偉 申請人:劉卉, 王軼彤, 陸明偉