技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種醫(yī)療數(shù)據(jù)查重和關(guān)聯(lián)的處理方法及系統(tǒng),所述方法包括(1)提取待處理的醫(yī)療數(shù)據(jù)中的核心數(shù)據(jù)項(xiàng);(2)將核心數(shù)據(jù)項(xiàng)分類;(3)分別對(duì)排除數(shù)組及模糊數(shù)組中的各個(gè)數(shù)據(jù)項(xiàng)初步篩查;(4)對(duì)核心數(shù)據(jù)項(xiàng)中的各項(xiàng)數(shù)據(jù)項(xiàng)進(jìn)行深度篩查;(5)設(shè)定疑似重復(fù)數(shù)據(jù)相似度的閾值M2和/或疑似關(guān)聯(lián)數(shù)據(jù)的閾值M3;(6)人工核查疑似重復(fù)和/或關(guān)聯(lián)數(shù)據(jù)并給予判斷后,將被判斷為不重復(fù)的數(shù)據(jù)輸入醫(yī)療數(shù)據(jù)庫(kù)中,并給予判斷為存在關(guān)聯(lián)的數(shù)據(jù)一個(gè)或多個(gè)相應(yīng)的關(guān)聯(lián)標(biāo)簽。本發(fā)明與現(xiàn)有技術(shù)相比具有漏判率低、錯(cuò)判率低、查重效率高的特點(diǎn),對(duì)人工核查的人工專業(yè)度要求不高,因此查重和關(guān)聯(lián)的運(yùn)行成本顯著降低。
技術(shù)研發(fā)人員:劉勁松;王友柱;饒江;李廣東;李楠;王東;陳桂太
受保護(hù)的技術(shù)使用者:江蘇華生基因數(shù)據(jù)科技股份有限公司
技術(shù)研發(fā)日:2017.03.15
技術(shù)公布日:2017.07.07