本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法、裝置及輔助診斷方法。
背景技術(shù):
知識(shí)圖譜作為一個(gè)結(jié)構(gòu)化的信息網(wǎng)絡(luò),打破了原有的關(guān)系型數(shù)據(jù)庫(kù)的限制,具有非常強(qiáng)大的表達(dá)能力,它在信息檢索和信息整合等領(lǐng)域扮演著越來(lái)越重要的角色,可以為用戶提供更廣度、更深度的知識(shí)體系并不斷擴(kuò)充。
目前,知識(shí)圖譜的應(yīng)用非常廣泛,在醫(yī)學(xué)領(lǐng)域中,構(gòu)建醫(yī)學(xué)知識(shí)圖譜,可以將病癥、疾病與診療手段之間的錯(cuò)綜復(fù)雜的關(guān)系,通過(guò)知識(shí)圖譜構(gòu)建成數(shù)據(jù)庫(kù),從而可以為醫(yī)護(hù)人員提供很好的輔助診斷手段。但是,現(xiàn)有的醫(yī)學(xué)知識(shí)圖譜的結(jié)構(gòu)比較簡(jiǎn)單,并且在利用知識(shí)圖譜進(jìn)行輔助診斷上,由于知識(shí)圖譜的結(jié)構(gòu)限制,不能很好地為醫(yī)護(hù)人員提供幫助。
技術(shù)實(shí)現(xiàn)要素:
基于上述問題,本發(fā)明提供一種醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法、裝置及輔助診斷方法,能夠?yàn)榕R床醫(yī)學(xué)提供智能化的輔助診斷。
為解決上述問題,本發(fā)明提供了一種醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法,包括:
收集醫(yī)學(xué)數(shù)據(jù)庫(kù)中的數(shù)據(jù),構(gòu)建用戶詞典;
根據(jù)所述用戶詞典和停止詞詞庫(kù),對(duì)電子病歷數(shù)據(jù)進(jìn)行處理;
將處理后的數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別;
將識(shí)別的各個(gè)實(shí)體建立關(guān)聯(lián)關(guān)系;
根據(jù)各個(gè)實(shí)體以及各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,建立醫(yī)學(xué)知識(shí)圖譜。
其中,所述將處理后的數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,具體還包括:
通過(guò)處理后的診斷數(shù)據(jù)得到疾病實(shí)體,通過(guò)處理后的體檢數(shù)據(jù)得到體征實(shí)體,根據(jù)處理后的患者主訴數(shù)據(jù)得到癥狀實(shí)體,根據(jù)處理意見數(shù)據(jù)得到處理實(shí)體,根據(jù)科室信息得到科室實(shí)體。
其中,所述將識(shí)別的各個(gè)實(shí)體建立關(guān)聯(lián)關(guān)系,具體包括:
對(duì)疾病實(shí)體,分別與癥狀實(shí)體、體征實(shí)體、處理實(shí)體、科室實(shí)體建立關(guān)聯(lián)關(guān)系;
其中,所述關(guān)聯(lián)關(guān)系強(qiáng)度采用以下公式:
z=x/y
其中,y表示某項(xiàng)疾病的病歷份數(shù),x表示某項(xiàng)疾病的病歷中目標(biāo)實(shí)體出現(xiàn)的總次數(shù),所述目標(biāo)實(shí)體為癥狀實(shí)體、體征實(shí)體、處理實(shí)體、科室實(shí)體中的任一個(gè)。
其中,所述根據(jù)各個(gè)實(shí)體以及各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,建立醫(yī)學(xué)知識(shí)圖譜,具體包括:
將處理后的實(shí)體依據(jù)關(guān)聯(lián)關(guān)系形成的實(shí)體對(duì)及其相應(yīng)的關(guān)聯(lián)關(guān)系強(qiáng)度值導(dǎo)入neo4j圖形數(shù)據(jù)庫(kù),并可視化,生成所述醫(yī)學(xué)知識(shí)圖譜。
其中,所述方法還包括:
根據(jù)當(dāng)前獲取的患者診斷結(jié)果和患者主訴及檢查數(shù)據(jù),對(duì)相應(yīng)實(shí)體之間的關(guān)聯(lián)強(qiáng)度進(jìn)行實(shí)時(shí)更新。在本發(fā)明的另一個(gè)方面,提供一種基于醫(yī)學(xué)知識(shí)圖譜的計(jì)算機(jī)輔助診斷方法,包括:
獲取患者的主訴數(shù)據(jù)和檢查數(shù)據(jù);
對(duì)所述主訴數(shù)據(jù)和檢查進(jìn)行預(yù)處理,得到患者的癥狀實(shí)體和體征實(shí)體構(gòu)成的集合;
在醫(yī)學(xué)知識(shí)圖譜中查找與所述癥狀實(shí)體和體征實(shí)體相關(guān)聯(lián)的疾病實(shí)體集合;
根據(jù)所述疾病實(shí)體集合和每個(gè)疾病實(shí)體所對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的集合,分別計(jì)算每個(gè)疾病實(shí)體在其對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的集合下的后驗(yàn)概率;
輸出后驗(yàn)概率最大的疾病實(shí)體及其關(guān)聯(lián)節(jié)點(diǎn)對(duì)應(yīng)的數(shù)據(jù)。
其中,所述計(jì)算每個(gè)疾病實(shí)體在其對(duì)應(yīng)子集下的后驗(yàn)概率,具體包括:
對(duì)于疾病di,在對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的子集{t1,t2,...tk}下的后驗(yàn)概率為:
其中,
通過(guò)所述癥狀實(shí)體與知識(shí)圖譜中的疾病實(shí)體的關(guān)系強(qiáng)度值
在本發(fā)明的又一個(gè)方面,提供一種醫(yī)學(xué)知識(shí)圖譜的構(gòu)建裝置,所述裝置包括:
用戶詞典構(gòu)建單元,用于收集醫(yī)學(xué)數(shù)據(jù)庫(kù)中的數(shù)據(jù),構(gòu)建用戶詞典;
數(shù)據(jù)處理單元,用于根據(jù)所述用戶詞典和停止詞詞庫(kù),對(duì)電子病歷數(shù)據(jù)進(jìn)行處理;
實(shí)體識(shí)別單元,用于對(duì)數(shù)據(jù)處理單元處理后的數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別;
關(guān)聯(lián)關(guān)系建立單元,用于對(duì)實(shí)體識(shí)別單元形成的各個(gè)實(shí)體建立關(guān)聯(lián)關(guān)系;
醫(yī)學(xué)知識(shí)圖譜構(gòu)建單元,用于根據(jù)所述各個(gè)實(shí)體以及各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,建立醫(yī)學(xué)知識(shí)圖譜。
其中,所述實(shí)體識(shí)別單元,具體包括:
疾病實(shí)體識(shí)別子單元,用于對(duì)處理后的診斷數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到疾病實(shí)體;
體征實(shí)體識(shí)別子單元,用于對(duì)處理后的體檢數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到體征實(shí)體;
癥狀實(shí)體識(shí)別子單元,用于對(duì)處理后的患者主訴數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到癥狀實(shí)體;
處理實(shí)體識(shí)別子單元,用于對(duì)處理后的處理意見數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到處理實(shí)體;
科室實(shí)體識(shí)別子單元,用于對(duì)處理后的科室信息進(jìn)行命名實(shí)體識(shí)別,得到科室實(shí)體。
其中,所述裝置還包括:
更新單元,用于根據(jù)當(dāng)前獲取的患者診斷結(jié)果和患者主訴及檢查數(shù)據(jù),對(duì)相應(yīng)實(shí)體之間的關(guān)聯(lián)強(qiáng)度進(jìn)行實(shí)時(shí)更新。本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法、裝置及輔助診斷方法,通過(guò)使用醫(yī)學(xué)知識(shí)圖譜進(jìn)行輔助診斷,能夠減輕醫(yī)護(hù)人員工作負(fù)擔(dān),有效緩解醫(yī)療壓力,從而降低醫(yī)療事故的發(fā)生。同時(shí),對(duì)于醫(yī)護(hù)工作者憑借經(jīng)驗(yàn)不能確診的病例,提供了精確的計(jì)算機(jī)輔助診斷,對(duì)醫(yī)護(hù)人員工作的有力支撐。
此外,對(duì)于沒有相應(yīng)醫(yī)學(xué)專業(yè)知識(shí)背景的普通人,通過(guò)自身癥狀,依靠系統(tǒng)而了解自身所患的疾病信息以及相應(yīng)的治療意見,了解基本的可行的疾病應(yīng)對(duì)方法。
附圖說(shuō)明
圖1示出了本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法的流程圖。
圖2示出了本發(fā)明的基于醫(yī)學(xué)知識(shí)圖譜的輔助診斷方法的流程圖。
圖3示出了本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說(shuō)明本發(fā)明,但不用來(lái)限制本發(fā)明的范圍。
圖1示出了本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法的流程圖。
參照?qǐng)D1,本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法,具體包括以下步驟:
s11、收集醫(yī)學(xué)數(shù)據(jù)庫(kù)中的數(shù)據(jù),構(gòu)建用戶詞典。
在本實(shí)施例中,在現(xiàn)有的醫(yī)學(xué)數(shù)據(jù)庫(kù)中,依據(jù)icd-10和icd-9-cm,收集相關(guān)的數(shù)據(jù),構(gòu)建成用戶詞典。
s12、根據(jù)所述用戶詞典和停止詞詞庫(kù),對(duì)電子病歷數(shù)據(jù)進(jìn)行處理。
本實(shí)施例中,構(gòu)建知識(shí)圖譜使用的數(shù)據(jù)可以是從現(xiàn)有的電子病歷中獲取的數(shù)據(jù),如患者主訴、科室、病史、體檢、診斷、處理意見等相關(guān)數(shù)據(jù),然后根據(jù)用戶詞典以及停止詞詞庫(kù),可以使用相關(guān)的醫(yī)學(xué)語(yǔ)言處理技術(shù)(mlp)對(duì)電子病歷的數(shù)據(jù)進(jìn)行處理,也可以對(duì)數(shù)據(jù)進(jìn)行文本分詞,去除停止詞等處理,使得構(gòu)建知識(shí)圖譜的數(shù)據(jù)更精確。
s13、將處理后的數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別。
在一個(gè)實(shí)施例中,可以通過(guò)條件隨機(jī)場(chǎng)模型(crf)機(jī)器學(xué)習(xí)的方法,運(yùn)用crf++工具進(jìn)行命名實(shí)體識(shí)別,如一個(gè)實(shí)施例中,通過(guò)處理后的診斷數(shù)據(jù)得到疾病實(shí)體,通過(guò)處理后的體檢數(shù)據(jù)得到體征實(shí)體,根據(jù)處理后的患者主訴數(shù)據(jù)得到癥狀實(shí)體,根據(jù)處理意見數(shù)據(jù)得到處理實(shí)體,根據(jù)科室信息得到科室實(shí)體。
s14、將識(shí)別的各個(gè)實(shí)體建立關(guān)聯(lián)關(guān)系。
本實(shí)施例中,對(duì)疾病實(shí)體,分別與癥狀實(shí)體、體征實(shí)體、處理實(shí)體、科室實(shí)體建立關(guān)聯(lián)關(guān)系,該關(guān)聯(lián)關(guān)系強(qiáng)度采用以下公式:
z=x/y
其中,y表示某項(xiàng)疾病的病歷份數(shù),x表示某項(xiàng)疾病的病歷中目標(biāo)實(shí)體出現(xiàn)的總次數(shù),所述目標(biāo)實(shí)體為癥狀實(shí)體、體征實(shí)體、處理實(shí)體、科室實(shí)體中的任一個(gè)。
s15、根據(jù)各個(gè)實(shí)體以及各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,建立醫(yī)學(xué)知識(shí)圖譜。
具體地,將處理后的實(shí)體依據(jù)關(guān)聯(lián)關(guān)系形成的實(shí)體對(duì)及其相應(yīng)的關(guān)聯(lián)關(guān)系強(qiáng)度值導(dǎo)入neo4j圖形數(shù)據(jù)庫(kù),并可視化,生成所述醫(yī)學(xué)知識(shí)圖譜。
在進(jìn)一步的實(shí)施例中,當(dāng)使用上述知識(shí)圖譜進(jìn)行輔助診斷后,根據(jù)診斷后的疾病結(jié)果,以及患者的主訴及檢查數(shù)據(jù),對(duì)相應(yīng)實(shí)體之間的關(guān)聯(lián)強(qiáng)度值進(jìn)行更新,其關(guān)系強(qiáng)度為z=(x+1)/(y+1),其中y為已處理錄入的該項(xiàng)疾病的病歷份數(shù),x為已處理錄入的該項(xiàng)疾病的病歷中目標(biāo)實(shí)體出現(xiàn)次數(shù)。
本發(fā)明的醫(yī)學(xué)知識(shí)圖譜,將電子病歷作為建立知識(shí)圖譜的源數(shù)據(jù),通過(guò)建立各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,從而能夠建立精確的知識(shí)圖譜,為醫(yī)護(hù)人員對(duì)疾病的針對(duì)起到很好的輔助作用,并能夠?yàn)獒t(yī)護(hù)人員減輕工作負(fù)擔(dān),有效緩解了醫(yī)療壓力,從而降低醫(yī)療事故的發(fā)生。
在本發(fā)明的另一個(gè)實(shí)施例中,提供一種基于醫(yī)學(xué)知識(shí)圖譜的輔助診斷方法,如圖2所示,其具體步驟包括:
s21、獲取患者的主訴數(shù)據(jù)和檢查數(shù)據(jù);
s22、對(duì)所述主訴數(shù)據(jù)和檢查數(shù)據(jù)進(jìn)行預(yù)處理,得到患者的癥狀實(shí)體和體征實(shí)體構(gòu)成的集合;如對(duì)主訴數(shù)據(jù)和檢查數(shù)據(jù)進(jìn)行文本分詞、去除停止詞、以及命名實(shí)體識(shí)別處理等,以得到癥狀實(shí)體和體征實(shí)體構(gòu)成的集合。
s23、在醫(yī)學(xué)知識(shí)圖譜中查找與所述癥狀實(shí)體和體征實(shí)體相關(guān)聯(lián)的疾病實(shí)體集合;
根據(jù)步驟s22得到的癥狀實(shí)體和體征實(shí)體的集合中的實(shí)體與疾病實(shí)體的關(guān)聯(lián)關(guān)系,在醫(yī)學(xué)知識(shí)圖譜中查找疾病實(shí)體集合d{d1,d2,...dn}。
在上述過(guò)程中,可以設(shè)定疾病di對(duì)癥狀實(shí)體或體征實(shí)體sj的條件概率p(sj|di)為兩實(shí)體之間的關(guān)系強(qiáng)度值,即p(sj|di)=x/y。
s24、根據(jù)步驟s23得到的疾病實(shí)體和步驟s22得到的每個(gè)疾病實(shí)體所對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的集合,分別計(jì)算每個(gè)疾病實(shí)體在其對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的集合下的后驗(yàn)概率;
s25、輸出后驗(yàn)概率最大的疾病實(shí)體及其關(guān)聯(lián)節(jié)點(diǎn)對(duì)應(yīng)的數(shù)據(jù)。
在上述過(guò)程中,對(duì)應(yīng)疾病實(shí)體集合d中的n個(gè)疾病實(shí)體,通過(guò)關(guān)聯(lián)關(guān)系找到癥狀實(shí)體與體征實(shí)體對(duì)應(yīng)的n個(gè)集合。對(duì)于疾病di,在對(duì)應(yīng)的癥狀實(shí)體與體征實(shí)體構(gòu)成的集合{t1,t2,...tk}下的后驗(yàn)概率為:
其中,
通過(guò)上述計(jì)算的后驗(yàn)概率,將后驗(yàn)概率最大的疾病及其關(guān)聯(lián)節(jié)點(diǎn)對(duì)應(yīng)的數(shù)據(jù)作為診斷結(jié)果。
本實(shí)施例的基于醫(yī)學(xué)知識(shí)圖譜的計(jì)算機(jī)輔助診斷方法,使用終端設(shè)備采集患者主訴,檢查數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行醫(yī)學(xué)語(yǔ)言處理mlp(分詞、去停止詞),命名實(shí)體識(shí)別處理,得到相應(yīng)實(shí)體信息,依托已構(gòu)建的醫(yī)學(xué)知識(shí)圖譜,通過(guò)關(guān)聯(lián)關(guān)系,找到對(duì)應(yīng)的候選疾病集,然后采用貝葉斯算法進(jìn)行輔助診斷,確認(rèn)患者所患何種疾病,為臨床醫(yī)學(xué)提供智能化的輔助診斷。
在本發(fā)明的又一個(gè)實(shí)施例中,提供一種醫(yī)學(xué)知識(shí)圖譜的構(gòu)建裝置,如圖2所示,該裝置包括:
用戶詞典構(gòu)建單元10,用于收集醫(yī)學(xué)數(shù)據(jù)庫(kù)中的數(shù)據(jù),構(gòu)建用戶詞典;
數(shù)據(jù)處理單元20,用于根據(jù)所述用戶詞典和停止詞詞庫(kù),對(duì)電子病歷數(shù)據(jù)進(jìn)行處理;
實(shí)體識(shí)別單元30,用于對(duì)數(shù)據(jù)處理單元處理后的數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別;
關(guān)聯(lián)關(guān)系建立單元40,用于對(duì)實(shí)體識(shí)別單元30形成的各個(gè)實(shí)體建立關(guān)聯(lián)關(guān)系;
醫(yī)學(xué)知識(shí)圖譜構(gòu)建單元50,用于根據(jù)所述各個(gè)實(shí)體以及各個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系,建立醫(yī)學(xué)知識(shí)圖譜。
具體地,上述實(shí)施例中,實(shí)體識(shí)別單元30包括:
疾病實(shí)體識(shí)別子單元,用于對(duì)處理后的診斷數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到疾病實(shí)體;
體征實(shí)體識(shí)別子單元,用于對(duì)處理后的體檢數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到體征實(shí)體;
癥狀實(shí)體識(shí)別子單元,用于對(duì)處理后的患者主訴數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到癥狀實(shí)體;
處理實(shí)體識(shí)別子單元,用于對(duì)處理后的處理意見數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別,得到處理實(shí)體;
科室實(shí)體識(shí)別子單元,用于對(duì)處理后的科室信息進(jìn)行命名實(shí)體識(shí)別,得到科室實(shí)體。
在又一個(gè)實(shí)施例中,本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建裝置還包括:更新單元,用于根據(jù)當(dāng)前獲取的患者診斷結(jié)果和患者主訴及檢查數(shù)據(jù),對(duì)相應(yīng)實(shí)體之間的關(guān)聯(lián)強(qiáng)度進(jìn)行實(shí)時(shí)更新。
本發(fā)明的醫(yī)學(xué)知識(shí)圖譜的構(gòu)建方法、裝置及輔助診斷方法,通過(guò)使用醫(yī)學(xué)知識(shí)圖譜進(jìn)行輔助診斷,能夠減輕醫(yī)護(hù)人員工作負(fù)擔(dān),有效緩解醫(yī)療壓力,從而降低醫(yī)療事故的發(fā)生。同時(shí),對(duì)于醫(yī)護(hù)工作者憑借經(jīng)驗(yàn)不能確診的病例,提供了精確的計(jì)算機(jī)輔助診斷,對(duì)醫(yī)護(hù)人員工作的有力支撐。
此外,對(duì)于沒有相應(yīng)醫(yī)學(xué)專業(yè)知識(shí)背景的普通人,通過(guò)自身癥狀,依靠系統(tǒng)而了解自身所患的疾病信息以及相應(yīng)的治療意見,了解基本的可行的疾病應(yīng)對(duì)方法。
以上實(shí)施方式僅用于說(shuō)明本發(fā)明,而并非對(duì)本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。