本發(fā)明涉及醫(yī)療技術領域,尤其涉及一種臨床診斷模型的構建方法及構建系統(tǒng)、臨床診斷系統(tǒng)。
背景技術:
目前醫(yī)生主要通過培訓等專業(yè)學習,依靠個人經驗進行判斷疾病,容易由于經驗判斷而產生誤診。由于醫(yī)生對病癥知識掌握有限,不可能掌握所有疾病的癥狀。尤其是??漆t(yī)生,臨床上往往只能對日常熟悉的病癥進行診斷,而對于不常見疾病不能很好做出判斷,容易產生誤診。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種臨床診斷模型的構建方法及構建系統(tǒng)、臨床診斷系統(tǒng),用于提高醫(yī)生診病的準確度。
為達到上述目的,本發(fā)明提供的臨床診斷模型的構建方法采用如下技術方案:
一種臨床診斷模型的構建方法包括:
步驟s1、進行數據采集,數據采集源為多個電子病歷;
步驟s2、對采集到的數據進行處理;
步驟s3、根據處理后的數據中的已知典型病歷建立病例分析模型,并對病歷分析模型進行訓練評估;
步驟s4、將訓練評估完成的模型應用到臨床診斷系統(tǒng)中,形成臨床診斷模型。
示例性地,步驟s1中的電子病歷的數據包括病人的基本信息、用藥歷史、患病史、癥狀主訴和檢查指標。
可選地,步驟s1中采用數據倉庫技術進行數據的采集。
示例性地,步驟s2具體包括:
子步驟s21、去掉未確診和關鍵信息缺失的數據;
子步驟s22、篩選出數據量大且數據可用度好的疾病種類;
子步驟s23、通過疾病共用條件篩選可能病癥;
子步驟s24、獲取患者癥狀主訴數據、檢查指標數據;
子步驟s25、根據統(tǒng)計學概率分析理論將篩選出的可能病癥與患者癥狀主訴數據、檢查指標數據進行概率分析。
示例性地,步驟s3中對病歷分析模型進行訓練評估具體包括:逐層對臨床診斷模型進行訓練評估。
進一步地,逐層對臨床診斷模型進行訓練評估具體包括:
針對有核心癥狀詞的病癥,通過核心癥狀詞進行初級判斷過濾,根據過濾結果進行逐層分析,通過回歸、分析、聚類算法將診斷結果輸出;
針對無典型指向的病癥,通過貝葉斯網絡神經網絡模型進行算法精細化診斷,通過分析后將診斷結果按照近似概率輸出。
示例性地,病歷分析模型的權重為:w=(w1,w2,…,wn),其中,w1、w2,…,wn均表示各個癥狀的權重,n為大于或者等于1的正整數;
p(w)為在未給定任何數據時的先驗概率,在給了訓練數據d后,其后驗概率p(w|d)為:
示例性地,數據采集源包括多個病癥的電子病歷時,針對每個病癥分別執(zhí)行步驟s1~步驟s4,以獲得針對不同病癥的多個臨床診斷模型。
本發(fā)明提供的臨床診斷模型的構建方法包括如上所述的步驟,從而使得使用該構建方法構建的臨床診斷模型應用到臨床診斷系統(tǒng)中后,通過錄入病人的基本信息,例如,年齡、性別、病史等,然后錄入主訴條件,臨床診斷系統(tǒng)即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫(yī)生在診斷時可以參考臨床診斷系統(tǒng)列出的患病概率,針對可疑疾病,通過醫(yī)生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫(yī)生診病的準確度的效果。
本發(fā)明提供的臨床診斷模型的構建系統(tǒng)采用如下技術方案:
臨床診斷模型的構建系統(tǒng)包括:
數據采集模塊,用于進行數據采集,數據采集源為多個電子病歷;
數據處理模塊,用于對采集到的數據進行處理;
模型訓練評估模塊,用于根據處理后的數據中的已知典型病歷建立病例分析模型,并對病歷分析模型進行訓練評估;以及
模型應用模塊,用于將訓練評估完成的模型應用到臨床診斷系統(tǒng)中,形成臨床診斷模型。
該臨床診斷模型的構建系統(tǒng)具有和上述臨床診斷模型的構建方法相同的有益效果,此處不再進行贅述。
本發(fā)明提供的臨床診斷系統(tǒng)采用如下技術方案:
臨床診斷系統(tǒng)包括:
輸入裝置,用于輸入患者的基本信息、癥狀主訴和檢查指標;
診斷裝置,用于根據患者的基本信息、癥狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,臨床診斷模型為使用如權利要求1~8任一項所述的臨床診斷模型的構建方法構建所得;
顯示裝置,用于顯示診斷出的可能的疾病及其概率。
醫(yī)生在使用該臨床診斷系統(tǒng)的過程中,通過錄入病人的基本信息,例如,年齡、性別、病史等,然后錄入主訴條件,臨床診斷系統(tǒng)即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫(yī)生在診斷時可以參考臨床診斷系統(tǒng)列出的患病概率,針對可疑疾病,通過醫(yī)生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫(yī)生診病的準確度的效果。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例中的臨床診斷模型的構建方法的流程圖;
圖2為本發(fā)明實施例中的臨床診斷系統(tǒng)的示意圖。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例提供一種臨床診斷模型的構建方法,具體地,如圖1所示,該臨床診斷模型的構建方法包括:
步驟s1、進行數據采集,數據采集源為多個電子病歷。
可選地,數據采集源為三甲醫(yī)院多年積累的電子病歷,電子病歷的數據要完整,應包括病人的基本信息、用藥歷史、患病史、癥狀主訴、檢查指標等。在本發(fā)明實施例中,可選地,步驟s1中采用數據倉庫技術進行數據的采集,以備后續(xù)的數據處理及模型訓練使用。其中,數據倉庫技術的英文為extract-transform-load,簡寫為etl,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。
步驟s2、對采集到的數據進行處理。
為了提高臨床診斷模型的準確性,本發(fā)明實施例中選擇對采集到的數據進行處理后再進行模型的訓練。
具體數據處理方式可以包括:首先,去掉未確診和關鍵信息缺失的數據;然后,篩選出數據量大且數據可用度好的疾病種類;接著,通過疾病共用條件篩選可能病癥;然后,獲取患者癥狀主訴數據、檢查指標數據;最后,根據統(tǒng)計學概率分析理論將篩選出的可能病癥與患者癥狀主訴數據、檢查指標數據進行概率分析。
當然,本領域技術人員也可以采用其他數據處理方式,只要能達到上述目的即可,此處不進行限定。
步驟s3、根據處理后的數據中的已知典型病歷建立病例分析模型,并對病歷分析模型進行訓練評估。
示例性地,步驟s3中對病歷分析模型進行訓練評估具體包括:逐層對臨床診斷模型進行訓練評估。
進一步地,逐層對臨床診斷模型進行訓練評估具體包括:
針對有核心癥狀詞的病癥,通過核心癥狀詞進行初級判斷過濾,根據過濾結果進行逐層分析,通過回歸、分析、聚類算法將診斷結果輸出,相當于快速定位初級分類;
針對無典型指向的病癥,通過貝葉斯網絡神經網絡模型進行算法精細化診斷,通過分析后將診斷結果按照近似概率輸出。
模型應用核心是以最大似然(誤差最小)獲得網絡權重的一個解(一個權重向量)。而貝葉斯方法考慮的權重空間(即權重的整個解空間上許多解)上權重的概率分布,通過先驗概論表達不同權重值的相對置信度。當越來越多的數據觀測到,權重的后驗概率會逐漸集中到權重空間的局部上。當觀測到更多數據時,后驗概率會逐步收縮。
示例性地,某一病歷分析模型的權重為:w=(w1,w2,…,wn),其中,w1、w2,…,wn均表示各個癥狀的權重,n為大于或者等于1的正整數;
p(w)為在未給定任何數據時的先驗概率,一般很難傾向于某個模型時,就給所有模型賦予同樣的先驗概率,在給了訓練數據d后,其后驗概率p(w|d)為:
實踐表明,模型越復雜,它能描述的數據集越廣。貝葉斯方法中,可以選擇evidence(證據)最大的模型,也可以利用所有的模型,它會將所有模型的輸出進行加權而得到最終輸出,其權重就是每個模型的evidence。越好的模型對輸出貢獻越大。
根據數據積累情況增加模型參數權重結果,模型越接近實際典型病癥判斷標準對實際運算輸出貢獻越大。由于判斷模型是通過訓練數據獲得的,因此可以避免單獨切分出測試數據,減少交叉驗證環(huán)節(jié)。
上述提及的貝葉斯網絡是基于概率推理的數學模型,具有處理不確定性信息的處理能力,通過大規(guī)模數據訓練,逐步提高準確度的優(yōu)勢。
基于貝葉斯-深層神經網絡具有以下特性:具有很強的容錯性,這是因為信息是分布存貯于網絡內的神經元中;并行處理方法,人工神經元網絡在結構上是并行的,而且網絡的各個單元可以同時進行類似的處理過程,使得計算快速;自學習、自組織、自適應性,神經元之間的連接多種多樣,各元之間聯(lián)接強度具有一定可塑性,使得神經網絡可以處理不確定或不知道的系統(tǒng);可以充分逼近任意復雜的非線性關系;具有很強的信息綜合能力,能同時處理定量和定性的信息,能很好的協(xié)調多種輸入信息關系,適用于處理復雜非線性和不確定對象。
步驟s4、將訓練評估完成的模型應用到臨床診斷系統(tǒng)中,形成臨床診斷模型。
本發(fā)明實施例中通過提取醫(yī)院臨床積累的診斷數據,通過疾病共用條件篩選可能病癥,通過獲取患者癥狀主訴數據、檢查指標數據并進行預處理,根據統(tǒng)計學概率分析理論將診斷后的疾病庫與患者主訴、各種檢查指標進行概率分析。處理后的數據利用貝葉斯算法進行訓練形成疾病與癥狀、檢查指標的概率診斷模型。再對訓練后的診斷模型進行評估,最后將達到要求的模型應用到輔助診斷過程中。其中,利用貝葉斯理論訓練的過程中,針對癥狀主訴數據的特點,從兩方面進行了優(yōu)化,一方面是利用核心癥狀詞表在計算向量權重時賦予絕對權重,另一方面是利用疾病大類和特點,采用分層的貝葉斯模型進行訓練。通過訓練癥狀主訴、檢查指標等不斷優(yōu)化,提高疾病輔助診斷模型的準確性,在基層醫(yī)生疾病診斷場景下,提醒醫(yī)生可能存在的疾病及概率,避免醫(yī)生漏診,同時通過疾病對應的癥狀,引導醫(yī)生對患者進行提問驗證,逐步提高基層醫(yī)生的疾病診斷能力。
此外,在本發(fā)明實施例中,當數據采集源包括多個病癥的電子病歷時,可以針對每個病癥分別執(zhí)行步驟s1~步驟s4,以獲得針對不同病癥的多個臨床診斷模型。將多個臨床診斷模型應用于臨床診斷系統(tǒng)中后,通過主訴癥狀以及檢查指標等不僅可以獲得患者患某種特定病癥的可能性,還可以獲得患者患其他病癥的可能性,可輔助醫(yī)生確定最可能的病癥,進而為醫(yī)生的進一步確診提供保證。
本發(fā)明實施例還提供一種臨床診斷模型的構建系統(tǒng),該臨床診斷模型的構建系統(tǒng)與上述構建方法相對應,具體地,該臨床診斷模型的構建系統(tǒng)包括:
數據采集模塊,用于進行數據采集,數據采集源為多個電子病歷;
數據處理模塊,用于對采集到的數據進行處理;
模型訓練評估模塊,用于根據處理后的數據中的已知典型病歷建立病例分析模型,并對病歷分析模型進行訓練評估;以及
模型應用模塊,用于將訓練評估完成的模型應用到臨床診斷系統(tǒng)中,形成臨床診斷模型。
需要補充的是,各模塊執(zhí)行其功能的具體細節(jié)可以參照上述臨床診斷模型的構建方法各步驟的相關描述,此處不再進行贅述。
使用該臨床診斷模型的構建系統(tǒng)構建的臨床診斷模型應用到臨床診斷系統(tǒng)中后,通過錄入病人的基本信息,例如,年齡、性別、病史等,然后錄入主訴條件,臨床診斷系統(tǒng)即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫(yī)生在診斷時可以參考臨床診斷系統(tǒng)列出的患病概率,針對可疑疾病,通過醫(yī)生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫(yī)生診病的準確度的效果。
此外,本發(fā)明實施例還提供一種臨床診斷系統(tǒng),該臨床診斷系統(tǒng)包括輸入裝置,用于輸入患者的基本信息、癥狀主訴和檢查指標;診斷裝置,用于根據患者的基本信息、癥狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,臨床診斷模型為使用如上所述的臨床診斷模型的構建方法或構建系統(tǒng)構建所得;顯示裝置,用于顯示診斷出的可能的疾病及其概率。
可選地,輸入裝置為電腦的鍵盤,顯示裝置為電腦的顯示器,診斷裝置和臨床診斷模型均集成在電腦的主機的cpu中。
在該臨床診斷系統(tǒng)中,通過錄入病人的基本信息,例如,年齡、性別、病史等,然后錄入主訴條件,臨床診斷系統(tǒng)即可根據錄入的信息,列出診斷出的可能的疾病及其概率,進而使得醫(yī)生在診斷時可以參考臨床診斷系統(tǒng)列出的患病概率,避免醫(yī)生漏診,針對可疑疾病,通過醫(yī)生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫(yī)生診病的準確度的效果。該臨床診斷模型可以作為醫(yī)生學習和輔助診斷的工具。
示例性地,如圖2所示,該臨床診斷系統(tǒng)的診斷裝置可以包括疾病共用條件庫、查體陽性指標庫、疾病庫、疾病診療庫、癥狀描述資源庫和癥狀關系庫;臨床診斷系統(tǒng)的顯示裝置中對應顯示有主訴錄入區(qū)。示例性地,疾病共用條件庫中的疾病條件包括性別、年齡、病史、疾病自身條件等;查體陽性指標庫中的指標包括查體胃區(qū)壓痛、胃鏡提示出血、炎癥、潰瘍、無胸腔積液、胸腔積液心音遙遠、肺部哮鳴音咳出白痰后緩解、查體局部壓痛、心彩超未見異常、ecg僅提示st改變、心彩超提示節(jié)段性運動障礙、ecg提示st段抬高/壓低紙診斷標準等;疾病庫包括食管/胃炎癥、胸膜炎、哮喘肺部疾病、肋軟骨炎、冠心病(心絞痛)等;疾病診療庫包括疾病癥狀、疾病檢查、疾病治療等;癥狀描述資源庫包括癥狀圖片、癥狀別名、癥狀描述等;與上述疾病庫對應的,癥狀關系庫中的癥狀包括:反酸、噯氣;黑便;針刺樣疼痛,咽食后明顯;針刺樣疼痛;針刺樣疼痛,隨呼吸變化;胸痛;隨咳嗽加重;與活動無關;乳房牽涉痛;胸悶,呼吸困難;惡心,嘔吐;局部腫脹;活動后加劇;壓榨樣,憋悶樣,絞痛;頭暈等;主訴錄入區(qū)可以錄入性別、年齡、主訴條件輸入、病史等。
以患者具有反酸、噯氣、黑便、針刺樣疼痛,咽食后明顯以及惡心、嘔吐的癥狀為例,在使用上述疾病診斷系統(tǒng)對患者進行診斷的過程中,先通過輸入裝置將反酸、噯氣、黑便、針刺樣疼痛,咽食后明顯以及惡心、嘔吐的癥狀輸入,然后,診斷裝置根據患者的基本信息、癥狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,可能的疾病包括食管/胃炎癥,急性心梗,食管/胃炎癥的概率為65%,急性心梗的概率為10%;最后通過顯示裝置顯示診斷出的可能的疾病及其概率。
需要補充的是,上述診斷裝置根據患者的基本信息、癥狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率的具體方式可以為:將癥狀主訴和檢查指標作為臨床診斷模型的輸入,然后應用臨床診斷模型對癥狀主訴和檢查指標進行處理,篩選出可能病癥及其概率并輸出第一結果,該第一結果作為診斷裝置的最終輸出;或者,將癥狀主訴和檢查指標作為臨床診斷模型的輸入,然后應用臨床診斷模型對癥狀主訴和檢查指標進行處理,篩選出可能病癥及其概率并輸出第一結果a1,但該第一結果a1在診斷裝置的最終輸出中僅占據一定的權重p1,p1小于1且大于0,診斷裝置還對患者的基本信息進行處理,得到第二結果a2,第二結果a2也占據一定的權重p2,p2小于1且大于0,且p1+p2=1,將a1*p1+a2*p2作為診斷裝置的最終輸出。其中,p1和p2的具體數值的確定可以由醫(yī)生根據其工作經驗確定,或者應用大量的病歷數據統(tǒng)計分析獲得。當然,當篩選出的可能病癥為多個疾病時,本領域技術人員必然知道上述第一結果a1和第二結果a2均應該是包含多個相互獨立的數據,各個數據與各個疾病相對應,此處不再舉例進行描述。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。