本發(fā)明實(shí)施例涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法、裝置及數(shù)據(jù)評(píng)估方法。
背景技術(shù):
病歷是醫(yī)務(wù)人員對(duì)患者疾病的發(fā)生、發(fā)展、轉(zhuǎn)歸,進(jìn)行檢查、診斷、治療等醫(yī)學(xué)活動(dòng)過程所作的文字記錄。病歷既是臨床實(shí)踐工作的總結(jié),又是探索疾病規(guī)律及處理醫(yī)學(xué)糾紛的法律依據(jù),是國家的寶貴財(cái)富。
在臨床醫(yī)學(xué)中,有效整理病歷,從中挖掘醫(yī)生臨床醫(yī)學(xué)經(jīng)驗(yàn),對(duì)醫(yī)學(xué)進(jìn)步具有重大意義。在實(shí)際診療中,由于醫(yī)務(wù)人員本身存在知識(shí)儲(chǔ)備和臨床經(jīng)驗(yàn)等方面的差異性,往往不同的醫(yī)務(wù)人員針對(duì)同一種疾病或者癥狀的診斷方式以及用藥習(xí)慣等也不盡相同,而出現(xiàn)有的收效顯著有的卻見效甚微。而通過組織業(yè)內(nèi)醫(yī)務(wù)人員的進(jìn)行治療經(jīng)驗(yàn)交流,不僅需要大量的人力物力,且不具有實(shí)時(shí)性和普遍共享性。因此,如何有效地從病歷中整理出醫(yī)學(xué)經(jīng)驗(yàn),實(shí)現(xiàn)醫(yī)學(xué)知識(shí)共享顯得尤為重要。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法、裝置及數(shù)據(jù)評(píng)估方法,以有效地從病歷中整理出醫(yī)學(xué)經(jīng)驗(yàn),實(shí)現(xiàn)醫(yī)學(xué)知識(shí)共享。
第一方面,本發(fā)明實(shí)施例提供了一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法,該方法包括:
根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練;
根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練;
根據(jù)訓(xùn)練完成后的所述生成式模型生成第二偽造數(shù)據(jù),并根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)所述第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
第二方面,本發(fā)明實(shí)施例還提供了一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立裝置,該裝置包括:
生成式模型訓(xùn)練模塊,用于根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練;
鑒別式模型訓(xùn)練模塊,用于根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練;
醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型生成模塊,用于根據(jù)訓(xùn)練完成后的所述生成式模型生成第二偽造數(shù)據(jù),并根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)所述第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
第三方面,本發(fā)明實(shí)施例還提供了一種基于醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的數(shù)據(jù)評(píng)估方法,該方法包括:
獲取用戶輸入的患者數(shù)據(jù);其中,所述患者數(shù)據(jù)包括患者當(dāng)前的病情描述;
采用本發(fā)明任意實(shí)施例所述的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法所建立的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型對(duì)當(dāng)前輸入的所述患者數(shù)據(jù)進(jìn)行處理,輸出與所述患者數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)評(píng)估結(jié)果進(jìn)行顯示;其中,所述數(shù)據(jù)評(píng)估結(jié)果包括與患者當(dāng)前的病情描述所對(duì)應(yīng)的疾病類型。
本發(fā)明實(shí)施例的技術(shù)方案,首先通過歷史病歷樣本中的目標(biāo)數(shù)據(jù)即來訓(xùn)練生成式模型,使得生成式模型能夠比較好地?cái)M合真實(shí)的病歷數(shù)據(jù);然后根據(jù)生成式模型生成第一偽造數(shù)據(jù)以及真實(shí)病歷數(shù)據(jù)來訓(xùn)練鑒別式模型,使得鑒別式模型能夠很好地識(shí)別哪些是真實(shí)的病歷數(shù)據(jù),哪些是第一偽造數(shù)據(jù);進(jìn)而根據(jù)鑒別式模型對(duì)生成式模型生成第二偽造數(shù)據(jù)的鑒別結(jié)果調(diào)整生成式模型的參數(shù),目的是讓生成式模型生成的假數(shù)據(jù),與真實(shí)病歷非常相似,從而使得生成式模型也針對(duì)歷史病歷樣本中沒有覆蓋到的目標(biāo)數(shù)據(jù),能夠有效地從歷史病歷樣本中整理出臨床醫(yī)學(xué)經(jīng)驗(yàn),很好地實(shí)現(xiàn)對(duì)醫(yī)學(xué)經(jīng)驗(yàn)的總結(jié),促進(jìn)醫(yī)學(xué)進(jìn)步。
附圖說明
為了更加清楚地說明本發(fā)明示例性實(shí)施例的技術(shù)方案,下面對(duì)描述實(shí)施例中所需要用到的附圖做一簡單介紹。顯然,所介紹的附圖只是本發(fā)明所要描述的一部分實(shí)施例的附圖,而不是全部的附圖,對(duì)于本領(lǐng)域普通技術(shù)人員,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖得到其他的附圖。
圖1為本發(fā)明實(shí)施例一提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程圖;
圖2為本發(fā)明實(shí)施例二提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程圖;
圖3為本發(fā)明實(shí)施例三提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程圖;
圖4為本發(fā)明實(shí)施例四提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立裝置的結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖并通過具體實(shí)施方式來進(jìn)一步說明本發(fā)明的技術(shù)方案。可以理解的是,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
實(shí)施例一
圖1為本發(fā)明實(shí)施例一所提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程示意圖。如圖1所示,本實(shí)施例的方法可以由醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立裝置來執(zhí)行,該裝置可通過硬件和/或軟件的方式實(shí)現(xiàn),并一般可獨(dú)立的配置在服務(wù)器中或者由終端和服務(wù)器配合實(shí)現(xiàn)本實(shí)施例的方法。
本實(shí)施例的方法具體包括:
S110、根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練。
可以理解的是,歷史病歷樣本包括手寫的紙質(zhì)版病歷以及電子化歷史病歷等。其中,歷史病歷樣本中的目標(biāo)數(shù)據(jù)可以包括歷史病歷樣本中所記載的目標(biāo)病情描述,以及與目標(biāo)病情描述對(duì)應(yīng)的一種、兩種或者多種目標(biāo)疾病類型。
示例性地,生成式模型Generator可以是由一個(gè)深度神經(jīng)網(wǎng)絡(luò)多層感知器(Multi-Layer Perceptron,MLP)構(gòu)成。其中,生成式模型Generator的輸入層、隱藏層和輸出層以及網(wǎng)絡(luò)初始參數(shù)可以根據(jù)實(shí)際需求進(jìn)行設(shè)置,在此不做限定。
根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練,可以是根據(jù)歷史病歷樣本中的目標(biāo)病情描述,以及該歷史病歷樣本中與目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型,對(duì)預(yù)設(shè)的生成式模型Generator進(jìn)行訓(xùn)練,即生成式模型Generator輸入的是目標(biāo)病情描述,輸出的是與該目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型。具體可包括:獲取至少一份歷史病歷樣本中的目標(biāo)病情描述,以及與所述病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型;根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練。
在本操作中,采用歷史病歷樣本中的目標(biāo)數(shù)據(jù)來訓(xùn)練生成式模型Generator,使得這樣生成式模型Generator的參數(shù)能夠比較好得擬合真實(shí)的病歷數(shù)據(jù)。
S120、根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練。
在本實(shí)施例中,第一偽造數(shù)據(jù)與目標(biāo)數(shù)據(jù)相對(duì)應(yīng),可以理解為歷史病歷樣本中沒有覆蓋到的數(shù)據(jù)。類似地,第一偽造數(shù)據(jù)可以包括隨機(jī)生成的第一偽造病情描述,以及與第一偽造病情描述對(duì)應(yīng)的一種、兩種或者多種第一偽造疾病類型。其中,第一偽造疾病類型由第一偽造病情描述輸入訓(xùn)練完成后的生成式模型,經(jīng)生成式模型處理后得到。值得注意的是,第一偽造數(shù)據(jù)并不一定不符合醫(yī)學(xué)理論,換言之,在臨床醫(yī)學(xué)上,隨機(jī)生成的第一偽造病情并不一定不能診斷出第一偽造疾病類型,第一偽造病情與第一偽造疾病類型之間的關(guān)系也可能是符合醫(yī)學(xué)原理的。
需要說明的是,“第一偽造數(shù)據(jù)”中的“第一”僅僅用于與之后出現(xiàn)的偽造數(shù)據(jù)進(jìn)行區(qū)分,“第一”本身并沒有特殊含義。
示例性地,鑒別式模型Discriminator可以由一個(gè)深度神經(jīng)網(wǎng)絡(luò)多層感知器(Multi-Layer Perceptron,MLP)構(gòu)成。若將目標(biāo)數(shù)據(jù)定義為真數(shù)據(jù),第一偽造數(shù)據(jù)定義為偽數(shù)據(jù),則根據(jù)目標(biāo)數(shù)據(jù)和第一偽造數(shù)據(jù)進(jìn)行訓(xùn)練的預(yù)設(shè)的鑒別式模型,旨在辨別輸入數(shù)據(jù)的真?zhèn)?,即鑒別式模型Discriminator訓(xùn)練的目的是,使得鑒別式模型能夠更精準(zhǔn)地鑒別哪些數(shù)據(jù)來自于真實(shí)病歷,哪些是基于生成式模型Generator偽造出的數(shù)據(jù),也可以理解為,鑒別式模型用于鑒別輸入數(shù)據(jù)是不是存在于歷史病歷樣本中。對(duì)于鑒別式模型來說,輸入目標(biāo)數(shù)據(jù)之后的理想鑒別結(jié)果為真數(shù)據(jù);輸入第一偽造數(shù)據(jù)之后的理想鑒別結(jié)果為假數(shù)據(jù)。
具體地,根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練,可以包括:將隨機(jī)生成的第一偽造病歷描述輸入訓(xùn)練完成后的所述生成式模型中,輸出與所述第一偽造病情描述對(duì)應(yīng)的至少一種第一偽造疾病類型;進(jìn)而,根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練。
S130、根據(jù)訓(xùn)練完成后的所述生成式模型生成第二偽造數(shù)據(jù),并根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)所述第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
類似地,第二偽造數(shù)據(jù)可以包括隨機(jī)生成的第二偽造病情描述,以及與第二偽造病情描述對(duì)應(yīng)的一種、兩種或者多種第二偽造疾病類型。其中,第二偽造疾病類型由第二偽造病情描述輸入訓(xùn)練完成后的生成式模型,經(jīng)生成式模型處理后得到。值得注意的是,第二偽造數(shù)據(jù)并不一定不符合醫(yī)學(xué)理論,換言之,在臨床醫(yī)學(xué)上,隨機(jī)生成的第二偽造病情并不一定不能診斷出第二偽造疾病類型,第二偽造病情與第二偽造疾病類型之間的關(guān)系也可能是符合醫(yī)學(xué)原理的。
需要說明的是,“第二偽造數(shù)據(jù)”中的“第二”僅僅用于與之前出現(xiàn)的“第一偽造數(shù)據(jù)”進(jìn)行區(qū)分,“第一”與“第二”本身并沒有特殊含義。
示例性地,預(yù)設(shè)平衡條件可以包括:基于預(yù)設(shè)次數(shù)的訓(xùn)練后所述生成式模型及所述鑒別式模型所對(duì)應(yīng)的預(yù)設(shè)的各評(píng)價(jià)函數(shù)中同一所述評(píng)價(jià)函數(shù)的各函數(shù)值隨著訓(xùn)練次數(shù)的增加而收斂。其中,評(píng)價(jià)函數(shù)可包括擬合評(píng)價(jià)函數(shù)、鑒別評(píng)價(jià)函數(shù)以及生成評(píng)價(jià)函數(shù)等。
以生成式模型為例,假設(shè)生成式模型的訓(xùn)練數(shù)據(jù)包含N條數(shù)據(jù),其中,N為正整數(shù)。那么實(shí)際上每一輪訓(xùn)練時(shí),生成式模型的參數(shù)就被調(diào)整了N次。每一輪訓(xùn)練結(jié)束后,可以計(jì)算一下調(diào)整后的生成式模型的評(píng)價(jià)函數(shù),記為Losst=1。然后,用同樣的N條數(shù)據(jù),我們對(duì)模型做第二次訓(xùn)練。結(jié)束后,再計(jì)算一下生成式模型的評(píng)價(jià)函數(shù)Losst=2;依此類推,用同樣的N條數(shù)據(jù),重復(fù)訓(xùn)練過程M次,每次訓(xùn)練結(jié)束后,都計(jì)算一下評(píng)價(jià)函數(shù)Losst。則在此過程中,生成式模型的參數(shù)總共被調(diào)整了N*M次。
為了使得訓(xùn)練后的生成是模型的輸出結(jié)果盡可能的精準(zhǔn)或達(dá)到預(yù)期,可以基于海量歷史病歷樣本對(duì)生成式模型進(jìn)行多次的訓(xùn)練。在訓(xùn)練達(dá)到或超過預(yù)設(shè)的次數(shù)閾值時(shí),可以選取靠近最后一次訓(xùn)練的預(yù)設(shè)數(shù)量(次數(shù))的訓(xùn)練作為目標(biāo)評(píng)價(jià)訓(xùn)練,比如,選擇最后20次訓(xùn)練作為目標(biāo)評(píng)價(jià)訓(xùn)練,如果LossM-20,LossM-19,…,LossM-1,LossM彼此的數(shù)值非常接近,從曲線圖上來看,在訓(xùn)練次數(shù)的變化時(shí),LOSS函數(shù)的函數(shù)值變化很小或者不再變化,換而言之,LOSS函數(shù)收斂了,那么訓(xùn)練就可以結(jié)束了。
綜上,預(yù)設(shè)平衡條件可以,用公式表示為其中,M是生成式模型的訓(xùn)練次數(shù);τ是預(yù)設(shè)的收斂閾值,例如可取5%或0.05。
具體地,根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)生成式模型生成第二偽造數(shù)據(jù)的鑒別結(jié)果,對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整,可以包括:將隨機(jī)生成的第二偽造病情描述輸入訓(xùn)練完成后的所述生成式模型,輸出與所述第二偽造病情描述對(duì)應(yīng)的所述第二偽造疾病類型;將所述第二偽造病情描述以及所述第二偽造疾病類型輸入訓(xùn)練完成后的所述鑒別式模型中,獲取與所述第二偽造病情描述以及所述第二偽造疾病類型對(duì)應(yīng)的參考鑒別結(jié)果;根據(jù)所述參考鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
需要說明的是,第一偽造數(shù)據(jù)與第二偽造數(shù)據(jù)可以相同也可以不相同。為了更好地實(shí)現(xiàn)鑒別式模型對(duì)第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)生成式模型的反調(diào)整,可以采用與第一偽造數(shù)據(jù)不同的第二偽造數(shù)據(jù)輸入鑒別式模型,獲取與第二偽造數(shù)據(jù)對(duì)應(yīng)的參考鑒別結(jié)果。
上述技術(shù)方案,相當(dāng)于對(duì)生成式模型的第二次訓(xùn)練,可以讓生成式模型盡可能迷惑鑒別式模型,目的是使得生成式模型生成的偽數(shù)據(jù),與真實(shí)病歷非常相似,以覆蓋真實(shí)病例中沒有覆蓋到的數(shù)據(jù),也可以理解為借助歷史病歷樣本中的真實(shí)數(shù)據(jù),更好地評(píng)估出與輸入數(shù)據(jù)對(duì)應(yīng)的輸出數(shù)據(jù)。
本實(shí)施例的技術(shù)方案,首先通過歷史病歷樣本中的目標(biāo)數(shù)據(jù)即來訓(xùn)練生成式模型,使得生成式模型能夠比較好地?cái)M合真實(shí)的病歷數(shù)據(jù);然后根據(jù)生成式模型生成第一偽造數(shù)據(jù)以及真實(shí)病歷數(shù)據(jù)來訓(xùn)練鑒別式模型,使得鑒別式模型能夠很好地識(shí)別哪些是真實(shí)的病歷數(shù)據(jù),哪些是第一偽造數(shù)據(jù);進(jìn)而根據(jù)鑒別式模型對(duì)生成式模型生成第二偽造數(shù)據(jù)的鑒別結(jié)果調(diào)整生成式模型的參數(shù),目的是讓生成式模型生成的偽數(shù)據(jù),與真實(shí)病歷非常相似,從而使得生成式模型針對(duì)歷史病歷樣本中沒有覆蓋到的數(shù)據(jù),也能夠很好地實(shí)現(xiàn)對(duì)醫(yī)學(xué)經(jīng)驗(yàn)的總結(jié),有效地從歷史病歷樣本中整理出臨床醫(yī)學(xué)經(jīng)驗(yàn),實(shí)現(xiàn)臨床醫(yī)學(xué)經(jīng)驗(yàn)的共享,促進(jìn)醫(yī)學(xué)進(jìn)步。
實(shí)施例二
圖2為本發(fā)明實(shí)施例二所提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程示意圖,如圖2所示,本實(shí)施例在上述實(shí)施例的基礎(chǔ)上,可選是所述根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練,包括:獲取至少一份歷史病歷樣本中的目標(biāo)病情描述,以及與所述病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型;根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練。
在上述各技術(shù)方案的基礎(chǔ)上,可選地,所述根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練,進(jìn)一步包括:將隨機(jī)生成的第一偽造病歷描述輸入訓(xùn)練完成后的所述生成式模型中,輸出與所述第一偽造病情描述對(duì)應(yīng)的至少一種第一偽造疾病類型;根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練。
在上述各技術(shù)方案的基礎(chǔ)上,進(jìn)一步地,所述根據(jù)訓(xùn)練完成后的所述生成式模型生成第二偽造數(shù)據(jù),并根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)所述第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,具體可包括:將隨機(jī)生成的第二偽造病情描述輸入訓(xùn)練完成后的所述生成式模型,輸出與所述第二偽造病情描述對(duì)應(yīng)的所述第二偽造疾病類型;將所述第二偽造病情描述以及所述第二偽造疾病類型輸入訓(xùn)練完成后的所述鑒別式模型中,獲取與所述第二偽造病情描述以及所述第二偽造疾病類型對(duì)應(yīng)的參考鑒別結(jié)果;根據(jù)所述參考鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
具體地,本實(shí)施例的方法包括:
S210、獲取至少一份歷史病歷樣本中的目標(biāo)病情描述,以及與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型。
示例性地,目標(biāo)病情描述可包括下述中的至少一個(gè):患者的基本信息、生命體征、癥狀、化驗(yàn)指標(biāo)以及檢查標(biāo)志物等。具體地,患者的基本信息可包括性別、年齡、工作性質(zhì)、家庭住址以及經(jīng)濟(jì)收入等等;患者的生命體征可包括身高、體重、體溫、脈搏以及血壓等等;患者的癥狀可包括對(duì)患者不適的主觀描述,在歷史病歷樣本中可用對(duì)話等自然語言表達(dá),譬如頭痛、惡心、眩暈以及食欲不振等;患者的化驗(yàn)指標(biāo)可包括血小板計(jì)數(shù)偏低、白細(xì)胞計(jì)數(shù)偏高、血糖濃度偏高以及尿蛋白計(jì)數(shù)偏高等;患者的檢查標(biāo)志物可包括心電圖特征、腦電圖特征、X光片顯示某區(qū)域有陰影、彩超顯示某區(qū)域低回聲結(jié)節(jié)、CT顯示條索狀陰影以及PET顯示某區(qū)域局部代謝率偏高等。
可以理解的是,在同一份歷史病歷樣本中,與病情描述所對(duì)應(yīng)的目標(biāo)疾病類型可能是一種、兩種或多種,例如,與病情描述所對(duì)應(yīng)的目標(biāo)疾病類型可能包括一種疾病,也可能還包括由該疾病引起的各種并發(fā)癥,或者患者本身就罹患多種疾病。在本實(shí)施例中,與目標(biāo)病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型可理解為同一歷史病歷樣本中與目標(biāo)病情描述所對(duì)應(yīng)的所有的目標(biāo)疾病類型。為了更好地對(duì)生成式模型進(jìn)行訓(xùn)練,可以盡可能多地獲取歷史病歷樣本數(shù)據(jù)?;诤A繗v史病歷樣本對(duì)生成式模型進(jìn)行訓(xùn)練。
S220、根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練。
對(duì)生成式模型的訓(xùn)練旨在通過實(shí)際輸出與目標(biāo)輸出的差距調(diào)整模型的參數(shù),使得輸入的目標(biāo)病情描述經(jīng)過生成式模型的處理后,輸出與目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型。具體地,根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練可包括:將目標(biāo)病情描述輸入預(yù)設(shè)的生成式模型中,輸出與目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型以及估算疾病類型的概率分布;將估算疾病類型與目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整。
采用目標(biāo)病情描述以及與目標(biāo)病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型來訓(xùn)練生成式模型,即采用歷史病歷樣本中真實(shí)的目標(biāo)數(shù)據(jù)來訓(xùn)練生成式模型,能夠使得生成式模型的參數(shù)能夠比較好得擬合真實(shí)的病歷數(shù)據(jù)。
S230、將隨機(jī)生成的第一偽造病歷描述輸入訓(xùn)練完成后的所述生成式模型中,輸出與所述第一偽造病情描述對(duì)應(yīng)的至少一種第一偽造疾病類型。
根據(jù)歷史病歷樣本中的目標(biāo)病情描述以及與目標(biāo)病情描述對(duì)應(yīng)的至少一種目標(biāo)疾病類型訓(xùn)練完成的生成式模型,可根據(jù)輸入的隨機(jī)生成的第一偽造病歷描述,結(jié)合訓(xùn)練后的模型參數(shù),輸出與第一偽造病歷描述對(duì)應(yīng)的第一偽造疾病類型。其中,第一偽造疾病類型的數(shù)量可能是一種、兩種或多種。
S240、根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練。
在本實(shí)施例中,可以將一份歷史病歷樣本中的目標(biāo)病情描述以及與該目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型,即真實(shí)的病歷數(shù)據(jù),作為一組真數(shù)據(jù),輸入預(yù)設(shè)的鑒別模型之后對(duì)應(yīng)的輸出為用于表示該數(shù)據(jù)為真的估算鑒別結(jié)果,例如具體可以是接近或者等于1的概率值;將第一偽造病情描述以及生成式模型輸出的與第一偽造病情描述對(duì)應(yīng)的第一偽造疾病類型,第一偽造病情描述與第一偽造疾病類型作為一組偽數(shù)據(jù),輸入預(yù)設(shè)的鑒別模型之后對(duì)應(yīng)的輸出為用于表示該數(shù)據(jù)為假的估算鑒別結(jié)果,例如具體可以是接近或等于0的概率值。
根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練,目的是為了優(yōu)化鑒別式模型,提升對(duì)真?zhèn)螖?shù)據(jù)的鑒別精準(zhǔn)度。具體可包括:將所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型輸入預(yù)設(shè)的鑒別式模型中,輸出用于表示數(shù)據(jù)真實(shí)性的估算鑒別結(jié)果;將所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果進(jìn)行比較,根據(jù)比較結(jié)果對(duì)所述鑒別式模型的參數(shù)進(jìn)行調(diào)整。
S250、將隨機(jī)生成的第二偽造病情描述輸入訓(xùn)練完成后的所述生成式模型,輸出與所述第二偽造病情描述對(duì)應(yīng)的所述第二偽造疾病類型。
其中,隨機(jī)生成的第二偽造病情描述可以是人為編寫的病歷描述,也可以是將不同歷史病歷樣本中的病情描述打亂重新組合生成的新的病歷描述。可以理解的是,第二偽造病情描述需要經(jīng)過預(yù)處理,去除相互沖突的病情描述。例如,“未見咳嗽”與“濃痰”可以理解為相互沖突的病情描述。
S260、將所述第二偽造病情描述以及所述第二偽造疾病類型輸入訓(xùn)練完成后的所述鑒別式模型中,獲取與所述第二偽造病情描述以及所述第二偽造疾病類型對(duì)應(yīng)的參考鑒別結(jié)果。
由于第二偽造病情描述以及第二偽造疾病類型基于生成式模型生成,因此將第二偽造病情描述以及第二偽造疾病類型輸入訓(xùn)練完成的鑒別式模型中,可以通過鑒別式模型輸出的參考鑒別結(jié)果輔助判斷生成式模型的輸出結(jié)果是否接近真實(shí)數(shù)據(jù),評(píng)價(jià)生成式模型的訓(xùn)練成果。
S270、根據(jù)所述參考鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
根據(jù)參考鑒別結(jié)果對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整,可以是根據(jù)鑒別式模型對(duì)基于生成式模型第二偽造病情描述以及第二偽造疾病類型的參考鑒別結(jié)果,計(jì)算出生成式模型的生成誤差,進(jìn)而根據(jù)生成誤差對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整。具體可以包括:基于參考鑒別結(jié)果以及預(yù)設(shè)的生成評(píng)價(jià)函數(shù)計(jì)算出在當(dāng)前鑒別結(jié)果下所述生成式模型的生成誤差;根據(jù)計(jì)算出的生成誤差采用梯度下降法對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整。
需要說明的是,對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整的目的在于,當(dāng)將偽造的病情描述輸入生成式模型中后,生成式模型所生成的與偽造的病情描述對(duì)應(yīng)的偽造疾病類型,作為偽造數(shù)據(jù)輸入鑒別式模型時(shí),也能夠被鑒別為真實(shí)數(shù)據(jù)。從而使得生成式模型在針對(duì)歷史病歷樣本未覆蓋到的數(shù)據(jù)是,也能夠很好地提供可供參考的醫(yī)學(xué)經(jīng)驗(yàn)。
本實(shí)施例的技術(shù)方案,通過歷史病歷樣本中的目標(biāo)數(shù)據(jù)即目標(biāo)病情描述以及與目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型,對(duì)生成式模型進(jìn)行訓(xùn)練,能夠使得生成式模型根據(jù)輸入的目標(biāo)病情描述準(zhǔn)確地輸出與目標(biāo)病情描述對(duì)應(yīng)的目標(biāo)疾病類型,實(shí)現(xiàn)對(duì)歷史病歷樣本中的醫(yī)學(xué)經(jīng)驗(yàn)的有效總結(jié);考慮到歷史病歷樣本中無法完全覆蓋臨床醫(yī)學(xué)知識(shí),進(jìn)一步通過訓(xùn)練完成的生成式模型生成與隨機(jī)生成的第一偽造病歷描述對(duì)應(yīng)的第一偽造疾病類型,作為偽造數(shù)據(jù),將偽造數(shù)據(jù)與歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)鑒別式模型進(jìn)行訓(xùn)練,使得鑒別式模型能夠準(zhǔn)確地識(shí)別出數(shù)據(jù)的真實(shí)性;進(jìn)而,根據(jù)訓(xùn)練完成的鑒別式模型對(duì)第二偽造病情描述以及第二偽造疾病類型的參考鑒別結(jié)果,對(duì)生成式模型的參數(shù)進(jìn)行反調(diào)整,能夠進(jìn)一步優(yōu)化生成式模型,提升醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的準(zhǔn)確性。
實(shí)施例三
圖3為本發(fā)明實(shí)施例三所提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法的流程示意圖,如圖3所示,本實(shí)施例在上述實(shí)施例的基礎(chǔ)上,可選是所述根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練,包括:將所述目標(biāo)病情描述輸入預(yù)設(shè)的生成式模型中,輸出與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型以及所述估算疾病類型的概率分布;將所述估算疾病類型與所述目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,具體地,所述根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練,可包括:將所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型輸入預(yù)設(shè)的鑒別式模型中,輸出用于表示數(shù)據(jù)真實(shí)性的估算鑒別結(jié)果;將所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果進(jìn)行比較,根據(jù)比較結(jié)果對(duì)所述鑒別式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,進(jìn)一步地,所述根據(jù)所述參考鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,可包括:基于所述參考鑒別結(jié)果以及預(yù)設(shè)的生成評(píng)價(jià)函數(shù)計(jì)算出在當(dāng)前鑒別結(jié)果下所述生成式模型的生成誤差;根據(jù)計(jì)算出的生成誤差采用梯度下降法對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整。
具體地,本實(shí)施例的方法包括:
S301、獲取至少一份歷史病歷樣本中的目標(biāo)病情描述,以及與所述病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型。
S302、將所述目標(biāo)病情描述輸入預(yù)設(shè)的生成式模型中,輸出與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型以及所述估算疾病類型的概率分布。
在本實(shí)施例中,將目標(biāo)病情描述輸入預(yù)設(shè)的生成式模型中,生成式模型根據(jù)已經(jīng)收集到的目標(biāo)病情描述,判斷患者可能罹患的疾病類型。生成式模型的實(shí)際輸出可以表示為條件概率其中,si是第i位患者的目標(biāo)病情描述;di表示第i位患者可能罹患的疾病類型,由于生成式模型輸出的與目標(biāo)病情描述對(duì)應(yīng)的估算疾病類型的數(shù)量可能不止一個(gè),可以采用表示第i位患者可能罹患的第j種疾病類型。即生成式模型Generator的輸入是目標(biāo)病情描述si;生成式模型Generator的輸出是該目標(biāo)病情描述si所對(duì)應(yīng)的患者可能罹患的各種估算疾病類型以及各估算疾病類型所對(duì)應(yīng)的各個(gè)概率pdf(di),也可以理解為各估算疾病類型的概率分布,即
進(jìn)一步地,為了使得生成式模型的輸出結(jié)果具有針對(duì)性,可以把輸出的中超過預(yù)先設(shè)定的閾值的疾病類型作為診斷結(jié)果di。
S303、將所述估算疾病類型與所述目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
具體地,將所述估算疾病類型與所述目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,可包括:基于預(yù)設(shè)的擬合評(píng)價(jià)函數(shù)計(jì)算出所述估算疾病類型與所述目標(biāo)疾病類型之間的擬合誤差;根據(jù)所述擬合誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。示例性地,擬合評(píng)價(jià)函數(shù)用如下公式表示:其中,si表示第i份歷史病歷樣本中的目標(biāo)病情描述;表示第i位份歷史病歷樣本中的第j種疾病類型;表示在第i份歷史病歷樣本中的目標(biāo)病情描述si下,所述第i份歷史病歷樣本中的患者罹患第j種疾病類型的條件概率;表示與目標(biāo)病情描述si對(duì)應(yīng)的第j種疾病類型是否存在于第i份歷史病歷樣本中,可用0或1表示;LossG表示所述估算疾病類型與所述目標(biāo)疾病類型之間的擬合誤差。
其中,如果第j種疾病類型出現(xiàn)在第i份歷史病歷樣本的診斷結(jié)果中,那么如果第j種疾病類型沒有出現(xiàn)在第i份歷史病歷樣本的診斷結(jié)果中,那么擬合誤差越小,說明生成式模型Generator模仿醫(yī)生的臨床診斷模仿得越像,對(duì)醫(yī)學(xué)經(jīng)驗(yàn)的總結(jié)越好。但是僅根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)模仿醫(yī)生的臨床診斷,并不意味著生成式模型Generator的診斷很精準(zhǔn),原因如下:由于醫(yī)生沒有給患者做足夠的化驗(yàn)和檢查,導(dǎo)致無法做出正確的診斷,或者因?yàn)榛颊叩牟∏檫^于復(fù)雜,在多個(gè)可能的疾病中,很難甄別患者究竟罹患哪些疾病,從而導(dǎo)致歷史病歷樣本中的診斷結(jié)果可能不準(zhǔn)確;歷史病歷樣本中的目標(biāo)病情描述殘缺,不足以支持歷史病歷樣本中的診斷結(jié)果;歷史病歷樣本中涵蓋的病情描述不完備,遇到罕見的病情,無法找到足夠數(shù)量的相似歷史病歷,來輔助診斷決策。此時(shí)可以參考醫(yī)學(xué)臨床指南等醫(yī)學(xué)參考文獻(xiàn),修正生成式模型Generator的診斷結(jié)果pdf(di|si)。
具體地,將所述估算疾病類型與所述目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,還可以包括:獲取醫(yī)學(xué)參考文獻(xiàn)中與目標(biāo)疾病類型對(duì)應(yīng)的參考病情描述;基于預(yù)設(shè)的偏差懲罰函數(shù)計(jì)算所述參考病情描述與歷史病歷樣本中的目標(biāo)病情描述之間的描述誤差;根據(jù)所述描述誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
舉例而言,在生成式模型Generator中輸入的目標(biāo)病情描述用si表示,生成式模型Generator根據(jù)該病情描述si所輸出的目標(biāo)疾病類型的概率分布用公式可以表示為:若根據(jù)醫(yī)學(xué)參考文獻(xiàn)疾病類型的參考病情描述應(yīng)該是此時(shí),可以計(jì)算歷史病歷樣本中的目標(biāo)病情描述si,與醫(yī)學(xué)參考文獻(xiàn)中的病情描述之間的差距,即兩者描述誤差。譬如,歷史病歷樣本中的目標(biāo)病情描述si包含三個(gè)指標(biāo),歷史病歷樣本中的診斷結(jié)果di包含兩種疾病類型,di=d1,d2。而根據(jù)醫(yī)學(xué)參考文獻(xiàn),疾病類型d1的參考病情描述應(yīng)該包含兩個(gè)指標(biāo)s1,s2;疾病類型d2的參考病情描述應(yīng)該包含三個(gè)指標(biāo)s3,s4,s5。那么歷史病歷樣本中對(duì)疾病d1的診斷,是有充足證據(jù)的;而歷史病歷樣本中對(duì)疾病d2的診斷,缺失了病情描述s4,s5。此時(shí),可以構(gòu)造偏差懲罰函數(shù)其中,Δi是目標(biāo)病情描述相對(duì)于參考病情描述的缺失個(gè)數(shù);si表示第i份歷史病歷樣本中的目標(biāo)病情描述;表示第i位份歷史病歷樣本中的第j種疾病類型;ξ(si|di)表示所述參考病情描述與所述歷史病歷樣本中的目標(biāo)病情描述之間的描述誤差。計(jì)算出的ξ的結(jié)果,介于0和1之間,當(dāng)Δ=0時(shí),ξ=1,當(dāng)Δ=+∞時(shí),ξ=0。延用上述例子,歷史病歷樣本中對(duì)疾病d2的診斷,缺失了兩項(xiàng)病情描述s4,s5,則此時(shí)的偏差懲罰函數(shù)用ξ來修正生成式模型Generator的診斷結(jié)果具體可以用公式表示為
為了進(jìn)一步強(qiáng)化生成式模型,在所述根據(jù)所述描述誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整之后,還可以包括:根據(jù)生成式模型所輸出與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型的概率分布,計(jì)算出各所述估算疾病類型的熵;基于所述熵與所述偏差懲罰函數(shù)構(gòu)建低熵偏差函數(shù),根據(jù)所述低熵偏差懲罰函數(shù)對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
通常為了使得診斷具有針對(duì)性,生成式模型Generator的診斷結(jié)果不要羅列過多種的疾病類型,而是集中于少數(shù)疾病類型。譬如,生成式模型Generator根據(jù)已經(jīng)收集到的有限的病情描述,輸出的診斷結(jié)果顯示患者可能罹患五種疾病類型,其中,每種疾病類型的概率分別是20%。這時(shí),各疾病類型對(duì)應(yīng)的熵是-1.0*(5*0.20*log0.20)=2.32,其中,對(duì)數(shù)log以2為底。
假設(shè)隨后生成式模型中輸入了更多的病情描述,然后把診斷結(jié)果更新為患者可能罹患兩種疾病類型,與這兩種疾病類型對(duì)應(yīng)的概率分別為20%和80%,這時(shí)各疾病類型對(duì)應(yīng)的熵是-1.0*(0.20*log0.20+0.80*log0.80)=0.72。在極端情況下,與輸入的病情描述對(duì)應(yīng)的診斷結(jié)果可能只有一種疾病類型,概率為100%,這時(shí)該疾病類型對(duì)應(yīng)的熵是-1.0*log1.0=0。由此可知,診斷結(jié)果越是集中在少數(shù)幾個(gè)疾病類型,熵值越低。如果診斷結(jié)果只有一個(gè)疾病,則熵值最低,為0。
在本實(shí)施例中,診斷結(jié)果中各疾病類型對(duì)應(yīng)的熵可以由以下公式計(jì)算:
進(jìn)一步地,在采用偏差懲罰函數(shù)的同時(shí),可以將計(jì)算出的熵與偏差懲罰函數(shù)結(jié)合構(gòu)建出熵偏差函數(shù)。示例性地,低熵偏差函數(shù)可以用公式表示為進(jìn)而,為了達(dá)到低熵的效果,可進(jìn)一步構(gòu)建出低熵偏差懲罰函數(shù)。示例性地,低熵偏差懲罰函數(shù)可用公式表示為使ξ(di)的取值介于0和1之間。當(dāng)診斷結(jié)果只包含一個(gè)疾病,熵值為0,ξ=0。當(dāng)診斷結(jié)果包含無數(shù)種疾病類型時(shí),熵值會(huì)很大,此時(shí)ξ趨近于1。
根據(jù)低熵偏差懲罰函數(shù)對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整,即用低熵偏差懲罰函數(shù)ξ(di)來修正生成式模型的輸出結(jié)果。具體地,可以采用如下公式構(gòu)建損失函數(shù):LossG=∑i{[Discriminator(si,di)-1]2}-λ*ξ(di),其中,λ為低熵偏差懲罰函數(shù)ξ(di)的權(quán)重。λ的具體取值可根據(jù)需求設(shè)置,在此不做限定,如可以為0.2。
采用上述技術(shù)方案對(duì)生成式模型進(jìn)行參數(shù)調(diào)整,能夠在訓(xùn)練生成式模型Generator的過程中,兼顧三方面的因素:很好地?cái)M合歷史病歷樣本中記錄的醫(yī)生的臨床診斷經(jīng)驗(yàn);符合醫(yī)學(xué)參考文獻(xiàn)中的醫(yī)學(xué)知識(shí);診斷結(jié)果集中于少數(shù)疾病樂行,而避免羅列過多可能疾病類型,可參考性強(qiáng)。
S304、將隨機(jī)生成的第一偽造病歷描述輸入訓(xùn)練完成后的所述生成式模型中,輸出與所述第一偽造病情描述對(duì)應(yīng)的至少一種第一偽造疾病類型。
S305、將所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型輸入預(yù)設(shè)的鑒別式模型中,輸出用于表示數(shù)據(jù)真實(shí)性的估算鑒別結(jié)果。
如上所述,可以將所述目標(biāo)病情描述與所述目標(biāo)疾病類型作為真數(shù)據(jù),將第一偽造病情描述以及生成式模型輸出的與第一偽造病情描述對(duì)應(yīng)的第一偽造疾病類型作為偽數(shù)據(jù),輸入預(yù)設(shè)的鑒別模型,進(jìn)而由鑒別式模型輸出用于表示該數(shù)據(jù)為真假的估算鑒別結(jié)果。
S306、將所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果進(jìn)行比較,根據(jù)比較結(jié)果對(duì)所述鑒別式模型的參數(shù)進(jìn)行調(diào)整。
具體地,將所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果進(jìn)行比較,根據(jù)比較結(jié)果對(duì)所述鑒別式模型的參數(shù)進(jìn)行調(diào)整,可包括:基于預(yù)設(shè)的鑒別評(píng)價(jià)函數(shù)計(jì)算出所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果之間的鑒別誤差;根據(jù)鑒別誤差對(duì)鑒別式模型的參數(shù)進(jìn)行調(diào)整。示例性地,鑒別評(píng)價(jià)函數(shù)可以用公式表示為:Loss(D)=∑i{pdf(true|di,si)-label(si,di)}2,其中,label(si,di)輸入的病情描述si以及與病情描述si對(duì)應(yīng)的疾病類型di的目標(biāo)鑒別結(jié)果。
把多份歷史病歷樣本中的表征真實(shí)病歷的目標(biāo)數(shù)據(jù)與基于生成式模型生成的偽造數(shù)據(jù),摻雜在一起,作為鑒別模型的訓(xùn)練數(shù)據(jù)。則每一組訓(xùn)練數(shù)據(jù)均由三元組構(gòu)成,分別為第i份病歷的病情描述si,與病情描述si對(duì)應(yīng)的疾病類型di,以及表征改組數(shù)據(jù)真?zhèn)蔚哪繕?biāo)鑒別結(jié)果labeli。其中,di為這份病歷的診斷結(jié)果,可包含若干種疾病類型,可表示為n表示疾病類型的總數(shù)量。labeli是標(biāo)識(shí),如果這份病歷是歷史病歷樣本中的目標(biāo)數(shù)據(jù),即對(duì)應(yīng)的真實(shí)病歷,則labeli=1。如果是偽造數(shù)據(jù),則labeli=0。
輸入一份病歷描述si及其診斷結(jié)果di給鑒別模型,通過鑒別式模型識(shí)別這份病歷的真實(shí)性。鑒別式模型的輸出是估算鑒別結(jié)果表示為概率pdf(true|di,si)表示是這份病歷是真實(shí)病歷的概率是多少。把鑒別模型的輸出pdf(true|di,si)與訓(xùn)練數(shù)據(jù)中的label(si,di)比較。如果鑒別模型的pdf(true|di,si)接近于1,意味著鑒別式模型認(rèn)為si和di來自真實(shí)的歷史病歷樣本中的可能性越大。
實(shí)際上,在生成這一組訓(xùn)練數(shù)據(jù)時(shí),預(yù)先知道這組數(shù)據(jù)是來自真實(shí)的歷史病歷樣本,還是基于生成式模型偽造的數(shù)據(jù),如果該組訓(xùn)練數(shù)據(jù)是真實(shí)的歷史病歷樣本,則在訓(xùn)練數(shù)據(jù)中預(yù)設(shè)標(biāo)簽label(si,di)=1,如果該組訓(xùn)練數(shù)據(jù)是基于生成式模型偽造的數(shù)據(jù),則預(yù)設(shè)標(biāo)簽label(si,di)=0。如果pdf(true|di,si)接近于1,而label(si,di)=0,那么說明鑒別模型鑒別錯(cuò)誤,需要調(diào)整鑒別模型的參數(shù)。
假設(shè),鑒別式模型的訓(xùn)練數(shù)據(jù)是一組輸入和與輸入對(duì)應(yīng)的正確的輸出,用公式表示為{(s1,d1),0},{(s2,d2),0},{(s3,d3),1},…,{(sN,dN),0},其中,N為表示訓(xùn)練數(shù)據(jù)的總組數(shù)(總條數(shù))。將訓(xùn)練數(shù)據(jù)中的(si,di)作為鑒別式模型Discriminator輸入,由鑒別式模型Discriminator計(jì)算輸出,可得到如下類似的計(jì)算結(jié)果,即估算鑒別結(jié)果[0.1,0.9,0.8...0.5,0.3];比較預(yù)設(shè)的目標(biāo)鑒別結(jié)果與鑒別式模型Discriminator計(jì)算出的估算鑒別結(jié)果,可根據(jù)預(yù)設(shè)的鑒別評(píng)價(jià)函數(shù)計(jì)算得到鑒別式模型Discriminator的鑒別誤差Loss(D)。
譬如,鑒別式模型Discriminator的輸出估算鑒別結(jié)果是[0.1,0.9,0.8...0.5,0.3],而目標(biāo)鑒別結(jié)果是[0,0,1,...,1,0]。此時(shí),鑒別誤差Loss(D)=(0.1-0)2+(0.9-0)2+(0.8-1)2+…+(0.3-0)2=0.01+0.81+0.04+…+0.09。
鑒別誤差Loss(D)越小,說明鑒別式模型Discriminator鑒別真?zhèn)蔚哪芰υ綇?qiáng)。因此,可以進(jìn)一步根據(jù)鑒別誤差Loss(D)采用梯度下降算法,調(diào)整鑒別式模型Discriminator深度神經(jīng)網(wǎng)絡(luò)的參數(shù),使得鑒別誤差Loss(D)盡可能縮小。
S307、將隨機(jī)生成的第二偽造病情描述輸入訓(xùn)練完成后的所述生成式模型,輸出與所述第二偽造病情描述對(duì)應(yīng)的所述第二偽造疾病類型。
S308、將所述第二偽造病情描述以及所述第二偽造疾病類型輸入訓(xùn)練完成后的所述鑒別式模型中,獲取與所述第二偽造病情描述以及所述第二偽造疾病類型對(duì)應(yīng)的參考鑒別結(jié)果。
可選地,為了更好地更全面地對(duì)生成式模型進(jìn)行調(diào)整,第二偽造病情描述可以不同于第一偽造病情描述。本操作中的參考鑒別結(jié)果可以理解為鑒別式模型輸出的與第二偽造病情描述以及第二偽造疾病類型對(duì)應(yīng)的估算鑒別結(jié)果。
S309、基于所述參考鑒別結(jié)果以及預(yù)設(shè)的生成評(píng)價(jià)函數(shù)計(jì)算出在當(dāng)前鑒別結(jié)果下所述生成式模型的生成誤差。
其中,預(yù)設(shè)的生成評(píng)價(jià)函數(shù)可以表示為:LossG=[Discrimintor(si,di)-1]2,(si,di)表示第i組偽造數(shù)據(jù);Discrimintor(si,di)表示參考鑒別結(jié)果。
把隨機(jī)生成第二偽造病情描述si以及生成式模型輸出的與第二偽造病情描述si對(duì)應(yīng)的第二疾病類型di,作為一組偽數(shù)據(jù)輸入鑒別式模型,由鑒別式模型Discriminator鑒別真?zhèn)?。如果鑒別式模型Discriminator的鑒別結(jié)果很精準(zhǔn),則鑒別式模型輸出的估算鑒別結(jié)果應(yīng)該接近表示數(shù)據(jù)為偽造數(shù)據(jù)的目標(biāo)鑒別結(jié)果,越接近于0。但是,從生成式模型Generator的立場(chǎng)出發(fā),生成式模型Generator希望鑒別式模型Discriminator被自己愚弄,輸出結(jié)果接近于表示數(shù)據(jù)真實(shí)數(shù)據(jù)的鑒別結(jié)果,即更接近于1,從而使得生成式模型對(duì)歷史病歷樣本中未覆蓋到的數(shù)據(jù)也能輸出具有參考價(jià)值的診斷結(jié)果。
S310、根據(jù)計(jì)算出的生成誤差采用梯度下降法對(duì)生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
計(jì)算出的生成誤差LossG越小,說明生成式模型Generator模仿醫(yī)生的臨床診斷模仿得越像。因此,可根據(jù)生成誤差LossG用梯度下降算法,調(diào)整生成式模型Generator的參數(shù),使得LossG盡可能縮小。
本實(shí)施例的技術(shù)方案,能夠解決上述各技術(shù)方案所解決的技術(shù)問題,具有相同的有益效果,而且能夠通過生成式模型與鑒別式模型的輸出結(jié)果分別調(diào)整生成式模型與鑒別式模型的參數(shù),從而提升生成式模型與鑒別式模型的輸出結(jié)果的精準(zhǔn)度,進(jìn)一步地,還能夠通過根據(jù)參考鑒別結(jié)果計(jì)算出的生成誤差對(duì)生成式模型進(jìn)行反調(diào)整,充分發(fā)揮生成對(duì)抗網(wǎng)絡(luò)的優(yōu)勢(shì),提升醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型對(duì)醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)的準(zhǔn)確性。
實(shí)施例四
圖4為本發(fā)明實(shí)施例四所提供的一種醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立裝置的結(jié)構(gòu)框圖。該裝置可通過硬件和/或軟件的方式實(shí)現(xiàn),并一般可獨(dú)立的配置在服務(wù)器中或者由終端和服務(wù)器配合實(shí)現(xiàn)本實(shí)施例的方法。如圖4所示,本實(shí)施例的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立裝置包括:生成式模型訓(xùn)練模塊410、鑒別式模型訓(xùn)練模塊420和醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型生成模塊430。
其中,生成式模型訓(xùn)練模塊410,用于根據(jù)歷史病歷樣本中的目標(biāo)數(shù)據(jù)對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練;鑒別式模型訓(xùn)練模塊420,用于根據(jù)訓(xùn)練完成后的所述生成式模型生成第一偽造數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)以及所述第一偽造數(shù)據(jù)對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練;醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型生成模塊430,用于根據(jù)訓(xùn)練完成后的所述生成式模型生成第二偽造數(shù)據(jù),并根據(jù)訓(xùn)練完成后的所述鑒別式模型對(duì)所述第二偽造數(shù)據(jù)的鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整,將調(diào)整后滿足預(yù)設(shè)平衡條件的生成式模型作為醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型。
本實(shí)施例的技術(shù)方案,首先通過歷史病歷樣本中的目標(biāo)數(shù)據(jù)即來訓(xùn)練生成式模型,使得生成式模型能夠比較好地?cái)M合真實(shí)的病歷數(shù)據(jù);然后根據(jù)生成式模型生成第一偽造數(shù)據(jù)以及真實(shí)病歷數(shù)據(jù)來訓(xùn)練鑒別式模型,使得鑒別式模型能夠很好地識(shí)別哪些是真實(shí)的病歷數(shù)據(jù),哪些是第一偽造數(shù)據(jù);進(jìn)而根據(jù)鑒別式模型對(duì)生成式模型生成第二偽造數(shù)據(jù)的鑒別結(jié)果調(diào)整生成式模型的參數(shù),目的是讓生成式模型生成的假數(shù)據(jù),與真實(shí)病歷非常相似,從而使得生成式模型也針對(duì)歷史病歷樣本中沒有覆蓋到的目標(biāo)數(shù)據(jù),能夠很好地實(shí)現(xiàn)對(duì)醫(yī)學(xué)經(jīng)驗(yàn)的總結(jié),有效地從歷史病歷樣本中整理出臨床醫(yī)學(xué)經(jīng)驗(yàn),實(shí)現(xiàn)臨床醫(yī)學(xué)經(jīng)驗(yàn)的共享,促進(jìn)醫(yī)學(xué)進(jìn)步。
在上述技術(shù)方案的基礎(chǔ)上,所述生成式模型訓(xùn)練模塊可包括:目標(biāo)數(shù)據(jù)獲取單元和生成式模型訓(xùn)練單元。其中,目標(biāo)數(shù)據(jù)獲取單元,用于獲取至少一份歷史病歷樣本中的目標(biāo)病情描述,以及與所述病情描述所對(duì)應(yīng)的至少一種目標(biāo)疾病類型;生成式模型訓(xùn)練單元,用于根據(jù)所述目標(biāo)病情描述以及所述至少一種目標(biāo)疾病類型對(duì)預(yù)設(shè)的生成式模型進(jìn)行訓(xùn)練。
在上述各技術(shù)方案的基礎(chǔ)上,所述鑒別式模型訓(xùn)練模塊可包括:第一偽造數(shù)據(jù)獲生成單元和鑒別式模型訓(xùn)練單元。其中,第一偽造數(shù)據(jù)生成單元,用于將隨機(jī)生成的第一偽造病歷描述輸入訓(xùn)練完成后的所述生成式模型中,輸出與所述第一偽造病情描述對(duì)應(yīng)的至少一種第一偽造疾病類型;鑒別式模型訓(xùn)練單元,用于根據(jù)所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型,對(duì)預(yù)設(shè)的鑒別式模型進(jìn)行訓(xùn)練。
在上述各技術(shù)方案的基礎(chǔ)上,所述醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型生成模塊可包括:第二偽造數(shù)據(jù)生成單元、參考鑒別結(jié)果獲取單元和生成參數(shù)調(diào)整單元。
其中,第二偽造數(shù)據(jù)生成單元,用于將隨機(jī)生成的第二偽造病情描述輸入訓(xùn)練完成后的所述生成式模型,輸出與所述第二偽造病情描述對(duì)應(yīng)的所述第二偽造疾病類型;參考鑒別結(jié)果獲取單元,用于將所述第二偽造病情描述以及所述第二偽造疾病類型輸入訓(xùn)練完成后的所述鑒別式模型中,獲取與所述第二偽造病情描述以及所述第二偽造疾病類型對(duì)應(yīng)的參考鑒別結(jié)果;生成參數(shù)調(diào)整單元,用于根據(jù)所述參考鑒別結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述生成式模型訓(xùn)練單元具體可包括:估算疾病類型輸出子單元和生成參數(shù)調(diào)整子單元。其中,估算疾病類型輸出子單元,用于將所述目標(biāo)病情描述輸入預(yù)設(shè)的生成式模型中,輸出與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型以及所述估算疾病類型的概率分布;生成參數(shù)調(diào)整子單元,用于將所述估算疾病類型與所述目標(biāo)疾病類型進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述生成參數(shù)調(diào)整子單元具體可用于:基于預(yù)設(shè)的擬合評(píng)價(jià)函數(shù)計(jì)算出所述估算疾病類型與所述目標(biāo)疾病類型之間的擬合誤差;根據(jù)所述擬合誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述生成參數(shù)調(diào)整子單元還可用于:獲取醫(yī)學(xué)參考文獻(xiàn)中與目標(biāo)疾病類型對(duì)應(yīng)的參考病情描述;基于預(yù)設(shè)的偏差懲罰函數(shù)計(jì)算所述參考病情描述與歷史病歷樣本中的目標(biāo)病情描述之間的描述誤差;根據(jù)所述描述誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,生成參數(shù)調(diào)整子單元還進(jìn)一步可用于:在所述根據(jù)所述描述誤差對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整之后,根據(jù)生成式模型所輸出與所述目標(biāo)病情描述所對(duì)應(yīng)的至少一種估算疾病類型的概率分布,計(jì)算出各所述估算疾病類型的熵;基于所述熵與所述偏差懲罰函數(shù)構(gòu)建低熵偏差函數(shù),根據(jù)所述低熵偏差懲罰函數(shù)對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述鑒別式模型訓(xùn)練模塊可包括:估算鑒別結(jié)果輸出單元和鑒別參數(shù)調(diào)整單元。其中,估算鑒別結(jié)果輸出單元,用于將所述目標(biāo)病情描述與所述目標(biāo)疾病類型,以及所述第一偽造病歷描述與所述第一偽造疾病類型輸入預(yù)設(shè)的鑒別式模型中,輸出用于表示數(shù)據(jù)真實(shí)性的估算鑒別結(jié)果;鑒別參數(shù)調(diào)整單元,用于將所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果進(jìn)行比較,根據(jù)比較結(jié)果對(duì)所述鑒別式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述鑒別參數(shù)調(diào)整單元具體可用于:基于預(yù)設(shè)的鑒別評(píng)價(jià)函數(shù)計(jì)算出所述估算鑒別結(jié)果與預(yù)設(shè)的目標(biāo)鑒別結(jié)果之間的鑒別誤差;根據(jù)鑒別誤差對(duì)鑒別式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述生成參數(shù)調(diào)整單元具體可用于:基于所述參考鑒別結(jié)果以及預(yù)設(shè)的生成評(píng)價(jià)函數(shù)計(jì)算出在當(dāng)前鑒別結(jié)果下所述生成式模型的生成誤差;根據(jù)所述生成誤差采用梯度下降法對(duì)所述生成式模型的參數(shù)進(jìn)行調(diào)整。
在上述各技術(shù)方案的基礎(chǔ)上,所述預(yù)設(shè)平衡條件可包括:基于預(yù)設(shè)次數(shù)的訓(xùn)練后所述生成式模型及所述鑒別式模型所對(duì)應(yīng)的預(yù)設(shè)的各評(píng)價(jià)函數(shù)中同一所述評(píng)價(jià)函數(shù)的各函數(shù)值隨著訓(xùn)練次數(shù)的增加而收斂。
上述裝置可執(zhí)行本發(fā)明任意實(shí)施例所提供的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法,具備執(zhí)行上述方法相應(yīng)的功能模塊和有益效果。未在本實(shí)施例中詳盡描述的技術(shù)細(xì)節(jié),可參見本發(fā)明任意實(shí)施例所提供的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法。
另外,本發(fā)明實(shí)施例還提供了一種基于醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的數(shù)據(jù)評(píng)估方法,該方法包括:獲取用戶輸入的患者數(shù)據(jù);其中,所述患者數(shù)據(jù)包括患者當(dāng)前的病情描述;采用本發(fā)明任意實(shí)施例所述的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的建立方法所建立的醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型對(duì)當(dāng)前輸入的所述患者數(shù)據(jù)進(jìn)行處理,輸出與所述患者數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)評(píng)估結(jié)果進(jìn)行顯示;其中,所述數(shù)據(jù)評(píng)估結(jié)果包括與患者當(dāng)前的病情描述所對(duì)應(yīng)的疾病類型。
上述基于醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型的數(shù)據(jù)評(píng)估方法,通過醫(yī)學(xué)經(jīng)驗(yàn)總結(jié)模型對(duì)用戶所輸入病情描述進(jìn)行處理,進(jìn)而輸出并顯示與對(duì)應(yīng)的評(píng)估疾病類型,能夠?qū)τ脩糨斎氲幕颊邤?shù)據(jù)進(jìn)行有效評(píng)估,為用戶可能罹患的疾病類型提供判斷依據(jù)。
注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。