專利名稱:一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及 到醫(yī)學(xué)信息智能處理領(lǐng)域,具體來(lái)說(shuō)涉及一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法。
背景技術(shù):
電子病歷(Electronic Medical Records, EMR)作為數(shù)字化醫(yī)院的一個(gè)重要組成部分,它是以病人為中心,以計(jì)算機(jī)為媒介,客觀、完整、連續(xù)地記錄病人病情變化和診斷的全過(guò)程,并通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)實(shí)現(xiàn)醫(yī)療信息的查詢、統(tǒng)計(jì)分析、信息交換與共享等,EMR是病人臨床進(jìn)行科學(xué)診斷治療的基礎(chǔ)資料,在未來(lái)計(jì)算機(jī)輔助臨床決策支持系統(tǒng)(ClinicalDecision Support System, Q)SS)中將起著重要的作用。根據(jù)國(guó)際醫(yī)療機(jī)構(gòu)一體化組織IHE (Integrating Healthcare Enterprise)模型標(biāo)準(zhǔn),電子病歷應(yīng)成為未來(lái)居民健康檔案的核心部分,通過(guò)標(biāo)準(zhǔn)化接口與醫(yī)院信息系統(tǒng)進(jìn)行集成。在HL7 (Health Level Seven)中,臨床文檔結(jié)構(gòu)標(biāo)準(zhǔn)CDA (Clinical Document Architecture)簡(jiǎn)明、完整地定義了電子病歷統(tǒng)一結(jié)構(gòu)和詞匯標(biāo)準(zhǔn),用于實(shí)現(xiàn)廣泛臨床場(chǎng)景的信息表達(dá)需求,這為進(jìn)一步開(kāi)展標(biāo)準(zhǔn)化電子病歷相關(guān)研究和應(yīng)用奠定了較好的基礎(chǔ)。電子病歷系統(tǒng)中存儲(chǔ)的醫(yī)療數(shù)據(jù)隱含著大量的有用信息,挖掘出其中重要的醫(yī)學(xué)診斷規(guī)則和知識(shí)是形成計(jì)算機(jī)智能臨床決策支持系統(tǒng)的關(guān)鍵,但由于電子病歷是一個(gè)特殊的不完備信息系統(tǒng),其存儲(chǔ)的醫(yī)學(xué)數(shù)據(jù)具有如下主要特點(diǎn)
(I)電子病歷數(shù)據(jù)的多樣性。電子病歷系統(tǒng)中醫(yī)療數(shù)據(jù)對(duì)象形態(tài)異常豐富,它不僅記錄紙質(zhì)病歷的全部?jī)?nèi)容,還記錄MRI、CT、X線、超聲、心電圖和手術(shù)麻醉等影像圖片、聲像動(dòng)態(tài)及神經(jīng)電生理信號(hào)等,這是它區(qū)別于其它領(lǐng)域數(shù)據(jù)最顯著的特征,這種數(shù)據(jù)多樣性加大了電子病歷處理的難度。(2)電子病歷數(shù)據(jù)的不完整性。病例和病案的有限性使電子病歷系統(tǒng)不可能對(duì)任何一種疾病信息都能作出全面地反映,病歷數(shù)據(jù)中存在大量不完整、不確定的未知病歷屬性,以及疾病信息所體現(xiàn)出的客觀不完整性和描述疾病的主觀不確切性,是形成電子病歷屬性不完整的主要因素。(3)電子病歷數(shù)據(jù)的動(dòng)態(tài)性。電子病歷系統(tǒng)中醫(yī)學(xué)檢測(cè)的波形、圖像等均是時(shí)間函數(shù),它們是不斷更新和動(dòng)態(tài)變化的,具有較強(qiáng)的不確定時(shí)效性,如何對(duì)這些動(dòng)態(tài)數(shù)據(jù)進(jìn)行高效處理是設(shè)計(jì)臨床決策支持系統(tǒng)需要解決的關(guān)鍵技術(shù)。上述電子病歷系統(tǒng)中存儲(chǔ)的醫(yī)學(xué)數(shù)據(jù)復(fù)雜屬性,使得病歷系統(tǒng)進(jìn)行結(jié)構(gòu)化轉(zhuǎn)換后通常是電子病歷系統(tǒng),給其特征選擇、規(guī)則挖掘及臨床決策分析等帶來(lái)了較大困難。我們知道疾病診療是一個(gè)復(fù)雜、綜合的過(guò)程,片面的信息和簡(jiǎn)單地分析、歸納、推理機(jī)制等自然會(huì)導(dǎo)致似是而非甚至完全錯(cuò)誤的診斷結(jié)論。電子病歷系統(tǒng)中醫(yī)療數(shù)據(jù)屬性所具有多樣性、不確定性、不完整性和動(dòng)態(tài)性等,給其屬性約簡(jiǎn)帶來(lái)了一定的挑戰(zhàn),對(duì)復(fù)雜類型的電子病歷屬性如何有效處理是設(shè)計(jì)未來(lái)電子病歷臨床智能決策分析系統(tǒng)的關(guān)鍵技術(shù),因此結(jié)合電子病歷系統(tǒng)自身具有的復(fù)雜性和特殊性,設(shè)計(jì)一些高效的技術(shù)和方法進(jìn)行不完備病歷屬性約簡(jiǎn)處理,為挖掘疾病或體征之間的關(guān)聯(lián)性、基因變異與疾病發(fā)生、治療、藥物關(guān)系,以及成功開(kāi)展臨床決策支持分析和個(gè)性化診斷、治療等具有重要意義。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種易構(gòu)造、較快進(jìn)化收斂速度和較高的最小屬性約簡(jiǎn)運(yùn)行效率和精度的用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,本發(fā)明為電子病歷屬性約簡(jiǎn)提供了一種新的技術(shù)方法,將在醫(yī)學(xué)信息智能處理領(lǐng)域得到廣泛應(yīng)用。本發(fā)明通過(guò)以下的技術(shù)方案實(shí)現(xiàn)的
一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,具體步驟如下
A 、 采用屬性空間 映射關(guān)系
^構(gòu)造電子病歷相應(yīng)病癥的形式背景并映射至蛙群進(jìn)化種群空間,建立屬·
性約簡(jiǎn)的函數(shù)優(yōu)化模型= (功= ,將病歷最小屬性約簡(jiǎn)優(yōu)化問(wèn)題轉(zhuǎn)化為進(jìn)
i-l
化蛙群結(jié)點(diǎn)的目標(biāo)尋優(yōu)問(wèn)題;
B、將電子病歷屬性集劃分成進(jìn)化子樹(shù)初始時(shí)先將原電子病歷屬性集隨機(jī)劃分成若干
具有進(jìn)化子樹(shù)度^的進(jìn)化子樹(shù),執(zhí)行時(shí)不斷優(yōu)化每次劃分的各進(jìn)化子樹(shù)執(zhí)行記錄!計(jì)算
其相應(yīng)的動(dòng)態(tài)選擇概率1 并調(diào)整為有序序列;然后根據(jù)新的進(jìn)化子樹(shù)度重新將電子病歷
屬性集劃分為若干棵新的進(jìn)化子樹(shù),再將病歷屬性集中各病癥屬性分配至各棵子樹(shù)的結(jié)點(diǎn)上,參與進(jìn)化樹(shù)的迭代尋優(yōu);
C、設(shè)計(jì)一種自適應(yīng)蛙群進(jìn)化樹(shù)動(dòng)態(tài)尋優(yōu)結(jié)構(gòu)在電子病歷屬性集劃分的各棵進(jìn)化子樹(shù)上建立一種自適應(yīng)蛙群進(jìn)化樹(shù)動(dòng)態(tài)尋優(yōu)結(jié)構(gòu),進(jìn)化子樹(shù)中每個(gè)病歷屬性結(jié)點(diǎn)視為混合蛙跳算法SFLA中每一蛙個(gè)體,這樣即將病歷屬性約簡(jiǎn)優(yōu)化問(wèn)題轉(zhuǎn)化為進(jìn)化樹(shù)中蛙群結(jié)點(diǎn)的尋優(yōu)問(wèn)題,通過(guò)子樹(shù)上屬性進(jìn)化結(jié)點(diǎn)的動(dòng)態(tài)調(diào)整和反復(fù)迭代,將蛙群進(jìn)化樹(shù)逐步由“胖樹(shù)”變
為“瘦樹(shù)”,最后優(yōu)選出每一棵蛙群進(jìn)化樹(shù)的精英個(gè)體曷;
D、構(gòu)建進(jìn)化向量U,將電子病歷屬性子集分配至U =I i E {I,..,I},J G乓},
其中I表示劃分的子樹(shù)大小,爲(wèi)為病歷屬性各棵子樹(shù)中進(jìn)化出的精英個(gè)體結(jié)點(diǎn);
E、利用混合蛙跳算法SFLA和當(dāng)前各棵進(jìn)化子樹(shù)的精英個(gè)體爲(wèi)分別對(duì)各電子病歷劃分的屬性子集進(jìn)化,并在各棵子樹(shù)間進(jìn)行適應(yīng)度共享;
F、計(jì)算病歷進(jìn)化子樹(shù)Gi上最好適應(yīng)度目標(biāo)函數(shù)值,取纟次劃分子樹(shù)所形成的進(jìn)
化樹(shù)平均最優(yōu)適應(yīng)度為全局最優(yōu)適應(yīng)度值,即^^;
t Z-I
G、求出上述每次所形成的屬性進(jìn)化子樹(shù)最優(yōu)適應(yīng)度相應(yīng)的病歷最優(yōu)屬性約簡(jiǎn)集為,以及電子病歷全局最優(yōu)屬性約簡(jiǎn)集為及^> =;
H、計(jì)算電子病歷屬性約簡(jiǎn)率,并判斷其是否滿足約簡(jiǎn)精度#要求,其中#為0.85,如滿足約簡(jiǎn)精虔P,則整個(gè)病歷屬性約簡(jiǎn)循環(huán)終止,否則繼續(xù)重復(fù)上述進(jìn)化樹(shù)的約簡(jiǎn)尋優(yōu)迭代,直至滿足約簡(jiǎn)精度要求。本發(fā)明的進(jìn)一步改進(jìn)在于步驟B中的具體步驟如下
權(quán)利要求
1.一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,其特征在于具體步驟如下 A 、 采用屬性空間 映射關(guān)系^ {XOf ^,構(gòu)造電子病歷相應(yīng)病癥的形式背景并映射至蛙群進(jìn)化種群空間,建立其電子病歷屬性約簡(jiǎn)進(jìn)化目標(biāo)優(yōu)化模= (功,將病歷最小屬性約簡(jiǎn)優(yōu)化-1.問(wèn)題轉(zhuǎn)化為進(jìn)化蛙群結(jié)點(diǎn)的目標(biāo)尋優(yōu)問(wèn)題;B、將電子病歷屬性集劃分成進(jìn)化子樹(shù)初始時(shí)先將原電子病歷屬性集隨機(jī)劃分成若干具有進(jìn)化子樹(shù)度^的進(jìn)化子樹(shù),執(zhí)行時(shí)不斷優(yōu)化每次劃分的各進(jìn)化子樹(shù)執(zhí)行記錄^,計(jì)算其相應(yīng)的動(dòng)態(tài)選擇概率爲(wèi)并調(diào)整為有序序列;然后根據(jù)新的進(jìn)化子樹(shù)度重新將電子病歷屬性集劃分為若干棵新的進(jìn)化子樹(shù),再將病歷屬性集中各病癥屬性分配至各棵子樹(shù)的結(jié)點(diǎn)上,參與進(jìn)化樹(shù)的迭代尋優(yōu); C、設(shè)計(jì)一種自適應(yīng)蛙群進(jìn)化樹(shù)動(dòng)態(tài)尋優(yōu)結(jié)構(gòu)在電子病歷屬性集劃分的各棵進(jìn)化子樹(shù)上建立一種自適應(yīng)蛙群進(jìn)化樹(shù)動(dòng)態(tài)尋優(yōu)結(jié)構(gòu),進(jìn)化子樹(shù)中每個(gè)病歷屬性結(jié)點(diǎn)視為混合蛙跳算法SFLA中每一蛙個(gè)體,這樣即將病歷屬性約簡(jiǎn)優(yōu)化問(wèn)題轉(zhuǎn)化為進(jìn)化樹(shù)中蛙群結(jié)點(diǎn)的尋優(yōu)問(wèn)題,通過(guò)子樹(shù)上屬性進(jìn)化結(jié)點(diǎn)的動(dòng)態(tài)調(diào)整和反復(fù)迭代,將蛙群進(jìn)化樹(shù)逐步由“胖樹(shù)”變?yōu)椤笆輼?shù)”,最后優(yōu)選出每一棵蛙群進(jìn)化樹(shù)的精英個(gè)體乓; D、構(gòu)建進(jìn)化向量U,將電子病歷屬性子集分配至U= {UQ,J) I i EG },其中I表示劃分的子樹(shù)大小,巧為病歷屬性各棵子樹(shù)中進(jìn)化出的精英個(gè)體結(jié)點(diǎn); E、利用混合蛙跳算法SFLA和當(dāng)前各棵進(jìn)化子樹(shù)的精英個(gè)體巧分別對(duì)各電子病歷劃分的屬性子集進(jìn)化,并在各棵子樹(shù)間進(jìn)行適應(yīng)度共享;F、計(jì)算病歷進(jìn)化子樹(shù)Gi上最好適應(yīng)度目標(biāo)函數(shù)值,取f次劃分子樹(shù)所形成的進(jìn)化樹(shù)平均最優(yōu)適應(yīng)度為全局最優(yōu)適應(yīng)度值,即; G、求出上述每次所形成的屬性進(jìn)化子樹(shù)最優(yōu)適應(yīng)度相應(yīng)的病歷最優(yōu)屬 性約簡(jiǎn)集為以及電子病歷全局最優(yōu)屬性約簡(jiǎn)集為Jferfaiil =; H、計(jì)算電子病歷屬性約簡(jiǎn)率,并判斷其是否滿足約簡(jiǎn)精度#要求,其中#為0.85,如滿足約簡(jiǎn)精度於則整個(gè)病歷屬性約簡(jiǎn)循環(huán)終止,否則繼續(xù)重復(fù)上述進(jìn)化樹(shù)的約簡(jiǎn)尋優(yōu)迭代,直至滿足約|B」g度要求。
2.根據(jù)權(quán)利要求I所述一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,其特征在于所述步驟B中的具體步驟如下 (I)、首先根據(jù)電子病歷屬性集中屬性數(shù)隨機(jī)分配一組進(jìn)化子樹(shù)度集合D ;(2)、在進(jìn)化樹(shù)的根結(jié)點(diǎn)下以相應(yīng)的進(jìn)化子樹(shù)度構(gòu)造各棵進(jìn)化子樹(shù),并創(chuàng)建一組每次構(gòu)造進(jìn)化子樹(shù)執(zhí)行記錄! = fr13r2,...,rf},其中與其相應(yīng)的<相對(duì)應(yīng),G計(jì)算公式如下
3.根據(jù)權(quán)利要求I所述一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,其特征在于所述步驟C中的具體步驟如下 (I)、構(gòu)建蛙群進(jìn)化正序樹(shù)在電子病歷屬性劃分到的各個(gè)進(jìn)化子樹(shù)中,將所有參與病歷屬性約簡(jiǎn)的病癥屬性個(gè)體置為進(jìn)化子樹(shù)上的每個(gè)蛙結(jié)點(diǎn),設(shè)蛙群進(jìn)化樹(shù)的高度為fc進(jìn)化子樹(shù)度dj依次選取上述進(jìn)化子樹(shù)選擇度集合中的值,進(jìn)化樹(shù)中結(jié)點(diǎn)總數(shù)為BI ; 屬性約簡(jiǎn)過(guò)程為了利用取得最好適應(yīng)度的優(yōu)秀蛙結(jié)點(diǎn),將在上述每一棵蛙群進(jìn)化子樹(shù)內(nèi)部采用競(jìng)爭(zhēng)機(jī)制優(yōu)選出精英個(gè)體并不斷上下跳動(dòng)尋優(yōu),最終形成一棵蛙群進(jìn)化正序樹(shù),其設(shè)計(jì)方法如下 ①在每一次創(chuàng)建蛙群進(jìn)化樹(shù)的過(guò)程中,對(duì)蛙群進(jìn)化樹(shù)中每個(gè)蛙結(jié)點(diǎn)對(duì)象計(jì)算其屬性適應(yīng)度目標(biāo)函數(shù)值/( ); ②對(duì)每一棵蛙群進(jìn)化子樹(shù),從樹(shù)底到樹(shù)頂逐步形成各棵進(jìn)化子樹(shù),將所屬第*層的每個(gè)孩子結(jié)點(diǎn)為第i層孩子結(jié)點(diǎn)的編號(hào))適應(yīng)度相互競(jìng)爭(zhēng)比較,優(yōu)選出第層優(yōu)秀精英蛙個(gè)體為,并將該進(jìn)化子樹(shù)的雙親蛙結(jié)點(diǎn)Pare!略與精英蛙進(jìn)行適應(yīng)度比較,如火,則進(jìn)化子樹(shù)中孩子精英蛙個(gè)體將與雙親結(jié)點(diǎn) 位置互換,始終保持每棵子樹(shù)的雙親結(jié)點(diǎn)為該進(jìn)化子樹(shù)最優(yōu)適應(yīng)度蛙結(jié)點(diǎn); ③上述比較和交換在各棵劃分的進(jìn)化蛙群子樹(shù)中按照從樹(shù)底到樹(shù)頂采用遞歸方式逐步進(jìn)行,經(jīng)過(guò)fe-1次上下迭代交換后,將建立了一棵蛙群進(jìn)化“正序”樹(shù),即樹(shù)中形成的每棵子樹(shù)根結(jié)點(diǎn)適應(yīng)度總是小于其所有孩子的適應(yīng)度,整棵進(jìn)化樹(shù)的結(jié)點(diǎn)適應(yīng)度從上至下逐步增加,最后整棵進(jìn)化樹(shù)的根結(jié)點(diǎn)將存儲(chǔ)當(dāng)前全局最優(yōu)精英進(jìn)化蛙個(gè)體; (2)、自適應(yīng)調(diào)整蛙群進(jìn)化樹(shù)所有進(jìn)化蛙被置為上述樹(shù)型結(jié)構(gòu)的每個(gè)結(jié)點(diǎn)上,由于進(jìn)化子樹(shù)的選擇度集是一個(gè)優(yōu)化后的有序集合,其對(duì)整個(gè)種群的進(jìn)化自適應(yīng)調(diào)整步驟如下 ①對(duì)初始建立的蛙群進(jìn)化樹(shù)< 比較大,大部分屬性進(jìn)化蛙個(gè)體均靠近樹(shù)的根結(jié)點(diǎn),整棵樹(shù)的深度f(wàn)c相對(duì)較小,可進(jìn)行廣度搜索,進(jìn)化樹(shù)是一棵“胖樹(shù)”,整個(gè)進(jìn)化開(kāi)始時(shí)收斂速度快,具有較強(qiáng)的全局搜索能力,但其魯棒性相對(duì)較弱; ②隨著整棵屬性蛙群進(jìn)化樹(shù)的逐步進(jìn)化,進(jìn)化樹(shù)選擇度<逐步變小,大部分屬性結(jié)點(diǎn)上的進(jìn)化蛙個(gè)體將遠(yuǎn)離進(jìn)化樹(shù)的根結(jié)點(diǎn),向深度探索,則fr逐步變大,進(jìn)化樹(shù)逐步變成是一棵“瘦樹(shù)”,這時(shí)進(jìn)化樹(shù)雖搜索能力相對(duì)較慢,但其具有牧5蟲(chóng)的全局搜索性,魯棒性也較好; ③在屬性蛙群進(jìn)化樹(shù)由“胖樹(shù)”逐步進(jìn)化到“瘦樹(shù)”的過(guò)程中,對(duì)每棵屬性進(jìn)化子樹(shù)中具有最低適應(yīng)度的進(jìn)化蛙個(gè)體,將其從原進(jìn)化子樹(shù)的第%層葉子結(jié)點(diǎn)上移至I1層葉子結(jié)占. ④對(duì)上述進(jìn)化樹(shù)的各棵子樹(shù)分別構(gòu)造其蛙群進(jìn)化正序樹(shù),通過(guò)反復(fù)優(yōu)化調(diào)整,最后輸出整棵正序樹(shù)的根結(jié)點(diǎn),即為全局最優(yōu)精英進(jìn)化個(gè)體。
全文摘要
本發(fā)明公開(kāi)了一種用于電子病歷屬性約簡(jiǎn)的自適應(yīng)蛙群進(jìn)化樹(shù)設(shè)計(jì)方法,首先建立電子病歷屬性約簡(jiǎn)進(jìn)化目標(biāo)優(yōu)化模型;其次根據(jù)進(jìn)化子樹(shù)最優(yōu)選擇度集將電子病歷屬性集劃分成進(jìn)化子樹(shù),并設(shè)計(jì)一種自適應(yīng)蛙群進(jìn)化樹(shù)動(dòng)態(tài)尋優(yōu)結(jié)構(gòu)優(yōu)選出各進(jìn)化子樹(shù)精英個(gè)體;再次將電子病歷屬性子集分配至各進(jìn)化向量上,利用各精英個(gè)體和混合蛙跳算法SFLA分別進(jìn)行進(jìn)化,計(jì)算出病歷進(jìn)化子樹(shù)上最好目標(biāo)適應(yīng)度,并在進(jìn)化子樹(shù)間進(jìn)行尋優(yōu)適應(yīng)度共享;最后求出各病歷屬性進(jìn)化子樹(shù)上最優(yōu)屬性約簡(jiǎn)集和全局最優(yōu)屬性約簡(jiǎn)集,并判斷所求病歷屬性約簡(jiǎn)率是否滿足約簡(jiǎn)精度。本發(fā)明具有易構(gòu)造、較快進(jìn)化收斂速度和較高最小屬性約簡(jiǎn)效率和精度等優(yōu)點(diǎn)。
文檔編號(hào)G06Q50/24GK102682210SQ20121013974
公開(kāi)日2012年9月19日 申請(qǐng)日期2012年5月8日 優(yōu)先權(quán)日2012年5月8日
發(fā)明者丁衛(wèi)平, 施佺, 王建東, 管致錦, 董建成 申請(qǐng)人:南通大學(xué)