本發(fā)明涉及,具體為一種機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng)。
背景技術(shù):
妊娠期糖尿病(Gestational Diabetes Mellitus,GDM)是指妊娠期間首次發(fā)生或發(fā)現(xiàn)的不同程度的糖耐量異常,包含了一部分妊娠前已患有糖尿病但孕期首次被診斷的患者。2012年衛(wèi)生部推薦采用國(guó)際糖尿病
與妊娠研究小組(international association ofdiabetes and pregnancy study group,IADPSG)推薦的標(biāo)準(zhǔn),我國(guó)GDM的發(fā)病率高達(dá)17.5%左右。近年來(lái),單獨(dú)二胎政策的放開(kāi)及實(shí)施,高齡產(chǎn)婦越來(lái)越多,加上孕婦膳食結(jié)構(gòu)的不合理及體力活動(dòng)的缺乏,GDM的患病率也在不斷增加。GDM不僅是糖代謝的紊亂,而且同時(shí)還存在脂代謝及蛋白質(zhì)代謝的紊亂,由此導(dǎo)致的近期及遠(yuǎn)期母嬰并發(fā)癥也越來(lái)越多。包括巨大兒的發(fā)生率、早產(chǎn)發(fā)生率、先天性畸形發(fā)生率、剖宮產(chǎn)率、新生兒低血糖及高膽紅素血癥的發(fā)生率升高、子代兒童期肥胖、糖尿病及高血壓的發(fā)生率升高。GDM對(duì)母親的影響包括孕期體重增加過(guò)多所致肥胖、妊娠期高血壓、高脂血癥及心腦血管疾病等一系列代謝綜合癥的發(fā)生率升高。遠(yuǎn)期影響有產(chǎn)后肥胖及高血壓的發(fā)生率升高及糖代
謝異常的發(fā)生率也明顯升高。預(yù)測(cè)約70%的GDM患者在產(chǎn)
后5年至10年后轉(zhuǎn)變成2型糖尿病。
孕婦體重(包括孕前體重及孕期體重增加)、產(chǎn)婦年齡、產(chǎn)婦孕前BMI、產(chǎn)婦家族糖尿病史、產(chǎn)婦孕期營(yíng)養(yǎng)攝入、產(chǎn)婦孕期運(yùn)動(dòng)量、產(chǎn)婦所在的地域等因素與妊娠糖尿病的關(guān)系成為圍產(chǎn)學(xué)者關(guān)注的焦點(diǎn),大多數(shù)研究表明,孕婦孕前體重指數(shù)過(guò)大及體重增加過(guò)度會(huì)導(dǎo)致妊娠期糖尿病、高血壓、產(chǎn)后出血、剖宮產(chǎn)及巨大兒等概率升高。剖宮產(chǎn)、產(chǎn)后出血、巨大兒、高危妊娠(妊娠期糖尿病等)的發(fā)生率在這些體重增加過(guò)多的孕婦中發(fā)生率明顯上升。研究結(jié)果表明正常體重指數(shù)的孕婦體重增長(zhǎng)過(guò)多同樣會(huì)導(dǎo)致不良的妊娠結(jié)局,適當(dāng)?shù)乜刂骑嬍痴{(diào)整膳食結(jié)構(gòu)和運(yùn)動(dòng),有利于體重的控制,孕期體重指數(shù)的增長(zhǎng)得到一定控制會(huì)使妊娠期合并糖尿病并發(fā)癥、巨大兒發(fā)生率、手術(shù)產(chǎn)率、產(chǎn)后出血率減少。此外,有研究表明產(chǎn)婦的家族糖尿病史與產(chǎn)婦妊娠糖尿病發(fā)病也有很強(qiáng)的正相關(guān)性。
近年來(lái)越來(lái)越多的研究關(guān)注胎兒起源學(xué)說(shuō),妊娠期糖尿病導(dǎo)致的糖代謝異常,營(yíng)養(yǎng)不足或過(guò)剩導(dǎo)致低出生體重兒和巨大兒的出現(xiàn),這些后代患慢性非感染性疾病如高血壓、糖尿病、心臟病的風(fēng)險(xiǎn)均增加。所以慢性疾病的預(yù)防要從胎兒期開(kāi)始,在宮內(nèi)階段就要開(kāi)始關(guān)注母親的營(yíng)養(yǎng)體重管理和血糖管理,爭(zhēng)取理想的出生體重,減少巨大兒和降低剖宮產(chǎn)率,并盡量減少可能出現(xiàn)的對(duì)子代的遠(yuǎn)期不良影響。
妊娠期糖尿病(GDM)危害母兒近期及遠(yuǎn)期健康。發(fā)病原因尚不清楚,可能與胰島素抵抗有關(guān),除遺傳及妊娠期內(nèi)分泌改變可引起胰
島素抵抗外,飲食及運(yùn)動(dòng)是胰島素抵抗的一個(gè)重要影響因素。孕期運(yùn)動(dòng)及飲食是孕期體重增加的重要影響因素,而孕期體重增加又是孕期胰島素抵抗最重要的原因。本發(fā)明借助互聯(lián)網(wǎng)+技術(shù),可以做到每天監(jiān)測(cè)一天的飲食、運(yùn)動(dòng)量、空腹血糖、體重變化,通過(guò)這些因素形成可以實(shí)現(xiàn)機(jī)器學(xué)習(xí)的自動(dòng)算法,并采用算法來(lái)評(píng)估孕期的生活方式,通過(guò)對(duì)生活方式健康與否的評(píng)估,繼而了解這些不同的生活方式與GDM的發(fā)生的關(guān)系,并可以進(jìn)一步的預(yù)測(cè)妊娠期糖尿病的發(fā)病幾率和病情程度的變化。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),其組成包括:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、機(jī)器學(xué)習(xí)模塊、風(fēng)險(xiǎn)性評(píng)估模塊、專家系統(tǒng)模塊、顯示輸出模塊,所述的數(shù)據(jù)采集模塊的輸出端與數(shù)據(jù)預(yù)處理模塊的輸入端連接,所述的數(shù)據(jù)預(yù)處理模塊的輸出端與機(jī)器學(xué)習(xí)模塊和專家系統(tǒng)模塊的輸入端連接,所述的機(jī)器學(xué)習(xí)模塊的輸出端與風(fēng)險(xiǎn)性評(píng)估模塊的輸入端連接,所述的風(fēng)險(xiǎn)性評(píng)估模塊的輸出端與專家系統(tǒng)模塊輸入端連接,所述的專家系統(tǒng)模塊的輸出端與顯示輸出模塊的輸入端連接。
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系
統(tǒng),所述的數(shù)據(jù)采集模塊負(fù)責(zé)采集孕婦的數(shù)據(jù),包括對(duì)孕婦的年齡,身高,體重,血糖,懷孕周期等數(shù)據(jù)的采集工作,其中,年齡,身高、工作性質(zhì)和每周運(yùn)動(dòng)量為節(jié)點(diǎn)數(shù)據(jù),體重、血糖和懷孕周期為流數(shù)據(jù)。
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的數(shù)據(jù)預(yù)處理模塊負(fù)責(zé)數(shù)據(jù)的預(yù)處理工作,主要包含兩部分工作,數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化,數(shù)據(jù)清洗主要負(fù)責(zé)清洗出一些無(wú)效數(shù)據(jù)和錯(cuò)誤數(shù)據(jù),數(shù)據(jù)標(biāo)準(zhǔn)化是指將用戶的年齡,體重,血糖,懷孕周期等數(shù)據(jù),同一度量單位,同一格式。
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的機(jī)器學(xué)習(xí)模塊主要負(fù)責(zé)分析單因素連續(xù)時(shí)間變量與妊娠期糖尿病之間的關(guān)系,例如血糖,體脂比變化等,該模塊采用隱馬爾科夫模型分析單因素的異常波動(dòng)與妊娠期糖尿病之間的關(guān)系,其模型可以由一個(gè)五元組表示;
λ=(A,B,π,Q,V)
\*MERGEFORMAT (1)
身體狀態(tài)集合Q
孕婦的身體狀態(tài)是一個(gè)隱含變量,日常生活中不可能被直接觀測(cè)出來(lái),因此用隱馬爾科夫模型中的隱含狀態(tài)表示孕婦的身體健康狀態(tài),設(shè)Q是所有可能的身體健康狀態(tài)的集合,則
Q={q0,q1}
\*MERGEFORMAT (2)
其中,q0表示孕婦身體處于健康狀態(tài),q1表示孕婦身體出于非健康狀態(tài);
檢測(cè)指標(biāo)集合V
在醫(yī)療診斷環(huán)節(jié)中,孕婦的檢查指標(biāo)是可以觀測(cè)到的變量,因此,令孕婦的身體檢測(cè)指標(biāo)集合作為可觀測(cè)狀態(tài)集合,設(shè)V是某項(xiàng)檢測(cè)項(xiàng)目所有可能檢測(cè)結(jié)果的集合,則
V={v1,v2,…,vM}
\*MERGEFORMAT (3)
其中,M是可能的檢測(cè)結(jié)果的數(shù)量;
身體狀態(tài)轉(zhuǎn)移矩陣A
設(shè)L是長(zhǎng)度為T的身體健康狀態(tài)序列,L=(l0,l1,l2,…,lT),孕婦的當(dāng)前的狀態(tài)與之前的身體狀態(tài)有關(guān),則健康狀態(tài)轉(zhuǎn)移矩陣為:
A=[aij]N×N
\*MERGEFORMAT (4)
其中,
aij=p(lr=qi|lr-1=qj),1≤r≤T
\*MERGEFORMAT (5)
表示狀態(tài)轉(zhuǎn)移概率,其中aij是與時(shí)間t獨(dú)立的,且滿足0≤aij≤1,
身體狀態(tài)觀測(cè)概率矩陣B
設(shè)O是對(duì)應(yīng)的檢測(cè)項(xiàng)目觀測(cè)序列,O=(o1,o2,…,oT),則觀測(cè)概率矩陣為
B=[bij]N×M
\*MERGEFORMAT (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顧客身體健康狀態(tài)與檢測(cè)指標(biāo)之間觀測(cè)概率,其中bi(k)是與時(shí)間t獨(dú)立的,且滿足0≤bi(k)≤1,
初始孕婦身體狀態(tài)分布π
描述了在初始狀態(tài)時(shí),孕婦身體健康與非健康狀態(tài)之間的比例;
π=(πl)
\*MERGEFORMAT (7)
其中,
πi=P(lr=qi),1≤r≤T
\*MERGEFORMAT (8)
且滿足0≤πi≤1,且
采用前向后向算法,對(duì)隱馬爾科夫模型進(jìn)行學(xué)習(xí)。前向?qū)W習(xí)算法過(guò)程如下:第一步,確定前向概率αt(qi);
在給定隱馬爾科夫模型λ中,前向概率是指到時(shí)刻t時(shí)孕婦某項(xiàng)檢測(cè)指標(biāo)為o1,o2,…,ot且孕婦的身體狀態(tài)為qi的條件概率,記作
\*MERGEFORMAT (9)
然后通過(guò)歸納法求解αt+1(qi)
遞推可得:
\*MERGEFORMAT (10)
那么,前向觀測(cè)概率為
\*MERGEFORMAT (11)
第二步確定后向概率;
在給定隱馬爾科夫模型λ中,后向變量βt(i)是指在t時(shí)刻為狀態(tài)qi的條件下,從t+1到T的部分孕婦檢測(cè)指標(biāo)序列為ot+1,ot+2,…,oT的條件概率,記作
\*MERGEFORMAT (12)
通過(guò)歸納法求解βt(i)可得:
\*MERGEFORMAT (13)
于是可以得出:
\*MERGEFORMAT (14)
第三步執(zhí)行EM算法的E步:
求Q函數(shù)
\*MERGEFORMAT(15)
其中,是隱馬爾科夫模型參數(shù)的當(dāng)前估計(jì)值,λ是要極大化的隱馬爾科夫模型參數(shù);
P(O,L|λ)=πibi(ot)ai…b1(o1)a1
\*MERGEFORMAT (16)
于是函數(shù)可以改寫為
\*MERGEFORMAT (17)
第四步執(zhí)行EM算法的M步:
極大化Q函數(shù)由于要極大化的參數(shù)在公式中單獨(dú)出現(xiàn)在三個(gè)項(xiàng)中,所以只需要對(duì)各項(xiàng)分別極大化即可,分別對(duì)每一項(xiàng)進(jìn)行拉格朗日乘子法求解,可以找到使得公式取得最大值的條件,分別如下所示。采用Hadar等價(jià)變換,在隱馬爾科夫模型中,狀態(tài)序列為其觀測(cè)過(guò)程為令
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T
\*MERGEFORMAT (18)
則可以由公式得出
第一項(xiàng)極大化條件:
\*MERGEFORMAT (19)
第二項(xiàng)極大化條件:
\*MERGEFORMAT (20)
第三項(xiàng)極大化條件:
\*MERGEFORMAT (21)
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的風(fēng)險(xiǎn)性評(píng)估模塊在獲得模型中各個(gè)參數(shù)之后,給定任何孕婦的某項(xiàng)項(xiàng)目的檢測(cè)指標(biāo),采用維特比算法就可以識(shí)別出每一個(gè)時(shí)刻的孕婦的身體狀態(tài),從而可以判斷出當(dāng)前孕婦患病的風(fēng)險(xiǎn);
定義為單個(gè)身體狀態(tài)序列中的最大值,則在時(shí)刻t興趣模式為的身體狀態(tài)概率最大值為
\*MERGEFORMAT (22)
采用維特比算法,就可以得到某一個(gè)孕婦在某時(shí)刻的身體狀態(tài);
算法流程
初始化:
δ1(i)=πibi(o1)
\*MERGEFORMAT (23)
\*MERGEFORMAT (24)
其中,0≤i≤N-1
遞歸計(jì)算:
\*MERGEFORMAT (25)
\*MERGEFORMAT (26)
其中,0≤i≤N-1
中斷:
\*MERGEFORMAT (27)
\*MERGEFORMAT (28)
回溯最佳路徑:
\*MERGEFORMAT (29)
最佳的身體狀態(tài)序列:
Y*=l2-r…lT
\*MERGEFORMAT (30)
通過(guò)上述方式,就可以根據(jù)孕婦的實(shí)時(shí)的檢測(cè)項(xiàng)目具體指標(biāo),判斷出孕婦當(dāng)前的身體健康狀態(tài),從而判斷出孕婦患病得風(fēng)險(xiǎn)。
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的專家系統(tǒng)診斷模塊根據(jù)孕婦的風(fēng)險(xiǎn)性評(píng)估模塊,通過(guò)分析不同檢驗(yàn)指標(biāo),可以得出孕婦可能患有妊娠期糖尿病的概率,本發(fā)明采用BP神經(jīng)網(wǎng)絡(luò)方法評(píng)估各指標(biāo)的風(fēng)險(xiǎn)性,從而對(duì)患病概率做出預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)包括三層,分別是輸入層,隱含層和輸出層;
輸入層輸入與妊娠期糖尿病有關(guān)的各個(gè)因素,分別為孕婦年齡(x1)、血糖風(fēng)險(xiǎn)(x2)、體脂比風(fēng)險(xiǎn)(x3)、工作性質(zhì)(x4)、鍛煉強(qiáng)度指標(biāo)(x5),采用有監(jiān)督學(xué)習(xí)算法進(jìn)行訓(xùn)練集學(xué)習(xí),根據(jù)給出正確的輸入和輸出對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)整,讓神經(jīng)網(wǎng)絡(luò)能做出正確的反應(yīng)。學(xué)習(xí)訓(xùn)練樣本表示為 i=1,2…,N,其中,為樣本輸入數(shù)據(jù),為yi樣本輸出數(shù)據(jù),N為訓(xùn)練集樣本數(shù)量。通過(guò)學(xué)習(xí)調(diào)整各神經(jīng)元的參數(shù),讓神經(jīng)網(wǎng)絡(luò)產(chǎn)生期望的結(jié)果;
其中,隱含神經(jīng)元的功能函數(shù)為
\*MERGEFORMAT (31)
其中,θ'為指定的閾值,w為權(quán)重,且f=1-ex/1+ex
輸出層的功能函數(shù)為
\*MERGEFORMAT (32)
其中,θ″為指定的閾值,u為權(quán)重,且f=1-eh/1+eh。
優(yōu)選的,所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的顯示輸出模塊根據(jù)孕婦的實(shí)際判斷數(shù)據(jù),做出相應(yīng)的輸出。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:該機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)及病情程度預(yù)測(cè)系統(tǒng),其保證母嬰健康,減少因?yàn)轶w重管理不當(dāng)導(dǎo)致的妊娠預(yù)后不良發(fā)生增加??梢詭椭t(yī)生和患者提早發(fā)現(xiàn)GDM病情,并且為治療疾病爭(zhēng)取更多的時(shí)間從而可以有效提高患者治療質(zhì)量,降低病情對(duì)胎兒的影響。GDM對(duì)孕產(chǎn)婦、胎嬰兒具有多重負(fù)性影響,如GDM產(chǎn)婦在產(chǎn)后易發(fā)展為2型糖尿病(T2DM);胎嬰兒有巨大兒、死胎、新生兒呼吸窘迫綜合征、低血糖等并發(fā)癥;子代將來(lái)患糖耐量減低、兒童期肥胖、神經(jīng)心理失調(diào)等風(fēng)險(xiǎn)增加。按新的診斷標(biāo)準(zhǔn)GDM的發(fā)生率約18%,其持續(xù)增長(zhǎng)的流行病學(xué)趨勢(shì)已成為嚴(yán)重的公共衛(wèi)生問(wèn)題。目前75g口服葡萄糖耐量試驗(yàn)(OGTT)篩查時(shí)機(jī)多為孕24~28周后,對(duì)篩查出GDM孕婦進(jìn)行飲食或胰島素干預(yù),以降低孕產(chǎn)婦并發(fā)癥及圍生兒不良妊娠結(jié)局的發(fā)生率。然而此時(shí)已至孕中晚期,分娩前對(duì)GDM干預(yù)時(shí)間短,因此通過(guò)孕早期分析和評(píng)價(jià)危險(xiǎn)因素,不僅有助于確定高危人群、提高GDM的篩查效率,并且對(duì)預(yù)防和降低
GDM發(fā)生起到重要作用。
附圖說(shuō)明
圖1為本發(fā)明系統(tǒng)框圖。
圖2為本發(fā)明原理框圖。
圖3為本發(fā)明BP神經(jīng)網(wǎng)絡(luò)原理圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參閱圖1-3,本發(fā)明提供一種技術(shù)方案:
實(shí)施例1:
一種機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),其組成包括:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、機(jī)器學(xué)習(xí)模塊、風(fēng)險(xiǎn)性評(píng)估模塊、專家系統(tǒng)模塊、顯示輸出模塊,所述的數(shù)據(jù)采集模塊的輸出端與數(shù)據(jù)預(yù)處理模塊的輸入端連接,所述的數(shù)據(jù)預(yù)處理模塊的輸出端與機(jī)器學(xué)習(xí)模塊和專家系統(tǒng)模塊的輸入端連接,所述的機(jī)器學(xué)習(xí)模塊的輸出端與風(fēng)險(xiǎn)性評(píng)估模塊的輸入端連接,所述的風(fēng)險(xiǎn)性評(píng)估模塊的輸出端與專家系統(tǒng)模塊輸入端連接,所述的專家系統(tǒng)模塊的輸出端與顯示輸出模塊的輸入端連接。
實(shí)施例2:
根據(jù)實(shí)施例1所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的數(shù)據(jù)采集模塊負(fù)責(zé)采集孕婦的數(shù)據(jù),包括對(duì)孕婦的年齡,身高,體重,血糖,懷孕周期等數(shù)據(jù)的采集工作,其中,年齡,身高、工作性質(zhì)和每周運(yùn)動(dòng)量為節(jié)點(diǎn)數(shù)據(jù),體重、血糖和懷孕周期為流數(shù)據(jù)。
實(shí)施例3:
根據(jù)實(shí)施例1或2所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的數(shù)據(jù)預(yù)處理模塊負(fù)責(zé)數(shù)據(jù)的預(yù)處理工作,主要包含兩部分工作,數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化,數(shù)據(jù)清洗主要負(fù)責(zé)清洗出一些無(wú)效數(shù)據(jù)和錯(cuò)誤數(shù)據(jù),數(shù)據(jù)標(biāo)準(zhǔn)化是指將用戶的年齡,體重,血糖,懷孕周期等數(shù)據(jù),同一度量單位,同一格式。
實(shí)施例4:
根據(jù)實(shí)施例1或2或3所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的機(jī)器學(xué)習(xí)模塊主要負(fù)責(zé)分析單因素連續(xù)時(shí)間變量與妊娠期糖尿病之間的關(guān)系,例如血糖,體脂比變化等,該模塊采用隱馬爾科夫模型分析單因素的異常波動(dòng)與妊娠期糖尿病之間的關(guān)系,其模型可以由一個(gè)五元組表示;
λ=(A,B,π,Q,V)
\*MERGEFORMAT (1)
身體狀態(tài)集合Q
孕婦的身體狀態(tài)是一個(gè)隱含變量,日常生活中不可能被直接觀測(cè)出來(lái),因此
用隱馬爾科夫模型中的隱含狀態(tài)表示孕婦的身體健康狀態(tài),設(shè)Q是所有可能的身體健康狀態(tài)的集合,則
Q={q0,q1}
\*MERGEFORMAT (2)
其中,q0表示孕婦身體處于健康狀態(tài),q1表示孕婦身體出于非健康狀態(tài);
檢測(cè)指標(biāo)集合V
在醫(yī)療診斷環(huán)節(jié)中,孕婦的檢查指標(biāo)是可以觀測(cè)到的變量,因此,令孕婦的身體檢測(cè)指標(biāo)集合作為可觀測(cè)狀態(tài)集合,設(shè)V是某項(xiàng)檢測(cè)項(xiàng)目所有可能檢測(cè)結(jié)果的集合,則
V={v1,v2,…,vM}
\*MERGEFORMAT (3)
其中,M是可能的檢測(cè)結(jié)果的數(shù)量;
身體狀態(tài)轉(zhuǎn)移矩陣A
設(shè)L是長(zhǎng)度為T的身體健康狀態(tài)序列,L=(l0,l1,l2,…,lT),孕婦的當(dāng)前的狀態(tài)與之前的身體狀態(tài)有關(guān),則健康狀態(tài)轉(zhuǎn)移矩陣為:
A=[aij]N×N
\*MERGEFORMAT (4)
其中,
aij=p(lr=qi|lr-1=qj),1≤r≤T
\*MERGEFORMAT (5)
表示狀態(tài)轉(zhuǎn)移概率,其中aij是與時(shí)間t獨(dú)立的,且滿足0≤aij≤1,
身體狀態(tài)觀測(cè)概率矩陣B
設(shè)O是對(duì)應(yīng)的檢測(cè)項(xiàng)目觀測(cè)序列,O=(o1,o2,…,oT),則觀測(cè)概率矩陣為
B=[bij]N×M
\*MERGEFORMAT (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顧客身體健康狀態(tài)與檢測(cè)指標(biāo)之間觀測(cè)概率,其中bi(k)是與時(shí)間t獨(dú)立的,且滿足0≤bi(k)≤1,
初始孕婦身體狀態(tài)分布π
描述了在初始狀態(tài)時(shí),孕婦身體健康與非健康狀態(tài)之間的比例;
π=(πl)
\*MERGEFORMAT (7)
其中,
πi=P(lr=qi),1≤r≤T
\*MERGEFORMAT (8)
且滿足0≤πi≤1,且
采用前向后向算法,對(duì)隱馬爾科夫模型進(jìn)行學(xué)習(xí)。前向?qū)W習(xí)算法過(guò)程如下:第一步,確定前向概率αt(qi);
在給定隱馬爾科夫模型λ中,前向概率是指到時(shí)刻t時(shí)孕婦某項(xiàng)檢測(cè)指標(biāo)為o1,o2,…,ot且孕婦的身體狀態(tài)為qi的條件概率,記作
\*MERGEFORMAT (9)
然后通過(guò)歸納法求解αt+1(qi)
遞推可得:
\*MERGEFORMAT (10)
那么,前向觀測(cè)概率為
\*MERGEFORMAT (11)
第二步確定后向概率;
在給定隱馬爾科夫模型λ中,后向變量βt(i)是指在t時(shí)刻為狀態(tài)qi的條件下,從t+1到T的部分孕婦檢測(cè)指標(biāo)序列為ot+1,ot+2,…,oT的條件概率,記作
\*MERGEFORMAT (12)
通過(guò)歸納法求解βt(i)可得:
\*MERGEFORMAT (13)
于是可以得出:
\*MERGEFORMAT (14)
第三步執(zhí)行EM算法的E步:
求Q函數(shù)Q
\*MERGEFORMAT (15)
其中,是隱馬爾科夫模型參數(shù)的當(dāng)前估計(jì)值,λ是要極大化的隱馬爾科夫模型參數(shù);
P(O,L|λ)=πibi(ot)ai…b1(o1)a1
\*MERGEFORMAT (16)
于是函數(shù)Q可以改寫為
\*MERGEFORMAT (17)
第四步執(zhí)行EM算法的M步:
極大化Q函數(shù)Q由于要極大化的參數(shù)在公式中單獨(dú)出現(xiàn)在三個(gè)項(xiàng)中,所以只需要對(duì)各項(xiàng)分別極大化即可,分別對(duì)每一項(xiàng)進(jìn)行拉格朗日乘子法求解,可以找到使得公式取得最大值的條件,分別如下所示。采用Hadar等價(jià)變換,在隱馬爾科夫模型中,狀態(tài)序列為其觀測(cè)過(guò)程為令
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T
\*MERGEFORMAT (18)
則可以由公式得出
第一項(xiàng)極大化條件:
\*MERGEFORMAT (19)
第二項(xiàng)極大化條件:
\*MERGEFORMAT (20)
第三項(xiàng)極大化條件:
\*MERGEFORMAT (21)
實(shí)施例5:
根據(jù)實(shí)施例1或2或3或4所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的風(fēng)險(xiǎn)性評(píng)估模塊在獲得模型中各個(gè)參數(shù)之后,給定任何孕婦的某項(xiàng)項(xiàng)目的檢測(cè)指標(biāo),采用維特比算法就可以識(shí) 別出每一個(gè)時(shí)刻的孕婦的身體狀態(tài),從而可以判斷出當(dāng)前孕婦患病的風(fēng)險(xiǎn);
定義為單個(gè)身體狀態(tài)序列中的最大值,則在時(shí)刻t興趣模式為的身體狀態(tài)概率最大值為
\*MERGEFORMAT (22)
采用維特比算法,就可以得到某一個(gè)孕婦在某時(shí)刻的身體狀態(tài);
算法流程
初始化:
δ1(i)=πibi(o1)
\*MERGEFORMAT (23)
\*MERGEFORMAT (24)
其中,0≤i≤N-1
遞歸計(jì)算:
\*MERGEFORMAT (25)
\*MERGEFORMAT (26)
其中,0≤i≤N-1
中斷:
\*MERGEFORMAT (27)
\*MERGEFORMAT (28)
回溯最佳路徑:
\*MERGEFORMAT (29)
最佳的身體狀態(tài)序列:
Y*=l2-r…lT
\*MERGEFORMAT (30)
通過(guò)上述方式,就可以根據(jù)孕婦的實(shí)時(shí)的檢測(cè)項(xiàng)目具體指標(biāo),判斷出孕婦當(dāng)前的身體健康狀態(tài),從而判斷出孕婦患病得風(fēng)險(xiǎn)。
實(shí)施例6:
根據(jù)實(shí)施例1或2或3或4或5所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),所述的專家系統(tǒng)診斷模塊根據(jù)孕婦的風(fēng)險(xiǎn)性評(píng)估模塊,通過(guò)分析不同檢驗(yàn)指標(biāo),可以得出孕婦可能患有妊娠期糖尿病的概率,本發(fā)明采用BP神經(jīng)網(wǎng)絡(luò)方法評(píng)估各指標(biāo)的風(fēng)險(xiǎn)性,從而對(duì)患病概率做出預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)包括三層,分別是輸入層,隱含層和輸出層;如圖3,
輸入層輸入與妊娠期糖尿病有關(guān)的各個(gè)因素,分別為孕婦年齡(x1)、血糖風(fēng)險(xiǎn)(x2)、體脂比風(fēng)險(xiǎn)(x3)、工作性質(zhì)(x4)、鍛煉強(qiáng)度指標(biāo)(x5),采用有監(jiān)督學(xué)習(xí)算法進(jìn)行訓(xùn)練集學(xué)習(xí),根據(jù)給出正確的輸入和輸出對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)整,讓神經(jīng)網(wǎng)絡(luò)能做出正確的反應(yīng)。學(xué)習(xí)訓(xùn)練樣本表示為 i=1,2…,N,其中,為樣本輸入數(shù)據(jù),為yi樣本輸出數(shù)據(jù),N為訓(xùn)練集樣本數(shù)量。通過(guò)學(xué)習(xí)調(diào)整各神經(jīng)元的參數(shù),讓神經(jīng)網(wǎng)絡(luò)產(chǎn)生期望的結(jié)果;
其中,隱含神經(jīng)元的功能函數(shù)為
\*MERGEFORMAT (31)
其中,θ'為指定的閾值,w為權(quán)重,且f=1-ex/1+ex
輸出層的功能函數(shù)為
\*MERGEFORMAT (32)
其中,θ″為指定的閾值,u為權(quán)重,且f=1-eh/1+eh。
實(shí)施例7:
根據(jù)實(shí)施例1或2或3或4或5或所述的機(jī)器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險(xiǎn)病情程度預(yù)測(cè)系統(tǒng),其特征是:所述的顯示輸出模塊根據(jù)孕婦的實(shí)際判斷數(shù)據(jù),做出相應(yīng)的輸出。
盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同物限定。