1.一種機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其組成包括:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、機器學(xué)習(xí)模塊、風(fēng)險性評估模塊、專家系統(tǒng)模塊、顯示輸出模塊,其特征是:所述的數(shù)據(jù)采集模塊的輸出端與數(shù)據(jù)預(yù)處理模塊的輸入端連接,所述的數(shù)據(jù)預(yù)處理模塊的輸出端與機器學(xué)習(xí)模塊和專家系統(tǒng)模塊的輸入端連接,所述的機器學(xué)習(xí)模塊的輸出端與風(fēng)險性評估模塊的輸入端連接,所述的風(fēng)險性評估模塊的輸出端與專家系統(tǒng)模塊輸入端連接,所述的專家系統(tǒng)模塊的輸出端與顯示輸出模塊的輸入端連接。
2.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的數(shù)據(jù)采集模塊負(fù)責(zé)采集孕婦的數(shù)據(jù),包括對孕婦的年齡,身高,體重,血糖,懷孕周期等數(shù)據(jù)的采集工作,其中,年齡,身高、工作性質(zhì)和每周運動量為節(jié)點數(shù)據(jù),體重、血糖和懷孕周期為流數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的數(shù)據(jù)預(yù)處理模塊負(fù)責(zé)數(shù)據(jù)的預(yù)處理工作,主要包含兩部分工作,數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化,數(shù)據(jù)清洗主要負(fù)責(zé)清洗出一些無效數(shù)據(jù)和錯誤數(shù)據(jù),數(shù)據(jù)標(biāo)準(zhǔn)化是指將用戶的年齡,體重,血糖,懷孕周期等數(shù)據(jù),同一度量單位,同一格式。
4.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的機器學(xué)習(xí)模塊主要負(fù)責(zé)分析單因素連續(xù)時間變量與妊娠期糖尿病之間的關(guān)系,例如血糖,體脂比變化等,
該模塊采用隱馬爾科夫模型分析單因素的異常波動與妊娠期糖尿病之間的關(guān)系,其模型可以由一個五元組表示;
λ=(A,B,π,Q,V)
\*MERGEFORMAT (1)
身體狀態(tài)集合Q
孕婦的身體狀態(tài)是一個隱含變量,日常生活中不可能被直接觀測出來,因此用隱馬爾科夫模型中的隱含狀態(tài)表示孕婦的身體健康狀態(tài),設(shè)Q是所有可能的身體健康狀態(tài)的集合,則
Q={q0,q1}
\*MERGEFORMAT (2)
其中,q0表示孕婦身體處于健康狀態(tài),q1表示孕婦身體出于非健康狀態(tài);
檢測指標(biāo)集合V
在醫(yī)療診斷環(huán)節(jié)中,孕婦的檢查指標(biāo)是可以觀測到的變量,因此,令孕婦的身體檢測指標(biāo)集合作為可觀測狀態(tài)集合,設(shè)V是某項檢測項目所有可能檢測結(jié)果的集合,則
V={v1,v2,…,vM}
\*MERGEFORMAT (3)
其中,M是可能的檢測結(jié)果的數(shù)量;
身體狀態(tài)轉(zhuǎn)移矩陣A
設(shè)L是長度為T的身體健康狀態(tài)序列,L=(l0,l1,l2,…,lT),孕婦的當(dāng)前的狀態(tài)與之前的身體狀態(tài)有關(guān),則健康狀態(tài)轉(zhuǎn)移矩陣為:
A=[aij]N×N
\*MERGEFORMAT (4)
其中,
aij=p(lr=qi|lr-1=qj),1≤r≤T
\*MERGEFORMAT (5)
表示狀態(tài)轉(zhuǎn)移概率,其中aij是與時間t獨立的,且滿足0≤aij≤1,
身體狀態(tài)觀測概率矩陣B
設(shè)O是對應(yīng)的檢測項目觀測序列,O=(o1,o2,…,oT),則觀測概率矩陣為
B=[bij]N×M
\*MERGEFORMAT (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顧客身體健康狀態(tài)與檢測指標(biāo)之間觀測概率,其中bi(k)是與時間t獨立的,且滿足0≤bi(k)≤1,
初始孕婦身體狀態(tài)分布π
描述了在初始狀態(tài)時,孕婦身體健康與非健康狀態(tài)之間的比例;
π=(πl)
\*MERGEFORMAT (7)
其中,
πi=P(lr=qi),1≤r≤T
\*MERGEFORMAT (8)
且滿足0≤πi≤1,且
采用前向后向算法,對隱馬爾科夫模型進行學(xué)習(xí)。前向?qū)W習(xí)算法過程如下:
第一步,確定前向概率αt(qi);
在給定隱馬爾科夫模型λ中,前向概率是指到時刻t時孕婦某項檢測指標(biāo)為o1,o2,…,ot且孕婦的身體狀態(tài)為qi的條件概率,記作
然后通過歸納法求解αt+1(qi)
遞推可得:
那么,前向觀測概率為
第二步確定后向概率;
在給定隱馬爾科夫模型λ中,后向變量βt(i)是指在t時刻為狀態(tài)qi的條件下,從t+1到T的部分孕婦檢測指標(biāo)序列為ot+1,ot+2,…,oT的條件概率,記作
通過歸納法求解βt(i)可得:
于是可以得出:
第三步執(zhí)行EM算法的E步:
求Q函數(shù)
其中,是隱馬爾科夫模型參數(shù)的當(dāng)前估計值,λ是要極大化的隱馬爾科夫模型參數(shù);
P(O,L|λ)=πibi(ot)ai…b1(o1)a1
\*MERGEFORMAT (16)
于是函數(shù)可以改寫為
第四步執(zhí)行EM算法的M步:
極大化Q函數(shù)由于要極大化的參數(shù)在公式中單獨出現(xiàn)在三個項中,所以只需要對各項分別極大化即可,分別對每一項進行拉格朗日乘子法求解,可以找到使得公式取得最大值的條件,分別如下所示。采用Hadar等價變換,在隱馬爾科夫模型中,狀態(tài)序列為其觀測過程為令
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T
\*MERGEFORMAT (18)
則可以由公式得出
第一項極大化條件:
第二項極大化條件:
第三項極大化條件:
5.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的風(fēng)險性評估模塊在獲得模型中各個參數(shù)之后,給定任何孕婦的某項項目的檢測指標(biāo),采用維特比算法就可以識別出每一個時刻的孕婦的身體狀態(tài),從而可以判斷出當(dāng)前孕婦患病的風(fēng)險;
定義為單個身體狀態(tài)序列中的最大值,則在時刻t興趣模式為的身體狀態(tài)概率最大值為
采用維特比算法,就可以得到某一個孕婦在某時刻的身體狀態(tài);
算法流程
初始化:
δ1(i)=πibi(o1)
\*MERGEFORMAT (23)
其中,0≤i≤N-1
遞歸計算:
其中,0≤i≤N-1
中斷:
回溯最佳路徑:
最佳的身體狀態(tài)序列:
Y*=l2-r…lT
\*MERGEFORMAT (30)
通過上述方式,就可以根據(jù)孕婦的實時的檢測項目具體指標(biāo),判斷出孕婦當(dāng)前的身體健康狀態(tài),從而判斷出孕婦患病得風(fēng)險。
6.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的專家系統(tǒng)診斷模塊根據(jù)孕婦的風(fēng)險性評估模塊,通過分析不同檢驗指標(biāo),可以得出孕婦可能患有妊娠期糖尿病的概率,本發(fā)明采用BP神經(jīng)網(wǎng)絡(luò)方法評估各指標(biāo)的風(fēng)險性,從而對患病概率做出預(yù)測,BP神經(jīng)網(wǎng)絡(luò)包括三層,分別是輸入層,隱含層和輸出層;
輸入層輸入與妊娠期糖尿病有關(guān)的各個因素,分別為孕婦年齡(x1)、血糖風(fēng)險(x2)、體脂比風(fēng)險(x3)、工作性質(zhì)(x4)、鍛煉強度指標(biāo)(x5),采用有監(jiān)督學(xué)習(xí)算法進行訓(xùn)練集學(xué)習(xí),根據(jù)給出正確的輸入和輸出對神經(jīng)網(wǎng)絡(luò)進行調(diào)整,讓神經(jīng)網(wǎng)絡(luò)能做出正確的反應(yīng)。學(xué)習(xí)訓(xùn)練樣本表示為i=1,2…,N,其中,為樣本輸入數(shù)據(jù),為yi樣本輸出數(shù)據(jù),N為訓(xùn)練集樣本數(shù)量。通過學(xué)習(xí)調(diào)整各神經(jīng)元的參數(shù),讓神經(jīng)網(wǎng)絡(luò)產(chǎn)生期望的結(jié)果;
其中,隱含神經(jīng)元的功能函數(shù)為
其中,θ'為指定的閾值,w為權(quán)重,且f=1-ex/1+ex
輸出層的功能函數(shù)為
其中,θ”為指定的閾值,u為權(quán)重,且f=1-eh/1+eh。
7.根據(jù)權(quán)利要求1所述的機器學(xué)習(xí)妊娠期糖尿病發(fā)病風(fēng)險病情程度預(yù)測系統(tǒng),其特征是:所述的顯示輸出模塊根據(jù)孕婦的實際判斷數(shù)據(jù),做出相應(yīng)的輸出。