1.基于全記憶事件序列挖掘模型的用藥分析方法,其特征在于,具體步驟為:
(1)首先,對患者歷史用藥數(shù)據(jù)進(jìn)行預(yù)處理,即采集用藥事件序列的原始數(shù)據(jù),將原始用藥數(shù)據(jù)轉(zhuǎn)換成用藥事件發(fā)生序列;然后,對用藥事件序列數(shù)據(jù)進(jìn)行處理,將序列中的每個事件都用一個或多個類別型的變量進(jìn)行表示;
(2)對于已經(jīng)處理好的類別型變量表示的事件序列,設(shè)置一個特定的記憶長度閾值,選擇高于該閾值的序列用于構(gòu)造訓(xùn)練數(shù)據(jù)集;
(3)采用基于全記憶事件序列方法構(gòu)建訓(xùn)練預(yù)測模型;
(4)對于新的用藥事件序列,輸入預(yù)測模型實現(xiàn)對未來時間節(jié)點的用藥事件進(jìn)行預(yù)測。
2.如權(quán)利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(1)中的患者歷史用藥數(shù)據(jù)的事件序列的轉(zhuǎn)化表示方法,該步驟將患者歷史用藥記錄表示為事件,每個事件用一個或多個類別型變量表示。
3.如權(quán)利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(2)中將患者用藥的歷史事件作為記憶序列,形成記憶特征表示。
4.如權(quán)利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(4)把要新的用藥事件序列作為訓(xùn)練好的預(yù)測模型的輸入,使用模型輸出預(yù)測結(jié)果。
5.如權(quán)利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(2)中所述構(gòu)造訓(xùn)練數(shù)據(jù)集方法的具體步驟為:
(1)設(shè)置一個特定的記憶長度閾值M,高于這個閾值的序列才用于構(gòu)造訓(xùn)練數(shù)據(jù)集合;
(2)對于每個事件序列,從第M+1個事件節(jié)點開始設(shè)置預(yù)測節(jié)點,采集訓(xùn)練集;預(yù)測節(jié)點的每個類別變量作為模型的輸出,當(dāng)前節(jié)點之前的所有節(jié)點作為模型的輸入;預(yù)測節(jié)點不斷向右移動,每移動一個時間節(jié)點就形成一個或多個新的訓(xùn)練數(shù)據(jù)。
6.如權(quán)利要求5所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(3)中所述構(gòu)建訓(xùn)練模型方法的具體步驟為:
(1)設(shè)置一個最大記憶數(shù)量T,使用的記憶數(shù)量不能超過這個數(shù)量,通常設(shè)置大于數(shù)據(jù)中大部分序列的長度;
(2)初始化變換矩陣A,把預(yù)測事件的前一個事件投影到多維連續(xù)空間中的向量,并求和形成一個向量q;
(3)初次化變換矩陣B、C,把預(yù)測事件之前的所有事件分別投影到多維連續(xù)空間中的多個向量,這些稱為記憶向量,表示預(yù)測事件的所有記憶;
(4)使用向量q和經(jīng)過B投影矩陣變換后的向量做內(nèi)積,形成權(quán)重向量,再使用這些權(quán)重向量和經(jīng)過C投影矩陣變換后的記憶向量加權(quán)求和,形成最終的一個記憶向量表示m;
(5)向量m和向量q相加,作為預(yù)測分類器的輸入,并使用一個變換矩陣W,投影到原始的離散事件空間,再使用softmax函數(shù),得到下一個預(yù)測事件的每一項的概率;
(6)使用交叉熵?fù)p失函數(shù)作為目標(biāo)函數(shù),使用梯度下降的方法求參數(shù),即求得參數(shù)A、B、C和W。