使用個(gè)性化的預(yù)測模型識別并評級個(gè)體層面的風(fēng)險(xiǎn)因子的制作方法
【專利摘要】實(shí)施例涉及識別個(gè)體層面的風(fēng)險(xiǎn)因子的方法。該方法包括從人口數(shù)據(jù)識別風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子,并且基于該組全局風(fēng)險(xiǎn)因子來從人口數(shù)據(jù)中識別成員,該成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性。該方法基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、人口數(shù)據(jù)中的成員,訓(xùn)練風(fēng)險(xiǎn)目標(biāo)的個(gè)性化預(yù)測模型。該方法基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。
【專利說明】
使用個(gè)性化的預(yù)測模型識別并評級個(gè)體層面的風(fēng)險(xiǎn)因子
技術(shù)領(lǐng)域
[0001]本公開總的涉及特定的疾病狀態(tài)的風(fēng)險(xiǎn)因子。更具體地,本公開涉及用于使用個(gè)性化的預(yù)測模型識別并評級個(gè)體層面的風(fēng)險(xiǎn)因子的系統(tǒng)和方法。
【背景技術(shù)】
[0002]預(yù)測建模經(jīng)常用在臨床以及醫(yī)療保健研究。例如,預(yù)測建模已經(jīng)成功應(yīng)用到病發(fā)的早期檢測以及更好的個(gè)性化護(hù)理。預(yù)測建模中的常規(guī)方式是構(gòu)建使用所有可用的訓(xùn)練數(shù)據(jù)的單一的“全局”預(yù)測模型,然后其用于計(jì)算個(gè)體患者的風(fēng)險(xiǎn)分?jǐn)?shù)并識別人口廣泛風(fēng)險(xiǎn)因子。在個(gè)體化醫(yī)藥領(lǐng)域的近期研究中顯示出患者人群趨向于異質(zhì)性(heterogeneous)。相應(yīng)地,每個(gè)患者具有獨(dú)特的特性,因此目標(biāo)化的、患者特定的預(yù)測、建議和治療是有幫助的。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的實(shí)施例涉及識別個(gè)體層面的風(fēng)險(xiǎn)因子的計(jì)算機(jī)實(shí)現(xiàn)方法。該方法包括由至少一個(gè)處理器電路從一組人口數(shù)據(jù)識別至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子。該方法還包括由至少一個(gè)處理器電路至少部分基于該組全局風(fēng)險(xiǎn)因子來從該組人口數(shù)據(jù)中識別至少一個(gè)成員,其中所述至少一個(gè)成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性。該方法還包括由至少一個(gè)處理器至少部分基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、該組人口數(shù)據(jù)中的至少一個(gè)成員,訓(xùn)練至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的至少一個(gè)個(gè)性化預(yù)測模型。該方法還包括由至少一個(gè)處理器至少部分基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。
[0004]實(shí)施例還涉及用于識別個(gè)體層面的風(fēng)險(xiǎn)因子的計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括在其中體現(xiàn)了程序指令的計(jì)算機(jī)可讀存儲介質(zhì),其中計(jì)算機(jī)可讀存儲介質(zhì)本質(zhì)上不是短暫的信號。該程序指令可由至少一個(gè)處理器電路讀取以使該至少一個(gè)處理器電路執(zhí)行以下方法,包括:從一組人口數(shù)據(jù)識別至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子。該方法還包括至少部分基于該組全局風(fēng)險(xiǎn)因子來從該組人口數(shù)據(jù)中識別至少一個(gè)成員,其中所述至少一個(gè)成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性。該方法還包括至少部分基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、該組人口數(shù)據(jù)中的至少一個(gè)成員,訓(xùn)練至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的至少一個(gè)個(gè)性化預(yù)測模型。該方法還包括至少部分基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。
[0005]實(shí)施例進(jìn)一步涉及用于識別個(gè)體層面的風(fēng)險(xiǎn)因子的計(jì)算機(jī)系統(tǒng)。該計(jì)算機(jī)系統(tǒng)包括至少一個(gè)處理器電路,配置來從一組人口數(shù)據(jù)中識別至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子。該系統(tǒng)進(jìn)一步包括至少一個(gè)處理器電路,配置來至少部分基于該組全局風(fēng)險(xiǎn)因子來從該組人口數(shù)據(jù)中識別至少一個(gè)成員,其中所述至少一個(gè)成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性。該系統(tǒng)還包括至少一個(gè)處理器,配置來至少部分基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、該組人口數(shù)據(jù)中的至少一個(gè)成員,訓(xùn)練至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的至少一個(gè)個(gè)性化預(yù)測模型。該系統(tǒng)還包括至少一個(gè)處理器,配置來至少部分基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。
[0006]通過這里描述的技術(shù)實(shí)現(xiàn)附加的特征以及優(yōu)點(diǎn)。這里詳細(xì)描述了其它實(shí)施例和方面。為了更好地理解,請參照具體描述以及附圖。
【附圖說明】
[0007]在所附的權(quán)利要求中特別指出并毫無疑義地聲明了本公開的主題。通過結(jié)合下面的附圖,上述以及其它特征和優(yōu)點(diǎn)將在下面的詳細(xì)描述中變得更加清楚。
[0008]圖1描述圖解根據(jù)一個(gè)多個(gè)實(shí)施例的系統(tǒng)的不意圖;
[0009]圖2描述圖解圖1所示的系統(tǒng)的更具體的實(shí)現(xiàn)的示意圖;
[0010]圖3描述能夠?qū)崿F(xiàn)本公開的一個(gè)或多個(gè)實(shí)施例的示例性計(jì)算機(jī)系統(tǒng);
[0011 ]圖4描述圖解根據(jù)一個(gè)多個(gè)實(shí)施例的方法的流程圖;
[0012]圖5描述圖解全局風(fēng)險(xiǎn)因子的示例的示意圖,其中從關(guān)于所有訓(xùn)練患者訓(xùn)練的邏輯回歸模型確定該全局風(fēng)險(xiǎn)因子;
[0013]圖6描述圖解根據(jù)一個(gè)或多個(gè)實(shí)施例確定的個(gè)體化風(fēng)險(xiǎn)因子的示例的示意圖;
[0014]圖7描述圖解根據(jù)一個(gè)或多個(gè)實(shí)施例的個(gè)體化邏輯回歸分類器的性能的示意圖;
[0015]圖8描述根據(jù)一個(gè)或多個(gè)實(shí)施例的計(jì)算機(jī)程序產(chǎn)品。
[0016]在附圖以及下面的公開實(shí)施例的詳細(xì)說明中,向附圖中示出的各種元件設(shè)置三或四位附圖標(biāo)記。每個(gè)附圖標(biāo)記的最左側(cè)的數(shù)字對應(yīng)于第一次圖解其元件的圖。
【具體實(shí)施方式】
[0017]將參照附圖描述本公開的各個(gè)實(shí)施例。在不背離本公開的范圍的情況下可以設(shè)計(jì)出替代實(shí)施例。應(yīng)當(dāng)注意,在下面的描述和附圖中的元件之間詳細(xì)闡述了各個(gè)實(shí)施例。除非另行說明,這些連接可以是直接或間接的,并且本公開不意欲在這方面進(jìn)行限定。因此實(shí)體間的耦合可以指直接或間接連接。
[0018]如之前在這里說明的那樣,預(yù)測建模已經(jīng)成功地應(yīng)用到病發(fā)的早期檢測以及更好的個(gè)性化護(hù)理。預(yù)測建模是賦予數(shù)學(xué)技術(shù)的集合的名稱,這類數(shù)學(xué)技術(shù)具有找到目標(biāo)、響應(yīng)或“因變量(dependent)”以及可變預(yù)測符或“自變量(independent)”之間的數(shù)學(xué)關(guān)系的共同目標(biāo),并且具有測量那些預(yù)測符的未來值并將其插入數(shù)學(xué)關(guān)系來預(yù)測目標(biāo)變量的未來值的目標(biāo)。由于這些關(guān)系在實(shí)踐中是不完美的,因此希望對預(yù)測的不確定性給予一些度量。例如可以向預(yù)測區(qū)間賦予置信度(如,95%)。處理中的另一任務(wù)是建模。通??捎玫臐撛陬A(yù)測符變量可被分類為三組:那些不太可能影響響應(yīng)的變量、那些幾乎確定影響響應(yīng)并因此注定包含在預(yù)測方程中的那些變量、以及那些在中間的、可能或可能不影響響應(yīng)的變量。在同時(shí)期的患者診斷方法中,預(yù)測建模中的途徑是使用所有的可用訓(xùn)練數(shù)據(jù)建立單一的“全局”預(yù)測模型,然后該預(yù)測模型用于計(jì)算個(gè)體患者的風(fēng)險(xiǎn)分?jǐn)?shù)并且識別人口廣泛風(fēng)險(xiǎn)因子。近來在個(gè)性化醫(yī)療領(lǐng)域中的研究表明患者人群趨向于異質(zhì)性。相應(yīng)地,每個(gè)患者具有獨(dú)特的特性,因此目標(biāo)化的、患者特定的預(yù)測、建議、推薦和治療是有幫助的。
[0019]因此,本公開涉及用于使用個(gè)性化的預(yù)測模型識別并評級個(gè)體層面的風(fēng)險(xiǎn)因子的系統(tǒng)和方法。本公開的一個(gè)或多個(gè)實(shí)施例針對每個(gè)患者提供患者特定的或‘個(gè)性化’的預(yù)測模型。由于使用來自患者以及來自臨床類似的患者的信息構(gòu)建所公開的模型,因此針對個(gè)體的患者定制該模型。由于所公開的個(gè)性化預(yù)測模型是針對具體的患者動態(tài)訓(xùn)練的,因此這樣的個(gè)性化預(yù)測模型可以利用最相關(guān)的患者信息,并可能產(chǎn)生更準(zhǔn)確的風(fēng)險(xiǎn)評價(jià)(如,分?jǐn)?shù))并識別更相關(guān)和信息量更大的患者特定的風(fēng)險(xiǎn)因子。
[0020]現(xiàn)在詳細(xì)參照附圖,其中相同的附圖標(biāo)記指代相同的元件。圖1描述圖解根據(jù)一個(gè)或多個(gè)實(shí)施例的系統(tǒng)100的示意圖。如圖所配置或排列,系統(tǒng)100包括訓(xùn)練患者數(shù)據(jù)102、個(gè)體患者數(shù)據(jù)104、預(yù)測模型106和個(gè)體風(fēng)險(xiǎn)因子108。訓(xùn)練患者數(shù)據(jù)102從大量患者(如,數(shù)千)獲取,并且包括用于訓(xùn)練的風(fēng)險(xiǎn)目標(biāo)標(biāo)簽。訓(xùn)練患者數(shù)據(jù)102包括電子醫(yī)學(xué)記錄(如,診斷、實(shí)驗(yàn)室、藥物治療、操作等等)、調(diào)查問卷數(shù)據(jù)、遺傳學(xué)、活動/飲食跟蹤數(shù)據(jù)等等。與訓(xùn)練患者數(shù)據(jù)相對,個(gè)體患者數(shù)據(jù)104從感興趣的患者處獲得。個(gè)體患者數(shù)據(jù)104包括電子醫(yī)學(xué)記錄(如,診斷、實(shí)驗(yàn)室、藥物治療、操作等等)、調(diào)查問卷數(shù)據(jù)、遺傳學(xué)等等。
[0021]訓(xùn)練患者數(shù)據(jù)102和個(gè)體患者數(shù)據(jù)104被輸入到預(yù)測模型106,該預(yù)測模型106包括多種類型的預(yù)測模型(決策樹、邏輯回歸、貝葉斯網(wǎng)絡(luò)、隨機(jī)森林等等)。預(yù)測模型106在類似的患者群上訓(xùn)練,并且用于提供在病例和對照(cases and control)之間區(qū)分的重要的風(fēng)險(xiǎn)因子的更強(qiáng)的評估。因此,預(yù)測模型106選擇并評級個(gè)體的患者特定的風(fēng)險(xiǎn)來產(chǎn)生個(gè)體的風(fēng)險(xiǎn)因子108。
[0022]圖2描述圖解系統(tǒng)100A的示意圖,其為圖1所示的系統(tǒng)100的更詳細(xì)的實(shí)現(xiàn)。更具體地,在系統(tǒng)100A中,預(yù)測模型106被實(shí)現(xiàn)為全局風(fēng)險(xiǎn)因子選擇模塊202、類似患者識別模塊204、個(gè)性化預(yù)測模型訓(xùn)練模塊206以及個(gè)體風(fēng)險(xiǎn)因子選擇和評級模塊208。全局風(fēng)險(xiǎn)因子選擇模塊202使用訓(xùn)練患者數(shù)據(jù)來識別特定的風(fēng)險(xiǎn)目標(biāo)(如,心力衰竭、糖尿病、慢性阻塞性肺病等等)的全局風(fēng)險(xiǎn)因子??梢允褂镁哂胁煌膮^(qū)分度量標(biāo)準(zhǔn)的標(biāo)準(zhǔn)特征選擇方式(如,過濾、包覆、嵌入、集合等等)。類似患者表示模塊204從訓(xùn)練患者數(shù)據(jù)集中將臨床類似的病例和對照患者群識別為個(gè)體目標(biāo)患者。可以使用基于全局風(fēng)險(xiǎn)因子的多種不同的距離或相似性測量方式,包括但不限于基于規(guī)則的相似性限制、目標(biāo)獨(dú)立測量方式(諸如,歐幾里得、馬哈拉諾比斯、曼哈頓距離等等)或者目標(biāo)特定(度量學(xué)習(xí))測量方式,上述測量方式在類似訓(xùn)練患者數(shù)據(jù)集上訓(xùn)練。識別類似患者的附加細(xì)節(jié)公開在Wang F1Sun J,Li T1Anerousis N的、名稱為〃Two Heads Better Than One:Metric+Active Learning and itsApplicat1ns for IT Service Classificat1n,"ICDM,09(2009),p.1022-7的出版物中,其完整公開通過引用合并在此。
[0023]個(gè)性化預(yù)測模型訓(xùn)練模塊206使用類似患者群中的病例和對照來針對風(fēng)險(xiǎn)目標(biāo)訓(xùn)練多個(gè)不同的預(yù)測模型分類器(邏輯回歸、決策樹、貝葉斯網(wǎng)絡(luò)、支持向量模型、隨機(jī)森林)。個(gè)體風(fēng)險(xiǎn)因子選擇和評級模塊208基于從訓(xùn)練過的模型賦予每個(gè)風(fēng)險(xiǎn)因子的權(quán)重獲取的可用性評價(jià)(如,分?jǐn)?shù))通過重新評級全局風(fēng)險(xiǎn)因子來選擇個(gè)體患者風(fēng)險(xiǎn)因子。例如,這些可以是邏輯回歸分類器中的β(ΒΕΤΑ)系數(shù)和P值,和/或決策樹和隨機(jī)森林分類器中的變量重要度分?jǐn)?shù)。
[0024]圖3圖解用于顯示實(shí)現(xiàn)本公開的一個(gè)或多個(gè)實(shí)施例的基于計(jì)算機(jī)的信息處理系統(tǒng)300的示例的高級方框圖。雖然顯示了一個(gè)示例性計(jì)算機(jī)系統(tǒng)300,但是計(jì)算機(jī)系統(tǒng)300包括通信路徑326,該通信路徑326將計(jì)算機(jī)系統(tǒng)300連接到附加的系統(tǒng)(未示出),并且可以包括諸如因特網(wǎng)、內(nèi)部網(wǎng)之類的一個(gè)或多個(gè)廣域網(wǎng)(WAN)和/或局域網(wǎng)(LAN)和/或無線通信網(wǎng)絡(luò)。計(jì)算機(jī)系統(tǒng)300和附加系統(tǒng)經(jīng)由通信路徑326進(jìn)行通信,以例如,在它們之間通信數(shù)據(jù)。
[0025]計(jì)算機(jī)系統(tǒng)300包括諸如處理器302之類的一個(gè)或多個(gè)處理器。處理器302連接到通信基礎(chǔ)結(jié)構(gòu)304(如,通信總線、交換條(cross-over bar)或網(wǎng)絡(luò))。計(jì)算機(jī)系統(tǒng)300可以包括顯示接口 306,其將圖形、文字和其他數(shù)據(jù)從通信基本結(jié)構(gòu)304(或從未示出的幀緩沖器)轉(zhuǎn)發(fā)以在顯示單元308上顯示。計(jì)算機(jī)系統(tǒng)300還包括主存儲器310,優(yōu)選為隨機(jī)存取存儲器(RAM),并且還可以包括次級存儲器312。次級存儲器312可以包括,例如,硬盤驅(qū)動器314和/或可拆卸存儲驅(qū)動器316(例如,其代表軟盤驅(qū)動器、磁帶驅(qū)動器或光盤驅(qū)動器)??刹鹦洞鎯︱?qū)動器316以本領(lǐng)域技術(shù)人員熟知的方式從可拆卸存儲單元讀取數(shù)據(jù)或向其寫入數(shù)據(jù)。例如,可拆卸存儲單元318代表軟盤、壓縮盤、磁帶、光盤等等,上述可拆卸存儲單元318由可拆卸存儲驅(qū)動器316讀取或?qū)懭?。可以理解,可拆卸存儲單?18包括在其上存儲了計(jì)算機(jī)軟件和/或數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)。
[0026]在替代的實(shí)施例中,次級存儲器312可以包括允許計(jì)算機(jī)程序或其它指令被加載到計(jì)算機(jī)系統(tǒng)的其它類似裝置。例如,這樣的裝置可以包括可拆卸存儲單元320和接口 322。這樣的裝置的實(shí)例可以包括程序包和包接口(如,視頻游戲設(shè)備中的接口)、可拆卸存儲條(如,EPROM或PR0M)和相關(guān)插口以及其它可拆卸存儲單元320和允許軟件和數(shù)據(jù)從可拆卸存儲單元320發(fā)送到計(jì)算機(jī)系統(tǒng)300的接口 322。
[0027]計(jì)算機(jī)系統(tǒng)300還可以包括通信接口324。通信接口 324允許軟件和數(shù)據(jù)在計(jì)算機(jī)系統(tǒng)和外部設(shè)備之間發(fā)送。通信接口324的示例可以包括調(diào)制解調(diào)器、網(wǎng)絡(luò)接口(如,以太網(wǎng)卡)、通信端口或PCM-CIA插槽和卡等等。經(jīng)由通信接口 324發(fā)送的軟件和數(shù)據(jù)以信號的形式,其可以是例如能夠由通信接口 324接收的電、電磁、光學(xué)或其它信號。這些信號經(jīng)由通信路徑(如,信道)326被提供給通信接口 324。通信路徑326承載信號,并且可以使用線或線纜、光纖、電話線、蜂窩電話鏈路、RF鏈路和/或其它通信信道實(shí)現(xiàn)。
[0028]在本公開中,術(shù)語“計(jì)算機(jī)程序介質(zhì)”、“計(jì)算機(jī)可用介質(zhì)”和“計(jì)算機(jī)可讀介質(zhì)”總地用于指代諸如主存儲器310、次級存儲器312、可拆卸存儲驅(qū)動器316以及安裝在硬盤驅(qū)動器314中的硬盤。計(jì)算機(jī)程序(還稱為計(jì)算機(jī)控制邏輯)存儲在主存儲器310和/或次級存儲器312中。還可以經(jīng)由通信接口 324接收計(jì)算機(jī)程序。在運(yùn)行時(shí),這樣的計(jì)算機(jī)程序使計(jì)算機(jī)系統(tǒng)執(zhí)行這里討論的本公開的特征。特別地,在運(yùn)行時(shí),計(jì)算機(jī)程序使處理器302執(zhí)行計(jì)算機(jī)系統(tǒng)的特征。相應(yīng)地,這樣的計(jì)算機(jī)程序代表計(jì)算機(jī)系統(tǒng)的控制器。
[0029]圖4描述圖解根據(jù)一個(gè)或多個(gè)實(shí)施例的方法400的流程圖。方法400在方框402開始,該步驟收集從大量患者(如,數(shù)千)獲取的訓(xùn)練患者數(shù)據(jù)并包括用于訓(xùn)練的風(fēng)險(xiǎn)目標(biāo)標(biāo)簽。訓(xùn)練患者數(shù)據(jù)包括電子醫(yī)學(xué)記錄(如,診斷、實(shí)驗(yàn)室、藥物治療、操作等等)、調(diào)查問卷數(shù)據(jù)、遺傳學(xué)、活動/飲食跟蹤數(shù)據(jù)等等。方法400還從方框404開始,該步驟收集個(gè)體患者數(shù)據(jù),個(gè)體患者數(shù)據(jù)包括電子醫(yī)學(xué)記錄(如,診斷、實(shí)驗(yàn)室、藥物治療、操作等等)、調(diào)查問卷數(shù)據(jù)、遺傳學(xué)、活動/飲食跟蹤數(shù)據(jù)等等。方框406從訓(xùn)練患者數(shù)據(jù)中識別風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子。方框408使用所識別的該組全局風(fēng)險(xiǎn)因子連同個(gè)體患者數(shù)據(jù),以至少部分基于全局風(fēng)險(xiǎn)因子,使用可訓(xùn)練的相似性度量來針對個(gè)體患者識別臨床類似患者群。因此,實(shí)際上,方框408從訓(xùn)練患者數(shù)據(jù)中識別與感興趣的個(gè)體患者類似的訓(xùn)練患者。方框410至少部分基于類似的患者群以及全局風(fēng)險(xiǎn)因子來針對風(fēng)險(xiǎn)目標(biāo)訓(xùn)練一個(gè)或多個(gè)個(gè)性化預(yù)測模型。因此,方框410建立將僅使用被確定為與特定的患者類似的患者的數(shù)據(jù)來針對特定的患者預(yù)測特定的病發(fā)的風(fēng)險(xiǎn)的模型。方框412檢查(look at)在方框410訓(xùn)練的模型。在方框410訓(xùn)練的模型包括該模型認(rèn)為對于評價(jià)特定的患者的風(fēng)險(xiǎn)非常重要的一組風(fēng)險(xiǎn)因子(其通常為全局風(fēng)險(xiǎn)因子的子集),其采用加權(quán)因子的一些形式來識別給定風(fēng)險(xiǎn)因子的重要性。方框412至少部分基于通過組合由訓(xùn)練的預(yù)測模型賦予每個(gè)風(fēng)險(xiǎn)因子的權(quán)重而確定的可用性評價(jià)(如,分?jǐn)?shù)),通過方框410中的個(gè)性化預(yù)測模型訓(xùn)練,通過重新評級全局風(fēng)險(xiǎn)因子來識別被認(rèn)為是重要的風(fēng)險(xiǎn)因子。在一個(gè)或多個(gè)實(shí)施例中,方框412可以確定每個(gè)訓(xùn)練的個(gè)性化預(yù)測模型中該組風(fēng)險(xiǎn)因子的貢獻(xiàn)度,并且將所訓(xùn)練的個(gè)性化預(yù)測模型組合為組合分?jǐn)?shù)。方框414輸出在方框412演化出來的個(gè)體風(fēng)險(xiǎn)因子。
[0030 ]圖5圖解可從系統(tǒng)100 (如圖1和2所示)和/或方法400 (如圖4所示)的應(yīng)用得出的全局風(fēng)險(xiǎn)因子簡檔500。橫跨橫軸的是特征(或風(fēng)險(xiǎn)因子),而橫跨縱軸的是與每個(gè)特征相關(guān)聯(lián)的值。在演化全局風(fēng)險(xiǎn)因子簡檔500中,應(yīng)用了過濾器,該過濾器包括過濾具有低的統(tǒng)計(jì)學(xué)顯著性的特征的過濾器,例如,排除了具有高P值(如,P值>0.05)的特征。在應(yīng)用過濾器之后,可以在全局風(fēng)險(xiǎn)因子簡檔500上繪制特征,從該簡檔已經(jīng)識別了最重要的特征。在全局風(fēng)險(xiǎn)因子簡檔500中所識別的最相關(guān)的風(fēng)險(xiǎn)因子的示例被標(biāo)注出來(如,HCC 312,ICD9790.6 等等)。
[0031 ]圖6圖解可從系統(tǒng)100 (如圖1和2所示)和/或方法400 (如圖4所示)的應(yīng)用得出的個(gè)性化風(fēng)險(xiǎn)因子簡檔600、600A ο針對兩個(gè)患者LRl和LR2示出了個(gè)性化風(fēng)險(xiǎn)因子簡檔,然而,應(yīng)當(dāng)理解的是可以針對多個(gè)個(gè)體患者演化和圖形地比較個(gè)性化風(fēng)險(xiǎn)因子簡檔。不參照每個(gè)個(gè)性化風(fēng)險(xiǎn)因子簡檔,橫跨橫軸的是特征(或風(fēng)險(xiǎn)因子),而橫跨縱軸的是與每個(gè)特征相關(guān)聯(lián)的值。在演化個(gè)性化風(fēng)險(xiǎn)因子簡檔600、600A中,應(yīng)用了過濾器,該過濾器包括過濾具有低的統(tǒng)計(jì)學(xué)顯著性的特征的過濾器,例如,排除了具有高P值(如,P值>0.05)的任意特征。在應(yīng)用過濾器之后,可以在個(gè)性化風(fēng)險(xiǎn)因子簡檔600上繪制特征,從該簡檔已經(jīng)識別了最重要的特征。在個(gè)性化風(fēng)險(xiǎn)因子簡檔600中所識別的最相關(guān)的風(fēng)險(xiǎn)因子的示例被標(biāo)注出來(如,HCC076,HCC066 等等)。
[0032]將描述一個(gè)或多個(gè)實(shí)施例的示例性實(shí)現(xiàn)以便進(jìn)一步說明本公開。本公開沿多個(gè)維度擴(kuò)展個(gè)性化預(yù)測模型的調(diào)查和分析,包括使用可訓(xùn)練的相似性度量來找出臨床上類似的患者,通過分析訓(xùn)練的個(gè)性化模型的參數(shù)來創(chuàng)建個(gè)性化風(fēng)險(xiǎn)因子簡檔,以及聚集風(fēng)險(xiǎn)因子簡檔來幫助分析患者特定的風(fēng)險(xiǎn)因子的特性以及分布。從匿名的縱向醫(yī)療索賠數(shù)據(jù)庫(其由300000個(gè)以上的患者的四年數(shù)據(jù)組成)構(gòu)建15038個(gè)患者的患者群。具有最近兩年中的糖尿病診斷但是前兩年未被診斷患糖尿病的7519個(gè)患者被識別為新發(fā)病例(incidentcases)。基于年齡(+/-5歲)、性別以及初級護(hù)理醫(yī)師(導(dǎo)致7519個(gè)對照患者在四年內(nèi)未診斷出糖尿病),將每個(gè)病例與匹配的對照患者配對。在本示例中使用頭兩年中的患者的診斷信息、用藥醫(yī)囑、醫(yī)療操作和實(shí)驗(yàn)室測試。
[0033]基于患者的縱向數(shù)據(jù)產(chǎn)生針對每個(gè)患者的特征向量表達(dá)式。該數(shù)據(jù)可以被看作時(shí)間上的多個(gè)事件序列(如,患者可以具有不同日期的高血壓的多個(gè)診斷)。為了將這樣的事件序列轉(zhuǎn)換為特征變量(或風(fēng)險(xiǎn)因子),指定了觀察窗(如,頭兩年)。然后,在窗口內(nèi)的相同特征的所有事件被合計(jì)在單一的或很小的一組值中。合計(jì)功能可以產(chǎn)生類似計(jì)數(shù)和平均的簡單的特征值,或考慮時(shí)間的信息的復(fù)雜特征值(如,趨勢和時(shí)間變化)。在該示例中,使用基本的合計(jì)功能,例如用于分類的變量(如,診斷、藥物治療和操作)的計(jì)數(shù)以及用于數(shù)字變量(實(shí)驗(yàn)室測試)的均值。這導(dǎo)致8500個(gè)以上的唯一的特征變量。為了減少特征空間的大小,使用信息增益測量執(zhí)行特征選擇來選擇每個(gè)特征類型的主要特征,例如50個(gè)診斷、50個(gè)操作、15次藥物治療和15個(gè)實(shí)驗(yàn)室測試,總計(jì)130個(gè)特征。
[0034]個(gè)性化預(yù)測建模涉及以下處理步驟:接收新的測試患者;使用患者相似性測量從訓(xùn)練集中識別K個(gè)類似患者的群;使用來自測試患者以及K個(gè)類似患者的群的信息選擇特征的子集;使用類似的患者群訓(xùn)練個(gè)性化的預(yù)測模型;使用訓(xùn)練的個(gè)性化預(yù)測模型針對新的測試患者計(jì)算風(fēng)險(xiǎn)值;以及分析所訓(xùn)練的個(gè)性化預(yù)測模型來創(chuàng)建個(gè)性化風(fēng)險(xiǎn)簡檔。
[0035]可以使用多種不同的相似性測量來從訓(xùn)練集識別患者群,該患者群與測試患者臨床上最相似。通常,相似性測量至少部分基于該組全局風(fēng)險(xiǎn)因子,識別來自該組人口數(shù)據(jù)(其具有感興趣的個(gè)體的至少一個(gè)臨床特點(diǎn)的預(yù)定范圍內(nèi)的至少一個(gè)臨床特點(diǎn))的至少一個(gè)成員。該組人口數(shù)據(jù)包括,但不限于診斷、實(shí)驗(yàn)室結(jié)果、藥物治療、操作、住院記錄、調(diào)查問卷的回答、遺傳學(xué)信息、微生物數(shù)據(jù)和自跟蹤體動數(shù)據(jù)。在本示例中,使用了稱為局部監(jiān)控的度量學(xué)習(xí)(Locally Supervised Metric Learning,LSML)的可訓(xùn)練相似性測量,其可針對特定的目標(biāo)條件定制。(見Wang F,Sun J,Li T,Anerousis N.,〃Two Heads Better ThanOne: Metric + Active Learning and its Applicat1ns for IT ServiceClassificat1n,〃Ninth IEEE Internat1nal Conference on Data Mining,(2009)ICDMp.1022-7)。由于不同的臨床場景有可能要求不同的患者相似性測量,因此可訓(xùn)練度量是非常重要的。例如,相對于一個(gè)疾病目標(biāo)(如,糖尿病)相互類似的兩個(gè)病人可能對于不同的疾病目標(biāo)(如,肺癌)是完全不同的。對于所有的目標(biāo)條件,靜態(tài)的相似性測量(如,歐幾里得或馬哈拉諾比斯)的使用可能不是最優(yōu)的。在本示例中,針對糖尿病發(fā)目標(biāo)訓(xùn)練LSML相似性測量,然后將其用于找出臨床上類似的患者。將其與基于歐幾里得距離測量選擇患者以及隨機(jī)選擇進(jìn)行比較。
[0036]從訓(xùn)練集中僅使用K個(gè)最相似的患者可以減少用于訓(xùn)練個(gè)性化預(yù)測模型的數(shù)據(jù)變量的數(shù)量。通過選擇初始特征的子集減少特征向量的維度可以有助于對其補(bǔ)償??梢允褂枚喾N途徑來進(jìn)行,包括使用信息增益或Fisher分?jǐn)?shù)對類似的患者訓(xùn)練群執(zhí)行常規(guī)的特征選擇。在本示例中,使用簡單的過濾探試,使得所選擇的特征由測試患者特征向量中出現(xiàn)的特征連同在K個(gè)最相似的患者中的兩個(gè)或多個(gè)特征向量中出現(xiàn)的所有特征的聯(lián)合組成。這里,目的是確保能只有能夠影響測試患者的特征被包括進(jìn)來。
[0037]對于每個(gè)患者,基于LSML相似性測量,使用來自與目標(biāo)患者臨床上類似的病例和對照患者的數(shù)據(jù)動態(tài)地訓(xùn)練邏輯回歸(LR)預(yù)測模型。然后個(gè)性化預(yù)測模型用于計(jì)算該患者的分?jǐn)?shù)(糖尿病發(fā)的風(fēng)險(xiǎn))。使用十倍交叉驗(yàn)證執(zhí)行預(yù)測建模實(shí)驗(yàn),并且使用標(biāo)準(zhǔn)AUC(R0C曲線下面積)度量來測量性能。報(bào)告AUC和95%置信區(qū)間。
[0038]在訓(xùn)練之后,分析預(yù)測模型中的參數(shù)來識別由模型獲取的重要風(fēng)險(xiǎn)因子,并且用于針對由模型代表的患者創(chuàng)建“風(fēng)險(xiǎn)因子簡檔”。針對邏輯回歸模型,針對每個(gè)特征的貝塔系數(shù)獲取該特征的單位變化的對數(shù)優(yōu)勢(log odds)中的變化。除了系數(shù)值之外,可以通過計(jì)算瓦爾德統(tǒng)計(jì)(wald statistic)以及對應(yīng)的P值來評價(jià)系數(shù)的重要性。重要的風(fēng)險(xiǎn)因子是具有統(tǒng)計(jì)重要的、大幅度的系數(shù)的特征。這些所選擇的特征的貝塔系數(shù)值可被用于創(chuàng)建風(fēng)險(xiǎn)因子簡檔。對于全局預(yù)測模型,可以僅獲取單一的“人口廣泛”的風(fēng)險(xiǎn)因子簡檔。針對個(gè)性化的預(yù)測模型,針對每個(gè)患者獲取風(fēng)險(xiǎn)因子簡檔,而這導(dǎo)致大量的簡檔。在這種情況下,可以獨(dú)立地檢查風(fēng)險(xiǎn)簡檔以及風(fēng)險(xiǎn)簡檔跨患者人口的分布。個(gè)體簡檔的探索和比較允許準(zhǔn)確地找到患者間的風(fēng)險(xiǎn)因子的差異。簡檔的分布的檢查提供它們的行為和關(guān)系的全局視角。可以支持個(gè)體比較和全局分布分析二者的一種可擴(kuò)展的方式是對風(fēng)險(xiǎn)簡檔執(zhí)行合成分層聚類(agglomerative hierarchical clustering)。聚類結(jié)果的分析可以提供簡檔的特征和分布的洞察??梢葬槍Σ煌幕颊咴u價(jià)風(fēng)險(xiǎn)因子的相似性和差異。此外,可以關(guān)于個(gè)性化模型識別的共同風(fēng)險(xiǎn)因子,發(fā)現(xiàn)患者人口中的任意結(jié)構(gòu)關(guān)系。
[0039]在圖7中顯示了作為最接近相鄰訓(xùn)練患者的數(shù)量的函數(shù)的、根據(jù)AUC的個(gè)性化邏輯回歸分類器的性能。存在與四個(gè)不同配置對應(yīng)的四條曲線。此外,還顯示的全局邏輯回歸模型(~)的性能以供參考。首先,作為基線,K個(gè)隨機(jī)選擇的患者被用于訓(xùn)練個(gè)性化模型(O)。隨著訓(xùn)練患者的增加,性能穩(wěn)定地向全局模型性能增加。由于對于諸如邏輯回歸之類的參數(shù)模型來說,針對模型參數(shù)需要足夠的數(shù)據(jù)來進(jìn)行核實(shí)的訓(xùn)練,因此這樣情況是可預(yù)見的。其次,代替隨機(jī)選擇患者,歐幾里得距離度量用于選擇K個(gè)最類似的患者U)。對于固定數(shù)量的訓(xùn)練患者,基于相似性的選擇始終優(yōu)于隨機(jī)選擇。此外,性能開始在3000個(gè)訓(xùn)練患者之后持平,而這暗示使用更多的不同患者的增益很小。第三,LSML相似性度量被用于選擇用于訓(xùn)練的K個(gè)最類似的患者(Δ )。對于K的所有值,使用定制訓(xùn)練的相似性測量的性能要優(yōu)于使用靜態(tài)測量。第四,使用之前描述的過濾途徑減少特征向量的維度(O)。這減少模型的訓(xùn)練數(shù)據(jù)需求,并且導(dǎo)致明顯的性能改善,特別是對更小的K值。再次,在性能針對大于2000的K值持平時(shí),使用更多的不同訓(xùn)練患者的邊際效益遞減。個(gè)性化模型的性能在K=100時(shí)可與全局模型相比較(AUC: 0.611,95 % Cl: 0.605-0.617),并且在更大的K值上好于全局模型(AUC:0.624,95%C1:0.617-0.631 在K = 2000時(shí))。
[0040]為了方便患者特定的風(fēng)險(xiǎn)因子的特性和分布的分析,可以對個(gè)性化風(fēng)險(xiǎn)因子簡檔執(zhí)行合成分層聚類(使用歐幾里得距離測量)。例如,可以構(gòu)建分層的熱圖繪制,其顯示多達(dá)500個(gè)隨機(jī)選擇的患者的、由個(gè)性化模型識別的頂部風(fēng)險(xiǎn)因子?;颊咛囟ǖ娘L(fēng)險(xiǎn)因子簡檔(如,熱圖中的列)沿橫軸聚類。沿縱軸聚類個(gè)體風(fēng)險(xiǎn)因子??梢赃x擇熱圖中的顏色以與患者風(fēng)險(xiǎn)簡檔中的風(fēng)險(xiǎn)因子分?jǐn)?shù)值(如,β系數(shù)值)對應(yīng)。風(fēng)險(xiǎn)因子簡檔簇的分析顯示一些患者共享非常類似的風(fēng)險(xiǎn)因子,并且被一起分組到相同的簇中,而其他患者具有非常不同且?guī)缀醪恢丿B的風(fēng)險(xiǎn)因子并且屬于簇樹中相互遠(yuǎn)離的組。具有特定風(fēng)險(xiǎn)因子簡檔的患者具有一致的高風(fēng)險(xiǎn)分?jǐn)?shù)(其可被顯示為沿橫軸底部的豎條)。例如,在他們的風(fēng)險(xiǎn)簡檔中具有“操作:CPT:83086[糖化血紅蛋白測試]”以及“實(shí)驗(yàn)室:血紅蛋白alc/全血紅蛋白”的高值的患者具有比低值的患者更高的風(fēng)險(xiǎn)分?jǐn)?shù)。針對每個(gè)患者的個(gè)性化風(fēng)險(xiǎn)因子還可以與全局模型獲取的風(fēng)險(xiǎn)因子不同。實(shí)際上,未由全局模型獲取的大量風(fēng)險(xiǎn)因子可以在個(gè)性化模型中被識別為有用的預(yù)測符。沿縱軸的風(fēng)險(xiǎn)因子簇可以用于識別具有跨患者的、高共同出現(xiàn)率的高風(fēng)險(xiǎn)因子組。圖6描述個(gè)性化風(fēng)險(xiǎn)簡檔600的一個(gè)示例,其形成一列分層的熱圖,其顯示由多個(gè)隨機(jī)選擇的患者的個(gè)性化預(yù)測模型識別的頂部風(fēng)險(xiǎn)因子。
[0041]因此,可以從上述描述和圖示中看出本公開的一個(gè)或多個(gè)實(shí)施例提供技術(shù)特征以及有益效果。對于給定的個(gè)體患者,使用患者相似性來動態(tài)地確定用于風(fēng)險(xiǎn)目標(biāo)的病例和對照訓(xùn)練患者的唯一組(類似的患者群)。針對類似患者群訓(xùn)練多種類型的預(yù)測模型(決策樹、邏輯回歸、貝葉斯網(wǎng)絡(luò)、隨機(jī)森林等等),并將其用于提供在病例和對照之間區(qū)分的重要的風(fēng)險(xiǎn)因子的更強(qiáng)健的評估?;谕ㄟ^將不同訓(xùn)練的個(gè)性化預(yù)測模型分配給每個(gè)風(fēng)險(xiǎn)因子的權(quán)重組合而確定的可用性分?jǐn)?shù)來選擇和評級個(gè)體患者特定的風(fēng)險(xiǎn)。
[0042]因此,根據(jù)本公開的一個(gè)或多個(gè)實(shí)施例的、使用來自與調(diào)查患者臨床上類似的患者的更小數(shù)據(jù)組訓(xùn)練的患者特定的個(gè)性化預(yù)測模型可以比使用所示的訓(xùn)練數(shù)據(jù)訓(xùn)練的全局預(yù)測模型更好地運(yùn)行。與靜態(tài)訓(xùn)練的全局模型不同,個(gè)性化模型是動態(tài)訓(xùn)練的,并且可以利用患者記錄中可用的最相關(guān)的信息。可以分析個(gè)性化預(yù)測模型來識別對于個(gè)體患者重要的風(fēng)險(xiǎn)因子,并且可以用于創(chuàng)建個(gè)性化的風(fēng)險(xiǎn)因子簡檔。風(fēng)險(xiǎn)簡檔的簇分析顯示具有類似風(fēng)險(xiǎn)的患者的不同組以及個(gè)體和全局風(fēng)險(xiǎn)因子之間的差別。一旦識別,可以利用患者特定的風(fēng)險(xiǎn)因子來支持更好的目標(biāo)化治療、定制的治療方案以及其它個(gè)性化的藥物應(yīng)用。因此,可以改善實(shí)現(xiàn)所公開的一個(gè)或多個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的操作。
[0043]現(xiàn)在參照圖8,顯示了根據(jù)實(shí)施例的計(jì)算機(jī)程序產(chǎn)品800,其包括計(jì)算機(jī)可讀存儲介質(zhì)802以及程序指令804。
[0044]本發(fā)明可以是系統(tǒng)、方法和/或計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī)程序產(chǎn)品可以包括計(jì)算機(jī)可讀存儲介質(zhì),其上載有用于使處理器實(shí)現(xiàn)本發(fā)明的各個(gè)方面的計(jì)算機(jī)可讀程序指令。
[0045]計(jì)算機(jī)可讀存儲介質(zhì)可以是可以保持和存儲由指令執(zhí)行設(shè)備使用的指令的有形設(shè)備。計(jì)算機(jī)可讀存儲介質(zhì)例如可以是一一但不限于一一電存儲設(shè)備、磁存儲設(shè)備、光存儲設(shè)備、電磁存儲設(shè)備、半導(dǎo)體存儲設(shè)備或者上述的任意合適的組合。計(jì)算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPROM或閃存)、靜態(tài)隨機(jī)存取存儲器(SRAM)、便攜式壓縮盤只讀存儲器(CD-ROM)、數(shù)字多功能盤(DVD)、記憶棒、軟盤、機(jī)械編碼設(shè)備、例如其上存儲有指令的打孔卡或凹槽內(nèi)凸起結(jié)構(gòu)、以及上述的任意合適的組合。這里所使用的計(jì)算機(jī)可讀存儲介質(zhì)不被解釋為瞬時(shí)信號本身,諸如無線電波或者其他自由傳播的電磁波、通過波導(dǎo)或其他傳輸媒介傳播的電磁波(例如,通過光纖電纜的光脈沖)、或者通過電線傳輸?shù)碾娦盘枴?br>[0046]這里所描述的計(jì)算機(jī)可讀程序指令可以從計(jì)算機(jī)可讀存儲介質(zhì)下載到各個(gè)計(jì)算/處理設(shè)備,或者通過網(wǎng)絡(luò)、例如因特網(wǎng)、局域網(wǎng)、廣域網(wǎng)和/或無線網(wǎng)下載到外部計(jì)算機(jī)或外部存儲設(shè)備。網(wǎng)絡(luò)可以包括銅傳輸電纜、光纖傳輸、無線傳輸、路由器、防火墻、交換機(jī)、網(wǎng)關(guān)計(jì)算機(jī)和/或邊緣服務(wù)器。每個(gè)計(jì)算/處理設(shè)備中的網(wǎng)絡(luò)適配卡或者網(wǎng)絡(luò)接口從網(wǎng)絡(luò)接收計(jì)算機(jī)可讀程序指令,并轉(zhuǎn)發(fā)該計(jì)算機(jī)可讀程序指令,以供存儲在各個(gè)計(jì)算/處理設(shè)備中的計(jì)算機(jī)可讀存儲介質(zhì)中。
[0047]用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序指令可以是匯編指令、指令集架構(gòu)(ISA)指令、機(jī)器指令、機(jī)器相關(guān)指令、微代碼、固件指令、狀態(tài)設(shè)置數(shù)據(jù)、或者以一種或多種編程語言的任意組合編寫的源代碼或目標(biāo)代碼,所述編程語言包括面向?qū)ο蟮木幊陶Z言一諸如Smalltalk、C++等,以及常規(guī)的過程式編程語言一諸如“C”語言或類似的編程語言。計(jì)算機(jī)可讀程序指令可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。在一些實(shí)施例中,通過利用計(jì)算機(jī)可讀程序指令的狀態(tài)信息來個(gè)性化定制電子電路,例如可編程邏輯電路、現(xiàn)場可編程門陣列(FPGA)或可編程邏輯陣列(PLA),該電子電路可以執(zhí)行計(jì)算機(jī)可讀程序指令,從而實(shí)現(xiàn)本發(fā)明的各個(gè)方面。
[0048]這里參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述了本發(fā)明的各個(gè)方面。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)可讀程序指令實(shí)現(xiàn)。
[0049]這些計(jì)算機(jī)可讀程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得這些指令在通過計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時(shí),產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動作的裝置。也可以把這些計(jì)算機(jī)可讀程序指令存儲在計(jì)算機(jī)可讀存儲介質(zhì)中,這些指令使得計(jì)算機(jī)、可編程數(shù)據(jù)處理裝置和/或其他設(shè)備以特定方式工作,從而,存儲有指令的計(jì)算機(jī)可讀介質(zhì)則包括一個(gè)制造品,其包括實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動作的各個(gè)方面的指令。
[0050]也可以把計(jì)算機(jī)可讀程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上,使得在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過程,從而使得在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上執(zhí)行的指令實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動作。
[0051]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或指令的一部分,所述模塊、程序段或指令的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
[0052]這里使用的術(shù)語是僅用于描述特定實(shí)施例的目的,并且不意欲限制本公開。如這里使用的那樣,除非上下文明確指出,單數(shù)形式意欲涵蓋復(fù)數(shù)形式。將理解術(shù)語“包括”在說明書中使用時(shí),指代所陳述的特征、整數(shù)、步驟、操作、元件和/或組成部分的存在,但是不排除附加的一個(gè)或多個(gè)特征、整數(shù)、步驟、操作、元件和/或它們的組合的存在。
[0053]在權(quán)利要求中的對應(yīng)的結(jié)構(gòu)、材料、行為以及所有裝置或步驟加功能元件的等效物意欲涵蓋用于與具體聲明的其它聲明的元件執(zhí)行功能的任何結(jié)構(gòu)、材料或動作。為了圖示和說明的目的呈現(xiàn)了本公開的描述,但是不意欲是排他的或限制到所公開的形式。在不背離本公開的范圍和精神的前提下,本領(lǐng)域技術(shù)人員可以進(jìn)行多種修改和變形。選擇并描述實(shí)施例以便最好地解釋本公開的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域技術(shù)人員理解本公開的各個(gè)實(shí)施例,并且可以進(jìn)行各種修改以適合特殊使用。
[0054]本領(lǐng)域技術(shù)人員將理解,現(xiàn)在或?qū)砜梢赃M(jìn)行各種改進(jìn)和提高,其落入權(quán)利要求的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種識別個(gè)體層面的風(fēng)險(xiǎn)因子的計(jì)算機(jī)實(shí)現(xiàn)方法,該方法包括: 由至少一個(gè)處理器電路從一組人口數(shù)據(jù)識別至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子;由至少一個(gè)處理器電路至少部分基于該組全局風(fēng)險(xiǎn)因子來從該組人口數(shù)據(jù)中識別至少一個(gè)成員,其中所述至少一個(gè)成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性; 由至少一個(gè)處理器至少部分基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、該組人口數(shù)據(jù)中的至少一個(gè)成員,訓(xùn)練至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的至少一個(gè)個(gè)性化預(yù)測模型; 由至少一個(gè)處理器至少部分基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。2.如權(quán)利要求1所述的方法,其中所述相關(guān)性評價(jià)包括代表所述子集與所述感興趣的個(gè)體的相關(guān)性等級的分?jǐn)?shù)。3.如權(quán)利要求1所述的方法,其中從所述人口數(shù)據(jù)識別至少一個(gè)成員包括使用利用所述人口數(shù)據(jù)訓(xùn)練的目標(biāo)特定的度量學(xué)習(xí)測量。4.如權(quán)利要求1所述的方法,其中從所述人口數(shù)據(jù)識別至少一個(gè)成員包括分別識別病例和對照個(gè)體并歸并他們。5.如權(quán)利要求1所述的方法,其中訓(xùn)練至少一個(gè)個(gè)性化預(yù)測模型包括至少一個(gè)下列統(tǒng)計(jì)分類方法: 邏輯回歸; 決策樹; 隨機(jī)森林;以及 貝葉斯網(wǎng)絡(luò)。6.如權(quán)利要求1所述的方法,其中所述確定包括確定該組風(fēng)險(xiǎn)因子在至少一個(gè)訓(xùn)練的個(gè)性化模型的每一個(gè)中的至少一個(gè)貢獻(xiàn)度,并且將所述至少一個(gè)貢獻(xiàn)度組合為復(fù)合分?jǐn)?shù)。7.如權(quán)利要求1所述的方法,其中該組人口數(shù)據(jù)包括以下至少一種:診斷、實(shí)驗(yàn)室結(jié)果、藥物治療、操作、住院記錄、調(diào)查問卷的回答、遺傳學(xué)信息、微生物數(shù)據(jù)和自跟蹤體動數(shù)據(jù)。8.—種用于識別個(gè)體層面的風(fēng)險(xiǎn)因子的計(jì)算機(jī)系統(tǒng),該系統(tǒng)包括: 至少一個(gè)處理器電路,配置來從一組人口數(shù)據(jù)中識別至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的一組全局風(fēng)險(xiǎn)因子; 所述至少一個(gè)處理器電路,進(jìn)一步配置來至少部分基于該組全局風(fēng)險(xiǎn)因子來從該組人口數(shù)據(jù)中識別至少一個(gè)成員,其中所述至少一個(gè)成員具有感興趣的個(gè)體的至少一種臨床特性的預(yù)定范圍內(nèi)的至少一種臨床特性; 所述至少一個(gè)處理器,進(jìn)一步配置來至少部分基于該組全局風(fēng)險(xiǎn)因子以及具有預(yù)定范圍內(nèi)的至少一種臨床特性的、該組人口數(shù)據(jù)中的至少一個(gè)成員,訓(xùn)練至少一個(gè)風(fēng)險(xiǎn)目標(biāo)的至少一個(gè)個(gè)性化預(yù)測模型;以及 所述至少一個(gè)處理器,進(jìn)一步配置來至少部分基于感興趣的個(gè)體的該組全局風(fēng)險(xiǎn)因子中的每一個(gè)的相關(guān)性評價(jià),確定該組全局風(fēng)險(xiǎn)因子的子集,其中所述子集包括感興趣的個(gè)體的一組個(gè)體風(fēng)險(xiǎn)因子。9.如權(quán)利要求8所述的系統(tǒng),其中所述相關(guān)性評價(jià)包括代表所述子集與所述感興趣的個(gè)體的相關(guān)性等級的分?jǐn)?shù)。10.如權(quán)利要求8所述的系統(tǒng),其中從所述人口數(shù)據(jù)識別至少一個(gè)成員包括使用利用所述人口數(shù)據(jù)訓(xùn)練的目標(biāo)特定的度量學(xué)習(xí)測量。11.如權(quán)利要求8所述的系統(tǒng),其中從所述人口數(shù)據(jù)識別至少一個(gè)成員包括分別識別病例和對照個(gè)體并歸并他們。12.如權(quán)利要求8所述的系統(tǒng),其中訓(xùn)練至少一個(gè)個(gè)性化預(yù)測模型包括至少一個(gè)下列統(tǒng)計(jì)分類方法: 邏輯回歸; 決策樹; 隨機(jī)森林;以及 貝葉斯網(wǎng)絡(luò)。13.如權(quán)利要求8所述的系統(tǒng),其中所述全局風(fēng)險(xiǎn)因子的子集的確定包括確定該組風(fēng)險(xiǎn)因子在至少一個(gè)訓(xùn)練的個(gè)性化模型的每一個(gè)中的至少一個(gè)貢獻(xiàn)度,并且將所述至少一個(gè)貢獻(xiàn)度組合為復(fù)合分?jǐn)?shù)。
【文檔編號】G06F19/00GK106021843SQ201610169189
【公開日】2016年10月12日
【申請日】2016年3月23日
【發(fā)明人】胡建英, K.恩格, 王飛
【申請人】國際商業(yè)機(jī)器公司