專利名稱:使用生物標(biāo)記鑒別疾病狀態(tài)的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及用于鑒別患者疾病狀態(tài)的方法和設(shè)備,尤其涉及 根據(jù)一個(gè)或多個(gè)生物標(biāo)記的水平鑒別患者的疾病狀態(tài)。
背景技術(shù):
在醫(yī)學(xué)中使用生物標(biāo)記以幫助診斷或確定特定疾病的存在、不存 在、狀態(tài)和/或階段。已經(jīng)通過使用從人口的有統(tǒng)計(jì)顯著性數(shù)量的疾病 陰性主體和疾病陽性主體獲得的單個(gè)生物標(biāo)記的測(cè)量水平并建立對(duì)于 疾病陰性狀態(tài)和疾病陽性狀態(tài)的均值和標(biāo)準(zhǔn)偏差來鑒別在診斷上有用 的生物標(biāo)記。如果發(fā)現(xiàn)所測(cè)得的疾病陽性狀態(tài)和疾病陰性狀態(tài)的生物 標(biāo)記的集中度具有區(qū)別很大的高斯分布或類高斯分布,則認(rèn)為該生物 標(biāo)記可用于預(yù)測(cè)該疾病的情況。如果以后的患者的生物標(biāo)記集中度在 一般被定義為疾病陽性均值和疾病陰性均值之間的生物標(biāo)記集中度的
分界點(diǎn)(cut point)以上(或者,在某些情況下為以下)并且偏離疾 病狀態(tài)陰性均值二到三個(gè)標(biāo)準(zhǔn)偏差,則可認(rèn)為該患者為疾病陽性。
盡管傳統(tǒng)方法已經(jīng)產(chǎn)生臨床上有用的生物標(biāo)記,但是由于至少五 個(gè)原因,它們應(yīng)用于確定主體的各種疾病狀態(tài)受到限制。首先,這些 方法假定人口的正態(tài)高斯數(shù)據(jù)分布,其中所有測(cè)得的生物標(biāo)記集中度 在均值以上和以下大致對(duì)稱分布并且呈鐘形曲線形狀。在這種情況下, 在疾病陽性群組中或者在疾病陰性群組中,該數(shù)據(jù)的大約68%在均值 的一個(gè)標(biāo)準(zhǔn)偏差內(nèi),該數(shù)據(jù)的95%在均值的兩個(gè)標(biāo)準(zhǔn)偏差內(nèi),并且該 數(shù)據(jù)的99.7%在均值的三個(gè)標(biāo)準(zhǔn)偏差內(nèi)。然而該假定僅對(duì)全部潛在的 生物標(biāo)記的一部分保持正確。人體生物化學(xué)是一個(gè)復(fù)雜系統(tǒng),其中許 多組成用于多種功能并且通過多種其它組成來調(diào)節(jié)它們自己。因此, 通常發(fā)現(xiàn)顯示非高斯分布的生物標(biāo)記,其包括本質(zhì)上偏離大部分值的值(在分布的遠(yuǎn)高端和/和遠(yuǎn)低端),并且可能跨度幾個(gè)數(shù)量級(jí)。
第二,傳統(tǒng)方法依賴于單個(gè)生物標(biāo)記的分析以指示疾病狀態(tài)。然 而,考慮到人體生物化學(xué)的復(fù)雜相互作用,多個(gè)標(biāo)記的相互作用經(jīng)常 與疾病的存在或不存在有關(guān)。代替綜合多個(gè)有統(tǒng)計(jì)顯著性的標(biāo)記,單 個(gè)標(biāo)記模型依賴于單個(gè)標(biāo)記的理想(或接近理想)表現(xiàn),與綜合多個(gè) 生物標(biāo)記相比,這可導(dǎo)致對(duì)疾病狀態(tài)診斷的較低準(zhǔn)確度。
第三,傳統(tǒng)方法唯一地依賴于疾病陰性和疾病陽性人口之間大的 差異,并且當(dāng)疾病陰性人口和疾病陽性人口的分布重疊到某顯著程度 時(shí),將放棄所有信息。在傳統(tǒng)的單個(gè)標(biāo)記模型中,當(dāng)陰性疾病狀態(tài)的 均值和陽性疾病狀態(tài)的均值之間的差異小于一個(gè)半到兩個(gè)標(biāo)準(zhǔn)偏差 時(shí),認(rèn)為該差異幾乎沒有價(jià)值,即使當(dāng)發(fā)現(xiàn)這些差異是穩(wěn)定的并可重 復(fù)的時(shí)候也是如此。
第四,生物多樣性和疾病陰性人口或疾病陽性人口中的子群的存 在經(jīng)?;煜齻鹘y(tǒng)的單個(gè)標(biāo)記方法??紤]到人體生物化學(xué)的復(fù)雜性,許 多因素可影響所測(cè)得的給定生物標(biāo)記的集中度,如患者的人口統(tǒng)計(jì)學(xué) 特征、家族歷史和病史。所有這些因素都可能增加潛在標(biāo)記的觀測(cè)可 變性和標(biāo)準(zhǔn)偏差,掩蓋或模糊與疾病狀態(tài)的關(guān)系。
最后,盡管對(duì)生物標(biāo)記的理解不斷增加并且可以使用用于檢測(cè)和 量化與疾病相關(guān)的特定生物標(biāo)記的表達(dá)的方便的生物標(biāo)記化驗(yàn)(例如, 免疫組織化學(xué)化驗(yàn)),但傳統(tǒng)分析仍然經(jīng)常不能充分區(qū)分疾病陰性狀 態(tài)和疾病陽性狀態(tài)以允許可靠的疾病診斷。
發(fā)明內(nèi)容
根據(jù)本發(fā)明各方面的用于鑒別疾病狀態(tài)的方法和設(shè)備包括分析 一個(gè)或多個(gè)生物標(biāo)記的水平。該方法和設(shè)備可以使用狀況陽性群組和 狀況陰性群組的生物標(biāo)記數(shù)據(jù)并自動(dòng)從多個(gè)生物標(biāo)記中選擇多個(gè)相關(guān) 生物標(biāo)記。該系統(tǒng)可以自動(dòng)生成用于根據(jù)各群組對(duì)于相關(guān)生物標(biāo)記的 生物標(biāo)記數(shù)據(jù)之間的差異確定疾病狀態(tài)的統(tǒng)計(jì)模型。該方法和設(shè)備還 通過產(chǎn)生個(gè)體患者的綜合得分并將該患者的綜合得分與用于鑒別潛在疾病狀態(tài)的一個(gè)或多個(gè)閾值相比較來幫助確定個(gè)體的疾病狀態(tài)。
通過結(jié)合以下說明性附圖參閱本詳細(xì)描述可以更完全地理解本 發(fā)明。在以下附圖中,同樣的附圖標(biāo)記表示類似的元件和步驟。 圖l是計(jì)算機(jī)系統(tǒng)的框圖。
圖2是用于鑒別疾病狀態(tài)的處理的流程圖。
圖3是用于控制值的范圍的處理的流程圖。
圖4是用于歸一化數(shù)據(jù)的處理的流程圖。
圖5是用于根據(jù)分界點(diǎn)分類數(shù)據(jù)的處理的流程圖。
圖6是疾病陽性和疾病陰性生物標(biāo)記集中度的累積頻率的曲線圖。
圖7是用于建立疾病狀態(tài)模型的處理的流程圖。 圖8是用于鑒別個(gè)體疾病狀態(tài)的處理的流程圖。 圖9是乳腺癌陽性集中度和乳腺癌陰性集中度的累積頻率相對(duì)于 PSA集中度的關(guān)系曲線。
圖IO示出用于選擇一個(gè)或多個(gè)分界點(diǎn)的數(shù)據(jù)記分模型。 為了簡化和清楚,示出了附圖中的元件和步驟,并且根據(jù)具體的 程序,不一定表現(xiàn)這些元件和步驟。例如,附圖中示出了可:,—', 行或者以不同順序進(jìn)行的步驟,以幫助增進(jìn)對(duì)本發(fā)明的實(shí)施方式的理
具體實(shí)施例方式
根據(jù)功能組件和各種處理步驟來部分地描述本發(fā)明??梢酝ㄟ^任 意數(shù)量的用于進(jìn)行指定的功能并完成各種結(jié)果的組件、操作和技術(shù)來 實(shí)現(xiàn)所述功能組件和處理步驟。例如,本發(fā)明可以采用各種生物樣本、 生物標(biāo)記、元件、材料、計(jì)算機(jī)、數(shù)據(jù)源、存儲(chǔ)系統(tǒng)和介質(zhì)、信息收 集技術(shù)和處理、數(shù)據(jù)處理準(zhǔn)則、統(tǒng)計(jì)分析、回歸分析等,它們可以實(shí) 現(xiàn)各種功能。另外,盡管關(guān)于醫(yī)學(xué)診斷情況描述了本發(fā)明,但是也可以結(jié)合許多應(yīng)用、環(huán)境和數(shù)據(jù)分析來實(shí)踐本發(fā)明;所描述的系統(tǒng)僅是 本發(fā)明的示范性應(yīng)用。
可以用任何適當(dāng)?shù)姆绞綄?shí)施根據(jù)本發(fā)明各方面的用于分析生物 標(biāo)記信息的方法和設(shè)備,例如使用在計(jì)算機(jī)系統(tǒng)上運(yùn)行的計(jì)算機(jī)程序。 參照?qǐng)D1,可以結(jié)合計(jì)算機(jī)系統(tǒng)110,例如包括處理器112和隨機(jī)存取 存儲(chǔ)器114的傳統(tǒng)計(jì)算機(jī)系統(tǒng),如可遠(yuǎn)程訪問的應(yīng)用服務(wù)器、網(wǎng)絡(luò)服 務(wù)器、個(gè)人計(jì)算機(jī)或工作站來實(shí)施根據(jù)本發(fā)明各方面的示范性生物標(biāo) 記分析系統(tǒng)100。計(jì)算機(jī)系統(tǒng)110還適當(dāng)?shù)匕ɡ绱笕萘看鎯?chǔ)系統(tǒng) 116的附加存儲(chǔ)器裝置或信息存儲(chǔ)系統(tǒng)和例如傳統(tǒng)的監(jiān)視器、鍵盤和 跟蹤裝置的用戶接口 118。然而,計(jì)算機(jī)系統(tǒng)110可以包括任何適當(dāng) 的計(jì)算機(jī)系統(tǒng)和相關(guān)設(shè)備,并且可以用任何適當(dāng)?shù)姆绞脚渲?。在一個(gè) 實(shí)施例中,計(jì)算機(jī)系統(tǒng)110包括單機(jī)系統(tǒng)。在另一個(gè)實(shí)施例中,計(jì)算 機(jī)系統(tǒng)110是包括服務(wù)器120和數(shù)據(jù)庫122的計(jì)算機(jī)網(wǎng)絡(luò)的一部分。 該數(shù)據(jù)庫存儲(chǔ)可被多個(gè)用戶124A-C (如連接到服務(wù)器120的不同用 戶)訪問的信息。在本實(shí)施例中,服務(wù)器120包括可遠(yuǎn)程訪問的服務(wù) 器,如可通過局域網(wǎng)或因特網(wǎng)等網(wǎng)絡(luò)訪問的應(yīng)用服務(wù)器。
接收、處理和分析生物標(biāo)記信息所需的軟件可以用單個(gè)裝置來實(shí) 施或者用多個(gè)裝置來實(shí)施??梢酝ㄟ^網(wǎng)絡(luò)訪問該軟件,使得對(duì)于用戶 124A-C遠(yuǎn)程地進(jìn)行信息的存儲(chǔ)和處理。根據(jù)本發(fā)明各方面的生物標(biāo)記 分析系統(tǒng)100及其各種元件提供多種功能和操作以促進(jìn)生物標(biāo)記分 析,如數(shù)據(jù)收集、處理、分析、報(bào)告和/或診斷。該生物標(biāo)記分析系統(tǒng) 100保持與生物標(biāo)記相關(guān)的信息并促進(jìn)分析和/或診斷。例如,在本實(shí) 施例中,計(jì)算機(jī)系統(tǒng)IIO執(zhí)行計(jì)算機(jī)程序,其可以接收、存儲(chǔ)、搜索、 分析和報(bào)告與生物標(biāo)記有關(guān)的信息。該計(jì)算機(jī)程序可以包括進(jìn)行各種 功能或操作的多個(gè)模塊,如用于處理原始數(shù)據(jù)和收集追加數(shù)據(jù)的處理 模塊和用于分析原始數(shù)據(jù)和追加數(shù)據(jù)以生成疾病狀態(tài)模型和/或診斷 信息的分析模塊。
由生物標(biāo)記分析系統(tǒng)100進(jìn)行的程序可以包括任何適當(dāng)?shù)奶幚硪?促進(jìn)生物標(biāo)記分析和/或診斷。在一個(gè)實(shí)施例中,生物標(biāo)記分析系統(tǒng)100被配置用于建立疾病狀態(tài)模型和/或確定患者的疾病狀態(tài)。確定或鑒別 疾病狀態(tài)可以包括生成相對(duì)于該疾病關(guān)于患者的狀況的任何有用的信 息,如進(jìn)行診斷,提供對(duì)診斷有幫助的信息,評(píng)估疾病的階段或發(fā)展, 鑒別可表示對(duì)該疾病的易感染性、鑒別是否可推薦進(jìn)一步測(cè)試或者另 外評(píng)估疾病狀態(tài)、疾病可能性或患者的其它健康方面的狀況。參照?qǐng)D
2,在本實(shí)施例中,生物標(biāo)記分析系統(tǒng)IOO接收與提供提取生物標(biāo)記數(shù) 據(jù)的生物樣本的一個(gè)或多個(gè)個(gè)體相關(guān)的原始生物標(biāo)記數(shù)據(jù)和主體數(shù)據(jù) (210 )。生物標(biāo)記分析系統(tǒng)100處理該原始數(shù)據(jù)和主體數(shù)據(jù)以生成追 加數(shù)據(jù)(212),并分析該原始數(shù)據(jù)、主體數(shù)據(jù)和/或追加數(shù)據(jù)(214) 以建立疾病狀態(tài)模型和/或患者診斷(216)。
生物標(biāo)記分析系統(tǒng)100還可以提供各種附加模塊和/或單獨(dú)功能。 例如,生物標(biāo)記分析系統(tǒng)IOO還可以包括報(bào)告功能,例如提供與處理 和分析功能相關(guān)的信息。生物標(biāo)記分析系統(tǒng)IOO還可以提供各種管理 功能,如控制訪問和執(zhí)行其它管理功能。
生物標(biāo)記分析系統(tǒng)100適當(dāng)?shù)厣杉膊顟B(tài)模型和/或基于與群 組中的主體相關(guān)的附加主體數(shù)據(jù)和/或原始生物標(biāo)記數(shù)據(jù)提供對(duì)患者 的診斷。
根據(jù)本發(fā)明的各方面,生物標(biāo)記數(shù)據(jù)被獲得以及處理以建立疾病 狀態(tài)模型,該疾病狀態(tài)模型結(jié)合了來自多個(gè)生物標(biāo)記的數(shù)據(jù),如來自
的成員的數(shù)據(jù)。從有統(tǒng)計(jì)顯著'^數(shù)量的疾^陽性和疾病^月性主體適當(dāng) 地獲得該生物樣本。疾病陽性群組和疾病陰性群組可以包含足夠數(shù)量 的主體以確保所獲得的數(shù)據(jù)基本上是疾病陰性狀態(tài)和疾病陽性狀態(tài)的 特征,如統(tǒng)計(jì)上有代表性的群。例如,每個(gè)群組中可以具有至少30 個(gè)主體。每個(gè)群組可以表征為幾個(gè)子群組,該子群組反映例如該疾病 可能以不同階段存在于疾病陽性個(gè)體中,或者反映可以影響疾病陽性 或疾病陰性個(gè)體的生物標(biāo)記水平的其它人口統(tǒng)計(jì)學(xué)的、行為的或其它 的因素。
生物標(biāo)記分析系統(tǒng)100可以使用任意單個(gè)生物材料或者生物材料的組合,可以從該單個(gè)生物材料或者生物材料的組合可再現(xiàn)地確定潛 在生物標(biāo)記的水平。在本實(shí)施例中,從盡可能少的樣本源(如從單個(gè) 容易獲得的樣本)獲得所有測(cè)得的生物標(biāo)記的水平。例如,樣本源可 以包括但不限于純粹的血液、血清、血漿、尿、唾液、粘液、吸出物 (包括乳頭吸出物)或組織(包括乳房組織或其它組織樣本)。生物 標(biāo)記水平可能隨不同的源而變化,并且只有在特定的樣本源中才能發(fā) 現(xiàn)疾病表示水平。因此,同一樣本源被適當(dāng)?shù)赜糜趧?chuàng)建疾病狀態(tài)模型 和估計(jì)患者二者。如果根據(jù)在純粹的血液中測(cè)得的生物標(biāo)記水平構(gòu)建 疾病狀態(tài)模型,那么來自患者的測(cè)試樣本也可以是純粹的血液。在測(cè) 試之前處理樣本的情況下,所有樣本可被以相同的方式對(duì)待并隨機(jī)地 采集和處理。
生物標(biāo)記分析系統(tǒng)IOO可以分析任何適當(dāng)?shù)牧炕蛱卣?。在本情況
下,生物標(biāo)記可以包括能夠量化的任何疾病間接物理特征,并且在一 個(gè)實(shí)施例中,可以包括生物過程或事件的獨(dú)特生物化學(xué)指標(biāo)。許多生
物標(biāo)記可以使用,并且生物標(biāo)記分析系統(tǒng)100提供用于模型化和評(píng)估
生物標(biāo)記水平數(shù)據(jù)的分析構(gòu)架。
可以使用多種方法中的任何一種來測(cè)量樣本中的原始生物標(biāo)記 水平,并且可以使用多個(gè)測(cè)量工具來獲取生物標(biāo)記水平數(shù)據(jù)。例如, 適當(dāng)?shù)臏y(cè)量工具可以包括但不限于任何適當(dāng)形式的酶聯(lián)免疫吸附試驗(yàn)
(enzyme linked immunosorbent assay, EUSA)、 放射性免疫試驗(yàn) (radioimmunoassay, RIA)、 ^充式細(xì)胞術(shù)(flow cytometry)、質(zhì)"i脊等。由 于生物標(biāo)記水平可以隨方法的不同和程序的不同而變化,所以本實(shí)施 例的生物標(biāo)記分析系統(tǒng)100使用固定的方法和程序來創(chuàng)建疾病狀態(tài)模 型和評(píng)估患者。例如,如果根據(jù)使用指定的ELISA協(xié)議測(cè)量的生物標(biāo) 記水平構(gòu)建疾病狀態(tài)模型,則應(yīng)該使用相同的ELISA協(xié)議測(cè)量來自患 者的測(cè)試樣本。
如原始生物標(biāo)記水平的生物標(biāo)記數(shù)據(jù)和任何其它相關(guān)數(shù)據(jù)被提 供給生物標(biāo)記分析系統(tǒng)100進(jìn)行處理。生物標(biāo)記分析系統(tǒng)100可以分 析一個(gè)或多個(gè)標(biāo)記。生物標(biāo)記分析系統(tǒng)100可以處理生物標(biāo)記數(shù)據(jù)以
14結(jié)合多個(gè)標(biāo)記,最小化對(duì)非高斯分布的潛在影響以及解決生物多樣性。
在本實(shí)施例中,生物標(biāo)記分析系統(tǒng)100分析多個(gè)生物標(biāo)記,分配生物
標(biāo)記水平的邊界值,基于原始數(shù)據(jù)和潛在相關(guān)生物標(biāo)記影響因素生成 歸一化數(shù)據(jù),將生物標(biāo)記與分界點(diǎn)進(jìn)行比較,并且/或者減小原始和/
或調(diào)節(jié)后的數(shù)據(jù)值的范圍。生物標(biāo)記分析系統(tǒng)IOO還可以調(diào)節(jié)疾病特
定風(fēng)險(xiǎn)因素的數(shù)據(jù)并分析該數(shù)據(jù)以生成疾病狀態(tài)模型。
在一個(gè)實(shí)施例中,生物標(biāo)記分析系統(tǒng)IOO可以分析多個(gè)生物標(biāo)記
以建立疾病狀態(tài)模型并生成診斷??紤]到人體生物化學(xué)的復(fù)雜相互作 用,多個(gè)標(biāo)記可能與疾病狀態(tài)的存在或不存在有關(guān)系。此外,單個(gè)生 物標(biāo)記不可能只與一種疾病唯一相關(guān)。盡管單個(gè)生物標(biāo)記可以提供有 用的信息,但是通過包括多個(gè)生物標(biāo)記,例如最具有信息性的生物標(biāo)
記,可以提高診斷可靠性。生物標(biāo)記分析系統(tǒng)IOO適當(dāng)?shù)亟Y(jié)合了多個(gè)
雖然不夠理想但是仍然具有統(tǒng)計(jì)顯著性的并且具有信息性的生物標(biāo) 記。
生物標(biāo)記分析系統(tǒng)IOO可以按照不具有信息性、具有信息性或者
信息性高的分類來評(píng)估所給的生物標(biāo)記是否具有信息性,并估計(jì)該生
物標(biāo)記是否有價(jià)值(productive),以將該標(biāo)記包括在疾病狀態(tài)模型 中。例如,各種生物標(biāo)記與乳腺癌相關(guān),并且當(dāng)模型化特征生物標(biāo)記 水平并評(píng)估主體的乳腺癌時(shí),這些標(biāo)記可能高度相關(guān)。在一個(gè)具體例 子中,前列腺特異抗原(prostate specific antigen, PSA)的血清的上 調(diào)(提高的)和/或下調(diào)(抑制的)水平、腫瘤壞死因子a (TNF-a)、 白細(xì)胞介素-6 (IL-6)、白細(xì)胞介素-8 (IL-8)、血管內(nèi)皮生長因子 (VEGF)和/或核黃素載體蛋白質(zhì)(riboflavin carrier protein, RCP ) 與乳腺癌相關(guān)。其中,RCP、 TNF-a、 IL-8和VEGF與其它兩個(gè)標(biāo)記 相比,對(duì)于乳腺癌狀態(tài)來說更具有信息性。
人體生物化學(xué)是一個(gè)復(fù)雜系統(tǒng),其中許多組成用于多重調(diào)節(jié)和其 它功能,并且被多個(gè)其它的組成調(diào)節(jié)。通常,特別是在疾病狀態(tài)下, 生物數(shù)據(jù)是非高斯的。因此,經(jīng)常發(fā)現(xiàn)顯示非高斯分布的生物標(biāo)記, 其中所測(cè)得的值可以包括在分布的遠(yuǎn)高端、遠(yuǎn)低端或者高端和低端兩處與大部分值充分分離的值,并且可以跨度幾個(gè)數(shù)量級(jí)。生物標(biāo)記分
析系統(tǒng)IOO可以處理該數(shù)據(jù)以適應(yīng)非高斯分布的影響。與高斯分布不
同,非高斯分布可能關(guān)于數(shù)據(jù)的均值向左或向右傾斜。可以使用對(duì)數(shù) 變換將非高斯分布數(shù)學(xué)變換為高斯分布??梢詫?duì)非高斯數(shù)據(jù)進(jìn)行子組
平均、數(shù)據(jù)分割、使用差分分布(differential distribution )或者使用 非參數(shù)統(tǒng)計(jì)。
為了結(jié)合多個(gè)生物標(biāo)記并控制非高斯數(shù)據(jù)點(diǎn)對(duì)疾病狀態(tài)模型的 任何不利影響,該生物標(biāo)記分析系統(tǒng)可以預(yù)處理該生物標(biāo)記數(shù)據(jù)以生 成附加數(shù)據(jù)來幫助分析。例如生物標(biāo)記分析系統(tǒng)100可以對(duì)來自原始 生物標(biāo)記水平數(shù)據(jù)的附加數(shù)據(jù)施加各種限制并對(duì)其進(jìn)行調(diào)節(jié)和/或計(jì) 算,以生成除了可以被處理的原始數(shù)據(jù)之外的包括一組變量的追加數(shù) 據(jù),例如使用邏輯回歸以生成線性模型,或者使用描述生物標(biāo)記與疾 病狀態(tài)的關(guān)系的其它適當(dāng)?shù)慕y(tǒng)計(jì)分析。
例如,生物標(biāo)記分析系統(tǒng)100可以被配置為處理原始生物標(biāo)記數(shù) 據(jù)以減小非高斯分布的負(fù)面影響。在一個(gè)實(shí)施例中,生物標(biāo)記分析系 統(tǒng)100可以例如通過對(duì)每個(gè)生物標(biāo)記分配最大和/或最小允許值或封頂 (cap)來減小具有非高斯分布的生物標(biāo)記的非正態(tài)生物標(biāo)記才〕彭 響??梢愿鶕?jù)任何適當(dāng)?shù)臏?zhǔn)則來分配該封頂,如包含測(cè)得水平的火約 66%和大約99.7%之間并排除極高值。
參照?qǐng)D3,可以這樣為每個(gè)候選生物標(biāo)記建立最大和/或最小允許 值首先確定疾病陰性群組的該生物標(biāo)記的中間值(310),如均值或 中值,并確定所測(cè)得的生物標(biāo)記水平的所選量的標(biāo)準(zhǔn)偏差(312),如 在將該數(shù)據(jù)繪制在柱狀圖上時(shí)在中值的任一側(cè)上的數(shù)據(jù)點(diǎn)的大約30 %-45%,使得在確定標(biāo)準(zhǔn)偏差時(shí)考慮到測(cè)得的數(shù)據(jù)點(diǎn)的中心60%至 90%??梢愿鶕?jù)所選生物標(biāo)記數(shù)據(jù)的中間值和標(biāo)準(zhǔn)偏差確定最大允許 值(314),例如通過將中值增加到標(biāo)準(zhǔn)偏差的倍數(shù),如不超過標(biāo)準(zhǔn)偏 差的四倍,更典型地為標(biāo)準(zhǔn)偏差的一倍半和三倍之間的量。
在本實(shí)施例中,生物標(biāo)記分析系統(tǒng)100使用中值代替均值作為用 于確定所允許的最大值的基礎(chǔ),以更準(zhǔn)確地反映多數(shù)值,同時(shí)減小一個(gè)或幾個(gè)非常高的邊遠(yuǎn)非高斯值的影響。還可以使用來自任何適當(dāng)數(shù) 據(jù)集的數(shù)據(jù)和任何適當(dāng)技術(shù)或算法來計(jì)算最大值,如來自疾病陽性群 組的數(shù)據(jù)或來自疾病陽性主體和疾病陰性主體的混合的數(shù)據(jù)??梢葬?對(duì)每一個(gè)相關(guān)生物標(biāo)記計(jì)算最大值。
例如,在本發(fā)明的被配置用于檢測(cè)乳腺癌的存在的實(shí)施例中,通 過將沒有乳腺癌的所有主體的生物標(biāo)記的中值增加到?jīng)]有乳腺癌的所 有主體的該標(biāo)記的標(biāo)準(zhǔn)偏差的兩倍半來計(jì)算可應(yīng)用的生物標(biāo)記的最大
值。在該示范性實(shí)施例中,PSA、 IL-6、 TNF-a、 IL-8和VEGF的適 當(dāng)中值可以分別在0.01-10、 0.5-25、 0.1-10、 5-150和100-5000皮克每 毫升(pg/ml )的范圍內(nèi),如分別為0.53 、 0.34 、 2.51 、 52.12和329.98pg/ml。 例如可以分別在5-200、 10-300、 0.5-50、 100-2000和500-10000pg/ml 的范圍內(nèi)對(duì)生物標(biāo)記PSA、 IL-6、 TNF-a、 IL-8和VEGF的每一個(gè)分 配最大值,如分別為122.15、 12.52、 48.01、 350.89和821.15pg/ml。 因此,可以單獨(dú)地對(duì)生物標(biāo)記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF 或?qū)ι飿?biāo)記RCP、 TNF-a、 IL-8和VEGF計(jì)算不同的最大值。在本 實(shí)施例中,使用對(duì)健康婦女的ELISA測(cè)量確定這些數(shù)字。這些值可隨 更多數(shù)據(jù)的增加、ELISA程序和/或測(cè)試工具的變化、對(duì)疾病陽性婦女 的數(shù)據(jù)的依賴或非ELISA技術(shù)的使用而改變。
然后可以將得到的最大允許值與各個(gè)測(cè)得的生物標(biāo)記水平相比 較(316)。如果特定主體的測(cè)得水平在最大值以上,則可以將修正指 示符或標(biāo)志(如整數(shù)值1或0)或其它適當(dāng)?shù)闹甘痉c主體生物標(biāo)記 數(shù)據(jù)相關(guān)聯(lián),如記錄在他或她的追加數(shù)據(jù)組中的特定區(qū)域中;如果生 物標(biāo)記水平在最大值以下,則將整數(shù)值0記錄在他或她的追加數(shù)據(jù)組 中(318)??梢栽谏杉膊顟B(tài)模型和對(duì)各個(gè)患者的生物標(biāo)記水平記 分之間始終應(yīng)用指示符準(zhǔn)則,從而使疾病狀態(tài)模型的解釋容易。該指 示符還可以包括多于正好兩個(gè)離散水平。
另外,當(dāng)主體的生物標(biāo)記值的任何一個(gè)超過該生物標(biāo)記的最大允 許值時(shí),可以用該生物標(biāo)記的最大允許值替換該原始生物標(biāo)記值 (320)。該調(diào)整后的具有封頂值的數(shù)據(jù)和附加指示符可以是追加數(shù)據(jù)
17的一部分,使得該原始數(shù)據(jù)被保存并且該調(diào)整后的具有封頂值的數(shù)據(jù) 和附加指示符成為追加數(shù)據(jù)組的一部分。該附加指示符表明測(cè)得值非 常高,其可能對(duì)疾病狀態(tài)具有信息性,同時(shí)用該封頂值進(jìn)行替換限制 了極高值的影響。如果沒有這種封頂,該極高值可"拉伸"該線性模 型,從而擬合作為例外的而非標(biāo)準(zhǔn)的數(shù)據(jù)。
這樣,如果患者的RCP生物標(biāo)記超過最大允許值,則在主體的 追加數(shù)據(jù)中設(shè)置標(biāo)志以表示該RCP生物標(biāo)記超過限制,并且可以用最 大允許值替換該原始生物標(biāo)記水平。反過來,如果TNF-a生物標(biāo)記水 平在被接受的值的范圍內(nèi),則該原始生物標(biāo)記水平被保留并且主體的 追加數(shù)據(jù)中的對(duì)應(yīng)標(biāo)志保持未被設(shè)置。
生物標(biāo)記分析系統(tǒng)100還可以被配置成例如基于原始生物標(biāo)記數(shù) 據(jù)和/或封頂?shù)淖芳訑?shù)據(jù)生成和分析歸一化數(shù)據(jù)。歸一化數(shù)據(jù)包括原始 數(shù)據(jù),該原始數(shù)據(jù)被調(diào)整以解決在測(cè)得值中觀察到的變化,該測(cè)得值 可以歸因于一個(gè)或多個(gè)有統(tǒng)計(jì)顯著性的生物標(biāo)記水平影響因素。例如, 遺傳、行為、年齡、藥物或其它因素可以增加或減少觀察到的個(gè)體的 特定生物標(biāo)記水平,而與疾病狀態(tài)的存在或不存在無關(guān)。在本實(shí)施例 中,為了檢測(cè)乳腺癌,可能本質(zhì)上影響指示乳腺癌的生物標(biāo)記水平的
潛在因素包括年齡;絕經(jīng)狀態(tài);是否已經(jīng)進(jìn)行了子宮切除;各種激
素的使用,如節(jié)育、雌激素代替治療、它莫西芬(Tamoxifen)或雷 洛昔芬(Raloxifene)以及生育藥物;滿期懷孕次數(shù);哺乳的總月數(shù); 先前的乳房活體檢查;先前的乳房手術(shù);乳腺癌家族史;身高;體重; 種族;飲食習(xí)慣;藥物使用,包括NSAID的使用;其它疾病的存在; 飲酒;身體活動(dòng)水平;以及抽煙。
可以使用任何適當(dāng)?shù)脑椿蛳到y(tǒng)來確定可能影響給定的生物標(biāo)記 的因素,如文獻(xiàn)或研究。另外,可以使用任何適當(dāng)?shù)奶幚砘蚣夹g(shù)來確 定特定的因素是否可以應(yīng)用以及可以應(yīng)用到什么程度。例如,當(dāng)采集 生物樣本時(shí),可以通過主體調(diào)查問巻、附加臨床測(cè)試或其它適當(dāng)?shù)奶?理以及關(guān)于可能影響其標(biāo)記水平的各種因素的機(jī)制來詢問組群的成 員??梢岳缫噪x散和/或連續(xù)變量的形式將包含關(guān)于主體本身的該信息的主體數(shù)據(jù)提供給具有原始數(shù)據(jù)的生物標(biāo)記分析系統(tǒng)100 。
可以以任何適當(dāng)?shù)姆绞皆u(píng)估各種因素與生物標(biāo)記水平的關(guān)聯(lián)及 對(duì)其影響。例如,當(dāng)樣本采集完成,所有生物標(biāo)記已被測(cè)量并且與附 加因素有關(guān)的原始數(shù)據(jù)和主體數(shù)據(jù)已被提供時(shí),生物標(biāo)記分析系統(tǒng)
100可以分析該原始數(shù)據(jù)和附加因素以確定在統(tǒng)計(jì)學(xué)上具有顯著影響 的這些因素。生物標(biāo)記分析系統(tǒng)100還可以自動(dòng)從多個(gè)生物標(biāo)記中選 擇多個(gè)相關(guān)生物標(biāo)記。在一個(gè)實(shí)施例中,參照?qǐng)D4,生物標(biāo)記分析系 統(tǒng)IOO使用作為因變量的每個(gè)生物標(biāo)記和作為獨(dú)立變量的潛在影響其 水平的因素進(jìn)行回歸分析或其它適當(dāng)?shù)慕y(tǒng)計(jì)分析(410)。然而生物標(biāo) 記分析系統(tǒng)100可以使用任何適當(dāng)?shù)姆治鰜泶_定所述因素和生物標(biāo)記 數(shù)據(jù)的變化之間的潛在關(guān)系。
在本實(shí)施例中,可以重點(diǎn)考慮被發(fā)現(xiàn)保持低于預(yù)定水平的p值的 因素(例如,沒有限制,p〈0.1,p〈0.05或p<0.025)。還可以將生 物標(biāo)記分析系統(tǒng)100配置為例如通過生成歸一化數(shù)據(jù)來補(bǔ)償該因素的 影響,其中由該因素導(dǎo)致的變化已從該分析中去除。例如,為了去除 因素導(dǎo)致的變化,可以使用描述生物標(biāo)記水平和被發(fā)現(xiàn)重要的因素之 間的關(guān)系的線性方程的反演來轉(zhuǎn)換原始數(shù)據(jù)。在本發(fā)明的一個(gè)例子中, 可以將用于確定專用于檢測(cè)乳腺癌的生物標(biāo)記的統(tǒng)計(jì)顯著性的所選P 值選擇為0.05。在另一具體例子中,如果原始數(shù)據(jù)和主體的線性回歸 或其它適當(dāng)?shù)姆治鲲@示出主體的年齡和性別對(duì)與阿爾茨海默 (Alzheimer)病Y相關(guān)的潛在生物標(biāo)記的影響達(dá)到具有統(tǒng)計(jì)顯著性 的水平,則所觀察到的生物標(biāo)記水平和主體的年齡和性別之間的關(guān)系 可以用以下方程來描述
Y - ]V^ (年齡)+ M2 (小生另'J ) + B
其中Y是潛在的阿爾茨海默病生物標(biāo)記的測(cè)量水平,Mi和M2是 由線性回歸確定的系數(shù),(年齡)是發(fā)現(xiàn)在統(tǒng)計(jì)上對(duì)Y的確定有意義的連 續(xù)變量,(性別)U現(xiàn)在統(tǒng)計(jì)上對(duì)Y的確定有意義的離散變量,其中l(wèi) 為男性,0為女性,B是截距(412)。為了去除可能由年齡和性別導(dǎo)致的 Y的變化,可以才艮據(jù)逆方程計(jì)算潛在的阿爾茨海默病生物標(biāo)記Y的歸一化值或調(diào)節(jié)值Y, (414):
Y, - Y* (1/Mi)(年齡)-M2 (性別)
可以通過將該逆方程應(yīng)用到原始數(shù)據(jù)和/或追加數(shù)據(jù)來生成歸一 化數(shù)據(jù)并將該數(shù)據(jù)加到追加數(shù)據(jù)。通過去除由已知的原因引起的變化, 可以將較大比例的剩余變化歸因于疾病狀態(tài)的存在或不存在,從而弄 清可能不明顯的標(biāo)記與疾病狀態(tài)的關(guān)系。當(dāng)具有統(tǒng)計(jì)顯著性的因素被 確定為影響一個(gè)或多個(gè)潛在生物標(biāo)記的水平時(shí),可以在隨后的分析中 使用原始數(shù)據(jù)和歸 一化數(shù)據(jù)二者。對(duì)歸 一化值的分析可以闡明可能不 明顯的關(guān)系,同時(shí)原始數(shù)椐可以提供更容易的測(cè)試管理和傳送。
生物標(biāo)記分析系統(tǒng)100可以進(jìn)一 步以任何適當(dāng)?shù)姆绞教幚碓紨?shù) 據(jù)和/或追加數(shù)據(jù),如減小非高斯分布的影響。例如,生物標(biāo)記分析系 統(tǒng)100可以選擇一個(gè)或多個(gè)生物標(biāo)記分界點(diǎn)并比較原始和/或追加生物 標(biāo)記數(shù)據(jù)與至少 一個(gè)指定的生物標(biāo)記分界點(diǎn)。可以根據(jù)任何適當(dāng)?shù)臏?zhǔn) 則選擇生物標(biāo)記分界點(diǎn),如根據(jù)與疾病對(duì)應(yīng)的已知水平或基于原始和/ 或歸一化生物標(biāo)記數(shù)據(jù)。例如,生物標(biāo)記分析系統(tǒng)IOO可以比較特定 生物標(biāo)記的狀況陽性和陰性生物標(biāo)記數(shù)據(jù)的累積頻率分布,并根據(jù)所 選生物標(biāo)記的狀況陽性累積頻率分布和狀況陰性累積頻率分布之間的 最大差異選擇該生物標(biāo)記的一個(gè)或多個(gè)分界點(diǎn)。
在一個(gè)實(shí)施例中,參照?qǐng)D5和圖6,生物標(biāo)記分析系統(tǒng)100為每 個(gè)生物標(biāo)記指定至少一個(gè)分界點(diǎn)。生物標(biāo)記分析系統(tǒng)100可以首先針 對(duì)每個(gè)相關(guān)生物標(biāo)記(如針對(duì)每個(gè)單獨(dú)的生物標(biāo)記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF )生成疾病陽性群組630和疾病陰性群組620 二者的原始和/或追加數(shù)據(jù)的累積頻率分布(510)。生物標(biāo)記分析系 統(tǒng)100可以選擇一個(gè)或多個(gè)分界點(diǎn)(512),例如在疾病陽性群組和疾 病陰性群組中的測(cè)量值的累積頻率分布之間的差超過預(yù)定值的水平。 該預(yù)定值可以是任何適當(dāng)?shù)拈撝?,如累積頻率差超過10%,其中較高 的值表示陽性群組和陰性群組之間的較大差異。
該生物標(biāo)記分析系統(tǒng)100可以尋找陽性群組和陰性群組之間的差 異最大的水平以建立分界點(diǎn)640。疾病陽性和陰性狀態(tài)的累積頻率中的較大差異表示屬于疾病陽性或疾病陰性群組的傾向。反過來,顯示
為在任意點(diǎn)處累積頻率的差異小于10%的潛在標(biāo)記的信息性的有用
程度可能較低,并且可以任選地在進(jìn)一步分析中省略。
即使在累積頻率中的差異低的情況下,特別是在該分界點(diǎn)可被認(rèn) 為特別具有信息性的情況下,如在不存在超過某一生物標(biāo)記水平的疾
病陽性或疾病陰性值的情況下,也可以選擇分界點(diǎn)640。例如,參照 圖9,為了檢測(cè)乳腺癌,可以使用累積頻率曲線900將生物標(biāo)記PSA 的分界點(diǎn)選擇為具有超過10%的絕對(duì)差異的局部最大值處的值。在本 實(shí)施例中,第一分界點(diǎn)910被選擇在1.25,第二分界點(diǎn)920被選擇在 2.5,第三分界點(diǎn)930被選擇在4.5。在這三個(gè)分界點(diǎn)的每一處疾病陽 性群組曲線940和疾病陰性群組曲線950之間的累積頻率差異分別為 24%、 22%和12%。在本實(shí)施例中,由于缺少超過PSA濃度為4.5的 疾病陰性值表示對(duì)于分布來說特別具有信息性的點(diǎn),所以盡管累積頻 率的差異相對(duì)較低,也可以適當(dāng)?shù)剡x擇第三分界點(diǎn)930。
再參照?qǐng)D5,可以將原始和/或歸一化生物標(biāo)記數(shù)據(jù)與分界點(diǎn)進(jìn)行 比較(514 )并且生物標(biāo)記分析系統(tǒng)100可以記錄表示比較結(jié)果的值作 為分界點(diǎn)指示符(516)。該分界點(diǎn)指示符可以包括任何適當(dāng)?shù)闹祷蛑?標(biāo),如該值與分界點(diǎn)之間的差或其它值。在一個(gè)實(shí)施例中,如果原始 或歸一化生物標(biāo)記水平在分界點(diǎn)以上,則記錄整數(shù)值1作為分界點(diǎn)指 示符并將其存儲(chǔ)在追加數(shù)據(jù)中;如果該水平低于該分界點(diǎn),則記錄整 數(shù)值0。該整數(shù)值可以同樣地表示生物標(biāo)記水平是否低于多于一個(gè)的 分界點(diǎn),或者超過患者生物標(biāo)記中的一些的分界點(diǎn)而不超過其它的分 界點(diǎn)。連續(xù)變量到離散變量的轉(zhuǎn)換表示屬于疾病陽性或陰性群體的傾 向。分界點(diǎn)的特定側(cè)的所有值可以接收相等的權(quán)重,而與它們可能有 多高或多低無關(guān),這趨向于消除非高斯分布的影響。
生物標(biāo)記分析系統(tǒng)100還可以被配置為例如在生物標(biāo)記的測(cè)得的 或歸一化的水平值的范圍非常大的情況下減小數(shù)據(jù)值的范圍??梢詫?值的范圍減小,并減少非常高的值的數(shù)量,同時(shí)保持該范圍的低端和 高端處的值之間有意義的差異。生物標(biāo)記分析系統(tǒng)IOO可以以任何適當(dāng)?shù)姆绞秸{(diào)節(jié)值的范圍,例如通過將測(cè)得的值變化到分?jǐn)?shù)冪
(fractional power)以獲得一組減小的生物標(biāo)記值。生物標(biāo)記分沖斤系 統(tǒng)100可以選擇任意適當(dāng)?shù)闹笖?shù)值來保持該數(shù)據(jù)中的有意義的差異。 如果選擇太小的分?jǐn)?shù)冪使該范圍過窄,則可能喪失有意義的差異。
在本實(shí)施例中,生物標(biāo)記分析系統(tǒng)可以通過將每個(gè)值變化到分?jǐn)?shù) 冪來調(diào)節(jié)每個(gè)群組成員中對(duì)于每個(gè)生物標(biāo)記(如生物標(biāo)記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF)的測(cè)得值。在每個(gè)生物標(biāo)記的分析中 可以包括多個(gè)不同的分?jǐn)?shù)冪,如范圍從3/4到1/10的指數(shù)值,如2/3 和1/2。在與相關(guān)的生物標(biāo)記數(shù)據(jù)組相關(guān)聯(lián)的追加數(shù)據(jù)中可以包括每個(gè) 減小的值。生物標(biāo)記分析系統(tǒng)100可以例如通過去除缺乏統(tǒng)計(jì)顯著性 的值的組,例如在進(jìn)行后期回歸分析的過程中分析該結(jié)果以確定最適 合該數(shù)據(jù)的分?jǐn)?shù)冪值。以分?jǐn)?shù)值指數(shù)變化測(cè)得的或歸 一化的水平值減 小了數(shù)據(jù)范圍,允許線性模型更好地?cái)M合非線性數(shù)據(jù),并提供記分的 連續(xù)性,其中可以施加不同的權(quán)重作為高或低值。例如在配置用于檢 測(cè)乳腺癌的實(shí)施例中,生物標(biāo)記PSA、 IL-6、 RCP、 TNF-a、 IL-8和 VEGF的適當(dāng)分?jǐn)?shù)冪對(duì)于每個(gè)相關(guān)生物標(biāo)記可以包括1/10、 1/5、 1/3、 1/2和2/3。
生物標(biāo)記分析系統(tǒng)100可以對(duì)原始數(shù)據(jù)、歸一化數(shù)據(jù)、任何其它 追加數(shù)據(jù)和/或?qū)膊〉陌l(fā)展的特定風(fēng)險(xiǎn)有影響的任何附加疾病風(fēng)險(xiǎn) 因素生成疾病狀態(tài)模型。考慮到人體生物化學(xué)的復(fù)雜性,許多因素可 能影響一個(gè)或多個(gè)生物標(biāo)記的測(cè)量濃度,包括但不限于患者的人口統(tǒng) 計(jì)學(xué)特征、家族史和病史。這些因素都增加潛在標(biāo)記的觀測(cè)可變性和
標(biāo)準(zhǔn)偏差,掩飾或模糊與疾病狀態(tài)的關(guān)系。
生物標(biāo)記分析系統(tǒng)100可以分析和/或處理可影響主體風(fēng)險(xiǎn)的疾 病風(fēng)險(xiǎn)因素以及可如上述不同地影響生物標(biāo)記水平的生物標(biāo)記因素。 例如,生物標(biāo)記分析系統(tǒng)100可以與分析標(biāo)記特定得分相結(jié)合在對(duì)數(shù) 據(jù)的全面分析中考慮疾病風(fēng)險(xiǎn)因素??紤]風(fēng)險(xiǎn)因素解決了流行性的差 異,并且本質(zhì)上移動(dòng)總體得分,從而反映該流行性。
例如,對(duì)于可能影響測(cè)得的生物標(biāo)記水平的生物標(biāo)記因素,在確定變量和疾病狀態(tài)之間的關(guān)系時(shí)可以將疾病風(fēng)險(xiǎn)因素包括在所確定的 變量當(dāng)中。可以根據(jù)任何適當(dāng)?shù)臏?zhǔn)則和/或從任何適當(dāng)?shù)脑催x擇附加疾 病風(fēng)險(xiǎn)因素。例如,技術(shù)文獻(xiàn)可以確定對(duì)關(guān)注的特定疾病發(fā)展的特定 風(fēng)險(xiǎn)有影響的附加因素。特定風(fēng)險(xiǎn)因素可以包括但不限于年齡、種族、 家族史、初潮日期、絕經(jīng)狀態(tài)、沮喪、疾病狀態(tài)、藥物治療狀態(tài)、體
重指數(shù)(BMI)、第一胎日期、頭部傷害和/或其它因素。當(dāng)已知或懷 疑這些疾病風(fēng)險(xiǎn)因素與疾病狀態(tài)相關(guān)聯(lián)時(shí),應(yīng)該關(guān)于該疾病風(fēng)險(xiǎn)因素 詢問該主體的病史和/或?qū)嶋H主體。可以將該附加主體數(shù)據(jù)提供給生物 標(biāo)記分析系統(tǒng)100,其可以利用主體的生物標(biāo)記因素?cái)?shù)據(jù)記錄主體的 疾病風(fēng)險(xiǎn)因素?cái)?shù)據(jù)作為附加的連續(xù)或離散變量。
生物標(biāo)記分析系統(tǒng)100適當(dāng)?shù)胤治鲈摂?shù)據(jù)以鑒別疾病狀態(tài)和各種 原始數(shù)據(jù)、追加數(shù)據(jù)和/或主體數(shù)據(jù)之間的關(guān)系??梢愿鶕?jù)任何適當(dāng)?shù)?分析和準(zhǔn)則來確定該關(guān)系。例如,生物標(biāo)記分析系統(tǒng)100可以建立描 述所確定的變量和疾病狀態(tài)之間關(guān)系的方程,如線性方程。生物標(biāo)記 分析系統(tǒng)100可以應(yīng)用任何適當(dāng)?shù)姆治?,如使用疾病狀態(tài)作為因變量 和原始數(shù)據(jù)和追加數(shù)據(jù)的一個(gè)或多個(gè)元素作為獨(dú)立變量的一個(gè)或多個(gè) 傳統(tǒng)回歸分析(例如,線性回歸、對(duì)數(shù)回歸和/或泊術(shù)〉回歸),或者采 用其它分析方法,如通用線性模型方法、邏輯方法、判別函數(shù)分析、 協(xié)方差分析、矩陣代數(shù)和微積分,以及/或者接收器操作特征方法。在 一個(gè)實(shí)施例中,生物標(biāo)記分析系統(tǒng)IOO自動(dòng)生成用于根據(jù)各群組對(duì)于 相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異來確定疾病狀態(tài)的統(tǒng)計(jì)模
該生物標(biāo)記分析系統(tǒng)IOO可以按照任何適當(dāng)?shù)募夹g(shù)或處理來評(píng)估
生物標(biāo)記與特定疾病或狀況的相關(guān)性。在一個(gè)實(shí)施例中,生物標(biāo)記分
析系統(tǒng)IOO進(jìn)行生物標(biāo)記數(shù)據(jù)的統(tǒng)計(jì)分析,如統(tǒng)計(jì)顯著性分析。例如, 生物標(biāo)記分析系統(tǒng)100可以自動(dòng)生成疾病狀態(tài)模型,該模型例如通過
放棄在對(duì)疾病狀態(tài)的統(tǒng)計(jì)分析時(shí)產(chǎn)生低于預(yù)定值的p值的所有潛在生 物標(biāo)記來消除無信息和一些信息較少的生物標(biāo)記。生物標(biāo)記分析系統(tǒng)
100可以例如通過該模型施加到標(biāo)記的系數(shù)或者通過每個(gè)標(biāo)記的系數(shù)與其值的范圍的乘積來確定剩余的各個(gè)生物標(biāo)記的相對(duì)貢獻(xiàn)或強(qiáng)度。 在該模型中與其它生物標(biāo)記的系數(shù)或乘積相比,較高的系數(shù)或乘積表 示該生物標(biāo)記可被分配的較大的影響,以便在該疾病狀態(tài)模型中確定 疾病狀態(tài)。在本實(shí)施例中,該分析可以減少所使用的分界點(diǎn)和分?jǐn)?shù)指 數(shù)值的數(shù)量,在許多情況下,可以減少到單個(gè)分界點(diǎn)和/或分?jǐn)?shù)指數(shù)。
一些因數(shù)可能涉及完全相同的信息,所以生物標(biāo)記分析系統(tǒng)100可以
選擇最有用的因素,如具有最低p值的因素。
參照?qǐng)D7,生物標(biāo)記分析系統(tǒng)IOO可以進(jìn)行迭代分析,該迭代分 析或者以單個(gè)變量開始并且每次將變量加1,或者以全部變量開始并 且每次將變量減1,直到全部變量都被確定為統(tǒng)計(jì)顯著的,比如通過 使p值低于閾值水平(例如,但不是限制,p<0.1、 p〈0.05或者p〈 0.025 ) ( 710 )??梢詫⒃摰治雠渲脼殍b別并去除與其它數(shù)據(jù)相 比關(guān)于疾病狀態(tài)信息較少的生物標(biāo)記數(shù)據(jù)。例如,在該模型中保留表 現(xiàn)出p值低于預(yù)定值的獨(dú)立變量,同時(shí)放棄p值高于該預(yù)定值的獨(dú)立 變量(712)。生物標(biāo)記分析系統(tǒng)IOO可以分析變量的增加和減少的多 個(gè)變化,以獲得最佳方案(714),例如最大化該模型的調(diào)節(jié)后的R 平方或者貝葉斯信息準(zhǔn)則并避免次優(yōu)化該模型。例如,最終的記分模 型可以采用以下方程的形式
y = + m2X2 + m3xn + m4(^ + m5d2 + m5dn + b
其中,y是代表疾病狀態(tài)的連續(xù)變量;
x^是連續(xù)變量,如在生物標(biāo)記樣本中測(cè)得的原始生物標(biāo)記水平 和/或已經(jīng)被確定為統(tǒng)計(jì)上顯著的歸一化或封頂?shù)闹?,如RCP、TNF-a、 IL-8和VEGF生物標(biāo)記的原始和追加數(shù)據(jù);
d^是離散變量,如已經(jīng)被確定為統(tǒng)計(jì)上顯著的離散疾病風(fēng)險(xiǎn)因 素或追加數(shù)據(jù)中的指示符,
iih至mn是與每個(gè)所確定的變量相關(guān)聯(lián)的系數(shù),以及
b是該方程的y截距。
當(dāng)限定了剩余的變量并選擇出它們各自的系數(shù)時(shí),生物標(biāo)記分析 系統(tǒng)IOO建立作為疾病狀態(tài)模型的最終方程(716)。生物標(biāo)記分析系統(tǒng)IOO可以建立作為進(jìn)一步評(píng)估的候選的多個(gè)疾病狀態(tài)模型。生物標(biāo) 記分析系統(tǒng)IOO可以通過將該疾病狀態(tài)模型中的變量的值乘以在建模
期間確定的系數(shù)并將乘積連同截距值相加來生成相關(guān)群組中的各主體
的綜合得分(718)。然而,該疾病狀態(tài)模型可以包括用于根據(jù)原始數(shù) 據(jù)、追加數(shù)據(jù)和/或主體數(shù)據(jù)預(yù)測(cè)疾病狀態(tài)的任何適當(dāng)?shù)哪P突蜿P(guān)系。
生物標(biāo)記分析系統(tǒng)IOO可以使用對(duì)疾病狀態(tài)與各種原始數(shù)據(jù)、追 加數(shù)據(jù)和/或主體數(shù)據(jù)之間關(guān)系的分析結(jié)果來建立用于使用被鑒別為 具有信息性的數(shù)據(jù)確定疾病狀態(tài)的診斷準(zhǔn)則。生物標(biāo)記分析系統(tǒng)100 可以根據(jù)任何適當(dāng)?shù)奶幚砗?或技術(shù)建立該診斷準(zhǔn)則。例如,生物標(biāo)記 分析系統(tǒng)100可以鑒別和/或量化疾病陽性群組的信息性數(shù)據(jù)(和/或 信息性數(shù)據(jù)的組合)與對(duì)應(yīng)的疾病陰性群組的信息性數(shù)據(jù)(和/或信息 性數(shù)據(jù)的組合)之間的差異。
在本實(shí)施例中,生物標(biāo)記分析系統(tǒng)100比較各群組的綜合得分以 確定可以表示疾病陽性或陰性狀態(tài)的該綜合得分中的一個(gè)或多個(gè)分界 點(diǎn)。例如,生物標(biāo)記分析系統(tǒng)100可以選擇和/或檢索一個(gè)或多個(gè)診斷 分界點(diǎn)并比較各群組的綜合得分與診斷分界點(diǎn)(722)??梢愿鶕?jù)任何 適當(dāng)?shù)臏?zhǔn)則,如根據(jù)各群組的綜合得分的中值和/或累積頻率之間的差 異來選擇該診斷分界點(diǎn)。作為選擇,該分界點(diǎn)可以是綜合得分的范圍 上的規(guī)則間隔。
生物標(biāo)記分析系統(tǒng)100可以比較群組的每個(gè)成員的綜合得分與一 個(gè)或多個(gè)分界點(diǎn),并記錄表示比較結(jié)果的值作為綜合得分分界點(diǎn)指示 符(724)。該綜合得分分界點(diǎn)指示符可以包括任何適當(dāng)?shù)闹祷蛑笜?biāo), 如該值與分界點(diǎn)之間的差或其它值。在一個(gè)實(shí)施例中,如果綜合得分 在分界點(diǎn)以上,則記錄整數(shù)值l作為綜合得分分界點(diǎn)指示符;如果該 水平低于該分界點(diǎn),則記錄整數(shù)值0。該整數(shù)值同樣可以表示綜合得 分是否低于多于一個(gè)的分界點(diǎn)。
在本實(shí)施例中,為了確定適當(dāng)?shù)姆纸琰c(diǎn)以確定疾病陽性或疾病陰 性狀態(tài),以跨越該數(shù)據(jù)范圍的不同分界點(diǎn)適當(dāng)?shù)卦u(píng)估每個(gè)群組主體的 綜合得分。根據(jù)該數(shù)據(jù)和疾病之間關(guān)系的本質(zhì),在每個(gè)分界點(diǎn)處,等
25于或小于該分界點(diǎn)的值可以被認(rèn)為是疾病陰性,而高于該分界點(diǎn)的值
可以被認(rèn)為是疾病陽性點(diǎn),反之亦然。生物標(biāo)記分析系統(tǒng)100可以比
較每個(gè)分界點(diǎn)候選的綜合得分分界點(diǎn)指示符與每個(gè)群組成員的真實(shí)診
斷狀態(tài)(726),并量化每個(gè)分界點(diǎn)處的測(cè)試性能(728),例如由靈 敏度、特異性、真陽性比例、真陰性比例、假陽性比例、假陰性比例 等等所定義的測(cè)試性能。生物標(biāo)記分析系統(tǒng)IOO可以從評(píng)估出的分界 點(diǎn)的范圍中為數(shù)據(jù)的將來評(píng)估選擇一個(gè)或多個(gè)分界點(diǎn),使得靈敏度被 最大化,特異性被最大化,或者作為最大的靈敏度和特異性的折中將 總體測(cè)試性能最大化。
現(xiàn)在參照?qǐng)DIO,在被配置用于檢測(cè)乳腺癌的存在的本發(fā)明的示范 性實(shí)施例中,可以通過使用數(shù)據(jù)記分模型1000來選擇適當(dāng)?shù)姆纸琰c(diǎn)。 在該實(shí)施例中,數(shù)據(jù)記分模型1000包括表示在各分界點(diǎn)處的特異性和 靈敏度的測(cè)試準(zhǔn)確度的表格1020。使用在表格1020中提供的數(shù)據(jù), 生物標(biāo)記分析系統(tǒng)IOO可以選擇分界點(diǎn)1010以提供靈敏度和特異性之 間最佳平衡,如本示范性實(shí)施例中在0.55。
生物標(biāo)記分析系統(tǒng)100還可以被配置用于核實(shí)疾病狀態(tài)模型的有 效性。例如,生物標(biāo)記分析系統(tǒng)100可以接收來自疾病陰性和疾病陽 性個(gè)體的盲數(shù)據(jù)。該盲數(shù)據(jù)可以被分析以得出可以與實(shí)際診斷相比較 的診斷,從而確認(rèn)該疾病狀態(tài)模型獨(dú)自基于測(cè)得的和確定的變量的值 區(qū)分疾病陰性和疾病陽性。如果幾個(gè)模型是可行的,則可以選擇與臨 床診斷具有最高一致性的模型用于進(jìn)一步的主體評(píng)估。
在建立該疾病狀態(tài)模型之后,生物標(biāo)記分析系統(tǒng)100可以分析生 物樣本數(shù)據(jù)和/或主體數(shù)據(jù),以應(yīng)用該疾病狀態(tài)模型作為各患者的疾病 狀態(tài)的指標(biāo)。相關(guān)生物標(biāo)記水平可以被測(cè)量并與相關(guān)主體數(shù)據(jù)一起提 供給生物標(biāo)記分析系統(tǒng)100。
生物標(biāo)記分析系統(tǒng)IOO可以處理生物標(biāo)記數(shù)據(jù)和主體數(shù)據(jù),例如 用于根據(jù)任何相關(guān)生物標(biāo)記因素調(diào)節(jié)生物標(biāo)記水平。生物標(biāo)記分析系 統(tǒng)IOO可以不使用各種變量,如一個(gè)或多個(gè)與生物標(biāo)記特定分界點(diǎn)相
關(guān)聯(lián)的整數(shù)值、減小的值、表示異常值的整數(shù)值以及原始或歸一化的數(shù)據(jù)。特定疾病狀態(tài)模型不需要的數(shù)據(jù)可以被放棄。生物標(biāo)記分析系
統(tǒng)100可以只使用和/或生成相關(guān)生物標(biāo)記和變量,它們顯示出統(tǒng)計(jì)顯
著性并且/或者在疾病狀態(tài)模型中使用,以評(píng)估各患者。例如,如果疾
病狀態(tài)模型最初考慮生物標(biāo)記PSA、 IL-6、 RCP、 TNF-ou IL-8和 VEGF,但是》丈棄作為不顯著或低顯著的生物標(biāo)記的生物標(biāo)記PSA和
TT _《 Bill A 44 "il^i、?.A:l:jf玄4* 1 ftA "ST l" A直A 44 DC A知TT —/; 朵務(wù)
7 A一 ','一, ,7 j 'j、 i vf Vf j、/ i , w i ,| 「 v m ^
據(jù)并進(jìn)行對(duì)生物標(biāo)記RCP、 TNF-ou IL-8和VEGF的分析。
參照?qǐng)D8,生物標(biāo)記分析系統(tǒng)IOO可以對(duì)生物標(biāo)記數(shù)據(jù)和其它患 者信息進(jìn)行任何適當(dāng)?shù)奶幚?。例如,生物?biāo)記分析系統(tǒng)100可以為患 者的相關(guān)生物標(biāo)記水平的每一個(gè)建立指示符,如整數(shù)值,其表示每個(gè) 生物標(biāo)記的水平是否超過在疾病狀態(tài)模型中指定的相關(guān)特定生物標(biāo)記 最大允許值(810)。生物標(biāo)記分析系統(tǒng)IOO還可以將對(duì)應(yīng)的指示符與 患者的追加數(shù)據(jù)組相關(guān)聯(lián),表示原始數(shù)據(jù)值超過相關(guān)限制。
另外,生物標(biāo)記分析系統(tǒng)IOO可以根據(jù)在生成疾病狀態(tài)模型中建 立的歸一化準(zhǔn)則以及患者的主體數(shù)據(jù),如患者年齡、吸煙習(xí)慣等,生 成患者的歸一化數(shù)據(jù)(812)??梢詫⒃摎w一化數(shù)據(jù)加到患者的追加數(shù) 據(jù)。
生物標(biāo)記分析系統(tǒng)100還可以將患者的原始數(shù)據(jù)和/或追加數(shù)據(jù) 與生物標(biāo)記分界點(diǎn)進(jìn)行比較,并生成每個(gè)相關(guān)生物標(biāo)記分界點(diǎn)的分界 點(diǎn)指示符和對(duì)應(yīng)數(shù)據(jù)(814)。生物標(biāo)記分析系統(tǒng)IOO可以例如通過將 相關(guān)數(shù)據(jù)變化到由疾病狀態(tài)模型使用的分?jǐn)?shù)冪,并將所有減小的數(shù)據(jù) 值與患者數(shù)據(jù)組相關(guān)聯(lián)來進(jìn)一步為患者的相關(guān)測(cè)量生物標(biāo)記水平的每 一個(gè)建立減小的數(shù)據(jù)值(816)。
生物標(biāo)記分析系統(tǒng)100可以結(jié)合該疾病狀態(tài)模型評(píng)估原始生物標(biāo) 記數(shù)據(jù)和任何其它相關(guān)數(shù)據(jù)。例如,生物標(biāo)記分析系統(tǒng)IOO可以使用 患者的生物標(biāo)記數(shù)據(jù)和其它數(shù)據(jù)以及該疾病狀態(tài)模型來計(jì)算患者的綜 合得分(818)。生物標(biāo)記分析系統(tǒng)IOO可以比較綜合得分與記分模型 分界點(diǎn)(820)。分界點(diǎn)以上的得分暗示主體的疾病狀態(tài)是陽性的,同 時(shí)分界點(diǎn)以下的得分表示該主體是陰性的。生物標(biāo)記分析系統(tǒng)100還
27可以將綜合得分與不確定區(qū)域的邊界限制進(jìn)行比較,該不確定區(qū)域可 以構(gòu)建在不能進(jìn)行判斷的分界點(diǎn)周圍。該不確定區(qū)域例如可以解決患 者的生物可變性(關(guān)注的生物標(biāo)記通常天天變化)和評(píng)估方法誤差二 者。
所示出和描述的具體實(shí)施方式
說明了本發(fā)明及其最佳模式,并不 意圖以任何方式限制本發(fā)明的范圍。實(shí)際上為了簡潔,傳統(tǒng)處理、數(shù) 據(jù)輸入、計(jì)算機(jī)系統(tǒng)以及該系統(tǒng)的其它功能方面可以不詳細(xì)描述。另 外,各附圖中所示出的連線用于代表各元件之間示范性的功能關(guān)系和/ 或物理耦合。在實(shí)際系統(tǒng)中可以存在許多可選擇的或附加的功能關(guān)系 或物理連接。
上面結(jié)合具體實(shí)施例描述了本發(fā)明。然而,可以對(duì)該具體實(shí)施例 進(jìn)行變化和修改而不偏離本發(fā)明的范圍。這些和其它變化或修改意圖 包括在本發(fā)明的范圍內(nèi)。
權(quán)利要求
1. 一種用于評(píng)估人的疾病狀態(tài)的方法,包括獲取狀況陽性群組對(duì)于多個(gè)生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)據(jù);獲取狀況陰性群組對(duì)于多個(gè)生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù);自動(dòng)從多個(gè)生物標(biāo)記中選擇多個(gè)相關(guān)生物標(biāo)記;以及根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異生成用于確定疾病狀態(tài)的統(tǒng)計(jì)模型。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括 生成狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù);并且 其中生成統(tǒng)計(jì)模型包括根據(jù)以下差異生成統(tǒng)計(jì)模型 狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異;以及狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)之間的差異。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,生成范圍減小的生 物標(biāo)記數(shù)據(jù)包括將生物標(biāo)記數(shù)據(jù)乘以分?jǐn)?shù)的指數(shù)。
4. 根據(jù)權(quán)利要求l所述的方法,其特征在于,還包括 比較所選的生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)據(jù)的累積頻率分布和所選的生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù)的累積頻率分布;根據(jù)所選的生物標(biāo)記的狀況陽性累積頻率分布和狀況陰性累積頻 率分布之間的最大差異選擇生物標(biāo)記的分界點(diǎn)。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括將狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)與分界點(diǎn)進(jìn)行 比較;以及根據(jù)與分界點(diǎn)比較的每個(gè)數(shù)據(jù)是否超過分界點(diǎn)生成包括一組離散值的分界點(diǎn)數(shù)據(jù)組。
6. 根據(jù)權(quán)利要求l所述的方法,其特征在于,生成統(tǒng)計(jì)模型包括 對(duì)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì) 于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)進(jìn)行迭代分析,其中所述迭代分析被 配置為鑒別并去除與第二組數(shù)據(jù)相比關(guān)于疾病狀態(tài)的信息性較低的第 一組數(shù)據(jù)。
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于;還包括 將狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)與閾值進(jìn)行比較;并且根據(jù)比較結(jié)果生成與閾值比較的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰 性生物標(biāo)記數(shù)據(jù)的多個(gè)離散值;以及根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的離散值和狀況陰性群組對(duì) 于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)的離散值之間的差異生成用于確定疾 病狀態(tài)的統(tǒng)計(jì)模型。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括生成狀況陽封頂生物標(biāo)記數(shù)據(jù)包括封頂限制內(nèi)的數(shù)據(jù)的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記 數(shù)據(jù);以及超過封頂限制的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù) 的封頂值。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,還包括根據(jù)狀況陽 性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)中的至少一個(gè)的中值選擇封 頂限制。
10. 根據(jù)權(quán)利要求l所述的方法,其特征在于, 統(tǒng)計(jì)模型包括至少一個(gè)因變量和多于一個(gè)的獨(dú)立變量, 疾病狀態(tài)是因變量;并且多個(gè)相關(guān)生物標(biāo)記的多個(gè)量值包括多個(gè)獨(dú)立變量。
11. 一種用于評(píng)估人的疾病狀態(tài)的系統(tǒng),包括計(jì)算機(jī)系統(tǒng),該計(jì)算機(jī)系統(tǒng)被配置用于接收狀況陽性群組對(duì)于多個(gè)生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)椐; 接收狀況陰性群組對(duì)于多個(gè)生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù); 自動(dòng)從多個(gè)生物標(biāo)記中選擇多個(gè)相關(guān)生物標(biāo)記;以及 根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異自動(dòng)生成用于確定處病;He水^i統(tǒng)i+;虔刑
12. 根據(jù)權(quán)利要求ll所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 被進(jìn)一步配置用于生成狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù) 和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù);并且 根據(jù)以下差異自動(dòng)生成統(tǒng)計(jì)模型對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異;以及狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)和狀 況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)之間的差 異。
13. 根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 被配置用于通過將生物標(biāo)記數(shù)據(jù)乘以分?jǐn)?shù)的指數(shù)來生成范圍減小的生 物標(biāo)記數(shù)據(jù)。
14. 根據(jù)權(quán)利要求ll所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 還^Ji置用于比較所選的生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)據(jù)的累積頻率分布和 所選的生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù)的累積頻率分布;根據(jù)所選的生物標(biāo)記的狀況陽性累積頻率分布和狀況陰性累積頻 率分布之間的最大差異選擇生物標(biāo)記的分界點(diǎn)。
15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 還被配置用于將狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)與分界點(diǎn)進(jìn)行比較;以及根據(jù)與分界點(diǎn)比較的每個(gè)數(shù)據(jù)是否超過分界點(diǎn)生成包括一組離散 值的分界點(diǎn)數(shù)據(jù)組。
16. 根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 被配置用于通過對(duì)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和 狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)進(jìn)行迭代分析自動(dòng)生 成統(tǒng)計(jì)模型,其中迭代分析被配置為鑒別并去除與第二組數(shù)據(jù)相比關(guān) 于疾病狀態(tài)的信息性較低的第一組數(shù)據(jù)。
17. 根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 被進(jìn)一步配置用于將狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)與閾值進(jìn)行比 較;并且性生物標(biāo)記數(shù)據(jù)的多個(gè)離散值;以及根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的離散值和狀況陰性群組對(duì) 于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)的離散值之間的差異自動(dòng)生成用于確 定疾病狀態(tài)的統(tǒng)計(jì)模型。
18. 根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 還被配置用于生成狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)的 封頂生物標(biāo)記數(shù)據(jù),其中封頂生物標(biāo)記數(shù)據(jù)包括封頂限制內(nèi)的數(shù)據(jù)的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記 數(shù)據(jù);以及超過封頂限制的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù) 的封頂值。
19. 根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述計(jì)算機(jī)系統(tǒng) 還被配置用于根據(jù)狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)中 的至少 一個(gè)的中值選擇封頂限制。
20. 根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于, 統(tǒng)計(jì)模型包括至少一個(gè)因變量和多于一個(gè)的獨(dú)立變量,疾病狀態(tài)是因變量;并且多個(gè)相關(guān)生物標(biāo)記的多個(gè)量值包括多個(gè)獨(dú)立變量。
21. —種計(jì)算機(jī)程序,該計(jì)算機(jī)程序被配置成使計(jì)算機(jī)執(zhí)行用于評(píng)估人的疾病狀態(tài)的方法,該方法包括獲取狀況陽性群組對(duì)于多個(gè)生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)據(jù);獲取狀況陰性群組對(duì)于多個(gè)生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù);自動(dòng)從多個(gè)生物標(biāo)記中選擇多個(gè)相關(guān)生物標(biāo)記;以及根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異自動(dòng)生成用于確定疾病狀態(tài)的統(tǒng)計(jì)模型。
22. 根據(jù)權(quán)利要求21所述的計(jì)算機(jī)程序,其特征在于,所述方法還包括生成狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù);并且其中自動(dòng)生成統(tǒng)計(jì)模型包括根據(jù)以下差異生成統(tǒng)計(jì)模型狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異;以及狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的范圍減小的生物標(biāo)記數(shù)據(jù)之間的差異。
23. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)程序,其特征在于,生成范圍減小的生物標(biāo)記數(shù)據(jù)包括將生物標(biāo)記數(shù)據(jù)乘以分?jǐn)?shù)的指數(shù)。
24. 根據(jù)權(quán)利要求21所述的計(jì)算機(jī)程序,其特征在于,該方法還包括比較所選的生物標(biāo)記的狀況陽性生物標(biāo)記數(shù)據(jù)的累積頻率分布和所選的生物標(biāo)記的狀況陰性生物標(biāo)記數(shù)據(jù)的累積頻率分布;根據(jù)所選的生物標(biāo)記的狀況陽性累積頻率分布和狀況陰性累積頻率分布之間的最大差異選擇生物標(biāo)記的分界點(diǎn)。
25. 根據(jù)權(quán)利要求24所述的計(jì)算機(jī)程序,其特征在于,所述方法還包括將狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)與分界點(diǎn)進(jìn)行比較;以及根據(jù)與分界點(diǎn)比較的每個(gè)數(shù)據(jù)是否超過分界點(diǎn)生成包括一組離散值的分界點(diǎn)數(shù)據(jù)組。
26. 根據(jù)權(quán)利要求21所述的計(jì)算機(jī)程序,其特征在于,自動(dòng)生成統(tǒng)計(jì)模型包括對(duì)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)進(jìn)行迭代分析,其中迭代分析被配置為鑒別并去除與第二組數(shù)據(jù)相比關(guān)于疾病狀態(tài)的信息性較低的第 一 組數(shù)據(jù)。
27. 根據(jù)權(quán)利要求21所述的計(jì)算機(jī)程序,其特征在于,所述方法還包括較;并且根據(jù)比較結(jié)果生成與閾值比較的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)的多個(gè)離散值;以及根據(jù)狀況陽性群組對(duì)于相關(guān)生物標(biāo)記的離散值和狀況陰性群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)的離散值之間的差異自動(dòng)生成用于確定疾病狀態(tài)的統(tǒng)計(jì)模型。
28. 根據(jù)權(quán)利要求27所述的計(jì)算機(jī)程序,其特征在于,所述方法還包括生成狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)的封頂生物標(biāo)記數(shù)據(jù),其中封頂生物標(biāo)記數(shù)據(jù)包括封頂限制內(nèi)的數(shù)據(jù)的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù);以及超過封頂限制的狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)的封頂值。
29. 根據(jù)權(quán)利要求28所述的計(jì)算機(jī)程序,其特征在于,所述方法還包括根據(jù)狀況陽性生物標(biāo)記數(shù)據(jù)和狀況陰性生物標(biāo)記數(shù)據(jù)中的至少一個(gè)的中值選擇封頂限制。
30.根據(jù)權(quán)利要求21所述的計(jì)算機(jī)程序,其特征在于,統(tǒng)計(jì)模型包括至少一個(gè)因變量和多于一個(gè)的獨(dú)立變量,疾病狀態(tài)是因變量;并且多個(gè)相關(guān)生物標(biāo)記的多個(gè)量值包括多個(gè)獨(dú)立變量。
全文摘要
根據(jù)本發(fā)明各方面的鑒別疾病狀態(tài)的方法和設(shè)備包括分析一個(gè)或多個(gè)生物標(biāo)記的水平。該方法和設(shè)備可以使用狀況陽性群組和狀況陰性群組的生物標(biāo)記數(shù)據(jù)并從多個(gè)生物標(biāo)記中選擇多個(gè)相關(guān)生物標(biāo)記。該系統(tǒng)可以生成用于根據(jù)各群組對(duì)于相關(guān)生物標(biāo)記的生物標(biāo)記數(shù)據(jù)之間的差異確定疾病狀態(tài)的統(tǒng)計(jì)模型。該方法和設(shè)備還可以通過產(chǎn)生個(gè)體患者的綜合得分并將該患者的綜合得分與用于鑒別潛在疾病狀態(tài)的一個(gè)或多個(gè)閾值相比較來幫助確定個(gè)體的疾病狀態(tài)。
文檔編號(hào)G01N33/48GK101479599SQ200780023720
公開日2009年7月8日 申請(qǐng)日期2007年4月25日 優(yōu)先權(quán)日2006年5月1日
發(fā)明者G·F·蘭達(dá)爾 申請(qǐng)人:曾羅維斯塔診斷學(xué)有限責(zé)任公司