專利名稱:從一群患者的生物學(xué)圖譜中取樣預(yù)測一個個體臨床治療結(jié)果的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及從一群患者的生物學(xué)圖譜取樣來預(yù)測一個個體的治療結(jié)果的方法、系統(tǒng)和計算機程序產(chǎn)品。
背景技術(shù):
眾所周知,在不同的人群中就所產(chǎn)生的功效和副反應(yīng)而言,藥物反應(yīng)變化很大。例如,阿司匹林在一些使用者中引起胃腸道不適;某些抗組胺藥物并非對所有人有利。這種群體變化性也可以在例如癌癥等嚴重和致死性疾病的治療中看到。一名患者開始接受一種治療,然后,臨床醫(yī)生根據(jù)功效和副反應(yīng)將決定他/她是否應(yīng)該繼續(xù)這種治療或者轉(zhuǎn)換為另一種療法。
當在治療某些嚴重性疾病時,這種嘗試并轉(zhuǎn)換的方法會產(chǎn)生嚴重后果;在癌癥治療的時間敏感性情況中尤其如此。不清楚不同化學(xué)療法對于一個個體的功效就使得設(shè)計一個有效的治療計劃變得非常困難;他們的治療結(jié)果基本上是隨機的。由于大部分癌癥患者將在患病期間接受化療,所以很多人將因治療無效而蒙受損害并且經(jīng)受對他們已經(jīng)脆弱的健康狀況可能產(chǎn)生的副反應(yīng)。
這種局面是現(xiàn)有臨床試驗設(shè)計范圍受限的結(jié)果。設(shè)計這些試驗是為了確定在一個患者群體中的藥效。該等試驗結(jié)果代表對一群患者有效性的統(tǒng)計學(xué)概率。沒有關(guān)于針對單獨患者藥效的具體信息。
傳統(tǒng)的體外和體內(nèi)藥效分析多年以來藥效預(yù)測一直使用體外和體內(nèi)分析來確定,該等分析被設(shè)計成能測量腫瘤在一個模擬環(huán)境下對藥物的反應(yīng)。盡管許多分析用細致的實驗設(shè)計和精良的技術(shù)而高度完善,但是這些方法存在基本性限制。另外,大多數(shù)臨床醫(yī)生懷疑這些實驗的有效性。
一般用體外化學(xué)敏感性分析來預(yù)測患者對藥物治療的反應(yīng)。從腫瘤中分離出原發(fā)性癌細胞或轉(zhuǎn)移性細胞并且用化療藥物孵育該等細胞。然后評估細胞存活率,而其結(jié)果經(jīng)過解釋來確定患者腫瘤對于該等藥物的敏感性和抗性。在這些實驗中存在很多問題。第一,存在獨立于所用分析方式之外的問題,包括原發(fā)性與轉(zhuǎn)移性細胞之間的差別、藥物濃度的選擇以及腫瘤樣本的異質(zhì)性。第二,存在分析方式特有的問題,例如在培養(yǎng)中不能區(qū)分惡性和非惡性細胞的生長。第三,人腫瘤克隆分析方式中存在技術(shù)困難,其中大約半數(shù)樣本不能生長;因此,難以獲得細胞群落用于藥物反應(yīng)讀數(shù)量化分析。除了上述缺點外,這些實驗還可有其它問題;例如,該分析需要長時間孵育(14到28天),這在臨床實踐的使用中是不切實際的。另外,體外分析條件與體內(nèi)生理環(huán)境之間存在顯著差異,從而使在體外觀察到的藥物反應(yīng)有效性及其潛在臨床引用令人懷疑。
除體外實驗以外另一種方式是極端藥物抗性研究(EDR),其專注于藥物抗性而非藥物敏感性。在這些實驗中,將腫瘤用極高藥物濃度處理很長一段暴露時間。該假說認為如果該等腫瘤在這些極端條件下不能表現(xiàn)出反應(yīng)那么患者也將對這些藥物沒有反應(yīng)。Kern和Weisenthal首先報導(dǎo)了陽性EDR結(jié)果(參見Kern,D.H.,Weisenthal,L.M.,″Highly specific prediction ofantineoplastic drug resistance with an in vitro assay using suprapharmacologicdrug exposures,″(1990)J Natl Cancer Inst;7582),全文以引用的方式并入本文中,但在隨后其他人的研究中沒有得到證實。在關(guān)于患有II期卵巢癌患者的研究中,EDR分析沒有預(yù)測出3年存活率的差異。(參見Orr,J.W.Jr,Orr,P,Kern,D.H.,Cost-effective treatment of women with advanced ovarian cancer bycytoreductive surgery and chemotherapy directed by an in vitro assay for drugresistance,(1999)Cancer J Sci Am 5174-178,以引用的方式并入本文中)。在Eltabbakh對75名卵巢癌患者進行的另一項研究中(參見Eltabbakh,G.H.,Piver,M.S.,Hempling,R.E.,等人.″Correlation between extreme drug resistanceassay and response to primary paclitaxel and cisplatin in patients with epithelialovarian cancer,″(1998)Gynecol Oncol;70392-397,以引用的方式并入本文中),EDR分析也未能證明預(yù)測藥物反應(yīng)的任何優(yōu)勢。一項對95名直腸癌和闌尾癌患者進行的前瞻性研究也未能使腫瘤的敏感性或抗性與體外預(yù)測分析相互關(guān)聯(lián)。(參見Fernandez-Trigo,V.,Shansa,F(xiàn).,Vidal-Jove,J.,等人“Prognostic implications of chemoresistance-sensitivity assays for colorectaland apendiceal cancer”(1995)Am J Clin Oncol;18454-460),全文以文本方式并入本文中)。
對于體外方法的一個改良是體內(nèi)技術(shù),它研究腫瘤的三維細胞結(jié)構(gòu)以及藥物的代謝、活化效應(yīng)。體內(nèi)實驗通常利用免疫缺陷型小鼠,在其腎囊下移植腫瘤細胞或給該等動物接種癌癥細胞。對于前者報導(dǎo)了一些很有前景的結(jié)果。(例如參見Bogden,A.E.,″The subrenal capsule assay and its predictivevalue in oncology,″(1985)Ann Chir Gynaecol;74(增刊199)12),全文以引用方式并入本文中)。雖然體內(nèi)實驗法被設(shè)計成能精密模擬生物系統(tǒng)的復(fù)雜性,但是仍然存在許多不能通過動物建模來復(fù)制的因素。例如,小鼠的藥物代謝和宿主毒性與人類的藥物代謝和宿主毒性不能相比,或者引入的腫瘤可能與在人體系統(tǒng)中的腫瘤行為不同。(參見Cunningham,D.等人,″The 6-daysubrenal capsule assay is of no value with primary surgical explants from gastriccancer,″(1986)Br.J Cancer;54519,全文以引用的方式并入本文中)。另外在這些實驗中所需要的顯著持續(xù)時間使得難以將這些分析用于診斷目的。一次體內(nèi)實驗經(jīng)常會占用三個月才能獲得結(jié)果,這在癌癥研究上是可以接受的,但是在臨床實踐中應(yīng)用是極不可能的。
總而言之,用于預(yù)測個體患者藥物反應(yīng)的體內(nèi)和體外實驗技術(shù)都具有其固有問題。最明顯的是這些實驗系統(tǒng)所產(chǎn)生的差異,它們與患者體內(nèi)的生理環(huán)境大不相同。而且,腫瘤類型差異、藥物濃度水平以及質(zhì)量控制問題在這些體外預(yù)測測試中都證明是難以解決的。
遺傳藥理學(xué)近況由于許多疾病是遺傳病,因此期望基因表達能夠預(yù)測它們對治療的反應(yīng)。有幾個與化療功效相聯(lián)系的單個標志基因的例子。例如,在乳癌治療中,在ER陽性腫瘤中使用它莫西芬(tamoxifen),并且當生長因子受體HER2過度表達的時候使用赫賽汀(herceptin)。然而這些只是例外情況;一般不能期望利用單個標志基因去可靠地預(yù)測一種藥物的有效性。與此相反,許多與藥物反應(yīng)相關(guān)的基因有待鑒別。需要繼續(xù)發(fā)展一種將來自這些基因的信息結(jié)合的最優(yōu)方法。這一新穎方法影響很多種與NIH所報導(dǎo)的遺傳病相關(guān)的疾病癌癥、血液和淋巴疾病、消化系統(tǒng)、耳鼻喉、眼部疾病、婦科病、腺體和激素、心血管、免疫系統(tǒng)疾病、男科疾病、肌肉和骨骼、新生兒疾病、神經(jīng)系統(tǒng)、營養(yǎng)和代謝疾病、呼吸系統(tǒng)疾病、皮膚和結(jié)締組織。(參見″Genesand Disease″,by National Center for Biotechnology Information,″來自http//www.ncbi.nhn.nih.gov/entrez/ouerv.fcgi?db=Books,全文以引用的方式并入本文中)。遺傳藥理學(xué)的目標是理解遺傳??;該等結(jié)果可能提供一個比單個標志基因預(yù)測模型更好的預(yù)測模型。
最近DNA微陣列或基因芯片技術(shù)的出現(xiàn)為有可能在一個單個實驗中分析所有人類基因提供了一個平臺。這項技術(shù)使藥理學(xué)研究發(fā)生巨大變化(參見Lander,E.S.等人″Initial sequencing and analysis of the human genome.Nature 409860-921,(2001);和Venter,J.C.等人″The sequence of the humangenome.Science,″2911304-1351,(2001);全文以引用的方式并入本文中)。監(jiān)控基因表達譜可以有助于理解疾病的分子指紋。這項技術(shù)也提供了研究治療性處理、環(huán)境介質(zhì)的基礎(chǔ),而且可以最終幫助區(qū)分對于一種給定藥物的應(yīng)答者與非應(yīng)答者以及在表達譜中改變模式的基礎(chǔ)上預(yù)測毒性和其它不利效應(yīng)。
迄今為止,基于基因的臨床癌癥研究非常有限。有人應(yīng)用微陣列去推斷正常組織與癌癥組織之間的差異(參見Welsh,J.B.等人″Analysis of GeneExpression Profiles in Normal and Neoplastic Ovarian Tissue Samples IdentifiesCandidate Molecular Markers of Epithelial Ovarian Cancer,″Proc.Natl.Acad.Sci.USA 98,1176-1181,(2001);和Alon,U,等人″Broad Patterns of Geneexpression revealed by clustering analysis of tumor and normal colon tissuesprobed by oligonucleotide arrays,″Proc.Natl.Acad.Sci.USA,96,6745-6750,(1999));全文以引用的方式并入本文中)。這些研究被設(shè)計成能發(fā)現(xiàn)標志基因或共調(diào)控基因。微陣列研究的另一種應(yīng)用是利用癌癥組織的病理學(xué)特征(例如轉(zhuǎn)移性、侵襲性或白血病中急性骨髓性白血病(AML)對急性淋巴性白血病(ALL))將它們進行分子分類。這些研究已經(jīng)根據(jù)它們的遺傳譜成功的分離了乳腺、黑素瘤、白血病、肺和淋巴瘤組織(參見Laura J.van′t Veer,Hongyue Dai等人″Gene expression profiling predicts clinical outcome of breastcancer,Nature,415,530-536(2002);Marc J.van de Vijver等人″A geneexpression signature as a predictor of survival in breast cancer,″N Engl J Med,347,No.25,1999-2009(2002);Bittner,M.,等人″Molecular classification ofcutaneous malignant melanoma by gene expression profiling,″Nature 406,536-540(2000);Golub,T.R.等人″Molecular Classification of CancerClassDiscovery and Class Prediction by Gene Expression Monitoring,″Science,286,531-537(1999);Bhattacharjee,A.等人″Classification of human lung carcinomasby mRNA expression profiling reveals distinct adenocarcinoma subclasses,″Proc.Natl.-Acad.Ssi,-USA-98,13790-13795-{2001};和Alizadeh,Ash A.等人″Distinct Types of Diffuse Large B-Cell Lymphoma Identified by GeneExpression Profiling,″Nature,403,503-511(2000));全部以全文引用的方式并入本文中。)然而,這些研究中沒有一個能夠提出治療結(jié)果的可預(yù)測性。
關(guān)于預(yù)測治療結(jié)果的當前研究現(xiàn)狀在癌癥治療中藥物抗性是一個尤其關(guān)鍵的問題。例如使用DNA微陣列的基因組學(xué)方法已經(jīng)用于鑒別有助于癌癥中藥物抗性的遺傳途徑。由于這種方法要求詳細分析許多個別途徑,所以獲得對基因組、分子、細胞和臨床表型之間復(fù)雜關(guān)系的綜合理解尚有一定距離。
由于對臨床應(yīng)用中遺傳途徑的認識極為有限,因此DNA微陣列已經(jīng)用于研究在體外和體內(nèi)環(huán)境下的藥物反應(yīng)。無需明確指明途徑,已經(jīng)報導(dǎo)了將因?qū)熢噭┑捻憫?yīng)變化而產(chǎn)生的基因組范圍的基因表達與腫瘤組織藥物反應(yīng)直接關(guān)聯(lián)的研究。(參見Staunton,J.E.等人″Chemosensitivity predictionby transcriptional profiling,″Proc.Natl.Acad.Sci.USA 98,10787-10792(2001);Zembutsu,H.等人″Genome-wide cDNA microarray screening tocorrelate gene expression profiles with sensitivity of 85human cancerxenografts to anticancer drugs,″Cancer Res.62518-527(2002);上述文獻全部以全文引用的方式并入本文中)。由于實驗設(shè)計的局限性,這些結(jié)果對于決定一個樣本基因譜是否與一個特定藥物反應(yīng)精確相關(guān)不夠確定。然而,即使進一步的體外或體內(nèi)研究得出陽性結(jié)果,直接臨床應(yīng)用也仍然是不可能的。
我們所需要的是根據(jù)一群患者生物學(xué)圖譜取樣來預(yù)測一個個體的治療結(jié)果的方法、系統(tǒng)和計算機程序產(chǎn)品。
發(fā)明內(nèi)容
本發(fā)明涉及從一群患者的生物學(xué)圖譜取樣來預(yù)測一個個體的治療結(jié)果的方法、系統(tǒng)和計算機程序產(chǎn)品。
根據(jù)本發(fā)明的一個方面,生物學(xué)圖譜信息采自被診斷為具有一種醫(yī)療狀況并且接受一種治療的患者。還接受關(guān)于具有該醫(yī)療狀況且接受該治療的患者的治療結(jié)果信息。隨后對這些生物學(xué)圖譜信息和治療結(jié)果信息實施一個基于判別分析的模式識別方法,從而產(chǎn)生一個使得該生物學(xué)圖譜信息與治療結(jié)果信息相互關(guān)聯(lián)的模型。該模型尤其可以用于預(yù)測新患者接受所述治療的治療結(jié)果。本文中描述了本發(fā)明的這些以及其它特性。
本發(fā)明將參考附圖進行描述,其中同樣的參考數(shù)字表示相同或者功能相似的要素。同樣,參考數(shù)字最左邊的數(shù)字標識首次引入相關(guān)要素的圖示。
圖1是一個實例方法的流程圖,用于產(chǎn)生和使用一個模型以便從一群患者的生物學(xué)圖譜取樣來預(yù)測一個個體的治療結(jié)果。
圖2說明一個分離基因分布的實例。
圖3是用于研磨冷凍組織的一個定制釘槍的照片。
圖4是一個凝膠電泳檢驗RNA的實例說明。
圖5是掃描一個微陣列得到的一張實例圖像。
圖6是一張放射性療法應(yīng)答分析產(chǎn)生的實例圖像。
圖7是可以在其中執(zhí)行本發(fā)明的一組實例計算機系統(tǒng)。
具體實施例方式
目錄表I 引言........................................................9II 一種用于預(yù)測治療結(jié)果的方法..................................10III商業(yè)應(yīng)用實例................................................13IV 與其它治療結(jié)果預(yù)測方法比較..................................14A 自下而上方法(top-down)對比由下至上(bottom-up)法.............14B 選擇患者形成預(yù)測模型........................................16V 生物學(xué)圖譜..................................................16A 使用一名患者的非靶點組織用于預(yù)測............................16B 總RNA和eDNA.................................................17C 預(yù)測長期治療后結(jié)果..........................................18VI 進行判別分析來建立預(yù)測模型..................................18VII可選執(zhí)行細節(jié)、實例和測試結(jié)果................................19A 方法由微陣列繪制圖譜......................................201.微陣列.......................................................202.RNA提取......................................................20
3.cDNA探針標記......................................................214.陣列雜交和圖像處理................................................21B使用判別分析進行數(shù)據(jù)分析...........................................221.費舍線性判別分析..................................................232.K最近鄰法.........................................................25C實例...............................................................261.放射性治療子宮頸癌的功效預(yù)測......................................272.結(jié)腸直腸癌........................................................293.卵巢癌............................................................304.體外授精..........................................................31D樣本規(guī)模...........................................................32VIII計算機執(zhí)行DC總結(jié)I引言本發(fā)明涉及一種方法,其將一個患者組織的微陣列芯片分析與用于預(yù)測建議該患者進行的治療計劃功效的判別分析相結(jié)合。該方法分析并且將來自處于不同醫(yī)療狀況(例如疾病或者營養(yǎng)不良的人體狀態(tài))的許多患者的生物學(xué)圖譜(如基因組譜、DNA譜、RNA譜、蛋白質(zhì)譜)與他們各自治療的臨床結(jié)果相互關(guān)聯(lián)。本發(fā)明為針對一名指定患者制定專門且有效的臨床治療提供基礎(chǔ)。
本發(fā)明使臨床患者組織與臨床治療反應(yīng)直接相互關(guān)聯(lián)。本發(fā)明無需途徑信息而通過數(shù)學(xué)建模提供一種直接關(guān)系。與在體外和體內(nèi)研究中所用數(shù)據(jù)大不相同,本發(fā)明利用從復(fù)雜的人體生理環(huán)境所獲得的數(shù)據(jù)。本發(fā)明也提出更多精心設(shè)計的藥物輸入人體方法和其它治療方式(例如放射療法、體外授精)。
至少在部分內(nèi)容中,本發(fā)明假定以下概念,即藥物反應(yīng)中的個體間改變是由于生物學(xué)(例如遺傳學(xué))差異。本文中稱之為遺傳藥理學(xué)。這對于某些藥物尤其顯著,例如在癌癥治療中使用的化學(xué)療法。此等遺傳學(xué)差異可以影響藥物的藥代動力學(xué)(例如代謝或運輸)或藥效學(xué)(例如靶點或調(diào)節(jié)酶)。用于繪制表達譜的DNA微陣列的出現(xiàn)為用于鑒別醫(yī)療狀況(例如疾病、先前未識別的疾病子集和預(yù)后性癥狀類別)、途徑、靶點和化合物的分子特征的生物學(xué)圖譜(例如基因組范圍)方法提供一個有用的平臺。(參見Pagliarulo,V.等人″Role of genetic and expression profiling inpharmacogenomicsthe changing fece of patient management,″Curr.Issues Mol.Biol.4101-110(2002),全文以引用的方式并入本文中)。這允許對例如癌癥的更系統(tǒng)性研究。例如“個人化醫(yī)療“討論于Mancinelli,L.等人″PharmacogenomicsThe Promise of personalized Medicine,AAPS PharmSci2000;2(1)第4篇(2002),全文以引用的方式并入本文中。
II一種用于預(yù)測治療結(jié)果的方法本發(fā)明將人體組織或樣本的微陣列分析與判別分析結(jié)合來預(yù)測治療結(jié)果。圖1是一個實例方法100的工藝流程圖,該方法用于生成和使用從一群患者的生物學(xué)圖譜取樣來預(yù)測一個個體的治療結(jié)果的模型。方法100包括一個模型生成過程102和一個治療結(jié)果預(yù)測過程104。該模型生成過程102產(chǎn)生一個預(yù)測模型。該模型生成過程102的目標是獲取已知的輸入數(shù)據(jù)(歷史數(shù)據(jù))并生成一個辯別不同治療結(jié)果的模型。治療結(jié)果預(yù)測過程104預(yù)測一個新組織樣本的治療結(jié)果。
所述模型生成過程102開始于任務(wù)定義106,其中定義了模型生成參數(shù)。參數(shù)可以不加限制地包括范圍定義。范圍定義可以不加限制地包括識別一種治療方法(例如化學(xué)療法、免疫療法、放射療法或體外授精)。在一個藥物治療案例中,可能存在許多治療選擇,所以可選擇一種特定的藥物或者組合藥物來進行研究。其他參數(shù)因子可以包括一個被預(yù)測目標(即即時藥物反應(yīng)或長期效應(yīng))、組織類型(例如原發(fā)性腫瘤、轉(zhuǎn)移性病灶、血清)、組織表征(例如利用RNA、DNA和蛋白質(zhì)繪制圖譜)及/或大小足夠代表患者群體的組織樣本量數(shù)目。參數(shù)也可以包括組織收集的附加考慮因素(例如同時包括正常組織和腫瘤的總RNA)和治療反應(yīng)變量(例如CT掃描結(jié)果、CEA值)。
在步驟108中,從患者處收集治療結(jié)果130。治療結(jié)果130可以通過多種方式收集。例如(且不限于)可以通過使用由治療醫(yī)師、腫瘤學(xué)家及/或患者回答的調(diào)查問卷來收集治療結(jié)果。所述問卷可以是計算機實施、書面或其組合??梢詮膯我粰C構(gòu)或不同機構(gòu)收集治療結(jié)果。治療結(jié)果130可以通過電子方法及/或傳統(tǒng)信件傳輸方式在本地及/或遠程收集。
在步驟110中,從患者處收集組織樣本132。
在步驟112中,在確定組織處理技術(shù)(例如cDNA微陣列)之后,在該等組織樣本132上執(zhí)行微陣列實驗。
在圖1中示為生物學(xué)圖譜數(shù)據(jù)134的來自微陣列的患者組織處理結(jié)果(例如基因表達值)和相應(yīng)的臨床治療結(jié)果記錄(例如響應(yīng)或未響應(yīng))(在圖1中示為治療結(jié)果130)在一個判別數(shù)據(jù)分析中用作輸入量,在圖1中示為步驟114。分析不同的治療結(jié)果(治療結(jié)果130)和它們相應(yīng)的生物學(xué)圖譜數(shù)據(jù)134(例如基因組表達)來識別它們的差異。然后使用最優(yōu)結(jié)果建立一個治療預(yù)測模型136。上述判定在下文分章節(jié)討論。
該方法的第二部分是治療結(jié)果預(yù)測過程104,它使用模型136對一名新患者預(yù)測治療結(jié)果。該過程開始于步驟116,即按步驟110從患者處收集相同類型的組織樣本138。在步驟118中,使用與步驟112中相同或大體上相似的方法制備和處理該患者組織138來產(chǎn)生新的患者生物學(xué)圖譜(例如基因組譜)值140。在步驟120中,將這些新的患者生物學(xué)圖譜值140輸入到預(yù)測模型136中并返回一個預(yù)測結(jié)果。
在預(yù)期有多種備選療法時,對于每一種療法都產(chǎn)生另一個模型136。換句話說,使用由已經(jīng)接受相應(yīng)治療的患者獲得的治療結(jié)果130對每種療法重復(fù)該模型生成過程102。然后將從新患者獲得的生物學(xué)圖譜數(shù)據(jù)140提供給每種模型136?;蛘?,當從一個不同類型組織生成一個特殊模型136時,就會需要一個新的患者組織樣本138。
所述模型136可以由以陽性/陰性反應(yīng)形式及/或以分度反應(yīng)(例如以標度0-1)形式的治療結(jié)果生成。由以陽性/陰性反應(yīng)形式的治療結(jié)果生成該或該等模型136時,輸出預(yù)測結(jié)果142也將為陽性/陰性反應(yīng)的形式?;蛘撸梢砸环N分級數(shù)值反應(yīng)的形式生成該或該等模型136時,輸出預(yù)測結(jié)果142也將為分度反應(yīng)的形式。當考慮多種療法時,可以用分度反應(yīng)142從多種陽性療法中選擇一種優(yōu)選療法。
每種藥物具有不同的作用機制。這些內(nèi)在差異使得很難將藥物活性與基因表達相關(guān)。因此,有可能一種特定程序可以成功地預(yù)測藥物反應(yīng)但是卻不能夠正確地預(yù)測其它藥物的活性或者治療類型。例如,單一藥物治療和組合治療是非常不同的;所以一個能夠預(yù)測單一藥物治療反應(yīng)的程序可能不能預(yù)測對于一個藥物組合的反應(yīng)。不同的用藥進程也導(dǎo)致極為不同的功效,而且一個預(yù)測一種特殊藥物輸送方法(例如一次性大劑量注射)的程序可能在另一進程(例如延時的)下不起作用。(參見Levi F,等人″A phase I-II trial offive-day continuous intra-venous infusion of 5-fluorouracil delivered atcircadian rhythm modulated rate in patients with metastatic colorectal cancer,″JInfus Chemother;5153-158(1995),全文以引用的方式并入本文中)。通過仔細選擇在各種情況下的樣本案例,我們證明本發(fā)明就其產(chǎn)生精確預(yù)測模型的能力來說是相當有用的。
本發(fā)明展示預(yù)測單一藥物、藥物組合和其它醫(yī)學(xué)療法選擇(例如放射療法、體外授精)功效、從而為診斷和治療各種醫(yī)療狀況給出確定結(jié)果的能力。本發(fā)明可用于預(yù)測許多種需要物理、生物或化學(xué)干涉的人類疾病的治療反應(yīng)。
III商業(yè)應(yīng)用實例除了為患者預(yù)測治療結(jié)果之外,本發(fā)明還可應(yīng)用于多種其它應(yīng)用。例如(不限于),一個商業(yè)應(yīng)用實例是協(xié)助研發(fā)癌癥治療計劃。該預(yù)測模型將可用療法的反應(yīng)分級,其可能用于合理設(shè)計治療計劃。
另一種應(yīng)用是幫助設(shè)計新的臨床藥物試驗。多種藥物雖然在臨床測試中得到陽性結(jié)果卻在試驗期間失敗。有時這并非因為該藥物無效,而是因為效率不夠高或者副作用太嚴重。本發(fā)明通過鑒別最受益于該藥物并經(jīng)受最小量副作用的患者來解決這些問題。例如,在I期和II期臨床試驗期間,可以保存患者的組織而且在II期結(jié)束時記錄臨床治療結(jié)果。然后可以用此組織和臨床治療結(jié)果產(chǎn)生一個預(yù)測模型。該模型隨后可包括于III期臨床試驗中。
另一種應(yīng)用是判別臨床前試驗的可能性??梢詮囊粋€原始臨床試驗建立一個預(yù)測模型。然后用該模型判定其它哪些疾病可以作為這種藥物的靶點。例如,在一種新結(jié)腸癌藥物的臨床試驗完成以后,其數(shù)據(jù)可用于建立一個預(yù)測模型。然后就可以用該新模型來測試其它腫瘤(例如卵巢、乳癌)以選擇另一個臨床試驗的最佳試驗對象。
IV與其它方法比較治療結(jié)果的預(yù)測A自下而上方法對比傳統(tǒng)的由下至上法一般而言,基因表達與臨床治療功效之間的關(guān)系是非常復(fù)雜的。為了充分理解遺傳藥理學(xué),可能必須應(yīng)用一種系統(tǒng)生物學(xué)方法去研究基因組與其環(huán)境之間的相互作用。大多數(shù)研究由尋找標志基因開始。隨后探索生物化學(xué)途徑以理解生物網(wǎng)絡(luò)系統(tǒng)。在所述途徑網(wǎng)絡(luò)中會有大量分支和回饋環(huán)路。在理論上,將需要分析每一個基因并且確定常存于每個途徑和環(huán)路中的連接和反應(yīng)常數(shù)。也需要考慮到其他因素以使得臨床模型更加真實,諸如細胞體積和蛋白質(zhì)定位。當預(yù)測一種組合藥物或者組合方式治療的時候這一方法會變得相當復(fù)雜。在這一模型中也必須考慮許多額外藥理學(xué)因素,如藥物輸送順序和藥物輸送速率。
這是一種研究個別要素來獲得對整體系統(tǒng)逐漸深入理解的經(jīng)典的還原論方法;即一種由下至上方法。運用這種方法有很多益處。新藥的發(fā)現(xiàn)將明顯受益于途徑研究。對于整個系統(tǒng)的理解是醫(yī)藥基因組學(xué)的最終目標。這是建立遺傳藥理學(xué)研究網(wǎng)絡(luò)和知識數(shù)據(jù)庫財團(Pharmacogenetics ResearchNetwork and Knowledge Base consortium(PharmGKB))的主要原因。遺傳藥理學(xué)知識數(shù)據(jù)庫(PharmGKB)由以下機構(gòu)提供資金支持從屬于美國國立健康研究院(NIH)的美國國家常規(guī)醫(yī)學(xué)科學(xué)研究院(NIGMS)、人類基因組研究院(NHGRI)和國家醫(yī)學(xué)實驗室(NLM)和遺傳藥理學(xué)研究網(wǎng)以及斯坦福大學(xué)兒童健康計劃。網(wǎng)址是(http//www.pharmpkb.org)。上述內(nèi)容以引用的方式全部并入本文中。這個數(shù)據(jù)庫將用于研究人類遺傳多態(tài)現(xiàn)象如何導(dǎo)致在治療藥物反應(yīng)中觀察到的變化。研究者將用來交換研究結(jié)果的PharmGKB的復(fù)雜數(shù)據(jù)庫設(shè)計強調(diào)該自下而上方法的復(fù)雜性。(參見OliverD.等人″Ontology Development for a Pharmacogenetics Knowledge Base,″Pac.Symp.Biocomput.65-76(2002),全文以引用方式并入本文中)。
因此需要大量的資源和時間去仔細研究這些關(guān)系、途徑和網(wǎng)絡(luò)。目前,這些研究限于較簡單的有機體,如酵母(參見Ledeker T.等人″IntegratedGenomic and Proteomic Analyses of a Systematically Perturbed MetabolicNetwork,″Science,292,929-934(2001),全文以引用方式并入本文中)和細胞系。(見Butte A.J.等人″Discovering Functional Relationships Between RNAExpression and Chemotherapeutic Susceptibility Using Relevance Networks,″Proc.Natl.Acad.Sci.USA 97,12182-12186(2000),全文以引用方式并入本文中)。甚至在這些案例中,結(jié)果也表現(xiàn)出復(fù)雜網(wǎng)絡(luò)的證據(jù)。這種自下而上方法也是目前關(guān)于藥效的專利的基礎(chǔ)(例如6218122或6222093,其全文以引用方式并入本文中)。這些專利使用體外實驗來研究途經(jīng)并預(yù)測藥物反應(yīng)。迄今為止,這種方法仍不成熟。希望有一天將有足夠的知識來建立一個輔助預(yù)測藥物反應(yīng)的模型。
該分析所有相關(guān)生物途徑的自下而上方法仍然處于其初級階段。使用這種方法建立一個預(yù)測模型還將有很長的時間。然而,本發(fā)明假定預(yù)測治療功效不需要途徑信息。
本發(fā)明將微陣列表達圖譜與臨床結(jié)果直接關(guān)聯(lián)。通常,對于密切相關(guān)的因果事件,人們期望可以建立一個統(tǒng)計模型使這兩種因素相關(guān)。然而這卻不適用于現(xiàn)在的情形,因為在基因表達與治療結(jié)果之間有很多步驟。另外,一種人體臨床治療反應(yīng)是基于很多其它因素的。因此,這種自下而上方法的成功就是本發(fā)明的一個主要觀念。
B選擇患者形成預(yù)測模型在一種典型的自下而上方法中,詳細信息(例如途徑)提供建立一個用于藥效預(yù)測模型的基礎(chǔ)。在一種自上而下方法中,這個信息可能并不存在。本發(fā)明以采取患者樣本為基礎(chǔ)來形成一個統(tǒng)計模型。假定不管在基因表達與臨床治療結(jié)果之間的復(fù)雜聯(lián)系,在不同臨床群體的患者之間存在足夠的表達譜分離以提供一個預(yù)測模型。理論上,患者的基因譜分布會非常復(fù)雜。需要使用正確的分析工具來正確地分離一個患者群體。圖2是一個關(guān)于這種分離概念的簡化實例。實際分布可不同于所示曲線。
在圖2中,患者在治療后顯示兩種不同的臨床結(jié)果。每條曲線圍起一群具有相似結(jié)果的患者。該分布的分離就使得能夠預(yù)測各種臨床結(jié)果。
V生物學(xué)圖譜A使用患者的非靶點組織進行預(yù)測預(yù)測一名個體患者治療反應(yīng)的主要困難是創(chuàng)造一個真實的人體環(huán)境。我們認為患者組織是該患者內(nèi)部系統(tǒng)的最好記錄器,而且該組織的一個完整基因組(或蛋白質(zhì)組)表達可以代表他/她的真實體內(nèi)狀態(tài)。
在一些自下而上研究中,在一個體外或者體內(nèi)實驗中使用患者組織。在這些實驗中,該等組織對一個不同于患者原始內(nèi)部環(huán)境的模擬環(huán)境應(yīng)答。本發(fā)明不以患者組織作為這些實驗的對象。作為代替,生物學(xué)圖譜(例如基因表達結(jié)果)代表原始體內(nèi)狀態(tài)。這是使用自下而上方法的一個優(yōu)點。
在本發(fā)明的自下而上方法中,仍然需要決定使用何種組織。一個選擇是使用作為治療靶點的組織;即如果想要治療初生組織就選擇初生組織,如果治療靶點是轉(zhuǎn)移性病灶就選擇轉(zhuǎn)移性腫瘤。然而,靶點組織可能無法利用。即使靶點組織是可用的,也可能不希望使用它。舉例而言,即使可以用一個轉(zhuǎn)移性病灶的樣本,在相同患者中可以存在轉(zhuǎn)移性腫瘤的若干變異。所以并不總是能獲得必需的組織。
初生組織往往不可利用。例如,眾所周知原發(fā)性腫瘤細胞經(jīng)歷許多突變步驟而變得具有轉(zhuǎn)移性,產(chǎn)生非常不同的細胞圖譜。然而,根據(jù)本發(fā)明可以成功地使用非靶點組織(例如初生組織、粒層細胞)來預(yù)測靶點組織(例如轉(zhuǎn)移性腫瘤、卵巢)對治療的響應(yīng)。
B總RNA和cDNA可以用各種類型生物學(xué)圖譜信息中的一種或一種以上來實施本發(fā)明,該信息無限制性地包括遺傳譜信息、RNA譜信息、DNA譜信息和蛋白質(zhì)譜信息。
可以用從含有混合細胞群的組織樣本中采集的RNA及/或DNA譜信息實施本發(fā)明。通常優(yōu)選純的癌細胞群,但是測試結(jié)果顯示對于治療預(yù)測而言不需要均質(zhì)組織樣本。
組織選擇部分基于所選微陣列技術(shù)而定。盡管如出版論文中所述,微陣列已經(jīng)得到成功應(yīng)用,但是探針的設(shè)計和處理仍需要改進。本發(fā)明使用經(jīng)典的cDNA基微陣列測試以證明其預(yù)測治療反應(yīng)的能力。未來微陣列處理的改進將進一步增強本發(fā)明的預(yù)測能力。
C預(yù)測長期治療后結(jié)果通常藥物反應(yīng)的研究是針對治療后的即時結(jié)果。然而,在疾病的臨床治療中長期功效是另一個重要因素。在一些情況下,一名對一種治療完全響應(yīng)的癌癥患者會在一段時期(例如兩年)后復(fù)發(fā)。一種可以精確預(yù)測治療后復(fù)發(fā)的方法將可能提供更及時的干涉。
由于癌細胞持續(xù)改變,在一段延遲(例如高達和超過2年)之后積累性改變會相當大。這種情況會通過使用原發(fā)性腫瘤組織來預(yù)測轉(zhuǎn)移性腫瘤的長期治療反應(yīng)而復(fù)雜化。本發(fā)明可以成功地預(yù)測一種長期反應(yīng)。
VI進行判別分析以建立預(yù)測模型本發(fā)明使用判別分析來建立用于預(yù)測一名患者治療結(jié)果的模型。例如,本發(fā)明可以結(jié)合DNA微陣列處理與判別分析來建立用于每名患者獨立治療結(jié)果的模型。
本發(fā)明使用一類稱為“判別分析”或者“監(jiān)督聚類(supervised clustering)”(常用于模式識別領(lǐng)域)的數(shù)據(jù)分析方法學(xué)來分析生物學(xué)圖譜。判別分析方法的實例是線性判別法、最大相似法、K最近鄰法、神經(jīng)網(wǎng)絡(luò)和隱式馬可夫法(Hidden Markov Method)。這類方法不同于在現(xiàn)今微陣列數(shù)據(jù)分析中常用的無監(jiān)督聚類法,如層次聚類法、K均值聚類法和自組織映射圖(SOM)。
無監(jiān)督聚類分析是一種單輸入(基因表達)和單輸出(分組樣本或基因)方法。由于不需要附加輸入/信息指導(dǎo)分組過程,所以由使用者去選擇執(zhí)行細節(jié)(例如距離量度)、判斷結(jié)果正確性和揭示其意義。本方法最適用于“新類別發(fā)現(xiàn)”。
無監(jiān)督方法是一種單步法,而判別分析/監(jiān)督聚類是一種由訓(xùn)練和測試組成的兩步法。訓(xùn)練步驟需要兩個輸入(例如基因表達和臨床結(jié)果)并且在分析所述兩個輸入之間關(guān)系的基礎(chǔ)上產(chǎn)生一個輸出結(jié)果。臨床結(jié)果的附加輸入支配分析過程。從臨床觀察了解患者之間的分組信息。因此,訓(xùn)練的目的并非是如無監(jiān)督聚類中一樣將患者分組,而是解決如何通過基因表達分離群組的問題。然后使用從訓(xùn)練獲得的知識建立一個用于“類別預(yù)測“的模型。在測試步驟中,把來自其他患者未用于訓(xùn)練過程的信息用于測試該模型的性能并確定其準確度。
VII可選性執(zhí)行細節(jié)、實例和測試結(jié)果藥效取決于許多因素,例如在治療中所用藥物的藥效學(xué)和藥代動力學(xué)。由于這些多種考慮因素,本文提供的實例被設(shè)計成是對于不同疾病使用不同治療方法測試各種狀況。本文的實例證明預(yù)測不同臨床觀察的能力短期治療、長期治療和不同治療方式(例如放射療法、化學(xué)療法和體外授精)。短期反應(yīng)的一個實例性測試是預(yù)測在治療周期結(jié)束之后的即時化學(xué)療法反應(yīng)。長期反應(yīng)的一個實例性測試是預(yù)測對化學(xué)療法成功、完全反應(yīng)之后的復(fù)發(fā)。也可以用更困難的組合藥物療法代替較簡單單一藥物療法來說明本發(fā)明。下列實例的目的是為各種案例建立一個普遍成功的方法。
A方法由微陣列繪制圖譜由DNA微陣列繪制表達譜始終在改進。(參見Heller MJ.″DNAmicroarray technologydevices,systems,and applications,″Annu.Rev.Biomed.Eng.4129-153(2002);Chicurel,M.E.,和Dalma-Weiszhausz,D.D.,″Microarrays in pharmacogenomics-advances and future promise,″Pharmacogenomics,3589-601(2002);全部以引用的方式并入本文中)。但是為了證明本發(fā)明,使用了一種cDNA微陣列。未來更先進的微陣列技術(shù)對于使用本發(fā)明可以產(chǎn)生更好的表現(xiàn)。
使用印制在尼龍濾膜上的cDNA微陣列。將RNA樣本反轉(zhuǎn)錄并且使用[33P]加以標記。本方法使用印制在尼龍膜上的微陣列的再現(xiàn)性類似于北方雜交實驗。
1.微陣列使用來自GeneMachines的OmniGrid高通量陣列點樣儀(arrayer)產(chǎn)生實例微陣列。這些印制在3×8尼龍膜上的陣列含有大約11000個DNA元件,該等DNA元件對應(yīng)于GenBank數(shù)據(jù)庫中基本上所有的功能已知的人類轉(zhuǎn)錄物(約7000)和一些匿名EST(>3000)。
2.RNA提取為此實驗,從由至少50%癌細胞組成的腫瘤組織中分離出總RNA。在一些情況下,由醫(yī)院癌癥中心提取RNA,把它懸浮于乙醇中,并通過快遞郵件運送到測試中心以供分析。另外,將冷凍的組織包裝放在干冰里面。為了更有效地研磨該冷凍組織,使用配有一個載彈簧活塞和一個不銹鋼支架的定制釘槍300(圖3)。用這個程序按常規(guī)回收了相對高產(chǎn)量和良好質(zhì)量的RNA。
使用標準化方案處理這些樣本以保證在實驗條件波動最小。使用購自Qiagen的RNeasy試劑盒分離出RNA。用勻漿器(杜恩斯(Dounce)勻漿器)把大約5mg的研磨組織在RNA提取試劑中勻化。隨后使用Rneasy試劑盒的迷你柱純化來自勻漿組織樣本的RNA。通過凝膠電泳檢查分離RNA的完整性來檢驗用購自SyberGold的分子探針染色的18S和28S核糖體RNA的質(zhì)量(圖4)。通過熒光成像儀掃描檢測了染色RNA。SyberGold的高靈敏度使得能夠使用僅1ng總RNA來確認分離RNA的質(zhì)量,這在RNA樣本量有限的時候是很有利的。
3.cDNA探針標記通過使用Superscript II逆轉(zhuǎn)錄酶(Gibco/BRL)的寡聚dT引導(dǎo)的聚合反應(yīng)從分離總RNA用33P-dCTP合成cDNA探針。一個使用33P-dCTP的典型標記反應(yīng)顯示于表1中。
表1.使用33P-dCTP的標記反應(yīng)實例。
4.陣列雜交和圖像處理將33P-dCTP標記探針與濾膜陣列雜交過夜。隨后用2X SSC/0.2%SDS(50℃下清洗20分鐘)進行兩次清洗并用0.5X SSC/1%SDS(65℃下清洗15分鐘)進行一次清洗。將清洗過的濾膜暴露于一臺熒光成像屏上24小時并且隨后在一臺購自Molecular Dynamics的Typhoon熒光成像儀上進行掃描(圖5)。
使用Imagene(Biodiscovery)處理這些掃描圖像來提取每個單點密度。以表格式(tab delimited)文件輸出這些值,把它們用于判別/監(jiān)督聚類分析中。
在圖5中,一個10K人類濾膜陣列與用5μg從子宮頸癌組織分離的總RNA標記的探針雜交。清洗該濾膜陣列并暴露于一臺熒光成像屏上然后用熒光成像儀掃描。
B使用判別分析進行數(shù)據(jù)分析微陣列數(shù)據(jù)分析屬于兩種類型數(shù)據(jù)分類的一種。在第一類中,任務(wù)的目的是探索數(shù)據(jù)中聚類或者類別的存在。然后用所得分組信息執(zhí)行其它詳細分析。在第二類中,類別信息已知;目的是了解類別之間的差異,隨后使用所述知識建立一個模型。該模型可以用于將一個未知類別中的數(shù)據(jù)分類。所述第一類叫做無監(jiān)督學(xué)習(xí)/聚類或者簡單聚類。后者是一種監(jiān)督學(xué)習(xí)/聚類,在文獻中也稱作判別分析或者模式識別。
監(jiān)督學(xué)習(xí)認為存在某人(監(jiān)督者)可以將數(shù)據(jù)正確分類。建立預(yù)測模型所需的知識可以直接由監(jiān)督者提供或通過對數(shù)據(jù)的統(tǒng)計推理來了解。我們的數(shù)據(jù)分析通過統(tǒng)計推理派生出這種知識而且我們的監(jiān)督者是臨床醫(yī)師,他們將患者治療后的反應(yīng)進行分類但是不知道如何區(qū)分這些不同類別。這個監(jiān)督者的分類和來自患者腫瘤的微陣列表達譜是用于我們分析的兩組輸入數(shù)據(jù)。
所述監(jiān)督學(xué)習(xí)方法具有三種基本方式線性判別分析、概率密度估算和決策樹/規(guī)則基礎(chǔ)方法。決策樹或者規(guī)則基礎(chǔ)方法在一些現(xiàn)象數(shù)據(jù)分析中已經(jīng)顯示出是成功的(參見MALIN,B.A.,SWEENEY,L.A.,″Inferring genotypefrom clinical phenotype through a knowledge based algorithm,″PacificSymposium on Biocomputing 2002(2000),全文以引用的方式并入本文中),但是并非適于本文中描述的數(shù)據(jù)分析。因此這項研究將使用前兩種方法。線性判別的實例包括經(jīng)典費舍氏線性判別分析、邏輯判別、二次判別、支持向量機(Brown,M.P.S.等人″Knowledge based Analysis of Microarray GeneExpression Data by Using Support Vector Machines,″Proc.Natl.Acad.Sci.USA 97,262-267(2000),全文以引用的方法并入本文中)和感知網(wǎng)絡(luò)。概率估算方法的實例包括K最近鄰法、樸素貝葉斯和多重層次神經(jīng)網(wǎng)絡(luò)(即非感知器網(wǎng)絡(luò))。
在選擇分類方法中,除非問題已經(jīng)得到很好的研究或者底層結(jié)構(gòu)已知,否則通常需要嘗試盡可能多的不同方法和途徑。假設(shè)每一個數(shù)據(jù)集含有不同組的隱藏結(jié)構(gòu)。最好不預(yù)測每一種方法的性能直到已經(jīng)廣泛研究了許多數(shù)據(jù)集。
1.費舍線性判別分析費舍線性判別分析(FLDA)是一種將最小平方距離用于分類的經(jīng)驗方法。其目標是在特征空間中選出一個最優(yōu)超平面來分離已知類別。
在該實例中,目標是將組織分為兩種類別(即敏感性和抗性)。該特征空間由在微陣列中使用的基因來定義。每個組織樣本在這個空間中是一個點。FLDA分類法在這個特征空間中找到一條優(yōu)化線來分離所述兩種類別。這條優(yōu)化線具有如下特性如果所有組織點都投影在這條線上,那么兩組組織(敏感性對抗性)將得到最大程度的分離。
可以證明,尋找這條優(yōu)化線類似于尋找在組內(nèi)散布與組間散布之間的最優(yōu)比率。
對于每個組織樣本,存在一個基因表達向量X;投影向量P投影X到該特征空間內(nèi)的一條線上而得到標量值Y。
Y=PTX讓組1內(nèi)的組織具有基因表達向量X1。它們具有平均值x1,而且組1內(nèi)投影值(即Y1)之間的方差是S12。相似地,組2中的組織具有基因表達向量x2,平均值為X2且方差為S22。所以FLDA用一個目標函數(shù)J(P)將所有基因向量投影到一條線上并且找到在所有可能投影P中J(P)的最大值。
J(P)=|PTX-1+PTX-2|/(S12+S22)]]>分子是組1與組2之間分開的距離,而分母是這兩組的方差。用方差對間隔標準化/重設(shè)比例,所以可以在不同投影向量P之間比較J(P)。
上述方程還可以寫成J(P)=PTSBP/PTSWP其中SB是組間散布矩陣,而Sw是組內(nèi)散布矩陣;SB=(x1-x2)(x1-x2)TSW=Σ1(X1-X-1)(X1-X-1)T+Σ2(X2-X-2)(X2-X-2)T]]>J(P)的最優(yōu)值可以由解決矩陣SW-1SB的本征值問題來確定。
FLDA一半用于單模高斯分布時執(zhí)行良好。對于其它種類的分布,F(xiàn)LDA可能不能有效執(zhí)行。由于我們不知道基因值的概率分布而且每一種治療的反應(yīng)來源于非常不同的概率分布,F(xiàn)LDA的執(zhí)行難以預(yù)測。
2.K最近鄰法K最近鄰(KNN)規(guī)則是一個沒有先前分布知識的簡單非參數(shù)分類器。傳統(tǒng)上,KNN確定使用下列三個步驟對于一個未知的樣本x,從所有訓(xùn)練向量中確定k個最小近鄰。
在這些k個樣本之外,識別屬于每一類/組的樣本數(shù)量。
將x分配到具有在第一步中識別的k個最小近鄰樣本數(shù)量最大的類別。
這種方法可能遭遇到一種情況,即存在不止一個具有相同最大KNN樣本數(shù)的類別。因而需要一種沖突解決方法。
為了避免所述沖突解決方法,上述多數(shù)票運算法則已經(jīng)被修改,而且對于這項數(shù)據(jù)分析將稱之為KNN平均距離比較運算法則。此處是修改的KNN步驟
對一個測試向量x,找到每個訓(xùn)練類/組i的KNN。
對于每個類/組,添加從x至KNN的距離。
Di=Σj∈KNNdistxj]]>其中distxj是向量x與樣本向量j之間的距離。
把x分配至具有所有可能的D1中最小相加距離的組mDm=min{D1}從上述程序來看明顯KNN的執(zhí)行極大地取決于距離定義。許多不同種類的距離測量法都可以用。最常見的選擇是歐幾里德距離和基因向量的相關(guān)性系數(shù)。在我們目前的研究中,使用基于相關(guān)性系數(shù)的距離。
對于兩個基因向量X1和X2,它們之間的距離由下式定義Dist12=1-Σ(X1-X-1)(X2-X-2)/(Σ(X1-X-1)2Σ(X2-X-2)2)]]>其中∑是該等基因值的總和。
FLDA與KNN之間的比較顯示,F(xiàn)LDA一般善于發(fā)現(xiàn)組1與組2之間的總體差異,而KNN一般善于估算局部概率密度。這兩種方法的結(jié)果提供本發(fā)明的基本性能。
C.實例本發(fā)明建立預(yù)測治療反應(yīng)的通用程序。在具有不同治療方案和目標(例如短期反應(yīng)、長期復(fù)發(fā))的不同疾病分析中用幾種方法進行最優(yōu)化。已經(jīng)對這些研究進行過選擇以保證具有不同隱藏結(jié)構(gòu)的不同數(shù)據(jù)集的覆蓋率。在一種情況下給出最好性能的特殊判別方法對于另一種情況可能并非同樣良好。本發(fā)明并非太多關(guān)注于針對一個特殊數(shù)據(jù)集來確定最佳方法,而更多地關(guān)注于證明在治療預(yù)測中判別分析的成功應(yīng)用。為了測試不同的方法,使用一種線性判別分析的代表性方法和概率估算方法的另一種代表性方法分別是費舍線性判別分析(FLDA)和K最近鄰法(KNN)。
從幾個不同的患者群組獲得表達譜并且隨后使微陣列表達數(shù)據(jù)與臨床治療反應(yīng)相互關(guān)聯(lián)。在每一項研究中,把可用的微陣列數(shù)據(jù)隨機地分為訓(xùn)練樣本和測試樣本。該等訓(xùn)練樣本用于建立可能的預(yù)測模型。隨后使用剩下的測試樣本測試每個模型的性能。將最佳性能模型選作最終結(jié)果。
在訓(xùn)練期內(nèi),訓(xùn)練組數(shù)據(jù)及其臨床分組信息(例如抗性對敏感性)是判別分析的輸入值。檢測不同臨床群組的基因表達來開發(fā)一個將它們進行最佳區(qū)分的模型。然后用從訓(xùn)練獲得的知識建立一個用于進一步“類別預(yù)測“的模型。用該等測試樣本驗證該模型的正確性和選擇最佳性能模型。
通常該模型的預(yù)測性能取決于如何將數(shù)據(jù)分為訓(xùn)練和測試樣本的最初選擇。這在小型數(shù)據(jù)集中更經(jīng)常出現(xiàn)。為避免這種偏倚,將分離過程多次隨機化。每一次將所有患者的微陣列數(shù)據(jù)隨機重分離為訓(xùn)練集和測試集,而且重復(fù)整個訓(xùn)練和測試過程。通過將所有這些重復(fù)的性能平均來確定最終預(yù)測模型的準確度。結(jié)果報導(dǎo)如下。
用四個數(shù)據(jù)集來測試本發(fā)明結(jié)腸直腸、卵巢和子宮頸癌以及體外授精。使用判別分析法分析微陣列數(shù)據(jù)來預(yù)測案例中的治療結(jié)果。
1.預(yù)測放射療法對子宮頸癌的功效第一項研究檢測了子宮頸癌患者的表達譜。從子宮頸癌患者中收集了二十六個大體解剖的原發(fā)性腫瘤?;颊叩奶卣魇居诒?中。將十三名患者給予放射療法作為對子宮頸癌的初期治療。對他們進行挑選以用于我們的分析并且根據(jù)24個月之后的治療結(jié)果按照以下臨床結(jié)果中的記錄分為兩組盡管接受治療但仍死于該疾病(DOD)的患者和從治療結(jié)束后仍存活沒有疾病跡象(NED)的患者。RT抗性組具有平均20.6個月的存活時間,而RT敏感組具有64.1個月的平均存活時間。當進行本研究時,放射療法抗性組中的所有患者已經(jīng)死于該疾病,而放射療法敏感組中的患者都仍然存活。
表2.患者的數(shù)據(jù)(n=26名患者)
表3.在分析時患者的存活時間使用判別分析法分析這13名患者。在預(yù)測模型中使用的前50個基因顯示于圖6中,圖6正確區(qū)分出放射療法敏感性或放射療法抗性的治療結(jié)果。在圖6中,用一個群集圖展示可以用于放射抗性組和放射敏感組分類的最重要基因所得出的結(jié)果。表中顯示了這兩組患者在放射治療后的平均存活時間(月)。
一名在治療兩年后“無疾病跡象”的患者被定義為反應(yīng)性的,而兩年內(nèi)癌癥的任何復(fù)發(fā)都定義為抗性的。在訓(xùn)練過程中,一名反應(yīng)性患者和一名抗性患者被隨機保留為測試樣本。用其他11個樣本建立該模型。為了測試該模型是否能夠預(yù)測治療反應(yīng),使用經(jīng)過校準的模型去預(yù)測2個保留測試樣本的結(jié)果。這種測試樣本選擇、數(shù)據(jù)分析和測試重復(fù)100次。平均隨機化預(yù)測準確度是97%。
在該模型中一些基因代表寬范圍的細胞功能(表4),包括具有轉(zhuǎn)錄、細胞粘附和信號傳導(dǎo)功能的基因。
表4.在對放射療法應(yīng)答(敏感)或者無應(yīng)答(抗性)的患者之間區(qū)別表達的基因。
2.結(jié)腸直腸癌我們的第二項研究中分析了結(jié)腸直腸癌的治療。目標是預(yù)測即時化療反應(yīng)(即在治療后立即評估化療反應(yīng))。這項研究中的治療方案是每兩周給予一次5FU、亞葉酸與CPT11(伊立替康)的組合。每4個周期由CT掃描和CEA值變化來評估反應(yīng)。在該研究中包括10個患者樣本。用CT結(jié)果將患者分為反應(yīng)性組和抗性組。三名部分反應(yīng)患者分配到反應(yīng)性組而兩名進行性患者分配到抗性組。由CT掃描確定的5名疾病穩(wěn)定狀態(tài)患者又基于在治療過程中CEA水平的變化分成敏感組和抗性組。所有CEA水平有50%縮減率的患者都分配至敏感組,而剩余患者分配至抗性組。由于在我們的分析中包括具有疾病穩(wěn)定狀態(tài)的患者,這兩組之間的差異遠遠小于沒有他們所形成的兩組間差異。由于是預(yù)測組合藥物療法,因此有可能存在比單一藥物治療分析中更多支配藥物功效的因素。但是,我們發(fā)現(xiàn)這項測試的預(yù)測精確性大約為83%。
3.卵巢癌第三項研究是卵巢癌治療。許多患者經(jīng)歷了偕同兩側(cè)卵巢輸卵管切除術(shù)、子宮切除術(shù)和橫結(jié)腸網(wǎng)膜切除術(shù)及最大腫瘤切除術(shù)進行的剖腹探查術(shù)作為部分對患者卵巢癌的治療。所有患者隨后受到手術(shù)后以鉑為基礎(chǔ)的化學(xué)療法治療(即順鉑或卡鉑加上環(huán)磷酰胺或紫杉醇)。治療后某些患者立即處于一種“檢測不到疾病”的狀態(tài)。在29個卵巢癌樣本之外,8個III/IV期的病例已經(jīng)用上述藥物治療過并且在治療后處于“檢測不到疾病”的狀態(tài)。在治療結(jié)束兩年后這些患者中有四例保持無病(無疾病跡象),而四例已經(jīng)經(jīng)歷了臨床復(fù)發(fā)。我們的目標是將微陣列數(shù)據(jù)與復(fù)發(fā)相連接。由于在這項測試中使用的微陣列數(shù)據(jù)是采自初期手術(shù),所以在組織采集時間和臨床結(jié)果之間存在非常長的延遲?;虮磉_與結(jié)果之間的聯(lián)系是非常復(fù)雜的,不過這項測試的預(yù)測精確度估計大約在94%。
最終,一些卵巢癌患者在以鉑為基礎(chǔ)治療復(fù)發(fā)之后使用以拓撲異構(gòu)酶1抑制劑為基礎(chǔ)的化療藥物(例如伊立替康或拓撲替康(Topotecan))作為二線治療。使用結(jié)腸直腸癌患者數(shù)據(jù)建構(gòu)的預(yù)測模型能夠正確預(yù)測卵巢癌患者的反應(yīng)。這個結(jié)果表明我們用一種癌癥生成的模型可以用于預(yù)測另一種癌癥的反應(yīng)。
4.體外授精本發(fā)明也對除了癌癥之外的其它醫(yī)療狀況進行了測試。在這種情況下,此項研究是指導(dǎo)體外授精(IVF)程序。在這項研究中包括9名卵巢儲量(ovarian reserve)正常和9名卵巢儲量下降的共十八名婦女。在IVF準備期間用在卵泡抽吸時分離的粒層細胞給予所有的患者促性腺激素刺激。從婦女體內(nèi)分離的黃素化粒層細胞的基因表達和關(guān)于她們正?;蛳陆档穆殉矁α啃畔⒌呐R床信息是判別分析的輸入數(shù)據(jù)。所得模型從一名患者的粒層細胞基因表達對她的卵巢儲量給出了完美的預(yù)測。
以上所給出的實例包括短期化學(xué)療法反應(yīng)預(yù)測、長期化學(xué)療法反應(yīng)預(yù)測以及對于其它治療方式(例如放射療法、體外授精)反應(yīng)的預(yù)測。總的來說,所述結(jié)果證明了預(yù)測不同疾病反應(yīng)的能力。所述結(jié)果還證明通過DNA微陣列和判別計算分析使用表達譜預(yù)測治療反應(yīng)的能力。這些結(jié)果意味著組織表達譜展示抗性模式的患者應(yīng)該給予可能產(chǎn)生改良反應(yīng)或治愈的替代性治療方式,從而根據(jù)個體的基因表達模式將其療法個人化。
D樣本規(guī)模在微陣列數(shù)據(jù)分析中,實驗中包括的一個生物學(xué)圖譜樣本(如基因)中的數(shù)據(jù)點數(shù)目經(jīng)常遠大于樣本規(guī)模。理論上,由于在一個生物學(xué)圖譜樣本、例如基因中有大量數(shù)據(jù)點,少量樣本可偶然與基因表達吻合。處理這一問題保證這些研究結(jié)果不是隨機的。
這項研究使用監(jiān)督判別分析。主要目標是將表達譜與所觀察臨床結(jié)果擬合。一個正確執(zhí)行的臨床數(shù)據(jù)分析應(yīng)該從觀察到的臨床差異中發(fā)現(xiàn)真正的遺傳學(xué)原因。隨機化數(shù)據(jù)的分析不會發(fā)現(xiàn)任何真正的“原因”。
為測試分析的有效性,將分析所得結(jié)果與隨機化數(shù)據(jù)集進行比較。為了創(chuàng)建隨機化數(shù)據(jù),將每位患者的樣本任意分配到不同群組(即通過混合陽性和陰性樣本人工創(chuàng)建新的群組)中。
在這項研究中,這些人工創(chuàng)建的群組在每一個群組中具有大概相等數(shù)目的真實陽性和陰性樣本。然后將這些群組進行判別分析來創(chuàng)建將各群組互相區(qū)別開來的模型。將所得的這些人工數(shù)據(jù)模型的準確度與真實數(shù)據(jù)的性能比較。由于存在多種創(chuàng)建這些中性(即相等數(shù)目的陽性和陰性成員)人工群組的方式,所以重復(fù)多次(>30)地創(chuàng)建和分析這些數(shù)據(jù)來評估這些隨機結(jié)果的性能。表5總結(jié)所述結(jié)果。
表5預(yù)測準確度(%)在表5中報導(dǎo)了基于臨床觀察結(jié)果的數(shù)據(jù)分析和隨機分群的數(shù)據(jù)分析兩者兩種不同的結(jié)果自包括和自排除。自包括結(jié)果在分析過程中包括測試樣本;自排除結(jié)果不包括測試樣本。自排除分析通常是報導(dǎo)結(jié)果。比較這兩種結(jié)果確證該分析的有效性。對于隨機化數(shù)據(jù),自包括預(yù)測準確度非常良好;但是自排除準確度差得多;即自包括預(yù)測中的良好結(jié)果在嘗試預(yù)測未知樣本時失敗。這表明分組不含有真實信息。這正是對人工創(chuàng)建的中性群組所估計的情況。另一方面,自包括和自排除結(jié)果對于真實臨床數(shù)據(jù)十分接近。這表明來自真實數(shù)據(jù)的模型提取的是臨床差異的真實遺傳原因。因此,如自排除準確度的高準確度所示,這一模型可以預(yù)測新的樣本。
第二個有效性指標(indictor)是將真實臨床數(shù)據(jù)的自排除準確度與隨機化數(shù)據(jù)比較。這項研究中報導(dǎo)的真實臨床數(shù)據(jù)結(jié)果優(yōu)于隨機化結(jié)果約2個標準偏差(意即它們相差1.8SD、4.5SD和2.3SD)。這表示以臨床數(shù)據(jù)為基礎(chǔ)的結(jié)果不是偶然出現(xiàn)的。這進一步支持了所報導(dǎo)結(jié)果的有效性。
VIII計算機執(zhí)行可以在能夠進行本文所述功能性的一種或一種以上計算機系統(tǒng)中執(zhí)行本發(fā)明。例如(且不限于)在一種計算機系統(tǒng)中可以執(zhí)行模型生成過程102(圖1)及/或治療結(jié)果預(yù)測過程104(圖1)或其部分。更具體來說,在一種計算機系統(tǒng)中可以執(zhí)行判別分析程序(圖1中步驟114)、所得模型136及/或治療預(yù)測程序(圖1中步驟120)或其部分。
圖7說明一個實例計算機系統(tǒng)700。依據(jù)這個實例計算機系統(tǒng)700描述了各種軟件實施例。在閱讀了本說明文之后,相關(guān)領(lǐng)域技術(shù)人員將很清楚如何使用其它計算機系統(tǒng)及/或計算機體系結(jié)構(gòu)來執(zhí)行本發(fā)明。
該實例計算機系統(tǒng)700包括一個或一個以上處理器704。處理器704與一個通訊基礎(chǔ)設(shè)施702相連接。
計算機系統(tǒng)700也包括一個主存儲器708,優(yōu)選的是隨機存取存儲器(RAM)。
計算機系統(tǒng)700也可以包括一個輔助存儲器710,所述輔助存儲器可以包括(例如)一個硬盤驅(qū)動器712及/或一個移動存儲驅(qū)動器714,該移動存儲驅(qū)動器可以是軟盤驅(qū)動器、磁帶驅(qū)動器、光盤驅(qū)動器等。移動存儲驅(qū)動器714以一熟知的方式讀取及/或?qū)懭胍粋€移動存儲單元718。移動存儲單元718代表軟盤、磁帶、光盤等,它由移動存儲驅(qū)動器714讀取和寫入。移動存儲單元718包括一個其中存儲有計算機軟件及/或數(shù)據(jù)的計算機可用存儲媒體。
在其它實施例中,輔助存儲器710可以包括其它可以使計算機程序或其它指令輸入到計算機系統(tǒng)700中的裝置。所述裝置可以包括(例如)移動存儲單元722和接口720。所述裝置實例可以包括程序卡(program cartridge)和程序卡接口(如那些電視游戲機中的裝置)、移動記憶芯片(如EPROM或PROM)和相關(guān)插口和其它的移動存儲單元722及允許將軟件和數(shù)據(jù)從移動存儲單元722轉(zhuǎn)移到計算機系統(tǒng)700的接口720。
計算機系統(tǒng)700也可以包括一個通訊接口724,它允許軟件和數(shù)據(jù)在計算機系統(tǒng)700與外部設(shè)備之間轉(zhuǎn)移。通訊接口724的實例包括但不限于調(diào)制解調(diào)器、網(wǎng)絡(luò)接口(如以太網(wǎng)卡)、通訊端口、PCMCIA插槽和卡等。通過通訊接口724轉(zhuǎn)移的軟件和數(shù)據(jù)是以信號728的形式,它們可以是能夠被通訊接口724接收的電子、電磁、光學(xué)或者其它信號。這些信號728通過信號路徑726提供到通訊接口724。信號路徑726攜帶信號728而且可以使用電線或電纜、光纖、電話線、蜂窩式電話連接、RF連接和其它通訊通道加以實現(xiàn)。
在這份文件中,術(shù)語“計算機程序媒體”和“計算機可用媒體”用以表示移動存儲單位718、安裝在硬盤驅(qū)動器712中的硬盤和信號728。這些計算機程序產(chǎn)品是為計算機系統(tǒng)700提供軟件的工具。
計算機程序(也稱為計算機控制邏輯)存儲于主存儲器708及/或輔助存儲器710中。計算機程序也可通過通訊接口724接收。這些計算機程序被執(zhí)行時能夠讓計算機系統(tǒng)700實現(xiàn)如本文中討論的本發(fā)明特征。特別是,這些計算機程序被執(zhí)行時能夠讓處理器704實現(xiàn)本發(fā)明的特征。因此,這些計算機程序代表該計算機系統(tǒng)700的控制器。
在一個使用軟件執(zhí)行本發(fā)明的實施例中,該軟件可以存儲于一個計算機程序產(chǎn)品中并且輸入到使用移動存儲驅(qū)動器714、硬盤驅(qū)動器712或通訊接口724的計算機系統(tǒng)700中。該控制邏輯(軟件)由所述處理器704執(zhí)行時使得處理器704實行如本文所描述的本發(fā)明功能。
在另一個實施例中,主要是使用(例如)如專用集成電路(ASIC)的硬件部件在硬件中執(zhí)行本發(fā)明。相關(guān)領(lǐng)域技術(shù)人員將很容易了解硬件狀態(tài)機的實行以實施本文所述的功能。
在另一個實施例中,使用硬件與軟件兩者的組合來實現(xiàn)本發(fā)明。
例如而不限于,在一次計算機執(zhí)行中向計算機系統(tǒng)700中提供治療結(jié)果130和生物學(xué)圖譜數(shù)據(jù)134,隨后所述計算機系統(tǒng)執(zhí)行進行步驟114的指令產(chǎn)生一個計算機模型136。隨后向該計算機模型136(在計算機系統(tǒng)700中或者在另一個計算機系統(tǒng)中)提供新的患者生物學(xué)圖譜數(shù)據(jù)140,所述計算機模型輸出預(yù)測結(jié)果142。
IX總結(jié)本發(fā)明已經(jīng)借助于說明其特定功能操作和關(guān)系的功能結(jié)構(gòu)單元描述于上文中。為描述方便起見,這些功能結(jié)構(gòu)單元的界限已經(jīng)在本文中獨立加以限定??梢韵薅ㄌ娲越缦蓿灰涮囟üδ芎完P(guān)系得到適當?shù)貓?zhí)行。因而任何此等替代性界限都位于所主張的發(fā)明范圍和精神之內(nèi)。所屬領(lǐng)域技術(shù)人員應(yīng)認識到這些功能結(jié)構(gòu)單元可以由分立部件、專用集成電路、執(zhí)行合適軟件的處理器及其類似物和其組合來實現(xiàn)。
雖然上文已經(jīng)描述了本發(fā)明的不同實施例,但是應(yīng)了解它們僅僅是以實例的方式提出而非具有限制性。因此,本發(fā)明的廣度和范圍不應(yīng)受到任何上述例示性實施例限制,但是僅應(yīng)根據(jù)所附的權(quán)利要求及其等效物進行界定。
權(quán)利要求
1.一種預(yù)測一醫(yī)療狀況的醫(yī)學(xué)治療結(jié)果的方法,其包含(1)從具有所述醫(yī)療狀況并接受治療的患者取得生物學(xué)圖譜信息;(2)取得關(guān)于具有所述醫(yī)療狀況并接受所述治療的患者的治療結(jié)果信息;和(3)對所述生物學(xué)圖譜信息和所述治療結(jié)果信息執(zhí)行基于判別分析的模式識別過程,從而產(chǎn)生一個使所述生物學(xué)圖譜信息與所述治療結(jié)果信息之間相關(guān)聯(lián)的模型。
2.根據(jù)權(quán)利要求1所述的方法,其進一步包含(4)將來自一名新患者的生物學(xué)圖譜信息提供給所述模型,借此所述模型輸出所述新患者的所述治療的一個預(yù)測治療結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其中所述模型以陽性或者陰性指標形式輸出預(yù)測治療結(jié)果。
4.根據(jù)權(quán)利要求2所述的方法,其中所述模型輸出一定范圍內(nèi)的預(yù)測治療結(jié)果。
5.根據(jù)權(quán)利要求1所述的方法,其進一步包含針對一種或一種以上對所述醫(yī)療狀況的其它治療重復(fù)步驟(1)到(3)。
6.根據(jù)權(quán)利要求5所述的方法,其進一步包含(4)將來自一名新患者的生物學(xué)圖譜信息提供給所述模型,借此所述模型輸出所述患者的所述治療的預(yù)測治療結(jié)果。
7.根據(jù)權(quán)利要求1所述的方法,其中所述醫(yī)療狀況是一疾病。
8.根據(jù)權(quán)利要求7所述的方法,其中所述醫(yī)療狀況是一人類疾病。
9.根據(jù)權(quán)利要求8所述的方法,其中所述醫(yī)療狀況是一癌癥。
10.根據(jù)權(quán)利要求1所述的方法,其中所述醫(yī)療狀況不是疾病。
11.根據(jù)權(quán)利要求10所述的方法,其中所述醫(yī)療狀況是一生殖力分析。
12.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含遺傳圖譜信息。
13.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含DNA圖譜信息。
14.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含RNA圖譜信息。
15.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含蛋白質(zhì)圖譜信息。
16.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含一種或一種以上下列信息遺傳圖譜信息;DNA圖譜信息;RNA圖譜信息;和蛋白質(zhì)圖譜信息。
17.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息是嵌在一個微陣列上。
18.根據(jù)權(quán)利要求17所述的方法,其中所述生物學(xué)圖譜信息是從一基因組分析中產(chǎn)生。
19.根據(jù)權(quán)利要求1所述的方法,其中關(guān)于具有所述醫(yī)療狀況的患者的信息是從一組少于100名的患者中獲得。
20.根據(jù)權(quán)利要求1所述的方法,其中關(guān)于具有所述醫(yī)療狀況的患者的信息從一組少于30名的患者中獲得。
21.根據(jù)權(quán)利要求1所述的方法,其中關(guān)于具有所述醫(yī)療狀況的患者的信息從一組少于20名的患者中獲得。
22.根據(jù)權(quán)利要求1所述的方法,其中關(guān)于具有所述醫(yī)療狀況的患者的信息從一組少于10名的患者中獲得。
23.根據(jù)權(quán)利要求1所述的方法,其中關(guān)于具有所述醫(yī)療狀況的患者的信息從一組多于100名的患者中獲得。
24.根據(jù)權(quán)利要求12所述的方法,其中所述遺傳圖譜信息包括關(guān)于大約10000個基因的遺傳信息。
25.根據(jù)權(quán)利要求12所述的方法,其中所述遺傳圖譜信息包括關(guān)于至少10個基因的遺傳信息。
26.根據(jù)權(quán)利要求12所述的方法,其中所述遺傳圖譜信息包括關(guān)于至少100個基因的遺傳信息。
27.根據(jù)權(quán)利要求12所述的方法,其中所述遺傳圖譜信息包括關(guān)于至少1000個基因的遺傳信息。
28.根據(jù)權(quán)利要求12所述的方法,其中所述遺傳圖譜信息包括關(guān)于至少1個基因的遺傳信息。
29.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含遺傳圖譜信息,并且其中步驟(2)包含將所述遺傳圖譜信息減少到說明多樣性一實質(zhì)部分的基因子集。
30.根據(jù)權(quán)利要求29所述的方法,其進一步包含將一個所述基因子集表示嵌入到一個微陣列芯片上作為所述模型的一部分。
31.根據(jù)權(quán)利要求29所述的方法,其中步驟(4)包含提供來自所述新患者的僅關(guān)于所述基因子集的遺傳圖譜信息。
32.根據(jù)權(quán)利要求30所述的方法,其中步驟(4)包含提供來自所述新患者的僅關(guān)于所述基因子集的遺傳圖譜信息。
33.根據(jù)權(quán)利要求1所述的方法,其中所述模型是在計算機程序中執(zhí)行。
34.根據(jù)權(quán)利要求1所述的方法,其中所述治療包含基于藥物的治療。
35.根據(jù)權(quán)利要求1所述的方法,其中所述治療包含非基于藥物的治療。
36.根據(jù)權(quán)利要求1所述的方法,其中所述治療包含基于藥物治療和非基于藥物治療的組合治療。
37.根據(jù)權(quán)利要求36所述的方法,其中所述治療包含化學(xué)療法治療與放射治療的組合。
38.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測一名癌癥患者的第一線治療。
39.根據(jù)權(quán)利要求36所述的方法,其進一步包含使用所述模型預(yù)測一名癌癥患者的第一線治療。
40.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測單一藥物治療的功效。
41.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測多種藥物治療的功效。
42.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測第一線單一藥物治療的功效。
43.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測第一線多種藥物治療的功效。
44.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測后線藥物治療的功效。
45.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測所述治療的短期功效。
46.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測所述治療的長期功效。
47.根據(jù)權(quán)利要求46所述的方法,其進一步包含使用所述模型預(yù)測長期抗藥性。
48.根據(jù)權(quán)利要求46所述的方法,其進一步包含使用所述模型預(yù)測復(fù)發(fā)前的時間。
49.根據(jù)權(quán)利要求1所述的方法,其進一步包含使用所述模型預(yù)測所述治療對另一種醫(yī)療狀況的功效。
50.根據(jù)權(quán)利要求49所述的方法,其中所述生物學(xué)圖譜信息和所述治療結(jié)果信息是關(guān)于結(jié)腸癌患者,所述方法進一步包含使用所述模型預(yù)測所述治療對一名卵巢癌患者的功效。
51.根據(jù)權(quán)利要求49所述的方法,其中所述生物學(xué)圖譜信息和所述治療結(jié)果信息是關(guān)于第一型腫瘤,所述方法進一步包含使用所述模型預(yù)測所述治療對與所述第一型腫瘤相關(guān)的第二型腫瘤的功效。
52.根據(jù)權(quán)利要求51所述的方法,其中所述第一型腫瘤是原發(fā)性腫瘤并且所述第二型腫瘤是轉(zhuǎn)移性腫瘤。
53.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息包含微陣列表達圖譜信息。
54.根據(jù)權(quán)利要求1所述的方法,其中所述微陣列表達圖譜數(shù)據(jù)是從一種或一種以上下列來源獲得核酸表達圖譜;蛋白質(zhì)表達圖譜;和單核苷酸多態(tài)性。
55.根據(jù)權(quán)利要求1所述的方法,其進一步包含(4)將所述模型用于個人化醫(yī)學(xué)治療的臨床診斷性、預(yù)后性和確定性治療管理工具。
56.根據(jù)權(quán)利要求1所述的方法,其進一步包含(4)將所述模型用于人類疾病標志的數(shù)據(jù)采集。
57.根據(jù)權(quán)利要求1所述的方法,其進一步包含(4)將所述模型用于鑒別人類疾病標志。
58.根據(jù)權(quán)利要求1所述的方法,其進一步包含(4)將所述模型用于分析人類疾病中相關(guān)的基因組與臨床數(shù)據(jù)的組合。
59.根據(jù)權(quán)利要求1所述的方法,其中所述治療結(jié)果信息包含醫(yī)學(xué)上可測量的特征。
60.根據(jù)權(quán)利要求1所述的方法,其中所述治療結(jié)果信息包含客觀特征。
61.根據(jù)權(quán)利要求60所述的方法,其中所述治療結(jié)果信息包含客觀短期特征。
62根據(jù)權(quán)利要求60所述的方法,其中所述治療結(jié)果信息包含客觀長期特征。
63.根據(jù)權(quán)利要求1所述的方法,其中所述治療結(jié)果信息包含副作用信息。
64.根據(jù)權(quán)利要求1所述的方法,其中所述治療結(jié)果信息包含主觀特征。
65.根據(jù)權(quán)利要求64所述的方法,其中所述治療結(jié)果信息包含生命品質(zhì)的特征。
66.根據(jù)權(quán)利要求64所述的方法,其中所述治療結(jié)果信息包含短期主觀特征。
67.根據(jù)權(quán)利要求64所述的方法,其中所述治療結(jié)果信息包含長期主觀特征。
68.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息和所述治療結(jié)果信息是從受益于所述治療的臨床試驗的患者取得。
69.根據(jù)權(quán)利要求68所述的方法,其進一步包含(4)將來自一名新患者的生物學(xué)圖譜信息提供給所述模型,借此所述模型輸出所述新患者的所述治療的預(yù)測治療結(jié)果。
70.根據(jù)權(quán)利要求68所述的方法,其進一步包含提交一申請,請求批準將所述治療用于所述模型對其輸出有利預(yù)測治療結(jié)果的新患者。
71.根據(jù)權(quán)利要求1所述的方法,其中步驟(3)包含(i)將所述生物學(xué)圖譜信息和所述治療結(jié)果信息分為一個訓(xùn)練子集和一個測試子集;(ii)對所述訓(xùn)練子集執(zhí)行所述基于判別分析的模式識別過程;和(iii)用所述測試子集測試所得模型。
72.根據(jù)權(quán)利要求1所述的方法,其中步驟(3)包含(i)將所述生物學(xué)圖譜信息和所述治療結(jié)果信息分為一個生物學(xué)圖譜信息和治療結(jié)果信息的訓(xùn)練子集與一個生物學(xué)圖譜信息和治療結(jié)果信息的測試子集;(ii)對所述生物學(xué)圖譜信息和治療結(jié)果信息的訓(xùn)練子集執(zhí)行不同的判別分析的模式識別過程,從而產(chǎn)生數(shù)個使所述生物學(xué)圖譜信息的訓(xùn)練子集與所述治療結(jié)果信息的訓(xùn)練子集之間相關(guān)聯(lián)的模型;(iii)用所述生物學(xué)圖譜信息和治療結(jié)果信息的測試子集測試所述數(shù)個模型;(iv)選擇可根據(jù)所述生物學(xué)圖譜信息的測試子集最精確地預(yù)測所述治療結(jié)果信息的測試子集的模型。
73.根據(jù)權(quán)利要求72所述的方法,其進一步包含(v)選擇生物學(xué)圖譜信息和治療結(jié)果信息的新測試子集;(vi)對所述新信息子集重復(fù)步驟(3)(ii);和(vii)將所述復(fù)數(shù)個模型每一個的結(jié)果進行平均;其中步驟(3)(iv)包含選擇所述生物學(xué)圖譜信息的測試子集最精確預(yù)測所述治療結(jié)果信息的平均值的測試子集的模型。
74.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息是從靶向組織樣本獲得。
75.根據(jù)權(quán)利要求1所述的方法,其中所述生物學(xué)圖譜信息是從非靶向組織樣本獲得。
76.根據(jù)權(quán)利要求2所述的方法,其進一步包含依據(jù)所述預(yù)測治療結(jié)果選擇一治療模式。
77.根據(jù)權(quán)利要求2所述的方法,其進一步包含依據(jù)所述預(yù)測治療結(jié)果避開一治療模式。
78.根據(jù)權(quán)利要求1所述的方法,其中步驟(3)的執(zhí)行無需生物途徑信息。
79.一種計算機程序產(chǎn)品,其包括一個計算機可用媒體,所述媒體中存儲有計算機程序邏輯以使得計算機系統(tǒng)能夠生成一個使生物學(xué)圖譜信息與治療結(jié)果信息之間相關(guān)聯(lián)的模型,其中所述計算機程序邏輯包含起動程式使所述計算機系統(tǒng)從具有所述醫(yī)療狀況并接受一治療的患者取得生物學(xué)圖譜信息的功能;起動程式使所述計算機系統(tǒng)取得關(guān)于具有所述醫(yī)療狀況并接受所述治療的患者的治療結(jié)果信息的功能;和起動程式使所述計算機系統(tǒng)對所述生物學(xué)圖譜信息和所述治療結(jié)果信息執(zhí)行基于判別分析的模式識別過程、從而生成一個使所述生物學(xué)圖譜信息與所述治療結(jié)果信息之間相關(guān)的模型的功能。
80.根據(jù)權(quán)利要求2所述的方法,其中所述生物學(xué)圖譜信息是嵌在一個微陣列中。
81.根據(jù)權(quán)利要求80所述的方法,其中所述模型和計算機程序是嵌在一個微陣列中以輸出所述預(yù)測。
全文摘要
本發(fā)明涉及根據(jù)一群患者的生物學(xué)圖譜取樣來預(yù)測一個個體治療結(jié)果的方法、系統(tǒng)和計算機程序產(chǎn)品。生物學(xué)圖譜信息采自具有一種醫(yī)療狀況并接受一種治療的患者。還取得了關(guān)于具有所述醫(yī)療狀況和接受所述治療的患者的治療結(jié)果信息。隨后對所述生物學(xué)圖譜信息和所述治療結(jié)果信息實施一種基于判別分析的模式識別過程,從而產(chǎn)生一個使所述生物學(xué)圖譜信息與所述治療結(jié)果信息之間相關(guān)聯(lián)的模型。此模型尤其可用于預(yù)測新患者接受所述治療的治療結(jié)果。
文檔編號A61KGK1764837SQ200480007995
公開日2006年4月26日 申請日期2004年2月19日 優(yōu)先權(quán)日2003年3月24日
發(fā)明者魏念之 申請人:魏念之