本發(fā)明涉及一種特別用于個(gè)人化療方案選擇的試劑盒,包括化療方案選擇的方法和反應(yīng)系統(tǒng),以及對(duì)化療方案的療效預(yù)測(cè)。
背景技術(shù):
乳腺癌是一類由多種基因突變引起的異質(zhì)性疾病(癌癥基因組圖譜網(wǎng)絡(luò),2012)。在過(guò)去,臨床病理特征和預(yù)后相關(guān)因素,包括腫瘤大小,是否累及淋巴結(jié),病理分級(jí)和患者年齡,被醫(yī)生們廣泛地運(yùn)用在選擇化療方案上,但常導(dǎo)致相當(dāng)數(shù)量的患者過(guò)度治療或治療不足?,F(xiàn)在知道患者即使病理特征相似,也可能對(duì)相同的化療方案反應(yīng)不同,雖然具體機(jī)理目前尚未清楚。最近雌激素受體(ER),上皮生長(zhǎng)因子受體2(HER2)和孕激素被證實(shí)為預(yù)后指標(biāo),所以這三者成為評(píng)估乳腺癌的常規(guī)檢查指標(biāo)。微芯片和第二代基因測(cè)序等高通量基因組技術(shù)的發(fā)展使得基于患者基因組情況的個(gè)人化癌癥治療(PCT)成為可能。(Oakman,et al.,2010,Dotan,et al.,2010,Eng-Wong,et al.,2010)由于從這些基因組技術(shù)獲得的個(gè)人基因組信息比起臨床常規(guī)參數(shù)能更準(zhǔn)確地預(yù)測(cè)患者的化療反應(yīng),因此在個(gè)人化癌癥治療中,一系列基因標(biāo)記(genetic markers)將從大量基因信息中仔細(xì)選出,結(jié)合患者臨床信息,建立一個(gè)預(yù)測(cè)治療反應(yīng)的模型?;熤行枰鰞蓚€(gè)決定:是否采用化療;以及采用哪種化療。個(gè)人化癌癥治療對(duì)做這兩步的決定都有幫助。目前已發(fā)現(xiàn)許多基因標(biāo)識(shí)可用來(lái)預(yù)測(cè)乳腺癌治療后的生存率和復(fù)發(fā)率(van de Vijver,et al.,2002,Paik,et al.,2006,Wang,et al.,2005,van’t Veer,et al.,2002,Mook,et al.,2007,Straver,et al.,2010,Buyse,et al.,2006,Foekens,et al.,2006,Look,et al.,2002,Harbeck,et al.,2013),并用于決定是否采用更積極的治療方案,比如化療。當(dāng)前檢測(cè)21個(gè)基因表達(dá)的檢測(cè)試劑盒Oncotype X已廣泛用于針對(duì)乳腺癌的預(yù)后評(píng)估(http://www.oncotypedx.com)。針對(duì)某一特定治療方案或者針對(duì)某一群患者的綜合治療的預(yù)測(cè)評(píng)估研究也已經(jīng)有報(bào)道(Hatzis,et al.,2011,Graeser,et al.,2010,Shen,et al.,2012,Esserman,et al.,2012,Miyake,et al.,2012,Lips,et al.,2012,Hess,et al.,2006,Takada,et al.,2012,Albain,et al.,2010,Liu,et al.,2012)。但從多個(gè)化療方案中選出并制定個(gè)人化癌癥治療方案并無(wú)報(bào)道。病人接受化療后,也并無(wú)合適的治療指導(dǎo)來(lái)選擇 最優(yōu)方案。過(guò)去研究中忽略了一個(gè)重要問(wèn)題,就是當(dāng)患者決定采用某種化療方案后,個(gè)人化癌癥治療如何幫助患者選擇接下來(lái)的化療方案,使治療效果更為有效。原理上,如果所有患者對(duì)目前的化療方案有一致的療效,那么個(gè)人化癌癥治療并無(wú)益處,除非有新的化療方案介入。此外,考慮到相當(dāng)數(shù)量的患者對(duì)至少兩種治療方案有不同反應(yīng)(他們是個(gè)人化癌癥治療的潛在受益者),如何選出這些患者并給予他們更有效的治療方案成為另外一個(gè)挑戰(zhàn)。
因此,我們重新分析了以前研究中接受過(guò)新輔助化療的乳腺癌患者的數(shù)據(jù)。乳腺癌患者可以在癌癥不同時(shí)期接受化療:手術(shù)前,手術(shù)后和轉(zhuǎn)移后。新輔助化療常常用來(lái)消除腫瘤大小以便于手術(shù)摘除。乳腺癌中常用的兩種細(xì)胞毒性化療試劑是:蒽環(huán)類藥物及紫杉烷藥物。這兩類藥物的不同組合已經(jīng)應(yīng)用在乳腺癌的治療中,盡管目前尚無(wú)具體的治療導(dǎo)向來(lái)幫助患者選擇化療方案(Dotan,et al.,2010)。我們從高通量基因數(shù)據(jù)庫(kù)里收集了1111例乳腺癌患者的數(shù)據(jù),有包括化療效果在內(nèi)的臨床信息和基因表達(dá)數(shù)據(jù)等。(Gene Expression Omnibus(Edgar,et al.,2002,Barrett,et al.,2013)),其中化療效果病理完全緩解用病理完全緩解(pathologic complete response)or殘留病灶(residual disease)來(lái)表示。病理完全緩解已被證明是病人生存率的一種潛在的替代標(biāo)記(Kaufmann,et al.,2006,Kuerer,et al.,1999,von Minckwitz,et al.,2012)并用于檢測(cè)病人對(duì)化療的敏感性(Straver,et al.,2010).在這1111個(gè)病例中,大約21.2%的患者對(duì)化療顯示病理完全緩解,剩余患者有殘留病灶。我們將病理完全緩解和殘留病灶的比例(pCR/RD)作為衡量化療效果的參數(shù),來(lái)考察基于基因組變量的個(gè)人化化療方案是否能改進(jìn)現(xiàn)有的病理完全緩解的比值。將患者分成3個(gè)組:只用蒽環(huán)類藥物治療的患者(A組),用蒽環(huán)類和紫杉醇藥物治療的患者(AT組),用蒽環(huán)類和多西紫杉醇治療的患者(TxA組)。三組數(shù)據(jù)用隨機(jī)森林模型進(jìn)行處理,10折交叉驗(yàn)證用來(lái)檢測(cè)模型的運(yùn)行。臨床變量包括ER,PR和HER2狀態(tài)和基因變量(基因表達(dá))被用作疾病預(yù)測(cè)因子。具備臨床和基因變量的模型普遍比只有臨床變量的模型更有效預(yù)測(cè)療效。在A組中發(fā)現(xiàn)3個(gè)基因;在TA組中有5個(gè)基因,在TxA組中發(fā)現(xiàn)11個(gè)基因能有效預(yù)測(cè)病理完全緩解。我們還發(fā)現(xiàn)基于基因變量的個(gè)人化方案選擇能使相當(dāng)數(shù)量的患者在選擇使用當(dāng)前化療方案時(shí)受益?;谀P皖A(yù)測(cè)的化療結(jié)果,選擇那些預(yù)計(jì)有更高的病理完全緩解的化療方案用于治療患者。我們預(yù)計(jì)采用這個(gè)新的PERS(個(gè)人化方案選擇)治療方案后,患者的病理完全緩解率為39.1%,相比于之前的21.2%增加了84%。大約有17.28%患者被過(guò)度治療,9.63%患者存在不足治療的問(wèn)題。在考察的患者中,接受TxA方案的患者中的病理完全緩解病理完全緩解率為33.1%,比TA組(19.7%)和A組(8.6%)的比例高。如果我們希望患者的病理完全緩解病理完全緩解率最大化,應(yīng)該基于患者的基因變量和臨床 變量來(lái)選擇化療方案。如果基于患者的HER2,ER狀態(tài),和淋巴結(jié)是否累及,將患者進(jìn)一步分層,也獲得與以上類似的療效。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明涉及一個(gè)用于化療方案選擇的基因診斷試劑盒。這個(gè)試劑盒包括:用于檢測(cè)以下基因群中一個(gè)或多個(gè)基因的一個(gè)或多個(gè)試劑成份。這個(gè)基因群包括SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,BAT2L1,PMP22,NME5,CENPA,BANK1,和其衍生物大分子。
本發(fā)明還包括一種用于預(yù)測(cè)化療方案療效的方法。這個(gè)方法包括:
a)確定一個(gè)檢測(cè)樣品中至少有一種可用于預(yù)測(cè)化療方案療效的生物分子的表達(dá);
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,用模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals)
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)化療方案療效的方法。這個(gè)方法包括:
a)確定一個(gè)樣品至少表達(dá)有以下基因群中的至少兩個(gè)生物分子。這個(gè)基因群包括:
SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9, COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,BAT2L1,PMP22,NME5,CENPA,BANK1,和其衍生物。
本發(fā)明還包括用于預(yù)測(cè)僅使用蒽環(huán)類藥物(不包括紫杉醇或多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:SLC12A7,GZMB,TAF6L,和其衍生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)同時(shí)使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:NFIB,METRN,ROPN1B,TTK,CCND1,和其衍生物大分子。
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)同時(shí)使用蒽環(huán)類藥物和多西紫杉醇(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,和其衍生物大分子。
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全 緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性癌癥患者上只使用蒽環(huán)類藥物(不包括紫杉醇和多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性癌癥患者上使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:NFIB,ROPN1B,TTK,MELK,CTSL2,METRN和其衍生的生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性癌癥患者上使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1和其衍生的生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2和ER-陰性癌癥患者上使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24和其衍生的生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2和ER-陰性癌癥患者上使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:TSPYL5,SRI和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和ER-陽(yáng)性癌癥患者上使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:LRP12,CENPF,TUBD1,KIAA1324,TTK和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和ER-陽(yáng)性癌癥患者上使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,CCNE2和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和無(wú)淋巴累及的癌癥患者上使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:CHD3,CAP1,GPM6B,GUSBP3和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
c)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和無(wú)淋巴累及的癌癥患者上使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:CDKN2C,GNAI3,LMO4,PSRC1,USP1,STK38和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和有淋巴累及的癌癥患者上使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:NFIB,ROPN1B和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);
d)對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括用于預(yù)測(cè)在HER-2陰性和有淋巴累及的癌癥患者上使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物)的化療方案療效的方法。這個(gè)方法包括:
a)確定檢測(cè)的樣品中至少表達(dá)有以下基因群中的一個(gè)生物大分子。這個(gè)基因群包括:TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,BANK1和其衍生生物大分子;
b)對(duì)于上步確定有表達(dá)的一個(gè)或多個(gè)生物分子,代入模型來(lái)計(jì)算化療方案的病理完全緩 解的預(yù)測(cè)概率;
c)將病理完全緩解的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率空間(probability intervals);對(duì)所述化療方案的化療結(jié)果的進(jìn)行定量測(cè)量,其中化療結(jié)果的定量測(cè)量對(duì)患者化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括一個(gè)用于化療方案選擇的方法。這個(gè)方法包括:
a)確定用于檢測(cè)的樣品中至少表達(dá)有以下基因群中的兩個(gè)生物大分子。這個(gè)基因群包括:SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,BAT2L1,PMP22,NME5,CENPA,BANK1和其衍生生物大分子;
本發(fā)明還包括一個(gè)用于化療方案選擇的方法。這個(gè)方法適用于患者樣品中檢測(cè)到以下包括:
a)確定檢測(cè)的樣品中至少表達(dá)有預(yù)測(cè)首個(gè)化療方案療效的第一組生物大分子。
b)將檢測(cè)的第一組生物大分子代入第一個(gè)模型里,計(jì)算首個(gè)化療方案的病理完全緩解的預(yù)測(cè)概率;將首個(gè)病理完全緩解的預(yù)測(cè)概率分成第一組與首個(gè)化療方案相關(guān)的概率空間(probability intervals);
c)對(duì)所述首個(gè)化療方案的化療結(jié)果的進(jìn)行第一次定量測(cè)量,其中首個(gè)化療結(jié)果的定量測(cè)量對(duì)患者首個(gè)化療方案有效性具有預(yù)測(cè)功能。
本發(fā)明還包括一個(gè)用于選擇可預(yù)測(cè)化療方案療效的生物標(biāo)記物的方法。這個(gè)方法包括:
a)用隨機(jī)樣品篩選法從一系列生物大分子中獲得至少一個(gè)遺傳預(yù)測(cè)因子;
b)建立一個(gè)模型,以至少一個(gè)(或多個(gè))遺傳預(yù)測(cè)因子作為變量,模型輸出能對(duì)模型性能做定量測(cè)量;
c)確定以上模型的性能做定量測(cè)量;
d)至少重復(fù)一遍步驟b)–c),獲得其他一個(gè)(或多個(gè))模型和相應(yīng)的模型性能的定量測(cè)量;
e)從一組生物大分子中選擇一個(gè)生物標(biāo)記物,將這個(gè)生物標(biāo)記物作為變量之一,代入以上建成的模型中,對(duì)模型性能做局部最優(yōu)化定量測(cè)量。
本發(fā)明還包括一個(gè)用于化療方案療效的選擇系統(tǒng)。這個(gè)系統(tǒng)包括:
a)數(shù)據(jù)采集模塊:數(shù)據(jù)采集模塊可從特定患者的某個(gè)樣品上收集包括診斷標(biāo)記物概況的數(shù)據(jù)。診斷標(biāo)記物中應(yīng)該包括至少一個(gè)可用于對(duì)以下化療方案療效進(jìn)行預(yù)測(cè)的生物大分子?;煼桨赴ǎ?i)僅使用蒽環(huán)類藥物(不包括紫杉醇藥物和多西紫杉醇藥物)(ii)使用蒽環(huán)類藥物和紫杉醇藥物(不包括多西紫杉醇藥物)及(iii)使用蒽環(huán)類藥物和多西紫杉醇藥物(不包括紫杉醇藥物);
b)數(shù)據(jù)處理模塊:數(shù)據(jù)處理模塊采用學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)處理數(shù)據(jù),對(duì)患者的化療方案療效生成統(tǒng)計(jì)來(lái)源的預(yù)測(cè)數(shù)據(jù);
c)顯示模塊:顯示模塊可以有來(lái)顯示統(tǒng)計(jì)來(lái)源的預(yù)測(cè)數(shù)據(jù)。
本發(fā)明的一個(gè)實(shí)施方案是用于受試者選擇化療方案的試劑盒。此試劑盒包括:用來(lái)檢測(cè)以下至少兩種生物分子表達(dá)的一個(gè)或多個(gè)試劑成份。生物分子包括:SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,BAT2L1,PMP22,NME5,CENPA,BANK1,和它們的衍生物。
在某些實(shí)施方案中,“選擇一種化療方案”和其語(yǔ)法變異的表達(dá)方式可指受試者有兩個(gè)或更多的化療方案可選擇作為潛在的治療方案。在某些實(shí)施方案中,“選擇一種化療方案”和其語(yǔ)法變異的表達(dá)方式可指受試者只有一種化療方案作為潛在的治療方案。因此,在本發(fā)明中,“選擇一種化療方案”的操作可以是醫(yī)療專業(yè)人員在多個(gè)化療方案中選擇最優(yōu)方案,或是醫(yī)療專業(yè)人員決定是否對(duì)受試者采用化療方案。
在某些實(shí)施方案中,“選擇一種化療方案”和其語(yǔ)法變異的表達(dá)方式所指的操作可 在受試者初次化療給藥之前或之后。當(dāng)在最初化療給藥之前進(jìn)行選擇,所選擇的化療方案將優(yōu)選在其后給予受試者。當(dāng)在最初化療給藥后進(jìn)行,所選擇的化療方案將與實(shí)際施用化療方案進(jìn)行比較,以確定進(jìn)一步的療程。
如本文所用,除非另有說(shuō)明,“化療方案”可指任何用在受試者上的化療藥物。本發(fā)明中的化療藥物包括,但不限于,DNA損傷劑,抗代謝藥物,抗微管劑,和抗菌劑,等。DNA損傷劑包括:烷化劑,鉑類藥物,插層劑,以及DNA復(fù)制抑制劑。非限制性的DNA烷化劑例子包括環(huán)磷酰胺,氮芥,尿嘧啶氮芥,美法侖,苯丁酸氮芥,環(huán)磷酰胺,卡氮芥,洛莫司汀,鏈脲菌素,白消安,替莫唑胺,其可藥用鹽,前體藥物,以及它們的組合。非限制性的鉑類藥物例子包括順鉑,碳化鉑,奧沙利鉑,奈達(dá)鉑,沙鉑,四硝酸三鉑,其可藥用鹽,前體藥物,以及它們的組合。非限制性的嵌入劑的例子包括蒽環(huán)類藥物如阿霉素,柔紅霉素,伊達(dá)比星,米托蒽醌,戊柔比星,表阿霉素,其藥用鹽,前體藥物,以及它們的組合。非限制性的DNA復(fù)制抑制劑的例子包括伊立替康,拓?fù)涮婵?,安吖啶,依托泊苷,磷酸依托泊苷,替尼泊甙,其藥用鹽,前體藥物,以及它們的組合??勾x物包括葉酸拮抗劑如氨甲喋呤和培美曲塞,嘌呤受體拮抗劑如6-巰基嘌呤,達(dá)卡巴嗪,和氟達(dá)拉濱,和嘧啶拮抗劑如5-氟尿嘧啶,阿糖胞苷,卡培他濱,吉西他濱,地西他濱,其藥用鹽,前體藥物,以及它們的組合??刮⒐軇┌ǖ幌抻陂L(zhǎng)春花堿,紫杉醇多西紫杉醇和抗菌劑包括但不限于放線菌素,博萊霉素,普卡霉素,絲裂霉素,其藥用鹽,前體藥物,以及它們的組合。
如本文所用,“受試者”是哺乳動(dòng)物,最好是人。除了人外,本發(fā)明范圍中的哺乳動(dòng)物類別包括:例如農(nóng)場(chǎng)動(dòng)物,家養(yǎng)動(dòng)物和實(shí)驗(yàn)動(dòng)物。農(nóng)場(chǎng)動(dòng)物的例子包括:奶牛,豬,馬,山羊等。家養(yǎng)動(dòng)物的例子包括:狗,貓等。實(shí)驗(yàn)動(dòng)物的例子包括靈長(zhǎng)類,大鼠,小鼠,兔,豚鼠等。
如本文所用,“受試者”可能表現(xiàn)出于本發(fā)明相關(guān)的各類基因特征。例如:本發(fā)明中的“受試者”包括,但不限于:HER2陽(yáng)性受試者,HER2陰性受試者,HER2陰性ER-陰性受試者,HER2-陰性ER-陽(yáng)性受試者,HER2陰性及淋巴結(jié)累及陽(yáng)性受試者,HER2陰性及淋巴結(jié)累及陽(yáng)性受試者。
如本文所用,本發(fā)明中用來(lái)檢測(cè)生物分子表達(dá)的成份包括,例如,在實(shí)驗(yàn)室或臨床環(huán)境中用于檢測(cè)給定樣品中的生物分子表達(dá)產(chǎn)物的任何底物,化合物,組合物,設(shè)備,試劑,或檢測(cè)劑等。本發(fā)明中用來(lái)檢測(cè)表達(dá)產(chǎn)物的成份包括,但不僅限于核酸,DNA,RNA,一 套引物,多個(gè)探針,蛋白,抗體,抗原結(jié)合片段,DNA芯片,RNA芯片,寡核苷酸芯片和蛋白質(zhì)芯片。已知通常這類檢測(cè)試劑可能采用不同的標(biāo)記,例如放射性和熒光標(biāo)記,來(lái)幫助檢測(cè)基因表達(dá)。
如本文所用,一種“表達(dá)產(chǎn)物”指任何在給定樣品中的存在可用來(lái)指示該樣品中或者是抽樣樣本來(lái)源中有相應(yīng)生物分子表達(dá)的物質(zhì);“表達(dá)產(chǎn)物”包括但不限于,一個(gè)給定的生物分子轉(zhuǎn)錄的信息核糖核酸(mRNA)或者是由以上mRNA翻譯獲得的蛋白。此外,表達(dá)產(chǎn)物包括從給定的生物分子轉(zhuǎn)錄的mRNA的任何片段,或從以上mRNA的任何片段翻譯的蛋白片段。
如本文所用,“表達(dá)”指細(xì)胞里給定樣品的數(shù)量的定性和定量測(cè)量?!氨磉_(dá)”包括本發(fā)明中給定生物大分子的“表達(dá)水平”。本發(fā)明中的表達(dá)的適合的形式包括由細(xì)胞里給定的物質(zhì)的絕對(duì)量和相對(duì)量。在本發(fā)明的上下文中,“表達(dá)”包括,但不限于,mRNA表達(dá),蛋白質(zhì)表達(dá),非編碼RNA的表達(dá),和miRNA表達(dá)。
如本文所用,“生物分子”指存在細(xì)胞里或由細(xì)胞分泌的任何分子或者分子的任何部分。本發(fā)明中“生物分子”包括,但不限于基因和基因片段,轉(zhuǎn)錄mRNA和蛋白產(chǎn)物。此外,本發(fā)明中的生物分子還包括,但不限于非編碼DNA,非編碼RNA,例如tRNAs,rRNAs和miRNAs.”
如本文所用,“基因”是一個(gè)復(fù)雜的概念。為了便于闡述并不產(chǎn)生誤解,此發(fā)明中“基因”指在一個(gè)生命體內(nèi)所有可被處理并產(chǎn)生有功能的生物物質(zhì)的核糖核酸序列。例如,基因可轉(zhuǎn)錄成mRNA,tRNA,或者核糖酶。然后mRNA可以繼續(xù)翻譯成蛋白產(chǎn)物,例如酶或抗體。本發(fā)明中生物分子的衍生物包括:表觀遺傳修飾的DNA,包括表觀遺傳修飾的基因或基因片段,轉(zhuǎn)錄后修飾RNA(如,但不限于,選擇性剪接的RNA),和翻譯后修飾的蛋白(如,但不限于,糖基化蛋白或蛋白水解活化蛋白)。
在一些實(shí)施方案中,要從有多個(gè)生物分子的組合里選出至少兩個(gè)生物分子。因此,這兩個(gè)生物分子是指2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,或更多生物分子.
對(duì)應(yīng)于本發(fā)明中的生物分子的核苷酸和多肽序列都可以在公共數(shù)據(jù)庫(kù)中查詢到。
在一些實(shí)施方案中,所述試劑盒包括一個(gè)或多個(gè)組分,用于檢測(cè)指定樣品組中至少 三個(gè)生物分子的表達(dá)。
如本文中所用,至少需要檢測(cè)到表達(dá)的三個(gè)生物分子指:3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,或更多生物分子。
在該實(shí)施方案的另一個(gè)方面,所述試劑盒包含一個(gè)或多個(gè)組分,用于檢測(cè)從生物分子中組1,組2和組3中獨(dú)立選擇的至少兩個(gè)生物分子的表達(dá)
a.組1:SLC12A7,GZMB,TAF6L,以及衍生物;
b.組2:NFIB,METRN,ROPN1B,TTK,CCND1,以及衍生物;
c.組3:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,以及衍生物。
如本文所使用的,“獨(dú)立選擇”是指,一個(gè)生物分子的選擇的不影響另一生物分子的選擇。
在該實(shí)施方案的另一方面,試劑盒包含一個(gè)或多個(gè)組分,可用于檢測(cè)分別從第4組,第5組和第6組中選出的至少兩個(gè)生物分子的表達(dá):
a.第4組:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,及其衍生物;
b.第5組:NFIB,ROPN1B,TTK,MELK,CTSL2,METRN,及其衍生物;
c.第5組:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1,及其衍生物。
在該實(shí)施方案的另一方面,試劑盒包含一個(gè)或多個(gè)組分,可用于檢測(cè)分別從第7組,和第8組中選出的至少兩個(gè)生物分子的表達(dá):
a.第7組:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,及其衍生物;
b.第8組:TSPYL5,SRI,及其衍生物.
在該實(shí)施方案的另一方面,試劑盒包含一個(gè)或多個(gè)組分,可用于檢測(cè)分別從第9組,和第10組中挑選出的至少兩個(gè)生物分子的表達(dá):
a.第9組:LRP12,CENPF,TUBD1,KIAA1324,TTK,及其衍生物;
b.第10組:DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,CCNE2,及其衍生物。
在該實(shí)施方案另一個(gè)方面,所述試劑盒包含一個(gè)或多個(gè)組分,用于檢測(cè)分別從第11組,和第12組中挑選出的至少兩個(gè)生物分子的表達(dá):
a.第11組:CHD3,CAP1,GPM6B,GUSBP3,及其衍生物;
b.第12組:CDKN2C,GNAI3,LMO4,PSRC1,USP1,STK38,及其衍生物。
在該實(shí)施方案的另一方面,所述試劑盒包含一個(gè)或多個(gè)組分,用于檢測(cè)分別從第13組,和第14組中挑選出的至少兩個(gè)生物分子的表達(dá):
a.第13組:NFIB,ROPN1B,及其衍生物;
b.第14組:TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,BANK1,及其衍生物.
該實(shí)施方案的優(yōu)選方面是,至少有兩個(gè)選中的生物分子是來(lái)自至少兩個(gè)不同組的生物分子。例如,一種生物分子可以選自第1組而另一個(gè)生物分子可以選自第2組。
該實(shí)施方案的更優(yōu)選方面是,至少有兩個(gè)選中的生物分子是兩個(gè)選自同一組的生物分子。例如,一種生物分子可以選自第1組而另一個(gè)生物分子可以也選自第1組。
該實(shí)施方案的另一優(yōu)選方面是,所述試劑盒包括一個(gè)或多個(gè)組分可檢測(cè)以上提到的某組里的各個(gè)生物分子。例如,可檢測(cè)第1組里的所有生物分子的組分。
該實(shí)施方案的更優(yōu)選方面是,所述試劑盒包括一個(gè)或多個(gè)組分可以檢測(cè)以上所述的至少兩組里的各個(gè)生物分子。例如,可檢測(cè)第1組和第2組里的所有生物分子的組分。另外,可檢測(cè)第1組,第2組和第3組里的所有生物分子的組分。
該實(shí)施方案的更優(yōu)選方面是,所述試劑盒包括一個(gè)或多個(gè)組分可以檢測(cè)以上提到的各組的各個(gè)生物分子。例如,可檢測(cè)第1組,第2組和第3組里的所有生物分子的組分。在另一例子中又可檢測(cè)第13組,和第14組里的所有生物分子的組分。
在該實(shí)施方案的優(yōu)選方面,所述的一個(gè)或多個(gè)組分可從包括以下分子的組中選擇:DNA芯片,RNA芯片,寡核糖核酸片段芯片,蛋白芯片,抗體,抗原結(jié)合片段,多個(gè)探針,和一組引物。
本發(fā)明中的芯片矩陣可包括,例如,結(jié)合在芯片上,或者與上述芯片的特殊區(qū)域有相互作用的核糖核酸或蛋白。芯片上的特殊區(qū)域通常對(duì)應(yīng)一個(gè)特定的種類,例如基因,mRNA, cDNA,核糖核酸探針或者蛋白探針。本發(fā)明中的芯片矩陣可為任何大小,例如可以是2X 2或者100X 100芯片矩陣。
本發(fā)明中的抗原結(jié)合片段包括,但不限于,抗體片段例如scFvs或Fabs,和受體,例如細(xì)胞表面受體,和受體片段等。
本發(fā)明中的引物包括,但不限于,用于多聚酶鏈?zhǔn)椒磻?yīng)的引物和逆轉(zhuǎn)錄酶多聚酶鏈?zhǔn)椒磻?yīng)的引物。
本實(shí)施方案的另一方面,從由mRNA表達(dá),蛋白表達(dá),非編碼RNA表達(dá)和miRNA表達(dá)構(gòu)成的組中選取表達(dá)數(shù)據(jù)。
本發(fā)明中的試劑盒可進(jìn)一步包括合適的貯存容器,例如,安瓿,小瓶,試管等用于貯存各個(gè)檢測(cè)劑和其它試劑,例如,在測(cè)試樣品上檢測(cè)使用的緩沖劑和平衡鹽溶液等。檢測(cè)試劑和其他試劑可以任何適宜的形式保存于試劑盒里,例如,溶液或粉末。試劑盒可進(jìn)一步包括包裝容器,可選擇性分成一個(gè)或多個(gè)部分以容納檢測(cè)試劑和其他自選試劑。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)受試者化療方案功效的方法。該方法包括:
a.確定受試者的樣品中表達(dá)了至少一種可對(duì)化療方案功效進(jìn)行預(yù)測(cè)的生物分子;
b.將以上所檢測(cè)到的生物分子表達(dá)數(shù)據(jù)代入模型,計(jì)算出該化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定該化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
在一些實(shí)施方案中,“化療方案功效預(yù)測(cè)”在采用化療方案前進(jìn)行,可優(yōu)化受試者的治療效果。這類預(yù)測(cè)可幫助醫(yī)療專業(yè)人員確定對(duì)受試者選用特定的化療方案。在一些實(shí)施方案中,“化療方案功效預(yù)測(cè)”在采用化療方案后進(jìn)行,以評(píng)估化療中特殊階段的起始時(shí)間是否適宜,并/或決定是否基于變化例如受試者腫瘤遺傳因子的改變,來(lái)調(diào)整化療方案。
如本文和此后使用的,“受試者”和“化療方案”的定義如上。
在一些實(shí)施方案中,步驟(a),包括,為確定受試者樣品中有至少一個(gè)可預(yù)測(cè)化療方案功效的生物分子的表達(dá),可以使用任何數(shù)量的試驗(yàn)方法,包括雜交試驗(yàn)方法,基于擴(kuò)增的試驗(yàn)方法,免疫試驗(yàn)方法,和免疫組化分析法。
雜交試驗(yàn)方法包括,但不限于,斑點(diǎn)印跡,核糖核酸酶保護(hù),Northern雜交,芯片,熒光原位雜交(FISH)及它們的組合。基于擴(kuò)增的試驗(yàn)方法包括,但不限于多聚酶鏈?zhǔn)椒磻?yīng),逆轉(zhuǎn)錄酶PCR以它們的組合。免疫實(shí)驗(yàn)方法包括,但不限于免疫細(xì)胞化學(xué),免疫組織化學(xué),酶聯(lián)免疫吸附測(cè)定,記憶細(xì)胞免疫刺激試驗(yàn)(MELISA),克隆酶供體免疫分析法(CEDIA),和它們的組合。免疫組化試驗(yàn)方法包括,但不限于,直接熒光抗體法,間接熒光抗體法(IFA),抗補(bǔ)體免疫熒光法,親和素-生物素免疫熒光染色法,熒光激活細(xì)胞分類法(FACS)。這些試驗(yàn)方法是本領(lǐng)域技術(shù)人員所熟知的。
如此處所用的,“樣品”是指任何從受試者上獲得的生物標(biāo)本。本發(fā)明中的樣品包括,但不限于,全血,血漿,血清,唾液,尿液,糞便,痰液,眼淚,任何其他體液,組織樣本,如活體組織切片及細(xì)胞提取物。
在一些實(shí)施方案中,從上述各組的樣品中檢測(cè)至少一個(gè)的生物分子的表達(dá),可能涉及到在特定組的樣品里至少一個(gè)或多個(gè)生物分子的表達(dá)檢測(cè)。至少一個(gè)生物分子可以指1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,或更多生物分子。甚至,檢測(cè)那些未在本發(fā)明中公開(kāi)的其他生物分子的表達(dá),無(wú)論它們對(duì)本發(fā)明中公開(kāi)的生物分子的表達(dá)是否有額外的預(yù)測(cè)價(jià)值,都包括在本發(fā)明的范圍內(nèi)。
在一些實(shí)施方案中,將上文中公布的生物分子表達(dá)“代入模型”的操作可在計(jì)算機(jī)或者本文公開(kāi)的系統(tǒng)中進(jìn)行。本發(fā)明中的統(tǒng)計(jì)模型,或此處稱為“學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)”包括,但不限于,隨機(jī)森林模型,分類和回歸樹(shù)模型,Boosting模型,貝葉斯網(wǎng)絡(luò),馬爾可夫隨機(jī)場(chǎng),線性和廣義線性模型,Boosted樹(shù)模型,神經(jīng)網(wǎng)絡(luò),支持向量機(jī),通用卡方自動(dòng)交互檢測(cè)模型,互動(dòng)樹(shù)模型,多適應(yīng)性回歸,機(jī)器學(xué)習(xí)分類,以及它們的組合。這些統(tǒng)計(jì)模型都是本領(lǐng)域技術(shù)人員所熟知的。
本發(fā)明的模型可以以,例如,如本文中所用的“模型性能的定量測(cè)量”來(lái)評(píng)價(jià),如準(zhǔn)確度,精確度,召回率(recall)和/或f1-值。本發(fā)明中的模型優(yōu)先選用f1-值進(jìn)行評(píng)估。f1-值在本文中定義為2×[(精確度×召回率)/(精確度+召回率)]其中,精確度和召回率是本領(lǐng)域技術(shù)人員的熟知的統(tǒng)計(jì)技術(shù)術(shù)語(yǔ)。在本發(fā)明的一些實(shí)施方案中,多個(gè)統(tǒng)計(jì)模型是基于若干個(gè)變量來(lái)開(kāi)發(fā)的,包括臨床變量,例如腫瘤大小,年齡,雌激素受體狀態(tài),孕激素受體狀態(tài),人類表皮生長(zhǎng)因子受體狀態(tài),淋巴結(jié)狀態(tài),t_stage,n_stage及遺傳變量,如本文公開(kāi)的任 何生物分子的表達(dá)。優(yōu)選情況下,本發(fā)明的統(tǒng)計(jì)模型將基于對(duì)各個(gè)模型評(píng)估后的f1-值,新變量并入模型來(lái)進(jìn)行開(kāi)發(fā)的。例如,一個(gè)模型只并入臨床變量后將返回一定f1-值。另一個(gè)新模型結(jié)合臨床變量和一個(gè)單一的基因變量將返回另一個(gè)f1-值,并可和上一個(gè)f1-值進(jìn)行比較,較高的f1-值通常表明此模型具更強(qiáng)的預(yù)測(cè)能力。
在一些實(shí)施方案中,優(yōu)選的統(tǒng)計(jì)模型是那些生成局部最大f1-值的模型。更優(yōu)選的模型是生成第一個(gè)局部最大f1-值的統(tǒng)計(jì)模型。本文中,“局部最大”是指從第一個(gè)統(tǒng)計(jì)模型獲得的數(shù)值,其特征是將代入第一個(gè)統(tǒng)計(jì)模型中的變量和其他附加變量代入其他統(tǒng)計(jì)模型,或者將代入第一個(gè)統(tǒng)計(jì)模型中的變量的子集代入其他統(tǒng)計(jì)模型得到的f1-值都比第一個(gè)統(tǒng)計(jì)模型更低。局部最大f1-值可是第一個(gè)統(tǒng)計(jì)模型計(jì)算得到的f1-值,其中該統(tǒng)計(jì)模型可以是包括除了代入第一個(gè)統(tǒng)計(jì)模型的變量外,還包括1,2,3,4,5,6,7,8,9,10個(gè),或更多變量的統(tǒng)計(jì)模型;和包括1,2,3,4,5,6,7,8,9,10個(gè)變量,或者那些代入其他模型都獲得比第一個(gè)統(tǒng)計(jì)模型更小的f1-值的變量組的變量。優(yōu)化情況下,本發(fā)明中的局部最大f1-值可從第一個(gè)統(tǒng)計(jì)模型中獲得,其中,統(tǒng)計(jì)模型包括那些除了代入第一個(gè)統(tǒng)計(jì)模型的變量外還有其它三個(gè)變量的模型,或那些比第一個(gè)統(tǒng)計(jì)模型變量的子集少3個(gè)變量且其f1-值比第一個(gè)統(tǒng)計(jì)變量少的統(tǒng)計(jì)模型。當(dāng)變量代入給定的統(tǒng)計(jì)模型,將產(chǎn)生第一個(gè)局部最大f1-值。附加變量可提供獲得第二個(gè)局部最大f1-值的模型,但本發(fā)明的優(yōu)選方案將采用產(chǎn)生的第一個(gè)局部最大f1-值的統(tǒng)計(jì)模型。
在一些實(shí)施方案中,本發(fā)明中的統(tǒng)計(jì)模型與本發(fā)明中的化療方案相關(guān)聯(lián)。例如使用“蒽環(huán)類藥物但無(wú)紫杉醇或多西紫杉醇藥物”的化療方案可與第一個(gè)統(tǒng)計(jì)模型相關(guān)聯(lián),而使用“蒽環(huán)類與紫杉醇藥物但無(wú)多西紫杉醇”的化療方案可與第二個(gè)統(tǒng)計(jì)模型關(guān)聯(lián)。
在一些實(shí)施方案中,本發(fā)明中的統(tǒng)計(jì)模型可以計(jì)算化療方案的病理完全緩解的預(yù)測(cè)概率。病理完全緩解以前就定義過(guò)。(Kaufmann,et al.,2006,Kuerer,et al.,1999,von Minckwitz,et al.,2012)。在本發(fā)明的上下文中,一個(gè)指定的統(tǒng)計(jì)模型應(yīng)該能輸出與該統(tǒng)計(jì)模型相關(guān)聯(lián)的化療方案的病理完全緩解的預(yù)測(cè)概率。同樣地,不同的統(tǒng)計(jì)模型,可輸出與其相關(guān)聯(lián)的不同的化療方案在同一患者上的病理完全緩解的不同預(yù)測(cè)概率。因此,患者可以有多個(gè)不同的病理完全緩解的預(yù)測(cè)概率,它們是由與多個(gè)化療方案相關(guān)聯(lián)的多個(gè)統(tǒng)計(jì)模型計(jì)算獲得的。
在一些實(shí)施方案中,病理完全緩解的預(yù)測(cè)概率可分類成和化療方案相關(guān)的一組概率區(qū)間。在本發(fā)明的上下文中,從患者組得到的表達(dá)數(shù)據(jù)可以代入一個(gè)統(tǒng)計(jì)模型,得到與此統(tǒng) 計(jì)模型相關(guān)的概率區(qū)間。例如,可從已接受第一期化療方案治療的患者組上收集表達(dá)數(shù)據(jù),將其代入統(tǒng)計(jì)模型后,可以得到每個(gè)患者的病理完全緩解的預(yù)測(cè)概率。這些病理完全緩解的預(yù)測(cè)概率可分成任意個(gè)概率區(qū)間,其中每個(gè)概率區(qū)間里包含有數(shù)目相同的預(yù)測(cè)概率。(例如.每個(gè)概率區(qū)間可包含1,2,3,4,5,6,7,8,9,或10或更多個(gè)預(yù)測(cè)概率)。概率區(qū)間可定義為在某上限和下限之間,包括上限和下限,的范圍。例如,區(qū)間[0,1]可以是0到1之間的任何值,包括0和1。優(yōu)化的分組方式是將預(yù)測(cè)概率分為5個(gè)區(qū)間。
在已知一組患者的概率區(qū)間時(shí),本實(shí)施方案采用的方法是把受試者病理完全緩解的預(yù)測(cè)概率分類成上述的某一種概率區(qū)間。
在一些實(shí)施方案中,接受多個(gè)化療方案的受試者可有多個(gè)與之相關(guān)的病理完全緩解預(yù)測(cè)概率,可將這些預(yù)測(cè)概率分類成多個(gè)概率區(qū)間組,從某一組中選擇的一個(gè)概率區(qū)間與一個(gè)特定的化療方案相關(guān)。
在一些實(shí)施方案中,要對(duì)一個(gè)給定的化療方案的效果進(jìn)行定量測(cè)量。在一些實(shí)施方案中,這個(gè)化療方案效果的定量測(cè)量是病理完全緩解值(pCR score)。病理完全緩解值與病理完全緩解預(yù)測(cè)概率不同。當(dāng)患者的病理反應(yīng)預(yù)測(cè)概率被分類在某個(gè)特定的概率區(qū)間時(shí),病理完全緩解值才定義為該患者對(duì)此特定化療方案的預(yù)測(cè)概率。在本實(shí)施方案的上下文中,在受試者的病理完全緩解預(yù)測(cè)概率被劃分入某個(gè)概率區(qū)間之前或之后,病理完全緩解值可與概率區(qū)間相關(guān)。如本文所用,病理完全緩解值是在某個(gè)概率區(qū)間內(nèi)有病理完全緩解的患者與此概率區(qū)間所有患者的比值。這個(gè)比值在此被稱為陽(yáng)性預(yù)測(cè)值(PPV)。因此當(dāng)受試者對(duì)某個(gè)特定化療的病理完全緩解預(yù)測(cè)概率被分類到某個(gè)概率區(qū)間的情況下,和以上提到的概率區(qū)間相關(guān)的受試者的病理完全緩解值即是該受試者對(duì)此給定化療方案的病理完全緩解值。
在一些實(shí)施方案中,接受多個(gè)化療方案的受試者可有多個(gè)與之相關(guān)的病理完全緩解預(yù)測(cè)概率,這些預(yù)測(cè)概率可分類成多個(gè)概率區(qū)間,每個(gè)概率區(qū)間可從與特定的化療方案相關(guān)的一組概率區(qū)間中選出。同樣的,每個(gè)概率區(qū)間和某個(gè)病理完全緩解值相關(guān)聯(lián),因此受試者與其病理完全緩解預(yù)測(cè)概率分類后所在區(qū)間內(nèi)的病理完全緩解值相關(guān)聯(lián)。
在一些實(shí)施方案中,可就某一化療方案對(duì)受試者的療效進(jìn)行預(yù)測(cè)。根據(jù)對(duì)化療結(jié)果的定量測(cè)試,例如病理完全緩解值,受試者或者醫(yī)療專業(yè)人員可以預(yù)測(cè)在受試者上使用與以上所述病理完全緩解值相關(guān)的的化療方案后受試者的病理完全緩解。受試者如果接受多個(gè)化療方案,就有多個(gè)病理完全緩解值與其接受的化療方案相關(guān)聯(lián),其中與最大病理完全緩解值相關(guān)聯(lián)的化療方案就是預(yù)測(cè)為該受試者接受的所有化療方案中最有效的一個(gè)方案。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在受試者上療效的方法。該方法包括:
a.測(cè)定受試者樣品中有以下包括SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,,BAT2L1,PMP22,NME5,CENPA,BANK1,及其衍生物在內(nèi)的至少兩個(gè)生物分子的表達(dá);
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在受試者上療效的方法,其中所述的化療方案包括使用蒽環(huán)類藥物,但不使用紫杉醇類和多西紫杉醇藥物的化療方案。此方法包括:
a.測(cè)定受試者樣品中有以下包括SLC12A7,GZMB,TAF6L,及其衍生物在內(nèi)的至少一種生物分子的表達(dá);
b.將生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量可預(yù)測(cè)化療方案對(duì)受試者的功效。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在受試者上療效的方法,其中所述的化療方案包括使用蒽環(huán)類和紫杉醇類藥物,但不包括使用多西紫杉醇藥物的化療方案。此方法包括:
a.測(cè)定受試者樣品中表達(dá)有以下組中包括NFIB,METRN,ROPN1B,TTK,CCND1,及其衍生物中至少一種生物分子的表達(dá);
b.將生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量可預(yù)測(cè)化療方案對(duì)受試者的功效。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在受試者上療效的方法,其中所述的化療方案包括使用蒽環(huán)類和多西紫杉醇類藥物,但不包括使用紫杉醇藥物的化療方案。此方法包括:
a.測(cè)定受試者樣品中表達(dá)有以下組中包括PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,及其衍生物中至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
c.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量可預(yù)測(cè)化療方案在受試者上的功效。
如本文所用的,“使用蒽環(huán)類藥物但不涉及紫杉醇或多西紫杉醇藥物”的化療方案包括一個(gè)或多個(gè)蒽環(huán)類藥物,與其他任何非紫杉醇及其類似物,及非多西紫杉醇及其類似物的藥物的組合。同樣,“使用蒽環(huán)類和紫杉醇藥物,但無(wú)西紫杉醇藥物”的化療方案包括一個(gè)或多個(gè)蒽環(huán)類藥物,與任何紫杉醇及其類似物藥物的組合,但其中不涉及多西紫杉醇及其類似物的藥物。與此類似,“使用蒽環(huán)類和多西紫杉醇藥物,但無(wú)西紫杉醇藥物”的化療方案包括一個(gè)或多個(gè)蒽環(huán)類藥物,與任何多西紫杉醇及其類似物藥物的組合,但其中不涉及紫杉醇及其類似物的藥物。
本發(fā)明中另一個(gè)實(shí)施方案是用來(lái)預(yù)測(cè)化療方案在HER2-陰性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類藥物,但不使用無(wú)紫杉醇和多西紫杉醇藥物這個(gè)方法包括:
a.測(cè)試受試者樣品中有以下包括SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
c.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量可預(yù)測(cè)化療方案在受試者上的功效。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性受試者上療效的方法,其中所述的化療方案包括使用蒽環(huán)類和紫杉醇類藥物,但不使用多西紫杉醇藥物。該方法包 括:
a.測(cè)試受試者樣品中有以下包括NFIB,ROPN1B,TTK,MELK,CTSL2,METRN,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性受試者上療效的方法,其中所述的化療方案包括使用蒽環(huán)類和多西紫杉醇類藥物,但不使用紫杉醇藥物。該方法包括:
a.測(cè)試受試者樣品中有以下包括TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
人體表皮生長(zhǎng)因子受體2(HER2)基因表達(dá)膜絡(luò)氨酸激酶,并在特定的腫瘤組織里高表達(dá),使這些組織有特定生物功能,包括對(duì)特定化療的敏感性。癌細(xì)胞中HER2的表達(dá)水平可以用,例如免疫組化(IHC)和熒光原位雜交(FISH)方法,進(jìn)行檢測(cè)。癌癥可根據(jù)FISH檢測(cè)到的HER2水平值進(jìn)行分類。在癌細(xì)胞中檢測(cè)不到HER2染色,其表達(dá)水平為0,癌癥被分類為HER2陰性。在癌細(xì)胞中檢測(cè)到微弱或者不完整的膜染色,其表達(dá)水平為1+,癌癥被分類為HER2-陰性。當(dāng)有至少10%細(xì)胞檢測(cè)到HER2強(qiáng)度不均勻或弱的完整膜染色,或者在30%或更少細(xì)胞檢測(cè)到強(qiáng)烈的HER2膜染色,其表達(dá)水平為2+,該癌癥被分類為HER2不確定病例(HER2-equivocal)。HER2-陽(yáng)性癌癥表達(dá)水平為3+,能在30%侵襲性癌細(xì)胞檢測(cè)到強(qiáng)烈均勻的HER2染色。在本發(fā)明的上下文中,用于確定受試者是否為HER2陰性/陽(yáng)性,ER陰性/陽(yáng)性,或淋巴結(jié)陰性/陽(yáng)性的標(biāo)準(zhǔn)是本領(lǐng)域共同認(rèn)可的。此外,用于確定受試者HER2/ER/淋巴結(jié)狀態(tài)的某些標(biāo)準(zhǔn)可能會(huì)隨著分析技術(shù)的提高而隨時(shí)改變。此處列出的標(biāo)準(zhǔn)僅供說(shuō)明,并非意在以任何方式限制。
本發(fā)明中另外一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,ER-陰性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和紫杉醇類藥物,但不使用多西紫杉醇藥物。此方法包括:
a.測(cè)試受試者樣品中有以下包括NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量可預(yù)測(cè)化療方案對(duì)受試者的功效。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,ER-陰性受試者上效果的方法,其中所述的化療方案使用蒽環(huán)類和多西紫杉醇藥物,但無(wú)紫杉醇藥物。該方法包括:
a.測(cè)試受試者樣品中有以下包括TSPYL5,SRI,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,ER-陽(yáng)性受試者上療效 的方法,其中所述的化療方案使用蒽環(huán)類和紫杉醇藥物,但無(wú)多西紫杉醇藥物。該方法包括:
a.測(cè)試受試者樣品中有以下包括LRP12,CENPF,TUBD1,KIAA1324,TTK,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER-陰性,ER-陽(yáng)性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和多西紫杉醇藥物,但無(wú)紫杉醇藥物。該方法包括:
a.測(cè)試受試者樣品中有以下包括DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,CCNE2,及其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,淋巴結(jié)陰性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和紫杉醇藥物,但無(wú)多西紫杉醇藥物。該方法包括:
a.測(cè)試受試者樣品中有以下包括CHD3,CAP1,GPM6B,GUSBP3和其衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
如本文所用,雌激素受體(ER)狀態(tài)也可以作為受試者對(duì)某些化療反應(yīng)的表征。類似于HER2,根據(jù)癌組織中檢測(cè)到的ER水平,受試者可分類成ER-陽(yáng)性或ER-陰性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,淋巴結(jié)陰性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和多西紫杉醇藥物,但無(wú)紫杉醇藥物。該方法包括:
a.測(cè)試受試者測(cè)試受試者樣品中有以下包括CDKN2C,GNAI3,LMO4,PSRC1,USP1,STK38和衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,淋巴結(jié)陽(yáng)性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和紫杉醇藥物,但無(wú)多西紫杉醇藥物。該方法包括:
a.測(cè)試受試者測(cè)試受試者樣品中有以下包括NFIB,ROPN1B和衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案的化療效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
本發(fā)明中的另一個(gè)實(shí)施方案是用于預(yù)測(cè)化療方案在HER2-陰性,淋巴結(jié)陽(yáng)性受試者上療效的方法,其中所述的化療方案使用蒽環(huán)類和多西紫杉醇藥物,但無(wú)紫杉醇藥物。該方 法包括:
a.測(cè)試受試者測(cè)試受試者樣品中有以下包括TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,BANK1和衍生物在內(nèi)的至少一個(gè)生物分子的表達(dá);
b.將上述檢測(cè)到的生物分子表達(dá)代入模型中,計(jì)算此化療方案的病理完全緩解的預(yù)測(cè)概率;
c.按病理完全緩解(PCR)的預(yù)測(cè)概率分成一組與化療方案相關(guān)的概率區(qū)間(PIS);
d.確定化療方案效果的定量測(cè)量,其中化療效果的定量測(cè)量對(duì)受試者化療方案的功效具預(yù)測(cè)性。
癌癥,包括乳腺癌,可根據(jù)受試者淋巴結(jié)中是否檢測(cè)到癌細(xì)胞而分類為淋巴結(jié)陽(yáng)性和淋巴結(jié)陰性。淋巴結(jié)狀態(tài)可通過(guò)淋巴結(jié)活檢來(lái)檢測(cè),而是否存在癌細(xì)胞可由,例如病理醫(yī)生,來(lái)進(jìn)行評(píng)估。
在一些實(shí)施方案中,在使用本發(fā)明中的方法或者檢測(cè)試劑盒前,可先檢測(cè)受試者的HER2/ER/淋巴結(jié)狀態(tài),從而使醫(yī)護(hù)人員知曉本發(fā)明中哪個(gè)方法或檢測(cè)試劑盒對(duì)受試者最為最有效。
在一些實(shí)施方案中,表達(dá)可以是mRNA表達(dá),蛋白表達(dá),非編碼RNA表達(dá)和miRNA表達(dá)。
本發(fā)明中的另一個(gè)實(shí)施方案是為受試者選擇化療方案的方法。此方法包括:
a.測(cè)試受試者樣品中有以下包括SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,,BAT2L1,PMP22,NME5,CENPA,BANK1,及其衍生物在內(nèi)的至少兩個(gè)生物分子的表達(dá);
本發(fā)明中另一個(gè)實(shí)施方案是用于為受試者選擇化療方案的方法,此方法包括::
a.確定受試者的樣品中表達(dá)有用于預(yù)測(cè)第一個(gè)化療方案效果的第一組生物分子;
b.將上述檢測(cè)到的第一組生物分子的表達(dá)代入第一個(gè)模型中,計(jì)算第一個(gè) 化療方案的第一個(gè)病理完全緩解的的預(yù)測(cè)概率;
c.按第一個(gè)病理完全緩解(PCR)的預(yù)測(cè)概率分成第一組與第一個(gè)化療方案相關(guān)的概率區(qū)間(PIS),并且
d.確定第一個(gè)化療方案的化療效果的定量測(cè)量,其中化療效果的第一次定量測(cè)量對(duì)受試者接受的第一個(gè)化療方案的功效具預(yù)測(cè)性。
在此實(shí)施方案另一方面,此方法還包括:
a.確定受試者樣品中有用于預(yù)測(cè)第二個(gè)化療方案效果的第二組生物分子的表達(dá);
b.將上述檢測(cè)到的第二組生物分子的表達(dá)代入第二個(gè)模型中,計(jì)算第二個(gè)化療方案的第二個(gè)病理完全緩解的的預(yù)測(cè)概率;
c.按第二個(gè)病理完全緩解(PCR)的預(yù)測(cè)概率分成第二組與第二個(gè)化療方案相關(guān)的概率區(qū)間(PIS),并且
d.確定第二個(gè)化療方案的化療效果的定量測(cè)量,其中化療效果的第二次定量測(cè)量對(duì)受試者接受的第二個(gè)化療方案的功效具預(yù)測(cè)性。
在另一實(shí)施方案,此方法還包括:
a.確定受試者樣品中有用于預(yù)測(cè)第三個(gè)化療方案效果的第三組生物分子的表達(dá);
b.將上述檢測(cè)到的第三組生物分子的表達(dá)代入第三個(gè)模型中,計(jì)算出第三個(gè)化療方案的第三個(gè)病理完全緩解的的預(yù)測(cè)概率;
c.按第三個(gè)病理完全緩解(PCR)的預(yù)測(cè)概率分成第三組與第三個(gè)化療方案相關(guān)的概率區(qū)間(PIS),并且
d.確定第三個(gè)化療方案的化療效果的定量測(cè)量,其中化療效果的第三次定量測(cè)量對(duì)受試者接受的第三個(gè)化療方案的功效具預(yù)測(cè)性。
在本實(shí)施方案的另一方面,第一組生物分子(多個(gè)分子)是以下1-14組中的至少一組生物分子:
a.組1:SLC12A7,GZMB,TAF6L,及其衍生物;
b.組2:NFIB,METRN,ROPN1B,TTK,CCND1,及其衍生物;
c.組3:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,及其衍生物;
d.組4:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,及其衍生物;
e.組5:NFIB,ROPN1B,TTK,MELK,CTSL2,METRN,及其衍生物;
f.組6:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1,及其衍生物;
g.組7:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,及其衍生物;
h.組8:TSPYL5,SRI,及其衍生物;
i.組9:LRP12,CENPF,TUBD1,KIAA1324,TTK,及其衍生物;
j.組10:DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,CCNE2,及其衍生物;
k.組11:CHD3,CAP1,GPM6B,GUSBP3,及其衍生物;
l.組12:CDKN2C,GNAI3,LMO4,PSRC1,USP1,STK38,及其衍生物;
m.組13:NFIB,ROPN1B,及其衍生物;
n.組14:TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,BANK1,及其衍生物.
在一實(shí)施方案,所述的第二組生物分子(多個(gè)分子)是以下1-14組中的至少一組生物分子:
a.組1:SLC12A7,GZMB,TAF6L,及其衍生物;
b.組2:NFIB,METRN,ROPN1B,TTK,CCND1,及其衍生物;
c.組3:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,及其衍生物;
d.組4:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,及其衍生物;
e.組5:NFIB,ROPN1B,TTK,MELK,CTSL2,METRN,及其衍生物;
f.組6:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1,及其衍生物;
g.組7:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,及其衍生物;
h.組8:TSPYL5,SRI,及其衍生物;
i.組9:LRP12,CENPF,TUBD1,KIAA1324,TTK,及其衍生物;
j.組10:DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1, SIRT3,GTSE1,PCNA,CCNE2,及其衍生物;
k.組11:CHD3,CAP1,GPM6B,GUSBP3,及其衍生物;
l.組12:CDKN2C,GNAI3,LMO4,PSRC1,USP1,STK38,及其衍生物;
m.組13:NFIB,ROPN1B,及其衍生物;
n.組14:TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,BANK1,及其衍生物.
在另一實(shí)施方案,所述的第二組生物分子(多個(gè)分子)是以下1-6組中的至少一組生物分子:
a.組1:SLC12A7,GZMB,TAF6L,及其衍生物;
b.組2:NFIB,METRN,ROPN1B,TTK,CCND1,及其衍生物;
c.組3:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,及其衍生物;
d.組4:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,XCL2,及其衍生物;
e.組5:NFIB,ROPN1B,TTK,MELK,CTSL2,METRN,及其衍生物;
f.組6:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,ABCF1,及其衍生物.
在一些實(shí)施方案中,表達(dá)數(shù)據(jù)可是mRNA表達(dá),蛋白表達(dá),非編碼RNA表達(dá),miRNA表達(dá)。
在一些實(shí)施方案中,用來(lái)為受試者選擇化療方案的方法可能會(huì)涉及到使用來(lái)自一組生物分子中的生物分子。從一組生物分子中選出的生物分子可用做,例如,化療方案效果的定量測(cè)量。而化療效果的定量測(cè)量可幫助醫(yī)療人員確定對(duì)患者有效的某一個(gè)化療方案。在一些實(shí)施方案中,用于受試者選擇化療方案的方法可能會(huì)涉及使用從兩組或更多組分子(包括三組)中選出的一些生物分子。從多組生物分子選擇的生物分子對(duì),例如多個(gè)化療方案效果的定量測(cè)量,非常有用,從而可對(duì)這些化療方案進(jìn)行比較,從而預(yù)測(cè)哪個(gè)化療方案對(duì)患者最有效。
本發(fā)明中的另一個(gè)實(shí)施方案是用來(lái)選擇預(yù)測(cè)化療效果的生物標(biāo)記物的方法。此方法包括:
a.用隨機(jī)樣品篩選(RSS)流程對(duì)一組生物分子進(jìn)行篩選,確定至少一個(gè)基因預(yù)測(cè)因子(genetic predictor);
b.生成一個(gè)模型,此模型應(yīng)整合入至少一個(gè)變量來(lái)代表(多個(gè))基因預(yù)測(cè)因子,模型輸出為模型性能的定量測(cè)度;
c.確定該模型性能的定量測(cè)度;
d.重復(fù)步驟(b)-(c)至少一次,生成(多個(gè))附加模型和相應(yīng)的(多個(gè))模型性能的定量測(cè)度;
e.從一組生物分子中挑出生物標(biāo)記物,以生成的模型中的一個(gè)變量來(lái)代表被選的生物標(biāo)記物,代入以上獲得的模型中有局部最優(yōu)定量測(cè)度的模型。
在本實(shí)施方案的另一個(gè)方面,此方法還包括用以確定在使用上述化療方案后表現(xiàn)出病理完全緩解的第一組受試者和使用同樣化療方案后表現(xiàn)出殘留病灶的第二組受試者之間存在表達(dá)差異的一組生物分子的初始步驟。
如本文所用,“生物標(biāo)記物”是任何診斷標(biāo)記物,例如生化標(biāo)記物,血清標(biāo)記物,基因標(biāo)記物,或其他可用于預(yù)測(cè)化療方案效果的臨床特征。本發(fā)明中的生物標(biāo)記物包括本發(fā)明中的生物分子及其衍生物,例如,但不限于,基因和基因片段,mRNA轉(zhuǎn)錄及其蛋白產(chǎn)物。本發(fā)明中的生物標(biāo)記物也包括DNA修飾,如表觀遺傳修飾和對(duì)給定基因和基因片段的拷貝數(shù)的修改,轉(zhuǎn)錄后修飾的RNA和翻譯后修飾的蛋白。
在一些實(shí)施方案中,“選擇可以預(yù)測(cè)化療方案療效的生物標(biāo)記物”包括從存在于受試者細(xì)胞或分泌的生物分子中選擇生物分子,但不意味著限制以其它任何方式獲得。
在一些實(shí)施方案中,“篩選”指用特定的標(biāo)準(zhǔn)從一組生物分子中選擇一個(gè)或多個(gè)生物分子。
如本文所用,術(shù)語(yǔ)“表達(dá)差異”和其語(yǔ)法變異指在與其它細(xì)胞相關(guān)的特定細(xì)胞里特定的mRNA和/或蛋白的表達(dá)水平的變化。表達(dá)差異包括(多個(gè))生物分子的上調(diào)和下調(diào)。在一些實(shí)施方案中,“差異表達(dá)”生物分子包括在具病理完全緩解(pCR)的受試者和具殘留病灶(RD)受試者上顯示出統(tǒng)計(jì)性差異表達(dá)水平的生物分子。統(tǒng)計(jì)顯著性可通過(guò)使用任何測(cè)量統(tǒng)計(jì)意義的方法來(lái)獲得,包括本領(lǐng)域內(nèi)技術(shù)人員熟識(shí)的方法。這里,統(tǒng)計(jì)顯著性優(yōu)先使用T-test測(cè)定,更優(yōu)則用Welch雙樣本t-檢驗(yàn)來(lái)測(cè)定。
T-tests得到的P-值可檢驗(yàn)統(tǒng)計(jì)顯著性。P-值小于或者等于0.05表示具統(tǒng)計(jì)顯著性,但一個(gè)合適的P-值可由本領(lǐng)域技術(shù)人員輕易獲得。最優(yōu)情況下,本發(fā)明中有表達(dá)差異的生物分子指P-值為0.05或者更小,包括P-值為0.01或者更小,0.001或更小,甚至0.001或更小。
如本文所用,殘留病灶(RD)之前已經(jīng)定義過(guò)。(Kaufmann,et al.,2006,Kuerer,et al.,1999,von Minckwitz,et al.,2012)。
在一些實(shí)施方案中,用隨機(jī)抽樣篩選(RSS)程序來(lái)篩選一組差異表達(dá)的生物分子,確定至少一個(gè)基因預(yù)測(cè)因子。隨機(jī)抽樣篩選的例子,如本文中使用的,包括以下步驟:
a.從探針組S0中隨機(jī)抽取探針樣品C0
b.用C0計(jì)算隨機(jī)森林曲線下面積(area under the curve random forest(AUCRF)或者用另一種機(jī)器學(xué)習(xí)方法由C0得到一組探針R0(x),其中x=1,除非在接下來(lái)的步驟里對(duì)其另有定義;
c.將R0(x)里的探針加入探針組Sy,其中y=1,除非接下來(lái)的步驟對(duì)其另有定義;
d.重復(fù)步驟(a)-(c),其中在步驟(b)的每次迭代中,X增加1;而且
e.重復(fù)步驟(a)–(d),其中用Sy代替S0,在步驟(b)的第一次迭代中,重新設(shè)定X為1,并且在步驟(c)的每次迭代中,Y增加1。
如上文中用到的,“探針”等同于上文中描述的“生物分子”。此外S0被定義為上文中討論的一組有表達(dá)差異性的生物分子。
在一些實(shí)施方案中,探針樣品C0僅受探針組S0的探針數(shù)目限制。探針樣品C0最好有S0組的最少探針數(shù)目的1/4,或者500個(gè)。(the sample of probes C0contains the minimum of the number of probes in S0/4,or 500.)
在一些實(shí)施方案中,隨機(jī)樣品篩選(RSS)過(guò)程中的步驟(d)可以重復(fù)數(shù)十次。步驟(d)重復(fù)上百次更好,最好是重復(fù)一千次。
在一些實(shí)施方案中,隨機(jī)樣品篩選(RSS)過(guò)程中的步驟(e)一直重復(fù),直到Sy里的探針數(shù)目與Sy-1里的探針數(shù)目相同,或者少于50。由此生成探針組Sy里的探針,“基因預(yù)測(cè)子”,可以任意選來(lái)輸入AUCRF,對(duì)基因預(yù)測(cè)子的重要性進(jìn)行排序。如此處所用的,“基因預(yù)測(cè)子”是在對(duì)一組具表達(dá)差異性的生物分子進(jìn)行隨機(jī)樣品篩選后留下的生物分子,最理想的是基因。
在一些實(shí)施方案中,“建立至少一個(gè)包括至少一個(gè)代表基因預(yù)測(cè)子的變量的模型,且此模型能輸出對(duì)其性能的定量測(cè)量”的操作將按以上描述來(lái)執(zhí)行。簡(jiǎn)而言之,可以通過(guò),例如將臨床變量代入隨機(jī)森林模型對(duì)f1-score進(jìn)行初步評(píng)估,來(lái)建立能代入至少一個(gè)代表至少一個(gè)基因預(yù)測(cè)子(例如,一個(gè)基因)的變量的統(tǒng)計(jì)模型。第一個(gè)模型可輸出此模型性能的 定量測(cè)量,并用以評(píng)估。然后,更多的變量,包括至少一個(gè)至少代表一個(gè)基因預(yù)測(cè)子的變量,可以代入模型,以建立更多模型,并輸出更多的模型性能的定量測(cè)量數(shù)據(jù)。最優(yōu)情況下,如果用f1-score作模型性能的定量測(cè)量,f1-score大的模型比f(wàn)1-score小的模型更好。
在一些實(shí)施方案中,“至少一個(gè)變量”代表至少一個(gè)基因預(yù)測(cè)子的變量,例如,一個(gè)將基因預(yù)測(cè)子表達(dá)作為輸入值的變量。當(dāng)前發(fā)明中的其他變量包括臨床變量,例如受試者的年齡和體重。
如此處所用,“確定模型性能的定量測(cè)量”是此領(lǐng)域中眾所周知的技術(shù),通常涉及到計(jì)算某模型質(zhì)量的數(shù)量形式,例如,某給定模型的準(zhǔn)確度,精密度,召回,或者它們的組合。
在當(dāng)前用來(lái)選擇可預(yù)測(cè)化療方案效果的生物標(biāo)記分子的實(shí)施方案中,步驟(b)-(c)可重復(fù)至少一次以獲得額外的(多個(gè))模型以及與此(多個(gè))模型相對(duì)應(yīng)的性能定量測(cè)量數(shù)據(jù)??稍O(shè)想,步驟(b)-(c)可重復(fù)任何次以獲得任意額外的(多個(gè))模型以及與此(多個(gè))模型相對(duì)應(yīng)的性能定量測(cè)量數(shù)據(jù)。優(yōu)化情況下,當(dāng)一個(gè)模型的性能定量測(cè)量獲得局部最大值時(shí),可不再重復(fù)步驟。更優(yōu)化的情況下,上述模型性能定量測(cè)量的局部最大值是第一個(gè)該模型性能定量測(cè)量的局部最大值。
在一些實(shí)施方案中,“從一組生物分子里選擇生物標(biāo)記分子,被選中的生物標(biāo)記分子可用一個(gè)或多個(gè)變量代入以上建成的具有模型性能定量測(cè)量局部最大值的模型來(lái)表示”意味著,一個(gè)能得到模型性能定量測(cè)量局部最大值的模型,以代入該模型的任何變量來(lái)表示的任何生物標(biāo)記分子都可被選中。此外,一個(gè)具備模型性能定量測(cè)量局部最大值的模型如果包括多個(gè)變量來(lái)表示多個(gè)生物分子,那么從以上生物分子中可選出多個(gè)生物標(biāo)記。如本文所用,術(shù)語(yǔ)“最優(yōu)”與模型性能的定量測(cè)量相關(guān),根據(jù)所用的模型性能的定量測(cè)量方法,它可是最大值或最小值。例如,當(dāng)使用f1-值,大數(shù)值比小數(shù)值更優(yōu)。同樣的,當(dāng)f1-值獲得最大值時(shí),就是一個(gè)模型性能的最優(yōu)定量測(cè)量。
本發(fā)明中的一個(gè)附加的實(shí)施方案是一個(gè)用來(lái)為受試者選擇化療方案的系統(tǒng)。該系統(tǒng)包括:
a.一個(gè)可從受試者的某個(gè)樣品里生成一個(gè)數(shù)據(jù)集的數(shù)據(jù)采集模塊,這個(gè)數(shù)據(jù)集包括診斷標(biāo)記物譜,其中所述診斷標(biāo)記物譜可指出至少一個(gè)可預(yù)測(cè)以下化療方案療效的生物分子的表達(dá);其中化療方案包括(i)使用蒽環(huán)類藥物,但無(wú)紫杉醇或多西紫杉醇的化療,(ii)使用蒽環(huán)類和紫杉醇類藥物,但無(wú)多西紫杉醇藥物的化療,和(iii)使用蒽環(huán)類和多西紫杉醇藥 物,但無(wú)紫杉醇藥物的化療;
b.一個(gè)應(yīng)用學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)處理數(shù)據(jù)的數(shù)據(jù)處理模塊,可對(duì)化療方案在受試者上的效果進(jìn)行預(yù)測(cè),生成統(tǒng)計(jì)學(xué)預(yù)測(cè)數(shù)據(jù)。和,
c.一個(gè)顯示統(tǒng)計(jì)學(xué)預(yù)測(cè)數(shù)據(jù)的數(shù)據(jù)顯示模塊。
在一些實(shí)施方案中,從受試者的樣品里生成一個(gè)數(shù)據(jù)集的數(shù)據(jù)采集模塊可是一個(gè)計(jì)算機(jī)系統(tǒng),例如,一個(gè)計(jì)算機(jī)系統(tǒng)可設(shè)定用來(lái)專門收集用本發(fā)明中檢測(cè)生物分子表達(dá)的某個(gè)測(cè)量方法獲得的數(shù)據(jù)。又如,一個(gè)計(jì)算機(jī)系統(tǒng)可設(shè)置成專門收集那些特別針對(duì)本發(fā)明中生物分子的檢測(cè)試劑而獲得的基因芯片數(shù)據(jù)。數(shù)據(jù)采集模塊可進(jìn)一步轉(zhuǎn)化或以其他方式將上述收集到的數(shù)據(jù)進(jìn)行排序,輸出一個(gè)包括診斷標(biāo)記物譜的數(shù)據(jù)集??梢灶A(yù)見(jiàn)的是,本發(fā)明中的數(shù)據(jù)采集模塊可以設(shè)置為從已建立的數(shù)據(jù)庫(kù)中收集數(shù)據(jù),并不需要從一個(gè)特定的測(cè)量方法中獲得數(shù)據(jù)。本發(fā)明中的一個(gè)診斷標(biāo)記物譜包括,但不局限于,可預(yù)測(cè)本發(fā)明中的化療方案在本發(fā)明中的樣品上的效果的至少一個(gè)生物分子的表達(dá)數(shù)據(jù)。在一些實(shí)施方案中,診斷標(biāo)記物譜包括用本發(fā)明中的一個(gè)測(cè)量方法收集到的數(shù)據(jù)子集。
在一些實(shí)施方案中,數(shù)據(jù)處理模塊可設(shè)置為一個(gè)使用學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)處理數(shù)據(jù),可對(duì)一個(gè)化療方案在受試者上的效果進(jìn)行預(yù)測(cè),生成統(tǒng)計(jì)學(xué)預(yù)測(cè)數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)。這個(gè)計(jì)算機(jī)系統(tǒng)可以是和數(shù)據(jù)采集模塊同一個(gè)的計(jì)算機(jī)系統(tǒng),或是分開(kāi)的計(jì)算機(jī)系統(tǒng)。
在一些實(shí)施方案中,學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)是個(gè)模型,最優(yōu)情況是以上提到的統(tǒng)計(jì)模型。在本文中,一個(gè)統(tǒng)計(jì)模型包括各種用于確定獨(dú)立變量(預(yù)測(cè)變量)和響應(yīng)變量之間關(guān)系的數(shù)學(xué)算法。本發(fā)明中,變量可以是臨床變量,例如受試者年齡或體重,或基因變量,例如受試者樣品中可預(yù)測(cè)化療方案效果的生物分子表達(dá)。本發(fā)明中的統(tǒng)計(jì)模型不局限于任何特定數(shù)目的變量。本發(fā)明的統(tǒng)計(jì)模型可以包括一個(gè)或多個(gè)變量。
在一些實(shí)施方案中,學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)包括機(jī)器學(xué)習(xí)技術(shù),它能調(diào)整數(shù)據(jù)集和基于此數(shù)據(jù)集的決策過(guò)程。一些實(shí)施方案使用單個(gè)學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)。另一些實(shí)施方案則使用有多個(gè)學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)的組合。此處描述的學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)可以使用樣品或者從不同受試者,例如,健康受試者,化療后表現(xiàn)病理完全緩解的受試者,化療后仍有病灶的受試者,收集來(lái)的數(shù)據(jù)來(lái)對(duì)系統(tǒng)進(jìn)行訓(xùn)練和測(cè)試。本發(fā)明中對(duì)學(xué)習(xí)統(tǒng)計(jì)分類系統(tǒng)的訓(xùn)練和測(cè)試是本此領(lǐng)域中眾所周知的技術(shù)。
在一些實(shí)施方案中,對(duì)化療方案效果的統(tǒng)計(jì)學(xué)預(yù)測(cè)可以是對(duì)化療效果的定量測(cè)量,例如病理完全緩解值。
在一些實(shí)施方案中,數(shù)據(jù)顯示模塊可以是一個(gè)可顯示視覺(jué)信息的屏幕。本發(fā)明中中首選顯示模塊包括,但不限于,計(jì)算機(jī)顯示器,電視機(jī),平板顯示器和智能手機(jī)顯示器。
在一些實(shí)施方案中,表達(dá)數(shù)據(jù)可選自mRNA表達(dá)數(shù)據(jù),蛋白表達(dá)數(shù)據(jù),非編碼RNA表達(dá)數(shù)據(jù)和miRNA表達(dá)數(shù)據(jù)。
本發(fā)明中的代表性系統(tǒng)可用圖3中的流程圖來(lái)說(shuō)明。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否表達(dá)有以下至少一個(gè)基因:SLC12A7,GZMB,和TAF6L,從而計(jì)算化療方案的預(yù)測(cè)概率和病理完全緩解;和(ii)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用使用蒽環(huán)類藥物的化療。其中化療效果的定量測(cè)量來(lái)自于上述的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患乳腺癌的受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否表達(dá)以下至少一個(gè)基因:NFIB,METRN,ROPN1B,TTK,和CCND1,從而計(jì)算化療方案的預(yù)測(cè)概率和病理完全緩解;和(ii)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療。其中化療效果的定量測(cè)量來(lái)自上述的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否表達(dá)有以下至少一個(gè)基因:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1,從而計(jì)算化療方案的預(yù)測(cè)概率和病理完全緩解;和(ii)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療。其中化療效果的定量測(cè)量來(lái)自上述的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(a)要求檢測(cè)受試者樣品中是否(i)表達(dá)以下至少一個(gè)基因:SLC12A7,GZMB,和TAF6L,從而計(jì)算化療方案的第一預(yù)測(cè)概率和病理完全緩解,以及(ii)表達(dá)以下至少一個(gè)基因:NFIB,METRN,ROPN1B,TTK,和CCND1,從而計(jì)算該化療方案的第二預(yù)測(cè)概率和病理完全緩解;和(b)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用使用蒽環(huán)類藥物,或者蒽環(huán)類和多西紫杉醇藥物的化療。其中化療效果的定量測(cè)量來(lái)自上述的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(a)要求檢測(cè)受試者樣品中是否有(i)表達(dá)以下至少一個(gè)基因:SLC12A7,GZMB,和TAF6L,從而計(jì)算化療方案的第一預(yù)測(cè)概率和病理完全緩解,以及(ii)表達(dá)以下至少一個(gè)基因:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1,從而計(jì)算該化療方案的第二預(yù)測(cè)概率和病理完全緩解;和(b)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用 使用蒽環(huán)類藥物,或者蒽環(huán)類和多西紫杉醇藥物的化療。其中化療效果的定量測(cè)量來(lái)自于上述的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(a)要求檢測(cè)受試者樣品中是否(i)表達(dá)有以下至少一個(gè)基因:NFIB,METRN,ROPN1B,TTK,和CCND1,從而計(jì)算化療方案的第一預(yù)測(cè)概率和病理完全緩解,以及(ii)表達(dá)有以下至少一個(gè)基因:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1,從而計(jì)算該化療方案的第二預(yù)測(cè)概率和病理完全緩解;和(b)根據(jù)化療結(jié)果的定量測(cè)量結(jié)果對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物,或者蒽環(huán)類和多西紫杉醇藥物的化療。其中化療效果的定量測(cè)量即是上述化療方案的病理完全緩解預(yù)測(cè)概率。
在一個(gè)實(shí)施方案中,提供了治療患有乳腺癌的受試者的方法。方法包括:(a)要求檢測(cè)受試者樣品中是否(i)表達(dá)有以下至少一個(gè)基因:SLC12A7,GZMB,和TAF6L,從而計(jì)算化療方案的第一預(yù)測(cè)概率和病理完全緩解,以及(ii)表達(dá)有以下至少一個(gè)基因:NFIB,METRN,ROPN1B,TTK,和CCND1,從而計(jì)算該化療方案的第二預(yù)測(cè)概率和病理完全緩解;以及(iii)表達(dá)有以下至少一個(gè)基因:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1,從而計(jì)算該化療方案的第三預(yù)測(cè)概率和病理完全緩解和(b)根據(jù)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用化療方案,其中包括使用蒽環(huán)類藥物,或蒽環(huán)類和紫杉醇藥物,或者蒽環(huán)類和多西紫杉醇藥物的化療。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否表達(dá)有以下至少一個(gè)基因:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,和XCL2,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有至少以下一個(gè)基因的表達(dá):NFIB,ROPN1B,TTK,MELK,CTSL2,和METRN,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有至少以下一個(gè)基因的表達(dá):TPX2,PTTG1,MCM2,MCM6,AURKA, CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,和ABCF1,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和ER-陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有表達(dá)以下至少一個(gè)基因:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,和STK24,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和ER-陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):TSPYL5和SRI,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和ER-陽(yáng)性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):LRP12,CENPF,TUBD1,KIAA1324,和TTK,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和ER-陽(yáng)性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,和CCNE2,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和淋巴結(jié)陰性乳腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):CHD3,CAP1,GPM6B,和GUSBP3,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和淋巴結(jié)陰性腺癌受試者的方法。方法 包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):CDKN2C,GNAI3,LMO4,PSRC1,USP1,和STK38,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和淋巴結(jié)陽(yáng)性腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):NFIB和ROPN1B,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)基于對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,提供了治療HER2-陰性,和淋巴結(jié)陽(yáng)性腺癌受試者的方法。方法包括:(i)要求檢測(cè)受試者樣品中是否有以下至少一個(gè)基因的表達(dá):TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,和BANK1,從而計(jì)算該化療方案的預(yù)測(cè)概率和病理完全緩解,以及(ii)根據(jù)對(duì)上述的化療效果的定量測(cè)量,即化療方案的病理完全緩解預(yù)測(cè)概率,對(duì)受試者采用使用蒽環(huán)類和多西紫杉醇藥物的化療方案。
在一個(gè)實(shí)施方案中,以上方法中的基因表達(dá)可以是mRNA表達(dá),蛋白表達(dá),非編碼RNA表達(dá),或者是imRNA表達(dá)。
在一個(gè)實(shí)施方案中,基因表達(dá)可以通過(guò)DNA陣列芯片,RNA陣列芯片,寡核苷酸陣列芯片,蛋白陣列芯片,一個(gè)或多個(gè)抗體,一個(gè)或多個(gè)抗原結(jié)合片段,多個(gè)探針,或一組引物來(lái)檢測(cè)。
在一個(gè)實(shí)施方案中,提供了一種為患乳腺癌的受試者選擇化療方案的試劑盒。這個(gè)試劑盒包括了一個(gè)或多個(gè)成分用來(lái)檢測(cè)以下至少一個(gè)基因表達(dá)。這些基因包括:SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,LZTFL1,C11orf17,CCL5,XCL1,XCL2,MELK,CTSL2,TPX2,AURKA,CDKN2C,BRP44,PNP,SMC4,NR4A2,C3orf37,MTPAP,CDC25B,ABCF1,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,STK24,TSPYL5,SRI,LRP12,CENPF,TUBD1,KIAA1324,DBF4,CCNA2,DLGAP5,FHL1,SIRT3,GTSE1,PCNA,CCNE2,CHD3,CAP1,GPM6B,GUSBP3,GNAI3,LMO4,PSRC1,USP1,STK38,BAT2L1,PMP22,NME5,CENPA,和BANK1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:SLC12A7,GZMB,和TAF6L.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:NFIB,METRN,ROPN1B,TTK,和CCND1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,and LZTFL1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,和CCND1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:SLC12A7,GZMB,TAF6L,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:SLC12A7,GZMB,TAF6L,NFIB,METRN,ROPN1B,TTK,CCND1,PTTG1,H2AFZ,WDR45L,DEK,MCM2,USP1,CDT1,TMEM97,RER1,MCM6,和LZTFL1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:SLC12A7,GZMB,C11orf17,TAF6L,CCL5,XCL1,和XCL2.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:NFIB,ROPN1B,TTK,MELK,CTSL2,和METRN.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:TPX2,PTTG1,MCM2,MCM6,AURKA,CDKN2C,BRP44,H2AFZ,PNP,SMC4,DEK,TMEM97,NR4A2,C3orf37,LZTFL1,MTPAP,CDC25B,和ABCF1.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:NFIB,MTAP,SNAPC3,RANBP9,COIL,FAM86B1,ITGA6,S100P,RANBP1,PRSS16,SMARCA2,和STK24.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:TSPYL5和SRI.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:LRP12,CENPF,TUBD1,KIAA1324,和TTK.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:DBF4,DEK,CDC25B,CCNA2,DLGAP5,MCM2,CDKN2C,FHL1,SIRT3,GTSE1,PCNA,和CCNE2.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:CHD3,CAP1,GPM6B,和GUSBP3.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:CDKN2C,GNAI3,LMO4,PSRC1, USP1,和STK38.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:NFIB和ROPN1B.
在一個(gè)實(shí)施方案中,以上試劑盒可檢測(cè)的基因包括:TPX2,BAT2L1,PMP22,PTTG1,NME5,CENPA,和BANK1.
在一個(gè)實(shí)施方案中,以上試劑盒中的一個(gè)或多個(gè)成分可以是在一個(gè)實(shí)施方案中,以上試劑盒中的一個(gè)或多個(gè)成分可以是DNA陣列芯片,RNA陣列芯片,寡核苷酸陣列芯片,蛋白陣列芯片,一個(gè)或多個(gè)抗體,一個(gè)或多個(gè)抗原結(jié)合片段,多個(gè)探針,或一組引物。
附加定義
在本發(fā)明一些實(shí)施方案中,受試者患有癌癥。本發(fā)明中的癌癥包括,但不限于腎上腺皮質(zhì)癌,肛門腫瘤/癌,膀胱腫瘤/癌,骨腫瘤/癌癥(如骨肉瘤),腦腫瘤,乳腺腫瘤/癌癥,類癌,癌,宮頸癌腫瘤/癌,結(jié)腸癌腫瘤/癌,子宮內(nèi)膜腫瘤/癌食管腫瘤/癌,肝外膽管腫瘤/癌,尤因家族腫瘤,顱外生殖細(xì)胞腫瘤,眼腫瘤/癌癥,膽囊腫瘤/癌癥,胃腫瘤/癌,生殖細(xì)胞腫瘤,妊娠滋養(yǎng)細(xì)胞腫瘤,頭頸部腫瘤/癌,下咽癌腫瘤/癌,胰島細(xì)胞癌,腎腫瘤/癌,喉癌腫瘤/癌,白血病,唇和口腔腫瘤/癌,肝癌腫瘤/癌,肺癌腫瘤/癌,淋巴瘤,惡性間皮瘤,Merkel細(xì)胞癌,蕈樣肉芽腫,骨髓增生異常綜合征,骨髓增生性疾病,鼻咽腫瘤/癌癥,神經(jīng)母細(xì)胞瘤,口腔腫瘤/癌,口咽腫瘤/癌,骨肉瘤,卵巢上皮性腫瘤/癌,卵巢生殖細(xì)胞腫瘤,胰腺腫瘤/癌,鼻竇和鼻腔腫瘤/癌,甲狀旁腺腫瘤/癌,陰莖腫瘤/癌,垂體瘤/癌,漿細(xì)胞瘤,前列腺腫瘤/癌,橫紋肌肉瘤,直腸癌腫瘤/癌,腎細(xì)胞瘤/癌,移行細(xì)胞瘤/腎盂癌和輸尿管,唾液腺腫瘤/癌癥,塞扎里綜合征,皮膚腫瘤(如皮膚T細(xì)胞淋巴瘤,卡波西氏肉瘤,肥大細(xì)胞瘤和黑素瘤),小腸腫瘤/癌,軟組織肉瘤,胃腫瘤/癌,睪丸腫瘤/癌,胸腺瘤,甲狀腺腫瘤/癌,尿道腫瘤/癌,子宮腫瘤/癌,陰道腫瘤/癌,外陰腫瘤/癌,和腎母細(xì)胞瘤。具有乳腺癌受試者屬于優(yōu)選實(shí)施方案。
在本發(fā)明的一些實(shí)施方案中,檢測(cè)試劑包括核酸?!昂怂帷被蛘哌@里使用的“寡核苷酸”或“多核苷酸”包括至少兩個(gè)由共價(jià)鍵鏈接的核苷酸。一個(gè)核酸可有多個(gè)變異體,因此,一個(gè)核酸可包括與它相同的核酸以及它的互補(bǔ)序列。
核酸可以是單鏈或者雙鏈,或同時(shí)具有單鏈雙鏈部分。核酸可以是DNA,基因DNA或者互補(bǔ)DNA,RNA,或者雜交核酸,即該核酸可包含脫氧核糖-和核糖-核苷酸的組合,以及包括尿嘧啶,腺嘌呤,胸腺嘧啶,胞嘧啶,鳥(niǎo)嘌呤,肌苷,黃嘌呤次黃嘌呤,異胞嘧啶和異鳥(niǎo)嘌呤等堿基組合。核酸可以被合成為一個(gè)單鏈分子,或使用合成基因在細(xì)胞(體外或 體內(nèi))表達(dá)。核酸可以通過(guò)化學(xué)合成方法或者重組方法獲得。
核酸可以是RNA,例如mRNA,tRNA,短發(fā)夾RNA(shRNA),短干擾RNA(siRNA),雙鏈RNA(dsRNA),轉(zhuǎn)錄后基因沉默RNA(ptgsRNA),Piwi相互作用RNA(Piwi-interacting RNA),初級(jí)miRNA(pri-miRNA),前miRNA(pre-miRNA),微小miRNA(micro-(miRNA),or反-miRNA(anti-miRNA),正如在美國(guó)專利申請(qǐng)?zhí)枮?1/429,720,11/384,049,11/418,870,和11/429,720的專利申請(qǐng)書(shū)和公開(kāi)的國(guó)際專利號(hào)為WO 2005/116250及WO 2006/126040的申請(qǐng)里所描述的。
短干擾RNA基因靶向(siRNA gene-targeting)可以通過(guò)瞬態(tài)轉(zhuǎn)移siRNA進(jìn)入細(xì)胞,并通過(guò)如脂質(zhì)介導(dǎo)的轉(zhuǎn)染(如脂質(zhì)體的封裝,與陽(yáng)離子脂質(zhì),膽固醇,和/或縮合聚合物配位,電穿孔,或顯微注射)等經(jīng)典方法來(lái)實(shí)現(xiàn)。短干擾RNA基因靶向也可用結(jié)合抗體的siRNA,或者結(jié)合有融合蛋白的siRNA來(lái)實(shí)現(xiàn);其中融合蛋白包含了細(xì)胞穿透肽,穿透肽連接了可結(jié)合siRNA的雙鏈RNA-結(jié)合域(DRBD)(可參看美國(guó)專利申請(qǐng)?zhí)枮?009/0093026的專利申請(qǐng))。
一個(gè)短發(fā)夾RNA(shRNA)分子有兩個(gè)序列反向互補(bǔ)區(qū),可以彼此配對(duì)形成分子內(nèi)雙鏈。短發(fā)夾RNA基因靶向(shRNA gene-targeting)可以使用載體轉(zhuǎn)移siRNA進(jìn)入細(xì)胞,比如病毒載體(例如慢病毒載體,腺病毒載體,或腺相關(guān)病毒載體)。siRNA和shRNA的設(shè)計(jì)和合成是業(yè)界熟知的技術(shù),可以從,例如Gene Link(Hawthorne,NY),Invitrogen Corp.(Carlsbad,CA),Thermo Fisher Scientific,和Dharmacon Products(Lafayette,CO)等商業(yè)公司購(gòu)買。.
核酸可以是核酸適體,intramer,或者是spiegelmer。術(shù)語(yǔ)“核酸適體”指的是可以結(jié)合特定分子靶標(biāo)的核酸或者寡核苷酸分子。核酸適體衍生于體外進(jìn)化過(guò)程(例如,SELEX(Systematic Evolution of Ligands by EXponential Enrichment,指數(shù)富集的配基系統(tǒng)進(jìn)化技術(shù)),公開(kāi)在美國(guó)專利5,270,163中),此過(guò)程可從巨大的組合核酸庫(kù)里選出靶標(biāo)特異性的核酸適體。核酸適體可是雙鏈或單鏈,可包括脫氧核糖核苷酸,核糖核苷酸,核苷酸衍生物或其他核苷酸類似分子。適體的核苷酸組分可是已修飾的糖基(例如在核糖苷酸的2’-羥基可用2’-氟基團(tuán)或者2’-胺基取代),這樣可改進(jìn)所期望的屬性,例如,抗核酸酶的抗性或血液中更長(zhǎng)有效期。核酸適體可與其它分子偶聯(lián),例如,與高分子載體偶聯(lián)以減慢適體在循環(huán)系統(tǒng)里的降解速度。核酸配體可以與它們的特異性同源配體交聯(lián),例如,通過(guò)光激活交聯(lián)劑(Brody,E.N.and L.Gold(2000)J.Biotechnol.74:5-13)交聯(lián)。
術(shù)語(yǔ)“intramer”指在體內(nèi)表達(dá)的一類核酸適體。例如,基于牛痘病毒的RNA表達(dá)系統(tǒng)可用來(lái)在白細(xì)胞胞質(zhì)里高水平表達(dá)特異性的RNA核酸適體。(Blind,M.et al.(1999)Proc.Natl.Acad.Sci.USA 96:3606-3610).
術(shù)語(yǔ)“spiegelmer”指包括左旋-DNA,左旋-RNA或其他左旋核苷酸衍生物或核苷酸衍生物的核酸適體。含有左旋核苷酸的適體對(duì)天然存在的降解酶有抗性,因?yàn)檫@類降解酶通常以右旋核苷酸作為底物。
核酸一般包括磷酸二酯鍵,盡管在核酸類似物內(nèi)可有至少一個(gè)不同的連接鍵,例如在氨基磷酸酯,硫代磷酸酯,二硫代磷酸酯,或O-甲基氨基磷酸酯里的連接鍵和肽核酸主鏈和連接鍵。其他核酸包括正主鏈(positive backbone),非離子主鏈,包括在美國(guó)專利5,235,033和5,034,506公布的非核糖主鏈等。核酸還包括那些帶有一個(gè)或多個(gè)非天然或修飾的核苷酸的核酸。例如在核酸5’-末端和/或3’-末端能找到修飾的核苷酸類似物。帶有核糖修飾或主鏈修飾的核酸是核苷酸類似物的代表例子。然而必須要注意的是,堿基修飾的核苷酸,例如在5’-位帶有非天然堿基的核苷酸,例如5-(2-氨基)丙基尿苷,5-溴尿苷和腺苷,和在8-位有修飾的鳥(niǎo)苷酸,例如8-溴鳥(niǎo)苷,脫氮核苷酸,例如7-脫氮腺苷,以及O-和N-烷基化的核苷酸,例如甲基腺苷可歸入此類。2’-羥基團(tuán)可以被下列任何基團(tuán)代替:H,OR,R,鹵素基團(tuán),SH,SR,NH2,NHR,NR2或CN,其中R是C1-C6烷基,鏈烯基或炔基,鹵素基團(tuán)是F,Cl,Br或I。修飾的核苷酸包括與膽固醇共軛的核酸,例如在文獻(xiàn)Krutzfeldt et al.,Nature(Oct.30,2005),文獻(xiàn)Soutschek et al.,Nature 432:173-178(2004)里,和美國(guó)專利申請(qǐng)20050107325中所公開(kāi)的由羥脯氨酸連接的共軛。修飾過(guò)的核苷酸和核酸還包括在美國(guó)專利申請(qǐng)20020115080中所公開(kāi)的鎖核酸(locked核酸s)。其他修飾的核苷酸和核酸可在美國(guó)專利申請(qǐng)20050182005中查詢。核糖-磷酸主鏈可由于不同的原因進(jìn)行修飾,例如,增加這類分子在生理環(huán)境下的穩(wěn)定性和半衰期,增強(qiáng)此類分子的跨膜擴(kuò)散,或者是用作生物芯片上的探針。核酸混合物可由混合天然核酸以及類似物獲得,或混合不同核酸類似物,或者混合不同天然核酸獲得。
在一些實(shí)施方案中,檢測(cè)試劑是蛋白質(zhì)。術(shù)語(yǔ)“肽”,“多肽”和“蛋白質(zhì)”在本文中可互換使用。在本發(fā)明中,該術(shù)語(yǔ)指鏈接的氨基酸序列。氨基酸序列可以是天然的,合成的,或修飾的,或是天然和合成的組合。該術(shù)語(yǔ)包括抗體,抗體模擬物,域抗體,脂質(zhì)運(yùn)載蛋白,靶向蛋白酶,和多肽模擬物。該術(shù)語(yǔ)還包括含有肽或肽片段的疫苗。目的是產(chǎn)生對(duì)抗這些肽或肽片段的抗體。
在一些實(shí)施方案中,檢測(cè)試劑是抗體。如本文中所用,“抗體”和“抗原-結(jié)合片段”涵蓋天然存在的免疫球蛋白(例如,IgM,IgG,IgD,IgA,IgD),和非天然存在的免疫球蛋白,包括,例如,單鏈抗體,嵌合抗體(如,人源化鼠抗),異源抗體(如,雙特異性抗體),和Fab’,F(xiàn)(ab')2,抗原結(jié)合片段(Fab),可變區(qū)(Fv),和重組免疫球蛋白IgG(rIgG)。另見(jiàn),皮爾斯公司產(chǎn)品目錄和手冊(cè),1994-1995(Pierce Chemical Co.,Rockford,IL);Kuby,et al.,1998。如本文所用,“抗原結(jié)合片段”指全長(zhǎng)抗體上保存有識(shí)別抗原的部分,以及包括此部分的各種組合。
非天然的抗體可通過(guò)固相多肽合成來(lái)構(gòu)建,也可通過(guò)重組生產(chǎn),或者通過(guò),例如,篩選由可變重鏈和可變輕鏈組成的組合庫(kù)來(lái)獲得,其中組合庫(kù)在Huse等人的文章中(Huse et al.,Science 246:1275-1281(1989))有描述,并通過(guò)引用結(jié)合到本文中。這些和其他,例如獲得嵌合抗體,人源化抗體,CDR-移植抗體,單鏈抗體和雙功能抗體的方法,是本領(lǐng)域技術(shù)人員熟知的技術(shù)(Winter and Harris,Immunol.Today 14:243-246(1993);Ward et al.,Nature 341:544-546(1989);Harlow and Lane,supra,1988;Hilyard et al.,Protein Engineering:A practical approach(IRL Press 1992);Borrabeck,Antibody Engineering,2d ed.(Oxford University Press 1995);以上的各個(gè)文獻(xiàn)通過(guò)引用結(jié)合到本文中。
全長(zhǎng)抗體可被蛋白酶水解,被消化成若干個(gè)離散,保留抗原識(shí)別能力的功能性抗體片段。例如,木瓜蛋白酶可把全長(zhǎng)的免疫球蛋白裂解成兩個(gè)抗原結(jié)合片段(Fab)和一個(gè)結(jié)晶片段(Fc)。因此,抗原結(jié)合片段通常包括兩個(gè)可變結(jié)構(gòu)域和來(lái)自重鏈和輕鏈的兩個(gè)恒定結(jié)構(gòu)域??勺儏^(qū)片段(Fv)通常被認(rèn)為是抗原結(jié)合區(qū)的一個(gè)組成部分,通常包括兩個(gè)可變區(qū),一個(gè)來(lái)自重鏈(如本文所用VH,“重鏈可變區(qū)”,)和輕鏈(如本文所用的VL,“輕鏈可變區(qū)”)。胃蛋白酶裂解抗體鉸鏈區(qū)下端,因此產(chǎn)生一個(gè)F(ab')2片段和一個(gè)pFc'片段。F(ab')2片段是去除恒定區(qū)(constant region)被消化的完整抗體。兩個(gè)Fab’片段則來(lái)自被酶進(jìn)一步消化的F(ab')2片段。抗原結(jié)合片段的例子包括,但不限于,可變區(qū)(Fv),抗原結(jié)合區(qū)段(Fab),Fab’,Fab’-SH,F(ab’)2,雙抗體,三抗體,單鏈可變區(qū)片段(scFvs),和單域抗體。.
通常,一個(gè)全長(zhǎng)的抗體至少有一個(gè)重鏈和一個(gè)輕鏈。每個(gè)重鏈包含一個(gè)可變結(jié)構(gòu)區(qū)(VH),通常還有三個(gè)或更多的恒定區(qū)(CH1,CH2,CH3,等),而每個(gè)輕鏈有一個(gè)可變區(qū)(VL)和一個(gè)恒定區(qū)(CL)。輕鏈和重鏈的可變區(qū)包含四個(gè)被三個(gè)高變區(qū)(hypervariable regions)亦稱為“互補(bǔ)決定區(qū)”或是“CDRs”打斷的“框架區(qū)”??蚣軈^(qū)和互補(bǔ)決定區(qū)的范圍已經(jīng)被Kabat定義(見(jiàn)文獻(xiàn)Kabat et al.,U.S.Dept.of Health and人Services, Sequences of Proteins of Immunological Interest(1983)and Chothia et al.,J.Mol.Biol.196:901-917(1987))同一物種內(nèi)的不同輕鏈或重鏈的框架區(qū)序列相對(duì)保守??贵w的框架區(qū),即輕鏈和重鏈的組合框架區(qū),能在三維空間中定位和對(duì)齊互補(bǔ)決定區(qū)。
互補(bǔ)決定區(qū)主要結(jié)合抗原的抗原決定簇。每條多肽鏈上的互補(bǔ)決定區(qū)通常稱為互補(bǔ)決定區(qū)1,互補(bǔ)決定區(qū)2,互補(bǔ)決定區(qū)3,從氨基-末端開(kāi)始依次編號(hào),通常還通過(guò)其中特定的互補(bǔ)決定區(qū)所在鏈進(jìn)行定位。因此,重鏈可變區(qū)的互補(bǔ)決定區(qū)3(VH CDR3)位于抗體重鏈的可變區(qū),一個(gè)輕鏈可變區(qū)的互補(bǔ)決定區(qū)1在抗體輕鏈的可變區(qū)。
術(shù)語(yǔ)“單克隆抗體”,如本文所用,指的是從相同的抗體群中獲得的一個(gè)抗體,即構(gòu)成抗體群的各個(gè)抗體相同,除了極少數(shù)可能的有自然突變的抗體。單克隆抗體高度特異,能特異識(shí)別單個(gè)抗原決定簇。修飾語(yǔ)“單克隆”表示該抗體來(lái)自于相同的抗體群的特性,而不是用以詮釋此抗體生產(chǎn)所需的任何特定方法。例如,本發(fā)明所使用的單克隆抗體可通過(guò)最早由Kohler(Kohler et al.,Nature 256:495(1975))等人描述的雜交瘤方法制備,并用體細(xì)胞雜交法對(duì)上述方法進(jìn)行改進(jìn);或者通過(guò)其他重組DNA方法來(lái)獲得。(例如,參見(jiàn)美國(guó)專利4,816,567).
還有其他抗體可以歸入本發(fā)明中的單克隆抗體的一部分,它們包括但不限于,嵌合型抗體,人源化抗體,和人抗體。對(duì)于用在人上的抗體,通常期望能減少源自其他物種的抗體免疫原性,例如小鼠。這個(gè)可通過(guò)構(gòu)建嵌合抗體,或者通過(guò)“人性化”的過(guò)程,來(lái)實(shí)現(xiàn)。在這種情況下,“嵌合抗體”可以理解為一個(gè)融合了來(lái)自一個(gè)物種(例如,小鼠)的一個(gè)結(jié)構(gòu)域(例如,可變區(qū))和另一不同物種(例如,人類)的一個(gè)結(jié)構(gòu)域(例如,恒定區(qū))的抗體。
如本文所用,術(shù)語(yǔ)“人源化抗體”指含有非人源(例如,鼠源)序列的抗體以及人抗體。這類抗體是含有來(lái)自非人源免疫球蛋白的最小序列的嵌合抗體。通常人源化抗體基本包含全部可變區(qū)中的至少一個(gè),通常兩個(gè)可變區(qū),其中所有或基本上所有的高度可變環(huán)(hypervariable loops)與那些非人源免疫球蛋白相對(duì)應(yīng);其中所有或基本上所有的框架區(qū)(FR)是人源免疫球蛋白序列。人源化抗體可選擇性地含有免疫球蛋白恒定區(qū)的至少一部分(Jones et al.,Nature 321:522-525(1986);Riechmann et al.,Nature 332:323-329(1988);and Presta,Curr.Op.Struct.Biol 2:593-596(1992))??贵w人源化的方法基本上可遵循Winter和他同事等人用的方法(Jones et al.,Nature 321:522-525(1986);Riechmann et al.,Nature 332:323-3'27(1988);Verhoeyen et al.,Science 239:1534-1536(1988),用人類抗體的相應(yīng)序列取代鼠源抗體的互補(bǔ)決定區(qū)序列。
此外,基于人類基因組的序列的抗體構(gòu)建技術(shù)已經(jīng)開(kāi)發(fā),例如,噬菌體展示或使用轉(zhuǎn)基因動(dòng)物(WO 90/05144;D.Marks,H.R.Hoogenboom,T.P.Bonnert,J.McCafferty,A.D.Griffiths and G.Winter(1991)"By-passing immunisation.人antibodies from V-gene libraries displayed on phage."J.Mol.Biol.,222,581-597;Knappik et al.,J.Mol.Biol.296:57-86,2000;Carmen and L.Jermutus,"Concepts in antibody phage display".Briefings in Functional Genomics and Proteomics 2002 1(2):189-203;Lonberg N,Huszar D."人antibodies from transgenic mice".Int Rev Immunol.1995;13(1):65-93.;Bruggemann M,Taussig M J."Production of人antibody repertoires in transgenic mice".Curr Opin Biotechnol.1997August;8(4):455-8.)。在本發(fā)明中,這類抗體屬于“人源抗體”。
如本文中所用的,“重組”抗體指的是任何在生產(chǎn)過(guò)程中涉及在生物體內(nèi)表達(dá)編碼所需抗體的非天然DNA序列的一類抗體。本發(fā)明中,重組抗體包括:串聯(lián)scFv(taFv or scFv2),雙抗體(diabody),dAb2/VHH2,knob-into-holes衍生物,SEED-IgG,heteroFc-scFv,Fab-scFv,scFv-Jun/Fos,Fab’-Jun/Fos,tribody,DNL-F(ab)3,scFv3-CH1/CL,Fab-scFv2,IgG-scFab,IgG-scFv,scFv-IgG,scFv2-Fc,F(ab')2-scFv2,scDB-Fc,scDb-CH3,Db-Fc,scFv2-H/L,DVD-Ig,tandAb,scFv-dhlx-scFv,dAb2-IgG,dAb-IgG,dAb-Fc-dAb,和它們的組合。
抗體可變區(qū)通常分離成單鏈可變區(qū)(scFv)或抗原結(jié)合片段。單鏈可變區(qū)片段是由重鏈可變區(qū)(VH)和輕鏈可變區(qū)(VL)組成,兩者之間由短的10-15氨基酸鏈接。一旦分開(kāi),單鏈可變區(qū)片段(scFv)可通過(guò)柔性肽段鏈接,例如,一個(gè)或多個(gè)重復(fù)的Ala-Ala-Ala,Gly-Gly-Gly-Gly-Ser肽段。所產(chǎn)生的肽段,即串聯(lián)的單鏈可變區(qū)片段(taFv or scFv2)可以以不同方式排列,可以是重鏈可變區(qū)-輕鏈可變區(qū)(VH-VL)或是輕鏈可變區(qū)-重鏈可變區(qū)(VL-VH)順序。(Kontermann,R.E.In:Bispecific Antibodies.Kontermann RE(ed.),Springer Heidelberg Dordrecht London New York,pp.1-28(2011)).
如本文中所用,術(shù)語(yǔ)“抗原決定簇”指抗原中被抗體或抗原結(jié)合片段識(shí)別的部分。單個(gè)抗原(例如抗原性多肽)可含有一個(gè)以上的抗原決定簇??乖瓫Q定簇可以從結(jié)構(gòu)或功能上來(lái)定義。功能性抗原決定簇是結(jié)構(gòu)性抗原決定簇的一個(gè)子集,含有直接參與相互作用的氨基酸殘基。抗原決定簇也有構(gòu)象,即,它可由非線性氨基酸構(gòu)成。.在一些特定實(shí)施方案中,抗原決定簇可包含具化學(xué)活性表面基團(tuán)的分子,例如,氨基酸,糖側(cè)鏈,磷?;螯S磺?;?,并且在另一些特定的實(shí)施方案中,抗原決定簇可能有特殊的三維結(jié)構(gòu)特征,和/或特定的電荷特征。由連續(xù)氨基酸序列形成的抗原決定簇在暴露于變性溶劑中后仍能保留其構(gòu)象,而由蛋白三級(jí)折疊形成的抗原決定簇在由變性溶劑處理后完全喪失其構(gòu)象。
以下實(shí)例進(jìn)一步說(shuō)明本發(fā)明中的方法。這些例子是說(shuō)明性的,并不旨在限制本發(fā)明的范圍。.
附圖說(shuō)明
圖1為個(gè)人化化療方案選擇過(guò)程的流程圖。
圖2顯示預(yù)測(cè)的病理完全緩解率和實(shí)際的病理完全緩解率的關(guān)系。
圖3所示為本發(fā)明中為受試者選擇化療方案的系統(tǒng)的流程圖。
具體實(shí)施方式
實(shí)施例1
材料和方法
從GEO數(shù)據(jù)庫(kù)(基因表達(dá)數(shù)據(jù)庫(kù)Gene Expression Omnibus(Takada,et al.,2012,Albain,et al.,2010))中的7個(gè)數(shù)據(jù)序列中收集了1111個(gè)乳腺癌樣品(表格1)。樣品分成三個(gè)治療組:A組(蒽環(huán)類藥物),TA組(紫杉醇和蒽環(huán)類藥物),和TxA組(多西紫杉醇和蒽環(huán)類藥物),用R(Liu,et al.,2012)package Affyio(Edgar,et al.,2002)來(lái)讀取和規(guī)范化 數(shù)據(jù)。所有樣品的反應(yīng)均以病理完全緩解(pCR)或殘留病灶(RD)來(lái)編碼。
表格1
GEO數(shù)據(jù)組以及每組中的病人數(shù)目
*括號(hào)里的數(shù)值為具病理完全緩解的患者在其相應(yīng)治療組中的百分比。
模型建立和評(píng)估
此處所用方法的流程圖如圖1所示。首先,用Welch雙樣本t-檢驗(yàn)(Welch two-sample t-test)找到在病理完全緩解組和病灶殘留組中存在表達(dá)差異的探針。設(shè)置顯著水平為0.05,將具表達(dá)顯著差異的那組探針選出來(lái),將這組候選探針組設(shè)為S0。
用隨機(jī)抽樣篩選(RSS)程序?qū)⒑蜻x探針組S0進(jìn)一步縮小,隨機(jī)抽樣篩選的工作原理如下:
1.隨機(jī)從探針組S0中抽取樣品min{(S0/4),500},將抽取的探針組命名為C0;
2.代入探針組C0中的探針,執(zhí)行AUCRF(Calle,et al.,2011),并記錄下由AUCRF選出的探針組,R0(1);
3.重復(fù)步驟(1)和(2)一千次,記錄所有在R0(1),...,R0(1000)出現(xiàn)的探針,將其設(shè)為S1;
4.用S1代替S0,重復(fù)步驟(1),(2),和(3);在步驟(3)中,不記錄所有在AUCRF出現(xiàn)的探針,而是記錄那些出現(xiàn)率(探針出現(xiàn)次數(shù)與總共取樣次數(shù)(1000)的比值)大于50%的探針;
5.重復(fù)步驟(4)直到迭代n值滿足Sn和Sn-1相同,或者Sn小于50。
Sn是由隨機(jī)抽樣篩選法找出的最后一組候選探針,接下來(lái),代入Sn執(zhí)行AUCRF,在Sn中的探針將根據(jù)它們的重要性進(jìn)行排序。
鑒于數(shù)據(jù)組是不平衡的(有殘留病灶的病人比有病理完全緩解的病人多),所以f1-score連同正精確率(positive precision)和正召回率(positive recall),而不是準(zhǔn)確率(accuracy),被用來(lái)測(cè)量模型功能。F1-score定義為2×精確率(precision)×召回率(recall)/(正確率+召回率)(precision+recall)。從十折交叉驗(yàn)證計(jì)算獲得f1-score,將獨(dú)立使用每個(gè)訓(xùn)練數(shù)值組進(jìn)行上述的篩選過(guò)程操作,從而獲得候選探針組:Sn1,...,Sn10。
為某個(gè)模型選擇重要的探針并評(píng)估模型,可將探針一次一個(gè)(從最高排名)地代入僅有臨床變量的模型(這是個(gè)隨機(jī)森林模型,僅有臨床變量:年齡,ER-狀態(tài),HER2-狀態(tài),t_stage,和n_stage),并記錄過(guò)程中的f1-score。此模型的最優(yōu)探針數(shù)目即是得到第一個(gè)f1-score局部最大值的探針數(shù)目值(此處,局部定義為+/-3探針數(shù))。
除了僅有臨床變量的模型(臨床模型)和有臨床基因變量模型(臨床-基因模型)外,使用從臨床-基因模型中選出的基因也可在每個(gè)治療組中建立僅有基因變量的模型(基因模型)。由此可顯示兩種類型變量的相對(duì)重要性。
方案選擇
一旦三種治療方案的模型建好,每個(gè)患者即可通過(guò)模型計(jì)算得到他實(shí)際接受的治療方案的病理完全緩解的預(yù)測(cè)概率。為了避免過(guò)度擬合,可用十折交叉驗(yàn)證法計(jì)算預(yù)測(cè)概率,這意味著患者的預(yù)測(cè)值將通過(guò)一個(gè)不帶患者信息的模型計(jì)算獲得。將從每個(gè)模型計(jì)算得到的病理完全緩解的預(yù)測(cè)概率排序,并分成5個(gè)概率區(qū)間(probability intervals),這樣每個(gè)概率區(qū)間中的患者人數(shù)大致相同(為平衡每個(gè)區(qū)間覆蓋的概率可以對(duì)其有微小調(diào)整)。每個(gè)區(qū)間的精度(或陽(yáng)性預(yù)測(cè)值)可用在此區(qū)間觀察到的病理完全緩解患者比例來(lái)計(jì)算獲得。這個(gè)比例稱為病理完全緩解值,是一個(gè)患者使用某個(gè)特定治療方案后其預(yù)測(cè)概率落在某個(gè)特定概率區(qū)間的概率。每個(gè)治療方案對(duì)應(yīng)5個(gè)概率區(qū)間有5個(gè)病理完全緩解值。一個(gè)手動(dòng)建立的概率區(qū)間將用來(lái)和按以上描述方法建立的概率區(qū)間做對(duì)比。
下一步,在每個(gè)模型中對(duì)所有患者的病理完全緩解的概率進(jìn)行預(yù)測(cè)。再次,對(duì)那些用來(lái)建模的患者數(shù)據(jù),通過(guò)十折交叉驗(yàn)證法計(jì)算出他們的預(yù)測(cè)概率。每個(gè)患者在由A組,TA組和TxA組化療方案上建成的三個(gè)模型上得到三個(gè)相應(yīng)的病理完全緩解的預(yù)測(cè)概率。然后每個(gè)概率可用來(lái)定位每個(gè)模型的概率區(qū)間。當(dāng)一個(gè)治療方案的最大病理完全緩解值在該方案的概率區(qū)間內(nèi),那這個(gè)治療方案為此患者的最優(yōu)治療方案??紤]到治療方案的毒性,如果A組患者的病理完全緩解值和其他兩組治療方案的病理完全緩解值相差在+/-0.02之間,那么這個(gè)患者可以使用A組治療方案。另外,治療方案的分配也可通過(guò)獲得最大病理完全緩解值來(lái)實(shí)現(xiàn),以獲得比預(yù)期稍高的病理完全緩解值的比例。在給患者分配治療方案后,計(jì)算所有患者的病理完全緩解值的總和,即是預(yù)計(jì)出現(xiàn)病理完全緩解的患者數(shù)目。
人群分層
合并后數(shù)據(jù)集中的患者群相當(dāng)不均勻??捎脦追N方法對(duì)患者群進(jìn)行分層后來(lái)研究分層如何影響研究結(jié)果。研究的患者群中有10%的患者為HER2-陽(yáng)性。目前,針對(duì)HER2-陽(yáng)性患者的有效靶向治療使用曲妥珠單抗(trastuzumab)。在目前臨床條件下,大部分HER2-陽(yáng)性患者都將接受靶向治療。值得一提的是,許多HER2-陽(yáng)性患者除使用曲妥珠單抗(trastuzumab)外,仍接受化療以增加靶向治療的療效。
對(duì)HER2-陰性患者的研究采用與整個(gè)患者群體相同的研究方案,并得到非常類似的結(jié)果。但沒(méi)有足夠的HER2-陽(yáng)性患者進(jìn)行此類研究。HER2-陰性患者按其淋巴結(jié)或ER狀態(tài)進(jìn)一步分層,可分成兩層:(1)淋巴結(jié)-陽(yáng)性和淋巴結(jié)-陰性,和(2)ER-陽(yáng)性和ER-陰性。這種分層的所有患者都是HER2-陰性?;颊叻謱又械囊粋€(gè)問(wèn)題是那些被分出去在較小群體的患者,因?yàn)槿后w小將限制有質(zhì)量的預(yù)測(cè)模型建立。因此,HER2-陰性患者,無(wú)論是接受TA組或者TxA組治療,都將進(jìn)一步分層。而接受蒽環(huán)類藥物治療的患者(A組)將不包括在這些研究中。
比較紫杉醇(T)和多西紫杉醇(Tx)
一些臨床試驗(yàn)已經(jīng)表明了紫杉烷類藥物加入基于蒽環(huán)類藥物的治療方案的益處(Gajria,et al.,2010)。紫杉醇和多西紫杉醇都屬于抗癌化合物紫杉烷類的家族,它們都有相同的主要結(jié)構(gòu)和作用機(jī)制。但是兩者在包括解聚抑制活性,毒性等幾個(gè)方面不同(Verweij,et al.,1994)。對(duì)于初次接受蒽環(huán)類藥物治療的患者,當(dāng)單獨(dú)給藥時(shí),紫杉醇和多西紫杉醇功效類似(Chan,et al.,1999,Sledge,et al.,2003)。一些臨床試驗(yàn)也顯示紫杉醇和多西紫杉醇在改進(jìn)無(wú)病生存率(disease-free survival)和總生存期(overall survival)時(shí)功效相似(De Laurentiis,et al.,2008,Sparano,et al.,2008)。在參與這項(xiàng)研究并表現(xiàn)病理完全緩解的患者中,接受多西紫杉醇的患者(33.1%)比接受紫杉醇的患者(19.7%)多。當(dāng)然,這并不能作為一個(gè)說(shuō)明多西紫杉醇比紫杉醇具有更高療效的有力證據(jù)。依然存在的一個(gè)關(guān)鍵問(wèn)題是:患者對(duì)兩種藥物是否反應(yīng)相似?是否存在一類患者亞群,他們更適合用其中一種藥物,而非另外一種藥物。由于紫杉醇和多西紫杉醇是常用的治療乳腺癌的藥物。這是一個(gè)具有重要臨床意義的問(wèn)題。在此,可用淋巴結(jié)或ER狀態(tài)對(duì)HER-陰性患者的亞群進(jìn)行分層,如前段所述,并將分層后的患者亞群來(lái)進(jìn)行紫杉醇和多西紫杉醇之間的比較研究。
實(shí)施例2
整個(gè)患者群的結(jié)果
模型性能和基因標(biāo)簽(gene signatures)
對(duì)三個(gè)不同治療方案的三個(gè)模型的功能在表格2中列出。帶有臨床和基因變量的模型(clinical-gene models)通常比其他僅有臨床變量的模型(clinical models)和僅有基因變量的模型(gene models)性能更好。加入基因變量的模型在處理治療方案TA和TxA數(shù)據(jù)時(shí),其性能顯著改進(jìn),而在處理治療方案A的數(shù)據(jù)時(shí),三個(gè)模型在性能上并無(wú)大異。基因模型和臨床-基因模型處理治療方案TA和TxA數(shù)據(jù)的性能比臨床模型好很多,顯示基因變量可能是化療反應(yīng)的一個(gè)強(qiáng)大預(yù)測(cè)因子?;谶@些比較,在接下來(lái)的研究中將使用臨床-基因模型。與每個(gè)治療方案中治療反應(yīng)相關(guān)的特征基因組(gene signatures)在表格3中列出。在治療方案A,TA和TxA中的特征基因組分別有3,5,和11個(gè)基因。我們也比較了預(yù)測(cè)的病理完全緩解和實(shí)際的病理完全緩解的關(guān)系。從圖2可以看出他們有很好的正相關(guān)。
表格2
三種模型的性能:僅有臨床變量的臨床模型,有臨床和基因變量的臨床-基因模型,和僅有基因變量的基因模型*
*:A:蒽環(huán)類藥物,TA:蒽環(huán)類和紫杉醇藥物,TxA:蒽環(huán)類和多西紫杉醇藥物粗體數(shù)值是每個(gè)治療方案中的最大值
表格3
從三個(gè)治療方案中選出的基因
*pCR status:“+”:基因在病理完全緩解病例中高水平表達(dá);“-”:基因在病理完全緩解病例中低水平表達(dá).
個(gè)性化治療方案選擇
如在材料和方法部分中所述,每個(gè)模型的預(yù)測(cè)概率首先排序,然后分成5個(gè)相等的區(qū)間。由于每個(gè)化療方案中的病理完全緩解率比殘留病灶率低,被區(qū)間覆蓋的概率呈現(xiàn)偏斜趨勢(shì)。(The probabilities covered by the intervals were skewed due to the fact that pCR rate of each regimen was lower than RD rate.)該分區(qū)允許患者在每個(gè)區(qū)間內(nèi)均勻分布,從而使大部分區(qū)間的預(yù)測(cè)病理完全緩解率(pCR score)更為可靠。當(dāng)病理完全緩解的預(yù)測(cè)值很低時(shí),此模型表現(xiàn)相當(dāng)好。在三個(gè)治療組中的第一區(qū)間的陰性預(yù)測(cè)值(NPV)為97%或更高。在處理TA和TxA組數(shù)據(jù)時(shí),在數(shù)據(jù)值的另一端,即病理完全緩解的預(yù)測(cè)概率高時(shí),模型也表現(xiàn)很好。在這種情況下,陽(yáng)性預(yù)測(cè)值(positive predictive values(PPVs))很高,TA組為0.667而TxA組為0.878。
按照材料和方法部分所描述的方法將最優(yōu)化療方案分配給病人。使用預(yù)測(cè)模型和個(gè)性化方案選擇方法(personalized regimen selection approach(PERS))得到的病理完全緩解值為435.8(表格4,第一排),與最初選擇的方案觀察到的病理完全緩解值(236)提高了84%。
表格4中列出來(lái)自不同分層的患者上的結(jié)果。在HER2-陰性患者中觀察到的結(jié)果與在所有患者上觀察到的結(jié)果類似,這個(gè)是由于90%總患者中有90%是HER2-陰性。其特征基因組(gene signatures)包括許多類似基因??傮w而言,與病人分配的最初化療方案相比,分層后患者的預(yù)計(jì)病理完全緩解有顯著改善。
可從個(gè)性化的治療方案選擇中獲益的病人比例
我們也檢查了那些可能受益于目前可用的個(gè)性化治療方案的患者。對(duì)每個(gè)患者,先計(jì)算出任何兩個(gè)化療方案的病理完全緩解值之間的最大絕對(duì)差(MADPS)。對(duì)應(yīng)于三個(gè)模型(化療方案),每個(gè)病人有三個(gè)病理完全緩解值,即會(huì)有三對(duì)病理完全緩解值的差異值。這三個(gè)差異值的最大絕對(duì)值就是這個(gè)患者的病理完全緩解之的最大絕對(duì)差(MADPS)。MADPS的幅度即表明了個(gè)性化治療方案對(duì)此患者的重要程度。該值接近于0則表明此患者對(duì)所有的化療方案反應(yīng)類似。該值越大,則表明此患者對(duì)至少兩個(gè)化療方案反應(yīng)非常不同??傮w來(lái)說(shuō),相當(dāng)數(shù)量的患者可以從個(gè)性化方案選擇中獲益。
結(jié)論和討論
在本研究中,從接受過(guò)幾種新輔助化療方案的乳腺癌患者上收集的高通量基因表達(dá)數(shù)據(jù)被用來(lái)研究個(gè)性化方案選擇能否使現(xiàn)已接受化療的乳腺癌患者受益。將患者分成3組方案組:只接受蒽環(huán)類藥物化療的患者(A組),接受蒽環(huán)類和紫杉醇類藥物化療的患者(TA組),和接受蒽環(huán)類和多西紫杉醇類藥物的患者(TxA組)。有相當(dāng)數(shù)量的患者對(duì)至少兩個(gè)方案有不同反應(yīng),表明個(gè)性化方案對(duì)于那些選擇這些選項(xiàng)其中一項(xiàng)的患者是非常有益的。另外,變量選擇方法可以選擇少數(shù)基因,這些基因能有效區(qū)分出在某些化療方案中表現(xiàn)更高病理完全緩解的患者。個(gè)性化治療方案選擇(A personalized regimen selection strategy,PERS)的策略根據(jù)數(shù)據(jù)組中的患者設(shè)計(jì)并應(yīng)用到患者上。病理完全緩解率可從21.2%提高到39.3%,增幅84%。接受TA和TxA化療方案的患者,有17.28%的患者有可能過(guò)度治療,這意味如果接受A化療方案,這些患者至少會(huì)有相同的病理完全緩解概率。有9.63%接受A化療方案的患者治療不足,這意味著如果他們接受TA或TxA化療方案,他們有更高的病理完全緩解概率??紤]到治療不足可能是由于費(fèi)用負(fù)擔(dān)原因,當(dāng)前化療方案選擇的策略傾向于用在過(guò)度治療的患者上。
在沒(méi)有化療方案能提高病理完全緩解概率時(shí),本發(fā)明除了可幫助患者選擇最佳化療方案外,病人也可選擇不采取這些化療方案或不參加替代治療,例如臨床試驗(yàn)。個(gè)性化治療方案選擇(PERS)把111個(gè)患者分到化療方案A的第二和第三個(gè)概率區(qū)間;把37個(gè)患者分到化療方案TA的第二和第三個(gè)概率區(qū)間;把94個(gè)患者分到化療方案TxA的前兩個(gè)概率區(qū)間。在所有概率區(qū)間里的負(fù)預(yù)測(cè)值(NPVs)均大于90%。這表明有21.8%患者的病理完全緩解值被預(yù)測(cè)偏低,而他們實(shí)際的病理完全緩解值也很低。盡管是否采用其中的某個(gè)化療方案 是患者的個(gè)人決定,但提供這些信息可以指導(dǎo)患者做決策。另一方面,有175名(15.8%)正預(yù)測(cè)值為0.878的患者被分在化療方案TxA的第五個(gè)概率區(qū)間。另有149名(14.3%)正預(yù)測(cè)值為0.667患者被分在化療方案TA的第五個(gè)概率區(qū)間??偠灾?,這些預(yù)測(cè)可幫助一半以上的患者做決策(并且對(duì)其余患者的決策也非常有用,因?yàn)樗麄兛梢灾啦±硗耆徑獾母怕省?
將本研究中發(fā)現(xiàn)的顯著基因(表格3)與之前研究中的顯著基因(Hatzis,et al.,2011)相比,發(fā)現(xiàn)兩套基因組之間并無(wú)重疊。Hatzis的數(shù)據(jù)集里包括470個(gè)患者,是本研究人群中的一個(gè)子集。鑒于兩組數(shù)據(jù)集之間存在顯著重疊,當(dāng)結(jié)果顯示兩組研究之間并未發(fā)現(xiàn)一個(gè)共同基因時(shí),確實(shí)令人感到意外。我們進(jìn)一步地考察本研究中使用基于不同患者分層建成的模型鑒定出的基因。出乎我們意外,除了占總患者90%的HER2-陰性患者亞群,大部分模型都生成不同的基因組,且只有小部分的相同基因。因此,我們就不同模型獲得的完全病理反應(yīng)的預(yù)測(cè)概率的一致性進(jìn)行研究。
有人可能會(huì)注意到在整個(gè)研究人群中,大部分患者被分配采用化療方案TxA。這是有道理的,因?yàn)榛煼桨窽xA的病理完全緩解率是33%,而化療方案A和TA的病理完全緩解率分別為8.6%和19.7%。用于TxA化療方案的模型具較高的精度,對(duì)TxA的最終療效結(jié)果是有幫助的。本研究中,化療方案A的模型性能比其它兩個(gè)模型都差。這可能是由于化療方案A組中患者總?cè)藬?shù)和病理完全緩解病例比其它兩組低得多造成的。
即使不考慮其中所有HER2-陽(yáng)性患者的數(shù)據(jù),此數(shù)據(jù)集的患者數(shù)據(jù)差異非常大。將不同患者數(shù)據(jù)合并,可幫助找到它們共同的生物標(biāo)記物。進(jìn)一步將數(shù)據(jù)分層,可研究將不同亞群分開(kāi)研究時(shí)是否獲得更一致的結(jié)果。然而,由于某些數(shù)據(jù)層的患者數(shù)目一定,此研究中并未對(duì)數(shù)據(jù)做徹底比較。對(duì)接受TA或者TxA化療方案的HER2-陰性患者,根據(jù)他們的淋巴結(jié)或ER狀態(tài)進(jìn)行分層,生成了類似的結(jié)果。
手動(dòng)方法能使被覆蓋的概率在每個(gè)區(qū)間分布更平衡,同時(shí)使每個(gè)區(qū)間里有足夠的患者數(shù)目以保證獲得可靠的病理完全緩解預(yù)測(cè)值,所以可用來(lái)研究區(qū)間劃分如何影響預(yù)期的病理完全緩解。
表格5
每組化療方案中的患者數(shù)(重劃分的區(qū)間)
*初始方案數(shù)據(jù)是觀察數(shù)據(jù)。(The original group is observed.)
本研究中用到十折交叉驗(yàn)證法。許多以前的研究用不同的訓(xùn)練和測(cè)試數(shù)據(jù)集。原則上,與不同的訓(xùn)練和測(cè)試數(shù)據(jù)集相比,十折交叉驗(yàn)證法不太可能過(guò)度擬合,表明目前使用模型比之前所用模型有更高的普遍性。
本研究中使用的方法可以方便地用于開(kāi)發(fā)其他癌癥的個(gè)人化化療方案選擇,這也將是未來(lái)研究的主題。
實(shí)施例3
來(lái)自HER2-陰性亞群的結(jié)果
用于HER2-陰性亞群的三個(gè)化療方案的三種模型的性能列在表格6中。我們看到用新的方案病理完全緩解率可以有很大的提高。
表格6
每個(gè)化療方案中的患者數(shù)
*初始方案數(shù)據(jù)是觀察數(shù)據(jù)。The original group is observed.
實(shí)施例4
ER-陽(yáng)性患者亞群的結(jié)果
用在ER-陰性患者亞群的三種化療方案上的三種模型性能列于表格7。每個(gè)模型的預(yù)測(cè)概率首先分類,然后分成5個(gè)等距的區(qū)間。用在較低預(yù)測(cè)概率范圍的兩個(gè)模型的負(fù)預(yù)測(cè)值都很好(兩者都大于90%);但是用于較高的預(yù)測(cè)概率范圍的TA模型的正預(yù)測(cè)值略低(33.3%),可能是由于觀察到的病理完全緩解率低導(dǎo)致。新分配方案預(yù)測(cè)顯示病理完全緩解的患者數(shù)量可增加超過(guò)100%,并且表明至少有四分之一的最初使用化療方案TA的患者應(yīng)該用化療方案TxA。由于用紫杉醇和多西紫杉醇這兩種化療方案的患者數(shù)目相當(dāng),所以很難解釋這兩種藥物在使用時(shí)存在顯著偏好。但是有一點(diǎn)很明確,即在最初的化療方案分配里,有更多的患者使用紫杉醇,但病理完全緩解值更低。
表格7
每個(gè)化療方案的患者數(shù)目
*初始方案是觀察數(shù)據(jù)The original group is observed.
實(shí)施例5
ER-陰性亞群的結(jié)果
ER-陰性亞群的兩個(gè)模型表現(xiàn)都很好?;颊卟捎肨A方案的正預(yù)測(cè)值為0.824,在高預(yù)測(cè)概率范圍的患者采用TxA方案的正預(yù)測(cè)值為0.895和0.9;而在低預(yù)測(cè)概率范圍的患者的負(fù)預(yù)測(cè)值為0.9。按五等分劃分的區(qū)間在這個(gè)亞群里均勻分布,重分配后的化療方案結(jié)果表 明雖然方案TxA療效不如方案TA,但仍有部分患者從TA換到TxA后取得更好的療效。與初始化療方案相比,至少有15位患者在換成TxA化療方案后表現(xiàn)出更佳療效,患者表現(xiàn)出更高的預(yù)期病理完全緩解(160.31>125,有30%增加)也證實(shí)了個(gè)人化化療方案能增加患者的病理完全緩解。但是,在此亞群中,紫杉醇療效更優(yōu)于多西紫杉醇,因?yàn)轭A(yù)測(cè)表明更多使用TA化療方案的患者表現(xiàn)出病理完全緩解。
實(shí)施例6
淋巴結(jié)-陽(yáng)性亞群的結(jié)果
淋巴結(jié)-陽(yáng)性亞群兩個(gè)模型的低預(yù)測(cè)概率范圍的負(fù)預(yù)測(cè)值大于90%,而高預(yù)測(cè)概率范圍的正預(yù)測(cè)值為92%。由于TA化療方案的最后一個(gè)區(qū)間覆蓋了大于整個(gè)范圍的65%,有90多名患者在此范圍,因此TA化療方案的區(qū)間被重新劃分。新區(qū)間和它們對(duì)應(yīng)的病理完全緩解值列在表格21中。在此亞群中,重新分配的化療方案表明多西紫杉醇比紫杉醇更有效,使用個(gè)人化化療方案分配后,預(yù)測(cè)表現(xiàn)病理完全緩解的患者數(shù)目大概增加了50%。
實(shí)施例7
淋巴結(jié)陰性亞群的結(jié)果
淋巴結(jié)陰性亞群的兩個(gè)模型的負(fù)預(yù)測(cè)值(NPV)在低預(yù)測(cè)概率范圍內(nèi)偏高,而化療方案TxA的正預(yù)測(cè)值在高預(yù)測(cè)概率范圍偏高。但是化療方案TA的最后一個(gè)區(qū)間覆蓋了相對(duì)長(zhǎng)的范圍,而化療方案TxA的前三個(gè)區(qū)間并無(wú)必要?jiǎng)澐帧T诘皖A(yù)測(cè)概率范圍內(nèi)的負(fù)預(yù)測(cè)值仍很高,而兩個(gè)模型在高預(yù)測(cè)概率范圍內(nèi)的正預(yù)測(cè)值也高。重新分配化療方案結(jié)果表明在此亞群中紫杉醇療效略優(yōu),但如果把至少36名患者的紫杉醇化療方案轉(zhuǎn)成使用多西紫杉醇化療方案,能優(yōu)化病理完全緩解的預(yù)計(jì)值,使預(yù)計(jì)表現(xiàn)病理完全緩解患者數(shù)目提高約85%。
實(shí)施例8
單個(gè)和成對(duì)探針具有預(yù)測(cè)功能
為了測(cè)出鑒定好的探針(基因)組里的每個(gè)單個(gè)探針(基因)或成對(duì)探針(基因)預(yù)測(cè)能力,每個(gè)探針和每對(duì)探針都用十折交叉驗(yàn)證隨機(jī)森林法進(jìn)行操作。測(cè)試部分的f-值(f-score of the test portion)可用來(lái)報(bào)告預(yù)測(cè)能力。要顯示探針的優(yōu)越性,可將結(jié)果與另一組 隨機(jī)挑選的含同樣數(shù)量探針的探針組結(jié)果相比較。從每個(gè)患者群中每個(gè)治療方案中隨機(jī)挑出300組探針。計(jì)算平均f-值和它們的95%置信區(qū)間,用來(lái)評(píng)估鑒定好的探針性能。
我們研究了以下患者群:使用治療方案A并用單個(gè)探針檢測(cè),使用治療方案A并用成對(duì)探針檢測(cè),使用治療方案TA并用單個(gè)探針檢測(cè),使用治療方案TA并用成對(duì)探針檢測(cè),使用治療方案TxA并用單個(gè)探針檢測(cè),和使用TxA治療方案并用成對(duì)探針檢測(cè)。每組患者群按照HER2,和ER,淋巴結(jié)進(jìn)一步分類。我們發(fā)現(xiàn)單個(gè)探針和成對(duì)的探針絕大部分都比隨機(jī)抽取的探針有更好的預(yù)測(cè)力。
本申請(qǐng)中引用的所有文獻(xiàn)均通過(guò)引用整體地結(jié)合于本文中。
盡管本文中已經(jīng)描述了本發(fā)明中的說(shuō)明性實(shí)施例,但是應(yīng)當(dāng)理解,本發(fā)明并不限于所描述的那些實(shí)施例,并且本領(lǐng)域技術(shù)人員在不脫離本發(fā)明范圍和實(shí)質(zhì)的情況下,可對(duì)其進(jìn)行不同的變更或修改。
參考文獻(xiàn)
ALBAIN,K.S.,et al.Prognostic and predictive value of the 21-gene recurrence score assay in postmenopausal women with node-positive,oestrogen-receptor-positive breast cancer on chemotherapy:a retrospective analysis of a randomised trial.Lancet Oncol 2010;11:55-65.
BARRETT,T.,et al.NCBI GEO:archive for functional genomics data sets--update.核酸s Res 2013;41:D991-5.
BUYSE,M.,et al.Validation and clinical utility of a 70-gene prognostic signature for women with node-negative breast cancer.J Natl Cancer Inst 2006;98:1183-92.
CALLE,M.L.,et al.AUC-RF:a new strategy for genomic profiling with random forest.Hum Hered 2011;72:121-32.
CHAN,S.,et al.Prospective randomized trial of docetaxel versus doxorubicin in patients with metastatic breast cancer.J Clin Oncol 1999;17:2341-54.
DE LAURENTIIS,M.,et al.Taxane-based combinations as adjuvant chemotherapy of early breast cancer:a meta-analysis of randomized trials.J Clin Oncol 2008;26:44-53.
DOTAN,E.,et al.Optimizing chemotherapy regimens for patients with early-stage breast cancer.Clin Breast Cancer 2010;10Suppl 1:E8-15.
EDGAR,R.,et al.Gene Expression Omnibus:NCBI gene expression and hybridization array data repository.核酸s Res 2002;30:207-10.
ENG-WONG,J.,et al.Prediction of benefit from adjuvant treatment in patients with breast cancer.Clin Breast Cancer 2010;10Suppl 1:E32-7.
ESSERMAN,L.J.,et al.Chemotherapy response and recurrence-free survival in neoadjuvant breast cancer depends on biomarker profiles:results from the I-SPY
1TRIAL(CALGB 150007/150012;ACRIN 6657).Breast Cancer Res Treat2012;132:1049-62.
FOEKENS,J.A.,et al.Multicenter validation of a gene expression-based prognostic signature in lymph node-negative primary breast cancer.J Clin Oncol 2006;24:1665-71.
GAJRIA,D.,et al.Adjuvant taxanes:more to the story.Clin Breast Cancer 2010;10Suppl 2:S41-9.
GRAESER,M.,et al.A marker of homologous recombination predicts pathologic complete response to neoadjuvant chemotherapy in primary breast cancer.Clin Cancer Res 2010;16:6159-68.
HARBECK,N.,et al.Ten-year analysis of the prospective multicentre Chemo-N0trial validates American Society of Clinical Oncology(ASCO)-recommended biomarkers uPA and PAI-1for therapy decision making in node-negative breast cancer patients.Eur J Cancer 2013;49:1825-35.
HATZIS,C.,et al.A genomic predictor of response and survival following taxane-anthracycline chemotherapy for invasive breast cancer.JAMA 2011;305:1873-81.
HESS,K.R.,et al.Pharmacogenomic predictor of sensitivity to preoperative chemotherapy with paclitaxel and fluorouracil,doxorubicin,and cyclophosphamide in breast cancer.J Clin Oncol 2006;24:4236-44.
IWAMOTO,T.,et al.Gene pathways associated with prognosis and chemotherapy sensitivity in molecular subtypes of breast cancer.J Natl Cancer Inst 2011;103:264-72.KAUFMANN,M.,et al.Recommendations from an international expert panel on the use of neoadjuvant(primary)systemic treatment of operable breast cancer:an update.J Clin Oncol 2006;24:1940-9.
KUERER,H.M.,et al.Clinical course of breast cancer patients with complete pathologic primary tumor and axillary lymph node response to doxorubicin-based neoadjuvant chemotherapy.J Clin Oncol 1999;17:460-9.
LIPS,E.H.,et al.Neoadjuvant chemotherapy in ER+HER2-breast cancer:response prediction based on immunohistochemical and molecular characteristics.Breast Cancer Res Treat 2012;131:827-36.
LIU,J.C.,et al.Seventeen-gene signature from enriched Her2/Neu mammary tumor-initiating cells predicts clinical outcome for人HER2+:ERalpha-breast cancer.Proc Natl Acad Sci U S A 2012;109:5832-7.
LOOK,M.P.,et al.Pooled analysis of prognostic impact of urokinase-type plasminogen activator and its inhibitor PAI-1in 8377breast cancer patients.J Natl Cancer Inst2002;94:116-28.
MIYAKE,T.,et al.GSTP1expression predicts poor pathological complete response to neoadjuvant chemotherapy in ER-negative breast cancer.Cancer Sci 2012;103:913-20.
MOOK,S.,et al.Individualization of therapy using Mammaprint:from development to the MINDACT Trial.Cancer Genomics Proteomics 2007;4:147-55.
OAKMAN,C.,et al.Breast cancer assessment tools and optimizing adjuvant therapy.Nat Rev Clin Oncol 2010;7:725-32.
PAIK,S.,et al.Gene expression and benefit of chemotherapy in women with node-negative,estrogen receptor-positive breast cancer.J Clin Oncol 2006;24:3726-34.
POPOVICI,V.,et al.Effect of training-sample size and classification difficulty on the accuracy of genomic predictors.Breast Cancer Res 2010;12.
SHEN,K.,et al.Cell line derived multi-gene predictor of pathologic response to neoadjuvant chemotherapy in breast cancer:a validation study on US Oncology 02-103clinical trial.BMC Med Genomics 2012;5:51.
SHEN,K.,et al.Cell line derived multi-gene predictor of pathologic response to neoadjuvant chemotherapy in breast cancer:a validation study on US Oncology 02-103clinical trial.BMC Med Genomics 2012;5.
SLEDGE,G.W.,et al.Phase III trial of doxorubicin,paclitaxel,and the combination of doxorubicin and paclitaxel as front-line chemotherapy for metastatic breast cancer:an intergroup trial(E1193).J Clin Oncol 2003;21:588-92.
SPARANO,J.A.,et al.Weekly paclitaxel in the adjuvant treatment of breast cancer. N Engl J Med 2008;358:1663-71.
STRAVER,M.E.,et al.The 70-gene signature as a response predictor for neoadjuvant chemotherapy in breast cancer.Breast Cancer Res Treat 2010;119:551-8.
TABCHY,A.,et al.Evaluation of a 30-gene paclitaxel,fluorouracil,doxorubicin,and cyclophosphamide chemotherapy response predictor in a multicenter randomized trial in breast cancer.Clinical cancer research:an official journal of the American Association for Cancer Research 2010;16:5351-61.
TAKADA,M.,et al.Predictions of the pathological response to neoadjuvant chemotherapy in patients with primary breast cancer using a data mining technique.Breast Cancer Res Treat 2012;134:661-70.
THE CANCER GENOME ATLAS NETWORK.Comprehensive molecular portraits of人breast tumours.Nature 2012;490:61-70.
VAN DE VIJVER,M.J.,et al.A gene-expression signature as a predictor of survival in breast cancer.N Engl J Med 2002;347:1999-2009.
VAN’T VEER,L.J.,et al.Gene expression profiling predicts clinical outcome of breast cancer.Nature 2002;415:530-6.
VERWEIJ,J.,et al.Paclitaxel(Taxol)and docetaxel(Taxotere):not simply two of a kind.Ann Oncol 1994;5:495-505.
VON MINCKWITZ,G.,et al.Definition and impact of pathologic complete response on prognosis after neoadjuvant chemotherapy in various intrinsic breast cancer subtypes.J Clin Oncol 2012;30:1796-804.
WANG,Y.,et al.Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer.Lancet 2005;365:671-9.