專利名稱:胃腸癌的增生標簽及預后的制作方法
技術領域:
本發(fā)明涉及確定患者的癌癥,特別是胃腸癌預后的方法和組合物。具體地,本發(fā)明 涉及基于細胞增生標簽使用遺傳標志物確定癌癥如胃腸癌的預后。
背景技術:
細胞增生是活生物最基本的過程,因此其被增生相關基因的表達水平精確調控 (1)。喪失增生控制是癌癥的標志,因此,與毗鄰的正常組織相比,生長調控基因在腫瘤中異 常表達并不讓人感到詫異(2)。增生改變可伴隨其他細胞性質的改變,如侵入和轉移的能 力,因此,能影響患者的結局。該相關性吸引了大量關注,已經(jīng)進行了許多研究來開發(fā)腫瘤 細胞增生作為潛在的結果指示因子。通常通過流式細胞儀,或更一般地,在組織中通過增生標志物的免疫組化評價來 評估細胞增生(3)。最廣泛使用的增生標志物是Ki-67,其是在除靜止期&外的所有細胞 周期表達的蛋白(4)。通過使用Ki-67,已經(jīng)在惡性腫瘤如乳腺癌、肺癌、軟組織腫瘤和星細 胞瘤中建立了周期細胞比例與臨床結果間的清晰相關性(5)。在乳腺癌中,通過微陣列分析 也已經(jīng)確認了該相關性,這產(chǎn)生了已經(jīng)用于鑒定患者的增生基因表達譜,該患者處于增加 的復發(fā)風險(6)。然而,增生指數(shù)(PI)在結直腸癌(CRC)中作為預后因子產(chǎn)生了相互矛盾的結果, 因此不能在臨床環(huán)境中應用(參見下文)。研究隨患者選擇、取樣方法、截止點水平、抗體 選擇、染色技術及收集和解釋數(shù)據(jù)的方式而變化。方法差異和這些研究的異質性可部分解 釋相互矛盾的結果(7),(8)。Ki-67作為增生標記的用途也具有局限性。Ki-67 PI評價了 活性周期細胞的比例,但沒有給出細胞周期長度的說明(3),(9)。因此,由于不同的周期速 度,具有相似PI的腫瘤可能以不同的速率生長。此外,當Ki-67mRNA在靜止期細胞中不生 產(chǎn)時,在部分結直腸腫瘤中仍可檢測到蛋白,這導致高估的增生速率(10)。因為使用單個增生標志物評估預后在CRC中顯得不可靠(參見下文),需要其他工 具來預測胃腸癌的預后。本發(fā)明基于癌癥預后標志物,特別是胃腸癌預后標志物提供了其 他方法和組合物以幫助癌癥的預后和治療。發(fā)明概述在本發(fā)明的一個方面,使用微陣列來鑒定為癌癥細胞提供增生標簽的基因。這些 基因及其編碼的蛋白質在本文稱為胃腸癌增生標志物(GCPM)。在本發(fā)明的一個方面,預后 的癌癥是胃腸癌,特別是胃癌或結直腸癌。在個別的方面,本發(fā)明包括通過鑒定樣品中至少一種GCPM表達水平測定癌癥預 后的方法。所選GCPM編碼與細胞增生有關的蛋白質,例如細胞周期組分。這些GCPM在確 定基于預后的特定癌癥的最好治療方案的方法中具有附加用途。在個別的方面,與復發(fā)型 腫瘤組織相比,非復發(fā)型腫瘤組織中GCPM水平較高??蓡为毷褂?,或彼此或與其他已知癌 癥標志物組合使用這些標志物。在其他方面,本發(fā)明包括測定癌癥預后的方法,其包括(a)提供癌癥樣品;(b)檢 測樣品中至少一種GCPM家族成員的表達水平;及(c)測定癌癥預后。
在另一個方面,本發(fā)明包括測定至少一種GCPM RNA,例如至少一種mRNA表達水平 的步驟。在另一個方面,本發(fā)明包括檢測至少一種GCPM蛋白表達水平的步驟。在另一個方 面,本發(fā)明包括檢測至少一種GCPM肽水平的步驟。在另一個方面,本發(fā)明包括檢測樣品中 至少一種GCPM家族成員表達水平的步驟。在另一個方面,GCPM是與細胞增生相關的基因, 如細胞周期成分。在其他方面,至少一種GCPM選自本文表A、表B、表C或表D。在另一個方面,本發(fā)明包括檢測至少一種列于本文表A、表B、表C或表D的GCPM 表達水平的方法。在另一個方面,本發(fā)明包括檢測CDC2,MCM6,RPA3,MCM7,PCNA, G22P1, KPNA2, ANLN, APG7L, TOPK, GMNN, RRM1,CDC45L,MAD2L1,RAN, DUT, RRM2, CDK7, MLH3, SMC4L1, CSPG6, P0LD2, P0LE2, BCCIP, Pfs2, TREX1, BUB3, FEN1, DRF1, PREI3, CCNE1, RPA1, P0LE3, RFC4,MCM3,CHEK1,CCND1和⑶C37的至少一種的表達水平的方法。在另一個方面,本發(fā)明 包括檢測 CDC2、RFC4、PCNA、CCNE1、CCND1、CDK7、MCM 基因、FEN1、MAD2L1、MYBL2、RRM2 和 BUB3的至少一種的表達水平。在另一個方面,測定了至少2,或至少5,或至少10,至少15,至少20,至少25,至少 30,至少35,至少40,至少45,至少50或至少75種增生標志物或其表達產(chǎn)物的表達水平,所 述增生標志物或其表達產(chǎn)物例如選自表A、表B、表C或表D ;選自⑶C2,MCM6,RPA3,MCM7, PCNA, G22P1,KPNA2,ANLN, APG7L, TOPK, GMNN, RRM1, CDC45L, MAD2L1, RAN, DUT, RRM2, CDK7, MLH3, SMC4L1, CSPG6, P0LD2, P0LE2, BCCIP, Pfs2, TREX1, BUB3, FEN1, DRF1, PREI3, CCNE1, RPA1, P0LE3, RFC4, MCM3, CHEK1, CCND1 和 CDC37 ;或選自 CDC2、RFC4、PCNA、CCNE1、CCND1、 CDK7、MCM 基因(例如 MCM3、MCM6 禾口 MCM7 的一個或多個)、FEN1、MAD2LU MYBL2、RRM2 禾口 BUB3。在其他方面,測定了所有增生標志物或其表達產(chǎn)物的表達水平,所述增生標志物 或其表達產(chǎn)物例如列于表A、表B、表C或表D的;列于組CDC2,MCM6,RPA3,MCM7,PCNA, G22P1,KPNA2,ANLN,APG7L, TOPK, GMNN, RRM1, CDC45L, MAD2L1, RAN, DUT, RRM2, CDK7, MLH3, SMC4L1, CSPG6, P0LD2, P0LE2, BCCIP, Pfs2, TREX1, BUB3, FEN1, DRF1, PREI3, CCNE1, RPA1, P0LE3,RFC4,MCM3,CHEK1 和 CDC37 ;或列于組 CDC2、RFC4、PCNA、CCNE1、CCND1、CDK7、MCM 基 因(例如 MCM3、MCM6 禾口 MCM7 的一種或多種)、FEN1、MAD2L1、MYBL2、RRM2 禾口 BUB3。在另一個方面,本發(fā)明包括確定癌癥治療方案的方法,其包括(a)提供癌癥樣 品;(b)檢測樣品中至少一種GCPM家族成員的表達水平;(c)基于至少一種GCPM家族成員 的表達水平測定癌癥預后;及(d)根據(jù)預后確定治療方案。在另一個方面,本發(fā)明包括測定至少一種GCPM的裝置,其包括(a)其上具有至少 一種GCPM捕獲劑的基底;及(b)能檢測至少一種捕獲的GCPM、捕獲劑或其復合物的檢測 劑。在另一個方面,本發(fā)明包括檢測癌癥的試劑盒,其包括(a)GCPM捕獲劑;(b)能檢 測捕獲的GCPM、捕獲劑或其復合物的檢測劑;及可選地,(c)使用說明書。在另一個方面,該 試劑盒也包括用于捕獲的GCPM的基底。在另一個方面,本發(fā)明包括使用定量PCR檢測至少一種GCPM的方法,其包括(a) 特異于至少一種GCPM的正向引物;(b)特異于至少一種GCPM的反向引物;(c)PCR試劑 ’及 可選地,(d)反應管和(e)使用說明書的至少一種。本發(fā)明的其它方面包括檢測至少一種GCPM蛋白或肽存在的試劑盒,其包括(a)特異于至少一種GCPM蛋白或肽的抗體或抗體片段;及可選地,(b)抗體或抗體片段的標記 和(c)使用說明書的至少一種。在某些方面,該試劑盒也包括具有至少一種GCPM蛋白或肽 的捕獲劑的基底。在具體的方面,本發(fā)明包括檢測胃腸癌,特別是結直腸癌或胃癌預后的方法,其包 括步驟(a)提供來源于懷疑患有胃腸癌的患者的樣品,例如腫瘤樣品;(b)使用ELISA法 測量GCPM蛋白的存在。在本發(fā)明的其它方面,本發(fā)明的一種或多種GCPM選自本文表A、表B、表C或表D 中概括的組。在本文的下文公開了本發(fā)明的其他方面和實施方案。
參考其特定實施方案和附圖公開了本發(fā)明。圖1 用于取得和應用本文公開的基因增生標簽(GPS)方法的概述。圖2A 根據(jù)基因增生標簽表達水平K均值聚類(K-means clustering)群A的73 個腫瘤到兩組。圖2B :Ki-67PI的棒圖(% );垂直線代表了覆蓋所有樣品的平均Ki-67 PI。 具有大約為該平均值及低于該平均值的增生指數(shù)的腫瘤分別以紅色和綠色顯示。結果顯 示,增生標簽過表達并不總與較高的Ki-67PI相關。圖3 根據(jù)GPS(基因增生信號)表達水平和Ki_67PI的Kaplan-Meier存活曲線。 在結直腸癌群A(a,b)和結直腸癌群B(c,d)中具有低GPS表達的患者中,總存活(OS)和未 復發(fā)存活(RFS)都顯著較短。根據(jù)Ki-67PI,在群A患者的存活率中未觀察到差異(e,f)。 顯示了時序檢驗(Log rank test)的P值。圖4 根據(jù)胃癌患者中GPS (基因增生信號)表達水平的Kaplan-Meier存活曲線。 在該群混合階段的38個胃癌患者中,具有低GPS表達的患者的總存活顯著較短。顯示了時 序檢驗的P值。圖5 顯示處于指數(shù)期(EP)的周期細胞和處于靜止期(SP)的生長經(jīng)抑制的細胞 間11種QRT-PCR確認的基因差異表達的盒須圖(box-and-whisker plot)。盒范圍包括25 到75%數(shù)據(jù)。盒中的水平線代表了中位數(shù)?!绊殹笔亲畲笾岛妥钚≈?排除異常值)。任何 超過從盒末端四分位范圍的3/2倍的點是異常值并以點代表。Y軸代表細胞系RNA和參照 RNA間比率的log2倍改變。使用SPSS軟件進行分析。發(fā)明詳述由于單個增生標志物不足以獲得可信賴的CRC預后,使用微陣列來同時分析多個 生長相關基因以提供測定胃腸腫瘤增生狀態(tài)的更定量和客觀的方法。表1 (下文)舉例說 明了顯示使用增生指數(shù)(PI)作為結直腸癌預后因子的已出版的相互沖突的結果。表1 增生指數(shù)與CRC患者存活相關性研究的總結 與之相反,本發(fā)明成功地⑴通過使用細胞系模型限定了 CRC-特異的基因增生標 簽(GPS);及(ii)測定了 GPS在預測患者結果中的預后重要性及其在兩個獨立的CRC患者 群中與臨床病理變量的相關性。定義在詳細公開本發(fā)明的實施方案前提供本文使用的一些術語的定義是有用的。如本文所用,“抗體”及類似術語指免疫球蛋白分子及免疫球蛋白(Ig)分子的免疫 活性部分,即含有特異結合抗原(與之發(fā)生免疫反應)的抗原結合位點的分子。其包括但 不限于多克隆、單克隆、嵌合、單鏈、Fc、Fab、Fab,、Fab2片段及Fab表達文庫??贵w分子涉 及IgG、IgM、IgA、IgE和IgD的任何一類,這些類別根據(jù)存在于分子中重鏈的性質而彼此不 同。這些抗體也包括亞類,如IgGl、IgG2,及其他。輕鏈可以是k鏈或\鏈。本文提及的 抗體包括所有類、亞類及型。也包括嵌合抗體,例如特異于多于一種來源,例如小鼠或人序 列的單克隆抗體或其片段。其他也包括駝類抗體(camelid antibody)、鯊魚抗體或納米抗 體。術語“標志物”指與生物學現(xiàn)象的存在定量或定性相關的分子?!皹酥疚铩钡膶嵗?包括多核苷酸,如基因或基因片段,RNA或RNA片段;或多肽如肽、寡肽、蛋白質,或蛋白質片 段;或任何代謝產(chǎn)物,副產(chǎn)物,或任何其他鑒定分子,如抗體或抗體片段,不管是否直接或間 接與表型的機理相關。本發(fā)明的標志物包括如本文所公開的核苷酸序列(即GenBank序 列),特別是全長序列,任何編碼序列,任何片段,或其任何互補物。術語“GCPM”或“胃腸癌增生標志物”或“GCPM家族成員,,指標志物,其增加的表 達與積極預后有關,所述積極預后如本文所公開的較低癌癥復發(fā)可能性,但可排除本領域 已知的與胃腸癌預后有關的分子。應理解,術語GCPM不需要標志物僅對胃腸腫瘤特異。相 反,在包括惡性腫瘤在內的其他類型腫瘤中可發(fā)生GCPM表達的改變。GCPM的非限制性例子包括在下文表A、表B、表C或表D中,且包括但不限于具體的組 CDC2、MCM6、RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK、GMNN、RRM1、CDC45L、 MAD2L1、RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、 BUB3、FEN1、DRF1、PREI3、CCNE1、RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 和 CDC37 ;及具體 的組 CDC2、RFC4、PCNA、CCNE1、CCND1、CDK7、MCM 基因(例如 MCM3、MCM6 禾口 MCM7 的一個或 更多)、FEN1、MAD2L1、MYBL2、RRM2 和 BUB3。術語“癌癥”和“癌性的”是指或者描述了哺乳動物中通常以異常或失控的細胞生 長為特征的生理狀態(tài)。癌癥和癌癥病理可以伴隨著例如轉移、干擾鄰近細胞的正常機能、以 異常水平釋放細胞因子或其他分泌產(chǎn)物、抑制或加重炎性或免疫應答、瘤形成、癌前病變、 惡性腫瘤、周圍或遠距離組織或器官如淋巴結的浸潤等。特別包括的是胃腸癌,如食管癌、 胃癌、小腸癌、大腸癌、肛門癌(anal cancer)和直腸癌,特別包括的是胃癌和結直腸癌。術語“結直腸癌”包括結腸癌、直腸癌和/或肛門癌(anus cancer),特別地,腺癌, 也可包括癌(例如鱗狀泄殖腔原癌(squamous cloacogeniccarcinomas)),黑素瘤、淋巴瘤 和肉瘤。也包括表皮樣(無角化鱗狀細胞或基底細胞樣)癌。癌癥可能與特定類型的息肉 或其他傷害有關,例如管狀腺瘤、管形絨毛狀腺瘤(例如絨毛腺管狀息肉(villoglandular polyps))、絨毛狀(例如乳突狀)腺瘤(具有或不具有腺癌)、增生性息肉、錯構瘤、幼年性 息肉、息肉樣癌、假息肉、脂肪瘤或平滑肌肉瘤。癌癥可能與家族性腸息肉病和相關狀況如 加德納綜合征或波-杰綜合征有關。癌癥可能例如與慢性瘺、照射的肛門皮膚、粘膜白斑 病、性病性淋巴肉芽腫、Bowen氏病(上皮內癌)、尖銳濕疣或人類乳頭瘤病毒。在其他方 面,癌癥可能與基底細胞癌、乳腺外佩吉特氏病、泄殖腔源性癌或惡性黑素瘤相關。術語“差異表達的基因”‘差異基因表達”及相似短語指相對于在對照受試樣品(例 如對照樣品)中的表達,其表達在受試樣品(例如受試樣品),特別是癌癥如胃腸癌中被激 活至較高或較低水平的基因。這些術語也包括其表達在如下情況被激活至較高或較低的水 平的基因在相同疾病的不同階段;在復發(fā)或非復發(fā)疾病中;或在具有較高或較低水平增 生的細胞中。差異表達的基因可在多核苷酸水平或多肽水平被激活或抑制,或可經(jīng)歷可變 拼接而導致不同多肽產(chǎn)物。此類區(qū)別可例如通過mRNA水平、表面表達、多肽分泌或其他分 配上的變化而得到證明。差異基因表達可包括比較兩個或更多基因或其基因產(chǎn)物間的表達;或比較兩個 或更多個基因或其基因產(chǎn)物間的表達比率;或比較相同基因的不同加工產(chǎn)物,其在正常受 試對象和患病對象間不同;或在相同疾病的不同階段間不同;或在復發(fā)和非復發(fā)疾病間不 同;或在具有較高和較低增生水平的細胞間不同;或在正常組織和患病組織,特別是癌癥 或胃腸癌間不同。差異表達包括基因或其表達產(chǎn)物在例如正常和患病細胞中、或在經(jīng)歷不 同疾病事件或疾病階段的細胞中、或在具有不同增生水平的細胞中在時間或細胞表達譜上 的定量以及定性差異。術語“表達”包括多核苷酸和多肽的生產(chǎn),特別地,從基因或基因的一部分生產(chǎn) RNA (例如mRNA),且包括RNA或基因或基因的一部分編碼的蛋白質的生產(chǎn),及與表達有關的 可檢測物質的出現(xiàn)。例如,例如來源于蛋白質-蛋白質相互作用、蛋白質-核苷酸相互作用 或類似相互作用的復合物形成也包括在術語“表達”的范圍內。其他例子是結合配體如雜 交探針或抗體結合到基因或其他寡核苷酸、蛋白質或蛋白質片段及結合配體的可視化。因 此,微陣列、雜交印跡(如Northern印跡)、或免疫印跡(如Western印跡)或珠陣列上的
9斑點強度,或通過PCR分析的強度包括在正在說明的生物分子術語“表達”的范圍內。術語“胃癌”包括胃及周圍組織的癌癥,特別是腺癌,且也可包括淋巴瘤和平滑肌 肉瘤。該癌癥可與胃潰瘍或胃息肉有關,且可被分類為突出的、穿透的、蔓延的或這些類別 的任何組合,或,可選地,分類為表面的(鼓起的、扁平的或凹陷的)或貫穿的(excavated)。本文所用術語“長期存活”指在手術或其他治療后存活至少5年,更優(yōu)選存活至少 8年,最優(yōu)選存活至少10年。術語“微陣列”指捕獲劑,優(yōu)選多核苷酸(如探針)或多肽在基底上的有序排 列。參見例如,Microarray Analysis, M. Schena, John Wiley &Sons,2002 ;Microarray Biochip Technology, M. Schena,編著,EatonPublishing,2000 ;Guide to Analysis of DNA Microarray Data, S.Knudsen, John Wiley & Sons,2004 ;和 Protein Microarray Technology,D. Kambhampati,編著,John Wiley & Sons,2004。術語“寡核苷酸”指多核苷酸,一般是探針或引物,包括但不限于單鏈脫氧核苷 酸,單鏈或雙鏈核苷酸,RNA :DNA雜化物及雙鏈DNA。寡核苷酸如單鏈DNA探針寡核苷酸經(jīng) 常利用化學方法合成,例如通過使用可商購的自動寡核苷酸合成儀,或通過多種其他方法, 包括體外表達系統(tǒng),重組技術及在細胞和生物體中的表達。當以單數(shù)或復數(shù)形式使用時,術語“多核苷酸” 一般指任何多核苷酸或多脫氧核苷 酸,其可以是未修飾的RNA或DNA或修飾的RNA或DNA。這包括但不限于單鏈和雙鏈DNA, 包括單鏈和雙鏈區(qū)域的DNA,單鏈和雙鏈RNA,包括單鏈和雙鏈區(qū)域的RNA,包含可以是單鏈 或更一般地是雙鏈或包括單鏈和雙鏈區(qū)域的DNA和RNA的雜化物分子。也包括包含RNA或 DNA或既包含RNA又包含DNA的三鏈區(qū)域。特別包括mRNA、cDNA和基因組DNA。該術語包 括包含一個或更多個修飾堿基如氚化堿基或稀有堿基如肌苷的DNA和RNA。本發(fā)明的多核 苷酸能包括編碼或非編碼序列,或正義或反義序列。如本文所用,“多肽”指寡肽、肽或蛋白質序列,或其片段,及天然發(fā)生的、重組的、 合成的或半合成的分子。其中本文引用的“多肽”指天然發(fā)生的蛋白質分子的氨基酸序列, “多肽”及類似術語不意味著限定氨基酸序列為全長分子的完整天然氨基酸序列。應理解, 本文每一次引用“多肽”或類似術語時均包括全長序列及其任何片段、衍生物或變體。術語“預后”指醫(yī)療結果(例如長期存活的可能性)的預測;消極預后或壞結果, 包括疾病復發(fā)、疾病進展(例如腫瘤生長或轉移,或藥物抗性)或死亡的預測;積極預后或 好結果,包括疾病緩和(例如無病狀態(tài))、改善(例如腫瘤退行)或穩(wěn)定的預測。術語“預后標簽”、“標簽”及類似術語指兩個或更多個標志物的集,例如GCPM,其在 作為一個集合一起進行分析時允許測定或預測事件,如結直腸癌的預后結果。應用包含兩 個或更多個標志物的標簽降低了個體差異的影響并允許更可靠的預測。GCPM的非限制性實 例包括在下文的表A、表B、表C或表D中,并包括但不限于具體的組CDC2、MCM6、RPA3、MCM7、 PCNA、G22P1、KPNA2、ANLN、APG7L、T0PK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、RRM2、CDK7、 MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、PREI3、CCNE1、 RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 和 CDC37 ;及具體的組 CDC2、RFC4、PCNA、CCNE1、 CCND1、CDK7、MCM 基因(例如 MCM3、MCM6 和 MCM7 的一個或多個)、FEN1、MAD2L1、MYBL2、RRM2 和 BUB3。在本發(fā)明的上下文中,述及任何特定集(例如任何標簽)中所列的“至少一個”‘至少兩個” “至少五個”標志物等等時,表示所列標志物中的任何一個或任何個和全部組合。術語“預測方法”定義為覆蓋來自統(tǒng)計學、機器學習、人工智能和數(shù)據(jù)挖掘領域的 較寬方法種類,其可用來確定預測模型。這些在發(fā)明詳述部分進一步討論。術語“預測模型”指通過對數(shù)據(jù)集合應用預測方法而獲得的特定數(shù)學模型。在本 文詳述的實施例中,這樣的數(shù)據(jù)集由采自復發(fā)和非復發(fā)結直腸癌患者組織樣品中的基因活 性測量結果組成,其中各樣品的分類(復發(fā)或不復發(fā))是已知的。此模型可用來(1)將復 發(fā)狀態(tài)未知的樣品歸類為復發(fā)或非復發(fā),或(2)基于未知樣品中指定基因集的mRNA表達水 平或表達產(chǎn)物的測量結果,進行代表未知樣品具有復發(fā)可能性的概率預測(即,產(chǎn)生欲解 釋為概率的比例或百分比)。有關這些基因特異性測量結果如何組合起來產(chǎn)生分類和概率 預測的確切細節(jié),取決于用來構建模型的預測方法的具體機制。術語“增生”指導致細胞大小或細胞數(shù)量增加的過程,并且可包括如下一種或多 種腫瘤或細胞生長、血管發(fā)生、神經(jīng)支配和轉移。術語“qPCR” 或 “QPCR” 指例如 PCR Technique Quantitative PCR, J. ff. Larrick 編輯,Eaton Publishing,1997 禾口 A-Z of Quantitative PCR, S. Bustin 編輯,IUL Press, 2004中所述的定量聚合酶鏈式反應。術語“腫瘤”指所有惡性或良性的瘤形成性細胞生長和增生,以及所有癌前及癌細 胞和組織?!办`敏性”、“特異性”(或“選擇性”)和“分類率” (classification rate)在用于 描述預測模型的效力時表示如下含義“靈敏性”指真陽性樣品(通過模型)也被預測為陽性的比例。在用于腫瘤復發(fā)的 檢驗中,這將是復發(fā)腫瘤通過模型預測為復發(fā)的比例?!疤禺愋浴被颉斑x擇性”表示真陰性樣 品(通過模型)也被預測為陰性的比例。在用于CRC復發(fā)的檢驗中,這等于非復發(fā)樣品通 過模型被預測為非復發(fā)的比例。“分類率”是所有樣品通過預測模型正確分類(不管是陽性 還是陰性)的比例。如本文所定義,“嚴緊條件”或“高嚴緊條件”通常(1)采用低離子強度和高溫 進行洗滌,例如0.015M氯化鈉/0.0015M檸檬酸鈉/0. 十二烷基磺酸鈉,50°C ; (2)雜 交期間采用變性劑(如甲酰胺),例如50% (v/v)甲酰胺,與0. 牛血清白蛋白/0. Ficoll/0. 聚乙烯吡咯烷酮/50mM磷酸鈉緩沖液pH 6. 5,與750mM氯化鈉,75mM檸檬酸 鈉,42°C;或(3)采用50%甲酰胺,5父55((0. 75M NaCl,0. 075M檸檬酸鈉),50mM磷酸鈉(pH 6. 8),0. 焦磷酸鈉,5X,Denhardt 溶液,超聲處理的鮭精 DNA(50 u g/ml), 0. 1% SDS,和 10%硫酸葡聚糖,42°C,并在0. 2XSSC(氯化鈉/檸檬酸鈉)中于42°C和50%甲酰胺中于 55 °C洗滌,接著是包括于55°C在含EDTA的0. 1XSSC中的高嚴緊洗滌?!爸械葒谰o條件”可如Sambrook等人,《分子克隆實驗指南》(MolecularCloning :A Laboratory Manual),紐約冷泉港出版社(Cold SpringHarbor Press),1989 所述予以確 認,并且包括使用不如上文所述嚴緊的洗滌溶液和雜交條件(如溫度、離子強度和SDS% )。 中等嚴緊條件的一個實例是于37°C在包含20%甲酰胺,5XSSC(150mM NaCl, 15mM檸檬酸 三鈉),50mM磷酸鈉(pH 7. 6) ,5XDenhardt溶液,10%硫酸葡聚糖和20mg/ml變性剪切鮭 精DNA的溶液中過夜孵育,接著在IX SSC中于大約37-50°C洗滌濾膜。熟練技術人員將會 明了如何對溫度、離子強度等進行必要的調整,以適應諸如探針長度等因素。
除非另有說明,本發(fā)明的實施將采用分子生物學(包括重組技術)、微生物學、 細胞生物學和生物化學的常規(guī)技術,這落入本領域技術范圍內。這樣的技術在文獻中有 充分的說明,例如《分子克隆實驗指南》,第2版,Sambrook等人,1989 ;Oligonucleotide Synthesis,MJ Gait 1984 ;Animal Cell Culture, R. I. Freshney 1987 ;Methods in Enzymology, Academic Press, Inc. ;Handbook of Experimental Immunology, 第 4 fk, D. M. Weir & CC. Blackwell H Blackwell Science Inc. , 1987 ;GeneTransfer Vectors for Mammalian Cells, J. M. Miller & M. P. Calos編輯,1987 ;Current Protocols in Molecular Biology, F. M. Ausubel 1987 ; \)JsR PCR :The Polymerase Chain Reaction, Mullis 等人編輯,1994。本發(fā)明實施方案的描述細胞增生是某些惡性結果的指示。然而,在結直腸癌中,已報道了不一致的結果。 由于這些結果均基于單個增生標志物,本發(fā)明公開了克服該缺陷的微陣列的用途,以獲得 更穩(wěn)靠的結論并測定細胞增生在結直腸癌預后中的作用。本文顯示的基于微陣列的增生研 究表明,結直腸癌中增生標簽減少的速率與不良結果有關。因此,本發(fā)明可用于鑒定處于癌 癥早期死亡高風險中的患者。本發(fā)明提供用于確定疾病預后,例如包括胃腸腫瘤在內的腫瘤復發(fā)可能性的標志 物。已經(jīng)通過使用本發(fā)明的方法發(fā)現(xiàn)大量標志物與胃腸癌進展有關,并能用于確定癌癥預 后。取自結直腸腫瘤各個階段患者的樣品的微陣列分析已經(jīng)導致了驚人發(fā)現(xiàn)標志物表達 的特定模式與癌癥預后有關。某些GCPM如與細胞增生相關的標志物的增加是積極預后的指示。這能包括標準 治療后癌癥(特別是胃腸道癌如胃癌或結直腸癌)復發(fā)可能性的降低。與此相反,這些標 志物的降低是消極預后的指示。這能包括疾病進展或癌癥(特別是胃腸道癌如胃癌或結直 腸癌)復發(fā)可能性的增加??衫缤ㄟ^比較受試樣品(例如腫瘤樣品)和與積極預后有關 的樣品確定表達的減少。可例如通過比較受試樣品(例如腫瘤樣品)和與消極預后有關的 樣品確定表達的增加。例如,為了獲得預后,可將患者的樣品(例如腫瘤樣品)與具有已知患者結果的樣 品比較。假如患者的樣品顯示了可與具有良好結果的樣品相比的增加的GCPM表達,和/或 比具有不良結果的樣品高的GCPM表達,則暗示了積極預后。假如患者的樣品顯示了可與具 有不良結果的樣品相比的降低的GCPM表達,和/或比具有良好結果的樣品低的GCPM表達, 則暗示了消極預后??蛇x地,患者的樣品可與活性增生/未增生腫瘤細胞的樣品相比。假 如患者的樣品顯示了可以與活性增生細胞相比的和/或比未增生細胞高的增加的GCPM表 達,就暗示了積極的預后。如果患者的樣品顯示了可以與未增生細胞相比和/或比活性增 生細胞低的降低的GCPM表達,則暗示了消極的預后。本發(fā)明提供了一套基因,其從患有各階段腫瘤的癌癥患者鑒定而來并概括在表C 中,且顯示其預后結直腸癌。這些基因全與細胞增生相關并建立了細胞增生基因和其在腫 瘤預后中應用間的關系。也已經(jīng)發(fā)現(xiàn),在列于表C中的預后標簽中的基因也與其他細胞增 生基因相關。基于這些發(fā)現(xiàn),本發(fā)明也提供了顯示在表D中用做預后標志物的一套細胞周 期基因,其在高增生和低增生組間差異表達。此外,基于預后和細胞增生相關基因間相關性 的令人驚奇的發(fā)現(xiàn),本發(fā)明也提供了一套在高增生和低增生狀態(tài)的細胞系間差異表達的增生相關基因(表A)和已知的增生相關基因(表B)。在表A、表B、表C和表D中概括的基因 提供了一套胃腸癌預后標志物(GCPM)。作為一種方法,一組標志物(例如GCPM)的表達可通過包括線性判別分析(Linear Discriminant Analysis,LDA)在內的技術進行分析,以做出預后得分。選擇的標志物組和 預后得分計算能通過大量實驗室檢驗和多個獨立臨床發(fā)展研究而獲得。因此,公開的GCPM提供了確定癌癥預后和建立特異于該腫瘤的治療方案的有用 工具。特別地,患者能使用積極預后來決定進行標準或較少侵入性的治療選擇?;颊吣苁?用消極預后來決定終止治療或進行高度侵入性或實驗性的治療。此外,患者能基于其對細 胞增生或細胞增生標志物(例如GCPM)表達的影響而選擇治療。與本發(fā)明一致,特異性針 對具有高增生的細胞或特異性降低細胞增生標志物(例如GCPM)表達的治療對患有胃腸癌 例如結直腸癌或胃癌的患者不是優(yōu)選的治療??梢酝ㄟ^使用任何合適的技術檢測腫瘤組織、接近腫瘤的組織、淋巴結樣品、血液 樣品、血清樣品、尿液樣品或糞便樣品中的GCPM水平,所述技術包括但不限于寡核苷酸探 針、定量PCR或抗所述標簽的抗體。樣品中一個GCPM的表達水平將是該受試對象復發(fā)可能 性的指示。然而,請理解,分析多個GCPM表達的存在和數(shù)量及構建增生標簽增加了預后靈 敏性和準確度。因此,可以使用多個根據(jù)本發(fā)明的標志物來測定癌癥預后。本發(fā)明涉及一組標志物,特別是GCPM,其表達具有預后價值,特別是具有關于無癌 癥存活的預后價值。在特定方面,癌癥是胃腸癌,特別是胃癌和結直腸癌,且在其他方面,結 直腸癌是腺癌。在一個方面,本發(fā)明涉及預測癌癥患者長期存活而不復發(fā)癌癥的可能性的方法, 其包括測定獲自該患者的樣品中一個或更多個增生標志物或其表達產(chǎn)物的表達水平,該水 平用樣品中所有RNA轉錄物或其產(chǎn)物、或參照組的RNA轉錄物或其表達產(chǎn)物的表達水平進 行標準化,其中增生標志物是本文表A、表B、表C或表D中列出的一個或更多個標志物的轉 錄物。在具體的方面,一個或更多個GCPM表達水平的降低指示了無癌癥復發(fā)長期存活可能 性的降低,而一個或更多個GCPM表達水平的增加指示了無癌癥復發(fā)長期存活可能性的增 加。在其他方面,測定了一個或更多個,例如至少2個,或至少3個,或至少4個,或至 少5個,或至少10個,或至少15個,或至少20個,或至少25個,或至少30個,或至少35個, 或至少40個,或至少45個,或至少50個,或至少75個增生標志物或其表達產(chǎn)物的表達水 平,所述增生標志物或其表達產(chǎn)物例如選自表A、表B、表C或表D ;選自⑶C2、MCM6、RPA3、 MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、RRM2、 CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、PREI3、 CCNE1、RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 或 CDC37 ;或選自 CDC2、RFC4、PCNA、CCNE1、 CCND1、CDK7、MCM 基因(例如 MCM3、MCM6 和 MCM7 的一個或更多個)、FEN1、MAD2L1、MYBL2、 RRM2 禾口 BUB3。在另一個方面,該方法包括測定所有增生標志物或其表達產(chǎn)物的表達水平,所述 增生標簽或其表達產(chǎn)物例如列于表A、表B、表C或表D ;列于組⑶C2、MCM6、RPA3、MCM7、 PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、RRM2、CDK7、 MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、PREI3、CCNE1、RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 和 CDC37 ;或列于組 CDC2、RFC4、PCNA、CCNE1、CCND1、 CDK7、MCM 基因(例如 MCM3、MCM6 和 MCM7 的一個或更多個)、FEN1、MAD2L1、MYBL2、RRM2 和 BUB3。本發(fā)明包括利用存檔的石蠟包埋活檢材料來分析集中所有的標志物,因此與最廣 泛可用的活檢材料類型兼容。本發(fā)明也與若干不同的腫瘤組織收獲方法兼容,例如,核芯針 活檢或細針抽吸。在某些方面,從固定的石蠟包埋患者癌組織樣本中分離RNA。分離可以, 例如自核芯針活檢組織或細針抽吸細胞,通過本領域已知的任何技術進行。在另一個方面,本發(fā)明涉及包含與下述兩種或更多種標志物雜交的多核苷酸的陣 列,所述標志物選自表A、表B、表C或表D;選自CDC2、MCM6、RPA3、MCM7、PCNA、G2 2P1、KPNA2、 ANLN、APG7L、T0PK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、 P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、PREI3、CCNE1、RPA1、P0LE3、RFC4、 MCM3、CHEK1、CCND1 和 CDC37 ;或選自 CDC2、RFC4、PCNA、CCNE1、CCND1、CDK7、MCM 基因(例 如 MCM3、MCM6 禾口 MCM7 的一個或更多個)、FEN1、MAD2L1、MYBL2、RRM2 禾口 BUB3。在具體方面,陣列包括與列于表A、表B、表C或表D ;列于組⑶C2、MCM6、RPA3、 MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、RRM2、 CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、PREI3、 CCNE1、RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 和 CDC37 ;或列于組 CDC2、RFC4、PCNA、CCNE1、 CCND1、CDK7、MCM 基因(例如 MCM3、MCM6 和 MCM7 的一個或更多個)、FEN1、MAD2L1、MYBL2、 RRM2和BUB3的標志物的至少3種,或至少5種,或至少10種,或至少15種,或至少20種, 至少25種,至少30種,至少35種,至少40種,至少45種,至少50種,或至少75種或全部 雜交的多核苷酸。在另一個特定方面,陣列包含與列于表A、表B、表C或表D ;列于組⑶C2、MCM6、 RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK、GMNN、RRM1、CDC45L、MAD2L1、RAN、DUT、 RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREX1、BUB3、FEN1、DRF1、 PREI3、CCNE1、RPA1、P0LE3、RFC4、MCM3、CHEK1、CCND1 和 CDC37 ;或列于組 CDC2、RFC4、PCNA、 CCNE1、CCND1、CDK7、MCM 基因(例如 MCM3、MCM6 和 MCM7 的一個或更多個)、FEN1、MAD2L1、 MYBL2、RRM2和BUB3的標志物的全集雜交的多核苷酸。多核苷酸可以是cDNA或寡核苷酸,且其上展示它們的固體表面可以例如是玻璃。 多核苷酸可與本文公開的一個或更多個標志物雜交,例如與全長序列、其任何編碼序列、任 何片段或任何互補物雜交。仍是在另一個方面,本發(fā)明涉及預測診斷為患有癌癥的患者長期存活而無癌癥復 發(fā)的可能性的方法,其包括下述步驟(1)測定獲自患者的樣品中列于本文表A、表B、表C 或表D的全基或子集標志物的RNA轉錄物或表達產(chǎn)物的表達水平,用樣品中全部RNA轉錄 物或其表達產(chǎn)物、或參照組RNA轉錄物或其產(chǎn)物的表達水平標準化;(2)將步驟(1)中獲得 的數(shù)據(jù)進行統(tǒng)計分析;及(3)測定長期存活可能性是否增加或減少。仍是在另一個方面,本發(fā)明涉及為患者例如癌癥患者制作個體化基因組譜 (profile)的方法,其包含下述步驟(a)將獲自患者的樣品進行表達分析;(b)測定選自列 于表A、表B、表C或表D任何一個的標志物集合的一個或更多個標志物的表達水平,其中表 達水平用對照基因進行標準化,及可選地,與參照組中發(fā)現(xiàn)的數(shù)量相比較;及(c)創(chuàng)建總結了從表達分析獲得的數(shù)據(jù)的報告。該報告可例如包括預測患者長期存活可能性和/或推薦 患者的治療方式。在其他方面,本發(fā)明涉及預后方法,其包含(a)對獲自患者的樣品進行至少一個 選自本文表A、表B、表C或表D的標志物的RNA轉錄物或其產(chǎn)物表達水平的定量分析,及(b) 如果標志物或其產(chǎn)物的經(jīng)標準化的表達水平高于定義的表達臨界點,則鑒定患者可能具有 增加的長期存活可能性而無癌癥復發(fā)。在可選的方面,步驟(b)包含鑒定患者可能具有減 少的無癌癥復發(fā)的長期存活可能性,如果標志物或其產(chǎn)物的經(jīng)標準化的表達水平降低到低 于定義的表達臨界點。特別地,增生標志物相對低的表達與不良結果有關。這可包括疾病進展或增加的 癌癥復發(fā)可能性,特別是對胃腸癌如胃癌和結直腸癌。與此相反,增生標志物相對高的表達 與良好結果有關。這可包括標準治療后降低的癌癥復發(fā)可能性,特別是對胃腸癌如胃癌或 結直腸癌。低表達可例如通過比較受試樣品(例如腫瘤樣品)和與積極預后有關的樣品而 確定。高表達可例如通過比較受試樣品(例如腫瘤樣品)和與消極預后有關的樣品而確定。例如,為了獲得預后,可將患者樣品(例如腫瘤樣品)與具有已知患者結果的樣品 比較。如果患者樣品顯示了可與具有良好結果的樣品相比和/或比具有不良結果的樣品高 的GCPM高表達,則暗示了積極預后。如果患者樣品顯示了可與具有不良結果的樣品相比和 /或比具有良好結果的樣品低的GCPM低表達,則暗示了消極預后??蛇x地,患者樣品可與活 性增生/未增生腫瘤細胞的樣品相比。如果患者樣品顯示了可以與活性增生細胞相比和/ 或比未增生細胞高的GCPM高表達,則暗示了積極預后。如果患者樣品顯示了可以與未增生 細胞相比和/或比活性增生細胞低的GCPM低表達,則暗示了消極預后。作為進一步的實施例,可將來源于患者樣品(例如腫瘤樣品)的包含兩個或更多 個GCPM預后標簽的表達水平與復發(fā)/非復發(fā)癌癥樣品相比較。如果通過與非復發(fā)癌癥樣 品相比,患者樣品顯示了增加的或減少的GCPM表達,和/或可與復發(fā)癌癥樣品的表達相比 的表達,則暗示了消極預后。如果患者樣品顯示了可與非復發(fā)癌癥樣品相比和/或比復發(fā) 癌癥樣品的表達低或高的GCPM表達,則暗示了積極預后。作為一種方法,預測方法可應用到一組標志物,例如在表A、表B、表C或表D中概 括的GCPM組,以產(chǎn)生預測模型。這涉及到包含兩個或更多個GCPM的預后標簽的產(chǎn)生。因此,表A、表B、表C或表D中公開的GCPM提供了產(chǎn)生預測標簽的有用的標志物 集合,用于特別針對該腫瘤確定癌癥預后并建立治療方案或治療方法。特別地,患者能使用 積極預后來決定進行標準或較少侵入性的治療選擇?;颊吣苁褂孟麡O預后來決定終止治療 或進行高度侵入性或實驗性治療。此外,患者能基于其對預后的標志物(例如GCPM)的表 達的影響而選擇治療??梢酝ㄟ^使用任何合適的技術檢測腫瘤組織、接近腫瘤的組織、淋巴結樣品、血液 樣品、血清樣品、尿液樣品或糞便樣品中的GCPM水平,所述技術包括但不限于寡核苷酸探 針、定量PCR或抗所述標志物的抗體。應理解,通過分析多個預測性標簽形式的GCPM表達 的存在和數(shù)量及構建預后標簽將增加預后的靈敏性和準確度。因此,可以使用多個根據(jù)本 發(fā)明的標志物來確定癌癥預后。本發(fā)明包括利用存檔的石蠟包埋活檢材料來檢測集中所有的標志物,因此與最廣 泛可用的活檢材料類型兼容。本發(fā)明也與若干不同的腫瘤組織收獲方法兼容,例如,核芯針活檢或細針抽吸。在某些方面,從固定的石蠟包埋患者癌組織樣本中分離RNA。分離可以, 例如自核芯針活檢組織或細針抽吸細胞,通過本領域已知的任何技術進行。在一個方面,本發(fā)明涉及預測預后(例如癌癥患者長期存活無癌癥復發(fā)的可能 性)的方法,其包括測定獲自該患者的樣品中一個或更多個預后標志物或其表達產(chǎn)物的表 達水平,該水平用樣品中其它RNA轉錄物或其產(chǎn)物、或參照組的RNA轉錄物或其表達產(chǎn)物的 表達水平進行標準化。在特定的方面,預后標志物是表A、表B、表C或表D中列出的一個或 更多個標志物,或作為一個或更多個源自列于表A、表B、表C或表D的標志物的預后標簽而 被包括。在其他方面,測定了預后標志物或其表達產(chǎn)物,例如列于表A、表B、表C或表D的 標志物,源于列于表A、表B、表C或表D的標志物的預后標簽的表達水平,在另一方面,該方 法包括測定全集的預后標志物或其表達產(chǎn)物,例如列于表A、表B、表C或表D的標志物,源 于列于表A、表B、表C或表D的標志物的預后標簽的表達水平。在其他方面,本發(fā)明涉及包含多核苷酸的陣列(例如微陣列),該多核苷酸與例如 列于表A、表B、表C或表D的標志物或源自列于表A、表B、表C或表D的標志物的預后標簽 的兩個或更多個標志物雜交。在特別的方面,陣列包括與源自列于表A、表B、表C或表D的 標志物的預后標簽雜交的多核苷酸,或者例如針對預后標簽雜交的多核苷酸。在另一個特 定方面,陣列包含與標志物的全集雜交的多核苷酸,例如針對列于表A、表B、表C或表D的 標志物或例如針對預后標簽雜交的多核苷酸。對于這些陣列,多核苷酸可以是cDNA或寡核苷酸,且其上展示它們的固體表面可 以例如是玻璃。多核苷酸可與本文公開的一個或更多個標志物雜交,例如與全長序列、其任 何編碼序列、任何片段或任何互補物雜交。在特別的方面,一個或更多個GCPM表達水平的 增加或降低指示了例如由于癌癥復發(fā)的減少的長期存活可能性,而一個或更多個GCPM表 達水平的增加或降低的缺少指示了無癌癥復發(fā)的長期存活可能性的增加。在其他方面,本發(fā)明涉及適于進行任何上述方法的試劑盒,其包括下述一種或者 更多種⑴抽提緩沖液/試劑和操作流程;⑵反轉錄緩沖液/試劑和操作流程;及⑶定 量PCR緩沖液/試劑和操作流程。本發(fā)明的其他方面及優(yōu)點在本文包括的說明書及實施例 中進行了解釋。表A 細胞增生標簽的GCPM
唯一 ID基因符號基因名稱GenBank登錄號基因別名A09020CCND1細胞周期蛋白D1NM—053056BCL1 ;PRAD1 ; U21B31 ; D11S287EC 0921CCNE1細胞周期蛋白E1NM—001238, NM—057182CCNE
表A 在高增生和低增生狀態(tài)的細胞系間差異表達的增生相關基因。通過在30K MWG Biotech陣列上進行微陣列分析鑒定了在融合(低增生)和半融合(高增生)狀態(tài) 的細胞系間差異表達的基因(見圖1)。表A包含了利用基因本體分析(gene ontology analysis)分類為細胞增生相關的這些基因的子集。表B 細胞增生標簽的GCPM 表B 已知的細胞增生相關基因。所有基因均以基因本體分析分類為細胞增生相 關并在Affymetrix HG-U133平臺上呈現(xiàn)。預后標志物檢測的一般方法下述方法是能用于檢測包括GCPM家族成員在內的增生標志物的非限制性方法 使用特異于GCPM的寡核苷酸探針的微陣列方法;使用GCPM特異引物和探針的腫瘤樣品實 時qPCR ;使用GCPM特異引物和探針的淋巴結、血液、血清、糞便或尿液樣品的實時qPCR ;酶 聯(lián)免疫法(ELISA);使用抗標志物抗體的免疫組化;和使用計算機的陣列或qPCR數(shù)據(jù)分析。其他有用的方法包括northern印跡和原位雜交(Parker和Barnes, Methods in Molecular Biology 106 :247_283 (1999));核糖核酸酶保護測定(Hod, BioTechniques 13:852-854(1992));反轉錄聚合酶鏈反應(RT-PCR ;Weis 等人,Trends in Genetics 8:263-264(1992));基因表達系列分析(SAGE ;Velculescu 等人,Science 270 484-487(1995);及 Velculescu 等人,Cell 88 :243_51(1997)) ;MassARRAY 技術(Sequenom, San Diego, CA),及通過大規(guī)模平行標簽測序進行的基因表達分析(MPSS ; Brenner 等人,Nature Biotechnology 18:630-634(2000))??蛇x地,可使用能識別特異復 合物,包括DNA雙鏈體、RNA雙鏈體和DNA-RNA雜交雙鏈體或DNA-蛋白質雙鏈體的抗體??梢允占紨?shù)據(jù)并進行倍數(shù)變化分析,例如,通過比較腫瘤組織和非腫瘤組織 中標志物的表達水平;通過比較標志物表達水平與在復發(fā)腫瘤和非復發(fā)腫瘤中測定的水 平;通過比較標志物表達水平與在具有或不具有轉移的腫瘤中測定的水平;通過比較標志 物表達水平與在不同分期腫瘤中測定的水平;或通過比較標志物表達水平與在具有不同增 生水平的細胞中測定的水平?;谠摲治龃_定消極或積極預后。腫瘤標志物表達的進一步 分析包括將顯示了增加或減少表達的那些標志物與已知胃腸道腫瘤的表達譜相匹配以提 供預后。用于得出表達增加的結論的閾值以例如至少1. 5倍或2倍增加的形式提供,且在 其他實施方案中,以至少3倍增加,4倍增加或5倍增加形式提供。用于得出表達減少的結 論的閾值以例如至少1. 5倍或2倍減少的形式提供,且在其他實施方案中,以至少3倍減 少,4倍減少或5倍減少形式提供。應理解,為得出發(fā)生了表達增加或減少的結論,可選擇其 他的閾值而不偏離本發(fā)明的范圍。也應理解,用于得出表達增加的結論的閾值將依賴于特定的標志物以及將要應用 的特定預測模型。一般設定閾值為獲得具有最低錯誤率的最高靈敏度和選擇性,盡管在特 定的臨床情況下需要改變。期望的閾值可以通過在考慮任何預測模型的統(tǒng)計學可變性的情 況下分析足夠大小的群體來確定,并可以從用來產(chǎn)生預測模型的樣品的大小來計算。這同 樣適用于確定用于得出表達減少的結論的閾值。能夠明了,為得出發(fā)生了表達增加或減少 的結論,可選擇其他的閾值或確立閾值的方法而不偏離本發(fā)明的范圍。還可以的是,預測模型可以產(chǎn)生數(shù)值作為其輸出結果,例如分值、似然值或概率。 在這些情況下,可對預測模型所產(chǎn)生的結果應用閾值,并且在這些情況下適用與設置表達 值的閾值時相似的原則。一旦獲得腫瘤樣品中一個或更多個增生標志物的表達水平,則可測定腫瘤復發(fā)可 能性。與本發(fā)明一致,消極預后與至少一種增生標志物的減少表達相關,而積極預后與至少 一種增生標志物的增加表達相關。在多個方面,通過本文公開的至少1、2、3、4、5、10、15、20、 25、30、35、40、45、50或75個標志物顯示表達增加。在其他方面,通過本文公開的至少1、2、 3、4、5、10、15、20、25、30、35、40、45、50 或 75 個標志物顯示表達減少。從鑒定的基因出發(fā),可以通過將一個或多個基因的表達水平與所公開的增生標簽 進行比較,利用包含一個或多個GCPM的增生標簽,確定癌癥的預后。通過將腫瘤樣品中一 個或多個GCPM的表達與所公開的增生標簽進行比較,可確定癌癥復發(fā)的可能性??赏ㄟ^應 用如前面所述的預測模型,比較預后標簽的表達水平,以確立預后。確定癌癥復發(fā)可能性對開業(yè)醫(yī)師具有重大價值。高復發(fā)可能性意味著應給予更長 或更高劑量治療,且患者應被更密切地監(jiān)視癌癥復發(fā)的跡象。精確的預后對患者同樣有益。 其允許患者、連同其伴侶、家人和朋友,也可以就治療做出決斷,以及就其未來和生活方式 變化做出決策。因此,本發(fā)明也提供了基于預后確立具體癌癥的治療方案的方法,所述預后 通過將腫瘤樣品中標志物的表達與差異表達標簽進行匹配而確立。能夠明了,標志物選擇或增生標簽構建不必限于本文表A、表B、表C或表D中公開的GCPM,也可涉及使用來源于公開的標簽的一個或更多個GCPM,或新標簽可通過使用選自 公開的標志物清單的GCPM而建立。任何標簽的要求是它以足夠精確度預測了復發(fā)可能性 以輔助從業(yè)醫(yī)生建立治療方案。令人驚奇地,據(jù)發(fā)現(xiàn),許多GCPM與細胞增生的增加水平相關,也與積極預后相關。 也相似地發(fā)現(xiàn),減少的GCPM表達水平和消極預后間存在緊密相關性,例如增加的胃腸癌復 發(fā)可能性。因此,本發(fā)明也提供與細胞增生相關的標志物,例如細胞周期組分,作為GCPM的 用途。如本文所公開,可通過測定一個或更多個增生特異性標志物的表達而實現(xiàn)對癌癥 復發(fā)可能性的確定。本文提供的方法也包括具有高靈敏度的方法。特別地,qPCR極其靈敏 并能用于檢測樣品中極低拷貝數(shù)的標志物(例如1-100)。在具有這樣的靈敏度時,可以可 靠、準確和容易地對胃腸癌進行預后。反轉錄PCR (RT-PCR)在上面列出的技術中,最靈敏和最靈活的定量方法是RT-PCR,其能用于比較正常 和經(jīng)或不經(jīng)藥物治療的腫瘤組織中不同樣品組中的RNA水平,以表征表達模式、分辨密切 相關的RNA,并分析RNA結構。對于RT-PCR,第一步是從靶樣品中分離RNA。起始材料通常是分別從人腫瘤或腫 瘤細胞系以及相應的正常組織或細胞系分離的總RNA??蓮亩喾N樣品如來源于乳腺、肺、結 腸(例如大腸或小腸)、結直腸、胃、食管、肛門、直腸、前列腺、腦、肝臟、腎臟、胰臟、脾臟、胸 腺、睪丸、卵巢、子宮等組織的腫瘤樣品,來源于原發(fā)性腫瘤或腫瘤細胞系,和來源于從健康 供體收集的樣品分離RNA。如果RNA來源是腫瘤,可例如從冷凍或存檔的石蠟包埋和固定 (例如福爾馬林固定的)的組織樣品抽提RNA。 通過RT-PCR制作基因表達譜的第一步是將RNA模板反轉錄為cDNA,接著在PCR反 應中進行指數(shù)擴增。兩種最常用的反轉錄酶是禽成髓細胞瘤病毒反轉錄酶(AMV-RT)和莫 洛尼鼠白血病病毒反轉錄酶(MMLV-RT)。反轉錄步驟通常利用特異性引物、隨機六聚體或 寡聚dT引物引發(fā),這視情況和制作表達譜的目的而定。例如,可利用GeneAmp RNAPCR試劑 盒(珀金埃爾默公司,Perkin Elmer, CA, USA),遵循生產(chǎn)商的說明,對提取的RNA進行反轉 錄。得到的cDNA隨之可在后續(xù)的PCR反應中用作模板。雖然PCR步驟能夠利用多種熱穩(wěn)定的DNA依賴性DNA聚合酶,但通常采用Taq DNA 聚合酶,其具有5’ -3’核酸酶活性但缺乏3’ -5’校正核酸內切酶活性。因此,TaqMan (g) PCR通常利用Taq或Tth聚合酶的5’核酸酶活性來水解結合在靶擴增子上的雜交探針,但 任何具有等同5’核酸酶活性的酶均可使用??梢岳脙蓚€寡核苷酸引物產(chǎn)生PCR反應典型的擴增子。設計第三寡核苷酸或探 針以檢測位于所述兩個PCR引物之間的核苷酸序列。探針是不能被Taq DNA聚合酶延伸 的,并用報告熒光染料和淬滅熒光染料標記。當兩種染料如其在探針上一樣位置緊靠在一 起時,任何激光誘導的報告染料的發(fā)射將被淬滅染料淬滅。在擴增反應期間,Taq DNA聚合 酶以模板依賴性的方式切割探針。所產(chǎn)生的探針片段在溶液中分離,來自所釋放的報告染 料的信號不受該第二熒光團的淬滅作用的影響。每合成一個新分子,就釋放一分子報告染 料,從而對未淬滅的報告染料的檢測可以提供數(shù)據(jù)定量闡釋的基礎。TaqMan RT-PCR可利用可商購的設備進行,例如ABI PRISM 7700tam序列檢測系統(tǒng)(珀金埃爾默應用生物系統(tǒng)公司,Perkin-Elmer-AppliedBiosystems,福斯特城,加利福 尼亞州,美國)或Lightcycler (羅氏分子生物藥劑公司,Roche Molecular Biochemicals, 曼海姆,德國)。在優(yōu)選的實施方案中,在實時定量PCR裝置如ABI PRISM 7700tam序列檢 測系統(tǒng)中運行該5’核酸酶方法。該系統(tǒng)由熱循環(huán)儀、激光、電荷耦合器件(CCD)、照相機和 計算機組成。該系統(tǒng)在熱循環(huán)儀上以96孔的形式擴增樣品。在擴增期間,通過光纖光纜實 時采集所有96個孔的激光誘導的熒光信號,并在CCD處進行檢測。該系統(tǒng)包括用于運行儀 器以及用于分析數(shù)據(jù)的軟件。5’核酸酶測定試驗的數(shù)據(jù)最初表達為Ct或循環(huán)閾值。如上文所討論的那樣,在每 一循環(huán)過程中記錄熒光值,其代表在擴增反應中該點所擴增的產(chǎn)物量。第一次記錄到具有 統(tǒng)計學顯著性的熒光信號的時間點為循環(huán)閾值。為最小化誤差及樣品間差異的影響,通常利用內部標準進行RT-PCR。理想的內部 標準以恒定的水平在不同的組織中表達,并且不受實驗處理的影響。最頻繁用來標準化基 因表達模式的RNA是持家基因甘油醛-3-磷酸-脫氫酶(GAPDH)和肌動蛋白的mRNA。實時定量PCR(qPCR)RT-PCR技術較為新近的一種變形是實時定量PCR,其通過雙重標記的熒光生成探 針(即TaqManO探針)測量PCR產(chǎn)物的積累。實時PCR既與定量競爭PCR又與定量比較PCR 兼容。前者利用各靶序列的內部競爭物進行標準化,而后者利用樣品內所含的標準化基因 或持家基因進行RT-PCR。更多細節(jié)由例如Held等人,Genome Research 6:986-994(1996)提供。表達水平可利用固定的、石蠟包埋的組織作為RNA來源來測定。根據(jù)本發(fā)明的一 個方面,基于欲擴增基因中存在的內含子序列設計PCR引物和探針。在此實施方案中,引物 /探針設計的第一步是描述出基因內部的內含子序列。這可通過公眾可獲得的軟件,如由 Kent, W. J.,Genome Res. 12(4) 656-64 (2002)開發(fā)的 DNA BLAT 軟件,或通過 BLAST 軟件 (包括其變形)來進行。后續(xù)步驟遵循成熟建立的PCR引物和探針設計方法。為了避免非特異性信號,在設計引物和探針時遮蔽內含子內部的重復序列是有 益的。這可通過應用可自Baylor College of Medicine在線獲得的R印eat Masker程 序容易地實現(xiàn),該程序相對于重復元件文庫篩選DNA序列,并返回遮蔽了重復元件的查詢 序列。經(jīng)遮蔽的序列隨之可用來設計引物和探針序列,利用任何可商購的或其他公眾可 獲得的引物/探針設計包,例如Primer Express (Applied Biosystems) ;MGB設計測定 (AppliedBiosystems) ;Primer3 (Steve Rozen 禾口 Helen J. Skaletsky(2000)Primer3on the Wffff for general users and for biologist programmers in :KrawetzS, Misener S(編 輯)Bioinformatics Methods and Protocols-Methods inMolecular Biology. Humana Press, Totowa, NJ, 365-386 頁)。PCR引物設計中考慮的最重要的因素包括引物長度、解鏈溫度(Tm)和G/C含量、特 異性、互補引物序列和3'端序列。通常,最佳PCR引物長度一般17-30個堿基,并含有約 20-80%、例如約50-60%的G+C堿基。一般優(yōu)選50_80°C的解鏈溫度,例如約50_70°C。有 關PCR引物和探針設計的更多指南,參見例如Dieffenbach,C. W.等人,General Concepts for PCRPrimer Design in :PCR Primer, A Laboratory Manual, Cold SpringHarbor Laboratory Press, New York, 1995,133—155 頁;Innis 禾口 Gelfand, Optimization of PCRsin :PCR Protocols,A Guide to Methods andApplications,CRC Press,London,1994,5—11 頁;禾口 Plasterer, Τ. N. Primerselect Primer and probe design. Methods Mol. Biol. 70 520-527(1997),其全部公開內容明確并入本文作為參考。微陣列分析差異基因表達也可利用微陣列技術鑒定或驗證。因此,可利用微陣列技術在新鮮 或者石蠟包埋的腫瘤組織中測量GCPM表達譜。在這種方法中,在微芯片基質上印刷或陣列 安排目的多核苷酸序列(包括cDNA和寡核苷酸)。陣列序列(即捕獲探針)隨之與來自目 的細胞或組織(即靶標)的特異性多核苷酸雜交。與RT-PCR方法一樣,RNA來源通常為從 人腫瘤或腫瘤細胞系以及對應的正常組織或細胞系中分離的總RNA。因此,RNA可以分離自 各種原代腫瘤或腫瘤細胞系。如果RNA的來源是原代腫瘤,則可以例如從冷凍或存檔的石 蠟包埋和固定(如福爾馬林固定)組織樣品中提取RNA,這些樣品在日常的臨床實踐中都是 常規(guī)制備和保存的。在微陣列技術的一個具體實施方案中,向基質上施加PCR擴增的cDNA克隆插入 物?;|可以包括至多1、2、3、4、5、10、15、20、25、30、35、40、45、50或75種核苷酸序列。在 其他方面,基質可以包括至少10,000種核苷酸序列。固定在微芯片上的微陣列序列適合于 在嚴緊條件下雜交。作為其他實施方案,用于微陣列的靶可以長至少50、100、200、400、500、 1000 或 2000 個堿基;或者 50-100、100-200、100-500、100-1000、100-2000 或 500-5000 個 堿基。作為另外的實施方案,用于微陣列的捕獲探針長度可為至少10、15、20、25、50、75、80 或 100 個堿基;或者 10-15、10-20、10-25、10-50、10-75、10-80 或 20-80 個堿基。通過反轉錄從目的組織提取的RNA,摻入熒光核苷酸,可以生成熒光標記的cDNA 探針。施加到芯片上的標記cDNA探針與陣列上的各DNA斑點特異性地雜交。嚴緊洗滌以 除去非特異性結合的探針之后,通過激光共聚焦顯微鏡或通過其他檢測方法如CCD照相機 掃描芯片。對各陣列元素的雜交的定量允許評估對應mRNA的豐度。利用雙色熒光,由兩個 RNA源生成分開標記的cDNA探針,其成對地與陣列雜交。由此,對應于各指定基因的來自兩 個來源的轉錄物的相對豐度可以得以同時確定。此小型化規(guī)模的雜交提供了對大量基因表達模式的便利快速評價。此類方法已 經(jīng)證明具有檢測微量轉錄物以及可再現(xiàn)地檢測至少大約兩倍的表達水平差異所需的靈敏 性,其中所述微量轉錄物僅以每細胞少數(shù)幾個拷貝的水平表達(Schena等人,Proc. Natl. Acad. Sci. USA 93(2) 106-149 (1996))。微陣列分析可以通過可商購的設備遵循生產(chǎn)商的 方案進行,例如利用AfTymetrix GenChip技術或Incyte微陣列技術。對大規(guī)模分析基因 表達的微陣列法的研發(fā),使得可以在各種腫瘤類型中系統(tǒng)地尋找癌癥分類和結果預測的分 子標志物。RNA分離、純化和擴增用于mRNA提取的一般方法在本領域眾所周知,并公開在分子生物學的標準教 禾斗書中,包括 Ausubel 等人,Current Protocols of MolecularBiology, John Wiley and Sons (1997)。例如,用于石蠟包埋組織RNA提取的方法公開在Rupp和Locker,Lab Invest. 56 :A67(1987),以及 DeSandres 等人,BioTechniques 18 42044(1995)中。特別 是,可以利用來自商業(yè)生產(chǎn)商如Qiagen的純化試劑盒、成套緩沖液和蛋白酶按照生產(chǎn)商的 說明進行RNA分離。例如,可以利用Qiagen RNeasy微型柱自培養(yǎng)細胞分離總RNA。其他可商購的RNA分離試劑盒包括MasterPure完整DNA和RNA純化試劑盒(EPICENTRE公司 (D, Madison, WI)和Paraffin BlockRNA分離試劑盒(Ambion有限公司)。可以利用RNA Stat-60 (Tel-Test公司)自組織樣品分離總RNA。例如,可以通過氯化銫密度梯度離心分 離由腫瘤制備的RNA。利用固定的石蠟包埋組織作為RNA來源進行基因表達譜制作的代表性方 案的步驟包括mRNA分離、純化、引物延伸和擴增,這在多篇發(fā)表的期刊文章中提供 (例如Τ· E. Godfrey 等人 J. Molec. Diagnostics 2:84-91(2000) ;K. Specht 等人, Am. J. Pathol. 158 :419_29 (2001))。簡言之,一個代表性方法始于切割大約10 μ m厚的石蠟 包埋腫瘤組織樣品切片。然后提取RNA,除去蛋白質和DNA。分析RNA濃度之后,如果必要 的話,可以包括RNA修復和/或擴增步驟,之后利用基因特異性啟動子反轉錄RNA,接著進行 RT-PCR。最后,分析數(shù)據(jù),以基于在所研究的腫瘤樣品中鑒定到的特征性基因表達模式,確 定患者可用的最佳治療選擇。免疫組織化學和蛋白質組學免疫組織化學法也適用于檢測本發(fā)明增生標志物的表達水平。因此,利用特異于 各標志物的抗體或抗血清、優(yōu)選多克隆抗血清、最優(yōu)選單克隆抗體來檢測表達??梢酝ㄟ^用 例如放射性標記、熒光標記、半抗原標記如生物素、或酶如辣根過氧化物酶或堿性磷酸酶直 接標記抗體本身,來檢測抗體??蛇x地,可以將未標記的一抗與標記的二抗聯(lián)合使用,所述 二抗包括特異于一抗的抗血清、多克隆抗血清或單克隆抗體。免疫組織化學方案和試劑盒 在本領域眾所周知并且可以商購。蛋白質組學可用來分析某個時間點樣品(如組織、器官或細胞培養(yǎng)物)中存在的 多肽。特別是,蛋白質組學技術可用來評估樣品中蛋白質表達的全局變化(也稱為表達蛋 白質組學)。蛋白質組學分析通常包括(1)通過二維凝膠電泳(2-D PAGE)分離樣品中的 蛋白質個體;(2)鑒定從凝膠中回收的蛋白質個體,例如通過質譜法或N-末端測序法,和 (3)利用生物信息學分析數(shù)據(jù)。蛋白質組學方法對于其他基因表達譜研究方法是有價值的 補充,并且可以單獨或與其他方法組合使用,以檢測本發(fā)明增生標志物的產(chǎn)物。選擇差異表達的基因選擇視為有顯著性的基因的一種早期方法包括簡單地查看給定基因在兩個目的 群之間的“倍數(shù)變化”。雖然這種方法鎖定似乎變化最為驚人的基因,但是考慮到基礎統(tǒng)計 學,令人們意識到如果差異(或噪聲水平)相當高的話(正如在微陣列實驗中所常見的那 樣),那么看似巨大的倍數(shù)變化可能僅僅因為偶然而頻繁發(fā)生。微陣列實驗,例如本文所述的那些,一般包括同時測量數(shù)以千計的基因。如果人 們比較兩組(例如復發(fā)和非復發(fā)腫瘤)之間特定基因的表達水平,那么典型的顯著性檢驗 (例如t-檢驗)并不足夠。這是因為,在具有數(shù)以千計實驗的系綜(ensemble)中(在此 上下文中,每個基因構成一個“實驗”),至少一個實驗僅因偶然而通過顯著性慣用標準的概 率基本為1。在顯著性檢驗中,人們一般計算“虛假設”正確的概率。在兩組比較的情況下, 虛假設是兩組之間沒有差異。如果統(tǒng)計學檢驗得出該虛假設的概率低于某一閾值(通常 是0. 05或0. 01),則表述為我們可以拒絕該虛假設,而接受兩組顯著不同的假設。顯然,在 這樣的檢驗中,可以預期20次中有1次(或者100次中有1次)虛假設會僅因偶然而被拒 絕。應用t-檢驗或其他類似的顯著性統(tǒng)計學檢驗在微陣列的情況下是不成功的,產(chǎn)生太多太多的假陽性(或I型錯誤)。在同一時間檢驗多個假設的這類情形下,人們應用典型的多重比較方法,例如 Bonferroni法(43)。然而,此類檢驗對于大多數(shù)微陣列實驗而言太過保守,產(chǎn)生太多的假 陰性(II型)錯誤。較為近來的一種方法是不嘗試應用給定檢驗顯著性概率,而是建立選擇實驗子集 的手段,從而控制預期的I型錯誤比例(或誤診率(falsediscovery rate) ;47)。正是這 種方法已在本研究中應用,借助于多種執(zhí)行工具,即BRB陣列工具(48)和Bioconductor的 limma(ll,42)包(其應用R統(tǒng)計環(huán)境;10,39)所提供的方法。數(shù)據(jù)挖掘的一般方法學生成預后標簽數(shù)據(jù)挖掘是用來描述從(通常是)大量數(shù)據(jù)(數(shù)據(jù)集)中提取“消息”,換言之“技 術訣竅”,或者預測能力的術語。這是本研究中用來生成預后標簽的方法。在本研究的情況 下,“技術訣竅”是從給定的一組基因表達測量結果或者“標簽”中準確預測預后的能力(在 本節(jié)將作一般描述,在實施例一節(jié)中作更詳細描述)。本研究所用方法的具體細節(jié)在實施例17-20中描述。不過,任何數(shù)據(jù)挖掘方法(既 包括實施例中所述的那些,也包括此處所述的那些)的應用均可遵循此通用方案。數(shù)據(jù)挖掘(49)以及相關話題機器學習(40)是一個復雜的重復性數(shù)學任務,其涉 及應用一種或多種適宜的計算機軟件包(見下文)。軟件的應用在一方面是有利的,原因是 人們無需為了成功應用數(shù)據(jù)挖掘技術而徹底通曉每種技術背后錯綜復雜的理論,而只要堅 持正確的方法學即可。缺點是數(shù)據(jù)挖掘的應用往往可被視為“黑匣子”人們插入數(shù)據(jù)而接 收答案。這是如何實現(xiàn)的往往不為終端用戶所知(對于所述技術中的許多而言確是如此, 并且往往可影響選擇用于數(shù)據(jù)挖掘的統(tǒng)計學方法)。例如,神經(jīng)網(wǎng)絡和支持向量機具有特別 復雜的執(zhí)行工具,使得終端用戶極難提取出用來產(chǎn)生決策的“規(guī)則”。而另一方面,k-近鄰 方法和線性判別分析具有不隱瞞用戶的非常透明的決策過程。有兩類方法用于數(shù)據(jù)挖掘有監(jiān)督的和無監(jiān)督的方法。在有監(jiān)督的方法中,與數(shù)據(jù) 關聯(lián)的信息是已知的,例如分類數(shù)據(jù)(例如,復發(fā)對非復發(fā)腫瘤)。所需的是將觀察到的反 應(例如,復發(fā)與非復發(fā))與輸入變量關聯(lián)起來的能力。在無監(jiān)督的方法中,事先并不知曉 數(shù)據(jù)集內的分類,數(shù)據(jù)挖掘方法學被用于嘗試尋找數(shù)據(jù)集內的分類或結構。在本實施例中使用的是有監(jiān)督的方法,并在本文詳細討論,不過應當明了可使用 任何其他技術。整體方案包括如下步驟 數(shù)據(jù)呈現(xiàn)。這包括將數(shù)據(jù)轉化為用所選的數(shù)據(jù)挖掘技術最可能成功工作的形式。 在數(shù)據(jù)為數(shù)值,如在本研究中所研究的數(shù)據(jù)為相對基因表達水平的情況下,這還算簡單。如 果數(shù)據(jù)覆蓋大的動態(tài)范圍(即,許多個數(shù)量級),通常取數(shù)據(jù)的對數(shù)(log)。如果數(shù)據(jù)覆蓋 許多由不同研究人員在不同日子對不同樣品的測量結果,必須特別小心以確保系統(tǒng)誤差最 小化。最小化系統(tǒng)誤差(即,因方案差異、機器差異、操作人員差異以及其他可量化因素所 致的誤差)是此處稱為“標準化”的過程?!ぬ卣鬟x擇。一般,數(shù)據(jù)集含有比對于日常測量而言實用的數(shù)據(jù)元素多得多的數(shù)據(jù) 元素,此外還含有許多不提供產(chǎn)生預測模型所需的信息的元素。預測模型描述數(shù)據(jù)集的實 際能力源于全維度的該數(shù)據(jù)集的某子集。這些維度是數(shù)據(jù)集最為重要的成分(或特征)。注意在微陣列數(shù)據(jù)的情況下,數(shù)據(jù)集的維度是基因個體。特征選擇在此處的上下文中包括 尋找最為“差異表達”的那些基因。在更一般的意義上,這涉及通過某個顯著性統(tǒng)計學檢驗 的那些群組,即,在所研究的一個或其他群組中一貫地較高或較低的特定變量的水平。有時 特征是呈現(xiàn)出最大變異的那些變量(或維度)。特征選擇的應用完全獨立于用來創(chuàng)建預測模型的方法,并且為了實現(xiàn)期望的結果 涉及大量的實驗。在本發(fā)明中,顯著性基因的選擇以及那些與更早期的成功模型(NZ分類 器)相關的選擇需要特征選擇。另外,可對數(shù)據(jù)集應用數(shù)據(jù)約簡方法(例如主成分分析)。·訓練。一旦數(shù)據(jù)集的分類(例如,復發(fā)/非復發(fā))和特征已經(jīng)確立,且數(shù)據(jù)呈現(xiàn) 為數(shù)據(jù)挖掘輸入可接受的形式,則對所選的預測模型應用簡約后的數(shù)據(jù)集(如通過特征描 述的)。此模型的輸入通常是多維度數(shù)值輸入的形式(稱為向量),伴有相關的輸出信息 (分類標記或反應)。在訓練過程中,將選擇的數(shù)據(jù)相繼地(在諸如神經(jīng)網(wǎng)絡的技術中)或 整體地(在應用某些回歸形式的技術中,例如線性模型、線性判別分析、支持向量機)輸入 預測模型。在一些情況(例如,k_近鄰方法)下,數(shù)據(jù)集(或在特征選擇之后獲得的數(shù)據(jù) 集的子集)本身即為模型。正如所討論的那樣,通過應用模型參數(shù)已由內行分析專家預設 為最有可能得出成功結果的多種軟件包,可以在對數(shù)學細節(jié)有最小限度理解的情況下確立 有效的模型。 驗證。這是數(shù)據(jù)挖掘方案的關鍵部分,對其的不正確應用常常導致錯誤。除了特 征選擇和訓練之外,應當留出部分的數(shù)據(jù)集來檢驗預測模型的成功。此外,如果驗證的結果 用來實現(xiàn)特征選擇和模型訓練,那么在模型應用于現(xiàn)實情形之前,獲取再一驗證集來檢驗 模型。如果不嚴格遵循此過程,那么模型很可能失于現(xiàn)實情形。驗證的方法在下文更詳細 地說明?!?。一旦模型已經(jīng)構建并驗證,其必須以終端用戶可及的某種方式進行包裝。 這往往包括對電子表格應用程序(其中已嵌入模型)的某種形式執(zhí)行,提供統(tǒng)計學軟件包 的腳本,或由信息技術工作人員將模型重構(refactoring)成硬編碼應用程序。常使用的軟件包的實例有-電子表格插件,由多家賣主獲得。-R統(tǒng)計環(huán)境。-商業(yè)包MatLab、S-plus、SAS、SPSS、STATA。-自由開源軟件,如 Octave (MatLab clone)。-許多各種各樣的C++庫,其可用來在商業(yè)閉源設置中執(zhí)行預測模型。數(shù)據(jù)挖掘方法的實例可通過首先采取數(shù)據(jù)挖掘步驟(上文),然后應用適當?shù)囊阎浖瑏韺嵤┍景l(fā) 明的方法。有關數(shù)據(jù)挖掘方法的更多說明在許多極其充分著述的教科書(49)中有描述。·線性模型(49,50)數(shù)據(jù)作為線性回歸模型的輸入進行處理,其中分類標記或反 應變量為輸出。分類標記或其他分類數(shù)據(jù)必須轉化為數(shù)值(通常為整數(shù))。在廣義線性模 型中,分類標記或反應變量本身并不與輸入數(shù)據(jù)線性相關,而是通過應用“關聯(lián)函數(shù)”被轉 化。邏輯回歸是最常見形式的廣義線性模型。·線性判別分析(49,51,52)。如果數(shù)據(jù)是線性可分的(即,數(shù)據(jù)的群組或類可由 超平面,S卩,閾值的η維延伸,分開),就可應用此技術。利用變量組合來分開類別,使組間方差最大化和組內方差最小化。其副產(chǎn)品是分類規(guī)則的形成。對未知類別的樣品應用此規(guī)則 允許對該樣品進行有關類別成員的預測或分類。存在線性判別分析的變形,例如nearest shrunkencentroids,其常用于微陣列分析。·支持向量機(53)變量集合與權重集合聯(lián)合使用,以確定使類間的分離就其加 權變量而言最大化的模型。然后對樣品應用此模型,產(chǎn)生對該樣品類別成員的分類或預測?!ど窠?jīng)網(wǎng)絡(52)數(shù)據(jù)作為輸入節(jié)點網(wǎng)絡進行處理,這些節(jié)點表面上類似于生物 神經(jīng)元,運用來自與其相連的所有節(jié)點的輸入,并將輸入轉化為輸出。通常,神經(jīng)網(wǎng)絡利用 “乘積和加和,,算法,將來自多個連接的輸入節(jié)點的輸入轉化為單一輸出。節(jié)點可以不必產(chǎn) 生輸出,除非該節(jié)點的輸入超過了一定的閾值。每個節(jié)點具有來自若干其他節(jié)點的輸出作 為其輸入,其中最終輸出節(jié)點通常與分類變量相連。節(jié)點的數(shù)量以及節(jié)點的拓撲學能夠以 幾乎無窮的方式變化,從而能夠對以其他方式可能不可能予以分類的極端噪聲數(shù)據(jù)進行分 類。神經(jīng)網(wǎng)絡最常見的執(zhí)行工具是多層感知器?!し诸惢貧w樹(54)在這些方法中,利用變量定義一個能夠被逐步遵循以確定樣 品分類的規(guī)則層次。典型的方法創(chuàng)建一個規(guī)則集合,其導致特定的分類輸出,或者是有關不 能分辨的特定陳述。分類樹的一個實例是執(zhí)行諸如下面的算法若基因A > χ且基因Y > χ且基因Z = Z貝IJA 類否則,若基因A = q則B 類·近鄰方法(51,52)。通過將(未知分類的)樣品與其附近的那些(或已知分類 的)樣品比較來進行預測或分類,其中緊密度由距離函數(shù)定義??梢远x許多不同的距離 函數(shù)。常用的距離函數(shù)有歐幾里德距離(將在三角測量中那樣的畢達哥拉斯距離延伸至η 維)、多種形式的相關性(包括Pearson Correlation相關系數(shù))。此外,還有如下轉化函 數(shù),該轉化函數(shù)可以將正常不通過有意義的距離量度互連的數(shù)據(jù)點轉換為歐幾里德空間, 以致隨后可以應用歐幾里德距離(例如,馬爾距離)。雖然距離量度可相當復雜,但是k-近 鄰法的基本前提相當簡單,基本上是“尋找與未知輸入最類似的k-數(shù)據(jù)向量,找出它們所 對應的類別,并表決該未知輸入是哪個類別”的重述。 其他方法-貝葉斯網(wǎng)絡。利用有向無環(huán)圖表示一組變量以及它們的聯(lián)合概率分布,其隨之可 以用來確定樣品的類別成員的概率。-獨立成分分析,其中自變量集合中將獨立信號(例如,類別成員)分離出來(為 成分)。這些成分可隨之用來進行樣品的類別成員分類或預測。-集成學習方法,其中組合一系列預測方法以對樣品進行類別成員聯(lián)合分類或預 測。存在可以探索的這些方法學的許多變形方式(49),且許多新的方法正不斷地被定 義和研發(fā)出來。應當明了為獲得可接受的結果,可應用這些方法中的任一方法。必須特別 小心,確保所有結果經(jīng)全面的驗證方案檢驗,以避免過擬合。
驗證所述任何預測方法的應用都涉及訓練和交叉驗證(43,55),之后該方法才可應用 于新的數(shù)據(jù)集(例如來自臨床試驗的數(shù)據(jù))。訓練包括取目的數(shù)據(jù)集(在本案中為來自結 直腸瘤的基因表達測量結果)的子集,以便將其按照正在檢驗的類別(在本案中為復發(fā)和 非復發(fā)腫瘤)分層。利用此訓練集生成(上文定義的)預測模型,在剩余的數(shù)據(jù)(測試集) 上檢驗之??梢愿淖冾A測模型的參數(shù)以便在測試集中獲得更佳的表現(xiàn),然而,這可能導致稱 為過擬合的情形,在這種情形下預測模型對訓練數(shù)據(jù)集有效,但是對任何外部數(shù)據(jù)集無效。 為避免之,接著實施驗證過程。有兩大典型應用的驗證類型,第一類(保留(hold-out)驗 證法)涉及將數(shù)據(jù)集分為三組測試集、訓練集和驗證集。無論如何驗證集對訓練過程沒有 輸入,因此任何參數(shù)調整或其他精化必須在應用于測試集(而非驗證集)時進行。第二大 類是交叉驗證法,其可以以數(shù)種不同的方式應用,如下文所述。有兩種主要的交叉驗證亞類型K-折交叉驗證和留一法交叉驗證。K-折交叉驗證將數(shù)據(jù)集分成K個子樣本,每個子樣本含有與最初大致相同比例 的類別群組。在每一輪驗證中,留出K個子樣本中的一個,并利用剩余的數(shù)據(jù)集實施訓練。該輪 訓練的有效性通過留出組的分類正確程度來測量。此過程重復K次,并通過比較預測分類 與已知分類來確定總體有效性。留一法交叉驗證Κ-折交叉驗證的一種常用變形,其中K = η,其中η為樣本數(shù)。CCPMS (例如上文表1和2所述的那些)的組合可用來構建預后的預測模型。預后標簽可以通過應用源自標簽的一個或多個預測模型,用預后標簽(包含這些標志物中 的一個或多個)測定患者的結果。特別地,臨床醫(yī)師或研究人員可以確定標簽中一個或多 個標志物的差異表達(例如,增加或減少的表達),應用預測模型,由此預測患者的消極預 后(例如疾病復發(fā)的可能性),或者可選地,積極預后的可能性(繼續(xù)好轉)。仍是在另一個方面,本發(fā)明包括確定癌癥治療方案的方法,其包含(a)提供癌癥樣品;(b)檢測所述樣品中GgCPM家族成員的表達水平;(c)基于 CCPM家族成員的表達水平測定癌癥預后;及(d)根據(jù)預后確定治療方案。仍是在另一個方面,本發(fā)明包括檢測GCPM的裝置,其包含在其上具有GCPM捕 獲試劑的底物;及與所述底物有關的檢測器,所述檢測器能檢測與所述捕獲試劑相關的 GCPM。其他方面包括檢測癌癥的試劑盒,其包含底物;GCPM捕獲試劑;及使用說明書。本 發(fā)明的其他方面包括使用qPCR檢測GCPM的方法,其包含特異于所述GCPM的正向引物;特 異于所述GCPM的反向引物;PCR試劑;反應管;及使用說明書。本發(fā)明的其他方面包含檢測GCPM多肽或肽存在的試劑盒,其包含具有針對所述 GCPM多肽或肽的捕獲試劑的底物;特異于所述GCPM多肽或肽的抗體;能標記結合針對所述 GCPM多肽或肽的抗體的試劑;及使用說明書。仍是在另一個方面,本發(fā)明包括檢測結直腸癌預后的方法,其包含步驟提供來源 于懷疑患有結直腸癌患者的腫瘤樣品;使用ELISA方法測量GCPM多肽的存在。在本發(fā)明的 特定方面,本發(fā)明的GCPM選自表A、表B、表C或表D中所列的標志物。仍是在另一個方面,GCPM包括在預后標簽中。盡管本文舉例說明的是胃腸道癌癥,例如胃癌和結直腸癌,但是本發(fā)明的GCPM也 可用于預后其他癌癥,例如乳腺癌、前列腺癌、卵巢癌、肺癌(如腺癌及特別地,小細胞肺 癌)、淋巴瘤、神經(jīng)膠質瘤、胚細胞瘤(如成神經(jīng)管細胞瘤)及間皮瘤,其中減少的或低表達 與積極預后相關,而增加的或高表達與消極預后相關。
實施例本文所述的實施例為舉例說明本發(fā)明實施方案的目的。其他實施方案、方法和分 析類型在分子診斷領域普通技術人員的能力范圍內,故無需在此詳細說明。落在本領域范 圍內的其他實施方案視為本發(fā)明的一部分。實施例1 細胞培養(yǎng)物實驗方案示于圖1。培養(yǎng)十株結直腸細胞系并在半融合和全融合時收集細胞。在 30,000寡核苷酸陣列上分析兩個生長階段的表達譜,通過差異表達基因的基因本體分析鑒 定了基因增生標簽(GPS ;表C)。然后,基于GPS表達的相似性,使用無監(jiān)督聚類獨立地二分 臨床結直腸樣品的兩個群(群A:寡陣列上的73個I -IV期樣品,群B:在Affymetrix芯片 上的55個II期樣品)。也在來源于群A腫瘤的組織切片上進行Ki-67免疫染色。在此之后 研究增生活性和臨床病理參數(shù)間的相關性。在該研究中包括了源自不同疾病階段的十株結直腸癌細胞系DLD_1、HCT-8、 HCT-116、HT-29、LoVo, Lsl74T、SK-CO-U SW48、SW480 和 SW620 (ATCC, Manassas, VA)。在 5% CO2、潮濕空氣、37°C、補充有10%胎牛血清和100IU/ml青霉素以及100 μ g/ml鏈霉素 的α極限必需培養(yǎng)基(GIBCO-Invigrogen,CA)中培養(yǎng)細胞。每種細胞系建立兩個細胞培 養(yǎng)物。在達到半融合(50-60%)時收集第一培養(yǎng)物。當?shù)诙囵B(yǎng)物中的細胞達到全融合 (既用顯微鏡又用肉眼測定)時,更換培養(yǎng)基,在二十四小時后收集細胞以從生長抑制的細 胞制備RNA。在從每一種細胞培養(yǎng)物抽提的RNA上進行陣列實驗。此外,按照相同方法進行 第二培養(yǎng)實驗,抽提的RNA用于染料翻轉的(dye-reversed)雜交。實施例2:患者分析了兩群患者。群A包括73個新西蘭結直腸癌患者,他們在1995和2000年間 在Dimedin和Auckland醫(yī)院進行了外科手術。這些患者是前瞻性群研究的一部分并包括 全部疾病階段。腫瘤樣品從手術室新鮮收集并在液氮中急凍,保存于-80°C。由單個病理 學家(H-SY)檢查樣本,根據(jù) !系統(tǒng)(34)將腫瘤分期。在最少5年的隨訪后,在73個患 者中32個疾病復發(fā),41個沒有復發(fā)。復發(fā)和非復發(fā)患者的中位總存活期分別是29. 5和66 個月。二十個患者接受了基于5-FU的手術后輔助化療,12個患者接受了放療(7個在手術 前,5個在手術后)。群B包括一組55個德國結直腸患者,他們在1995和2001年間在慕尼黑技術大學 進行了外科手術并在組織庫中存貯有新鮮冷凍樣品。所有55個患者均患有II期疾病,26個 患者疾病復發(fā)(中位存活期47個月),29個患者未疾病復發(fā)(中位存活期82個月)。沒有 患者接受化療或放療。兩個群的臨床病理變量總結為表2的一部分。表2 臨床病理參數(shù)及其與GPS表達和Ki_67PI的關聯(lián) 實施例3 陣列制備和基因表達分析群A腫瘤和細胞系勻漿組織樣品和細胞系,使用Tri-Reagent (Progenz, Auckland,新西蘭)抽提RNA。然后根據(jù)廠商方案使用RNeasy微型柱(Qiagen,Victoria, 澳大利亞)純化RNA。十微克抽提自每一培養(yǎng)物或腫瘤樣品的總RNA用寡聚dT引發(fā),在 存在 aa-dUTP 禾口 Superscript II RNase Η-Reverse Transcriptase (Invitrogen)時進行 cDNA合成。使用間接氨基烯丙基cDNA標記方法將Cy染料摻入cDNA。源自一群12種不同 細胞系的cDNA用作所有雜交的參照。將來源于單個結直腸細胞系或組織樣品的Cy5-dUTP 標記的cDNA與來源于參照樣品的Cy3-dUTP標記的cDNA組合。然后使用QiaQuick PCR 純化試劑盒(Qiagen,Victoria,澳大利亞)純化該混合物,共雜交到點有MWG 30K Oligo Set(MWGBiotech, NC)的微陣列。使用反向標記額外地在微陣列上分析來源于第二培養(yǎng)實 驗的cDNA樣品。用GenePix 4000B微陣列掃描儀掃描陣列,使用GenePix Pro 4. 1微陣列捕獲和 分析軟件(AXOn,CA)分析數(shù)據(jù)。來源于每一通道的前臺強度進行轉化并使用SNOMAD軟 件標準化(35)。使用BRB陣列工具版本3. 2 (由國立癌癥研究所生物測定研究部的Richard Simon和Amy PengLam博士開發(fā))將標準化的數(shù)值進行校對和過濾。在進一步的分析中排 除低強度基因以及在整個組織樣品或細胞系中丟失超過20%的測量值的基因。
群B腫瘤使用RNeasy微型試劑盒從每一腫瘤抽提總RNA并用RNeasy柱子 (Qiagen,Hilden,德國)進行純化。利用 SuperScript II 反轉錄酶(GIBCO-Invitrogen, NY)和寡聚dT-T7引物(Eurogentec,Koeln,德國)并用十微克總RNA合成雙鏈cDNA。使 用 Promega RiboMax T7 試劑盒(Promega,Madison,WI)和 Biotin-ΝΤΡ 標記混合物(Loxo, Dossenheim,德國)從雙鏈cDNA合成生物素化的cRNA。然后,純化和片段化生物素化的 cRNA。將片段化的 cRNA 與 Affymetrix HGU133A基因芯片(Affymetrix,Santa Clara, CA)雜 交并用鏈霉抗生物素_藻紅蛋白進行染色。然后用HP-argon-離子激光共聚焦顯微鏡掃描 陣列,用Affymetrix 微陣列套件5. O軟件加工數(shù)字化的圖像數(shù)據(jù)。所有AffymetriXU133A 基因芯片均經(jīng)過質量控制以消除具有異常特征的掃描。使用應用于Bioconductor affy包 的robust multi-array average函數(shù)在R計算環(huán)境中進行背景校正和標準化。實施例4 實時定量PCR(QPCR)使用來源于細胞培養(yǎng)物的cDNA確認了i^一個基因的表達(MAD2L1、P0LE2、CDC2、 MCM6、MCM7、RANSEH2A、Τ0ΡΚ、KPNA2、G22P1、PCNA 禾口 GMNN)。使用 SuperScript II RNase Η-Reverse Transcriptase 試劑盒(Invitrogen)禾口寡聚 dT 弓|物(Invitrogen)反轉錄總 RNA(2 μ g)。使用 Taqman 基因表達測試(Applied Biosystems)在 ABI Prism 7900HT 序列 檢測系統(tǒng)(Applied Biosystems)上進行QPCR。使用2_“CT方法36以拓撲異構酶3A作為 內部對照計算相對倍數(shù)改變。參照RNA用作校準器以使不同實驗間的比較成為可能。實施例5 免疫組織化學分析在來源于群A的73個石蠟包埋原代結直腸腫瘤的4 μ m切片上研究Ki_67抗原的 免疫組織化學表達(MIB-1 ;DakoCytomation,丹麥)。用溶于甲醇的0. 3%過氧化氫酶封閉 內源性過氧化物酶活性,抗原在煮沸的檸檬酸緩沖液(PH 6)中恢復。用含有1%BSA的5% 正常山羊血清封閉非特異性結合位點。使用EnVision系統(tǒng)(Dako EnVision,CA)和DAB底 物試劑盒(Vector laboritories,CA)檢測第一抗體(1 50稀釋)。使用IOX 10顯微格 柵選擇五個高倍視野,在不知道臨床病理數(shù)據(jù)情況下以盲試方法手動進行細胞計數(shù)。Ki-67 增生指數(shù)(PI)顯示為每一腫瘤陽性染色的細胞核的百分比。實施例6 統(tǒng)計分析使用SPSS 版本 14. 00 (SPSS Inc.,Chicago, IL)進行統(tǒng)計分析。Ki-67 增生指數(shù) 顯示為平均值士SD。使用Fisher’ s確切檢驗或Kruskal-Wallis檢驗評估基于GPS表達 或Ki-67PI對臨床病理參數(shù)歸類的群組間差異。P值<0.05認為是顯著的。使用Kaplan 和Meier方法(37)標繪總存活期(OS)和無復發(fā)存活期(RFS)。使用時序檢驗檢驗歸類的 群組間存活時間的差異。也使用Cox單變量模型估計每個變量的相對危險度和伴隨的置信 區(qū)間,使用具有在單變量分析中顯著的預測變量的前向逐步回歸開發(fā)了多變量Cox比例風 險模型?;贕PS表達水平,使用K均值聚類方法分類臨床樣品。實施例7 使用結直腸細胞系模型鑒定基因增生標簽(GPS)在圖1中總結了用于獲得和應用基因增生標簽(GPS)的方法的概觀。GPS,包括38 個有絲分裂細胞周期基因(表C)在半融合培養(yǎng)物的周期細胞中相對過表達。通過低GPS 表達定義的低增生與不利的臨床病理變量,較短的總存活期和無復發(fā)存活期(P < 0. 05)相 關。在Ki-67增生指數(shù)和臨床病理變量或臨床結果間未發(fā)現(xiàn)關聯(lián)。表C 用于細胞增生標簽的GCPM
GPS被鑒定為表達與CRC細胞增生率相關的基因的子集。使用微陣列統(tǒng)計分析 (SAM;文獻38)鑒定指數(shù)生長(半融合)和非周期(全融合)CRC細胞系間差異表達(DE) 的基因(圖1,1期)。為了調節(jié)基因特異的染料偏愛和其他變化的來源,獨立分析每個培養(yǎng) 物集。將分析限定到502個DE基因,對于這些基因,在兩個培養(yǎng)物集的兩個生長期間觀察 到了顯著的表達差異(錯誤發(fā)現(xiàn)率< 1%)。使用EASE39進行基因本體(GO)分析以鑒定 在DE基因中被顯著反射的生物過程類別。細胞增生相關類別被過度代表主要是由于在指數(shù)生長細胞中被上調的基因。有絲 分裂細胞周期類別(GO =0000278)被定義為GPS,這是因為(i)該生物過程是最過代表的GO 術語(term) (EASE得分=5.5211);及(ii)與生長抑制細胞相比,所有38個有絲分裂細胞 周期基因(表C)在快速生長時以較高水平表達。利用QPCR評估了來源于GPS的11個基 因的表達并與獲自陣列數(shù)據(jù)的相應值相關聯(lián)。因此,QPCR確認升高的增生標簽基因表達與 CRC細胞系中增加的增生相關(圖5)。實施例8 根據(jù)基因增生標簽的表達水平分類CRC樣品為了檢查CRC腫瘤的相對增生狀態(tài)和將GPS用于臨床應用,基于GPS表達將來源 于兩個群的CRC腫瘤分層為兩個簇(圖1,2期)。首先從微陣列產(chǎn)生的腫瘤表達譜獲得定 義GPS的38個基因的表達值。然后使用逐步無監(jiān)督聚類并基于其GPS表達水平相似性,將 來自于每一個群的腫瘤單獨分類為兩個簇(K = 2)。使用所有過濾的基因分析兩個定義的 簇間的DE基因揭示,在兩個群中,GPS包括在相對于簇2 (圖2A下圖)在簇1 (圖2A,上圖) 中上調的基因的名單中。因此,簇1中腫瘤特征為高GPS表達,而簇2中腫瘤特征為低GPS表達。實施例9 低基因增生標簽與不利的臨床病理變量相關表2總結了 GPS表達水平和臨床病理變量間的關聯(lián)。在兩個群中,在由低GPS表 達定義的低增生活性和增加的復發(fā)風險間觀察到了關聯(lián)(群A和B分別為P = 0. 03和 < 0. 001)。在群A中,低GPS表達也與較晚期疾病階段和淋巴結轉移相關(分別為P = 0. 006和0. 03)。此外,來源于群A的具有淋巴侵入的腫瘤比不具有淋巴侵入的腫瘤傾向于 較少增生,縱使沒有達到統(tǒng)計顯著性(P = 0. 06)。在GPS表達水平和腫瘤位點、年齡、性別、 分化程度、T-期、血管侵入、淋巴浸潤程度和腫瘤界限間未觀察到關聯(lián)。實施例10 基因增生標簽預測臨床結果為了檢查GPS在預測患者結果中的表現(xiàn),使用KapIan-Meier存活分析比較了低和 高GPS腫瘤間的RFS和OS(圖3)。在術后60個月時檢查所有患者。在結直腸癌群A中,在 具有低GPS表達的患者中OS和RFS較短(時序檢驗分別為P = 0. 04和0. 01)。在結直腸 癌群B中,低GPS表達也與減少的OS(P = 0.0004)和RFS(P = 0.0002)相關。當單變量分 析中預測OS和RFS的參數(shù)在多變量模型中被研究時,疾病期是5-年OS的唯一獨立預測因 子,而疾病期和T-期是群A中RFS的獨立預測因子。在群B中,低GPS表達和淋巴侵入顯 示了對OS和RFS 二者的獨立貢獻。如果將存活分析限定為不具有淋巴侵入的群B患者,低 GPS仍與較短的OS和RFS相關,這確證了 GPS作為預測因子的獨立性。單變量和多變量與 存活關聯(lián)的分析總結在表3中。低GPS表達也與胃癌患者中減少的5年總存活期相關(P = 0. 008)。在圖4中顯 示了比較低和高GPS胃癌的總存活期的Kaplan-Meier存活曲線。表3 在兩個群中OS和RFS的預后因子的單變量和多變量分析
基因在高增生組中過表達。然后使用GATHER基因本體程序來鑒定差異表達基因名單中最 過代表的基因本體類別。細胞周期類別是差異表達基因名單中最過代表的類別。在表D中 顯示了在低和高增生組間差異表達的102個細胞周期基因(除了原始的38個基因標簽)。表D 在低和高增生中差異表達的細胞周期基因 總結本發(fā)明第一次報道了基因增生標簽和主要臨床病理變量以及結直腸癌結果間的 關聯(lián)。此公開研究使用源自體外的多基因增生標簽和Ki-67免疫染色研究了腫瘤增生狀 態(tài)。根據(jù)本文結果,腫瘤中GPS低表達與兩個獨立患者群中較高的復發(fā)風險和較短的存活 相關。與此相反,Ki-67增生指數(shù)與任何臨床相關終末點無關。結直腸GPS包括38個有絲分裂細胞周期基因并包括一組核心基因(⑶C2、RFC4、 PCNA, CCNEl、CDK7、MCM 基因、FENl、MAD2L1、MYBL2、RRM2 和 BUB3),其是已定義的乳腺癌 (40)、(41),卵巢癌(42),肝癌(43)、急性淋巴母細胞白血病(44),神經(jīng)細胞瘤(45),肺鱗狀細胞癌(46),頭頸癌(47),前列腺癌(48)和胃癌(49)增生標簽的一部分。這代表了表達 的保守模式,因為大多數(shù)的這些基因已被發(fā)現(xiàn)在快速生長腫瘤中高度過表達且反映了高比 例的快速周期細胞(50)。因此,結直腸GPS表達水平提供了腫瘤增生狀態(tài)的測量。在本研究中,與不良結果相關的多個臨床病理變量(疾病階段、淋巴結轉移和淋 巴侵入)與群A患者中低GPS表達相關。在整個由II期腫瘤組成的群B中,本研究評估了 GPS和淋巴侵入間的關聯(lián)。由于在該群中僅有少量腫瘤具有淋巴侵入(5/55),該關聯(lián)不能 達到統(tǒng)計學上的顯著性。不局限于理論,在較晚期腫瘤中的低GPS表達可能表明,CRC過程 不被增強的增生所驅動。然而加速的增生仍可能是腫瘤發(fā)生起始階段的重要驅動力,較晚 期疾病可能更依賴于諸如遺傳不穩(wěn)定性的過程,以允許持續(xù)的選擇。與我們的發(fā)現(xiàn)相一致, 兩個大規(guī)模研究報告了減少的CDK2、細胞周期蛋白E和A的表達和晚期,深度浸潤和淋巴結 轉移間的關聯(lián)性(51),(52)。低GPS和不利臨床病理變量間的關系表明GPS也應預測了患者結果。的確,在群 A和B中,低GPS均與高復發(fā)風險和較短總存活期和無復發(fā)存活期相關。在所有患者均患 有II期腫瘤的群B中,該關聯(lián)性在多變量分析中仍然存在。然而,在患者患有I -IV期疾病 的群A中,該關聯(lián)性依賴于腫瘤分期。在群A的每一個疾病期內具有和不具有復發(fā)的患者 數(shù)目可能不足以證明GPS和存活間的獨立關聯(lián)性。在群B中,低GPS表達和淋巴侵入在多 變量分析中仍是獨立預測因子,這表明GPS可能改善了同一疾病階段CRC患者結果的預測。 不奇怪的是,淋巴結和遠端器官牽涉的存在是結果的最有力預測因素,因為這些是腫瘤轉 移的直接現(xiàn)象。分別在18%和27%群A患者中使用的放療或化療治療是本研究中的可能致混淆 因素。理論上,改善的存活期可能反映了快速增生腫瘤對癌癥治療更好的反應,該存活期與 增加的GPS表達相關的(53),(54)。然而,在治療和GPS表達間未發(fā)現(xiàn)關聯(lián)性。此外,在群 B中沒有患者接受輔助治療,這表明GPS和存活期間的關聯(lián)性獨立于治療。應當注意,該研 究并非設計用于研究腫瘤增生和對化療或放療反應間的關系。樣本大小也可解釋本研究中臨床病理變量和存活期間與Ki_67PI缺乏關聯(lián)性。如 上所述,其他對Ki-67和CRC結果的研究已經(jīng)報道了不一致的發(fā)現(xiàn)。然而,在三個具有最大 樣本大小的其他CRC研究中,低Ki-67PI與最差預后相關(27),(29),(30)。我們通過應用 GPS獲得了同樣結論,但基于小得多的樣本大小。因此,多基因表達分析是比Ki-67PI更靈 敏的評估增生和預后間關系的工具。仍需進一步研究隱藏在具有低GPS的腫瘤的不利預后的生物學原因。可能的潛在 導致低GPS腫瘤中較差臨床結果的機理包括⑴對快速增生腫瘤的更有效免疫反應;(ii) 可能導致腫瘤細胞對凋亡更具抗性并增加侵入但也擾亂平穩(wěn)復制機制的較高水平遺傳損 傷;(iii)增加數(shù)目的類似于正常干細胞的緩慢分裂但具有高轉移潛能的腫瘤干細胞;及 (iv)較高比例的具有高增生率但相對良好預后的微衛(wèi)星不穩(wěn)定腫瘤。總之,本發(fā)明澄清了先前關于細胞增生在結直腸癌預后中角色的相互沖突的結 果。使用CRC細胞系開發(fā)GPS并已經(jīng)應用到兩個獨立的患者群。據(jù)發(fā)現(xiàn),CRC中生長相關 基因低表達與較晚腫瘤期(群A)和同一分期中不良臨床結果(群B)相關。顯示多基因表 達分析是比建立已久的增生標志物Ki-67更有力的預測結果指示因子。對于未來研究,它 將有利于確定CRC不同于其他普通上皮癌如乳腺癌和肺癌的原因(例如關于Ki-67)。這可能提供了對重要的潛在生物學機理的洞察。從實用的觀點來看,將給定病理期內復發(fā)風險 進行分類的能力使輔助治療更精確地靶向成為可能。因此,可將GPS表達用作鑒定處于復 發(fā)和死于結直腸癌高風險患者的傳統(tǒng)分期方法的輔助方法。上面的說明書中提及的所有出版物和專利通過并入本文作為參考。在前述說明書中已經(jīng)提及了具有已知等同物的整數(shù)或成分,這樣的等同物在此并 入本文,就如同單獨進行過陳述一樣。雖然通過舉例并參照其可能的實施方案對本發(fā)明進行了描述,但是應當理解,可 以進行改進和/或改變而不偏離本發(fā)明的范圍。參考文獻1. Evan GIiVousden KH !Proliferation,cell cycle and apoptosis in cancer. Nature 411 :342_8,20012. Whitfield ML,George LK,Grant GD,e t al Common markers ofproliferation. Nat Rev Cancer 6 :99_106,20063. Rew DA, Wilson GD :Cell production rates in human tissues andtumours and their significance. Part 1 :an introduction to the techniques ofmeasurement and their limitations. Eur J Surg Oncol 26 :227-38,20004.Endle E,Gerdes J :The Ki_67 protein :fascinating forms and anunknown function. Exp Cell Res 257 :231_7,20005. Brown DC,Gatter KC :Ki67 protein :The immaculate deception. Histopathology 40:2_11,20026. Paik S,Shak S,Tang G,et al :A multigene assay to predict recurrence oftamoxifen-treated, node-negative breast cancer. N Engl J Med 351 :2817_26,20047. Ofner D,Grothaus A,Riedmann B,et al :MIB1 in colorectal carcinomas its evaluation by three different methods reveals lack of prognosticsignificance. Anal Cell Pathol 12 :61_70,19968. Ihmann T,Liu J,Schwabe W, et al :High_level mRNA quantification ofproliferation marker pKi—67 is correlated with favorable prognosis incolorectal carcinoma. J Cancer Res Clin Oncol 130 :749_756,20049. Van Oijen MG, Medema RH, Slootweg PJ, et al :Positivity of theproIiferation marker pKi-67 in non-cycling cells. Am J Clin PatholllO :24_31, 199810. Duchrow M,Ziemann T, Windhovel U, et al Colorectal carcinomaswith high MIB-I labelling indices but low pKi67 mRNA levels correlatewith better prognostic outcome. Histopathology 42 :566_574,200311. Evans C,Morrison I,Heriot AG,et al The correlation betweencolorectal cancer rates of proliferation and apoptosis and systemic cytokinelevels ;plus their influence upon survival. Br J Cancer 94 :1412-9,200612. Rosati G,Chiacchio R,Reggi ar do G,et al :Thymidylate synthaseexpression, p53,be 1-2, Ki_67and p27 in colorectal cancer relationshipswith tumour recurrence and survival. Tumour Biol 25 :258_63,200413. Ishida H,Miwa H,Tatsuta M,et al :Ki_67 and CEA expression asprognostic markers in Dukes'C colorectal cancer. Cancer Lett 207 :109_115,200414. Buglioni S,D’ Agnano I,Cosimelli M,et al -Evaluation of mu 11ip1ebio_patho1ogica1 factors in colorectal adenocarcinomas independentprognostic role of p53 and bcl-2. Int J Cancer 84 545~52,199915. Guerra A,Borda F,Javier Jimenez F,et al -Multivariate analysis ofprognostic factors in resected colorectal cancer :a new prognostic index. Eur J Gastroenterol Hepatol 10:51-8,199816.Kyzer S,Gordon PH !Determination of proliferative activity incolorectal carcinoma using monoclonal antibody Ki67.Dis Colon Rectum40 322-5,199717. Jansson A, Sun XF K i -6 7 expression in relation to clinicopathologicalvariables and prognosis in colorectal adenocarcinomas. APMIS105 :730-4,199718. Baretton GB,Diebold J,Christoforis G,et al :Apoptosis andimmunohistochemical bcl-2 expression in colorectal adenomas andcarcinomas. Aspects of carcinogenesis and prognostic significance· Cancer77 :255_64,199619. Sun XF, Carstensen JM, Stal 0,et al -Proliferating cell nuclear antigen (PCNA) in relation to ras,c-erbB-2,p53,clinico-pathological variablesand prognosis in colorectal adenocarcinoma. Int J Cancer 69:5—8,199620. Kubota Y,Petras RE,Easley KA,et al :Ki-67_determined growthfraction versus standard staging and grading parameters in colorectalcarcinoma. A multivariate analysis. Cancer 70 2602~9,199221. Valera V,Yokoyama N,Walter B,et al :Clinical significance of Ki_67proliferation index in disease progression and prognosis of patients withresected colorectal carcinoma. Br J Surg 92 :1002_7,200522.Dziegiel P, Forgacz J, Suder E, et al -Prognostic significance ofmetallothionein expression in correlation with Ki_67 expression inadenocarcinomas of large intestine. Histol Histopathol 18 :401_7,200323. Scopa CD,Tsamandas AC,Zolata V,et al -Potential role of bcl-2 andKi—67 expression and apoptosis in colorectal carcinoma :a clinicopathologicstudy. Dig Dis Sci 48 :1990_7,200324. Bhatavdekar JM, Patel DD, Chikhlikar PR,et al :Molecular markersare predictors of recurrence and survival in patients with Dukes B andDukes C colorectal adenocarcinoma. Dis Colon Rectum 44 :523_33,200125. Chen YT, Henk MJ, Carney KJ, et al -Prognostic Significance of TumorMarkers in Colorectal Cancer Patients :DNA Index, S-Phase Fraction, p53Expression,and Ki_67 Index. J Gastrointest Surg 1 :266_273,1997
26. Choi HJ, Jung IK, Kim SS, et al -Proliferating cell nuclear antigenexpression and its relationship to malignancy potential in invasivecolorectal carcinomas. Dis Colon Rectum 40:51—9,199727. Hilska M, Collan YU, O Laine VJ, et al :The significance of tumourmarkers for proliferation and apoptosis in predicting survival in colorectalcancer. Dis Colon Rectum 48 :2197_208,200528.Salminen E,Palmu S,Vahlberg T,et al :Increased proliferation activitymeasured by immunoreactive Ki67 is associated with survival improvement in rectal/recto sigmoid cancer. World J Gastroenterolll :3245_9,200529. Garrity MM,Burgart LJ, Mahoney MR,et al -Prognostic value ofproliferation,apoptosis,defective DNA mismatch repair,and p53overexpression in patients with resected Dukes' B2 or C colon cancer :aNorth Central Cancer Treatment Group Study. J Clin Oncol 22 :1572_82,200430. Allegra CJiPaik S,Colangelo LH,et al Prognostic value ofthymidylate synthase, Ki_67,and p53 in patients with Dukes ' B and Ccolon cancer :a National Cancer Institute-National Surgical AdjuvantBreast and Bowel Project collaborative study. J Clin Oncol 21 :241_50,200331. Palmqvist R,Sellberg P,Oberg A,et al :Low tumour cell proliferationat the invasive margin is associated with a poor prognosis in Dukes' stage Bcolorectal cancers. Br J Cancer 79 :577-81,199932. Paradiso A,Rabinovich M,Vallejo C,et al :p53 and PCNA expressionin advanced colorectal cancer-response to chemotherapy and long-termprognosis. Int J Cancer 69 :437_41,199633. Neoptolemos JP, Oates GD, Newbold KM, et al :Cyclin/proliferationcell nuclear antigen immunohistochemistry does not improve theprognostic power of Dukes' or Jassr classifications for colorectal cancer. BrJ Surg 82 :184-7,199534. Compton C,F(xiàn)enoglio-Preiser CM,Pettigrew N,et al :American jointcommittee on cancer prognostic factors consensus conference. Colorectalworking group. Cancer 88 :1739_1757,200035. Colantuoni C,Henry G,Zeger S,et al :SN0MAD (Standarization andNOrmalization of MicroArray Data) :web_accessible gene expression dataanalysis. Bioinformatics 18 :1540_1541,200236.Livak KJ, Schmittgen TD Analysis of Relative Gene Expression DataUsing Real-Time Quantitative PCR and the 2-Δ Δ CT Method. METH0DS25 402-408,200137. Pocock SJ,Clayton TC,Altman DG :Survival plots of time-to-eventoutcomes in clinical trials :good practice and pitfalls.Lancet 359 :1686-89,200238. Trusher VG, Tibshirani R,Chu G !Significance analysis ofmicroarraysapplied to the ionizing radiation response.Proc Natl Acad Sci USA98 5116-21,200139.Hosack DA, Dennis G, Sherman BT, et al -Identifying biological themeswithin lists of genes with EASE. Genome biology 4:R70,200340.Perou CM,Jeffrey SS,DE Rijn MV-Distinctive gene expressionpatterns in human mammary epithelial cells and breast cancers. Proc. Natl. Acad. Sci. USA 96 :9212-17,199941.Perou CM :Molecular portraits of human breast tumours. Nature406 747-752,200042. Welsh JB,Zarrinkar PP,Sapinoso LM,et al :Analysis of geneexpression profiles in normal and neoplastic ovarian tissue samplesidentifies candidate molecular markers of epithelial ovarian cancer. Proc. Natl Acad. Sci. USA 98 1176-1181,200143.Chen X,Cheung ST,So S,et al :Gene expression patterns in humanliver cancers. Mol. Biol. Cell 13 :1929-1939,200244. Kirschner-Schwabe R,Lottaz C,Todling J,et al :Expression of late cellcycle genes and an increased proliferative capacity characterize very earlyrelapse of childhood acute lymphoblastic leukemia. Clin Cancer Resl2 4553-61,200645. Krasnoselsky ALiWhiteford CC,Wei JS,et al :Altered expression ofcell cycle genes distinguishes aggressive neuroblastoma· 0ncogene24 :1533—1541,200546. Inamura K,F(xiàn)ujiwara T,Hoshida Y, et al :Two subclasses of lungsquamous cell carcinoma with different gene expression profiles andprognosis identified by hierarchical clustering and non-negative matrixfactorization. Oncogene 24 7105-13,200547. Chung CH, Parker JS, Karaca G,et al :Molecular classification of headand neck squamous cell carcinomas using patterns of gene expression. Cancer Cell 5 :489-500,200448.LaTulippe E,Satagopan J,Smith A,et al -Comprehensive geneexpression analysis of prostate cancer reveals distinct transcriptionalprograms associated with metastatic disease. Cancer Res 62 :4499_4506,200249. Hippo Y,Taniguchi H,Tsutumi S,et al :Global gene expression analysisof gastric cancer by oligonucleotide microarrays. Cancer Res 62 :233_40, 200250. Whitfield ML, Sherlock G, Saldanha AJ, et al !identification of genesperiodically expressed in the human cell cycle and their expression intumours.Mol Biol Cell 13 1977-2000,200251. Li JQ, Miki H, Ohmori M, et al :Expression of cyclin E andcyclin-dependent kinase 2 correlates with metastasis and prognosisincolorectal carcinoma. Hum Pathol 32 :945_53,200152. Li JQ, Miki H,Wu F,et al :Cyclin A correlates with carcinogenesis andmetastasis, and p27(kipl)correlates with lymphatic invasion, incolorectal neoplasms. Hum Pathol 33,1006-15,200253.Itamochi H,Kigawa J,Sugiyama T,et al :Low proliferation activitymay be associated with chemoresistance in clear cell carcinoma of theovary. Obstet Gynecol 100 :281_287,200254 :Imdahl A,Jenkner J,Ihling C,et al :1s MIB-I proliferation index apredictor for response to neoadjuvant therapy in patients with esophagealcancer ? Am J Surg 179 :514_520,2000.
權利要求
確定患者中胃腸癌進展的預后標簽,其包含選自表A、表B、表C或表D的一種或更多種基因。
2.根據(jù)權利要求1所述的標簽,其中所述標簽包含選自CDC2、MCM6、RPA3、MCM7、PCNA、 G22P1、KPNA2、ANLN、APG7L、TOPK, GMNN、RRMl、CDC45L、MAD2L1、RAN、DUT, RRM2、CDK7、MLH3、 SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、FENl、DRFl、PREI3、CCNEl、RPAl、 P0LE3、RFC4、MCM3、CHEKU CCNDl和CDC37中任何一種的一種或更多種基因。
3.預測不具有胃腸癌復發(fā)的胃腸癌患者長期存活的可能性的方法,其包含測定獲自患 者的胃腸道樣品中的一種或更多種預后RNA轉錄物或其表達產(chǎn)物的表達水平,用胃腸癌組 織樣品中所有RNA轉錄物或其產(chǎn)物或參照組RNA轉錄物或其表達產(chǎn)物的表達水平進行標準 化;其中預后RNA轉錄物是選自表A、表B、表C或表D的一種或更多種基因的轉錄物;及建立不具有胃腸癌復發(fā)的長期存活可能性。
4.根據(jù)權利要求3所述的方法,其中至少一個預后RNA轉錄物或其表達產(chǎn)物選自 CDC2、MCM6、RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、T0PK、GMNN、RRM1、CDC45L、MAD2L1、 RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、FENl、 DRFl、PREI3、CCNE1、RPAl、P0LE3、RFC4、MCM3、CHEKl、CCNDl 和 CDC37 的任何一種。
5.根據(jù)權利要求3或權利要求4的方法,其包含測定至少2種、至少5種、至少10種或 至少15種預后RNA轉錄物或其表達產(chǎn)物的表達水平。
6.根據(jù)權利要求3到5任一項所述的方法,其中一種或更多種預后RNA轉錄物或其表 達產(chǎn)物增加的表達指示了不具有胃腸癌復發(fā)的長期存活可能性的增加。
7.根據(jù)權利要求3到5任一項所述的方法,其中預測模型被應用于建立不具有胃腸癌 復發(fā)的長期存活可能性,所述模型通過對復發(fā)和非復發(fā)腫瘤樣品中預測標簽的表達水平應 用預測方法而建立。
8.根據(jù)權利要求7所述的方法,其中所述預測方法選自線性模型、支持向量機、神經(jīng)網(wǎng) 絡、分類回歸樹、集成學習方法、線性判別分析、近鄰方法、貝葉斯網(wǎng)絡和獨立成分分析。
9.根據(jù)權利要求3到8任一項所述的方法,其中胃腸癌是胃癌或結直腸癌。
10.根據(jù)權利要求3到9任一項所述的方法,其中測定一種或更多種預后RNA轉錄物的 表達水平。
11.根據(jù)權利要求3到10任一項所述的方法,其中從患者的固定的蠟包埋的胃腸癌組 織樣本分離RNA。
12.根據(jù)權利要求3到10任一項所述的方法,其中從核芯針活檢組織或細針抽吸細胞 分離RNA。
13.包含雜交到選自表A、表B、表C或表D的兩種或更多種基因的多核苷酸的陣列。
14.根據(jù)權利要求13所述的陣列,其包含雜交到下述基因的兩種或更多種的多核苷 酸CDC2、MCM6、RPA3、MCM7、PCNA, G22P1、KPNA2、ANLN、APG7L、TOPK, GMNN、RRMl、CDC45L、 MAD2L1、RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、 FENl、DRFl、PREI3、CCNEl、RPAl、P0LE3、RFC4、MCM3、CHEKl、CCNDl 和 CDC37。
15.根據(jù)權利要求13或權利要求14所述的陣列,其包含雜交到至少3、至少5、至少10 或至少15種所述基因的多核苷酸。
16.根據(jù)權利要求13所述的陣列,其包含雜交到下述基因的多核苷酸CDC2、MCM6、 RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、TOPK, GMNN、RRMl、CDC45L、MAD2L1、RAN、DUT, RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、FENl、DRFl、 PREI3、CCNE1、RPAl、P0LE3、RFC4、MCM3、CHEKl、CCNDl 和 CDC37。
17.根據(jù)權利要求13到16任一項所述的陣列,其中多核苷酸是cDNA。
18.根據(jù)權利要求17所述的陣列,其中cDNA長大約500到5000個堿基。
19.根據(jù)權利要求13到16任一項所述的陣列,其中多核苷酸是寡核苷酸。
20.根據(jù)權利要求19所述的陣列,其中寡核苷酸長大約20到80個堿基。
21.根據(jù)權利要求13到20任一項所述的陣列,其中固體表面是玻璃。
22.預測診斷患有胃腸癌的患者無胃腸癌復發(fā)的長期存活可能性的方法,其包含下述 步驟(1)測定胃腸癌組織樣品中選自表A、表B、表C或表D的一種或多種基因的RNA轉錄物 或表達產(chǎn)物的表達水平,所述樣品獲自患者,用胃腸癌組織樣品中所有RNA轉錄物或其產(chǎn) 物或參照組RNA轉錄物或其表達產(chǎn)物的表達水平進行標準化;(2)將步驟(1)中獲得的數(shù)據(jù)進行統(tǒng)計分析;及(3)確定長期存活可能性是增加還是減少;并建立無胃腸癌復發(fā)的長期存活可能性。
23.根據(jù)權利要求22所述的方法,其中至少一種預后RNA轉錄物或其表達產(chǎn)物選自 CDC2、MCM6、RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、T0PK、GMNN、RRM1、CDC45L、MAD2L1、 RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、FENl、 DRFl、PREI3、CCNE1、RPAl、P0LE3、RFC4、MCM3、CHEKl、CCNDl 和 CDC37 的任何一種。
24.根據(jù)權利要求22或權利要求23所述的方法,其中通過使用Cox比例風險模型進行 統(tǒng)計分析。
25.為癌癥患者制作個體化基因組學譜的方法,其包含步驟(a)將從獲得自患者的胃 腸組織抽提的RNA進行基因表達分析;(b)測定選自列于表A、表B、表C或表D任一種的胃 腸癌基因集的一種或更多種基因的表達水平,其中用一種對照基因或多種對照基因將表達 水平標準化,及可選地,與胃腸癌參照組織集中發(fā)現(xiàn)的量進行比較;及(c)創(chuàng)立總結了通過 基因表達分析獲得的數(shù)據(jù)的報告。根據(jù)權利要求24所述的方法,其中胃腸組織包括胃腸癌細胞。
26.根據(jù)權利要求24所述的方法,其中從固定的石蠟包埋的活檢樣品獲取胃腸組織。
27.根據(jù)權利要求26所述的方法,其中RNA被片段化。
28.根據(jù)權利要求22到27任一項所述的方法,其中所述報告包括患者長期存活可能性 的預測。
29.根據(jù)權利要求22到29任一項所述的方法,其中報告包括患者治療方法的建議。
30.一種預后方法,其包含(a)對樣品的至少一種基因的RAN轉錄物或其產(chǎn)物的水平 進行定量分析,所述樣品包含胃腸癌細胞且獲得自患者,所述基因選自表A、表B、表C或表D 的任一種,及(b)如果一種或多種基因或其產(chǎn)物的標準化表達水平升高到高于定義的表達 閾值則鑒定患者可能具有無胃腸癌復發(fā)的長期存活可能性。
31.根據(jù)權利要求30所述的方法,其中至少一種預后RNA轉錄物或其表達產(chǎn)物選自CDC2、MCM6、RPA3、MCM7、PCNA、G22P1、KPNA2、ANLN、APG7L、T0PK、GMNN、RRM1、CDC45L、MAD2L1、 RAN、DUT、RRM2、CDK7、MLH3、SMC4L1、CSPG6、P0LD2、P0LE2、BCCIP、Pfs2、TREXl、BUB3、FENl、 DRFl、PREI3、CCNE1、RPAl、P0LE3、RFC4、MCM3、CHEKl、CCNDl 和 CDC37 的任何一個。
32.根據(jù)權利要求30或31所述的方法,其中將基因的RNA轉錄物水平相對于兩種或更 多種持家基因的平均RNA轉錄物或產(chǎn)物水平進行標準化。
33.根據(jù)權利要求32所述的方法,其中持家基因選自甘油醛-3-磷酸-脫氫酶 (GAPDH)、CypI、清蛋白、肌動蛋白、微管蛋白、親環(huán)蛋白次黃嘌呤磷酸核糖基轉移酶(HRPT)、 L32、28S 和 185。
34.根據(jù)權利要求30到33任一項所述的方法,其中對樣品的基因進行全局基因表達分 析,所述基因為存在的高于檢測限的所有基因。
35.根據(jù)權利要求30到34任一項所述的方法,其中基因的RNA轉錄物水平相對于所有 測試的基因或其子集的平均RNA轉錄物或產(chǎn)物信號進行標準化。
36.根據(jù)權利要求30到35任一項所述的方法,其中利用定量RT-PCR測定RNA轉錄物 水平,且信號是Ct值。
37.根據(jù)權利要求35所述的方法,其中測試基因包括至少50或至少100種癌癥相關基因。
38.根據(jù)權利要求30到37任一項所述的方法,其中患者是人。
39.根據(jù)權利要求30到38任一項所述的方法,其中樣品是固定的石蠟包埋組織 (FPET)樣品或新鮮或冷凍的組織樣品。
40.根據(jù)權利要求30到38任一項所述的方法,其中樣品是來源于細針活檢、核芯針活 檢或其他類型活檢的組織樣品。
41.根據(jù)權利要求30到40任一項所述的方法,其中利用定量RT-PCR進行定量分析。
42.根據(jù)權利要求30到40任一項所述的方法,其中通過定量基因的產(chǎn)物進行定量分析。
43.根據(jù)權利要求30到40任一項所述的方法,其中通過免疫組織化學或蛋白質組學技 術定量產(chǎn)物。
44.根據(jù)權利要求30到43任一項所述的方法,進一步包含制作報告的步驟,所述報告 指示患者具有增加的無胃腸癌復發(fā)的長期存活可能性。
45.一種試劑盒,其包含下述成分的一種或多種(1)抽提緩沖液/試劑及規(guī)程;(2) 反轉錄緩沖液/試劑及規(guī)程;及(3)適于進行權利要求3、25和30任一項所述方法的定量 RT-PCR緩沖液/試劑及規(guī)程。
全文摘要
本發(fā)明涉及用于確定患者中癌癥,特別是胃腸癌如胃癌或結直腸癌預后的方法和組合物。特別地,本發(fā)明涉及基于細胞增生標簽使用遺傳標志物預測癌癥如胃癌或結直腸癌的預后。在多個方面,本發(fā)明涉及預測癌癥患者長期存活可能性的方法,確定癌癥患者治療方案的方法,制作癌癥患者個體化基因組學譜的方法等方法,以及用于執(zhí)行這些方法的試劑盒和裝置。
文檔編號C12Q1/68GK101932724SQ200880119316
公開日2010年12月29日 申請日期2008年10月6日 優(yōu)先權日2007年10月5日
發(fā)明者A·E·里夫, A·安若姆肖阿, M·A·布萊克, Y-H·林 申請人:環(huán)太平洋生物技術有限公司