專利名稱::黑色素瘤的預(yù)后預(yù)測(cè)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及用于在患者中確定癌癥(特別是黑色素瘤)預(yù)后的方法和組合物。具體地,本發(fā)明涉及基于預(yù)后標(biāo)簽(prognosticsignatures),使用遺傳和蛋白質(zhì)組標(biāo)志物(marker)確定癌癥(如黑色素瘤)的預(yù)后。
背景技術(shù):
:在工業(yè)國(guó)家,黑色素瘤的發(fā)生率在過去25年間穩(wěn)步上升,其中澳洲的發(fā)生率居世界最高、雖然察覺到的"黑色素瘤流行"最有可能代表了對(duì)薄的黑色素瘤的檢測(cè)增加2,但是黑色素瘤主要影響年輕人群,導(dǎo)致生產(chǎn)壽命的損失,且僅次于兒童惡性腫瘤和睪丸癌3'4。黑色素瘤在很大程度上對(duì)細(xì)胞毒性化療5、生物劑6'7及多種疫苗接種策略8無反應(yīng)。小亞群的患者似乎可以受益于生物和/或細(xì)胞毒性化療,但是先驗(yàn)性地鑒別這些患者在目前是不可能的,這就造成許多患者被迫接觸相當(dāng)大的毒性而受益概率低。黑色素瘤一旦轉(zhuǎn)移到局部淋巴結(jié),70%的患者將在5年內(nèi)死亡9。長(zhǎng)期存活的患者亞群是獨(dú)特的群體。目前無輔助療法可提供總體的存活益處,雖然一些臨床醫(yī)師提供干擾素-a改善無疾存活^但許多國(guó)際中心不提供臨床試驗(yàn)之外的主動(dòng)輔助治療。預(yù)測(cè)哪些患者不管是否應(yīng)用輔助療法皆可表現(xiàn)良好,將可以防止不必要的毒性,并使得能夠研發(fā)出靶向更可能獲益人群的更佳治療策略。在輔佐臨床試驗(yàn)中對(duì)患者更好的分層將會(huì)減少I型和II型兩類錯(cuò)誤。EC0G1684研究的后續(xù)12年更新及其他隨機(jī)化研究已經(jīng)表明干擾素-a改善III期黑色素瘤的TTP但不改善總體存活s'"'11。患者群內(nèi)固有的異質(zhì)性現(xiàn)已被充分認(rèn)識(shí)到但尚且不能控制,該異質(zhì)性可能會(huì)粉碎在最初EC0G1684研究10及其他較小II期研究中所見到的有希望的存活效果。對(duì)更可能復(fù)發(fā)的那些患者進(jìn)行分層可以平衡這種異質(zhì)性,并允許更精確地對(duì)治療進(jìn)行比較。需要進(jìn)一步的工具來預(yù)測(cè)黑色素瘤的預(yù)后。本發(fā)明提供基于預(yù)后癌癥標(biāo)志物(尤其是黑色素瘤預(yù)后標(biāo)志物)以輔助預(yù)后和治療癌癥的方法、組合物、試劑盒和裝置。發(fā)明概述在某些實(shí)施方案中,提供經(jīng)鑒定在具有良好預(yù)后的黑色素瘤和具有不良預(yù)后的黑色素瘤中差異表達(dá)的標(biāo)志物基因集。該基因集可用來產(chǎn)生包含兩個(gè)或更多個(gè)標(biāo)志物、能夠預(yù)測(cè)患者黑色素瘤的進(jìn)展速度的預(yù)后標(biāo)簽。單個(gè)的標(biāo)志物個(gè)體可能隨腫瘤進(jìn)展快速與否而差異表達(dá)。通過將標(biāo)志物組合在一起成為預(yù)后標(biāo)簽,可以增強(qiáng)預(yù)測(cè)的準(zhǔn)確度,提供比單基因分析法有效得多的單獨(dú)檢驗(yàn)。此外,本發(fā)明還提供,諸如統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、人工智能和數(shù)據(jù)挖掘等技術(shù)在預(yù)后標(biāo)簽上的應(yīng)用,從而生成預(yù)測(cè)模型。在另一實(shí)施方案中,隨后可以將預(yù)測(cè)模型應(yīng)用于患者腫瘤中特定預(yù)后標(biāo)簽的標(biāo)志物的表達(dá)水平上,以確定預(yù)后。在某些實(shí)施方案中,標(biāo)志物的表達(dá)水平可利用微陣列方法、定量聚合酶鏈?zhǔn)椒磻?yīng)(qPCR)或免疫測(cè)定法來確立。特別地,本發(fā)明提供了確定患者黑色素瘤預(yù)后的方法,包括步驟(i)在來自患者的黑色素瘤腫瘤樣品中確定黑色素瘤預(yù)后標(biāo)志物(MPM)的表達(dá)水平、或者包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)水平,(ii)應(yīng)用預(yù)測(cè)模型,所述模型通過對(duì)預(yù)后良好和不良的腫瘤樣品中該MPM或預(yù)后標(biāo)簽的表達(dá)水平應(yīng)用預(yù)測(cè)方法而確立,(iii)確立預(yù)后??蛇x地,本發(fā)明也提供了確定黑色素瘤患者進(jìn)行藥物試驗(yàn)的適宜性的方法,包括步驟(i)在來自患者的黑色素瘤腫瘤樣品中確定MPM的表達(dá)水平、或者包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)水平,(ii)應(yīng)用預(yù)測(cè)模型,所述模型通過對(duì)預(yù)后良好和不良的腫瘤樣品中該MPM或預(yù)后標(biāo)簽的表達(dá)水平應(yīng)用預(yù)測(cè)方法而確立,(iii)確立患者對(duì)試驗(yàn)的適宜性。根據(jù)這些方法的MPM可選自表1。預(yù)測(cè)方法選自線性模型(1inearmodel)、支持向量機(jī)(supportvectormachine)、神經(jīng)網(wǎng)絡(luò)(neuralnetwork)、分類回歸樹(classificationandregressiontree)、集成學(xué)習(xí)方法(ensemblelearningmethods)、判另ll分析(discriminantanalysis)、近令卩方法(nearestneighbormethod)、貝口十其jf網(wǎng)絡(luò)(Bayesiannetwork)、獨(dú)立成分分析(independentcomponentsanalysis)。確定MPM或預(yù)后標(biāo)簽的表達(dá)水平可通過檢測(cè)各基因的mRNA表達(dá)水平進(jìn)行,例如利用正向引物和反向引物實(shí)施qPCR方法。確定MPM或預(yù)后標(biāo)簽表達(dá)水平也可通過檢測(cè)各基因的cDNA表達(dá)水平進(jìn)行,例如利用與所述cDNA的至少一部分互補(bǔ)的核苷酸。此外,MPM或預(yù)后標(biāo)簽表達(dá)水平可通過檢測(cè)各標(biāo)志物的蛋白質(zhì)表達(dá)水平、或通過檢測(cè)各標(biāo)志物的肽表達(dá)水平來確定,例如利用針對(duì)各標(biāo)志物的抗體(如單克隆抗體或多克隆抗血清)??衫脢A心免疫測(cè)定法或ELISA試驗(yàn)。本發(fā)明還提供用于確定黑色素瘤進(jìn)展風(fēng)險(xiǎn)的預(yù)后標(biāo)簽,包括兩個(gè)或更多個(gè)黑色素瘤預(yù)后標(biāo)志物(MPM)。該預(yù)后標(biāo)簽的MPM可選自表1。另一方面,本發(fā)明提供用于確定黑色素瘤預(yù)后的裝置,包括其上具有一個(gè)或多個(gè)位置的基質(zhì),所述位置上具有兩個(gè)或更多個(gè)寡核苷酸,每個(gè)寡核苷酸選自一個(gè)或多個(gè)MPM。所述兩個(gè)或更多個(gè)寡核苷酸可以是選自表1的MPM。本發(fā)明還提供用于檢測(cè)MPM的表達(dá)、或包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)的試劑在制備用于預(yù)測(cè)患者黑色素瘤預(yù)后的試劑盒中的用途。MPM可選自表1。所述試劑可通過檢測(cè)MPMmRNA或MPMcDNA的表達(dá)而檢測(cè)該一個(gè)或多個(gè)MPM的表達(dá)水平。所述試劑可以是與MPMmRNA或cDNA的至少一部分互補(bǔ)的寡核苷酸??蛇x地,所述試劑可通過檢測(cè)MPM蛋白質(zhì)或肽的表達(dá)而檢測(cè)該一個(gè)或多個(gè)MPM的表達(dá)水平。所述試劑可以是抗體,如單克隆抗體或多克隆抗血清。所述試劑盒可適合于進(jìn)行夾心免疫測(cè)定或ELISA試驗(yàn)。附圖的簡(jiǎn)短說明本發(fā)明參照其具體實(shí)施方案并參照附圖進(jìn)行說明,其中圖1圖示了用來建立預(yù)測(cè)分值的22個(gè)基因("黑色素瘤標(biāo)志物")?;蚶肕ann-Whitney檢驗(yàn)選擇。圖2圖示了差異表達(dá)基因的基因本體(GeneOntology)分類及相關(guān)顯著性。最顯著本體(themostsignificantontologies)由各類間重疊的基因數(shù)目來確定,即這許多基因既在該基因列表中又處于該類中為巧合的似然性。圖3為實(shí)驗(yàn)圖解,包括訓(xùn)練集和兩個(gè)獨(dú)立應(yīng)用的驗(yàn)證集A(運(yùn)用qPS)和驗(yàn)證集B(運(yùn)用aPS)。訓(xùn)練集用來開發(fā)預(yù)測(cè)基因,隨后這些預(yù)測(cè)基因運(yùn)用qPS應(yīng)用于驗(yàn)證集A,和運(yùn)用aPS應(yīng)用于驗(yàn)證集B。圖4圖示了用來創(chuàng)建參照cDNA的RNA,所述參照cDNA既用在陣列實(shí)驗(yàn)中,又在qPCR測(cè)定中用作比較器。圖5圖示了使用通用探針文庫(kù)的探針、用于qPCR的測(cè)定法。圖6圖示了用于測(cè)試集和驗(yàn)證集A的患者特征。圖7圖示了利用所有基因(A)和差異表達(dá)基因(B)進(jìn)行的主成分分析,展示了15個(gè)基因分離良好(實(shí)心盒)與不良(空心盒)預(yù)后群的能力。這些基因用來開發(fā)基于陣列和qPCR的預(yù)測(cè)器。圖8圖示了aPS(a-b)和qPS(C_d)在訓(xùn)練集上的應(yīng)用,展示了其與TTP和總體存活的相關(guān)性。aPS僅利用了在陣列數(shù)據(jù)和qPCR數(shù)據(jù)之間具有最強(qiáng)相關(guān)性的15個(gè)基因,而qPS利用了具有最大的分離兩群的能力的5個(gè)基因。圖9圖示了對(duì)訓(xùn)練集和驗(yàn)證集A應(yīng)用的qPS邏輯回歸算法。在平均值處繪制水平線。圖10圖示了第三獨(dú)立集的良好和不良預(yù)后群的qPS分值的分布。發(fā)明詳述定義在詳細(xì)說明本發(fā)明的實(shí)施方案之前,提供本文使用的一些術(shù)語(yǔ)的定義是有用的。術(shù)語(yǔ)"標(biāo)志物"指與生物學(xué)現(xiàn)象的存在定量或定性相關(guān)的分子。"標(biāo)志物"的實(shí)例包括多核苷酸,如基因或基因片段、RNA或RNA片段;或基因產(chǎn)物,包括多肽,如肽、寡肽、蛋白質(zhì)或蛋白質(zhì)片段;或任何相關(guān)代謝物、副產(chǎn)物、或任何其他與現(xiàn)象潛在的機(jī)制直接或間接相關(guān)的鑒定分子,如抗體或抗體片段。本發(fā)明的標(biāo)志物包括如本文公開的核苷酸序列(如GenBank序列),特別是全長(zhǎng)序列、任何編碼序列、任何片段、或其任何互補(bǔ)物,及如上文定義的其任何可測(cè)量的標(biāo)志物。術(shù)語(yǔ)"MPM"或"黑色素瘤預(yù)后標(biāo)志物"或"MPM家族成員"指具有與特定預(yù)后(例如如本文所述的,癌癥向更晚期進(jìn)展的較高或較低可能性)相關(guān)的改變的表達(dá)的標(biāo)志物,但是可排除現(xiàn)有技術(shù)中已知的與黑色素瘤預(yù)后相關(guān)的分子。應(yīng)當(dāng)理解術(shù)語(yǔ)MPM并不要求該標(biāo)志物僅特異于黑色素瘤。相反,在其他類型腫瘤(包括惡性腫瘤)中可以發(fā)生MPM表達(dá)的改變。術(shù)語(yǔ)"預(yù)后標(biāo)簽"、"標(biāo)簽"等指兩個(gè)或更多個(gè)標(biāo)志物(例如MPM)的集,當(dāng)這些標(biāo)志物作為一個(gè)集合一起分析時(shí)允許確定或預(yù)測(cè)事件,例如黑色素瘤的預(yù)后結(jié)果。應(yīng)用包含兩個(gè)或更多個(gè)標(biāo)志物的標(biāo)簽可以減小個(gè)體差異(individualvariation)的影響,允許更穩(wěn)靠的預(yù)測(cè)。MPM的非限制性實(shí)例示于XX。在本發(fā)明的上下文中,述及任何特定集(例如任何標(biāo)簽)中所列的"至少一個(gè)"、"至少兩個(gè)"、"至少五個(gè)"標(biāo)志物等等時(shí),表示所列標(biāo)志物中的任何一個(gè)或任何及所有組合。術(shù)語(yǔ)"預(yù)測(cè)方法"定義為覆蓋來自統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、人工智能和數(shù)據(jù)挖掘領(lǐng)域的較寬方法種類,其可用來確定預(yù)測(cè)模型。該術(shù)語(yǔ)也包括任何適于對(duì)結(jié)果進(jìn)行預(yù)測(cè)的方法,并且不僅包括對(duì)多重標(biāo)志物實(shí)施復(fù)雜分析的方法,而且包括為預(yù)測(cè)結(jié)果而將單個(gè)標(biāo)志物或標(biāo)簽的表達(dá)與對(duì)照組織或與預(yù)定閾值進(jìn)行直接比較的方法。這些在發(fā)明詳述部分進(jìn)一步討論。術(shù)語(yǔ)"預(yù)測(cè)模型"指通過對(duì)數(shù)據(jù)集合應(yīng)用預(yù)測(cè)方法而獲得的特定數(shù)學(xué)模型。在本文詳述的實(shí)施例中,這樣的數(shù)據(jù)集由采自具有良好或不良預(yù)后的黑色素瘤患者的組織樣品中的基因活性測(cè)量結(jié)果組成,其中各樣品的分類(良好或不良)是已知的。這樣的模型可用來(1)將預(yù)后狀態(tài)未知的樣品歸類為良好或不良預(yù)后,或(2)基于未知樣品中指定基因集的mRNA表達(dá)水平或表達(dá)產(chǎn)物的測(cè)量結(jié)果,進(jìn)行代表未知樣品具有良好預(yù)后的可能性的概率預(yù)測(cè)(即,產(chǎn)生欲解釋為概率的比例或百分比)。有關(guān)這些基因特異性測(cè)量結(jié)果如何組合起來產(chǎn)生分類和概率預(yù)測(cè)的確切細(xì)節(jié),取決于用來構(gòu)建模型的預(yù)測(cè)方法的具體機(jī)制。該術(shù)語(yǔ)也包括適于預(yù)測(cè)結(jié)果的任何模型,并且不僅包括利用對(duì)多重標(biāo)志物進(jìn)行復(fù)雜分析的模型,而且包括為預(yù)測(cè)結(jié)果而涉及將單個(gè)標(biāo)志物或標(biāo)簽的表達(dá)與對(duì)照組織或與預(yù)定閾值進(jìn)行直接比較的模型。"靈敏性"、"特異性"(或"選擇性")和"分類率"(classificationrate)在用于描述預(yù)測(cè)模型的效力時(shí)表示如下含義"靈敏性"指真陽(yáng)性樣品(通過模型)也被預(yù)測(cè)為陽(yáng)性的比例。在用于黑色素瘤預(yù)后的檢驗(yàn)中,這將是具有良好預(yù)后的腫瘤通過模型預(yù)測(cè)為良好的比例。"特異性"或"選擇性"表示真陰性樣品(通過模型)也被預(yù)測(cè)為陰性的比例。在用于黑色素瘤預(yù)后的檢驗(yàn)中,這等于具有不良預(yù)后的樣品通過模型被預(yù)測(cè)為不良的比例。"分類率"是所有樣品通過預(yù)測(cè)模型正確分類(不管是陽(yáng)性還是陰性)的比例。如本文所用,"抗體"及類似術(shù)語(yǔ)指免疫球蛋白分子和免疫球蛋白(Ig)分子的免疫活性部分,即含有與抗原特異性結(jié)合(與之發(fā)生免疫反應(yīng))的抗原結(jié)合位點(diǎn)的分子。這些分子包括但不限于多克隆、單克隆、嵌合、單鏈抗體、Fc、Fab、Fab'和Fab2片段,以及Fab表達(dá)文庫(kù)??贵w分子涉及IgG、IgM、IgA、IgE和IgD類的任何分子,這些類型的分子由于其中存在的重鏈的性質(zhì)而彼此不同。這些分子也包括亞類如IgGl、IgG2等等。輕鏈可以是k鏈或A鏈。本文述及抗體時(shí)包括對(duì)所有類、亞類和型的述及。同樣包括在內(nèi)的有嵌合抗體,例如特異于不止一種來源如小鼠或人序列的單克隆抗體或其片段。還包括駝?lì)?camelid)抗體、鯊魚抗體或納米抗體。術(shù)語(yǔ)"癌癥"和"癌"是指或者描述哺乳動(dòng)物中通常以異?;蚴Э氐募?xì)胞生長(zhǎng)為特征的生理狀態(tài)。癌癥和癌癥病理可以伴隨著例如轉(zhuǎn)移、干擾鄰近細(xì)胞的正常機(jī)能、以異常水平釋放細(xì)胞因子或其他分泌產(chǎn)物、抑制或加重炎性或免疫應(yīng)答、瘤形成、癌前病變、惡性腫瘤、周圍或遠(yuǎn)距離組織或器官如淋巴結(jié)的浸潤(rùn)等。尤其包括的是黑色素瘤。術(shù)語(yǔ)"黑色素瘤"指起源于黑素細(xì)胞的腫瘤,所述黑素細(xì)胞見于皮膚,但也見于其他位置,如口腔和肛門生殖器粘膜表面、食道、腦膜和眼。這些腫瘤能夠轉(zhuǎn)移至任何器官。術(shù)語(yǔ)"差異表達(dá)的"、"差異表達(dá)"及類似短語(yǔ)指基因標(biāo)志物的表達(dá)在有病(尤其是癌癥,如黑色素瘤)受試者(例如檢驗(yàn)樣品)中相對(duì)于其在對(duì)照受試者(例如參照樣品)中被激活至更高或更低的水平。該術(shù)語(yǔ)也包括標(biāo)志物的表達(dá)在如下情況被激活至更高或更低的水平在同一病癥的不同階段;在具有良好或不良預(yù)后的疾病中;或在具有更高或更低水平增生的細(xì)胞中。差異表達(dá)的標(biāo)志物可以在多核苷酸水平或多肽水平被激活或抑制,或者可以發(fā)生可變剪接以產(chǎn)生不同的多肽產(chǎn)物。此類差異可通過例如mRNA水平、多肽的表面表達(dá)、分泌或其他分配上的變化來證明。差異表達(dá)可包括比較兩個(gè)或更多個(gè)標(biāo)志物(例如基因或其基因產(chǎn)物)的表達(dá);或比較兩個(gè)或更多個(gè)標(biāo)志物(例如基因或其基因產(chǎn)物)之間的表達(dá)比值;或比較同一標(biāo)志物的兩個(gè)差異加工產(chǎn)物(例如轉(zhuǎn)錄物或多肽),它們?cè)谡J茉囌吆突疾∈茉囌咧g不同;或在同一疾病的不同階段不同;或在具有良好或不良預(yù)后的疾病之間不同;或在具有更高或更低增生水平的細(xì)胞中不同;或在正常組織和患病(尤其是癌癥,或黑色素瘤)組織之間不同。差異表達(dá)包括基因或其表達(dá)產(chǎn)物在例如正常和患病細(xì)胞中、或在經(jīng)歷不同疾病事件或疾病階段的細(xì)胞中、或在具有不同增生水平的細(xì)胞中在時(shí)間或細(xì)胞表達(dá)模式上的定量以及定性差異。術(shù)語(yǔ)"表達(dá)"包括多核苷酸和多肽的產(chǎn)生,特別是由基因或基因的一部分產(chǎn)生RNA(如mRNA),并且包括由RNA或基因或基因的一部分編碼的多肽的產(chǎn)生,以及與表達(dá)相關(guān)的可檢測(cè)物質(zhì)的出現(xiàn)。例如,由于例如多肽_多肽相互作用、多肽_核苷酸相互作用等所致的復(fù)合物形成包括在術(shù)語(yǔ)"表達(dá)"的范圍內(nèi)。另一實(shí)例是結(jié)合性配體(如雜交探針或者抗體)與基因或其他多核苷酸或寡核苷酸、多肽或蛋白質(zhì)片段的結(jié)合,以及結(jié)合性配體的可視化。因此,微陣列、雜交印跡(如Northern印跡)、或免疫印跡(如Western印跡)或珠陣列上的斑點(diǎn)強(qiáng)度,或通過PCR分析的強(qiáng)度,包括在作為根據(jù)的該生物分子的術(shù)語(yǔ)"表達(dá)"的范圍內(nèi)。術(shù)語(yǔ)"表達(dá)閾值"和"規(guī)定的表達(dá)閾值"可互換使用,是指所討論標(biāo)志物的水平,該多核苷酸或多肽在此界外作為患者存活的預(yù)測(cè)標(biāo)志物。閾值將取決于確立的預(yù)測(cè)模型,通過實(shí)驗(yàn)由臨床研究(例如下文實(shí)施例中所述的那些)獲得。根據(jù)所用的預(yù)測(cè)模型,可設(shè)置表達(dá)閾值以實(shí)現(xiàn)最高靈敏性,或最大特異性,或最小誤差(最高分類率)。例如,可設(shè)置較高的閾值以實(shí)現(xiàn)最小誤差,但是這可能導(dǎo)致較低的靈敏性。所以,對(duì)于任何給定的預(yù)測(cè)模型,可以利用臨床研究設(shè)置表達(dá)閾值,其通常實(shí)現(xiàn)最高靈敏性而同時(shí)具有最小誤差率。在任何情形下表達(dá)閾值的確定完全落在本領(lǐng)域技術(shù)人員的知識(shí)范圍之內(nèi)。術(shù)語(yǔ)"長(zhǎng)期存活"在本文用來指繼手術(shù)或其他治療之后存活至少5年,更優(yōu)選至少8年,最優(yōu)選至少10年。術(shù)語(yǔ)"微陣列"指捕獲劑[優(yōu)選多核苷酸(如探針)或多肽]在基質(zhì)上的有序或無序排列。參見例如MicroarrayAnalysis,M.Schena,JohnWiley&Sons,2002;MicroarrayBiochipTechnology,M.Schena編車茸,EatonPublishing,2000;GuidetoAnalysisofDNAMicroarrayData,S.K皿dsen,JohnWiley&Sons,2004;禾口ProteinMicroarrayTechnology,D.Kambhampati編車茸,JohnWiley&Sons,2004。術(shù)語(yǔ)"寡核苷酸"是指多核苷酸,通常為探針或引物,包括而不限于單鏈脫氧核糖核苷酸、單鏈或雙鏈核糖核苷酸、RNA:DNA雜合體、和雙鏈DNA。寡核苷酸(如單鏈DNA探針寡核苷酸)往往通過化學(xué)法合成,例如利用可商購(gòu)的自動(dòng)化寡核苷酸合成儀,或通過多種其他方法,包括體外表達(dá)系統(tǒng)、重組技術(shù)以及細(xì)胞和生物體中的表達(dá)。以單數(shù)或復(fù)數(shù)形式使用的術(shù)語(yǔ)"多核苷酸"通常是指任何多聚核糖核苷酸或多聚脫氧核糖核苷酸,其可以是未修飾的RNA或DNA,或者修飾的RNA或DNA。這包括而不限于單鏈和雙鏈DNA,包括單鏈和雙鏈區(qū)的DNA,單鏈和雙鏈RNA,以及包括單鏈和雙鏈區(qū)的RNA,包含DNA和RNA的雜合分子——其可以為單鏈、或更通常為雙鏈、或者包括單鏈和雙鏈區(qū)。同樣包括在內(nèi)的有包含RNA或DNA或者RNA和DNA兼有的三鏈區(qū)。尤其包括的有mRNA、cDNA、和基因組DNA,及其任何片段。該術(shù)語(yǔ)包括含有一個(gè)或多個(gè)修飾堿基(如氚化堿基)或者稀有堿基(如肌苷)的DNA和RNA。本發(fā)明的多核苷酸可包括編碼或非編碼序列、或有義或反義序列。應(yīng)當(dāng)理解,本文各處述及的"多核苷酸"或類似術(shù)語(yǔ)將包括全長(zhǎng)序列及其任何片段、衍生物或變體。如本文所用,"多肽"指寡肽、肽或蛋白質(zhì)序列,或其片段,并且指天然存在的、重組的、合成的或半合成的分子。在本文引述的"多肽"指天然存在的蛋白質(zhì)分子的氨基酸序列的情況下,"多肽"或類似術(shù)語(yǔ)并不意在將氨基酸序列局限為全長(zhǎng)分子的全部、天然氨基酸序列。應(yīng)當(dāng)理解,本文各處述及的"多肽"或類似術(shù)語(yǔ)將包括全長(zhǎng)序列及其任何片段、衍生物或變體。術(shù)語(yǔ)"預(yù)后"指對(duì)醫(yī)學(xué)結(jié)果(medicaloutcome),例如不良或良好結(jié)果的預(yù)測(cè)(例如長(zhǎng)期存活的可能性);消極的預(yù)后或不良結(jié)果包括復(fù)發(fā)、疾病進(jìn)展(例如腫瘤生長(zhǎng)或轉(zhuǎn)移或耐藥性)或死亡的預(yù)測(cè)。積極的預(yù)后或良好結(jié)果包括疾病好轉(zhuǎn)(例如無疾狀態(tài))、改善(例如腫瘤消退)或穩(wěn)定的預(yù)測(cè)。術(shù)語(yǔ)"增生"指導(dǎo)致細(xì)胞大小或細(xì)胞數(shù)量增加的過程,并且可包括如下一種或多種腫瘤或細(xì)胞生長(zhǎng)、血管生成、神經(jīng)支配和轉(zhuǎn)移。術(shù)語(yǔ)"qPCR,,或"QPCR,,指例如PCRTechnique-QuantitativePCR,J.W丄arrick編輯,EatonPublishing,1997禾口A-ZofQuantitativePCR,S.Bustin編輯,IULPress,2004中所述的定量聚合酶鏈?zhǔn)椒磻?yīng)。術(shù)語(yǔ)"腫瘤"指所有惡性或良性的瘤形成性細(xì)胞生長(zhǎng)和增生,以及所有癌前及癌細(xì)胞和組織。雜交反應(yīng)的"嚴(yán)緊性"可由本領(lǐng)域普通技術(shù)人員容易地確定,并且通常是取決于探針長(zhǎng)度、洗滌溫度和鹽濃度的經(jīng)驗(yàn)式計(jì)算。一般而言,較長(zhǎng)的探針需要較高的溫度進(jìn)行正確退火,而較短的探針需要較低的溫度。雜交通常有賴于當(dāng)互補(bǔ)鏈存在時(shí)變性DNA于低于其解鏈溫度的環(huán)境中重新退火的能力。探針和可雜交序列之間期望的同源性程度越高,可以使用的相對(duì)溫度就越高。由此,較高的相對(duì)溫度將傾向于使反應(yīng)條件更加嚴(yán)緊,而較低的溫度則將傾向于使反應(yīng)條件不太嚴(yán)緊。雜交反應(yīng)嚴(yán)緊性的其他細(xì)節(jié)和說明可以見于例如Ausubel等人,CurrentProtocolsinMolecularBiology,WileyIntersciencePublishers,(1995)。如本文所定義,"嚴(yán)緊條件"或"高嚴(yán)緊條件"通常(l)采用低離子強(qiáng)度和高溫進(jìn)行洗滌,例如0.015M氯化鈉/0.0015M檸檬酸鈉/0.1X十二烷基硫酸鈉,5(TC;(2)雜交期間采用變性劑(如甲酰胺),例如50%(v/v)甲酰胺,與O.1%牛血清白蛋白/0.1%Ficoll/0.1X聚乙烯妣咯烷酮/50mM磷酸鈉緩沖液pH6.5,與750mM氯化鈉,75mM擰檬酸鈉,42"C;或(3)采用50X甲酰胺,5XSSC(0.75MNaCl,O.075M擰檬酸鈉),50mM磷酸鈉(pH6.8),0.lX焦磷酸鈉,5XDenhardt溶液,超聲化鮭精DNA(50iig/ml),0.1%SDS,禾口10%硫酸葡聚糖,42t:,并在0.2XSSC(氯化鈉/檸檬酸鈉)中于42t:和50%甲酰胺中于55t:洗滌,接著是包括于55t:在含EDTA的0.1XSSC中的高嚴(yán)緊洗滌。"中等嚴(yán)緊條件"可如Sambrook等人,《分子克隆實(shí)驗(yàn)指南》(MolecularCloning:ALaboratoryManual),紐約冷泉港出版社(ColdSpringHarborPress),1989所述予以確認(rèn),并且包括使用不如上文所述嚴(yán)緊的洗滌溶液和雜交條件(如溫度、離子強(qiáng)度和SDS%)。中等嚴(yán)緊條件的一個(gè)實(shí)例是于37t:在包含20X甲酰胺,5XSSC(150mMNaCl,15mM檸檬酸三鈉),50mM磷酸鈉(pH7.6),5XDenhardt溶液,10%硫酸葡聚糖和20mg/ml變性剪切鮭精DNA的溶液中過夜孵育,接著在1XSSC中于大約37-5(TC洗滌濾膜。熟練技術(shù)人員將會(huì)明了如何對(duì)溫度、離子強(qiáng)度等進(jìn)行必要的調(diào)整,以適應(yīng)諸如探針長(zhǎng)度等因素。除非另有說明,本發(fā)明的實(shí)施將采用分子生物學(xué)(包括重組技術(shù))、微生物學(xué)、細(xì)胞生物學(xué)和生物化學(xué)的常規(guī)技術(shù),這落入本領(lǐng)域技術(shù)范圍內(nèi)。這樣的技術(shù)在文獻(xiàn)中有充分的說明,例如《分子克隆實(shí)驗(yàn)指南》,第2版,Sambrook等人,1989OligonucleotideSynthesis,MJGait編輯,1984;AnimalCellCulture,R.I.Freshney編輯,1987;MethodsinEnzymology,AcademicPress,Inc.;HandbookofExperimentalImmunology,第4版,D.M.Weir&CC.Blackwell編輯,BlackwellScienceInc.,1987;GeneTransferVectorsforMammalianCells,J.M.Miller&M.P.Calos編輯,1987;CurrentProtocolsinMolecularBiology,F.M.Ausubel等人編輯,1987;以及PCR:ThePolymeraseChainReaction,Mullis等人編輯,1994。本發(fā)明實(shí)施方案的描述本發(fā)明公開了使用微陣列來鑒定和確定特定預(yù)后標(biāo)志物和標(biāo)簽在黑色素瘤中的特定預(yù)后作用。本文所示的基于微陣列的研究可以確立能夠用來預(yù)測(cè)黑色素瘤患者的良好或不良預(yù)后的標(biāo)志物。特別地,本文所示的基于微陣列的研究和qPCR分析表明,特定差異表達(dá)的基因可用作為與特定預(yù)后相關(guān)的預(yù)后標(biāo)簽。本發(fā)明因此可用來鑒定可能具有侵襲性疾病的患者。本發(fā)明提供確定疾病預(yù)后的標(biāo)志物。利用本發(fā)明的方法,已經(jīng)發(fā)現(xiàn)標(biāo)志物與黑色素瘤預(yù)后相關(guān),且可用來預(yù)測(cè)結(jié)果。采自不同階段黑色素瘤患者的樣品的微陣列分析引起了令人驚訝的發(fā)現(xiàn),即特定模式的標(biāo)志物表達(dá)與癌癥預(yù)后相關(guān)。本發(fā)明因此提供了表1所列的基因集,其在具有良好或不良結(jié)果的黑色素瘤中差異表達(dá)。表1所列的基因提供了一個(gè)黑色素瘤預(yù)后標(biāo)志物(MPM)集合。例如,某些黑色素瘤預(yù)后標(biāo)志物(MPM)的減少可指示特定的預(yù)后。相反地,其他MPM的增加指示特定的預(yù)后。特定的預(yù)后可包括疾病進(jìn)展速度。表達(dá)的減少或增加可例如,通過將測(cè)試樣品(例如患者的腫瘤樣品)與參照樣品(例如與已知預(yù)后相關(guān)的樣品)進(jìn)行比較來確定。特別是來自具有良好預(yù)后的患者的一個(gè)或多個(gè)樣品可用作為參照樣品。例如,為獲得預(yù)后,可將患者樣品(例如腫瘤樣品)的表達(dá)水平與來自具有已知結(jié)果的患者的樣品進(jìn)行比較。如果患者樣品顯示出與具有不良結(jié)果(快速疾病進(jìn)展)的樣品相當(dāng)?shù)囊粋€(gè)或多個(gè)MPM的增加或減少表達(dá),則意味著不良預(yù)后。如果患者樣品顯示出與具10有良好結(jié)果(慢疾病進(jìn)展)的樣品相當(dāng)?shù)囊粋€(gè)或多個(gè)MPM的表達(dá),則意味著積極的預(yù)后或良好預(yù)后。作為另一實(shí)例,可就包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)水平,對(duì)患者樣品(例如腫瘤樣品)與已知具有良好或不良預(yù)后的癌癥樣品進(jìn)行比較。如果患者樣品顯示出與良好預(yù)后樣品相比增加或減少的MPM表達(dá),和/或與不良預(yù)后樣品相當(dāng)?shù)谋磉_(dá),則意味著消極的預(yù)后。如果患者樣品顯示出與良好預(yù)后樣品相當(dāng)?shù)腗PM表達(dá),和/或比不良預(yù)后樣品低或高的表達(dá),則意味著積極的或良好的預(yù)后。作為一種方法,可對(duì)一組標(biāo)志物(例如表1所列的MPM集)應(yīng)用預(yù)測(cè)方法,以生成預(yù)測(cè)模型。這包括生成包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽。表1公開的MPM因此提供了一組有用的標(biāo)志物,其可以用于生成預(yù)測(cè)標(biāo)簽,確定癌癥預(yù)后,和確立特異于該腫瘤的治療方案或治療形式。特別是患者可利用積極的預(yù)后來決定繼續(xù)特定的治療選擇?;颊呖衫孟麡O的預(yù)后來決定終止治療或進(jìn)行高攻擊性或試驗(yàn)性治療。另外,患者可基于自預(yù)后標(biāo)志物(如MPM)的表達(dá)所預(yù)測(cè)的其預(yù)后來選擇治療。可在腫瘤組織、腫瘤鄰近組織、淋巴結(jié)樣品、血樣、血清樣品、尿樣或便樣中利用任何適宜的技術(shù)來檢測(cè)MPM的水平,并且可包括但不限于寡核苷酸探針、定量PCR或抗標(biāo)志物抗體??梢岳斫?,通過以預(yù)測(cè)標(biāo)簽的形式分析多種MPM的存在和表達(dá)量,并構(gòu)建預(yù)后標(biāo)簽,將增加預(yù)后的靈敏性和準(zhǔn)確性。因此,根據(jù)本發(fā)明的多重標(biāo)志物可用來確定癌癥預(yù)后。本發(fā)明包括利用存檔的石蠟包埋活檢材料來分析集中的標(biāo)志物,因此與最廣泛可用的活檢材料類型兼容。本發(fā)明也與若干不同的腫瘤組織收獲方法兼容,例如,核芯針活檢或細(xì)針抽吸。在某些方面,從固定的石蠟包埋患者癌組織樣本中分離RNA。分離可以,例如自核芯針活檢組織或細(xì)針抽吸細(xì)胞,通過本領(lǐng)域已知的任何技術(shù)進(jìn)行。—方面,本發(fā)明涉及預(yù)測(cè)預(yù)后(例如癌癥患者在治療后長(zhǎng)期存活的可能性)的方法,包括測(cè)定獲自患者的樣品中一個(gè)或多個(gè)預(yù)后標(biāo)志物或其表達(dá)產(chǎn)物的表達(dá)水平,相對(duì)于樣品中其他RNA轉(zhuǎn)錄物或其產(chǎn)物的表達(dá)水平、或參照的一組RNA轉(zhuǎn)錄物或其表達(dá)產(chǎn)物的表達(dá)水平進(jìn)行標(biāo)準(zhǔn)化。在特定的方面,預(yù)后標(biāo)志物是表1所列的一個(gè)或多個(gè)標(biāo)志物,或被包括為來自表1所列標(biāo)志物的一個(gè)或多個(gè)預(yù)后標(biāo)簽。在其它方面,確定預(yù)后標(biāo)志物或其表達(dá)產(chǎn)物的表達(dá)水平,例如對(duì)于表1所列的標(biāo)志物以及來自表1所列標(biāo)志物的預(yù)后標(biāo)簽。另一方面,該方法包括確定整個(gè)預(yù)后標(biāo)志物集或其表達(dá)產(chǎn)物的表達(dá)水平,例如對(duì)于表1所列的標(biāo)志物或來自表1所列標(biāo)志物的預(yù)后標(biāo)簽。另一方面,本發(fā)明涉及陣列(例如微陣列),其包括與兩個(gè)或多個(gè)標(biāo)志物雜交的多核苷酸,例如對(duì)于表1所列標(biāo)志物或來自表1所列標(biāo)志物的預(yù)后標(biāo)簽。在特別的方面,該陣列包括與來自表1所列標(biāo)志物的預(yù)后標(biāo)簽雜交的多核苷酸。在另一具體的方面,該陣列包括與整個(gè)標(biāo)志物集(例如對(duì)于表1所列標(biāo)志物)雜交的多核苷酸。對(duì)于這些陣列,多核苷酸可為cDNA或寡核苷酸,且展示之的固體表面可為例如玻璃。多核苷酸可與如本文公開的一個(gè)或多個(gè)標(biāo)志物(例如全長(zhǎng)序列、任何編碼序列、任何片段、或其任何互補(bǔ)物)雜交。在特別的方面,一個(gè)或多個(gè)MPM的表達(dá)水平增加或減少指示長(zhǎng)期存活的可能性減少(例如由于癌癥復(fù)發(fā)),而一個(gè)或多個(gè)MPM的表達(dá)水平?jīng)]有增加或減少則指示無癌癥復(fù)發(fā)的長(zhǎng)期存活的可能性增加。表1:黑色素瘤預(yù)測(cè)標(biāo)志物<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>*此標(biāo)志物以前稱為kiaa0353;dmn(XM_031031)。"此標(biāo)志物以前稱為免疫球蛋白k可變l-5(IGKC;AJ131063)。*"此標(biāo)志物以前稱作似微管蛋白a6;locl43712(XM_084610)。檢測(cè)預(yù)后標(biāo)志物的一般方法如下方法為可用來檢測(cè)增生標(biāo)志物(包括MPM家族成員)的非限制性方法利用對(duì)MPM具有選擇性的寡核苷酸探針的微陣列方法;利用MPM特異性引物和探針對(duì)腫瘤樣品進(jìn)行的實(shí)時(shí)qPCR;利用MPM特異性引物和探針對(duì)淋巴結(jié)、血液、血清、糞便或尿液樣品進(jìn)行的實(shí)時(shí)qPCR;酶聯(lián)免疫試驗(yàn)(ELISA);利用抗標(biāo)志物抗體的免疫組織化學(xué);以及利用計(jì)算機(jī)分析陣列或qPCR數(shù)據(jù)。其#>有用的方f去包f舌northern印跡禾口原^[立雜交(Parker禾口Barnes,MethodsinMolecularBiology106:247-283(1999));RNA酶保護(hù)試驗(yàn)(Hod,BioTechniques13:852-854(1992));反轉(zhuǎn)錄聚合鏈?zhǔn)椒磻?yīng)(RT-PCR;Weis等人,TrendsinGenetics8:263-264(1992));基因表達(dá)的系列分析(SAGE;Velculescu等人,Science270:484-487(1995)和Velculescu等人,Cell88:243-51(1997)),MassARRAY技術(shù)(Sequenom,SanDiego,CA),以及通過大量平行標(biāo)簽測(cè)序進(jìn)行的基因表達(dá)分析(MPSS;Brenner等人,NatureBiotechnology18:630-634(2000))??蛇x的,可采用識(shí)別特定復(fù)合物(包括DNA雙鏈體、RNA雙鏈體、以及DNA-RNA雜合雙鏈體或DNA-多肽雙鏈體)的抗體??墒占紨?shù)據(jù),并例如如下進(jìn)行倍數(shù)變化分析通過比較腫瘤組織和非腫瘤組織中的標(biāo)志物表達(dá)水平;通過將標(biāo)志物表達(dá)水平與在復(fù)發(fā)腫瘤和非復(fù)發(fā)腫瘤中測(cè)定的水平進(jìn)行比較;通過將標(biāo)志物表達(dá)水平與在有或沒有轉(zhuǎn)移的腫瘤中測(cè)定的水平進(jìn)行比較;通過將標(biāo)志物表達(dá)水平與在不同階段腫瘤中測(cè)定的水平進(jìn)行比較;或通過將標(biāo)志物表達(dá)水平與在具有不同增生水平的細(xì)胞中測(cè)定的水平進(jìn)行比較。基于此分析確定消極的或積極的預(yù)后。腫瘤標(biāo)志物表達(dá)的其它分析包括將呈現(xiàn)出增加或減少表達(dá)的那些標(biāo)志物與已知黑色素瘤腫瘤的表達(dá)譜進(jìn)行匹配,以提供預(yù)后。用于得出表達(dá)增加的結(jié)論的閾值將取決于具體的標(biāo)志物以及待應(yīng)用的具體預(yù)測(cè)模型。通常設(shè)置閾值以實(shí)現(xiàn)最高靈敏性和選擇性及最小誤差率,不過對(duì)于具體臨床情況而言可能期望變動(dòng)。期望的閾值可以通過在考慮任何預(yù)測(cè)模型的統(tǒng)計(jì)學(xué)可變性的情況下分析足夠大小的群體來確定,并可以從用來產(chǎn)生預(yù)測(cè)模型的樣品的大小來計(jì)算。這同樣適用于確定用于得出表達(dá)減少的結(jié)論的閾值。能夠明了,為得出發(fā)生了表達(dá)增加或減少的結(jié)論,可13選擇其他的閾值或確立閾值的方法而不偏離本發(fā)明的范圍。還可以的是,預(yù)測(cè)模型可以產(chǎn)生數(shù)值作為其輸出結(jié)果,例如分值、似然值或概率。在這些情況下,可對(duì)預(yù)測(cè)模型所產(chǎn)生的結(jié)果應(yīng)用閾值,并且在這些情況下適用與設(shè)置表達(dá)值的閾值時(shí)相似的原則?!┮呀?jīng)獲得了腫瘤樣品中預(yù)測(cè)標(biāo)簽的表達(dá)水平或預(yù)測(cè)模型輸出結(jié)果,則可確定癌癥復(fù)發(fā)的可能性。從鑒定的標(biāo)志物出發(fā),可以通過將一個(gè)或多個(gè)標(biāo)志物的表達(dá)水平與所公開的預(yù)后標(biāo)簽進(jìn)行比較,利用包含一個(gè)或多個(gè)MPM的預(yù)后標(biāo)簽,確定癌癥的預(yù)后。通過將腫瘤樣品中一個(gè)或多個(gè)標(biāo)志物的表達(dá)與所公開的預(yù)后標(biāo)簽進(jìn)行比較,可確定癌癥復(fù)發(fā)的可能性。可通過應(yīng)用如前面所述的預(yù)測(cè)模型,比較預(yù)后標(biāo)簽的表達(dá)水平,以確立預(yù)后。確定癌癥復(fù)發(fā)的可能性對(duì)于從業(yè)醫(yī)師具有重大價(jià)值。腫瘤對(duì)治療無反應(yīng)的可能性高意味著應(yīng)當(dāng)考慮更長(zhǎng)或更高劑量的治療,或者可以根本不予治療。準(zhǔn)確預(yù)后對(duì)于患者同樣有益。其允許患者、連同其伴侶、家人和朋友,也可以就治療做出決斷,以及就其未來和生活方式變化做出決策。因此,本發(fā)明也提供了基于預(yù)后確立具體癌癥的治療方案的方法,所述預(yù)后通過將腫瘤樣品中標(biāo)志物的表達(dá)與差異表達(dá)標(biāo)簽進(jìn)行匹配而確立。能夠明了,標(biāo)志物的選擇或預(yù)后標(biāo)簽的構(gòu)建并不必局限于本文表1所公開的MPM,而是可包括應(yīng)用來自所公開標(biāo)簽的一個(gè)或多個(gè)MPM,或者可以利用選自所公開標(biāo)志物列表的MPM確立新的標(biāo)簽。對(duì)于任何標(biāo)簽的要求是其以足夠的準(zhǔn)確性預(yù)測(cè)快速疾病進(jìn)展的可能性,以輔助從業(yè)醫(yī)師確立治療方案。反轉(zhuǎn)錄PCR(RT-PCR)在上文所列的技術(shù)中,最靈敏和最靈活的定量方法是RT-PCR,其可用于比較不同樣品群中、正常及腫瘤組織(經(jīng)或未經(jīng)藥物處理的)中的RNA水平,以表征表達(dá)模式,分辨密切相關(guān)的RNA,并分析RNA結(jié)構(gòu)。對(duì)于RT-PCR,第一步是從靶樣品中分離RNA。起始材料通常是分別從人腫瘤或腫瘤細(xì)胞系以及對(duì)應(yīng)的正常組織或細(xì)胞系中分離的總RNA。ORNA可以分離自多種樣品,如來自乳腺、肺、結(jié)腸(如大腸或小腸)、皮膚、結(jié)腸直腸、胃、食道、肛門、直腸、前列腺、腦、肝、腎、胰腺、脾、胸腺、睪丸、卵巢、子宮等組織的腫瘤樣品、原代腫瘤或腫瘤細(xì)胞系,以及來自多名健康供體的混合樣品。如果RNA的來源是腫瘤,則可以例如從冷凍或存檔的石蠟包埋固定的(如福爾馬林固定的)組織樣品中提取RNA。通過RT-PCR制作基因表達(dá)譜的第一步是將RNA模板反轉(zhuǎn)錄為cDNA,接著在PCR反應(yīng)中進(jìn)行指數(shù)擴(kuò)增。兩種最常用的反轉(zhuǎn)錄酶是禽成髓細(xì)胞瘤病毒反轉(zhuǎn)錄酶(AMV-RT)和莫洛尼鼠白血病病毒反轉(zhuǎn)錄酶(匪LV-RT)。反轉(zhuǎn)錄步驟通常利用特異性引物、隨機(jī)六聚體或寡聚dT引物引發(fā),這視情況和制作表達(dá)譜的目的而定。例如,可利用GeneAmpRNAPCR試劑盒(珀金埃爾默公司,PerkinElmer,CA,USA),遵循生產(chǎn)商的說明,對(duì)提取的RNA進(jìn)行反轉(zhuǎn)錄。得到的cDNA隨之可在后續(xù)的PCR反應(yīng)中用作模板。雖然PCR步驟能夠利用多種熱穩(wěn)定的DNA依賴性DNA聚合酶,但通常采用T叫DNA聚合酶,其具有5'-3'核酸酶活性但缺乏3'-5'校正核酸內(nèi)切酶活性。因此,TaqMan(q)PCR通常利用Taq或Tth聚合酶的5'核酸酶活性來水解結(jié)合在靶擴(kuò)增子上的雜交探針,但任何具有等同5'核酸酶活性的酶均可使用??梢岳脙蓚€(gè)寡核苷酸引物產(chǎn)生PCR反應(yīng)典型的擴(kuò)增子。設(shè)計(jì)第三寡核苷酸或探針以檢測(cè)位于所述兩個(gè)PCR引物之間的核苷酸序列。探針是不能被TaqDNA聚合酶延伸的,并用報(bào)告熒光染料和淬滅熒光染料標(biāo)記。當(dāng)兩種染料如其在探針上一樣位置緊靠在一起時(shí),任何激光誘導(dǎo)的報(bào)告染料的發(fā)射將被淬滅染料淬滅。在擴(kuò)增反應(yīng)期間,TaqDNA聚合酶以模板依賴性的方式切割探針。所產(chǎn)生的探針片段在溶液中分離,來自所釋放的報(bào)告染料的信號(hào)不受該第二熒光團(tuán)的淬滅作用的影響。每合成一個(gè)新分子,就釋放一分子報(bào)告染料,從而對(duì)未淬滅的報(bào)告染料的檢測(cè)可以提供數(shù)據(jù)定量闡釋的基礎(chǔ)。TaqManRT-PCR可利用可商購(gòu)的設(shè)備進(jìn)行,例如ABIPRISM7700序列檢測(cè)系統(tǒng)(珀金埃爾默應(yīng)用生物系統(tǒng)公司,Perkin-Elmer-A卯liedBiosystems,福斯特城,加利福尼亞州,美國(guó))或Lightcycler(羅氏分子生物藥劑公司,RocheMolecularBiochemicals,曼海姆,德國(guó))。在優(yōu)選的實(shí)施方案中,在實(shí)時(shí)定量PCR裝置如ABIPRISM7700tam序列檢測(cè)系統(tǒng)中運(yùn)行該5'核酸酶方法。該系統(tǒng)包括熱循環(huán)儀、激光、電荷耦合器件(CCD)、照相機(jī)和計(jì)算機(jī)。該系統(tǒng)在熱循環(huán)儀上以96孔的形式擴(kuò)增樣品。在擴(kuò)增期間,通過光纖光纜實(shí)時(shí)采集所有96個(gè)孔的激光誘導(dǎo)的熒光信號(hào),并在CCD處進(jìn)行檢測(cè)。該系統(tǒng)包括用于運(yùn)行儀器以及用于分析數(shù)據(jù)的軟件。5'核酸酶測(cè)定試驗(yàn)的數(shù)據(jù)最初表達(dá)為Ct或循環(huán)閾值。如上文所討論的那樣,在每一循環(huán)過程中記錄熒光值,其代表達(dá)到擴(kuò)增反應(yīng)中該點(diǎn)所擴(kuò)增的產(chǎn)物量。第一次記錄到具有統(tǒng)計(jì)學(xué)顯著性的熒光信號(hào)的時(shí)間點(diǎn)為循環(huán)閾值。為最小化誤差及樣品間差異的影響,通常利用內(nèi)部標(biāo)準(zhǔn)進(jìn)行RT-PCR。理想的內(nèi)部標(biāo)準(zhǔn)以恒定的水平在不同的組織中表達(dá),并且不受實(shí)驗(yàn)處理的影響。最頻繁用來標(biāo)準(zhǔn)化基因表達(dá)模式的RNA是持家基因甘油醛-3-磷酸-脫氫酶(GAPDH)和肌動(dòng)蛋白的mRNA。實(shí)時(shí)定量PCR(qPCR)RT-PCR技術(shù)較為新近的一種變形是實(shí)時(shí)定量PCR,其通過雙重標(biāo)記的熒光生成探針(即T叫Man探針)測(cè)量PCR產(chǎn)物的積累。實(shí)時(shí)PCR既與定量競(jìng)爭(zhēng)PCR又與定量比較PCR兼容。前者利用各靶序列的內(nèi)部競(jìng)爭(zhēng)物進(jìn)行標(biāo)準(zhǔn)化,而后者利用樣品內(nèi)所含的標(biāo)準(zhǔn)化基因或持家基因進(jìn)行RT-PCR。更多細(xì)節(jié)由例如Held等人,GenomeResearch6:986-994(1996)提供。表達(dá)水平可利用固定的、石蠟包埋的組織作為RNA來源來測(cè)定。根據(jù)本發(fā)明的一個(gè)方面,基于欲擴(kuò)增基因中存在的內(nèi)含子序列,設(shè)計(jì)PCR引物和探針。在此實(shí)施方案中,引物/探針設(shè)計(jì)的第一步是描述出基因內(nèi)部的內(nèi)含子序列。這可通過公眾可獲得的軟件,如由Kent,W.J.,GenomeRes.12(4):656-64(2002)開發(fā)的DNABLAT軟件,或通過BLAST軟件(包括其變形)來進(jìn)行。后續(xù)步驟遵循成熟建立的PCR引物和探針設(shè)計(jì)方法。為了避免非特異性信號(hào),在設(shè)計(jì)引物和探針時(shí)遮蔽內(nèi)含子內(nèi)部的重復(fù)序列是有益的。這可通過應(yīng)用可自BaylorCollegeofMedicine在線獲得的R印eatMasker程序容易地實(shí)現(xiàn),該程序相對(duì)于重復(fù)元件文庫(kù)篩選DNA序列,并返回遮蔽了重復(fù)元件的查詢序列。經(jīng)遮蔽的序列隨之可用來設(shè)計(jì)引物和探針序列,利用任何可商購(gòu)的或其他公眾可獲得的引物/探針設(shè)計(jì)包,例如PrimerExpress(AppliedBiosystems);MGB設(shè)計(jì)測(cè)定(AppliedBiosystems);Primer3(SteveRozen禾口HelenJ.Skaletsky(2000)Primer3ontheWWWforgeneralusersandforbiologistprogrammersin:KrawetzS,MisenerS(編車茸)BioinformaticsMethodsandProtocols:MethodsinMolecularBiology.HumanaPress,Totowa,NJ,365-386頁(yè))。PCR引物設(shè)計(jì)中考慮的最重要的因素包括引物長(zhǎng)度、解鏈溫度(TJ和G/C含量、特異性、互補(bǔ)引物序列和3'端序列。通常,最佳PCR引物長(zhǎng)度一般17-30個(gè)堿基,并含有約20-80%、例如約50-60%的G+C堿基。一般優(yōu)選50_80°C的解鏈溫度,例如約50-7(TC。有關(guān)PCR引物和探針設(shè)計(jì)的更多指南,參見例如Dieffenbach,C.W.等人,GeneralConceptsforPCRPrimerDesignin:PCRPrimer,ALaboratoryManual,ColdSpringHarborLaboratoryPress,NewYork,1995,133-155頁(yè);Innis禾口Gelfand,OptimizationofPCRsin:PCRProtocols,AGuidetoMethodsandApplications,CRCPress,London,1994,5_11頁(yè);禾口Plasterer,T.N.Primerselect:Primerandprobedesign.MethodsMol.Biol.70:520-527(1997),其全部公開內(nèi)容明確并入本文作為參考。微陣列分析差異表達(dá)也可利用微陣列技術(shù)鑒定或驗(yàn)證。因此,可利用微陣列技術(shù)在新鮮或者石蠟包埋的腫瘤組織中測(cè)量MPM的表達(dá)譜。在這種方法中,在微芯片基質(zhì)上印刷或陣列安排目的多核苷酸序列(包括cDNA和寡核苷酸)。陣列序列(即捕獲探針)隨之與來自目的細(xì)胞或組織(即靶標(biāo))的特異性多核苷酸雜交。與RT-PCR方法一樣,RNA的來源通常為從人腫瘤或腫瘤細(xì)胞系以及對(duì)應(yīng)的正常組織或細(xì)胞系中分離的總RNA。因此,RNA可以分離自各種原代腫瘤或腫瘤細(xì)胞系。如果RNA的來源是原代腫瘤,則可以例如從冷凍或存檔的福爾馬林固定石蠟包埋(FFPE)組織樣品以及固定(如福爾馬林固定)組織樣品中提取RNA,這些樣品在日常的臨床實(shí)踐中都是常規(guī)制備和保存的。在微陣列技術(shù)的一個(gè)具體實(shí)施方案中,向基質(zhì)上施加PCR擴(kuò)增的cDNA克隆插入物?;|(zhì)可以包括多達(dá)1、2、5、10、15、20、25、30、35、40、45、50或75種核苷酸序列。在其他方面,基質(zhì)可以包括至少10,000種核苷酸序列。固定在微芯片上的微陣列序列適合于在嚴(yán)緊條件下雜交。作為其他實(shí)施方案,用于微陣列的靶可以長(zhǎng)至少50、100、200、400、500、1000或2000個(gè)堿基;或者50-100、100-200、100-500、100-1000、100-2000或500-5000個(gè)堿基。作為另外的實(shí)施方案,用于微陣列的捕獲探針長(zhǎng)度可為至少10、15、20、25、50、75、80或100個(gè)堿基;或者10-15、10-20、10-25、10-50、10-75、10-80或20-80個(gè)堿基。通過反轉(zhuǎn)錄從目的組織提取的RNA,摻入熒光核苷酸,可以生成熒光標(biāo)記的cDNA探針。施加到芯片上的標(biāo)記cDNA探針與陣列上的各DNA斑點(diǎn)特異性地雜交。嚴(yán)緊洗滌以除去非特異性結(jié)合的探針之后,通過激光共聚焦顯微鏡或通過其他檢測(cè)方法如CCD照相機(jī)掃描芯片。對(duì)各陣列元素的雜交的定量允許評(píng)估對(duì)應(yīng)mRNA的豐度。利用雙色熒光,由兩個(gè)RNA源生成分開標(biāo)記的cDNA探針,其成對(duì)地與陣列雜交。由此,對(duì)應(yīng)于各指定基因的來自兩個(gè)來源的轉(zhuǎn)錄物的相對(duì)豐度可以得以同時(shí)確定。此小型化規(guī)模的雜交提供了對(duì)大量基因表達(dá)模式的便利快速評(píng)價(jià)。此類方法已經(jīng)證明具有檢測(cè)稀有轉(zhuǎn)錄物以及可再現(xiàn)地檢測(cè)至少大約兩倍的表達(dá)水平差異所需的靈敏性,其中所述稀有轉(zhuǎn)錄物僅以每細(xì)胞少數(shù)幾個(gè)拷貝的水平表達(dá)(Schena等人,Proc.Natl.Acad.Sci.USA93(2):106-149(1996))。微陣列分析可以通過可商購(gòu)的設(shè)備遵循生產(chǎn)商的方案進(jìn)行,例如利用AffymetrixGenChip技術(shù)、Ill咖ina微陣列技術(shù)或Incyte微陣列技術(shù)。對(duì)大規(guī)模分析基因表達(dá)的微陣列法的研發(fā),使得可以在各種腫瘤類型中系統(tǒng)地尋找癌癥分類和結(jié)果預(yù)測(cè)的分子標(biāo)志物。RNA分離、純化和擴(kuò)增用于mRNA提取的一般方法在本領(lǐng)域眾所周知,并公開在分子生物學(xué)的標(biāo)準(zhǔn)教禾斗書中,包括Ausubel等人,CurrentProtocolsofMolecularBiology,JohnWileyandSons(1997)。例如,用于石蠟包埋組織RNA提取的方法公開在Ru卯和Locker,LabInvest.56:A67(1987),以及DeSandres等人,BioTechniques18:42044(1995)中。特別是,可以利用來自商業(yè)生產(chǎn)商如Qiagen的純化試劑盒、成套緩沖液和蛋白酶按照生產(chǎn)商的說明進(jìn)行RNA分離。例如,可以利用QiagenRNeasy微型柱自培養(yǎng)細(xì)胞分離總RNA。其他可商購(gòu)的RNA分離試劑盒包括MasterPure完整DNA和RNA純化試劑盒(EPICENTRE公司(D,Madison,WI)和ParaffinBlockRNA分離試劑盒(Ambion有限公司)??梢岳肦NAStat-60(Tel-Test公司)自組織樣品分離總RNA。例如,可以通過氯化銫密度梯度離心分離由腫瘤制備的RNA。利用固定的石蠟包埋組織作為RNA來源進(jìn)行基因表達(dá)譜制作的代表性方案的步驟包括mRNA分離、純化、引物延伸和擴(kuò)增,這在多篇發(fā)表的期刊文章中提供(例如T.E.Godfrey等人J.Molec.Diagnostics2:84-91(2000);K.Specht等你,Am.J.Pathol.158:419-29(2001))。簡(jiǎn)言之,一個(gè)代表性方法始于切割大約10ym厚的石蠟包埋腫瘤組織樣品切片。然后提取RNA,除去蛋白質(zhì)和DNA。分析RNA濃度之后,如果必要的話,可以包括RNA修復(fù)和/或擴(kuò)增步驟,之后利用基因特異性啟動(dòng)子反轉(zhuǎn)錄RNA,接著進(jìn)行RT-PCR。最后,分析數(shù)據(jù),以基于在所研究的腫瘤樣品中鑒定到的特征性基因表達(dá)模式,確定患者可用的最佳治療選擇。免疫組織化學(xué)和蛋白質(zhì)組學(xué)免疫組織化學(xué)法也適用于檢測(cè)本發(fā)明增生標(biāo)志物的表達(dá)水平。因此,可以利用特異于各標(biāo)志物的抗體或抗血清、優(yōu)選多克隆抗血清、最優(yōu)選單克隆抗體來檢測(cè)表達(dá)??梢酝ㄟ^用例如放射性標(biāo)記、熒光標(biāo)記、半抗原標(biāo)記如生物素、或酶如馬辣根過氧化物酶或堿性磷酸酶直接標(biāo)記抗體本身,來檢測(cè)抗體??蛇x地,可以將未標(biāo)記的一抗與標(biāo)記的二抗聯(lián)合使用,所述二抗包括特異于一抗的抗血清、多克隆抗血清或單克隆抗體。免疫組織化學(xué)方案和試劑盒在本領(lǐng)域眾所周知并且可以商購(gòu)。蛋白質(zhì)組學(xué)可用來分析某個(gè)時(shí)間點(diǎn)樣品(如組織、器官或細(xì)胞培養(yǎng)物)中存在的多肽。特別是,蛋白質(zhì)組學(xué)技術(shù)可用來評(píng)估樣品中多肽表達(dá)的全局變化(也稱為表達(dá)蛋白質(zhì)組學(xué))。蛋白質(zhì)組學(xué)分析通常包括(l)通過雙向凝膠電泳(2-DPAGE)分離樣品中的多肽個(gè)體;(2)鑒定從凝膠中回收的多肽個(gè)體,例如通過質(zhì)譜法或N-末端測(cè)序法,和(3)利用生物信息學(xué)分析數(shù)據(jù)。蛋白質(zhì)組學(xué)方法對(duì)于其他基因表達(dá)譜研究方法是有價(jià)值的補(bǔ)充,并且可以單獨(dú)或與其他方法組合使用,以檢測(cè)本發(fā)明增生標(biāo)志物的產(chǎn)物?!┮呀?jīng)評(píng)估了腫瘤樣品中一個(gè)或多個(gè)預(yù)后標(biāo)志物的表達(dá)水平,則可確定癌癥對(duì)治療有反應(yīng)的可能性。發(fā)明人已經(jīng)在患者數(shù)據(jù)集中鑒定到了許多與對(duì)治療無反應(yīng)(不良預(yù)后)的黑色素瘤相比,在對(duì)治療有反應(yīng)(良好預(yù)后)的黑色素瘤中差異表達(dá)的標(biāo)志物。所述標(biāo)志物示于表l及下文的實(shí)施例中。選擇差異表達(dá)的基因選擇可以被視為顯著的基因的一種早期方法包括簡(jiǎn)單地查看給定基因在兩個(gè)目的群之間的"倍數(shù)變化"。雖然這種方法鎖定似乎變化最為驚人的基因,但是考慮到基礎(chǔ)統(tǒng)計(jì)學(xué),令人們意識(shí)到如果差異(或噪聲水平)相當(dāng)高的話(正如在微陣列實(shí)驗(yàn)中所常見的那樣),那么看似巨大的倍數(shù)變化可能僅僅因?yàn)榕既欢l繁發(fā)生。微陣列實(shí)驗(yàn),例如本文所述的那些,一般包括同時(shí)測(cè)量數(shù)以千計(jì)的基因。如果人們比較兩組(例如良好預(yù)后和不良預(yù)后腫瘤)之間特定基因的表達(dá)水平,那么典型的顯著性檢驗(yàn)(例如t-檢驗(yàn))并不足夠。這是因?yàn)?,在具有?shù)以千計(jì)實(shí)驗(yàn)的系綜(ensemble)中(在此上下文中,每個(gè)基因構(gòu)成一個(gè)"實(shí)驗(yàn)"),至少一個(gè)實(shí)驗(yàn)僅因偶然而通過顯著性慣用標(biāo)準(zhǔn)的概率基本為l。在顯著性檢驗(yàn)中,人們一般計(jì)算"無效假設(shè)"正確的概率。在兩組比較的情況下,無效假設(shè)是兩組之間沒有差異。如果統(tǒng)計(jì)學(xué)檢驗(yàn)得出該無效假設(shè)的概率低于某一閾值(通常是0.05或0.01),則表述為我們可以拒絕該無效假設(shè),而接受兩組顯著不同的假設(shè)。顯然,在這樣的檢驗(yàn)中,可以預(yù)期20次中有1次(或者100次中有1次)無效假設(shè)會(huì)僅因偶然而被拒絕。應(yīng)用t-檢驗(yàn)或其他類似的顯著性統(tǒng)計(jì)學(xué)檢驗(yàn)在微陣列的情況下是不成功的,產(chǎn)生太多太多的假陽(yáng)性(或I型錯(cuò)誤)。在同一時(shí)間檢驗(yàn)多個(gè)假設(shè)的這類情形下,人們應(yīng)用典型的多重比較方法,例如Bonferroni法12。然而,此類檢驗(yàn)對(duì)于大多數(shù)微陣列實(shí)驗(yàn)而言太過保守,產(chǎn)生太多的假陰性(II型)錯(cuò)誤。較為近來的一種方法是不嘗試應(yīng)用給定檢驗(yàn)顯著性概率,而是建立選擇實(shí)驗(yàn)子集的手段,從而控制預(yù)期的I型錯(cuò)誤比例(或誤診率(falsediscoveryrate)13)。正是這種方法已在本研究中應(yīng)用,借助于多種執(zhí)行工具,即BRB陣列工具14和Bioconductor的limma15'16包(其應(yīng)用R統(tǒng)計(jì)環(huán)境17'18)所提供的方法。數(shù)據(jù)挖掘的一般方法學(xué)生成預(yù)后標(biāo)簽數(shù)據(jù)挖掘是用來描述從(通常是)大量數(shù)據(jù)(數(shù)據(jù)集)中提取"消息",換言之"技術(shù)訣竅",或者預(yù)測(cè)能力的術(shù)語(yǔ)。這是本研究中用來生成預(yù)后標(biāo)簽的方法。在本研究的情況下,"技術(shù)訣竅"是從給定的一組(一個(gè)集合)基因表達(dá)測(cè)量結(jié)果或者"標(biāo)簽"中準(zhǔn)確預(yù)測(cè)預(yù)后的能力(在本節(jié)將作一般描述,在實(shí)施例一節(jié)中作更詳細(xì)描述)。本研究所用方法的具體應(yīng)用細(xì)節(jié)在實(shí)施例17-20中描述。不過,任何數(shù)據(jù)挖掘方法(既包括實(shí)施例中所述的那些,也包括此處所述的那些)的應(yīng)用均可遵循此通用方案。數(shù)據(jù)挖掘19以及相關(guān)話題機(jī)器學(xué)習(xí)2°是一個(gè)復(fù)雜的重復(fù)性數(shù)學(xué)任務(wù),其涉及應(yīng)用一種或多種適宜的計(jì)算機(jī)軟件包(見下文)。軟件的應(yīng)用在一方面是有利的,原因是人們無需為了成功應(yīng)用數(shù)據(jù)挖掘技術(shù)而徹底通曉每種技術(shù)背后錯(cuò)綜復(fù)雜的理論,而只要堅(jiān)持正確的方法學(xué)即可。缺點(diǎn)是數(shù)據(jù)挖掘的應(yīng)用往往可被視為"黑匣子"人們代入數(shù)據(jù)而接收答案。這是如何實(shí)現(xiàn)的往往不為終端用戶所知(對(duì)于所述技術(shù)中的許多而言確是如此,并且往往可影響選擇用于數(shù)據(jù)挖掘的統(tǒng)計(jì)學(xué)方法)。例如,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)具有特別復(fù)雜的執(zhí)行工具,使得終端用戶極難提取出用來產(chǎn)生決策的"規(guī)則"。而另一方面,k-近鄰方法和線性判別分析具有不隱瞞用戶的非常透明的決策過程。有兩類方法用于數(shù)據(jù)挖掘有監(jiān)督的和無監(jiān)督的方法。在有監(jiān)督的方法中,與數(shù)據(jù)關(guān)聯(lián)的信息是已知的,例如分類數(shù)據(jù)(例如,良好對(duì)不良預(yù)后)。所需的是將觀察到的反應(yīng)(例如,良好與不良預(yù)后)與輸入變量關(guān)聯(lián)起來的能力。在無監(jiān)督的方法中,事先并不知曉數(shù)據(jù)集內(nèi)的分類,數(shù)據(jù)挖掘方法學(xué)被用于嘗試尋找數(shù)據(jù)集內(nèi)的分類或結(jié)構(gòu)。在本實(shí)施例中使用的是有監(jiān)督的方法,并在本文詳細(xì)討論,不過應(yīng)當(dāng)明了可使用任何其他技術(shù)。整體方案包括如下步驟,數(shù)據(jù)呈現(xiàn)。這包括將數(shù)據(jù)轉(zhuǎn)化為用所選的數(shù)據(jù)挖掘技術(shù)最可能成功工作的形式。在數(shù)據(jù)為數(shù)值,如在本研究中所研究的數(shù)據(jù)為相對(duì)基因表達(dá)水平的情況下,這還算簡(jiǎn)單。如果數(shù)據(jù)覆蓋大的動(dòng)態(tài)范圍(即,許多個(gè)數(shù)量級(jí)),通常取數(shù)據(jù)的對(duì)數(shù)(log)。如果數(shù)據(jù)覆蓋許多由不同研究人員在不同日子對(duì)不同樣品的測(cè)量結(jié)果,必須特別小心以確保系統(tǒng)誤差最小化。最小化系統(tǒng)誤差(即,因方案差異、機(jī)器差異、操作人員差異以及其他可量化因素所致的誤差)是此處稱為"標(biāo)準(zhǔn)化"的過程。特征選擇。一般,數(shù)據(jù)集含有比對(duì)于日常測(cè)量而言實(shí)用的數(shù)據(jù)元素多得多的數(shù)據(jù)元素,此外還含有許多不提供產(chǎn)生預(yù)測(cè)模型所需的信息的元素。預(yù)測(cè)模型描述數(shù)據(jù)集的實(shí)際能力源于全維度的該數(shù)據(jù)集的某子集。這些維度是數(shù)據(jù)集最為重要的成分(或特征)。注意在微陣列數(shù)據(jù)的情況下,數(shù)據(jù)集的維度是基因個(gè)體。特征選擇在此處的上下文中包括尋找最為"差異表達(dá)"的那些基因。在更一般的意義上,這涉及通過某個(gè)顯著性統(tǒng)計(jì)學(xué)檢驗(yàn)的那些群組,即,在所研究的一個(gè)或其他群組中一貫地較高或較低的特定變量的水平。有時(shí)特征是呈現(xiàn)出最大變異的那些變量(或維度)。特征選擇的應(yīng)用完全獨(dú)立于用來創(chuàng)建預(yù)測(cè)模型的方法,并且為了實(shí)現(xiàn)期望的結(jié)果涉及大量的實(shí)驗(yàn)。在本發(fā)明中,顯著性基因的選擇需要特征選擇。另外,可對(duì)數(shù)據(jù)集應(yīng)用數(shù)據(jù)約簡(jiǎn)方法(例如主成分分析)。訓(xùn)練。一旦數(shù)據(jù)集的分類(例如,良好/不良預(yù)后)和特征已經(jīng)確立,且數(shù)據(jù)呈現(xiàn)為數(shù)據(jù)挖掘輸入可接受的形式,則對(duì)所選的預(yù)測(cè)模型應(yīng)用簡(jiǎn)約后的數(shù)據(jù)集(如通過特征描述的)。此模型的輸入通常是多維度數(shù)值輸入的形式(稱為向量),伴有相關(guān)的輸出信息(分類標(biāo)記或反應(yīng))。在訓(xùn)練過程中,將選擇的數(shù)據(jù)相繼地(在諸如神經(jīng)網(wǎng)絡(luò)的技術(shù)中)或整體地(在應(yīng)用某些形式的回歸的技術(shù)中,例如線性模型、線性判別分析、支持向量機(jī))輸入預(yù)測(cè)模型。在一些情況(例如,k-近鄰方法)下,數(shù)據(jù)集(或在特征選擇之后獲得的數(shù)據(jù)集的子集)本身即為模型。正如所討論的那樣,通過應(yīng)用模型參數(shù)已由內(nèi)行分析專家預(yù)設(shè)為最有可能得出成功結(jié)果的多種軟件包,可以在對(duì)數(shù)學(xué)細(xì)節(jié)有最小限度理解的情況下確立有效的模型。*驗(yàn)證。這是數(shù)據(jù)挖掘方案的關(guān)鍵部分,對(duì)其的不正確應(yīng)用常常導(dǎo)致錯(cuò)誤。除了特征選擇和訓(xùn)練之外,應(yīng)當(dāng)留出部分的數(shù)據(jù)集來檢驗(yàn)預(yù)測(cè)模型的成功。此外,如果驗(yàn)證的結(jié)果用來實(shí)現(xiàn)特征選擇和模型訓(xùn)練,那么在模型應(yīng)用于現(xiàn)實(shí)情形之前,獲取再一驗(yàn)證集來檢驗(yàn)?zāi)P汀H绻粐?yán)格遵循此過程,那么模型很可能失于現(xiàn)實(shí)情形。驗(yàn)證的方法在下文更詳細(xì)地說明。應(yīng)用。一旦模型已經(jīng)構(gòu)建并驗(yàn)證,其必須以終端用戶可及的某種方式進(jìn)行包裝。這往往包括對(duì)電子表格應(yīng)用程序(其中已嵌入模型)的某種形式執(zhí)行,提供統(tǒng)計(jì)學(xué)軟件包的腳本,或由信息技術(shù)工作人員將模型重構(gòu)(refactoring)成硬編碼應(yīng)用程序。常使用的軟件包的實(shí)例有-電子表格插件,由多家賣主獲得。-R統(tǒng)計(jì)環(huán)境。-商業(yè)包MatLab、S-plus、SAS、SPSS、STATA。_自由開源軟件,如Octave(MatLabclone)。-許多各種各樣的0++庫(kù),其可用來在商業(yè)閉源設(shè)置中執(zhí)行預(yù)測(cè)模型。數(shù)據(jù)挖掘方法的實(shí)例可通過首先采取數(shù)據(jù)挖掘步驟(上文),然后應(yīng)用適當(dāng)?shù)囊阎浖瑏韺?shí)施本發(fā)明的方法。有關(guān)數(shù)據(jù)挖掘方法的更多說明在許多極其充分著述的教科書19中有描述。線性模型19'21:數(shù)據(jù)作為線性回歸模型的輸入進(jìn)行處理,其中分類標(biāo)記或反應(yīng)變量為輸出。分類標(biāo)記或其他分類數(shù)據(jù)必須轉(zhuǎn)化為數(shù)值(通常為整數(shù))。在廣義線性模型中,分類標(biāo)記或反應(yīng)變量本身并不與輸入數(shù)據(jù)線性相關(guān),而是通過應(yīng)用"關(guān)聯(lián)函數(shù)"被轉(zhuǎn)化。邏輯回歸是最常見形式的廣義線性模型。線性判別分析19'22'23。如果數(shù)據(jù)是線性可分的(即,數(shù)據(jù)的群組或類可由超平面,即,閾值的n維延伸,分開),就可應(yīng)用此技術(shù)。利用變量組合來分開類別,使組間方差最大化和組內(nèi)方差最小化。其副產(chǎn)品是分類規(guī)則的形成。對(duì)未知類別的樣品應(yīng)用此規(guī)則允許對(duì)該樣品進(jìn)行有關(guān)類別成員的預(yù)測(cè)或分類。存在線性判別分析的變形,例如nearestsh進(jìn)kencentroids,其常用于微陣列分析。支持向量機(jī)24:變量集合與權(quán)重集合聯(lián)合使用,以確定使類間的分離就其加權(quán)變量而言最大化的模型。然后對(duì)樣品應(yīng)用此模型,產(chǎn)生對(duì)該樣品的分類或類別成員預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)23:數(shù)據(jù)輸入節(jié)點(diǎn)網(wǎng)絡(luò)進(jìn)行處理,這些節(jié)點(diǎn)表面上類似于生物神經(jīng)元,運(yùn)用來自與其相連的所有節(jié)點(diǎn)的輸入,并將輸入轉(zhuǎn)化為輸出。通常,神經(jīng)網(wǎng)絡(luò)利用"乘積和加和"算法,將來自多個(gè)連接的輸入節(jié)點(diǎn)的輸入轉(zhuǎn)化為單一輸出。節(jié)點(diǎn)可以不必產(chǎn)生輸出,除非該節(jié)點(diǎn)的輸入超過了一定的閾值。每個(gè)節(jié)點(diǎn)具有來自若干其他節(jié)點(diǎn)的輸出作為其輸入,其中最終輸出節(jié)點(diǎn)通常與分類變量相連。節(jié)點(diǎn)的數(shù)量以及節(jié)點(diǎn)的拓?fù)鋵W(xué)能夠以幾乎無窮的方式變化,從而能夠?qū)σ云渌绞娇赡懿豢赡苡枰苑诸惖臉O端噪聲數(shù)據(jù)進(jìn)行分類。神經(jīng)網(wǎng)絡(luò)最常見的執(zhí)行工具是多層感知器。分類回歸樹25:在這些方法中,利用變量定義一個(gè)能夠被逐步遵循以確定樣品分類的規(guī)則層次。典型的方法創(chuàng)建一個(gè)規(guī)則集合,其導(dǎo)致特定的分類輸出,或者是有關(guān)不能分辨的特定陳述。分類樹的一個(gè)實(shí)例是執(zhí)行諸如下面的算法若基因A〉x且基因Y〉x且基因Z=z貝UA類否則,若基因A二q則B類近鄰方法22'23。通過將(未知分類的)樣品與其附近的那些(已知分類的)樣品比較來進(jìn)行預(yù)測(cè)或分類,其中緊密度由距離函數(shù)定義。可以定義許多不同的距離函數(shù)。常用的距離函數(shù)有歐氏距離(將在三角測(cè)量中那樣的畢達(dá)哥拉斯距離延伸至n維)、多種形式的相關(guān)性(包括皮爾遜相關(guān)系數(shù))。此外,還有如下轉(zhuǎn)化函數(shù),該轉(zhuǎn)化函數(shù)可以將正常不通過有意義的距離量度互連的數(shù)據(jù)點(diǎn)轉(zhuǎn)換為歐氏空間,以致隨后可以應(yīng)用歐氏距離(例如,馬氏距離)。雖然距離量度可相當(dāng)復(fù)雜,但是k-近鄰法的基本前提相當(dāng)簡(jiǎn)單,基本上是"尋找與未知輸入最類似的k-數(shù)據(jù)向量,找出它們所對(duì)應(yīng)的類別,并表決該未知輸入是哪個(gè)類別"的重述。其他方法-貝葉斯網(wǎng)絡(luò)。利用有向無環(huán)圖表示一組變量以及它們的聯(lián)合概率分布,其隨之可以用來確定樣品的類別成員的概率。-獨(dú)立成分分析,其中自變量集合中將獨(dú)立信號(hào)(例如,類別成員)分離出來(為成分)。這些成分可隨之用來進(jìn)行樣品的分類或類別成員預(yù)測(cè)。-集成學(xué)習(xí)方法,其中組合一系列預(yù)測(cè)方法以對(duì)樣品進(jìn)行聯(lián)合分類或類別成員預(yù)存在可以探索的這些方法學(xué)的許多變形方式19,且許多新的方法正不斷地被定義和研發(fā)出來。應(yīng)當(dāng)明了為獲得可接受的結(jié)果,可應(yīng)用這些方法中的任一方法。必須特別小心,確保所有結(jié)果經(jīng)全面的驗(yàn)證方案檢驗(yàn),以避免過擬合。驗(yàn)證所述任何預(yù)測(cè)方法的應(yīng)用都涉及訓(xùn)練和交叉驗(yàn)證12'26,之后該方法才可應(yīng)用于新的數(shù)據(jù)集(例如來自臨床試驗(yàn)的數(shù)據(jù))。訓(xùn)練包括取目的數(shù)據(jù)集(在本案中為來自黑色素瘤的基因表達(dá)測(cè)量結(jié)果)的子集,以便將其按照正在檢驗(yàn)的類別(在本案中為具有快速發(fā)展的良好或不良可能性的腫瘤)分層。利用此訓(xùn)練集生成(上文定義的)預(yù)測(cè)模型,在剩余的數(shù)據(jù)(測(cè)試集)上檢驗(yàn)之。可以改變預(yù)測(cè)模型的參數(shù)以便在測(cè)試集中獲得更佳的表現(xiàn),然而,這可能導(dǎo)致稱為過擬合的情形,在這種情形下預(yù)測(cè)模型對(duì)訓(xùn)練數(shù)據(jù)集有效,但是對(duì)任何外部數(shù)據(jù)集無效。為避免之,接著實(shí)施驗(yàn)證過程。有兩大典型應(yīng)用的驗(yàn)證類型,第一類(保留(hold-out)驗(yàn)證法)涉及將數(shù)據(jù)集分為三組測(cè)試集、訓(xùn)練集和驗(yàn)證集。無論如何驗(yàn)證集對(duì)訓(xùn)練過程沒有輸入,因此任何參數(shù)調(diào)整或其他精化必須在應(yīng)用于測(cè)試集(而非驗(yàn)證集)時(shí)進(jìn)行。第二大類是交叉驗(yàn)證法,其可以以數(shù)種不同的方式應(yīng)用,如下文所述。有兩種主要的交叉驗(yàn)證亞類型K-折交叉驗(yàn)證和留一法交叉驗(yàn)證。K-折交叉驗(yàn)證將數(shù)據(jù)集分成K個(gè)子樣本,每個(gè)子樣本含有與最初大致相同比例的類別群組。在每一輪驗(yàn)證中,留出K個(gè)子樣本中的一個(gè),并利用剩余的數(shù)據(jù)集實(shí)施訓(xùn)練。該輪訓(xùn)練的有效性通過留出組的分類正確程度來測(cè)量。此過程重復(fù)K次,并通過比較預(yù)測(cè)分類與已知分類來確定總體有效性。留一法交叉驗(yàn)證K-折交叉驗(yàn)證的一種常用變形,其中K=n,其中n為樣本數(shù)。MPM(例如上文表1所述的那些)的組合可用來構(gòu)建預(yù)后的預(yù)測(cè)模型。預(yù)后標(biāo)簽可以通過應(yīng)用源自預(yù)后標(biāo)簽(包含這些標(biāo)志物中的一個(gè)或多個(gè))的一個(gè)或多個(gè)預(yù)測(cè)模型,使用該預(yù)后標(biāo)簽確定患者的結(jié)果。特別地,臨床醫(yī)師或研究人員可以確定標(biāo)簽中一個(gè)或多個(gè)標(biāo)志物的差異表達(dá)(例如,增加或減少的表達(dá)),應(yīng)用預(yù)測(cè)模型,由此預(yù)測(cè)患者的消極預(yù)后(例如疾病復(fù)發(fā)的可能性),或者積極預(yù)后的可能性(繼續(xù)好轉(zhuǎn))。已經(jīng)開發(fā)了預(yù)后標(biāo)簽。如下文實(shí)施例所述,已由一組黑色素瘤患者確立了包含22個(gè)基因的預(yù)后標(biāo)簽(表l)。通過獲得患者樣品(例如腫瘤樣品),并將樣品中一個(gè)或多個(gè)標(biāo)志物的表達(dá)水平與差異表達(dá)譜進(jìn)行匹配,能夠確定癌癥快速進(jìn)展的可能性。藥物試驗(yàn)本發(fā)明也可用于選擇個(gè)體進(jìn)行特定的藥物試驗(yàn)。通過確立黑色素瘤個(gè)體的預(yù)后,能夠更好地決策是否患者應(yīng)當(dāng)進(jìn)行他們很可能對(duì)之產(chǎn)生反應(yīng)的常規(guī)治療、或者他們是否應(yīng)當(dāng)參與瞄準(zhǔn)特定腫瘤類型或階段的特定藥物試驗(yàn)。選擇對(duì)于疾病進(jìn)展具有短的預(yù)測(cè)時(shí)間的患者,還將能夠縮短藥物試驗(yàn)的持續(xù)時(shí)間,并允許招募更少的患者以獲得具有統(tǒng)計(jì)學(xué)意義的藥物反應(yīng)數(shù)據(jù)。實(shí)施例本文所述的實(shí)施例為舉例說明本發(fā)明實(shí)施方案的目的。其他實(shí)施方案、方法和分析類型在分子診斷領(lǐng)域普通技術(shù)人員的能力范圍內(nèi),故無需在此詳細(xì)說明。落在本領(lǐng)域范圍內(nèi)的其他實(shí)施方案視為本發(fā)明的一部分。為研究腫瘤中可能影響III期黑色素瘤臨床結(jié)果的生物學(xué)機(jī)制,在初始測(cè)試的一組29份黑色素瘤樣本上進(jìn)行了基因表達(dá)譜分析,所述樣本來自在IIIB和IIIC期黑色素瘤的淋巴結(jié)清掃術(shù)之后具有不同臨床結(jié)果的患者。然后利用此信息在包括10名和14名患者的兩個(gè)獨(dú)立驗(yàn)證集中基于分子譜前瞻性地預(yù)測(cè)臨床結(jié)果。利用此分子信息,還鑒定了在這兩個(gè)患者群中可被差異調(diào)控并是治療性干預(yù)的可能靶標(biāo)的細(xì)胞通路和網(wǎng)絡(luò)。材料和方法用于微陣列分析的樣本收集和選擇所進(jìn)行的實(shí)驗(yàn)的總體方案示于圖3。選擇來自29名在1997-2004年間在奧斯汀醫(yī)院(AustinHealth)經(jīng)歷了針對(duì)臨床可觸摸淋巴結(jié)的手術(shù)淋巴結(jié)清掃術(shù)的患者的離體黑色素瘤組織進(jìn)行微陣列分析。所有樣本依據(jù)奧斯汀醫(yī)院人類研究倫理委員會(huì)(AustinHealthHumanResearchEthicsCommittee)許可的組織獲取方案收集,并附有每名患者的知情同意書。將快速冷凍樣本包埋在最佳切片溫度化合物(OCT)中,并作為組織塊于-8(TC貯存在路德維格/奧斯汀組織庫(kù)貯藏中心(Ludwig/Austintissuebankr印ository)。對(duì)于所有病例,由病理學(xué)家確認(rèn)診斷?;趶腎II期到IV期疾病所需的腫瘤進(jìn)展時(shí)間(TTP),選擇患者樣品用于微陣列分析,包括16名"不良"(平均TTP4個(gè)月)和13名"良好"(平均TTP42個(gè)月)預(yù)后患者。在淋巴結(jié)清掃術(shù)后的最初12個(gè)月內(nèi)每月在專門黑色素瘤單位中進(jìn)行術(shù)后復(fù)查,之后根據(jù)臨床需要進(jìn)行每3個(gè)月和每6個(gè)月的復(fù)查持續(xù)4年,之后是每年復(fù)查。根據(jù)臨床懷疑或常規(guī)地每3-6個(gè)月進(jìn)行分期研究。如果組織存在最小程度的壞死,且腫瘤細(xì)胞占總細(xì)胞群的至少60%,則認(rèn)為該組織是此研究可接受的。在提取RNA時(shí),切兩個(gè)5iim的切片,并以蘇木精和曙紅染色,以確保所提取組織的完整性。RNA提取和cDNA合成針對(duì)29名選擇的患者一式兩份地進(jìn)行具有通常標(biāo)準(zhǔn)設(shè)計(jì)的cDNA合成和雜交。通過將切片浸沒在Tri-reagent(MolecularResearchCenter,Cincinnati,0H)中并勻槳化,從OCT包埋組織中提取總RNA。向勻漿物中加入1.5mL氯仿,離心樣品,取上相并與100%的乙醇混合。利用RNeasy柱根據(jù)制造商的說明(Qiagen,Valencia,CA)進(jìn)行純化。RNA的質(zhì)量基于260:280吸光值之比予以確認(rèn),而完整性在甲醛瓊脂糖凝膠上相對(duì)于rRNA標(biāo)準(zhǔn)Marker予以檢查。在寡聚(dT)和氨基烯丙基脫氧核苷酸的存在下由20ygRNA合成cDNA。22Cy染料(AmershamBiosciences,Buckinghamshire,UK)與月中瘤cDNA偶聯(lián),并平行產(chǎn)生參照cDNA。參照cDNA由來自多種腫瘤和細(xì)胞系(包括黑色素瘤)以及來自正常組織的合并RNA合成(參見圖4)。寡核苷酸陣列和數(shù)據(jù)分析由麗GBiotech(Erbesberg,德國(guó))獲得代表基因個(gè)體和內(nèi)部對(duì)照的30,888個(gè)寡核苷酸探針,并利用Omnigrid機(jī)器人(GeneMachines,SanCarlos,CA)點(diǎn)制為高密度陣列。標(biāo)記的腫瘤/參照cDNA共雜交,并利用Gen印ix4000A微陣列掃描儀(AxonInstruments,UnionCity,CA)掃描。將矩陣重疊圖(matrixoverlay)與掃描圖像進(jìn)行對(duì)準(zhǔn)(align),利用GenePixv6.0軟件(AxonInstruments,FosterCity,CA)進(jìn)行特征提取。原始數(shù)據(jù)利用GeneSpringv7.2(SiliconGenetics,RedwoodCity,CA)分析。針對(duì)點(diǎn)樣組進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,然后進(jìn)行中位數(shù)標(biāo)準(zhǔn)化。簡(jiǎn)言之,使lowess曲線與log-強(qiáng)度對(duì)log-比值圖進(jìn)行擬合。利用20X的數(shù)據(jù)計(jì)算各點(diǎn)的lowess擬合。利用此曲線調(diào)整用于各測(cè)量結(jié)果的對(duì)照值。然后各基因除以所有樣品中其測(cè)量結(jié)果的中位數(shù)。來自E0RTC黑色素瘤研究27的用于獨(dú)立驗(yàn)證集B的數(shù)據(jù)可通過ArrayE鄧ress公其數(shù)據(jù)庫(kù)http:〃www.ebi.ac.uk/arrayexpress/獲得。將數(shù)據(jù)上傳至Genespringv7.2,并進(jìn)行每點(diǎn)、每芯片和每基因標(biāo)準(zhǔn)化。簡(jiǎn)言之,各基因的測(cè)量強(qiáng)度除以各樣品中的其對(duì)照通道值,然后除以該樣品中所有測(cè)量結(jié)果的50%。最后各基因除以所有樣品中其測(cè)量結(jié)果的中位數(shù)。如下文所述利用差異表達(dá)基因的表達(dá)值計(jì)算預(yù)測(cè)分值。統(tǒng)計(jì)學(xué)方法基因表達(dá)數(shù)據(jù)首先進(jìn)行過濾器處理,排除不在所有樣品中存在的探針。在所考慮的初始30,888個(gè)探針中,18,807個(gè)通過了此過濾器,并用于方差分析、層次聚類(hierarchicalclustering)分析禾口主成分分析。通過進(jìn)行Wilcoxon_Mann-Whitney檢驗(yàn)發(fā)現(xiàn)了差異表達(dá)的基因,其中對(duì)于多重檢驗(yàn)校正,基于0.05的p值截?cái)嘀?,利用Benjamini和Hochberg28的誤診率控制方法進(jìn)行修正。利用斯皮爾曼相關(guān)(Spearmancorrelation)作為距離函數(shù)和平均聯(lián)接(averagelinkage),進(jìn)行樣品的層次聚類分析。定量實(shí)時(shí)PCR(qPCR)對(duì)差異表達(dá)的基因進(jìn)行qPCR以確認(rèn)陣列結(jié)果,然后使用驗(yàn)證集A驗(yàn)證預(yù)測(cè)器。利用隨機(jī)hexamer引物(Promega,Madison,WI)由提取用于陣列試驗(yàn)的總RNA的2iig合成第一鏈cDNA。通過省略反轉(zhuǎn)錄酶獲得陰性對(duì)照。利用通用探針文庫(kù)測(cè)定試驗(yàn)設(shè)計(jì)中心https://www,roche—applied—science.com/(Roche,Ma皿heim,Germany),設(shè)計(jì)跨內(nèi)含子的多重測(cè)定試驗(yàn)用于qPCR(有關(guān)測(cè)定試驗(yàn)的設(shè)計(jì)參見圖5)。所有反應(yīng)利用ABI7700序列檢測(cè)儀(AppliedBiosystems,F(xiàn)osterCity,CA)—式兩份進(jìn)行。熱循環(huán)儀條件如下50°C2分鐘,95t:10分鐘,接著是94°C20秒和60°C45秒進(jìn)行40個(gè)循環(huán)。所有結(jié)果相對(duì)于18S擴(kuò)增(A卯liedBiosystems,FosterCity,CA)進(jìn)行標(biāo)準(zhǔn)化。我們利用參照物的靶閾值(CT)作為我們的比較器29,計(jì)算了相對(duì)表達(dá)。然后將基因個(gè)體的相對(duì)表達(dá)值沿標(biāo)準(zhǔn)化的log2比值陣列值作圖,并計(jì)算了相關(guān)系數(shù)。結(jié)果列出了納入該測(cè)試集(testset)和驗(yàn)證集A的患者的臨床和病理特征(見圖6)。所有患者均具有有關(guān)初診年齡、性別、以及陽(yáng)性淋巴結(jié)轉(zhuǎn)移的數(shù)量和位置的信息。并非所有患者的初診都是在我們的醫(yī)院做出的,因此在一些病例中,我們不能確定在原發(fā)性黑色素瘤中是否存在潰瘍。原發(fā)部位的潰瘍?yōu)橐粋€(gè)獨(dú)立的預(yù)后因素,其如果存在的話,則疾病的分期由IIIB升至IIIC3°。"良好"預(yù)后群的平均TTP為40個(gè)月,相比之下,"不良"群為4個(gè)月。雖然"良好"群看起來更年輕且含有更多的女性,但兩群之間在中位數(shù)年齡和性別方面沒有統(tǒng)計(jì)學(xué)顯著差異。雖然樣本大小有限,但其他已知的預(yù)后特征(包括AJCC分期、輔助干擾素的應(yīng)用以及腫瘤浸潤(rùn)淋巴細(xì)胞的存在)方面沒有統(tǒng)計(jì)學(xué)顯著差異?!颊咴加芯窒抻谇谐钠⑴K的孤立性IV期疾病,但是考慮到他保持了無病狀態(tài),還是納入了此樣品。排除此樣品并不改變基因表達(dá)譜。差異表達(dá)的基因?qū)蓚€(gè)預(yù)后群分離開無監(jiān)督的層次聚類沒有揭示出與預(yù)后相關(guān)的黑色素瘤亞群,也沒有揭示出與其他臨床信息相關(guān)的黑色素瘤亞群,考慮到樣品間的相似性,這是在預(yù)料之中的。為搜索能夠有效分離預(yù)后群的基因,研究了差異基因表達(dá)。兩群之間有2,140個(gè)基因差異表達(dá),然而嚴(yán)格應(yīng)用多重檢驗(yàn)校正將其減少至22個(gè)具有高度顯著差異表達(dá)的基因(圖1)。這22個(gè)基因進(jìn)一步在訓(xùn)練集中利用qPCR進(jìn)行驗(yàn)證,并選擇在這兩個(gè)平臺(tái)之間具有最高相關(guān)系數(shù)的基因(r>0.5,p<0.05)進(jìn)行進(jìn)一步分析(數(shù)據(jù)未顯示)。在初始的22個(gè)基因中,有15個(gè)基因呈現(xiàn)出高交叉平臺(tái)相關(guān)性,故這些基因用來開發(fā)預(yù)測(cè)分值。主成分分析證明了這15個(gè)基因分離預(yù)后群的能力(圖7)。預(yù)測(cè)分值的開發(fā)利用該初始的測(cè)試集開發(fā)預(yù)測(cè)器,在兩個(gè)獨(dú)立的驗(yàn)證集上檢驗(yàn)之?;陉嚵袛?shù)據(jù)、然后是qPCR數(shù)據(jù),開發(fā)了兩種預(yù)測(cè)算法1.為計(jì)算陣列數(shù)據(jù)的預(yù)測(cè)分值(aPS),使用在陣列和qPCR之間具有最顯著相關(guān)性的15個(gè)基因。標(biāo)準(zhǔn)化的log2表達(dá)比值通過其2次冪進(jìn)行換算。對(duì)在"良好"預(yù)后群中下調(diào)的基因賦予負(fù)值。然后通過對(duì)所有15個(gè)基因的值求和來計(jì)算最終分值。正分值與改善的結(jié)果相關(guān)。2.對(duì)于qPCR數(shù)據(jù)(qPS),對(duì)15個(gè)最相關(guān)基因的AACT值應(yīng)用邏輯回歸算法,該算法利用赤池信息量準(zhǔn)則(AkaikeInformationCriterion)僅選擇對(duì)于類別區(qū)分有貢獻(xiàn)的那些基因。這選擇了5個(gè)顯著基因,隨之用于如下方程式qPS=[1328.15-187.42(IDH)+137.10(MFG8)+73.61(PILRA)+211.22(HLA-E)+143.94(TXNDC5)]X-l同aPS—樣,使用此方法正分值與改善的結(jié)果相關(guān)。預(yù)測(cè)分值與TTP和存活相關(guān)正如所預(yù)期的那樣,對(duì)該測(cè)試集應(yīng)用aPS和qPS均能夠區(qū)分兩個(gè)預(yù)后群。個(gè)體分值與TTP和總體存活兩者之間的強(qiáng)相關(guān)性均明顯,這樣對(duì)于qPS和aPS,個(gè)體分值的幅度(aPS的高分值和qPS的負(fù)分值)與改進(jìn)的結(jié)果關(guān)聯(lián)起來(圖8,斯皮爾曼秩相關(guān)系數(shù)r=0.7908,p<0.0001)。這表明這些差異表達(dá)基因的表達(dá)水平與直接影響臨床結(jié)果的潛在生物機(jī)制相關(guān),強(qiáng)調(diào)了它們的預(yù)后中肯性。對(duì)三個(gè)獨(dú)立集應(yīng)用預(yù)測(cè)分值然后對(duì)獨(dú)立生成的數(shù)據(jù)應(yīng)用該結(jié)果。鑒定了一個(gè)公開數(shù)據(jù)集,其與我們自己的具有相似患者亞群。在83名于此研究中27進(jìn)行了特征分析的患者中,14名患有III期疾病并長(zhǎng)期隨訪。在此亞群中,利用在我們測(cè)試集中應(yīng)用的相似標(biāo)準(zhǔn),10名患者將會(huì)被歸為"不良"(平均TTP10個(gè)月),而4名為"良好"(平均TTP62個(gè)月)。當(dāng)對(duì)這些樣品應(yīng)用aPS算法時(shí),所有10名"不良"患者和4名"良好"患者中的2名均被正確地預(yù)測(cè)出來,得到85%的總體正確分類率。接下來我們對(duì)來自路德維格/奧斯汀組織庫(kù)的10個(gè)腫瘤的獨(dú)立集應(yīng)用qPS算法,其中利用所述的5個(gè)最強(qiáng)預(yù)測(cè)基因進(jìn)行了該qPCR測(cè)定。該預(yù)測(cè)器對(duì)全部5個(gè)"良好"預(yù)后腫瘤進(jìn)行了正確的分類,但是對(duì)5個(gè)"不良"樣品中的1個(gè)進(jìn)行了誤分類(圖9)。誤分類的"不良"樣品所代表的患者TTP短暫,但是具有6年的長(zhǎng)期總體存活,伴有轉(zhuǎn)移性疾病。還對(duì)第三個(gè)3期黑色素瘤樣品獨(dú)立集應(yīng)用了此五基因qPS。這些樣品由繼診斷為3期疾病后存活不足18個(gè)月的19名患者、以及自3期診斷起存活大于4年的另外18名患者組成。這些良好和不良預(yù)后群的qPS分值分布有顯著差異(p=0.02),并示于圖10。討論此實(shí)施例表明利用源于微陣列基因表達(dá)數(shù)據(jù)和qPCR的表達(dá)譜能夠在以其他方式不可區(qū)分的III期黑色素瘤患者群中成功地預(yù)測(cè)臨床結(jié)果。在兩個(gè)獨(dú)立集中已經(jīng)確立開發(fā)的這兩種基于15個(gè)差異表達(dá)基因的預(yù)測(cè)分值算法,能夠應(yīng)用于微陣列和qPCR數(shù)據(jù),以在IIIB/C期黑色素瘤患者中前瞻性地預(yù)測(cè)臨床結(jié)果。這些患者因?yàn)橄嗨频募膊‰A段而被選擇,而若干研究已證明不同階段采集的自體樣品之間的基因表達(dá)相似性甚于相似疾病階段的不同患者之間的基因表達(dá)相似性27'31'32。本觀察結(jié)果,即,存在能夠以高達(dá)92%的準(zhǔn)確性用來前瞻性地預(yù)測(cè)結(jié)果的組間差異表達(dá)基因,強(qiáng)調(diào)了其重要性。此外,該預(yù)測(cè)器與TTP和總體存活兩者間的相關(guān)性也凸顯了該預(yù)測(cè)器的實(shí)用性,從而分值的差異幅度直接與臨床結(jié)果相關(guān)。在說明書中已經(jīng)提及了具有已知等同物的整數(shù)或成分,這樣的等同物在此并入本文,就如同單獨(dú)進(jìn)行過陳述一樣。雖然通過舉例并參照其可能的實(shí)施方案對(duì)本發(fā)明進(jìn)行了描述,但是應(yīng)當(dāng)理解,可以進(jìn)行改進(jìn)和/或改變而不偏離本發(fā)明的范圍。參考文獻(xiàn)1.AustralianInstituteofHealthandWelfare(AIHW):CancerinAustralia2001.Canberra,AustralianInstituteofHealthandWelfareAustralasianAssociationofCancerRegistries(AACR),20042.FlorezA,CrucesM:Melanomaepidemic:trueorfalseIntJDermatol43:405-7,20043.ThursfieldV,F(xiàn)arrugiaH,GilesG:CancerinVictoria2004,Canstat.Victoria,CancerEpidemiologyCentre,2006,32頁(yè)4.ThompsonJF,ScolyerRA,KeffordRF:Cutaneousmelanoma.Lancet365:687-701,20055.VermaS,QuirtI,McCreadyD等人-Systematicreviewofsystemicadjuvantther即yforpatientsathighriskforrecurrentmelanoma.Cancerl06:1431_42,20066.HerseyP:Adjuvanttherapyforhigh—riskprimaryandresectedmetastaticmelanoma.InternMedJ33:33-43,20037.KirkwoodJM,ManolaJ,IbrahimJ等人Apooledanalysisofeasterncooperativeoncologygroupandintergrouptrialsofadjuvanthigh_doseinterferonformelanoma.ClinCancerRes10:1670—7,20048.SondakVK,SabelMS,MuleJJ-Allogeneicandautologousmelanomavaccines:wherehavewebeenandwherearewegoingClinCancerResl2:2337s-2341s,20069.BalchCM,SoberAJ,SoongSJ等人Thenewmelanomastagingsystem.SeminCutanMedSurg22:42-54,200310.KirkwoodJM,StrawdermanMH,ErnstoffMS等人lnterfe皿alfa-2badjuvanttherapyofhigh—riskresectedcutaneousmelanoma:theEasternCooperativeOncologyGroupTrialEST1684.JClin0ncoll4:7_17,1996ll.KirkwoodJM,IbrahimJG,SondakVK等人High-andlow_doseinterferonalfa_2binhigh-riskmelanoma:firstanalysisofintergrouptrialE1690/S9111/C9190.JClinOncol18:2444-58,200012.Efron,B.andTibshirani,R.AnIntroductiontotheBootstrap.Chapman&Hall.200513.McLaughlanGJ,DoK,AmbroiseCAnalyzingMicroarrayGeneExpressionData(WileySeriesinProbabilityandStatistics)200414.WrightGW,SimonRMArandomvariancemodelfordetectionofdifferentialgeneexpressioninsmallmicroarrayexperiments.Bioinformatics2003;19:2448-2455.15.SmythGK.LinearmodelsandempiricalBayesmethodsforassessingdifferentialexpressioninmicroarrayexperiments.StatisticalApplicationsinGeneticsandMolecularBiology2004;3:Article3.16.L6nnstedtI.andSpeedTP.Rep1icatedmicroarraydata.StatisticaSinica2002;12:31-46.17.IhakaR,GentlemanR.R:Alanguagefordataanalysisandgraphics.JournalofComputationalandGraphicalStatistics1996;5:299—314.18.BeckerRA,Chambers,JMandWilksARTheNewSLanguage.Wadsworth&Brooks/Cole1988.19.HastieT,TibshiraniR,F(xiàn)riedmanJTheElementsofStatisticalLearningDataMining,InferenceandPredictionSpringer200320.GentlemanR.,CareyVJ,HuberW.,IrizarryRA,DudoitS.BioinformaticsandComputationalBiologySolutionsUsingRandBioconductor.Springer2005.21.NeterJ,KutnerMH,WassermanW,NachtsheimCJ,AppliedLinearStatisticalModelsMcGraw_Hill/Irwin199622.Venables,WN,Ripley,BDModernAppliedStatisticswithS.4thed..Springer2002.2623.Ripley,B.D.PatternRecognitionandNeuralNetworksCambridgeUniversityPress199624.CristianiniN,Shawe-TaylorJAnIntroductiontoSupportVectorMachines(andotherkernel-basedlearningmethods)CambridgeUniversityPress200025.BreimanL,F(xiàn)riedmanJ,StoneCJ,OlshenRAClassificationandRegressionTreesChapman&Hall/CRC198426.Good,PIResamplingMethods:APracticalGuidetoDataAnalysisBirkhauser199927.Wi皿印e皿inckxV,LazarV,MichielsS等人Geneexpressionprofilingofprimarycutaneousmelanomaandclinicaloutcome.JNatlCancerInst98:472—82,200628.BenjaminiY,HochbergY-Controllingthefalsediscoveryrate:apracticalandpowerfulapproachtomultipletesting.JournaloftheRoyalStatisticalSociety57:289-300,199529.LivakKJ,SchmittgenTD:Analysisofrelativegeneexpressiondatausingreal-timequantitativePCRandthe2(-DeltaDeltaC(T))Method.Methods25:402-8,200130.BalchCM,SoberAJ,SoongSJ等人Thenewmelanomastagingsystem.SeminCutanMedSurg22:42-54,200331.WangE,MillerLD,OhnmachtGA等人-Prospectivemolecularprofilingofmelanomametastasessuggestsclassifiersofimmuneresponsiveness.CancerRes62:3581-6,200232.RamaswamyS,RossKN,LanderES等人Amolecularsignatureofmetastasisinprimarysolidtumors.NatGenet33:49—54,2003工業(yè)實(shí)用性本發(fā)明的方法、組合物、試劑盒和裝置基于預(yù)后癌癥標(biāo)志物,尤其是黑色素瘤預(yù)后標(biāo)志物,可用于預(yù)后和治療癌癥,特別是黑色素瘤。2權(quán)利要求確定黑色素瘤進(jìn)展風(fēng)險(xiǎn)的預(yù)后標(biāo)簽,包括兩個(gè)或更多個(gè)黑色素瘤預(yù)后標(biāo)志物(MPM)。2.權(quán)利要求1的標(biāo)簽,其中MPM選自表1。3.確定黑色素瘤預(yù)后的裝置,包括其上具有一個(gè)或多個(gè)位置的基質(zhì),各位置上具有兩個(gè)或更多個(gè)寡核苷酸,各寡核苷酸選自一個(gè)或多個(gè)MPM。4.權(quán)利要求3的裝置,其中所述兩個(gè)或更多個(gè)寡核苷酸是選自表1的MPM。5.確定患者黑色素瘤預(yù)后的方法,包括步驟(i)確定來自患者的黑色素瘤腫瘤樣品中MPM的表達(dá)水平、或者包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)水平,(ii)應(yīng)用預(yù)測(cè)模型,所述模型通過對(duì)預(yù)后良好和不良腫瘤樣品中該MPM的表達(dá)水平或預(yù)后標(biāo)簽的表達(dá)水平應(yīng)用預(yù)測(cè)方法而確立,(iii)確立預(yù)后。6.確定黑色素瘤患者進(jìn)行藥物試驗(yàn)的適宜性的方法,包括步驟(i)確定來自患者的黑色素瘤腫瘤樣品中MPM的表達(dá)水平、或者包含兩個(gè)或更多個(gè)MPM的預(yù)后標(biāo)簽的表達(dá)水平,(ii)應(yīng)用預(yù)測(cè)模型,所述模型通過對(duì)預(yù)后良好和不良腫瘤樣品中該MPM的表達(dá)水平或預(yù)后標(biāo)簽的表達(dá)水平應(yīng)用預(yù)測(cè)方法而確立,(iii)確立患者對(duì)試驗(yàn)的適宜性。7.權(quán)利要求5或權(quán)利要求6的方法,其中MPM選自表l。8.權(quán)利要求5的方法,其中所述預(yù)測(cè)方法選自線性模型、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、分類回歸樹、集成學(xué)習(xí)方法、判別分析、近鄰方法、貝葉斯網(wǎng)絡(luò)、獨(dú)立成分分析。9.權(quán)利要求5至8中任一項(xiàng)的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟通過檢測(cè)各基因的mRNA表達(dá)水平進(jìn)行。10.權(quán)利要求5至8中任一項(xiàng)的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟通過檢測(cè)各基因的cDNA表達(dá)水平進(jìn)行。11.權(quán)利要求10的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟利用與所述cDNA的至少一部分互補(bǔ)的核苷酸進(jìn)行。12.權(quán)利要求9的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟利用正向引物和反向引物通過qPCR方法進(jìn)行。13.權(quán)利要求8的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟利用根據(jù)權(quán)利要求3或權(quán)利要求4的裝置進(jìn)行。14.權(quán)利要求5至8中任一項(xiàng)的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟通過檢測(cè)各標(biāo)志物的蛋白質(zhì)表達(dá)水平進(jìn)行。15.權(quán)利要求5至8中任一項(xiàng)的方法,其中確定MPM或預(yù)后標(biāo)簽表達(dá)水平的步驟通過檢測(cè)各標(biāo)志物的肽表達(dá)水平進(jìn)行。16.權(quán)利要求13或權(quán)利要求14的方法,其中所述檢測(cè)步驟利用針對(duì)各標(biāo)志物的抗體進(jìn)行。17.權(quán)利要求13至15中任一項(xiàng)的方法,其中所述檢測(cè)步驟利用夾心免疫測(cè)定法進(jìn)行。18.權(quán)利要求13至16中任一項(xiàng)的方法,其中所述抗體是單克隆抗體。19.權(quán)利要求13至16中任一項(xiàng)的方法,其中所述抗體是多克隆抗血清。全文摘要本發(fā)明涉及預(yù)后標(biāo)志物和預(yù)后標(biāo)簽,以及確定患者癌癥(特別是黑色素瘤)預(yù)后的組合物和方法。具體地,本發(fā)明涉及基于標(biāo)志物和標(biāo)志物標(biāo)簽將遺傳和蛋白質(zhì)標(biāo)志物用于預(yù)測(cè)癌癥(如黑色素瘤)進(jìn)展風(fēng)險(xiǎn)的用途。在多個(gè)方面,本發(fā)明提供了基于預(yù)后癌癥標(biāo)志物(尤其是黑色素瘤預(yù)后標(biāo)志物)的方法、組合物、試劑盒和裝置,以輔助預(yù)后和治療癌癥。文檔編號(hào)C12Q1/68GK101743327SQ200880024863公開日2010年6月16日申請(qǐng)日期2008年5月23日優(yōu)先權(quán)日2007年5月24日發(fā)明者J·塞本,M·A·布萊克,P·J·吉爾福德,T·約翰申請(qǐng)人:環(huán)太平洋生物技術(shù)有限公司;路德維希癌癥研究所