本發(fā)明提供一種鑒別基于PLSR的模型以用于預測個體對治療劑 的敏感性的基因表達譜的方法,所述方法包含以下步驟:將基因表達數(shù)據(jù)集在訓練數(shù)據(jù)集 與測試數(shù)據(jù)集之間進行均衡的分割;反復地使用PLSR算法,通過隨機分割將訓練數(shù)據(jù)集進 一步分成子訓練集和子測試集,由此用所述子訓練數(shù)據(jù)集訓練PLSR模型;選擇所述數(shù)據(jù)集 中表示共同特征的最佳PLSR模型;應用一致性加權方法鑒別與所述一致性最類似的核心 基因表達模型;以及分析所述核心模型中表示的基因間生物學路徑關聯(lián)以鑒別過度表現(xiàn) (over-represented)的生物路徑;及選擇所述過度表現(xiàn)的生物路徑中所發(fā)現(xiàn)的一或多種 標記物以得到預測標記物基因集;由此產(chǎn)生基于PLSR的模型。在一些實施例中,一致性加 權方法是基于奇異值分解的方法。在一些實施例中,所述方法另外包含至少一個數(shù)據(jù)簡化 步驟。在一些實施例中,所述方法另外包含特征選擇步驟。
[0051] 本文所述的特性與NAE抑制劑(例如1-取代的氨基磺酸甲酯,例如MLN4924)治 療之后的結(jié)果關聯(lián)的標記物基因提供于表1中。本文所述的特性與EGFR抑制劑(例如埃 羅替尼)治療之后的結(jié)果關聯(lián)的標記物基因提供于表2中。本文所述的特性與泛激酶抑制 劑(例如索拉非尼)治療之后的結(jié)果關聯(lián)的標記物基因提供于表3中。對應于標記物基因 的mRNA序列、探針集靶序列(即,結(jié)合探針集的序列)也在表1、表2及表3中列出。表1、 表2及表3中所列的標記物基因可具有普遍存在或表達受限的同功異型物。表1、2及3中 的代表性核酸SEQ ID NO只是指編碼代表性同功異型物蛋白質(zhì)(例如最長或占優(yōu)勢的同功 異型物)的mRNA,所述蛋白質(zhì)表示至少此類同功異型物的前體并且未必表示成熟蛋白質(zhì)。 這些序列并不打算限制標記物基因與所述同功異型物或前體的一致性。通過審查在英特茲 基因 (Entrez Gene)(由馬里蘭州貝塞斯達(Bethesda, MD)的美國國家生物技術信息中心 (National Center for Biotechnology Information)維護的數(shù)據(jù)庫)下所提供的以表 1、 表2或表3中列出的ID編號標識的信息,所屬領域的技術人員可容易地獲取并理解另外的 同功異型物和成熟蛋白質(zhì)。各表中的探針集革G序列是實例的昂飛陣列(Affymetrix array) 中用于測量標記物表達的探針集(通過其探針集標識符標識)所結(jié)合的靶。昂飛陣列上探 針集的序列靶易于公開獲得(參見AFFYMETRIX?公司的網(wǎng)站,加利福尼亞州圣克拉拉 (Santa Clara CA))。此類序列可以不必翻譯出來,而且可以涵蓋標記物基因的非翻譯部 分。標記物基因的表達可以通過多種方式測量,例如通過定量從個體獲得的樣品(例如腫 瘤細胞樣品)中標記物基因核酸、由標記物基因核酸編碼的蛋白質(zhì)或探針集靶序列。
[0052] 表1.關于NAE抑制劑治療的標記物基因說明
【主權項】
1. 一種用于確定是否用NEDD8活化酶NAE抑制劑治療癌癥患者的方法,所述方法包含 以下步驟: a) 測定從所述患者獲得的癌細胞樣品中包含至少兩種表1中所標識的標記物的標記 物基因集的基因表達水平的定量測量值; b) 基于所述標記物基因集的基因表達水平,使用基于偏最小二乘回歸PLSR的算法來 產(chǎn)生預測結(jié)果評分; c) 將所述預測結(jié)果評分與截止值相比較;及 d) 基于所述預測結(jié)果評分與所述截止值的所述比較來確定是否用所述NAE抑制劑治 療所述患者。
2. 根據(jù)權利要求1所述的方法,其進一步包含如果所述比較預測所述癌細胞樣品對所 述NAE抑制劑敏感,那么確定治療所述患者。
3. 根據(jù)權利要求1所述的方法,其進一步包含如果所述比較預測所述癌細胞樣品對所 述NAE抑制劑具有耐藥性,那么確定不治療所述患者。
4. 根據(jù)權利要求1所述的方法,其中所述標記物基因表達水平是通過測量所述標記物 集中所述標記物基因的核酸的量來測定。
5. 根據(jù)權利要求1所述的方法,其中所述標記物基因表達水平是通過測量所述標記物 集中所述標記物基因的多肽的量來測定。
6. 根據(jù)權利要求4所述的方法,其中所述核酸選自由以下組成的群組:SEQIDNO: 1到 69及其剪接變體。
7. 根據(jù)權利要求4所述的方法,其中所述核酸選自由以下組成的群組:SEQIDNO: 117 到185及其片段。
8. 根據(jù)權利要求5所述的方法,其中所述多肽是由選自由SEQIDNO: 1到69及其剪接 變體組成的群組的核酸編碼的多肽或其同功異型物。
9. 根據(jù)權利要求1所述的方法,其中所述標記物基因集包含選自由以下組成的群組的 標記物:表1中標識的標記物1、2、3及4。
10. -種用于鑒別作為用NEDD8活化酶NAE抑制劑治療的候選者的癌癥患者的方法,所 述方法包含以下步驟: a) 測定從所述患者獲得的癌細胞樣品中包含選自由表1中所標識的標記物1、2、3及4 組成的群組的標記物的標記物基因集的基因表達水平的定量測量值; b) 基于所述標記物基因集的基因表達水平,使用基于偏最小二乘回歸PLSR的算法來 產(chǎn)生預測結(jié)果評分; c) 將所述預測結(jié)果評分與截止值相比較;及 d) 如果步驟c)中的所述比較指示所述癌細胞樣品對所述NAE抑制劑敏感,那么將所述 患者鑒別為用所述NAE抑制劑治療的候選者。
11. 根據(jù)權利要求10所述的方法,其中所述標記物基因集包含標記物1和2。
12. 根據(jù)權利要求10所述的方法,其中所述標記物基因集包含標記物1、2、3及4。
13. 根據(jù)權利要求10到12中任一權利要求所述的方法,其中所述標記物基因集另外包 含標記物46、標記物47或標記物46和標記物47二者。
14. 根據(jù)權利要求10到13中任一權利要求所述的方法,其中所述標記物基因集另外包 含選自由以下組成的群組的路徑中的標記物:TGF0 -SMD信號傳導路徑、粘附受體誘導的 信號傳導路徑、c-myc轉(zhuǎn)錄因子路徑及c-myb轉(zhuǎn)錄因子路徑。
15. 根據(jù)權利要求10所述的方法,其中所述標記物基因集由表1的標記物1到3及5 到45組成。
16. 根據(jù)權利要求10所述的方法,其中所述標記物基因集由表1的標記物1到69組 成。
17. 根據(jù)權利要求10到16中任一權利要求所述的方法,其中所述癌細胞是來自血液癌 癥或?qū)嶓w腫瘤癌癥。
18. 根據(jù)權利要求17所述的方法,其中所述實體腫瘤癌癥選自由以下組成的群組:皮 膚癌、乳癌、結(jié)腸癌、肺癌、胰臟癌、食道癌、膀胱癌及頭頸癌。
19. 根據(jù)權利要求17所述的方法,其中所述血液癌癥是急性骨髓性白血病。
20. 根據(jù)權利要求10所述的方法,其中所述截止值是分離截止值。
21. 根據(jù)權利要求10所述的方法,其中所述預測結(jié)果評分是以所述NAE抑制劑的 Iog2 (IC50)表示并且所述截止值在-3到1的范圍內(nèi)。
22. 根據(jù)權利要求21所述的方法,其中低于所述截止值的預測結(jié)果評分預測對所述 NAE抑制劑敏感。
23. 根據(jù)權利要求22所述的方法,其中所述截止值是-1. 45。
24. 根據(jù)權利要求10到23中任一權利要求所述的方法,其中所述NAE抑制劑是1-取 代的氨基磺酸甲酯。
25. 根據(jù)權利要求24所述的方法,其中所述1-取代的氨基磺酸甲酯是(氨基磺 酸((1S,2S,4R)-4-{4-[ (IS)-2, 3-二氫-IH-茚-1-基氨基]-7H-吡咯并[2, 3-d]嘧 啶-7-基} -2-羥基環(huán)戊基)甲酯)。
26. 根據(jù)權利要求18所述的方法,其中所述皮膚癌是黑素瘤。
27. 根據(jù)權利要求26所述的方法,其中所述標記物基因集包含表1中所標識的標記物 1 到 44、46 到 48、50、51、53 到 66、68 及 69。
28. -種用于治療癌癥患者的方法,所述方法包含以下步驟: a) 測定從所述患者獲得的癌細胞樣品中包含選自由表1中所標識的標記物1、2、3及4 組成的群組的標記物的標記物基因集的基因表達水平的定量測量值; b) 基于所述標記物基因集的基因表達水平,使用基于偏最小二乘回歸PLSR的算法來 產(chǎn)生預測結(jié)果評分; c) 將所述預測結(jié)果評分與截止值相比較;及 d) 如果c)中的所述比較指示所述癌細胞樣品對NAE抑制劑敏感,那么用所述NAE抑制 劑治療所述個體。
29. 根據(jù)權利要求28所述的方法,其中所述標記物基因集包含標記物1和2。
30. 根據(jù)權利要求28所述的方法,其中所述標記物基因集包含標記物1、2、3及4。
31. 根據(jù)權利要求28到30中任一權利要求所述的方法,其中所述標記物基因集另外包 含標記物46、標記物47或標記物46和標記物47二者。
32. 根據(jù)權利要求28到31中任一權利要求所述的方法,其中所述標記物基因集另外包 含選自由以下組成的群組的路徑中的標記物:TGF0 -SMD信號傳導路徑、粘附受體誘導的 信號傳導路徑、c-myc轉(zhuǎn)錄因子路徑及c-myb轉(zhuǎn)錄因子路徑。
33. 根據(jù)權利要求2