專利名稱::Egfr抑制劑治療的預測性標記物的制作方法EGFR抑制劑治療的預測性標記物本發(fā)明提供一種生物標記物,其預測癌癥患者中EGFR抑制劑治療的臨床益處。許多人惡性腫瘤與表皮生長因子受體(EGFR)的異?;蜻^表達有關。EGF,轉化生長因子-a(TGF-a),和許多其他配體結合EGFR,從而刺激該受體胞內酪氨酸激酶結構域的自身磷酸化。隨后激活多種胞內途徑,且這些下游事件導致腫瘤細胞體外增殖。已經假定通過EGFR刺激腫瘤細胞可能對體內腫瘤生長和腫瘤存活非常重要。關于Tarceva,即EGFR酪氨酸激酶的抑制劑的早期臨床數(shù)據(jù)顯示該化合物是安全的且通常在提供靶有效濃度的劑量是良好耐受(如通過臨床前數(shù)據(jù)確定地)的?;加型砥诩膊〉幕颊咧械呐R床I和II期試驗證明Tarceva在一定范圍的上皮腫瘤中具有有前景的臨床活性。事實上,已經顯示出Tarceva能夠在先前受治療的患有頭頸癌和NSCLC(非小細胞肺癌)的患者中誘導與確定的第二線化學療法相似級別的持久部分好轉,但是具有比化學療法更好的安全特性和改進的方便性(片劑代替靜脈內[i.v.]施用)的額外益處。近期完成的隨機雙盲安慰劑對照試驗(BR.21)顯示單試劑Tarceva顯著延長和改善NSCLC患者的存活,對于所述NSCLC患者,標準的晚期疾病療法未能成功。Tarceva(厄洛替尼)是小化學分子;其是EGFR酪氨酸激酶(EGFR-TKI)的口服活性有效選擇性抑制劑。肺癌是北美和歐洲中癌癥相關死亡的主要原因。在美國,由肺癌繼發(fā)的死亡數(shù)量超過由第二(結腸癌)、第三(乳腺癌)、和第四(前列腺癌)主要癌癥死亡原因組合的總死亡。全部肺癌的約75%-80%是NSCLC,其約40%的患者表現(xiàn)出局部晚期和/或不可切除的疾病。該組典型地包括患有大量IIIA和IIIB期疾病的那些,不包括惡性胸膜滲漏。肺癌在歐洲聯(lián)盟中的粗略發(fā)生率是52.5,死亡率是48.7病例/100000/年。分別地,在男性中,所述比率是79.3和78.3,在女性中,是21.6和20.5。NSCLC占所有肺癌病例的80%。男性中約90%的肺癌死亡率和女性中的80%可歸因于吸煙。在美國,根據(jù)美國癌癥協(xié)會,在2004年,存在約173,800件新肺癌病例(男性中93,100和女性中80,700)并占全部新癌癥的約13%。大多數(shù)患者在診斷兩年內由于他們的疾病后果而死亡。對于許多NSCLC患者,成功的治療仍然難以捉摸。晚期腫瘤經常不能通過手術處理并且還可能對可耐受劑量的放射療法和化學療法具有抗性。在隨機試驗中,當前最具活性的組合化學療法獲得約30%-40%的反應率,和35%-40%的1年存活率。這確實是超過單獨使用支持性醫(yī)護所觀察到的10%的1年存活率的進步(Sh印herd1999)。直到最近,復發(fā)患者復發(fā)后的治療選擇僅限于最佳支持性醫(yī)護或減輕。近期比較多西他賽(泰索帝(Taxotere))和最佳支持性醫(yī)護的試驗顯示患有NSCLC的患者在基于順鉬的第一線方案失敗后,可以受益于第二線化學療法。所有年齡和具有0,1,或2EC0G性能狀態(tài)的患者證明了使用多西他賽的提高的存活,先前用基于鉬的治療難治的患者也如此。不受益于療法的患者包括體重減輕10%、高乳酸脫氫酶水平、多器官累及、或肝累及的那些。另外,多西他賽單一療法的益處不擴展超過第二線設置。接受多西他賽作為第三線治療或以上的患者沒顯示出存活的延長。單試劑多西他賽成為NSCLC的標準第二線療法。近期,第二線NSCLC療法中的另一個隨機ill期試驗比較了培美曲塞(Alimta)和多西他賽。使用培美曲塞的治療導致臨床等價功效但與多西他賽相比具有顯著更小的副作用。長期以來公認存在開發(fā)個性化癌癥治療的方法的需要。伴隨著靶向癌治療的發(fā)展,存在可以提供腫瘤靶標分子特征的方法學的特別目的,(即預測臨床益處的那些)。關于癌癥中基因表達模式原則的證據(jù)已經利用腫瘤類型分子分類建立了,所述腫瘤類型基于目前的形態(tài)學和免疫組織化學測試是不明顯的。兩種單獨的疾病個體用來自使用基因表達模式的單一目前擴散大B細胞淋巴瘤分類的不同預后來區(qū)分。因此,本發(fā)明的目的是提供預測癌癥患者中EGFR抑制劑治療的臨床益處的表達生物標記物。在第一個目標中,本發(fā)明提供預測對EGFR抑制劑治療反應的癌癥患者的臨床益處的體外方法,其包括以下步驟確定患者腫瘤樣品中STCH基因的表達水平和對該STCH基因表達水平和代表不由該治療獲得臨床益處的患者群的腫瘤中STCH基因表達水平的值進行比較,其中患者的腫瘤樣品中STCH基因的較低表達水平指示將由該治療獲得臨床益處的患者??s寫STCH意指應激70蛋白蛋白伴侶。Seq.Id.No.1表示人STCH的核苷酸序列。術語“代表不由該治療獲得臨床益處的患者群的腫瘤中STCH基因表達水平的值”指不由該治療獲得臨床益處的患者群的腫瘤中標記物基因平均表達水平的估值。臨床益處定義為具有目標反應或疾病穩(wěn)定>12周。在另一個優(yōu)選的實施方案中,STCH基因在所述患者的腫瘤樣品中表現(xiàn)出與代表不由該治療獲得臨床益處的患者群的值相比,1.1-1.8或更多倍的更低表達水平。在優(yōu)選的實施方案中,標記物基因的表達水平通過微陣列技術或其他評估RNA表達水平的技術如定量RT-PCR或通過任何著眼于各自蛋白表達水平的方法,例如免疫組織化學法(IHC)來確定?;蛐酒臉嫿ê陀猛臼潜绢I域中眾所周知的。參見,美國專利號5,202,231;5,445,934;5,525,464;5,695,940;5,744,305;5,795,716和15,800,992。還參見,Johnston,M.Curr.Biol.(當前生物學)8:R171_174(1998);IyerVR等,Science(科學)283:83-87(1999)。當然,基因表達水平可以通過本領域中技術人員已知的其他方法,諸如例如RNA印跡、RT-PCR、實時定量PCR、引物延伸、RNA酶保護、RNA表達模式來確定。本發(fā)明的標記物基因可以與其他生物標記物組合為生物標記物組。生物標記物組可以由預測性生物標記物的任何組合構成,從而預測EGFR抑制劑治療在癌癥患者中的作用。本文中所述的生物標記物和生物標記物組可以用于,例如,預測患有癌癥的患者將如何對使用EGFR抑制劑的治療干預進行反應。術語“基因”用于本文中時,包括基因的變體。術語“變體”涉及與GenBank登記號提供的核酸序列基本相似的核酸序列。術語“基本相似”被本領域中技術人員充分理解。具體地,基因變體可以是這樣的等位基因,所述等位基因與人群中最普遍的等位基因的核酸序列相比表現(xiàn)出核苷酸交換。優(yōu)選地,這樣的基本相似的核酸序列與最普遍的等位基因具有至少80%,優(yōu)選至少85%,更優(yōu)選至少90%,最優(yōu)選至少95%的序列相似性。術語“變體”還意指涉及剪接變體。EGFR抑制劑可以選自由吉非替尼,厄洛替尼,PKI-166,EKB-569,GW2016,CI-1033和抗erbB抗體,諸如曲妥珠單抗和西妥昔單抗組成的組。在另一個實施方案中,EGFR抑制劑是厄洛替尼。在再一個實施方案中,癌癥是NSCLC。用于檢測和量化本發(fā)明所述基因的基因表達的技術包括,但不限于,RNA印跡、RT-PCR、實時定量PCR、引物延伸、RNA酶保護、RNA表達模式和相關技術。這些技術是本領域中技術人員公知的。參見例如,SambrookJ等,MolecularCloning:ALaboratoryManual(分子克隆實驗室手冊),第三版(ColdSpringHarborPress(冷泉港出版社),ColdSpringHarbor(冷泉港),2000)。用于檢測本發(fā)明所述各種基因的蛋白表達的技術包括,但不限于,免疫組織化學法(IHC)。根據(jù)本發(fā)明,可以測定來自患者組織樣品,例如腫瘤或癌活組織檢查的細胞,以確定一種或多種生物標記物的表達模式。癌癥治療的成功或失敗可以基于來自測試組織(測試細胞),例如腫瘤或癌活組織檢查的細胞的生物標記物的表達模式來確定,如與一種或多種生物標記物的對照組的表達模式相對相似或不同。在本發(fā)明的上下文中,發(fā)現(xiàn)表3的基因受到下調,即與不由使用EGFR抑制劑的治療獲得臨床益處的患者的腫瘤相比,在由EGFR抑制劑治療獲得臨床益處的患者的腫瘤中表現(xiàn)出更低的表達水平。因此,如果測試細胞表現(xiàn)出對應于對癌癥治療有反應的患者的生物標記物表達模式,則該個體的癌癥或腫瘤應該有利地對使用EGFR抑制劑的治療有反應,這是高度可能的或被預測的。相反,如果測試細胞表現(xiàn)出對應于不對癌癥治療有反應的患者的生物標記物表達模式,則該個體的癌癥或腫瘤不應該對使用EGFR抑制劑的治療有反應,這是高度可能的或被預測的。本發(fā)明的生物標記物,即表3中列出的基因,是對于患有癌癥,特別是患有難治NSCLC的患者的個性化療法的第一步。該個性化療法應該容許治療醫(yī)師從用于癌癥療法,特別是NSCLC的現(xiàn)存藥物中選擇最合適的藥劑。個性化療法對于每名將來的患者的益處是反應率/獲益患者數(shù)量將增加且歸因于無效治療的有害副作用的風險將降低。在另一個目標中,本發(fā)明提供治療通過本發(fā)明的體外方法鑒定的癌癥患者的治療法。所述治療法包括將EGFR抑制劑施用于患者,所述患者已經基于表3中基因的預測性表達模式被選擇進行處理。優(yōu)選的EGFR抑制劑是厄洛替尼且優(yōu)選的待治療癌癥是NSCLC。附圖簡述圖1顯示研究設計;圖2顯示樣品處理方案;圖3a顯示STCH表達水平對比Genechip模式的臨床結果;圖3b顯示STCH表達水平對比qRT-PCR的臨床結果;和圖3C顯示關于STCH的Genechip和qRT-PCR測量之間的相關性。實驗部分關于研究和研究設計的基本原理近期,描述了NSCLC患者子集的腫瘤組織中EGFR基因內的突變和這些突變與針對厄洛替尼和吉非替尼的靈敏性的聯(lián)系(Paoff,等2004;Lynch等2004;Paez等2004)。對于由兩項研究組合的患者,在14名對吉非替尼有反應的患者中的13名中觀察到突變的EGFR和在11名吉非替尼_治療的不反應患者中沒有觀察到突變的EGFR。這些突變的報告的普遍性在未選擇的NSCLC患者中是8%(25名中2名)。發(fā)現(xiàn)這些突變在腺癌中(21%),在來自雌性的腫瘤中(20%),和在來自日本患者的腫瘤中(26%)更頻繁。這些突變導致增加的EGFR體外活性和增加的針對吉非替尼的靈敏性。沒有預期評估突變與延長的穩(wěn)定疾病或存活期限的關系。基于來自BR.21研究的探究性分析,觀察到的存活益處似乎未必僅歸因于EGFR突變,因為即使在將具有目標反應的患者排除在分析之外時,顯著的存活益處仍保持(數(shù)據(jù)存檔)。其他的分子機制必定也對該效果作出功效?;谶@樣的假設,即存在預測對Tarceva治療反應/益處的基因表達水平變化,使用微陣列分析檢測這些變化。這需要明確定義的在第一線療法失敗后使用Tarceva單一療法治療的研究群體。基于來自BR.21研究的經驗,將獲益群體定義為具有目標反應,或12周的疾病穩(wěn)定性。按照預定義的統(tǒng)計學設計,分析臨床和微陣列數(shù)據(jù)組。該技術的應用需要新鮮冷凍的組織(FFT)。因此,在開始治療前,必須進行強制性活組織檢查。將收集的材料冷凍在液氮(N2)中。同時收集第二腫瘤樣品并保存在石蠟(福爾馬林固定的石蠟包埋的,F(xiàn)FPE)中。分析該樣品,以獲得EGFR信號傳導途徑中的改變。通過支氣管鏡檢進行腫瘤活組織檢查的能力是該研究的先決條件。支氣管鏡檢是驗證肺癌診斷的標準程序。盡管通常安全,但是保留并發(fā)癥,例如出血的風險。該研究是對于患有難治NSCLC的患者的個性化療法的第一步。該個性化療法應該容許治療醫(yī)師針對該指示從現(xiàn)存藥物中選擇最合適的藥劑。一旦可利用個性化療法,在本研究中,對每名未來患者的益處將勝過患者不得不接受的風險反應率/獲益患者數(shù)量將增加,歸因于無效治療的有害副作用的風險將降低。關于劑量選擇的基本原理Tarceva以150mg劑量每日口服給藥一次,直到疾病發(fā)展,無法耐受的毒性或死亡。該劑量的選擇基于藥物動力學參數(shù),以及在重度預處理的晚期癌癥患者的I,II和III期試驗中觀察到的該劑量的安全性和耐受能力模式。在接受150mg/日劑量的癌癥患者血漿中觀察到的藥物水平一致地高于臨床功效作為目標的平均血漿濃度500ng/ml。BR.21顯示使用該劑量的存活益處。研究的目標第一個目標是鑒定預測Tarceva治療益處(CRJR或SD彡12周)的差異表達基因。鑒定預測對Tarceva治療“反應”(CR,PR)的差異表達基因是一個重要的額外目標。第二個目標是評估EGFR信號傳導途徑關于來自治療的益處的變化。研究設計研究設計和給藥方案綜述這是一個開放_標記、預測性標記物鑒定II期研究。該研究在約12個國家中的約26個地點進行。264名經歷過至少一次以前化學療法方案失敗的晚期NSCLC患者在12個月的期間內參與。連續(xù)口服Tarceva以150mg/日的劑量給藥?;趯λ幬锆煼ǖ哪褪苣芰υ试S劑量的減少。評估臨床和實驗室參數(shù),以評價疾病控制和毒性。治療持續(xù)直到疾病發(fā)展,不能接受的毒性或死亡。研究設計描述在圖1中。獲得腫瘤組織和血液樣品進行分子分析,從而評價Tarceva的作用和鑒定受益于療法的患者子群。預測性標記物評估腫瘤的活組織檢查在開始治療前2周內進行。收集2種不同的樣品第一樣品通常立即冷凍在液N2中第二樣品在福爾馬林中固定并包埋在石蠟中快速冷凍的組織在該研究中具有最高的優(yōu)先級。圖2顯示樣品處理方案。微陣列分析快速冷凍的樣品用于腫瘤細胞的激光捕獲顯微切割(LCM),從而提取腫瘤RNA和來自腫瘤周圍組織的RNA。將RNA在Affymetrix微陣列芯片(HG-U133A)上分析,以構建患者腫瘤基因表達模式。使用Affymetrix芯片的質量控制選擇具有足夠質量以進行統(tǒng)計學比較的那些樣品。關于福爾馬林固定的石蠟包埋的組織的單生物標記物分析將第二腫瘤活組織檢查,F(xiàn)FPE樣品,用于進行DNA突變,IHC和ISH分析,如下所述。類似的分析對在最初診斷時收集的組織進行。編碼EGFR和參與EGFR信號傳導途徑的其他分子的基因的DNA突變狀態(tài)通過DNA測序分析。EGFR和相關基因的基因擴增通過FISH來研究。蛋白表達分析包括EGFR和EGFR信號傳導途徑中的其他蛋白的免疫組織化學[IHC]分析。反應評估使用RECIST(—維腫瘤測量)標準來評價反應??梢栽谝韵骆溄又邪l(fā)現(xiàn)這些標準http://www.eortc.be/recist/0注意為了對CR或ra狀態(tài)賦值,腫瘤測量的改變必須通過在治療期間內任意時刻時彼此相隔至少4周的重復評估來驗證。在SD的情形中,后繼測量必須在研究以6周的最小間隔進入后,達到了SD標準至少一次。在維持的SD的情形中,后繼測量必須在研究以至少12周的維持期間進入后,達到了SD標準至少一次。存活評估每3個月的定時狀態(tài)檢查通過患者就診(visittotheclinic)或通過電話進行。記錄所有的死亡。在研究結束時,需要對每名患者進行存活的明確確認。方法RNA樣品制備和RNA樣品的質量控制所有的活組織檢查樣品處理通過病理學參考實驗室來操作;新鮮冷凍的組織樣品由研究者地點運到RocheBasel(巴塞爾羅氏)中的臨床樣品操作機構(ClinicalSampleOperationsfacility),并由那里運到病理學實驗室以進行進一步的處理。使用激光捕獲顯微切割來從周圍組織中選擇腫瘤細胞。LCM后,由富集的腫瘤材料中純化RNA。病理學實7驗室然后進行許多步驟,以評價RNA的濃度和質量。RNA酶是RNA降解酶且到處存在,并且因此所述所有使用RNA的程序必須嚴格受控,以最小化RNA降解。大部分mRNA種類自身具有相當短的半衰期并且因此被認為非常不穩(wěn)定。因此,在任何測定前進行RNA完整性檢查和量化非常重要。RNA濃度和質量模式可以使用來自安捷倫(AgilentTechnologies,Inc.(安捷倫技術公司),PaloAlto,CA)的儀器,稱為2100Bioanalyzer(2100生物分析儀)評估。該儀器軟件產生RNA完整性指數(shù)(RIN),一種量化評價(Schr0eder,A.,等,TheRIN:anRNAintegritynumberforassigningintegrityvaluestoRNAmeasurements(RIN用于對RNA測量賦予完整性數(shù)值的RNA完整性指數(shù)).BMCMolBiol(BMC分子生物學),2006.7第3頁),并計算總RNA樣品的核糖體比率。RIN由RNA樣品的全部電泳痕跡確定,并且因此包括降解產物的存在或缺乏。RNA質量通過2100Bioanalyzer(2100生物分析儀)分析。只選擇具有至少一個高于加入的聚-I噪音的rRNA峰和充足RNA的樣品來進一步在Affymetrix平臺上進行分析。將純化的RNA運送到RocheCentreforMedicalGenomics(羅氏醫(yī)學基因組中心)(RCMG;巴塞爾,瑞士),以通過微陣列進行分析。從病理學實驗室收到122份RNA樣品以進一步處理。靶標記組織RNA樣品靶標記根據(jù)來自Affymetrix(Affymetrix,SantaClara,加利福尼亞)的兩循環(huán)靶標記擴增流程進行,按照制造商的說明。該方法基于標準Eberwine線性擴增程序,但是使用2個循環(huán)的該程序,以產生足夠的標記的cRNA,從而與微陣列雜交。該標記反應中使用的總RNA輸入,對于可獲得多于10ngRNA的那些樣品是10ng;如果可獲得小于該量或如果不存在可用的數(shù)量數(shù)據(jù)(由于非常低的RNA濃度),則將總樣品的一半用于該反應。來自標記反應的產量在20-180ygcRNA的范圍內。在雜交水平上引入標準化步驟,其中關于每份樣品使用15i!gCRNA。將人參照RNA(Stratagene,卡爾斯巴德,CA,美國)用作每批樣品工作流程的對照樣品。將10ng的該RNA作為輸入用在測試樣品的旁邊,以檢驗標記和雜交試劑如預期地工作。微陣列雜交AffymetrixHG-U133A微陣列含有超過22,000個探針組,其靶向約18,400個轉錄物和變體,其代表約14,500個充分表征的基因。對于所有樣品的雜交根據(jù)Affymetrix說明書(AffymetrixInc.(Affymetrix公司),ExpressionAnalysisTechnicalManual(表達分析技術手冊),2004)進行。簡言之,對于每份樣品,將15yg生物素標記的cRNA在存在二價陽離子和加熱的條件下斷裂,并與AffymetrixHG-U133A全基因組寡核苷酸陣列雜交過夜。第二天,按照制造商的說明,用鏈霉抗生物素-藻紅蛋白(MolecularProbes(分子探針);Eugene,OR)染色陣列。然后用GeneChipScanner(基因芯片掃描儀)3000(Affymetrix)掃描陣列,并通過GeneChipOperatingSoftware(基因芯片操作軟件)(GC0S)版本1.4(Affymetrix)自動計算信號強度。統(tǒng)計學分析Affymetrix數(shù)據(jù)分析由五個主要步驟組成。步驟1是質量控制。目的是從分析陣列中識別和排除具有不合標準的質量模式的數(shù)據(jù)。步驟2是預處理和標準化。目的是形成標準化的和成比例的“分析數(shù)據(jù)組”,其可用于芯片間比較。其包括背景噪音評估和扣除,探針總計和定比例。步驟3是探究和描述。目的是識別潛在偏差和可變性來源。其由應用多變量和單變量描述性分析技術來識別影響性相關變量(covariates)組成。步驟4是建模和測試。目的是基于“臨床益處”和“無臨床益處”患者之間平均表達水平差異的統(tǒng)計學評估來鑒定一系列候選標記物。其由使合適的統(tǒng)計學模型擬合每個探針組和獲得統(tǒng)計學顯著性測量組成。步驟5是有效性分析。目的是產生不嚴重依賴預處理方法和統(tǒng)計學假設的一系列合格的候選標記物。其由使用不同的方法學方法重復分析和交叉系列候選物組成。全部分析均利用R軟件包進行。步驟1質量控制數(shù)據(jù)質量的評估基于檢查若干參數(shù)。這些包括標準AffymetrixGeneChip質量參數(shù),具體地比例因子、PresentCall百分比和平均背景。該步驟還包括視覺化檢查虛擬芯片圖像(virtualchipimage)以檢測局部化雜交問題,和比較每個芯片和虛擬中值芯片(virtualmedianchip)以檢測由中值行為的任何不尋常偏離。還進行芯片間相關性分析,以檢測異常值樣品。另外,考慮獲自使用安捷倫生物分析儀2100(AgilentBioanalyzer2100)獲自分析RNA樣品的RNA質量的輔助測量?;谶@些參數(shù),從分析中排除來自20個陣列的數(shù)據(jù)。因此該分析中包括來自代表102名患者的總共102個陣列的數(shù)據(jù)。這102份樣品組的臨床說明報告在表1中。表1該分析中包括的患者的臨床特征說明變量值n-102n(%)最佳反應N/A16(15.7%)PD49(48.0%)SD31(30.4%)PR6(5.9%)臨床益處否81(79.4%).是21(20.6%)性別女性25(24.5%)男性77(74.5%)種族白種人65(63.7%)東方人37(36.3%)組織學腺癌35(34.3%)鱗狀53(52.0%)其他14(13.7%)曾經-吸煙否20(19.6%)是82(80.4%)步驟2數(shù)據(jù)預處理和標準化使用rma運算法貝(Irizarry,R.A.,等,SummariesofAffymetrixGeneChipprobeleveldata(Affymetrix基因芯片探針水平數(shù)據(jù)總結).Nucl.AcidsRes.(核酸研究),2003.31(4)第el5頁)進行預處理和標準化。使用mas5運算法則(AFFYMETRIX,Expression:DataAnalysisFundamentals('GeneC/zz/^^數(shù)據(jù)分析基礎).2004,AFFYMETRIX)檢測關于各個探針組的調用(call)。在所有樣品中稱為“缺乏的”或“最低限度的”探針組由進一步分析去除;由基于該標準的分析去除5930個探針組。分析數(shù)據(jù)組因此由具有在102名患者中測量的16353個(在22283個范圍內)探針組矩陣組成。步驟3數(shù)據(jù)描述和探究進行描述性探究分析,以確定潛在的偏差和主要可變性來源。篩選了一組對基因10表達模式具有潛在影響的相關變量。其包括技術和臨床變量。技術相關變量包括RNA處理日期(以后稱為批次),RIN(作為RNA質量/完整性的測量),操作者和樣品收集中心。臨床相關變量包括組織學類型,吸煙狀態(tài),腫瘤等級,表現(xiàn)評分(Oken,M.M.,等,ToxicityandresponsecriteriaoftheEasternCooperativeOncologyGroup(東方合作月中瘤學小組的毒性和反應標準).AmJClinOncol(美國臨床腫瘤學雜志),1982.5(6)第649-55頁),人口統(tǒng)計數(shù)據(jù),反應者狀態(tài)和臨床受益狀態(tài)。分析工具包括單變量AN0VA和主要成分分析。對于這些相關變量中的每個,將單變量AN0VA獨立應用于每個探針組。確定批次變量的顯著作用。在實踐上,批次變量捕獲樣品處理和Affymetrix芯片組日期之間的差異。在檢查批次變量幾乎與目的變量無關后,批次影響利用Johnson,ff.E.,C.Li,禾口A.Rabinovic,AdjustingbatcheffectsinmicroarrayexpressiondatausingempiricalBayesmethods(利用經驗貝葉斯法調節(jié)微陣列表達數(shù)據(jù)中的批次影響)Biostat(生物統(tǒng)計學),2007.8(1)第118-127頁中所述的方法校正。批次影響校正后,標準化數(shù)據(jù)組在隨后的分析中起分析數(shù)據(jù)組的作用。組織學和RIN是通過描述性分析突出的2種另外的重要變量。步驟4:數(shù)據(jù)建模和測試將線性模型對每個探針組進行獨立擬合。該模型中包括的變量報告在表2中。通過最大似然技術評估模型參數(shù)。使用對應于“臨床益處”變量(XI)的參數(shù)評估具有臨床益處的患者組和無臨床益處的患者組之間的表達水平的差異。表2線性模型中包括的變量的描述。<table>tableseeoriginaldocumentpage11</column></row><table>對于每個探針組i,統(tǒng)計學測試的目的是為了否定這樣的假說,即具有臨床益處的患者和無臨床益處的患者中平均表達水平相等,其中考慮了表2中列出的其他調節(jié)相關變量。在形式上,等同性的虛假設針對兩面性選擇對象來測試。相應的P值報告在表3中。線性模型的選擇由兩個原因促成。第一,線性建模是通用的、充分表征和有效的方法,其容許在評價目的變量作用時調節(jié)混同的變量。第二,假定樣品尺寸102,和數(shù)據(jù)組的標準化和定比例,正態(tài)分布假設是合理的和正當?shù)摹τ诿總€探針組,方差的同質性假定利用基于模型剩余(modelresiduals)的Fligner-Killeen檢驗來評價。該分析由以下三步組成1.測試每個分類變量以獲得剩余方差的同質性2.注意具有最小p值的變量V3.如果最小p值小于0.001,則重擬合該模型,以容許不同水平的變量V具有不同的方差。步驟5:有效性有效性分析的目的是降低分析的結果可能是人為的和解釋統(tǒng)計學分析的預處理步驟或假設的結果的風險??紤]了以下三方面a)在質量控制步驟中包含或排除少量額外的芯片;b)預處理和標準化運算法則;c)統(tǒng)計學假設和測試方法。將這一系列候選標記物定義為使用不同分析設置始終顯示出顯著性的基因子集。不同的應用分析選擇如下a)基于更嚴格的質量控制標準識別另外8個芯片的子集。通過排除這8個芯片定義“減少的數(shù)據(jù)組”。b)將MAS5確定為用于預處理和標準化的rma的備選方案。MAS5使用不同的方法進行背景評價、探針總計和標準化。c)使用2種另外的統(tǒng)計學檢驗。a.關于臨床和無臨床益處之間的區(qū)別的wilcoxon檢驗和b.對邏輯回歸模型進行測試的似然比值測定(LRT),在所述模型中臨床益處被認為是反應變量和基因表達被認為是相關變量。這兩種另外的檢驗依賴解釋統(tǒng)計學假設的不同組。對于每個探針組,LRT遵從具有一個自由度的卡方??傊?,考慮了兩組樣品(“全”數(shù)據(jù)組和“減少的”數(shù)據(jù)組)和2種預處理運算法則(mas5和rma);這導致四個不同的分析數(shù)據(jù)組。對于這四個數(shù)據(jù)組中的每一個,應用三種不同的統(tǒng)計學檢驗。因此,對于每個探針組,計算三個P值。在每個分析數(shù)據(jù)組中,應用組合標準確定受到差異調節(jié)的基因系列。該組合標準定義為最大P值小于0.05且最小p值小于0.001。利用用于鑒定標記物基因的標準1的有效性分析產生作為關于EGFR抑制劑治療的預測性標記物的STCH。表3在應用組合標準后基于有效性分析的臨床益處基因標記物。欄1是探針組的Affymetrix識別物。欄2是相應基因序列的GenBank登記號。欄3是相應的正式基因名稱。欄4是臨床和無臨床益處患者之間表達水平的相應調節(jié)的平均倍數(shù)變化,如由線性模型評估地。欄5是用于檢驗如源自線性模型的臨床益處和無臨床益處患者之間表達水平差異的P值。欄6是關于受調節(jié)的表達水平平均倍數(shù)變化的95%可靠區(qū)間。<table>tableseeoriginaldocumentpage13</column></row><table>講一步統(tǒng)計學分析對于選擇的候選標記物PTPRF,由獨立的統(tǒng)計人員,在生效環(huán)境中進行以下另外的分析關于來自初步Affymetrix分析的PFS(無進展存活)的單變量Cox回歸,關于來自初步Affymetrix分析的臨床益處的單變量邏輯回歸,和關于來自初步Affymetrix分析的存活的單變量Cox回歸。將這些分析的結果顯示在下文中。它們與初步分析的結果相一致并確認所選標記物的選擇。結果關于來自初步Affymetrix分析的PFS(無進展存活)的單變量Cox回歸基因患者數(shù)目風險比風險比的P-值95%CISTCH1021.631.23;2.150.0006結果關于來自初步Affymetrix分析的臨床益處的單變量Cox回歸基因患者數(shù)目比值比比值比的p-值95%CISTCH1020.170.04;0.650.0096結果關于來自初步Affymetrix分析的存活的單變量Cox回歸基因患者數(shù)目風險比風險比的p-值95%CISTCH1021.471.09;1.980.0105qRT-PCR利用用于qRT-PCR的SuperScriptIII第一鏈合成高效混合物(SuperMix)(Invitrogen,CA,美國),按照制造商的說明書但在不包含RNA酶H消化的條件下,合成cDNA。定量PCR利用TaqMan基因表達測定法,在ABIprism7900HT序列檢測系統(tǒng)上,按照制造商的建議(AppliedBi0SyStemS(應用生物系統(tǒng)),CA,美國)進行。所有測定一式三份地進行。所用的引物和探針跨過外顯子邊界或在AffymetrixGeneehip目的探針序列內。包括2個持家基因作為內源對照0-2-微球蛋白(B2M;測定Hs99999907_ml)和次黃嘌呤磷酸核糖轉移酶(HPRT;測定Hs99999909_ml)。所有運行包括校正樣品(MVP,來自人成年肺的總RNA;Stratagene,CA,美國)和標準曲線。使用通用人參照總RNA(Stratagene,CA,美國)作為PTPRF標準曲線的模板。將全部樣品一式三份地測量。利用-ACt法進行相對量化。結果如以前報告地,對本研究中包括的102名患者確定AffymetrixGenechip基因表達模式。在這些患者中,對75名獲得qRT-PCR結果(表4)。具有qRT_PCR結果的患者的人口統(tǒng)計和臨床特征類似于整個群體(n=264)和具有可獲得的Genechip基因表達模式的患者的那些。表4基線特征具有qRT-PCR分析的患者(n=75)<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>在75名具有qRT-PCR結果的患者中,4(5%)具有部分反應(PR),23(31%)具有SD,39(52%)具有PD,且9(12%)不可評估。這些結果非常類似于在整個研究群體(n=264)中觀察到的那些。圖3顯示個體患者中STCH的相對mRNA水平,如通過AffymetrixGenechip模式和qRT-PCR評估地。圖3a顯示表達水平對比Genechip模式的臨床結果,且圖3b顯示對qRT-PCR的表達水平。在關于STCHmRNA轉錄物的Genechip和qRT-PCR測量之間存在良好相關性(圖3c;pearson,s(皮爾森)p=0.76,p<0.01)。如使用Genechip模式觀察地,利用qRT-PCR評估的STCHmRNA水平顯示與對厄洛替尼的反應,與在反應者中觀察到的與不反應者相比更高的水平相關。討論通過利用高密度寡核苷酸微陣列技術分析組織樣品,和對數(shù)據(jù)應用統(tǒng)計學模型,我們已經能夠鑒定其表達水平可以預測由使用厄洛替尼的治療獲得臨床益處的患者的基因。應用組合標準(定義如上)。其導致STCH作為關于EGFR抑制劑治療的預測性標記物。STCH,應激70蛋白蛋白伴侶,與微粒體有關并具有分子量60kDa。由該基因編碼的蛋白是熱激蛋白70家族的成員并發(fā)現(xiàn)與微粒體有關。該蛋白家族成員在加工胞質和分泌蛋白中,以及在除去變性的或錯誤折疊的蛋白中起作用。編碼的蛋白包含ATP酶結構域并已經顯示出與遍在蛋白樣蛋白相關。在日本患者中發(fā)現(xiàn)了與胃癌的聯(lián)系。在本研究中,發(fā)現(xiàn)STCH在由使用厄洛替尼的治療獲得臨床益處的患者中被下調。權利要求預測癌癥患者對使用EGFR抑制劑的治療的反應的體外方法,其包括確定患者腫瘤樣品中STCH基因的表達水平和對所述STCH基因表達水平和代表不由所述治療獲得臨床益處的患者群的腫瘤中STCH基因表達水平的值進行比較,其中所述患者的腫瘤樣品中STCH基因的較低表達水平指示將由所述治療獲得臨床益處的患者。2.權利要求1的方法,其中所述表達水平通過微陣列技術確定。3.權利要求1或2的方法,其中與代表不由所述治療獲得臨床益處的患者群的腫瘤中STCH基因表達水平的值相比,所述STCH基因在所述患者的腫瘤樣品中表現(xiàn)出1.1-1.8或更多倍的更低表達水平。4.權利要求1-3的方法,其中所述EGFR抑制劑是厄洛替尼。5.權利要求1-4的方法,其中所述癌癥是NSCLC。6.STCH基因用于預測癌癥患者對EGFR抑制劑治療的反應的用途。7.權利要求6的用途,其中所述癌癥是NSCLC。8.權利要求6或7的用途,其中所述EGFR抑制劑是厄洛替尼。9.治療通過權利要求1-5的方法鑒定的癌癥患者的方法,其包括將EGFR抑制劑施用于所述患者。10.權利要求9的方法,其中所述EGFR抑制劑是厄洛替尼。11.權利要求9或10的方法,其中所述癌癥是NSCLC。全文摘要本發(fā)明提供一種生物標記物,其預測癌癥患者中EGFR抑制劑治療的臨床益處。文檔編號C12Q1/68GK101802221SQ200880102973公開日2010年8月11日申請日期2008年8月7日優(yōu)先權日2007年8月14日發(fā)明者保羅·德爾馬,帕特里夏·麥克洛克林,芭芭拉·克盧格哈默,韋雷娜·盧策申請人:霍夫曼-拉羅奇有限公司