專利名稱:表皮生長因子受體基因啟動子的多態(tài)性的制作方法
背景技術(shù):
本發(fā)明要求2004年3月1日提交的美國臨時專利申請系列號60/549,069的優(yōu)先權(quán),此專利內(nèi)容納入本文作參考。由于在國立衛(wèi)生研究院基金號U01GM61393支持下,政府對本發(fā)明擁有權(quán)利。
1.發(fā)明領(lǐng)域本發(fā)明一般涉及分子生物學(xué)和腫瘤學(xué)領(lǐng)域。更具體說,本發(fā)明涉及表皮生長因子受體(EGFR)基因中與EGFR表達和活性相關(guān)的多態(tài)性。在某些實施方案中,本發(fā)明是關(guān)于涉及EGFR基因啟動子中影響EGFR表達的單核苷酸多態(tài)性(SNP)的組合物和方法。
2.相關(guān)技術(shù)描述人表皮生長因子受體(EGFR)在細胞增殖、分化和存活的信號傳導(dǎo)通路中起著重要作用。發(fā)現(xiàn)約30%的人原發(fā)腫瘤中EGFR有過度表達。在這些腫瘤中其活性似乎可通過提高細胞增殖、移動、粘附、入侵能力和阻斷凋亡而促進腫瘤生長(Tysnes等,1997)。EGFR過度表達和調(diào)節(jié)失常與病人預(yù)后差、腫瘤轉(zhuǎn)移、疾病晚期和對化療、激素療法及放療的抗藥性相關(guān)(Salomon等,1995;Akimoto等,1999;Wosikowski等,2000)。
EGFR的5’調(diào)控區(qū)長約4kb,覆蓋外顯子1的2kb上游和2kb下游。調(diào)控元件包括啟動子區(qū)和兩個分開的增強子區(qū)。EGFR啟動子和增強子的功能已研究得很清楚和見諸文獻(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988;Maekawa等,1989)。簡而言之,其啟動子中沒有發(fā)現(xiàn)TATA或CAAT盒。而有多個轉(zhuǎn)錄起始位點(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。已發(fā)現(xiàn)了許多順式和反式調(diào)節(jié)子。這些調(diào)節(jié)子包括EGF反應(yīng)性DNA結(jié)合蛋白(ERDBP-1)、p53、p63、Sp1、維生素D-反應(yīng)元件(VDRE)和雌激素反應(yīng)元件,它們反映了對EGFR調(diào)控認識的困惑。
脫氧核糖核酸酶I的足跡試驗顯示,Sp1能結(jié)合EGFR啟動子中的4個CCGCCC序列(-457至-440,-365至-286,-214至-200,和-110至-84),因而可能在基因調(diào)控中起著關(guān)鍵作用(Johnson等,1998)。Gebhardt及同事的研究(1999)證明EGFR內(nèi)含子1中(接近下游增強子)有14-21個重復(fù)性的似乎是調(diào)節(jié)EGFR表達的二核苷酸(CA)n重復(fù)序列多態(tài)性。含有21個重復(fù)序列的較長等位基因與較短的含16個重復(fù)序列的等位基因相比,顯示基因表達減少了80%(Gebhardt等,1999;Buerger等,2000)。關(guān)于多態(tài)性CA重復(fù)序列的研究資料提示該多態(tài)性位點對易患癌癥可能具有作用(Brandt等,2004)。
鑒于EGFR在腫瘤生物學(xué)中的重要性,近年來幾種以EGFR為靶標的癌癥治療藥物正在開發(fā)。EGFR靶向藥物的作用通常是抑制EGFR磷酸化或阻抑EGF結(jié)合。近年批準的治療轉(zhuǎn)移性非小細胞肺癌的一種藥物是吉非替尼。吉非替尼是一種選擇性EGFR-酪氨酸激酶抑制劑,能抑制EGF激活的EGFR自身磷酸化。
由于EGFR是許多抗癌藥物的直接靶標,EGFR的不同表達可能直接影響到藥物的反應(yīng)和毒性。因此,EGFR基因中與基因表達或活性相關(guān)的多態(tài)性對進一步了解細胞信號轉(zhuǎn)導(dǎo)和闡明藥物的反應(yīng)/毒性均很重要。EGFR基因多態(tài)性的研究也可用于進一步的藥物設(shè)計。
EGFR表達還與癌癥以外的疾病有關(guān)。例如,據(jù)報道EGFR微衛(wèi)星多態(tài)性與常染色體顯性多囊性腎病(ADPKD)的發(fā)展速度之間存在相關(guān)性(Magistroni等,2003)。已提出影響EGFR功能或表達的突變可能易患炎性大腸疾病(Martin等,2002)。因此,鑒定EGFR基因中與其表達或活性相關(guān)的多態(tài)性,對進一步了解各種EGFR失調(diào)相關(guān)疾病的進展將會很重要。
發(fā)明概述本發(fā)明公開了EGFR 5’調(diào)控區(qū)中的12個多態(tài)性位點。更具體說,本發(fā)明人證明了-216 G>T多態(tài)性與EGFR啟動子區(qū)的表達增加相關(guān)。鑒定與EGFR表達相關(guān)的多態(tài)性能為評價EGFR-靶向治療藥物的潛在效力和/或毒性,預(yù)測病人的臨床預(yù)后,和評價病人發(fā)生EGFR失調(diào)相關(guān)疾病的風(fēng)險提供新的方法和組合物。
本發(fā)明公開了EGFR基因座中位于以下核苷酸位置的多態(tài)性位點-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。EGFR基因座的核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是指它們相對于翻譯起點的位置,翻譯起點指定為+1。沒有指定為0的核苷酸位置。根據(jù)此命名法,緊靠+1 5’的核苷酸是-1,緊靠+1 3’的核苷酸是2。翻譯起始位點(+1)對應(yīng)于EGFR基因座的核苷酸9,385(GenBank登錄號AF288738,納入本文作為參考)和SEQ ID NO1的核苷酸505。SEQ ID NO1包含AF288738的核苷酸8,881-9,405。
本發(fā)明人發(fā)現(xiàn)的獨特多態(tài)性是-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。由于這些多態(tài)性位于EGFR基因的5’調(diào)控區(qū)中,它們可能與基因調(diào)控有關(guān)。
因此在一種實施方案中,本發(fā)明提供預(yù)測細胞中EGFR表達水平的方法,該方法包括確定細胞中一個或兩個EGFR基因上核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034中一個或多個的序列。因此可預(yù)測含有這種細胞的病人可能具有一般水平的EGFR表達。在一優(yōu)選實施方案中,該方法包括測定細胞中EGFR基因的一種或兩種等位基因。在一種或兩種等位基因的-216位存在T,表明表達水平較高?!氨磉_水平較高”是其表達水平比EGFR基因的兩個等位基因-216位為G的細胞表達水平更高。術(shù)語“測定”按其單純和普通的含義使用;指通過調(diào)查、推理或計算找出或作出決定。
本發(fā)明方法也可利用與位于EGFR基因座以下核苷酸位置上的多態(tài)性連鎖不平衡的多態(tài)性-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034?!斑B鎖不平衡”(本文使用的“LD”在本領(lǐng)域也稱為“LED”)按本領(lǐng)域技術(shù)人員所知的其單純和普通含義使用。LD指兩個基因座的等位基因(即某給定基因的變體形式)或多態(tài)性的特定組合比預(yù)計的更經(jīng)常出現(xiàn)的情況。關(guān)于連鎖不平衡,如本領(lǐng)域技術(shù)人員所測定,有顯著性用于指統(tǒng)計學(xué)的p或α值可為0.25或0.1,可為0.1、0.05、0.001、0.00001或更低??衫肊GFR單倍型與EGFR蛋白表達水平之間的相關(guān)性將其基因型(即生物體的基因組成)與表型(即生物體或細胞顯示的物理性狀)相關(guān)連?!皢伪缎汀卑幢绢I(lǐng)域技術(shù)人員所知的其單純和普通含義使用,指沿一條同源染色體分布的兩個或多個等位基因,或多態(tài)性的基因型。
可采用本領(lǐng)域技術(shù)人員已知的任何方法測定位于EGFR基因座以下核苷酸位置的序列或與EGFR基因座以下核苷酸位置的序列連鎖不平衡的序列-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034??芍苯踊蜷g接測定該序列。感興趣核苷酸位置的序列可用間接方法測定,例如通過測定與感興趣位置的特定核酸連鎖不平衡的位置上的核苷酸序列。測定特定核苷酸位置的序列的方法包括例如,雜交試驗、等位基因特異性擴增試驗、測序試驗、微量測序試驗、侵染性切割試驗和限制性酶試驗。在一具體實施方案中,采用限制性酶BseR1消化測定是否存在-216 G>T多態(tài)性。-216位含有T的等位基因可用BseR1切割,而-216位含有G的等位基因用此酶不可切割。
在其它實施方案中,本發(fā)明提供評價EGFR靶向治療藥物治療病人的EGFR失調(diào)相關(guān)疾病潛在效力的方法,包括測定該病人一種或兩種EGFR基因中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列。
EGFR失調(diào)相關(guān)疾病可以是與相當?shù)恼<毎啾龋珽GFR過度表達、低表達、表達時間不適當所致的疾病。EGFR調(diào)節(jié)不當相關(guān)疾病的例子包括癌癥、常染色體顯性多囊腎病和炎癥疾病如炎性腸病。
EGFR靶向治療藥物可以是能直接或間接調(diào)節(jié)EGFR活性的任何藥物。本領(lǐng)域已知的EGFR靶向治療藥物通常指抑制EGFR磷酸化或阻抑EGF結(jié)合的藥物。兩種已得到FDA批準的EGFR靶向治療藥物為Iressa(吉非替尼)和Erbitux(西妥昔單抗)。另一種EGFR靶向治療藥物,Tarceva(埃羅替尼)正在III期臨床試驗中。Iressa和Tarceva是小分子,而Erbitux是單克隆抗體。其它EGFR靶向藥物通過調(diào)節(jié)其轉(zhuǎn)錄調(diào)節(jié)EGFR活性。例如,用EGF、地塞米松、甲狀腺素、視黃酸、干擾素α或野生型p53處理細胞來直接或間接刺激EGFR mRNA產(chǎn)生。
在某些方面,本發(fā)明提供評價EGFR靶向治療藥物治療病人癌癥的潛在效力的方法,包括測定該病人一種或兩種EGFR基因中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列。在某些實施方案中,EGFR靶向治療藥物是吉非替尼(gefitinib)、埃羅替尼(erlotinib)或西妥昔單抗(cetuximab)。在一優(yōu)選方式中,測定-216位的序列。在某些實施方案中,病人的EGFR基因的一種或兩種等位基因在-216位含有T時,表明該病人用EGFR靶向治療藥物的療效與二等位基因-216位含有G的病人相比會降低。
在某些實施方案中,本發(fā)明的方法還包括獲得樣品。樣品可以是含有可測定其基因組DNA中一種或兩種EGFR基因核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列的樣品??赏ㄟ^,例如活檢、靜脈穿刺、抽吸或擦拭獲得這種樣品。該樣品可獲自任何組織或體液。在某些實施方案中,樣品可含有口腔細胞、單核細胞或癌細胞。
在某些方面,本發(fā)明的方法還包括給予病人EGFR靶向治療藥物。
在其它實施方案中,本發(fā)明提供預(yù)測患EGFR失調(diào)相關(guān)疾病病人臨床預(yù)后的方法,該方法包括測定該病人一種或兩種EGFR基因中一個或多個以下核苷酸位置的序列或與一個或多個以下核苷酸位置連鎖不平衡的序列-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。在某些實施方案中,多態(tài)性是-216 G>T。某等位基因-216位存在T,表明EGFR蛋白表達升高。在某些方面,EGFR蛋白表達升高預(yù)示預(yù)后不良。在某些實施方案中,EGFR失調(diào)相關(guān)疾病是癌癥。對癌癥病人而言,預(yù)后不良表示,例如對化療、激素療法或放療的抗藥性提高。預(yù)后不良也表示轉(zhuǎn)移風(fēng)險升高或生存時間減少。
在一實施方案中,本發(fā)明提供評價EGFR靶向治療藥物對病人毒性風(fēng)險的方法,包括測定該病人一種或兩種EGFR基因的一個或多個核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多態(tài)性。在一方面,所述多態(tài)性是-216 G>T。在一實施方案中,一種或兩種等位基因的-216位存在T,表明EGFR靶向治療藥物的毒性低。
在其它實施方案中,本發(fā)明提供評價病人發(fā)生癌癥風(fēng)險的方法,包括測定該病人一種或兩種EGFR基因的一個或多個核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多態(tài)性。在一實施方案中,所述多態(tài)性是-216 G>T。
在本發(fā)明的某些方面,所示方法還包括采集病人的病史,以確定該病人是否處在發(fā)生癌癥的風(fēng)險中,或是否需要EGFR靶向治療藥物。
本發(fā)明還提供試劑盒。一實施方案中,本發(fā)明提供了檢測核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034中一個或多個上的多態(tài)性的試劑盒。在某些實施方案中,該試劑盒裝有能檢測所述多態(tài)性存在的核酸。所述核酸是引物或探針。在某些實施方案中,所示探針包含在寡核苷酸陣列或微陣列中。在其它實施方案中,該試劑盒裝有用于測定是否存在多態(tài)性的限制性酶。在某些實施方案中,該試劑盒裝有核酸酶和限制性酶二者??蓪φ蘸怂嵫b入此試劑盒中。
在某些實施方案中,該試劑盒的核酸包含SEQ ID NO2的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、200、300、400、500或更多個連續(xù)核苷酸。
在某些方面,本發(fā)明提供了評價EGFR靶向治療藥物在病人中的潛在效力的試劑盒,該試劑盒裝有用于測定EGFR基因座中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034上是否存在多態(tài)性的核酸。在其它方面,本發(fā)明提供評價EGFR靶向治療藥物在某病人中潛在效力的試劑盒,該試劑盒裝有用于測定EGFR基因座中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多態(tài)性的限制性酶。
考慮可采用本文所述的任何一種方法或組合物來實施本文所述的其它方法或組合物。
權(quán)利要求書中所用的術(shù)語“或”用于指“和/或”,除非清楚地表明只指另一些,或另一些相互排斥,雖然該揭示支持的定義只指另一些和“和/或”。
此申請書中,術(shù)語“大約”表示一種數(shù)值,包括測定該值所用儀器或方法產(chǎn)生的標準差。
按常務(wù)專利法,詞語“一種”當在權(quán)利要求書或說明書中與詞“包括”聯(lián)用時,指一種或多種,除非另有專門示出。
本發(fā)明的其它目的、特征和優(yōu)點將通過以下描述變得更為清晰。然而應(yīng)理解以下詳述和具體實施例雖然表明了本發(fā)明的具體實施方案,但只是為了闡明本發(fā)明,因為本領(lǐng)域技術(shù)人員知道根據(jù)這種詳述作出的各種變化和修飾都屬于本發(fā)明的思路和范圍內(nèi)。
附圖簡述以下附圖組成了本說明書的一部分,包括這些附圖以進一步顯示本發(fā)明的某些方面內(nèi)容。通過參見一幅或多幅這些附圖,結(jié)合本文提供的詳述和具體實施可更好地理解本發(fā)明。
圖1圖1是EGFR基因座圖。伸展的EGFR調(diào)控區(qū)顯示有啟動子、增強子和外顯子1。如箭頭所指顯示該調(diào)控區(qū)中的12個核苷酸多態(tài)性位置。
圖2圖2顯示EGFR啟動子區(qū)的核苷酸序列。該核苷酸序列從-505至+21,其中+1為翻譯起始密碼子的第一個核苷酸,沒有0位核苷酸。也示出了-216 G>T多態(tài)性、-191 C>A多態(tài)性、Sp1結(jié)合位點、轉(zhuǎn)錄起始位點、ScaI切割位點的位置以及正向引物的位置。
圖3圖3顯示構(gòu)建用于熒光素酶活性試驗的載體圖。EGFR啟動子的405bpKpnI-ScaI片段克隆在到熒光素酶基因上游的多克隆位點中。也示出了用于測定這些克隆片段序列的引物RVP3和GLP2的位置。
圖4圖4顯示在采用熒光素酶報告構(gòu)建物的瞬時轉(zhuǎn)染試驗中,EGFR多態(tài)性-216 G>T和-191 C>A的4個單倍型的表達活性。熒光素酶基因的有關(guān)表達已用PRL-TK載體中的renilla基因水平標準化。
圖5圖5顯示測定核蛋白與-216G和-216T等位基因結(jié)合效力的電泳遷移試驗(EMSA)。采用SpI共有序列探針作為對照。EMSA中所用的探針和競爭序列見表4所列。觀察到與-216G等位基因(泳道1)相比,-216T等位基因(泳道3)的結(jié)合效力高得多。
圖6A-B在MDA-MB-231、MCF-7、HEK-293和SL-2細胞中瞬時轉(zhuǎn)染pG3EGFRluc(*1至*4)。對于人細胞系,用160ng pRL-TK載體共轉(zhuǎn)染1.6μgpGL3EGFRluc。對于SL-2細胞,用100ng pPac-SpI載體共轉(zhuǎn)染300ng pGL3EGFRluc,將200光單位的熒光素酶活性相對表達量按每微克總蛋白/ml設(shè)定為1。-216G/T-191C/A的G-C和T-C單倍型之間啟動子活性有顯著差異(所有p值小于0.04)。數(shù)據(jù)以平均值±標準差表示。MDA-MB-231、MCF-7、和HEK-293細胞系中的EGFR相對表達量,和-216G/T與-191C/A多態(tài)性的相應(yīng)基因型見圖B。將EGFRmRNA水平按1000拷貝的β肌動蛋白基因標準化。實驗重復(fù)三次數(shù)據(jù)以平均值±標準差表示。
闡述性實施方案的描述A.表皮生長因子受體人表皮生長因子受體(EGFR)是一種跨膜蛋白。其配體如表皮生長因子和TGF-α與其胞外表面的N-末端結(jié)合誘導(dǎo)了二聚體化和激活了其胞內(nèi)功能域的酪氨酸激酶活性。EGFR活化導(dǎo)致細胞級聯(lián)反應(yīng),最終導(dǎo)致DNA合成和細胞增殖、成熟、存活和凋亡。
EGFR的表達主要在轉(zhuǎn)錄水平上受到調(diào)節(jié)(Xu等,1984)。業(yè)已證明,用EGF、地塞米松、甲狀腺素、視黃酸、干擾素α或野生型p53處理可直接或間接激活EGFRmRNA的產(chǎn)生(Deb等,1994;Grandis等,1996;Hudson等,1989;Subler等,1994;Xu等,1993)。
EGFR的5’調(diào)控區(qū)長約4kb,覆蓋外顯子1的2kb上游和2kb下游。調(diào)控元件包括啟動子區(qū)和兩個分開的增強子區(qū)。EGFR啟動子和增強子的功能已研究得很清楚和見諸文獻(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988;Maekawa等,1989,各自納入作為參考)。簡而言之,其啟動子中沒有發(fā)現(xiàn)TATA或CAAT盒。而有多個轉(zhuǎn)錄起始位點(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。已發(fā)現(xiàn)了許多順式和反式調(diào)節(jié)子。這些調(diào)節(jié)子包括EGF反應(yīng)性DNA結(jié)合蛋白(ERDBP-1)、p53、p63、Sp1、維生素D-反應(yīng)元件(VDRE)和雌激素反應(yīng)元件,它們反映了對EGFR調(diào)控認識的困惑。
脫氧核糖核酸酶I的足跡試驗顯示,Sp1能結(jié)合EGFR啟動子中的4個CCGCCC序列(-457至-440,-365至-286,-214至-200,和-110至-84),因而可能在基因調(diào)控中趁著關(guān)鍵作用(Johnson等,1998)。Gebhardt及同事的研究(1999)證明EGFR內(nèi)含子1中(靠近下游增強子)有14-21個重復(fù)性的似乎是調(diào)節(jié)EGFR表達的二核苷酸(CA)n重復(fù)序列多態(tài)性。含有21個重復(fù)序列的較長等位基因與較短的含16個重復(fù)序列的等位基因相比,顯示基因表達減少了80%(Gebhardt等,1999;Buerger等,2000)。關(guān)于多態(tài)性CA重復(fù)序列的研究資料提示該多態(tài)性位點對易患癌癥可能具有作用(Brandt等,2004)。
發(fā)現(xiàn)約30%的人原發(fā)腫瘤中EGFR有過度表達。在這些腫瘤中其活性似乎可通過提高細胞增殖、移動、粘附、入侵能力和阻斷凋亡而促進腫瘤生長(Tysnes等,1997)。EGFR過度表達和調(diào)節(jié)失常與病人預(yù)后差、腫瘤轉(zhuǎn)移、疾病晚期和對化療、激素療法及放療的抗性相關(guān)(Salomon等,1995;Akimoto等,1999;Wosikowski等,2000)。
根據(jù)EGFR過度表達與某些癌癥有關(guān)似乎其促進了腫瘤生長的觀察,鑒定EGFR基因中與基因表達相關(guān)的多態(tài)性,對預(yù)測個體發(fā)生癌癥的風(fēng)險和預(yù)測癌癥病人的預(yù)后可能很重要。此外,也可利用EGFR表達相關(guān)的多態(tài)性來評價EGFR靶向治療藥物的毒性、劑量和潛在效力。
幾種EGFR靶向治療藥物目前正在開發(fā)中。EGFR靶向治療藥物通常指抑制EGFR磷酸化或阻抑EGF結(jié)合的藥物。兩種已得到批準的EGFR靶向治療藥物為Iressa(吉非替尼)和Erbitux(西妥昔單抗),Tarceva(埃羅替尼)正在III期臨床試驗中。由于EGFR是許多抗癌藥物的直接靶標,EGFR的不同表達可能直接影響到藥物的反應(yīng)和毒性。因此,EGFR基因中與基因表達或活性相關(guān)的多態(tài)性對進一步了解細胞信號轉(zhuǎn)導(dǎo)和闡明藥物的反應(yīng)/毒性二者均很重要。EGFR基因多態(tài)性的研究也可用于進一步的藥物設(shè)計。
EGFR表達還與癌癥以外的疾病有關(guān)。EGFR是腎小管增生中的關(guān)鍵因素。近年來,據(jù)報道EGFR微衛(wèi)星多態(tài)性與常染色體顯性多囊性腎病(ADPKD)的發(fā)展速度之間存在相關(guān)性(Magistroni等,2003)。也已證明用特異性酪氨酸激酶抑制劑(EKI-785)抑制EGFR,可減緩ADPKD小鼠模型的疾病發(fā)展(Sweeney等,1999)。
人EGFR作圖位于染色體7p12中,該區(qū)域與炎性腸病連鎖(Satsangi等,1996)。此外,已在結(jié)腸炎動物模型中EGFR免疫反應(yīng)性的顯著升高(Reinshagen等,1993)。已提出影響EGFR功能或表達的突變可能易患炎性大腸疾病(Martin等,2002)。
鑒于EGFR在調(diào)節(jié)細胞增殖中的重要性,EGFR基因中與其表達或活性相關(guān)的多態(tài)性對進一步了解EGFR失調(diào)相關(guān)疾病的發(fā)展很重要。本發(fā)明在EGFR基因的5’調(diào)節(jié)區(qū)中鑒定到12種多態(tài)性1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034 G>A。根據(jù)它們的位置與翻譯起始位點的關(guān)系鑒定這些多態(tài)性,翻譯起點指定為+1。根據(jù)此命名法,緊靠+1 5’的核苷酸是-1,緊靠+1 3’的核苷酸是2。翻譯起始位點(+1)對應(yīng)于EGFR基因座的核苷酸9,385(GenBank登錄號AF288738)和SEQ ID NO1的核苷酸505。SEQ ID NO1包含AF288738的核苷酸8,881-9,405。
一種SNP,-1249 G>A在上游增強子中,而-216 G>T和-191 C>A在啟動子區(qū)中。令人感興趣的是,-216 G>T位于Sp1結(jié)合位點,T置換G可改變Sp1結(jié)合。-191 C>A靠近轉(zhuǎn)錄起始位點。因此,這些SNP可能對EGFR轉(zhuǎn)錄有顯著影響。
B.核酸本發(fā)明某些實施方案涉及各種核酸,包括啟動子、擴增引物、寡核苷酸探針和涉及基因組DNA分析用的其它核酸元件。在某些方面,核酸包括野生型、突變或多態(tài)性核酸。
術(shù)語“核酸”是本領(lǐng)域熟知的。本文中“核酸”一般用于指DNA、RNA分子(即鏈)或其衍生物或同類物,包括核苷堿基。核苷堿基包括,例如DNA中發(fā)現(xiàn)的天然產(chǎn)生的嘌呤或嘧啶堿基(如腺嘌呤“A”,鳥嘌呤“G”,胸腺嘧啶“T”或胞嘧啶“C”)或RNA中的堿基(如A,G,尿嘧啶“U”或C)。術(shù)語“核酸”包括“寡核苷酸”和“多核苷酸”,它們是術(shù)語“核酸”的亞屬。術(shù)語“寡核苷酸”指長約3-100個核苷堿基的分子。術(shù)語“多核苷酸”指長度至少大于100個核苷堿基的分子?!盎颉敝富虍a(chǎn)物的編碼序列,以及該基因產(chǎn)物的內(nèi)含子和啟動子。除EGFR基因外,認為其它調(diào)控區(qū)如EGFR的啟動子和增強子也是本發(fā)明權(quán)利要求所述組合物和方法要用的核酸。
這些定義通常指單鏈分子,但在具體實施方案中也包括與該單鏈分子部分、基本上或完全互補的其它鏈。因此,核酸可包括雙鏈分子或三鏈分子,它們含有與某分子特定序列互補的一條或多條鏈或“互補物”。如本文所用,單鏈核酸可用前綴“ss”表示,雙鏈核酸可用前綴“ds”表示,三鏈核酸用前綴“ts”表示。
術(shù)語“基因”指涉及產(chǎn)生多肽鏈的DNA區(qū)段;它包括編碼區(qū)之前和之后的區(qū)域,及各編碼區(qū)段(外顯子)之間的間插序列(內(nèi)含子)。“啟動子”是核酸序列中控制轉(zhuǎn)錄起始和速度的區(qū)域。啟動子可包含能結(jié)合例如RNA聚合酶和其它轉(zhuǎn)錄因子以啟動核酸序列特異性轉(zhuǎn)錄的調(diào)節(jié)性蛋白質(zhì)和分子的元件。術(shù)語“增強子”指涉及核酸序列轉(zhuǎn)錄活性的順式作用調(diào)節(jié)序列。增強子可按兩種取向之一發(fā)揮功能,可位于啟動子上游或下游。
1.核酸的制備核酸可按本領(lǐng)域普通技術(shù)人員已知的技術(shù),如化學(xué)合成、酶促產(chǎn)生或生物學(xué)方法產(chǎn)生來制備。合成核酸(如合成寡核苷酸)的非限制性例子包括用磷酸三酯、亞磷酸酯或亞磷酰胺化學(xué)試劑和歐洲專利266,032(納入本文作參考)所述的固相技術(shù),或通過Froehler等,1986和美國專利5,705,629(納入本文作參考)中所述的脫氧核苷H-膦酸酯中間物體外化學(xué)合成來制備核酸。在本發(fā)明的方法中,采用一種或多種寡核苷酸。在例如美國專利4,659,774;4,816,571;5,141,813;5,264,566;4,959,463;5,428,148;5,554,744;5,574,146;5,602,244中披露了寡核苷酸合成的各種不同機制,其各自內(nèi)容納入本文作參考。
酶促產(chǎn)生核酸的非限制性例子包括在擴增反應(yīng),如PCRTM(見例如美國專利4,683,202和4,682,195,各納入本文作參考)或美國專利5,645,897(納入本文作參考)中所述的寡核苷酸合成方法中產(chǎn)生核酸。生物學(xué)方法產(chǎn)生核酸的非限制性例子包括在活細胞中產(chǎn)生重組核酸(即復(fù)制),例如在細菌中復(fù)制重組DNA載體(見例如Sambrook等,2001,納入本文作參考)。
2.核酸的純化核酸可用聚丙烯酰胺凝膠、氯化銫梯度離心、層析柱或本領(lǐng)域普通技術(shù)人員已知的其它方法純化(見例如Sambrook等,2001,納入本文作參考)。
在某些方面,本發(fā)明涉及的核酸是分離的核酸。如本文所用,術(shù)語“分離的核酸”指經(jīng)過分離不含有一種或多種細胞其它成分,或沒有大量總基因組和轉(zhuǎn)錄核酸的核酸分子。在某些實施方案中,“分離的核酸”指經(jīng)過分離不含有其它細胞組分或體外反應(yīng)組分,如脂質(zhì)或蛋白質(zhì)大分子、小的生物分子等的核酸。
3.核酸區(qū)段在某些實施方案中,所述核酸是核酸區(qū)段。如本文所用,術(shù)語“核酸區(qū)段”是核酸的片段,非限制性例子如只編碼EGFR基因序列部分的核酸。因此,“核酸區(qū)段”可包含某基因序列的任何部分,包括約2個核苷酸至全長基因,包括調(diào)控區(qū)至聚腺苷酸信號,和任何長度,包括所有的編碼區(qū)。
可根據(jù)某特定核酸序列設(shè)計各種核酸區(qū)段,可以是任何長度。通過給某序列按排序號,例如第1個殘基為1,第兩個殘基為2等等;可產(chǎn)生定義所有核酸區(qū)段的算法n至n+y其中,n是該序列1至最后編號之間的一個整數(shù),y是核酸區(qū)段減1的長度,n+y不超過該序列的最后編號。因此,對于10聚體,核酸區(qū)段對應(yīng)于堿基1-10、2-11、3-12等等。對于15聚體,核酸區(qū)段對應(yīng)于堿基1-15、2-16、3-17等等。對于20聚體,核酸區(qū)段對應(yīng)于堿基1-20、2-21、3-22等等。在某些實施方案中,所述核酸區(qū)段可以是探針或引物。“探針”本文一般用于指在檢測方法或組合物中所用的核酸?!耙铩北疚囊话阒秆由旎驍U增方法或組合物中所用的核酸。
4.核酸互補物本發(fā)明也包括與核酸互補的核酸。核酸“互補物”或“與另一核酸互補”指其堿基能與另一核酸按標準的Watson-Crick、Hoogsteen或反向Hoogsteen結(jié)合互補規(guī)律配對。另一核酸本文用于指不同的分子,或與同一分子部分不同的序列。在優(yōu)選實施方案中,互補物是用于檢測核酸多態(tài)性的雜交探針或擴增引物。
術(shù)語“互補的”或“互補物”本文也用于指即使在不是所有的核苷堿基都與對應(yīng)核苷堿基配對時也能與另一核酸鏈或雙鏈體雜交的連續(xù)核苷堿基或半連續(xù)核苷堿基(如該分子中不存在一個或多個核苷堿基)序列組成的核酸。然而,在某些診斷或檢測實施方案中,優(yōu)選完全互補的核酸。
C.核酸檢測本發(fā)明的某些實施方案涉及鑒定EGFR中的多態(tài)性、相關(guān)基因型或單倍型與表型,其中,所述基因型是EGFR活性或表達降低的或改變的表型,然后鑒定已給予或?qū)⒔o予EGFR靶向治療藥物或化合物的病人的多態(tài)性。因此,本發(fā)明涉及鑒定多態(tài)性的多種試驗和其它核酸檢測方法。因此核酸的用途是在涉及核酸雜交的實施方案中用作探針或引物。它們可用于本發(fā)明的診斷或篩選方法。檢測編碼EGFR的核酸及參與EGFR多肽或轉(zhuǎn)錄物表達或穩(wěn)定性的核酸也包括在本發(fā)明中。以下提供核酸檢測的通用方法,通過以下具體實施例來檢測多態(tài)性,包括單核苷酸多態(tài)性(SNP)。
1.雜交采用的探針或引物在3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100個核苷酸之間,優(yōu)選長17-100個核苷酸,或在本發(fā)明某些方面,長達1-2kb堿基可更長,以使穩(wěn)定地和選擇性地形成雙鏈體分子。通常優(yōu)選長20個堿基的連續(xù)的互補序列來提高所得雜交分子的穩(wěn)定性和選擇性。通常宜設(shè)計用于雜交的含有20-30個核苷酸,若需要甚至更長的一種或多種互補序列的核酸分子??赏ㄟ^,例如用化學(xué)方法直接合成片段,或在重組載體中導(dǎo)入選擇的序列來重組產(chǎn)生而不難制備這種片段。
在某些實施方案中,所述探針或引物含有SEQ ID NO1的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100個連續(xù)核苷酸。在某些實施方案中,所述探針或引物含有SEQ ID NO2的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100個連續(xù)核苷酸。
因此,可利用本發(fā)明的核苷酸序列與DNA和/或RNA的互補延伸段選擇性形成雙鏈體分子,或提供用于擴增DNA或RNA的引物。取決于應(yīng)用,可能需要采用不同雜交條件來獲得所述探針或引物對靶序列的不同程度選擇性。
對于需要高度選擇性的應(yīng)用,通常需要采用較高嚴謹性條件來形成雜交。例如,較低的鹽濃度和/或較高溫度條件,如約0.02M-0.10M NaCl,溫度約50-70℃。如果探針或引物與模板或靶鏈之間有任何錯配,對這種高嚴謹條件耐受受差,特別適合分離特定基因或檢測特定多態(tài)性。一般可理解通過加入增加量的甲酰胺可賦予雜交條件更高的嚴謹性。例如,在高嚴謹性條件下,與濾膜結(jié)合的DNA雜交可在65℃在0.5M NaHPO4,7%十二烷基硫酸鈉(SDS),1mM EDTA中進行,及68℃用0.1xSSC/0.1%SDS洗滌(Ausubel等,1996)。
提高鹽濃度和/或降低溫度可賦予嚴謹性較低的條件。例如,采用約0.1-0.25MNaCl和約37-55℃溫度可提供中等嚴謹條件,而約0.15-0.9M的鹽和約20-55℃溫度可提供低嚴謹條件。在低嚴謹條件下,如溫和的嚴謹條件下,可用0.2xSSC/0.1%SDS和42℃進行洗滌(Ausubel等,1996)。根據(jù)所需結(jié)果不難操縱雜交條件。
在其它實施方案中,雜交是在例如50mM Tris-HCl(pH8.3),75mM KCl,3mMMgCl2,1.0mM二硫蘇糖醇和溫度約20-37℃的條件下完成的。采用的其它雜交條件可包括約10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,溫度約40-72℃。
在某些實施方案中,優(yōu)選采用本發(fā)明定義的核酸序列與適當?shù)姆椒ǎ鐦擞?,?lián)用以測定雜交。各種各樣的適當指示物是本領(lǐng)域已知的,包括熒光、放射活性標記、酶標記或能補檢測的其它配體,如親和素/生物素。在優(yōu)選實施方案中,可能需要采用熒光標記或酶標記,如脲酶、堿性磷酸酶或過氧化物酶,而不是放射活性標記或其它對環(huán)境不利的試劑。就酶標記而言,可采用已知能顯色的底物來提供可觀察的或用分光光度法可檢測的檢測物質(zhì),來鑒定與含有互補核酸樣品的特異性雜交。在其它方面,可提供特定的核酸酶切割位點,通過是否存在切割的核酸來檢測特定的核苷酸序列。
一般而言,本文所述探針或引物在雜交溶液中例如在PCRTM中以及在固相實施方案中,將用作試劑,來檢測相應(yīng)基因的表達或基因型。在涉及固相的實施方案中,測試的DNA(或RNA)吸附于或結(jié)合于選擇的基質(zhì)或表面上。然后使這種固定的單鏈核酸與所選的探針在所需條件下雜交。條件的選擇取決于具體環(huán)境(如取決于G+C含量、靶核酸的類型。核酸的來源、雜交探針的大小等)。具體應(yīng)用時的最佳雜交條件是本領(lǐng)域技術(shù)人員熟知的。洗滌雜交分子除去非特異性結(jié)合探針分子后,通過測定結(jié)合的標記物量來檢測和/或定量測定雜交。代表性的固相雜交方法見美國專利5,843,663;5,900,481和5,919,626中所述。實施本發(fā)明可采用的其它雜交方法見美國專利5,849,481;5,849,486和5,851,772。本說明書此章節(jié)中引用的這些和其它參考文獻的有關(guān)部分內(nèi)容納入本文作參考。
2.核酸擴增可按照標準方法從細胞、組織或其它樣品中分離得到用作擴增模板的核酸(Sambrook等,2001)。在某些實施方案中,用或不用基本純的模板核酸對全細胞或組織均漿或生物液體樣品進行分析。所述核酸可以是基因組DNA或片段化的或全細胞RNA。當采用RNA時,可能需要先將RNA轉(zhuǎn)變?yōu)榛パa的DNA。
術(shù)語“引物”本文用于指包含的核酸,其能以模板依賴方式引導(dǎo)新生核酸的合成。通常引物是長10-12個和/或30個堿基對的寡核苷酸,但可采用更長的序列。可提供雙鏈和/或單鏈形式的引物,雖然優(yōu)選單鏈形式。
在允許選擇性雜交的條件下,使設(shè)計的能與EGFR基因座相應(yīng)核酸(Genbank登錄號AF288738)或其變體和片段選擇性雜交的引物對與模板核酸接觸。SEQ ID NO1包括EGFR基因座的核苷酸8,881-9,405,SEQ ID NO1的核苷酸505對應(yīng)于EGFR基因的翻譯起始位點,因此該翻譯起始位點位于AF288738的核苷酸9,385處。取決于所需的應(yīng)用,可選擇高嚴謹性雜交條件使其只與引物完全互補的序列雜交。在其它實施方案中,可降低嚴謹性進行雜交,以擴增含有與引物序列一個或多個錯配(堿基)的核酸。一旦雜交后,使模板-引物復(fù)合物與一種或多種酶接觸以促進模板依賴性核酸的合成??蛇M行多輪擴增,也稱為“循環(huán)”直到產(chǎn)生了足夠量的擴增產(chǎn)物。
可檢測、分析或定量測定擴增產(chǎn)物。在某些應(yīng)用中,可通過肉眼觀察檢測。在某些應(yīng)用中,檢測可包括通過化學(xué)發(fā)光法、摻入了放射標記或熒光標記的放射活性閃爍圖象法、或甚至采用電子和/或溫度脈沖信號的系統(tǒng)(Affymax technology;Bellus,1994),間接鑒定該產(chǎn)物。
可利用許多模板依賴方式來擴增某給定模板樣品中存在的該寡核苷酸序列。最佳的已知擴增方法之一是聚合酶鏈式反應(yīng)(稱為PCRTM),其詳述見美國專利4,683,195;4,683,202和4,800,159和Innis等,1988,各文獻內(nèi)容納入本文作參考。
另一種擴增方法是連接酶鏈式反應(yīng)(“LCR”),見歐洲專利申請No,320308,其內(nèi)容納入本文作參考。美國專利4,883,750描述了與LCR相似的方法,使探針對與靶序列結(jié)合。也可采用以PCRTM為基礎(chǔ)的方法和寡核苷酸連接酶試驗(OLA)(以下作進一步描述)見美國專利5,912,148。
可用于實施本發(fā)明擴增靶核酸序列的其它方法見美國專利5,843,650;5,846,709;5,846,783;5,849,546;5,849,497;5,849,547;5,858,652;5,866,366;5,916,776;5,922,574;5,928,905;5,928,906;5,932,451;5,935,825;5,939,291和5,942,391,英國專利申請2 202 328和PCT/US89/01025,各自內(nèi)容納入本文作參考。也可在本發(fā)明的擴增方法中采用PCT申請PCT/US87/00880中描述的Qβ復(fù)制酶。
也可在擴增本發(fā)明核酸中采用恒溫擴增方法,此方法利用限制性內(nèi)切酶和連接酶來擴增一條鏈含有核苷酸5’-[α-巰基]-三磷酸限制位點的靶分子(Walker等,1992)。美國專利5,916,779所述的鏈置換擴增(SDA)是另一種進行核酸恒溫擴增的方法,包括多輪鏈置換和合成,即缺口翻譯。
其它的核酸擴增方法包括轉(zhuǎn)錄為基礎(chǔ)的擴增系統(tǒng)(TAS),基包括核酸序列為基礎(chǔ)的擴增(NASBA)和3SR(Kwoh等,1989;PCT申請WO 88/10315,其內(nèi)容納入本文作參考)。歐洲專利申請329 822披露了一種涉及循環(huán)合成單鏈RNA(“ssRNA”),ssDNA和雙鏈DNA(dsDNA)的核酸擴增方法,可用于本發(fā)明。
PCT申請WO 89/06700(其內(nèi)容納入本文作參考)披露了一種基于啟動子區(qū)/引物序列與靶單鏈DNA(“ssDNA”)雜交,然后轉(zhuǎn)錄該序列的許多RNA拷貝的核酸序列擴增方案。此方案不用循環(huán),即新模板不從所得RNA轉(zhuǎn)錄物產(chǎn)生。其它擴增方法包括“RACE”和“一側(cè)PCR”(Frohman,1994;Ohara等,1989)。
3.核酸檢測任何擴增后,可能需要分離擴增產(chǎn)物與模板和/或過量的引物。一實施方案中,用瓊脂糖、瓊脂糖-丙烯酰胺凝膠電泳以標準技術(shù)分離擴增產(chǎn)物(Sambrook等,2001)??汕邢路蛛x的擴增產(chǎn)物并從凝膠上洗脫供進一步操作。利用低熔點瓊脂糖凝膠,通過加熱凝膠取得分離的條帶,然后抽提該核酸。
也可用旋轉(zhuǎn)柱和/或本領(lǐng)域已知的層析技術(shù)進行核酸分離。有許多種層析可用于實施本發(fā)明,包括吸附、分配、離子交換、羥基磷灰石、分子篩、反相層析、柱層析、紙層析、薄層層析和氣相層析及HPLC。
在某些實施方案中,可用肉眼觀察分離或未分離的擴增產(chǎn)物。典型的觀察方法包括用溴乙錠染色凝膠在UV光下觀察條帶?;蛘撸绻麛U增產(chǎn)物用放射或熒光標記的核苷酸整合標記,可使分離的擴增產(chǎn)物暴露x光膠片,在適當?shù)募ぐl(fā)光下觀察。
在一實施方案中,分離擴增產(chǎn)物后,使標記的核酸探針與擴增的標記序列接觸。優(yōu)選將探針偶聯(lián)于生色團而不作放射標記。在另一實施方案中,將探針偶聯(lián)于結(jié)合伴侶,如抗體或生物素,或其它載有可檢測成分的結(jié)合伴侶。
在具體實施方案中,用Southern印跡法與標記的探針雜交來檢測。Southern印跡法涉及的技術(shù)是本領(lǐng)域技術(shù)人員熟知的(見Sambrook等,2001)。上述技術(shù)的一個例子(見美國專利5,279,721所述,其內(nèi)容納入本文作參考)披露了自動化電泳和轉(zhuǎn)移核酸的裝置和方法。這些裝置允許不用外部操作凝膠而進行電泳和印跡,理想地適合于進行本發(fā)明的方法。
其它可用于實施本發(fā)明的核酸檢測方法見美國專利5,840,873;5,843,640;5,843,651;5,846,708;5,846,717;5,846,726;5,846,729;5,849,487;5,853,990;5,853,992;5,854,993;5,956,092;5,861,244;5,863,732;5,863,753;5,866,331;5,905,024;5,910,407;5,912,124;5,912,145;5,919,630;5,925,517;5,928,862;5,938,869;5,929,227;5,932,413和5,935,791,其各自內(nèi)容納入本文作參考。
4.其它試驗本發(fā)明范圍中可采用其它基因篩選方法,例如來檢測基因組DNA、cDNA和/或RNA樣品中的突變。用于檢測點突變的方法包括變性梯度凝膠電泳(“DGGE”)、限制性片段長度多態(tài)性分析(“RFLP”)、化學(xué)或酶切割法、直接測序PCRTM擴增的靶區(qū)域(見上)、單鏈構(gòu)型多態(tài)性分析(“SSCP”)和本領(lǐng)域熟知的其它方法。
篩選點突變的一種方法依據(jù)RNA/DNA或RNA/RNA異質(zhì)雙鏈體中堿基錯配的RNA酶切割。術(shù)語“錯配”本文定義為雙鏈RNA/RNA、RNA/DNA或DNA/DNA分子中含有一個或多個不配對的或錯配的核苷酸有區(qū)域。此定義包括由于插入/缺失突變,及單個或多個堿基點突變所至的錯配。
美國專利4,946,773描述了一種RNA酶A錯配切割試驗,其包括使單鏈DNA或RNA測試樣品與RNA探針退火,隨后用RNA酶A處理該核酸雙鏈體。為檢測錯配,將RNA酶A處理的單鏈產(chǎn)物按大小電泳分離,與相似處理的對照雙鏈體作比較。含有在對照雙鏈體中看不見的較小片段(切割產(chǎn)物)的樣品評為陽性。
其它學(xué)者描述了在錯配試驗中采用RNA酶I。在Promega Biotech的文獻中描述了錯配檢測采用了RNA酶I。Promega銷售的試劑盒裝有RNA酶I,報告說能切除4個已知錯配的三個。其它學(xué)者描述了采用MutS蛋白或其它DNA-修復(fù)酶來檢測單堿基錯配。
可用于實施本發(fā)明的其它檢測缺失、插入或置換突變的方法見美國專利5,849,483;5,851,770;5,866,337;5,925,525和5,928,870,其各自內(nèi)容納入本文作參考。
5.SNP篩選方法的具體例子進化過程中生物體基因組發(fā)生的自發(fā)性突變常不會立即傳遞給該種族的所有成員。從而產(chǎn)生多態(tài)性等位基因,它們共同存在于該種族群體中。多態(tài)性常常是遺傳疾病的原因。已鑒定到幾種多態(tài)性。例如,核苷酸的雙或三核苷酸重復(fù)基序自發(fā)形成的串聯(lián)復(fù)制會發(fā)生各種核苷酸類型的多態(tài)性(VNTR)。如果這種變化改變了限制性內(nèi)切核酸酶切割所產(chǎn)生的DNA片段長度,這種變化就稱為限制性長度多態(tài)性(RFLP),RFLP廣泛用于人和動物的遺傳分析。
另一類多態(tài)性由于單個核苷酸置換而產(chǎn)生。這種單核苷酸多態(tài)性(SNP)罕見可導(dǎo)致限制性內(nèi)切核酸酶位點的改變。因此,SNP用限制性片段長度分析很難檢測。SNP是最見的變化,平均每100-300堿基中發(fā)生一個,已發(fā)現(xiàn)幾種SNP突變影響了蛋白質(zhì)-編碼基因中的單個核苷酸,其方式足夠真正引起遺傳疾病。SNP疾病的例子有血友病、鐮狀細胞貧血、先天性血色素沉著癥、晚期發(fā)作早老性癡呆等。
本發(fā)明的內(nèi)容中,通過一系列篩選方法測定影響EGFR基因產(chǎn)物活性和水平的多態(tài)性突變。一組篩選方法目標是在體外或體內(nèi)試驗中鑒定影響EGFR基因產(chǎn)物R可誘導(dǎo)性、活性和/或水平的SNP。然后進行另一組篩選方法來篩選某個體是否存在以上鑒定的SNP。為了這樣做,采集病人的樣品(如血液或其它體液或組織樣品)用于基因型分析。SNP的存在與否將決定EGFR的表達和/或活性水平。按照本發(fā)明提供的方法,可利用這些結(jié)果來調(diào)整和/或改變給予某個體的EGFR靶向藥物的劑量以減少藥物的副作用。
SNP可能是缺失、點突變和插入所致。通常任何一個堿基的改變。不論其原因如何,可能導(dǎo)致SNP。SNP的頻率越高意味著它們比其它類型的多態(tài)性更易鑒定。它們分布的一貫性越高得以鑒定“最接近”感興趣特定性狀的SNP。這兩種貢獻的聯(lián)合作用使SNP極有價值。例如,如果某特定性狀(如EGFR過度表達)反映了特定基因座處的突變,那么可利用與該特定基因座聯(lián)鎖的任何多態(tài)性來預(yù)測顯示該性狀個體的(患病)可能性。在某些病例中,SNP可能是該性狀的原因。例如,EGFR調(diào)控區(qū)Sp1結(jié)合位點中的SNP可能改變其Sp1結(jié)合從而影響EGFR轉(zhuǎn)錄。
已開發(fā)了幾種方法來篩檢多態(tài)性,某些例子見下所述。參見Kwok和Chen(2003)及Kwok(2001)提供的這些方法的一些綜述,此二文專門納入作參考。
可采用這些方法中的任何一種或其適當?shù)母牧挤椒ㄌ卣麒b定涉及EGFR基因表達調(diào)節(jié)的SNP。這類方法包括直接或間接測定該位點的序列,采用能在該位點的等位基因中產(chǎn)生或破壞限制性位點的限制性酶,或采用等位基因特異性雜交探針。
可在美國專利6,472,157和美國專利申請公布號20020016293,20030099960,20040203034;WO 0180896(其內(nèi)容納入作參考)中找到鑒定多態(tài)性和應(yīng)用信息的方法,對病人產(chǎn)生有用信息的例子。
a)DNA測序特征鑒定多態(tài)性的最常用方法是對側(cè)接并包括該多態(tài)性的基因座進行DNA測序。這種分析可用“雙脫氧介導(dǎo)的鏈終止法”,也稱為“Sanger方法”(Sanger等,1975)或“化學(xué)降解法”也稱為“Maxam-Gilbert法”(Maxam等,1977)進行。可采用測序聯(lián)合基因組序列特異性擴增技術(shù),如聚合酶鏈式反應(yīng)來促進所需基因的發(fā)現(xiàn)(Mullis等,1986;歐洲專利申請50,424;84,796;258,017;237,362;201,184;美國專利4,683,202;4,582,788和4,683,194),所有上述專利納入本文作參考)。
b)外切核酸酶抗性可用于測定多態(tài)性位點核苷酸身份的其它方法采用專門化的外切核酸酶抗性核苷酸衍生物(美國專利4,656,127)。使與某等位基因從立即3’端至該多態(tài)性位點序列相互補的引物,在研究條件下與DNA雜交。如果此DNA的多態(tài)性位點含有與特定外切核酸酶抗性核苷酸衍生物互補的核苷酸,那么該聚合酶將把此衍生物摻入到雜交引物的末端。這種摻入使該引物能抵抗外切核酸酶的切割,從而使其能被檢測到。由于該外切核苷酸抗性衍生物是已知的,因此可確定該DNA的多態(tài)性位點中存在此特異性核苷酸。
c)微量測序方法已描述了測定DNA中多態(tài)性位點的幾種其它引物指導(dǎo)的核苷酸摻入方法(Komher等,1989;Sokolov,1990;Syvanen,1990;Kuppuswamy等,1991;prezant等,1992;Ugozzoll等,1992;Nyren等,1993)。這些方法依賴于摻入標記的脫氧核苷酸以區(qū)分多態(tài)性位點的堿基。由于信號與摻入的脫氧核苷酸量成比例,運作同樣核苷酸產(chǎn)生的多態(tài)性導(dǎo)致與運作的長度成比例(Syvanen等,1990)。
d)在溶液中延伸法國專利2,650,840和PCT申請專利WO 91/02087描述了測定多態(tài)性位點核苷酸身份的方法。按照這些方法,采用了與等位基因從緊靠3’端至多態(tài)性位點序列相互補的引物。該位點的核苷酸身份可用標記的雙脫氧核苷酸衍生物(如果其與該多態(tài)性位點互補即能摻入到該引物的末端)測定。
e)基因小段分析或固相延伸PCT申請專利WO 92/15712描述了一種采用標記的終止子混合物和與從3’端至多態(tài)性位點序列相互補的引物的方法。摻入的標記終止子與待評價的靶分子的多態(tài)性位點中的核苷酸相互補,因而得以鑒定。此時引物或靶分子固定在固相中。
f)寡核苷酸連接試驗(OLA)這是另一種固相方法,采用了不同的方法學(xué)(Landegren等,1988)。采用能與靶DNA單鏈的毗連序列雜交的兩個寡核苷酸。生物素化這些寡核苷酸之一,而另一個為可檢測標記。如果在靶分子中存在精確的互補序列,該寡核苷酸將雜交,它們的末端毗連并產(chǎn)生連接底物。用親和素連接得以發(fā)現(xiàn)該標記的寡核苷酸。根據(jù)此法,其它的核酸檢測試驗與PCR聯(lián)用也已有描述(Nickerson等,1990)。此時用PCR可實現(xiàn)靶DNA的指數(shù)擴增,然后用OLA檢測。
g)連接酶/聚合酶-介導(dǎo)的基因小段分析美國專利5,952,174描述了一種方法也包括兩種能與靶分子毗連序列雜交的引物。在固定有靶分子的固相支持物上形成雜交產(chǎn)物。此時發(fā)生的雜交使二引物被一個核苷酸間隔彼此分開。在存在聚合酶、連接酶和核苷三磷酸混合物(含有至少一種脫氧核苷三磷酸)時培育此雜交產(chǎn)物,使毗連雜交的寡核苷酸對連接。此法比單用延伸或連接的方法,提供了較高的特異性和較低的“嘈聲”,不象聚合酶試驗,此法通過與二次雜交和使信號附著于固相的連接步驟聯(lián)用,提高了聚合酶步驟的特異性。
h)侵入性切割反應(yīng)可利用侵入性切割反應(yīng)來評價細胞DNA的特定多態(tài)性。一種稱為INVADER的技術(shù)采用了這類反應(yīng)(如de Arruda等,2002;Stevens等,2003,納入作參考)。通常有三種核酸分子1)靶位點上游藝室的寡核苷酸(“上游寡”),2)覆蓋該靶位點的探針寡核苷酸(“探針”),和3)含該靶位點的單鏈DNA(“靶”)。所述探針含有供者熒光團,如熒光素,和受者染料,如Dabcyl。上游寡核苷酸3’末端的核苷酸重疊(“侵入了”)了探針-靶分子雙鏈體的第一對堿基。因此探針被結(jié)構(gòu)特異性的5’核酸酶切斷,導(dǎo)致熒光團/淬滅劑對分離,從而提高可檢測的熒光量。見Lu等,2004。
在某些病例中,在固相表面或以陣列格式進行該試驗。
h)檢測SNP的其它方法以下提供的SNP檢測和鑒定的幾種其它特異性方法,可經(jīng)適當改進與鑒定本發(fā)明EGFR基因多態(tài)性的方法聯(lián)用。在納入本文作參考的網(wǎng)站www.ncbi.nlm.nib.gov/SNP的NCBI的SNP網(wǎng)點上也有其它幾種方法的描述。
在一具體實施方案中,可測定某群體中任何給定基因座的推廣的單倍型,使我們得以精確鑒定那個SNP將會豐余,那個將是相關(guān)性研所必須。后者稱為“單倍型標記SNP(htSNP)”,這些標記能捕獲基因或連鎖不平衡區(qū)域的單倍型。見Johnson等(2001)以及Ke和Cardon(2003),各自內(nèi)容納入本文作示范性方法的參考。
VDA-試驗通過利用TaKaRa LA Taq試劑和其它標準反應(yīng)條件進行長時間PCR法,用PCR擴增基因組區(qū)段。長時間擴增可擴增約2000-12000bp大小的DNA。Affymetrix高通量篩選中心可進行產(chǎn)物與各種探測陣列(VDA)的雜交,并用計算機軟件分析。
一種稱為芯片試驗的方法采用標準或長時間PCR方案來擴增基因組區(qū)段。用VDA分析雜交產(chǎn)物,Halushka等,1999,納入本文作參考。SNO通常根據(jù)雜交模式的計算機分析,分類為“確定”或“類似”。通過與其它檢測方法,如核苷酸測序相比較,“確定”的SNP經(jīng)100%次證實;和“類似”的SNP經(jīng)此法70%次證實。
其它方法方法簡單地包括PCR擴增后用相關(guān)的限制性酶消化。還有其它方法包括對純化的PCR產(chǎn)物已知基因組區(qū)域測序。
在另一種方法中,用PCR擴增大外顯子的各個外顯子或重疊片段。根據(jù)發(fā)表的序列或數(shù)據(jù)庫序列設(shè)計引物,用以下條件進行基因組DNA的PCR擴增200ng DNA模板、0.5μM的各引物、80μM的各dCTP、dATP、dTTP和dGTP、5%甲酰胺、1.5mMMgCl2、0.5U Taq聚合酶、和0.1體積的Taq緩沖液。進行溫度循環(huán),用PCR-單鏈驗證多態(tài)性(PCR-SSCP)分析法,在不同條件,如5%或10%聚丙烯酰胺凝膠和15%尿素,加或不加5%甘油時分析所產(chǎn)生的PCR產(chǎn)物。進行電泳過夜。再擴增顯示遷移的PCR產(chǎn)物并測序以鑒定核苷酸變異。
在稱為CGAP-GAI(DEMIGLACE)的方法中,將序列和排列對比數(shù)據(jù)(得自PHRAP.ace file)、序列堿基訪問的質(zhì)量評分(得自PHRED質(zhì)量文件(PHRED qualityfile))、距離信息(得自PHYLIP DNA距離和鄰居程序(PHYLIP dnadist and neighbourprogram))和堿基訪問數(shù)據(jù)(得自PHRED‘-d’轉(zhuǎn)換)加載到存貯器中。排列對比諸序列并檢查產(chǎn)生的裝配不一致的各個垂直的信息塊(‘薄片’)。認為任何這種薄片是候選的SNP(DEMIGLACE)。DEMIGLACE利用許多過濾器來消除不可能提供真實多態(tài)性的薄片。這些過濾器包括(i)當鄰近序列質(zhì)量評分下降40%或更多時排除任何給定薄片的SNP序列;(ii)排除該核苷酸類型所有堿基訪問峰幅度低于15%的訪問;(iii)取消序列中具有大量與參與SNP計算的共有序列不一致的序列區(qū)域;(iv)考慮去除含有峰值高于訪問峰區(qū)域25%或更多的交替訪問的任何堿基訪問;(v)排除只發(fā)生在一種閱讀取向的變異。將PHRED質(zhì)量評分轉(zhuǎn)變成該薄片中各核苷酸的誤差可能性值(probability-of-error value)。采用標準的Bayesian法來計算后驗概率,這是某給定部位核苷酸異質(zhì)性的證據(jù)。
在一種稱為CU-RDF(RESEQ)的方法中,用每種SNP的特異性引物從分離自血液的DNA進行PCR擴增,并在典型的除去未使用的引物和游離核苷酸的提純步驟之后用相同或嵌套引物直接測序。
在稱為DEBNICK(方法-B)的方法中,用熒光DNA測序法進行簇集EST序列的比較性分析并驗證。在一相關(guān)的稱為DEBNICK(方法-C)的方法中,比較性分析了錯配位點含有phred質(zhì)量>20簇集EST序列,其5個堿基的5’-端FLANK和3’端至SNP上平均phred質(zhì)量>=20,5個堿基的5’端和3’端至SNP中無錯配,通過跟蹤檢測進行了各等位基因發(fā)生的至少兩個SNP并得以證實。
在鑒定為ERO的方法(RESEQ)中,設(shè)計了新的引物組來電泳檢測發(fā)表的STS,用于擴增10種不同品系小鼠的DNA。然后凝膠純化各品系的擴增產(chǎn)物并用標準的雙脫氧循環(huán)測序技術(shù)以33P-標記的終止子測序。所有的ddGTP反應(yīng)后將所有的ddATP終止反應(yīng)物加載到測序凝膠的毗鄰泳道中等等。觀察掃描放射圖象鑒定SNP。
在鑒定為ERO的另一方法(RESEQ-HT)中,設(shè)計了新的引物組來電泳檢測發(fā)表的小鼠DNA序列,用于擴增10種不同品系小鼠的DNA。制備各品系的擴增產(chǎn)物用外切核酸酶I和蝦堿性磷酸酶處理進行測序。用ABI Prism Big Dye TerminatorReady ReactionKit(Perkin-Elmer)進行測序,序列樣品在3700 DNA分析儀(96毛細管測序儀)上運作。
FGU-CBT(SCA2-SNP)鑒定一種方法,其中含有SNP的區(qū)域用引物SCA2-FP3和SCA2-RP3作PCR擴增。在含有最終濃度5mM Tris、25mM KCl、0.75mM MgCl2、0.05%明膠、20pmol各引物和0.5U Taq DNA聚合酶的50ml反應(yīng)體積中擴增大約100ng的基因組DNA。使樣品變性、退火和延伸,用例如QIAquick凝膠抽提試劑盒(Qiagen)從切下的瓊脂糖凝膠條帶純化PCR產(chǎn)物。并用染料終止化學(xué)試劑在ABIPrism 377自動化DNA測序儀上用PCR引物測序。
在鑒定為JBLACK(SEQ/RESTRICT)的方法中,用基因組DNA進行了二次獨立的PCR反應(yīng)。測序分析第一次反應(yīng)的產(chǎn)物,表明有一個獨特的FspI限制位點。用FspI消化證實第二次PCR反應(yīng)產(chǎn)物中有突變。
在描述為KWOK(1)的方法中,通過用染料終止化學(xué)試劑直接測定PCR產(chǎn)物的DNA序列,比較4名隨機選擇個體的高質(zhì)量基因組序列數(shù)據(jù)來鑒定其SNP(見Kwok等,1996)。在一相關(guān)的鑒定為KWOK(2)的方法中,通過比較重疊的大插入克隆,如細菌的人造染色體(BAC)或P1-人造染色體(PAC)的高質(zhì)量基因組序列數(shù)據(jù)來鑒定其SNP。然后產(chǎn)生含此SNP的STS,用合并的DNA測序驗證不同人群中該SNP的存在(見Taillon-Miller等,1998)。在另一類似的稱為KWOK(3)方法中,通過比較重疊的大插入克隆BAC或PAC的高質(zhì)量基因組序列數(shù)據(jù)來鑒定SNP。此法發(fā)現(xiàn)的SNP代表了該二供者染色體之間的DNA序列差異,但沿沒確定該總體人群中的此等位基因頻率。在KWOK(5)方法中,通過用染料終止化學(xué)試劑直接測定PCR產(chǎn)物的DNA序列,比較純合型DNA樣品與一種或多種合并的DNA樣品的高質(zhì)量基因組序列數(shù)據(jù)來鑒定SNP。從公眾可得到的數(shù)據(jù)庫中找到的序列數(shù)據(jù)產(chǎn)生了所用的STS。具體說,用PCR擴增完全性葡萄胎(Complete hydatidiform mole,CHM)(已證明在所有基因座均為純合型)和80名CEPH病人的合并DNA樣品的這些STS(見Kwok等,1994)。
在另一種此類KWOK(OverlapSnpDetectionWithPolyBayes)方法中,通過計算機的自動化分析人基因組大插入克隆序列的重疊區(qū)域發(fā)現(xiàn)了SNP。為獲得數(shù)據(jù),直接從大規(guī)模測序中心獲得克隆序列。這是必須的,因為GenBank不提供/不能從其得到堿基質(zhì)量序列。初步數(shù)據(jù)加工包括分析克隆序列與伴隨的堿基質(zhì)量信息的一致性。指定含有無關(guān)堿基質(zhì)量序列的完成(‘堿基偏愛’,錯誤率低于1/10,000bp)序列的統(tǒng)一堿基質(zhì)量值為40(1/10,000bp錯誤率)。拒絕無堿基質(zhì)量值的草圖序列。將經(jīng)加工的序列輸入局部數(shù)據(jù)庫。也存貯含掩蓋的已知人重復(fù)序列的各序列版本。用程序“MASKERAID”進行重復(fù)序列的掩蓋。重疊檢測用程序“WUBLAST”檢測推定的重疊(序列)。隨后進行幾次過濾步驟以消除假重疊檢測結(jié)果,即消除由于序列復(fù)制與與重疊相反而產(chǎn)生的一對克隆序列之間的相似性。重疊的總長度、相似性總百分比、含高質(zhì)量堿基值“高質(zhì)量錯配”的核苷酸之間的序列差異數(shù)量。也將結(jié)果與華盛頓大學(xué)基因組測序中心(Washington University Genome Sequencing Center)的基因組克隆限制性片段作圖結(jié)果、關(guān)于重疊的最終報告以及NCBI上的序列連續(xù)構(gòu)建工作的結(jié)果進行比較。SNP檢測用‘POLYBAYES’SNP檢測軟件分析候選SNP位點的克隆序列重疊對。給序列對之間的序列差異評分其代表與測序誤差相反的真實序列不同的可能性。此法要求提供二序列的堿基質(zhì)量值。抽出高評分候選序列。檢索限制于取代類型的單堿基對不同。用POLYBAYES軟件給SNP作計算機可信限平分。
在KWOK(TaqMan試驗)鑒定的方法中,用TaqMan試驗測定90名隨機個體的基因型。在KYUGEN(Q1)鑒定的方法中,合并指定人群的DNA樣品用PLACE-SSCP分析。用雜合子的數(shù)據(jù)糾正合并分析中各等位基因的峰高度,隨后用于計算等位基因頻率。此法可靠地量化了高于10%的等位基因頻率。等位基因頻率=0(零)意味個體中可找到該等位基因,但在合并物檢查中看不見相應(yīng)的峰。等位基因頻率=0-0.1表示在合并物中可檢測到微量等位基因但峰太低不能可靠地量化。
在另一鑒定為KYUGEN的方法(方法1)中,用熒光染料后標記PCR產(chǎn)物和在SSCP條件(PLACE-SSCP)下用自動化毛細管電泳系統(tǒng)分析。在一系列實驗中用或不用兩種合并的DNA(日本合并物和CEPH合并物)分析4名或多名個體的DNA。肉眼觀察鑒定等位基因。測定含有不同基因型的個體的DNA序列,鑒定SNP。用雜合子峰高度糾正信號偏差后從合并樣品的峰高度估計等位基因頻率。PCR引物經(jīng)標記后其二條鏈的末端具有5’-ATT或5’-GTT尾。擴增DNA(10ng/μl)樣品,反應(yīng)混合物含緩沖液(10mM Tris-HCl,pH8.3或9.3,50mM KCl,2.0mM MgCl2)0.25μM的各引物、200μM各dNTP、0.025U/μl Taq DNA聚合酶,預(yù)先與抗-Taq抗體混合。通過DNA聚合酶I的Klenow片段的交換反應(yīng)用經(jīng)R110和R6G修飾的核苷酸差別性標記PCR產(chǎn)物的二條鏈。加入EDTA終止反應(yīng),加入牛小腸堿性磷酸酶使未摻入的核苷酸去磷酸化。對于SSCP將等量的熒光素標記的PCR產(chǎn)物和TAMRA標記的內(nèi)部標志加入到去離子的甲酰胺中變性。用ABI Primer 310基因分析儀進行毛細管電泳。用Genescan軟件(P-E Biosystems)收集數(shù)據(jù)作數(shù)據(jù)加工。用big-dye終止化學(xué)試劑在ABI Primer 310測序儀上,對在SSCP上顯示基因型不同的個體的DNA進行直接測序。從ABI Primer 310獲得多個序列的跟蹤文件,用Phred/Phrap校正,用Consed viewer觀察。用PolyPhred軟件和肉眼觀察鑒定SNP。
在另一鑒定為KYUGEN的方法(方法2)中,通過變性HPLC(DHPLC)或PLACE-SSCP(Inazuka等,1997)搜尋具有不同基因型的個體,測定它們的序列來鑒定SNP。用經(jīng)標記后其二條鏈的末端具有5’-ATT或5’-GTT尾的引物進行PCR。用WAVE DNA片段分析系統(tǒng)(Transgenomic)進行DHPLC分析。將PCR產(chǎn)物注射入DNASep柱中,用WAVEMaker程序(Transgenomic)在確定的條件下分離該產(chǎn)物。通過DNA聚合酶I的Klenow片段的交換反應(yīng)用經(jīng)R110和R6G修飾的核苷酸差別性標記PCR產(chǎn)物的二條鏈。加入EDTA終止反應(yīng),加入牛小腸堿性磷酸酶使未摻入的核苷酸去磷酸化。SSCP隨后用ABI Primer 310基因分析儀進行毛細管電泳。Genescan軟件(P-E Biosystems)。用big-dye終止化學(xué)試劑在ABI Primer 310測序儀上,對在DHPLC或SSCP上顯示基因型不同的個體的DNA進行直接測序。從ABIPrimer 310獲得多個序列的跟蹤文件,用Phred/Phrap校正,用Consed viewer觀察。用PolyPhred軟件和肉眼觀察鑒定SNP。用PHRED加工Unigene中的EST序列的跟蹤層析諳數(shù)據(jù)。為鑒定可能的SNP,對每個Unigene簇,報告了從程序PHRAP、BRO和POA產(chǎn)生的多個序列排列對比后的單個堿基錯配。BRO糾正了可能錯報的EST取向‘而POA鑒定和分析了非線性排列對比結(jié)構(gòu),其可表明基因的混合/嵌合,可能產(chǎn)生假SNP。利用Bayesian參比品權(quán)衡真實多態(tài)性與測序錯誤、錯排列對比、或模棱兩可、錯簇集或嵌合性EST序列的證據(jù),評估數(shù)據(jù),如初步層析譜高度、銳度、重疊和間隔;測序錯誤幾率;內(nèi)容靈敏度;cDNA文庫來源等。
在鑒定為MARSHFIELD的方法(方法-B)中,通過搜尋公眾數(shù)據(jù)庫鑒定含有推定的插入/缺失多態(tài)性的重疊人DNA序列。從共有序列中選出側(cè)接各多態(tài)性位點的PCR引物。利用此引物來擴增個體的或合并的人基因組DNA。在變性聚丙烯酰胺凝膠上分辨得到的PCR產(chǎn)物,用PhosphorImager估計DNA合并物的等位基因頻率。
6.連鎖不平衡本發(fā)明方法也可利用與EGFR基因座-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169或2034位的多態(tài)性連鎖不平衡的多態(tài)性?!斑B鎖不平衡”(本文使用的“LD”在本領(lǐng)域也稱為“LED”)指一種情況,此時兩個基因座的等位基因(即某給定基因的變化形式)的特定組合或多態(tài)性看來比碰巧預(yù)期的更頻繁。如該領(lǐng)域技術(shù)人員所測定,當“顯著”用于連鎖不平衡時,認為統(tǒng)計學(xué)的p或α值是0.25或0.1,可以是0.1、0.05、0.001、0.0001或更小??衫肊GFR單倍型與EGFR蛋白表達水平之間的關(guān)系來使基因型(即生物體的基因組成)與表型(即生物體或細胞顯示的物理性狀)相關(guān)聯(lián)?!皢伪缎汀卑丛擃I(lǐng)域技術(shù)人員所知的其單純和普通含義使用,指沿同源染色體之一分布的兩個或多個等位基因或多態(tài)性的集合基因型。
D.試劑盒試劑盒中可裝有本文所述的任何組合物。非限制性例子中,試劑盒裝有測定一種或兩種EGFR基因的基因型的試劑。該盒也可裝有可擴增和/或檢測EGFR基因的特定核酸序列的各種核酸。在具體實施方案中,其裝有一種或多種引物和/或探針。裝有含標記的核酸分子、染料或其它信號傳導(dǎo)分子,如熒光團。也可裝有一種或多種緩沖液,如DNA分離緩沖液、擴增緩沖液或雜交緩沖液。該試劑盒也可裝有用于制備DNA模板和分離樣品DNA的化合物和試劑。試劑盒還可裝有各種標記試劑和化合物。
可以含水介質(zhì)或凍干形式包裝試劑盒的諸成分。試劑盒的容器通常包括至少一個小瓶、試管、燒瓶、大瓶子、針筒或其它容器,其中各裝有一種組分,優(yōu)選適當?shù)胤殖傻确?。當盒中裝有一種以上組分(標記試劑與標記物一起包裝)時,該試劑盒通常也裝有第兩個、第三個或更多個容器,其中各組分分開放置。然而小瓶中可含有各組分的各種組合。本發(fā)明的試劑盒通常包括供商品銷售的裝有核酸和其它試劑的密封容器。這類容器可裝有注塑或吹塑容器,其中裝有所需數(shù)目的小瓶。
當試劑盒的各組分以一種或多種液體溶液提供時,該液體溶液是水溶液,特別優(yōu)選滅菌水溶液。然而試劑盒組分也可以干粉提供。當試劑和/或組分以干粉提供時,可加入適當?shù)娜軇﹣碇亟ù烁煞?。預(yù)想溶劑可在其它容器中提供。
試劑盒也裝有如何使用試劑盒諸組分和該盒中沒有的其它試劑的說明書。說明書可包括如何執(zhí)行的各種變化。
認為這類試劑是本發(fā)明試劑盒的實施方案。然而昆試劑盒不限于上述特定條款,可包括直接或間接用于檢測EGFR基因中多態(tài)性或EGFR基因表達水平的任何試劑。
E.實施例包括以下實施例來顯示本發(fā)明的優(yōu)選實施方案。本領(lǐng)域技術(shù)人員應(yīng)理解實施例中所披露的技術(shù),代表了本發(fā)明人所公開的實施本發(fā)明性能良好的技,可認為構(gòu)成了其實施的優(yōu)選模式。然而本領(lǐng)域技術(shù)人員借助本文公開的內(nèi)容,應(yīng)理解可對所公開的具體實施方案做出許多修改,仍能獲得同樣或類似的結(jié)果,但這些都屬于本發(fā)明的思路和范圍。
實施例1EGFR調(diào)控區(qū)中發(fā)現(xiàn)的單核苷酸多態(tài)性(SNP)利用Coriell Cell Repository的DNA樣品重測序。樣品包括22名高加索人、23名非洲美國人和23名亞洲人。對于SNP發(fā)現(xiàn),用表1的引物通過PCR擴增大約4.5kb的片段,該片段含有上游和下游增強子、啟動子、外顯子1和部分內(nèi)含子1。從兩端直接測序純化的PCR產(chǎn)物。用ABI-3700毛細管測序儀和phred/phrap/polyphred/consed管線(pipeline)(萬維網(wǎng)地位為phrap.org/)鑒定多態(tài)性。
表1
通過重測序包括啟動子和增強子在內(nèi)的4kb的EGFR5’調(diào)控區(qū),從包括22名高加索人、23名非洲美國人和23名亞洲人的68份DNA樣品中鑒定到12個單核苷酸多態(tài)性(圖1和表2)。與其它7個罕見的SNP相比,5個SNP顯示至少在一個群體中有較高的出現(xiàn)率(罕見等位基因頻率>10%)。在啟動子和增強子區(qū)中觀察到9個SNP,其中3個常見。一個SNP,-1249 G>A(在非洲美國人中占10%)位于上游增強子中,而-216 G>T(在非洲美國人中占29%,高加索人中占34%)和-191 C>A位于啟動子區(qū)(高加索人中占18%)(圖1和表2)。令人感興趣的是,-216 G>T位于Sp1結(jié)合位點(-216)中,用T置換G可改變Sp1結(jié)合。同時,-191 C>A靠近轉(zhuǎn)錄起始位點(圖2)(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。因此,這些SNP可能對EGFR轉(zhuǎn)錄具有顯著影響。
表2在EGFR調(diào)控區(qū)發(fā)現(xiàn)的SNP罕見等位基因的數(shù)目和頻率。
非洲美國人(AA),高加索人(CA)亞洲人(AA)
實施例2兩個啟動子SNP(-216 G>T和-191 C>A)的功能特征鑒定在體外瞬時轉(zhuǎn)染試驗和電泳遷移試驗(ENSA)特征鑒定了EGFR啟動子區(qū)中兩個SNP(-216 G>T和-191 C>A)的潛在功能。
單倍型當本發(fā)明人測定了得自不同種族的68份樣品時,發(fā)現(xiàn)SNP-216 G>T在非洲美國人(29%)和高加索人(34%)中頻率高,但在亞洲人中較為罕見(9%);而-191 C>A只見于高加索人(18%)(表3)。連鎖不平衡和單倍型分析顯示-216 G>T和-191 C>A在強LD中不存在(D’=0.5562,P>0.05),在樣品中觀察到3種單倍型G-C、G-A和T-C,見下表3。擴增含有這3種單倍型的DNA片段并克隆,同時將用DraIII消化的G-A和T-C單倍型的T片段和A片段相連接,構(gòu)建T-A單倍型(圖3)。
表3高加索人、非洲美國人和亞洲人中-216 G>T和-191 C>A單倍型的頻率
載體和檢測系統(tǒng) 將載有4個靶DNA片段中每一個的PGL3-luc+基礎(chǔ)報告載體(Promega)和含有受單純皰疹病毒胸苷激酶(HSV-TK)啟動子驅(qū)動的renilla基因的pRL-TK報告載體(Promega)共轉(zhuǎn)染到MDA-MB-231細胞中,比較熒光素酶基因的相對表達。采用雙熒光素酶報告試驗系統(tǒng)(Promega)檢測熒光素酶的表達水平。PGL3-luc+基礎(chǔ)載體和PGL3-luc+SV40-啟動子載體分別作為陰性和陽性對照。
缺失圖譜研究顯示,含有這兩種SNP的外顯子1上游384bp片段具有基本的啟動子功能(圖2)(Johnson等,1988)。因此用Proofstart DNA聚合酶(Qiagen)通過PCR從具有特定單倍型的個體擴增此片段,作改進的高保真DNA擴增。設(shè)計引物來擴增圖2所示515bp擴增子。引物序列是正向引物5’-CCACCGGTACCGGCGGCCGCTGGCCTTG-3’(SEQ ID NO25)和反向引物5’-CGGCGAGACACGCCCTTACCTTT-3’(SEQ ID NO26)。此515bp擴增子含有3’-端的ScaI切割位點(圖2)。為方便亞克隆,設(shè)計的正向引物含有KpnI位點。用KpnI和ScaI消化該片段,將405bp的產(chǎn)物克隆到pGL3-luc+基礎(chǔ)載體的KpnI/ScaI位點。為驗證插入了DNA片段,對所有質(zhì)粒測序以PCR錯誤,核對片段的取向確保單倍型(正確)然后轉(zhuǎn)染。
瞬時轉(zhuǎn)染 將MDA-MB-231細胞系維持在含10%FBS和2Mm L-谷氨酰胺的RPMI1640培養(yǎng)基(Invitrogen)中。用轉(zhuǎn)染胺2000(Invitrogen)按廠商說明書進行瞬時轉(zhuǎn)染。所有轉(zhuǎn)染一式三份進行并重復(fù)三次。用pRL-TK載體共轉(zhuǎn)染細胞以標準化轉(zhuǎn)染效率。轉(zhuǎn)染后,培養(yǎng)細胞24小時,洗滌、裂解,用雙熒光素酶試劑盒(Promega)按廠商說明書進行分析。
比較4種單倍型驅(qū)動的體外熒光素酶轉(zhuǎn)錄效率。觀察到T-C單倍型載體的熒光素酶活性明顯高于G-C單倍型載體(圖4,p<0.01)。在高加索人、非洲美國人和亞洲人中T-C和G-C單倍型是最常見的單倍型(表3)。此外,-216 G>T多態(tài)性對熒光素酶活性影響比-191 C>A多態(tài)性高(圖4;圖6A,所有比較的p<0.04)。這種作用不依賴細胞的EGFR表達水平(圖6B)。平均而言,用T等位基因置換G等位基因顯示熒光素酶基因表達提高約30%。
為進一步驗證DNA改變和Sp1對啟動子活性的可能協(xié)同作用,還在果蠅(Drosophila melanogaster)Schneider細胞系2(SL-2,其Sp1缺陷)中進行了瞬時轉(zhuǎn)染(Courey等,1988)。結(jié)果,與pGL3EGFRluc單獨轉(zhuǎn)染相比,用Sp1表達載體共轉(zhuǎn)染pGL3EGFRluc導(dǎo)致啟動子活性誘導(dǎo)增高約100倍。與T-C單倍型相比,pPac-Sp1和4種pGL3EGFRluc構(gòu)建物之一共轉(zhuǎn)染顯示受G-C單倍型驅(qū)動的啟動子活性顯著降低(p<0.03,圖6A)。
電泳遷移試驗(EMSA)用EMSA評價-216 G>T多態(tài)性位點的核蛋白結(jié)合。用NE-PER胞核和胞質(zhì)提取試劑按廠商(Pierce,Rockford,USA)方案提取MDA-MB-231細胞的核蛋白。表4列出了對應(yīng)于G等位基因、T等位基因和Sp1結(jié)合共有序列的探針和競爭物。
表4 EMSA所用的探針和競爭物。多態(tài)性核苷酸的位置用粗體和下劃線標出 合成的探針為單鏈,末端用生物素標記。含有相同序列的未標記寡核苷酸用作競爭物。使二互補寡核苷酸退火制備雙鏈DNA。用LightShift化學(xué)發(fā)光EMSA試劑盒(Pierce,Rockford,USA)按廠商說明書進行EMSA。
簡而言之,室溫培育核抽取物與結(jié)合緩沖液(100mM Tris-HCl,pH 7.5;500mMNaCl,25mM MgCl2和5mM二硫蘇糖醇)、1μg poly(dI-dC)和0.2pmol(200,000cpm)標記探針20分鐘進行結(jié)合反應(yīng)。對于競爭試驗,在結(jié)合反應(yīng)中100倍摩爾過量的未標記寡核苷酸(特異性、非特異性或Sp1特異性)。結(jié)合后在4℃在5%非變性聚丙烯酰胺凝膠中以0.5xTBE分離樣品2小時。在0.5xTBE中100V電泳40分鐘,將結(jié)合反應(yīng)物轉(zhuǎn)移到尼龍膜(Amersham Pharmacia Biotech)上。轉(zhuǎn)移后,在254nm UV燈下以120mJ/cm2交聯(lián)DNA。在ChemiDoc系統(tǒng)(Bio-Rad)中用化學(xué)發(fā)光檢測方法檢測生物素標記的DNA。
進行EMSA來測定核蛋白與各等位基因特異性探針的結(jié)合效率。用Sp1共有序列探針作為對照來顯示結(jié)合與遷移位置。與G等位基因探針相比,用T等位基因探針檢測觀察到的MDA-MB-231細胞核蛋白結(jié)合效率顯著為高(圖5)。
-216 G>T-191 C>A單倍型與體內(nèi)EGFR mRNA表達相關(guān)選擇人成纖維細胞(表達EGFR)來評價-216 G>T-191 C>A單倍型與EGFR轉(zhuǎn)錄之間的相關(guān)性。按先前報導(dǎo),EGFR啟動子中有多個轉(zhuǎn)錄起始位點(Johnson等,1988;Kageyama等,1988),而體內(nèi)轉(zhuǎn)錄的主要位點在-260位(Kageyama等,1988)。因此,-216和-191位存在于大多數(shù)EGFR mRNA序列中。選擇含有二倍型(diplotype)G-C/T-C兩種多態(tài)性的10個細胞系,它們具有檢測同一細胞中載有T-C單倍型和G-C單倍型的mRNA之間表達水平差異的能力。結(jié)果,觀察到平均相對比例距離假設(shè)的比例1∶1有顯著偏差(R的均值=1.39±0.12,95%CI 1.11-1.67,p<0.02,證明T-C單倍型產(chǎn)生的EGFR mRNA高于G-C單倍型約40%。此發(fā)現(xiàn)表明,-216G/T變化對EGFR的體內(nèi)轉(zhuǎn)錄也有很強的影響。
除了等位基因不平衡,通過實時PCR還評估了上述三種人細胞系之間EGFR的相對表達。有趣的是,這些細胞間的EGFR水平與它們的二倍型一致,MDA-MBA-231細胞的EGFR水平非常高,但在HEK293中低約6倍,在MCF-7中最低(圖6B)。
本文披露的和權(quán)利要求書要求的所有組合物和方法借助本文所公開的內(nèi)容,無須過多實驗即可制備和實施。雖然已通過優(yōu)選實施方案描述了本發(fā)明的組合物和方法,但本領(lǐng)域技術(shù)人員知道可對這些組合物和方法及所述方法的步驟或步驟的順序作出許多變化而不背離本發(fā)明的概念、思路和范圍。更具體說,顯然可用化學(xué)上和生理學(xué)上相關(guān)的某些試劑來替代本文所述的試劑,仍可獲得同樣或類似的結(jié)果。本領(lǐng)域技術(shù)人員應(yīng)知道所有這些類似的替代和修飾均屬于本發(fā)明權(quán)利要求書所定義的本發(fā)明的思路、范圍和概念內(nèi)。
參考文獻以下參考文獻的內(nèi)容提供了對本文所述內(nèi)容的示范性方法或其它詳細說明,而納入本文參考文獻。
美國專利4,582,788美國專利4,656,127美國專利4,659,774美國專利4,682,195美國專利4,683,194美國專利4,683,195美國專利4,683,202
美國專利4,683,202美國專利4,683,202美國專利4,800,159美國專利4,816,571美國專利4,883,750美國專利4,946,773美國專利4,959,463美國專利5,141,813美國專利5,264,566美國專利5,279,721美國專利5,428,148美國專利5,554,744美國專利5,574,146美國專利5,602,244美國專利5,645,897美國專利5,705,629美國專利5,840,873美國專利5,843,640美國專利5,843,650美國專利5,843,651美國專利5,843,663美國專利5,846,708美國專利5,846,709美國專利5,846,717美國專利5,846,726美國專利5,846,729美國專利5,846,783美國專利5,849,481美國專利5,849,483美國專利5,849,486美國專利5,849,487
美國專利5,849,497美國專利5,849,546美國專利5,849,547美國專利5,851,770美國專利5,851,772美國專利5,853,990美國專利5,853,992美國專利5,853,993美國專利5,856,092美國專利5,858,652美國專利5,861,244美國專利5,863,732美國專利5,863,753美國專利5,866,331美國專利5,866,337美國專利5,866,366美國專利5,900,481美國專利5,905,024美國專利5,910,407美國專利5,912,124美國專利5,912,145美國專利5,912,148美國專利5,916,776美國專利5,916,779美國專利5,919,626美國專利5,919,630美國專利5,922,574美國專利5,925,517美國專利5,925,525美國專利5,928,862美國專利5,928,869
美國專利5,928,870美國專利5,928,905美國專利5,928,906美國專利5,929,227美國專利5,932,413美國專利5,932,451美國專利5,935,791美國專利5,935,825美國專利5,939,291美國專利5,942,391美國專利5,952,174Akimoto等,Clin.Cancer Res.52884-2890,1999.
Ausubel等,選自《新編分子生物學(xué)實驗指南》(Current Protocols in MolecularBiology),John,Wiley & Sons,Inc,紐約,1996.
Brandt等,Cancer Res.,647-12,2004.
Buerger等,Cancer Res.,60(4)854-857,2000.
Courey等,Cell,55887-98,1988.
Deb等,Oncogene,91341-1349,1994.
歐洲專利申請201,184歐洲專利申請237,362歐洲專利申請258,017歐洲專利申請329 822歐洲專利申請50,424歐洲專利申請84,796歐洲專利266,032法國專利2,650,840Froehler等,Nucleic Acids Res.,14(13)5399-5407,1986.
Frohman,選自《PCR實驗方法方法和應(yīng)用指南》(PCR ProtocolsA Guide ToMethods And Applications),學(xué)術(shù)出版社(Academic Press),紐約,1994.
Gebhardt等,J.Biol.Chem.,274(19)13176-13180,1999.
Grandis等,Nature Med.,2237-240,1996.
英國專利申請2 202 328Haley等,Oncogene Res.,1(4)375-396,1987.
Halushka等,Nat.Genet.,22(3)239-247,1999.
Hudson等,Mol.Endocrinol.,3400-408,1989.
Inazuka等,Genome Res,7(11)1094-1103,1997.
Innis等,Proc.Natl.Acad.Sci.USA,85(24)9436-9440,1988.
Ishii等,Proc.Natl.Acad.Sci.USA,82(15)4920-4924,1985.
Johnson等,Nat.Genet.,29(2)233-237,2001.
Johnson等,J.Biol.Chem.,263(12)5693-5699,1988.
Johnson等,F(xiàn)ront Biosci.3d447-d4488,1998.
Kageyama等,J.Biol.Chem.,263(13)6329-6336,1988.
Ke和Cardon,Bioinformatics,19(2)287-288,2003.
Komher等,Nucl.Acids.Res.177779-7784,1989.
Kuppuswamy等,Proc.Natl.Acad.Sci.(U.S.A.)881143-1147,1991.
Kwoh等,Proc.Natl.Acad.Sci.USA,861173,1989.
Kwok,Annu.Rev.Genomics Hum.Genet.,2235-58,2001.
Kwok and Chen,Curr.Issues Mol.Biol.,5(2)43-60,2003.
Kwok等,J Med Genet.,33(6)465-468,1996.
Kwok等,Genomics,23(1)138-144,1994.
Landegren等,Science 2411077-1080,1988.
Maekawa等,J.Biol.Chem.,264(10)5488-5494,1989.
Magistroni等,J.Nephrology,16110-115,2003.
Martin等,Digestion,66121-126,2002.
Maxam等,Proc.Natl.Acad.Sci.USA,74560,1977。
Mullis等,Cold Spring Harbor Symp.Quant.Biol.51263-273,1986.
Nickerson等,Proc.Natl.Acad.Sci.USA,878923-8927,1990.
Nyren等,Anal.Biochem.208171-175,1993.
Ohara等,Proc.Natl.Acad.Sci.USA,865673-5677,1989.
PCT申請WO91/02087PCT申請PCT/US87/00880PCT申請PCT/US89/01025
PCT申請WO 88/10315PCT申請WO 89/06700PCT申請WO 92/15712Prezant等,Hum.Mutat.,1159-164,1992.
Reinshagen等,Gastroenterology,104A642,1993.
Salomon等,Crit.Rev.Oncol.Hematol.19183-232,1995.
Sambrook等,選自《分子克隆》(Molecular cloning),冷泉港實驗室出版社,冷泉港,紐約,2001.
Sanger等,J.Molec.Biol.,94441,1975.
Satsangi等,Nat.Genet.,14199-202,1996.
Sokolov,Nucl.Acids Res.183671,1990.
Subler等,Oncogene,91351-1359,1994.
Sweeney等,Kidney Int.,551187-1197,1999.
Syvanen等,Genomics 8684-692,1990.
Taillon-Miller等,Genome Res,8(7)748-754,1998.
Tysnes等,Invasion Metastasis,17270-280,1997.
Ugozzoll等,GATA 9107-112,1992.
Walker等,Proc.Natl.Acad.Sci.USA,89392-396 1992.
Wosikowski等,Biochim.Biophys.Acta,1497215-226,2000.
Xu等Proc.Natl.Acad.Sci.USA,817308-7312,1984.
Xu等,J.Biol.Chem.,26816065-16073,1993.
序列表<110>M.J.拉泰恩(RATAIN,MARK J.)W.劉(LIU,WANQING)F.伊諾桑蒂(INNOCENTI,F(xiàn)EDERICO)<120>表皮生長因子受體基因啟動子的多態(tài)性<130>ARCD404WO<140>未知<141>2005-03-01<150>60/549,069<151>2004-03-01<160>38<170>PatentIn Ver.2.1<210>1<211>525<212>DNA<213>智人(Homo sapiens)<400>1gaaattaact cctcagggca cccgctcccc tcccatgcgc cgccccactc ccgccggaga60ctaggtcccg cgggggccac cgctgtccac cgcctccggc ggccgctggc cttgggtccc120cgctgctggt tctcctccct cctcctcgca ttctcctcct cctctgctcc tcccgatccc180tcctccgccg cctggtccct cctcctcccg ccctgcctcc ccgcgcctcg gcccgcgcga240gctagacgtc cgggcagccc ccggcgcagc gcggccgcag cagcctccgc cccccgcacg300gtgtgagcgc ccgacgcggc cgaggcggcc ggagtcccga gctagccccg gcggccgccg360ccgcccagac cggacgacag gccacctcgt cggcgtccgc ccgagtcccc gcctcgccgc420caacgccaca accaccgcgc acggccccct gactccgtcc agtattgatc gggagagccg480gagcgagctc ttcggggagc agcgatgcga ccctccggga cggcc525<210>2<211>4990<212>DNA<213>智人(Homo sapiens)<400>2ctccacagag gctgtgagct agagccctaa ctgtgcaggg ccctaactat gccaggctac60ttatctctct taagaggact tcattagtgc ctgctcggcc atacagtttt ttacttacca120agtaacacag ttatcagcac actccaggta ctagccaagg actacaaaat caacgtgaat180gtcagctttt gtatcaaaag ctcaaaggag aaactcaaac tttacataga tgtcccatga240agatgttcag caaacccatt cttctctgtt ccctggaatc catcccagta ttgtgctatg300tgtgtgtcta gtaattcttt acaaaaagct ctgtttcttg tgatgctatc agatcacatt360gaagaatata caagccgtac tatgaaggct gttgtctcat atagtcctaa cgtagtgaga420actgatgttc ttacatgctg tctttttggg cactcaaaga aattcctgta cagtcttaca480aatcagttgt agcttaaatt gatttgtgtt gtgacttgta cacacaggtc acattccctt540
gacagaaaat atagtttaaa accaaatttg cagcccttgt taagtgaatg cacaggactt600tattgtattc aggtctttta ttgtaagact cactcctgtc ttcattttat gttccactgt660tgtgcttccc atttgccttt ctctagtttt gttttctgtg tttctacgga ctgctctcag720cccaggtgtg caggaagcac acacatgcct gcagagcctt catggcctct gcattcaggg780catgacttca acgcacagtg gctgtactga tttgttaaaa caaaggaaca gattacttct840cctaattcac agggaagttc caggttgtgc gggcagtgag cagacctgtg tctgtctgcg900cttgccctgg tgaaaaaccc caccgttcag gctgcagggt gcgagaccca ggcacaaaca960ttttgctgga tgaggaggaa agatgtaagg ttgctcccct tcagagacag caaagggcag1020gtctgtagct tcacttactt caggattgtg atttttgaca gagccgagag atcagggttg1080ttgaaccagg cctgaaggtc ctagtgaatc tcgtgaagag aggaggggtc tggctgtaac1140atggacctag aggacatttt tactgcagga gaaggaacag tggggatggg gtggacttgc1200caaaggaata tagctcaagt tcctgcagcc caaaaaagct cagtttcttt tggccaaagc1260ttccgcgagt ttccctggca tttctcctgc gggagctaca ggggcagtgg gacacttagc1320ctctctaaaa gcacctccac ggctgtttgt gtcaagcctt tattccaaga gcttcacttt1380tgcgaagtaa tgtgcttcac acattggctt caaagtaccc atggctggtt gcaataaaca1440ttaaggaggc ctgtctctgc acccggagtt gggtgccctc atttcagatg atttcgaggg1500tgcttgacaa gatctgaagg accctcggac tttagagcac cacctcggac gcctggcacc1560cctgccgcgc gggcacggcg acctcctcag ctgccaggcc agcctctgat ccccgagagg1620gtcccgtagt gctgcagggg aggtggggac ccgaataaag gagcagtttc cccgtcggtg1680ccattatccg acgctggctc taaggctcgg ccagtctgtc taaagctggt acaagtttgc1740tttgtaaaac aaaagaaggg aaagggggaa ggggaccctg gcacagattt ggctcgacct1800ggacataggc tgggcctgca agtccgcggg gaccgggtcc agaggggcag tgctgggaac1860gcccctctcg gaaattaact cctcagggca cccgctcccc tcccatgcgc cgccccactc1920ccgccggaga ctaggtcccg cgggggccac cgctgtccac cgcctccggc ggccgctggc1980cttgggtccc cgctgctggt tctcctccct cctcctcgca ttctcctcct cctctgctcc2040tcccgatccc tcctccgccg cctggtccct cctcctcccg ccctgcctcc ccgcgcctcg2100gcccgcgcga gctagacgtc cgggcagccc ccggcgcagc gcggccgcag cagcctccgc2160cccccgcacg gtgtgagcgc ccgacgcggc cgaggcggcc ggagtcccga gctagccccg2220gcggccgccg ccgcccagac cggacgacag gccacctcgt cggcgtccgc ccgagtcccc2280gcctcgccgc caacgccaca accaccgcgc acggccccct gactccgtcc agtattgatc2340gggagagccg gagcgagctc ttcggggagc agcgatgcga ccctccggga cggccggggc2400agcgctcctg gcgctgctgg ctgcgctctg cccggcgagt cgggctctgg aggaaaagaa2460aggtaagggc gtgtctcgcc ggctcccgcg ccgcccccgg atcgcgcccc ggaccccgca2520gcccgcccaa ccgcgcaccg gcgcaccggc tcggcgcccg cgcccccgcc cgtcctttcc2580tgtttccttg agatcagctg cgccgccgac cgggaccgcg ggaggaacgg gacgtttcgt2640tcttcggccg ggagagtctg gggcgggcgg aggaggagac gcgtgggaca ccgggctgca2700ggccaggcgg ggaacggccg ccgggacctc cggcgccccg aaccgctccc aactttcttc2760cctcactttc cccgcccagc tgcgcaggat cggcgtcagt gggcgaaagc cgggtgctgg2820tgggcgcctg gggccggggt cccgcacgtg cgccccgcgc tgtcttccca gggcgcgacg2880gggtcctggc gcgcacccga ggggcgggcg ctgcccaccc gccgagactg cactgtttag2940ggaagctgag gaaggaaccc aaaaatacag cctcccctcg gaccccgcgg gacaggcggc3000tttctgagag gacctccccg cctccgccct ccgcgcaggt ctcaaactga agccggcgcc3060cgccagcctg gccccggccc ctctccaggt ccccgcgatc ctcgttcccc agtgtggagt3120cgcagcctcg acctgggagc tgggagaact cgtctaccac cacctgcggc tcccggggag3180gggtggtgct ggcggcggtt agtttcctcg ttggcaaaag gcaggtgggg tccgacccgc3240cccttgggcg cagaccccgg ccgctcgcct cgcccggtgc gccctcgtct tgcctatcca3300agagtgcccc ccacctcccg gggaccccag ctccctcctg ggcgcccgcg ccgaaagccc3360caggctctcc ttcgatggcc gcctcgcgga gacgtccggg tctgctccac ctgcagccct3420tcggtcgcgc ctgggcttcg cggtggagcg ggacgcggct gtccggccac tgcagggggg3480gatcgcggga ctcttgagcg gaagccccgg aagcagagct catcctggcc aacaccatgg3540tgtttcaaaa tggggctcac agcaaacttc tcctcaaaac ccggagactt tctttcttgg3600atgtctcttt ttgctgtttg aagaatttga gccaaccaaa atattaaacc tgtcttacac3660
acacacacac acacacacac acacacacac cggattgctg tccctggttc aagtgtgcca3720agtgtgcaga cagaacatga gcgagtctgg cttcgtgact accgaccata aacccacttg3780acaggggaaa catgccttgg aaggtttaat tgcacaattc caaccttgag ctgcgcgggt3840tccaagagcc aggcccgtac ttgctgttga tgtcattggc ttggggagtt ggggtttggt3900gcccagcgcg gtcgttgggg gaggggcaag gcatagaaca gtggttccca gaccttgctg3960cacattggaa ttacctggga ttaaaaaaaa aaaaatcaaa acaaaaacca gtgtctggct4020cccgccccca gacattctga tttaattggc atggggcaag acctggactt gggatttttt4080ttaatgctct tcatgtgatc tgttgggcag ccagatttgg ggatcactag acggaagaag4140gattgttaaa gtctccggag atgttacttg ccaatgctaa gagctctttg aggacatctg4200gaattgttac aatattgcca aatataggaa agagggaaaa ggtagagtgt gattccaata4260ataaaggatt ccgcttttca ttgaaggaac tggtggaaag gtttcttctc tgctgagcct4320gcaggcccgt cctgcctgcc tggggtgccc gggagacgcg ggcctgctcc ggagactgct4380gactgccggt cctgttagtc aggtgtcagc cctgtctctg ccgaagagac tcttctcttt4440attttaaatt aaaccctcag agcaccacca aagcatcact tttctccctc cattggtgtt4500ctcattcttt gatgttactt gtttgaacac cactattagt agttggagat ttgttcctga4560gaaaaatata aataccactt aatttgcctg tttgtcccgc attcactcaa aacagaatgc4620tcctgaagac aagagagaga gtaggagaac agacgctatt ccattacagt aacataaaag4680actggatttt caggggcaaa ttattaaaat aggagatgag ctcttttaac agaaatttgt4740ttaaggcctg tgtctatcaa attcagtgga ttttattcaa gatgcacttt gtttagtggg4800agttttgttt ggttctggga catgctaact tctagacttg ctgctcttag aggtaatgac4860tgccagacac catttcatga gtcctaatcc ccacattaag cataagaggt gcacactctc4920ctcctatggg ggaaactgag gtacgaagaa ctaaagtgac tttcccacag ctggtgggag4980gcagacggga 4990<210>3<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>3gttccactgt tgtgcttccc 20<210>4<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>4aagaaagttg ggagcggttc 20<210>5<211>19<212>DNA
<213>人工序列<220>
<223>人工序列的描述合成引物<400>5gggtggactt gccaaagga19<210>6<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>6cttagagcca gcgtcggata 20<210>7<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>7gcatgacttc aacgcacagt 20<210>8<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>8gaggctaagt gtcccactgc 20<210>9<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物
<400>9tcggacttta gagcaccacc 20<210>10<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>10gaggaggaga atgcgaggag 20<210>11<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>11aaattaactc ctcagggcac c 21<210>12<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>12cgcccttacc tttcttttcc 20<210>13<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>13ccctgactcc gtccagtatt 20
<210>14<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>14cgtcctttcc tgtttccttg 20<210>15<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>15accagctgtg ggaaagtcac 20<210>16<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>16agacgagttc tcccagctcc 20<210>17<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>17gcgcaggtct caaactgaag 20<210>18<211>20<212>DNA
<213>人工序列<220>
<223>人工序列的描述合成引物<400>18ggagaagttt gctgtgagcc20<210>19<211>19<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>19ccctcgtctt gcctatcca 19<210>20<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>20agtgatcccc aaatctggct20<210>21<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>21ggcatagaac agtggttccc20<210>22<211>20<212> DNA<213>人工序列<220>
<223>人工序列的描述合成引物
<400>22gaacaccaat ggagggagaa20<210>23<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>23tgaaggaact ggtggaaagg20<210>24<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>24catgtcccag aaccaaacaa20<210>25<211>28<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>25ccaccggtac cggcggccgc tggccttg 28<210>26<211>23<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>26cggcgagaca cgcccttacc ttt23
<210>27<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>27gcagcctccg ccccccgcac ggtgt 25<210>28<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>28acaccgtgcg gggggcggag gctgc 25<210>29<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>29gcagcctccg ccccccgcac ggtgt 25<210>30<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>30acaccgtgcg gggggcggag gctgc 25<210>31<211>25<212>DNA
<213>人工序列<220>
<223>人工序列的描述合成引物<400>31gcagcctcct ccccccgcac ggtgt 25<210>32<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>32acaccgtgcg gggggaggag gctgc 25<210>33<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>33gcagcctcct ccccccgcac ggtgt 25<210>34<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>34acaccgtgcg gggggaggag gctgc 25<210>35<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物
<400>35attcgatcgg ggcggggcga gc 22<210>36<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>36gctcgccccg ccccgatcga at 22<210>37<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>37attcgatcgg ggcggggcga gc 22<210>38<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述合成引物<400>38gctcgccccg ccccgatcga at 2權(quán)利要求
1.一種評價EGFR靶向治療藥物治療癌癥病人潛在效力的方法,其特征在于,所述方法包括測定病人一種或兩種EGFR基因中的多態(tài)性序列。
2.如權(quán)利要求1所述的方法,其特征在于,所述多態(tài)性位于選自以下的核苷酸位置或與選自以下的核苷酸位置連鎖不平衡核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
3.如權(quán)利要求2所述的方法,其特征在于,所述多態(tài)性是選自以下的多態(tài)性或與選自以下的多態(tài)性連鎖不平衡-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
4.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括測定病人一種或兩種EGFR基因中的至少兩種多態(tài)性序列。
5.如權(quán)利要求1所述的方法,其特征在于,所述EGFR靶向治療藥物是EGFR酪氨酸激酶抑制劑。
6.如權(quán)利要求5所述的方法,其特征在于,所述EGFR酪氨酸激酶抑制劑是吉非替尼或埃羅替尼。
7.如權(quán)利要求1所述的方法,其特征在于,所述EGFR靶向治療藥物是單克隆抗體。
8.如權(quán)利要求7所述的方法,其特征在于,所述單克隆抗體是西妥昔單抗。
9.如權(quán)利要求3所述的方法,其特征在于,所述多態(tài)性是-216 G>T。
10.如權(quán)利要求9所述的方法,其特征在于,某等位基因-216位為T表示EGFR蛋白表達較高,而EGFR蛋白表達較高表示EGFR靶向治療藥物的療效降低。
11.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括測定病人兩種EGFR基因中的多態(tài)性序列。
12.如權(quán)利要求1所述的方法,其特征在于,用雜交試驗測定多態(tài)性序列。
13.如權(quán)利要求1所述的方法,其特征在于,用等位基因特異性擴增試驗測定多態(tài)性序列。
14.如權(quán)利要求1所述的方法,其特征在于,用測序或微量測序試驗測定多態(tài)性序列。
15.如權(quán)利要求1所述的方法,其特征在于,用限制性酶消化測定多態(tài)性序列。
16.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括獲得樣品。
17.如權(quán)利要求16所述的方法,其特征在于,所述樣品包括口腔細胞、單核細胞或癌細胞。
18.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括給予病人EGFR靶向治療藥物。
19.一種預(yù)測癌癥病人臨床預(yù)后的方法,其特征在于,所述方法包括測定病人一種或兩種EGFR基因中的多態(tài)性序列。
20.如權(quán)利要求19所述的方法,其特征在于,所述方法還包括測定病人兩種EGFR基因中的多態(tài)性序列。
21.如權(quán)利要求19所述的方法,其特征在于,所述多態(tài)性位于選自以下的核苷酸位置或與選自以下的核苷酸位置連鎖不平衡核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
22.如權(quán)利要求21所述的方法,其特征在于,所述多態(tài)性是選自以下的多態(tài)性或與選自以下的多態(tài)性連鎖不平衡-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
23.如權(quán)利要求22所述的方法,其特征在于,所述多態(tài)性是-216 G>T。
24.如權(quán)利要求23所述的方法,其特征在于,等位基因-216位為T表示EGFR蛋白表達增加。
25.如權(quán)利要求24所述的方法,其特征在于,EGFR蛋白表達增加預(yù)示預(yù)后不良。
26.如權(quán)利要求25所述的方法,其特征在于,預(yù)后不良表示對化療、激素療法或放療的抗藥性增強。
27.如權(quán)利要求25所述的方法,其特征在于,預(yù)后不良表示轉(zhuǎn)移風(fēng)險增加。
28.一種評價病人對EGFR靶向治療藥物毒性風(fēng)險的方法,其特征在于,所述方法包括測定病人一種或兩種EGFR基因中的多態(tài)性序列。
29.如權(quán)利要求28所述的方法,其特征在于,所述多態(tài)性位于選自以下的核苷酸位置或與選自以下的核苷酸位置連鎖不平衡核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
30.如權(quán)利要求29所述的方法,其特征在于,所述多態(tài)性是選自以下的多態(tài)性或與選自以下的多態(tài)性連鎖不平衡-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
31.如權(quán)利要求30所述的方法,其特征在于,所述多態(tài)性是-216 G>T。
32.如權(quán)利要求31所述的方法,其特征在于,一種或多種等位基因-216位為T表示EGFR靶向治療藥物的毒性降低。
33.如權(quán)利要求28所述的方法,其特征在于,所述方法還包括測定病人兩種EGFR基因中的多態(tài)性序列。
34.一種預(yù)測細胞中EGFR表達水平的方法,其特征在于,所述方法包括測定細胞EGFR基因的一種或兩種等位基因中-216位的序列,其中,一種或兩種等位基因-216位為T表示表達水平較高。
35.一種評價EGFR靶向治療藥物治療EGFR失調(diào)相關(guān)疾病病人的潛在效力的方法,其特征在于,所述方法包括測定病人一種或兩種EGFR基因中的多態(tài)性序列。
36.一種評價EGFR靶向治療藥物在病人中的潛在效力的試劑盒,其特征在于,所述試劑盒裝有用于測定EGFR基因座中多態(tài)性序列的核酸。
37.如權(quán)利要求36所述的試劑盒,其特征在于,所述核酸是用來擴增位于選自以下氨基酸位置的多態(tài)性的引物-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
38.如權(quán)利要求36所述的試劑盒,其特征在于,所述核酸是設(shè)計用來檢測選自以下核苷酸位置的多態(tài)性的特異性雜交探針-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
39.如權(quán)利要求38所述的試劑盒,其特征在于,所述特異性雜交探針包含在寡核苷酸陣列或微陣列中。
40.一種評價EGFR靶向治療藥物在病人中潛在效力的試劑盒,其特征在于,所述試劑盒裝有用于測定EGFR基因座中多態(tài)性序列的限制性酶。
全文摘要
本發(fā)明涉及表皮生長因子受體(EGFR)基因的多態(tài)性。在某些實施方案中,本發(fā)明是關(guān)于EGFR基因啟動子中影響EGFR表達的單核苷酸多態(tài)性(SNP)的組合物和方法。鑒定與EGFR表達或活性相關(guān)的多態(tài)性,可為評價EGFR靶向治療藥物的潛能和毒性,預(yù)測病人的臨床預(yù)后,和為評價病人發(fā)生EGFR失調(diào)相關(guān)疾病的風(fēng)險提供新的方法和組合物。
文檔編號A61K31/713GK101056990SQ200580006465
公開日2007年10月17日 申請日期2005年3月1日 優(yōu)先權(quán)日2004年3月1日
發(fā)明者M·J·拉泰恩, W·劉, F·伊諾桑蒂 申請人:芝加哥大學(xué)