專利名稱:用于確定CYP2D6基因的基因型的htSNP及其用于多重基因分型的方法
技術(shù)領(lǐng)域:
本發(fā)明的設(shè)備和方法涉及用于確定細(xì)胞色素P450認(rèn)2、2々6和206、?)0 和皿 -葡萄糖醛酸基轉(zhuǎn)移酶IA基因的基因型的單倍型標(biāo)簽單核苷酸多態(tài)性(htSNP)和基因芯片,更具體而言,涉及用于確定人類CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA基因的單倍型的htSNP的選擇方法、確定所述基因的基因型的方法和用于所述方法的基因芯片。
背景技術(shù):
出于遺傳多樣性的原因,個體對藥物的毒性和效果會有不同反應(yīng)。因此,在藥物的初始開發(fā)階段考慮重要藥用蛋白相對于遺傳多樣性的效果是必要的,因為這可以降低藥物開發(fā)的可能性失敗。單倍型是決定個體之間的遺傳多樣性的因素之一。單倍型指的是在單個研究種群中每個基因序列的多態(tài)性的組合。單倍型比個體多態(tài)性提供了更準(zhǔn)確和更可靠的關(guān)于遺傳多樣性的信息。人類細(xì)胞色素P450是血紅蛋白的一部分,血紅蛋白協(xié)助氧化外來化學(xué)物質(zhì)如藥物、致癌物質(zhì)和毒素以及內(nèi)部物質(zhì)如膽固醇、脂肪酸和維生素(Nelson等, Pharmacogenetics 6 :1-42,1996) 在肝、腎、小腸和肺中發(fā)現(xiàn)了細(xì)胞色素P450的各種亞科。人類細(xì)胞色素P450 1A2 (下文稱CYP1A2)基因以及CYPlAl和CYPlBl都是CYPl 基因群中包含的藥物代謝酶。CYP1A2主要在肝臟中產(chǎn)生,并占細(xì)胞色素酶總量的15%。 CYP1A2參與重要醫(yī)用藥物如咖啡因、氯氮平(clozapine)、丙咪嗪(imiparamine)和普萘洛爾(propranolol)的代謝。另外,CYP1A2催化內(nèi)部合成物質(zhì)(如17 β-雌二醇、尿卟啉原III),以及致癌物質(zhì)的生物活化(如多環(huán)芳烴的環(huán)氧化和芳香胺/雜環(huán)胺的N-羥基化)(Brosen K. , Clinical Pharmacokinetic, 1995, 29 (suppll) :20-25 ; Josephy PD., Environ. Mol. Mutagen, 2001, 38 :12-18)。人類細(xì)胞色素 P4502A6(下文稱 CYP2A6)基因位于19號染色體上,而具有非常相似的基因序列的偽基因CYP2A7處于CYP2A6基因之上。 CYP2A6酶是一種將尼古丁轉(zhuǎn)化為可替寧(cotinine)的主要酶,且CYP2A6酶參與大約80% 的尼古丁代謝。CYP2A6酶將抗癌藥物替加氟(tegafur)轉(zhuǎn)化為體內(nèi)活性藥物5-氟尿嘧啶(5-FU)。所述酶主要由肝臟產(chǎn)生,并且在諸如肺、大腸、乳腺、腎和子宮等器官中少量表達(Drus Metab Dispos. ,29(2) :91-5,2001 ;Adv Drug Deliv Rev. , 18 ;54(10) 1245—56, 2002)。人類細(xì)胞色素P4502D6(下文稱CYP2D6)基因位于22號染色體上,而偽基因CYP2D7和CYP2D8處于CYP2D6基因的一端。已知由所述基因編碼的酶負(fù)責(zé)100種以上的重要臨床藥物(包括精神活性藥物、心血管藥物、嗎啡藥物等)的代謝。由所述CYP2D6基因編碼的酶主要由肝臟產(chǎn)生。盡管所述酶占細(xì)胞色素P450酶總量的大約2%,它們卻是參與30%的藥物代謝的主要酶類。所述酶在個體中的活性各異,并根據(jù)其活性級別被劃分為PM(弱代謝劑)、IM(中等代謝劑)、EM(強代謝劑)和UM(超快代謝劑)。所述基因的遺傳多態(tài)性部分地造成了所述酶的不同活性。眾所周知,CYP1A2基因展現(xiàn)了遺傳多態(tài)性。到目前為止,在所述CYP1A2基因的啟動子、外顯子和內(nèi)含子中發(fā)現(xiàn)了 M種以上的變異體。到2007年6月為止,已有36種單倍型(遺傳變異體的組合)(http//www. cypalleles. ki. se/cypla2. htm)、50 種 CYP2A6 的基因型(http://www. cypalleles. ki. se. cyp2a6. htm)以及大約 80 種 CYP2D6 基因的遺傳多態(tài)性(www. immi. ki. se. cypalleles/cyp2d6. htm),它們在物種之間有極大的差異。由于各種類型的基因變異體和單倍型已經(jīng)被報道過,因此有必要通過最小的單核苷酸多態(tài)性 (SNP)確定準(zhǔn)確的單倍型從而增強時間和成本有效性。在各種藥物被人體吸收并排出以前,代謝和轉(zhuǎn)運將一直進行。細(xì)胞色素P450 (CYP) 和藥物轉(zhuǎn)運蛋白參與代謝和轉(zhuǎn)運。對參與藥物代謝的CYP酶的研究一直在積極地進行。目前,15 種 CYP 酶,尤其是 CYP2D6、CYP2C9、CYP3A4、CYP2B6、MDRl 和 CYP2C19,已被報道具有遺傳多態(tài)性。所述遺傳多態(tài)性是影響所述酶的藥物底物的臨床效果、治療效果和副作用的主要因素。一些遺傳變異體造成酶的沉積而根本不能代謝藥物。其它遺傳變異體使酶活性部分地降低。例如,諸如CYP2D6和CYP2C9等酶根據(jù)所述遺傳變異體的不同而在表型上不同,且基因型和表型之間具有相對較高的相似性。同時,很難根據(jù)功能性遺傳變異體的存在與否來預(yù)測CYP3A4、CYP2B6和MDRl基因的表型。就人類而言,代謝50%的所有服用藥物的CYP3A4在個體之間顯示出極大的活性差異。已知CYP2B6在個體之間表現(xiàn)出最大270倍的差異。盡管個體差異如此之大,個體之間的活性差異仍很難直接從基因型來預(yù)測,因為基因型和表型之間具有低相關(guān)性的藥物代謝酶或藥物轉(zhuǎn)運蛋白的蛋白表達根據(jù)外部因素的不同而出現(xiàn)極大的不同。對于這些基因而言,蛋白的表達調(diào)節(jié),而非遺傳變異體的存在與否,可能是更重要的導(dǎo)致代謝活性的個體差異的因素。當(dāng)所述酶的表達被誘導(dǎo)后,這些酶自己大量生成來提高活性。表達誘導(dǎo)的機理通過將包含藥物受體的外部材料與目標(biāo)基因的啟動子相結(jié)合來實現(xiàn)。所述藥物受體的典型實例是已知在NRl 12基因中表達的孕烷X受體(PXR)。據(jù)報道,P)(R的表達量根據(jù)個體的不同而不同。有趣的是,所述受體的表達量與藥物代謝酶如CYP3A4和CYP2B6的表達量具有高度相關(guān)性(Current Drug Metabolism, 2005, 6 :369-383) 0于是,個體之間的所述藥物代謝酶的表達量差異取決于所述P)(R基因的表達量差異或活性差異,而不是取決于變異體蛋白。在這點上,對個體P)(R基因的遺傳多態(tài)性或所述P)(R基因的表達差異的研究近來引起了關(guān)注。有報道稱,盡管氨基酸序列并未改變,一些遺傳變異體仍導(dǎo)致個體對藥物反應(yīng)的差異,如因紅霉素呼吸測試或體內(nèi)利福平(rifampin)引起的CYP3A4活性提升。這些PXR 變異體由于所述目標(biāo)基因的表達變化而導(dǎo)致活性變化。因此,所述P)(R變異體可能導(dǎo)致藥物或者生物分子在體內(nèi)的活性差異,并極大地影響藥物(P)CR基因的耦合劑)引起的藥物相互作用的個體差異。
6
UDP-葡萄糖醛酸基轉(zhuǎn)移酶(UGT)是催化葡萄糖醛酸與體內(nèi)內(nèi)源性物質(zhì)和外源性物質(zhì)相結(jié)合的酶。所述UDP-葡萄糖醛酸基轉(zhuǎn)移酶產(chǎn)生諸如苯酚、乙醇、胺和脂肪酸化合物等具有毒性的物質(zhì)的葡萄糖醛酸耦合劑,并把這些物質(zhì)轉(zhuǎn)化為親水材料以從人體經(jīng)膽汁或尿排出(Parkinson A, Toxicol Pathol. ,24 :48-57,1996) 據(jù)報道,所述UGT主要存在于間質(zhì)細(xì)胞的內(nèi)質(zhì)網(wǎng)或核膜內(nèi),且在其它組織諸如腎和皮膚中也有表達。所述UGT酶可以根據(jù)一級氨基酸序列的相似性大致劃分為UGTl和 UGT2亞科。人類UGTlA族有9種異構(gòu)體(UGT1A1和UGT1A3 UGT1A10)。其中,五種異構(gòu)體 (UGT1A1、UGT1A3、UGT1A4、UGT1A6和UGT1A9)由肝臟表達。所述UGTlA基因家族的遺傳多態(tài)性因人而異。已知相對于UGT1A1、UGT1A3 UGT1A10基因存在數(shù)種遺傳多態(tài)性(http:// galien. pha. ulaval. ca/alleles/alleles. html)。所述 UGTlA 基因的多態(tài)性在種族之間有極大的差異。已證實酶的活性因多態(tài)性的不同而不同,而多態(tài)性是決定對于藥物治療的敏感性的重要因素。UGTlAlt和UGT1A158與吉爾伯特綜合征有關(guān)(Monaghan G. Lancet, 347 578-581,1996)。另外,已報道了與各種疾病相關(guān)的各種功能性變異體。由于已報道了各種類型的遺傳變異體和單倍型,所以搜索方法應(yīng)當(dāng)是有效的。所述單倍型可以由ArlequiruSNPalyze或其它類似軟件進行分析。分析所有單核苷酸多態(tài)性 (SNP)來搜索每種單倍型的遺傳變異體會在成本和時間上不夠有效。為了提高效率,可以提供單倍型標(biāo)簽SNP(htSNP)選擇方法。所述htSNP選擇方法是一種選擇最小標(biāo)簽組來準(zhǔn)確標(biāo)記每種單倍型的方法。如果確定了所選SNP,則可以預(yù)測所有單倍型。對于許多基因而言,遺傳多態(tài)性的分布因種族的不同而不同。因此,有必要檢查先天遺傳變異體和單倍型是否頻繁出現(xiàn)在高麗人中,而如果是的話,它們有多頻繁,以及如何根據(jù)單倍型選擇htSNP。然而,對高麗人的基因中的遺傳變異體、與之對應(yīng)的單倍型和根據(jù)每種單倍型的htSNP選擇的研究并不多。近來,已報道了一種通過對主要發(fā)現(xiàn)于白種人中的CYP2D6遺傳變異體進行 SNaPshot 分析來確定 11 種 SNP 的方法(Sistonen J 等,Clin Chem. 2005Jul ;51 (7) 1291-1295), ^P Roche或Jurilab公司的CYP2D6診斷芯片。然而,它們集中在發(fā)現(xiàn)于白種人中的CYP2D6遺傳變異體上。對診斷包括高麗人在內(nèi)的亞洲人的CYP2D6遺傳變異體的研究還不足。因此,本發(fā)明人研究開發(fā)了一種短時間內(nèi)準(zhǔn)確確定主要發(fā)現(xiàn)于高麗人中的人類 CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA基因的變異體的方法。本發(fā)明提供了對主要發(fā)現(xiàn)于高麗人中的人類CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA遺傳變異體的htSNP選擇方法,以便證明所選htSNP的可用性。
發(fā)明內(nèi)容
因此,本發(fā)明的一個方面提供了用于確定發(fā)現(xiàn)于高麗人中的CYP1A2、CYP2A6、 CYP2D6、NRl 12 ( = PXR)和UGTlA基因的單倍型的htSNP選擇方法。 另外,本發(fā)明的另一方面提供了使用所述htSNP確定人類CYP1A2、CYP2A6、 CYP2D6、NR1I2( = PXR)和UGTlA基因的基因型的方法。 另外,本發(fā)明的另一方面還提供了使用包含基因芯片的試劑盒來確定人類CYP2D6基因的基因型的方法。總發(fā)明構(gòu)思的其它方面和優(yōu)點將在下面的說明中部分闡明,并將部分地根據(jù)所述說明而顯而易見,或可通過實踐所述總發(fā)明構(gòu)思而得到理解。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供選自人類CYP1A2、CYP2A6、CYP2D6、 P)(R和UGTlA基因中的基因的htSNP的選擇方法而實現(xiàn),所述方法包括從人類收集生物樣本;從操作(a)中所收集的樣本中提取核酸;用引物進行PCR(聚合酶鏈?zhǔn)椒磻?yīng)),該反應(yīng)使用操作中所提取的核酸作為模板來擴增選自人類CYP1A2、CYP2A6、CYP2D6、P)(R和UGTlA基因中的基因或其片段;由操作(c)中所得PCR產(chǎn)物的基因序列確定變異體的存在;由在操作(d)中已確定具有變異體的PCR產(chǎn)物的基因序列確定單倍型;和用SNPtagger軟件對操作(d)中分析的所述單倍型進行測序并選擇SNP。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定人類CYP2A2基因的基因型的方法而實現(xiàn),所述方法包括(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取基因組DNA; (c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的基因組DNA作為模板來擴增人類CYP1A2基因或其片段;和(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定CYP1A2基因的至少11種變異體的存在,所述至少11種變異體選自-3860G > A、_3598G
>Τ、-3594Τ > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、-2467delT、-1708T
>C、-739T > G、-163C > A、1514G > A、2159G > A、2321G > C、3613T > C、5347C > T 和 5521A > G0本發(fā)明的上述和/或其它方面和優(yōu)點通過提供檢測CYP1A2啟動子基因中的變異體的方法實現(xiàn),所述方法包括(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取基因組DNA ; (c)用引物進行PCR,該反應(yīng)使用操作(b)中所得基因組DNA作為模板來擴增人類CYP1A2基因的啟動子區(qū)域;(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定CYP1A2遺傳變異體的存在,所述CYP1A2遺傳變異體包括-3860G>A、-3598G>T、-3594T
>G、-3113G > A、-2847T > C、-2808A > C、_2603insA、_2467delT、-1708T > C、-739T > G 和-163C > A0本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定人類CYP2A6基因的基因型的方法實現(xiàn),所述方法包括(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所得核酸作為模板來擴增人類 CYP2A6基因或其片段;和(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定CYP2A6遺傳變異體的存在,所述CYP2A6遺傳變異體選自-48T > G、13G > A、567C > T、2134A > G、 3391T > C、6458A > T、6558T > C、6582G > T、6600G > T 和 6091C > Τ。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定人類CYP2D6基因的基因型的方法實現(xiàn),所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所得的核酸作為模板來擴增人類 CYP2D6基因或其片段;和(d)確定CYP2D6基因中至少11種變異體的存在,所述至少11種變異體包括選自> TUOOC > !“和1039C > T中的一種;選自-1(^8T > C、-377Α
>G、3877G > A、4388C > T 和 4401C > T 中的一種;選自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、245A > G 和 2850C > T 中的一種; 1611T > A ;1758G > A ;1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;2D6 刪除;和2D6重復(fù)。 本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定P)(R基因的基因型的方法實現(xiàn),所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸; (c)用引物進行PCR,該反應(yīng)使用操作(b)中所得核酸作為模板來擴增人類P)(R基因或其片段;和(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中研究P)(R基因的遺傳變異體的存在,所述遺傳變異體選自-25385C > T、-24113G > A.7635A > G、8055C > TU1156A > C 和 11193T > C。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定UGTlA基因的功能性變異體的方法實現(xiàn),所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)使用操作(b)中所提取的核酸作為模板來單獨地擴增人類UGTlA基因;和(d) 對操作(c)中擴增的所述基因測序并確定所述UGTlA基因中功能性變異體的存在,所述功能性變異體選自:UGT1A1 基因中的-39 (TA) 6 > (TA)7、211G > A,233C > T 禾口 686C > A ; UGT1A3 基因中的 31T > CU33C > T 禾日 140T > C ;UGT1A4 基因中的 31C > TU42T > 6和 292C > T ;UGT1A6 基因中的 19T > G、541A > G 和 552A > C ;UGT1A7 基因中的 387T > G、 391C > A、392G < A、622T > C 和 701T > C ;和 UGT1A9 基因中的-118T9 > T10、726T > G 和 766G > A0本發(fā)明的上述和/或其它方面和優(yōu)點通過提供確定UGTlA基因的與對依立替康 (irinotecan)的敏感性相關(guān)的多態(tài)性的方法而實現(xiàn),所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)使用操作(b)中所提取的核酸作為模板來擴增人類UGTlA基因;和(d)對操作(c)中擴增的所述人類UGTlA基因測序并確定所述UGTlA基因中變異體的存在,所述變異體選自=UGTlAl基因中的211G > A、233C > 丁和 686C > A ;UGT1A6 基因中的 19T > G、541A > 6和 552A > C ;和 UGT1A9 基因中的-118T9 > T10、726T > 6和 766G > Α。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供用基因芯片確定人類CYP2D6基因的基因型的方法實現(xiàn),所述方法包括(a)提取待研究的基因并進行多重PCR以獲得包含待鑒定的SNP的邊界(circumference)的PCR產(chǎn)物;(b)用識別等位基因的特異性堿基的 ASPE (等位基因特異性引物延伸)引物進行ASPE反應(yīng);(c)將所述反應(yīng)產(chǎn)物與基因芯片混合;和(d)分析所述基因芯片。本發(fā)明的上述和/或其它方面和優(yōu)點通過提供用于確定CYP2D6基因的基因型的 SNaPshot基因分型試劑盒和用于確定SNP的具有Zip編碼(Zip Code)寡核苷酸芯片的基因芯片來實現(xiàn)。本發(fā)明中所述生物樣本包括對象的血液、皮膚細(xì)胞、粘液細(xì)胞和毛發(fā),且優(yōu)選的是血液。本發(fā)明中所述核酸可以包括DNA或RNA,優(yōu)選的是DNA,更優(yōu)選的是基因組DNA。本發(fā)明中所述變異體將說明如下。本發(fā)明中的術(shù)語“aN>M”或“NaM” (a是正數(shù),N和M分別是A、C、T或G)是指在基因序列中第“a”位的堿基N被堿基M所替代。術(shù)語“ainsN”或“adelN”(a是正數(shù),N是 A、C、T或G)是在基因序列中第“a”位處插入或刪除一個堿基N。例如,“-1M8C > T”變異體是基因序列中第-1584位的C堿基被T堿基替代。
9
“2573insC”變異體是在基因序列中第2573位插入(加入)了 C堿基。 “4125-4133insGTGCCCACT”變異體是在人類CYP2D6基因的第4125 4133位堿基處插入了 9 個堿基 GTGCCCACT。"2D6刪除”變異體是將整個人類CYP2D6基因從染色體中刪除。另外,“2D6重復(fù)”變異體是在同一染色體中重復(fù)了至少2個人類CYP2D6基因。如上所述,本發(fā)明提供了使用最優(yōu)搜索組合來分析與CYP1A2、CYP2A6、CYP2D6、PXR 和UGTlA基因的藥物敏感性相關(guān)的功能性變異體或多態(tài)性的方法,所述最優(yōu)搜索組合基于目前為止還未被檢查的高麗人CYP1A2、CYP2A6、CYP2D6、PXR和UGTIA基因的多態(tài)性。本發(fā)明可以適用于確定包括在遺傳學(xué)特性上與高麗人相似的日本人和中國人以及高麗人在內(nèi)的亞洲人的CYP1A2、CYP2A6、CYP2D6、PXR和UGTlA基因的基因型。
根據(jù)結(jié)合附圖的對本發(fā)明實施方式的下述說明,本發(fā)明的上述和/或其它方面將變得顯而易見且更容易理解,在所述附圖中圖1說明了根據(jù)本發(fā)明首次確定的CYP1A2基因的一種變異體在CYP1A2基因的基因序列中的位置;圖2 6是根據(jù)本發(fā)明選擇的CYP1A2基因的htSNP組合的實例;圖7 14說明了 CYP1A2啟動子基因的變異體的結(jié)果,所述變異體是根據(jù)本發(fā)明選擇的所述CYP1A2基因的功能性變異體(這里,X軸表示取決于引物分子數(shù)量的運動,Y軸表示每個峰的高度),圖7說明了 CYP1A2啟動子的野生型SNP,圖8說明了位于雜合(hetero)變異體中的CYP1A2啟動子的-3860G > A(CYP1A2 *1C) ,-2467delT(CYPlA2*lD)和-163C > A (CYP1A2*1F)變異體,所述雜合變異體在雙鏈 DNA 中含有一個變異體和一個野生型,圖9說明了位于純合(homo)變異體中的CYP1A2啟動子的-3860G > A(CYP1A2*1C ),-2467delT(CYPlA2*lD)和-163C > A (CYP1A2*1F)變異體,所述純合變異體在雙鏈DNA中含有兩個變異體,圖10說明了位于雜合變異體中的CYP1A2啟動子的-163C > A (CYP1A2*1F) 和-2808A > C變異體,圖11說明了位于純合變異體中的CYP1A2啟動子的-163C > A(CYP1A2*1F)變異體,還說明了位于雜合變異體中的 _2467delT(CYPlA2*lD)、-739T > G(CYP1A2*1E)、-3598G > Τ、-3113G > A、-2847T > C 和-1708T > C 變異體,圖12說明了位于純合變異體中的CYP1A2啟動子的-163C > A(CYP1A2*1F)變異體,還說明了位于雜合變異體中的_2467delT(CYPlA2*lD)、-3598G > T和-2847T > C變異體,圖13說明了位于雜合變異體中的CYP1A2啟動子的-163C > A(CYP1A2*1F)、-246 7delT(CYPlA2*lD)和-3594T > G 變異體,圖14說明了位于純合變異體中的CYP1A2啟動子的-163C > A(CYP1A2*1F)變異體,還說明了位于雜合變異體中的-3860G > A (CYP1A2*C)、-2467delT (CYP1A2*1D)和-2603insA變異體;圖15說明了根據(jù)本發(fā)明用于選擇htSNP組合的CYP2A6在高麗人中的單倍型的種類和頻率;圖16 21舉例說明了根據(jù)本發(fā)明選擇的CYP2A6基因的htSNP組合,圖16說明了用于通過在遺傳變異體檢測目標(biāo)中添加6種功能性變異體和具有所謂功能性的3種遺傳變異體來確定CYP2A6基因的單倍型的htSNP組合的選擇,圖17說明了用于確定CYP2A6基因的單倍型的htSNP組合的選擇,所述CYP2A6基因包含8種含有氨基酸替換的變異體、3種具有CYP2A6基因刪除標(biāo)記的變異體和6種頻繁 CYP2A6遺傳變異體,圖18說明了用于確定CYP2A6基因的單倍型的另一 htSNP組合的選擇,所述 CYP2A6基因包含8種含有氨基酸替換的變異體、3種具有CYP2A6基因刪除標(biāo)記的變異體和 6種頻繁CYP2A6遺傳變異體,圖19說明了用于確定CYP2A6基因的單倍型的另一 htSNP組合的選擇,所述 CYP2A6基因包含8種含有氨基酸替換的變異體、3種具有CYP2A6基因刪除標(biāo)記的變異體和 6種頻繁CYP2A6遺傳變異體,圖20說明了用于確定CYP2A6基因的單倍型的另一 htSNP組合的選擇,所述 CYP2A6基因包含8種含有氨基酸替換的變異體、3種具有CYP2A6基因刪除標(biāo)記的變異體和 6種頻繁CYP2A6遺傳變異體,圖21說明了用于確定CYP2A6基因的單倍型的另一 htSNP組合的選擇,所述 CYP2A6基因包含8種含有氨基酸替換的變異體、3種具有CYP2A6基因刪除標(biāo)記的變異體和 6種頻繁CYP2A6遺傳變異體,圖22 30說明了對所選htSNP組合和CYP2A6功能性遺傳變異體組合的SNaPshot 分析的結(jié)果,圖22說明了位于雜合變異體中的CYP2A6基因的-48T > G、2134A > 6和6558T
>C變異體,所述雜合變異體在雙鏈DNA中含有一個變異體和一個野生型,圖23說明了位于雜合變異體中的CYP2A6基因的567C > 7變異體,所述雜合變異體在雙鏈DNA中含有一個變異體和一個野生型,圖M說明了位于雜合變異體中的CYP2A6基因的6458A > T和6558T > C變異體, 所述雜合變異體在雙鏈DNA中含有一個變異體和一個野生型,圖25說明了位于雜合變異體中的CYP2A6基因的-48T > G、13G > A和6558T > C變異體,所述雜合變異體在雙鏈DNA中含有一個變異體和一個野生型,圖沈說明了位于雜合變異體中的CYP2A6基因的3391T > C變異體,所述雜合變異體在雙鏈DNA中含有一個變異體,而另一個被刪除,圖27說明了位于雜合變異體中的CYP2A6基因的-48T > 6和2134A > 6變異體, 所述雜合變異體在雙鏈DNA中含有一個變異體,而另一個被刪除,圖沘說明了位于雜合變異體中的CYP2A6基因的-48T > G、6558T > C和6600G
>T變異體,所述雜合變異體在雙鏈DNA中含有一個變異體,而另一個被刪除,圖四說明了位于雜合變異體中的CYP2A6基因的6458A > T變異體,所述雜合變異體在雙鏈DNA中含有一個變異體,而另一個被刪除,
圖30說明了位于雜合變異體中的CYP2A6基因的6558T > C和6582G > T變異體, 所述雜合變異體在雙鏈DNA中含有一個變異體和一個野生型;圖31和32說明了與圖22 30中所述基因研究一起進行的SNaPshot分析,所述 SNaPshot分析另外確定了除圖22 30中的所述遺傳變異體之外的CYP2A6基因刪除,圖31說明了存在于同源染色體中的CYP2A6基因,圖32說明了不存在于一個染色體中且只有一個基因的CYP2A6基因;圖33說明了部分的CYP2A6基因和CYP2A7基因的共軛連接;圖34 39說明了根據(jù)本發(fā)明選擇的CYP2D6基因的htSNP組合,圖40和41說明了根據(jù)本發(fā)明選擇的CYP2D6基因的htSNP組合之一的SNaPshot 分析結(jié)果;圖42說明了使用基因芯片確定CYP2D6基因的基因型的過程;圖43說明了用于CYP2D6基因的所述基因芯片上的探針;圖44說明了使用長PCR進行的CYP2D6基因擴增;圖45說明了 ASPE反應(yīng)過程;圖46說明了顯示根據(jù)示例性實施方式12對CYP2D6基因中的變異體的分析結(jié)果的基因芯片;圖47說明了根據(jù)本發(fā)明選擇的P)(R基因的htSNP組合;圖48 50說明了搜索根據(jù)本發(fā)明選擇的P)(R基因中的功能性變異體的結(jié)果(這里,X軸表示取決于每個引物的分子數(shù)量的運動,Y軸表示每個峰的高度),圖 48 說明了 PXR基因的-25385C > T、_24113G > A.7635A > G、8055C > TU1156A
>C和11193T > C功能性變異體,所述變異體均為野生型;圖49說明了位于雜合變異體中的PXR基因的-25385C > T、-24113G > A、7635A
>G、8055C > TU1156A > (和11193T > C功能性變異體,所述雜合變異體在雙鏈DNA中
含有一個變異體和一個野生型;圖50說明了位于純合變異體中的PXR基因的-25385C > T、-24113G > A.7635A
>G、8055C > TU1156A > (和11193T > C功能性變異體,所述純合變異體在雙鏈DNA中含有兩個變異體;圖51 M說明了對50個高麗人的UGTlA基因的功能性變異體的分析結(jié)果(這里,X軸表示SNP的位置,Y軸表示每個峰的高度,紅色是T,黑色是C,藍色是G,綠色是A);圖51說明了對UGTlAl (a)和UGT1A3 (b)基因的功能性變異體的分析結(jié)果;圖52說明了對UGT1A4 (a)和UGT1A6 (b)基因的功能性變異體的分析結(jié)果;圖53說明了對UGT1A7基因的功能性變異體的分析結(jié)果;圖M說明了對UGT1A9基因的功能性變異體的分析結(jié)果;圖55說明了對50個高麗人的UGTlAl、UGT1A6和UGT1A9基因的與對依立替康 (irinotecan)的敏感性相關(guān)的多態(tài)性的分析結(jié)果;(a) UGTlAl 基因的 211G > A、233C > T 禾口 686C > A ;UGT1A6 基因的 19T > G、541A
>6和552A > C ;以及UGT1A9基因的726T > 6和766G > A,上述均為野生型,(b)UGTlAl基因的野生型211G >六和233C > T,雜合型686C > A ;UGT1A6基因的雜合型19T > 6和552A > C,野生型MlA > G ;UGT1A9基因的野生型726T > 6和766G >A,(C)UGTlAl 基因的野生型 211G > A、233C > T 和 686C > A ;UGT1A6 基因的雜合型 19T > G、541A > 6和 552A > C ; UGT1A9 基因的雜合型 > G 和野生型 766G > Α,和(d)UGTlAl基因的雜合型211G >六和233C > T,野生型686C > A ;UGT1A6基因的雜合型 19T > G、541A > G 和 552A > C ;UGT1A9 基因的野生型 > G 和 766G > Α。
具體實施例方式下文將參照
本發(fā)明的示例性實施方式,其中相同的附圖標(biāo)記表示相同要素,并且將盡量避免重復(fù)性說明。本發(fā)明可供通過對高麗人CYP1A2基因的變異體分析來確定發(fā)現(xiàn)于高麗人中的 CYP1A2基因的基因型、選擇htSNP作為每個單倍型的最優(yōu)標(biāo)簽組并確認(rèn)其可用性。另外,本發(fā)明可供確定人類CYP1A2基因的新單倍型。本發(fā)明的選擇人類CYP1A2基因的htSNP的方法如下(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 CYP1A2基因或其片段;(d)從操作(c)中所得的PCR產(chǎn)物的基因序列中確定變異體的存在;(e)用SNPtagger軟件對操作(d)中已確定具有變異體的所述PCR產(chǎn)物進行測序。從操作(a)中所收集的樣本中提取核酸的方法沒有限制,是本領(lǐng)域公知的。作為另外一種選擇,可以使用提取試劑盒來提取所述核酸。例如,可以使用由Qiagen公司(美國)和Mratagene公司(美國)生產(chǎn)的DNA或RNA提取試劑盒。如果從所述試劑盒提取的是RNA,則通過逆轉(zhuǎn)錄生產(chǎn)cDNA待用。操作(c)中所述人類CYP1A2基因的片段是指包含人類CYP1A2基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)。擴增所述人類CYP1A2基因或其片段的所述引物可以基于人類CYP1A2基因或其片段的基因序列來設(shè)計,并且可以選自含參照2 31的引物,但不限于此。操作(d)中的所述變異體包括SNP、基因刪除和基因重復(fù),但不限于此。例如,所述變異體可以包括17種變異體,如表5。所述測序方法沒有限制,可以是本領(lǐng)域內(nèi)已知方法。例如,可以使用自動DNA測序儀或進行焦磷酸測序來確定基因序列。所述焦磷酸測序是用于DNA測序中的已知SNP測定方法,是檢測來自DNA聚合時釋放的無機焦磷酸鹽(PPi)的光表達的方法。所述DNA測序可以使用來自參照32 61的引物進行,但不限于此。可以通過比較野生型CYP1A2基因的基因序列來確定操作(d)中變異體的存在??梢允褂盟鲆吧虲YP1A2基因的基因序列,例如參照1的基因序列(基因庫(GenBank)登錄號NT_010194)或本領(lǐng)域內(nèi)已知的每個 CYP1A2 基因型的基因序列(Drug Metab. Pharmacokinet, 2005, 20 (1) :24-33)。單倍型的頻率和類型可以使用本領(lǐng)域內(nèi)已知的技術(shù)程序或市場上銷售的程序來估計。例如,可以使用免費分發(fā)的Haploview,或商業(yè)化程序SNPAlyze。所述Haploview軟件是本領(lǐng)域內(nèi)已知的。更優(yōu)選的是,可以從http://www. broad, mit. edu/mpg/haploview下載所述軟件。本發(fā)明的方法可以另外包括對操作(a) (d)的重復(fù)。為了確定諸如種族或者病人等特定群體內(nèi)的CYP1A2基因的變異相及其單倍型,可以在檢測完CYP1A2基因型的頻率并從所述群體中選出頻繁CYP1A2基因型之后執(zhí)行操作(e)。在操作(e)中,用SNPtagger軟件分析CYP1A2基因的單倍型數(shù)據(jù)以選擇htSNP。所述 SNPtagger 軟件在本領(lǐng)域內(nèi)是已知的,例如 Genehunter、Merlin、Allegro、SNPHAP、htSNP finder (基于PCA)。更優(yōu)選的是,所述軟件可以從http://www. well. ox. ac. uk/ xiayi/ haplotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下載??梢则炞C所選htSNP來改善精度從而確定二倍型。當(dāng)由雙鏈染色體確定人類的基因型后,將所述基因型解碼以確定兩種單倍型組合。如果同時分析數(shù)個SNP,則特定單倍型的組合可以和另一個單倍型的組合相同。如果所述基因型由根據(jù)本發(fā)明所開發(fā)的診斷解碼,則應(yīng)該驗證它是否準(zhǔn)確確定了所述基因型。可以用Matlab (邁斯沃克軟件有限公司 (The Mathfforks, hc.),美國)來分析是否由基因分析結(jié)果對所述基因型進行了正確的解碼,從而進行所述驗證。在本發(fā)明的一個示例性實施方式中,首先研究了高麗人CYP1A2基因中的變異體來選擇發(fā)現(xiàn)于高麗人中的CYP1A2基因型的htSNP。結(jié)果,在高麗人CYP1A2基因中共發(fā)現(xiàn) 17個SNP (參見表5)。17個SNP中有一個(_2603insA)是新型的。本發(fā)明首次提供的所述單一 SNP在雙鏈DNA中包含一個變異體和一個野生型(參見圖1)。在本發(fā)明的另一個示例性實施方式中,確定了發(fā)現(xiàn)于高麗人中的17個SNP的單倍型。結(jié)果,本發(fā)明確定了此前從未在高麗人中發(fā)現(xiàn)的CYP1A2基因的的單倍型(參見表6) 和基于上述單倍型的基因型。例如,表6中的CYP1A2基因的單倍型2(CYP1A2*1L)是指在所述CYP1A2基因的基因序列中的-3860、-2467和-163位堿基處有SNP的基因型。更具體而言,所述基因型具有-3860G > A、-2467T > delT (_2467delT)和-163C > A 的 SNP。在本發(fā)明的另一個示例性實施方式中,用SNPtagger軟件分析已由含CYP1A2基因中的變異體的基因序列確定的單倍型以便選擇htSNP,亦即發(fā)現(xiàn)于高麗人中的CYP1A2基因的變異體的17個單倍型的最小標(biāo)記。根據(jù)本發(fā)明選擇的htSNP組合的實例如圖2 6中所示。根據(jù)本發(fā)明選擇的所述htSNP組合可以用于確定人類CYP1A2基因的單倍型。因此,本發(fā)明提供了確定人類CYP1A2基因的單倍型的方法。所述方法包括如下步驟(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所得核酸作為模板來擴增人類CYP1A2 基因或其片段;和(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定所述CYP1A2基因中變異體的存在,所述變異體選自-3860G > A、-3598G > T、-3594T > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、-2467delT、-1708T > C、-739T > G、-163C > A、1514G > A、 2159G > A、2321G > C、3613T > C、5347C > T 和 5521A > G。操作(b)中的所述提取核酸的方法與上述相同。
如上所述,所述人類CYP1A2基因的片段是指包含所述人類CYP1A2基因的已知SNP 的片段。用于操作(c)的所述引物沒有限制,可以選自參照2 31。操作(d)中研究的所述SNP可以選自圖4 6中的htSNP。所述SNP的存在可以由如下變異體研究圖4中的-3860G > A、-3598G > T、-3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > T 和 5521A > G ;圖 5 中的-3860G > A、-3113G > A、-2808A > C、-2603insA, -2467delT, -739T > G、-163C
>A、1514G > A、2159G > A、5347C > !“和 5521A > G ;以及圖 6 中的-3860G > A、-3598G
>Τ、-3594Τ > G、-3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > !“和 5521A > G,或-3860G > A、-3598G > T、2321G > C、_3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > T 和 5521A > G0操作(d)中檢測的所述SNP基于發(fā)現(xiàn)于高麗人中的CYP1A2基因中的變異體,且該 SNP對確定高麗人的CYP1A2基因的單倍型和基因型極具特異性。操作(d)中的所述PCR產(chǎn)物的基因序列中的CYP1A2基因的SNP可以用本領(lǐng)域內(nèi)已知的多態(tài)性分析方法確定。優(yōu)選的是,所述SNP可以由SNaPshot分析(參見[Peter M-Vallone等,Int J Legal Med,2004,118 :147-157])、電泳分析或它們的組合來確定,更優(yōu)選的是用SNaPshot分析來確定。所述SNaPshot分析是指通過用引物進行PCR反應(yīng)來確定基因型的方法,所述引物含有在SNP位點附近的已退火基因序列(除SNP區(qū)域以外)和ddNTP。本發(fā)明中使用的所述 SNaPshot是用已知方法基于操作(c)中研究的所述CYP1A2基因的SNP設(shè)計和制造的。所用SNaPshot是可變的,只要其含有緊鄰SNP位點的堿基作為3’端,包含與SNP位點相鄰的已退火基因序列,并在5’端添加了 T堿基即可。更具體而言,引物可以選自參照64 74。 優(yōu)選的是,所述與SNP位點相鄰的已退火基因序列的長度大約為20bp。如果同時確定數(shù)個 SNP,則所述SNaPshot引物5’端的T堿基的長度被設(shè)計為可變。例如,在所述5’端添加5 個T堿基以使引物的大小不同,從而改變所述PCR產(chǎn)物的長度。然后,將所述SNaPshot引物與和每個SNP互補的ddNTP結(jié)合。所述組合物因SNP的不同而大小不同。因此,可以同時確定數(shù)個SNP。為確定用所述SNaPshot分析所得的基因分型結(jié)果是否正確,執(zhí)行了另一種確定所述基因型的方法。另一種方法沒有限制,優(yōu)選包括自動DNA測序或焦磷酸測序。發(fā)現(xiàn)于高麗人中的所述CYP1A2基因中的17種變異體的11個SNP位于啟動子區(qū)域。所述11個SNP包含由本發(fā)明首次確定的-2603insA變異體。因此,本發(fā)明提供了確定人類CYP1A2啟動子基因中變異體的方法。所述方法包括下列步驟(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取基因組DNA ;(c)使用引物進行PCR,所述反應(yīng)使用在操作(b)中所得的基因組DNA作為模板擴增人類CYP1A2基因的啟動子區(qū)域;和(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定所述CYP1A2基因中變異體的存在,所述變異體包括-3860G > A、-3598G > T、-3594T > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、_2467delT、-1708T > C、-739T > G 禾口 -163C > A。
操作(b)中的所述提取基因組DNA的方法與上述相同。操作(c)中擴增人類CYP1A2基因的啟動子區(qū)域的所述引物是可變的,只要所述引物能擴增來自參照1的從-3860G > A到-163C > A的SNP,更優(yōu)選的是來自參照62和63 的SNP即可。操作(d)中所述PCR產(chǎn)物的基因序列中的CYP1A2基因的所述SNP可以用本領(lǐng)域內(nèi)公知的多態(tài)性分析方法確定。優(yōu)選的是,所述SNP可以用SNaPshot分析確定。本發(fā)明所用SNaPshot分析可以使用基于CYP1A2基因的所述11個SNP而設(shè)計的引物進行。本發(fā)明所用的SNaPshot引物是可變的,只要其被設(shè)計為包含與除所述SNP以外的序列相鄰的基因序列即可。更優(yōu)選的是,具有選自參照64 74的基因序列的引物。在本發(fā)明的另一個示例性實施方式中,基于所述影響CYP1A2酶活性的啟動子區(qū)域中的11個SNP,由SNaPshot分析檢測所述CYP1A2啟動子基因的變異體。結(jié)果,證實本發(fā)明的所述方法可以準(zhǔn)確地高速檢測所述CYP1A2啟動子基因中的變異體(參見圖7 14)。2. CYP2A6本發(fā)明可供通過對高麗人CYP2A6基因的變異體分析來確定主要發(fā)現(xiàn)于高麗人中的CYP2A6基因的基因型、選擇htSNP作為每個單倍型的最優(yōu)標(biāo)簽組并確認(rèn)其可用性。根據(jù)本發(fā)明選擇人類CYP2A6基因的htSNP的方法如下(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 CYP2A6基因或其片段;(d)確定在操作(C)中所得的PCR產(chǎn)物的基因序列中變異體的存在;(e)由在操作(d)中已確定具有變異體的PCR產(chǎn)物的基因序列確定單倍型;和(f) M SNPtagger (http//www. well. ox. ac. uk/ xiayi/haplotype/) X^tM 作(e)中確定的所述單倍型進行測序以選擇htSNP。所述從操作(a)中收集的樣本中提取核酸的方法沒有限制,是本領(lǐng)域內(nèi)的已知方法。作為另外一種選擇,可以使用提取試劑盒來提取所述核酸。例如,可以使用由Qiagen 公司(美國)和Mratagene公司(美國)生產(chǎn)的DNA或RNA提取試劑盒。如果提取的是 RNA,則通過逆轉(zhuǎn)錄生產(chǎn)cDNA待用。操作(c)中所述人類CYP2A6基因的片段是指包含人類CYP2A6基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)。擴增所述人類CYP2A6基因或其片段的所述引物可以基于人類CYP2A6基因或其片段的基因序列來設(shè)計,并且可以選自參照76 89的引物,但不限于此。操作(d)中的所述變異體包括SNP、基因刪除和基因重復(fù),但不限于此。例如,所述變異體可以包括30種變異體,如表15。操作(d)中確定變異體的存在的方法可以包括本領(lǐng)域內(nèi)已知的變異體檢測方法。 優(yōu)選的是,用序列分析或電泳分析來比較本領(lǐng)域內(nèi)已知的野生型CYP2A6基因的基因序列 (例如參照75的基因序列(基因庫登錄號NC_000019))或本領(lǐng)域內(nèi)已知的CYP2A6基因型的各基因序列。另外,還可用RFLP分析來比較所述野生型CYP2A6基因的限制性酶的切割相。所述CYP2A6基因的刪除或重復(fù)可以通過對PCR產(chǎn)物的電泳分析來確定。所述測序可以通過自動DNA測序儀或焦磷酸測序進行。操作(e)中確定含有變異體的PCR產(chǎn)物的基因序列中的所述單倍型可以通過諸如 SNPAlyze, Haplotyper, Arlequin 等程序來確定。本發(fā)明的方法可以另外包括對操作(a) (d)的重復(fù)。為了確定諸如種族或者病人等特定群體內(nèi)的CYP2A6基因的變異相,可以在檢測完CYP2A6基因型的頻率并從所述群體中選出頻繁CYP2A6基因型之后執(zhí)行操作(f)。在操作(f)中,用SNPtagger軟件分析操作(e)中確定的所述單倍型的基因序列以選擇 htSNP。用于選擇 htSNP 的所述軟件包括 HapBlock、LDSelect、Haploview、htSNP、 TagIT和tagSNPs以及SNPtagger。所述SNPtagger軟件在本領(lǐng)域內(nèi)是已知的,且優(yōu)選的是可以從 http://www. well. ox. ac. uk/ xiayi/haplotype 下載??梢则炞C所選 htSNP 來改善精度從而確定二倍型??梢杂肕atlab (邁斯沃克軟件有限公司,美國)來驗證所述htSNP。在本發(fā)明的一個示例性實施方式中,首先研究了發(fā)現(xiàn)于高麗人中的CYP2A6基因中的變異體來選擇高麗人的CYP2A6基因型的htSNP。結(jié)果,在高麗人CYP2A6基因中共發(fā)現(xiàn) 30個SNP (參見表15)。在本發(fā)明的另一個示例性實施方式中,用DYNAC0M公司生產(chǎn)的SNPAlyze確定了所選的30個SNP中的14個SNP的單倍型,從而確定了具有以上的頻率的總共19個單倍型。所述14個SNP包括8個導(dǎo)致氨基酸替換且含有功能性遺傳變異體的變異體,和6個頻繁變異體。用來確定所述單倍型的程序不限于所述SNPAlyze。作為另外一種選擇,可以使用本領(lǐng)域內(nèi)已知的各種軟件,例如,Haplotyper (http //www. people, fas. harvard, edu/ junliu/Haplo/docMain. htm)、Arlequin (htt: //lgb. unife. ch/arlequin)禾口 Istech 公司生產(chǎn)的 SNP Analyzer (http://www. istech21. com/)。在本發(fā)明的另一個示例性實施方式中,用SNPtagger軟件分析了包括19個單倍型和1個基因刪除在內(nèi)的20個單倍型的基因序列和頻率以選擇htSNP,亦即能方便地鑒定主要發(fā)現(xiàn)于高麗人中的CYP2A6基因的基因型的最小標(biāo)記。htSNP的實例如圖16 21所示。可以使用本發(fā)明所選的htSNP組合來確定所述人類CYP2A6基因的基因型。因此, 本發(fā)明提供了確定所述人類CYP2A6基因的基因型的方法。所述方法包括如下步驟(a)從對象中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 CYP2A6基因或其片段;(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定所述CYP2A6基因中變異體的存在,所述變異體選自-48T > G、13G > A、567C > T、2134A > G、3391T > C、6458A > Τ、 6558T > C、6582G > T、6600G > T 和 6091C > Τ。操作(b)中的所述提取核酸的方法與上述相同。如上所述,所述人類CYP2A6基因的片段是指包含人類CYP2A6基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)。可以用于操作(c)的引物可以包括參照90、91、120 和130的引物,但不限于此。操作(d)中的所述變異體可以選自圖16 21中的htSNP。例如,在操作(d)中, 所述變異體可以由圖 16 中的-48T > G ;22C > T ;567C > T ;2134A > G ;3391T > C ;6458A>T ;6558T > C ;6582G > T ;6600G > T ;選自 6091C > T、5971G > 八和 5983T > G 中的一種;和13G > A ;51G > A ; 1620T > C ;以及1836G > !“來確定。所述變異體也可以由圖17 中的-48T > G ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;3391T > C ;6458A > T ;6558T > C ;6600G > T ;和選自 6091C > T、5971G > 六和 5983T > G 中的一種來確定。如圖18 所示,所述變異體可以由 22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G
>T ;3391T > C ;6354T > C ;6458A > T ;6558T > C ;6600G > T ;和選自 6091C > T、5971G
>A和5983T > G中的一種來確定。如圖19 所示,所述變異體可以由-48T > G ;13G > A ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;2134A > G ;3391T > C ;6458A > T ;6558T > C ;和選自 6091C > T、5971G >々和5983T > G中的一種來確定。如圖20 所示,所述變異體可以由-48T > G ;13G > A ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;3391T > C ;6458A > T ;6558T > C ;和選自 6091C > T、5971G > A和5983T > G中的一種來確定。另外,如圖21所示,所述變異體可以由-48T > G ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;2134A > G ;3391T > C ;6458A > T ;6558T > C ;6600G > T ;和選自 6091C > T、5971G >々和5983T > G中的一種來確定。優(yōu)選的是,所述變異體如圖16所示
來確定。在圖16中的變異體中,證實具有功能性或具有很高的潛在功能性的變異體包含了替換氨基酸或?qū)е禄騽h除的變異體。因此,要檢測圖16中的變異體中的功能性CYP2A6 變異體,可以研究圖16中的變異體中的所述氨基酸替換變異體或基因刪除變異體。基因刪除幾乎無法由SNP檢測。當(dāng)搜索所述變異體以標(biāo)記基因刪除時,發(fā)現(xiàn)了 6091C > !“變異體。 所述6091C > T變異體是特異性地發(fā)現(xiàn)于操作(c)所擴增的PCR產(chǎn)物中刪除了 CYP2A6基因的染色體中的SNP,而且所述6091C > T變異體可以用作基因刪除標(biāo)記變異體。用于確定功能性的所選變異體組合包括10個變異體,即-48T > G ;13G > A ;567C > T ;2134A > G ; 3391T > C ;6458A > T ;6558T > C ;6582G > T ;6600G > T ;和 6091C > T。所述 CYP2A6 基因中的5971G > A和5983T > G變異體可以替代所述6091C > T變異體來標(biāo)記基因刪除。操作(d)中研究的所述變異體基于主要發(fā)現(xiàn)于高麗人中的CYP2A6基因中的變異體。因此,它對確定高麗人的CYP2A6基因的單倍型和基因型極具特異性。操作(d)中的所述PCR產(chǎn)物的基因序列中的CYP2A6基因的變異體可以用本領(lǐng)域內(nèi)已知的多態(tài)性分析方法研究??梢杂肧NaPshot分析(參見[Peter Μ. Vallone等,Int J Legal Med, 2004,118 :147-157])、電泳分析或它們的組合,更具體而言,可以使用SNaPshot 分析來研究所述變異體。所述SNaPshot分析是指通過用引物進行PCR反應(yīng)來確定基因型的方法,所述引物含有在SNP位點附近的已退火序列(除SNP區(qū)域以外)和ddNTP。本發(fā)明中使用的所述 SNaPshot是用基于操作(d)中研究的所述CYP2A6基因的SNP的已知方法設(shè)計和制造的。 所用SNaPshot是可變的,只要其含有緊鄰SNP位點的堿基作為3’端,包含與所述SNP位點相鄰的已退火基因序列,并在5’端添加了 T堿基即可。更優(yōu)選的是,引物可以選自參照 97 102。優(yōu)選的是,所述與SNP位點相鄰的已退火基因序列的長度大約為20bp。如果同時確定數(shù)個SNP,則所述SNaPshot引物的5’端的T堿基的長度被設(shè)計為可變。例如,在所
18述5’端添加5個T堿基以使引物的大小不同,從而改變所述PCR產(chǎn)物的長度。然后,將所述SNaPshot引物與和每個SNP互補的ddNTP結(jié)合。所述組合物因所述SNP的不同而大小不同。因此,可以同時確定數(shù)個SNP。然后,擴增以用于SNaPshot分析的所述PCR產(chǎn)物的基因序列可以用本領(lǐng)域內(nèi)的已知測序方法進行分析,優(yōu)選的是使用自動DNA測序進行分析。例如,具有選自參照92 101的基因序列的引物可以在操作(c)中用于研究圖16 中的htSNP組合。優(yōu)選的是,可以使用來自參照92 101的所有引物,但不限于此。然后,擴增以用于SNaPshot分析的所述PCR產(chǎn)物的基因序列可以用本領(lǐng)域內(nèi)的已知測序方法進行分析,優(yōu)選的是使用自動DNA測序進行分析。在本發(fā)明的另一個示例性實施方式中,對所選htSNP組合的可用性進行了確認(rèn)。 通過從圖16的htSNP組合中選擇10種功能性或潛在功能性CYP2A6變異體來分析操作(c) 中所得的PCR產(chǎn)物的基因序列,從而進行SNaPshot分析。結(jié)果,證實本發(fā)明的方法能高速地同時確定發(fā)現(xiàn)于高麗人中的CYP2A6基因型(參見圖22 32)??梢杂帽景l(fā)明所述方法確定的所述CYP2A6基因的基因型包括_48T > G、13G > A、 567C > T、2134A > G、3391T > C、6458A > T、6558T > C、6582G > T、6600G > T 和 6091C > Τ。與之相對應(yīng)的每個基因型和變異體如圖22 32中所示。例如,圖22說明了含有-48Τ > G、6558T > C和2134A > G變異體和7個野生型的基因型。圖23說明了含有567C > T 和9個野生型的基因型。所述CYP2A6、基因型包含2A6刪除變異體。當(dāng)從人類染色體中刪除CYP2A6基因后,根本不會生成酶。如果CYP2A6基因被刪除,則所述基因的形狀為部分 CYP2A6基因和部分CYP2A7基因相結(jié)合的形狀。所述刪除特異性變異體可以通過研究上述結(jié)合基因來確定。3. CYP2D6本發(fā)明可供通過對高麗人CYP2D6基因的變異體分析來確定主要發(fā)現(xiàn)于高麗人中的CYP2D6基因的基因型、選擇htSNP作為每個單倍型的最優(yōu)標(biāo)簽組并確認(rèn)其可用性。根據(jù)本發(fā)明選擇人類CYP2D6基因的htSNP的方法如下(a)從人類中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 CYP2D6基因或其片段;(d)由在操作(C)中所得的PCR產(chǎn)物的基因序列確定變異體的存在;(e)由在操作(d)中已確定具有變異體的PCR產(chǎn)物的基因序列確定單倍型;和(f)用SNPtagger軟件對操作(e)中所確定的單倍型進行測序以選擇htSNP。所述從操作(a)中收集的樣本中提取核酸的方法沒有限制,是本領(lǐng)域內(nèi)的已知方法。作為另外一種選擇,可以使用提取試劑盒來提取所述核酸。例如,可以使用由Qiagen 公司(美國)和Mratagene公司(美國)生產(chǎn)的DNA或RNA提取試劑盒。如果提取的是 RNA,則通過逆轉(zhuǎn)錄生產(chǎn)cDNA待用。操作(c)中所述人類CYP2D6基因的片段是指包含人類CYP2D6基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)。擴增所述人類CYP2D6基因或其片段的所述引物可以基于人類CYP2D6基因或其片段的基因序列來設(shè)計。例如,所述引物可以包含選自參照106、參照107、參照121 127、參照1 136、參照138、參照139、參照140和參照150的基因序列,但不限于此。操作(d)中的所述變異體包括SNP、基因刪除和基因重復(fù),但不限于此。例如,所述變異體可以包括33種變異體,如表34。操作(d)中確定變異體的存在的方法可以包括本領(lǐng)域內(nèi)已知的變異體檢測方法。 優(yōu)選的是,可以用基因測序、電泳分析和RFLP分析來確定所述變異體。所述基因測序可以通過自動DNA測序儀或焦磷酸測序進行。所述焦磷酸測序是用于DNA測序中的已知SNP測定方法,是檢測來自DNA聚合時釋放的無機焦磷酸鹽(PPi)的光表達的方法??梢酝ㄟ^比較野生型CYP2D6基因的基因序列來確定操作(d)中的變異體的存在。 所述野生型CYP2D6基因的基因序列是本領(lǐng)域內(nèi)已知的。例如,可以使用參照105的基因序列(基因庫登錄號AYM5216)或本領(lǐng)域內(nèi)已知的每個CYP2D6基因型的基因序列(基因庫登錄號M33388,http//www. cypalleles. ki. se/cyp2d6. htm)。另外,還可進行 RFLP 分析來比較所述野生型CYP2D6基因的限制性酶的切割相。所述CYP2D6基因的刪除或重復(fù)可以通過對PCR產(chǎn)物的電泳分析來確定。操作(d)中已確定含有變異體的PCR產(chǎn)物的基因序列中的單倍型可以用全測序來確定。本發(fā)明的方法可以另外包括對操作(a) (d)的重復(fù)。為了確定諸如種族或者病人等特定群體內(nèi)的CYP2D6基因的變異相,可以在檢測完CYP2D6基因型的頻率并從所述群體中選出頻繁CYP2D6基因型之后執(zhí)行操作(f)。在操作(f)中,用SNPtagger軟件分析操作(e)中確定的單倍型的基因序列以選擇htSNP。所述SNPtagger軟件在本領(lǐng)域內(nèi)是已知的,例如Genehunter、Merlin、Allegro、 SNPHAP、htSNP finder (基于 PCA),更優(yōu)選的是,所述軟件可以從 http://www. well. ox. ac. uk/ xiayi/hapIotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下^^??梢则炞C所選htSNP來改善精度從而確定二倍型。當(dāng)由雙鏈染色體確定人類的基因型后,將所述基因型解碼以確定兩種單倍型組合。如果同時確定數(shù)個SNP,則特定單倍型的組合可能和另一個單倍型的組合相同。如果所述基因型由根據(jù)本發(fā)明所開發(fā)的診斷解碼,則應(yīng)該驗證它是否準(zhǔn)確確定了所述基因型。可以用Matlab (邁斯沃克軟件有限公司,美國)分析是否由基因分析結(jié)果對所述基因型進行了正確的解碼,從而進行所述驗證。在本發(fā)明的一個示例性實施方式中,首先研究了發(fā)現(xiàn)于高麗人中的CYP2D6基因中的變異體以選擇高麗人CYP2D6基因型的htSNP。結(jié)果,在高麗人CYP2D6基因中發(fā)現(xiàn)了 33種變異體和與之相對應(yīng)的12個單倍型(基因型)(參見表34和35)。在本發(fā)明的另一個示例性實施方式中,用SNPtagger軟件對12個CYP2D6基因型進行測序以選擇htSNP,亦即可方便地鑒定主要發(fā)現(xiàn)于高麗人中的CYP2D6基因型的最小標(biāo)記。根據(jù)本發(fā)明選擇的htSNP組合的實例如圖34 39中所示。根據(jù)本發(fā)明選擇的所述htSNP組合可以用于確定人類CYP2D6基因的基因型。因此,本發(fā)明提供了確定人類CYP2D6基因的基因型的方法。所述方法包括如下步驟(a)從人類中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類CYP2D6基因或其片段;(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定CYP2D6基因中的至少11種變異體的存在,所述至少11種變異體包括選自-1426C > TUOOC > !“和1039C > T中的一種;選自> C、-377Α > G、3877G > A、4388C > T 和 4401C > T 中的一種;選自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一種;1611T > A ; 1758G > A ;1887insTA ;2573insC ;2988G > A ;4125-4133insGTGCCCACT ;2D6 刪除;禾口 2D6 重復(fù)。操作(b)中的所述提取核酸的方法與上述相同。如上所述,所述人類CYP2D6基因的片段是指包含人類CYP2D6基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)??梢杂糜诓僮?c)的引物可以包括選自參照106和 107、參照121 127、參照129 136、參照138、139、149和150的基因序列。操作(d)中的所述變異體可以選自圖34 39中的htSNP。例如,如圖34所示, 可以確定下述變異體的存在,所述變異體包括選自-1426C > TUOOC > !“和1039C > T 中的一種;選自 > C、-377Α > G、3877G > A、4388C > T 和 4401C > T 中的一種;選自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一種;1611T > A ; 1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125-4133insGTGCCCACT ;2D6 刪除;禾口 2D6 重復(fù)。如圖35所示,可以確定下述變異體的存在,所述變異體包括_1584C > G ;選自-1426C > TUOOC > T 禾日 1039C > T 中的一種;1611T > A ; 1758G > A ;2573insC ;圭自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一種;選自-1245insGA、-1028T > C、-377A > C、3877G > A、 4388C > T 禾口 4401C > T 中的一禾中;4125_4133insGTGCCCACT ;2D6 刪除;禾口 2D6 重復(fù)。另外,如圖36所示,可以確定下述變異體的存在,所述變異體包括選自-1426C > TUOOC > !“和 1039C > T 中的一種;-1584C > G ;選自-1028T > C、_377A > G、3877G > A、 4388C > !“和 4401C > T 中的一種;選自-740C > T、_678G > A、214G > C、221C > A、223C
>G、227T > C、232G > C、233A > C、245A > 6和 2850C > T 中的一種;1611T > A ; 1758G
>A ; 1887insTA ;2573insC ;4125_4133insGTGCCCACT ;2D6 刪除;禾口 2D6 重復(fù)。另外,如圖37所示,可以確定下述變異體的存在,所述變異體包括_1584C > G ; 選自> TUOOC > T 禾日 1039C > T 中的一種;1611T > A ; 1758G > A ;2573insC ;選自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一種;選自-1245insGA、-1028T > C、-377A > G、3877G > A、 4388C > T 禾口 4401C > T 中的一禾中;4125_4133insGTGCCCACT ;-1235A > G ; 1887insTA ;2D6 刪除;和2D6重復(fù)。另外,如圖38所示,可以確定下述變異體的存在,所述變異體包括選自-1426C > TUOOC > T 和 1039C > T 中的一種;選自-1028T > C、-377A > G、3877G > A、4388C > T 和 4401C > T 中的一種;1611T > A ;選自 1661G > C和 4180G > C 中的一種;1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;-1235A > G ; 1887insTA ;2D6 刪除;和2D6重復(fù)。另外,如圖39所示,可以確定下述變異體的存在,所述變異體包括_1584C > G ;選自> TUOOC > !“和 1039C > T 中的一種;1611T > A ;1758G > A ;2573insC ;選自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一種;選自-1245insGA、-1028T > C、-377A > G、3877G > A、 4388C > T 和 4401C > T 中的一種;1887insTA ;2988G > A ;4125_4133insGTGCCCACT ;2D6 刪除;和2D6重復(fù)。優(yōu)選的是,可以確定圖34中的變異體的存在。操作(d)中確定的所述變異體基于主要發(fā)現(xiàn)于高麗人中的CYP2D6基因中的變異體。因此,它對確定高麗人的CYP2D6基因的單倍型和基因型極具特異性。操作(d)中所述PCR產(chǎn)物的基因序列中的CYP2D6基因的變異體可以用本領(lǐng)域內(nèi)已知的多態(tài)性分析方法確定。優(yōu)選的是,可以用SNaPshot分析(參見[PeterM. Vallone等, Int J Legal Med,2004,118 :147-157])、電泳分析或它們的組合來確定所述變異體。如果所述CYP2D6中的變異體包含SNP,則可以使用SNaPshot分析。所述SNaPshot分析是指通過用引物進行PCR反應(yīng)來確定基因型的方法,所述引物含有在SNP位點附近的已退火基因序列(除SNP區(qū)域以外)和ddNTP。本發(fā)明中使用的 SNaPshot分析是用基于操作(c)中確定的所述CYP2D6基因的SNP的已知方法設(shè)計和制造的。所用SNaPshot是可變的,只要其含有緊鄰SNP位點的堿基作為3’端,包含與所述SNP 位點相鄰的已退火基因序列,并在5’端添加了 T堿基即可。優(yōu)選的是,所述與SNP位點相鄰的已退火基因序列的長度大約為20bp。如果同時確定數(shù)個SNP,則所述SNaPshot引物5’ 端的T堿基的長度被設(shè)計為可變。例如,在所述5’端添加5個T堿基以使引物的大小不同, 從而改變所述PCR產(chǎn)物的長度。然后,將所述SNaPshot引物與和每個SNP互補的ddNTP結(jié)合。所述組合物因所述SNP的不同而大小不同。因此,可以同時確定數(shù)個SNP。例如,具有選自參照141 148以及參照152和153的基因序列的引物可以在操作(c)中用于研究圖34中的htSNP組合。更優(yōu)選的是,可以使用具有選自參照141 148 以及參照152和153的基因序列的所有引物。然后,通過所述SNaPshot分析擴增的PCR產(chǎn)物的基因序列可以用已知基因測序方法進行分析。所述基因測序方法可以在本領(lǐng)域內(nèi)的已知方法中靈活選取,優(yōu)選的是包括自動DNA測序。在本發(fā)明的另一個示例性實施方式中,對根據(jù)本發(fā)明所選的htSNP組合的可用性進行了確認(rèn)。在使用圖34中的htSNP組合進行所述SNaPshot分析后,分析了所得PCR產(chǎn)物的基因序列。結(jié)果,證實本發(fā)明的方法能高速地同時確定發(fā)現(xiàn)于高麗人中的CYP2D6基因型(參見圖40和41)??梢杂帽景l(fā)明所述方法確定的所述CYP2D6基因的基因型包括CYP2D6*1A、 CYP2D6*2A、CYP2D6*5、CYP2D6*2N、CYP2D6*10B、CYP2D6*14B、CYP2D6*18、CYP2D6*21B、 CYP2D6*41A、CYP2D6*49、CYP2D6*52和CYP2D6*60。各個基因型和與之相對應(yīng)的變異體如表 34中所示。參見表34,例如,所述CYP2D6*1A基因型包含一個野生型,而所述CYP2D6*2A基因型包含野生型CYP2D6基因的基因序列中在SNP 1、SNP 5、SNP 8、SNP 9、SNP 12 SNP 18、SNP 21、SNP 25和SNP 28位點的變異體。所述CYP2D63基因型包含2D5刪除變異體。 當(dāng)CYP2D6基因從人類染色體中被完全刪除后,不再產(chǎn)生酶。所述CYP2D6*2N基因型包含2D6 重復(fù)變異體。即在同一染色體中至少存在2個CYP2D6基因。本發(fā)明提供了使用基因芯片確定人類CYP2D6基因的基因型的方法。所述方法包括如下步驟(a)提取待研究的基因,對所述基因進行多重PCR并得到包含SNP的邊界的PCR產(chǎn)物;(b)用ASPE (等位基因特異性引物延伸)引物進行ASPE反應(yīng)以鑒定等位基因的特異性堿基;(c)將所述反應(yīng)產(chǎn)物與基因芯片相混合;和(d)分析所述基因芯片。本發(fā)明提供了用于確定SNP的基因型分析芯片(參見圖42),所述芯片含有基于 Zip編碼(Zip Code)寡核苷酸的芯片。對每個SNP生成一對引物以在操作(b)中進行ASPE反應(yīng)。所生成的ASPE引物是在3’端包含SNP位點并與等位基因特異性結(jié)合的基因序列。所述ASPE引物包含Zip編碼, 即,朝向5’端具有Mbp的寡核苷酸。所生成Zip編碼在每個等位基因中含有不同的基因序列。本發(fā)明從文獻中公開的基因序列和用生物信息學(xué)技術(shù)設(shè)計的基因序列中選擇了最優(yōu)Zip編碼序列,所述最優(yōu)Zip編碼序列經(jīng)實驗驗證不與其它樣品發(fā)生交叉反應(yīng)。所選序列的Tm為61°C。所生成的Zip編碼不互相干擾。所選基因序列具有AG值為-2以上的發(fā)夾形二級結(jié)構(gòu)。如果使用所述ASPE引物進行ASPE反應(yīng),則含有對應(yīng)于所述引物的3’端的等位基因的樣品與所述引物反應(yīng)以發(fā)生等位基因特異性延伸反應(yīng)。如果使用與熒光材料Cyanine 5(Cy5)共價結(jié)合的dUTP(Cy5-dUTP)來進行所述延伸反應(yīng),則只有含對應(yīng)等位基因的樣品會被Cy5熒光材料標(biāo)記(參見圖45)。所述熒光材料不限于Cy5,可以使用其它材料,諸如 Cy3、TAMRA、TexasRed、Cy3· 5、Rhodamin 6G、SyBR Green 等。在本發(fā)明的分析芯片上提供了與所述Zip編碼互補結(jié)合的寡核苷酸探針(cZip Code,互補Zip編碼)。因此,可以識別用所述Zip編碼引物延伸的樣品中包含的每個等位基因(參見圖43)。在所述探針中,在3’端插入了 IObp的基因序列作為間隔區(qū)來誘導(dǎo)與目標(biāo)的雜交。 例如,所述間隔區(qū)序列優(yōu)選為5’ -CAG GCC AAGT-3’。本發(fā)明的所述探針優(yōu)選包含參照158 184的基因序列。在操作(c)和(d)中的將所述反應(yīng)產(chǎn)物與所述基因芯片相混合并分析經(jīng)混合的所述芯片的方法可以包括本領(lǐng)域內(nèi)已知的方法。所用的DNA芯片掃描儀可以變化。更優(yōu)選的是,使用Axon公司生產(chǎn)的GenePix 4100B掃描儀。掃描的圖片可以用GenePix Pro6. 0軟件進行分析。如果用本發(fā)明所述基因芯片分析所述CYP2D6基因的變異體,則其結(jié)果與用序列分析所驗證的結(jié)果相同。因此,本發(fā)明的基因芯片可以低成本分析各種基因的變異體。4. PXR本發(fā)明的方法使用基于高麗人P)(R基因中的變異體選擇的htSNP來確定P)(R基因中的功能性變異體。本發(fā)明所述的選擇人類P)(R基因的htSNP的方法包括如下步驟(a)從人類中收集生物樣本;
(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 P)(R基因或其片段;(d)對操作(C)中所得PCR產(chǎn)物測序以確定變異體的存在;(e)確定操作(d)中已證實具有變異體的PCR產(chǎn)物的基因序列中的單倍型;和(f)用SNPtagger軟件對操作(e)中所確定的單倍型進行測序并選擇htSNP。所述從操作(a)收集的樣本中提取核酸的方法沒有限制,是本領(lǐng)域內(nèi)的已知方法。作為另外一種選擇,可以使用提取試劑盒來提取所述核酸。例如,可以使用由Qiagen 公司(美國)和Mratagene公司(美國)生產(chǎn)的DNA或RNA提取試劑盒。如果提取的是 RNA,則通過逆轉(zhuǎn)錄生產(chǎn)cDNA待用。操作(c)中的所述人類P)(R基因的片段是指包含人類P)(R基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)。擴增所述人類P)(R基因或其片段的引物可以基于人類PXR 基因或其片段的基因序列來設(shè)計,并且所述引物可以選自參照221 240的引物,但不限于此。操作(d)中所述的變異體包括SNP、基因刪除和基因重復(fù),但不限于此。例如,所述變異體可以包括22種變異體,如表48。操作(d)中確定變異體的存在的方法可以包括本領(lǐng)域內(nèi)已知的變異體檢測方法。 優(yōu)選的是,可以進行基因測序、電泳分析和RFLP分析來確定所述變異體的存在。所述基因測序可以通過自動DNA測序儀或焦磷酸測序進行。可以通過比較野生型P)(R基因的基因序列來確定操作(d)中變異體的存在??梢允褂盟鲆吧蚉)(R基因的基因序列,例如參照2200的基因序列(基因庫登錄號NT 005612)或本領(lǐng)域內(nèi)已知的每個P)(R基因型的基因序列。另外,還可用RFLP分析來比較所述野生型P)(R基因的限制性酶的切割相。所述P)(R基因的刪除或重復(fù)可以通過對PCR產(chǎn)物的電泳分析來確定。操作(d)中證實含有變異體的PCR產(chǎn)物的基因序列中的單倍型的頻率和類型可以使用本領(lǐng)域內(nèi)已知的技術(shù)程序或市場上銷售的程序來分析。例如,可以使用免費分發(fā)的 Haploview,或商業(yè)化程序SNPAlyze。所述Haploview軟件是本領(lǐng)域內(nèi)已知的,而更優(yōu)選的是,可以從 http://www. broad, mit. edu/mpg/haploview 下載所述軟件。本發(fā)明的方法可以另外包括對操作(a) (e)的重復(fù)。為了確定諸如種族或者病人等特定群體內(nèi)的P)(R基因的變異相及其單倍型,可以在檢測完P(guān))(R基因型的頻率并從所述群體中選出頻繁P)(R基因型之后執(zhí)行操作(f)。在操作(f)中,用SNPtagger軟件對操作(e)中確定的單倍型測序來選擇htSNP。 所述SNPtagger軟件在本領(lǐng)域內(nèi)是已知的,例如Genehunter、Merlin、Allegro、SNPHAP, htSNP finder (基于PCA),更優(yōu)選的是,所述軟件可以從http://www. well. ox. ac. uk/ xiayi/hapIotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下^^??梢则炞C所選htSNP來改善精度從而確定二倍型。當(dāng)由雙鏈染色體確定人類的基因型后,將所述基因型解碼以確定兩種單倍型組合。如果同時確定數(shù)個SNP,則特定單倍型的組合可能和另一個單倍型的組合相同。如果所述基因型由根據(jù)本發(fā)明所開發(fā)的診斷解碼,則應(yīng)該驗證它是否準(zhǔn)確確定了所述基因型。可以用Matlab (邁斯沃克軟件有限公司,美國)來分析是否由基因分析結(jié)果對所述基因型進行了正確的解碼,從而進行所述驗證。在本發(fā)明的一個示例性實施方式中,首先研究了高麗人P)(R基因中的變異體以選擇htSNP,高麗人P)(R基因的功能性變異體。結(jié)果,在高麗人的P)(R基因中共發(fā)現(xiàn)了 22個 SNP (參見表48)。在本發(fā)明的另一個示例性實施方式中,用DYNAC0M公司生產(chǎn)的SNPAlyze軟件確定了 22個所選SNP中的6個功能性變異體的單倍型,從而確定了總共14個單倍型(參見表 49)。在本發(fā)明的另一個示例性實施方式中,用SNPtagger軟件對所述14個單倍型進行測序以選擇htSNP,亦即可方便地確定發(fā)現(xiàn)于高麗人中的P)(R基因的功能性變異體的最小標(biāo)記(參見圖47)??梢允褂酶鶕?jù)本發(fā)明選擇的htSNP組合來確定人類P)(R基因的功能性變異體。因此,本發(fā)明提供了確定人類P)(R基因的功能性變異體的方法。所述方法包括如下步驟(a)從人類中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的核酸作為模板來擴增人類 P)(R基因或其片段;和(d)在操作(C)中所得的PCR產(chǎn)物的基因序列中確定P)(R基因中功能性變異體的存在,所述變異體選自-25385C > T、-24113G > A.7635A > G、8055C > TU1156A > C 和 11193T > C。操作(b)中的所述從收集的樣本中提取核酸的方法與上述相同。所述人類P)(R基因的片段是指包含人類P)(R基因的已知變異體的片段,例如,單核苷酸多態(tài)性(SNP)??梢杂糜诓僮?c)的引物可以選自參照242 M7的引物,但不限于此。操作(d)中研究的所述SNP基于發(fā)現(xiàn)于高麗人中的P)(R基因的功能性變異體,它對確定高麗人PXR基因的功能性變異體和所述功能性變異體的單倍型極具特異性。可以用本領(lǐng)域內(nèi)已知的多態(tài)性分析方法來確定操作(d)中所述PCR產(chǎn)物的基因序列中的P)(R基因的變異體的存在。優(yōu)選的是,可以用SNaPshot分析(參見[Peter M-Vallone等,Int J Legal Med,2004,118 :147-157])、電泳分析或它們的組合,更優(yōu)選的是用SNaPshot分析來確定所述變異體的存在。所述SNaPshot分析是指通過用引物進行PCR反應(yīng)來確定基因型的方法,所述引物含有在SNP位點附近的已退火基因序列(除SNP區(qū)域以外)和ddNTP。本發(fā)明中使用的 SNaPshot分析是用基于操作(d)中研究的所述P)(R基因的SNP的已知方法設(shè)計和制造的。 所用SNaPshot是可變的,只要其含有緊鄰SNP位點的堿基作為3’端,包含與所述SNP位點相鄰的已退火基因序列,并在5’端添加了 T堿基即可。更優(yōu)選的是,引物可以選自參照 242 M57的引物。優(yōu)選的是,所述與SNP位點相鄰的已退火基因序列的長度大約為20bp。 如果同時確定數(shù)個SNP,則所述SNaPshot引物5’端的T堿基的長度被設(shè)計為可變。例如, 在所述5’端添加5個T堿基以使引物的大小不同,從而改變所述PCR產(chǎn)物的長度。然后, 將所述SNaPshot引物與和每個SNP互補的ddNTP結(jié)合。所述組合物因所述SNP的不同而大小不同。因此,可以同時確定數(shù)個SNP。
為了確定使用所述SNaPshot分析的基因分型結(jié)果是否正確,采用了另一種基因分型方法。另一種基因分型方法沒有限制,優(yōu)選包括自動DNA測序或焦磷酸測序。在本發(fā)明的另一個示例性實施方式中,對本發(fā)明所選的htSNP組合的可用性進行了確認(rèn)。使用圖47中的htSNP組合進行所述SNaPshot分析,并分析了所得PCR產(chǎn)物的基因序列。結(jié)果,證實本發(fā)明的方法能高速地同時確定發(fā)現(xiàn)于高麗人中的P)(R基因功能性變異體(參見圖48 50)??梢杂帽景l(fā)明的方法確定的所述P)(R基因的功能性變異體包括-25385C > T、-24113G > A、7635A > G、8055C > TU1156A > C 和 11193T > C。5. UGTlA根據(jù)本發(fā)明確定人類UGTlA基因的功能性變異體的方法包括如下步驟(a)從人類中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)使用操作(b)中所提取的核酸個別地擴增人類UGTlA基因;和(d)對操作(c)中擴增的所述基因進行測序并確定UGTlA基因的功能性變異體的存在,所述變異體選自UGT1A1基因中的-39(TA)6 > (TA) 7、211G > A,233C > T和686C > A ;UGTlA3 基因中的 31T > CU33C > T 禾日 140T > C ;UGT1A4 基因中的 31C > TU42T > G 禾口 292C > T ;UGT1A6 基因中的 19T > G、541A > G 禾口 552A > C ;UGT1A7 基因中的 387T > G、391C > A、392G < A、622T > C 和 701T > C ;和 UGT1A9 基因中的-118T9 > T10、726T > G 和 766G > A0本發(fā)明的確定UGTlA基因的與對依立替康的敏感性相關(guān)的多態(tài)性的方法包括如下步驟(a)從人類中收集生物樣本;(b)從操作(a)中所收集的樣本中提取核酸;(c)使用操作(b)中所提取的核酸個別地擴增人類UGTlA基因;和(d)對操作(c)中擴增的所述基因進行測序并確定UGTlA遺傳變異體的存在,所述變異體選自UGT1A1基因中的211G > A、233C > !“和686C > A ;UGT1A6基因中的19T > G、541A > G 和 552A > C ;和 UGT1A9 基因中的-118T9 > T10.726T > G 和 766G > A。本發(fā)明的方法采用了基于主要發(fā)現(xiàn)于高麗人的UGTlA基因的多態(tài)性而選擇的最優(yōu)多態(tài)性標(biāo)簽組,并確定了 UGTlA基因中的功能性變異體或藥物敏感性。與現(xiàn)有方法相比, 本發(fā)明的方法對分析高麗人的UGTlA基因而言在時間和成本上具有有效性。在本發(fā)明的操作(a)中,所述生物樣本采自人類,優(yōu)選的是包括高麗人、中國人和日本人在內(nèi)的亞洲人,而更優(yōu)選的是高麗人。所述生物樣本可以包括血液、皮膚細(xì)胞、粘液細(xì)胞或毛發(fā),更優(yōu)選的是血液。在本發(fā)明的操作(b)中,所述核酸提取自操作(a)中收集的生物樣本。所述核酸可以包括DNA或RNA,優(yōu)選的是DNA,更優(yōu)選的是基因組DNA。從所收集的樣本中提取核酸的工藝沒有限制,可以根據(jù)本領(lǐng)域內(nèi)已知的技術(shù)進行。作為另外一種選擇,可以使用DNA或 RNA提取試劑盒,例如由Quiagen公司(美國)和Mratagene公司(美國)生產(chǎn)的試劑盒。在本發(fā)明的操作(C)中,使用操作(b)中提取的核酸作為模板并用引物擴增了所述UGTlA基因。如果操作(b)中提取的核酸是RNA,則將該RNA經(jīng)逆轉(zhuǎn)錄轉(zhuǎn)化為cDNA以用作模板。所述引物由已知方法基于人類UGTlA基因或其片段的基因序列設(shè)計和制造。在本發(fā)明的操作(c)中,優(yōu)選的是擴增UGT1A1、UGTlA3, UGT1A4、UGT1A6、UGT1A7 和UGT1A9基因來確定UGTlA基因中的功能性變異體。優(yōu)選的是,擴增UGT1A1、UGT1A6和 UGT1A9基因來確定UGTlA基因的決定了對依立替康的敏感性的多態(tài)性。在本發(fā)明的操作(d)中,使用操作(c)中所擴增的UGTlA基因來分析所述功能性變異體或與UGTlA基因的藥物敏感性相關(guān)的多態(tài)性??梢允褂帽绢I(lǐng)域內(nèi)已知的多態(tài)性分析方法來分析所述功能性變異體或多態(tài)性。例如,可以進行SNaPshot分析、電泳分析、焦磷酸測序或上述方法的組合。具體而言,如果待分析的UGTlA基因的變異體包含SNP,則優(yōu)選的是SNaPshot分析。在SNaPshot分析中,使用可以使與SNP位點相鄰的區(qū)域退火的引物和ddNTP來進行 PCR反應(yīng)。SNaPshot分析中使用的所述引物由基于UGTlA基因的SNP的已知方法設(shè)計和制造。例如,設(shè)計和制造引物使得緊鄰SNP位點的堿基是3’端,包含與所述SNP位點相鄰的已退火基因序列,且在5’端添加了 T堿基。優(yōu)選的是,所述已退火的基因序列的長度大約為20bp。如果同時確定數(shù)個SNP,則所述SNaPshot引物5’端的T堿基的長度被設(shè)計為不同,從而改變所述PCR產(chǎn)物的長度。含參照四05 314的基因序列的引物可以用來進行確定UGTlA基因的功能性變異體的SNaPshot分析。含參照315 322的基因序列的引物可以用來進行確定UGTlA基因的與對依立替康的敏感性相關(guān)的多態(tài)性。由所述SNaPshot分析擴增的PCR產(chǎn)物的基因序列可以用已知測序方法分析。優(yōu)選的是,所述PCR產(chǎn)物的基因序列可以用自動測序方法來分析,但不限于此。如果待分析的UGTlA基因變異體不是SNP (例如,UGTlAl基因中的-39 (TA) 6 > (TA) 7),則可以進行已知的焦磷酸測序來代替所述SNaPshot分析。所述焦磷酸測序評價在 DNA聚合時釋放的PPi (無機焦磷酸鹽)的表達。在本發(fā)明的一個示例性實施方式中,可以使用含參照四2 四4的基因序列的引物來進行焦磷酸測序以確定UGTlAl基因的-39 (TA) 6 > (TA)7。下文將對本發(fā)明的示例性實施方式進行詳細(xì)說明。下述示例性實施方式對本發(fā)明進行了示例性說明,但本發(fā)明并不限于下述示例性實施方式。<CYP1A2>示例性實施方式1 確定高麗人CYP1A2基因的基因型<1-1>CYP1A2 基因的擴增從48個健康對象采集血液后,使用Qiagen公司生產(chǎn)的基因組DNA分離試劑盒將 DNA從血液中分離。所述CYP1A2基因包含7個外顯子(exon),且大約為111Λ長。將所述 CYP1A2基因分為15個片段進行PCR。在每個PCR中使用的引物如表1所示。在本說明書中的基因序列中所寫的A、T、G和C是指腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶。[表1]用于擴增CYP1A2基因及其基因序列的引物
權(quán)利要求
1.選擇人類CYP2D6基因的單倍型標(biāo)簽單核苷酸多態(tài)性的方法,所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的所述樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的所述核酸作為模板來擴增人類 CYP2D6基因或其片段;(d)在操作(c)中所得的PCR產(chǎn)物的基因序列中確定變異體的存在;(e)由在操作(d)中已確定具有所述變異體的PCR產(chǎn)物的基因序列確定單倍型;和(f)用SNPtagger軟件對操作(e)中所確定的所述單倍型進行測序并選擇單倍型標(biāo)簽單核苷酸多態(tài)性。
2.如權(quán)利要求1所述的方法,其中,操作(a)中收集的所述生物樣本選自血液、皮膚細(xì)胞、粘液細(xì)胞和毛發(fā)。
3.如權(quán)利要求1所述的方法,其中,操作(c)中的所述引物包含選自參照106、107、 121 127,129 136、138、139、149 和 150 的基因序列。
4.如權(quán)利要求1所述的方法,其中,操作(d)中的所述變異體選自單核苷酸多態(tài)性、基因刪除和基因重復(fù)。
5.如權(quán)利要求1所述的方法,其中,操作(d)中對所述變異體的存在的確定包括用測序、電泳分析和RFLP分析中的一種來確定所述變異體的存在。
6.如權(quán)利要求1所述的方法,所述方法還包括重復(fù)操作(a) (d)。
7.確定人類CYP2D6基因的基因型的方法,所述方法包括(a)從人類收集生物樣本;(b)從操作(a)中所收集的所述樣本中提取核酸;(c)用引物進行PCR,該反應(yīng)使用操作(b)中所提取的所述核酸作為模板來擴增人類 CYP2D6基因或其片段;和(d)確定CYP2A6基因中至少11種變異體的存在,所述至少11種變異體包括選自-1426C > TUOOC > !“和 1039C > T 中的一種;選自-1028T > C、_377A > G、3877G > A、 4388C > T 和 4401C > T 中的一種;選自-740C > T、_678G > A、214G > C、221C > A、223C>G、227T > C、232G > C、233A > C、245A > 6和 2850C > T 中的一種;1611T > A ; 1758G>A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;2D6 刪除;禾口 2D6 重復(fù)。
8.如權(quán)利要求7所述的方法,其中,操作(a)中收集的所述生物樣本選自血液、皮膚細(xì)胞、粘液細(xì)胞和毛發(fā)。
9.如權(quán)利要求7所述的方法,其中,操作(c)中的所述引物包含選自參照106、107、 121 127,129 136、138、139、149 和 150 中的基因序列。
10.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自> Τ、IOOC > T 和 1039C > T 中的一種;選自 1(^8Τ > C、-377Α > G、 3877G > A、4388C > !“和 4401C > T 中的一種;選自-740C > T、_678G > A、214G > C、221C>A、223C > G、227T > C、232G > C、233A > C、245A > 6和 2850C > T 中的一種;1611T > A ; 1758G>A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;2D6 刪除;和 2D6 重復(fù)。
11.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自-1584C > G ;-1426C > TUOOC > !“和 1039C > T 中的一種;選自 161IT > A ; 1758G > A ;2573insC ;-740C > T、_678G > A、214G > C、221C > A、223C > G、227T > C、232G>C、233A > C、245A > 6和 2850C > T 中的一種;選自-1245insGA、-1028T > C、_377A > C、3877G > A、4388C > !“和 4401C > T 中的一種;4125_4133insGTGCCCACT ;2D6 刪除;和 2D6重復(fù)。
12.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自> TUOOC > T 和 1039C > T 中的一種;選自 1584C > G ;-1028T > C、-377A > G、3877G > A、4388C > !“和 4401C > T 中的一種;選自-740C > T、_678G > A、 214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、245A > 6和 2850C > T 中的一種;161 IT > A ;1758G> A ;1887insTA ;2573insC ;4125_4133insGTGCCCACT ;2D6 刪除;禾口 2D6重復(fù)。
13.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自-1584C > G ;-1426C > TUOOC > !“和 1039C > T 中的一種;選自 161IT > A ; 1758G > A ;2573insC ;-740C > T、_678G > A、214G > C、221C > A、223C > G、227T > C、232G>C、233A > C、245A > 6和 2850C > T 中的一種;選自-1245insGA、-1028T > C、_377A > G、3877G > A、4388C > T 和 4401C > T 中的一種;4125_4133insGTGCCCACT ;-1235A > G ; 1887insTA ;2D6 刪除;禾口 2D6 重復(fù)。
14.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自> TUOOC > !“和 1039C > T 中的一種;選自 1(^8T > C、-377Α > G、 3877G > A、4388C > T 和 4401C > T 中的一種;選自 1611T > A ;1661G > C 和 4180G > C 中的一種;1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;-1235A>G ; 1887insTA ;2D6 刪除;禾口 2D6 重復(fù)。
15.如權(quán)利要求7所述的方法,其中,所述操作(d)包括確定變異體的存在,所述變異體包括選自-1584C > G ;-1426C > TUOOC > T禾日1039C > T中的一種;選自1611T>A ; 1758G > A ;2573insC ;-740C > T、-678G > A、214G > C、221C > A、223C > G、227T>C、232G > C、233A > C、245A > G 禾日 2850C > T 中的一種;選自-1245insGA、-1028T>C、-377A > G、3877G > A、4388C > T 和 4401C > T 中的一種;1887insTA ;2988G > A ; 4125-4133insGTGCCCACT ; 2D6 刪除;和 2D6 重復(fù)。
16.如權(quán)利要求7所述的方法,其中,操作(d)中對所述變異體的存在的確定包括用 SNaPshot分析確定所述變異體的存在。
17.如權(quán)利要求16所述的方法,其中,所述SNaPshot分析用引物進行,所述引物具有緊接單核苷酸多態(tài)性的堿基作為3’端,具有在與所述單核苷酸多態(tài)性位點相鄰處退火的基因序列,并具有添加到5’端的T堿基。
18.如權(quán)利要求17所述的方法,其中,所述引物包含選自參照141 148、152和153中的基因序列。
19.用基因芯片確定人類CYP2D6基因的方法,所述方法包括(a)提取待研究的基因并進行多重PCR以獲得具有待鑒定的單核苷酸多態(tài)性邊界的 PCR產(chǎn)物;(b)對ASPE(等位基因特異性引物延伸)引物進行ASPE反應(yīng)以鑒定每個等位基因的特異性堿基;(C)將反應(yīng)物與所述基因芯片相混合;和 (d)分析所述芯片。
20.如權(quán)利要求19所述的方法,其中,所述基因芯片包含具有參照158 184的基因序列的探針。
21.CYP2D6基因分型試劑盒,所述試劑盒具有用于單核苷酸多態(tài)性檢測的Zip編碼寡核苷酸芯片。
全文摘要
本發(fā)明涉及用于確定細(xì)胞色素P450 2D6(CYP2D6)基因的基因型的單倍型標(biāo)簽單核苷酸多態(tài)性(htSNP)和使用所述htSNP的基因芯片,更具體而言,涉及用于確定人類CYP2D6基因的單倍型的htSNP的選擇方法、使用所述htSNP確定所述基因的基因型的方法和用于所述方法的基因芯片。
文檔編號C12Q1/68GK102304572SQ20111024042
公開日2012年1月4日 申請日期2007年6月26日 優(yōu)先權(quán)日2006年9月11日
發(fā)明者孫知弘, 崔銀貞, 張仁珍, 李相燮, 申載國, 芮晟洙, 車仁浚, 車恩暎, 鄭惠恩, 鄭玄朱, 金佑永, 金垠泳, 金江美 申請人:Inje 大學(xué)校產(chǎn)學(xué)協(xié)力團