專利名稱:用于預(yù)測2型糖尿病易感性的試劑盒及引物的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于預(yù)測2型糖尿病易感性的試劑盒及引物,更具體地,本發(fā)明涉及利用新鑒別的2型糖尿病易感基因Caspase9的一個(gè)單核苷酸多態(tài)性(SNP)位點(diǎn)設(shè)計(jì)的預(yù)測2型糖尿病易感性的試劑盒和引物。本發(fā)明還涉及Caspase9基因在制備預(yù)測2型糖尿病易感性的診斷劑中的應(yīng)用。
背景技術(shù):
大量流行病學(xué)資料表明,糖尿病是一種具有明顯遺傳傾向的復(fù)雜的多基因遺傳病。遺傳因素可明顯影響機(jī)體對胰島素的敏感性。最近幾年,大多數(shù)研究者致力于通過定位克隆法尋找糖尿病相關(guān)基因,即尋找患病家系成員間共享的染色體DNA區(qū)域間的連鎖。已發(fā)現(xiàn)2型糖尿病中的一些相對較少見的單基因形式,稱為青年晚發(fā)型糖尿病(maturity-onset diabetes of the young,MODY),是由于突變導(dǎo)致了β細(xì)胞功能低下。這些病人通常在青春期到成人早期發(fā)病,表現(xiàn)為葡萄糖反應(yīng)性胰島素分泌缺陷。這些致病基因中有6個(gè)分別編碼葡萄糖激酶、轉(zhuǎn)錄因子HNF1α、1β、4α及胰島素啟動因子(IPF1),神經(jīng)細(xì)胞分化蛋白(NeuroD1)。這些基因突變最終導(dǎo)致高血糖血癥。這些單基因糖尿病的發(fā)病率還不確切,估計(jì)占所有2型糖尿病的5%。但是,單純利用定位克隆的策略來確定多基因遺傳病的成功報(bào)道還不多。
除了定位克隆法外,目前對多基因遺傳病的相關(guān)基因進(jìn)行研究還有一種方法最常用的方法,即候選基因法,即直接研究疾病候選基因的變異與疾病表型之間的關(guān)系。該法主要基于對家系或人群的病例-對照關(guān)聯(lián)分析。關(guān)聯(lián)分析不需要大的家系研究而是比較某個(gè)或某一套標(biāo)記在患者和正常個(gè)體的分布程度。某種標(biāo)記如果在患病個(gè)體中分布十分明顯,那么就可以認(rèn)為該標(biāo)記與疾病表型相關(guān)聯(lián)。但是,候選基因法中由于對致病基因所在位置沒有足夠了解,在選擇候選基因上存在較大的盲目性,主要針對與疾病發(fā)生發(fā)展相關(guān)的一些代謝通路進(jìn)行研究。將上述兩種方法相結(jié)合的定位候選克隆法在一定程度上彌補(bǔ)了任何單一一種方法的局限性,為目前多基因遺傳病研究中所普遍采用的策略。
同遺傳病研究策略相對應(yīng),其研究工具—多態(tài)性標(biāo)記也從第一代的限制性片段長度多態(tài)性(Restrictive Fragment Length Polymorphism,RFLP),第二代的微衛(wèi)星標(biāo)記(Microsatellite Marker)發(fā)展到第三代的單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)。尤其在對多基因遺傳病進(jìn)行病例-對照關(guān)聯(lián)分析中,需要利用大量高密度的標(biāo)記物,前兩代多態(tài)性標(biāo)記已不能滿足這種要求。因此,近年來,SNP作為第三代遺傳圖譜的構(gòu)建者已越來越引起人們的廣泛關(guān)注。
單核苷酸多態(tài)性(SNP)主要是指基因組水平上由單核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種,占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛分布,平均每500-1000個(gè)堿基中就有1個(gè),其總數(shù)估計(jì)可達(dá)300萬個(gè)甚至更多。近年來,隨著人類基因組及遺傳學(xué)研究的進(jìn)展,SNP在全面深入地了解個(gè)體和群體間基因組的變異或多態(tài)性及疾病研究等方面也越來越顯示出其重要意義。將SNP用于疾病易感基因定位的一個(gè)最大的優(yōu)點(diǎn)就是它的分布廣泛性。其次是它有比微衛(wèi)星更高的穩(wěn)定性,可以最大限度地減少遺傳過程中由于序列變異所導(dǎo)致的信息遺失。另外,SNP很容易實(shí)現(xiàn)高通量的分型,短時(shí)間內(nèi)可以產(chǎn)生大量的結(jié)果,這一點(diǎn)是微衛(wèi)星所無法比擬的。SNP的上述特點(diǎn)決定了它非常適合于進(jìn)行象糖尿病這樣的多基因疾病,尤其是多個(gè)微效基因所導(dǎo)致的疾病的定位研究。選擇合適的病例和正常對照,采取關(guān)聯(lián)分析的研究方法,對SNP而言,是非常適合的。
本發(fā)明人近幾年來一直從事中國北方漢族人群2型糖尿病(非胰島素依賴型糖尿病,NIDDM)基因定位研究。在先前進(jìn)行的全基因組掃描工作中,本發(fā)明人已經(jīng)分別鑒定出多個(gè)易感基因位點(diǎn),它們分別位于1號,12號,18號及20號染色體上。其中在1號染色體上共有5個(gè)存在易感基因的區(qū)域。在此基礎(chǔ)上,本發(fā)明人嘗試從定位區(qū)域選擇合適的候選基因,利用SNP進(jìn)行了病例-對照關(guān)聯(lián)分析,最終終于鑒定了一個(gè)糖尿病易感基因(即CASP9基因),以及該基因上的一個(gè)與中國北方漢族人2型糖尿病特別相關(guān)的SNP位點(diǎn)。由此經(jīng)過深入研究完成了本發(fā)明。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,提供了一種預(yù)測2型糖尿病易感性的試劑盒,所述試劑盒包含基于圖1B或圖1A的序列設(shè)計(jì)的用于PCR擴(kuò)增的特異引物以及通過核酸擴(kuò)增進(jìn)行檢測的試劑盒所含的常規(guī)組件。所述引物針對圖中所示的SNP位點(diǎn)而設(shè)計(jì),長度為18bp-21bp。優(yōu)選地,所述引物選自SEQ ID NO1-30組成的一組,更優(yōu)選地,所述引物為具有SEQ ID NO31,SEQ ID NO32所示序列的單堿基延伸(SBE)引物。
根據(jù)本發(fā)明的另一方面,提供了用于預(yù)測2型糖尿病易感性的引物,所述引物為基于圖1B或圖1A的序列設(shè)計(jì)的用于PCR擴(kuò)增的特異引物,所述引物針對圖中所示的SNP位點(diǎn)而設(shè)計(jì),長度為18bp-21bp。優(yōu)選地,所述引物選自SEQ ID NO1-30組成的一組。根據(jù)本發(fā)明的一個(gè)更優(yōu)選的實(shí)施方案,本發(fā)明的引物為SEQ ID NO31,SEQID NO32所示的單堿基延伸(SBE)引物。
根據(jù)本發(fā)明的再一方面,提供了Caspase9基因作為2型糖尿病易感基因在制備用于糖尿病診斷的診斷劑中的應(yīng)用,Caspase9基因的核苷酸序列如SEQ ID NO33所示。
圖1A為本發(fā)明的SNP位點(diǎn)(R)所在的Caspase9基因區(qū)域的核苷酸序列。
圖1B為圖1A序列的互補(bǔ)序列。
具體實(shí)施例方式
定義單核苷酸多態(tài)性(SNP)主要是指基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種,占所有已知多態(tài)性的90%以上。
微衛(wèi)星位點(diǎn)把長度為2-6個(gè)核苷酸的串聯(lián)重復(fù)序列(VNTR)稱為微衛(wèi)星(Microsatellite),微衛(wèi)星位點(diǎn)有兩個(gè)最突出的優(yōu)點(diǎn)一是它出現(xiàn)頻率很高,遍布于整個(gè)基因組,而且,由于短序列在進(jìn)化上不受選擇,因而在同一位點(diǎn)上可變重復(fù)單位數(shù)目變化很大,一個(gè)位點(diǎn)可能有多達(dá)幾十種的等位基因,信息含量高;二是STR兩側(cè)的特異性單拷貝序列穩(wěn)定性高,可作為檢測其多態(tài)性的PCR引物。以PCR技術(shù)操作,可以實(shí)現(xiàn)自動化大規(guī)模操作基因分型及等位基因頻率分布同一種群生物中,相同等位基因核苷酸序列順序分析,在此表示相同SNP位點(diǎn)在不同個(gè)體中的組成成分的確定,為基因分型。等位基因頻率是指所研究的同一種類等位基因里,所期望出現(xiàn)的等位基因占的比例,也就是出現(xiàn)變化的等位基因的所占比例。
疾病易感性(糖尿病易感性)人群對疾病容易感受程度。
病例-對照關(guān)聯(lián)分析是一種由因及果的回顧性研究。它是先按疾病狀態(tài)確定調(diào)查對象,分為病例和對照組,通過比較病例組與對照組間所研究的遺傳標(biāo)志出現(xiàn)頻率的差異而獲得該標(biāo)志與疾病間關(guān)聯(lián)的信息。
單堿基延伸(SBE)反應(yīng)它是指在缺乏四種dNTP、存在四種ddNTP的情況下,測序酶可在引物的3’端加上一個(gè)ddNTP,但因?yàn)椴荒苄纬闪姿岫ユI,故不會繼續(xù)延伸,堿基延伸一個(gè)后即告終止。只需檢測這一個(gè)堿基即可。又稱微測序法(Minisequencing)。
參數(shù)連鎖分析和非參數(shù)連鎖分析根據(jù)基因的重組率來計(jì)算兩個(gè)基因之間的染色體圖距即連鎖分析,用分類變量(離散變量)來進(jìn)行分析,把測量指標(biāo)按某一標(biāo)準(zhǔn)歸類,計(jì)數(shù),然后進(jìn)行分析為參數(shù)分析,用實(shí)際測量后的結(jié)果進(jìn)行的分析為非參數(shù)連鎖分析,細(xì)胞凋亡是在發(fā)育過程中,正常生理狀況下的細(xì)胞死亡。這一個(gè)過程的很重要的特征caspase基因,活性氧,鈣離子。β細(xì)胞的凋亡程度的增加和糖尿病相關(guān)。
Caspase-9位于染色體的1p36.3-p36.1,是Caspase家族成員的半胱氨酸—天門冬氨酸蛋白酶,Caspase蛋白家族成員的順序活化在凋亡的執(zhí)行階段起到重要的作用。Caspase蛋白以無活性的前體蛋白形式存在,通過在保守的天門冬氨酸殘基處斷裂產(chǎn)生兩個(gè)亞基,這兩個(gè)亞基結(jié)合成有活性的蛋白酶。
1997年,Li等人報(bào)道了從hela細(xì)胞中純化了第三種凋亡活性因子APAF3,在體外參與caspase-3的活化。APAF3被確認(rèn)為caspase家族的一個(gè)成員,并且叫做caspase-9。在cytochrome c和dATP存在的情況下,caspase-9和APAF1通過他們各自的N-端的CED-3同源結(jié)構(gòu)域相互作用,導(dǎo)致caspase-9的活化,活化的caspase-9反過來剪切和活化caspase-3。caspase-9的活性位點(diǎn)的突變降低了caspase-3的活化和對凋亡的應(yīng)答。表明caspase-9是凋亡過程中非常上游的蛋白,并且由cytochrome c和dATP觸發(fā)。
Procaspase-9在cytochrome c和dATP的存在下被APAF1切割活化,產(chǎn)生了成熟的caspase蛋白。caspase-9的活化起始了一系列下游的蛋白因子如caspase-3,caspase-6,caspase-7。XIAP和caspase-9相互作用并且抑制它的活性,而SMAC通過和XIAP相互作用解除這種抑制。
2002年,Marsden等人建立了由BCL2控制的細(xì)胞死亡途徑,并不需要caspase-9及其活化因子APAF1的參與。由于凋亡過程在缺失caspase-9和APAF1的時(shí)候受到的影響很小,Marsden認(rèn)為凋亡復(fù)合體并不是凋亡過程中的一個(gè)觸發(fā)機(jī)制,只不過是放大了凋亡的過程。
早在1998年,Kuida等人敲除小鼠的人caspase-9基因的同源基因,大多數(shù)基因敲除小鼠死于大腦的明顯的增大和畸形,這是由于在發(fā)育過程中凋亡過程的減弱引起的。Hakem等人也得到了caspase9敲除的小鼠。caspase-9缺失的胚胎干細(xì)胞和胚胎纖維細(xì)胞系對包括UV和伽馬射線的數(shù)種凋亡刺激都有抵抗。
2型糖尿病的病因十分復(fù)雜,在大多數(shù)情況下都會發(fā)生胰島素抵抗和β細(xì)胞的功能缺陷。隨著病情的發(fā)展,β細(xì)胞的功能缺陷加劇,使得胰島素的分泌不足,病人必須補(bǔ)充胰島素來維持正常的代謝。研究表明,在出現(xiàn)臨床癥狀之前,β細(xì)胞的缺損就已經(jīng)出現(xiàn)了。已經(jīng)通過不同的途徑表現(xiàn)出來在葡萄糖或者其他促分泌劑的刺激下胰島素的分泌減少,胰島素的分泌特點(diǎn)上出現(xiàn)了問題,前胰島素原到胰島素的轉(zhuǎn)變的效率的改變,還有,胰島細(xì)胞淀粉小體多肽(Islet AmyloidPolypeptide,IAPP)釋放的減少。
胰島素的抵抗會引起β細(xì)胞分泌功能的提高。這一提高需要胰島素的生物合成和釋放,這一現(xiàn)象提示,經(jīng)過一段時(shí)間,和胰島素的抗性的增加引起的對胰島素需求的增加導(dǎo)致了β細(xì)胞的“衰竭”,因此最終會失去功能。在沒有遺傳缺陷的個(gè)體中在胰島素抵抗的時(shí)候,β細(xì)胞會有適應(yīng)性改變,并且防止最終防止發(fā)生高血糖。因?yàn)椋瑤缀踉谒械姆逝謧€(gè)體中都有存在不同程度的胰島素抵抗,只有一小部分的個(gè)體最終發(fā)展成為糖尿病。這說明,正常的β細(xì)胞可以適應(yīng)胰島素的抵抗,遺傳易感個(gè)體攜帶的突變,使得個(gè)體無法完全適應(yīng)胰島素的抵抗,而導(dǎo)致遺傳性的β細(xì)胞程序型死亡。這樣,增加的胰島素分泌因此暴露了β細(xì)胞功能的缺陷。
血液中葡萄糖不正常的代謝狀態(tài)導(dǎo)致了細(xì)胞凋亡的加速。在人的體外培養(yǎng)的人的胰腺的朗罕氏細(xì)胞中發(fā)現(xiàn)高糖可以調(diào)控bcl基因家族的表達(dá),來誘導(dǎo)細(xì)胞的凋亡。有一系列的研究表明在2型糖尿病患者中都發(fā)生減少。β細(xì)胞質(zhì)量的減少導(dǎo)致了胰島素的分泌的減少,然而質(zhì)量的減少并不能解釋觀測到的所有的功能改變,質(zhì)量減少的病理學(xué)原因可能是多因素的。
最近的研究發(fā)現(xiàn),飽和自由脂肪酸(Free Fatty Acid,F(xiàn)FA)的含量的升高會誘導(dǎo)胰島素的抗性和β細(xì)胞的凋亡。并且有證據(jù)表明FFA可以影響caspase,bcl-2基因的表達(dá),引發(fā)β細(xì)胞的調(diào)亡。另外,在糖尿病并發(fā)視網(wǎng)膜疾病的小鼠中,發(fā)現(xiàn)在小鼠患有糖尿病之后的2個(gè)月之內(nèi),有數(shù)個(gè)Caspase基因被激活,包括caspases-1,-2,-6,-8,and-9,說明糖尿病引發(fā)了凋亡的產(chǎn)生。
本課題組的先期工作表明,1、12、18和20號染色體上均存在有中國北方漢族人2型糖尿病的易感基因位點(diǎn),其中1號染色體上有4個(gè)區(qū)域(1p36、1p31、1q22及1q42-43)顯示與2型糖尿病相連鎖(本組前人作出,不需要文獻(xiàn))。如下述實(shí)施例所示,進(jìn)一步對該區(qū)域進(jìn)行的精細(xì)掃描結(jié)果顯示,其中有3個(gè)區(qū)域(1p36.33-36.23、1q24.3-25.1及1q42.12-42.13)仍存在連鎖。
目前有多個(gè)公共數(shù)據(jù)庫儲存了幾百萬條SNP信息,人們可以通過多種方式,如以基因名、登記號、染色體號、功能級別等,進(jìn)行查尋。但是,這些數(shù)據(jù)庫中的SNP絕大多數(shù)只是“候選者”,而非經(jīng)過驗(yàn)證的真正SNP。它們是利用計(jì)算機(jī)在對多個(gè)克隆序列進(jìn)行比對時(shí)發(fā)掘出來的,其中必然存在一部分假陽性SNP。另外,這些SNP大多數(shù)是利用高加索人和黑人測序?qū)ふ业腟NP,在中國人群中的分布有些不一定相同,我們利用中國北方漢族人群的糖尿病患者和正常對照,重新測序?qū)ふ襍NP。并利用我們在中國北方漢族糖尿病人群中發(fā)現(xiàn)的高頻的SNP進(jìn)行基因分型。
為尋找2型糖尿病易感基因,本發(fā)明人根據(jù)美國國家生物信息學(xué)(National Center for Biotechnology Information) 中心公布的信息選取位于1p36.23-36.33、1q24.3-25.1及1q42.12-42.13區(qū)域的2型糖尿病34個(gè)候選基因,對這些基因的外顯子,Promotor區(qū)2kb,以及臨近的內(nèi)含子的區(qū)域進(jìn)行測序篩查中國北方漢族人群中的SNP。并對其中部分高頻的SNP進(jìn)行基因分型,通過SBE反應(yīng)(包括直接的SBE反映,SnapshotTM試劑盒,SnupeTM試劑盒),酶切,序列測定等方法對其在病例組及對照組進(jìn)行分型及病例-對照關(guān)聯(lián)分析。
如以下實(shí)施例所詳細(xì)討論的,所選擇的124個(gè)高頻的SNP位點(diǎn)中,Caspase9基因內(nèi)選取了9個(gè)位點(diǎn)進(jìn)行基因分型,發(fā)現(xiàn)本位點(diǎn)和糖尿病相關(guān),分別位于第八號內(nèi)含子的-237位處的一個(gè)SNP位點(diǎn)(K,即G/T),NCBI中的編號是rs884363,其等位基因頻率分布在病例組和對照組中的差異有統(tǒng)計(jì)學(xué)意義(P<0.05),提示這一SNP位點(diǎn)與2型糖尿病相關(guān),進(jìn)一步得出結(jié)論,其所在基因Casp9基因?yàn)橹袊狈饺?型糖尿病的易感基因。
因此,本發(fā)明的一個(gè)方面涉及糖尿病易感基因Casp9基因在預(yù)測糖尿病易感性中的應(yīng)用?;贑asp9基因,可以獲得各種診斷劑和試劑盒以用于預(yù)測2型糖尿病易感性。
Casp9所在基因組序列如SEQ ID NO33所示,全長為31,971bp,本發(fā)明所揭示的SNP位點(diǎn)(K)位于該序列的30,250-31,700位之間,這一區(qū)域的核苷酸序列如圖1A所示,圖中K為SNP位點(diǎn),其代表堿基G/T多態(tài)性,即該位點(diǎn)可以為G,也可以為T。這一區(qū)域的互補(bǔ)序列如圖1B所示,圖中M代表本發(fā)明的SNP位點(diǎn)的互補(bǔ)堿基,其代表堿基C/A。
本發(fā)明還涉及用于預(yù)測糖尿病易感性的引物。優(yōu)選地,所述引物基于圖1A的序列而設(shè)計(jì),由此,PCR擴(kuò)增后的產(chǎn)物測序可以直接測得SNP位點(diǎn)。當(dāng)然,本發(fā)明的引物也可以基于圖1B的序列設(shè)計(jì),這樣PCR擴(kuò)增后的產(chǎn)物測序得到SNP的互補(bǔ)堿基。優(yōu)選地,本發(fā)明的引物具有SEQ ID NO1-30所示的序列,特別優(yōu)選的是SEQ ID NO31SEQ ID NO32所示的SBE引物。下表1舉例示出了本發(fā)明的引物的一些組合,引物的解鏈溫度(Tm)以及這些組合得到的產(chǎn)物大小。本領(lǐng)域技術(shù)人員能夠理解,本發(fā)明的引物不限于這些列出的引物及其組合。
表1
本發(fā)明進(jìn)一步涉及包含本發(fā)明的一或多種引物的試劑盒,該試劑盒用于檢測糖尿病的易感性。除了本發(fā)明的引物之外,所述試劑盒還包含運(yùn)用PCR擴(kuò)增而進(jìn)行檢測的試劑盒的常規(guī)組件、試劑、緩沖液等,本領(lǐng)域技術(shù)人員熟悉這些常規(guī)組件和檢測方法。
以下將參照實(shí)施例進(jìn)一步描述本發(fā)明。
實(shí)施例1中國北方漢族人群2型糖尿病易感基因的精細(xì)定位1、2型糖尿病家系的收集收集中國北方漢族人群中滿足以下要求的2型糖尿病家系1)家系中連續(xù)2代或2代以上出現(xiàn)2型糖尿病患者,每代至少有一個(gè)患者、一個(gè)正常人。
2)糖尿病患者應(yīng)是在正規(guī)醫(yī)院確診的、對胰島素不敏感者(除外1型糖尿病)。入選的對照個(gè)體年齡應(yīng)在35歲以上(以盡量排除尚未發(fā)病的家系成員)。
3)除糖尿病外,不合并其它明顯器質(zhì)性疾病,如高血壓、冠心病(除外糖尿病所導(dǎo)致的并發(fā)癥)等。
在采集家系前應(yīng)確保所有家系成員都了解采血目的,即有知情權(quán),血樣提供人在了解了所有情況后,若同意,要在“知情同意書”上簽字,才能實(shí)施抽血和其它個(gè)人情況的調(diào)查。若不同意,則尊重其個(gè)人意見。將收集的資料嚴(yán)格保密,不對外公布供血成員的姓名、年齡、疾病等所有資料。
對入選家系的每一個(gè)成員,除已明確診斷的2型糖尿病患者外,均應(yīng)進(jìn)行口服葡萄糖糖耐量試驗(yàn)(Oral Glucose Tolerance Test,OGTT),以確認(rèn)每一個(gè)成員是否可作為正常對照。OGTT試驗(yàn)過程抽取空腹靜脈血及口服75g葡萄糖(5分鐘內(nèi)喝完)后30分鐘、60分鐘、120分鐘及180分鐘的靜脈血,觀察血糖濃度的動態(tài)變化情況。此外,記錄每一個(gè)體一般情況,包括性別、出生年月、籍貫、發(fā)病年齡、身高、體重、心率、呼吸、血壓、用藥情況、有無合并癥、以及血脂、血電解質(zhì)等項(xiàng)目,必要時(shí)行特殊檢查,以排除合并有高血壓、心臟病、動脈粥樣硬化等疾病的家系。
2型糖尿病的診斷嚴(yán)格按照WHO于1985年頒發(fā)的標(biāo)準(zhǔn)執(zhí)行。即空腹血葡萄糖濃度≥7.8mmol/L或餐后2小時(shí)血糖≥11.1mmol/L為糖尿病。OGTT的判斷標(biāo)準(zhǔn)為服糖后2小時(shí)血葡萄糖濃度<7.8mmol/L為正常,≥11.1mmol/L為糖尿病,在7.8-11.1mmol/L之間為糖耐量低減(impaired glucose tolerance,IGT)。
共采集到60個(gè)符合以上條件的2型糖尿病家系,成員共計(jì)367人。其中2型糖尿病患者180例,正常人171例,IGT患者16例。這些家系分別來自北京、山東、河北、內(nèi)蒙古、河南等地的漢族人群。繪制所有家系的家系圖,并對每一家系及家系成員進(jìn)行編號,此編號同DNA入庫號一致。在所收集到的家系中,15%(9/60)為三代家系,85%(51/60)為二代家系。患者中男性為83人,女性為97人;IGT者16人。家系成員平均年齡為50.03歲,其分布情況(分患病和正常)見表2表2 2型糖尿病家系成員年齡構(gòu)成
取所有家系每一成員的外周血樣備用。
2、PCR擴(kuò)增微衛(wèi)星片段、基因分型常規(guī)方法提取上述血樣中的基因組DNA,提取后的DNA均溶解于TE緩沖液中,注明樣品所屬家系、編號等資料,-20℃保存待用。
在以往全基因組掃描陽性區(qū)(1p36,1p31,1p12,1q22,1q42-43區(qū),20p12,20q13區(qū),12p12區(qū)及18q23區(qū))選擇雜合度較高、分布較為均勻的微衛(wèi)星位點(diǎn)進(jìn)行第二輪掃描。共選擇了60個(gè)位點(diǎn),其中1號染色體5個(gè)陽性區(qū)域內(nèi)34個(gè),平均密度3.2cM;12號染色體4個(gè),平均密度2.2cM;18號染色體4個(gè),平均密度1.9cM;20號染色體上3個(gè)區(qū)域內(nèi)18個(gè),平均密度2.6cM。這些微衛(wèi)星位點(diǎn)的最低雜合度為0.64,最高為0.88,平均值0.748。部分微衛(wèi)星位點(diǎn)的遺傳學(xué)位置自http//www-genome.wi.mit.edu查找所得(在“Human PhysicalMapping Project”欄下),部分自法國Genethon的人類多態(tài)性中心的資料上獲得。在所用的60個(gè)微衛(wèi)星位點(diǎn)中,16個(gè)在ABI公司Version2.0試劑盒中已有引物,46個(gè)需新設(shè)計(jì)合成引物。新合成的一對引物中的一條用熒光物質(zhì)FAM或HEX標(biāo)記。所有引物在合成時(shí)綜合考量PCR擴(kuò)增片段長度的大小及可能的合理分組情況來確定熒光標(biāo)記的顏色。反應(yīng)所用的引物序列參見法國Genethon遺傳圖譜的Microsatellite Markers Data Set。各微衛(wèi)星位點(diǎn)擴(kuò)增片段長度及引物信息見表3。
表3 60個(gè)微衛(wèi)星位點(diǎn)的大小范圍與標(biāo)記熒光位點(diǎn)名稱片段大小(bp)標(biāo)記熒光位點(diǎn)名稱片段大小(bp)標(biāo)記熒光D1S243 142-170 HEX D1S2709 191-197 FAMD1S468 173-191 HEX D1S2800 195-225 FAMD1S2845 193-233 FAM D1S235 175-195 FAMD1S214 122-152 NED D1S2850 145-153 FAMD1S2663 183-205 FAM D12S1625264-280 FAMD1S472 228-244 FAM D12S77 163-193 FAMD1S2892 93-129 FAM D12S336 117-135 NEDD1S2722 195-223 FAM D12S89 254-288 HEXD1S463 223-233 HEX D18S465 233-251 HEXD1S211 170-198 HEX D18S61 213-243 NEDD1S2627 265-279 FAM D18S1125268-286 FAMD1S2868 210-224 FAM D18S488 239-264 HEXD1S497 250-278 EAM D20S906 229-247 FAMD1S206 208-226 NED D20S842 156-180 HEXD1S495 138-164 FAM D20S889 93-129 FAMD1S2707 137-159 FAM D20S849 214-236 FAMD1S2878 152-178 NED D20S95 82-100 FAMD1S196 322-338 HEX D20S892 205-223 FAMD1S2815 210-237 FAM D20S115 238-250 NEDD1S218 266-286 NED D20S851 128-150 FAMD1S466 155-175 FAM D20S901 260-268 FAM
D1S2692 187-217 HEX D20S186 121-143 HEXD1S245 235-253 FAM D20S852 152-176 HEXD1S205 94-112 FAM D20S112 217-241 FAMD1S425 336-360 NED D20S912 267-283 FAMD1S419 162-194 FAM D20S857 204-220 FAMD1S2860 168-184 FAM D20S840 141-165 FAMD1S2880 113-135 FAM D20S120 213-241 FAMD1S213 107-133 NED D20S100 213-239 HEXD1S2833 92-108 FAM D20S102 169-177 FAMPCR擴(kuò)增后,在377電泳儀(ABI公司)上進(jìn)行電泳,用377電泳圖象收集軟件(ABI PrismTM377-96 Collection或ABI PrismTM377XL Collection)收集結(jié)果,在GENEHUNTER2.0軟件(美國麻省理工學(xué)院遺傳系編寫,從http//cmag.cit.nih.gov上可自由下載)上運(yùn)算,計(jì)算相關(guān)的位點(diǎn)與表型連鎖的P值、Z值。結(jié)果顯示在所研究的10個(gè)區(qū)域中有3個(gè)區(qū)域繼續(xù)顯示出與糖尿病連鎖的證據(jù),如表4所示表4 3個(gè)陽性區(qū)域內(nèi)有意義位點(diǎn)的遺傳位置、P值及Z值位點(diǎn)名稱距p末端距離(cM)細(xì)胞遺傳學(xué)位置統(tǒng)計(jì)P值統(tǒng)計(jì)Z值D1S243 0.01p36.33 0.008341.653D1S468 6.21p36.33 0.0015 2.135D1S2845 11.1 1p36.32 0.033 1.292D1S214 16.4 1p36.31 0.0025 2.005D1S2663 16.9 1p36.23 0.002051.996D1S2815 193.8 1q24.30.001262.17D1S218 196.5 1q25.10.043 1.2D1S2800 256.2 1q42.12 0.0128 1.579D1S235 258.7 1q42.13 0.0547 1.363從上表可以看出,1p36.33-36.23區(qū)有意義(P<0.05)的陽性位點(diǎn)最多,共有5個(gè),最低的P值為0.0015,Z值2.135,5個(gè)位點(diǎn)分布在長達(dá)16.9cM的區(qū)域內(nèi)。1q24.3-25.1區(qū)有2個(gè)位點(diǎn),1q42.12-42.13區(qū)有1個(gè)位點(diǎn)滿足P<0.05的標(biāo)準(zhǔn),另外D1S235的P值雖然略高于0.05,但其Z值已達(dá)統(tǒng)計(jì)學(xué)界值(Z>1.36),因此可以認(rèn)為該位點(diǎn)與糖尿病還是有連鎖關(guān)系的。這兩個(gè)區(qū)域已分別精細(xì)定位至2.7cM(D1S2815-D1S218)和2.5cM(D1S2800-D1S235)的狹窄范圍內(nèi)。引人注目的是在1p36.33-36.23區(qū),連續(xù)5個(gè)位點(diǎn)都出現(xiàn)了P值小于0.05的情況,因此下一步選擇此區(qū)域克隆易感基因。
實(shí)施例2 糖尿病易感基因CASP9的鑒定及該基因內(nèi)SNP的相關(guān)研究1、中國北方漢族人群2型糖尿病患者及正常對照標(biāo)本的收集正常組及2型糖尿病組人群外周血樣本均采自北京協(xié)和醫(yī)院內(nèi)分泌科門診。標(biāo)本來源均為我國北方地區(qū),包括北京、山東、河北、內(nèi)蒙古自治區(qū)等地,以北京為主。糖尿病可為散發(fā),也可為糖尿病家系的成員(但此時(shí)每一家系中通常只有一個(gè)患者入選,同一家系中沒有任何血緣關(guān)系的成員可以選擇一個(gè)以上);正常對照來自正常人群,要求其家庭三代以內(nèi)沒有糖尿病患者(包括I型糖尿病),對照組與患病組年齡及性別相匹配。
2型糖尿病診斷同實(shí)施例1。入選的每個(gè)成員記錄一般情況,包括性別、出生年月、籍貫、發(fā)病年齡、身高、體重、心率、呼吸、血壓、用藥情況、有無合并癥等,對每個(gè)成員檢查血脂、血電解質(zhì)等項(xiàng)目,必要時(shí)行特殊檢查,以排除合并有高血壓、心臟病、動脈粥樣硬化等疾病。入選的每個(gè)成員都應(yīng)在“知情同意書”上簽字。
共采集到325份標(biāo)本,其中病例組173份,對照組152份。兩組在性別、年齡上相匹配,糖尿病患者的平均年齡為51.99歲,正常對照采樣時(shí)的平均年齡為48.8歲。在所有成員中,男女的比例為169∶156,病例組男性92人,女性81人;對照組男性77人,女性75人。兩組成員的年齡分布情況如下表5患病組和對照組成員的年齡構(gòu)成
2、候選基因的確定及候選基因中用于基因分型的SNP位點(diǎn)的選擇基于實(shí)施例1的結(jié)果,即染色體1p36.33-36.23區(qū)域與2型糖尿病相連鎖,利用生物信息學(xué)方法從NCBI SNP數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/SNP)中選出位于這一區(qū)域或其附近的37個(gè)與葡萄糖代謝相關(guān)基因測定基因的promotor區(qū)2kb,外顯子及其鄰近的內(nèi)含子區(qū),和3’非翻譯區(qū)。并對其中的80個(gè)高頻的snp進(jìn)行基因分型,所述的34個(gè)候選基因如下(1)CASP9位于染色體的1p36.3-p36.1,是caspase家族成員的半胱氨酸精氨酸蛋白酶,caspase蛋白的順序活化在凋亡的執(zhí)行階段起到重要的作用。caspase蛋白以無活性的前提蛋白形式村子,通過在保守的精氨酸殘基處斷裂產(chǎn)生兩個(gè)亞基,這兩個(gè)亞基結(jié)合成有活性的蛋白酶。
(2)CDC2L2基因編碼p34Cdc2蛋白激酶家族成員,位于1p36.3。該激酶家族成員對真核細(xì)胞的細(xì)胞周期調(diào)控起著關(guān)鍵的作用。
(3)磷酸葡萄糖脫氫酶(PGD)是戊糖磷酸旁路途徑中的第二個(gè)脫氫酶,位于人染色體的1p36.3-p36.13。
(4)PRKCZ是蛋白激酶Cζ成員,位于染色體的1p36.33-p36.2位置。是絲氨酸,蘇氨酸蛋白激酶家族中的ζ成員,它參與數(shù)種細(xì)胞代謝過程,(5)SAC基因編碼一個(gè)與典型的哺乳動物不同的腺苷酸環(huán)化酶,位于染色體的1q24。
(6)Urotensin II基因位于染色體1p36,編碼一個(gè)成熟的多肽具有活性的環(huán)12肽,從七腮鰻到人類具有很高的保守性。
(7)GNB1基因位于染色體1p36.33,在信號接受分子和效應(yīng)分子之間傳遞信號,由三個(gè)不同的亞基組成,這個(gè)基因編碼beta亞基。
(8)GPR52基因位于染色體1q24,G蛋白耦聯(lián)的受體家族成員。
(9)氨氯吡咪敏感性鈉離子通道δ亞基(dNaCh,SCNN1D)基因位于1p36.32區(qū)NT_002209中,編碼產(chǎn)物屬非電壓敏感型通道蛋白,可被利尿劑氨氯吡咪抑制,介導(dǎo)腔內(nèi)離子的電擴(kuò)散,以異源四聚體的形式存在于膜上。
(10)乙酰CoA硫酯水解酶(HBACH)基因位于1p36.23區(qū)NT_002530中。編碼產(chǎn)物屬乙酰輔酶家族成員之一,可水解棕櫚酸CoA的CoA硫酯及其它長鏈脂肪酸。
(11)Urotensin II位于1p36.23區(qū)NT_002530中。目前對其蛋白功能所知甚少,但已知其保守性很高。一個(gè)G蛋白偶聯(lián)受體GPR14可作為其受體。
(12)DJ-1(RNA結(jié)合蛋白調(diào)節(jié)亞基)位于1p36.23區(qū)NT_002163中。
(13)5,10-亞甲基四氫葉酸還原酶(MTHFR)基因位于1p36.21區(qū)AL354994克隆中。5,10-亞甲基四氫葉酸還原酶參與葉酸代謝,是同型半胱氨酸葉酸依賴的再甲基化過程的關(guān)鍵酶,以同源二聚體形式發(fā)揮催化活性,受S-腺苷蛋氨酸別構(gòu)調(diào)節(jié)。
(14)氯離子通道B(CLCNKB)基因位于1p36.13區(qū)bA254I4.00143(長47068bp,屬unfinished sequence)中,編碼電壓門控型氯離子通道蛋白B型,主要在腎中表達(dá),它和A型有94%的同源性。氯離子通道可參與調(diào)節(jié)細(xì)胞體積、膜電位穩(wěn)定性、信號傳導(dǎo)及跨上皮轉(zhuǎn)運(yùn)等。
(15)TNFSF4位于染色體的1q25,編碼一個(gè)腫瘤壞死因子受體超家族的個(gè)體。
(16)TNFSF6位于染色體的1q23,編碼一個(gè)腫瘤壞死因子受體超家族的個(gè)體。
(17)SLC19A2位于染色體的1q23.3,編碼維生素b1的轉(zhuǎn)運(yùn)蛋白,屬于葉酸轉(zhuǎn)運(yùn)超家族的成員。
(18)CDC42BPA又叫做PK428,位于染色體1q42.11,和肌強(qiáng)直性營養(yǎng)不良相關(guān)的蛋白激酶相似,絲氨酸,蘇氨酸蛋白激酶,和cAMP依賴的蛋白激酶相似。
(20)KCNK1位于染色體的1q42-q43,這個(gè)基因編碼一個(gè)鉀離子通道蛋白超家族的成員,包含有2個(gè)形成孔蛋白的p結(jié)構(gòu)域,這個(gè)基因的產(chǎn)物看起來不是一個(gè)功能性的通道,他需要其他的蛋白的參與才具有活性。
(21)ATP2B4位于染色體的1q25-q32,這個(gè)基因編碼一個(gè)質(zhì)膜鈣離子泵。
(22)CACYBP位于染色體的1q24-q25,這個(gè)基因編碼一個(gè)鈣結(jié)合蛋白的結(jié)合蛋白,這個(gè)蛋白的結(jié)合的作用還不清楚。
(23)氯離子通道A(CLCNKA)基因,位于1p36.13區(qū)bA254I4.00143(長47068bp,屬unfinished sequence)中,編碼電壓門控型氯離子通道蛋白A型,主要在腎中表達(dá)。
(24)ENO1位于染色體的1p36.3-p36.2,這個(gè)基因編碼哺乳動物中的3個(gè)烯醇化酶異構(gòu)酶中的一個(gè),它編碼一個(gè)alpha烯醇化酶,一個(gè)同源二聚體可溶性酶。
(25)DFFA位于染色體的1p36.3-p36.2,這個(gè)基因編碼一個(gè)DNA片段化因子DFF,這個(gè)是個(gè)異源二倍體蛋白包括DFFB和DFFA兩個(gè)亞基。
(26)G蛋白伽馬4蛋白(GNG4),是異源三聚體的G蛋白復(fù)合體中的一個(gè)組分,三聚體蛋白從G蛋白耦聯(lián)的受體產(chǎn)道信號到細(xì)胞內(nèi)的效應(yīng)器。
(27)ICMT異戊基半胱氨酸羰基甲基轉(zhuǎn)移酶,位于染色體的1p36.21,這個(gè)基因編碼一個(gè)翻譯后修飾蛋白的轉(zhuǎn)移酶。
(28)RE2是G蛋白耦聯(lián)的受體,位于染色體的1q23.2,這個(gè)基因是視紫質(zhì)家族的G蛋白耦聯(lián)受體,協(xié)助調(diào)控攻擊和進(jìn)食。
(29)PKLR是肝臟丙酮酸激酶的L型的糖分解酶,位于染色體的1q23.2,將磷酸烯醇式丙酮酸轉(zhuǎn)變成丙酮酸,并且生成ATP。
(30)ALPL是一種非組織特異性的堿性磷酸酶,位于染色體的1p36.1-p34,在肝臟,骨骼,腎臟都有分布。準(zhǔn)確的生理功能現(xiàn)在未知。
(31)PLA2G2D是磷酸酯酶A2,IID組,位于染色體的1p36.12,優(yōu)先水化磷脂的sn-2酯鍵,也許在感染的過程中有重要的功能。
(32)CA14是羰基脫水酶家族中的一個(gè),位于染色體的1q21,催化二氧化碳的可逆性水化,參與數(shù)種不同的生理過程。
(33)CA6是羰基脫水酶家族中的一個(gè),位于染色體的1p36.2,催化二氧化碳的可逆性水化,主要在唾液腺里邊發(fā)現(xiàn)。
(34)PANK4是泛酸酯激酶家族的成員,位于染色體的1p36.23,在細(xì)菌和哺乳動物中催化輔酶A的生物合成。并受到輔酶A的反饋調(diào)節(jié)。
所選擇的用于基因分型的80個(gè)SNP位點(diǎn)如表6所示。
3、SNP位點(diǎn)基因分型分析主要采用3種方法進(jìn)行SNP的分型長度多重性單堿基延伸(LengthMultiplexed Single Base Extension,LM-SBE)反應(yīng),SnaPshot法,限制性片段長度多態(tài)性(Restrictive Fragment Length Polymorphism,RFLP-PCR)及測序分型。
1).LM-SBE反應(yīng)進(jìn)行SNP分型1.1)引物設(shè)計(jì)與合成針對上述23個(gè)SNP位點(diǎn)中的每一個(gè)SNP位點(diǎn)設(shè)計(jì)3條引物,其中的2條為PCR引物,用于擴(kuò)增包含SNP位點(diǎn)的一段序列,另外一條是SBE引物,用于單堿基延伸反應(yīng)。PCR引物通過Primer 3.0程序在線設(shè)計(jì),擴(kuò)增片段長度為150~300bp。
SBE引物設(shè)計(jì)原則引物要位于SNP位點(diǎn)的5′端,其3′端的最后一個(gè)堿基恰好是與SNP緊鄰的前一個(gè)堿基。引物長度在18~46base之間,Tm值在55~80℃之間。預(yù)備同組的幾個(gè)位點(diǎn)為不同類型交替出現(xiàn),其長度相差4個(gè)(或其倍數(shù))堿基,且它們之間不能形成發(fā)卡結(jié)構(gòu),較長的SBE引物不能形成回折等二級結(jié)構(gòu)。參照文獻(xiàn)(Lindhlad-Toh K,Winchester E,Daly MJ,et al.Lange-scale discoveryand genotyping of single-nucleotide polymorphisms in the mouse.Nat.Genet..2000,24381-386)。
另外,設(shè)計(jì)用作分子量大小標(biāo)準(zhǔn)的FAM標(biāo)記的DNA片段,其大小分別為19bp、23bp、27bp、31bp、35bp、39bp、43bp、47bp,所有序列均為AT重復(fù)而成。
1.2)PCR反應(yīng)及產(chǎn)物鑒定將不同類型及不同SBE引物長度的多個(gè)SNP位點(diǎn)(一般為3-5個(gè))組合為一組,先進(jìn)行多重PCR擴(kuò)增包含SNP位點(diǎn)的相應(yīng)數(shù)目DNA片段。反應(yīng)體系5μl,各組分如下名稱原液濃度加樣量(μl)體系終濃度Mg2+25mM0.63mM緩沖液 10× 0.51×
dNTP2mM 0.075 30nM引物10μM 0.05×n各0.1μMAmpliGold 5U/μl 0.05 0.05U/μl模板50ng/μl1 5ng/μlddH2O 補(bǔ)齊至5μl采用Touch-down PCR,其程序如下94℃、12分鐘后,進(jìn)行15個(gè)循環(huán)的94℃ 30秒、63℃ 30秒(每一循環(huán)溫度下降0.5℃)、72℃50秒,隨后24個(gè)循環(huán)的94℃ 30秒、56℃ 30秒、72℃ 50秒,最后72℃ 10分鐘兩次。反應(yīng)結(jié)束后用1%瓊脂糖電泳鑒定,在UV燈下觀察有無產(chǎn)物,并在紫外凝膠成像儀拍照,記錄時(shí)間、位點(diǎn)名稱、樣品號等。
1.3)PCR產(chǎn)物純化PCR反應(yīng)后體系中殘存的dNTP及沒有參與反應(yīng)的單鏈引物會影響下一步的SBE反應(yīng),故用作SBE反應(yīng)模板的PCR產(chǎn)物需要清除這兩者。蝦堿性磷酸酶(Shrimp AlkalinePhosphatase,SAP)可以將dNTP 5′端的磷酸基團(tuán)去除,使之不能形成磷酸二酯鍵,從而不能參與DNA鏈的延伸;核酸外切酶I(Exonuclease I,ExoI)可從單鏈DNA的3′端到5′端方向逐個(gè)降解核苷酸,從而避免PCR反應(yīng)剩余的引物影響下一步的SBE反應(yīng)。
在每5μl PCR產(chǎn)物中加入2μl酶混合液,其中含SAP 0.5U/μl,Exo I lU/μl,混勻,置入37℃水浴箱消化1小時(shí),取出后離心,85℃ 15min滅活SAP及Exo I,用作SBE反應(yīng)模板。
1.4)LM-SBE反應(yīng)由于體系中只有熒光標(biāo)記的ddNTP(本實(shí)驗(yàn)中分別為JOE-ddATP,F(xiàn)AM-ddGTP,TAMRA-ddCTP ROX-ddUTP),使用對熒光標(biāo)記ddNTP摻入率比較高的熱測序酶(ThermoSequenase)來進(jìn)行反應(yīng),可使每個(gè)SBE引物在反應(yīng)中僅延伸一個(gè)堿基即告終止。盡管擴(kuò)增只是線性增長的,但40個(gè)循環(huán)后,在ddNTP足量的情況下,其總量也達(dá)到了模板的40倍,足以進(jìn)行檢測。
反應(yīng)體系為5μl,各組分如下
名稱 原液濃度加樣量(μl)體系終濃度Mg2+25mM0.52.5mM緩沖液 10× 0.51×JOE-ddATP0.12μM 0.12.4nMFAM-ddGTP0.12μM 0.12.4nMTAMRA-ddCTP 0.12μM 0.12.4nMROX-ddUTP0.60μM 0.112nMSBE引物 2μM0.05×n40nMTheromo Sequenase10U/μl 0.025 0.05U/μl模板 1ddH2O 補(bǔ)齊至5μl反應(yīng)程序?yàn)?5℃、3分鐘后,進(jìn)行40個(gè)循環(huán)的95℃ 30秒、50℃30秒、60℃40秒,最后60℃ 2分鐘。
1.5)電泳SBE產(chǎn)物1μl與上樣緩沖液等比例混合,在377測序儀上進(jìn)行電泳。加樣時(shí)可分別于電泳時(shí)及加樣后30分鐘2次加樣,在加樣孔的兩端分別各加一個(gè)孔的大小標(biāo)準(zhǔn)。電泳結(jié)束后通過觀察SBE產(chǎn)物電泳位置并與大小標(biāo)準(zhǔn)比較,即可判斷是哪一個(gè)位點(diǎn)。
1.6)基因型判定及數(shù)據(jù)整理根據(jù)條帶顏色判定SNP基因型,藍(lán)色為G/G,綠色為A/A,黃色為C/C,紅色T/T,藍(lán)/綠色為A/G,黃/紅色為C/T。將各位點(diǎn)分型結(jié)果整理為Excel格式以進(jìn)行統(tǒng)計(jì)處理。
2)SnaPshotTM進(jìn)行基因分型SnaPshotTM是PE公司基于單堿基延伸(SBE)的原理開發(fā)的基因分型的試劑盒,多重引物特異性延伸用于多個(gè)SNP位點(diǎn)同時(shí)做基因分型,必須在ABI3700測序儀上運(yùn)行。
2.1)需要分型的SNP位點(diǎn),一般把7~8個(gè)位點(diǎn)放入同一個(gè)體系中,分型,必須在ABI3700測序儀上運(yùn)行。
2.1)需要分型的SNP位點(diǎn),一般把7~8個(gè)位點(diǎn)放入同一個(gè)體系中,引物的3’末端必須設(shè)計(jì)在SNP位點(diǎn)的上游或下游的鄰近位點(diǎn),規(guī)則同普通的PCR反應(yīng)。各引物的Tm值最好接近,不能低于50℃;2.2)在引物前加上適當(dāng)長度的polyT,使各個(gè)位點(diǎn)之間至少相差4bp,并盡可能使鄰近的兩個(gè)位點(diǎn)沒有重合的堿基,(例如3個(gè)位點(diǎn)依次是C/T,A/G,C/T);2.3)分別用常規(guī)方法PCR含有各SNP位點(diǎn)的DNA片段,標(biāo)定濃度后等量混合、純化;2.4)將各個(gè)SNP位點(diǎn)的延伸引物等量混合并稀釋到分別為0.5μM。將SNaPshot反應(yīng)混合物2μl、引物混合物2μl和純化后的PCR產(chǎn)物混合物1μl混勻,96℃10s,50℃5s,60℃30s,30個(gè)循環(huán)進(jìn)行引物特異性延伸。反應(yīng)產(chǎn)物中加入9倍體積的70%乙醇,常溫下靜置20分鐘,4℃4000轉(zhuǎn)離心45分鐘,棄上清,再加入9倍體積的70%乙醇,靜置20分鐘,同樣條件離心,棄上清,1300轉(zhuǎn)倒置離心。空氣中晾干30分鐘,加入6μl雙蒸水。
2.5)SNaPshot上樣和判讀每孔加甲酰胺(Hi-Di Formamide)9μl,長度標(biāo)記0.2μl,SNaPshot反應(yīng)產(chǎn)物3μl,95℃變性5分鐘,冷卻后在在ABI PRISM 3700 DNA測序儀上進(jìn)行毛細(xì)管電泳,運(yùn)行Genescan 3.7進(jìn)行數(shù)據(jù)分析,Genotyper3.7輸出各樣本各位點(diǎn)的基因型。
3)RFLP-PCR進(jìn)行SNP分型對于改變酶切位點(diǎn)的SNP,可先進(jìn)行PCR擴(kuò)增,擴(kuò)增產(chǎn)物用相應(yīng)的內(nèi)切酶消化,電泳后根據(jù)條帶位置判定基因型。完全酶切或不能被酶切的為兩種不同的純合型,不完全酶切的為雜合型。
4)測序分型對于不適合用以上兩種方法分型或分型結(jié)果不理想的位點(diǎn)進(jìn)行測序分型。
以上各SNP位點(diǎn)的分型均先在96個(gè)隨機(jī)選取的正常對照個(gè)體中進(jìn)行。
在病例組和對照組中,上述80個(gè)位點(diǎn)均符合Hardy-Weinberg平衡。經(jīng)SPSS統(tǒng)計(jì)軟件10.0版(免費(fèi)下載于http//linkage.rockefeller.edu/soft/)分析,有1個(gè)SNP位點(diǎn)位于Casp9的第8號內(nèi)含子的第-237位,在NCBI的SNP數(shù)據(jù)庫中的編號是(rs884363),等位基因頻率分布在兩組中差異有統(tǒng)計(jì)學(xué)意義(P<0.05),如表7所示。
表7病例組與對照組SNP分型SPSS統(tǒng)計(jì)分析結(jié)果等位基因SNP C T A G 總計(jì) P值病例組194 256 450 0.043rs884363對照組108 194 302總計(jì)位于CASP9基因的L2N4片斷中的1個(gè)SNP位點(diǎn)rs884363的等位基因頻率在病例組和對照組存在顯著差異,因此提示這一位點(diǎn)與2型糖尿病相關(guān)。進(jìn)而提示CASP9基因?yàn)橐环N新的糖尿病易感基因。
CASP9的基因組序列如SEQ ID NO33所示,全長為31,971bp,所揭示的SNP位點(diǎn)(K)位于該基因的30,250-31,700位之間,這一區(qū)域的核苷酸序列如圖1A所示,圖中K為SNP位點(diǎn),其代表堿基G/T多態(tài)性,即該位點(diǎn)可以為G,也可以為T。這一區(qū)域的互補(bǔ)序列如圖1B所示,圖中M代表所述SNP位點(diǎn)的互補(bǔ)堿基,其代表堿基C/A。
基于這一SNP位點(diǎn),可以設(shè)計(jì)適當(dāng)長度的引物,用于經(jīng)PCR擴(kuò)增而預(yù)測2型糖尿病易感性。
實(shí)施例3 預(yù)測2型糖尿病易感性引物的設(shè)計(jì)及2型糖尿病易感性的預(yù)測1.SBE引物引物要位于SNP位點(diǎn)的5’端,其3’端的最后一個(gè)堿基恰好是與SNP緊鄰的前一個(gè)堿基。該引物有一條。長度為18-46個(gè)堿基之間。要避免含有過多的G+C,Tm值在50~65℃之間。由于SNP位點(diǎn)中轉(zhuǎn)換型較多,因此應(yīng)避免連續(xù)幾個(gè)出現(xiàn)相同的序列類型(如連續(xù)幾個(gè)C/T型),如遇到準(zhǔn)備放入同一個(gè)組的幾個(gè)位點(diǎn)都是C/T型時(shí),可以將其中的數(shù)個(gè)從反鏈設(shè)計(jì),即變?yōu)锳/G型,最好是C/T與A/G間隔出現(xiàn)。另外預(yù)備同組的幾個(gè)位點(diǎn)之間不能有發(fā)卡等形成,較長的SBE引物不能形成回折等二級結(jié)構(gòu)。根據(jù)以上原則設(shè)計(jì)的一個(gè)引物為5′CAG ACT GAA ATA TTT GCA AGG AGC 3′(SEQ ID NO31),或者5′AGGCTG GGG CCACTC CT 3′(SEQ ID NO32)其為該鏈的同序引物,即與其互補(bǔ)鏈結(jié)合。以此SBE引物對待測個(gè)體基因組DNA進(jìn)行SBE反應(yīng)檢測SNP位點(diǎn)的序列。
2、普通PCR擴(kuò)增引物根據(jù)SNP位點(diǎn)所在的序列(圖1A和1B),設(shè)計(jì)如SEQ ID NO1-30所示的引物。如表1所示進(jìn)行各種組合。以所述組合為引物,以得自待測個(gè)體血樣的基因組DNA為模板進(jìn)行PCR擴(kuò)增,對擴(kuò)增產(chǎn)物進(jìn)行測序檢測所述SNP位點(diǎn)的單核苷酸多態(tài)性。
SEQUENCE LISTING<110>中國醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所北京諾賽基因組研究中心有限公司國家人類基因組南方研究中心中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院<120>用于預(yù)測2型糖尿病易感性的試劑盒及引物<130>I20030512CB<160>33<170>PatentIn version 3.1<210>1<211>21<212>DNA<213>人工序列<400>1ctcagagcag ttgcttcctc t 21<210>2<211>21<212>DNA<213>人工序列<400>2gaaggaagaa ttcaagaggg g 21<210>3<211>21<212>DNA<213>人工序列<400>3atagaaaccc gactcagagc a 21<210>4<211>21<212>DNA<213>人工序列<400>4catagaaacc cgactcagag c 21<210>5<211>21<212>DNA<213>人工序列
<400>5aggcccagtc ctactccata g 21<210>6<211>21<212>DNA<213>人工序列<400>6actcagagca gttgcttcct c 21<210>7<211>21<212>DNA<213>人工序列<400>7gaggaaacag atagggaagg g 21<210>8<211>21<212>DNA<213>人工序列<400>8ataggcccag tcctactcca t 21<210>9<211>21<212>DNA<213>人工序列<400>9ggaaacagat agggaagggt g 21<210>10<211>21<212>DNA<213>人工序列<400>10ccagtgagga aacagatagg g 21<210>11<211>21<212>DNA<213>人工序列<400>11atcctgtggg catcatgtag t 21
<210>12<211>21<212>DNA<213>人工序列<400>12agcgacctgt aagacatgac c 21<210>13<211>21<212>DNA<213>人工序列<400>13gtcggcactt ttgtgtctct t 21<210>14<211>21<212>DNA<213>人工序列<400>14cttctcgtgg catgaatacc t 21<210>15<211>21<212>DNA<213>人工序列<400>15aggtattcat gccacgagaa g 21<210>16<211>21<212>DNA<213>人工序列<400>16gctgctaaga gcctgtctgt c 21<210>17<211>18<212>DNA<213>人工序列<400>17ctcgtgatct gcccacct 18
<210>18<211>21<212>DNA<213>人工序列<400>18agtcggcact tttgtgtctc t 21<210>19<211>21<212>DNA<213>人工序列<400>19gcccagtcct actccataga a 21<210>20<211>21<212>DNA<213>人工序列<400>20taagagcctg tctgtcactg g 21<210>21<211>21<212>DNA<213>人工序列<400>21tattcaaaga gttgccttcc c 21<210>22<211>21<212>DNA<213>人工序列<400>22tgaaggaaga attcaagagg g 21<210>23<211>21<212>DNA<213>人工序列<400>23tgctaagagc ctgtctgtca c 21<210>24<211>21
<212>DNA<213>人工序列<400>24gaagctgcta agagcctgtc t 21<210>25<211>21<212>DNA<213>人工序列<400>25tgaggaaaca gatagggaag g 21<210>26<211>21<212>DNA<213>人工序列<400>26gtccttgagt tgcaggaaag t 21<210>27<211>21<212>DNA<213>人工序列<400>27cattcatctg tccctcttcc t 21<210>28<211>21<212>DNA<213>人工序列<400>28ttgaccctca agaattgtga a 21<210>29<211>21<212>DNA<213>人工序列<400>29cagcattagc gacctgtaag a 21<210>30<211>21<212>DNA<213>人工序列
<400>30aaattaaagc aaccaggcat c 21<210>31<211>24<212>DNA<213>人工序列<400>31cagactgaaa tatttgcaag gagc24<210>32<211>17<212>DNA<213>人工序列<400>32aggctggggc cactcct17<210>33<211>31970<212>DNA<213>Homo sapiens<400>33cggaagcgga ctgaggcggc ctggagtctt agttggctac tcgccatgga cgaagcggat 60cggcggctcc tgcggcggtg ccggctgcgg ctggtggaag agctgcaggt ggaccagctc120tgggacgccc tgctgagccg cgagctgttc aggccccata tgatcgagga catccaggtg180cgcccccggc cccctgtccc cgcgctgcac ggccgggtcc ccacgcccct cgaggaggcg240ttgtgcggga gcctagcctt ccctgtggct tcaaacccct cagcggagcc aaagaatccc300aaacacctct tagtcgggtg ttcgctaaag cgattccatg ccatactcag tcagcgtaca360ctgttagtgc ttgtgtttct tgtgtaaagg aaaaatgtga gacacatctt gagaactttg420aataagaaac aattcatgaa ttggagaaca tcagactgaa agagctttag tgttgcaatg480acaaaacgtc agaggcaagt atttattggg aaaatgtgga agcaaaataa agaaattatt540tgattggttt gcagttacaa aattgccttt tttttttaag gtctgttaat tgactgcttt600tggctggtct taagttttat ttctctctaa cataagcatt tatcagatat gacccaagtt660aaattttgct tatgtttgca gtttaagcaa gatttaggtc acttaggata cctgattggt720tttgtctgct caggaattct tcatggttgg tctccatttt aatttacgtt aatacttgcg780aggaaggagg cgtgtgcgtt tttacttttc tagcatagag gtttcgggaa cccactttgg840
catcaggctg cctggcagcg tgttcttggg ccagtcactt accctctttg agccacagtt900tctgggctgt gaaatgggaa taagaataat actgtcataa ggactaaatg aaataacgga960tgtgaaactg tagtgctagg cacagagcgg gggatcagcg taccctgccc tctttggcca 1020gccccttctg tgttcagttt atgttttgtt aagaggtttt ggaaatgagg ggacctgatg 1080cagaatggag aataatgaag tcaaacattt gaggttttgt ttaaaagcac tttcccatct 1140ttgtctcatt tgaccctcat cacaggcctg tgaggatgca ggagatattt cctaccatga 1200ggtgcagtag gtgtgagtgg ctggctggat atccctggcc agtgccctgg cccagggaaa 1260gagtctttaa ataattgagt atcatatgag taattattca ttaataataa aataagtttt 1320gtgccttctg tgtggcccct actggggaac agtaatggtt tgaggccaca gtccttgcct 1380tcaggaatgt tcacggggat cacaaactca aatgcccatg gaggaccaat ggatgggcgt 1440catagtggat agcctttgca ctgccctccg tctccagctg agtatggcca tatcaacaaa 1500tggcccagta ttgccacatc ttacacttat tttgaggcag ggtctcactc ttgcccagcc 1560tggagtgcag ggatgagatc atggctcact gcgaccttga cctcctgggc ttaagtggtc 1620ttcctgcctc agcctttaga gcagctggga ctttaggcac atgccaccat gcctggctaa 1680ttaaaaaaaa tttttttttt gtacagatag gagtcttgct atgttgccta gatgagtctc 1740aaactcttgg cctcaagtga ttctcctgcc tcagtgttgg gattacaggt gtgagccact 1800gtacccggcc cagctttcac atcttaaaaa agaagctgaa aatcttgatt cctctgtcaa 1860attccctggc ttaaaatgtt agcaacaaat tcagaaattt tttaagaacc ttgtgggaac 1920cacaggttgc cattttgcca ttcagtatgg ctgaaaaaca ggcaggtttt ggaaccagtt 1980ggatctgggc tctcatcctg gccttgttac atattagcaa gttgtaaaaa accacaacca 2040atgagccaaa caaacagaaa aaccctatga ctcagtttcc ctgaaatttt ttaccctaaa 2100aagttgggaa gttctaattt aactctataa agttattgag ggagaaaaag atgaaacaat 2160gcatttaaca cagtgttgac ctcctggagt gttcagcaaa tgtggagaga aacctaaaca 2220ccaccatcta tttgcatgta gccaactgtt ctgctagtga gacttacctt ctcagtggca 2280ctgtaggtct gtgctgttcc caacagtagc cattagccac atgtcgttaa aggtaaattt 2340gaagtaatta aaattaaata aaactaaaaa ttggtagggt caagccttac agggcctgtg 2400ggtttttctc ctcgtgtgcg gagatgagag atcgtagaaa taaagacaca ggagaaagag 2460atagaaaaaa agacagctgg gcccggggga ccactaccac ctagacgtgg agacagggta 2520
gtggccccga atgcctggct gcgctgttat tggatataag gcaaggggac agggtaagga 2580gggtgaatct tctaagtgat tgataaggtg aagcaagtca cgtgatcata ggacaggggg 2640cccttccctt ttaggtagct gaagcagaga gagaaggcag catatgtcag cgttttcttc 2700tatgcactta taagaaagat caaagacttt aagactttca ctatttcttc taccgctatc 2760tatgaacttc aaacaggaac caggagtacg ggaggaacat gaaagtgggc aaggagcgtg 2820accatggaag cacagcacca cagggagggg tttaggtctc cggatgactg cgggcaggca 2880tggataatat ccagcctccc acaagaagct ggtggagcag agtgctccct gacgcctcca 2940aggaaaggag actccctttc tttttttttt ttttttgagg tggtgtccca ctttttcgcc 3000caggctggag tgcaatggta cgatctcagc tcactgcaac ctccaccttc cgggttcaag 3060ctattttcct tttttttttt tttttttttg agacggagtc tcgctctgtc gcccaggctg 3120gagtgcagtg ccgcaatctc ggctcactgc aagctccgcc tcccgggttc atgccattct 3180cctccctcag cctcccgagt agctgggtct acaggcaccc gccaccacgc ccggctaatt 3240ttttgtattt ttagtagaga tggggtttca ccgtgttagc caggatggtc tcgatctcct 3300gacctcgtga tctgcccacc ttggcctccc aaagtgctgg gattacaggc ttgagccacc 3360gcgcccagcc agggttcaag ctgttctgcc tcagcctcct gagtagctgg aattacaggt 3420gcgcactacc acgcccagct aatttttttg tatttttagt agagacgggt ttcaccgtgt 3480tggtcaggct ggtcttgaac tcctaacctt gtgatctgcc tgccttggcc tcccaaagtg 3540ctgggattac aggcgtgagc caccgcgcct ggcaggagac tccccttcgc ggtctgctaa 3600gtaatgggtg tctccccaga cactggcatt accgcttgac caaggagccc tcaagcggcc 3660cttatgcggg cctgacagag ggctcacctc ttgccttcta ggtcacttct cacaatgtcc 3720cttcagcacc tgaccctata cccgccggtt attcctaagt tatattagca atgcaacaaa 3780gagtaatatt aaaagctaat gattaataat gtttataata atgattgata attgtccatg 3840atcatctcta tacctaattt gtattatgac tattcttatt ctaactattt tctttattat 3900actgaaacag tttgtggctt cagtctcttg cctcggcacc tgggtaatct ttcgcccaca 3960aaaattcagt tcctcagttg tactacccaa gtgcttaatg gtcatgtgat atatggttac 4020taaataggac aatacagacc aagaatattt ccatcatcac ggaaggttct catagacagt 4080gctgctgtag gatagttgag gacacggtgc catcttatcc ctgtggatcc tgagaacctg 4140tccagtgctg ggtatctgag gacaggtggc agataaccag actcttcctt cttagtgact 4200
gaccccacca tcctgacacc tctcaatttt tttttttgag acagggtctt gctctgtcac 4260ccaggctgaa gtgcagtggt gctatcacag ctcactgcag ccttatctcc tgggctcgag 4320ccatcctctt gggagcctca gcctcctgag tagctgggac tacaggtgcg tgacaccata 4380cctggctttt tttttgttat tttttgtaga gacagggtct cactgtgttg tccaggctgg 4440tctcgaactg ggctcaagct atcctcccac ttcagcctcc caaagtgctg gaattgcaag 4500catgagccac tgtgcctggc ctgcctgtca accttgaccc ttgctctgtc ttcacagtcc 4560ccccagtcag tgcccatgtc ctatggaccc tctctctttg tatctctgct ttgtcctttc 4620acttctctct attctagctg caccatcttt gctgcctcct gatctggcta tggctcactc 4680ctttccattt ttcaccctga cccctggatg actttttgaa aggccatatc tgtctctgtc 4740actccattct taaaactctt tggtggccgg gcatggtagc tcacgcctgt aatcctagca 4800ctttgagagg ctgaggttgg tggatcgctt gaggtcagga gttttgagac cagcctggcc 4860aacatggtga aaccctgtct taaccaaaaa atacaaacat tagccaggca tggtggtggg 4920tgcctgtagt cccagctacc tgggaggctg atgtgggaga atcatttgta cccaaaaggt 4980ggaggttgca gtgagctgag atggtgccac tgcattccag cctgggtga cagagcaagac 5040tcctcaaaaa acaaacaaaa aaacaaccga tggctggcca cggtggctca tgcctataat 5100cccagcactt tgggaggcca aggctggagg atcacttgag gtcagttcaa gaccagcctg 5160ggcaacatgg tgaaaccctg tttctactaa aaataaaaaa aaaattagtc aggtatggtg 5220gtgtgtgcct gtaaccccaa ctactccgga ggctgaggca ggataatcgc ttgaaccttg 5280gagttggagg ttgcagtgag ctgagattgc accagtacac tctagcctgg gtgacagagt 5340gagactccgt ctcaagaaaa aaaaaaaaaa acaaaaacaa aaccaaaaaa ctctttggtg 5400gcacctgaca ggtctcagga tgaatttctt ggcctggcca cacaaaggcc ttgtcccttg 5460ccactatcta cctcccacct cataagactc tgaattcgct attcacttca tgatatcctc 5520agccccatgt gcttccctct gggcacttgt ctcttgttgt gtcattgctg atttgtctga 5580ttgcattccc cattagaaat ttgctcctta aggactgaga ctgtccatgg cagcattttc 5640agcacttagc atagtgctgg gcatcttttg ccctgcaaaa taatgaacag atcagcaaag 5700gctggtaaat ggcacacagt gcacctgcag ctccattgct gcccacgtgc ctgattgttt 5760agacttacag tagctgggaa atggggagac aaggtgagag ccatataaaa gtacgtggat 5820aattagtatc ctgcctttct ttccaaacag cgggcaggct ctggatctcg gcgggatcag 5880
gccaggcagc tgatcataga tctggagact cgagggagtc aggctcttcc tttgttcatc 5940tcctgcttag aggacacagg ccaggacatg ctggcttcgt ttctgcgaac taacaggcaa 6000gcagcaaagt tgtcgaagcc aaccctagaa aaccttaccc cagtggtgct cagaccagag 6060attcgcaaac cagaggttct cagaccggaa acacccagac cagtggacat tggttctgga 6120ggatttggtg atgtcggtaa gtagcaagag agtgattggt gggtgggcat gacacgtagt 6180catttgggac tcactatgag tacagctggg tgggctgaga ttcagaattt aattttagca 6240ttgtctttct gaatgttcat agggatggca aaattctggg aggttttcag gaggttgaat 6300cttggcagcc cctcctctga aaagcatgtg ttgaggtctg ttttggatgt cccaggtttt 6360ttgtttttgt ttttgttttt tttcctgcct ttgagatagc aggccccagg ttttgatcaa 6420tgtttccaga gccatctatt gttttggatt tgcctttcag tctgggtggg tagcctggac 6480tacctcatgt ctgggggcag gagacaggcc tcagttgtat ctgccccata caaacagaca 6540tctgcaaagt atttaccctt accttcttcg tttatagcaa ccttgcaagg caggtatcat 6600tagacccatc cttgttgatg gagaaactga ctgaagctca cggaaattaa acactttgcc 6660aaaggtcaca cggctacatc caacaaaatg cataaatccc aagagtaagc tgggtgattt 6720ttacctatgc atacccacag gtaactaaca cccatatcat caagatgaaa acattccggg 6780gtcctgtaag accgttgact ctctttccat ttcttcccac tttccctttc ccaaggtaat 6840caccgttctc atctctatcg ccagagatcc cttttgcttg tccttaaact tcaatataaa 6900tcctatatag tcttatatgc tcttgagcct ggcttctttc attcatcatt gtatctttga 6960aattcattca tattgttgta catatcggta gttcattctt tttaatttct acatggcatt 7020ctgaataatc cacagtttat ttaaccattt tcctactgat ggacatgtgg gttgttttca 7080gttggggctt tgttcccatg gcagcgtgtg gagctctagc acttcctgtt tcatgggtgt 7140ctggtggacc attgcatggt atcaaagtta ataatcataa tagtaatggt gaacattatt 7200gagtaattgc tatttgccag gcaccgttcg gagtgcttac ataaatgatc taatttaatc 7260tctccatctc tcttgtaagg caggtgcttt gctgttagaa aaagtgagcc acagattggg 7320agatgacttg tgccaaatca cacagctagt gaggagtgga gacagggctg cagcccgggc 7380ttacctgttc tgtctgctct gcagggtagc cccatgtgtg ctttgtggga cacacctcat 7440tgatccgact catgctggtg gacattgtgt tgtttctgca gttagccttg catgtgcgtc 7500tagttctgac tgcaggatat ttctagaaat ggaattgtgt gttaaagggt acttgttcct 7560
gtccgataga tgctaccaac ttatacttca aaaatatgtc attttagcca ggtgtggtgg 7620tgtgagcctg taggacaagc tacttgagag gctgaggcag gaggactaca tgagcctagg 7680aattcacagc cagcctgggt aacttagtga gatcctatct ctaagaaaaa agaaattgaa 7740aaattgtgtc tttttttttt ttttaattga ggcaaggtct tctgtggccc aggctggagt 7800gcagtggcat gatcacggct cactgcatcc ttgaactccc aggctcaagc gatcctccca 7860ctcagcctcc caggtagctg tgtgcgccac caggcctggc taattttttt gtattttttg 7920tagagacagg gtctcaccat gtggcccagg ctggtcttga tctcctgggc tcaagcaatc 7980ctcccatctc ggcctcctgg atagctgtgc atgttatccc tggccatttt tttttttttt 8040ttttaagagg gagtctcgct ctgtcaccca ggctggagtg cagtggcgca atctcagctc 8100actgcaacct ccacctcctg ggttcaagca attatcctgc ctcagcctcc tgagtagctg 8160ggactacagg cagccgccac catgcctggc taatttttgt atttttagta gagatggggt 8220ttcaccatgt tgcctaggct gatcttgaac tcctggcctc aagtgatcca cctgcctcag 8280cctcccaaag tgctgggatt aaaggtgtga gccaccactc ccagcccatg cctggccaat 8340tttaaaattt tttgtagaga tagggtctta ccgtgttgcc caggctgccc tcaaactcct 8400gtgctccagt agtctgccca cctcggcctc ccaaagtgct ggaattacag gtgtgagcca 8460ctgcactcgg cccaaattgt gtcattttat aatctcacca actgcgagtg aaggtgacca 8520ctttcccaca ttcttgccaa cagtgaatat tgacattttt tcctgtgtga tgggtaaaaa 8580gtgctgtttt ctttcaacaa aaattcacca aaactcattc atattgttgt gcatatcagt 8640agttcattct ttttaatttc tagatggcag cagttcctgt tctgaataat ccacaattta 8700tttaaccatt ttcctattga tggacatgtg ggttgttttc agttggggct ttgttcccat 8760ggcagcgtgt ggagctctag cacttcctgt ttcatgggtg cctggtggac cattgcatgg 8820tatcagagtt aatattcata atagtaatgg tgaacattat tgagtacttg ctgcataatg 8880gtgatttttg ggcaatccac taaagcagag aaacagacaa acatgataag ggtaggaagc 8940tgcatttgct tgaagtgtaa ggaagaagac tggttctgga attggccatg tgcattacca 9000tcctgtaaag gaggcaggca gaatacaaag ctcatctgtt gttatttggt tctgggaaat 9060gtcaacgtga gtcatttagg accaacagtc agaatttgaa acttcctgtt tttttggaag 9120gtgttttatt tcctgtttct tgtgaatatt tattcctagt aggagcttaa ttctgaaggg 9180taaataacaa cagcaatagt aagatcactt aatttttttt actttattat tattattttt 9240
tgagataggg tcttactctg tcacccaggg tggagtgcgg tggtgtgttt tcggctcact 9300gcaacctctg cctcccaggt tcaaacaatt ctctcacctc agcctcccaa gtagctggga 9360ctacaggtgc accaccatgc ctggctagtt tttgtatttt ttgatagaga caaggtttcc 9420ccatgttggc caggctggtc ttgaactcct gacctcaagt gataaacccg cctcagcctc 9480ccaaagtgct gggattatag gtatgagcca gcacggctgg cccaagatca ctttaaataa 9540tgtgaatatc actttgtagt atacacagtg ttttttcagg tcatcaaaac caccctgtgc 9600cgtggtagac atggcaagcc cgtctgtcat tatatgctac ttacagggga ggaaactggg 9660ttctgagagc aacagtcaca aagtgagttc cagtacagag ctaggacttg ggcctaggtc 9720ttctggctta atagagcgac tgtcccattt tccatgagct gctgagagat gtccttttta 9780gatgctgggc cttagactcc agagtactgc atgggaatgt ttcccaaggt aggtttcatg 9840gtgacccaca aaggaagagc tgtgtattca tatgtatggg aaggtctggc tgagcaagaa 9900tagggccagc agcagagcct ttaataagtg aatacaggaa aggatgctgt aggtcagtgt 9960ttcacactgg ggacgatttt tccccgacct ccaagggaca tttgacaatg tctagagaca 10020aatctggttg ttatagctga gggtgggtgg gtgctactgg catctagtgg gtagacagag 10080atgctgccaa aacccaacag tgtacagagt agctctgcac aataaagaag aatctggccc 10140aaagggttag tgtggtgggg ctgagtacac acactgcact catacatatt cattgagcat 10200gagtgtcaat gaataataat gtggacacat cagttttatt gagttgtcaa gtgtgtcggg 10260tattgttcta tgtgcctcac atgtattaat tgtttgaggt gtcatcacaa tcctatgagg 10320ttggtagttg ctcctattat cctgtaatac agatggggaa atcagaagcc cagagactct 10380gagctccttg cccattgtga cacaggtgct aagtgttgga gttgggattt gaacccaagt 10440acctcagact cactccatca ctgtctcatg aagaacaaat ggctcattct ctttcttgtc 10500cctatatttg tgccattact cattagctca cacaaatgtt tactaagtac ctgttgggtt 10560ctaggtgttg gggatgcagc ttcgaacaag gatgcccagt ccttgccttc aggtggagag 10620gggcaggtac tcagttcatg cttgcctaat ttggtcttta ttcacggctg tgggtagtgc 10680tatgaagctg aacacggtgc tttagaggtg catcattagg ggacccacca gagagagtgg 10740ctttgtcttt gtatattcaa aggaaaatgc cttttccttc agaatggaag gaactttctt 10800agtttcagac gtgatgcctt gtgtgtaact gcttgttcca gccagggcct cttgcccggg 10860aggactggga gaactgttgg tggctgtgtt ctcatgattc tccagagaaa gagaaccaat 10920
agggggtgtg tgtatgtgta taaaacagca tcttttgttc aatgctgcat ccccaacacc 10980tagaactcag caggtactta gtaaacattt gcatgagcta atgattaatg gcacatatac 11040acagacaaga aagagaatga gccgttcgtt tttttttttt tttttgagac ggagtcttgt 11100tctgttgccc aggctggagt gcagtggcgc gatctccgca cactgcaagc tctgcctcct 11160gggttcacgc cattctctcg cctcagcctc ccgagtatct gggactacag gcacctgcca 11220ccatgcccag ctaatttttt tgtatttttt ttagtagaga cagggtttca ccatgttaac 11280cagtatggtc ttgatctcct gacctcgtga tctgtccgcc tcagcctccc aaagtggtgg 11340gattacaggc gtgagccact gcacctggcc aagccatttg tcctttatga ggcagtgatg 11400gagtgagtcc gaggtacttg gttcaaagcc caactccaac acttagcagc tgtgtcacag 11460tggacaagta gttgagtctc tgggcctctg ttttatatat atacatatac acacatacac 11520acacggatat atatagaaag atatatgcat tttttttgtg tgtgtatata tatatatctt 11580tatctaaaaa catatttatt acaaggaaca ggctcatgca attatggacg ctgagaagtt 11640ccaagatctg ccatctgcaa gttggagacc aggaaagctg gtggtgtagt tccagtctga 11700gtctgaaggc ctgagatcca ggagcaccaa tggtagaagt cccattccaa aggcaggaga 11760agactgatgt cccagctcaa gtagtgagac agagagagat caaattctcc cattctccac 11820tgtttcgttc tattcaggcc cttgacggat tggacgcggc ccaccatcct ggggagggcc 11880atctgcttta ctctgtctac ctattcaaat cccattctca tccccaaaac actctcacag 11940gcaccctgag aaatactgtt atatttaacc aaatatttgg gtaccctgtg atctagtcaa 12000gttgacctgt gaactcaacc atcagtggct ttctctgctc atgccttgcc tgggttggaa 12060cttccttgaa agtagaagtt ggcttttcag ccctacctgg cttcttggtc tctttgctct 12120ggggctggtg gctgtgctca cctcccatta caactcaggg tctctgagcc cccaattccc 12180ctctggcaaa tggggatgtg tgccagtact tctgtgctga agggcctgct ctgaggagta 12240aatgaggcag tgtgtggagg gacttcacat ggggcctcct attgagtgag ccttgggtct 12300tgttggtcag ctctgcttcc ttctgtgatt tctaaattgc caagggctgg ggagggccag 12360tcctagggca tcttcccttc tgtagggtcc cccagttccc ctgtttcttt ctgtgtcctg 12420attgaaaatc acagagtgct ttgaccaccc tgtgacccag ccagctacag gtttttccca 12480gcagacctga gcccaaacct gggccttaaa cattctcagg cattgataaa ggtatctagg 12540taggctgggc atggtggctc acgcctgtga tcccagcact tggggaggcc aagacggatg 12600
gatcacttga ggccagtagt ttgagaccag cctggccaac atgatgaaac cctgtctcta 12660ctaaaaatgc aaaaattagc tgggcgtggt ggtgtgtgct tgtaatccca gctacttggg 12720aggctgaggc aggagaattg tttgaacctg ggagacagag gttgcagtga gccaagattg 12780tgccattgta ctccagcctg ggcgacagag cgggactctg tctgaaaaaa aaaaaaaaat 12840taggtgtggt ggtgtagtcc tagctacttg gatggcttag gagggagggt cacttgagcc 12900cagcaggcaa agtttgcaat gagttgagat tgtaccactg cactccagcc tggacaagag 12960agtgagactc cgtctccaaa aacaaaacaa aacaaaaagg tatctaggtt atcacccaaa 13020acaactgaaa gaaaccagcc ttggccctga gccaaattcc ttaaaccctc atataaactc 13080cttaccctga cctcttcact ttggaccaaa cctaggtaga cacctgtttt tttttctcgc 13140ctccgcacct cgaggattgc tttggccaga tcgccctggc atttattgct tctttctttg 13200gaatcccaac tggccccatc ttaggacagt ttggggcact cccttgtggg aactcttctg 13260ctgccacttc tggggtgatt ccagcatagg ttcggaggga cgaaacccct tctttccctt 13320gggtggcaga gaggatgtgc ttgccctctt ctgtttgtgt tggagacctg ggcacatgcc 13380cagtgactca ggctggaaga ctgattcttt tgcacacact tagccatgtg tgtttattgt 13440ccccatggga gtggccattt caggagaaac tggtctcatg caccttgtat ctgaccatgt 13500cacccaactt gaggggccct gaacatgcca tgctcctgca tcctccctgc ctttgctcat 13560gccggggcct ctgcctggag tgtctcctct ccctctttct ttgggcaccc cttggttgat 13620ttgctccctc catgggcacc tgtagccctt ggcctcttga gagcagtcat tttgctttat 13680caatagatat ttctaatttg gggaatgagt gaattcctca gtagtggata gtagttatat 13740ttttggggta cagcggaatt ttggaaatga gcaaatgttc tcagaatgaa gtctgtggat 13800gaataggaat tttcagggta ggtaaaacca tttctaactt taaaaatggg atgtgaatgg 13860gatgtgagtg cttttctgct gtggccttta agctggcaga atagttcaga cctgttctaa 13920gcaaggaatg gcactgttat tggaacagga gtatgggctc cactgcaact tggaggtggc 13980cactgtattc tccttgttta aaaaagaaaa aatgtaggcc gggcgtggtg gctcatgcct 14040gtaatcccag cactttggga gggtgaggca ggtggatcac ctgaggtcag gagttcgaga 14100ccagcctggc taacatggtg aaaccccatc tctactaaaa atacaaaaat tagccaagcg 14160tgatgcaggt gcctgtactc ccagctactt gggaggctga ggcaggagaa tcgcttgaac 14220ccaggaggca gaagttgcag cgaggcaaga tcgcgccact gcactccagc ctgggtgaca 14280
gagcgagact ctgtctcaaa aaaaaagaaa aaacatctca taacctttta ggctggtggc 14340cagtcaactt cttgctaacg gaaatgaaaa ctcttttgat gttgatggaa aataatcatc 14400tttattcatt tattcattct gcaagtattt cctgaggacc tgctgtgtgc tgggcccctg 14460tggactcgca gacagtgagc atccgctctc ctgagcttct ctcacctctt tctgctctgg 14520aatttcttct caatgagacc acactatttc tatactctct ggtgtctggc ttttttcacg 14580cagcacgttt tctttctttt tttttttttt gagatggagt tttgctcttg ttgcccaggc 14640tggagtgcaa tgacgtgatc tcgactcact gcaacctctg cctcccaggt tcaagcgatt 14700ctcctgcctc agcctcccga gtagctggga ttacaggcgc ctgccccctc gcctggctaa 14760tttttctttt tttttttttt tttttgtatt tttagtacag atggggtttc accacgttgg 14820ccaggctagt ctcgaactcc tgacctcagg tgatctgcct cccaaagtgc caggattata 14880ggcgtgagcc accgcacctg gccttacgca gcacattttc aaggttatcc cgcattgcgt 14940gtatcagtga agcggtgtca ctcgtctggg gtaaataccc aagattcatt gtcttcacag 15000ccacggaaga ctaggacacg gacatacagt gaggttcaga gtggaagtat aataggtgaa 15060agaaagagaa gagctctgtc tgctgcagag agaggggttc cagtgaaatg ggttgctgtt 15120tctgcaatga aatgcaaggg gttttaaaga tgagcctgag gagatggtgt ctgatttaca 15180aagggcacaa agattggtca gaccaggtgt ttcatttgca taggatgcat aaaactggtt 15240agggctaggt gtgccatttg catgtggtgc gaaaagctgg ccagccccac tccaatcttg 15300tgttatgcag atgggttctc tacctggcca gtgccatgtt gcctacttct ttactgtctt 15360gtggtaacaa aagggaagat agagcctctt tgctgagtat atctggcccc ctggtagccc 15420ttttctattg gcacagctgc tggcattcac tcctgtgagc ttccagcttg cttatctatg 15480tctgcagctt gatttttcag gctgctcttt tttagaaaag aaatgatttg aggctgggtg 15540cagtggctca cacctgtaat ctcaacactt tgggaggctg aggtgggtgg atcaactgag 15600gtcaagagtt tgagactagc ctggccaaca tggtgaaacc ccgtctctac taaaaataca 15660aaaaaattag ccgggcatgg tggtgggtgc ctgtaattcc agctacttgg gaggctgaga 15720caggagaatt gcttgaatct gggaggtaga gtttgcagtg agccaagata gtgccattgc 15780actcctgcct gggcgacaag agtgaaactc cgtctcaaaa aagaaaaaga aaaaagaaaa 15840aaaagaaaag aaacgatttg gggattttgt taaaagggaa attctgccga ggactgtttt 15900accctcacta tctgcctaaa taatttcttt ctgtctcctg tatcatcagt agctcattcc 15960
tttttaggct gtgtaatgtt ctcttgtgtg gctgtatcac aatttgtata tctaccaaac 16020tgttgttaga ttggttgttt ccatgttggg gcgtgatgaa taaggcctca gggaacattt 16080tggccaagtc ttttgtgccc gtttgcactc cttgctcttt gatatatacc taagggtgga 16140cttgctgtca gagggtaggt gtgtgtttaa ctttgttaga aacctctaaa cagatctcca 16200aggtggctct cccaccagca gagtctgagg gtctgagttc tcgctgctcc gttcttgggg 16260ggctgtcctc acagagcccc ttgcccctcc tctgctgtaa cccaacattc atgtttctct 16320ctttctctgc ctcttcaggt gctcttgaga gtttgagggg aaatgcagat ttggtgagtc 16380tccatgaaat ttgggccagt agctcgggct ctgggccctt ccctccccac ccctcaggtc 16440cttccctgca ggtgtgtcag gagcccaggg aacccaaccc taggcagtgc agtgggggtc 16500tggtctcagc ctccctgact ccggcccagc gcctgctggg gcagattgtt catctctgcg 16560cttcctcatc tgcaaagctg acagcagaag cagggcagac ctgatgaggg gcagtcatcg 16620ggatccagac caagtcgcca ctctctcatt cacaagtatt tattgtgtgg ctcccatgct 16680ctgtgctggg gccacctggg aaggagccat cagtcagtta ggcgagagag aagttagaca 16740aatgagtata taaatagaaa tagtgataag taccatcaac aaaagaacag gctgccttga 16800gagaattaca aggggactga gcctggggag agggcagcct tgggtgcctc caggtggcct 16860gggcatggtt ctgctgacag agttctcagg tacaccccgg cctaggtgac ccgtgaggtc 16920ctttgggatg aatgctcatg gctgttggat ttccaggtta ccagctccct tcccttaata 16980ccaagatggg ggggtcacct tctagtgcta gtcttccctg cagttgcttc tcttttgccc 17040tggaatgccg ggtggagacc ctgctactcc ttgtgcgaga gggcagaccc cgttttcttc 17100ccgcctctcc agactgtcct ctagggagcg tggggagagc ccgggtttac gtgggtccct 17160gtgctggcag gcttacatcc tgagcatgga gccctgtggc cactgcctca ttatcaacaa 17220tgtgaacttc tgccgtgagt ccgggctccg cacccgcact ggctccaaca tcgactgtga 17280gaagttgcgg cgtcgcttct cctcgctgca tttcatggtg gaggtgaagg gcgacctgac 17340tgccaaggta cactcactat ctgtggaggg agacagggtg gggggcagtg ggtggggaag 17400tatcttttga gggactccaa aagccagctg actccccagg cgagccctta catctggagg 17460accatgggag gtaggacggc ccagcggcta caggttcaag ttcagacgca gaagtccggg 17520tttgaggact ggctctctcg gccacctgct gtgtgacctc ctgtgcctca gtttccttgt 17580ctggaaagca ggaatagtac ctgcctcctt gggttgtttt gggggttaga tgaacagtgc 17640
ccaagcgtag caccttctcc ccaaaaatgg tggctattac gactgctggg actgtcagca 17700cttcggtact ggccctggga aaccgagaaa gtgctctgcc caggcgtttg ggttgggccc 17760tttgttgttt tattttttgg ggggggcggg ggcacagagt cccactctgt catccaggct 17820ggagtacagt ggcgcgatct cggctcactg caacctccac ctcccaggtt caagcaattc 17880tcctgcctca gcctcctgag tagctgggat tacaggtgtg tgccaccatg cctggctaaa 17940tttttttttt tgtattttta gtagagacgg ggtttcacca tgttggccag gctggtctcg 18000aactcgtgac ctcaaatgat ccacctgcct tggcctccca aagtgctggg attacaggcg 18060tgaaccacca tgcctggcca ggctgggccc ttttattgtt aggaacggtc cagtctgcat 18120ctagacctat ccgtgcttct ggctcacctg cagccctctc ttgtagaaaa tggtgctggc 18180tttgctggag ctggcgcagc aggaccacgg tgctctggac tgctgcgtgg tggtcattct 18240ctctcacggc tgtcaggtag gaagcctccc actgttccct gggcaggcat tgggtactgg 18300ccgtgccaag aggctgtgca ggggccatgt cccttcttgt gtccaaaaca cccttggctt 18360tgtggaaaag ggctgtgggg ccctgcccac ctcctgttgt tttcttggga gccatgtggt 18420cctctgagga gttggctgca ccgtcctggg caggtcggtg ttcctgggag aagccctctg 18480ggagagggag ggcagagacc aggtctgctc acgaagctcc tgcacccaga gtttgttcag 18540aggcgggtac agcacacatg ttgtctcagc tcctgtctct gtcctgtgag gcactgcccc 18600aggccccttg ctgctggtgg gactcaggac accaggccca ctgggggctt ggccccttac 18660gtatttgtca ctgtgattaa gcccttaccc cttactgggc ctcagtttcc tcatctttta 18720agttgaggag ttggacagat cacagttata agctggggcc tggagtcccc ctgtggtctg 18780cacggtgttt tgaaaactgg caaatttcac ataaaaatca ggatttctag tttctcttga 18840caaaccgcaa aggtctggcc tgacgaggcc agcatcttca gccagtaaaa ctccagcctg 18900tggctgggca gggctttccc tttggtcctt tctctcataa tatggtccct agagctcatg 18960aagaatgtgg actcccaggc cctaccctgg acctcttcat tccaagtccg cccagcaaca 19020aggtttccag gtgatttcca tgcccttgag gtctgagctg aactgattta aagcagccac 19080tctcagcgtt gagctgcctc agtcagaggg gcctggagga ccatactgct gattaggagg 19140tctgggtggg gcccaggaat cacatttctt acaagttccc aagcgatatt gatgccgctg 19200ctgcaggggc caaactttga gaaccactgg tctagaggcc gcagccagca ctctccaggc 19260acactggccc ctagaggcac atgagtttga catgcaaccc cttgctgtca aggtgtcttt 19320
ccagatgctg accagggtct ttccagaacc aacctgctct gtctcaatca gcctcgtgcc 19380cctggctttg accttccaaa tccttggctc ccacaaaacc tctgaacagg ctgttggatt 19440cctactccaa cttcttggtt ttgtaaccag ggttcttggt cttctaggcc agccacctgc 19500agttcccagg ggctgtctac ggcacagatg gatgccctgt gtcggtcgag aagattgtga 19560acatcttcaa tgggaccagc tgccccagcc tgggagggaa gcccaagctc tttttcatcc 19620aggcctgtgg tgggggtaag cagctcctca gcctccctct gggtgggtct ggtggggagg 19680gagccgccac ctgcttcttt ctccagcctg cccctcacag ggcccatgag gtctctccag 19740gcagtcagag ggtaccacac atggtccctt tttggcagca cctctgtctg gctggagcag 19800gccctgctct gtctgctttg tagaggtcag agtcttctgt ttcatggcac agtggcatca 19860tgggctcaag taactttggc agcttcaatt ccaaagactt ggcaaaaaga aagcagaaga 19920gagaggagaa acctcttttt atttttcttg tcaccattct cctgacctcc atcaactaga 19980ccccgtttcc actatcccag agaaagggtg gccacagcta aactgcatgg agaaaccaaa 20040gaatttaaat attggaattt tcaaaagtgt agttgtgggg gttcgaggaa catttaaaga 20100ttacttgggc tgggtgcagt gtctcatgcc caacactttg ggaggccgag gcaggaggat 20160tgcttgagcc aggagttcga gaccagcctg ggcaacacag cgagaccctg tctctatttt 20220tgttttgttt tttaaatgta ttacttggat tctttgtagt tttgctgtat gctctaattt 20280taaacttaac tcctattaca gtgttatctg attttcttat aaaaaaagag ggaagagaga 20340caaacatggg gttcctagtt tgtgggtcat gacaggaata tcagggagcg ctagaaattc 20400tgtcccaggg agtcccctct gccctaggct ctccacggac tggaacattc agaaggtata 20460tcagttcctt gcctccagcc tgatctgcca gagaagtgag cactgttata ccatagcgct 20520gtccagctcg tccagctgtg acatgggcac ctgtggtcta tttctcctgt gcacatccaa 20580ctgccccatc cctattccac gttggtggag ttgggtggag gctacctagg agagcagtct 20640ctggtcacat cattcatcca gtaagtgttt attgagcacc atctgtatat accaggctgt 20700gcgttaggtg ctggggatag gggaaaaaca gagtttcagt ctcctggaat ttataatttg 20760acatgaactg tattaagtca ctgtcatgac ccatgcccat aacttgacca caagtgattg 20820agaacacttg attaaccctg gatgggctac tgacctatct atcacacagc cctgggccag 20880ttcatctcta gacagctcag caaatgggga aaataacaga acccactccc aagctcaggt 20940gatcctccca cctcagcctc ctgagtagct ggggctacag gtgcacacta ccatgcccag 21000
ctaatttttc tatttttttt ttgtagagac agggttttgc catgttgccc aggctggtct 21060tgaactcctg ggttcaagca atctgctcac ttcggcctcc caaagtgctg ggattacagg 21120cgtgagccac tgtgcccagg caactttaat aatatttaat gcactaattg gtgtgtgtac 21180agtgattggt tcattttaat aactgaaaac ccagcctgcc ccccgctccc accccggagg 21240acccagtgtc acataagagt cccccacccc gctgtcgcca gcagagttcc ctcaggacaa 21300cagtaacagg aagtgaggaa ggctgccact ctcggggctg tagaaaccct gctctgcctc 21360acctcctgtc ttatccacag tgtgtggtcc agcaatgctc ttccttcgga gcctccggtc 21420cctctttctc ctatgaatca aatgaaagac agaaagggca ggggaattag gaatgcaggc 21480tgagcaggca tacctacttt ctggacagtt agtcagtctt gtgctcctcc catgccccat 21540ccagtctcag tctcaacagc agggagggcc tttgtcacgt gaatatctgc tgtcactctt 21600aggactcagt agcagggctt ccaaggcctt tggtgacctg gcccctgcca cttcaccttc 21660cccagcctgg catgctccga gtccccagca cggcccagcc ttcccaggat gtccaggctc 21720ttgcttgctc ttctacctgc tcccctggct aactcttttt ttaaaattca tttttactta 21780ttttgtttta gagatggggg tctcactata ttgcccaggc tagtcttgaa ctgttgggtt 21840caagtgatac tcccacctcc gcctcccaaa gtgctgggat aacaggcatg agccaccgtg 21900cctggcacct ggctgactct taatcatcca tccttctggt tacaatttat tgtcacttcc 21960ctaaacaccc cctttcttgg ccaaagtcag ggttagctgg cctttgtgct cctgcagcct 22020ctgtccctcc cctaccatag cactgtctca ttgtattgag atgggcttat cccctggtca 22080gctctgaggg gagggccagg cctaccctgc agccaggccc ccagcctggc acagagccca 22140cagtctggtt gcgtctcatg tggattctaa tttgaatgta aaggagaacc atacaaaagc 22200atctgtggtg gttcacgcct gtaatcccaa cagtttggga ggccaaggtg ggaggatctc 22260ttgagacgag gagtttgaga ccagtctcta tcataaaatt taaaacatta gccaggcctg 22320gtggtgtgtg cctatggtcc cagctacttg ggatgtttag gcaggaagat cgcttgagcc 22380ctggaggtcg aggctacagt gagccatgtt tacactattg cactccggcc tgagtgacag 22440agccagtctg tcacctgtct ctaaaaaaat aaaaaataaa aaaaaaatat gagccaaatt 22500tggcataatg tagatttcca tcattaaaac aaaactcaca gaaaacagca agatttcaaa 22560gccagcatgc agtgattaag atatcccttt ggagtcgggt ccttgctttg cctccgcagg 22620ctgcgtgacc tggtgcttaa cgcagttacc acatggtggc gccacgtcag ctgagagcag 22680
aaatagaaag gtccccgttc ttcactagtg cctggcgagg ggtctgttta catgcatcag 22740aacacctgtc ctgggttttg aggactcttg tattgctatt ttataactca ctataatact 22800ttaaaaatat ttaatttaaa aatcatttaa taattaattt aaatataata ataaataatt 22860taaaaatcat ttttaaataa taattttaaa accctccaac atgtcatcca cccattcatt 22920aggaggtaac agcaccaggg ctgaaaaatg tgcattaaag tcgataactt tggtgtgcaa 22980cgtcagcgtg ataggcaacc aagtagccac ctctctgagg ctgagccgtc aattttgggg 23040tgacccctct ttgggatttg agagatcggg ctgagaagac agaaagcaat gacaatatgc 23100tgcagtggtc gtggattttc tgtgcggagg gaacatctcc tcctactgta tatttattct 23160tgtggggaat gagtcctgcc ctacggggag ttttgcatta atgaggctct ctaagaaccg 23220aggctctcca agaaccaagc catgcataca gtgcagaaca ccctaggcaa ggccttcaca 23280tcagatttgt gggctgaggc tgacacgtga acggagctgc cttagcgccc cgcctgaccc 23340cctctttcct ttcccccaca ccccctgctc tgatctgctg tctcttctca gcctctctgc 23400tcaccctgtc tcttctggcc attcttaacg gcatccccca cttaggcatc cctccgcccc 23460cacaggctgc caggcagacc cagcaccatc acattcacgc ctcaggcctc cttgctgtgc 23520tgtttcacgt cattcccaga cacctggggc agattccgga gtctctacca agaaaacaac 23580cagaagcaat gaaccacaaa atctggagaa aaacatggct gtcacagatc aaagaggccc 23640ccctttggag gctgggggcc tccgtgagaa gcagtgggat agttgagagg caaaaaacat 23700ggggcagaat tccgcgcccc tcatatcagc tgggagaatg ccaatgacca gtggtttctg 23760agctttagct gtgtggggta agaggtcaat agattttggt gttactatta tggggttgcc 23820agagccacct ctgttcctgc cagatgggcc cccagctcct ctgggtgaac tgtgacttcc 23880ctcagtcaca tagatccagc catgcaaacc tgcctgcgtt gcggccacag cacttgctgt 23940ctctctcacc aggaccgttc tccctgatgg catcagggcc tggatcacag tcacattctc 24000caggagtgtt tttgcagggg accctctgga tcactcctac tccaacttca gcctattttt 24060aaaaaaattt ctcttttttt ttctgcagta tgtatacata gttaaatata tatttatatt 24120ttttaaccaa agctcttgtt agatgccttc tttcctgagt agccctctgt gctccgcctt 24180accccaccca ccatgagccc tactgcagaa gacctcatcc cggaagacct ccgtcagtgt 24240ctccacttca gtagctctgt agctgagcca tgtggggcac aagtcctgcc aggacctctc 24300tgttttccaa gcttggcact gcctttgggg agtctagatt ttaaaatgga aaagacaaaa 24360
aatatggcaa cctaaaaaag aaaataattc agaatgttat aagctaatac agccatctca 24420tttttgcatc ttccttttgg attccagccc atgagcacag tctgcttttc tcagctaacg 24480ttatccctta agcagttccc cagatctcca tggccttcat catcactagc tcaaatggct 24540ttataatggg ccattttcat gacatgcact aatttactaa accattttcc taatgtcggc 24600catttaggtg atatctaatt tttggctcac acaaccacag gtgtcttcat atagaaagct 24660tttgactgca tttgaattat tttcttagga aattactgga ttagaaggtg taaacatctc 24720catggatttc attatccatg acttggtgtc tatttggtat ttttctgatg gcttctttga 24780ttctagaaaa ggatttgcca tagtgcaaga agtacaaatg ataacactag gacaaaatag 24840agagggaaca caaggagaga agaaaagtaa aagtttggat tccaaaaata catcctagga 24900tgtcctgcag ctttctacag ttctctaatg tacaagtgaa ttaaaaattt aaggtataca 24960acgactgatt ttagagataa aatcactttg cagatgtaaa gaaacatgga aaaatcccag 25020ccattggtaa tagtagactc aaaaatgagg taggtcaaag tcccagtcag cctctgtctg 25080gggggaaacc ccttaactta tctcagtctc agttgcctaa ttacataaaa tggaatactg 25140atagctactt gctagaggtg gcctgcgcat tttttacgct ttccagccgc cattggaaat 25200aagatcattg gccaggggcg gtggctcacg cctgtcatcc cagcactttg ggaggctgag 25260gcgggcagat cacgaggtca ggagatcaag accatcctgg ctaacacagt gaagccccat 25320ctctacaaat aattagccag gtgtggtggc acacgcctgt agtcccagct acttgggagg 25380ctgagacagg agaatcgctt gaacccagga ggcgaagctt gcagtgagcc atcgcgccac 25440tgcattccag cctggatgac agagcgagac tctgtctcaa aaaaaaaaaa aaaaaaaaaa 25500aaagatcact ttcaagatcc atggaatctg gtgttctata gttctatatc tggtatttgc 25560aagacagaag tcaggaatag agactccaga cacatttctt cccttggttg tcttaaaggg 25620gacactgtga tcttgacagc ctgagtaaag ggtttgagtg agtgcctatg atatagtgga 25680cagtttcctc aactatattt ctaaaaaaag acaagtttta tgtcttttta aaaattgtgg 25740caaaatacat ataacataaa atttactatc ttaaccattt ttttggggtg attgcttgag 25800ctcaggagtt tgaggctgga gcgagttaag atcatgccac ttcaatctgg gcaacagagc 25860aaaagtgtgt ctcttaaaaa aaaaaatgcc tgtaatccca gcactttggg aggccaaggc 25920aggcagattg cttgagccca ggagtttgag accagcccgg gcaacatggc aagatcctgt 25980ctctacaaaa aatacaaaaa ttaactgggt gtggtggcac ctgtagtccc agctacttga 26040
gaggctgagg tgggggatca cttgagcctg gcaggtcaag gctgcagtga gctgtgattg 26100caccactgca ctccagcctg ggtgacagaa tgagactctc tcaaaaaaca aaaacaaaaa 26160caaaaaacaa tcccccaaaa caaaacaaaa aaccactgcc ctctccccac tgaatggtcc 26220tgccaccctt ttcaaaattc atttgaccac gcatgtgagg gtgtatgtct gggctctatt 26280caatgacatt gacctatgtc tgtctttatg ccagtaccat actgttttga ttactgtagc 26340tttgtagtaa gttttgaaat caggaagtgt gagtcctcca attttgctct ttttccagat 26400tgttttgtct atttggggtc ccttgagatt ctcgtgtgaa ttttaggata gattttctat 26460ttctgcaaaa aacatcattg gggttttgat agggattaca tttaatctat ggattgcttt 26520gggtagtatt gagatcttta agttttctaa tccatgaaca taggatatat ttccatttat 26580ttatatcttt tttttttttt tcttgagaca gagtctcgct ctgttgtcag actggaggac 26640tgtggcgcca tctcggctca ctgcaacctc tgactccctg gttcaagcaa ttctcctgct 26700tcagcctcct gagtagctgg gattacaggc acacgccacc acgcccagct aatttttata 26760tttttagtag agacggggtt tcaccatgtt ggctaggatg gtctcaatct cctgacctag 26820tgatccacca gcctcggtct cccaaagtgc tgggattaca ggcgtgagcc actgtgcctg 26880gcctatgtct tctttatttt tctttctttc tttctttctt tttttttttt ttttttagat 26940ggagtcctgc tctgttgccc aggctggagt gcaatggcac gatcttgact cactgcaacc 27000tccgcctcct ggattcaagt gattttcctg cctcagcctc ccaagtagct gggattacag 27060gtgcccacca ccacgcctgg gtaatttttg tattttttaa tagagacggg gttttaccat 27120gttggccagg cttgtttcaa actcctgacc tcaggtgatc tgcctgcctt ggcctcccaa 27180agtgctggga ttacaggtgt gagccactgt gcccggctct ttttcttttt tgagactggg 27240tcttgctttg tcacccaggc tgaagtgcag tggcgcgatc actgcacact gcagcctcaa 27300ctgcttggac tcaagtggtt ctcccacctc agcctcacga gtagctggga ccacaggcac 27360atgccaccac acctggctaa attttttatt atgtgtagag atgaggtttt gctggtctgg 27420aactcctggg ctcaagggat cctcctgcct cagcctccca aagtgttgag attacaggcg 27480tgagccatgg catccagcct tctttctttc agcaatgttt tgtagttttc attttacaag 27540tctttcatct tggttaagtt aatttctaac tattttatta tttttgatgc tattgtcaat 27600ggaaccattt ttgtaatttc tttttctgat tgttcattgt tagtgtatag aaatggaagt 27660attttttgtg gttggcttcg tatcctgcta atatgctaat tttatttgtt ctaatagtgt 27720
ttcatcttta gggttttctg catataaaat cataccattt gtgagtagag ataattttac 27780tccttctttc caatttgaat gtcttttatt tctttttctt gcctccttgc tctattaact 27840tctagtaatg tgttgaatag aagtggcaaa agcagaaatt cttgccttct tcctgatctt 27900atagaaaaag gtttcagtct ttcaccattg agtataatgt ttgctgtggg tttttcatat 27960atggctttta ctatgttgag gtagtttcct tctattctga gtttgttgac tgtttttatc 28020atgaaagctt gttgaatttt gtcatgtgct tttttctgca tcaattgaga tgatgatgta 28080gggttttttt cattctctta tgaaccccaa aaatctgaga caggtctcag tcaatttaag 28140aagtttcttt tgccaaagtt aaggatgcac gcccaggaga caggtctatg cctttctctg 28200aacatgaatt ttagggttcc aaatttaaag gggaaagggc aggatattga gaagtacaca 28260gttttcaggt aagagcaggg tagggggaaa tagtcattca agcatttgtc tggctcagtg 28320aatttgcatt tttacgtaag gtaacatagg gcaggggaaa atgcagggaa cctgcatttt 28380tacgtaagat aacaaagaca aatggggcag gggaataatc agatatgcat ttgtgccagg 28440tgggcagagg ggtgatgcct ctgtaaagat aagctatcca tttacattgc cgtggtgaat 28500tttatcagac aactatcttg gagctcacca ggaatttcct tgtgggcaaa atatgggaga 28560ggtgtgtagc ttttcatctt gtagccatct tatttaggaa ccaaaacggg gaggcaggtt 28620tgcgtgaccc agttcccagc ttgacttttc cgtttggctt aatgagtttg gggtcccaag 28680atttattttc ctttcacact gttaatgtag tatattgcac cgactttcat atgttgaacc 28740atccttgtct gtgtatttca atgacaagag gtgtttgttt ctgcttcctg cagagcagaa 28800agaccatggg tttgaggtgg cctccacttc ccctgaagac gagtcccctg gcagtaaccc 28860cgagccagat gccaccccgt tccaggaagg tttgaggacc ttcgaccagc tggacgccat 28920atctagtttg cccacaccca gtgacatctt tgtgtcctac tctactttcc caggtgagca 28980catcagaagg gctcgtcctc gcagccagtg ggtcttcccg tctgccctag aggcagctgt 29040gtggtgagag aaaagaccag ggtatgagtc ctggttctgt cttttgcccc tctgtgaccc 29100tgagcaagtt acttctctct gagcctcggc tcaggctgag cgggcaagga tgcgcgctgc 29160aaggaggcct gcgcccttgg gttcctatgc ctcacttgcc tctcctctgc ctgaccctgc 29220ctctgccttc gcatctttag caggggaata ggaatcgtgc ctcaggggtt tccatgggaa 29280ttaaacaagg tggctggcac gtcactgagc acagtgcggg gcacgtagta gttgcagcaa 29340gcggtagttt ccttccttct tttttttttt tttttttttt tttgagatgg aatctcgctc 29400
tgttgcccag gctggagtgc agtggcgcga tcttgggtca ctgcaagctc tgcatcccgg 29460gttcacacca ttctcctgcc tcagcctccc aagtagctgg gactacaagc acctgccacc 29520acgcctggct aattttttgt atttttagta gagatggggt ttcaccgtgt tagccacgat 29580ggtctcgatc tcctgacctc gtgatccacc tgcctcggct tcccaaagtg ctgggattac 29640aggcgtgagc caccgcgccc agcctttttt tttttttttt tgagacggag tcttgctttg 29700tcgcccaggc tggagttcag tagcatgatc tcagctcact gcaacctcca cctcccgggt 29760tgaagtaatt ctcctgcctt agcctcctaa gtagctggga ttacaggcat gcatcaccac 29820acccagctaa tttttgtatt tttagtagac acagggtttc accatgttgg ccaggctggt 29880caagaattcc tgacctcaag tgatttgccc acctcggcct tccaaaatgc tgggattaca 29940ggtgtgagcc actgtgcctg gcagtttcct tcctttctta tgtcttggat gagtcacttg 30000acttttccaa gccttggttt ccttgctggg aaaacaggaa ttatagccgg aatcagggga 30060tggtcatgag ggtgaaataa gatcatgatt agggcagagc ctcaggggcc aggctgctcc 30120tgttggatgt atgtatgagt caaggtctgg agggcgcccg agccagcgtg catggccaga 30180ggggtggtgg ggagccggcg gaggggtggc tctccagcag tgttcagccc tcctccctcc 30240aaaggttttg tttcctggag ggaccccaag agtggctcct ggtacgttga gaccctggac 30300gacatctttg agcagtgggc tcactctgaa gacctgcagt ccctcctgct tagggtgagt 30360gctgccttcc tctgcaaagg agaggggagg ctgctgaggg gcagcgtgtc ctcctggggc 30420tggggatttg gggtgagcag ggcaggccca aaccaagggt aaaaggtagt agactcctgc 30480ctctgagcct tggagtcggc acttttgtgt ctctttatga gaggcatcct gcctgtggtg 30540acgtttgccc tttattcaaa gagttgcctt ccctgtctcc tccaaggtcc ccaggttgac 30600acctcccgct cctccactga tggagctggt cctcagtgcc agcgcaggat ggctctgtcc 30660agaccctgaa ggcgggtcat gggcccctcc ctatatcctg tgggcatcat gtagtcttct 30720actcttgacc ctcaagaatt gtgaacccct ccttgtacat cgccttctca ggaggcccca 30780gtgaggaaac agatagggaa gggtggcctg ataggcccag tcctactcca tagaaacccg 30840actcagagca gttgcttcct ctgagggtcc tgtggccttg tggctgcctt gggaggcagc 30900atgtatgggc cccagctgct ctgctcaggt attcatgcca cgagaagggg ctgcgaggct 30960ggggccactc ctggctcctt gcaaatattt cagtctgatt tgaactttat gaatttggaa 31020attttgaatt ttgagttttt taaaggtaaa gttgaggtgc gtattcttta agccctcctg 31080
ctcaaagagg ctgcagtttg agctgttttt aaggtgcggg ttgagtggac attcccccca 31140gcccctcttg aattcttcct tcagtccaga gaactgaact cacagagctc tccatggtca 31200tgtcttacag gtcgctaatg ctgtttcggt gaaagggatt tataaacaga tgcctggttg 31260ctttaatttc ctccggaaaa aacttttctt taaaacatca taaggccagg gcccctcacc 31320ctgccttatc ttgcacccca aagctttcct gccccaggcc tgaaagaggc tgaggcctgg 31380actttcctgc aactcaagga ctttgcagcc ggcacagggt ctgctctttc tctgccagtg 31440acagacaggc tcttagcagc ttccagattg acgacaagtg ctgaacagtg gaggaagagg 31500gacagatgaa tgccgtggat tgcacgtggc ctcttgagca gtggctggtc cagggctagt 31560gacttgtgtc ccatgatccc tgtgttgtct ctagagcagg gattaacctc tgcactactg 31620acatgtgggg ccaggtcacc ctttgctgtg aggctgtcct gtacattgtg ggatgttcag 31680cactgtccct tgcctcaatg ccagtaacgc gtcttcctga gtggtgccaa acaaaaaggt 31740tctcaggtgt tgccaaatat gtcctggggt ataaaacttt cctcgcctga caaccactgg 31800tctgtaggga tttttggcta cacacaaacc agtatcgctc atagatcagc aaaccggggc 31860ctactagagt ctgaacagct gtaatctatg aattctaagt gaaattttaa aaattgttaa 31920tttttcctat attgcattaa ttttaaaaaa taaatctgag gcaaatatgg 31970
權(quán)利要求
1.用于預(yù)測2型糖尿病易感性的引物,所述引物為基于圖1B或圖1A的序列而設(shè)計(jì)的用于PCR擴(kuò)增的特異引物,所述引物針對圖中所示的SNP位點(diǎn)R而設(shè)計(jì),長度為18-46個(gè)核苷酸。
2.如權(quán)利要求1所述的引物,其包含選自SEQ ID NO1-30組成的一組的一種序列。
3.如權(quán)利要求2所述的引物,其為具有SEQ ID NO31 SEQ IDNO32所示的序列的單堿基延伸引物。
4.用于預(yù)測2型糖尿病易感性的試劑盒,其包含如權(quán)利要求1-3任一項(xiàng)所述的引物。
5.CASP9基因在制備用于預(yù)測2型糖尿病易感性的診斷劑中的應(yīng)用。
全文摘要
本發(fā)明涉及用于預(yù)測2型糖尿病易感性的試劑盒及引物,更具體地,本發(fā)明涉及利用新鑒別的2型糖尿病易感基因CASP9的一個(gè)單核苷酸多態(tài)性(SNP)位點(diǎn)設(shè)計(jì)的預(yù)測2型糖尿病易感性的試劑盒和引物。本發(fā)明還涉及CASP9基因在制備預(yù)測2型糖尿病易感性的診斷劑中的應(yīng)用。
文檔編號C12Q1/68GK1548554SQ03136978
公開日2004年11月24日 申請日期2003年5月21日 優(yōu)先權(quán)日2003年5月21日
發(fā)明者吳國棟, 李云峰, 左瑾, 方福德, 強(qiáng)伯勤, 沈巖, 姚志建, 陳竺, 黃薇, 王姮 申請人:中國醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所, 北京諾賽基因組研究中心有限公司, 國家人類基因組南方研究中心, 中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院