專利名稱:具有新的單核苷酸多態(tài)性的HNF-1α基因變體和其編碼的蛋白質變體的制作方法
技術領域:
本發(fā)明涉及一個含有在1699位置上具有腺嘌呤(A)核苷酸的SEQ IDNO1的多態(tài)性位點,或者在位置29上具有胸腺嘧啶(T)核苷酸的SEQ IDNO3的多態(tài)性位點,和含有在SEQ ID NO1或3中顯示多于10個連續(xù)核苷酸地核酸片段,或其互補序列,和含有多態(tài)性位點的蛋白質變體。
背景技術:
按照慣例,分析基因變異的各種方法已經(jīng)被廣泛用于醫(yī)藥領域,用來診斷疾病的發(fā)生和/或傾向。這些方法包括利用核酸擴增的方法如聚合酶鏈式反應(PCR)擴增基因和利用核苷酸測序,雜交或單鏈構象多態(tài)性(SSCP)分析來分析擴增基因的核苷酸序列。例如,PCR和核苷酸測序在商業(yè)上被用于BRCA基因探針。BRCA基因已知與乳腺癌(breast cancer)有關。
MODY3基因引發(fā)青春晚期糖尿病(maturity onset diabetes of the young)幼體糖尿病成熟發(fā)作,表現(xiàn)為10-30%或更高的II型糖尿病(Yamada,Diabetes 48645,1997;Yoshiuchi等,Human mutation18345,2001;USP 6,187,533;WO 9811254)。
目前,少數(shù)MODY3基因突變的病歷已經(jīng)在韓國被報道(Kim等,KoreanDiabetes Association,23793,1999),而且被報道的病歷與新的突變不相關。
因此,這就要求研究用于疾病診斷的新的突變,疾病機理的研究和藥物的發(fā)現(xiàn)。特別地,篩選特異于種族和地理特性的MODY3基因的突變的需求正在增加。
發(fā)明內容
本發(fā)明提供一種含有具有新的突變位點的,多于10個連續(xù)(contiguous)核苷酸的核酸片段和其互補序列。
本發(fā)明也提供了與含有新突變位點的核酸全部和部分雜交的等位基因特異性寡核苷酸。
本發(fā)明提供了一種分析核酸的方法,包含測定含有新突變位點的核酸的核苷酸序列。
同樣,本發(fā)明提供了一種人HNF-1α多肽的變體或片段,該多肽具有的氨基酸序列由10個或更多個具有相應于包括新的突變位點的核酸的氨基酸突變之氨基酸組成。
本發(fā)明提供了一種分析蛋白質的方法,包括測定與含有新突變位點核酸相應的氨基酸突變。
圖1表示具有包含根據(jù)本發(fā)明的HNF-1α突變核苷酸的部分的基因組DNA;和
圖2表示具有含有根據(jù)本發(fā)明的HNF-1α突變核苷酸的內含子8的基因組DNA。
本發(fā)明的詳細描述
本發(fā)明的核酸片段,包括具有在1699位為腺嘌呤(A)的SEQ ID NO1的多態(tài)性位點,或29位為胸腺嘧啶(T)的SEQ ID NO3的多態(tài)性位點,并且包括在SEQ IDNO1或3中顯示的多于10個連續(xù)核苷酸,或其互補序列。
詳細地,根據(jù)本發(fā)明的核酸片段可以包括任何多核苷酸,該多核苷酸含有1699位為核苷酸A的SEQ ID NO1的多態(tài)性位點和在SEQ ID NO1中顯示多于10個連續(xù)核苷酸。根據(jù)本發(fā)明的核酸片段也可以包含HNF-1α基因本身。
核酸片段優(yōu)選包括在SEQ ID NO1或其互補序列中的10到100個連續(xù)核苷酸,更優(yōu)選地10到50個連續(xù)核苷酸,以及最優(yōu)選地10到20個連續(xù)核苷酸。多態(tài)性位點可以位于該片段的任何部分。
同樣地,根據(jù)本發(fā)明的核酸片段可以包括包含SEQ ID NO3中顯示的多于10個連續(xù)核苷酸的任何多核苷酸,它與位于人HNF-1α的外顯子8和外顯子9之間的內含子8的序列相對應。
核酸可以是DNA、RNA或PNA,而且在形式上可以是單鏈或雙鏈核酸。核酸片段可以是天然的或是合成的。
在本發(fā)明中,術語“多態(tài)性”是指在被遺傳檢測的組中存在兩種或更多的可選擇的基因組序列或等位基因?!岸鄳B(tài)性標記或位點”是變異發(fā)生的位置。在被選擇的組中,優(yōu)選地,標記含有至少兩個具有大于1%,更優(yōu)選地10%到20%的頻率的等位基因。多態(tài)性位點可以是單堿基對。
此外,本發(fā)明提供了等位基因-特異性寡核苷酸,該寡核苷酸包括位點1699有A核苷酸的SEQ ID NO1的多態(tài)性位點,或位點29有T核苷酸的SEQ ID NO3的多態(tài)性位點,并且與SEQ ID NO3的核苷酸雜交,或其互補序列。
在本發(fā)明中,術語“等位基因-特異性”是指特異地與每個等位基因雜交。例如,進行雜交使得特異地鑒定在位點1699上有A核苷酸的SEQ IDNO1的SNP。雜交是在嚴謹條件下進行的,例如1M或更低的鹽濃度和25℃或更高的溫度的條件。例如,5×SSPE(750mM NaCl,50mM磷酸鈉(Naphosphate),5mM EDTA,pH7.4)和25~30℃的溫度的條件適用于等位基因-特異性探針的雜交。
在本發(fā)明中,等位基因特異性寡核苷酸可以是探針。這里使用的術語“探針”意指雜交探針,它是能與核酸互補鏈序列-特異性結合的寡核苷酸。這種探針包括Nielsen等在Science 254,1497-1500(1991)中描述的肽核酸。本發(fā)明的探針是等位基因-特異性探針,其與一種成分衍生的DNA片段雜交,但不與不同成分衍生的DNA片段雜交,這是由于自相同種類兩種成分衍生來的核酸片段有多態(tài)性位點。在這種情形下,雜交條件在等位基因間的雜交嚴謹性明顯不同。這樣,雜交條件應該嚴謹?shù)阶阋栽试S僅與一個等位基因雜交。依據(jù)本發(fā)明的探針優(yōu)選處理,使得中心位點,即15個核苷酸探針時在位點7,或16個核苷酸探針時在位點8或9,與序列的多態(tài)性位點匹配(align),使得等位基因的雜交明顯不同。本發(fā)明的探針能夠被用于檢測等位基因的診斷方法中。診斷方法包括基于核酸雜交的檢測方法,例如,southern印跡雜交和當DNA芯片用于檢測特定核酸時,探針可以以在DNA芯片底物上固定的形式被提供。
在本發(fā)明中,等位基因特異性寡核苷酸可以是引物。這里使用的術語“引物”是指能在適當?shù)臈l件(例如,在含有4種不同核苷三磷酸和聚合酶如DNA和RNA聚合酶或逆轉錄酶的緩沖條件下)和適當?shù)臏囟认伦鳛槟0逡龑У腄NA合成起始位點的單鏈寡核苷酸。引物的適當長度可以根據(jù)使用目的而改變,通常15到30個核苷酸。大體上,短的引物分子需要較低的溫度來與模板形成穩(wěn)定的雜交。引物序列與模板不需要完全互補,但應該是足以與模板雜交的互補。優(yōu)選安排引物,使得其3’末端和1699位具有的A核苷酸的SEQ ID NO1的多態(tài)性位點或者29位具有的T核苷酸的SEQ IDNO3的多態(tài)性位點一起排列(arrange)。引物與含有多態(tài)性位點的靶DNA雜交,并且起始于等位基因的擴增,其中引物顯出完全的同源。該引物與在相對位點雜交的第二引物成對使用。擴增反應后,擴增產(chǎn)物從兩個引物獲得,這就意味著有特殊的等位基因形式。
根據(jù)本發(fā)明的另一方面,提供了一種分析核酸的方法,包括測定在SEQID NO1的1699位或SEQ ID NO3的29位的多態(tài)性位點核苷酸序列。該方法可以包括將核酸,例如基因組DNA或RNA從樣品中分離,測定分離核酸的序列并且測定在SEQ ID NO1的1699位或SEQ ID NO3的29位多態(tài)性位點的核苷酸序列。如果分析結果顯示出在SEQ ID NO1的1699位的多態(tài)性位點的核苷酸序列是不同于鳥嘌呤(G)的核苷酸或SEQ ID NO3的29位的多態(tài)性位點是不同于胞嘧啶(C)的核苷酸,這就確定有青年期糖尿病(MODY)增加的危險。這里,核苷酸序列是通過普通測序方法被測定的,例如,雙脫氧法(Sambrook等,分子克隆,A Laboratory Manual,2nd Ed.CSHPNew York 1989),或利用自動化設備。
根據(jù)本發(fā)明的人HNF-1α多肽的變體或片段含有多態(tài)性位點,該位點上,SEQ ID NO2的527位氨基酸是一個不同于纈氨酸(Val)的氨基酸,優(yōu)選地是異亮氨酸(Ile),而且含有由SEQ ID NO2氨基酸序列衍生而來的多于10個連續(xù)氨基酸。如SEQ ID NO2中所示,根據(jù)本發(fā)明的人HNF-1α多肽的變體或片段,優(yōu)選地是在567位具有Ile而不是(instead of)Val的SEQ ID NO2氨基酸序列衍生而來。
根據(jù)本發(fā)明蛋白質的分析方法,包含測定SEQ ID NO2的567位的氨基酸序列。該氨基酸序列是用通常的方法測定的,例如,N-或C-末端鑒定,或使用諸如MS/MS或MALDI-TOF設備。
現(xiàn)在本發(fā)明將通過參考下面提到的實施例更詳細地描述。但是,這些實施例僅被提供用于說明,并且本發(fā)明不局限于那些實施例。
實施例
從97個臨床推定為MODY患者的血液樣品中分離基因組DNA。為了堿基測序而擴增MODY3基因的10外顯子和內含子部分,并且MODY3基因的變體被測定。
實施例1人HNF-1α基因中10外顯子DNA的擴增
從97個患者收集血液,并且基因組DNA用QIAGEN質粒中間(midi)試劑盒(QIAGEN德國)分離,10 MODY3外顯子用PCR反應溶液(表1)擴增。PCR擴增的條件是5分鐘(95℃)用于最初的變性,30個循環(huán)為30秒(95℃)用于變性,15秒(62℃)用于退火,和30秒(72℃)用于延伸,3分鐘(72℃)用于最后的延伸。PCR擴增中用的引物列于表2。
表2所列的引物中,T7啟動子序列(SEQ ID NO24)被加入到正向引物中,并且T3啟動子序列(SEQ ID NO25)被加入到反向引物的5’末端中。
表1.PCR反應溶液的組成
表2.用于擴增MODY3基因的PCR引物
擴增產(chǎn)物用QIA快速試劑盒純化。純化產(chǎn)物用作核苷酸序列分析的模板。
實施例2MODY3基因的核苷酸序列分析
核苷酸測序PCR是通過ABI PRISM BigDye終止子循環(huán)測序預備反應試劑盒(Applied Biosystem,U.S.A)方法,用每種純化的引物對MODY3外顯子10來進行的,并且用乙醇沉淀產(chǎn)物,接著產(chǎn)物在甲酰胺中懸浮,95℃煮沸5分鐘,立即浸入4℃的冰中。最后,序列分析用一種ABI PRISM 3700Genetic Analyzer(Applied Biosystem,U.S.A)來進行。
實施例3用于MODY3基因突變探測的分析
從序列分析得到的DNA序列在NCBI數(shù)據(jù)庫中與核苷酸序列相比較,并且遺傳突變用DNAstar程序(DNASTAR,Inc,U.S.A)來分析。
用II型糖尿病診斷的97個患者的DNA樣品擴增得到的MODY3基因的10個外顯子序列被用于分析。
結果顯示突變在4個患者中被發(fā)現(xiàn),而且4個患者中1個發(fā)現(xiàn)新的突變。也就是,發(fā)現(xiàn)該患者的MODY3基因外顯子9的1699位的G變成了A(圖1)。此外,這可能提示MODY3基因編碼的氨基酸序列中567位的纈氨酸(Val)變成了異亮氨酸(Ile)(SEQ ID NO2)。
實施例4MODY3基因中內含子的核苷酸序列分析
實施例1到3所示的同樣的方法被用于HNF-1α中內含子的核苷酸序列分析。分析結果顯示在一個患者身上發(fā)現(xiàn)了一個新的突變。那就是位于HNF-1α外顯子8和外顯子9之間的內含子8的29位的C被變成了T(圖2)。
在糖尿病患者中青年期糖尿病(MODY)的病歷在韓國比在歐洲相對低,其中所有糖尿病病歷中MODY估計占10%,推測是因為MODY基因的分布依據(jù)種族和地理特性而不同。這樣,必須作MODY分布的進一步研究。
根據(jù)本發(fā)明的核酸片段可以被有效用作MODY診斷的探針或引物。
根據(jù)本發(fā)明的等位基因特異寡核苷酸可以用作MODY診斷的探針或引物。
根據(jù)本發(fā)明的人HNF-1α多肽的變體或片段可以有效用作MODY診斷的探針或引物。
此外,根據(jù)本發(fā)明的蛋白分析方法可以有效用作通過多肽序列分析的MODY診斷的探針或引物。
雖然本發(fā)明參照示范性的實施方案來特別說明或描述,那些本領域的普通技術人員將明白其中形式和細節(jié)上的可作的不同變化不脫離象下面的權利要求定義的本發(fā)明的精神和范圍。
序列表<110>三星電子有限公司(samsung Elect ronics Co.Ltd)<120>具有新的單核苷酸多態(tài)性的HNF-1α基因變體和其編碼的蛋白質變體<160>25<170>KopatentIn 1.71<210>1<211>1896<212>DNA<213>人(Homo sapiens)<220><221>CDS<222>(1)..(1893)<223>HNF-1α的氨基酸序列<400>1
atg gtt tct aaa ctg agc cag ctg cag acg gag ctc ctg gcg gcc ctg 48
Met Val Ser Lys Leu Ser Gln Leu Gln Thr Glu Leu Leu Ala Ala Leu
1 5 10 15
ctc gag tca ggg ctg agc aaa gag gca ctg atc cag gca ctg ggt gag 96
Leu Glu Ser Gly Leu Ser Lys Glu Ala Leu Ile Gln Ala Leu Gly Glu
20 25 30
ccg ggg ccc tac ctc ctg gct gga gaa ggc ccc ctg gac aag ggg gag 144
Pro Gly Pro Tyr Leu Leu Ala Gly Glu Gly Pro Leu Asp Lys Gly Glu
35 40 45
tcc tgc ggc ggc ggt cga ggg gag ctg gct gag ctg ccc aat ggg ctg 192
Ser Cys Gly Gly Gly Arg Gly Glu Leu Ala Glu Leu Pro Asn Gly Leu
50 55 60
ggg gag act cgg ggc tcc gag gac gag acg gac gac gat ggg gaa gac 240
Gly Glu Thr Arg Gly Ser Glu Asp Glu Thr Asp Asp Asp Gly Glu Asp
65 70 75 80
ttc acg cca ccc atc ctc aaa gag ctg gag aac ctc agc cct gag gag 288
Phe Thr Pro Pro Ile Leu Lys Glu Leu Glu Asn Leu Ser Pro Glu Glu
85 90 95
gcg gcc cac cag aaa gcc gtg gtg gag acc ctt ctg cag gag gac ccg 336
Ala Ala His Gln Lys Ala Val Val Glu Thr Leu Leu Gln Glu Asp Pro
100 105 110
tgg cgt gtg gcg aag atg gtc aag tcc tac ctg cag cag cac aac atc 384
Trp Arg Val Ala Lys Met Val Lys Ser Tyr Leu Gln Gln His Asn Ile
115 120 125
cca cag cgg gag gtg gtc gat acc act ggc ctc aac cag tcc cac ctg 432
Pro Gln Arg Glu Val Val Asp Thr Thr Gly Leu Asn Gln Ser His Leu
130 135 140
tcc caa cac ctc aac aag ggc act ccc atg aag acg cag aag cgg gcc 480
Ser Gln His Leu Asn Lys Gly Thr Pro Met Lys Thr Gln Lys Arg Ala
145 150 155 160
gcc ctg tac acc tgg tac gtc cgc aag cag cga gag gtg gcg cag cag 528
Ala Leu Tyr Thr Trp Tyr Val Arg Lys Gln Arg Glu Val Ala Gln Gln
165 170 175
ttc acc cat gca ggg cag gga ggg ctg att gaa gag ccc aca ggt gat 576
Phe Thr His Ala Gly Gln Gly Gly Leu Ile Glu Glu Pro Thr Gly Asp
180 185 190
gag cta cca acc aag aag ggg cgg agg aac cgt ttc aag tgg ggc cca 624
Glu Leu Pro Thr Lys Lys Gly Arg Arg Asn Arg Phe Lys Trp Gly Pro
195 200 205
gca tcc cag cag atc ctg ttc cag gcc tat gag agg cag aag aac cct 672
Ala Ser Gln Gln Ile Leu Phe Gln Ala Tyr Glu Arg Gln Lys Asn Pro
210 215 220
agc aag gag gag cga gag acg cta gtg gag gag tgc aat agg gcg gaa 720
Ser Lys Glu Glu Arg Glu Thr Leu Val Glu Glu Cys Asn Arg Ala Glu
225 230 235 240
tgc atc cag aga ggg gtg tcc cca tca cag gca cag ggg ctg ggc tcc 768
Cys Ile Gln Arg Gly Val Ser Pro Ser Gln Ala Gln Gly Leu Gly Ser
245 250 255
aac ctc gtc acg gag gtg cgt gtc tac aac tgg ttt gcc aac cgg cgc 816
Asn Leu Val Thr Glu Val Arg Val Tyr Asn Trp Phe Ala Asn Arg Arg
260 265 270
aaa gaa gaa gcc ttc cgg cac aag ctg gcc atg gac acg tac agc ggg 864
Lys Glu Glu Ala Phe Arg His Lys Leu Ala Met Asp Thr Tyr Ser Gly
275 280 285
ccc ccc cca ggg cca ggc ccg gga cct gcg ctg ccc gct cac agc tcc 912
Pro Pro Pro Gly Pro Gly Pro Gly Pro Ala Leu Pro Ala His Ser Ser
290 295 300
cct ggc ctg cct cca cct gcc ctc tcc ccc agt aag gtc cac ggt gtg 960
Pro Gly Leu Pro Pro Pro Ala Leu Ser Pro Ser Lys Val His Gly Val
305 310 315 320
cgc tat gga cag cct gcg acc agt gag act gca gaa gta ccc tca agc 1008
Arg Tyr Gly Gln Pro Ala Thr Ser Glu Thr Ala Glu Val Pro Ser 8er
325 330 335
agc ggc ggt ccc tta gtg aca gtg tct aca ccc ctc cac caa gtg tcc 1056
Ser Gly Gly Pro Leu Val Thr Val Ser Thr Pro Leu His Gln Val Ser
340 345 350
ccc acg ggc ctg gag ccc agc cac agc ctg ctg agt aca gaa gcc aag 1104
Pro Thr Gly Leu Glu Pro Ser His Ser Leu Leu Ser Thr Glu Ala Lys
355 360 365
ctg gtc tca gca gct ggg ggc ccc ctc ccc cct gtc agc acc ctg aca 1152
Leu Val Ser Ala Ala Gly Gly Pro Leu Pro Pro Val Ser Thr Leu Thr
370 375 380
gca ctg cac agc ttg gag cag aca tcc cca ggc ctc aac cag cag ccc 1200
Ala Leu His Ser Leu Glu Gln Thr Ser Pro Gly Leu Asn Gln Gln Pro
385 390 395 400
cag aac ctc arc atg gcc tca ctt cct ggg gtc atg acc atc ggg cct 1248
Gln Asn Leu Ile Met Ala Ser Leu Pro Gly Val Met Thr Ile Gly Pro
405 410 415
ggt gag cct gcc tcc ctg ggt cct acg ttc acc aac aca ggt gcc tcc 1296
Gly Glu Pro Ala Ser Leu Gly Pro Thr Phe Thr Asn Thr Gly Ala Ser
420 425 430
acc ctg gtc atc ggc ctg gcc tcc acg cag gca cag agt gtg ccg gtc 1344
Thr Leu Val Ile Gly Leu Ala Ser Thr Gln Ala Gln Ser Val Pro Val
435 440 445
atc aac agc atg ggc agc agc ctg acc acc ctg cag ccc gtc cag ttc 1392
Ile Asn Ser Met Gly Ser Ser Leu Thr Thr Leu Gln Pro Val Gln Phe
450 455 460
tcc cag ccg ctg cac ccc tcc tac cag cag ccg ctc atg cca cct gtg 1440
Ser Gln Pro Leu His Pro Ser Tyr Gln Gln Pro Leu Met Pro Pro Val
465 470 475 480
cag agc cat gtg acc cag aac ccc ttc atg gcc acc atg gct cag ctg 1488
Gln Ser His Val Thr Gln Asn Pro Phe Met Ala Thr Met Ala Gln Leu
485 490 495
cag agc ccc cac gcc ctc tac agc cac aag ccc gag gtg gcc cag tac 1536
Gln Ser Pro His Ala Leu Tyr Ser His Lys Pro Glu Val Ala Gln Tyr
500 505 510
acc cac acg ggc ctg ctc ccg cag act atg ctc atc acc gac acc acc 1584
Thr His Thr Gly Leu Leu Pro Gln Thr Met Leu Ile Thr Asp Thr Thr
515 520 525
aac ctg agc gcc ctg gcc agc ctc acg ccc acc aag cag gtc ttc acc 1632
Asn Leu Ser Ala Leu Ala Ser Leu Thr Pro Thr Lys Gln Val Phe Thr
530 535 540
tca gac act gag gcc tcc agt gag tcc ggg ctt cac acg ccg gca tct 1680
Ser Asp Thr Glu Ala Ser Ser Glu Ser Gly Leu His Thr Pro Ala Ser
545 550 555 560
cag gcc acc acc ctc cac atc ccc agc cag gac cct gcc ggc atc cag 1728
Gln Ala Thr Thr Leu His Ile Pro Ser Gln Asp Pro Ala Gly Ile Gln
565 570 575
cac ctg cag ccg gcc cac cgg ctc agc gcc agc ccc aca gtg tcc tcc 1776
His Leu Gln Pro Ala His Arg Leu Ser Ala Ser Pro Thr Val Ser Ser
580 585 590
agc agc ctg gtg ctg tac cag agc tca gac tcc agc aat ggc cag agc 1824
Ser Ser Leu Val Leu Tyr Gln Ser Ser Asp Ser Ser Asn Gly Gln Ser
595 600 605
cac ctg ctg cca tcc aac cac agc gtc atc gag acc ttc atc tcc acc 1872
His Leu Leu Pro Ser Asn His Ser Val Ile Glu Thr Phe Ile Ser Thr
610 615 620
cag atg gcc tct tcc tcc cag taa 1896
Gln Met Ala Ser Ser Ser Gln
625 630<210>2<211>631<212>PRT<213>人(Homo sa piens)<400>2
Met Val Ser Lys Leu Ser Gln Leu Gln Thr Glu Leu Leu Ala Ala Leu
1 5 10 15
Leu Glu Ser Gly Leu Ser Lys Glu Ala Leu Ile Gln Ala Leu Gly Glu
20 25 30
Pro Gly Pro Tyr Leu Leu Ala Gly Glu Gly Pro Leu Asp Lys Gly Glu
35 40 45
Ser Cys Gly Gly Gly Arg Gly Glu Leu Ala Glu Leu Pro Asn Gly Leu
50 55 60
Gly Glu Thr Arg Gly Ser Glu Asp Glu Thr Asp Asp Asp Gly Glu Asp
65 70 75 80
Phe Thr Pro Pro Ile Leu Lys Glu Leu Glu Asn Leu Ser Pro Glu Glu
85 90 95
Ala Ala His Gln Lys Ala Val Val Glu Thr Leu Leu Gln Glu Asp Pro
100 105 110
Trp Arg Val Ala Lys Met Val Lys Ser Tyr Leu Gln Gln His Asn Ile
115 120 125
Pro Gln Arg Glu Val Val Asp Thr Thr Gly Leu Asn Gln Ser His Leu
130 135 140
Ser Gln His Leu Asn Lys Gly Thr Pro Met Lys Thr Gln Lys Arg Ala
145 150 155 160
Ala Leu Tyr Thr Trp Tyr Val Arg Lys Gln Arg Glu Val Ala Gln Gln
165 170 175
Phe Thr His Ala Gly Gln Gly Gly Leu Ile Glu Glu Pro Thr Gly Asp
180 185 190
Glu Leu Pro Thr Lys Lys Gly Arg Arg Asn Arg Phe Lys Trp Gly Pro
195 200 205
Ala Ser Gln Gln Ile Leu Phe Gln Ala Tyr Glu Arg Gln Lys Asn Pro
210 215 220
Ser Lys Glu Glu Arg Glu Thr Leu Val Glu Glu Cys Asn Arg Ala Glu
225 230 235 240
Cys Ile Gln Arg Gly Val Ser Pro Ser Gln Ala Gln Gly Leu Gly Ser
245 250 255
Asn Leu Val Thr Glu Val Arg Val Tyr Asn Trp Phe Ala Asn Arg Arg
260 265 270
Lys Glu Glu Ala Phe Arg His Lys Leu Ala Met Asp Thr Tyr Ser Gly
275 280 285
Pro Pro Pro Gly Pro Gly Pro Gly Pro Ala Leu Pro Ala His Ser Ser
290 295 300
Pro Gly Leu Pro Pro Pro Ala Leu Ser Pro Ser Lys Val His Gly Val
305 310 315 320
Arg Tyr Gly Gln Pro Ala Thr Ser Glu Thr Ala Glu Val Pro Ser Ser
325 330 335
Ser Gly Gly Pro Leu Val Thr Val Ser Thr Pro Leu His Gln Val Ser
340 345 350
Pro Thr Gly Leu Glu Pro Ser His Ser Leu Leu Ser Thr Glu Ala Lys
355 360 365
Leu Val Ser Ala Ala Gly Gly Pro Leu Pro Pro Val Ser Thr Leu Thr
370 375 380
Ala Leu His Ser Leu Glu Gln Thr Ser Pro Gly Leu Asn Gln Gln Pro
385 390 395 400
Gln Asn Leu Ile Met Ala Ser Leu Pro Gly Val Met Thr Ile Gly Pro
405 410 415
Gly Glu Pro Ala Ser Leu Gly Pro Thr Phe Thr Asn Thr Gly Ala Ser
420 425 430
Thr Leu Val Ile Gly Leu Ala Ser Thr Gln Ala Gln Ser Val Pro Val
435 440 445
Ile Asn Ser Met Gly Ser Ser Leu Thr Thr Leu Gln Pro Val Gln Phe
450 455 460
Ser Gln Pro Leu His Pro Ser Tyr Gln Gln Pro Leu Met Pro Pro Val
465 470 475 480
Gln Ser His Val Thr Gln Asn Pro Phe Met Ala Thr Met Ala Gln Leu
485 490 495
Gln Ser Pro His Ala Leu Tyr Ser His Lys Pro Glu Val Ala Gln Tyr
500 505 510
Thr His Thr Gly Leu Leu Pro Gln Thr Met Leu Ile Thr Asp Thr Thr
515 520 525
Asn Leu Ser Ala Leu Ala Ser Leu Thr Pro Thr Lys Gln Val Phe Thr
530 535 540
Ser Asp Thr Glu Ala Ser Ser Glu Ser Gly Leu His Thr Pro Ala Ser
545 550 555 560
Gln Ala Thr Thr Leu His Ile Pro Ser Gln Asp Pro Ala Gly Ile Gln
565 570575
His Leu Gln Pro Ala His Arg Leu Ser Ala Ser Pro Thr Val Ser Ser
580 585 590
Ser Ser Leu Val Leu Tyr Gln Ser Ser Asp Ser Ser Asn Gly Gln Ser
595 600 605
His Leu Leu Pro Ser Asn His Ser Val Ile Glu Thr Phe Ile Ser Thr
610 615 620
Gln Met Ala Ser Ser Ser Gln
625 630<210>3<211>93<212>DNA<213>人(Homo sapiens)<400>3
gtaaggtcca ggcctgctgg ccctcccttg gcctgtgaca gagcccctca cccccacatc 60
ccccgggctc aggaggctgc tctgctcccc cag 93<210>4<211>41<212>DNA<213>人工序列<220><223>用于擴增MODY3基因啟動子的有義引物<400>4
taatacgact cactataggg tggccgtgag catcctctgc c 41<210>5<211>39<212>DNA<213>人工序列<220><223>用于擴增MODY3基因啟動子的反義引物<400>5
gtaaccctca ctaaagggac gtgggt tgcg tttgcctgc 39<210>6<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子1的有義引物<400>6
taatacgact cactataggg cgtggccctg tggcagccga 40<210>7<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子1的反義引物<400>7
gtaaccctca ctaaagggag ggctcgttag gagctgaggg 40<210>8<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子2的有義引物<400>8
taatacgact cactataggg cccttgctga gcagatcccg tc42<210>9<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子2的反義引物<400>9
gtaaccctca ctaaagggag ggatggtgaa gcttccagcc 40<210>10<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子3的有義引物<400>10
taatacgact cactataggg gcaaggtcag gggaatggac 40<210>11<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子3的反義引物<400>11
gtaaccctca ctaaagggac gccgttgtac ctattgcact cc42<210>12<211>43<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子4的有義引物<400>12
taatacgact cactataggg ggctcatggg tggctatttc tgc 43<210>13<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子4的反義引物<400>13
gtaaccctca ctaaagggac gtgtcccttg tccccacata cc42<210>14<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子5的有義引物<400>14
taatacgact cactataggg tgctgaggca ggacactgct tc42<210>15<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子5的反義引物<400>15
gtaaccctca ctaaagggat acaagcaagg acactcacca gc42<210>16<211>41<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子6的有義引物<400>16
taatacgact cactataggg cccggacaca gcttggcttc c 41<210>17<211>42<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子6的反義引物<400>17
gtaaccctca ctaaagggaa tccccaccag cttaccgatg ac42<210>18<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子7的有義引物<400>18
taatacgact cactataggg caggcctggc ctccacgcag 40<210>19<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子7的反義引物<400>19
gtaaccctca ctaaagggag gggctctgca gctgagccat 40<210>20<211>41<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子8和9的有義引物<400>20
taatacgact cactataggg ggcccagtac acccacacgg g 41<210>21<211>40<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子8和9的反義引物<400>21
gtaaccctca ctaaagggag ggcagggaca gtaagggagg 40<210>22<211>41<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子10的有義引物<400>22
taatacgact cactataggg gccttgtttg cctctgcagt g 41<210>23<211>41<212>DNA<213>人工序列<220><223>用于擴增MODY3基因外顯子10的反義引物<400>23
gtaaccctca ctaaagggag gccatctggg tggagatgaa g 41<210>24<211>20<212>DNA<213>人工序列<220><223>T7啟動子序列<400>24
taatacgact cactataggg 20<210>25<211>19<212>DNA<213>人工序列<220><223>T3啟動子序列<400>25
gtaaccctca ctaaaggga 19
權利要求
1.一種核酸片段,包括在1699位有腺嘌呤(A)的SEQ ID NO1的多態(tài)性位點,或29位有胸腺嘧啶(T)的SEQ ID NO3的多態(tài)性位點,并且含有SEQ ID NO1或3所示的核苷酸序列衍生的超過10個連續(xù)核苷酸,或其互補序列。
2.權利要求1的核酸片段,其中核酸片段含有10到100個連續(xù)的核苷酸,或其互補序列。
3.一種與權利要求1的核酸片段或其互補序列雜交的等位基因特異性寡核苷酸。
4.權利要求3的等位基因-特異性寡核苷酸,其中該寡核苷酸是探針。
5.權利要求3的等位基因-特異性寡核苷酸,其中該寡核苷酸是引物。
6.權利要求5的等位基因-特異性寡核苷酸,其中引物的3’末端和核酸片段的多態(tài)性位點排列。
7.一種用于分析核酸的方法,包括測定位于SEQ ID NO1的1699位或SEQ ID NO3的29位的多態(tài)性位點的核苷酸序列。
8.權利要求7的方法,其中當?shù)?699位的多態(tài)性位點的核苷酸序列是A或第29位的多態(tài)性位點的核苷酸序列是T時,可確定患有青年期糖尿病(MODY)的危險增加。
9.一種人HNF-1α多肽的變體或片段,含有SEQ ID NO2第567位的氨基酸的多態(tài)性位點,并且含有衍生自SEQ ID NO2的氨基酸序列的多于10個連續(xù)氨基酸。
10.權利要求9的人HNF-1α多肽的變體或片段,其中在第567位的氨基酸是異亮氨酸。
11.一種用于分析蛋白質的方法,包括測定SEQ ID NO2第567位的氨基酸序列。
12.權利要求11的分析蛋白質的方法,其中當?shù)?67位的氨基酸是異亮氨酸時,可確定患有青年期糖尿病(MODY)的危險增加。
全文摘要
一種含有人HNF-1α基因的新的單核苷酸多態(tài)性的多核苷酸或核酸片段。該多核苷酸或核酸片段包括SEQ IDNO1的1699位有腺嘌呤(A)或在SEQ ID NO3的29位有胸腺嘧啶(T)的多態(tài)性位點,和在SEQ ID NO1或3中顯示的超過10個連續(xù)的核苷酸。
文檔編號C12N15/12GK1495191SQ0312727
公開日2004年5月12日 申請日期2003年9月16日 優(yōu)先權日2002年9月16日
發(fā)明者李娟受, 鄭成榮, 安奎定, 金秉俊, 金淑榮, 金美卿 申請人:三星電子株式會社