專利名稱:一個與心臟發(fā)育相關的人類新基因znf382的制作方法
技術領域:
本發(fā)明涉及一種人類新基因,具體是鋅指蛋白家族的人類新基因ZNF382的cDNA全長克隆,及其它在人體心臟胚胎發(fā)育過程中和在其它器官發(fā)育過程中的表達變化。
背景技術:
人類基因組估計有300-700個鋅指蛋白,它們都具有鋅指結構域,而C2H2型占絕大多數,此種鋅指蛋白含有大約28個氨基酸的重復鋅指序列,并由兩個半胱氨酸殘基和兩個組氨酸殘基螯合一個鋅離子構成,此結構域能結合到特異的DNA識別位點,激活或抑制基因的表達(Klug and Rhodes,1987)。有三分之一的C2H2型鋅指蛋白同時具有一個KRAB框,此結構域位于鋅指蛋白的氮末端非鋅指區(qū)域,由A框和B框組成,折疊成α-螺旋參與蛋白質和蛋白質之間的作用,這種作用大部分是通過與轉錄中介因子-TIF1相互作用實現(xiàn)的(Friedman et al.,1996)。研究表明鋅指蛋白在生物發(fā)育過程中充當持家基因或調節(jié)因子的角色,起著多方面的作用。如ZNF174是某些生長因子基因的負調節(jié)子(Williams et al.,1995),AJ18參與骨的發(fā)育(Jheon et al.,2001)。許多鋅指蛋白參與某些腫瘤的形成,如RB基因與視網膜瘤的形成有關(Lee,et al.,1987)。
研究表明許多鋅指蛋白參與心臟的形成和疾病的發(fā)生,如C2C2型的鋅指蛋白GATA4和FOG2(Crispino et al.,2001),在心血管系統(tǒng)出現(xiàn)的鋅指蛋白,有80%是這兩種鋅指蛋白類型-C2H2型和C2C2型,至少有上百個C2H2型鋅指蛋白在心血管系統(tǒng)表達,如HFHZ可能對心臟肥大的病理起重要作用,另外Hsall,WT1,以及TR-alpha-1等C2H2型鋅指蛋白與心臟功能和疾病有關(Daiand Liew,1998)。在模型動物果蠅中,zfh1參與調節(jié)eve基因的表達,控制心臟前體細胞(EPC)的形成,對果蠅心臟的特異分化是必需的(Su et al.,1999)。
發(fā)明內容
本發(fā)明在研究心臟發(fā)育的分子調控機理過程中,從人類早期胚胎心臟cDNA文庫中分離得到一新的KRAB/C2H2型鋅指蛋白-ZNF382,提供了人類新基因ZNF382的全長cDNA序列,并分析了它在成體和幾個不同時期人體胚胎的不同組織的表達水平及其在染色體上的定位,探索其對心臟發(fā)育的功能作用,開發(fā)治療心臟疾病的基因藥物。
本發(fā)明根據鋅指蛋白的KRAB框的氨基酸序列設計兼并引物zls和zlas,以20周的胚胎心臟文庫為模板進行PCR擴增,擴增產物經瓊脂糖凝膠電泳分離,克隆到pUCm-T(SANGON)載體,轉化的克隆子任意挑選測序,把所得的序列用Blastn去搜索dbEST發(fā)現(xiàn)是EST H30708的部分序列,把EST H30708用blastn nr去搜索Genbank,發(fā)現(xiàn)H30708屬于一個新基因,再用該新基因去搜索dbEST,發(fā)現(xiàn)許多EST包括AI902783,AI902802,AI902800,H30708,BF477956,AA781941,H97563,BM973530都屬于該新基因,我們根據EST H30708和EST H97563設計一對基因特異引物E1s和E1a,以20周的胚胎心臟文庫為模板進行PCR擴增,得到一特異帶,經測序此片段長1606bp,是該基因的部分序列(圖2)。再以心臟文庫為模板,分別用兩對引物GSP1/UPM,NGSP1/NUP進行5`-RACE和GSP2/UPM,NGSP2/NUP進行3`-RACE快速擴增末端,其中GSP1/NGSP1,GSP2/NGSP2是設計的基因特異引物,UPM和NUP由SMART RACE試劑盒提供的,RACE反應分別得到了416bp和960bp的目的片段,經T-載體克隆、測序,為該基因的5`端和3`端,經拼接,共2824bp(圖1),經國際命名委員會(HUGOGene Nomenclature Committee)命名為ZNF382。
ZNF382屬于KRAB/C2H2型鋅指蛋白,該基因全長為2824bp,編碼548個氨基酸,大約60kD,起始密碼子ATG開始于核苷酸114,終止密碼子TAA在核苷酸1760的位置,在3`未翻譯區(qū)的核苷酸2781-2787的位置有一個加尾信號AATAAA,SAMRT程序分析表明ZNF382在N-末端含一個KRAB框,在C-末端有一個未成形的鋅指結構(VZF)和9個重復的鋅指(ZF)。中間大約有144個氨基酸連接KRAB和鋅指,大部分鋅指與鋅指之間都有一個同源序列TGEKPY,屬于典型的KRAB/C2H2亞家族。9個鋅指都具有鋅指結構共有序列CX2CX3FX5LX2HX3H(X是任意一個氨基酸)的特征,在VZF和ZF1之間有一個核定位信號(NLS)-KKPSAYNKYGKFLCRK。
用DNASTAR程序的CLUSTAL分析其與鋅指蛋白家族的其它鋅指蛋白的同源發(fā)現(xiàn),ZNF382與小鼠的KS1同源度達73%,特別是在KRAB和鋅指結構區(qū)同源度分別為91%和83%(見圖3)。而研究表明KS1可能是一個重要的抑癌基因(Gebelein et al.,1998),同樣它與另外一個重要的視網膜瘤RB相關基因-RBak有較高的同源度,達44%。
用全長cDNA檢索GenBank的Blastn nr,發(fā)現(xiàn)BAC CTD-3234P18(AC074138)上包含了該基因,ZNF382在基因組上囊括了共約23kb長,有5個外顯子和4個內含子,KRAB框的A框和B框分別由外顯子3和4編碼,而所有的鋅指結構和3`非編碼區(qū)都由外顯子5編碼,根據BACCTD-3234P18的定位,可知ZNF382定位于19q13.13。ZNF382的基因序列已遞交到GenBank,受理號為AF513816。
進行8種正常成人組織mRNA的Northern雜交分析,結果表明,ZNF382mRNA只局限于在心臟和骨骼肌表達,而且在心臟的表達水平大大高于在骨骼肌的表達水平,基因的大小約2.9kb(見圖4A),此結果表明ZNF382在成體的表達具有細胞特異性,可能對心臟的晚期發(fā)育和功能發(fā)揮起重要作用。
進行15周,18周,20周,23周的人體胚胎各種組織總RNA膜的Northern雜交分析,結果表明該基因在人體不同發(fā)育時期的胚胎的表達情況與在成體的表達情況大不相同,ZNF382 mRNA在胚胎時期廣泛表達(見圖4B-4E),其在小腦,腎,和大腦表達最強,在肺,心臟,骨骼肌,舌,和腎上腺表達相對較弱,在上述四個胚胎時期,在不同組織的表達水平基本沒有什么變化。用更早時期的總胚胎組織進行Northern雜交分析,結果表明ZNF382至少在受精34天以前就開始表達(見圖4F),此表達水平比任何一個檢測過的更晚時期胚胎的單一組織表達水平要高。說明ZNF382可能對人類早期胚胎的分化起重要作用,可能作為轉錄因子參與胚胎的形成。
本發(fā)明的優(yōu)點1、提供了一個人類新基因ZNF382基因的全長cDNA序列,并描述了其編碼的蛋白產物與重要基因KS1和RBaK的同源性,證明了該基因是鋅指蛋白基因家族KRAB/C2H2亞家族的成員之一,很可能是一個非常重要的基因。
2、該基因編碼的蛋白產物為鋅指蛋白,是一種轉錄調控因子,并且在人類成體組織大量限制在心臟表達,有可能成為心臟疾病治療的基因工程藥物。
3、該基因在胚胎發(fā)育34天就檢測到強表達水平,說明該基因作為轉錄因子在發(fā)育早期起著很重要的作用,可能參與胚胎的形成。
本發(fā)明通過以下附圖和實施例作進一步闡述,但并不限制本發(fā)明的范圍。
圖1.ZNF382 cDNA的核苷酸序列和編碼的氨基酸序列圖2.ZNF382 的內部分核苷酸序列。
圖3.ZNF382 的氨基酸與小鼠KS1氨基酸的同源比較A ZNF382與小鼠KS1蛋白質的氨基酸同源比較,黑色陰影部分表示氨基酸同源B人類ZNF382基因的蛋白質示意圖及其和小鼠KS1的同源百分比圖4.ZNF382在人類組織的Northern雜交A,B,C,D,E分別為成人組織,15周,18周,20周,23周胚胎組織的Northern雜交結果,F(xiàn)為34天和40天胚胎組織的Northern雜交結果。圖中1肝 2腸 3 腎上腺 4心臟 5肺 6腦 6’大腦 6”小腦 7舌 8腎 9骨骼肌 10胃 11脾 12胰腺 13胎盤 14 34天胚胎組織 15 40天胚胎組織
具體實施例方式實施例1 兼并引物進行PCR擴增篩選新基因利用鋅指蛋白的KRAB框設計兼并引物Zlssense5′-GTNACNTTMMGNGAMGTNGCNGTZlas antisense5′-CCANGGMTCMTCNCCMTGMTCNAGPCR反應以心臟cDNA文庫為模板,使用標準的反應程序,擴增的帶,進行T-載體連接,轉化,任意挑選轉化子去測序。測序結果去進行dbEST檢索,發(fā)現(xiàn)該片段是EST H30708的部分片段,用此EST進行Blastn nr檢索得到一新基因,再進行dbEST檢索。
根據EST H30708和H97563設計引物Els sense5′-CGCAAGTTGGAACAAGGAGAAElasantisense5′-CAGGCTGGCAAACAGTAGGTT以心臟文庫為模板進行PCR擴增,PCR產物經純化,T-載體連接,轉化,測序,得到了該基因的部分序列,長共1606bp(見圖2)。
實施例2 ZNF382全長cDNA的克隆和測序以檢索獲得的cDNA序列設計RACE引物GSP1antisense5′-CTGGAGCTTGAACCTTCTGATGCTG-3′NGSP1 antisense5′-GAGGGGTCTAGAATGCCTGTCTTGG-3′GSP2sense5′-GCCAGAAGGCAATCCTCACTGTTCA-3′NGSP2 sense5′-GGTAACCTACTGTTTGCCAGCCTGT-3′利用CLONTECH公司的SMART RACE試劑盒,取心臟mRNA 5ug為膜板做5′端和 3′端RACE PCR。CLONTECH公司提供的引物MUP5′-CTAATACGACTCACTATAGGGCAAGCAGTGGTATCAACGCAGAGT-3′5′-CTAATACGACTCACTATAGGGC-3′NUP5′-AAGCAGTGGTATCAACGCAGAGT-3′具體操作按該公司protocol進行。將RACE產物克隆入T載體并測序獲得ZNF382的5`端和3`端序列。
實施例3 Northern雜交1.組織總RNA的提取(按王雁云,羅開梅等,一種快速的總RNA提取方法,生命科學研究,5(1)88-90(2001)進行)。
2.總RNA的電泳及轉膜,均按《現(xiàn)代分子生物學實驗技術》介紹的方法進行(盧圣棟主編,第二版)。
3.Northern雜交將從CLONTECH公司買的成人組織mRNA膜和轉有20ug人體胚胎多種組織以及總胚胎組織的總RNA的尼龍膜,放入培養(yǎng)皿中,加入變性10ml68℃預熱的快速雜交液(Clontech公司),68℃預雜交30分鐘,加入同位素標記的ZNF382的變性cDNA片段,68℃雜交過夜。用2×SSC,0.05%SDS,65℃洗膜兩次,15分鐘/次。0.1×SSC,0.1%SDS,65℃洗膜兩次,15分鐘/次。
4.-80℃曝光幾天,洗X光片。
5.用0.1×SSC和0.5%SDS在95℃洗10分鐘,膜用β-actin cDNA探針重新標記,做Northern雜交進行陽性對照。
權利要求
1.一個與心臟發(fā)育相關的人類新基因ZNF382,其特征在于該人類新基因ZNF382的cDNA核苷酸序列與編碼氨基酸序列如下gactcaccct gggccggggg tgaggcttgg actgtttctt tttccaaaag 50aggagctcaa aagagaaagt tcatctagaa atctcaaagc catgtctcag 100gatgaactag agt 113atg ccc tta cag gga tca gtg tca ttc aag gat gtg act gtg gac 158Met Pro Leu Gln Gly Ser Val Ser Phe Lys Asp Val Thr Val Asp1 5 10 15ttc acc cag gag gag tgg cag caa cta gac cct gct cag aag gcg 203Phe Thr Gln Glu Glu Trp Gln Gln Leu Asp Pro Ala Gln Lys Ala20 25 30ctt tac agg gat gtg atg ttg gaa aac tat tgc cac ttc gta tct 248Leu Tyr Arg Asp Val Met Leu Glu Asn Tyr Cys His Phe Val Set35 40 45gtg ggg ttt cac atg gct aag cct gat atg atc cgc aag ttg gaa 293Val Gly Phe His Met Ala Lys Pro Asp Met Ile Arg Lys Leu Glu50 55 60caa gga gaa gag cta tgg aca cag aga att ttt cca agt tac agc 338Gln Gly Glu Glu Leu Trp Thr Gln Arg Ile Phe Pro Ser Tyr Ser65 70 75tac cta gaa gaa gat ggg aaa act gaa gat gtc tta gtg aag ttc 383Tyr Leu Glu Glu Asp Gly Lys Thr Glu Asp Val Leu Val Lys Phe80 85 90aaa gaa tac caa gac agg cat tct aga ccc ctc ata ttc atc aac 428Lys Glu Tyr Gln Asp Arg His Ser Arg Pro Leu Ile Phe Ile Asn95 100 105cac aaa aaa cta att aag gag aga agt aat att tat ggt aaa aca 473His Lys Lys Leu Ile Lys Glu Arg Ser Asn Ile Tyr Gly Lys Thr110 115 120ttt act cta ggc aag aac cgt att aca ata cta tgt gaa tat aaa 518Phe Thr Leu Gly Lys Asn Arg Ile Thr Ile Leu Cys Glu Tyr Lys125 130 135cct gat gga aaa gtt tLg aaa aat att tca gaa cta gtc att aga 563Pro Asp Gly Lys Val Leu Lys Asn Ile Ser Glu Leu Val Ile Arg140 145 150aat ata agc ccc ata aaa gag aag ttt ggt gac agt act gga tgg 608Asn Ile Ser Pro Ile Lys Glu Lys Phe Gly Asp Ser Thr Gly Trp155 160 165gag aaa tca ctc ctc aat acc aag cat gag aaa att cat cct gca 653Glu Lys Ser Leu Leu Asn Thr Lys His Glu Lys Ile His Pro Ala170 175 180gtg aat ctc cat aaa caa aca gaa aga gtt ctc agt ggt aaa cag 698Val Asn Leu His Lys Gln Thr Glu Arg Val Leu Ser Gly Lys Gln185 190 195gag ctt att cag cat cag aag gtt caa gct cca gag caa cca ttt 743Glu Leu Ile Gln His Gln Lys Val Gln Ala Pro Glu Gln Pro Phe200 205 210gac cat aat gaa tgt gaa aaa tcc ttc ctg atg aaa gga atg cta 788Asp His Asn Glu Cys Glu Lys Ser Phe Leu Met Lys Gly Met Leu215 220 225ttt aca cat act aga gct cac aga gga gaa aga acc ttt gaa tac 833Phe Thr His Thr Arg Ala His Arg Gly Glu Arg Thr Phe Glu Tyr230 235 240aat aaa gat gga att gcc ttc ata gaa aag tca agc ctc agt gtc 878Asn Lys Asp Gly Ile Ala Phe Ile Glu Lys Ser Ser Leu Ser Val245 250 255cat cca agt aat ctt atg gaa aag aag ccc tct gcc tac aac aaa 923His Pro Ser Asn Leu Met Glu Lys Lys Pro Ser Ala Tyr Asn Lys260 265 270tat ggg aaa ttc ctc tgc aga aag cct gtt ttt att atg cct cag 968Tyr Gly Lys Phe Leu Cys Arg Lys Pro Val Phe Ile Met Pro Gln275 280 285aga cct caa aca gaa gag aaa ccc ttt cac tgt cct tac tgt ggg 1013Arg Pro Gln Thr Glu Glu Lys Pro Phe His Cys Pro Tyr Cys Gly290 295 300aat aac ttt aga agg aag tca tac ctc att gaa cat cag cga att 1058Asn Asn Phe Arg Arg Lys Ser Tyr Leu Ile Glu His Gln Arg Ile305 310 315cac aca ggt gaa aaa cct tat gtt tgc aat caa tgt gga aag gcc 1103His Thr Gly Glu Lys Pro Tyr Val Cys Asn Gln Cys Gly Lys Ala320 325 330ttc cgt cag aag aca gcc ctc acc ctt cat gag aaa aca cat ata 1148Phe Arg Gln Lys Thr Ala Leu Thr Leu His Glu Lys Thr His Ile335 340 345gag ggg aaa ccc ttt att tgt atc gat tgt ggg aag tcc ttc cgc 1193Glu Gly Lys Pro Phe Ile Cys Ile Asp Cys Gly Lys Ser Phe Arg350 355 360cag aag gcc acc ctc act aga cat cac aaa aca cat acg ggg gag 1238Gln Lys Ala Thr Leu Thr Arg His His Lys Thr His Thr Gly Glu365 370 375aaa gcc tat gaa tgt cct cag tgt gga agt gcc ttt agg aag aag 1283Lys Ala Tyr Glu Cys Pro Gln Cys Gly Ser Ala Phe Arg Lys Lys380 385 390tca tac ctc att gat cac cag aga act cac aca gga gag aaa ccg 1328Ser Tyr Leu Ile Asp His Gln Arg Thr His Thr Gly Glu Lys Pro395 400 405tat cag tgt aat gag tgt ggg aag gca ttt atc cag aag aca acc 1373Tyr Gln Cys Asn Glu Cys Gly Lys Ala Phe Ile Gln Lys Thr Thr410 415 420ctc act gtt cat cag aga act cac aca gga gag aaa ccc tat att 1418Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Ile425 430 435tgc aat gaa tgt ggg aag tcc ttc tgc caa aag aca acc ctc act 1463Cys Asn Glu Cys Gly Lys Ser Phe Cys Gln Lys Thr Thr Leu Thr440 445 450ctc cac cag aga att cac acg ggg gaa aaa ccc tat att tgt aat 1508Leu His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Asn455 460 465gaa tgt ggg aag tcc ttc cgc cag aag gca atc ctc act gtt cat 1553Glu Cys Gly Lys Ser Phe Arg Gln Lys Ala Ile Leu Thr Val His470 475 480cac aga ata cat aca gga gaa aaa tcc aat ggg tgt cct cag tgt 1598His Arg Ile His Thr Gly Glu Lys Ser Asn Gly Cys Pro Gln Cys485 490 495ggg aaa gcc ttc agt agg aaa tca aac ctc att cgc cat cag aaa 1643Gly Lys Ala Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Lys500 505 510act cac aca ggc gag aaa cca tat gaa tgt aaa cag tgt ggg aag 1688Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Lys Gln Cys Gly Lys515 520 525ttc ttc agt tgt aag tca aac ctc att gtc cat cag aaa act cac 1733Phe Phe Ser Cys Lys Ser Asn Leu Ile Val His Gln Lys Thr His530 535 540aag gta gaa acc acg gga att cag taa 1760Lys Val Glu Thr Thr Gly Ile Gln *545gtaatgtggc tttttttgta aaaaaatgtt aagtcatagt aaaccctgta 1810gatgatgttg cttgcaagcg taatatccaa cagtttaagg tactatacca 1860catggtaacc tactgtttgc cagcctgtaa aacacacaca cacacacaca 1910cacacacaca aatattatta gacaaattag atgacaaaaa tcattaagaa 1960gtccaaactt tttttttatt actagcttca gcagacaaaa acttcctctg 2010tcaaggtgtt ataaacattt aaaatcacat tttccatttc catacatatc 2060tttttgttca tcagtaataa ctagttggcc aactgactgt ggtccatgga 2110ctacacagtg agtagaggtt ctttaaaaga aggaggtatg aactgtattt 2160ctcattgcaa atacaaaata aaaattagtt gttacctcct cacagttgac 2210catgattctg acttctaaca ttacaaatta gtttttacta ttataaacct 2260ttctataaat tggattatat atcatgtatt ctttcatata cagcttatta 2310ccttcatcat gtccgtgagt ctaatcatta gtacgtgtgg cagaagttta 2360tttattttta tccagtatag aattcaatta tatgattata tcacaattta 2410tccattctgc tgttgatgga cttttacatt gtttacagct tagggtcata 2460ataaatcatg cttctgagaa catacttgtc ttggtgtaca tacatgtatt 2510tctcttgtgt atatacttag gagtggaatc gctgggtctt agagcatgtg 2560tgtattcagt cagatactgg cagacaattc agaactttca ccacatgaga 2610taattgacac tgaagggaaa cagctataaa ttttatcaat atggtgctgg 2660ttcaaaccag agaattcatg ctgcagggaa actcaatcaa tgttattgtg 2710aaaactggga atgtgaatgt aatatatgta gaaaaacatt tagccacagc 2760ccaaatcttc caggcaaatg taataaacgt gacattgccg ttagccaaaa 2810aaaaaaaaaa aaaa 282全文摘要
一個與心臟發(fā)育相關的人類新基因ZNF382涉及鋅指蛋白家族的人類基因。本發(fā)明與心臟發(fā)育相關的人類基因ZNF382,它的cDNA全長2824bp,編碼548個氨基酸,約60KD,起始密碼子ATG始于核苷酸114,終止密碼子TAA在核苷酸1760位置,ZNF382定位于19q13.13,ZNF382mRNA只局限在心臟和骨骼肌表達,而且在心臟的表達水平大大高于在骨骼肌的表達水平,表明ZNF382對心臟的晚期發(fā)育和功能發(fā)揮起重要作用,可能成為治療心臟疾病的基因藥物。
文檔編號C12N15/12GK1439719SQ02114359
公開日2003年9月3日 申請日期2002年8月26日 優(yōu)先權日2002年8月26日
發(fā)明者吳秀山, 王躍群, 羅開梅, 袁婺洲, 李永青, 朱傳炳 申請人:湖南師范大學