本發(fā)明屬于生物技術領域,具體涉及一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體及其應用。
背景技術:
轉(zhuǎn)座子(transposon)是指在基因組上能從一個位點轉(zhuǎn)移到另一個位點的一段dna序列。自20世紀40年代美國遺傳學家mcclintock首先在玉米中發(fā)現(xiàn)轉(zhuǎn)座子(ac/ds)以來,科學家們發(fā)現(xiàn)了多種類型的轉(zhuǎn)座子,它們廣泛存在于細菌、酵母和高等動植物中。隨著人們在分子水平上對轉(zhuǎn)座子結構和功能認識的不斷深化,一些轉(zhuǎn)座子已被改造為基因標簽應用于基因分析,并逐漸成為大規(guī)模分離基因的重要手段之一。
mariner-like轉(zhuǎn)座子(mariner-likeelements,mle)是轉(zhuǎn)座子中一個重要家族,最早是在研究毛里塔尼亞果蠅(drosophilamauristiana)白眼基因的一個不穩(wěn)定突變時發(fā)現(xiàn)的。此后在其他動物以及植物基因組中也發(fā)現(xiàn)了大量mle轉(zhuǎn)座子的存在。與其它轉(zhuǎn)座子相比較,mle轉(zhuǎn)座子具有結構簡單、異源轉(zhuǎn)座率高、在基因組插入位點接近隨機等特點,在開發(fā)基因標簽,分離基因,研究基因功能上,遠遠優(yōu)于其他轉(zhuǎn)座子。
mle轉(zhuǎn)座子由兩端反向重復序列(terminalinvertedrepeats,tirs)和編碼轉(zhuǎn)座酶的基因組成,轉(zhuǎn)座酶負責催化轉(zhuǎn)座子轉(zhuǎn)座,因此轉(zhuǎn)座酶的活性是影響轉(zhuǎn)座子的轉(zhuǎn)座頻率的主要因素。然而自然界分離的mle轉(zhuǎn)座酶由于在進化過程中“垂直失活”效應積累了或多或少的突變,部分或全部喪失了催化轉(zhuǎn)座能力,成為低活性或非活性的轉(zhuǎn)座酶,嚴重影響了mle轉(zhuǎn)座子的應用,因此人工構建高活性的轉(zhuǎn)座酶就顯得十分重要。
技術實現(xiàn)要素:
本發(fā)明的目的是提供一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體及其應用,解決了現(xiàn)有自然界分離的mle轉(zhuǎn)座酶催化活性較低或者不具備催化活性的問題。
本發(fā)明提供了一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體,所述的ppmar1轉(zhuǎn)座酶d332s突變體的氨基酸序列如seqidno.1所示。
本發(fā)明還提供了一種編碼所述ppmar1轉(zhuǎn)座酶d332s突變體的基因,編碼所述ppmar1轉(zhuǎn)座酶d332s突變體的基因的核苷酸序列如seqidno.2所示。
本發(fā)明還提供了一種重組質(zhì)粒,所述重組質(zhì)粒攜帶有編碼所述ppmar1轉(zhuǎn)座酶d332s突變體的基因。
本發(fā)明還提供了一種工程菌株,所述工程菌株攜帶有上述重組質(zhì)粒。
本發(fā)明還提供了一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體在構建酵母突變體中的應用。
與現(xiàn)有技術相比,本發(fā)明提供的一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體,具有以下有益效果:
本發(fā)明從毛竹中克隆到的活性轉(zhuǎn)座酶,對其進行人工改造之后獲得較高活性的mle轉(zhuǎn)座酶突變體(ppmar1轉(zhuǎn)座酶d332s突變體),ppmar1轉(zhuǎn)座酶d332s突變體催化轉(zhuǎn)座子轉(zhuǎn)座的活性是野生型轉(zhuǎn)座酶的活性的2.56倍,為利用mle轉(zhuǎn)座子開發(fā)基因標簽奠定了基礎,為后基因組時代大規(guī)模分離和標記基因,研究基因的功能提供了新工具。
具體實施方式
下面結合具體實施方式對本發(fā)明進行詳細說明,但應當理解本發(fā)明的保護范圍并不受具體實施方式的限制。下列實施例中未注明具體條件的試驗方法,通常按照常規(guī)條件操作,如sambrook等主編的《分子克隆實驗指南》中所述條件,或按照試劑盒陳述的步驟進行操作,由于不涉及發(fā)明點,故不對其步驟進行詳細描述。
當實施例給出數(shù)值范圍時,應理解,除非本發(fā)明另有說明,每個數(shù)值范圍的兩個端點以及兩個端點之間任何一個數(shù)值均可選用。除非另外定義,本發(fā)明中使用的所有技術和科學術語與本技術領域技術人員通常理解的意義相同。除實施例中使用的具體方法、設備、材料外,根據(jù)本技術領域的技術人員對現(xiàn)有技術的掌握及本發(fā)明的記載,還可以使用與本發(fā)明實施例中所述的方法、設備、材料相似或等同的現(xiàn)有技術的任何方法、設備和材料來實現(xiàn)本發(fā)明。
一、野生型mle轉(zhuǎn)座酶和去除轉(zhuǎn)座酶的非自主性轉(zhuǎn)座子的獲得
步驟1.1,采集新鮮的毛竹葉片(phyllostachyspubescens,采集于浙江農(nóng)林大學植物園,北緯n30°15′14.67″東經(jīng)e119°43′33.47″),利用ctab法提取毛竹基因組dna,根據(jù)mle轉(zhuǎn)座子tir保守序列設計引物ppmar1-5-3(ppmar1-5-3的序列信息見表1),進行pcr擴增,得到mle轉(zhuǎn)座子擴增產(chǎn)物。
pcr擴增的體系為20μl,包括0.2μlrtaqpolymerase(5u/μl),1μlppmar1-5-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),100ng毛竹基因組dna,加無菌水補齊20μl。
pcr擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
步驟1.2,擴增出序列后,采用takara公司pmdtm18-tvectorcloningkit試劑盒的方法將步驟1.1的mle轉(zhuǎn)座子擴增產(chǎn)物連接到pmd18-t載體,測序確認后,命名為ppmar1轉(zhuǎn)座子,ppmar1轉(zhuǎn)座子全長序列如seqidno.3所示。
步驟1.3,采用qiagen公司的rneasyminikit試劑盒提取毛竹葉片rna,通過invitrogen公司的superscripttmvilotmcdnasynthesiskit試劑盒將rna反轉(zhuǎn)錄為cdna,根據(jù)ppmar1轉(zhuǎn)座酶序列設計一對引物pptpase1-5和pptpase1-3(pptpase1-5和pptpase1-3的序列信息見表1),進行pcr擴增,回收得到ppmar1轉(zhuǎn)座酶擴增產(chǎn)物,即為ppmar1轉(zhuǎn)座酶核苷酸序列。
pcr擴增的體系為20μl,包括0.2μlrtaqpolymerase(5u/μl),0.5μlpptpase1-5(10μmol/l),0.5μlpptpase1-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),10ng毛竹葉片cdna,加無菌水補齊20μl。
pcr擴增的反應條件為:預變性94℃5min;變性94℃30s,55℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
步驟1.4,采用takara公司pmdtm18-tvectorcloningkit試劑盒的方法將步驟1.3的ppmar1轉(zhuǎn)座酶核苷酸序列連接到pmd18-t載體克隆,測序確認,ppmar1轉(zhuǎn)座酶核苷酸序列和相應的氨基酸序列分別如seqidno.4和seqidno.5所示。
將含有ppmar1轉(zhuǎn)座子全長序列的pmd18-t載體用bseri切除ppmar1中間轉(zhuǎn)座酶的大部分序列。
酶切體系為50μl,包括5μl10×buffer,1μlbseri(1u/μl),1μg質(zhì)粒(含有ppmar1全長序列的pmd18-t載體),加無菌水補齊50μl,37℃溫浴6小時?;厥召|(zhì)粒大片段,用t4dnaligase將質(zhì)粒大片段自連接,得到ppmar1的非自主性轉(zhuǎn)座子pmd18-t-ppmar1-tn(tn表示非自主性轉(zhuǎn)座子)。
其中,自連接的體系為10μl,包括1μl10×t4dnaligasebuffer,1μlt4dnaligase(10u/μl),50ng質(zhì)粒大片段,加無菌水補齊10μl,16℃溫浴8小時。
ppmar1的非自主性轉(zhuǎn)座子的序列如seqidno.6所示。
二、酵母轉(zhuǎn)座表達載體的構建
步驟2.1,ppmar1轉(zhuǎn)座酶表達載體的構建
將步驟1.3的ppmar1轉(zhuǎn)座酶核苷酸序列經(jīng)noti和ecorv雙酶切,回收ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段;將pag413-gal-ccdb載體經(jīng)noti和ecorv雙酶切,回收pag413-gal-ccdb載體酶切產(chǎn)物的大片段;且ppmar1轉(zhuǎn)座酶核苷酸序列的雙酶切體系、雙酶切條件與pag413-gal-ccdb載體的雙酶切體系、雙酶切條件均相同;
其中雙酶切體系為50μl,包括5μl10×buffer,1μlnoti(1u/μl),1μlecor(1u/μl),1μg質(zhì)粒(ppmar1轉(zhuǎn)座酶核苷酸序列或者pag413-gal-ccdb載體),加無菌水補齊50μl,雙酶切條件為:37℃溫浴6小時。
將ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段和pag413-gal-ccdb載體酶切產(chǎn)物的大片段相連接;
連接體系為10μl,包括1μl10×t4dnaligasebuffer,1μlt4dnaligase(10u/μl),50ngpag413-gal-ccdb載體酶切產(chǎn)物的大片段,20ngppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段,加無菌水補齊10μl,16℃溫浴8小時。
此時完成了用ppmar1轉(zhuǎn)座酶核苷酸序列替換pag413-gal-ccdb質(zhì)粒中的ccdb核苷酸序列,得到重組質(zhì)粒pag413-gal-tpase(tpase表示轉(zhuǎn)座酶);
該重組質(zhì)粒pag413-gal-tpase即為ppmar1轉(zhuǎn)座酶表達載體,其攜帶有編碼所述ppmar1轉(zhuǎn)座酶的基因。該表達載體具有his(組氨酸)篩選標記,使導入pag413-gal-tpase載體的宿主能夠缺乏his的缺失培養(yǎng)基上生長。
步驟2.2,ppmar1非自主轉(zhuǎn)座子供體載體的構建
以步驟1.4的ppmar1的非自主性轉(zhuǎn)座子pmd18-t-ppmar1-tn為模板,利用ppmar1-5-3引物擴增ppmar1的非自主性轉(zhuǎn)座子,進行pcr擴增,得到ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物。
pcr擴增的體系為20μl,包括0.2μlrtaqpolymerase(5u/μl),1μlppmar1-5-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),10ngpmd18-t-ppmar1-tn,加無菌水補齊20μl。
pcr擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
同時,將載體pwl89a用xhoⅰ酶切(酶切位點位于ade2基因內(nèi)),回收載體pwl89a骨架。酶切體系為50μl,包括5μl10×buffer,1μlxhoⅰ(1u/μl),1μg載體pwl89a,加無菌水補齊50μl,37℃溫浴6小時。
然后用in-fusionadvantagepcrcloningkit(takara公司,日本)將ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物插入到載體pwl89a骨架的ade2基因中,導致報告基因ade2插入失活,得到pwl89a-tn重組質(zhì)粒,即為ppmar1非自主轉(zhuǎn)座子供體載體。若轉(zhuǎn)座子發(fā)生轉(zhuǎn)座從ade2基因上離開,那么ade2基因閱讀框得到回復。該載體具有ura3篩選標記,使導入pwl89a-tn的宿主能夠在缺乏ura(尿素)的缺失培養(yǎng)基上生長。
三、ppmar1轉(zhuǎn)座酶d332s突變體的獲得
將ppmar1轉(zhuǎn)座酶核苷酸序列與其他植物mle轉(zhuǎn)座酶的核苷酸序列進行同源性比對,選取ppmar1轉(zhuǎn)座酶核苷酸序列332位置上的天冬氨酸開展突變,計劃將其突變?yōu)榻z氨酸(d332s)。
步驟3.1,根據(jù)quikchangetmsite-directedmutagenesiskit(stratagene公司,美國)試劑盒說明書,設計定點突變引物d332s-f和d332s-r(d332s-f和d332s-r的序列信息見表1),按照quikchangetmsite-directedmutagenesiskit試劑盒方法,以步驟2.1的重組質(zhì)粒pag413-gal-tpase為模板,利用pfuturbotmdnapolymerase重新合成含有ppmar1轉(zhuǎn)座酶d332s突變體的質(zhì)粒dna;
步驟3.2,然后在合成的質(zhì)粒dna中加入2μl的dpni限制性內(nèi)切酶,于37℃條件下反應5min,將原始模板序列徹底降解。將新合成的質(zhì)粒dna測序確認后得到ppmar1轉(zhuǎn)座酶d332s突變體;
ppmar1轉(zhuǎn)座酶d332s突變體的氨基酸序列如seqidno.1所示,編碼所述ppmar1轉(zhuǎn)座酶d332s突變體的基因的核苷酸序列如seqidno.2所示。
四、轉(zhuǎn)座酶活性的檢測
實驗組是將步驟3.1的含有ppmar1轉(zhuǎn)座酶d332s突變體的質(zhì)粒dna和步驟2.2的pwl89a-tn重組質(zhì)粒,用peg/liac法共同轉(zhuǎn)化到酵母中,用his/ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達,促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。
以野生型ppmar1轉(zhuǎn)座酶為對照組,步驟2.1的帶有野生型的ppmar1轉(zhuǎn)座酶的重組質(zhì)粒pag413-gal-tpase和步驟2.2的pwl89a-tn重組質(zhì)粒,用peg/liac法共同轉(zhuǎn)化到酵母中,用his/ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達,促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。
實驗組和對照組的經(jīng)誘導培養(yǎng)的酵母用缺失his/ura/ade固體培養(yǎng)基上進行選擇培養(yǎng),計算培養(yǎng)基上長出的酵母菌斑。如果轉(zhuǎn)座發(fā)生,pwl89a-tn重組質(zhì)粒上的ade2基因就能表達,因此陽性酵母株能夠在缺乏腺嘌呤的培養(yǎng)基上生長。
以野生型ppmar1轉(zhuǎn)座酶為對照,比較轉(zhuǎn)化有ppmar1轉(zhuǎn)座酶d332s突變體的酵母菌落數(shù)目,篩選出較高活性的轉(zhuǎn)座酶突變株,結果如表2所示。
由表2可知,野生型ppmar1轉(zhuǎn)座酶的陽性酵母菌落數(shù)量明顯小于ppmar1轉(zhuǎn)座酶d332s突變體,且ppmar1轉(zhuǎn)座酶d332s突變體催化轉(zhuǎn)座能力提高到原來的256%。這個高活性人工改造的ppmar1轉(zhuǎn)座酶d332s突變體將為利用ppmar1轉(zhuǎn)座子開發(fā)基因標簽奠定了重要基礎。
表1本發(fā)明應用的引物序列
表2不同轉(zhuǎn)座酶誘導的陽性酵母菌落數(shù)量和催化活性
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領域內(nèi)的技術人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
序列表
<110>浙江農(nóng)林大學
<120>一種具有高催化活性的ppmar1轉(zhuǎn)座酶d332s突變體及其應用
<160>6
<170>patentinversion3.3
<210>1
<211>499
<212>prt
<213>人工序列
<400>1
metalaaspproileaspserglypheaspleuasnvalargleuglu
151015
gluaspaspaspglyasnleupropheaspleuasngluproileleu
202530
gluasphisasnasnglyileaspleuasnleuproleuaspgluphe
354045
glyalavalasppheasptyrvalglnasnleualagluglnaspval
505560
glualaprovalglnvalhisproprolyshisasptyrprogluhis
65707580
valarglysleuvaltyrglnalaleuleumetargserlysasngly
859095
lysleuglyasnhisaspthrthrilevalserserglnpheglyval
100105110
lysileargservalglnargiletrplysglnglylysasnglnleu
115120125
alaglnasnileprovalvalvalalaasnleulyslysglyargser
130135140
glyarglysalathrproleuaspleugluglnleuargasnilepro
145150155160
leulysglnargmetthrilegluaspvalserserargleuglyile
165170175
serlysserargileglnargtyrleulyslysglyleuleuargarg
180185190
hisserserserilelysprotyrleuthraspalaasnlyslysthr
195200205
argleulystrpcysileaspmetilegluglnglyleuvalaspasp
210215220
prolyspheargaspleupheaspphevalpheileaspglulystrp
225230235240
pheasnleuserglnlyssergluargtyrtyrleuleuproaspglu
245250255
aspgluprohisargthrcyslysasnlysasntyrileproargile
260265270
metpheleucysvalcysalaargproargpheargasnglyglucys
275280285
valpheaspglylysileglycyspheproleuvalthrpheglugln
290295300
alaileargglyserglnasnargleuargglygluglnvalilelys
305310315320
proileglnserileasnarggluvalileargserphemetileasn
325330335
argvalleuproalaileargalalystrpproarggluaspvalhis
340345350
lysproilepheileglnglnaspasnvalproserhisleulysval
355360365
aspaspproglnphearggluvalalalysglnaspglypheaspile
370375380
argleuilecysglnproproasnserproasppheasnileleuasp
385390395400
leuglyphepheargalaileglnalaileglntyrlyslysaspala
405410415
lysthrleulysaspleuileproalavalglnglnalapheleuglu
420425430
tyrserprotrplysalaasnargilephevalthrleuglnthrval
435440445
leulysglualametlysilelysglycysasnlysilelysilepro
450455460
hisileglnlysglnargleugluarggluaspargleuproleugln
465470475480
ileprocysglualaserleuleualaglualaleualaserleupro
485490495
alaalaasn
<210>2
<211>1500
<212>dna
<213>人工序列
<400>2
atggctgacccaatagattctggcttcgatctgaacgttcggttagaagaagatgatgac60
ggcaatcttccctttgatctcaacgagccaatattggaagatcacaacaatggaattgat120
ttgaacttgccattagatgagtttggtgccgtcgacttcgactatgtacaaaacctcgct180
gaacaagatgttgaggctcccgttcaagtacaccctccgaagcatgactatcctgaacat240
gttagaaaactagtgtaccaagcattgttgatgagaagcaagaatgggaaactaggcaat300
catgatacaacaattgtttccagtcaatttggagtaaagattcgatcagttcagcgcata360
tggaagcaaggtaaaaaccaacttgctcaaaacattccggtcgtggttgctaatctaaag420
aaaggtagaagtggccgtaaagcaacccctcttgatttggaacaattgcgcaacattcct480
ctcaagcaaagaatgaccatagaagatgtgtctagtagacttggtattagcaaatctagg540
atacaaaggtatttgaaaaagggtttgcttaggcgccactctagtagcataaaaccttac600
ctcaccgatgctaacaagaagactaggttgaagtggtgcattgacatgattgagcaaggt660
ttggttgatgatccaaagttcagggatttgtttgactttgtgtttattgatgagaagtgg720
ttctacctctctcaaaaatccgagagatactacttgctacccgacgaagatgaaccacat780
cgcacttgcaagaacaagaattacatccctaggatcatgtttttgtgtgtttgtgctcgg840
ccaagatttagaaatggagaatgtgtgtttgatggcaaaataggttgttttccactagtc900
acttttgaacaagctattagaggaagccaaaaccgtcttcgtggagaacaagtaatcaag960
ccaattcaatcaattaatagggaagtgataagaagtttcatgataaatagagtgttgcct1020
gcaattagagcaaagtggccaagagaagatgtacacaagccaattttcatacaacaagat1080
aatgttccatctcatttaaaggtggatgatcctcagtttcgtgaggttgctaagcaagat1140
gggtttgacattaggctcatatgtcaaccacccaattctccagattttaacattctagat1200
ttgggtttttttcgagctattcaagcaattcaatacaagaaagatgctaagacattgaaa1260
gatctaattccagcagtccaacaggcatttttggagtactctccatggaaagcaaatagg1320
atatttgtgacactacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaa1380
atcaaaattcctcacatccagaaacaaagacttgagagagaagataggctgccattgcaa1440
atcccttgtgaagcttccttgctagccgaagcacttgcaagccttcctgcagctaattag1500
<210>3
<211>3435
<212>dna
<213>毛竹基因組
<400>3
tactccctccatacccgaaattcctgacgtttaggacatgattgtggtaaccaaggagtg60
attaattaggggttagttttccatctttgcccctaataaatatggttacgggtgctcttt120
gtacgagaaagtaaaccagctcgactggctagcgcgcggaggcctcagtcctgtggtgcg180
cgttcgatacctcgcggacgcaggtttttttcttgttgctgtttattcatttttgcatgg240
cactgtttaggcaacgcacgtcgcgcgcgcttagccgctgcgggcgttagttttcgagtg300
gatttgggcctggcgcacggaggaggttgcatggctgcccgaaaatttcgttgcatgcac360
tggattttcaaaattttgtcctcgcgctgtggaggctcgtttgaggccgcgttttttttc420
atctggcgcgctggaaggccgacgtttggagtgctcgttgcttgttctatttaaacgcct480
ggaaccttccttgttgtcttcctatgccggactcctgtactatggctgacccaatagatt540
ctggcttcgatctgaacgttcggttagaagaagatgatgacggcaatcttccctttgatc600
tcaacgagccaatattggaagatcacaacaatggtaagcaaaaacgtcaaattagtttct660
cagtttctcgtttccttttttctttactgagcttgtcgtttcctttttcgataggaattg720
atttgaacttgccattagatgagtttggtgctgtcgacttcgactatgtacaaaacctcg780
ctggtaagcatggctagtattatgaattcgcttgtttttttatttccttttgctggaaca840
tgccgtgaataatagtattatgaactcgcttgttttttatttccttttactagaacatgt900
gcttgttttattcctatagctagatcatgacgtcaatactttttacgatgaatatgctcg960
ttacagtatagctagaacatgccgtgactacatagtagtatgaatatgcttgttttattt1020
ctataactataacatgccgtgagtatatttagatcatgccgtgagtactaagtactatta1080
aaatgcttgttttttatttccttttgctagaacaagatgttgaggctcccgttcaagtac1140
accctccgaagcatgactatcctgaacatgttagaaaactagtgtaccaagcattgttga1200
tgagaagcaagaatgggaaactaggcaatcatgatacaacaattgtttccagtcaatttg1260
gagtaaagattcgatcagttcagcgcatatggaagcaaggtaaaaaccaacttgctcaaa1320
acattccggtcgtggttgctaatctaaagaaaggtagaagtggccgtaaagcaacccctc1380
ttgatttggaacaattgcgcaacattcctctcaagcaaagaatgaccatagaagatgtgt1440
ctagtagacttggtattagcaaatctaggatacaaaggtatttgaaaaagggtttgctta1500
ggcgccactctagtagcataaaaccttacctcaccgatgctaacaagaagactaggttga1560
agtggtgcattgacatgattgagcaaggtttggttgatgatccaaagttcagggatttgt1620
ttgactttgtgtttattgatgagaagtggttctacctctctcaaaaatccgagagatact1680
acttgctacccgacgaagatgaaccacatcgcacttgcaagaacaagaattacatcccta1740
ggatcatgtttttgtgtgtttgtgctcggccaagatttagaaatggagaatgtgtgtttg1800
atggcaaaataggttgttttccactagtcacttttgaacaagctattagaggaagccaaa1860
accgtcttcgtggagaacaagtaatcaagccaattcaatcaatcaatagggaagtgataa1920
gagatttcatgataaatagagtgttgcctgcaattagagcaaagtggccaagagaagatg1980
tacacaagccaattttcatacaacaagataatgctccatctcatttaaaggtggatgatc2040
ctcagttttgtgaggttgctaagcaagatgggtttgacattaggctcatatgtcaaccac2100
ccaattctccagattttaacattctagatttgggtttttttcgagctattcaagcaattc2160
aatacaagaaagatgctaagacattgaaagatctaattccagcagtccaacaggtaaatg2220
atcatccattacagtgtttaaattgatcttgaacaaataatataatcactgatcttgaac2280
atgttttgtaggcatttttggagtactctccatggaaagcaaataggatatttgtgacac2340
tacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaaatcaaaattcctc2400
acatccagaaacaaagacttgagagagaagataggctgccattgcaaatcccttgtgaag2460
cttccttgctagccgaagcacttgcaagccttcctgcggctaattagaagatgcaagcat2520
gttactcttttgcagcagcaagcatgtaagaagacgcgagcatgttagtagcaaactatg2580
aacaaactagtttatgcatgtagtagtatgttagcttgtgcaccttagtcatctcgtccc2640
aaccgcttgataacatgctcaggaagaagtattgtgtcaccatccatttcaagtttctcc2700
acatcaggaatgtagacctcacaatcaaacttttccatgtcatcgagccacttcgctgtc2760
atgtcgtagtcttcatgtaaaaggccacaacgggcacacatgcgagcttcgcggcgagct2820
tggtagcaggcttctccgaagacgccgccggcgtggaacgtaacacagcgaggacacaga2880
gactcgacggagtcgggatcgacggtgtcgggcaccatctcgagggagtctgcaaccatg2940
tcgacggagtccggcagctcctcgacggagtccggcaccatgtcgacggtgtccggcagc3000
tcctcgacggagtctggcacctcctgcggcgccatgtccacggtgtccagcgacgctatg3060
gagcccgacgagatgtcctgcacggcgacgtccagcgccgcaacggactccgtcgtttcc3120
atctgatccgacgaggcatcgacgtcctgcgacgagcgtggcggcgagagcacggcgagc3180
gggcaggcgagcgggcaggcgagcgagccattcgcgcgagcgatgaatgcgagctgctgt3240
accaggcgcacacacgcgcaatcaatgcgggcgagtaacgatgcgagcatgcgcggcgga3300
agcgcaacagacgggcagcagcgcatggccaggggcaaacgcgtgaaaagaagaccacgc3360
gaggccacaacgtcagcttttgcgcaaacgggcacttcgcctagaacgtcaggaatttcg3420
ggtatggagggagta3435
<210>4
<211>1500
<212>dna
<213>人工序列
<400>4
atggctgacccaatagattctggcttcgatctgaacgttcggttagaagaagatgatgac60
ggcaatcttccctttgatctcaacgagccaatattggaagatcacaacaatggaattgat120
ttgaacttgccattagatgagtttggtgccgtcgacttcgactatgtacaaaacctcgct180
gaacaagatgttgaggctcccgttcaagtacaccctccgaagcatgactatcctgaacat240
gttagaaaactagtgtaccaagcattgttgatgagaagcaagaatgggaaactaggcaat300
catgatacaacaattgtttccagtcaatttggagtaaagattcgatcagttcagcgcata360
tggaagcaaggtaaaaaccaacttgctcaaaacattccggtcgtggttgctaatctaaag420
aaaggtagaagtggccgtaaagcaacccctcttgatttggaacaattgcgcaacattcct480
ctcaagcaaagaatgaccatagaagatgtgtctagtagacttggtattagcaaatctagg540
atacaaaggtatttgaaaaagggtttgcttaggcgccactctagtagcataaaaccttac600
ctcaccgatgctaacaagaagactaggttgaagtggtgcattgacatgattgagcaaggt660
ttggttgatgatccaaagttcagggatttgtttgactttgtgtttattgatgagaagtgg720
ttctacctctctcaaaaatccgagagatactacttgctacccgacgaagatgaaccacat780
cgcacttgcaagaacaagaattacatccctaggatcatgtttttgtgtgtttgtgctcgg840
ccaagatttagaaatggagaatgtgtgtttgatggcaaaataggttgttttccactagtc900
acttttgaacaagctattagaggaagccaaaaccgtcttcgtggagaacaagtaatcaag960
ccaattcaatcaattaatagggaagtgataagagatttcatgataaatagagtgttgcct1020
gcaattagagcaaagtggccaagagaagatgtacacaagccaattttcatacaacaagat1080
aatgttccatctcatttaaaggtggatgatcctcagtttcgtgaggttgctaagcaagat1140
gggtttgacattaggctcatatgtcaaccacccaattctccagattttaacattctagat1200
ttgggtttttttcgagctattcaagcaattcaatacaagaaagatgctaagacattgaaa1260
gatctaattccagcagtccaacaggcatttttggagtactctccatggaaagcaaatagg1320
atatttgtgacactacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaa1380
atcaaaattcctcacatccagaaacaaagacttgagagagaagataggctgccattgcaa1440
atcccttgtgaagcttccttgctagccgaagcacttgcaagccttcctgcagctaattag1500
<210>5
<211>499
<212>prt
<213>人工序列
<400>5
metalaaspproileaspserglypheaspleuasnvalargleuglu
151015
gluaspaspaspglyasnleupropheaspleuasngluproileleu
202530
gluasphisasnasnglyileaspleuasnleuproleuaspgluphe
354045
glyalavalasppheasptyrvalglnasnleualagluglnaspval
505560
glualaprovalglnvalhisproprolyshisasptyrprogluhis
65707580
valarglysleuvaltyrglnalaleuleumetargserlysasngly
859095
lysleuglyasnhisaspthrthrilevalserserglnpheglyval
100105110
lysileargservalglnargiletrplysglnglylysasnglnleu
115120125
alaglnasnileprovalvalvalalaasnleulyslysglyargser
130135140
glyarglysalathrproleuaspleugluglnleuargasnilepro
145150155160
leulysglnargmetthrilegluaspvalserserargleuglyile
165170175
serlysserargileglnargtyrleulyslysglyleuleuargarg
180185190
hisserserserilelysprotyrleuthraspalaasnlyslysthr
195200205
argleulystrpcysileaspmetilegluglnglyleuvalaspasp
210215220
prolyspheargaspleupheaspphevalpheileaspglulystrp
225230235240
phetyrleuserglnlyssergluargtyrtyrleuleuproaspglu
245250255
aspgluprohisargthrcyslysasnlysasntyrileproargile
260265270
metpheleucysvalcysalaargproargpheargasnglyglucys
275280285
valpheaspglylysileglycyspheproleuvalthrpheglugln
290295300
alaileargglyserglnasnargleuargglygluglnvalilelys
305310315320
proileglnserileasnarggluvalileargaspphemetileasn
325330335
argvalleuproalaileargalalystrpproarggluaspvalhis
340345350
lysproilepheileglnglnaspasnvalproserhisleulysval
355360365
aspaspproglnphearggluvalalalysglnaspglypheaspile
370375380
argleuilecysglnproproasnserproasppheasnileleuasp
385390395400
leuglyphepheargalaileglnalaileglntyrlyslysaspala
405410415
lysthrleulysaspleuileproalavalglnglnalapheleuglu
420425430
tyrserprotrplysalaasnargilephevalthrleuglnthrval
435440445
leulysglualametlysilelysglycysasnlysilelysilepro
450455460
hisileglnlysglnargleugluarggluaspargleuproleugln
465470475480
ileprocysglualaserleuleualaglualaleualaserleupro
485490495
alaalaasn
<210>6
<211>779
<212>dna
<213>人工序列
<400>6
tactccctccatacccgaaattcctgacgtttaggacatgattgtggtaaccaaggagtg60
attaattaggggttagttttccatctttgcccctaataaatatggttacgggtgctcttt120
gtacgagaaagtaaaccagctcgactggctagcgcgcggaggcctcagtcctgtggtgcg180
cgttcgatacctcgcggacgcaggtttttttcttgttgctgtttattcatttttgcatgg240
cactgtttaggcaacgcacgtcgcgcgcgcttagccgctgcgggcgttagttttcgagtg300
gatttgggcctggcgcacggaggaggttgcatggctccggcagctcctcgacggagtctg360
gcacctcctgcggcgccatgtccacggtgtccagcgacgctatggagcccgacgagatgt420
cctgcacggcgacgtccagcgccgcaacggactccgtcgtttccatctgatccgacgagg480
catcgacgtcctgcgacgagcgtggcggcgagagcacggcgagcgggcaggcgagcgggc540
aggcgagcgagccattcgcgcgagcgatgaatgcgagctgctgtaccaggcgcacacacg600
cgcaatcaatgcgggcgagtaacgatgcgagcatgcgcggcggaagcgcaacagacgggc660
agcagcgcatggccaggggcaaacgcgtgaaaagaagaccacgcgaggccacaacgtcag720
cttttgcgcaaacgggcacttcgcctagaacgtcaggaatttcgggtatggagggagta779