本發(fā)明屬于生物技術(shù)領(lǐng)域,涉及一種可編程的多位點(diǎn)特異性的轉(zhuǎn)錄抑制系統(tǒng)及其應(yīng)用。
背景技術(shù):
可編程的位點(diǎn)特異性的基因調(diào)控元件在全基因組層次的基因功能研究、代謝通路調(diào)控以及人工基因線路設(shè)計(jì)中均發(fā)揮重要作用。目前,研究人員已經(jīng)開發(fā)了諸多可編程的基因調(diào)控元件,包括rnai(rnainterference)、工程化的dna結(jié)合蛋白(如鋅指蛋白zfp(zinc-fingerprotein)、轉(zhuǎn)錄激活樣效應(yīng)蛋白tale(transcription-activator-likeeffectorprotein)和基于crispr-cas系統(tǒng)的crispri。其中rnai介導(dǎo)的基因敲低技術(shù)特異性較低且受作用機(jī)體限制,而基于dna結(jié)合蛋白的調(diào)控技術(shù),比如鋅指蛋白zfp及轉(zhuǎn)錄激活樣效應(yīng)蛋白tale,在對(duì)特定位點(diǎn)進(jìn)行調(diào)控時(shí),需要對(duì)蛋白質(zhì)序列進(jìn)行重新設(shè)計(jì),且得到的蛋白不一定具有良好的特異性,因而限制了其廣泛應(yīng)用。目前以ⅱ型crispr-cas9系統(tǒng)為基礎(chǔ)的crispri技術(shù)應(yīng)用最為廣泛,該技術(shù)系統(tǒng)中包含一個(gè)dcas9及一個(gè)工程化的sgrna,對(duì)基因的特定位點(diǎn)進(jìn)行調(diào)控時(shí),只需要改變sgrna中20bp的序列,而不要對(duì)蛋白序列做任何改變。盡管如此,該系統(tǒng)也存在一定問題,如多位點(diǎn)調(diào)控時(shí)sgrna表達(dá)問題。而近期報(bào)道的ⅴ-a型crispr-cpf1系統(tǒng),與crispr-cas9系統(tǒng)相比,具有明顯優(yōu)勢(shì)。首先,cpf1在天然狀態(tài)下由單個(gè)rna引導(dǎo),而cas9在天然狀態(tài)下由兩個(gè)rna(tracrrna-crrna)引導(dǎo);其次,cpf1蛋白除具有dna切割酶活性外,還具有加工自身前體rna(pre-rna)的rna酶活性,而cas9只具有dna切割酶活性,加工自身前體rna時(shí)需要rnaseⅲ的參與;再者,與crispr-cas9系統(tǒng)相比,該系統(tǒng)還具有更低的脫靶率,是除crispr-cas9之外非常具有前景的基因組工程技術(shù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種可編程的多位點(diǎn)特異性的轉(zhuǎn)錄抑制系統(tǒng)及其應(yīng)用。
本發(fā)明所提供的可編程的多位點(diǎn)特異性的轉(zhuǎn)錄抑制系統(tǒng),可來自于crispr-cpf1系統(tǒng),具體可包括如下(a)和(b):
(a)位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白,或者能夠表達(dá)所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白的dna環(huán)狀質(zhì)粒或dna線性片段或體外轉(zhuǎn)錄的rna或mrna;
所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白為將來自于弗朗西斯菌(francisellanovicida)u112的cpf1蛋白的第917位氨基酸由天冬氨酸突變?yōu)楸彼?d917a)后得到的蛋白;
(b)靶向多個(gè)位點(diǎn)的可編程sgrna,或者能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna的dna環(huán)狀質(zhì)?;騞na線性片段;
所述靶向多個(gè)位點(diǎn)的可編程sgrna,由19-36nt的重復(fù)序列以及可變的16-31nt的間隔序列自5’端到3’端依次交替排列構(gòu)成。
其中,所述間隔序列為與預(yù)進(jìn)行轉(zhuǎn)錄抑制的目的基因的靶標(biāo)序列相結(jié)合的序列。對(duì)特定位點(diǎn)進(jìn)行基因調(diào)控時(shí),只需要改變所述靶向多個(gè)位點(diǎn)的可編程sgrna中的所述間隔序列。
更加具體的,所述轉(zhuǎn)錄抑制系統(tǒng)可為如下(a)或(b)或(c):
(a)由所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白和所述靶向多個(gè)位點(diǎn)的可編程sgrna組成;
(b)由既能夠表達(dá)所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白也能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna的dna環(huán)狀質(zhì)?;騞na線性片段組成;
(c)由能夠表達(dá)所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白的dna環(huán)狀質(zhì)?;騞na線性片段或體外轉(zhuǎn)錄的rna或mrna,以及能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna的dna環(huán)狀質(zhì)粒或dna線性片段組成。
進(jìn)一步,在所述靶向多個(gè)位點(diǎn)的可編程sgrna中,所述重復(fù)序列的長(zhǎng)度最好為19nt。所述間隔序列的長(zhǎng)度最好為18-20nt。
其中,所述重復(fù)序列為來自于弗朗西斯菌(francisellanovicida)u112的sgrna的重復(fù)序列。
具體的,所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白的氨基酸序列具體如序列表中序列1所示。所述靶向多個(gè)位點(diǎn)的可編程sgrna中,所述重復(fù)序列為至少含有序列表中序列2自3’末端起的19個(gè)核苷酸,并且從序列2自3’末端起的第20個(gè)核苷酸起沿著序列2向5’端延長(zhǎng),得到的長(zhǎng)度為19-36nt的單鏈rna。
在本發(fā)明中,所述可編程的多位點(diǎn)特異性的轉(zhuǎn)錄抑制系統(tǒng)具體由能夠表達(dá)所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白的dna環(huán)狀質(zhì)粒,以及能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna的dna環(huán)狀質(zhì)粒組成。其中,所述“能夠表達(dá)所述位點(diǎn)特異性轉(zhuǎn)錄抑制蛋白的dna環(huán)狀質(zhì)?!睘閒ndcpf1表達(dá)質(zhì)粒,所述fndcpf1表達(dá)質(zhì)粒的全序列如序列表中序列3所示。所述“能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna的dna環(huán)狀質(zhì)粒”是將fnsgrna_bcb質(zhì)粒兩個(gè)酶切位點(diǎn)bsmbi之間的片段替換為能夠轉(zhuǎn)錄所述靶向多個(gè)位點(diǎn)的可編程sgrna對(duì)應(yīng)的dna序列后得到的重組質(zhì)粒;所述fnsgrna_bcb質(zhì)粒的全序列如序列表中序列4所示。
所述轉(zhuǎn)錄抑制系統(tǒng)在抑制目的基因轉(zhuǎn)錄中的應(yīng)用也屬于本發(fā)明的保護(hù)范圍。
利用所述轉(zhuǎn)錄抑制系統(tǒng)抑制所述目的基因轉(zhuǎn)錄的過程中,最好以所述目的基因中符合如下條件的序列作為pam序列:3’末端的堿基為a或c或g,5’端富含堿基t的序列。
所述pam序列的長(zhǎng)度最好為4-6bp。進(jìn)一步,所述pam序列最好為5′-tttttv-3′、5′-ttttv-3′或5′-tttv-3′;其中,v為a或c或g。
另外,crispr-cpf1系統(tǒng)在制備用于抑制靶標(biāo)基因轉(zhuǎn)錄的系統(tǒng)中的應(yīng)用也屬于本發(fā)明的保護(hù)范圍。其中,所述crispr-cpf1系統(tǒng)中的cpf1蛋白為將來自于弗朗西斯菌(francisellanovicida)u112的cpf1蛋白的第917位氨基酸由天冬氨酸突變?yōu)楸彼岷蟮玫降牡鞍住?/p>
本發(fā)明比較了francisellanovicidau112cpf1(fncpf1)的三種dnase失活突變體,fncpf1(d917a),fncpf1(e1006a),fncpf1(d917a,e1006a)作為位點(diǎn)特異性基因調(diào)控蛋白的作用,并選擇較優(yōu)的突變體d917a,優(yōu)化了多位點(diǎn)sgrna設(shè)計(jì)及pam序列選擇,最終獲得了具有高效的、位點(diǎn)特異性的、且可同時(shí)靶向多個(gè)位點(diǎn)的基因轉(zhuǎn)錄調(diào)控工具。
附圖說明
圖1為三個(gè)質(zhì)粒的組成示意圖。a:fndcpf1表達(dá)質(zhì)粒;b:報(bào)告質(zhì)粒;c:sgrna表達(dá)質(zhì)粒;d:fnsgrna_bcb示意圖及作用于不同位點(diǎn)的sgrna的構(gòu)建方法。
圖2為fndcpf1不同突變位點(diǎn)對(duì)抑制作用的影響。a:三種突變體在啟動(dòng)子區(qū)ntp1位置上的抑制作用曲線,其中fnd1_ntp1、fnd2_ntp1、fnd12_ntp1分別對(duì)應(yīng)d917a、e1006a、(d917a,e1006a)的突變體;陽性對(duì)照p,即不含有sgrna,但含有fndcpf1及報(bào)告質(zhì)粒的菌株;陰性對(duì)照n,即不含有報(bào)告質(zhì)粒,但含有fndcpf1及sgrna質(zhì)粒的菌。該實(shí)驗(yàn)中iptg的濃度為:0,7.8125,31.25,62.5,125,250,500,2000μm;(因?yàn)閳D為對(duì)數(shù)軸,橫坐標(biāo)無法顯示0,所以圖中橫坐標(biāo)1μmiptg濃度下的熒光值實(shí)際對(duì)應(yīng)0μmiptg濃度下的數(shù)值);b:三種突變體在ntp1位點(diǎn)的抑制倍數(shù),即iptg濃度為0μm時(shí)的熒光值與iptg濃度為2000μm時(shí)的比值,fnd1(d917a)的抑制倍數(shù)約為85倍,fnd2(e1006a)的抑制倍數(shù)約為47倍,fnd12(d917a,e1006a)的抑制倍數(shù)約為17倍。
圖3為sgrna靶序列長(zhǎng)度對(duì)fndcpf1抑制作用的影響。a:sgrna作用于編碼區(qū)模板鏈上,序列長(zhǎng)度分別為14-25nt(逐個(gè)堿基增加)及27nt、29nt、31nt;b:fndcpf1在不同sgrna靶序列長(zhǎng)度下的抑制倍數(shù)(即iptg濃度為0μm時(shí)的熒光值與iptg濃度為100μm時(shí)的比值),其中長(zhǎng)度為14、15nt時(shí)抑制倍數(shù)最低在10-20倍之間,大于15nt時(shí),抑制倍數(shù)明顯提高,在18、19、20nt時(shí)抑制倍數(shù)達(dá)到最高。
圖4為sgrna為t1時(shí)不同重復(fù)序列長(zhǎng)度對(duì)其抑制作用的影響。a:sgrna為t1,其中repeat序列長(zhǎng)度變化示意圖;b:t1中重復(fù)序列長(zhǎng)度為16、18nt時(shí),幾乎無抑制作用,重復(fù)序列長(zhǎng)度為19nt及大于19nt時(shí),抑制倍數(shù)(即iptg濃度為0μm時(shí)的熒光值與iptg濃度為100μm時(shí)的比值)差異不大。
圖5為fndcpf1同時(shí)作用于編碼區(qū)多個(gè)位點(diǎn)的抑制作用。a:sgrnat1、t12、t123的構(gòu)建形式;b:fndcpf1在sgrna為t1、t12、t123時(shí)的抑制作用曲線;c:fndcpf1在sgrna為t1、t12、t123時(shí)的抑制倍數(shù),分別約為67倍、119倍、283倍;該實(shí)驗(yàn)中iptg的濃度為:0,7.8125,31.25,62.5,125,250,500,2000μm;抑制倍數(shù),即iptg濃度為0μm時(shí)的熒光值與iptg濃度為2000μm時(shí)的比值。
圖6為測(cè)試系統(tǒng)中的報(bào)告質(zhì)粒設(shè)計(jì)。sgrna靶向位點(diǎn)位于riboj及啟動(dòng)子之間,nnnnnn表示pam序列。
圖7為pam序列富集方法流程圖。
圖8為fndcpf1在不同pam序列下的抑制作用。fndcpf1在不同pam序列下的抑制作用,橫坐標(biāo)為不同pam序列的編碼,對(duì)應(yīng)的pam序列見表5,縱坐標(biāo)為不同pam序列的菌株在20μmiptg誘導(dǎo)下對(duì)應(yīng)的熒光值。
圖9為pam序列3′位堿基偏好性分析。a:數(shù)據(jù)中pam序列特征為5′-tttttn-3′的抑制作用比較,框內(nèi)為最后一個(gè)堿基為t的pam序列;b:數(shù)據(jù)中pam序列特征為5′-ttttn-3′的抑制作用比較;c:數(shù)據(jù)中pam序列特征為5′-tttn-3′的抑制作用比較;d:數(shù)據(jù)中pam序列特征為5′-ttn-3′的抑制作用比較。
具體實(shí)施方式
下述實(shí)施例中所使用的實(shí)驗(yàn)方法如無特殊說明,均為常規(guī)方法。
下述實(shí)施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
(1)luria-bertani(lb)液體培養(yǎng)基:蛋白胨(fisherscientific)10g/l;nacl(fisherscientific)10g/l;酵母粉(fisherscientific)5g/l。121℃高壓滅菌20min。
(2)lb固體培養(yǎng)基:與lb液體培養(yǎng)基的配方相同,添加1.5%瓊脂粉。
(3)補(bǔ)充有鹽的m9基本培養(yǎng)基:na2po4(sigma)6.8g/l;kh2po4(sigma)3g/l;nacl(sigma)0.5g/l;nh4cl(sigma)1g/l;mgso4(fisherscientific)2mm;cacl2(sigma)100μm;葡萄糖(sigma)0.4%;酪蛋白氨基酸(acros)0.2%。
(4)氯霉素(acros):溶于lb或m9培養(yǎng)基,終濃度20μg/ml。
(5)氨芐青霉素(acros):溶于lb或m9培養(yǎng)基,終濃度25μg/ml。
(6)卡那霉素(acros):溶于lb或m9培養(yǎng)基,終濃度50μg/ml。
(7)異丙基-β-d-1-硫代半乳糖苷(iptg)(usbcorporation)儲(chǔ)液濃度1m。
(8)pbs緩沖液:nacl:7.9g(北京化工廠,純度≥99.5%,ph:5.0~8.0);kcl:0.2g(北京化工廠,純度≥99.5%,ph:5.0~8.0);kh2po4:0.24g(北京化工廠,純度≥99.5%,ph:4.2~4.5);k2hpo4:1.8g(北京化工廠,純度≥99.0%,ph:8.9~9.4)。溶于800ml蒸餾水中,最后加蒸餾水定容至1l,用hcl(分析純,國(guó)藥集團(tuán)化學(xué)試劑有限公司)調(diào)節(jié)溶液的ph值至7.4。
(9)補(bǔ)充有2mg/ml卡那霉素的pbs緩沖液。
質(zhì)粒構(gòu)建和菌株維持中使用lb液體和固體培養(yǎng)基。培養(yǎng)基中對(duì)菌株進(jìn)行培養(yǎng),誘導(dǎo)時(shí)使用補(bǔ)充有鹽的m9基本培養(yǎng)基。
限制性內(nèi)切酶、t4多核苷酸激酶和t4dna連接酶購(gòu)自newenglandbiolabs(frankfurt,germany)。普通引物合成服務(wù)由博邁德生物技術(shù)有限公司提供,n堿基隨機(jī)引物合成服務(wù)由英濰捷基(上海)貿(mào)易有限公司提供。
實(shí)施例1、轉(zhuǎn)錄抑制測(cè)試系統(tǒng)的構(gòu)建
本發(fā)明在大腸桿菌dh5α(transgenbiotech)中,選用不同的質(zhì)粒分別表達(dá)fndcpf1,sgrna及熒光報(bào)告蛋白,sgrna作用于熒光報(bào)告質(zhì)粒的不同位點(diǎn),利用報(bào)告蛋白的熒光強(qiáng)度表征轉(zhuǎn)錄抑制作用,即熒光強(qiáng)度越低,轉(zhuǎn)錄抑制作用越強(qiáng),以此研究不同設(shè)計(jì)下的fndcpf1的轉(zhuǎn)錄抑制作用。
其中,fndcpf1表達(dá)質(zhì)粒(全序列如序列表中序列3所示),啟動(dòng)子為ptac誘導(dǎo)型啟動(dòng)子,使用異丙基-β-d-硫代半乳糖苷(iptg)作為誘導(dǎo)劑誘導(dǎo)表達(dá),氨芐青霉素抗性,p15a復(fù)制子。sgrna表達(dá)質(zhì)粒,啟動(dòng)子為j23119組成型啟動(dòng)子,氯霉素抗性,cole1復(fù)制子。報(bào)告質(zhì)粒(全序列如序列表中序列5所示)使用sfgfp作為報(bào)告基因,啟動(dòng)子為j23100的組成型啟動(dòng)子,卡那霉素抗性,psc101復(fù)制子。這三個(gè)質(zhì)粒的結(jié)構(gòu)示意圖具體參見圖1。
sgrna表達(dá)質(zhì)粒:是以fnsgrna_bcb質(zhì)粒(全序列如序列表中序列4所示)為基礎(chǔ),以goldengate反應(yīng)方法根據(jù)作用序列不同分別構(gòu)建的,構(gòu)建不同靶點(diǎn)的sgrna序列時(shí),將靶序列設(shè)計(jì)在一對(duì)反向互補(bǔ)的引物內(nèi),同時(shí)留出與載體切口(bsmbi酶切后的切口)互補(bǔ)的粘性末端(圖1中d)。在組裝前,分別取濃度為10μm的兩引物各5μl加入40μl的雙蒸水中混合均勻,然后再取2μl的引物混合物進(jìn)行磷酸化處理,磷酸化反應(yīng)體系如下:引物對(duì)2μl;t4pnk1μl;10×t4連接酶緩沖液2μl;雙蒸水15μl。最后從磷酸化體系中取1μl產(chǎn)物與基礎(chǔ)質(zhì)粒fnsgrna_bcb一起進(jìn)行g(shù)oldengate反應(yīng)。goldengate程序設(shè)置及反應(yīng)體系分別見表1和表2。
表1goldengate程序設(shè)置
表2goldengate反應(yīng)體系
實(shí)施例2、fncpf1不同dnase突變體的轉(zhuǎn)錄抑制作用比較
根據(jù)已有fncpf1的遺傳學(xué)突變研究報(bào)道,fncpf1(d917a),fncpf1(e1006a)單個(gè)氨基酸位點(diǎn)的突變均能使得fncpf1完全喪失切割dna活性。因而本發(fā)明設(shè)計(jì)了三種fncpf1突變形式,分別為fncpf1(d917a),fncpf1(e1006a),fncpf1(d917a,e1006a),靶位點(diǎn)選擇報(bào)告基因的啟動(dòng)子區(qū)的非模板鏈,即nt鏈,sgrna命名為ntp1,分別將三種fndcpf1的突變體的表達(dá)質(zhì)粒與sgrnantp1表達(dá)質(zhì)粒(按照實(shí)施例1方法構(gòu)建,其中含有靶序列ntp1引物為f:agatgcactgtacctaggactgagctag;r:cttcctagctcagtcctaggtacagtgc)及報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)共轉(zhuǎn)大腸桿菌dh5α,誘導(dǎo)劑iptg濃度設(shè)置為:0,7.8125,31.25,62.5,125,250,500,2000μm,經(jīng)過流式測(cè)試各組中報(bào)告蛋白的熒光強(qiáng)度。
實(shí)驗(yàn)同時(shí)設(shè)置陽性對(duì)照(p),即不含有sgrna,但含有fndcpf1及報(bào)告質(zhì)粒的菌株;陰性對(duì)照(n),即不含有報(bào)告質(zhì)粒,但含有fndcpf1及sgrna質(zhì)粒的菌。。
用于表達(dá)fncpf1(d917a)的質(zhì)粒即為實(shí)施例1中的fndcpf1質(zhì)粒。用于表達(dá)fncpf1(e1006a)的質(zhì)粒以實(shí)施例1中的fndcpf1表達(dá)質(zhì)粒為模板,分別以f:atgtcaatttatcaagaatttgttaataaatatag和r:caaaatttaaatctgcaaaaaccacaatag;以及f:ctattgtggtttttgcagatttaaattttg和r:ctagttattcctattctgcacgaactca為引物,得到的兩個(gè)片段經(jīng)gibson方法連接并測(cè)序驗(yàn)證正確后得到該質(zhì)粒。用于表達(dá)fncpf1(d917a,e1006a)同樣以實(shí)施例1中的fndcpf1表達(dá)質(zhì)粒為模板,分別以f:atgtcaatttatcaagaatttgttaataaatatag和r:cacctcttgctatacttaatatatgaac;f:gttcatatattaagtatagcaagaggtgaaagacatttag和r:caaaatttaaatctgcaaaaaccacaatag;以及f:ctattgtggtttttgcagatttaaattttg和r:ctagttattcctattctgcacgaactca為引物,得到的三個(gè)片段經(jīng)gibson方法連接并測(cè)序驗(yàn)證正確后得到該質(zhì)粒。
流式細(xì)胞儀熒光定量檢測(cè)方法,具體如下:
首先,在lb平板上選取單克隆的細(xì)菌,接種至falcon管的4mllb中,在37℃、250rpm的搖床中培養(yǎng)過夜。利用預(yù)熱的m9培養(yǎng)基將過夜培養(yǎng)物1:200稀釋至96孔板。在高速軌道振蕩的safire微板分光光度計(jì)(tecan)中37℃孵育,每5min記錄各孔的od600測(cè)量值。一旦稀釋培養(yǎng)物的od600到達(dá)0.12-0.14(~3h),利用含有iptg的預(yù)熱的m9培養(yǎng)基,將培養(yǎng)物700倍稀釋至新的96孔板。在數(shù)顯恒溫?fù)u床(elmi)中以1,000rpm誘導(dǎo)6小時(shí),維持指數(shù)生長(zhǎng)。最后,將各培養(yǎng)物轉(zhuǎn)移至含有150μlpbs和2mg/ml卡那霉素的新板中,終止蛋白表達(dá)。
流式細(xì)胞儀電壓參數(shù)設(shè)置:fsc:440,ssc:260,fitc:480。激發(fā)光波長(zhǎng)為488nm,sfgfp的發(fā)射光波長(zhǎng)為533/30nm。fsc閾值設(shè)為200,ssc閾值設(shè)為500,兩者間關(guān)系設(shè)為and。收集50000個(gè)事件。流式細(xì)胞儀測(cè)得的數(shù)據(jù)使用軟件flowjo(v7.6)分析處理,其中熒光值取算術(shù)平均值。
所有測(cè)試實(shí)驗(yàn)數(shù)據(jù)均為至少3次不同天次的平均值,數(shù)據(jù)由excel2010、graphpadprism6進(jìn)行處理并作圖。
結(jié)果如圖2所示,由圖可見:三種突變體中fnd1(d917a)的抑制作用倍數(shù)最高,約85倍,其次為fnd12(d917a,e1006a),約47倍,最后是fnd2(e1006a),約17倍(抑制倍數(shù)是指iptg為零時(shí)的熒光值與iptg為2000時(shí)的熒光值之間的比值,因?yàn)閳D對(duì)數(shù)軸,橫坐標(biāo)無法顯示0,所以圖中橫坐標(biāo)1μmiptg濃度下的熒光值實(shí)際對(duì)應(yīng)0μmiptg濃度下的數(shù)值)。
因而后續(xù)實(shí)驗(yàn)中采用fnd1作為研究對(duì)象,后文中出現(xiàn)的fndcpf1均為fnd1,即fndcpf1(d917a)。
實(shí)施例3、sgrna的構(gòu)建中重復(fù)序列長(zhǎng)度、間隔序列長(zhǎng)度對(duì)轉(zhuǎn)錄抑制作用的影響
一、sgrna靶序列長(zhǎng)度變化
本發(fā)明的發(fā)明人在報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)中sfgfp基因的編碼區(qū)上選擇了一個(gè)位點(diǎn),改變sgrna中靶序列長(zhǎng)度,探究其最短靶序列長(zhǎng)度,該實(shí)驗(yàn)中序列長(zhǎng)度設(shè)為14-25nt(逐個(gè)堿基增加)及27nt、29nt、31nt(圖3中a)。
具體操作如下:各sgrna相關(guān)質(zhì)粒的構(gòu)建方法見實(shí)施例1(圖1中d),序列信息見表3。
表3sgrna中不同長(zhǎng)度的靶序列信息
分別將fndcpf1的突變體的表達(dá)質(zhì)粒與各sgrna相關(guān)質(zhì)粒及報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)共轉(zhuǎn)大腸桿菌dh5α,誘導(dǎo)劑iptg濃度設(shè)置為:100μm,經(jīng)過流式測(cè)試各組中報(bào)告蛋白的熒光強(qiáng)度(具體方法參見實(shí)施例2)。
每組設(shè)置至少3個(gè)重復(fù),結(jié)果以均值±標(biāo)準(zhǔn)差的形式表示。
結(jié)果如圖3中b,不同靶序列長(zhǎng)度下,fndcpf1的抑制倍數(shù)(指iptg濃度為0μm時(shí)的熒光值與iptg濃度為100μm時(shí)的比值)。由圖可見:靶序列至少需要16nt,fndcpf1才能發(fā)揮明顯的抑制作用。靶序列長(zhǎng)度大于16nt時(shí),抑制倍數(shù)有所差異,但是差異不大,其中靶序列長(zhǎng)度在18nt,19nt,20nt時(shí),抑制倍數(shù)達(dá)到最大。
二、sgrna中重復(fù)序列長(zhǎng)度變化
為了探究sgrna表達(dá)時(shí)所需的最小重復(fù)序列長(zhǎng)度,對(duì)sgrna中重復(fù)序列長(zhǎng)度做了不同的截短,作用位點(diǎn)為t1(圖4中a),重復(fù)序列(自5′端截短)分別為36nt、23nt、21nt、20nt、19nt、18nt、16nt。
具體操作如下:重復(fù)序列為36nt的作用于t1位點(diǎn)的sgrna(fnsgrna_t1_36nt)的構(gòu)建見實(shí)施例1(圖1中d),含有靶序列的引物為f:agatgtggaactggatggtgatgtcaac;r:cttcgttgacatcaccatccagttccac)。
隨后以fnsgrna_t1_36nt質(zhì)粒為模板,
以正向引物f:ttctactgttgtagatgtggaactggatggtgatgtcaacgaag,反向引物分別為:
16_r:acatctacaacagtagaaactagtattatacctaggactgagctag;
18_r:acatctacaacagtagaaatactagtattatacctaggactgagctagc;
19_r:acatctacaacagtagaaattactagtattatacctaggactgagctag;
20_r:cacatctacaacagtagaaattaactagtattatacctaggactgagctagc;
21_r:acatctacaacagtagaaattatactagtattatacctaggactgagctagc;
23_r:cacatctacaacagtagaaattatttactagtattatacctaggactgagctagct;
(反向pcr,引物內(nèi)含有互補(bǔ)序列)分別進(jìn)行pcr,得到的產(chǎn)物,經(jīng)dpni消化,及產(chǎn)物傳化后,直接轉(zhuǎn)入dh5α化轉(zhuǎn)感受態(tài),得到重復(fù)序列分別為16nt、18nt、19nt、20nt、21nt、23nt的質(zhì)粒。
分別將fndcpf1的突變體的表達(dá)質(zhì)粒與各sgrna相關(guān)質(zhì)粒及報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)共轉(zhuǎn)大腸桿菌dh5α,誘導(dǎo)劑iptg濃度設(shè)置為:100μm,經(jīng)過流式測(cè)試各組中報(bào)告蛋白的熒光強(qiáng)度(具體方法參見實(shí)施例2)。
結(jié)果顯示重復(fù)序列長(zhǎng)度為16nt及18nt時(shí),均幾乎無抑制作用,只有在大于19nt時(shí)才具有明顯的抑制作用(圖4中b)。
實(shí)施例4、fndcpf1同時(shí)作用于編碼區(qū)多個(gè)位點(diǎn)的抑制作用
由于cpf1具有自加工pre-crrna的活性,因而作用于多個(gè)位點(diǎn)時(shí),可以用一個(gè)轉(zhuǎn)錄本表達(dá)多個(gè)sgrna。為了探究fndcpf1同時(shí)作用于多個(gè)位點(diǎn)時(shí)的抑制作用,在本實(shí)驗(yàn)中,發(fā)明人設(shè)計(jì)了兩種sgrna,一種t12,包含作用于報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)中sfgfp基因的編碼區(qū)模板鏈t1、t2兩個(gè)位點(diǎn)的sgrna序列;另一種t123,包含作用于報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)中sfgfp基因的編碼區(qū)模板鏈t1、t2、t3三個(gè)位點(diǎn)的sgrna序列,每個(gè)位點(diǎn)的sgrna序列均由重復(fù)序列間隔開(圖5中a)。
具體操作如下:
1、fnsgrna_t1_36質(zhì)粒的構(gòu)建見實(shí)施例3,
2、sgrna_t12的構(gòu)建:
以fnsgrna_t1_36質(zhì)粒為模板,
t12_f:aaattatttaaagttcttagacgttgacatcaccatccagttccacat;
t12_r:agttcatctgtactactggtaaagaagcttgggcccgaacaaa;
為引物,pcr得到的片段1;
t12_o1:gtctaagaactttaaataatttctactgttgtagataagttcatctgtactactggtaa;
t12_o2:ttaccagtagtacagatgaacttatctacaacagtagaaattatttaaagttcttagac;
兩引物經(jīng)退火處理(95℃,10min),得到片段2;隨后將片段1與片段2經(jīng)gibson方法連接,即得到該質(zhì)粒。
3、sgrna_t123的構(gòu)建:
以sgrna_t12質(zhì)粒為模板,
t123_f:cttagactttaccagtagtacagatgaacttatctacaaca;
t123_r:gtagatgtaacgacgctgacttatggtgttgaagcttgggcccgaacaaa;
為引物,pcr得到的片段1;
t123_o1:ctactggtaaagtctaagaactttaaataatttctactgttgtagatgtaacgacgctg;
t123_o2:cagcgtcgttacatctacaacagtagaaattatttaaagttcttagactttaccagtag;
兩引物經(jīng)退火處理(95℃,10min),得到片段2;隨后將片段1與片段2經(jīng)gibson方法連接,即得到該質(zhì)粒。
分別將fndcpf1的突變體的表達(dá)質(zhì)粒與各sgrna相關(guān)質(zhì)粒及報(bào)告質(zhì)粒(即實(shí)施例1中的報(bào)告質(zhì)粒)共轉(zhuǎn)大腸桿菌dh5α,誘導(dǎo)劑iptg濃度設(shè)置為:0,7.8125,31.25,62.5,125,250,500,2000μm,經(jīng)過流式測(cè)試各組中報(bào)告蛋白的熒光強(qiáng)度(具體方法參見實(shí)施例2)。
實(shí)驗(yàn)同時(shí)設(shè)置陽性對(duì)照(p),即不含有sgrna,但含有fndcpf1及報(bào)告質(zhì)粒的菌株;陰性對(duì)照(n),即不含有報(bào)告質(zhì)粒,但含有fndcpf1及sgrna質(zhì)粒的菌。
每組設(shè)置至少3個(gè)重復(fù),結(jié)果以均值±標(biāo)準(zhǔn)差的形式表示。
實(shí)驗(yàn)結(jié)果顯示,sgrna為t1、t12、t123時(shí),其抑制倍數(shù)分別約為67倍、119倍、283倍,可以看出隨著sgrna數(shù)量的增多,fndcpf1的抑制倍數(shù)逐漸增大(圖5中b和c)。
實(shí)施例5、pam序列對(duì)fndcpf1轉(zhuǎn)錄抑制作用的影響
為了驗(yàn)證pam序列的不同是否會(huì)導(dǎo)致fndcpf1抑制作用的不同,發(fā)明人將靶序列(t6)5′端上游六個(gè)堿基的pam序列作為研究對(duì)象,構(gòu)建了一個(gè)pam序列庫(kù)(圖6),并驗(yàn)證了該處6個(gè)堿基的變化對(duì)報(bào)告基因(yfg)的表達(dá)幾乎沒有影響,可以確保后續(xù)實(shí)驗(yàn)中熒光強(qiáng)度的變化是由fndcpf1與不同pam序列間的作用不同導(dǎo)致的。
其中,pam序列庫(kù)構(gòu)建及富集方法具體如下(圖7):
1)pam克隆庫(kù)的獲?。涸跇?gòu)建質(zhì)粒庫(kù)之前,首先重新構(gòu)建了一個(gè)報(bào)告質(zhì)粒,該質(zhì)粒的報(bào)告基因選擇yfp,并將t6靶點(diǎn)及其附近序列構(gòu)建在該質(zhì)粒的啟動(dòng)子下游,該質(zhì)粒命名為r_pam(圖6,全序列如序列表中序列6所示)。pam序列測(cè)試質(zhì)粒庫(kù)是在該質(zhì)粒的基礎(chǔ)上構(gòu)建的,正向引物含有自由堿基,其序列為random_f:5′-atggtgatgtcaacggtcataannnnnncgtgcgtggcgagggtgaag-3′,反向引物random_r:5′-ccgttgacatcaccatccagtggtcagtgcgtcctgctgat-3′,其與正向引物間有16nt的互補(bǔ)序列,用于pcr純化產(chǎn)物的連接,以r_pam質(zhì)粒為模板,進(jìn)行pcr反應(yīng),得到的產(chǎn)物經(jīng)dpni酶消化去除模板后,純化回收,回收產(chǎn)物取300-1000ng直接轉(zhuǎn)入備用的100ul的已含有fndcpf1及sgrna_t6的dh5α電轉(zhuǎn)感受態(tài),加入37℃預(yù)熱lb培養(yǎng)基復(fù)蘇約1h,涂在同時(shí)含有氨芐霉素,氯霉素,卡納霉素的lb平板上,抗生素使用濃度為氨芐霉素100μg/ml,氯霉素20μg/ml,卡納霉素50μg/ml(之后所使用的培養(yǎng)基均含有三種抗性,不再贅述)。37℃恒溫培養(yǎng)箱培養(yǎng)過夜(12-16h)。
2)pam克隆庫(kù)的收集:得到單克隆后,用槍頭及l(fā)b液體培養(yǎng)基將所得的所有單克隆刮除洗下,收集在50ml的無菌離心管中,混合均勻后,稀釋約1000倍至新鮮的lb液體培養(yǎng)基,37℃,220rpm,搖床震蕩過夜培養(yǎng)12-16h。
3)樣品誘導(dǎo):次日分別取10μl種子液加入3ml含有0,10,20,100μmiptg的m9培養(yǎng)基,37℃,220rpm,搖床震蕩誘導(dǎo)3-4h。
4)流式分選:分別取500μl誘導(dǎo)物加入1mlpbs緩沖液,經(jīng)流式細(xì)胞分選儀分別上樣并記錄數(shù)據(jù)后,收集目的菌至含有2mllb培養(yǎng)基的5ml的離心管中。收集菌的分選范圍設(shè)置為:10μmiptg樣品中熒光區(qū)間前10%,20μmiptg樣品中熒光區(qū)間前20%,100μmiptg樣品中熒光區(qū)間前50%。每個(gè)樣品收集細(xì)胞約1000000個(gè),隨后分別取適當(dāng)體積的分選液稀釋后分別涂板,待用,再將剩余的所有分選菌混合加入含有l(wèi)b液體培養(yǎng)基的50ml離心管中,37℃,220rpm,搖床震蕩過夜培養(yǎng)12-16h,重復(fù)步驟3),4),再次分選,一共分選3次。
5)富集后的pam庫(kù)中單克隆熒光測(cè)試:經(jīng)3次分選后,分別挑取三次分選后涂在板子上的單克隆,至含有800μl的96孔深孔板中,于96孔板震蕩儀中37℃,1000rpm震蕩過夜培養(yǎng)12-16h,次日梯度稀釋1000倍至含有不同濃度iptg誘導(dǎo)劑的m9培養(yǎng)基中,于96孔板震蕩儀中37℃,1000rpm誘導(dǎo)培養(yǎng)約4.5h后,稀釋10倍至含有2mg/ml卡那霉素的pbs緩沖液中,采用bdlsrii流式細(xì)胞儀測(cè)定各樣品熒光值。流式細(xì)胞儀參數(shù)設(shè)置見流式細(xì)胞儀熒光定量檢測(cè)方法。根據(jù)測(cè)試結(jié)果,對(duì)不同熒光值對(duì)應(yīng)的單克隆進(jìn)行菌落pcr鑒定,上游引物設(shè)計(jì)在啟動(dòng)子上游,下游引物在yfp基因末端下游,保證測(cè)序部分中包含pam序列及yfg基因,根據(jù)測(cè)序結(jié)果分析pam序列與熒光抑制之間的關(guān)系。
利用該pam序列庫(kù),在經(jīng)過三輪富集篩選后,從每次分選的菌中分別挑取單克隆進(jìn)行熒光定量測(cè)試,選取不同熒光區(qū)間的克隆分別進(jìn)行測(cè)序,刪除測(cè)序結(jié)果中的重復(fù)序列后最終得到約200種不同pam序列(表5)的單克隆,同時(shí)測(cè)試了這200種克隆在不同iptg濃度下(20μm、100μm)的熒光強(qiáng)度。實(shí)驗(yàn)結(jié)果顯示,不同pam序列下,fndcpf1的抑制作用不同,在20μmiptg誘導(dǎo)下,最高熒光值(約6200a.u.)為最低熒光值(約50a.u.)的124倍,100μmiptg誘導(dǎo)下,差異更為顯著,約300倍(圖8,表4)。
表4約200種不同pam序列的序列及其對(duì)應(yīng)的熒光強(qiáng)度
注:以上熒光值為至少三次不同天次測(cè)試的平均值,均減去本底30。
為了探究pam序列中-1位堿基是否為v(v表示堿基a或c或g)偏好,本發(fā)明將所有數(shù)據(jù)按照5′-tttttn-3′,5′-ttttn-3′,5′-tttn-3′,5′-ttn-3′,分別進(jìn)行熒光強(qiáng)度比較,結(jié)果如圖9,在3′末端為t時(shí)對(duì)應(yīng)的熒光值均高于同等條件下其他pam序列對(duì)應(yīng)的熒光值。且pam序列為5′-tttttt-3′與5′-tttttv-3′對(duì)應(yīng)的熒光比值約7.4(pam序列為5′-tttttt-3′對(duì)應(yīng)的熒光平均值/pam序列為5′-tttttv-3′對(duì)應(yīng)的熒光平均值),5′-ttttt-3′與5′-ttttv-3′對(duì)應(yīng)的熒光比值約4.3,pam序列為5′-tttt-3′與5′-tttv-3′對(duì)應(yīng)的熒光比值約9.4,pam序列為5′-ttt-3′與5′-ttv-3′對(duì)應(yīng)的熒光比值約8.4??梢?,pam序列的-1位(3′末端堿基)具有v堿基偏好性,且5′-t富集(5′-tttttv-3′/5′-ttttv-3′/5′-tttv-3′)具有明顯優(yōu)勢(shì)。
<110>中國(guó)科學(xué)技術(shù)大學(xué);中國(guó)科學(xué)院微生物研究所
<120>一種可編程的多位點(diǎn)特異性的轉(zhuǎn)錄抑制系統(tǒng)及其應(yīng)用
<130>gncln171035
<160>6
<170>patentinversion3.5
<210>1
<211>1300
<212>prt
<213>人工序列
<220>
<223>
<400>1
metseriletyrglngluphevalasnlystyrserleuserlysthr
151015
leuargphegluleuileproglnglylysthrleugluasnilelys
202530
alaargglyleuileleuaspaspglulysargalalysasptyrlys
354045
lysalalysglnileileasplystyrhisglnphepheilegluglu
505560
ileleuserservalcysilesergluaspleuleuglnasntyrser
65707580
aspvaltyrphelysleulyslysseraspaspaspasnleuglnlys
859095
aspphelysseralalysaspthrilelyslysglnileserglutyr
100105110
ilelysaspserglulysphelysasnleupheasnglnasnleuile
115120125
aspalalyslysglyglngluseraspleuileleutrpleulysgln
130135140
serlysaspasnglyilegluleuphelysalaasnseraspilethr
145150155160
aspileaspglualaleugluileilelysserphelysglytrpthr
165170175
thrtyrphelysglyphehisgluasnarglysasnvaltyrserser
180185190
asnaspileprothrserileiletyrargilevalaspaspasnleu
195200205
prolyspheleugluasnlysalalystyrgluserleulysasplys
210215220
alaproglualaileasntyrgluglnilelyslysaspleualaglu
225230235240
gluleuthrpheaspileasptyrlysthrsergluvalasnglnarg
245250255
valpheserleuaspgluvalphegluilealaasnpheasnasntyr
260265270
leuasnglnserglyilethrlyspheasnthrileileglyglylys
275280285
phevalasnglygluasnthrlysarglysglyileasnglutyrile
290295300
asnleutyrserglnglnileasnasplysthrleulyslystyrlys
305310315320
metservalleuphelysglnileleuseraspthrgluserlysser
325330335
phevalileasplysleugluaspaspseraspvalvalthrthrmet
340345350
glnserphetyrgluglnilealaalaphelysthrvalgluglulys
355360365
serilelysgluthrleuserleuleupheaspaspleulysalagln
370375380
lysleuaspleuserlysiletyrphelysasnasplysserleuthr
385390395400
aspleuserglnglnvalpheaspasptyrservalileglythrala
405410415
valleuglutyrilethrglnglnilealaprolysasnleuaspasn
420425430
proserlyslysgluglngluleuilealalyslysthrglulysala
435440445
lystyrleuserleugluthrilelysleualaleugluglupheasn
450455460
lyshisargaspileasplysglncysargpheglugluileleuala
465470475480
asnphealaalaileprometilepheaspgluilealaglnasnlys
485490495
aspasnleualaglnileserilelystyrglnasnglnglylyslys
500505510
aspleuleuglnalaseralagluaspaspvallysalailelysasp
515520525
leuleuaspglnthrasnasnleuleuhislysleulysilephehis
530535540
ileserglnsergluasplysalaasnileleuasplysaspgluhis
545550555560
phetyrleuvalphegluglucystyrphegluleualaasnileval
565570575
proleutyrasnlysileargasntyrilethrglnlysprotyrser
580585590
aspglulysphelysleuasnphegluasnserthrleualaasngly
595600605
trpasplysasnlysgluproaspasnthralaileleupheilelys
610615620
aspasplystyrtyrleuglyvalmetasnlyslysasnasnlysile
625630635640
pheaspasplysalailelysgluasnlysglygluglytyrlyslys
645650655
ilevaltyrlysleuleuproglyalaasnlysmetleuprolysval
660665670
phepheseralalysserilelysphetyrasnprosergluaspile
675680685
leuargileargasnhisserthrhisthrlysasnglyserprogln
690695700
lysglytyrglulyspheglupheasnilegluaspcysarglysphe
705710715720
ileaspphetyrlysglnserileserlyshisproglutrplysasp
725730735
pheglypheargpheseraspthrglnargtyrasnserileaspglu
740745750
phetyrarggluvalgluasnglnglytyrlysleuthrphegluasn
755760765
ileserglusertyrileaspservalvalasnglnglylysleutyr
770775780
leupheglniletyrasnlysasppheseralatyrserlysglyarg
785790795800
proasnleuhisthrleutyrtrplysalaleupheaspgluargasn
805810815
leuglnaspvalvaltyrlysleuasnglyglualagluleuphetyr
820825830
arglysglnserileprolyslysilethrhisproalalysgluala
835840845
ilealaasnlysasnlysaspasnprolyslysgluservalpheglu
850855860
tyraspleuilelysasplysargphethrgluasplysphephephe
865870875880
hiscysproilethrileasnphelysserserglyalaasnlysphe
885890895
asnaspgluileasnleuleuleulysglulysalaasnaspvalhis
900905910
ileleuserilealaargglygluarghisleualatyrtyrthrleu
915920925
valaspglylysglyasnileilelysglnaspthrpheasnileile
930935940
glyasnaspargmetlysthrasntyrhisasplysleualaalaile
945950955960
glulysaspargaspseralaarglysasptrplyslysileasnasn
965970975
ilelysglumetlysgluglytyrleuserglnvalvalhisgluile
980985990
alalysleuvalileglutyrasnalailevalvalphegluaspleu
99510001005
asnpheglyphelysargglyargphelysvalglulysglnval
101010151020
tyrglnlysleuglulysmetleuileglulysleuasntyrleu
102510301035
valphelysaspasnglupheasplysthrglyglyvalleuarg
104010451050
alatyrglnleuthralaprophegluthrphelyslysmetgly
105510601065
lysglnthrglyileiletyrtyrvalproalaglyphethrser
107010751080
lysilecysprovalthrglyphevalasnglnleutyrprolys
108510901095
tyrgluservalserlysserglngluphepheserlyspheasp
110011051110
lysilecystyrasnleuasplysglytyrpheglupheserphe
111511201125
asptyrlysasnpheglyasplysalaalalysglylystrpthr
113011351140
ilealaserpheglyserargleuileasnpheargasnserasp
114511501155
lysasnhisasntrpaspthrarggluvaltyrprothrlysglu
116011651170
leuglulysleuleulysasptyrserileglutyrglyhisgly
117511801185
glucysilelysalaalailecysglygluserasplyslysphe
119011951200
phealalysleuthrservalleuasnthrileleuglnmetarg
120512101215
asnserlysthrglythrgluleuasptyrleuileserproval
122012251230
alaaspvalasnglyasnphepheaspserargglnalaprolys
123512401245
asnmetproglnaspalaaspalaasnglyalatyrhisilegly
125012551260
leulysglyleumetleuleuglyargilelysasnasnglnglu
126512701275
glylyslysleuasnleuvalilelysasngluglutyrpheglu
128012851290
phevalglnasnargasnasn
12951300
<210>2
<211>36
<212>dna
<213>人工序列
<220>
<223>
<400>2
gtctaagaactttaaataatttctactgttgtagat36
<210>3
<211>8751
<212>dna
<213>人工序列
<220>
<223>
<400>3
gctagcggagtgtatactggcttactatgttggcactgatgagggtgtcagtgaagtgct60
tcatgtggcaggagaaaaaaggctgcaccggtgcgtcagcagaatatgtgatacaggata120
tattccgcttcctcgctcactgactcgctacgctcggtcgttcgactgcggcgagcggaa180
atggcttacgaacggggcggagatttcctggaagatgccaggaagatacttaacagggaa240
gtgagagggccgcggcaaagccgtttttccataggctccgcccccctgacaagcatcacg300
aaatctgacgctcaaatcagtggtggcgaaacccgacaggactataaagataccaggcgt360
ttccccctggcggctccctcgtgcgctctcctgttcctgcctttcggtttaccggtgtca420
ttccgctgttatggccgcgtttgtctcattccacgcctgacactcagttccgggtaggca480
gttcgctccaagctggactgtatgcacgaaccccccgttcagtccgaccgctgcgcctta540
tccggtaactatcgtcttgagtccaacccggaaagacatgcaaaagcaccactggcagca600
gccactggtaattgatttagaggagttagtcttgaagtcatgcgccggttaaggctaaac660
tgaaaggacaagttttggtgactgcgctcctccaagccagttacctcggttcaaagagtt720
ggtagctcagagaaccttcgaaaaaccgccctgcaaggcggttttttcgttttcagagca780
agagattacgcgcagaccaaaacgatctcaagaagatcatcttattaatcagataaaata840
tttgctcatgagcccgaagtggcgagcccgatcttccccatcggtgatgtcggcgatata900
ggcgccagcaaccgcacctgtggcgccggtgatgccggccacgatgcgtccggcgtagag960
gatctgctcatgtttgacagcttatcatcgatgcataatgtgcctgtcaaatggacgaag1020
cagggattctgcaaaccctatgctactccctcgagccgtcaattgtctgattcgttacca1080
attagaattctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatg1140
aatcggccaacgcgcggggagaggcggtttgcgtattgggcgccagggtggtttttcttt1200
tcaccagtgagactggcaacagctgattgcccttcaccgcctggccctgagagagttgca1260
gcaagcggtccacgctggtttgccccagcaggcgaaaatcctgtttgatggtggttaacg1320
gcgggatataacatgagctatcttcggtatcgtcgtatcccactaccgagatatccgcac1380
caacgcgcagcccggactcggtaatggcgcgcattgcgcccagcgccatctgatcgttgg1440
caaccagcatcgcagtgggaacgatgccctcattcagcatttgcatggtttgttgaaaac1500
cggacatggcactccagtcgccttcccgttccgctatcggctgaatttgattgcgagtga1560
gatatttatgccagccagccagacgcagacgcgccgagacagaacttaatgggcccgcta1620
acagcgcgatttgctggtgacccaatgcgaccagatgctccacgcccagtcgcgtaccgt1680
cctcatgggagaaaataatactgttgatgggtgtctggtcagagacatcaagaaataacg1740
ccggaacattagtgcaggcagcttccacagcaatggcatcctggtcatccagcggatagt1800
taatgatcagcccactgacgcgttgcgcgagaagattgtgcaccgccgctttacaggctt1860
cgacgccgcttcgttctaccatcgacaccaccacgctggcacccagttgatcggcgcgag1920
atttaatcgccgcgacaatttgcgacggcgcgtgcagggccagactggaggtggcaacgc1980
caatcagcaacgactgtttgcccgccagttgttgtgccacgcggttgggaatgtaattca2040
gctccgccatcgccgcttccactttttcccgcgttttcgcagaaacgtggctggcctggt2100
tcaccacgcgggaaacggtctgataagagacaccggcatactctgcgacatcgtataacg2160
ttactggtttcatattcaccaccctgaattgactctcttccgggcgctatcatgccatac2220
cgcgaaaggttttgcgccattcgatggcgcgccgcttcgtcaggccacatagctttcttg2280
ttctgatcggaacgatcgttggctgtgttgacaattaatcatcggctcgtataatgtgtg2340
gaattgtgagcgctcacaattagctgtcaccggatgtgctttccggtctgatgagtccgt2400
gaggacgaaacagcctctacaaataattttgtttaaagatctaaagaggagaaaggatct2460
atgtcaatttatcaagaatttgttaataaatatagtttaagtaaaactctaagatttgag2520
ttaatcccacagggtaaaacacttgaaaacataaaagcaagaggtttgattttagatgat2580
gagaaaagagctaaagactacaaaaaggctaaacaaataattgataaatatcatcagttt2640
tttatagaggagatattaagttcggtttgtattagcgaagatttattacaaaactattct2700
gatgtttattttaaacttaaaaagagtgatgatgataatctacaaaaagattttaaaagt2760
gcaaaagatacgataaagaaacaaatatctgaatatataaaggactcagagaaatttaag2820
aatttgtttaatcaaaaccttatcgatgctaaaaaagggcaagagtcagatttaattcta2880
tggctaaagcaatctaaggataatggtatagaactatttaaagccaatagtgatatcaca2940
gatatagatgaggcgttagaaataatcaaatcttttaaaggttggacaacttattttaag3000
ggttttcatgaaaatagaaaaaatgtttatagtagcaatgatattcctacatctattatt3060
tataggatagtagatgataatttgcctaaatttctagaaaataaagctaagtatgagagt3120
ttaaaagacaaagctccagaagctataaactatgaacaaattaaaaaagatttggcagaa3180
gagctaacctttgatattgactacaaaacatctgaagttaatcaaagagttttttcactt3240
gatgaagtttttgagatagcaaactttaataattatctaaatcaaagtggtattactaaa3300
tttaatactattattggtggtaaatttgtaaatggtgaaaatacaaagagaaaaggtata3360
aatgaatatataaatctatactcacagcaaataaatgataaaacactcaaaaaatataaa3420
atgagtgttttatttaagcaaattttaagtgatacagaatctaaatcttttgtaattgat3480
aagttagaagatgatagtgatgtagttacaacgatgcaaagtttttatgagcaaatagca3540
gcttttaaaacagtagaagaaaaatctattaaagaaacactatctttattatttgatgat3600
ttaaaagctcaaaaacttgatttgagtaaaatttattttaaaaatgataaatctcttact3660
gatctatcacaacaagtttttgatgattatagtgttattggtacagcggtactagaatat3720
ataactcaacaaatagcacctaaaaatcttgataaccctagtaagaaagagcaagaatta3780
atagccaaaaaaactgaaaaagcaaaatacttatctctagaaactataaagcttgcctta3840
gaagaatttaataagcatagagatatagataaacagtgtaggtttgaagaaatacttgca3900
aactttgcggctattccgatgatatttgatgaaatagctcaaaacaaagacaatttggca3960
cagatatctatcaaatatcaaaatcaaggtaaaaaagacctacttcaagctagtgcggaa4020
gatgatgttaaagctatcaaggatcttttagatcaaactaataatctcttacataaacta4080
aaaatatttcatattagtcagtcagaagataaggcaaatattttagacaaggatgagcat4140
ttttatctagtatttgaggagtgctactttgagctagcgaatatagtgcctctttataac4200
aaaattagaaactatataactcaaaagccatatagtgatgagaaatttaagctcaatttt4260
gagaactcgactttggctaatggttgggataaaaataaagagcctgacaatacggcaatt4320
ttatttatcaaagatgataaatattatctgggtgtgatgaataagaaaaataacaaaata4380
tttgatgataaagctatcaaagaaaataaaggcgagggttataaaaaaattgtttataaa4440
cttttacctggcgcaaataaaatgttacctaaggttttcttttctgctaaatctataaaa4500
ttttataatcctagtgaagatatacttagaataagaaatcattccacacatacaaaaaat4560
ggtagtcctcaaaaaggatatgaaaaatttgagtttaatattgaagattgccgaaaattt4620
atagatttttataaacagtctataagtaagcatccggagtggaaagattttggatttaga4680
ttttctgatactcaaagatataattctatagatgaattttatagagaagttgaaaatcaa4740
ggctacaaactaacttttgaaaatatatcagagagctatattgatagcgtagttaatcag4800
ggtaaattgtacctattccaaatctataataaagatttttcagcttatagcaaagggcga4860
ccaaatctacatactttatattggaaagcgctgtttgatgagagaaatcttcaagatgtg4920
gtttataagctaaatggtgaggcagagcttttttatcgtaaacaatcaatacctaaaaaa4980
atcactcacccagctaaagaggcaatagctaataaaaacaaagataatcctaaaaaagag5040
agtgtttttgaatatgatttaatcaaagataaacgctttactgaagataagtttttcttt5100
cactgtcctattacaatcaattttaaatctagtggagctaataagtttaatgatgaaatc5160
aatttattgctaaaagaaaaagcaaatgatgttcatatattaagtatagcaagaggtgaa5220
agacatttagcttactatactttggtagatggtaaaggcaatatcatcaaacaagatact5280
ttcaacatcattggtaatgatagaatgaaaacaaactaccatgataagcttgctgcaata5340
gagaaagatagggattcagctaggaaagactggaaaaagataaataacatcaaagagatg5400
aaagagggctatctatctcaggtagttcatgaaatagctaagctagttatagagtataat5460
gctattgtggtttttgaggatttaaattttggatttaaaagagggcgtttcaaggtagag5520
aagcaggtctatcaaaagttagaaaaaatgctaattgagaaactaaactatctagttttc5580
aaagataatgagtttgataaaactgggggagtgcttagagcttatcagctaacagcacct5640
tttgagacttttaaaaagatgggtaaacaaacaggtattatctactatgtaccagctggt5700
tttacttcaaaaatttgtcctgtaactggttttgtaaatcagttatatcctaagtatgaa5760
agtgtcagcaaatctcaagagttctttagtaagtttgacaagatttgttataaccttgat5820
aagggctattttgagtttagttttgattataaaaactttggtgacaaggctgccaaaggc5880
aagtggactatagctagctttgggagtagattgattaactttagaaattcagataaaaat5940
cataattgggatactcgagaagtttatccaactaaagagttggagaaattgctaaaagat6000
tattctatcgaatatgggcatggcgaatgtatcaaagcagctatttgcggtgagagcgac6060
aaaaagttttttgctaagctaactagtgtcctaaatactatcttacaaatgcgtaactca6120
aaaacaggtactgagttagattatctaatttcaccagtagcagatgtaaatggcaatttc6180
tttgattcgcgacaggcgccaaaaaatatgcctcaagatgctgatgccaatggtgcttat6240
catattgggctaaaaggtctgatgctactaggtaggatcaaaaataatcaagagggcaaa6300
aaactcaatttggttatcaaaaatgaagagtattttgagttcgtgcagaataggaataac6360
tagtactagtccaggcatcaaataaaacgaaaggctcagtcgaaagactgggcctttcgt6420
tttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatccgccgggagcggat6480
ttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcccgccataaactgcc6540
aggcatcaaattaagcagaaggccatcctgacggatggcctttttgcgtttctacaaact6600
cttttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctg6660
ataaatgcttcaataatattgaaaaaggaagactatgagtattcaacatttccgtgtcgc6720
ccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggt6780
gaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatct6840
caacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcac6900
ttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaact6960
cggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaa7020
gcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtga7080
taacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttt7140
tttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatga7200
agccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcg7260
caaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggat7320
ggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttat7380
tgctgataaatctggagccggtgagcgtggatctcgcggtatcattgcagcactggggcc7440
agatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatgga7500
tgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtc7560
agaccaagtttactcatatatactttagattgatttacgcgccctgtagcggcgcattaa7620
gcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgc7680
ccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaag7740
ctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgacccca7800
aaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacggtttttc7860
gccctttgacgttggagtccacgttctttaatagtggactcttgttccaaacttgaacaa7920
cactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggcct7980
attggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaa8040
cgtttacaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatc8100
ccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatct8160
tcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgcta8220
ccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggc8280
ttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccac8340
ttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtcagg8400
catttgagaagcacacggtcacactgcttccggtagtcaataaaccggtaaaccagcaat8460
agacataagcggctatttaacgaccctgccctgaaccgacgaccgggtcgaatttgcttt8520
cgaatttctgccattcatccgcttattatcacttattcaggcgtagcaccaggcgtttaa8580
gggcaccaataactgccttaaaaaaattacgccccgccctgccactcatcgcagtactgt8640
tgtaattcattaagcattctgccgacatggaagccatcacagacggcatgatgaacctga8700
atcgccagcggcatcagcaccttgtcgccttgcgtataatatttgcccatg8751
<210>4
<211>2815
<212>dna
<213>人工序列
<220>
<223>
<400>4
ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcg60
acgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccc120
tggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgc180
ctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttc240
ggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccg300
ctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgcc360
actggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacaga420
gttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgc480
tctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaac540
caccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaagg600
atctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactc660
acgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaa720
ttaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacaggtt780
gatcgggcacgtaagaggttccaactttcaccataatgaaataagatcactaccgggcgt840
attttttgagttatcgagattttcaggagctaaggaagctaaaatggagaaaaaaatcac900
gggatataccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttca960
gtcagttgctcaatgtacctataaccagaccgttcagctggatattacggcctttttaaa1020
gaccgtaaagaaaaataagcacaagttttatccggcctttattcacattcttgcccgcct1080
gatgaacgctcacccggagtttcgtatggccatgaaagacggtgagctggtgatctggga1140
tagtgttcacccttgttacaccgttttccatgagcaaactgaaacgttttcgtccctctg1200
gagtgaataccacgacgatttccggcagtttctccacatatattcgcaagatgtggcgtg1260
ttacggtgaaaacctggcctatttccctaaagggtttattgagaatatgttttttgtctc1320
agccaatccctgggtgagtttcaccagttttgatttaaacgtggccaatatggacaactt1380
cttcgcccccgttttcacgatgggcaaatattatacgcaaggcgacaaggtgctgatgcc1440
gctggcgatccaggttcatcatgccgtttgtgatggcttccatgtcggccgcatgcttaa1500
tgaattacaacagtactgtgatgagtggcagggcggggcgtaataatactagctccggca1560
aaaaaacgggcaaggtgtcaccaccctgccctttttctttaaaaccgaaaagattacttc1620
gcgtttgccacctgacgtctaagaaaaggaatattcagcaatttgcccgtgccgaagaaa1680
ggcccacccgtgaaggtgagccagtgagttgattgctacgtaattagttagttagccctt1740
agtgactcgaattcgcggccgcttctagagctcggtaccaaattccagaaaagaggccgc1800
gaaagcggccttttttcgttttggtcctactagatgcctccacaccgctcgtcacatcct1860
gaattctaaagatctttgacagctagctcagtcctaggtataatactagtgtctaagaac1920
tttaaataatttctactgttgtagatagagacggcgcaacgcaattaatgtgagttagct1980
cactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaat2040
tgtgagcggataacaatttcacacaggaaacagctatgaccatgattacggattcactgg2100
ccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttg2160
cagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgccctt2220
cccaacagttgcgcagcctgaatggcgaatggtaacgtctccgaagcttgggcccgaaca2280
aaaactcatctcagaagaggatctgaatagcgccgtcgaccatcatcatcatcatcattg2340
agtttaaacggtctccagcttggctgttttggcggatgagagaagattttcagcctgata2400
cagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagc2460
gcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggt2520
agtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggc2580
tcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaactggatccttac2640
tcgagtctagactgcaggcttcctcgctcactgactcgctgcgctcggtcgttcggctgc2700
ggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggata2760
acgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa2815
<210>5
<211>4590
<212>dna
<213>人工序列
<220>
<223>
<400>5
cttcgcgtttgccacctgacgtctaagaaaaggaatattcagcaatttgcccgtgccgaa60
gaaaggcccacccgtgaaggtgagccagtgagttgattgctacgtaattagttagttagc120
ccttagtgactcgaattcgaattcctcgtcagttccgcttcgctacaggatccctatctg180
gagagtgcccgattgggacccgactttcgcaggagcctattacggagccaccaacgacga240
gacagcagactgggtcctttcctcacgatagaagtttcaggttgacggctagctcagtcc300
taggtacagtgctagcatcagcaggacgcactgacctttgctgtcaccggatgtgctttc360
cggtctgatgagtccgtgaggacgaaacagcctctacaaataattttgtttaagaattca420
aaagatcttttaagaaggagatatacatatgcgtaaaggcgaagagctgttcactggtgt480
cgtccctattctggtggaactggatggtgatgtcaacggtcataagttttccgtgcgtgg540
cgagggtgaaggtgacgcaactaatggtaaactgacgctgaagttcatctgtactactgg600
taaactgccggtaccttggccgactctggtaacgacgctgacttatggtgttcagtgctt660
tgctcgttatccggaccatatgaagcagcatgacttcttcaagtccgccatgccggaagg720
ctatgtgcaggaacgcacgatttcctttaaggatgacggcacgtacaaaacgcgtgcgga780
agtgaaatttgaaggcgataccctggtaaaccgcattgagctgaaaggcattgactttaa840
agaagacggcaatatcctgggccataagctggaatacaattttaacagccacaatgttta900
catcaccgccgataaacaaaaaaatggcattaaagcgaattttaaaattcgccacaacgt960
ggaggatggcagcgtgcagctggctgatcactaccagcaaaacactccaatcggtgatgg1020
tcctgttctgctgccagacaatcactatctgagcacgcaaagcgttctgtctaaagatcc1080
gaacgagaaacgcgatcatatggttctgctggagttcgtaaccgcagcgggcatcacgca1140
tggtatggatgaactgtacaaatgatgagccaggcatcaaataaaacgaaaggctcagtc1200
gaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctctactagagtca1260
cactggctcaccttcgggtgggcctttctgcgtttatacaattgttgggcctttctgcgt1320
ttatatactagtagcggccgctgcaggagtcactaagggttagttagttagattagcaga1380
aagtcaaaagcctccgaccggaggcttttgactaaaacttcccttggggttatcattggg1440
gctcactcaaaggcggtaatcagataaaaaaaatccttagctttcgctaaggatgatttc1500
tgctagtattattagaaaaactcatcgagcatcaaatgaaactgcaatttattcatatca1560
ggattatcaataccatatttttgaaaaagccgtttctgtaatgaaggagaaaactcaccg1620
aggcagttccaaagaatggcaaggtcctggtaacggtctgcgattccgacccgtccaaca1680
tcaatacaacctattaatttcccctcgtcaaaaataaggttatcaagtgagaaatcacca1740
tgagtgacgactgaatccggtgagaatggcaagagcttgtgcatttctttccagacttgt1800
tcaacaggccagccattacgctcgtcatcaaaatcactcgcatcaaccaaaccgttattc1860
atgcgtgattgcgcctgagcaagacgaaatacacgatcgctgttaaaaggacaattacaa1920
acaggaatcgaatgtaaccggcgcaggaacacggccagcgcatcaacaatattttcacct1980
gaatcaggatattcttctaatacctggaaggctgttttcccaggaatcgcggtggtgagt2040
aaccacgcatcatcaggagtacggataaaatgcttgatggtcgggagaggcataaactcc2100
gtcagccagttgagacggaccatctcatctgtaacatcattggcaacgctacctttgcca2160
tgtttcagaaacaactctggcgcatcgggcttcccatacaagcgatagattgtcgcacct2220
gattgcccgacattatcgcgagcccatttatacccatataaatcagcgtccatgttggag2280
tttaagcgcggacgggagcaagacgtttcccgttgaatatggctcataacaccccttgta2340
ttactgtttatgtaagcagacagttttattgttcatgatgatatatttttatcttgtgca2400
atgtaacatcagagattttgagacacaacgtggctttgttgaataaatcgaacttttgct2460
gagttgaaggatcagctctagtagttacattgtcgatctgttcatggtgaacagctttga2520
atgcaccaaaaactcgtaaaagctctgatgtatctatcttttttacaccgttttcatctg2580
tgcatatggacagttttccctttgatatgtaacggtgaacagttgttctacttttgtttg2640
ttagtcttgatgcttcactgatagatacaagagccataagaacctcagatccttccgtat2700
ttagccagtatgttctctagtgtggttcgttgtttttgcgtgagccatgagaacgaacca2760
ttgagatcatacttactttgcatgtcactcaaaaattttgcctcaaaactggtgagctga2820
atttttgcagttaaagcatcgtgtagtgtttttcttagtccgttatgtaggtaggaatct2880
gatgtaatggttgttggtattttgtcaccattcatttttatctggttgttctcaagttcg2940
gttacgagatccatttgtctatctagttcaacttggaaaatcaacgtatcagtcgggcgg3000
cctcgcttatcaaccaccaatttcatattgctgtaagtgtttaaatctttacttattggt3060
ttcaaaacccattggttaagccttttaaactcatggtagttattttcaagcattaacatg3120
aacttaaattcatcaaggctaatctctatatttgccttgtgagttttcttttgtgttagt3180
tcttttaataaccactcataaatcctcatagagtatttgttttcaaaagacttaacatgt3240
tccagattatattttatgaatttttttaactggaaaagataaggcaatatctcttcacta3300
aaaactaattctaatttttcgcttgagaacttggcatagtttgtccactggaaaatctca3360
aagcctttaaccaaaggattcctgatttccacagttctcgtcatcagctctctggttgct3420
ttagctaatacaccataagcattttccctactgatgttcatcatctgagcgtattggtta3480
taagtgaacgataccgtccgttctttccttgtagggttttcaatcgtggggttgagtagt3540
gccacacagcataaaattagcttggtttcatgctccgttaagtcatagcgactaatcgct3600
agttcatttgctttgaaaacaactaattcagacatacatctcaattggtctaggtgattt3660
taatcactataccaattgagatgggctagtcaatgataattacatgtccttttcctttga3720
gttgtgggtatctgtaaattctgctagacctttgctggaaaacttgtaaattctgctaga3780
ccctctgtaaattccgctagacctttgtgtgttttttttgtttatattcaagtggttata3840
atttatagaataaagaaagaataaaaaaagataaaaagaatagatcccagccctgtgtat3900
aactcactactttagtcagttccgcagtattacaaaaggatgtcgcaaacgctgtttgct3960
cctctacaaaacagaccttaaaaccctaaaggcttaagtagcaccctcgcaagctcgggc4020
aaatcgctgaatattccttttgtctccgaccatcaggcacctgagtcgctgtctttttcg4080
tgacattcagttcgctgcgctcacggctctggcagtgaatgggggtaaatggcactacag4140
gcgccttttatggattcatgcaaggaaactacccataatacaagaaaagcccgtcacggg4200
cttctcagggcgttttatggcgggtctgctatgtggtgctatctgactttttgctgttca4260
gcagttcctgccctctgattttccagtctgaccacttcggattatcccgtgacaggtcat4320
tcagactggctaatgcacccagtaaggcagcggtatcatcaacaggcttacccgtcttac4380
tgtccctagtgcttggattctcaccaataaaaaacgcccggcggcaaccgagcgttctga4440
acaaatccagatggagttctgaggtcattactggatctatcaacaggagtccaagcgagc4500
tcgtaaacttggtctgacagctctagctccggcaaaaaaacgggcaaggtgtcaccaccc4560
tgccctttttctttaaaaccgaaaagatta4590
<210>6
<211>4652
<212>dna
<213>人工序列
<220>
<223>
<400>6
ttgccacctgacgtctaagaaaaggaatattcagcaatttgcccgtgccgaagaaaggcc60
cacccgtgaaggtgagccagtgagttgattgctacgtaattagttagttagcccttagtg120
actcgaattcgaattcctcgtcagttccgcttcgctacaggatccctatctggagagtgc180
ccgattgggacccgactttcgcaggagcctattacggagccactgatgctagcactgtac240
cttgggtcctttcctcacgatagaagtttcaggttgacggctagctcagtcctaggtaca300
gtgctagcatcagcaggacgcactgaccactggatggtgatgtcaacggtcataagtttt360
ccgtgcgtggcgagggtgaaggtgacgcaactaatggtagctgtcaccggatgtgctttc420
cggtctgatgagtccgtgaggacgaaacagcctctacaaataattttgtttaatactaga480
gaaagaggagaaatactagatggtgagcaagggcgaggagctgttcaccggggtggtgcc540
catcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgaggg600
cgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagct660
gcccgtgccctggcccaccctcgtgaccaccttcggctacggcctgcaatgcttcgcccg720
ctaccccgaccacatgaagctgcacgacttcttcaagtccgccatgcccgaaggctacgt780
ccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaa840
gttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggagga900
cggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcat960
ggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgagga1020
cggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgt1080
gctgctgcccgacaaccactacctgagctaccagtccgccctgagcaaagaccccaacga1140
gaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcat1200
ggacgagctgtacaagtaataggccaggcatcaaataaaacgaaaggctcagtcgaaaga1260
ctgggcctttcgttttatctgttgtttgtcggtgaacgctctctactagagtcacactgg1320
ctcaccttcgggtgggcctttctgcgtttatacaattgttgggcctttctgcgtttatat1380
actagtagcggccgctgcaggagtcactaagggttagttagttagattagcagaaagtca1440
aaagcctccgaccggaggcttttgactaaaacttcccttggggttatcattggggctcac1500
tcaaaggcggtaatcagataaaaaaaatccttagctttcgctaaggatgatttctgctag1560
tattattagaaaaactcatcgagcatcaaatgaaactgcaatttattcatatcaggatta1620
tcaataccatatttttgaaaaagccgtttctgtaatgaaggagaaaactcaccgaggcag1680
ttccaaagaatggcaaggtcctggtaacggtctgcgattccgacccgtccaacatcaata1740
caacctattaatttcccctcgtcaaaaataaggttatcaagtgagaaatcaccatgagtg1800
acgactgaatccggtgagaatggcaagagcttgtgcatttctttccagacttgttcaaca1860
ggccagccattacgctcgtcatcaaaatcactcgcatcaaccaaaccgttattcatgcgt1920
gattgcgcctgagcaagacgaaatacacgatcgctgttaaaaggacaattacaaacagga1980
atcgaatgtaaccggcgcaggaacacggccagcgcatcaacaatattttcacctgaatca2040
ggatattcttctaatacctggaaggctgttttcccaggaatcgcggtggtgagtaaccac2100
gcatcatcaggagtacggataaaatgcttgatggtcgggagaggcataaactccgtcagc2160
cagttgagacggaccatctcatctgtaacatcattggcaacgctacctttgccatgtttc2220
agaaacaactctggcgcatcgggcttcccatacaagcgatagattgtcgcacctgattgc2280
ccgacattatcgcgagcccatttatacccatataaatcagcgtccatgttggagtttaag2340
cgcggacgggagcaagacgtttcccgttgaatatggctcataacaccccttgtattactg2400
tttatgtaagcagacagttttattgttcatgatgatatatttttatcttgtgcaatgtaa2460
catcagagattttgagacacaacgtggctttgttgaataaatcgaacttttgctgagttg2520
aaggatcagctctagtagttacattgtcgatctgttcatggtgaacagctttgaatgcac2580
caaaaactcgtaaaagctctgatgtatctatcttttttacaccgttttcatctgtgcata2640
tggacagttttccctttgatatgtaacggtgaacagttgttctacttttgtttgttagtc2700
ttgatgcttcactgatagatacaagagccataagaacctcagatccttccgtatttagcc2760
agtatgttctctagtgtggttcgttgtttttgcgtgagccatgagaacgaaccattgaga2820
tcatacttactttgcatgtcactcaaaaattttgcctcaaaactggtgagctgaattttt2880
gcagttaaagcatcgtgtagtgtttttcttagtccgttatgtaggtaggaatctgatgta2940
atggttgttggtattttgtcaccattcatttttatctggttgttctcaagttcggttacg3000
agatccatttgtctatctagttcaacttggaaaatcaacgtatcagtcgggcggcctcgc3060
ttatcaaccaccaatttcatattgctgtaagtgtttaaatctttacttattggtttcaaa3120
acccattggttaagccttttaaactcatggtagttattttcaagcattaacatgaactta3180
aattcatcaaggctaatctctatatttgccttgtgagttttcttttgtgttagttctttt3240
aataaccactcataaatcctcatagagtatttgttttcaaaagacttaacatgttccaga3300
ttatattttatgaatttttttaactggaaaagataaggcaatatctcttcactaaaaact3360
aattctaatttttcgcttgagaacttggcatagtttgtccactggaaaatctcaaagcct3420
ttaaccaaaggattcctgatttccacagttctcgtcatcagctctctggttgctttagct3480
aatacaccataagcattttccctactgatgttcatcatctgagcgtattggttataagtg3540
aacgataccgtccgttctttccttgtagggttttcaatcgtggggttgagtagtgccaca3600
cagcataaaattagcttggtttcatgctccgttaagtcatagcgactaatcgctagttca3660
tttgctttgaaaacaactaattcagacatacatctcaattggtctaggtgattttaatca3720
ctataccaattgagatgggctagtcaatgataattacatgtccttttcctttgagttgtg3780
ggtatctgtaaattctgctagacctttgctggaaaacttgtaaattctgctagaccctct3840
gtaaattccgctagacctttgtgtgttttttttgtttatattcaagtggttataatttat3900
agaataaagaaagaataaaaaaagataaaaagaatagatcccagccctgtgtataactca3960
ctactttagtcagttccgcagtattacaaaaggatgtcgcaaacgctgtttgctcctcta4020
caaaacagaccttaaaaccctaaaggcttaagtagcaccctcgcaagctcgggcaaatcg4080
ctgaatattccttttgtctccgaccatcaggcacctgagtcgctgtctttttcgtgacat4140
tcagttcgctgcgctcacggctctggcagtgaatgggggtaaatggcactacaggcgcct4200
tttatggattcatgcaaggaaactacccataatacaagaaaagcccgtcacgggcttctc4260
agggcgttttatggcgggtctgctatgtggtgctatctgactttttgctgttcagcagtt4320
cctgccctctgattttccagtctgaccacttcggattatcccgtgacaggtcattcagac4380
tggctaatgcacccagtaaggcagcggtatcatcaacaggcttacccgtcttactgtccc4440
tagtgcttggattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaat4500
ccagatggagttctgaggtcattactggatctatcaacaggagtccaagcgagctcgtaa4560
acttggtctgacagctctagctccggcaaaaaaacgggcaaggtgtcaccaccctgccct4620
ttttctttaaaaccgaaaagattacttcgcgt4652