本發(fā)明涉及基因編輯領(lǐng)域,具體涉及一種谷氨酸棒狀桿菌的基因編輯系統(tǒng)及其應(yīng)用。
背景技術(shù):
基因編輯技術(shù)出現(xiàn)自20世紀(jì)90年代,指外源DNA與受體細(xì)胞基因組通過(guò)重組方式對(duì)受體細(xì)胞基因組目標(biāo)基因進(jìn)行突變,從而產(chǎn)生目的突變株。基因編輯需要依賴于包括同源重組、特異位點(diǎn)重組和轉(zhuǎn)座重組等DNA重組系統(tǒng)。
CRISPR/Cas(Clustered regularly interspaced short palindromic repeats,CRISPR)/Cas系統(tǒng)作為細(xì)菌和古細(xì)菌的獲得性免疫系統(tǒng),通過(guò)RNA介導(dǎo),特異性的切割外源遺傳物質(zhì),用以對(duì)抗入侵的病毒和質(zhì)粒。隨著近兩年的發(fā)展,該技術(shù)已經(jīng)發(fā)展成為一套精確的打靶系統(tǒng),通過(guò)CRISPR/Cas9 介導(dǎo)的打靶系統(tǒng)可以試驗(yàn)快速高效的基因敲除、基因敲入、基因沉默。目前該技術(shù)已成功應(yīng)用到大腸桿菌、斑馬魚(yú)、擬南芥、釀酒酵母等物種中。
CRISPR/Cas 系統(tǒng)發(fā)揮基因編輯的作用是建立在由CRISPR 轉(zhuǎn)錄來(lái)的trancrRNA 與crRNA 形成一個(gè)tracrRNA-crRNA 復(fù)合體,接著該復(fù)合體與Cas9 蛋白結(jié)合,并在crRNA 的引導(dǎo)下識(shí)別靶位點(diǎn);而對(duì)目的片段的切割是由crRNA 上長(zhǎng)度為20 bp 的向?qū)蛄?Guiding sequence)與目的DNA上的特定序列互補(bǔ)來(lái)引導(dǎo)Cas9 蛋白對(duì)目的基因的切割;除此之外,在所識(shí)別的目的DNA 上還必須有一個(gè)3′堿基(NGG)組成的PAM (protospacer adjacent motif)區(qū)域,識(shí)別區(qū)域緊跟PAM 的5′端。
谷氨酸棒桿菌(Corynebacterium. glutamicum)是一種革蘭氏陽(yáng)性細(xì)菌,其DNA含有大約56%的GC。該菌在過(guò)去的50多年里被廣泛用于氨基酸的生產(chǎn),比如谷氨酸、賴氨酸等,還被用于食品工業(yè)、動(dòng)物飼料和醫(yī)藥產(chǎn)品的生產(chǎn)。普遍認(rèn)為C. glutamicum無(wú)致病性,不產(chǎn)生內(nèi)毒素,因而是一種安全的醫(yī)藥蛋白表達(dá)宿主。
用于工業(yè)生產(chǎn)的谷氨酸棒狀桿菌菌株主要通過(guò)傳統(tǒng)誘變獲得。隨著,C. giutamicum ATCC 13032和C. giutamicum ATCC 14067全基因組的測(cè)序,通過(guò)基因工程手段定向改造谷氨酸棒狀桿菌生產(chǎn)氨基酸越來(lái)越受到重視。
目前,只有pKl8mobsacB/pKl9mobsacB等少數(shù)幾個(gè)用于谷氨酸棒狀桿菌基因編輯的載體,但上述載體的基因編輯效率低下。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)上述問(wèn)題,本發(fā)明提供了一種谷氨酸棒狀桿菌的基因編輯系統(tǒng),其具有較高的基因編輯效率。
一種谷氨酸棒狀桿菌的基因編輯系統(tǒng),所述谷氨酸棒狀桿菌中待編輯的目的基因具有5′-(N20)-NGG-3′結(jié)構(gòu),N為A、T、C或G,其特征在于:
所述基因編輯系統(tǒng)包括cas9表達(dá)載體和sgRNA表達(dá)載體;
所述cas9表達(dá)載體包括cas9序列和SD序列,所述cas9序列如SEQ ID No.1所示,所述SD序列如SEQ ID No.2所示、并連接在cas9序列的始密碼子ATG前;
所述sgRNA表達(dá)載體的包含sgRNA序列和同源修復(fù)序列,所述sgRNA序列為crRNA與trancrRNA 連接形成的復(fù)合體序列,所述trancrRNA序列如SEQ ID No.3所示,所述crRNA序列為20bp的引導(dǎo)序列、與目的基因的N20序列相同。
進(jìn)一步的,所述cas9表達(dá)載體的核苷酸序列如SEQ ID No.4所示。
進(jìn)一步的,所述cas9表達(dá)載體由以下方法制備得到:a、合成由SD序列和cas9序列連接形成的復(fù)合體序列,并在復(fù)合體序列的兩端引入HindⅢ酶切識(shí)別序列、EcoRⅠ酶切識(shí)別序列;b、將帶有酶切識(shí)別序列的復(fù)合體序列以及pXMJ19載體分別酶切、純化后進(jìn)行連接,得到所述cas9表達(dá)載體。
進(jìn)一步的,所述同源修復(fù)序列由目的基因上游序列、目的基因編輯后形成的序列、目的基因下游序列依次連接形成,所述目的基因上游序列、目的基因下游序列長(zhǎng)度為300bp~1500bp。
更進(jìn)一步的,當(dāng)所述目的基因編輯為敲除時(shí),所述同源修復(fù)序列由目的基因上游序列和目的基因下游序列連接形成。
進(jìn)一步的,所述sgRNA表達(dá)載體由以下方法制備得到:a、合成sgRNA序列,并在sgRNA兩端引入EcoRⅠ酶切識(shí)別序列、XbaⅠ酶切識(shí)別序列;b、將帶有酶切識(shí)別序列的sgRNA序列以及pECXK-99載體分別酶切、純化后進(jìn)行連接,得到pFST-1載體;c、合成同源修復(fù)序列,并在同源修復(fù)序列兩端引入BglⅡ酶切識(shí)別序列或者同源重組位點(diǎn);d、將帶有酶切識(shí)別序列的同源修復(fù)序列以及pFST-1載體分別酶切、純化后進(jìn)行連接或者同源重組組裝,得到所述sgRNA表達(dá)載體。
上述基因編輯系統(tǒng)在谷氨酸棒狀桿菌中的應(yīng)用,所述應(yīng)用包括基因敲除和基因替換。
上述應(yīng)用的具體操作如下:
a、將cas9表達(dá)載體和sgRNA表達(dá)載體轉(zhuǎn)化谷氨酸棒狀桿菌;
b、培養(yǎng)、篩選,獲得轉(zhuǎn)化子。
本發(fā)明構(gòu)建的基因編輯系統(tǒng)即利用crispr/cas9技術(shù),利用人工設(shè)計(jì)的sgRNA結(jié)合cas9蛋白對(duì)基因組靶點(diǎn)位置切割,形成雙鏈斷裂缺口;同時(shí)提供同源修復(fù)序列,以達(dá)到基因敲除,基因插入和基因替換的目的;其中,SD序列的涉及使得cas9蛋白能夠在谷氨酸棒桿菌中順利表達(dá)。
實(shí)驗(yàn)證明,利用本發(fā)明構(gòu)建的基因編輯系統(tǒng)對(duì)谷氨酸棒狀桿菌基因組進(jìn)行編輯,具有周期短,節(jié)省成本效率高等優(yōu)點(diǎn);并且使用該系統(tǒng)對(duì)谷氨酸棒狀桿菌基因編輯效率能達(dá)到100%。
附圖說(shuō)明
圖1為pXMJ19的質(zhì)粒圖譜。
圖2為cas9表達(dá)載體的質(zhì)粒圖譜。
圖3為pECXK-99的質(zhì)粒圖譜。
圖4為sgRNA表達(dá)載體的質(zhì)粒圖譜。
圖5為同源修復(fù)序列的設(shè)計(jì)示意圖。
圖6為porb基因敲除后基因型驗(yàn)證結(jié)果,其中,泳道M: marker DL10,000;泳道1-6: 敲除菌株基因型驗(yàn)證結(jié)果;泳道7: 陽(yáng)性對(duì)照;泳道8: 陰性對(duì)照野生型菌株基因型。
具體實(shí)施方式
下述實(shí)施例或應(yīng)用例中的實(shí)驗(yàn)方法,如無(wú)特殊說(shuō)明,均為常規(guī)方法。
下述實(shí)施例或應(yīng)用例中所用的材料、試劑,基因合成等,如無(wú)特殊說(shuō)明,均可從商業(yè)途徑獲得。
下述實(shí)施例或應(yīng)用例中所用載體骨架pXMJ19及pECXK-99均購(gòu)自Addgene。
下述實(shí)施例或應(yīng)用例中所用大腸桿菌DH5α購(gòu)買(mǎi)自TAKARA。
下述實(shí)施例或應(yīng)用例中所用谷氨酸棒狀桿菌C. glutamicum ATCC13032購(gòu)買(mǎi)自中國(guó)工業(yè)微生物菌種保藏管理中心(CICC)。
下述實(shí)施例或應(yīng)用例中所用連接液solution Ⅰ購(gòu)買(mǎi)自TaKaRa公司,貨號(hào) D6020A。
下述實(shí)施例或應(yīng)用例中所用Gibson Assembly Master Mix溶液購(gòu)買(mǎi)自NEB( New England Biolabs)公司,貨號(hào)E2611S。
下述實(shí)施例或應(yīng)用例中大腸桿菌的培養(yǎng)使用LB培養(yǎng)基,培養(yǎng)基配方為:胰蛋白胨10g、酵母提取物5g、NaCl 10g,去離子水1L。
下述實(shí)施例或應(yīng)用例中谷氨酸棒狀桿菌的培養(yǎng)使用LBB培養(yǎng)基,培養(yǎng)基配方為:胰蛋白胨10g、酵母提取物5g、NaCl 10g,腦心浸液10g、去離子水1L。
實(shí)施例1:一種谷氨酸棒狀桿菌的基因編輯系統(tǒng)
1、cas9表達(dá)載體
cas9表達(dá)載體,其制備過(guò)程如下:
a、合成由SD序列和cas9序列連接形成的復(fù)合體序列,并在復(fù)合體序列的兩端引入HindⅢ酶切識(shí)別序列、EcoRⅠ酶切識(shí)別序列,SD序列、cas9序列分別如SEQ ID No.2和SEQ ID No.1所示。
b、將帶有酶切識(shí)別序列的復(fù)合體序列以及pXMJ19載體分別酶切、純化后進(jìn)行連接,得到cas9表達(dá)載體。
酶切、純化連接體系如下:20μL反應(yīng)體系中含有限制性內(nèi)切酶HindⅢ、EcoRⅠ各1μL,含有待酶切的復(fù)合體及pXMJ19載體0.8ng,pXMJ19的質(zhì)粒圖譜如圖1所示,37℃反應(yīng)30min;0.7%瓊脂糖凝膠電泳,切膠回收,膠回收試劑盒純化,即得到酶切純化后的復(fù)合體序列以及pXMJ19載體片段;純化后的復(fù)合體序列和pXMJ19載體片段摩爾比3:1,連接液Solution I 5μL,無(wú)菌水補(bǔ)齊到10μL ,16℃反應(yīng)1h,熱擊轉(zhuǎn)化E.coli DH5α感受態(tài)細(xì)胞;均勻涂布于含有30μg/mL氯霉素的LB固體培養(yǎng)基上,37℃倒置培養(yǎng)16h;挑選陽(yáng)性克隆子,提取質(zhì)粒即為cas9表達(dá)載體。
2、sgRNA表達(dá)載體
sgRNA表達(dá)載體,其制備過(guò)程如下:
a、合成由crRNA序列和trancrRNA序列連接形成sgRNA序列,并在sgRNA序列兩端引入EcoRⅠ、XbaⅠ酶切酶切識(shí)別序列,crRNA序列為20bp的引導(dǎo)序列、并與目的基因中5′-(N20)-NGG-3′結(jié)構(gòu)的N20序列相同,trancrRNA序列如SEQ ID No.3所示。
b、將帶有酶切識(shí)別序列的sgRNA序列以及pECXK-99載體分別酶切、純化后進(jìn)行連接,得到pFST-1載體。
酶切純化連接體系如下:20μL反應(yīng)體系中含有限制性內(nèi)切酶EcoRⅠ、XbaⅠ各1μL,含有待酶切的sgRNA片段及pECXK-99載體0.8ng,37℃反應(yīng)30min;0.7%瓊脂糖凝膠電泳,切膠回收,膠回收試劑盒純化,即得到酶切純化后的sgRNA片段及pECXK-99載體片段;純化后的sgRNA片段和pECXK-99載體片段摩爾比3:1,連接液Solution I 5μL,無(wú)菌水補(bǔ)齊到10μL ,16℃反應(yīng)1h,熱擊轉(zhuǎn)化E.coli DH5α感受態(tài)細(xì)胞;均勻涂布于含有30μg/mL卡那霉素的LB固體培養(yǎng)基上,37℃倒置培養(yǎng)16h;挑選陽(yáng)性克隆子,提取質(zhì)粒即為pFST-1載體。
c、根據(jù)目的不同設(shè)計(jì)不同的同源修復(fù)序列,設(shè)計(jì)方法依據(jù)圖5所示,若實(shí)現(xiàn)目的基因的敲除,構(gòu)建由目的基因上游序列和目的基因下游序列融合連接形成的同源修復(fù)序列,目的基因上、下游序列長(zhǎng)度為300bp~1500bp,并在同源修復(fù)序列兩端引入BglⅡ酶切識(shí)別序列,其中,目的基因的原序列中具有5′-(N20)-NGG-3′結(jié)構(gòu);將帶有酶切識(shí)別序列的同源修復(fù)序列以及pFST-1載體分別酶切、純化后進(jìn)行連接,得到sgRNA表達(dá)載體,轉(zhuǎn)化E.coli DH5α。
構(gòu)建體系如下:根據(jù)目的基因基因組序列設(shè)計(jì)引物,分別擴(kuò)增目的基因上游序列和目的基因下游序列,擴(kuò)增片段長(zhǎng)度為300bp~1500bp,兩個(gè)片段的中間引物設(shè)計(jì)融合位點(diǎn),可以通過(guò)融合pcr的方法融合兩個(gè)片段,并在兩端引物上引入BglⅡ酶切識(shí)別序列。20μL反應(yīng)體系中含有限制性內(nèi)切酶BglⅡ1μL,含有待酶切的同源修復(fù)序列片段及pFST-1載體0.8ng,37℃反應(yīng)30min;0.7%瓊脂糖凝膠電泳,切膠回收,膠回收試劑盒純化,即得到酶切純化后的同源修復(fù)序列片段及pFST-1載體片段;純化后的同源修復(fù)序列片段與pFST-1載體片段摩爾比3:1,連接液Solution I 5μL,無(wú)菌水補(bǔ)齊到10μL ,16℃反應(yīng)1h,熱擊轉(zhuǎn)化E.coli DH5α感受態(tài)細(xì)胞;均勻涂布于含有30μg/mL卡那霉素的LB固體培養(yǎng)基上,37℃倒置培養(yǎng)16h;挑選陽(yáng)性克隆子,提取質(zhì)粒即為sgRNA表達(dá)載體。
d、若實(shí)現(xiàn)目的基因的替換,構(gòu)建目的基因上游、目的基因編輯后形成的序列和目的基因下游序列連接形成的同源修復(fù)序列,目的基因上、下游序列長(zhǎng)度為300bp~1500bp,并在同源修復(fù)序列兩端引入載體pFST-1 位于BglⅡ酶切位點(diǎn)兩端的同源序列,其中,目的基因的原序列中具有5′-(N20)-NGG-3′結(jié)構(gòu)。將同源修復(fù)序列以及pFST-1載體利用Gibson Assembly Master Mix溶液進(jìn)行組裝,得到sgRNA表達(dá)載體,轉(zhuǎn)化E.coli DH5α。
構(gòu)建體系如下:根據(jù)目的基因基因組序列設(shè)計(jì)引物,分別擴(kuò)增目的基因上游片段、目的基因編輯后形成的序列、目的基因下游片段,目的基因上、下游片段長(zhǎng)度為300bp~1500bp,每?jī)蓚€(gè)片段中間設(shè)計(jì)同源位點(diǎn),可以通過(guò)Gibson Assembly Master Mix溶液進(jìn)行組裝,其中組裝后片段兩端要包含pFST-1位于 BglⅡ酶切位點(diǎn)兩端的同源序列,以便于將片段組裝到載體pFST-1上。20μL反應(yīng)體系中含有限制性內(nèi)切酶BglⅡ1μL,含有待酶切的pFST-1載體0.8ng,37℃反應(yīng)30min;0.7%瓊脂糖凝膠電泳,切膠回收,膠回收試劑盒純化,即得到酶切純化后pFST-1載體片段;純化后的pFST-1載體片段、目的基因上游片段、目的基因編輯后形成序列、目的基因下游片段摩爾比1:3:3:3:3, Gibson Assembly Master Mix溶液 10μL,無(wú)菌水補(bǔ)齊到20μL ,50℃反應(yīng)1h;熱擊轉(zhuǎn)化E.coli DH5α感受態(tài)細(xì)胞;均勻涂布于含有30μg/mL卡那霉素的LB固體培養(yǎng)基上,37℃倒置培養(yǎng)16h;挑選陽(yáng)性克隆子,提取質(zhì)粒即為sgRNA表達(dá)載體。
3、基因編輯
基因編輯過(guò)程如下:
a、提取cas9表達(dá)載體和sgRNA表達(dá)載體,并轉(zhuǎn)化谷氨酸棒狀桿菌;b、培養(yǎng)、篩選,獲得轉(zhuǎn)化子。
基因編輯具體包括基因敲除和基因替換,如圖5所示,其中B為待編輯的目的基因,A、C為待編輯的目的基因兩端的同源片段,D為替換后的基因。
應(yīng)用例1:porb基因的敲除
一種谷氨酸棒狀桿菌的porb基因敲除系統(tǒng),包括cas9表達(dá)載體和sgRNA表達(dá)載體。
1、cas9表達(dá)載體
cas9表達(dá)載體的制備方法如實(shí)施例1中所示。
cas9表達(dá)載體的質(zhì)粒圖譜如圖2所示,其核苷酸序列如SEQ ID No.4所示,其中9359-10678位的核苷酸序列為乳糖操作子,9359-10330位的核苷酸序列為乳糖操縱子中的lacIq基因,10514-10678位的核苷酸為乳糖操縱子中的tac啟動(dòng)子;11-25位核苷酸序列為促進(jìn)翻譯的SD序列; 26-4132位核苷酸序列cas9序列,即針對(duì)谷氨酸棒狀桿菌密碼子優(yōu)化過(guò)的cas9編碼基因;4144-4569位核苷酸序列為調(diào)控cas9基因轉(zhuǎn)錄的終止子rrnb ;8487-9306位核苷酸序列為氯霉素抗性基因;5044-5616位核苷酸序列為大腸桿菌復(fù)制子ori PUC;5801-8355位核苷酸序列為谷氨酸棒狀桿菌復(fù)制子PBL1。
2、sgRNA表達(dá)載體
sgRNA表達(dá)載體,其制備方法如下:
a、制備pFST-1
根據(jù)谷氨酸棒狀桿菌基因組序列(NCBI Reference Sequence: NC_003450.3),針對(duì)porb基因?qū)ふ?′-(N20)-NGG-3′結(jié)構(gòu), porb基因正義鏈的靶點(diǎn)序列、以及針對(duì)靶點(diǎn)序列設(shè)計(jì)的crRNA、sgRNA序列分別如下所示:
靶點(diǎn)序列為:
GGAGGATAGGTTTGCGAAGTCGG;
crRNA序列為:
GGAGGATAGGTTTGCGAAGT,對(duì)應(yīng)序列表中SEQ ID No.5;
sgRNA序列為:
GGAGGATAGGTTTGCGAAGTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT,對(duì)應(yīng)序列表中SEQ ID No.6;
其中,sgRNA交由基因公司合成,同時(shí)在sgRNA序列兩端引入EcoRⅠ和XbaⅠ酶切識(shí)別序列,sgRNA片段和pECXK-99分別EcoRⅠ、XbaⅠ酶切,然后純化、連接,pECXK-99的質(zhì)粒圖譜如圖3所示,獲得pFST-1,轉(zhuǎn)化E.coli DH5α。
b、制備帶有酶切識(shí)別序列的同源修復(fù)序列
根據(jù)porb基因序列設(shè)計(jì)帶有酶切識(shí)別序列的同源修復(fù)序列porb LR,同源修復(fù)序列porb LR由porb基因的上游同源片段porb-L、下游同源片段porb-R依次連接組成,其中porb-L、porb-R分別引入BglⅡ酶切識(shí)別序列。
上游同源片段porb-L的引物為:
porb L-F:5’GAGAGATCTGGAGTGGACAAGTCACGAT 3’;
porb L-R:5’TTGGAGGACATGCCACTGTGATGCCTGCGGTTGCT 3’。
下游同源片段porb-R的引物為:
porb R-F:5’ CACAGTGGCATGTCCTCCAACTTCTCTTCCTAAAA 3’ ;
porb R-R:5’GGCAGATCTGGGTGAACCTGTTTCTATC 3’。
分別擴(kuò)增porb-L和porb-R,然后采用融合pcr的方法融合形成porb LR, porb LR長(zhǎng)度為2068bp,融合后序列如SEQ ID No.7所示。
c、制備sgRNA表達(dá)載體
將帶有酶切識(shí)別序列的同源修復(fù)序列以及pFST-1載體分別BglⅡ酶切,然后純化、連接,得到sgRNA表達(dá)載體,轉(zhuǎn)化E.coli DH5α。
sgRNA表達(dá)載體的質(zhì)粒圖譜如圖4所示、其核苷酸序列如SEQ ID No.8所示,其中7777-9161位核苷酸序列為乳糖操縱子,7777-8859位核苷酸序列為乳糖操縱子中的lacIq基因,8916-9161位核苷酸序列為乳糖操縱子中的trc啟動(dòng)子;7-108位核苷酸序列為trancrRNA 與crRNA 形成一個(gè)tracrRNA-crRNA 復(fù)合體,即sgRNA序列;344-546位核苷酸序列為調(diào)控sgRNA轉(zhuǎn)錄終止的終止子T1和T2;3604-5671位核苷酸序列為同源修復(fù)模板;5705-6499位核苷酸序列為卡那霉素抗性基因;6664-7339位核苷酸序列為大腸桿菌復(fù)制子ori;1644-3107位核苷酸序列為谷氨酸棒狀桿菌復(fù)制子repA。
3、porb基因的敲除具體操作流程:
a、將cas9表達(dá)載體和sgRNA表達(dá)載體質(zhì)粒從E.coli中提出,各取1μg DNA共轉(zhuǎn)化谷氨酸棒狀桿菌感受態(tài),電擊轉(zhuǎn)化條件為1800v,50ms,恢復(fù)培養(yǎng)后涂布于含有氯霉素和卡那霉素的LBB固體培養(yǎng)基,30℃培養(yǎng)36h。
b、挑取平板上的單菌落,利用cas9基因引物;
cas9-F:5’ACAACTAATGGATAAAAAGTATTC 3’;
cas9-R:5’ TATGAATTCTTAGTCGCCACCCA 3’;
驗(yàn)證cas9表達(dá)載體是否正確轉(zhuǎn)入;
用同源片段引物porb L-F 和porb R-R驗(yàn)證sgRNA表達(dá)載體質(zhì)粒是否正確轉(zhuǎn)入。
c、挑選正確的轉(zhuǎn)化子,接種于LBB液體培養(yǎng)基中30℃培養(yǎng)到OD≈1,加入0.1mmIPTG誘導(dǎo)。
d、繼續(xù)培養(yǎng)12h,將培養(yǎng)物劃線與含有卡那霉素、氯霉素以及IPTG的固體培養(yǎng)基中,30℃培養(yǎng)24h。
e、挑取平板上的單菌落用同源片段引物porb L-F 和porb R-R pcr驗(yàn)證獲得目的菌株,同時(shí)把擴(kuò)增出來(lái)的片段進(jìn)行測(cè)序驗(yàn)證,最終根據(jù)基因型及測(cè)序結(jié)果挑選正確的菌株及porb基因敲除菌株,基因型驗(yàn)證結(jié)果如圖6所示。
實(shí)驗(yàn)證明,利用本發(fā)明構(gòu)建的crispr/cas9基因編輯系統(tǒng)對(duì)谷氨酸棒狀桿菌基因組進(jìn)行編輯,具有周期短,節(jié)省成本效率高等優(yōu)點(diǎn),使用該系統(tǒng)對(duì)谷氨酸棒狀桿菌基因編輯效率能達(dá)到100%。
質(zhì)粒的除去,把挑選出的敲除菌株在不加抗生素的培養(yǎng)基中培養(yǎng),質(zhì)粒cas9表達(dá)載體和sgRNA表達(dá)載體即可除去。
SEQUENCE LISTING
<110> 江南大學(xué)
<120> 一種谷氨酸棒狀桿菌的基因編輯系統(tǒng)
<130> 2016
<160> 8
<170> PatentIn version 3.3
<210> 1
<211> 4107
<212> DNA
<213> 人工序列
<400> 1
atggataaaa agtattccat tggcctggac atcggcacca attctgtggg ttgggcagtc 60
atcaccgacg aatacaaggt cccatccaag aagttcaagg tgctcggtaa taccgatcgc 120
cactctatca agaaaaacct gatcggcgcc ctgctcttcg actccggcga aaccgcagaa 180
gcaacccgtc tcaagcgtac cgcacgtcgc cgctacaccc gccgtaagaa tcgcatctgc 240
tacctccagg aaatcttctc taatgagatg gcaaaggtgg atgactcctt tttccaccgc 300
ctcgaagagt ccttcctggt ggaagaggac aagaaacacg agcgccatcc tatcttcggc 360
aatattgtcg atgaagtcgc atatcatgaa aaatacccaa ccatttacca tctccgtaaa 420
aaactcgtcg attccaccga taaggcagat ctccgcctga tctatctggc actggcccac 480
atgatcaagt ttcgtggcca cttcctgatc gaaggtgacc tcaatccaga caattccgac 540
gtggacaagc tgttcatcca gctggtgcaa acctacaacc agctctttga ggaaaaccca 600
atcaacgcat ctggcgtcga cgcaaaagcc atcctgtccg cccgtctctc caagtctcgt 660
cgcctcgaaa acctcattgc ccagctccct ggcgagaaga aaaacggtct gttcggcaat 720
ctgatcgccc tgtctctggg tctgacccca aatttcaaat ccaactttga tctcgcagaa 780
gatgccaagc tgcagctctc taaggacacc tacgatgatg acctggataa cctcctcgcc 840
cagatcggcg accagtacgc cgatctcttc ctcgcagcca agaacctctc tgacgcaatt 900
ctgctgtccg acatcctgcg cgtgaacacc gaaatcacta aggcaccact ctctgcctcc 960
atgattaagc gctacgacga gcatcatcag gatctcactc tcctcaaagc cctggtccgc 1020
cagcagctcc cagagaagta caaggaaatc tttttcgacc aatccaaaaa cggctacgca 1080
ggttacatcg atggcggcgc ctctcaggaa gagttttaca aattcattaa gccaatcctc 1140
gaaaagatgg acggcaccga ggaactgctg gtgaaactca accgtgaaga tctcctgcgc 1200
aaacagcgca ccttcgacaa cggttccatt cctcaccaga tccacctggg cgaactgcac 1260
gcaatcctcc gccgtcaaga ggacttctac ccattcctga aggacaaccg tgaaaagatc 1320
gaaaagattc tcaccttccg catcccttac tacgtgggtc ctctcgcccg tggcaattcc 1380
cgcttcgcct ggatgactcg caaatctgaa gagaccatca ccccttggaa ctttgaggaa 1440
gtcgtcgata aaggcgcctc tgcccaatcc ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctcccaa acgagaaagt gctgcctaag cattccctcc tgtacgagta ctttactgtc 1560
tacaatgagc tgactaaggt gaagtatgtc actgaaggca tgcgtaagcc agcctttctc 1620
tccggcgagc agaaaaaggc aatcgtcgac ctcctgttta aaaccaaccg caaagtgact 1680
gtgaaacagc tcaaggaaga ttactttaaa aaaatcgaat gcttcgattc tgtggaaatc 1740
tccggcgtgg aggatcgttt caacgcctcc ctgggtacct atcacgacct cctgaagatt 1800
atcaaggaca aagattttct ggataacgag gaaaacgagg acattctcga ggacattgtg 1860
ctgaccctga ccctcttcga ggaccgcgag atgatcgagg agcgcctgaa gacctatgcc 1920
cacctctttg acgacaaggt catgaagcaa ctcaagcgcc gccgctatac cggttggggc 1980
cgtctctccc gtaagctcat caatggtatc cgcgacaagc aatccggcaa gactatcctg 2040
gactttctga agtctgacgg cttcgccaac cgcaatttta tgcaactgat ccacgacgat 2100
tccctgacct tcaaagagga catccagaaa gcccaagtgt ccggtcaagg cgactccctg 2160
cacgaacaca tcgccaatct ggcaggttcc ccagcaatca agaagggcat cctgcagacc 2220
gtcaaggtgg tggacgaact cgtcaaagtg atgggtcgcc acaaaccaga aaacatcgtc 2280
atcgagatgg cccgtgagaa ccagaccacc cagaaaggcc agaaaaactc ccgtgagcgc 2340
atgaagcgca ttgaagaagg cattaaagag ctcggctctc agatcctgaa agagcatcct 2400
gtcgagaaca cccaactgca gaatgagaag ctgtatctgt attatctcca gaacggccgc 2460
gacatgtacg tcgaccagga actggacatc aaccgtctct ctgattacga tgtggaccat 2520
atcgtccctc agtctttcct gaaagacgac tctattgaca acaaagtcct cacccgctcc 2580
gacaagaacc gcggcaagtc cgataacgtg ccatccgagg aggtcgtgaa gaagatgaag 2640
aactactggc gccagctgct caacgccaag ctgatcactc agcgcaagtt cgataacctg 2700
accaaggccg aacgtggtgg tctctccgag ctcgacaagg caggctttat caagcgccaa 2760
ctcgtggaga ctcgccaaat cactaaacac gtcgcccaga tcctcgactc ccgcatgaat 2820
accaagtacg atgaaaatga caagctcatc cgcgaagtga aagtcattac cctgaagtcc 2880
aaactggtct ctgactttcg caaggatttc cagttctaca aggtccgcga gattaataac 2940
tatcatcatg cacacgatgc atacctcaac gcagtcgtgg gtaccgcact gatcaagaag 3000
taccctaaac tggagtccga gttcgtctat ggcgactaca aggtgtacga cgtccgcaaa 3060
atgattgcca agtccgagca ggagatcggc aaagcaactg ccaaatattt cttttactcc 3120
aacatcatga acttcttcaa gaccgaaatc accctcgcca acggtgaaat ccgcaaacgt 3180
ccactcatcg agactaatgg tgaaaccggc gagatcgtct gggacaaggg ccgtgacttc 3240
gcaaccgtcc gcaaggtcct ctccatgcca caggtcaaca tcgtgaaaaa gaccgaggtg 3300
caaaccggcg gcttctccaa ggagtctatc ctgcctaaac gcaattccga taagctcatt 3360
gcacgcaaaa aggactggga ccctaaaaaa tacggcggtt tcgactcccc aactgtcgca 3420
tattctgtgc tcgtggtcgc caaagtggaa aagggcaaat ccaaaaagct caagtccgtc 3480
aaggaactcc tgggtatcac catcatggaa cgctcctcct ttgagaagaa ccctatcgat 3540
ttcctcgaag caaaaggtta caaggaggtg aagaaagatc tgatcatcaa gctccctaaa 3600
tactccctct tcgagctcga gaacggccgc aagcgtatgc tggcctccgc aggtgaactg 3660
caaaaaggta acgagctggc actcccatcc aagtatgtca actttctcta cctggcctcc 3720
cactacgaaa agctgaaagg ttccccagaa gacaacgagc agaaacagct gttcgtggag 3780
cagcacaagc actacctgga cgaaatcatc gagcagatct ccgagttctc taaacgcgtc 3840
attctggccg atgccaacct cgataaagtg ctctccgcct acaataagca tcgtgataag 3900
ccaatccgtg agcaggcaga gaacatcatt cacctgttca ctctcaccaa cctgggtgca 3960
ccagccgcct ttaagtactt cgacaccacc atcgaccgca agcgctatac ctccactaag 4020
gaggtgctcg atgcaaccct gatccaccag tctatcaccg gcctctacga gactcgcatc 4080
gatctctccc agctgggtgg cgactaa 4107
<210> 2
<211> 15
<212> DNA
<213> 人工序列
<400> 2
aaaggaggac aacta 15
<210> 3
<211> 82
<212> DNA
<213> 人工序列
<400> 3
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt tt 82
<210> 4
<211> 10678
<212> DNA
<213> 人工序列
<400> 4
aattaagctt aaaggaggac aactaatgga taaaaagtat tccattggcc tggacatcgg 60
caccaattct gtgggttggg cagtcatcac cgacgaatac aaggtcccat ccaagaagtt 120
caaggtgctc ggtaataccg atcgccactc tatcaagaaa aacctgatcg gcgccctgct 180
cttcgactcc ggcgaaaccg cagaagcaac ccgtctcaag cgtaccgcac gtcgccgcta 240
cacccgccgt aagaatcgca tctgctacct ccaggaaatc ttctctaatg agatggcaaa 300
ggtggatgac tcctttttcc accgcctcga agagtccttc ctggtggaag aggacaagaa 360
acacgagcgc catcctatct tcggcaatat tgtcgatgaa gtcgcatatc atgaaaaata 420
cccaaccatt taccatctcc gtaaaaaact cgtcgattcc accgataagg cagatctccg 480
cctgatctat ctggcactgg cccacatgat caagtttcgt ggccacttcc tgatcgaagg 540
tgacctcaat ccagacaatt ccgacgtgga caagctgttc atccagctgg tgcaaaccta 600
caaccagctc tttgaggaaa acccaatcaa cgcatctggc gtcgacgcaa aagccatcct 660
gtccgcccgt ctctccaagt ctcgtcgcct cgaaaacctc attgcccagc tccctggcga 720
gaagaaaaac ggtctgttcg gcaatctgat cgccctgtct ctgggtctga ccccaaattt 780
caaatccaac tttgatctcg cagaagatgc caagctgcag ctctctaagg acacctacga 840
tgatgacctg gataacctcc tcgcccagat cggcgaccag tacgccgatc tcttcctcgc 900
agccaagaac ctctctgacg caattctgct gtccgacatc ctgcgcgtga acaccgaaat 960
cactaaggca ccactctctg cctccatgat taagcgctac gacgagcatc atcaggatct 1020
cactctcctc aaagccctgg tccgccagca gctcccagag aagtacaagg aaatcttttt 1080
cgaccaatcc aaaaacggct acgcaggtta catcgatggc ggcgcctctc aggaagagtt 1140
ttacaaattc attaagccaa tcctcgaaaa gatggacggc accgaggaac tgctggtgaa 1200
actcaaccgt gaagatctcc tgcgcaaaca gcgcaccttc gacaacggtt ccattcctca 1260
ccagatccac ctgggcgaac tgcacgcaat cctccgccgt caagaggact tctacccatt 1320
cctgaaggac aaccgtgaaa agatcgaaaa gattctcacc ttccgcatcc cttactacgt 1380
gggtcctctc gcccgtggca attcccgctt cgcctggatg actcgcaaat ctgaagagac 1440
catcacccct tggaactttg aggaagtcgt cgataaaggc gcctctgccc aatccttcat 1500
cgagcgcatg accaacttcg acaagaacct cccaaacgag aaagtgctgc ctaagcattc 1560
cctcctgtac gagtacttta ctgtctacaa tgagctgact aaggtgaagt atgtcactga 1620
aggcatgcgt aagccagcct ttctctccgg cgagcagaaa aaggcaatcg tcgacctcct 1680
gtttaaaacc aaccgcaaag tgactgtgaa acagctcaag gaagattact ttaaaaaaat 1740
cgaatgcttc gattctgtgg aaatctccgg cgtggaggat cgtttcaacg cctccctggg 1800
tacctatcac gacctcctga agattatcaa ggacaaagat tttctggata acgaggaaaa 1860
cgaggacatt ctcgaggaca ttgtgctgac cctgaccctc ttcgaggacc gcgagatgat 1920
cgaggagcgc ctgaagacct atgcccacct ctttgacgac aaggtcatga agcaactcaa 1980
gcgccgccgc tataccggtt ggggccgtct ctcccgtaag ctcatcaatg gtatccgcga 2040
caagcaatcc ggcaagacta tcctggactt tctgaagtct gacggcttcg ccaaccgcaa 2100
ttttatgcaa ctgatccacg acgattccct gaccttcaaa gaggacatcc agaaagccca 2160
agtgtccggt caaggcgact ccctgcacga acacatcgcc aatctggcag gttccccagc 2220
aatcaagaag ggcatcctgc agaccgtcaa ggtggtggac gaactcgtca aagtgatggg 2280
tcgccacaaa ccagaaaaca tcgtcatcga gatggcccgt gagaaccaga ccacccagaa 2340
aggccagaaa aactcccgtg agcgcatgaa gcgcattgaa gaaggcatta aagagctcgg 2400
ctctcagatc ctgaaagagc atcctgtcga gaacacccaa ctgcagaatg agaagctgta 2460
tctgtattat ctccagaacg gccgcgacat gtacgtcgac caggaactgg acatcaaccg 2520
tctctctgat tacgatgtgg accatatcgt ccctcagtct ttcctgaaag acgactctat 2580
tgacaacaaa gtcctcaccc gctccgacaa gaaccgcggc aagtccgata acgtgccatc 2640
cgaggaggtc gtgaagaaga tgaagaacta ctggcgccag ctgctcaacg ccaagctgat 2700
cactcagcgc aagttcgata acctgaccaa ggccgaacgt ggtggtctct ccgagctcga 2760
caaggcaggc tttatcaagc gccaactcgt ggagactcgc caaatcacta aacacgtcgc 2820
ccagatcctc gactcccgca tgaataccaa gtacgatgaa aatgacaagc tcatccgcga 2880
agtgaaagtc attaccctga agtccaaact ggtctctgac tttcgcaagg atttccagtt 2940
ctacaaggtc cgcgagatta ataactatca tcatgcacac gatgcatacc tcaacgcagt 3000
cgtgggtacc gcactgatca agaagtaccc taaactggag tccgagttcg tctatggcga 3060
ctacaaggtg tacgacgtcc gcaaaatgat tgccaagtcc gagcaggaga tcggcaaagc 3120
aactgccaaa tatttctttt actccaacat catgaacttc ttcaagaccg aaatcaccct 3180
cgccaacggt gaaatccgca aacgtccact catcgagact aatggtgaaa ccggcgagat 3240
cgtctgggac aagggccgtg acttcgcaac cgtccgcaag gtcctctcca tgccacaggt 3300
caacatcgtg aaaaagaccg aggtgcaaac cggcggcttc tccaaggagt ctatcctgcc 3360
taaacgcaat tccgataagc tcattgcacg caaaaaggac tgggacccta aaaaatacgg 3420
cggtttcgac tccccaactg tcgcatattc tgtgctcgtg gtcgccaaag tggaaaaggg 3480
caaatccaaa aagctcaagt ccgtcaagga actcctgggt atcaccatca tggaacgctc 3540
ctcctttgag aagaacccta tcgatttcct cgaagcaaaa ggttacaagg aggtgaagaa 3600
agatctgatc atcaagctcc ctaaatactc cctcttcgag ctcgagaacg gccgcaagcg 3660
tatgctggcc tccgcaggtg aactgcaaaa aggtaacgag ctggcactcc catccaagta 3720
tgtcaacttt ctctacctgg cctcccacta cgaaaagctg aaaggttccc cagaagacaa 3780
cgagcagaaa cagctgttcg tggagcagca caagcactac ctggacgaaa tcatcgagca 3840
gatctccgag ttctctaaac gcgtcattct ggccgatgcc aacctcgata aagtgctctc 3900
cgcctacaat aagcatcgtg ataagccaat ccgtgagcag gcagagaaca tcattcacct 3960
gttcactctc accaacctgg gtgcaccagc cgcctttaag tacttcgaca ccaccatcga 4020
ccgcaagcgc tatacctcca ctaaggaggt gctcgatgca accctgatcc accagtctat 4080
caccggcctc tacgagactc gcatcgatct ctcccagctg ggtggcgact aagaattcag 4140
cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa atcagaacgc 4200
agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac 4260
cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 4320
gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 4380
ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg 4440
agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata 4500
aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 4560
acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 4620
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 4680
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 4740
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 4800
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 4860
tgagcacttt tgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 4920
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 4980
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 5040
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 5100
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 5160
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 5220
cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg gtgtaggtcg 5280
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 5340
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 5400
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 5460
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 5520
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 5580
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 5640
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 5700
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttgggg tgggcgaaga 5760
actccagcat gagatccccg cgctggagga tcatccagcc attcggggtc gttcactggt 5820
tcccctttct gatttctggc atagaagaac ccccgtgaac tgtgtggttc cgggggttgc 5880
tgatttttgc gagacttctc gcgcaattcc ctagcttagg tgaaaacacc atgaaacact 5940
agggaaacac ccatgaaaca cccattaggg cagtagggcg gcttcttcgt ctagggcttg 6000
catttgggcg gtgatctggt ctttagcgtg tgaaagtgtg tcgtaggtgg cgtgctcaat 6060
gcactcgaac gtcacgtcat ttaccgggtc acggtgggca aagagaacta gtgggttaga 6120
cattgttttc ctcgttgtcg gtggtggtga gcttttctag ccgctcggta aacgcggcga 6180
tcatgaactc ttggaggttt tcaccgttct gcatgcctgc gcgcttcatg tcctcacgta 6240
gtgccaaagg aacgcgtgcg gtgaccacga cgggcttagc ctttgcctgc gcttctagtg 6300
cttcgatggt ggcttgtgcc tgcgcttgct gcgcctgtag tgcctgttga gcttcttgta 6360
gttgctgttc tagctgtgcc ttggttgcca tgctttaaga ctctagtagc tttcctgcga 6420
tatgtcatgc gcatgcgtag caaacattgt cctgcaactc attcattatg tgcagtgctc 6480
ctgttactag tcgtacatac tcatatttac ctagtctgca tgcagtgcat gcacatgcag 6540
tcatgtcgtg ctaatgtgta aaacatgtac atgcagattg ctgggggtgc agggggcgga 6600
gccaccctgt ccatgcgggg tgtggggctt gccccgccgg tacagacagt gagcaccggg 6660
gcacctagtc gcggataccc cccctaggta tcggacacgt aaccctccca tgtcgatgca 6720
aatctttaac attgagtacg ggtaagctgg cacgcatagc caagctaggc ggccaccaaa 6780
caccactaaa aattaatagt ccctagacaa gacaaacccc cgtgcgagct accaactcat 6840
atgcacgggg gccacataac ccgaaggggt ttcaattgac aaccatagca ctagctaaga 6900
caacgggcac aacacccgca caaactcgca ctgcgcaacc ccgcacaaca tcgggtctag 6960
gtaacactga gtaacactga aatagaagtg aacacctcta aggaaccgca ggtcaatgag 7020
ggttctaagg tcactcgcgc tagggcgtgg cgtaggcaaa acgtcatgta caagatcacc 7080
aatagtaagg ctctggcggg gtgccatagg tggcgcaggg acgaagctgt tgcggtgtcc 7140
tggtcgtcta acggtgcttc gcagtttgag ggtctgcaaa actctcactc tcgctggggg 7200
tcacctctgg ctgaattgga agtcatgggc gaacgccgca ttgagctggc tattgctact 7260
aagaatcact tggcggcggg tggcgcgctc atgatgtttg tgggcactgt tcgacacaac 7320
cgctcacagt catttgcgca ggttgaagcg ggtattaaga ctgcgtactc ttcgatggtg 7380
aaaacatctc agtggaagaa agaacgtgca cggtacgggg tggagcacac ctatagtgac 7440
tatgaggtca cagactcttg ggcgaacggt tggcacttgc accgcaacat gctgttgttc 7500
ttggatcgtc cactgtctga cgatgaactc aaggcgtttg aggattccat gttttcccgc 7560
tggtctgctg gtgtggttaa ggccggtatg gacgcgccac tgcgtgagca cggggtcaaa 7620
cttgatcagg tgtctacctg gggtggagac gctgcgaaaa tggcaaccta cctcgctaag 7680
ggcatgtctc aggaactgac tggctccgct actaaaaccg cgtctaaggg gtcgtacacg 7740
ccgtttcaga tgttggatat gttggccgat caaagcgacg ccggcgagga tatggacgct 7800
gttttggtgg ctcggtggcg tgagtatgag gttggttcta aaaacctgcg ttcgtcctgg 7860
tcacgtgggg ctaagcgtgc tttgggcatt gattacatag acgctgatgt acgtcgtgaa 7920
atggaagaag aactgtacaa gctcgccggt ctggaagcac cggaacgggt cgaatcaacc 7980
cgcgttgctg ttgctttggt gaagcccgat gattggaaac tgattcagtc tgatttcgcg 8040
gttaggcagt acgttctcga ttgcgtggat aaggctaagg acgtggccgc tgcgcaacgt 8100
gtcgctaatg aggtgctggc aagtctgggt gtggattcca ccccgtgcat gatcgttatg 8160
gatgatgtgg acttggacgc ggttctgcct actcatgggg acgctactaa gcgtgatctg 8220
aatgcggcgg tgttcgcggg taatgagcag actattcttc gcacccacta aaagcggcat 8280
aaaccccgtt cgatattttg tgcgatgaat ttatggtcaa tgtcgcgggg gcaaactatg 8340
atgggtcttg ttgttggcgt cccggaaaac gattccgaag cccaaccttt catagaaggc 8400
ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc gcttggtcgg tcatttcgaa 8460
gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt 8520
tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga 8580
atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg 8640
ggggcgaaga agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag 8700
ggattggctg agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt 8760
tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg 8820
tattcactcc agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg 8880
tgaacactat cccatatcac cagctcaccg tctttcattg ccatacggaa ctccggatga 8940
gcattcatca ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc 9000
tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga 9060
gcaactgact gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg 9120
gtatatccag tgattttttt ctccatttta gcttccttag ctcctgaaaa tctcgtcgaa 9180
gctcggcgga tttgtcctac tcaagctgat ccgacaaaat ccacacatta tcccaggtgt 9240
ccggatcggt caaatacgct gccagctcat agaccgtatc caaagcatcc ggggctgatc 9300
cccggcgcca gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 9360
accgcctggc cctgagagag ttgcagcaag cggtccacgt ggtttgcccc agcaggcgaa 9420
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 9480
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 9540
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 9600
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 9660
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 9720
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 9780
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 9840
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 9900
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 9960
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 10020
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 10080
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 10140
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 10200
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 10260
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 10320
cttccgggcg ctatcatgcc ataccgcgaa aggttttgca ccattcgatg gtgtcaacgt 10380
aaatgccgct tcgccttcgc gcgcgaattg caagctgatc cgggcttatc gactgcacgg 10440
tgcaccaatg cttctggcgt caggcagcca tcggaagctg tggtatggct gtgcaggtcg 10500
taaatcactg cataattcgt gtcgctcaag gcgcactccc gttctggata atgttttttg 10560
cgccgacatc ataacggttc tggcaaatat tctgaaatga gctgttgaca attaatcatc 10620
ggctcgtata atgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagaatt 10678
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
ggaggatagg tttgcgaagt 20
<210> 6
<211> 102
<212> DNA
<213> 人工序列
<400> 6
ggaggatagg tttgcgaagt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102
<210> 7
<211> 2068
<212> DNA
<213> 人工序列
<400> 7
ggagtggaca agtcacgatc gttggaacac aacaggtttg cggcactcaa tgctgcgtca 60
tcaatttggt tggggtccgc taccccatca ccgtttgcat ccaatcccat aagtcgccac 120
gtttccggaa tgaactgcat gggacctacc gcgcgatcat attcagtatc gccatctaat 180
tccccaccat cagtgtcggg aatttccgca aaccccggtg aaccatcaag tggaacgccg 240
atgattggag gggttgcaac tccattttca tccagggaac tgcccccgaa cattttgccg 300
ttgtaggtac cgtgacgggt ttccacctgg ccgatacctg ccaaggtatt ccaccccaga 360
ttgcagccag accacgcagt actcgcaatg agctctgcgt ttccataagc cgcaatcgct 420
tgagcggaca caccagtatc ttgagcaatt ggttccgccc aaaaacgcaa atggtcggat 480
gtgcgtccat ctgcccctgt atcaatttgc ggaacttcta caccacgcgc cggcggaaca 540
tcttcaggga tttgctggag ttggcgaata ggtgccgttc catccatgaa gctaagcgcc 600
catccaacaa atgagatcac catgatgacg gccaaaaccg aaccgcatcc aaatcccatt 660
gcttttctaa cccctgaact catgagggtc gatgttaccg gctcgtttta gaactctcgc 720
attggctaga aaaacctgat tacttcacgc ctctttaagt aaaaaatcct gtgtctttct 780
aaccaaaaga cccaaaaaga cacgctaaat cagcctccta tgcaattagt agagcattca 840
catacaccgt gccaagacct aatttccacg actgaaactt caccaaatcc gcaggtagaa 900
actttgatga tctacatcac aaatttacaa tgtgtgatga gttgttcata taacccaagg 960
acttgaacct taaaaggagc cttagaatca tgaagctttc acaccgcatc gcagcaatgg 1020
cagcaaccgc aggcatcaca gtggcatgtc ctccaacttc tcttcctaaa aggttcgggg 1080
gtaaccccaa aaatcactta agccacaaca gtcacataaa tcacttcagt aacgtacgat 1140
tttggactgt tgtggctttt gccatattta tttcatttcc atctcagtga tctcttaagg 1200
aaacccatga agaaactacg tttcgccacc atcgcggccg ctaccgttgc cctgactgcg 1260
agcctttccc tctcagcttc cgcacaggac ttcaaccaaa tcatcgacaa ctttgattgt 1320
ggcatcctcc agaccgctat ctacaccacc ggtctggctc acgagaactc cactcgctca 1380
gagctcgctg ctaatctgcg caactccgca gctgtcggcc aactagactt cccattgaat 1440
atcgcggcta ccggctactc cgagcgcatc gctaaccgcg cactgacctg cggaatcgtg 1500
aaggaagatc cacaggactt cctctcccag ctgcagcttc tgtcctctaa cctatcttct 1560
tccttcttca ctgcttagtt tctcttgggc ttttccttga gcccacagcc gttgctgctc 1620
gacggtgtcc acaattccgg tggagccgtc gaacaggttc ggcgaacgag attgcatctt 1680
ggctacgaaa ctcgccgcca cgtcaaaaat gtcgaatcga ccctgacggg cggcgatttc 1740
tgcatgaaaa agcacctgca gcaaaacatc ccccagtgcg cttttcatgt gctcatcatc 1800
gccaccatga atcgcttcaa taaactcctg cgattcttct tccagatacg gaatcaaact 1860
ctcatgggtt tgcgtgcgtt cccactcgcc gcggcccacg gccgcccgca tgacgccgac 1920
ggcctcatgc aaagggttga ggggcgcgtc gataagcagc gtgctttgcg gttttgcggt 1980
gataaaccag gaggcgcttg tcgacgtctt gatcccccat ttttcaatat caaatggaaa 2040
atcgggatcg atagaaacag gttcaccc 2068
<210> 8
<211> 9167
<212> DNA
<213> 人工序列
<400> 8
gaattcggag gataggtttg cgaagtgttt tagagctaga aatagcaagt taaaataagg 60
ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttc tagagtcgac 120
ctgcaggcat gcaagcttgg ctgttttggc ggatgagaga agattttcag cctgatacag 180
attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 240
gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 300
gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 360
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 420
gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 480
aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 540
cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 600
ccgctcatga attaattccg ctagatgacg tgcggcttcg acctcctggg cgtggcgctt 660
gttggcgcgc tcgcggctgg ctgcggcacg acacgcgtct gagcagtatt ttgcgcgccg 720
tcctcgtggg tcaggccggg gtgggatcag gccaccgcag taggcgcagc tgatgcgatc 780
ctccactact gcgcgtcctc ctggcgctgc cgagcacgca gctcgtcggc cagctcttca 840
aggtcggcca caagcgtttc taggtcgctc gcggcacttg cccagtcgcg tgatgctggc 900
gcgtctgtcg tatcgagggc gcggaaaaat ccgatcaccg tttttaaatc gacggcggca 960
tcgagtgcgt cggactccag cgcgacatcg gagagatcca ccgctgatgc ttcaggccag 1020
ttttggtact tcgtcgtgaa ggtcatgaca ccattataac gaacgttcgt taaaaattct 1080
agccccaatt ctgataattt cttccggcac tcctgcgaaa acctgcgaga cttcttgccc 1140
agaaaaaacg ccaagcgcag cggttaccgc actttttttc caggtgattt caccctgacc 1200
agcgaagcgg cactttagtg catgaggtgt gcccctggtt tcccctcttt ggagggttca 1260
acccaaaaaa gcacacaagc aaaaatgaaa atcatcatga gcaagttggt gcgaagcagc 1320
aacgcgctag ctccaaaaag gtctccagga tctcgaggag atttttgagg gggagggagt 1380
cgaggaagag ccagagcaga aggcggggaa ccgttctctg ccgacagcgt gagcccccct 1440
taaaaatcag gccggggagg aaccggggag ggatcagagc taggagcgag acaccctaaa 1500
gggggggaac cgttttctgc tgacggtgtt tcgtttatta gttttcagcc cgtggatagc 1560
ggagggtgag ggcaagtgag agccagagca aggacgggac ccctaaaggg gggaaccgtt 1620
ttctgctgac ggtgtttcgt ttattagttt tcagcccgtg gacggccgcg tttagcttcc 1680
attccaagtg cctttctgac ttgttggatg cgcctttcac tgacacctag ttcgcctgca 1740
agctcacgag tcgagggatc agcaaccgat tgagaacggg catccaggat cgcagttttg 1800
acgcgaagtt cgagcaactc gcctgtcatt tctcggcgtt tgtttgcttc cgctaatcgc 1860
tgtcgcgtct cctgcgcata cttactttct gggtcagccc atctgcgtgc attcgatgta 1920
gctgcgcccc gtcgccccat cgtcgctaga gctttccgcc ctcggctgct ctgcgtttcc 1980
acccgacgag cagggacgac tggctggcct ttagccacgt agccgcgcac acgacgcgcc 2040
atcgtcaggc gatcacgcat ggcgggaaga tccggctccc ggccgtctgc accgaccgcc 2100
tgggcaacgt tgtacgccac ttcatacgcg tcgatgatct tggcatcttt taggcgctca 2160
ccagcagctt tgagctggta tcccacggtc aacgcgtggc gaaacgcggt ctcgtcgcgc 2220
gctcgctctg gatttgtcca gagcactcgc acgccgtcga tcaggtcgcc ggacgcgtcc 2280
agggcgctcg gcaggctcgc gtccaaaatc gctagcgcct tggcttctgc ggtggcgcgt 2340
tgtgccgctt caatgcgggc gcgtccgctg gaaaagtcct gctcaatgta ctttttcggc 2400
ttctgtgatc cggtcatcgt tcgagcaatc tccattaggt cggccagccg atccacacga 2460
tcatgctggc agtgccattt ataggctgtc ggatcgtctg agacgtgcag cggccaccgg 2520
ctcagcctat gcgaaaaagc ctggtcagcg ccgaaaacac gagtcatttc ttccgtcgtt 2580
gcagccagca ggcgcatatt tgggctggtt ttacctgctg cggcatacac cgggtcaatg 2640
agccagatga gctggcattt cccgctcagc ggattcacgc cgatccaagc cggcgctttt 2700
tctaggcgtg cccatttctc taaaatcgcg tagacctgcg ggtttacgtg ctcaatcttc 2760
ccgccggcct ggtggctggg cacatcgatg tcaagcacga tcaccgcggc atgttgcgcg 2820
tgcgtcagcg caacgtactg gcaccgcgtc agcgcttttg agccagcccg gtagagcttt 2880
ggttgggttt cgccggtatc cgggttttta atccaggcgc tcgcgaaatc tcttgtcttg 2940
ctgccctgga agctttcgcg tcccaggtga gcgagcagtt cgcggcgatc ttctgccgtc 3000
cagccgcgtg agccgcagcg catagcttcg gggtgggtgt cgaacagatc ggcggacaat 3060
ttccacgcgc tagctgtgac tgtgtcctgc ggatcggcta gagtcatgtc ttgagtgctt 3120
tctcccagct gatgactggg ggttagccga cgccctgtga gttcccgctc acggggcgtt 3180
caactttttc aggtatttgt gcagcttatc gtgttttctt cgtaaatgaa cgcttaacta 3240
ccttgttaaa cgtggcaaat aggcaggatt gatggggatc tagcttcacg ctgccgcaag 3300
cactcagggc gcaagggctg ctaaaggaag cggaacacgt agaaagccag tccgcagaaa 3360
cggtgctgac cccggatgaa tgtcagctac tgggctatct ggacaaggga aaacgcaagc 3420
gcaaagagaa agcaggtagc ttgcagtggg cttacatggc gatagctaga ctgggcggtt 3480
ttatggacag caagcgaacc ggaattgcca gctggggcgc cctctggtaa ggttgggaag 3540
ccctgcaaag taaactggat ggctttcttg ccgccaagga tctgatggcg caggggatca 3600
agaggagtgg acaagtcacg atcgttggaa cacaacaggt ttgcggcact caatgctgcg 3660
tcatcaattt ggttggggtc cgctacccca tcaccgtttg catccaatcc cataagtcgc 3720
cacgtttccg gaatgaactg catgggacct accgcgcgat catattcagt atcgccatct 3780
aattccccac catcagtgtc gggaatttcc gcaaaccccg gtgaaccatc aagtggaacg 3840
ccgatgattg gaggggttgc aactccattt tcatccaggg aactgccccc gaacattttg 3900
ccgttgtagg taccgtgacg ggtttccacc tggccgatac ctgccaaggt attccacccc 3960
agattgcagc cagaccacgc agtactcgca atgagctctg cgtttccata agccgcaatc 4020
gcttgagcgg acacaccagt atcttgagca attggttccg cccaaaaacg caaatggtcg 4080
gatgtgcgtc catctgcccc tgtatcaatt tgcggaactt ctacaccacg cgccggcgga 4140
acatcttcag ggatttgctg gagttggcga ataggtgccg ttccatccat gaagctaagc 4200
gcccatccaa caaatgagat caccatgatg acggccaaaa ccgaaccgca tccaaatccc 4260
attgcttttc taacccctga actcatgagg gtcgatgtta ccggctcgtt ttagaactct 4320
cgcattggct agaaaaacct gattacttca cgcctcttta agtaaaaaat cctgtgtctt 4380
tctaaccaaa agacccaaaa agacacgcta aatcagcctc ctatgcaatt agtagagcat 4440
tcacatacac cgtgccaaga cctaatttcc acgactgaaa cttcaccaaa tccgcaggta 4500
gaaactttga tgatctacat cacaaattta caatgtgtga tgagttgttc atataaccca 4560
aggacttgaa ccttaaaagg agccttagaa tcatgaagct ttcacaccgc atcgcagcaa 4620
tggcagcaac cgcaggcatc acagtggcat gtcctccaac ttctcttcct aaaaggttcg 4680
ggggtaaccc caaaaatcac ttaagccaca acagtcacat aaatcacttc agtaacgtac 4740
gattttggac tgttgtggct tttgccatat ttatttcatt tccatctcag tgatctctta 4800
aggaaaccca tgaagaaact acgtttcgcc accatcgcgg ccgctaccgt tgccctgact 4860
gcgagccttt ccctctcagc ttccgcacag gacttcaacc aaatcatcga caactttgat 4920
tgtggcatcc tccagaccgc tatctacacc accggtctgg ctcacgagaa ctccactcgc 4980
tcagagctcg ctgctaatct gcgcaactcc gcagctgtcg gccaactaga cttcccattg 5040
aatatcgcgg ctaccggcta ctccgagcgc atcgctaacc gcgcactgac ctgcggaatc 5100
gtgaaggaag atccacagga cttcctctcc cagctgcagc ttctgtcctc taacctatct 5160
tcttccttct tcactgctta gtttctcttg ggcttttcct tgagcccaca gccgttgctg 5220
ctcgacggtg tccacaattc cggtggagcc gtcgaacagg ttcggcgaac gagattgcat 5280
cttggctacg aaactcgccg ccacgtcaaa aatgtcgaat cgaccctgac gggcggcgat 5340
ttctgcatga aaaagcacct gcagcaaaac atcccccagt gcgcttttca tgtgctcatc 5400
atcgccacca tgaatcgctt caataaactc ctgcgattct tcttccagat acggaatcaa 5460
actctcatgg gtttgcgtgc gttcccactc gccgcggccc acggccgccc gcatgacgcc 5520
gacggcctca tgcaaagggt tgaggggcgc gtcgataagc agcgtgcttt gcggttttgc 5580
ggtgataaac caggaggcgc ttgtcgacgt cttgatcccc catttttcaa tatcaaatgg 5640
aaaatcggga tcgatagaaa caggttcacc ctctgatcaa gagacaggat gaggatcgtt 5700
tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 5760
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 5820
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 5880
actccaagac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 5940
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 6000
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 6060
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 6120
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 6180
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcggatgcc 6240
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 6300
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 6360
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 6420
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 6480
tcttgacgag ttcttctgag cgggactctg gggttcgcgg aatcatgacc aaaatccctt 6540
aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 6600
gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 6660
cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 6720
gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 6780
agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 6840
ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 6900
cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 6960
acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 7020
gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 7080
ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 7140
agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 7200
cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 7260
tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 7320
gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 7380
ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta 7440
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 7500
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 7560
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 7620
gttttcaccg tcatcaccga aacgcgcgag gcagcagatc aattcgcgcg cgaaggcgaa 7680
gcggcatgca tttacgttga caccatcgaa tggtgcaaaa cctttcgcgg tatggcatga 7740
tagcgcccgg aagagagtca attcagggtg gtgaatgtga aaccagtaac gttatacgat 7800
gtcgcagagt atgccggtgt ctcttatcag accgtttccc gcgtggtgaa ccaggccagc 7860
cacgtttctg cgaaaacgcg ggaaaaagtg gaagcggcga tggcggagct gaattacatt 7920
cccaaccgcg tggcacaaca actggcgggc aaacagtcgt tgctgattgg cgttgccacc 7980
tccagtctgg ccctgcacgc gccgtcgcaa attgtcgcgg cgattaaatc tcgcgccgat 8040
caactgggtg ccagcgtggt ggtgtcgatg gtagaacgaa gcggcgtcga agcctgtaaa 8100
gcggcggtgc acaatcttct cgcgcaacgc gtcagtgggc tgatcattaa ctatccgctg 8160
gatgaccagg atgccattgc tgtggaagct gcctgcacta atgttccggc gttatttctt 8220
gatgtctctg accagacacc catcaacagt attattttct cccatgaaga cggtacgcga 8280
ctgggcgtgg agcatctggt cgcattgggt caccagcaaa tcgcgctgtt agcgggccca 8340
ttaagttctg tctcggcgcg tctgcgtctg gctggctggc ataaatatct cactcgcaat 8400
caaattcagc cgatagcgga acgggaaggc gactggagtg ccatgtccgg ttttcaacaa 8460
accatgcaaa tgctgaatga gggcatcgtt cccactgcga tgctggttgc caacgatcag 8520
atggcgctgg gcgcaatgcg cgccattacc gagtccgggc tgcgcgttgg tgcggatatc 8580
tcggtagtgg gatacgacga taccgaagac agctcatgtt atatcccgcc gtcaaccacc 8640
atcaaacagg attttcgcct gctggggcaa accagcgtgg accgcttgct gcaactctct 8700
cagggccagg cggtgaaggg caatcagctg ttgcccgtct cactggtgaa aagaaaaacc 8760
accctggcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 8820
ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 8880
ttagcgcgaa ttgatctggt ttgacagctt atcatcgact gcacggtgca ccaatgcttc 8940
tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 9000
attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 9060
cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 9120
tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatg 9167