本發(fā)明涉及用于重組蛋白生產(chǎn)的異源系統(tǒng)。特別地,本發(fā)明涉及在基于經(jīng)改進(jìn)的毒物-解毒劑系統(tǒng)生產(chǎn)蛋白質(zhì)的方法中使用的宿主細(xì)胞。
背景技術(shù):
現(xiàn)今,微生物廣泛地用于蛋白質(zhì)或DNA生產(chǎn)。通常來說,這些過程需要使用細(xì)菌質(zhì)粒作為載體攜帶所需表達(dá)基因。然而,質(zhì)粒在微生物內(nèi)的維持受到限制,并且因此質(zhì)粒不穩(wěn)定性代表重組蛋白生產(chǎn)或DNA生產(chǎn)方面的顯著問題。
已證明攜帶質(zhì)粒細(xì)胞的生長速率相對(duì)于無質(zhì)粒細(xì)胞顯著降低。一種理論是質(zhì)粒復(fù)制和轉(zhuǎn)錄以及蛋白質(zhì)生產(chǎn)代表對(duì)細(xì)胞代謝的顯著負(fù)擔(dān)。因此,在發(fā)酵過程中,丟失質(zhì)粒的細(xì)胞展現(xiàn)出比仍攜帶該質(zhì)粒的細(xì)胞更高的適合度,并且前者迅速在細(xì)菌群中戰(zhàn)勝后者。
為了限制細(xì)胞群中的質(zhì)粒丟失并且為了避免無質(zhì)粒細(xì)胞存活下來且在培養(yǎng)物中占主要優(yōu)勢,在質(zhì)粒中插入選擇標(biāo)記。
發(fā)酵操作中最常用的選擇標(biāo)記是抗生素抗性基因。然而,從醫(yī)療或調(diào)節(jié)方面考慮,抗生素(或編碼抗生素抗性的基因)污染產(chǎn)物或生物質(zhì)是不能接受的。此外,抗生素抗性基因可在環(huán)境中增殖或者轉(zhuǎn)移至致病性菌株。再者,最近的研究表明在生產(chǎn)重組蛋白中使用抗生素抗性基因強(qiáng)烈降低蛋白質(zhì)生產(chǎn)的產(chǎn)率(Peubez等,Microbial Cell factories,2010,9:65)
因此,需要允許質(zhì)粒維持,并且沒有抗生素抗性基因的缺點(diǎn)的其他系統(tǒng)。
使用抗生素抗性基因的一個(gè)替代方案是通過插入到質(zhì)粒中的野生型等位基因來互補(bǔ)必需的突變?nèi)旧w基因。例如,開發(fā)了這樣的系統(tǒng),其中突變宿主在沒有攜帶提供該功能的基因的質(zhì)粒下不能夠合成必需氨基酸。然而,該方法強(qiáng)烈限制了生長培養(yǎng)基的可能選擇。
開發(fā)的另一策略是這樣的系統(tǒng),其中質(zhì)粒介導(dǎo)的阻遏物滴定戰(zhàn)勝置于lac操縱子控制之下的必需染色體基因的阻遏。然而,該方法具有以下限制:(i)其使Lac啟動(dòng)子不能用于其他目的,例如蛋白質(zhì)表達(dá);(ii)該系統(tǒng)局限于大腸桿菌(E.coli)或其他Lac啟動(dòng)子具有功能性的細(xì)菌;以及(iii)必須避免含有乳糖的培養(yǎng)基。
使用抗生素抗性基因的另一替代系統(tǒng)基于毒物蛋白(即,對(duì)宿主細(xì)胞具有毒性的分子)與其解毒劑組合的對(duì)。例如,毒物基因可由宿主細(xì)胞從染色體拷貝表達(dá),而解毒劑由質(zhì)粒攜帶。因此,宿主細(xì)胞的存活需要該質(zhì)粒的存在。毒物/解毒劑對(duì)的一個(gè)實(shí)例是ccdA(解毒劑)/ccdB(毒物)系統(tǒng)。CcdA和CcdB是由大腸桿菌F質(zhì)粒編碼的解毒劑和毒物蛋白。在一起時(shí),他們確保未接受F拷貝的子細(xì)胞死亡。ccdB蛋白的表達(dá)干擾DNA促旋酶的重新連接步驟,導(dǎo)致宿主細(xì)胞染色體被切成片段。解毒劑/毒物對(duì)的另一些實(shí)例包括但不限于Kis/Kid蛋白、Phd/Doc蛋白、RelB/relE蛋白PasB(或PasC)/PasA蛋白、mazF/maze蛋白。
該解毒劑/毒物系統(tǒng)已廣泛地用于克隆方法中,如例如美國專利US8,470,580中所述的:將包含編碼毒物的基因的宿主細(xì)胞與包含編碼相應(yīng)解毒劑的基因的質(zhì)粒組合使用。因此,該系統(tǒng)允許直接選擇整合有目的基因的細(xì)胞,因?yàn)閮H表達(dá)解毒劑基因的細(xì)胞存活下來。
該系統(tǒng)還用于蛋白質(zhì)生產(chǎn),如發(fā)明人之前所述的(Szpirer和Milinkovitch,BioTechniques,2005,38(5):775-781)。出乎意料的是,觀察到重組蛋白的生產(chǎn)水平增加3至5倍,表明該系統(tǒng)具有用于生產(chǎn)重組蛋白的巨大潛力。
然而,發(fā)明人觀察到,當(dāng)將該系統(tǒng)用于生產(chǎn)毒性蛋白時(shí),可出現(xiàn)一些缺點(diǎn),例如,如目的基因突變、解毒劑/毒物系統(tǒng)突變,等等。期望開發(fā)經(jīng)改進(jìn)的質(zhì)粒穩(wěn)定系統(tǒng),發(fā)明人對(duì)包含與一個(gè)拷貝毒物基因組合的一個(gè)拷貝解毒劑基因的典型系統(tǒng)進(jìn)行了改進(jìn)。令人吃驚且出乎意料的是,顯示在宿主細(xì)胞的基因組中插入額外拷貝的毒物基因提高質(zhì)粒的穩(wěn)定性,而且還提高蛋白質(zhì)生產(chǎn)的產(chǎn)率(以不相關(guān)方式)。
發(fā)明概述
因此,本發(fā)明涉及用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的宿主細(xì)胞,其中所述宿主細(xì)胞包含至少2個(gè)拷貝的編碼毒物蛋白的核酸序列。在一個(gè)實(shí)施方案中,所述至少2個(gè)拷貝在不同于編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列的復(fù)制子中。在一個(gè)實(shí)施方案中,所述毒物蛋白是由SEQ ID NO:1或與SEQ ID NO:1具有至少75%同一性的任意核酸序列編碼的CcdB。
在一個(gè)實(shí)施方案中,所述宿主細(xì)胞還包含至少1個(gè)拷貝的編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列。在一個(gè)實(shí)施方案中,所述解毒劑蛋白是由SEQ ID NO:13或與SEQ ID NO:13具有至少75%同一性的任意核酸序列編碼的CcdA。
在一個(gè)實(shí)施方案中,編碼解毒劑蛋白的核酸序列由質(zhì)粒攜帶,所述質(zhì)粒還包含插入有或能夠插入有編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的表達(dá)系統(tǒng)。在另一個(gè)實(shí)施方案中,所述表達(dá)系統(tǒng)包含選自包含T7啟動(dòng)子、Ptrc、Para和Plac的組的啟動(dòng)子。在另一個(gè)實(shí)施方案中,所述表達(dá)系統(tǒng)包含T7啟動(dòng)子,并且所述宿主細(xì)胞還包含優(yōu)選地插入在所述宿主的基因組中,更優(yōu)選地插入在T7表達(dá)系統(tǒng)中的T7RNA聚合酶基因。在另一個(gè)實(shí)施方案中,所述表達(dá)系統(tǒng)包含T7啟動(dòng)子,并且所述宿主細(xì)胞還包含插入在其基因組中的經(jīng)遺傳修飾的噬菌體,優(yōu)選地所述噬菌體限定為以下噬菌體,其中:
-插入T7表達(dá)系統(tǒng),
-S、R和/或Q基因失活,并且
-Int和/或Xis基因失活。
在一個(gè)實(shí)施方案中,所述宿主細(xì)胞是細(xì)菌,優(yōu)選革蘭氏陰性細(xì)菌,更優(yōu)選腸桿菌科(Enterobacteriacea),并且甚至更優(yōu)選大腸桿菌。
在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞還包含基因tonA、galK、araB、araA、lon、ompT、rcsA、hsdR、mrr、endA和recA中至少一個(gè)的失活。在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞還包含gyrA基因的至少一個(gè)額外拷貝。
本發(fā)明還涉及試劑盒,其包含如上文所述的宿主細(xì)胞和載體,所述載體包含至少一個(gè)拷貝的編碼解毒劑蛋白的核酸序列和至少一個(gè)拷貝的插入有或能夠插入有編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的表達(dá)系統(tǒng)。在一個(gè)實(shí)施方案中,編碼目的肽、多肽或蛋白質(zhì)的核酸序列在選自包括T7啟動(dòng)子、Ptrc、Para和Plac的組的啟動(dòng)子控制之下。
本發(fā)明的一個(gè)目的是用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的方法,其中所述方法包括培養(yǎng)上述宿主細(xì)胞并回收目的肽、多肽或蛋白質(zhì)。
在一個(gè)實(shí)施方案中,所述重組蛋白是分泌蛋白、跨膜蛋白或?qū)?xì)菌菌株具有毒性的蛋白質(zhì)。
定義
在本發(fā)明中,下述術(shù)語具有以下含義:
-本文中使用的“肽”指少于50個(gè)氨基酸通過肽鍵連接在一起的線性氨基酸聚合物;“多肽”指至少50個(gè)氨基酸通過肽鍵連接在一起的線性聚合物;蛋白質(zhì)特別地指由一個(gè)或更多個(gè)肽或多肽以及任選地非多肽輔因子形成的功能性實(shí)體。
-“重組肽、多肽或蛋白質(zhì)”指由重組DNA,即由人工插入在生產(chǎn)宿主細(xì)胞中的DNA產(chǎn)生的肽、多肽或蛋白質(zhì)。
-“毒物蛋白”指對(duì)生產(chǎn)該毒物蛋白的宿主細(xì)胞具有毒性的蛋白質(zhì)。
因此,本文中使用的毒物蛋白對(duì)本發(fā)明的宿主細(xì)胞具有毒性。
發(fā)明詳述
本發(fā)明涉及用于生產(chǎn)重組肽、多肽或蛋白質(zhì)的宿主細(xì)胞,其中所述宿主細(xì)胞包含至少兩個(gè)拷貝的編碼毒物蛋白的核酸序列。在一個(gè)實(shí)施方案中,所述宿主細(xì)胞包含2個(gè)拷貝的編碼毒物蛋白的核酸序列或者3、4、5或6個(gè)拷貝(或者更多拷貝)的該核酸序列。
毒物蛋白的實(shí)例包括但不限于CcdB、Kid、Doc、RelE、PasA、MazE或任何其他毒物分子,例如,如來源于或不來源于質(zhì)粒的細(xì)菌素。毒物蛋白還可以是天然或人工具有毒性并且影響(原核生物)細(xì)胞的一項(xiàng)或更多項(xiàng)重要功能的毒素蛋白。由基因sacB編碼的蛋白質(zhì)(來自于解淀粉芽孢桿菌(Bacillus amylolique-faciens))、蛋白GpE、蛋白GATA-1和蛋白Crp這樣的毒性分子的另一些實(shí)例?;騭acB編碼果聚糖蔗糖酶,其催化蔗糖水解成對(duì)大腸桿菌具有毒性的產(chǎn)物(Pierce等Proc.Natl.Acad.Sci.,第89卷,N[deg.]6(1992)第2056-2060頁)。蛋白GpE由來自噬菌體[phi]X174的E基因編碼,其包括六個(gè)獨(dú)特的限制性位點(diǎn)。GpE導(dǎo)致大腸桿菌細(xì)胞裂解((Heinrich等,Gene,第42(3)卷(1986)第345-349頁)。蛋白GATA-1已由Trudel等(Biotechniques 1996,第20(4)卷,第684-693頁)進(jìn)行了描述。蛋白Crp已由Schlieper等(Anal.Biochem.1998,第257(2)卷,第203-209頁)進(jìn)行了描述。
優(yōu)選地,本發(fā)明的宿主細(xì)胞包含編碼蛋白CcdB的核酸序列的至少兩個(gè),優(yōu)選2個(gè)拷貝。在一個(gè)實(shí)施方案中,編碼蛋白CcdB的核酸序列是ccdB基因(序列SEQ ID NO:1)或者與SEQ ID NO:1具有至少75%,優(yōu)選至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的編碼功能性CcdB蛋白的任意序列。
在一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列不具有100%同一性(例如具有約30%,優(yōu)選約35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)以避免2個(gè)拷貝之間發(fā)生重組事件。
在一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列來自于不同來源(例如來自至少2個(gè)細(xì)菌物種)或者第一個(gè)來源于質(zhì)粒并且第二個(gè)來源于染色體。例如,第一CcdB拷貝來自于大腸桿菌O157:H7并且第二CcdB拷貝可來自于F質(zhì)粒。
在一個(gè)實(shí)施方案中,至少兩個(gè)毒物蛋白是100%相同的,但是由不具有100%同一性的核酸序列編碼(即,核酸序列的不同之處在于非編碼差異,例如,如編碼給定氨基酸的密碼子替換成編碼相同氨基酸的另一密碼子)。
在一個(gè)實(shí)施方案中,至少兩個(gè)毒物蛋白不是100%相同的(例如具有約30%,優(yōu)選約35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性),但是其作用可被相同解毒劑抵消。
在一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列不具有100%同一性,但是使用例如Guglielmini等(BMC Microbiology 2008,8:104)中所述的程序TAQ V1.0根據(jù)計(jì)算機(jī)(in silico)分析,二者均包含保守的推定結(jié)構(gòu)域。在一個(gè)實(shí)施方案中,第二拷貝的編碼毒物蛋白的核酸序列是與第一拷貝相關(guān)并且使用程序TAQ V1.0鑒定的推定毒物蛋白。在一個(gè)實(shí)施方案中,第一拷貝的編碼毒物蛋白的核酸序列是CcdB,并且第二拷貝選自使用Guglielmini等,2008的程序TAQ V1.0鑒定的22種CcdB計(jì)算機(jī)推導(dǎo)的毒素。
在本發(fā)明的一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在不同于編碼對(duì)應(yīng)解毒劑蛋白的核酸序列的復(fù)制子上,即在不包含編碼對(duì)應(yīng)解毒劑蛋白的核酸序列的復(fù)制子上。特別地,根據(jù)該實(shí)施方案,包含至少兩個(gè)拷貝的質(zhì)粒F(質(zhì)粒F包含復(fù)制子,所述復(fù)制子同時(shí)含有編碼毒物蛋白的核酸序列和編碼解毒劑蛋白的核酸序列)的宿主細(xì)胞不是本發(fā)明的一部分。
在一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在同一復(fù)制子上。在另一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在至少兩個(gè)不同的復(fù)制子上。
在一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列中的至少一個(gè)在質(zhì)粒上。在另一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在質(zhì)粒上。
在本發(fā)明的一個(gè)實(shí)施方案中,至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在染色體上,即,插入在宿主細(xì)胞的基因組中。
在本發(fā)明的一個(gè)實(shí)施方案中,當(dāng)將兩個(gè)拷貝的編碼毒物蛋白的核酸序列插入在宿主細(xì)胞的基因組中時(shí),每個(gè)拷貝在宿主細(xì)胞中染色體上的相對(duì)側(cè)。優(yōu)選地,每個(gè)拷貝插入在宿主細(xì)胞的染色體的非編碼區(qū)域中或者插入在失活的基因中。
例如,將第一拷貝的編碼毒物蛋白的核酸序列插入在dcm基因中,將第二拷貝的編碼毒物蛋白的核酸序列插入在yjjK和slt基因之間(即,在大腸桿菌染色體的相對(duì)側(cè))的基因間非編碼間隔中。
術(shù)語“同一性”或“同一的”當(dāng)用于兩條或多條核酸序列或多肽的序列間關(guān)系時(shí)指核酸序列或多肽(分別)之間的序列相關(guān)性程度,如通過兩個(gè)或多個(gè)核酸殘基或氨基酸殘基(分別)串之間的匹配數(shù)目所確定的?!巴恍浴睖y量兩條或多條序列中較短者之間的相同匹配的百分比,其中缺口對(duì)比(如果有的話)通過特定的數(shù)學(xué)模型或計(jì)算機(jī)程序(即,“算法”)來解決。相關(guān)多肽的同一性可容易地通過已知方法來計(jì)算。這樣的方法包括但不限于以下中所述的那些:Computational Molecular Biology,Lesk,A.M.,編輯,Oxford University Press,New York,1988;Biocomputing:Informatics 5 and Genome Projects,Smith,D.W.,編輯,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,和Griffin,H.G.,編輯,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;Sequence Analysis Primer,Gribskov,M.和Devereux,J.,編輯,M.Stockton Press,New York,1991;以及Carillo等,SIAM J.Applied Math.48,1073(1988)。用于確定同一性的優(yōu)選方法設(shè)計(jì)成提供受試序列之間的最大匹配。確定同一性的方法在可公開獲得的計(jì)算機(jī)程序中進(jìn)行了描述。用于確定兩條序列間同一性的優(yōu)選計(jì)算機(jī)程序方法包括GCG程序包,其包括GAP(Devereux等,Nucl.Acid.Res.\2,387(1984);Genetics Computer Group,University of Wisconsin,Madison,Wis.)、BLASTP、BLASTN和FASTA(Altschul等,J.MoI.Biol.215,403-410(1990))。BLASTX程序可從國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)及其他資源(BLAST Manual,Altschul等NCB/NLM/NIH Bethesda,Md.20894;Altschul等,同上)公開獲得。還可使用公知的Smith Waterman算法來確定同一性。
優(yōu)選地,編碼毒物蛋白的核酸序列在天然啟動(dòng)子控制之下。例如,可將編碼蛋白CcdB的核酸序列融合至ccd啟動(dòng)子下游。因此,在解毒劑存在下,ccd啟動(dòng)子受到強(qiáng)烈阻遏。
在一個(gè)實(shí)施方案中,所述宿主細(xì)胞是微生物,優(yōu)選原核生物,更優(yōu)選細(xì)菌,并且甚至更優(yōu)選革蘭氏陰性細(xì)菌。有利地,根據(jù)當(dāng)前可適用的分類學(xué),所述宿主細(xì)胞是來自腸桿菌科家族的細(xì)菌。如果分類學(xué)改變,技術(shù)人員知曉如何使分類學(xué)中的變化適應(yīng)于推斷可用于本發(fā)明的菌株。來自腸桿菌科家族的細(xì)菌的實(shí)例包括但不限于術(shù)語以下屬的細(xì)菌:埃希氏菌屬(Escherichia)、腸桿菌屬(Enterobacter)、歐文氏菌屬(Erwinia)、克雷伯氏菌屬(Klebsiella)、泛菌屬(Pantoea)、光桿狀菌屬(Photorhabdus)、普羅威登斯菌屬(Providencia)、沙門氏菌屬(Salmonella)、沙雷氏菌屬(Serratia)、志賀氏菌屬(Shigella)、摩根菌屬(Morganella)和耶爾森氏菌屬(Yersinia)。根據(jù)一個(gè)優(yōu)選實(shí)施方案,所述宿主細(xì)胞屬于埃希氏菌屬,并且更優(yōu)選地,所述宿主細(xì)胞是大腸桿菌(Escherichia coli,E.coli)??捎糜诒景l(fā)明的大腸桿菌菌株的實(shí)例包括但不限于由大腸桿菌K-12、大腸桿菌B或大腸桿菌W衍生的菌株,例如,如MG1655、W3110、DG1、DG2、Top10、DH10B、DH5α、HMS174、BL21、BL21(DE3)、HMS174(DE3)、BL21(DE3)pLysS和BL21(DE3)pLysE。
在一個(gè)實(shí)施方案中,可使宿主細(xì)胞中的基因失活。
本文中使用的術(shù)語“失活”指阻斷或阻遏基因在轉(zhuǎn)錄或翻譯水平上的表達(dá)。優(yōu)選地,術(shù)語“失活”指其轉(zhuǎn)錄受到阻遏的基因。根據(jù)本發(fā)明,基因的失活可由基因的突變或者在該基因的編碼序列中插入表達(dá)系統(tǒng)引起。術(shù)語“突變”在本發(fā)明的含義中指遺傳序列的穩(wěn)定變化。本發(fā)明中可導(dǎo)致基因失活的突變的實(shí)例包括但不限于點(diǎn)突變、插入、缺失和擴(kuò)增或基因重復(fù)。優(yōu)選地,所述突變是缺失。本文中使用的術(shù)語“缺失”意指基因的丟失或不存在,優(yōu)選基因的全部丟失或不存在。更優(yōu)選地,缺失在所缺失基因的起始密碼子處或之前開始并且在所缺失基因的終止子處或之后終止。
在一個(gè)實(shí)施方案中,使基因tonA(還稱為fhuA,SEQ ID NO:2)失活。TonA/FhuA蛋白是噬菌體T1、T5和Phi80的受體。
在一個(gè)實(shí)施方案中,使基因galK(SEQ ID NO:3)失活。該基因的缺失允許使用galK陽性/陰性選擇通過基于同源重組的方法來缺失基因。
在一個(gè)實(shí)施方案中,使基因araB(SEQ ID NO:4)失活。在另一個(gè)實(shí)施方案中,使基因araA(SEQ ID NO:5)失活。推薦araB和/或araA的失活使用宿主細(xì)胞內(nèi)的Para啟動(dòng)子(可被阿拉伯糖誘導(dǎo))。
在一個(gè)實(shí)施方案中,使基因lon(SEQ ID NO:6)和/或基因ompT(SEQ ID NO:7)失活。Lon蛋白是一種ATP依賴性蛋白酶。OmpT蛋白是一種外膜蛋白酶。優(yōu)選地,使基因lon和ompT失活。
在一個(gè)實(shí)施方案中,使基因rcsA(SEQ ID NO:8)失活。RcsA蛋白是合成被膜的正調(diào)節(jié)蛋白,其由Lon蛋白酶降解。
在一個(gè)實(shí)施方案中,使基因hsdR(SEQ ID NO:9)和/或基因mrr(SEQ ID NO:10)失活。HsdR和Mrr蛋白是具有不同特異性的限制性酶。優(yōu)選地,使基因hsdR和mrr二者都失活。
在一個(gè)實(shí)施方案中,使基因endA(SEQ ID NO:11)和/或基因recA(SEQ ID NO:12)失活。EndA是一種DNA特異性的內(nèi)切核酸酶。RecA是一種具有蛋白酶和核酸酶活性的重組蛋白。優(yōu)選地,使基因endA和recA二者都失活。
在本發(fā)明的一個(gè)實(shí)施方案中,使基因tonA、galK、araB、araA、lon、ompT、rcsA、hsdR、mrr、endA和recA中的至少一個(gè)失活。優(yōu)選地,缺失失活的基因。
在一個(gè)優(yōu)選實(shí)施方案中,使基因tonA、galK、araB、lon、ompT、rcsA、hsdR、mrr、endA和recA失活。優(yōu)選地,缺失基因tonA、galK、araB、lon、ompT、rcsA、hsdR、mrr、endA和recA。
在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞包含至少一個(gè)額外拷貝的編碼毒物蛋白的靶標(biāo)的核酸序列。在一個(gè)實(shí)施方案中,所述宿主細(xì)胞包含2個(gè)拷貝的編碼毒物蛋白的靶標(biāo)的核酸序列,或者3、4、5或6個(gè)拷貝(或者更多拷貝)的該核酸序列。優(yōu)選地,所述至少一個(gè)額外拷貝是染色體的,即插入在宿主細(xì)胞的基因組中。
在毒物蛋白是CcdB的一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞可包含至少一個(gè)額外拷貝的編碼GyrA蛋白的核酸序列。
在一個(gè)實(shí)施方案中,編碼GyrA蛋白的核酸序列是gyrA基因(序列SEQ ID NO:15)或者與SEQ ID NO:15具有至少75%,優(yōu)選地至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的編碼功能性GyrA蛋白的任意序列。
在一個(gè)實(shí)施方案中,將第二拷貝的編碼毒物蛋白的靶蛋白的核酸序列插入在宿主細(xì)胞中染色體中與編碼毒物蛋白的核酸序列拷貝相同的位置。在一個(gè)實(shí)施方案中,編碼毒物蛋白的核酸序列拷貝與第二拷貝的編碼毒物蛋白的靶蛋白的核酸序列同時(shí)插入。
在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞包含至少一個(gè)拷貝的編碼解毒劑蛋白的核酸序列,所述解毒劑蛋白抵消由本發(fā)明的宿主細(xì)胞表達(dá)的毒物蛋白的作用。
解毒劑蛋白的實(shí)例包括但不限CcdA(CcdB的解毒劑)、Kis(Kid的解毒劑)、Phd(Doc的解毒劑)、RelB(RelE的解毒劑)、PasB(或PasC)(PasA的解毒劑)、MazF(MazE的解毒劑)或免疫分子(細(xì)菌素的解毒劑)。當(dāng)相應(yīng)毒性分子由細(xì)胞產(chǎn)生時(shí),針對(duì)毒性分子的解毒劑蛋白是降低或阻遏所述毒性分子對(duì)所述細(xì)胞(優(yōu)選原核生物細(xì)胞)的作用的任何分子。
根據(jù)一個(gè)優(yōu)選實(shí)施方案,毒物蛋白是CcdB,并且宿主細(xì)胞包含至少一個(gè)拷貝的編碼CcdA的核酸序列。在一個(gè)實(shí)施方案中,編碼CcdA蛋白的核酸序列是ccdA基因(序列SEQ ID NO:13)或者與SEQ ID NO:13具有至少75%,優(yōu)選地至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的編碼功能性CcdA蛋白的任意序列。本文中使用的“功能性”CcdA蛋白指與SEQ ID NO:13具有至少75%同一性并且保留CcdA降低或阻遏CcdB對(duì)細(xì)胞的作用的能力的CcdA蛋白。
在一個(gè)實(shí)施方案中,編碼解毒劑蛋白的核苷酸序列由載體,例如質(zhì)粒、噬菌體、病毒、陽離子囊泡或任意其他類型的載體攜帶,優(yōu)選地由質(zhì)粒攜帶。因此,技術(shù)人員可容易地推斷出,編碼解毒劑蛋白的核酸序列的拷貝數(shù)取決于所使用質(zhì)粒的類型。例如,pBR322家族的質(zhì)粒通常以范圍在約1至約100,優(yōu)選約20至約50之間的拷貝數(shù)存在于細(xì)胞中;而pUC家族的質(zhì)粒通常以范圍在約100至約500,優(yōu)選約150至約200之間的拷貝數(shù)存在于細(xì)胞中。然而,技術(shù)人員還可容易地推斷,質(zhì)粒在宿主細(xì)胞中的拷貝數(shù)還可取決于復(fù)制細(xì)胞的復(fù)制速率和/或生長。
因此,在一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明的宿主細(xì)胞還包含攜帶至少一個(gè)拷貝的以下載體,優(yōu)選質(zhì)粒:(1)編碼針對(duì)毒物蛋白的解毒劑的核酸序列;和(2)編碼待生產(chǎn)的目的重組肽、多肽或蛋白質(zhì)的核酸序列或者用于插入編碼待生產(chǎn)的目的重組肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn)。
在一個(gè)實(shí)施方案中,編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中;或者插入位點(diǎn)使得當(dāng)插入時(shí)編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中。特別地,編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列置于啟動(dòng)子控制之下或者在插入后將置于啟動(dòng)子控制之下。
本文中使用的“表達(dá)系統(tǒng)”指與用于系統(tǒng)轉(zhuǎn)錄的另外片段可操作地連接的由編碼核酸序列的片段組成的線性或環(huán)狀DNA分子,所述片段編碼目的重組肽、多肽或蛋白質(zhì)。
所述另外片段包括啟動(dòng)子和終止密碼子序列。所述表達(dá)系統(tǒng)還可包含一個(gè)或更多個(gè)復(fù)制起點(diǎn)、一個(gè)或更多個(gè)選擇標(biāo)記和編碼核糖體結(jié)合位點(diǎn)的序列。
“可操作地連接”意指將片段設(shè)置成按照期望的那樣發(fā)揮功能,例如一旦在啟動(dòng)子處開始轉(zhuǎn)錄,其經(jīng)過編碼片段直至終止密碼子。
“啟動(dòng)子”在本發(fā)明中的含義是允許RNA聚合酶結(jié)合并起始轉(zhuǎn)錄的表達(dá)控制元件。
在本發(fā)明的一個(gè)實(shí)施方案中,核酸序列在“強(qiáng)”啟動(dòng)子的控制之下。強(qiáng)啟動(dòng)子一方面以啟動(dòng)子序列與RNA聚合酶(通常是天然存在的對(duì)應(yīng)RNA聚合酶)的高結(jié)合親和力為特征,并且另一方面以通過該RNA聚合酶形成mRNA的高速率為特征。
在一個(gè)優(yōu)選實(shí)施方案中,核酸序列在“誘導(dǎo)型啟動(dòng)子”的控制之下?!罢T導(dǎo)型啟動(dòng)子”是可通過外部因素(例如誘導(dǎo)物(還稱為“誘導(dǎo)劑”)分子的存在或阻遏物分子的不存在)或者物理因素(例如溫度、摩爾滲透壓濃度或pH值的升高或降低)來調(diào)節(jié)的啟動(dòng)子。不同的啟動(dòng)子及相應(yīng)的誘導(dǎo)原理由Makrides等(Microbiological Reviews,1996,(60)3:512-538)進(jìn)行了綜述??捎糜诒景l(fā)明的誘導(dǎo)型啟動(dòng)子的實(shí)例包括但不限于全部均使用大腸桿菌RNA聚合酶的tac或trc啟動(dòng)子、lac或lacUV5啟動(dòng)子(所有均是可通過乳糖或其類似物IPTG(異丙硫基-β-D-半乳糖苷)誘導(dǎo)的)、可嚴(yán)格調(diào)節(jié)的araBAD啟動(dòng)子(Para;Guzman等,1995,可通過阿拉伯糖誘導(dǎo)的)、trp啟動(dòng)子(可通過β-吲哚丙烯酸添加或色氨酸饑餓誘導(dǎo)的,可通過色氨酸添加阻遏的)、λ啟動(dòng)子pL(λ)(通過升高溫度來誘導(dǎo))、phoA啟動(dòng)子(可通過磷酸鹽饑餓誘導(dǎo)的)或其他適于重組肽、多肽或蛋白質(zhì)表達(dá)的啟動(dòng)子。
誘導(dǎo)型啟動(dòng)子中有是表現(xiàn)出“滲漏”表達(dá)行為的那些。這樣的啟動(dòng)子(所謂的“滲漏啟動(dòng)子”)在原理上是可誘導(dǎo)的,但是仍然還無需外部誘導(dǎo)即可表現(xiàn)出基本表達(dá)。在非誘導(dǎo)條件下表現(xiàn)出滲漏表達(dá)的誘導(dǎo)型啟動(dòng)子的表現(xiàn)可與組成型啟動(dòng)子(即,其是穩(wěn)定且連續(xù)地具有活性或者其可由于某些培養(yǎng)條件而激活或增強(qiáng))類似。滲漏啟動(dòng)子特別地可用于連續(xù)操作的培養(yǎng)過程。滲漏啟動(dòng)子的實(shí)例是T7啟動(dòng)子和trp啟動(dòng)子。在本發(fā)明的含義中,術(shù)語“T7啟動(dòng)子”包括存在于噬菌體T7的基因組中的啟動(dòng)子以及能夠介導(dǎo)通過T7RNA聚合酶的轉(zhuǎn)錄的此類啟動(dòng)子的共有序列和變體。噬菌體T7包含17個(gè)不同的啟動(dòng)子序列,其全部均包含高度保守的核苷酸序列。
在本發(fā)明的一個(gè)實(shí)施方案中,啟動(dòng)子還可以是組成型的,即一方面無需誘導(dǎo)即可控制表達(dá)或者另一方面無阻遏可能性的啟動(dòng)子。因此,在一定水平具有連續(xù)且穩(wěn)定的表達(dá)。作為一個(gè)實(shí)例,可使用強(qiáng)組成型HCD啟動(dòng)子(Poo等,Biotechnology Letters,2002,24:1185-1189;Jeong等,Proteinexpression and purification,2004,36:150-156)來進(jìn)行組成型表達(dá)。
有利地,在特定條件下,例如在選擇下誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。
根據(jù)一個(gè)優(yōu)選實(shí)施方案,將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于T7啟動(dòng)子、可通過IPTG誘導(dǎo)的啟動(dòng)子(例如,如Ptrc啟動(dòng)子或Ptac啟動(dòng)子)或者可通過阿拉伯糖誘導(dǎo)的啟動(dòng)子(例如,如Para)的控制之下。
在一個(gè)優(yōu)選實(shí)施方案中,編碼解毒劑蛋白的核酸序列是直接功能性的,即其直接編碼功能性的解毒劑蛋白。此外,在一個(gè)實(shí)施方案中,編碼目的肽、多肽或蛋白質(zhì)的核酸序列或者插入位點(diǎn)不放置在編碼解毒劑蛋白的核酸序列中。
在一個(gè)實(shí)施方案中,本發(fā)明的載體包含cer基因座。cer基因座通過阻止多聚體的失控累積(稱為“二聚體災(zāi)難”)來實(shí)現(xiàn)ColE1及相關(guān)質(zhì)粒的穩(wěn)定遺傳。多聚體分解通過XerCd位點(diǎn)特異性重組酶在cer位點(diǎn)的作用來實(shí)現(xiàn)。優(yōu)選地,當(dāng)在本發(fā)明的載體中插入cer基因座時(shí),宿主細(xì)胞是大腸桿菌。
在一個(gè)實(shí)施方案中,本發(fā)明的載體不包含任何抗生素抗性基因。在另一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞不包含任何抗生素抗性基因。在一個(gè)實(shí)施方案中,本發(fā)明的載體或宿主細(xì)胞均不包含任何抗生素抗性基因。因此,根據(jù)該實(shí)施方案,當(dāng)使用本發(fā)明的宿主細(xì)胞和載體來生產(chǎn)目的肽、多肽或蛋白質(zhì)時(shí),不需要抗生素。
本發(fā)明還涉及包含本發(fā)明的宿主細(xì)胞和至少一種上述載體(優(yōu)選質(zhì)粒)的試劑盒,所述宿主細(xì)胞包含至少兩個(gè)拷貝的編碼毒物蛋白的核酸。優(yōu)選地,所述載體攜帶至少一個(gè)編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列,和表達(dá)系統(tǒng)中的編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列,或者表達(dá)系統(tǒng)中的用于插入編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn)。
根據(jù)一個(gè)優(yōu)選實(shí)施方案,本發(fā)明的宿主細(xì)胞包含至少兩個(gè)編碼插入在其基因組中的CcdB蛋白的核酸序列,并且本發(fā)明的載體攜帶至少一個(gè)編碼CcdA的核酸序列。
在一個(gè)實(shí)施方案中,所述載體包含表達(dá)系統(tǒng)和用于在所述表達(dá)系統(tǒng)中插入編碼目的肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn),從而獲得用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的功能性載體。因此,在用本發(fā)明的用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的載體轉(zhuǎn)化宿主細(xì)胞之前,必須將編碼目的肽、多肽或蛋白質(zhì)的核酸序列插入在載體中的插入位點(diǎn)處。用于將核酸序列插入在插入位點(diǎn)中的方法是本領(lǐng)域技術(shù)人員公知的,并且通常基于使用限制性酶。
對(duì)于目的肽、多肽或蛋白質(zhì),其可指待以制備規(guī)模生產(chǎn)的任何肽、多肽或蛋白質(zhì),例如工業(yè)用肽、多肽或蛋白質(zhì)或者治療性肽、多肽或蛋白質(zhì)。
可通過本發(fā)明方法生產(chǎn)的肽、多肽或蛋白質(zhì)的實(shí)例是但不限于酶、調(diào)節(jié)蛋白、受體、肽(例如肽類激素)、細(xì)胞因子、抗體、納米抗體、膜蛋白或轉(zhuǎn)運(yùn)蛋白。
目的肽、多肽或蛋白質(zhì)還可以是如用于接種疫苗、疫苗、抗原結(jié)合蛋白、免疫刺激蛋白、變應(yīng)原、全長抗體或者抗體片段或衍生物??贵w衍生物可選自單鏈抗體、(scFv)、Fab片段、F(ab’)2片段、Fv片段、單結(jié)構(gòu)域抗體(VH或VL片段)、駱駝單可變結(jié)構(gòu)域(VHH)或如例如Andersen和Reilly(Current Opinion in Biotechnology,2004,15:456-462)或Holliger或Hudson(Nature Biotechnology,2005(23)9:1126-1136)中所述的其他抗體形式。
本發(fā)明中目的肽、多肽或蛋白質(zhì)的實(shí)例還可為致病性病毒的基因組中編碼的蛋白質(zhì)(病毒抗原),例如外殼蛋白、核心蛋白、蛋白酶、逆轉(zhuǎn)錄酶、整合酶等,所述致病性病毒例如乙型肝炎病毒、丙型肝炎病毒、I-HV、流感病毒等;生長因子,例如血小板源性生長因子(PDGF)、干細(xì)胞生長因子(SCF)、肝細(xì)胞生長因子(HGF)、轉(zhuǎn)化生長因子(TGF)、神經(jīng)生長因子(NGF)、表皮生長因子(EGF)、成纖維細(xì)胞生長因子(FGF)、胰島素樣生長因子(IGF)等;細(xì)胞因子,例如腫瘤壞死因子、干擾素、白介素等;造血因子,例如紅細(xì)胞生成素、粒細(xì)胞菌落刺激因子、粒細(xì)胞-巨噬細(xì)胞菌落刺激因、巨噬細(xì)胞菌落刺激因子、血小板生成素等;肽類激素,例如促黃體素釋放素(LB-RH)、促甲狀腺素釋放激素(TRH)、胰島素、生長抑素、生長激素、催乳素、促腎上腺皮質(zhì)激素(ACTH)、促黑素細(xì)胞激素(MSH)、促甲狀腺激素(TSH)、黃體生成素(LU)、促卵泡激素(FSH)、加壓素、氧化毒素、降鈣素、甲狀旁腺激素(PTH)、胰高血糖素、胃泌素、分泌素、促胰酶素、膽囊收縮素、血管緊張素、人胎盤催乳素、人絨毛膜促性腺素(HCG)、蛙皮素、胃動(dòng)素等;鎮(zhèn)痛肽,例如腦啡肽、內(nèi)啡肽、強(qiáng)啡肽、京都啡肽等;酶,例如超氧化物歧化酶(SOD)、尿激酶、組織纖溶酶原激活物(TPA)、天冬酰胺酶、激肽釋放酶等;肽類神經(jīng)遞質(zhì),例如鈴蟾肽、神經(jīng)張力蛋白、緩激肽、P物質(zhì)、阿爾茨海默淀粉樣肽(AD)、SOD1、早老素1和2、腎素、突觸核蛋白(Dsynuclein)、淀粉樣蛋白A、淀粉樣蛋白P、激活素、抗HER-2、蛙皮素、腦啡肽酶、蛋白酶抑制劑、治療性酶、D1-抗胰蛋白酶、哺乳動(dòng)物胰蛋白酶抑制劑、哺乳動(dòng)物胰腺胰蛋白酶抑制劑、降鈣素、心臟肥大因子、心肌營養(yǎng)蛋白(例如心肌營養(yǎng)蛋白-1)、CD蛋白(例如CD-3、CD-4、CD-8和CD-19)、CFTR、CTNF、DNA酶、人絨毛膜促性腺激素、小鼠促性腺激素相關(guān)肽、細(xì)胞因子、轉(zhuǎn)甲狀腺素蛋白、支鏈淀粉、脂蛋白、淋巴因子、溶菌酶、生長激素(包括人生長激素)、牛生長激素、生長激素釋放因子、甲狀旁腺激素、促甲狀腺激素、生長因子、腦源性神經(jīng)營養(yǎng)生長因子、表皮生長因子(EGF)、成纖維細(xì)胞生長因子(例如D FGF和D FGF)、胰島素樣生長因子-I和-II、des(1-3)-IGF-I(腦IGF-I)、胰島素樣生長因子結(jié)合蛋白、神經(jīng)生長因子(例如NGF-D)、血小板源性生長因子(PDGF)、血管內(nèi)皮生長因子(VEGF)、生長激素或生長因子的受體、轉(zhuǎn)化生長因子(TGF)(例如TGF-D、TGF-D1、TGF-D2、TGF-D3、TGF-D4或TGF-D5)、神經(jīng)營養(yǎng)因子(例如神經(jīng)營養(yǎng)蛋白-3、-4、-5或-6)、凝溶膠蛋白、胰高血糖素、激肽釋放酶、米勒管抑制物質(zhì)、神經(jīng)營養(yǎng)因子、p53、蛋白A或D、松弛素、松弛素A-鏈、松弛素B-鏈、類風(fēng)濕因子、視紫紅質(zhì)、血清白蛋白(例如人血清清蛋白)、抑制素、胰島素、胰島素鏈、胰島素A-鏈、胰島素D-鏈、胰島素受體、胰島素原、黃體生成素、整聯(lián)蛋白、白介素(IL)(例如IL-1至IL-10、IL-12、IL-13)、紅細(xì)胞生成素、血小板生成素、原纖維蛋白、促卵泡激素、凝血因子(如因子VIIIC、因子IX、組織因子和馮·維勒布蘭德因子)、抗凝血因子(例如蛋白C、心房利鈉尿因子、肺表面活性劑)、纖溶酶原激活劑(例如人組織纖溶酶原激活物或尿激酶)、凝血酶、腫瘤壞死因子-D或D、D-酮酸脫氫酶、地址素、骨形態(tài)生成蛋白(BMP)、膠原、菌落刺激因子(CSF)(例如M-CSF、GM-CSF和G-CSF)、衰變加速因子、歸巢受體、干擾素(例如干擾素-α、γ和β)、角蛋白、骨誘導(dǎo)因子、PRNP、調(diào)節(jié)蛋白、超氧化物歧化酶、表面膜蛋白、轉(zhuǎn)運(yùn)蛋白、T-細(xì)胞受體、例如gp120(HIb)免疫毒素的抗原、心房利鈉尿肽、精囊外分泌蛋白、D 2-微球蛋白、PrP、降鈣素原、脊髓小腦性共濟(jì)失調(diào)蛋白1、脊髓小腦性共濟(jì)失調(diào)蛋白2、脊髓小腦性共濟(jì)失調(diào)蛋白3、脊髓小腦性共濟(jì)失調(diào)蛋白6、脊髓小腦性共濟(jì)失調(diào)蛋白7、亨廷頓蛋白、雄激素受體、CREB結(jié)合蛋白、gp120、p300、CREB、API、Ras、NFAT、Jun、Fos、齒狀核紅核蒼白球路易氏體萎縮相關(guān)蛋白、微生物蛋白(例如麥芽糖結(jié)合蛋白、ABC轉(zhuǎn)運(yùn)蛋白、谷胱甘肽S轉(zhuǎn)移酶、硫氧還蛋白、D-內(nèi)酰胺酶)、綠色熒光蛋白、紅色熒光蛋白;酶,例如超氧化物歧化酶、天冬酰胺酶、精氨酸酶、精氨酸脫氨酶、腺苷脫氨酶、核糖核酸酶、過氧化氫酶、尿酸酶、膽紅素氧化酶、胰蛋白酶、木瓜蛋白酶、堿性磷酸酶、β-葡糖苷酸酶、嘌呤核苷磷酸化酶或巴曲酶;阿片樣物質(zhì),例如內(nèi)啡肽、腦啡肽或非天然阿片樣物質(zhì);激素或神經(jīng)肽,例如降鈣素、胰高血糖素、胃泌素、促腎上腺皮質(zhì)激素(ACTH)、膽囊收縮素、黃體生成素、促性腺激素釋放激素、絨毛膜促性腺激素、促腎上腺皮質(zhì)激素釋放因子、加壓素、催產(chǎn)素、抗利尿激素、促甲狀腺激素、促甲狀腺激素釋放激素、松弛素、催乳素、肽YY、神經(jīng)肽Y、胰腺多肽、瘦素、CART(可卡因安非他明調(diào)節(jié)轉(zhuǎn)錄物)、CART相關(guān)肽、脂滴包被蛋白、例如MC-4的黑皮質(zhì)素(黑素細(xì)胞刺激激素)、黑色素濃集激素、利鈉肽、腎上腺髓質(zhì)素、內(nèi)皮素、胰泌素、胰淀素、血管活性腸肽(VIP)、垂體腺苷酸環(huán)化酶激活多肽(PACAP)、鈴蟾肽、鈴蟾肽樣肽、胸腺素、肝素結(jié)合蛋白、可溶性CD4、下丘腦釋放因子和褪黑激素或者其功能類似物。在本發(fā)明的另一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)可以是加工酶,例如蛋白酶(例如腸激酶、胱天蛋白酶胰蛋白酶,類似于絲氨酸蛋白酶)、脂肪酶、磷酸酶、糖基水解酶(例如甘露糖苷酶、木糖苷酶、巖藻糖苷酶)、激酶、單氧化酶或二氧化酶、過氧化物酶、轉(zhuǎn)谷氨酰胺酶、羧肽酶、酰胺酶、酯酶,磷酸酶等。
這樣的哺乳動(dòng)物多肽的優(yōu)選來源包括人、牛、馬、豬、狼和嚙齒類動(dòng)物來源,其中特別優(yōu)選人蛋白。
本發(fā)明的目的肽、多肽或蛋白質(zhì)還涵蓋前述目的肽、多肽或蛋白質(zhì)的變體。這些變體涵蓋例如與前述目的肽、多肽或蛋白具有相同活性并且具有在前述目的肽、多肽或蛋白的氨基酸序列中缺失、替換、插入和/或添加一個(gè)或多個(gè)氨基酸的氨基酸序列的肽、多肽或蛋白質(zhì)。這樣的肽、多肽或蛋白質(zhì)的實(shí)例可以是與前述目的肽、多肽或蛋白具有相同活性并且具有在前述目的肽、多肽或蛋白的氨基酸序列中缺失、替換、插入和/或添加一個(gè)或多個(gè)氨基酸的氨基酸序列的肽、多肽或蛋白質(zhì)??赏瑫r(shí)進(jìn)行選自缺失、替換、插入和添加的兩種或多種類型修飾。
本發(fā)明的目的肽、多肽或蛋白質(zhì)還涵蓋前述目的肽、多肽或蛋白質(zhì)的“部分肽或多肽”。目的肽、多肽或蛋白質(zhì)的部分肽或多肽的實(shí)例可以是這樣的部分肽或多肽,其包含其中前述目的肽、多肽或蛋白質(zhì)的一部分氨基酸序列不間斷地延伸的氨基酸序列,其中部分肽或多肽優(yōu)選地與所述目的肽、多肽或蛋白質(zhì)具有相同的活性。這樣的部分肽或多肽的實(shí)例可以是包含前述目的肽、多肽或蛋白質(zhì)的氨基酸序列中至少20,優(yōu)選至少50個(gè)氨基酸殘基的氨基酸序列。該肽或多肽優(yōu)選地包含對(duì)應(yīng)于與前述目的肽、多肽或蛋白質(zhì)的活性相關(guān)的區(qū)域的氨基酸序列。另外,用于本發(fā)明的部分肽或多肽還可以是通過對(duì)該肽進(jìn)行修飾產(chǎn)生的部分肽或多肽,其中從其氨基酸序列缺失、替換、插入和/或添加1或多個(gè)(例如,約1至20個(gè),更優(yōu)選約1至10個(gè),并且甚至更優(yōu)選約1至5個(gè))氨基酸殘基。用于本發(fā)明的部分肽或多肽還可用作用于抗體生產(chǎn)的抗原。
在本發(fā)明的一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)選自人生長激素、人胰島素、促卵泡激素、因子VIII、紅細(xì)胞生成素、粒細(xì)胞菌落刺激因子、α-半乳糖苷酶A、α-L-艾杜糖苷酸酶、N-乙酰半乳糖胺-4-硫酸酯酶、阿法鏈道酶、組織纖溶酶原激活物、葡糖腦苷脂酶、干擾素、胰島素樣生長因子1、牛生長激素、豬生長激素、牛凝乳酶和乙型肝炎病毒包膜蛋白。
目的肽、多肽或蛋白質(zhì)還涵蓋已在周質(zhì)中進(jìn)行翻譯后修飾和輸出后修飾的經(jīng)修飾肽、多肽或蛋白質(zhì),所述修飾例如環(huán)化、糖基化、磷酸化、甲基化、氧化、脫水、蛋白水解切割。
在一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是用于代謝細(xì)胞外介質(zhì)中的生物分子(本文中稱為“細(xì)胞外生物分子”)的酶。在一個(gè)實(shí)施方案中,細(xì)胞外生物分子包含多糖或脂質(zhì)。在本發(fā)明的一個(gè)實(shí)施方案中,所述多糖包含藻酸鹽、果膠、纖維素、纖維二糖、昆布多糖或其混合物。在本發(fā)明的一個(gè)實(shí)施方案中,所述脂質(zhì)包含脂肪酸、葡糖脂、甜菜堿脂質(zhì)、甘油脂、磷脂、甘油磷脂、鞘脂、甾醇脂質(zhì)、異戊烯醇脂質(zhì)、糖脂、聚酮化合物或其混合物。在本發(fā)明的一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是將多糖轉(zhuǎn)化成單糖、寡糖或二者的酶。在本發(fā)明的一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是將脂質(zhì)轉(zhuǎn)化成脂肪酸、單糖或二者的酶。在本發(fā)明的一個(gè)實(shí)施方案中,所述單糖或寡糖是低聚藻酸鹽、甘露糖醛酸鹽、古羅糖醛酸鹽、甘露醇、α-酮酸、4-脫氧-L-赤式-己酮糖糖醛酸鹽(DEHU)、2-酮-3-脫氧D-葡萄糖酸鹽(KDG)、葡萄糖、葡萄糖醛酸鹽、半乳糖醛酸鹽、半乳糖、木糖、阿拉伯糖或甘露糖。在本發(fā)明的一個(gè)實(shí)施方案中,所述脂肪酸是14:0、反式-14、16:0、16:ln-7、反式-16、16:2n-6、18:0、18:ln-9、18:2n-6、18:3n-6、18:3n-3、18:4n-3、20:0、20:2n-6、20:3n-6、20:4n-3、20:4n-6或20:5n-3。
在本發(fā)明的一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是將細(xì)胞外生物分子轉(zhuǎn)化成商用化學(xué)品的酶。在本發(fā)明的一個(gè)實(shí)施方案中,所述商用化學(xué)品是乙醇、丁醇或生物柴油。在本發(fā)明的一個(gè)實(shí)施方案中,所述生物柴油是脂肪酸、脂肪酸酯或萜類化合物。
在一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是一種分泌蛋白。在一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是天然分泌的,即編碼其的核酸序列天然包含導(dǎo)致其分泌的信號(hào)肽。在另一個(gè)實(shí)施方案中,目的肽、多肽或蛋白質(zhì)是是人工分泌的,即編碼其的核酸序列與信號(hào)肽融合,從而實(shí)現(xiàn)其分泌??捎糜诒景l(fā)明的情況的信號(hào)肽的實(shí)例包括但不限于OmpA信號(hào)肽(SEQ ID NO:17)、DsbA信號(hào)肽(SEQ ID NO:18)或PhoA信號(hào)肽(SEQ ID NO:19)。
在另一個(gè)實(shí)施方案中,所述肽、多肽或蛋白質(zhì)是一種跨膜蛋白。
在另一個(gè)實(shí)施方案中,所述肽、多肽或蛋白質(zhì)是對(duì)宿主細(xì)胞具有毒性的蛋白質(zhì)。
在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞還包含編碼誘導(dǎo)目的肽、多肽或蛋白質(zhì)表達(dá)的蛋白質(zhì)的核酸序列,其優(yōu)選地放置在表達(dá)系統(tǒng)中。
這樣的核酸序列的實(shí)例包括但不限于編碼T7RNA聚合酶的基因,T7基因1。在此情況下,T7RNA聚合酶的表達(dá)誘導(dǎo)置于T7啟動(dòng)子的控制之下的目的肽、多肽或蛋白質(zhì)表達(dá)。
優(yōu)選地,編碼目的肽、多肽或蛋白質(zhì)表達(dá)的蛋白質(zhì)的核酸序列是T7表達(dá)系統(tǒng)。T7表達(dá)系統(tǒng)在US4,952,496中進(jìn)行了描述,其通過引用并入本文。T7表達(dá)系統(tǒng)包含來自T7噬菌體的包含T7RNA聚合酶的整個(gè)編碼序列的DNA片段(即,T7基因1)。移除T7基因1的任何天然活性啟動(dòng)子,并在編碼序列之前插入誘導(dǎo)型lacUV5啟動(dòng)子。lacUV5啟動(dòng)子通過向培養(yǎng)基中添加IPTG來誘導(dǎo)。
在一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞包含插入在其基因組中的噬菌體。在將目的肽、多肽或蛋白質(zhì)置于T7啟動(dòng)子控制之下的一個(gè)實(shí)施方案中,所述經(jīng)遺傳修飾的噬菌體如PCT專利申請(qǐng)WO2013/004817(通過引用并入本文)中所述的。在一個(gè)實(shí)施方案中,所述經(jīng)遺傳修飾的噬菌體進(jìn)一步限定為以下噬菌體,其中:
-插入表達(dá)系統(tǒng)(優(yōu)選T7表達(dá)系統(tǒng)),并且
-S和/或R基因失活。
本發(fā)明的一個(gè)實(shí)施方案中,使噬菌體中的Int和/或Xis基因失活。
所述經(jīng)遺傳修飾的噬菌體進(jìn)一步限定為以下噬菌體,其中:
-插入表達(dá)系統(tǒng)(優(yōu)選T7表達(dá)系統(tǒng)),
-S、R和/或Q基因失活,并且
-Int和/或Xis基因失活。
可用于本發(fā)明的噬菌體的實(shí)例包括但不限于λ噬菌體(腸桿菌噬菌體λ,登錄號(hào)NC_001416)、λ樣噬菌體和λ形噬菌體。λ噬菌體(還稱為大腸桿菌噬菌體λ)是一種感染大腸桿菌的病毒。λ是一種溫和噬菌體。λ樣噬菌體形成細(xì)菌噬菌體和以長的非收縮尾為特征的古細(xì)菌病毒的家族。λ形噬菌體是λ噬菌體的天然相關(guān)物。其大多數(shù)生長在大腸桿菌上,但是少數(shù)來自于其他宿主細(xì)胞,例如,例如鼠傷寒沙門氏菌(Salmonella typhimurium)??捎糜诒景l(fā)明的λ樣噬菌體和λ形噬菌體的實(shí)例包括但不限于大腸桿菌噬菌體434、phi80、phi81、HK97、P21和P22。
在一個(gè)實(shí)施方案中,所述噬菌體是λDE3(登錄號(hào)EU078592)。λDE3噬菌體是經(jīng)修飾的λ噬菌體D69,其包含在lacUV5啟動(dòng)子控制之下的編碼T7RNA聚合酶的基因。
根據(jù)一個(gè)優(yōu)選實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是具有SEQ ID NO:14并且為(DE3)ΔS-C,Δxis-ea10(DE3指其中已將T7RNA聚合酶基因整合在int基因序列內(nèi)的λ噬菌體DE3)的噬菌體P11。所述經(jīng)修飾噬菌體P11對(duì)應(yīng)于序列NC_001416,其中缺失基因S、R、Rz、Xis和Int的編碼序列。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P12,其中缺失基因Int和S的編碼序列(P12的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P13,其中缺失基因S、R、Rz、Q、Xis和Int的編碼序列(P13的一個(gè)實(shí)例是序列DE3ΔS-C,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P14,其中缺失基因R和Int的編碼序列(P14的一個(gè)實(shí)例是序列DE3ΔR)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P15,其中缺失基因Q和Int的編碼序列的(P15的一個(gè)實(shí)例是序列DE3ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P16,其中缺失基因S和Xis的編碼序列(P16的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P17,其中缺失基因R和Xis的編碼序列(P17的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P18,其中缺失基因Q和Xis的編碼序列(P18的一個(gè)實(shí)例是序列NC_001416Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P19,其中缺失基因R、Rz和Int的編碼序列(P19的一個(gè)實(shí)例是序列DE3ΔR,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P20,其中缺失基因S、Rz和Int的編碼序列(P20的一個(gè)實(shí)例是序列DE3ΔS,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P21,其中缺失基因Rz、Q和Int的編碼序列(P21的一個(gè)實(shí)例是序列DE3ΔRz,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P22,其中缺失基因S、Q和Int的編碼序列(P22的一個(gè)實(shí)例是序列DE3ΔS,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P23,其中缺失基因R、Q和Int的編碼序列(P23的一個(gè)實(shí)例是序列DE3ΔR,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P24,其中缺失基因S、R和Int的編碼序列(P24的一個(gè)實(shí)例是序列DE3ΔS,ΔR)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P25,其中缺失基因S、Rz和Xis的編碼序列(P25的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P26,其中缺失基因S、Rz和Xis的編碼序列(P26的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P27,其中缺失基因Q、Rz和Xis的編碼序列(P27的一個(gè)實(shí)例是序列NC_001416ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P28,其中缺失基因S、Q和Xis的編碼序列(P28的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P29,其中缺失基因R、Q和Xis的編碼序列(P29的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P30,其中缺失基因R、S和Xis的編碼序列(P30的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔR)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P31,其中缺失基因R、Xis和Int的編碼序列(P31的一個(gè)實(shí)例是序列DE3ΔR,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P32,其中缺失基因S、Xis和Int的編碼序列(P32的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P33,其中缺失基因Q、Xis和Int的編碼序列(P33的一個(gè)實(shí)例是序列DE3Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P34,其中缺失基因S、R、Xis和Int的編碼序列(P34的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔR)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P35,其中缺失基因S、R、Xis和Int的編碼序列(P35的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔR)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P36,其中缺失基因S、Q、Xis和Int的編碼序列(P36的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P37,其中缺失基因R、Rz、Xis和Int的編碼序列(P37的一個(gè)實(shí)例是序列DE3ΔR,Δxis-ea10,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P38,其中缺失基因S、Rz、Xis和Int的編碼序列(P38的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔRz)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P39,其中缺失基因Rz、Q、Xis和Int的編碼序列(P39的一個(gè)實(shí)例是序列DE3ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P40,其中缺失基因S、R、Q和Int的編碼序列(P40的一個(gè)實(shí)例是序列DE3ΔS,ΔR,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P41,其中缺失基因S、R、Rz和Int的編碼序列(P41的一個(gè)實(shí)例是序列DE3ΔS-C)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P42,其中缺失基因R、Rz、Q和Int的編碼序列(P42的一個(gè)實(shí)例是序列DE3ΔR,ΔRz,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P43,其中缺失基因S、Rz、Q和Int的編碼序列(P43的一個(gè)實(shí)例是序列DE3ΔS,ΔRz,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P44,其中缺失基因S、R、Q和Xis的編碼序列(P44的一個(gè)實(shí)例是序列NC_001416ΔS,ΔR,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P45,其中缺失基因S、R、Rz和Xis的編碼序列(P45的一個(gè)實(shí)例是序列NC_001416ΔS-C,Δxis-ea10)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P46,其中缺失基因R、Rz、Q和Xis的編碼序列(P46的一個(gè)實(shí)例是序列NC_001416ΔR,ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P47,其中缺失基因S、Rz、Q和Xis的編碼序列(P47的一個(gè)實(shí)例是序列NC_001416ΔS,ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P48,其中缺失基因S、R、Q和Int的編碼序列(P48的一個(gè)實(shí)例是序列DE3ΔS,ΔR,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P49,其中缺失基因S、Rz、Q、Xis和Int的編碼序列(P49的一個(gè)實(shí)例是序列DE3ΔS,ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P50,其中缺失基因R、Rz、Q、Xis和Int的編碼序列(P50的一個(gè)實(shí)例是序列DE3ΔR,ΔRz,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P51,其中缺失基因S、R、Q、Rz和Int的編碼序列(P51的一個(gè)實(shí)例是序列DE3ΔS-C,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P52,其中缺失基因S、R、Rz、Q和Xis的編碼序列(P52的一個(gè)實(shí)例是序列NC_001416ΔS-C,Δxis-ea10,ΔQ)。
根據(jù)另一個(gè)實(shí)施方案,所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001415的P53,其中缺失基因Q、Xis和Int的編碼序列(P53的一個(gè)實(shí)例是DE3Δxis-ea10,ΔQ)。
本發(fā)明還涉及用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法,其中所述方法包括:
-培養(yǎng)根據(jù)本發(fā)明的宿主細(xì)胞,所述宿主細(xì)胞包含:
-至少兩個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列,
-至少一個(gè)拷貝的編碼針對(duì)該毒物蛋白的解毒劑蛋白(優(yōu)選CcdA)的核酸序列,以及
-至少一個(gè)拷貝的編碼目的肽、多肽或蛋白質(zhì)的核酸序列,以及
-回收目的肽、多肽或蛋白質(zhì)。
在一個(gè)實(shí)施方案中,至少兩個(gè)拷貝的編碼毒物蛋白的核酸序列插入在宿主細(xì)胞的基因組中。
在一個(gè)實(shí)施方案中,至少一個(gè)拷貝的編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列和至少一個(gè)拷貝的編碼目的肽、多肽或蛋白質(zhì)的核酸序列可由同一載體攜帶。因此,僅包含所述載體的宿主細(xì)胞得以增殖,而無該載體的宿主細(xì)胞由于毒物蛋白的毒性作用而死亡。
在本發(fā)明的一個(gè)實(shí)施方案中,編碼目的肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中。根據(jù)該實(shí)施方案,目的肽、多肽或蛋白質(zhì)的生產(chǎn)是直接的,即其由表達(dá)系統(tǒng)中的基因的表達(dá)產(chǎn)生,例如通過在誘導(dǎo)表達(dá)系統(tǒng)中包含的啟動(dòng)子的培養(yǎng)基中進(jìn)行培養(yǎng)。例如,在一個(gè)實(shí)施方案中,將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于pLac或pTRC啟動(dòng)子控制之下,并且當(dāng)向培養(yǎng)基中添加IPTG時(shí)誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。此外,在另一個(gè)實(shí)施方案中,將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于Para啟動(dòng)子的控制之下,并且當(dāng)向培養(yǎng)基中添加阿拉伯糖時(shí)誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。
在另一個(gè)實(shí)施方案中,本發(fā)明的宿主細(xì)胞還包含另一表達(dá)系統(tǒng),所述表達(dá)系統(tǒng)含有插入在其基因組中在lac啟動(dòng)子(優(yōu)選lacUV5啟動(dòng)子)控制之下的T7RNA聚合酶的核酸序列。根據(jù)該實(shí)施方案,用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法包括用載體(優(yōu)選質(zhì)粒)轉(zhuǎn)化宿主細(xì)胞,所述載體包含在T7啟動(dòng)子的控制之下的目的肽、多肽或蛋白質(zhì)的核酸序列和編碼解毒劑蛋白的核酸序列。T7啟動(dòng)子的表達(dá)在對(duì)T7啟動(dòng)子具有嚴(yán)格特異性的T7RNA聚合酶的控制之下,即T7啟動(dòng)子僅能夠被細(xì)菌噬菌體T7的RNA聚合酶利用。當(dāng)向培養(yǎng)基中添加IPTG時(shí),通過從lac啟動(dòng)子轉(zhuǎn)錄來表達(dá)T7RNA聚合酶,這將允許目的肽、多肽或蛋白質(zhì)的表達(dá)。
根據(jù)一個(gè)實(shí)施方案,目的肽、多肽或蛋白質(zhì)被宿主細(xì)胞分泌在發(fā)酵肉湯中。根據(jù)該實(shí)施方案,目的肽、多肽或蛋白質(zhì)可容易地使用本領(lǐng)域中公知的方法來從發(fā)酵肉湯中回收。
根據(jù)另一個(gè)實(shí)施方案,目的肽、多肽或蛋白質(zhì)不被宿主細(xì)胞分泌在發(fā)酵肉湯中。用于回收細(xì)胞內(nèi)或周質(zhì)的目的肽、多肽或蛋白質(zhì)的方法還是本領(lǐng)域中公知的。
此類方法的實(shí)例包括但不限于使用三氯乙酸(TCA)或包含十二烷基硫酸鈉(SDS)的破裂緩沖液在變性條件下回收總蛋白,或者使用聲波處理、弗氏細(xì)胞壓碎器或其等同方法在壓力下破裂細(xì)菌從而在天然(未變性)條件下來回收總細(xì)胞質(zhì)蛋白。接著,可使用特異性方法(包括但不限于使用親和柱或離子交換柱)來純化目的肽、多肽或蛋白質(zhì)。
本發(fā)明還涉及用于制備上述宿主細(xì)胞的方法。
本發(fā)明用于制備宿主細(xì)胞的方法包括在宿主細(xì)胞的基因組中插入至少一個(gè)拷貝,優(yōu)選兩個(gè)拷貝的編碼毒物蛋白的核酸序列。優(yōu)選地,所述毒物蛋白是CcdB,更優(yōu)選地,所述編碼毒物蛋白的核酸序列是SEQ ID NO:1。
在一個(gè)實(shí)施方案中,本發(fā)明用于制備宿主細(xì)胞的方法包括缺失步驟,其中缺失宿主細(xì)胞中的核酸序列。
用于插入或缺失基因序列的方法是本領(lǐng)域技術(shù)人員公知的。更高效的方法是由λRed編碼基因或者來自原噬菌體Rac的recE和recT基因介導(dǎo)的同源重組。一些研究人員已經(jīng)對(duì)該方法進(jìn)行了充分描述,包括Datsenko和Wanner(PNAS 97-12,6640-6645,2000);以及Stewart等(WO0104288)。使用具有與待缺失基因相鄰的區(qū)域同源或其中將插入核酸序列的區(qū)域同源的20-nt至60-nt延伸序列的引物來產(chǎn)生PCR引物。由于只要少數(shù)細(xì)菌有效地使目的片段重組,因此必需具有強(qiáng)選擇標(biāo)記來對(duì)其進(jìn)行選擇??墒褂每股貥?biāo)記來選擇重組子:使用經(jīng)修飾的引物來擴(kuò)增抗生素抗性基因。在轉(zhuǎn)化和活化重組基因之后,在包含合適抗生素的培養(yǎng)基上選擇重組細(xì)菌。在此情況下,抗生素抗性基因替代所靶向的基因或區(qū)域。為了使用相同的策略來進(jìn)行接下來的缺失,必需在第二步驟期間去除該抗生素抗性基因。如Datsenko和Wanner中所述的,可使用以FRT(FLP識(shí)別靶標(biāo))位點(diǎn)為側(cè)翼的抗生素抗性基因。然后,通過使用編碼FLP重組酶的輔助質(zhì)粒來消除抗性基因。該位點(diǎn)特異性重組酶去除抗生素抗性基因,但是該方法留有痕跡:在去除抗生素抗性基因之后仍然存在一個(gè)位點(diǎn)特異性重組位點(diǎn)。
為了避免該位點(diǎn)的存在,更優(yōu)選地,本發(fā)明的方法使用galK作為標(biāo)記基因。galK選擇的原理在Warming等(Nucleic acid research,2005,33(4))中進(jìn)行了描述。該方法在第一重組(插入)期間使用galK作為陽性選擇標(biāo)記(在包含半乳糖的基本培養(yǎng)基上生長)。在第二同源重組步驟期間進(jìn)行該標(biāo)記的去除。在該步驟期間,使用galK作為包含2-脫氧-半乳糖(DOG)的基本培養(yǎng)基上的陰性選擇標(biāo)記。galK基因產(chǎn)物半乳糖激酶催化半乳糖降解途徑中的第一步驟。半乳糖激酶還有效地催化DOG半乳糖類似物的磷酸化。該反應(yīng)的產(chǎn)物不能進(jìn)一步代謝,從而導(dǎo)致毒性分子(2-脫氧-半乳糖-1-磷酸)累積。該方法的優(yōu)勢是避免在缺失所靶向的基因和去除選擇標(biāo)記之后存在特異性重組位點(diǎn)。
在一個(gè)實(shí)施方案中,本發(fā)明的方法還包括通過上述經(jīng)遺傳修飾的噬菌體來感染宿主細(xì)胞的步驟。在本發(fā)明的一個(gè)實(shí)施方案中,所述感染步驟包括使用輔助噬菌體。在本發(fā)明的含義中,術(shù)語“輔助噬菌體”指用于補(bǔ)充其他噬菌體的缺失或失活的噬菌體。輔助噬菌體將提供所述其他噬菌體缺失的功能以能夠感染細(xì)菌或者制備噬菌體貯存液。通常來說,輔助噬菌體由于沒有cI而自身不能形成溶原體(其不具有阻遏物,因此具有毒性)。
使用輔助噬菌體來用噬菌體感染宿主細(xì)胞的方法在本領(lǐng)域中是公知的。在一個(gè)實(shí)施方案中,第一步驟是制備裂解液,第二步驟是溶原化。簡言之,可使用如“Molecular cloning:a laboratory manual”,Sambrook等(2001,ISBN 978-087969577-4)或“Large-and Small-Scale Preparation of Bacteriophage lambda lysate and DNA”,Su等,BioTechniques 25:44-46(1998年7月)中所述的標(biāo)準(zhǔn)方法來制備輔助噬菌體的細(xì)菌裂解液。在噬菌體誘導(dǎo)(最經(jīng)常使用UV照射,或者溶原體經(jīng)受DNA損傷或宿主的SOS應(yīng)答或Cro生產(chǎn)的任何情形)之后可使用相同原理來進(jìn)行目的噬菌體的制備以啟動(dòng)裂解循環(huán),并且使用輔助噬菌體以提供缺失的功能。輔助噬菌體的替代方案是使用編碼缺失功能的質(zhì)粒。
接著,將噬菌體裂解液與所靶向的細(xì)菌混合并鋪板在LB板上以獲得溶原體(如Novagen,User Protocol TB031的λDE3溶原化試劑盒中所述的,或者Studier和Moffat,Journal of Molecular Biology,1986,189:113-130中描述了替代方法)。可使用選擇噬菌體來特異性地選擇包含目的噬菌體的細(xì)菌。該選擇噬菌體是與目的噬菌體具有相同免疫性的烈性噬菌體。因此,選擇噬菌體不能夠形成噬菌斑或者殺死目的噬菌體的溶原體,因?yàn)樵撌删w生產(chǎn)cI阻遏物(在λDE3噬菌體中還稱為C2)。
在一個(gè)實(shí)施方案中,本發(fā)明的方法還包括用上述攜帶以下的載體,優(yōu)選質(zhì)粒轉(zhuǎn)化本發(fā)明的宿主細(xì)胞:(1)編碼針對(duì)毒物蛋白的解毒劑的核酸序列;和(2)編碼目的肽、多肽或蛋白質(zhì)的核酸序列。用于用載體轉(zhuǎn)化細(xì)胞的方法在本領(lǐng)域中是公知的,并且包括但不限于化學(xué)轉(zhuǎn)化和電穿孔。
因此,使用本發(fā)明宿主細(xì)胞來生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法提供以下優(yōu)勢:
-其可應(yīng)用于任何肽、多肽或蛋白質(zhì),甚至應(yīng)用于對(duì)宿主細(xì)胞具有毒性的肽、多肽或蛋白質(zhì);
-其可應(yīng)用于任何宿主細(xì)胞,因?yàn)樵谒拗骷?xì)胞的基因組中插入ccdB基因?qū)夹g(shù)人員而言是容易的;
-如下文的實(shí)施例中所示,其導(dǎo)致目的肽、多肽或蛋白質(zhì)的生產(chǎn)產(chǎn)率提高;
-如下文的實(shí)施例中所示,其實(shí)現(xiàn)提高包含編碼目的肽、多肽或蛋白質(zhì)的載體的穩(wěn)定性,尤其是當(dāng)目的肽、多肽或蛋白質(zhì)對(duì)宿主細(xì)胞具有毒性時(shí);以及
-在一些實(shí)施方案中,其不包括使用抗生素,并且宿主細(xì)胞和載體二者均不包含抗生素抗性基因。
附圖簡述
圖1是pVHH6載體的圖譜。
圖2是顯示在pVHH6ΔKan誘導(dǎo)24小時(shí)之后對(duì)W3110ccdB菌株的PCR篩選的照片。將誘導(dǎo)后的培養(yǎng)物在沒有抗生素的平板上劃線,并且對(duì)20個(gè)菌落進(jìn)行PCR。示出了關(guān)于VHH6(A)、ccdB(B)和菌株特異性(C)基因的PCR結(jié)果。左側(cè)的箭頭顯示PCR產(chǎn)物的預(yù)期大小。上端箭頭顯示ccdB變化。
圖3是顯示在SDS-PAGE上比較W3110pVHH6、W3110ccdB pVHH6ΔKan和W31102ccdB pVHH6ΔKan菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間觀察到差異,但是在誘導(dǎo)樣品(矩形)之間尤其如此。
圖4是pTraG載體的圖譜。
圖5是顯示在SDS-PAGE上比較3110ccdB pTraG和W31102ccdB pTraG菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間,觀察到差異,但是在誘導(dǎo)樣品之間未觀察到差異。
圖6是兩張照片的組合,所述兩張照片顯示通過考馬斯藍(lán)染色(左)或通過Western印跡(右)在SDS-PAGE上比較W3110pD1.3、W3110ccdB pD1.3ccdAΔAmp和W31102ccdB pD1.3ccdAΔAmp菌株的生產(chǎn)。通過Western印跡在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間充分觀察到差異。
圖7是顯示在pStaby1.2 TraG誘導(dǎo)24小時(shí)之后對(duì)SE3(BL21(DE3)2ccdB)菌株的篩選PCR的照片。將誘導(dǎo)后的培養(yǎng)物在皮氏培養(yǎng)皿上劃線,并且對(duì)22個(gè)菌落進(jìn)行PCR。示出了關(guān)于TraG(A)、ccdA(B)、第一ccdB(C)和第二ccdB(D)基因的PCR結(jié)果。左側(cè)的箭頭顯示PCR產(chǎn)物的預(yù)期大小。
圖8是顯示SE1 pStabyTraG和SE4(BL21(DE3)2ccdB 2gyrA)pStabyTraG菌株的生產(chǎn)比較的SDS-PAGE凝膠照片。在未誘導(dǎo)和誘導(dǎo)(I)樣品之觀察到差異。
圖9是顯示在SDS-PAGE上比較W3110ccdB pVHH6ΔKan、W31102ccdB pVHH6ΔKan和W31102ccdB 2gyrA pVHH6ΔKan菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間觀察到差異,但是在誘導(dǎo)樣品之間尤其如此。
實(shí)施例
通過以下實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步說明。
實(shí)施例1:ccdB基因的重復(fù)提高產(chǎn)率
為了測試由技術(shù)(基于在宿主染色體中插入一個(gè)拷貝的ccdB基因的技術(shù),Delphi Genetics,產(chǎn)品,專利WO9958652)生產(chǎn)的穩(wěn)定性,我們生產(chǎn)了似乎在大腸桿菌中也具有毒性特性的分泌蛋白(稱為VHH6的可變重鏈抗體片段)。使用W3110大腸桿菌菌株(遺傳背景:大腸桿菌K12,基因型:F-λ-INV(rrnD-rrnE)rph-1)作為生產(chǎn)者宿主并且在pBR322載體上用pTrc啟動(dòng)子來實(shí)現(xiàn)表達(dá)((pVHH6;圖6)。將使用典型抗生素穩(wěn)定系統(tǒng)(在此為卡那霉素抗性)的W3110菌株的生產(chǎn)與已進(jìn)行修飾使用技術(shù)的W3110ccdB菌株(ccdB基因引入到菌株染色體內(nèi))的生產(chǎn)進(jìn)行比較。用于這一比較的載體二者均包含ccdA基因,并且W3110ccdB中使用的載體缺失卡那霉素抗性基因(pVHH6ΔKan)。
在具有或不具有抗生素下在LB培養(yǎng)基(10ml)中于30℃下培養(yǎng)菌株,并且當(dāng)OD600達(dá)到0.5時(shí)誘導(dǎo)(0,5mM IPTG)4小時(shí)。盡管在這些溫和誘導(dǎo)條件下兩種選擇系統(tǒng)都具有100%的質(zhì)粒穩(wěn)定性,但是當(dāng)通過SDS-PAGE進(jìn)行分析時(shí)沒有明顯的生產(chǎn)。如下施加更強(qiáng)的誘導(dǎo)條件(在基于灌注的連續(xù)發(fā)酵之后)。在500ml發(fā)酵罐中培養(yǎng)菌株,并通過灌注來使OD600恒定維持在0.3:在發(fā)酵罐中添加新鮮培養(yǎng)基(多至5l)并除去溢流液以使OD600一直維持至0.3。在灌注5l之后,OD600增加,并且當(dāng)培養(yǎng)物達(dá)到OD600為0.5時(shí),最終實(shí)現(xiàn)誘導(dǎo)24小時(shí)。當(dāng)使用抗生素選擇系統(tǒng)來穩(wěn)定表達(dá)載體時(shí),通過將細(xì)菌鋪板在含有或不含合適抗生素(根據(jù)質(zhì)粒編碼的抗性基因)的平板上來確定最終的質(zhì)粒穩(wěn)定性。使用不具有抗生素的平板來確定細(xì)菌的總數(shù)并使用含有抗生素的平板來確定仍包含質(zhì)粒的細(xì)菌的數(shù)量。
經(jīng)評(píng)價(jià),使用抗生素的細(xì)菌的質(zhì)粒穩(wěn)定性為約0%(在含有抗生素的平板上無菌落)。
當(dāng)使用基于ccdA和ccdB的系統(tǒng)時(shí),不存在抗生素抗性基因。因此,通過PCR來測試質(zhì)粒的存在或不存在。由于我們使用的是系統(tǒng),因此我們假設(shè):由于選擇性ccdB基因存在于細(xì)菌染色體中,ccdA解毒劑基因存在于質(zhì)粒中,因此在平板上生長的所有細(xì)菌均應(yīng)含有該質(zhì)粒。出乎意料的是,通過對(duì)菌落的PCR實(shí)驗(yàn),我們觀察到約65%的穩(wěn)定性(圖2B)。事實(shí)上,雖然穩(wěn)定性顯著提高,但是這是首次技術(shù)未實(shí)現(xiàn)100%穩(wěn)定性。
此外,在保留的65%中,在所有的受試質(zhì)粒中目的基因(VHH6基因)均通過部分或完全缺失而突變(圖2A)。提取高于預(yù)期的ccdB PCR條帶并測序。測序結(jié)果顯示:小插入序列(insAB)的插入(SEQ ID NO:16)使ccdB基因失活。根據(jù)菌株特異性PCR結(jié)果(圖2C),除ccdB基因之外的未擴(kuò)增條帶可能歸因于ccdB區(qū)中的大缺失或插入。已重復(fù)該實(shí)驗(yàn)并且觀察到等同結(jié)果。
因此,必需改進(jìn)技術(shù)以避免這種穩(wěn)定系統(tǒng)失活。在yjjK和slt基因之間插入第二拷貝的毒物基因(生產(chǎn)W31102ccdB菌株)。選擇這些基因是因?yàn)樗麄兿鄬?duì)于第一ccdB基因位置在大腸桿菌染色體的相對(duì)位點(diǎn),并且因?yàn)榛蜷g間隔似乎是非編碼的。
為了比較W3110、W3110ccdB和W31102ccdB菌株中的生產(chǎn),應(yīng)用以下方案。在10ml LB培養(yǎng)基中于37℃下過夜培養(yǎng)單菌落。次日,使用每份培養(yǎng)物中的1μl來接種10ml新鮮LB培養(yǎng)基。在37℃下過夜培養(yǎng)培養(yǎng)物。在此重復(fù)該步驟以進(jìn)行額外的傳代(如在發(fā)酵罐中實(shí)現(xiàn)的)。次日,使用每份培養(yǎng)物中的10μl來接種10ml新鮮LB培養(yǎng)基。在30℃下培養(yǎng)培養(yǎng)物,并在OD600 0.5時(shí)誘導(dǎo)24小時(shí)。在所有這些步驟期間僅對(duì)W3110菌株使用卡那霉素。盡管使用該抗生素來維持表達(dá)質(zhì)粒,在誘導(dǎo)之后其穩(wěn)定性仍為約0%。另一方面,在這一較為溫和的方案之下,兩種系統(tǒng)(即,具有1或2個(gè)ccdB基因)的質(zhì)粒穩(wěn)定性為約100%:對(duì)ccdB基因和質(zhì)粒ccdA基因進(jìn)行的每個(gè)PCR均在預(yù)期大小處。對(duì)于W31102ccdB培養(yǎng)物,僅一些VHH6基因被突變(27%)。
還通過考馬斯藍(lán)SDS-PAGE來比較生產(chǎn)(圖3)。出乎意料的是,W31102ccdB菌株的產(chǎn)率遠(yuǎn)遠(yuǎn)高于其他菌株(VHH6=27kDa)。這種產(chǎn)率提高已經(jīng)在使用技術(shù)但是僅具有一個(gè)ccdB拷貝時(shí)被報(bào)道過(Peubez等,Microbial Cell Factories 2010,9:65;Sodoyer et al.,In:Antibiotic Resistant Bacteria-A Continuous Challenge in the New Millennium 2012)。在此,盡管在具有一個(gè)拷貝的ccdB基因的細(xì)菌中質(zhì)粒是穩(wěn)定的且存在的,但是令人吃驚的是只有在存在兩個(gè)拷貝的ccdB時(shí)才發(fā)生產(chǎn)率提高。
實(shí)施例2:2ccdB技術(shù)生產(chǎn)其他蛋白質(zhì)的應(yīng)用
為了測試具有兩個(gè)ccdB基因拷貝的菌株是否能夠用于所有蛋白質(zhì)(包括在僅一個(gè)ccdB拷貝下已得到良好表達(dá)的蛋白質(zhì)),我們測試了70kDa的TraG蛋白的生產(chǎn)(Szpirer等,2000,Mol.Microbiol.37(6)1283-1292)。構(gòu)建具有編碼解毒劑CcdA和TraG(pTraG)的質(zhì)粒的W3110(DE3)ccdB和W3110(DE3)2ccdB菌株(圖4)。traG基因在T7啟動(dòng)子控制之下。這些菌株和質(zhì)粒使用技術(shù)來穩(wěn)定質(zhì)粒。第一觀察結(jié)果是:在編碼ccdA的質(zhì)粒存在下,兩個(gè)拷貝的ccdB基因存在既不影響W3110菌株的生存力,也不影響其生長。質(zhì)粒中的一個(gè)拷貝的ccdA基因足以獲得完全生存力。
TraG在典型系統(tǒng)(1個(gè)ccdB基因)下的生產(chǎn)等同于在新系統(tǒng)(2個(gè)ccdB基因)的生產(chǎn)(圖5)。然而,1個(gè)ccdB下的生產(chǎn)已經(jīng)提供非常優(yōu)良的產(chǎn)率,因此,提高該差率可能是不可能的,甚至通過應(yīng)用新系統(tǒng)也如此。
為了確定我們之前的結(jié)果,已實(shí)現(xiàn)另一生產(chǎn)。選擇抗體片段作為模型(重鏈和輕鏈為D1.3=24kDa,相關(guān)鏈為50kDa)并使用Para啟動(dòng)子(阿拉伯糖誘導(dǎo))來進(jìn)行表達(dá)。已使載體(pBAD24)適用于包含ccdB基因的菌株(插入ccdA并且缺失氨芐青霉素抗性基因)。
如圖6中所示,通過使用1或2個(gè)ccdB基因,產(chǎn)率得到強(qiáng)烈提高,但是我們并未在兩種菌株之間觀察到差異(包括生長和速度)。
總而言之,具有2個(gè)拷貝的ccdB基因的菌株的使用可用于生產(chǎn)任何蛋白質(zhì)。然而,產(chǎn)率優(yōu)勢取決于每種蛋白質(zhì),并且當(dāng)在使用僅1個(gè)拷貝ccdB時(shí)產(chǎn)率就已經(jīng)非常高時(shí),編碼2個(gè)拷貝的菌株提供相同的結(jié)果。由于當(dāng)工業(yè)生產(chǎn)者和研究人員在其開始實(shí)驗(yàn)時(shí)并不知道某一蛋白質(zhì)是否會(huì)難以生產(chǎn),因此能夠?qū)Φ湫偷鞍踪|(zhì)和生產(chǎn)困難的蛋白質(zhì)使用相同菌株并且一開始就使用針對(duì)最難蛋白質(zhì)設(shè)計(jì)的菌株是一項(xiàng)優(yōu)勢。
實(shí)施例3:2ccdB技術(shù)在其他宿主菌株中生產(chǎn)蛋白質(zhì)的應(yīng)用
大腸桿菌菌株分為K12型和B型。由于W3110菌株是一種K12菌株時(shí),因此測試了2ccdB技術(shù)對(duì)B菌株的適用性。因此,向大腸桿菌B(BL21(DE3)型–遺傳背景:大腸桿菌B–基因型F–ompT gal dcm lon hsdSB(rB-mB-)λ(DE3[lacI lacUV5-T7基因1]))的基因組中引入兩個(gè)ccdB拷貝以得到SE3菌株。然后,實(shí)現(xiàn)灌注發(fā)酵以在幾代之后生產(chǎn)TraG蛋白。誘導(dǎo)24小時(shí)之后的質(zhì)粒穩(wěn)定性為100%(圖7)。在這些表達(dá)條件下,每個(gè)ccdB基因都是完整的。
在具有以下基因型的另一K12衍生菌株中獲得類似的結(jié)果:F-endA1 glnV44 thi-1 recA1 relA1 gyrA96 deoR nupGΦ80dlacZΔM15Δ(lacZYA-argF)U169,hsdR17(rK-mK+),λ–,dcm::FRTccdB yjjK::FRTccdB。該菌株由DH5α在其中如上所述插入2個(gè)拷貝ccdB基因而衍生。
這些結(jié)果表明可構(gòu)建包含插入兩個(gè)拷貝的ccdB基因的不同大腸桿菌菌株。這些2個(gè)拷貝的存在不是有害的。
實(shí)施例4:gyrA基因的復(fù)制
如前所述,技術(shù)基于CcdB蛋白對(duì)大腸桿菌的毒性。當(dāng)CcdA解毒劑抑制ccdB基因的表達(dá)時(shí),不對(duì)該毒素基因施加選擇壓力。因此,不可能發(fā)現(xiàn)一些針對(duì)CcdB的大腸桿菌抗性菌株。然而,已通過在誘變劑存在下施加幾輪生長人工分離到這種抗性株((Bernard等,J Mol Biol.1992,226:735)。這種抗性菌株顯示出gyrA基因(CcdB的靶標(biāo))的突變,將精氨酸462改變成半胱氨酸。
在我們的毒性蛋白模型VHH6的表達(dá)期間(參見實(shí)施例1),已分離到具有野生型ccdB基因但不具有質(zhì)粒(也就是ccdA基因)的菌株。因此,這些菌株對(duì)CcdB具有抗性。對(duì)這些菌株中的gyrA基因進(jìn)行測序確定精氨酸462被修飾成另一尚未描述的氨基酸(絲氨酸)。
通過如該專利中所述復(fù)制ccdB基因,我們猜測對(duì)gyrA基因的選擇壓力將增加并且更容易產(chǎn)生CcdB抗性菌株。為了避免這些突變體,已實(shí)現(xiàn)了gyrA基因的復(fù)制。通過轉(zhuǎn)導(dǎo)被用作重組臂的同源區(qū)包圍的包含gyrA、卡那霉素和ccdB基因的DNA片段來在SE2菌株中在yjjK基因和slt基因之間整合第二拷貝(在同一插入中)的同時(shí)整合該新gyrA拷貝。使用卡那霉素抗性基因來選擇重組事件。該基因的周圍是兩個(gè)FRT位點(diǎn),允許使用FLP重組酶來將其去除。該構(gòu)建已成功完成并且菌株的生存力未改變。如實(shí)施例2中測試TraG表達(dá)的能力并且用稱為E4的SE2菌株衍生株(BL21(DE3)2ccdB 2gyrA)來進(jìn)行。
如圖8所示,TraG在典型系統(tǒng)(1個(gè)ccdB基因)下的生產(chǎn)等同于在新系統(tǒng)(2個(gè)ccdB基因+1個(gè)額外gyrA拷貝)下的生產(chǎn)。然而,在1個(gè)ccdB下的生產(chǎn)已經(jīng)實(shí)現(xiàn)非常好的產(chǎn)率,因此該產(chǎn)率可能不能得到提高,甚至通過應(yīng)用新系統(tǒng)也如此。我們可觀察到,添加2個(gè)ccdB和1個(gè)額外拷貝的gyrA(已經(jīng)存在1個(gè)拷貝)由于CcdB毒物蛋白的較高毒性而不降低蛋白質(zhì)的量。
向大腸桿菌W3110衍生株(稱為KW4:W31102ccdB 2gyrA的菌株)施加類似的遺傳修飾。比較該菌株與其他W3110菌株的毒性蛋白模型VHH6的生產(chǎn)。在生產(chǎn)之后,針對(duì)質(zhì)粒的存在來測試每種菌株并且在所有菌株中均觀察到100%保留。如圖9中所示,當(dāng)存在2個(gè)拷貝的ccdB基因時(shí),CHH6的生產(chǎn)更佳(圖9)。此外,如對(duì)SE4菌株所描述的,添加2個(gè)ccdB和1個(gè)額外拷貝的gyrA(已經(jīng)存在1個(gè)拷貝)不降低蛋白質(zhì)的量并且不影響生長能力。
實(shí)施例5:來自大腸桿菌O157的ccdB的用途
為了驗(yàn)證可在2ccdB系統(tǒng)中使用來自除F質(zhì)粒之外的其他來源的ccdB基因拷貝,我們構(gòu)建了包含來自大腸桿菌O157:H7的ccdB拷貝的菌株。選擇大腸桿菌O157:H7的ccdB基因是因?yàn)?1)其與來自F質(zhì)粒的ccdB基因僅具有36%同源性(在氨基酸水平),(2)其被來自F質(zhì)粒的相同CcdA蛋白抑制。
首先,構(gòu)建包含ccdBO157基因和卡那霉素基因的DNA片段,所述卡那霉素抗性基因的周圍是2個(gè)FRT位點(diǎn),允許在將該DNA片段插入細(xì)菌基因組中之后切除該抗性基因。將這一構(gòu)建體連接在質(zhì)粒中并轉(zhuǎn)化在B462(由于存在gyrA462突變而對(duì)CcdB具有抗性的菌株)中。接著,該片段插入在包含在Pbad啟動(dòng)子控制之下編碼ccdA的質(zhì)粒的大腸桿菌W3110的yjjK和slt基因之間在去除抗性基因之后生產(chǎn)新KW5菌株(W3110 yjjK::FRTccdBO157)。該菌株像WT菌株一樣生長,并且如所預(yù)期的當(dāng)Pbad啟動(dòng)子受到阻遏(在阿拉伯糖不存在下)時(shí)ccdBO157基因殺死細(xì)菌。這些結(jié)果表明,可使用ccdBO157基因來構(gòu)建菌株。CcdBO157蛋白產(chǎn)物被F質(zhì)粒CcdA抵消并且可用于本發(fā)明中。
實(shí)施例6:本發(fā)明宿主細(xì)胞的其他修飾
接下來,我們測試了2ccdB系統(tǒng)對(duì)包含經(jīng)遺傳修飾噬菌體的細(xì)菌菌株的適用性,所述遺傳修飾噬菌體含有表達(dá)系統(tǒng)并且其中缺失Q、S、R和Rz基因。這些基因的缺失防止當(dāng)發(fā)生噬菌體偶然重新活化時(shí)裂解宿主細(xì)胞。
在SE2菌株(BL21(DE3)dcm::FRTccdB)中轉(zhuǎn)導(dǎo)包含具有2個(gè)FRT位點(diǎn)的卡那霉素抗性基因且被Q、S、R和Rz基因的邊界區(qū)域包圍以允許通過同源重組使它們?nèi)笔У腄NA片段(如先前WO2013004817中所述)以在除去卡那霉素抗性基因之后產(chǎn)生菌株BL21(DE3)dcm::FRTccdB QSRRz::FRT。接著,在BL21(DE3)dcm::FRTccdB QSRRz::FRT中轉(zhuǎn)導(dǎo)編碼yjjK::FRTkanFRTccdB的另一片段以在去除卡那霉素抗性基因后產(chǎn)生SE5[BL21(DE3)dcm::FRTccdB yjjK::FRTccdB QSRRz::FRT]。該最終菌株如上所述包含2個(gè)ccdB基因并且缺失Q、S、R、Rz基因,從而避免細(xì)菌裂解。
將SE5菌株與其未經(jīng)修飾的QSSRz同源菌株(SE3)進(jìn)行比較。以與SE1菌株的相同速率生長,并且對(duì)照蛋白(TraG)的生產(chǎn)也提供相同結(jié)果。
序列表
<110> 德爾菲遺傳學(xué)公司
<120> 用于生產(chǎn)蛋白質(zhì)的經(jīng)改進(jìn)的宿主細(xì)胞
<130> CV - 357/PCT
<160> 19
<170> BiSSAP 1.3
<210> 1
<211> 306
<212> DNA
<213> 大腸桿菌
<220>
<223> ccdB
<400> 1
atgcagttta aggtttacac ctataaaaga gagagccgtt atcgtctgtt tgtggatgta 60
cagagtgata ttattgacac gcccgggcga cggatggtga tccccctggc cagtgcacgt 120
ctgctgtcag ataaagtctc ccgtgaactt tacccggtgg tgcatatcgg ggatgaaagc 180
tggcgcatga tgaccaccga tatggccagt gtgccggtct ccgttatcgg ggaagaagtg 240
gctgatctca gccaccgcga aaatgacatc aaaaacgcca ttaacctgat gttctgggga 300
atataa 306
<210> 2
<211> 2244
<212> DNA
<213> 大腸桿菌
<220>
<223> tonA DNA
<400> 2
atggcgcgtt ccaaaactgc tcagccaaaa cactcactgc gtaaaatcgc agttgtagta 60
gccacagcgg ttagcggcat gtctgtttat gcacaggcag cggttgaacc gaaagaagac 120
actatcaccg ttaccgctgc acctgcgccg caagaaagcg catgggggcc tgctgcaact 180
attgcggcgc gacagtctgc taccggcact aaaaccgata cgccgattca aaaagtgcca 240
cagtctattt ctgttgtgac cgccgaagag atggcgctgc atcagccgaa gtcggtaaaa 300
gaagcgctta gctacacgcc gggtgtctct gttggtacgc gtggcgcatc caacacctat 360
gaccacctga tcattcgcgg ctttgcggca gaaggccaaa gccagaataa ctatctgaat 420
ggcctgaagt tgcagggcaa cttctataac gatgcggtca ttgacccgta tatgctggaa 480
cgcgctgaaa ttatgcgtgg cccggtttcc gtgctttacg gtaaaagcag tcctggcggc 540
ctgttgaata tggtcagcaa gcgtccgacc accgaaccgc tgaaagaagt tcagtttaaa 600
gccggtactg acagcctgtt ccagactggt tttgacttta gcgattcgtt ggatgatgac 660
ggtgtttact cttatcgcct gaccggtctt gcgcgttctg ccaatgccca gcagaaaggg 720
tcagaagagc agcgttatgc tattgcaccg gcgttcacct ggcgtccgga tgataaaacc 780
aattttacct tcctttctta cttccagaac gagccggaaa ccggttatta cggctggttg 840
ccgaaagagg gaaccgttga gccgctgccg aacggtaagc gtctgccgac agactttaat 900
gaaggggcga agaacaacac ctattctcgt aatgagaaga tggtcggcta cagcttcgat 960
cacgaattta acgacacctt tactgtgcgt cagaacctgc gctttgctga aaacaaaacc 1020
tcgcaaaaca gcgtttatgg ttacggcgtc tgctccgatc cggcgaatgc ttacagcaaa 1080
cagtgtgcgg cattagcgcc agcggataaa ggccattatc tggcacgtaa atacgtcgtt 1140
gatgatgaga agctgcaaaa cttctccgtt gatacccagt tgcagagcaa gtttgccact 1200
ggcgatatcg accacaccct gctgaccggt gtcgacttta tgcgtatgcg taatgacatc 1260
aacgcctggt ttggttacga cgactctgtg ccactgctca atctgtacaa tccggtgaat 1320
accgatttcg acttcaatgc caaagatccg gcaaactccg gcccttaccg cattctgaat 1380
aaacagaaac aaacgggcgt ttatgttcag gatcaggcgc agtgggataa agtgctggtc 1440
accctaggcg gtcgttatga ctgggcagat caagaatctc ttaaccgcgt tgccgggacg 1500
accgataaac gtgatgacaa acagtttacc tggcgtggtg gtgttaacta cctgtttgat 1560
aatggtgtaa caccttactt cagctatagc gaatcgtttg aaccttcttc gcaagttggg 1620
aaggatggta atattttcgc accgtctaaa ggtaagcagt atgaagtcgg cgtgaaatat 1680
gtaccggaag atcgtccgat tgtagttact ggtgccgtgt ataatctcac taaaaccaac 1740
aacctgatgg cggaccctga gggttccttc ttctcggttg aaggtggcga gatccgcgca 1800
cgtggcgtag aaatcgaagc gaaagcggcg ctgtcggcga gtgttaacgt agtcggttct 1860
tatacttaca ccgatgcgga atacaccacc gatactacct ataaaggcaa tacgcctgca 1920
caggtgccaa aacacatggc ttcgttgtgg gctgactaca ccttctttga cggtccgctt 1980
tcaggtctga cgctgggcac cggtggtcgt tatactggct ccagttatgg tgatccggct 2040
aactccttta aagtgggaag ttatacggtc gtggatgcgt tagtacgtta tgatctggcg 2100
cgagtcggca tggctggctc caacgtggcg ctgcatgtta acaacctgtt cgatcgtgaa 2160
tacgtcgcca gctgctttaa cacttatggc tgcttctggg gcgcagaacg tcaggtcgtt 2220
gcaaccgcaa ccttccgttt ctaa 2244
<210> 3
<211> 1149
<212> DNA
<213> 大腸桿菌
<220>
<223> galK DNA
<400> 3
atgagtctga aagaaaaaac acaatctctg tttgccaacg catttggcta ccctgccact 60
cacaccattc aggcgcctgg ccgcgtgaat ttgattggtg aacacaccga ctacaacgac 120
ggtttcgttc tgccctgcgc gattgattat caaaccgtga tcagttgtgc accacgcgat 180
gaccgtaaag ttcgcgtgat ggcagccgat tatgaaaatc agctcgacga gttttccctc 240
gatgcgccca ttgtcgcaca tgaaaactat caatgggcta actacgttcg tggcgtggtg 300
aaacatctgc aactgcgtaa caacagcttc ggcggcgtgg acatggtgat cagcggcaat 360
gtgccgcagg gtgccgggtt aagttcttcc gcttcactgg aagtcgcggt cggaaccgta 420
ttgcagcagc tttatcatct gccgctggac ggcgcacaaa tcgcgcttaa cggtcaggaa 480
gcagaaaacc agtttgtagg ctgtaactgc gggatcatgg atcagctaat ttccgcgctc 540
ggcaagaaag atcatgcctt gctgatcgat tgccgctcac tggggaccaa agcagtttcc 600
atgcccaaag gtgtggctgt cgtcatcatc aacagtaact tcaaacgtac cctggttggc 660
agcgaataca acacccgtcg tgaacagtgc gaaaccggtg cgcgtttctt ccagcagcca 720
gccctgcgtg atgtcaccat tgaagagttc aacgctgttg cgcatgaact ggacccgatc 780
gtggcaaaac gcgtgcgtca tatactgact gaaaacgccc gcaccgttga agctgccagc 840
gcgctggagc aaggcgacct gaaacgtatg ggcgagttga tggcggagtc tcatgcctct 900
atgcgcgatg atttcgaaat caccgtgccg caaattgaca ctctggtaga aatcgtcaaa 960
gctgtgattg gcgacaaagg tggcgtacgc atgaccggcg gcggatttgg cggctgtatc 1020
gtcgcgctga tcccggaaga gctggtgcct gccgtacagc aagctgtcgc tgaacaatat 1080
gaagcaaaaa caggtattaa agagactttt tacgtttgta aaccatcaca aggagcagga 1140
cagtgctga 1149
<210> 4
<211> 1701
<212> DNA
<213> 大腸桿菌
<220>
<223> araB DNA
<400> 4
atggcgattg caattggcct cgattttggc agtgattctg tgcgagcttt ggcggtggac 60
tgcgctaccg gtgaagagat cgccaccagc gtagagtggt atccccgttg gcagaaaggg 120
caattttgtg atgccccgaa taaccagttc cgtcatcatc cgcgtgacta cattgagtca 180
atggaagcgg cactgaaaac cgtgcttgca gagcttagcg tcgaacagcg cgcagctgtg 240
gtcgggattg gcgttgacag taccggctcg acgcccgcac cgattgatgc cgacggaaac 300
gtgctggcgc tgcgcccgga gtttgccgaa aacccgaacg cgatgttcgt attgtggaaa 360
gaccacactg cggttgaaga agcggaagag attacccgtt tgtgccacgc gccgggcaac 420
gttgactact cccgctacat tggtggtatt tattccagcg aatggttctg ggcaaaaatc 480
ctgcatgtga ctcgccagga cagcgccgtg gcgcaatctg ccgcatcgtg gattgagctg 540
tgcgactggg tgccagctct gctttccggt accacccgcc cgcaggatat tcgtcgcgga 600
cgttgcagcg ccgggcataa atctctgtgg cacgaaagct ggggcggcct gccgccagcc 660
agtttctttg atgagctgga cccgatcctc aatcgccatt tgccttcccc gctgttcact 720
gacacttgga ctgccgatat tccggtgggc accttatgcc cggaatgggc gcagcgtctc 780
ggcctgcctg aaagcgtggt gatttccggc ggcgcgtttg actgccatat gggcgcagtt 840
ggcgcaggcg cacagcctaa cgcactggta aaagttatcg gtacttccac ctgcgacatt 900
ctgattgccg acaaacagag cgttggcgag cgggcagtta aaggtatttg cggtcaggtt 960
gatggcagcg tggtgcctgg atttatcggt ctggaagcag gccaatcggc gtttggtgat 1020
atctacgcct ggtttggtcg cgtactcggc tggccgctgg aacagcttgc cgcccagcat 1080
ccggaactga aaacgcaaat caacgccagc cagaaacaac tgcttccggc gctgaccgaa 1140
gcatgggcca aaaatccgtc tctggatcac ctgccggtgg tgctcgactg gtttaacggc 1200
cgccgcacac cgaacgctaa ccaacgcctg aaaggggtga ttaccgatct taacctcgct 1260
accgacgctc cgctgctgtt cggcggtttg attgctgcca ccgcctttgg cgcacgcgca 1320
atcatggagt gctttaccga tcaggggatc gccgttaata acgtgatggc actgggcggc 1380
atcgcgcgga aaaaccaggt cattatgcag gcctgctgcg acgtgctgaa tcgcccgctg 1440
caaattgttg cctctgacca gtgctgtgcg ctcggtgcgg cgatttttgc tgccgtcgcc 1500
gcgaaagtgc acgcagacat cccatcagct cagcaaaaaa tggccagtgc ggtagagaaa 1560
accctgcaac cgtgcagcga gcaggcacaa cgctttgaac agctttatcg ccgctatcag 1620
caatgggcga tgagcgccga acaacactat cttccaactt ccgccccggc acaggctgcc 1680
caggccgttg cgactctata a 1701
<210> 5
<211> 1503
<212> DNA
<213> 大腸桿菌
<220>
<223> araA DNA
<400> 5
atgacgattt ttgataatta tgaagtgtgg tttgtcattg gcagccagca tctgtatggc 60
ccggaaaccc tgcgtcaggt cacccaacat gccgagcacg tcgttaatgc gctgaatacg 120
gaagcgaaac tgccctgcaa actggtgttg aaaccgctgg gcaccacgcc ggatgaaatc 180
accgctattt gccgcgacgc gaattacgac gatcgttgcg ctggtctggt ggtgtggctg 240
cacaccttct ccccggccaa aatgtggatc aacggcctga ccatgctcaa caaaccgttg 300
ctgcaattcc acacccagtt caacgcggcg ctgccgtggg acagtatcga tatggacttt 360
atgaacctga accagactgc acatggcggt cgcgagttcg gcttcattgg cgcgcgtatg 420
cgtcagcaac atgccgtggt taccggtcac tggcaggata aacaagccca tgagcgtatc 480
ggctcctgga tgcgtcaggc ggtctctaaa caggataccc gtcatctgaa agtctgccga 540
tttggcgata acatgcgtga agtggcggtc accgatggcg ataaagttgc cgcacagatc 600
aagttcggtt tctccgtcaa tacctgggcg gttggcgatc tggtgcaggt ggtgaactcc 660
atcagcgacg gcgatgttaa cgcgctggtc gatgagtacg aaagctgcta caccatgacg 720
cctgccacac aaatccacgg caaaaaacga cagaacgtgc tggaagcggc gcgtattgag 780
ctggggatga agcgtttcct ggaacaaggt ggcttccacg cgttcaccac cacctttgaa 840
gatttgcacg gtctgaaaca gcttcctggt ctggccgtac agcgtctgat gcagcagggt 900
tacggctttg cgggcgaagg cgactggaaa actgccgccc tgcttcgcat catgaaggtg 960
atgtcaaccg gtctgcaggg cggcacctcc tttatggagg actacaccta tcacttcgag 1020
aaaggtaatg acctggtgct cggctcccat atgctggaag tctgcccgtc gatcgccgca 1080
gaagagaaac cgatcctcga cgttcagcat ctcggtattg gtggtaagga cgatcctgcc 1140
cgcctgatct tcaataccca aaccggccca gcgattgtcg ccagcttgat tgatctcggc 1200
gatcgttacc gtctactggt taactgcatc gacacggtga aaacaccgca ctccctgccg 1260
aaactgccgg tggcgaatgc gctgtggaaa gcgcaaccgg atctgccaac tgcttccgaa 1320
gcgtggatcc tcgctggtgg cgcgcaccat accgtcttca gccatgcact gaacctcaac 1380
gatatgcgcc aattcgccga gatgcacgac attgaaatca cggtgattga taacgacaca 1440
cgcctgccag cgtttaaaga cgcgctgcgc tggaacgaag tgtattacgg gtttcgtcgc 1500
taa 1503
<210> 6
<211> 2355
<212> DNA
<213> 大腸桿菌
<220>
<223> lon DNA
<400> 6
atgaatcctg agcgttctga acgcattgaa atccccgtat tgccgctgcg cgatgtggtg 60
gtttatccgc acatggtcat ccccttattt gtcgggcggg aaaaatctat ccgttgtctg 120
gaagcggcga tggaccatga taaaaaaatt atgctggtcg cgcagaaaga agcttcaacg 180
gatgagccgg gtgtaaacga tcttttcacc gtcgggaccg tggcctctat attgcagatg 240
ctgaaactgc ctgacggcac cgtcaaagtg ctggtcgagg ggttacagcg cgcgcgtatt 300
tctgcgctct ctgacaatgg cgaacacttt tctgcgaagg cggagtatct ggagtcgccg 360
accattgatg agcgggaaca ggaagtgctg gtgcgtactg caatcagcca gttcgaaggc 420
tacatcaagc tgaacaaaaa aatcccacca gaagtgctga cgtcgctgaa tagcatcgac 480
gatccggcgc gtctggcgga taccattgct gcacatatgc cgctgaaact ggctgacaaa 540
cagtctgttc tggagatgtc cgacgttaac gaacgtctgg aatatctgat ggcaatgatg 600
gaatcggaaa tcgatctgct gcaggttgag aaacgcattc gcaaccgcgt taaaaagcag 660
atggagaaat cccagcgtga gtactatctg aacgagcaaa tgaaagctat tcagaaagaa 720
ctcggtgaaa tggacgacgc gccggacgaa aacgaagccc tgaagcgcaa aatcgacgcg 780
gcgaagatgc cgaaagaggc aaaagagaaa gcggaagcag agttgcagaa gctgaaaatg 840
atgtctccga tgtcggcaga agcgaccgta gtgcgtggtt atatcgactg gatggtacag 900
gtgccgtgga atgcgcgtag caaggtcaaa aaagacctgc gtcaggcgca ggaaatcctt 960
gataccgacc attatggtct ggagcgcgtg aaagatcgaa tccttgagta tcttgcggtt 1020
caaagccgtg tcaacaaaat caagggaccg atcctctgcc tggtagggcc gccgggggta 1080
ggtaaaacct ctcttggtca gtccattgcc aaagccaccg ggcgtaaata tgtccgtatg 1140
gcgctgggcg gcgtgcgtga tgaagcggaa atccgtggtc accgccgtac ttacatcggt 1200
tctatgccgg gtaaactgat ccagaaaatg gcgaaagtgg gcgtgaaaaa cccgctgttc 1260
ctgctcgatg agatcgacaa aatgtcttct gacatgcgtg gcgatccggc ctctgcactg 1320
cttgaagtgc tggatccaga gcagaacgta gcgttcagcg accactacct ggaagtggat 1380
tacgatctca gcgacgtgat gtttgtcgcg acgtcgaact ccatgaacat tccggcaccg 1440
ctgctggatc gtatggaagt gattcgcctc tccggttata ccgaagatga aaaactgaac 1500
atcgccaaac gtcacctgct gccgaagcag attgaacgta atgcactgaa aaaaggtgag 1560
ctgaccgtcg acgatagcgc cattatcggc attattcgtt actacacccg tgaggcgggc 1620
gtgcgtggtc tggagcgtga aatctccaaa ctgtgtcgca aagcggttaa gcagttactg 1680
ctcgataagt cattaaaaca tatcgaaatt aacggcgata acctgcatga ctatctcggt 1740
gttcagcgtt tcgactatgg tcgcgcggat aacgaaaacc gtgtcggtca ggtaaccggt 1800
ctggcgtgga cggaagtggg cggtgacttg ctgaccattg aaaccgcatg tgttccgggt 1860
aaaggcaaac tgacctatac cggttcgctc ggcgaagtga tgcaggagtc cattcaggcg 1920
gcgttaacgg tggttcgtgc gcgtgcggaa aaactgggga tcaaccctga tttttacgaa 1980
aaacgtgaca tccacgtcca cgtaccggaa ggtgcgacgc cgaaagatgg tccgagtgcc 2040
ggtattgcta tgtgcaccgc gctggtttct tgcctgaccg gtaacccggt tcgtgccgat 2100
gtggcaatga ccggtgagat cactctgcgt ggtcaggtac tgccgatcgg tggtttgaaa 2160
gaaaaactcc tggcagcgca tcgcggcggg attaaaacag tgctaattcc gttcgaaaat 2220
aaacgcgatc tggaagagat tcctgacaac gtaattgccg atctggacat tcatcctgtg 2280
aagcgcattg aggaagttct gactctggcg ctgcaaaatg aaccgtctgg tatgcaggtt 2340
gtgactgcaa aatag 2355
<210> 7
<211> 954
<212> DNA
<213> 大腸桿菌
<220>
<223> ompT DNA
<400> 7
atgcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60
tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120
ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180
caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240
atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300
atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360
caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420
ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480
tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540
ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600
attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660
agcggctggg tggaatcatc tgataacgat gaacactatg acccgggaaa aagaatcact 720
tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780
gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840
ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900
ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954
<210> 8
<211> 624
<212> DNA
<213> 大腸桿菌
<220>
<223> rcsA DNA
<400> 8
atgtcaacga ttattatgga tttatgtagt tacacccgac taggtttaac cgggtatctg 60
ttgagtagag gggttaaaaa aagagaaatc aacgacattg aaaccgttga tgaccttgcc 120
atagcttgtg attcacagcg cccttcagtg gtgtttatta atgaggactg tttcatccac 180
gatgcttcta acagtcagcg tatcaagctc atcattaatc aacatcccaa tacgttattt 240
atcgttttta tggcaattgc caatgttcat tttgatgaat atctattggt cagaaaaaat 300
ttattgatca gttctaaatc gattaaaccg gaatctctcg acgatatcct tggcgatatt 360
ctgaaaaaag agacaacgat aacctcgttt ttaaatatgc cgacgttatc attgagccga 420
accgaatcga gtatgttgcg aatgtggatg gcaggtcagg gaaccattca aatctctgac 480
caaatgaata tcaaagccaa gaccgtttca tcgcataaag gtaatattaa acgtaagatc 540
aaaacgcata ataaacaggt tatctaccat gtcgtccgac tgacggataa tgtgactaat 600
ggtatttttg tcaacatgcg ctaa 624
<210> 9
<211> 3567
<212> DNA
<213> 大腸桿菌
<220>
<223> hsdR DNA
<400> 9
atgttatggg ccttaaatat ttggacaggc ccgcacagca atggattaat aacaatgatg 60
aataaatcca attttgaatt cctgaagggc gtcaacgact tcacttatgc catcgcctgt 120
gcggcggaaa ataactaccc ggatgatccc aacacgacgc tgattaaaat gcgtatgttt 180
ggcgaagcca cagcgaaaca tcttggtctg ttactcaaca tccccccttg tgagaatcaa 240
cacgatctcc tgcgtgaact cggcaaaatc gcctttgttg atgacaacat cctctctgta 300
tttcacaaat tacgccgcat tggtaaccag gcggtgcacg aatatcataa cgatctcaac 360
gatgcccaga tgtgcctgcg actcgggttc cgcctggctg tctggtacta ccgtctggtc 420
actaaagatt atgacttccc ggtgccggtg tttgtgttgc cggaacgtgg tgaaaacctc 480
tatcaccagg aagtgctgac gctaaaacaa cagcttgaac agcaggtgcg agaaaaagcg 540
cagactcagg cagaagtcga agcgcaacag cagaagctgg ttgccctgaa cggctatatc 600
gccattctgg aaggcaaaca gcaggaaacc gaagcgcaaa cccaggctcg ccttgcggca 660
ctggaagcac agctcgccga gaagaacgcg gaactggcaa aacagaccga acaggaacgt 720
aaggcttacc acaaagaaat taccgatcag gccatcaagc gcacactcaa ccttagcgaa 780
gaagagagtc gcttcctgat tgatgcgcaa ctgcgtaaag caggctggca ggccgacagc 840
aaaaccctgc gcttctccaa aggcgcacgt ccggaacccg gcgtcaataa agccattgcc 900
gaatggccga ccggaaaaga tgaaacgggt aatcagggct ttgcggatta tgtgctgttt 960
gtcggcctca aacccatcgc ggtggtagag gcgaaacgta acaatatcga cgttcccgcc 1020
aggctcaatg agtcgtatcg ctacagtaaa tgtttcgata atggcttcct gcgggaaacc 1080
ttgcttgagc actactcacc ggatgaagtg catgaagcag tgccagagta tgaaaccagc 1140
tggcaggaca ccagcggcaa acaacggttt aaaatcccct tctgctactc gaccaacggg 1200
cgcgaatacc gcgcaacaat gaagaccaaa agcggcatct ggtatcgcga cgtgcgtgat 1260
acccgcaata tgtcgaaagc cttacccgag tggcaccgcc cggaagagct gctggaaatg 1320
ctcggcagcg aaccgcaaaa acagaatcag tggtttgccg ataaccctgg catgagcgag 1380
ctgggcctgc gttattatca ggaagatgcc gtccgcgcgg ttgaaaaggc aatcgtcaag 1440
gggcaacaag agatcctgct ggcgatggcg accggtaccg gtaaaacccg tacggcaatc 1500
gccatgatgt tccgcctgat ccagtcccag cgttttaaac gcattctctt ccttgtcgac 1560
cgccgttctc ttggcgaaca ggcgctgggc gcgtttgaag atacgcgtat taacggcgac 1620
accttcaaca gcattttcga cattaaaggg ctgacggata aattcccgga agacagcacc 1680
aaaattcacg ttgccaccgt acagtcgctg gtgaaacgca ccctgcaatc agatgaaccg 1740
atgccggtgg cccgttacga ctgtatcgtc gttgacgaag cgcatcgcgg ctatattctc 1800
gataaagagc agaccgaagg cgaactgcag ttccgcagcc agctggatta cgtctctgcc 1860
taccgtcgca ttctcgatca cttcgatgcg gtaaaaatcg ctctcaccgc caccccggcg 1920
ctacatactg tgcagatttt cggcgagccg gtttaccgtt atacctaccg taccgcggtt 1980
atcgacggtt ttctgatcga ccaggatccg cctattcaga tcatcacccg caacgcgcag 2040
gagggggttt atctctccaa aggcgagcag gtagagcgca tcagcccgca gggagaagtg 2100
atcaatgaca ccctggaaga cgatcaggat tttgaagtcg ccgactttaa ccgtggcctg 2160
gtgatcccgg cgtttaaccg cgccgtctgt aacgaactca ccaattatct tgacccgacc 2220
ggatcgcaaa aaacgctggt cttctgcgtc accaatgccc atgccgatat ggtggtggaa 2280
gagctgcgtg ccgcgttcaa gaaaaagtat ccgcaactgg agcacgacgc gatcatcaag 2340
atcaccggtg atgccgataa agacgcgcgc aaagtgcaga ccatgatcac ccgcttcaat 2400
aaagagcggc tgcccaatat cgtggtaacc gtcgacctgc tgacgaccgg cgtcgatatt 2460
ccgtcgatct gtaatatcgt gttcctgcgt aaagtacgca gccgcattct gtacgaacag 2520
atgaaaggcc gcgccacgcg cttatgcccg gaggtgaata aaaccagctt taagattttt 2580
gactgtgtcg atatctacag cacgctggag agcgtcgaca ccatgcgtcc ggtggtggtg 2640
cgcccgaagg tggaactgca aacgctggtc aatgaaatta ccgattcaga aacctataaa 2700
atcaccgaag cggatggccg cagttttgcc gagcacagcc atgaacaact ggtggcgaag 2760
ctccagcgta tcatcggtct ggccacgttt aaccgtgacc gcagcgaaac gatagataaa 2820
caggtgcgtc gtctggatga gctatgccag gacgcggcgg gcgtgaactt taacggcttc 2880
gcctcgcgcc tgcgggaaaa agggccgcac tggagcgccg aagtctttaa caaactgcct 2940
ggctttatcg cccgtctgga aaagctgaaa acggacatca acaacctgaa tgatgcgccg 3000
atcttcctcg atatcgacga tgaagtggtg agtgtaaaat cgctgtacgg tgattacgac 3060
acgccgcagg atttcctcga agcctttgac tcgctggtgc aacgttcccc gaacgcgcaa 3120
ccggcattgc aggcagttat taatcgcccg cgcgatctca cccgtaaagg gctggtcgag 3180
ctacaggagt ggtttgaccg ccagcacttt gaggaatctt ccctgcgcaa agcatggaaa 3240
gagacgcgca atgaagatat cgccgcccgg ctgattggtc atattcgccg cgctgcggtg 3300
ggcgatgcgc tgaaaccgtt tgaggaacgt gtcgatcacg cgctgacgcg cattaagggc 3360
gaaaacgact ggagcagcga gcaattaagc tggctcgatc gtttagcgca ggcgctgaaa 3420
gagaaagtgg tgctcgacga cgatgtcttc aaaaccggca acttccaccg tcgcggcggg 3480
aaggcgatgc tgcaaagaac ctttgacgat aatctcgata ccctgctggg caaattcagc 3540
gattatatct gggacgagct ggcctga 3567
<210> 10
<211> 915
<212> DNA
<213> 大腸桿菌
<220>
<223> mrr DNA
<400> 10
atgacggttc ctacctatga caaatttatt gaacctgttc tgcgttatct ggcaacaaaa 60
ccggaaggtg cagccgcgcg tgatgttcat gaggctgccg cggatgcatt aggactggat 120
gacagccagc gagcgaaagt cattaccagc ggacaacttg tttataaaaa tcgtgcaggc 180
tgggcgcatg accgtttaaa acgtgccggg ttgtcgcaaa gtttgtcgcg tggcaaatgg 240
tgcctgactc ctgcgggttt tgactgggtt gcgtctcatc cccagccaat gacggagcag 300
gagacgaacc atctggcctt cgcttttgtg aatgtcaaac ttaagtcacg gccggatgcc 360
gtcgatttag atccgaaagc cgactctccc gatcatgaag aacttgcaaa gagcagcccg 420
gacgatcggt tagatcaggc gctaaaagag cttcgtgatg cggtggctga tgaggttctg 480
gaaaacttat tgcaggtttc tccttcgcgc tttgaagtca ttgttctgga tgttttgcat 540
cgcctggggt atggcggcca ccgtgatgat ttgcagcgtg ttggcggtac tggagatggt 600
ggcatcgatg gtgtgatatc gcttgataaa cttggcctgg agaaagttta tgttcaggca 660
aaacgttggc agaatactgt aggcaggcca gaattacagg cattttacgg cgcactggct 720
gggcaaaaag cgaaacgtgg ggtgtttatt accacttctg gatttacttc tcaggcgcgt 780
gactttgccc aatccgtcga gggtatggtg ttggttgatg gggaacgcct ggtgcactta 840
atgatcgaaa acgaagtagg ggtttcttca cgtttgttga aggtgccgaa actggatatg 900
gactattttg agtga 915
<210> 11
<211> 708
<212> DNA
<213> 大腸桿菌
<220>
<223> endA DNA
<400> 11
atgtaccgtt atttgtctat tgctgcggtg gtactgagcg cagcattttc cggcccggcg 60
ttggccgaag gtatcaatag tttttctcag gcgaaagccg cggcggtaaa agtccacgct 120
gacgcgcccg gtacgtttta ttgcggatgt aaaattaact ggcagggcaa aaaaggcgtt 180
gttgatctgc aatcgtgcgg ctatcaggtg cgcaaaaatg aaaaccgcgc cagccgcgta 240
gagtgggaac atgtcgttcc cgcctggcag ttcggtcacc agcgccagtg ctggcaggac 300
ggtggacgta aaaactgcgc taaagatccg gtctatcgca agatggaaag cgatatgcat 360
aacctgcagc cgtcagtcgg tgaggtgaat ggcgatcgcg gcaactttat gtacagccag 420
tggaatggcg gtgaaggcca gtacggtcaa tgcgccatga aggtcgattt caaagaaaaa 480
gctgccgaac caccagcgcg tgcacgcggt gccattgcgc gcacctactt ctatatgcgc 540
gaccaataca acctgacact ctctcgccag caaacgcagc tgttcaacgc atggaacaag 600
atgtatccgg ttaccgactg ggagtgcgag cgcgatgaac gcatcgcgaa ggtgcagggc 660
aatcataacc cgtatgtgca acgcgcttgc caggcgcgaa agagctaa 708
<210> 12
<211> 1062
<212> DNA
<213> 大腸桿菌
<220>
<223> recA DNA
<400> 12
atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60
caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120
atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180
cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240
atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300
gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360
gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420
gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480
ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540
ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600
ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660
tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720
agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780
ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840
aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900
cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960
gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020
gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062
<210> 13
<211> 219
<212> DNA
<213> 大腸桿菌
<220>
<223> CcdA DNA
<400> 13
atgaagcagc gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat 60
gatgtcaata tctccggtct ggtaagcaca accatgcaga atgaagcccg tcgtctgcgt 120
gccgaacgct ggaaagcgga aaatcaggaa gggatggctg aggtcgcccg gtttattgaa 180
atgaacggct cttttgctga cgagaacagg gactggtga 219
<210> 14
<211> 29865
<212> DNA
<213> 人工序列
<220>
<223> 噬菌體P11
<400> 14
gcttttttat actaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 60
caggtcacta tcagtcaaaa taaaatcatt atttgatttc aattttgtcc cactccctgc 120
ctctgtcatc acgatactgt gatgccatgg tgtccgactt atgcccgaga agatgttgag 180
caaacttatc gcttatctgc ttctcataga gtcttgcaga caaactgcgc aactcgtgaa 240
aggtaggcgg atccagatcc cggacaccat cgaatggcgc aaaacctttc gcggtatggc 300
atgatagcgc ccggaagaga gtcaattcag ggtggtgaat gtgaaaccag taacgttata 360
cgatgtcgca gagtatgccg gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc 420
cagccacgtt tctgcgaaaa cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta 480
cattcccaac cgcgtggcac aacaactggc gggcaaacag tcgttgctga ttggcgttgc 540
cacctccagt ctggccctgc acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc 600
cgatcaactg ggtgccagcg tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg 660
taaagcggcg gtgcacaatc ttctcgcgca acgcgtcagt gggctgatca ttaactatcc 720
gctggatgac caggatgcca ttgctgtgga agctgcctgc actaatgttc cggcgttatt 780
tcttgatgtc tctgaccaga cacccatcaa cagtattatt ttctcccatg aagacggtac 840
gcgactgggc gtggagcatc tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg 900
cccattaagt tctgtctcgg cgcgtctgcg tctggctggc tggcataaat atctcactcg 960
caatcaaatt cagccgatag cggaacggga aggcgactgg agtgccatgt ccggttttca 1020
acaaaccatg caaatgctga atgagggcat cgttcccact gcgatgctgg ttgccaacga 1080
tcagatggcg ctgggcgcaa tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga 1140
tatctcggta gtgggatacg acgataccga agacagctca tgttatatcc cgccgttaac 1200
caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct tgctgcaact 1260
ctctcagggc caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa 1320
aaccaccctg gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1380
gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 1440
taagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa 1500
tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 1560
gattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 1620
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 1680
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgctttgc ctggtttccg 1740
gcaccagaag cggtgccgga aagctggctg gagtgcgatc ttcctgaggc cgatactgtc 1800
gtcgtcccct caaactggca gatgcacggt tacgatgcgc ccatctacac caacgtgacc 1860
tatcccatta cggtcaatcc gccgtttgtt cccacggaga atccgacggg ttgttactcg 1920
ctcacattta atgttgatga aagctggcta caggaaggcc agacgcgaat tatttttgat 1980
ggcgtcggga tctgatccgg atttactaac tggaagaggc actaaatgaa cacgattaac 2040
atcgctaaga acgacttctc tgacatcgaa ctggctgcta tcccgttcaa cactctggct 2100
gaccattacg gtgagcgttt agctcgcgaa cagttggccc ttgagcatga gtcttacgag 2160
atgggtgaag cacgcttccg caagatgttt gagcgtcaac ttaaagctgg tgaggttgcg 2220
gataacgctg ccgccaagcc tctcatcact accctactcc ctaagatgat tgcacgcatc 2280
aacgactggt ttgaggaagt gaaagctaag cgcggcaagc gcccgacagc cttccagttc 2340
ctgcaagaaa tcaagccgga agccgtagcg tacatcacca ttaagaccac tctggcttgc 2400
ctaaccagtg ctgacaatac aaccgttcag gctgtagcaa gcgcaatcgg tcgggccatt 2460
gaggacgagg ctcgcttcgg tcgtatccgt gaccttgaag ctaagcactt caagaaaaac 2520
gttgaggaac aactcaacaa gcgcgtaggg cacgtctaca agaaagcatt tatgcaagtt 2580
gtcgaggctg acatgctctc taagggtcta ctcggtggcg aggcgtggtc ttcgtggcat 2640
aaggaagact ctattcatgt aggagtacgc tgcatcgaga tgctcattga gtcaaccgga 2700
atggttagct tacaccgcca aaatgctggc gtagtaggtc aagactctga gactatcgaa 2760
ctcgcacctg aatacgctga ggctatcgca acccgtgcag gtgcgctggc tggcatctct 2820
ccgatgttcc aaccttgcgt agttcctcct aagccgtgga ctggcattac tggtggtggc 2880
tattgggcta acggtcgtcg tcctctggcg ctggtgcgta ctcacagtaa gaaagcactg 2940
atgcgctacg aagacgttta catgcctgag gtgtacaaag cgattaacat tgcgcaaaac 3000
accgcatgga aaatcaacaa gaaagtccta gcggtcgcca acgtaatcac caagtggaag 3060
cattgtccgg tcgaggacat ccctgcgatt gagcgtgaag aactcccgat gaaaccggaa 3120
gacatcgaca tgaatcctga ggctctcacc gcgtggaaac gtgctgccgc tgctgtgtac 3180
cgcaaggaca aggctcgcaa gtctcgccgt atcagccttg agttcatgct tgagcaagcc 3240
aataagtttg ctaaccataa ggccatctgg ttcccttaca acatggactg gcgcggtcgt 3300
gtttacgctg tgtcaatgtt caacccgcaa ggtaacgata tgaccaaagg actgcttacg 3360
ctggcgaaag gtaaaccaat cggtaaggaa ggttactact ggctgaaaat ccacggtgca 3420
aactgtgcgg gtgtcgataa ggttccgttc cctgagcgca tcaagttcat tgaggaaaac 3480
cacgagaaca tcatggcttg cgctaagtct ccactggaga acacttggtg ggctgagcaa 3540
gattctccgt tctgcttcct tgcgttctgc tttgagtacg ctggggtaca gcaccacggc 3600
ctgagctata actgctccct tccgctggcg tttgacgggt cttgctctgg catccagcac 3660
ttctccgcga tgctccgaga tgaggtaggt ggtcgcgcgg ttaacttgct tcctagtgaa 3720
accgttcagg acatctacgg gattgttgct aagaaagtca acgagattct acaagcagac 3780
gcaatcaatg ggaccgataa cgaagtagtt accgtgaccg atgagaacac tggtgaaatc 3840
tctgagaaag tcaagctggg cactaaggca ctggctggtc aatggctggc ttacggtgtt 3900
actcgcagtg tgactaagcg ttcagtcatg acgctggctt acgggtccaa agagttcggc 3960
ttccgtcaac aagtgctgga agataccatt cagccagcta ttgattccgg caagggtctg 4020
atgttcactc agccgaatca ggctgctgga tacatggcta agctgatttg ggaatctgtg 4080
agcgtgacgg tggtagctgc ggttgaagca atgaactggc ttaagtctgc tgctaagctg 4140
ctggctgctg aggtcaaaga taagaagact ggagagattc ttcgcaagcg ttgcgctgtg 4200
cattgggtaa ctcctgatgg tttccctgtg tggcaggaat acaagaagcc tattcagacg 4260
cgcttgaacc tgatgttcct cggtcagttc cgcttacagc ctaccattaa caccaacaaa 4320
gatagcgaga ttgatgcaca caaacaggag tctggtatcg ctcctaactt tgtacacagc 4380
caagacggta gccaccttcg taagactgta gtgtgggcac acgagaagta cggaatcgaa 4440
tcttttgcac tgattcacga ctccttcggt accattccgg ctgacgctgc gaacctgttc 4500
aaagcagtgc gcgaaactat ggttgacaca tatgagtctt gtgatgtact ggctgatttc 4560
tacgaccagt tcgctgacca gttgcacgag tctcaattgg acaaaatgcc agcacttccg 4620
gctaaaggta acttgaacct ccgtgacatc ttagagtcgg acttcgcgtt cgcgtaacgc 4680
caaatcaata cgactccgga tccccttcga aggaaagacc tgatgctttt cgtgcgcgca 4740
taaaatacct tgatactgtg ccggatgaaa gcggttcgcg acgagtagat gcaattatgg 4800
tttctccgcc aagaatctct ttgcatttat caagtgtttc cttcattgat attccgagag 4860
catcaatatg caatgctgtt gggatggcaa tttttacgcc tgttttgctt tgctcgacat 4920
aaagatatcc atctacgata tcagaccact tcatttcgca taaatcacca actcgttgcc 4980
cggtaacaac agccagttcc attgcaagtc tgagccaaca tggtgatgat tctgctgctt 5040
gataaatttt caggtattcg tcagccgtaa gtcttgatct ccttacctct gattttgctg 5100
cgcgagtggc agcgacatgg tttgttgtta tatggccttc agctattgcc tctcggaatg 5160
catcgctcag tgttgatctg attaacttgg ctgacgccgc cttgccctcg tctatgtatc 5220
cattgagcat tgccgcaatt tcttttgtgg tgatgtcttc aagtggagca tcaggcagac 5280
ccctccttat tgctttaatt ttgctcatgt aatttatgag tgtcttctgc ttgattcctc 5340
tgctggccag gattttttcg tagcgatcaa gccatgaatg taacgtaacg gaattatcac 5400
tgttgattct cgctgtcaga ggcttgtgtt tgtgtcctga aaataactca atgttggcct 5460
gtatagcttc agtgattgcg attcgcctgt ctctgcctaa tccaaactct ttacccgtcc 5520
ttgggtccct gtagcagtaa tatccattgt ttcttatata aaggttaggg ggtaaatccc 5580
ggcgctcatg acttcgcctt cttcacactg gagggcaaag aagatttcca ataatcagaa 5640
caagtcggct cctgtttagt tacgagcgac attgctccgt gtattcactc gttggaatga 5700
atacacagtg cagtgtttat tctgttattt atgccaaaaa taaaggccac tatcaggcag 5760
ctttgttgtt ctgtttacca agttctctgg caatcattgc cgtcgttcgt attgcccatt 5820
tatcgacata tttcccatct tccattacag gaaacatttc ttcaggctta accatgcatt 5880
ccgattgcag cttgcatcca ttgcatcgct tgaattgtcc acaccattga tttttatcaa 5940
tagtcgtagt catacggata gtcctggtat tgttccatca catcctgagg atgctcttcg 6000
aactcttcaa attcttcttc catatatcac ctcaaataag tggtttgctg cctaatttaa 6060
ttttctggcg accaacacaa gtcacaccca tttcactgcg tggcttgctg tagtaaatac 6120
ggttctgttt acgctcgact tcttctgcct tcttgcagcg aaggcttccg agtgatgctg 6180
ctttatctgc tctgacgcaa ccagagagct ttagcgcaat ttttcgcgcc agtgcttcat 6240
tactgcgtcg ctcggcaata agttctgctc tgcgagcttt gtagcggctt tttgccgtac 6300
ctttggattc tttccagaca atggttacca tgatggtctc ctttaagtgg ctttggcgca 6360
tgacgcgtcg aggtgcttat cttctcgatc gctgtcttgt agctgcaatt cgcgccatcc 6420
ccaaaaccac tcaagttctg gtctcaacgg ttaggttgag agtccgtcga tgttaaagag 6480
cctgccaatc tgttccgttt ggcttccagc gtcctgctga tggcttaaat ttaagacttc 6540
ttaatttatt ggtcaagtgc atttttgaag aaaacttaat tttatgggcg tgaatttagt 6600
ttgtctttga tttttaacgg gaaataaaaa aggggcgaaa gccccttaag gaaggtttgc 6660
tagcttggca tcaacgacaa cgccaatgat tttacagttc ccattgattt caatcattgg 6720
gtattgtgga ttgagtggtt tcaggaattt tctaccggca tcaataacta actttttgaa 6780
tgtcgcctcg ttttctcctt caagtttggc gactaccagc tttccattac gtggttcgac 6840
ttctgggtcg acgagaataa tcatcccctc aggaatactc agtcctgccg gggcagtcat 6900
tgaatcgcct ttaacgtcga gccaaaaaga gtcttcagaa caatctaccg ttgtgtcgta 6960
ccagttatct attgcacgcc tatgatatgg ctctacagct tccatccaac atcctgcgct 7020
tacccaacta attagaggat acgaacctct tggatcatgc ctgctgtgat aggcaatgtt 7080
tgaaagacta tcctctcctt tcaacaggta atcaggggag cactgcaaag ccttggctaa 7140
ggccaatagg ttttcgccat tgggctcagt ttcagatcgc tcccattggg aaatagcaac 7200
attagacacg ccaaccatct tgccaagggc agcctgccta atcttgagtt cttttctgcg 7260
agcgcgaata cgctcaccca tcagttgtgt attcatagtt aagacatctt aaataaactt 7320
gacttaagat tcctttggtg gataatttaa gtgttcttta atttcggagc gagtctatgt 7380
acaaaaaaga tgttattgac cacttcggaa cccagcgtgc tgttgctaaa gcactaggca 7440
ttagcgatgc agcagtctct cagtggaaag aagttatccc agagaaagac gcctatcgat 7500
tggaaatcgt tacagctggc gccctgaagt atcaagaaag tgcttaccgc caagcggcat 7560
aagcaaattg ctctttaaca gttctggcct ttcacctcta accgggtgag caaacatcag 7620
cggcaaatcc attgggtgtg ccgctataac tcaatatcaa tataggtaaa ttaacaaatg 7680
gcacaagcaa gctacagcaa gccaacacag cgagaaattg atcgcgctga aactgattta 7740
ctcatcaacc tgtcaacgct tacccagcgc ggtctggcaa agatgattgg ctgtcatgaa 7800
tcgaagataa gcagaacgga ctggagattt attgcttcgg tcttgtgtgc tttcggaatg 7860
gcatcagaca tcagtccgat tagcagggct tttaagtatg cgcttgatgg actcacaaag 7920
aaaaaacgcc cggtgtgcaa gaccgagcgt tctgaacaaa tccagatgga gttctgaggt 7980
cattactgga tctatcaaca ggagtcatta tgacaaatac agcaaaaata ctcaacttcg 8040
gcagaggtaa ctttgccgga caggagcgta atgtggcaga tctcgatgat ggttacgcca 8100
gactatcaaa tatgctgctt gaggcttatt cgggcgcaga tctgaccaag cgacagttta 8160
aagtgctgct tgccattctg cgtaaaacct atgggtggaa taaaccaatg gacagaatca 8220
ccgattctca acttagcgag attacaaagt tacctgtcaa acggtgcaat gaagccaagt 8280
tagaactcgt cagaatgaat attatcaagc agcaaggcgg catgtttgga ccaaataaaa 8340
acatctcaga atggtgtatc cctcaaaacg agggaaaatc ccctaaaacg agggataaaa 8400
catccctcaa attgggggat tgctatccct caaaacaggg ggacacaaaa gacactatta 8460
caaaagaaaa aagaaaagat tattcgtcag agaattctgg cgaatcctct gaccagccag 8520
aaaacgacct ttctgtggtg aaaccggatg ctgcaattca gagcggcagc aagtggggga 8580
cagcagaaga cctgaccgcc gcagagtgga tgtttgacat ggtgaagact atcgcaccat 8640
cagccagaaa accgaatttt gctgggtggg ctaacgatat ccgcctgatg cgtgaacgtg 8700
acggacgtaa ccaccgcgac atgtgtgtgc tgttccgctg ggcatgccag gacaacttct 8760
ggtccggtaa cgtgctgagc ccggccaaac tccgcgataa gtggacccaa ctcgaaatca 8820
accgtaacaa gcaacaggca ggcgtgacag ccagcaaacc aaaactcgac ctgacaaaca 8880
cagactggat ttacggggtg gatctatgaa aaacatcgcc gcacagatgg ttaactttga 8940
ccgtgagcag atgcgtcgga tcgccaacaa catgccggaa cagtacgacg aaaagccgca 9000
ggtacagcag gtagcgcaga tcatcaacgg tgtgttcagc cagttactgg caactttccc 9060
ggcgagcctg gctaaccgtg accagaacga agtgaacgaa atccgtcgcc agtgggttct 9120
ggcttttcgg gaaaacggga tcaccacgat ggaacaggtt aacgcaggaa tgcgcgtagc 9180
ccgtcggcag aatcgaccat ttctgccatc acccgggcag tttgttgcat ggtgccggga 9240
agaagcatcc gttaccgccg gactgccaaa cgtcagcgag ctggttgata tggtttacga 9300
gtattgccgg aagcgaggcc tgtatccgga tgcggagtct tatccgtgga aatcaaacgc 9360
gcactactgg ctggttacca acctgtatca gaacatgcgg gccaatgcgc ttactgatgc 9420
ggaattacgc cgtaaggccg cagatgagct tgtccatatg actgcgagaa ttaaccgtgg 9480
tgaggcgatc cctgaaccag taaaacaact tcctgtcatg ggcggtagac ctctaaatcg 9540
tgcacaggct ctggcgaaga tcgcagaaat caaagctaag ttcggactga aaggagcaag 9600
tgtatgacgg gcaaagaggc aattattcat tacctgggga cgcataatag cttctgtgcg 9660
ccggacgttg ccgcgctaac aggcgcaaca gtaaccagca taaatcaggc cgcggctaaa 9720
atggcacggg caggtcttct ggttatcgaa ggtaaggtct ggcgaacggt gtattaccgg 9780
tttgctacca gggaagaacg ggaaggaaag atgagcacga acctgatgaa caaactggat 9840
acgattggat tcgacaacaa aaaagacctg cttatctcgg tgggcgattt ggttgatcgt 9900
ggtgcagaga acgttgaatg cctggaatta atcacattcc cctggttcag agctgtacgt 9960
ggaaaccatg agcaaatgat gattgatggc ttatcagagc gtggaaacgt taatcactgg 10020
ctgcttaatg gcggtggctg gttctttaat ctcgattacg acaaagaaat tctggctaaa 10080
gctcttgccc ataaagcaga tgaacttccg ttaatcatcg aactggtgag caaagataaa 10140
aaatatgtta tctgccacgc cgattatccc tttgacgaat acgagtttgg aaagccagtt 10200
gatcatcagc aggtaatctg gaaccgcgaa cgaatcagca actcacaaaa cgggatcgtg 10260
aaagaaatca aaggcgcgga cacgttcatc tttggtcata cgccagcagt gaaaccactc 10320
aagtttgcca accaaatgta tatcgatacc ggcgcagtgt tctgcggaaa cctaacattg 10380
attcaggtac agggagaagg cgcatgagac tcgaaagcgt agctaaattt cattcgccaa 10440
aaagcccgat gatgagcgac tcaccacggg ccacggcttc tgactctctt tccggtactg 10500
atgtgatggc tgctatgggg atggcgcaat cacaagccgg attcggtatg gctgcattct 10560
gcggtaagca cgaactcagc cagaacgaca aacaaaaggc tatcaactat ctgatgcaat 10620
ttgcacacaa ggtatcgggg aaataccgtg gtgtggcata tcttgaagga aatactaagg 10680
caaaggtact gcaagtgctc gcaacattcg cttatgcgga ttattgccgt agtgccgcga 10740
cgccgggggc aagatgcaga gattgccatg gtacaggccg tgcggttgat attgccaaaa 10800
cagagctgtg ggggagagtt gtcgagaaag agtgcggaag atgcaaaggc gtcggctatt 10860
caaggatgcc agcaagcgca gcatatcgcg ctgtgacgat gctaatccca aaccttaccc 10920
aacccacctg gtcacgcact gttaagccgc tgtatgacgc tctggtggtg caatgccaca 10980
aagaagagtc aatcgcagac aacattttga atgcggtcac acgttagcag catgattgcc 11040
acggatggca acatattaac ggcatgatat tgacttattg aataaaattg ggtaaatttg 11100
actcaacgat gggttaattc gctcgttgtg gtagtgagat gaaaagaggc ggcgcttact 11160
accgattccg cctagttggt cacttcgacg tatcgtctgg aactccaacc atcgcaggca 11220
gagaggtctg caaaatgcaa tcccgaaaca gttcgcaggt aatagttaga gcctgcataa 11280
cggtttcggg attttttata tctgcacaac aggtaagagc attgagtcga taatcgtgaa 11340
gagtcggcga gcctggttag ccagtgctct ttccgttgtg ctgaattaag cgaataccgg 11400
aagcagaacc ggatcaccaa atgcgtacag gcgtcatcgc cgcccagcaa cagcacaacc 11460
caaactgagc cgtagccact gtctgtcctg aattccatgc ttgaacccgc ctatgcgcgg 11520
gttttctttt gtgcgcttgc aggccagctt gggatcagca gcctgacgga tgcggtgtcc 11580
ggcgacagcc tgactgccca ggaggcactc gcgacgctgg cattatccgg tgatgatgac 11640
ggaccacgac aggcccgcag ttatcaggtc atgaacggca tcgccgtgct gccggtgtcc 11700
ggcacgctgg tcagccggac gcgggcgctg cagccgtact cggggatgac cggttacaac 11760
ggcattatcg cccgtctgca acaggctgcc agcgatccga tggtggacgg cattctgctc 11820
gatatggaca cgcccggcgg gatggtggcg ggggcatttg actgcgctga catcatcgcc 11880
cgtgtgcgtg acataaaacc ggtatgggcg cttgccaacg acatgaactg cagtgcaggt 11940
cagttgcttg ccagtgccgc ctcccggcgt ctggtcacgc agaccgcccg gacaggctcc 12000
atcggcgtca tgatggctca cagtaattac ggtgctgcgc tggagaaaca gggtgtggaa 12060
atcacgctga tttacagcgg cagccataag gtggatggca acccctacag ccatcttccg 12120
gatgacgtcc gggagacact gcagtcccgg atggacgcaa cccgccagat gtttgcgcag 12180
aaggtgtcgg catataccgg cctgtccgtg caggttgtgc tggataccga ggctgcagtg 12240
tacagcggtc aggaggccat tgatgccgga ctggctgatg aacttgttaa cagcaccgat 12300
gcgatcaccg tcatgcgtga tgcactggat gcacgtaaat cccgtctctc aggagggcga 12360
atgaccaaag agactcaatc aacaactgtt tcagccactg cttcgcaggc tgacgttact 12420
gacgtggtgc cagcgacgga gggcgagaac gccagcgcgg cgcagccgga cgtgaacgcg 12480
cagatcaccg cagcggttgc ggcagaaaac agccgcatta tggggatact caactgtgag 12540
gaggctcacg gacgcgaaga acaggcacgc gtgctggcag aaacccccgg tatgaccgtg 12600
aaaacggccc gccgcattct ggccgcagca ccacagagtg cacaggcgcg cagtgacact 12660
gcgctggatc gtctgatgca gggggcaccg gcaccgctgg ctgcaggtaa cccggcatct 12720
gatgccgtta acgatttgct gaacacacca gtgtaaggga tgtttatgac gagcaaagaa 12780
acctttaccc attaccagcc gcagggcaac agtgacccgg ctcataccgc aaccgcgccc 12840
ggcggattga gtgcgaaagc gcctgcaatg accccgctga tgctggacac ctccagccgt 12900
aagctggttg cgtgggatgg caccaccgac ggtgctgccg ttggcattct tgcggttgct 12960
gctgaccaga ccagcaccac gctgacgttc tacaagtccg gcacgttccg ttatgaggat 13020
gtgctctggc cggaggctgc cagcgacgag acgaaaaaac ggaccgcgtt tgccggaacg 13080
gcaatcagca tcgtttaact ttacccttca tcactaaagg ccgcctgtgc ggcttttttt 13140
acgggatttt tttatgtcga tgtacacaac cgcccaactg ctggcggcaa atgagcagaa 13200
atttaagttt gatccgctgt ttctgcgtct ctttttccgt gagagctatc ccttcaccac 13260
ggagaaagtc tatctctcac aaattccggg actggtaaac atggcgctgt acgtttcgcc 13320
gattgtttcc ggtgaggtta tccgttcccg tggcggctcc acctctgaat ttacgccggg 13380
atatgtcaag ccgaagcatg aagtgaatcc gcagatgacc ctgcgtcgcc tgccggatga 13440
agatccgcag aatctggcgg acccggctta ccgccgccgt cgcatcatca tgcagaacat 13500
gcgtgacgaa gagctggcca ttgctcaggt cgaagagatg caggcagttt ctgccgtgct 13560
taagggcaaa tacaccatga ccggtgaagc cttcgatccg gttgaggtgg atatgggccg 13620
cagtgaggag aataacatca cgcagtccgg cggcacggag tggagcaagc gtgacaagtc 13680
cacgtatgac ccgaccgacg atatcgaagc ctacgcgctg aacgccagcg gtgtggtgaa 13740
tatcatcgtg ttcgatccga aaggctgggc gctgttccgt tccttcaaag ccgtcaagga 13800
gaagctggat acccgtcgtg gctctaattc cgagctggag acagcggtga aagacctggg 13860
caaagcggtg tcctataagg ggatgtatgg cgatgtggcc atcgtcgtgt attccggaca 13920
gtacgtggaa aacggcgtca aaaagaactt cctgccggac aacacgatgg tgctggggaa 13980
cactcaggca cgcggtctgc gcacctatgg ctgcattcag gatgcggacg cacagcgcga 14040
aggcattaac gcctctgccc gttacccgaa aaactgggtg accaccggcg atccggcgcg 14100
tgagttcacc atgattcagt cagcaccgct gatgctgctg gctgaccctg atgagttcgt 14160
gtccgtacaa ctggcgtaat catggccctt cggggccatt gtttctctgt ggaggagtcc 14220
atgacgaaag atgaactgat tgcccgtctc cgctcgctgg gtgaacaact gaaccgtgat 14280
gtcagcctga cggggacgaa agaagaactg gcgctccgtg tggcagagct gaaagaggag 14340
cttgatgaca cggatgaaac tgccggtcag gacacccctc tcagccggga aaatgtgctg 14400
accggacatg aaaatgaggt gggatcagcg cagccggata ccgtgattct ggatacgtct 14460
gaactggtca cggtcgtggc actggtgaag ctgcatactg atgcacttca cgccacgcgg 14520
gatgaacctg tggcatttgt gctgccggga acggcgtttc gtgtctctgc cggtgtggca 14580
gccgaaatga cagagcgcgg cctggccaga atgcaataac gggaggcgct gtggctgatt 14640
tcgataacct gttcgatgct gccattgccc gcgccgatga aacgatacgc gggtacatgg 14700
gaacgtcagc caccattaca tccggtgagc agtcaggtgc ggtgatacgt ggtgtttttg 14760
atgaccctga aaatatcagc tatgccggac agggcgtgcg cgttgaaggc tccagcccgt 14820
ccctgtttgt ccggactgat gaggtgcggc agctgcggcg tggagacacg ctgaccatcg 14880
gtgaggaaaa tttctgggta gatcgggttt cgccggatga tggcggaagt tgtcatctct 14940
ggcttggacg gggcgtaccg cctgccgtta accgtcgccg ctgaaagggg gatgtatggc 15000
cataaaaggt cttgagcagg ccgttgaaaa cctcagccgt atcagcaaaa cggcggtgcc 15060
tggtgccgcc gcaatggcca ttaaccgcgt tgcttcatcc gcgatatcgc agtcggcgtc 15120
acaggttgcc cgtgagacaa aggtacgccg gaaactggta aaggaaaggg ccaggctgaa 15180
aagggccacg gtcaaaaatc cgcaggccag aatcaaagtt aaccgggggg atttgcccgt 15240
aatcaagctg ggtaatgcgc gggttgtcct ttcgcgccgc aggcgtcgta aaaaggggca 15300
gcgttcatcc ctgaaaggtg gcggcagcgt gcttgtggtg ggtaaccgtc gtattcccgg 15360
cgcgtttatt cagcaactga aaaatggccg gtggcatgtc atgcagcgtg tggctgggaa 15420
aaaccgttac cccattgatg tggtgaaaat cccgatggcg gtgccgctga ccacggcgtt 15480
taaacaaaat attgagcgga tacggcgtga acgtcttccg aaagagctgg gctatgcgct 15540
gcagcatcaa ctgaggatgg taataaagcg atgaaacata ctgaactccg tgcagccgta 15600
ctggatgcac tggagaagca tgacaccggg gcgacgtttt ttgatggtcg ccccgctgtt 15660
tttgatgagg cggattttcc ggcagttgcc gtttatctca ccggcgctga atacacgggc 15720
gaagagctgg acagcgatac ctggcaggcg gagctgcata tcgaagtttt cctgcctgct 15780
caggtgccgg attcagagct ggatgcgtgg atggagtccc ggatttatcc ggtgatgagc 15840
gatatcccgg cactgtcaga tttgatcacc agtatggtgg ccagcggcta tgactaccgg 15900
cgcgacgatg atgcgggctt gtggagttca gccgatctga cttatgtcat tacctatgaa 15960
atgtgaggac gctatgcctg taccaaatcc tacaatgccg gtgaaaggtg ccgggaccac 16020
cctgtgggtt tataagggga gcggtgaccc ttacgcgaat ccgctttcag acgttgactg 16080
gtcgcgtctg gcaaaagtta aagacctgac gcccggcgaa ctgaccgctg agtcctatga 16140
cgacagctat ctcgatgatg aagatgcaga ctggactgcg accgggcagg ggcagaaatc 16200
tgccggagat accagcttca cgctggcgtg gatgcccgga gagcaggggc agcaggcgct 16260
gctggcgtgg tttaatgaag gcgatacccg tgcctataaa atccgcttcc cgaacggcac 16320
ggtcgatgtg ttccgtggct gggtcagcag tatcggtaag gcggtgacgg cgaaggaagt 16380
gatcacccgc acggtgaaag tcaccaatgt gggacgtccg tcgatggcag aagatcgcag 16440
cacggtaaca gcggcaaccg gcatgaccgt gacgcctgcc agcacctcgg tggtgaaagg 16500
gcagagcacc acgctgaccg tggccttcca gccggagggc gtaaccgaca agagctttcg 16560
tgcggtgtct gcggataaaa caaaagccac cgtgtcggtc agtggtatga ccatcaccgt 16620
gaacggcgtt gctgcaggca aggtcaacat tccggttgta tccggtaatg gtgagtttgc 16680
tgcggttgca gaaattaccg tcaccgccag ttaatccgga gagtcagcga tgttcctgaa 16740
aaccgaatca tttgaacata acggtgtgac cgtcacgctt tctgaactgt cagccctgca 16800
gcgcattgag catctcgccc tgatgaaacg gcaggcagaa caggcggagt cagacagcaa 16860
ccggaagttt actgtggaag acgccatcag aaccggcgcg tttctggtgg cgatgtccct 16920
gtggcataac catccgcaga agacgcagat gccgtccatg aatgaagccg ttaaacagat 16980
tgagcaggaa gtgcttacca cctggcccac ggaggcaatt tctcatgctg aaaacgtggt 17040
gtaccggctg tctggtatgt atgagtttgt ggtgaataat gcccctgaac agacagagga 17100
cgccgggccc gcagagcctg tttctgcggg aaagtgttcg acggtgagct gagttttgcc 17160
ctgaaactgg cgcgtgagat ggggcgaccc gactggcgtg ccatgcttgc cgggatgtca 17220
tccacggagt atgccgactg gcaccgcttt tacagtaccc attattttca tgatgttctg 17280
ctggatatgc acttttccgg gctgacgtac accgtgctca gcctgttttt cagcgatccg 17340
gatatgcatc cgctggattt cagtctgctg aaccggcgcg aggctgacga agagcctgaa 17400
gatgatgtgc tgatgcagaa agcggcaggg cttgccggag gtgtccgctt tggcccggac 17460
gggaatgaag ttatccccgc ttccccggat gtggcggaca tgacggagga tgacgtaatg 17520
ctgatgacag tatcagaagg gatcgcagga ggagtccggt atggctgaac cggtaggcga 17580
tctggtcgtt gatttgagtc tggatgcggc cagatttgac gagcagatgg ccagagtcag 17640
gcgtcatttt tctggtacgg aaagtgatgc gaaaaaaaca gcggcagtcg ttgaacagtc 17700
gctgagccga caggcgctgg ctgcacagaa agcggggatt tccgtcgggc agtataaagc 17760
cgccatgcgt atgctgcctg cacagttcac cgacgtggcc acgcagcttg caggcgggca 17820
aagtccgtgg ctgatcctgc tgcaacaggg ggggcaggtg aaggactcct tcggcgggat 17880
gatccccatg ttcagggggc ttgccggtgc gatcaccctg ccgatggtgg gggccacctc 17940
gctggcggtg gcgaccggtg cgctggcgta tgcctggtat cagggcaact caaccctgtc 18000
cgatttcaac aaaacgctgg tcctttccgg caatcaggcg ggactgacgg cagatcgtat 18060
gctggtcctg tccagagccg ggcaggcggc agggctgacg tttaaccaga ccagcgagtc 18120
actcagcgca ctggttaagg cgggggtaag cggtgaggct cagattgcgt ccatcagcca 18180
gagtgtggcg cgtttctcct ctgcatccgg cgtggaggtg gacaaggtcg ctgaagcctt 18240
cgggaagctg accacagacc cgacgtcggg gctgacggcg atggctcgcc agttccataa 18300
cgtgtcggcg gagcagattg cgtatgttgc tcagttgcag cgttccggcg atgaagccgg 18360
ggcattgcag gcggcgaacg aggccgcaac gaaagggttt gatgaccaga cccgccgcct 18420
gaaagagaac atgggcacgc tggagacctg ggcagacagg actgcgcggg cattcaaatc 18480
catgtgggat gcggtgctgg atattggtcg tcctgatacc gcgcaggaga tgctgattaa 18540
ggcagaggct gcgtataaga aagcagacga catctggaat ctgcgcaagg atgattattt 18600
tgttaacgat gaagcgcggg cgcgttactg ggatgatcgt gaaaaggccc gtcttgcgct 18660
tgaagccgcc cgaaagaagg ctgagcagca gactcaacag gacaaaaatg cgcagcagca 18720
gagcgatacc gaagcgtcac ggctgaaata taccgaagag gcgcagaagg cttacgaacg 18780
gctgcagacg ccgctggaga aatataccgc ccgtcaggaa gaactgaaca aggcactgaa 18840
agacgggaaa atcctgcagg cggattacaa cacgctgatg gcggcggcga aaaaggatta 18900
tgaagcgacg ctgaaaaagc cgaaacagtc cagcgtgaag gtgtctgcgg gcgatcgtca 18960
ggaagacagt gctcatgctg ccctgctgac gcttcaggca gaactccgga cgctggagaa 19020
gcatgccgga gcaaatgaga aaatcagcca gcagcgccgg gatttgtgga aggcggagag 19080
tcagttcgcg gtactggagg aggcggcgca acgtcgccag ctgtctgcac aggagaaatc 19140
cctgctggcg cataaagatg agacgctgga gtacaaacgc cagctggctg cacttggcga 19200
caaggttacg tatcaggagc gcctgaacgc gctggcgcag caggcggata aattcgcaca 19260
gcagcaacgg gcaaaacggg ccgccattga tgcgaaaagc cgggggctga ctgaccggca 19320
ggcagaacgg gaagccacgg aacagcgcct gaaggaacag tatggcgata atccgctggc 19380
gctgaataac gtcatgtcag agcagaaaaa gacctgggcg gctgaagacc agcttcgcgg 19440
gaactggatg gcaggcctga agtccggctg gagtgagtgg gaagagagcg ccacggacag 19500
tatgtcgcag gtaaaaagtg cagccacgca gacctttgat ggtattgcac agaatatggc 19560
ggcgatgctg accggcagtg agcagaactg gcgcagcttc acccgttccg tgctgtccat 19620
gatgacagaa attctgctta agcaggcaat ggtggggatt gtcgggagta tcggcagcgc 19680
cattggcggg gctgttggtg gcggcgcatc cgcgtcaggc ggtacagcca ttcaggccgc 19740
tgcggcgaaa ttccattttg caaccggagg atttacggga accggcggca aatatgagcc 19800
agcggggatt gttcaccgtg gtgagtttgt cttcacgaag gaggcaacca gccggattgg 19860
cgtggggaat ctttaccggc tgatgcgcgg ctatgccacc ggcggttatg tcggtacacc 19920
gggcagcatg gcagacagcc ggtcgcaggc gtccgggacg tttgagcaga ataaccatgt 19980
ggtgattaac aacgacggca cgaacgggca gataggtccg gctgctctga aggcggtgta 20040
tgacatggcc cgcaagggtg cccgtgatga aattcagaca cagatgcgtg atggtggcct 20100
gttctccgga ggtggacgat gaagaccttc cgctggaaag tgaaacccgg tatggatgtg 20160
gcttcggtcc cttctgtaag aaaggtgcgc tttggtgatg gctattctca gcgagcgcct 20220
gccgggctga atgccaacct gaaaacgtac agcgtgacgc tttctgtccc ccgtgaggag 20280
gccacggtac tggagtcgtt tctggaagag cacgggggct ggaaatcctt tctgtggacg 20340
ccgccttatg agtggcggca gataaaggtg acctgcgcaa aatggtcgtc gcgggtcagt 20400
atgctgcgtg ttgagttcag cgcagagttt gaacaggtgg tgaactgatg caggatatcc 20460
ggcaggaaac actgaatgaa tgcacccgtg cggagcagtc ggccagcgtg gtgctctggg 20520
aaatcgacct gacagaggtc ggtggagaac gttatttttt ctgtaatgag cagaacgaaa 20580
aaggtgagcc ggtcacctgg caggggcgac agtatcagcc gtatcccatt caggggagcg 20640
gttttgaact gaatggcaaa ggcaccagta cgcgccccac gctgacggtt tctaacctgt 20700
acggtatggt caccgggatg gcggaagata tgcagagtct ggtcggcgga acggtggtcc 20760
ggcgtaaggt ttacgcccgt tttctggatg cggtgaactt cgtcaacgga aacagttacg 20820
ccgatccgga gcaggaggtg atcagccgct ggcgcattga gcagtgcagc gaactgagcg 20880
cggtgagtgc ctcctttgta ctgtccacgc cgacggaaac ggatggcgct gtttttccgg 20940
gacgtatcat gctggccaac acctgcacct ggacctatcg cggtgacgag tgcggttata 21000
gcggtccggc tgtcgcggat gaatatgacc agccaacgtc cgatatcacg aaggataaat 21060
gcagcaaatg cctgagcggt tgtaagttcc gcaataacgt cggcaacttt ggcggcttcc 21120
tttccattaa caaactttcg cagtaaatcc catgacacag acagaatcag cgattctggc 21180
gcacgcccgg cgatgtgcgc cagcggagtc gtgcggcttc gtggtaagca cgccggaggg 21240
ggaaagatat ttcccctgcg tgaatatctc cggtgagccg gaggcgtatt tccgtatgtc 21300
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 21360
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 21420
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 21480
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 21540
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 21600
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 21660
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 21720
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 21780
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 21840
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 21900
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 21960
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 22020
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 22080
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 22140
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 22200
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 22260
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 22320
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 22380
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 22440
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 22500
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 22560
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 22620
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 22680
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 22740
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 22800
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 22860
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 22920
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 22980
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 23040
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 23100
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 23160
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 23220
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 23280
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 23340
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 23400
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 23460
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 23520
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 23580
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 23640
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 23700
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 23760
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 23820
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 23880
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 23940
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 24000
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 24060
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 24120
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 24180
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 24240
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 24300
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 24360
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 24420
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 24480
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 24540
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 24600
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 24660
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 24720
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 24780
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 24840
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 24900
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 24960
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 25020
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 25080
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 25140
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 25200
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 25260
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 25320
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 25380
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 25440
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 25500
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 25560
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 25620
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 25680
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 25740
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 25800
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 25860
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 25920
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 25980
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 26040
tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 26100
gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 26160
cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 26220
cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 26280
gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 26340
tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 26400
taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 26460
aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 26520
cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 26580
cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 26640
gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 26700
acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 26760
ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 26820
tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 26880
acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 26940
gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 27000
aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 27060
ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 27120
cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 27180
ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 27240
agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 27300
ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 27360
aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 27420
cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 27480
ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 27540
gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 27600
cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 27660
aagcggcggc aatacgtgca gaaaattcgg caaaacgtgc agaagatata gcttcagctg 27720
tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 27780
acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 27840
cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 27900
gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 27960
agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 28020
cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 28080
gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 28140
tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 28200
aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt ctaagcggag 28260
atcgcctagt gattttaaac tattgctggc agcattcttg agtccaatat aaaagtattg 28320
tgtacctttt gctgggtcag gttgttcttt aggaggagta aaaggatcaa atgcactaaa 28380
cgaaactgaa acaagcgatc gaaaatatcc ctttgggatt cttgactcga taagtctatt 28440
attttcagag aaaaaatatt cattgttttc tgggttggtg attgcaccaa tcattccatt 28500
caaaattgtt gttttaccac acccattccg cccgataaaa gcatgaatgt tcgtgctggg 28560
catagaatta accgtcacct caaaaggtat agttaaatca ctgaatccgg gagcactttt 28620
tctattaaat gaaaagtgga aatctgacaa ttctggcaaa ccatttaaca cacgtgcgaa 28680
ctgtccatga atttctgaaa gagttacccc tctaagtaat gaggtgttaa ggacgctttc 28740
attttcaatg tcggctaatc gatttggcca tactactaaa tcctgaatag ctttaagaag 28800
gttatgttta aaaccatcgc ttaatttgct gagattaaca tagtagtcaa tgctttcacc 28860
taaggaaaaa aacatttcag ggagttgact gaatttttta tctattaatg aataagtgct 28920
tacttcttct ttttgaccta caaaaccaat tttaacattt ccgatatcgc atttttcacc 28980
atgctcatca aagacagtaa gataaaacat tgtaacaaag gaatagtcat tccaaccatc 29040
tgctcgtagg aatgccttat ttttttctac tgcaggaata tacccgcctc tttcaataac 29100
actaaactcc aacatatagt aacccttaat tttattaaaa taaccgcaat ttatttggcg 29160
gcaacacagg atctctcttt taagttactc tctattacat acgttttcca tctaaaaatt 29220
agtagtattg aacttaacgg ggcatcgtat tgtagttttc catatttagc tttctgcttc 29280
cttttggata acccactgtt attcatgttg catggtgcac tgtttatacc aacgatatag 29340
tctattaatg catatatagt atcgccgaac gattagctct tcaggcttct gaagaagcgt 29400
ttcaagtact aataagccga tagatagcca cggacttcgt agccattttt cataagtgtt 29460
aacttccgct cctcgctcat aacagacatt cactacagtt atggcggaaa ggtatgcatg 29520
ctgggtgtgg ggaagtcgtg aaagaaaaga agtcagctgc gtcgtttgac atcactgcta 29580
tcttcttact ggttatgcag gtcgtagtgg gtggcacaca aagctttgca ctggattgcg 29640
aggctttgtg cttctctgga gtgcgacagg tttgatgaca aaaaattagc gcaagaagac 29700
aaaaatcacc ttgcgctaat gctctgttac aggtcactaa taccatctaa gtagttgatt 29760
catagtgact gcatatgttg tgttttacag tattatgtag tctgtttttt atgcaaaatc 29820
taatttaata tattgatatt tatatcattt tacgtttctc gttca 29865
<210> 15
<211> 2628
<212> DNA
<213> 大腸桿菌
<220>
<223> gyra基因
<400> 15
atgagcgacc ttgcgagaga aattacaccg gtcaacattg aggaagagct gaagagctcc 60
tatctggatt atgcgatgtc ggtcattgtt ggccgtgcgc tgccagatgt ccgagatggc 120
ctgaagccgg tacaccgtcg cgtactttac gccatgaacg tactaggcaa tgactggaac 180
aaagcctata aaaaatctgc ccgtgtcgtt ggtgacgtaa tcggtaaata ccatccccat 240
ggtgactcgg cggtctatga cacgatcgtc cgcatggcgc agccattctc gctgcgttat 300
atgctggtag acggtcaggg taacttcggt tctatcgacg gcgactctgc ggcggcaatg 360
cgttatacgg aaatccgtct ggcgaaaatt gcccatgaac tgatggccga tctcgaaaaa 420
gagacggtcg atttcgttga taactatgac ggcacggaaa aaattccgga cgtcatgcca 480
accaaaattc ctaacctgct ggtgaacggt tcttccggta tcgccgtagg tatggcaacc 540
aacatcccgc cgcacaacct gacggaagtc atcaacggtt gtctggcgta tattgatgat 600
gaagacatca gcattgaagg gctgatggaa cacatcccgg ggccggactt cccgacggcg 660
gcaatcatta acggtcgtcg cggtattgaa gaagcttacc gtaccggtcg cggcaaggtg 720
tatatccgcg ctcgcgcaga agtggaagtt gacgccaaaa ccggtcgtga aaccattatc 780
gtccacgaaa ttccgtatca ggtaaacaaa gcgcgcctga tcgagaagat tgcggaactg 840
gtaaaagaaa aacgcgtgga aggcatcagc gcgctgcgtg acgagtctga caaagacggt 900
atgcgcatcg tgattgaagt gaaacgcgat gcggtcggtg aagttgtgct caacaacctc 960
tactcccaga cccagttgca ggtttctttc ggtatcaaca tggtggcatt gcaccatggt 1020
cagccgaaga tcatgaacct gaaagacatc atcgcggcgt ttgttcgtca ccgccgtgaa 1080
gtggtgaccc gtcgtactat tttcgaactg cgtaaagctc gcgatcgtgc tcatatcctt 1140
gaagcattag ccgtggcgct ggcgaacatc gacccgatca tcgaactgat ccgtcatgcg 1200
ccgacgcctg cagaagcgaa aactgcgctg gttgctaatc cgtggcagct gggcaacgtt 1260
gccgcgatgc tcgaacgtgc tggcgacgat gctgcgcgtc cggaatggct ggagccagag 1320
ttcggcgtgc gtgatggtct gtactacctg accgaacagc aagctcaggc gattctggat 1380
ctgcgtttgc agaaactgac cggtcttgag cacgaaaaac tgctcgacga atacaaagag 1440
ctgctggatc agatcgcgga actgttgcgt attcttggta gcgccgatcg tctgatggaa 1500
gtgatccgtg aagagctgga gctggttcgt gaacagttcg gtgacaaacg tcgtactgaa 1560
atcaccgcca acagcgcaga catcaacctg gaagatctga tcacccagga agatgtggtc 1620
gtgacgctct ctcaccaggg ctacgttaag tatcagccgc tttctgaata cgaagcgcag 1680
cgtcgtggcg ggaaaggtaa atctgccgca cgtattaaag aagaagactt tatcgaccga 1740
ctgctggtgg cgaacactca cgaccatatt ctgtgcttct ccagccgtgg tcgcgtctat 1800
tcgatgaaag tttatcagtt gccggaagcc actcgtggcg cgcgcggtcg tccgatcgtc 1860
aacctgctgc cgctggagca ggacgaacgt atcactgcga tcctgccagt gaccgagttt 1920
gaagaaggcg tgaaagtctt catggcgacc gctaacggta ccgtgaagaa aactgtcctc 1980
accgagttca accgtctgcg taccgccggt aaagtggcga tcaaactggt tgacggcgat 2040
gagctgatcg gcgttgacct gaccagcggc gaagacgaag taatgctgtt ctccgctgaa 2100
ggtaaagtgg tgcgctttaa agagtcttct gtccgtgcga tgggctgcaa caccaccggt 2160
gttcgcggta ttcgcttagg tgaaggcgat aaagtcgtct ctctgatcgt gcctcgtggc 2220
gatggcgcaa tcctcaccgc aacgcaaaac ggttacggta aacgtaccgc agtggcggaa 2280
tacccaacca agtcgcgtgc gacgaaaggg gttatctcca tcaaggttac cgaacgtaac 2340
ggtttagttg ttggcgcggt acaggtagat gactgcgacc agatcatgat gatcaccgat 2400
gccggtacgc tggtacgtac tcgcgtttcg gaaatcagca tcgtgggccg taacacccag 2460
ggcgtgatcc tcatccgtac tgcggaagat gaaaacgtag tgggtctgca acgtgttgct 2520
gaaccggttg acgaggaaga tctggatacc atcgacggca gtgccgcgga aggggacgat 2580
gaaatcgctc cggaagtgga cgttgacgac gagccagaag aagaataa 2628
<210> 16
<211> 768
<212> DNA
<213> 人工序列
<220>
<223> 插入序列
<400> 16
ggtaatgact ccaacttatt gatagtgttt tatgttcaga taatgcccga tgactttgtc 60
atgcagctcc accgattttg agaacgacag cgacttccgt cccagccgtg ccaggtgctg 120
cctcagattc aggttatgcc gctcaattcg ctgcgtatat cgcttgctga ttacgtgcag 180
ctttcccttc aggcgggatt catacagcgg ccagccatcc gtcatccata tcaccacgtc 240
aaagggtgac agcaggctca taagacgccc cagcgtcgcc atagtgcgtt caccgaatac 300
gtgcgcaaca accgtcttcc ggagactgtc atacgcgtaa aacagccagc gctggcgcga 360
tttagccccg acatagcccc actgttcgtc catttccgcg cagacgatga cgtcactgcc 420
cggctgtatg cgcgaggtta ccgactgcgg cctgagtttt ttaagtgacg taaaatcgtg 480
ttgaggccaa cgcccataat gcgggctgtt gcccggcatc caacgccatt catggccata 540
tcaatgattt tctggtgcgt accgggttga gaagcggtgt aagtgaactg cagttgccat 600
gttttacggc agtgagagca gagatagcgc tgatgtccgg cggtgctttt gccgttacgc 660
accaccccgt cagtagctga acaggaggga cagctgatag aaacagaagc cactggagca 720
cctcaaaaac accatcatac actaaatcag taagttggca gcatcacc 768
<210> 17
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> OmpA信號(hào)肽
<400> 17
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala
20
<210> 18
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> DsbA信號(hào)肽
<400> 18
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala Ala
20
<210> 19
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PhoA信號(hào)肽
<400> 19
Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr
1 5 10 15
Pro Val Thr Lys Ala
20