用于生產(chǎn)蛋白質(zhì)的經(jīng)改進(jìn)的宿主細(xì)胞的制作方法

文檔序號(hào)：12070519閱讀：847來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>有機(jī)化合物處理,合成應(yīng)用技術(shù)

用于生產(chǎn)蛋白質(zhì)的經(jīng)改進(jìn)的宿主細(xì)胞的制作方法與工藝

本發(fā)明涉及用于重組蛋白生產(chǎn)的異源系統(tǒng)。特別地，本發(fā)明涉及在基于經(jīng)改進(jìn)的毒物-解毒劑系統(tǒng)生產(chǎn)蛋白質(zhì)的方法中使用的宿主細(xì)胞。

背景技術(shù)：

現(xiàn)今，微生物廣泛地用于蛋白質(zhì)或DNA生產(chǎn)。通常來說，這些過程需要使用細(xì)菌質(zhì)粒作為載體攜帶所需表達(dá)基因。然而，質(zhì)粒在微生物內(nèi)的維持受到限制，并且因此質(zhì)粒不穩(wěn)定性代表重組蛋白生產(chǎn)或DNA生產(chǎn)方面的顯著問題。

已證明攜帶質(zhì)粒細(xì)胞的生長速率相對(duì)于無質(zhì)粒細(xì)胞顯著降低。一種理論是質(zhì)粒復(fù)制和轉(zhuǎn)錄以及蛋白質(zhì)生產(chǎn)代表對(duì)細(xì)胞代謝的顯著負(fù)擔(dān)。因此，在發(fā)酵過程中，丟失質(zhì)粒的細(xì)胞展現(xiàn)出比仍攜帶該質(zhì)粒的細(xì)胞更高的適合度，并且前者迅速在細(xì)菌群中戰(zhàn)勝后者。

為了限制細(xì)胞群中的質(zhì)粒丟失并且為了避免無質(zhì)粒細(xì)胞存活下來且在培養(yǎng)物中占主要優(yōu)勢，在質(zhì)粒中插入選擇標(biāo)記。

發(fā)酵操作中最常用的選擇標(biāo)記是抗生素抗性基因。然而，從醫(yī)療或調(diào)節(jié)方面考慮，抗生素(或編碼抗生素抗性的基因)污染產(chǎn)物或生物質(zhì)是不能接受的。此外，抗生素抗性基因可在環(huán)境中增殖或者轉(zhuǎn)移至致病性菌株。再者，最近的研究表明在生產(chǎn)重組蛋白中使用抗生素抗性基因強(qiáng)烈降低蛋白質(zhì)生產(chǎn)的產(chǎn)率(Peubez等,Microbial Cell factories,2010,9:65)

因此，需要允許質(zhì)粒維持，并且沒有抗生素抗性基因的缺點(diǎn)的其他系統(tǒng)。

使用抗生素抗性基因的一個(gè)替代方案是通過插入到質(zhì)粒中的野生型等位基因來互補(bǔ)必需的突變?nèi)旧w基因。例如，開發(fā)了這樣的系統(tǒng)，其中突變宿主在沒有攜帶提供該功能的基因的質(zhì)粒下不能夠合成必需氨基酸。然而，該方法強(qiáng)烈限制了生長培養(yǎng)基的可能選擇。

開發(fā)的另一策略是這樣的系統(tǒng)，其中質(zhì)粒介導(dǎo)的阻遏物滴定戰(zhàn)勝置于lac操縱子控制之下的必需染色體基因的阻遏。然而，該方法具有以下限制：(i)其使Lac啟動(dòng)子不能用于其他目的，例如蛋白質(zhì)表達(dá)；(ii)該系統(tǒng)局限于大腸桿菌(E.coli)或其他Lac啟動(dòng)子具有功能性的細(xì)菌；以及(iii)必須避免含有乳糖的培養(yǎng)基。

使用抗生素抗性基因的另一替代系統(tǒng)基于毒物蛋白(即，對(duì)宿主細(xì)胞具有毒性的分子)與其解毒劑組合的對(duì)。例如，毒物基因可由宿主細(xì)胞從染色體拷貝表達(dá)，而解毒劑由質(zhì)粒攜帶。因此，宿主細(xì)胞的存活需要該質(zhì)粒的存在。毒物/解毒劑對(duì)的一個(gè)實(shí)例是ccdA(解毒劑)/ccdB(毒物)系統(tǒng)。CcdA和CcdB是由大腸桿菌F質(zhì)粒編碼的解毒劑和毒物蛋白。在一起時(shí)，他們確保未接受F拷貝的子細(xì)胞死亡。ccdB蛋白的表達(dá)干擾DNA促旋酶的重新連接步驟，導(dǎo)致宿主細(xì)胞染色體被切成片段。解毒劑/毒物對(duì)的另一些實(shí)例包括但不限于Kis/Kid蛋白、Phd/Doc蛋白、RelB/relE蛋白PasB(或PasC)/PasA蛋白、mazF/maze蛋白。

該解毒劑/毒物系統(tǒng)已廣泛地用于克隆方法中，如例如美國專利US8,470,580中所述的：將包含編碼毒物的基因的宿主細(xì)胞與包含編碼相應(yīng)解毒劑的基因的質(zhì)粒組合使用。因此，該系統(tǒng)允許直接選擇整合有目的基因的細(xì)胞，因?yàn)閮H表達(dá)解毒劑基因的細(xì)胞存活下來。

該系統(tǒng)還用于蛋白質(zhì)生產(chǎn)，如發(fā)明人之前所述的(Szpirer和Milinkovitch,BioTechniques,2005,38(5):775-781)。出乎意料的是，觀察到重組蛋白的生產(chǎn)水平增加3至5倍，表明該系統(tǒng)具有用于生產(chǎn)重組蛋白的巨大潛力。

然而，發(fā)明人觀察到，當(dāng)將該系統(tǒng)用于生產(chǎn)毒性蛋白時(shí)，可出現(xiàn)一些缺點(diǎn)，例如，如目的基因突變、解毒劑/毒物系統(tǒng)突變，等等。期望開發(fā)經(jīng)改進(jìn)的質(zhì)粒穩(wěn)定系統(tǒng)，發(fā)明人對(duì)包含與一個(gè)拷貝毒物基因組合的一個(gè)拷貝解毒劑基因的典型系統(tǒng)進(jìn)行了改進(jìn)。令人吃驚且出乎意料的是，顯示在宿主細(xì)胞的基因組中插入額外拷貝的毒物基因提高質(zhì)粒的穩(wěn)定性，而且還提高蛋白質(zhì)生產(chǎn)的產(chǎn)率(以不相關(guān)方式)。

發(fā)明概述

因此，本發(fā)明涉及用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的宿主細(xì)胞，其中所述宿主細(xì)胞包含至少2個(gè)拷貝的編碼毒物蛋白的核酸序列。在一個(gè)實(shí)施方案中，所述至少2個(gè)拷貝在不同于編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列的復(fù)制子中。在一個(gè)實(shí)施方案中，所述毒物蛋白是由SEQ ID NO:1或與SEQ ID NO:1具有至少75％同一性的任意核酸序列編碼的CcdB。

在一個(gè)實(shí)施方案中，所述宿主細(xì)胞還包含至少1個(gè)拷貝的編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列。在一個(gè)實(shí)施方案中，所述解毒劑蛋白是由SEQ ID NO:13或與SEQ ID NO:13具有至少75％同一性的任意核酸序列編碼的CcdA。

在一個(gè)實(shí)施方案中，編碼解毒劑蛋白的核酸序列由質(zhì)粒攜帶，所述質(zhì)粒還包含插入有或能夠插入有編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的表達(dá)系統(tǒng)。在另一個(gè)實(shí)施方案中，所述表達(dá)系統(tǒng)包含選自包含T7啟動(dòng)子、Ptrc、Para和Plac的組的啟動(dòng)子。在另一個(gè)實(shí)施方案中，所述表達(dá)系統(tǒng)包含T7啟動(dòng)子，并且所述宿主細(xì)胞還包含優(yōu)選地插入在所述宿主的基因組中，更優(yōu)選地插入在T7表達(dá)系統(tǒng)中的T7RNA聚合酶基因。在另一個(gè)實(shí)施方案中，所述表達(dá)系統(tǒng)包含T7啟動(dòng)子，并且所述宿主細(xì)胞還包含插入在其基因組中的經(jīng)遺傳修飾的噬菌體，優(yōu)選地所述噬菌體限定為以下噬菌體，其中：

-插入T7表達(dá)系統(tǒng)，

-S、R和/或Q基因失活，并且

-Int和/或Xis基因失活。

在一個(gè)實(shí)施方案中，所述宿主細(xì)胞是細(xì)菌，優(yōu)選革蘭氏陰性細(xì)菌，更優(yōu)選腸桿菌科(Enterobacteriacea)，并且甚至更優(yōu)選大腸桿菌。

在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞還包含基因tonA、galK、araB、araA、lon、ompT、rcsA、hsdR、mrr、endA和recA中至少一個(gè)的失活。在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞還包含gyrA基因的至少一個(gè)額外拷貝。

本發(fā)明還涉及試劑盒，其包含如上文所述的宿主細(xì)胞和載體，所述載體包含至少一個(gè)拷貝的編碼解毒劑蛋白的核酸序列和至少一個(gè)拷貝的插入有或能夠插入有編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的表達(dá)系統(tǒng)。在一個(gè)實(shí)施方案中，編碼目的肽、多肽或蛋白質(zhì)的核酸序列在選自包括T7啟動(dòng)子、Ptrc、Para和Plac的組的啟動(dòng)子控制之下。

本發(fā)明的一個(gè)目的是用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的方法，其中所述方法包括培養(yǎng)上述宿主細(xì)胞并回收目的肽、多肽或蛋白質(zhì)。

在一個(gè)實(shí)施方案中，所述重組蛋白是分泌蛋白、跨膜蛋白或?qū)?xì)菌菌株具有毒性的蛋白質(zhì)。

定義

在本發(fā)明中，下述術(shù)語具有以下含義：

-本文中使用的“肽”指少于50個(gè)氨基酸通過肽鍵連接在一起的線性氨基酸聚合物；“多肽”指至少50個(gè)氨基酸通過肽鍵連接在一起的線性聚合物；蛋白質(zhì)特別地指由一個(gè)或更多個(gè)肽或多肽以及任選地非多肽輔因子形成的功能性實(shí)體。

-“重組肽、多肽或蛋白質(zhì)”指由重組DNA，即由人工插入在生產(chǎn)宿主細(xì)胞中的DNA產(chǎn)生的肽、多肽或蛋白質(zhì)。

-“毒物蛋白”指對(duì)生產(chǎn)該毒物蛋白的宿主細(xì)胞具有毒性的蛋白質(zhì)。

因此，本文中使用的毒物蛋白對(duì)本發(fā)明的宿主細(xì)胞具有毒性。

發(fā)明詳述

本發(fā)明涉及用于生產(chǎn)重組肽、多肽或蛋白質(zhì)的宿主細(xì)胞，其中所述宿主細(xì)胞包含至少兩個(gè)拷貝的編碼毒物蛋白的核酸序列。在一個(gè)實(shí)施方案中，所述宿主細(xì)胞包含2個(gè)拷貝的編碼毒物蛋白的核酸序列或者3、4、5或6個(gè)拷貝(或者更多拷貝)的該核酸序列。

毒物蛋白的實(shí)例包括但不限于CcdB、Kid、Doc、RelE、PasA、MazE或任何其他毒物分子，例如，如來源于或不來源于質(zhì)粒的細(xì)菌素。毒物蛋白還可以是天然或人工具有毒性并且影響(原核生物)細(xì)胞的一項(xiàng)或更多項(xiàng)重要功能的毒素蛋白。由基因sacB編碼的蛋白質(zhì)(來自于解淀粉芽孢桿菌(Bacillus amylolique-faciens))、蛋白GpE、蛋白GATA-1和蛋白Crp這樣的毒性分子的另一些實(shí)例?；騭acB編碼果聚糖蔗糖酶，其催化蔗糖水解成對(duì)大腸桿菌具有毒性的產(chǎn)物(Pierce等Proc.Natl.Acad.Sci.,第89卷,N[deg.]6(1992)第2056-2060頁)。蛋白GpE由來自噬菌體[phi]X174的E基因編碼，其包括六個(gè)獨(dú)特的限制性位點(diǎn)。GpE導(dǎo)致大腸桿菌細(xì)胞裂解((Heinrich等,Gene,第42(3)卷(1986)第345-349頁)。蛋白GATA-1已由Trudel等(Biotechniques 1996,第20(4)卷,第684-693頁)進(jìn)行了描述。蛋白Crp已由Schlieper等(Anal.Biochem.1998,第257(2)卷,第203-209頁)進(jìn)行了描述。

優(yōu)選地，本發(fā)明的宿主細(xì)胞包含編碼蛋白CcdB的核酸序列的至少兩個(gè)，優(yōu)選2個(gè)拷貝。在一個(gè)實(shí)施方案中，編碼蛋白CcdB的核酸序列是ccdB基因(序列SEQ ID NO:1)或者與SEQ ID NO:1具有至少75％，優(yōu)選至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的編碼功能性CcdB蛋白的任意序列。

在一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列不具有100％同一性(例如具有約30％，優(yōu)選約35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性)以避免2個(gè)拷貝之間發(fā)生重組事件。

在一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列來自于不同來源(例如來自至少2個(gè)細(xì)菌物種)或者第一個(gè)來源于質(zhì)粒并且第二個(gè)來源于染色體。例如，第一CcdB拷貝來自于大腸桿菌O157:H7并且第二CcdB拷貝可來自于F質(zhì)粒。

在一個(gè)實(shí)施方案中，至少兩個(gè)毒物蛋白是100％相同的，但是由不具有100％同一性的核酸序列編碼(即，核酸序列的不同之處在于非編碼差異，例如，如編碼給定氨基酸的密碼子替換成編碼相同氨基酸的另一密碼子)。

在一個(gè)實(shí)施方案中，至少兩個(gè)毒物蛋白不是100％相同的(例如具有約30％，優(yōu)選約35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性)，但是其作用可被相同解毒劑抵消。

在一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列不具有100％同一性，但是使用例如Guglielmini等(BMC Microbiology 2008,8:104)中所述的程序TAQ V1.0根據(jù)計(jì)算機(jī)(in silico)分析，二者均包含保守的推定結(jié)構(gòu)域。在一個(gè)實(shí)施方案中，第二拷貝的編碼毒物蛋白的核酸序列是與第一拷貝相關(guān)并且使用程序TAQ V1.0鑒定的推定毒物蛋白。在一個(gè)實(shí)施方案中，第一拷貝的編碼毒物蛋白的核酸序列是CcdB，并且第二拷貝選自使用Guglielmini等,2008的程序TAQ V1.0鑒定的22種CcdB計(jì)算機(jī)推導(dǎo)的毒素。

在本發(fā)明的一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在不同于編碼對(duì)應(yīng)解毒劑蛋白的核酸序列的復(fù)制子上，即在不包含編碼對(duì)應(yīng)解毒劑蛋白的核酸序列的復(fù)制子上。特別地，根據(jù)該實(shí)施方案，包含至少兩個(gè)拷貝的質(zhì)粒F(質(zhì)粒F包含復(fù)制子，所述復(fù)制子同時(shí)含有編碼毒物蛋白的核酸序列和編碼解毒劑蛋白的核酸序列)的宿主細(xì)胞不是本發(fā)明的一部分。

在一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在同一復(fù)制子上。在另一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在至少兩個(gè)不同的復(fù)制子上。

在一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列中的至少一個(gè)在質(zhì)粒上。在另一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在質(zhì)粒上。

在本發(fā)明的一個(gè)實(shí)施方案中，至少2個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列在染色體上，即，插入在宿主細(xì)胞的基因組中。

在本發(fā)明的一個(gè)實(shí)施方案中，當(dāng)將兩個(gè)拷貝的編碼毒物蛋白的核酸序列插入在宿主細(xì)胞的基因組中時(shí)，每個(gè)拷貝在宿主細(xì)胞中染色體上的相對(duì)側(cè)。優(yōu)選地，每個(gè)拷貝插入在宿主細(xì)胞的染色體的非編碼區(qū)域中或者插入在失活的基因中。

例如，將第一拷貝的編碼毒物蛋白的核酸序列插入在dcm基因中，將第二拷貝的編碼毒物蛋白的核酸序列插入在yjjK和slt基因之間(即，在大腸桿菌染色體的相對(duì)側(cè))的基因間非編碼間隔中。

術(shù)語“同一性”或“同一的”當(dāng)用于兩條或多條核酸序列或多肽的序列間關(guān)系時(shí)指核酸序列或多肽(分別)之間的序列相關(guān)性程度，如通過兩個(gè)或多個(gè)核酸殘基或氨基酸殘基(分別)串之間的匹配數(shù)目所確定的?！巴恍浴睖y量兩條或多條序列中較短者之間的相同匹配的百分比，其中缺口對(duì)比(如果有的話)通過特定的數(shù)學(xué)模型或計(jì)算機(jī)程序(即，“算法”)來解決。相關(guān)多肽的同一性可容易地通過已知方法來計(jì)算。這樣的方法包括但不限于以下中所述的那些：Computational Molecular Biology,Lesk,A.M.,編輯,Oxford University Press,New York,1988；Biocomputing:Informatics 5 and Genome Projects,Smith,D.W.,編輯,Academic Press,New York,1993；Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,和Griffin,H.G.,編輯,Humana Press,New Jersey,1994；Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987；Sequence Analysis Primer,Gribskov,M.和Devereux,J.,編輯,M.Stockton Press,New York,1991；以及Carillo等,SIAM J.Applied Math.48,1073(1988)。用于確定同一性的優(yōu)選方法設(shè)計(jì)成提供受試序列之間的最大匹配。確定同一性的方法在可公開獲得的計(jì)算機(jī)程序中進(jìn)行了描述。用于確定兩條序列間同一性的優(yōu)選計(jì)算機(jī)程序方法包括GCG程序包，其包括GAP(Devereux等,Nucl.Acid.Res.\2,387(1984)；Genetics Computer Group,University of Wisconsin,Madison,Wis.)、BLASTP、BLASTN和FASTA(Altschul等,J.MoI.Biol.215,403-410(1990))。BLASTX程序可從國家生物技術(shù)信息中心(National Center for Biotechnology Information，NCBI)及其他資源(BLAST Manual,Altschul等NCB/NLM/NIH Bethesda,Md.20894；Altschul等,同上)公開獲得。還可使用公知的Smith Waterman算法來確定同一性。

優(yōu)選地，編碼毒物蛋白的核酸序列在天然啟動(dòng)子控制之下。例如，可將編碼蛋白CcdB的核酸序列融合至ccd啟動(dòng)子下游。因此，在解毒劑存在下，ccd啟動(dòng)子受到強(qiáng)烈阻遏。

在一個(gè)實(shí)施方案中，所述宿主細(xì)胞是微生物，優(yōu)選原核生物，更優(yōu)選細(xì)菌，并且甚至更優(yōu)選革蘭氏陰性細(xì)菌。有利地，根據(jù)當(dāng)前可適用的分類學(xué)，所述宿主細(xì)胞是來自腸桿菌科家族的細(xì)菌。如果分類學(xué)改變，技術(shù)人員知曉如何使分類學(xué)中的變化適應(yīng)于推斷可用于本發(fā)明的菌株。來自腸桿菌科家族的細(xì)菌的實(shí)例包括但不限于術(shù)語以下屬的細(xì)菌：埃希氏菌屬(Escherichia)、腸桿菌屬(Enterobacter)、歐文氏菌屬(Erwinia)、克雷伯氏菌屬(Klebsiella)、泛菌屬(Pantoea)、光桿狀菌屬(Photorhabdus)、普羅威登斯菌屬(Providencia)、沙門氏菌屬(Salmonella)、沙雷氏菌屬(Serratia)、志賀氏菌屬(Shigella)、摩根菌屬(Morganella)和耶爾森氏菌屬(Yersinia)。根據(jù)一個(gè)優(yōu)選實(shí)施方案，所述宿主細(xì)胞屬于埃希氏菌屬，并且更優(yōu)選地，所述宿主細(xì)胞是大腸桿菌(Escherichia coli，E.coli)?？捎糜诒景l(fā)明的大腸桿菌菌株的實(shí)例包括但不限于由大腸桿菌K-12、大腸桿菌B或大腸桿菌W衍生的菌株，例如，如MG1655、W3110、DG1、DG2、Top10、DH10B、DH5α、HMS174、BL21、BL21(DE3)、HMS174(DE3)、BL21(DE3)pLysS和BL21(DE3)pLysE。

在一個(gè)實(shí)施方案中，可使宿主細(xì)胞中的基因失活。

本文中使用的術(shù)語“失活”指阻斷或阻遏基因在轉(zhuǎn)錄或翻譯水平上的表達(dá)。優(yōu)選地，術(shù)語“失活”指其轉(zhuǎn)錄受到阻遏的基因。根據(jù)本發(fā)明，基因的失活可由基因的突變或者在該基因的編碼序列中插入表達(dá)系統(tǒng)引起。術(shù)語“突變”在本發(fā)明的含義中指遺傳序列的穩(wěn)定變化。本發(fā)明中可導(dǎo)致基因失活的突變的實(shí)例包括但不限于點(diǎn)突變、插入、缺失和擴(kuò)增或基因重復(fù)。優(yōu)選地，所述突變是缺失。本文中使用的術(shù)語“缺失”意指基因的丟失或不存在，優(yōu)選基因的全部丟失或不存在。更優(yōu)選地，缺失在所缺失基因的起始密碼子處或之前開始并且在所缺失基因的終止子處或之后終止。

在一個(gè)實(shí)施方案中，使基因tonA(還稱為fhuA，SEQ ID NO:2)失活。TonA/FhuA蛋白是噬菌體T1、T5和Phi80的受體。

在一個(gè)實(shí)施方案中，使基因galK(SEQ ID NO:3)失活。該基因的缺失允許使用galK陽性/陰性選擇通過基于同源重組的方法來缺失基因。

在一個(gè)實(shí)施方案中，使基因araB(SEQ ID NO:4)失活。在另一個(gè)實(shí)施方案中，使基因araA(SEQ ID NO:5)失活。推薦araB和/或araA的失活使用宿主細(xì)胞內(nèi)的Para啟動(dòng)子(可被阿拉伯糖誘導(dǎo))。

在一個(gè)實(shí)施方案中，使基因lon(SEQ ID NO:6)和/或基因ompT(SEQ ID NO:7)失活。Lon蛋白是一種ATP依賴性蛋白酶。OmpT蛋白是一種外膜蛋白酶。優(yōu)選地，使基因lon和ompT失活。

在一個(gè)實(shí)施方案中，使基因rcsA(SEQ ID NO:8)失活。RcsA蛋白是合成被膜的正調(diào)節(jié)蛋白，其由Lon蛋白酶降解。

在一個(gè)實(shí)施方案中，使基因hsdR(SEQ ID NO:9)和/或基因mrr(SEQ ID NO:10)失活。HsdR和Mrr蛋白是具有不同特異性的限制性酶。優(yōu)選地，使基因hsdR和mrr二者都失活。

在一個(gè)實(shí)施方案中，使基因endA(SEQ ID NO:11)和/或基因recA(SEQ ID NO:12)失活。EndA是一種DNA特異性的內(nèi)切核酸酶。RecA是一種具有蛋白酶和核酸酶活性的重組蛋白。優(yōu)選地，使基因endA和recA二者都失活。

在本發(fā)明的一個(gè)實(shí)施方案中，使基因tonA、galK、araB、araA、lon、ompT、rcsA、hsdR、mrr、endA和recA中的至少一個(gè)失活。優(yōu)選地，缺失失活的基因。

在一個(gè)優(yōu)選實(shí)施方案中，使基因tonA、galK、araB、lon、ompT、rcsA、hsdR、mrr、endA和recA失活。優(yōu)選地，缺失基因tonA、galK、araB、lon、ompT、rcsA、hsdR、mrr、endA和recA。

在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞包含至少一個(gè)額外拷貝的編碼毒物蛋白的靶標(biāo)的核酸序列。在一個(gè)實(shí)施方案中，所述宿主細(xì)胞包含2個(gè)拷貝的編碼毒物蛋白的靶標(biāo)的核酸序列，或者3、4、5或6個(gè)拷貝(或者更多拷貝)的該核酸序列。優(yōu)選地，所述至少一個(gè)額外拷貝是染色體的，即插入在宿主細(xì)胞的基因組中。

在毒物蛋白是CcdB的一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞可包含至少一個(gè)額外拷貝的編碼GyrA蛋白的核酸序列。

在一個(gè)實(shí)施方案中，編碼GyrA蛋白的核酸序列是gyrA基因(序列SEQ ID NO:15)或者與SEQ ID NO:15具有至少75％，優(yōu)選地至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的編碼功能性GyrA蛋白的任意序列。

在一個(gè)實(shí)施方案中，將第二拷貝的編碼毒物蛋白的靶蛋白的核酸序列插入在宿主細(xì)胞中染色體中與編碼毒物蛋白的核酸序列拷貝相同的位置。在一個(gè)實(shí)施方案中，編碼毒物蛋白的核酸序列拷貝與第二拷貝的編碼毒物蛋白的靶蛋白的核酸序列同時(shí)插入。

在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞包含至少一個(gè)拷貝的編碼解毒劑蛋白的核酸序列，所述解毒劑蛋白抵消由本發(fā)明的宿主細(xì)胞表達(dá)的毒物蛋白的作用。

解毒劑蛋白的實(shí)例包括但不限CcdA(CcdB的解毒劑)、Kis(Kid的解毒劑)、Phd(Doc的解毒劑)、RelB(RelE的解毒劑)、PasB(或PasC)(PasA的解毒劑)、MazF(MazE的解毒劑)或免疫分子(細(xì)菌素的解毒劑)。當(dāng)相應(yīng)毒性分子由細(xì)胞產(chǎn)生時(shí)，針對(duì)毒性分子的解毒劑蛋白是降低或阻遏所述毒性分子對(duì)所述細(xì)胞(優(yōu)選原核生物細(xì)胞)的作用的任何分子。

根據(jù)一個(gè)優(yōu)選實(shí)施方案，毒物蛋白是CcdB，并且宿主細(xì)胞包含至少一個(gè)拷貝的編碼CcdA的核酸序列。在一個(gè)實(shí)施方案中，編碼CcdA蛋白的核酸序列是ccdA基因(序列SEQ ID NO:13)或者與SEQ ID NO:13具有至少75％，優(yōu)選地至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的編碼功能性CcdA蛋白的任意序列。本文中使用的“功能性”CcdA蛋白指與SEQ ID NO:13具有至少75％同一性并且保留CcdA降低或阻遏CcdB對(duì)細(xì)胞的作用的能力的CcdA蛋白。

在一個(gè)實(shí)施方案中，編碼解毒劑蛋白的核苷酸序列由載體，例如質(zhì)粒、噬菌體、病毒、陽離子囊泡或任意其他類型的載體攜帶，優(yōu)選地由質(zhì)粒攜帶。因此，技術(shù)人員可容易地推斷出，編碼解毒劑蛋白的核酸序列的拷貝數(shù)取決于所使用質(zhì)粒的類型。例如，pBR322家族的質(zhì)粒通常以范圍在約1至約100，優(yōu)選約20至約50之間的拷貝數(shù)存在于細(xì)胞中；而pUC家族的質(zhì)粒通常以范圍在約100至約500，優(yōu)選約150至約200之間的拷貝數(shù)存在于細(xì)胞中。然而，技術(shù)人員還可容易地推斷，質(zhì)粒在宿主細(xì)胞中的拷貝數(shù)還可取決于復(fù)制細(xì)胞的復(fù)制速率和/或生長。

因此，在一個(gè)優(yōu)選實(shí)施方案中，本發(fā)明的宿主細(xì)胞還包含攜帶至少一個(gè)拷貝的以下載體，優(yōu)選質(zhì)粒：(1)編碼針對(duì)毒物蛋白的解毒劑的核酸序列；和(2)編碼待生產(chǎn)的目的重組肽、多肽或蛋白質(zhì)的核酸序列或者用于插入編碼待生產(chǎn)的目的重組肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn)。

在一個(gè)實(shí)施方案中，編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中；或者插入位點(diǎn)使得當(dāng)插入時(shí)編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中。特別地，編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列置于啟動(dòng)子控制之下或者在插入后將置于啟動(dòng)子控制之下。

本文中使用的“表達(dá)系統(tǒng)”指與用于系統(tǒng)轉(zhuǎn)錄的另外片段可操作地連接的由編碼核酸序列的片段組成的線性或環(huán)狀DNA分子，所述片段編碼目的重組肽、多肽或蛋白質(zhì)。

所述另外片段包括啟動(dòng)子和終止密碼子序列。所述表達(dá)系統(tǒng)還可包含一個(gè)或更多個(gè)復(fù)制起點(diǎn)、一個(gè)或更多個(gè)選擇標(biāo)記和編碼核糖體結(jié)合位點(diǎn)的序列。

“可操作地連接”意指將片段設(shè)置成按照期望的那樣發(fā)揮功能，例如一旦在啟動(dòng)子處開始轉(zhuǎn)錄，其經(jīng)過編碼片段直至終止密碼子。

“啟動(dòng)子”在本發(fā)明中的含義是允許RNA聚合酶結(jié)合并起始轉(zhuǎn)錄的表達(dá)控制元件。

在本發(fā)明的一個(gè)實(shí)施方案中，核酸序列在“強(qiáng)”啟動(dòng)子的控制之下。強(qiáng)啟動(dòng)子一方面以啟動(dòng)子序列與RNA聚合酶(通常是天然存在的對(duì)應(yīng)RNA聚合酶)的高結(jié)合親和力為特征，并且另一方面以通過該RNA聚合酶形成mRNA的高速率為特征。

在一個(gè)優(yōu)選實(shí)施方案中，核酸序列在“誘導(dǎo)型啟動(dòng)子”的控制之下?！罢T導(dǎo)型啟動(dòng)子”是可通過外部因素(例如誘導(dǎo)物(還稱為“誘導(dǎo)劑”)分子的存在或阻遏物分子的不存在)或者物理因素(例如溫度、摩爾滲透壓濃度或pH值的升高或降低)來調(diào)節(jié)的啟動(dòng)子。不同的啟動(dòng)子及相應(yīng)的誘導(dǎo)原理由Makrides等(Microbiological Reviews,1996,(60)3:512-538)進(jìn)行了綜述?？捎糜诒景l(fā)明的誘導(dǎo)型啟動(dòng)子的實(shí)例包括但不限于全部均使用大腸桿菌RNA聚合酶的tac或trc啟動(dòng)子、lac或lacUV5啟動(dòng)子(所有均是可通過乳糖或其類似物IPTG(異丙硫基-β-D-半乳糖苷)誘導(dǎo)的)、可嚴(yán)格調(diào)節(jié)的araBAD啟動(dòng)子(Para；Guzman等,1995,可通過阿拉伯糖誘導(dǎo)的)、trp啟動(dòng)子(可通過β-吲哚丙烯酸添加或色氨酸饑餓誘導(dǎo)的，可通過色氨酸添加阻遏的)、λ啟動(dòng)子pL(λ)(通過升高溫度來誘導(dǎo))、phoA啟動(dòng)子(可通過磷酸鹽饑餓誘導(dǎo)的)或其他適于重組肽、多肽或蛋白質(zhì)表達(dá)的啟動(dòng)子。

誘導(dǎo)型啟動(dòng)子中有是表現(xiàn)出“滲漏”表達(dá)行為的那些。這樣的啟動(dòng)子(所謂的“滲漏啟動(dòng)子”)在原理上是可誘導(dǎo)的，但是仍然還無需外部誘導(dǎo)即可表現(xiàn)出基本表達(dá)。在非誘導(dǎo)條件下表現(xiàn)出滲漏表達(dá)的誘導(dǎo)型啟動(dòng)子的表現(xiàn)可與組成型啟動(dòng)子(即，其是穩(wěn)定且連續(xù)地具有活性或者其可由于某些培養(yǎng)條件而激活或增強(qiáng))類似。滲漏啟動(dòng)子特別地可用于連續(xù)操作的培養(yǎng)過程。滲漏啟動(dòng)子的實(shí)例是T7啟動(dòng)子和trp啟動(dòng)子。在本發(fā)明的含義中，術(shù)語“T7啟動(dòng)子”包括存在于噬菌體T7的基因組中的啟動(dòng)子以及能夠介導(dǎo)通過T7RNA聚合酶的轉(zhuǎn)錄的此類啟動(dòng)子的共有序列和變體。噬菌體T7包含17個(gè)不同的啟動(dòng)子序列，其全部均包含高度保守的核苷酸序列。

在本發(fā)明的一個(gè)實(shí)施方案中，啟動(dòng)子還可以是組成型的，即一方面無需誘導(dǎo)即可控制表達(dá)或者另一方面無阻遏可能性的啟動(dòng)子。因此，在一定水平具有連續(xù)且穩(wěn)定的表達(dá)。作為一個(gè)實(shí)例，可使用強(qiáng)組成型HCD啟動(dòng)子(Poo等,Biotechnology Letters,2002,24:1185-1189；Jeong等,Proteinexpression and purification,2004,36:150-156)來進(jìn)行組成型表達(dá)。

有利地，在特定條件下，例如在選擇下誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。

根據(jù)一個(gè)優(yōu)選實(shí)施方案，將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于T7啟動(dòng)子、可通過IPTG誘導(dǎo)的啟動(dòng)子(例如，如Ptrc啟動(dòng)子或Ptac啟動(dòng)子)或者可通過阿拉伯糖誘導(dǎo)的啟動(dòng)子(例如，如Para)的控制之下。

在一個(gè)優(yōu)選實(shí)施方案中，編碼解毒劑蛋白的核酸序列是直接功能性的，即其直接編碼功能性的解毒劑蛋白。此外，在一個(gè)實(shí)施方案中，編碼目的肽、多肽或蛋白質(zhì)的核酸序列或者插入位點(diǎn)不放置在編碼解毒劑蛋白的核酸序列中。

在一個(gè)實(shí)施方案中，本發(fā)明的載體包含cer基因座。cer基因座通過阻止多聚體的失控累積(稱為“二聚體災(zāi)難”)來實(shí)現(xiàn)ColE1及相關(guān)質(zhì)粒的穩(wěn)定遺傳。多聚體分解通過XerCd位點(diǎn)特異性重組酶在cer位點(diǎn)的作用來實(shí)現(xiàn)。優(yōu)選地，當(dāng)在本發(fā)明的載體中插入cer基因座時(shí)，宿主細(xì)胞是大腸桿菌。

在一個(gè)實(shí)施方案中，本發(fā)明的載體不包含任何抗生素抗性基因。在另一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞不包含任何抗生素抗性基因。在一個(gè)實(shí)施方案中，本發(fā)明的載體或宿主細(xì)胞均不包含任何抗生素抗性基因。因此，根據(jù)該實(shí)施方案，當(dāng)使用本發(fā)明的宿主細(xì)胞和載體來生產(chǎn)目的肽、多肽或蛋白質(zhì)時(shí)，不需要抗生素。

本發(fā)明還涉及包含本發(fā)明的宿主細(xì)胞和至少一種上述載體(優(yōu)選質(zhì)粒)的試劑盒，所述宿主細(xì)胞包含至少兩個(gè)拷貝的編碼毒物蛋白的核酸。優(yōu)選地，所述載體攜帶至少一個(gè)編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列，和表達(dá)系統(tǒng)中的編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列，或者表達(dá)系統(tǒng)中的用于插入編碼目的重組肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn)。

根據(jù)一個(gè)優(yōu)選實(shí)施方案，本發(fā)明的宿主細(xì)胞包含至少兩個(gè)編碼插入在其基因組中的CcdB蛋白的核酸序列，并且本發(fā)明的載體攜帶至少一個(gè)編碼CcdA的核酸序列。

在一個(gè)實(shí)施方案中，所述載體包含表達(dá)系統(tǒng)和用于在所述表達(dá)系統(tǒng)中插入編碼目的肽、多肽或蛋白質(zhì)的核酸序列的插入位點(diǎn)，從而獲得用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的功能性載體。因此，在用本發(fā)明的用于生產(chǎn)目的重組肽、多肽或蛋白質(zhì)的載體轉(zhuǎn)化宿主細(xì)胞之前，必須將編碼目的肽、多肽或蛋白質(zhì)的核酸序列插入在載體中的插入位點(diǎn)處。用于將核酸序列插入在插入位點(diǎn)中的方法是本領(lǐng)域技術(shù)人員公知的，并且通常基于使用限制性酶。

對(duì)于目的肽、多肽或蛋白質(zhì)，其可指待以制備規(guī)模生產(chǎn)的任何肽、多肽或蛋白質(zhì)，例如工業(yè)用肽、多肽或蛋白質(zhì)或者治療性肽、多肽或蛋白質(zhì)。

可通過本發(fā)明方法生產(chǎn)的肽、多肽或蛋白質(zhì)的實(shí)例是但不限于酶、調(diào)節(jié)蛋白、受體、肽(例如肽類激素)、細(xì)胞因子、抗體、納米抗體、膜蛋白或轉(zhuǎn)運(yùn)蛋白。

目的肽、多肽或蛋白質(zhì)還可以是如用于接種疫苗、疫苗、抗原結(jié)合蛋白、免疫刺激蛋白、變應(yīng)原、全長抗體或者抗體片段或衍生物?？贵w衍生物可選自單鏈抗體、(scFv)、Fab片段、F(ab’)2片段、Fv片段、單結(jié)構(gòu)域抗體(VH或VL片段)、駱駝單可變結(jié)構(gòu)域(VHH)或如例如Andersen和Reilly(Current Opinion in Biotechnology,2004,15:456-462)或Holliger或Hudson(Nature Biotechnology,2005(23)9:1126-1136)中所述的其他抗體形式。

本發(fā)明中目的肽、多肽或蛋白質(zhì)的實(shí)例還可為致病性病毒的基因組中編碼的蛋白質(zhì)(病毒抗原)，例如外殼蛋白、核心蛋白、蛋白酶、逆轉(zhuǎn)錄酶、整合酶等，所述致病性病毒例如乙型肝炎病毒、丙型肝炎病毒、I-HV、流感病毒等；生長因子，例如血小板源性生長因子(PDGF)、干細(xì)胞生長因子(SCF)、肝細(xì)胞生長因子(HGF)、轉(zhuǎn)化生長因子(TGF)、神經(jīng)生長因子(NGF)、表皮生長因子(EGF)、成纖維細(xì)胞生長因子(FGF)、胰島素樣生長因子(IGF)等；細(xì)胞因子，例如腫瘤壞死因子、干擾素、白介素等；造血因子，例如紅細(xì)胞生成素、粒細(xì)胞菌落刺激因子、粒細(xì)胞-巨噬細(xì)胞菌落刺激因、巨噬細(xì)胞菌落刺激因子、血小板生成素等；肽類激素，例如促黃體素釋放素(LB-RH)、促甲狀腺素釋放激素(TRH)、胰島素、生長抑素、生長激素、催乳素、促腎上腺皮質(zhì)激素(ACTH)、促黑素細(xì)胞激素(MSH)、促甲狀腺激素(TSH)、黃體生成素(LU)、促卵泡激素(FSH)、加壓素、氧化毒素、降鈣素、甲狀旁腺激素(PTH)、胰高血糖素、胃泌素、分泌素、促胰酶素、膽囊收縮素、血管緊張素、人胎盤催乳素、人絨毛膜促性腺素(HCG)、蛙皮素、胃動(dòng)素等；鎮(zhèn)痛肽，例如腦啡肽、內(nèi)啡肽、強(qiáng)啡肽、京都啡肽等；酶，例如超氧化物歧化酶(SOD)、尿激酶、組織纖溶酶原激活物(TPA)、天冬酰胺酶、激肽釋放酶等；肽類神經(jīng)遞質(zhì)，例如鈴蟾肽、神經(jīng)張力蛋白、緩激肽、P物質(zhì)、阿爾茨海默淀粉樣肽(AD)、SOD1、早老素1和2、腎素、突觸核蛋白(Dsynuclein)、淀粉樣蛋白A、淀粉樣蛋白P、激活素、抗HER-2、蛙皮素、腦啡肽酶、蛋白酶抑制劑、治療性酶、D1-抗胰蛋白酶、哺乳動(dòng)物胰蛋白酶抑制劑、哺乳動(dòng)物胰腺胰蛋白酶抑制劑、降鈣素、心臟肥大因子、心肌營養(yǎng)蛋白(例如心肌營養(yǎng)蛋白-1)、CD蛋白(例如CD-3、CD-4、CD-8和CD-19)、CFTR、CTNF、DNA酶、人絨毛膜促性腺激素、小鼠促性腺激素相關(guān)肽、細(xì)胞因子、轉(zhuǎn)甲狀腺素蛋白、支鏈淀粉、脂蛋白、淋巴因子、溶菌酶、生長激素(包括人生長激素)、牛生長激素、生長激素釋放因子、甲狀旁腺激素、促甲狀腺激素、生長因子、腦源性神經(jīng)營養(yǎng)生長因子、表皮生長因子(EGF)、成纖維細(xì)胞生長因子(例如D FGF和D FGF)、胰島素樣生長因子-I和-II、des(1-3)-IGF-I(腦IGF-I)、胰島素樣生長因子結(jié)合蛋白、神經(jīng)生長因子(例如NGF-D)、血小板源性生長因子(PDGF)、血管內(nèi)皮生長因子(VEGF)、生長激素或生長因子的受體、轉(zhuǎn)化生長因子(TGF)(例如TGF-D、TGF-D1、TGF-D2、TGF-D3、TGF-D4或TGF-D5)、神經(jīng)營養(yǎng)因子(例如神經(jīng)營養(yǎng)蛋白-3、-4、-5或-6)、凝溶膠蛋白、胰高血糖素、激肽釋放酶、米勒管抑制物質(zhì)、神經(jīng)營養(yǎng)因子、p53、蛋白A或D、松弛素、松弛素A-鏈、松弛素B-鏈、類風(fēng)濕因子、視紫紅質(zhì)、血清白蛋白(例如人血清清蛋白)、抑制素、胰島素、胰島素鏈、胰島素A-鏈、胰島素D-鏈、胰島素受體、胰島素原、黃體生成素、整聯(lián)蛋白、白介素(IL)(例如IL-1至IL-10、IL-12、IL-13)、紅細(xì)胞生成素、血小板生成素、原纖維蛋白、促卵泡激素、凝血因子(如因子VIIIC、因子IX、組織因子和馮·維勒布蘭德因子)、抗凝血因子(例如蛋白C、心房利鈉尿因子、肺表面活性劑)、纖溶酶原激活劑(例如人組織纖溶酶原激活物或尿激酶)、凝血酶、腫瘤壞死因子-D或D、D-酮酸脫氫酶、地址素、骨形態(tài)生成蛋白(BMP)、膠原、菌落刺激因子(CSF)(例如M-CSF、GM-CSF和G-CSF)、衰變加速因子、歸巢受體、干擾素(例如干擾素-α、γ和β)、角蛋白、骨誘導(dǎo)因子、PRNP、調(diào)節(jié)蛋白、超氧化物歧化酶、表面膜蛋白、轉(zhuǎn)運(yùn)蛋白、T-細(xì)胞受體、例如gp120(HIb)免疫毒素的抗原、心房利鈉尿肽、精囊外分泌蛋白、D 2-微球蛋白、PrP、降鈣素原、脊髓小腦性共濟(jì)失調(diào)蛋白1、脊髓小腦性共濟(jì)失調(diào)蛋白2、脊髓小腦性共濟(jì)失調(diào)蛋白3、脊髓小腦性共濟(jì)失調(diào)蛋白6、脊髓小腦性共濟(jì)失調(diào)蛋白7、亨廷頓蛋白、雄激素受體、CREB結(jié)合蛋白、gp120、p300、CREB、API、Ras、NFAT、Jun、Fos、齒狀核紅核蒼白球路易氏體萎縮相關(guān)蛋白、微生物蛋白(例如麥芽糖結(jié)合蛋白、ABC轉(zhuǎn)運(yùn)蛋白、谷胱甘肽S轉(zhuǎn)移酶、硫氧還蛋白、D-內(nèi)酰胺酶)、綠色熒光蛋白、紅色熒光蛋白；酶，例如超氧化物歧化酶、天冬酰胺酶、精氨酸酶、精氨酸脫氨酶、腺苷脫氨酶、核糖核酸酶、過氧化氫酶、尿酸酶、膽紅素氧化酶、胰蛋白酶、木瓜蛋白酶、堿性磷酸酶、β-葡糖苷酸酶、嘌呤核苷磷酸化酶或巴曲酶；阿片樣物質(zhì)，例如內(nèi)啡肽、腦啡肽或非天然阿片樣物質(zhì)；激素或神經(jīng)肽，例如降鈣素、胰高血糖素、胃泌素、促腎上腺皮質(zhì)激素(ACTH)、膽囊收縮素、黃體生成素、促性腺激素釋放激素、絨毛膜促性腺激素、促腎上腺皮質(zhì)激素釋放因子、加壓素、催產(chǎn)素、抗利尿激素、促甲狀腺激素、促甲狀腺激素釋放激素、松弛素、催乳素、肽YY、神經(jīng)肽Y、胰腺多肽、瘦素、CART(可卡因安非他明調(diào)節(jié)轉(zhuǎn)錄物)、CART相關(guān)肽、脂滴包被蛋白、例如MC-4的黑皮質(zhì)素(黑素細(xì)胞刺激激素)、黑色素濃集激素、利鈉肽、腎上腺髓質(zhì)素、內(nèi)皮素、胰泌素、胰淀素、血管活性腸肽(VIP)、垂體腺苷酸環(huán)化酶激活多肽(PACAP)、鈴蟾肽、鈴蟾肽樣肽、胸腺素、肝素結(jié)合蛋白、可溶性CD4、下丘腦釋放因子和褪黑激素或者其功能類似物。在本發(fā)明的另一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)可以是加工酶，例如蛋白酶(例如腸激酶、胱天蛋白酶胰蛋白酶，類似于絲氨酸蛋白酶)、脂肪酶、磷酸酶、糖基水解酶(例如甘露糖苷酶、木糖苷酶、巖藻糖苷酶)、激酶、單氧化酶或二氧化酶、過氧化物酶、轉(zhuǎn)谷氨酰胺酶、羧肽酶、酰胺酶、酯酶，磷酸酶等。

這樣的哺乳動(dòng)物多肽的優(yōu)選來源包括人、牛、馬、豬、狼和嚙齒類動(dòng)物來源，其中特別優(yōu)選人蛋白。

本發(fā)明的目的肽、多肽或蛋白質(zhì)還涵蓋前述目的肽、多肽或蛋白質(zhì)的變體。這些變體涵蓋例如與前述目的肽、多肽或蛋白具有相同活性并且具有在前述目的肽、多肽或蛋白的氨基酸序列中缺失、替換、插入和/或添加一個(gè)或多個(gè)氨基酸的氨基酸序列的肽、多肽或蛋白質(zhì)。這樣的肽、多肽或蛋白質(zhì)的實(shí)例可以是與前述目的肽、多肽或蛋白具有相同活性并且具有在前述目的肽、多肽或蛋白的氨基酸序列中缺失、替換、插入和/或添加一個(gè)或多個(gè)氨基酸的氨基酸序列的肽、多肽或蛋白質(zhì)?？赏瑫r(shí)進(jìn)行選自缺失、替換、插入和添加的兩種或多種類型修飾。

本發(fā)明的目的肽、多肽或蛋白質(zhì)還涵蓋前述目的肽、多肽或蛋白質(zhì)的“部分肽或多肽”。目的肽、多肽或蛋白質(zhì)的部分肽或多肽的實(shí)例可以是這樣的部分肽或多肽，其包含其中前述目的肽、多肽或蛋白質(zhì)的一部分氨基酸序列不間斷地延伸的氨基酸序列，其中部分肽或多肽優(yōu)選地與所述目的肽、多肽或蛋白質(zhì)具有相同的活性。這樣的部分肽或多肽的實(shí)例可以是包含前述目的肽、多肽或蛋白質(zhì)的氨基酸序列中至少20，優(yōu)選至少50個(gè)氨基酸殘基的氨基酸序列。該肽或多肽優(yōu)選地包含對(duì)應(yīng)于與前述目的肽、多肽或蛋白質(zhì)的活性相關(guān)的區(qū)域的氨基酸序列。另外，用于本發(fā)明的部分肽或多肽還可以是通過對(duì)該肽進(jìn)行修飾產(chǎn)生的部分肽或多肽，其中從其氨基酸序列缺失、替換、插入和/或添加1或多個(gè)(例如，約1至20個(gè)，更優(yōu)選約1至10個(gè)，并且甚至更優(yōu)選約1至5個(gè))氨基酸殘基。用于本發(fā)明的部分肽或多肽還可用作用于抗體生產(chǎn)的抗原。

在本發(fā)明的一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)選自人生長激素、人胰島素、促卵泡激素、因子VIII、紅細(xì)胞生成素、粒細(xì)胞菌落刺激因子、α-半乳糖苷酶A、α-L-艾杜糖苷酸酶、N-乙酰半乳糖胺-4-硫酸酯酶、阿法鏈道酶、組織纖溶酶原激活物、葡糖腦苷脂酶、干擾素、胰島素樣生長因子1、牛生長激素、豬生長激素、牛凝乳酶和乙型肝炎病毒包膜蛋白。

目的肽、多肽或蛋白質(zhì)還涵蓋已在周質(zhì)中進(jìn)行翻譯后修飾和輸出后修飾的經(jīng)修飾肽、多肽或蛋白質(zhì)，所述修飾例如環(huán)化、糖基化、磷酸化、甲基化、氧化、脫水、蛋白水解切割。

在一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是用于代謝細(xì)胞外介質(zhì)中的生物分子(本文中稱為“細(xì)胞外生物分子”)的酶。在一個(gè)實(shí)施方案中，細(xì)胞外生物分子包含多糖或脂質(zhì)。在本發(fā)明的一個(gè)實(shí)施方案中，所述多糖包含藻酸鹽、果膠、纖維素、纖維二糖、昆布多糖或其混合物。在本發(fā)明的一個(gè)實(shí)施方案中，所述脂質(zhì)包含脂肪酸、葡糖脂、甜菜堿脂質(zhì)、甘油脂、磷脂、甘油磷脂、鞘脂、甾醇脂質(zhì)、異戊烯醇脂質(zhì)、糖脂、聚酮化合物或其混合物。在本發(fā)明的一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是將多糖轉(zhuǎn)化成單糖、寡糖或二者的酶。在本發(fā)明的一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是將脂質(zhì)轉(zhuǎn)化成脂肪酸、單糖或二者的酶。在本發(fā)明的一個(gè)實(shí)施方案中，所述單糖或寡糖是低聚藻酸鹽、甘露糖醛酸鹽、古羅糖醛酸鹽、甘露醇、α-酮酸、4-脫氧-L-赤式-己酮糖糖醛酸鹽(DEHU)、2-酮-3-脫氧D-葡萄糖酸鹽(KDG)、葡萄糖、葡萄糖醛酸鹽、半乳糖醛酸鹽、半乳糖、木糖、阿拉伯糖或甘露糖。在本發(fā)明的一個(gè)實(shí)施方案中，所述脂肪酸是14:0、反式-14、16:0、16:ln-7、反式-16、16:2n-6、18:0、18:ln-9、18:2n-6、18:3n-6、18:3n-3、18:4n-3、20:0、20:2n-6、20:3n-6、20:4n-3、20:4n-6或20:5n-3。

在本發(fā)明的一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是將細(xì)胞外生物分子轉(zhuǎn)化成商用化學(xué)品的酶。在本發(fā)明的一個(gè)實(shí)施方案中，所述商用化學(xué)品是乙醇、丁醇或生物柴油。在本發(fā)明的一個(gè)實(shí)施方案中，所述生物柴油是脂肪酸、脂肪酸酯或萜類化合物。

在一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是一種分泌蛋白。在一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是天然分泌的，即編碼其的核酸序列天然包含導(dǎo)致其分泌的信號(hào)肽。在另一個(gè)實(shí)施方案中，目的肽、多肽或蛋白質(zhì)是是人工分泌的，即編碼其的核酸序列與信號(hào)肽融合，從而實(shí)現(xiàn)其分泌?？捎糜诒景l(fā)明的情況的信號(hào)肽的實(shí)例包括但不限于OmpA信號(hào)肽(SEQ ID NO:17)、DsbA信號(hào)肽(SEQ ID NO:18)或PhoA信號(hào)肽(SEQ ID NO:19)。

在另一個(gè)實(shí)施方案中，所述肽、多肽或蛋白質(zhì)是一種跨膜蛋白。

在另一個(gè)實(shí)施方案中，所述肽、多肽或蛋白質(zhì)是對(duì)宿主細(xì)胞具有毒性的蛋白質(zhì)。

在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞還包含編碼誘導(dǎo)目的肽、多肽或蛋白質(zhì)表達(dá)的蛋白質(zhì)的核酸序列，其優(yōu)選地放置在表達(dá)系統(tǒng)中。

這樣的核酸序列的實(shí)例包括但不限于編碼T7RNA聚合酶的基因，T7基因1。在此情況下，T7RNA聚合酶的表達(dá)誘導(dǎo)置于T7啟動(dòng)子的控制之下的目的肽、多肽或蛋白質(zhì)表達(dá)。

優(yōu)選地，編碼目的肽、多肽或蛋白質(zhì)表達(dá)的蛋白質(zhì)的核酸序列是T7表達(dá)系統(tǒng)。T7表達(dá)系統(tǒng)在US4,952,496中進(jìn)行了描述，其通過引用并入本文。T7表達(dá)系統(tǒng)包含來自T7噬菌體的包含T7RNA聚合酶的整個(gè)編碼序列的DNA片段(即，T7基因1)。移除T7基因1的任何天然活性啟動(dòng)子，并在編碼序列之前插入誘導(dǎo)型lacUV5啟動(dòng)子。lacUV5啟動(dòng)子通過向培養(yǎng)基中添加IPTG來誘導(dǎo)。

在一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞包含插入在其基因組中的噬菌體。在將目的肽、多肽或蛋白質(zhì)置于T7啟動(dòng)子控制之下的一個(gè)實(shí)施方案中，所述經(jīng)遺傳修飾的噬菌體如PCT專利申請(qǐng)WO2013/004817(通過引用并入本文)中所述的。在一個(gè)實(shí)施方案中，所述經(jīng)遺傳修飾的噬菌體進(jìn)一步限定為以下噬菌體，其中：

-插入表達(dá)系統(tǒng)(優(yōu)選T7表達(dá)系統(tǒng))，并且

-S和/或R基因失活。

本發(fā)明的一個(gè)實(shí)施方案中，使噬菌體中的Int和/或Xis基因失活。

所述經(jīng)遺傳修飾的噬菌體進(jìn)一步限定為以下噬菌體，其中：

-插入表達(dá)系統(tǒng)(優(yōu)選T7表達(dá)系統(tǒng))，

-S、R和/或Q基因失活，并且

-Int和/或Xis基因失活。

可用于本發(fā)明的噬菌體的實(shí)例包括但不限于λ噬菌體(腸桿菌噬菌體λ，登錄號(hào)NC_001416)、λ樣噬菌體和λ形噬菌體。λ噬菌體(還稱為大腸桿菌噬菌體λ)是一種感染大腸桿菌的病毒。λ是一種溫和噬菌體。λ樣噬菌體形成細(xì)菌噬菌體和以長的非收縮尾為特征的古細(xì)菌病毒的家族。λ形噬菌體是λ噬菌體的天然相關(guān)物。其大多數(shù)生長在大腸桿菌上，但是少數(shù)來自于其他宿主細(xì)胞，例如，例如鼠傷寒沙門氏菌(Salmonella typhimurium)?？捎糜诒景l(fā)明的λ樣噬菌體和λ形噬菌體的實(shí)例包括但不限于大腸桿菌噬菌體434、phi80、phi81、HK97、P21和P22。

在一個(gè)實(shí)施方案中，所述噬菌體是λDE3(登錄號(hào)EU078592)。λDE3噬菌體是經(jīng)修飾的λ噬菌體D69，其包含在lacUV5啟動(dòng)子控制之下的編碼T7RNA聚合酶的基因。

根據(jù)一個(gè)優(yōu)選實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是具有SEQ ID NO:14并且為(DE3)ΔS-C，Δxis-ea10(DE3指其中已將T7RNA聚合酶基因整合在int基因序列內(nèi)的λ噬菌體DE3)的噬菌體P11。所述經(jīng)修飾噬菌體P11對(duì)應(yīng)于序列NC_001416，其中缺失基因S、R、Rz、Xis和Int的編碼序列。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P12，其中缺失基因Int和S的編碼序列(P12的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P13，其中缺失基因S、R、Rz、Q、Xis和Int的編碼序列(P13的一個(gè)實(shí)例是序列DE3ΔS-C,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P14，其中缺失基因R和Int的編碼序列(P14的一個(gè)實(shí)例是序列DE3ΔR)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P15，其中缺失基因Q和Int的編碼序列的(P15的一個(gè)實(shí)例是序列DE3ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P16，其中缺失基因S和Xis的編碼序列(P16的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P17，其中缺失基因R和Xis的編碼序列(P17的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P18，其中缺失基因Q和Xis的編碼序列(P18的一個(gè)實(shí)例是序列NC_001416Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P19，其中缺失基因R、Rz和Int的編碼序列(P19的一個(gè)實(shí)例是序列DE3ΔR,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P20，其中缺失基因S、Rz和Int的編碼序列(P20的一個(gè)實(shí)例是序列DE3ΔS,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P21，其中缺失基因Rz、Q和Int的編碼序列(P21的一個(gè)實(shí)例是序列DE3ΔRz,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P22，其中缺失基因S、Q和Int的編碼序列(P22的一個(gè)實(shí)例是序列DE3ΔS,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P23，其中缺失基因R、Q和Int的編碼序列(P23的一個(gè)實(shí)例是序列DE3ΔR,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P24，其中缺失基因S、R和Int的編碼序列(P24的一個(gè)實(shí)例是序列DE3ΔS,ΔR)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P25，其中缺失基因S、Rz和Xis的編碼序列(P25的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P26，其中缺失基因S、Rz和Xis的編碼序列(P26的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P27，其中缺失基因Q、Rz和Xis的編碼序列(P27的一個(gè)實(shí)例是序列NC_001416ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P28，其中缺失基因S、Q和Xis的編碼序列(P28的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P29，其中缺失基因R、Q和Xis的編碼序列(P29的一個(gè)實(shí)例是序列NC_001416ΔR,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P30，其中缺失基因R、S和Xis的編碼序列(P30的一個(gè)實(shí)例是序列NC_001416ΔS,Δxis-ea10,ΔR)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P31，其中缺失基因R、Xis和Int的編碼序列(P31的一個(gè)實(shí)例是序列DE3ΔR,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P32，其中缺失基因S、Xis和Int的編碼序列(P32的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P33，其中缺失基因Q、Xis和Int的編碼序列(P33的一個(gè)實(shí)例是序列DE3Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P34，其中缺失基因S、R、Xis和Int的編碼序列(P34的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔR)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P35，其中缺失基因S、R、Xis和Int的編碼序列(P35的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔR)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P36，其中缺失基因S、Q、Xis和Int的編碼序列(P36的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P37，其中缺失基因R、Rz、Xis和Int的編碼序列(P37的一個(gè)實(shí)例是序列DE3ΔR,Δxis-ea10,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P38，其中缺失基因S、Rz、Xis和Int的編碼序列(P38的一個(gè)實(shí)例是序列DE3ΔS,Δxis-ea10,ΔRz)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P39，其中缺失基因Rz、Q、Xis和Int的編碼序列(P39的一個(gè)實(shí)例是序列DE3ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P40，其中缺失基因S、R、Q和Int的編碼序列(P40的一個(gè)實(shí)例是序列DE3ΔS,ΔR,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P41，其中缺失基因S、R、Rz和Int的編碼序列(P41的一個(gè)實(shí)例是序列DE3ΔS-C)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P42，其中缺失基因R、Rz、Q和Int的編碼序列(P42的一個(gè)實(shí)例是序列DE3ΔR,ΔRz,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P43，其中缺失基因S、Rz、Q和Int的編碼序列(P43的一個(gè)實(shí)例是序列DE3ΔS,ΔRz,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P44，其中缺失基因S、R、Q和Xis的編碼序列(P44的一個(gè)實(shí)例是序列NC_001416ΔS,ΔR,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P45，其中缺失基因S、R、Rz和Xis的編碼序列(P45的一個(gè)實(shí)例是序列NC_001416ΔS-C,Δxis-ea10)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P46，其中缺失基因R、Rz、Q和Xis的編碼序列(P46的一個(gè)實(shí)例是序列NC_001416ΔR,ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P47，其中缺失基因S、Rz、Q和Xis的編碼序列(P47的一個(gè)實(shí)例是序列NC_001416ΔS,ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P48，其中缺失基因S、R、Q和Int的編碼序列(P48的一個(gè)實(shí)例是序列DE3ΔS,ΔR,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P49，其中缺失基因S、Rz、Q、Xis和Int的編碼序列(P49的一個(gè)實(shí)例是序列DE3ΔS,ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P50，其中缺失基因R、Rz、Q、Xis和Int的編碼序列(P50的一個(gè)實(shí)例是序列DE3ΔR,ΔRz,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P51，其中缺失基因S、R、Q、Rz和Int的編碼序列(P51的一個(gè)實(shí)例是序列DE3ΔS-C,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001416的P52，其中缺失基因S、R、Rz、Q和Xis的編碼序列(P52的一個(gè)實(shí)例是序列NC_001416ΔS-C,Δxis-ea10,ΔQ)。

根據(jù)另一個(gè)實(shí)施方案，所述經(jīng)遺傳修飾的噬菌體是對(duì)應(yīng)于序列NC_001415的P53，其中缺失基因Q、Xis和Int的編碼序列(P53的一個(gè)實(shí)例是DE3Δxis-ea10,ΔQ)。

本發(fā)明還涉及用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法，其中所述方法包括：

-培養(yǎng)根據(jù)本發(fā)明的宿主細(xì)胞，所述宿主細(xì)胞包含：

-至少兩個(gè)拷貝的編碼毒物蛋白(優(yōu)選CcdB)的核酸序列，

-至少一個(gè)拷貝的編碼針對(duì)該毒物蛋白的解毒劑蛋白(優(yōu)選CcdA)的核酸序列，以及

-至少一個(gè)拷貝的編碼目的肽、多肽或蛋白質(zhì)的核酸序列，以及

-回收目的肽、多肽或蛋白質(zhì)。

在一個(gè)實(shí)施方案中，至少兩個(gè)拷貝的編碼毒物蛋白的核酸序列插入在宿主細(xì)胞的基因組中。

在一個(gè)實(shí)施方案中，至少一個(gè)拷貝的編碼針對(duì)毒物蛋白的解毒劑蛋白的核酸序列和至少一個(gè)拷貝的編碼目的肽、多肽或蛋白質(zhì)的核酸序列可由同一載體攜帶。因此，僅包含所述載體的宿主細(xì)胞得以增殖，而無該載體的宿主細(xì)胞由于毒物蛋白的毒性作用而死亡。

在本發(fā)明的一個(gè)實(shí)施方案中，編碼目的肽、多肽或蛋白質(zhì)的核酸序列包含在表達(dá)系統(tǒng)中。根據(jù)該實(shí)施方案，目的肽、多肽或蛋白質(zhì)的生產(chǎn)是直接的，即其由表達(dá)系統(tǒng)中的基因的表達(dá)產(chǎn)生，例如通過在誘導(dǎo)表達(dá)系統(tǒng)中包含的啟動(dòng)子的培養(yǎng)基中進(jìn)行培養(yǎng)。例如，在一個(gè)實(shí)施方案中，將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于pLac或pTRC啟動(dòng)子控制之下，并且當(dāng)向培養(yǎng)基中添加IPTG時(shí)誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。此外，在另一個(gè)實(shí)施方案中，將編碼目的肽、多肽或蛋白質(zhì)的核酸序列置于Para啟動(dòng)子的控制之下，并且當(dāng)向培養(yǎng)基中添加阿拉伯糖時(shí)誘導(dǎo)目的肽、多肽或蛋白質(zhì)的表達(dá)。

在另一個(gè)實(shí)施方案中，本發(fā)明的宿主細(xì)胞還包含另一表達(dá)系統(tǒng)，所述表達(dá)系統(tǒng)含有插入在其基因組中在lac啟動(dòng)子(優(yōu)選lacUV5啟動(dòng)子)控制之下的T7RNA聚合酶的核酸序列。根據(jù)該實(shí)施方案，用于生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法包括用載體(優(yōu)選質(zhì)粒)轉(zhuǎn)化宿主細(xì)胞，所述載體包含在T7啟動(dòng)子的控制之下的目的肽、多肽或蛋白質(zhì)的核酸序列和編碼解毒劑蛋白的核酸序列。T7啟動(dòng)子的表達(dá)在對(duì)T7啟動(dòng)子具有嚴(yán)格特異性的T7RNA聚合酶的控制之下，即T7啟動(dòng)子僅能夠被細(xì)菌噬菌體T7的RNA聚合酶利用。當(dāng)向培養(yǎng)基中添加IPTG時(shí)，通過從lac啟動(dòng)子轉(zhuǎn)錄來表達(dá)T7RNA聚合酶，這將允許目的肽、多肽或蛋白質(zhì)的表達(dá)。

根據(jù)一個(gè)實(shí)施方案，目的肽、多肽或蛋白質(zhì)被宿主細(xì)胞分泌在發(fā)酵肉湯中。根據(jù)該實(shí)施方案，目的肽、多肽或蛋白質(zhì)可容易地使用本領(lǐng)域中公知的方法來從發(fā)酵肉湯中回收。

根據(jù)另一個(gè)實(shí)施方案，目的肽、多肽或蛋白質(zhì)不被宿主細(xì)胞分泌在發(fā)酵肉湯中。用于回收細(xì)胞內(nèi)或周質(zhì)的目的肽、多肽或蛋白質(zhì)的方法還是本領(lǐng)域中公知的。

此類方法的實(shí)例包括但不限于使用三氯乙酸(TCA)或包含十二烷基硫酸鈉(SDS)的破裂緩沖液在變性條件下回收總蛋白，或者使用聲波處理、弗氏細(xì)胞壓碎器或其等同方法在壓力下破裂細(xì)菌從而在天然(未變性)條件下來回收總細(xì)胞質(zhì)蛋白。接著，可使用特異性方法(包括但不限于使用親和柱或離子交換柱)來純化目的肽、多肽或蛋白質(zhì)。

本發(fā)明還涉及用于制備上述宿主細(xì)胞的方法。

本發(fā)明用于制備宿主細(xì)胞的方法包括在宿主細(xì)胞的基因組中插入至少一個(gè)拷貝，優(yōu)選兩個(gè)拷貝的編碼毒物蛋白的核酸序列。優(yōu)選地，所述毒物蛋白是CcdB，更優(yōu)選地，所述編碼毒物蛋白的核酸序列是SEQ ID NO:1。

在一個(gè)實(shí)施方案中，本發(fā)明用于制備宿主細(xì)胞的方法包括缺失步驟，其中缺失宿主細(xì)胞中的核酸序列。

用于插入或缺失基因序列的方法是本領(lǐng)域技術(shù)人員公知的。更高效的方法是由λRed編碼基因或者來自原噬菌體Rac的recE和recT基因介導(dǎo)的同源重組。一些研究人員已經(jīng)對(duì)該方法進(jìn)行了充分描述，包括Datsenko和Wanner(PNAS 97-12,6640-6645,2000)；以及Stewart等(WO0104288)。使用具有與待缺失基因相鄰的區(qū)域同源或其中將插入核酸序列的區(qū)域同源的20-nt至60-nt延伸序列的引物來產(chǎn)生PCR引物。由于只要少數(shù)細(xì)菌有效地使目的片段重組，因此必需具有強(qiáng)選擇標(biāo)記來對(duì)其進(jìn)行選擇?？墒褂每股貥?biāo)記來選擇重組子：使用經(jīng)修飾的引物來擴(kuò)增抗生素抗性基因。在轉(zhuǎn)化和活化重組基因之后，在包含合適抗生素的培養(yǎng)基上選擇重組細(xì)菌。在此情況下，抗生素抗性基因替代所靶向的基因或區(qū)域。為了使用相同的策略來進(jìn)行接下來的缺失，必需在第二步驟期間去除該抗生素抗性基因。如Datsenko和Wanner中所述的，可使用以FRT(FLP識(shí)別靶標(biāo))位點(diǎn)為側(cè)翼的抗生素抗性基因。然后，通過使用編碼FLP重組酶的輔助質(zhì)粒來消除抗性基因。該位點(diǎn)特異性重組酶去除抗生素抗性基因，但是該方法留有痕跡：在去除抗生素抗性基因之后仍然存在一個(gè)位點(diǎn)特異性重組位點(diǎn)。

為了避免該位點(diǎn)的存在，更優(yōu)選地，本發(fā)明的方法使用galK作為標(biāo)記基因。galK選擇的原理在Warming等(Nucleic acid research,2005,33(4))中進(jìn)行了描述。該方法在第一重組(插入)期間使用galK作為陽性選擇標(biāo)記(在包含半乳糖的基本培養(yǎng)基上生長)。在第二同源重組步驟期間進(jìn)行該標(biāo)記的去除。在該步驟期間，使用galK作為包含2-脫氧-半乳糖(DOG)的基本培養(yǎng)基上的陰性選擇標(biāo)記。galK基因產(chǎn)物半乳糖激酶催化半乳糖降解途徑中的第一步驟。半乳糖激酶還有效地催化DOG半乳糖類似物的磷酸化。該反應(yīng)的產(chǎn)物不能進(jìn)一步代謝，從而導(dǎo)致毒性分子(2-脫氧-半乳糖-1-磷酸)累積。該方法的優(yōu)勢是避免在缺失所靶向的基因和去除選擇標(biāo)記之后存在特異性重組位點(diǎn)。

在一個(gè)實(shí)施方案中，本發(fā)明的方法還包括通過上述經(jīng)遺傳修飾的噬菌體來感染宿主細(xì)胞的步驟。在本發(fā)明的一個(gè)實(shí)施方案中，所述感染步驟包括使用輔助噬菌體。在本發(fā)明的含義中，術(shù)語“輔助噬菌體”指用于補(bǔ)充其他噬菌體的缺失或失活的噬菌體。輔助噬菌體將提供所述其他噬菌體缺失的功能以能夠感染細(xì)菌或者制備噬菌體貯存液。通常來說，輔助噬菌體由于沒有cI而自身不能形成溶原體(其不具有阻遏物，因此具有毒性)。

使用輔助噬菌體來用噬菌體感染宿主細(xì)胞的方法在本領(lǐng)域中是公知的。在一個(gè)實(shí)施方案中，第一步驟是制備裂解液，第二步驟是溶原化。簡言之，可使用如“Molecular cloning:a laboratory manual”,Sambrook等(2001,ISBN 978-087969577-4)或“Large-and Small-Scale Preparation of Bacteriophage lambda lysate and DNA”,Su等,BioTechniques 25:44-46(1998年7月)中所述的標(biāo)準(zhǔn)方法來制備輔助噬菌體的細(xì)菌裂解液。在噬菌體誘導(dǎo)(最經(jīng)常使用UV照射，或者溶原體經(jīng)受DNA損傷或宿主的SOS應(yīng)答或Cro生產(chǎn)的任何情形)之后可使用相同原理來進(jìn)行目的噬菌體的制備以啟動(dòng)裂解循環(huán)，并且使用輔助噬菌體以提供缺失的功能。輔助噬菌體的替代方案是使用編碼缺失功能的質(zhì)粒。

接著，將噬菌體裂解液與所靶向的細(xì)菌混合并鋪板在LB板上以獲得溶原體(如Novagen,User Protocol TB031的λDE3溶原化試劑盒中所述的，或者Studier和Moffat,Journal of Molecular Biology,1986,189:113-130中描述了替代方法)。可使用選擇噬菌體來特異性地選擇包含目的噬菌體的細(xì)菌。該選擇噬菌體是與目的噬菌體具有相同免疫性的烈性噬菌體。因此，選擇噬菌體不能夠形成噬菌斑或者殺死目的噬菌體的溶原體，因?yàn)樵撌删w生產(chǎn)cI阻遏物(在λDE3噬菌體中還稱為C2)。

在一個(gè)實(shí)施方案中，本發(fā)明的方法還包括用上述攜帶以下的載體，優(yōu)選質(zhì)粒轉(zhuǎn)化本發(fā)明的宿主細(xì)胞：(1)編碼針對(duì)毒物蛋白的解毒劑的核酸序列；和(2)編碼目的肽、多肽或蛋白質(zhì)的核酸序列。用于用載體轉(zhuǎn)化細(xì)胞的方法在本領(lǐng)域中是公知的，并且包括但不限于化學(xué)轉(zhuǎn)化和電穿孔。

因此，使用本發(fā)明宿主細(xì)胞來生產(chǎn)目的肽、多肽或蛋白質(zhì)的方法提供以下優(yōu)勢：

-其可應(yīng)用于任何肽、多肽或蛋白質(zhì)，甚至應(yīng)用于對(duì)宿主細(xì)胞具有毒性的肽、多肽或蛋白質(zhì)；

-其可應(yīng)用于任何宿主細(xì)胞，因?yàn)樵谒拗骷?xì)胞的基因組中插入ccdB基因?qū)夹g(shù)人員而言是容易的；

-如下文的實(shí)施例中所示，其導(dǎo)致目的肽、多肽或蛋白質(zhì)的生產(chǎn)產(chǎn)率提高；

-如下文的實(shí)施例中所示，其實(shí)現(xiàn)提高包含編碼目的肽、多肽或蛋白質(zhì)的載體的穩(wěn)定性，尤其是當(dāng)目的肽、多肽或蛋白質(zhì)對(duì)宿主細(xì)胞具有毒性時(shí)；以及

-在一些實(shí)施方案中，其不包括使用抗生素，并且宿主細(xì)胞和載體二者均不包含抗生素抗性基因。

附圖簡述

圖1是pVHH6載體的圖譜。

圖2是顯示在pVHH6ΔKan誘導(dǎo)24小時(shí)之后對(duì)W3110ccdB菌株的PCR篩選的照片。將誘導(dǎo)后的培養(yǎng)物在沒有抗生素的平板上劃線，并且對(duì)20個(gè)菌落進(jìn)行PCR。示出了關(guān)于VHH6(A)、ccdB(B)和菌株特異性(C)基因的PCR結(jié)果。左側(cè)的箭頭顯示PCR產(chǎn)物的預(yù)期大小。上端箭頭顯示ccdB變化。

圖3是顯示在SDS-PAGE上比較W3110pVHH6、W3110ccdB pVHH6ΔKan和W31102ccdB pVHH6ΔKan菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間觀察到差異，但是在誘導(dǎo)樣品(矩形)之間尤其如此。

圖4是pTraG載體的圖譜。

圖5是顯示在SDS-PAGE上比較3110ccdB pTraG和W31102ccdB pTraG菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間，觀察到差異，但是在誘導(dǎo)樣品之間未觀察到差異。

圖6是兩張照片的組合，所述兩張照片顯示通過考馬斯藍(lán)染色(左)或通過Western印跡(右)在SDS-PAGE上比較W3110pD1.3、W3110ccdB pD1.3ccdAΔAmp和W31102ccdB pD1.3ccdAΔAmp菌株的生產(chǎn)。通過Western印跡在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間充分觀察到差異。

圖7是顯示在pStaby1.2 TraG誘導(dǎo)24小時(shí)之后對(duì)SE3(BL21(DE3)2ccdB)菌株的篩選PCR的照片。將誘導(dǎo)后的培養(yǎng)物在皮氏培養(yǎng)皿上劃線，并且對(duì)22個(gè)菌落進(jìn)行PCR。示出了關(guān)于TraG(A)、ccdA(B)、第一ccdB(C)和第二ccdB(D)基因的PCR結(jié)果。左側(cè)的箭頭顯示PCR產(chǎn)物的預(yù)期大小。

圖8是顯示SE1 pStabyTraG和SE4(BL21(DE3)2ccdB 2gyrA)pStabyTraG菌株的生產(chǎn)比較的SDS-PAGE凝膠照片。在未誘導(dǎo)和誘導(dǎo)(I)樣品之觀察到差異。

圖9是顯示在SDS-PAGE上比較W3110ccdB pVHH6ΔKan、W31102ccdB pVHH6ΔKan和W31102ccdB 2gyrA pVHH6ΔKan菌株的生產(chǎn)的照片。在未誘導(dǎo)(NI)和誘導(dǎo)(I)樣品之間觀察到差異，但是在誘導(dǎo)樣品之間尤其如此。

實(shí)施例

通過以下實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步說明。

實(shí)施例1：ccdB基因的重復(fù)提高產(chǎn)率

為了測試由技術(shù)(基于在宿主染色體中插入一個(gè)拷貝的ccdB基因的技術(shù)，Delphi Genetics,產(chǎn)品,專利WO9958652)生產(chǎn)的穩(wěn)定性，我們生產(chǎn)了似乎在大腸桿菌中也具有毒性特性的分泌蛋白(稱為VHH6的可變重鏈抗體片段)。使用W3110大腸桿菌菌株(遺傳背景：大腸桿菌K12,基因型:F^-λ^-INV(rrnD-rrnE)rph-1)作為生產(chǎn)者宿主并且在pBR322載體上用pTrc啟動(dòng)子來實(shí)現(xiàn)表達(dá)((pVHH6；圖6)。將使用典型抗生素穩(wěn)定系統(tǒng)(在此為卡那霉素抗性)的W3110菌株的生產(chǎn)與已進(jìn)行修飾使用技術(shù)的W3110ccdB菌株(ccdB基因引入到菌株染色體內(nèi))的生產(chǎn)進(jìn)行比較。用于這一比較的載體二者均包含ccdA基因，并且W3110ccdB中使用的載體缺失卡那霉素抗性基因(pVHH6ΔKan)。

在具有或不具有抗生素下在LB培養(yǎng)基(10ml)中于30℃下培養(yǎng)菌株，并且當(dāng)OD₆₀₀達(dá)到0.5時(shí)誘導(dǎo)(0,5mM IPTG)4小時(shí)。盡管在這些溫和誘導(dǎo)條件下兩種選擇系統(tǒng)都具有100％的質(zhì)粒穩(wěn)定性，但是當(dāng)通過SDS-PAGE進(jìn)行分析時(shí)沒有明顯的生產(chǎn)。如下施加更強(qiáng)的誘導(dǎo)條件(在基于灌注的連續(xù)發(fā)酵之后)。在500ml發(fā)酵罐中培養(yǎng)菌株，并通過灌注來使OD₆₀₀恒定維持在0.3：在發(fā)酵罐中添加新鮮培養(yǎng)基(多至5l)并除去溢流液以使OD₆₀₀一直維持至0.3。在灌注5l之后，OD₆₀₀增加，并且當(dāng)培養(yǎng)物達(dá)到OD₆₀₀為0.5時(shí)，最終實(shí)現(xiàn)誘導(dǎo)24小時(shí)。當(dāng)使用抗生素選擇系統(tǒng)來穩(wěn)定表達(dá)載體時(shí)，通過將細(xì)菌鋪板在含有或不含合適抗生素(根據(jù)質(zhì)粒編碼的抗性基因)的平板上來確定最終的質(zhì)粒穩(wěn)定性。使用不具有抗生素的平板來確定細(xì)菌的總數(shù)并使用含有抗生素的平板來確定仍包含質(zhì)粒的細(xì)菌的數(shù)量。

經(jīng)評(píng)價(jià)，使用抗生素的細(xì)菌的質(zhì)粒穩(wěn)定性為約0％(在含有抗生素的平板上無菌落)。

當(dāng)使用基于ccdA和ccdB的系統(tǒng)時(shí)，不存在抗生素抗性基因。因此，通過PCR來測試質(zhì)粒的存在或不存在。由于我們使用的是系統(tǒng)，因此我們假設(shè)：由于選擇性ccdB基因存在于細(xì)菌染色體中，ccdA解毒劑基因存在于質(zhì)粒中，因此在平板上生長的所有細(xì)菌均應(yīng)含有該質(zhì)粒。出乎意料的是，通過對(duì)菌落的PCR實(shí)驗(yàn)，我們觀察到約65％的穩(wěn)定性(圖2B)。事實(shí)上，雖然穩(wěn)定性顯著提高，但是這是首次技術(shù)未實(shí)現(xiàn)100％穩(wěn)定性。

此外，在保留的65％中，在所有的受試質(zhì)粒中目的基因(VHH6基因)均通過部分或完全缺失而突變(圖2A)。提取高于預(yù)期的ccdB PCR條帶并測序。測序結(jié)果顯示：小插入序列(insAB)的插入(SEQ ID NO:16)使ccdB基因失活。根據(jù)菌株特異性PCR結(jié)果(圖2C)，除ccdB基因之外的未擴(kuò)增條帶可能歸因于ccdB區(qū)中的大缺失或插入。已重復(fù)該實(shí)驗(yàn)并且觀察到等同結(jié)果。

因此，必需改進(jìn)技術(shù)以避免這種穩(wěn)定系統(tǒng)失活。在yjjK和slt基因之間插入第二拷貝的毒物基因(生產(chǎn)W31102ccdB菌株)。選擇這些基因是因?yàn)樗麄兿鄬?duì)于第一ccdB基因位置在大腸桿菌染色體的相對(duì)位點(diǎn)，并且因?yàn)榛蜷g間隔似乎是非編碼的。

為了比較W3110、W3110ccdB和W31102ccdB菌株中的生產(chǎn)，應(yīng)用以下方案。在10ml LB培養(yǎng)基中于37℃下過夜培養(yǎng)單菌落。次日，使用每份培養(yǎng)物中的1μl來接種10ml新鮮LB培養(yǎng)基。在37℃下過夜培養(yǎng)培養(yǎng)物。在此重復(fù)該步驟以進(jìn)行額外的傳代(如在發(fā)酵罐中實(shí)現(xiàn)的)。次日，使用每份培養(yǎng)物中的10μl來接種10ml新鮮LB培養(yǎng)基。在30℃下培養(yǎng)培養(yǎng)物，并在OD₆₀₀ 0.5時(shí)誘導(dǎo)24小時(shí)。在所有這些步驟期間僅對(duì)W3110菌株使用卡那霉素。盡管使用該抗生素來維持表達(dá)質(zhì)粒，在誘導(dǎo)之后其穩(wěn)定性仍為約0％。另一方面，在這一較為溫和的方案之下，兩種系統(tǒng)(即，具有1或2個(gè)ccdB基因)的質(zhì)粒穩(wěn)定性為約100％：對(duì)ccdB基因和質(zhì)粒ccdA基因進(jìn)行的每個(gè)PCR均在預(yù)期大小處。對(duì)于W31102ccdB培養(yǎng)物，僅一些VHH6基因被突變(27％)。

還通過考馬斯藍(lán)SDS-PAGE來比較生產(chǎn)(圖3)。出乎意料的是，W31102ccdB菌株的產(chǎn)率遠(yuǎn)遠(yuǎn)高于其他菌株(VHH6＝27kDa)。這種產(chǎn)率提高已經(jīng)在使用技術(shù)但是僅具有一個(gè)ccdB拷貝時(shí)被報(bào)道過(Peubez等,Microbial Cell Factories 2010,9:65；Sodoyer et al.,In:Antibiotic Resistant Bacteria-A Continuous Challenge in the New Millennium 2012)。在此，盡管在具有一個(gè)拷貝的ccdB基因的細(xì)菌中質(zhì)粒是穩(wěn)定的且存在的，但是令人吃驚的是只有在存在兩個(gè)拷貝的ccdB時(shí)才發(fā)生產(chǎn)率提高。

實(shí)施例2：2ccdB技術(shù)生產(chǎn)其他蛋白質(zhì)的應(yīng)用

為了測試具有兩個(gè)ccdB基因拷貝的菌株是否能夠用于所有蛋白質(zhì)(包括在僅一個(gè)ccdB拷貝下已得到良好表達(dá)的蛋白質(zhì))，我們測試了70kDa的TraG蛋白的生產(chǎn)(Szpirer等,2000,Mol.Microbiol.37(6)1283-1292)。構(gòu)建具有編碼解毒劑CcdA和TraG(pTraG)的質(zhì)粒的W3110(DE3)ccdB和W3110(DE3)2ccdB菌株(圖4)。traG基因在T7啟動(dòng)子控制之下。這些菌株和質(zhì)粒使用技術(shù)來穩(wěn)定質(zhì)粒。第一觀察結(jié)果是：在編碼ccdA的質(zhì)粒存在下，兩個(gè)拷貝的ccdB基因存在既不影響W3110菌株的生存力，也不影響其生長。質(zhì)粒中的一個(gè)拷貝的ccdA基因足以獲得完全生存力。

TraG在典型系統(tǒng)(1個(gè)ccdB基因)下的生產(chǎn)等同于在新系統(tǒng)(2個(gè)ccdB基因)的生產(chǎn)(圖5)。然而，1個(gè)ccdB下的生產(chǎn)已經(jīng)提供非常優(yōu)良的產(chǎn)率，因此，提高該差率可能是不可能的，甚至通過應(yīng)用新系統(tǒng)也如此。

為了確定我們之前的結(jié)果，已實(shí)現(xiàn)另一生產(chǎn)。選擇抗體片段作為模型(重鏈和輕鏈為D1.3＝24kDa，相關(guān)鏈為50kDa)并使用Para啟動(dòng)子(阿拉伯糖誘導(dǎo))來進(jìn)行表達(dá)。已使載體(pBAD24)適用于包含ccdB基因的菌株(插入ccdA并且缺失氨芐青霉素抗性基因)。

如圖6中所示，通過使用1或2個(gè)ccdB基因，產(chǎn)率得到強(qiáng)烈提高，但是我們并未在兩種菌株之間觀察到差異(包括生長和速度)。

總而言之，具有2個(gè)拷貝的ccdB基因的菌株的使用可用于生產(chǎn)任何蛋白質(zhì)。然而，產(chǎn)率優(yōu)勢取決于每種蛋白質(zhì)，并且當(dāng)在使用僅1個(gè)拷貝ccdB時(shí)產(chǎn)率就已經(jīng)非常高時(shí)，編碼2個(gè)拷貝的菌株提供相同的結(jié)果。由于當(dāng)工業(yè)生產(chǎn)者和研究人員在其開始實(shí)驗(yàn)時(shí)并不知道某一蛋白質(zhì)是否會(huì)難以生產(chǎn)，因此能夠?qū)Φ湫偷鞍踪|(zhì)和生產(chǎn)困難的蛋白質(zhì)使用相同菌株并且一開始就使用針對(duì)最難蛋白質(zhì)設(shè)計(jì)的菌株是一項(xiàng)優(yōu)勢。

實(shí)施例3：2ccdB技術(shù)在其他宿主菌株中生產(chǎn)蛋白質(zhì)的應(yīng)用

大腸桿菌菌株分為K12型和B型。由于W3110菌株是一種K12菌株時(shí)，因此測試了2ccdB技術(shù)對(duì)B菌株的適用性。因此，向大腸桿菌B(BL21(DE3)型–遺傳背景:大腸桿菌B–基因型F–ompT gal dcm lon hsdS_B(r_B-mB-)λ(DE3[lacI lacUV5-T7基因1]))的基因組中引入兩個(gè)ccdB拷貝以得到SE3菌株。然后，實(shí)現(xiàn)灌注發(fā)酵以在幾代之后生產(chǎn)TraG蛋白。誘導(dǎo)24小時(shí)之后的質(zhì)粒穩(wěn)定性為100％(圖7)。在這些表達(dá)條件下，每個(gè)ccdB基因都是完整的。

在具有以下基因型的另一K12衍生菌株中獲得類似的結(jié)果：F-endA1 glnV44 thi-1 recA1 relA1 gyrA96 deoR nupGΦ80dlacZΔM15Δ(lacZYA-argF)U169,hsdR17(rK-mK+),λ–,dcm::FRTccdB yjjK::FRTccdB。該菌株由DH5α在其中如上所述插入2個(gè)拷貝ccdB基因而衍生。

這些結(jié)果表明可構(gòu)建包含插入兩個(gè)拷貝的ccdB基因的不同大腸桿菌菌株。這些2個(gè)拷貝的存在不是有害的。

實(shí)施例4：gyrA基因的復(fù)制

如前所述，技術(shù)基于CcdB蛋白對(duì)大腸桿菌的毒性。當(dāng)CcdA解毒劑抑制ccdB基因的表達(dá)時(shí)，不對(duì)該毒素基因施加選擇壓力。因此，不可能發(fā)現(xiàn)一些針對(duì)CcdB的大腸桿菌抗性菌株。然而，已通過在誘變劑存在下施加幾輪生長人工分離到這種抗性株((Bernard等,J Mol Biol.1992,226:735)。這種抗性菌株顯示出gyrA基因(CcdB的靶標(biāo))的突變，將精氨酸462改變成半胱氨酸。

在我們的毒性蛋白模型VHH6的表達(dá)期間(參見實(shí)施例1)，已分離到具有野生型ccdB基因但不具有質(zhì)粒(也就是ccdA基因)的菌株。因此，這些菌株對(duì)CcdB具有抗性。對(duì)這些菌株中的gyrA基因進(jìn)行測序確定精氨酸462被修飾成另一尚未描述的氨基酸(絲氨酸)。

通過如該專利中所述復(fù)制ccdB基因，我們猜測對(duì)gyrA基因的選擇壓力將增加并且更容易產(chǎn)生CcdB抗性菌株。為了避免這些突變體，已實(shí)現(xiàn)了gyrA基因的復(fù)制。通過轉(zhuǎn)導(dǎo)被用作重組臂的同源區(qū)包圍的包含gyrA、卡那霉素和ccdB基因的DNA片段來在SE2菌株中在yjjK基因和slt基因之間整合第二拷貝(在同一插入中)的同時(shí)整合該新gyrA拷貝。使用卡那霉素抗性基因來選擇重組事件。該基因的周圍是兩個(gè)FRT位點(diǎn)，允許使用FLP重組酶來將其去除。該構(gòu)建已成功完成并且菌株的生存力未改變。如實(shí)施例2中測試TraG表達(dá)的能力并且用稱為E4的SE2菌株衍生株(BL21(DE3)2ccdB 2gyrA)來進(jìn)行。

如圖8所示，TraG在典型系統(tǒng)(1個(gè)ccdB基因)下的生產(chǎn)等同于在新系統(tǒng)(2個(gè)ccdB基因+1個(gè)額外gyrA拷貝)下的生產(chǎn)。然而，在1個(gè)ccdB下的生產(chǎn)已經(jīng)實(shí)現(xiàn)非常好的產(chǎn)率，因此該產(chǎn)率可能不能得到提高，甚至通過應(yīng)用新系統(tǒng)也如此。我們可觀察到，添加2個(gè)ccdB和1個(gè)額外拷貝的gyrA(已經(jīng)存在1個(gè)拷貝)由于CcdB毒物蛋白的較高毒性而不降低蛋白質(zhì)的量。

向大腸桿菌W3110衍生株(稱為KW4:W31102ccdB 2gyrA的菌株)施加類似的遺傳修飾。比較該菌株與其他W3110菌株的毒性蛋白模型VHH6的生產(chǎn)。在生產(chǎn)之后，針對(duì)質(zhì)粒的存在來測試每種菌株并且在所有菌株中均觀察到100％保留。如圖9中所示，當(dāng)存在2個(gè)拷貝的ccdB基因時(shí)，CHH6的生產(chǎn)更佳(圖9)。此外，如對(duì)SE4菌株所描述的，添加2個(gè)ccdB和1個(gè)額外拷貝的gyrA(已經(jīng)存在1個(gè)拷貝)不降低蛋白質(zhì)的量并且不影響生長能力。

實(shí)施例5：來自大腸桿菌O157的ccdB的用途

為了驗(yàn)證可在2ccdB系統(tǒng)中使用來自除F質(zhì)粒之外的其他來源的ccdB基因拷貝，我們構(gòu)建了包含來自大腸桿菌O157:H7的ccdB拷貝的菌株。選擇大腸桿菌O157:H7的ccdB基因是因?yàn)?1)其與來自F質(zhì)粒的ccdB基因僅具有36％同源性(在氨基酸水平)，(2)其被來自F質(zhì)粒的相同CcdA蛋白抑制。

首先，構(gòu)建包含ccdBO157基因和卡那霉素基因的DNA片段，所述卡那霉素抗性基因的周圍是2個(gè)FRT位點(diǎn)，允許在將該DNA片段插入細(xì)菌基因組中之后切除該抗性基因。將這一構(gòu)建體連接在質(zhì)粒中并轉(zhuǎn)化在B462(由于存在gyrA462突變而對(duì)CcdB具有抗性的菌株)中。接著，該片段插入在包含在Pbad啟動(dòng)子控制之下編碼ccdA的質(zhì)粒的大腸桿菌W3110的yjjK和slt基因之間在去除抗性基因之后生產(chǎn)新KW5菌株(W3110 yjjK::FRTccdBO157)。該菌株像WT菌株一樣生長，并且如所預(yù)期的當(dāng)Pbad啟動(dòng)子受到阻遏(在阿拉伯糖不存在下)時(shí)ccdB_O157基因殺死細(xì)菌。這些結(jié)果表明，可使用ccdB_O157基因來構(gòu)建菌株。CcdB_O157蛋白產(chǎn)物被F質(zhì)粒CcdA抵消并且可用于本發(fā)明中。

實(shí)施例6：本發(fā)明宿主細(xì)胞的其他修飾

接下來，我們測試了2ccdB系統(tǒng)對(duì)包含經(jīng)遺傳修飾噬菌體的細(xì)菌菌株的適用性，所述遺傳修飾噬菌體含有表達(dá)系統(tǒng)并且其中缺失Q、S、R和Rz基因。這些基因的缺失防止當(dāng)發(fā)生噬菌體偶然重新活化時(shí)裂解宿主細(xì)胞。

在SE2菌株(BL21(DE3)dcm::FRTccdB)中轉(zhuǎn)導(dǎo)包含具有2個(gè)FRT位點(diǎn)的卡那霉素抗性基因且被Q、S、R和Rz基因的邊界區(qū)域包圍以允許通過同源重組使它們?nèi)笔У腄NA片段(如先前WO2013004817中所述)以在除去卡那霉素抗性基因之后產(chǎn)生菌株BL21(DE3)dcm::FRTccdB QSRRz::FRT。接著，在BL21(DE3)dcm::FRTccdB QSRRz::FRT中轉(zhuǎn)導(dǎo)編碼yjjK::FRTkanFRTccdB的另一片段以在去除卡那霉素抗性基因后產(chǎn)生SE5[BL21(DE3)dcm::FRTccdB yjjK::FRTccdB QSRRz::FRT]。該最終菌株如上所述包含2個(gè)ccdB基因并且缺失Q、S、R、Rz基因，從而避免細(xì)菌裂解。

將SE5菌株與其未經(jīng)修飾的QSSRz同源菌株(SE3)進(jìn)行比較。以與SE1菌株的相同速率生長，并且對(duì)照蛋白(TraG)的生產(chǎn)也提供相同結(jié)果。

序列表

<110> 德爾菲遺傳學(xué)公司

<120> 用于生產(chǎn)蛋白質(zhì)的經(jīng)改進(jìn)的宿主細(xì)胞

<130> CV - 357/PCT

<160> 19

<170> BiSSAP 1.3

<210> 1

<211> 306

<212> DNA

<213> 大腸桿菌

<220>

<223> ccdB

<400> 1

atgcagttta aggtttacac ctataaaaga gagagccgtt atcgtctgtt tgtggatgta 60

cagagtgata ttattgacac gcccgggcga cggatggtga tccccctggc cagtgcacgt 120

ctgctgtcag ataaagtctc ccgtgaactt tacccggtgg tgcatatcgg ggatgaaagc 180

tggcgcatga tgaccaccga tatggccagt gtgccggtct ccgttatcgg ggaagaagtg 240

gctgatctca gccaccgcga aaatgacatc aaaaacgcca ttaacctgat gttctgggga 300

atataa 306

<210> 2

<211> 2244

<212> DNA

<213> 大腸桿菌

<220>

<223> tonA DNA

<400> 2

atggcgcgtt ccaaaactgc tcagccaaaa cactcactgc gtaaaatcgc agttgtagta 60

gccacagcgg ttagcggcat gtctgtttat gcacaggcag cggttgaacc gaaagaagac 120

actatcaccg ttaccgctgc acctgcgccg caagaaagcg catgggggcc tgctgcaact 180

attgcggcgc gacagtctgc taccggcact aaaaccgata cgccgattca aaaagtgcca 240

cagtctattt ctgttgtgac cgccgaagag atggcgctgc atcagccgaa gtcggtaaaa 300

gaagcgctta gctacacgcc gggtgtctct gttggtacgc gtggcgcatc caacacctat 360

gaccacctga tcattcgcgg ctttgcggca gaaggccaaa gccagaataa ctatctgaat 420

ggcctgaagt tgcagggcaa cttctataac gatgcggtca ttgacccgta tatgctggaa 480

cgcgctgaaa ttatgcgtgg cccggtttcc gtgctttacg gtaaaagcag tcctggcggc 540

ctgttgaata tggtcagcaa gcgtccgacc accgaaccgc tgaaagaagt tcagtttaaa 600

gccggtactg acagcctgtt ccagactggt tttgacttta gcgattcgtt ggatgatgac 660

ggtgtttact cttatcgcct gaccggtctt gcgcgttctg ccaatgccca gcagaaaggg 720

tcagaagagc agcgttatgc tattgcaccg gcgttcacct ggcgtccgga tgataaaacc 780

aattttacct tcctttctta cttccagaac gagccggaaa ccggttatta cggctggttg 840

ccgaaagagg gaaccgttga gccgctgccg aacggtaagc gtctgccgac agactttaat 900

gaaggggcga agaacaacac ctattctcgt aatgagaaga tggtcggcta cagcttcgat 960

cacgaattta acgacacctt tactgtgcgt cagaacctgc gctttgctga aaacaaaacc 1020

tcgcaaaaca gcgtttatgg ttacggcgtc tgctccgatc cggcgaatgc ttacagcaaa 1080

cagtgtgcgg cattagcgcc agcggataaa ggccattatc tggcacgtaa atacgtcgtt 1140

gatgatgaga agctgcaaaa cttctccgtt gatacccagt tgcagagcaa gtttgccact 1200

ggcgatatcg accacaccct gctgaccggt gtcgacttta tgcgtatgcg taatgacatc 1260

aacgcctggt ttggttacga cgactctgtg ccactgctca atctgtacaa tccggtgaat 1320

accgatttcg acttcaatgc caaagatccg gcaaactccg gcccttaccg cattctgaat 1380

aaacagaaac aaacgggcgt ttatgttcag gatcaggcgc agtgggataa agtgctggtc 1440

accctaggcg gtcgttatga ctgggcagat caagaatctc ttaaccgcgt tgccgggacg 1500

accgataaac gtgatgacaa acagtttacc tggcgtggtg gtgttaacta cctgtttgat 1560

aatggtgtaa caccttactt cagctatagc gaatcgtttg aaccttcttc gcaagttggg 1620

aaggatggta atattttcgc accgtctaaa ggtaagcagt atgaagtcgg cgtgaaatat 1680

gtaccggaag atcgtccgat tgtagttact ggtgccgtgt ataatctcac taaaaccaac 1740

aacctgatgg cggaccctga gggttccttc ttctcggttg aaggtggcga gatccgcgca 1800

cgtggcgtag aaatcgaagc gaaagcggcg ctgtcggcga gtgttaacgt agtcggttct 1860

tatacttaca ccgatgcgga atacaccacc gatactacct ataaaggcaa tacgcctgca 1920

caggtgccaa aacacatggc ttcgttgtgg gctgactaca ccttctttga cggtccgctt 1980

tcaggtctga cgctgggcac cggtggtcgt tatactggct ccagttatgg tgatccggct 2040

aactccttta aagtgggaag ttatacggtc gtggatgcgt tagtacgtta tgatctggcg 2100

cgagtcggca tggctggctc caacgtggcg ctgcatgtta acaacctgtt cgatcgtgaa 2160

tacgtcgcca gctgctttaa cacttatggc tgcttctggg gcgcagaacg tcaggtcgtt 2220

gcaaccgcaa ccttccgttt ctaa 2244

<210> 3

<211> 1149

<212> DNA

<213> 大腸桿菌

<220>

<223> galK DNA

<400> 3

atgagtctga aagaaaaaac acaatctctg tttgccaacg catttggcta ccctgccact 60

cacaccattc aggcgcctgg ccgcgtgaat ttgattggtg aacacaccga ctacaacgac 120

ggtttcgttc tgccctgcgc gattgattat caaaccgtga tcagttgtgc accacgcgat 180

gaccgtaaag ttcgcgtgat ggcagccgat tatgaaaatc agctcgacga gttttccctc 240

gatgcgccca ttgtcgcaca tgaaaactat caatgggcta actacgttcg tggcgtggtg 300

aaacatctgc aactgcgtaa caacagcttc ggcggcgtgg acatggtgat cagcggcaat 360

gtgccgcagg gtgccgggtt aagttcttcc gcttcactgg aagtcgcggt cggaaccgta 420

ttgcagcagc tttatcatct gccgctggac ggcgcacaaa tcgcgcttaa cggtcaggaa 480

gcagaaaacc agtttgtagg ctgtaactgc gggatcatgg atcagctaat ttccgcgctc 540

ggcaagaaag atcatgcctt gctgatcgat tgccgctcac tggggaccaa agcagtttcc 600

atgcccaaag gtgtggctgt cgtcatcatc aacagtaact tcaaacgtac cctggttggc 660

agcgaataca acacccgtcg tgaacagtgc gaaaccggtg cgcgtttctt ccagcagcca 720

gccctgcgtg atgtcaccat tgaagagttc aacgctgttg cgcatgaact ggacccgatc 780

gtggcaaaac gcgtgcgtca tatactgact gaaaacgccc gcaccgttga agctgccagc 840

gcgctggagc aaggcgacct gaaacgtatg ggcgagttga tggcggagtc tcatgcctct 900

atgcgcgatg atttcgaaat caccgtgccg caaattgaca ctctggtaga aatcgtcaaa 960

gctgtgattg gcgacaaagg tggcgtacgc atgaccggcg gcggatttgg cggctgtatc 1020

gtcgcgctga tcccggaaga gctggtgcct gccgtacagc aagctgtcgc tgaacaatat 1080

gaagcaaaaa caggtattaa agagactttt tacgtttgta aaccatcaca aggagcagga 1140

cagtgctga 1149

<210> 4

<211> 1701

<212> DNA

<213> 大腸桿菌

<220>

<223> araB DNA

<400> 4

atggcgattg caattggcct cgattttggc agtgattctg tgcgagcttt ggcggtggac 60

tgcgctaccg gtgaagagat cgccaccagc gtagagtggt atccccgttg gcagaaaggg 120

caattttgtg atgccccgaa taaccagttc cgtcatcatc cgcgtgacta cattgagtca 180

atggaagcgg cactgaaaac cgtgcttgca gagcttagcg tcgaacagcg cgcagctgtg 240

gtcgggattg gcgttgacag taccggctcg acgcccgcac cgattgatgc cgacggaaac 300

gtgctggcgc tgcgcccgga gtttgccgaa aacccgaacg cgatgttcgt attgtggaaa 360

gaccacactg cggttgaaga agcggaagag attacccgtt tgtgccacgc gccgggcaac 420

gttgactact cccgctacat tggtggtatt tattccagcg aatggttctg ggcaaaaatc 480

ctgcatgtga ctcgccagga cagcgccgtg gcgcaatctg ccgcatcgtg gattgagctg 540

tgcgactggg tgccagctct gctttccggt accacccgcc cgcaggatat tcgtcgcgga 600

cgttgcagcg ccgggcataa atctctgtgg cacgaaagct ggggcggcct gccgccagcc 660

agtttctttg atgagctgga cccgatcctc aatcgccatt tgccttcccc gctgttcact 720

gacacttgga ctgccgatat tccggtgggc accttatgcc cggaatgggc gcagcgtctc 780

ggcctgcctg aaagcgtggt gatttccggc ggcgcgtttg actgccatat gggcgcagtt 840

ggcgcaggcg cacagcctaa cgcactggta aaagttatcg gtacttccac ctgcgacatt 900

ctgattgccg acaaacagag cgttggcgag cgggcagtta aaggtatttg cggtcaggtt 960

gatggcagcg tggtgcctgg atttatcggt ctggaagcag gccaatcggc gtttggtgat 1020

atctacgcct ggtttggtcg cgtactcggc tggccgctgg aacagcttgc cgcccagcat 1080

ccggaactga aaacgcaaat caacgccagc cagaaacaac tgcttccggc gctgaccgaa 1140

gcatgggcca aaaatccgtc tctggatcac ctgccggtgg tgctcgactg gtttaacggc 1200

cgccgcacac cgaacgctaa ccaacgcctg aaaggggtga ttaccgatct taacctcgct 1260

accgacgctc cgctgctgtt cggcggtttg attgctgcca ccgcctttgg cgcacgcgca 1320

atcatggagt gctttaccga tcaggggatc gccgttaata acgtgatggc actgggcggc 1380

atcgcgcgga aaaaccaggt cattatgcag gcctgctgcg acgtgctgaa tcgcccgctg 1440

caaattgttg cctctgacca gtgctgtgcg ctcggtgcgg cgatttttgc tgccgtcgcc 1500

gcgaaagtgc acgcagacat cccatcagct cagcaaaaaa tggccagtgc ggtagagaaa 1560

accctgcaac cgtgcagcga gcaggcacaa cgctttgaac agctttatcg ccgctatcag 1620

caatgggcga tgagcgccga acaacactat cttccaactt ccgccccggc acaggctgcc 1680

caggccgttg cgactctata a 1701

<210> 5

<211> 1503

<212> DNA

<213> 大腸桿菌

<220>

<223> araA DNA

<400> 5

atgacgattt ttgataatta tgaagtgtgg tttgtcattg gcagccagca tctgtatggc 60

ccggaaaccc tgcgtcaggt cacccaacat gccgagcacg tcgttaatgc gctgaatacg 120

gaagcgaaac tgccctgcaa actggtgttg aaaccgctgg gcaccacgcc ggatgaaatc 180

accgctattt gccgcgacgc gaattacgac gatcgttgcg ctggtctggt ggtgtggctg 240

cacaccttct ccccggccaa aatgtggatc aacggcctga ccatgctcaa caaaccgttg 300

ctgcaattcc acacccagtt caacgcggcg ctgccgtggg acagtatcga tatggacttt 360

atgaacctga accagactgc acatggcggt cgcgagttcg gcttcattgg cgcgcgtatg 420

cgtcagcaac atgccgtggt taccggtcac tggcaggata aacaagccca tgagcgtatc 480

ggctcctgga tgcgtcaggc ggtctctaaa caggataccc gtcatctgaa agtctgccga 540

tttggcgata acatgcgtga agtggcggtc accgatggcg ataaagttgc cgcacagatc 600

aagttcggtt tctccgtcaa tacctgggcg gttggcgatc tggtgcaggt ggtgaactcc 660

atcagcgacg gcgatgttaa cgcgctggtc gatgagtacg aaagctgcta caccatgacg 720

cctgccacac aaatccacgg caaaaaacga cagaacgtgc tggaagcggc gcgtattgag 780

ctggggatga agcgtttcct ggaacaaggt ggcttccacg cgttcaccac cacctttgaa 840

gatttgcacg gtctgaaaca gcttcctggt ctggccgtac agcgtctgat gcagcagggt 900

tacggctttg cgggcgaagg cgactggaaa actgccgccc tgcttcgcat catgaaggtg 960

atgtcaaccg gtctgcaggg cggcacctcc tttatggagg actacaccta tcacttcgag 1020

aaaggtaatg acctggtgct cggctcccat atgctggaag tctgcccgtc gatcgccgca 1080

gaagagaaac cgatcctcga cgttcagcat ctcggtattg gtggtaagga cgatcctgcc 1140

cgcctgatct tcaataccca aaccggccca gcgattgtcg ccagcttgat tgatctcggc 1200

gatcgttacc gtctactggt taactgcatc gacacggtga aaacaccgca ctccctgccg 1260

aaactgccgg tggcgaatgc gctgtggaaa gcgcaaccgg atctgccaac tgcttccgaa 1320

gcgtggatcc tcgctggtgg cgcgcaccat accgtcttca gccatgcact gaacctcaac 1380

gatatgcgcc aattcgccga gatgcacgac attgaaatca cggtgattga taacgacaca 1440

cgcctgccag cgtttaaaga cgcgctgcgc tggaacgaag tgtattacgg gtttcgtcgc 1500

taa 1503

<210> 6

<211> 2355

<212> DNA

<213> 大腸桿菌

<220>

<223> lon DNA

<400> 6

atgaatcctg agcgttctga acgcattgaa atccccgtat tgccgctgcg cgatgtggtg 60

gtttatccgc acatggtcat ccccttattt gtcgggcggg aaaaatctat ccgttgtctg 120

gaagcggcga tggaccatga taaaaaaatt atgctggtcg cgcagaaaga agcttcaacg 180

gatgagccgg gtgtaaacga tcttttcacc gtcgggaccg tggcctctat attgcagatg 240

ctgaaactgc ctgacggcac cgtcaaagtg ctggtcgagg ggttacagcg cgcgcgtatt 300

tctgcgctct ctgacaatgg cgaacacttt tctgcgaagg cggagtatct ggagtcgccg 360

accattgatg agcgggaaca ggaagtgctg gtgcgtactg caatcagcca gttcgaaggc 420

tacatcaagc tgaacaaaaa aatcccacca gaagtgctga cgtcgctgaa tagcatcgac 480

gatccggcgc gtctggcgga taccattgct gcacatatgc cgctgaaact ggctgacaaa 540

cagtctgttc tggagatgtc cgacgttaac gaacgtctgg aatatctgat ggcaatgatg 600

gaatcggaaa tcgatctgct gcaggttgag aaacgcattc gcaaccgcgt taaaaagcag 660

atggagaaat cccagcgtga gtactatctg aacgagcaaa tgaaagctat tcagaaagaa 720

ctcggtgaaa tggacgacgc gccggacgaa aacgaagccc tgaagcgcaa aatcgacgcg 780

gcgaagatgc cgaaagaggc aaaagagaaa gcggaagcag agttgcagaa gctgaaaatg 840

atgtctccga tgtcggcaga agcgaccgta gtgcgtggtt atatcgactg gatggtacag 900

gtgccgtgga atgcgcgtag caaggtcaaa aaagacctgc gtcaggcgca ggaaatcctt 960

gataccgacc attatggtct ggagcgcgtg aaagatcgaa tccttgagta tcttgcggtt 1020

caaagccgtg tcaacaaaat caagggaccg atcctctgcc tggtagggcc gccgggggta 1080

ggtaaaacct ctcttggtca gtccattgcc aaagccaccg ggcgtaaata tgtccgtatg 1140

gcgctgggcg gcgtgcgtga tgaagcggaa atccgtggtc accgccgtac ttacatcggt 1200

tctatgccgg gtaaactgat ccagaaaatg gcgaaagtgg gcgtgaaaaa cccgctgttc 1260

ctgctcgatg agatcgacaa aatgtcttct gacatgcgtg gcgatccggc ctctgcactg 1320

cttgaagtgc tggatccaga gcagaacgta gcgttcagcg accactacct ggaagtggat 1380

tacgatctca gcgacgtgat gtttgtcgcg acgtcgaact ccatgaacat tccggcaccg 1440

ctgctggatc gtatggaagt gattcgcctc tccggttata ccgaagatga aaaactgaac 1500

atcgccaaac gtcacctgct gccgaagcag attgaacgta atgcactgaa aaaaggtgag 1560

ctgaccgtcg acgatagcgc cattatcggc attattcgtt actacacccg tgaggcgggc 1620

gtgcgtggtc tggagcgtga aatctccaaa ctgtgtcgca aagcggttaa gcagttactg 1680

ctcgataagt cattaaaaca tatcgaaatt aacggcgata acctgcatga ctatctcggt 1740

gttcagcgtt tcgactatgg tcgcgcggat aacgaaaacc gtgtcggtca ggtaaccggt 1800

ctggcgtgga cggaagtggg cggtgacttg ctgaccattg aaaccgcatg tgttccgggt 1860

aaaggcaaac tgacctatac cggttcgctc ggcgaagtga tgcaggagtc cattcaggcg 1920

gcgttaacgg tggttcgtgc gcgtgcggaa aaactgggga tcaaccctga tttttacgaa 1980

aaacgtgaca tccacgtcca cgtaccggaa ggtgcgacgc cgaaagatgg tccgagtgcc 2040

ggtattgcta tgtgcaccgc gctggtttct tgcctgaccg gtaacccggt tcgtgccgat 2100

gtggcaatga ccggtgagat cactctgcgt ggtcaggtac tgccgatcgg tggtttgaaa 2160

gaaaaactcc tggcagcgca tcgcggcggg attaaaacag tgctaattcc gttcgaaaat 2220

aaacgcgatc tggaagagat tcctgacaac gtaattgccg atctggacat tcatcctgtg 2280

aagcgcattg aggaagttct gactctggcg ctgcaaaatg aaccgtctgg tatgcaggtt 2340

gtgactgcaa aatag 2355

<210> 7

<211> 954

<212> DNA

<213> 大腸桿菌

<220>

<223> ompT DNA

<400> 7

atgcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60

tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120

ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180

caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240

atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300

atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360

caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420

ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480

tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540

ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600

attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660

agcggctggg tggaatcatc tgataacgat gaacactatg acccgggaaa aagaatcact 720

tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780

gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840

ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900

ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954

<210> 8

<211> 624

<212> DNA

<213> 大腸桿菌

<220>

<223> rcsA DNA

<400> 8

atgtcaacga ttattatgga tttatgtagt tacacccgac taggtttaac cgggtatctg 60

ttgagtagag gggttaaaaa aagagaaatc aacgacattg aaaccgttga tgaccttgcc 120

atagcttgtg attcacagcg cccttcagtg gtgtttatta atgaggactg tttcatccac 180

gatgcttcta acagtcagcg tatcaagctc atcattaatc aacatcccaa tacgttattt 240

atcgttttta tggcaattgc caatgttcat tttgatgaat atctattggt cagaaaaaat 300

ttattgatca gttctaaatc gattaaaccg gaatctctcg acgatatcct tggcgatatt 360

ctgaaaaaag agacaacgat aacctcgttt ttaaatatgc cgacgttatc attgagccga 420

accgaatcga gtatgttgcg aatgtggatg gcaggtcagg gaaccattca aatctctgac 480

caaatgaata tcaaagccaa gaccgtttca tcgcataaag gtaatattaa acgtaagatc 540

aaaacgcata ataaacaggt tatctaccat gtcgtccgac tgacggataa tgtgactaat 600

ggtatttttg tcaacatgcg ctaa 624

<210> 9

<211> 3567

<212> DNA

<213> 大腸桿菌

<220>

<223> hsdR DNA

<400> 9

atgttatggg ccttaaatat ttggacaggc ccgcacagca atggattaat aacaatgatg 60

aataaatcca attttgaatt cctgaagggc gtcaacgact tcacttatgc catcgcctgt 120

gcggcggaaa ataactaccc ggatgatccc aacacgacgc tgattaaaat gcgtatgttt 180

ggcgaagcca cagcgaaaca tcttggtctg ttactcaaca tccccccttg tgagaatcaa 240

cacgatctcc tgcgtgaact cggcaaaatc gcctttgttg atgacaacat cctctctgta 300

tttcacaaat tacgccgcat tggtaaccag gcggtgcacg aatatcataa cgatctcaac 360

gatgcccaga tgtgcctgcg actcgggttc cgcctggctg tctggtacta ccgtctggtc 420

actaaagatt atgacttccc ggtgccggtg tttgtgttgc cggaacgtgg tgaaaacctc 480

tatcaccagg aagtgctgac gctaaaacaa cagcttgaac agcaggtgcg agaaaaagcg 540

cagactcagg cagaagtcga agcgcaacag cagaagctgg ttgccctgaa cggctatatc 600

gccattctgg aaggcaaaca gcaggaaacc gaagcgcaaa cccaggctcg ccttgcggca 660

ctggaagcac agctcgccga gaagaacgcg gaactggcaa aacagaccga acaggaacgt 720

aaggcttacc acaaagaaat taccgatcag gccatcaagc gcacactcaa ccttagcgaa 780

gaagagagtc gcttcctgat tgatgcgcaa ctgcgtaaag caggctggca ggccgacagc 840

aaaaccctgc gcttctccaa aggcgcacgt ccggaacccg gcgtcaataa agccattgcc 900

gaatggccga ccggaaaaga tgaaacgggt aatcagggct ttgcggatta tgtgctgttt 960

gtcggcctca aacccatcgc ggtggtagag gcgaaacgta acaatatcga cgttcccgcc 1020

aggctcaatg agtcgtatcg ctacagtaaa tgtttcgata atggcttcct gcgggaaacc 1080

ttgcttgagc actactcacc ggatgaagtg catgaagcag tgccagagta tgaaaccagc 1140

tggcaggaca ccagcggcaa acaacggttt aaaatcccct tctgctactc gaccaacggg 1200

cgcgaatacc gcgcaacaat gaagaccaaa agcggcatct ggtatcgcga cgtgcgtgat 1260

acccgcaata tgtcgaaagc cttacccgag tggcaccgcc cggaagagct gctggaaatg 1320

ctcggcagcg aaccgcaaaa acagaatcag tggtttgccg ataaccctgg catgagcgag 1380

ctgggcctgc gttattatca ggaagatgcc gtccgcgcgg ttgaaaaggc aatcgtcaag 1440

gggcaacaag agatcctgct ggcgatggcg accggtaccg gtaaaacccg tacggcaatc 1500

gccatgatgt tccgcctgat ccagtcccag cgttttaaac gcattctctt ccttgtcgac 1560

cgccgttctc ttggcgaaca ggcgctgggc gcgtttgaag atacgcgtat taacggcgac 1620

accttcaaca gcattttcga cattaaaggg ctgacggata aattcccgga agacagcacc 1680

aaaattcacg ttgccaccgt acagtcgctg gtgaaacgca ccctgcaatc agatgaaccg 1740

atgccggtgg cccgttacga ctgtatcgtc gttgacgaag cgcatcgcgg ctatattctc 1800

gataaagagc agaccgaagg cgaactgcag ttccgcagcc agctggatta cgtctctgcc 1860

taccgtcgca ttctcgatca cttcgatgcg gtaaaaatcg ctctcaccgc caccccggcg 1920

ctacatactg tgcagatttt cggcgagccg gtttaccgtt atacctaccg taccgcggtt 1980

atcgacggtt ttctgatcga ccaggatccg cctattcaga tcatcacccg caacgcgcag 2040

gagggggttt atctctccaa aggcgagcag gtagagcgca tcagcccgca gggagaagtg 2100

atcaatgaca ccctggaaga cgatcaggat tttgaagtcg ccgactttaa ccgtggcctg 2160

gtgatcccgg cgtttaaccg cgccgtctgt aacgaactca ccaattatct tgacccgacc 2220

ggatcgcaaa aaacgctggt cttctgcgtc accaatgccc atgccgatat ggtggtggaa 2280

gagctgcgtg ccgcgttcaa gaaaaagtat ccgcaactgg agcacgacgc gatcatcaag 2340

atcaccggtg atgccgataa agacgcgcgc aaagtgcaga ccatgatcac ccgcttcaat 2400

aaagagcggc tgcccaatat cgtggtaacc gtcgacctgc tgacgaccgg cgtcgatatt 2460

ccgtcgatct gtaatatcgt gttcctgcgt aaagtacgca gccgcattct gtacgaacag 2520

atgaaaggcc gcgccacgcg cttatgcccg gaggtgaata aaaccagctt taagattttt 2580

gactgtgtcg atatctacag cacgctggag agcgtcgaca ccatgcgtcc ggtggtggtg 2640

cgcccgaagg tggaactgca aacgctggtc aatgaaatta ccgattcaga aacctataaa 2700

atcaccgaag cggatggccg cagttttgcc gagcacagcc atgaacaact ggtggcgaag 2760

ctccagcgta tcatcggtct ggccacgttt aaccgtgacc gcagcgaaac gatagataaa 2820

caggtgcgtc gtctggatga gctatgccag gacgcggcgg gcgtgaactt taacggcttc 2880

gcctcgcgcc tgcgggaaaa agggccgcac tggagcgccg aagtctttaa caaactgcct 2940

ggctttatcg cccgtctgga aaagctgaaa acggacatca acaacctgaa tgatgcgccg 3000

atcttcctcg atatcgacga tgaagtggtg agtgtaaaat cgctgtacgg tgattacgac 3060

acgccgcagg atttcctcga agcctttgac tcgctggtgc aacgttcccc gaacgcgcaa 3120

ccggcattgc aggcagttat taatcgcccg cgcgatctca cccgtaaagg gctggtcgag 3180

ctacaggagt ggtttgaccg ccagcacttt gaggaatctt ccctgcgcaa agcatggaaa 3240

gagacgcgca atgaagatat cgccgcccgg ctgattggtc atattcgccg cgctgcggtg 3300

ggcgatgcgc tgaaaccgtt tgaggaacgt gtcgatcacg cgctgacgcg cattaagggc 3360

gaaaacgact ggagcagcga gcaattaagc tggctcgatc gtttagcgca ggcgctgaaa 3420

gagaaagtgg tgctcgacga cgatgtcttc aaaaccggca acttccaccg tcgcggcggg 3480

aaggcgatgc tgcaaagaac ctttgacgat aatctcgata ccctgctggg caaattcagc 3540

gattatatct gggacgagct ggcctga 3567

<210> 10

<211> 915

<212> DNA

<213> 大腸桿菌

<220>

<223> mrr DNA

<400> 10

atgacggttc ctacctatga caaatttatt gaacctgttc tgcgttatct ggcaacaaaa 60

ccggaaggtg cagccgcgcg tgatgttcat gaggctgccg cggatgcatt aggactggat 120

gacagccagc gagcgaaagt cattaccagc ggacaacttg tttataaaaa tcgtgcaggc 180

tgggcgcatg accgtttaaa acgtgccggg ttgtcgcaaa gtttgtcgcg tggcaaatgg 240

tgcctgactc ctgcgggttt tgactgggtt gcgtctcatc cccagccaat gacggagcag 300

gagacgaacc atctggcctt cgcttttgtg aatgtcaaac ttaagtcacg gccggatgcc 360

gtcgatttag atccgaaagc cgactctccc gatcatgaag aacttgcaaa gagcagcccg 420

gacgatcggt tagatcaggc gctaaaagag cttcgtgatg cggtggctga tgaggttctg 480

gaaaacttat tgcaggtttc tccttcgcgc tttgaagtca ttgttctgga tgttttgcat 540

cgcctggggt atggcggcca ccgtgatgat ttgcagcgtg ttggcggtac tggagatggt 600

ggcatcgatg gtgtgatatc gcttgataaa cttggcctgg agaaagttta tgttcaggca 660

aaacgttggc agaatactgt aggcaggcca gaattacagg cattttacgg cgcactggct 720

gggcaaaaag cgaaacgtgg ggtgtttatt accacttctg gatttacttc tcaggcgcgt 780

gactttgccc aatccgtcga gggtatggtg ttggttgatg gggaacgcct ggtgcactta 840

atgatcgaaa acgaagtagg ggtttcttca cgtttgttga aggtgccgaa actggatatg 900

gactattttg agtga 915

<210> 11

<211> 708

<212> DNA

<213> 大腸桿菌

<220>

<223> endA DNA

<400> 11

atgtaccgtt atttgtctat tgctgcggtg gtactgagcg cagcattttc cggcccggcg 60

ttggccgaag gtatcaatag tttttctcag gcgaaagccg cggcggtaaa agtccacgct 120

gacgcgcccg gtacgtttta ttgcggatgt aaaattaact ggcagggcaa aaaaggcgtt 180

gttgatctgc aatcgtgcgg ctatcaggtg cgcaaaaatg aaaaccgcgc cagccgcgta 240

gagtgggaac atgtcgttcc cgcctggcag ttcggtcacc agcgccagtg ctggcaggac 300

ggtggacgta aaaactgcgc taaagatccg gtctatcgca agatggaaag cgatatgcat 360

aacctgcagc cgtcagtcgg tgaggtgaat ggcgatcgcg gcaactttat gtacagccag 420

tggaatggcg gtgaaggcca gtacggtcaa tgcgccatga aggtcgattt caaagaaaaa 480

gctgccgaac caccagcgcg tgcacgcggt gccattgcgc gcacctactt ctatatgcgc 540

gaccaataca acctgacact ctctcgccag caaacgcagc tgttcaacgc atggaacaag 600

atgtatccgg ttaccgactg ggagtgcgag cgcgatgaac gcatcgcgaa ggtgcagggc 660

aatcataacc cgtatgtgca acgcgcttgc caggcgcgaa agagctaa 708

<210> 12

<211> 1062

<212> DNA

<213> 大腸桿菌

<220>

<223> recA DNA

<400> 12

atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60

caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120

atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180

cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240

atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300

gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360

gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420

gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480

ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540

ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600

ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660

tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720

agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780

ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840

aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900

cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960

gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020

gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062

<210> 13

<211> 219

<212> DNA

<213> 大腸桿菌

<220>

<223> CcdA DNA

<400> 13

atgaagcagc gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat 60

gatgtcaata tctccggtct ggtaagcaca accatgcaga atgaagcccg tcgtctgcgt 120

gccgaacgct ggaaagcgga aaatcaggaa gggatggctg aggtcgcccg gtttattgaa 180

atgaacggct cttttgctga cgagaacagg gactggtga 219

<210> 14

<211> 29865

<212> DNA

<213> 人工序列

<220>

<223> 噬菌體P11

<400> 14

gcttttttat actaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 60

caggtcacta tcagtcaaaa taaaatcatt atttgatttc aattttgtcc cactccctgc 120

ctctgtcatc acgatactgt gatgccatgg tgtccgactt atgcccgaga agatgttgag 180

caaacttatc gcttatctgc ttctcataga gtcttgcaga caaactgcgc aactcgtgaa 240

aggtaggcgg atccagatcc cggacaccat cgaatggcgc aaaacctttc gcggtatggc 300

atgatagcgc ccggaagaga gtcaattcag ggtggtgaat gtgaaaccag taacgttata 360

cgatgtcgca gagtatgccg gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc 420

cagccacgtt tctgcgaaaa cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta 480

cattcccaac cgcgtggcac aacaactggc gggcaaacag tcgttgctga ttggcgttgc 540

cacctccagt ctggccctgc acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc 600

cgatcaactg ggtgccagcg tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg 660

taaagcggcg gtgcacaatc ttctcgcgca acgcgtcagt gggctgatca ttaactatcc 720

gctggatgac caggatgcca ttgctgtgga agctgcctgc actaatgttc cggcgttatt 780

tcttgatgtc tctgaccaga cacccatcaa cagtattatt ttctcccatg aagacggtac 840

gcgactgggc gtggagcatc tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg 900

cccattaagt tctgtctcgg cgcgtctgcg tctggctggc tggcataaat atctcactcg 960

caatcaaatt cagccgatag cggaacggga aggcgactgg agtgccatgt ccggttttca 1020

acaaaccatg caaatgctga atgagggcat cgttcccact gcgatgctgg ttgccaacga 1080

tcagatggcg ctgggcgcaa tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga 1140

tatctcggta gtgggatacg acgataccga agacagctca tgttatatcc cgccgttaac 1200

caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct tgctgcaact 1260

ctctcagggc caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa 1320

aaccaccctg gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1380

gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 1440

taagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa 1500

tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 1560

gattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 1620

aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 1680

gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgctttgc ctggtttccg 1740

gcaccagaag cggtgccgga aagctggctg gagtgcgatc ttcctgaggc cgatactgtc 1800

gtcgtcccct caaactggca gatgcacggt tacgatgcgc ccatctacac caacgtgacc 1860

tatcccatta cggtcaatcc gccgtttgtt cccacggaga atccgacggg ttgttactcg 1920

ctcacattta atgttgatga aagctggcta caggaaggcc agacgcgaat tatttttgat 1980

ggcgtcggga tctgatccgg atttactaac tggaagaggc actaaatgaa cacgattaac 2040

atcgctaaga acgacttctc tgacatcgaa ctggctgcta tcccgttcaa cactctggct 2100

gaccattacg gtgagcgttt agctcgcgaa cagttggccc ttgagcatga gtcttacgag 2160

atgggtgaag cacgcttccg caagatgttt gagcgtcaac ttaaagctgg tgaggttgcg 2220

gataacgctg ccgccaagcc tctcatcact accctactcc ctaagatgat tgcacgcatc 2280

aacgactggt ttgaggaagt gaaagctaag cgcggcaagc gcccgacagc cttccagttc 2340

ctgcaagaaa tcaagccgga agccgtagcg tacatcacca ttaagaccac tctggcttgc 2400

ctaaccagtg ctgacaatac aaccgttcag gctgtagcaa gcgcaatcgg tcgggccatt 2460

gaggacgagg ctcgcttcgg tcgtatccgt gaccttgaag ctaagcactt caagaaaaac 2520

gttgaggaac aactcaacaa gcgcgtaggg cacgtctaca agaaagcatt tatgcaagtt 2580

gtcgaggctg acatgctctc taagggtcta ctcggtggcg aggcgtggtc ttcgtggcat 2640

aaggaagact ctattcatgt aggagtacgc tgcatcgaga tgctcattga gtcaaccgga 2700

atggttagct tacaccgcca aaatgctggc gtagtaggtc aagactctga gactatcgaa 2760

ctcgcacctg aatacgctga ggctatcgca acccgtgcag gtgcgctggc tggcatctct 2820

ccgatgttcc aaccttgcgt agttcctcct aagccgtgga ctggcattac tggtggtggc 2880

tattgggcta acggtcgtcg tcctctggcg ctggtgcgta ctcacagtaa gaaagcactg 2940

atgcgctacg aagacgttta catgcctgag gtgtacaaag cgattaacat tgcgcaaaac 3000

accgcatgga aaatcaacaa gaaagtccta gcggtcgcca acgtaatcac caagtggaag 3060

cattgtccgg tcgaggacat ccctgcgatt gagcgtgaag aactcccgat gaaaccggaa 3120

gacatcgaca tgaatcctga ggctctcacc gcgtggaaac gtgctgccgc tgctgtgtac 3180

cgcaaggaca aggctcgcaa gtctcgccgt atcagccttg agttcatgct tgagcaagcc 3240

aataagtttg ctaaccataa ggccatctgg ttcccttaca acatggactg gcgcggtcgt 3300

gtttacgctg tgtcaatgtt caacccgcaa ggtaacgata tgaccaaagg actgcttacg 3360

ctggcgaaag gtaaaccaat cggtaaggaa ggttactact ggctgaaaat ccacggtgca 3420

aactgtgcgg gtgtcgataa ggttccgttc cctgagcgca tcaagttcat tgaggaaaac 3480

cacgagaaca tcatggcttg cgctaagtct ccactggaga acacttggtg ggctgagcaa 3540

gattctccgt tctgcttcct tgcgttctgc tttgagtacg ctggggtaca gcaccacggc 3600

ctgagctata actgctccct tccgctggcg tttgacgggt cttgctctgg catccagcac 3660

ttctccgcga tgctccgaga tgaggtaggt ggtcgcgcgg ttaacttgct tcctagtgaa 3720

accgttcagg acatctacgg gattgttgct aagaaagtca acgagattct acaagcagac 3780

gcaatcaatg ggaccgataa cgaagtagtt accgtgaccg atgagaacac tggtgaaatc 3840

tctgagaaag tcaagctggg cactaaggca ctggctggtc aatggctggc ttacggtgtt 3900

actcgcagtg tgactaagcg ttcagtcatg acgctggctt acgggtccaa agagttcggc 3960

ttccgtcaac aagtgctgga agataccatt cagccagcta ttgattccgg caagggtctg 4020

atgttcactc agccgaatca ggctgctgga tacatggcta agctgatttg ggaatctgtg 4080

agcgtgacgg tggtagctgc ggttgaagca atgaactggc ttaagtctgc tgctaagctg 4140

ctggctgctg aggtcaaaga taagaagact ggagagattc ttcgcaagcg ttgcgctgtg 4200

cattgggtaa ctcctgatgg tttccctgtg tggcaggaat acaagaagcc tattcagacg 4260

cgcttgaacc tgatgttcct cggtcagttc cgcttacagc ctaccattaa caccaacaaa 4320

gatagcgaga ttgatgcaca caaacaggag tctggtatcg ctcctaactt tgtacacagc 4380

caagacggta gccaccttcg taagactgta gtgtgggcac acgagaagta cggaatcgaa 4440

tcttttgcac tgattcacga ctccttcggt accattccgg ctgacgctgc gaacctgttc 4500

aaagcagtgc gcgaaactat ggttgacaca tatgagtctt gtgatgtact ggctgatttc 4560

tacgaccagt tcgctgacca gttgcacgag tctcaattgg acaaaatgcc agcacttccg 4620

gctaaaggta acttgaacct ccgtgacatc ttagagtcgg acttcgcgtt cgcgtaacgc 4680

caaatcaata cgactccgga tccccttcga aggaaagacc tgatgctttt cgtgcgcgca 4740

taaaatacct tgatactgtg ccggatgaaa gcggttcgcg acgagtagat gcaattatgg 4800

tttctccgcc aagaatctct ttgcatttat caagtgtttc cttcattgat attccgagag 4860

catcaatatg caatgctgtt gggatggcaa tttttacgcc tgttttgctt tgctcgacat 4920

aaagatatcc atctacgata tcagaccact tcatttcgca taaatcacca actcgttgcc 4980

cggtaacaac agccagttcc attgcaagtc tgagccaaca tggtgatgat tctgctgctt 5040

gataaatttt caggtattcg tcagccgtaa gtcttgatct ccttacctct gattttgctg 5100

cgcgagtggc agcgacatgg tttgttgtta tatggccttc agctattgcc tctcggaatg 5160

catcgctcag tgttgatctg attaacttgg ctgacgccgc cttgccctcg tctatgtatc 5220

cattgagcat tgccgcaatt tcttttgtgg tgatgtcttc aagtggagca tcaggcagac 5280

ccctccttat tgctttaatt ttgctcatgt aatttatgag tgtcttctgc ttgattcctc 5340

tgctggccag gattttttcg tagcgatcaa gccatgaatg taacgtaacg gaattatcac 5400

tgttgattct cgctgtcaga ggcttgtgtt tgtgtcctga aaataactca atgttggcct 5460

gtatagcttc agtgattgcg attcgcctgt ctctgcctaa tccaaactct ttacccgtcc 5520

ttgggtccct gtagcagtaa tatccattgt ttcttatata aaggttaggg ggtaaatccc 5580

ggcgctcatg acttcgcctt cttcacactg gagggcaaag aagatttcca ataatcagaa 5640

caagtcggct cctgtttagt tacgagcgac attgctccgt gtattcactc gttggaatga 5700

atacacagtg cagtgtttat tctgttattt atgccaaaaa taaaggccac tatcaggcag 5760

ctttgttgtt ctgtttacca agttctctgg caatcattgc cgtcgttcgt attgcccatt 5820

tatcgacata tttcccatct tccattacag gaaacatttc ttcaggctta accatgcatt 5880

ccgattgcag cttgcatcca ttgcatcgct tgaattgtcc acaccattga tttttatcaa 5940

tagtcgtagt catacggata gtcctggtat tgttccatca catcctgagg atgctcttcg 6000

aactcttcaa attcttcttc catatatcac ctcaaataag tggtttgctg cctaatttaa 6060

ttttctggcg accaacacaa gtcacaccca tttcactgcg tggcttgctg tagtaaatac 6120

ggttctgttt acgctcgact tcttctgcct tcttgcagcg aaggcttccg agtgatgctg 6180

ctttatctgc tctgacgcaa ccagagagct ttagcgcaat ttttcgcgcc agtgcttcat 6240

tactgcgtcg ctcggcaata agttctgctc tgcgagcttt gtagcggctt tttgccgtac 6300

ctttggattc tttccagaca atggttacca tgatggtctc ctttaagtgg ctttggcgca 6360

tgacgcgtcg aggtgcttat cttctcgatc gctgtcttgt agctgcaatt cgcgccatcc 6420

ccaaaaccac tcaagttctg gtctcaacgg ttaggttgag agtccgtcga tgttaaagag 6480

cctgccaatc tgttccgttt ggcttccagc gtcctgctga tggcttaaat ttaagacttc 6540

ttaatttatt ggtcaagtgc atttttgaag aaaacttaat tttatgggcg tgaatttagt 6600

ttgtctttga tttttaacgg gaaataaaaa aggggcgaaa gccccttaag gaaggtttgc 6660

tagcttggca tcaacgacaa cgccaatgat tttacagttc ccattgattt caatcattgg 6720

gtattgtgga ttgagtggtt tcaggaattt tctaccggca tcaataacta actttttgaa 6780

tgtcgcctcg ttttctcctt caagtttggc gactaccagc tttccattac gtggttcgac 6840

ttctgggtcg acgagaataa tcatcccctc aggaatactc agtcctgccg gggcagtcat 6900

tgaatcgcct ttaacgtcga gccaaaaaga gtcttcagaa caatctaccg ttgtgtcgta 6960

ccagttatct attgcacgcc tatgatatgg ctctacagct tccatccaac atcctgcgct 7020

tacccaacta attagaggat acgaacctct tggatcatgc ctgctgtgat aggcaatgtt 7080

tgaaagacta tcctctcctt tcaacaggta atcaggggag cactgcaaag ccttggctaa 7140

ggccaatagg ttttcgccat tgggctcagt ttcagatcgc tcccattggg aaatagcaac 7200

attagacacg ccaaccatct tgccaagggc agcctgccta atcttgagtt cttttctgcg 7260

agcgcgaata cgctcaccca tcagttgtgt attcatagtt aagacatctt aaataaactt 7320

gacttaagat tcctttggtg gataatttaa gtgttcttta atttcggagc gagtctatgt 7380

acaaaaaaga tgttattgac cacttcggaa cccagcgtgc tgttgctaaa gcactaggca 7440

ttagcgatgc agcagtctct cagtggaaag aagttatccc agagaaagac gcctatcgat 7500

tggaaatcgt tacagctggc gccctgaagt atcaagaaag tgcttaccgc caagcggcat 7560

aagcaaattg ctctttaaca gttctggcct ttcacctcta accgggtgag caaacatcag 7620

cggcaaatcc attgggtgtg ccgctataac tcaatatcaa tataggtaaa ttaacaaatg 7680

gcacaagcaa gctacagcaa gccaacacag cgagaaattg atcgcgctga aactgattta 7740

ctcatcaacc tgtcaacgct tacccagcgc ggtctggcaa agatgattgg ctgtcatgaa 7800

tcgaagataa gcagaacgga ctggagattt attgcttcgg tcttgtgtgc tttcggaatg 7860

gcatcagaca tcagtccgat tagcagggct tttaagtatg cgcttgatgg actcacaaag 7920

aaaaaacgcc cggtgtgcaa gaccgagcgt tctgaacaaa tccagatgga gttctgaggt 7980

cattactgga tctatcaaca ggagtcatta tgacaaatac agcaaaaata ctcaacttcg 8040

gcagaggtaa ctttgccgga caggagcgta atgtggcaga tctcgatgat ggttacgcca 8100

gactatcaaa tatgctgctt gaggcttatt cgggcgcaga tctgaccaag cgacagttta 8160

aagtgctgct tgccattctg cgtaaaacct atgggtggaa taaaccaatg gacagaatca 8220

ccgattctca acttagcgag attacaaagt tacctgtcaa acggtgcaat gaagccaagt 8280

tagaactcgt cagaatgaat attatcaagc agcaaggcgg catgtttgga ccaaataaaa 8340

acatctcaga atggtgtatc cctcaaaacg agggaaaatc ccctaaaacg agggataaaa 8400

catccctcaa attgggggat tgctatccct caaaacaggg ggacacaaaa gacactatta 8460

caaaagaaaa aagaaaagat tattcgtcag agaattctgg cgaatcctct gaccagccag 8520

aaaacgacct ttctgtggtg aaaccggatg ctgcaattca gagcggcagc aagtggggga 8580

cagcagaaga cctgaccgcc gcagagtgga tgtttgacat ggtgaagact atcgcaccat 8640

cagccagaaa accgaatttt gctgggtggg ctaacgatat ccgcctgatg cgtgaacgtg 8700

acggacgtaa ccaccgcgac atgtgtgtgc tgttccgctg ggcatgccag gacaacttct 8760

ggtccggtaa cgtgctgagc ccggccaaac tccgcgataa gtggacccaa ctcgaaatca 8820

accgtaacaa gcaacaggca ggcgtgacag ccagcaaacc aaaactcgac ctgacaaaca 8880

cagactggat ttacggggtg gatctatgaa aaacatcgcc gcacagatgg ttaactttga 8940

ccgtgagcag atgcgtcgga tcgccaacaa catgccggaa cagtacgacg aaaagccgca 9000

ggtacagcag gtagcgcaga tcatcaacgg tgtgttcagc cagttactgg caactttccc 9060

ggcgagcctg gctaaccgtg accagaacga agtgaacgaa atccgtcgcc agtgggttct 9120

ggcttttcgg gaaaacggga tcaccacgat ggaacaggtt aacgcaggaa tgcgcgtagc 9180

ccgtcggcag aatcgaccat ttctgccatc acccgggcag tttgttgcat ggtgccggga 9240

agaagcatcc gttaccgccg gactgccaaa cgtcagcgag ctggttgata tggtttacga 9300

gtattgccgg aagcgaggcc tgtatccgga tgcggagtct tatccgtgga aatcaaacgc 9360

gcactactgg ctggttacca acctgtatca gaacatgcgg gccaatgcgc ttactgatgc 9420

ggaattacgc cgtaaggccg cagatgagct tgtccatatg actgcgagaa ttaaccgtgg 9480

tgaggcgatc cctgaaccag taaaacaact tcctgtcatg ggcggtagac ctctaaatcg 9540

tgcacaggct ctggcgaaga tcgcagaaat caaagctaag ttcggactga aaggagcaag 9600

tgtatgacgg gcaaagaggc aattattcat tacctgggga cgcataatag cttctgtgcg 9660

ccggacgttg ccgcgctaac aggcgcaaca gtaaccagca taaatcaggc cgcggctaaa 9720

atggcacggg caggtcttct ggttatcgaa ggtaaggtct ggcgaacggt gtattaccgg 9780

tttgctacca gggaagaacg ggaaggaaag atgagcacga acctgatgaa caaactggat 9840

acgattggat tcgacaacaa aaaagacctg cttatctcgg tgggcgattt ggttgatcgt 9900

ggtgcagaga acgttgaatg cctggaatta atcacattcc cctggttcag agctgtacgt 9960

ggaaaccatg agcaaatgat gattgatggc ttatcagagc gtggaaacgt taatcactgg 10020

ctgcttaatg gcggtggctg gttctttaat ctcgattacg acaaagaaat tctggctaaa 10080

gctcttgccc ataaagcaga tgaacttccg ttaatcatcg aactggtgag caaagataaa 10140

aaatatgtta tctgccacgc cgattatccc tttgacgaat acgagtttgg aaagccagtt 10200

gatcatcagc aggtaatctg gaaccgcgaa cgaatcagca actcacaaaa cgggatcgtg 10260

aaagaaatca aaggcgcgga cacgttcatc tttggtcata cgccagcagt gaaaccactc 10320

aagtttgcca accaaatgta tatcgatacc ggcgcagtgt tctgcggaaa cctaacattg 10380

attcaggtac agggagaagg cgcatgagac tcgaaagcgt agctaaattt cattcgccaa 10440

aaagcccgat gatgagcgac tcaccacggg ccacggcttc tgactctctt tccggtactg 10500

atgtgatggc tgctatgggg atggcgcaat cacaagccgg attcggtatg gctgcattct 10560

gcggtaagca cgaactcagc cagaacgaca aacaaaaggc tatcaactat ctgatgcaat 10620

ttgcacacaa ggtatcgggg aaataccgtg gtgtggcata tcttgaagga aatactaagg 10680

caaaggtact gcaagtgctc gcaacattcg cttatgcgga ttattgccgt agtgccgcga 10740

cgccgggggc aagatgcaga gattgccatg gtacaggccg tgcggttgat attgccaaaa 10800

cagagctgtg ggggagagtt gtcgagaaag agtgcggaag atgcaaaggc gtcggctatt 10860

caaggatgcc agcaagcgca gcatatcgcg ctgtgacgat gctaatccca aaccttaccc 10920

aacccacctg gtcacgcact gttaagccgc tgtatgacgc tctggtggtg caatgccaca 10980

aagaagagtc aatcgcagac aacattttga atgcggtcac acgttagcag catgattgcc 11040

acggatggca acatattaac ggcatgatat tgacttattg aataaaattg ggtaaatttg 11100

actcaacgat gggttaattc gctcgttgtg gtagtgagat gaaaagaggc ggcgcttact 11160

accgattccg cctagttggt cacttcgacg tatcgtctgg aactccaacc atcgcaggca 11220

gagaggtctg caaaatgcaa tcccgaaaca gttcgcaggt aatagttaga gcctgcataa 11280

cggtttcggg attttttata tctgcacaac aggtaagagc attgagtcga taatcgtgaa 11340

gagtcggcga gcctggttag ccagtgctct ttccgttgtg ctgaattaag cgaataccgg 11400

aagcagaacc ggatcaccaa atgcgtacag gcgtcatcgc cgcccagcaa cagcacaacc 11460

caaactgagc cgtagccact gtctgtcctg aattccatgc ttgaacccgc ctatgcgcgg 11520

gttttctttt gtgcgcttgc aggccagctt gggatcagca gcctgacgga tgcggtgtcc 11580

ggcgacagcc tgactgccca ggaggcactc gcgacgctgg cattatccgg tgatgatgac 11640

ggaccacgac aggcccgcag ttatcaggtc atgaacggca tcgccgtgct gccggtgtcc 11700

ggcacgctgg tcagccggac gcgggcgctg cagccgtact cggggatgac cggttacaac 11760

ggcattatcg cccgtctgca acaggctgcc agcgatccga tggtggacgg cattctgctc 11820

gatatggaca cgcccggcgg gatggtggcg ggggcatttg actgcgctga catcatcgcc 11880

cgtgtgcgtg acataaaacc ggtatgggcg cttgccaacg acatgaactg cagtgcaggt 11940

cagttgcttg ccagtgccgc ctcccggcgt ctggtcacgc agaccgcccg gacaggctcc 12000

atcggcgtca tgatggctca cagtaattac ggtgctgcgc tggagaaaca gggtgtggaa 12060

atcacgctga tttacagcgg cagccataag gtggatggca acccctacag ccatcttccg 12120

gatgacgtcc gggagacact gcagtcccgg atggacgcaa cccgccagat gtttgcgcag 12180

aaggtgtcgg catataccgg cctgtccgtg caggttgtgc tggataccga ggctgcagtg 12240

tacagcggtc aggaggccat tgatgccgga ctggctgatg aacttgttaa cagcaccgat 12300

gcgatcaccg tcatgcgtga tgcactggat gcacgtaaat cccgtctctc aggagggcga 12360

atgaccaaag agactcaatc aacaactgtt tcagccactg cttcgcaggc tgacgttact 12420

gacgtggtgc cagcgacgga gggcgagaac gccagcgcgg cgcagccgga cgtgaacgcg 12480

cagatcaccg cagcggttgc ggcagaaaac agccgcatta tggggatact caactgtgag 12540

gaggctcacg gacgcgaaga acaggcacgc gtgctggcag aaacccccgg tatgaccgtg 12600

aaaacggccc gccgcattct ggccgcagca ccacagagtg cacaggcgcg cagtgacact 12660

gcgctggatc gtctgatgca gggggcaccg gcaccgctgg ctgcaggtaa cccggcatct 12720

gatgccgtta acgatttgct gaacacacca gtgtaaggga tgtttatgac gagcaaagaa 12780

acctttaccc attaccagcc gcagggcaac agtgacccgg ctcataccgc aaccgcgccc 12840

ggcggattga gtgcgaaagc gcctgcaatg accccgctga tgctggacac ctccagccgt 12900

aagctggttg cgtgggatgg caccaccgac ggtgctgccg ttggcattct tgcggttgct 12960

gctgaccaga ccagcaccac gctgacgttc tacaagtccg gcacgttccg ttatgaggat 13020

gtgctctggc cggaggctgc cagcgacgag acgaaaaaac ggaccgcgtt tgccggaacg 13080

gcaatcagca tcgtttaact ttacccttca tcactaaagg ccgcctgtgc ggcttttttt 13140

acgggatttt tttatgtcga tgtacacaac cgcccaactg ctggcggcaa atgagcagaa 13200

atttaagttt gatccgctgt ttctgcgtct ctttttccgt gagagctatc ccttcaccac 13260

ggagaaagtc tatctctcac aaattccggg actggtaaac atggcgctgt acgtttcgcc 13320

gattgtttcc ggtgaggtta tccgttcccg tggcggctcc acctctgaat ttacgccggg 13380

atatgtcaag ccgaagcatg aagtgaatcc gcagatgacc ctgcgtcgcc tgccggatga 13440

agatccgcag aatctggcgg acccggctta ccgccgccgt cgcatcatca tgcagaacat 13500

gcgtgacgaa gagctggcca ttgctcaggt cgaagagatg caggcagttt ctgccgtgct 13560

taagggcaaa tacaccatga ccggtgaagc cttcgatccg gttgaggtgg atatgggccg 13620

cagtgaggag aataacatca cgcagtccgg cggcacggag tggagcaagc gtgacaagtc 13680

cacgtatgac ccgaccgacg atatcgaagc ctacgcgctg aacgccagcg gtgtggtgaa 13740

tatcatcgtg ttcgatccga aaggctgggc gctgttccgt tccttcaaag ccgtcaagga 13800

gaagctggat acccgtcgtg gctctaattc cgagctggag acagcggtga aagacctggg 13860

caaagcggtg tcctataagg ggatgtatgg cgatgtggcc atcgtcgtgt attccggaca 13920

gtacgtggaa aacggcgtca aaaagaactt cctgccggac aacacgatgg tgctggggaa 13980

cactcaggca cgcggtctgc gcacctatgg ctgcattcag gatgcggacg cacagcgcga 14040

aggcattaac gcctctgccc gttacccgaa aaactgggtg accaccggcg atccggcgcg 14100

tgagttcacc atgattcagt cagcaccgct gatgctgctg gctgaccctg atgagttcgt 14160

gtccgtacaa ctggcgtaat catggccctt cggggccatt gtttctctgt ggaggagtcc 14220

atgacgaaag atgaactgat tgcccgtctc cgctcgctgg gtgaacaact gaaccgtgat 14280

gtcagcctga cggggacgaa agaagaactg gcgctccgtg tggcagagct gaaagaggag 14340

cttgatgaca cggatgaaac tgccggtcag gacacccctc tcagccggga aaatgtgctg 14400

accggacatg aaaatgaggt gggatcagcg cagccggata ccgtgattct ggatacgtct 14460

gaactggtca cggtcgtggc actggtgaag ctgcatactg atgcacttca cgccacgcgg 14520

gatgaacctg tggcatttgt gctgccggga acggcgtttc gtgtctctgc cggtgtggca 14580

gccgaaatga cagagcgcgg cctggccaga atgcaataac gggaggcgct gtggctgatt 14640

tcgataacct gttcgatgct gccattgccc gcgccgatga aacgatacgc gggtacatgg 14700

gaacgtcagc caccattaca tccggtgagc agtcaggtgc ggtgatacgt ggtgtttttg 14760

atgaccctga aaatatcagc tatgccggac agggcgtgcg cgttgaaggc tccagcccgt 14820

ccctgtttgt ccggactgat gaggtgcggc agctgcggcg tggagacacg ctgaccatcg 14880

gtgaggaaaa tttctgggta gatcgggttt cgccggatga tggcggaagt tgtcatctct 14940

ggcttggacg gggcgtaccg cctgccgtta accgtcgccg ctgaaagggg gatgtatggc 15000

cataaaaggt cttgagcagg ccgttgaaaa cctcagccgt atcagcaaaa cggcggtgcc 15060

tggtgccgcc gcaatggcca ttaaccgcgt tgcttcatcc gcgatatcgc agtcggcgtc 15120

acaggttgcc cgtgagacaa aggtacgccg gaaactggta aaggaaaggg ccaggctgaa 15180

aagggccacg gtcaaaaatc cgcaggccag aatcaaagtt aaccgggggg atttgcccgt 15240

aatcaagctg ggtaatgcgc gggttgtcct ttcgcgccgc aggcgtcgta aaaaggggca 15300

gcgttcatcc ctgaaaggtg gcggcagcgt gcttgtggtg ggtaaccgtc gtattcccgg 15360

cgcgtttatt cagcaactga aaaatggccg gtggcatgtc atgcagcgtg tggctgggaa 15420

aaaccgttac cccattgatg tggtgaaaat cccgatggcg gtgccgctga ccacggcgtt 15480

taaacaaaat attgagcgga tacggcgtga acgtcttccg aaagagctgg gctatgcgct 15540

gcagcatcaa ctgaggatgg taataaagcg atgaaacata ctgaactccg tgcagccgta 15600

ctggatgcac tggagaagca tgacaccggg gcgacgtttt ttgatggtcg ccccgctgtt 15660

tttgatgagg cggattttcc ggcagttgcc gtttatctca ccggcgctga atacacgggc 15720

gaagagctgg acagcgatac ctggcaggcg gagctgcata tcgaagtttt cctgcctgct 15780

caggtgccgg attcagagct ggatgcgtgg atggagtccc ggatttatcc ggtgatgagc 15840

gatatcccgg cactgtcaga tttgatcacc agtatggtgg ccagcggcta tgactaccgg 15900

cgcgacgatg atgcgggctt gtggagttca gccgatctga cttatgtcat tacctatgaa 15960

atgtgaggac gctatgcctg taccaaatcc tacaatgccg gtgaaaggtg ccgggaccac 16020

cctgtgggtt tataagggga gcggtgaccc ttacgcgaat ccgctttcag acgttgactg 16080

gtcgcgtctg gcaaaagtta aagacctgac gcccggcgaa ctgaccgctg agtcctatga 16140

cgacagctat ctcgatgatg aagatgcaga ctggactgcg accgggcagg ggcagaaatc 16200

tgccggagat accagcttca cgctggcgtg gatgcccgga gagcaggggc agcaggcgct 16260

gctggcgtgg tttaatgaag gcgatacccg tgcctataaa atccgcttcc cgaacggcac 16320

ggtcgatgtg ttccgtggct gggtcagcag tatcggtaag gcggtgacgg cgaaggaagt 16380

gatcacccgc acggtgaaag tcaccaatgt gggacgtccg tcgatggcag aagatcgcag 16440

cacggtaaca gcggcaaccg gcatgaccgt gacgcctgcc agcacctcgg tggtgaaagg 16500

gcagagcacc acgctgaccg tggccttcca gccggagggc gtaaccgaca agagctttcg 16560

tgcggtgtct gcggataaaa caaaagccac cgtgtcggtc agtggtatga ccatcaccgt 16620

gaacggcgtt gctgcaggca aggtcaacat tccggttgta tccggtaatg gtgagtttgc 16680

tgcggttgca gaaattaccg tcaccgccag ttaatccgga gagtcagcga tgttcctgaa 16740

aaccgaatca tttgaacata acggtgtgac cgtcacgctt tctgaactgt cagccctgca 16800

gcgcattgag catctcgccc tgatgaaacg gcaggcagaa caggcggagt cagacagcaa 16860

ccggaagttt actgtggaag acgccatcag aaccggcgcg tttctggtgg cgatgtccct 16920

gtggcataac catccgcaga agacgcagat gccgtccatg aatgaagccg ttaaacagat 16980

tgagcaggaa gtgcttacca cctggcccac ggaggcaatt tctcatgctg aaaacgtggt 17040

gtaccggctg tctggtatgt atgagtttgt ggtgaataat gcccctgaac agacagagga 17100

cgccgggccc gcagagcctg tttctgcggg aaagtgttcg acggtgagct gagttttgcc 17160

ctgaaactgg cgcgtgagat ggggcgaccc gactggcgtg ccatgcttgc cgggatgtca 17220

tccacggagt atgccgactg gcaccgcttt tacagtaccc attattttca tgatgttctg 17280

ctggatatgc acttttccgg gctgacgtac accgtgctca gcctgttttt cagcgatccg 17340

gatatgcatc cgctggattt cagtctgctg aaccggcgcg aggctgacga agagcctgaa 17400

gatgatgtgc tgatgcagaa agcggcaggg cttgccggag gtgtccgctt tggcccggac 17460

gggaatgaag ttatccccgc ttccccggat gtggcggaca tgacggagga tgacgtaatg 17520

ctgatgacag tatcagaagg gatcgcagga ggagtccggt atggctgaac cggtaggcga 17580

tctggtcgtt gatttgagtc tggatgcggc cagatttgac gagcagatgg ccagagtcag 17640

gcgtcatttt tctggtacgg aaagtgatgc gaaaaaaaca gcggcagtcg ttgaacagtc 17700

gctgagccga caggcgctgg ctgcacagaa agcggggatt tccgtcgggc agtataaagc 17760

cgccatgcgt atgctgcctg cacagttcac cgacgtggcc acgcagcttg caggcgggca 17820

aagtccgtgg ctgatcctgc tgcaacaggg ggggcaggtg aaggactcct tcggcgggat 17880

gatccccatg ttcagggggc ttgccggtgc gatcaccctg ccgatggtgg gggccacctc 17940

gctggcggtg gcgaccggtg cgctggcgta tgcctggtat cagggcaact caaccctgtc 18000

cgatttcaac aaaacgctgg tcctttccgg caatcaggcg ggactgacgg cagatcgtat 18060

gctggtcctg tccagagccg ggcaggcggc agggctgacg tttaaccaga ccagcgagtc 18120

actcagcgca ctggttaagg cgggggtaag cggtgaggct cagattgcgt ccatcagcca 18180

gagtgtggcg cgtttctcct ctgcatccgg cgtggaggtg gacaaggtcg ctgaagcctt 18240

cgggaagctg accacagacc cgacgtcggg gctgacggcg atggctcgcc agttccataa 18300

cgtgtcggcg gagcagattg cgtatgttgc tcagttgcag cgttccggcg atgaagccgg 18360

ggcattgcag gcggcgaacg aggccgcaac gaaagggttt gatgaccaga cccgccgcct 18420

gaaagagaac atgggcacgc tggagacctg ggcagacagg actgcgcggg cattcaaatc 18480

catgtgggat gcggtgctgg atattggtcg tcctgatacc gcgcaggaga tgctgattaa 18540

ggcagaggct gcgtataaga aagcagacga catctggaat ctgcgcaagg atgattattt 18600

tgttaacgat gaagcgcggg cgcgttactg ggatgatcgt gaaaaggccc gtcttgcgct 18660

tgaagccgcc cgaaagaagg ctgagcagca gactcaacag gacaaaaatg cgcagcagca 18720

gagcgatacc gaagcgtcac ggctgaaata taccgaagag gcgcagaagg cttacgaacg 18780

gctgcagacg ccgctggaga aatataccgc ccgtcaggaa gaactgaaca aggcactgaa 18840

agacgggaaa atcctgcagg cggattacaa cacgctgatg gcggcggcga aaaaggatta 18900

tgaagcgacg ctgaaaaagc cgaaacagtc cagcgtgaag gtgtctgcgg gcgatcgtca 18960

ggaagacagt gctcatgctg ccctgctgac gcttcaggca gaactccgga cgctggagaa 19020

gcatgccgga gcaaatgaga aaatcagcca gcagcgccgg gatttgtgga aggcggagag 19080

tcagttcgcg gtactggagg aggcggcgca acgtcgccag ctgtctgcac aggagaaatc 19140

cctgctggcg cataaagatg agacgctgga gtacaaacgc cagctggctg cacttggcga 19200

caaggttacg tatcaggagc gcctgaacgc gctggcgcag caggcggata aattcgcaca 19260

gcagcaacgg gcaaaacggg ccgccattga tgcgaaaagc cgggggctga ctgaccggca 19320

ggcagaacgg gaagccacgg aacagcgcct gaaggaacag tatggcgata atccgctggc 19380

gctgaataac gtcatgtcag agcagaaaaa gacctgggcg gctgaagacc agcttcgcgg 19440

gaactggatg gcaggcctga agtccggctg gagtgagtgg gaagagagcg ccacggacag 19500

tatgtcgcag gtaaaaagtg cagccacgca gacctttgat ggtattgcac agaatatggc 19560

ggcgatgctg accggcagtg agcagaactg gcgcagcttc acccgttccg tgctgtccat 19620

gatgacagaa attctgctta agcaggcaat ggtggggatt gtcgggagta tcggcagcgc 19680

cattggcggg gctgttggtg gcggcgcatc cgcgtcaggc ggtacagcca ttcaggccgc 19740

tgcggcgaaa ttccattttg caaccggagg atttacggga accggcggca aatatgagcc 19800

agcggggatt gttcaccgtg gtgagtttgt cttcacgaag gaggcaacca gccggattgg 19860

cgtggggaat ctttaccggc tgatgcgcgg ctatgccacc ggcggttatg tcggtacacc 19920

gggcagcatg gcagacagcc ggtcgcaggc gtccgggacg tttgagcaga ataaccatgt 19980

ggtgattaac aacgacggca cgaacgggca gataggtccg gctgctctga aggcggtgta 20040

tgacatggcc cgcaagggtg cccgtgatga aattcagaca cagatgcgtg atggtggcct 20100

gttctccgga ggtggacgat gaagaccttc cgctggaaag tgaaacccgg tatggatgtg 20160

gcttcggtcc cttctgtaag aaaggtgcgc tttggtgatg gctattctca gcgagcgcct 20220

gccgggctga atgccaacct gaaaacgtac agcgtgacgc tttctgtccc ccgtgaggag 20280

gccacggtac tggagtcgtt tctggaagag cacgggggct ggaaatcctt tctgtggacg 20340

ccgccttatg agtggcggca gataaaggtg acctgcgcaa aatggtcgtc gcgggtcagt 20400

atgctgcgtg ttgagttcag cgcagagttt gaacaggtgg tgaactgatg caggatatcc 20460

ggcaggaaac actgaatgaa tgcacccgtg cggagcagtc ggccagcgtg gtgctctggg 20520

aaatcgacct gacagaggtc ggtggagaac gttatttttt ctgtaatgag cagaacgaaa 20580

aaggtgagcc ggtcacctgg caggggcgac agtatcagcc gtatcccatt caggggagcg 20640

gttttgaact gaatggcaaa ggcaccagta cgcgccccac gctgacggtt tctaacctgt 20700

acggtatggt caccgggatg gcggaagata tgcagagtct ggtcggcgga acggtggtcc 20760

ggcgtaaggt ttacgcccgt tttctggatg cggtgaactt cgtcaacgga aacagttacg 20820

ccgatccgga gcaggaggtg atcagccgct ggcgcattga gcagtgcagc gaactgagcg 20880

cggtgagtgc ctcctttgta ctgtccacgc cgacggaaac ggatggcgct gtttttccgg 20940

gacgtatcat gctggccaac acctgcacct ggacctatcg cggtgacgag tgcggttata 21000

gcggtccggc tgtcgcggat gaatatgacc agccaacgtc cgatatcacg aaggataaat 21060

gcagcaaatg cctgagcggt tgtaagttcc gcaataacgt cggcaacttt ggcggcttcc 21120

tttccattaa caaactttcg cagtaaatcc catgacacag acagaatcag cgattctggc 21180

gcacgcccgg cgatgtgcgc cagcggagtc gtgcggcttc gtggtaagca cgccggaggg 21240

ggaaagatat ttcccctgcg tgaatatctc cggtgagccg gaggcgtatt tccgtatgtc 21300

gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 21360

ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 21420

gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 21480

cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 21540

tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 21600

gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 21660

acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 21720

ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 21780

gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 21840

atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 21900

ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 21960

gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 22020

cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 22080

gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 22140

tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 22200

ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 22260

ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 22320

tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 22380

cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 22440

caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 22500

tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 22560

gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 22620

gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 22680

ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 22740

caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 22800

gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 22860

cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 22920

tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 22980

atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 23040

ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 23100

ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 23160

ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 23220

agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 23280

acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 23340

gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 23400

gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 23460

ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 23520

cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 23580

aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 23640

cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 23700

aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 23760

gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 23820

atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 23880

aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 23940

catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 24000

ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 24060

ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 24120

gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 24180

gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 24240

tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 24300

ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 24360

gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 24420

ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 24480

ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 24540

acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 24600

cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 24660

gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 24720

ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 24780

attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 24840

atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 24900

aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 24960

ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 25020

gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 25080

aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 25140

ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 25200

agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 25260

acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 25320

ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 25380

ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 25440

ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 25500

atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 25560

gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 25620

cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 25680

acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 25740

gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 25800

gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 25860

tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 25920

tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 25980

aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 26040

tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 26100

gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 26160

cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 26220

cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 26280

gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 26340

tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 26400

taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 26460

aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 26520

cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 26580

cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 26640

gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 26700

acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 26760

ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 26820

tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 26880

acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 26940

gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 27000

aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 27060

ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 27120

cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 27180

ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 27240

agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 27300

ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 27360

aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 27420

cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 27480

ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 27540

gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 27600

cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 27660

aagcggcggc aatacgtgca gaaaattcgg caaaacgtgc agaagatata gcttcagctg 27720

tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 27780

acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 27840

cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 27900

gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 27960

agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 28020

cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 28080

gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 28140

tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 28200

aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt ctaagcggag 28260

atcgcctagt gattttaaac tattgctggc agcattcttg agtccaatat aaaagtattg 28320

tgtacctttt gctgggtcag gttgttcttt aggaggagta aaaggatcaa atgcactaaa 28380

cgaaactgaa acaagcgatc gaaaatatcc ctttgggatt cttgactcga taagtctatt 28440

attttcagag aaaaaatatt cattgttttc tgggttggtg attgcaccaa tcattccatt 28500

caaaattgtt gttttaccac acccattccg cccgataaaa gcatgaatgt tcgtgctggg 28560

catagaatta accgtcacct caaaaggtat agttaaatca ctgaatccgg gagcactttt 28620

tctattaaat gaaaagtgga aatctgacaa ttctggcaaa ccatttaaca cacgtgcgaa 28680

ctgtccatga atttctgaaa gagttacccc tctaagtaat gaggtgttaa ggacgctttc 28740

attttcaatg tcggctaatc gatttggcca tactactaaa tcctgaatag ctttaagaag 28800

gttatgttta aaaccatcgc ttaatttgct gagattaaca tagtagtcaa tgctttcacc 28860

taaggaaaaa aacatttcag ggagttgact gaatttttta tctattaatg aataagtgct 28920

tacttcttct ttttgaccta caaaaccaat tttaacattt ccgatatcgc atttttcacc 28980

atgctcatca aagacagtaa gataaaacat tgtaacaaag gaatagtcat tccaaccatc 29040

tgctcgtagg aatgccttat ttttttctac tgcaggaata tacccgcctc tttcaataac 29100

actaaactcc aacatatagt aacccttaat tttattaaaa taaccgcaat ttatttggcg 29160

gcaacacagg atctctcttt taagttactc tctattacat acgttttcca tctaaaaatt 29220

agtagtattg aacttaacgg ggcatcgtat tgtagttttc catatttagc tttctgcttc 29280

cttttggata acccactgtt attcatgttg catggtgcac tgtttatacc aacgatatag 29340

tctattaatg catatatagt atcgccgaac gattagctct tcaggcttct gaagaagcgt 29400

ttcaagtact aataagccga tagatagcca cggacttcgt agccattttt cataagtgtt 29460

aacttccgct cctcgctcat aacagacatt cactacagtt atggcggaaa ggtatgcatg 29520

ctgggtgtgg ggaagtcgtg aaagaaaaga agtcagctgc gtcgtttgac atcactgcta 29580

tcttcttact ggttatgcag gtcgtagtgg gtggcacaca aagctttgca ctggattgcg 29640

aggctttgtg cttctctgga gtgcgacagg tttgatgaca aaaaattagc gcaagaagac 29700

aaaaatcacc ttgcgctaat gctctgttac aggtcactaa taccatctaa gtagttgatt 29760

catagtgact gcatatgttg tgttttacag tattatgtag tctgtttttt atgcaaaatc 29820

taatttaata tattgatatt tatatcattt tacgtttctc gttca 29865

<210> 15

<211> 2628

<212> DNA

<213> 大腸桿菌

<220>

<223> gyra基因

<400> 15

atgagcgacc ttgcgagaga aattacaccg gtcaacattg aggaagagct gaagagctcc 60

tatctggatt atgcgatgtc ggtcattgtt ggccgtgcgc tgccagatgt ccgagatggc 120

ctgaagccgg tacaccgtcg cgtactttac gccatgaacg tactaggcaa tgactggaac 180

aaagcctata aaaaatctgc ccgtgtcgtt ggtgacgtaa tcggtaaata ccatccccat 240

ggtgactcgg cggtctatga cacgatcgtc cgcatggcgc agccattctc gctgcgttat 300

atgctggtag acggtcaggg taacttcggt tctatcgacg gcgactctgc ggcggcaatg 360

cgttatacgg aaatccgtct ggcgaaaatt gcccatgaac tgatggccga tctcgaaaaa 420

gagacggtcg atttcgttga taactatgac ggcacggaaa aaattccgga cgtcatgcca 480

accaaaattc ctaacctgct ggtgaacggt tcttccggta tcgccgtagg tatggcaacc 540

aacatcccgc cgcacaacct gacggaagtc atcaacggtt gtctggcgta tattgatgat 600

gaagacatca gcattgaagg gctgatggaa cacatcccgg ggccggactt cccgacggcg 660

gcaatcatta acggtcgtcg cggtattgaa gaagcttacc gtaccggtcg cggcaaggtg 720

tatatccgcg ctcgcgcaga agtggaagtt gacgccaaaa ccggtcgtga aaccattatc 780

gtccacgaaa ttccgtatca ggtaaacaaa gcgcgcctga tcgagaagat tgcggaactg 840

gtaaaagaaa aacgcgtgga aggcatcagc gcgctgcgtg acgagtctga caaagacggt 900

atgcgcatcg tgattgaagt gaaacgcgat gcggtcggtg aagttgtgct caacaacctc 960

tactcccaga cccagttgca ggtttctttc ggtatcaaca tggtggcatt gcaccatggt 1020

cagccgaaga tcatgaacct gaaagacatc atcgcggcgt ttgttcgtca ccgccgtgaa 1080

gtggtgaccc gtcgtactat tttcgaactg cgtaaagctc gcgatcgtgc tcatatcctt 1140

gaagcattag ccgtggcgct ggcgaacatc gacccgatca tcgaactgat ccgtcatgcg 1200

ccgacgcctg cagaagcgaa aactgcgctg gttgctaatc cgtggcagct gggcaacgtt 1260

gccgcgatgc tcgaacgtgc tggcgacgat gctgcgcgtc cggaatggct ggagccagag 1320

ttcggcgtgc gtgatggtct gtactacctg accgaacagc aagctcaggc gattctggat 1380

ctgcgtttgc agaaactgac cggtcttgag cacgaaaaac tgctcgacga atacaaagag 1440

ctgctggatc agatcgcgga actgttgcgt attcttggta gcgccgatcg tctgatggaa 1500

gtgatccgtg aagagctgga gctggttcgt gaacagttcg gtgacaaacg tcgtactgaa 1560

atcaccgcca acagcgcaga catcaacctg gaagatctga tcacccagga agatgtggtc 1620

gtgacgctct ctcaccaggg ctacgttaag tatcagccgc tttctgaata cgaagcgcag 1680

cgtcgtggcg ggaaaggtaa atctgccgca cgtattaaag aagaagactt tatcgaccga 1740

ctgctggtgg cgaacactca cgaccatatt ctgtgcttct ccagccgtgg tcgcgtctat 1800

tcgatgaaag tttatcagtt gccggaagcc actcgtggcg cgcgcggtcg tccgatcgtc 1860

aacctgctgc cgctggagca ggacgaacgt atcactgcga tcctgccagt gaccgagttt 1920

gaagaaggcg tgaaagtctt catggcgacc gctaacggta ccgtgaagaa aactgtcctc 1980

accgagttca accgtctgcg taccgccggt aaagtggcga tcaaactggt tgacggcgat 2040

gagctgatcg gcgttgacct gaccagcggc gaagacgaag taatgctgtt ctccgctgaa 2100

ggtaaagtgg tgcgctttaa agagtcttct gtccgtgcga tgggctgcaa caccaccggt 2160

gttcgcggta ttcgcttagg tgaaggcgat aaagtcgtct ctctgatcgt gcctcgtggc 2220

gatggcgcaa tcctcaccgc aacgcaaaac ggttacggta aacgtaccgc agtggcggaa 2280

tacccaacca agtcgcgtgc gacgaaaggg gttatctcca tcaaggttac cgaacgtaac 2340

ggtttagttg ttggcgcggt acaggtagat gactgcgacc agatcatgat gatcaccgat 2400

gccggtacgc tggtacgtac tcgcgtttcg gaaatcagca tcgtgggccg taacacccag 2460

ggcgtgatcc tcatccgtac tgcggaagat gaaaacgtag tgggtctgca acgtgttgct 2520

gaaccggttg acgaggaaga tctggatacc atcgacggca gtgccgcgga aggggacgat 2580

gaaatcgctc cggaagtgga cgttgacgac gagccagaag aagaataa 2628

<210> 16

<211> 768

<212> DNA

<213> 人工序列

<220>

<223> 插入序列

<400> 16

ggtaatgact ccaacttatt gatagtgttt tatgttcaga taatgcccga tgactttgtc 60

atgcagctcc accgattttg agaacgacag cgacttccgt cccagccgtg ccaggtgctg 120

cctcagattc aggttatgcc gctcaattcg ctgcgtatat cgcttgctga ttacgtgcag 180

ctttcccttc aggcgggatt catacagcgg ccagccatcc gtcatccata tcaccacgtc 240

aaagggtgac agcaggctca taagacgccc cagcgtcgcc atagtgcgtt caccgaatac 300

gtgcgcaaca accgtcttcc ggagactgtc atacgcgtaa aacagccagc gctggcgcga 360

tttagccccg acatagcccc actgttcgtc catttccgcg cagacgatga cgtcactgcc 420

cggctgtatg cgcgaggtta ccgactgcgg cctgagtttt ttaagtgacg taaaatcgtg 480

ttgaggccaa cgcccataat gcgggctgtt gcccggcatc caacgccatt catggccata 540

tcaatgattt tctggtgcgt accgggttga gaagcggtgt aagtgaactg cagttgccat 600

gttttacggc agtgagagca gagatagcgc tgatgtccgg cggtgctttt gccgttacgc 660

accaccccgt cagtagctga acaggaggga cagctgatag aaacagaagc cactggagca 720

cctcaaaaac accatcatac actaaatcag taagttggca gcatcacc 768

<210> 17

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> OmpA信號(hào)肽

<400> 17

Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala

1 5 10 15

Thr Val Ala Gln Ala

<210> 18

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> DsbA信號(hào)肽

<400> 18

Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser

1 5 10 15

Ala Ser Ala Ala

<210> 19

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PhoA信號(hào)肽

<400> 19

Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr

1 5 10 15

Pro Val Thr Lys Ala

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：C·斯派爾;J·卡韋倫內(nèi);B·米歇爾
技術(shù)所有人：德爾菲遺傳學(xué)公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、薛老師：1.CRISPR-Cas系統(tǒng) 2.基因編輯 3.基因修復(fù) 4.天然產(chǎn)物合成 5.單分子技術(shù)開發(fā)與應(yīng)用
2、張老師：1.探索新型氧化還原酶結(jié)構(gòu)-功能關(guān)系，電催化反應(yīng)機(jī)制 2.酶電催化導(dǎo)向的酶分子改造 3.納米材料、生物功能多肽對(duì)酶-電極體系的影響4. 生物電化學(xué)傳感和生物電合成體系的設(shè)計(jì)與應(yīng)用。
3、豆老師：1.環(huán)境納米材料及揮發(fā)性有機(jī)化合物（VOCs） 2.CO污染物的催化氧化 3.低溫等離子體 4.吸脫附等控制技術(shù)
4、趙老師：1.高分子材料改性及加工技術(shù) 2.微孔及過濾材料 3.環(huán)境友好高分子材料
5、鄔老師：1.高分子材料的共混與復(fù)合 2.涉及材料功能化及結(jié)構(gòu)與性能的研究；高分子熱穩(wěn)定劑的研發(fā)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

宿主細(xì)胞相關(guān)技術(shù)

宿主細(xì)胞蛋白殘留相關(guān)技術(shù)

質(zhì)粒轉(zhuǎn)化宿主細(xì)胞相關(guān)技術(shù)

宿主細(xì)胞蛋白相關(guān)技術(shù)

噬菌體的宿主細(xì)胞相關(guān)技術(shù)

人二倍體細(xì)胞宿主蛋白相關(guān)技術(shù)

細(xì)胞膜上的蛋白質(zhì)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于生產(chǎn)蛋白質(zhì)的經(jīng)改進(jìn)的宿主細(xì)胞的制作方法