專利名稱:類異戊二烯的生產(chǎn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通過(guò)微生物來(lái)生產(chǎn)類異戊二烯特別是輔酶Q-10的方法。更具體地,本發(fā)明涉及通過(guò)Rhodobacter屬的微生物(特別是R.sphaeroides種的微生物)增加輔酶Q-10產(chǎn)量的方法,所述微生物已經(jīng)經(jīng)過(guò)了來(lái)自不同微生物(優(yōu)選是Paracoccus屬的,更優(yōu)選是P.zeaxanthinifaciens種的)的甲羥戊酸(mev)操縱子的一種或多種基因的轉(zhuǎn)化,由此所述mev操縱子被突變,導(dǎo)致產(chǎn)生增加的輔酶Q-10產(chǎn)量。攜帶此類突變的序列以及攜帶此類經(jīng)突變mev操縱子的微生物也包括在本發(fā)明內(nèi)。
輔酶Q-10(2,3-二甲氧基-二甲基-6-十異戊二烯基-1,4-苯醌),也被稱為泛醌-10,是脂溶性苯醌,具有類異戊二烯側(cè)鏈,所述側(cè)鏈包括十個(gè)C-5類異戊二烯單元。輔酶Q-10(下文中縮寫(xiě)為CoQ10)被發(fā)現(xiàn)于微生物和植物以及動(dòng)物中。它是人類和大多數(shù)哺乳動(dòng)物中泛醌最普遍的存在形式。已有人提出,并有越來(lái)越多的證據(jù)表明,CoQ10對(duì)人類健康狀況以及對(duì)疾病抵抗來(lái)說(shuō)是重要因素。CoQ10的醫(yī)藥和健康方面的有益效果已被認(rèn)為與其兩種主要的生理功能相關(guān),即作為線粒體電子傳遞鏈的重要輔助因子的功能(與三磷酸腺苷的合成有關(guān))以及作為脂溶性抗氧化劑發(fā)揮作用的功能。
CoQ10的健康方面的好處使得該化合物的商業(yè)重要性增加??梢酝ㄟ^(guò)化學(xué)合成或通過(guò)用微生物發(fā)酵來(lái)生產(chǎn)CoQ10。這些微生物可以是已通過(guò)遺傳工程對(duì)其CoQ10生產(chǎn)進(jìn)行過(guò)改進(jìn)的天然的CoQ10生產(chǎn)者,或者它們可以不是天然生產(chǎn)CoQ10的,但是通過(guò)遺傳功能改造而能對(duì)CoQ10進(jìn)行合成了。
在細(xì)菌中,泛醌的醌環(huán)獲得自分支酸鹽/酯(Chorismate),其是芳香族化合物生物合成中的核心中間產(chǎn)物,而泛醌的類異戊二烯尾巴獲得自C-5化合物異戊烯焦磷酸酯(IPP)。加到醌環(huán)上的類異戊二烯尾巴的長(zhǎng)度取決于細(xì)菌中存在的特定異戊二烯轉(zhuǎn)移酶。例如,在Escherichia coli中,八異戊二烯焦磷酸酯合酶催化從法尼基焦磷酸酯(FPP,C-15)和五個(gè)IPP單位來(lái)合成八異戊二烯焦磷酸酯(C-40)的過(guò)程。將該分子加入到醌環(huán)中導(dǎo)致了泛醌-8的形成。在Paracoccus和Rhodobacter的種中,十異戊二烯焦磷酸酯(DPP)合酶催化用FPP(C-15)和七個(gè)IPP單位來(lái)形成DPP(C-50)的過(guò)程。將DPP加入到醌環(huán)中然后會(huì)導(dǎo)致泛醌-10(CoQ10)的形成。
自然界中,已知有兩種不同的對(duì)IPP進(jìn)行生物合成的途徑(
圖1)。甲羥戊酸途徑,如其名稱所暗示的,其利用甲羥戊酸鹽/酯作為核心中間產(chǎn)物,該途徑已于真核生物中被很好地研究。多年以來(lái)甲羥戊酸途徑都被認(rèn)為是自然界中IPP合成的普遍途徑。但是,近十年來(lái),還發(fā)現(xiàn)了第二條IPP生物合成途徑,其被稱為非甲羥戊酸途徑或MEP途徑(因?yàn)槠溆?C-甲基-D-赤藻糖醇4-磷酸酯MEP作為中間產(chǎn)物)。目前已發(fā)現(xiàn),該MEP途徑存在于多種真細(xì)菌以及高等植物的質(zhì)體區(qū)室中。
基于R.sphaeroides中yaeM基因(現(xiàn)在被稱為ispC,其編碼1-去氧-D-木酮糖-5-磷酸酯還原異構(gòu)酶)的存在,以及基于近來(lái)完成的對(duì)R.sphaeroides基因組序列的研究,看上去該細(xì)菌排他性地使用MEP途徑用于對(duì)IPP進(jìn)行生物合成。支持R.sphaeroides中排他性使用MEP途徑的其它證據(jù)是以下發(fā)現(xiàn)與其緊密相關(guān)的種,Rhodobacter capsulatus,僅用MEP途徑進(jìn)行類異戊二烯生物合成。
WO 02/26933 A1公開(kāi)了在Rhodobacter sphaeroides中提高CoQ10產(chǎn)量的方法,其通過(guò)過(guò)量表達(dá)編碼MEP途徑中某些酶的一些天然和/或異源基因來(lái)實(shí)現(xiàn)。但是,這些酶的過(guò)量表達(dá)僅使CoQ10的產(chǎn)量獲得非常有限的提高。
如上所述,一些細(xì)菌僅用甲羥戊酸途徑來(lái)對(duì)IPP進(jìn)行生物合成。Paracoccus zeaxanthinifaciens是此類細(xì)菌的一個(gè)例子。在P.zeaxanthinifaciens中,編碼甲羥戊酸途徑的五個(gè)酶的基因加上編碼IPP異構(gòu)酶的基因(見(jiàn)圖1),一起成簇于染色體的單個(gè)轉(zhuǎn)錄單元中,即下文中被稱為甲羥戊酸(mev)操縱子的操縱子(Hümbelin et al.,Gene 297,129-139,2002)。
現(xiàn)在已經(jīng)發(fā)現(xiàn),通過(guò)將經(jīng)突變的mev操縱子引入是mev操縱子的一個(gè)或多個(gè)基因天然缺陷型的微生物(即,天然使用非甲羥戊酸途徑用于生產(chǎn)類異戊二烯的微生物)中,可顯著提高對(duì)類異戊二烯特別是CoQ10的生產(chǎn),其中,可引入包含一處或多處突變的完整mev操縱子或所述mev操縱子的一個(gè)或多個(gè)基因。所述一處或多處突變可以例如在下述基因的一種或全部中編碼羥甲基戊二酸單酰-CoA(hydroxymethylglutaryl-CoA)還原酶的mvaA、編碼異戊烯二磷酸異構(gòu)酶的idi、編碼羥甲基戊二酸單酰-CoA合酶的hcs、編碼甲羥戊酸激酶的mvk、編碼磷酸甲羥戊酸激酶的pmk以及編碼二磷酸甲羥戊酸脫羧酶的mvd。
因此,本發(fā)明提供了一種多核苷酸序列,其包含編碼下述蛋白的一種或多種基因,所述蛋白具有羥甲基戊二酸單酰-CoA還原酶活性、異戊烯二磷酸異構(gòu)酶活性、羥甲基戊二酸單酰-CoA合酶活性、甲羥戊酸激酶活性、磷酸甲羥戊酸激酶活性和/或二磷酸甲羥戊酸脫羧酶活性,其中,所述多核苷酸序列攜帶一處或多處突變,存在于微生物中時(shí)能導(dǎo)致產(chǎn)生提高的類異戊二烯產(chǎn)量。類異戊二烯產(chǎn)量的提高可例如通過(guò)下述方法來(lái)測(cè)量比較不攜帶所述多核苷酸序列的野生型微生物(即,不使用mev途徑)與攜帶本發(fā)明多核苷酸的微生物的產(chǎn)量。
在一種實(shí)施方式中,本發(fā)明涉及可從SEQ ID NO1或2獲得的多核苷酸序列,即,包含野生型mev操縱子或其片段的基因,其中,所述片段具有mev操縱子的基因中至少一種的活性,例如,編碼羥甲基戊二酸單酰-CoA還原酶的mvaA、編碼異戊烯二磷酸異構(gòu)酶的idi、編碼羥甲基戊二酸單酰-CoA合酶的hcs、編碼甲羥戊酸激酶的mvk、編碼磷酸甲羥戊酸激酶的pmk以及編碼二磷酸甲羥戊酸脫羧酶的mvd。優(yōu)選地,經(jīng)突變的多核苷酸序列由SEQ ID NO3或其片段所代表,當(dāng)存在于微生物中時(shí)其導(dǎo)致例如CoQ10產(chǎn)量的增加。
在一個(gè)方面,本發(fā)明涉及包含攜帶突變的mev操縱子的DNA序列,所述DNA序列由SEQ ID NO3所代表。
術(shù)語(yǔ)“提高的類異戊二烯產(chǎn)量”,特別是提高的CoQ10產(chǎn)量,在本文中用于表示,例如,較之?dāng)y帶各自的野生型多核苷酸的各自的微生物而言,通過(guò)攜帶包含如上所述一處或多處突變的多核苷酸的微生物獲得的至少大約10%的增加。類異戊二烯的產(chǎn)量通過(guò)標(biāo)準(zhǔn)方法來(lái)測(cè)量,例如,HPLC(見(jiàn)實(shí)施例2),其可表示為mg/l或mg/l/OD600(見(jiàn)實(shí)施例5)。
攜帶一處或多處突變的完整mev操縱子或其一種或多種基因可例如是完全合成的,或部分分離和合成的。經(jīng)分離的mev操縱子或其一種或多種基因可來(lái)源于使用甲羥戊酸途徑的任何微生物,即,其中所述操縱子中包括的一種或多種基因天然存在。優(yōu)選地,該微生物屬于Paracoccus屬,更優(yōu)選地,來(lái)自Paracoccus zeaxanthinifaciens,例如,Paracoccus sp.R114或P.zeaxanthinifaciens ATCC 21588。具有完全功能的、操縱子DNA序列的等位基因變異和突變體也被上述術(shù)語(yǔ)所包括。P.zeaxanthinifaciens ATCC21588的完整mev操縱子如SEQ ID NO1所示,Paracoccus sp.R114的完整mev操縱子如SEQ ID NO2所示(也見(jiàn)WO 02/099095的SEQ IDNO42)。
菌株P(guān)aracoccus sp.R114是P.zeaxanthinifaciens ATCC 21588的衍生物,其已按照Budapest Treaty的條款于2001年4月24日以專利保藏號(hào)PTA-3335保藏于ATCC。關(guān)于可用于本發(fā)明的Paracoccus種和菌株,以及對(duì)Flavobacterium sp.的分類學(xué)重新分類為Paracoccus,參見(jiàn)WO02/099095的47ff頁(yè)??墒褂玫拇祟愇锓N的例子是P.marcusii、P.carotinifaciens、P.solventivorans、P.zeaxanthinifaciens或Paracoccus sp.R114。
本發(fā)明的mev操縱子攜帶一處或多處突變,所述突變可位于操縱子內(nèi)的任何位置,導(dǎo)致所述操縱子內(nèi)一種或多種基因活性的變化,從而在攜帶此類多核苷酸的微生物中產(chǎn)生提高的類異戊二烯產(chǎn)量。
在一種實(shí)施方式中,mev操縱子攜帶至少一處突變,其優(yōu)選位于mev操縱子的hcs基因中,例如,Paracoccus zeaxanthinifaciens的mev操縱子的hcs基因中,例如,Paracoccus sp.R114或P.zeaxanthinifaciens ATCC21588的mev操縱子的hcs基因中。更優(yōu)選地,本發(fā)明所用的經(jīng)突變的mev操縱子由SEQ ID NO3所代表。Paracoccus sp.R114的各個(gè)蛋白質(zhì)和野生型hcs基因的序列由SEQ ID NO5和4分別代表。
在一種實(shí)施方式中,本發(fā)明涉及包含位于hcs基因中的一處或多處突變的多核苷酸,優(yōu)選如SEQ ID NO6所示的多核苷酸,其編碼如SEQ IDNO7所示的具有羥甲基戊二酸單酰-CoA合酶的蛋白,其中,SEQ IDNO5中第90位上存在的谷氨酰胺被賴氨酸所代替。
因此,本發(fā)明的目的是提供如前所述的多核苷酸序列,其包括mev操縱子的一個(gè)或多個(gè)基因,所述多核苷酸選自如下多核苷酸構(gòu)成的組(a)編碼包含根據(jù)SEQ ID NO7的氨基酸序列的多肽的多核苷酸,(b)包含根據(jù)SEQ ID NO6的核苷酸序列的多核苷酸,(c)包含下述核苷酸序列的多核苷酸,所述序列編碼被(a)或(b)的多核苷酸編碼的多肽的片段或衍生物,其中,在所述衍生物中,較之所述多肽,一個(gè)或多個(gè)氨基酸殘基被保守取代,并且所述片段或衍生物具有羥甲基戊二酸單酰-CoA合酶(Hcs)的活性,(d)多核苷酸,其互補(bǔ)鏈能在嚴(yán)格條件下與(a)至(c)中任意一項(xiàng)定義的多肽雜交,并且編碼Hcs蛋白。
本發(fā)明的多肽和多核苷酸優(yōu)選以經(jīng)分離的形式提供,優(yōu)選被純化至同質(zhì)(homogeneity)。
術(shù)語(yǔ)“經(jīng)分離的”指物質(zhì)從其原始環(huán)境(例如,如果天然存在的話,天然環(huán)境)移出。例如,存在于活的微生物中的天然存在的多核苷酸或多肽不是經(jīng)分離的,但是與天然系統(tǒng)中共存物質(zhì)中的一些或所有分離開(kāi)的同樣的多核苷酸或多肽就是經(jīng)分離的。此類多核苷酸可以是載體的一部分,和/或此類多核苷酸或多肽可以是組合物的一部分,但它們?nèi)允墙?jīng)分離的,因?yàn)榇祟愝d體或組合物并非其天然環(huán)境的一部分。
本文中使用的經(jīng)分離的多核苷酸或核酸可以是下述DNA或RNA,其并不與其來(lái)源生物的天然存在的基因組中緊密相鄰的兩段編碼序列(一段在5’末端,一段在3’末端)緊密相鄰。因此,在一種實(shí)施方式中,核酸包括與編碼序列緊密相鄰的5’非編碼(例如啟動(dòng)子)序列的一些或全部。術(shù)語(yǔ)“經(jīng)分離的多核苷酸”因此包括例如,被包括進(jìn)載體,包括進(jìn)自主復(fù)制質(zhì)?;虿《?、或被包括進(jìn)原核或真核生物基因組DNA的重組DNA,或者作為獨(dú)立于其它序列的單獨(dú)分子存在(例如,通過(guò)PCR或限制性內(nèi)切酶處理產(chǎn)生的基因組DNA片段或cDNA)。其還包括下述重組DNA,所述DNA是編碼額外多肽的雜交基因的一部分,所述多肽基本不含細(xì)胞內(nèi)物質(zhì)、病毒物質(zhì)或培養(yǎng)基(當(dāng)通過(guò)重組DNA技術(shù)產(chǎn)生時(shí))、或化學(xué)物質(zhì)前體或其它化學(xué)物質(zhì)(當(dāng)通過(guò)化學(xué)合成時(shí))。此外,“經(jīng)分離的核酸片段”是天然不作為片段存在,并且在自然狀態(tài)下將不會(huì)發(fā)現(xiàn)的核酸片段。
基因可包括編碼序列、非編碼序列(例如,在基因編碼序列3’和5’末端的非翻譯序列)以及調(diào)控序列。此外,基因指本文所定義的經(jīng)分離的核酸分子。此外,本領(lǐng)域技術(shù)人員還將知道,在種群中可能存在導(dǎo)致蛋白質(zhì)氨基酸序列有所改變的DNA序列多態(tài)性。
本發(fā)明還涉及下述經(jīng)分離的多核苷酸,它們能在嚴(yán)格條件,優(yōu)選高度嚴(yán)格條件下與本發(fā)明的多核苷酸,例如,SEQ ID NO6所示的多核苷酸雜交。
本文中使用的術(shù)語(yǔ)“雜交”用于描述下述雜交和洗滌條件,在所述條件下,相互之間至少大約50%,至少大約60%,至少大約70%,更優(yōu)選至少大約80%,進(jìn)一步更優(yōu)選至少大約85%至90%,最優(yōu)選至少大約95%同源的核苷酸序列典型地保持相互雜交。
此類雜交條件的一種優(yōu)選的、非限制性的例子是在6x氯化鈉/檸檬酸鈉(SSC)中于大約45℃雜交,接著在1x SSC、0.1%SDS中于50℃,優(yōu)選于55℃,更優(yōu)選于60℃,進(jìn)一步更優(yōu)選于65℃洗一次或多次。
高度嚴(yán)格條件包括,例如,使用地高辛(DIG)標(biāo)記的DNA探針(使用DIG標(biāo)記系統(tǒng)制備的;Roche Diagnostics GmbH,68298 Mannheim,Germany),在例如含或不含100μg/ml鮭魚(yú)精DNA的DigEasyHyb溶液(Roche Diagnostics GmbH),或包含50%甲酰胺、5x SSC(150mMNaCl、15mM檸檬酸三鈉)、0.02%十二烷基硫酸鈉、0.1%N-月桂酰肌氨酸以及2%封閉試劑(Roche Diagnostics GmbH)的溶液中,于42℃溫育2小時(shí)至4天,接著于室溫在2x SSC和0.1%SDS中對(duì)濾膜洗兩次,每次5至15分鐘,然后于65-68℃C在0.5x SSC和0.1%SDS或0.1x SSC和0.1%SDS中洗兩次,每次15-30分鐘。
技術(shù)人員將知道何種條件應(yīng)用于嚴(yán)格和高度嚴(yán)格雜交條件。關(guān)于此類條件的額外指導(dǎo)在本領(lǐng)域中易于獲得,例如,在Sambrook et al.,1989,Molecular Cloning,A Laboratory Manual,cold Spring Harbor Press,N.Y.和Ausubel et al.(eds.),1995,Current Protocols in Molecular Biology,(John Wiley& Sons,N.Y.)中。當(dāng)然,僅與poly(A)序列(例如mRNA的3’末端poly(A)片斷),或與T(或U)的互補(bǔ)延伸段雜交的多核苷酸將不被包括在用于特異雜交本發(fā)明核酸一部分的多核苷酸中,因?yàn)榇祟惗嗪塑账釋⑴c含有poly(A)延伸段或其互補(bǔ)序列的任何核酸分子(例如,實(shí)踐中,任何雙鏈cDNA克隆)雜交。
本發(fā)明可用于生產(chǎn)類異戊二烯,特別是泛醌,優(yōu)選是CoQ10。優(yōu)選地,包含一處或多處突變的多核苷酸,即完整mev操縱子或僅其片斷被引入合適的微生物,所述微生物原本是mev操縱子的一種或多種基因缺陷型的,即,天然僅使用MEP途徑用于生產(chǎn)類異戊二烯。
前文所述經(jīng)突變的mev操縱子或其一種或多種基因可例如引入Rhodobacter屬的微生物中。
特別地,本發(fā)明涉及生產(chǎn)類異戊二烯,特別是泛醌,優(yōu)選是CoQ10的方法,所述方法包括(1)將本發(fā)明的多核苷酸引入原本是所述多核苷酸缺陷型的微生物中,以及(2)在允許生產(chǎn)類異戊二烯的條件下培養(yǎng)步驟(1)的微生物。優(yōu)選地,將屬于Paracoccus屬的微生物的經(jīng)突變mev操縱子或其片段引入屬于Rhodobacter屬的微生物。更優(yōu)選地,在編碼羥甲基戊二酸單酰-CoA合酶的基因中包含一處或多處突變的多核苷酸被引入所述微生物,最優(yōu)選的是引入SEQ ID NO3示出的多核苷酸序列。
原本是mev操縱子的一種或多種基因缺陷型的,即,天然僅使用MEP途徑用于生產(chǎn)類異戊二烯的任何微生物可用于本發(fā)明的目的。特別地,Rhodobacter屬的微生物可用于引入本發(fā)明的經(jīng)突變多核苷酸,例如R.sphaeroides、R.adriaticus、R.capsulatus、R.sulfidophilus或R.veldkampii。優(yōu)選菌株是R.sphaeroide,進(jìn)一步更優(yōu)選的是R.sphaeroideATCC 35053。
應(yīng)當(dāng)理解,本文提到的微生物包括具有如International Code ofNomenclature of Prokaryotes所定義的相同物理化學(xué)性質(zhì)的此類菌株的異名體(synonym)以及基原異名體(basonym)。
本發(fā)明還提供了具有引入的上述多核苷酸的重組微生物,即包含攜帶有一處或多處突變的mev操縱子的一種或多個(gè)基因,其中,對(duì)應(yīng)的野生型微生物原本是mev操縱子的一種或多種基因缺陷型的,即,天然僅使用MEP途徑用于生產(chǎn)類異戊二烯,這導(dǎo)致產(chǎn)生了類異戊二烯(特別是泛醌,優(yōu)選是CoQ10)產(chǎn)量較之對(duì)應(yīng)的野生型微生物提高。
除上述mev操縱子的一種或多種基因中的突變之外,重組微生物可含有進(jìn)一步的修飾/變化,只要它們能導(dǎo)致所述微生物中類異戊二烯產(chǎn)量提高即可。
在一種實(shí)施方式中,此類進(jìn)一步修飾是將編碼具有十異戊二烯二磷酸酯合酶活性的蛋白的DNA序列引入所述重組微生物,優(yōu)選地,可從Paracoccus屬的微生物,例如P.zeaxanthinifaciens,特別是P.zeaxanthinifaciens ATCC 21588獲得的。最優(yōu)選的是SEQ ID NO8的多核苷酸序列或編碼SEQ ID NO9的蛋白的多核苷酸。
因此,本發(fā)明涉及上述生產(chǎn)類異戊二烯,優(yōu)選CoQ10的方法,其中,編碼具有十異戊二烯二磷酸酯合酶活性的蛋白的DNA序列也被引入下述微生物,所述微生物天然情況下使用MEP途徑,并且具有包含按照上文引入的一處或多處突變的mev操縱子的一種或多種基因,例如,Rhodobacter屬的微生物。
編碼具有十異戊二烯二磷酸酯合酶活性的蛋白的任何DNA序列都可用于本發(fā)明。此類DNA的例子是Paracoccus屬的微生物,例如Paracoccus zeaxanthinifaciens,更優(yōu)選P.zeaxanthinifaciens ATCC 21588的編碼具有十異戊二烯二磷酸酯合酶活性的蛋白的ddsA基因或其部分序列。最優(yōu)選的是SEQ ID NO6示出的來(lái)自P.zeaxanthinifaciens ATCC21588的ddsA基因,其編碼十異戊二烯二磷酸酯合酶(SEQ ID NO7)。
因此,本發(fā)明的一個(gè)方面是提供生產(chǎn)CoQ10的方法,所述方法包括(1)將屬于Paraccoccus屬的微生物的、編碼具有十異戊二烯二磷酸酯合酶活性的蛋白的DNA序列和甲羥戊酸(mev)操縱子引入屬于Rhodobacter屬的微生物,其中,所述mev操縱子攜帶有一處或多處突變,以及(2)培養(yǎng)經(jīng)過(guò)修飾的Rhodobacter菌株。
術(shù)語(yǔ)“引入”被用于本發(fā)明說(shuō)明書(shū)和權(quán)利要求中關(guān)于對(duì)例如Rhodobacter屬的宿主生物或微生物進(jìn)行轉(zhuǎn)化的部分,其包括本領(lǐng)域技術(shù)人員公知的、任何可用于將遺傳物質(zhì)(特別是經(jīng)突變甲羥戊酸操縱子或其一種或多種基因)高效帶入到宿主生物中的方法,即以能使生物對(duì)其進(jìn)行表達(dá)的方式進(jìn)行的。引入例如可通過(guò)載體(優(yōu)選地,表達(dá)質(zhì)粒)來(lái)進(jìn)行,或根據(jù)標(biāo)準(zhǔn)方法,通過(guò)整合到宿主基因組中來(lái)進(jìn)行。優(yōu)選的方法是通過(guò)質(zhì)粒引入基因,例如處于PcrtE啟動(dòng)子控制下的、在表達(dá)質(zhì)粒pBBR-K-PcrtE(該質(zhì)粒的構(gòu)建已被詳細(xì)描述于WO 02/099095實(shí)施例6,第91頁(yè)12-27行)中克隆的基因。用于向Rhodobacter屬的微生物引入DNA例如表達(dá)質(zhì)粒的一種優(yōu)選方法是質(zhì)粒的接合轉(zhuǎn)移(conjugational transfer),例如,來(lái)自E.coli S17-1的質(zhì)粒向Rhodobacter菌株的接合轉(zhuǎn)移(Nishimura et al.,Nucl.Acids Res.18,6169,1990;Simon et al.,Bio/Technology 1983,784-91)。
mev操縱子或其一種或多種基因的突變可通過(guò)例如PCR定點(diǎn)誘變來(lái)產(chǎn)生,這使用本領(lǐng)域技術(shù)人員熟悉的方法來(lái)進(jìn)行,所述方法無(wú)需特別解釋??捎糜诒景l(fā)明的目的的、技術(shù)人員已知的其它誘變方法包括,例如,UV照射、換位(transposition)或化學(xué)誘變。用于鑒定展示出增加的類異戊二烯(例如CoQ10)生產(chǎn)力的突變體的篩選方法可例如選自通過(guò)UV光、HPLC、NMR或薄層色譜對(duì)類異戊二烯(例如CoQ10)進(jìn)行直接測(cè)量。類異戊二烯(例如CoQ10)的產(chǎn)量還可通過(guò)對(duì)類胡蘿卜素色密度的增加進(jìn)行測(cè)量來(lái)間接測(cè)得,該方法是本領(lǐng)域技術(shù)人員熟悉的。
可使用已知方法對(duì)用本發(fā)明的經(jīng)突變mev操縱子或其一種或多種基因轉(zhuǎn)化的宿主進(jìn)行培養(yǎng),例如在含有可被宿主吸收的、例如碳源和氮源、無(wú)機(jī)鹽等的培養(yǎng)基中,適合高效生長(zhǎng)以及目標(biāo)產(chǎn)物(特別是CoQ10)表達(dá)的溫度、pH和通風(fēng)條件下進(jìn)行。
可按照本領(lǐng)域公知的方法,來(lái)進(jìn)行下述步驟從發(fā)酵培養(yǎng)液和/或轉(zhuǎn)化子(即其中已經(jīng)引入了屬于例如Paracoccus屬的微生物的經(jīng)突變甲羥戊酸操縱子)進(jìn)行分離,以及可選地,對(duì)獲得的類異戊二烯(特別是CoQ10)的純化和進(jìn)一步加工,包括例如將產(chǎn)生的CoQ10加以配方用于人或動(dòng)物的用途。但是,為用于動(dòng)物健康和營(yíng)養(yǎng)用途,可以不需要進(jìn)行特定的純化。在該情況下,可能需要對(duì)產(chǎn)生的類異戊二烯(例如CoQ10)與生物物質(zhì)和/或發(fā)酵培養(yǎng)液的其它組分一起進(jìn)行進(jìn)一步加工,以產(chǎn)生有商業(yè)吸引力的產(chǎn)品。
本發(fā)明的方法導(dǎo)致產(chǎn)生更高產(chǎn)量的類異戊二烯,例如CoQ10。這種增加可以是較之使用例如Rhodobacter的非重組菌株或使用攜帶例如Paracoccus菌株野生型mev操縱子的例如Rhodobacter重組菌株而言增加至少大約10%。
圖1示出了在R.sphaeroides(其使用MEP途徑用于IPP形成)中對(duì)CoQ10進(jìn)行生物合成的途徑??虺龅膮^(qū)域展示了反應(yīng)順序,其包括甲羥戊酸途徑(導(dǎo)致IPP形成)加上IPP異構(gòu)酶步驟。甲羥戊酸途徑在R.sphaeroides中并非天然存在。在P.zeaxanthinifaciens中,編碼甲羥戊酸途徑的五種酶加上IPP異構(gòu)酶的基因組成一個(gè)操縱子,其在下文中被稱為甲羥戊酸操縱子。
下述實(shí)施例用于闡述本發(fā)明,而非以任何方式加以限制。
實(shí)施例1細(xì)菌和培養(yǎng)條件Rhodobacter sphaeroides菌株ATCC 35053(從American TypeCulturecollection,Manassas VA,USA獲得)被用作為基礎(chǔ)菌株,以構(gòu)建具有提高的CoQ10產(chǎn)量的重組菌株。在培養(yǎng)基RS100中,于30℃下對(duì)所有的R.sphaeroides菌株進(jìn)行培養(yǎng)。表1中概括了培養(yǎng)基RS100的組成和制備方法。將50mg/l的卡納霉素加入到培養(yǎng)基中,以培養(yǎng)重組菌株。在LB培養(yǎng)基(Becton Dickinson,Sparks,MD,USA)中,于37℃對(duì)E.coli菌株進(jìn)行培養(yǎng)。為保持重組E.coli菌株中的質(zhì)粒,向培養(yǎng)基中加入氨芐青霉素(ampicillin,100mg/l)和/或卡納霉素(25-50mg/l,取決于質(zhì)粒)。在旋轉(zhuǎn)式搖床中,于200rpm,需氧條件下,對(duì)E.coli和R.sphaeroides的液體培養(yǎng)物進(jìn)行常規(guī)培養(yǎng)。當(dāng)需要固體培養(yǎng)基時(shí),加入瓊脂(1.5%的終濃度)。
表1培養(yǎng)基RS100的組成和制備方法
實(shí)施例2對(duì)CoQ10的分析試驗(yàn)將全培養(yǎng)液(見(jiàn)實(shí)施例5)中的400μl轉(zhuǎn)移到一次性的15ml聚丙烯離心管中。加入4ml經(jīng)穩(wěn)定的抽提溶液(0.5g/l BHT,處于1∶1(v/v)DMSO/THF中),在實(shí)驗(yàn)室搖床(IKA,德國(guó))中,對(duì)樣品進(jìn)行20分鐘的混合,以促進(jìn)抽提。最后,對(duì)樣品進(jìn)行離心,將上清液轉(zhuǎn)移到琥珀色玻璃管中,以通過(guò)反相HPLC進(jìn)行分析。該方法被開(kāi)發(fā)來(lái)對(duì)泛醌及其相應(yīng)氫醌進(jìn)行同時(shí)測(cè)定,并能將類胡蘿卜素(八氫番茄紅素、球形酮(spheroidenone)、球形烯(spheroidene)和鏈孢紅素(neurosporene))與CoQ10清楚地分開(kāi)。用裝備有溫控自動(dòng)上樣儀和二極管陣列檢測(cè)器的Agilent1100HPLC系統(tǒng)(Agilent Technologies,USA)來(lái)進(jìn)行色譜分析。該方法的參數(shù)如下所示柱 YMC Carotenoid C30柱3微米,鋼質(zhì),150mm長(zhǎng)×3.0mm I.D.
(YMC,Part No.CT99S031503QT)保護(hù)柱 Security Guard C18(ODS,十八烷)4mm長(zhǎng)×3.0mm I.D.
(Phenomenex,Part No.AJO-4287)典型柱壓開(kāi)始時(shí)60bar流速0.5ml/min移動(dòng)相 乙腈(A)∶甲醇(B)∶TBME(C)的混合物梯度曲線時(shí)間(min)%A%B%C060 15 2513 60 15 2520 00 10022 60 15 25
2560 15 25后時(shí)間(post time) 4分鐘注射體積 10μl柱溫 15℃檢測(cè) 按照表2,用三種波長(zhǎng)來(lái)對(duì)特定化合物進(jìn)行檢測(cè)表2.HPLC保留時(shí)間和所用的波長(zhǎng)
計(jì)算計(jì)算基于峰的面積來(lái)進(jìn)行。
實(shí)施例3從P.zeaxanthinifaciens來(lái)克隆經(jīng)突變的mev操縱子構(gòu)建質(zhì)粒pBBR-K-mev-op-wt和pBBR-K-mev-op-R114WO 02/099095的實(shí)施例13(105頁(yè)第10行至106頁(yè)第8行)中詳細(xì)描述了對(duì)質(zhì)粒pBBR-K-mev-op-up-4(含有甲羥戊酸操縱子的前4個(gè)基因)的構(gòu)建。
使用P.zeaxanthinifaciens R114的基因組DNA作為模板,用引物hcs-5326(SEQ ID NO10)和mvd-9000(SEQ ID NO11)來(lái)進(jìn)行PCR。引物hcs-5326對(duì)應(yīng)P.zeaxanthinifaciens mev操縱子從SEQ ID NO2的3321至3340位核苷酸的序列,而引物mvd-9000對(duì)應(yīng)SEQ ID NO2的6977至6996位核苷酸序列的反向互補(bǔ)序列。將獲得的3675bp的PCR產(chǎn)物克隆進(jìn)pCR2.1-TOPO(Invitrogen,Carlsbad,CA,USA),得到質(zhì)粒TOPO-pCR2.1-mev-op-d-3wt。該質(zhì)粒因此含有甲羥戊酸操縱子的下游一半,包括hcs的3’末端和最后三個(gè)基因mvk、pmk和mvd。
用限制性內(nèi)切酶SacI和NdeI來(lái)消化質(zhì)粒pBBR-K-mev-op-up-4和TOPO-pCR2.1-mev-op-d-3wt,將從TOPO-pCR2.1-mev-op-d-3wt得到的3319bp的片段與來(lái)自pBBR-K-mev-op-up-4的8027bp的片段相連。得到的質(zhì)粒pBBR-K-mev-op-R114含有來(lái)自P.zeaxanthinifaciens R114的完整甲羥戊酸操縱子,其中包含其(可能的)啟動(dòng)子。
構(gòu)建質(zhì)粒pBBR-K-mev-op-wt-PcrtE-crtE和pBBR-K-mev-op-R114-PcrtE-crtEWO 02/099095中實(shí)施例6(第92頁(yè),10-17行)詳細(xì)描述了對(duì)質(zhì)粒pBBR-K-PcrtE-crtE的構(gòu)建。用NaeI來(lái)切割質(zhì)粒pBBR-K-PcrtE-crtE,分離出1.33kb的片段,將其插入到pBBR-K-mev-op-up-4的Ecl136II位點(diǎn)。檢查插入的定向,以與甲羥戊酸操縱子基因相同的定向攜帶crtE基因的質(zhì)粒被命名為pBBR-K-mev-op-up-4-PcrtE-crtE-2。
用SphI和SpeI切割質(zhì)粒pBBR-K-mev-op-up-4-PcrtE-crtE-2,分離出得到的含有crtE基因的5566bp的片段。將該片段與使用相同的酶對(duì)pBBR-K-mev-op-wt或pBBR-K-mev-op-R114進(jìn)行限制性消化之后獲得的7132bp的SphI-SpeI片段相連,分別得到質(zhì)粒pBBR-K-mev-op-wt-PcrtE-crtE和pBBR-K-mev-op-R114-PcrtE-crtE。
構(gòu)建質(zhì)粒pBBR-K-mev-op-wt-PcrtE-ddsAwt和pBBR-K-mev-op-R114-PcrtE-ddsAwtWO 02/099095中實(shí)施例6(第91頁(yè),12-27行)詳細(xì)描述了對(duì)質(zhì)粒pBBR-K-PcrtE的構(gòu)建。
使用引物dds-Nde(SEQ ID NO12)和dds-Bam(SEQ ID NO13)通過(guò)PCR(GC-rich PCR System,roche Molecular Biochemicals,Mannheim,Germany)來(lái)擴(kuò)增P.zeaxanthinifaciens菌株ATCC 21588的ddsA基因(被稱為ddsAwt),并將其克隆進(jìn)pCR2.1-TOPO(Invitrogen,Carlsbad,CA,USA),得到質(zhì)粒TOPO-ddsAwt。
用NdeI和BamHI切割質(zhì)粒TOPO-ddsAwt,將獲得的含有ddsA基因的1005bp的片段克隆進(jìn)用NdeI和BamHI切割過(guò)的質(zhì)粒pBBR-K-PcrtE中,得到質(zhì)粒pBBR-K-PcrtE-ddsAwt。通過(guò)使用寡核苷酸dds-R-1(SEQ IDNO14)和dds-R-2(SEQ ID NO15),利用QuikChange XL Site-Directed Mutagenesis Kit(Stratagene,La Jolla,CA,USA)引入沉默突變,來(lái)去除ddsA基因中內(nèi)切核酸酶EcoRI的識(shí)別位點(diǎn)。得到的質(zhì)粒pBBR-K-PcrtE-ddsAwt-R用EcoRI和MamI切割,將含有ddsA基因的1278bp的片段插入用EcoRI和EcoRV切割過(guò)的TOPO-ddsAwt中,得到質(zhì)粒pCR2.1-TOPO-ddsAwt-R。用CelII和XbaI切割該質(zhì)粒,將獲得的含有ddsA基因的1211bp的片段與分別用CelII和BlnI對(duì)pBBR-K-mev-op-wt-PcrtE-crtE和pBBR-K-mev-op-R114-PcrtE-crtE進(jìn)行消化獲得的11.6kb限制性片段分別相連。得到的質(zhì)粒被命名為pBBR-K-mev-op-wt-PcrtE-ddsAwt和pBBR-K-mev-op-R114-PcrtE-ddsAwt。
構(gòu)建質(zhì)粒pBBR-K-mev-op-4-89-PcrtE-ddsAwt使用QuikChange XL Site-Directed Mutagenesis Kit(Stratagene,La Jolla,CA,USA),以及引物mut4-89-1-fw(SEQ ID NO16)和mut4-89-1-rev(SEQ ID NO17),通過(guò)兩輪PCR定點(diǎn)誘變來(lái)獲得質(zhì)粒pBBR-K-mev-op-4-89-PcrtE-ddsAwt。兩條引物相互互補(bǔ),在SEQ ID NO3的2949位含有想要的突變A代替C,該位置對(duì)應(yīng)于SEQ ID NO4的268位。根據(jù)廠商說(shuō)明書(shū),按照下述過(guò)程來(lái)進(jìn)行第一輪誘變反應(yīng)將5μl 10x反應(yīng)緩沖液、10ng質(zhì)粒DNA pBBR-K-mev-op-4-89-PcrtE-ddsAwt、125ng引物mut4-89-1-fw、125ng mut4-89-1-rev、1μl dNTP混合物、3μl QuikSolution和2.5U Pfu Turbo DNA聚合酶混合至最終體積50μl。使用下述參數(shù)來(lái)進(jìn)行循環(huán)95℃1分鐘,一個(gè)循環(huán);95℃50秒,60℃50秒,68℃30分鐘,18個(gè)循環(huán);68℃7分鐘,一個(gè)循環(huán)。將反應(yīng)混合物冷卻至37℃之后,加入10U限制性內(nèi)切核酸酶DpnI,在37℃溫育反應(yīng)體系2小時(shí)。按照廠商的方案,用經(jīng)DpnI處理過(guò)的DNA轉(zhuǎn)化Escherichia coli XL10-GoldUltracompetent細(xì)胞(Stratagene,La Jolla,CA,USA)。
得到的質(zhì)粒pBBR-K-mev-op-4-89-1-PcrtE-ddsAwt被分離出,將其用作為模板DNA,進(jìn)行第二輪PCR定點(diǎn)誘變,其中使用引物mut4-89-2-fw(SEQ ID NO18)和mut4-89-2-rev(SEQ ID NO19),它們?cè)赟EQ IDNO3的6948位含有想要的突變C代替T。按照上文所述來(lái)進(jìn)行誘變。獲得的質(zhì)粒pBBR-K-mev-op-4-89-PcrtE-ddsAwt被分離出,在MicrosynthGmbH(Balgach,Switzerland)上進(jìn)行測(cè)序。經(jīng)突變mev操縱子的完整序列示為SEQ ID NO3,其中包含下述基因617至1639位的mvaA(編碼羥甲基戊二酸單酰-CoA還原酶)、1636至2685位的idi(編碼異戊烯二磷酸異構(gòu)酶)、2682至3848位的hcs(編碼羥甲基戊二酸單酰-CoA合酶)、3829至4965位的mvk(編碼甲羥戊酸激酶)、4965至5882位的pmk(編碼磷酸甲羥戊酸激酶)以及5875至6873位的mvd(編碼二磷酸甲羥戊酸脫羧酶)。
實(shí)施例4向R.sphaeroides ATCC 35053中引入經(jīng)突變mev操縱子使用標(biāo)準(zhǔn)流程,用攜帶經(jīng)突變mev操縱子的質(zhì)粒轉(zhuǎn)化E.coli S17-1(Simon et al.,Bio/Technology 11,784-791,1983)隨后通過(guò)接合將質(zhì)粒從E.coli S17-1轉(zhuǎn)移至R.sphaeroides ATCC 35053(Nishimura et al.,Nucl.AcidsRes.18,6169,1990;Simon et al.,Bio/Technology 1983,784-91)。
通過(guò)下述方法首先分離出R.sphaeroides ATCC 35053的自發(fā)利福平抗性突變體在補(bǔ)充有100mg/l利福平的RS100液體培養(yǎng)基上培養(yǎng)菌株ATCC 35053,將細(xì)胞涂布到含有100mg/l利福平的RS100平板上,分離單個(gè)菌落。為進(jìn)行接合,通過(guò)離心,對(duì)每份為1毫升的培養(yǎng)于含有100mg/l利福平的RS100培養(yǎng)基上的受體細(xì)胞(利福平抗性R.sphaeroidesATCC 35053)培養(yǎng)物和供體細(xì)胞(攜帶有待轉(zhuǎn)移質(zhì)粒的E.coli S17-1,培養(yǎng)于含有50mg/l卡納霉素的LB培養(yǎng)基中)進(jìn)行沉淀。棄去上清液,用新鮮的RS100培養(yǎng)基對(duì)細(xì)胞洗兩次,除去抗生素。然后將每份沉淀重新懸浮于1ml新鮮的RS100培養(yǎng)基中,混合50微升供體細(xì)胞和0.45ml受體細(xì)胞,通過(guò)離心沉淀,重新懸浮于0.03ml RS100培養(yǎng)基中,點(diǎn)樣至RS100平板上。30℃過(guò)夜溫育之后,用接種環(huán)收獲細(xì)胞,將其重新懸浮于0.3mlRS100培養(yǎng)基中。將該懸浮液的稀釋液涂布到含有100mg/l利福平和50mg/l卡納霉素的RS100平板上,在30℃溫育。從平板上挑出菌落(R.sphaeroides ATCC 35053的可能轉(zhuǎn)化細(xì)胞),培養(yǎng)于含有50mg/l卡納霉素的液體RS100培養(yǎng)基中,在PCR反應(yīng)中檢驗(yàn)質(zhì)粒的存在,其中退火溫度為56℃,延伸時(shí)間為1分15秒,使用下述兩對(duì)不同的引物對(duì)pBBR-K-up(SEQ ID NO20)/PcrtE-2442(SEQ ID NO21)Kan3out(SEQ ID NO22)/mvaA3256(SEQ ID NO23)將陽(yáng)性克隆劃線到含有50mg/l卡納霉素的RS100平板上,以獲得單個(gè)菌落。再在含有50mg/l卡納霉素的液體RS100培養(yǎng)基中培養(yǎng)來(lái)自每個(gè)克隆的一個(gè)單個(gè)菌落,按照上文所述通過(guò)PCR證實(shí)了期待質(zhì)粒的存在。得到的重組菌株被稱為ATCC 35053/pBBR-K-mev-op-4-89-PcrtE-ddsAwt。
實(shí)施例5在R.sphaeroides ATCC 35053的轉(zhuǎn)化菌株中生產(chǎn)CoQ10在培養(yǎng)基RS100中在搖瓶培養(yǎng)物中培養(yǎng)R.sphaeroides ATCC 35053、ATCC 35053/pBBR-K-mev-op-R114-PcrtE-ddsAwt和ATCC 35053/pBBR-K-mev-op-4-89-PcrtE-ddsAwt。含有重組R.sphaeroides的培養(yǎng)物含有50mg/l卡納霉素。在200rpm振蕩下,于30℃,在250ml帶擋板Erlenmeyer瓶中,對(duì)25毫升培養(yǎng)物進(jìn)行培養(yǎng)。為檢驗(yàn)CoQ10的生產(chǎn)情況,用R.sphaeroides菌株的經(jīng)冷凍且加入甘油的貯藏培養(yǎng)物去接種25ml的種子培養(yǎng)物。對(duì)種子培養(yǎng)物進(jìn)行24-28小時(shí)的培養(yǎng)之后,取合適體積的培養(yǎng)物,用于接種實(shí)驗(yàn)用瓶,使得660納米處最初的光密度(OD660)為0.16。以24小時(shí)為間隔,分別于無(wú)菌條件下取2毫升樣品。分析項(xiàng)目包括生長(zhǎng)情況(以O(shè)D660來(lái)測(cè))、pH、培養(yǎng)物上清液中的葡萄糖、以及CoQ10和類胡蘿卜素(通過(guò)HPLC來(lái)測(cè)定),這按照實(shí)施例2所述來(lái)進(jìn)行。結(jié)果概括于表3中。這些結(jié)果清楚表明,克隆的來(lái)自P.zeaxanthinifaciens的經(jīng)突變甲羥戊酸操縱子的表達(dá)顯著提高了R.sphaeroides中CoQ 10的產(chǎn)量。
表3.經(jīng)轉(zhuǎn)化的R.sphaeroides ATCC 35053菌株中CoQ10的產(chǎn)量
1比形成率被表示為mg/l產(chǎn)生的CoQ10/OD660。
序列表<110>帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司<120>類異戊二烯的生產(chǎn)方法<130>Case 22259<160>23<170>PatentIn version 3.2<210>1<211>7096<212>DNA<213>Paracoccus zeaxanthinifaciens ATCC 21588<400>1cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa60gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat120tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt180tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg240ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc300agcgcgggga tctcatgctg gagttcttcg cccaccccca tgggcaaata ttatacgcaa360ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtttg tgatggcttc420catgtcggca gaatgcttaa tgaattacaa cagtttttat gcaacgcgtc gaaccgcccg480tccgacgccg gtttccgcac ggaaacgcgc ggcaagttga cataacttgc acgcgacgtc540tcgattctgc ccgcgaagaa tgcgatgcat ccagatgatg cagaacgaag aagcggaagc600gcccgtgaaa gaccagatga tttcccatac cccggtgccc acgcaatggg tcggcccgat660cctgttccgc ggccccgtcg tcgagggccc gatcagcgcg ccgctggcca cctacgagac720gccgctctgg ccctcgaccg cgcggggggc aggggtttcc cggcattcgg gcgggatcca780ggtctcgctg gtcgacgaac gcatgagccg ctcgatcgcg ctgcgggcgc atgacggggc840ggcggcgacc gccgcctggc agtcgatcaa ggcccgccag gaagaggtcg cggccgtggt900cgccaccacc agccgcttcg cccgccttgt cgagctgaat cgccagatcg tgggcaacct960gctttacatc cgcatcgaat gcgtgacggg cgacgcctcg ggtcacaaca tggtcaccaa1020ggccgccgag gccgtgcagg gctggatcct gtcggaatac ccgatgctgg cctattccac1080gatctcgggg aacctgtgca ccgacaagaa ggcgtcggcg gtcaacggca tcctgggccg1140cggcaaatac gccgtcgccg aggtcgagat cccgcgcaag atcctgaccc gcgtgctgcg1200caccagcgcc gagaagatgg tccgcctgaa ctacgagaag aactatgtcg ggggtacgct1260
ggcggggtcg ctgcgcagtg cgaacgcgca tttcgccaac atgctgctgg gcttctacct1320ggcgacgggg caggacgcgg ccaacatcat cgaggccagc cagggcttcg tccattgcga1380ggcccgcggc gaggatctgt atttctcgtg cacgctgccc aacctcatca tgggctcggt1440cggtgccggc aagggcatcc cctcgatcga ggagaacctg tcgcggatgg gctgccgcca1500gccgggcgaa cccggcgaca acgcgcgccg tcttgcggcg atctgcgcgg gcgtcgtgct1560gtgtggtgaa ttgtcgctgc ttgcggccca gaccaacccc ggagagttgg tccgcaccca1620catggagatg gagcgatgac cgacagcaag gatcaccatg tcgcggggcg caagctggac1680catctgcgtg cattggacga cgatgcggat atcgaccggg gcgacagcgg cttcgaccgc1740atcgcgctga cccatcgcgc cctgcccgag gtggatttcg acgccatcga cacggcgacc1800agcttcctgg gccgtgaact gtccttcccg ctgctgatct cgtccatgac cggcggcacc1860ggcgaggaga tcgagcgcat caaccgcaac ctggccgctg gtgccgagga ggcccgcgtc1920gccatggcgg tgggctcgca gcgcgtgatg ttcaccgacc cctcggcgcg ggccagcttc1980gacctgcgcg cccatgcgcc caccgtgccg ctgctggcca atatcggcgc ggtgcagctg2040aacatggggc tggggctgaa ggaatgcctg gccgcgatcg aggtgctgca ggcggacggc2100ctgtatctgc acctgaaccc cctgcaagag gccgtccagc ccgaggggga tcgcgacttt2160gccgatctgg gcagcaagat cgcggccatc gcccgcgacg ttcccgtgcc cgtcctgctg2220aaggaggtgg gctgcggcct gtcggcggcc gatatcgcca tcgggctgcg cgccgggatc2280cggcatttcg acgtggccgg tcgcggcggc acatcctgga gccggatcga gtatcgccgc2340cgccagcggg ccgatgacga cctgggcctg gtcttccagg actggggcct gcagaccgtg2400gacgccctgc gcgaggcgcg gcccgcgctt gcggcccatg atggaaccag cgtgctgatc2460gccagcggcg gcatccgcaa cggtgtcgac atggcgaaat gcgtcatcct gggggccgac2520atgtgcgggg tcgccgcgcc cctgctgaaa gcggcccaaa actcgcgcga ggcggttgta2580tccgccatcc ggaaactgca tctggagttc cggacagcca tgttcctcct gggttgcggc2640acgcttgccg acctgaagga caattcctcg cttatccgtc aatgaaagtg cctaagatga2700ccgtgacagg aatcgaagcg atcagcttct acacccccca gaactacgtg ggactggata2760tccttgccgc gcatcacggg atcgaccccg agaagttctc gaaggggatc gggcaggaga2820aaatcgcact gcccggccat gacgaggata tcgtgaccat ggccgccgag gccgcgctgc2880cgatcatcga acgcgcgggc acgcagggca tcgacacggt tctgttcgcc accgagagcg2940ggatcgacca gtcgaaggcc gccgccatct atctgcgccg cctgctggac ctgtcgccca3000
actgccgttg cgtcgagctg aagcaggcct gctattccgc gacggcggcg ctgcagatgg3060cctgcgcgca tgtcgcccgc aagcccgacc gcaaggtgct ggtgatcgcg tccgatgtcg3120cgcgctatga ccgcgaaagc tcgggcgagg cgacgcaggg tgcgggcgcc gtcgccatcc3180ttgtcagcgc cgatcccaag gtggccgaga tcggcaccgt ctcggggctg ttcaccgagg3240atatcatgga tttctggcgg ccgaaccacc gccgcacgcc cctgttcgac ggcaaggcat3300cgacgctgcg ctatctgaac gcgctggtcg aggcgtggaa cgactatcgc gcgaatggcg3360gccacgagtt cgccgatttc gcgcatttct gctatcacgt gccgttctcg cggatgggcg3420agaaggcgaa cagccacctg gccaaggcga acaagacgcc ggtggacatg gggcaggtgc3480agacgggcct gatctacaac cggcaggtcg ggaactgcta taccgggtcg atctacctgg3540cattcgcctc gctgctggag aacgctcagg aggacctgac cggcgcgctg gtcggtctgt3600tcagctatgg ctcgggtgcg acgggcgaat tcttcgatgc gcggatcgcg cccggttacc3660gcgaccacct gttcgcggaa cgccatcgcg aattgctgca ggatcgcacg cccgtcacat3720atgacgaata cgttgccctg tgggacgaga tcgacctgac gcagggcgcg cccgacaagg3780cgcgcggtcg tttcaggctg gcaggtatcg aggacgagaa gcgcatctat gtcgaccggc3840aggcctgaag caggcgccca tgccccgggc aagctgatcc tgtccgggga acattccgtg3900ctctatggtg cgcccgcgct tgccatggcc atcgcccgct ataccgaggt gtggttcacg3960ccgcttggca ttggcgaggg gatacgcacg acattcgcca atctctcggg cggggcgacc4020tattcgctga agctgctgtc ggggttcaag tcgcggctgg accgccggtt cgagcagttc4080ctgaacggcg acctaaaggt gcacaaggtc ctgacccatc ccgacgatct ggcggtctat4140gcgctggcgt cgcttctgca cgacaagccg ccggggaccg ccgcgatgcc gggcatcggc4200gcgatgcacc acctgccgcg accgggtgag ctgggcagcc ggacggagct gcccatcggc4260gcgggcatgg ggtcgtctgc ggccatcgtc gcggccacca cggtcctgtt cgagacgctg4320ctggaccggc ccaagacgcc cgaacagcgc ttcgaccgcg tccgcttctg cgagcggttg4380aagcacggca aggccggtcc catcgacgcg gccagcgtcg tgcgcggcgg gcttgtccgc4440gtgggcggga acgggccggg ttcgatcagc agcttcgatt tgcccgagga tcacgacctt4500gtcgcgggac gcggctggta ctgggtactg cacgggcgcc ccgtcagcgg gaccggcgaa4560tgcgtcagcg cggtcgcggc ggcgcatggt cgcgatgcgg cgctgtggga cgccttcgca4620gcctgcaccc gcgcgttgga ggccgcgctg ctgtctgggg gcagccccga cgccgccatc4680accgagaacc agcgcctgct ggaacgcatc ggcgtcgtgc cggcagcgac gcaggccctc4740gtggcccaga tcgaggaggc gggtggcgcg gccaagatct gcggcgcagg ttccgtgcgg4800
ggcgatcacg gcggggcggt cctcgtgcgg attgacgacg cgcaggcgat ggcttcggtc4860atggcgcgcc atcccgacct cgactgggcg cccctgcgca tgtcgcgcac gggggcggca4920cccggccccg cgccgcgtgc gcaaccgctg ccggggcagg gctgatggat caggtcatcc4980gcgccagcgc gccgggttcg gtcatgatca cgggcgaaca tgccgtggtc tatggacacc5040gcgccatcgt cgccgggatc gagcagcgcg cccatgtgac gatcgtcccg cgtgccgacc5100gcatgtttcg catcacctcg cagatcgggg cgccgcagca ggggtcgctg gacgatctgc5160ctgcgggcgg gacctatcgc ttcgtgctgg ccgccatcgc gcgacacgcg ccggacctgc5220cttgcgggtt cgacatggac atcacctcgg ggatcgatcc gaggctcggg cttggatcct5280cggcggcggt gacggtcgcc tgcctcggcg cgctgtcgcg gctggcgggg cgggggaccg5340aggggctgca tgacgacgcg ctgcgcatcg tccgcgccat ccagggcagg ggcagcgggg5400ccgatctggc ggccagcctg catggcggct tcgtcgccta tcgcgcgccc gatggcggtg5460ccgcgcagat cgaggcgctt ccggtgccgc cggggccgtt cggcctgcgc tatgcgggct5520acaagacccc gacagccgag gtgctgcgcc ttgtggccga tcggatggcg ggcaacgagg5580ccgctttcga cgcgctctac tcccggatgg gcgcaagcgc agatgccgcg atccgcgcgg5640cgcaagggct ggactgggct gcattccacg acgcgctgaa cgaataccag cgcctgatgg5700agcagctggg cgtgtccgac gacacgctgg acgcgatcat ccgcgaggcg cgcgacgcgg5760gcgccgcagt cgccaagatc tccggctcgg ggctggggga ttgcgtgctg gcactgggcg5820accagcccaa gggtttcgtg cccgcaagca ttgccgagaa gggacttgtt ttcgatgact5880gatgccgtcc gcgacatgat cgcccgtgcc atggcgggcg cgaccgacat ccgagcagcc5940gaggcttatg cgcccagcaa catcgcgctg tcgaaatact ggggcaagcg cgacgccgcg6000cggaaccttc cgctgaacag ctccgtctcg atctcgttgg cgaactgggg ctctcatacg6060cgggtcgagg ggtccggcac gggccacgac gaggtgcatc acaacggcac gctgctggat6120ccgggcgacg ccttcgcgcg ccgcgcgttg gcattcgctg acctgttccg gggggggagg6180cacctgccgc tgcggatcac gacgcagaac tcgatcccga cggcggcggg gcttgcctcg6240tcggcctcgg ggttcgcggc gctgacccgt gcgctggcgg gggcgttcgg gctggatctg6300gacgacacgg atctgagccg catcgcccgg atcggcagtg gcagcgccgc ccgctcgatc6360tggcacggct tcgtccgctg gaaccggggc gaggccgagg atgggcatga cagccacggc6420gtcccgctgg acctgcgctg gcccggcttc cgcatcgcga tcgtggccgt ggacaagggg6480cccaagcctt tcagttcgcg cgacggcatg aaccacacgg tcgagaccag cccgctgttc6540
ccgccctggc ctgcgcaggc ggaagcggat tgccgcgtca tcgaggatgc gatcgccgcc6600cgcgacatgg ccgccctggg tccgcgggtc gaggcgaacg cccttgcgat gcacgccacg6660atgatggccg cgcgcccgcc gctctgctac ctgacgggcg gcagctggca ggtgctggaa6720cgcctgtggc aggcccgcgc ggacgggctt gcggcctttg cgacgatgga tgccggcccg6780aacgtcaagc tgatcttcga ggaaagcagc gccgccgacg tgctgtacct gttccccgac6840gccagcctga tcgcgccgtt cgaggggcgt tgaacgcgta agacgaccac tgggtaaggt6900tctgccgcgc gtggtctcga ctgcctgcaa agaggtgctt gagttgctgc gtgactgcgg6960cggccgactt cgtgggactt gcccgccacg ctgacgaagg gcgaattcca gcacactggc7020ggccgttact agttctagag cggccgccac cgcggtggag ggcggcacct cgctaacgga7080ttcaccgttt ttatca7096<210>2<211>7096<212>DNA<213>Paracoccus sp.R114<400>2cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa60gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat120tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt180tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg240ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc300agcgcgggga tctcatgctg gagttcttcg cccaccccca tgggcaaata ttatacgcaa360ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtttg tgatggcttc420catgtcggca gaatgcttaa tgaattacaa cagtttttat gcaacgcgtc gaaccgcccg480tccgacgccg gtttccgcac ggaaacgcgc ggcaagttga cataacttgc acgcgacgtc540tcgattctgc ccgcgaagaa tgcgatgcat ccagatgatg cagaacgaag aagcggaagc600gcccgtgaaa gaccagatga tttcccatac cccggtgccc acgcaatggg tcggcccgat660cctgttccgc ggccccgtcg tcgagggccc gatcagcgcg ccgctggcca cctacgagac720gccgctctgg ccctcgaccg cgcggggggc aggggtttcc cggcattcgg gcgggatcca780ggtctcgctg gtcgacgaac gcatgagccg ctcgatcgcg ctgcgggcgc atgacggggc840ggcggcgacc gccgcctggc agtcgatcaa ggcccgccag gaagaggtcg cggccgtggt900cgccaccacc agccgcttcg cccgccttgt cgagctgaat cgccagatcg tgggcaacct960
gctttacatc cgcatcgaat gcgtgacggg cgacgcctcg ggtcacaaca tggtcaccaa1020ggccgccgag gccgtgcagg gctggatcct gtcggaatac ccgatgctgg cctattccac1080gatctcgggg aacctgtgca ccgacaagaa ggcgtcggcg gtcaacggca tcctgggccg1140cggcaaatac gccgtcgccg aggtcgagat cccgcgcaag atcctgaccc gcgtgctgcg1200caccagcgcc gagaagatgg tccgcctgaa ctacgagaag aactatgtcg ggggtacgct1260ggcggggtcg ctgcgcagtg cgaacgcgca tttcgccaac atgctgctgg gcttctacct1320ggcgacgggg caggacgcgg ccaacatcat cgaggccagc cagggcttcg tccattgcga1380ggcccgcggc gaggatctgt atttctcgtg cacgctgccc aacctcatca tgggctcggt1440cggtgccggc aagggcatcc cctcgatcga ggagaacctg tcgcggatgg gctgccgcca1500gccgggcgaa cccggcgaca acgcgcgccg tcttgcggcg atctgcgcgg gcgtcgtgct1560gtgtggtgaa ttgtcgctgc ttgcggccca gaccaacccc ggagagttgg tccgcaccca1620catggagatg gagcgatgac cgacagcaag gatcaccatg tcgcggggcg caagctggac1680catctgcgtg cattggacga cgatgcggat atcgaccggg gcgacagcgg cttcgaccgc1740atcgcgctga cccatcgcgc cctgcccgag gtggatttcg acgccatcga cacggcgacc1800agcttcctgg gccgtgaact gtccttcccg ctgctgatct cgtccatgac cggcggcacc1860ggcgaggaga tcgagcgcat caaccgcaac ctggccgctg gtgccgagga ggcccgcgtc1920gccatggcgg tgggctcgca gcgcgtgatg ttcaccgacc cctcggcgcg ggccagcttc1980gacctgcgcg cccatgcgcc caccgtgccg ctgctggcca atatcggcgc ggtgcagctg2040aacatggggc tggggctgaa ggaatgcctg gccgcgatcg aggtgctgca ggcggacggc2100ctgtatctgc acctgaaccc cctgcaagag gccgtccagc ccgaggggga tcgcgacttt2160gccgatctgg gcagcaagat cgcggccacc gcccgcgacg ttcccgtgcc cgttttgctg2220aaggaggtgg gctgcggcct gtcggcggcc gatatcgcca tcgggctgcg cgccgggatc2280cggcatttcg acgtggccgg tcgcggcggc acatcctgga gccggatcga gtatcgccgc2340cgccagcggg ccgatgacga cctgggcctg gtcttccagg actggggcct gcagaccgtg2400gacgccctgc gcgaggcgcg gcccgcgctt gcggcccatg atggaaccag cgtgctgatc2460gccagcggcg gcatccgcaa cggtgtcgac atggcgaaat gcgtcatcct gggggccgac2520atgtgcgggg tcgccgcgcc cctgctgaaa gcggcccaaa actcgcgcga ggcggttgta2580tccgccatcc ggaaactgca tctggagttc cggacagcca tgttcctcct gggttgcggc2640acgcttgccg acctgaagga caattcctcg cttatccgtc aatgaaagtg cctaagatga2700ccgtgacagg aatcgaagcg atcagcttct acacccccca gaactacgtg ggactggata2760
tccttgccgc gcatcacggg atcgaccccg agaagttctc gaaggggatc gggcaggaga2820aaatcgcact gcccggccat gacgaggata tcgtgaccat ggccgccgag gccgcgctgc2880cgatcatcga acgcgcgggc acgcagggca tcgacacggt tctgttcgcc accgagagcg2940ggatcgacca gtcgaaggcc gccgccatct atctgcgccg cctgctggac ctgtcgccca3000actgccgttg cgtcgagctg aagcaggcct gctattccgc gacggcggcg ctgcagatgg3060cctgcgcgca tgtcgcccgc aagcccgacc gcaaggtgct ggtgatcgcg tccgatgtcg3120cgcgctatga ccgcgaaagc tcgggcgagg cgacgcaggg tgcgggcgcc gtcgccatcc3180ttgtcagcgc cgatcccaag gtggccgaga tcggcaccgt ctcggggctg ttcaccgagg3240atatcatgga tttctggcgg ccgaaccacc gccgcacgcc cctgttcgac ggcaaggcat3300cgacgctgcg ctatctgaac gcgctggtcg aggcgtggaa cgactatcgc gcgaatggcg3360gccacgagtt cgccgatttc gcgcatttct gctatcacgt gccgttctcg cggatgggcg3420agaaggcgaa cagccacctg gccaaggcga acaagacgcc ggtggacatg gggcaggtgc3480agacgggcct gatctacaac cggcaggtcg ggaactgcta taccgggtcg atctacctgg3540cattcgcctc gctgctggag aacgctcagg aggacctgac cggcgcgctg gtcggtctgt3600tcagctatgg ctcgggtgcg acgggcgaat tcttcgatgc gcggatcgcg cccggttacc3660gcgaccacct gttcgcggaa cgccatcgcg aattgctgca ggatcgcacg cccgtcacat3720atgacgaata cgttgccctg tgggacgaga tcgacctgac gcagggcgcg cccgacaagg3780cgcgcggtcg tttcaggctg gcaggtatcg aggacgagaa gcgcatctat gtcgaccggc3840aggcctgaag caggcgccca tgccccgggc aagctgatcc tgtccgggga acattccgtg3900ctctatggtg cgcccgcgct tgccatggcc atcgcccgct ataccgaggt gtggttcacg3960ccgcttggca ttggcgaggg gatacgcacg acattcgcca atctctcggg cggggcgacc4020tattcgctga agctgctgtc ggggttcaag tcgcggctgg accgccggtt cgagcagttc4080ctgaacggcg acctaaaggt gcacaaggtc ctgacccatc ccgacgatct ggcggtctat4140gcgctggcgt cgcttctgca cgacaagccg ccggggaccg ccgcgatgcc gggcatcggc4200gcgatgcacc acctgccgcg accgggtgag ctgggcagcc ggacggagct gcccatcggc4260gcgggcatgg ggtcgtctgc ggccatcgtc gcggccacca cggtcctgtt cgagacgctg4320ctggaccggc ccaagacgcc cgaacagcgc ttcgaccgcg tccgcttctg cgagcggttg4380aagcacggca aggccggtcc catcgacgcg gccagcgtcg tgcgcggcgg gcttgtccgc4440gtgggcggga acgggccggg ttcgatcagc agcttcgatt tgcccgagga tcacgacctt4500
gtcgcgggac gcggctggta ctgggtactg cacgggcgcc ccgtcagcgg gaccggcgaa4560tgcgtcagcg cggtcgcggc ggcgcatggt cgcgatgcgg cgctgtggga cgccttcgca4620gtctgcaccc gcgcgttgga ggccgcgctg ctgtctgggg gcagccccga cgccgccatc4680accgagaacc agcgcctgct ggaacgcatc ggcgtcgtgc cggcagcgac gcaggccctc4740gtggcccaga tcgaggaggc gggtggcgcg gccaagatct gcggcgcagg ttccgtgcgg4800ggcgatcacg gcggggcggt cctcgtgcgg attgacgacg cgcaggcgat ggcttcggtc4860atggcgcgcc atcccgacct cgactgggcg cccctgcgca tgtcgcgcac gggggcggca4920cccggccccg cgccgcgtgc gcaaccgctg ccggggcagg gctgatggat caggtcatcc4980gcgccagcgc gccgggttcg gtcatgatca cgggcgaaca tgccgtggtc tatggacacc5040gcgccatcgt cgccgggatc gagcagcgcg cccatgtgac gatcgtcccg cgtgccgacc5100gcatgtttcg catcacctcg cagatcgggg cgccgcagca ggggtcgctg gacgatctgc5160ctgcgggcgg gacctatcgc ttcgtgctgg ccgccatcgc gcgacacgcg ccggacctgc5220cttgcgggtt cgacatggac atcacctcgg ggatcgatcc gaggctcggg cttggatcct5280cggcggcggt gacggtcgcc tgcctcggcg cgctgtcgcg gctggcgggg cgggggaccg5340aggggctgca tgacgacgcg ctgcgcatcg tccgcgccat ccagggcagg ggcagcgggg5400ccgatctggc ggccagcctg catggcggct tcgtcgccta tcgcgcgccc gatggcggtg5460ccgcgcagat cgaggcgctt ccggtgccgc cggggccgtt cggcctgcgc tatgcgggct5520acaagacccc gacagccgag gtgctgcgcc ttgtggccga tcggatggcg ggcaacgagg5580ccgctttcga cgcgctctac tcccggatgg gcgcaagcgc agatgccgcg atccgcgcgg5640cgcaagggct ggactgggct gcattccacg acgcgctgaa cgaataccag cgcctgatgg5700agcagctggg cgtgtccgac gacacgccgg acgcgatcat ccgcgaggcg cgcgacgcgg5760gcgccgcagt cgccaagatc tccggctcgg ggctggggga ttgcgtgctg gcactgggcg5820accagcccaa gggtttcgtg cccgcaagca ttgccgagaa gggacttgtt ttcgatgact5880gatgccgtcc gcgacatgat cgcccgtgcc atggcgggcg cgaccgacat ccgagcagcc5940gaggcttatg cgcccagcaa catcgcgctg tcgaaatact ggggcaagcg cgacgccgcg6000cggaaccttc cgctgaacag ctccgtctcg atctcgttgg cgaactgggg ctctcatacg6060cgggtcgagg ggtccggcac gggccacgac gaggtgcatc acaacggcac gctgctggat6120ccgggcgacg ccttcgcgcg ccgcgcgttg gcattcgctg acctgttccg gggggggagg6180cacctgccgc tgcggatcac gacgcagaac tcgatcccga cggcggcggg gcttgcctcg6240tcggcctcgg ggttcgcggc gctgacccgt gcgctggcgg gggcgttcgg gctggatctg6300
gacgacacgg atctgagccg catcgcccgg atcggcagtg gcagcgccgc ccgctcgatc6360tggcacggct tcgtccgctg gaaccggggc gaggccgagg atgggcatga cagccacggc6420gtcccgctgg acctgcgctg gcccggcttc cgcatcgcga tcgtggccgt ggacaagggg6480cccaagcctt tcagttcgcg cgacggcatg aaccacacgg tcgagaccag cccgctgttc6540ccgccctggc ctgcgcaggc ggaagcggat tgccgcgtca tcgaggatgc gatcgccgcc6600cgcgacatgg ccgccctggg tccgcgggtc gaggcgaacg cccttgcgat gcacgccacg6660atgatggccg cgcgcccgcc gctctgctac ctgacgggcg gcagctggca ggtgctggaa6720cgcctgtggc aggcccgcgc ggacgggctt gcggcctttg cgacgatgga tgccggcccg6780aacgtcaagc tgatcttcga ggaaagcagc gccgccgacg tgctgtacct gttccccgac6840gccagcctga tcgcgccgtt cgaggggcgt tgaacgcgta agacgaccac tgggtaaggt6900tctgccgcgc gtggtctcga ctgcctgcaa agaggtgctt gagttgctgc gtgactgcgg6960cggccgactt cgtgggactt gcccgccacg ctgacgaagg gcgaattcca gcacactggc7020ggccgttact agttctagag cggccgccac cgcggtggag ggcggcacct cgctaacgga7080ttcaccgttt ttatca7096<210>3<211>1167<212>DNA<213>Paracoccus sp.R114<400>3atgaaagtgc ctaagatgac cgtgacagga atcgaagcga tcagcttcta caccccccag60aactacgtgg gactggatat ccttgccgcg catcacggga tcgaccccga gaagttctcg120aaggggatcg ggcaggagaa aatcgcactg cccggccatg acgaggatat cgtgaccatg180gccgccgagg ccgcgctgcc gatcatcgaa cgcgcgggca cgcagggcat cgacacggtt240ctgttcgcca ccgagagcgg gatcgaccag tcgaaggccg ccgccatcta tctgcgccgc300ctgctggacc tgtcgcccaa ctgccgttgc gtcgagctga agcaggcctg ctattccgcg360acggcggcgc tgcagatggc ctgcgcgcat gtcgcccgca agcccgaccg caaggtgctg420gtgatcgcgt ccgatgtcgc gcgctatgac cgcgaaagct cgggcgaggc gacgcagggt480gcgggcgccg tcgccatcct tgtcagcgcc gatcccaagg tggccgagat cggcaccgtc540tcggggctgt tcaccgagga tatcatggat ttctggcggc cgaaccaccg ccgcacgccc600ctgttcgacg gcaaggcatc gacgctgcgc tatctgaacg cgctggtcga ggcgtggaac660gactatcgcg cgaatggcgg ccacgagttc gccgatttcg cgcatttctg ctatcacgtg720
ccgttctcgc ggatgggcga gaaggcgaac agccacctgg ccaaggcgaa caagacgccg780gtggacatgg ggcaggtgca gacgggcctg atctacaacc ggcaggtcgg gaactgctat840accgggtcga tctacctggc attcgcctcg ctgctggaga acgctcagga ggacctgacc900ggcgcgctgg tcggtctgtt cagctatggc tcgggtgcga cgggcgaatt cttcgatgcg960cggatcgcgc ccggttaccg cgaccacctg ttcgcggaac gccatcgcga attgctgcag1020gatcgcacgc ccgtcacata tgacgaatac gttgccctgt gggacgagat cgacctgacg1080cagggcgcgc ccgacaaggc gcgcggtcgt ttcaggctgg caggtatcga ggacgagaag1140cgcatctatg tcgaccggca ggcctga1167<210>4<211>388<212>PRT<213>Paracoccus sp.R114<400>4Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile Ser Phe1 5 10 15Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala His His20 25 30Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu Lys Ile35 40 45Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala Glu Ala50 55 60Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp Thr Val65 70 75 80Leu Phe Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala Ala Ile85 90 95Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys Val Glu100 105 110Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met Ala Cys115 120 125Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile Ala Ser130 135 140
Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr Gln Gly145 150 155 160Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val Ala Glu165 170 175Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp Phe Trp180 185 190Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala Ser Thr195 200 205Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr Arg Ala210 215 220Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr His Val225 230 235 240Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala Lys Ala245 250 255Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu Ile Tyr260 265 270Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu Ala Phe275 280 285Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala Leu Val290 295 300Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe Asp Ala305 310 315 320Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg His Arg325 330 335Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr Val Ala340 345 350Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys Ala Arg355 360 365Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile Tyr Val
370 375 380Asp Arg Gln Ala385<210>5<211>1167<212>DNA<213>Paracoccus sp.R114<400>5atgaaagtgc ctaagatgac cgtgacagga atcgaagcga tcagcttcta caccccccag60aactacgtgg gactggatat ccttgccgcg catcacggga tcgaccccga gaagttctcg120aaggggatcg ggcaggagaa aatcgcactg cccggccatg acgaggatat cgtgaccatg180gccgccgagg ccgcgctgcc gatcatcgaa cgcgcgggca cgcagggcat cgacacggtt240ctgttcgcca ccgagagcgg gatcgacaag tcgaaggccg ccgccatcta tctgcgccgc300ctgctggacc tgtcgcccaa ctgccgttgc gtcgagctga agcaggcctg ctattccgcg360acggcggcgc tgcagatggc ctgcgcgcat gtcgcccgca agcccgaccg caaggtgctg420gtgatcgcgt ccgatgtcgc gcgctatgac cgcgaaagct cgggcgaggc gacgcagggt480gcgggcgccg tcgccatcct tgtcagcgcc gatcccaagg tggccgagat cggcaccgtc540tcggggctgt tcaccgagga tatcatggat ttctggcggc cgaaccaccg ccgcacgccc600ctgttcgacg gcaaggcatc gacgctgcgc tatctgaacg cgctggtcga ggcgtggaac660gactatcgcg cgaatggcgg ccacgagttc gccgatttcg cgcatttctg ctatcacgtg720ccgttctcgc ggatgggcga gaaggcgaac agccacctgg ccaaggcgaa caagacgccg780gtggacatgg ggcaggtgca gacgggcctg atctacaacc ggcaggtcgg gaactgctat840accgggtcga tctacctggc attcgcctcg ctgctggaga acgctcagga ggacctgacc900ggcgcgctgg tcggtctgtt cagctatggc tcgggtgcga cgggcgaatt cttcgatgcg960cggatcgcgc ccggttaccg cgaccacctg ttcgcggaac gccatcgcga attgctgcag1020gatcgcacgc ccgtcacata tgacgaatac gttgccctgt gggacgagat cgacctgacg1080cagggcgcgc ccgacaaggc gcgcggtcgt ttcaggctgg caggtatcga ggacgagaag1140cgcatctatg tcgaccggca ggcctga1167<210>6<211>388<212>PRT<213>Paracoccus sp.R114
<400>6Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile Ser Phe1 5 10 15Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala His His20 25 30Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu Lys Ile35 40 45Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala Glu Ala50 55 60Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp Thr Val65 70 75 80Leu Phe Ala Thr Glu Ser Gly Ile Asp Lys Ser Lys Ala Ala Ala Ile85 90 95Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys Val Glu100 105 110Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met Ala Cys115 120 125Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile Ala Ser130 135 140Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr Gln Gly145 150 155 160Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val Ala Glu165 170 175Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp Phe Trp180 185 190Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala Ser Thr195 200 205Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr Arg Ala210 215 220Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr His Val
225 230 235 240Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala Lys Ala245 250 255Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu Ile Tyr260 265 270Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu Ala Phe275 280 285Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala Leu Val290 295 300Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe Asp Ala305 310 315 320Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg His Arg325 330 335Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr Val Ala340 345 350Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys Ala Arg355 360 365Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile Tyr Val370 375 380Asp Arg Gln Ala385<210>7<211>1002<212>DNA<213>Paracoccus zeaxanthinifaciens ATCC 21588<400>7atgaacgtgc aggaagacgt ccgcaaacca ctggaccggc tggccgaggc gctggcaccc60gagatggagg ccgtgaacgc gctgatccgc gaacgcatgg ccagcaggca tgcgccgcgc120atccccgagg tgaccgccca cctgatcgag gccggcggca agcgcctgcg cccgatgctg180accctggccg cggcgaagct gcttggctat ggcggcccct atcacgtgca tctggccgcg240acggtcgaat tcatccacac cgcgaccctg ctgcatgacg acgtggtcga cgaaagccgc300
cagcgccgcg ggcgtccgac ggcgaacctg ctgtgggaca acaagtccag cgtgctggtc360ggcgattacc tgttcgcgcg cagcttccag ctgatggtcg aacccggcag catgcgcacg420ctcgagatcc tgtcgaacgc cgccgccacc atcgccgagg gcgaggtgct gcagctgacc480gcggcgcagg atctggccac gaacgaggac atctatctgc aggtcgtgcg cggcaagacg540gcagcgctgt tctcggccgc gaccgaggtg ggcggcgtca tcgcgggcgt ccccgatgcg600caggtccgcg cgctgttcga ttacggcgac gcgcttggca tcgccttcca gatcgtggac660gacctgctgg attacggcgg caccgccgag gcgatcggca agaataccgg cgacgatttc720cgcgaacgca agctgacgct gccggtgatc aaggccgtgg cccgcgccac ccccgaggaa780cgcgccttct ggtcgcgcac catcgagaag ggcgaccaga aggacggcga ccttgaacac840gcgctggaac tgctggcccg ccacggcgcg atggccgatg cccgccgcga cgcgctggac900tgggcggcca gggcccgcgc ctccctgcag atcctgcccg agcatccgat ccgcgacatg960ctgtcggacc tggccgattt cgtggtcgaa cgcatcgcct ga 1002<210>8<211>333<212>PRT<213>Paracoccus zeaxanthinifaciens ATCC 21588<400>8Met Asn Val Gln Glu Asp Val Arg Lys Pro Leu Asp Arg Leu Ala Glu1 5 10 15Ala Leu Ala Pro Glu Met Glu Ala Val Asn Ala Leu Ile Arg Glu Arg20 25 30Met Ala Ser Arg His Ala Pro Arg Ile Pro Glu Val Thr Ala His Leu35 40 45Ile Glu Ala Gly Gly Lys Arg Leu Arg Pro Met Leu Thr Leu Ala Ala50 55 60Ala Lys Leu Leu Gly Tyr Gly Gly Pro Tyr His Val His Leu Ala Ala65 70 75 80Thr Val Glu Phe Ile His Thr Ala Thr Leu Leu His Asp Asp Val Val85 90 95Asp Glu Ser Arg Gln Arg Arg Gly Arg Pro Thr Ala Asn Leu Leu Trp100 105 110
Asp Asn Lys Ser Ser Val Leu Val Gly Asp Tyr Leu Phe Ala Arg Ser115 120 125Phe Gln Leu Met Val Glu Pro Gly Ser Met Arg Thr Leu Glu Ile Leu130 135 140Ser Asn Ala Ala Ala Thr Ile Ala Glu Gly Glu Val Leu Gln Leu Thr145 150 155 160Ala Ala Gln Asp Leu Ala Thr Asn Glu Asp Ile Tyr Leu Gln Val Val165 170 175Arg Gly Lys Thr Ala Ala Leu Phe Ser Ala Ala Thr Glu Val Gly Gly180 185 190Val Ile Ala Gly Val Pro Asp Ala Gln Val Arg Ala Leu Phe Asp Tyr195 200 205Gly Asp Ala Leu Gly Ile Ala Phe Gln Ile Val Asp Asp Leu Leu Asp210 215 220Tyr Gly Gly Thr Ala Glu Ala Ile Gly Lys Asn Thr Gly Asp Asp Phe225 230 235 240Arg Glu Arg Lys Leu Thr Leu Pro Val Ile Lys Ala Val Ala Arg Ala245 250 255Thr Pro Glu Glu Arg Ala Phe Trp Ser Arg Thr Ile Glu Lys Gly Asp260 265 270Gln Lys Asp Gly Asp Leu Glu His Ala Leu Glu Leu Leu Ala Arg His275 280 285Gly Ala Met Ala Asp Ala Arg Arg Asp Ala Leu Asp Trp Ala Ala Arg290 295 300Ala Arg Ala Ser Leu Gln Ile Leu Pro Glu His Pro Ile Arg Asp Met305 310 315 320Leu Ser Asp Leu Ala Asp Phe Val Val Glu Arg Ile Ala325 330<210>9<211>20
<212>DNA<213>人工<220>
<223>引物<400>9gcgctggtcg aggcgtggaa 20<210>10<211>20<212>DNA<213>人工<220>
<223>引物<400>10cgtcagcgtg gcgggcaagt 20<210>11<211>30<212>DNA<213>人工<220>
<223>引物<400>11aaggcctcat atgaacgtgc aggaagacgt 30<210>12<211>28<212>DNA<213>人工<220>
<223>引物<400>12cgggatcctc aggcgatgcg ttcgacca 28<210>13<211>31<212>DNA<213>人工<220>
<223>引物<400>13ggccgcgacg gtcgagttca tccacaccgc g 31<210>14
<211>31<212>DNA<213>人工<220>
<223>引物<400>14cgcggtgtgg atgaactcga ccgtcgcggc c 31<210>15<211>27<212>DNA<213>人工<220>
<223>引物<400>15agagcgggat cgacaagtcg aaggccg 27<210>16<211>27<212>DNA<213>人工<220>
<223>引物<400>16cggccttcga cttgtcgatc ccgctct 27<210>17<211>26<212>DNA<213>人工<220>
<223>引物<400>17gtgcttgagt tgccgcgtga ctgcgg 26<210>18<211>26<212>DNA<213>人工<220>
<223>引物<400>18ccgcagtcac gcggcaactc aagcac 26
<210>19<211>20<212>DNA<213>人工<220>
<223>引物<400>19cgtcaattat tacctccacg 20<210>20<211>20<212>DNA<213>人工<220>
<223>引物<400>20ggccatgccc gtgacgcgat 20<210>21<211>20<212>DNA<213>人工<220>
<223>引物<400>21gagttcttct gagcgggact 20<210>22<211>20<212>DNA<213>人工<220>
<223>引物<400>22ccgacatagt tcttctcgta 20<210>23<211>7096<212>DNA<213>Paracoccus sp.R114<400>23cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa60gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat120tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt180
tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg240ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc300agcgcgggga tctcatgctg gagttcttcg cccaccccca tgggcaaata ttatacgcaa360ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtttg tgatggcttc420catgtcggca gaatgcttaa tgaattacaa cagtttttat gcaacgcgtc gaaccgcccg480tccgacgccg gtttccgcac ggaaacgcgc ggcaagttga cataacttgc acgcgacgtc540tcgattctgc ccgcgaagaa tgcgatgcat ccagatgatg cagaacgaag aagcggaagc600gcccgtgaaa gaccagatga tttcccatac ccggtgcccc acgcaatggg tcggcccgat660cctgttccgc ggccccgtcg tcgagggccc gatcagcgcg ccgctggcca cctacgagac720gccgctctgg ccctcgaccg cgcggggggc aggggtttcc cggcattcgg gcgggatcca780ggtctcgctg gtcgacgaac gcatgagccg ctcgatcgcg ctgcgggcgc atgacggggc840ggcggcgacc gccgcctggc agtcgatcaa ggcccgccag gaagaggtcg cggccgtggt900cgccaccacc agccgcttcg cccgccttgt cgagctgaat cgccagatcg tgggcaacct960gctttacatc cgcatcgaat gcgtgacggg cgacgcctcg ggtcacaaca tggtcaccaa1020ggccgccgag gccgtgcagg gctggatcct gtcggaatac ccgatgctgg cctattccac1080gatctcgggg aacctgtgca ccgacaagaa ggcgtcggcg gtcaacggca tcctgggccg1140cggcaaatac gccgtcgccg aggtcgagat cccgcgcaag atcctgaccc gcgtgctgcg1200caccagcgcc gagaagatgg tccgcctgaa ctacgagaag aactatgtcg ggggtacgct1260ggcggggtcg ctgcgcagtg cgaacgcgca tttcgccaac atgctgctgg gcttctacct1320ggcgacgggg caggacgcgg ccaacatcat cgaggccagc cagggcttcg tccattgcga1380ggcccgcggc gaggatctgt atttctcgtg cacgctgccc aacctcatca tgggctcggt1440cggtgccggc aagggcatcc cctcgatcga ggagaacctg tcgcggatgg gctgccgcca1500gccgggcgaa cccggcgaca acgcgcgccg tcttgcggcg atctgcgcgg gcgtcgtgct1560gtgtggtgaa ttgtcgctgc ttgcggccca gaccaacccc ggagagttgg tccgcaccca1620catggagatg gagcgatgac cgacagcaag gatcaccatg tcgcggggcg caagctggac1680catctgcgtg cattggacga cgatgcggat atcgaccggg gcgacagcgg cttcgaccgc1740atcgcgctga cccatcgcgc cctgcccgag gtggatttcg acgccatcga cacggcgacc1800agcttcctgg gccgtgaact gtccttcccg ctgctgatct cgtccatgac cggcggcacc1860ggcgaggaga tcgagcgcat caaccgcaac ctggccgctg gtgccgagga ggcccgcgtc1920
gccatggcgg tgggctcgca gcgcgtgatg ttcaccgacc cctcggcgcg ggccagcttc1980gacctgcgcg cccatgcgcc caccgtgccg ctgctggcca atatcggcgc ggtgcagctg2040aacatggggc tggggctgaa ggaatgcctg gccgcgatcg aggtgctgca ggcggacggc2100ctgtatctgc acctgaaccc cctgcaagag gccgtccagc ccgaggggga tcgcgacttt2160gccgatctgg gcagcaagat cgcggccatc gcccgcgacg ttcccgtgcc cgtcctgctg2220aaggaggtgg gctgcggcct gtcggcggcc gatatcgcca tcgggctgcg cgccgggatc2280cggcatttcg acgtggccgg tcgcggcggc acatcctgga gccggatcga gtatcgccgc2340cgccagcggg ccgatgacga cctgggcctg gtcttccagg actggggcct gcagaccgtg2400gacgccctgc gcgaggcgcg gcccgcgctt gcggcccatg atggaaccag cgtgctgatc2460gccagcggcg gcatccgcaa cggtgtcgac atggcgaaat gcgtcatcct gggggccgac2520atgtgcgggg tcgccgcgcc cctgctgaaa gcggcccaaa actcgcgcga ggcggttgta2580tccgccatcc ggaaactgca tctggagttc cggacagcca tgttcctcct gggttgcggc2640acgcttgccg acctgaagga caattcctcg cttatccgtc aatgaaagtg cctaagatga2700ccgtgacagg aatcgaagcg atcagcttct acacccccca gaactacgtg ggactggata2760tccttgccgc gcatcacggg atcgaccccg agaagttctc gaaggggatc gggcaggaga2820aaatcgcact gcccggccat gacgaggata tcgtgaccat ggccgccgag gccgcgctgc2880cgatcatcga acgcgcgggc acgcagggca tcgacacggt tctgttcgcc accgagagcg2940ggatcgacaa gtcgaaggcc gccgccatct atctgcgccg cctgctggac ctgtcgccca3000actgccgttg cgtcgagctg aagcaggcct gctattccgc gacggcggcg ctgcagatgg3060cctgcgcgca tgtcgcccgc aagcccgacc gcaaggtgct ggtgatcgcg tccgatgtcg3120cgcgctatga ccgcgaaagc tcgggcgagg cgacgcaggg tgcgggcgcc gtcgccatcc3180ttgtcagcgc cgatcccaag gtggccgaga tcggcaccgt ctcggggctg ttcaccgagg3240atatcatgga tttctggcgg ccgaaccacc gccgcacgcc cctgttcgac ggcaaggcat3300cgacgctgcg ctatctgaac gcgctggtcg aggcgtggaa cgactatcgc gcgaatggcg3360gccacgagtt cgccgatttc gcgcatttct gctatcacgt gccgttctcg cggatgggcg3420agaaggcgaa cagccacctg gccaaggcga acaagacgcc ggtggacatg gggcaggtgc3480agacgggcct gatctacaac cggcaggtcg ggaactgcta taccgggtcg atctacctgg3540cattcgcctc gctgctggag aacgctcagg aggacctgac cggcgcgctg gtcggtctgt3600tcagctatgg ctcgggtgcg acgggcgaat tcttcgatgc gcggatcgcg cccggttacc3660gcgaccacct gttcgcggaa cgccatcgcg aattgctgca ggatcgcacg cccgtcacat3720
atgacgaata cgttgccctg tgggacgaga tcgacctgac gcagggcgcg cccgacaagg3780cgcgcggtcg tttcaggctg gcaggtatcg aggacgagaa gcgcatctat gtcgaccggc3840aggcctgaag caggcgccca tgccccgggc aagctgatcc tgtccgggga acattccgtg3900ctctatggtg cgcccgcgct tgccatggcc atcgcccgct ataccgaggt gtggttcacg3960ccgcttggca ttggcgaggg gatacgcacg acattcgcca atctctcggg cggggcgacc4020tattcgctga agctgctgtc ggggttcaag tcgcggctgg accgccggtt cgagcagttc4080ctgaacggcg acctaaaggt gcacaaggtc ctgacccatc ccgacgatct ggcggtctat4140gcgctggcgt cgcttctgca cgacaagccg ccggggaccg ccgcgatgcc gggcatcggc4200gcgatgcacc acctgccgcg accgggtgag ctgggcagcc ggacggagct gcccatcggc4260gcgggcatgg ggtcgtctgc ggccatcgtc gcggccacca cggtcctgtt cgagacgctg4320ctggaccggc ccaagacgcc cgaacagcgc ttcgaccgcg tccgcttctg cgagcggttg4380aagcacggca aggccggtcc catcgacgcg gccagcgtcg tgcgcggcgg gcttgtccgc4440gtgggcggga acgggccggg ttcgatcagc agcttcgatt tgcccgagga tcacgacctt4500gtcgcgggac gcggctggta ctgggtactg cacgggcgcc ccgtcagcgg gaccggcgaa4560tgcgtcagcg cggtcgcggc ggcgcatggt cgcgatgcgg cgctgtggga cgccttcgca4620gtctgcaccc gcgcgttgga ggccgcgctg ctgtctgggg gcagccccga cgccgccatc4680accgagaacc agcgcctgct ggaacgcatc ggcgtcgtgc cggcagcgac gcaggccctc4740gtggcccaga tcgaggaggc gggtggcgcg gccaagatct gcggcgcagg ttccgtgcgg4800ggcgatcacg gcggggcggt cctcgtgcgg attgacgacg cgcaggcgat ggcttcggtc4860atggcgcgcc atcccgacct cgactgggcg cccctgcgca tgtcgcgcac gggggcggca4920cccggccccg cgccgcgtgc gcaaccgctg ccggggcagg gctgatggat caggtcatcc4980gcgccagcgc gccgggttcg gtcatgatca cgggcgaaca tgccgtggtc tatggacacc5040gcgccatcgt cgccgggatc gagcagcgcg cccatgtgac gatcgtcccg cgtgccgacc5100gcatgtttcg catcacctcg cagatcgggg cgccgcagca ggggtcgctg gacgatctgc5160ctgcgggcgg gacctatcgc ttcgtgctgg ccgccatcgc gcgacacgcg ccggacctgc5220cttgcgggtt cgacatggac atcacctcgg ggatcgatcc gaggctcggg cttggatcct5280cggcggcggt gacggtcgcc tgcctcggcg cgctgtcgcg gctggcgggg cgggggaccg5340aggggctgca tgacgacgcg ctgcgcatcg tccgcgccat ccagggcagg ggcagcgggg5400ccgatctggc ggccagcctg catggcggct tcgtcgccta tcgcgcgccc gatggcggtg5460
ccgcgcagat cgaggcgctt ccggtgccgc cggggccgtt cggcctgcgc tatgcgggct5520acaagacccc gacagccgag gtgctgcgcc ttgtggccga tcggatggcg ggcaacgagg5580ccgctttcga cgcgctctac tcccggatgg gcgcaagcgc agatgccgcg atccgcgcgg5640cgcaagggct ggactgggct gcattccacg acgcgctgaa cgaataccag cgcctgatgg5700agcagctggg cgtgtccgac gacacgctgg acgcgatcat ccgcgaggcg cgcgacgcgg5760gcgccgcagt cgccaagatc tccggctcgg ggctggggga ttgcgtgctg gcactgggcg5820accagcccaa gggtttcgtg cccgcaagca ttgccgagaa gggacttgtt ttcgatgact5880gatgccgtcc gcgacatgat cgcccgtgcc atggcgggcg cgaccgacat ccgagcagcc5940gaggcttatg cgcccagcaa catcgcgctg tcgaaatact ggggcaagcg cgacgccgcg6000cggaaccttc cgctgaacag ctccgtctcg atctcgttgg cgaactgggg ctctcatacg6060cgggtcgagg ggtccggcac gggccacgac gaggtgcatc acaacggcac gctgctggat6120ccgggcgacg ccttcgcgcg ccgcgcgttg gcattcgctg acctgttccg gggggggagg6180cacctgccgc tgcggatcac gacgcagaac tcgatcccga cggcggcggg gcttgcctcg6240tcggcctcgg ggttcgcggc gctgacccgt gcgctggcgg gggcgttcgg gctggatctg6300gacgacacgg atctgagccg catcgcccgg atcggcagtg gcagcgccgc ccgctcgatc6360tggcacggct tcgtccgctg gaaccggggc gaggccgagg atgggcatga cagccacggc6420gtcccgctgg acctgcgctg gcccggcttc cgcatcgcga tcgtggccgt ggacaagggg6480cccaagcctt tcagttcgcg cgacggcatg aaccacacgg tcgagaccag cccgctgttc6540ccgccctggc ctgcgcaggc ggaagcggat tgccgcgtca tcgaggatgc gatcgccgcc6600cgcgacatgg ccgccctggg tccgcgggtc gaggcgaacg cccttgcgat gcacgccacg6660atgatggccg cgcgcccgcc gctctgctac ccgacgggcg gcagctggaa ggtgctggaa6720cgcctgtggc aggcccgcgc ggacgggctt gcggcctttg cgacgatgga tgccggcccg6780aacgtcaagc tgatcttcga ggaaagcagc gccgccgacg tgctgtacct gttccccgac6840gccagcctga tcgcgccgtt cgaggggcgt tgaacgcgta agacgaccac tgggtaaggt6900tctgccgcgc gtggtctcga ctgcctgcaa agaggtgctt gagttgccgc gtgactgcgg6960cggccgactt cgtgggactt gcccgccacg ctgacgaagg gcgaattcca gcacactggc7020ggccgttact agttctagag cggccgccac cgcggtggag ggcggcacct cgctaacgga7080ttcaccgttt ttatca709權(quán)利要求
1.一種多核苷酸序列,其包含編碼下述蛋白的一種或多種基因,所述蛋白具有羥甲基戊二酸單酰-CoA還原酶活性、異戊烯二磷酸異構(gòu)酶活性、羥甲基戊二酸單酰-CoA合酶活性、甲羥戊酸激酶活性、磷酸甲羥戊酸激酶活性和/或二磷酸甲羥戊酸脫羧酶活性,其中,所述多核苷酸序列攜帶一處或多處突變,存在于微生物中時(shí)能導(dǎo)致產(chǎn)生提高的類異戊二烯產(chǎn)量。
2.如權(quán)利要求1所述的多核苷酸序列,其可從SEQ ID NO1或2或其片段獲得,并且攜帶有一處或多處突變。
3.如權(quán)利要求1或2所述的多核苷酸序列,其在編碼具有羥甲基戊二酸單酰-CoA合酶活性的蛋白的hcs基因中包含一處或多處突變。
4.如權(quán)利要求1至3中任意一項(xiàng)所述的多核苷酸,其由SEQ ID NO3或其片段代表。
5.如權(quán)利要求1至4中任意一項(xiàng)所述的多核苷酸,其選自如下多核苷酸構(gòu)成的組(a)編碼包含根據(jù)SEQ ID NO7的氨基酸序列的多肽的多核苷酸,(b)包含根據(jù)SEQ ID NO6的核苷酸序列的多核苷酸,(c)包含下述核苷酸序列的多核苷酸,所述序列編碼被(a)或(b)的多核苷酸編碼的多肽的片段或衍生物,其中,在所述衍生物中,較之所述多肽,一個(gè)或多個(gè)氨基酸殘基被保守取代,并且所述片段或衍生物具有羥甲基戊二酸單酰-CoA合酶的活性,(d)多核苷酸,其互補(bǔ)鏈能在嚴(yán)格條件下與(a)至(c)中任意一項(xiàng)定義的多肽雜交,并且編碼Hcs蛋白。
6.權(quán)利要求1至5中任意一項(xiàng)所述的多核苷酸用于生產(chǎn)類異戊二烯的用途,優(yōu)選用于生產(chǎn)輔酶Q10的用途。
7.生產(chǎn)類異戊二烯的方法,包括(a)將權(quán)利要求1至5中任意一項(xiàng)所述的多核苷酸序列引入原本是所述多核苷酸缺陷型的微生物中,以及(b)在允許生產(chǎn)類異戊二烯的條件下培養(yǎng)步驟(a)的微生物。
8.如權(quán)利要求7所述的方法,其中,向其中引入所述多核苷酸的微生物選自Rhodobacter屬,優(yōu)選為Rhodobacter sphaeroides。
9.如權(quán)利要求7或8所述的方法,其中,所述引入的多核苷酸可從選自Paracoccus屬的微生物獲得,優(yōu)選從P.zeaxanthinifaciens獲得。
10.一種微生物,包含權(quán)利要求1至5中任意一項(xiàng)所述的多核苷酸序列。
11.如權(quán)利要求10所述的微生物,選自Rhodobacter屬,優(yōu)選為Rhodobacter sphaeroides。
12.如權(quán)利要求10或11所述的微生物,其中,引入可從Paracoccus屬的微生物獲得的、權(quán)利要求1至5中任意一項(xiàng)所述的多核苷酸。
13.如權(quán)利要求10至12中任意一項(xiàng)所述的微生物用于生產(chǎn)類異戊二烯的用途。
全文摘要
本發(fā)明涉及通過(guò)微生物來(lái)生產(chǎn)類異戊二烯特別是輔酶Q-10的方法。更具體地,本發(fā)明涉及通過(guò)Rhodobacter屬的微生物(特別是R.sphaeroides種的微生物)增加輔酶Q-10產(chǎn)量的方法,所述微生物已經(jīng)經(jīng)過(guò)了來(lái)自不同微生物的甲羥戊酸(mev)操縱子的一種或多種基因的轉(zhuǎn)化,所述不同微生物優(yōu)選是Paracoccus屬的,更優(yōu)選是P.zeaxanthinifaciens種的,由此所述mev操縱子被突變,導(dǎo)致產(chǎn)生增加的輔酶Q-10產(chǎn)量。攜帶此類突變的序列以及攜帶此類經(jīng)突變mev操縱子的微生物也包括在本發(fā)明內(nèi)。
文檔編號(hào)C12P7/66GK101044243SQ200580028026
公開(kāi)日2007年9月26日 申請(qǐng)日期2005年8月11日 優(yōu)先權(quán)日2004年8月19日
發(fā)明者阿蘭·貝利, 克利斯汀·曼哈特, 彼得拉·斯米克 申請(qǐng)人:帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司