專利名稱:1,3-丙二醇的重組生產(chǎn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分子生物學(xué)領(lǐng)域,并且特別地涉及用于在宿主細(xì)胞中生產(chǎn)1,3-丙二醇的改進(jìn)的方法。特別地,本發(fā)明描述了宿主細(xì)胞中與1,3-丙二醇生產(chǎn)相關(guān)的基因簇的組分,包括蛋白質(zhì)X,和蛋白質(zhì)1、蛋白質(zhì)2以及蛋白質(zhì)3。尤其特別地本發(fā)明描述了為提高宿主細(xì)胞中1,3-丙二醇的產(chǎn)量之克隆基因的表達(dá),該克隆基因分別編碼或一起編碼蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3。
背景1,3-丙二醇是在聚酯纖維的生產(chǎn)以及聚氨基甲酸乙酯和環(huán)狀化合物的制造中具有潛在用途的一種單體。
已知多種能產(chǎn)生1,3-丙二醇的化學(xué)路線。例如,在磷化氫,水,一氧化碳,氫和一種酸存在時(shí),氧化乙烯可以經(jīng)過(guò)丙烯醛的催化溶液相水合作用再被還原成1,3-丙二醇,或者在一氧化碳和氫氣存在時(shí),烴類如甘油可以被具有來(lái)自周期表VIII組原子的催化劑轉(zhuǎn)化成1,3-丙二醇。雖然有可能用這些方法產(chǎn)生1,3-丙二醇,但它們昂貴而且產(chǎn)生含有環(huán)境污染物的廢液。
了解1,3-丙二醇可以通過(guò)甘油發(fā)酵來(lái)生產(chǎn)已經(jīng)超過(guò)一個(gè)世紀(jì)。已經(jīng)發(fā)現(xiàn)了能產(chǎn)生1,3-丙二醇的細(xì)菌菌株,如檸檬酸桿菌屬(Citrobacter),梭狀芽孢桿菌屬(Clostridium),腸桿菌屬(Enterobacter),泥桿菌屬(Ilyobacter),克雷伯氏菌屬(Klebsiella),乳酸桿菌屬(Lactobacillus)和暗桿菌屬(Pelobacter)中的菌株。在研究過(guò)的每一種情況中,甘油經(jīng)過(guò)兩步酶催化的反應(yīng)步驟被轉(zhuǎn)化成1,3-丙二醇。第一步,脫水酶催化甘油轉(zhuǎn)化成3-羥基丙醛(3-HP)和水(方程式1)。第二步,3-HP被NAD+-偶聯(lián)的氧化還原酶還原成1,3-丙二醇(方程式2)。
(方程式1)(方程式2)1,3-丙二醇不再被進(jìn)一步代謝,因而以高濃度累積在基質(zhì)中??偡磻?yīng)消耗一個(gè)輔助因子形式的還原單位,即還原型b-尼克酰胺腺嘌呤二核苷酸(NADH)被氧化成尼克酰胺腺嘌呤二核苷酸(NAD+)。
從甘油生產(chǎn)1,3-丙二醇通常在無(wú)氧條件下以甘油為唯一碳源并且無(wú)其它外源還原單位受體時(shí)進(jìn)行。在這些條件下,在例如檸檬酸桿菌屬,梭狀芽孢桿菌屬和克雷伯氏菌屬的菌株中,可以經(jīng)類似的途徑加工甘油,首先涉及甘油被NAD+-(或NADP+-)偶聯(lián)的甘油脫氫酶氧化成二羥丙酮(DHA)(方程式3)。DHA再被DHA激酶磷酸化成為磷酸二羥丙酮(DHAP)(方程式4),從而可用于生物合成以及幫助通過(guò)例如酵解過(guò)程的ATP的產(chǎn)生。
(方程式3)(方程式4)與1,3-丙二醇途徑相比,此途徑可以給細(xì)胞提供碳和能量,產(chǎn)生而不是消耗NADH。
肺炎克雷伯氏菌(Klebsiella pneumoniae)和弗勞地檸檬酸桿菌(Citrobacter freundii)中,編碼功能相關(guān)的甘油脫水酶(dhaB)、1,3-丙二醇氧化還原酶(dhaT)、甘油脫氫酶(dhaD)和二羥丙酮激酶(dhaK)活性的基因被包括在dha調(diào)節(jié)子中。檸檬酸桿菌屬和克雷伯氏菌屬的dha調(diào)節(jié)子已在大腸桿菌(Escherichia coli)表達(dá)并且已表明能將甘油轉(zhuǎn)化為1,3-丙二醇。甘油脫水酶(E.C.4.2.1.30)與二醇[1,2-丙二醇]脫水酶(E.C.4.2.1.28)相關(guān)但為不同基因編碼的不同的酶。在鼠傷寒沙門氏菌(Salmonella typhimurium)和肺炎克雷伯氏菌中二醇脫水酶與pdu操縱子相關(guān),見(jiàn)Bobik等人,1992,細(xì)菌學(xué)雜志(J.Bacteriol.)1742253-2266和美國(guó)專利5,633,362。Tobimatsu等人,1996,生物化學(xué)雜志(J.Biol.Chem.)27122352-22357公開(kāi)了編碼甘油脫水酶蛋白質(zhì)X的已命名為ORF4的肺炎克雷伯氏菌基因;Seyfried等人,1996,細(xì)菌學(xué)雜志(J.Bacteriol.)1785793-5796公開(kāi)了編碼蛋白質(zhì)X的已命名為ORF4的弗勞地檸檬酸桿菌的甘油脫水酶基因。Tobimatsu等人,1995,生物化學(xué)雜志(J.Biol.Chem.)2707142-7148公開(kāi)了二醇脫水酶亞單位α,β和Y并證明了orf4的存在。Luers(1997,F(xiàn)EMS微生物學(xué)通訊154337-345)公開(kāi)了巴氏梭菌(Clostridium pasteurianum)的蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的氨基酸序列。
已知制備甘油的生物學(xué)過(guò)程。絕大多數(shù)甘油產(chǎn)生菌是酵母菌,其次已知一些細(xì)菌,真菌和藻類也產(chǎn)生甘油。細(xì)菌和酵母菌都通過(guò)糖酵解中的果糖-1,6-二磷酸途徑或者Embden Meyerhof Parnas途徑將葡萄糖或其它碳水化合物轉(zhuǎn)化為甘油,而特定的藻類將葉綠體中溶解的二氧化碳或碳酸氫鹽轉(zhuǎn)化為卡爾文循環(huán)中的三碳中間物。經(jīng)過(guò)一系列步驟,此三碳中間物磷酸甘油酸轉(zhuǎn)化為甘油醛3-磷酸,甘油醛3-磷酸可以容易地互變?yōu)槠渫疆悩?gòu)體磷酸二羥丙酮并最終轉(zhuǎn)變成為甘油。
特別地,地衣芽孢桿菌(Bacillus licheniformis)和番茄乳酸桿菌(Lactobacillus lycopersica)可合成甘油,并且已發(fā)現(xiàn)耐鹽藻類Dunaliella sp和Asteromonas gracilis中產(chǎn)生甘油起到抗外部高鹽濃度的保護(hù)作用(Ben-Amotz等人,Experientia 38,49-52,(1982))。類似地,許多耐滲透壓酵母菌以合成甘油作為保護(hù)方式。酵母屬(Saccharomyces)的大多數(shù)菌株在乙醇發(fā)酵中產(chǎn)生一些甘油并且可以應(yīng)用滲透壓力生理性地提高其產(chǎn)量(Albertyn等人,分子細(xì)胞生物學(xué)(Mol.Cell.Biol.)14,4135-4144,(1994))。本世紀(jì)早期通過(guò)使用加入“引導(dǎo)劑”如亞硫酸鹽或堿的酵母菌培養(yǎng)物進(jìn)行甘油的商業(yè)化生產(chǎn)。通過(guò)失活復(fù)合物的形成,引導(dǎo)劑阻斷或抑制了乙醛轉(zhuǎn)化為乙醇;因而,過(guò)量的還原單位(NADH)可用于生產(chǎn)甘油或被引導(dǎo)向用于還原的DHAP以產(chǎn)生甘油。此方法受亞硫酸鹽導(dǎo)致的酵母菌生長(zhǎng)的部分抑制反應(yīng)的局限。用堿通過(guò)另外的機(jī)制產(chǎn)生過(guò)量的NADH單位可以部分克服這一局限。在此情況下,堿起始了康尼扎羅(Cannizarro)不對(duì)稱反應(yīng),從兩個(gè)單位的乙醛產(chǎn)生乙醇和乙酸。
來(lái)自糖化酵母(Saccharomyces diastaticus)的編碼甘油-3-磷酸脫氫酶的基因(DAR1,GPD1)已被克隆和測(cè)序(Wang等人,細(xì)菌學(xué)雜志(J.Bacteriol.)176,7091-7095,(1994))。將DAR1基因克隆進(jìn)穿梭載體并用其轉(zhuǎn)化大腸桿菌,結(jié)果表達(dá)產(chǎn)生了活性酶。Wang等人(出處同上)認(rèn)識(shí)到DAR1受細(xì)胞滲透壓環(huán)境的調(diào)節(jié),但是并沒(méi)有提出如何在重組生物中利用該基因提高1,3-丙二醇的產(chǎn)量。
其它的甘油3-磷酸脫氫酶已被分離例如來(lái)自釀酒酵母(S.cerevisiae)的立體專一編號(hào)的甘油-3-磷酸脫氫酶已被克隆和測(cè)序(Larason等人,分子微生物學(xué)(Mol.Microbiol.)10,1101,(1993)),并且Albertyn等人,(分子細(xì)胞生物學(xué)(Mol.Cell.Biol.)14,4135-4144,(1994))描述了來(lái)自釀酒酵母的編碼甘油-3-磷酸脫氫酶的GPD1的克隆。如Wang等人(出處同上),Larason等人和Albertyn等人都認(rèn)識(shí)到此基因調(diào)節(jié)的滲透壓敏感性,但都沒(méi)有提出如何用此基因在重組生物中生產(chǎn)1,3-丙二醇。
關(guān)于G3PDH的蛋白質(zhì),已從釀酒酵母中分離了甘油-3-磷酸酶并且鑒定了該蛋白質(zhì)由GPP1和GPP2基因編碼(Norbeck等人,生物化學(xué)雜志(J.Biol.Chem.)271,13875,(1996))。類似于編碼G3PDH的基因,GPP2表現(xiàn)出滲透壓敏感性。
雖然生產(chǎn)甘油和1,3-丙二醇的生物學(xué)方法都已知,但從未證明過(guò)用一個(gè)單獨(dú)的重組生物能完成整個(gè)過(guò)程。
由于化學(xué)過(guò)程需要高能量而生物學(xué)過(guò)程需要昂貴的起始物甘油,上述生產(chǎn)1,3-丙二醇的化學(xué)和生物學(xué)方法都不很適合于工業(yè)規(guī)模的生產(chǎn)。需要一種要求低能量輸入和不昂貴的起始物質(zhì)的方法。更受歡迎的方法需要一種能將基本碳源如碳水化合物或糖類轉(zhuǎn)化為所需1,3-丙二醇終產(chǎn)物的微生物。
雖然期望有一種生物能將除甘油或二羥丙酮之外的可發(fā)酵碳源轉(zhuǎn)化為1,3-丙二醇,已證明這一嘗試中存在巨大的難度。例如,Gottschalk等人(EP373230)描述了氫供體如果糖或葡萄糖的存在會(huì)干擾用于生產(chǎn)1,3-丙二醇的大多數(shù)菌株,包括弗勞地檸檬酸桿菌、Clostridium autobutylicum、丁酸梭菌和肺炎克雷伯氏菌的生長(zhǎng)。在甘油和果糖或葡萄糖的共發(fā)酵中產(chǎn)生1,3-丙二醇的短乳桿菌(Lactobacillus brevis)和布氏乳桿菌(Lactobacillus buchner),當(dāng)供給甘油作為唯一碳源時(shí)不能生長(zhǎng),并且雖然已經(jīng)證明休止細(xì)胞能代謝葡萄糖或果糖,但它們不能產(chǎn)生1,3-丙二醇(Veiga DA Cunha等人,細(xì)菌學(xué)雜志(J.Bacteriol.)174,1013(1992))。相類似,已證明一株供給甘油和乙酸時(shí)產(chǎn)生1,3-丙二醇的多養(yǎng)型泥桿菌(Ilyobacterpolytropus)不能從甘油之外的碳底物(包括果糖和葡萄糖)產(chǎn)生1,3-丙二醇(Steib等人,微生物學(xué)文獻(xiàn)(Arch.Microbiol.)140,139(1984))。最后Tong等人(生物化學(xué)生物技術(shù)學(xué)應(yīng)用(Appl.Biochem.Biotech.)34,149(1992))已證明當(dāng)無(wú)外源甘油時(shí),用編碼甘油脫水酶的dha調(diào)節(jié)子轉(zhuǎn)化的大腸桿菌從葡萄糖和木糖都不能產(chǎn)生1,3-丙二醇。
已報(bào)道了促進(jìn)由甘油生產(chǎn)1,3-丙二醇的嘗試,此過(guò)程包括能提供還原單位的輔助底物,一般為可發(fā)酵糖類。已要求了共發(fā)酵甘油和葡萄糖的弗勞地檸檬酸桿菌和肺炎克雷伯氏菌DSM4270的休止細(xì)胞產(chǎn)量提高(Gottschalk等人,出處同上,以及Tran-Dinh等人,DE3734764);但未要求共發(fā)酵甘油和葡萄糖的不產(chǎn)生1,3-丙二醇的肺炎克雷伯氏菌ATCC 25955的生長(zhǎng)細(xì)胞(I-T.Tong,博士論文,University ofWisconsin-Madison(1992))。已報(bào)道重組大腸桿菌的甘油和葡萄糖或果糖的共發(fā)酵的產(chǎn)量提高;然而,無(wú)甘油時(shí)不產(chǎn)生1,3-丙二醇(Tong等人,出處同上)。在這些系統(tǒng)中,提供用于細(xì)胞維持和生長(zhǎng)的能量和碳時(shí),單一生物用碳水化合物作為產(chǎn)生NADH的來(lái)源。這些公開(kāi)的內(nèi)容表明糖類并不進(jìn)入產(chǎn)生1,3-丙二醇的碳途徑。沒(méi)有外源的甘油來(lái)源時(shí)無(wú)論如何也不產(chǎn)生1,3-丙二醇。因而這些文獻(xiàn)的內(nèi)容清楚地表明用單一的生物從一種碳源生產(chǎn)1,3-丙二醇是不可能的。
在評(píng)價(jià)宿主細(xì)胞的1,3-丙二醇產(chǎn)生中蛋白質(zhì)X的作用時(shí),各文獻(xiàn)的內(nèi)容極為混亂。在得到基因信息之前,McGee等人,1982,生物化學(xué)生物物理學(xué)研究通訊(Biochem.Biophys.Res.Comm.)108547-551報(bào)道來(lái)自肺炎克雷伯氏菌ATCC 8724的二醇脫水酶包含通過(guò)大小(60K、51K、29K和15K道爾頓)和N-末端氨基酸序列鑒定的四個(gè)亞單位。與McGee正好相反,Tobimatsu等人1996,出處同上,報(bào)道了來(lái)自同一生物的二醇脫水酶的克隆、測(cè)序和表達(dá),并且未發(fā)現(xiàn)脫水酶與51K道爾頓多肽相關(guān)聯(lián)的證據(jù)。Tobimatsu等人1996,出處同上,得出結(jié)論蛋白質(zhì)X多肽不是甘油脫水酶的亞單位,與GenBank登記號(hào)U30903中描述的蛋白質(zhì)X是甘油脫水酶的大亞單位相反。Seyfried等人,出處同上,報(bào)道orfZ(蛋白質(zhì)X)3′末端192bp的缺失對(duì)酶活性無(wú)影響,并推論orfZ不編碼脫水酶活性所需的亞單位。最后,Skraly,F(xiàn)A.(1997,名為“改善的1,3-丙二醇發(fā)酵的代謝工程”的論文)公開(kāi),在一個(gè)重組ORF3(蛋白質(zhì)X)被打斷產(chǎn)生一個(gè)大的融合蛋白的實(shí)驗(yàn)中,甘油脫水酶活性喪失,而在另一個(gè)實(shí)驗(yàn)中,與ORF3為完整的對(duì)照相比從甘油生產(chǎn)的1,3-丙二醇降低,但甘油脫水酶活性未失去。
本發(fā)明要解決的問(wèn)題是用一種重組生物從例如葡萄糖或其它糖類的廉價(jià)碳底物以商業(yè)上可行的量進(jìn)行1,3-丙二醇的生物學(xué)生產(chǎn)。1,3-丙二醇的生物學(xué)生產(chǎn)要求以甘油作為兩步連續(xù)反應(yīng)的底物,反應(yīng)中脫水酶(一般為輔酶B12依賴的脫水酶)將甘油轉(zhuǎn)化為中間物3-羥基丙醛,3-羥基丙醛再被NADH(或NADPH)依賴的氧化還原酶還原為1,3-丙二醇。輔助因子需求的復(fù)雜性使在工業(yè)方法中利用完整細(xì)胞催化以將此反應(yīng)程序用于1,3-丙二醇的生產(chǎn)成為必需。而且,為了使此過(guò)程在商業(yè)上可行,需要一種比甘油或二羥丙酮更廉價(jià)的原料并且需要達(dá)到高產(chǎn)量水平。葡萄糖和其它碳水化合物是合適的底物,但是如上所述,已知它們會(huì)干擾1,3-丙二醇的產(chǎn)生。因此還沒(méi)有一種生物能將葡萄糖轉(zhuǎn)化為1,3-丙二醇。
申請(qǐng)者已經(jīng)解決了提出的問(wèn)題并且本發(fā)明提供了用一種重組生物將可發(fā)酵碳源直接生物轉(zhuǎn)化為1,3-丙二醇的方法。葡萄糖作為一種模式底物被采用并且生物轉(zhuǎn)化適用于任何現(xiàn)有微生物。包含編碼蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3以及其它與1,3-丙二醇產(chǎn)生相關(guān)的蛋白質(zhì)之基因的微生物,能夠以高產(chǎn)量和很好的選擇性通過(guò)甘油降解途徑將葡萄糖和其它糖類轉(zhuǎn)化為1,3-丙二醇。另外,本發(fā)明可以普遍性地適用于任何易于轉(zhuǎn)化為1)甘油、2)二羥丙酮或3)甘油的氧化狀態(tài)的三碳化合物(如甘油3-磷酸)或4)二羥丙酮的氧化狀態(tài)的三碳化合物(如磷酸二羥丙酮或甘油醛3-磷酸)的碳底物。
發(fā)明概述本發(fā)明涉及從單一微生物生產(chǎn)1,3-丙二醇的改進(jìn)方法。本發(fā)明部分建立在此未曾預(yù)料的發(fā)現(xiàn)上,即在包含至少一個(gè)編碼脫水酶活性的基因并且能夠產(chǎn)生1,3-丙二醇的微生物中,編碼蛋白質(zhì)X的基因的存在與脫水酶活性的體內(nèi)再激活以及此微生物中1,3-丙二醇的產(chǎn)量提高有關(guān)。本發(fā)明還部分建立在此未曾預(yù)料的發(fā)現(xiàn)上,即在包含至少一個(gè)編碼脫水酶活性的基因并且能夠產(chǎn)生1,3-丙二醇的宿主細(xì)胞中,編碼蛋白質(zhì)X的基因和至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的一種蛋白質(zhì)的基因的存在與脫水酶活性的體內(nèi)再激活以及此微生物中1,3-丙二醇的產(chǎn)量提高有關(guān)。
因而,本發(fā)明提供了用能產(chǎn)生1,3-丙二醇的微生物來(lái)生產(chǎn)1,3-丙二醇的改進(jìn)方法,所述微生物包含至少一種編碼脫水酶活性的基因,此方法包含的步驟包括將編碼蛋白質(zhì)X的基因?qū)肷矬w產(chǎn)生轉(zhuǎn)化的生物;然后在至少一種能在所述轉(zhuǎn)化的宿主生物中被轉(zhuǎn)化為1,3-丙二醇的碳源存在的情況下,并且在適合于產(chǎn)生1,3-丙二醇的條件下培養(yǎng)此轉(zhuǎn)化的生物,其中碳源選自單糖、寡糖、多糖和一碳底物。
在一個(gè)優(yōu)選實(shí)施方案中,改進(jìn)了的生產(chǎn)1,3-丙二醇的方法還包括將至少一種編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的一種蛋白質(zhì)基因?qū)肷矬w。此微生物還可以包括如下的至少一種(a)編碼甘油-3-磷酸脫氫酶活性的基因;(b)編碼甘油-3-磷酸酶活性的基因;和(c)編碼1,3-丙二醇氧化還原酶活性的基因。編碼脫水酶活性、蛋白質(zhì)X、蛋白質(zhì)1、2或3的基因或其它1,3-丙二醇產(chǎn)生所必需的基因可以穩(wěn)定地存在于宿主細(xì)胞基因組中或存在于宿主微生物中的復(fù)制型質(zhì)粒中。
此方法還任選地包括回收1,3-丙二醇的步驟。在本發(fā)明的一個(gè)方面,碳源是葡萄糖。
微生物選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬(Aerobacter),乳桿菌屬,曲霉屬(Aspergillus),酵母屬,裂殖酵母屬(Schizosaccharomyces),接合酵母屬(Zygosaccharomyces),畢氏酵母屬(Pichia),克魯維酵母屬(Kluyveromyces),假絲酵母屬(Candida),漢遜酵母屬(Hansenula),德巴利酵母屬(Debaryomyces),毛霉屬(Mucor),球擬酵母屬(Torulopsis),甲基細(xì)菌屬(Methylobacter),埃希氏菌屬(Escherichia),沙門氏菌屬(Salmonella),芽孢桿菌屬(Bacillus),鏈霉菌屬(Streptomyces)和假單胞菌屬(Pseudomonas)。
在一方面,蛋白質(zhì)X衍生自甘油脫水酶基因簇,在另一方面蛋白質(zhì)X衍生自二醇脫水酶基因簇。編碼脫水酶活性的基因可能與此微生物同源或異源。在一個(gè)實(shí)施方案中,甘油脫水酶基因簇衍生自選自克雷伯氏菌屬和檸檬酸桿菌屬的生物。在另一個(gè)實(shí)施方案中,二醇脫水酶基因簇衍生自選自克雷伯氏菌屬、梭狀芽孢桿菌屬和沙門氏菌屬的生物。
在另一方面,本發(fā)明提供的重組微生物包含至少一個(gè)編碼脫水酶活性的基因;至少一個(gè)編碼甘油-3-磷酸酶的基因;和至少一個(gè)編碼蛋白質(zhì)X的基因,其中所述微生物能夠從碳源產(chǎn)生1,3-丙二醇。碳源可以選自單糖、寡糖、多糖和一碳底物。在另一個(gè)實(shí)施方案中,此微生物還包含一個(gè)編碼胞質(zhì)甘油-3-磷酸脫氫酶的基因。在另一個(gè)實(shí)施方案中,此重組微生物還包含至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的蛋白質(zhì)的基因。此微生物選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。在一方面,蛋白質(zhì)X衍生自甘油脫水酶基因簇,在另一方面蛋白質(zhì)X衍生自二醇脫水酶基因簇。在一方面,脫水酶活性與所述微生物異源,而在另一方面脫水酶活性與所述微生物同源。
本發(fā)明也提供了在能夠產(chǎn)生1,3-丙二醇并且含有至少一種脫水酶活性的基因的微生物中脫水酶活性的體內(nèi)再激活的方法,包括將編碼蛋白質(zhì)X的基因?qū)胨鑫⑸锏牟襟E。此微生物選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。
在一方面,編碼脫水酶活性的基因與所述微生物異源,而在另一方面編碼脫水酶活性的基因與所述微生物同源。在一個(gè)實(shí)施方案中,編碼蛋白質(zhì)X的基因衍生自甘油脫水酶基因簇,在另一個(gè)實(shí)施方案中,編碼蛋白質(zhì)X的基因衍生自二醇脫水酶基因簇。
本發(fā)明也提供了包含編碼蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的基因的表達(dá)載體和宿主細(xì)胞。
根據(jù)本發(fā)明的生產(chǎn)1,3-丙二醇方法的一個(gè)優(yōu)點(diǎn)是與無(wú)編碼蛋白質(zhì)X的核酸的宿主細(xì)胞相比,編碼蛋白質(zhì)X的核酸存在時(shí)能產(chǎn)生1,3-丙二醇的宿主細(xì)胞中1,3-丙二醇的產(chǎn)量獲得了未曾預(yù)料的提高。如后面所證明,含有編碼dhaB 1、2和3以及蛋白質(zhì)X的核酸的宿主細(xì)胞比含有編碼dhaB 1、2和3但無(wú)編碼蛋白質(zhì)X的核酸的宿主細(xì)胞產(chǎn)生明顯多的1,3-丙二醇。
本發(fā)明的另一個(gè)優(yōu)點(diǎn)如后面所證明,是與無(wú)編碼蛋白質(zhì)X的核酸和編碼蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中至少一種的核酸之宿主細(xì)胞相比,同時(shí)含有編碼蛋白質(zhì)X的核酸和編碼蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中至少一種的核酸之產(chǎn)生1,3-丙二醇的宿主細(xì)胞獲得了未曾預(yù)料的結(jié)果,宿主細(xì)胞的1,3-丙二醇產(chǎn)量提高。
本發(fā)明的生產(chǎn)方法的另一個(gè)優(yōu)點(diǎn)如下所示,是與此微生物中編碼蛋白質(zhì)X的核酸存在相關(guān)的此微生物中脫水酶活性的體內(nèi)再激活。
附圖簡(jiǎn)述
圖1闡明了質(zhì)粒pHK28-26上的來(lái)自肺炎克雷伯氏菌的甘油脫水酶基因簇的組分(SEQ ID NO19)。此圖中,orfY編碼蛋白質(zhì)1,orfX編碼蛋白質(zhì)2,orfW編碼蛋白質(zhì)3。DhaB-X指蛋白質(zhì)X。
圖2A-2G闡明了肺炎克雷伯氏菌的甘油脫水酶蛋白質(zhì)X(dhab4)(SEQ ID NO59)的核苷酸和氨基酸序列。
圖3闡明了肺炎克雷伯氏菌蛋白質(zhì)1(SEQ ID NO61)和弗勞地檸檬酸桿菌蛋白質(zhì)1(SEQ ID NO60)(圖3中稱為orfY)的氨基酸排列。
圖4闡明了肺炎克雷伯氏菌蛋白質(zhì)2(SEQ ID NO63)和弗勞地檸檬酸桿菌蛋白質(zhì)2(SEQ ID NO62)(圖4中稱為orfX)的氨基酸排列。
圖5闡明了肺炎克雷伯氏菌蛋白質(zhì)3(SEQ ID NO64)和弗勞地檸檬酸桿菌蛋白質(zhì)3(SEQ ID NO65)(圖5中稱為orfW)的氨基酸排列。
圖6闡明了大腸桿菌DH5α細(xì)胞中質(zhì)粒pHK28-26(包含dhaB亞單位1、2和3以及蛋白質(zhì)X和編碼蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的開(kāi)放閱讀框架)與pDT24(包含dhaB亞單位1、2和3以及蛋白質(zhì)X)的原位再激活比較。
圖7闡明了大腸桿菌DH5α細(xì)胞中質(zhì)粒pM7(包含編碼dhaB亞單位1、2和3以及蛋白質(zhì)X的基因)與質(zhì)粒pM11(包含編碼dhaB亞單位1、2和3的基因)的原位再激活比較。
圖8A-8E闡明了肺炎克雷伯氏菌二醇脫水酶基因簇蛋白質(zhì)X的核酸序列(SEQ ID NO66)和氨基酸序列(SEQ ID NO67)。
圖9闡明了用大腸桿菌FM5/pDT24(FM5的描述見(jiàn)Amgen專利US5,494,816,ATCC保藏號(hào)53911)生產(chǎn)1,3-丙二醇的標(biāo)準(zhǔn)的10公升發(fā)酵。
圖10闡明了闡明了用大腸桿菌DH5α/pHK28-26生產(chǎn)1,3-丙二醇的標(biāo)準(zhǔn)10升發(fā)酵。
生物保藏和序列表簡(jiǎn)述包含有編碼甘油-3-磷酸脫氫酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶),甘油脫水酶(dhaB),和1,3-丙二醇氧化還原酶(dhaT)的基因的轉(zhuǎn)化的大腸桿菌W2042(包含大腸桿菌宿主W1485和質(zhì)粒pDT20和pAH42)按照國(guó)際認(rèn)證的為專利申請(qǐng)目的的微生物保藏的布達(dá)佩斯條約的條款于1996年9月26日被美國(guó)典型培養(yǎng)物保藏中心(ATCC)保藏,保藏號(hào)為ATCC98188。
包容含有編碼甘油-3-磷酸脫氫酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脫水酶(dhaB)和1,3-丙二醇氧化還原酶(dhaT)的基因的質(zhì)粒pMCK10、pMCK17、pMCK30和pMCK35的釀酒酵母YPH500按照國(guó)際認(rèn)證的為專利申請(qǐng)目的的微生物保藏的布達(dá)佩斯條約的條款于1996年9月26日被ATCC保藏,保藏號(hào)為ATCC74392。
包容含有甘油脫水酶、蛋白質(zhì)X、蛋白質(zhì)1、2和3的克雷伯氏菌基因組約35kb的質(zhì)粒pKP1的大腸桿菌DH5α按照布達(dá)佩斯條約的條款于1995年4月18日被ATCC保藏,保藏號(hào)為ATCC69789。包容含有編碼二醇脫水酶(包括蛋白質(zhì)X)的克雷伯氏菌基因組一部分的質(zhì)粒pKP4的大腸桿菌DH5α按照布達(dá)佩斯條約的條款于1995年4月18日被ATCC保藏,保藏號(hào)為ATCC69790。
“ATCC”指的是位于12301 Parklawn Drive,Rockville,MD20852美國(guó)的美國(guó)典型培養(yǎng)物保藏中心國(guó)際保藏單位。命名是按照保藏物的保藏號(hào)。發(fā)明詳述本發(fā)明涉及單一微生物中1,3-丙二醇的生產(chǎn)并且提供了于單一重組生物從可發(fā)酵碳源生產(chǎn)1,3-丙二醇的改進(jìn)方法。此方法包括能產(chǎn)生1,3-丙二醇的一種微生物,此微生物含有編碼脫水酶(dhaB)的同源或異源基因,至少一個(gè)編碼蛋白質(zhì)X的基因以及任選的至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中一種蛋白質(zhì)的基因。任選地,此微生物含有至少一個(gè)編碼甘油-3-磷酸脫氫酶、甘油-3-磷酸酶和1,3-丙二醇氧化還原酶(dhaT)的基因。將碳底物給予此重組微生物并從生長(zhǎng)培養(yǎng)基中分離1,3-丙二醇。
本方法提供了可用于聚酯和其它聚合物生產(chǎn)的1,3-丙二醇單體的一種來(lái)源,其迅速、低廉而且無(wú)害于環(huán)境。
下列定義用于解釋權(quán)利要求書(shū)和說(shuō)明書(shū)。
術(shù)語(yǔ)“脫水酶基因簇”或“基因簇”指的是與宿主細(xì)胞中1,3-丙二醇的產(chǎn)生相關(guān)的一系列基因并且意在包括甘油脫水酶基因簇和二醇脫水酶基因簇。dha調(diào)節(jié)子指的是甘油脫水酶基因簇,見(jiàn)包含調(diào)節(jié)區(qū)域的圖1。
術(shù)語(yǔ)“再生脫水酶活性”或“再激活脫水酶活性”指的是將無(wú)催化底物能力的脫水酶轉(zhuǎn)化為有催化底物能力的脫水酶的現(xiàn)象,或者抑制脫水酶失活的現(xiàn)象,或者在體內(nèi)延長(zhǎng)脫水酶的有效半壽期的現(xiàn)象。
術(shù)語(yǔ)“甘油脫水酶”或“脫水酶”或“脫水酶活性”指的是起到能將甘油分子異構(gòu)化或轉(zhuǎn)化為產(chǎn)物3-羥基丙醛的酶活性作用的多肽。為本發(fā)明的目的,脫水酶包括優(yōu)選底物分別為甘油和1,2-丙二醇的甘油脫水酶(GenBank U09771,U30903)和二醇脫水酶(GenBankD45071)。肺炎克雷伯氏菌ATCC 25955的甘油脫水酶被分別等同于SEQ ID NO1、2和3的基因dhaB1、dhaB2和dhaB3編碼。dhaB1、dhaB2和dhaB3基因分別編碼甘油脫水酶的a、b和c亞單位。
短語(yǔ)“脫水酶基因簇的蛋白質(zhì)X”或“dhaB蛋白質(zhì)X”或“蛋白質(zhì)X”指的是與圖2所示肺炎克雷伯氏菌脫水酶基因簇的蛋白質(zhì)X相類似的蛋白質(zhì)或者圖8所示肺炎克雷伯氏菌二醇脫水酶基因簇的蛋白質(zhì)X相類似的蛋白質(zhì)。優(yōu)選地,與宿主生物中無(wú)蛋白質(zhì)X的1,3-丙二醇產(chǎn)量相比,蛋白質(zhì)X能夠增加宿主生物中1,3-丙二醇的產(chǎn)量?!跋囝愃啤北硎揪幋a此蛋白質(zhì)的DNA與編碼相應(yīng)于克雷伯氏菌dhaB1、dhaB2和dhaB3的克雷伯氏菌蛋白質(zhì)X的DNA位于相同的結(jié)構(gòu)位置,即編碼蛋白質(zhì)X的DNA位于編碼dhaB1-B3的核酸的3′端,或者表示蛋白質(zhì)X與克雷伯氏菌二醇或甘油脫水酶蛋白質(zhì)X具有整體氨基酸序列相似性。本發(fā)明包括與肺炎克雷伯氏菌的甘油或二醇脫水酶或弗勞地檸檬酸桿菌的蛋白質(zhì)X具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白質(zhì)X分子。
術(shù)語(yǔ)“蛋白質(zhì)X”內(nèi)包括的是蛋白質(zhì)X,也指的是來(lái)自檸檬酸桿菌屬dha調(diào)節(jié)子的ORF Z(Seyfried M.1996,細(xì)菌學(xué)雜志(J.Bacteriol.)1785793-5796)。本發(fā)明也包含來(lái)自任何微生物的蛋白質(zhì)X的氨基酸變體,只要蛋白質(zhì)X變體保持了其重要功能特征,此特征為與無(wú)蛋白質(zhì)X的宿主生物的1,3-丙二醇產(chǎn)量相比能提高宿主生物的1,3-丙二醇產(chǎn)量。
編碼甘油脫水酶活性以及蛋白質(zhì)X的克雷伯氏菌基因組的一部分被轉(zhuǎn)化進(jìn)大腸桿菌,轉(zhuǎn)化的大腸桿菌于1995年4月18日按照布達(dá)佩斯條約的條款被ATCC保藏并被命名為ATCC保藏號(hào)69789。編碼二醇脫水酶活性以及蛋白質(zhì)X的克雷伯氏菌基因組的一部分被轉(zhuǎn)化進(jìn)大腸桿菌,轉(zhuǎn)化的大腸桿菌于1995年4月18日按照布達(dá)佩斯條約的條款被ATCC保藏并被命名為ATCC保藏號(hào)69790。
發(fā)現(xiàn)克雷伯氏菌甘油脫水酶蛋白質(zhì)X位于SEQ ID NO19的堿基9749-11572位,將dhaK的第一個(gè)堿基作為位置編號(hào)第1。編碼蛋白質(zhì)X的弗勞地檸檬酸桿菌(ATCC保藏號(hào)CFU09771)的核酸被發(fā)現(xiàn)位于位置11261至13072。
本發(fā)明包括被重組導(dǎo)入宿主生物并在質(zhì)粒上進(jìn)行復(fù)制的編碼脫水酶蛋白質(zhì)X的基因以及穩(wěn)定維持在宿主基因組中的編碼脫水酶蛋白質(zhì)X的基因。本發(fā)明包括提高1,3-丙二醇產(chǎn)量的方法,其中編碼蛋白質(zhì)X的基因與編碼脫水酶活性和/或產(chǎn)生1,3-丙二醇必需的基因一起被轉(zhuǎn)化進(jìn)宿主細(xì)胞。編碼蛋白質(zhì)X、脫水酶活性的基因和/或其它基因可以在相同或不同的表達(dá)盒中?;蛘撸幋a蛋白質(zhì)X的基因可以分開(kāi)進(jìn)行轉(zhuǎn)化,或者提前或落后于編碼脫水酶活性和/或其它活性的基因。本發(fā)明包括含有編碼蛋白質(zhì)X的內(nèi)源核酸的宿主細(xì)胞以及無(wú)編碼蛋白質(zhì)X的內(nèi)源核酸的宿主細(xì)胞。
術(shù)語(yǔ)“蛋白質(zhì)1”、“蛋白質(zhì)2”和“蛋白質(zhì)3”指的是微生物內(nèi)編碼的分別類似于蛋白質(zhì)1(SEQ ID NO60或SEQ ID NO61)(也稱為orfy),蛋白質(zhì)2(SEQ ID NO62或SEQ ID NO63)(也稱為orfX)以及蛋白質(zhì)3(SEQ ID NO64或SEQ ID NO65)(也稱為orfW)的蛋白質(zhì)。
優(yōu)選地,與宿主生物中無(wú)蛋白質(zhì)X并且有蛋白質(zhì)1、2和3中至少一種的1,3-丙二醇產(chǎn)量相比,宿主生物中有蛋白質(zhì)X并且有蛋白質(zhì)1、2和3中的至少一種能夠增加宿主細(xì)胞中1,3-丙二醇的產(chǎn)量。類似于表示編碼此蛋白質(zhì)的DNA與編碼各個(gè)蛋白質(zhì)的DNA位于相同的結(jié)構(gòu)位置,如圖1所示,或者表示各個(gè)蛋白質(zhì)與圖3、4和5所示的各個(gè)SEQID NO具有整體序列氨基酸相似性。
本發(fā)明包括與SEQ ID NO60或SEQ ID NO61具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白質(zhì)1分子。本發(fā)明包括與SEQ ID NO62或SEQ ID NO63具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白質(zhì)2分子。本發(fā)明包括與SEQ ID NO64或SEQ ID NO65具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白質(zhì)3分子。
術(shù)語(yǔ)“蛋白質(zhì)1”、“蛋白質(zhì)2”和“蛋白質(zhì)3”分別包括來(lái)自巴氏梭菌的orfY、orfX和orfW(Luers等人,出處同上)以及與巴氏梭菌的orfY、orfX或orfW具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的分子。本發(fā)明也包括來(lái)自任何微生物的蛋白質(zhì)1、2和3的氨基酸變體,只要結(jié)合蛋白質(zhì)X的該變體保留了其重要的功能特征,所述特征為與無(wú)這些蛋白質(zhì)的宿主生物的1,3-丙二醇產(chǎn)量相比能提高宿主生物的1,3-丙二醇產(chǎn)量。
本發(fā)明包括提高1,3-丙二醇產(chǎn)量的一種方法,其中編碼蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中至少一種的基因與編碼蛋白質(zhì)X、脫水酶活性的基因和/或其它產(chǎn)生1,3-丙二醇必需的基因一起轉(zhuǎn)化進(jìn)宿主細(xì)胞。編碼蛋白質(zhì)1、2和3,蛋白質(zhì)X,脫水酶活性的基因和/或其它基因可以位于相同或不同的表達(dá)盒?;蛘撸幋a蛋白質(zhì)1、2和3中至少一種的基因可以分開(kāi)進(jìn)行轉(zhuǎn)化,或者提前或落后于編碼脫水酶活性和/或其它活性的基因。本發(fā)明包括具有編碼蛋白質(zhì)1、蛋白質(zhì)2或蛋白質(zhì)3的內(nèi)源性核酸的宿主細(xì)胞以及無(wú)編碼這些蛋白質(zhì)的內(nèi)源性核酸的宿主細(xì)胞。
術(shù)語(yǔ)“氧化還原酶”或“1,3-丙二醇氧化還原酶”指的是起到能將3-羥基丙醛還原為1,3-丙二醇的酶活性作用的多肽。1,3-丙二醇氧化還原酶包括例如dhaT基因(GenBank U09771,U30903)編碼的多肽并且被命名為SEQ ID NO4。
術(shù)語(yǔ)“甘油-3-磷酸脫氫酶”或“G3PDH”指的是起到能將磷酸二羥丙酮(DHAP)轉(zhuǎn)化為甘油-3-磷酸的酶活性作用的多肽。在體內(nèi)G3PDH可以是NADH-,NADPH-,或FAD依賴的。此酶活性的實(shí)例包括NADH依賴的酶(EC 1.1.1.8)被包括GPD1(GenBank Z74071×2)或GPD2(GenBank Z35169×1)或GPD3(GenBankG984182)或DAR1(GenBank Z74071×2)的幾種基因編碼;NADPH依賴的酶(EC 1.1.1.94)被gpsA(GenBank U32164,G466746(cds 197911-196892),和L45246)編碼;以及FAD依賴的酶(EC 1.1.99.5)被GUT2(GenBank Z47047×23)或glpD(GenBank G147838)或glpABC(GenBank M20938)編碼。
術(shù)語(yǔ)“甘油-3-磷酸酶”或“sn-甘油-3-磷酸酶”或“d,l-甘油磷酸酶”或“G3P磷酸酶”指的是起到催化甘油-3-磷酸轉(zhuǎn)化為甘油的酶活性作用的多肽。G3P磷酸酶包括例如GPP1(GenBank Z47047×125)或GPP2(GenBank U18813×11)編碼的多肽。
術(shù)語(yǔ)“甘油激酶”指的是依據(jù)反應(yīng)條件,起到催化甘油轉(zhuǎn)化為甘油-3-磷酸或催化甘油-3-磷酸轉(zhuǎn)化為甘油的酶活性作用的多肽。甘油激酶包括例如GUT1(GenBank U11583×19)編碼的多肽。
術(shù)語(yǔ)“GPD1”、“DAR1”、“OSG1”、“D2830”和“YDL022W”可以被互換使用并且指編碼胞質(zhì)甘油-3-磷酸脫氫酶,以SEQ ID NO5的堿基序列為特征的基因。
術(shù)語(yǔ)“GPD2”指的是編碼胞質(zhì)甘油-3-磷酸脫氫酶并且以SEQ IDNO6的堿基序列為特征的基因。
術(shù)語(yǔ)“GUT2”和“YIL155C”可以被互換使用并且指編碼線粒體甘油-3-磷酸脫氫酶并且以SEQ ID NO7的堿基序列為特征的基因。
術(shù)語(yǔ)“GPP1”、“RHR2”和“YIL053W”可以被互換使用并且指編碼胞質(zhì)甘油-3-磷酸酶并且以稱為SEQ ID NO8的堿基序列為特征的基因。
術(shù)語(yǔ)“GPP2”、“HOR2”和“YER062C”可以被互換使用并且指編碼胞質(zhì)甘油-3-磷酸酶并且以SEQ ID NO9的堿基序列為特征的基因。
術(shù)語(yǔ)“GUT1”指的是編碼胞質(zhì)甘油激酶并且以SEQ ID NO10的堿基序列為特征的基因。
術(shù)語(yǔ)“功能”或“酶功能”指的是酶在改變特定化學(xué)反應(yīng)所需能量中的催化活性。可以理解的是這樣一種活性可以應(yīng)用于處于平衡的反應(yīng),其中產(chǎn)物或底物的產(chǎn)生可以在合適的條件下完成。
術(shù)語(yǔ)“多肽”和“蛋白質(zhì)”可被互換使用。
術(shù)語(yǔ)“碳底物”或“碳源”指的是能被本發(fā)明的宿主生物代謝的碳源,并且特別是選自單糖、寡糖、多糖,和一碳底物或其混合物的碳源。
術(shù)語(yǔ)“宿主細(xì)胞”或“宿主生物”指的是能接受外源或異源基因并表達(dá)這些基因以產(chǎn)生活性基因產(chǎn)物的微生物。
術(shù)語(yǔ)“外源基因”、“外源DNA”、“異源基因”和“異源DNA”指的是用多種方法置于宿主生物中的對(duì)于一種生物為天然帶有的遺傳物質(zhì)。此目的基因可以是天然產(chǎn)生的基因、突變的基因或合成的基因。
術(shù)語(yǔ)“重組生物”和“轉(zhuǎn)化的宿主”指的是已被異源或外源基因或同源基因的額外拷貝轉(zhuǎn)化的任何生物。本發(fā)明的重組生物表達(dá)編碼用于從合適的碳底物生產(chǎn)1,3-丙二醇的甘油-3-磷酸脫氫酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脫水酶(dhaB)和1,3-丙二醇氧化還原酶(dhaB)的外源基因。
“基因”指的是表達(dá)特定蛋白質(zhì)的核酸片段,包括位于編碼區(qū)域之前(5′非編碼區(qū))和之后(3′非編碼區(qū))的調(diào)節(jié)序列。術(shù)語(yǔ)“天然的”和“野生型的”指的是對(duì)其本身的調(diào)節(jié)序列為天然的基因。
術(shù)語(yǔ)“編碼”和“把……編碼”指的是一個(gè)過(guò)程,通過(guò)此過(guò)程基因根據(jù)轉(zhuǎn)錄和翻譯的機(jī)制產(chǎn)生氨基酸序列??梢岳斫獾氖谴司幋a特定氨基酸序列的過(guò)程包括不導(dǎo)致編碼的氨基酸改變的涉及堿基改變的DNA序列,或者涉及可能改變一或多個(gè)氨基酸,但不影響此DNA序列編碼的蛋白質(zhì)的功能特性的堿基改變的DNA序列。因此可以理解本發(fā)明所包括的多于特定的舉例序列。序列的修飾,例如導(dǎo)致基本上不影響產(chǎn)生的蛋白質(zhì)分子的功能特性的沉默突變之序列中的缺失、插入、或替換,也可以被考慮。例如,反映了遺傳密碼簡(jiǎn)并性或?qū)е略诮o定位點(diǎn)產(chǎn)生化學(xué)上等同的氨基酸之基因序列的改變也加以考慮。因此,一種疏水性氨基酸丙氨酸的密碼子可以被編碼另一種疏水性較弱的殘基如甘氨酸,或一種疏水性較強(qiáng)的殘基如纈氨酸、亮氨酸或異亮氨酸的密碼子替換。相類似,導(dǎo)致一種帶負(fù)電荷的殘基替換了另一種帶負(fù)電荷的殘基,例如天冬氨酸替換谷氨酸的替換,或者是一種帶正電荷的殘基替換了另一種帶正電荷的殘基,例如賴氨酸替換精氨酸的替換,也可以被認(rèn)為是產(chǎn)生了生物學(xué)上等同的產(chǎn)物。導(dǎo)致蛋白質(zhì)分子的N末端部分和C末端部分改變的核苷酸改變也不被認(rèn)為會(huì)改變蛋白質(zhì)的活性。在某些情況下,可能確實(shí)期望得到此序列的突變體用于研究改變對(duì)蛋白質(zhì)生物學(xué)活性的影響。根據(jù)測(cè)定編碼產(chǎn)物的生物學(xué)活性,每一種設(shè)計(jì)的修飾充分符合本領(lǐng)域的常規(guī)技術(shù)。而且,熟練的技術(shù)人員了解,本發(fā)明包括的序列也通過(guò)在嚴(yán)格的條件下(0.1×SSC,0.1%SDS,65℃)它們能與此處所舉例的序列雜交的能力加以界定。
術(shù)語(yǔ)“表達(dá)”指的是從編碼基因產(chǎn)物序列的基因轉(zhuǎn)錄和翻譯成為基因產(chǎn)物。
術(shù)語(yǔ)“質(zhì)?!?、“載體”和“盒”指的是經(jīng)常攜帶不屬于細(xì)胞的重要代謝部分的基因,并且通常以環(huán)狀雙鏈DNA分子的形式存在的染色體外元件單位。這種元件可以是衍生自任何來(lái)源的自主復(fù)制型序列、基因組整合序列、噬菌體或核苷酸序列、線狀或環(huán)狀的單鏈或雙鏈的DNA或RNA,其中很多核苷酸序列已經(jīng)被連接或重組進(jìn)一個(gè)獨(dú)特的構(gòu)件,該構(gòu)件能將啟動(dòng)子片段和用于選定的基因產(chǎn)物的DNA序列以及合適的3′非翻譯序列導(dǎo)入細(xì)胞?!稗D(zhuǎn)化盒”指的是一個(gè)特定載體,此載體包含外源基因并且具有能促進(jìn)對(duì)特定的宿主細(xì)胞進(jìn)行轉(zhuǎn)化的除外源基因以外的元件。術(shù)語(yǔ)“表達(dá)盒”指的是一個(gè)特定載體,此載體包含一個(gè)外源基因并且具有能容許此基因在外源宿主中提高表達(dá)的元件。
術(shù)語(yǔ)“轉(zhuǎn)化”和“轉(zhuǎn)染”指的是核酸整合以后細(xì)胞對(duì)新基因的接受。接受的基因可以被整合進(jìn)染色體DNA或者以染色體外復(fù)制型序列被導(dǎo)入。術(shù)語(yǔ)“轉(zhuǎn)化體”指的是轉(zhuǎn)化的產(chǎn)物。
術(shù)語(yǔ)“遺傳性改變的”指的是通過(guò)轉(zhuǎn)化或突變改變遺傳物質(zhì)的方法。
術(shù)語(yǔ)“經(jīng)分離的”指的是從至少一種與其天然相關(guān)的組分中分出的蛋白質(zhì)或DNA序列。
術(shù)語(yǔ)“同源的”指的是在革蘭氏陽(yáng)性宿主細(xì)胞中天然的或天然地產(chǎn)生的蛋白質(zhì)或多肽。本發(fā)明包括通過(guò)重組DNA技術(shù)產(chǎn)生同源蛋白質(zhì)的微生物。重組生物的構(gòu)建包含編碼對(duì)將碳底物轉(zhuǎn)化為1,3-丙二醇的酶途徑必需基因的重組生物可以用本領(lǐng)域熟知的技術(shù)來(lái)構(gòu)建。如實(shí)施例9所討論的,編碼克雷伯氏菌dhaB1、dhaB2、dhaB3和蛋白質(zhì)X的基因被用于轉(zhuǎn)化大腸桿菌DH5α,如實(shí)施例10所討論的,編碼克雷伯氏菌蛋白質(zhì)1、2和3中至少一個(gè)的基因以及編碼蛋白質(zhì)X的至少一個(gè)基因被用于轉(zhuǎn)化大腸桿菌。
從例如為克雷伯氏菌屬或酵母屬的天然宿主分離編碼甘油-3-磷酸脫氫酶(G3PDH)、甘油-3-磷酸酶(G3P磷酸酶)、甘油脫水酶(dhaB),和1,3-丙二醇氧化還原酶(dhaT)的基因,并且用其轉(zhuǎn)化宿主菌株,例如大腸桿菌DH5α、ECL707、AA200或W1485;釀酒酵母菌株YPH500或肺炎克雷伯氏菌菌株ATCC25955或ECL2106?;虻姆蛛x從細(xì)菌基因組獲得所需基因的方法是普通的方法而且為分子生物學(xué)領(lǐng)域所熟知。例如,如果此基因的序列已知,可以用限制性內(nèi)切核酸酶酶解來(lái)建立合適的基因組文庫(kù),并且可用互補(bǔ)探針與所需基因序列互補(bǔ)的方法對(duì)其進(jìn)行篩選。一旦分離出此序列,可以用標(biāo)準(zhǔn)的引物引導(dǎo)的擴(kuò)增方法如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)(U.S.4,683,202)以獲得適合于用合適的載體進(jìn)行轉(zhuǎn)化的量的DNA。
或者,可以建立粘粒文庫(kù),其中大片段的基因組DNA(35-45kb)可以被包裝在載體中并用于轉(zhuǎn)化合適的宿主。粘粒載體的獨(dú)特性在于其能容納大量的DNA。通常,粘粒載體具有外源DNA包裝和其后的環(huán)化所需的至少一份拷貝的cos DNA序列。除cos序列之外,這些載體也包含一個(gè)復(fù)制起點(diǎn)如ColE1和抗藥性標(biāo)記如抗氨芐青霉素或新霉素的基因。用粘粒載體轉(zhuǎn)化合適的細(xì)菌宿主的方法在Sambrook等人,分子克隆實(shí)驗(yàn)手冊(cè),第二版(1989)Cold Spring HarborLaboratory Press,Cold Sspring Harbon,NY(1989)中進(jìn)行了詳細(xì)描述。
對(duì)于克隆粘粒,一般用合適的限制性內(nèi)切核酸酶分離和連接外源DNA使之鄰近粘粒載體的cos區(qū)域。然后包含線性外源DNA的粘粒載體與DNA包裝載體如細(xì)菌噬菌體I反應(yīng)。在包裝過(guò)程中cos位點(diǎn)被切開(kāi),外源DNA被包裝進(jìn)細(xì)菌病毒顆粒的頭部。這些顆粒然后被用于轉(zhuǎn)染適當(dāng)?shù)乃拗骷?xì)胞如大腸桿菌。一旦注入細(xì)胞,外源DNA在cos粘性末端的作用下環(huán)化。通過(guò)這種方式大片段的外源DNA可以被導(dǎo)入并在重組宿主細(xì)胞中表達(dá)。編碼甘油脫水酶(dhaB)和1,3-丙二醇氧化還原酶(dhaT)的基因的分離和克隆在本發(fā)明的上下文中,利用粘粒載體和粘粒轉(zhuǎn)化方法以克隆來(lái)自己知含有能將甘油轉(zhuǎn)化為1,3-丙二醇的基因之細(xì)菌菌株的大片段基因組DNA。特別地,用本領(lǐng)域熟知的方法分離肺炎克雷伯氏菌ATCC25955的基因組DNA,用限制性酶Sau3A將其酶切以插入粘粒載體Supercos1,用GigapackII包裝提取物對(duì)其進(jìn)行包裝。然后用粘粒DNA轉(zhuǎn)化構(gòu)建的載體大腸桿菌XL1-Blue MR細(xì)胞。通過(guò)在甘油存在下培養(yǎng)細(xì)胞并分析基質(zhì)中1,3-丙二醇的形成來(lái)篩選能將甘油轉(zhuǎn)化為1,3-丙二醇的轉(zhuǎn)化體。
分析了兩個(gè)1,3-丙二醇陽(yáng)性轉(zhuǎn)化體,粘粒被命名為pKP1和pKP2。DNA測(cè)序顯示與弗勞地檸檬酸桿菌的甘油脫水酶基因(dhaB)具有廣泛的同源性,表明這些轉(zhuǎn)化體包含編碼甘油脫水酶基因的DNA。分析了其它的1,3-丙二醇陽(yáng)性轉(zhuǎn)化體,粘粒被命名為pKP4和pKP5。DNA測(cè)序顯示這些粘粒攜帶編碼二醇脫水酶基因的DNA。編碼蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的基因的分離雖然本發(fā)明利用的是分離自克雷伯氏菌屬粘粒的基因,其它的脫水酶基因和蛋白質(zhì)X及蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的來(lái)源包括但不限于檸檬酸桿菌屬,梭狀芽孢桿菌屬,和沙門氏菌屬。Tobimatsu等人,1996,生物化學(xué)雜志(J.Biol.Chem.)27122352-22357公開(kāi)了肺炎克雷伯氏菌屬的甘油脫水酶操縱子,其中蛋白質(zhì)X被命名為ORF4;Seyfried等人,1996,細(xì)菌學(xué)雜志(J.Bacteriol.)1785793-5796公開(kāi)了弗勞地檸檬酸桿菌的甘油脫水酶操縱子,其中蛋白質(zhì)X被命名為ORFZ。圖8公開(kāi)了克雷伯氏菌屬的二醇脫水酶蛋白質(zhì)X,圖3、4和5公開(kāi)了來(lái)自克雷伯氏菌屬和檸檬酸桿菌屬的蛋白質(zhì)1、2和3的氨基酸序列。編碼G3PDH和G3P磷酸酶的基因本發(fā)明提供了適合于在宿主細(xì)胞中表達(dá)G3PDH和G3P磷酸酶活性的基因。
已知編碼G3PDH的基因。例如,GPD1已被從酵母屬分離,并且具有編碼SEQ ID NO11給出的氨基酸序列的SEQ ID NO5給出的堿基序列(Wang等人,出處同上)。相類似,G3PDH活性也已被從酵母屬分離并由GPD2編碼,GPD2具有編碼SEQ ID NO12給出的氨基酸序列的SEQ ID NO6給出的堿基序列(Eriksson等人,分子微生物學(xué)(Mol.Microbiol)17,95,(1995))。
任何編碼具有G3PDH活性多肽的基因都被認(rèn)為適合于本發(fā)明的目的,其中此活性能催化磷酸二羥丙酮(DHAP)轉(zhuǎn)化為甘油-3-磷酸(G3P)。而且,任何編碼分別相應(yīng)于基因GPD1、GPD2、GUT2、gpsA、glpD以及glpABC的亞單位的SEQ ID NO11、12、13、14、15和16中任何一個(gè)給出的G3PDH氨基酸序列的基因都被認(rèn)為能用于本發(fā)明,其中氨基酸序列包括不改變酶功能的氨基酸替換、缺失或添加。本領(lǐng)域技術(shù)人員知曉分離自其它來(lái)源的編碼G3PDH的基因也適合應(yīng)用于本發(fā)明。例如,從原核生物分離的GenBank保藏號(hào)為M34393,M20938,L06231,U12567,L45246,L45323,L45324,L45325,U32164和U39682的基因;從真菌分離的GenBank保藏號(hào)為U30625,U30876和X56162的基因;從昆蟲(chóng)分離的GenBank保藏號(hào)為X61223和X14179的基因;以及從哺乳動(dòng)物來(lái)源分離的GenBank保藏號(hào)為U12424,M25558和X78593的基因。
已知編碼G3P磷酸酶的基因。例如,GPP2已被從釀酒酵母分離,并且具有編碼SEQ ID NO17給出的氨基酸序列的SEQ ID NO9給出的堿基序列(Norbeck等人,生物化學(xué)雜志(J.Bio1.Chem)271,第13875頁(yè),1996)。
任何編碼G3P磷酸酶活性的基因都被認(rèn)為適用于本發(fā)明的目的,其中此活性能催化甘油-3-磷酸轉(zhuǎn)化為甘油。而且,任何編碼SEQ IDNO33和17給出的G3P磷酸酶氨基酸序列的基因都被認(rèn)為能用于本發(fā)明,其中氨基酸序列包括不改變酶功能的氨基酸替換、缺失或添加。技術(shù)人員認(rèn)為分離自其它來(lái)源的編碼G3P磷酸酶的基因也適合應(yīng)用于本發(fā)明。例如,可以用一或多個(gè)下列普通或特定磷酸酶實(shí)現(xiàn)甘油-3-磷酸的脫磷酸化以產(chǎn)生甘油堿性磷酸酶(EC 3.1.3.1)[GenBankM19159,M29663,U02550或M33965];酸性磷酸酶(EC 3.1.3.2)[GenBank U51210,U19789,U28658或L20566];甘油-3-磷酸酶(EC3.1.3.-)[GenBank Z38060或U18813×11];葡萄糖-1-磷酸酶(EC3.1.3.10)[GenBank M33807];葡萄糖-6-磷酸酶(EC3.1.3.9)[GenBank U00445];果糖-1,6-二磷酸酶(EC 3.1.3.11)[GenBankX12545或J03207]或磷酯酰甘油磷酸磷酸酶(EC 3.1.3.27)[GenBankM23546和M23628]。
已知編碼甘油激酶的基因。例如,來(lái)自酵母屬的編碼甘油激酶的GUT1已被分離并測(cè)序(Pavlik等人,當(dāng)代遺傳學(xué)(Curr.Genet.)24,21,(1993)),并且編碼SEQ ID NO18給出的氨基酸序列的SEQ ID NO10給出了其堿基序列。技術(shù)人員知曉雖然在天然條件下甘油激酶催化甘油的降解,但在合適的反應(yīng)能量條件下同一種酶應(yīng)能進(jìn)行甘油的合成,將甘油-3-磷酸轉(zhuǎn)化為甘油。存在通過(guò)甘油激酶產(chǎn)生甘油的證據(jù)。在無(wú)氧或抑制呼吸的條件下,布氏錐蟲(chóng)(Trypanosomabrucei)在甘油-3-磷酸和ADP存在時(shí)產(chǎn)生甘油。此反應(yīng)發(fā)生于酵解酶體(D.Hammond,生物化學(xué)雜志(J.Biol.Chem.)260,15646-15654,(1985))。宿主細(xì)胞用于1,3-丙二醇重組生產(chǎn)的合適的宿主細(xì)胞可以為原核的或真核的,并且僅以宿主細(xì)胞表達(dá)活性酶的能力來(lái)限制。優(yōu)選的宿主是一般應(yīng)用于甘油或1,3-丙二醇的生產(chǎn)的那些,例如檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。本發(fā)明中最優(yōu)選的是大腸桿菌、克雷伯氏菌屬的菌株以及酵母屬的菌株。
腺苷鈷胺素(輔酶B12)對(duì)于甘油脫水酶活性是一種重要的輔助因子。這種輔酶是已知的最復(fù)雜的非聚合天然產(chǎn)物,并且其體內(nèi)合成通過(guò)應(yīng)用約30種基因產(chǎn)物進(jìn)行。在原核生物中發(fā)現(xiàn)了輔酶B12的合成,其中一些能夠從頭合成此化合物,而另一些能夠進(jìn)行部分反應(yīng)。例如大腸桿菌不能形成咕啉環(huán)結(jié)構(gòu),但能夠催化咕啉醇酰胺轉(zhuǎn)化為類咕啉并且能引入脫氧腺苷基團(tuán)。
真核生物不能從頭合成輔酶B12,并且作為代替從細(xì)胞外環(huán)境轉(zhuǎn)運(yùn)進(jìn)維生素B12,然后此化合物被細(xì)胞的酶轉(zhuǎn)化為活性形式的化合物。已經(jīng)描述了用于這一系列反應(yīng)的三種酶的活性1)水鈷胺素還原酶(EC 1.6.99.8)將Co(III)還原為Co(II);2)鈷(II)胺素還原酶(EC1.6.99.9)將Co(II)還原為Co(I);和3)鈷(I)胺素腺苷轉(zhuǎn)移酶(EC1.5.1.17)將5′脫氧腺苷部分從ATP轉(zhuǎn)移到還原的類咕啉。最后一種酶的活性是三種當(dāng)中表征最全面的一種,并且被鼠傷寒沙門氏桿菌的cobA、大腸桿菌的btuR和P.denitrificans的cobO編碼。這三種鈷(I)胺素腺苷轉(zhuǎn)移酶基因已被克隆和測(cè)序。鈷(I)胺素腺苷轉(zhuǎn)移酶活性已在人成纖維細(xì)胞和分離的鼠線粒體中檢測(cè)到(Fenton等人,生物化學(xué)生物物理學(xué)研究通訊(Biochem.Biophys.Res.Commun.)98,283-9,(1981))。涉及鈷還原的兩種酶表征不全面并且未得到基因序列。已有關(guān)于來(lái)自小眼蟲(chóng)(Euglena gracillus)的水鈷胺素還原酶(Watanabe等人,生物化學(xué)生物物理學(xué)文獻(xiàn)(Arch.Biochem.Biophys)305,421-7,(1993))以及來(lái)自鼠成纖維細(xì)胞的存在于微粒體和線粒體內(nèi)膜部分的微粒體鈷(II)胺素還原酶(Pezacka,(Biochem.Biophys.Acta)1157,167-77,(1993))的報(bào)道。
含維生素B12的補(bǔ)充培養(yǎng)基可以滿足許多微生物中甘油脫水酶活性所需的輔酶B12的產(chǎn)生,但在一些情況下必需在體內(nèi)另外補(bǔ)充或增加催化活性。真核生物中尤其需要增加了的輔酶B12合成。有了已發(fā)表的編碼鈷(I)胺素腺苷轉(zhuǎn)移酶的基因序列,本領(lǐng)域的技術(shù)人員能夠完成此基因的克隆和表達(dá)。例如,設(shè)想酵母如酵母屬可以被如此構(gòu)建,使其除了含有對(duì)將碳底物(如葡萄糖)轉(zhuǎn)化為1,3-丙二醇的必需的基因以外,還含有編碼鈷(I)胺素腺苷轉(zhuǎn)移酶的基因。用于鈷還原反應(yīng)的基因的克隆和表達(dá)需要另外的途徑。這可以建立在篩選到以乙醇胺為唯一氮源進(jìn)行生長(zhǎng)的大腸桿菌的基礎(chǔ)上。在輔酶B12存在時(shí),乙醇胺裂解酶使細(xì)胞能在無(wú)其它氮源時(shí)生長(zhǎng)。如果大腸桿菌細(xì)胞包含克隆的鈷(I)胺素腺苷轉(zhuǎn)移酶基因和來(lái)自另一種生物的隨機(jī)克隆DNA,水鈷胺素存在時(shí)在乙醇胺上的生長(zhǎng)會(huì)被促進(jìn),并且如果隨機(jī)克隆的DNA編碼鈷還原特性,應(yīng)加以篩選以促進(jìn)水鈷胺素的腺苷化。
甘油脫水酶是一種多亞單位的酶,包含三個(gè)以a2b2g2構(gòu)型排列的蛋白質(zhì)組分(Seyfried等人,細(xì)菌學(xué)雜志(J.Bacteriol.)5793-5796(1996))。此構(gòu)型是一種無(wú)活性的脫輔基酶,其結(jié)合一分子的輔酶B12后變成有催化活性的全酶。在催化反應(yīng)中,全酶經(jīng)過(guò)迅速的一級(jí)失活后變成無(wú)活性的復(fù)合物,其中輔酶B12已被轉(zhuǎn)移給羥基鈷胺素(Z.Schneider和J.Pawelkiewicz,(ACTA Biochim.Poi)311-328(1966))。甘油脫水酶與作為底物的甘油反應(yīng)的化學(xué)計(jì)量分析表明在失活以前每分子的酶催化100,000個(gè)反應(yīng)(Z.Schneider和J.Pawelkiewicz,(ACTA Biochim.Pol.)311-328)。在體外此失活復(fù)合物只能通過(guò)用鎂和亞硫酸鹽的強(qiáng)化學(xué)處理,去除羥基鈷胺素,以另加的輔酶B12替換才能被再激活,(Z.Schneider等人,生物化學(xué)雜志(J.Biol.Chem.)3388-3396(1970))。野生型肺炎克雷伯氏菌中失活的甘油脫水酶可以在輔酶B12、腺苷5’-三磷酸(ATP)、和錳存在時(shí)在原位(甲苯化(toluenized)細(xì)胞)被再激活(S.Honda等人,細(xì)菌學(xué)雜志(J.Bacteriol.)1458-1465(1980))。已表明這種再激活是由于ATP依賴的用輔酶B12替換無(wú)活性的鈷胺素(K.Ushio等人,維生素營(yíng)養(yǎng)學(xué)雜志(J.Nutr.Sci.Vitaminol.)225-236(1982))。經(jīng)原位催化ATP、錳和輔酶B12依賴的再激活處理的甲苯化細(xì)胞之細(xì)胞提取物就這種再激活而言是無(wú)活性的。因此,沒(méi)有強(qiáng)化學(xué)還原處理或者細(xì)胞介導(dǎo)的失活輔助因子替換,每分子的甘油脫水酶只能催化100,000個(gè)反應(yīng)。
本發(fā)明表明蛋白質(zhì)X的存在對(duì)于體內(nèi)脫水酶的再激活很重要,而且能產(chǎn)生1,3-丙二醇的宿主細(xì)胞在蛋白質(zhì)X存在時(shí)其1,3-丙二醇產(chǎn)量提高。本發(fā)明也公開(kāi)了與蛋白質(zhì)X一起,蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的存在也提高了產(chǎn)生1,3-丙二醇的宿主細(xì)胞的1,3-丙二醇產(chǎn)量。
除大腸桿菌和酵母屬外,克雷伯氏菌屬也是尤其優(yōu)選的宿主。已知肺炎克雷伯氏菌在以甘油為唯一碳源生長(zhǎng)時(shí)產(chǎn)生1,3-丙二醇。認(rèn)為克雷伯氏菌可以被遺傳性改變以從單糖、寡糖、多糖或一碳底物產(chǎn)生1,3-丙二醇。
為了改造這些菌株,最好能提供攜帶受一或多個(gè)組成型或誘導(dǎo)型啟動(dòng)子控制的基因的克雷伯氏菌宿主,這些基因可以單獨(dú)或一起促進(jìn)磷酸二羥丙酮轉(zhuǎn)化為甘油以及甘油轉(zhuǎn)化為1,3-丙二醇。分別編碼甘油-3-磷酸脫氫酶和甘油-3-磷酸酶的DAR1和GPP2基因的導(dǎo)入提供了克雷伯氏菌從合適的碳源產(chǎn)生1,3-丙二醇的遺傳機(jī)制。
編碼蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3或其它與1,3-丙二醇產(chǎn)生相關(guān)的酶基因(例如,G3PDH、G3P磷酸酶、dhaB和/或dhaT)可以被導(dǎo)入任何能在肺炎克雷伯氏菌中復(fù)制的質(zhì)粒,或者它們可以被整合進(jìn)肺炎克雷伯氏菌基因組。例如,已知肺炎克雷伯氏菌ATCC25955和肺炎克雷伯氏菌ECL 2106對(duì)四環(huán)素或氯霉素敏感;因而可以用能在肺炎克雷伯氏菌中復(fù)制并且能編碼對(duì)這兩種抗生素的一種或全部抗性的質(zhì)粒載體將這些基因?qū)敕窝卓死撞暇S媚康幕蜣D(zhuǎn)化克雷伯氏菌的方法普通并且為本領(lǐng)域所熟知,合適的方案,包括合適的載體和表達(dá)技術(shù)見(jiàn)Sambrook,出處同上。載體和表達(dá)盒本發(fā)明提供了用于在合適的宿主細(xì)胞中克隆、轉(zhuǎn)化和表達(dá)蛋白質(zhì)X、蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3以及其它與產(chǎn)生1,3-丙二醇相關(guān)的蛋白質(zhì)(如G3PDH和G3P磷酸酶)的許多載體和轉(zhuǎn)化以及表達(dá)盒。合適的載體是與所用細(xì)菌相適合的那些。合適的載體可以衍生自例如細(xì)菌、病毒(如噬菌體T7或M-13衍生的噬菌體)、粘粒、酵母或植物。獲得和應(yīng)用這些載體的方法為本領(lǐng)域的人所了解(Sambrook等人,分子克隆實(shí)驗(yàn)手冊(cè)(Molecular CloningA Laboratory Manual,Second Edition)卷1,2,3冷泉港實(shí)驗(yàn)室,冷泉港(Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1989))。
一般,載體或盒包含指導(dǎo)相關(guān)基因轉(zhuǎn)錄和翻譯的序列、一個(gè)選擇性標(biāo)記以及容許自主復(fù)制或染色體整合的序列。合適的載體包含一個(gè)位于5’區(qū)域的包含控制轉(zhuǎn)錄起始的基因以及一個(gè)位于3’區(qū)域的控制轉(zhuǎn)錄終止的DNA片段。雖然可以理解的是該控制區(qū)域不必衍生自對(duì)于所選作為生產(chǎn)宿主的特定菌種為天然的基因,最優(yōu)選的是兩個(gè)控制區(qū)域都衍生自與轉(zhuǎn)化的宿主細(xì)胞同源的基因。
對(duì)于本領(lǐng)域的技術(shù)人員,用于指導(dǎo)蛋白質(zhì)X和蛋白質(zhì)1、蛋白質(zhì)2或蛋白質(zhì)3在期望宿主細(xì)胞中表達(dá)的起始控制區(qū)域或啟動(dòng)子是大量而且熟悉的。實(shí)際上任何能驅(qū)動(dòng)這些基因的啟動(dòng)子都適用于本發(fā)明,包括但不限于CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI(用于在酵母屬的表達(dá));AOX1(用于在畢氏酵母屬的表達(dá));以及l(fā)ac、trp、IPL、IPR、T7、tac、和trc(用于在大腸桿菌的表達(dá))。
終止控制區(qū)域可以衍生自對(duì)優(yōu)選宿主為天然的多種基因。或者,終止位點(diǎn)可以為非必需,但如果含有則為最優(yōu)選的.
為了有效地表達(dá)此酶,編碼此酶的DNA通過(guò)起始密碼子有效地連接到選擇的表達(dá)控制區(qū)域,這樣表達(dá)導(dǎo)致了合適的信使RNA的形成。為生產(chǎn)1,3-丙二醇目的之合適宿主的轉(zhuǎn)化以及基因的表達(dá)構(gòu)建了合適的盒后用它們轉(zhuǎn)化合適的宿主細(xì)胞。單獨(dú)地或共同地包含dhaB活性、dhaB蛋白質(zhì)X和至少一種蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3以及任選的包括1,3-丙二醇氧化還原酶(dhaT)的盒的導(dǎo)入,可以用已知方法導(dǎo)入宿主細(xì)胞,例如轉(zhuǎn)化(例如用鈣滲透處理的細(xì)胞、電穿孔法)或利用重組噬菌體病毒的轉(zhuǎn)染(Sambrook等人,出處同上)。在本發(fā)明中,用dhaB的亞單位1、2和3以及dha蛋白質(zhì)X轉(zhuǎn)化大腸桿菌DH5α。
另外,構(gòu)建了包含編碼甘油-3-磷酸脫氫酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脫水酶(dhaB)以及1,3-丙二醇氧化還原酶(dhaT)的大腸桿菌W2042(ATCC 98188)。另外,構(gòu)建了包含質(zhì)粒pMCK10、pMCK17、pMCK30和pMCK35的釀酒酵母YPH500(ATCC 74392),其包含編碼甘油-3-磷酸脫氫酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脫水酶(dhaB)以及1,3-丙二醇氧化還原酶(dhaT)的基因。上述的兩種經(jīng)轉(zhuǎn)化的大腸桿菌和酵母菌都代表了本發(fā)明的優(yōu)選的實(shí)施方案。培養(yǎng)基和碳底物本發(fā)明的發(fā)酵培養(yǎng)基必須包含合適的碳底物。合適的底物可以包括但不限于單糖如葡萄糖和果糖,寡糖如乳糖或蔗糖,多糖如淀粉或纖維素,或者其混合物,以及來(lái)自可再生原料如奶酪乳清液(cheesewhey permeate),玉米浸汁,甜菜糖漿和大麥麥芽。另外,碳底物也可以是一碳底物如二氧化碳,或者已被證明經(jīng)過(guò)代謝轉(zhuǎn)化成為關(guān)鍵的生物化學(xué)中間物的甲醇。已報(bào)道甲基營(yíng)養(yǎng)型酵母(Yamada等人,農(nóng)業(yè)生物化學(xué)(Agric.Biol.Chem.)53(2)541-543,(1989))以及細(xì)菌(Hunter等人,生物化學(xué)(Biochemistry)24,4148-4155,(1985))可從一碳來(lái)源(例如甲醇、甲醛或甲酸鹽)產(chǎn)生甘油。這些生物能同化氧化狀態(tài)從甲烷到甲酸鹽的一碳化合物并且產(chǎn)生甘油。碳同化的途徑可以經(jīng)過(guò)核酮糖一磷酸、絲氨酸、或木酮糖一磷酸(Gottschalk,細(xì)菌代謝(Bacterial Metabolism)第二版,Springer-VerlagNew York(1086))。核酮糖一磷酸途徑涉及甲酸鹽與核酮糖-5-磷酸縮合形成六碳糖,再變成果糖,最后成為三碳產(chǎn)物甘油醛-3-磷酸。相類似,在絲氨酸途徑中,同化的一碳化合物經(jīng)過(guò)甲叉四氫葉酸進(jìn)入糖酵解途徑。
已知甲基營(yíng)養(yǎng)型生物除了利用一碳和二碳底物外,還能利用許多其它的含碳化合物如甲胺、葡萄糖胺以及許多氨基酸用于代謝活動(dòng)。例如,已知甲基營(yíng)養(yǎng)型酵母能利用碳源甲胺形成海藻糖或甘油(Beilion等人,(Microb.Growth C1Compd.),[Int.Symp.],7th(1993),415-32,編者M(jìn)urrell,J.Collin;Kelly,DonP,出版Intercept,Andover,英國(guó))。相類似,很多假絲酵母屬的種類能夠代謝丙氨酸或油酸(Sulter等人,微生物學(xué)文獻(xiàn)(Arch.Microbiol.),153(5),485-9(1990))。因此,本發(fā)明利用的碳源包括很多種類的含碳底物,并且僅受宿主生物要求的限制。
雖然認(rèn)為所有上述碳底物和其混合物都適用于本發(fā)明,優(yōu)選的碳底物是單糖、寡糖、多糖,和一碳底物。更優(yōu)選的是糖類如葡萄糖,果糖,蔗糖和一碳底物如甲醇和二氧化碳。最優(yōu)選的是葡萄糖。
除了合適的碳源外,發(fā)酵培養(yǎng)基必須包含本領(lǐng)域技術(shù)人員熟知的合適的礦物質(zhì)、鹽類、輔助因子、緩沖劑和其它組分,這些成分適合培養(yǎng)物的生長(zhǎng)并且能促進(jìn)產(chǎn)生甘油所需要的酶催化途徑。尤其被關(guān)注的是鈷(II)鹽和/或維生素B12或其前體。培養(yǎng)條件一般,在合適的培養(yǎng)基中30℃培養(yǎng)細(xì)胞。本發(fā)明中優(yōu)選的培養(yǎng)基是普通的商業(yè)化制備的培養(yǎng)基如Luria Bertani(LB)培養(yǎng)基,Sabouraud Dextrose(SD)培養(yǎng)基或酵母粉麥芽汁提取物(YM)培養(yǎng)基。也可以用其它的特定或合成的培養(yǎng)基,用于特定微生物生長(zhǎng)的合適的培養(yǎng)基應(yīng)為微生物學(xué)或發(fā)酵學(xué)領(lǐng)域的技術(shù)人員熟知。反應(yīng)基質(zhì)中也可以加入已知能直接或間接調(diào)節(jié)降解物阻遏的物質(zhì),例如環(huán)腺苷2′∶3′-一磷酸或環(huán)腺苷2′∶5′-一磷酸。相類似,已知能調(diào)節(jié)酶活性并導(dǎo)致甘油產(chǎn)量提高的物質(zhì)(例如亞硫酸鹽、亞硫酸氫鹽和堿)也可以與遺傳操作一起使用或者作為其替代物。
用于發(fā)酵的合適的pH范圍在pH5.0到pH9.0之間,其中pH6.0到pH8.0作為起始條件的優(yōu)選范圍。
反應(yīng)可以在有氧或無(wú)氧條件下進(jìn)行,其中優(yōu)選無(wú)氧或微需氧條件。分批和連續(xù)發(fā)酵本方法用分批發(fā)酵的方法。經(jīng)典的分批發(fā)酵是一個(gè)封閉的系統(tǒng),其中基質(zhì)的組分在發(fā)酵開(kāi)始時(shí)確定并且在發(fā)酵過(guò)程中不進(jìn)行人為的改變。因而,在發(fā)酵開(kāi)始時(shí)基質(zhì)中接種了所需的一種或多種生物,并且進(jìn)行發(fā)酵時(shí)不向系統(tǒng)中再加入任何材料。然而一般,分批發(fā)酵是根據(jù)加入的碳源“批量”進(jìn)行的,并且經(jīng)常需要控制例如pH和氧濃度等因素。分批系統(tǒng)中的代謝物和生物量組分始終在改變直到發(fā)酵結(jié)束。在分批培養(yǎng)物中細(xì)胞經(jīng)過(guò)穩(wěn)定的遲滯期到達(dá)迅速生長(zhǎng)的對(duì)數(shù)期,最后到達(dá)生長(zhǎng)速率停止或暫停的靜止期。如果不加以處理,靜止期的細(xì)胞最后會(huì)死亡。通常處于對(duì)數(shù)期的細(xì)胞產(chǎn)生大量的終產(chǎn)物或代謝中間物。
標(biāo)準(zhǔn)的分批系統(tǒng)的變型之一是也適合于本發(fā)明的分批補(bǔ)料(Fed-Batch)發(fā)酵系統(tǒng)。在此標(biāo)準(zhǔn)分批系統(tǒng)的變型中,發(fā)酵進(jìn)行時(shí)以增加的量加入底物。當(dāng)降解物阻遏開(kāi)始抑制細(xì)胞的代謝時(shí)以及期望基質(zhì)中含有有限量的底物時(shí),適合應(yīng)用分批補(bǔ)料系統(tǒng)。難以測(cè)定分批補(bǔ)料系統(tǒng)中確切的底物濃度,因此根據(jù)可測(cè)量因素如pH、溶解氧和廢氣如CO2的分壓進(jìn)行估計(jì)。分批發(fā)酵和分批補(bǔ)料發(fā)酵普通并且為本領(lǐng)域所熟知,應(yīng)用舉例參見(jiàn)Brock出處同上。
也認(rèn)為此方法可適用于連續(xù)發(fā)酵。連續(xù)發(fā)酵是一個(gè)開(kāi)放系統(tǒng),其中在發(fā)酵進(jìn)行中將特定的發(fā)酵基質(zhì)連續(xù)加入到生物反應(yīng)器中,同時(shí)取出等量的一定條件的基質(zhì)。連續(xù)發(fā)酵通常保持培養(yǎng)物始終處于高密度,其中的細(xì)胞主要處于對(duì)數(shù)生長(zhǎng)期。
連續(xù)發(fā)酵容許調(diào)節(jié)影響細(xì)胞生長(zhǎng)或終產(chǎn)物濃度的一個(gè)或多個(gè)因素。例如,有一種方法保持有限的營(yíng)養(yǎng)物如碳源或氮源的水平維持固定的比率而允許其它因素的改變。在其它系統(tǒng)中許多影響生長(zhǎng)的因素可以持續(xù)變化,而根據(jù)基質(zhì)濁度測(cè)定的細(xì)胞濃度維持恒定。連續(xù)發(fā)酵系統(tǒng)意在維持穩(wěn)定的生長(zhǎng)條件的狀態(tài),因而在發(fā)酵中由于取出基質(zhì)導(dǎo)致的細(xì)胞損失與細(xì)胞生長(zhǎng)比率保持平衡。連續(xù)發(fā)酵工藝中調(diào)整營(yíng)養(yǎng)物和生長(zhǎng)因素的方法以及將產(chǎn)物得率最大化的技術(shù)為工業(yè)微生物領(lǐng)域所熟知,并且很多方法被Brock,出處同上詳細(xì)描述。
本發(fā)明可以采用分批、分批補(bǔ)料或連續(xù)發(fā)酵工藝并且任何已知形式的發(fā)酵都是可行的。另外,可以考慮將細(xì)胞作為完整細(xì)胞催化劑固定于底物上并經(jīng)歷適合生產(chǎn)1,3-丙二醇的發(fā)酵條件。1,3-丙二醇生產(chǎn)途徑中的改變代表性的酶催化途徑從葡萄糖產(chǎn)生1,3-丙二醇可以用下面的一系列步驟完成。該系列代表了本領(lǐng)域技術(shù)人員了解的很多途徑。在一系列步驟中葡萄糖被糖酵解途徑的酶轉(zhuǎn)化成磷酸二羥丙酮(DHAP)和3-磷酸甘油醛(3-PG)。然后通過(guò)DHAP水解形成二羥丙酮(DHA)后再被還原形成甘油,或者通過(guò)DHAP還原為甘油-3-磷酸(G3P)后再被水解都可形成甘油。水解步驟可以被任何種類的已知對(duì)其底物特異或非特異的細(xì)胞磷酸酶催化,或者可以通過(guò)重組將此活性引入宿主。還原步驟可以被NAD+(或NADp+)偶聯(lián)的宿主酶催化,或者可以通過(guò)重組將此活性引入宿主。需要注意的是dha調(diào)節(jié)子包含一個(gè)催化方程式3所示可逆反應(yīng)的甘油脫氫酶(E.C.1.1.1.6)。
(方程式1)(方程式2)(方程式3)如上面詳細(xì)描述的,甘油經(jīng)過(guò)中間產(chǎn)物3-羥基丙醛(3-HP)轉(zhuǎn)化為1,3-丙二醇。在由宿主編碼的或可通過(guò)重組引入宿主的脫水酶催化下由甘油產(chǎn)生中間產(chǎn)物3-HP(方程式1)。此脫水酶可以是甘油脫水酶(E.C.4.2.1.30),二醇脫水酶(E.C.4.2.1.28),或任何其它能催化此轉(zhuǎn)化反應(yīng)的酶。甘油脫水酶,而不是二醇脫水酶,由dha調(diào)節(jié)子編碼。在NAD+(或NADP+)偶聯(lián)的宿主酶或者通過(guò)重組引入宿主的酶活性催化下從3-HP產(chǎn)生1,3-丙二醇(方程式2)。這一生產(chǎn)1,3-丙二醇的終反應(yīng)可以被1,3-丙二醇脫氫酶(E.C.1.1.1.202)或其它乙醇脫氫酶催化。影響碳途徑的突變和轉(zhuǎn)化包含改變的1,3-丙二醇產(chǎn)生途徑的多種突變體生物可以應(yīng)用于本發(fā)明。將磷酸丙糖異構(gòu)酶突變(tpi-)引入微生物是通過(guò)碳途徑改良性狀的突變之應(yīng)用例子?;蛘?,降低乙醇(adh)或乳酸鹽(ldh)產(chǎn)生的突變能增加用于生產(chǎn)1,3-丙二醇的NADH產(chǎn)量。其它的糖酵解中甘油醛-3-磷酸之后的步驟如磷酸甘油酸變位酶(pgm)的突變可以用于促進(jìn)碳進(jìn)入1,3-丙二醇的產(chǎn)生途徑。抑制PEP損失的影響葡萄糖轉(zhuǎn)運(yùn)系統(tǒng)如PTS的突變也證明是有用的。阻斷1,3-丙二醇產(chǎn)生途徑的中間產(chǎn)物的替代途徑如甘油分解途徑(glp)的突變也可以用于本發(fā)明。突變可以針對(duì)結(jié)構(gòu)基因以降低或促進(jìn)酶的活性,或者針對(duì)調(diào)節(jié)基因以調(diào)節(jié)酶活性的表達(dá)水平。
或者,轉(zhuǎn)化可以與突變結(jié)合以控制特定的酶活性,從而提高1,3-丙二醇的產(chǎn)量。因此期望通過(guò)修飾完整細(xì)胞催化劑來(lái)提高1,3-丙二醇的產(chǎn)量均屬于本發(fā)明的范圍。1,3-丙二醇的鑒定和純化從發(fā)酵基質(zhì)中純化1,3-丙二醇的方法為本領(lǐng)域熟知。例如,通過(guò)將反應(yīng)混合物進(jìn)行有機(jī)溶劑抽提、蒸餾和柱層析可以從細(xì)胞基質(zhì)獲得丙二醇(U.S.5,356,812)。用于此方法的尤其合適的有機(jī)溶劑是環(huán)己烷(US.5,008,473)。
通過(guò)對(duì)基質(zhì)進(jìn)行高壓液相層析(HPLC)分析可以直接鑒定1,3-丙二醇。本發(fā)明優(yōu)選的一種方法是用分析離子交換柱以無(wú)梯度形式的0.01N的硫酸為流動(dòng)相分析發(fā)酵基質(zhì)。G3PDH和G3P磷酸酶的鑒定和純化用酶分析方法測(cè)量蛋白質(zhì)G3PDH和G3P磷酸酶的表達(dá)水平,G3PDH活性分析依據(jù)DHAP轉(zhuǎn)化為G-3-P反應(yīng)中的輔助底物NADH的光譜性質(zhì)。NADH具有固有的UV/可見(jiàn)光吸收并且其吸收可以在340nm用分光光度法檢測(cè)。通過(guò)測(cè)定反應(yīng)中釋放的無(wú)機(jī)磷酸的方法可以測(cè)定G3P磷酸酶的活性。最常用的檢測(cè)方法是用可見(jiàn)光光譜分析測(cè)定蘭色的鉬磷酸銨復(fù)合物。
實(shí)施例一般方法磷酸化、連接和轉(zhuǎn)化的步驟在本領(lǐng)域中眾所周知??稍赟ambrook等人,分子克隆實(shí)驗(yàn)手冊(cè)(Molecular CloningALaboratory Manual,Second Edition)卷1,2,3冷泉港實(shí)驗(yàn)室,冷泉港(Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989))中找到適合用于下列實(shí)施例的技術(shù)。
適合細(xì)菌培養(yǎng)物維持和生長(zhǎng)的材料和方法在本領(lǐng)域中眾所周知??稍谌缙胀?xì)菌學(xué)方法手冊(cè)(Manual of Methods for GeneralBacteriologv)(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg G.和Briggs Phillips,編),美國(guó)微生物學(xué)協(xié)會(huì),Washington,DC.(1994)或者Thomas D.Brock生物技術(shù)學(xué)工業(yè)微生物學(xué)教科書(shū),第二版,(BiotechnologyA Txetbook of Industrial Microbiology,SecongEdition)Sinayer Associates,Inc.,Sunderland,MA(1989)中找到適合用于下列實(shí)施例的技術(shù)。除非另外指明,所有用于細(xì)菌細(xì)胞生長(zhǎng)和維持的試劑和材料可以從Aldrich Chemicai(Milwaukee,WI),DIFCO實(shí)驗(yàn)室(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma化學(xué)公司(St.Louis,MO)獲得。
縮寫(xiě)的意思如下“h”指小時(shí),“min”指分鐘,“sec”指秒,“d”指天,“mL”指毫升,“L”指升。酶分析用1,2-丙二醇為底物確定無(wú)細(xì)胞抽提物中甘油脫水酶的活性?;谌┡c甲苯-2-噻唑酮腙的反應(yīng)的此分析方法由Forage和Foster((Biochim.Biophys.Acta.),569,249(1979))描述。如Johnson和Lin,細(xì)菌學(xué)雜志(J. Bacteriol.),169,2050(1987)所描述,用1,3-丙二醇和NAD+為底物在溶液中或在平板膠中測(cè)定有時(shí)被稱為1,3-丙二醇脫氫酶的1,3-丙二醇氧化還原酶的活性。如所描述的(R.M.Bell和J.E.Cronan,Jr.,生物化學(xué)雜志(J.Biol.Chem.)2507153-8(1975)),在NADH或NADPH耗盡之后,用分光光度測(cè)定法測(cè)定NADH或NADPH依賴的甘油3-磷酸脫氫酶(G3PDH)的活性。
Honda等人(1980,甘油滅活的輔酶B12依賴性酶、甘油脫水酶和二醇脫水酶的原位再激活細(xì)菌學(xué)雜志1431458-1465)公開(kāi)了測(cè)定脫水酶再激活的分析實(shí)驗(yàn)。甘油-3-磷酸酶,GPP的分析通過(guò)將抽提物與bis-Tris或MES和pH6.5的鎂離子緩沖液中的有機(jī)磷酸底物孵育進(jìn)行酶活性分析。使用的底物是l-a-甘油磷酸;d,l-a-甘油磷酸。分析中試劑的終濃度為緩沖液(20mM bis-Tris或50mMMES);MgCl2(10mM);以及底物(20mM)。如果樣品中總蛋白很少并且用酸終止反應(yīng)無(wú)可見(jiàn)沉淀發(fā)生,則方便地在比色杯中分析樣品。此方法包括在含20mM底物(50mL,200mM),50mM MES,10mM MgCl2,pH6.5緩沖液的比色杯中孵育酶樣品。磷酸酶分析終體積為0.5mL。將含酶樣品加到反應(yīng)混合物中;混合比色杯內(nèi)成分,然后將比色杯放置于T=37℃的循環(huán)水浴中5到10分鐘,這取決于酶樣品中磷酸酶活性范圍是否為2到0.02U/mL。通過(guò)加入酸性鉬酸鹽試劑(0.4mL)終止酶反應(yīng)。加入Fiske SubbaRow試劑(0.1mL)和蒸餾水(1.5mL)后,將溶液混合使之顯色。10分鐘后,用Cary 219 UV/可見(jiàn)分光光度計(jì)在660nm測(cè)樣品的吸收值。將釋放的無(wú)機(jī)磷酸鹽的量與標(biāo)準(zhǔn)曲線比較,通過(guò)使用無(wú)機(jī)磷酸鹽貯存液(0.65mM)和用終濃度范圍從0.026到0.130mmol/mL的無(wú)機(jī)磷酸鹽制備6個(gè)標(biāo)準(zhǔn)品制作標(biāo)準(zhǔn)曲線。1,3-丙二醇的分離和鑒定用HPLC監(jiān)測(cè)甘油轉(zhuǎn)化為1,3-丙二醇。用層析領(lǐng)域的技術(shù)人員可得的標(biāo)準(zhǔn)技術(shù)和材料進(jìn)行分析。一種合適的方法應(yīng)用使用UV(210nm)和RI檢測(cè)的Waters Maxima 820 HPLC系統(tǒng)。將樣品注射到裝有Shodex SH-1011P前置柱(6mm×50mm)的Shodex SH-1011柱上(8mm×300mm,購(gòu)自Waters,Milford,MA),溫度控制在50℃,用0.01NH2SO4作為流動(dòng)相,流速為0.5mL/min。當(dāng)期望進(jìn)行定量分析時(shí),用已知量的三甲基乙酸作為外標(biāo)制備樣品。一般,甘油(RI檢測(cè))、1,3-丙二醇(RI檢測(cè))和三甲基乙酸(UV和RI檢測(cè))的滯留時(shí)間分別為20.67min、26.08min和35.03min。
GC/MS證實(shí)了1,3-丙二醇的產(chǎn)生。用GC/MS領(lǐng)域的技術(shù)人員可得的標(biāo)準(zhǔn)技術(shù)和材料進(jìn)行分析。一種合適的方法利用與Hewlett Packard5971 Series質(zhì)量選擇性檢測(cè)器(EI)和HP-INNOWax柱(長(zhǎng)30m,內(nèi)徑0.25mm.,薄膜厚0.25微米)連接的Hewlett Packard 5890 Series II氣相色譜儀。比較產(chǎn)生的1,3-丙二醇和真正的1,3-丙二醇的滯留時(shí)間和質(zhì)譜(m/e57,58)。
GC/MS的另一方法涉及樣品的衍生化。將30uL濃縮的(70%v/v)高氯酸加入到1.0mL樣品(例如,培養(yǎng)物上清)中?;旌虾?,冷凍并冷凍干燥樣品。雙(三甲基甲硅烷基)三氟乙酰胺∶吡啶為1∶1的混合物(300uL)加到凍干物質(zhì)中,劇烈混合并于65℃靜置1小時(shí)。離心清除樣品的不溶性物質(zhì)。得到的液體分配成兩相,上層用于分析。用DB-5柱(48m,內(nèi)徑0.25mm,薄膜厚0.25um;獲自J&WScientific)層析樣品,并且比較得自培養(yǎng)物上清的1,3-丙二醇衍生物與得自真正標(biāo)準(zhǔn)品的滯留時(shí)間和質(zhì)譜。TMS衍生的1,3-丙二醇的質(zhì)譜含有205、177、130和115AMU的特征性離子。實(shí)施例1用粘粒DNA克隆和轉(zhuǎn)化大腸桿菌宿主細(xì)胞以表達(dá)1,3-丙二醇培養(yǎng)基用合成S12培養(yǎng)基篩選有產(chǎn)生1,3-丙二醇的能力的細(xì)菌轉(zhuǎn)化體。S12培養(yǎng)基含有10mM硫酸銨,50mM磷酸鉀緩沖液,pH7.0,2mMMgCl2,0.7mM CaCl2,50uM MnCl2,1uM FeCl3,1uM ZnCl2,1.7uM CuSO4,2.5uM CoCl2,2.4uM Na2MoO4和2uM鹽酸硫胺。
用于生長(zhǎng)和發(fā)酵的培養(yǎng)基A包括10mM硫酸銨;50mMMOPS/KOH緩沖液,pH7.5;5mM磷酸鉀緩沖液,pH7.5;2mMMgCl2;0.7mM CaCl2;50uM MnCl2;1uM ZnCl2;1.72uM CuSO4,2.53uM CoCl2;2.42uM Na2MoO4;2uM鹽酸硫胺;0.01%酵母抽提物;0.01%酪蛋白水解物;0.8ug/mL維生素B12和50ug/mL氨芐青霉素。按要求培養(yǎng)基A補(bǔ)加0.2%甘油或0.2%甘油和0.2%D-葡萄糖。細(xì)胞肺炎克雷伯氏菌ECL2106(Ruch等,細(xì)菌學(xué)雜志,124,348(1075)),已知在文獻(xiàn)中也為產(chǎn)氣克雷伯氏菌或產(chǎn)氣氣桿菌,得自E.C.C. Lin(哈佛醫(yī)學(xué)院,Cambridge,MA)并作為實(shí)驗(yàn)室培養(yǎng)物保藏。
肺炎克雷伯氏菌ATCC 25955購(gòu)自美國(guó)典型培養(yǎng)物保藏中心(Rockville,MD)。
大腸桿菌DH5α購(gòu)自Gibco/BRL并且用從肺炎克雷伯氏菌ATCC25955分離的含有編碼甘油或二醇脫水酶基因的粘粒DNA將其轉(zhuǎn)化。含有甘油脫水酶的粘粒被稱為pKP1和pKP2,含有二醇脫水酶的粘粒被稱為pKP4。被轉(zhuǎn)化的DH5α細(xì)胞被稱為DH5α-pKP1、DH5αt-pKP2和DH5α-pKP4。
大腸桿菌ECL707(Sprenger等,普通微生物學(xué)雜志(J. Gen.Microbiol.),135,1255(1989))得自E.C.C.Lin(哈佛醫(yī)學(xué)院,Cambridge,MA)并且相類似地用獲自肺炎克雷伯氏菌的粘粒DNA將其轉(zhuǎn)化。這些轉(zhuǎn)化體被稱為含有甘油脫水酶基因的ECL707-pKP1和ECL707-pKP2以及含有二醇脫水酶基因的ECL707-pKP4。
含有tpi基因突變的大腸桿菌AA200(Anderson等,普通微生物學(xué)雜志,62,329(1970))購(gòu)自大腸桿菌基因儲(chǔ)藏中心,耶魯大學(xué)(New Haven,CT)并且用克雷伯氏菌的粘粒DNA將其轉(zhuǎn)化以產(chǎn)生含有甘油脫水酶基因的重組體生物AA200-pKP1和AA200-pKP2以及含有二醇脫水酶基因的AA200-pKP4。DH5α用5mL LB培養(yǎng)基洗六個(gè)含有大約1000個(gè)菌落的經(jīng)肺炎克雷伯氏菌DNA轉(zhuǎn)染的大腸桿菌XL1-Blue MR的轉(zhuǎn)化平皿并離心。沉淀細(xì)菌并將其重懸浮在5mL LB培養(yǎng)基+甘油中。將等量樣品(50uL)接種于含有S12合成培養(yǎng)基以及0.2%甘油+每mL 400ng的B12+0.001%酵母抽提物+50氨芐青霉素的15mL試管中。用培養(yǎng)基將試管加滿至頂部,并用石蠟?zāi)し饪诓⑶矣?0℃孵育。48小時(shí)后觀察到輕微渾濁。如上所述在78小時(shí)和132小時(shí)分析等量樣品的產(chǎn)物分布,等量樣品對(duì)于1,3-丙二醇為陽(yáng)性,后一個(gè)時(shí)間點(diǎn)含有增加量的1,3-丙二醇。
分級(jí)稀釋對(duì)于1,3-丙二醇的產(chǎn)生測(cè)試為陽(yáng)性的細(xì)菌,并且涂布到LB-50氨芐青霉素(amp)平板上以分離單個(gè)菌落。為產(chǎn)生1,3-丙二醇的目的分離了48個(gè)單菌落并對(duì)其再次檢測(cè)。從6個(gè)非依賴性菌落分離了粘粒DNA并且將其轉(zhuǎn)化進(jìn)大腸桿菌DH5α中。為產(chǎn)生1,3-丙二醇的目的再次檢測(cè)轉(zhuǎn)化體。進(jìn)一步表征了兩個(gè)轉(zhuǎn)化體并稱其為Dh5α-pKP1和DH5αx-pKP2。
將一個(gè)獲自pKP1的12.1kb的EcoRI-SalI片段亞克隆進(jìn)pIBI31(IBI Biosystem,New Haven,CT),測(cè)序并稱為pHK28-26(SEQ IDNO19)。測(cè)序揭示了編碼甘油脫水酶和調(diào)節(jié)作用必需基因的dha操縱子之相關(guān)開(kāi)放閱讀框架的基因座。參照SEQ ID NO19,發(fā)現(xiàn)編碼二羥基丙酮激酶的dhaK的開(kāi)放閱讀框架之片段位于1-399位堿基;發(fā)現(xiàn)編碼甘油脫氫酶的dhaD的開(kāi)放閱讀框架之片段位于983-2107位堿基;發(fā)現(xiàn)編碼抑制子的dhaR的開(kāi)放閱讀框架之片段位于2209-4134位堿基;發(fā)現(xiàn)編碼1,3-丙二醇氧化還原酶的dhaT的開(kāi)放閱讀框架之片段位于5017-6180位堿基;發(fā)現(xiàn)編碼甘油脫水酶α亞基的dhaB1的開(kāi)放閱讀框架之片段位于7044-8711位堿基;發(fā)現(xiàn)編碼甘油脫水酶β亞基的dhaB2的開(kāi)放閱讀框架之片段位于8724-9308位堿基;發(fā)現(xiàn)編碼甘油脫水酶γ亞基的dhaB3的開(kāi)放閱讀框架之片段位于9311-9736位堿基;以及發(fā)現(xiàn)編碼未知功能蛋白質(zhì)的dhaBX的開(kāi)放閱讀框架之片段位于9749-11572位堿基。
經(jīng)獲自肺炎克雷伯氏菌的包裝粘粒DNA轉(zhuǎn)染的大腸桿菌XL1-BlueMR之單菌落被接種進(jìn)含200μL的S15培養(yǎng)基(硫酸銨,10mM;磷酸鉀緩沖液,pH7.0,1mM;MOPS/KOH緩沖液,pH7.0,50mM;MgCl2,2mM;CaCl2,0.7mM;MnCl2,50uM;FeCl3,1uM;ZnCl2,1uM;CuSO4,1.72uM;CoCl2,2.53uM;Na2MoO4,2.42uM和鹽酸硫胺,2uM)+0.2%甘油+400ng/mL維生素B12+0.001%酵母抽提物+50ug/mL氨芐青霉素的微滴定孔中。除微滴定孔外,也接種一塊含有LB-50amp的主平皿。96小時(shí)后,取出100uL并在具有0.2微米尼龍膜過(guò)濾器的Rainin微離心管中離心。保留細(xì)菌并且對(duì)濾出物進(jìn)行HPLC分析。篩選大約240個(gè)菌落后鑒定表明產(chǎn)生1,3-丙二醇的陽(yáng)性菌落。鑒定了三個(gè)陽(yáng)性菌落,其中兩個(gè)在LB50-amp上生長(zhǎng)而一個(gè)不能不能在其上生長(zhǎng)。分離出在LB-50amp上生長(zhǎng)的兩個(gè)陽(yáng)性菌落之一的單菌落并證實(shí)產(chǎn)生1,3-丙二醇,稱之為pKP4。從含有pKP4的大腸桿菌菌株分離出粘粒DNA并且轉(zhuǎn)化大腸桿菌菌株DH5α。證實(shí)稱為DH5α-pKP4的非依賴性轉(zhuǎn)化體能產(chǎn)生1,3-丙二醇。ECL707用相應(yīng)于pKP1、pKP4其中之一或單獨(dú)的Supercos載體的粘粒肺炎克雷伯氏菌DNA轉(zhuǎn)化大腸桿菌菌株ECL707,并將其分別命名為ECL707-pKP1、ECL707-pKP2、ECL707-pKP4和ECL707-sc。ECL707中g(shù)lpK、gld和ptsD是缺陷型的,其分別編碼用于磷酸烯醇丙酮酸依賴性磷酸轉(zhuǎn)移酶系統(tǒng)的二羥基丙酮的ATP依賴性甘油激酶、NAD+偶聯(lián)的甘油脫氫酶和酶II。
將從LB50-amp平板上分離的20個(gè)均為粘粒轉(zhuǎn)化的單菌落和5個(gè)單獨(dú)的Supercos載體(陰性對(duì)照)轉(zhuǎn)化的菌落轉(zhuǎn)移到主LB-50amp平板上。為了確定這些分離物是否含有脫水酶活性也檢測(cè)它們將甘油轉(zhuǎn)化成1,3-丙二醇的能力。用無(wú)菌牙簽將轉(zhuǎn)化體轉(zhuǎn)移到含有200uL補(bǔ)加了0.2%甘油或0.2%甘油加0.2%D-葡萄糖的培養(yǎng)基A之微量滴定板中。30℃孵育48小時(shí)后,用0.45微米尼龍過(guò)濾器過(guò)濾微量滴定板孔的內(nèi)容物并對(duì)其進(jìn)行HPLC層析。表1中給出了這些測(cè)試的結(jié)果。
表1由經(jīng)轉(zhuǎn)化的ECL707將甘油轉(zhuǎn)化至1,3丙二醇轉(zhuǎn)化體 甘油*甘油加葡萄糖*ECL707-pKP119/2019/20ECL707-pKP218/2020/20ECL707-pKP 40/2020/20ECL707-sc 0/5 0/5*表示陽(yáng)性分離物數(shù)目/測(cè)試的分離物總數(shù)AA200用相應(yīng)于pKP1、pKP2、pKP4其中之一和單獨(dú)的Supercos載體的粘粒肺炎克雷伯氏菌DNA轉(zhuǎn)化大腸桿菌菌株AA200并將其分別命名為AA200-pKP1、AA200-pKP2、AA200-pKP4和AA200-sc。菌株AA200為磷酸丙糖異構(gòu)酶缺陷型(tpi)。
如描述大腸桿菌菌株ECL707時(shí)所述,分離了每種粘粒轉(zhuǎn)化的20個(gè)單菌落和5個(gè)空載體轉(zhuǎn)化菌落并檢測(cè)了它們將甘油轉(zhuǎn)化為1,3-丙二醇的能力。表2給出了這些測(cè)試的結(jié)果。
表2由經(jīng)轉(zhuǎn)化的AA200將甘油轉(zhuǎn)化至1,3丙二醇轉(zhuǎn)化體甘油*甘油加葡萄糖*AA200-pKP117/2017/20AA200-pKP217/2017/20AA200-pKP42/20 16/20AA200-sc 0/5 0/5*表示陽(yáng)性分離物數(shù)目/測(cè)試的分離物總數(shù)實(shí)施例2重組體大腸桿菌利用DAR1、GPP2、dhaB和dhaT將D-葡萄糖轉(zhuǎn)化成1,3-丙二醇構(gòu)建用于大腸桿菌轉(zhuǎn)化的一般目的之表達(dá)質(zhì)粒表達(dá)載體pTaclQ大腸桿菌表達(dá)載體pTaclQ含有插入到pBR322的EcoRI的laclq基因(Sutcliffe等,(Cold Spring Harb.symp.Quant.Biol.) 43,77(1979))(Farabaugh,自然(Nature)274,5673(1978)和tac啟動(dòng)子(Amann等,基因(Gene)25,167(1983)。多克隆位點(diǎn)和終止子序列(SEQ ID NO20)取代了pBR322的從EcoRI到SphI的序列。甘油脫水酶基因的亞克隆(dhaB1,2,3)使用引物(SEQ ID NO21和22)通過(guò)PCR從pHK28-26擴(kuò)增dhaB3基因的開(kāi)放閱讀框架(在5′末端引入了一個(gè)EcoRI位點(diǎn)以及在3′末端引入了一個(gè)XbaI位點(diǎn))。將產(chǎn)物亞克隆進(jìn)pLitmus29(NewEngland Biolab,Inc.,Beverly,MA)以產(chǎn)生含有dhaB3的質(zhì)粒pDHAB3。
使用限制性酶KpnI和EcoRI將包含獲自pHK28-26的dhaB操縱子之4個(gè)基因的完整編碼區(qū)域的區(qū)域克隆進(jìn)pBluescriptII KS+(Stratagene,La Jolla,CA)以構(gòu)建質(zhì)粒pM7。
通過(guò)用ApaI和XbaI(刪除部分dhaB3和所有的dhaBX)酶解含有dhaB(1,2,3,4)的質(zhì)粒pM7去除dhaBX基因。純化所得的5.9kb片段并將其與獲自質(zhì)粒pDHAB3的325-bp ApaI-XbaI片段連接(恢復(fù)dhaB3基因)以建立含有dhaB(1,2,3)的pM11。
使用引物(SEQ ID NO23和SEQ ID NO24)通過(guò)PCR從pHK28-26擴(kuò)增dhaB1基因的開(kāi)放閱讀框架(在5′末端引入了一個(gè)HindIII位點(diǎn)和一個(gè)共有RBS核糖體結(jié)合位點(diǎn)以及在3′末端引入了一個(gè)XbaI位點(diǎn))。將產(chǎn)物亞克隆進(jìn)pLitmus28(New England Biolab,Inc.)以產(chǎn)生含有dhaB1的質(zhì)粒pDT1。
將獲自含有dhaB1基因、dhaB2基因和dhaB3基因的一部分的pM11之NotI-XbaI片段插入pDT1以建立dhaB表達(dá)質(zhì)粒pDT2。將含有獲自pDT2的dhaB(1,2,3)基因之HindIII-XbaI片段插入pTaclQ以建立pDT3。1,3-丙二醇脫氫酶基因(dhaT)的亞克隆將含有完整1,3-丙二醇脫氫酶(dhaT)基因的pHK28-26之KpnI-SacI片段亞克隆進(jìn)pBluescriptII KS+得到了pAH1。使用合成引物(SEQ ID NO25以及SEQ ID NO26)從作為模板DNA的pAH1用PCR擴(kuò)增dhaT因(在5′末端引入了一個(gè)XbaI位點(diǎn)以及在3′末端引入了一個(gè)BamHI位點(diǎn))。將產(chǎn)物亞克隆進(jìn)pCR-Script(Stratagene)的SrfI位點(diǎn)產(chǎn)生含有dhaT的質(zhì)粒pAH4和pAH5。質(zhì)粒pAH4含有用于從pCR-Script中l(wèi)ac啟動(dòng)子開(kāi)始表達(dá)的正確方向的dhaT基因,pAH5含有反方向的dhaT基因。將獲自含有dhaT基因的pAH4之XbaI-BamHI片段插入pTaclQ產(chǎn)生質(zhì)粒pAH8。將獲自含有RBS和dhaT基因的pAH8之HindIII-BamHI片段插入pBluescript KS+建立pAH11。將獲自含有RBS、dhaT基因和終止子的pAH8之HindIII-SalI片段插入pBluescriptII SK+建立pAH12。dhaB(1,2,3和dhaT的表達(dá)盒的構(gòu)建使用標(biāo)準(zhǔn)分子生物學(xué)方法從上述單獨(dú)dhaB(1,2,3)和dhaT亞克隆組裝dhaB(1,2,3)和dhaT的表達(dá)盒。將獲自含有RBS、dhaT基因和終止子的pAH8之SpeI-KpnI片段插入pDT3的XbaI-KpnI位點(diǎn)以建立pAH23。去除pAH23的dhaB3和dhaT基因之間的SmaI-EcoRI片段以建立pAH26。用含有獲自pDT2的EcoRI位點(diǎn)之SpeI-NotI片段取代pAH26的SpeI-NotI片段以產(chǎn)生pAH27。dhaT和dhaB(1,2,3)表達(dá)盒的構(gòu)建使用標(biāo)準(zhǔn)分子生物學(xué)方法從前述單獨(dú)的dhaB(1,2,3)和dhaT亞克隆組裝dhaT和dhaB(1,2,3)的表達(dá)盒。將含有獲自pDT3的dhaB(1,2,3)基因之SpeI-SacI片段插入pAH11的SpeI-SacI位點(diǎn)以建立pAH24。用于增加大腸桿菌中甘油產(chǎn)量的甘油3-磷酸酶的克隆和表達(dá)釀酒酵母的染色體Vλ克隆6592(Gene Bank,保藏號(hào)#U18813×11)得自ATCC。使用合成引物(SEQ ID NO27以及SEQ IDNO28)從作為靶DNA的λ克隆通過(guò)PCR克隆方法克隆到甘油3-磷酸磷酸酶(GPP2)基因(在5′末端引入了一個(gè)BamHI-RBS-XbaI位點(diǎn)以及在3′末端引入了一個(gè)SmaI位點(diǎn))。將產(chǎn)物亞克隆進(jìn)pCR-Script(Stratagene)的SrfI位點(diǎn)以產(chǎn)生含有GPP2的質(zhì)粒pAH15。質(zhì)粒pAH15含有對(duì)于從pCR-Script SK+中l(wèi)ac啟動(dòng)子表達(dá)為無(wú)活性方向的GPP2基因。將獲自含有GPP2基因的pAH15之BamHI-SmaI片段插入pBlueScriptII SK+以產(chǎn)生質(zhì)粒pAH19。PAH19含有對(duì)于從lac啟動(dòng)子表達(dá)為正確方向的GPP2基因。將獲自含有GPP2基因的pAH19之XbaI-PstI片段插入pPHOX2以建立質(zhì)粒pAH21。用于表達(dá)dhaT、dhaB(1,2,3)和GPP2基因的質(zhì)粒將一個(gè)SalI-EcoRI-XbaI接頭(SEQ ID NO29和30)插入用限制性酶SalI-XbaI酶解的pAH5以產(chǎn)生pDT16。接頭破壞了XbaI位點(diǎn)。然后將獲自pDT16的1kb之SalI-MluI片段插入pAH24,取代了現(xiàn)存的SalI-MluI片段以建立pDT18。
將含有獲自pDT18的dhaT和dhaB(1,2,3)之表達(dá)盒的4.1kb EcoRI-XbaI片段和含有獲自pAH21的GPP2基因之1.0kb的XbaI-SaII片段插入用限制性酶EcoRI和SalI酶解的載體pMMB66EH(F*ste等,基因(GENE),48,119(1986))以建立pDT20。用于在大腸桿菌中過(guò)量表達(dá)DAR1的質(zhì)粒使用合成引物(SEQ ID NO46以及SEQ ID NO47)從釀酒酵母基因組DNA通過(guò)PCR克隆分離DAR1。成功的PCR克隆在DAR15′末端引入一個(gè)NcoI位點(diǎn),NcoI內(nèi)的ATG是DAR1的起始甲硫氨酸。在DAR1的3’端翻譯終止子之后引入一個(gè)BamHI位點(diǎn)。用NcoI+BamHI酶解PCR片段并將其克隆進(jìn)表達(dá)質(zhì)粒pTrc99A(Pharmacia,Piseataway,New Jersey)內(nèi)的相同位點(diǎn)以產(chǎn)生pDAR1A。
為了在DAR1的5′未端建立更好的核糖體結(jié)合位點(diǎn),將通過(guò)合成引物(SEQ ID NO48以及SEQ ID NO49)退火得到的一個(gè)SpeI-PBS-NcoI接頭插入pDAR1A的NcoI位點(diǎn)以建立pAH40。質(zhì)粒pAH40含有對(duì)于從Trc99A(Pharmacia)的trc啟動(dòng)子表達(dá)為正確方向的新RBS和DAR1基因。將獲自pDAR1A的NcoI-BamHI片段和通過(guò)合成引物(SEQ IDNO31以及SEQ ID NO32)退火得到的第二套SpeI-RBS-NcoI接頭插入pBluescript II-SK+(Stratagene)的SpeI-BamHI位點(diǎn)以建立pAH41。構(gòu)件pAH41含有氨芐青霉素抗性基因。將獲自pDAR1A的NcoI-BamHI片段和通過(guò)合成引物(SEQ ID NO31以及SEQ ID NO32)退火得到的第二套SpeI-RBS-NcoI接頭插入pBC-SK+(Stratagene)的SpeI-BamHI位點(diǎn)以建立pAH42。構(gòu)件pAH42含有氯霉素抗性基因。DAR1和GPP2的表達(dá)盒的構(gòu)建使用標(biāo)準(zhǔn)分子生物學(xué)方法從上述單獨(dú)的DAR1和GPP2亞克隆組裝DAR1和GPP2的表達(dá)盒。將含有RBS和GPP2基因的獲自pAH19之BamHI-PstI片段插入pAH40以建立pAH43。將含有RBS和GPP2基因的獲自pAH19之BamHI-PstI片段插入pAH41以建立pAH44。將含有RBS和GPP2基因的獲自pAH19之相同的BamHI-PstI片段插入pAH42以建立pAH45。
如下改造位于GPP2 5′末端的核糖體結(jié)合位點(diǎn)。將由合成引物GATCCAGGAAACAGA以及CTAGTCTGTTTCCTG與含有GPP2基因的獲自pAH19之XbaI-PstI片段退火得到的BamHI-RBS-SpeI接頭插入pAH40的BamHI-PstI位點(diǎn)以建立pAH48。質(zhì)粒pAH48含有對(duì)于從Trc99A(Pharmacia,Piscataway,N.J.)的trc啟動(dòng)子表達(dá)為正確方向的DAR1基因、改造的RBS和GPP2基因。大腸桿菌菌株的構(gòu)建大腸桿菌W1485是野生型K-12菌株(ATCC 12345)。用質(zhì)粒pDT20和pAH42轉(zhuǎn)化此菌株并在補(bǔ)加了50mg/mL羧芐青霉素和10mg/mL氯霉素的LA(Luria Agar,Difco)平板上對(duì)其進(jìn)行選擇。從葡萄糖產(chǎn)生1,3-丙二醇將大腸桿菌W1485/pDT20/pAH42從平板轉(zhuǎn)移到50mL培養(yǎng)基中,每升培養(yǎng)基含有22.5g葡萄糖,6.85g K2HPO4,6.3g(NH4)2SO4,0.5g NaHCO3,2.5g NaCl,8g酵母抽提物,8g胰蛋白胨,2.5mg維生素B12,2.5mL改進(jìn)的Balch微量元素溶液,50mg羧芐青霉素和10mg氯霉素,終pH 6.8(HCl),然后過(guò)濾除菌。在普通和分子細(xì)菌學(xué)方法(Methods for General and Molecular Bacteriology)(P.Gerhardt等人,編,158頁(yè),美國(guó)微生物學(xué)協(xié)會(huì),Washington,DC(1994))中能找到改進(jìn)的Balch微量元素溶液的組分。在37℃,300轉(zhuǎn)/分孵育6小時(shí)后,加入0.5g葡萄糖和IPTG(終濃度=0.2mM)并且轉(zhuǎn)速降到100轉(zhuǎn)/分。通過(guò)GC/MS分析樣品。24小時(shí)后,W1485/pDT20/pAH42產(chǎn)生1.1g/L的甘油和195mg/L的1,3-丙二醇。
實(shí)施例3dhaB和dhaT在釀酒酵母中的克隆和表達(dá)為4個(gè)dha基因的每一個(gè)都構(gòu)建了能作為復(fù)制游離基因元件存在的表達(dá)質(zhì)粒。對(duì)于所有的表達(dá)質(zhì)粒來(lái)說(shuō)存在酵母ADH1啟動(dòng)子,并通過(guò)含有一種或多種限制性內(nèi)切酶識(shí)別位點(diǎn)的DNA片段與酵母ADH1轉(zhuǎn)錄終止子分開(kāi)。每個(gè)表達(dá)質(zhì)粒也含有用于在含有氨芐青霉素的培養(yǎng)基上篩選大腸桿菌的β-半乳糖苷酶基因、用于在大腸桿菌中維持質(zhì)粒的復(fù)制起點(diǎn)以及用于在釀酒酵母中維持的2微米(micron)的復(fù)制起點(diǎn)。酵母使用的并且存在于表達(dá)質(zhì)粒上的選擇性營(yíng)養(yǎng)標(biāo)記為下列之一編碼咪唑甘油磷酸脫水酶的HIS3基因、編碼乳清酸核苷5’-磷酸脫羧酶的URA3基因、編碼N-(5’-磷酸核苷)-鄰氨基苯甲酸異構(gòu)酶的TRP1基因和編碼β-異丙基蘋果酸脫氫酶的LEU2。
使用在5’末端引入了EcoRI位點(diǎn)的引物(對(duì)于dhaT、dhaB3、dhaB2、dhaB1分別為SEQ ID NO38與SEQ ID NO39、SEQ ID NO40與SEQ ID NO41、SEQ ID NO42與SEQ ID NO43、SEQ ID NO44與SEQ ID NO45)通過(guò)PCR從pHK28-26(SEQ ID NO19)擴(kuò)增dhaT、dhaB3、dhaB2和dhaB1的開(kāi)放閱讀框架(10mM Tris pH8.3,50mMKCl,1.5mM MgCl2,0.0001%明膠,200mM dATP,200mM dCTP,200mM dGTP,200mM dTTP,1mM每種引物,1-10ng靶DNA,25單位/mLAmplitaq*DNA聚合酶(Perkin-Elmer Cetus,Norwalk CT))。PCR參數(shù)是94℃1分鐘,55℃1分鐘,72℃1分鐘,35個(gè)循環(huán)。將產(chǎn)物亞克隆進(jìn)pHIL-D4(Phillips Petroleum,Bartlllesville,OK)的EcoRI位點(diǎn)以產(chǎn)生分別含有dhaT、dhaB3、dhaB2和dhaB1的質(zhì)粒pMP13、pMP14、pMP20和pMP15。dhaB1表達(dá)質(zhì)粒pMCK10的構(gòu)建用HindIII酶解7.8kb的復(fù)制型質(zhì)粒pGADGH(Clontech,Palo Alto,CA),經(jīng)去磷酸化并與獲自pMP15的dhaB1之HindIII片段連接。得到的質(zhì)粒(pMCK10)含有對(duì)于從ADH1啟動(dòng)子開(kāi)始的轉(zhuǎn)錄為正確方向的dhaB1并含有LEU2標(biāo)記。dhaB2表達(dá)質(zhì)粒pMPCK17的構(gòu)建用HindIII酶解質(zhì)粒pGADGH(Clontech,Palo Alto,CA)并通過(guò)與HindIII-XmnI和EcoRI-XmnI接頭(New England Biolabs,Beverly,MA)連接將單鏈末端變?yōu)镋coRI末端。帶有正確EcoRI末端的質(zhì)粒的選擇可通過(guò)如下方法實(shí)現(xiàn)與獲自質(zhì)粒pUC4K(Pharmacia Biotech,Uppsala)的EcoRI片段上的卡那霉素抗性基因連接,轉(zhuǎn)化進(jìn)大腸桿菌菌株DH5α并用含有25mg/mL卡那霉素的LB平板選擇。用SnaBI和EcoRI酶解得到的質(zhì)粒(pGAD/KAN2)并且分離含ADH1啟動(dòng)子的1.8kb片段。用SnaBI和EcoRI酶解質(zhì)粒pGBT9(Clontech,Palo Alto,CA),并且通過(guò)用SnaBI和EcoRI酶解使1.5kb的ADH1/GAL4片段被從pGAD/KAN2分離到的1.8kb的ADH1啟動(dòng)子片段取代。得到的載體(pMCK11)是含ADH1啟動(dòng)子和終止子以及TRP1標(biāo)記的酵母中的復(fù)制型質(zhì)粒。用EcoRI酶解質(zhì)粒pMCK11,將其去磷酸化并與獲自pMP20的dhaB2之EcoRI片段連接。得到的質(zhì)粒(pMCK17)有對(duì)于從ADH1啟動(dòng)子開(kāi)始的轉(zhuǎn)錄為正確方向的dhaB2并含有TRP1標(biāo)記。dhaB3表達(dá)質(zhì)粒pMCK30的構(gòu)建用NaeI和PvuII酶解質(zhì)粒pGBT9(Clontech)并且將1kb的TRP1基因從該載體中除去。TRP1基因被獲自質(zhì)粒pRS406(Stratagene)的稱為1.7kb之AatII/NaeI片段的URA3基因取代以產(chǎn)生中間載體pMCK32。在1.5kb的SnaBI/EcoRI片段上將pMCK32上存在的截短的ADH1啟動(dòng)子去除,并用獲自質(zhì)粒pGAD/KAN2的1.8kb之SnaBI/EcoRI片段上的全長(zhǎng)ADH1啟動(dòng)子將其取代以產(chǎn)生載體pMCK26。使用pMCK26上單一EcoRI位點(diǎn)插入帶有質(zhì)粒pMP14的dhaB3的EcoRI片段而產(chǎn)生pMCK30。pMCK30復(fù)制型表達(dá)質(zhì)粒有對(duì)于從ADH1啟動(dòng)子開(kāi)始的表達(dá)為正確方向的dhaB3并且有URA3標(biāo)記。dhaT表達(dá)質(zhì)粒pMCK35的構(gòu)建用NaeI和PvuII酶解質(zhì)粒pGBT9(Clontech)并且將1kb的TRP1基因從該載體中除去。TRP1基因被獲自質(zhì)粒pRS403(Stratagene)的稱為XmnI/NaeI片段的HIS3基因取代以產(chǎn)生中間載體pMCK33。在1.5kb的SnaBI/EcoRI片段上將存在于pMCK33上的截短的ADH1啟動(dòng)子去除并用獲自質(zhì)粒pGAD/KAN2的1.8kb之SnaBI/EcoR1片段上的全長(zhǎng)ADH1啟動(dòng)子將其取代以產(chǎn)生載體pMCK31。使用pMCK31上的單一EcoRI位點(diǎn)插入帶有質(zhì)粒pMP13的dhaT的EcoRI片段而產(chǎn)生pMCK35。PMCK35復(fù)制型表達(dá)質(zhì)粒有對(duì)于從ADH1啟動(dòng)子開(kāi)始的表達(dá)為正確方向的dhaT且有HIS3標(biāo)記。用dha表達(dá)質(zhì)粒轉(zhuǎn)化釀酒酵母使用Frozen-EZ酵母轉(zhuǎn)化試劑盒(Catalog#T2001)(ZymoResearch,Orange,CA)用1-2mg質(zhì)粒DNA轉(zhuǎn)化購(gòu)自Stratagene(La Jolla,CA)的釀酒酵母株YPH500(ura3-52 lys2-801 ade2-101 trp1-D63 his3-D200 leu2-D1)(Sikorski R.S.和Hieter P.,遺傳學(xué)(Genetics)122,19-27,(1989))。用補(bǔ)加了一種或多種如下附加物的補(bǔ)充基礎(chǔ)培養(yǎng)基(SMM-0.67%的無(wú)氨基酸酵母氮基質(zhì),2%葡萄糖)于29℃培養(yǎng)菌落3-4天硫酸腺嘌呤(20mg/L)、尿嘧啶(20mg/L)、L-色氨酸(20mg/L)、L-組氨酸(20mg/L)、L-亮氨酸(30mg/L)、L-賴氨酸(30mg/L)。將菌落在選擇性平板上劃線并將其接種于液體培養(yǎng)基。dha基因的釀酒酵母轉(zhuǎn)化體的篩選使用對(duì)每個(gè)基因特異的引物(SEQ ID NO38-45)用PCR方法分析獲自URA+、HIS+、TRP+、LEU+轉(zhuǎn)化體的染色體DNA。證實(shí)了所有4個(gè)開(kāi)放閱讀框架的存在。dhaB和dhaT活性在經(jīng)轉(zhuǎn)化的釀酒酵母中的表達(dá)用體外酶分析證明了有活性的甘油脫水酶(dhaB)和1,3-丙二醇氧化還原酶(dhaT)的存在。另外,western印跡分析實(shí)驗(yàn)證實(shí)了從所有4個(gè)開(kāi)放閱讀框架表達(dá)的蛋白質(zhì)。
將用質(zhì)粒pMCK10、pMCK17、pMCK30和pMCK35轉(zhuǎn)化的酵母株YPH500接種于含有0.67%的無(wú)氨基酸酵母氮基質(zhì)、2%葡萄糖、20mg/L硫酸腺嘌呤和30mg/L L-賴氨酸的補(bǔ)充基礎(chǔ)培養(yǎng)基。將細(xì)胞勻漿并分析抽提物的dhaB活性。對(duì)于甘油脫水酶得到0.12單位/mg蛋白質(zhì)的比活性,以及對(duì)于1,3-丙二醇氧化還原酶得到0.024單位/mg蛋白質(zhì)的比活性。
實(shí)施例4使用重組體釀酒酵母從D-葡萄糖產(chǎn)生1,3-丙二醇將含有質(zhì)粒pMCK10、pMCK17、pMCK30和pMCK35的釀酒酵母YPH500在BiostatB發(fā)酵罐(B Braun Biotech,Inc.)中培養(yǎng),最初的1.0L基礎(chǔ)培養(yǎng)基含有20g/L葡萄糖、6.7g/L無(wú)氨基酸的酵母氮基質(zhì)、40mg/L硫酸腺嘌呤和60mg/L L-賴氨酸·HCl。在生長(zhǎng)過(guò)程中,加入另外的酵母氮基質(zhì)等同物、腺嘌呤和賴氨酸。用另外加入的10%磷酸和2M NaOH將發(fā)酵罐控制在pH 5.5,30℃以及通過(guò)攪拌控制保持40%的溶解氧壓力。38小時(shí)后,離心收集細(xì)胞(OD600=5.8AU)并將其重新懸浮在基礎(chǔ)培養(yǎng)基(6.7g/L的無(wú)氨基酸酵母氮基質(zhì),20mg/L硫酸腺嘌呤,30mg/L L-賴氨酸·HCl,以及50mM磷酸鉀緩沖液,pH7.0)。
在無(wú)光和無(wú)氧氣(氮?dú)鈬婌F)存在下,在10mL卷縮的血清瓶中制備存在于總體積為4mL的補(bǔ)加了0.5%葡萄糖,5ug/mL輔酶B12和0、10、20或40mM氯喹的基礎(chǔ)培養(yǎng)基中的含細(xì)胞(OD600=20AU)反應(yīng)混合物,于30℃振搖孵育。30小時(shí)后,取出等量樣品并進(jìn)行HPLC分析。結(jié)果見(jiàn)表3。
表3利用重組釀酒酵母生產(chǎn)1,3-丙二醇反應(yīng)氯奎(mM)1,3-丙二醇(mM)1 0 0.22 10 0.23 20 0.34 40 0.7實(shí)施例5使用dhaB和dhaT整合進(jìn)基因組的釀酒酵母雙重轉(zhuǎn)化體從D-葡萄糖生產(chǎn)1,3-丙二醇實(shí)施例5預(yù)言性地證明了用dhaB1、dhaB2、dhaB3和dhaT轉(zhuǎn)化釀酒酵母以及將這些基因穩(wěn)定地整合進(jìn)酵母基因組以從葡萄糖產(chǎn)生1,3-丙二醇。表達(dá)盒的構(gòu)建為在釀酒酵母中進(jìn)行這些基因的葡萄糖誘導(dǎo)的高水平組成性表達(dá),構(gòu)建了4個(gè)表達(dá)盒(dhaB1、dhaB2、dhaB3和dhaT)。這些表達(dá)盒由以下組成(i)獲自釀酒酵母株S288C的磷酸甘油酯激酶(PGK)啟動(dòng)子;(ii)基因dhaB1、dhaB2、dhaB3或dhaT其中之一;以及(iii)獲自釀酒酵母株S288C的PGK終止子。使用通過(guò)重疊延伸(overlapextension)(Horton等,生物技術(shù)(Bio Techniques),8528-535,(1990))的基于PCR技術(shù)的基因剪切來(lái)重組DNA序列以產(chǎn)生用于最佳表達(dá)各個(gè)基因的這些無(wú)縫連接表達(dá)盒。這些表達(dá)盒被單獨(dú)克隆進(jìn)含有適合酵母表達(dá)質(zhì)粒多盒克隆的限制性位點(diǎn)之合適載體(pLITMUS39)。酵母整合載體的構(gòu)建構(gòu)建用于將表達(dá)盒整合進(jìn)酵母基因組的載體。這些載體含有以下元件(i)被亞克隆進(jìn)表達(dá)盒的多克隆區(qū);(ii)用于選擇穩(wěn)定酵母轉(zhuǎn)化體的單一標(biāo)記;(iii)允許轉(zhuǎn)化酵母前在大腸桿菌中進(jìn)行基因操作的復(fù)制起點(diǎn)和選擇性標(biāo)記。一個(gè)整合載體含有URA3營(yíng)養(yǎng)缺陷型標(biāo)記(YIp352b),而另一個(gè)整合載體含有LYS2營(yíng)養(yǎng)缺陷型標(biāo)記(pKP7)。酵母表達(dá)質(zhì)粒的構(gòu)建將dhaB1和dhaB2的表達(dá)盒亞克隆進(jìn)YIp352b(表達(dá)質(zhì)粒#1)的多克隆區(qū),并將dhaB3和dhaT的表達(dá)盒亞克隆進(jìn)pKP7(表達(dá)質(zhì)粒#2)的多克隆區(qū)。用表達(dá)質(zhì)粒轉(zhuǎn)化酵母使用Frozen-EZ酵母轉(zhuǎn)化試劑盒(Zymo Research,Orange,CA)用表達(dá)質(zhì)粒#1轉(zhuǎn)化釀酒酵母(ura3,lys2),并在缺乏尿嘧啶的平板上選擇轉(zhuǎn)化體。染色體DNA的PCR分析證實(shí)了dhaB1和dhaB2表達(dá)盒的整合。使用Frozen-EZ酵母轉(zhuǎn)化試劑盒用表達(dá)質(zhì)粒#2再次轉(zhuǎn)化選擇出來(lái)的轉(zhuǎn)化體,并在缺乏賴氨酸的平板上選擇雙重轉(zhuǎn)化體。染色體DNA的PCR分析證實(shí)了dhaB3和dhaT表達(dá)盒的整合。染色體DNA的PCR分析證實(shí)了雙重轉(zhuǎn)化體中所有4個(gè)表達(dá)盒(dhaB1、dhaB2、dhaB3和dhaT)的存在。產(chǎn)生于雙重轉(zhuǎn)化酵母的蛋白質(zhì)Western印跡分析證實(shí)了由獲自雙重轉(zhuǎn)化酵母的dhaB1、dhaB2、dhaB3和dhaT編碼的蛋白質(zhì)的產(chǎn)生。獲自雙重轉(zhuǎn)化酵母的酶活性用上面一般方法中所述的酶分析證實(shí)了獲自雙重轉(zhuǎn)化酵母的有活性的甘油脫水酶和有活性的1,3-丙二醇脫氫酶。用雙重轉(zhuǎn)化酵母生產(chǎn)1,3-丙二醇如實(shí)施例4中所述基本上證明了雙重轉(zhuǎn)化酵母從葡萄糖生產(chǎn)1,3-丙二醇。
實(shí)施例6構(gòu)建含有DA1/GPP2或dhaT/dhaB1-3質(zhì)粒并將其轉(zhuǎn)化進(jìn)克雷伯氏菌屬肺炎克雷伯氏菌(ATCC25955)、肺炎克雷伯氏菌(ECL2106)和產(chǎn)酸克雷伯氏菌(K.oxytoca)(ATCC 8724)天然地對(duì)氨芐青霉素(最高150ug/mL)和卡那霉素(最高50ug/mL)有抗性,但對(duì)四環(huán)素(10ug/mL)和氯霉素(25ug/mL)敏感。因此,編碼對(duì)后兩個(gè)抗生素有抗性的復(fù)制質(zhì)??赡苡糜谧鳛檫@些克雷伯氏菌菌株的克隆載體。成功地通過(guò)用中等拷貝數(shù)的質(zhì)粒pBR322(New England biolabs,Beverly,MA)用電穿孔法將野生型肺炎克雷伯氏菌(ATCC25955)、葡萄糖去阻遏的肺炎克雷伯氏菌(ECL2106)和產(chǎn)酸克雷伯氏菌(ATCC 8724)轉(zhuǎn)化為四環(huán)素抗性。該過(guò)程通過(guò)如下步驟完成將10mL的過(guò)夜培養(yǎng)物接種于1L LB(1%(w/v)Bacto-胰胨(Difco,Detriot,MI),0.5%(w/v)Bacto-酵母抽提物(Difco)和0.5%(w/v)NaCl(Sigma,St.Louis,MO))中,培養(yǎng)物在37℃下孵育至OD600為0.5-0.7。細(xì)胞在冰上冷卻,4000×g離心15分鐘收集,并將其重新懸浮于1L無(wú)菌的10%冰冷甘油中。重復(fù)離心收集細(xì)胞并逐次懸浮于500mL、20mL和最后2mL無(wú)菌的10%冰冷甘油中。對(duì)于電穿孔法,將40uL細(xì)胞與1-2uL DNA在預(yù)冷的0.2cm小管中混合,使用BioRad基因脈沖儀(BioRad,Richmond,CA)以200Ω,2.5kV對(duì)其進(jìn)行脈沖4-5毫秒。將1mL SOC培養(yǎng)基(2%(w/v)Bacto-胰胨(Difco),0.5%(w/v)Bacto-酵母抽提物(Difco),10mM NaCl,10mM MgCl2,10mM MgSO4,2.5mM KCl和20mM葡萄糖)加入到細(xì)胞中,并且在將懸浮液轉(zhuǎn)移到17×100mm無(wú)菌聚丙烯試管之后,在37℃,225轉(zhuǎn)/分下孵育培養(yǎng)物1小時(shí)。如所示,在選擇性培養(yǎng)基上涂布等量樣品。對(duì)獲自非依賴性四環(huán)素抗性轉(zhuǎn)化體的質(zhì)粒DNA的分析顯示出pBR322典型的限制性內(nèi)切酶酶解模式,提示在含有四環(huán)素(10ug/mL)的LB中37℃過(guò)夜培養(yǎng)后載體可穩(wěn)定維持。因而,該載體和衍生物例如編碼氨芐青霉素、四環(huán)素和氯霉素抗性的pBR329(ATCC 37264)可被用來(lái)將DAR1/GPP2和dhaT/dhaB1-3表達(dá)盒導(dǎo)入肺炎克雷伯氏菌和產(chǎn)酸克雷伯氏菌中。
基于DAR1和GPP2基因的已知DNA序列,可通過(guò)PCR介導(dǎo)的擴(kuò)增從釀酒酵母基因組得到它們。然后在一個(gè)或多個(gè)可被用于指導(dǎo)它們?cè)诤咸烟堑呐囵B(yǎng)基中表達(dá)的啟動(dòng)子控制下將其轉(zhuǎn)化進(jìn)肺炎克雷伯氏菌和產(chǎn)酸克雷伯氏菌。為了方便,從通過(guò)用PvuII限制性內(nèi)切酶酶解質(zhì)粒pAH44得到的2.4kb的DNA片段中得到這些基因,籍此這些基因已排列在表達(dá)盒中并且受大腸桿菌lac啟動(dòng)子的控制。將該DNA片段連接到經(jīng)PvuII酶解的pBR329上,導(dǎo)致其氯霉素抗性基因的插入失活。使用連接的DNA轉(zhuǎn)化大腸桿菌DH5α(Gibco,Gaithersberg,MD)。根據(jù)它們的四環(huán)素(10ug/mL)抗性選擇轉(zhuǎn)化體并篩選它們對(duì)氯霉素(25ug/mL)的敏感性。對(duì)獲自四環(huán)素抗性、氯霉素敏感轉(zhuǎn)化體的質(zhì)粒DNA的分析證實(shí)了期望的質(zhì)粒的存在,質(zhì)粒中Plac-dar1-gpp2表達(dá)盒以任一方向被亞克隆進(jìn)pBR329的PvuII位點(diǎn)。如所述通過(guò)電穿孔法分別將這些稱為pJSP1A(順時(shí)針?lè)较?和pJSP1B(逆時(shí)針?lè)较?的質(zhì)粒轉(zhuǎn)化進(jìn)肺炎克雷伯氏菌(ATCC 25955)、肺炎克雷伯氏菌(ECL2106)和產(chǎn)酸克雷伯氏菌(ATCC 8724)。根據(jù)重組體的四環(huán)素(10ug/mL)抗性對(duì)其進(jìn)行選擇并篩選其對(duì)氯霉素(25ug/mL)的敏感性。對(duì)分離自非依賴性轉(zhuǎn)化體的質(zhì)粒的限制性分析顯示了僅有期望的酶解模式,并證實(shí)了37℃下進(jìn)行抗生素選擇性時(shí)它們可以被穩(wěn)定地保持。在生長(zhǎng)培養(yǎng)基中加入IPTG(0.2-2.0mM)可增強(qiáng)DAR1和GPP2基因的表達(dá)。
基于4個(gè)肺炎克雷伯氏菌的dhaB(1-3)和dhaT基因的已知DNA序列,可通過(guò)PCR介導(dǎo)的擴(kuò)增從肺炎克雷伯氏菌基因組得到這些基因。然后在一個(gè)或多個(gè)可用于指導(dǎo)這些基因在含葡萄糖培養(yǎng)基中表達(dá)的啟動(dòng)子控制下將它們轉(zhuǎn)化進(jìn)肺炎克雷伯氏菌。為了方便,從通過(guò)用KpnI/SacI限制性內(nèi)切酶酶解質(zhì)粒pAH24得到的大約4.0kb的DNA片段中獲得這些基因,籍此這些基因已排列在表達(dá)盒中并且受大腸桿菌lac啟動(dòng)子的控制。將該DNA片段與經(jīng)類似酶解的pBC-KS+(Strategene,LaJolla,CA)連接并將其用于轉(zhuǎn)化大腸桿菌DHSα。根據(jù)轉(zhuǎn)化體的氯霉素(25ug/mL)抗性對(duì)其進(jìn)行選擇,并在含X-gal的LB瓊脂上篩選其白色菌落表型。獲自表明為白色菌落的抗氯霉素轉(zhuǎn)化體質(zhì)粒DNA的限制性分析證實(shí)了期望的被稱為pJSP2質(zhì)粒的存在,其中dhaT-dhaB(1-3)基因被亞克隆進(jìn)該質(zhì)粒,在大腸桿菌lac啟動(dòng)子的控制下。
為了促進(jìn)葡萄糖轉(zhuǎn)化為1,3-丙二醇,通過(guò)電穿孔法分別將該質(zhì)粒轉(zhuǎn)化入已含有Plac-dar1-gpp2表達(dá)盒的肺炎克雷伯氏菌(ATCC25955)(pJSP1A)、肺炎克雷伯氏菌(ECL2106)(pJSP1A)和產(chǎn)酸克雷伯氏菌(ATCC 8724)(pJSP1A)。根據(jù)共轉(zhuǎn)化體對(duì)四環(huán)素(10ug/mL)和氯霉素(25ug/mL)的抗性對(duì)其進(jìn)行選擇。對(duì)分離自非依賴性共轉(zhuǎn)化體的質(zhì)粒的限制性分析顯示了期望的pJSP1A和pJSP2的酶解模式。培養(yǎng)基中加入IPTG(0.2-2.0mM)可增強(qiáng)DAR1、GPP2、dhaB(1-3)和dhaT基因的表達(dá)。
實(shí)施例7肺炎克雷伯氏菌從葡萄糖產(chǎn)生1,3-丙二醇為了用葡萄糖生產(chǎn)1,3-丙二醇,在不同條件下(見(jiàn)表4)將均用pJSP1A轉(zhuǎn)化的肺炎克雷伯氏菌菌株ECL 2106和2106-47以及用pJSP1A和pJSP2轉(zhuǎn)化的ATCC 25955培養(yǎng)于5L Appiikon發(fā)酵罐中。如Bauer等,應(yīng)用環(huán)境微生物學(xué)(Appl.Environ.Micraobiol.)56,1296(1990)中所述,菌株2104-47是得自氟乙酸鹽/乳酸鹽選擇性平板的ECL 2106的耐氟乙酸鹽衍生物。在每一種情況下,使用的培養(yǎng)基含有50-100mM磷酸鉀緩沖液,pH7.5,40mM(NH4)2SO4,0.1%(w/v)酵母抽提物,10μM CoCl2,6.5μM CuCl2,100μM FeCl3,18μMFeSO4,5μM H3BO3,50μM MnCl2,0.1μM Na2MoO4,25μMZnCl2,0.82mM MgSO4,0.9mM CaCl2和10-20g/L葡萄糖。另外加入葡萄糖,使剩余的葡萄糖保持過(guò)量。溫度控制在37℃,并且用5N KOH或NaOH將pH控制在7.5。為了維持質(zhì)粒加入合適的抗生素;也加入指定濃度的IPTG(異丙基-b-D-巰基半乳糖吡喃糖苷)。對(duì)于無(wú)氧發(fā)酵,反應(yīng)器中噴入0.1vvm氮?dú)?;?dāng)dO設(shè)置點(diǎn)為5%時(shí),反應(yīng)器中噴入1vvm空氣并且在培養(yǎng)基中補(bǔ)加維生素B12。最終濃度和總產(chǎn)量(g/g)見(jiàn)表4。
表4肺炎克雷伯氏菌從葡萄糖生產(chǎn)1,3-丙二醇
實(shí)施例8含有dar1、gpp2、dhaB和dhaT的重組肺炎克雷伯氏菌將碳底物轉(zhuǎn)化為1,3-丙二醇A.不同的肺炎克雷伯氏菌重組菌株將D-果糖轉(zhuǎn)化為1,3-丙二醇將肺炎克雷伯氏菌(ATCC 25955 pJSP1A)、肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)、肺炎克雷伯氏菌(ATCC 2106pJSP1A)和肺炎克雷伯氏菌(ATCC 2106 pJSP1A/pJSP2)的單菌落從瓊脂平板轉(zhuǎn)移進(jìn)分隔的培養(yǎng)試管中,在含有合適抗生素的Luria-Bertani(LB)培養(yǎng)基中傳代培養(yǎng)過(guò)夜。50mL培養(yǎng)瓶中含有45mL過(guò)濾除菌的基礎(chǔ)培養(yǎng)基,其稱為L(zhǎng)LMM/F,其中每升含有10g果糖;1g酵母抽提物;50mmol磷酸鉀,pH7.5;40mmol(NH4)2SO4;0.09mmol氯化鈣;2.38mg CoCl2·6H2O;0.88mg CuCl2·2H2O27mg FeCL3·2H2O;5mg FeSO4·7H2O;0.3lmg H3BO3;10mg MnCl2·4H2O;0.023mg Na2MoO4·2H2O;3.4mg ZnCl2;0.2g MgSO4·7H2O。對(duì)于利用任一單個(gè)質(zhì)粒重組體的反應(yīng)在培養(yǎng)基中加入10ug/mL的四環(huán)素;對(duì)于利用雙重質(zhì)粒重組體的反應(yīng)加入10ug/mL四環(huán)素和25ug/mL氯霉素。在接種2mL傳代培養(yǎng)物前培養(yǎng)基被充分噴入氮?dú)?。在某些培養(yǎng)瓶中加入終濃度為0.5mM的IPTG(I)。培養(yǎng)瓶加蓋,然后在37℃,100轉(zhuǎn)/分下在NeW Brunswick Series 25孵育箱/搖床中孵育。反應(yīng)進(jìn)行至少24小時(shí)或直到大部分碳底物轉(zhuǎn)化為產(chǎn)物。HPLC分析樣品。表5描述了不同的克雷伯氏菌重組體從果糖產(chǎn)生1,3-丙二醇(3G)的產(chǎn)量。表5利用重組克雷伯氏菌從D-果糖生產(chǎn)1,3-丙二醇[3G]克雷伯氏菌菌株 培養(yǎng)基 轉(zhuǎn)化(g/L)產(chǎn)碳率%2106pBR329LLMM/F 1000 02106pJSP1ALLMM/F500.66 15.52106pJSP1ALLMM/F+11000.111.42106 LLMM/F580.265pJSP1A/pJSP225955pBR329 LLMM/F 1000 025955pJSP1A LLMM/F 1000.3 425955pJSP1A LLMM/F+11000.15225955 LLMM/F 1000.911pJSP1A/pJSP225955 LLMM/F+1 621.020pJSP1AJpJSP2B.肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)將不同的碳底物轉(zhuǎn)化成1,3-丙二醇取肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)冰凍儲(chǔ)存培養(yǎng)物的等量樣品(0.1mL)轉(zhuǎn)移到250mL帶擋板培養(yǎng)瓶中的50mL種子培養(yǎng)基中。每升種子培養(yǎng)基含有0.1mol NaK/PO4緩沖液,pH7.0;3g(NH4)2SO4;5g葡萄糖,0.15g MgSO4·7H2O,10mL 100X微量元素溶液,25mg氯霉素,10mg四環(huán)素和1g酵母抽提物。每升100X微量元素溶液含有10g檸檬酸,1.5g CaCl2·2H2O,2.8g FeSO4·7H2O,0.39gZnSO4·7H2O,0.38g CuSO4·5H2O,0.2g CoCl2.6H2O和0.3g MnCl2·4H2O。用KOH或H2SO4將得到的溶液滴定到pH7.0。葡萄糖、微量元素、抗生素和酵母抽提物分開(kāi)滅菌。種子接種物在35℃和250轉(zhuǎn)/分培養(yǎng)過(guò)夜。
反應(yīng)設(shè)計(jì)是半需氧的。系統(tǒng)由在留有鋁箔條部分開(kāi)口的125mL密封培養(yǎng)瓶中的130mL反應(yīng)培養(yǎng)基組成。每升反應(yīng)培養(yǎng)基含有3g(NH4)2SO4;20g碳底物;0.15mol NaK/PO4緩沖液,pH7.5;1g酵母抽提物;0.15g MgSO4·7H2O;0.5mmol IPTG;10mL 100X微量元素溶液;25mg氯霉素;以及10mg四環(huán)素。用KOH或H2SO4將得到的溶液滴定到pH7.5。碳源是D-葡萄糖(Glc);D-果糖(Frc);D-乳糖(Lac);D-蔗糖(Suc);D-麥芽糖(Mal);以及D-甘露糖(Man)。培養(yǎng)基中加入一些玻璃珠以促進(jìn)混合。加入種子接種物起始反應(yīng),使細(xì)胞懸浮液I600nm測(cè)定的光密度開(kāi)始為0.1AU。35℃250轉(zhuǎn)/分孵育培養(yǎng)瓶。24小時(shí)后用HPLC測(cè)定3G的產(chǎn)生。表6描述了從不同碳底物產(chǎn)生1,3-丙二醇的產(chǎn)量。
表6利用重組克雷伯氏菌25955pJSP1A/pJSP2從多種碳底物生產(chǎn)1,3-丙二醇1,3-丙二醇(g/L)碳底物實(shí)驗(yàn)1實(shí)驗(yàn)2實(shí)驗(yàn)3Glc 0.8911.6Frc 0.190.23 0.24Lac 0.150.58 0.56Suc 0.880.62Mal 0.050.03 0.02Man 0.030.05 0.04
實(shí)施例9使用dhaBX基因改善1,3-丙二醇產(chǎn)生實(shí)施例9證明了當(dāng)引入編碼蛋白質(zhì)X的基因時(shí)促進(jìn)了1,3-丙二醇的產(chǎn)生。表達(dá)載體pTaclQ的構(gòu)建將含有l(wèi)aclq基因(Farabaugh,P.J.1978,自然274(5673)765-769)和tac啟動(dòng)子(Amann等,1983,基因25,167-178)的大腸桿菌表達(dá)載體pTaclQ插入pBR322的限制性內(nèi)切酶位點(diǎn)EcoRI(Sutcliffe,1979,Cold Spring Harb.Symp.Quant.Biol.43,77-90)。多克隆位點(diǎn)和終止子序列(SEQ ID NO50)取代了pBR322中從EcoRI到SphI的序列。亞克隆甘油脫水酶基因(dhaB1,2,3,X)用限制性內(nèi)切酶KpnI和EcoRI將含有獲自pHK28-26的dhaB操縱子之克雷伯氏菌dhaB1、dhaB2、dhaB3和dhaBX的全部編碼區(qū)的區(qū)域克隆進(jìn)pBluescriptIIKS+(Stratagene)以建立質(zhì)粒pM7。
用在5’末端引入了一個(gè)EcoRI位點(diǎn)以及在3’末端引入了一個(gè)XbaI位點(diǎn)的引物(SEQ ID NO51和SEG ID NO52)利用PCR從pHK28-26擴(kuò)增dhaB3的開(kāi)放閱讀框架。將產(chǎn)物亞克隆進(jìn)pLitmus29(NEB)以產(chǎn)生含有dhaB3的質(zhì)粒pDHAB3。
通過(guò)用ApaI和XbaI酶解質(zhì)粒pM7,純化5.9kb片段并將其與獲自質(zhì)粒pDHAB3的325bp之ApaI-XbaI片段連接以去除dhaBX基因,建立含有dhaB1、dhaB2和dhaB3的pM11。
用5’末端引入了一個(gè)HindIII位點(diǎn)和一個(gè)共有核糖體結(jié)合位點(diǎn)以及在3’末端引入了一個(gè)XbaI位點(diǎn)的引物(SEQ ID NO53與SEQ IDNO54)利用PCR從pHK28-26擴(kuò)增dhaB1的開(kāi)放閱讀框架。將產(chǎn)物亞克隆進(jìn)pLitmus28(NEB)以產(chǎn)生含有dhaB1的質(zhì)粒pDT1。
將獲自含有dhaB1基因、dhaB2基因和dhaB3基因一部分的pM11之NotI-XbaI片段插入pDT1以建立dhaB表達(dá)質(zhì)粒pDT2。將含有獲自pDT2的dhaB(1,2,3)基因的HindIII-XbaI片段插入pTaclQ以建立pDT3。亞克隆TMG脫氫酶基因(dhaT)將含有TMG脫氫酶(dhaT)基因之pHK28-26的KpnI-SacI片段亞克隆進(jìn)pBluescriptII KS+以建立質(zhì)粒pAH11。利用在5’末端引入了一個(gè)XbaI位點(diǎn)以及在3’末端引入了一個(gè)BamHI位點(diǎn)的合成引物(SEQID NO55與SEQ ID NO56)從作為模板DNA的pAH1通過(guò)PCR克隆dhaT基因。將產(chǎn)物亞克隆進(jìn)pCR-Script(Stratagene)的SrfI位點(diǎn)以產(chǎn)生含有dhaT的質(zhì)粒pAH4和pAH5。pAH4含有對(duì)于從pCR-Script中l(wèi)ac啟動(dòng)子開(kāi)始的表達(dá)為正確方向的dhaT基因,pAH5含有反向的dhaT基因。將獲自含dhaT基因的pAH4的XbaI-BamHI片段插入pTaclQ以產(chǎn)生質(zhì)粒pAH8。將獲自含RBS和dhaT基因的pAH8之HindII-BamHI片段插入pBluescriptII KS+以建立pAH11。dhaT和dhaB(1,2,3)表達(dá)盒的構(gòu)建使用標(biāo)準(zhǔn)分子生物學(xué)方法用前述單獨(dú)的dhaB(1,2,3)和dhaT亞克隆組裝dhaT和dhaB(1,2,3)的表達(dá)盒。將含有獲自pDT3的dhaB(1,2,3)基因的SpeI-SacI片段插入pAH11的SpeI-SacI位點(diǎn)以建立pAH24。將SalI-XbaI接頭(SEQ ID NO57和SEQ ID NO58)插入用限制性酶SalI-XbaI酶解的pAH5以建立pDT16。接頭破壞了XbaI位點(diǎn)。獲自pDT16的1kb之SalI-MluI片段被插入pAH24,取代已現(xiàn)有的SalI-MluI以建立pDT18。用于在大腸桿菌中過(guò)度表達(dá)dhaTdhaB(1,2,3,X)的質(zhì)粒純化含有獲自質(zhì)粒pM7的dhaB1基因、dhaB2、dhaB3和dhaBX一部分的4.4kb之NotI-XbaI片段,將其與獲自質(zhì)粒pDT18的4.1kb之NotI-XbaI片段連接(恢復(fù)dhaB1)以建立含有dhaB1、dhaB2、dhaB3和dhaBX的pM33。大腸桿菌菌株大腸桿菌DH5α得自BRL(Difco)。用質(zhì)粒pM7、pM11、pM33或pDT18轉(zhuǎn)化該菌株并在含有100ug/ml羧芐青霉素的LA平板上對(duì)其進(jìn)行選擇。1,3-丙二醇的產(chǎn)生在加了100ug/mL羧芐青霉素的LA平板上培養(yǎng)含有質(zhì)粒pM7、pM11、pM33或pDT18的大腸桿菌DH5α,37℃過(guò)夜。獲自每種質(zhì)粒的一個(gè)菌落被用于接種在加了0.005g/L維生素B12、0.2mM IPTG、200ug/mL羧芐青霉素和5ml改良的Balch微量元素溶液(在普通和分子細(xì)菌學(xué)方法(P.Gerhardt等編,158頁(yè),美國(guó)微生物協(xié)會(huì),Washington,DC,1994)中能找到其組成)的25ml培養(yǎng)基(0.2MKH2PO4,2.0g/L檸檬酸,2.0g/L MgSO4·7H2O,1.2ml/LH2SO4(98%),0.3g/L檸檬酸鐵銨,0.2g CaCl2·2H2O,5g/L酵母抽提物,10g/L葡萄糖,30g/L甘油)中,終pH 6.8(NH4OH),然后在250mL錐形瓶中過(guò)濾除菌。在37℃振搖(300轉(zhuǎn)/分)孵育搖瓶數(shù)天,在此期間用標(biāo)準(zhǔn)步驟取樣進(jìn)行HPLC分析。最終產(chǎn)量見(jiàn)表4。
總的說(shuō)來(lái),如表7所示,結(jié)果顯示在表達(dá)dhaB(1,2,3)或dhaT-dhaB(1,2,3)的質(zhì)粒中dhaBX的表達(dá)大大增加了1,3-丙二醇的產(chǎn)量。
表7 dhaBX表達(dá)對(duì)大腸桿菌產(chǎn)生1,3-丙二醇的影響菌株 時(shí)間(天數(shù))1,3-丙二醇(mg/L)*DH5a/pM7(dhaB1,2,3,X)1 15002 2700DH5a/pM11(dhaB1,2,3) 1 <200μg2 <200μgDH5a/pM33(dhaT-dhaB1,2,3,X) 2 1200DH5a/pDT18(dhaT-dhaB1,2,3) 2 88*表達(dá)為數(shù)次實(shí)驗(yàn)的平均值引物SEQ ID NO50-MCS-終止子5AGCTTAGGAGTCTAGAATATTGAGCTCGAATTCCCGGGCATGCGGTACCGGATCCAGAAAAAAGCCCGCACCTGACAGTGCGGGCTTTTTTTTT3′SEQ ID NO51-dhaB3-5′端EcoR1GGAATTCAGATCTCAGCAATGAGCGAGAAAACCATGCSEQ ID NO 52dhaB3-3′端xbalGCTCTAGATTAGCTTCCTTTACGCAGCSEQ ID NO 53dhaB15′端Hindlll-SD5′GGCCAAGCTTAAGGAGGTTAATTAAATGAAAAG3′SEQ ID NO 54dhaB13′端-xba5′GCTCTAGATTATTCAATGGTGTCGGG3′SEQ ID NO 55dhaT5′端-Xbal5′GCGCCGTCTAGAATTATGAGCTATCGTATGTTTTGATTATCTG3′SEQ ID NO 56dhaT3′端BamHl5′TCTGATACGGGATCCTCAGAATGCCTGGCGGAAAAT3′SEQ ID NO 57pUsH接頭 15′TCGACGAATTCAGGAGGA 3′SEQ ID NO 58pUSH接頭25′CTAGTCCTCCTGAATTCG3′
實(shí)施例10甘油脫水酶活性的再激活實(shí)施例10證明了在含有至少一個(gè)編碼蛋白質(zhì)X基因的微生物中甘油脫水酶活性的體內(nèi)再激活。
如實(shí)施例9所述,構(gòu)建了質(zhì)粒pM7和pM11并將其轉(zhuǎn)化進(jìn)大腸桿菌DH5α細(xì)胞。培養(yǎng)轉(zhuǎn)化的細(xì)胞并根據(jù)Honda等人(1980,甘油失活的輔酶B12依賴性酶、甘油脫水酶和二醇脫水酶的原位再激活,細(xì)菌學(xué)雜志1431458-1465)的方法分析1,3-丙二醇的產(chǎn)生。材料和方法細(xì)胞的甲苯化細(xì)胞生長(zhǎng)至對(duì)數(shù)中期,并在生長(zhǎng)較早時(shí),即0.2>OD600<0.8時(shí)于室溫離心收集細(xì)胞。室溫下用50mM KPO4pH8.0清洗收集的細(xì)胞。將細(xì)胞在50mM KPO4pH8.0中重新懸浮至OD600為20-30。絕對(duì)的OD值不是關(guān)鍵性的。將較少細(xì)胞群體重新懸浮在較少體積內(nèi)。如果在此時(shí)加入輔酶B12,則余下步驟在黑暗中進(jìn)行。將甲苯加入到1%終體積的細(xì)胞懸液中并在室溫下劇烈振搖懸液5分鐘。離心懸液使細(xì)胞成團(tuán)。室溫下用50mM KPO4pH8.0清洗細(xì)胞兩次(每次25mL)。加入甲苯前將細(xì)胞團(tuán)重新懸浮于所用過(guò)的相同體積中并將其轉(zhuǎn)移至干凈試管。測(cè)定并記錄甲苯化細(xì)胞的OD600,于4℃貯存。完整細(xì)胞甘油脫水酶分析為了檢測(cè)脫水酶活性的存在于37℃分析甲苯處理過(guò)的細(xì)胞。如下所示進(jìn)行三套反應(yīng)無(wú)ATP、在0時(shí)加入ATP以及在10分鐘加入ATP。無(wú)ATP100ul 2M甘油100ul 150uM輔酶B12700ul 緩沖液(0.03M KPO4/0.5M KCl,pH8.0)T=0分鐘ATP 100ul2M甘油100ul150uM輔酶B12600ul緩沖液(0.03M KPO4/0.5M KCl,pH8.0)100ul30mM ATP/30mM MnCl2T=10分鐘ATP 100ul2M甘油100ul150uM輔酶B12700ul緩沖液(0.03M KPO4/0.5M KCl,pH8.0)加100ul緩沖液而不是輔酶B12以制備每一個(gè)上述條件的對(duì)照?;旌显嚬?。這些試管的每一個(gè)中都加入50ul MBTH(3-甲基-2-苯基-噻唑啉酮腙)(在375mM甘氨酸/HCl pH2.7中為6mg/ml),并在冰水中繼續(xù)孵育。反應(yīng)管于37℃水浴中放置幾分鐘以平衡到37℃。將盛有足夠所有分析管使用的甲苯化細(xì)胞的試管放置于37℃水浴中幾分鐘以平衡到37℃。將含有2.5倍稀釋(在分析緩沖液中)的30mM ATP/30mMMncl2(每個(gè)12mM)的試管放置于37℃水浴中幾分鐘以平衡到37℃。在所有的試管中加入100ul細(xì)胞懸浮液,并于0、1、2、3、4、5、10、15、20和30分鐘時(shí)取樣。在每個(gè)時(shí)間點(diǎn),取100ul反應(yīng)物并立即加入到50ul冰冷的MBTH中,振蕩,并將其置于冰水浴中。在T=10分鐘時(shí),取一份樣品并加入到MBTH中,然后盡可能快地加入100ul 2.5倍稀釋的ATP/Mn。收集到所有的樣品后,將樣品試管架置于沸水浴中煮沸3分鐘。在冰水浴中冷卻試管30秒。將500ul新鮮制備的3.3mg/mlFeCl3·6H2O加入到試管中并且振蕩試管。室溫下孵育試管30分鐘,用水稀釋10倍,然后離心收集細(xì)胞和顆粒。在670nm測(cè)定吸收值并稀釋細(xì)胞使OD低于1.0?;钚杂?jì)算舉例稀釋因子乘以所測(cè)OD670以測(cè)定吸收值。對(duì)于反應(yīng)組扣除空白吸收值并扣除TO的A670nm。絕對(duì)A670nm除以53.4(3羥基-丙醛的mM消光系數(shù)),mM濃度乘以時(shí)程中任何反應(yīng)的稀釋度。因?yàn)槭褂昧?ml反應(yīng)物,3羥基-丙醛的濃度(umol/ml)除以分析中使用的mg干重(通過(guò)OD600計(jì)算并且1 OD600=0.436mg干重),得到每毫克細(xì)胞干重中的醛微摩爾系數(shù)。結(jié)果如圖6所示,分析完整大腸桿菌細(xì)胞在未加入和加入ATP和Mn++時(shí)甘油脫水酶的再激活。結(jié)果顯示含有帶dhaB1,2和3以及蛋白質(zhì)X質(zhì)粒的細(xì)胞有再激活催化性失活的甘油脫水酶之能力。含有蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的細(xì)胞再激活催化性失活的甘油脫水酶之能力增加。
如圖7所示,分析完整大腸桿菌細(xì)胞在未加入和加入ATP和Mn++時(shí)甘油失活的甘油脫水酶的再激活。結(jié)果顯示含有dhaB亞基1、2和3以及X的細(xì)胞有再激活催化性失活的甘油脫水酶之能力。缺乏蛋白質(zhì)X基因的細(xì)胞無(wú)再激活催化性失活的甘油脫水酶之能力。
圖9和10闡明了含有質(zhì)粒pHK28-26(圖1)的宿主細(xì)胞在適合產(chǎn)生1,3-丙二醇的條件下培養(yǎng)時(shí),比被pDT24轉(zhuǎn)化并在適合產(chǎn)生1,3-丙二醇的條件下培養(yǎng)的宿主細(xì)胞能產(chǎn)生更多的1,3-丙二醇。質(zhì)粒pDT24是pDT18(實(shí)施例9中所述)的衍生物并含有dhaT、dhaB1、2、3和蛋白質(zhì)X,但缺乏蛋白質(zhì)1、2和3。
序列表(1)一般信息(i)申請(qǐng)人MARIA DIAZ-TORRESNIGEL DUNN-COLEMANMATTHEW CHASE(ii)發(fā)明名稱1,3-丙二醇的重組生產(chǎn)方法(iii)序列數(shù)目49(iv)聯(lián)系地址(A)地址GENENCOR INTERNATIONAL,INC.(B)街道4 Cambridge Place1870 South Winton Road(C)城市Richester(D)州紐約(E)國(guó)家美國(guó)(F)郵政編碼(ZIP)14618(v)計(jì)算機(jī)可讀信息(A)介質(zhì)類型3.5#軟盤(B)計(jì)算機(jī)IBM PC兼容機(jī)(C)操作系統(tǒng)Microsoft Windows 3.1(D)軟件Microword 2.0c(vi)當(dāng)前申請(qǐng)數(shù)據(jù)(A)申請(qǐng)?zhí)栁捶峙?B)遞交日1997年11月13日(C)分類(vi)在先申請(qǐng)數(shù)據(jù)(A)申請(qǐng)?zhí)?0/030,601(B)遞交日1996年11月13日(C)分類(viii)代理人/代理機(jī)構(gòu)信息(A)姓名GLAISTER,DEBRA(B)登記號(hào)33,888(C)文獻(xiàn)/卷號(hào)gc 369-2(ix)通訊信息(A)電話(650)864-7620(B)傳真(650)845-6504(2)SEQ ID NO1的信息(i)序列特征(A)長(zhǎng)度1668個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(iii)假設(shè)非(iv)反義非(vi)初始來(lái)源(A)生物DHAB1(xi)SEQ ID NO1的序列描述ATGAAAAGAT CAAAACGATT TGCAGTACTG GCCCAGCGCC CCGTCAATCA GGACGGGCTG 60ATTGGCGAGT GGCCTGAAGA GGGGCTGATC GCCATGGACA GCCCCTTTGA CCCGGTCTCT 120TCAGTAAAAG TGGACAACGG TCTGATCGTC GAACTGGACG GCAAACGCCG GGACCAGTTT 180GACATGATCG ACCGATTTAT CGCCGATTAC GCGATCAACG TTGAGCGCAC AGAGCAGGCA 240ATGCGCCTGG AGGCGGTGGA AATAGCCCGT ATGCTGGTGG ATATTCACGT CAGCCGGGAG 300GAGATCATTG CCATCACTAC CGCCATCACG CCGGCCAAAG CGGTCGAGGT GATGGCGCAG 360ATGAACGTGG TGGAGATGAT GATGGCGCTG CAGAAGATGC GTGCCCGCCG GACCCCCTCC 420AACCAGTGCC ACGTCACCAA TCTCAAAGAT AATCCGGTGC AGATTGCCGC TGACGCCGCC 480GAGGCCGGGA TCCGCGGCTT CTCAGAACAG GAGACCACGG TCGGTATCGC GCGCTACGCG 540CCGTTTAACG CCCTGGCGCT GTTGGTCGGT TCGCAGTGCG GCCGCCCCGG CGTGTTGACG 600CAGTGCTCGG TGGAAGAGGC CACCGAGCTG GAGCTGGGCA TGCGTGGCTT AACCAGCTAC 660GCCGAGACGG TGTCGGTCTA CGGCACCGAA GCGGTATTTA CCGACGGCGA TGATACGCCG 720TGGTCAAAGG CGTTCCTCGC CTCGGCCTAC GCCTCCCGCG GGTTGAAAAT GCGCTACACC 780TCCGGCACCG GATCCGAAGC GCTGATGGGC TATTCGGAGA GCAAGTCGAT GCTCTACCTC 840GAATCGCGCT GCATCTTCAT TACTAAAGGC GCCGGGGTTC AGGGACTGCA AAACGGCGCG 900GTGAGCTGTA TCGGCATGAC CGGCGCTGTG CCGTCGGGCA TTCGGGCGGT GCTGGCGGAA 960AACCTGATCG CCTCTATGCT CGACCTCGAA GTGGCGTCCG CCAACGACCA GACTTTCTCC1020CACTCGGATA TTCGCCGCAC CGCGCGCACC CTGATGCAGA TGCTGCCGGG CACCGACTTT1080ATTTTCTCCG GCTACAGCGC GGTGCCGAAC TACGACAACA TGTTCGCCGG CTCGAACTTC1140GATGCGGAAG ATTTTGATGA TTACAACATC CTGCAGCGTG ACCTGATGGT TGACGGCGGC1200CTGCGTCCGG TGACCGAGGC GGAAACCATT GCCATTCGCC AGAAAGCGGC GCGGGCGATC1260CAGGCGGTTT TCCGCGAGCT GGGGCTGCCG CCAATCGCCG ACGAGGAGGT GGAGGCCGCC1320ACCTACGCGC ACGGCAGCAA CGAGATGCCG CCGCGTAACG TGGTGGAGGA TCTGAGTGCG1380GTGGAAGAGA TGATGAAGCG CAACATCACC GGCCTCGATA TTGTCGGCGC GCTGAGCCGC1440AGCGGCTTTG AGGATATCGC CAGCAATATT CTCAATATGC TGCGCCAGCG GGTCACCGGC1500GATTACCTGC AGACCTCGGC CATTCTCGAT CGGCAGTTCG AGGTGGTGAG TGCGGTCAAC1560GACATCAATG ACTATCAGGG GCCGGGCACC GGCTATCGCA TCTCTGCCGA ACGCTGGGCG1620GAGATCAAAA ATATTCCGGG CGTGGTTCAG CCCGACACCA TTGAATAA 1668(2)SEQ ID NO2的信息(i)序列特征(A)長(zhǎng)度585個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(iii)假設(shè)非(iv)反義非(vi)初始來(lái)源(A)生物DHAB2(xi)SEQ ID NO2的序列描述GTGCAACAGA CAACCCAAAT TCAGCCCTCT TTTACCCTGA AAACCCGCGA GGGCGGGGTA60GCTTCTGCCG ATGAACGCGC CGATGAAGTG GTGATCGGCG TCGGCCCTGC CTTCGATAAA 120CACCAGCATC ACACTCTGAT CGATATGCCC CATGGCGCGA TCCTCAAAGA GCTGATTGCC 180GGGGTGGAAG AAGAGGGGCT TCACGCCCGG GTGGTGCGCA TTCTGCGCAC GTCCGACGTC 240TCCTTTATGG CCTGGGATGC GGCCAACCTG AGCGGCTCGG GGATCGGCAT CGGTATCCAG 300TCGAAGGGGA CCACGGTCAT CCATCAGCGC GATCTGCTGC CGCTCAGCAA CCTGGAGCTG 360TTCTCCCAGG CGCCGCTGCT GACGCTGGAG ACCTACCGGC AGATTGGCAA AAACGCTGCG 420CGCTATGCGC GCAAAGAGTC ACCTTCGCCG GTGCCGGTGG TGAACGATCA GATGGTGCGG 480CCGAAATTTA TGGCCAAAGC CGCGCTATTT CATATCAAAG AGACCAAACA TGTGGTGCAG 540GACGCCGAGC CCGTCACCCT GCACATCGAC TTAGTAAGGG AGTGA585(2)SEQ ID NO3的信息(i)序列特征(A)長(zhǎng)度426個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物DHAB3(xi)SEQ ID NO3的序列描述ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG CCCGGAGCAT 60ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT GCTCTCTGGC 120GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA GGCGCAGATT 180GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC GGAGCTTATC 240GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT CCGCTCCTCG 300CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC GACAGTGAAT 360GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT GCGTAAAGGA 420AGCTAA 426(2)SEQ ID NO4的信息(i)序列特征(A)長(zhǎng)度1164個(gè)堿基對(duì)(B)類型核酸
(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物DHAT(xi)SEQ ID NO4的序列描述ATGAGCTATC GTATGTTTGA TTATCTGGTG CCAAACGTTA ACTTTTTTGG CCCCAACGCC60ATTTCCGTAG TCGGCGAACG CTGCCAGCTG CTGGGGGGGA AAAAAGCCCT GCTGGTCACC 120GACAAAGGCC TGCGGGCAAT TAAAGATGGC GCGGTGGACA AAACCCTGCA TTATCTGCGG 180GAGGCCGGGA TCGAGGTGGC GATCTTTGAC GGCGTCGAGC CGAACCCGAA AGACACCAAC 240GTGCGCGACG GCCTCGCCGT GTTTCGCCGC GAACAGTGCG ACATCATCGT CACCGTGGGC 300GGCGGCAGCC CGCACGATTG CGGCAAAGGC ATCGGCATCG CCGCCACCCA TGAGGGCGAT 360CTGTACCAGT ATGCCGGAAT CGAGACCCTG ACCAACCCGC TGCCGCCTAT CGTCGCGGTC 420AATACCACCG CCGGCACCGC CAGCGAGGTC ACCCGCCACT GCGTCCTGAC CAACACCGAA 480ACCAAAGTGA AGTTTGTGAT CGTCAGCTGG CGCAAACTGC CGTCGGTCTC TATCAACGAT 540CCACTGCTGA TGATCGGTAA ACCGGCCGCC CTGACCGCGG CGACCGGGAT GGATGCCCTG 600ACCCACGCCG TAGAGGCCTA TATCTCCAAA GACGCTAACC CGGTGACGGA CGCCGCCGCC 660ATGCAGGCGA TCCGCCTCAT CGCCCGCAAC CTGCGCCAGG CCGTGGCCCT CGGCAGCAAT 720CTGCAGGCGC GGGAAAACAT GGCCTATGCT TCTCTGCTGG CCGGGATGGC TTTCAATAAC 780GCCAACCTCG GCTACGTGCA CGCCATGGCG CACCAGCTGG GCGGCCTGTA CGACATGCCG 840CACGGCGTGG CCAACGCTGT CCTGCTGCCG CATGTGGCGC GCTACAACCT GATCGCCAAC 900CCGGAGAAAT TCGCCGATAT CGCTGAACTG ATGGGCGAAA ATATCACCGG ACTGTCCACT 960CTCGACGCGG CGGAAAAAGC CATCGCCGCT ATCACGCGTC TGTCGATGGA TATCGGTATT 1020CCGCAGCATC TGCGCGATCT GGGGGTAAAA GAGGCCGACT TCCCCTACAT GGCGGAGATG 1080GCTCTAAAAG ACGGCAATGC GTTCTCGAAC CCGCGTAAAG GCAACGAGCA GGAGATTGCC 1140GCGATTTTCC GCCAGGCATT CTGA1164(2)SEQ ID NO5的信息(i)序列特征(A)長(zhǎng)度1380個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物GPD1(xi)SEQ ID NO5的序列描述CTTTAATTTT CTTTTATCTT ACTCTCCTAC ATAAGACATC AAGAAACAAT TGTATATTGT 60ACACCCCCCC CCTCCACAAA CACAAATATT GATAATATAA AGATGTCTGC TGCTGCTGAT 120AGATTAAACT TAACTTCCGG CCACTTGAAT GCTGGTAGAA AGAGAAGTTC CTCTTCTGTT 180TCTTTGAAGG CTGCCGAAAA GCCTTTCAAG GTTACTGTGA TTGGATCTGG TAACTGGGGT 240ACTACTATTG CCAAGGTGGT TGCCGAAAAT TGTAAGGGAT ACCCAGAAGT TTTCGCTCCA 300ATAGTACAAA TGTGGGTGTT CGAAGAAGAG ATCAATGGTG AAAAATTGAC TGAAATCATA 360AATACTAGAC ATCAAAACGT GAAATACTTG CCTGGCATCA CTCTACCCGA CAATTTGGTT 420GCTAATCCAG ACTTGATTGA TTCAGTCAAG GATGTCGACA TCATCGTTTT CAACATTCCA 480CATCAATTTT TGCCCCGTAT CTGTAGCCAA TTGAAAGGTC ATGTTGATTC ACACGTCAGA 540GCTATCTCCT GTCTAAAGGG TTTTGAAGTT GGTGCTAAAG GTGTCCAATT GCTATCCTCT 600TACATCACTG AGGAACTAGG TATTCAATGT GGTGCTCTAT CTGGTGCTAA CATTGCCACC 660GAAGTCGCTC AAGAACACTG GTCTGAAACA ACAGTTGCTT ACCACATTCC AAAGGATTTC 720AGAGGCGAGG GCAAGGACGT CGACCATAAG GTTCTAAAGG CCTTGTTCCA CAGACCTTAC 780TTCCACGTTA GTGTCATCGA AGATGTTGCT GGTATCTCCA TCTGTGGTGC TTTGAAGAAC 840GTTGTTGCCT TAGGTTGTGG TTTCGTCGAA GGTCTAGGCT GGGGTAACAA CGCTTCTGCT 900GCCATCCAAA GAGTCGGTTT GGGTGAGATC ATCAGATTCG GTCAAATGTT TTTCCCAGAA 960TCTAGAGAAG AAACATACTA CCAAGAGTCT GCTGGTGTTG CTGATTTGAT CACCACCTGC1020GCTGGTGGTA GAAACGTCAA GGTTGCTAGG CTAATGGCTA CTTCTGGTAA GGACGCCTGG1080GAATGTGAAA AGGAGTTGTT GAATGGCCAA TCCGCTCAAG GTTTAATTAC CTGCAAAGAA1140GTTCACGAAT GGTTGGAAAC ATGTGGCTCT GTCGAAGACT TCCCATTATT TGAAGCCGTA1200TACCAAATCG TTTACAACAA CTACCCAATG AAGAACCTGC CGGACATGAT TGAAGAATTA1260GATCTACATG AAGATTAGAT TTATTGGAGA AAGATAACAT ATCATACTTC CCCCACTTTT1320TTCGAGGCTC TTCTATATCA TATTCATAAA TTAGCATTAT GTCATTTCTC ATAACTACTT1380(2)SEQ ID NO6的信息(i)序列特征(A)長(zhǎng)度2946個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源
(A)生物GPD2(xi)SEQ ID NO6的序列描述GAATTCGAGC CTGAAGTGCT GATTACCTTC AGGTAGACTT CATCTTGACC CATCAACCCC 60AGCGTCAATC CTGCAAATAC ACCACCCAGC AGCACTAGGA TGATAGAGAT AATATAGTAC 120GTGGTAACGC TTGCCTCATC ACCTACGCTA TGGCCGGAAT CGGCAACATC CCTAGAATTG 180AGTACGTGTG ATCCGGATAA CAACGGCAGT GAATATATCT TCGGTATCGT AAAGATGTGA 240TATAAGATGA TGTATACCCA ATGAGGAGCG CCTGATCGTG ACCTAGACCT TAGTGGCAAA 300AACGACATAT CTATTATAGT GGGGAGAGTT TCGTGCAAAT AACAGACGCA GCAGCAAGTA 360ACTGTGACGA TATCAACTCT TTTTTTATTA TGTAATAAGC AAACAAGCAC GAATGGGGAA 420AGCCTATGTG CAATCACCAA GGTCGTCCCT TTTTTCCCAT TTGCTAATTT AGAATTTAAA 480GAAACCAAAA GAATGAAGAA AGAAAACAAA TACTAGCCCT AACCCTGACT TCGTTTCTAT 540GATAATACCC TGCTTTAATG AACGGTATGC CCTAGGGTAT ATCTCACTCT GTACGTTACA 600AACTCCGGTT ATTTTATCGG AACATCCGAG CACCCGCGCC TTCCTCAACC CAGGCACCGC 660CCCAGGTAAC CGTGCGCGAT GAGCTAATCC TGAGCCATCA CCCACCCCAC CCGTTGATGA 720CAGCAATTCG GGAGGGCGAA AATAAAACTG GAGCAAGGAA TTACCATCAC CGTCACCATC 780ACCATCATAT CGCCTTAGCC TCTAGCCATA GCCATCATGC AAGCGTGTAT CTTCTAAGAT 840TCAGTCATCA TCATTACCGA GTTTGTTTTC CTTCACATGA TGAAGAAGGT TTGAGTATGC 900TCGAAACAAT AAGACGACGA TGGCTCTGCC ATTGGTTATA TTACGCTTTT GCGGCGAGGT 960GCCGATGGGT TGCTGAGGGG AAGAGTGTTT AGCTTACGGA CCTATTGCCA TTGTTATTCC1020GATTAATCTA TTGTTCAGCA GCTCTTCTCT ACCCTGTCAT TCTAGTATTT TTTTTTTTTT1080TTTTTGGTTT TACTTTTTTT TCTTCTTGCC TTTTTTTCTT GTTACTTTTT TTCTAGTTTT1140TTTTCCTTCC ACTAAGCTTT TTCCTTGATT TATCCTTGGG TTCTTCTTTC TACTCCTTTA1200GATTTTTTTT TTATATATTA ATTTTTAAGT TTATGTATTT TGGTAGATTC AATTCTCTTT1260CCCTTTCCTT TTCCTTCGCT CCCCTTCCTT ATCAATGCTT GCTGTCAGAA GATTAACAAG1320ATACACATTC CTTAAGCGAA CGCATCCGGT GTTATATACT CGTCGTGCAT ATAAAATTTT 1380GCCTTCAAGA TCTACTTTCC TAAGAAGATC ATTATTACAA ACACAACTGC ACTCAAAGAT 1440GACTGCTCAT ACTAATATCA AACAGCACAA ACACTGTCAT GAGGACCATC CTATCAGAAG 1500ATCGGACTCT GCCGTGTCAA TTGTACATTT GAAACGTGCG CCCTTCAAGG TTACAGTGAT 1560TGGTTCTGGT AACTGGGGGA CCACCATCGC CAAAGTCATT GCGGAAAACA CAGAATTGCA 1620TTCCCATATC TTCGAGCCAG AGGTGAGAAT GTGGGTTTTT GATGAAAAGA TCGGCGACGA 1680AAATCTGACG GATATCATAA ATACAAGACA CCAGAACGTT AAATATCTAC CCAATATTGA 1740CCTGCCCCAT AATCTAGTGG CCGATCCTGA TCTTTTACAC TCCATCAAGG GTGCTGACAT 1800CCTTGTTTTC AACATCCCTC ATCAATTTTT ACCAAACATA GTCAAACAAT TGCAAGGCCA 1860CGTGGCCCCT CATGTAAGGG CCATCTCGTG TCTAAAAGGG TTCGAGTTGG GCTCCAAGGG 1920TGTGCAATTG CTATCCTCCT ATGTTACTGA TGAGTTAGGA ATCCAATGTG GCGCACTATC 1980TGGTGCAAAC TTGGCACCGG AAGTGGCCAA GGAGCATTGG TCCGAAACCA CCGTGGCTTA 2040CCAACTACCA AAGGATTATC AAGGTGATGG CAAGGATGTA GATCATAAGA TTTTGAAATT 2100GCTGTTCCAC AGACCTTACT TCCACGTCAA TGTCATCGAT GATGTTGCTG GTATATCCAT 2160TGCCGGTGCC TTGAAGAACG TCGTGGCACT TGCATGTGGT TTCGTAGAAG GTATGGGATG 2220GGGTAACAAT GCCTCCGCAG CCATTCAAAG GCTGGGTTTA GGTGAAATTA TCAAGTTCGG 2280TAGAATGTTT TTCCCAGAAT CCAAAGTCGA GACCTACTAT CAAGAATCCG CTGGTGTTGC 2340AGATCTGATC ACCACCTGCT CAGGCGGTAG AAACGTCAAG GTTGCCACAT ACATGGCCAA 2400GACCGGTAAG TCAGCCTTGG AAGCAGAAAA GGAATTGCTT AACGGTCAAT CCGCCCAAGG 2460GATAATCACA TGCAGAGAAG TTCACGAGTG GCTACAAACA TGTGAGTTGA CCCAAGAATT 2520CCCAATTATT CGAGGCAGTC TACCAGATAG TCTACAACAA CGTCCGCATG GAAGACCTAC 2580CGGAGATGAT TGAAGAGCTA GACATCGATG ACGAATAGAC ACTCTCCCCC CCCCTCCCCC 2640TCTGATCTTT CCTGTTGCCT CTTTTTCCCC CAACCAATTT ATCATTATAC ACAAGTTCTA 2700CAACTACTAC TAGTAACATT ACTACAGTTA TTATAATTTT CTATTCTCTT TTTCTTTAAG 2760AATCTATCAT TAACGTTAAT TTCTATATAT ACATAACTAC CATTATACAC GCTATTATCG 2820TTTACATATC ACATCACCGT TAATGAAAGA TACGACACCC TGTACACTAA CACAATTAAA 2880TAATCGCCAT AACCTTTTCT GTTATCTATA GCCCTTAAAG CTGTTTCTTC GAGCTTTTCA 2940CTGCAG 2946(2)SEQ ID NO7的信息(i)序列特征(A)長(zhǎng)度3178個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物GUT2(xi)SEQ ID NO7的序列描述CTGCAGAACT TCGTCTGCTC TGTGCCCATC CTCGCGGTTA GAAAGAAGCT GAATTGTTTC60ATGCGCAAGG GCATCAGCGA GTGACCAATA ATCACTGCAC TAATTCCTTT TTAGCAACAC 120ATACTTATAT ACAGCACCAG ACCTTATGTC TTTTCTCTGC TCCGATACGT TATCCCACCC 180AACTTTTATT TCAGTTTTGG CAGGGGAAAT TTCACAACCC CGCACGCTAA AAATCGTATT 240TAAACTTAAA AGAGAACAGC CACAAATAGG GAACTTTGGT CTAAACGAAG GACTCTCCCT 300CCCTTATCTT GACCGTGCTA TTGCCATCAC TGCTACAAGA CTAAATACGT ACTAATATAT 360GTTTTCGGTA ACGAGAAGAA GAGCTGCCGG TGCAGCTGCT GCCATGGCCA CAGCCACGGG 420GACGCTGTAC TGGATGACTA GCCAAGGTGA TAGGCCGTTA GTGCACAATG ACCCGAGCTA 480CATGGTGCAA TTCCCCACCG CCGCTCCACC GGCAGGTCTC TAGACGAGAC CTGCTGGACC 540GTCTGGACAA GACGCATCAA TTCGACGTGT TGATCATCGG TGGCGGGGCC ACGGGGACAG 600GATGTGCCCT AGATGCTGCG ACCAGGGGAC TCAATGTGGC CCTTGTTGAA AAGGGGGATT 660TTGCCTCGGG AACGTCGTCC AAATCTACCA AGATGATTCA CGGTGGGGTG CGGTATTTAG 720AGAAGGCCTT CTGGGAGTTC TCCAAGGCAC AACTGGATCT GGTCATCGAG GCACTCAACG 780AGCGTAAACA TCTTATCAAC ACTGCCCCTC ACCTGTGCAC GGTGCTACCA ATTCTGATCC 840CCATCTACAG CACCTGGCAG GTCCCGTACA TCTATATGGG CTGTAAATTC TACGATTTCT 900TTGGCGGTTC CCAAAACTTG AAAAAATCAT ACCTACTGTC CAAATCCGCC ACCGTGGAGA 960AGGCTCCCAT GCTTACCACA GACAATTTAA AGGCCTCGCT TGTGTACCAT GATGGGTCCT1020TTAACGACTC GCGTTTGAAC GCCACTTTAG CCATCACGGG TGTGGAGAAC GGCGCTACCG1080TCTTGATCTA CCGGGACGTT GAGACTAATG AGCTTGTCAG AATCAACGCT AAATGTGTGG1200TCAATGCCAC GGGCCCATAC AGTGACGCCA TTTTGCAAAT GGACCGCAAC CCATCCGGTC1260TGCCGGACTC CCCGCTAAAC GACAACTCCA AGATCAAGTC GACTTTCAAT CAAATCTCCG1320TCATGGACCC GAAAATGGTC ATCCCATCTA TTGGCGTTCA CATCGTATTG CCCTCTTTTT1380ACTCCCCGAA GGATATGGGT TTGTTGGACG TCAGAACCTC TGATGGCAGA GTGATGTTCT1440TTTTACCTTG GCAGGGCAAA GTCCTTGCCG GCACCACAGA CATCCCACTA AAGCAAGTCC1500CAGAAAACCC TATGCCTACA GAGGCTGATA TTCAAGATAT CTTGAAAGAA CTACAGCACT1560ATATCGAATT CCCCGTGAAA AGAGAAGACG TGCTAAGTGC ATGGGCTGGT GTCAGACCTT1620TGGTCAGAGA TCCACGTACA ATCCCCGCAG ACGGGAAGAA GGGCTCTGCC ACTCAGGGCG1680TGGTAAGATC CCACTTCTTG TTCACTTCGG ATAATGGCCT AATTACTATT GCAGGTGGTA1740AATGGACTAC TTACAGACAA ATGGCTGAGG AAACAGTCGA CAAAGTTGTC GAAGTTGGCG1800GATTCCACAA CCTGAAACCT TGTCACACAA GAGATATTAA GCTTGCTGGT GCAGAAGAAT1860GGACGCAAAA CTATGTGGCT TTATTGGCTC AAAACTACCA TTTATCATCA AAAATGTCCA1920ACTACTTGGT TCAAAACTAC GGAACCCGTT CCTCTATCAT TTGCGAATTT TTCAAAGAAT 1980CCATGGAAAA TAAACTGCCT TTGTCCTTAG CCGACAAGGA AAATAACGTA ATCTACTCTA 2040GCGAGGAGAA CAACTTGGTC AATTTTGATA CTTTCAGATA TCCATTCACA ATCGGTGAGT 2100TAAAGTATTC CATGCAGTAC GAATATTGTA GAACTCCCTT GGACTTCCTT TTAAGAAGAA 2160CAAGATTCGC CTTCTTGGAC GCCAAGGAAG CTTTGAATGC CGTGCATGCC ACCGTCAAAG 2220TTATGGGTGA TGAGTTCAAT TGGTCGGAGA AAAAGAGGCA GTGGGAACTT GAAAAAACTG 2280TGAACTTCAT CCAAGGACGT TTCGGTGTCT AAATCGATCA TGATAGTTAA GGGTGACAAA 2340GATAACATTC ACAAGAGTAA TAATAATGGT AATGATGATA ATAATAATAA TGATAGTAAT 2400AACAATAATA ATAATGGTGG TAATGGCAAT GAAATCGCTA TTATTACCTA TTTTCCTTAA 2460TGGAAGAGTT AAAGTAAACT AAAAAAACTA CAAAAATATA TGAAGAAAAA AAAAAAAAGA 2520GGTAATAGAC TCTACTACTA CAATTGATCT TCAAATTATG ACCTTCCTAG TGTTTATATT 2580CTATTTCCAA TACATAATAT AATCTATATA ATCATTGCTG GTAGACTTCC GTTTTAATAT 2640CGTTTTAATT ATCCCCTTTA TCTCTAGTCT AGTTTTATCA TAAAATATAG AAACACTAAA 2700TAATATTCTT CAAACGGTCC TGGTGCATAC GCAATACATA TTTATGGTGC AAAAAAAAAA 2760ATGGAAAATT TTGCTAGTCA TAAACCCTTT CATAAAACAA TACGTAGACA TCGCTACTTG 2820AAATTTTCAA GTTTTTATCA GATCCATGTT TCCTATCTGC CTTGACAACC TCATCGTCGA 2880AATAGTACCA TTTAGAACGC CCAATATTCA CATTGTGTTC AAGGTCTTTA TTCACCAGTG 2940ACGTGTAATG GCCATGATTA ATGTGCCTGT ATGGTTAACC ACTCCAAATA GCTTATATTT 3000CATAGTGTCA TTGTTTTTCA ATATAATGTT TAGTATCAAT GGATATGTTA CGACGGTGTT 3060ATTTTTCTTG GTCAAATCGT AATAAAATCT CGATAAATGG ATGACTAAGA TTTTTGGTAA 3120AGTTACAAAA TTTATCGTTT TCACTGTTGT CAATTTTTTG TTCTTGTAAT CACTCGAG3178(2)SEQ ID NO8的信息(i)序列特征(A)長(zhǎng)度816個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物GPP1(xi)SEQ ID NO8的序列描述ATGAAACGTT TCAATGTTTT AAAATATATC AGAACAACAA AAGCAAATAT ACAAACCATC 60GCAATGCCTT TGACCACAAA ACCTTTATCT TTGAAAATCA ACGCCGCTCT ATTCGATGTT 120GACGGTACCA TCATCATCTC TCAACCAGCC ATTGCTGCTT TCTGGAGAGA TTTCGGTAAA 180GACAAGCCTT ACTTCGATGC CGAACACGTT ATTCACATCT CTCACGGTTG GAGAACTTAC 240GATGCCATTG CCAAGTTCGC TCCAGACTTT GCTGATGAAG AATACGTTAA CAAGCTAGAA 300GGTGAAATCC CAGAAAAGTA CGGTGAACAC TCCATCGAAG TTCCAGGTGC TGTCAAGTTG 360TGTAATGCTT TGAACGCCTT GCCAAAGGAA AAATGGGCTG TCGCCACCTC TGGTACCCGT 420GACATGGCCA AGAAATGGTT CGACATTTTG AAGATCAAGA GACCAGAATA CTTCATCACC 480GCCAATGATG TCAAGCAAGG TAAGCCTCAC CCAGAACCAT ACTTAAAGGG TAGAAACGGT 540TTGGGTTTCC CAATTAATGA ACAAGACCCA TCCAAATCTA AGGTTGTTGT CTTTGAAGAC 600GCACCAGCTG GTATTGCTGC TGGTAAGGCT GCTGGCTGTA AAATCGTTGG TATTGCTACC 660ACTTTCGATT TGGACTTCTT GAAGGAAAAG GGTTGTGACA TCATTGTCAA GAACCACGAA 720TCTATCAGAG TCGGTGAATA CAACGCTGAA ACCGATGAAG TCGAATTGAT CTTTGATGAC 780TACTTATACG CTAAGGATGA CTTGTTGAAA TGGTAA 816(2)SEQ ID NO9的信息(i)序列特征(A)長(zhǎng)度753個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物GPP2(xi)SEQ ID NO9的序列描述ATGGGATTGA CTACTAAACC TCTATCTTTG AAAGTTAACG CCGCTTTGTT CGACGTCGAC60GGTACCATTA TCATCTCTCA ACCAGCCATT GCTGCATTCT GGAGGGATTT CGGTAAGGAC 120AAACCTTATT TCGATGCTGA ACACGTTATC CAAGTCTCGC ATGGTTGGAG AACGTTTGAT 180GCCATTGCTA AGTTCGCTCC AGACTTTGCC AATGAAGAGT ATGTTAACAA ATTAGAAGCT 240GAAATTCCGG TCAAGTACGG TGAAAAATCC ATTGAAGTCC CAGGTGCAGT TAAGCTGTGC 300AACGCTTTGA ACGCTCTACC AAAAGAGAAA TGGGCTGTGG CAACTTCCGG TACCCGTGAT 360ATGGCACAAA AATGGTTCGA GCATCTGGGA ATCAGGAGAC CAAAGTACTT CATTACCGCT 420AATGATGTCA AACAGGGTAA GCCTCATCCA GAACCATATC TGAAGGGCAG GAATGGCTTA 480GGATATCCGA TCAATGAGCA AGACCCTTCC AAATCTAAGG TAGTAGTATT TGAAGACGCT 540CCAGCAGGTA TTGCCGCCGG AAAAGCCGCC GGTTGTAAGA TCATTGGTAT TGCCACTACT 600TTCGACTTGG ACTTCCTAAA GGAAAAAGGC TGTGACATCA TTGTCAAAAA CCACGAATCC 660ATCAGAGTTG GCGGCTACAA TGCCGAAACA GACGAAGTTG AATTCATTTT TGACGACTAC 720TTATATGCTA AGGACGATCT GTTGAAATGG TAA 753(2)SEQ ID NO10的信息(i)序列特征(A)長(zhǎng)度2520個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物GUT1(xi)SEQ ID NO10的序列描述TGTATTGGCC ACGATAACCA CCCTTTGTAT ACTGTTTTTG TTTTTCACAT GGTAAATAAC 60GACTTTTATT AAACAACGTA TGTAAAAACA TAACAAGAAT CTACCCATAC AGGCCATTTC120GTAATTCTTC TCTTCTAATT GGAGTAAAAC CATCAATTAA AGGGTGTGGA GTAGCATAGT180GAGGGGCTGA CTGCATTGAC AAAAAAATTG AAAAAAAAAA AGGAAAAGGA AAGGAAAAAA240AGACAGCCAA GACTTTTAGA ACGGATAAGG TGTAATAAAA TGTGGGGGGA TGCCTGTTCT300CGAACCATAT AAAATATACC ATGTGGTTTG AGTTGTGGCC GGAACTATAC AAATAGTTAT360ATGTTTCCCT CTCTCTTCCG ACTTGTAGTA TTCTCCAAAC GTTACATATT CCGATCAAGC420CAGCGCCTTT ACACTAGTTT AAAACAAGAA CAGAGCCGTA TGTCCAAAAT AATGGAAGAT480TTACGAAGTG ACTACGTCCC GCTTATCGCC AGTATTGATG TAGGAACGAC CTCATCCAGA540TGCATTCTGT TCAACAGATG GGGCCAGGAC GTTTCAAAAC ACCAAATTGA ATATTCAACT600TCAGCATCGA AGGGCAAGAT TGGGGTGTCT GGCCTAAGGA GACCCTCTAC AGCCCCAGCT660CGTGAAACAC CAAACGCCGG TGACATCAAA ACCAGCGGAA AGCCCATCTT TTCTGCAGAA720GGCTATGCCA TTCAAGAAAC CAAATTCCTA AAAATCGAGG AATTGGACTT GGACTTCCAT780AACGAACCCA CGTTGAAGTT CCCCAAACCG GGTTGGGTTG AGTGCCATCC GCAGAAATTA840CTGGTGAACG TCGTCCAATG CCTTGCCTCA AGTTTGCTCT CTCTGCAGAC TATCAACAGC 900GAACGTGTAG CAAACGGTCT CCCACCTTAC AAGGTAATAT GCATGGGTAT AGCAAACATG 960AGAGAAACCA CAATTCTGTG GTCCCGCCGC ACAGGAAAAC CAATTGTTAA CTACGGTATT1020GTTTGGAACG ACACCAGAAC GATCAAAATC GTTAGAGACA AATGGCAAAA CACTAGCGTC1080GATAGGCAAC TGCAGCTTAG ACAGAAGACT GGATTGCCAT TGCTCTCCAC GTATTTCTCC1140TGTTCCAAGC TGCGCTGGTT CCTCGACAAT GAGCCTCTGT GTACCAAGGC GTATGAGGAG1200AACGACCTGA TGTTCGGCAC TGTGGACACA TGGCTGATTT ACCAATTAAC TAAACAAAAG1260GCGTTCGTTT CTGACGTAAC CAACGCTTCC AGAACTGGAT TTATGAACCT CTCCACTTTA1320AAGTACGACA ACGAGTTGCT GGAATTTTGG GGTATTGACA AGAACCTGAT TCACATGCCC1380GAAATTGTGT CCTCATCTCA ATACTACGGT GACTTTGGCA TTCCTGATTG GATAATGGAA1440AAGCTACACG ATTCGCCAAA AACAGTACTG CGAGATCTAG TCAAGAGAAA CCTGCCCATA1500CAGGGCTGTC TGGGCGACCA AAGCGCATCC ATGGTGGGGC AACTCGCTTA CAAACCCGGT1560GCTGCAAAAT GTACTTATGG TACCGGTTGC TTTTTACTGT ACAATACGGG GACCAAAAAA1620TTGATCTCCC AACATGGCGC ACTGACGACT CTAGCATTTT GGTTCCCACA TTTGCAAGAG1680TACGGTGGCC AAAAACCAGA ATTGAGCAAG CCACATTTTG CATTAGAGGG TTCCGTCGCT1740GTGGCTGGTG CTGTGGTCCA ATGGCTACGT GATAATTTAC GATTGATCGA TAAATCAGAG1800GATGTCGGAC CGATTGCATC TACGGTTCCT GATTCTGGTG GCGTAGTTTT CGTCCCCGCA1860TTTAGTGGCC TATTCGCTCC CTATTGGGAC CCAGATGCCA GAGCCACCAT AATGGGGATG1920TCTCAATTCA CTACTGCCTC CCACATCGCC AGAGCTGCCG TGGAAGGTGT TTGCTTTCAA1980GCCAGGGCTA TCTTGAAGGC AATGAGTTCT GACGCGTTTG GTGAAGGTTC CAAAGACAGG2040GACTTTTTAG AGGAAATTTC CGACGTCACA TATGAAAAGT CGCCCCTGTC GGTTCTGGCA2100GTGGATGGCG GGATGTCGAG GTCTAATGAA GTCATGCAAA TTCAAGCCGA TATCCTAGGT2160CCCTGTGTCA AAGTCAGAAG GTCTCCGACA GCGGAATGTA CCGCATTGGG GGCAGCCATT2220GCAGCCAATA TGGCTTTCAA GGATGTGAAC GAGCGCCCAT TATGGAAGGA CCTACACGAT2280GTTAAGAAAT GGGTCTTTTA CAATGGAATG GAGAAAAACG AACAAATATC ACCAGAGGCT2340CATCCAAACC TTAAGATATT CAGAAGTGAA TCCGACGATG CTGAAAGGAG AAAGCATTGG2400AAGTATTGGG AAGTTGCCGT GGAAAGATCC AAAGGTTGGC TGAAGGACAT AGAAGGTGAA2460CACGAACAGG TTCTAGAAAA CTTCCAATAA CAACATAAAT AATTTCTATT AACAATGTAA2520(2)SEQ ID NO11的信息(i)序列特征(A)長(zhǎng)度391個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GPD1(xi)SEQ ID NO11的序列描述Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn1 5 10 15Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu20 25 30Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr35 40 45Ile Ala Lys Val Val Ala Glu Ash Cys Lys Gly Tyr Pro Glu Val Phe50 55 60Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu65 70 75 80Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu85 90 95Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile100 105 110Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln115 120 125Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His130 135 140Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly145 150 155 160Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys165 170 175Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu Mis180 185 190Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly195 200 205Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg210 215 220Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile225 230 235 240Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu245 250 255Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly260 265 270Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg275 280 285Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr290 295 300Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr305 310 315 320Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln325 330 335Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu340 345 350Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln355 360 365Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu370 375 380Glu Leu Asp Leu His Glu Asp385 390(2)SEQ ID NO12的信息(i)序列特征(A)長(zhǎng)度384個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GPD2(xi)SEQ ID NO12的序列描述Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp1 5 10 15His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys20 25 30Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr35 40 45Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile50 55 60Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp65 70 75 80Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr85 90 95Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu100 105 110Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His115 120 125Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro130 135 140His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys145 150 155 160Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln165 170 175Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu180 185 190His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln195 200 205Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His210 215 220Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser225 230 235 240Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val245 250 255Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu260 265 270Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser275 280 285Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile290 295 300Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala305 310 315 320Lys Thr Giy Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly325 330 335Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu340 345 350Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Ile Ile Arg Gly Ser Leu355 360 365Pro Asp Ser Leu Gln Gln Arg Pro His Gly Arg Pro Thr Gly Asp Asp370 375 380(2)SEQ ID NO13的信息(i)序列特征(A)長(zhǎng)度614個(gè)氨基酸(B)類型氨基酸
(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GUT2(xi)SEQ ID NO13的序列描述Met Thr Arg Ala Thr Trp Cys Asn Ser Pro Pro Pro Leu His Arg Gln1 5 10 15Val Ser Arg Arg Asp Leu Leu Asp Arg Leu Asp Lys Thr His Gln Phe20 25 30Asp Val Leu Ile Ile Gly Gly Gly Ala Thr Gly Thr Gly Cys Ala Leu35 40 45Asp Ala Ala Thr Arg Gly Leu Asn Val Ala Leu Val Glu Lys Gly Asp50 55 60Phe Ala Ser Gly Thr Ser Ser Lys Ser Thr Lys Met Ile His Gly Gly65 70 75 80Val Arg Tyr Leu Glu Lys Ala Phe Trp Glu Phe Ser Lys Ala Gln Leu85 90 95Asp Leu Val Ile Glu Ala Leu Asn Glu Arg Lys His Leu Ile Asn Thr100 105 110Ala Pro His Leu Cys Thr Val Leu Pro Ile Leu Ile Pro Ile Tyr Ser115 120 125Thr Trp Gln Val Pro Tyr Ile Tyr Met Gly Cys Lys Phe Tyr Asp Phe130 135 140Phe Gly Gly Ser Gln Asn Leu Lys Lys Ser Tyr Leu Leu Ser Lys Ser145 150 155 160Ala Thr Val Glu Lys Ala Pro Met Leu Thr Thr Asp Asn Leu Lys Ala
165 170 175Ser Leu Val Tyr His Asp Gly Ser Phe Asn Asp Ser Arg Leu Asn Ala180 185 190Thr Leu Ala Ile Thr Gly Val Glu Aan Gly Ala Thr Val Leu Ile Tyr195 200 205Val Glu Val Gln Lys Leu Ile Lys Asp Pro Thr Ser Gly Lys Val Ile210 215 220Gly Ala Glu Ala Arg Asp Val Glu Thr Asn Glu Leu Val Arg Ile Asn225 230 235 240Ala Lys Cys Val Val Asn Ala Thr Gly Pro Tyr Sar Asp Ala Ile Leu245 250 255Gln Met Asp Arg Asn Pro Ser Gly Leu Pro Asp Ser Pro Leu Asn Asp260 265 270Asn Ser Lys Ile Lys Ser Thr Phe Asn Gln Ile Ser Val Met Asp Pro275 280 285Lys Met Val Ile Pro Ser Ile Gly Val His Ile Val Leu Pro Ser Phe290 295 300Tyr Ser Pro Lys Asp Met Gly Leu Leu Asp Val Arg Thr Ser Asp Gly305 310 315 320Arg Val Met Phe Phe Leu Pro Trp Gln Gly Lys Val Leu Ala Gly Thr325 330 335Thr Asp Ile Pro Leu Lys Gln Val Pro Glu Asn Pro Met Pro Thr Glu340 345 350Ala Asp Ile Gln Asp Ile Leu Lys Glu Leu Gln His Tyr Ile Glu Phe355 360 365Pro Val Lys Arg Glu Asp Val Leu Ser Ala Trp Ala Gly Val Arg Pro370 375 380Leu Val Arg Asp Pro Arg Thr Ite Pro Ala Asp Gly Lys Lys Gly Ser385 390 395 400Ala Thr Gln Gly Val Val Arg Ser His Phe Leu Phe Thr Ser Asp Asn405 410 415Gly Leu Ile Thr Ile Ala Gly Gly Lys Trp Thr Thr Tyr Arg Gln Met420 425 430Ala Glu Glu Thr Val Asp Lys Val Val Glu Val Gly Gly Phe His Asn435 440 445Leu Lys Pro Cys His Thr Arg Asp Ile Lys Leu Ala Gly Ala Glu Glu450 455 460Trp Thr Gln Asn Tyr Val Ala Leu Leu Ala Gln Asn Tyr His Leu Ser465 470 475 480Ser Lys Met Ser Asn Tyr Leu Val Gln Asn Tyr Gly Thr Arg Ser Ser485 490 495Ile Ile Cys Glu Phe Phe Lys Glu Ser Met Glu Asn Lys Leu Pro Leu500 505 510Ser Leu Ala Asp Lys Glu Asn Asn Val Ile Tyr Ser Ser Glu Glu Asn515 520 525Asn Leu Val Asn Phe Asp Thr Phe Arg Tyr Pro Phe Thr Ile Gly Glu530 535 540Leu Lys Tyr Ser Met Gln Tyr Glu Tyr Cys Arg Thr Pro Leu Asp Phe545 550 555 560Leu Leu Arg Arg Thr Arg Phe Ala Phe Leu Asp Ala Lys Glu Ala Leu565 570 575Asn Ala Val His Ala Thr Val Lys Val Met Gly Asp Glu Phe Asn Trp580 585 590Ser Glu Lys Lys Arg Gln Trp Glu Leu Glu Lys Thr Val Asn Phe Ile595 600 605Gln Gly Arg Phe Gly Val610(2)SEQ ID NO14的信息(i)序列特征(A)長(zhǎng)度339個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GPSA(xi)SEQ ID NO14的序列描述Met Asn Gln Arg Asn Ala Ser Met Thr Val Ile Gly Ala Gly Ser Tyr1 5 10 15Gly Thr Ala Leu Ala Ile Thr Leu Ala Arg Asn Gly His Glu val Val20 25 30Leu Trp Gly His Asp Pro Glu His Ile Ala Thr Leu Glu Arg Asp Arg35 40 45Cys Asn Ala Ala Phe Leu Pro Asp Val Pro Phe Pro Asp Thr Leu His50 55 60Leu Glu Ser Asp Leu Ala Thr Ala Leu Ala Ala Ser Arg Asn Ile Leu65 70 75 80Val Val Val Pro Ser His Val Phe Gly Glu Val Leu Arg Gln Ile Lys85 90 95Pro Leu Met Arg Pro Asp Ala Arg Leu Val Trp Ala Thr Lys Gly Leu100 105 110Glu Ala Glu Thr Gly Arg Leu Leu Gln Asp Val Ala Arg Glu Ala Leu115 120 125Gly Asp Gln Ile Pro Leu Ala Val Ile Ser Gly Pro Thr Phe Ala Lys130 135 140Glu Leu Ala Ala Gly Leu Pro Thr Ala Ile Ser Leu Ala Ser Thr Asp145 150 155 160Gln Thr Phe Ala Asp Asp Leu Gln Gln Leu Leu His Cys Gly Lys Ser165 170 175Phe Arg Val Tyr Ser Asn Pro Asp Phe Ile Gly Val Gln Leu Gly Gly180 185 190Ala Val Lys Asn Val Ile Ala Ile Gly Ala Gly Met Ser Asp Gly Ile195200 205Gly Phe Gly Ala Asn Ala Arg Thr Ala Leu Ile Thr Arg Gly Leu Ala210 215 220Glu Met Ser Arg Leu Gly Ala Ala Leu Gly Ala Asp Pro Ala Thr Phe225 230 235 240Met Gly Met Ala Gly Leu Gly Asp Leu Val Leu Thr Cys Thr Asp Asn245 250 255Gln Ser Arg Asn Arg Arg Phe Gly Met Met Leu Gly Gln Gly Met Asp260 265 270Val Gln Ser Ala Gln Glu Lys Ile Gly Gln Val Val Glu Gly Tyr Arg275 280 285Asn Thr Lys Glu Val Arg Glu Leu Ala His Arg Phe Gly Val Glu Met290 295300Pro Ile Thr Glu Glu Ile Tyr Gln Val Leu Tyr Cys Gly Lys Asn Ala305 310 315 320Arg Glu Ala Ala Leu Thr Leu Leu Gly Arg Ala Arg Lys Asp Glu Arg325 330 335Ser Ser His(2)SEQ ID NO15的信息(i)序列特征(A)長(zhǎng)度501個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GLPD(xi)SEQ ID NO15的序列描述Met Glu Thr Lys Asp Leu Ile Val Ile Gly Gly Gly Ile Asn Gly Ala1 5 10 15Gly Ile Ala Ala Asp Ala Ala Gly Arg Gly Leu Ser Val Leu Met Leu20 25 30Glu Ala Gln Asp Leu Ala Cys Ala Thr Ser Ser Ala Ser Ser Lys Leu35 40 45Ile His Gly Gly Leu Arg Tyr Leu Glu Mis Tyr Glu Phe Arg Leu Val50 55 60Ser Glu Ala Leu Ata Glu Arg Glu Val Leu Leu Lys Met Ala Pro His65 70 75 80Ile Ala Phe Pro Met Arg Phe Arg Leu Pro Mis Arg Pro His Leu Arg85 90 95Pro Ala Trp Met Ile Arg Ile Gly Leu Phe Met Tyr Asp His Leu Gly100 105 110Lys Arg Thr Ser Leu Pro Gly Ser Thr Gly Leu Arg Phe Gly Ala Asn115 120 125Ser Val Leu Lys Pro Glu Ile Lys Arg Gly Phe Glu Tyr Ser Asp Cys130 135 140Trp Val Asp Asp Ala Arg Leu Val Leu Ala Asn Ala Gln Met Val Val145 150 155 160Arg Lys Gly Gly Glu Val Leu Thr Arg Thr Arg Ala Thr Ser Ala Arg165 170 175Arg Glu Asn Gly Leu Trp Ile Val Glu Ala Glu Asp Ile Asp Thr Gly180 185 190Lys Lys Tyr Ser Trp Gln Ala Arg Gly Leu Val Asn Ala Thr Gly Pro195 200 205Trp Val Lys Gln Phe Phe Asp Asp Gly Met His Leu Pro Ser Pro Tyr210 215 220Gly Ile Arg Leu Ile Lys Gly Ser His Ile Val Val Pro Arg Val His225 230 235 240Thr Gln Lys Gln Ala Tyr Ile Leu Gin Asn Glu Asp Lys Arg Ile Val245 250 255Phe Val Ile Pro Trp Met Asp Glu Phe Ser Ile Ile Gly Thr Thr Asp260 265 270Val Glu Tyr Lys Gly Asp Pro Lys Ala Val Lys Ile Glu Glu Ser Glu275 280 285Ile Asn Tyr Leu Leu Asn Val Tyr ASn Thr His Phe Lys Lys Gln Leu290 295 300Ser Arg Asp Asp Ile Val Trp Thr Tyr Ser Gly Val Arg Pro Leu Cys305 310 315 320Asp Asp Glu Ser Asp Ser Pro Gln Ala Ile Thr Arg Asp Tyr Thr Leu325 330 335Asp Ile His Asp Glu Asn Gly Lys Ala Pro Leu Leu Ser Val Phe Gly340 345 350Gly Lys Leu Thr Thr Tyr Arg Lys Leu Ala Glu His Ala Leu Glu Lys355 360 365Leu Thr Pro Tyr Tyr Gln Gly Ile Gly Pro Ala Trp Thr Lys Glu Ser370 375 380Val Leu Pro Gly Gly Ala Ile Glu Gly Asp Arg Asp Asp Tyr Ala Ala385 390 395 400Arg Leu Arg Arg Arg Tyr Pro Phe Leu Thr Glu Ser Leu Ala Arg His405410 415Tyr Ala Arg Thr Tyr Gly Ser Asn Ser Glu Leu Leu Leu Gly Asn Ala420 425 430Gly Thr Val Ser Asp Leu Gly Glu Asp Phe Gly His Glu Phe Tyr Glu435 440 445Ala Glu Leu Lys Tyr Leu Val Asp His Glu Trp Val Arg Arg Ala Asp450 455 460Asp A la LeuTrp Arg Arg Thr Lys Gin Gly Met Trp Leu Asn Ala Asp465 470 475 480Gln Gln Ser Arg Val Ser Gln Trp Leu Val Glu Tyr Thr Gln Gln Arg485 490 495Leu Ser Leu Ala Ser500(2)SEQ ID NO16的信息(i)序列特征(A)長(zhǎng)度542個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GLPABC(xi)SEQ ID NO16的序列描述Met Lys Thr Arg Asp Ser Gln Ser Ser Asp Val Ile Ile Ile Gly Gly1 5 10 15Gly Ala Thr Gly Ala Gly Ile Ala Arg Asp Cys Ala Leu Arg Gly Leu20 25 30Arg Val Ile Leu Val Glu Arg His Asp Ile Ala Thr Gly Ala Thr Gly35 40 45Arg Asn His Gly Leu Leu His Ser Gly Ala Arg Tyr Ala Val Thr Asp50 55 60Ala Glu Ser Ala Arg Glu Cys Ile Ser Glu Asn Gln Ile Leu Lys Arg65 70 75 80Ile Ala Arg His Cys Val Gtu Pro Thr Asn Gly Leu Phe Ile Thr Leu85 90 95Pro Glu Asp Asp Leu Ser Phe Gln Ala Thr Phe Ile Arg Ala Cys Glu100 105 110Glu Ala Gly Ile Ser Ala Glu Ala Ile Asp Pro Gln Gln Ala Arg Ile115 120 125Ile Glu Pro Ala Val Asn Pro Ala Leu Ile Gly Ala Val Lys Val Pro130 135 140Asp Gly Thr Val Asp Pro Phe Arg Leu Thr Ala Ala Asn Met Leu Asp145 150 155 160Ala Lys Glu His Gly Ala Val Ile Leu Thr Ala Mis Glu Val Thr Gly165 170 175Leu Ile Arg Glu Gly Ala Thr Val Cys Gly Val Arg Val Arg Asn His180 185 190Leu Thr Gly Glu Thr Gln Ala Leu His Ala Pro Val Val Val Asn Ala195 200 205Ala Gly Ile Trp Gly Gln His Ile Ala Glu Tyr Ala Asp Leu Arg Ile210 215 220Arg Met Phe Pro Ala Lys Gly Ser Leu Leu Ile Met Asp His Arg Ile225 230 235 240Asn Gln His Val Ile Asn Arg Cys Arg Lys Pro Ser Asp Ala Asp Ile245 250 255Leu Val Pro Gly Asp Thr Ile Ser Leu Ile Gly Thr Thr Ser Leu Arg260 265 270Ile Asp Tyr Asn Glu Ile Asp Asp Asn Arg Val Thr Ala Glu Glu Val275 280 285Asp Ile Leu Leu Arg Glu Gly Glu Lys Leu Ala Pro Val Met Ala Lys290 295 300Thr Arg Ile Leu Arg Ala Tyr Ser Gly Val Arg Pro Leu Val Ala Ser305 310 315 320Asp Asp Asp Pro Ser Gly Arg Asn Leu Ser Arg Gly Ile Val Leu Leu325 330 335Asp His Ala Glu Arg Asp Gly Leu Asp Gly Phe Ile Thr Ile Thr Gly340 345 350Gly Lys Leu Met Thr Tyr Arg Leu Met Ala Glu Trp Ala Thr Asp Ala355 360 365Val Cys Arg Lys Leu Gly Asn Thr Arg Pro Cys Thr Thr Ala Asp Leu370 375 380Ala Leu Pro Gly Ser Gln Glu Pro Ala Glu Val Thr Leu Arg Lys Val385 390 395 400Ile Ser Leu Pro Ala Pro Leu Arg Gly Ser Ala Val Tyr Arg His Gly405 410 415Asp Arg Thr Pro Ala Trp Leu Ser Glu Gly Arg Leu His Arg Ser Leu420 425 430Val Cys Glu Cys Glu Ala Val Thr Ala Gly Glu Val Gln Tyr Ala Val435 440 445Glu Asn Leu Asn Val Asn Ser Leu Leu Asp Leu Arg Arg Arg Thr Arg450 455 460Val Gly Met Gly Thr Cys Gln Gly Glu Leu Cys Ala Cys Arg Ala Ala465 470 475480Gly Leu Leu Gln Arg Phe Asn Val Thr Thr Ser Ala Gln Ser Ile Glu485 490 495Gln Leu Ser Thr Phe Leu Asn Glu Arg Trp Lys Gly Val Gln Pro Ile500 505 510Ala Trp Gly Asp Ala Leu Arg Glu Ser Glu Phe Thr Arg Trp Val Tyr515 520 525Gln Gly Leu Cys Gly Leu Glu Lys Glu Gln Lys Asp Ala Leu530 535 540(2)SEQID NO17的信息(i)序列特征(A)長(zhǎng)度250個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GPP2(xi)SEQ ID NO17的序列描述Met Gly Leu Thr Thr Lys Pro Leu Ser Leu Lys Val Asn Ala Ala Leu1 5 10 15Phe Asp Val Asp Gly Thr Ile Ile Ile Sar Gln Pro Ala Ile Ala Ala20 25 30Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His35 40 45Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys50 55 60Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala65 70 75 80Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala85 90 95Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala100 105 110Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His115 120 125Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys130 135 140Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu145 150 155160Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val165 170 175Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys180 185 190Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu195 200 205Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly210 215 220Gly Tyr Asn Ala Glu Thr Asp Glu Val Glu Phe Ile Phe Asp Asp Tyr225 230 235 240Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp245 250(2)SEQ ID NO18的信息(i)序列特征(A)長(zhǎng)度709個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GUT1(xi)SEQ ID NO18的序列描述Met Phe Pro Ser Leu Phe Arg Leu Val Val Phe Ser Lys Arg Tyr Ile1 5 10 15Phe Arg Ser Ser Gln Arg Leu Tyr Thr Ser Leu Lys Gln Glu Gln Ser20 25 30Arg Met Ser Lys Ile Met Glu Asp Leu Arg Ser Asp Tyr Val Pro Leu35 40 45Ile Ala Ser Ile Asp Val Gly Thr Thr Ser Ser Arg Cys Ile Leu Phe50 55 60Asn Arg Trp Gly Gln Asp Val Ser Lys His Gln Ile Glu Tyr Ser Thr65 70 75 80Ser Ala Ser Lys Gly Lys Ile Gly Val Ser Gly Leu Arg Arg Pro Ser85 90 95Thr Ala Pro Ala Arg Glu Thr Pro Asn Ala Gly Asp Ile Lys Thr Ser100 105 110Gly Lys Pro Ile Phe Ser Ala Glu Gly Tyr Ala Ile Gln Glu Thr Lys115 120 125Phe Leu Lys Ile Glu Glu Leu Asp Leu Asp Phe His Asn Glu Pro Thr130 135 140Leu Lys Phe Pro Lys Pro Gly Trp Val Glu Cys His Pro Gln Lys Leu145 150 155 160Leu Val Asn Val Val Gln Cys Leu Ala Ser Ser Leu Leu Ser Leu Gln165 170 175Thr Ile Asn Ser Glu Arg Val Ala Asn Gly Leu Pro Pro Tyr Lys Val180 185 190Ile Cys Met Gly Ile Ala Asn Met Arg Glu Thr Thr Ile Leu Trp Ser195 200 205Arg Arg Thr Gly Lys Pro Ile Val Asn Tyr Gly Ile Val Trp Asn Asp210 215 220Thr Arg Thr Ile Lys Ile Val Arg Asp Lys Trp Gln Asn Thr Ser Val225 230 235 240Asp Arg Gln Leu Gln Leu Arg Gln Lys Thr Gly Leu Pro Leu Leu Ser245 250 255Thr Tyr Phe Ser Cys Ser Lys Leu Arg Trp Phe Leu Asp Asn Glu Pro260 265 270Leu Cys Thr Lys Ala Tyr Glu Glu Asn Asp Leu Met Phe Gly Thr Val275 280 285Asp Thr Trp Leu Ile Tyr Gln Leu Thr Lys Gln Lys Ala Phe Val Ser290 295 300Asp Val Thr Asn Ala Ser Arg Thr Gly Phe Met Asn Leu Ser Thr Leu305 310 315 320Lys Tyr Asp Asn Glu Leu Leu Glu Phe Trp Gly Ile Asp Lys Asn Leu325 330 335Ile His Met Pro Glu Ile Val Ser Ser Ser Gln Tyr Tyr Gly Asp Phe340 345 350Gly Ile Pro Asp Trp Ile Met Glu Lys Leu His Asp Ser Pro Lys Thr355 360 365Val Leu Arg Asp Leu Val Lys Arg Asn Leu Pro Ile Gln Gly Cys Leu370 375 380Gly Asp Gln Ser Ala Ser Met Val Gly Gln Leu Ala Tyr Lys Pro Gly385 390 395400Ala Ala Lys Cys Thr Tyr Gly Thr Gly Cys Phe Leu Leu Tyr Asn Thr405 410 415Gly Thr Lys Lys Leu Ile Ser Gln His Gly Ala Leu Thr Thr Leu Ala420 425 430Phe Trp Phe Pro His Leu Gln Glu Tyr Gly Gly Gln Lys Pro Glu Leu435 440 445Ser Lys Pro His Phe Ala Leu Glu Gly Ser Val Ala Val Ala Gly Ala450 455 460Val Val Gln Trp Leu Arg Asp Asn Leu Arg Leu Ile Asp Lys Ser Glu465 470 475 480Asp Val Gly Pro Ile Ala Set Thr Val Pro Asp Ser Gly Gly Val Val485 490 495Phe Val Pro Ala Phe Ser Gly Leu Phe Ala Pro Tyr Trp Asp Pro Asp500 505 510Ala Arg Ala Thr Ile Met Gly Met Ser Gln Phe Thr Thr Ala Ser His515 520 525Ile Ala Arg Ala Ala Val Glu Gly Val Cys Phe Gln Ala Arg Ala Ile530 535 540Leu Lys Ala Met Ser Ser Asp Ala Phe Gly Glu Gly Ser Lys Asp Arg545 550 555 560Asp Phe Leu Glu Glu Ile Ser Asp Val Thr Tyr Glu Lys Ser Pro Leu565 570 575Ser Val Leu Ala Val Asp Gly Gly Met Ser Arg Ser Asn Glu Val Met580 585 590Gln Ile Gln Ala Asp Ile Leu Gly Pro Cys Val Lys Val Arg Arg Ser595 600 605Pro Thr Ala Glu Cys Thr Ala Leu Gly Ala Ala Ile Ala Ala Ash Met610 615 620Ala Phe Lys Asp Val Asn Glu Arg Pro Leu Trp Lys Asp Leu His Asp625 630 635 640Val Lys Lys Trp Val Phe Tyr Asn Gly Met Glu Lys Asn Glu Gln Ile645 650 655Ser Pro Glu Ala His Pro Asn Leu Lys Ile Phe Arg Ser Glu Ser Asp660 665 670Asp Ala Glu Arg Arg Lys His Trp Lys Tyr Trp Glu Val Ala Val Glu675 680 685Arg Ser Lys Gly Trp Leu Lys Asp Ile Glu Gly Glu His Glu Gln Val690 695 700Leu Glu Asn Phe Gln705(2)SEQ ID NO19的信息(i)序列特征(A)長(zhǎng)度12145個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(vi)初始來(lái)源(A)生物PHK28-26(xi)SEQ ID NO19的序列描述GTCGACCACC ACGGTGGTGA CTTTAATGCC GCTCTCATGC AGCAGCTCGG TGGCGGTCTC60AAAATTCAGG ATGTCGCCGG TATAGTTTTT GATAATCAGC AAGACGCCTT CGCCGCCGTC 120AATTTGCATC GCGCATTCAA ACATTTTGTC CGGCGTCGGC GAGGTGAATA TTTCCCCCGG 180ACAGGCGCCG GAGAGCATGC CCTGGCCGAT ATAGCCGCAG TGCATCGGTT CATGTCCGCT 240GCCGCCGCCG GAGAGCAGGG CCACCTTGCC AGCCACCGGC GCGTCGGTGC GGGTCACATA 300CAGCGGGTCC TGATGCAGGG TCAGCTGCGG ATGGGCTTTA GCCAGCCCCT GTAATTGTTC 360ATTCAGTACA TCTTCAACAC GGTTAATCAG CTTTTTCATT ATTCAGTGCT CCGTTGGAGA 420AGGTTCGATG CCGCCTCTCT GCTGGCGGAG GCGGTCATCG CGTAGGGGTA TCGTCTGACG 480GTGGAGCGTG CCTGGCGATA TGATGATTCT GGCTGAGCGG ACGAAAAAAA GAATGCCCCG 540ACGATCGGGT TTCATTACGA AACATTGCTT CCTGATTTTG TTTCTTTATG GAACGTTTTT 600GCTGAGGATA TGGTGAAAAT GCGAGCTGGC GCGCTTTTTT TCTTCTGCCA TAAGCGGCGG 660TCAGGATAGC CGGCGAAGCG GGTGGGAAAA AATTTTTTGC TGATTTTCTG CCGACTGCGG 720GAGAAAAGGC GGTCAAACAC GGAGGATTGT AAGGGCATTA TGCGGCAAAG GAGCGGATCG 780GGATCGCAAT CCTGACAGAG ACTAGGGTTT TTTGTTCCAA TATGGAACGT AAAAAATTAA 840CCTGTGTTTC ATATCAGAAC AAAAAGGCGA AAGATTTTTT TGTTCCCTGC CGGCCCTACA 900GTGATCGCAC TGCTCCGGTA CGCTCCGTTC AGGCCGCGCT TCACTGGCCG GCGCGGATAA 960CGCCAGGGCT CATCATGTCT ACATGCGCAC TTATTTGAGG GTGAAAGGAA TGCTAAAAGT 1020TATTCAATCT CCAGCCAAAT ATCTTCAGGG TCCTGATGCT GCTGTTCTGT TCGGTCAATA 1080TGCCAAAAAC CTGGCGGAGA GCTTCTTCGT CATCGCTGAC GATTTCGTAA TGAAGCTGGC 1140GGGAGAGAAA GTGGTGAATG GCCTGCAGAG CCACGATATT CGCTGCCATG CGGAACGGTT 1200TAACGGCGAA TGCAGCCATG CGGAAATCAA CCGTCTGATG GCGATTTTGC AAAAACAGGG 1260CTGCCGCGGC GTGGTCGGGA TCGGCGGTGG TAAAACCCTC GATACCGCGA AGGCGATCGG 1320TTACTACCAG AAGCTGCCGG TGGTGGTGAT CCCGACCATC GCCTCGACCG ATGCGCCAAC 1380CAGCGCGCTG TCGGTGATCT ACACCGAAGC GGGCGAGTTT GAAGAGTATC TGATCTATCC 1440GAAAAACCCG GATATGGTGG TGATGGACAC GGCGATTATC GCCAAAGCGC CGGTACGCCT 1500GCTGGTCTCC GGCATGGGCG ATGCGCTCTC CACCTGGTTC GAGGCCAAAG CTTGCTACGA 1560TGCGCGCGCC ACCAGCATGG CCGGAGGACA GTCCACCGAG GCGGCGCTGA GCCTCGCCCG 1620CCTGTGCTAT GATACGCTGC TGGCGGAGGG CGAAAAGGCC CGTCTGGCGG CGCAGGCCGG 1680GGTAGTGACC GAAGCGCTGG AGCGCATCAT CGAGGCGAAC ACTTACCTCA GCGGCATTGG 1740CTTTGAAAGC AGTGGCCTGG CCGCTGCCCA TGCAATCCAC AACGGTTTCA CCATTCTTGA 1800AGAGTGCCAT CACCTGTATC ACGGTGAGAA AGTGGCCTTC GGTACCCTGG CGCAGCTGGT 1860GCTGCAGAAC AGCCCGATGG ACGAGATTGA AACGGTGCAG GGCTTCTGCC AGCGCGTCGG 1920CCTGCCGGTG ACGCTCGCGC AGATGGGCGT CAAAGAGGGG ATCGACGAGA AAATCGCCGC 1980GGTGGCGAAA GCTACCTGCG CGGAAGGGGA AACCATCCAT AATATGCCGT TTGCGGTGAC 2040CCCGGAGAGC GTCCATGCCG CTATCCTCAC CGCCGATCTG TTAGGCCAGC AGTGGCTGGC 2100GCGTTAATTC GCGGTGGCTA AACCGCTGGC CCAGGTCAGC GGTTTTTCTT TCTCCCCTCC 2160GGCAGTCGCT GCCGGAGGGG TTCTCTATGG TACAACGCGG AAAAGGATAT GACTGTTCAG 2220ACTCAGGATA CCGGGAAGGC GGTCTCTTCC GTCATTGCCC AGTCATGGCA CCGCTGCAGC 2280AAGTTTATGC AGCGCGAAAC CTGGCAAACG CCGCACCAGG CCCAGGGCCT GACCTTCGAC 2340TCCATCTGTC GGCGTAAAAC CGCGCTGCTC ACCATCGGCC AGGCGGCGCT GGAAGACGCC 2400TGGGAGTTTA TGGACGGCCG CCCCTGCGCG CTGTTTATTC TTGATGAGTC CGCCTGCATC 2460CTGAGCCGTT GCGGCGAGCC GCAAACCCTG GCCCAGCTGG CTGCCCTGGG ATTTCGCGAC 2520GGCAGCTATT GTGCGGAGAG CATTATCGGC ACCTGCGCGC TGTCGCTGGC CGCGATGCAG 2580GGCCAGCCGA TCAACACCGC CGGCGATCGG CATTTTAAGC AGGCGCTACA GCCATGGAGT 2640TTTTGCTCGA CGCCGGTGTT TGATAACCAC GGGCGGCTGT TCGGCTCTAT CTCGCTTTGC 2700TGTCTGGTCG AGCACCAGTC CAGCGCCGAC CTCTCCCTGA CGCTGGCCAT CGCCCGCGAG 2760GTGGGTAACT CCCTGCTTAC CGACAGCCTG CTGGCGGAAT CCAACCGTCA CCTCAATCAG 2820ATGTACGGCC TGCTGGAGAG CATGGACGAT GGGGTGATGG CGTGGAACGA ACAGGGCGTG 2880CTGCAGTTTC TCAATGTTCA GGCGGCGAGA CTGCTGCATC TTGATGCTCA GGCCAGCCAG 2940GGGAAAAATA TCGCCGATCT GGTGACCCTC CCGGCGCTGC TGCGCCGCGC CATCAAACAC 3000GCCCGCGGCC TGAATCACGT CGAAGTCACC TTTGAAAGTC AGCATCAGTT TGTCGATGCG 3060GTGATCACCT TAAAACCGAT TGTCGAGGCG CAAGGCAACA GTTTTATTCT GCTGCTGCAT 3120CCGGTGGAGC AGATGCGGCA GCTGATGACC AGCCAGCTCG GTAAAGTCAG CCACACCTTT 3180GAGCAGATGT CTGCCGACGA TCCGGAAACC CGACGCCTGA TCCACTTTGG CCGCCAGGCG 3240GCGCGCGGCG GCTTCCCGGT GCTACTGTGC GGCGAAGAGG GGGTCGGGAA AGAGCTGCTG 3300AGCCAGGCTA TTCACAATGA AAGCGAACGG GCGGGCGGCC CCTACATCTC CGTCAACTGC 3360CAGCTATATG CCGACAGCGT GCTGGGCCAG GACTTTATGG GCAGCGCCCC TACCGACGAT 3420GAAAATGGTC GCCTGAGCCG CCTTGAGCTG GCCAACGGCG GCACCCTGTT TCTGGAAAAG 3480ATCGAGTATC TGGCGCCGGA GCTGCAGTCG GCTCTGCTGC AGGTGATTAA GCAGGGCGTG 3540CTCACCCGCC TCGACGCCCG GCGCCTGATC CCGGTGGATG TGAAGGTGAT TGCCACCACC 3600ACCGTCGATC TGGCCAATCT GGTGGAACAG AACCGCTTTA GCCGCCAGCT GTACTATGCG 3660CTGCACTCCT TTGAGATCGT CATCCCGCCG CTGCGCGCCC GACGCAACAG TATTCCGTCG 3720CTGGTGCATA ACCGGTTGAA GAGCCTGGAG AAGCGTTTCT CTTCGCGACT GAAAGTGGAC 3780GATGACGCGC TGGCACAGCT GGTGGCCTAC TCGTGGCCGG GGAATGATTT TGAGCTCAAC 3840AGCGTCATTG AGAATATCGC CATCAGCAGC GACAACGGCC ACATTCGCCT GAGTAATCTG 3900CCGGAATATC TCTTTTCCGA GCGGCCGGGC GGGGATAGCG CGTCATCGCT GCTGCCGGCC 3960AGCCTGACTT TTAGCGCCAT CGAAAAGGAA GCTATTATTC ACGCCGCCCG GGTGACCAGC 4020GGGCGGGTGC AGGAGATGTC GCAGCTGCTC AATATCGGCC GCACCAGCCT GTGGCGCAAA 4080ATGAAGCAGT ACGATATTGA CGCCAGCCAG TTCAAGCGCA AGCATCAGGC CTAGTCTCTT 4140CGATTCGCGC CATGGAGAAC AGGGCATCCG ACAGGCGATT GCTGTAGCGT TTGAGCGCGT 4200CGCGCAGCGG ATGCGCGCGG TCCATGGCCG TCAGCAGGCG TTCGAGCCGA CGGGACTGGG 4260TGCGCGCCAC GTGCAGCTGG GCAGAGGCGA GATTCCTCCC CGGGATCACG AACTGTTTTA 4320ACGGGCCGCT CTCGGCCATA TTGCGGTCGA TAAGCCGCTC CAGGGCGGTG ATCTCCTCTT 4380CGCCGATCGT CTGGCTCAGG CGGGTCAGGC CCCGCGCATC GCTGGCCAGT TCAGCCCCCA 4440GCACGAACAG CGTCTGCTGA ATATGGTGCA GGCTTTCCCG CAGCCCGGCG TCGCGGGTCG 4500TGGCGTAGCA GACGCCCAGC TGGGATATCA GTTCATCGAC GGTGCCGTAG GCCTCGACGC 4560GAATATGGTC TTTCTCGATG CGGCTGCCGC CGTACAGGGC GGTGGTGCCT TTATCCCCGG 4620TGCGGGTATA GATACGATAC ATTCAGTTTC TCTCACTTAA CGGCAGGACT TTAACCAGCT 4680GCCCGGCGTT GGCGCCGAGC GTACGCAGTT GATCGTCGCT ATCGGTGACG TGTCCGGTAG 4740CCAGCGGCGC GTCCGCCGGC AGCTGGGCAT GAGTGAGGGC TATCTCGCCG GACGCGCTGA 4800GCCCGATACC CACCCGCAGG GGCGAGCTTC TGGCCGCCAG GGCGCCCAGC GCAGCGGCGT 4860CACCGCCTCC GTCATAGGTT ATGGTCTGGC AGGGGACCCC CTGCTCCTCC AGCCCCCAGC 4920ACAGCTCATT GATGGCGCCG GCATGGTGCC CGCGCGGATC GTAAAACAGG CGTACGCCTG 4980GCGGTGAAAG CGACATGACG GTCCCCTCGT TAACACTCAG AATGCCTGGC GGAAAATCGC 5040GGCAATCTCC TGCTCGTTGC CTTTACGCGG GTTCGAGAAC GCATTGCCGT CTTTTAGAGC 5100CATCTCCGCC ATGTAGGGGA AGTCGGCCTC TTTTACGCCC AGATCGCGCA GATGCTGCGG 5160AATACCGATA TCCATCGACA GACGCGTGAT AGCGGCGATG GCTTTTTCCG CCGCGTCGAG 5220AGTGGACAGT CCGGTGATAT TTTCGCCCAT CAGTTCAGCG ATATCGGCGA ATTTCTCCGG 5280GTTGGCGATC AGGTTGTAGC GCGCCACATG CGGCAGCAGG ACAGCGTTGG CCACGCCGTG 5340CGGCATGTCG TACAGGCCGC CCAGCTGGTG CGCCATGGCG TGCACGTAGC CGAGGTTGGC 5400GTTATTGAAA GCCATCCCGG CCAGCAGAGA AGCATAGGCC ATGTTTTCCC GCGCCTGCAG 5460ATTGCTGCCG AGGGCCACGG CCTGGCGCAG GTTGCGGGCG ATGAGGCGGA TCGCCTGCAT 5520GGCGGCGGCG TCCGTCACCG GGTTAGCGTC TTTGGAGATA TAGGCCTCTA CGGCGTGGGT 5580CAGGGCATCC ATCCCGGTCG CCGCGGTCAG GGCGGCCGGT TTACCGATCA TCAGCAGTGG 5640ATCGTTGATA GAGACCGACG GCAGTTTGCG CCAGCTGACG ATCACAAACT TCACTTTGGT 5700TTCGGTGTTG GTCAGGACGC AGTGGCGGGT GACCTCGCTG GCGGTGCCGG CGGTGGTATT 5760GACCGCGACG ATAGGCGGCA GCGGGTTGGT CAGGGTCTCG ATTCCGGCAT ACTGGTACAG 5820ATCGCCCTCA TGGGTGGCGG CGATGCCGAT GCCTTTGCCG CAATCGTGCG GGCTGCCGCC 5880GCCCACGGTG ACGATGATGT CGCACTGTTC GCGGCGAAAC ACGGCGAGGC CGTCGCGCAC 5940GTTGGTGTCT TTCGGGTTCG GCTCGACGCC GTCAAAGATC GCCACCTCGA TCCCGGCCTC 6000CCGCAGATAA TGCAGGGTTT TGTCCACCGC GCCATCTTTA ATTGCCCGCA GGCCTTTGTC 6060GGTGACCAGC AGGGCTTTTT TCCCCCCCAG CAGCTGGCAG CGTTCGCCGA CTACGGAAAT 6120GGCGTTGGGG CCAAAAAAGT TAACGTTTGG CACCAGATAA TCAAACATAC GATAGCTCAT 6180AATATACCTT CTCGCTTCAG GTTATAATGC GGAAAAACAA TCCAGGGCGC ACTGGGCTAA 6240TAATTGATCC TGCTCGACCG TACCGCCGCT AACGCCGACG GCGCCAATTA CCTGCTCATT 6300AAAAATAACT GGCAGGCCGC CGCCAAAAAT AATAATTCGC TGTTGGTTGG TTAGCTGCAG 6360ACCGTACAGA GATTGTCCTG GCTGGACCGC TGACGTAATT TCATGGGTAC CTTGCTTCAG 6420GCTGCAGGCG CTCCAGGCTT TATTCAGGGA AATATCGCAG CTGGAGACGA AGGCCTCGTC 6480CATCCGCTGG ATAAGCAGCG TGTTGCCTCC GCGGTCAACT ACGGAAAACA CCACCGCCAC 6540GTTGATCTCA GTGGCTTTTT TTTCCACCGC CGCCGCCATT TGCTGGGCGG CGGCCAGGGT 6600GATTGTCTGA ACTTGTTGGC TCTTGTTCAT CATTCTCTCC CGCACCAGGA TAACGCTGGC 6660GCGAATAGTC AGTAGGGGGC GATAGTAAAA AACTATTACC ATTCGGTTGG CTTGCTTTAT 6720TTTTGTCAGC GTTATTTTGT CGCCCGCCAT GATTTAGTCA ATAGGGTTAA AATAGCGTCG 6780GAAAAACGTA ATTAAGGGCG TTTTTTATTA ATTGATTTAT ATCATTGCGG GCGATCACAT 6840TTTTTATTTT TGCCGCCGGA GTAAAGTTTC ATAGTGAAAC TGTCGGTAGA TTTCGTGTGC 6900CAAATTGAAA CGAAATTAAA TTTATTTTTT TCACCACTGG CTCATTTAAA GTTCCGCTAT 6960TGCCGGTAAT GGCCGGGCGG CAACGACGCT GGCCCGGCGT ATTCGCTACC GTCTGCGGAT 7020TTCACCTTTT GAGCCGATGA ACAATGAAAA GATCAAAACG ATTTGCAGTA CTGGCCCAGC 7080GCCCCGTCAA TCAGGACGGG CTGATTGGCG AGTGGCCTGA AGAGGGGCTG ATCGCCATGG 7140ACAGCCCCTT TGACCCGGTC TCTTCAGTAA AAGTGGACAA CGGTCTGATC GTCGAACTGG 7200ACGGCAAACG CCGGGACCAG TTTGACATGA TCGACCGATT TATCGCCGAT TACGCGATCA 7260ACGTTGAGCG CACAGAGCAG GCAATGCGCC TGGAGGCGGT GGAAATAGCC CGTATGCTGG 7320TGGATATTCA CGTCAGCCGG GAGGAGATCA TTGCCATCAC TACCGCCATC ACGCCGGCCA 7380AAGCGGTCGA GGTGATGGCG CAGATGAACG TGGTGGAGAT GATGATGGCG CTGCAGAAGA 7440TGCGTGCCCG CCGGACCCCC TCCAACCAGT GCCACGTCAC CAATCTCAAA GATAATCCGG 7500TGCAGATTGC CGCTGACGCC GCCGAGGCCG GGATCCGCGG CTTCTCAGAA CAGGAGACCA 7560CGGTCGGTAT CGCGCGCTAC GCGCCGTTTA ACGCCCTGGC GCTGTTGGTC GGTTCGCAGT 7620GCGGCCGCCC CGGCGTGTTG ACGCAGTGCT CGGTGGAAGA GGCCACCGAG CTGGAGCTGG 7680GCATGCGTGG CTTAACCAGC TACGCCGAGA CGGTGTCGGT CTACGGCACC GAAGCGGTAT 7740TTACCGACGG CGATGATACG CCGTGGTCAA AGGCGTTCCT CGCCTCGGCC TACGCCTCCC 7800GCGGGTTGAA AATGCGCTAC ACCTCCGGCA CCGGATCCGA AGCGCTGATG GGCTATTCGG 7860AGAGCAAGTC GATGCTCTAC CTCGAATCGC GCTGCATCTT CATTACTAAA GGCGCCGGGG 7920TTCAGGGACT GCAAAACGGC GCGGTGAGCT GTATCGGCAT GACCGGCGCT GTGCCGTCGG 7980GCATTCGGGC GGTGCTGGCG GAAAACCTGA TCGCCTCTAT GCTCGACCTC GAAGTGGCGT 8040CCGCCAACGA CCAGACTTTC TCCCACTCGG ATATTCGCCG CACCGCGCGC ACCCTGATGC 8100AGATGCTGCC GGGCACCGAC TTTATTTTCT CCGGCTACAG CGCGGTGCCG AACTACGACA 8160ACATGTTCGC CGGCTCGAAC TTCGATGCGG AAGATTTTGA TGATTACAAC ATCCTGCAGC 8220GTGACCTGAT GGTTGACGGC GGCCTGCGTC CGGTGACCGA GGCGGAAACC ATTGCCATTC 8280GCCAGAAAGC GGCGCGGGCG ATCCAGGCGG TTTTCCGCGA GCTGGGGCTG CCGCCAATCG 8340CCGACGAGGA GGTGGAGGCC GCCACCTACG CGCACGGCAG CAACGAGATG CCGCCGCGTA 8400ACGTGGTGGA GGATCTGAGT GCGGTGGAAG AGATGATGAA GCGCAACATC ACCGGCCTCG 8460ATATTGTCGG CGCGCTGAGC CGCAGCGGCT TTGAGGATAT CGCCAGCAAT ATTCTCAATA 8520TGCTGCGCCA GCGGGTCACC GGCGATTACC TGCAGACCTC GGCCATTCTC GATCGGCAGT 8580TCGAGGTGGT GAGTGCGGTC AACGACATCA ATGACTATCA GGGGCCGGGC ACCGGCTATC 8640GCATCTCTGC CGAACGCTGG GCGGAGATCA AAAATATTCC GGGCGTGGTT CAGCCCGACA 8700CCATTGAATA AGGCGGTATT CCTGTGCAAC AGACAACCCA AATTCAGCCC TCTTTTACCC 8760TGAAAACCCG CGAGGGCGGG GTAGCTTCTG CCGATGAACG CGCCGATGAA GTGGTGATCG 8820GCGTCGGCCC TGCCTTCGAT AAACACCAGC ATCACACTCT GATCGATATG CCCCATGGCG 8880CGATCCTCAA AGAGCTGATT GCCGGGGTGG AAGAAGAGGG GCTTCACGCC CGGGTGGTGC 8940GCATTCTGCG CACGTCCGAC GTCTCCTTTA TGGCCTGGGA TGCGGCCAAC CTGAGCGGCT 9000CGGGGATCGG CATCGGTATC CAGTCGAAGG GGACCACGGT CATCCATCAG CGCGATCTGC 9060TGCCGCTCAG CAACCTGGAG CTGTTCTCCC AGGCGCCGCT GCTGACGCTG GAGACCTACC 9120GGCAGATTGG CAAAAACGCT GCGCGCTATG CGCGCAAAGA GTCACCTTCG CCGGTGCCGG 9180TGGTGAACGA TCAGATGGTG CGGCCGAAAT TTATGGCCAA AGCCGCGCTA TTTCATATCA 9240AAGAGACCAA ACATGTGGTG CAGGACGCCG AGCCCGTCAC CCTGCACATC GACTTAGTAA 9300GGGAGTGACC ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG 9360CCCGGAGCAT ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT 9420GCTCTCTGGC GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA 9480GGCGCAGATT GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC 9540GGAGCTTATC GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT 9600CCGCTCCTCG CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC 9660GACAGTGAAT GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT 9720GCGTAAAGGA AGCTAAGCGG AGGTCAGCAT GCCGTTAATA GCCGGGATTG ATATCGGCAA 9780CGCCACCACC GAGGTGGCGC TGGCGTCCGA CTACCCGCAG GCGAGGGCGT TTGTTGCCAG 9840CGGGATCGTC GCGACGACGG GCATGAAAGG GACGCGGGAC AATATCGCCG GGACCCTCGC 9900CGCGCTGGAG CAGGCCCTGG CGAAAACACC GTGGTCGATG AGCGATGTCT CTCGCATCTA 9960TCTTAACGAA GCCGCGCCGG TGATTGGCGA TGTGGCGATG GAGACCATCA CCGAGACCAT10020TATCACCGAA TCGACCATGA TCGGTCATAA CCCGCAGACG CCGGGCGGGG TGGGCGTTGG10080CGTGGGGACG ACTATCGCCC TCGGGCGGCT GGCGACGCTG CCGGCGGCGC AGTATGCCGA10140GGGGTGGATC GTACTGATTG ACGACGCCGT CGATTTCCTT GACGCCGTGT GGTGGCTCAA10200TGAGGCGCTC GACCGGGGGA TCAACGTGGT GGCGGCGATC CTCAAAAAGG ACGACGGCGT10260GCTGGTGAAC AACCGCCTGC GTAAAACCCT GCCGGTGGTG GATGAAGTGA CGCTGCTGGA10320GCAGGTCCCC GAGGGGGTAA TGGCGGCGGT GGAAGTGGCC GCGCCGGGCC AGGTGGTGCG10380GATCCTGTCG AATCCCTACG GGATCGCCAC CTTCTTCGGG CTAAGCCCGG AAGAGACCCA10440GGCCATCGTC CCCATCGCCC GCGCCCTGAT TGGCAACCGT TCCGCGGTGG TGCTCAAGAC10500CCCGCAGGGG GATGTGCAGT CGCGGGTGAT CCCGGCGGGC AACCTCTACA TTAGCGGCGA10560AAAGCGCCGC GGAGAGGCCG ATGTCGCCGA GGGCGCGGAA GCCATCATGC AGGCGATGAG10620CGCCTGCGCT CCGGTACGCG ACATCCGCGG CGAACCGGGC ACCCACGCCG GCGGCATGCT10680TGAGCGGGTG CGCAAGGTAA TGGCGTCCCT GACCGGCCAT GAGATGAGCG CGATATACAT10740CCAGGATCTG CTGGCGGTGG ATACGTTTAT TCCGCGCAAG GTGCAGGGCG GGATGGCCGG10800CGAGTGCGCC ATGGAGAATG CCGTCGGGAT GGCGGCGATG GTGAAAGCGG ATCGTCTGCA10860AATGCAGGTT ATCGCCCGCG AACTGAGCGC CCGACTGCAG ACCGAGGTGG TGGTGGGCGG10920CGTGGAGGCC AACATGGCCA TCGCCGGGGC GTTAACCACT CCCGGCTGTG CGGCGCCGCT10980GGCGATCCTC GACCTCGGCG CCGGCTCGAC GGATGCGGCG ATCGTCAACG CGGAGGGGCA11040GATAACGGCG GTCCATCTCG CCGGGGCGGG GAATATGGTC AGCCTGTTGA TTAAAACCGA 11100GCTGGGCCTC GAGGATCTTT CGCTGGCGGA AGCGATAAAA AAATACCCGC TGGCCAAAGT 11160GGAAAGCCTG TTCAGTATTC GTCACGAGAA TGGCGCGGTG GAGTTCTTTC GGGAAGCCCT 11220CAGCCCGGCG GTGTTCGCCA AAGTGGTGTA CATCAAGGAG GGCGAACTGG TGCCGATCGA 11280TAACGCCAGC CCGCTGGAAA AAATTCGTCT CGTGCGCCGG CAGGCGAAAG AGAAAGTGTT 11340TGTCACCAAC TGCCTGCGCG CGCTGCGCCA GGTCTCACCC GGCGGTTCCA TTCGCGATAT 11400CGCCTTTGTG GTGCTGGTGG GCGGCTCATC GCTGGACTTT GAGATCCCGC AGCTTATCAC 11460GGAAGCCTTG TCGCACTATG GCGTGGTCGC CGGGCAGGGC AATATTCGGG GAACAGAAGG 11520GCCGCGCAAT GCGGTCGCCA CCGGGCTGCT ACTGGCCGGT CAGGCGAATT AAACGGGCGC 11580TCGCGCCAGC CTCTCTCTTT AACGTGCTAT TTCAGGATGC CGATAATGAA CCAGACTTCT 11640ACCTTAACCG GGCAGTGCGT GGCCGAGTTT CTTGGCACCG GATTGCTCAT TTTCTTCGGC 11700GCGGGCTGCG TCGCTGCGCT GCGGGTCGCC GGGGCCAGCT TTGGTCAGTG GGAGATCAGT 11760ATTATCTGGG GCCTTGGCGT CGCCATGGCC ATCTACCTGA CGGCCGGTGT CTCCGGCGCG 11820CACCTAAATC CGGCGGTGAC CATTGCCCTG TGGCTGTTCG CCTGTTTTGA ACGCCGCAAG 11880GTGCTGCCGT TTATTGTTGC CCAGACGGCC GGGGCCTTCT GCGCCGCCGC GCTGGTGTAT 11940GGGCTCTATC GCCAGCTGTT TCTCGATCTT GAACAGAGTC AGCATATCGT GCGCGGCACT 12000GCCGCCAGTC TTAACCTGGC CGGGGTCTTT TCCACGTACC CGCATCCACA TATCACTTTT 12060ATACAAGCGT TTGCCGTGGA GACCACCATC ACGGCAATCC TGATGGCGAT GATCATGGCC 12120CTGACCGACG ACGGCAACGG AATTC 12145(2)SEQ ID NO20的信息(i)序列特征(A)長(zhǎng)度94個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO20的序列描述AGCTTAGGAG TCTAGAATAT TGAGCTCGAA TTCCCGGGCA TGCGGTACCG GATCCAGAAA60AAAGCCCGCA CCTGACAGTG CGGGCTTTTT TTTT94(2)SEQ ID NO21的信息(i)序列特征(A)長(zhǎng)度37個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO21的序列描述GGAATTCAGA TCTCAGCAAT GAGCGAGAAA ACCATGC 37(2)SEQ ID NO22的信息(i)序列特征(A)長(zhǎng)度27個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO22的序列描述GCTCTAGATT AGCTTCCTTT ACGCAGC 27(2)SEQ ID NO23的信息(i)序列特征(A)長(zhǎng)度33個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO23的序列描述GGCCAAGCTT AAGGAGGTTA ATTAAATGAA AAG33(2)SEQ ID NO24的信息(i)序列特征(A)長(zhǎng)度26個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO24的序列描述GCTCTAGATT ATTCAATGGT GTCGGG26(2)SEQ ID NO25的信息(i)序列特征(A)長(zhǎng)度42個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO25的序列描述GCGCCGTCTA GAATTATGAG CTATCGTATG TTTGATTATC TG42(2)SEQ ID NO26的信息(i)序列特征(A)長(zhǎng)度36個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO26的序列描述TCTGATACGG GATCCTCAGA ATGCCTGGCG GAAAAT 36(2)SEQ ID NO27的信息(i)序列特征(A)長(zhǎng)度51個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO27的序列描述GCGCGGATCC AGGAGTCTAG AATTATGGGA TTGACTACTA AACCTCTATCT 51(2)SEQ ID NO28的信息(i)序列特征(A)長(zhǎng)度36個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈
(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO28的序列描述GATACGCCCG GGTTACCATT TCAACAGATC GTCCTT36(2)SEQ ID NO29的信息(i)序列特征(A)長(zhǎng)度18個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO29的序列描述TCGACGAATT CAGGAGGA 18(2)SEQ ID NO30的信息(i)序列特征(A)長(zhǎng)度18個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO30的序列描述CTAGTCCTCC TGAATTCG 18(2)SEQ ID NO31的信息(i)序列特征(A)長(zhǎng)度19個(gè)堿基對(duì)(B)類型核酸
(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO31的序列描述CTAGTAAGGA GGACAATTC 19(2)SEQ ID NO32的信息(i)序列特征(A)長(zhǎng)度19個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO32的序列描述CATGGAATTG TCCTCCTTA 19(2)SEQ ID NO33的信息(i)序列特征(A)長(zhǎng)度271個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物GPP1(xi)SEQ ID NO33的序列描述Met Lys Arg Phe Asn Val Leu Lys 5yr Ile Arg Thr Thr Lys Ala Asn1 5 10 15Ile Gln Thr Ile Ala Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys
20 25 30Ile Asn Ala Ala Leu Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln35 40 45Pro Ala Ile Ala Ala Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr50 55 60Phe Asp Ala Glu His Val Ile His Ile Ser His Gly Trp Arg Thr Tyr65 70 75 80Asp Ala Ile Ala Lys Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val85 90 95Asn Lys Leu Glu Gly Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile100 105 110Glu Val Pro Gly Ala Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro115 120 125Lys Glu Lys Trp Ala Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys130 135 140Lys Trp Phe Asp Lle Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr145150 155 160Ala Asn Asp Val Lys Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys165 170 175Gly Arg Asn Gly Leu Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser LyslB0 185 190Ser Lys Val Val Val Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly195 200 205Lys Ala Ala Gly Cys Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu210 215 220Asp Phe Leu Lys Glu Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu225 230 235 240Ser Ile Arg Val Gly Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu245 250 255Ile Phe Asp Asp Tyr Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp260 265 270(2)SEQ ID NO34的信息(i)序列特征(A)長(zhǎng)度555個(gè)氨基酸
(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi初始來(lái)源(A)生物DHAB1(xi) SEQ ID NO34的序列描述Met Lys Arg Ser Lys Arg Phe Ala Val Leu A la Gln ArgPro Val Asn1 5 10 15Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Sly Leu Ile Ala Met20 25 30Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gty Leu35 40 45Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp50 55 60Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Aig Thr Glu Gln Ala65 70 75 80Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His85 90 95Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala100 105 110Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met115 120 125Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His130 135 140Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala145 150 155 160Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile165 170 175Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln180 185 190Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr195 200 205Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val210 215 220Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro225230 235240Trp Ser Lys Ala Phe Leu Ala Ser Als Tyr Ala Ser Arg Gly Leu Lys245 250 255Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser260 265 270Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr275 280 285Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile290 295 300Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu305 310 315 320Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp325 330 335Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met340 345 350Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val355 360 365Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp370 375 380Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly385 390 395 400Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala405 410 415Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile420 425 430Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu435 440 445Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met450 455 460Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg465 470 475 480Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln485 490 495Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln500 505 510Phe Glu val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro515 520 525Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn530 535 540Ile Pro Gly Val Val Gln Pro Asp Thr Ile Glu545 550 555(2)SEQ ID NO35的信息(i)序列特征(A)長(zhǎng)度194個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物DHAB2(xi)SEQ ID NO35的序列描述Met Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg1 5 10 15Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile20 25 30Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp35 40 45Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu50 55 60Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val65 70 75 80Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly85 90 95Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leul00 105 ll0Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ata Pro 5eu Leu Thr115 120 125Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg130 135 140Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Argl45 l50 155 160Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Slu Thr Lys165 170 175His Val Val Gln Asp Ala Slu Pro Val Thr Leu His Ile Asp Leu Val180 185 190Arg Glu(2)SEQ ID NO36的信息(i)序列特征(A)長(zhǎng)度140個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物DHAB3(xi)SEQ ID NO36的序列描述Met Ser Glu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg1 5 10 15Cys Pro Glu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile20 25 30Thr Leu Glu Lys Val Leu Ser Gly Glu Val Gly Pro Gln Asp Val Arg35 40 45Ile Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met50 55 60Gln His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile Ala65 70 75 80Ile Pro Asp Glu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro Phe85 90 95Arg Ser Ser Gln Ala Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu His100 105 110Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala Glu115 120 125Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser130 135 140(2)SEQ ID NO37的信息(i)序列特征(A)長(zhǎng)度387個(gè)氨基酸(B)類型氨基酸(C)鏈型未知(D)拓?fù)漕愋臀粗?ii)分子類型蛋白質(zhì)(vi)初始來(lái)源(A)生物DHAT(xi)SEQ ID NO37的序列描述Met Ser Tyr Arg Met Phe Asp Tyr Leu Val Pro Asn Val Asn Phe Phe1 5 10 15Gly Pro Asn Ala Ile Ser Val Val Gly Glu Arg Cys Gln Leu Leu Gly20 25 30Gly Lys Lys Ala Leu Leu Val Thr Asp Lys Gly Leu Arg Ala Ile Lys35 40 45Asp Gly Ala Val Asp Lys Thr Leu His Tyr Leu Arg Glu Ala Gly Ile50 55 60Glu Val Ala Ile Phe Asp Gly Val Glu Pro Asn Pro Lys Asp Thr Asn65 70 75 80Val Arg Asp Gly Leu Ala Val Phe Arg Arg Glu Glu Cys Asp Ile Ile85 90 95Val Thr Val Gly Gly Gly Ser Pro His Asp Cys Gty Lys Gly Ile Gly100 105 110Ile Ala Ala Thr His Glu Gly Asp Leu Tyr Gln Tyr Ala Gly Ile Glu115 120 125Thr Leu Thr Asn Pro Leu Pro Pro Ile Val Ala Val Asn Thr Thr Ala130 135 140Gly Thr Ala Ser Glu Val Thr Arg His Cys Val Leu Thr Asn Thr Glu145 150 155 160Thr Lys Val Lys Phe Val lle Val Ser Trp Arg Lys Leu Pro Ser Va1165 170 175Ser Ile Asn Asp Pro Leu Leu Met Ile Gly Lys Pro Ala Ala Leu Thr180 185 190Ala Ala Thr Gly Met Asp Ala Leu Thr His Ala Val Glu Ala Tyr Ile195 200 205Ser Lys Asp Ala Asn Pro Val Thr Asp Ala Ala Ala Met Gln Ala Ile210 215 220Arg Leu Ile Ala Arg Asn Leu Arg Gln Ala Val Ala Leu Gly Ser Asn225 230 235 240Leu Gln Ala Arg Glu Asn Met Ala Tyr Ala Ser Leu Leu Ala Gly Met245250 255Ala Phe Asn Asn Ala Asn Leu Gly Tyr Val His Ala Met Ala His Gln260 265 270Leu Gly Gly Leu Tyr Asp Met Pro His Gly Val Ala Asn Ala Val Leu275 280285Leu Pro Mis Val Ala Arg Tyr Asn Leu Ile Ala Asn Pro Glu Lys Phe290 295 300Ala Asp Ile Ala Glu Leu Met Gly Glu Asn Ile Thr Gly Leu Ser Thr305 310 315 320Leu Asp Ala Ala Glu Lys Ala Ile Ala Ala Ile Thr Arg Leu Ser Met325 330 335Asp Ile Gly Ile Pro Gln His Leu Arg Asp Leu Gly Val Lys Glu Ala340 345 350Asp Phe Pro Tyr Met Ala Glu Met Ala Leu Lys Asp Gly Asn Ala Phe355 360 365Ser Asn Pro Arg Lys Gly Asn Glu Gln Glu Ile Ala Ala Ile Phe Arg370 375 380Gln Ala Phe385(2)SEQ ID NO38的信息(i)序列特征(A)長(zhǎng)度27個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO38的序列描述GCGAATTCAT GAGCTATCGT ATGTTTG 27(2)SEQ ID NO39的信息(i)序列特征(A)長(zhǎng)度28個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO39的序列描述GCGAATTCAG AATGCCTGGC GGAAAATC 28(2)SEQ ID NO40的信息(i)序列特征(A)長(zhǎng)度28個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO40的序列描述GGGAATTCAT GAGCGAGAAAA ACCATGCG28(2)SEQ ID NO41的信息(i)序列特征(A)長(zhǎng)度27個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO41的序列描述GCGAATTCTT AGCTTCCTTT ACGCAGC27(2)SEQ ID NO42的信息(i)序列特征(A)長(zhǎng)度30個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO42的序列描述GCGAATTCAT GCAACAGACA ACCCAAATTC 30(2)SEQ ID NO43的信息(i)序列特征(A)長(zhǎng)度25個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO43的序列描述GCGAATTCAC TCCCTTACTA AGTCG 25(2)SEQ ID NO44的信息(i)序列特征(A)長(zhǎng)度30個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO44的序列描述GGGAATTCAT GAAAAGATCA AAACGATTTG30(2)SEQ ID NO45的信息(i)序列特征(A)長(zhǎng)度29個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO45的序列描述GCGAATTCTT ATTCAATGGT GTCGGGCTG 29(2)SEQ ID NO46的信息(i)序列特征(A)長(zhǎng)度34個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO46的序列描述TTGATAATAT AACCATGGCT GCTGCTGCTG ATAG 34(2)SEQ ID NO47的信息(i)序列特征(A)長(zhǎng)度39個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO47的序列描述GTATGATATG TTATCTTGGA TCCAATAAAT CTAATCTTC39(2)SEQ ID NO48的信息(i)序列特征(A)長(zhǎng)度24個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO48的序列描述CATGACTAGT AAGGAGGACA ATTC24(2)SEQ ID NO49的信息(i)序列特征(A)長(zhǎng)度24個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)漕愋途€性(ii)分子類型DNA(基因組)(xi)SEQ ID NO49的序列描述CATGGAATTG TCCTCCTTAC TAGT2權(quán)利要求
1.一種用于從能產(chǎn)生1,3-丙二醇的生物產(chǎn)生1,3-丙二醇的改進(jìn)方法,該生物包含至少一個(gè)編碼脫水酶活性的基因,該方法包含如下步驟(a)將編碼蛋白質(zhì)X的基因引入生物體以建立經(jīng)轉(zhuǎn)化的生物;以及(b)在至少一種能在該經(jīng)轉(zhuǎn)化的宿主生物中被轉(zhuǎn)化為1,3-丙二醇的碳源存在下,以及在適合產(chǎn)生1,3-丙二醇的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的生物,其中碳源選自單糖、寡糖、多糖以及一碳底物。
2.權(quán)利要求1的方法,其還包含將至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的蛋白質(zhì)的基因引入生物體的步驟。
3.權(quán)利要求1的方法,其還包含回收1,3-丙二醇的步驟。
4.權(quán)利要求1的方法,其中編碼蛋白質(zhì)X的基因分離自甘油脫水酶基因簇。
5.權(quán)利要求1的方法,其中編碼蛋白質(zhì)X的基因分離自二醇脫水酶基因簇。
6.權(quán)利要求4的方法,其中甘油脫水酶基因簇來(lái)自選自克雷伯氏菌屬和檸檬酸桿菌屬種類的生物。
7.權(quán)利要求5的方法,其中二醇脫水酶基因簇來(lái)自選自克雷伯氏菌屬、梭狀芽孢桿菌屬和沙門氏菌屬種類的生物。
8.權(quán)利要求1的方法,其中編碼脫水酶活性的基因?qū)τ谠撋餅楫愒础?br>
9.權(quán)利要求1的方法,其中編碼脫水酶活性的基因?qū)τ谠撋餅橥础?br>
10.權(quán)利要求1的方法,其中生物選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。
11.權(quán)利要求10的方法,其中生物體選自大腸桿菌和克雷伯氏菌屬的種。
12.權(quán)利要求1的方法,其中編碼蛋白質(zhì)X的基因穩(wěn)定地維持在宿主基因組內(nèi)。
13.權(quán)利要求2的方法,其中至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的蛋白質(zhì)的基因穩(wěn)定地維持在宿主基因組內(nèi)。
14.權(quán)利要求1的方法,其中碳源是葡萄糖。
15.權(quán)利要求1的方法,其中編碼蛋白質(zhì)X的基因有如SEQ IDNO59所示的序列。
16.權(quán)利要求2的方法,其中蛋白質(zhì)1有如SEQ ID NO60或SEQID NO61所示的序列。
17.權(quán)利要求2的方法,其中蛋白質(zhì)2有如SEQ ID NO62或SEQID NO63所示的序列。
18.權(quán)利要求2的方法,其中蛋白質(zhì)3有如SEQ ID NO64或SEQID NO65所示的序列。
19.一種能從碳源產(chǎn)生1,3-丙二醇的重組微生物,該重組微生物包含a)至少一個(gè)編碼脫水酶活性的基因;b)至少一個(gè)編碼甘油-3-磷酸酶的基因;以及c)至少一個(gè)編碼蛋白質(zhì)X的基因。
20.權(quán)利要求19的重組微生物,其還包含d)至少一個(gè)編碼選自蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3的蛋白質(zhì)的基因。
21.權(quán)利要求19的重組微生物,其選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。
22.權(quán)利要求19的重組微生物,其中編碼蛋白質(zhì)X的基因分離自甘油脫水酶基因簇。
23.權(quán)利要求19的重組微生物,其中編碼蛋白質(zhì)X的基因分離自二醇脫水酶基因簇。
24.權(quán)利要求22的重組微生物,其中甘油脫水酶基因簇來(lái)自選自克雷伯氏菌屬和檸檬酸桿菌屬種類的生物。
25.權(quán)利要求23的重組微生物,其中二醇脫水酶基因簇來(lái)自選自克雷伯氏菌屬、檸檬酸桿菌屬和沙門氏菌屬種類的生物。
26.權(quán)利要求19的重組微生物,其中該脫水酶活性對(duì)于該微生物為異源。
27.權(quán)利要求19的重組微生物,其中該脫水酶活性對(duì)于該微生物為同源。
28.權(quán)利要求19的重組微生物,其中編碼蛋白質(zhì)X的基因有如SEQ ID NO59中所示的序列。
29.權(quán)利要求20的重組微生物,其中蛋白質(zhì)1有如SEQ ID NO60或SEQ ID NO61所示的序列。
30.權(quán)利要求20的方法,其中蛋白質(zhì)2有如SEQ ID NO62或SEQID NO63所示的序列。
31.權(quán)利要求20的方法,其中蛋白質(zhì)3有如SEQ ID NO64或SEQID NO65所示的序列。
32.一種用于在能產(chǎn)生1,3-丙二醇并含有至少一個(gè)編碼脫水酶活性的微生物中延長(zhǎng)脫水酶活性半壽期的方法,包括將編碼蛋白質(zhì)X的基因引入該微生物并在適合產(chǎn)生1,3-丙二醇的條件下進(jìn)行培養(yǎng)的步驟。
33.權(quán)利要求32的方法,其中編碼脫水酶活性的基因?qū)τ谠撐⑸餅楫愒础?br>
34.權(quán)利要求32的方法,其中編碼脫水酶活性的基因?qū)τ谠撐⑸餅橥础?br>
35.權(quán)利要求32的微生物,其中編碼蛋白質(zhì)X的基因分離自甘油脫水酶基因簇。
36.權(quán)利要求32的微生物,其中編碼蛋白質(zhì)X的基因分離自二醇脫水酶基因簇。
37.權(quán)利要求35的微生物,其中甘油脫水酶基因簇來(lái)自選自克雷伯氏菌屬和檸檬酸桿菌屬種類的生物。
38.權(quán)利要求34的微生物,其中二醇脫水酶基因簇來(lái)自選自克雷伯氏菌屬、芽孢桿菌屬和沙門氏菌屬種類的生物。
39.權(quán)利要求32的方法,其中微生物選自檸檬酸桿菌屬,腸桿菌屬,梭狀芽孢桿菌屬,克雷伯氏菌屬,氣桿菌屬,乳桿菌屬,曲霉屬,酵母屬,裂殖酵母屬,接合酵母屬,畢氏酵母屬,克魯維酵母屬,假絲酵母屬,漢遜酵母屬,德巴利酵母屬,毛霉屬,球擬酵母屬,甲基細(xì)菌屬,埃希氏菌屬,沙門氏菌屬,芽孢桿菌屬,鏈霉菌屬和假單胞菌屬。
40.權(quán)利要求32的方法,其還包含將編碼蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中至少一種的基因引入該微生物的步驟。
全文摘要
本發(fā)明提供了一種用于生物中從多種碳源生產(chǎn)1,3-丙二醇的改進(jìn)方法,包括含有編碼脫水酶蛋白質(zhì)X的DNA或者編碼蛋白質(zhì)X以及蛋白質(zhì)1、蛋白質(zhì)2和蛋白質(zhì)3中至少一種的DNA的生物。蛋白質(zhì)X可分離自二醇脫水酶或甘油脫水酶。本發(fā)明還提供了含有能夠提高1,3-丙二醇產(chǎn)量的蛋白質(zhì)X的宿主細(xì)胞。
文檔編號(hào)C12N9/16GK1239511SQ97180074
公開(kāi)日1999年12月22日 申請(qǐng)日期1997年11月13日 優(yōu)先權(quán)日1996年11月13日
發(fā)明者N·S·杜恩-科萊曼, M·狄茨-托里斯, M·W·查瑟, D·特里布爾 申請(qǐng)人:金克克國(guó)際有限公司