專利名稱::具有c4-二羧酸轉(zhuǎn)運蛋白活性的多肽和編碼該多肽的多核苷酸的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽和編碼所述多肽的多核苷酸。本發(fā)明亦涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及產(chǎn)生和使用所述多肽的方法,和產(chǎn)生C4-二羧酸如蘋果酸的方法。
背景技術(shù):
:有機酸在多種工業(yè)中具有悠久歷史的商業(yè)使用。舉例而言,有機酸用于食品和飼料工業(yè)(檸檬酸、抗壞血酸、乳酸、乙酸和葡糖酸),作為用于產(chǎn)生多種聚合物的單體(己二酸、乳酸、丙烯酸和衣康酸),作為金屬螯合劑(葡糖酸)和作為“綠色”溶劑(乙酸)(Sauer等,2008,TrendsinBiotechnology26:100-108)。有機酸自身可為商業(yè)產(chǎn)品或其可為用于制造其他化學(xué)品的化學(xué)構(gòu)件(buildingblock)。除了專門用途之外,長久以來公認(rèn)C4-二羧酸亦可充當(dāng)構(gòu)件化合物以供產(chǎn)生大體積的工業(yè)化學(xué)品,如1,4-丁二醇,四氫呋喃和Y-丁內(nèi)酯。由于石油衍生構(gòu)件的高成本,通過傳統(tǒng)石油化學(xué)途徑產(chǎn)生這些大體積工業(yè)化學(xué)品的成本顯著增加。有機酸在商業(yè)上是通過從石油衍生原料的化學(xué)合成(例如,延胡索酸、蘋果酸、丙烯酸和己二酸)或通過微生物發(fā)酵(例如檸檬酸、乳酸、葡糖酸和衣康酸)產(chǎn)生的。一些有機酸如延胡索酸和蘋果酸亦可通過微生物發(fā)酵來產(chǎn)生,但由于更低的生產(chǎn)成本,目前在商業(yè)上仍通過化學(xué)合成從石油化學(xué)原料產(chǎn)生。然而,石油衍生構(gòu)件化學(xué)品的成本的日益升高,地緣政治的不穩(wěn)定性對原油價格的影響,以及對實施利用來源于可再生資源的原料的制造工藝的期望,刺激了通過微生物發(fā)酵產(chǎn)生有機酸和其他化學(xué)品中的重建的興趣。雖然現(xiàn)在通過化學(xué)合成從石油化學(xué)原料商業(yè)性產(chǎn)生蘋果酸,其亦可通過微生物發(fā)酵產(chǎn)生。蘋果酸已在基因工程改造的酵母(釀酒酵母(Saccharomycescerevisia))(Zelle等,2008,Appl.Environ.Microbiol.74:2766-2777)和天然存在的絲狀真菌如曲霉屬菌種(Aspergillusspp.)(美國專利號3,063,910;Bercovitz等,1990,Appl.Environ.Microbiol.56:1594-1597)中以高水平產(chǎn)生。Abe等(美國專利號3,063,910)和Bercovitz等(1990,Appl.Environ.Microbiol.56:1594-1597)報道了在幾種曲霉屬菌種中高水平的蘋果酸產(chǎn)生。而且,Battat等(1991,Biotechnol.Bioengineering,37:1108-1116)報道了在優(yōu)化條件下在攪拌的發(fā)酵罐中由黃曲霉(Aspergillusflavus)產(chǎn)生了高至113g/L的蘋果酸。在W02010/003728中描述了在酵母中通過微生物發(fā)酵產(chǎn)生二羧酸。亦在W02009/011974和W02009/155382中描述了通過微生物發(fā)酵產(chǎn)生蘋果酸。通過對曲霉屬(Aspergillus)進行遺傳工程改造改善蘋果酸產(chǎn)生會使得能夠通過發(fā)酵經(jīng)濟地商業(yè)性生產(chǎn)蘋果酸。曲霉屬菌種(Aspergillusspp.)中的蘋果酸過量產(chǎn)生在特定的培養(yǎng)條件(有氧條件和高C:N比;碳酸鈣亦作為中和劑和作為用于蘋果酸生物合成的CO2源添加)下發(fā)生。在這些條件下,通過胞質(zhì)溶膠的、還原性三羧酸(TCA)循環(huán)的溢出代謝(overflowmetabolism)導(dǎo)致增加的蘋果酸生物合成和分泌入培養(yǎng)基。已在釀酒酵母中報道了通過使用遺傳工程增加丙酮酸羧化酶(Bauer等,1999,F(xiàn)EMSMicrobiolLett.179:107-113)或蘋果酸脫氫酶(Pines等,1997,Appl.Microbiol.Biotechnol.48:248-255)的水平和增加蘋果酸轉(zhuǎn)運蛋白的表達(Zelle等,2008,見上)而增加蘋果酸產(chǎn)生?;谏锘瘜W(xué)證據(jù),提出了在黃曲霉菌株ATCC13697中,蘋果酸脫氫酶活性限制蘋果酸產(chǎn)生(Peleg等,1988,Appl.Microbiol.Biotechnol.28:69-75)。2010年8月27日提交、題為“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申請?zhí)朠CT/US10/47002(其內(nèi)容通過提述以其整體并入本文)描述了絲狀真菌中的蘋果酸產(chǎn)生。在本領(lǐng)域中,在曲霉屬中作為使用重組DNA技術(shù)的遺傳工程改造的結(jié)果而改善C4-二羧酸產(chǎn)生如蘋果酸產(chǎn)生會是有益的。本發(fā)明提供了具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽,編碼所述多肽的多核苷酸,和用于改善C4-二羧酸產(chǎn)生(例如蘋果酸產(chǎn)生)的方法坐寸ο
發(fā)明內(nèi)容本發(fā)明涉及具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽選自:(a)多肽,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%序列同一'丨生;(b)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,或其成熟多肽編碼序列,或前述序列的全長互補鏈在低嚴(yán)格條件下雜交;(c)多肽,其由多核苷酸編碼,所述`多核苷酸與SEQIDNO:1、3或5,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。本發(fā)明亦涉及產(chǎn)生C4-二羧酸(例如蘋果酸)的方法。在一個方面,該方法包括:(a)培養(yǎng)宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞),所述宿主細(xì)胞包含編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸;和(b)回收所述C4-二羧酸(例如蘋果酸)。在另一個方面,該方法包括(a)將編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸轉(zhuǎn)化入宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞);(b)在培養(yǎng)基中培養(yǎng)經(jīng)轉(zhuǎn)化的生物;和(c)回收所述C4-二羧酸(例如蘋果酸)。在所述方法的一些方面,所述宿主細(xì)胞進一步包含編碼蘋果酸脫氫酶和/或丙酮酸羧化酶的異源多核苷酸。本發(fā)明還涉及宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞,如米曲霉(AspergiIIusoryzae)),所述宿主細(xì)胞包含本文中所述的編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸,其中所述宿主細(xì)胞分泌和/或能夠分泌增加水平的C4-二羧酸(例如蘋果酸)。在一些方面,所述宿主細(xì)胞進一步包含編碼蘋果酸脫氫酶和/或丙酮酸羧化酶的異源多核苷酸。本發(fā)明亦涉及信號肽和編碼該信號肽的多核苷酸。在一個方面,本發(fā)明涉及多核苷酸,其編碼可操作地連接于編碼蛋白的基因的信號肽,所述信號肽包含或組成為(consistingof)SEQIDNO:2的氨基酸I至61或I至68。在另一個方面,本發(fā)明涉及多核苷酸,其編碼可操作地連接于編碼蛋白的基因的信號肽,所述信號肽包含或組成為SEQIDN0:4的氨基酸I至17。在另一個方面,本發(fā)明涉及多核苷酸,其編碼可操作地連接于編碼蛋白的基因的信號肽,所述信號肽包含或組成為SEQIDN0:6的氨基酸I至68。本發(fā)明亦涉及包含本文中所述的多肽的組合物,編碼所述多肽的分離的多核苷酸,包含所述多核苷酸的核酸構(gòu)建體、表達載體、重組宿主細(xì)胞,和產(chǎn)生所述多肽的方法。圖1顯示pShTh60的限制圖譜。圖2顯示pSaMF35的限制圖譜。圖3顯不棘抱曲霉(Aspergillusaculeatus)C4_二羧酸轉(zhuǎn)運蛋白基因(c4t737)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:1和2)。圖4顯示pSaMF36的限制圖譜。圖5顯示棘孢曲霉C4-二羧酸轉(zhuǎn)運蛋白基因(c4t521)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:3和4)。圖6顯不米曲霉(Aspergillusoryzae)NRRL3488蘋果酸脫氫酶基因(mdh3)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:11和12)。圖7顯示pSaMF21的限制圖譜。圖8A和8B—同顯示了米曲霉NRRL3488丙酮酸羧化酶(pyc)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:15和16)。圖9顯示pRYANl的限制圖譜。圖10顯示pAaMAT737的限制圖譜。圖11顯示pSaMF38的限制圖譜。圖12顯示棘孢曲霉C4-二羧酸轉(zhuǎn)運蛋白基因(mat737)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:5和6)。定義C4-二羧酸轉(zhuǎn)運蛋白:術(shù)語“C4-二羧酸轉(zhuǎn)運蛋白”在本文中定義為可將蘋果酸、琥珀酸、草酰乙酸、丙二酸和/或延胡索酸轉(zhuǎn)運至細(xì)胞外的二羧酸通透酶(Grobler等,1995,Yeast11:1485-1491;Camarasa等,2001,AppliedandEnvironmentalMicrobiology67:4144-4151)。用于預(yù)測線粒體輸入的蛋白及其祀向序列的計算方法由Claros和Vincens,1996,Eur.J.Biochem.241:779-786描述。在一些方面,所述C4-二羧酸轉(zhuǎn)運蛋白具有成熟多肽SEQIDNO:2、SEQIDNO:4和/或SEQIDNO:6的C4-二羧酸轉(zhuǎn)運蛋白活性(例如蘋果酸轉(zhuǎn)運蛋白活性)的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。蘋果酸脫氫酶:術(shù)語“蘋果酸脫氫酶”在本文中定義為在NADH+H+的存在下催化將草酰乙酸還原為蘋果酸和NAD+的蘋果酸:NAD+氧還酶(EC1.1.1.37)。就本發(fā)明而言,根據(jù)下述步驟確定蘋果酸脫氫酶活性。測定溶液由ImM草酰乙酸,IOOmMTrispH8.0,IOmMNaHCO3,5mMMgCl2,和0.1mMNADH(SigmaChemicalC0.,St.Louis,MO,USA)組成。將不含草酰乙酸作為底物的測定溶液作為對照運行以測量背景NADH降解率(degradationrates)。用雙蒸水制備每種上清的1/100,1/500,1/2500和1/12500的稀釋物。將測定溶液的270μI的等分試樣分配入96孔聚苯乙烯平底板。添加每種稀釋的上清的30μI樣品以起始測定。使用SPECTRAMAXr.340PC讀板器(MolecularDevices,Sunnyvale,CA,USA)以下述設(shè)定監(jiān)測反應(yīng):340nm,動力學(xué)讀取(kineticreading)。使用NADH的濃度系列以構(gòu)建標(biāo)準(zhǔn)曲線,并使用純化的蘋果酸脫氫酶(SigmaChemicalC0.,St.Louis,MO,USA)的稀釋系列作為陽性對照。一單位的蘋果酸脫氫酶活性等于能夠在pH8.0,25°C每分鐘將I微摩爾草酰乙酸和NADH+H"轉(zhuǎn)化為蘋果酸和NAD+的酶量。在一些方面,所述蘋果酸脫氫酶具有成熟多肽SEQIDNO:12的蘋果酸脫氫酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。丙酮酸羧化酶:術(shù)語“丙酮酸羧化酶”在本文中定義為在ATP和HCO3-存在下催化將丙酮酸羧化為草酰乙酸、ADP和磷酸的丙酮酸:二氧化碳連接酶(ADP-形成)(EC6.4.1.1)。就本發(fā)明而言,根據(jù)針對丙酮酸羧化酶(SigmaChemicalC0.,St.Louis,MO,USA)的SIGMAQualityControlTest方法的步驟確定丙酮酸羧化酶活性,只是該測定使用pH8.0的Tris緩沖液。一單位的丙酮酸羧化酶活性等于能夠在pH7.8,30°C每分鐘將I微摩爾的丙酮酸和CO2轉(zhuǎn)化為草酰乙酸的酶量。在一些方面,所述丙酮酸羧化酶具有成熟多肽SEQIDNO:16的丙酮酸羧化酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%O異源多核苷酸:術(shù)語“異源多核苷酸”在本文中定義為對于宿主細(xì)胞并非天然的多核苷酸;其中已對編碼區(qū)進行結(jié)構(gòu)修飾的天然多核苷酸;作為通過重組DNA技術(shù)(例如,不同的(外源)啟動子)操縱DNA的結(jié)果其表達定量改變的天然多核苷酸;或其表達通過將一個或多個(例如,兩個、幾個)額外拷貝的多核苷酸導(dǎo)入宿主細(xì)胞而定量改變的天然多核苷酸。分離的/純化的:術(shù)語“分離的”和“純化的”意指從至少一種與其天然結(jié)合(associated)的成分分離的多肽或多核苷酸。舉例而言,如通過SDS-PAGE確定的,該多肽可為至少1%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,至少93%純,至少95%純,至少97%純,至少98%純,或至少99%純;且如通過瓊脂糖電泳確定的,該多核苷酸可為至少1%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,至少93%純,至少95%純,至少97%純,至少98%純,或至少99%純。編碼序列:術(shù)語“編碼序列”的意思是指定其蛋白產(chǎn)物的氨基酸序列的多核苷酸序列。編碼序列的邊界通常由開讀框確定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子如GTG和TTG開始,并且以終止密碼子如TAA、TAG和TGA結(jié)束。編碼序列可以是基因組DNA、cDNA、合成多核苷酸和/或重組多核苷酸的序列。cDNA序列:術(shù)語“cDNA序列”意指從得自真核細(xì)胞的成熟的、已剪接的mRNA分子在反轉(zhuǎn)錄之后所得的DNA。來自基因組DNA起始的(initial)、初級的RNA轉(zhuǎn)錄物是mRNA的前體,其通過一系列包括剪接的步驟加工然后作為成熟的已剪接的mRNA出現(xiàn)。cDNA序列缺乏可存在于相應(yīng)基因組DNA序列中的插入的內(nèi)含子。相應(yīng)地,短語“SEQIDΝ0:Χ的cDNA序列”意指將SEQIDΝ0:Χ中插入的內(nèi)含子序列(若存在)去除之后所得的序列。在一些情況下一當(dāng)參照的基因組DNA序列缺乏插入的內(nèi)含子序列時一cDNA序列可與相應(yīng)的基因組DNA序列完全相同?;蚪MDNA序列:術(shù)語“基因組DNA序列”意指見于來源生物的基因組(例如真核或原核基因組)的DNA序列。在一些情況下,來自真核基因組的基因組DNA序列含有一個或多個插入的內(nèi)含子序列,其作為RNA剪接的結(jié)果從初級RNA轉(zhuǎn)錄物去除。相應(yīng)地,短語“SEQIDNO:Y的基因組DNA序列”意指來自來源生物的相應(yīng)DNA序列,其含有在RNA剪接之前存在的插入的內(nèi)含子序列(若存在)。成熟多肽序列:術(shù)語“成熟多肽序列”意指參照的多核苷酸序列在任何翻譯后序列修飾(如N端加工和/或C端截短)之后的部分。在一些情況下,所述成熟多肽序列可以與整個參照的多肽序列相同。在一個方面,基于預(yù)測SEQIDNO:2的氨基酸I至68為信號妝的InterProScan程序(TheEuropeanBioinformaticsInstitute),所述成熟多妝序列是SEQIDNO:2的氨基酸69至397。在另一個方面,基于預(yù)測SEQIDNO:2的氨基酸I至61為信號肽的SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),所述成熟多肽序列是SEQIDNO:2的氨基酸62至397。在另一個方面,基于預(yù)測SEQIDNO:4的氨基酸I至17為信號肽的SignalP程序,所述成熟多肽序列是SEQIDN0:4的氨基酸18至418。在另一個方面,基于預(yù)測無信號肽的InterPiOScan程序,所述成熟多肽序列是SEQIDNO:4的氨基酸I至418。在一個方面,基于預(yù)測SEQIDNO:6的氨基酸I至68為信號肽的InterProScan程序,所述成熟多肽序列是SEQIDNO:2的氨基酸69至397。成熟多肽編碼序列:術(shù)語“成熟多肽編碼序列”意指參照的多核苷酸序列(例如基因組或cDNA序列)編碼成熟多肽序列的部分。在一些情況下,所述成熟多肽編碼序列可以與整個參照的多核苷酸序列相同。在一個方面,基于預(yù)測SEQIDNO:1的核苷酸I至204編碼信號妝的InterProScan程序(TheEuropeanBioinformaticsInstitute),所述成熟多妝編碼序列是SEQIDNO:1的核苷酸205至1194。在另一個方面,基于預(yù)測SEQIDNO:1的核苷酸I至183編碼信號妝的SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),所述成熟多肽編碼序列是SEQIDNO:1的核苷酸184至1194。在另一個方面,基于預(yù)測SEQIDNO:3的核苷酸I至51編碼信號肽的SignalP程序,所述成熟多肽編碼序列是SEQIDNO:3的核苷酸52至1257。在另一個方面,基于預(yù)測無信號肽的InterProScan程序,所述成熟多肽編碼序列是SEQIDN0:3的核苷酸I至1257。在另一個方面,基于預(yù)測SEQIDNO:5的核苷酸I至204編碼信號肽的InterProScan程序,所述成熟多肽編碼序列是SEQIDNO:1的核苷酸205至1194。片段:術(shù)語“片段”意指從參照的多肽序列的氨基和/或羧基末端缺失了一個或多個(例如兩個、幾個)氨基酸的多肽。在一個方面,所述片段具有C4-二羧酸轉(zhuǎn)運蛋白活性。在另一個方面,片段包含SEQIDNO:2的至少337個氨基酸殘基,例如至少357個氨基酸殘基或至少377個氨基酸殘基。在另一個方面,片段包含SEQIDNO:4的至少355個氨基酸殘基,例如至少375個氨基酸殘基或至少395個氨基酸殘基。在另一個方面,片段包含SEQIDNO:6的至少337個氨基酸殘基,例如至少357個氨基酸殘基或至少377個氨基酸殘基。亞序列:術(shù)語“亞序列(subsequence)”意指從參照的核苷酸序列的5’和/或3’端缺失了一個或多個(例如兩個、幾個)核苷酸的多核苷酸。在一個方面,所述亞序列編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,亞序列包含SEQIDNO:1的至少1011個核苷酸,例如至少1171個核苷酸或至少1131個核苷酸。在另一個方面,亞序列包含SEQIDNO:3的至少1065個核苷酸,例如至少1125個核苷酸或至少1185個核苷酸。在另一個方面,亞序列包含SEQIDN0:5的至少1011個核苷酸,例如至少1171個核苷酸或至少1131個核苷酸。等位變體(allelicvariant):術(shù)語“等位變體”意指占據(jù)相同染色體基因座的基因的任何兩種以上可選形式。等位變異通過突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。序列同一性:兩個氨基酸序列間或兩個核苷酸序列間的相關(guān)性由參數(shù)“序列同一性”所描述。就本發(fā)明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:歐洲分子生物學(xué)開放軟件套組(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,TrendsGenet.16:276-277)的Needle程序(優(yōu)選為3.0.0版或之后的版本)中執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)確定的。所用的可選參數(shù)為缺口開放罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)0.5,和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用標(biāo)記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)作為百分比同一性并如下計算:(相同的殘基X100)/(比對長度-比對中缺口總數(shù))就本發(fā)明而言,兩個脫氧核糖核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:歐洲分子生物學(xué)開放軟件套組(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,見上)的Needle程序(優(yōu)選為3.0.0版或之后的版本)中執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上)確定的。所用的可選參數(shù)為缺口開放罰分10,缺口延伸罰分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用標(biāo)記為”最長同一性”的Needle輸出(使用-nobrief選項獲得)作為百分比同一性并如下計算:(相同的脫氧核糖核苷酸X100)/(比對長度-比對中缺口總數(shù))。表達:術(shù)語“表達”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。核酸構(gòu)建體:術(shù)語“核酸構(gòu)建體”意指單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或經(jīng)修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段,或為合成的,其中所述核酸分子包含一個或多個(例如兩個,幾個)調(diào)控序列。調(diào)控序列(controlsequence):術(shù)語“調(diào)控序列”意指對于多肽表達必需的核酸序列。調(diào)控序列對于編碼所述多肽的多核苷酸可以是天然的或外源的,以及對于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動子序列、信號肽序列和轉(zhuǎn)錄終止子序列。調(diào)控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調(diào)控序列與編碼多肽的多核苷酸編碼區(qū)的連接??刹僮鞯剡B接:術(shù)語“可操作地連接”意指這樣的構(gòu)型,其中將調(diào)控序列置于相對于多核苷酸的編碼序列的適當(dāng)位置,使得調(diào)控序列指導(dǎo)編碼序列的表達。表達載體:術(shù)語“表達載體”意指線性的或環(huán)狀的DNA分子,其包含編碼多肽的多核苷酸,并與調(diào)控序列可操作地連接,其中所述調(diào)控序列提供編碼所述多肽的多核苷酸的表達。最少的情況,所述表達載體包含啟動子序列,和轉(zhuǎn)錄和翻譯終止信號序列。宿主細(xì)胞:術(shù)語“宿主細(xì)胞”意指任何細(xì)胞類型,所述細(xì)胞類型對于用包含本發(fā)明的多核苷酸(例如編碼C4-二羧酸轉(zhuǎn)運蛋白的多核苷酸)的核酸構(gòu)建體或表達載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的(susceptible)。術(shù)語“宿主細(xì)胞”涵蓋親本細(xì)胞的任何后代,其由于在復(fù)制過程中發(fā)生的突變而不同于親本細(xì)胞。變體:術(shù)語“變體”意指在一個或多個位置包含變化即取代、插入和/或缺失一個或多個(例如兩個、幾個)氨基酸殘基的,具有活性例如C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。取代意指將占據(jù)某位置的氨基酸用不同氨基酸替換;缺失意指去除占據(jù)某位置的氨基酸;而插入意指在占據(jù)某位置的氨基酸的相鄰處添加一個或多個,例如1-3個氨基酸。體積產(chǎn)量:術(shù)語“體積產(chǎn)量”指每單位時間每體積(例如,培養(yǎng)基及其中內(nèi)含物的總體積)使用的系統(tǒng)所產(chǎn)生的參照的產(chǎn)物的量(例如,產(chǎn)生的C4-二羧酸的量)。發(fā)酵培養(yǎng)基:術(shù)語“發(fā)酵培養(yǎng)基”指包含一種或多種(例如,兩種,幾種)糖如葡萄糖、果糖、蔗糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖的培養(yǎng)基,其中所述培養(yǎng)基能夠部分地通過宿主細(xì)胞轉(zhuǎn)化(發(fā)酵)為所需產(chǎn)物,如C4-二羧酸。在一些情況下,所述發(fā)酵培養(yǎng)基源自天然來源,如甘蔗,淀粉,或纖維素,并可為通過酶水解(糖化)而預(yù)處理所述來源的結(jié)果。在本文中,提及“約”某值或參數(shù)包括了涉及該值或參數(shù)本身的方面。舉例而言,提及“約X”的描述包括了“X”的方面。如用于本文中和所附權(quán)利要求中,除非上下文明確地表示相反,單數(shù)形式“一(個/種...)&)”或“所述/該(the)”包括了對復(fù)數(shù)的提及。應(yīng)理解本文中所述的發(fā)明的各方面包括了“由…組成(consisting)”和/或“基本上由…組成(consistingessentiallyof)”的方面。除非另行定義或上下文明確指出,本文中使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的相同的含意。發(fā)明詳述具有C-4二羧酸轉(zhuǎn)運蛋白活性的多肽本發(fā)明涉及具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽選自:(a)多肽,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈雜交;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或⑷的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽選自:(a)多肽,其與SEQIDNO:2,或其成熟多肽序列具有至少65%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與SEQIDN0:1,其成熟多肽編碼序列,或前述序列的全長互補鏈雜交;(C)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:2,或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或⑷的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽選自:(a)多肽,其與SEQIDNO:4,或其成熟多肽序列具有至少65%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與SEQIDN0:3,其成熟多肽編碼序列,或前述序列的全長互補鏈雜交;(C)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:4,或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或⑷的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽選自:(a)多肽,其與SEQIDNO:6,或其成熟多肽序列具有至少65%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與SEQIDN0:5,其成熟多肽編碼序列,或前述序列的全長互補鏈雜交;(C)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDN0:6,或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或⑷的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在一些這些方面,所述分離的多肽具有氨基酸序列,所述氨基酸序列與SEQIDNO:2,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述多肽包含氨基酸序列,所述氨基酸序列與SEQIDNO:2,或其成熟多肽序列相差不多于十個氨基酸,例如五個氨基酸,四個氨基酸,三個氨基酸,兩個氨基酸,或一個氨基酸。在一個方面,所述多肽包含或組成為SEQIDNO:2的氨基酸序列,SEQIDNO:2的成熟多肽序列,其等位變體,或前述序列的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:2的氨基酸序列。在另一個方面,所述多肽包含或組成為SEQIDN0:2的成熟多肽序列。在另一個優(yōu)選的方面,所述多肽包含或組成為SEQIDNO:2的氨基酸62至397或69至397。在一些這些方面,所述分離的多肽具有氨基酸序列,所述氨基酸序列與SEQIDNO:4,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述多肽包含氨基酸序列,所述氨基酸序列與SEQIDN0:4,或其成熟多肽序列相差不多于十個氨基酸,例如五個氨基酸,四個氨基酸,三個氨基酸,兩個氨基酸,或一個氨基酸。在一個方面,所述多肽包含或組成為SEQIDNO:4的氨基酸序列,SEQIDNO:4的成熟多肽序列,其等位變體,或前述序列的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:4的氨基酸序列。在另一個方面,所述多肽包含或組成為SEQIDN0:4的成熟多肽序列。在另一個優(yōu)選的方面,所述多肽包含或組成為SEQIDNO:2的氨基酸52至418。在一些這些方面,所述分離的多肽具有氨基酸序列,所述氨基酸序列與SEQIDNO:6,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述多肽包含氨基酸序列,所述氨基酸序列與SEQIDN0:6,或其成熟多肽序列相差不多于十個氨基酸,例如五個氨基酸,四個氨基酸,三個氨基酸,兩個氨基酸,或一個氨基酸。在一個方面,所述多肽包含或組成為SEQIDNO:6的氨基酸序列,SEQIDNO:6的成熟多肽序列,其等位變體,或前述序`列的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:6的氨基酸序列。在另一個方面,所述多肽包含或組成為SEQIDN0:6的成熟多肽序列。在另一個優(yōu)選的方面,所述多肽包含或組成為SEQIDNO:6的氨基酸69至397。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDN0:1,其成熟多肽編碼序列,或前述序列的全長互補鏈(參見,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。在另一個方面,所述具有C4_二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:3,其成熟多肽編碼序列,或前述序列的全長互補鏈。在另一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:5,其成熟多肽編碼序列,或前述序列的全長互補鏈。在另一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一I"生。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸與SEQIDN0:1,其成熟多肽編碼序列,或前述序列的全長互補鏈具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸與SEQIDN0:3,其成熟多肽編碼序列,或前述序列的全長互補鏈具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽由多核苷酸編碼,所述多核苷酸與SEQIDN0:5,其成熟多肽編碼序列,或前述序列的全長互補鏈具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述多肽由SEQIDNO:1、3或5,或其成熟多肽編碼序列編碼。在一個方面,所述多肽由SEQIDNO:1或其成熟多肽編碼序列編碼。在一個方面,所述多肽由SEQIDNO:1編碼。在一個方面,所述多肽由SEQIDN0:3或其成熟多肽編碼序列編碼。在一個方面,所述多肽由SEQIDN0:3編碼。在一個方面,所述多肽由SEQIDN0:5或其成熟多肽編碼序列編碼。在一個方面,所述多肽由SEQIDN0:5編碼。在一個方面,所述多肽由SEQIDN0:1、3或5的亞序列編碼,其中所述亞序列編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述多肽由SEQIDNO:1的亞序列編碼,其中所述亞序列編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述多肽由SEQIDN0:3的亞序列編碼,其中所述亞序列編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述多肽由SEQIDNO:5的亞序列編碼,其中所述亞序列編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述分離的多肽是SEQIDNO:2、4或6,或其成熟多肽編碼序列的包含一個或多個(例如兩個、幾個)氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDNO:2的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDNO:2的成熟多肽的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDNO:4的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDNO:4的成熟多肽的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDN0:6的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述多肽是SEQIDN0:6的成熟多肽的包含一個或多個氨基酸的取代、缺失和/或插入的變體。優(yōu)選地,氨基酸改變的性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結(jié)合域(bindingdomain)。保守取代的實例是在以下組之內(nèi):堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly?;蛘?,氨基酸改變具有這樣的性質(zhì):使多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸改變可改善多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的C4-二羧酸轉(zhuǎn)運蛋白活性以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結(jié)構(gòu)的物理分析而測定,如通過以下這些技術(shù):如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記,連同推定的接觸位點氨基酸的突變來確定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能夠從與多肽的同一'丨生分析來推斷,所述多肽與親本多肽相關(guān)。能夠使用已知的誘變、重組和/或改組(shuffling)方法接著進行有關(guān)的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sc1.USA86:2152-2156;W095/17413;或W095/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、卩遼菌體展不(例如,Lowman等,1991,Biochemistry30:10832-10837;美國專利N0.5,223,409;W092/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細(xì)胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnologyl7:893-896)。能夠從宿主細(xì)胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域中的標(biāo)準(zhǔn)方法快速測序。這些方法允許快速確定多肽中單個氨基酸殘基的重要性。在一些方面,SEQIDNO:2、4或6,或其成熟多肽序列的氨基酸取代、缺失和/或插入的總數(shù)不多于10,例如不多于1,2,3,4,5,6,7,8或9。在另一個方面,所述多肽是SEQIDN0:2、4或6,或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述多肽是SEQIDN0:2或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述片段含有SEQIDNO:2的至少337個氨基酸殘基,例如至少357個氨基酸殘基,或至少377個氨基酸殘基。在另一個方面,所述多肽是SEQIDN0:4或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述片段含有SEQIDN0:4的至少355個氨基酸殘基,例如至少375個氨基酸殘基,或至少395個氨基酸殘基。在另一個方面,所述多肽是SEQIDN0:6或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸轉(zhuǎn)運蛋白活性。在一個方面,所述片段含有SEQIDNO:6的至少337個氨基酸殘基,例如至少357個氨基酸殘基,或至少377個氨基酸殘基。所述多肽可為雜合的多肽,其中一個多肽的一部分融合于另一個多肽的一部分的N而或C而。所述多肽可為融合多肽或可切割的融合多肽,其中另一種多肽融合于本發(fā)明多肽的N端或C端。通過將編碼另一個多肽的多核苷酸融合于本發(fā)明的多核苷酸來產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達在相同啟動子和終止子的調(diào)控下。融合蛋白亦可使用內(nèi)蛋白(intein)技術(shù)構(gòu)建,其中融合物在翻譯后產(chǎn)生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。融合多肽還可以包含在兩個多肽之間的切割位點。一旦分泌了融合多肽,就切割所述位點,釋放所述兩個多肽。切割位點的實例包括,但不限于,Martin等,2003,J.1nd.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnologyl3:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512;Collins-Racie等,1995,Biotechnologyl3:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中公開的位點。具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的來源本發(fā)明的具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽(例如SEQIDN0:2、4或6,或其成熟多肽序列的多肽)可獲得自任何屬的微生物。就本發(fā)明而言,如用于本文中的、與給定的來源相聯(lián)的術(shù)語“獲得自”,意思應(yīng)為由多核苷酸編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的多核苷酸的株產(chǎn)生。在一個方面,從給定來源獲得的多肽分泌至胞外。所述多肽可為細(xì)菌多肽。例如,所述多肽可為革蘭氏陽性細(xì)菌多肽如具有C4-二羧酸轉(zhuǎn)運蛋白活性的芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、地芽抱桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽抱桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Streptococcus)或鏈霉菌屬(Streptomyces)多肽;或革蘭氏陰性細(xì)菌多肽,如具有C4-二羧酸轉(zhuǎn)運蛋白活性的彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)Jjj^zF菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)或脲原體屬(Ureaplasma)多肽。在一個方面,所述多肽是嗜堿芽孢桿菌(Bacillusalkalophilus)、解淀粉芽抱桿菌(Bacillusamyloliquefaciens)、短芽抱桿菌(Bacillusbrevis)、環(huán)狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結(jié)芽孢桿菌(Bacilluscoagulans)、堅強芽抱桿菌(Bacillusfirmus)、燦爛芽抱桿菌(Bacilluslautus)、遲緩芽抱桿菌(Bacilluslentus)、地衣芽抱桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽抱桿菌(Bacillussubtilis)或蘇云金芽抱桿菌(Bacillusthuringiensis)多月太。在另一個方面,所述多肽是似馬鏈球菌(Streptococcusequisimilis)、釀膿鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞種(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個方面,所述多肽是不產(chǎn)色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(StreptomycesIividans)多月太。所述多肽亦可為真菌多肽。例如,所述多肽可為酵母多肽,如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓄霉屬(Yarrowia)多肽,或絲狀真菌多肽,如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬錯菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsis)、Coptotermes、棒囊殼屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、德抱屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質(zhì)霉屬(Humicola)、把齒菌屬(Irpex)、蘑燕屬(Lentinula)、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌屬(Schizophyllum)、柱頂抱屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳燕屬(Volvariella)或炭角菌屬(Xylaria)多肽。在另一個方面,所述多肽是卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一個方面,所述多肽是解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Asperigullusfoetidus)、煙曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillusjaponicus)、構(gòu)巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporiuminops、嗜角質(zhì)金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威德抱(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本科德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱德抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質(zhì)霉(Humicolagrisea)、特異腐質(zhì)霉(Humicolainsolens)、疏棉狀腐質(zhì)霉(Humicolalanuginosa)、白牽巴齒菌(IrpexIacteus)、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糖脈抱菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、無色梭抱殼(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimet1、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)、Thielaviaperuviana、毛梭抱殼(Thielaviasetosa)、瘤抱梭抱殼(Thielaviaspededonium)'Thielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichoderma1ngibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多肽。在另一個方面,所述多肽是曲霉屬多肽,例如棘孢曲霉多肽,如來自大腸桿菌NRRLB-50400、大腸桿菌NRRLB-50388或大腸桿菌NRRLB-50401的棘孢曲霉多肽。在另一個方面,所述多肽是SEQIDN0:2或SEQIDN0:4的棘孢曲霉多肽。在另一個方面,所述多肽是SEQIDN0:2的棘孢曲霉多肽。在另一個方面,所述多肽是SEQIDN0:4的棘孢曲霉多肽。可理解的是對于前述的`種,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學(xué)的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領(lǐng)域技術(shù)人員將容易地識別適合的等同物的身份。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細(xì)胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)0亦可使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得所述多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領(lǐng)域內(nèi)公知的。然后可通過相似地篩選另一種微生物的基因組DNA或cDNA文庫或混合的DNA樣品來獲得編碼所述多肽的多核苷酸。一旦用探針檢測到編碼所述多肽的多核苷酸,就能夠使用本領(lǐng)域普通技術(shù)人員公知的技術(shù)將所述多核苷酸分離或克隆(參見,例如,Samtoook等,1989,見上文)。多核苷酸本發(fā)明亦涉及編碼本發(fā)明的多肽的分離的多核苷酸(例如,編碼任何涉及SEQIDNO:2、4或6的方面的多肽的分離的多核苷酸)。用于分離或克隆編碼編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域內(nèi)已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達文庫的抗體篩選來檢測具有共有結(jié)構(gòu)特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U增方法,如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)??梢詮那箤?例如棘孢曲霉)菌株,或其他或相關(guān)生物體克隆所述多核苷酸,并且因此可為所述核苷酸序列的多肽編碼區(qū)的等位變體或種變體(speciesvariant)。本發(fā)明亦涉及分離的多核苷酸,其包含或組成為核苷酸序列,所述核苷酸序列與SEQIDNO:1、3或5,或其成熟多肽編碼序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述分離的多核苷酸包含或組成為核苷酸序列,所述核苷酸序列與SEQIDNO:1或其成熟多肽編碼序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述分離的多核苷酸包含或組成為核苷酸序列,所述核苷酸序列與SEQIDNO:3或其成熟多肽編碼序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在一個方面,所述分離的多核苷酸包含或組成為核苷酸序列,所述核苷酸序列與SEQIDNO:5或其成熟多肽編碼序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。修飾編碼本發(fā)明多肽的多核苷酸對于合成與所述多肽基本上相似的多肽可為必需的。術(shù)語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的變體。可以在作為SEQIDNO:1、3或5的成熟多肽編碼序列存在的多核苷酸,例如其亞序列的基礎(chǔ)上,和/或通過引入如下核苷酸取代來構(gòu)建變體序列:所述取代不產(chǎn)生所述多肽的氨基酸序列的變化,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關(guān)于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,ProteinExpressionandPurification2:95-107。本發(fā)明亦涉及編碼本發(fā)明的多肽的分離的多核苷酸,所述多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:1、3或5;SEQIDNO:1、3或5的成熟多肽編碼序列;其全長互補鏈;或前述序列的等位變體或亞序列(參見,例如Sambrook等,1989,見上文),如本文中所定義。在一個方面,所述分離的多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDN0:1;SEQIDNO:1的成熟多肽編碼序列;其全長互補鏈;或前述序列的等位變體或亞序列(參見,例如Sambrook等,1989,見上文),如本文中所定義。在一個方面,所述分離的多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDN0:3或1;SEQIDNO:3的成熟多肽編碼序列;其全長互補鏈;或前述序列的等位變體或亞序列(參見,例如Sambrook等,1989,見上文),如本文中所定義。在一個方面,所述分離的多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDN0:5或1;SEQIDNO:5的成熟多肽編碼序列;其全長互補鏈;或前述序列的等位變體或亞序列(參見,例如Sambrook等,1989,見上文),如本文中所定義。在一個方面,所述多核苷酸包含或組成為SEQIDNO:1,SEQIDNO:1的成熟多肽編碼序列,或大腸桿菌NRRLB-50400中包含的質(zhì)粒pAaC4T737中包含的序列,或SEQIDN0:1編碼SEQIDNO:2的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段(例如SEQIDN0:2的氨基酸69-397或62至397)的亞序列,如SEQIDNO:1的核苷酸204至1194或184至1194的多核苷酸。在另一個方面,所述多核苷酸包含或組成為SEQIDNO:3,SEQIDNO:3的成熟多肽編碼序列,或大腸桿菌NRRLB-50388中包含的質(zhì)粒pAaC4T521中包含的序列,或SEQIDN0:3編碼SEQIDN0:4的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段(例如SEQIDN0:4的氨基酸18-418)的亞序列,如SEQIDNO:3的核苷酸52至1257的多核苷酸。在另一個方面,所述多核苷酸包含或組成為SEQIDNO:5,SEQIDNO:5的成熟多肽編碼序列,或大腸桿菌NRRLB-50401中包含的質(zhì)粒pAaMAT737中包含的序列,或SEQIDN0:5編碼SEQIDN0:6的具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段(例如SEQIDN0:6的氨基酸69-397)的亞序列,如SEQIDNO:5的核苷酸205至1194的多核苷酸。SEQIDNO:1、3或5的多核苷酸,或亞序列,以及SEQIDNO:2、4或6的氨基酸序列,或其片段,可用于設(shè)計核酸探針,以根據(jù)本領(lǐng)域內(nèi)公知的方法從不同屬或種的菌株鑒定和克隆編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的DNA。具體而言,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組DNA或cDNA雜交,以鑒定和分離其中相應(yīng)的基因。這些探針可明顯短于完整序列,但長度上應(yīng)為至少14個核苷酸,例如至少25個核苷酸,至少35個核苷酸,或至少70個核苷酸。優(yōu)選地,所述核酸探針為至少100個核苷酸的長度,例如至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,或至少500個核苷酸的長度,至少600個核苷酸,例如至少700個核苷酸,至少800個核苷酸,或至少900個核苷酸的長度。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以供檢測相應(yīng)的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標(biāo)記)。這些探針涵蓋于本發(fā)明中??蓮挠蛇@些其它菌株制備的基因組DNA或cDNA文庫中篩選與上述探針雜交并且編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的DNA??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術(shù)分離來自這些其它株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉(zhuǎn)移至硝化纖維素(nitrocellulose)或其它合適的擔(dān)載體材料并且固定于其上。為了鑒定與SEQIDN0:1、3或5,或其亞序列同源的克隆或DNA,所述擔(dān)載體材料優(yōu)選用于Sounthern印跡。就本發(fā)明而言,雜交表示多核苷酸在非常低至非常高的嚴(yán)格條件下與標(biāo)記的核酸探針雜交,所述核酸探針對應(yīng)于SEQIDNO:1、3或5,SEQIDNO:1、3或5的成熟多肽編碼序列,其全長互補鏈;或前述序列的亞序列。可使用例如X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在一個方面,核酸探針是SEQIDN0:l、3或5。在另一個方面,核酸探針是SEQIDN0:l、3或5的成熟多肽編碼序列。在另一個方面,核酸探針是編碼SEQIDN0:2、4或6的多肽,或其片段的多核苷酸。在另一個方面,核酸探針是SEQIDN0:1。在另一個方面,核酸探針是SEQIDNO:3。在另一個方面,核酸探針是SEQIDNO:5。在另一個方面,核酸探針是大腸桿菌NRRLB-50400中包含的質(zhì)粒pAaC4T737中包含的多核苷酸,其中所述多核苷酸編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在另一個方面,核酸探針是大腸桿菌NRRLB-50400中包含的質(zhì)粒pAaC4T737中包含的成熟多肽編碼序列,其中所述多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性。在另一個方面,核酸探針是大腸桿菌NRRLB-50388中包含的質(zhì)粒pAaC4T521中包含的多核苷酸,其中所述多核苷酸編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在另一個方面,核酸探針是大腸桿菌NRRLB-50388中包含的質(zhì)粒pAaC4T521中包含的成熟多肽編碼序列,其中所述多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性。在另一個方面,核酸探針是大腸桿菌NRRLB-50401中包含的質(zhì)粒pAaMAT737中包含的多核苷酸,其中所述多核苷酸編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽。在另一個方面,核酸探針是大腸桿菌NRRLB-50401中包含的質(zhì)粒pAaMAT737中包含的成熟多肽編碼序列,其中所述多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴(yán)格條件定義為在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴(yán)格性為25%的甲酰胺、對于中和中-高嚴(yán)格性為35%的甲酰胺、或?qū)τ诟吆头浅8邍?yán)格性為50%的甲酰胺,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進行預(yù)雜交和雜交最佳12至24小時。使用2XSSC、0.2%SDS在45。。(非常低嚴(yán)格性),在50°C(低嚴(yán)格性),在55°C(中嚴(yán)格性),在60°C(中-高嚴(yán)格性),在65°C(高嚴(yán)格性),和在70°C(非常高嚴(yán)格性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴(yán)格條件定義為在比使用根據(jù)Bolton和McCarthy計算法(1962,Proc.Natl.Acad.Sc1.USA48:1390)計算的Tni低大約5至大約1(TC,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP_40,IXDenhardt溶液,ImM焦憐酸鈉(sodiumpyrophosphate),ImM憐酸二氫鈉(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根據(jù)標(biāo)準(zhǔn)的Southern印跡步驟進行預(yù)雜交和雜交最佳12至24小時。將所述載體材料在6XSSC加0.1%SDS中最終洗滌一次15分鐘,并用6XSSC在比計算的Tm低5°C至I(TC的溫度洗滌兩次,每次15分鐘。核酸構(gòu)建體本發(fā)明還涉及核酸構(gòu)建體,所述核酸構(gòu)建體包含可操作地連接于一個或多個(例如兩個、幾個)調(diào)控序列的本發(fā)明的多核苷酸,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)編碼序列的表達。本發(fā)明亦涵蓋利用核酸構(gòu)建體的宿主細(xì)胞和方法,所述核酸構(gòu)建體包含連接于一個或多個調(diào)控序列、編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白(和/或本文中所述的蘋果酸脫氫酶,或丙酮酸羧化酶)的異源多核苷酸,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)表達。此類核酸構(gòu)建體可用于本文中所述的任何宿主細(xì)胞和方法中??梢杂迷S多方式操作本文中所述的多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術(shù)是本領(lǐng)域熟知的。調(diào)控序列可為啟動子序列,其是由用于表達編碼本發(fā)明的多肽的多核苷酸的宿主細(xì)胞所識別的多核苷酸。啟動子序列含有介導(dǎo)多肽的表達的轉(zhuǎn)錄調(diào)控序列。啟動子可以是在所選的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何多核苷酸,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。本文中所述的每個多核苷酸可以可操作地連接于對于所述多核苷酸是外源的啟動子。例如,在一個方面,編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸可操作地連接于對于所述多核苷酸是外源的啟動子。在另一個方面,編碼蘋果酸脫氫酶的異源多核苷酸可操作地連接于對于所述多核苷酸是外源的啟動子。在一個方面,編碼丙酮酸羧化酶的異源多核苷酸可操作地連接于對于所述多核苷酸是外源的啟動子。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的實例是從下述獲得的啟動子:解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌`青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、大腸桿菌Iac操縱子、天藍色鏈霉菌瓊脂糖酶基因(dagA)和原核β-內(nèi)酸胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac啟動子(DeBoer等,1983,Proc.Natl.Acad.Sc1.USA80:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文描述。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的實例是從下列酶的基因獲得的啟動子:構(gòu)巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(W000/56900)、鑲片鐮孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶1、里氏木霉纖維二糖水解酶I1、里氏木霉內(nèi)切葡聚糖酶1、里氏木霉內(nèi)切葡聚糖酶I1、里氏木霉內(nèi)切葡聚糖酶II1、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(一種修飾的啟動子,其來自曲霉屬中編碼中性α-淀粉酶的基因,其中未翻譯的前導(dǎo)序列已由曲霉屬(Aspergilli)中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代;非限制性實例包括修飾的啟動子,其來自黑曲霉中編碼中性α-淀粉酶的基因,其中未翻譯的前導(dǎo)序列已由構(gòu)巢曲霉或米曲霉中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得:釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細(xì)胞其它有用的啟動子由Romanos等,1992,Yeast8:423-488描述。調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,其由宿主細(xì)胞識別以終止轉(zhuǎn)錄。所述終止子序列與編碼所述多肽的多核苷酸的3’末端可操作地連接??梢詫⒃谒x宿主細(xì)胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得:構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得:釀酒酵母烯醇化酶、釀酒酵母細(xì)胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細(xì)胞其它有用的終止子由Romanos等,1992,見上文描述。調(diào)控序列還可以是合適的前導(dǎo)序列,當(dāng)被轉(zhuǎn)錄時其為對于宿主細(xì)胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的多核苷酸的5’-末端??墒褂迷谒x宿主細(xì)胞中有功能的任何前導(dǎo)序列。對于絲狀真菌宿主細(xì)胞優(yōu)選的前導(dǎo)序列從如下酶的基因獲得:米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶。對于酵母宿主細(xì)胞合適的前導(dǎo)序列從如下酶的基因獲得:釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調(diào)控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3’末端可操作地連接的序列,并且在轉(zhuǎn)錄時,宿主細(xì)胞將其識別為將聚腺苷殘基添加至轉(zhuǎn)錄的mRNA的信號??墒褂迷谒x宿主細(xì)胞中有功能的任何聚腺苷酸化序列。對于絲狀真菌宿主細(xì)胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細(xì)胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。調(diào)控序列還可以是信號肽編碼區(qū),其編碼與多肽的N端相連的信號肽,并且指導(dǎo)多肽進入細(xì)胞的分泌途徑。多核苷酸的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼所述多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中??晒┻x擇的是,編碼序列5’端可含有對于所述編碼序列外源的信號肽編碼序列。外源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的?;蛘?,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,可使用指導(dǎo)表達的多肽進入所選宿主細(xì)胞的分泌途徑的任何信號肽編碼序列。對于細(xì)菌宿主細(xì)胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。對于絲狀真菌宿主細(xì)胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V、疏棉狀腐質(zhì)霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。對于酵母宿主細(xì)胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉(zhuǎn)化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。調(diào)控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化為活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(aprE),枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。當(dāng)信號肽和前肽序列二者均出現(xiàn)在多肽的N端時,將前肽序列置于緊接著(nextto)多肽N端,并且將信號肽序列置于緊接著前肽序列的N端。同樣理想的是添加調(diào)節(jié)序列,其允許相對于宿主細(xì)胞的生長來調(diào)節(jié)多肽的表達。調(diào)節(jié)系統(tǒng)的實例是引起基因表達響應(yīng)化學(xué)或物理刺激物,包括調(diào)節(jié)化合物的存在而開啟或關(guān)閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。調(diào)節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調(diào)節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調(diào)節(jié)序列可操作地連接。表達載體本發(fā)明亦涉及包含本發(fā)明的多核苷酸、啟動子和轉(zhuǎn)錄和翻譯終止信號的重組表達載體。本發(fā)明亦涵蓋利用重組表達載體的重組宿主細(xì)胞和方法,所述重組表達載體包含編碼C4-二羧酸轉(zhuǎn)運蛋白(和/或蘋果酸脫氫酶或丙酮酸羧化酶)的異源多核苷酸,以及啟動子和轉(zhuǎn)錄和翻譯終止信號。此類重組表達載體可用于本文中所述的任何宿主細(xì)胞和方法中。多種核苷酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達載體,所述表達載體可以包括一個或多個(例如兩個、幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的多核苷酸??晒┻x擇的是,可以通過在適當(dāng)?shù)挠糜诒磉_的載體中插入包含所述序列的多核苷酸或核酸構(gòu)建體來表達所述多核苷酸。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當(dāng)?shù)谋磉_調(diào)控序列可操作地連接。重組表達載體可以是任何載體(例如,質(zhì)粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生多核苷酸的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細(xì)胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。在一個方面,每個編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白、蘋果酸脫氫酶,和/或丙酮酸羧化酶的多核苷酸包含于各自獨立的載體上。在一個方面,至少兩個所述多核苷酸包含于單一的載體上。在一個方面,所有編碼C4-二羧酸轉(zhuǎn)運蛋白,蘋果酸脫氫酶,和丙酮酸羧化酶的多核苷酸包含于單一的載體上。載體可以是自主復(fù)制載體,即,作為染色體外實體(entity)存在的載體,其復(fù)制獨立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復(fù)制的手段(means)?;蛘?,載體可以是一種當(dāng)被引入宿主細(xì)胞中時,整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨的載體或質(zhì)?;騼蓚€或更多個載體或質(zhì)粒,其共同含有待引入宿主細(xì)胞基因組的完整DNA(totalDNA),或可以使用轉(zhuǎn)座子(transposon)。載體優(yōu)選含有一個或多個(例如兩個、幾個)選擇性標(biāo)記,其允許簡單選擇經(jīng)轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細(xì)胞。選擇性標(biāo)記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細(xì)菌選擇性標(biāo)記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標(biāo)記,所述抗生素抗性如氨芐青霉素、氯霉素、卡那霉素或四環(huán)素抗性。對于酵母宿主細(xì)胞合適的標(biāo)記是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細(xì)胞的選擇性標(biāo)記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷_5’_憐酸脫羧酶)(orotidine_5’-phosphatedecarboxylase)>sC(硫酸腺苷酸轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細(xì)胞中的是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)的bar基因。載體優(yōu)選含有元件,其允許載體整合入宿主細(xì)胞基因組或載體在細(xì)胞中獨立于基因組的自主復(fù)制。為了整合入宿主細(xì)胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘撸d體可以含有額外的多核苷酸,用于指導(dǎo)通過同源重組整合入宿主細(xì)胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應(yīng)含有足夠數(shù)量的核酸,如100至10,000堿基對,400至10,000堿基對,和800至10,000堿基對,其與相應(yīng)的目標(biāo)序列具有高度序列同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細(xì)胞基因組中的目標(biāo)序列同源。此夕卜,整合元件可以是非編碼或編碼的多核苷酸。另一方面,可以將載體通過非同源重組整合到宿主細(xì)胞的基因組中。為了自主復(fù)制,載體可以進一步包含復(fù)制起點,其使載體能夠在所述的宿主細(xì)胞中自主地復(fù)制。復(fù)制起點可以是介導(dǎo)自主復(fù)制的任何質(zhì)粒復(fù)制子(replicator),其在細(xì)胞中發(fā)揮功能。術(shù)語“復(fù)制起點”或“質(zhì)粒復(fù)制子”意指能夠使質(zhì)?;蜉d體體內(nèi)復(fù)制的多核苷酸。細(xì)菌復(fù)制起點的實例是允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177和pACYC184的復(fù)制起點,和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUBllO、pE194、pTA1060和ρΑΜβI的復(fù)制起點。用于酵母宿主細(xì)胞中的復(fù)制起點的實例是2微米復(fù)制起點,ARS1,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細(xì)胞中有用的復(fù)制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分離AMAl基因和構(gòu)建包含該基因的質(zhì)粒或載體能夠根據(jù)公開于W000/24883中的方法完成??梢詫⒍嘤谝粋€拷貝的本發(fā)明的多核苷酸插入宿主細(xì)胞以增加多肽的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得:將至少一個額外拷貝的序列整合入宿主細(xì)胞基因組,或?qū)⒖蓴U增的選擇性標(biāo)記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細(xì)胞來選擇含有選擇性標(biāo)記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細(xì)胞。用于連接上述元件以構(gòu)建本發(fā)明的重組表達載體的方法是本領(lǐng)域技術(shù)人員熟知的(參見,例如,Sambrook等,1989,見上文)。蘋果酸脫氫酶和編碼蘋果酸脫氫酶的多核苷酸在重組宿主細(xì)胞及其使用方法的一些方面,所述宿主細(xì)胞具有蘋果酸脫氫酶活性。在一些方面,所述宿主細(xì)胞包含編碼蘋果酸脫氫酶的異源多核苷酸。所述蘋果酸脫氫酶可為任何適于實施本發(fā)明的蘋果酸脫氫酶。在一個方面,所述蘋果酸脫氫酶是存在于宿主細(xì)胞胞質(zhì)溶膠中的酶。在本文所述的重組宿主細(xì)胞和方法的一個方面,所述蘋果酸脫氫酶是:(a)蘋果酸脫氫酶,其與SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與以下雜交:(i)SEQIDN0:11或其成熟多肽編碼序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈;(c)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸與以下具有至少60%序列同一性:(iv)SEQIDNO:11或其成熟多肽編碼序列,(v)SEQIDN0:11的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈;(d)SEQIDNO:12或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的蘋果酸脫氫酶變體;和(e)(a)、(b)、(c)或(d)的多肽具有蘋果酸脫氫酶活性的片段。在一個方面,所述蘋果酸脫氫酶包含或組成為氨基酸序列,所述氨基酸序列與SEQIDNO:12或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一'丨生。在一個方面,所述蘋果酸脫氫酶包含氨基酸序列,所述氨基酸序列與SEQIDNO:12或其成熟多肽序列相差不多于十個氨基酸,例如不多于五個氨基酸,不多于四個氨基酸,不多于三個氨基酸,不多于兩個氨基酸,或一個氨基酸。在一個方面,所述蘋果酸脫氫酶包含或組成為SEQIDNO:12的氨基酸序列,SEQIDNO:12的成熟多肽序列,其等位變體,或前述的具有蘋果酸脫氫酶活性的片段。在另一個方面,所述蘋果酸脫氫酶包含或組成為SEQIDN0:12的氨基酸序列。在另一個方面,所述蘋果酸脫氫酶包含或組成為SEQIDNO:12的成熟多肽序列。在另一個方面,所述蘋果酸脫氫酶包含或組成為SEQIDNO:12的氨基酸I至330。在一個方面,所述蘋果酸脫氫酶由多核苷酸編碼,所述多核苷酸在至少低嚴(yán)格條件,例如中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:(i)SEQIDNO:11或其成熟多肽編碼序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈(參見,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,見上文)。在一個方面,所述蘋果酸脫氫酶由多核苷酸編碼,所述多核苷酸與(iv)SEQIDNO:11或其成熟多肽編碼序列,(V)SEQIDNO:11的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述蘋果酸脫氫酶由SEQIDNO:11,或其成熟多肽編碼序列編碼。在一個方面,所述蘋果酸脫氫酶由SEQIDNO:11編碼。在一個方面,所述蘋果酸脫氫酶由SEQIDNO:11的成熟多肽編碼序列編碼。在一個方面,所述蘋果酸脫氫酶由SEQIDNO:11的亞序列編碼,其中所述亞序列編碼具有蘋果酸脫氫酶活性的多肽。在一個方面,所述亞序列含有SEQIDNO:11的至少885個核苷酸,例如至少930個核苷酸或至少975個核苷酸。在一個方面,所述蘋果酸脫氫酶為SEQIDNO:12或其成熟多肽序列的包含一個或多個(例如兩個、幾個)氨基酸的取代、缺失和/或插入的變體,如上文所述。在一個方面,所述蘋果酸脫氫酶為SEQIDNO:12的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述蘋果酸脫氫酶為SEQIDN0:12的成熟多肽序列的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一些方面,SEQIDNO:12或其成熟多肽序列的氨基酸取代、缺失和/或插入的總數(shù)不多于10,例如不多于1,2,3,4,5,6,7,8或9。在另一個方面,所述蘋果酸脫氫酶是SEQIDNO:12或其成熟多肽序列的片段,其中所述片段具有蘋果酸脫氫酶活性。在一個方面,所述的片段含有SEQIDN0:12的至少295個氨基酸殘基,例如至少310個氨基酸殘基,或至少325個氨基酸殘基。所述蘋果酸脫氫酶亦可為蘋果酸脫氫酶的等位變體或人工變體。所述蘋果酸脫氫酶亦可包括融合多肽或可切割的融合多肽,如上文所述。用于分離或克隆編碼蘋果酸脫氫酶的多核苷酸的技術(shù)如上文中所述。SEQIDNO:11的多核苷酸;或其亞序列;以及SEQIDNO:12的氨基酸序列;或其片段;可用于設(shè)計核酸探針以從不同屬或種的菌株鑒定和克隆編碼蘋果酸脫氫酶的DNA,如上文中所述。本發(fā)明涵蓋此類探針??蓪拇祟惼渌镏苽涞幕蚪MDNA或cDNA篩選與如上所述的探針雜交并編碼蘋果酸脫氫酶的DNA,如上文中所述。在一個方面,所述核酸探針為SEQIDNOill0在另一個方面,所述核酸探針為SEQIDNO:11的成熟多肽編碼序列。在另一個方面,所述核酸探針是多核苷酸序列,其編碼SEQIDNO:12,其成熟多肽序列或前述序列的片段。對于長度至少100個核苷酸的長探針,非常低至非常高的嚴(yán)格條件和洗滌條件如上文中所述定義。對于長度大約15個核苷酸至大約70個核苷酸的短探針,嚴(yán)格條件和洗滌條件如上文中所述定義。所述蘋果酸脫氫酶可獲得自任何屬的微生物。在一個方面,所述蘋果酸脫氫酶可為從本文中所述的微生物獲得的細(xì)菌、酵母或絲狀真菌蘋果酸脫氫酶。在另一個方面,所述蘋果酸脫氫酶是米曲霉蘋果酸脫氫酶,例如SEQIDNO:12的米曲霉蘋果酸脫氫酶。其它可用于實施本發(fā)明的蘋果酸脫氫酶包括但不限于:構(gòu)巢曲霉蘋果酸脫氫酶(AN6717.1;SMS等,2004,Mycol.Res.108:853-857);黑曲霉蘋果酸脫氫酶(Anl6g00120;Pel等,2007,NatureBiotechnology25:221-231);Phytophthorainfestans蘋果酸脫氫酶(PITG13614.1;Calcagno等,2009,MycologicalResearchl13:771-781);釀酒酵母蘋果酸脫氫酶(YKL085W;McAlister-Henn和Thompson,1987,JBacteriol.169:5157-5166);埃默森踩節(jié)菌(Talaromycesemersonii)蘋果酸脫氧酶(AF439996,AF487682;Maloney等,2004,Eur.J.Biochem.271:3115-3126);以及玉蜀黍黑粉菌(Ustilagomaydis)蘋果酸脫氫酶(um00403,umlll61;McCann和Snetselaar,2008,F(xiàn)ungalGeneticsandBiology45:S77-S87),SEQIDNO:20的米曲霉蘋果酸脫氫酶(其由SEQIDNO:19的核苷酸序列所編碼;參見美國申請?zhí)?2/870,523,標(biāo)題為“MethodsforImprovingMalicAcidProductioninFilamentousFungi”,2010年8月27日提交),或任何相應(yīng)的參考文獻中所述的蘋果酸脫氫酶的任何方面。本發(fā)明涵蓋將本文中所述的序列同一性、雜交、變體和片段的任何方面適用于如上所述的蘋果酸脫氫酶多肽序列和多核苷酸序列。舉例而言,在一個方面,所述蘋果酸脫氫酶是(a)蘋果酸脫氫酶,其與SEQIDNO:20或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件,例如中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDN0:19或其成熟多肽編碼序列,(ii)SEQIDNO:19的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈;(c)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸與(iv)SEQIDN0:19或其成熟多肽編碼序列,(v)SEQIDNO:19的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:20或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的蘋果酸脫氫酶變體;和(e)(a)、(b)、(c)或(d)的多肽具有蘋果酸脫氫酶活性的片段。所述蘋果酸脫氫酶亦可從其它來源鑒定和獲取,所述來源包括從自然界(例如土壤、堆肥、水等)分離的微生物或直接從自然材料(例如土壤、堆肥、水等)獲得的DNA樣品,如上文中所述。丙酮酸羧化酶和編碼丙酮酸羧化酶的多核苷酸在重組宿主細(xì)胞及其使用方法的一些方面,所述宿主細(xì)胞具有丙酮酸羧化酶活性。在一些方面,所述宿主細(xì)胞包含編碼丙酮酸羧化酶的異源多核苷酸。所述丙酮酸羧化酶可為任何適于實施本發(fā)明的丙酮酸羧化酶。在一個方面,所述丙酮酸羧化酶是存在于宿主細(xì)胞胞質(zhì)溶膠中的酶。在本文所述的重組宿主細(xì)胞和方法的一個方面,所述丙酮酸羧化酶是:(a)丙酮酸羧化酶,其與SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與以下雜交:(i)SEQIDN0:15或其成熟多肽編碼序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈;(c)丙酮酸羧化酶,其由多核苷酸編碼,所述多核苷酸與以下具有至少60%序列同一性:(iv)SEQIDNO:15或其成熟多肽編碼序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈;(d)SEQIDNO:16或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的丙酮酸羧化酶變體;和(e)(a)、(b)、(C)或(d)的多肽具有丙酮酸羧化酶活性的片段。在一個方面,所述丙酮酸羧化酶包含或組成為氨基酸序列,所述氨基酸序列與SEQIDNO:16或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一性。在一個方面,所述丙酮酸羧化酶包含氨基酸序列,所述氨基酸序列與SEQIDNO:16或其成熟多肽序列相差不多于十個氨基酸,例如不多于五個氨基酸,不多于四個氨基酸,不多于三個氨基酸,不多于兩個氨基酸,或一個氨基酸。在一個方面,所述丙酮酸羧化酶包含或組成為SEQIDNO:16的氨基酸序列,SEQIDNO:16的成熟多肽序列,其等位變體,或前述序列的具有丙酮酸羧化酶活性的片段。在另一個方面,所述丙酮酸羧化酶包含或組成為SEQIDNO:16的氨基酸序列。在另一個方面,所述丙酮酸羧化酶包含或組成為SEQIDN0:16的成熟多肽序列。在另一個方面,所述丙酮酸羧化酶包含或組成為SEQIDNO:16的氨基酸I至1193。在一個方面,所述丙酮酸羧化酶由多核苷酸編碼,所述多核苷酸在至少低嚴(yán)格條件,例如中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:(i)SEQIDNO:15或其成熟多肽編碼序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)`的全長互補鏈(參見,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,見上文)。在一個方面,所述丙酮酸羧化酶由多核苷酸編碼,所述多核苷酸與(iv)SEQIDNO:15或其成熟多肽編碼序列,(V)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述丙酮酸羧化酶由SEQIDNO:15或其成熟多肽編碼序列編碼。在一個方面,所述丙酮酸羧化酶由SEQIDNO:15編碼。在一個方面,所述丙酮酸羧化酶由SEQIDNO:15的成熟多肽編碼序列編碼。在一個方面,所述丙酮酸羧化酶由SEQIDNO:15的亞序列編碼,其中所述亞序列編碼具有丙酮酸羧化酶活性的多肽。在一個方面,所述亞序列含有SEQIDNO:15的至少3060個核苷酸,例如至少3240個核苷酸或至少3420個核苷酸。在一個方面,所述丙酮酸羧化酶為SEQIDNO:16或其成熟多肽序列的包含一個或多個(例如兩個、幾個)氨基酸的取代、缺失和/或插入的變體,如上文所述。在一個方面,所述丙酮酸羧化酶為SEQIDNO:16的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一個方面,所述丙酮酸羧化酶為SEQIDN0:16的成熟多肽序列的包含一個或多個氨基酸的取代、缺失和/或插入的變體。在一些方面,SEQIDNO:16或其成熟多肽序列的氨基酸取代、缺失和/或插入的總數(shù)不多于16,例如不多于1,2,3,4,5,6,7,8或9。在另一個方面,所述丙酮酸羧化酶是SEQIDNO:16或其成熟多肽序列的片段,其中所述片段具有丙酮酸羧化酶活性。在一個方面,所述的片段含有SEQIDN0:16的至少1020個氨基酸殘基,例如至少1080個氨基酸殘基,或至少1140個氨基酸殘基。所述丙酮酸羧化酶亦可為丙酮酸羧化酶的等位變體或人工變體。所述丙酮酸羧化酶亦可包括融合多肽或可切割的融合多肽,如上文所述。所述丙酮酸羧化酶可為線粒體丙酮酸羧化酶的變體,使得體內(nèi)輸入線粒體減少,由此增加所述丙酮酸羧化酶在胞質(zhì)溶膠中的水平。用于分離或克隆編碼丙酮酸羧化酶的多核苷酸的技術(shù)如上文中所述。SEQIDNO:15的多核苷酸;或其亞序列;以及SEQIDNO:16的氨基酸序列;或其片段;可用于設(shè)計核酸探針以從不同屬或種的菌株鑒定和克隆編碼丙酮酸羧化酶的DNA,如上文中所述。本發(fā)明涵蓋此類探針??蓪拇祟惼渌镏苽涞幕蚪MDNA或cDNA篩選與如上所述的探針雜交并編碼丙酮酸羧化酶的DNA,如上文所述。在一個方面,所述核酸探針為SEQIDN0:15。在另一個方面,所述核酸探針為SEQIDNO:15的成熟多肽編碼序列。在另一個方面,所述核酸探針是多核苷酸序列,其編碼SEQIDNO:16,其成熟多肽序列或前述序列的片段。對于長度至少100個核苷酸的長探針,非常低至非常高的嚴(yán)格條件和洗滌條件如上文中所述定義。對于長度大約15個核苷酸至大約70個核苷酸的短探針,嚴(yán)格條件和洗滌條件如上文中所述定義。所述丙酮酸羧化酶可獲得自任何屬的微生物。在一個方面,所述丙酮酸羧化酶可為從本文中所述的微生物獲得的細(xì)菌、酵母或絲狀真菌丙酮酸羧化酶。在另一個方面,所述丙酮酸羧化酶是米曲霉丙酮酸羧化酶,例如SEQIDNO:16的米曲霉丙酮酸羧化酶。其它可用于實施本發(fā)明的丙酮酸羧化酶包括但不限于:棒曲霉(Aspergillusclavatus)NRRLl丙酮酸羧化酶(XP_001271664;DirectSubmission,Submitted(26-0CT-2006),TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);煙曲霉Af293丙酮酸羧化酶(XP_752054;Nierman等,2005,Nature438:1151-1156);構(gòu)巢曲霉FGSCA4丙酮酸羧化酶(XP_662066;Galagan等,2005,Nature438:1105-1115);黑曲霉丙酮酸羧化酶(Anl5g02820;Pel等,2007,NatureBiotechnology25:221-231;ASPNG5061;Panneman等,(JUL-1998)提交至EMBL/GenBank/DDBJ數(shù)據(jù)庫);土曲霉丙酮酸羧化酶(093918;DirectSubmission,Submitted(0CT-1998)TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);灰梨抱菌(Magnaporthegrisea)70-15丙酮酸羧化酶(XP_367852;DirectSubmission,Submitted(26-SEP-2005)BroadInstituteofMITandHarvard,320CharlesStreet,Cambridge,MA02142,USA);粗糖脈抱菌0R74A丙酮酸羧化酶(XP_965636;Galagan等,2003,Nature422:859-868);米根霉(Rhizopusoryzae)丙酮酸羧化酶(R03G_06931.1);釀酒酵母丙酮酸羧化酶(NP_009777;Gaffeau等,1996,Science274:546-547);粟酒裂殖酵母丙酮酸羧化酶(NP_595900;DirectSubmission,Submitted(29-JUN-2007)EuropeanSchizosaccharomycesgenomesequencingproject,SangerInstitute,TheWellcomeTrustGenomeCampus,Hinxton,CambridgeCB101SA);和玉蜀黍黑粉菌丙酮酸羧化酶(um01054;McCann和Snetselaar,2008,F(xiàn)ungalGeneticsandBiology45:S77-S87)。本發(fā)明涵蓋將本文中所述的序列同一性、雜交、變體和片段的任何方面適用于其它如上所述的丙酮酸羧化酶多肽序列和多核苷酸序列。所述丙酮酸羧化酶亦可從其它來源鑒定和獲取,所述來源包括從自然界(例如土壤、堆肥、水等)分離的微生物或直接從自然材料(例如土壤、堆肥、水等)獲得的DNA樣品,如上文中所述。宿主細(xì)胞如本文中所述,本發(fā)明還涉及重組宿主細(xì)胞,其包含本文中所述的多核苷酸可操作地連接于一個或多個(例如兩個、幾個)調(diào)控序列,所述調(diào)控序列指導(dǎo)本文中所述的多肽的產(chǎn)生。本發(fā)明還涵蓋重組宿主細(xì)胞,其包含一個或多個本文中所述的多核苷酸,所述多核苷酸可為可操作地連接于一個或多個調(diào)控序列,所述調(diào)控序列指導(dǎo)一種或多種所述多肽的表達,以供重組產(chǎn)生C4-二羧酸,以及本發(fā)明涉及使用此類宿主細(xì)胞以供產(chǎn)生C4-二羧酸的方法。所述宿主細(xì)胞可包含任何一種或多種本文中所述的多核苷酸的組合。舉例而言,在一個方面,所述重組宿主細(xì)胞包含編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸,并任選地包含編碼蘋果酸脫氫酶的異源多核苷酸,和/或編碼丙酮酸脫羧酶的異源多核苷酸;其中所述宿主細(xì)胞與不含有所述編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸的宿主細(xì)胞在相同條件下培養(yǎng)時相比產(chǎn)生(或能夠產(chǎn)生)更多量的C4-二羧酸。在一個方面,所述重組宿主細(xì)胞包含:(I)異源多核苷酸,其編碼C4-二羧酸轉(zhuǎn)運蛋白,如選自下組的C4-二羧酸轉(zhuǎn)運蛋白:(a)C4-二羧酸轉(zhuǎn)運蛋白,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少60%序列同一性;(b)C4-二羧酸轉(zhuǎn)運蛋白,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與以下雜交:SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈;(c)C4-二羧酸轉(zhuǎn)運蛋白,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈具有至少60%序列同一性;(d)SEQIDN0:2、4或6,或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的C4-二羧酸轉(zhuǎn)運蛋白變體;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段;(2)任選的異源第二多核苷酸,其編碼蘋果酸脫氫酶,如選自下組的蘋果酸脫氫酶:(a)蘋果酸脫氫酶,其與SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與以下雜交:(i)SEQIDNO:11或其成熟多肽編碼序列,(ii)SEQIDN0:11的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈;(c)蘋果酸脫氫酶,其由多核苷酸編碼,所述多核苷酸與以下具有至少60%序列同一性:(iv)SEQIDNO:11或其成熟多肽編碼序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈;(d)SEQIDNO:12或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的蘋果酸脫氫酶變體;和(e)(a)、(b)、(c)或(d)的多肽具有蘋果酸脫氫酶活性的片段;和(3)任選的異源第三多核苷酸,其編碼丙酮酸羧化酶,如選自下組的丙酮酸羧化酶:(a)丙酮酸羧化酶,其與SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件下與以下雜交:(i)SEQIDNO:15或其成熟多肽編碼序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補鏈;(c)丙酮酸羧化酶,其由多核苷酸編碼,所述多核苷酸與以下具有至少60%序列同一性:(iv)SEQIDNO:15或其成熟多肽編碼序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽編碼序列,或(vi)(iv)或(V)的全長互補鏈;(d)SEQIDNO:16或其成熟多肽序列的包含一個或多個氨基酸(例如兩個、幾個)的取代、缺失和/或插入的丙酮酸羧化酶變體;和(e)(a)、(b)、(C)或(d)的多肽具有丙酮酸羧化酶活性的片段;其中所述宿主細(xì)胞與不含有所述一種或多種多核苷酸(例如不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸)的宿主細(xì)胞在相同條件下培養(yǎng)時相比產(chǎn)生(或能夠產(chǎn)生)更多量的C4-二羧酸。在一個方面,所述宿主細(xì)胞包含編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面)和編碼蘋果酸脫氫酶的異源多核苷酸。在本發(fā)明中,所述蘋果酸脫氫酶可為任何適于實施本發(fā)明的蘋果酸脫氫酶,如上文所述。在另一個方面,所述宿主細(xì)胞包含編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面)和編碼丙酮酸羧化酶的異源多核苷酸。在本發(fā)明中,所述丙酮酸羧化酶可為任何適于實施本發(fā)明的丙酮酸羧化酶,如上文所述。具體而言,所述丙酮酸羧化酶優(yōu)選為存在于宿主細(xì)胞胞質(zhì)溶膠中的酶。在一個方面,所述宿主細(xì)胞包含編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面),編碼蘋果酸脫氫酶的第二異源多核苷酸,和編碼丙酮酸羧化酶的第三異源多核苷酸。將包含一個或多個(例如兩個、幾個)的多核苷酸的一個構(gòu)建體或載體(或多個構(gòu)建體或載體)導(dǎo)入宿主細(xì)胞,使所述構(gòu)建體或載體如前所述作為染色體整合體或者作為自復(fù)制的染色體外載體維持。術(shù)語“宿主細(xì)胞”涵蓋任何親本細(xì)胞的后代,其由于在復(fù)制中發(fā)生的突變而與親本細(xì)胞不同。在一些情況下,宿主細(xì)胞的選擇會很大程度上依賴于編碼多肽的基因及其來源。下文中所述的方面適用于宿主細(xì)胞本身,以及使用宿主細(xì)胞的方法。所述宿主細(xì)胞可為任何能夠重組產(chǎn)生本發(fā)明的多肽的細(xì)胞,例如原核細(xì)胞或真核細(xì)胞,和/或任何能夠重組產(chǎn)生C4-二羧酸(例如蘋果酸)的細(xì)胞(例如任何絲狀真菌細(xì)胞)。原核宿主細(xì)胞可以是任何革蘭氏陽性或革蘭氏陰性細(xì)菌。革蘭氏陽性細(xì)菌包括但不限于,芽孢桿菌屬、梭菌屬、腸球菌屬、地芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬和鏈霉菌屬。革蘭氏陰性細(xì)菌包括但不限于,彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬和脲原體屬。細(xì)菌宿主細(xì)胞可以是任何芽孢桿菌屬細(xì)胞,包括但不限于嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈球菌屬細(xì)胞,包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈霉菌屬細(xì)胞,包括但不限于,不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細(xì)胞。可通過如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細(xì)胞:例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Chang和Cohenj1979,Mol.Gen.Genet.168:111-115),使用感受態(tài)細(xì)胞(參見,例如,Young和Spizizenj1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-AbeIson,1971,J.Mol.Biol.56:209-221),電穿孑L(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thornej1987,J.Bacteriol.169:5771-5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細(xì)胞:例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Hanahanj1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈霉菌屬細(xì)胞:例如原生質(zhì)體轉(zhuǎn)化和電穿孔(參見,例如,Gong等,2004,F(xiàn)oliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或轉(zhuǎn)導(dǎo)(參見,例如,Burke等,2001,Proc.Natl.Acad.Sc1.USA98:6289-6294)ο可通過如下方法實現(xiàn)將DNA引入到假單胞菌屬細(xì)胞:例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smetsj2005,Appl.Environ.Microbiol.71:51-57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌屬細(xì)胞:例如天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsuj1981,Infect.1mmun.32:1295-1297),原生質(zhì)體轉(zhuǎn)化(參見,例如,Catt和Jollickj1991,Microbios.68:189-207),電穿孑L(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewellj1981,Microbiol.Rev.45:409-436)。然而,可以使用本領(lǐng)域已知的用于將DNA引入宿主細(xì)胞的任何方法。宿主細(xì)胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細(xì)胞。所述宿主細(xì)胞可為真菌細(xì)胞?!罢婢庇迷诒疚陌ㄒ韵麻T:子囊菌門(Ascomycota)、擔(dān)子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby,sDictionaryofTheFungij第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用)和所有有絲分裂抱子真菌(mitosporicfungi)(Hawksworth等,1995,見上)。所述真菌宿主細(xì)胞可為酵母細(xì)胞。“酵母”用在本文包括產(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)抱霉目(Endomycetales))、產(chǎn)擔(dān)子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesN0.9,1980)中所述。所述酵母宿主細(xì)胞可為假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細(xì)胞,如乳酸克魯維酵母(Kluyveromyceslactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂西洋蓍霉(YarrowiaIipolytica)細(xì)胞。所述真菌宿主細(xì)胞可為絲狀真菌細(xì)胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復(fù)雜多糖組成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細(xì)胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。所述絲狀真菌宿主細(xì)胞可為枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、FiIibasidium、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細(xì)胞。所述絲狀真菌宿主細(xì)胞可為棘孢曲霉、泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkanderaadusta)、干擬臘菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta>Ceriporiopsisrivulosa>Ceriporiopsissubrufa、蟲擬臘菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角質(zhì)金抱子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium>|^^|il^|Mf>Chrysosporiumqueenslandicum>熱帶金孢子菌、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌、福射射脈菌(Phlebiaradiata)、刺療側(cè)耳(Pleurotuseryngii)、土生梭抱霉、長絨毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細(xì)胞。在一個方面,所述宿主細(xì)胞是曲霉屬宿主細(xì)胞。在另一個方面,所述宿主細(xì)胞是米曲霉??梢詫⒄婢?xì)胞通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁再生的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細(xì)胞的合適方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和W096/00787描述??梢允褂糜扇缦挛墨I描述的方法轉(zhuǎn)化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.1.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,ppl82-187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sc1.USA75:1920。在一些方面,所述宿主細(xì)胞包含一種或多種(例如兩種、幾種)本文中所述的多核苷酸,其中所述宿主細(xì)胞與不含有所述一種或多種多核苷酸的宿主細(xì)胞在相同條件下培養(yǎng)時相比分泌(或能夠分泌)增加水平的C4-二羧酸。在一些方面,所述宿主細(xì)胞與不含有所述一種或多種多核苷酸(例如不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸)的宿主細(xì)胞在相同條件下培養(yǎng)時相比,分泌和/或能夠分泌增加至少5%,例如至少10%,至少15%,至少20%,至少25%,至少50%,至少100%,至少150%,至少200%,至少300%,或500%的水平的C4-二羧酸(例如蘋果酸)。在本文中所述的重組宿主細(xì)胞和方法的任何方面中,所述C4-二羧酸可為蘋果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸,或其組合。在一些方面中,所述C4-二羧酸是蘋果酸、琥珀酸或延胡索酸,或其組合。在一些方面中,所述C4-二羧酸是蘋果酸或延胡索酸,或蘋果酸和延胡索酸的組合。在一些方面中,所述C4-二羧酸是蘋果酸。在任何這些方面,所述宿主細(xì)胞以比理論值高至少10%,例如至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%或至少90%的產(chǎn)率(yield)產(chǎn)生(和/或能夠產(chǎn)生)C4-二羧酸。在任何這些方面,所述重組宿主具有大于約0.lg/L每小時,例如,大于約0.2g/L每小時,0.5g/L每小時,0.6g/L每小時,0.7g/L每小時,0.8g/L每小時,0.9g/L每小時,1.0g/L每小時,1.lg/L每小時,1.2g/L每小時,1.3g/L每小時,1.5g/L每小時,1.75g/L每小時,2.0g/L每小時,2.25g/L每小時,2.5g/L每小時,或3.0g/L每小時;或約0.lg/L每小時至約2.0g/L每小時,例如,約0.3g/L每小時至約1.7g/L每小時,約0.5g/L每小時至約1.5g/L每小時,約0.7g/L每小時至約1.3g/L每小時,約0.8g/L每小時至約1.2g/L每小時,或約0.9g/L每小時至約1.lg/L每小時的C4-二羧酸體積生產(chǎn)力(volumetricproductivity)(例如蘋果酸體積生產(chǎn)力)。可將所述重組宿主細(xì)胞在適于產(chǎn)生C4-二羧酸轉(zhuǎn)運蛋白、蘋果酸脫氫酶或丙酮酸羧化酶的營養(yǎng)培養(yǎng)基中使用如下所述的本領(lǐng)域中公知的方法進行培養(yǎng)。所述C4-二羧酸轉(zhuǎn)運蛋白、蘋果酸脫氫酶和丙酮酸羧化酶,及其活性,可使用本領(lǐng)域中公知的方法檢測。這些檢測方法可包括使用特異性抗體,酶產(chǎn)物的形成,或酶底物的消失。參見,例如Sambrook等,MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarborLaboratory,NewYork(2001);Ausubel等,CurrentProtocolsinMolecularBiology,JohnWileyandSons,Baltimore,MD(1999);及Hanai等,Appl.Environ.Microbiol.73:7814-7818(2007))。產(chǎn)生方法本發(fā)明還涉及產(chǎn)生本文中所述的多肽(例如,包含或組成為SEQIDN0:2、4、6或其任何所述的方面的多肽)的方法,其包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在一個方面,所述細(xì)胞是曲霉屬的細(xì)胞。在另一個的方面,所述細(xì)胞是棘孢曲霉。在另一個的方面,所述細(xì)胞是大腸桿菌NRRLB50400、大腸桿菌NRRLB-50388或大腸桿菌NRRLB50401。本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)本發(fā)明的重組宿主細(xì)胞,和(b)回收所述多肽。使用本領(lǐng)域熟知的方法在適合于產(chǎn)生C4-二羧酸轉(zhuǎn)運蛋白的營養(yǎng)培養(yǎng)基中培養(yǎng)宿主細(xì)胞。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細(xì)胞。使用本領(lǐng)域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽未分泌,其可從細(xì)胞裂解物(lysate)回收。如上文中所述,可以使用本領(lǐng)域已知的對于多肽是特異性的方法來檢測C4-二羧酸轉(zhuǎn)運蛋白。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于確定多肽的活性。多肽可以使用本領(lǐng)域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。多肽可以通過多種本領(lǐng)域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J._C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。在另一個方面,不回收所述多肽,而是使用表達多肽的本發(fā)明的宿主細(xì)胞作為多肽的來源。植物本發(fā)明還涉及植物,例如,轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其包含本發(fā)明的多肽,從而以可回收的量表達和產(chǎn)生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該多肽的植物或植物部分用于改進食品或飼料的質(zhì)量,例如,改進營養(yǎng)價值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗?fàn)I養(yǎng)因子。轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass`)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關(guān)的模式生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細(xì)胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細(xì)胞質(zhì)(cytoplasm)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無論什么組織來源,都被認(rèn)為是植物部分。同樣地,植物部分,如分離以促進本發(fā)明的應(yīng)用的具體組織和細(xì)胞也被認(rèn)為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細(xì)胞的后代。表達多肽的轉(zhuǎn)基因植物或植物細(xì)胞可以依照本領(lǐng)域已知方法構(gòu)建。簡而言之,通過如下構(gòu)建所述植物或植物細(xì)胞:將編碼多肽的一個或多個(例如兩個、幾個)表達構(gòu)建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細(xì)胞繁殖為轉(zhuǎn)基因植物或植物細(xì)胞。表達構(gòu)建體便利地是包含編碼多肽的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸所需的適當(dāng)?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達構(gòu)建體可以包含對于鑒定整合了該表達構(gòu)建體的宿主細(xì)胞有用的選擇性標(biāo)記,和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉(zhuǎn)運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼多肽的基因的表達可以是組成型的或誘導(dǎo)型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以革巴向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成型表達,可以使用35S_CaMV、玉米泛素I和稻肌動蛋白I啟動子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantM0.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantCellPhysiol.39:885-889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,J.PlantPhysiol.152:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantCellPhysiol.39:935-941),來自歐洲油菜(Brassicanapus)的忙藏蛋白napA啟動子,或本
技術(shù)領(lǐng)域:
公知的任何其他種子特異性的啟動子,例如,在W091/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番爺?shù)膔bcs啟動子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),或來自稻的aldP基因啟動子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或傷口誘導(dǎo)的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMol.Biol.22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導(dǎo),所述非生物的處理如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現(xiàn)多肽在植物中的較高表達。例如,啟動子增強子元件可以是內(nèi)含子,其置于啟動子和編碼多肽的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白I基因的第一內(nèi)含子以增強表達。選擇性標(biāo)記基因和表達構(gòu)建體的任何其它部分可以選自本領(lǐng)域內(nèi)可用的那些。將核酸構(gòu)建體根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)并入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌屬(Agrobacterium)介導(dǎo)的轉(zhuǎn)化、病毒介導(dǎo)的轉(zhuǎn)化、顯微注射(microinjection)、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對于這些植物常常使用其他的轉(zhuǎn)化方法。目前,產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選的方法,是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,Curr.0pin.Biotechnol.5:158-162;Vasil等,1992,Bio/TechnologylO:667-674)。轉(zhuǎn)化單子葉植物的可供選擇的方法基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它依照本公開使用的轉(zhuǎn)化方法包括描述于美國專利號6,395,966和7,151,204中的那些(兩者均通過全文提述并入本文)。轉(zhuǎn)化之后,根據(jù)本領(lǐng)域熟知的方法選擇具有并入的表達構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設(shè)計轉(zhuǎn)化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因:例如,使用帶有兩個獨立的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過特異性重組酶位點特異性地切除選擇基因。除了用根據(jù)本發(fā)明制備的構(gòu)建體直接轉(zhuǎn)化具體植物基因型之外,還可通過將具有構(gòu)建體的植物與缺乏該構(gòu)建體的第二植物雜交來制備轉(zhuǎn)基因植物。舉例而言,可將編碼多肽的構(gòu)建體通過雜交而引入特定植物品種,而根本無需直接轉(zhuǎn)化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經(jīng)轉(zhuǎn)化的細(xì)胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文,后代可指依照本發(fā)明制備的親本植物任何世代的后裔(offspring)。此種后代可包含依據(jù)本發(fā)明制備的DNA構(gòu)建體,或依據(jù)本發(fā)明制備的DNA構(gòu)建體的一部分。雜交導(dǎo)致轉(zhuǎn)基因通過將起始種系與供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例進一步闡述于美國專利7,151,204號。植物可通過回交轉(zhuǎn)化的過程生成。舉例而言,植物包括稱作回交轉(zhuǎn)化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物。可使用遺傳標(biāo)記以協(xié)助本發(fā)明的一種或多種轉(zhuǎn)基因從一個遺傳背景基因滲入(introgression)至另一個。標(biāo)記協(xié)助的選擇提供了相對于常規(guī)育種的優(yōu)勢,在于其可用于避免由表型變異導(dǎo)致的錯誤。進一步,遺傳標(biāo)記可在特定雜交的個體后代中提供有關(guān)良種種質(zhì)相對程度的數(shù)據(jù)。舉例而言,當(dāng)具有期望性狀但除此之外(otherwise)具有非農(nóng)藝學(xué)期望的遺傳背景的植物與良種親本雜交時,可使用遺傳標(biāo)記來選擇不僅具有該目標(biāo)性狀,還具有相對較大比例期望種質(zhì)的后代。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。本發(fā)明亦涉及產(chǎn)生本發(fā)明的多肽的方法,其包括:(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)包含編碼所述多肽的多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞;和(b)回收所述多肽。去除或減少C4-二羧酸轉(zhuǎn)運蛋白活性本發(fā)明還涉及用于產(chǎn)生親本細(xì)胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導(dǎo)致在相同條件下培養(yǎng)時,與親本細(xì)胞相比突變細(xì)胞產(chǎn)生較少的所述多肽??梢允褂帽绢I(lǐng)域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除編碼所述多核苷酸的表達來構(gòu)建突變細(xì)胞。在一個優(yōu)選的方面,所述核苷酸序列是失活的。待修飾或失活的多核苷酸可以是,例如,編碼區(qū)或其對活性關(guān)鍵的部分,或表達編碼區(qū)所需的調(diào)節(jié)元件。此種調(diào)節(jié)或調(diào)控序列的實例可以是啟動子序列或其功能部分,即,足以影響多核苷酸表達的部分。其它用于可能的修飾的調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄激活子??梢酝ㄟ^向親本細(xì)胞施以誘變,并且選擇其中已將所述多核苷酸的表達減少或消除的突變細(xì)胞來進行多核苷酸的修飾或失活。誘變(其可為特異性的或隨機的)可以通過例如使用合適的物理或化學(xué)誘變劑進行,通過使用合適的寡核苷酸進行,或通過對所述DNA序列進行PCR產(chǎn)生的誘變來進行。此外,可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發(fā)明目的的物理或化學(xué)誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N’-硝基-N-亞硝基胍(MNNG)、0-甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當(dāng)使用這些試劑時,通常通過如下方法來進行所述誘變:在合適條件下存在所選的誘變劑時溫育待誘變的親本細(xì)胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變細(xì)胞。通過導(dǎo)入、取代或去除基因或其轉(zhuǎn)錄或翻譯所需的調(diào)控元件中的一個或多個(例如兩個、幾個)核苷酸可以實現(xiàn)所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導(dǎo)致引入終止密碼子,去除起始密碼子,或改變開讀框。按照本領(lǐng)域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以完成此種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進行,即,直接在表達待修飾的多核苷酸的細(xì)胞上進行,但優(yōu)選如下面所示例的那樣在體外進行所述修飾。消除或減少核苷酸序列通過細(xì)胞的表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術(shù)。例如,在基因破壞方法中,將相應(yīng)于內(nèi)源多核苷酸的核酸序列在體外進行誘變以產(chǎn)生缺陷性的核酸序列,然后將其轉(zhuǎn)化入親本細(xì)胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代內(nèi)源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標(biāo)記,其可用于選擇其中多核苷酸被修飾或破壞的轉(zhuǎn)化體。在一個特別優(yōu)選的方面,用選擇性標(biāo)記,如本文所述的那些,來破壞所述核苷酸序列。本發(fā)明亦涉及在細(xì)胞中抑制具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的表達的方法,其包括向細(xì)胞施以或在細(xì)胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。在一個優(yōu)選的方面,所述dsRNA長度為約15,16,17,18,19,20,21,22,23,24,25或更多個雙鏈核苷酸。所述dsRNA優(yōu)選為小干擾RNA(siRNA)或微RNA(miRNA)。在一個優(yōu)選的方面,所述dsRNA是用于抑制轉(zhuǎn)錄的小干擾RNA(siRNA)。在另一個優(yōu)選的方面,所述dsRNA是用于抑制翻譯的微RNA(miRNA)。本發(fā)明亦涉及此種雙鏈RNA(dsRNA)分子,其包含SEQIDNO:1、3或5的一部分,或其成熟多肽編碼序列,以供抑制所述多肽在細(xì)胞中的表達。盡管本發(fā)明并不限于任何特定的作用機制,但所述dsRNA可進入細(xì)胞,并導(dǎo)致類似或相同序列的單鏈RNA(ssRNA),包括內(nèi)源mRNA的降解。當(dāng)細(xì)胞暴露于dsRNA時,來自同源基因的mRNA通過稱為RNA干擾(RNAi)的過程被選擇性降解。本發(fā)明的dsRNA可用于基因沉默。在一個方面,本發(fā)明提供了使用本發(fā)明的dsRNAi選擇性降解RNA的方法。該工藝可在體外、離體或體內(nèi)實施。在一個方面,所述dsRNA分子可用于在細(xì)胞、器官或動物中生成功能喪失突變。用于制備和使用dsRNA分子以選擇性降解RNA的方法在本領(lǐng)域中是公知的,參見,例如美國專利號6,489,127;6,506,559;6,511,824;和6,515,109。本發(fā)明進一步涉及親本細(xì)胞的突變細(xì)胞,其包含編碼所述多肽的多核苷酸或其調(diào)控序列的破壞或缺失,或編碼所述多肽的基因的沉默,這導(dǎo)致突變細(xì)胞與親本細(xì)胞相比產(chǎn)生較少的所述多肽或不產(chǎn)生所述多肽。多肽缺陷突變細(xì)胞作為用于表達天然或異源多肽的宿主細(xì)胞是特別有用的。因此,本發(fā)明進一步涉及產(chǎn)生天然或異源多肽的方法,其包括:(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)突變細(xì)胞;和(b)回收所述多肽。術(shù)語“異源多肽”意指對于宿主細(xì)胞并非天然的多肽,例如,天然蛋白的變體。所述宿主細(xì)胞可包含多于一個拷貝的編碼所述天然或異源多肽的多核苷酸。用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可通過本領(lǐng)域中已知的方法進行。C4-二羧酸產(chǎn)生的方法本發(fā)明還涉及使用具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的方法,或使用編碼具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的多核苷酸的方法。本文中所述的C4-二羧酸轉(zhuǎn)運蛋白或編碼該蛋白的多核苷酸可用于宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞)以協(xié)助(如增加)C4-二羧酸(例如蘋果酸)的產(chǎn)生。對于這些方法,可使用任何本文中所述的本發(fā)明的多核苷酸或多肽(例如SEQIDN0:l、2、3、4、5和/或6,或任何其所述的方面),如下文所列的方面中所例示的。在一個方面,本發(fā)明涉及產(chǎn)生C4-二羧酸(例如蘋果酸)的方法,其包括:(I)培養(yǎng)宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞),其包含編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面),其中所述宿主細(xì)胞與不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸的宿主細(xì)胞相比分泌增加水平的C4-二羧酸;和(2)回收所述蘋果酸。在另一個方面,本發(fā)明涉及相對于親本宿主細(xì)胞增加C4-二羧酸產(chǎn)生(例如蘋果酸產(chǎn)生)的方法,其包括:(I)將編碼本文中所述的C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面)轉(zhuǎn)化入宿主細(xì)胞,其中所述宿主細(xì)胞與不含有所述異源多核苷酸的絲狀真菌宿主細(xì)胞相比分泌增加水平的C4-二羧酸;(2)在培養(yǎng)基中培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細(xì)胞;和(3)回收所述C4-二羧酸。在所述方法的這些方面中的一些,C4-二羧酸是蘋果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸,或其組合。在一些方面,C4-二羧酸是蘋果酸、琥珀酸或延胡索酸,或其組合。在一些方面,C4-二羧酸是蘋果酸或延胡索酸,或蘋果酸和延胡索酸的組合。在一些方面,所述C4-二羧酸是蘋果酸。如上文所述,所述C4-二羧酸轉(zhuǎn)運蛋白可為任何本文中所述的C4-二羧酸轉(zhuǎn)運蛋白,例如選自下組的C4-二羧酸轉(zhuǎn)運蛋白:(a)多肽,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈在低嚴(yán)格條件下雜交;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽的片段。舉例而言,在一個方面,本發(fā)明涉及產(chǎn)生C4-二羧酸(例如蘋果酸)的方法,其包括:(I)培養(yǎng)宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞),其包含編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸,其中所述C4-二羧酸轉(zhuǎn)運蛋白選自:(a)多肽,其與SEQIDN0:2或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:1,其成熟多肽編碼序列,或前述序列的全長互補鏈在低嚴(yán)格條件下雜交;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:2或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主細(xì)胞與不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸的宿主細(xì)胞相比分泌增加水平的C4-二羧酸;和(2)回收所述蘋果酸。在另一個例示性方面,本發(fā)明涉及產(chǎn)生C4-二羧酸(例如蘋果酸)的方法,其包括:(I)培養(yǎng)宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞),其包含編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸,其中所述C4-二羧酸轉(zhuǎn)運蛋白選自:(a)多肽,其與SEQIDN0:4或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3,其成熟多肽編碼序列,或前述序列的全長互補鏈在低嚴(yán)格條件下雜交;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:4或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主細(xì)胞與不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸的宿主細(xì)胞相比分泌增加水平的C4-二羧酸;和(2)回收所述蘋果酸。在另一個例示性方面,本發(fā)明涉及產(chǎn)生C4-二羧酸(例如蘋果酸)的方法,其包括:(I)培養(yǎng)宿主細(xì)胞(例如絲狀真菌宿主細(xì)胞),其包含編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸,其中所述C4-二羧酸轉(zhuǎn)運蛋白選自:(a)多肽,其與SEQIDN0:6或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:5,其成熟多肽編碼序列,或前述序列的全長互補鏈在低嚴(yán)格條件下雜交;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5或其成熟多肽編碼序列具有至少65%序列同一性;(d)SEQIDNO:6或其成熟多肽序列的包含一個或多個(例如兩個,幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主細(xì)胞與不含有編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸的宿主細(xì)胞相比分泌增加水平的C4-二羧酸;和(2)回收所述蘋果酸。在本申請全文內(nèi)描述了上述方法中涵蓋的具有C4-二羧酸轉(zhuǎn)運蛋白活性的多肽的其它變化和實施方案。在所述方法的一個方面,以大于約10g/L,例如,大于約25g/L,50g/L,75g/L,100g/L,125g/L,150g/L,160g/L,170g/L,180g/L,190g/L,200g/L,210g/L,225g/L,250g/L,275g/L,300g/L,325g/L,350g/L,400g/L,或500g/L;或約lOg/L至約500g/L,例如,約50g/L至約350g/L,約lOOg/L至約300g/L,約150g/L至約250g/L,約175g/L至約225g/L,或約190g/L至約210g/L的效價產(chǎn)生或分泌所述C4-二羧酸(例如蘋果酸)。在所述方法的任何方面,在宿主細(xì)胞中產(chǎn)生或分泌的C4-二羧酸(例如蘋果酸)的水平與不包含編碼所述異源多核苷酸的多核苷酸的宿主細(xì)胞相比,在相同條件下培養(yǎng)時增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或至少500%。在所述方法的任何這些方面,所述異源多核苷酸可能可操作地連接于對于所述多核苷酸為外源的啟動子。在所述方法的任何這些方面,所述宿主細(xì)胞可進一步包含編碼蘋果酸脫氫酶的異源第二多核苷酸(例如,SEQIDNO:11的成熟多肽編碼序列,或其任何所述的方面)和/或編碼丙酮酸羧化酶的異源第三多核苷酸(例如,SEQIDNO:15的成熟多肽編碼序列,或其任何所述的方面),如上文中所述。在一些方面中,所述異源第二和/或第三多核苷酸可操作地連接于對于所述多核苷酸為外源的啟動子??捎糜谶@些方法的蘋果酸脫氫酶和丙酮酸羧化酶的實例可見于例如2010年8月27日提交的題為“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申請?zhí)朠CT/US10/47002,其內(nèi)容通過全文提述并入本文,特別是其中關(guān)于編碼蘋果酸脫氫酶和丙酮酸羧化酶多肽的多核苷酸所述的內(nèi)容。`在所述方法的任何這些方面,所述宿主細(xì)胞可為任何上述的宿主細(xì)胞,例如,絲狀真菌宿主細(xì)胞,如選自下組的宿主細(xì)胞:枝頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、煙管霉屬(Bjerkandera)、擬臘菌屬(Ceriporiopsis)、金孢子菌屬(Chrysosporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬(Cryptococcus)、Filibasidium、鍵抱屬(Fusarium)、腐質(zhì)霉屬(Humicola)、梨抱菌屬(Magnaporthe)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬(Piromyces)、側(cè)耳屬(Pleurotus)、根霉屬(Rhizopus)、裂裙菌屬(Schizophyllum)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、栓菌屬(Trametes)和木霉屬(Trichoderma)。舉例而言,所述宿主細(xì)胞可為曲霉屬宿主細(xì)胞,如米曲霉宿主細(xì)胞。在本發(fā)明的方法中,所述重組宿主細(xì)胞在適于產(chǎn)生C4-二羧酸轉(zhuǎn)運蛋白的培養(yǎng)基中,使用本領(lǐng)域中公知的方法進行培養(yǎng),如上文中所述。重組C4-二羧酸可任選地使用任何本領(lǐng)域中已知的方法從發(fā)酵培養(yǎng)基回收(參見,例如W01998/022611和U.S.7,601,865),所述方法包括但不限于層析(例如大小排阻層析、吸附層析、離子交換層析),電泳方法,差示溶解度,滲透,蒸餾,萃取(例如液-液萃取),滲透蒸發(fā)(pervaporation),提取過濾,膜過濾,膜分離,反向過濾或超濾。在一個實例中,C4-二羧酸通過過濾從發(fā)酵培養(yǎng)基中的其它材料回收。在所述方法的一些方面,在任選地純化之前和/或之后的重組C4-二羧酸是基本上純的。對于產(chǎn)生C4-二羧酸(或其具體的C4-二羧酸,如蘋果酸)的方法,“基本上純的”意指C4-二羧酸的回收的制備物含有不超過15%雜質(zhì),其中雜質(zhì)意指除了C4-二羧酸之外的化合物。在一個變化中,提供了基本上純的C4-二羧酸的制備物,其中所述制備物含有不超過25%雜質(zhì),或不超過20%雜質(zhì),或不超過10%雜質(zhì),或不超過5%雜質(zhì),或不超過3%雜質(zhì),或不超過1%雜質(zhì),或不超過0.5%雜質(zhì)。用于對于本文中所述的產(chǎn)生方法和宿主細(xì)胞測試C4-二羧酸產(chǎn)生的合適測定法可使用本文中已知的方法進行。舉例而言,最終C4-二羧酸產(chǎn)物(例如蘋果酸),和其它有機化合物,可通過方法如HPLC(高效液相色譜),GC-MS(氣相色譜-質(zhì)譜)和LC-MS(液相色譜-質(zhì)譜)或其它合適的分析方法使用本領(lǐng)域公知的常規(guī)步驟進行分析。發(fā)酵液中C4-二羧酸的釋放亦可用培養(yǎng)上清來進行測試。發(fā)酵培養(yǎng)基中的副產(chǎn)物和殘余糖(例如葡萄糖)可通過HPLC使用例如針對葡萄糖和醇的折射率檢測器,和針對有機酸的UV檢測器(Lin等,Biotechnol.Bioeng.90:775-779(2005)),或使用其它本領(lǐng)域中公知的合適測定法和檢測方法來進行定量。信號肽本發(fā)明亦涉及編碼信號肽的分離的多核苷酸。在一個方面,所述信號肽包含或組成為SEQIDNO:2的氨基酸I至61或I至68。在一些方面,編碼所述信號肽的分離的多核苷酸是SEQIDNO:1的核苷酸I至183或I至204。在另一個方面,所述信號肽包含或組成為SEQIDNO:4的氨基酸I至17。在一些方面,編碼所述信號肽的分離的多核苷酸是SEQIDN0:3的I至51。在另一個方面,所述信號肽包含或組成為SEQIDN0:6的I至68。在一些方面,編碼所述信號肽的分離的多核苷酸是SEQIDNO:5的核苷酸I至204。所述多核苷酸可進一步包含編碼蛋白的基因,其可操作地連接于信號肽和/或前肽。所述蛋白優(yōu)選對于信號肽和/或前肽是外源的。本發(fā)明亦涉及包含此類多核苷酸的核酸構(gòu)建體、表達載體和重組宿主細(xì)胞。本發(fā)明亦涉及產(chǎn)生蛋白質(zhì)的方法,其包括:(a)培養(yǎng)包含此種多核苷酸的重組宿主細(xì)胞;和(b)回收所述蛋白質(zhì)。所述蛋白質(zhì)對于宿主細(xì)胞可為天然的或異源的。術(shù)語“蛋白質(zhì)”在本文中并不意指特定長度的編碼產(chǎn)物,并因此涵蓋肽、寡肽和蛋白。術(shù)語“蛋白質(zhì)”亦涵蓋組合以形成編碼產(chǎn)物的兩個或多個多肽。蛋白質(zhì)亦包括雜合多肽和融合多肽。優(yōu)選地,所述蛋白是激素或其變體,酶,受體或其部分,抗體或其部分,或報道蛋白。舉例而言,所述蛋白可為氧還酶,轉(zhuǎn)移酶,水解酶,裂合酶,異構(gòu)酶,或連接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠酸裂合酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。所述基因可從任何原核、真核或其它來源獲得。本發(fā)明進一步通過下述實施例描述,其不應(yīng)視為對本發(fā)明范圍的限制。實施例用作緩沖液和底物是至少試劑級的商品。真菌菌株使用棘孢曲霉作為C4-二羧酸轉(zhuǎn)運蛋白基因c4t737、c4t521和mat737的來源。使用米曲霉NRRL3488(或ATCC56747)作為丙酮酸羧化酶基因、蘋果酸脫氫酶基因的來源,并用于產(chǎn)生C4-二羧酸。培養(yǎng)基YEG培養(yǎng)基組成為:20g葡萄糖,5g酵母提取物,和去離子水加至I升。COVE平板組成為:1M蔗糖,2%C0VE鹽溶液,IOmM乙酰胺,15mMCsCl,和25g/lAgarNoble0COVE鹽溶液組成為:26gKCl,26gMgSO4.7H20,76gKH2PO4,50mlCOVE痕量元素溶液,和去離子水加至I升。COVE痕量元素溶液組成為:0.04gNa2B4O7.IOH2O,0.04gCuSO4.5H20,1.2gFeSO4.7Η20,0.7gMnSO4.H20,0.8gNa2MoO2.2H20,IOgZnSO4.7H20和去離子水加至I升。種子培養(yǎng)基組成為:40g葡萄糖,6gBactoPeptone(細(xì)菌用蛋白胨),750mgKH2P04,750mgK2HPO4,IOOmgMgSO4.7Η20,IOOmgCaCl2.H2O,5mgFeS04.7Η20,5mgNaCl,和去離子水加至I升。種子培養(yǎng)基B組成為:30g葡萄糖,3gBactoPeptone,560mgKH2PO4,560mgK2HPO4,925mgNaH2PO4.H20,820mgNa2HPO4,75mgMgSO4.7H20,75mgCaCl2.H20,0.75ml的1000X微量營養(yǎng)物溶液(MicronutrientSolution),和去離子水加至I升。酸產(chǎn)生培養(yǎng)基C組成為:100g葡萄糖,80gCaCO3,6gBactoPeptone,150mgKH2PO4,150mgK2HPO4,IOOmgMgSO4.7H20,IOOmgCaCl2.H2O,ImllOOOX微量營養(yǎng)物溶液,和去離子水加至I升。發(fā)酵器批式培養(yǎng)基組成為:120g葡萄糖,120gCaCO3,9gBactoPeptone,150mgKH2PO4,150mgK2HPO4,IOOmgMgS0.7H20,IOOmgCaCl2_2H20,5mgFeSO4.7H20,5mgNaCl,5mLPluronicL61,和去離子水加至I升。1000X微量營養(yǎng)物溶液組成為:5gNaCl,5gFeSO4.7Η20,Ig檸檬酸,和去離子水加至I升。PDA平板組成為:39g/l馬鈴薯右旋糖瓊脂。2XYT+amp平板組成為16g胰蛋白胨,IOg酵母提取物,5gNaCl,IOOmg氨節(jié)青霉素,15gBacto瓊脂,和去離子水加至I升。實施例1:棘孢曲霉C4-二羧酸轉(zhuǎn)運蛋白基因的克隆和表達載體pSaMF35的構(gòu)建分離來自棘孢曲霉的基因組DNA,即用2xl06個孢子接種至搖瓶中的IOOml的YEG培養(yǎng)基,并將所述燒瓶在34°C以160rpm振蕩溫育過夜。將菌絲體通過使用MIRAC1--OTHii(Calbiochem,SanDiego,CA,USA)帶襯里的漏斗(Iinedfunnel)的過濾來收獲,并回收了大約2g的菌絲體,并將其凍結(jié)于液氮。將凍結(jié)的菌絲體通過仍包裹在MIRACLOTH見中時迅速用錘子錘碎來破壞。然后將破壞的菌絲體轉(zhuǎn)移至含有IOml的IX裂解緩沖液(IOOmMEDTA,IOmMTrisρΗ8.0,1%TritonX-100,0.5M胍-HC1,200mMNaCl)和3μI的RNaseA(QIAGENInc.,Valencia,CA,USA,lOOmg/ml)的50ml聚丙烯錐形離心管中。將管通過輕柔的渦旋來混合,然后在室溫溫育5分鐘,之后添加150μI蛋白酶K(QIAGENInc.,Valencia,CA,USA;20mg/ml)。將管通過倒置混合,并在50。。溫育I小時。然后將管在7240xg離心20分鐘,然后將上清添加至預(yù)平衡的QIAGEN-tiplOO(QIAGENInc.,Valencia,CA,USA),而剩余的DNA提取步驟根據(jù)生產(chǎn)商的指示進行。將DNA重懸于100μITE緩沖液(IOmMTris堿,ImMEDTA,ρΗ8.0)中。將1194bpC4_二羧酸轉(zhuǎn)運蛋白基因c4t737從棘孢曲霉基因組DNA使用下示的引物069698和069699擴增。引物069698:5,-GTGATAGAACATCGTCCATAATGCTCGGGCAACACT-3’(SEQIDNO:7)引物069699:5’-GTGTCAGTCACCTCTAGTTATTACTCCGATACATCCTCGT-3’(SEQIDNO:8)PCR反應(yīng)物組成為:5μIlOX反應(yīng)緩沖液(Stratagene,LaJolla,CA,USA),IμI棘孢曲霉DNA模板(105ng/yI),IμI引物069698(lOOng/μI),IμI引物069699(lOOng/μI),IμIdNTP混合物(IOmM),40.5μI去離子水,和0.5μIHerculaseHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。將擴增反應(yīng)溫育于EPPENDORFyoMASIERCYCLERj(EppendorfScientificInc.ffestbury,NewYork,USA),其程序如下:I個循環(huán),在95°C進行2分鐘;10個循環(huán),每個95°C進行10秒,60V進行30秒,和72°C進行1.5分鐘;和20個循環(huán),每個在95°C進行10秒,60°C進行30秒,72°C進行1.5分鐘且每循環(huán)加10秒。然后使用MinElute⑩PCRPurificationKit(QIAGENInc.,Valencia,CA,USA)純化PCR產(chǎn)物。將質(zhì)粒pShTh60(圖1;亦參見2010年8月27日提交的PCR申請?zhí)朠CT/US10/47002)用SexAl和PacI消化,通過TBE緩沖液(10.8g/LTris堿,5.5g/L硼酸,2mMEDTA,pH8.0)中的0.8%瓊脂糖凝膠電泳分離,并使用(、)j.A(、)UICKiiGelExtractionKit(QIAGENInc.,Valencia,CA,USA)純化。然后將上述純化的PCR產(chǎn)物使用In-FusionAdvantage反應(yīng)試劑盒(Clontech,MountainView,CA,USA)插入消化的pShTh60片段中,該反應(yīng)組成為2μ15Χ緩沖液(Clontech,MountainView,CA,USA),2.4μI純化的PCR產(chǎn)物(33ng/yI),1.5μI消化和凝膠純化的pShTh60(132ng/μI),IμIIn-Fusion酶和3.1μI去尚子水。將反應(yīng)在37°C溫育15分鐘,50°C溫育15分鐘,置于冰上5分鐘,并用40μITE緩沖液(IOmMTris堿,ImMEDTA,ρΗ8.0)稀釋,得到pSaMF35(圖2)。將上述含有pSaMF35的連接反應(yīng)產(chǎn)物的2.5μI等分試樣根據(jù)生產(chǎn)商的指示轉(zhuǎn)化ΛONI':SI])If'.Τ0Ρ10化學(xué)感受態(tài)大腸桿菌細(xì)胞(Invitrogen,SanDiego,CA,USA)。將轉(zhuǎn)化物鋪板于2XYT+amp平板上,并在37°C溫育過夜。挑取所得的轉(zhuǎn)化體,并對其進行DNA測序以確認(rèn)c4t737基因整合入載體。棘孢曲霉c4t737基因的核苷酸序列(SEQIDNO:1)和推導(dǎo)的氨基酸序列(SEQIDNO:2)顯示于圖3。編碼序列為1194bp,包含終止密碼子。編碼的預(yù)測蛋白為397個氨基酸,具有44.3kDa的預(yù)測分子量和6.93的等電點pH。該基因不含內(nèi)含子。使用SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),預(yù)測了61個殘基的信號肽?;谠摮绦?,預(yù)測的成熟蛋白含有336個氨基酸,具有37.3kDa的預(yù)測分子量和6.52的等電點pH。使用InterProScan程序(TheEuropeanBioinformaticsInstitute),預(yù)測了68個殘基的信號肽?;谠摮绦?,預(yù)測的成熟蛋白含有329個氨基酸,具有36.5kDa的預(yù)測分子量和6.52的等電點pH。實施例2:將pSaMF35的表達載體片段轉(zhuǎn)化入棘孢曲霉NRRL3488(SaMF35)進行米曲霉NRRL3488的原生質(zhì)體制備和轉(zhuǎn)化,即將大約2xl07個孢子接種入IOOmLYEG培養(yǎng)基,并將燒瓶在27°C以140rpm溫育16-18小時。收集菌絲體,即將培養(yǎng)物傾倒透過襯有MIRA(::L(ymS(Calbiochem,SanDiego,CA,USA)的滅菌漏斗,并用50mL的0.7MKCl漂洗。將經(jīng)洗滌的菌絲體重懸于含有20mL原生質(zhì)體化溶液的125mL燒瓶,所述溶液包含每mL0.7MKCl(經(jīng)過濾滅菌)5mg的GLUCANEX(NovozymesA/S,BagSVtCid,Denmark)和0.5mg的殼多糖酶(SigmaChemicalC0.,St.Louis,MO,USA),并將該燒瓶在34°C以80rpm混合溫育30分鐘。將原生質(zhì)體化溶液傾倒透過襯有MIRACXOTH的滅菌漏斗,并用50mL的STC緩沖液(1M山梨醇-1OmMTris-HClpH6.5-10mMCaCl2)漂洗。將流過物在兩個50mL聚丙烯管中收集。將管在室溫以1300xg離心10分鐘。棄去上清并將原生質(zhì)體沉淀重懸于20mL的STC緩沖液。洗滌原生質(zhì)體,即進行兩輪的將沉淀重懸于20mL的STC緩沖液并在室溫在1300xg離心10分鐘。將最終沉淀重懸于2mL的STC緩沖液。對原生質(zhì)體進行計數(shù),即移取10μI樣品并在血細(xì)胞計數(shù)器(VWR,Westchester,PA,USA)中對其進行計數(shù)。用STC緩沖液調(diào)整體積以獲得2xl07每mL的原生質(zhì)體濃度。通過用PmeI進行限制性消化制備質(zhì)粒pSaMF35以供轉(zhuǎn)化。通過TBE緩沖液中的0.8%瓊脂糖凝膠電泳從消化的載體分離4977bp表達盒,并使用QIAQUICKiGelExtractionKit進行純化。準(zhǔn)備了兩個轉(zhuǎn)化反應(yīng)。對于每個反應(yīng),將100μL原生質(zhì)體制備的溶液轉(zhuǎn)移至12mL聚丙烯管,對其添加5μg直鏈化的pSaMF35和250μIPEG溶液(60%w/v聚乙二醇(PEG),IOmMTris6.5,IOmMCaCl)接著進行輕柔地混合,并在37°C溫育30分鐘。將每個轉(zhuǎn)化反應(yīng)物用9mL的STC溶液稀釋,接著將三個不同的3ml等分試樣鋪板于COVE平板上。然后將每個平板在34°C溫育7-10日。將二十個SaMF35轉(zhuǎn)化體轉(zhuǎn)移至單個COVE平板,并在34°C溫育5日。通過將孢子收集于0.1%TWEEN80來制備孢子儲液。儲藏培養(yǎng)物,即制備每個的甘油儲液(800μI孢子儲液,200μ10.1%TWFFMK:80)并凍結(jié)于_80°C。實施例3:在含有pSaMF35的表達載體片段的米曲霉轉(zhuǎn)化體(SaMF35)的搖瓶培養(yǎng)中產(chǎn)生蘋果酸將來自實施例2中所述的每個pSaMF35轉(zhuǎn)化體和作為對照的米曲霉NRRL3488的孢子鋪板于單個PDA平板,并允許其在34°C進行5至7日的孢子形成。在0.1%TWEEN80中收集孢子,并使用血細(xì)胞計數(shù)器進行計數(shù)。在含有IOOml的種子培養(yǎng)基B的250ml燒瓶中制備種子培養(yǎng)物,并用300μI的孢子懸液接種。將種子培養(yǎng)物在30°C以200rpm振蕩生長大約17個小時。在含有50ml的酸產(chǎn)生培養(yǎng)基C和3ml的17小時種子培養(yǎng)物的250ml不帶擋板的燒瓶中制備酸產(chǎn)生培養(yǎng)物。將培養(yǎng)物在30°C以200rpm振蕩溫育2_10日。對于搖瓶培養(yǎng)轉(zhuǎn)化體的蘋果酸定量通過使用1200SeriesBinaryLCSystem和1200SeriesDiodeArrayDetector(DAD)(AgilentTechnologies,SantaClara,CAUSA)的ReversePhaseHighPressureLiquidChromatography(RP-HPLC)進行。使用Aqua5μC18J25A205x4.6mmID柱和AQCl84x3.0mmSecurityGuardCartridge(Phenomenex,Inc.,Torrance,CA,USA)進行反向分離。流動相由10%甲醇(HPLC級)和90%145mM磷酸鹽pHl.5緩沖液組成。移出全培養(yǎng)樣品,并將其在由850ml的64mM磷酸鹽緩沖液和150ml的甲醇pHl.65組成的HPLCRunningBuffer中以1:10稀釋。然后將樣品透過25mm0.45微米聚醚砜膜(Whatman,FlorhamPark,NJ,USA)進行過濾,并將1.5ml濾過物置入HPLC小瓶進行酸分析。將剩余量的搖瓶培養(yǎng)物透過3層粗濾布(cheesecloth)過濾,并用10體積的雙蒸無菌水漂洗三次以去除不溶的CaC03。從粗濾布收獲細(xì)胞沉淀,置入15ml培養(yǎng)管,并儲藏于_20°C。使用10μI的注入體積以0.7ml/分鐘(等度洗脫)的流速以25°C的柱溫度和11分鐘的運行時間進行RP-HPLC。檢測設(shè)定為210nm,8nm帶寬,參照為360nm,40nm帶寬。確定空白時間(voidtime)為3.8分鐘。通過進行濃度范圍為49.2至3.93mM的系列稀釋的蘋果酸標(biāo)樣的重復(fù)注入,對于蘋果酸確定了反相方法的定量能力。對于重復(fù)注入的相對標(biāo)準(zhǔn)偏差(RSD)為彡5%。蘋果酸顯示R2彡0.9999。在3日搖瓶生長之后,含有pSaMF35的米曲霉轉(zhuǎn)化體與米曲霉NRRL3488對照菌株相比顯示了超過2倍的蘋果酸產(chǎn)生方面的改善。實施例3B:含有pSaMF35的表達載體片段的米曲霉轉(zhuǎn)化體(SaMF35)的發(fā)酵。制備了實施例2中所述的米曲霉pSaMF35轉(zhuǎn)化體和對照轉(zhuǎn)化體米曲霉ShThl040(參見2010年8月27日提交的PCR申請?zhí)朠CT/US10/47002)并將其如下文實施例7中所述進行發(fā)酵。發(fā)酵中蘋果酸的定量如上所述進行。米曲霉pSaMF35轉(zhuǎn)化體的相對蘋果酸效價類似于米曲霉ShThl040轉(zhuǎn)化體,表明基于之前描述的ShThl040和NRRL3488的比較,米曲霉pSaMF35轉(zhuǎn)化體與米曲霉NRRL3488對照(其缺乏過表達的C4-二羧酸轉(zhuǎn)運蛋白基因)相比性能更好。`實施例4:棘孢曲霉C4-二羧酸轉(zhuǎn)運蛋白基因的克隆和表達載體pSaMF36的構(gòu)建將1257bpC4_二羧酸轉(zhuǎn)運蛋白基因c4t521從棘孢曲霉基因組DNA(實施例1)使用下示的引物069700和069701擴增。引物069700:5’-TGTGATAGAACATCGTCCATAATGCACGACCACAGC-3’(SEQIDNO:9)引物069701:5’-GTGTCAGTCACCTCTAGTTATCATTCGAACAACTCGGACA-3’(SEQIDNO:10)PCR反應(yīng)物組成為:10μ15X反應(yīng)緩沖液,1μI棘孢曲霉DNA模板(105ng/yl),IμI引物069700(100ng/yI),IμI引物069701(lOOng/μI),IμIdNTP混合物(IOmM),35.5μI去離子水,和0.5μIPhusionHotStartHigh-FideIityDNA聚合酶(Finnzymes,Inc,Massachusetts,USA)0將擴增反應(yīng)溫育于EPPENDORFi)MASTERCYCLER,其程序如下:I個循環(huán),在98°C進行30秒;30個循環(huán),每個在98°C進行10秒,60°C進行30秒,72°C進行I分鐘,和一個循環(huán),在72°C進行10分鐘。將PCR產(chǎn)物用DpnI消化I小時以降解任何質(zhì)粒DNA模板。將質(zhì)粒PShTh60(圖1)用SexAl和PacI消化,通過TBE緩沖液中的0.8%瓊脂糖凝膠電泳分離,并使用QlAQL'iCK/K)GelExtractionKit純化。然后將上述純化的PCR產(chǎn)物使用In-FusionAdvantage反應(yīng)試劑盒插入消化的pShTh60片段中,該反應(yīng)組成為2μ15X緩沖液,3μI純化的PCR產(chǎn)物(26ng/μI),1.5μI凝膠純化的SexAl和PacI消化的和凝膠純化的pShTh60(132ng/μI),IμIIn-Fusion酶和2.5μI去離子水。將反應(yīng)在37°C溫育15分鐘,50°C溫育15分鐘,置于冰上5分鐘,并用40μITE緩沖液稀釋,得到pSaMF36(圖4)。將上述連接反應(yīng)產(chǎn)物的2.5μI等分試樣根據(jù)生產(chǎn)商的指示轉(zhuǎn)化入ONESHOTT0P10化學(xué)感受態(tài)大腸桿菌細(xì)胞。將轉(zhuǎn)化物鋪板于2XYT+amp平板上,并在37°C溫育過夜。挑取所得的轉(zhuǎn)化體,并對其進行DNA測序以確認(rèn)mat521基因成功整合入載體。棘孢曲霉c4t521基因的核苷酸序列(SEQIDNO:3)和推導(dǎo)的氨基酸序列(SEQIDNO:4)顯示于圖5。編碼序列為1257bp,包含終止密碼子。編碼的預(yù)測蛋白為418個氨基酸,具有46.8kDa的預(yù)測分子量和6.36的等電點pH。該基因不含內(nèi)含子。使用SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),預(yù)測了17個殘基的信號肽?;谠摮绦颍A(yù)測的成熟蛋白含有401個氨基酸,具有44.9kDa的預(yù)測分子量和6.89的等電點pH。實施例5:將pSaMF36的表達載體片段轉(zhuǎn)化入棘孢曲霉NRRL3488(SaMF36)米曲霉NRRL3488的原生質(zhì)體制備和轉(zhuǎn)化如實施例2中所述進行。通過用PmeI進行限制性消化制備質(zhì)粒pSaMF35以供轉(zhuǎn)化。通過TBE緩沖液中的0.8%瓊脂糖凝膠電泳從消化的載體分離5040bp表達盒,并使用QL.\QUlCi<..g_.GelExtractionKit進行純化。準(zhǔn)備了兩個轉(zhuǎn)化反應(yīng)。對于每個反應(yīng),將100μL原生質(zhì)體制備的溶液轉(zhuǎn)移至12mL聚丙烯管,對其添加5μg直鏈化的pSaMF36和250μIPEG溶液(60%w/V聚乙二醇(PEG),IOmMTris6.5,IOmMCaCl)接著進行輕柔地混合,并在37°C溫育30分鐘。將每個轉(zhuǎn)化反應(yīng)物用9mL的STC溶液稀釋,接著將三個不同的3ml等分試樣鋪板于COVE平板上。然后將每個平板在34°C溫育7-10日。將二十個SaMF36轉(zhuǎn)化體轉(zhuǎn)移至單個COVE平板,并在34°C溫育5H。通過將孢子收集于0.1%TWEEN80來制備孢子儲液。儲藏培養(yǎng)物,即制備每個的甘油儲液(800μI孢子儲液,200μ10.1%TWEEN80)并凍結(jié)于-80。。。實施例6:在含有pSaMF36的表達載體片段的米曲霉轉(zhuǎn)化體(SaMF36)的搖瓶培養(yǎng)中產(chǎn)生蘋果酸來自實施例5中所述的每個pSaMF36轉(zhuǎn)化體和作為對照的米曲霉NRRL3488的孢子如實施例3中所述制備。對于搖瓶培養(yǎng)轉(zhuǎn)化體的蘋果酸的定量如實施例3中所述進行。表I顯示了在3日的搖瓶生長之后,轉(zhuǎn)化體米曲霉SaMF36_3和米曲霉SaMF36_4與作為對照的米曲霉NRRL3488的蘋果酸產(chǎn)生相比的蘋果酸效價的相對增加。相對于米曲霉NRRL3488,米曲霉SaMF36_3和米曲霉SaMF36_4分別產(chǎn)生了2.1倍和2.3倍的蘋果酸效價的增加。表I權(quán)利要求1.一種具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽,其選自:(a)多肽,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1、3或5,其成熟多肽編碼序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一I"生;(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一個或多個(例如兩個、幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(C)或(d)的多肽具有C4-二羧酸轉(zhuǎn)運蛋白活性的片段。2.權(quán)利要求1的多肽,其與SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。3.權(quán)利要求1或2的多肽,其由多核苷酸編碼,所述多核苷酸在低嚴(yán)格條件,低-中等嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件下,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈。4.權(quán)利要求1-3任一項的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDΝΟ:1、3或5,或其成熟多肽編碼序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。5.權(quán)利要求1-4任一項的多肽,其包含或組成為SEQIDNO:2、4或6。6.權(quán)利要求1-4任一項的多肽,其包含或組成為SEQIDNO:2、4或6的成熟多肽。7.權(quán)利要求6的多肽,其中所述SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸62至397或69至397IDNO:4的成熟多肽是SEQIDNO:4的氨基酸18至418;和所述SEQIDN0:6的成熟多肽是SEQIDNO:6的氨基酸69至397。8.權(quán)利要求1-7任一項的多肽,其中所述多肽由大腸桿菌NRRLB-50400中包含的質(zhì)粒pAaC4T737中包含的多核苷酸編碼;由大腸桿菌NRRLB-50388中包含的質(zhì)粒pAaC4t521中包含的多核苷酸編碼;或由大腸桿菌NRRLB-50401中包含的質(zhì)粒pAaMAT737中包含的多核苷酸編碼。9.一種組合物,其包含權(quán)利要求1-8任一項的多肽。10.一種分離的多核苷酸,其編碼權(quán)利要求1-8任一項的多肽。11.一種核酸構(gòu)建體或表達載體,其包含權(quán)利要求10的多核苷酸可操作地連接于一個或多個(例如兩個、幾個)調(diào)控序列,所述調(diào)控序列指導(dǎo)所述多肽在表達宿主中的產(chǎn)生。12.—種重組宿主細(xì)胞,其包含權(quán)利要求10的多核苷酸,所述多核苷酸可操作地連接于一個或多個調(diào)控序列,所述調(diào)控序列指導(dǎo)所述多肽的產(chǎn)生。13.一種宿主細(xì)胞,其包含編碼C4-二羧酸轉(zhuǎn)運蛋白的異源多核苷酸;其中所述異源多核苷酸:(a)編碼C4-二羧酸轉(zhuǎn)運蛋白,所述轉(zhuǎn)運蛋白與SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)在低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件與以下雜交:SEQIDNO:1、3或5,其成熟多肽編碼序列,或前述序列的全長互補鏈;或(c)與SEQIDNO:1、3或5,其成熟多肽編碼序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;其中所述宿主細(xì)胞與不包含所述異源多核苷酸的宿主細(xì)胞相比,在相同條件下培養(yǎng)時,能夠產(chǎn)生更大量的C4-二羧酸。14.權(quán)利要求13的宿主細(xì)胞,其中所述異源多核苷酸可操作地連接于對于所述多核苷酸為外源的啟動子。15.權(quán)利要求13或14的宿主細(xì)胞,其中所述宿主細(xì)胞進一步包含異源第二多核苷酸,所述多核苷酸編碼蘋果酸脫氫酶。16.權(quán)利要求13-15任一項的宿主細(xì)胞,其中所述宿主細(xì)胞進一步包含異源第三多核苷酸,所述多核苷酸編碼丙酮酸羧化酶。17.權(quán)利要求13-16任一項的宿主細(xì)胞,其中所述宿主細(xì)胞是絲狀真菌宿主細(xì)胞。18.權(quán)利要求17的絲狀真菌宿主細(xì)胞,其中所述宿主細(xì)胞是曲霉屬宿主細(xì)胞。19.權(quán)利要求17的絲狀真菌宿主細(xì)胞,其中所述宿主細(xì)胞是米曲霉宿主細(xì)胞。20.權(quán)利要求13-19任一項的宿主細(xì)胞,其中所述C4-二羧酸是蘋果酸。21.—種產(chǎn)生C4-二羧酸的方法,其包括:(a)在培養(yǎng)基中在合適的條件下培養(yǎng)權(quán)利要求13-20任一項的宿主細(xì)胞以產(chǎn)生C4-二羧酸;和(b)回收所述C4-二羧酸。22.—種增加C4-二羧酸產(chǎn)生的方法,其包括:(a)將編碼權(quán)利要求1-8任一項的多肽的異源多核苷酸轉(zhuǎn)化入宿主細(xì)胞;(b)在培養(yǎng)基中在合適的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細(xì)胞以產(chǎn)生C4-二羧酸;和(c)回收所述C4-二羧酸。全文摘要本發(fā)明涉及具有C4-二羧酸轉(zhuǎn)運蛋白活性的分離的多肽,和編碼所述多肽的分離的多核苷酸。本發(fā)明亦涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及產(chǎn)生和使用所述多肽的方法,和產(chǎn)生C4-二羧酸如蘋果酸的方法。文檔編號C07K14/38GK103080126SQ201180040520公開日2013年5月1日申請日期2011年6月21日優(yōu)先權(quán)日2010年6月21日發(fā)明者A.費希爾,D.亞弗申請人:諾維信股份有限公司