專利名稱::醛縮酶、編碼它們的核酸及制備和使用它們的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及分子和細胞生物學(xué)及生物化學(xué)。更特別地,本發(fā)明涉及具有醛縮酶活性的多肽,編碼這些多肽的多核苷酸,以及制造和使用這些多核苷酸和多肽的方法。Monatin包括導(dǎo)致四種潛在的立體異構(gòu)的構(gòu)型的兩個手性中心。R,R構(gòu)型("R,R立體異構(gòu)體,,或"R,Rmonatin,,);S,S構(gòu)型("S,S立體異構(gòu)體"或"S,Smonatin,,);R,S構(gòu)型("R,S立體異構(gòu)體"或"R,Smonatin,,);和S,R構(gòu)型("S,R立體異構(gòu)體,,或"S,Rmonatin")。用在此處,除非另有說明,術(shù)語"monatin"用于表示包含全部四種monatin立體異構(gòu)體的組合物,包含monatin立體異構(gòu)體的任意組合的組合物(如僅包括R,R和S,S構(gòu)型的monatin立體異構(gòu)體的組合物),以及單一的異構(gòu)體形式。出于本公開的目的,monatin的碳主鏈按上圖所示編號,與醇基團直接共價連接的碳被編為2-位碳,而與氨基基團直接共價連接的碳被編為4-位碳。因此,這里對R,Rmonatin、S,Smonatin、R,Smonatin禾口S,Rmonatin分別表示2R,4Rmonatin、2S,4Smonatin、2R,4Smonatin禾口2S,4Rmonatin,除非另有說明。應(yīng)該注意,在文獻中monatin碳骨架也使用可選的慣例編號,與醇基團連接的碳是4-位碳,而與氨基基團連接的碳是2-位碳。因此,舉例來說,本公
背景技術(shù):
:Monatin是具有如下化學(xué)式的高強度甜味劑:開中2S,4Rmonatin的指代與使用可選編號慣例的文獻中2R,4Smonatin的指代相同。此外,由于不同的命名習(xí)慣,monatin已知有多個可選的化學(xué)名稱,包括2-羥基-2-(d引哚-3-基甲基)-4-氨基戊二酸;4-氨基-2-羥基-2-(lH-吲哚-3-基甲基)-戊二酸;4-羥基-4-(3-吲哚基甲基)谷氨酸;和3-(1-氨基-1,3-二羧基-3-羥基-丁-4-基)吲哚。Monatin的某些異構(gòu)形式可在位于南非的德蘭士瓦地區(qū)(TransvaalRegion)的ScWeractoon///"/o/Zw植物根的莖皮中找到。美國專利申請?zhí)?0/422,366(,366申請)和10/979,821(,821申請)公開了用于體外和體內(nèi)生產(chǎn)monatin的多肽、通路和微生物,這兩個申請引入本文作為參考。概述本發(fā)明提供了具有醛縮酶活性(下文中為"醛縮酶"),包括丙酮酸醛縮酶活性,如,沒有限制地,HMG和KHG醛縮酶活性的多肽,編碼該多肽的多核苷酸,和生產(chǎn)和使用該多肽和多核苷酸的方法。在一些實施方式中,本發(fā)明也提供了含有根據(jù)本發(fā)明所述的多肽或多核苷酸的組合物(如藥物組合物、燃料和燃料添加劑組合物、食品和食品添加劑、飲料和飲料添加劑、飼料和飼料添加劑、藥品和藥品添加劑、膳食補充物)。這些組合物可以被配制為多種形式,如片劑、凝膠、丸劑、植入物、液體、噴霧劑、薄膜、膠束、粉末、食品、飼料顆?;蛉我忸愋偷哪z囊化形式。在一些實施方式中,醛縮酶和/或其組合物可以用于藥物、工業(yè)和/或農(nóng)業(yè)方面。在一些實施方式中,醛縮酶和/或其組合物可以用于形成或斷裂碳-碳鍵。在一些實施方式中,提供催化cx-酮酸受體和丙酮酸(丙酮酸鹽(酯))或丙酮酸衍生物供體之間的碳-碳鍵形成反應(yīng)的醛縮酶(見下面的反應(yīng)圖示)。在一些實施方式中,受體也可以是酮類或醛類。在一些實施方式中,提供具有4-羥基-2-氧化戊二酸醛縮酶(如2-酮-4-羥基戊二酸醛縮酶、2-氧代-4-羥基戊二酸醛縮酶、KHG-醛縮酶,EC4.1.3.16)活性并催化以下反應(yīng)的醛縮酶4-羥基-2-氧化戊二酸<=>丙酮酸+乙醛酸。在一些實施方式中,提供具有HMG-酸縮酶(如4-羥基-4-甲基-2-氧化戊二酸醛縮酶、丙酮酸醛縮酶、Y-甲基-7-羥基-a-酮戊二酸醛縮酶、4-羥基_4-甲基-2-酮戊二酸醛縮酶,EC4丄3.H)活性并催化以下反應(yīng)的醛縮酶4-羥基_4-甲基-2-氧化戊二酸<=>2丙酮酸。HMG酸縮酶也作用于4-羥基-4-甲基-2-氧化己二酸和4-羧基-4-羥基-2-氧化十六二酸(oxohexadioate)。28醛縮酶a-酮酸,酮類或醛類受體丙酮酸或丙酮酸衍生物R=H、垸基、取代烷基、芳基、取代芳基、芐基、取代芐基R2=H、垸基、取代烷基、芳基、取代芳基、節(jié)基、取代節(jié)基R3=H、垸基、取代垸基、芳基、取代芳基、芐基、取代芐基、羧酸。在一些實施方式中,醛縮酶,例如丙酮酸醛縮酶,如,沒有限制地,HMG和/或KHG醛縮酶被提供用于促進3,4-取代的2-酮-戊二酸的生產(chǎn)。在一種實施方式中,本發(fā)明提供了生產(chǎn)3,4-取代的2-酮-戊二酸的方法,包括(a)提供具有醛縮酶活性,例如丙酮酸醛縮酶活性,如沒有限制地,HMG醛縮酶和/或KMG醛縮酶活性的多肽;(b)提供供體和受體化合物;禾[](c)在醛縮酶催化3,4-取代的2-酮-戊二酸合成的條件下將步驟(a)的多肽與步驟(b)中的化合物接觸,其中任選地供體和受體是丙酮酸或丙酮酸供體和a-酮酸受體,酮類和/或醛類。在一些實施方式中,提供促進R-2-羥基-2-(H引哚-3-基甲基)-4-酮戊二酸(R-MP)——一種monatin前體——產(chǎn)生的醛縮酶。在一些實施方式中,丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶,可以與D-氨基轉(zhuǎn)移酶聯(lián)合使用以產(chǎn)生4-取代D-谷氨酸或其衍生物。4-取代D-谷氨酸和/或其衍生物可以被用作抗生素,因為這些化合物已經(jīng)被發(fā)現(xiàn)能抑制細菌的谷氨酸解旋酶(WO0214261A3)。在一種實施方式中,本發(fā)明提供了生產(chǎn)4-取代D-谷氨酸的方法,包括(a)提供具有醛縮酶活性的多肽,例如丙酮酸醛縮酶活性,如沒有限制地,HMG醛縮酶和域KMG醛縮酶活性;(b)提供ot-酮酸受體和丙酮酸或丙酮酸供體;和(c)在醛縮酶催化4-取代D-谷氨酸合成的條件下將步驟(a)的多肽與步驟(b)中的化合物接觸,其中任選地多肽具有丙酮酸醛縮酶、HMG醛縮酶和/或KHG醛縮酶活性,并且其中任選地,該方法進一步包括使用D-氨基轉(zhuǎn)移酶。本發(fā)明提供了分離的,合成的或重組的核酸,其包含與根據(jù)本發(fā)明的核酸序列,包括SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQID29NO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:3U、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338,在至少約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、302450、2500或更多殘基的區(qū)域中,具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的核酸序列。在一些實施方式中,一種或多種核酸編碼至少一種多肽,所述多肽具有醛縮酶活性,包括丙酮酸醛縮酶活性,如沒有限制地,HMG和/或KHG醛縮酶活性。在一些實施方式中,序列同一性通過用序列比較算法的分析或通過視覺觀察確定。在可選的實施方式中,一種或多種核酸編碼至少一種能夠產(chǎn)生抗體的多肽,所述抗體可以特異地與本發(fā)明的多肽結(jié)合,或這些核酸可以被用作鑒定或分離編碼醛縮酶的核酸的探針,或用于抑制醛縮酶表達核酸的表達。根據(jù)本發(fā)明的核酸也包括分離的、合成的或重組的核酸,其編碼根據(jù)本發(fā)明的酶,如包含一種或多種具有如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:I8、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQ1DN0:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、31SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334中所述序列和其子序列的多肽的酶,其變體及其酶活性片段。在一些實施方式中,所述多肽具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性。在一些實施方式中,本發(fā)明提供了優(yōu)選地由混合培養(yǎng)物衍生的編碼醛縮酶,例如編碼丙酮酸酲縮酶,如HMG和/或KHG醛縮酶的核酸。在一些實施方式中,本發(fā)明提供了由混合培養(yǎng)物分離的編碼碳-碳鍵形成或斷裂酶的核酸,其含有依據(jù)本發(fā)明的多核苷酸,如與依據(jù)本發(fā)明的核酸,如SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、32、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338在至少約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、或更多殘基的區(qū)域內(nèi)具有至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全(100%)序列同一性的序列。在一些實施方式中,本發(fā)明提供了編碼醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG酶的核酸,包括依據(jù)本發(fā)明的多核苷酸序列和由它們編碼的多肽,包括依據(jù)本發(fā)明的酶,如依據(jù)本發(fā)明的多肽,如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQID33NO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:簡、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:I50、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:亂SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:2%、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334及其酶的活性片段,其優(yōu)選地由常見來源,如環(huán)境來源獲得。在一些實施方式中,本發(fā)明也提供了編碼醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG酶的核酸,其優(yōu)選地由環(huán)境來源,如混合環(huán)境來源獲得。在一些實施方式中,所述序列比較算法是BLAST版2.2.2算法,其中過濾設(shè)置被設(shè)置為blastall-pblastp~d"nrpataa"-FF,所有其它選項被設(shè)置為默認值。本發(fā)明的其它實施方式是分離的、合成的或重組的核酸,其包括依據(jù)34本發(fā)明的核酸序列、與其基本一致的序列、和與其互補的序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多個連續(xù)的堿基。在一些實施方式中,依據(jù)本發(fā)明的分離的、合成的或重組的核酸編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽,其是熱穩(wěn)定的。依據(jù)本發(fā)明的熱穩(wěn)定多肽在包含溫度范圍從約-100'C到約-80。C、約-80'C到約-40'C、約-40'C到約-20'C、約-20'C到約(TC、約0。C到約37。C、約O'C到約5'C、約5'C到約15'C、約15'C到約25°C、約25'C到約37°C、約37'C到約45'C、約45'C到約55'C、約55'C到約70'C、約70'C到約75'C、約75'C到約S5。C、約85'C到約90°C、約9(TC到約95°C、約95。C到約IOO'C、約100。C到約105°C、約105。C到約110。C、約IIO'C到約120°C、或95'C、96°C、97°C、98。C、99°C、IO(TC、101°C、102°C、103。C、104。C、105。C、106°C、107。C、108°C、109'C、ll(TC、lirC、112°C、113'C、114°C、115'C或更高溫度的條件下,可以保持醛縮酶活性,例如丙酮酸醛縮酶活性,如HMG和/或KHG醛縮酶活性。依據(jù)本發(fā)明的熱穩(wěn)定多肽在范圍從約-100'C到約-80。C、約-80'C到約-4(TC、約-40。C到約-2(TC、約-20。C到約0'C、約(TC到約5'C、約5。C到約15'C、約15。C到約25'C、約25'C到約37'C、約37'C到約45。C、約45'C到約55。C、約55'C到約70。C、約70'C到約75。C、約75。C到約85。C、約85。C到約90。C、約卯。C到約95。C、約95。C到約IO(TC、約IOO'C到約105°C、約105。C到約ll(TC、約ll(TC到約120。C、或95。C、96°C、97°C、98°C、99°C、IOO'C、101°C、102°C、103°C、104。C、105°C、106。C、107°C、108°C、109°C、ll(TC、111°C、112°C、113°C、114°C、115。C或更高的溫度下,可以保持醛縮酶活性,例如丙酮酸醛縮酶活性,如HMG和/或KHG醛縮酶活性。在一些實施方式中,依據(jù)本發(fā)明的熱穩(wěn)定多肽在上述溫度范圍內(nèi),在約pH3.0、約pH3.5、約pH4.0、約pH4.5、約pH5.0、約pH5.5、約pH6.0、約pH6.5、約pH7.0、約pH7.5、約pH8.0、約pH8.5、約pH9,0、約pH9.5、約pH10.0、約pH10.5、約pH11.0、約pH11.5、約pH12.0或更高pH的條件下保持醛縮酶活性。在其它的實施方式中,分離的、合成的或重組的核酸編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽,其是耐熱的。依據(jù)本發(fā)明的耐熱性多肽在暴露于包含范圍從約-ioo'c到約-8(rc、約-80°<:到約-40°。、約-4(TC到約-20。C、約-20。C到約(TC、約(TC到約5。C、約5'C到約15°C、約15。C到約25°C、約25'C到約37°C、約37。C到約45'C、約45'C到約55°C、約55。C到約70。C、約70。C到約75。C、約75。C到約85°C、約85。C到約90。C、35約9CTC到約95。C、約95。C到約雨。C、約IOO'C到約105°C、約105'C到約IIO'C、約ll(TC到約120°C、或95。C、96°C、97°C、98°C、99。C、IOO'C、IOI'C、102。C、103°C、104'C、105'C、106'C、107。C、108'C、109'C、IIO'C、lll'C、U2。C、113'C、114°C、115'C或更高溫度的條件后,可以保持醛縮酶活性,例如丙酮酸醛縮酶活性,如HMG和/或KHG醛縮酶活性。依據(jù)本發(fā)明的耐熱性多肽在暴露于范圍從約-100°(:到約-80°(:、約-80。C到約-40。C、約-40'C到約-20'C、約-20。C到約(TC、約o°c到約5'C、約5'C到約15°C、約15'C到約25'C、約25'C到約37°C、約37'C到約45°C、約45。C到約55°C、約55'C到約70'C、約70'C到約75°C、約75'C到約85'C、約85'C到約90°C、約90'C到約95°C、約95'C到約IOO'C、約IO(TC到約105'C、約105。C到約IIO'C、約110。C到約120。C、或95。C、96。C、97°C、98°C、99'C、IO(TC、10rC、102°C、103°C、104°C、105°C、106°C、107。C、108°C、109'C、IIO'C、Ul'C、112'C、113'C、114'C、115'C或更高的溫度后,可以保持醛縮酶活性,例如丙酮酸醛縮酶活性,如HMG禾卩/或KHG醛縮酶活性。在一些實施方式中,依據(jù)本發(fā)明的耐熱性多肽在暴露于上述溫度范圍內(nèi)后,在約pH3.0、約pH3.5、約pH4.0、約pH4.5、約pH5.0、約pH5.5、約pH6.0、約pH6.5、約pH7.0、約pH7.5、約pH8.0、約pH8.5、約pH9.0、約pH9.5、約pH10.0、約pH10.5、約pH11.0、約pH11.5、約pH12.0或更高的pH值下保持醛縮酶活性。本發(fā)明提供了分離的、合成的或重組的核酸,其包括在嚴格條件下與依據(jù)本發(fā)明的核酸雜交的序列,依據(jù)本發(fā)明的核酸包括如SEQIDN0:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDN0:13、SEQIDN0:15、SEQIDNO:17、SEQIDNO:19、SEQIDN0:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDN。:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、36SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:2D、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338中所述的序列或其片段或子序列。在一些實施方式中,所述核酸編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽。所述核酸長度可以是至少約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多個殘基,或基因或轉(zhuǎn)錄物的全長。在一些實施方式中,所述嚴格條件包括清洗步驟,其包括在0.2xSSC中在約65'C的溫度下洗漆約15分鐘。本發(fā)明提供了用于鑒定或分離編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽的核酸的核酸探針,其中所述探針包括依據(jù)本發(fā)明的序列中約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多連續(xù)的堿基,并且其中所述探針通過結(jié)合或雜交鑒定核酸。該探針可以包括含有依據(jù)本發(fā)明的序列、或其片段或子序列中約10-100個連續(xù)堿基的寡核苷酸,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個堿基或更多,或在它們之間任意期望的長度。本發(fā)明提供了用于鑒定或分離編碼具有醛縮酶活性,包括丙酮酸活37性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽的核酸的核酸探針,其中所述探針包括含有依據(jù)本發(fā)明核酸中至少約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多堿基的序列的核酸,例如與本發(fā)明的核酸具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全(100%)序列同一性的多核苷酸。在一些實施方式中,序列同一性通過使用序列比較算法的分析或通過視覺觀察確定。在其它的實施方式中,探針可以包括含有依據(jù)本發(fā)明的核酸序列或其子序列的至少約10-100個連續(xù)堿基的寡核苷酸,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個堿基或更多堿基,或在它們之間任意期望的長度。本發(fā)明提供了擴增(如通過PCR)編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG酸縮酶活性的多肽的核酸的擴增引物對,其中每個引物對能夠擴增包含依據(jù)本發(fā)明的序列,或其片段或子序列的核酸(參見序列表)。擴增引物序列對中的一個或每個成員可以包含寡核苷酸,其含有該序列至少約10到50個,或更多連續(xù)堿基,或該序列約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多連續(xù)堿基。在一些實施方式中,本發(fā)明提供了擴增引物對,其中每個引物對包含具有如依據(jù)本發(fā)明的核酸的大約前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個殘基所述的序列的第一成員,和具有如第一成員的互補鏈的大約前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個殘基所述的序列的第二成員。本發(fā)明提供了編碼醛縮酶,例如編碼丙酮酸醛縮酶、編碼HMG禾口/或KHG醛縮酶的核酸,其通過擴增,如聚合酶鏈反應(yīng)(PCR),使用依據(jù)本發(fā)明的擴增引物對產(chǎn)生。在一些實施方式中,本發(fā)明提供了編碼醛縮酶,例如編碼丙酮酸醛縮酶、編碼HMG和/或KHG醛縮酶的核酸,其通過擴增,如聚合酶鏈反應(yīng)(PCR),使用依據(jù)本發(fā)明的擴增引物對產(chǎn)生。在一些實施方式中,本發(fā)明提供了通過擴增,如聚合酶鏈反應(yīng)(PCR),使用依據(jù)本發(fā)明的擴增引物對生產(chǎn)醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的方法。在一些實施方式中,擴增引物對從文庫,例如基因文庫,如環(huán)境文庫中擴增核酸。本發(fā)明提供了擴增編碼具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的多肽的核酸的方法,包括用能夠擴增依據(jù)本38發(fā)明的核酸序列、或其片段或子序列的擴增引物序列對來擴增模板核酸。本發(fā)明提供了包含依據(jù)本發(fā)明的核酸或其子序列的表達盒。在一些實施方式中,表達盒可以含有與啟動子可操作地連接的核酸。該啟動子可以是病毒、細菌、哺乳動物、真菌、酵母或植物啟動子。在一些實施方式中,植物啟動子可以是馬鈴薯、稻、玉米、小麥、煙草或大麥啟動子。該啟動子可以是組成型啟動子。組成型啟動子可以含有CaMV35S。在其它的實施方式中,啟動子可以是誘導(dǎo)型啟動子。在一些實施方式中,啟動子可以是組織特異性啟動子或環(huán)境調(diào)控或發(fā)育調(diào)控型啟動子。因此,啟動子可以是,例如種子特異性、葉特異性、根特異性、莖特異性、或脫落誘導(dǎo)的啟動子。在一些實施方式中,表達盒可以進一步包含植物或植物病毒表達載體。本發(fā)明提供了克隆載體,包括依據(jù)本發(fā)明的表達盒(例如載體)或依據(jù)本發(fā)明的核酸??寺≥d體可以是病毒載體、質(zhì)粒、噬菌體(phage)、噬粒、粘粒(cosmid)、F粘粒(fosmid)、細菌噬菌體(bacteriophage)或人工染色體。病毒載體可以包括腺病毒載體、逆轉(zhuǎn)錄病毒載體或腺相關(guān)病毒載體??寺≥d體可以包括細菌人工染色體(BAC)、質(zhì)粒、細菌噬菌體P1衍生載體(PAC)、酵母人工染色體(YAC)或哺乳動物人工染色體(MAC)。本發(fā)明提供了包含依據(jù)本發(fā)明的核酸或本發(fā)明的表達盒(例如載體)或依據(jù)本發(fā)明的克隆載體的轉(zhuǎn)化細胞。在一些實施方式中,轉(zhuǎn)化細胞可以是細菌細胞、哺乳動物細胞、真菌細胞、酵母細胞、昆蟲細胞或植物細胞。在一些實施方式中,植物細胞可以是大豆、油菜籽、含油種子、番茄、甘蔗、谷類、馬鈴薯、小麥、稻、玉米、煙草或大麥細胞。本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達盒(例如載體)的轉(zhuǎn)基因非人動物。在一些實施方式中,該動物是小鼠、大鼠、豬、山羊或綿羊。本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達盒(例如載體)的轉(zhuǎn)基因植物。轉(zhuǎn)基因植物可以是谷類植物、玉米植物、馬鈴薯植物、番茄植物、小麥植物、含油種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物或煙草植物。本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達序列盒(例如載體)的轉(zhuǎn)基因種子。轉(zhuǎn)基因種子可以是谷類種子、玉米種子、小麥粒、含油種子、油菜籽、大豆種子、棕櫚核、向日葵種子、芝麻種子、花生或煙草植物種子。本發(fā)明提供了反義寡核苷酸,其包含與在嚴格條件下與依據(jù)本發(fā)明的核酸互補或能夠與其雜交的核酸序列。在一些實施方式中,本發(fā)明提供了抑制醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶信息在細胞中翻譯的方法,該方法包括給細胞施用反義寡核苷酸或在細胞中表達反義寡核苷酸,所述反義寡核苷酸包括與本發(fā)明的核酸互補的核酸序列或能與本發(fā)明的核酸在嚴格條件下雜交的核酸序列。在一些實施方式中,所述反義寡核苷酸的長度在大約10到50、大約20到60、大約30到70、大約40到80或大約60到100個堿基之間,例如長度為3910、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多個堿基。本發(fā)明提供了抑制醛縮酶,例如丙酮酸醛縮酶、HMG和域KHG醛縮酶信息在細胞中翻譯的方法,該方法包括給予細胞反義寡核苷酸或在細胞中表達反義寡核苷酸,所述反義寡核苷酸包括與本發(fā)明的核酸互補的核酸序列或能與本發(fā)明的核酸在嚴格條件下雜交的核酸序列。本發(fā)明提供了雙鏈抑制RNA(RNAi或RNA干擾)分子(包括小干擾性RNA,或siRNA,用于抑制轉(zhuǎn)錄;以及微RNA或miRNA,用于抑制翻譯),其包含依據(jù)本發(fā)明序列的子序列。在一些實施方式中,siRNA的長度為約21到約24個殘基,或大約至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多雙鏈核苷酸。在一些實施方式中,本發(fā)明提供了抑制醛縮酶,例如丙酮酸酸縮酶、HMG和/或KHG醛縮酶在細胞中表達的方法,該方法包括給予細胞雙鏈抑制RNA(siRNA或miRNA)或在細胞中表達雙鏈抑制RNA(siRNA或miRNA),其中所述RNA包括依據(jù)本發(fā)明的序列的子序列。本發(fā)明提供了分離的、合成的或重組的多肽,其包含與依據(jù)本發(fā)明的多肽或肽在至少約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多殘基的區(qū)域,或在該多肽的全長區(qū)域中具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、810/0、820/0、83%、84%、85%、86%、87%、88%、89%、卯%、91%、92%、93%、94%、95°/。、96%、97%、98%、99%或更多或完全(100%)序列同一性的氨基酸序列。在一些實施方式中,序列同一性通過用序列比較算法的分析或通過視覺觀察確定。依據(jù)本發(fā)明的多肽或肽包括SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:簡、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、40SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:I42、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO彌、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334及其子序列、其變體和其酶活性片段。依據(jù)本發(fā)明的多肽也包括長度至少約10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多個殘基的片段,或者為酶的全長區(qū)域內(nèi)的片段。依據(jù)本發(fā)明的多肽或肽序列包括由依據(jù)本發(fā)明的核酸編碼的序列。依據(jù)本發(fā)明的多肽或肽序列包括由依據(jù)本發(fā)明的抗體特異性結(jié)合的多肽或肽(例如,表位),或可產(chǎn)生依據(jù)本發(fā)明的抗體的多肽或肽(例如,免疫原)。在一些實施方式中,依據(jù)本發(fā)明的多肽具有至少一種醛縮酶的酶活性,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性。在其它的實施方式中,依據(jù)本發(fā)明的多核苷酸編碼具有至少一種醛縮酶的酶活性,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性的多肽。本發(fā)明的另一實施方式提供了分離的、合成的或重組的多肽或肽,其41包含依據(jù)本發(fā)明的多肽或肽序列、與其基本一致的序列和與其互補的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150或更多個連續(xù)的堿基。該肽可以是例如免疫原性片段、基序(例如結(jié)合位點)、信號序列、前原序列(preprosequence)或活性位點。本發(fā)明提供了分離的、合成的或重組的核酸,其包含編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶酶活性和信號序列的多肽的序列,其中所述核酸包含依據(jù)本發(fā)明的序列。"信號序列"指幫助依據(jù)本發(fā)明的醛縮酶從宿主細胞分泌的分泌信號或其它區(qū)域。信號序列可以由另一種醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,或非醛縮酶,例如非丙酮酸醛縮酶,如非HMG和/或非KHG酸縮酶(異源)的酶衍生。在一些實施方式中,本發(fā)明提供了分離的、合成的或重組的核酸,其含有編碼具有醛縮酶、例如丙酮酸酸縮酶、如HMG和/或KHG醛縮酶的酶活性的多肽的序列,其中所述序列不含有信號序列并且所述核酸含有依據(jù)本發(fā)明的序列。在一些實施方式中,本發(fā)明提供了分離的、合成的或重組的多肽,其含有缺少所有或部分信號序列的依據(jù)本發(fā)明的多肽。在一些實施方式中,分離的、合成的或重組的多肽可以含有依據(jù)本發(fā)明的多肽,其含有異源信號序列,例如異源醛縮酶,如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的信號序列或非酸縮酶,例如非丙酮酸醛縮酶,如非HMG和/或非KHG醛縮酶的信號序列。在一些實施方式中,本發(fā)明提供了嵌合蛋白,其包括含有依據(jù)本發(fā)明的信號序列的第一結(jié)構(gòu)域和至少一個第二結(jié)構(gòu)域。該蛋白可以是融合蛋白。第二結(jié)構(gòu)域可以包含酶。該蛋白可以是非酶。本發(fā)明提供了嵌合多肽,包括含有依據(jù)本發(fā)明的信號肽(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)的至少第一結(jié)構(gòu)域以及含有異源多肽或肽的第二結(jié)構(gòu)域,其中所述異源多肽或肽不與所述信號肽(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)天然相關(guān)。在一些實施方式中,異源多肽或肽不是醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶。所述異源多肽或肽可以在所述信號肽(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)的氨基端、羧基端或兩端。本發(fā)明提供了編碼嵌合多肽的分離的或重組的核酸,其中所述嵌合多肽包括含有本發(fā)明的信號肽(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)的至少第一結(jié)構(gòu)域以及含有異源多肽或肽的第二結(jié)構(gòu)域,其中所述異源多肽或肽不與所述信號肽(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)天然相關(guān)。本發(fā)明提供了分離的、合成的或重組的信號序列(如信號肽),其包括依據(jù)本發(fā)明的多肽,如SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、42<table>tableseeoriginaldocumentpage43</column></row><table>列,或由它們組成。在一些實施方式中,本發(fā)明提供了信號序列,其包含依據(jù)本發(fā)明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多個氨基端殘基。在一些實施方式中,所述醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性包含每毫克蛋白約10到約12,000單位的比活性。在其它的實施方式中,所述醛縮酶,例如丙酮酸酸縮酶,如HMG和/或KHG酸縮酶的活性包含每毫克蛋白約1000到約10,000單位,或每毫克蛋白約5000到約7500單位的比活性??蛇x地,所述醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性包含每毫克蛋白約10到約7500單位,或每毫克蛋白約5000到約12,000單位范圍內(nèi)的比活性。在一些實施方式中,所述醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性包含每毫克蛋白約10到約5000單位,或每毫克蛋白約7500到約10,000單位范圍內(nèi)的比活性。在其它實施方式中,所述醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性包含每毫克蛋白約10到約2500單位范圍內(nèi)的比活性。可選地,所述醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性包含每毫克蛋白約10到約1000單位范圍內(nèi)的比活性。測量不同醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的示例性方法使用普通底物,4-羧基-4-羥基-2-氧代己二酸("CHA")。典型的測試包括50mM磷酸鈉pH7.5、lmMMgCl2、lmMCHA、10嗎/ml來自賴氏乳桿菌aacto6a"7/Ms/e/c/wwm',')的D-乳酸脫氫酶("LDH")(Sigma-Aldrich,St.Louis,MO)、0.5mMNADH。該測試通過加入待測試的酶開始。與NAD+形成偶聯(lián)的丙酮酸釋放在分光光度計中340nm處連續(xù)監(jiān)測。酶活性單位被定義為釋放足量丙酮酸以使340nm處的吸收值每分鐘降低10D的量。在其它的實施方式中,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的耐熱性包括在被加熱到高溫后,如從約0'C到約2(TC、約20'C到約37°C、約37。C到約5CTC、約50。C到約70。C、約70。C到約75°C、約75。C到約80。C、約80。C到約85。C、約85'C到約90'C、約90。C到約95。C、約95'C到約IOO'C、約IO(TC到約ll(TC或更高溫度后,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的比活性保持至少一半??蛇x擇地,耐熱性可以包括在被加熱到高溫后,如上所述,保持每毫克蛋白從大約10到大約12000單位,或每毫克蛋白大約5000到大約10,000單位的范圍內(nèi)的比活性。在另一實施方式中,耐熱性可以包括在被加熱到高溫后,如上所述,保持每毫克蛋白從大約10到大約5000單位的范圍內(nèi)的比活性。本發(fā)明提供了依照本發(fā)明的分離的、合成的或重組的多肽,其中所述多肽包括至少一個糖基化位點。在一些實施方式中,糖基化可以是N-連接糖基化。44在一些實施方式中,多肽可以在畢赤酵母(i^M/on's)或裂變酵母(S./70A^e)宿主中被表達后被糖基化。在一些實施方式中,多肽可以在包含約pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低(更酸性)pH的條件下保持醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性。在其它實施方式中,多肽可以在包含約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5或更高(更堿性)pH的條件下保持醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性。在一些實施方式中,多肽可以在暴露于包含約pH6.5、pH6、pH5.5、pH5、pH4,5、pH4.0、pH3.5、pH3.0或更低(更酸性)pH的條件下之后保持醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性。在其它實施方式中,多肽可以在暴露于包含約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5或更高(更堿性)pH的條件下之后保持醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性。在一些實施方式中,依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶在堿性條件下,例如腸,如小腸的堿性條件下具有活性。在一些實施方式中,多肽在暴露于胃的酸性pH之后能夠保持活性。本發(fā)明提供了含有依照本發(fā)明的多肽(包括肽)的蛋白制備物,其中該蛋白制備物包括液體、固體或凝膠。在一些實施方式中,本發(fā)明提供了包含依照本發(fā)明的多肽和第二成員,諸如多肽或其他(第二)結(jié)構(gòu)域的異源二聚體。異源二聚體的第二成員可以是不同的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,不同的酶或另一種蛋白。在一些實施方式中,第二結(jié)構(gòu)域可以是多肽并且異源二聚體可以是融合蛋白。在一些實施方式中,第二結(jié)構(gòu)域可以是表位或標(biāo)記。在一些實施方式中,本發(fā)明提供了同源多聚體,包括但不限于同源二聚體、同源三聚體、同源四聚體、同源五聚體和同源六聚體,其包含依據(jù)本發(fā)明的多肽。本發(fā)明提供了具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的固定化多肽(包括肽),其中所述固定化多肽含有依據(jù)本發(fā)明的多肽,由依據(jù)本發(fā)明的核酸編碼的多肽,或含有依據(jù)本發(fā)明的多肽和第二結(jié)構(gòu)域的多肽。在一些實施方式中,多肽可以被固定在細胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、平板、陣列或毛細管上。本發(fā)明還提供了包含本發(fā)明的固定化核酸的陣列,包括,例如本發(fā)明的探針。在一些實施方式中,本發(fā)明還提供了包含本發(fā)明的抗體的陣列。本發(fā)明提供了分離的、合成的或重組的抗體,其與本發(fā)明的多肽或與由本發(fā)明的核酸編碼的多肽特異性結(jié)合。本發(fā)明的這些抗體可以是單克隆或多克隆抗體。在一些實施方式中,本發(fā)明提供了包含本發(fā)明的抗體的雜交瘤,所述抗體例如,與本發(fā)明的多肽或與由本發(fā)明的核酸編碼的多肽特異性結(jié)合的抗體。在45一些實施方式中,本發(fā)明提供了編碼這些抗體的核酸。本發(fā)明提供了分離或鑒定具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽的方法,包括以下步驟(a)提供依據(jù)本發(fā)明的抗體;(b)提供含有多肽的樣品;和(c)在抗體可以與該多肽特異結(jié)合的條件下,將步驟(b)的樣品與步驟(a)的抗體接觸,由此分離或鑒定具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽。本發(fā)明提供了制備抗醛縮酶,例如抗丙酮酸醛縮酶,如抗HMG禾口/或抗KHG醛縮酶抗體的方法,包括以足以產(chǎn)生體液免疫應(yīng)答的量給予非人類動物依據(jù)本發(fā)明的核酸,或依據(jù)本發(fā)明的多肽或其子序列,由此制備抗醛縮酶,例如抗丙酮酸醛縮酶,如抗HMG和/或抗KHG醛縮酶的抗體。在一些實施方式中,本發(fā)明提供了產(chǎn)生抗醛縮酶,例如抗丙酮酸醛縮酶,如抗HMG和/或抗KHG醛縮酶免疫反應(yīng)(細胞應(yīng)答或體液應(yīng)答)的方法,該方法包括以足以產(chǎn)生免疫應(yīng)答(細胞應(yīng)答或體液應(yīng)答)的量向非人動物施用本發(fā)明的核酸或本發(fā)明的多肽或其子序列。本發(fā)明提供了產(chǎn)生重組多肽的方法,包括如下步驟(a)提供與啟動子可操作地連接的本發(fā)明的核酸;和(b)在允許多肽表達的條件下表達步驟(a)的核酸,從而產(chǎn)生重組多肽。在一些實施方式中,該方法可進一步包括用步驟(a)的核酸轉(zhuǎn)化宿主細胞,隨后表達步驟(a)的核酸,從而在轉(zhuǎn)化細胞中產(chǎn)生重組多肽。本發(fā)明提供了鑒定具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽的方法,包括以下步驟(a)提供依據(jù)本發(fā)明的多肽;或由依據(jù)本發(fā)明的核酸編碼的多肽;(b)提供醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶底物;和(c)將步驟(a)的多肽或其片段或變體與步驟(b)的底物接觸,并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加,其中底物量的減少或反應(yīng)產(chǎn)物量的增加檢測出具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽。在一些實施方式中,底物是碳水化合物,含碳水化合物的化合物和/或碳水化合物的類似物。本發(fā)明提供了鑒定醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶底物的方法,包括以下步驟(a)提供依據(jù)本發(fā)明的多肽;或由依據(jù)本發(fā)明的核酸編碼的多肽;(b)提供測試底物;和(c)將步驟(a)的多肽與步驟(b)的測試底物接觸,并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加,其中底物量的減少或反應(yīng)產(chǎn)物量的增加將測試底物鑒定為醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶底物。本發(fā)明提供了確定測試化合物是否與多肽特異性結(jié)合的方法,包括以下步驟(a)在允許核酸翻譯成多肽的條件下表達核酸或含有核酸的載體,其中所述核酸含有依據(jù)本發(fā)明的核酸,或提供依據(jù)本發(fā)明的多肽;(b)提供測試化合物;(C)將所述多肽與所述測試化合物接觸;和(d)確定步驟(b)的測試化合物是否與所述多肽特異性結(jié)合。本發(fā)明提供了鑒定醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的調(diào)節(jié)劑的方法,包括以下步驟(a)提供依據(jù)本發(fā)明的多肽或由依據(jù)本發(fā)明的核酸編碼的多肽;(b)提供測試化合物;(c)將步驟(a)的多肽與步驟(b)的測試化合物接觸,并測量醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性,其中在存在測試化合物的情況下測定的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性與不存在測試化合物的情況下測定的活性相比的變化,提供了如此確定該測試化合物調(diào)節(jié)醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性。在一些實施方式中,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的活性可以通過提供醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶底物并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加,或,底物量的增加或反應(yīng)產(chǎn)物量的減少來測定。與測試化合物不存在的情況下底物或反應(yīng)產(chǎn)物量的比較,在測試化合物存在的情況下底物量的減少或反應(yīng)產(chǎn)物量的增加將測試化合物鑒定為醛縮酶例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的激活劑。與測試化合物不存在的情況下底物或反應(yīng)產(chǎn)物量的比較,在測試化合物存在的情況下底物量的增加或反應(yīng)產(chǎn)物量的減少將測試化合物鑒定為醛縮酶例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的抑制劑。本發(fā)明提供了計算機系統(tǒng),該系統(tǒng)包括處理器和數(shù)據(jù)存儲設(shè)備,其中所述數(shù)據(jù)存儲設(shè)備上已經(jīng)存儲了本發(fā)明的多肽序列或核酸序列(例如由依據(jù)本發(fā)明的核酸編碼的多肽或肽)。在一些實施方式中,計算機系統(tǒng)可以進一步包括序列比較算法和數(shù)據(jù)存儲設(shè)備,其中數(shù)據(jù)存儲設(shè)備上已經(jīng)存儲了至少一個參考序列。在其他實施方式中,序列比較算法包括指出多態(tài)現(xiàn)象(多態(tài)性)的計算機程序。在一些實施方式中,計算機系統(tǒng)可以進一步包括在所述序列中鑒定一個或多個特征的鑒定器(標(biāo)識符,identifier).在一些實施方式中,本發(fā)明提供了計算機可讀介質(zhì),其上已經(jīng)存儲了本發(fā)明的多肽序列或核酸序列。在一些實施方式中,本發(fā)明提供了用于鑒定序列中的特征的方法,包括如下步驟(a)使用鑒定序列中的一個或多個特征的計算機程序讀取序列,其中所述序列包括本發(fā)明的多肽序列或核酸序列;和(b)用所述計算機程序鑒定序列中的一個或多個特征。在一些實施方式中,本發(fā)明提供了將第一序列與第二序列進行比較的方法,包括如下步驟(a)通過使用比較序列的計算機程序讀取第一序列和第二序列,其中第一序列包括依據(jù)本發(fā)明的多肽序列或核酸序列和(b)用所述計算機程序確定第一序列和第二序列之間的差異。確定第一序列和第二序列之間差異的步驟可以進一步包括鑒定多態(tài)性的步驟。在一些實施方式中,該方法可以進一步包括可鑒定序列中的一個或多個特征的鑒定器。在其他實施方式中,該方法可以包括使用計算機程序讀取第一序列,并鑒定該序列中的一個或多個特征。47本發(fā)明提供了從樣品,如環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,包括以下步驟(a)提供擴增核酸的擴增引物序列對,該核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,其中所述引物對能夠擴增依據(jù)本發(fā)明的核酸;(b)從樣品中分離核酸,或處理樣品以便樣品中的核酸可實現(xiàn)與擴增引物對雜交;和(c)將步驟(b)的核酸與步驟(a)的擴增引物對組合,以從樣品中擴增核酸,由此從樣品中分離或回收編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽的核酸。擴增引物序列對的一個或每個成員可以包含寡核苷酸,其包括依據(jù)本發(fā)明的擴增引物序列對,如具有依據(jù)本發(fā)明序列的至少約10到50個連續(xù)堿基。在本發(fā)明的一種實施方式中,樣品是環(huán)境樣品。本發(fā)明提供了從樣品,如環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,包括以下步驟(a)提供具有依據(jù)本發(fā)明的核酸或其子序列的多核苷酸探針;(b)從樣品中分離核酸,或處理樣品,以便樣品中的核酸可實現(xiàn)與步驟(a)的多核苷酸探針雜交;(c)將步驟(b)的分離的核酸或處理樣品與步驟(a)的多核苷酸探針混合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,由此從樣品中分離或回收編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽的核酸。樣品可包括水樣品、液體樣品、土壤樣品、空氣樣品或生物樣品。在一些實施方式中,生物樣品可以來源于細菌細胞、原生動物細胞、昆蟲細胞、酵母細胞、植物細胞、真菌細胞或哺乳動物細胞。在本發(fā)明的一種實施方式中,樣品是環(huán)境樣品。本發(fā)明提供了產(chǎn)生核酸變體的方法,所述核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,該方法包括以下步驟(a)提供包含依據(jù)本發(fā)明的核酸的模板核酸;和(b)在模板序列中修飾、缺失或添加一個或多個核苷酸,或進行修飾、缺失和添加的組合,以產(chǎn)生模板核酸的變體。在一些實施方式中,該方法可以進一步包括表達變體核酸以產(chǎn)生變體醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽。修飾、添加或缺失可以通過包括如下方法中的方法來引入,包括易錯PCR、改組(重排'shuffling)、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變(recursiveensemblemutagenesis)、指數(shù)整體誘變、位點特異性誘變、基因再裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、染色體飽和誘變(CSM)或其組合。在其他實施方式中,修飾、添加或缺失通過如下方法的方法引入包括重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變(gappedduplexmutagenesis)、點錯配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。48在一些實施方式中,該方法可被迭代重復(fù),直到產(chǎn)生與由模板核酸編碼的多肽相比具有改變的或不同活性的或改變的或不同穩(wěn)定性的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶。在一些實施方式中,變體醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽是耐熱性的,并且在暴露于升高的溫度后保持一些活性。在其它的實施方式中,變體醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽與模板核酸編碼的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶相比具有提高的糖基化水平。可選地,變體醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽在高溫下具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性,其中由模板核酸編碼的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶在高溫下是沒有活性的。在一些實施方式中,該方法可被迭代重復(fù),直到產(chǎn)生具有與模板核酸的密碼子使用有所不同的密碼子使用的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶編碼序列。在其它實施方式中,該方法可以被迭代重復(fù),直到產(chǎn)生具有比模板核酸的信息表達或穩(wěn)定性更高或更低水平的信息表達或穩(wěn)定性的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶基因。本發(fā)明提供了在編碼具有醛縮酶例如丙酮酸醛縮酶,如HMG禾口/或KHG醛縮酶活性的多肽的核酸中修飾密碼子以增加其在宿主細胞中的表達的方法,該方法包括如下步驟(a)提供編碼具有酲縮酶例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽的依據(jù)本發(fā)明的核酸;和(b)鑒定步驟(a)的核酸中非優(yōu)選或較不優(yōu)選的密碼子,用優(yōu)選的或中度使用(neutrallyused)的密碼子來代替,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選密碼子是在宿主細胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以增加其在宿主細胞中的表達。本發(fā)明提供了修飾核酸中的密碼子的方法,所述核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG酸縮酶活性的多肽;該方法包括以下步驟(a)提供依據(jù)本發(fā)明的核酸;和(b)鑒定步驟(a)的核酸中的密碼子,并用不同的密碼子來代替,所述不同的密碼子編碼與被代替的密碼子相同的氨基酸,由此修飾編碼醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的核酸中的密碼子。本發(fā)明提供了修飾核酸中的密碼子的方法,以提高其在宿主細胞中的表達,該核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,該方法包括以下步驟(a)提供依據(jù)本發(fā)明的核酸,其編碼醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽;和(b)鑒定步驟(a)的核酸中的非優(yōu)選或較不優(yōu)選密碼子,并用優(yōu)選的或中度使用的密碼子來代替,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選密碼子是在49宿主細胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以增加其在宿主細胞中的表達。本發(fā)明提供了修飾核酸中的密碼子的方法,以提高其在宿主細胞中的表達,該核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,該方法包括以下步驟(a)提供本發(fā)明的核酸;和(b)鑒定步驟(a)的核酸中的至少一個優(yōu)選密碼子,并用非優(yōu)選的或較不優(yōu)選的密碼子來代替,所述非優(yōu)選或較不優(yōu)選的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選的密碼子是在宿主細胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以降低其在宿主細胞中的表達。在一些實施方式中,宿主細胞可以是細菌細胞、真菌細胞、昆蟲細胞、酵母細胞、植物細胞或哺乳動物細胞。本發(fā)明提供了產(chǎn)生核酸文庫的方法,該核酸編碼許多修飾的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性位點或底物結(jié)合位點,其中修飾的活性位點或底物結(jié)合位點由含有編碼第一活性位點或第一底物結(jié)合位點的序列的第一核酸衍生得到;該方法包括以下步驟(a)提供編碼第一活性位點或第一底物結(jié)合位點的第一核酸,其中第一核酸序列包含在嚴格條件下與依據(jù)本發(fā)明的核酸雜交的序列,并且該核酸編碼醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性位點,或醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶底物結(jié)合位點;(b)提供一組誘變寡核苷酸,其在第一核酸的多個目標(biāo)密碼子處編碼天然發(fā)生的氨基酸變體;和(c)使用該組誘變的寡核苷酸以產(chǎn)生一組編碼活性位點或編碼底物結(jié)合位點的變體核酸,其在被誘變的每一氨基酸密碼子處編碼一定范圍的氨基酸變化,從而產(chǎn)生編碼多個被修飾的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性位點或底物結(jié)合位點的核酸的文庫。在一些實施方式中,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸優(yōu)化的定向進化系統(tǒng)、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、易錯PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體誘變、位點特異性誘變、基因再裝配及其組合。在其他實施方式中,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸或變體重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變、點錯配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。本發(fā)明提供了產(chǎn)生小分子的方法,包括如下步驟(a)提供多個能合成或修飾小分子的生物合成酶,其中這些酶中的一種酶包括由本發(fā)明的核酸編碼的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶;(b)為步驟(a)的至少一種酶提供底物;和(c)將步驟(b)的底物與這些酶在能促進多個生物催50化反應(yīng)的條件下通過一系列生物催化反應(yīng)進行反應(yīng),以產(chǎn)生小分子。在一些實施方式中,本發(fā)明提供了修飾小分子的方法,包括如下步驟(a)提供醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,其中該酶包括本發(fā)明的多肽,或由本發(fā)明的核酸編碼的多肽,或其子序列;(b)提供小分子;和(C)將歩驟(a)的酶與步驟(b)的小分子在能促進由醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶催化的酶促反應(yīng)的條件下進行反應(yīng),從而通過醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶酶促反應(yīng)修飾小分子。在一些實施方式中,該方法可以包括步驟(a)的酶的多個小分子底物,從而產(chǎn)生通過由醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶催化的至少一種酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫。在一些實施方式中,該方法可以包括多個其它的酶,在有助于這些酶介導(dǎo)的多個生物催化反應(yīng)的條件下,以形成由多個酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫。在其他實施方式中,該方法可以進一步包括測試該文庫以確定該文庫中是否存在表現(xiàn)出期望活性的特定被修飾小分子的步驟。測試該文庫的步驟可以進一步包括系統(tǒng)地去除所有但保留一個用于產(chǎn)生文庫中多個被修飾小分子中的一部分的生物催化反應(yīng),方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,并鑒定出產(chǎn)生具有期望活性的特定修飾小分子的至少一個特異性生物催化反應(yīng)。本發(fā)明提供了確定醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶功能片段的方法,包括以下步驟(a)提供醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,其中所述酶含有依據(jù)本發(fā)明的多肽,或依據(jù)本發(fā)明的核酸或其子序列編碼的多肽;和(b)從步驟(a)的序列中缺失多個氨基酸殘基,并測試醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的剩余序列,從而確定丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的功能片段。在一些實施方式中,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性通過提供醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶底物,并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加來測量。本發(fā)明提供了通過使用實時代謝流(real-timemetabolicflux)分析進行新的或修飾的表型的全細胞工程改造的方法,該方法包括如下步驟(a)通過修飾細胞的遺傳組成產(chǎn)生修飾的細胞,其中所述遺傳組成通過將本發(fā)明的核酸加入到細胞來修飾;(b)培養(yǎng)修飾的細胞以產(chǎn)生多個修飾的細胞;(c)通過實時監(jiān)控步驟(b)的細胞培養(yǎng)物來測量該細胞的至少一個代謝參數(shù);和(d)分析步驟(c)的數(shù)據(jù),以確定被測量的參數(shù)是否與在類似條件下未修飾細胞中的參照測量值不同,從而使用實時代謝流量分析鑒定細胞中的工程改造的表型。在一些實施方式中,細胞的遺傳組成可以通過包括在細胞中序列的缺失或序列的修飾,或敲除基因的表達的方法來修飾。在一些實施方式中,該方法可以進一步包括選擇含有新的工程改造的表型的細胞。在其他實施方式中,該方法可以包括培養(yǎng)被選擇51的細胞,從而產(chǎn)生包含新的工程表型的新細胞株。本發(fā)明提供了提高醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶多肽的耐熱性或熱穩(wěn)定性的方法,該方法包括對醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶多肽進行糖基化,其中所述多肽包括依據(jù)本發(fā)明的多肽,或依據(jù)本發(fā)明的核酸編碼的多肽的至少三十個連續(xù)的氨基酸,由此提高醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶多肽的耐熱性或熱穩(wěn)定性。在一些實施方式中,醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的比活性在高于約37'C到約95'C的溫度范圍內(nèi)可以是熱穩(wěn)定的或耐熱的。本發(fā)明提供了在細胞中過量表達重組的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽的方法,該方法包括表達含有核酸的載體,該核酸包括本發(fā)明的核酸或本發(fā)明的核酸序列,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定,其中過量表達通過使用高活性啟動子、雙順反子(dicistronic)載體或通過該載體的基因擴增來實現(xiàn)。本發(fā)明提供了產(chǎn)生轉(zhuǎn)基因植物的方法,該方法包括如下步驟(a)將異源核酸序列引入細胞中,其中異源核酸序列包括本發(fā)明的核酸序列,從而產(chǎn)生轉(zhuǎn)化的植物細胞;和(b)從轉(zhuǎn)化的細胞產(chǎn)生轉(zhuǎn)基因植物。在一些實施方式中,步驟(a)可以進一步包括通過植物細胞原生質(zhì)體的電穿孔或顯微注射引入異源核酸序列。在其他實施方式中,步驟(a)可以進一步包括通過DNA微粒轟擊(DNAparticlebombardment)將異源核酸序列直接引入植物組織中??梢赃x擇地,步驟(a)可以進一步包括使用根瘤農(nóng)桿菌"gra6a"m'wmrtmje/aa'era)宿主將異源核酸序列引入植物細胞DNA中。在一些實施方式中,植物細胞可以是甘蔗、甜菜、大豆、番茄、馬鈴薯、玉米、水稻、小麥、煙草或大麥細胞。本發(fā)明提供了在植物細胞中表達異源核酸序列的方法,該方法包括如下步驟(a)用與啟動子可操作地連接的異源核酸序列轉(zhuǎn)化植物細胞,其中異源核酸序列包括本發(fā)明的核酸;(b)在異源核酸序列可在植物細胞中表達的條件下培養(yǎng)所述植物。在一些實施方式中,本發(fā)明提供了在植物細胞中表達異源核酸序列的方法,該方法包括如下步驟(a)用與啟動子可操作地連接的異源核酸序列轉(zhuǎn)化植物細胞,其中異源核酸序列包括本發(fā)明的序列;(b)在異源核酸序列可在植物細胞中表達的條件下培養(yǎng)所述植物。本發(fā)明提供了飼料或食品,其含有本發(fā)明的多肽或本發(fā)明的核酸編碼的多肽。在一些實施方式中,本發(fā)明提供了食品、飼料、液體如飲料(如果汁或啤酒)、面包或面團或面包產(chǎn)品、或飲料前體(例如,麥芽汁),其含有本發(fā)明的多肽。在其它實施方式中,本發(fā)明提供了含有依據(jù)本發(fā)明的多肽的食品、飼料或飲料添加劑。在一些實施方式中,本發(fā)明提供了含有依據(jù)本發(fā)明的多肽,或依據(jù)本發(fā)明的核酸編碼的多肽的食品或營養(yǎng)補充劑,如用于人類或動物的食品或營養(yǎng)補充劑。52在一些實施方式中,食品或營養(yǎng)補充劑中的多肽可以是糖基化的。在一些實施方式中,本發(fā)明提供了可食用的酶輸送基質(zhì),其包含依據(jù)本發(fā)明的多肽,如依據(jù)本發(fā)明的核酸編碼的多肽。在一些實施方式中,輸送基質(zhì)包含丸劑。在一些實施方式中,多肽可以是糖基化的。在一些實施方式中,醛縮酶,例如丙酮酸酸縮酶,如HMG和/或KHG醛縮酶的酶活性是耐熱的。在其它實施方式中,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的酶活性是熱穩(wěn)定的。本發(fā)明提供了含有依據(jù)本發(fā)明的多肽的食品、飼料或營養(yǎng)補充劑。在一些實施方式中,本發(fā)明提供了使用醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶作為動物膳食中的營養(yǎng)補充劑的方法,該方法包括制備含有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的營養(yǎng)補充劑,所述酶含有依據(jù)本發(fā)明的多肽的至少三十個連續(xù)氨基酸;和給予動物該營養(yǎng)補充劑。動物可以是人、反芻或單胃動物。醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶可以通過在選自細菌、酵母、植物、昆蟲、真菌和動物的生物體中表達編碼醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的多核苷酸制備。所述生物體可選自裂變酵母(S.pom6e)、釀酒酵母(S.cerev/w'ae)、畢赤酵母(尸/c/z/a.person's)、大腸桿菌(£.co//.)、鏈霉菌屬某種(5"加j^o/^c"sp.)、桿菌屬某種(5ac/〃Msp.)和乳酸桿菌屬某種(丄acoZwc/'〃Msp.)。本發(fā)明提供了可食用的酶輸送基質(zhì),其包含熱穩(wěn)定的重組醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,例如依據(jù)本發(fā)明的多肽。在一些實施方式中,本發(fā)明提供了向動物輸送酲縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的方法,該方法包括制備丸劑形式的可食用的酶輸送基質(zhì),其含有粒狀的可食用載體和熱穩(wěn)定的重組醛縮酶,例如丙酮酸酸縮酶,如HMG和/或KHG醛縮酶,其中所述丸劑易于將包含在其中的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶分散在含水介質(zhì)中和給予動物該可食用的酶輸送基質(zhì)。重組的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶可以包含依據(jù)本發(fā)明的多肽。醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,可以被糖基化,以在制丸的條件下提供熱穩(wěn)定性。該輸送基質(zhì)可以通過對含有谷物胚芽和醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的混合物進行制丸而形成。制丸條件可包括蒸汽的應(yīng)用。制丸條件可包括應(yīng)用超過約80'C的溫度約5分鐘,而該酶保持每毫克蛋白至少大約350到大約900單位的比活性。在一些實施方式中,本發(fā)明提供了藥物組合物,其含有依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶,或依據(jù)本發(fā)明的核酸編碼的多肽。在一些實施方式中,該藥物組合物發(fā)揮助消化劑的作用。在一些實施方式中,含有碳-碳鍵的化合物與依據(jù)本發(fā)明的多肽在約pH3.0到約pH9.0、約3.0到約10.0、約3.0到約11.0或更高的pH范圍內(nèi)接觸,依據(jù)本發(fā)明的多肽具有醛縮酶活性,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶53的酶活性。在其它實施方式中,含有碳-碳鍵的化合物與醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,在至少約55'C、60'C、65°C、70°C、75°C、80°C、85°C、90'C或更高的溫度下接觸。本公開還提供了用于促進生產(chǎn)monatin、monatin衍生物及其鹽,例如生產(chǎn)R-2-羥基2-(U引哚-3基甲基)-4-酮戊二酸(也是指R-a酮酸monatin、R-monatin前體、R-MP和a酮形式的monatin),monatin的某些立體異構(gòu)體的前體,如R,R和S,Rmonatin的過程中的反應(yīng)的多肽。本公開也提供了使用一種或多種本發(fā)明的多肽生產(chǎn)monatin、monatin衍生物、及其鹽和內(nèi)縮合產(chǎn)物的方法。合成R-MP、monatin的立體異構(gòu)體和/或monatin衍生物的立體異構(gòu)體的方法包括使用一種或多種具有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:26、SEQIDNO:36、SEQIDNO:46、SEQIDNO:56、SEQIDNO:66、SEQIDNO:76、SEQIDNO:86、SEQIDNO:%、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:148、SEQIDNO:150、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:166、SEQIDNO:168、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:184、SEQIDNO:186、SEQIDNO:I92、SEQIDNO:194、SEQIDNO:196、SEQIDNO:202、SEQIDNO:204、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:220、SEQIDNO:222、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:238、SEQIDNO:240、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:22SEQIDNO:32SEQIDNO:42SEQIDNO:52SEQIDNO:62SEQIDNO:72SEQIDNO:82SEQIDNO:92SEQIDNO:24、SEQIDNO:34、SEQIDNO:44、SEQIDNO:54、SEQIDNO:64、SEQIDNO:74、SEQIDNO:84、SEQIDNO:94、SEQIDNO:28、SEQIDNO:30、SEQIDNO:38、SEQIDNO:40、SEQIDNO:48、SEQIDNO:50、SEQIDNO:58、SEQIDNO:60、SEQIDNO:68、SEQIDNO:70、SEQIDNO:78、SEQIDNO:80、SEQIDNO:88、SEQIDNO:90、SEQIDNO:98、SEQIDNO:100、SEQIDNO:144、SEQIDNO:146、NO:152、SEQIDNO:154、SEQIDSEQIDNO:162、SEQIDNO:164、NO:HO、SEQIDNO:172、SEQIDSEQIDNO:180、SEQIDNO:182、NO:188、SEQIDNO:190、SEQIDSEQIDNO:198、SEQIDNO:200、NO:206、SEQIDNO:208、SEQIDSEQIDNO:216、SEQIDNO:218、NO:224、SEQIDNO:226、SEQIDSEQIDNO:234、SEQIDNO:236、NO:242、SEQIDNO:244、SEQIDSEQIDNO:252、SEQIDNO:254、54SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:3I0、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334及其酶活性片段中任何的帶有醛縮酶活性的多肽。同時,合成R-MP、monatin的立體異構(gòu)體禾D/或monatin衍生物的立體異構(gòu)體的方法可包括使用由核酸序列編碼的具有醛縮酶活性的多肽,所述核酸序列與依據(jù)本發(fā)明的核酸,包括SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:I49、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDN0..247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:26S、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQ1DN0:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338,在至少約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、l細、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多殘基的區(qū)域內(nèi),具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99。/。或更高或完全的(100%)序列同一性。此外,合成R-MP、monatin的立體異構(gòu)體禾Q/或monatin衍生物的立體異構(gòu)體的方法可包括使用在嚴格條件下與SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDN。:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:lOl、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQID56NO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:I89、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸雜交的核酸序列編碼的、具有醛縮酶活性的多肽。本發(fā)明提供了方法,包括在多步途徑中生產(chǎn)選自monatin、monatin衍生物、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由一種或多種多肽輔助,所述多肽選自包含SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQ57IDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:102、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334的氨基酸序列或其片段或子序列的、具有醛縮酶活性的分離的或重組的多肽。在一些實施方式中,其片段或子序列具有至少0.2mgMP/mg蛋白/hr的醛縮酶活性。在其它實施方式中,其片段或子序列具有至少0.1mgMP/mg蛋白/hr的醛縮酶活性。在一些實施方式中,由一種或多種依據(jù)本發(fā)明的多肽輔助的反應(yīng)在約1.0到約10.0mM的MgCl2中進行。在其它實施方式中,由一種或多種依據(jù)本發(fā)明的多肽輔助的反應(yīng)在約pH7.0到約pH11.5的條件下進行。在另外的實施方式中,由一種或多種依據(jù)本發(fā)明的多肽輔助的反應(yīng)在約0.005%到約1%的聚山梨醇酯洗滌劑中進行。在一些實施方式中,反應(yīng)是吲哚-3-丙酮酸與C3碳源之間的反應(yīng)。在58—些實施方式中,反應(yīng)優(yōu)選地產(chǎn)生R-2-羥基-2-(H引哚-3-基-甲基)-4-酮戊二酸,而非S-2-羥基-2-(n引哚-3-基-甲基)-4-酮戊二酸。在一些實施方式中,由多步途徑生產(chǎn)的產(chǎn)物是monatin、其鹽及其組合。在其它實施方式中,在多步途徑中,R,R-monatin、R-Smonatin或其組合中至少一種以比S,S-monatin或S,R-monatin更大的量被產(chǎn)出。在一些實施方式中,在多步途徑中,R,Rmonatin以比R,S-monatin、S,S-monatin禾卩S,R-monatin更大的量產(chǎn)出。本發(fā)明提供了方法,包括在多步途徑中生產(chǎn)選自monatin、monatin衍生物、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由至少一種由核酸序列編碼的多肽輔助,所述核酸序列包含與SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:I37、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQEDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:I69、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQID59NO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338具有至少50%序列同一性百分比的序列。在一些實施方式中,序列同一性百分數(shù)至少為95%。在其它實施方式中,序列同一性的百分數(shù)為100%。本發(fā)明提供了包含優(yōu)選地產(chǎn)生R-2-羥基-2-(D引哚-3-基-甲基)-4-酮戊二酸,而非S-2-羥基-2-(吲哚-3-基-甲基)-4-酮戊二酸反應(yīng)的方法,其中至少一種由核酸序列編碼的多肽被用于輔助多步途徑中的一個反應(yīng),所述多肽包括與SEQIDNO:28、SEQIDNO:116、SEQIDNO:298、SEQIDNO:44、SEQIDNO:54、SEQIDNO:148、SEQIDNO:46、SEQIDNO:134、SEQIDNO:142、SEQIDNO:122、SEQIDNO:74、SEQIDNO:64、SEQIDNO:108、SEQIDNO:96、SEQIDNO:126、SEQIDNO:80、SEQIDNO:36、SEQIDNO:62、SEQIDNO:112、SEQIDNO:130、SEQIDNO:94、SEQIDNO:58、SEQIDNO:50、SEQIDNO:106、SEQIDNO:42、SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192、SEQIDNO:200、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQK)NO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240和SEQIDNO:156具有至少95°/。的序列同一性的序列。本發(fā)明提供了方法,包括在多步途徑中生產(chǎn)選自monatin、monatin衍生物、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由至少一種由核酸序列編碼的多肽輔助,所述核酸序列包含在嚴格條件下與SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQID60NO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338的核酸雜交的序列。本發(fā)明也提供了方法,包括在多步途徑中生產(chǎn)選自monatin前體、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由一種或多種多肽輔助,所述多肽選自具有醛縮酶活性的、包含SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQID61SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:I92、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO,、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQEDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334的氨基酸序列或其片段或子序列的分離的或重組的多肽,其中所述monatin前體、其鹽及其組合是甜的。本發(fā)明額外地提供了方法,包括在多步途徑中生產(chǎn)選自monatin前體、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由至少一種由核酸序列編碼的多肽輔助,所述核酸序列包含與SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQID62NO:7、NO:17NO:27NO:37NO:47NO:57NO:69NO:79NO:89NO:99IDNOSEQIDNO:9、SEQIDNO:ll、SEQIDNO:19、SEQIDNO:21SEGIDNO:29、,SEQIDNO:39、,SEQIDNO:49、,SEQIDNO:59、,SEQIDNO:71、,SEQIDNO:81、,SEQIDNO:91、,SEQIDNO:103、111、SE()IDNO:SEQIDNO:31、SEQIDNO:41、SEQIDNO:51、SEQIDNO:63、SEQIDNO:73、SEQIDNO:83、SEQIDNO:93、SEQIDNO:15、SEQIDNO:25、SEQIDNO:35、SEQIDNO:45、SEQIDNO:55、SEQIDNO:67、,SEQIDNO:77、SEQIDNO:87、,SEQIDNO:97、SEQIDSEQIDSEQIDSEQIDSEQIDSEQIDSEQIDSEQIDSEQIDSEQIDNO:13、SEQIDNO:23、SEQIDNO:33、SEQIDNO:43、SEQIDNO:53、SEQIDNO:65、,SEQIDNO:75,SEQIDNO:85、,SEQIDNO:95,SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQ113、SECHDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQDDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338具有至少50%序列同一性百分比的序列,其中所述monatin前體、其鹽及其組合是甜的。本發(fā)明進一步提供了方法,包括在多步途徑中生產(chǎn)選自monatin前體、其鹽及其組合的產(chǎn)品,其中該途徑中的反應(yīng)由至少一種由核酸序列編碼的多肽輔助,所述核酸序列包含在嚴格條件下與SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:27、SEQIDNO:37、SEQIDNO:47、SEQIDNO:57、SEQIDNO:69、SEQIDNO:79、SEQIDNO:89、SEQIDNO:99、SEQIDNO:19、SEQIDNO:29、SEQIDNO:39、SEQIDNO:49、SEQIDNO:59、SEQIDNO:71、SEQIDNO:81、SEQIDNO:91、SEQIDNO:103、SEQIDNO:21、SEQIDNO:31、SEQIDNO:41、SEQIDNO:51、SEQIDNO:63、SEQIDNO:73、SEQIDNO:83、SEQIDNO:93、SEQIDNO:23、SEQIDNO:33、SEQIDNO:43、SEQIDNO:53、SEQIDNO:65、SEQIDNO:75、SEQIDNO:85、SEQIDNO:95、SEQIDNO:107、SEQIDNO:25、SEQIDNO:35、SEQIDNO:45、SEQIDNO:55、SEQIDNO:67、SEQIDNO:77、SEQIDNO:87、SEQIDNO:97、SEQIDNO:109、.SEQIDNO:105、SEQIDNO:川、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQE)NO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQ64IDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338的核酸雜交的序列,其中所述monatin前體、其鹽及其組合是甜的。為了簡潔,在本說明書及權(quán)利要求書中中間體/產(chǎn)物(如monatin、monatin前體或monatin衍生物(一種或多種))被認為形成的任何地方,術(shù)語"和/或其鹽"應(yīng)該被理解為被包括在應(yīng)用的地方。換句話說,例如,短語"H引哚-3-丙酮酸被轉(zhuǎn)化為MP"應(yīng)該被理解為是"U引哚-3-丙酮酸被轉(zhuǎn)化為MP和/或其鹽"。實際上,普通技術(shù)人員可以認識到在所示的反應(yīng)條件下,中間體/產(chǎn)物的鹽事實上存在。根據(jù)一些實施方式,該方法產(chǎn)生monatin或monatin衍生物組合物,其中該組合物的monatin或monatin衍生物組分僅包括R,R和S,R形式的monatin或monatin衍生物。當(dāng)用于表示只有某些異構(gòu)體形成時,術(shù)語"僅"表示如果外消旋反應(yīng)不發(fā)生,該途徑只產(chǎn)生識別的異構(gòu)體。因此,術(shù)語"僅"不應(yīng)該用來表示不存在其它異構(gòu)體,相反普通技術(shù)人員將會理解,由于可能發(fā)生的外消旋反應(yīng),其它異構(gòu)形式可能以相對小的量存在。根據(jù)一些實施方式,該方法產(chǎn)生組合物,其中該組合物的monatin或monatin衍生物組分僅包括R,R形式的monatin或monatin衍生物(除了一定程度的外消旋反應(yīng)發(fā)生,產(chǎn)生其它異構(gòu)形式)。如這里所用,短語"monatin組合物"表示包含一種或多種monatin異構(gòu)體的組合物;該術(shù)語也可以表示只有單一異構(gòu)形式的monatin而沒有其它。如這里所用,短語"monatin衍生物組合物"表示包含一種或多種monatin衍生物的異構(gòu)體的組合物;該術(shù)語也可以表示只有單一異構(gòu)形式的monatin衍生物而沒有其它。如這里所用,短語"monatin衍生物"具有以下結(jié)構(gòu)其中,Ra、Rb、Rc、Ro和Re每一個獨立地代表選自氫原子,羥基基團,C廣C3烷基基團,CrC3垸氧基基團,氨基基團,鹵素原子——如碘原子、溴原子、氯原子或氟原子——的任何取代基,然而,Ra、Rb、Rc、Rd和Re不能同時都為氫??蛇x地,Rb和Rc,和/或Rd和Re分別可以一起形成Q-Q亞烷基。如這里所用,"取代的吲哚-3-丙酮酸"表示吲哚-3-丙酮酸的吲哚環(huán)上的65一個或多個碳原子獨立地被上面定義的Ra、Rb、Rc、Rd和Re取代基中的一個或多個取代。然而,Ra、Rb、Rc、Rd和Re不能同時都為氫??蛇x地,Rb和Rc,和/或Ro和Re分別可一起形成CrC4亞烷基。如這里所用,"取代色氨酸"表示色氨酸的吲哚環(huán)上的一個或多個碳原子獨立地被上面定義的Ra、Rb、Rc、Rd和Re取代基中的一個或多個取代。然而,Ra、Rb、Rc、Rd和R^不能同時都為氫??蛇x地,Rb和R^和/或Rd和Re分別可以一起形成d-C4亞烷基。在一種實施方式中,取代的色氨酸在吲哚環(huán)上包含與最終monatin衍生物相同的取代基(一個或多個)。此外,本文所述的生產(chǎn)monatin的生物合成途徑可以使用取代的色氨酸來生產(chǎn)可能具有甜味的monatin衍生物。在一些實施方式中,用在本文所述的生物合成途徑中的取代的色氨酸包括氯化色氨酸和5-羥色氨酸。舉例來說,與R,Rmonatin具有結(jié)構(gòu)相似性的氯化D-色氨酸已經(jīng)被鑒定為非營養(yǎng)性增甜劑(特別是6-氯-D-色氨酸)。類似地,鹵化的和羥基取代形式的monatin已經(jīng)被發(fā)現(xiàn)具有甜味。美國公開的專利申請?zhí)?005/0118317。鹵素和羥基基團可以取代氫,特別在色氨酸的吲哚的苯環(huán)上的1-4位上,而不干擾后續(xù)向D-或L-色氨酸、卩引哚-3-丙酮酸、MP或monatin的轉(zhuǎn)化。取代的吲哚在文獻中已經(jīng)顯示出是PLP-酶的合適底物并且已經(jīng)產(chǎn)出取代的色氨酸。Fukuda,D.S.等,"ProductionofSubstitutedL墨TryptophansbyFermentation",j/7/7/.£"v/ro".A//'cto6/o/.,21:841-43(1971)。鹵素未顯示出在空間上阻礙色氨酸合成酶P亞基催化機理,并且對映特異性(enantiospecificity)也完整無損。在本發(fā)明的一些實施方式中,提供了生產(chǎn)monatin組合物的方法,其包括從L-色氨酸產(chǎn)生吲哚-3-丙酮酸,從吲哚-3-丙酮酸產(chǎn)生2-羥基-2-(B引哚-3-基甲基)_4-酮戊二酸("monatin前體"或"MP"),和從MP產(chǎn)生monatin。L-色氨酸產(chǎn)生n引哚-3-丙酮酸的反應(yīng)由具有對L-色氨酸比R-MP、R,Rmonatin或兩者更高特異性、更高活性或兩者兼具的酶促進(輔助)。根據(jù)某些實施方式,吲哚-3-丙酮酸的反應(yīng)由具有R-特異醛縮酶活性的酶促進并因此產(chǎn)生R-MP。根據(jù)某些實施方式,提供消旋酶,其能夠促進色氨酸反應(yīng)的氨基酸副產(chǎn)物從一種異構(gòu)形式到另一種異構(gòu)形式的差向異構(gòu)化(epimerization)。在依據(jù)本發(fā)明的一些實施方式中,提供了生產(chǎn)monatin組合物的方法,其包括從L-色氨酸產(chǎn)生吲哚-3-丙酮酸,從吲哚-3-丙酮酸產(chǎn)生2-羥基-2-(H引哚-3-基甲基)-4-酮戊二酸("monatin前體"或"MP"),和從MP產(chǎn)生monatin。L-色氨酸產(chǎn)生吲哚-3-丙酮酸的反應(yīng)由具有對L-色氨酸比R-MP、R,Rmonatin或兩者更高特異性、更高活性或兩者兼具的酶促進,并且MP形成monatin的反應(yīng)由對R-MP具有立體選擇性的酶促進。術(shù)語"立體選擇的(stereoselective)"表示對一種異構(gòu)體比另一種異構(gòu)體具有更高特異性、更高活性或兩者兼具的酶——本例中是R-MP對S-MP。在優(yōu)選的實施方式中,與另一種異構(gòu)體相比,立體選擇的酶對一種異構(gòu)體66具有有限的活性。"有限的"活性表示最小的或不可感知的活性,例如根據(jù)本文提供的實驗確定的。應(yīng)該注意,在對一系列反應(yīng)引用參考的地方,如前面的段落中,本發(fā)明不要求每一步被明確地實施該步驟被隱含地實施就足夠。換句話說,例如,生產(chǎn)monatin組合物的方法,其包括從L-色氨酸產(chǎn)生吲哚-3-丙酮酸,從B引哚-3-丙酮酸產(chǎn)生2-羥基-2-(卩引哚-3-基甲基)-4-酮戊二酸("monatin前體"或"MP"),和從MP產(chǎn)生monatin,其中每個反應(yīng)由適當(dāng)?shù)拿复龠M,可以通過混合L-色氨酸和酶并設(shè)置條件以便列舉的反應(yīng)能夠發(fā)生來進行。在這樣的例子中,L-色氨酸可以反應(yīng)成生吲哚-3-丙酮酸,從L-色氨酸成生的吲哚-3-丙酮酸可以反應(yīng)形成MP,以及從吲哚-3-丙酮酸成生的MP可以反應(yīng)形成monatin。該過程例如也可以通過下例的方法進行提供在適合L-色氨酸的產(chǎn)生發(fā)生的條件下能夠產(chǎn)生L-色氨酸的化合物并將該化合物與能夠促進所述一系列反應(yīng)的酶在適合那些反應(yīng)發(fā)生的條件下混合。作為另一個實例,該過程可以如下實施提供經(jīng)遺傳工程改造以根據(jù)所述的途徑產(chǎn)生monatin的微生物,并提供適合發(fā)酵過程發(fā)生的條件。例如,天然產(chǎn)生大量L-色氨酸的微生物可以被遺傳工程改造,以產(chǎn)生或過量產(chǎn)生用于促進產(chǎn)生monatin途徑中的反應(yīng)的一種或多種酶,并且提供合適的條件以便該微生物借此產(chǎn)生monatiiio在依據(jù)本發(fā)明的其它實施方式中,提供了生產(chǎn)monatin的方法,其中當(dāng)L-色氨酸被轉(zhuǎn)化為吲哚-3-丙酮酸時,底物形成L-氨基酸,吲哚-3-丙酮酸反應(yīng)形成MP(其可以包括R-MP和S-MP,盡管優(yōu)選地僅包括R-MP或絕大多數(shù)為R-MP),并且當(dāng)R-MP被轉(zhuǎn)化為R,Rmonatin時,L-氨基酸反應(yīng)重新產(chǎn)生(也被稱為"再循環(huán)(recycle)")底物。R-MP形成R,Rmonatin的反應(yīng)由立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶(stereoinvertingaminotransferase),如D-蛋氨酸氨基轉(zhuǎn)移酶(EC2.6丄41)或具有D-苯甘氨酸氨基轉(zhuǎn)移酶活性的酶促進。在依據(jù)本發(fā)明的其它實施方式中,提供了生產(chǎn)monatin組合物的方法,其包括從L-色氨酸產(chǎn)生D-色氨酸,從D-色氨酸產(chǎn)生吲哚-3-丙酮酸,從吲哚-3-丙酮酸產(chǎn)生R-MP,和從R-MP產(chǎn)生R,Rmonatin。從L-色氨酸產(chǎn)生D-色氨酸由色氨酸消旋酶及其功能等價物促進。在某些另外的實施方式中,0-色氨酸形成吲哚-3-丙酮酸和MP形成monatin的反應(yīng)由同一酶促進。在還有其他進一步的實施方式中,吲哚-3-丙酮酸的反應(yīng)由具有R-特異的醛縮酶活性的酶促進并由此形成R-MP,并且D-色氨酸形成吲哚-3-丙酮酸的反應(yīng)和R-MP形成R,Rmonatin的反應(yīng)由同一酶促進。在依據(jù)本發(fā)明的一些實施方式中,提供了生產(chǎn)monatin衍生物的方法,其包括使用具有R-特異的醛縮酶活性的酶催化反應(yīng),從取代的吲哚-3-丙酮酸和丙酮酸生產(chǎn)monatin衍生物。本發(fā)明一個或多個實施方式的細節(jié)在下面的附圖和說明書中敘述。依67據(jù)本發(fā)明的其它特征、目標(biāo)和優(yōu)點將通過說明書和附圖以及權(quán)利要求而清楚。從本文說明書應(yīng)該認識到,本發(fā)明能夠在各種實施方式中進行修改,而不背離本發(fā)明的精神和范圍。因此,附圖和詳細的說明書被認為本質(zhì)上是示例性的而非限制性的。此處引述的所有出版物、專利、專利申請、GenBank序列和ATCC保藏物均被特意地引入,以作為參考,用于所有目的。附圖簡述下面的附圖是本發(fā)明的方面的例證性說明,而不意圖限制權(quán)利要求書所包括的本發(fā)明的范圍。圖1是流程圖,其顯示了依據(jù)本發(fā)明,從L-色氨酸生產(chǎn)R,Rmonatin的酶促方法的實例。在該實例中,所述方法包括在L-色氨酸的反應(yīng)中使用L-氨基轉(zhuǎn)移酶(其例子包括L-色氨酸氨基轉(zhuǎn)移酶、L-芳香族氨基轉(zhuǎn)移酶、L-天冬氨酸氨基轉(zhuǎn)移酶和L-丙氨酸氨基轉(zhuǎn)移酶),其對作為底物的L-色氨酸具有比對R-MP更高的特異性和/或選擇性,和/或該方法包括使用對作為底物的R,Rmonatin具有有限活性和/或特異性的L-氨基酸氧化酶。在圖l圖示的特定實例中,L-氨基轉(zhuǎn)移酶或L-氨基酸氧化酶將L-色氨酸轉(zhuǎn)化為吲哚-3-丙酮酸,吲哚-3-丙酮酸與R-特異的醛縮酶和丙酮酸反應(yīng)產(chǎn)生R-a-酮酸monatin(R-MP),并且R-MP通過D-氨基轉(zhuǎn)移酶或D-氨基酸脫氫酶被轉(zhuǎn)化為R,Rmonatin。如圖1所示,反應(yīng)是可逆的,但是出于本發(fā)明的目的,不要求反應(yīng)以反方進行。圖2是顯示依據(jù)本發(fā)明,生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括使用對R-MP有立體選擇性的酶將R-MP轉(zhuǎn)化為monatin。在圖2圖示的特定實例中,色氨酸被顯示為在可逆反應(yīng)中被轉(zhuǎn)化為吲哚-3-丙酮酸。吲哚-3-丙酮酸可以與非立體特異性醛縮酶反應(yīng)以可逆地形成a-酮酸monatin(R-MP和S-MP)。R-MP通過立體選擇性D-氨基轉(zhuǎn)移酶或立體選擇性D-氨基酸脫氫酶被可逆地轉(zhuǎn)化為R,Rmonatin。如果使用立體選擇性D-氨基轉(zhuǎn)移酶或D-氨基酸脫氫酶,通過非立體特異性醛縮酶形成的任何3-旨可以被轉(zhuǎn)化回吲哚-3-丙酮酸。出于本發(fā)明的目的,顯示為可逆的反應(yīng)不需要以反向進行。圖3是顯示依據(jù)本發(fā)明,從L-色氨酸生產(chǎn)R,Rmonatin的又一方法的實例的流程圖。在本實例中,該方法包括使用色氨酸消旋酶將L-色氨酸轉(zhuǎn)化為D-色氨酸,和在與形成吲哚-3-丙酮酸的反應(yīng)偶聯(lián)的反應(yīng)中使用D-氨基酸產(chǎn)物,其中吲哚-3-丙酮酸作為與形成R,Rmonatin的反應(yīng)偶聯(lián)的反應(yīng)中的底物。在圖3圖示的特定實例中,L-色氨酸在可逆反應(yīng)中通過色氨酸消旋酶被轉(zhuǎn)化為D-色氨酸。D-色氨酸與a-酮戊二酸(a-KG)和寬特異性的D-氨基轉(zhuǎn)移酶反應(yīng),產(chǎn)生吲哚-3-丙酮酸和D-谷氨酸。吲哚-3-丙酮酸與丙酮酸和R-特異的醛縮酶反應(yīng)并轉(zhuǎn)化為R-a-酮酸monatin(R-MP),并且R-MP與寬特異性的D-氨基轉(zhuǎn)移酶和D-谷氨酸反應(yīng),形成68R,Rmonatin和a酮戊二酸(a-KG)。如圖3所示,每個反應(yīng)都是可逆的,但是出于本發(fā)明的目的,不要求反應(yīng)以反向進行。圖4是顯示依據(jù)本發(fā)明,從L-色氨酸生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括將在與L-色氨酸反應(yīng)偶聯(lián)的反應(yīng)中形成的L-氨基酸轉(zhuǎn)化為D-氨基酸;該D-氨基酸作為R-MP被轉(zhuǎn)化為R,Rmonatin的反應(yīng)的氨基供體。在圖4圖示的特定實例中,L-色氨酸與L-氨基轉(zhuǎn)移酶和a-酮戊二酸反應(yīng),產(chǎn)生吲哚-3-丙酮酸和L-谷氨酸。H引哚-3-丙酮酸與丙酮酸和R-特異的酸縮酶反應(yīng)并轉(zhuǎn)化為R-a-酮酸monatin(R-MP),并且R-MP與寬特異性的D-氨基轉(zhuǎn)移酶和D-谷氨酸反應(yīng),形成R,Rmonatin和a-酮戊二酸。如圖4所示,反應(yīng)是可逆的,但是出于本發(fā)明的目的,不要求反應(yīng)以反向進行。圖5是顯示依據(jù)本發(fā)明,從L-色氨酸生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括使用立體轉(zhuǎn)化性酶(stereoinvertingenzyme)酶學(xué)上促進R-MP向R,Rmonatin的轉(zhuǎn)化,以便由與L-色氨酸反應(yīng)偶聯(lián)的反應(yīng)形成的L-氨基酸可以被用作與R-MP到R,Rmonatin的反應(yīng)偶聯(lián)的反應(yīng)的底物。在圖5圖示的特定實例中,L-色氨酸與L-氨基轉(zhuǎn)移酶和草酰乙酸(草酰乙酸鹽(酯))、丙酮酸或a-酮戊二酸鹽(a-KG)反應(yīng)生成吲哚-3-丙酮酸,和L-天冬氨酸(如果使用草酰乙酸)、L-丙氨酸(如果使用丙酮酸)或L-谷氨酸(如果使用a-KG)。吲哚-3-丙酮酸與丙酮酸和R-特異的醛縮酶反應(yīng)并被轉(zhuǎn)化為R-a-酮酸monatin(R-MP),并且R-MP與立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶和L-天冬氨酸、L-丙氨酸或L-谷氨酸反應(yīng),形成R,Rmonatin和草酰乙酸(如果使用L-天冬氨酸)、丙酮酸(如果使用L-丙氨酸)或a-酮戊二酸(a-KG,如果使用L-谷氨酸)。如圖5所示,反應(yīng)是可逆的,但是出于本發(fā)明的目的,不要求反應(yīng)以反向進行。圖6是顯示依據(jù)本發(fā)明生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括再利用形成吲哚-3-丙酮酸的反應(yīng)中生成的L-氨基酸,以及D-氨基酸被用作與R-MP通過一些列轉(zhuǎn)化反應(yīng)形成R,Rmonatin的反應(yīng)中的反應(yīng)物。在圖6圖示的特定實例中,L-色氨酸與L-氨基轉(zhuǎn)移酶和草酰乙酸可逆地反應(yīng)生成卩引哚-3-丙酮酸和L-天冬氨酸。吲哚-3-丙酮酸以可逆的方式與丙酮酸和R-特異的醛縮酶反應(yīng)并被轉(zhuǎn)化為R-a-酮酸monatin(R-MP),并且R-MP與D-氨基轉(zhuǎn)移酶和D-丙氨酸可逆地反應(yīng)形成R,Rmonatin和丙酮酸。使用天冬氨酸4-脫羧酶,L-天冬氨酸被轉(zhuǎn)化為L-丙氨酸和C02。用丙氨酸消旋酶,L-丙氨酸被轉(zhuǎn)化為D-丙氨酸。出于本發(fā)明的目的,不要求顯示為可逆地反應(yīng)以反向進行。圖7是顯示依據(jù)本發(fā)明生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括通過將該反應(yīng)的L-氨基酸副產(chǎn)物轉(zhuǎn)化為另一種產(chǎn)物來推動L-色氨酸反應(yīng)進行(即推動反應(yīng)向n引哚-3-丙酮酸產(chǎn)生的方向進行)。在本實例中,使用脫羧酶,L-氨基酸L天冬氨酸副產(chǎn)物在不可逆反應(yīng)中被轉(zhuǎn)化為L-丙氨酸。在圖7圖示的特定實例中,L-色氨酸與L-氨基轉(zhuǎn)移酶并與a-酮戊二酸(a-KG)或草69酰乙酸可逆地反應(yīng),生成吲哚-3-丙酮酸和L-谷氨酸(如果使用a-KG)或L-天冬氨酸(如果使用草酰乙酸)。吲哚-3-丙酮酸與丙酮酸和R-特異的醛縮酶可逆地反應(yīng)并被轉(zhuǎn)化為R-a-酮酸monatin(R-MP)。R-MP以可逆的方式與D-氨基轉(zhuǎn)移酶和D-氨基酸反應(yīng)形成R,Rmonatin和草酰乙酸、丙酮酸或a-KG中任何一種。L氨基轉(zhuǎn)移酶反應(yīng)中的產(chǎn)物L(fēng)-谷氨酸或L-天冬氨酸使用谷氨酸或天冬氨酸脫羧酶被轉(zhuǎn)化為4-氨基丁酸鹽(4-aminobutanoate)禾tJC02(如果L-谷氨酸是底物)或Ji-丙氨酸和C02(如果L-天冬氨酸是底物)。出于本發(fā)明的目的,不要求顯示為可逆的反應(yīng)以反向進行。圖8是顯示依據(jù)本發(fā)明生產(chǎn)R,Rmonatin的另一方法的實例的流程圖。在本實例中,該方法包括通過一些列轉(zhuǎn)化反應(yīng)再利用L-色氨酸反應(yīng)中的氨基酸副產(chǎn)物與R-MP反應(yīng)中的氨基酸反應(yīng)物。在圖8圖示的特定實例中,L-色氨酸與L-氨基轉(zhuǎn)移酶并與a-酮戊二酸(a-KG)可逆地反應(yīng)生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸與丙酮酸和R-特異的醛縮酶可逆地反應(yīng)并被轉(zhuǎn)化為R-a-酮酸monatin(R-MP)。R-MP以可逆的方式與D-氨基轉(zhuǎn)移酶和D-丙氨酸反應(yīng)形成R,Rmonatin和丙酮酸。L-丙氨酸氨基轉(zhuǎn)移酶和丙酮酸被用于將L-氨基轉(zhuǎn)移酶反應(yīng)的產(chǎn)物L(fēng)-谷氨酸轉(zhuǎn)化回a-KG,并帶有L-丙氨酸為副產(chǎn)物。丙氨酸消旋酶將L-丙氨酸可逆地轉(zhuǎn)化為D-丙氨酸,其用于第三反應(yīng)(D-氨基轉(zhuǎn)移酶反應(yīng))。出于本發(fā)明的目的,不要求顯示為可逆的反應(yīng)以反向進行。圖9是計算機系統(tǒng)的框圖。圖10是一個流程圖,該圖示意性說明了用于將新核苷酸或蛋白序列與序列數(shù)據(jù)庫進行比較以確定該新序列與數(shù)據(jù)庫中序列之間的同源性水平的方法的一個實施方式。圖11是示意性說明計算機中確定兩個序列是否同源的方法的一種實施方式的流程圖。圖12是示意性說明用于檢測序列中特征是否存在的鑒定器進程(identifierprocess)300的一種實施方式的流程圖。圖13和14一同示意性說明了在monatin前體(MP)形成中58種不同醛縮酶的活性(每一種由其特定的SEQID編號鑒別),由LC/MS/MS測量。圖15示意性說明了二硫蘇糖醇對通過具有SEQIDNO:88的醛縮酶活性的多肽產(chǎn)生monatin的影響。在不同的附圖中同樣的標(biāo)記符號表示同樣的要素。詳述許多實施方式已經(jīng)在上文被描述,并將在下面被更詳細地描述。本發(fā)明的實施方式包括一個或多個所述方面。下面提供對術(shù)語和方法的解釋以更好地描述本公開并在本公開的實施中指導(dǎo)本領(lǐng)域普通技術(shù)人員。如這里所用,"包括(includnig),,表示"包含(含有,comprising)"。此外,單數(shù)形式的"一/一個(a)"或"一/一個(an),,或"這/這個(該,所述,the)"包括復(fù)數(shù)指代,除非上下文有明確相反的說明。舉例來說,"包含蛋白"的指代包括一種或多種這樣的蛋白,而"包含該細胞"的指代包括本領(lǐng)域普通技術(shù)人員公知的一個或多個細胞及其等價物,等等。術(shù)語"大約"包含在任何測量中發(fā)生的實驗誤差的范圍。除非另有說明,所有的測量數(shù)據(jù)被認為在其前面有詞語"大約",即使該詞語"大約"沒有明確使用。保守置換多肽中一個氨基酸置換另一個氨基酸,該置換對多肽的活性有很小或沒有影響。該置換被認為是保守的,不依賴于被交換的氨基酸是否顯示出結(jié)構(gòu)或功能上的相似性。舉例來說,理想地,包含一個或多個保守置換的色氨酸氨基轉(zhuǎn)移酶多肽保留了色氨酸氨基轉(zhuǎn)移酶的活性。多肽可以通過使用例如標(biāo)準程序操作編碼該多肽的核苷酸序列來產(chǎn)生以含有一個或多個保守置換,所述標(biāo)準程序如位點定向誘變或PCR或本領(lǐng)域普通技術(shù)人員公知的其它方法??芍脫Q蛋白中原有氨基酸,并且如果對該多肽的活性有很小或沒有影響,可被認為是保守置換的氨基酸的非限制性實例包括Ala用ser或thr置換;arg用gln、his或lys置換;asn用glu、gln、lys、his、asp置換;asp用asn、glu或gln置換;cys用ser或ala置換;gln用asn、glu、lys、his、asp或arg置換;glu用asn、gln、lys或asp置換;gly用pro置換;his用asn、lys、gln、arg、tyr置換;ile用leu、met、val、phe置換;leu用ile、met、val、phe置換;lys用asn、glu、gln、his、arg置換;met用ile、leu、val、phe置換;phe用trp、tyr、met、ile或leu置換;ser用thr、ala置換;thr用ser或ala置換;trp用phe、tyr置換;tyr用his、phe或trp置換;val用met、ile、leu置換。關(guān)于保守置換的其他信息可以在Ben-Bassat等,(J.Bacteriol.169:751-7,1987),0'Regan等,(Gene77:237-51,1989),Sahin-Toth等,(ProteinSci.3:240-7,1994),Hochuli等,(Bio/Technology6:1321-5,1988),WO00/67796(Curd等)及遺傳和分子生物學(xué)的標(biāo)準教科書等地方找到。衍生出于本說明書和權(quán)利要求書的目的,如果以下一項或多項為真,物質(zhì)是由生物體或來源"衍生的"1)該物質(zhì)存在于生物體/來源中;2)該物質(zhì)從天然宿主移??;或3)該物質(zhì)從天然宿主移取并通過例如誘變進化。分離的術(shù)語"分離的"用在這里是指從其天然宿主移取的任何物質(zhì);該物質(zhì)不需要被純化。例如"分離的核酸"指的是天然發(fā)生的核酸,該核酸與其衍生的生物體天然發(fā)生的基因組中緊鄰的兩個序列(一個在5'端,一個在3'端)都不緊鄰。舉例來說,沒有限制地,分離的核酸可以是任意長度的重組DNA分子,只要通常發(fā)現(xiàn)在天然發(fā)生的基因組中緊鄰該重組DNA分子側(cè)翼的核酸序列中的一個71被移除或不存在。因此,沒有限制地,分離的核酸包括獨立于其它序列作為單獨分子存在的重組DNA(如cDNA或由PCR或限制性核酸內(nèi)切酶處理產(chǎn)生的基因組DNA片段),以及整合入載體、自主復(fù)制的質(zhì)粒、病毒(如反轉(zhuǎn)錄病毒、腺病毒或皰疹病毒),或整合入原核生物或真核生物基因組DNA的重組DNA。此外,分離的核酸可以包括作為雜交或融合核酸序列的一部分的重組DNA分子。用在這里,術(shù)語"分離的"表示該物質(zhì)(如依據(jù)本發(fā)明的蛋白或核酸)被從其原始環(huán)境中(諸如天然環(huán)境,如果它是天然發(fā)生的話)移取。舉例來說,存在于活的動物中的天然發(fā)生的多核苷酸或多肽不是分離的,但從天然系統(tǒng)中共存材料的部分或全部中分離出來的相同多核苷酸或多肽是分離的。這樣的多核苷酸可以是載體的一部分和/或這樣的多核苷酸或多肽可以是組合物的一部分并仍是分離的,因為這樣的載體或組合物不是其天然環(huán)境的一部分。如這里所用指代核酸的術(shù)語"分離的",也包括任何非天然發(fā)生的核酸,因為非天然發(fā)生的核酸序列不是在自然界中發(fā)現(xiàn)的,在天然發(fā)生的基因組中也不具有緊鄰的序列。舉例來說,非天然發(fā)生的核酸,如工程化的核酸,被認為是分離的核酸。工程化的核酸可以使用普通分子克隆或化學(xué)核酸合成技術(shù)制備。分離的非天然發(fā)生的核酸可以獨立于其它序列,或整合入載體、自主復(fù)制的質(zhì)粒、病毒(如反轉(zhuǎn)錄病毒、腺病毒或皰疹病毒)、或原核生物或真核生物的基因組DNA。此外,非天然發(fā)生的核酸可以包括作為雜交或融合核酸序列的一部分的核酸分子。純化的術(shù)語"純化的"用在這里不要求絕對純凈,而是意欲作為相對的術(shù)語。因此,舉例來說,純化的多肽或核酸制備物可以是這樣的一種主體多肽或核酸有比該多肽或核酸存在于生物體內(nèi)其天然環(huán)境中更高的濃度,或比其移取的環(huán)境中更高的濃度。從文庫中獲得的單獨的核酸已經(jīng)按常規(guī)方法純化到電泳級同質(zhì)性(elec加phoretichomogeneity)。從這些克隆中獲得的序列不能直接從文庫或從總?cè)祟怐NA獲得。依據(jù)本發(fā)明的純化的核酸已經(jīng)從生物體基因組DNA的剩余物中純化至少104-106倍。在一些實施方式中,術(shù)語"純化的"包括從基因組DNA的剩余中或從文庫的其它序列或其它環(huán)境中純化至少一個數(shù)量級的核酸,例如,在一些實施方式中,純化至少兩個或三個數(shù)量級,或純化至少四個或五個數(shù)量級。氨基酸如本文所使用,"氨基酸"或"氨基酸序列"是指寡肽、肽、多肽或蛋白序列,或者指寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及指天然發(fā)生的或合成的分子。"氨基酸"或"氨基酸序列"包括寡肽、肽、多肽或蛋白序列,或者指寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及指天然發(fā)生的或合成的分子。如本文所使用,術(shù)語"多肽"是指通過肽鍵或修飾的肽鍵即肽等排體(peptideisosteres)彼此結(jié)合在一起的氨基酸,可以含有除20個由基因編碼的氨基酸之外的修飾的氨基酸。所述多肽可以通過天然過程,如,翻譯后加工或者通過本領(lǐng)域所熟知的化學(xué)修飾技術(shù)修飾所述多肽。72修飾可以發(fā)生在所述多肽的任何地方,包括肽骨架、氨基酸側(cè)鏈和氨基端或者羧基端。可以理解,相同類型的修飾可以在給定的多肽中以相同的或者不同的水平在幾個位點處發(fā)生。一個給定的多肽也可以具有很多類型的修飾。修飾包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共價連接核黃素、共價連接血紅素組分、共價連接核苷酸或者核苷酸衍生物、共價連接脂質(zhì)或者脂質(zhì)衍生物、共價連接磷脂酰肌醇、交聯(lián)的環(huán)化作用、形成二硫鍵、去甲基作用、形成共價交聯(lián)、形成半胱氨酸、形成焦谷氨酸、甲?;饔谩??羧化作用、糖基化作用、形成GPI錨、羥基化作用、碘化作用、甲基化作用、肉豆蔻?;饔?、氧化作用、聚乙二醇化、葡聚體水解酶處理、磷酸化作用、異戊烯作用、外消旋作用、硒化作用、硫酸鹽化作用,和轉(zhuǎn)移RNA介導(dǎo)氨基酸添加到蛋白質(zhì)中,如精氨?;?。(參見,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd"W.H.Freeman和Company,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,11-12頁(1983))。依據(jù)本發(fā)明的肽和多肽也包括所有"模擬物"和"肽模擬物"形式,正如下面進一步詳細描述的。具有醛縮酶活性的多肽"具有醛縮酶活性的多肽"是表示其自身,或與一個或多個額外的多肽(具有相同或不同的序列)關(guān)聯(lián)的多肽,其是具有醛縮酶的酶活性的蛋白。重組的"重組的"多肽或蛋白是指通過重組DNA技術(shù)產(chǎn)生的多肽或蛋白;即,由用編碼期望多肽或蛋白的外源DNA構(gòu)建物轉(zhuǎn)化的細胞產(chǎn)生的多肽或蛋白。"合成的"多肽或蛋白是那些通過化學(xué)合成制備的多肽或蛋白。固相化學(xué)肽合成方法也可以用于合成依據(jù)本發(fā)明的多肽或者片段。這樣的方法自二十世紀六十年代早期起就是本領(lǐng)域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也參見Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12頁),并且這些方法近來已經(jīng)被用于商業(yè)上可獲得的實驗室肽設(shè)計和合成試劑盒(CambridgeResearchBiochemicals)中。這樣的商業(yè)上可獲得的實驗室試劑盒一般是利用H.M.Geysen等,尸/^.^"http://.^"^.5^.,C/5L4,M;3998(1984)的教導(dǎo),它們讓肽合成在多個"桿(rods)"或者"釘(pins)"的頂端進行,而所有的"桿"或者"釘"都被連接到—塊板上?;鞠嗤陶Z"基本上相同(substantiallyidentical)"在用于兩個核酸或多肽時,是指當(dāng)兩個或更多個序列被比較和聯(lián)配(比對,aligned)以尋找最大同一性(maximuncorrespondence)時,它們具有例如至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、7392%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或氨基酸殘基(序列)同一性,所述同一性可以使用任意一種已知的序列比較算法測量,或者通過視覺觀察。在其他實施方式中,基本上相同存在于至少大約100或更多個殘基的區(qū)域內(nèi),最經(jīng)常地,在至少大約150至200或更多殘基的區(qū)域內(nèi)所述序列是基本上相同的。在一些實施方式中,本發(fā)明的核酸序列可以在編碼區(qū)的整個長度范圍內(nèi)是基本上相同的。此外,"基本上相同的"氨基酸序列可以是通過一個或多個保守或非保守氨基酸的置換、缺失或插入而與參考序列有所不同的序列。在一些實施方式中,置換發(fā)生在不是分子的活性位點的位置,或者可選地,置換發(fā)生在分子的活性位點的位置,前提是該多肽基本上保持其功能(酶促)特性。保守的氨基酸置換,例如用一個氨基酸置換另一個相同類別的氨基酸(例如用一個疏水氨基酸,如異亮氨酸、纈氨酸、亮氨酸或甲硫氨酸,置換另一個疏水氨基酸,或用一個極性氨基酸置換另一個極性氨基酸,例如用精氨酸置換賴氨酸、用谷氨酸置換天冬氨酸,或用谷氨酰胺置換天冬酰胺)。舉例來說,一個或多個氨基酸可以從醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG醛縮酶多肽中缺失,產(chǎn)生多肽結(jié)構(gòu)的修飾而不顯著改變其生物學(xué)活性。舉例來說,醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的生物活性不需要的氨基-或羧基端氨基酸可以被除去。依據(jù)本發(fā)明的修飾的多肽序列可以通過多種方法中任何方法分析其醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶生物活性,所述方法包括將修飾的多肽序列與底物接觸并確定修飾的多肽是否減少分析中特定底物的量或增加功能性醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽與底物的酶促反應(yīng)的生物產(chǎn)物。片段如本文所使用,關(guān)于蛋白或多肽或核酸的"片段"分別是蛋白、多肽或核酸的一部分。片段可以與該片段從其衍生的更長的蛋白、多肽或核酸序列具有相同或基本相同的氨基酸或核酸序列。也包含與更長的蛋白、多肽或核酸具有不同三維結(jié)構(gòu)的片段。這樣的一個實例是"原-形式(pro-form)"分子,例如,低活性的蛋白原(proprotein),其可以通過切割而被修飾,產(chǎn)生具有顯著更高的活性的成熟酶。蛋白或多肽的片段可以是蛋白或多肽的酶學(xué)上的活性部分。立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶"立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶"是當(dāng)使用相反手性底物作為氨基供體時,能夠優(yōu)選地或選擇性地產(chǎn)生手性氨基酸產(chǎn)物(如monatin)的多肽。舉例來說,立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶可以是優(yōu)選地或選擇性地使用L-谷氨酸作為底物產(chǎn)生R,Rmonatin的D-苯基甘氨酸氨基轉(zhuǎn)移酶(也被稱作D-4-羥苯基甘氨酸氨基轉(zhuǎn)移酶)。立體轉(zhuǎn)化性氨基轉(zhuǎn)移酶的非限制性實例包括D-蛋氨酸氨基轉(zhuǎn)移酶(EC2.6丄41)和具有D-苯基甘氨酸氨基轉(zhuǎn)移酶或D-4-羥苯基甘氨酸氨基轉(zhuǎn)移酶活性的酶。本發(fā)明提供了具有醛縮酶,包括丙酮酸醛縮酶,例如沒有限制地,HMG和/或KHG醛縮酶活性的多肽,編碼它們的多核苷酸,以及制備和使用這些多核74苷酸和多肽的方法。在一些實施方式中,本發(fā)明也提供了醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶,編碼這些酶的多核苷酸,這些多核苷酸和多肽的用途。在一些實施方式中,本發(fā)明提供了修飾的或進化的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶,與未修飾的或未進化的醛縮酶比較,其分別具有提高的比活性。在一些實施方式中,提供了促進3,4-取代的2-酮-戊二酸產(chǎn)生的醛縮酶,例如丙酮酸醛縮酶,如沒有限制地HMG和/或KHG醛縮酶。在一種實施方式中,本發(fā)明提供了制備3,4-取代的2-酮-戊二酸的方法,包括(a)提供具有醛縮酶活性,例如丙酮酸醛縮酶活性,如沒有限制地,HMG醛縮酶和/或KHG醛縮酶活性的多肽;(b)提供供體和受體化合物;和(c)在醛縮酶催化3,4-取代的2-酮-戊二酸合成的條件下,使步驟(a)的多肽與步驟(b)的化合物接觸,其中任選地,供體和受體是丙酮酸或丙酮酸供體和a-酮酸受體、酮類和/或醛類。〖0154]在本發(fā)明的另一實施方式中,丙酮酸醛縮酶,如HMG和/或KHG醛縮酶可以與D-氨基轉(zhuǎn)移酶結(jié)合使用以制備4-取代的D-谷氨酸或其衍生物。4-取代的D-谷氨酸和/或其衍生物可被用作抗生素,因為己經(jīng)發(fā)現(xiàn)這些化合物抑制細菌谷氨酸消旋酶。在一種實施方式中,本發(fā)明提供了制備4-取代的D-谷氨酸的方法,包括(a)提供具有酵縮酶活性,例如丙酮酸醛縮酶活性,如沒有限制地,HMG醛縮酶和/或KHG醛縮酶活性的多肽;(b)提供a-酮酸受體和丙酮酸或丙酮酸供體和(c)在醛縮酶催化4-取代的D-谷氨酸合成的條件下使步驟(a)的多肽與步驟(b)的化合物接觸,其中任選地,該多肽具有丙酮酸醛縮酶、HMG醛縮酶和/或KHG醛縮酶活性,并且其中任選地,該方法進一步包括D-氨基轉(zhuǎn)移酶的使用。在一些實施方式中,本發(fā)明提供了含有依據(jù)本發(fā)明的酶、多肽或多核苷酸的組合物(如酶制備物、食品和食品添加劑、飼料和飼料添加劑、飲料和飲料添加劑、藥物和藥物添加劑、以及膳食補充劑)。這些組合物可以被配制為多種形式,如液體、凝膠、丸劑、片劑、噴霧劑、薄膜、膠束、粉末、食品、飼料球或膠囊化的形式,包括納米膠囊化形式。測量醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性,例如確定多肽是否具有醛縮酶活性,包括丙酮酸活性,如沒有限制地,HMG和/或KHG醛縮酶活性的測定方法是本領(lǐng)域公知并且在依據(jù)本發(fā)明的范圍內(nèi);參見E.E.Dekker&R.P.Kitson,J.Biol.Chem.267,10507-10514,1992;TahaTS,DeitsTL,Purificationandcharacterizationof2-keto-3-deoxy-6-phosphogluconatealdolasefrom爿2;ofo6a"e/"v/we/awd":evidencethattheenzymeisbifunctionaltowards2-keto-4-hydroxyglutaratecleavage,BiochemBiophysResCommun.1994Apr15;200(l):459-66;DekkerEE,KobesRD,GradySR,2-keto-4-hydroxyglutaratealdolasefrombovineliver,MethodsEnzymol.1975;42:280-5;DekkerEE,NishiharaH,75GradySR,MethodsEnzymol.1975;42:285-90,2-keto隱4-hydroxyglutaratealdolasefrom五化/^/cWaco/!';NishiharaH,DekkerEE,BiochimBiophysActa.1969Jul8;185(l):255-7,Astereospecific2陽keto-4勿droxyglutaratealdolasefrom五jc/ie/7'c//aco//。確定多肽是否具有醛縮酶活性,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的合適的測定方法的一個實例在實施例3中描述。在一些實施方式中,本發(fā)明的醛縮酶可以被有效地在多種pH條件下使用,包括例如從約3.0到約12.0的范圍。在其它實施方式中,本發(fā)明的醛縮酶可以在pH值約為3.0、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5或約12.0的條件下使用。在酸性或堿性條件下進行的反應(yīng)條件也可以是有利的,例如在一些依據(jù)本發(fā)明的酶的工業(yè)或制藥應(yīng)用中。本發(fā)明提供了以多種形式和制備物存在的依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽。在依據(jù)本發(fā)明的方法中,依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽以多種形式和制備物被使用。舉例來說,純化的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽可以用在酶制備物中,所述酶制備物在^2-羥基-2-(巧|哚-3-基甲基)-4-酮戊二酸(R-MP)禾nmonatin的某些立體異構(gòu)體,如R,R和S,Rmonatin及其鹽,以及monatin衍生物的某些立體異構(gòu)體,如R,R和S,Rmonatin衍生物構(gòu)型及其鹽的生產(chǎn),或在藥物或膳食輔助劑應(yīng)用中被采用。可選地,依據(jù)本發(fā)明的酶可以直接用于生產(chǎn)R-2-羥基-2-(B引哚-3-基甲基)-4-酮戊二酸(R-MP)和monatin的某些立體異構(gòu)體,如R,R和s,Rmonatin及其鹽,以及monatin衍生物的某些立體異構(gòu)體,如R,R和S,Rmonatin衍生物構(gòu)型及其鹽的過程中,以加工食品、液體或飼料等的過程中。在一些實施方式中,依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽可以使用本領(lǐng)域已知的程序在微生物中表達。在一些實施方式中,依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶多肽可以在依據(jù)本發(fā)明的方法中在使用前固定在固態(tài)支持物上。將酶固定到固體支持物上的方法在本領(lǐng)域內(nèi)是公知的,例如J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivata等,Biocatalysis:Immobilizedcellsandenzymes,JMol.Cat.37(1986)1-24:Sharma等,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnology。核酸、探針和抑制性分子本發(fā)明提供了分離的和重組的核酸,例如參見序列表;編碼多肽的核酸,包括依據(jù)本發(fā)明的多核苷酸序列,例如參見序列表;包括表達盒,如含有依據(jù)本發(fā)明的核酸的表達載體和各種克隆載體。在一些實施方式中,本發(fā)明也包括76使用依據(jù)本發(fā)明的核酸發(fā)現(xiàn)、鑒定或分離新酸縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶多肽序列的方法。在一些實施方式中,本發(fā)明也包括使用依據(jù)本發(fā)明的核酸抑制醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶編碼基因和轉(zhuǎn)錄體表達的方法。還提供了修飾本發(fā)明的核酸的方法,包括通過例如合成連接重裝配、優(yōu)化的定向進化系統(tǒng)和/或飽和誘變例如基因位點飽和誘變(GSSM)產(chǎn)生本發(fā)明的核酸變體的方法。術(shù)語"飽和誘變"、基因位點飽和誘變或"GSSM"包括使用簡并寡核苷酸引物將點突變引入多核苷酸的方法,如在下面所詳細描述的。術(shù)語"優(yōu)化的定向進化系統(tǒng)"或"優(yōu)化的定向進化"包括用于重新裝配相關(guān)的核酸序列的片段的方法,所述的相關(guān)核酸序列例如相關(guān)的基因,下面對其進行了詳細解釋。術(shù)語"合成連接重裝配"或"SLR"包括以非隨機方式連接寡核苷酸片段的方法,下面進行了詳細解釋。術(shù)語"變體"是指在一個或多個堿基對、密碼子、內(nèi)含子、外顯子或氨基酸殘基處被(分別地)修飾的本發(fā)明的多核苷酸或多肽,然而它們?nèi)匀槐3直景l(fā)明的醛縮酶,例如丙酮酸酸縮酶,如HMG和/或KHG醛縮酶生物學(xué)活性。變體可以通過許多種方法產(chǎn)生,包括的方法諸如,例如易錯PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體誘變、位點特異性誘變、基因再裝配、GSSM及其任意組合。本發(fā)明的核酸可以通過,例如cDNA文庫的克隆和表達、通過PCR進行的信息或基因組DNA擴增以及類似的技術(shù)來制造、分離和/或操縱。例如,本發(fā)明的序列最初來源于環(huán)境來源。因此,在一些實施方式中,本發(fā)明提供了優(yōu)選地從常見來源,如環(huán)境、混合培養(yǎng)物或細菌來源衍生的編碼醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的核酸,以及它們編碼的多肽。在本發(fā)明方法的實踐中,同源基因可以通過操縱模板核酸加以修飾,如同在文中所描述的。在一些實施方式中,本發(fā)明可以與本
技術(shù)領(lǐng)域:
已知的任何方法或方案或設(shè)備一起實踐,這些方法、方案或設(shè)備在科學(xué)和專利文獻中得到充分描述。如本文所使用,短語"核酸"或"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA,它們可以是單鏈或雙鏈,并且可以代表正義鏈或反義(互補)鏈,或者是指肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質(zhì)。短語"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸,或者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA),它們可以是單鏈或雙鏈,并且可以代表正義鏈或反義鏈,或者是指肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質(zhì),例如包括iRNA、核糖核蛋白(例如雙鏈iRNA,77例如iRNPs)。該術(shù)語包括含有天然核苷酸的已知類似物的核酸,即寡核苷酸。該術(shù)語也包括具有合成骨架的核酸樣結(jié)構(gòu),例如參見Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"或者包括單鏈的多脫氧核苷酸,或者包括兩個互補的多脫氧核苷酸鏈,它們可以是化學(xué)合成的。這樣的合成的寡核苷酸沒有5'磷酸,因此如果不在存在激酶的情況下采用ATP添加磷酸,該合成寡核苷酸便不會連接到另一個寡核苷酸上。合成的寡核苷酸可以連接到?jīng)]有被去磷酸化的片段上。特定多肽或蛋白的"編碼序列"或編碼特定多肽或蛋白的"核苷酸序列"是這樣的核酸序列,其當(dāng)置于合適的調(diào)節(jié)序列的調(diào)控下時被轉(zhuǎn)錄和翻譯成多肽或蛋白質(zhì)。術(shù)語"基因"意指在產(chǎn)生多肽鏈中所涉及的DNA片段;其包括編碼區(qū)之前的區(qū)域和之后的區(qū)域(前導(dǎo)區(qū)(leader)和尾區(qū)(trailer)),以及在適用的情況下,可以包括各個編碼片段(外顯子)之間的間插序列(內(nèi)含子)。啟動子序列"可操作地連接到"編碼序列上,此時RNA聚合酶可以在啟動子處起始轉(zhuǎn)錄,將編碼序列轉(zhuǎn)錄成mRNA。正如此處所用,"可操作地連接(operablylinked)"是指兩個或更多個核酸(例如DNA)片段之間的功能關(guān)系。"可操作地連接"可以指轉(zhuǎn)錄調(diào)控序列與被轉(zhuǎn)錄序列的功能關(guān)系。例如,如果啟動子刺激或調(diào)節(jié)編碼序列例如本發(fā)明的核酸在適當(dāng)?shù)乃拗骷毎蚱渌磉_系統(tǒng)中的轉(zhuǎn)錄,那么該啟動子便是可操作地連接到編碼序列。通常,可操作地連接到被轉(zhuǎn)錄序列的啟動子轉(zhuǎn)錄調(diào)控序列與被轉(zhuǎn)錄序列是物理上相鄰的,即它們是順式作用。然而,一些轉(zhuǎn)錄調(diào)控序列,如增強子,不需要與編碼序列物理相鄰或者位于與編碼序列接近的位置,但這些轉(zhuǎn)錄調(diào)控序列仍增強編碼序列的轉(zhuǎn)錄。正如本文所用,術(shù)語"表達序列盒(expressioncassette)"指能影響結(jié)構(gòu)基因(即蛋白編碼序列,例如,編碼本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶的序列)在與這樣的序列相容的宿主中的表達的核苷酸序列。表達序列盒包括至少一個與多肽編碼序列可操作地連接的啟動子;并且任選地,可以與其它序列例如轉(zhuǎn)錄終止信號序列可操作地連接。也可以使用其它的在實現(xiàn)表達的方面必需的或有用的因子,例如增強子、a-因子。因此,表達序列盒也包括質(zhì)粒、表達載體、重組病毒、任何形式的重組"裸DNA"載體,以及類似物。"載體"包括可以感染、轉(zhuǎn)染、短暫或永久地轉(zhuǎn)導(dǎo)細胞的核酸。應(yīng)該認識到,載體可以是裸核酸、或與蛋白或脂質(zhì)復(fù)合的核酸。該載體任選地包含病毒或細菌核酸和/或蛋白,和/或膜(例如細胞膜、病毒脂質(zhì)包被等等)。載體包括但不限于復(fù)制子(例如RNA復(fù)制子、細菌噬菌體),DNA片段可以連接到這些復(fù)制子上從而可被復(fù)制。因此,載體包括但不限于RNA、自主復(fù)制環(huán)狀或線狀DNA或RNA(例如質(zhì)粒、病毒以及類似物,例如參見美國專利5,217,879),并且包括表達質(zhì)粒和非表達質(zhì)粒。在重組微生物或細胞培養(yǎng)物被描述為"表達載體"的宿主的情況下,該載體包括78染色體外環(huán)狀和線狀DNA,它們可以已經(jīng)被整合到宿主染色體中。在載體通過宿主細胞來維持的情況下,該載體或者可以作為自主結(jié)構(gòu)在有絲分裂過程中被細胞穩(wěn)定地復(fù)制,或者被整合進宿主的基因組中。正如此處所用,術(shù)語"重組的"包括與"骨架"核酸相鄰的核酸,這些核酸在其天然環(huán)境中與該"骨架"核酸是不相鄰的。在一些實施方式中,為了被"富集",核酸表現(xiàn)為在核酸骨架分子群體中有大約5%或更多數(shù)量的核酸插入物。本發(fā)明的骨架分子包括核酸,如表達載體、自主復(fù)制核酸、病毒、整合核酸,以及用于維持或操縱感興趣的核酸插入物的其它載體或核酸。在一些實施方式中,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約15%或更多數(shù)量的核酸插入物。在一些實施方式中,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約50%或更多數(shù)量的核酸插入物。在一些實施方式中,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約90%或更多數(shù)量的核酸插入物。本發(fā)明的一個實施方式是分離的、合成的或重組的核酸,包括本發(fā)明的序列之一,或者含有本發(fā)明的核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個連續(xù)堿基的片段。該分離的、合成的或重組的核酸可以包含DNA,包括cDNA、基因組DNA和合成DNA。DNA可以是雙鏈或單鏈,并且如果是單鏈,可以是編碼鏈或非編碼(反義)鏈??蛇x地,該分離的、合成的或重組的核酸包含RNA。本發(fā)明的分離的、合成的或重組的核酸可用于制備本發(fā)明的多肽之一,或者含有本發(fā)明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續(xù)氨基酸的片段。因此,本發(fā)明的另一實施方式是分離的、合成的或重組的核酸,其編碼本發(fā)明的多肽的一種,或者含有本發(fā)明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續(xù)氨基酸的片段。這些核酸的編碼序列可以與本發(fā)明的核酸之一的編碼序列之一相同或者可以是不同的編碼本發(fā)明的多肽之一的編碼序列,所述的多肽具有本發(fā)明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續(xù)氨基酸,這是遺傳密碼子的冗余性或簡并性的結(jié)果。遺傳密碼子對于本領(lǐng)域技術(shù)人員是熟知的,并可以例如在B.Lewin,GenesVI,OxfordUniversityPress,1997的第214頁上得到。編碼本發(fā)明的多肽之一或與其基本一致的序列的分離的核酸可包括,但不限于本發(fā)明的核酸的編碼序列和另外的編碼序列,例如前導(dǎo)序列或蛋白原序列(proproteinsequences),以及非編碼序列,例如內(nèi)含子,或編碼序列的5'和/或3'非編碼序列。因此,如在本發(fā)明中所使用,術(shù)語"編碼多肽的多核苷酸"包括多核苷酸,其包括多肽的編碼序列以及包含另外的編碼和/或非編碼序列的多核苷酸??蛇x地,使用常規(guī)技術(shù),例如位點定向誘變^^本領(lǐng)域技術(shù)人員熟悉的79其它技術(shù),本發(fā)明的核酸序列和與其基本一致的序列被誘變,以將沉默改變引入依據(jù)本發(fā)明的多核苷酸。如本文所使用,"沉默改變(silentchanges)"包括,例如不改變由所述多核苷酸編碼的氨基酸序列的改變。這樣的改變可能是期望的,以通過引入在宿主微生物中頻繁發(fā)生的密碼子或密碼子對而增加由宿主產(chǎn)生多肽的水平,該宿主含有編碼所述多肽的載體。本發(fā)明還涉及具有核苷酸改變的多核苷酸,所述核苷酸改變在依據(jù)本發(fā)明的多肽中導(dǎo)致氨基酸置換、添加、缺失、融合和截短。使用技術(shù)例如位點定向誘變、隨機化學(xué)誘變、外切核酸酶III缺失和其它重組DNA技術(shù),可以導(dǎo)入這樣的核苷酸改變??蛇x地,這樣的核苷酸改變可以是天然存在的等位基因變體,其通過鑒定在本文所提供的高嚴緊條件、中度嚴緊條件或低嚴緊條件下特異性雜交到探針的核酸而分離出,所述探針含有依據(jù)本發(fā)明的序列(或其互補序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500個連續(xù)堿基。纖財用于實踐本發(fā)明的核酸,不管是RNA、siRNA、miRNA、反義核酸、cDNA、基因組DNA、載體、病毒或其雜合體,都可以從多種來源分離、進行遺傳工程改造、擴增和/或表達/重組產(chǎn)生。從這些核酸產(chǎn)生的重組多肽(例如醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)可以被單獨地分離或克隆,并且可測試其期望活性??梢允褂萌魏沃亟M表達系統(tǒng),包括細菌、哺乳動物、酵母、昆蟲或植物細胞表達系統(tǒng)??蛇x地,這些核酸可以通過公知的化學(xué)合成技術(shù),如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol-68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美國專利號4,458,066中描述的技術(shù),被體外合成。用于操縱核酸的技術(shù),例如亞克隆、標(biāo)記探針(例如使用Klenow聚合酶、切口平移、擴增的隨機引物標(biāo)記)、測序、雜交以及類似的技術(shù)在科學(xué)和專利文獻中有充分的描述,例如參見Sambrook編著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。80獲得和操縱用于實踐本發(fā)明的方法的核酸的另一個有用方法是從基因組樣品中克隆,并且如果期望的話,篩選和再克隆插入物,插入物分離或擴增自例如基因組克隆或cDNA克隆。用于本發(fā)明的方法中的核酸的來源包括基因組或cDNA文庫,所述文庫可以包含在例如哺乳動物人工染色體(MACs),參見美國專利5,721,118;6,025,155;人類人工染色體,參見Rosenfeld(1997)Nat.Genet.15:333-335;酵母人工染色體(YAC);細菌人工染色體(BAC):Pl人工染色體,參見Woon(1998)Genomics50:306-316;Pl來源的載體(PACs),參見Kern(1997)Biotechniques23:120-124;粘粒、重組病毒、噬菌體或質(zhì)粒中。在一些實施方式中,編碼本發(fā)明的多肽的核酸與能指導(dǎo)翻譯出的多肽或其片段的分泌的前導(dǎo)序列以適當(dāng)?shù)奈恢藐P(guān)系進行裝配。本發(fā)明提供了融合蛋白和編碼這些融合蛋白的核酸。本發(fā)明的多肽可以被融合到異源肽或多肽上,如N-末端鑒定肽,其給予了期望的特性,如增加的穩(wěn)定性或簡化的純化特性。本發(fā)明的肽和多肽也可以作為融合蛋白被合成和表達,其中所述融合蛋白中連接有一個或多個額外的結(jié)構(gòu)域,例如用于產(chǎn)生免疫原性更強的肽、以便更易于分離重組合成的肽、以便鑒定和分離抗體和表達抗體的B細胞,等等。有利于檢測和純化的結(jié)構(gòu)域包括,例如金屬螯合肽,如多組氨酸標(biāo)記和組氨酸-色氨酸模塊,其允許在固定的金屬上純化,還包括蛋白A結(jié)構(gòu)域,其允許在固定的免疫球蛋白上純化,還包括在FLAGS延伸/親和純化系統(tǒng)中所使用的結(jié)構(gòu)域(ImmunexCorp,SeattleWA)。在純化結(jié)構(gòu)域和含有基序的肽或多肽之間可切裂的連接子序列的內(nèi)含物有助于純化,這樣的內(nèi)含物例如Xa因子或腸激酶(Invitrogen,SanDiegoCA)。例如,表達載體可以包括編碼表位的核酸序列,其連接到六組氨酸殘基上,然后連接到硫氧還蛋白和腸激酶切割位點(例如參見Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。組氨酸殘基有助于檢測和純化,而腸激酶切割位點提供了將表位與融合蛋白的剩余部分純化分離開的手段。關(guān)于編碼融合蛋白的載體的技術(shù)以及融合蛋白的應(yīng)用在科學(xué)和專利文獻中進行了充分地描述,例如參見KrolK1993)DNACe11.Biol.,12:441-53。存錄浙翻鞭劍顏本發(fā)明提供了可操作地連接到表達(例如轉(zhuǎn)錄或翻譯)控制序列(一個或多個)上的本發(fā)明的核酸(例如DNA)序列,所述控制序列例如啟動子或增強子,它們可以指導(dǎo)或調(diào)節(jié)RNA合成/表達。表達控制序列可以在表達載體中。示例性的細菌啟動子包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。示例性的真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTR啟動子以及鼠金屬硫蛋白I啟動子。如本文所使用,術(shù)語"啟動子"包括能夠驅(qū)動編碼序列在細胞中如植81物或動物細胞中轉(zhuǎn)錄的所有序列。因此,在本發(fā)明的構(gòu)建物中所用的啟動子包括順式作用轉(zhuǎn)錄控制元件和調(diào)節(jié)序列,它們涉及調(diào)節(jié)或調(diào)控基因轉(zhuǎn)錄的時間和/或速率。例如,啟動子可以是順式作用轉(zhuǎn)錄控制元件,包括增強子、啟動子、轉(zhuǎn)錄終止子、復(fù)制起點、染色體整合序列、5,和3,非翻譯區(qū)或內(nèi)含子序列,它們均涉及轉(zhuǎn)錄的調(diào)節(jié)。這些順式作用序列可與蛋白或其它生物分子互相作用來執(zhí)行(打開/關(guān)閉、調(diào)節(jié)、調(diào)控等等)轉(zhuǎn)錄。"組成型"啟動子是那些在大部分環(huán)境條件和發(fā)育狀態(tài)或細胞分化狀態(tài)下持續(xù)地驅(qū)動表達的啟動子。"誘導(dǎo)型"或"可調(diào)控型"啟動子在環(huán)境條件或發(fā)育條件的影響下指導(dǎo)本發(fā)明的核酸的表達??梢酝ㄟ^誘導(dǎo)型啟動子影響轉(zhuǎn)錄的環(huán)境條件的實例包括無氧條件、增高的溫度、干旱或光的存在。"組織特異性"啟動子是僅僅在特定細胞或組織或器官中有活性的轉(zhuǎn)錄控制元件,例如在植物或動物的特定細胞或組織或器官中有活性。組織特異性調(diào)節(jié)可以通過某些內(nèi)在因子來實現(xiàn),這些內(nèi)在因子確保對給定組織特異的蛋白編碼基因被表達。這樣的因子已知存在于哺乳動物和植物中,以便允許特異性組織的發(fā)育。適合于在細菌中表達多肽的啟動子包括大腸桿菌lac或trp啟動子、lacl啟動子、lacZ啟動子、T3啟動子、T7啟動子、gpt啟動子、XPR啟動子和XPL啟動子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動子、以及酸性磷酸酶啟動子。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、熱激啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTRs、以及小鼠金屬硫蛋白-I啟動子。也可以使用已知在原核或真核細胞或它們的病毒中控制基因表達的其它啟動子。適合于在細菌中表達多肽或其片段的啟動子包括大腸桿菌/ac或^p啟動子、/ac/啟動子、/acZ啟動子、!T5啟動子、r7啟動子、g;/啟動子、;LPs啟動子和;i/^啟動子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動子、以及酸性磷酸酶啟動子。真菌啟動子包括a-因子啟動子。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、熱激啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動子。也可以使用已知在原核或真核細胞或它們的病毒中控制基因表達的其它啟動子。蘊織待弄絲澄激啟動f本發(fā)明提供了能夠以組織特異性形式被表達,例如能夠以組織特異性形式表達依據(jù)本發(fā)明的醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的表達盒。在一些實施方式中,本發(fā)明也提供了以組織特異性方式表達依據(jù)本發(fā)明的醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的植物或種子。組織特異性可以是種子特異性、莖特異性、葉特異性、根特異性、果實特異性以及類似的方式。術(shù)語"植物"包括全植物、植物部分(例如葉、莖、花、根等等)、植物原生質(zhì)體、種子和植物細胞以及它們的后代??梢杂糜诒景l(fā)明的方法中的植物的種類很廣泛,廣泛至能用轉(zhuǎn)化技術(shù)進行處理的高等植物,包括被子植物(單子葉植物和雙子葉植物),以及裸子植物。它們包括各種倍數(shù)性水平的植物,包括多倍體、二倍體、單倍體和半合子植物。正如此處所用,術(shù)語"轉(zhuǎn)基因植物"包括異源核酸序列已經(jīng)被插入到其中的植物或植物細胞,所述異源核酸序列例如依據(jù)本發(fā)明的核酸和各種重組構(gòu)建物(例如表達序列盒)。在一些實施方式中,組成型啟動子如CaMV35S啟動子可以被用于在植物或種子的特定部分或在整個植物中的表達。例如,為了過度表達,可以使用植物啟動子片段,其將指導(dǎo)核酸在植物例如再生植物的一些或所有組織中表達。此處,這樣的啟動子被稱作"組成型"啟動子,它們在大部分環(huán)境條件和發(fā)育或細胞分化狀態(tài)下是有活性的。組成型啟動子的實例包括花椰菜花葉病毒(CaMV)35S轉(zhuǎn)錄起始區(qū)、來自根瘤農(nóng)桿菌的T-DNA的l'或2'啟動子、以及來自本
技術(shù)領(lǐng)域:
已知的多種植物基因的其它轉(zhuǎn)錄起始區(qū)。這樣的基因包括,例如來自擬南芥的爿C77/(Huang(1996)PlantMol.Biol.33:125-139):來自擬南芥的C。"(GenbankNo.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);來自甘藍型油菜(Bra^;0/A7fl/7M)的編碼硬酯?;??;d體蛋白去飽和酶的基因(GenbankNo.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);來自玉米的GPc/(GenbankNo.X15596;Martinez(1989)J.Mol.Biol.208:551-565);來自玉米的G;c2(GenbankNo.U45855;Manjunath(1997)Plant.Mol.Biol.33:97-112);在美國專利4,962,028:5,633,440中描述的植物啟動子。本發(fā)明使用來自病毒的組織特異性或組成型啟動子,這些啟動子可以包括,例如煙草花葉病毒亞基因組啟動子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;稻米東格魯桿狀病毒(RTBV),該病毒僅在受感染稻米植物中的韌皮細胞中復(fù)制,它的啟動子驅(qū)動強的韌皮特異性報道基因的表達木薯脈帶花葉病毒(CVMV)啟動子,其在導(dǎo)管元件、葉中軸細胞、根尖中具有最高活性(Verdaguer(1996)PlantMol.Biol.31:1129-1139)。在一些實施方式中,植物啟動子指導(dǎo)表達醛縮酶,例如丙酮酸醛縮酶、如HMG和/或KHG醛縮酶的核酸在特定的組織、器官或細胞類型中表達(即組織特異性啟動子),或可以在更精確的環(huán)境或發(fā)育控制或在誘導(dǎo)型啟動子的控制下表達??梢杂绊戅D(zhuǎn)錄的環(huán)境條件的例子包括厭氧條件、提高的溫度、有光或噴撒化學(xué)品/激素。例如,本發(fā)明包括玉米的干旱誘導(dǎo)型啟動子(Busk(1997)如上),馬鈴薯的寒冷、干旱、高鹽誘導(dǎo)型啟動子(Kirch(1997)PlantMol.Biol.33:897909)。在一些實施方式中,組織特異性啟動子只在該組織的發(fā)育階段的某個時間段內(nèi)促進轉(zhuǎn)錄。參見,例如描述擬南芥LEAFY基因啟動子的Blazquez(1998)PlantCell10:791-800。也見,描述轉(zhuǎn)錄因子SPL3的Cardon(1997)PlantJ12:367-77,SPL3識別擬南芥U.Aa"a"a)的花分生組織特性基因(meristemidentitygene)API的啟動子區(qū)域的保守序列基序;和描述分生組織啟動子elF4的Mandel(1995)83PlantMolecularBiology,29巻,995-1004頁??梢允褂迷谔囟ńM織的整個生命周期都具有活性的組織特異性啟動子。在一些實施方式中,本發(fā)明的核酸與主要在棉花纖維細胞中有活性的啟動子可操作地連接。在一些實施方式中,本發(fā)明的核酸與主要在棉花纖維細胞伸長的階段具有活性的啟動子可操作地連接,例如,Rinehart(1996)supra所描述的。核酸可以與Fbl2A基因啟動子可操作地連接,這樣它將偏好在棉花纖維細胞(Ibid)中表達。也見John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美國專利5,608,148和5,602,321,描述了用于構(gòu)建轉(zhuǎn)基因棉花植物的棉花纖維特異性啟動子和方法。也可以使用根特異性啟動子來表達本發(fā)明的核酸。根特異性啟動子的例子包括乙醇脫氫酶基因中的啟動子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。也可以使用別的啟動子來表達本發(fā)明的核酸,包括,例如,胚珠特異的、胚芽特異的、胚乳特異的、珠柄特異的、種皮特異的啟動子或它們的組合;葉特異的啟動子(見,例如,Busk(1997)PlanU.11:12851295,描述玉米的葉特異的啟動子);發(fā)根農(nóng)桿菌(v4gro6fl"m'wmW^ogews)的ORF13啟動子(ORF13啟動子在根部表現(xiàn)出高活性,見,例如Hansen(1997)如上);玉米花粉特異性啟動子(見,例如Guerrero(1990)Mol.Gen.Genet.224:161168);番茄啟動子,其在果實成熟、變老、從葉上脫落的過程中有活性,在花中具有低一些的活性(見,Blume(1997)PlantJ.12:731746);馬鈴薯SK2基因的雌蕊特異性啟動子(見,Ficker(1997)PlantMol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮組織和轉(zhuǎn)基因苜蓿的花梗頂中具有活性,這使它成為使外源基因靶向表達于活躍地生長的芽或纖維的表皮層的有用工具;胚珠特異的BEL1基因(見,Reiser(1995)Cell83:735-742,GenBank號:U39944):禾口/或Klee,美國專利5,589,583中的啟動子,描述了一種植物啟動子區(qū)域,其可導(dǎo)致在分生組織和/或快速分裂細胞中的高水平轉(zhuǎn)錄。在一些實施方式中,經(jīng)由對植物激素例如植物生長素的暴露便能被誘導(dǎo)的植物啟動子被用于表達依據(jù)本發(fā)明的核酸。例如,本發(fā)明可以使用大豆(Gfyc!'"ewa;cL.)的植物生長素響應(yīng)元件El啟動子片段(AuxREs)(Liu(1997)PlantPhysiol.115:397-407);植物生長素響應(yīng)性擬南芥GST6啟動子(也對水楊酸和過氧化氫產(chǎn)生響應(yīng))(Chen(1996)PlantJ.10:955-966);煙草的植物生長素誘導(dǎo)型parC啟動子(Sakai(1996)37:906-913);植物生物素響應(yīng)元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和對應(yīng)激激素脫落酸產(chǎn)生響應(yīng)的啟動子(Sheen(1996)Science274:1900-1卯2)。依據(jù)本發(fā)明的核酸也可以與植物啟動子可操作地連接,所述植物啟動子暴露于可施用于植物的化學(xué)試劑例如除草劑或抗生素,便能夠被誘導(dǎo)。例如,可以使用由苯磺酰胺除草劑安全劑活化的玉米In2-2啟動子(DeVeylder(1997)PlantCellPhysiol.38:568-577);不同的除草劑安全劑的應(yīng)用誘導(dǎo)不同的基因表達模式,包括在根中、排水器中和芽尖分生組織中的表達。編碼序列可以處于例如四環(huán)素誘導(dǎo)的啟動子的控制下,例如,針對含有燕麥"ve"asa"vflL.)(oat)精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物所描述的(Masgrau(1997)PlantJ.11:465-473);或者處于水楊酸響應(yīng)元件的控制之下(Stange(1997)PlantJ.11:1315-1324)。使用化學(xué)(例如,激素或殺蟲劑)誘導(dǎo)的啟動子,g(],對可施用于田間的轉(zhuǎn)基因植物的化學(xué)劑發(fā)生響應(yīng)的啟動子,依據(jù)本發(fā)明的多肽的表達可以在植物發(fā)育的特定階段被誘導(dǎo)。所以,本發(fā)明也提供含有可誘導(dǎo)基因的轉(zhuǎn)基因植物,所述可誘導(dǎo)基因編碼依據(jù)本發(fā)明的多肽,其宿主范圍局限于靶向植物種類,例如玉米、稻、大麥、大豆、番茄、小麥、馬鈴薯或別的作物,并且所述可誘導(dǎo)基因在作物發(fā)育的任何階段都可被誘導(dǎo)。本領(lǐng)域技術(shù)人員會認識到,組織特異性的植物啟動子可能驅(qū)動可操作地連接的序列在不是靶組織的組織中表達。因此,在一些實施方式中,組織特異性啟動子是驅(qū)動在靶組織或細胞類型中產(chǎn)生優(yōu)勢表達的啟動子,但是也可以導(dǎo)致在別的組織中的一些表達。本發(fā)明的核酸也可以與在暴露于化學(xué)試劑時被誘導(dǎo)的植物啟動子可操作地連接。這些試劑包括例如,除草劑、合成的植物生長激素或抗生素,它們可以通過例如噴霧施用于轉(zhuǎn)基因植物。依據(jù)本發(fā)明的產(chǎn)生醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的核酸的誘導(dǎo)型表達將允許栽培者對具有最佳的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶表達和/或活性的植物進行選擇。植物部分的發(fā)育也可以因此被控制。這樣,本發(fā)明提供了促進植物和植物部分的收獲的方法。例如,在許多實施方式中,玉米的由苯磺酰胺除草劑安全劑活化的玉米In2-2啟動子被使用(DeVeylder(1997)PlantCellPhysiol.38:568-577);應(yīng)用不同的除草劑安全劑誘導(dǎo)出不同的基因表達模式,包括在根中、排水器中、芽尖分生組織中的表達。依據(jù)本發(fā)明的編碼序列也可以處于四環(huán)素誘導(dǎo)的啟動子的控制之下,例如,對含有燕麥Uve"fl加fvaL.)(oat)精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物的描述(Masgrau(1997)PlantJ.11:465-473);或者'可以由水楊酸響應(yīng)元件控制(Stange(1997)PlantJ.11:1315-1324)。在一些實施方式中,適當(dāng)?shù)亩嚯谋磉_在該編碼區(qū)域的3'端可能需要多聚腺苷酸化區(qū)域。多聚腺苷酸化區(qū)域可以源自天然基因、源自各種類別的其它植物(或者動物或其它)基因或者源自農(nóng)桿菌T-DNA中的基因。教載雑克纖沐本發(fā)明提供了含有依據(jù)本發(fā)明的核酸,例如編碼依據(jù)本發(fā)明的醛縮酶,如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的表達載體和克隆載體。依據(jù)本發(fā)明的表達載體和克隆載體可以包括病毒顆粒、桿狀病毒、噬菌體、質(zhì)粒、噬菌粒(phagemids)、粘粒、F粘粒(fosmids)、細菌人工染色體、病毒DNA(例如疫苗、腺病毒、禽痘病毒、偽狂犬病病毒和SV40的衍生物)、Pl衍生的人工染色體、85酵母質(zhì)粒、酵母人工染色體和任何別的對感興趣的特定宿主(例如,桿狀菌、曲霉和酵母)特異性的載體。依據(jù)本發(fā)明的載體可以包括染色體、非染色體和合成的DNA序列。大量合適的載體對于本領(lǐng)域技術(shù)人員都是已知的,并且可以商業(yè)獲得。典型的載體包括細菌pQETM載體(Qiagen,Valencia,CA)、pBLUESCRIPT質(zhì)粒、pNH載體、A-ZAP載體(Stratagene,LaJolla,CA):ptrc99a、PKK223-3、pDR540、pRIT2T(GEHealthcare,Piscataway,NJ)、pET載體(Novagen,Madison,WI);真核細胞的PXT1、pSG5(Stratagene,LaJolla,CA)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何別的質(zhì)?;騽e的載體,只要它們可以在宿主中復(fù)制和存活下去??梢栽诒景l(fā)明中使用低拷貝數(shù)或高拷貝數(shù)的載體。"質(zhì)粒"可以商購得到,在不受限制的基礎(chǔ)上可以公開獲得,或可以根據(jù)已公開的程序用可獲得的質(zhì)粒來構(gòu)建。與本文描述的那些質(zhì)粒等價的質(zhì)粒在本
技術(shù)領(lǐng)域:
是已知的,并且對于普通技術(shù)人員是顯而易見的。表達載體可以包括啟動子、用于起始翻譯的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。載體也可以包括用于擴增表達的合適序列。哺乳動物表達載體可以包括復(fù)制原點、任何必需的核糖體結(jié)合位點、聚腺苷酸化位點、剪接供體和受體位點、轉(zhuǎn)錄終止序列、5'側(cè)翼非轉(zhuǎn)錄序列。在一些實施方式中,衍生于SV40剪接子和聚腺苷酸化位點的DNA序列可以用于提供所需要的非轉(zhuǎn)錄遺傳元件。在一些實施方式中,表達載體含有一個或多個選擇性標(biāo)記基因,使得可以對含有該載體的宿主細胞進行選擇。這樣的選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因和使得真核細胞培養(yǎng)物具有新霉素抗性的基因、使得大腸桿菌(五.co/O具有四環(huán)素或氨芐青霉素抗性的基因和釀酒酵母(S.cewv/w'ae)TRP1基因。啟動子區(qū)域可以從任何期望的基因中選擇出來,這使用氯霉素轉(zhuǎn)移酶(CAT)載體或具有選擇標(biāo)記的別的載體。在一些實施方式中,用于在真核細胞中表達多肽或其片段的載體含有增強子,以增加表達水平。增強子是DNA的順式作用元件,一般長度為大約10到大約300bp。它們可以作用于啟動子,增強其轉(zhuǎn)錄。示例性增強子包括在復(fù)制原點下游側(cè)100bp到270bp的SV40增強子、巨細胞病毒早期啟動子增強子、在復(fù)制原點下游側(cè)的多瘤增強子,和腺病毒增強子。核酸序列可以通過多種方法插入載體。一般而言,將插入物和載體用合適的限制性內(nèi)切酶消化后,序列可以連接到載體中的所希望的位置。可選擇地,插入物和載體的平末端可以被連接。多種克隆技術(shù)在本領(lǐng)域內(nèi)被公知,如Ausubel等,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.1997禾卩Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)中所述。這些及其它方法被認為在本領(lǐng)域技術(shù)人員的范圍內(nèi)。載體可以是質(zhì)粒、病毒顆粒或噬菌體的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細菌質(zhì)粒、噬菌體DNA、桿狀86病毒、酵母質(zhì)粒、衍生于質(zhì)粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和表達載體被例如Sambrook描述??梢允褂玫奶囟ǖ募毦d體包括商業(yè)上可獲得的質(zhì)粒,其包括以下已知的克隆載體的遺傳元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、pQE陽9(Qiagen,Valencia,CA)、pD10、psiX174pBLUESCRIPTIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene,Valencia,CA)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8、pET(Novagen,Madison,WI)和pCM7。特定的真核載體包括pSV2CAT、pOG44、pXTl、pSG(Stratagene,LaJolla,CA)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何別的載體,只要它可以在宿主細胞中復(fù)制和存活。依據(jù)本發(fā)明的核酸可以在表達序列盒、載體或病毒中表達,在植物細胞和種子中短暫地或穩(wěn)定地表達。一個示例性的短暫表達系統(tǒng)應(yīng)用了附加體(episomal)表達系統(tǒng),例如,通過含有超螺旋DNA的附加小染色體的轉(zhuǎn)錄而在核中產(chǎn)生的花椰菜花葉病毒(CaMV)病毒RNA,見,例如,Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作為選擇,編碼序列,即本發(fā)明的序列的全部或子片段,可以插入到植物宿主細胞基因組中,而成為該宿主染色體DNA的整合部分。正義和反義轉(zhuǎn)錄子可以以這種方式被表達。包含本發(fā)明的核酸的序列(例如,啟動子或編碼區(qū)域)的載體可以包含賦予植物細胞或種子選擇性表型的標(biāo)記基因。例如,所述標(biāo)記可以編碼生物殺滅劑抗性,特別是抗生素抗性,例如對卡那霉素、G418、博來霉素、潮霉素或除草劑的抗性,例如對氯磺隆或Basta的抗性??梢栽谥参镏斜磉_核酸和蛋白的表達載體在本領(lǐng)域中是熟知的,可以包括,例如,根瘤農(nóng)桿菌的載體、馬鈴薯病毒X(見,例如,Angell(1997)EMBOJ.16:3675-3684)、煙草花葉病病毒(見'例如,Casper(1996)Gene173:69-73)、番茄叢矮病毒(見,例如,Hillman(1989)Virology169:42-50)、煙草蝕紋病毒(見,例如,Dolja(l997)Virology234:243-252)、菜豆金色花葉病毒(見,例如,Morinaga(1993)Microbiolinimunol.37:471-476)、花椰菜花葉病毒(見,例如,Cecchini(1997)Mol.PlantMicrobeInteract10:1094-1101)、玉米Ac/Ds轉(zhuǎn)座元件(見,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302:K腿e(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突變基因(Spm)轉(zhuǎn)座元件(見,例如Schlappi(1996)PlantMol.Biol.32:717-725);和它們的衍生物。在一些實施方式中,表達載體可以有兩套復(fù)制系統(tǒng),使其可以在兩種生物中保持,例如在哺乳動物或昆蟲細胞中表達,在原核宿主中克隆和擴增。進一步,對于整合表達載體,該表達載體可以包括至少一個與宿主細胞基因組同源87的序列。它可以在該表達構(gòu)建物的兩側(cè)包含兩個同源序列。通過選擇包含入載體的合適的同源序列,可以將該整合載體定位到宿主細胞的特定位置。整合載體的構(gòu)建在本領(lǐng)域是已知的。依據(jù)本發(fā)明的表達載體也可以包括選擇性的標(biāo)記基因,以便對已經(jīng)轉(zhuǎn)化的細菌株進行選擇,例如,使細菌對藥物,例如氨芐青霉素、氯霉素、紅霉素、卡那霉素、新霉素和四環(huán)素產(chǎn)生抗性的基因。選擇性的標(biāo)記也可以包括生物合成基因,例如在組氨酸、色氨酸和亮氨酸生物合成途徑中的基因。表達載體中的DNA序列被可操縱連接到合適的表達控制序列(一種或多種)(啟動子),以指導(dǎo)RNA合成。具體命名的細菌啟動子包括/ac/、/acZ、r3、T7、砂f、1Pi和/rp。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動子。選擇合適的載體和啟動子在本領(lǐng)域技術(shù)人員的水平之內(nèi)。表達載體還可以包括用于起始翻譯的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。載體也可以包括用于擴增表達的合適序列。啟動子區(qū)域可以從任何期望的基因中選擇出來,使用氯霉素轉(zhuǎn)移酶(CAT)載體或具有選擇標(biāo)記的別的載體。此外,在一些實施方式中,表達載體含有一個或多個選擇性標(biāo)記基因,以提供用于選擇被轉(zhuǎn)化的宿主細胞的表型特征,例如用于真核細胞培養(yǎng)的二氫葉酸還原酶或新霉素抗性,或例如大腸桿菌中的四環(huán)素或氨芐青霉素抗性。哺乳動物表達載體還可以包括復(fù)制原點、任何必需的核糖體結(jié)合位點、聚腺苷酸化位點、剪接供體和受體位點、轉(zhuǎn)錄終止序列和5'側(cè)翼非轉(zhuǎn)錄序列。在一些實施方式中,衍生于SV40剪接子的DNA序列和聚腺苷酸化位點可以用于提供所需要的非轉(zhuǎn)錄基因元件。用于在真核細胞中表達多肽或其片段的載體也可以含有增強子,以增加表達水平。增強子是DNA的順式作用元件,一般長度為大約10到大約300bp,其作用于啟動子,以增強其轉(zhuǎn)錄。示例性增強子包括在復(fù)制起點下游側(cè)100bp到270bp的SV40增強子、巨細胞病毒早期啟動子增強子、在復(fù)制起點下游側(cè)的多瘤增強子,和腺病毒增強子。此外,表達載體含有一個或多個選擇性標(biāo)記基因,使得可以對含有該載體的宿主細胞進行選擇。這樣的選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因和使得真核細胞培養(yǎng)物具有新霉素抗性的基因、使得大腸桿菌(五.coh')具有四環(huán)素或氨芐青霉素抗性的基因和釀酒酵母(S.cewWw'w)r兄P7基因。在一些實施方式中,編碼本發(fā)明的多肽之一和與其序列基本上相同的或含有其至少大約5、10、15、20、25、30、35、40、50、75、100或150或更多個連續(xù)氨基酸的片段的核酸與能指導(dǎo)翻譯出的多肽或其片段的分泌的前導(dǎo)序列以適當(dāng)?shù)南辔贿M行裝配。在一些實施方式中,該核酸可以編碼融合多肽,其中本發(fā)明的多肽之一或含有其至少大約5、10、15、20、25、30、35、40、50、75、10088或150或更多個連續(xù)氨基酸的片段被融合到異源肽或多肽,例如N-末端鑒定肽,其給予了期望的特性,如增加的穩(wěn)定性或簡化的純化特性。合適的DNA序列可以通過各種程序插入載體中。一般而言,將插入物和載體用合適的限制性內(nèi)切酶消化后,DNA序列可以連接到載體中的所希望的位置??蛇x擇地,插入物和載體的平末端可以被連接。多種克隆技術(shù)被公開于Ausubel等.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.1997禾卩Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。這樣的程序和別的程序被認為在本領(lǐng)域技術(shù)人員的范圍內(nèi)。載體可以是例如質(zhì)粒、病毒顆?;蚴删w的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細菌質(zhì)粒、噬菌體DNA、桿狀病毒、酵母質(zhì)粒、衍生于質(zhì)粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆禾卩表達載體在Sambrook等,MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y.,(1989)中描述。涼主雄辦禱細本發(fā)明也提供了含有依據(jù)本發(fā)明的核酸序列,例如編碼依據(jù)本發(fā)明的醛縮酶,如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的序列,或依據(jù)本發(fā)明的載體的轉(zhuǎn)化的細胞。宿主細胞可能是本領(lǐng)域普通技術(shù)人員熟悉的任意宿主細胞,包括原核細胞,真核細胞,如細菌細胞、真菌細胞、酵母細胞、哺乳動物細胞、昆蟲細胞或植物細胞。示例性的細菌細胞包括鏈霉菌屬(S/r印tom;;c")、葡萄球菌屬(&ap/^/ococcMS)、假單胞菌屬(尸"^omoww)或芽孢桿菌屬(Bac///i)的任意種,包括大腸桿菌、枯草芽孢桿菌(Bac///w/6rifc)、熒光假單胞菌(Pwi^o/wowKywomscera)、蠟狀芽孢桿菌(5crc〃/iwcerews)或沙、門氏菌(Sa/wo"e//a0^Ww"n.w附)。示例性的真菌細胞包括曲霉菌屬(A^wg///^)的任意種。示例性的酵母細胞包括畢赤酵母屬(AcWfl)、釀酒酵母屬(Sacc/2ara/M少c")、裂殖酵母屬(5"cWzosacc/wran^cM)或許旺酵母屬(Sc/wfl"m'o附少cM)的任意種,包括巴斯德畢赤酵母(尸/cWa/wWonJ)、釀酒酵母(Sflcc/wromycwcewv/w力e)或粟酒裂殖酵母(ScWzoracc/2ara附^c^;wm6e)。示例性的昆蟲細胞包括草地夜蛾屬(印odo/^era)或果蠅屬(Z>(wop/7a)的任何種,包括果蠅52和草地夜蛾(Spoofa/能ra)S"。示例性的動物細胞包括CHO、COS或黑色素瘤細胞或任何鼠或人的細胞系。合適的宿主的選擇在本領(lǐng)域技術(shù)人員的能力范圍內(nèi)。轉(zhuǎn)化各種高等植物種類的技術(shù)是已知的,在技術(shù)和科學(xué)文獻中有描述。參見Weising(1988)Ann.Rey.Genet22:421-477;美國專利5,750,870。載體可以使用各種技術(shù)導(dǎo)入宿主細胞中,包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、DEAE-Dextran介導(dǎo)的轉(zhuǎn)染、脂轉(zhuǎn)染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。在一些實施方式中,依據(jù)本發(fā)明的核酸或載體導(dǎo)入細胞是為了篩選,所以,所述核酸是以合適于該核酸的后續(xù)表達的方式進入細胞。導(dǎo)入的方法大體上由靶細胞類型決定。示例性的方法包括CaP04沉淀法、脂質(zhì)體融合、脂轉(zhuǎn)染法(例如,LIPOFECTINTM)、電穿孔法、病毒感染法,等等。候選的核酸可以穩(wěn)定地整合到宿主細胞基因組中(例如,用反轉(zhuǎn)錄病毒導(dǎo)入)或者可以短暫的或穩(wěn)定的存在于細胞質(zhì)中(即,通過使用傳統(tǒng)的質(zhì)粒,利用標(biāo)準的調(diào)控序列、選擇標(biāo)記,等等)。因為許多藥學(xué)上重要的篩選要求人或模型哺乳動物靶細胞,所以可以使用能夠轉(zhuǎn)染這些靶的反轉(zhuǎn)錄病毒載體。在適當(dāng)?shù)那闆r下,工程宿主細胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動子、選擇轉(zhuǎn)化子或擴增本發(fā)明的基因。在合適的宿主株被轉(zhuǎn)化和宿主株生長到合適的細胞密度之后,用合適的方法(例如,溫度變化或化學(xué)誘導(dǎo))誘導(dǎo)被選擇的啟動子,細胞再培養(yǎng)一段時期,使得它們產(chǎn)生所需的多肽或其片段。細胞可以通過離心收獲,通過物理或化學(xué)方法破碎,保留得到的粗提物以用于進一步的純化。被用來表達蛋白質(zhì)的微生物細胞可以用任何常規(guī)方法破碎,包括冷凍-融解循環(huán)、超聲波裂解法、機械破碎法或使用細胞裂解試劑。這些方法為本領(lǐng)域技術(shù)人員所熟知。表達的多肽或其片段可以從重組細胞培養(yǎng)物中通過包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內(nèi)的方法回收和純化。假如必要的話,可以應(yīng)用蛋白質(zhì)重折疊步驟來完成多肽的構(gòu)象。假如需要的話,在最終的純化步驟中可以采用高效液相色譜(HPLC)。宿主細胞中的構(gòu)建物可以以傳統(tǒng)方式用于產(chǎn)生由重組序列編碼的基因產(chǎn)物。取決于重組生產(chǎn)方法中所用的宿主,由含有載體的宿主細胞產(chǎn)生的多肽可以糖基化或者非糖基化。依據(jù)本發(fā)明的多肽也可以包括或不包括起始甲硫氨酸殘基。也可以采用無細胞的翻譯系統(tǒng)來產(chǎn)生本發(fā)明的多肽。無細胞翻譯系統(tǒng)可以應(yīng)用由DNA構(gòu)建物轉(zhuǎn)錄得到的mRNA,所述DNA構(gòu)建物包括與編碼所述多肽或其片段的核酸可操作地連接的啟動子。在一些實施方式中,該DNA構(gòu)建物在進行體外轉(zhuǎn)錄反應(yīng)之前可以被線性化。轉(zhuǎn)錄得到的mRNA然后與合適的無細胞翻譯提取物例如兔網(wǎng)狀細胞提取物溫育,產(chǎn)生所需的多肽或其片段。表達載體可以含有一個或多個選擇性標(biāo)記基因,為選擇轉(zhuǎn)化宿主細胞提供表型特征,例如真核細胞培養(yǎng)物的二氫葉酸還原酶或新霉素抗性,或者例如大腸桿菌的四環(huán)素或氨芐青霉素抗性。90含有感興趣多核苷酸如本發(fā)明的核酸的宿主細胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動子、選擇轉(zhuǎn)化子或擴增基因。培養(yǎng)條件例如溫度、pH和類似條件是先前選擇宿主細胞用于表達所使用的培養(yǎng)條件,對于普通技術(shù)人員是明顯的。然后,被鑒定為具有指定的酶活性的克隆被測序,以鑒定編碼具有增強活性的酶的多核苷酸序列。本發(fā)明提供了在細胞中過量表達重組醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的方法,該方法包括表達含有本發(fā)明的核酸的載體,本發(fā)明的核酸例如包含在至少約100個殘基的區(qū)域內(nèi)與依據(jù)本發(fā)明的序列具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列的核酸,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定;或者在嚴格條件下與本發(fā)明的核酸序列雜交的核酸或其子序列。過度表達可以通過任何方式例如使用高活性啟動子、雙順反子(dicistronic)載體或通過該載體的基因擴增來實現(xiàn)。依據(jù)本發(fā)明的核酸可以在任何體外或體內(nèi)表達系統(tǒng)中被表達或過度表達。任何細胞培養(yǎng)系統(tǒng)可被用于表達或過度表達重組蛋白,包括細菌、昆蟲、酵母、真菌或哺乳動物培養(yǎng)物。通過啟動子、增強子、載體(例如,復(fù)制子載體、雙順反子載體的使用(見,例如Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8))、培養(yǎng)基、培養(yǎng)系統(tǒng)等等的合適選擇,可以實現(xiàn)過度表達。在一些實施方式中,使用選擇標(biāo)記如谷氨酰胺合酶(見,例如Sanders(1987)Dev.Biol.Stand.66:55-63)在細胞系統(tǒng)中進行的基因擴增被用于過度表達依據(jù)本發(fā)明的多肽。關(guān)于本方法的額外細節(jié)在公共文獻中和/或為本領(lǐng)域技術(shù)人員公知。在特定的非限制性實例中,這些可公開獲得的文獻包括EP0659215(WO9403612Al)(Nevalainen等);Lapidot,A"Mechaly,A"Shoham,Y.,"Overexpressionandsingle-steppurificationofathermostablexylanasefromBacillusstearothermophilusT-6"'J.Biotechnol.Nov51:259-64(1996);Liithi,E.,Jasmat,N.B"Bergquist,P.L.,"XylanasefromtheextremelythermophilicbacteriumCaldocellumsaccharolyticum:overexpressionoftiiegeneinEscherichiacoliandcharacterizationofthegeneproduct",Appl.Environ.Microbiol.Sep56:2677-83(1990);和Sung,W丄.,Luk,C.K.,Zahab,D.M,,Wakarchuk,W.,"OverexpressionoftheBacillussubtilisandcircul咖xylanasesinEscherichiacoli,,'ProteinExpr.Purif.Jun4:200-6(1993),然而這些參考文獻沒有教導(dǎo)本申請的具有創(chuàng)造性的酶。宿主細胞可能是本領(lǐng)域普通技術(shù)人員熟悉的任何宿主細胞,包括原核細胞、真核細胞、哺乳動物細胞、昆蟲細胞或植物細胞。作為合適宿主的代表性91實例,可能提到的有細菌細胞,如大腸桿菌、鏈霉菌屬、枯草芽孢桿菌(5aa7/"s6////s)、蠟狀芽孢桿菌(5a"7/^cem^)或沙門氏菌(5"a/mowe〃a0^/z/附w〃'ww)和假單胞菌屬(Pw^owomw)、鏈霉菌屬(&w//ow_ycej)和葡萄球菌屬(SZa//j;z/ococc"s)中的各個種;真菌細胞,例如曲霉菌屬(」印erg〃/w);酵母,例如畢赤酵母屬(AcWa)、釀酒酵母屬(SacdwAw^cw)、裂殖酵母屬(ScWzoracc/wramyces)或許旺酵母屬(ScMiYm"/o附;vces)的任意禾中,包括巴斯德畢赤酵母(P/c/n'cr/7asro〃's)、酉良酒酵母(SaccAarawycwcerevWae)或粟酒裂殖酵母(Sc/z&cwacc/2mwMycw;w/M6e);昆蟲細胞,例如果蠅和夜蛾S";動物細胞,例如CHO、COS或Bowes黑素瘤及腺病毒。適當(dāng)宿主的選擇在本領(lǐng)域技術(shù)人員的能力中。載體可以使用各種技術(shù)導(dǎo)入宿主細胞中,包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、DEAE-Dextran介導(dǎo)的轉(zhuǎn)染、脂轉(zhuǎn)染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。在適當(dāng)?shù)那闆r下,工程宿主細胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動子、選擇轉(zhuǎn)化子或擴增本發(fā)明的基因。在合適的宿主株被轉(zhuǎn)化和宿主株生長到合適的細胞密度之后,可以用合適的方法(例如,溫度變化或化學(xué)誘導(dǎo))誘導(dǎo)被選擇的啟動子,并且細胞再培養(yǎng)一段時期,使得它們產(chǎn)生所需的多肽或其片段。細胞可以通過離心收獲,通過物理或化學(xué)方法破碎,保留得到的粗提物以用于進一步的純化。被用來表達蛋白質(zhì)的微生物細胞可以用任何常規(guī)方法破碎,包括冷凍-融解循環(huán)、超聲波裂解法、機械破碎法或使用細胞裂解試劑。這些方法為本領(lǐng)域技術(shù)人員所熟知。表達的多肽或其片段可以從重組細胞培養(yǎng)物中通過包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內(nèi)的方法回收和純化。假如必要的話,可以應(yīng)用蛋白質(zhì)重折疊步驟來完成多肽的構(gòu)象。假如需要的話,在最終的純化步驟中可以采用高效液相色譜(HPLC)。各種哺乳動物細胞培養(yǎng)系統(tǒng)也可以被用于表達重組蛋白。哺乳動物表達系統(tǒng)的實例包括猴腎成纖維細胞的COS-7系(由Gluzman,Cell,21:175,1981描述),以及能從相容載體表達蛋白的其它細胞系,如C127、3T3、CHO、HeLa和BHK細胞系。宿主細胞中的構(gòu)建物可以以傳統(tǒng)方式用于產(chǎn)生由重組序列編碼的基因產(chǎn)物。根據(jù)重組產(chǎn)生方法中所用的宿主,由含有載體的宿主細胞產(chǎn)生的多肽可以糖基化或者非糖基化。依據(jù)本發(fā)明的多肽也可以包括或不包括起始甲硫氨酸殘基??蛇x地,依據(jù)本發(fā)明的多肽,或者含有其至少5、10、15、20、25、9230、35、40、50、75、100或150或更多個連續(xù)氨基酸的片段,可以通過常規(guī)肽合成儀合成產(chǎn)生,例如,如下面所討論。在其它實施方式中,通過肽合成,所述多肽的片段或部分可以被用于產(chǎn)生相應(yīng)的全長多肽;因此,所述片段可用作產(chǎn)生全長多肽的中間物。也可以采用無細胞的翻譯系統(tǒng)來產(chǎn)生本發(fā)明的多肽之一或含有其至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續(xù)氨基酸的片段,其應(yīng)用由DNA構(gòu)建物轉(zhuǎn)錄得到的mRNA,所述DNA構(gòu)建物包括與編碼所述多肽或其片段的核酸可操作地連接的啟動子。在一些實施方式中,該DNA構(gòu)建物在進行體外轉(zhuǎn)錄反應(yīng)之前可以被線性化。轉(zhuǎn)錄得到的mRNA然后與合適的無細胞翻譯提取物例如兔網(wǎng)狀細胞提取物溫育,產(chǎn)生所需的多肽或其片段。在本發(fā)明的實踐中,本發(fā)明的核酸和編碼本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的核酸,或本發(fā)明的修飾的核酸,可以通過擴增來增殖,例如,通過PCR。擴增也可以被用于克隆或修飾本發(fā)明的核酸。因此,本發(fā)明提供了用于擴增本發(fā)明核酸的擴增引物序列對。本領(lǐng)域技術(shù)人員能設(shè)計用于這些序列的任何部分或全長的擴增引物序列對。在一些實施方式中,本發(fā)明提供了通過本發(fā)明的擴增引物對擴增的核酸,所述擴增引物對例如本發(fā)明的核酸的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個殘基以及互補鏈的大約前(5')15、16、17、18、19、20、21、22、23、24或25或更多個殘基所示的引物對。在一些實施方式中,本發(fā)明提供了用于擴增核酸的擴增引物序列對,所述核酸編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽,其中所述引物對能夠擴增含有本發(fā)明的序列或其片段或子序列的核酸。擴增引物序列對的一個成員或每一成員可以包含寡核苷酸,該寡核苷酸包含所述序列的至少約10至50個或更多個連續(xù)堿基,或所述序列的約12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個連續(xù)殘基。在一些實施方式中,本發(fā)明提供了擴增引物對,其中所述引物對包括第一成員和第二成員,第一成員具有本發(fā)明核酸的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個殘基所示的序列,第二成員具有第一成員的互補鏈的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個殘基所示的序列。本發(fā)明提供了通過擴增,例如聚合酶鏈反應(yīng)(PCR),使用依據(jù)本發(fā)明的擴增引物對產(chǎn)生的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶。在一些實施方式中,本發(fā)明提供了通過擴增,例如聚合酶鏈反應(yīng)(PCR),使用依據(jù)本發(fā)明的擴增引物對制備醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的方法。在一些實施方式中,擴增引物對從文庫,例如基因文庫,如環(huán)境文庫中擴增核酸。擴增反應(yīng)也可以被用于量化樣品中核酸的量(如細胞樣品中信息的量)、標(biāo)記核酸(例如將其應(yīng)用于陣列或印跡)、檢測核酸,或量化樣品中特異性核酸的量。在本發(fā)明的一個實施方式中,擴增從細胞或cDNA文庫分離出的信息。技術(shù)人員可以選擇和設(shè)計合適的寡核苷酸擴增引物。擴增方法在本
技術(shù)領(lǐng)域:
也是已知的,包括,例如聚合酶鏈式反應(yīng)PCR(參見PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEG正S(1995),ed.Innis,AcademicPress,Inc.N.Y.,連接酶鏈式反應(yīng)(LCR)(參見Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);轉(zhuǎn)錄擴增(參見Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);和自主維持序列復(fù)制(參見Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);Qp復(fù)制酶擴增(參見Smith(1997)J.Clin.Microbiol.35:1477-1491);自動Q-p復(fù)制酶擴增測定法(參見Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介導(dǎo)技術(shù)(例如NASBA,Cangene,Mississauga,Ontario);也參見Berger(1987)MethodsEnzymol.152:307-316;Ausubel等,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.1997禾卩Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。美國專利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。確定核酸和多肽中的序列同一性本發(fā)明提供了包含這樣的序列的核酸,該序列與依據(jù)本發(fā)明的核酸(參見序列表)在至少約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多殘基的區(qū)域內(nèi)具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、卯%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)。在一些實施方式中,本發(fā)明提供了包含這樣的序列的多肽,該序列與依據(jù)本發(fā)明的多肽(參見序列表)具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78°/。、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性。序列同一性(同源性)的程度可以使用任何計算機程序和相關(guān)參數(shù)來確定,包括本文描述的那些,如BLAST2.2.2或FASTA3.0t78版本,參數(shù)為默94認值。依據(jù)本發(fā)明的核酸序列可以包括本發(fā)明的序列和與其基本上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個連續(xù)核苷酸。本發(fā)明的核酸序列的同源序列和片段可以指與這些序列具有至少約50°/。、51%、52°/。、53°/。、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何計算機程序和參數(shù)來確定,包括FASTA3.0t78版本,參數(shù)為默認值。同源序列還包括RNA序列,其中尿嘧啶置換本發(fā)明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一種方法獲得,或者從對測序錯誤的糾正中產(chǎn)生。應(yīng)該意識到,本發(fā)明的核酸序列可以以傳統(tǒng)的單字母格式表示(例如參見Stryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork的內(nèi)圭寸底),或以在序列中記錄核苷酸的身份的任何其它格式表示。在一些實施方式中,本文描述的序列比較程序被用于本發(fā)明的該方面,即,確定核酸或多肽序列是否在依據(jù)本發(fā)明的范圍之內(nèi)。然而,蛋白和/或核酸序列同一性(同源性)可以使用本
技術(shù)領(lǐng)域:
已知的任何序列比較算法或程序來評價。這樣的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(參見Pearson和Lipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Thompson,NucleicAcidsRes.22(2):4673-4680,1994;Higgins等人,MethodsEnzymol.266:383-402,1996;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Altschul等人,NatureGenetics3:266-272,1993)。在一些實施方式中,同源性或同一性可以使用序列分析軟件來測量(例如,地址為1710UniversityAvenue,Madison,WI53705的威斯康星大學(xué)生物技術(shù)中心遺傳學(xué)計算機組(GeneticsComputerGroup)的序列分析軟件包)。這樣的軟件通過對各種缺失、置換和其它的修飾賦予同源性度數(shù)來匹配相似的序列。在一些實施方式中,用于表示兩個或者更多個核酸或者多肽序列之間的關(guān)系的術(shù)語"同源性"和"同一性",是指當(dāng)兩個或更多個序列或子序列在某一比較窗口(comparisonwindow)或者指定區(qū)域內(nèi)被比較和聯(lián)配以確定最大同一性時,這些序列是相同的,或者具有特定百分比例的相同氨基酸殘基或核苷酸,其可以應(yīng)用各種序列比較算法或者通過人工聯(lián)配和視覺觀察來確定。在一些實施方式中,對于序列比較,將一個序列作為參考序列,而將測試序列與之進行比較。當(dāng)使用序列比較算法時,將測試序列和參考序列輸入到計算機中,指定子序列坐標(biāo),如果必要,也指定序列算法程序參數(shù)??梢允褂媚J的程序參數(shù),或者可以指定別的參數(shù)。然后基于程序參數(shù),序列比較算法計算出測試序列相對于參考序列的序列同一性百分比。正如本文所用,"比較窗口"包括參考具有任意數(shù)目的連續(xù)位置的片段,所述數(shù)目選自從20到600、通常大約50到大約200,更經(jīng)常大約100到大約150,其中在序列和參考序列進行最優(yōu)化聯(lián)配后,序列可與具有相同數(shù)目的連續(xù)位置的參考序列作比較。用于比較的序列聯(lián)配方法在本
技術(shù)領(lǐng)域:
是熟知的??梢酝ㄟ^如下方法進行用于比較的序列的最優(yōu)化聯(lián)配例如Sm他和Waterman,Adv,Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.祖443,1970的同源性聯(lián)配算法,person和Lipman,Proc.Nat'l.Acad.Sci.USAM:2444,1988的查找相似性的方法,這些算法的計算機化實施(WisconsinGeneticsSoftwarePackage中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或手工聯(lián)配和視覺觀察。除了BLAST程序(生物信息國家中心的基本局部聯(lián)配搜索工具(BasicLocalAlignmentSearchTool))夕卜,用于確定同源性或者同一性的其它的算法包括,例如,ALIGN、AMAS(多重聯(lián)配序列分析(AnalysisofMultiplyAlignedSequences))、AMPS(蛋白多重序列聯(lián)配(ProteinMultipleSequenceAlignment))、ASSET(聯(lián)配片段統(tǒng)計評估工具(AlignedSegmentStatisticalEvaluationTool))、BANDS、BESTSCOR、BIOSCAN(生物學(xué)序列比較分析節(jié)點(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(BLocksIMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、LasVegas算法、FNAT(強迫核苷酸聯(lián)配工具(ForcedNucleotideAlignmentTool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析軟件包)、GAP(全局聯(lián)配程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(靈敏性序列比較(SensitiveSequenceComparison))、LALIGN(局部序列聯(lián)配(LocalSequenceAlignment))、LCP(局部內(nèi)容程序(LocalContentProgram))、MACAW(多重聯(lián)配構(gòu)建和分析工作臺(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(多重聯(lián)配程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模式誘導(dǎo)的多重序列聯(lián)配(Pattern-InducedMulti-s叫uenceAlignment))、SAGA(通過遺傳算法的序列聯(lián)配(S叫uenceAlignmentbyGeneticAlgorithm))和WHAT-IF。這樣的聯(lián)配程序也可以用于篩查基因組數(shù)據(jù)庫,以鑒定具有大體上相同的序列的多核苷酸序列。大量的基因組數(shù)據(jù)庫是可利用的,例如,作為人類基因組測序工程的構(gòu)成部分的人類基因組的實質(zhì)部分可以被利用(Gibbs,1995)。至少二十一個其它基因組己經(jīng)被測序,如,生殖器支原體(Mge"/to//ww)(Fraser等,Sde"ce270:397-403(1995))、甲烷球菌(M(Bult等,Sc/e"ce":1058-73(1996))、流行性感冒桿菌(//./"yi/e"加e)(Fleischmann等,Sci'e"ce269:496-512(1995))、大腸桿菌(£.co/i)(Blattner等,Scz'e"ce277:1453-74(1997))和酵母(釀酒酵母(51cewv&;'。e))(Mewes等,M7:7-65(1997))和黑腹果蠅(D.we/a"ogaWe。(Adams等,287:2185-95(2000))。在模式生物的基因組序列的測序上己經(jīng)取得了很大的進展,如小鼠,線蟲(C.e/ega"j)和擬南芥某種"ra6^/o/w^平)。含有用一些功能性信息注釋的基因組信息的一些數(shù)據(jù)庫由不同組織維護,可以通過互聯(lián)網(wǎng)登錄。在一些實施方式中,BLAST和BLAST2.0算法被使用,其分別被描述于Altschul(1997)Nuc.AcidsRes.25:3389-3402,1997和Atschul(1990)J.Mol.Biol.215:403-410,1990。用于實施BLAST分析的軟件可以通過美國國家生物技術(shù)信息中心公開獲得。這一算法涉及首先通過鑒別待詢序列(querysequence)中長度為W的短的字串來確定高分序列對(highscoringsequencepairs,HSPs),所述高分序列對在與數(shù)據(jù)庫序列中同樣長度的字串聯(lián)配時,匹配或者滿足某個正值的閾值分數(shù)T。T是指鄰近字串(neighborhoodword)的分數(shù)閾值(Altschul等,如上)。這些初始的鄰近字串分數(shù)(hits)被用作啟動搜索以發(fā)現(xiàn)包含有它們的更長的HSPs的種子。所述字串分數(shù)沿著每一個序列向兩個方向延伸,直到累積的聯(lián)配分數(shù)可被增加。對于核苷酸序列,使用參數(shù)M(—對匹配的殘基的獎勵分數(shù);總是大于0)來計算累積分數(shù)。對于氨基酸序列,使用記分矩陣來計算累計分數(shù)。出現(xiàn)下面情況時,字串分數(shù)在各個方向上的延伸便停止累積的聯(lián)配分數(shù)由達到的最大值下降了數(shù)量X;由于一個或者多個記分為負的殘基聯(lián)配的累積,累積分數(shù)達到0或者0以下;或者達到到了任一序列的末端。BLAST算法的參數(shù)W、T和X決定了聯(lián)配的靈敏度和速率。BLASTN程序(對于核苷酸序列)默認的是字串長度(W)為11,期望值(E)為10,M=5,N=-4,對兩條鏈進行比較。對于氨基酸序列,BLASTP程序默認的是字串長度為3,期望值(E)為10,BLOSUM62記分矩陣(參見Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)聯(lián)配(B)為50,期望值(E)為10,M=5,N=-4,對兩條鏈進行比較。BLAST算法也進行兩個序列之間的相似性的統(tǒng)計學(xué)分析(參見Kariin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一種相似性量度是最小合計概率(smallestsumprobability,P(N)),其表示兩個核苷酸或者氨基酸序列間的匹配將偶然發(fā)生的概率。例如,在測試核酸和參考核酸的比較中,如果最小合計概率小于大約0.2,在一些實施方式中小于0.01,在其它實施方式中小于大約0.001,就認為該核酸與參考序列相似。在一些實施方式中,應(yīng)用基本局部聯(lián)配搜索工具("BLAST")來評價蛋白和核酸序列同源性。具體而言,五個特定的BLAST程序可以用來進行以下的任務(wù)(1)BLASTP和BLAST3把氨基酸待詢序列與蛋白質(zhì)序列數(shù)據(jù)庫進行比較;(2)BLASTN把核苷酸待詢序列與核苷酸序列數(shù)據(jù)庫進行比較;(3)BLASTX把待詢核苷酸序列(兩條鏈)的六個框架的概念上的翻譯產(chǎn)物與蛋白序列數(shù)據(jù)庫進行比較;(4)TBLASTN把待詢蛋白序列與核苷酸序列數(shù)據(jù)庫的所有六個閱讀框架(兩條鏈)的翻譯結(jié)果進行比較;和(5)TBLASTX把核苷酸待詢序列的六個框架的翻譯結(jié)果與核苷酸序列數(shù)據(jù)庫的六個框架的翻譯結(jié)果進行比較。BLAST程序通過確定相似片段來確定同源序列,所述相似片段在此是指在待査詢的氨基酸或核酸序列與受測序列之間的"高分片段對(high-scoringsegmentpairs)",在一些實施方式中,該受測序列從蛋白或者核酸序列數(shù)據(jù)庫得到。在一些實施方式中,高分片段對利用記分矩陣來鑒定(即,聯(lián)配),很多的記分矩陣在本領(lǐng)域是己知的。在一些實施方式中,應(yīng)用的記分矩陣為BLOSUM62矩陣(Gonnet(1992),Science256:1443-1445;Henikoff和Henikoff(1993),Proteins17:49-61)。較不優(yōu)選地,在一些實施方式中,也可以應(yīng)用PAM或者PAM250矩陣(參見,Schwartz禾口Dayhoff,eds.,1978,MaWces/o/*D"ec"'wgDz'加"ceiW。"'o似鄉(xiāng)j:A/cwo/pro/e/"S^wewceawe/Slfn/c/wre,Washingion:NationalBiomedicalResearchFoundation)。BLAST程序通過美國國家醫(yī)學(xué)圖書館(U.S.NationalLibraryofMedicine)可以獲得?!?246]根據(jù)所研究的序列長度和同源性程度,上述算法使用的參數(shù)可以被調(diào)整。在一些實施方式中,在無用戶的指示的情況下,所述參數(shù)使用算法所采用的默認參數(shù)。計算機系統(tǒng)和計算機程序產(chǎn)品本發(fā)明提供了計算機、計算機系統(tǒng)、計算機可讀取的介質(zhì)、計算機程序產(chǎn)品以及其上記錄或存儲了本發(fā)明的核酸和多肽序列的類似設(shè)備。此外,在實踐本發(fā)明的方法中,例如,為了在硅之中(/"^7/co)確定和鑒定序列同一性(為了確定核酸是否在本發(fā)明的范圍之內(nèi))、結(jié)構(gòu)同源性、基序等等,依據(jù)本發(fā)明的核酸或多肽序列可以在可通過計算機讀取和訪問的任何介質(zhì)上存儲、記錄和操作。正如此處所用,詞語"記錄"和"存儲"指在計算機介質(zhì)上存儲信息的過程。熟練技術(shù)人員能容易地采用任何已知方法,在計算機可讀取的介質(zhì)上存儲信息,以產(chǎn)生包括本發(fā)明的一個或多個核酸和/或多肽序列的產(chǎn)品。正如本文所用,術(shù)語"計算機"、"計算機程序"和"處理器"以它們在最廣的普通語境中的含義被使用,包括了所有這樣的設(shè)備,例如下面所詳細描述的。特定多肽或蛋白的"編碼序列"或"編碼特定多肽或蛋白的序列"是指當(dāng)被置于適當(dāng)?shù)恼{(diào)控序列的控制下時可被轉(zhuǎn)錄和翻譯成多肽或蛋白的核酸序列。依據(jù)本發(fā)明的多肽包括依據(jù)本發(fā)明的序列和與其基本上相同的序列以及前述序列的任一個的子序列和酶促活性片段。在一些實施方式中,基本上相同的、或同源的多肽序列是指與依據(jù)本發(fā)明的序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、%%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的多肽序列。同源性(序列同一性)可以使用本文所描述的計算機程序和參數(shù)的任一種進行確定。本發(fā)明的核酸或多肽序列可以在可通過計算機讀取和訪問的任何介質(zhì)上存儲、記錄和操作。正如此處所用,詞語"記錄"和"存儲"指在計算機介質(zhì)上存儲信息的過程。熟練技術(shù)人員能容易地采用任何目前已知的方法,在計算機可讀取的介質(zhì)上存儲信息,以產(chǎn)生包括本發(fā)明的一個或多個核酸序列、本發(fā)明的一個或多個多肽序列的產(chǎn)品。本發(fā)明的另一實施方式是其上記錄有至少2、5、10、15或20或更多個本發(fā)明的核酸或多肽序列的計算機可讀取介質(zhì)。本發(fā)明的另一實施方式是其上記錄有本發(fā)明的一個或多個核酸序列的計算機可讀取介質(zhì)。本發(fā)明的另一實施方式是其上記錄有本發(fā)明的一個或多個多肽序列的計算機可讀取介質(zhì)。本發(fā)明的另一實施方式是其上記錄有至少2、5、10、15或20或更多個如上面所述的核酸或多肽序列的計算機可讀取介質(zhì)。計算機可讀取介質(zhì)包括磁性可讀取介質(zhì)、光學(xué)可讀取介質(zhì)、電子可讀取介質(zhì)和磁/光學(xué)介質(zhì)。例如,計算機可讀取的介質(zhì)可以是硬盤、軟盤、磁帶、CD-ROM、數(shù)字化視頻光盤(DVD)、隨機存取存儲器(RAM)或只讀存儲器(ROM)以及本領(lǐng)域的技術(shù)人員已知的其它類型的其它介質(zhì)。本發(fā)明的一些實施方式包括系統(tǒng)(例如基于因特網(wǎng)的系統(tǒng)),例如計算機系統(tǒng),它們存儲和操縱本文描述的序列信息。計算機系統(tǒng)100的一個實例以框圖形式示意性地描述在圖9中。正如此處所用,"計算機系統(tǒng)"指硬件部分、軟件部分以及數(shù)據(jù)存儲部分,它們用于分析本發(fā)明的核酸序列的核苷酸序列或本發(fā)明的多肽序列。在一些實施方式中,計算機系統(tǒng)100包括用于處理、訪問和操縱序列數(shù)據(jù)的處理器。處理器105可以是任何熟知類型的中央處理單元,如來自英特爾公司的奔騰III,或來自Sun、Motorola、Compag、AMD或IBM公司的類似處理器。在一些實施方式中,計算機系統(tǒng)100是一個通用的系統(tǒng),該系統(tǒng)包括處理器105和用于存儲數(shù)據(jù)的一個或多個內(nèi)部數(shù)據(jù)存儲部件110,以及用于檢索數(shù)據(jù)存儲部件上存儲的數(shù)據(jù)的一個或多個數(shù)據(jù)檢索設(shè)備。技術(shù)人員能容易地意識到,任何一種當(dāng)前可獲得的計算機系統(tǒng)都是合適的。在一種實施方式中,計算機系統(tǒng)100包括連接到總線(bus)上的處理器105,總線連接到主存儲器115(在一實施方式中,以RAM來實現(xiàn))和一個或多個內(nèi)部數(shù)據(jù)存儲設(shè)備110,例如其上已經(jīng)存儲了數(shù)據(jù)的硬盤驅(qū)動器和/或其它計算機可讀介質(zhì)。在一些實施方式中,計算機系統(tǒng)100進一步包括一個或多個數(shù)據(jù)檢索設(shè)備118,用于讀取在內(nèi)部數(shù)據(jù)存儲設(shè)備110上存儲的數(shù)據(jù)。數(shù)據(jù)檢索設(shè)備118可以代表,例如軟盤驅(qū)動器、壓縮磁盤驅(qū)動器、磁帶驅(qū)動器或能連接到遠程數(shù)據(jù)存儲系統(tǒng)的調(diào)制解調(diào)器(例如通過因特網(wǎng))等等。在一些實施方式中,內(nèi)部數(shù)據(jù)存儲設(shè)備110是可移動的計算機可讀介質(zhì),例如含有控制邏輯和/或其上記錄的數(shù)據(jù)的軟盤、壓縮磁盤、磁帶等等。計算機系統(tǒng)100可以有利地包括適當(dāng)?shù)能浖蛴眠m當(dāng)?shù)能浖幊蹋糜诋?dāng)數(shù)據(jù)存儲部件被插入到數(shù)據(jù)檢索設(shè)備中時從數(shù)據(jù)存儲部件讀取控制邏輯和/或數(shù)據(jù)。計算機系統(tǒng)100包括顯示器120,用于給計算機用戶顯示輸出。也應(yīng)用注意到,計算機系統(tǒng)100可以被連接到網(wǎng)絡(luò)或廣域網(wǎng)中的其它計算機系統(tǒng)125a-c,以便給計算機系統(tǒng)100提供集中訪問。用于訪問和處理依據(jù)本發(fā)明的核酸序列的核苷酸序列及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列的軟件(例如,檢索工具、比較工具和建模工具等等)在執(zhí)行過程中可駐留于主存儲器115中。在一些實施方式中,計算機系統(tǒng)100可進一步包含用于比較存儲在計算機可讀介質(zhì)上的依據(jù)本發(fā)明的核酸序列及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列與存儲于計算機可讀介質(zhì)上的參考核苷酸或多肽序列的序列比較算法。"序列比較算法"指在計算機系統(tǒng)100上執(zhí)行(本地或遠程)的一種或多種程序,以比較核苷酸序列和數(shù)據(jù)存儲設(shè)備中存儲的其它核苷酸序列和/或化合物。舉例來說,序列比較算法可比較存儲在計算機可讀介質(zhì)上的依據(jù)本發(fā)明的核酸序列的核苷酸序列及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列與存儲于計算機可讀介質(zhì)上的參考序列,以鑒定同源性或結(jié)構(gòu)基序。圖10是示意性說明過程200的一個實施方式的流程圖,該過程用于將新的核苷酸或蛋白序列與序列數(shù)據(jù)庫進行比較,以便確定新序列和數(shù)據(jù)庫中的序列之間的同源性水平。序列數(shù)據(jù)庫可以是存儲于計算機系統(tǒng)100上的私人數(shù)據(jù)庫,或可以通過因特網(wǎng)獲得的公共數(shù)據(jù)庫如GENBANK。過程200在起始狀態(tài)201開始,然后轉(zhuǎn)到狀態(tài)202,其中要被比較的新序列被存儲于計算機系統(tǒng)100的存儲器上。正如上面所討論的,該存儲器可以是任何類型的存儲器,包括RAM或內(nèi)部存儲設(shè)備。然后過程200轉(zhuǎn)到狀態(tài)204,其中打開序列數(shù)據(jù)庫以進行分析和比較。然后過程200轉(zhuǎn)到狀態(tài)206,其中數(shù)據(jù)庫中存儲的第一個序列被讀取到計算機的存儲器中。然后在狀態(tài)210進行比較,以確定第一個序列是否與第二個序列相同。重要的是應(yīng)該注意到,該步驟不限于進行新序列和數(shù)據(jù)庫中第一個序列之間的精確比較。用于比較兩個核苷酸或蛋白序列的熟知的方法對于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員是已知的,即使所述兩個核苷酸或蛋白序列不相同。例如,可以在列中引入空位,以提高兩個測試序列之間的同源性水平??刂瓶瘴换蚱渌卣髟诒容^過程中是否被引入到序列中的參數(shù)通常由計算機系統(tǒng)的用戶輸入?!┮呀?jīng)在狀態(tài)210進行兩個序列的比較,在決策狀態(tài)210就要作出兩個序列是否相同的判斷。當(dāng)然,術(shù)語"相同的"不限于絕對相同的序列。在過程200中,在由用戶輸入的同源性參數(shù)范圍內(nèi)的序列都將被標(biāo)記為"相同的"。如果作出兩個序列相同的判斷,過程200轉(zhuǎn)到狀態(tài)214,其中來自數(shù)據(jù)庫的序列的名稱被顯示給用戶。該狀態(tài)通知用戶,具有顯示的名稱的序列滿足所輸入的同源性限制。一旦所存儲序列的名稱被顯示給用戶,過程200轉(zhuǎn)到?jīng)Q策狀態(tài)218,其中作出數(shù)據(jù)庫中是否存在更多序列的判斷。如果數(shù)據(jù)庫中不存在更多的序列,那么過程200在結(jié)束狀態(tài)220終止。然而,如果數(shù)據(jù)庫中確實存在更多的序列,那么過程200轉(zhuǎn)到狀態(tài)224,其中指針被指向數(shù)據(jù)庫中的下一個序列,以便與新序列進行比較。以這種方式,將新序列與數(shù)據(jù)庫中的每一序列聯(lián)配并進行比較。應(yīng)該注意到,如果已經(jīng)在決策狀態(tài)212已經(jīng)作出了序列不同源的判斷,那么過程200將立即轉(zhuǎn)到?jīng)Q策狀態(tài)218,以便確定用于比較的數(shù)據(jù)庫中的任何其它序列是否可利用。因此,本發(fā)明的一種實施方式是計算機系統(tǒng),該系統(tǒng)包括處理器,數(shù)據(jù)存儲設(shè)備——其上存儲有依據(jù)本發(fā)明的核酸序列及與其基本相同的序列或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列,數(shù)據(jù)存儲設(shè)備——其上以可檢索方式存儲了待與依據(jù)本發(fā)明的核酸序列及與其基本相同的序列或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列比較的參考核苷酸序列或多肽序列,以及用于進行比較的序列比較器。該序列比較器可指出被比較序列之間的同源性水平,或鑒定上述依據(jù)本發(fā)明的核酸序列的核酸密碼及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列中的結(jié)構(gòu)基序,或其可鑒定與這些核酸密碼和多肽密碼比較的序列中的結(jié)構(gòu)基序。在一些實施方式中,數(shù)據(jù)存儲設(shè)備可具有存儲于其上的依據(jù)本發(fā)明的核酸序列及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列的至少2、5、10、15、20、25、30或40或更多的序列。本發(fā)明的另一實施方式是確定依據(jù)本發(fā)明的核酸序列及與其基本相同的序列,或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列與參考核苷酸序列之間同源性水平的方法。所述方法包括通過使用確定同源性水平的計算機程序讀取核酸密碼或多肽密碼以及參考核苷酸或多肽序列,以及用該計算機程序確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。所述計算機程序可以是確定同源性水平的許多計算機程序的任何一種,包括本文中具體羅列的那些程序(例如,BLAST2N,具有默認參數(shù)或任何調(diào)整的參數(shù))。該方法可使用上述計算機系統(tǒng)實施。所述方法還可以如下進行通過使用所述計算機程序讀取至少2、5、10、15、20、25、30或40個或更多個上述依據(jù)本發(fā)明的核酸序列及與其基本相同的序列或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列,以及確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。圖11是示意性說明計算機中實施的過程250的一個實施方式的流程圖,該過程用于確定兩個序列是否同源。過程250在起始狀態(tài)252開始,然后轉(zhuǎn)到狀態(tài)254,其中要被比較的第一個序列被存儲到存儲器上。然后要被比較的第二個序列在狀態(tài)256被存儲到存儲器上。然后過程250轉(zhuǎn)到狀態(tài)260,其中讀取第一個序列中的第一個字符,然后轉(zhuǎn)到狀態(tài)262,其中讀取第二個序列的第一個字符。應(yīng)該理解到,如果序列是核苷酸序列,那么字符將通常是A、T、C、G或U。如果序列是蛋白序列,那么在一些實施方式中,字符可以是單字母氨基酸密碼,以便第一個序列和第二個序列可以被容易地比較。然后在決策狀態(tài)264作出兩個字符是否相同的判斷。如果它們相同,那么過程250轉(zhuǎn)到狀態(tài)268,其中第一個和第二個序列中的下一個字符被讀取。然后作出該下一個字符是否相同的判斷。如果它們相同,那么過程250繼續(xù)循環(huán),直到兩個字符不相同。如果作出的判斷是這兩個字母不相符,那么過程250轉(zhuǎn)到?jīng)Q策狀態(tài)274,以確定是否有更多的字符或者序列可以讀取。如果沒有任何更多的字符可讀取,那么過程250轉(zhuǎn)到狀態(tài)276,其中第一個和第二個序列之間的同源性水平被顯示給用戶。同源性水平通過計算序列之間相同的字符在第一個序列的序列總數(shù)中的比例來確定。因此,如果第一個ioo個核苷酸序列中的每一個字符都與第二個序列中的每一個字符聯(lián)配,那么同源性水平將是100%??梢赃x擇地,計算機程序可以是這樣的計算機程序,其將本發(fā)明所示的核酸序列的核苷酸序列與一個或多個參考核苷酸序列進行比較,以確定本發(fā)明的核酸密碼及與其基本相同的序列是否在一個或多個位置上與參考核酸序列不同。任選地,這樣的程序記錄,相對于參考多核苷酸序列或者本發(fā)明的核酸序列及與其基本相同的序列,被插入、缺失或置換的核苷酸的長度和身份。在一些實施方式中,計算機程序可以是確定本發(fā)明的核酸序列及與其基本相同的序列是否相對于參考核苷酸序列含有單核苷酸多態(tài)性(SNP)的程序。因此,本發(fā)明的另一實施方式是確定本發(fā)明的核酸序列及與其基本相同的序列是否在一個或多個核苷酸處與參考核苷酸序列不同的方法,所述方法包括步驟通過使用鑒定核酸序列之間的差異的計算機程序讀取核酸密碼和參考核苷酸序列,并用該計算機程序鑒定核酸密碼和參考核苷酸序列之間的差異。在一些實施方式中,計算機程序是鑒定單核苷酸多態(tài)性的程序。該方法可以通過上面描述的計算機程序和圖11所示意性說明的方法執(zhí)行。所述方法還可以如下進行通過使用所述計算機程序讀取至少2、5、10、15、20、25、30或40個或更多個本發(fā)明核酸序列及與其基本相同的序列和參考核苷酸序列,以及用該計算機程序鑒定核酸密碼與參考核苷酸序列之間的差異。在其它實施方式中,基于計算機的系統(tǒng)可進一步包含鑒定依據(jù)本發(fā)明的核酸序列或依據(jù)本發(fā)明的多肽序列及與其基本相同的序列中的特征的鑒定器(識別器,identifier)。"鑒定器"指的是鑒定依據(jù)本發(fā)明的核酸序列,或依據(jù)本發(fā)明的多肽序列中某些特征的一個或多個程序。在一些實施方式中,鑒定器可包含鑒定依據(jù)本發(fā)明的核酸序列及與其基本相同的序列中的開放閱讀框的程序。圖12是示意性說明鑒定器過程300的一個實施方式的流程圖,即用于檢測序列中特征的存在與否。過程300在起始狀態(tài)302開始,然后轉(zhuǎn)到狀態(tài)304,其中將被檢查特征的第一個序列存儲在計算機系統(tǒng)100的存儲器115上。然后過程300轉(zhuǎn)到狀態(tài)306,其中打開序列特征數(shù)據(jù)庫。這樣的數(shù)據(jù)庫包括每一特征的屬性以及該特征的名稱的列表。例如,特征名稱可以是"起始密碼子",屬性是"ATG"。另一個實例是特征名稱"TAATAA序列盒",特征屬性是"TAATAA"。這樣的數(shù)據(jù)庫的實例由威斯康星大學(xué)遺傳學(xué)計算機組(UniversityofWisconsinGeneticsComputerGroup)開發(fā)的數(shù)據(jù)庫??梢赃x擇地,這些特征可以是結(jié)構(gòu)性多肽基序如a螺旋、卩折疊,或功能性多肽基序如酶活性位點、螺旋-轉(zhuǎn)角-螺旋基序或本
技術(shù)領(lǐng)域:
技術(shù)人員已知的其它基序。—旦在狀態(tài)306打開特征數(shù)據(jù)庫,過程300就轉(zhuǎn)到狀態(tài)308,其中從數(shù)據(jù)庫讀取第一個特征。然后在狀態(tài)310將第一個特征的屬性與第一個序列進行比較。接著在決策狀態(tài)316作出在第一個序列中是否發(fā)現(xiàn)該特征的屬性的判斷。如果發(fā)現(xiàn)了屬性,那么過程300轉(zhuǎn)到狀態(tài)318,其中所發(fā)現(xiàn)的特征的名稱被顯示給用戶。然后,過程300轉(zhuǎn)到?jīng)Q策狀態(tài)320,其中作出數(shù)據(jù)庫中是否存在更多特征的判斷。如果不存在更多特征,那么過程300在結(jié)束狀態(tài)324終止。然而,如果數(shù)據(jù)庫中確實存在更多的特征,那么過程300在狀態(tài)326讀取下一個序列特征,并循環(huán)回到狀態(tài)310,其中將下一個特征的屬性與第一個序列進行比較。應(yīng)當(dāng)注意,如果在決策狀態(tài)316在第一個序列中沒有發(fā)現(xiàn)特征屬性,那么過程300直接轉(zhuǎn)到?jīng)Q策狀態(tài)320,以便確定數(shù)據(jù)庫中是否存在更多特征。因此,本發(fā)明的另一實施方式是鑒定本發(fā)明的核酸序列及與其基本相同的序列,或本發(fā)明的多肽序列及與其基本相同的序列中的特征的方法,所述方法包括通過使用鑒定其中特征的計算機程序讀取核酸密碼(一個或多個)或多肽密碼(一個或多個),并用該計算機程序鑒定核酸密碼(一個或多個)中的特征。在一些實施方式中,計算機程序包括鑒定開放閱讀框的計算機程序。所述方法可以如下進行通過使用所述計算機程序讀取本發(fā)明的核酸序列及與其基本相同的序列,或本發(fā)明的多肽序列及與其基本相同的序列中的一個序列或至少2、5、10、15、20、25、30或40個或更多個序列,以及用該計算機程序鑒定核酸密碼或多肽密碼中的特征。依據(jù)本發(fā)明的核酸序列及與其基本相同的序列,或本發(fā)明的多肽序列及與其基本相同的序列可以以多種格式在各種數(shù)據(jù)處理器程序中存儲和操作。例如,本發(fā)明的核酸序列及與其基本相同的序列,或本發(fā)明的多肽序列及與其基本相同的序列,可以以文本文件存儲在字處理文件中,如MicrosoftWORDTM或WORDPERFECT,或以ASCII文件存儲在本領(lǐng)域技術(shù)人員熟悉的各種數(shù)據(jù)庫程序中,例如DB2TM、SYBASE或ORACLE。此外,許多計算機程序和數(shù)據(jù)庫可以被用作序列比較算法、鑒定器或與本發(fā)明的核酸序列及與其基本相同的序列或本發(fā)明的多肽序列及與其基本相同的序列進行比較的參考核苷酸序列或多肽序列的來源。下面的羅列不意圖限制本發(fā)明,而是提供對本發(fā)明的核酸序列及與其基本相同的序列或本發(fā)明的多肽序列及與其基本相同的序列有用的程序和數(shù)據(jù)庫的指導(dǎo)??梢允褂玫某绦蚝蛿?shù)據(jù)庫,包括但不限于MACPATTERNTM(EMBL)、DISCOVERYBASE(MolecularApplicationGroup)、GENEMINE(MolecularApplicationGroup)、LOOK(MolecularApplicationGroup)、MACLOOK(MolecularApplicationGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等人,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPETM(MolecularSimulationsInc.)、Cerius2.DBAccess(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、INSIGHTII(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMm(MolecularSimulationsInc.)、FELIX(MolecularSimulationsInc.)、DELPHI(MolecularSimulationsInc.)、QuanteMM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISISTM(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、"WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDLAvailableChemicalsDirectory數(shù)據(jù)庫、MDLDrugDataReport數(shù)據(jù)庫、ComprehensiveMedicinalChemistry數(shù)據(jù)庫、Derwent'sWorldDrugIndex數(shù)據(jù)庫、BioByteMasterFile數(shù)據(jù)庫、Genbank數(shù)據(jù)庫和Genseqn數(shù)據(jù)庫。基于本發(fā)明的公開內(nèi)容,許多其它程序和數(shù)據(jù)庫對于本
技術(shù)領(lǐng)域:
的技術(shù)人員是顯而易見的。可以用上述程序檢測的基序包括編碼亮氨酸拉鏈的序列、螺旋-轉(zhuǎn)角-螺旋基序、糖基化位點、泛素化位點、a螺旋和P折疊、編碼指導(dǎo)被編碼的蛋白分泌的信號肽的信號序列、在轉(zhuǎn)錄調(diào)節(jié)中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位點、底物結(jié)合位點和酶切割位點。核酸的雜交本發(fā)明提供了分離的、合成的或重組的核酸,其在嚴格條件下與依據(jù)本發(fā)明的序列雜交(如SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:19、SEQIDNO:29、SEQIDNO:39、SEQIDNO:49、SEQIDNO:59、SEQIDNO:69、SEQIDNO:79、SEQIDNO:89、SEQIDNO:99、SEQIDNO:II、SEQIDNO:21-SEQIDNO:31,SEQIDNO:41-SEQIDNO:51SEQIDNO:61SEQIDNO:71SEQIDNO:81.SEQIDNO:91SEQIDNO:15、,SEQIDNO:25、,SEQIDNO:35、,SE(^IDNO:45、,SEQIDNO:55、,SEQIDNO:65、SEQIDNO:75、SEQIDNO:85、SEQIDNO:95、,SEQIDNO:105-SEQIDNO:17、SEGIDNO:27、SEQIDNO:37、SEQIDNO:47、SEQIDNO:57、SEQIDNO:67、SEQIDNO:77、SEQIDNO:87、SEQIDNO:97、SEQIDNO:107、SEQIDNO:13、>SEQIDNO:23、>SEQIDNO:33、、SEQIDNO:43、、SEQIDNO:53、、SEQIDNO:63、、SEQIDNO:73、、SEQIDNO:83、、SEQIDNO:93、.SEQIDNO:101、SEQIDNO:103-SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQDDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:191、SEQIDNO:193、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:209、SEQIDNO:211、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221SEQIDNO:227、SEQIDNO:229、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:245、SEQIDNO:247、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、NO:177、SEQIDNO:179、SEQIDSEQDDNO:187、SEQIDNO:189、NO:195、SEQIDNO:197、SEQIDSEQIDNO:205、SEQIDNO:207、NO:213、SEQIDNO:215、SEQIDSEQIDNO:223、SEQIDNO:225、NO:231、SEQIDNO:233、SEQIDSEQIDNO:241、SEQIDNO:243、NO:249、SEQIDNO:251、SEQIDSEQIDNO:259、SEQIDNO:261、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338)。嚴格條件可以是高度嚴格的條件、中等嚴格的條件和/或低嚴格的條件,包括本文所述的高的和降低的嚴格條件。在一些實施方式中,洗滌條件的嚴格性闡述了確定核酸是否在依據(jù)本發(fā)明的范圍內(nèi)的條件,如下文討論。"雜交"指這樣一個過程,即,通過該過程核酸鏈與互補鏈通過堿基配對而結(jié)合。雜交反應(yīng)可以是靈敏的并且是選擇性的,以便感興趣的特定序列可以被鑒定,甚至在其以低濃度存在的樣品中也可以被鑒定。適度的嚴格條件(stringentconditions)可以通過,例如預(yù)雜交和雜交溶液中鹽或甲酰胺的濃度來定義,或者通過雜交溫度來定義,這些嚴緊條件在本
技術(shù)領(lǐng)域:
是已知的。在其它實施方式中,嚴格性可以通過降低鹽的濃度、增加甲酰胺的濃度或升高雜交溫度來增加。在其它實施方式中,本發(fā)明的核酸通過它們在各種嚴緊條件(例如強、中等和低嚴格條件)下雜交的能力來定義,正如本文所示。在一些實施方式中,高嚴格性條件下的雜交包括在約37'C到42'C下大約50%的甲酰胺。在一些實施方式中,雜交條件包括在約30'C到35'C下大約35%到25%的甲酰胺中的降低的嚴格性條件。在一些實施方式中,雜交條件包括高度嚴格性條件,例如,在42'C、在50%甲酰胺、5XSSPE、0.3。/。SDS中,和200n/ml的剪切和變性鮭精DNA。在一些實施方式中,雜交條件包括這些降低的嚴格性條件,但在降低的溫度35'C在35n/。甲酰胺中。相應(yīng)于特定的嚴格性水平的溫度范圍可以通過計算目標(biāo)核酸中的嘌呤嘧啶比并相應(yīng)調(diào)節(jié)溫度而進一步縮小。上述范圍和條件的變化在本領(lǐng)域中是熟知的。在其它實施方式中,本發(fā)明的核酸,正如通過它們在嚴緊條件下雜交的能力所定義的,可以在本發(fā)明的核酸的大約五個殘基到全長之間;例如它們的長度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多殘基。也包括小于全長的核酸。這些核酸可以用作,例如雜交探針、標(biāo)記探針、PCR寡核苷酸探針、siRNA或miRNA(單鏈或雙鏈)、反義或編碼抗體結(jié)合肽(表位)、基序、活性位點的序列以及類似序列。在一些實施方式中,本發(fā)明的核酸通過它們在高度嚴格性下雜交的能力定義,高度嚴格性包括在大約37'C到42'C的溫度下大約50%的甲酰胺的條件。在一些實施方式中,本發(fā)明的核酸通過它們在降低的嚴格性下雜交的能力定義,降低的嚴格性包括在大約30'C到35'C在大約35%至25%的甲酰胺中的條件??蛇x地,本發(fā)明的核酸通過它們在高度嚴格性下雜交的能力定義,高度嚴格性包括的條件為在42'C、在50%甲酰胺、5XSSPE、0.3。/。SDS中,和封閉核酸的重復(fù)序列,如cot-l或鮭精DNA(例如200n/ml的剪切和變性鮭精DNA)。在一些實施方式中,本發(fā)明的核酸通過它們在降低的嚴格性條件下雜交的能力定義,降低的嚴格性條件包括在35'C或42'C的降低溫度下的35%或40%甲酰胺中。在核酸雜交反應(yīng)中,用于得到特定嚴格性水平的條件將根據(jù)雜交中的核酸的性質(zhì)變化。例如,所述核酸的雜交區(qū)域的長度、互補程度、核苷酸序列組成(例如GC和AT含量)和核酸類型(例如RNA和DNA)可以在選擇雜交條件時加以考慮。另外的考慮因素是核酸之一是否被固定,例如固定在濾膜上。雜交可以在低度嚴格性、中度嚴格性或高度嚴格性的條件下進行。作為核酸雜交的一個實例,含有固定化的變性核酸的聚合物膜首先在45'C在含有如下成分的溶液中預(yù)雜交30分鐘0.9MNaCl、50mMNaH2P04,pH7.0、5.0mMNa2EDTA、0.5%SDS、10XDenhardt's禾口0.5mg/ml多核糖腺苷酸。然后在該溶液中加入大約2X10、pm(比活性為4-9Xl()Scpm/iig)的32P末端標(biāo)記的寡核苷酸探針。在溫育12-16小時后,在室溫下在含有0.5。/。SDS的1XSET(150mMNaCl、20mMTris鹽酸,pH7.8、lmMNa2EDTA)中將膜洗滌30分鐘,隨后,為了該寡核苷酸探針在Tm-l(TC的溫度下、在新鮮的1XSET中洗滌30分鐘。然后將膜暴露于放射自顯影膠片,以檢測雜交信號。所有的前述雜交將被認為在高嚴格性條件下。雜交后,洗滌濾膜(filter)以除去任何非特異性結(jié)合的可檢測探針。用于洗滌濾膜的嚴格性也可以根據(jù)如下方面進行變化被雜交的核酸的性質(zhì)、被雜交的核酸的長度、互補程度、核苷酸序列組成(例如GC對AT含量)和核酸類型(例如RNA和DNA)。逐步增高的嚴格性條件洗滌的實例如下2XSSC,0.1%SDS,室溫下洗漆15分鐘(低度嚴格性);0.1XSSC,0.5%SDS,室溫下洗滌30分鐘到1小時(中度嚴格性);0.1XSSC,0.5%SDS,雜交溫度和68'C之間洗滌15到30分鐘(高度嚴格性);和0.15MNaCl,72'C洗滌15分鐘(極高嚴格性)。最終的低嚴格性洗滌可以在0.1XSSC中在室溫下進行。上述的實例僅僅是可用于洗滌濾膜的一組條件的示例性說明。本領(lǐng)域技術(shù)人員將知道,對于不同嚴格性的洗滌,可以有多種方案。下面給出了一些其它實例。在一些實施方式中,雜交條件包括洗滌步驟,其包括在室溫下在含有1X150mMNaCl、20mMTris鹽酸,pH7.8、1mMNa2EDTA、0,5%SDS的溶液中洗滌30分鐘,然后在新鮮溶液中洗滌30分鐘。與探針雜交的核酸通過放射自顯影或其它傳統(tǒng)技術(shù)識別。可以對上述方法進行修飾,以鑒定與探針序列具有降低水平的序列同一性(同源性)的核酸。例如,為了獲得與可檢測的探針具有降低的序列同一性(同源性)的核酸,可以使用較低嚴格性的條件。例如,雜交溫度可以以5'C的增量從68'C降低到42X:,雜交緩沖液的Na+濃度為大約1M。在雜交后,用2XSSC、0.5。/。SDS在雜交溫度下洗滌濾膜。這些條件在高于50'C被認為是"中度"條件,在低于50。C被認為是"低度"條件。特定實例的"中度"雜交條件是當(dāng)上述雜交在55。C進行。特定實例的"低度嚴格性"雜交條件是當(dāng)上述雜交在45'C進行。交可以在含有甲酰胺的緩沖液如6XSSC中在42'C的溫度下進行。在這種情況下,雜交緩沖液中甲酰胺的濃度可以以5%的增量從50%降低到0%,以鑒定與探針具有降低水平的同源性的克隆。在雜交后,用6XSSC、0.5。/。SDS在50'C洗滌濾膜。這些條件在高于25%的甲酰胺被認為是"中度"條件,在低于25%甲酰胺被認為是"低度"條件。特定實例的"中度"雜交條件是當(dāng)上述雜交在30%甲酰胺中進行。特定實例的"低度嚴格性"雜交條件是當(dāng)上述雜交在10%甲酰胺中進行。然而,雜交形式的選擇不是關(guān)鍵性的——洗滌條件的嚴格性是決定核酸是否在本發(fā)明范圍內(nèi)的條件。用于鑒定本發(fā)明范圍內(nèi)的核酸的洗滌條件包括,例如在pH7大約0.02M的鹽濃度,至少大約5(TC或大約55'C到大約60'C的溫度;或者在72'C大約0.15MNaCl的鹽濃度下大約15分鐘;或者在至少大約50°C或大約55'C到大約60'C的溫度下大約0.2XSSC的鹽濃度下大約15到大約20分鐘;或者用溶液將雜交復(fù)合物洗滌兩次,所述溶液的鹽濃度為含有O.P/。SDS的大約2XSSC,在室溫下洗滌15分鐘,然后用含有0.1。/。SDS的0.1XSSC在68'C洗滌15分鐘,洗滌兩次;或者等同的條件。SSC緩沖液和等同條件的描述,參見Sambrook編輯,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989),LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,第I部分.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)和Ausubel編輯.JohnWiley&Sons,Inc.,NewYork(1997)。這些方法可以被用于分離或鑒定本發(fā)明的核酸及與其基本相同的序列。例如,前述方法可用于分離或鑒定核酸,所述核酸具有與選自本發(fā)明的序列及與其基本相同的序列或含有其至少大約10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個連續(xù)堿基的片段以及其互補序列之一的核酸序列具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性(同源性)的序列。序列同一性(同源性)可以使用聯(lián)配算法來測量。例如,同源多核苷酸可以具有編碼序列,該編碼序列是本文描述的編碼序列之一的天然發(fā)生的等位基因變體。當(dāng)與本發(fā)明的核酸比較時,這樣的等位基因變體可以具有一個或多個核苷酸的置換、缺失或添加。另外,上述的方法可用于分離編碼多肽的核酸,所述多肽與本發(fā)明的多肽或者包含其至少5、10、15、20、25、30、35、40、50、75、100或150個連續(xù)氨基酸的片段具有至少大約99%、至少大約95%、至少大約90%、至少大約85%、至少大約80%、至少大約75%、至少大約70%、至少大約65%、至少大約60%、至少大約55%或至少大約50%的序列同一性(同源性),正如使用序列聯(lián)配算法(例如FASTA3.0t78版本算法,參數(shù)為默認值)所確定的。寡核苷酸探針及其使用方法本發(fā)明也提供了核酸探針,其可以被用于,諸如鑒定、擴增或分離編碼具有醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性的多肽或其片段的核酸,或被用于鑒定醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶基因。在一些實施方式中,探針包含依據(jù)本發(fā)明的核酸的至少10個連續(xù)堿基??蛇x地,依據(jù)本發(fā)明的探針可以是依據(jù)本發(fā)明的核酸中所述序列的至少約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或約10到50、約20到60、約30到70個連續(xù)堿基。探針通過結(jié)合和/或雜交識別核酸。探針可以被用在依據(jù)本發(fā)明的陣列中,見下文討論,如毛細管陣列。依據(jù)本發(fā)明的探針也可以被用于分離其它核酸或多肽。依據(jù)本發(fā)明的分離的、合成的或重組的核酸,其互補序列,或包含依據(jù)本發(fā)明的序列之一的至少約10、15、20、25、30、35、40、50、75、100、150、200、300、400或500個連續(xù)堿基的片段,或與其互補的序列也可以被用作探針,以確定生物樣品,如土壤樣品是否包含具有依據(jù)本發(fā)明的核酸序列的生物體或該核酸可從其中獲得的生物體。在這樣的方法中,獲得潛在地具有從中可分離出所述核酸的生物體的生物樣品,并從樣品中獲得核酸。將這些核酸在允許探針與樣品中存在的任何互補序列特異性雜交的條件下與探針接觸。在必要的時候,允許探針與互補序列特異性雜交的條件,可以通過將探針與來自樣品的互補序列以及對照序列進行接觸來確定,所述樣品已知含有互補序列,所述對照序列不含有互補序列。雜交條件,如雜交緩沖液的鹽濃度、雜交緩沖液的甲酰胺濃度或雜交溫度,可以被改變以確定允許探針與互補核酸特異性雜交的條件。如果該樣品含有從中可分離出核酸的生物體,那么探針的特異性雜交被檢測到。雜交可以通過用可檢測的試劑標(biāo)記探針來檢測,所述可檢測的試劑如放射性同位素、熒光染料或能催化可檢測產(chǎn)物形成的酶。使用標(biāo)記探針來檢測樣品中互補核酸的存在的許多方法對于本領(lǐng)域技術(shù)人員是熟知的。這些方法包括Southern印跡、Northern印跡、集落雜交方法和斑點印跡。這些方法中的每一種方法的方案在Ausubel等.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.(1997)和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)中提供??梢赃x擇地,多于一種的探針(其中至少一種探針能與核酸樣品中存在的任何互補序列特異性雜交)可以在擴增反應(yīng)中使用,以確定樣品是否包含含有本發(fā)明的核酸的生物體(例如從中可分離出所述核酸的生物體)。在一些實施方式中,這些探針包括寡核苷酸。在一些實施方式中,擴增反應(yīng)可以包括PCR反應(yīng)。PCR實驗方案在在Ausubel和Sambrook,supra中有所描述。可選地,擴增可以包括連接酶鏈式反應(yīng)、3SR或鏈置換反應(yīng)(見Barany,F.,"TheLigaseChainReactioninaPCRWorld",尸C及Afe^ocfr^/^//ca"o"j1:5-16,1991;E.Fahy等,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",尸C/A/eAo(/ycmJ^p//!'a^/o^wi:25-33,1991;以及^WalkerG.T.等,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch2Q:1691-1696,1992)。在這樣的方法中,將樣品中的核酸與探針接觸,進行擴增反應(yīng),檢測所得到的擴增產(chǎn)物。擴增產(chǎn)物可以通過在反應(yīng)產(chǎn)物上進行凝膠電泳并用嵌入劑如溴化乙啶染色凝膠來檢測??梢赃x擇地,可以用放射性同位素標(biāo)記一種或多種探針,放射性擴增產(chǎn)物的存在在凝膠電泳后通過放射自顯影術(shù)來檢測。衍生自本發(fā)明序列的末端附近的序列的探針也可以在染色體步移(chromosomewalking)方法中使用,以鑒定含有臨近本發(fā)明的序列的基因組序列的克隆。這樣的方法允許從宿主生物中分離編碼額外蛋白的基因。在一些實施方式中,本發(fā)明的分離、合成的或重組的核酸、與其互補的序列、或含有本發(fā)明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個或更多連續(xù)堿基的片段、或與其互補的序列,被用作探針,以鑒定和分離相關(guān)的核酸。在一些實施方式中,該相關(guān)的核酸可以是來自生物體的cDNA或基因組DNA,這些生物體并不是最初從中分離出所述核酸的生物體。例如,其它生物體可以是相關(guān)生物體。在這樣的方法中,核酸樣品在允許探針與相關(guān)序列特異性雜交的條件下與探針接觸。然后用上面描述的任意一種方法檢測探針與來自相關(guān)生物體的核酸的雜交。通過改變用于鑒定與可檢測探針雜交的核酸例如cDNA或基因組DNA的雜交條件的嚴緊性,可以鑒定并分離與探針具有不同同源性水平的核酸。嚴格性通過在低于探針的解鏈溫度的變化溫度下進行雜交來改變。解鏈溫度Tm是50%的耙序列與完全互補的探針雜交時的溫度(在確定的離子強度和pH下)。選擇非常嚴格的條件,使其與特定探針的Tm相等,或比Tm低大約5'C??梢允褂孟率龉接嬎闾结樀慕怄湝囟葘τ陂L度在14到70個核苷酸的探針,使用如下公式計算解鏈溫度(Tm):Tm=81.5+16.6(1og[Na+])+0.41(G+C的比例分數(shù))一(600/N),其中N是探針的長度。如果雜交在含有甲酰胺的溶液中進行,解鏈溫度使用如下等式計算Tm=81.5+16.6(log[Na+])+0.41(G+C的比例分數(shù))一(0.63%甲酰胺)一(600/N),其中N是探針的長度。預(yù)雜交可以在6XSSC、5XDenhardt,s試劑、0.5%SDS、100嗎變性的片段化鮭精DNA或6XSSC、5XDenhardt's試劑、0.5%SDS、100ng變性的片段化鮭精DNA、50%甲酰胺中進行。SSC和Denhardt,s溶液的配方已在Sambrook等,如上中列出。在一些實施方式中,雜交通過將可檢測探針加入到上面所列出的預(yù)雜交溶液中來進行。在探針包括雙鏈DNA的情況下,在加入到雜交溶液之前對探針變性。在一些實施方式中,將濾膜與雜交溶液接觸充足的時間,以允許探針與含有與其互補的序列或與其同源的序列的cDNA或基因組DNA雜交。對于長度超過200個核苷酸的探針,雜交可以在比Tm低15-25'C的溫度進行。對于更短的探針,如寡核苷酸探針,雜交可以在比Tm低5-10'C的溫度進行。在一些實施方式中,6XSSC中的雜交在大約68'C進行。通常,在含有50%甲酰胺的溶液中的雜交是在大約42'C進行的。抑制醛縮酶的表達本發(fā)明提供了與依據(jù)本發(fā)明的核酸,例如編碼醛縮酶的核酸互補(如其反義序列)的核酸,如包含反義、siRNA、miRNA、核酶的核酸。含有反義序列的依據(jù)本發(fā)明的核酸能夠抑制編碼醛縮酶的基因的轉(zhuǎn)運、剪接或轉(zhuǎn)錄。這種抑制可以通過靶向基因組DNA或信使RNA生效。作為靶標(biāo)的核酸的轉(zhuǎn)錄或功能可以被抑制,例如通過雜交和/或切割。本發(fā)明提供的一組示例性的抑制劑包括能夠結(jié)合醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶基因或信使,在任一種情況下阻止或抑制醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的產(chǎn)生或功能的寡核苷酸。結(jié)合可通過序列特異性雜交來完成。另一類有用的抑制劑包括引起醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶信使失活或剪切的寡核苷酸。所述寡核苷酸可以具有引起這樣剪切的酶活性,如核酶??梢詫押塑账徇M行化學(xué)修飾,或與能切割互補核酸的酶或組分偶聯(lián)。可以對許多不同的這樣的寡核苷酸的庫進行篩選來尋找那些具有期望活性的寡核苷酸。因此,本發(fā)明提供了在核酸和/或蛋白水平上抑制醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶表達的多種組合物,如含有依據(jù)本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶序列的反義、siRNA、miRNA和核酶,和抗如依據(jù)本發(fā)明的醛縮酶,例如抗丙酮酸醛縮酶,抗HMG和/或抗KHG醛縮酶的抗體。醛縮酶,例如丙酮酸酸縮酶,如HMG和/或KHG醛縮酶表達的抑制可以具有各種工業(yè)應(yīng)用。例如,抑制醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的表達可以減慢或防止變壞。在一些實施方式中,本發(fā)明的抑制醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的表達和/或活性的組合物的使用,例如抗體、反義寡核苷酸、核酶、siRNA和miRNA的使用,被用于減慢或防止變壞。因此,在一些實施方式中,本發(fā)明提供了方法和組合物,包括將本發(fā)明的抗體、反義寡核苷酸、核酶、siRNA和miRNA應(yīng)用于植物或者植物產(chǎn)品(如,谷物、谷粒、果實、種籽、根、葉等),以阻止或者延緩變壞。這些組合物也可以由植物(如,轉(zhuǎn)基因植物)或者其它生物(如,用本發(fā)明的醛縮酶,例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶的基因轉(zhuǎn)化的細菌或者其它微生物)表達。依據(jù)本發(fā)明用于抑制酸縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶表達的組分(例如,反義序列、iRNA、核酶、抗體)可用作藥物組合物,例如,抗病原劑,或用在其它治療中,例如用作抗微生物劑,如用于沙門氏菌屬。反義寡核苷酸本發(fā)明提供了能結(jié)合醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶信息的反義寡核苷酸,在一些實施方式中,其能通過以mRNA作為靶標(biāo)來抑制醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶活性。設(shè)計反義寡核苷酸的策略在科學(xué)和專利文獻中有很好的描述,技術(shù)人員能使用本發(fā)明的新試劑設(shè)計這樣的醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶寡核苷酸。例如,篩選有效的反義寡核苷酸的基因步移/RNA作圖方法在本
技術(shù)領(lǐng)域:
是熟知的,參見Ho(2000)MethodsEnzymol.314:168-183,該文獻描述了RNA作圖分析法,該分析法是基于標(biāo)準的分子技術(shù),以提供用于有效的反義序列選擇的一種簡單且可靠的方法。也參見Smith(2000)Eur.J.Pharm.Sci.11:191-198。自然發(fā)生的核酸被用作反義寡核苷酸。該反義寡核苷酸可以是任意長度;例如,在可選擇的方面,該反義寡核苷酸在大約5到100之間,大約10到80之間,大約15到60之間,大約18到40之間。最適長度可以通過常規(guī)篩選來決定。這些反義寡核苷酸可以以任意濃度存在。最適濃度可通過常規(guī)篩選來決定。廣泛種類的合成的、非天然發(fā)生的核苷酸和核酸類似物是已知的,它們可以解決這一潛在的問題。例如,可以使用含有非離子骨架的肽核酸(PNAs),如含有N-(2-氨基乙基)甘氨酸單元。也可以使用具有硫代磷酸酯鍵的反義寡核苷酸,正如在如下文獻中所描述的WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)。正如上面所描述的,本發(fā)明提供的具有合成DNA骨架類似物的反義寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亞甲基(甲基亞氨)、3'-N-氨基甲酸酯和嗎啉代氨基甲酸酯核酸。組合化學(xué)方法學(xué)可用于產(chǎn)生大量能被快速篩選特異性寡核苷酸的寡核苷酸,所述特異性寡核苷酸對任何靶標(biāo)具有適當(dāng)?shù)慕Y(jié)合親和性和特異性,例如本發(fā)明的醛縮酶,如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的正義和反義序列(參見Gold(1995)J.,Biol.Chem.270:13581-13584)。鄰縱提艨本發(fā)明提供了能結(jié)合醛縮酶,如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶的信息的核酶。這些核酶能抑制醛縮酶,如丙酮酸酸縮酶,如HMG和/或KHG醛縮酶的活性,例如通過以mRNA作為耙標(biāo)。設(shè)計核酶和選擇用于耙向的醛縮酶,如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶特異性反義序列的策略在科學(xué)和專利文獻中有很好的描述,熟練技術(shù)人員能使用本發(fā)明的新試劑來設(shè)計這樣的核酶。核酶通過核酶的靶RNA結(jié)合部分來與靶RNA結(jié)合,從而發(fā)揮作用,核酶的靶RNA結(jié)合部分與該RNA上切割耙RNA的酶促部分非常接近。這樣,通過互補的堿基配對,核酶識別和結(jié)合靶RNA,而且一旦結(jié)合于正確的位置,便以酶促活性作用來切割靶RNA和使其失活。如果切割發(fā)生在編碼序列中,以這樣的方式切割靶RNA將會破壞其引導(dǎo)合成編碼的蛋白的能力。核酶結(jié)合和切割其RNA靶之后,它可以從該RNA上釋放出來并且重復(fù)結(jié)合和切割新的靶。在一些情況下,核酶的酶促性質(zhì)會優(yōu)于其它的技術(shù),如反義技術(shù)(其中核酸分子僅結(jié)合于核酸靶來阻止其轉(zhuǎn)錄、翻譯或者與其它分子的聯(lián)系),因為實現(xiàn)治療效果所必要的核酶有效濃度可能低于反義寡核苷酸的濃度。這一潛在的優(yōu)點反映出核酶可以以酶促方式進行作用的能力。因此,單個核酶分子可以切割靶RNA的多個分子。在一些實施方式中,核酶是高度特異性的抑制物,其抑制作用的特異性不僅依賴于堿基配對的結(jié)合機制,也依賴于該分子抑制與其結(jié)合的RNA的表達的機制。即,所述抑制是由切割靶RNA引起的,因此特異性定義為靶RNA的切割率與非耙RNA的切割率的比值。除了涉及堿基配對的那些因素,這種切割機制還依賴于另外的因素。這樣,核酶作用的特異性比結(jié)合于同樣的RNA位點的反義寡核苷酸強。本發(fā)明的核酶,例如,具有酶活的核酶RNA分子,可以形成錘頭狀基序、發(fā)夾基序,如肝炎S病毒基序、I類內(nèi)含子基序和/或與RNA引導(dǎo)序列(guidesequence)相聯(lián)系的RNaseP樣RNA。錘頭狀基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有說明;發(fā)夾基序在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.AcidsRes.18:299中有說明;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有說明;RNaseP基序在Guetrier-Takada(1983)Ce1135:849中有說明;I類內(nèi)含子在Cech美國專利4,987,071中有說明。這些特定基序的引述并不是限制性的。本領(lǐng)域技術(shù)人員將認識到本發(fā)明的核酶,如,本發(fā)明的有酶活的RNA分子,可以有與一個或者多個靶基因的RNA區(qū)域互補的特異性底物結(jié)合位點。本發(fā)明的核酶可以在底物結(jié)合位點內(nèi)或者其周圍具有賦予了該分子RNA切割活性的核苷酸序列。f拔rm4"在一些實施方式中,本發(fā)明提供了被稱為"RNAi"分子的RNA抑制性分子,其含有本發(fā)明的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶的酶序列。RNAi分子可以包括雙鏈RNA(dsRNA)分子,例如siRNA、miRNA和/或短發(fā)夾RNA(shRNA)分子。RNAi分子,如siRNA(小抑制性RNA)禾口/或miRNA(微小RNA),可抑制醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG酸縮酶的酶基因的表達。在一些實施方式中,RNAi分子如siRNA和/或miRNA的長度大約為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或更多個雙鏈核苷酸。盡管本發(fā)明不限于任何特殊的作用機制,但是RNAi可進入細胞中并引起相似或相同序列的單鏈RNA(ssRNA)的降解,包括內(nèi)源性mRNA。當(dāng)細胞暴露于雙鏈RNA(dsRNA)時,來自同源基因的mRNA被稱為RNA干擾(RNAi)的過程選擇性地降解。RNAi的一個可能的基本機制是將與特定的基因序列匹配的雙鏈RNA(dsRNA)打斷成為稱為短的干擾RNA的短的碎片,它可觸發(fā)與其序列匹配的mRNA的降解。在一些實施方式中,本發(fā)明的RNAi可用于基因沉默(gene-silencing)療法中,見,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一些實施方式中,本發(fā)明提供了使用本發(fā)明的RNAi的分子如siRNA和/或miRNA選擇性降解RNA的方法。該方法可在體外、離體或體內(nèi)實施。在一些實施方式中,本發(fā)明的RNAi分子可用來在細胞、器官或動物中產(chǎn)生喪失功能的突變?!矫妫琑NAi的細胞內(nèi)引入是通過與含有吸附的RNAi(如小RNA)的RNA結(jié)合蛋白連接的靶細胞特異配體的內(nèi)化(internalization)完成的。該配體對獨特的靶細胞表面抗原是特異的。在結(jié)合細胞表面抗原后,該配體可以自發(fā)地內(nèi)化。如果獨特的細胞表面抗原與其配體結(jié)合后不能自然內(nèi)化,內(nèi)化可以通過向配體或RNA結(jié)合蛋白的結(jié)構(gòu)中插入富含精氨酸的肽或其它膜滲透肽,或通過將這樣的肽粘附到配體或RNA結(jié)合蛋白上來促進。參見美國專利申請發(fā)明者D·P·維那,E·伯克,L·趙,P·M·??怂?P·盧京比爾,T·理查德森申請人:維萊尼姆公司