專利名稱::醛縮酶和編碼醛縮酶的核酸以及它們的制備和使用方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及分子和細(xì)胞生物學(xué)和生物化學(xué)。更具體地,本發(fā)明涉及具有醛縮酶活性的多肽、編碼這些多肽的多核苷酸、以及制備和使用這些多核苷酸和多肽的方法。
背景技術(shù):
:莫那亭(Monatin)是一種具有如下化學(xué)式的高強度甜味劑<formula>formulaseeoriginaldocumentpage21</formula>(I)莫那亭包括兩個手性中心,從而具有四種可能的立體異構(gòu)構(gòu)型R,R構(gòu)型("R,R立體異構(gòu)體"或"R,R莫那亭,,);S,S構(gòu)型("S,S立體異構(gòu)體,,或"S,S莫那亭");R,S構(gòu)型("R,S立體異構(gòu)體"或"R,S莫那亭")和S,R構(gòu)型("S,R立體異構(gòu)體"或"S,R莫那亭")。除非另有說明,此處所用的術(shù)語"莫那亭"指的是含有莫那亭的全部四種立體異構(gòu)體的組合物;含有任意組合的莫那亭立體異構(gòu)體的組合物(例如,只含有R,R和S,S立體異構(gòu)體的莫那亭的組合物);以及單一異構(gòu)形式的莫那亭。為了公開,對莫那亭的碳主鏈進(jìn)行如上所示的編號,將直接與羥基共價相連的碳編為2-位碳,將直接與氨基共價相連的碳編為4-位碳。因此,除非另有說明,此處分別涉及到R,R莫那亭、S,S莫那亭、R,S莫那亭、S,R莫那亭、2R,4R莫那亭、2S,4S莫那亭、2R,4S莫那亭和2S,4R莫那亭。需要注意的是,在文獻(xiàn)中,也使用可選擇的常規(guī)方式對莫那亭碳主鏈編號,將直接與羥基共價相連的碳編為4-位碳,將直接與氨基共價相連的碳編為2-位碳。因此,例如,在此公開的2S,4R莫那亭所表示的與使用文獻(xiàn)中可選擇的常規(guī)方式編號的2R,4S莫那亭相同。此外,由于有多種不同的命名習(xí)慣,莫那亭有多種可選擇的化學(xué)名稱,包括2-羥基-2-(卩引哚-3-基甲基)-4-谷氨酸;4-氨基-2-羥基-2-(lH-吲哚-3-基甲基)戊二酸;4-羥基-4-(3』引哚基甲基)谷氨酸;禾口,3-(l-氨基-l,3-雙羧基-3-羥基-丁-4-基)卩引哚。可以在位于南非的德蘭士瓦區(qū)的&/2/eracMow植物的根皮中找到莫那亭的某些異構(gòu)體形式。此處被一并引用作為參考的美國專利申請10/422336("366申請,,)和10/979821("821申請,,)公開了特別是用于在體內(nèi)和體外制備莫那亭的多肽、途徑和微生物。
發(fā)明內(nèi)容本發(fā)明提供了具有醛縮酶活性(以下稱為"醛縮酶")的多肽、編碼所述多肽的多核苷酸、以及制備和使用這些多核苷酸和多肽的方法,所述醛縮酶活性包括丙酮酸醛縮酶活性,例如(而非限定),HMG和KHG醛縮酶活性。在一些實施方式中,本發(fā)明還提供了含有本發(fā)明的多肽或多核苷酸的組合物(例如,藥物組合物、燃料和燃料添加劑組合物、食品和食品添加劑、飲料和飲料添加劑、飼料和詞料添加劑、藥物和藥物添加劑、膳食補充劑)。這些組合物可以配制成各種形式,例如,片劑、凝膠、丸劑、填埋劑(implants)、液劑、噴霧劑、薄膜、微粒(micdles)、粉末、食品、飼料顆粒、或者各種膠囊化的形式。在一些實施方式中,醛縮酶和/或它們的組合物可以用于制藥、工業(yè)和/或農(nóng)業(yè)領(lǐng)域。在一些實施方式中,醛縮酶和/或它們的組合物可以用于形成或斷開碳-碳鍵。在一些實施方式中,提供的醛縮酶能夠催化oc-酮酸受體和丙酮酸或丙酮酸衍生物供體之間形成碳-碳鍵的反應(yīng)(見以下反應(yīng)進(jìn)程圖)。在一些實施方式中,受體也可以是酮或醛。在一些實施方式中,提供的醛縮酶具有4-羥基-2-酮戊二酸醛縮酶(例如,2-酮基-4-羥基戊二酸醛縮酶、2-氧基-羥基戊二酸醛縮酶、KHG-醛縮酶,EC4丄3.16)活性,并且能夠催化如下反應(yīng)4-羥基-2-酮戊二酸<=>丙酮酸+乙醛酸。在一些實施方式中,提供的醛縮酶具有HMG-醛縮酶(例如,4-羥基-4-甲基-2-酮戊二酸醛縮酶、丙酮酸醛縮酶、y-甲基-Y-羥基-a-酮戊二酸醛縮酶、4-羥基-4-甲基-2-酮戊二酸醛縮酶、EC4丄3.17)活性,并且能夠催化如下反應(yīng)4-羥基-4-甲基-2-酮戊二酸<=>2丙酮酸。HMG醛縮酶也可以作用于4-羥基-4-甲基-2-氧代乙二酸(oxoadipate)和4-羧基-4-羥基-2-酮己二酸(oxohexadioate)。ct-酉鵬、酉f丙酮酸或丙酮或醛受體酸衍牛物生物<formula>formulaseeoriginaldocumentpage23</formula>R=H、烷基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲R2=H、烷基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲R3=H、垸基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲基、羧酸基。在一些實施方式中,提供了醛縮酶(如丙酮酸醛縮酶,例如,而不限于,HMG和/或KHG醛縮酶),以促進(jìn)3,4-取代的2-酮戊二酸的生產(chǎn)。在一個實施方式中,本發(fā)明提供了一種制備3,4-取代的2-酮戊二酸的方法,該方法包括(a)提供具有醛縮酶活性的多肽,所述醛縮酶活性例如丙酮酸醛縮酶活性,例如而不限于HMG醛縮酶和/或KMG醛縮酶活性;(b)提供供體化合物和受體化合物;和(c)在醛縮酶催化3,4-取代的2-酮戊二酸合成的條件下,使步驟(a)的多肽與步驟(b)的化合物接觸,其中,所述供體和受體可以為丙酮酸或丙酮酸供體和a-酮酸受體,酮和/或醛。在一些實施方式中,提供的醛縮酶用于促進(jìn)R-2-羥基-2-(吲哚-3基甲基)-4-酮戊二酸(R-MP,一種莫那亭的前體)的生產(chǎn)。在一些實施方式中,丙酮酸醛縮酶(例如,HMG和/或KHG醛縮酶)可以用于與D-轉(zhuǎn)氨酶連接,以制備4-取代的D-谷氨酸或它的衍生物。4-取代的D-谷氨酸和/或它的衍生物可以用作抗生素,因為這些化合物能夠抑制細(xì)菌的谷氨酸消旋酶(WO0214261A3)。在一種實施方式中,本發(fā)明提供了一種制備4-取代的D-谷氨酸的方法,該方法包括(a)提供具有醛縮酶活性的多肽,如丙酮酸醛縮酶活性,例如而不限于HMG醛縮酶和/或KMG醛縮酶活性;(b)提供a-酮酸受體和丙酮酸或丙酮酸供體;和(c)在醛縮酶催化4-取代的D-谷氨酸合成的條件下,使步驟(a)的多肽與步驟(b)的化合物接觸,其中,所述多肽可以具有丙酮酸醛縮酶活性、HMG醛縮酶活性和/或KHG醛縮酶活性,其中,該方法還可以包括使用4-取代的D-谷氨酸。本發(fā)明提供了分離的、合成的或重組的核酸,該核酸含有的核酸序列在至少約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更高位的殘基區(qū)域上與本發(fā)明的核酸具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或全部(100%)的同一性,本發(fā)明的核酸包括SEQIDNO:l、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQEDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDN0.231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDN0:311、SEQIDN0:313、SEQIDN0:315、SEQIDN0:317、SEQIDN0:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。在一些實施方式中,一個或多個核酸編碼至少一種具有醛縮酶活性(例如,丙酮酸醛縮酶活性,例如而不限于HMG醛縮酶和/或KMG醛縮酶活性)的多肽。在一些實施方式中,通過序列比對法分析或視覺檢驗來確定序列的同一性。在可選擇的實施方式中,一個或多個核酸編碼至少一種能夠產(chǎn)生可以與本發(fā)明的多肽進(jìn)行特異性鍵合的抗體的多肽,或者這些核酸可以用作識別或分離醛縮酶的編碼核酸的探針,或者用于抑制表達(dá)醛縮酶的核酸的表達(dá)。本發(fā)明的核酸還包括編碼本發(fā)明的酶的分離的、合成的或重組的核酸,例如,包括具有如下序列和它們的子序列的一種或多種多肽、多肽的變體、和它們的酶活性片段的酶SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:湧、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334。在一些實施方式中,所述多肽具有醛縮酶活性,包括丙酮酸活性,例如而不限于HMG和/或KHG醛縮酶活性。在一些實施方式中,本發(fā)明提供了醛縮酶的編碼核酸,例如,丙酮酸醛縮酶(如HMG和/或KHG醛縮酶)的編碼核酸,所述編碼核酸優(yōu)選來自混合培養(yǎng)物。在一些實施方式中,本發(fā)明提供了從含有本發(fā)明的多核苷酸的混合培養(yǎng)物中分離出來的用于編碼形成或斷開碳-碳鍵的酶的核酸,例如,與本發(fā)明的核酸至少在約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、或更高位的殘基區(qū)域上具有至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高、或全部(100%)的同一性的序列,例如,本發(fā)明的核酸可以為SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:793SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:IB、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQEDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQEDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。在一些實施方式中,本發(fā)明提供了醛縮酶的編碼核酸,例如,丙酮酸醛縮酶(如HMG和/或KHG酶)的編碼核酸,包括本發(fā)明的多核苷酸序列;并提供了由它們編碼的多肽,包括本發(fā)明的酶,例如,本發(fā)明的多肽及其酶活性片段,優(yōu)選來自于同源,例如環(huán)境源,例如,本發(fā)明的多肽可以為SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:26Q、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334。在一些實施方式中,本發(fā)明還提供了醛縮酶的編碼核酸,例如,優(yōu)選來自環(huán)境源(例如混合的環(huán)境源)的丙酮酸醛縮酶的編碼核酸,HMG和/或KHG酶的編碼核酸。在一些實施方式中,所述序列比對法為BLAST2.2.2版比對法,其中,篩選設(shè)置(filteringsetting)設(shè)定為blastall-pblastp—d"nrpataa"-FF,其它選項都設(shè)置為默認(rèn)。本發(fā)明的其它實施方式為分離的、合成的或重組的核酸,該核酸含有至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更多個本發(fā)明的核酸的連續(xù)堿基;與其基本一致的序列;和與其互補的序列。在一些實施方式中,分離的、合成的或重組的本發(fā)明的核酸編碼具有醛縮酶活性(包括丙酮酸活性,例如但不限于HMG和/或KHG醛縮酶活性)的熱穩(wěn)定性多肽。在下述溫度范圍的條件下,本發(fā)明的熱穩(wěn)定性多肽能夠保持醛縮酶活性(如丙酮酸醛縮酶活性,例如,HMG和/或KHG醛縮酶活性)約-10(TC至約-8(TC、約-8(TC至約-4(TC、約-40。C至約-2(TC、約-20"C至約0°C、約0。C至約37。C、約(TC至約5。C、約5。C至約15。C、約15。C至約25。C、約25。C至約37。C、約37。C至約45t:、約45。C至約55。C、約55。C至約70。C、約70。C至約75°C、約75。C至約85°C、約85。C至約90°C、約90。C至約95°C、約95。C至約IO(TC、約IO(TC至約105°C、約105。C至約110。C、約110。C至約120°C、或者95。C、96°C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的溫度。本發(fā)明的熱穩(wěn)定性的多肽在下述溫度范圍的條件下能夠保持醛縮酶活性(如,丙酮酸醛縮酶活性,例如HMG和/或KHG醛縮酶活性)約-100。C至約-80。C、約-80。C至約-40。C、約-40。C至約-20。C、約-20。C至約0。C、約0。C至約5。C、約5。C至約15。C、約15。C至約25。C、約25。C至約37。C、約37"至約45。C、約45t:至約55。C、約55°C至約70°C、約70。C至約75°C、約75。C至約85°C、約85。C至約90°C、約90°C至約95。C、約95。C至約100°C、約IO(TC至約105°C、約105。C至約110°C、約ll(TC至約120°C,或者95。C、96°C、97°C、98°C、99°C、100°C、101。C、102。C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的溫度。在一些實施方式中,在上述溫度范圍和下述pH下,本發(fā)明的熱穩(wěn)定性多肽能夠保持醛縮酶活性約pH3.0、約pH3.5、約pH4.0、約pH4.5、約pH5.0、約pH5.5、約pH6.0、約pH6.5、約pH7.0、約pH7.5、約pH8.0、約pH8.5、約pH9.0、約pH9.5、約pH10.0、約pH10.5、約pHll.O、約pH11.5、約pH12.0、或更高的pH。在其它實施方式中,所述分離的、合成的或重組的核酸編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性)的熱穩(wěn)定性多肽。本發(fā)明的熱穩(wěn)定性的多肽暴露在下述溫度范圍的環(huán)境下能夠保持醛縮酶活性(如,丙酮酸醛縮酶活性,例如HMG和/或KHG醛縮酶活性)約-100。C至約-80。C、約-80。C至約-40。C、約-40。C至約-20。C、約-20。C至約(TC、約(TC至約5。C、約5。C至約15。C、約15。C至約25。C、約25。C至約37。C、約37。C至約45。C、約45。C至約55。C、約55。C至約7(TC、約70°C至約75。C、約75。C至約85。C、約85。C至約90°C、約90°C至約95°C、約95。C至約IO(TC、約IO(TC至約105°C、約105。C至約110°C、約ll(TC至約120°C,或者95。C、96°C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110。C、111°C、112°C、113°C、114°C、115°C、或更高的溫度。本發(fā)明的熱穩(wěn)定性多肽暴露在下述溫度范圍下能夠保持醛縮酶活性(如,丙酮酸醛縮酶活性,例如HMG和/或KHG醛縮酶活性)約-10(TC至約-8(TC、約-8(TC至約-4(TC、約-40。C至約-20。C、約-2(TC至約(TC、約(TC至約5°C、約5"C至約15°C、約15。C至約25°C、約25"至約37。C、約37。C至約45。C、約45。C至約55。C、約55。C至約70。C、約70。C至約75。C、約75。C至約85。C、約85。C至約90。C、約90。C至約95。C、約95。C至約100°C、約IO(TC至約105°C、約105。C至約110。C、約ll(TC至約120°C,或者95°C、96°C、97°C、98°C、99°C、IO(TC、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的溫度。在一些實施方式中,本發(fā)明的熱穩(wěn)定性多肽暴露在上述溫度范圍和下述pH下,能夠保持醛縮酶活性約pH3.0、約pH3.5、約pH4.0、約pH4.5、約pH5.0、約pH5.5、約pH6.0、約pH6.5、約pH7.0、約pH7.5、約pH8.0、約pH8.5、約pH9.0、約pH9.5、約pH10.0、約pH10.5、約pHll.O、約pH11.5、約pH12.0、或更高的pH。本發(fā)明提供了含有在嚴(yán)格的條件下能與本發(fā)明的核酸雜交的序列的分離的、合成的或重組的核酸,該核酸含有如下序列及其片段或子序列SEQIDN0:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQEDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337、或SEQIDNO:338。在一些實施方式中,所述核酸編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽。所述核酸在長度上可以為至少約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、或更多個殘基,或者為基因或轉(zhuǎn)錄產(chǎn)物的全長。在一些實施方式中,所述嚴(yán)格的條件包括洗滌步驟,該洗滌步驟包括在65T下在0.2xSSC中洗滌15分鐘。本發(fā)明提供了用于對編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽的核酸進(jìn)行識別或分離的核酸探針,其中,該核酸探針含有約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、或更多個本發(fā)明的序列的連續(xù)堿基,其中,所述探針通過成鍵或雜交來識別所述核酸。所述探針包括寡核苷酸,該寡核苷酸含有約10-100個之間的本發(fā)明的序列或者它們片段或子序列的連續(xù)堿基,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100,或者更多個堿基,或者上述范圍之間任意期望的長度。本發(fā)明提供了用于對編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽的核酸進(jìn)行識別或分離的核酸探針,其中,該核酸探針包括約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、或更多個本發(fā)明的核酸的殘基的序列,例如與本發(fā)明的核酸具有至少約50%、51%、52%、53°/。、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或完全(100%)的同一性的多核苷酸。在一些實施方式中,通過用序列比對法進(jìn)行分析或用視覺檢驗法來確定序列的同一性。在其它實施方式中,所述探針包括寡核苷酸,該寡核苷酸含有約10-100個之間的本發(fā)明的核酸序列或者其子序列的連續(xù)堿基,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100、或者更多個堿基,或者上述范圍之間的任意期望的長度。本發(fā)明提供了用于擴增(例如,通過聚合酶鏈反應(yīng)(PCR))編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽的核酸的擴增引物對,其中,每個引物對能夠?qū)斜景l(fā)明的序列的、或它們的片段或子序列(見序列表)的核酸進(jìn)行擴增。所述擴增引物序列對中的一個或每一個成員均可以包括寡核苷酸,該寡核苷酸含有約10-50個、或者更多個所述序列的連續(xù)堿基,或者包括10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36個、或者更多個所述序列的連續(xù)堿基。在一些實施方式中,本發(fā)明提供了擴增引物對,其中,每個引物對包括具有前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36個、或更多個本發(fā)明的核酸的殘基的序列的第一成員,以及前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36個、或更多個第一成員的互補鏈的殘基的序列的第二成員。使用本發(fā)明的擴增引物對,本發(fā)明提供了通過擴增(例如,聚合酶鏈反應(yīng)(PCR))產(chǎn)生的醛縮酶的編碼核酸,例如,丙酮酸醛縮酶的編碼核酸,HMG和/或KHG醛縮酶的編碼核酸。在一些實施方式中,使用本發(fā)明的擴增引物對,本發(fā)明提供了通過擴增(例如,聚合酶鏈反應(yīng)(PCR))產(chǎn)生的醛縮酶的編碼核酸,例如,丙酮酸醛縮酶的編碼核酸,HMG和/或KHG醛縮酶的編碼核酸。在一些實施方式中,使用本發(fā)明的擴增引物對,本發(fā)明提供了通過擴增(例如聚合酶鏈反應(yīng)(PCR))來制備醛縮酶(例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的方法。在一些實施方式中,所述擴增引物對使來自庫(例如基因庫、例如環(huán)境庫)的核酸擴增。本發(fā)明提供了用于對編碼具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽的核酸進(jìn)行擴增的方法,該方法包括用能夠擴增本發(fā)明的核酸序列、或它們的片段或子序列的擴增引物序列對,擴增模板核酸。本發(fā)明提供了一種表達(dá)盒,該表達(dá)盒含有本發(fā)明的核酸或它們的子序列。在一些實施方式中,所述表達(dá)盒可以含有與啟動子可操作地連接的核酸。所述啟動子可以是病毒、細(xì)菌、哺乳動物、真菌、酵母、或植物的啟動子。在一些實施方式中,所述植物啟動子可以是馬鈴薯、大米、玉米、小麥、煙草、或大麥的啟動子。所述啟動子可以為組成型啟動子。所述組成型啟動子可以包括CaMV35S。在其它的實施方式中,所述啟動子可以為誘導(dǎo)型啟動子。在一些實施方式中,所述啟動子可以為組織特異型啟動子或環(huán)境調(diào)節(jié)型或發(fā)育調(diào)節(jié)型啟動子。因此,例如,所述啟動子可以為種子特異型、葉子特異型、根特異型、莖特異型或脫離誘導(dǎo)型啟動子。在一些實施方式中,所訴表達(dá)盒還可以含有植物或植物病毒表達(dá)載體。本發(fā)明提供了一種克隆載體,該克隆載體包括本發(fā)明的表達(dá)盒(例如病毒載體)或者本發(fā)明的核酸。所述克隆載體可以為病毒載體、質(zhì)粒、噬菌體(phage)、噬菌粒、粘粒、福斯質(zhì)粒(fosmid)、細(xì)菌噬菌體(bacteriophage)或人工染色體。所述病毒載體可以包括腺病毒載體、逆轉(zhuǎn)錄病毒載體或腺相關(guān)病毒載體。所述克隆載體可以包括細(xì)菌人工染色體(BAC)、質(zhì)粒、源自細(xì)菌噬菌體Pl的載體(PAC)、酵母人工染色體(YAC)、或哺乳動物人工染色體(MAC)。本發(fā)明提供了一種轉(zhuǎn)化細(xì)胞,該轉(zhuǎn)化細(xì)胞含有本發(fā)明的核酸、或本發(fā)明的表達(dá)盒(例如載體)、或本發(fā)明的克隆載體。在一些實施方式中,所述轉(zhuǎn)化細(xì)胞可以是細(xì)菌細(xì)胞、哺乳動物細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或植物細(xì)胞。在一些實施方式中,所述植物細(xì)胞可以為大豆、油菜籽、油籽、蕃茄、蔗糖、谷物、馬鈴薯、小麥、大米、煙草或大麥的細(xì)胞。本發(fā)明提供了一種轉(zhuǎn)基因非人類動物,該轉(zhuǎn)基因非人類動物含有本發(fā)明的核酸或本發(fā)明的表達(dá)盒(例如載體)。在一些實施方式中,所述動物為小鼠、大鼠、豬、山羊或綿羊。本發(fā)明提供了一種轉(zhuǎn)基因植物,該轉(zhuǎn)基因植物含有本發(fā)明的核酸或本發(fā)明的表達(dá)盒(例如載體)。所述轉(zhuǎn)基因植物可以為谷類植物、玉米植物、馬鈴薯植物、蕃茄植物、小麥植物、油籽植物、油菜籽植物、大豆植物、大米植物、大麥植物或煙草植物。本發(fā)明提供了一種轉(zhuǎn)基因種子,該轉(zhuǎn)基因種子含有本發(fā)明的核酸或本發(fā)明的表達(dá)盒(例如載體)。所述轉(zhuǎn)基因種子可以為谷類種子、玉米種子、小麥種子、油籽、油菜籽、大豆種子、棕櫚仁、向日葵種子、芝麻種子、花生或煙草植物種子。本發(fā)明提供了一種反義寡核苷酸,該反義寡核苷酸含有與本發(fā)明的核酸互補的核酸序列或者能夠在嚴(yán)格的條件下與本發(fā)明的核酸雜交的核酸序列。在一些實施方式中,本發(fā)明提供了在細(xì)胞中對醛縮酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶)信息的轉(zhuǎn)譯進(jìn)行抑制的方法,該方法包括對細(xì)胞施用反義寡核苷酸或者在細(xì)胞中使該反義寡核苷酸表達(dá),所述反義寡核苷酸含有與本發(fā)明的核酸互補的核酸序列或者能夠在嚴(yán)格的條件下與本發(fā)明的核酸雜交的核酸序列。在一些實施方式中,所述反義寡核苷酸的長度為約10至約50個、約20至約60個、約30至約70個、約40至約8個0、約50至約IOO個堿基,例如,所述長度為10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100個、或更多個堿基。本發(fā)明提供了一種在細(xì)胞中對醛縮酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的信息的轉(zhuǎn)譯進(jìn)行抑制的方法,該方法包括對細(xì)胞施用反義寡核苷酸或者在細(xì)胞中使該反義寡核苷酸表達(dá),所述反義寡核苷酸含有與本發(fā)明的核酸互補的核酸序列或者能夠在嚴(yán)格的條件下與本發(fā)明的核酸雜交的核酸序列。本發(fā)明提供了一種含有本發(fā)明的序列的子序列的雙鏈抑制性RNA(RNAi或RNA干擾)分子(包括用于抑制轉(zhuǎn)錄的小干擾RNA,或者siRNA,或者用于抑制轉(zhuǎn)譯的微RNA(microRNA)或小RNA(miRNA))。在一些實施方式中,所述siRNA為長度為約21-24個殘基的雙鏈核苷酸,或者長度至少為5、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、卯、95、100個、或更多個殘基的雙鏈核苷酸。在一些實施方式中,本發(fā)明提供了在細(xì)胞中對醛縮酶的(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶的酶)表達(dá)進(jìn)行抑制的方法,該方法包括對細(xì)胞施用雙鏈抑制性RNA(siRNA或miRNA)或者在細(xì)胞中使該雙鏈抑制性RNA表達(dá),其中,所述RNA含有本發(fā)明的序列的子序列。本發(fā)明提供了一種分離的、合成的或重組的多肽,該多肽包括至少在約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350位、或更高位的殘基區(qū)域上,或者在所述多肽的全長上與本發(fā)明的多肽或肽具有至少約50o/0、510/。、52。/()、53%、54%、55。/o、56%、57%、58。/o、59。/o、6()0/o、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或全部(100%)的同一性的氨基酸序列。在一些實施方式中,通過用序列比對法分析或通過視覺檢驗,來確定所述序列的同一性。本發(fā)明的多肽或肽序列包括以下序列和它們的子序列、它們的變體、和它們的酶活性片段SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334。本發(fā)明的多肽還含有長度至少為約10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600個、或更多個殘基的片段,或者所述酶的全長。本發(fā)明的多肽或肽序列含有由本發(fā)明的核酸所編碼的序列。本發(fā)明的多肽或肽序列包括與本發(fā)明的抗體特異性結(jié)合的多肽或肽(例如抗原決定簇),或者能夠產(chǎn)生本發(fā)明的抗體的多肽或肽(例如免疫原)。在一些實施方式中,本發(fā)明的多肽具有至少一種醛縮酶的活性,例如,丙酮酸醛縮酶(如,HMG和/或KHG醛縮酶)的活性。在其它的實施方式中,本發(fā)明的多核苷酸編碼具有至少一種醛縮酶的活性(例如,丙酮酸醛縮酶的活性,例如,HMG和/或KHG醛縮酶的活性)的多肽。本發(fā)明的另一種實施方式提供了一種分離的、合成的或重組的多肽,該多肽含有至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150個、或更多個本發(fā)明的多肽或肽的序列的連續(xù)堿基、與所述多肽或肽的序列基本一致的序列的連續(xù)堿基、和與所述多肽或肽的序列互補的序列的連續(xù)堿基。所述肽可以為,例如,免疫原的片段、基序(例如結(jié)合位點)、信號序列、前序列(pr印rosequence)或活性位點。本發(fā)明提供了一種分離的、合成的或重組的核酸,該核酸含有編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性和信號序列的多肽的序列,其中,所述核酸含有本發(fā)明的序列。"信號序列"的意思是指用于促進(jìn)宿主細(xì)胞分泌本發(fā)明的醛縮酶的分泌信號或其它功能域。所述信號序列可以源自于另一個醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)或非醛縮酶(如非丙酮酸醛縮酶,例如,非HMG和/或非KHG醛縮酶)(異源的)。在一些實施方式中,本發(fā)明提供了一種分離的、合成的或重組的核酸,該核酸含有編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性的多肽的序列,其中,所述序列不含有信號序列,且所述核酸含有本發(fā)明的序列。在一些實施方式中,本發(fā)明提供了一種分離的、合成的或重組的多肽,該多肽含有缺少了全部或部分信號序列的本發(fā)明多肽。在一些實施方式中,所述分離的、合成的或重組的多肽可以包括本發(fā)明的含有異源信號序列(如異源醛縮酶,例如,異源丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶的酶信號序列)的多肽或非醛縮酶的信號序列(如非丙酮酸醛縮酶,例如,非HMG和/或非KHG醛縮酶的酶信號序列)。在一些實施方式中,本發(fā)明提供了一種嵌合蛋白,該嵌合蛋白包括含有本發(fā)明的信號序列的第一區(qū)域和至少一個第二區(qū)域。所述蛋白可以為融合蛋白。所述第二區(qū)域可以含有酶。所述蛋白可以為非酶蛋白。本發(fā)明提供了一種嵌合多肽,該嵌合多肽包括至少一個第一區(qū)域和至少一個第二區(qū)域,所述第一區(qū)域含有本發(fā)明的信號肽(SP)、前序列(preprosequence)和/或催化功能域(CD),所述第二區(qū)域含有異源的多肽或肽,其中,所述異源的多肽或肽不必然地與所述信號肽(SP)、前序列(preprosequence)和/或催化功能域(CD)相關(guān)。在一些實施方式中,所述異源的多肽或肽不是醛縮酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶)。所述異源的多肽或肽可以為所述信號肽(SP)、前序列(preprosequence)禾口/或催化功能域(CD)的氨基末端、羧基末端或兩端。本發(fā)明提供了編碼嵌合多肽的分離的、合成的或重組的核酸,其中,所述嵌合多肽包括至少一個第一區(qū)域和至少一個第二區(qū)域,所述第一區(qū)域含有本發(fā)明的信號肽(SP)、前序列(preprosequence)和/或催化功能域(CD),所述第二區(qū)域含有異源的多肽或肽,其中,所述異源的多肽或肽不必然地與所述信號肽(SP)、前序列(preprosequence)和/或催化功能域(CD)相關(guān)。本發(fā)明提供了分離的、合成的或重組的信號序列(例如,信號肽),該信號序列含有具有以下殘基的序列或者由該序列所組成1至14、1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、l至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至4K1至42、1至43、1至44、1至45、1至46、或1至47個本發(fā)明的多肽的殘基,例如,本發(fā)明的多肽可以為SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:243SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDN0:403SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:l卯、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334。在一些實施例中,本發(fā)明提供了含有本發(fā)明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27328、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70個、或更多個氨基末端的信號序列。在一些實施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每亳克蛋白質(zhì)約10至約12000個單位的比活性。在其它的實施方式中,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白質(zhì)約1000至約10000個單位的比活性,或者每毫克蛋白質(zhì)約5000至約7500個單位。可選擇地,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白質(zhì)約10至約7500個單位的比活性,或者每毫克蛋白質(zhì)約5000至約12000個單位。在一些實施方式中,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白質(zhì)約10至約5000個單位的比活性,或每毫克蛋白質(zhì)約7500至約10000個單位。在其它的實施方式中,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白質(zhì)約10至約2500個單位的比活性??蛇x擇地,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白質(zhì)約10至約1000個單位的比活性。測量不同醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的典型的方法使用常規(guī)的基質(zhì),4-羧基-4-羥基-2-氧代己二酸("CHA")。典型的分析包括pH為7.5的50mM的磷酸鈉、lmM的MgCb、lmM的CHA、10嗎/ml的來自賴氏乳桿菌(丄ac,o6ac/〃M/e/c/zwam'z',Sigma-Aldrich,St.Louis,MO)的D-乳酸脫氫酶("LDH")、0.5mM的NADH。該測定通過加入待測量的酶開始。在340nm的分光光度計中連續(xù)地進(jìn)行丙酮酸的釋放、耦合形成NAD+。酶活性單位定義為釋放出的丙酮酸足以使340nm的吸光度以每分鐘IOD降低的量。在其它的實施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的耐熱性包括加熱到高溫后保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的比活性的至少一半,例如在約0。C至約20°C、約20。C至約37。C、約37。C至約5(TC、約5(TC至約70。C、約7(TC至約75。C、約75。C至約80。C、約80。C至約85。C、約85。C至約90。C、約90°C至約95。C、約95。C至約IO(TC、約IO(TC至約ll(TC,或更高的溫度??蛇x擇地,所述耐熱性可以包括在如上所述的高溫加熱后,比活性保持為每毫克蛋白質(zhì)約10至約12000個單位,或每毫克蛋白質(zhì)約5000至約10000個單位。在其它的實施方式中,所述耐熱性可以包括在如上所述的高溫加熱后,比活性保持為每毫克蛋白質(zhì)約10至約5000個單位。本發(fā)明提供了分離的、合成的或重組的本發(fā)明的多肽,其中,該多肽包括至少一個糖基化位點。在一些實施方式中,糖基化可以為N-連接型糖基化。在一些實施方式中,所述多肽可以在畢赤酵母(Ppwto/^)或粟酒裂殖酵母(S.戶m&)宿主中或在哺乳動物宿主細(xì)胞中表達(dá)后被糖基化。在一些實施方式中,所述多肽可以在具有約pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低的pH值的(更酸的)條件下保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在其它的實施方式中,所述多肽可以在具有約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5、或更高的pH值的(更堿的)條件下保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些實施方式中,所述多肽可以在暴露在具有約pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低的pH值的(更酸的)條件下后保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在其它的實施方式中,所述多肽可以在暴露在具有約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pHll.O、pH11.5、pH12、pH12.5、或更高的pH值的(更堿的)條件下后保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些實施方式中,本發(fā)明的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)在堿性條件下具有活性,例如,腸(例如小腸)的堿性環(huán)境。在一些實施方式中,所述多肽可以在暴露在胃的酸性pH后保持活性。本發(fā)明提供了含有本發(fā)明的多肽(包括肽)的蛋白質(zhì)制劑,其中,該蛋白質(zhì)制劑包括液體、固體或凝膠。在一些實施方式中,本發(fā)明提供了一種異源二聚體,該異源二聚體含有本發(fā)明的多肽和第二成員(例如多肽或其它(第二)區(qū)域)。所述異源二聚體的第二成員可以為不同的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)、不同的酶或其它蛋白質(zhì)。在一些實施方式中,所述第二區(qū)域可以為多肽,所述異源二聚體可以為融合蛋白。在一些實施方式中,所述第二區(qū)域可以為抗原決定簇或標(biāo)記。在一些實施方式中,本發(fā)明提供了含有本發(fā)明的多肽的同型多聚體,該同型多聚體包括,但不限于,同型二聚體、同型三聚體、同型四聚體、同型五聚體和同型六聚體。本發(fā)明提供了具有醛縮酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的固定化多肽(包括肽),其中,該固定化多肽包括本發(fā)明的多肽、由本發(fā)明的核酸編碼的多肽、或含有本發(fā)明的多肽和第二區(qū)域的多肽。在一些實施方式中,所述多肽可以被固定化在細(xì)胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、板、陣列或毛細(xì)管上。本發(fā)明還提供了含有本發(fā)明的固定化核酸(包括,例如本發(fā)明的探針)的陣列。在一些實施方式中,本發(fā)明還提供了含有本發(fā)明的抗體的陣列。本發(fā)明提供了分離的、合成的或重組的抗體,該抗體能夠與本發(fā)明的多肽或者能夠與由本發(fā)明的核酸編碼的多肽特異性結(jié)合。本發(fā)明的這些抗體可以為單克隆抗體或多克隆抗體。在一些實施方式中,本發(fā)明提供了含有本發(fā)明的抗體的雜種細(xì)胞,例如能夠與本發(fā)明的多肽或者與由本發(fā)明的核酸編碼的多肽特異性結(jié)合的抗體。在一些實施方式中,本發(fā)明提供了編碼這些抗體的核酸。本發(fā)明提供了具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的分離或識別方法,該方法包括(a)提供本發(fā)明的抗體;(b)提供含有多肽的樣品;和(c)在能夠使所述抗體與所述多肽特異性結(jié)合的條件下,使步驟(b)的樣品與步驟(a)的抗體接觸,從而對具有醛縮酶(如丙酮酸醛縮酶,例如,HMG禾口/或KHG醛縮酶)的酶活性的多肽進(jìn)行分離或識別。本發(fā)明提供了制備抗醛縮酶的抗體(如抗丙酮酸醛縮酶的抗體,例如,抗HMG和/或抗KHG醛縮酶的抗體)的方法,該方法包括以足以產(chǎn)生體液免疫響應(yīng)的量,對非人類動物給藥本發(fā)明的核酸或本發(fā)明的多肽或它們的子序列,從而制備抗醛縮酶的酶的抗體(如抗丙酮酸醛縮酶的抗體,例如,抗HMG和/或抗KHG醛縮酶的抗體)。在一些實施方式中,本發(fā)明提供了制備抗醛縮酶的抗體(如抗丙酮酸醛縮酶的抗體,例如,抗HMG和/或抗KHG醛縮酶的抗體)的方法,該方法包括以足以產(chǎn)生免疫響應(yīng)(細(xì)胞的或體液的)的量,對非人類動物給藥本發(fā)明的核酸或本發(fā)明的多肽或它們的子序列。本發(fā)明提供了生產(chǎn)重組多肽的方法,該方法包括以下步驟(a)提供能夠與啟動子可操作地連接的本發(fā)明的核酸;和(b)在允許該多肽表達(dá)的條件下使步驟(a)的核酸表達(dá)。在一些實施方式中,所述方法還可以包括用步驟(a)的核酸來轉(zhuǎn)化縮主細(xì)胞,然后使步驟(a)的核酸表達(dá),從而在轉(zhuǎn)化細(xì)胞中生產(chǎn)重組多肽。本發(fā)明提供了對具有醛縮酶(如丙酮酸醛縮酶,例如,HMG禾口/或KHG醛縮酶)的酶活性的多肽進(jìn)行識別的方法,該方法包括如下步驟(a)提供本發(fā)明的多肽、或由本發(fā)明的核酸編碼的多肽;(b)提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物;和(c)將步驟(a)的多肽或它們的片段或變體與步驟(b)的底物接觸,檢測底物量的減少或者反應(yīng)產(chǎn)物量的增多,其中,通過所述底物量的減少或者反應(yīng)產(chǎn)物量的增多,來檢測具有醛縮酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些實施方式中,所述底物為碳水化合物、含有碳水化合物的混合物和/或碳水化合物模擬物。本發(fā)明提供了用于對醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物進(jìn)行識別的方法,該方法包括如下步驟(a)提供本發(fā)明的多肽或由本發(fā)明的核酸編碼的多肽;(b)提供測試底物;和(c)將步驟(a)的多肽與步驟(b)的測試底物接觸,檢測底物量的減少或者反應(yīng)產(chǎn)物量的增多,其中,通過底物量的減少或者反應(yīng)產(chǎn)物量的增多來確定所述測試底物為醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物。本發(fā)明提供了用于確定測試化合物是否與多肽特異性結(jié)合的方法,該方法包括(a)在允許核酸轉(zhuǎn)譯為多肽的條件下,使核酸或含有核酸的載體表達(dá),其中,該核酸包括本發(fā)明的核酸,或者,提供本發(fā)明的多肽;(b)提供測試化合物;(c)將所述多肽與測試化合物接觸;(d)檢測步驟(b)的測試化合物是否與所述多肽特異性地結(jié)合。本發(fā)明提供了用于對醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性調(diào)節(jié)劑進(jìn)行識別的方法,該方法包括如下步驟(a)提供本發(fā)明的多肽或由本發(fā)明的核酸編碼的多肽;(b)提供測試化合物;(c)將步驟(a)的多肽與步驟(b)的測試化合物接觸,測量醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性,其中,在測試化合物的存在下測量的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性與測試化合物不存在下測量的酶活性相比發(fā)生改變,則說明測試化合物調(diào)節(jié)醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些實施方式中,可以通過提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),并檢測底物量的減少或反應(yīng)產(chǎn)物量的增多,或者,底物量的增多或反應(yīng)產(chǎn)物量的減少,來檢測所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。與不存在測試化合物的條件下的底物的量和反應(yīng)產(chǎn)物的量相比,存在測試化合物的條件下底物的量減少或反應(yīng)產(chǎn)物的量增多,則確定所述測試化合物為醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性活化劑。與不存在測試化合物的條件下的底物的量和反應(yīng)產(chǎn)物的量相比,存在測試化合物的條件下底物的量增多或反應(yīng)產(chǎn)物的量減少,則確定所述測試化合物為醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性抑制劑。本發(fā)明提供了包括處理器和數(shù)據(jù)存儲裝置的計算機系統(tǒng),其中,所述數(shù)據(jù)存儲裝置中存儲有本發(fā)明的多肽序列或核酸序列(例如,由本發(fā)明的核酸編碼的多肽或肽)。在一些實施方式中,所述計算機系統(tǒng)還可以包括數(shù)據(jù)比對系統(tǒng)和其中存儲有至少一個參考序列的數(shù)據(jù)存儲裝置。在其它的實施方式中,所述序列比對系統(tǒng)包括表現(xiàn)多態(tài)現(xiàn)象的計算機程序。在一些實施方式中,所述計算機系統(tǒng)還可以包括用于識別所述序列中的一個或多個特征的識別器。在一些實施方式中,本發(fā)明提供了其中存儲有本發(fā)明的多肽序列或核酸序列的計算機可讀的存儲材料。在一些實施方式中,本發(fā)明提供了用于鑒定序列中的特征的方法,該方法包括如下步驟(a)通過用于鑒定序列中的一個或多個特征的計算機程序來讀取序列,其中,該序列包括本發(fā)明提供的多肽序列或核酸序列;和(b)通過所述計算機程序來鑒定所述序列中的一個或多個特征。在一些實施方式中,本發(fā)明提供了用于將第一序列與第二序列進(jìn)行比較的方法,該方法包括如下步驟(a)通過使用比較序列的計算機程序來讀取第一序列和第二序列,其中,所述第一序列包括本發(fā)明提供的多肽序列或核酸序列;和(b)通過所述計算機程序來確定第一序列和第二序列之間的差異。該確定第一序列和第二序列之間的差異的步驟還可以包括對多態(tài)現(xiàn)象進(jìn)行識別的步驟。在一些實施方式中,所述方法還可以包括能夠識別序列中的一個或多個特征的識別器。在其它實施方式中,該方法還包括用計算機程序來讀取所述第一序列并對序列中的一個或多個特征進(jìn)行識別。本發(fā)明提供了用于從樣品(例如環(huán)境樣品)中分離或回收編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸的方法,該方法包括如下步驟(a)提供用于對編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸進(jìn)行擴增的擴增引物序列對,其中,該引物對能夠擴增本發(fā)明的核酸;(b)從樣品中分離核酸或處理該樣品使樣品中的核酸可以與所述擴增引物對雜交;和(c)使步驟(b)的核酸與步驟(a)的擴增引物對結(jié)合,并從樣品中擴增核酸,從而從樣品中分離或回收到編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸。所述擴增引物序列對的一個或各個成員可以含有寡核苷酸,該寡核苷酸包括本發(fā)明的擴增引物序列對,例如,具有至少約10至50個本發(fā)明序列的連續(xù)堿基。在本發(fā)明的一種實施方式中,所述樣品為環(huán)境樣品。本發(fā)明提供了用于從樣品(例如環(huán)境樣品)中分離或回收編碼具有醛縮酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸的方法,該方法包括如下步驟(a)提供含有本發(fā)明的核酸或其子序列的多核苷酸探針;(b)從樣品中分離核酸或處理該樣品使樣品中的核酸可以與步驟(a)的多核苷酸探針雜交;(c)使步驟(b)的核酸或處理后的樣品與步驟(a)的多核苷酸探針結(jié)合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,從而從樣品中分離或回收到編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸。所述樣品可以包括含水樣品、液態(tài)樣品、固態(tài)樣品、氣態(tài)樣品或生物樣品。在一些實施方式中,所述生物樣品可以來自細(xì)菌細(xì)胞、原生動物細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞、真菌細(xì)胞或哺乳動物細(xì)胞。在本發(fā)明的一種實施方式中,所述樣品為環(huán)境樣品。本發(fā)明提供了產(chǎn)生編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸的變體的方法,該方法包括如下步驟(a)提供含有本發(fā)明的核酸的模板核酸;和(b)在所述模板的序列中改變、缺失或添加一個或多個核苷酸,或者這些方式的組合,以產(chǎn)生所述模板核酸的變體。在一些實施方式中,所述方法還可以包括使變體核酸表達(dá),以產(chǎn)生變體醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的多肽。所述改變、添加或缺失可以通過包括錯配PCR、滑移、寡核苷酸定向突變、拼裝PCR、有性PCR突變、體內(nèi)突變、盒式突變、遞歸整體突變(recursiveensemblemutagenesis)、指類女整體突變(exponentialensemblemutagenesis)、位點特異性突變、基因重組、基因位點飽和誘變(GSSM)、合成連接重組(syntheticligationreassembly,SLR)、染色體飽和突變(CSM)或它們的組合的方法進(jìn)行。在其它的實施方式中,所述改變、添加或缺失可以通過包括重組、遞歸序列重組、磷代修飾的DNA突變、含尿嘧啶的模板突變、缺口二倍體突變(gappedduplexmutagenesis)、點錯配修復(fù)突變、缺失突變、限定選擇突變、限定純化突變、人工基因合成、整體突變、嵌合核酸多聚體形成和它們的組合的方法進(jìn)行。在一些實施方式中,所述方法可以循環(huán)重復(fù)直到產(chǎn)生出與由模板核酸編碼的多肽相比,具有改變的或不同的活性或改變的或不同的穩(wěn)定性的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)。在一些實施方式中,變體醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的多肽為熱穩(wěn)定性的,在暴露在高溫下之后保持一些活性。在其它的實施方式中,所述變體醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)與由模板核酸編碼的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)相比,具有增強的糖基化作用??蛇x擇地,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多肽在高溫下具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性,其中,由模板核酸編碼的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)在所述高溫下沒有活性。在一些實施方式中,所述方法可以循環(huán)重復(fù)直到產(chǎn)生出與模板核酸相比具有改變的密碼子用法的編碼序列的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)。在其它的實施方式中,所述方法可以循環(huán)重復(fù)直到產(chǎn)生出具有比模板核酸更高或更低水平的信息表達(dá)或穩(wěn)定性的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的基因。本發(fā)明提供了用于對編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密碼子進(jìn)行改變以增強它在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供本發(fā)明的編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸;和(b)識別步驟(a)的核酸中的非優(yōu)選的或較少優(yōu)選的密碼子,并將編碼相同氨基酸的優(yōu)選的或折中使用的密碼子作為替代密碼子,來代替非優(yōu)選的或較少優(yōu)選的密碼子,其中,所述優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的過表達(dá)的密碼子,所述非優(yōu)選的或較少優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的未充分表達(dá)的密碼子,因此,對核酸進(jìn)行改變能增強它在宿主細(xì)胞中的表達(dá)。本發(fā)明提供了用于對編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密碼子進(jìn)行改變的方法,該方法包括如下步驟(a)提供本發(fā)明的核酸;(b)識別步驟(a)的核酸中的密碼子,并使用編碼相同氨基酸的不同的密碼子作為替代密碼子來代替核酸中的密碼子,從而改變編碼醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的核酸中的密碼子。本發(fā)明提供了用于對編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密碼子進(jìn)行改變以減少它在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供本發(fā)明的編碼醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多肽的核酸;和(b)識別步驟(a)的核酸中的非優(yōu)選的或較少優(yōu)選的密碼子,并使用編碼相同氨基酸的優(yōu)選的或折中使用的密碼子作為替代密碼子來代替核酸中的非優(yōu)選的或較少優(yōu)選的密碼子,其中,所述優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的過表達(dá)的密碼子,所述非優(yōu)選的或較少優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的未充分表達(dá)的密碼子,因此,對所述核酸進(jìn)行改變能夠減少它在宿主細(xì)胞中的表達(dá)。本發(fā)明提供了用于對編碼具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密碼子進(jìn)行改變以降低它在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供本發(fā)明的核酸;(b)識別步驟(a)的核酸中的至少一個優(yōu)選的密碼子,并將編碼相同氨基酸的非優(yōu)選的或較少優(yōu)選的密碼子作為替代密碼子來代替它,其中,所述優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的過表達(dá)的密碼子,所述非優(yōu)選的或較少優(yōu)選的密碼子為宿主細(xì)胞的基因的編碼序列中的未充分表達(dá)的密碼子,因此,所述核酸的改變能降低它們在宿主細(xì)胞中的表達(dá)。在一些實施方式中,所述宿主細(xì)胞可以為細(xì)菌細(xì)胞、真菌細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞或哺乳動物細(xì)胞。本發(fā)明提供了產(chǎn)生編碼多個改良的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性位點或底物結(jié)合位點的核酸庫的方法,其中,改良的活性位點或底物結(jié)合位點來自于含有編碼第一活性位點或第一底物結(jié)合位點的序列的第一核酸,該方法包括如下步驟(a)提供編碼第一活性位點或第一底物結(jié)合位點的第一核酸,其中,所述第一核酸的序列包括在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的序列,且所述核酸能夠編碼醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性位點,或者能夠編碼醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物結(jié)合位點;(b)在第一核酸中的多個耙向密碼子中提供一系列用于編碼天然氨基酸變體的誘變寡核苷酸;(c)通過一系列的誘變寡核苷酸,在每個經(jīng)誘變處理的氨基酸密碼子上產(chǎn)生一系列由編碼多個氨基酸變體的變體核酸編碼的活性位點或底物結(jié)合位點,從而產(chǎn)生編碼多個改良的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性位點或底物結(jié)合位點的核酸庫。在一些實施方式中,該方法包括用如下方法誘變步驟(a)的第一核酸最佳定向進(jìn)化系統(tǒng)、基因位點飽和誘變(GSSM)、合成連接重組(syntheticligationreassembly,SLR)、錯酉己PCR、滑移、寡核苷酸定向突變、拼裝PCR、有性PCR突變、體內(nèi)突變、盒式突變、遞歸整體突變(recursiveensemblemutagenesis)、指數(shù)整體突變(exponentialensemblemutagenesis)、位點特異性突變、基因重組、和它們的組合。在其它的實施方式中,該方法包括用如下方法誘變步驟(a)的第一核酸或變體重組、遞歸序列重組、磷代修飾的DNA突變、含尿嘧啶的模板突變、缺口二倍體突變、點錯配修復(fù)突變、缺失突變、限定選擇突變、限定純化突變、人工基因合成、整體突變、嵌合核酸多聚體形成、和它們的組合。本發(fā)明提供了用于制備小分子的方法,該方法包括如下步驟(a)提供多種能夠合成或修飾小分子的生物合成酶,其中,這些酶中的一種包括由本發(fā)明的核酸編碼的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶);(b)提供用于步驟(a)中的至少一種酶的底物;和(c)在易于進(jìn)行多個生物催化反應(yīng)以生產(chǎn)小分子的條件下,通過一系列的生物催化反應(yīng)使步驟(b)的底物與所述酶反應(yīng)。在一些實施方式中,本發(fā)明提供了用于修飾小分子的方法,該方法包括如下步驟(a)提醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),其中,該酶含有本發(fā)明的多肽、或者由本發(fā)明的核酸編碼的多肽、或者它們的子序列;(b)提供小分子;和(c)在易于進(jìn)行由醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)催化的酶促反應(yīng)的條件下,使步驟(a)的酶與步驟(b)的小分子反應(yīng),從而通過醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶促反應(yīng)對小分子進(jìn)行修飾。在一些實施方式中,該方法包括多種用于步驟(a)的酶的小分子底物,從而產(chǎn)生通過至少一個由醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)催化的酶促反應(yīng)生成的修飾的小分子的庫。在一些實施方式中,所述方法可以包括在易于進(jìn)行由所述酶催化的多個生物催化反應(yīng)的條件下的多種額外的酶,以形成由多個酶促反應(yīng)產(chǎn)生的修飾的小分子的庫。在其它的實施方式中,所述方法還可以包括檢測所述庫的步驟,以確定所述庫中是否存在表現(xiàn)出所需活性的特定的修飾小分子。所述檢測步驟還可以包括通過對修飾小分子的部分中存在或不存在具有所需活性的特定的修飾小分子進(jìn)行檢測,并識別至少一種能夠生成具有所需活性的特定的修飾小分子的特定的生物催化反應(yīng),來系統(tǒng)地消除幾乎每一個的用于生成所述庫中的大量的修飾小分子的的部分的生物催化反應(yīng)。本發(fā)明提供了用于確定醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的功能性片段的方法,該方法包括(a)提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),其中所述醛縮酶含有本發(fā)明的多肽、或者由本發(fā)明的核酸編碼的多肽、或它們的子序列;和(b)從步驟(a)的序列中除去大量的氨基酸殘基,并檢測剩余序列的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性,從而確定醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的功能性片段。在一些實施方式中,通過提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物,并檢測所述底物的量的減少或反應(yīng)產(chǎn)物的量的增多來測定所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性。本發(fā)明提供了通過使用實時代謝流量分析的新的或改變的表型的全細(xì)胞工程方法,該方法包括如下步驟(a)通過改變細(xì)胞的遺傳成分來制備改變的細(xì)胞,其中,通過向細(xì)胞中加入本發(fā)明的核酸來改變所述遺傳成分;(b)培養(yǎng)所述改變的細(xì)胞以生成大量的改變的細(xì)胞;(c)通過實時監(jiān)測步驟(b)培養(yǎng)的細(xì)胞,來測量該細(xì)胞的至少一個代謝參數(shù);禾B(d)分析步驟(C)的參數(shù)以確定該測量參數(shù)是否與在相似條件下的未改變的細(xì)胞的比較測量的不同,從而通過使用實時代謝流量分析來識別細(xì)胞的工程化表型。在一些實施方式中,可以通過包括對細(xì)胞中的序列進(jìn)行消除或修改,或者敲除表達(dá)的基因的方法來改變所述細(xì)胞的遺傳組合物。在一些實施方式中,所述方法還可以包括選擇出含有新的工程化表型的細(xì)胞。在其它的實施方式中,所述方法可以包括對選擇的細(xì)胞進(jìn)行培養(yǎng),從而生成含有新的工程化表型的新的細(xì)胞株。本發(fā)明提供了增強醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的耐熱性或熱穩(wěn)定性的方法,該方法包括使醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的多肽糖基化,其中,所述多肽包括至少30個本發(fā)明的多肽或者由本發(fā)明的核酸序列編碼的多肽的連續(xù)的氨基酸,從而增強醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的耐熱性或熱穩(wěn)定性。在一些實施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的比活性可以在高于約37"C至約95。C的范圍內(nèi)的溫度下是熱穩(wěn)定的或耐熱的。本發(fā)明提供了用于在細(xì)胞中使重組體醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)過表達(dá)的方法,該方法包括表達(dá)包括含有本發(fā)明的核酸或者本發(fā)明的核酸序列的核酸的載體,其中,序列的同一性是通過序列比對分析或者通過視覺檢驗來確定的,其中,通過使用高活性的啟動子、雙順反子(dicistronic)載體或通過載體的基因擴增來實現(xiàn)過表達(dá)。本發(fā)明提供了制備轉(zhuǎn)基因植物的方法,該方法包括如下步驟(a)向細(xì)胞中引入異源的核酸序列,其中,所述異源的核酸序列包括本發(fā)明的核酸序列,從而制備轉(zhuǎn)基因的植物細(xì)胞;和(b)由所述轉(zhuǎn)基因細(xì)胞生產(chǎn)轉(zhuǎn)基因植物。在一些實施方式中,步驟(a)還可以包括通過對植物細(xì)胞原生質(zhì)體進(jìn)行電穿孔或顯微注射而引入異源的核酸序列。在其它的實施方式中,步驟(a)還可以包括通過DNA顆粒轟擊,直接向植物組織中引入異源的核酸序列。可選擇地,步驟(a)還可以包括使用根癌農(nóng)桿菌"graZacfen'MW/wme/ac/my)宿主向植物細(xì)胞DNA中引入異源的核酸序列。在一些實施例中,所述植物細(xì)胞可以為甘蔗、甜菜、大豆、蕃茄、馬鈴薯、玉米、稻、小麥、煙草或大麥的細(xì)胞。本發(fā)明提供了在植物細(xì)胞中表達(dá)異源核酸序列的方法,該方法包括如下步驟(a)使用能夠與啟動子可操作地連接的異源的核酸序列來轉(zhuǎn)化植物細(xì)胞,其中,所述異源核酸序列包括本發(fā)明的核酸;(b)在所述異源的核酸序列能夠在所述植物細(xì)胞中表達(dá)的條件下培育所述植物。在一些實施方式中,本發(fā)明提供了在植物細(xì)胞中表達(dá)異源核酸序列的方法,該方法包括如下步驟(a)使用能夠與啟動子可操作地連接的異源核酸序列來轉(zhuǎn)化植物細(xì)胞,其中,所述異源核酸序列包括本發(fā)明的序列;(b)在所述異源的核酸序列能夠在所述植物細(xì)胞中表達(dá)的條件下培育所述植物。本發(fā)明提供了飼料或食物,其中,該飼料或食物含有本發(fā)明的多肽或由本發(fā)明的核酸編碼的多肽。在一些實施方式中,本發(fā)明提供了含有本發(fā)明的多肽的食物、詞料、液體(例如,飲料,例如果汁或啤酒)、面包或面團(tuán)或面包產(chǎn)品、或飲料前體(例如麥芽汁)。在其它的實施方式中,本發(fā)明提供了含有本發(fā)明的多肽的食物、飼料或飲料添加劑。在一些實施方式中,本發(fā)明提供了例如用于人類或動物的含有本發(fā)明的多肽(例如,由本發(fā)明的核酸編碼的多肽)的食物或營養(yǎng)補品。在一些實施方式中,所述食物或營養(yǎng)補品中的多肽可以為糖基化的。在一些實施方式中,本發(fā)明提供了可食用的酶轉(zhuǎn)運基質(zhì)(enzymedeliverymatrices),其中,所述酶轉(zhuǎn)運基質(zhì)含有本發(fā)明的多肽,例如由本發(fā)明的核酸編碼的多肽。在一些實施方式中,所述轉(zhuǎn)運基質(zhì)包括小丸。在一些實施方式中,所述多肽可以為糖基化的。在一些實施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性為耐熱性的。在其它的實施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性為熱穩(wěn)定性的。本發(fā)明提供了含有本發(fā)明的多肽的食物、飼料或營養(yǎng)補品。在一些實施方式中,本發(fā)明提供了用于將醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)用作動物飲食的營養(yǎng)補品的方法,該方法包括制備含有包括至少30個本發(fā)明的多肽的連續(xù)氨基酸的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的營養(yǎng)補品;并將所述營養(yǎng)補品給食于動物。該動物可以為人類、反芻動物或單胃動物。所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)可以通過在有機體內(nèi)使編碼該醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多核苷酸表達(dá)來制備得到,所述有機體可以選自由桿菌、酵母、植物、昆蟲、真菌和動物所組成的組中。所述有機體可以選自由粟酒裂殖酵母(&pom6e)、釀酒酵母(5*.cwev/w'ae)、畢赤酵母(P/c/H'apaytonW大腸埃希氏菌(五.co//)、鏈霉菌(&^to/^c^sp.)、芽孢桿菌(5腦'〃Mssp)、假單胞菌(尸5e"(i畫owassp)、曲霉菌(爿,rg/〃wsp)禾口乳桿菌(Z^cto6a"7/附sp)。本發(fā)明提供了可食用的酶轉(zhuǎn)運基質(zhì),該酶轉(zhuǎn)運基質(zhì)含有熱穩(wěn)定性的重組的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),例如本發(fā)明的多肽。在一些實施方式中,本發(fā)明提供了用于向動物轉(zhuǎn)運醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)補品的方法,該方法包括制備小丸形式的可食用的酶轉(zhuǎn)運基質(zhì),該轉(zhuǎn)運基質(zhì)含有粒狀的載體和熱穩(wěn)定性的重組醛縮酶(如丙酮酸醛縮酶,例如,HMG禾B/或KHG醛縮酶),其中,所述小丸易于將其中含有的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)分散在水性介質(zhì)中;以及將所述可食用的酶轉(zhuǎn)運基質(zhì)給食于動物。所述重組的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)可以包括本發(fā)明的多肽。所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)可以被糖基化,以在成丸的條件下提供熱穩(wěn)定性。所述轉(zhuǎn)運基質(zhì)可以通過將含有胚顆粒和醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的混合物制成小丸而形成。所述成丸的條件可以包括施用蒸氣。所述成丸的條件可以包括在超過約8(TC的溫度施用約5分鐘,所述酶保持每毫克酶至少350至約900個單位的比活性。在一些實施方式中,本發(fā)明提供了含有本發(fā)明的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)或由本發(fā)明的核酸編碼的多肽的藥物組合物。在一些實施方式中,所述藥物組合物用作助消化藥。在一些實施方式中,在pH值為約3.0至約9.0、約3.0至約10.0、約3.0至約11.0或更多的pH值范圍內(nèi),使含有碳-碳鍵的化合物與具有醛縮酶活性(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶的酶活性)的本發(fā)明的多肽接觸。在其它的實施方式中,在至少約55。C、60°C、65°C、70°C、75°C、80°C、85°C、9(TC或更多的溫度下,使含有碳-碳鍵的化合物與具有醛縮酶活性(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶的酶活性)的本發(fā)明的多肽接觸。在其它產(chǎn)品中,本發(fā)明提供了用于促進(jìn)制備莫那亭、莫那亭衍生物、和它們的鹽的反應(yīng)過程的多肽,例如,在11-2-羥基-2-(吲哚-3基甲基)-4-酮戊二酸(也被稱作R-a酮酸莫那亭、R-莫那亭前驅(qū)體、R-MP和a酮酸形式的莫那亭,是一種特定的莫那亭立體異構(gòu)體(例如,R,R和S,R莫那亭)的前驅(qū)體)的制備過程中。本發(fā)明還提供了使用一種或多種本發(fā)明的多肽來制備莫那亭、莫那亭衍生物和鹽、以及它們的內(nèi)縮合產(chǎn)物的方法。合成R-MP、莫那亭的立體異構(gòu)體和/或莫那亭衍生物的立體異構(gòu)體的方法包括使用下述具有醛縮酶活性的多肽中的一種或多種SEQIDN0:2、SEQIDNO:4、SEQIDN0:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQI關(guān)0:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO龍SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDN〇:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDN0:312、SEQIDN0:314、SEQIDN0:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、禾BSEQIDNO:334、和它們的酶活性片段。所述合成R-MP、莫那亭的立體異構(gòu)體和/或莫那亭衍生物的立體異構(gòu)體的方法還可以包括使用由與本發(fā)明的核酸至少在約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更多個殘基的區(qū)域上具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91。/。、92%、93。/o、94%、95。/()、96%、97%、98%、99%、或更多、或全部(100%)的同一性的核酸序列編碼的具有醛縮酶特性的多肽,本發(fā)明的核酸包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDN0:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337禾卩SEQIDNO:338。此外,所述合成R-MP、莫那亭的立體異構(gòu)體和/或莫那亭衍生物的立體異構(gòu)體的方法還可以包括使用由在嚴(yán)格的條件下能夠與下列核酸雜交的核酸所編碼的具有醛縮酶活性的多肽SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。本發(fā)明提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的其鹽、以及它們的組合中的產(chǎn)物,其中,通過選自分離的或重組的多肽、或者所述多肽的具有醛縮酶活性的片段或子序列中的一種或多種多肽來促進(jìn)所述途徑中的反應(yīng),所述分離的或重組的多肽含有如下氨基酸序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:卯、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334。在一些實施方式中,所述它們的片段或子序列的醛縮酶活性至少為0.2mgMP/毫克蛋白質(zhì)/小時。在其它的實施方式中,所述它們的片段或子序列的醛縮酶活性至少為O.lmgMP/毫克蛋白質(zhì)/小時。在一些實施方式中,由本發(fā)明的一種或多種多肽所促進(jìn)的反應(yīng)在約1.0至約10.0mM的MgCl2中進(jìn)行。在其它實施方式中,由本發(fā)明的一種或多種多肽所促進(jìn)的反應(yīng)在約pH7.0至約pH11.5下進(jìn)行。在其它的實施方式中,由本發(fā)明的一種或多種多肽所促進(jìn)的反應(yīng)在約0.005%至約1%的聚山梨醇酯去污劑中進(jìn)行。在一些實施方式中,所述反應(yīng)為吲哚-3-丙酮酸和C3碳源之間的反應(yīng)。在一些實施方式中,相對于S-2-羥基-2-(吲哚-3-甲基)-4-谷氨酸,所述反應(yīng)優(yōu)先生成尺-2-羥基-2-(吲哚-3-甲基)-4-谷氨酸。在一些實施方式中,所述多步式途徑制得的產(chǎn)物為莫那亭、它的鹽、以及它們的組合。在其它的實施方式中,在所述多步式途徑中,R,R-莫那亭、R,S-莫那亭、或它們的組合中的至少一種的生成量既多于S,S-莫那亭,又多于S,R-莫那亭。在一些實施方式中,在該多步式途徑中,R,R-莫那亭的生成量多于R,S-莫那亭、S,S-莫那亭和S,R-莫那亭。本發(fā)明提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的其鹽、以及它們的組合中的產(chǎn)物,其中,通過由包括與以下核酸序列具有至少50%的序列同一性的序列的核酸序列所編碼的至少一種多肽來促進(jìn)所述途徑中的反應(yīng)SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338。在一些實施方式中,所述序列同一性的百分比為至少95。/。。在其它的實施方式中,所述序列同一性的百分比為100%。本發(fā)明提供了一種方法,該方法包括這樣的反應(yīng)相對于S-2-羥基-2-(吲哚-3-甲基)-4-谷氨酸,優(yōu)先生成R-2-羥基-2-(吲哚-3-甲基)-4-谷氮酸,其中,使用至少一種多肽來促進(jìn)所述多步式途徑中的反應(yīng),所述多肽由含有與如下序列具有至少95%的序列同一性的序列的核酸序列所編碼SEQIDNO:28、SEQIDNO:116、SEQIDNO:298、SEQIDNO:44、SEQIDNO:54、SEQIDNO:148、SEQIDNO:46、SEQIDNO:134、SEQIDNO:142、SEQIDNO:122、SEQIDNO:74、SEQIDNO:64、SEQIDNO:108、SEQIDNO:96、SEQIDNO:126、SEQIDNO:80、SEQIDNO:36、SEQIDNO:62、SEQIDNO:112、SEQIDNO:130、SEQIDNO:94、SEQIDNO:58、SEQIDNO:50、SEQIDNO:106、SEQIDNO:42、SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192、SEQIDNO:200、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQIDNO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240和SEQIDNO:156。本發(fā)明提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的鹽、以及它們的組合中的產(chǎn)物,其中,通過由包括在嚴(yán)格條件下與以下核酸序列雜交的序列的核酸序列所編碼的至少一種多肽來促進(jìn)所述途徑中的反應(yīng)SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337、或SEQIDNO:338。本發(fā)明還提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的鹽、以及它們的組合中的產(chǎn)物,其中,通過選自分離的或重組的多肽、或者所述多肽的具有醛縮酶活性的片段或子序列的一種或多種多肽,來促進(jìn)所述途徑中的反應(yīng),所述分離的或重組的多肽含有以下氨基酸序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334,其中,所述莫那亭前驅(qū)體、它的鹽、以及它們的組合是甜的。本發(fā)明另外提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的鹽、以及它們的組合中的產(chǎn)物,其中,所述途徑中的反應(yīng)被至少一種多肽所促進(jìn),該多肽由含有與如下序列具有至少50%的序列同一性的序列的核酸序列所編碼SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338,其中,所述莫那亭前驅(qū)體、它的鹽、以及它們的組合是甜的。本發(fā)明還提供了一種方法,該方法包括通過多步式途徑來制備選自莫那亭、莫那亭衍生物、它們的鹽、以及它們的組合中的產(chǎn)物,其中,所述途徑中的反應(yīng)被至少一種多肽所促進(jìn),該多肽由含有在嚴(yán)格的條件下與如下的核酸序列雜交的序列的核酸序列所編碼SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDN0:311、SEQIDN0:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338,其中,所述莫那亭前驅(qū)體、它的鹽、以及它們的組合是甜的。為了簡明,凡是在說明書和權(quán)利要求中鑒定了生成的中間物/產(chǎn)物(例如莫那亭、莫那亭前驅(qū)體或莫那亭衍生物)時,術(shù)語"和/或其鹽"應(yīng)該理解為在適用的情況下被包括在內(nèi)。換句話說,例如,短語"將吲哚-3-丙酮酸轉(zhuǎn)化為MP"應(yīng)該理解為"將吲哚-3-丙酮酸轉(zhuǎn)化為MP和/或其鹽"。事實上,常規(guī)技術(shù)人員會得知在反應(yīng)條件下實際上會生成所述中間物/產(chǎn)物的鹽。根據(jù)一些實施方式,所述方法生成了莫那亭或莫那亭衍生物組合物,其中,該組合物中的莫那亭或莫那亭衍生物成分僅包括R,R和R,S形式的莫那亭或莫那亭衍生物。當(dāng)使用術(shù)語"僅"時用于表明只形成該種異構(gòu)體,意思是如果不發(fā)生消旋作用,該途徑將只生成確定的異構(gòu)體。因此,術(shù)語"僅"不能理解為不存在其它的異構(gòu)體,而本領(lǐng)域技術(shù)人員可以理解,由于可能發(fā)生消旋作用,其它異構(gòu)體形式可以以相對少的量存在。根據(jù)一些實施方式,所述方法制備了一種組合物,其中,該組合物的莫那亭或莫那亭衍生物成分只包括R,R形式的莫那亭或莫那亭衍生物(除非一定程度的消旋化作用產(chǎn)生其它異構(gòu)體形式)。此處所用的術(shù)語"莫那亭組合物"的意思是包括莫那亭的一種或幾種異構(gòu)體的組合物,該術(shù)語還可以表示只是莫那亭的一種異構(gòu)體形式,而沒有其它的。此處所用的術(shù)語"莫那亭衍生物組合物"的意思是包括莫那亭衍生物的一種或幾種異構(gòu)體的組合物,該術(shù)語還可以表示只是莫那亭衍生物的一種異構(gòu)體形式,而沒有其它的。此處所用的術(shù)語"莫那亭衍生物"具有如下結(jié)構(gòu):其中,Ra、Rb、Re、Rd和Re各自獨立地表示選自氫原子、羥基、Cl-C3烷基、Cl-C3烷氧基、氨基或鹵原子(例如,碘原子、溴原子、氯原子或氟原子)中的取代基。但是,Ra、Rb、Rc、Rd和Re不同時全部為氫??蛇x擇地,Rb與Re禾口/或Rd與Re可以分別同時選自Cl-C4的烯基。此處所用的"取代的吲哚-3-丙酮酸"指的是吲哚-3-丙酮酸的吲哚環(huán)上的一個或幾個碳原子獨立地被以上定義的Ra、Rb、Rc、Rd和Re取代基中的一種或幾種取代。但是,Ra、Rb、Rc、Rd和Re不同時全部為氫。可選擇地,Rb與Rc禾口/或Rd與Re可以分別同時選自C1-C4的烯基。此處所用的"取代的色氨酸"指的是色氨酸的吲哚環(huán)上的一個或幾個碳原子獨立地被以上定義的Ra、Rb、Rc、Rd和Re取代基中的一種或幾種取代。但是,Ra、Rb、Re、Rd和Re不同時全部為氫??蛇x擇地,Rb與Re和/或Rd與Re可以分別同時選自Cl-C4的烯基。在一種實施方式中,所述取代的色氨酸含有與最終的莫那亭衍生物的吲哚環(huán)上相同的取代基。此外,此處所描述的用于制備莫那亭的生物合成途徑,可以應(yīng)用取代的色氨酸來生成可能有甜味的莫那亭衍生物。在一些實施方式中,此處所描述的用于所述生物合成途徑的取代的色氨酸包括氯化色氨酸和5-羥基色氨酸。例如,與R,R莫那亭具有相似結(jié)構(gòu)的氯化D-色氨酸已經(jīng)被確認(rèn)為沒有營養(yǎng)的甜味劑(特別是6-氯-D-色氨酸)。同樣地,發(fā)現(xiàn)鹵代的和羥基取代的莫那亭也是甜的。美國公開專利申請No.2005/0118317。鹵素或羥基可以被氫取代,特別是在色氨酸的吲哚的苯環(huán)的1-4位上,而不影響隨后轉(zhuǎn)化為D-或L-色氨酸、B引噪-3-丙酮酸、MP或莫那亭。文獻(xiàn)表明,取代的吲哚適于用作PLP-酶的底物,并且生產(chǎn)出了取代的色氨酸。Fukuda、D.S.等的"通過發(fā)酵制備取代的L-色氨酸(ProductionofSubstitutedL-TryptophansbyFermentation)",智/.£腦'證M.c油b/"21:841-43(1971)。所述卣原子沒有表現(xiàn)出對色氨酸合酶P取代催化機制具有空間位阻,并且不影響對映特異性。在本發(fā)明的一些實施方式中,提供了一種用于制備莫那亭組合物的方法,該方法包括由L-色氨酸制備吲哚-3-丙酮酸、由吲哚-3-丙酮酸制備2-羥基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驅(qū)體"或"MP")和由MP制備莫那亭。由L-色氨酸制備吲哚-3-丙酮酸的反應(yīng),被對L-色氨酸比對R-MP、R,R莫那亭或全部具有更強特異性的、更強活性的酶所促進(jìn)。根據(jù)該實施方式,吲哚-3-丙酮酸的反應(yīng)被具有R-特異性的醛縮酶活性的酶所促進(jìn),從而生成R-MP。根據(jù)該實施方式,提供了一種消旋酶,該消旋酶能夠促進(jìn)所述色氨酸反應(yīng)的氨基酸副產(chǎn)物從一種異構(gòu)體形式變?yōu)榱硪环N異構(gòu)體形式的差向異構(gòu)化。在本發(fā)明的一些實施方式中,提供了一種制備莫那亭組合物的方法,該方法包括由L-色氨酸制備吲哚-3-丙酮酸、由吲哚-3-丙酮酸制備2-羥基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驅(qū)體"或"MP")和由MP制備莫那亭。由L-色氨酸制備吲哚-3-丙酮酸的反應(yīng),被對L-色氨酸比對R-MP、R,R莫那亭或全部具有更強特異性的和更強活性的酶所促進(jìn)。由MP生成莫那亭的反應(yīng)被一種酶所促進(jìn),該酶對R-MP具有立體選擇性。術(shù)語"立體選擇性"指的是一種酶對一種異構(gòu)體比對另一種異構(gòu)體具有更強的特異性和更強的活性——此處指R-MP相對于S-MP。在優(yōu)選的實施方式中,立體選擇性的酶對一種異構(gòu)體與另一種異構(gòu)體相比具有限定的活性。"限定的"活性指的是最低程度的或表現(xiàn)不出來的活性,例如,和此處提供的實施方式的定義一樣。需要注意的是,在涉及一系列反應(yīng)時(例如前述的段落),本發(fā)明不需要每個步驟都明確地進(jìn)行,這些步驟可以暗含地進(jìn)行就足夠了。換句話說,例如,包括由L-色氨酸制備吲哚-3-丙酮酸、由剛哚-3-丙酮酸制備2-羥基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驅(qū)體"或"MP")和由MP制備莫那亭的制備莫那亭的過程,其中,各個反應(yīng)被適當(dāng)?shù)拿杆龠M(jìn),可以通過在設(shè)定條件下將L-色氨酸與酶結(jié)合,這樣列舉的反應(yīng)就可以發(fā)生。在這樣的例子中,L-色氨酸可以反應(yīng)生成吲哚-3-丙酮酸,由L-色氨酸反應(yīng)生成的吲哚-3-丙酮酸可以反應(yīng)生成MP,由B引哚-3-丙酮酸反應(yīng)生成的MP可以反應(yīng)生成莫那亭。例如,所述方法還可以通過下述方法進(jìn)行提供能夠制備L-色氨酸的化合物,在適于L-色氨酸生成反應(yīng)發(fā)生的條件下將所述化合物與促進(jìn)這一系列反應(yīng)發(fā)生的酶混合。另一個例子,所述方法可以通過下述方法進(jìn)行提供在基因水平上設(shè)計的微生物,以根據(jù)所述途徑生成莫那亭,提供適宜發(fā)生發(fā)酵過程的條件。例如,可以在基因水平上設(shè)計易于生成大量L-色氨酸的微生物,以制備或過量地制備一種或多種用于促進(jìn)制備莫那亭的途徑的酶,并且提供適當(dāng)?shù)臈l件,這樣所述微生物將生成莫那亭。在本發(fā)明的其它實施方式中,提供了制備莫那亭的方法,其中,在L-色氨酸轉(zhuǎn)化為吲哚-3-丙酮酸時,底物生成L-氨基酸,吲哚-3-丙酮酸反應(yīng)形成MP(可以包括R-MP和S-MP,優(yōu)選只包括R-MP或主要為R-MP),在R-MP轉(zhuǎn)化為R,R莫那亭時,所述L-氨基酸反應(yīng)再生成(也稱為"循環(huán)")底物。由R-MP生成R,R莫那亭的反應(yīng),被立體轉(zhuǎn)化轉(zhuǎn)氨酶(例如D-蛋氨酸轉(zhuǎn)氨酶,EC2.6丄41)或者具有D-苯基甘氨酸轉(zhuǎn)氨酶活性的酶所促進(jìn)。在本發(fā)明的其它實施方式中,提供了制備莫那亭的方法,其中,包括由L-色氨酸制備D-色氨酸、由D-色氨酸制備吲哚-3-丙酮酸、由吲哚-3-丙酮酸制備R-MP和由R-MP制備R,R莫那亭。由L-色氨酸制備D-色氨酸的反應(yīng)被色氨酸消旋酶及其功能等價物所促進(jìn)。在該實施方式中,由D-色氨酸生成B引哚-3-丙酮酸的反應(yīng)和由MP生成莫那亭的反應(yīng)被同樣的酶所促進(jìn)。在其它的實施方式中,吲哚-3-丙酮酸的反應(yīng)被具有R-特異性醛縮酶活性的酶所促進(jìn),從而形成R-MP,由D-色氨酸生成吲哚-3-丙酮酸的反應(yīng)和由R-MP生成R,R莫那亭的反應(yīng)被同樣的酶所促進(jìn)。在本發(fā)明的一些實施方式中,提供了用于制備莫那亭衍生物的方法,該方法包括由取代的吲哚-3-丙酮酸和丙酮酸制備莫那亭衍生物,使用具有R-特異性醛縮酶活性的酶來催化該反應(yīng)。在下面的附圖中列出了本發(fā)明的一種或幾種實施方式的詳細(xì)情況。通過說明書、附圖和權(quán)利要求,可以看出本發(fā)明的其它特征、目的和優(yōu)點。從此處的描述中應(yīng)該意識到,本發(fā)明可以有各種改變的實施方式,而不偏離本發(fā)明的精神范圍。因此,所述附圖和具體說明應(yīng)被視為說明性的,而不是限制性的。在所有情況下,在此引用的所有出版物、專利、專利申請、GenBank序列和ATCC保藏一并被引用作為參考。下面的附圖用于說明本發(fā)明的實施方式,而不是限定本發(fā)明的范圍,本發(fā)明的范圍由權(quán)利要求限定。圖1是表示本發(fā)明的用于由L-色氨酸制備R,R莫那亭的酶化方法的實施例的流程圖。在這個實施例中,該方法包括在L-色氨酸反應(yīng)中使用對作為底物的L-色氨酸比對R-MP具有更強的特異性和/或選擇性的L-轉(zhuǎn)氨酶(例子包括L-色氨酸轉(zhuǎn)氨酶、L-芳香族轉(zhuǎn)氨酶、L-天冬氨酸轉(zhuǎn)氨酶和L-丙氨酸轉(zhuǎn)氨酶),和/或該方法包括使用對作為底物的R,R莫那亭具有限定的活性和/或特異性的L-氨基酸氧化酶。在圖1表示的特定的實施例中,L-轉(zhuǎn)氨酶或L-氨基酸氧化酶將L-色氨酸轉(zhuǎn)化為吲哚-3-丙酮酸,吲哚-3-丙酮酸與R-特異性醛縮酶和丙酮酸反應(yīng)生成R-a-酮酸莫那亭(R-MP),然后用D-轉(zhuǎn)氨酶或D-氨基酸脫氫酶將R-MP轉(zhuǎn)化為R,R莫那亭。如圖1所示,反應(yīng)是可逆的,但是為了本發(fā)明的目的,不需要反應(yīng)向反方向進(jìn)行。圖2是表示本發(fā)明的用于制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括使用對R-MP有立體選擇性的酶,將R-MP轉(zhuǎn)化為莫那亭。在圖2所示的特定的實施例中,在一個可逆反應(yīng)中將色氨酸轉(zhuǎn)化為吲哚-3-丙酮酸。吲哚-3-丙酮酸可以與非立體特異性的醛縮酶可逆地反應(yīng)生成ot-酮酸莫那亭(R-和S-MP都有)。用立體選擇性的D-轉(zhuǎn)氨酶或立體選擇性的D-氨基酸脫氫酶,將R-MP轉(zhuǎn)化為R,R莫那亭。如果使用立體選擇性的D-轉(zhuǎn)氨酶或立體選擇性的D-氨基酸脫氫酶,則用非立體特異性醛縮酶生成的任何S-MP均可以轉(zhuǎn)化變回吲哚-3-丙酮酸。為了本發(fā)明的目的,不需要表示為可逆的反應(yīng)向反方向進(jìn)行。圖3是表示本發(fā)明的用于制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括使用色氨酸消旋酶,并使用與形成吲哚-3-丙酮酸的反應(yīng)相偶合的反應(yīng)中的D-氨基酸產(chǎn)物,使L-色氨酸轉(zhuǎn)化為D-色氨酸,所述吲哚-3-丙酮酸在與生成R,R莫那亭的反應(yīng)相偶合的反應(yīng)中作為底物。在圖3所示的特定的實施例中,在一個可逆反應(yīng)中用色氨酸消旋酶將L-色氨酸轉(zhuǎn)化為D-色氨酸。使D-色氨酸與ot-酮戊二酸(a-KG)和廣泛特異性的D-轉(zhuǎn)氨酶反應(yīng),以生成吲哚-3-丙酮酸和D-谷氨酸。B引哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶反應(yīng)并被轉(zhuǎn)化為R-ot-酮酸莫那亭(R-MP);R-MP與廣泛特異性的D-轉(zhuǎn)氨酶和D-谷氨酸反應(yīng),以生成R,R莫那亭和ot-酮戊二酸(a-KG)。如圖3所示,各個反應(yīng)都是可逆的,但是為了本發(fā)明的目的,不需要反應(yīng)向反方向進(jìn)行。圖4是表示本發(fā)明的用于由L-色氨酸制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括在與L-色氨酸的反應(yīng)相偶合的反應(yīng)中將L-氨基酸轉(zhuǎn)化為D-氨基酸,這個D-氨基酸用作將R-MP轉(zhuǎn)化為R,R莫那亭的反應(yīng)的氨基供體。在圖4所示的特定的實施例中,L-色氨酸與L-轉(zhuǎn)氨酶和(x-酮戊二酸反應(yīng),以生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶反應(yīng)并轉(zhuǎn)化為R-ct-酮酸莫那亭(R-MP);R-MP與廣泛特異性的D-轉(zhuǎn)氨酶和D-谷氨酸反應(yīng),以生成R,R莫那亭和a-酮戊二酸。如圖4所示,各個反應(yīng)都是可逆的,但是為了本發(fā)明的目的,不需要反應(yīng)向反方向進(jìn)行。圖5是表示本發(fā)明的用于由L-色氨酸制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括用立體轉(zhuǎn)化酶來促進(jìn)由R-MP向R,R莫那亭的轉(zhuǎn)化,這樣在與L-色氨酸的反應(yīng)相偶合的反應(yīng)中生成的L-氨基酸可以用作與由R-MP到R,R莫那亭的反應(yīng)相匹配的反應(yīng)的底物。在圖5所示的特定的實施例中,L-色氨酸與L-轉(zhuǎn)氨酶和草酰乙酸、丙酮酸或(X-酮戊二酸((x-KG)反應(yīng),生成吲哚-3-丙酮酸和L-天冬氨酸(如果使用草酰乙酸)、L-丙氨酸(如果使用丙酮酸)或L-谷氨酸(如果使用a-KG)。吲哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶反應(yīng)并轉(zhuǎn)化為R-a-酮酸莫那亭(R-MP),R-MP與立體轉(zhuǎn)化轉(zhuǎn)氨酶和L-天冬氨酸、L-丙氨酸或L-谷氨酸反應(yīng),以生成R,R莫那亭和草酰乙酸(如果使用L-天冬氨酸)、丙酮酸(如果使用L-丙氨酸)或cc-酮戊二酸((x-KG,如果使用L-谷氨酸)。如圖5所示,各個反應(yīng)都是可逆的,但是為了本發(fā)明的目的,不需要反應(yīng)向反方向進(jìn)行。圖6是表示本發(fā)明的用于制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括通過在R-MP經(jīng)過一系列轉(zhuǎn)化反應(yīng)生成R,R莫那亭的反應(yīng)中用作反應(yīng)物的D-氨基酸,回收在生成吲哚-3-丙酮酸的反應(yīng)中生成的L-氨基酸。在圖6所示的特定的實施例中,L-色氨酸與L-轉(zhuǎn)氨酶和草酰乙酸可逆地反應(yīng),生成吲哚-3-丙酮酸和L-天冬氨酸。fl引哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶以可逆的形式反應(yīng)并轉(zhuǎn)化為R-a-酮酸莫那亭(R-MP),R-MP與D-轉(zhuǎn)氨酶和D-丙氨酸可逆地反應(yīng),以生成R,R莫那亭和丙酮酸。用天冬氨酸-4-脫羧酶將L-天冬氨酸轉(zhuǎn)化為L-丙氨酸和C02。用丙氨酸消旋酶將L-丙氨酸轉(zhuǎn)化為D-丙氨酸。為了本發(fā)明的目的,不需要表示為可逆的反應(yīng)向反方向進(jìn)行。圖7是表示本發(fā)明的用于制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括通過將該反應(yīng)的L-氨基酸副產(chǎn)物轉(zhuǎn)化為另一種產(chǎn)品,來促進(jìn)L-色氨酸反應(yīng)的進(jìn)行(例如,將反應(yīng)控制為向生成吲哚-3-丙酮酸的方向進(jìn)行)。在這個實施例中,使用脫羧酶在可逆反應(yīng)中將L-氨基酸和L-天冬氨酸副產(chǎn)物轉(zhuǎn)化為L-丙氨酸。在圖7所示的特定的實施例中,L-色氨酸與L-轉(zhuǎn)氨酶和ct-酮戊二酸(a-KG)或草酰乙酸可逆地反應(yīng),生成口引哚-3-丙酮酸和L-谷氨酸(如果使用a-KG)或L-天冬氨酸(如果使用草酰乙酸)。吲哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶可逆地反應(yīng)并被轉(zhuǎn)化為R一a-酮酸莫那亭(R-MP)。R-MP與D-轉(zhuǎn)氨酶和D-氨基酸以可逆的形式反應(yīng)而生成R,R莫那亭和草酰乙酸、丙酮酸或a-KG中的一種。用谷氨酸脫羧酶或天冬氨酸-4-脫羧酶將L-氨基轉(zhuǎn)移反應(yīng)的產(chǎn)物L(fēng)-谷氨酸或L-天冬氨酸轉(zhuǎn)化為4-氨基丁酸和C02(如果底物為L-谷氨酸),或者轉(zhuǎn)化為(3-丙氨酸和C02(如果底物為L-天冬氨酸)。為了本發(fā)明的目的,不需要表示為可逆的反應(yīng)向反方向進(jìn)行。圖8是表示本發(fā)明的用于制備R,R莫那亭的另一個方法的實施例的流程圖。在這個實施例中,該方法包括通過將氨基酸用作通過一系列轉(zhuǎn)化反應(yīng)的R-MP反應(yīng)的反應(yīng)物,來回收L-色氨酸反應(yīng)的氨基酸副產(chǎn)物。在圖8所示的特定的實施例中,L-色氨酸與L-轉(zhuǎn)氨酶和oc-酮戊二酸(a-KG)可逆地反應(yīng),生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸與丙酮酸和R-特異性醛縮酶可逆地反應(yīng)并轉(zhuǎn)化為R-a-酮酸莫那亭(R-MP)。R-MP與D-轉(zhuǎn)氨酶和D-丙氨酸可逆地反應(yīng),以生成R,R莫那亭和丙酮酸。使用L-丙氮酸轉(zhuǎn)氨酶和丙酮酸將L-氨基轉(zhuǎn)移反應(yīng)的產(chǎn)物L(fēng)-谷氨酸可逆地轉(zhuǎn)化回oc-KG,L-丙氨酸為副產(chǎn)物。用丙氨酸消旋酶將L-丙氨酸可逆地轉(zhuǎn)化為用于第三個反應(yīng)(D-氨基轉(zhuǎn)移反應(yīng))的D-氨基酸。為了本發(fā)明的目的,不需要表示為可逆的反應(yīng)向反方向進(jìn)行。圖9為計算機系統(tǒng)的結(jié)構(gòu)圖。圖10是表示用于對新的核苷酸或蛋白質(zhì)序列與序列數(shù)據(jù)庫進(jìn)行比較以確定所述新的序列與數(shù)據(jù)庫中的數(shù)據(jù)的同源性水平的方法的一種實施方式的流程圖。圖11是表示計算機中的用于確定兩個序列是否同源的方法的一種實施方式的流程圖。圖12是表示用于檢測序列中存在特征的識別方法300的一種實施方式的流程圖。圖13和14一同表示用LC/MS/MS測量的在莫那亭前驅(qū)體(MP)的形成中58種不同的醛縮酶(各自由其SEQID號碼確定)的活性。圖15表示二硫蘇糖醇在通過SEQIDNO:88的具有醛縮酶活性的多肽生成莫那中的作用。不同圖中的相同的附圖標(biāo)記表示相同的元素。具體實施例方式上文己描述了大量的實施方式,將在下文詳細(xì)地描述這些實施方式。本發(fā)明的實施方式包括一種或多種所述的方面。縮寫和術(shù)語下文對術(shù)語和方法進(jìn)行解釋是為了更好地描述本發(fā)明的公開內(nèi)容,并為本領(lǐng)域的技術(shù)人員提供實施本發(fā)明的公開內(nèi)容的指導(dǎo)。本文中使用的"包括"意指"包含"。此外,除非上下文明確指明,單數(shù)形式的"一個"或"所述"包括所提及物的復(fù)數(shù)。例如,提及的"包括蛋白"意指包括所述蛋白的一種或多種;提及的"包括所述細(xì)胞"意指包括一種或多種細(xì)胞以及本領(lǐng)域公知的它們的等效物等等。術(shù)語"約"包括存在任何測量中的實驗誤差范圍。除非另有說明,即使沒有明確地使用"約"一詞,所有的檢測數(shù)值應(yīng)當(dāng)認(rèn)為在檢測數(shù)值前具有"約"一詞的意義。保守取代在多肽中用一種氨基酸取代另一種氨基酸,并且這種取代對所述多肽的活性幾乎沒有影響。所述取代是保守的而不依賴于交換的氨基酸在結(jié)構(gòu)上或在功能上是否為相似的。例如,理想狀態(tài)下,包括一種或多種保守取代的色氨酸轉(zhuǎn)氨酶多肽保持色氨酸轉(zhuǎn)氨酶的活性。可以通過使用例如標(biāo)準(zhǔn)的方法(如點突變或者PCR或者本領(lǐng)域技術(shù)人員公知的方法)操作編碼所述肽的核苷酸序列,以制備含有一種或多種保守取代的多肽??梢匀〈鞍踪|(zhì)中的原始氨基酸,并且如果這種取代對所述多肽的活性幾乎沒有影響時,則可以認(rèn)為是保守取代,能夠用于取代蛋白質(zhì)中的原始氨基酸的氨基酸的非限制性實例包括用絲氨酸或者蘇氨酸取代丙氨酸;用谷氨酰胺、組氨酸或者賴氨酸取代精氨酸;用谷氨酸、谷氨酰胺、賴氨酸、組氨酸、天冬氨酸取代天冬酰胺;用天冬酰胺、谷氨酸或谷氨酰胺取代天冬氨酸;用絲氨酸或丙氨酸取代半胱氨酸;用天冬酰胺、谷氨酸、賴氨酸、組氨酸、天冬氨酸或精氨酸取代谷氨酰胺;用天冬酰胺、谷氨酰胺、賴氨酸或者天冬氨酸取代谷氨酸;用脯氨酸取代甘氨酸;用天冬酰胺、賴氨酸、谷氨酰胺、精氨酸、酪氨酸取代組氨酸;用亮氨酸、蛋氨酸、纈氨酸、苯丙氨酸取代異亮氨酸;用異亮氨酸、蛋氨酸、纈氨酸、苯丙氨酸取代亮氨酸;用天冬酰胺、谷氨酸、谷氨酰胺、組氨酸、精氨酸取代賴氨酸;用異亮氨酸、亮氨酸、纈氨酸、苯丙氨酸取代蛋氨酸;用色氨酸、酪氨酸、蛋氨酸、異亮氨酸或亮氨酸取代苯丙氨酸;用蘇氨酸、丙氨酸取代絲氨酸;用絲氨酸或者丙氨酸取代蘇氨酸;用苯丙氨酸、酪氨酸取代色氨酸;用組氨酸、苯丙氨酸或色氨酸取代酪氨酸;和用蛋氨酸、異亮氨酸、亮氨酸取代纈氨酸。在其它地方還可以找到關(guān)于保守取代的信息,如Ben-Bassat等(J.Bacteriol.169:751-7,1987)、O'Regan等(Gene77:237-51,1989)、Sahin-Toth等(ProteinSci3:240-7,1994)、Hochuli等(Bio/Technology6:1321-5,1988)、WO00/67796(Curd等)遺傳學(xué)和分子生物學(xué)的標(biāo)準(zhǔn)教科書中。衍生的對于說明書和權(quán)利要求,如果下述條件中的一種或多種成立的話,一種物質(zhì)是從生物體或來源中衍生的1)所述物質(zhì)存在于所述生物體/來源中;2)所述物質(zhì)從天然的宿主中分離出;或者3)所述物質(zhì)從天然的宿主中分離出并且通過例如誘變而被發(fā)展。分離的本文中使用的術(shù)語"分離的"是指從天然宿主中分離的任何物質(zhì);所述物質(zhì)不需要純化。例如"分離的核酸"是指天然存在的核酸,該天然存在的核酸不直接地與在它們所源自生物體的天然存在的基因組中與它們直接連接的兩條序列相連(一條在5'末端,另一條在3'末端)。例如,分離的核酸可以是,但不限于,任何長度的重組DNA分子,條件是通常直接連接于在天然存在的基因組中的重組DNA分子的核酸序列中的一條被去除掉或者缺失。因此,分離的核酸包括但不限于不依賴于其它序列的以單獨的分子(如通過PCR或者限制性核酸內(nèi)且酶處理制備的cDNA或者基因組DNA片段)形式存在的重組DNA以及插入到載體中的重組DNA、能自主復(fù)制的質(zhì)粒、病毒(例如,逆轉(zhuǎn)錄病毒、腺病毒或者皰疹病毒)、或者整合到原核生物或者真核生物的基因組DNA中的DNA。此外,分離的核酸可以包括作為雜交的或者融合的核酸序列的一部分的重組DNA分子。本文所使用的術(shù)語"分離的"意指從最初環(huán)境中(如果是天然存在的話就是天然環(huán)境)分離的材料(如本發(fā)明的蛋白質(zhì)或者核酸)。例如,存在于活體動物中的天然存在的多核苷酸或者多肽不是分離的,但是所述多核苷酸或者多肽從一部分或者全部的天然體系中的共存材料中分離后則是分離的。這種多核苷酸可以是載體的一部分,和/或這種多核苷酸或者多肽可以是組分的部分并且還是分離的,因為所述載體或組分不是其天然環(huán)境中的部分。本文中涉及核酸時所使用的術(shù)語"分離的"還包括任何天然存在的核酸,因為在天然環(huán)境中不能找到非天然存在的核酸,并且非天然存在的核酸不具有在天然存在的基因組中直接連接的序列。例如,非天然存在的核酸如工程核酸被認(rèn)為是分離的核酸??梢圆捎闷胀ǖ姆肿涌寺〖夹g(shù)或者核酸的化學(xué)合成技術(shù)制備工程。分離的非天然存在的核酸可以是不依賴于其它序列的核酸,或者插入到載體中的核酸、能自主復(fù)制的質(zhì)粒、病毒(例如,逆轉(zhuǎn)錄病毒、腺病毒或者皰疹病毒)、或者整合到原核生物或者真核生物的基因組中的DNA。此外,分離的核酸可以包括雜交的或者融合的核酸序列的一部分的重組DNA分子。純化本文中所術(shù)語的術(shù)語"純化"不需要絕對的純度,是相對的術(shù)語。因此,例如,純化的多肽或者核酸制品可以是所述多肽或者核酸的濃度比存在于生物體內(nèi)的天然環(huán)境中的所述多肽或者核酸的濃度高,或者比所述多肽或者核酸在分離的環(huán)境中的濃度高。從文庫中獲得的單獨的核酸通常純化到電泳純(dectrophoretichomogeneity)。從克隆中獲得的序列不能直接從文庫或者總的人DNA中獲得。本發(fā)明中的純化的核酸是從生物體的基因組DNA的剩余物中純化的,其純度提高至少10^1(^倍。在一些實施方式中,術(shù)語"純化"是從基因組DNA的剩余物中或者從文庫的其它序列中或者其它環(huán)境中純化的核酸,核酸的純度提高至少一個數(shù)量級,例如,在一些實施方式中,為兩個或者三個數(shù)量級或者四個或者五個數(shù)量級。氨基酸本文中所使用的"氨基酸"或者"氨基酸序列"是指寡肽、肽、多肽或者蛋白質(zhì)序列,或者指前述的任何一種的片段、部分或者亞單位,以及天然存在的或者合成的分子。"氨基酸"或者"氨基酸序列"包括寡肽、肽、多肽或者蛋白質(zhì)序列,或者指前述的任何一種的片段、部分或者亞單位,以及天然存在的或者合成的分子。本文中所使用的術(shù)語"多肽"是指通過肽鍵或者修飾的肽鍵相互連接的氨基酸,即,肽的等排物(petedeisoteres);多肽可以包括除編碼基因的20種氨基酸外的修飾的氨基酸。所述多肽可以通過天然的過程(如翻譯后的過程)或者通過本領(lǐng)域公知的化學(xué)修飾技術(shù)來進(jìn)行修飾。所述修飾可以存在于多肽的任何部位,包括主鏈、氨基酸側(cè)鏈和氨基或羧基的末端??梢岳斫獾氖?,在給定的肽中的不同位點可以存在相同程度的或者不同程度的同類型的修飾。而且,給定的多肽中可以具有多種不同的修飾。所述修飾包括乙酰化、?;?、ADP-核糖基化、氨基化、共價連接黃素、共價連接血紅素、共價連接核苷或者核苷衍生物、共價連接脂質(zhì)或者脂質(zhì)衍生物、共價連接磷脂酰肌醇、交叉鏈接環(huán)化、形成二硫鍵、去甲基化、形成共價交叉鏈接、形成半胱氨酸、形成焦谷氨酸(pyroglutamate)、甲酸化、y-羧基化、糖基化、糖基磷脂酰肌醇錨著點的形成(GPIanchorformation)、羥基化、碘化、甲基化、豆蔻?;?myristolyation)、氧化、聚乙二醇化(pegylation)、葡聚糖水解過程、異戊二烯化、外消旋化、硒化(selenoylation)、硫酸化和轉(zhuǎn)移RNA介導(dǎo)的在蛋白質(zhì)上添加氨基酸如精氨酸化(見Creighton,T.E.,Proteins—StructureandMolecularProperties2ndEd.,W.H.FreemanandCompany,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,pp.1-12(1983))。本發(fā)明的肽和多肽還包括所有下文將詳細(xì)描述的"模擬的"和"擬肽"形式。具有醛縮酶活性的多肽所謂"具有醛縮酶活性的多肽"是指多肽本身或者該多肽與一種或多種附加的多肽(具有相同或者不同的序列)構(gòu)成的具有醛縮酶的酶活性的多肽,是一種具有醛縮酶活性的蛋白質(zhì)。重組"重組"多肽或者蛋白質(zhì)是指通過重組DNA技術(shù)制備的多肽或者蛋白質(zhì);S口,從用編碼所需的多肽或者蛋白質(zhì)的外源DNA構(gòu)建體轉(zhuǎn)化的細(xì)胞中制備的。"合成的"多肽或者蛋白質(zhì)是通過化學(xué)合成制備的多肽或者蛋白質(zhì)??梢圆捎霉滔嗷瘜W(xué)肽合成方法來合成本發(fā)明的多肽或者片段。這種方法從十九世紀(jì)六十年代早期就為本領(lǐng)域的技術(shù)人員所公知(Merrifidd,R.B.,J.Am.Chem.Soc,85:2149-2154,1963)(還可以參見Stewart,J.M.andYoung,J.D.,SolidPhasePeptideSynthesis,2ndEd.,PierceChemicalCo.,Rockford,HI"pp.11-12)),并且最近可以用于可商購獲得實驗室肽的設(shè)計和合成試劑盒中(CambridgeResearchBiochemicals)。這種可以商購的實驗室試劑盒通常利用H.M.Geysen等在Proc.Natl.Acad.ScL,USA,81:3998(1984)中的教導(dǎo),并提供了根據(jù)許多"棒(rods)"或者"針(pins)"來合成多肽。所述的"棒"或者"針"與單個盤(plate)相連接?;疽恢庐?dāng)使用公知的比對法或者通過肉眼檢査來比對最大的一致性時,在本文中的描述兩種核酸或多肽"基本一致"的術(shù)語是指兩種或者多種序列具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或者氨基酸殘基(序列)的同一性。在另一些實施方式中,所述基本一致是指在至少約ioo個或者更多個殘基的區(qū)域具有同一性,并且更通常是在所述序列的至少約150-200個或者更多個殘基上基本一致。在一些實施方式中,編碼區(qū)的整個序列基本一致。此外,"基本一致的"氨基酸序列是指以一種或多種保守氨基酸或者非保守氨基酸的取代、刪除或插入的方式與參考序列具有區(qū)別的序列。在一些實施方式中,所述取代存在于分子中的非活性位點,或者所述取代存在于分子中的活性位點,其條件是所述多肽能夠基本上保持它的功能(酶的)特性。保守的氨基酸取代,例如,用一種氨基酸取代同類的另一種氨基酸的取代(例如疏水氨基酸的取代,例如異亮氨酸、纈氨酸、亮氨酸或蛋氨酸,或者一種極性氨基酸取代另一種極性氨基酸的取代,例如用精氨酸取代賴氨酸、用谷氨酸取代天冬氨酸、或者用谷氨酰胺取代天冬酰胺)。例如,可以從醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的多肽中刪除一種或多種氨基酸,以產(chǎn)生所述多肽的修飾的結(jié)構(gòu)而沒有改變其生物活性。例如,對于醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)不是必需的氨基或羧基末端的氨基酸與生物活性無關(guān)??梢酝ㄟ^多種方法檢測本發(fā)明的修飾的多肽序列的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的生物活性,所述方法包括用底物與修飾的多肽序列接觸,并確定修飾的肽是否減少了試驗中特異底物的量或者增加了具有功能的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)與底物的酶促反應(yīng)的生物產(chǎn)物的量。片段本文中在描述蛋白質(zhì)或者多肽或者核酸時所使用的"片段"分別是所述蛋白質(zhì)或者多肽或者核酸的一部分。片段具有與產(chǎn)生該片段的更長的蛋白質(zhì)或者多肽或者核酸序列相同或者基本上相同的氨基酸或者核酸序列。所述片段還包括具有與更長的蛋白質(zhì)、多肽或者核酸不同的三維結(jié)構(gòu)的片段。這種片段的實例是"前體型"分子,如具有低活性的前體蛋白,該前體蛋白可以通過切開修飾,以產(chǎn)生具有很高活性的成熟酶。蛋白質(zhì)或者多肽的片段可以是該蛋白質(zhì)或者多肽的具有酶活性的部分。立體轉(zhuǎn)化的轉(zhuǎn)氨酶"立體轉(zhuǎn)化的轉(zhuǎn)氨酶"是在使用具有相反手性的底物作為氨基供體時,能夠選擇地產(chǎn)生手性氨基酸產(chǎn)物(如莫那亭(monatin))的多肽。例如,立體轉(zhuǎn)化的轉(zhuǎn)氨酶可以是D-苯基甘氨酸轉(zhuǎn)氮酶(也稱為D-4-羥基苯基甘氨酸轉(zhuǎn)氨酶),該酶選擇地使用L-谷氨酰胺作為底物以產(chǎn)生R,R莫那亭。立體轉(zhuǎn)化的轉(zhuǎn)氨酶的非限制的實例包括D-蛋氮酸轉(zhuǎn)氨酶(EC2.6丄41)和具有D-苯基甘氨酸轉(zhuǎn)氨酶活性或者D-4-羥基苯基甘氨酸轉(zhuǎn)氨酶活性的酶。本發(fā)明提供了具有醛縮酶活性的肽,所述醛縮酶包括丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶;本發(fā)明還提供了編碼所述肽的多核苷酸以及制備和使用這些多核苷酸和多肽的方法。在一些實施方式中,本發(fā)明還提供了醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶;編碼這些酶的多核苷酸以及制備和使用這些多核苷酸和多肽的方法。在一些實施方式中,本發(fā)明提供了修飾的或者改進(jìn)的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶),這些酶分別具有比未修飾或者未改進(jìn)的醛縮酶更高的比活性。在一些實施方式中,提供了醛縮酶,如丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶,這些酶有助于制備3,4-取代的2-酮-戊二酸。在一些實施方式中,本發(fā)明提供了制備3,4-取代的2-酮-戊二酸的方法,該方法包括(a)提供具有醛縮酶活性的多肽,如丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性;(b)提供供體或者受體化合物;和(c)將步驟(a)中的多肽與步驟(b)的化合物在能夠使所述醛縮酶催化合成3,4-取代的2-酮-戊二酸的條件下進(jìn)行接觸,其中,任選地,所述供體和受體為丙酮酸或者丙酮酸供體和a-酮酸受體、酮和/或醛。在本發(fā)明的另一些實施方式中,可以結(jié)合使用丙酮酸醛縮酶(如HMG和/或KHG醛縮酶)與D-轉(zhuǎn)氨酶,以制備4-取代的D-谷氨酸或其衍生物。由于4-取代的D-谷氨酸或其衍生物被發(fā)現(xiàn)能用于抑制細(xì)菌谷氨酰胺消旋酶的活性,因此,這些化合物可以用作抗生素。在一種實施方式中,本發(fā)明提供了一種制備4-取代的D-谷氨酸的方法,該方法包括(a)提供具有醛縮酶活性的多肽,如丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性;(b)提供a酮酸受體和丙酮酸或丙酮酸供體;和(c)將步驟(a)中的多肽與步驟(b)的化合物在能夠使所述醛縮酶催化合成4-取代的D-谷氨酸的條件下進(jìn)行接觸,其中,任選地,所述多肽具有丙酮酸醛縮酶活性、HMG醛縮酶活性和/或KHG醛縮酶活性,并且,其中,所述方法還任選地包括使用D-轉(zhuǎn)氨酶。在一些實施方式中,本發(fā)明提供了含有本發(fā)明的酶、多肽或多核苷酸的組合物(例如,酶制劑、食品和食品添加劑、飼料和飼料添加劑、飲料和飲料添加劑、藥品和藥品添加劑、和膳食補充劑)。這些組合物可以制成多種形式,如液體、凝膠體、丸劑、片劑、噴劑、薄膜、膠束、粉體、食物、飼料球、或者包括納米包封形式在內(nèi)的包封的形式。檢測醛縮酶(包括丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶)的活性的方法,例如確定多肽是否具有醛縮酶(包括丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶)的活性的方法是本領(lǐng)域所公知的,并且屬于本發(fā)明的范圍內(nèi);具體參見E.E.Dekker&R.P.Kitson,J.Biol.Chem.267,10507-10514,1992;TahaTS,DeitsTL1Purificationandcharacterizationof2-keto-3-deoxy-6-phosphogluconatealdolasefromAzotobactervinelandii:evidencethattheenzymeisbiflmctionaltowards2-keto-4-hydroxyglutaratecleavage,BiochemBiophysResCommun.1994Apr15;200(l):459-66;DekkerEE,KobesRD,GradySR,2-keto-4-hydroxyglutaratealdolasefrombovineliver,MethodsEnzymol.1975;42:280-5;DekkerEE,NisbiharaH,GradySR,MethodsEnzymol.1975;42:285-90,2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli;NishiharaH,DekkerEE,BiochimBiophysActa.1969Jul8;185(l):255-7,Astereospecific2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli。石角定多肽是否具有醛縮酶(包括丙酮酸,例如但不限于HMG和/或KHG醛縮酶)的活性的合適的方法的一種實例在實施例3中有描述。在一些實施方式中,本發(fā)明的醛縮酶可以在不同的pH條件下有效地使用,所述pH條件包括例如約3.0-12.0。在另一些實施方式中,本發(fā)明的醛縮酶可以在pH為約3.0、4,0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5或約12.0的條件下使用。在酸性或者堿性條件下進(jìn)行反應(yīng)是有利的,例如,本發(fā)明的酶可以應(yīng)用在一些工業(yè)或者藥物的應(yīng)用中。本發(fā)明提供了醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽的多種形式和制劑。在本發(fā)明的方法中,本發(fā)明的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽以多種形式和制劑使用。例如,純化的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽以酶制劑的形式應(yīng)用于制備R-2-羥基-2-(B引哚-3基-甲基)-4-酮戊二酸(R-MP)和莫那亭的某些立體異構(gòu)體(例如R,R和S,R莫那亭、和它們的鹽)的方法中,以及制備莫那亭衍生物的某些立體異構(gòu)體(如R,R和S,R莫那亭衍生物構(gòu)型,和它們的鹽)的方法中,或者在藥物或者膳食輔助應(yīng)用中??晒┻x擇地,本發(fā)明的酶可以直接地應(yīng)用于制備R-2-羥基-2-(吲哚-3基-甲基)-4-酮戊二酸(R-MP)和莫那亭的某些立體異構(gòu)體(例如R,R和S,R莫那亭、和它們的鹽)的方法中,以及制備莫那亭衍生物的某些立體異構(gòu)體(如R,R和S,R莫那亭衍生物構(gòu)型、和它們的鹽)的方法中,以及制備食物、液體或者飼料等的方法中。在一些實施方式中,可以使用本領(lǐng)域公知的方法在微生物中表達(dá)本發(fā)明的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽。在一些實施方式中,可在將本發(fā)明的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽用于本發(fā)明的方法中之前,將其固定到固體支持物上。將酶固定到固體支持物上的方法是本領(lǐng)域通常公知的,例如,J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivataetal.Biocatalysis:Immobilizedcellsandenzymes,JMol.Cat.37(1986)1-24:Sharmaetal.,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnology。核酸、探針和抑制分子本發(fā)明提供了分離的、重組的核酸,參見序列表;提供了編碼多肽的核酸,包括本發(fā)明的多核苷酸序列,參見序列表;提供了包括本發(fā)明的核酸的表達(dá)盒,如表達(dá)載體和各種克隆載體。在一些實施方式中,本發(fā)明還包括使用本發(fā)明的核酸來發(fā)現(xiàn)、鑒定或分離新的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽序列的方法。在一些實施方式中,本發(fā)明還包括使用本發(fā)明的核酸來抑制醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的編碼基因的表達(dá)和轉(zhuǎn)錄的方法。還提供了用于修飾本發(fā)明的核酸的方法,該方法包括通過例如人工連接再裝酉己(syntheticligationreassembly)、優(yōu)化的指導(dǎo)進(jìn)化體系(optimizeddirectedevolutionsystem)和/或飽和誘變(如基因位點飽和誘變(GSSM))來制備本發(fā)明的核酸的各種變體。術(shù)語"飽和誘變"、基因位點飽和誘變或者"GSSM"包括使用簡并寡核苷酸引物在多核苷酸中引入點突變的方法,這將在下文詳細(xì)描述。術(shù)語"優(yōu)化的指導(dǎo)進(jìn)化體系"或者"優(yōu)化的指導(dǎo)進(jìn)化"包括將相關(guān)的核酸序列(如相關(guān)的基因)的片段重新裝配的方法,這將在下文詳細(xì)解釋。術(shù)語"人工連接再裝配"或者"SLR"包括以非隨機的方式連接寡核苷酸片段的方法,這將在下文詳細(xì)解釋。術(shù)語"變體"是指本發(fā)明的多核苷酸或者多肽在一個或多個堿基對、密碼子、內(nèi)含子、外顯子或氨基酸殘基(分別地)修飾后仍然保持本發(fā)明的醛縮酶(例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的生物活性??梢酝ㄟ^各種方式來制備變體,所述方式包括如易錯PCR、改組(shuffling)、寡核苷酸定向變異、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸總體誘變(recursiveensemblemutagenesis)、指數(shù)總體誘變(exponentialensemblemutagenesis)、^立點年寺異性誘變、基因裝酉己、GSSM及它們的任意組合。可以通過如cDNA文庫的克隆和表達(dá)、用PCR擴增信息或基因組DNA等方法,制備、分離和/或操作本發(fā)明的核酸。例如,本發(fā)明的序列最初來源于環(huán)境源。因此,在一些實施方式中,本發(fā)明提供了編碼醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的核酸,和由這些核酸編碼的多肽,這些物質(zhì)優(yōu)選來自于普通的來源,例如環(huán)境源、混合培養(yǎng)物或細(xì)菌源。在實施本發(fā)明的方法時,可以通過按照本文所述的方法來操作模板核酸以修飾相似的基因。在一些實施方式中,可以結(jié)合本領(lǐng)域任何的方法或方案或設(shè)備來實施本發(fā)明,在科學(xué)文獻(xiàn)和專利文獻(xiàn)中詳細(xì)地描述了本領(lǐng)域任何的方法或方案或設(shè)備。本文中所使用的短語"核酸"或者"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者是指它們的任何片段、基因組或者合成的DNA或RNA,它們可以是單鏈或者雙鏈的,并且可以是正義鏈或者反義(互補)鏈,肽核酸(PNA)、或者任何DNA類似的或者RNA類似的物質(zhì)、天然或者合成的來源。短語"核酸"或者"核酸序列"包括寡核苷酸、核苷酸、多核苷酸、或者是指它們的任何片段、基因組或者合成的DNA或RNA(如mRNA、rRNA、tRNA、iRNA),它們可以是單鏈或者雙鏈的,并且可以是正義鏈或者反義(互補)鏈,肽核酸(PNA)、或者任何DNA類似的或者RNA類似的物質(zhì)、天然或者合成的來源,包括如iRNA、核蛋白(如雙鏈iRNAs,如iRNPs)。所述術(shù)語包括核酸,即含有天然核苷酸的已知相似物的寡核苷酸。所述術(shù)語還包括具有合成骨架結(jié)構(gòu)的核酸類似物,參見如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"包括單鏈聚脫氧核苷酸鏈或者兩個互補的聚脫氧核苷酸鏈,它們可以由化學(xué)合成得到。這種合成的寡核苷酸不具有5'磷酸,因而在激酶的存在下如果不加入ATP來引入磷酸,則不會連接至另一個寡核苷酸。合成的寡核苷酸可以連接至未去磷酸化的片段。一種具體多肽或蛋白質(zhì)的"編碼序列"或者"編碼一種具體多肽或蛋白質(zhì)的核苷酸序列"是一種核酸序列,當(dāng)置于適當(dāng)?shù)恼{(diào)節(jié)序列的控制下時該核酸序列可以被轉(zhuǎn)錄和翻譯成多肽或蛋白質(zhì)。術(shù)語"基因"是指涉及制備多肽鏈的DNA片段;它包括編碼區(qū)前后的區(qū)域(前導(dǎo)區(qū)和尾區(qū)),以及適當(dāng)?shù)脑?,在單個編碼片段(外顯子)之間的插入序列(內(nèi)含子)。啟動子序列"可操作地連接到"編碼序列上,能引發(fā)轉(zhuǎn)錄的RNA聚合酶在啟動子的作用下將編碼序列轉(zhuǎn)錄成mRNA。本文中所使用的"可操作地連接"是指兩個和多個核酸(如DNA)片段之間的功能連接。它可以為轉(zhuǎn)錄調(diào)節(jié)序列和轉(zhuǎn)錄序列之間的功能關(guān)系。例如,如果啟動子能刺激和調(diào)節(jié)編碼序列在適當(dāng)?shù)乃拗骷?xì)胞或者其它表達(dá)系統(tǒng)中轉(zhuǎn)錄,則啟動子被操作地連接到編碼序列(如本發(fā)明的核酸)上。通常,能夠可操作地連接到轉(zhuǎn)錄序列的啟動子轉(zhuǎn)錄調(diào)節(jié)序列與轉(zhuǎn)錄序列的位置接近,即它們是順式作用。然而,一些轉(zhuǎn)錄調(diào)節(jié)序列(如增強子),則不需要與由該增強子增強轉(zhuǎn)錄的編碼序列在位置上接近。本文使用的術(shù)語"表達(dá)盒"是指能影響結(jié)構(gòu)基因(即,編碼蛋白的序列,所述蛋白如本發(fā)明的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)在能兼容該序列的宿主中的表達(dá)的核苷酸序列。所述表達(dá)盒包括至少一個可操作地連接到編碼所述多肽的序列的啟動子;和任選的其它序列(例如轉(zhuǎn)錄終止信號)。還可以使用對影響表達(dá)必需的或者有用的因子,如增強子、oc-因子。因此,所述表達(dá)盒還可以包括質(zhì)粒、表達(dá)載體、重組病毒、重組"裸露DNA"載體的任何形式等。"載體"包括能傳染、感染、短暫地或永久地轉(zhuǎn)化細(xì)胞的核酸。應(yīng)該認(rèn)識到,所述載體可以是裸露的核酸、或者與蛋白質(zhì)或者脂質(zhì)復(fù)合的核酸。所述載體任選地包括病毒或者細(xì)菌核酸和/或蛋白質(zhì)、和/或膜(如細(xì)胞膜、病毒脂質(zhì)膜等)。所述載體包括但不限于復(fù)制子(如RNA復(fù)制子、噬菌體),DNA片段可以連接到復(fù)制子上并被復(fù)制。因此,所述載體包括但不限于RNA、自主復(fù)制的環(huán)狀或線性的DNA或RNA(如質(zhì)粒、病毒等,參見美國專利No.5,217,879),并且包括表達(dá)或非表達(dá)的質(zhì)粒。當(dāng)重組微生物或者細(xì)胞培養(yǎng)物作為"表達(dá)載體"的宿主時,所述表達(dá)載體包括染色體外的環(huán)狀或者線性DNA和整合到宿主細(xì)胞染色體中的DNA。當(dāng)所述載體由宿主細(xì)胞維持時,所述載體可以由細(xì)胞在有絲分裂時作為自主結(jié)構(gòu)而穩(wěn)定地進(jìn)行復(fù)制,或者被整合到宿主基因組中進(jìn)行復(fù)制。本文中所使用的術(shù)語"重組"包括連接到"骨架"核酸上的核酸,而這些"骨架"核酸在天然環(huán)境中沒有被連接。在一些實施方式中,待"富集的"核酸的存在量為核酸骨架分子群體中的核酸插入物數(shù)量的約5%或者更多。本發(fā)明的骨架分子為包括表達(dá)載體、自主復(fù)制的核酸、病毒、整合核酸和其它用于維持或操作感興趣的核酸插入物的核酸在內(nèi)的核酸。在一些實施方式中,富集的核酸的存在量為重組骨架分子群體中的核酸插入物數(shù)量的約15%或者更多。在一些實施方式中,富集的核酸的存在量為重組骨架分子群體中的核酸插入物數(shù)量的約50%或者更多。在一些實施方式中,富集的核酸的存在量為重組骨架分子群體中的核酸插入物數(shù)量的約90%或者更多。本發(fā)明的一個實施方式提供了一種分離的、合成的或者重組的核酸,該核酸包括一種本發(fā)明的序列,或者包括本發(fā)明的核酸的片段,該片段含有本發(fā)明的核酸的至少IO、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個的連續(xù)的堿基。所述分離的、合成的或者重組的核酸可以包括DNA,該DNA包括cDNA、基因組DNA和合成的DNA。DNA可以是雙鏈的或者單鏈的,并且如果是單鏈,該單鏈可以是編碼鏈或者非編碼(反義)鏈?;蛘?,所述分離的、合成的或者重組的核酸包括RNA。本發(fā)明的分離的、合成的或者重組的核酸可以用于制備一種本發(fā)明的多肽,或者片段,該片段含有本發(fā)明的一種多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個的連續(xù)的氨基酸。因此,本發(fā)明的另一種實施方式提供了分離的、合成的或者重組的核酸,該核酸編碼本發(fā)明的一種多肽,或者片段,該片段含有本發(fā)明的一種多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個的連續(xù)的氨基酸。這些核酸的編碼序列可以與本發(fā)明的一種核酸的編碼序列相同,或者與編碼具有本發(fā)明的一種多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個的連續(xù)的氨基酸的本發(fā)明的一種序列的編碼序列不同,這是由于遺傳密碼子的冗余或者簡并所導(dǎo)致的。遺傳密碼子是本領(lǐng)域的技術(shù)人員所公知的,并且可以獲得,如在B.Lewin編寫的GenesVI,OxfordUniversityPress,1997的第214頁。編碼本發(fā)明的一種多肽的分離的核酸和與該核酸序列基本一致的核酸可以包括但不限于本發(fā)明核酸的編碼序列和附加編碼序列(如前導(dǎo)序列或者前體蛋白序列);和非編碼序列(如內(nèi)含子或編碼序列的5'和/或3'端的非編碼序列)。因此,本文所使用的術(shù)語"編碼多肽的多核苷酸"包括含有多肽的編碼序列的多核苷酸以及含有附加編碼序列和/或非編碼序列的多核苷酸?;蛘撸景l(fā)明的核酸序列和與該核酸序列基本一致序列可以通過常規(guī)的技術(shù)(如定點誘變)或者本領(lǐng)域技術(shù)人員熟知的其它技術(shù),將沉默變化引入本發(fā)明的多核苷酸中。本文中所使用的"沉默變化"包括,例如,不改變由該多核苷酸編碼的氨基酸序列的變化。為了增加通過引入經(jīng)常存在于宿主生物體中的密碼子或者密碼子對而由含有編碼所述多肽的載體的宿主所產(chǎn)生的多肽的水平,這種變化是符合需要的。本發(fā)明還涉及具有改變的核苷酸的多核苷酸,所述改變導(dǎo)致了本發(fā)明的多肽中的氨基酸取代、增加、刪除、融合和轉(zhuǎn)位。可以使用包括位點指導(dǎo)誘變、隨機的化學(xué)誘變、核酸外切酶III的刪除和其它重組DNA技術(shù)在內(nèi)的技術(shù)來產(chǎn)生這種核苷酸的變化。或者,這種核苷酸的改變可以是天然存在的等位基因的變體;可以通過識別核酸來分離這種等位基因的變體;在本文提供的很高的、中等的、或低等的嚴(yán)格條件下,識別出的核酸能夠與含有本發(fā)明的一種序列(或者與它互補的序列)的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500個連續(xù)的堿基的探針專一地雜交。普通技術(shù)用于實施本發(fā)明的核酸,不管是RNA、siRNA、miRNA、反義核酸、cDNA、基因組DNA載體、病毒還是它們的混合物,都可以從不同的來源中分離出、被遺傳工程化、被擴增、和/或被表達(dá)/重組地產(chǎn)生。從這些核酸中產(chǎn)生的重組多肽(如醛縮酶,例如丙酮酸醛縮酶,如HMG禾B/或KHG醛縮酶)可以單獨地分離或克隆并檢測所需要的活性。可以使用任何重組表達(dá)系統(tǒng),這種系統(tǒng)包括細(xì)菌的、哺乳動物的、酵母的、昆蟲的或者植物細(xì)胞的表達(dá)系統(tǒng)?;蛘撸梢酝ㄟ^眾所周知的化學(xué)合成技術(shù)在體外合成這些核酸,所述的化學(xué)合成技術(shù)描述在例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:卯;Brown(1979)Meth.Enzymol.68:109;Bea腦ge(1981)Tetra.Lett.22:1859;美國專利No.4,458,066。操作核酸的技術(shù),如亞克隆、標(biāo)記探針(如使用克列偌(Klenow)酶、缺口翻譯、擴增的隨機引物標(biāo)記)、測序、雜交等,在科學(xué)和專利文獻(xiàn)中有詳細(xì)的描述,參見Sambrook,ed.,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),Vols.1-3,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,A畫bel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。獲得并操作用于實施本發(fā)明的方法的核酸的另一種有用的方式是從基因組樣品中進(jìn)行克隆,并且,如果需要,對例如從基因組克隆中或者cDNA克隆中分離的或擴增的插入物進(jìn)行篩選并再次進(jìn)行克隆。用于本發(fā)明方法的核酸的來源包括基因組或者cDNA文庫,這些基因組或者cDNA文庫包含在哺乳動物人造染色體(MAC)中,參見Rosenfeld(1997)Nat.Genet.15:333-335;酵母人造染色體(YAC)中;細(xì)菌人造染色體(BAC)中;PI人造染色體中,參見Woon(1998)Genomics50:306-316;來源于PI的載體(PACs),參見Kern(1997)Biotechniques23:120-124;粘粒、重組病毒、噬菌體或者質(zhì)粒中。在一些實施方式中,編碼本發(fā)明多肽的核酸能夠以適當(dāng)?shù)姆绞脚c能夠定向分泌翻譯的多肽或其片段的前導(dǎo)序列進(jìn)行組裝。本發(fā)明提供了融合蛋白和編碼該融合蛋白的核酸。本發(fā)明的多肽可以融合到異源的肽或者多肽上,如N-末端識別肽,這種N-末端識別肽被賦予了所需要的特性,例如增強的穩(wěn)定性或者簡化的純化性能。本發(fā)明的肽或者多肽還可以被合成,并作為具有連接在其上的一個或多個附加結(jié)構(gòu)域的融合蛋白而被表達(dá),例如產(chǎn)生免疫原性更強的肽,從而更易于分離出重組合成的肽,以對抗體和表達(dá)抗體的B細(xì)胞等進(jìn)行識別和分離。能夠促進(jìn)檢測和純化的結(jié)構(gòu)域包括,例如金屬螯和肽,如能在固定的金屬上純化的聚組氨酸段和組氨酸-色氨酸模型、能在固定的免疫球蛋白上純化的蛋白A結(jié)構(gòu)域、和在FLAGS延伸/親和純化系統(tǒng)(ImmunexCorp,SeattleWA)中使用的結(jié)構(gòu)域。位于純化結(jié)構(gòu)域和含有肽或者多肽的基序之間的可切割的接頭序列的包含物(如Xa因子或者腸激酶(Invitrogen,Carlsbad,CA))有助于純化。例如,表達(dá)載體可以包括連接于六個組氨酸殘基的編碼抗原決定簇的核酸序列,所述六個組氨酸殘基之后為硫氧還蛋白和腸激酶的酶切位點(參見,例如Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。所述組氨酸殘基有助于檢測和純化,而腸激酶的酶切位點提供了從融合蛋白的剩余部分中提純抗原決定簇的方法。編碼融合蛋白和使用融合的固有技術(shù)詳細(xì)描述在科學(xué)和專利文獻(xiàn)中,參見,如Kroll(1993)DNACell.Biol.,12:441-53。轉(zhuǎn)錄和翻譯控制序列本發(fā)明提供了可操作地連接到表達(dá)(如轉(zhuǎn)錄或翻譯)控制序列(如啟動子或增強子)的本發(fā)明的核酸(如DNA)序列,以控制或調(diào)節(jié)RNA的合成/表達(dá)。所述表達(dá)控制序列可以位于表達(dá)載體中。細(xì)菌啟動子的實例包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。真核生物啟動子的實例包括早早期CMV、HSV胸腺嘧啶激酶、早期和晚期SV40、來自逆轉(zhuǎn)錄病毒的LTRs和小鼠金屬硫蛋白I。本文中所使用的術(shù)語"啟動子"包括所有能推動編碼序列在細(xì)胞(如植物或動物細(xì)胞)中轉(zhuǎn)錄的序列。因此,本發(fā)明的構(gòu)建體中所使用的啟動子包括順式作用轉(zhuǎn)錄控制元件和涉及調(diào)節(jié)或操縱基因轉(zhuǎn)錄的時間和/或速度的調(diào)節(jié)序列,例如,啟動子可以是順式作用轉(zhuǎn)錄控制元件,該順式作用轉(zhuǎn)錄控制元件包括涉及轉(zhuǎn)錄調(diào)控的增強子、啟動子、轉(zhuǎn)錄終止子、復(fù)制起始(originofreplication^染色體整合序列、5,和3'非翻譯區(qū)、或者內(nèi)含子序列。這些順式作用元件與蛋白質(zhì)或者其它生物分子相互作用以實現(xiàn)(啟動/終止、調(diào)節(jié)、調(diào)制等)轉(zhuǎn)錄。"組成型"啟動子是在大多數(shù)環(huán)境條件下以及發(fā)育狀態(tài)中或者細(xì)胞分化中能夠驅(qū)動連續(xù)表達(dá)的那些啟動子。"可誘導(dǎo)的"或者"可調(diào)節(jié)的"啟動子在環(huán)境條件和發(fā)育條件的影響下指導(dǎo)本發(fā)明的核酸的表達(dá)。能夠影響由可誘導(dǎo)啟動子驅(qū)動的轉(zhuǎn)錄的環(huán)境調(diào)節(jié)的實例包括厭氧條件、增加的溫度、干旱或者光的存在。"組織特異性的"啟動子是指僅在某些特定的細(xì)胞或器官(例如動物或者植物的)中具有活性的轉(zhuǎn)錄控制元件。組織特異性調(diào)節(jié)可以通過某些內(nèi)部因子而獲得,所述內(nèi)部因子確保對給定的組織具有特異性的蛋白的編碼基因能夠表達(dá)。已知這些因子存在于哺乳動物和植物中,以使特定組織發(fā)育。適合在細(xì)菌中表達(dá)多肽的啟動子包括大腸桿菌lac或者trp啟動子、lacl啟動子、lacZ啟動子、T3啟動子、T7啟動子、gpt啟動子、人PR啟動子、人PL啟動子、來自編碼糖酵解酶(如3-磷酸甘油酯激酶(PGK))的操縱子的啟動子、和酸性磷脂酶啟動子。真核啟動子包括早早期CMV、HSV胸腺嘧啶激酶、熱休克啟動子、早期和晚期SV40、來自逆轉(zhuǎn)錄病毒的LTRs和小鼠金屬硫蛋白I啟動子。還可以使用其它已知的能夠控制基因在原核細(xì)胞或者真核細(xì)胞或者它們的病毒中表達(dá)的啟動子。適合在細(xì)菌中表達(dá)多肽或它們的片段的啟動子包括大腸桿菌lac或者trp啟動子、lacl啟動子、lacZ啟動子、T3啟動子、T7啟動子、gpt啟動子、人PR啟動子、XPL啟動子、來自編碼糖酵解酶(如3-磷酸甘油酯激酶(PGK))的操縱子的啟動子、和酸性磷脂酶啟動子。真菌啟動子包括oc-因子啟動子。真核啟動子包括早早期CMV、HSV胸腺嘧啶激酶、熱休克啟動子、早期和晚期SV40、來自逆轉(zhuǎn)錄病毒的LTRs和小鼠金屬硫蛋白I啟動子。還可以使用其它已知的能夠控制基因在原核細(xì)胞或者真核細(xì)胞或者它們的病毒中表達(dá)的啟動子。組織特異性植物啟動子本發(fā)明提供了表達(dá)盒,該表達(dá)盒以組織特異性的方式表達(dá),如以組織特異性的方式表達(dá)醛縮酶(例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)。在一些實施方式中,本發(fā)明還提供了能以組織特異性的方式表達(dá)本發(fā)明的醛縮酶(例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的植物或種子。所述組織特異性可以是種子特異性的、莖特異性的、葉特異性的、根特異性的、果實特異性的等。術(shù)語"植物"包括整個植物、植物部分(比如葉、莖、花、根等)、植物原生質(zhì)體、種子和植物細(xì)胞及其子代??捎糜诒景l(fā)明方法的植物類別一般與適合于轉(zhuǎn)化技術(shù)的更高級植物一樣寬泛,包括被子植物(單子葉植物和雙子葉植物)以及裸子植物。它包括各種倍性水平的植物,包括多倍體、二倍體、單倍體和半合子態(tài)。如本文所使用的,術(shù)語"轉(zhuǎn)基因植物"包括其中插入有異源核酸序列的植物或植物細(xì)胞,如本發(fā)明的核酸和各種重組構(gòu)建體(比如表達(dá)盒)。.在一些實施方式中,組成型啟動子(如CaMV35S啟動子)可以用于在植物和種子或整個植株的特定部位表達(dá)。例如,為了過表達(dá),可以使用植物啟動子片段,該植物啟動子片段能夠引導(dǎo)核酸在植株(如再生植株)的一些組織或者所有組織中表達(dá)。在本文中這種啟動子被稱為"組成型"啟動子,并且在大多數(shù)環(huán)境條件下以及發(fā)育狀態(tài)中或細(xì)胞分化中是具有活性的。組成型啟動子的實例包括花椰菜花葉病毒(cauliflowermosaicvims)(CaMV)35S轉(zhuǎn)錄引發(fā)區(qū)域(transcriptioninitationregion)、來源于根癌土壤桿菌(Agrobacteriumtumefaciens)的T-DNA的l'-或者2'-啟動子、和來源于本領(lǐng)域技術(shù)人員公知的各種植物基因的其它轉(zhuǎn)錄引發(fā)區(qū)域。這種基因包括,如來源于擬南芥的ACTll(Huang(1996)PlantMot.Biol.33:125-139);來源于擬南芥的Cat3(基因庫No.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);來源于油菜的編碼硬脂酰-?;d體蛋白脫氫酶的基因(基因庫No.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);來自玉米的GPc1(基因庫No.X15596;Martinez(1989)J.Mol.Biol208:551-565);來自玉米的Gpc2(基因庫No.U45855,Manjunath(1997)PlantMol.Biol.33:97-112);在美國專利No.4,962,028、No.5,633,440中描述的植物啟動子。本發(fā)明使用來自病毒的組織特異性啟動子或者組成型啟動子,該啟動子包括煙草花葉病毒亞基因組啟動子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;僅在感染的水稻植株的韌皮細(xì)胞中復(fù)制的東格魯桿狀病毒(thericetungrobacilliformvirus,RTBV)的啟動子,該啟動子推動強的韌皮部分特異性的報告基因的表達(dá);木薯莖花葉病毒(CVMV)啟動子,該啟動子在管狀組織、葉肉細(xì)胞、和根端(roottips)具有很高的活性(Verdaguer(1996)PlantMol.Biol.31:1129-1139)。在一些實施方式中,植物啟動子控制表達(dá)醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)的核酸在特定的組織、器官或細(xì)胞型(即組織特異性啟動子)中的表達(dá),或者在精確的環(huán)境的或者發(fā)育控制下,或者在可誘導(dǎo)型啟動子的控制下可以是以其它方式起作用。能影響轉(zhuǎn)錄的環(huán)境條件的實例包括厭氧條件、增加的溫度、光的存在、或者用化學(xué)物質(zhì)/激素的噴霧。例如,本發(fā)明結(jié)合使用了玉米的干旱誘導(dǎo)型啟動子(Busk(1997)supra);和番茄的冷、干旱和高鹽誘導(dǎo)型啟動子(Kirch(1997)PlantMol.Biol.33:897909)。在一些實施方式中,組織特異性啟動子僅在特定的組織中在發(fā)育的特定時間階段推動轉(zhuǎn)錄。參見Blazquez(1998)PlantCell10:791-800,該文獻(xiàn)描述了擬南芥LEAFY基因啟動子的特點。還可以參見Cardon(1997)PlantJ12:367-77,該文獻(xiàn)描述了轉(zhuǎn)錄因子SPL3,該轉(zhuǎn)錄因子識別擬南芥的花分生組織識別基因API的啟動子區(qū)域的保守序列基序;以及在Mandel(1995)PlantMolecularBiology,Vol.29,pp995-1004中描述了分生組織啟動子eIF4??梢允褂迷谔囟ńM織的整個生命周期中都具有活性的組織特異性啟動子。在一些實施方式中,本發(fā)明的核酸被可操作地連接到僅在棉花纖維細(xì)胞中具有活性的啟動子上。在一些實施方式中,本發(fā)明的核酸被可操作地連接到主要在棉花纖維細(xì)胞伸長階段時具有活性的啟動子上,如Rinehart(1996)supra的描述。可以將核酸可操作地連接到Fbl2A基因啟動子上,以在棉花纖維細(xì)胞(Ibid)中優(yōu)先表達(dá)。還可以參見John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美國專利No.5,608,148禾f]No.5,602,321,這些專利描述了棉花纖維特異性啟動子以及構(gòu)建轉(zhuǎn)基因棉花植株的方法。還可以使用根特異性啟動子,以表達(dá)本發(fā)明的核酸。根特異性啟動子的實例包括來自醇脫氫酶基因的啟動子(DeLisle(1990)Int.Rev.Cytol.123:39-60)。可以用于表達(dá)本發(fā)明的核酸的其它啟動子包括例如卵特異性的啟動子、胚胎特異性的啟動子、胚乳特異性的啟動子、珠被特異性的啟動子、種子表皮特異性的啟動子、或者它們的一些組合;葉特異性的啟動子(見Busk(1997)PlantJ.11:12851295,該文獻(xiàn)描述了玉米中的葉特異性的啟動子);來自毛根農(nóng)桿菌(Agrobacteriumrhizogenes)的ORF13啟動子(該啟動子在根中具有高活性,參見Hansen(1997)supra);玉米花粉特異性的啟動子(見Guerrero(1990)Mol.Gen.Genet.224:161168);可以使用在水果成熟、葉子衰老和切斷時具有活性的番茄啟動子,和在花衰老和切斷時具有較低活性的番茄啟動子(見Blume(1997)PlantJ.12:731746);來自番茄SK2基因的雌蕊特異性的啟動子(見Ficker(1997)PlantMol.Biol.35:425431);來自豌豆的Blec4基因,該基因在轉(zhuǎn)基因紫花苜蓿的植物頂端和花柄頂端的表皮組織中具有活性,這使得該基因成為將外源基因靶向到生長活躍的頂端或者纖維的表皮層中表達(dá)的有用工具;卵特異性BEL1基因(見Reiser(1995)Cell83:735-742,GenBankNo.U39944);和/或在由Klee在美國專利No.5,589,583中描述的啟動子,該文獻(xiàn)描述了植物啟動子區(qū)域能賦予在分生組織和/或快速分裂的細(xì)胞中高水平地轉(zhuǎn)錄的活性。在一些實施方式中,使用暴露于植物激素(如生長素)時可被誘導(dǎo)的植物啟動子來表達(dá)本發(fā)明的核酸。例如,本發(fā)明可以使用在大豆中響應(yīng)生長素的元件E1啟動子片段(AuxREs)(GlycinemaxL.)(Liu(1997)PlantPhysiol.115:397-407);響應(yīng)生長素的擬南芥GST6啟動子(該啟動子還響應(yīng)水楊酸和過氧化氫)(Chen(1996)PlantJ.10:955-966);來自煙草中的生物素誘導(dǎo)的parC啟動子(Sakai(1996)PlantCellPhysiol.37:906-913);植物生物素響應(yīng)元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和響應(yīng)應(yīng)急激素脫落酸的啟動子(Sheen(1996)Science274:1卯0-1902)。還可以將本發(fā)明的核酸可操作地連接到暴露于可以施用于植物的化學(xué)試劑如除草劑或抗生素時可被誘導(dǎo)的啟動子上。例如,可以使用受苯磺酰氨除草劑安全劑激活的玉米ln2-2啟動子(DeVeylder(1997)PlantCellPhysiol.38:568-577);使用不同的除草劑安全劑來誘導(dǎo)不同的基因表達(dá)模式,該表達(dá)模式包括在根部、排水器(hydathodes)和柄頂端的分生組織中表達(dá)。編碼序列可以在例如可由四環(huán)素誘導(dǎo)的啟動子的控制下表達(dá),如描述的含有飲用燕麥(AvenasativaL.)精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物(Masgrau(1997)PlantJ.11:465-473);或者響應(yīng)水楊酸的元件(Stange(1997)PlantJ.11:1315-1324)。使用化學(xué)(如激素或者殺蟲劑)誘導(dǎo)的啟動子,即響應(yīng)于能施用于本領(lǐng)域的轉(zhuǎn)基因植物的啟動子,可以使本發(fā)明的多肽在植物發(fā)育的特定階段被誘導(dǎo)表達(dá)。因此,本發(fā)明還提供了含有可誘導(dǎo)的編碼本發(fā)明多肽的基因的轉(zhuǎn)基因植物,所述可誘導(dǎo)的編碼本發(fā)明多肽的基因在農(nóng)作物的任何發(fā)育階段都是可誘導(dǎo)的,并且所述可誘導(dǎo)的編碼本發(fā)明多肽的基因的宿主限制于靶植物種類,如玉米、水稻、大麥、大豆、番茄或其它農(nóng)作物。本領(lǐng)域的技術(shù)人員將會認(rèn)識到,所述組織特異性的植物啟動子可以驅(qū)動可操作連接的除靶組織外的其它組織中的序列的表達(dá)。因此,在一些實施方式中,所述組織特異性的啟動子是能夠驅(qū)動優(yōu)先在靶組織或細(xì)胞型中表達(dá)的啟動子,但也可以在其它組織中導(dǎo)致一定水平的表達(dá)。本發(fā)明的核酸還可以可操作地連接到在暴露于化學(xué)試劑時可被誘導(dǎo)的植物啟動子上。這些化學(xué)試劑包括,例如除草劑、合成的生長素、或者可以施用(例如噴霧)到轉(zhuǎn)基因植物上的抗生素。本發(fā)明的產(chǎn)生醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的核酸的可誘導(dǎo)表達(dá)使栽培者可以選擇具有最佳的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表達(dá)和/或活性的植物。因此,可以控制植物部分的發(fā)育。本發(fā)明以這種方式提供了能夠促進(jìn)收獲植物或者植物的部分的方法。例如,在各種實施方式中,使用被苯磺酰氨除草劑安全劑激活的玉米In2-2啟動子(DeVeylder(1997)PlantCellPhysiol.38:568-577);使用不同的除草劑安全劑誘導(dǎo)不同的基因表達(dá)模式,該表達(dá)模式包括在根部、排水器和柄頂端分生組織中表達(dá)。本發(fā)明的編碼序列還可以在如可由四環(huán)素誘導(dǎo)的啟動子的控制下表達(dá),如描述的含有飲用燕麥精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物(Masgrau(1997)PlantJ.11:465-473);或者響應(yīng)水楊酸的元件(Stange(1997)PlantJ.11:1315-1324)。在一些實施方式中,適當(dāng)?shù)亩嚯牡谋磉_(dá)可能需要位于編碼區(qū)的3'末端的多腺苷化區(qū)域。這種多腺苷化區(qū)域可以來源于天然的基因、來源于其它植物的(或者動物的或者其它的)基因、或者來源于農(nóng)桿菌(Agrobacterial)T-DNA中的基因。表達(dá)載體和克隆載體本發(fā)明提供了表達(dá)載體和含有本發(fā)明的核酸的克隆載體,例如編碼本發(fā)明的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的序列。所述表達(dá)載體和含有本發(fā)明的核酸的克隆載體包括病毒顆粒、煙草花葉病毒、噬菌體、質(zhì)粒、噬菌粒、粘粒、福斯質(zhì)粒、細(xì)菌人造染色體、病毒DNA(如牛痘、腺病毒、畜痘病毒(foulpoxvirus)、狂犬病毒和SV40的衍生物)、基于Pl的人造染色體、酵母質(zhì)粒、酵母人造染色體和對感興趣的特異性宿主(如細(xì)菌、曲霉菌和酵母)具有特異性的任何其它載體。本發(fā)明的載體可以包括染色體、非染色體和合成的DNA序列。大量的合適的載體是本領(lǐng)域技術(shù)人員所公知的,并且是可以商購的。所述載體的實例包括細(xì)菌的pQEtm載體(Qiagen,Valencia,CA)、pBLUESCRIPT質(zhì)粒、pNH載體、人-ZAP載體(Stratagene,LaJolla,CA);ptrc99a、pKK223-3、pDR540、pRIT2T(GEHealthcare,Piscataway,NJ)、pET載體(Novagen,Madison,WI);真核的pXTl、pSG5(Stratagene,LaJolla,CA)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,可以使用任何其它的質(zhì)粒或其它的載體,只要它們在宿主中能夠復(fù)制并存活即可。在本發(fā)明中可以使用低拷貝或者高拷貝的的載體。"質(zhì)粒"可以通過商購獲得、無任何限制地公開獲得,或者根據(jù)公開的方法從可以獲得的質(zhì)粒中構(gòu)建得到。與本文中描述的質(zhì)粒相當(dāng)?shù)馁|(zhì)粒是本領(lǐng)域公知的,并對于本領(lǐng)域的普通技術(shù)人員來說是顯而易見的。所述表達(dá)載體可以包括啟動子、用于引發(fā)翻譯的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。所述載體還可以包括用于擴增表達(dá)的適當(dāng)?shù)男蛄?。哺乳動物的表達(dá)載體可以包括復(fù)制起始部分、任何必需的核糖體結(jié)合位點、多腺苷化位點、剪接供體和受體位點、轉(zhuǎn)錄終止序列和5'端非轉(zhuǎn)錄序列。在一些實施方式中??梢允褂脕碜許V40剪接的DNA序列和多腺苷化位點,以提供所需要的非轉(zhuǎn)錄基因元件。在一些實施方式中,所述表達(dá)載體含有一種或多種選擇性標(biāo)記基因,以允許對含有載體的宿主細(xì)胞進(jìn)行選擇。這種選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因或者能賦予培養(yǎng)的真核細(xì)胞以新霉素抗性的基因、能賦予大腸桿菌以四環(huán)素或者氨芐青霉素抗性的基因、和釀酒酵母(S.cerevisiae)TRP1基因。使用氯霉素轉(zhuǎn)移酶(CAT)載體或者具有選擇標(biāo)記的其它載體從所需要的基因中選擇啟動子區(qū)域。在一些實施方式中,用于在真核細(xì)胞中表達(dá)所述多肽或它們的片段的載體包括增強子,以提高表達(dá)的水平。增強子是順式作用的DNA元件,所述增強子的長度可以為約10-300bp。它們可以對啟動子起作用,以提高啟動子的轉(zhuǎn)錄作用。所述增強子的實例包括位于復(fù)制起點后側(cè)的100-270bp的SV40增強子、細(xì)胞巨化病毒的早期啟動子的增強子、位于復(fù)制起點后側(cè)的多瘤病毒增強子、和腺病毒增強子??梢酝ㄟ^各種方法將核酸序列插入到載體中。通常,在消化插入物和具有適當(dāng)限制性核酸內(nèi)切酶位點的載體后,將所述序列連接到載體中的所期望的位點?;蛘?,可以將插入物和載體的平末端連接。各種克隆技術(shù)是本領(lǐng)域公知的,例如由Ausubel等在CurrentProtocolsinMolecularBiologyJohnWiley&Sons,Inc.1997中描述的技術(shù),禾卩Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。這些方法和其它的方法屬于本領(lǐng)域技術(shù)人員所了解的范圍。所述載體的形式可以是質(zhì)粒、病毒顆?;蛘呤删w。其它載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細(xì)菌質(zhì)粒、噬菌體DNA、煙草花葉病毒、酵母質(zhì)粒、來自質(zhì)粒和噬菌體DNA的組合載體、病毒DNA(如牛痘、腺病毒、畜痘病毒和狂犬病毒)。例如Sambrook描述了多種用于原核和真核宿主的克隆載體和表達(dá)載體??梢允褂玫奶厥獾募?xì)菌載體包括可以商購的含有公知的克隆載體的遺傳元件的質(zhì)粒,所述公知的克隆載體包括pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)pQE70、pQE60、pQE-9(Qiagen,Valencia,CA)、pD10、psiX174pBLUESCRIPTIIKS、pNH8A、pNH64a、pNH18A、pNH46A(Stratagene,LaJolla,CA)、ptrc99a、pKK223-3、pKK233陽3、DR540、pRIT5(Pharmacia)、pKK232-8、pET(Novagen,Madison,WI)和pCM7。特殊的真核細(xì)胞載體包括pSV2CAT、pOG44、pXTl、pSG(Stratagene,LaJolla,CA)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它的載體,只要它在宿主細(xì)胞中可以復(fù)制并存活即可。本發(fā)明的核酸可以在表達(dá)盒、載體或者病毒中表達(dá),并且可以瞬時地或者穩(wěn)定地在植物細(xì)胞和種子中表達(dá)。一種示例性的瞬時表達(dá)系統(tǒng)使用游離表達(dá)系統(tǒng),如在核中由含有超螺旋DNA的游離小染色體的轉(zhuǎn)錄而產(chǎn)生的花椰菜花葉病毒(CaMV)病毒RNA,參見Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637?;蛘邔⒕幋a序列,即本發(fā)明的序列的所有或者亞片段插入到植物宿主細(xì)胞基因組中成為宿主細(xì)胞染色體整合的一部分。正義或者反義轉(zhuǎn)錄物可以以這種方式表達(dá)。含有來自本發(fā)明核酸的序列(如啟動子或者編碼區(qū))的載體可以包括標(biāo)記基因,該標(biāo)記基因賦予植物細(xì)胞或者種子以可選擇的表型。例如,所述標(biāo)記可以編碼生物殺滅劑耐性的物質(zhì),如抗生素耐性、卡那霉素耐性、G418耐性、增光霉素耐性、潮霉素耐性,或者除草劑耐性(如氯磺隆(chlorosulfUron)或者巴斯達(dá)(Basta)耐性)。能夠在植物中表達(dá)核酸和蛋白質(zhì)的表達(dá)載體是本領(lǐng)域公知的,它們可以包括,例如,以下來源的載體農(nóng)桿菌屬、番茄病毒X(見Angell(1997)EMBOJ.16:3675-3684)、煙草花葉病毒(見Casper(1996)Gene173:69-73)、番茄從矮病毒(見Hillman(1989)Virology169:42-50)、煙草蝕紋病毒(見Dolja(1997)Virology234:243-252)、豆金色花葉病毒(見Morinaga(1993)MicrobiolImmunol.37:471-476)、花椰菜花葉病毒(見Cecchini(1997)Mol.PlantMicrobeInteract10:1094-1101)、玉米Ac/Ds轉(zhuǎn)座子(見Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Immunol.204:161-194)、禾口玉米抑制基因-增變基因(Spm)轉(zhuǎn)座子(見Schlappi(1996)PlantMol.Biol.32:717-725)、和它們的衍生物。在一些實施方式中,所述表達(dá)載體具有兩種復(fù)制系統(tǒng)以使該表達(dá)載體能在兩種生物體中起作用,例如,在用于表達(dá)的哺乳動物或者昆蟲細(xì)胞中以及在用于克隆可擴增的原核生物的宿主中。此外,為了整合表達(dá)載體,該表達(dá)載體可以含有至少一種與宿主基因組同源的序列。所述表達(dá)載體可以含有兩種同源的序列,該同源序列可以在側(cè)面與表達(dá)構(gòu)建體連接??梢酝ㄟ^在所述載體中選擇適當(dāng)?shù)耐葱蛄校允拐陷d體定向到宿主細(xì)胞中的特定的位點。用于整合載體中的構(gòu)建體(construct)是本領(lǐng)域公知的。本發(fā)明的表達(dá)載體還可以包括選擇性標(biāo)記基因,以對已轉(zhuǎn)化的細(xì)菌菌株進(jìn)行篩選,例如,能賦予細(xì)菌對氨芐青霉素、氯霉素、紅霉素、卡那霉素、新霉素、和四環(huán)素的耐藥性的基因。所述選擇性標(biāo)記還可以包括生物合成的基因,如在組氨酸、色氨酸和亮氨酸的生物合成途徑中參與生物合成的基因。所述表達(dá)載體中的DNA序列被可操作地連接到適當(dāng)表達(dá)控制序列(啟動子)上,以控制RNA的合成。特別指定的細(xì)菌啟動子包括lacl、lacZ、T3、T7、gpt、入PR、PL和trp。真核啟動子包括早早期CMV、HSV胸腺嘧啶激酶、早期和晚期SV40、來自逆轉(zhuǎn)錄病毒和小鼠金屬硫蛋白-I的LTRs。合適的載體和啟動子的選擇是本領(lǐng)域普通技術(shù)人員公知的。所述表達(dá)載體還包括用于轉(zhuǎn)錄起始的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。所述載體還可以包括用于擴增表達(dá)的適當(dāng)?shù)男蛄?。啟動子區(qū)域可以選自使用氯霉素轉(zhuǎn)移酶(CAT)載體或其它具有選擇性標(biāo)記的任何感興趣的基因中。此外,在一些實施方式中的表達(dá)載體含有一種或多種選擇性標(biāo)記基因以提供對轉(zhuǎn)化的宿主細(xì)胞進(jìn)行選擇的表型特性,所述選擇性標(biāo)記基因如編碼二氫葉酸還原酶的基因、賦予培養(yǎng)的真核細(xì)胞對新霉素的耐藥性的基因,或者賦予大腸桿菌對四環(huán)素或者氨節(jié)霉素的耐藥性的基因。哺乳動物表達(dá)載體還可以包括復(fù)制起點、任何必要的核糖體結(jié)合位點、多腺苷酸化位點、剪接供體和受體位點、轉(zhuǎn)錄終止序列和5'側(cè)翼非轉(zhuǎn)錄序列。在一些實施方式中,來自SV40剪接和多腺苷酸化的DNA可以用于提供所需要的非轉(zhuǎn)錄基因元件。用于在真核細(xì)胞中表達(dá)多肽或者多肽片段的載體可以含有能夠提高表達(dá)水平的增強子。所述增強子是DNA的順式作用元件,長度通常為約10-300bp,所述增強子作用于啟動子以增強啟動子的轉(zhuǎn)錄能力,所述增強子的實例包括位于復(fù)制起點后側(cè)的100-270bp的SV40增強子、細(xì)胞巨化病毒的早期啟動子增強子、位于復(fù)制起點后側(cè)的多瘤病毒增強子、和腺病毒增強子。此外,所述表達(dá)載體可以含有一種或多種選擇性標(biāo)記基因以對含有所述載體的宿主細(xì)胞進(jìn)行篩選。所述選擇性標(biāo)記基因包括編碼二氫葉酸還原酶的基因或者編碼賦予培養(yǎng)的真核細(xì)胞對新霉素的耐藥性的基因,賦予大腸桿菌對四環(huán)素的耐藥性的基因和釀酒酵母TRP1基因。在一些實施方式中,編碼本發(fā)明的一種多肽、與該多肽基本上相似的序列、或者含有該多肽的至少約5、10、15、20、25、30、35、40、50、75、100或者150或者更多個的組成型氨基酸的片段的核酸以適當(dāng)?shù)姆绞竭M(jìn)行組裝,并具有能夠控制翻譯后多肽或者它們的片段的分泌的前導(dǎo)序列。在一些實施方式中,所述核酸能編碼融合多肽,在該融合多肽中,本發(fā)明的一種多肽、或者含有該多肽至少約5、10、15、20、25、30、35、40、50、75、100或者150或者更多個組成型氨基酸的片段被融合到異源的肽或者多肽上,如能賦予所需要的特性(如增強的穩(wěn)定性或者簡化純化)的N-末端相同的肽??梢酝ㄟ^各種方法將合適的DNA序列插入到載體中。通常,用適當(dāng)?shù)南拗菩詢?nèi)切酶將插入物和載體消化后,將DNA序列連接到所述載體上。或者,可以將插入物和載體的平末端連接。各種克隆技術(shù)是本領(lǐng)域公知的,例如由Ausubel等在CurrentProtocolsinMolecularBiologyJohnWiley&Sons,Inc.1997中描述的技術(shù)和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。這些方法和其它的方法屬于本領(lǐng)域技術(shù)人員所了解的范圍。所述載體的形式可以是質(zhì)粒、病毒顆?;蛘呤删w。其它載體包括染色體的、非染色體的和合成的DNA序列、SV40的衍生物;細(xì)菌質(zhì)粒、噬菌體DNA、煙草花葉病毒、酵母質(zhì)粒、來自質(zhì)粒和噬菌體DNA的組合載體、病毒DNA(如牛痘、腺病毒、家畜痘病毒和狂犬病毒)。例如Sambrook等在MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y"(1989)中描述了多種用于原核和真核宿主的克隆載體和表達(dá)載體。宿主細(xì)胞和轉(zhuǎn)化細(xì)胞本發(fā)明還提供了含有本發(fā)明的核酸序列的轉(zhuǎn)化細(xì)胞或者本發(fā)明的載體,所述核酸序列包括編碼本發(fā)明的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的序列。所述宿主細(xì)胞可以是本領(lǐng)域的技術(shù)人員所熟悉的任何宿主細(xì)胞,包括原核細(xì)胞、真核細(xì)胞,例如,細(xì)菌細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、哺乳細(xì)胞、昆蟲細(xì)胞或者植物細(xì)胞。細(xì)菌細(xì)胞的實例包括任何種類的鏈霉菌、葡萄狀球菌、假單胞菌或桿菌,其中包括大腸桿菌、枯草芽孢桿菌、熒光假單胞桿菌(Pseudomonasfluorescens)、蠟狀芽孢桿菌(Bacilluscereus)或鼠傷寒沙門氏菌(Salmonellatyphimurium)。真菌細(xì)胞的實例包括曲霉菌的任何種類。酵母細(xì)胞的實例包括任何種類的畢赤酵母(Pichia)、釀酒酵母(saccharomyces)、裂殖酵母、或者西方許旺酵母(Schwanniomyces),包括畢赤酵母、混濁釀酒酵母(Saccharomycescerevisiae)或者裂殖酵母(Schizosaccharomycespombe)。昆蟲細(xì)胞的實例包括任何種類的秋粘蟲(Spodoptera)或者果蠅,其中包括果蠅S2和秋粘蟲Sf9。動物細(xì)胞的實例包括CHO、COS或者人黑素瘤或者任何小鼠或者人的細(xì)胞系。本領(lǐng)域的技術(shù)人員能夠選擇適當(dāng)?shù)乃拗?。轉(zhuǎn)化大量的不同的高等植物種類的技術(shù)是公知的并在技術(shù)和科學(xué)文獻(xiàn)中有描述。參見Weising(1988)Ann.Rev.Genet.22:421-477;美國專利No.5,750,870。可以使用各種技術(shù)將載體導(dǎo)入到宿主細(xì)胞中,所述技術(shù)包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti-介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、二乙氨(基)乙基葡聚糖(DEAE-Dextran)介導(dǎo)的轉(zhuǎn)染、脂質(zhì)轉(zhuǎn)染或者電轉(zhuǎn)染(Davis,L.,Dibner,M.,Battey,L,BasicMethodsinMolecularBiology,(1986))。在一些實施方式中,將本發(fā)明的核酸或者載體導(dǎo)入到細(xì)胞質(zhì)以進(jìn)行篩選,因此,所述核酸以適于核酸隨后的表達(dá)的方式進(jìn)入細(xì)胞。導(dǎo)入的方法很大程度上由靶細(xì)胞的類型決定。這些方法的實例包括CaP04沉淀、脂質(zhì)體融合、脂質(zhì)轉(zhuǎn)染(例如LIPOFECTINtm)、電穿孔、表達(dá)轉(zhuǎn)染等。這些候選的核酸可以被穩(wěn)定地整合到宿主基因組中(例如,用逆轉(zhuǎn)錄病毒導(dǎo)入)或者可以瞬時或者穩(wěn)定地存在于細(xì)胞質(zhì)中(S卩,通過使用傳統(tǒng)的質(zhì)粒、利用標(biāo)準(zhǔn)的調(diào)節(jié)序列、選擇標(biāo)記等)。由于在藥物上的許多重要的篩選需要以人的細(xì)胞或者模型哺乳的細(xì)胞作為標(biāo)靶,因此,可以使用能夠轉(zhuǎn)化這種標(biāo)靶的逆轉(zhuǎn)錄病毒載體??梢詫⒐こ趟拗骷?xì)胞適當(dāng)?shù)嘏囵B(yǎng)在改良的常規(guī)營養(yǎng)培養(yǎng)基中,該培養(yǎng)基適于激活啟動子、對轉(zhuǎn)化株進(jìn)行篩選、或者對本發(fā)明的基因進(jìn)行擴增。在適當(dāng)?shù)乃拗髦曛修D(zhuǎn)化并生長到一定的細(xì)胞密度后,可以通過適當(dāng)?shù)姆椒?如改變溫度或者化學(xué)誘導(dǎo))來誘導(dǎo)選擇性的啟動子,并將細(xì)胞在培養(yǎng)一段時間以使細(xì)胞產(chǎn)生期望的肽或者該肽的片段??梢酝ㄟ^離心收集細(xì)胞,通過物理的方法或者化學(xué)的方法破碎細(xì)胞,并保留得到的粗提取物以進(jìn)一步純化。用于表達(dá)蛋白的微生物細(xì)胞可以通過任何常規(guī)的方法進(jìn)行破碎,所述常規(guī)的方法包括反復(fù)凍溶法、超聲波方法、機械破碎或者使用裂解劑破碎細(xì)胞的方法。這些方法是本領(lǐng)域技術(shù)人員所公知的??梢酝ㄟ^各種方法從重組的細(xì)胞培養(yǎng)物中回收到表達(dá)的多肽或者該多肽片段,所述方法包括硫酸銨或者乙醇沉淀、酸提取、陰離子或/陽離子交換色譜、磷酸纖維素色譜、疏水相互作用色譜、親和層析、羥磷灰石色譜和外源凝集素色譜。如果必要的話,可以使用蛋白的再折疊步驟以完善多肽的構(gòu)象。如果需要,可以使用高效液相色譜(HPLC)作為最后的純化步驟。可以按照常規(guī)的方法使用宿主中的構(gòu)建體,以產(chǎn)生由重組序列編碼的基因產(chǎn)品。由含有載體的宿主細(xì)胞產(chǎn)生的多肽可以是糖基化的或者可以是非糖基化的,這取決于在重組產(chǎn)物的步驟中所使用的宿主。本發(fā)明的多肽可以包括或不包括起始的蛋氨酸氨基酸殘基。還可以使用無細(xì)胞的翻譯體系,以產(chǎn)生本發(fā)明的多肽。無細(xì)胞的翻譯體系可以從使用由DNA構(gòu)建體轉(zhuǎn)錄來的mRNA,所述DNA構(gòu)建體含有可操作地連接到編碼所述多肽或者該多肽的片段的核酸的啟動子。在一些實施方式中,所述DNA構(gòu)建體在進(jìn)行體外轉(zhuǎn)錄反應(yīng)前可以被線性化。然后將轉(zhuǎn)錄的mRNA與適當(dāng)?shù)臒o細(xì)胞翻譯提取物(如兔網(wǎng)狀細(xì)胞提取物)進(jìn)行孵育,以產(chǎn)生所期望的多肽或者該多肽的片段。所述表達(dá)載體可以含有一種或多種選擇性標(biāo)記基因,以提供用于選擇轉(zhuǎn)化宿主細(xì)胞的表型特性,所述選擇性標(biāo)記基因如二氫葉酸還原酶基因或者能賦予培養(yǎng)的真核細(xì)胞對新霉素的耐藥性的基因、賦予大腸桿菌對四環(huán)素或者氨芐青霉素的耐藥性的基因。可以將含有感興趣的多核苷酸(如本發(fā)明的核酸)的宿主細(xì)胞培養(yǎng)在常規(guī)的改進(jìn)的營養(yǎng)培養(yǎng)基中,所述改進(jìn)是為了適于激活啟動子、選擇轉(zhuǎn)化株或者擴增基因。所述表達(dá)條件(如溫度和pH等)是以前用于表達(dá)所選擇的培養(yǎng)宿主細(xì)胞的條件,這對于本領(lǐng)域的技術(shù)人員來說是顯而易見的。然后對確定的具有特定酶活性的克隆進(jìn)行測序,以確定編碼具有增強活性的酶的多核苷酸序列。本發(fā)明提供了在包括含有本發(fā)明的核酸的表達(dá)載體的細(xì)胞中過表達(dá)重組的醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)的方法,所述核酸例如至少在約100個殘基的區(qū)域與本發(fā)明的序列具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列,其中,所述序列同一性是通過序列比對或者肉眼觀察確定的;或者在嚴(yán)格條件下與本發(fā)明的核酸序列雜交的核酸;或者它們的子序列。所述過表達(dá)可以通過任何方法來實現(xiàn),如使用高活性的啟動子、順反子載體或者通過載體的基因擴增。本發(fā)明的核酸可以在體外或者體內(nèi)的表達(dá)載體中表達(dá)或者過表達(dá)??梢允褂萌魏渭?xì)胞培養(yǎng)體系以表達(dá)或者過表達(dá)重組蛋白,如包括細(xì)菌培養(yǎng)物、昆蟲培養(yǎng)物、酵母培養(yǎng)物、真菌培養(yǎng)物或者哺乳動物培養(yǎng)物??梢酝ㄟ^選擇適當(dāng)?shù)膯幼?、增強子、載體(如使用復(fù)制子載體、順反子載體(見Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8))、培養(yǎng)基和培養(yǎng)系統(tǒng)等來實現(xiàn)過表達(dá)。在一些實施方式中,在細(xì)胞體系中使用選擇性標(biāo)記基因(如谷氨酸合成酶擴增的基因(見Sanders(1987)Dev.Biol.Stand.66:55-63))使本發(fā)明的多肽過表達(dá)。關(guān)于這種方法更詳細(xì)的信息描述在公眾文獻(xiàn)中和/或是本領(lǐng)域技術(shù)人員所公知的。在具體的非限制性示例說明中,所述公眾能獲得的文獻(xiàn)包括EP0659215(WO9403612Al)(Nevalai羅etal);Lapidot,A.,Mechaly,A.,Shoham:Y""Overexpressionandsingle-steppurificationofathermostablexylanasefromBacillusstearothermophilusT-6,"J.Biotechnol.Nov51:259-64(1996);LUthi,E.,Jasmat,N.B,,Bergquist,RL.,"XylanasefromtheextremelythermophilicbacteriumCaldocellumsaccharolyticum:overexpressionofthegeneinEscherichiacoliandcharacterizationofthegeneproduct,"Appl.Environ.Microbiol.Sep56:2677-83(1990);和Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarchuk,W.,"OverexpressionoftheBacillussubtilisandcirculansxylanasesinEscherichiacoli,"ProteinExpr.Purif.Jun4:200-6(1993);盡管這些參考文獻(xiàn)沒有給出關(guān)于本發(fā)明的酶的教導(dǎo)。所述宿主細(xì)胞可以是本領(lǐng)域技術(shù)人員所熟知的任何宿主細(xì)胞,包括原核細(xì)胞、真核細(xì)胞、哺乳細(xì)胞、昆蟲細(xì)胞或者植物細(xì)胞。作為適當(dāng)宿主的代表性實例,可以提及的是細(xì)菌細(xì)胞,如大腸桿菌、鏈霉菌、枯草芽孢桿菌、蠟狀芽孢桿菌、鼠傷寒沙門氏菌(Salmonellatyphimurium)和屬于假單胞菌、鏈霉菌和葡萄狀球菌屬中的任何種;真菌細(xì)胞,如曲霉菌;酵母,如任何種類的畢赤酵母、釀酒酵母、裂殖酵母、西方許旺酵母,其中包括畢赤酵母、混濁釀酒酵母、或者粟酒裂殖酵母;昆蟲細(xì)胞,例如,果蠅S2和秋粘蟲Sf9;動物細(xì)胞,如CHO、COS或者人黑素瘤;和腺病毒。本領(lǐng)域的技術(shù)人員能夠選擇適當(dāng)?shù)乃拗鳌?梢允褂酶鞣N技術(shù)將所述載體導(dǎo)入到宿主細(xì)胞中,所述方法包括轉(zhuǎn)化、轉(zhuǎn)染、病毒感染、基因槍或者Ti-介導(dǎo)的基因轉(zhuǎn)移。特定的方法包括磷酸鈣轉(zhuǎn)染、二乙氨(基)乙基葡聚糖(DEAE-Dextran)介導(dǎo)的轉(zhuǎn)染、脂質(zhì)轉(zhuǎn)染或者電穿孑L(Davis,L.,Dibner,M,,Battey,L,BasicMethodsinMolecularBiology,(1986》??梢詫⒐こ趟拗骷?xì)胞適當(dāng)?shù)嘏囵B(yǎng)在改良的常規(guī)營養(yǎng)培養(yǎng)基中,該培養(yǎng)基適于激活啟動子、選擇轉(zhuǎn)化株或者擴增本發(fā)明的基因。在適當(dāng)?shù)乃拗髦贽D(zhuǎn)化并生長到一定的細(xì)胞密度后,可以通過適當(dāng)?shù)姆椒?如改變溫度或者化學(xué)誘導(dǎo))來誘導(dǎo)選擇性的啟動子,并將細(xì)胞再培養(yǎng)一段時間以使細(xì)胞產(chǎn)生所需要的肽或者該肽的片段。可以通過離心收集細(xì)胞,通過物理的方法或者化學(xué)的方法破碎細(xì)胞,并保留得到的粗提取物以進(jìn)一步純化。用于表達(dá)蛋白的微生物細(xì)胞可以通過任何常規(guī)的方法進(jìn)行破碎,所述常規(guī)的方法包括反復(fù)凍溶法、超聲波方法、機械破碎或者使用裂解劑破碎細(xì)胞的方法。這些方法是本領(lǐng)域技術(shù)人員所公知的??梢酝ㄟ^各種方法從重組的細(xì)胞培養(yǎng)物中回收表達(dá)的多肽或者該多肽的片段,所述方法包括硫酸銨或者乙醇沉淀、酸提取、陰離子或/陽離子交換色譜、磷酸纖維素色譜、疏水相互作用色譜、親和層析、羥磷灰石色譜和外源凝集素色譜。如果必要的話,可以使用蛋白的再折疊步驟以完善多肽的構(gòu)象。如果需要,可以使用高效液相色譜(HPLC)作為最后的純化步驟??梢允褂酶鞣N哺乳細(xì)胞培養(yǎng)體系來表達(dá)重組的蛋白。哺乳表達(dá)體系的實例包括猴腎成纖維細(xì)胞C0S-7細(xì)胞系(由Gluzman描述的Ce11,23:175,1981)和能從相容載體(compatiblevector)中表達(dá)蛋白質(zhì)的其它細(xì)胞系,如C127、3T3、CHO、海拉(HeLa)和BHK細(xì)胞系。可以按照常規(guī)的方法使用宿主中的構(gòu)建體以產(chǎn)生由重組序列編碼的基因產(chǎn)物。由含有載體的宿主細(xì)胞產(chǎn)生的多肽可以是糖基化的或者可以是非糖基化的,這取決于在重組產(chǎn)物步驟所使用的宿主。本發(fā)明的多肽可以包括或不包括起始的蛋氨酸氨基酸殘基?;蛘撸景l(fā)明的多肽或者含有所述多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或者更多個組成型氨基酸的片段,可以通過常規(guī)的肽合成方法(如下文中討論的方法)合成。在另一些實施方式中,所述多肽的片段或者部分可以通過肽合成而用于產(chǎn)生相應(yīng)的全長多肽;因此,所述片段可以用作制備全長肽的中間體。通過使用由含有可操作地連接到編碼所述多肽或者該多肽的片段的核酸的啟動子的DNA構(gòu)建體轉(zhuǎn)錄的mRNAs,還可以使用無細(xì)胞翻譯體系以產(chǎn)生本發(fā)明的一種多肽或者含有所述多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或者更多個組成型氨基酸的片段。在一些實施方式中,所述DNA構(gòu)建體在進(jìn)行體外轉(zhuǎn)錄反應(yīng)前可以被線性化。然后將轉(zhuǎn)錄的mRNA與適當(dāng)?shù)臒o細(xì)胞翻譯提取物(如兔網(wǎng)狀細(xì)胞提取物)進(jìn)行孵育,以產(chǎn)生所需要的多肽或者多肽片段。核酸的擴增在實施本發(fā)明時,可以通過擴增方法(如PCR)使本發(fā)明的核酸和編碼本發(fā)明的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的核酸或者本發(fā)明的修飾的核酸擴增??梢允褂脭U增來克隆或者修飾本發(fā)明的核酸。因此,本發(fā)明提供了用于擴增本發(fā)明核酸的擴增引物序列對。本領(lǐng)域的技術(shù)人員可以設(shè)計用于這些序列的部分或者全長的擴增引物序列對。在一些實施方式中,本發(fā)明提供了由本發(fā)明的擴增引物對擴增的核酸,所述引物對是本發(fā)明核酸序列的初始的(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25個或者更多個的核酸殘基,和互補鏈的初始約(5'端)的15、16、17、18、19、20、21、22、23、24或者25個或更多個殘基而設(shè)計的。在優(yōu)選實施方式中,本發(fā)明提供用于擴增編碼具有醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)活性的多肽的核酸的引物對序列,其中,所述引物對能使含有本發(fā)明序列的核酸、或者該核酸的片段或者部分?jǐn)U增。所述擴增引物序列對的一條鏈或每條鏈可以包括含有所述序列的至少約10-50個或者更多個組成型堿基的寡核苷酸,或者含有所述序列的至少約12、13、14、15、16、17、18、19、20、21、22、23、24或者25個或者更多個組成型堿基的寡核苷酸。在一些實施方式中,本發(fā)明提供了擴增引物對,其中,所述引物對包括第一鏈和第二鏈,所述第一鏈具有本發(fā)明核酸序列的初始的(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25個或者更多個核酸殘基設(shè)計的序列,所述第二鏈具有本發(fā)明鏈的互補鏈的初始(5')的15、16、17、18、19、20、21、22、23、24或者25或更多的殘基設(shè)計的序列。本發(fā)明通過本發(fā)明的擴增引物對并使用擴增方法(如聚合酶鏈?zhǔn)椒磻?yīng)(PCR))提供了醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)。在一些實施方式中,本發(fā)明提供了使用本發(fā)明的擴增引物對并通過擴增方法(如聚合酶鏈?zhǔn)椒磻?yīng)(PCR))來制備醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)的方法。在一些實施方式中,所述擴增引物對來自文庫(如基因文庫、環(huán)境文庫)的核酸進(jìn)行擴增??梢允褂脭U增反應(yīng),以對樣品中的核酸的量(如細(xì)胞樣品中信息量)進(jìn)行定量、對核酸進(jìn)行標(biāo)記(如標(biāo)記一個陣列或者一個點)、對核酸進(jìn)行檢測,或者對樣品中特定核酸的量進(jìn)行定量。在本發(fā)明的一些實施方式中,對從細(xì)胞或者CDNA文庫中分離出的信息進(jìn)行擴增。本領(lǐng)域的技術(shù)人員可以選擇和設(shè)計適當(dāng)?shù)墓押塑账釘U增引物。所述擴增的方法是本領(lǐng)域公知的,包括,如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)(見PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCR技術(shù)(PCRSTRATEGIES)(1995),ed.Innis,AcademicPress,Inc.,N.Y.;連接酶鏈?zhǔn)椒磻?yīng)(LCR)(見Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);轉(zhuǎn)錄擴增(見Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);禾口自持序列復(fù)制(見Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);Q-(3復(fù)制酶擴增(見Smith(1997)J.Clin.Microbiol.35:1477-1491)、自動的Q-卩復(fù)制酶擴增方法(見Burg(1996)Mol.Cell.Probes10:257-271)和其它RNA聚合酶介導(dǎo)的技術(shù)(suchasNASBA,Cangene,Mississauga,Ontario);還可以參見Berger(1987)MethodsEnzymol.152:307-316;A飄bel等CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.1997andSambrooketal.,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。美國專利No.4,683,195和No.4,683,202;Sooknanan(1995)Biotechnology13:563-564。核酸和多肽的序列同一性的確定本發(fā)明提供了具有以下序列的核酸,所述序列與本發(fā)明核酸在至少約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多個殘基的區(qū)域內(nèi)的序列同一性至少為約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或者100%。在一些實施方式中,本發(fā)明提供的多肽含有與本發(fā)明的多肽的核酸序列(見序列表)的序列同一性至少為約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和更高或者100%的序列。所述序列同一性(同源)的程度可以使用任何的計算機程序和相關(guān)的參數(shù)來確定,所述計算機程序包括本文所描述的,如具有默認(rèn)參數(shù)的BLAST2.2.2.或者FASTA3.0t78版。本發(fā)明的核酸序列可以包括本發(fā)明的序列的和基本上與本發(fā)明的序列相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500個或者更多個組成型核苷酸。本發(fā)明核酸的同源序列和片段是指與本發(fā)明的序列的序列同一性(同源性)至少為約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更高的序列??梢允褂萌魏蔚挠嬎銠C程序和本文中描述的參數(shù)來確定同源性(序列同一性),所述的計算機程序包括具有默認(rèn)參數(shù)的FASTA3.0t78版。特異性序列還可以包括RNA序列,在該RNA序列中,尿嘧啶代替本發(fā)明核酸序列中的胸腺嘧啶。所述同源性序列可以通過使用本文中描述的任何方法獲得,或者通過糾正序列的錯誤而獲得。應(yīng)當(dāng)理解的是,本發(fā)明的核酸序列可以用傳統(tǒng)的字母格式表示(見theinsidebackcoverofStryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork.)或者用其它記錄序歹U中的核苷酸同一性的任何其它格式來表示。在一些實施方式中,將本發(fā)明所確定的序列比對程序用于本發(fā)明的這一方面,即確定核酸或者多肽序列是否屬于本發(fā)明的范圍??梢允褂萌魏蔚谋葘Ψɑ蛘弑绢I(lǐng)域的公知的程序來評價所述蛋白質(zhì)和/或核酸序列的同一性。這種比對法和程序包括但不限于TBLASTN、BLASTP、FASTA、TFASTA禾口CLUSTALW(見PearsonandLipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.2—i5(3):403-410,1990;ThompsonNucleicAcidsRes.22(2):4673-4680,1994;Higgins等,MethodsEnzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,NatureGenetics3:266-272,1993)。在一些實施方式中,使用序列分析軟件(如由GeneticsComputerGroup開發(fā)的序列分析軟件包,烕斯康星大學(xué)生物技術(shù)中心,1710UniversityAvenue,Madison,WI53705)來檢測同源性或者同一性。這些軟件通過確定不同的刪除、替換和其它修飾的同源性程度來匹配相似的序列。在一些實施方式中,上下文中提到的兩個或者多個核酸或者多肽序列所使用的術(shù)語"同源性"和"同一性"是指,使用任何序列比對方法或者通過人工比對的方法和肉眼觀察檢測來比較和計算一個比較窗口或者指定區(qū)域中的最大的相應(yīng)程度時,兩種或者多種序列或者子序列是相同的;或者是指具有相同的氨基酸殘基或者核苷酸的特定百分比。在一些實施方式中,為了進(jìn)行序列比較,一種序列作為另一種被檢測的測試序列的參考序列。當(dāng)進(jìn)行序列比對時,將測試序列和參考序列輸入到計算機中,隨后指定坐標(biāo);如果必要還指定序列比對程序的參數(shù)。可以使用默認(rèn)程序參數(shù)或者可以指定可供選擇的參數(shù)。然后根據(jù)程序參數(shù)使用序列比對法,計算測試序列與參考序列的序列同一性百分比。本文中所使用的"比較窗口"包括選自由以下序列所組成的組中的任何一序列的片段,所述序列含有20-600個,通常約50-200個,更通常約100-150個氨基酸殘基或者核苷酸,將這些序列中的一條序列與該序列具有相同數(shù)量的連續(xù)位置的參考序列最佳比對后,將這兩條序列進(jìn)行比對。用于比較序列的計算方法是本領(lǐng)域所公知的。用于序列比較的最佳計算方法可以通過如下方法進(jìn)行,如Smith&Waterman的局部同源計算(thelocalhomologyalgorithmofSmith&Waterman),Adv.Appl.Math.2:482,1981;Needleman&Wunsch的同源比對計算(thehomologyalignmentalgorithmofNeedleman&Wunsch),J.Mol.Biol48:443,1970,bythesearchforsimilaritymethodofperson&Lipman,Proc.Natl.Acad.Sci.USA85:2444,1988;這些計算的計算機執(zhí)行方法(GAP,BESTFIT,FASTAandTFASTAintheWisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI);或者通過人工計算和肉眼觀察。用于確定同源性或者同一性的其它計算方法包括,例如BLAST程序(國家生物信息中心的基本的局部的比對搜索工具)、ALIGN、AMAS(多比對序列分析)、AMPS(蛋白質(zhì)多序列比對)、ASSET(比對的片段統(tǒng)計評估工具)、BANDS、BESTSCOR、BIOSCAN(生物學(xué)序列比較分析節(jié)點(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(塊極值優(yōu)化搜索工具(BLocksEVIProvedSearcher))、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、斯密斯-沃特曼算法(Smith-Watermanalgorithm)、DARWIN、韋加斯算法(LasVegasalgorithm)、FNAT(加強的核苷酸比對根據(jù))、框架比對(Framealign)、框架搜索(Framesearch)、DYNAMIC、FILTER、FSAP(富日斯特斯克序列分析包(FristenskySequenceAnalysisPackage))、GAP(球形比對程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(靈敏的序列比較)、LALIGN(局部序列比對)、LCP(局部內(nèi)容程序(LocalContentProgram))、MACAW(多比對構(gòu)建體&分析工作臺(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(對比X寸程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模型導(dǎo)致的多系列比對(Pattern-InducedMulti-s叫uenceAlignment))、SAGA(通過遺傳運送的序列比對)和WHAT-IF。還可以使用這些比對程序?qū)蚪M數(shù)據(jù)庫進(jìn)行篩選,以確定基本上相似的多核苷酸序列。可以得到大量的基因組數(shù)據(jù)庫,例如,人類基因組的重要部分可以作為人類基因組計劃的一部分而獲得。(Gibbs,1995)。至少有21種其它的基因組已被測序,它們包括,例如生殖器支原體(M.genitalium)(Fraseretal,Science270:397-403(1995))、甲烷球菌(M.jannaschii)(Bultetal,Science23:1058-73(1996))、H流行感冒(H.influenzae)(Fleischmannetal"Science269:496-512(1995))、大腸桿菌(Blattneretal,Science277:1453-74(1997))和酵母(釀酒酵母)(Mewesetal"Nature387:7-65(1997))和黑腹果蠅(D.melanogaster)(Adamsetal,Science257:2185-95(2000))。在模型生物如小鼠、線蟲和擬南芥(Arabadopsissp)的基因組測序方面也取得了顯著的進(jìn)步。一些含有標(biāo)注有一些功能信息的基因組信息的數(shù)據(jù)庫,可以由不同的機構(gòu)維持并可以通過互聯(lián)網(wǎng)獲得。在一些實施方式中,使用BLAST和2.0算法。這些算法由Altschul等分別描述在Nuc.AcidsRes.25:3389-3402,1977和J.Mol.Biol.215:403-410,1990中。公眾可以通過國家生物信中心獲得用于實施BLAST分析的軟件。這些算法包括首先通過確定查詢序列的較短字串長度W來確定高分序列配對(HSPs),當(dāng)與數(shù)據(jù)庫中相同長度的字串比對時,所述高分序列配對能匹配或者滿足一些正值閾值T。T是指鄰近字串的得分閾值(Altschuletal.,supm)。這些最初的臨近字串采樣數(shù)作為引發(fā)搜索找到含有它們的更長的HSPs的種子。只要積累的比對得分增加,所述字串釆樣數(shù)就在每一序列的兩個方向延伸。對于核苷酸序列,使用參數(shù)M(—對匹配殘基獲得的分?jǐn)?shù);總是〉0)以計算累積得分。對于氨基酸序列,使用得分矩陣以計算累積得分。當(dāng)出現(xiàn)以下情況時終止所述字串兩端的延長通過從獲得的最大值定量X時,累積比對得分降低;由于出現(xiàn)一個或多個負(fù)分值的殘基比對使所述累積得分為零或者低于零;或者達(dá)到任一序列的終點。BLAST比對參數(shù)W、T和X用于確定比對的靈敏性和比對的時間。BLASTN程序(對于核苷酸序列)使用字串的長度(W)的默認(rèn)值為11,期望值(E)的默認(rèn)值為10,M=5,N=-4并比較兩條鏈。對于氨基酸序列,BLASTP程序使用字串的長度的默認(rèn)值為3,期望值(E)的默認(rèn)值為10,BLOSUM62得分矩陣(見Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915,1989)的比對(B)的默認(rèn)值為50,M=5,N:4并比較兩條鏈。BLAST算法也是實現(xiàn)兩條序列之間同一性的統(tǒng)計學(xué)分析的方法(見Karlin&Altschul,Proc.Natl.Acad.Sci.USA90:5873,1993)。用BLAST算法提供同一性檢測的一個量度標(biāo)準(zhǔn)(measure)是最小總和的概率(P(N)),該最小總和的概率表示了兩條核苷酸或者氨基酸序列之間偶然匹配的概率。例如,在比較測試核酸和參照核酸的過程中,如果最小總和的概率小于約0.2,在一些實施方式中小于約0.01,在另一些實施方式中小于約0.001,則測試核酸被認(rèn)為與參照序列相似。在一些實施方式中,使用基本點局部比對搜索工具("BLAST")來評價蛋白質(zhì)和核酸的序列同源性。尤其使用五個特定的BLAST程序?qū)崿F(xiàn)以下任(1)用BLASTP和BLAST3對氨基酸查詢序列與蛋白質(zhì)序列庫進(jìn)行比較;(2)用BLASTN對核苷酸査詢序列與核苷酸序列數(shù)據(jù)庫進(jìn)行比較;(3)用BLASTX對核苷酸查詢序歹ij(兩條鏈)的六框架概念翻譯(six-frameconceptualtranslation)產(chǎn)物與蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比較;(4)用TBLASTN對査詢的蛋白質(zhì)序列與所有的六個閱讀框架(兩條鏈)的核苷酸序列數(shù)據(jù)庫進(jìn)行比較;和(5)用TBLASTX對核苷酸查詢序列的六框架翻譯產(chǎn)物與核苷酸序列數(shù)據(jù)庫的六框架翻譯產(chǎn)物進(jìn)行比較。BLAST程序通過鑒定位于査詢氨基酸或者核酸序列與測試序列之間的相似片段來鑒定同源序列,所述相似片段在本文被稱為"高分片段對",所述測試序列在一些實施方式中來自于蛋白質(zhì)或者核酸序列數(shù)據(jù)庫。在一些實施方式中,所述高分片段對通過得分矩陣方法進(jìn)行鑒定(即比對),所述得分矩陣方法中的許多方法是本領(lǐng)域所公知的。在一些實施方式中,所使用的得分矩陣是BLOSUM62矩陣(Gonnet(1992)Science256:1443-1445;HenikoffandHenikoff(1993)Proteins17:49-61)。在一些實施方式中,偶爾還使用PAM或者PAM250矩陣(見SchwartzandDayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofProteinSequenceandStructure,Washington:NationalBiomedicalResearchFoundation)。BLAST程序可以通過美國國家醫(yī)藥實驗室獲得。上述算法中使用的參數(shù)可以根據(jù)研究的序列長度和同源性的程度而改變。在一些實施方式中,在缺乏來自使用者的指導(dǎo)時,可以使用算法中默認(rèn)的參數(shù)。計算機系統(tǒng)和計算機程序產(chǎn)品本發(fā)明提供了計算機、計算機系統(tǒng)、計算機可讀介質(zhì)、計算機程序產(chǎn)品和類似的記錄和儲存本發(fā)明核酸和多肽的產(chǎn)品。因此,在實施本發(fā)明的方法時,如用計算機來確定并鑒定序列同一性(確定核酸是否屬于本發(fā)明的范圍)、結(jié)構(gòu)同源性、圖形等,則可以將本發(fā)明的核酸或者多肽序列儲存、記錄并操作在能夠被計算機閱讀和存取的任何介質(zhì)上。本文所使用的詞語"記錄"和"存儲"是指在計算機介質(zhì)上存儲信息的過程。本領(lǐng)域的技術(shù)人員易于采用任何己知的方法在計算機可讀介質(zhì)上記錄信息,以產(chǎn)生含有一種或多種本發(fā)明的核酸和/或多肽序列的產(chǎn)品。本文中所使用的術(shù)語"計算機"、"計算機程序"和"處理器"為它們的最廣泛的通常的含義,并且將所有下文中詳細(xì)描述的設(shè)備組合在一起。特定的多肽或者蛋白質(zhì)的"編碼序列的"或者"序列編碼"是指,當(dāng)置于適當(dāng)?shù)恼{(diào)節(jié)序列的控制下時能被轉(zhuǎn)錄和翻譯成多肽或者蛋白質(zhì)的核酸序列。本發(fā)明的多肽包括本發(fā)明的序列和基本上與該序列相似的序列,以及任何前述序列的子序列和具有酶活性的片段。在一些實施方式中,基本上相似的或者同源的多肽序列是指與本發(fā)明的序列的序列同一性(同源性)至少為50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和更高和100%的多肽序列。可以使用本文中描述的任何的計算機程序和參數(shù)來確定同源性(序列同一性)。本發(fā)明的核酸和多肽可以保存、記錄和操作在任何可以用計算機閱讀和存取的介質(zhì)上。本文所使用的詞語"記錄"和"存儲"是指在計算機介質(zhì)上存儲信息的過程。本領(lǐng)域的技術(shù)人員易于采用任何已知的方法在計算機可讀介質(zhì)上記錄信息以產(chǎn)生含有一種或多種本發(fā)明的核酸序列,一種或多種本發(fā)明的多肽序列的產(chǎn)品。在本發(fā)明的另一種實施方式中,本發(fā)明提供了一種計算機可閱讀的介質(zhì),在該介質(zhì)上記錄了至少2、5、10、15或20個或更多個本發(fā)明的核酸或者多肽序列。本發(fā)明的另一個實施方式中,本發(fā)明提供了一種計算機可閱讀的介質(zhì),在該介質(zhì)上記錄了一種或多種本發(fā)明的核酸序列。本發(fā)明的另一個實施方式中,本發(fā)明提供了一種計算機可閱讀的介質(zhì),在該介質(zhì)上記錄了一種或多種本發(fā)明的多肽序列。在本發(fā)明的另一種實施方式中,本發(fā)明提供了一種計算機可閱讀的介質(zhì),在該介質(zhì)上記錄了至少2、5、10、15或20個或更多個本發(fā)明上述的核酸或者多肽序列。所述計算機可閱讀的介質(zhì)包括磁性可閱讀的介質(zhì)、可用眼睛閱讀的介質(zhì)、電子可閱讀的介質(zhì)、和磁性/可用眼睛閱讀的介質(zhì)。例如,計算機可閱讀介質(zhì)可以是硬盤、軟盤、磁帶、光盤驅(qū)動器(CD-ROM)、數(shù)字化視頻光盤(DVD)、隨機存取存儲器(RAM)或只讀存貯器(ROM)以及本領(lǐng)域技術(shù)人員公知的其它類型的其它介質(zhì)。在本發(fā)明的一些實施方式中,本發(fā)明包括如計算機系統(tǒng)在內(nèi)的系統(tǒng)(如基于互聯(lián)網(wǎng)的系統(tǒng)),所述計算機系統(tǒng)儲存并操作本文所描述的序列信息。在圖9中,計算機系統(tǒng)100的一個實例以結(jié)構(gòu)圖形式進(jìn)行了說明。本文中所使用的"計算機系統(tǒng)"是指硬件部分、軟件部分和用于分析本發(fā)明的核酸的核苷酸序列或者多肽序列的數(shù)據(jù)儲存部分。在一些實施方式中,所述計算機系統(tǒng)100包括用于處理、存取和操作所述序列數(shù)據(jù)的處理器。所述處理器可以是任何己知類型的中央處理單元,如英特公司的奔騰III或者美國太陽公司、摩托羅拉公司、美國康柏公司、美國AMD公司或者國際商業(yè)機械公司(InternationalBusinessMachines)的類4以處理器。在一些實施方式中,所述計算機系統(tǒng)100是實現(xiàn)普通目的的系統(tǒng),該系統(tǒng)包括處理器105和一個或多個用于儲存的內(nèi)部數(shù)據(jù)儲存部分以及一個或多個用于恢復(fù)儲存在數(shù)據(jù)儲存元件上的數(shù)據(jù)的數(shù)據(jù)恢復(fù)的設(shè)備。本領(lǐng)域的技術(shù)人員能容易地理解到目前可以得到的任何計算機系統(tǒng)都是合適的。在一個實施方式中,所述計算機系統(tǒng)100包括連接到母線(bus)的處理器105,所述母線連接于主要的儲存器115(在一種實施方式中實施的為RAM)以及一個或多個內(nèi)部數(shù)據(jù)儲存設(shè)備110(如硬驅(qū)動器和/或能在其上記錄數(shù)據(jù)的其它計算機可讀介質(zhì))。在一些實施方式中,所述計算機系統(tǒng)100還包括一種或多種數(shù)據(jù)恢復(fù)設(shè)備118,以閱讀儲存在內(nèi)部數(shù)據(jù)儲存設(shè)備110上的數(shù)據(jù)。所述數(shù)據(jù)恢復(fù)設(shè)備118可以表示為,例如,軟盤驅(qū)動器、光盤驅(qū)動器、磁帶驅(qū)動器或者能連接到遠(yuǎn)端數(shù)據(jù)儲存系統(tǒng)的調(diào)制解調(diào)器(如通過互聯(lián)網(wǎng))等。在一些實施方式中,所述內(nèi)部數(shù)據(jù)儲存設(shè)備110為含有控制邏輯和/或記載控制邏輯的數(shù)據(jù)的可移動的計算機可閱讀的介質(zhì),如軟盤、光盤、磁帶等。所述計算機系統(tǒng)IOO可以方便地包括或者設(shè)計為適當(dāng)?shù)能浖?,?dāng)數(shù)據(jù)儲存部分被插入到數(shù)據(jù)儲存設(shè)備時,所述軟件能從數(shù)據(jù)儲存部分中閱讀出控制邏輯的和/或數(shù)據(jù)。所述計算機系統(tǒng)100包括顯示器120,該顯示器用于對計算機用戶進(jìn)行顯示輸出。應(yīng)當(dāng)指出的是,所述計算機系統(tǒng)100可以連接到網(wǎng)絡(luò)或者更廣的網(wǎng)絡(luò)上的另一個計算機系統(tǒng)125a-c,以提供進(jìn)入所述計算機系統(tǒng)100的重要的途徑。在進(jìn)行操作時,軟件可以保存在主要儲存器115中,所述軟件用于提取和處理本發(fā)明的核酸序列的核苷酸的序列和與它們基本上相似的序列,或者用于提取和處理本發(fā)明的多肽序列和與該多肽序列基本上相似的多肽序列(如搜索工具,比較工具和建模工具等)。在一些實施方式中,所述計算機系統(tǒng)IOO還可以包括序列比對算法,以對儲存在計算機可讀介質(zhì)上的本發(fā)明的核酸序列和與該核酸序列基本上相似的序列、或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列與儲存在計算機可讀介質(zhì)上的參照核苷酸或者多肽序列進(jìn)行比較。"序列比對算法"是指一種或多種能在(本地或者遠(yuǎn)程)計算機100上進(jìn)行實施以對儲存在數(shù)據(jù)儲存器上一種核苷酸序列和另一種核苷酸序列和/或化合物進(jìn)行比較的程序。例如,所述序列比對算法可以對儲存在計算機可讀介質(zhì)上的本發(fā)明的核酸序列和與該核酸序列基本上相似的序列、或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列,與儲存在計算機可讀介質(zhì)上的參照序列進(jìn)行比對,以確定同源性或者結(jié)構(gòu)基序。圖10是說明用于對一種新的核苷酸或者蛋白質(zhì)序列與序列數(shù)據(jù)庫進(jìn)行比對,以確定新的序列和數(shù)據(jù)庫中的序列的同源性水平的程序200的一種實施方式的流程圖。所述序列數(shù)據(jù)庫可以是儲存在計算機系統(tǒng)100中的私人數(shù)據(jù),或者可以為從互聯(lián)網(wǎng)上獲得的如GENBANEC公共數(shù)據(jù)庫。所述程序200在起始狀態(tài)201開始并轉(zhuǎn)換到狀態(tài)202,此時,待比較的新序列儲存在計算機系統(tǒng)100的儲存器中。如上所述,所述儲存器可以是任何類型的儲存器,包括RAM或者內(nèi)部儲存設(shè)備。然后,將所述程序200轉(zhuǎn)換到狀態(tài)204。此時,打開序列數(shù)據(jù)庫以進(jìn)行分析和比對。然后將所述程序200轉(zhuǎn)換到狀態(tài)206,此時,將儲存在所述數(shù)據(jù)庫中的第一序列讀取到計算機的儲存器中。然后在狀態(tài)210下進(jìn)行比較,以確定第一序列與第二序列是否相同。值得注意的是這一步不限于對新序列和所述數(shù)據(jù)庫中的第一序列進(jìn)行精確的比較。用于比較兩條核苷酸或者蛋白質(zhì)序列的公知的方法是本領(lǐng)域的技術(shù)人員知道的,即使比較的序列不同。例如,可以在一條序列中引入缺口,以提高兩條測試序列之間的同源性。通常計算機系統(tǒng)的使用者在進(jìn)行比較時,將控制缺口或者其它特征的參數(shù)引入到序列中。一旦在狀態(tài)210進(jìn)行兩條序列的比較,必須在決策狀態(tài)(decisionstate)210下,作出兩條序列是否相同的決定。當(dāng)然,術(shù)語"相同"不限于兩條序列絕對相同。在程序200中,位于使用者所設(shè)定的同源參數(shù)范圍內(nèi)的序列被標(biāo)記為"相同"。如果作出兩條序列相同的決定,則將程序200轉(zhuǎn)化到狀態(tài)214,此時,數(shù)據(jù)庫中序列的名稱被顯示在使用者的面前。這種狀態(tài)告知使用者顯示名稱的序列滿足輸入的同源性約束條件。被儲存序列的名稱一旦顯示在使用者的面前,則程序200轉(zhuǎn)換到?jīng)Q策狀態(tài)218,此時,作出在數(shù)據(jù)庫中是否存在多種序列的決定。如果在數(shù)據(jù)庫中不存在多種序列,則程序200終止在終止?fàn)顟B(tài)220。然而,如果在數(shù)據(jù)庫存在多種序列,則將程序200轉(zhuǎn)化到狀態(tài)224,此時,指示器轉(zhuǎn)化到另一序列以比較新的序列。將新的序列以這種方式與數(shù)據(jù)庫中每一條序列進(jìn)行比對。應(yīng)當(dāng)指出的是,如果在決策狀態(tài)212下作出序列不是同源的決定,則程序220立即轉(zhuǎn)換到?jīng)Q策狀態(tài)218,以確定數(shù)據(jù)庫中是否存在其它的數(shù)據(jù)可以進(jìn)行比較。因此,本發(fā)明的一種實施方式提供了一種計算機系統(tǒng),該計算機系統(tǒng)包括處理器;數(shù)據(jù)儲存裝置,該數(shù)據(jù)儲存裝置儲存有本發(fā)明的核酸序列和基本上與該核酸序列相似的序列,或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列;數(shù)據(jù)儲存裝置,該數(shù)據(jù)儲存裝置可讀取地儲存有用于與本發(fā)明的核酸序列和基本上與該核酸序列相似的序列、或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列進(jìn)行比較的參照核苷酸序列或者多肽序列;和用于進(jìn)行對比的序列比較器。所述序列比較器可以指出比較的序列或者相似結(jié)構(gòu)的基序之間的同源性水平,這些相似結(jié)構(gòu)的基序存在于本發(fā)明的核酸序列和與該序列基本上相似的序列的上述核酸密碼中,或者這些相似結(jié)構(gòu)的基序存在于本發(fā)明的多肽序列和與該多肽序列基本上相似的序列的多肽密碼中;或者,所述序列比較器可以確定與這些核酸密碼和多肽密碼比較的序列中的結(jié)構(gòu)基序。在一些實施方式中,所述數(shù)據(jù)儲存裝置可以儲存本發(fā)明的核酸序列和與本發(fā)明的核酸序列基本上相似的序列、或者本發(fā)明的多肽序列和與本發(fā)明的多肽序列基本相似的序列中的至少2、5、10、15、20、25、30或者40個或者更多個序列。本發(fā)明的另一種實施方式提供了用于確定同源性水平的方法,所述同源性水平為本發(fā)明的核酸序列和基本上與該核酸序列相似的序列,或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列與參照核苷酸序列之間的同源性水平。所述方法包括通過使用能確定同源性水平的計算機程序來閱讀核酸密碼或者多肽密碼以及參照核苷酸或者多肽序列,并且能通過所述的計算機程序確定核酸密碼或者多肽密碼和參照核苷酸或者多肽序列的同源性。所述計算機程序可以是用于確定同源性水平的任何計算機程序,包括本文中特別列舉的那些(如具有默認(rèn)參數(shù)的或者具有任何修飾的參數(shù)的BLAST2N)。所述方法可以使用上述的計算機系統(tǒng)以進(jìn)行實施。所述方法還可以通過以下方法進(jìn)行實施,即通過計算機程序閱讀上述的本發(fā)明的核酸序列和與本發(fā)明的核酸序列基本上相似的序列、或者本發(fā)明的多肽序列和與該多肽序列基本上相似的序列中的至少2、5、10、15、20、25、30或者40個或者更多個核酸序列,并且確定核酸密碼或者多肽密碼和參照核苷酸或者多肽序列的同源性。圖11是說明用于確定兩個序列是否相同的計算機中的程序250的一個實施方式的流程圖。所述程序250從起始態(tài)252開始,然后轉(zhuǎn)化到狀態(tài)254,此時,待比較的第一序列被儲存在內(nèi)存中。待比較的第二序列然后儲存在狀態(tài)256的內(nèi)存中。然后,將程序轉(zhuǎn)換到260,此時,讀出第一序列的第一個特征,并轉(zhuǎn)換到狀態(tài)262,此時,讀出第二系列的第一個特征。應(yīng)當(dāng)理解的是,如果所述序列為核苷酸系列,則所述特征為A、T、C、G或U。如果所述序列為蛋白質(zhì)序列,則在一些實施方式中,所述特征為單字母的氨基酸密碼以便容易地對第一和第二序列進(jìn)行比較。然后在決策狀態(tài)264作出兩個特征是否相同的決定。如果它們相同,則所述程序250繼續(xù)循環(huán)直到兩個特征不同為止。如果作出另兩個特征不同的決定,程序250轉(zhuǎn)換到?jīng)Q策狀態(tài)274以決定每一條序列中是否存在其它的特征可以讀出。如果沒有其它的特征可以讀出,則將程序250轉(zhuǎn)換到狀態(tài)276,此時,第一序列和第二序列的同源性水平被顯示在使用者的眼前。同源性水平通過計算序列間相同的特征的比例來確定,所述特征是與第一條序列中所有特征中相同的部分。因此,如果在第一條序列的ioo個核苷酸中的每一個特征與第二條序列中的特征相匹配,貝U,同源性水平為100%?;蛘撸鲇嬎銠C程序可以是能夠?qū)Ρ景l(fā)明提供的核酸序列的核苷酸序列與一種或多種參照序列進(jìn)行比較以確定本發(fā)明的核酸密碼、以及與本發(fā)明核酸序列基本上相同的序列是否與參照核酸序列在一處或者多處存在不同的計算機程序。這種程序任選地記載有關(guān)于參照多核苷酸或者本發(fā)明的核酸序列或者與本發(fā)明的核酸序列基本上相同的序列的長度和插入、刪除或者取代核苷酸的特征。在一些實施方式中,所述計算機程序可以是能夠確定本發(fā)明的核酸序列和與本發(fā)明的核酸序列基本上相同的序列是否含有參照核苷酸序列中的單核苷酸多態(tài)性的程序。因此,本發(fā)明的另一個實施方式提供了一種用于確定本發(fā)明的核酸序列和與本發(fā)明基核酸序列本上相同的序列與參照序列是否在一處或者多處存在不同的方法,該方法包括通過使用計算機程序來閱讀核酸密碼和參照核苷酸序列的步驟,該方法通過所述計算機程序能識別核酸序列間的差異并能識別核酸密碼和參照核苷酸序列之間的差異。在一些實施方式中,所述計算機程序能識別單核苷酸的多態(tài)性。所述方法可以通過上述的計算機系統(tǒng)來實施,該方法闡述在圖11中。所述方法還可以通過以下方式實施,即通過所述計算機程序來閱讀本發(fā)明核酸序列和與本發(fā)明核酸序列基本上相同的序列以及參照核苷酸序列中的至少2、5、10、15、20、25、30或40個或更多個序列,并用所述計算機程序來識別核酸密碼和參照核苷酸序列之間的差巳幵。在另一些實施方式中,所述基于計算機的系統(tǒng)還可以包括用于識別本發(fā)明的核酸序列或者本發(fā)明的多肽序列和基本上與它們相同的序列中的特征的識別器。"識別器"是指一種或多種能識別本發(fā)明的核酸序列或者本發(fā)明的多肽序列中的某些特征的程序。在一些實施方式中,所述識別器可以包括能識別本發(fā)明的核酸序列和與本發(fā)明核酸序列基本上相同的序列中可讀框的程序。圖12是說明用于檢測序列中存在特征的識別器程序300的一個實施方式的流程圖。所述程序300在起始狀態(tài)302開始,并然后轉(zhuǎn)化到狀態(tài)304,此時,待檢測特征的第一序列被存儲在計算機系統(tǒng)100的內(nèi)存115中。然后將程序300轉(zhuǎn)化到狀態(tài)306,此時,開放序列特征的數(shù)據(jù)庫。這種數(shù)據(jù)庫包括每一種特征的屬性以及該特征的名稱的列表。例如,所述特征的名稱可以是"起始密碼子",其屬性為"ATG"。又例如,特征名稱為'TAATAA盒",其特征屬性為"TAATAA"。這種數(shù)據(jù)庫的一個實例是由威斯康星大學(xué)遺傳學(xué)計算機組(theUniversityofWisconsinGeneticsComputerGroup)倉鍵的。或者所述特征可以是如a螺旋、P折疊的結(jié)構(gòu)多肽的基序,或者是如酶活性位點、螺旋-轉(zhuǎn)角-螺旋基序或者本領(lǐng)域技術(shù)人員公知的其它基序的結(jié)構(gòu)多肽基序。一旦特征數(shù)據(jù)庫在狀態(tài)306被打開,則將程序300轉(zhuǎn)化到狀態(tài)308,此時,從所述數(shù)據(jù)庫中讀出第一特征。然后在狀態(tài)310對第一特征的屬性與第一序列進(jìn)行比較。然后在決策狀態(tài)316作出所述特征的屬性是否在第一序列中找到的決定。如果找到所述屬性,然后將所述程序轉(zhuǎn)換到狀態(tài)318,此時,找到的特征的屬性顯示在使用者面前。然后將所述程序300轉(zhuǎn)換到?jīng)Q策狀態(tài)320,此時,作出在所述數(shù)據(jù)庫中是否存在更多的特征的決定。如果不存在更多的特征,然后,將所述程序300終止在終止?fàn)顟B(tài)324。然而,如果在所述數(shù)據(jù)庫中存在更多的特征,則所述程序300在狀態(tài)326下閱讀下一個序列特征,并循環(huán)到狀態(tài)310,此時,對下一個特征的屬性與第一序列進(jìn)行比較。應(yīng)當(dāng)指出的是如果在決策狀態(tài)316下,在第一序列中沒有發(fā)現(xiàn)所述特征的屬性,則所述程序300將直接轉(zhuǎn)換到?jīng)Q策狀態(tài)320以確定在所述數(shù)據(jù)庫中是否存在更多的特征。因此,本發(fā)明的另一個實施方式提供了一種識別方法,該方法用于識別本發(fā)明的核酸序列和與本發(fā)明的核酸序列基本上相同的序列中的特征,或者本發(fā)明的多肽序列和與本發(fā)明多肽序列基本上相同序列中的特征,該方法包括通過使用計算機程序閱讀所述核酸密碼或者多肽密碼,并通過所述計算機程序識別所述核酸密碼中的特征,所述計算機程序能夠識別這些序列中的特征。在一些實施方式中,所述計算機程序包括能夠識別可讀框的計算機程序。所述方法還可以通過以下方式實施,即,通過所述計算機程序閱讀本發(fā)明核酸序列和與本發(fā)明核酸序列基本上相同的序列中的單一序列或者至少2、5、10、15、20、25、30或40個或更多個序列,并用該計算機程序識別核酸密碼或者多肽密碼中的特征??梢砸远喾N數(shù)據(jù)處理程序并以多種格式來儲存和操縱本發(fā)明的核酸序列和與本發(fā)明核酸序列基本上相同的序列,或者本發(fā)明的多肽序列和與本發(fā)明多肽序列基本上相同序列。例如,本發(fā)明的核酸序列和與本發(fā)明核酸序列基本上相同的序列,或者本發(fā)明的多肽序列和與本發(fā)明多肽序列基本上相同序列可以儲存為WORD處理文件的文本,例如MicrosoftWORDtm或WORDPERFECTTM或者儲存為本領(lǐng)域的技術(shù)人員熟知的各種數(shù)據(jù)庫程序中的ASCII文件,如DB2tm、SYBASEtm或者ORACLE。此外,可以使用許多的計算機程序和數(shù)據(jù)庫以對序列和識別序列進(jìn)行比對,或者作為待與本發(fā)明的核酸序列和與本發(fā)明核酸序列基本上相同的序列,或者本發(fā)明的多肽序列和與本發(fā)明多肽序列基本上相同序列進(jìn)行比較的參照核苷酸序列或者多肽序列的數(shù)據(jù)源。下述的列表不是為了限制本發(fā)明,而是為了提供能用于本發(fā)明的核酸序列和與本發(fā)明核酸序列基本上相同的序列,或者本發(fā)明的多肽序列和與本發(fā)明多肽序列基本上相同序列的程序和數(shù)據(jù)庫的指導(dǎo)??梢允褂玫某绦蚝蛿?shù)據(jù)庫包括但不限于MACPATTERNtm(EMBL)5DISCOVERYBASE(MolecularApplicationsGroup)、GENEMINETM(MolecularApplicationsGroup)、LOOK(MolecularApplicationsGroup)、MACLOOK(MolecularApplicationsGroup)、BLASTandBLAST2(NCBI)、BLASTNandBLASTX(Altschuletal,J.Mol.Biol.2JL5:403,1990)、FASTA(PearsonandLipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlagetal.Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPETM(MolecularSimulationsInc,)、Cerius2.DBAccess(MolecularSimulationsInc.)、HYPOGENTM(MolecularSimulationsInc.)、INSIGHTIITM、(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMmTM(MolecularSimulationsInc.)、FELIX(MolecularSimulationsInc.)、DELPHI,(MolecularSimulationsInc.)、QuanteMMTM(MolecularSimulationsInc.)、HOMOLOGY(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDL可獲得的化學(xué)物質(zhì)發(fā)現(xiàn)數(shù)據(jù)庫(MDLAvailableChemicalsDirectorydatabase)、MDL藥物數(shù)據(jù)報道數(shù)據(jù)庫(theMDLDrugDataReportdatabase)、綜合的藥物化學(xué)數(shù)據(jù)庫(theComprehensiveMedicinalChemistrydatabase)、Derwents'sWorldDrugIndexdatabase、theBioByteMasterFiledatabase、基因庫數(shù)據(jù)庫和基因序列數(shù)據(jù)庫(Genseqndatabase)。根據(jù)本發(fā)明公開的內(nèi)容,許多其它程序和數(shù)據(jù)庫對于本領(lǐng)域的技術(shù)人員也是顯而易見的。使用上述程序可以檢測的基序包括編碼亮氨酸拉鏈結(jié)構(gòu)、螺旋-轉(zhuǎn)角-螺旋基序、糖基化位點、泛素化位點、ot螺旋和卩折疊的序列;編碼能指導(dǎo)編碼蛋白質(zhì)分泌的信號肽的信號序列;涉及轉(zhuǎn)錄調(diào)節(jié)的序列,如同源框、酸性序列片段(acidicstretches)、酶活性位點、底物結(jié)合位點和酶切割位點。核酸的雜交本發(fā)明提供了分離的、合成的或者重組的核酸,該核酸能夠在嚴(yán)格條件下與本發(fā)明的序列雜交,本發(fā)明的序列為SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQ][DNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO,51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQEDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDN0.255、SEQIDN0.257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338。所述嚴(yán)格條件可以是高度嚴(yán)格條件、中度嚴(yán)格條件、或低度嚴(yán)格條件,包括本文所述的高度的或者降低的嚴(yán)格的條件。在一些實施方式中,洗滌條件的嚴(yán)格性是決定核酸是否屬于本發(fā)明的范圍的條件,這將在下文中將進(jìn)行討論。"雜交"是指核酸鏈與互補鏈通過堿基配對結(jié)合的過程。雜交反應(yīng)是靈敏性的和選擇性的,從而使研究的特定的序列在樣品中以低濃度存在時,就可以被確定。適當(dāng)?shù)膰?yán)格條件可以通過,例如,鹽或者甲酰胺在預(yù)雜交和雜交溶液中的濃度進(jìn)行定義,或者通過雜交溫度進(jìn)行定義,這些是本領(lǐng)域的技術(shù)人員所公知的。在另一些實施方式中,可以通過降低鹽的濃度、增加甲酰胺的濃度或者提高雜交溫度來提高嚴(yán)格性。在另一些實施方式中,本發(fā)明的核酸可以通過它們在本文所述的各種嚴(yán)格條件下(如高、中和低)的雜交能力來限定。在一些實施方式中,在高度嚴(yán)格條件下的雜交包括在約37"C-42'C下甲酰胺的濃度為約50%。在一些實施方式中,所述雜交的條件包括降低嚴(yán)格性的條件,如在3(TC-35。C下甲酰胺的濃度為約35%-25%。在一些實施方式中,所述雜交的條件包括高嚴(yán)格性的條件,如在約42"C下甲酰胺的濃度為約50%、5xSSPE、0.3%SDS和200嗎/ml的剪切的和變性的鮭魚精子DNA。在一些實施方式中,所述雜交的條件包括降低嚴(yán)格性的條件,如在降低的溫度為35。C下甲酰胺的濃度為約35%。可以通過計算所研究的核酸中的嘌呤與嘧啶的比例,來進(jìn)一步縮小對應(yīng)于特定嚴(yán)格性水平的溫度范圍,并相應(yīng)地調(diào)節(jié)溫度。上述范圍和條件的變化是本領(lǐng)域技術(shù)人員所公知的。在另一些實施方式中,通過在嚴(yán)格條件下的雜交能力限定的本發(fā)明的核酸的長度,可以在本發(fā)明核酸的約五個殘基至全長之間;例如,它們的長度可以是至少為5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多個殘基。長度小于全長的核酸也包括在內(nèi)。這些核酸可以用作,例如雜交探針、標(biāo)記探針、PCR寡核苷酸探針、siRNA或miRNA(單鏈或者雙鏈)、反義鏈或者編碼抗體結(jié)合肽(抗原決定簇)的序列、基序和活性位點等。在一些實施方式中,本發(fā)明的核酸可以通過在高度嚴(yán)格條件下雜交的能力來限定,所述高度嚴(yán)格條件包括在約37"C-42t:下甲酰胺的濃度為約50%。在一些實施方式中,本發(fā)明的核酸可以通過在降低嚴(yán)格性條件下雜交的能力來限定,所述降低嚴(yán)格性條件包括在約3(TC-35。C下甲酰胺的濃度為約35%-25%。或者,在一些實施方式中,本發(fā)明的核酸可以通過在高度嚴(yán)格條件下雜交的能力來限定,所述高度嚴(yán)格條件包括在42"C下、甲酰胺的濃度為約50%、5xSSPE、0.3%SDS和封閉核酸的重復(fù)序列,如cot-l或者鮭魚精子DNA(如200pg/ml的剪切的變性的鮭魚精子DNA)。在一些實施方式中,本發(fā)明的核酸可以通過在降低嚴(yán)格性條件下雜交的能力來限定,所述降低嚴(yán)格性條件包括在約35。C或者42"C下,甲酰胺的濃度為約35%或者40%。在核酸雜交反應(yīng)中,用于獲得特定嚴(yán)格性水平的條件根據(jù)被雜交的核酸的性質(zhì)變化。例如,在選擇雜交的條件時,可以考慮核酸雜交區(qū)域的長度、互補的程度、核苷酸的組成(如GC與AT的含量)和核酸的類型(如RNA和DNA)。另一個考慮的因素是核酸中是否有一個核酸分子被固定在如過濾器上。所述雜交可以在低度嚴(yán)格條件、中度嚴(yán)格條件或者高度嚴(yán)格條件下進(jìn)行。作為核酸雜交的一個實例,含有固定的變性的核酸的聚合物膜首先在45。C下于溶液(溶液含有0.9MNaCl、50mMNaH2PO4、pH7.0、5.0mM乙二胺四乙酸二鈉(Na2EDTA)、0.5%SDS(十二垸基硫酸鈉)、10xDenhardt's和0.5mg/ml的多核糖腺苷酸)中預(yù)雜交30分鐘。然后向溶液中加入約2X107cpm(專一性活性為4-9x108cpm/Vg)的32P末端標(biāo)記的寡核苷酸探針。在孵育12-16小時后,在室溫下用含有0.5。/。SDS的lxSET(150mMNaC1、20mMTris鹽酸、pH7.8、1mMNa2EDTA)洗滌30分鐘,隨后用新配制的lxSET在溫度為Tm-l(TC下,洗滌寡核苷酸探針30分鐘。然后將膜暴露在自動放射薄膜上,以檢測雜交信號。以上雜交都可以認(rèn)為是在高度嚴(yán)格條件下進(jìn)行的。在雜交后,洗滌過濾器,以除去任何非特異性結(jié)合的可檢測的探針。用于洗滌所述過濾器的嚴(yán)格條件也可以根據(jù)被雜交的核酸的性質(zhì)變化,例如,被雜交核酸的長度、互補的程度、核苷酸序列的組成(如GC與AT的含量)和核酸的類型(如RNA和DNA)。逐漸提高洗滌的嚴(yán)格性條件的實例為在窒溫下用2xSSC、0.1。/。SDS洗滌15分鐘(低度嚴(yán)格條件);在室溫下用0.1xSSC、0.5%SDS洗滌30分鐘到1小時(中度嚴(yán)格條件);在雜交溫度到68。C之間用O.lxSSC、0.5%SDS洗滌15-30分鐘(高度嚴(yán)格條件);和在72。C下用0.15MNaCl洗滌15分鐘(極高嚴(yán)格性條件)。最終在低度嚴(yán)格條件下(在室溫下用O.lxSSC洗滌)進(jìn)行洗滌。上述實施例僅僅說明了可以用于洗滌過濾器的一組條件。本領(lǐng)域的技術(shù)人員知道存在許多方法進(jìn)行不同嚴(yán)格性條件下的洗滌。下文給出了一些其它的實例。在一些實施方式中,所述雜交的條件包括洗滌步驟,該洗滌步驟包括在室溫下在溶液(lx150mMNaCl、20mMTris鹽酸、pH7.8、1mMNa2EDTA、0.5%SDS)中洗滌30分鐘,隨后用新制備的溶液洗滌30分鐘。與探針雜交的核酸通過射線自顯影方法或者其它常規(guī)的方法來確定??梢詫ι鲜龇椒ㄟM(jìn)行改進(jìn),以檢測與所述探針具有降低的序列同一性(同源性)水平的核酸。例如,為了獲得與檢測的探針具有降低的同一性(特異性)的核酸,可以使用降低的嚴(yán)格性條件。例如,在含有約lM的Na+緩沖液中,所述雜交的溫度可以以5的變化程度從68。C降低到42t:。在雜交后,可以在雜交溫度下用2xSSC、0.5%SDS洗滌過濾器。在上述條件中,如果溫度高于50°C,就認(rèn)為是中等嚴(yán)格性的雜交條件,溫度低于5(TC就認(rèn)為是低的嚴(yán)格性雜交條件。"中等嚴(yán)格性的"雜交條件的特定的實例為上述的雜交在55。C進(jìn)行。"低的嚴(yán)格性的,,雜交條件的特定的實例為上述的雜交在45。C進(jìn)行?;蛘?,雜交可以在42。C下如含有甲酰胺的6xSSC的緩沖液中進(jìn)行。在這種情況下,甲酰胺在雜交緩沖液中的濃度可以以5%的變化程度從50%降低到0%,以檢測與探針具有降低的特異性水平的克隆。在雜交后,可以在5(TC下用6xSSC、0.5%SDS洗滌濾器。在上述的條件中,如果甲酰胺的濃度高于25%,則被認(rèn)為是"中度嚴(yán)格"條件;如果甲酰胺的濃度低于25%,則被認(rèn)為是"低的嚴(yán)格性"條件。"中度嚴(yán)格"雜交條件的特定的實例為上述的雜交在30%的甲酰胺中進(jìn)行。"低度嚴(yán)格"雜交條件的特定的實例為上述的雜交在10%的甲酰胺進(jìn)行。然而,雜交方式的選擇可以是不重要的因素一洗滌條件的嚴(yán)格性是決定核酸是否屬于本發(fā)明的范圍內(nèi)的條件。用于鑒定核酸是否屬于本發(fā)明范圍內(nèi)的洗滌條件包括,例如鹽的濃度為約0.02摩爾,pH為7和溫度為至少約50°C、或者為約55。C到約60°C;或者鹽濃度為約0.15MNaCl,72°C,洗滌約15分鐘;或者,鹽濃度為約0.2xSSC,溫度至少為約5(TC、或者為約55"C到約6(TC,洗滌約15到約20分鐘;或者,雜交復(fù)合物在室溫下用含有0.1。/。SDS的鹽濃度為約2xSSC的溶液洗滌兩次,洗滌15分鐘,然后在68°C,用含有0.1%SDS的O.lxSSC洗滌15分鐘;或者為等效的條件。參見Sambrook等,MOLECULARCLONING:ALABORATORYMANUAL(2nded.),vols.1-3,ColdSpringHarborLaboratory(1989),LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)andAusubel,ed.JohnWiley&Sons,Inc.,NewYork(1997)foradescriptionofSSCbufferandequivalentconditions。這些方法可以用于分離或者鑒定本發(fā)明的核酸和與本發(fā)明的核酸基本上相似的序列。例如,上述方法可以用于分離或者鑒定以下核酸與選自以下序列組成的組中的核酸序列的序列同一性(特異性)至少為約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、61%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸,所述以下序列為本發(fā)明的一種序列和與本發(fā)明序列基本上相似的序列,或者含有本發(fā)明的序列中的至少約10、15、20、25、30、35、40、50、75、100、150、200、300、400或500個組成型堿基的片段和與該片段互補的序列??梢允褂脤Ρ鹊姆椒▉頇z測序列同一性(同源性)。例如,所述同源的多核苷酸可以具有本文所述的編碼序列的天然存在的等位基因變體的編碼序列。與本發(fā)明核酸進(jìn)行比較時,所述等位基因變體可以具有取代的、刪除的或者插入的一個或者多個核苷酸。因此,當(dāng)采用序列比對的方法(如具有默認(rèn)參數(shù)的FASTA版本3.0t78算法)進(jìn)行檢測時,上述方法可以用于分離下述核酸編碼與本發(fā)明多肽或者含有本發(fā)明多肽中的至少5、10、15、20、25、30、35、40、50、75、100或者150個組成型氨基酸的片段同一性(同源性)至少為約99%、至少為約95%、至少為約90%、至少為約85%、至少為約80%、至少為約75%、至少為約70%、至少為約65%、至少為約60%、至少為約55%、或者至少為約50%的多肽的核酸。寡核苷酸探針和使用這些探針的方法
技術(shù)領(lǐng)域:
:本發(fā)明還提供了核酸探針,例如,所述核酸探針可以用于識別、擴增、或者分離編碼具有醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的活性的多肽或者它們的片段;或者所述核酸探針可以用于識別醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的基因。在一些實施方式中,所述探針包括本發(fā)明的核酸的至少約10個組成型堿基。或者,本發(fā)明的探針可以是本發(fā)明核酸的序列中的至少約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150個組成型堿基,或者約10-50、約20-60、約30-70個組成型堿基。所述探針通過結(jié)合和/或雜交來識別核酸。所述探針可以用于本發(fā)明的包括毛細(xì)管陣列在內(nèi)的陣列中,參見下文的討論。本發(fā)明的探針還可以用于分離其它的核酸或者多肽。本發(fā)明的分離的、合成的、或者重組的核酸,與該核酸互補的序列,或者含有本發(fā)明的序列中的一種序列中的至少約10、15、20、25、30、35、40、50、75、100、150、200、300、400或者500個組成型堿基的片段,或者與所述片段互補的序列,可以被用作檢測生物樣品(如污染的樣品)中是否含有具有本發(fā)明的核酸的生物或者是否含有能獲得所述核酸的生物的探針。在這種方法中,對潛在含有可以從中分離出所述核酸的生物的生物樣品進(jìn)行分離,并從該樣品中獲得核酸。在能夠使上所述探針專一性地雜交到本文中所闡述的任何互補序列的條件下,使核酸與所述探針接觸。如果必要的話,使所述探針專一性地雜交到互補序列上的條件可以通過以下方法確定將探針與源自已知含有互補序列的樣品中的互補序列接觸,并與不含有互補序列的對照序列接觸。雜交條件(如雜交緩沖液的鹽濃度、雜交緩沖液的甲酰胺濃度、或者雜交溫度)可以根據(jù)識別的條件變化,所述識別的條件是使探針專一性地雜交到互補核酸上的條件。如果樣品中含有能分離出所述核酸的生物體,則能夠檢測到專一性雜交的探針。所述雜交還可以通過用可以檢測的試劑,對標(biāo)記探針進(jìn)行檢測,所述可以檢測的試劑為,如放射性同位素、熒光染料或者能夠催化形成可檢測的產(chǎn)物的酶。使用標(biāo)記的探針對樣品中存在互補核酸進(jìn)行檢測的許多方法為本領(lǐng)域的技術(shù)人員所熟知。這些方法包括DNA印跡方法、蛋白質(zhì)印跡方法、集落雜交方法和斑點印跡。用于所有這些方法的方案被描述在Ausubel等,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.(1997)禾口Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)中。或者,在擴增反應(yīng)中可以使用多于一個探針(至少一種探針能專一性地雜交到存在所述核酸的樣品中的任何互補序列),以檢測樣品中是否存在含有本發(fā)明核酸序列的生物體(如可以從中分離得到所述核酸的生物體)。在一些實施方式中,所述探針包括寡核苷酸。在一些實施方式中,所述擴增反應(yīng)包括PCR反應(yīng)。所述PCR方法描述在上述的AusubelandSambrook中?;蛘撸鰯U增可以包括連接酶鏈?zhǔn)椒磻?yīng)、3SR(自維持序列復(fù)制)、或者鏈置換反應(yīng)(見Barany,F(xiàn).,"TheLigaseChainReactioninaPCRWorld",PCRMethodsandApplications1:5-16,1991;E.Fahy等,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PCRMethodsandApplications1:25-33,1991;禾口WalkerG.T.等,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch20:1691-1696,1992)。在這些方法中,將樣品中的核酸與所述探針接觸,進(jìn)行擴增反應(yīng),并對任何得到的擴增產(chǎn)物進(jìn)行檢測??梢酝ㄟ^對反應(yīng)產(chǎn)物進(jìn)行凝膠電泳,并用溴化乙錠對所述凝膠進(jìn)行染色來檢測擴增產(chǎn)物。或者,可以用放射性同位素對一種或多種探針進(jìn)行標(biāo)記,然后在凝膠電泳后,通過射線自顯影方法對放射性擴增產(chǎn)物的存在進(jìn)行檢測。源自臨近本發(fā)明序列末端的序列的探針還可以用于染色體步移方法,以檢測含有位于臨近本發(fā)明序列的基因組序列的克隆。這種方法可以從宿主生物體中分離出編碼其它蛋白質(zhì)的基因。在一些實施方式中,本發(fā)明的分離的、合成的或者重組的核酸、與該核酸互補的序列、或者含有本發(fā)明的序列中的一種序列中的至少約10、15、20、25、30、35、40、50、75、100、150、200、300、400或者500個組成型堿基的片段、或者與所述片段互補的序列,可以用于對有關(guān)的核酸進(jìn)行識別和分離。在一些實施方式中,所述有關(guān)的核酸可以是來自除了能分離出所述核酸的生物體之外的生物的cDNAs或者基因組DNAs。例如,其它的生物可以是相關(guān)的生物。在這種方法中,在能夠使探針專一性地雜交到相關(guān)序列上的條件下,將核酸樣品與所述探針接觸。然后采用上述的任何方法對探針與來自相關(guān)生物中的核酸的雜交進(jìn)行檢測。通過改變能夠用于對可檢測探針上的雜交進(jìn)行鑒定的核酸,如cDNAs或者基因組DNAs的雜交條件的嚴(yán)格性可以對具有與探針不同水平的同源性的核酸進(jìn)行鑒定和分離。所述嚴(yán)格性可以通過使雜交在低于所述探針的熔點溫度的不同的溫度下進(jìn)行而改變。所述熔點溫度,即Tm,是50%的靶序列雜交到與之完全互補的探針上時的溫度(在確定的離子強度和pH下)。對于特定的探針,非常嚴(yán)格的條件是等于或者Tm低于約5"C。可以使用以下的公式來計算熔點溫度。對于長度處于14和70個核苷酸之間的探針,其熔點溫度(Tm)通過以下公式計算Tm=81.5+16.6(log[Na+])+0.41(片段G+C)-(600/N),其中N是探針的長度。如果雜交在含有甲酰胺的溶液中進(jìn)行,所述熔點溫度可以使用以下方程計算Tm=81.5+16.6(log[Na+])+0.41(片段G+C)-(0.63%甲酰胺)-(600/N),其中,N是探針的長度??梢栽诤幸韵鲁煞值娜芤褐羞M(jìn)行預(yù)雜交6xSSC、5xDenhardt's試齊U、0.5%SDS、100|ag/ml變性鮭魚精子DNA片段,或者含有6xSSC、5xDenhardt's試劑、0.5%SDS、100昭/ml變性鮭魚精子DNA片段、50%甲酰胺。SSC和Denhardt's溶液的配方列在如上所述的Sambrook等中。在一些實施方式中,通過將可檢測的探針加入上述的預(yù)雜交溶液中進(jìn)行雜交。其中,所述探針含有雙鏈DNA,在將所述雙鏈DNA加入到所述雜交溶液之前,所述雙鏈DNA已經(jīng)被變性。在一些實施方式中,所述過濾器與雜交溶液接觸足夠的時間,以使所述探針雜交到含有與該探針互補的序列或者與該探針同源的序列的cDNAs或者基因組DNAs。對于長度超過200個核苷酸的探針,所述雜交可以在比Tm低15-25。C的溫度下進(jìn)行。對于較短的探針,如寡核苷酸探針,所述雜交可以在比Tm低5-l(TC的溫度下進(jìn)行。在一些實施方式中,對于在6xSSC中進(jìn)行的雜交,所述雜交在約68"C下進(jìn)行。通常,對于在含有50%的甲酰胺的溶液中進(jìn)行的雜交,所述雜交在約42r下進(jìn)行。醛縮酶表達(dá)的抑制本發(fā)明提供了與本發(fā)明核酸互補(如與它們反義的序列)的核酸,如編碼醛縮酶的核酸,所述核酸包括反義鏈、siRNA、miRNA、核酶。本發(fā)明的包括反義序列的核酸能夠抑制編碼醛縮酶的基因的運輸、剪接或者轉(zhuǎn)錄。所述抑制可以通過耙向到基因組DNA或者信使RNA上而起作用??梢酝ㄟ^如雜交和/或切除,來抑制被靶向的核酸的轉(zhuǎn)錄或者功能。本發(fā)明的一組實例組包括寡核苷酸,所述寡核苷酸能夠結(jié)合到醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶),或者信使上;在上述任何情況下都能阻止或者抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的產(chǎn)生或者功能。所述連接可以通過序列特異性的雜交來實現(xiàn)。另一類有用的抑制劑包括能導(dǎo)致醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)信息失活或者切割的寡核苷酸。所述寡核苷酸具有能夠引起所述切割的酶的活性,如核酶。所述寡核苷酸可以通過化學(xué)修飾或者連接到能夠切割所述互補核酸的酶或者組成上??梢詫υS多不同的所述寡核苷酸進(jìn)行篩選,以得到具有所需活性的寡核苷酸。因此,本發(fā)明提供了用于在核酸水平和/或蛋白質(zhì)水平來抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表達(dá)的多種組成,如含有本發(fā)明的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的序列,和本發(fā)明的抗醛縮酶(如抗丙酮酸醛縮酶,如抗HMG和/或KHG醛縮酶)的抗體的反義鏈、siRNA、miRNA和核酶。醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表達(dá)的抑制可以具有多種工業(yè)應(yīng)用。例如,抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表達(dá)可以減緩或者抑制腐敗。在一些實施方式中,使用抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)表達(dá)和/或活性的成分以減緩或者抑制腐敗(spoilage),例如,所述成分可以為抗體、反義寡核苷酸、核酶、siRNA和miRNA。因此,在一些實施方式中,本發(fā)明提供了方法和成分,所述方法包括將本發(fā)明的抗體、反義寡核苷酸、核酶、siRNA和miRNA施用到植物或者植物產(chǎn)物(如,谷物、水果、種子、根、葉等)上,以減緩或者抑制腐敗。所述成分還可以由所述植物(如轉(zhuǎn)基因植物)或者由另一些生物體(如用本發(fā)明的醛縮酶(如,丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)轉(zhuǎn)化的細(xì)菌或者其它微生物)表達(dá)得到。用于抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表達(dá)的成分(如,反義鏈、iRNA、核酶和抗體)可以用作藥物組合物,如抗病原體藥或者其它的治療劑,如抗微生物(如沙門氏菌)的治療劑。反義寡核苷酸本發(fā)明提供了能夠結(jié)合醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)信息的反義寡聚核苷酸,在一些實施方式中,所述反義寡聚核苷酸能通過靶向mRNA來抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的活性。設(shè)計反義寡核苷酸的策略被描述在科學(xué)和專利文獻(xiàn)中,并且本領(lǐng)域的技術(shù)人員根據(jù)本發(fā)明并通過使用新的試劑,能夠設(shè)計醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的寡核苷酸。例如,用于篩選有效的反義寡核苷酸基因的步移/RNA定位方法是本領(lǐng)域公知的,見Ho(2000)MethodsEnzymol.314:168-183,該文獻(xiàn)描述了RNA定位分析的方法,該方法基于標(biāo)準(zhǔn)的分子技術(shù)以提供用于選擇潛在的反義序列的容易的可靠的方法;還可以參見Smith(2000)Eur.J.Pharm.Sci,11:191-198。天然存在的核酸可以用作反義寡核苷酸。所述反義寡核苷酸可以是任何長度,例如,在另一些實施方式中,所述反義寡核苷酸的長度為約5-100、約10-80、約15-60、約18-40。最佳的長度可以通過常規(guī)的篩選來確定。所述反義寡核苷酸可以以任何的濃度存在。最佳的濃度可以通過常規(guī)的篩選來確定。已知存在有大量的合成的、非天然的核苷酸和核酸類似物,可以解決潛在的問題。例如,可以使用含有非離子骨架(如N-(2-氨基乙基)甘氨酸單元)的肽核酸(PNAs)。還可以使用連接有硫代磷酸酯的反義寡核苷酸,關(guān)于這方面的內(nèi)容描述在WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N.J.,1996)。本發(fā)明提供的具有合成DNA骨架類似物的反義寡核苷酸還可以包括二硫代磷酸酯、甲基磷酸酯、磷酰氨(phosphoramidate)、烷基磷酸三酯、氨基磺酸鹽、3'-硫縮醛、亞甲基(甲基亞氨基)、3'-N-氨基甲酸鹽和上述的嗎啉代氨基甲酸鹽核酸。可以使用組合的化學(xué)方法以產(chǎn)生大量的寡核苷酸,可以從這些寡核苷酸中快速地篩選出對任何的靶具有適當(dāng)?shù)慕Y(jié)合親和力和特異性的寡核苷酸,例如,所述耙可以為本發(fā)明的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的正義和反義鏈序列(見Gold(1995)J.ofBiol.Chem.270:13581-13584)。抑制性核酶本發(fā)明提供了能夠結(jié)合醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)信息的核酶。這些核酶可以通過靶向mRNA來抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的活性。設(shè)計核酶和選擇醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)作為靶的專一性反義序列的策略在科學(xué)和專利文獻(xiàn)中有描述,并且本領(lǐng)域的技術(shù)人員根據(jù)本發(fā)明并通過使用新的試劑能夠設(shè)計出這些核酶。所述核酶通過核酶的靶RNA結(jié)合部分結(jié)合到靶RNA而起作用,所述核酶的靶RNA結(jié)合部分以與切割靶RNA的RNA酶性部分非常相似的方式被結(jié)合。因此,所述核酶通過互補堿基對來識別和結(jié)合靶RNA,并且一旦結(jié)合到正確的識別位點后,所述核酶發(fā)揮酶的作用切割并鈍化靶RNA。如果切割位于編碼序列中,靶RNA以這種方式切割將破壞直接合成編碼蛋白的能力。在核酶結(jié)合并切割靶RNA后,它將從該RNA上釋放下來并反復(fù)結(jié)合以切割新的靶。在一些情況下,所述核酶的酶的性質(zhì)比其它的技術(shù)更有益,如反義技術(shù)(核酸分子簡單地結(jié)合到靶核酸上,以抑制核酸的轉(zhuǎn)錄、翻譯或者與其它分子的結(jié)合),因為,發(fā)揮治療作用所必需的有效核酶的濃度比反義寡核苷酸的濃度低。這種潛在的優(yōu)點反映了所述核酶作為酶而起作用。因此,單個的核酶分子能夠切割多個靶RNA分子。在一些實施方式中,所述核酶是高度專一的抑制劑,且抑制的專一性不僅取決于結(jié)合的堿基成對的機制,而且取決于哪些分子抑制所述的分子結(jié)合的RNA的表達(dá)機制。也就是說,所述抑制是通過切割RNA靶導(dǎo)致的,并且所述專一性被定義為被切割的靶RNA與被切割的非靶RNA的比例。所述切割的機制還取決于除了涉及堿基成對之外的其它因素。因此,所述核酶作用的專一性作用高于能結(jié)合相同RNA位點的反義寡核苷酸作用的專一性。本發(fā)明的核酶(如具有酶活性的核酶RNA分子)可以以錘頭基序、發(fā)夾基序、5肝炎病毒基序,I類內(nèi)含子基序和/或與RNA前導(dǎo)序列相關(guān)的RNaseP-類似的RNA基序形成。錘頭基序的實例描述在Rossi(1992)AidsResearchandHumanRetroviruses8:183中;發(fā)夾基序的實例描述在Hampel(1989)Biochemistry28:4929,andHampel(19卯)Nuc.AcidsRes.18:299中;5肝炎病毒基序的實例描述在Perrotta(1992)Biochemistry31:16中;RNaseP基序描述在Guerrier-Takada(1983)Cell35:849中;和I類內(nèi)含子基序描述在Cech的美國專利No.4,987,071中。本發(fā)明不限于上述的這些特殊的基序。本領(lǐng)域的技術(shù)人員將會認(rèn)識到本發(fā)明的核酶(如本發(fā)明的具有酶活性的RNA分子)可以具有與一種或多種靶基因RNA區(qū)域互補的專一性的底物結(jié)合位點。本發(fā)明的核酶可以在底物結(jié)合位點中或者其周圍具有核苷酸序列,所述底物結(jié)合位點賦予核酶分子切割RNA的活性。RNA干擾(RNAi)在一些實施方式中,本發(fā)明提供了RNA抑制性分子,也稱為"RNAi"分子,該分子包括本發(fā)明的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的序列。所述RNAi分子包括雙鏈RNA(dsRNA)分子,如siRNA、miRNA和/或短發(fā)夾RNA(shRNA)分子。RNAi分子,如siRNA(小的抑制性RNA)和/或miRNA(微小RNA),可以抑制醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)基因的表達(dá)。在一些實施方式中,RNAi分子,如siRNA禾口/或miRNA的長度為約11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或更長的雙螺旋的核苷酸。然而,本發(fā)明不限于任何特定的作用機制,RNAi可以進(jìn)入細(xì)胞并導(dǎo)致類似的或者相同的序列的單鏈RNA(ssRNA)(包括內(nèi)源性的mRNAs)降解。當(dāng)細(xì)胞暴露于雙鏈RNA(dsRNA)的情況下,同源基因的mRNA被稱為RNA干擾(RNAi)的過程選擇性地降解。RNAi作用的基本機制可能是與特定基因相匹配的雙鏈(dsRNA)斷裂成被稱為干擾RNA的短的片段,這種短片段能引發(fā)與該短片段相匹配的mRNA降解。在一些實施方式中,本發(fā)明的RNAi's被用于基因沉默治療中,見Shuey(2002)DrugDiscov.Today7:1040-1046。在一些實施方式中,本發(fā)明提供了一種使用RNAi's分子選擇性降解RNA,根據(jù)本發(fā)明,所述RNAi's分子為如siRNA禾卩/或miRNA。所述過程可以在體外、離體(exvivo)或者體內(nèi)實施。在一些實施方式中,本發(fā)明的RNAi分子用于可以在細(xì)胞、器官或者動物中產(chǎn)生功能缺失變異。在一方面,通過內(nèi)化結(jié)合到含有待吸附的RNAi(如微小RNA)的RNA結(jié)合蛋白上的靶細(xì)胞的專一性配體,將RNAi導(dǎo)入到細(xì)胞內(nèi)。所述配體對于特定的靶細(xì)胞表面抗原是專一性的。所述配體在結(jié)合到所述細(xì)胞表面抗原上后可以自動地內(nèi)化。如果所述獨特的細(xì)胞表面的抗原在結(jié)合到其配體后不能自動地內(nèi)化,那么可以通過將富含精氨酸的肽或者其它能透過膜的肽而摻入到所述配體或者RNA結(jié)合蛋白的結(jié)構(gòu)中,或者將所述的肽附加到所述配體或者RNA結(jié)合蛋白上,以促進(jìn)內(nèi)化。參見美國專利申請發(fā)明者C·索爾海特,D·韋納,E·伯克,P·M·??怂?P·盧京比爾,S·C·麥克法倫,S·J·戈特,T·理查森,趙立山申請人:嘉吉公司