具有葡糖淀粉酶活性的多肽和編碼該多肽的多核苷酸涉及序列表本申請含有計算機可讀形式的序列表,所述計算機可讀形式通過提述并入本文。涉及生物材料的保藏本申請包含對于生物材料保藏的引用,所述保藏通過提述并入本文。對于其完整信息,參見說明書最后一段。發(fā)明背景發(fā)明領(lǐng)域本發(fā)明涉及具有葡糖淀粉酶活性的多肽和編碼所述多肽的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細胞,以及用于產(chǎn)生和使用所述多肽的方法,和本發(fā)明的葡糖淀粉酶用于淀粉轉(zhuǎn)化以產(chǎn)生發(fā)酵產(chǎn)物如乙醇,和糖漿如葡萄糖的用途。本發(fā)明還涉及包含本發(fā)明的葡糖淀粉酶的組合物。相關(guān)領(lǐng)域描述葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC3.2.1.3)是催化從淀粉或相關(guān)的寡糖和多糖分子的非還原端釋放D-葡萄糖的酶。葡糖淀粉酶由幾種絲狀真菌和酵母產(chǎn)生,其中來自曲霉屬(Aspergillus)的那些在商業(yè)上最為重要。商業(yè)上,使用葡糖淀粉酶將已經(jīng)由α-淀粉酶部分水解的淀粉材料轉(zhuǎn)化為葡萄糖。然后可使用發(fā)酵生物將葡萄糖直接或間接地轉(zhuǎn)化為發(fā)酵產(chǎn)物。商業(yè)性發(fā)酵產(chǎn)物的實例包括醇(例如乙醇,甲醇,丁醇,1,3-丙二醇),有機酸(例如檸檬酸,乙酸,衣康酸,乳酸,葡糖酸,葡糖酸鹽,乳酸,琥珀酸,2,5-二酮-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);氣體(例如H2和CO2),和更復(fù)雜的化合物,包括例如抗生素(例如青霉素和四環(huán)素);酶;維生素(例如核黃素,B12,β-胡蘿卜素);激素,和其他難以合成產(chǎn)生的化合物。發(fā)酵工藝亦常用于可飲用醇類(例如啤酒和葡萄酒)工業(yè)。終產(chǎn)物亦可為糖漿。例如,終產(chǎn)物可為葡萄糖,但亦可例如由葡萄糖異構(gòu)酶轉(zhuǎn)化為果糖或由幾乎等量的葡萄糖和果糖構(gòu)成的混合物。該混合物,或進一步富集果糖的混合物,是整個世界商業(yè)化的最常用的高果糖玉米糖漿(HFCS)。本發(fā)明的一個目的是提供具有葡糖淀粉酶活性的多肽和編碼所述多肽的多核苷酸,其在發(fā)酵產(chǎn)物生產(chǎn)工藝(如乙醇生產(chǎn)工藝,包括由未糊化的生(或未烹制)淀粉的一步乙醇發(fā)酵工藝)中提供高產(chǎn)率/得率(yield)。Uniprot:B0CVJ1公開了來自雙色蠟?zāi)?Laccariabicolor)的多肽且WO2006/069289描述了來自瓣環(huán)栓菌(Trametescingulata)的葡糖淀粉酶。發(fā)明概述已鑒定并表征了由真菌血紅密孔菌(Pycnoporussanguineus)產(chǎn)生并具有葡糖淀粉酶活性的多肽。相應(yīng)地,本發(fā)明在第一個方面涉及具有葡糖淀粉酶活性的分離的多肽,選自下組:(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有優(yōu)選至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,并且甚至最優(yōu)選至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(b)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476所示的催化域具有優(yōu)選至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,并且甚至最優(yōu)選至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(c)多肽,其由多核苷酸編碼,所述多核苷酸在優(yōu)選至少中-高嚴(yán)格條件下,并且最優(yōu)選在高嚴(yán)格條件下與以下雜交:(i)SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列;(ii)包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(d)多肽,其由多核苷酸編碼,所述多核苷酸包含核苷酸序列,所述核苷酸序列與SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列具有優(yōu)選至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,并且甚至最優(yōu)選至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;和(e)SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽的包含一個或多個(幾個)氨基酸的取代、缺失和/或插入變體。本發(fā)明在第二個方面涉及分離的多核苷酸,其包含編碼第一個方面的多肽的核苷酸序列。在進一步的方面,本發(fā)明涉及包含第二個方面的多核苷酸的核酸構(gòu)建體,重組表達載體,重組宿主細胞,轉(zhuǎn)基因植物、植物部分或植物細胞。在又進一步的方面,本發(fā)明涉及產(chǎn)生所述多肽的方法,所述多肽的用途,和包含α-淀粉酶和所述多肽的組合物。定義葡糖淀粉酶:術(shù)語葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,3.2.1.3)定義為催化從淀粉或相關(guān)的寡糖和多糖分子的非還原端釋放D-葡萄糖的酶。就本發(fā)明而言,葡糖淀粉酶活性根據(jù)下文“材料和方法”部分描述的步驟確定。本發(fā)明的多肽具有SEQIDNO:2的成熟多肽或其同源序列,或者SEQIDNO:4的成熟多肽或其同源序列,或者SEQIDNO:6的成熟多肽或其同源序列的葡糖淀粉酶活性的至少20%,優(yōu)選至少40%,優(yōu)選至少45%,更優(yōu)選至少50%,優(yōu)選至少55%,更優(yōu)選至少60%,優(yōu)選至少65%,更優(yōu)選至少70%,優(yōu)選至少75%,更優(yōu)選至少80%,優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,和甚至最優(yōu)選至少100%。分離的多肽:術(shù)語“分離的多肽”用于本文中指從來源分離的多肽。優(yōu)選地,所述多肽如通過SDS-PAGE測定的,為至少1%純,優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純?;旧霞兊亩嚯模盒g(shù)語“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的(associated)的其它多肽材料。因此,優(yōu)選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,甚至更優(yōu)選至少99%純,最優(yōu)選至少99.5%純,并且甚至最優(yōu)選100%純。本發(fā)明的多肽優(yōu)選是基本上純的形式,即,所述多肽制備物基本上(essentially)不含與其天然或重組結(jié)合的其它多肽材料。例如,這能夠通過以下實現(xiàn):通過公知的重組方法或由經(jīng)典純化方法制備多肽。成熟多肽:術(shù)語“成熟多肽”意指為以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個方面,基于預(yù)測SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸1至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),所述成熟多肽是SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573。優(yōu)選地,所述成熟多肽是SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573。由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476定義的序列是催化域,而由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸479至573定義的序列是淀粉結(jié)合域。成熟多肽編碼序列:術(shù)語“成熟多肽編碼序列”在本文中定義為編碼具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。優(yōu)選地,所述成熟多肽編碼序列是由SEQIDNO:1的位置55至159,229至505,573至877,932至1207,1269至1731,1800至1895,1962至2104,SEQIDNO:3或SEQIDNO:5的位置55至159,229至504,571至876,942至1217,1276至1738,1806至1901,1960至2102定義的核苷酸。同一性:參數(shù)“同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關(guān)性。就本發(fā)明而言,兩個氨基酸序列之間的同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)(優(yōu)選3.0.0版或更高版本)的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測定。使用的可選參數(shù)為缺口開啟罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩陣。使用Needle標(biāo)記為“最長同一性(longestidentity)”的輸出結(jié)果(使用-nobrief選項獲得)作為百分比同一性,并計算如下:(同樣的殘基×100)/(比對長度-比對中缺口的總數(shù))就本發(fā)明而言,兩個脫氧核糖核苷酸序列之間的同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文)(優(yōu)選3.0.0版或更高版本)的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定。使用的可選參數(shù)為缺口開啟罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標(biāo)記為“最長同一性”的輸出結(jié)果(使用-nobrief選項獲得)作為百分比同一性,并計算如下:(同樣的脫氧核糖核苷酸×100)/(比對長度-比對中缺口的總數(shù))同源序列:術(shù)語“同源序列”在本文中定義為分別與SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼部分,或者與SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,和甚至最優(yōu)選至少95%,如至少96%,至少97%,至少98%,或甚至至少99%同一性程度的核苷酸序列/多肽序列。多肽片段:術(shù)語“多肽片段”在本文中定義為從SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個或多個(幾個)氨基酸的多肽;其中所述片段具有葡糖淀粉酶活性。優(yōu)選地,片段含有SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的至少500個氨基酸殘基,更優(yōu)選至少450個氨基酸殘基,和最優(yōu)選至少400個氨基酸殘基。具體片段是由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的的氨基酸22至476定義的序列,其包含本發(fā)明的多肽的催化域。亞序列:術(shù)語“亞序列(subsequence)”在本文中定義為從SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列或其同源序列的5’和/或3’端缺失一個或多個(幾個)核苷酸的核苷酸序列;其中所述亞序列編碼具有葡糖淀粉酶活性的多肽片段。優(yōu)選地,亞序列含有SEQIDNO:1的成熟多肽編碼序列、SEQIDNO:3的成熟多肽編碼序列或SEQIDNO:5的成熟多肽編碼序列或其同源序列的至少1500個核苷酸,更優(yōu)選至少1400個核苷酸,和最優(yōu)選至少1200個核苷酸。等位變體(allelicvariant):術(shù)語“等位變體”在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸:術(shù)語“分離的多核苷酸”用于本文中指從來源分離的多核苷酸。優(yōu)選地,多核苷酸如通過瓊脂糖電泳測定的,為至少1%純,優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純。基本上純的多核苷酸:術(shù)語“基本上純的多核苷酸”用于本文指不含其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程的蛋白質(zhì)生產(chǎn)體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區(qū),例如啟動子和終止子。優(yōu)選基本上純的多核苷酸是按重量計至少90%純,優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,甚至更優(yōu)選至少98%純,最優(yōu)選至少99%,并且甚至最優(yōu)選至少99.5%純的。本發(fā)明所述多核苷酸優(yōu)選為基本上純的形式,即,所述多核苷酸制備物基本上不含與其天然或重組結(jié)合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。編碼序列:當(dāng)用于本文時術(shù)語“編碼序列”的意思是直接指定其蛋白產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結(jié)束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA:術(shù)語“cDNA”在本文中定義為可通過逆轉(zhuǎn)錄從自真核細胞獲得的成熟的、剪接的mRNA分子制備的DNA分子。cDNA缺乏通常存在于相應(yīng)的基因組DNA中的內(nèi)含子序列。該起始的、初級的RNA轉(zhuǎn)錄物是mRNA的前體,其經(jīng)歷一系列步驟,最后作為成熟的、剪接的mRNA出現(xiàn)。這些步驟包括通過稱作剪接的過程去除內(nèi)含子序列。因此,來源于mRNA的cDNA不含任何內(nèi)含子序列。核酸構(gòu)建體:術(shù)語“核酸構(gòu)建體”用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或?qū)⑺龊怂岱肿右员緛聿淮嬖谟?nototherwiseexist)自然界中的方式修飾以含有核酸的區(qū)段,或所述核酸分子是合成的。當(dāng)所述核酸構(gòu)建體含有表達本發(fā)明的編碼序列所需的調(diào)控序列時,術(shù)語核酸構(gòu)建體與術(shù)語“表達盒”同義。調(diào)控序列(controlsequence):術(shù)語“調(diào)控序列”在本文定義為包括對編碼本發(fā)明多肽的多核苷酸表達是必需的所有成分。各個調(diào)控序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個調(diào)控序列對于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。最少的情況,調(diào)控序列包括啟動子和轉(zhuǎn)錄和翻譯的終止信號。調(diào)控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調(diào)控序列與編碼多肽的核苷酸序列編碼區(qū)的連接??刹僮鞯剡B接:術(shù)語“可操作地連接”在本文表示這樣的構(gòu)型,其中將調(diào)控序列置于相對于多核苷酸序列的編碼序列的適當(dāng)位置,使得調(diào)控序列指導(dǎo)多肽編碼序列的表達。表達:術(shù)語“表達”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達載體:術(shù)語“表達載體”在本文定義為線性的或環(huán)狀的DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞:如本文中所使用的術(shù)語“宿主細胞”包括任何細胞類型,所述細胞類型對于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的(susceptible)。修飾:術(shù)語“修飾”在本文的意思是,對分別由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列組成的多肽的任何化學(xué)修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個(幾個)氨基酸的取代、缺失和/或插入,以及一個或多個(幾個)氨基酸側(cè)鏈的置換。變體:當(dāng)用于本文,術(shù)語“變體”意指具有葡糖淀粉酶活性的多肽,其在一個或多個(幾個)位置包含改變,即一個或多個(幾個)氨基酸殘基的取代、插入和/或缺失。取代意指用不同的氨基酸取代占據(jù)某位置的氨基酸;缺失意指去除占據(jù)某位置的氨基酸;而插入意指鄰接占據(jù)某位置的氨基酸添加1-3個氨基酸。發(fā)明詳述具有葡糖淀粉酶活性的多肽在第一個方面,本發(fā)明涉及具有葡糖淀粉酶活性的分離的多肽(在下文中稱為“同源多肽”),所述多肽包含氨基酸序列,所述氨基酸序列與SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有優(yōu)選至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,并且甚至最優(yōu)選至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%的同一性程度。優(yōu)選地,所述同源多肽具有氨基酸序列,所述氨基酸序列與SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽相差十個氨基酸,優(yōu)選相差五個氨基酸,更優(yōu)選相差四個氨基酸,甚至更優(yōu)選相差三個氨基酸,最優(yōu)選相差兩個氨基酸,并且甚至最優(yōu)選相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列或其等位變體,或其具有葡糖淀粉酶活性的片段。在另一個優(yōu)選的方面,所述多肽包含SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其等位變體,或其具有葡糖淀粉酶活性的片段。在另一個優(yōu)選的方面,所述多肽由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列或其等位變體,或其具有葡糖淀粉酶活性的片段組成。在第二個方面,本發(fā)明涉及具有葡糖淀粉酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在優(yōu)選非常低嚴(yán)格條件,更優(yōu)選低嚴(yán)格條件,更優(yōu)選中等嚴(yán)格條件,更優(yōu)選中等-高嚴(yán)格條件,甚至更優(yōu)選高嚴(yán)格條件,和最優(yōu)選優(yōu)選非常高嚴(yán)格條件下與以下雜交:(i)SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列;(ii)包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的cDNA序列,(iii)(i)或(ii)的亞序列;或(iv)(i)、(ii)或(iii)的全長互補鏈(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列的亞序列含有至少100個連續(xù)的核苷酸,或優(yōu)選至少200個連續(xù)的核苷酸。而且,所述亞序列可編碼具有葡糖淀粉酶活性的多肽片段。優(yōu)選地,所述互補鏈?zhǔn)荢EQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列的全長互補鏈。SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的核苷酸序列,或其亞序列,以及SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列,或其片段,可用于設(shè)計核酸探針,以根據(jù)本領(lǐng)域內(nèi)公知的方法從不同屬或種的菌株鑒定和克隆編碼具有葡糖淀粉酶活性的多肽的DNA。具體而言,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和分離其中相應(yīng)的基因。這些探針可明顯短于完整序列,但長度上應(yīng)為至少14,優(yōu)選至少25,更優(yōu)選至少35,并且最優(yōu)選至少70個核苷酸。然而,優(yōu)選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優(yōu)選至少300個核苷酸,更優(yōu)選至少400個核苷酸,或最優(yōu)選至少500個核苷酸。可使用甚至更長的探針,例如長度為優(yōu)選至少600個核苷酸,更優(yōu)選至少700個核苷酸,甚至更優(yōu)選至少800個核苷酸,或最優(yōu)選至少900個氨基酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以探測相應(yīng)的基因(例如,用33P、32P、3H、35S、生物素或抗生物素蛋白(avidin)標(biāo)記)。這些探針涵蓋于本發(fā)明中。因而,可從由這些其它菌株制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有葡糖淀粉酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術(shù)分離來自這些其它菌株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉(zhuǎn)移至并且固定于硝化纖維素(nitrocellulose)或其它合適的載體材料。為了鑒定與SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,或其亞序列同源的克隆或DNA,將所述載體材料優(yōu)選用于Sounthern印跡中。就本發(fā)明而言,雜交表示核苷酸序列在非常低至非常高的嚴(yán)格條件下與標(biāo)記的核酸探針雜交,所述核酸探針對應(yīng)于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列;包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的cDNA序列;其全長互補鏈;或它們的亞序列??墒褂美鏧射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。優(yōu)選地,核酸探針是SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列。在另一個優(yōu)選的方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:1。在另一個優(yōu)選的方面,核酸探針是大腸桿菌菌株DSM23221中的質(zhì)粒中包含的多核苷酸序列,其中其多核苷酸序列編碼具有葡糖淀粉酶活性的多肽。在另一個優(yōu)選的方面,核酸探針是大腸桿菌菌株DSM23221中的質(zhì)粒中包含的成熟多肽編碼區(qū)。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:3的成熟多肽編碼序列。在另一個優(yōu)選的方面,核酸探針是編碼SEQIDNO:4的多肽的多核苷酸序列,或其亞序列。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:3。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:5的成熟多肽編碼序列。在另一個優(yōu)選的方面,核酸探針是編碼SEQIDNO:6的多肽的多核苷酸序列,或其亞序列。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:5。對于長度至少100個核苷酸的長探針,非常低至非常高的嚴(yán)格條件定義為在42℃,在5XSSPE、0.3%SDS、200μg/ml已剪切并且變性的鮭精DNA中,以及對于非常低和低嚴(yán)格性為25%的甲酰胺,對于中等和中-高嚴(yán)格性為35%的甲酰胺,或?qū)τ诟吆头浅8邍?yán)格性為50%的甲酰胺,根據(jù)標(biāo)準(zhǔn)的Southern印跡步驟進行預(yù)雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優(yōu)選在45℃(非常低嚴(yán)格性),更優(yōu)選在50℃(低嚴(yán)格性),更優(yōu)選在55℃(中等嚴(yán)格性),更優(yōu)選在60℃(中等-高嚴(yán)格性),甚至更優(yōu)選在65℃(高嚴(yán)格性),并且最優(yōu)選在70℃(非常高嚴(yán)格性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴(yán)格條件定義為在比使用根據(jù)Bolton和McCarthy的計算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)計算的Tm低大約5℃至大約10℃,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸鈉(sodiumpyrophosphate),1mM磷酸二氫鈉(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根據(jù)標(biāo)準(zhǔn)的Southern印跡步驟進行預(yù)雜交、雜交和雜交后洗滌最佳12至24小時。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6×SSC加0.1%SDS中洗滌一次15分鐘,并用6×SSC在比計算的Tm低5℃至10℃的溫度洗滌兩次,每次15分鐘。在第三個方面,本發(fā)明涉及由多核苷酸編碼的具有葡糖淀粉酶活性的分離的多肽,所述多核苷酸包含核苷酸序列或由核苷酸序列組成,所述核苷酸序列與SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽編碼序列具有至少90%,更優(yōu)選至少91%,更優(yōu)選至少92%,甚至更優(yōu)選至少93%,最優(yōu)選至少94%,最優(yōu)選至少95%,和甚至最優(yōu)選至少96%,97%,98%,或99%的同一性程度,并編碼活性多肽。參見下文多核苷酸部分。本發(fā)明還涉及SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的人工變體。優(yōu)選地,氨基酸改變對性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;小缺失,通常為1至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結(jié)合域(bindingdomain)。保守取代的實例是在以下組之內(nèi):堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且例如由H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了用20個標(biāo)準(zhǔn)氨基酸,也可用非標(biāo)準(zhǔn)氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2-氨基異丁酸、異纈氨酸和α-甲基絲氨酸)取代野生型多肽中的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基?!胺翘烊话被帷痹诘鞍踪|(zhì)合成后已經(jīng)過修飾,和/或在它們的側(cè)鏈具有不同于基本氨基酸的化學(xué)結(jié)構(gòu)。非天然氨基酸能夠以化學(xué)方法合成,并且優(yōu)選是商業(yè)上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸?;蛘?,氨基酸變化可為這樣的性質(zhì),其使得所述多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸變化可改善多肽的熱穩(wěn)定性,改善其底物特異性,改變最適pH等。能夠根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的葡糖淀粉酶活性以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結(jié)構(gòu)的物理分析而確定,如通過以下這些技術(shù):如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記,連同推定的接觸位點氨基酸的突變來確定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來推斷,所述多肽與根據(jù)本發(fā)明的多肽相關(guān)。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關(guān)的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochem.30:10832-10837;美國專利No.5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域內(nèi)標(biāo)準(zhǔn)方法快速測序。這些方法允許快速確定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應(yīng)用于未知結(jié)構(gòu)的多肽。成熟多肽,如SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573,或者催化域,如SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選至多6,更優(yōu)選5,更優(yōu)選4,甚至更優(yōu)選3,最優(yōu)選2,并且甚至最優(yōu)選1。具有葡糖淀粉酶活性的多肽的來源本發(fā)明的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關(guān)的術(shù)語“獲得自”意思是核苷酸序列編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的核苷酸序列的菌株產(chǎn)生。優(yōu)選地,獲得自給定來源的多肽是胞外分泌的。本發(fā)明的具有葡糖淀粉酶活性的多肽亦可為具有葡糖淀粉酶活性的細菌多肽,酵母多肽,或更優(yōu)選絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、密瑚菌屬(Artomyces)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬蠟菌屬(Ceriporiopsis)、Chaetomidium、金孢子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsis)、Coptotermes、棒囊殼屬(Corynascus)、隱叢赤殼屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、粘褶菌屬(Gloeophyllum)、全鞭毛蟲屬(Holomastigotoides)、腐質(zhì)霉屬(Humicola)、耙齒菌屬(Irpex)、蘑菇屬(Lentinula)、Leptospaeria、梨孢菌屬(Magnaporthe)、Melanocarpus、多孔菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、Pseudotrichonympha、密孔菌屬(Pycnoporus)、根毛霉屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳菇屬(Volvariella)或炭角菌屬(Xylaria)多肽。在一個更優(yōu)選的方面,所述多肽是具有葡糖淀粉酶活性的密孔菌屬菌種多肽。具體而言所述密孔菌屬菌種是血紅密孔菌??衫斫獾氖菍τ谇笆龅姆N,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學(xué)的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領(lǐng)域熟練技術(shù)人員將容易地識別適合的等同物的身份(identity)。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領(lǐng)域內(nèi)公知的。隨后可通過相似地篩選這種微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就能夠通過使用本領(lǐng)域普通技術(shù)人員熟知的技術(shù)將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。本發(fā)明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發(fā)明的核苷酸序列(或其部分)來產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合蛋白,就切割所述位點,從融合蛋白質(zhì)釋放具有葡糖淀粉酶活性的多肽。切割位點的實例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381);Ile-(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。多核苷酸本發(fā)明還涉及分離的多核苷酸,其包含編碼本發(fā)明具有葡糖淀粉酶活性的多肽的核苷酸序列或由所述核苷酸序列組成。優(yōu)選地,所述核苷酸序列包含SEQIDNO:1或由SEQIDNO:1組成。在另一個更優(yōu)選的方面,所述核苷酸序列包含大腸桿菌DSM23221中包含的質(zhì)粒中包含的序列或由所述序列組成。在另一個優(yōu)選的方面,所述核苷酸序列包含SEQIDNO:1的成熟多肽編碼序列或由SEQIDNO:1的成熟多肽編碼序列組成。在另一個更優(yōu)選的方面,所述核苷酸序列包含大腸桿菌DSM23221中包含的質(zhì)粒中包含的成熟多肽編碼序列或由所述成熟多肽編碼序列組成。本發(fā)明還涵蓋編碼下述多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽或由SEQIDNO:2的氨基酸序列或其成熟多肽組成,所述核苷酸序列由于遺傳密碼的簡并性與SEQIDNO:1或其成熟多肽編碼序列有差異。本發(fā)明還涉及SEQIDNO:1的亞序列,其編碼SEQIDNO:2的具有葡糖淀粉酶活性的片段。本發(fā)明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO:1的成熟多肽編碼序列中包含至少一個突變或由在SEQIDNO:1的成熟多肽編碼序列中具有至少一個突變的序列組成,其中所述突變核苷酸序列編碼SEQIDNO:2的成熟多肽。優(yōu)選地,所述核苷酸序列包含SEQIDNO:3或由SEQIDNO:3組成。在另一個優(yōu)選的方面,所述核苷酸序列包含SEQIDNO:3的成熟多肽編碼序列或由SEQIDNO:3的成熟多肽編碼序列組成。本發(fā)明還涵蓋編碼下述多肽的核苷酸序列,所述多肽包含SEQIDNO:4的氨基酸序列或其成熟多肽或由SEQIDNO:4的氨基酸序列或其成熟多肽組成,所述核苷酸序列由于遺傳密碼的簡并性與SEQIDNO:3或其成熟多肽編碼序列有差異。本發(fā)明還涉及SEQIDNO:3的亞序列,其編碼SEQIDNO:4的具有葡糖淀粉酶活性的片段。本發(fā)明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO:3的成熟多肽編碼序列中包含至少一個突變或由在SEQIDNO:3的成熟多肽編碼序列中具有至少一個突變的...