專(zhuān)利名稱(chēng):葡糖淀粉酶變體的制作方法
葡糖淀粉酶變體 本申請(qǐng)是申請(qǐng)日為2008年4月8日、發(fā)明名稱(chēng)為“葡糖淀粉酶變體”的中國(guó)專(zhuān)利申請(qǐng)200880110897. 6 (國(guó)際申請(qǐng)?zhí)朠CT/US2008/004556)的分案申請(qǐng)。相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求2007年10月9日提出的國(guó)際專(zhuān)利申請(qǐng)PCT/US07/21683的優(yōu)先權(quán),而該國(guó)際專(zhuān)利申請(qǐng)要求2006年10月10日提出的美國(guó)臨時(shí)申請(qǐng)60/850,431的優(yōu)先權(quán),兩個(gè)專(zhuān)利申請(qǐng)的內(nèi)容整體納入本文做為參考。 發(fā)明領(lǐng)域本發(fā)明涉及葡糖淀粉酶變體。具體地,本發(fā)明涉及葡糖淀粉酶的淀粉結(jié)合區(qū)(SBD)中的變體。本發(fā)明還涉及與對(duì)應(yīng)的親本葡糖淀粉酶相比具有改變的性質(zhì)(例如,提高的熱穩(wěn)定性和/或增加的比活性)的變體。本發(fā)明還提供了包含變體葡糖淀粉酶的酶組合物;包含編碼所述變體的多核苷酸的DNA構(gòu)建體;和在宿主細(xì)胞中產(chǎn)生葡糖淀粉酶變體的方法。
背景技術(shù):
葡糖淀粉酶(葡聚糖l,4-a -葡糖水解酶,EC3. 2. I. 3)是淀粉水解外切糖酶,其催化從淀粉或相關(guān)寡糖和多糖分子的非還原性末端去除連續(xù)的葡萄糖單元。葡糖淀粉酶可以水解線性的和分枝的糖苷鍵連接的淀粉(例如,直鏈淀粉和支鏈淀粉)。葡糖淀粉酶可以通過(guò)多種株系的細(xì)菌,真菌,酵母和植物生產(chǎn)。尤其有趣和商業(yè)上重要的是,葡糖淀粉酶是細(xì)胞外產(chǎn)生的真菌酶,例如來(lái)自曲霉屬(Svensson等,(1983)Carlsberg Res. Commun. 48:529-544 ;Boel 等 ,(1984)EMBO J. 3 :1097-1102 ;Hayashida等.,(1989) Agric Biol Chem. 53 :923-929 ;USP 5024,941 ;USP4, 794,175和W088/09795);踝節(jié)菌屬(USP4, 247,637 ;USP6, 255,084 和 USP6, 620,924);根霉屬(Ashikari 等 ,(1986)Agric. Biol. Chem. 50 :957-964 ;Ashikari 等 ,(1989)App. Microbiol.和Biotech. 32 :129-133 和 USP4, 863,864);腐質(zhì)霉屬(W005/052148 和 USP4, 618579)和毛霉菌(Houghton-Larsen 等 ,(2003) Appl. Microbiol. Biotechnol. 62 :210-217)的菌株。編碼這些酶的很多基因已經(jīng)在酵母,真菌和/或細(xì)菌細(xì)胞內(nèi)被克隆和表達(dá)。葡糖淀粉酶是商業(yè)上非常重要的酶,并已經(jīng)應(yīng)用于需要淀粉水解的各種應(yīng)用(例如,從淀粉產(chǎn)生葡萄糖和其它單糖)。葡糖淀粉酶用于產(chǎn)生高果糖漿甜味劑,其構(gòu)成美國(guó)超過(guò)50%的甜味劑市場(chǎng)。一般來(lái)說(shuō),葡糖淀粉酶可以,并且通常與a-淀粉酶一起用于淀粉水解過(guò)程,以水解淀粉為糊精,然后水解為葡萄糖。接著葡萄糖可以由其它酶(例如,葡萄糖異構(gòu)酶)轉(zhuǎn)化為果糖;結(jié)晶化;或用于發(fā)酵以產(chǎn)生多種終產(chǎn)物(例如,乙醇,檸檬酸,乳酸,琥珀酸,抗壞血酸中間體,谷氨酸,甘油和1,3_丙二醇)。通過(guò)在淀粉和/或包含纖維素材料的發(fā)酵中使用葡糖淀粉酶產(chǎn)生的乙醇可以用做燃料或用于酒精消費(fèi)。盡管葡糖淀粉酶已經(jīng)成功地用于商業(yè)應(yīng)用許多年,但是仍然需要具有改變的性質(zhì),如提高的比活性和增加的熱穩(wěn)定性的新的葡糖淀粉酶。發(fā)明概述一方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其包含催化區(qū)和淀粉結(jié)合區(qū)(SBD),所述SBD在對(duì)應(yīng)于 SEQ ID NO :2 的位置493,494,495,501,502,503,508,511,517,518,519,520,525,527,531,533,535,536,537,538,539,540,545,546,547,549,551,561,563,567,569,577,579,和583或?qū)?yīng)于親本葡糖淀粉酶中等同位置的位置上包含一個(gè)或多個(gè)氨基酸取代。在一些實(shí)施方案中,通過(guò)序列同一性確定親本葡糖淀粉酶中的等同位置,所述親本葡糖淀粉酶與SEQ ID NO :2有至少80%氨基酸序列同一性和少于100%氨基酸序列同一性。在其他實(shí)施方案中,親本葡糖淀粉酶與SEQ ID NO :2有至少90%或至少95%氨基酸序列同一性。在額外實(shí)施方案中,通過(guò)與SEQ ID NO :2或SEQ ID NO :11的結(jié)構(gòu)同一性確定等同位置。在一些實(shí)施方案中,親 本葡糖淀粉酶包含與選自SEQ ID NO 11, SEQ ID NO :385,SEQ ID NO 386, SEQ ID NO 387, SEQ ID NO:388,或 SEQ ID NO :389 的 SBD 有至少 95%氨基酸序列同一性的SBD。在其他實(shí)施方案中,催化區(qū)與SEQ ID NO :3的序列有至少90%氨基酸序列同一性。在其他實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ ID NO:2的位置520,535或539。在再一個(gè)實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ ID NO :2的位置519和/或563。在再一個(gè)實(shí)施方案中,分離的葡糖淀粉酶變體還包含在對(duì)應(yīng)于SEQ ID NO:2 或 SEQ ID NO 3 的 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108,110,113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216,219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284,291,300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390,391,393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 的殘基位置的位置上的一個(gè)或多個(gè)氨基酸取代。在另一方面,本發(fā)明涉及包含催化區(qū)和SBD的分離的葡糖淀粉酶變體,所述SBD在對(duì)應(yīng)于 SEQ ID NO 2 的位置 493,494,495,502,503,508,511,518,519,520,527,531,535,536,537,539,563,和577或?qū)?yīng)于親本葡糖淀粉酶中等同位置的位置上包含一個(gè)或多個(gè)氨基酸取代。在一些實(shí)施方案中,親本葡糖淀粉酶與SEQ ID NO :2有至少90%序列同一性。在進(jìn)一步實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ ID N0:2的T493C,T493M,T493N, T493Q, T493Y, P494H, P494I, P494M, P494N, P494Q, P494W, T495M, T495P, T495R,H502A, H502M, H502S, H502V, E503C, E503D, E503H, E503S, E503W, Q508N, Q508P, Q508Y,Q511C, Q511G, Q511H, Q511I, Q511K, Q511T, Q511V, N518P, N518T, A519I, A520C, A520E,A520L, A520P, A520Q, A520R, A520W, V531A, V5311L, V531N, V531R, V531S, V531T, A535E,A535F, A535G, A535K, A535L, A535N, A535P, A535R, A535S, A535T, A535V, A535W, A535Y,V536C, V536E, V536I V536L, V536M, V536Q, V536S, A539E, A539M, A539R, A539S,和 A539W,或者親本葡糖淀粉酶中的等同位置。在進(jìn)一步實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ ID NO 2 的位置 T495R,E503C, E503S, Q511H, V531L,或 V536I。在還進(jìn)一步的實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ ID NO :2的位置494,511,520,527,531,535,536,537,563 和 577。在其他方面,本發(fā)明涉及包含催化區(qū)和SBD的葡糖淀粉酶變體,所述SBD在對(duì)應(yīng)于 SEQ ID NO 2 的位置 T493I, T495K, T495R, T495S, E503A, E503C, E503S, E503T, E503V,Q508H, Q508R, Q508S, Q508T, Q511A, Q511D, Q511H, Q511N, Q511S, N518S, A519E, A519K,A519R, A519T, A519V, A519Y, A520C, A520L, A520P, T527A, T527V, V531L, A535D, A535K,A535N, A535P, A535R, V536I, V536R, N537W, A539E, A539H, A539M, A539R, A539S, N563A,N563C, N563E, N563I, N563K, N563L, N563Q, N563T, N563V, N577A, N577K, N577P, N577R,和N577V的位置或親本葡糖淀粉酶中的等同位置上包含一個(gè)或多個(gè)氨基酸取代。在一些實(shí)施方案中,親本葡糖淀粉酶具有SEQ ID NO :2的至少90%序列。在再一方面,本發(fā)明涉及包含催化區(qū)和SBD的葡糖淀粉酶變體,所述SBD在對(duì)應(yīng)于SEQ ID NO :2的位置503,511,519,531,535,539,563,和577的位置上包含一個(gè)或多個(gè)氨基酸取代。在一些實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代選自SEQ ID N0:2的E503A,E503C,E503V, Q511H, A519K, A519R, A519Y, V531L, A535K, A535N, A535P, A535R, A539E, A539R,A539S, N563C, N563E, N563I, N563K, N563L, N563Q, N563T, N563V, N577K, N577P,和 N577R。在另一方面,本發(fā)明涉及包含催化區(qū)和淀粉結(jié)合區(qū)(SBD)的葡糖淀粉酶變體,a)所述催化區(qū)包含與SEQ ID NO :3的氨基酸序列有至少85%序列同一性和b)所述SBD在對(duì)應(yīng)于 SEQ ID NO 11 的位置 3,4,5,11,12,13,18,21,27,28,29,30,35,37,41,43,45,46,47,48,49,50,55,56,57,59,61,71,73,77,79,87,89,和93的位置上包含一個(gè)或多個(gè)氨基酸取代或所述SBD在親本葡糖淀粉酶SBD的SEQ ID NO 11的等同位置上包含一個(gè)或多個(gè)氨基 酸取代。在一些實(shí)施方案中,催化區(qū)與SEQ ID NO :3的氨基酸序列有至少90%序列同一性。在進(jìn)一步實(shí)施方案中,催化區(qū)與SEQ ID NO :3的氨基酸序列有至少95%序列同一性。在額外實(shí)施方案中,SBD 在對(duì)應(yīng)于 SEQ ID NO 11 的位置 3,4,5,11,12,13,18,21,27,28,29,30,35,37,41,43,45,46,47,48,49,50,55,56,57,59,61,71,73,77,79,87,89,和 93 的位置上包含一個(gè)或多個(gè)氨基酸取代。在其他實(shí)施方案中,SBD在對(duì)應(yīng)于SEQ ID N0:11的位置3,4,5,12,13,18,21,28,29,30,37,41,45,46,47,49,73,和 87 或親本葡糖淀粉酶的等同位置上包含一個(gè)或多個(gè)氨基酸取代。在其他實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于SEQ IDNO 11 的位置 3,5,13,18,21,28,29,30,37,41,45,46,47,49,73,和 87。在其他實(shí)施方案中,一個(gè)或多個(gè)氨基酸取代對(duì)應(yīng)于選自SEQ ID N0:11的位置5,13,21,30,41,45,46,和49的位置。在本發(fā)明的額外方面,葡糖淀粉酶變體與對(duì)應(yīng)的親本葡糖淀粉酶相比將具有至少一種改變的性質(zhì)。在一些實(shí)施方案中,改變的性質(zhì)是增加的比活性。在進(jìn)一步實(shí)施方案中,改變的性質(zhì)是增加的熱穩(wěn)定性。在額外實(shí)施方案中,改變的性質(zhì)是增加的比活性和增加的熱穩(wěn)定性。在本發(fā)明的其他方面,親本葡糖淀粉酶選自得自木霉、曲霉、腐質(zhì)霉、青霉、踝節(jié)菌或裂殖酵母的葡糖淀粉酶。在一些實(shí)施方案中,親本葡糖淀粉酶包含SEQ ID NOs :2,3,4,5,6,7,8,或9的序列。本發(fā)明的其他方面包括編碼本發(fā)明包含的葡糖淀粉酶變體的多核苷酸和包含所述多核苷酸的宿主細(xì)胞。本發(fā)明的其他方面包括包含本發(fā)明包含的葡糖淀粉酶變體的酶組合物。
圖IA顯示了具有632個(gè)氨基酸(SEQ ID NO: I)的里氏木霉葡糖淀粉酶(TrGA)。信號(hào)肽加下劃線,以氨基酸殘基SVDDFI (SEQ ID NO: 12)開(kāi)始,并具有453個(gè)氨基酸殘基的催化區(qū)(SEQ ID N0:3)以粗體顯示;接頭區(qū)域以斜體顯示,淀粉結(jié)合區(qū)(SBD)以斜體顯示并加下劃線。包括催化區(qū)(SEQ ID NO: 3),接頭區(qū)(SEQ ID NO: 10)和淀粉結(jié)合區(qū)(SEQ IDNO: 11)的成熟蛋白由SEQ ID N0:2表示。關(guān)于TrGA葡糖淀粉酶分子的SBD編號(hào),本公開(kāi)中參照a)成熟TrGA的SEQ ID NO:2中的位置491到599和/或SEQ ID NO: 11中的位置I到109,其代表成熟TrGA的分離的SBD序列。關(guān)于TrGA分子的催化區(qū)編號(hào),參考SEQ IDNO:2 和 SEQ ID NO:3。圖IB顯示了編碼TrGA的cDNA(SEQ ID NO 4)。圖IC顯示了 TrGA前體和成熟蛋白結(jié)構(gòu)域。圖2 顯示了包括 TrGA 的 cDNA(SEQ ID NO 4)的目的質(zhì)粒 pDONR-TrGA。圖3 顯示了質(zhì)粒 pTIT-Dest。圖4顯示了最終的表達(dá)載體pTTT-TrGA。
圖5A-5B顯示了親本葡糖淀粉酶催化區(qū)的比對(duì)比較,所含葡糖淀粉酶包括來(lái)源于泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO:5);黑曲霉(Aspergillus niger)(AnGA) (SEQ ID NO :6);米曲霉(Aspergillus oryzae) (AoGA) (SEQ ID NO :7);里氏木霉(Trichoderma reesei) (TrGA) (SEQ ID NO :3);灰腐質(zhì)霉(Humicola grisea) (HgGA) (SEQID NO 8)和Hypocrea vinosa(HvGA) (SEQ ID NO :9)的葡糖淀粉酶。相同的氨基酸通過(guò)星號(hào)r)指出。圖5C顯示了踝節(jié)菌葡糖淀粉酶(TeGA)成熟蛋白序列(SEQ ID NO :384)。圖OT-5E圖解了比對(duì),其比較了親本葡糖淀粉酶的淀粉結(jié)合區(qū)(SBD),包括里氏木霉(SEQ ID NO :11),灰腐質(zhì)霉(HgGA) (SEQ ID NO :385),疏棉狀嗜熱絲孢菌(Thermomyceslanuginosus) (ThGA) (SEQ ID NO :386),埃默森踩節(jié)菌(Talaromyces emersonii) (TeGA)(SEQ ID NO :387),黑曲霉(AnGA) (SEQ ID NO :388);和泡盛曲霉(AaGA) (SEQ ID NO :389)的親本葡糖淀粉酶。圖6是從側(cè)面觀察的木霉菌葡糖淀粉酶(黑色)(SEQ ID NO 2)和泡盛曲霉葡糖淀粉酶(灰色)三維結(jié)構(gòu)的比較。根據(jù)活性中心測(cè)定側(cè)面。例如,在圖6-8中活性中心入口定義為該分子的“頂部”。圖7是從頂部觀察木霉菌葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三維結(jié)構(gòu)的比較。活性中心入口在該分子的“頂部”。圖8是從側(cè)面觀察的TrGA (黑色)和黑曲霉GA (灰色)的三維結(jié)構(gòu)的比對(duì),顯示了結(jié)合位點(diǎn)I和2。圖9是阿卡波糖與圖6中所示TrGA晶體結(jié)構(gòu)的結(jié)合模型。發(fā)明詳述定義除非另有定義,本文使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有與本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員通常理解相同的含義。Singleton等,DICTIONARY OF MICROBIOLOGY ANDMOLECULAR BIOLOGY, 2D ED.,John Wiley 和 Sons, New York (1994),和 Hale&Markham, TheHARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N. Y. (1991)為技術(shù)人員提供本文應(yīng)用的很多術(shù)語(yǔ)的通常含義。但為了清楚和便于參考,仍在下面定義某些術(shù)語(yǔ)。本文所使用的術(shù)語(yǔ)“葡糖淀粉酶(EC3. 2.1.3) ”是指催化從淀粉和相關(guān)寡糖和多糖的非還原性末端釋放D-葡萄糖的酶。術(shù)語(yǔ)“親本”或“親本序列”指自然或天然發(fā)生的序列或者與TrGA (SEQ ID NOs 1和/或2)有序列和/或結(jié)構(gòu)同一性的參考序列。術(shù)語(yǔ)“TrGA”指的是具有SEQ ID NO :2中顯示的成熟蛋白序列的親本里氏木霉葡糖淀粉酶序列,其包括具有SEQ ID NO :3中顯示序列的催化區(qū)。W02006/060062和2006年5月4日公開(kāi)的美國(guó)專(zhuān)利號(hào)2006/0094080中描述了 TrGA的分離,克隆和表達(dá),其并入本文做為參考。TrGA也被認(rèn)為是親本葡糖淀粉酶序列。在一些實(shí)施方案中,親本序列指的是做為蛋白質(zhì)工程的起點(diǎn)的TrGA。短語(yǔ)“蛋白質(zhì)或多肽的成熟形式”指的是蛋白質(zhì)或多肽的最終功能形式。舉例來(lái)說(shuō),TrGA成熟形式包括催化區(qū),接頭區(qū)和淀粉結(jié)合區(qū),具有SEQ ID NO :2的氨基酸序列。術(shù)語(yǔ)“木霉菌葡糖淀粉酶同源物”指的是具有與TrGA序列(SEQ ID NO 2)至少50%序列同一性、至少60%序列同一性、至少70%序列同一性、至少80%氨基酸序列同一性的親本葡糖淀粉酶,其中該葡糖淀粉酶保持了葡糖淀粉酶的功能性特征。本文中使用的“同源序列”意思是為了比較進(jìn)行最佳序列比對(duì)時(shí),與一種核酸序 列或多肽序列具有至少100%,至少99%,至少98%,至少97%,至少96%,至少95%,至少94%,至少93%,至少92%,至少91%,至少90%,至少88%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%,至少50%或至少45%序列同一性的核酸或多肽序列,其中候選核酸序列或多肽序列的功能與和所述候選同源序列相比較的核酸序列或多肽序列基本相同。在一些實(shí)施方案,同源序列具有85%和100%之間的序列同一性,而在其它的實(shí)施方案中具有90%和100%之間的序列同一性,在其它的實(shí)施方案中,具有95%和100%的序列同一性。在一些實(shí)施方案中,候選同源序列(或參照序列)或親本與TrGA核酸序列或成熟蛋白序列比較。序列同一性可以經(jīng)由親本或同源序列的全長(zhǎng)測(cè)定。本文中使用的術(shù)語(yǔ)“葡糖淀粉酶變體”,“SBD變體”和“TrGA變體”用于與親本或參照葡糖淀粉酶序列相似的葡糖淀粉酶(例如,TrGA或木霉菌葡糖淀粉酶同源物),但在其氨基酸序列中具有使SBD在序列上不同于親本葡糖淀粉酶的至少一個(gè)取代,缺失或插入。本文中使用的術(shù)語(yǔ)“催化區(qū)”指的是多肽的結(jié)構(gòu)區(qū),其包含底物水解的活性位點(diǎn)。術(shù)語(yǔ)“接頭”指的是通常具有3到40個(gè)之間氨基酸殘基的短氨基酸序列,其共價(jià)連接包含淀粉結(jié)合區(qū)的氨基酸序列和包含催化區(qū)的氨基酸序列。術(shù)語(yǔ)“淀粉結(jié)合區(qū)(SBD) ”指的是優(yōu)選結(jié)合于淀粉底物的氨基酸序列。本文中使用的術(shù)語(yǔ)“突變序列”和“突變基因”可互換使用,指的是一種多核苷酸序列,其具有發(fā)生于宿主細(xì)胞親本序列中的至少一個(gè)密碼子內(nèi)的改變。突變序列的表達(dá)產(chǎn)物為相對(duì)于親本具有改變的氨基酸序列的變體蛋白。所述表達(dá)產(chǎn)物可以具有改變的功能容量(例如,增強(qiáng)的酶活性)。在多肽背景下,本文應(yīng)用的術(shù)語(yǔ)“性質(zhì)”或其語(yǔ)法上的等同對(duì)應(yīng)詞指的是能夠被選擇或檢測(cè)的多肽的任何特點(diǎn)或?qū)傩浴_@些性質(zhì)包括,但不限于氧化穩(wěn)定性,底物特異性,催化活性,熱穩(wěn)定性,PH活性曲線,對(duì)蛋白降解的抗性,Km, Kcat, Kcat/Km比率,蛋白折疊,結(jié)合底物的能力和分泌能力。在核酸背景下,本文應(yīng)用的術(shù)語(yǔ)“性質(zhì)”或其語(yǔ)法上的等同對(duì)應(yīng)詞指的是能夠被選擇或檢測(cè)的核酸的任何特點(diǎn)或?qū)傩?。這些性質(zhì)包括,但不限于,影響基因轉(zhuǎn)錄的性質(zhì)(例如,啟動(dòng)子強(qiáng)度和啟動(dòng)子識(shí)別),影響RNA加工的性質(zhì)(例如,RNA剪接和RNA穩(wěn)定性),影響翻譯的性質(zhì)(例如,調(diào)控,結(jié)合mRNA到核糖體蛋白)。
術(shù)語(yǔ)“比活性”定義為每mg活性葡糖淀粉酶蛋白質(zhì)的活性。使用如本文所述的乙醇測(cè)定法測(cè)定活性。被鑒定的與親本TrGA PI相比具有性能指數(shù)(PI) > 1.0的變體被認(rèn)為具有增加的比活性。從親本(WT)與變體葡糖淀粉酶的比活性(活性/mg酶)計(jì)算PI。它是“變體比活性/WT比活性”的商。術(shù)語(yǔ)“熱穩(wěn)定的”和“耐熱的”指的是在淀粉底物水解過(guò)程中普通的條件下,本發(fā)明的葡糖淀粉酶變體在給定的時(shí)段暴露于確認(rèn)的溫度后,例如暴露于改變的溫度后,保持特定量的酶活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語(yǔ)“增強(qiáng)的穩(wěn)定性”指的是比較于另一個(gè)參照(例如,親本)葡糖淀粉酶,隨時(shí)間推移維持的更高的淀粉水解活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語(yǔ)“降低的穩(wěn)定性”指的是比較于其他葡糖淀粉酶、變體和/或野生型葡糖淀粉酶,隨時(shí)間推移維持的更低的淀粉水解活性。術(shù)語(yǔ)“活性”和“生物活性”指的是與某具體蛋白相關(guān)的生物活性。由此可見(jiàn),給定蛋白的生物活性指的是由本領(lǐng)域技術(shù)人員通常歸因于該蛋白的任何生物活性。例如,與葡糖淀粉酶相關(guān)的酶活性是水解的,于是活性葡糖淀粉酶具有水解活性。術(shù)語(yǔ)“多核苷酸”和“核酸”,在本文中互換使用,指的是任何長(zhǎng)度核苷酸的聚合形式,或者核糖核苷酸或者脫氧核糖核苷酸。這些術(shù)語(yǔ)包括,但不限于,單_,雙_,或三-鏈DNA,基因組DNA,cDNA, RNA, DNA-RNA雜合物,或包含嘌呤和嘧啶堿基的聚合物,或其他天然的,化學(xué),生物化學(xué)修飾的,非天然的或者衍化的核苷酸堿基。本文中使用的術(shù)語(yǔ)“DNA構(gòu)建體” “轉(zhuǎn)化DNA”和“表達(dá)載體”互換使用,指的是用于引入序列到宿主細(xì)胞或生物的DNA。所述DNA可以通過(guò)PCR或本領(lǐng)域技術(shù)人員已知的任何其它合適的技術(shù)在體外產(chǎn)生。DNA構(gòu)建體,轉(zhuǎn)化DNA或重組表達(dá)盒可以被摻入到質(zhì)粒,染色體,線粒體DNA,質(zhì)體DNA,病毒或核酸片段。通常地,表達(dá)載體的重組表達(dá)盒部分,DNA構(gòu)建體或轉(zhuǎn)化DNA包括,除其它序列外,被轉(zhuǎn)錄的核酸序列和啟動(dòng)子。在實(shí)施方案中,表達(dá)載體具有在宿主細(xì)胞中摻入和表達(dá)異源DNA片段的能力。
本文中使用的術(shù)語(yǔ)“載體”指的是設(shè)計(jì)用于引入核酸到一種或多種細(xì)胞類(lèi)型的多核苷酸構(gòu)建體。載體包括克隆載體,表達(dá)載體,穿梭載體,質(zhì)粒,表達(dá)盒等等。在引入核酸序列到細(xì)胞內(nèi)的背景下,本文使用的術(shù)語(yǔ)“引入”指的是適合轉(zhuǎn)移核酸序列到細(xì)胞內(nèi)的任何方法。這些引入方法方法包括但不限于原生質(zhì)體融合,轉(zhuǎn)染,轉(zhuǎn)化,接合,和轉(zhuǎn)導(dǎo)。本文中使用的術(shù)語(yǔ)“轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”指的是細(xì)胞,其具有整合入其基因組的非天然(異源的)多核苷酸序列或做為維持至少兩代的游離質(zhì)粒。本文中使用的術(shù)語(yǔ)“選擇標(biāo)記”和“選擇性標(biāo)記”指的是能夠在宿主細(xì)胞內(nèi)表達(dá)的核酸(例如,基因),其允許容易地選擇那些包含載體的宿主。通常,選擇標(biāo)記是賦予宿主細(xì)胞抗生素抗性或代謝優(yōu)勢(shì)的基因,以在轉(zhuǎn)化過(guò)程中允許包含外源DNA的細(xì)胞與未接受任何外源序列的細(xì)胞區(qū)分開(kāi)來(lái)。本文中使用的術(shù)語(yǔ)“啟動(dòng)子”指的是具有指導(dǎo)下游基因轉(zhuǎn)錄作用的核酸序列。啟動(dòng)子,和其他轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸序列(也稱(chēng)為“控制序列”)一起對(duì)于表達(dá)給定基因是必須的。通常,轉(zhuǎn)錄和翻譯調(diào)節(jié)序列包括,但不限于啟動(dòng)子序列,核糖體結(jié)合位點(diǎn),轉(zhuǎn)錄起始和終止序列,翻譯起始和終止序列,和增強(qiáng)子或激活子序列。
當(dāng)其置于與另外一個(gè)核酸序列的功能關(guān)系中時(shí),核酸被“有效連接”。例如,如果編碼分泌前導(dǎo)序列(即,信號(hào)肽)的DNA表達(dá)為參與多肽分泌的前導(dǎo)蛋白,那么編碼分泌前導(dǎo)序列(即,信號(hào)肽)的DNA有效地連接于多肽的DNA。通常,“有效連接”意思是被連接的DNA序列是相鄰的,并且至于分泌前導(dǎo)序列,是相鄰的并且在閱讀相內(nèi)。本文中使用的術(shù)語(yǔ)“基因”指的是多核苷酸(例如,DNA片段),其編碼多肽,并包括編碼區(qū)之前和之后的區(qū)域以及單個(gè)編碼區(qū)段(外顯子)之間的間插序列(內(nèi)含子)。本文中使用的“同源基因”指的是來(lái)自不同,但通常相關(guān)的物種的一對(duì)基因,其相互對(duì)應(yīng)并且彼此相同或非常近似。該術(shù)語(yǔ)包括由物種形成(即新物種發(fā)展)分離的基因(例如,直向同源基因),以及已經(jīng)由基因復(fù)制分離的基因(例如,旁系同源基因)。本文中使用的“直向同源物”和“直向同源基因”指的是通過(guò)物種形成從共同的祖先基因(S卩,同源基因)進(jìn)化而來(lái)的不同物種中的基因。通常,直向同源物在進(jìn)化過(guò)程中保持相同的功能。直向同源物的鑒定在新近測(cè)序的基因組中可靠預(yù)測(cè)基因功能中得到應(yīng)用。
本文中使用的“旁系同源物”和“旁系同源基因”指的是基因組內(nèi)通過(guò)復(fù)制相關(guān)的基因。盡管直向同源物在進(jìn)化過(guò)程中保持相同的功能,但是旁系同源物進(jìn)化新功能,盡管一些功能通常與最初的基因相關(guān)。旁系同源基因的實(shí)例包括,但不限于編碼胰蛋白酶,胰凝乳蛋白酶,彈性蛋白酶和凝血酶的基因,其都是絲氨酸蛋白酶并在同一物種內(nèi)一起發(fā)生。本文中使用的術(shù)語(yǔ)“同源性”指的是序列相似性或同一性,優(yōu)選同一性。該同源性使用本領(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)確定(參見(jiàn),例如,Smith and Waterman, Adv. Appl. Math. ,2 482 [1981] ;Needleman and ffunsch, J. Mol. Biol. ,48 443[1970] ;Pearson and Lipman,Proc. Natl. Acad. Sci. USA85 :2444 [1988];;程序,如 Wisconsin Genetics SoftwarePackage (Genetics Computer Group, Madison, WI)中的 GAP, BESTFIT, FASTA,和 TFASTA ;和 Devereux et al. , Nucl. Acid Res. ,12 :387-395[1984])?!昂怂嵝蛄型恍园俜?jǐn)?shù)) ”或“氨基酸序列同一性百分?jǐn)?shù)) ”被定義為候選序列中與起始序列(如,TrGA)的核苷酸殘基或氨基酸殘基相同的核苷酸殘基或氨基酸殘基的百分比。同源序列由已知的序列比對(duì)方法確定。通常使用的比對(duì)方法是由Altschul等(Altschul 等,(1990) J. Mol. Biol.,215 :403-410 ;和 Karlin 等,(1993) Proc. Natl. Acad.Sci. USA 90 :5873-5787)描述的BLAST。一個(gè)尤其有用的BLAST程序是WU-BLAST-2程序(參見(jiàn),Altschul 等,(1996)Meth. Enzymol.,266 :460-480)。WU-BLAST-2 使用幾個(gè)檢索參數(shù),其大多數(shù)被設(shè)定為默認(rèn)值??烧{(diào)整的參數(shù)設(shè)定為下列值,重疊間隔=1,重疊部分=0. 125,字段閾值(T) = 11。HSPS和HSP S2參數(shù)是動(dòng)態(tài)值并通過(guò)程序本身建立,其依賴于具體序列的組成和目的序列被檢索的具體數(shù)據(jù)庫(kù)的組成。但是,這些值可以被調(diào)整以增加靈敏性。氨基酸序列同一性A%值由匹配的相同殘基的數(shù)目除以比對(duì)區(qū)內(nèi)“更長(zhǎng)”序列的殘基總數(shù)來(lái)確定?!案L(zhǎng)”序列是在比對(duì)區(qū)中具有大多數(shù)實(shí)際殘基的序列(忽略由WU-Blast-2為最大化比對(duì)得分而引入的空位)。其它的方法也應(yīng)用于比對(duì)序列。一個(gè)有用算法的例子是PILEUP。PILEUP使用漸進(jìn)的逐對(duì)比對(duì)從一組相關(guān)序列產(chǎn)生多個(gè)序列比對(duì)。PILEUP使用Feng和Doolittle的漸進(jìn)式比對(duì)方法的簡(jiǎn)化形式(Feng and Doolittle, J. Mol. Evol. ,35 :351-360 [1987])。該方法與 Higgins 和 Sharp 描述的方法相似(Higgins and Sharp, CABIOS 5 :151_153[1989])。有用的PILEUP參數(shù)包括默認(rèn)的空位權(quán)重3. 00,默認(rèn)的空位長(zhǎng)度權(quán)重0. 10和加權(quán)的末端空位。術(shù)語(yǔ)“最優(yōu)比對(duì)”指的是提供最高同一性百分率得分的比對(duì)?!暗韧恢谩敝傅氖莾蓚€(gè)序列之間的最優(yōu)比對(duì)。例如利用圖和5E,TrGA(SEQ ID NO 2)中491位是C491;黑曲霉的等同位置是C509位;泡盛曲霉的等同位置是Q538位。對(duì)于三維序列的示例性比對(duì)參見(jiàn)圖8。本文中使用的術(shù)語(yǔ)“雜交”指的是如本領(lǐng)域所知,核酸鏈與互補(bǔ)鏈通過(guò)堿基配對(duì)結(jié)合的過(guò)程。如果在中等到高嚴(yán)格度雜交和洗滌條件下,兩個(gè)序列互相特異地雜交,則認(rèn)為核酸序列對(duì)于參考序列是“選擇性雜交的”。雜交條件是以核酸結(jié)合復(fù)合體或探針的解鏈溫度(Tm)為基礎(chǔ)的。例如,“最大嚴(yán)格性”通常發(fā)生在約Tm-5°C (低于探針Tm 5°C )高嚴(yán)格性”在低于Tm約5-10°C ;“中等嚴(yán)格性”在低于探針Tm約10_20°C ;“低嚴(yán)格性”在低于Tm 約20-25°C。功能上來(lái)說(shuō),最大嚴(yán)格性條件可以用于鑒定與雜交探針具有嚴(yán)格同一性或接近嚴(yán)格同一性的序列;而中等或低嚴(yán)格性條件可以用于鑒定或檢測(cè)多核苷酸序列同源物。中等和高嚴(yán)格性雜交條件是本領(lǐng)域公知的。高嚴(yán)格性條件的一個(gè)例子包括在約42°C,在 50% 甲酰胺,5XSSC, 5XDenhardt’ s 液,0. 5% SDS 和 100 y g/ml 變性載體 DNA 中雜交,之后在室溫下,2XSSC和0. 5% SDS中洗滌兩次,并在42°C,0. IXSSC和0. 5% SDS中洗滌另外兩次。中等嚴(yán)格性條件的一個(gè)例子包括37°C,在包含20%甲酰胺,5XSSC(150mM NaCl,15mM朽1檬酸三鈉),50mM磷酸鈉(pH7. 6), 5XDenhardt’s液,10%硫酸葡聚糖和20mg/ml變性的剪切鮭精DNA的溶液中溫育,之后在約37-50°C,IXSSC中洗滌濾膜。本領(lǐng)域技術(shù)人員知曉如何調(diào)整溫度,離子強(qiáng)度等,其對(duì)于適應(yīng)例如探針長(zhǎng)度等等的因素是必須的。本文中使用的“重組”包括涉及的細(xì)胞或載體,其通過(guò)引入異源的或同源的核酸序列被修飾或所述細(xì)胞來(lái)源于此種修飾的細(xì)胞。這樣,例如,作為人類(lèi)有意干預(yù)的結(jié)果,重組細(xì)胞表達(dá)天然(非重組)形式細(xì)胞內(nèi)未發(fā)現(xiàn)相同形式的基因,或表達(dá)天然基因,其否則異常表達(dá),低表達(dá)或根本不表達(dá)。在本發(fā)明的一些實(shí)施方案中,突變的DNA序列通過(guò)在至少一個(gè)密碼子中位點(diǎn)飽和誘變產(chǎn)生。在其它的實(shí)施方案中,位點(diǎn)飽和誘變實(shí)施于兩個(gè)或更多的密碼子。在另一實(shí)施方案中,突變的DNA序列具有與親本序列超過(guò)50 %,超過(guò)55 %,超過(guò)60%,超過(guò)65%,超過(guò)70%,超過(guò)75%,超過(guò)80%,超過(guò)85%,超過(guò)90%,超過(guò)95%,超過(guò)98%或超過(guò)99%的同源性。在備選實(shí)施方案中,突變DNA使用任何已知的誘變方法如,舉例來(lái)說(shuō),輻射,亞硝基胍等等在體內(nèi)產(chǎn)生。希望DNA序列于是被分離和在本文提供的方法中使用。本文中使用的“異源蛋白”指的是非宿主細(xì)胞內(nèi)自然發(fā)生的蛋白質(zhì)或多肽。本文中使用的“同源蛋白”指的是細(xì)胞內(nèi)天然或自然發(fā)生的蛋白質(zhì)或多肽,并包括由重組DNA技術(shù)或者細(xì)胞內(nèi)天然過(guò)表達(dá)的天然蛋白質(zhì)。如果酶在細(xì)胞內(nèi)以比其在相應(yīng)野生型細(xì)胞內(nèi)表達(dá)的水平更高的水平表達(dá),酶即為在宿主細(xì)胞內(nèi)“過(guò)表達(dá)”。術(shù)語(yǔ)“蛋白質(zhì)”和“多肽”在本文中可互換使用。在本公開(kāi)和權(quán)利要求中,使用用于氨基酸殘基的常規(guī)單字母和三字母代碼。氨基酸三字母代碼定義與IUPAC-IUB生物化學(xué)命名聯(lián)合委員會(huì)(JCBN) —致。也可以理解的是,由于基因密碼的簡(jiǎn)并性,多肽可以由不止一個(gè)核苷酸序列編碼。通過(guò)下面的命名法描述本發(fā)明的變體[原始氨基酸殘基/位置/取代的氨基酸殘基]。例如在76位用亮氨酸取代精氨酸被表示為R76L。當(dāng)多于一個(gè)氨基酸在給定位置被取代,該取代被表示為D Q172C, Q172D或Q172R ;2) Q172C,D,R或c) Q172C/D/R。可以理解的是,當(dāng)本文鑒定的適合取代的位置沒(méi)有推薦的特定氨基酸,那么任何氨基酸殘基可以取代該位置上存在的氨基酸殘基。與其它葡糖淀粉酶相比,變體葡糖淀粉酶包含缺失時(shí),該缺失以標(biāo)示。例如,位置R76的缺失被表示為R76'兩個(gè)或更多個(gè)連續(xù)氨基酸的缺失被標(biāo)不為,例如(76-78)“前序列”是信號(hào)序列和成熟蛋白之間對(duì)于蛋白質(zhì)分泌必需的氨基酸序列。切割前序列將產(chǎn)生成熟有活性的蛋白質(zhì)。術(shù)語(yǔ)“信號(hào)序列”或“信號(hào)肽”指的是可以參與成熟或前體形式蛋白質(zhì)分泌的任何核苷酸和/或氨基酸序列。信號(hào)序列的該定義是功能性定義,意味著包括由所述蛋白基因的N-末端部分編碼的所有那些氨基酸序列,其參與蛋白分泌的完成。其經(jīng)常,但不總是,結(jié) 合于蛋白質(zhì)的N-末端部分或前體蛋白的N-末端部分。信號(hào)序列可以是內(nèi)源的或外源的。信號(hào)序列可以通常情況下結(jié)合于所述蛋白質(zhì)(例如,葡糖淀粉酶)或可以來(lái)自編碼另一分泌蛋白的基因。術(shù)語(yǔ)蛋白質(zhì)或肽的“前體”形式指的是具有有效連接于該蛋白質(zhì)的氨基或羰基末端的前序列的成熟形式的蛋白質(zhì)。前體也可以具有有效連接于前序列氨基末端的“信號(hào)”序列。前體也可以具有參與翻譯后活動(dòng)(例如,從中切割以產(chǎn)生成熟形式蛋白質(zhì)或肽的多肽)的另外的多肽?!八拗骶辍被颉八拗骷?xì)胞”指的是包含根據(jù)本發(fā)明DNA的表達(dá)載體的適宜宿主。術(shù)語(yǔ)“來(lái)自”和“獲自”不僅指由討論中的生物株系產(chǎn)生或可產(chǎn)生的葡糖淀粉酶,也指由分離自如此株系的DNA序列編碼的和在包含如此DNA序列的宿主生物中產(chǎn)生的葡糖淀粉酶。此外,該術(shù)語(yǔ)指由合成的和/或cDNA來(lái)源的DNA序列編碼的并且具有討論中的葡糖淀粉酶確認(rèn)特征的葡糖淀粉酶。該定義范圍內(nèi)的“衍生物”通常保持野生型,天然的或親本形式中觀察到的特征性水解活性到這樣的程度,其使該衍生物可用于與野生型,天然的或親本形式相似的目的。葡糖淀粉酶功能性的衍生物包含自然發(fā)生的,合成地或重組產(chǎn)生的肽或肽片段,其具有本發(fā)明的葡糖淀粉酶的一般特征。術(shù)語(yǔ)“分離的”或“純化的”指的是從其起始環(huán)境中被移開(kāi)的物質(zhì)(例如自然環(huán)境,如果其是自然發(fā)生地)。在一些實(shí)施方案中,如通過(guò)SDS-PAGE確定,分離的蛋白質(zhì)是超過(guò)10%純的,優(yōu)選超過(guò)20%純的,和更優(yōu)選超過(guò)30%純的。本發(fā)明另外的方面包括如通過(guò)SDS-PAGE確定的高度純化形式的蛋白質(zhì)(即超過(guò)40 %純的,超過(guò)60 %純的,超過(guò)80 %純的,超過(guò)90 %純的,超過(guò)95 %純的,超過(guò)97 %純的,和甚至超過(guò)99 %純的)。本文中使用的術(shù)語(yǔ)“組合誘變”指的是產(chǎn)生起始序列的變體文庫(kù)的方法。在這些文庫(kù)內(nèi),變體包含選自預(yù)先確定的一組突變的一個(gè)或幾個(gè)突變。除此之外,方法提供了引入隨機(jī)突變的手段,所述隨機(jī)突變不是預(yù)先確定的一組突變的成員。在一些實(shí)施方案中,所述方法包括USP6,582,914中闡述的那些方法,在此并入作為參考。在備選的實(shí)施方案中,組合誘變方法包括商業(yè)上可獲得的試劑盒(例如,Quik Change Multisite, Stratagene,San Diego, CA)。本文中使用的術(shù)語(yǔ)“突變體文庫(kù)”指的是細(xì)胞群體,其基因組的大多數(shù)相同,但包括一個(gè)或多個(gè)基因的不同同源物。這樣的文庫(kù)可以用于,例如,鑒定具有改良性狀的基因或操縱子。本文中使用的術(shù)語(yǔ)“干燥固體含量(DS或ds) ”指的是漿液的總固體基于干重的百分比。本文中使用的術(shù)語(yǔ)“目標(biāo)特性”指的是將被改變的起始基因的特性。并不意圖將本發(fā)明限定于任何具體的目標(biāo)特性。但是,在一些實(shí)施方案中,目標(biāo)特性是基因產(chǎn)物的穩(wěn)定性(例如,對(duì)變性,蛋白水解或其它降解因素的抗性),而在其它的實(shí)施方案中,生產(chǎn)宿主中的產(chǎn)物的水平改變。事實(shí)上,預(yù)期起始基因的任何特性都在本發(fā)明中得到應(yīng) 用。術(shù)語(yǔ)的其它定義可在說(shuō)明書(shū)的各處出現(xiàn)。在更詳細(xì)描述示例性的實(shí)施方案之前,應(yīng)當(dāng)理解的是,本發(fā)明不限于描述的具體實(shí)施方案,因?yàn)檫@些當(dāng)然可以變化。也應(yīng)當(dāng)理解,本文中使用的術(shù)語(yǔ)只是為了描述具體的實(shí)施方案,并無(wú)限制性意圖。當(dāng)提供數(shù)值范圍時(shí),應(yīng)當(dāng)理解,除非上下文另有明確規(guī)定,該范圍的上限和下限之間的每個(gè)中間值,直至下限單位的十分之一,也被具體地公開(kāi)。任何陳述值之間的每個(gè)更小范圍或陳述范圍內(nèi)的中間值和任何其它公開(kāi)的或所述公開(kāi)范圍內(nèi)的中間值都包括在本發(fā)明內(nèi)。這些更小范圍的上限或下限可以獨(dú)立地包括于或排除于該范圍,兩個(gè)端點(diǎn)之一,兩個(gè)端點(diǎn)都不或都包括在更小范圍的每個(gè)范圍也包括在本發(fā)明之內(nèi),其受限于公開(kāi)范圍內(nèi)任何具體排除的界限。如果公開(kāi)的范圍排除一個(gè)或兩個(gè)端點(diǎn),排除一個(gè)或者兩個(gè)所述被包括端點(diǎn)的范圍也包括在本發(fā)明內(nèi)。盡管與本文描述的那些方法和材料相似或等同的任何方法和材料可以用于實(shí)施或測(cè)試本發(fā)明,現(xiàn)在仍描述示例性的和優(yōu)選的方法和材料。本文提到的所有出版物并入本文作為參考,以公開(kāi)和描述與引用的出版物有關(guān)的方法和/或材料。必須指出的是,除非上下文另有明確規(guī)定,單數(shù)形式包括復(fù)數(shù)指代。這樣,例如,提至IJ “一個(gè)基因”包括多個(gè)這樣的候選基因,提到“細(xì)胞”包括涉及一個(gè)或多個(gè)細(xì)胞和本領(lǐng)域技術(shù)人員知曉的等同物,等等。本文中討論的出版物只有其公開(kāi)早于本申請(qǐng)的申請(qǐng)日,才被提供。本文不承認(rèn)本發(fā)明無(wú)權(quán)由于是在先發(fā)明而早于此類(lèi)出版物。II.實(shí)施方案親本葡糖淀粉酶在一些實(shí)施方案中,本發(fā)明提供了親本葡糖淀粉酶的葡糖淀粉酶變體。親本葡糖淀粉酶包含催化區(qū)和淀粉結(jié)合區(qū)。親本葡糖淀粉酶可以包含與TrGA(SEQ ID NOs 2)有序列和/或結(jié)構(gòu)同一性的序列。在一些實(shí)施方案中,親本葡糖淀粉酶包含如SEQ ID N0l,2,5,6,7,8,9或384中顯示的氨基酸序列。在一些實(shí)施方案中,親本葡糖淀粉酶是同源物。在一些實(shí)施方案中,親本葡糖淀粉酶具有與SEQ ID NO :2的TrGA氨基酸序列至少50%的序列同一性,包括至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。在一些實(shí)施方案中,親本葡糖淀粉酶包含催化區(qū),其具有與SEQ ID NO :1,2,3,5,6,7,8或384中顯示的一個(gè)或多個(gè)氨基酸序列有至少50%的氨基酸序列同一性的氨基酸序列,包括與 SEQ ID NO :1,2,3,5,6,7,8 或 384 至少 60%、至少 70%、至少 80%、至少 90%、至少95%、至少99%的序列同一性。在其它的實(shí)施方案中,親本葡糖淀粉酶具有與SEQ IDNO 3的TrGA氨基酸序列的催化區(qū)至少80%的序列同一性,至少85%的序列同一性,至少90 %的序列同一性,至少95%的序列同一性,至少97 %的序列同一性,至少98 %的序列同一性和至少99%的序列同一性。在一些實(shí)施方案中,親本葡糖淀粉酶包含與SEQ ID NO :11有結(jié)構(gòu)同一性的淀粉結(jié)合區(qū)。在一些實(shí)施方案中,親本葡糖淀粉酶包含具有與TrGA氨基酸序列SEQ ID NO :11的SBD有至少30 %序列同一‘丨生,至少40 %序列同一‘丨生,至少50 %序列同一‘丨生,至少60 %序列同一性,至少70 %序列同一性,至少80 %序列同一性,至少85 %序列同一性,至少90 %序列同一性,至少95%序列同一性,至少97%序列同一性,至少98%序列同一性,和至少99%序·列同一性的氨基酸序列的淀粉結(jié)合區(qū)。親本葡糖淀粉酶可以由DNA序列編碼,該DNA序列在中等、高或嚴(yán)格條件下與編碼包含SEQ ID NO :1,2,和/或11的氨基酸序列之一的葡糖淀粉酶的DNA雜交。在一些實(shí)施方案中,所編碼的葡糖淀粉酶與SEQ ID NO :1,2,和/或11的氨基酸序列有至少50%序列同一性,至少60 %序列同一性,至少70 %序列同一性,至少80 %序列同一性,至少85 %序列同一性,至少90 %序列同一性,至少95 %序列同一性,至少97 %序列同一性,至少98 %序列同一性,和至少99%序列同一性。在一些實(shí)施方案中,親本葡糖淀粉酶是宿主細(xì)胞中自然或天然發(fā)生的序列。在一些實(shí)施方案中,親本葡糖淀粉酶是天然發(fā)生的變體。在一些實(shí)施方案中,親本葡糖淀粉酶是參考序列,其是已經(jīng)被改造的變體或者是雜合葡糖淀粉酶。葡糖淀粉酶的預(yù)測(cè)結(jié)構(gòu)和已知序列在真菌物種中是保守的(Coutinho et al.,1994 Protein Eng. ,7 :393_400and Coutinho et al. ,1994, Protein Eng. ,7 :749-760)。在一些實(shí)施方案中,親本葡糖淀粉酶是絲狀真菌葡糖淀粉酶。在一些實(shí)施方案中,親本葡糖淀粉酶獲自木霉屬菌株(例如,里氏木霉,長(zhǎng)梗木霉(T. Iongibrachiatum),嚴(yán)緊木霉(T. strictipilis),棘胞木霉(T. asperellum),康長(zhǎng)木霉(T. koniIangbra)和哈茨木霉(T. hazianum)),曲霉屬菌株(例如黑曲霉,構(gòu)巢曲霉,A. kawachi,泡盛曲霉和米曲霉),踝節(jié)菌屬株(例如埃默森踝節(jié)菌(T. emersonii),濕熱踝節(jié)菌(T. thermophilus)和T. duponti),肉座菌屬菌株(例如膠質(zhì)肉座菌(H. gelatinosa),東方肉座菌(H. orientalis),H. vinosa, H. citrina),鐮孢屬菌株(例如,尖鐮孢(F. oxysporum),粉紅鐮孢(F. roseum)和F. venenatum),脈孢菌屬菌株(例如粗糙脈孢菌(N. crassa))和腐質(zhì)霉屬菌株(例如,灰腐質(zhì)霉,特異腐質(zhì)霉(H. insolens)和H. lanuginosa),青霉屬菌株(例如點(diǎn)青霉或產(chǎn)黃青霉),或復(fù)膜孢酵母屬菌株(例如S. fibuligera)。在一些實(shí)施方案中,親本葡糖淀粉酶包含如圖5A-E中圖解的那些序列的氨基酸序列。在一些實(shí)施方案中,親本葡糖淀粉酶可以是細(xì)菌葡糖淀粉酶。例如,葡糖淀粉酶可以獲自革蘭氏陽(yáng)性菌株,例如芽孢桿菌(例如,嗜堿芽孢桿菌(B.alkalophilus),解淀粉芽孢桿菌(B. amyIoliquefaciens),遲緩芽孢桿菌(B. Ientus),地衣芽孢桿菌(B. Iicheniformis),嗜熱脂肪芽抱桿菌(B. stearothermophilus),枯草芽抱桿菌(B. subtilis)和蘇云金芽孢桿菌(B. thuringiensis))或鏈霉屬菌株(例如,淺青紫鏈霉菌(S. Iividans))。
在一些實(shí)施方案中,親本葡糖淀粉酶將與SEQ ID NO :2的TrGA氨基酸序列有至少
50%序列同一性,至少60 %序列同一性,至少70 %序列同一性,至少80 %序列同一性,至少85 %序列同一性,至少88 %序列同一性,至少90 %序列同一性,至少93 %序列同一性,至少95%序列同一性,至少96%序列同一性,至少97%序列同一性,至少98%序列同一性和至少99%序列同一性。在一些實(shí)施方案中,親本葡糖淀粉酶也具有與SEQ ID NO :2的結(jié)構(gòu)同一性。在另外的實(shí)施方案中,木霉屬葡糖淀粉酶同源物可以獲自木霉屬或肉座菌屬的菌株。有些木霉葡糖淀粉酶同源物在美國(guó)專(zhuān)利
發(fā)明者C·弗勒門(mén), I·尼古拉耶夫, M·謝弗斯, P·范索林恩, R·R·博特, W·埃赫勒 申請(qǐng)人:丹尼斯科美國(guó)公司