葡糖淀粉酶變體和編碼它們的多核苷酸的制作方法
【專利摘要】本發(fā)明涉及具有對(duì)蛋白酶切口的減小的敏感度的多種葡糖淀粉酶變體。本發(fā)明還涉及編碼這些變體的多核苷酸,包含這些多核苷酸的核酸構(gòu)建體、載體以及宿主細(xì)胞;以及使用這些變體的方法。
【專利說明】葡糖淀粉酶變體和編碼它們的多核苷酸[0001 ] 對(duì)序列表的引用
[0002]本申請(qǐng)含有處于計(jì)算機(jī)可讀形式的序列表,將其通過引用結(jié)合在此。
[0003]發(fā)明背景
發(fā)明領(lǐng)域
[0004]本發(fā)明涉及一種葡糖淀粉酶變體、編碼該變體的多核苷酸、產(chǎn)生這些變體的方法、以及使用這些變體的方法。
[0005]相關(guān)技術(shù)說明[0006]葡糖淀粉酶(1,4- a -D-葡聚糖葡糖水解酶,EC3.2.1.3)是催化D-葡萄糖從淀粉或相關(guān)寡糖和多糖分子的非還原端釋放的一種酶。葡糖淀粉酶由若干絲狀真菌和酵母產(chǎn)生,其中來自曲霉菌屬(Aspergillus)的那些在商業(yè)上最為重要。
[0007]在商業(yè)上,葡糖淀粉酶用于將已經(jīng)由α-淀粉酶部分水解的淀粉轉(zhuǎn)化成葡萄糖。然后可以使用發(fā)酵有機(jī)體將葡萄糖直接或間接轉(zhuǎn)化成發(fā)酵產(chǎn)品。商業(yè)發(fā)酵產(chǎn)品的實(shí)例包括醇類(例如,乙醇、甲醇、丁醇、1,3-丙二醇);有機(jī)酸類(例如,檸檬酸、乙酸、衣康酸、乳酸、葡糖酸、葡糖酸鹽、乳酸、丁二酸、2,5-二酮-D-葡糖酸);酮類(例如,丙酮);氨基酸(例如,谷氨酸);氣體(例如,H2和CO2);以及更復(fù)雜的化合物,包括例如抗生素(例如,盤尼西林和四環(huán)素);酶;維生素(例如,核黃素、Β12、β-胡蘿卜素);激素以及難以合成生產(chǎn)的其他化合物。發(fā)酵過程通常還用于可食用酒精(例如,啤酒和酒)工業(yè)、乳制品(例如,在酸乳和奶酪的生產(chǎn)中)工業(yè)中。
[0008]最終產(chǎn)品還可以是糖漿。例如,最終產(chǎn)品可以是葡萄糖,但是還可以被葡萄糖異構(gòu)酶轉(zhuǎn)化成果糖或者由幾乎均等的葡萄糖與果糖組成的一種混合物。這種混合物或者進(jìn)一步富含果糖的一種混合物是全世界商業(yè)化的最常用的高果糖玉米糖漿(HFCS)。
[0009]本發(fā)明的一個(gè)目的是提供具有葡糖淀粉酶活性的多肽和編碼這些多肽的多核苷酸,并且這些多肽和多核苷酸在發(fā)酵產(chǎn)品的生產(chǎn)過程中提供高產(chǎn)量,這些生產(chǎn)過程例如乙醇生產(chǎn)過程,包括從未糊化的生淀粉(或者未蒸煮的淀粉)的一步乙醇發(fā)酵過程。共同未決的專利申請(qǐng)W02011/127802披露了來自草酸青霉菌的野生型葡糖淀粉酶。
[0010]本發(fā)明提供了與其親本相比具有改進(jìn)的特性的葡糖淀粉酶變體。
[0011]發(fā)明概述
[0012]本發(fā)明涉及一種葡糖淀粉酶變體,該葡糖淀粉酶變體至少在與SEQ IDN0:2的成熟多肽的位置79相對(duì)應(yīng)的一個(gè)位置處包含一個(gè)取代,其中該變體具有葡糖淀粉酶活性。
[0013]在另外的方面,本發(fā)明涉及一種變體葡糖淀粉酶催化域,該變體葡糖淀粉酶催化域至少在與SEQ ID NO: 2的成熟多肽的位置79相對(duì)應(yīng)的一個(gè)位置處包含一個(gè)取代,其中該變體具有葡糖淀粉酶活性。
[0014]在另一方面,本發(fā)明涉及一種包含本發(fā)明的多肽的組合物。
[0015]本發(fā)明還涉及編碼這些變體的分離的多核苷酸,包含這些多核苷酸的核酸構(gòu)建體、載體以及宿主細(xì)胞;以及產(chǎn)生這些變體的方法。[0016]本發(fā)明還涉及在糖漿和/或一種發(fā)酵產(chǎn)品的生產(chǎn)中使用本發(fā)明的多肽的方法。
[0017]定義
[0018]葡糖淀粉酶:術(shù)語(yǔ)葡糖淀粉酶(1,4- a -D-葡聚糖葡糖水解酶,EC3.2.1.3)被定義為催化D-葡萄糖從淀粉或相關(guān)寡糖和多糖分子的非還原端釋放的一種酶。出于本發(fā)明的目的,根據(jù)在此的‘材料與方法’部分所述的程序來確定葡糖淀粉酶活性。
[0019]本發(fā)明的多肽具有SEQ ID NO:2的成熟多肽的至少20%、優(yōu)選至少40%、優(yōu)選至少45%、更優(yōu)選至少50%、更優(yōu)選至少55%、更優(yōu)選至少60%、更優(yōu)選至少65%、更優(yōu)選至少70%、更優(yōu)選至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少90%、最優(yōu)選至少95%以及最優(yōu)選至少100%的葡糖淀粉酶活性。
[0020]等位基因變體:術(shù)語(yǔ)“等位基因變體”意指占據(jù)相同染色體基因座的基因的兩種或更多種替代形式中的任一種。等位基因變異通過突變而天然存在,并且可導(dǎo)致群體內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中沒有變化)或者可以編碼具有改變的氨基酸序列的多肽。一個(gè)多肽的等位基因變體是由一個(gè)基因的等位基因變體編碼的多肽。
[0021]cDNA:術(shù)語(yǔ)“cDNA”意指可以通過從成熟的、剪接的mRNA分子反轉(zhuǎn)錄制備的DNA分子,該mRNA分子是從真核細(xì)胞或原核細(xì)胞中獲得。cDNA缺乏可以存在于對(duì)應(yīng)基因組DNA中的內(nèi)含子序列。起始的初級(jí)RNA轉(zhuǎn)錄物是通過一系列步驟加工的mRNA的前體,這些步驟包括在作為成熟剪接的mRNA出現(xiàn)之前進(jìn)行剪接。
[0022]編碼序列:術(shù)語(yǔ)“編碼序列”意指直接指定一個(gè)變體的氨基酸序列的多核苷酸。編碼序列的邊界一般是通過以起始密碼子(例如ATG、GTG或TTG)開始并以終止密碼子(例如TAA,TAG或TGA)結(jié)束的一個(gè)開放讀碼框來決定。編碼序列可以是一個(gè)基因組DNA、cDNA、合成的DNA或其組合。
[0023]控制序列:術(shù)語(yǔ)“控制序列”意指對(duì)于表達(dá)編碼本發(fā)明的變體的多核苷酸所必需的核酸序列。每個(gè)控制序列針對(duì)編碼該變體的多核苷酸來說可以是原生的(即,來自相同基因)或者外源的(即,來自不同基因),或者相對(duì)于彼此是原生的或外源的。這類控制序列包含但不局限于前導(dǎo)子、多腺苷酸化序列、前肽序列、啟動(dòng)子、信號(hào)肽序列、以及轉(zhuǎn)錄終止子。這些控制序列至少包含一個(gè)啟動(dòng)子以及轉(zhuǎn)錄和翻譯終止信號(hào)。出于引入有利于將這些控制序列與編碼一種變體的多核苷酸的編碼區(qū)連接的特異性限制酶切位點(diǎn)的目的,這些控制序列可以提供有多個(gè)接頭。
[0024]表達(dá):術(shù)語(yǔ)“表達(dá)”包括涉及在一個(gè)變體的產(chǎn)生中的任何步驟,包括但不局限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾、以及分泌。
[0025]表達(dá)載體:術(shù)語(yǔ)“表達(dá)載體”意指包含編碼一種變體的一種多核苷酸并可操作地連接至提供其表達(dá)的控制序列的線性或環(huán)形DNA分子。
[0026]片段:術(shù)語(yǔ)“片段”意指使一個(gè)或多個(gè)(例如,若干個(gè))氨基酸從成熟多肽的氨基和/或羧基末端缺少的多肽,其中該片段具有葡糖淀粉酶活性。在一方面,一個(gè)片段含有至少465個(gè)氨基酸殘基(例如,SEQ ID NO:2的氨基酸30至494)。 [0027]高嚴(yán)格條件:術(shù)語(yǔ)“高嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及50%甲酰胺中進(jìn)行12至24小時(shí)的預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在65°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。[0028]宿主細(xì)胞:術(shù)語(yǔ)“宿主細(xì)胞”意指易于用包含本發(fā)明的多核苷酸的核酸構(gòu)建體或表達(dá)載體進(jìn)行轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、等的任何細(xì)胞類型。術(shù)語(yǔ)“宿主細(xì)胞”涵蓋了由于在復(fù)制過程中存在的突變而與親本細(xì)胞不相同的親本細(xì)胞的任何子代。
[0029]改進(jìn)的特性:術(shù)語(yǔ)“改進(jìn)的特性”意指與一種變體相關(guān)的相對(duì)于親本有所改進(jìn)的特征。這類改進(jìn)的特性包括但不局限于改進(jìn)的對(duì)由宿主蛋白酶所引起的降解或切口的穩(wěn)定性。改進(jìn)的穩(wěn)定性相當(dāng)于減小的敏感度。優(yōu)選地,該敏感度減小至少10%、優(yōu)選至少20%、更優(yōu)選至少30%、優(yōu)選至少40%、優(yōu)選至少45%、更優(yōu)選至少50%、更優(yōu)選至少55%、更優(yōu)選至少60%、更優(yōu)選至少65%、更優(yōu)選至少70%、更優(yōu)選至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少90%、更優(yōu)選至少95%、并且甚至最優(yōu)選至少100%。
[0030]分離的:術(shù)語(yǔ)“分離的”意指處于非天然存在的形式或環(huán)境中的一種物質(zhì)。分離的物質(zhì)的非限制實(shí)例包括(I)任何非天然存在的物質(zhì);(2)至少部分地從與其在自然界中相關(guān)聯(lián)的一種或多種或全部天然存在的組分中除去的任何物質(zhì),包括但不局限于任何酶、變體、核酸、蛋白、肽或輔因子;(3)相對(duì)于自然界中發(fā)現(xiàn)的那種物質(zhì)通過人工手動(dòng)改性的任何物質(zhì);或者(4)通過增加該物質(zhì)相對(duì)于與其天然相關(guān)聯(lián)的其他組分的量來改性的任何物質(zhì)(例如,編碼該物質(zhì)的一個(gè)基因的多個(gè)拷貝;比與編碼該物質(zhì)的基因天然相關(guān)聯(lián)的啟動(dòng)更強(qiáng)的啟動(dòng)子的使用)。一種分離的物質(zhì)可以存在于發(fā)酵液樣品中。
[0031]低嚴(yán)格條件:術(shù)語(yǔ)“低嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及25%甲酰胺中進(jìn)行12至24小時(shí)預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在50°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。
[0032]成熟多肽:術(shù)語(yǔ)“成熟多肽”意指在翻譯和任何翻譯后修飾(例如N-末端加工、C-末端截短、糖基化、磷酸化、等)之后處于其最終形式的一種多肽。在一方面,基于預(yù)測(cè)SEQID NO: 2的氨基酸I至21是一個(gè)信號(hào)肽的程序SignalP (尼爾森(Nielsen)等人,1997,蛋白工程(Protein Engineering)10:1-6),成熟多肽是 SEQ ID NO:2 的氨基酸 22 至 616。在本領(lǐng)域中已知的是,一個(gè)宿主細(xì)胞可以產(chǎn)生由相同多核苷酸表達(dá)的兩種或更多種不同成熟多肽(即,具有一個(gè)不同的C-末端和/或N-末端氨基酸)的混合物。
[0033]成熟多肽編碼序列:術(shù)語(yǔ)“成熟多肽編碼序列”意指編碼具有葡糖淀粉酶活性的一種成熟多肽的一種多核苷酸。在一方面,基于預(yù)測(cè)SEQ ID NO:1的核苷酸I至63編碼信號(hào)肽的SignalP(上文的尼爾森等人,1997),這一成熟多肽編碼序列是SEQ ID NO:1的核苷酸64 至 1848。
[0034]中等嚴(yán)格條件:術(shù)語(yǔ)“中等嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及35%甲酰胺中進(jìn)行12至24小時(shí)預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在55°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。
[0035]中-高嚴(yán)格條件:術(shù)語(yǔ)“中-高嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及35%甲酰胺中進(jìn)行12至24小時(shí)預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在60°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。
[0036]突變體:術(shù)語(yǔ)“突變體”意指編碼一種變體的一種多核苷酸。[0037]核酸構(gòu)建體:術(shù)語(yǔ)“核酸構(gòu)建體”意指單鏈亦或雙鏈的一種核酸分子,該核酸分子是從天然存在的基因中分離的,或者以一種否則將不存在于自然界中的方式被修飾成含有核酸的區(qū)段,或者是合成的,該核酸分子包含一個(gè)或多個(gè)控制序列。
[0038]可操作地連接:術(shù)語(yǔ)“可操作地連接”意指其中一個(gè)控制序列位于相對(duì)于一個(gè)多核苷酸的編碼序列的適當(dāng)位置處,這樣使得該控制序列指導(dǎo)該編碼序列的表達(dá)的配置。
[0039]親本或親本葡糖淀粉酶術(shù)語(yǔ)“親本”或“親本葡糖淀粉酶”意指對(duì)其做出改變以產(chǎn)生本發(fā)明的酶變體的一種葡糖淀粉酶。該親本可以是天然存在的(野生型)多肽或其變體或片段。在一個(gè)實(shí)施例中,該親本葡糖淀粉酶是SEQID N0:2的成熟多肽。
[0040]序列一致性:兩個(gè)氨基酸序列之間或者兩個(gè)核苷酸序列之間的關(guān)聯(lián)度通過參數(shù)“序列一致性”來描述。
[0041]出于本發(fā)明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼&翁施,1970,分子生物學(xué)雜志(J.Mol.Biol.) 48:443-453)來確定兩個(gè)氨基酸序列之間的序列一致性,該算法如EMBOSS軟件包(EMBOSS:歐洲分子生物學(xué)開放軟件套件(The EuropeanMolecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學(xué)趨勢(shì)(TrendsGenet.) 16:276-277)(優(yōu)選5.0.0版或更新版本)的Needle程序所實(shí)施的。使用的參數(shù)是10的空位開放罰分、0.5的空位擴(kuò)展罰分以及EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩陣。將標(biāo)記為“最長(zhǎng)一致性”的Needle的輸出(使用非簡(jiǎn)化選項(xiàng)(nobrief option)獲得)用作百分比一致性并且計(jì)算如下:
[0042](一致性殘基xl OO)/ (比對(duì)的長(zhǎng)度-比對(duì)中的空位總數(shù))
[0043]出于本發(fā)明的目的,使用尼德曼-翁施算法(上文的尼德曼&翁施,1970 )來確定兩個(gè)脫氧核苷酸序列之間的序列一致性,該算法如EMBOSS軟件包(EMB0SS:歐洲分子生物學(xué)開放軟件套件,上文的賴斯等人,2000)(優(yōu)選5.0.0版或更新版本)的Needle程序所實(shí)施的。使用的參數(shù)是10的空位開放罰分、0.5的空位擴(kuò)展罰分以及EDNAFULL (NCBI NUC4.4的EMBOSS版本)取代矩陣。將標(biāo)記為“最長(zhǎng)一致性”的Needle的輸出(使用非簡(jiǎn)化選項(xiàng)(nobrief option)獲得)用作一致性百分比并且計(jì)算如下:
[0044](一致性脫氧核苷酸xlOO)/ (比對(duì)的長(zhǎng)度-比對(duì)中的空位總數(shù))
[0045]子序列:術(shù)語(yǔ)“子序列”意指使一個(gè)或多個(gè)(例如,若干個(gè))核苷酸從成熟多肽編碼序列的5’端和/或3’端缺少的多核苷酸,其中該子序列編碼具有葡糖淀粉酶活性的一個(gè)片段。在一方面,一個(gè)子序列包含至少1395個(gè)核苷酸(例如,SEQ ID NO:1的核苷酸88至1482)。
[0046]變體:術(shù)語(yǔ)“變體”意指具有葡糖淀粉酶活性的、包含一個(gè)改變(即在一個(gè)或多個(gè)(例如,若干)位置處的一個(gè)取代、插入和/或缺失)的一個(gè)多肽。取代意指用一個(gè)不同的氨基酸替換占據(jù)某一位置的氨基酸;缺失意指去除占據(jù)某一位置的氨基酸;并且插入意指鄰近并且緊跟在占據(jù)某一位置的氨基酸之后添加一個(gè)氨基酸。本發(fā)明的這些變體具有SEQ IDNO:2的成熟多肽的至少20%、例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的葡糖淀粉酶活性。
[0047]非常高嚴(yán)格條件:術(shù)語(yǔ)“非常高嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及50%甲酰胺中進(jìn)行12至24小時(shí)預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在70°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。
[0048]非常低嚴(yán)格條件:術(shù)語(yǔ)“非常低嚴(yán)格條件”意指對(duì)于至少100個(gè)核苷酸長(zhǎng)的探針來說,按照標(biāo)準(zhǔn)DNA印跡法程序,在42°C下于5X SSPE、0.3%SDS、200微克/ml剪切且變性的蛙魚精DNA以及25%甲酰胺中進(jìn)行12至24小時(shí)預(yù)雜交和雜交。最終,使用2X SSC、0.2%SDS在45°C下洗滌運(yùn)載體材料三次,每次持續(xù)15分鐘。
[0049]野生型葡糖淀粉酶:術(shù)語(yǔ)“野生型葡糖淀粉酶”意指由天然存在的微生物(例如在自然界中發(fā)現(xiàn)的細(xì)菌、酵母或絲狀真菌)表達(dá)的一種葡糖淀粉酶。
[0050]用于變體表示的常規(guī)[0051]出于本發(fā)明的目的,將包括在SEQ ID N0:2中的成熟多肽用于確定另一種葡糖淀粉酶中的對(duì)應(yīng)氨基酸殘基。將另一種葡糖淀粉酶的氨基酸序列與SEQ ID N0:2的披露為氨基酸22至616的成熟多肽進(jìn)行比對(duì),并且基于該比對(duì),使用尼德曼-翁施算法(尼德曼&翁施,1970,分子生物學(xué)雜志48:443-453)來確定與SEQ ID NO:2中所披露的成熟多肽的任何氨基酸殘基相對(duì)應(yīng)的氨基酸位置編號(hào),該算法如EMBOSS軟件包(EMBOSS:歐洲分子生物學(xué)開放軟件套件,賴斯等人,2000,遺傳學(xué)趨勢(shì)16:276-277)(優(yōu)選5.0.0版或更新版本)的Needle程序所實(shí)施的。使用的參數(shù)是10的空位開放罰分、0.5的空位擴(kuò)展罰分、以及EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩陣。因此,如果例如該變體在位置79處具有一個(gè)取代,則這與如SEQ ID N0:2所披露的全長(zhǎng)多肽中的位置100相對(duì)應(yīng),因?yàn)榘被酙至21是信號(hào)肽并且位置22將與這一成熟多肽中的位置I相對(duì)應(yīng)。
[0052]通過使用若干計(jì)算機(jī)程序、使用它們相應(yīng)的默認(rèn)參數(shù)來比對(duì)多個(gè)多肽序列可以確定在另一種葡糖淀粉酶中的對(duì)應(yīng)氨基酸殘基的鑒別,這些計(jì)算機(jī)程序包括但不局限于MUSCLE (通過期望值的對(duì)數(shù)的多序列比較(multiple sequence comparison bylog - expectation) ;3.5 版或更新版本;埃德加(Edgar), 2004,核酸研究(Nucleic AcidsResearch)32:1792-1797),MAFFT (6.857 版或更新版本;加藤(Katoh)& 庫(kù)瑪(Kuma),2002,核酸研究30:3059-3066 ;加藤等人,2005,核酸研究33:511-518 ;加藤&都(Toh),2007,生物信息學(xué)(Bioinformatics) 23:372-374 ;加藤等人,2009,分子牛.物學(xué)方法(MethodsinMolecular Biology) 537:39-64:加藤 & 都,2010,牛物信息學(xué) 26:1899-1900)以及采用ClustalW的EMBOSS EMMA (1.83或更新版本;湯普森(Thompson)等人,1994,核酸研究22:4673-4680)。
[0053]當(dāng)從SEQ ID N0:2的成熟多肽中分叉分出其他酶,這樣使得傳統(tǒng)的基于序列的比較不能檢測(cè)它們的關(guān)系(林達(dá)爾(Lindahl) &埃洛弗松(Elofsson),2000,分子生物學(xué)雜志295:613-615)時(shí),則可以使用其他逐對(duì)序列比較算法。在基于序列的搜索中的更大靈敏度可以使用搜索程序來獲得,這些搜索程序利用多肽家族的概率表示(輪廓(profile))來搜索數(shù)據(jù)庫(kù)。例如,PS1-BLAST程序通過一個(gè)迭代數(shù)據(jù)庫(kù)搜索過程來產(chǎn)生多個(gè)輪廓并且能夠檢測(cè)遠(yuǎn)距離同源物(阿特休爾(Atschul)等人,1997,核酸研究25:3389-3402)。如果多肽的家族或超家族在蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)中具有一個(gè)或多個(gè)代表,則可以實(shí)現(xiàn)甚至更大的靈敏度。程序(例如GenTHREADER)(瓊斯(Jones),1999,分子生物學(xué)雜志287:797-815 ;麥谷芬(McGuffin) &瓊斯,2003,生物信息學(xué)19:874-881)利用來自多種來源(PS1-BLAST,二級(jí)結(jié)構(gòu)預(yù)測(cè)、結(jié)構(gòu)比對(duì)輪廓以及溶劑化可能性)的信息作為對(duì)預(yù)測(cè)查詢序列的結(jié)構(gòu)折疊的神經(jīng)網(wǎng)絡(luò)的輸出。類似地,高夫(Gough)等人,2000,分子生物學(xué)雜志313:903-919的方法可以用于比對(duì)未知結(jié)構(gòu)的序列與存在于SCOP數(shù)據(jù)庫(kù)中的超家族模型。這些比對(duì)進(jìn)而可以用于產(chǎn)生多肽的同源性模型,并且使用出于該目的而開發(fā)的多種工具可以評(píng)定這類模型的準(zhǔn)確度。
[0054]對(duì)于已知結(jié)構(gòu)的蛋白,若干工具和資源可用于檢索并產(chǎn)生結(jié)構(gòu)比對(duì)。例如,蛋白的SCOP超家族已經(jīng)在結(jié)構(gòu)上進(jìn)行比對(duì),并且那些比對(duì)是可訪問的并且可下載的。使用多種算法(例如距離比對(duì)矩陣(赫爾姆(Holm) &桑德爾(Sander), 1998,蛋白雜志(Proteins)33:88-96)或者組合擴(kuò)展(辛迪亞洛夫(Shindyalov) &伯恩(Bourne), 1998,蛋白工程11:739-747))可以比對(duì)兩個(gè)或更多個(gè)蛋白結(jié)構(gòu),并且可以額外利用這些算法的實(shí)施來隨所感興趣的結(jié)構(gòu)查詢結(jié)構(gòu)數(shù)據(jù)庫(kù)以便發(fā)現(xiàn)可能的結(jié)構(gòu)同源物(例如,赫爾姆&帕克(Park),2000,生物信息學(xué) 16:566-567)。
[0055]在描述本發(fā)明的變體中,以下所述的命名法適于方便參考。采用了已接受的IUPAC
單個(gè)字母和三字母的氨基酸縮寫。
[0056]取也對(duì)于一個(gè)氨基酸取代,使用了以下命名法:原始氨基酸、位置、取代的氨基酸。因此,在位置226上的蘇氨酸被丙氨酸取代被表示為“Thr226Ala”或者“T226A”。多個(gè)突變由加號(hào)(“ + ”)分開,例如“Gly205Arg+Ser411Phe”或者“G205R+S411F”代表分別在位置205和位置411上甘氨酸(G)被精氨酸(R)并且絲氨酸(S)被苯丙氨酸(F)取代。
[0057]跡失對(duì)于一個(gè)氨基酸缺失,使用了以下命名法。原始氨基酸、位置、*。因此,在位置195上的甘氨酸缺失被表示為“Glyl95*”或者“G195*”。多個(gè)缺失由加號(hào)(“ + ”)分開,例如 “Glyl95*+Ser411*,,或者 “G195*+S411*,,。
[0058]通A對(duì)于一個(gè)氨基酸插入,使用了以下命名法:原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此,在位置195上的甘氨酸之后插入賴氨酸被表示為“Glyl95GlyLys”或者“G195GK”。多個(gè)氨基酸的插入被表示為“原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2”;等。例如,在位置195上的甘氨酸之后插入賴氨酸和丙氨酸被表示為 “Glyl95GlyLysAla” 或者 “G195GKA”。
[0059]在這類情況下,通過將小寫字母添加到在所插入的一個(gè)或多個(gè)氨基酸殘基之前的氨基酸殘基的位置編號(hào)中來對(duì)所插入的一個(gè)或多個(gè)氨基酸殘基進(jìn)行編號(hào)。在以上實(shí)例中,該序列因此將是:
[0060]
【權(quán)利要求】
1.一種葡糖淀粉酶變體,該變體至少在與SEQ ID NO: 2的成熟多肽的位置79相對(duì)應(yīng)的一個(gè)位置處包含一個(gè)取代,其中該變體具有葡糖淀粉酶活性。
2.如權(quán)利要求1所述的葡糖淀粉酶變體,該變體選自下組,該組由以下各項(xiàng)組成: a)與SEQID NO:2的成熟多肽具有至少65%的序列一致性的一種多肽; b)由在低嚴(yán)格條件下與(i)SEQID NO:1的成熟多肽編碼序列、或者(ii)⑴的全長(zhǎng)補(bǔ)體雜交的一種多核苷酸編碼的一種多肽; c)由與SEQID NO:1的這一成熟多肽編碼序列具有至少65%的一致性的一種多核苷酸編碼的一種多肽;以及 d)SEQ ID NO: 2的這一成熟多肽的具有葡糖淀粉酶活性的一個(gè)片段。
3.如權(quán)利要求1或2所述的葡糖淀粉酶變體,該變體是選自下組的親本葡糖淀粉酶的一種變體,該組由以下各項(xiàng)組成: a)與SEQID NO:2的這一成熟多肽具有至少65%的序列一致性的一種多肽; b)由在低嚴(yán)格條件下與(i)SEQID NO:1的這一成熟多肽編碼序列、或者(ii)⑴的該全長(zhǎng)補(bǔ)體雜交的一種多核苷酸編碼的一種多肽; c)由與SEQID NO:1的這一成熟多肽編碼序列具有至少65%—致性的一種多核苷酸編碼的一種多肽;以及 d)SEQ ID NO: 2的這一成熟多肽的具有葡糖淀粉酶活性的一個(gè)片段。
4.如權(quán)利要求1-3中任一項(xiàng)所述的葡糖淀粉酶變體,其中取代的數(shù)目是1-20個(gè),例如1-10 個(gè)和 1-5 個(gè),如 1、2、3、4、5、6、7、8、9 或者 10 個(gè)取代。
5.如權(quán)利要求1-4中任一項(xiàng)所述的葡糖淀粉酶變體,其中該變體包含選自K79V、K79A、K79G、K791、K79L、K79S、K79T 的一個(gè)取代。
6.如權(quán)利要求1-5中任一項(xiàng)所述的葡糖淀粉酶變體,其中該變體包含取代K79V。
7.如權(quán)利要求1-6中任一項(xiàng)所述的葡糖淀粉酶變體,該變體相對(duì)于該親本具有一個(gè)改進(jìn)的特性,其中這一改進(jìn)的特性是對(duì)蛋白酶降解的減小的敏感度。
8.一種變體葡糖淀粉酶催化域,該催化域至少在與SEQ ID NO: 2的成熟多肽的位置79相對(duì)應(yīng)的一個(gè)位置處包含一個(gè)取代,其中該變體具有葡糖淀粉酶活性。
9.如權(quán)利要求8所述的變體葡糖淀粉酶催化域,該催化域選自下組,該組由以下各項(xiàng)組成:(a)與SEQID NO:2的氨基酸30至494具有至少65%的序列一致性的一個(gè)催化域; (b)由在中等嚴(yán)格條件下與(i)SEQID NO:1的核苷酸88至1482、或者(ii)⑴的全長(zhǎng)補(bǔ)體雜交的一種多核苷酸編碼的一個(gè)催化域; (c)由與(i)SEQID NO:1的核苷酸88至1482具有至少65%的序列一致性的一種多核苷酸編碼的一個(gè)催化域;以及 (d)SEQID NO: 2的氨基酸30至494的一種變體,該變體在一個(gè)或多個(gè)(例如若干個(gè))位置處包含一個(gè)取代、缺失和/或插入; 并且其中該催化域具有葡糖淀粉酶活性。
10.一種組合物,該組合物包含如權(quán)利要求1-9中任一項(xiàng)所述的葡糖淀粉酶變體。
11.一種如權(quán)利要求1-9中任一項(xiàng)所述的葡糖淀粉酶變體用于生產(chǎn)糖漿和/或一種發(fā)酵產(chǎn)品的用途。
12.—種如權(quán)利要求1-9中任一項(xiàng)所述的葡糖淀粉酶變體用于釀造的用途。
13.一種用于由含淀粉的材料來生產(chǎn)發(fā)酵產(chǎn)品的過程,該過程包括以下步驟: (a)在一種α-淀粉酶存在下使含淀粉的材料液化; (b)使所液化的材料糖化;并且 (C)使用一種發(fā)酵有機(jī)體進(jìn)行發(fā)酵; 其中使用如權(quán)利要求1-9中任一項(xiàng)所述的至少一種葡糖淀粉酶變體進(jìn)行步驟(a)和/或步驟(b)。
14.一種用于由含淀粉的材料來生產(chǎn)發(fā)酵產(chǎn)品的過程,該過程包括以下步驟: (a)在低于所述含淀粉的材料的初始糊化溫度的溫度下使含淀粉的材料糖化;并且 (b)使用一種發(fā)酵有機(jī)體進(jìn)行發(fā)酵, 其中使用如權(quán)利要求1-9中任一項(xiàng)所述的至少一種葡糖淀粉酶變體進(jìn)行步驟(a)。
15.一種分離的多核苷酸,該多核苷酸編碼如權(quán)利要求1-9中任一項(xiàng)所述的葡糖淀粉酶變體。
16.—種核酸構(gòu)建體或表達(dá)載體,該核酸構(gòu)建體或表達(dá)載體包含如權(quán)利要求15所述的多核苷酸,該多核苷酸可操作地連接至指導(dǎo)葡糖淀粉酶變體在一種表達(dá)宿主中的產(chǎn)生的一個(gè)或多個(gè)控制序列。
17.—種重組宿主細(xì)胞,這一重組宿主細(xì)胞包含如權(quán)利要求15所述的多核苷酸,該多核苷酸可操作地連接至指導(dǎo)葡糖淀粉酶變體的產(chǎn)生的一個(gè)或多個(gè)控制序列。
18.—種產(chǎn)生如權(quán)利要求1-9中任一項(xiàng)所述的葡糖淀粉酶變體的方法,該方法包括: (a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)如權(quán)利要求22所述的宿主細(xì)胞;并且 (b)回收該葡糖淀粉酶變體。
19.一種包含如權(quán)利要求15所述的多核苷酸的核酸構(gòu)建體。
20.—種包含如權(quán)利要求15所述的多核苷酸的表達(dá)載體。
21.—種包含如權(quán) 利要求15所述的多核苷酸的宿主細(xì)胞。
【文檔編號(hào)】C12N9/24GK103930543SQ201280043431
【公開日】2014年7月16日 申請(qǐng)日期:2012年9月5日 優(yōu)先權(quán)日:2011年9月6日
【發(fā)明者】松井知子, S.克拉克 申請(qǐng)人:諾維信公司, 諾維信北美公司