專利名稱:用于淀粉加工的酶的制作方法
技術(shù)領(lǐng)域:
本發(fā)明尤其涉及包含糖-結(jié)合模塊(carbohydrate-binding module)(“CBM”)和alpha-淀粉酶催化結(jié)構(gòu)域的酶。所述的酶可為糖-結(jié)合模塊(“CBM”)和alpha-淀粉酶之間的雜合體或為包含糖-結(jié)合模塊(“CBM”)和alpha-淀粉酶催化結(jié)構(gòu)域的親代酶的變體。本發(fā)明也涉及所述的酶在淀粉液化過程中的用途,在所述淀粉液化過程中淀粉被降解為較小的寡糖和/或多糖片段。
背景技術(shù):
已經(jīng)描述了很多酶和過程用于將淀粉轉(zhuǎn)化為淀粉水解物,諸如麥芽糖、葡萄糖或特制糖漿,用作甜味劑或作為其它糖類如果糖的前體。葡萄糖也可發(fā)酵為乙醇或其它發(fā)酵產(chǎn)物,諸如檸檬酸、谷氨酸單鈉、葡糖酸、葡糖酸鈉、葡糖酸鈣、葡糖酸鉀、葡糖酸delta內(nèi)酯,或異抗壞血酸鈉、衣康酸、乳酸、葡糖酸;酮類;氨基酸、谷氨酸(單谷氨酸鈉(sodium monoglutaminate))、青霉素、四環(huán)素;酶;維生素,諸如核黃素、B12、beta-胡蘿卜素或激素。
淀粉是高分子量聚合物,其由葡萄糖單元的鏈組成。它通常由大約80%支鏈淀粉和20%直鏈淀粉組成。支鏈淀粉是分枝的多糖,其中alpha-1,4D-葡萄糖殘基的直鏈通過alpha-1,6糖苷鍵連接。
直鏈淀粉是直鏈的多糖,其由通過alpha-1,4糖苷鍵連接在一起的D-吡喃葡萄糖單元組成。在將淀粉轉(zhuǎn)化為可溶的淀粉水解物的情況,所述的淀粉被解聚(depolymerize)。常規(guī)的解聚過程由凝膠化步驟和兩個連續(xù)的處理步驟,即液化處理和糖化處理組成。
顆粒狀淀粉由微小的顆粒組成,其在室溫不溶于水。當(dāng)加熱水性的淀粉漿體時,所述的顆粒膨脹并最終脹破,將所述的淀粉分子分散到所述溶液中。在此“凝膠化”處理過程中,粘度有顯著的提高。由于在通常的工業(yè)過程中,所述的固體水平為30-40%,就必須將所述的淀粉變稀薄和“液化”,以使其能被處理。此粘度的降低現(xiàn)今主要通過酶法降解獲得。在液化步驟中,所述的長鏈淀粉被alpha-淀粉酶降解為較小的分枝的和線狀的單元(麥芽糖糊精)。所述的液化步驟通常在大約105-110℃進行大約5至10分鐘,然后在大約95℃進行大約1-2小時。然后將溫度降低到60℃,加入葡糖淀粉酶或beta-淀粉酶和任選的脫支酶,諸如異淀粉酶或支鏈淀粉酶,而且所述糖化處理進行大約24至72小時。
由前面的討論顯然,由于依據(jù)不同的步驟中溫度的不同要求,常規(guī)的淀粉轉(zhuǎn)化方法是非常消耗能量的。因此就需要能夠選擇和/或設(shè)計用于此方法的酶,可以進行全過程而無需將所述淀粉凝膠化。這樣的方法是專利US4591560、US4727026和US4009074和EP0171218,以及丹麥專利申請PA2003 00949的主題。本發(fā)明公開新的雜交酶和設(shè)計用于所述方法并包含CBM的氨基酸序列和真菌淀粉降解酶的氨基酸序列的野生型酶的遺傳修飾。雜交酶是WO9814601、WO0077165和丹麥專利申請PA 2003 00949的主題。
發(fā)明內(nèi)容
本發(fā)明在第一個方面提供了雜交酶(hybrid enzyme),其包含具有alpha-淀粉酶活性的催化模塊的氨基酸序列和糖-結(jié)合模塊的氨基酸序列,其中所述的催化模塊是真菌來源的。
本發(fā)明在第二個方面提供了SEQ ID NO41所示的真菌alpha-淀粉酶的變體或與SEQ ID NO41具有至少60%同源性、至少70%同源性、至少80%同源性或甚至至少90%同源性的alpha-淀粉酶的變體,其中所述的變體在一個或多個下列位置包含改變13、15、18、31、32、33、34、35、36、61、63、64、68、69、73、74、75、76、77、78、79、80、81、82、83、84、89、117、118、119、120、121、122、123、124、125、152、153、154、155、156、157、158、161、162、165、166、167、168、169、170、171、172、173、174、175、204、205、206、207、208、209、210、211、216、229、230、231、232、233、234、235、236、237、238、239、242、245、250、252、253、255、256、257、259、260、275、292、295、296、297、298、299、304、328、339、344、348、378、383、386、387、405、448和480其中;(a)所述的變化獨立地,i)插入占據(jù)所述位置的氨基酸的氨基酸下游,ii)缺失占據(jù)所述位置的氨基酸,或iii)用不同的氨基酸取代占據(jù)所述位置的氨基酸,b)所述的變體相對于所述親代真菌alpha-淀粉酶具有增加的酸性alpha-淀粉酶活性和或改進的酶穩(wěn)定性和,(c)每個位置對應(yīng)于SEQ ID NO43中所示的TAKA淀粉酶和/或SEQ IDNO41中所示的川地曲霉alpha-淀粉酶的氨基酸序列的位置。
在又一方面,本發(fā)明提供了分離的DNA序列,其編碼第一方面的雜交酶或第二方面的變體,包含編碼第一方面的雜交酶或第二方面的變體的DNA序列的DNA構(gòu)建體,包含編碼第一方面的雜交酶或第二方面的變體的DNA序列的表達(dá)載體,和用載體轉(zhuǎn)化的宿主細(xì)胞;其中所述的宿主細(xì)胞能夠表達(dá)編碼第一方面的雜交酶或第二方面的變體的DNA序列。
在第八個方面,本方面提供了用于液化淀粉的方法,其中凝膠化的或顆粒狀的淀粉底物在水介質(zhì)中用第一方面的雜交酶或第二方面的變體處理。
發(fā)明詳述術(shù)語“顆粒狀淀粉”理解為生的未烹調(diào)過的淀粉,即未經(jīng)過凝膠化的淀粉。淀粉作為不可溶于水的微小顆粒在植物中形成。這些顆粒在低于初始凝膠化溫度的溫度保留在淀粉中,當(dāng)將其置于冷水中時,淀粉顆??晌丈倭康囊后w。在溫度高達(dá)50℃至70℃時,所述的膨脹是可逆的。可逆性的程度依賴于具體的淀粉。在更高的溫度下,被稱為凝膠化的不可逆膨脹開始。
術(shù)語“初始凝膠化溫度”理解為淀粉的凝膠化開始發(fā)生的最低溫度。在水中加熱的淀粉在50℃-75℃開始凝膠化;凝膠化的準(zhǔn)確溫度依賴于具體的淀粉,并能夠由本領(lǐng)域的技術(shù)人員容易地確定。這樣,初始凝膠化溫度可根據(jù)植物種類、植物種類的具體品種以及生長條件而變化。在本發(fā)明的上下文中,給出的淀粉的初始凝膠化溫度是應(yīng)用Gorinstein.S.和Lii.C.,Starch/St_rke,Vol.44(12)pp.461-466(1992)描述的方法,淀粉顆粒的雙折射(birefringence)損失5%時的溫度。
術(shù)語“可溶的淀粉水解產(chǎn)物”理解為本發(fā)明的方法的可溶的產(chǎn)物,并可以包括單糖、二糖和寡糖,如葡萄糖、麥芽糖、麥芽糖糊精、環(huán)糊精和這些的任意混合物。優(yōu)選至少90%、91%、92%、93%、94%、95%、96%、97%或98%的顆粒狀淀粉的干固體被轉(zhuǎn)化為可溶的淀粉水解產(chǎn)物。
術(shù)語多肽“同源性”理解為指示第一個序列與第二個序列差異(derivation)的兩個序列之間的同一性(identity)程度。同源性可通過本領(lǐng)域公知的計算機程序適合地確定,所述的計算機程序如GCG程序包中提供的GAP(ProgramManual for the Wisconsin Package,Version 8,August 1994,Genetics ComputerGroup,575 Science Drive,Madison,Wisconsin,USA 53711)(Needleman,S.B.and Wunsch,C.D.,(1970),Journal of Molecular Biology,48,443-453)。在氨基酸序列比較中采用下列設(shè)置GAP產(chǎn)生罰分(creation penalty)3.0和GAP延伸罰分(extension penalty)0.1。用于同源性檢測的氨基酸序列的相關(guān)部分是成熟多肽,即沒有信號肽。
雜交酶酶分類編號(EC number)在具有權(quán)利要求的本說明書中是指與國際生物化學(xué)和分子生物學(xué)聯(lián)合會的推薦(1992)(Recommendations (1992)of theNomenclature Committee of the International Union of Biochemistry andMolecular Biology),Academic Press Inc,1992一致。
本文涉及的雜交酶或遺傳修飾的野生型酶包括含有alpha-淀粉水解酶(EC 3.2.1.1)的氨基酸序列的物種,所述alpha-淀粉水解酶的氨基酸序列與含有糖-結(jié)合模塊(CBM)的氨基酸序列連接(即共價連接)。
含有CBM的雜交酶,以及其制備和純化的詳細(xì)描述在本技術(shù)領(lǐng)域是已知的[參見,例如WO 90/00609、WO 94/24158和WO 95/16782以及Greenwood等,Biotechnology and Bioengineering 44(1994)pp.1295-1305]。它門可以,例如通過將DNA構(gòu)建體轉(zhuǎn)化入宿主細(xì)胞來制備,所述的DNA構(gòu)建體含有至少一部分的編碼糖-結(jié)合模塊的DNA,所述的糖-結(jié)合模塊通過或不通過接頭連接于編碼目標(biāo)酶的DNA序列,并培養(yǎng)轉(zhuǎn)化的宿主細(xì)胞以表達(dá)所述的融合基因。得到的重組產(chǎn)物(雜交酶)-常常在本領(lǐng)域中稱為“融合蛋白-可通過下列通式來描述A-CBM-MR-X在后面的公式中,A-CBM是至少包含所述的糖-結(jié)合模塊(CBM)本身的氨基酸序列的N-末端或C-末端區(qū)域。MR是中間區(qū)域(所述“接頭”),且X是多肽的氨基酸殘基的序列,所述多肽由編碼連接CBM的所述酶(或其它蛋白)的DNA序列編碼。
所述A部分可以不存在(以致于A-CBM為CBM本身,即包含恰恰是那些構(gòu)成所述CBM的氨基酸殘基)或可為一個或多個氨基酸殘基的序列(起所述CBM本身的末端延伸的作用)。所述接頭(MR)可為結(jié)合(bond)或短的連接基團,其包含大約2至大約100個碳原子,尤其是2至40個碳原子。然而,MR優(yōu)選為大約2至大約100個氨基酸殘基的序列,更優(yōu)選2至40個氨基酸殘基,如2至15個氨基酸殘基。
所述X部分可構(gòu)成整體雜交酶的N-末端或C-末端。
因此從上面顯而易見,所述CBM在所述類型的雜交酶中可以定位于所述雜交酶的C-末端、N-末端或內(nèi)部。
接頭序列所述的接頭序列可為任意合適的接頭序列。在優(yōu)選的實施方案中,所述接頭序列源自Athelia rolfsii AMG、黑曲霉(A.niger)AMG或川地曲霉(A.kawachii)alpha-淀粉酶,諸如選自黑曲霉AMG接頭TGGTTTTATPTGSGSVTSTSKTTATASKTSTSTSSTSA(SEQ ID NO26)、川地曲霉alpha-淀粉酶接頭TTTTTTAAATSTSKATTSSSSSSAAATTSSS(SEQ ID NO27)、Athelia rolfsii AMG接頭GATSPGGSSGS(SEQID NO28),和PEPT接頭PEPTPEPT(SEQ ID NO29)的接頭序列。在另一個優(yōu)選的實施方案中,所述雜交酶具有接頭序列,其與SEQ ID NO26、SEQID NO27、SEQ ID NO28或SEQ ID NO29中所示的氨基酸序列相差不多于10個位置、不多于9個位置、不多于8個位置、不多于7個位置、不多于6個位置、不多于5個位置、不多于4個位置、不多于3個位置、不多于2個位置或甚至不多于1個位置的接頭序列。
糖-結(jié)合模塊糖-結(jié)合模塊(CBM),常常稱為糖-結(jié)合結(jié)構(gòu)域(CBD),是多肽氨基酸序列,其優(yōu)選地連接于多糖或寡糖(醣類),經(jīng)常地-但不一定排他地-連接于其不溶于水(包括晶體)的形式。
源自淀粉降解酶的CBM通常被稱作淀粉-結(jié)合模塊或SBM(可在一些淀粉分解酶,如一些葡糖淀粉酶中,或在如環(huán)糊精葡聚糖轉(zhuǎn)移酶的酶中,或在alpha-淀粉酶中出現(xiàn)的CBM)。同樣地,其它CBM的亞-類可包含,例如,纖維素-結(jié)合模塊(來自纖維素分解酶的CBM)、殼多糖(chitin)-結(jié)合模塊(通常出現(xiàn)在殼多糖酶(chitinase)中的CBM)、木聚糖-結(jié)合模塊(通常出現(xiàn)在木聚糖酶中的CBM)、甘露聚糖-結(jié)合模塊(通常出現(xiàn)在甘露聚糖酶中的CBM)。SBM常常稱作SBD(淀粉結(jié)合結(jié)構(gòu)域)發(fā)現(xiàn)CBM作為大多肽或蛋白的組成部分,所述蛋白由兩個或多個多肽氨基酸序列區(qū)組成,尤其在水解酶(水解酶)中,其通常包括含有用于底物水解的活性位置的催化模塊和用于與所述糖底物結(jié)合的糖-結(jié)合模塊(CBM)。這些酶可包括一個以上的催化模塊和一個、兩個或三個CBM,并任選的進一步包括一個或多個多肽氨基酸序列區(qū),它將所述的CBM與所述的催化模塊相連接,后一種類型的區(qū)域通常表示為“接頭”。包括CBM的水解酶的實例-其中的一些已經(jīng)在前面提及-為纖維素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖酶(arabinofuranosidases)、乙酰酯酶(acetylesterase)和殼聚糖酶。CBM也在藻類,例如在紅藻Porphyra purpura中以非-水解多糖-結(jié)合蛋白的形式被發(fā)現(xiàn)。
在出現(xiàn)CBM的蛋白質(zhì)/多肽中(例如酶,通常為水解酶),CBM可位于N或C末端或位于內(nèi)部位置。
構(gòu)成CBM本身的那部分多肽或蛋白(例如水解酶),通常由多于大約30個并且少于大約250個氨基酸殘基組成。
所述的“家族20的糖-結(jié)合模塊”或CBM-20模塊,在本發(fā)明的上下文中定義為大約100個氨基酸的序列,其與由Joergensen等(1997)在Biotechnol.Lett.191027-1031,在
圖1中公開的多肽的糖-結(jié)合模塊(CBM)具有至少45%同源性。所述的CBM包括所述多肽的最后102個氨基酸,即來自氨基酸582至氨基酸683的亞序列。此公開中應(yīng)用的糖苷水解酶家族的編號依據(jù)Coutinho,P.M.& Henrissat,B.(1999)CAZy-Carbohydrate-Active Enzymes server在URLhttp//afmb.cnrs-mrs.fr/-cazy/CAZY/index.html或可替換地Coutinho,P.M.&Henrissat,B.1999;纖維素酶和其它糖類-活性酶的模塊結(jié)構(gòu)綜合的數(shù)據(jù)庫方法,在“Genetics,Biochemistry and Ecology of Cellulose Degradation”,K.Ohmiya,K.Hayashi,K.Sakka,Y.Kobayashi,S.Karita和T.Kimura eds.,UniPublishers Co.,Tokyo,pp.15-23,和Bourne,Y.Henrissat,B.2001;糖苷水解酶和糖基轉(zhuǎn)移酶家族和功能模塊,Current Opinion in Structural Biology 11593-600的概念。
包含適用于本發(fā)明上下文中的CBM的酶的實例是alpha-淀粉酶、(產(chǎn))麥芽糖alpha-淀粉酶、纖維素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖酶、乙酰酯酶和殼聚糖酶。此外與本發(fā)明相關(guān)的目標(biāo)CBM包括源自葡糖淀粉酶(EC 3.2.1.3)或源自CGTase(EC 2.4.1.19)的CBM。
源自真菌、細(xì)菌或植物來源的CBM通常適用于本發(fā)明的上下文。優(yōu)選真菌來源的CBM,更優(yōu)選來自曲霉屬、芽孢桿菌屬、克雷伯氏菌屬(Klebsiella)或根霉屬(Rhizopus)。關(guān)于這一點,適于分離相關(guān)基因的技術(shù)是本領(lǐng)域眾所周知的。
本發(fā)明優(yōu)選糖-結(jié)合模塊家族20的CBM。適于本發(fā)明的糖-結(jié)合模塊家族20的CBM可源自泡盛曲霉(Aspergillus awamori)的葡糖淀粉酶(SWISSPROTQ12537),川地曲霉(Aspergillus kawachii)(SWISSPROT P23176)、黑曲霉(SWISSPROT P04064)、米曲霉(SWISSPROT P36914)、來自Aspergilluskawachii的alpha-淀粉酶(EMBL#AB008370)、構(gòu)巢曲霉(Aspergillus nidulans)(NCBI AAF17100.1)、來自蠟狀芽胞桿菌(Bacillus cereus)的beta-淀粉酶(SWISSPROT P36924),或來自環(huán)狀芽孢桿菌(Bacillus circulans)的CGTase(SWISSPROT P43379)。優(yōu)選來自Aspergillus kawachii的alpha-淀粉酶(EMBL#AB008370)的CBM,以及與川地曲霉(EMBL#AB008370)的alpha-淀粉酶的CBM具有至少50%、60%、70%、80%或甚至至少90%同源性的CBM,即與SEQ ID NO6的氨基酸序列具有至少50%、60%、70%、80%或甚至至少90%同源性的CBM。本發(fā)明也優(yōu)選糖-結(jié)合模塊家族20的CBM,所述的糖-結(jié)合模塊家族20具有SEQ ID NO9、SEQ ID NO10和SEQ IDNO11所顯示的和丹麥專利申請PA 2003 00949中分別如SEQ ID NO1、SEQID NO2和SEQ ID NO3所公開的氨基酸序列。還優(yōu)選的CBM包括來自Hormoconis sp.,如來自Hormoconis resinae(同物異名為木餾油真菌(Creosotefungus)或Amorphotheca resinae)的葡糖淀粉酶的CBM,如SWISSPROTQ03045的CBM(SEQ ID NO12),來自Lentinula sp.,如來自Lentinula edodes(shiitake mushroom),如SPTREMBLQ9P4C5的CBM(SEQ IDNO13),來自脈孢菌屬(Neurospora sp.),如來自粗糙脈孢菌(Neurosporacrassa),如SWISSPROTP14804的CBM(SEQ ID NO14),來自踝節(jié)菌屬(Talaromyces),如來自Talaromyces byssochlamydioides,如NN005220的CBM(SEQ ID NO15),來自Geosmithia sp.,如來自Geosmithia cylindrospora,如NN48286的CBM(SEQ ID NO16),來自膠殼炱屬(Scorias sp.),如來自Scoriasspongiosa,如NN007096的CBM(SEQ ID NO17),來自正青霉屬(Eupenicilliumsp.),如來自Eupenicillium ludwigii,如NN005968的CBM(SEQ ID NO18),來自曲霉屬,如來自日本曲霉(Aspergillus japonicus),如NN001136的CBM(SEQ ID NO19),來自青霉屬(Penicillium sp.),如來自米舒青霉(Penicillium cf.miczynskii),如NN48691的CBM(SEQ ID NO20),來自Mzl青霉屬,如NN48690的CBM(SEQ ID NO21),來自Thysanophora sp.,如NN48711的CBM(SEQ ID NO22),來自腐質(zhì)霉屬(Humicola sp.),如來自灰腐質(zhì)霉Humicola grisea thermoidea變種,如SPTREMBLQ12623的CBM (SEQ IDNO23)。最優(yōu)選的CBM包括來自曲霉屬,如來自黑曲霉的葡糖淀粉酶的CBM,如SEQ ID NO24,和來自Athelia sp.,如來自Athelia rolfsii的葡糖淀粉酶的CBM,如SEQ ID NO25。本發(fā)明也優(yōu)選應(yīng)用任意CBD,其與上述提及的CBD氨基酸序列具有至少50%、60%、70%、80%或甚至至少90%同源性。
此外合適的糖-結(jié)合模塊家族20的CBM可在URLhttp//afmb.cnrs-mrs.fr/-cazy/CAZY/index.html)找到。
一旦編碼底物-結(jié)合(糖-結(jié)合)區(qū)域的核苷酸序列鑒定為cDNA或染色體DNA,于是它可以以多種方法操作以將其融合與編碼目標(biāo)酶的DNA序列。然后編碼糖-結(jié)合氨基酸序列的DNA片段和編碼目標(biāo)酶的DNA通過或不通過接頭連接。所得到的連接的DNA然后可以以多種方法操作以實現(xiàn)表達(dá)。
Alpha-淀粉分解序列適合作為本發(fā)明的上下文中應(yīng)用的CBM/淀粉酶雜合體類型的基礎(chǔ)的Alpha-淀粉酶(尤其是酸穩(wěn)定的alpha-淀粉酶),包括那些真菌來源的。
優(yōu)選所述的alpha-淀粉酶是野生型酶。更優(yōu)選所述的alpha-淀粉酶是變體alpha-淀粉酶,其包括引起活性增加、在低pH和/或在高pH蛋白穩(wěn)定性增加、對于鈣耗竭(depletion)的穩(wěn)定性增加,和/或在高溫穩(wěn)定性增加的氨基酸修飾。上述alpha-淀粉酶的化學(xué)修飾或遺傳修飾的突變體包括在這一點中。
相關(guān)的alpha-淀粉酶包括,例如,從曲霉菌種,尤其是從黑曲霉菌中可得到的alpha-淀粉酶,如酸穩(wěn)定的alpha-淀粉酶(SWISSPROT P56271),其在WO 8901969(實施例3)中詳細(xì)描述并具有SEQ ID NO8中所示的氨基酸序列和/或由SEQ ID NO7中所示的DNA序列編碼。也優(yōu)選alpha-淀粉酶序列,其與SEQ ID NO8中所示的氨基酸序列具有50%以上,如60%,或70%、80%或90%同源性和/或由SEQ ID NO7中所示的DNA序列編碼。
在另一個優(yōu)選的實施方案中,所述的alpha-淀粉分解序列源自所述米曲霉菌酸性alpha-淀粉酶(FungamylTM)。更優(yōu)選所述alpha-淀粉分解序列與SEQID NO30中所示的氨基酸序列和/或與SEQ ID NO30中所示的氨基酸21-498顯示的序列具有50%以上,如60%,或70%、80%或90%同源性。
還更優(yōu)選的是實施方案,其中所述的雜交酶包括源自米曲霉酸性alpha-淀粉酶(FungamylTM,SEQ ID NO30)的淀粉分解序列,和/或源自川地曲霉alpha-淀粉酶或A.rolfsii AMG的接頭序列,和/或源自川地曲霉alpha-淀粉酶(SEQ ID NO5)或A.rolfsii AMG(SEQ ID NO25)的CBM。尤其是這樣的實施方案,所述雜交酶具有SEQ ID NO36中或SEQ ID NO40中顯示的氨基酸序列。
也優(yōu)選的是實施方案,其中所述的雜交酶包括源自具有SEQ ID NO8中所示序列的黑曲霉酸性alpha-淀粉酶催化模塊的淀粉分解序列,和/或源自川地曲霉alpha-淀粉酶或A.rolfsii AMG的接頭序列,和/或源自川地曲霉alpha-淀粉酶、A.rolfsii AMG或黑曲霉AMG的CBM。在特別優(yōu)選的實施方案中,所述雜交酶包含具有SEQ ID NO8中所示序列的黑曲霉酸性alpha-淀粉酶催化模塊和所述的川地曲霉alpha-淀粉酶接頭和CBM(SEQ ID NO6)。
優(yōu)選地,所述雜交酶包括CBD序列,其與SEQ ID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ IDNO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24或SEQ ID NO25中所示的任意的氨基酸序列具有至少50%、60%、70%、80%或甚至至少90%同源性。還更優(yōu)選的雜交酶包括CBD序列,其具有SEQ IDNO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ IDNO23、SEQ ID NO24或SEQ ID NO25中所示的氨基酸序列。在有一個優(yōu)選的實施方案中,所述的CBM序列具有氨基酸序列,其與SEQ ID NO9、SEQID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ IDNO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQID NO24或SEQ ID NO25中所示的氨基酸序列相差不多于10個位置、不多于9個位置、不多于8個位置、不多于7個位置、不多于6個位置、不多于5個位置、不多于4個位置、不多于3個位置、不多于2個位置或甚至不多于1個位置。在最優(yōu)選的實施方案中,所述的雜交酶包含CBM,其來自源于A.rolfsii的AMG,如美國專利4,727,026中描述的來自A.rolfsii AHU 9627的AMG。
在具體的上述上述方案中,所述的雜交酶具有SEQ ID NO32、SEQ IDNO34或SEQ ID NO38中所示的氨基酸序列,或所述的雜交酶具有氨基酸序列,其與上述提及的任何氨基酸序列具有至少50%、60%、70%、80%或甚至至少90%同源性。
在又一個優(yōu)選的實施方案中,所述的雜交酶具有氨基酸序列,其與SEQID NO32、SEQ ID NO34、SEQ ID NO36、SEQ ID NO38或SEQ ID NO40中所示的氨基酸序列相差不多于10個位置、不多于9個位置、不多于8個位置、不多于7個位置、不多于6個位置、不多于5個位置、不多于4個位置、不多于3個位置、不多于2個位置或甚至不多于1個位置。
在優(yōu)選的實施方案中,所述雜交酶是包含如SEQ ID NO40的氨基酸21-498(和/或SEQ ID NO30的氨基酸21-498)所示的催化結(jié)構(gòu)域的變體,其具有一個或多個取代,更優(yōu)選在選自81、158、161、163、164、175、176、177、253、264、266、466、468、470的一個或多個位置的取代,并最優(yōu)選選自Q81R、K158D、K158V、S161D、S161N、Q163S、Q163A、D164S、Y175W、E176D、D177N、D253N、N264K、N264E、M266L、G466D、D468S、和N470D的一個或多個取代。在還更優(yōu)選的實施方案中,所述的雜交酶是在表6中列出的變體中的一個。也優(yōu)選包含SEQ ID NO40的氨基酸21-498所示(和/或SEQ ID NO30的氨基酸21-498)的催化結(jié)構(gòu)域的變體,其具有選自Y175W+E176D、276W+P277Q、K380T+L381W、G62N、G62F、Y95D、D106K+S109D、A140P、K158D+D164S、F171L+E182Q、K200E+V202A、K200E+V202A、K200E+V202A、T227S+K233P、L252D+D255N、N264K+M266L、K283E、N359K+D360V、N390K+Y391L、G466D+N470D、Y484L+S498S、Y484L+S498G和Y484L+S498R的一個或多個取代或取代的組合。
在優(yōu)選的實施方案中,所述的雜交酶包含如SEQ ID NO40的氨基酸21-498(和/或SEQ ID NO30的氨基酸21-498)所示的催化模塊,其具有一個或多個選自K158V、S161N、Q163A、D164S、N264K、M266L、G466D、D468S和N470D的取代。
在另一個優(yōu)選的實施方案中,所述的雜交酶包含如SEQ ID NO40的氨基酸21-498(和/或SEQ ID NO30的氨基酸21-498)所示的催化模塊,其具有一個或多個選自Q81R、K158V、S161N、Q163A、D164S、Y175W、E176D、D177N、N264K、M266L、G466D、D468S和N470D的取代。
表達(dá)載體本發(fā)明也涉及重組表達(dá)載體,其可包含編碼所述雜交酶或遺傳修飾的野生型酶的DNA序列、啟動子、信號肽序列、轉(zhuǎn)錄和翻譯終止信號??蓪⑸鲜龅亩喾NDNA和控制序列結(jié)合在一起以產(chǎn)生重組表達(dá)載體,其可包括一種或多種方便的限制酶切位點,以允許在這些位點上插入或取代編碼所述多肽的DNA序列。可替換地,本發(fā)明的DNA序列可以通過將所述DNA序列或包含所述序列的DNA構(gòu)建體插入適于表達(dá)的載體中進行表達(dá)。在創(chuàng)建所述表達(dá)載體的過程中,使所述編碼序列位于所述載體中,這樣一來,所述的編碼序列可操作地與適于表達(dá)并可能分泌的控制序列連接。
所述的重組表達(dá)載體可為任意載體(例如,質(zhì)?;虿《?,其可以方便地進行重組DNA步驟,并可使所述DNA序列表達(dá)。所述載體的選擇通常依賴于所述載體與被導(dǎo)入所述載體的宿主細(xì)胞的相容性(compatibility)。所述載體可為線狀的質(zhì)?;蜷]合的環(huán)狀質(zhì)粒。
所述載體可為自發(fā)復(fù)制的(autonomously replicating)載體,即作為染色體外的實體存在的載體,它的復(fù)制獨立于染色體的復(fù)制,例如,質(zhì)粒、染色體外的元件(element)、極微染色體(minichromosome)、粘粒(cosmid)或人造染色體。所述質(zhì)??砂_保自我復(fù)制(self-replication)的任何方法(means)??商鎿Q地,當(dāng)所述載被導(dǎo)入宿主細(xì)胞時它被整合入基因組,并與被整合入所述載體的染色體一起復(fù)制。所述載體系統(tǒng)可為單一的載體或質(zhì)粒或共同含有待導(dǎo)入宿主細(xì)胞的基因組的總DNA的兩種或多種載體或質(zhì)粒,或轉(zhuǎn)座子(transposon)。
標(biāo)記本方面的載體優(yōu)選包含一個或多個可選擇的標(biāo)記,其允許方便地選擇轉(zhuǎn)化的細(xì)胞??蛇x擇的標(biāo)記是基因,其產(chǎn)物可供用于殺蟲劑抗性或病毒抗性、對于重金屬的抗性、對于營養(yǎng)缺陷型(auxotroph)的原養(yǎng)型(prototrophy)等等。
用于絲狀真菌宿主細(xì)胞的可選擇的標(biāo)記的實例可選自下組,其包括,但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰轉(zhuǎn)移酶)、bar(phosphinothricin乙酰轉(zhuǎn)移酶)、hygB(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸鹽還原酶)、pyrG(乳清酸核苷-5′-磷酸脫羧酶)、sC(硫酸鹽腺苷酰轉(zhuǎn)移酶)、trpC(鄰氨基苯甲酸合酶)和glufosinate抗性標(biāo)記,以及來自其它菌種的等價物。優(yōu)選用于曲霉菌細(xì)胞的是構(gòu)巢曲霉或米曲霉的amdS和pyrG標(biāo)記和吸水鏈霉菌(Streptomyceshygroscopicus)的bar標(biāo)記。此外,選擇可通過共-轉(zhuǎn)化完成,例如在WO91/17243中描述的,其中所述的可選擇的標(biāo)記在分離(separate)載體上。
本發(fā)明的載體優(yōu)選包含元件,其允許將所述載體穩(wěn)定地整合入所述宿主細(xì)胞基因組或所述載體在細(xì)胞中獨立于細(xì)胞基因組的自主復(fù)制。
當(dāng)把本發(fā)明的載體導(dǎo)入宿主細(xì)胞時,可將其整合入所述的宿主細(xì)胞基因組。為了整合,所述的載體可依賴于編碼目標(biāo)多肽的DNA序列或所述載體的任何其它元件,其用于將所述載體通過同源或非同源重組穩(wěn)定地整合入所述基因組??商鎿Q地,所述載體可包含附加的DNA序列用于指導(dǎo)通過同源重組整合入宿主細(xì)胞的基因組。所述的附加DNA序列使所述載體能夠在染色體中的精確位置整合入所述宿主細(xì)胞基因組。為了增加在精確位置整合的可能性,所述的整合元件應(yīng)優(yōu)選包含足夠數(shù)目的DNA,如100至1,500個堿基對,優(yōu)選400至1,500個堿基對,并最優(yōu)選800至1,500個堿基對,其與對應(yīng)的目標(biāo)序列高度同源以增加同源重組的可能性。整合元件可為任何序列,其與所述宿主細(xì)胞的基因組中的目標(biāo)序列同源。此外,整合元件可為非-編碼或編碼的DNA序列。另一方面,所述載體可通過非-同源重組整合入所述宿主細(xì)胞的基因組。這些DNA序列可為任何序列,其與所述宿主細(xì)胞的基因組中的目標(biāo)序列同源,而且此外,可為非-編碼或編碼序列。
為了進行自主復(fù)制,所述載體可進一步包括復(fù)制起點,其能使載體自發(fā)地在所述宿主細(xì)胞中復(fù)制。
可應(yīng)用在WO 00/24883中公開的游離型復(fù)制的AMA1質(zhì)粒載體。
多于一個拷貝的編碼目標(biāo)多肽的DNA序列可插入所述的宿主細(xì)胞以增強所述DNA序列的表達(dá)。所述DNA序列的穩(wěn)定擴增可以通過應(yīng)用本領(lǐng)域公知的方法將至少一個附加拷貝的所述序列整合入所述宿主細(xì)胞基因組并選擇轉(zhuǎn)化體來獲得。
用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的步驟對于本領(lǐng)域的技術(shù)人員是公知的(參見,例如Sambrook et al,1989,Molecular Cloning,ALaboratory Manual,2nd edition,Cold Spring Harbor,New York)。
宿主細(xì)胞包含DNA構(gòu)建體或表達(dá)載體的本發(fā)明的宿主細(xì)胞,在重組產(chǎn)生所述的雜交酶或遺傳修飾的野生型酶時方便地用作宿主細(xì)胞,所述的DNA構(gòu)建體或表達(dá)載體包含編碼所述雜交酶或遺傳修飾的野生型酶的DNA序列。所述的細(xì)胞可用表達(dá)載體轉(zhuǎn)化??商鎿Q地,所述細(xì)胞可用本發(fā)明的編碼所述雜交酶或遺傳修飾的野生型酶的DNA構(gòu)建體,方便地通過將所述的DNA構(gòu)建體(以一個或多個拷貝)整合入宿主染色體進行轉(zhuǎn)化,將所述的DNA構(gòu)建體整合入宿主染色體可以根據(jù)常規(guī)方法,例如通過同源或異源重組進行。
所述宿主細(xì)胞可為任何合適的原核或真核細(xì)胞,例如細(xì)菌細(xì)胞、絲狀真菌細(xì)胞、植物細(xì)胞或哺乳動物細(xì)胞。
在優(yōu)選的實施方案中,所述宿主細(xì)胞是由下組Ascomycota代表的絲狀真菌,包括,例如脈孢菌屬、正青霉屬(=青霉屬)、翹孢霉屬(Emericella)(=曲霉屬)、散囊菌屬(Eurotium)(=曲霉屬)。
在更優(yōu)選的實施方案中,所述的絲狀真菌包括所有絲狀形式的真菌門(Eumycota)和卵菌門(Oomycota)亞門(如由Hawksworth et al.在Ainsworth andBisby′s Dictionary of The Fungi,8thedition,1995,CAB International,UniversityPress,Cambridge,UK中所定義的。所述的絲狀真菌通過由甲殼質(zhì)(chitin)、纖維素、葡聚糖、脫乙酰殼多糖(chitosan)、甘露聚糖和其它復(fù)合多糖組成的營養(yǎng)菌絲體進行表征。營養(yǎng)生長是通過菌絲延長且碳代謝是專性好氧的。
在還更優(yōu)選的實施方案中,所述絲狀真菌宿主細(xì)胞是,但不限于選自屬于下組菌種的菌株的細(xì)胞,曲霉屬的菌株,優(yōu)選米曲霉、黑曲霉、泡盛曲霉、Aspergillus kawachii或芽孢桿菌屬(Bacillus)的菌株,或鐮孢屬(Fusarium)的菌株,如尖鐮孢(Fusarium oxysporum)、禾本科鐮孢(Fusarium graminearum)(在完全階段(perfect state)稱為玉蜀黍赤霉(Gribberella zeae),先前稱為Sphaeria zeae,與Gibberella roseum和Gibberella roseum f.sp.cerealis是同義詞),或Fusarium sulphureum(在完全階段稱為Gibberella puricaris,與Fusarium trichothecioides、桿孢狀鐮孢(Fusarium bactridioides)、Fusariumsambucium、粉紅鐮孢(Fusarium roseum)和粉紅鐮孢graminearum變種是同義詞)、Fusarium cerealis(與Fusarium crookwellense是同義詞),或Fusariumvenenatum的菌株,
在最優(yōu)選的實施方案種,所述絲狀真菌宿主細(xì)胞是屬于的曲霉的菌種,優(yōu)選米曲霉或黑曲霉的菌株的細(xì)胞。
所述宿主細(xì)胞可為野生型絲狀真菌宿主細(xì)胞或變體、突變體或遺傳修飾的絲狀真菌宿主細(xì)胞。在本發(fā)明的優(yōu)選實施方案中,所述宿主細(xì)胞是蛋白酶缺乏或無蛋白酶的菌株。也特別預(yù)期曲霉菌菌株,如黑曲霉菌株,遺傳修飾以破壞或減少葡糖淀粉酶、酸-穩(wěn)定性alpha-淀粉酶、alpha-1,6轉(zhuǎn)葡糖苷酶和蛋白酶活性的表達(dá)。
絲狀真菌宿主細(xì)胞的轉(zhuǎn)化絲狀真菌宿主細(xì)胞可通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化的細(xì)胞壁再生的方法以本技術(shù)領(lǐng)域公知的方式進行轉(zhuǎn)化。用于曲霉屬宿主細(xì)胞轉(zhuǎn)化的合適的方法在EP 238 023、EP 184 438和Yelton et al.1984,Proceedings of theNational Academy of Sciences USA 811470-1474中描述。轉(zhuǎn)化鐮孢菌種的合適的方法由Malardier et al.1989,Gene 78147-156或US 6,060,305描述。
分離并克隆編碼親代alpha-淀粉酶的DNA序列用于分離或克隆編碼目標(biāo)多肽的DNA序列的方法是本領(lǐng)域所公知的,并包括從基因組DNA分離、從cDNA制備或其組合。從上述基因組DNA克隆本發(fā)明的DNA序列可以例如通過應(yīng)用公知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫的抗體篩選以檢測具有共享的結(jié)構(gòu)特點的克隆的DNA片段來實現(xiàn)。參見,例如Innis et al.,1990,PCRA Guide to Methods and Application,AcademicPress,New York。可以應(yīng)用其它DNA擴增方法,諸如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接的活化轉(zhuǎn)錄(ligated activated transcription)(LAT)和基于DNA序列的擴增(NASBA)。
編碼親代alpha-淀粉酶的DNA序列可以應(yīng)用本領(lǐng)域公知的各種方法,從產(chǎn)生所述alpha-淀粉酶的任意細(xì)胞或微生物中分離。首先,基因組DNA和/或cDNA文庫應(yīng)采用來自產(chǎn)生待研究的alpha-淀粉酶的生物體的染色體DNA或信使RNA構(gòu)建。然后,如果已知所述alpha-淀粉酶的氨基酸序列,可合成標(biāo)記的寡核苷酸探針并用于從由所述生物體制備的基因組文庫中鑒定編碼alpha-淀粉酶的克隆??商鎿Q地,含有與另一種已知的alpha-淀粉酶基因同源的序列的標(biāo)記的寡核苷酸探針可以用作探針以鑒定編碼alpha-淀粉酶的克隆,應(yīng)用雜交和非常低到非常高的嚴(yán)緊性的洗滌條件。
鑒定編碼alpha-淀粉酶的克隆的另一種方法可涉及將基因組DNA的片段插入表達(dá)載體,如質(zhì)粒,用所得到的基因組DNA文庫轉(zhuǎn)化alpha-淀粉酶-陰性細(xì)菌,然后將轉(zhuǎn)化的細(xì)菌涂在含有alpha-淀粉酶的底物(即麥芽糖)的瓊脂上,從而允許鑒定表達(dá)所述alpha-淀粉酶的克隆。
可替換地,可通過已建立的標(biāo)準(zhǔn)方法,例如由S.L.Beaucage和M.H.Caruthers,(1981),Tetrahedron Letters 22,p.1859-1869描述的亞磷酰胺(phosphoroamidite)方法或由Matthes et al.(1984),EMBO J.3,p.801-805描述的方法合成地制備編碼所述酶的DNA序列。在亞磷酰胺(phosphoroamidite)方法中,例如在自動DNA合成儀中合成寡核苷酸,經(jīng)純化、退火、連接并在適當(dāng)?shù)妮d體中克隆。
最后,所述DNA序列可為混合的基因組和合成來源、混合的合成和cDNA來源或混合的基因組和cDNA來源,按照標(biāo)準(zhǔn)方法通過連接合成的、基因組的或cDNA來源的片段(適當(dāng)?shù)?,對?yīng)于全部DNA序列的不同部分的片段)來制備。所述的DNA序列也可以通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)應(yīng)用特異的引物來制備,例如在US 4,683,202或R.K.Saiki et al.(1988),Science 239,1988,pp.487-491中所描述的。
分離的DNA序列本發(fā)明尤其涉及分離的DNA序列,其包含編碼雜交酶或遺傳修飾的野生型酶的DNA序列,所述的雜交酶或遺傳修飾的野生型酶包括具有alpha-淀粉酶活性的催化模塊的氨基酸序列和糖-結(jié)合模塊的氨基酸序列,其中所述的催化模塊是真菌來源的。
本文應(yīng)用的術(shù)語“分離的DNA序列”是指DNA序列,其基本上無其它DNA序列,例如至少大約20%純度,優(yōu)選至少大約40%純度,更優(yōu)選至少大約60%純度,還更優(yōu)選至少大約80%純度和最優(yōu)選至少大約90%純度,如通過瓊脂糖電泳所測定的。
例如,分離的DNA序列可以通過用于基因工程的標(biāo)準(zhǔn)克隆步驟獲得,以將所述的DNA序列從其天然的位置重新定位于它將被復(fù)制的不同的位點。所述的克隆步驟可涉及剪切和分離包含編碼目標(biāo)多肽的DNA序列的所需DNA片段,將該片段插入載體分子和將所述的重組載體整合入宿主細(xì)胞,在所述的宿主細(xì)胞中多個拷貝或克隆的DNA序列將被復(fù)制。分離的DNA序列可以多種方式操作以供目標(biāo)多肽的表達(dá)。在將所述DNA序列插入載體之前,根據(jù)表達(dá)載體操作所述的DNA序列可以是想要的或必需的。應(yīng)用重組DNA方法修飾DNA序列的技術(shù)是本技術(shù)領(lǐng)域公知的。
DNA構(gòu)建體本發(fā)明尤其涉及DNA構(gòu)建體,其包含編碼雜交酶或遺傳修飾的野生型酶的DNA序列,所述的雜交酶或遺傳修飾的野生型酶包括具有alpha-淀粉酶活性的催化模塊的氨基酸序列和糖-結(jié)合模塊的氨基酸序列,其中所述的催化模塊是真菌來源的?!癉NA構(gòu)建體”在本文定義為單鏈或雙鏈的DNA分子,其分離自天然存在的基因或其已經(jīng)被修飾以包含DNA區(qū)段,其以自然中不存在的方式組合和并列。當(dāng)所述DNA構(gòu)建體包含表達(dá)本發(fā)明的編碼序列所需要的所有控制序列時,術(shù)語DNA構(gòu)建體與術(shù)語表達(dá)盒是同義詞。
定點突變一旦編碼親代alpha-淀粉酶的DNA序列已經(jīng)被分離,且用于突變的適當(dāng)位點得到鑒定,可以應(yīng)用合成的寡核苷酸引入突變。這些寡核苷酸包含側(cè)翼連接想要的突變位點的核苷酸序列。在具體方法中,DNA的單鏈缺口(gap),編碼alpha-淀粉酶的序列,在攜帶所述alpha-淀粉酶基因的載體中創(chuàng)建。然后含有所需突變的合成的核苷酸與所述單鏈DNA的同源部分退火。然后用DNA聚合酶I(Klenow片段)填充剩余的缺口并用T4連接酶連接所述構(gòu)建體。此方法的具體實施例在Morinaga et al.(1984),Biotechnology 2,p.646-639中描述。US 4,760,025公開了通過盒(cassette)的小改變導(dǎo)入編碼多個突變的寡核苷酸。然而,更多種的突變可以在任何一時刻通過Morinaga方法導(dǎo)入,因為可以引入大量不同長度的寡核苷酸。
將突變導(dǎo)入編碼alpha-淀粉酶的DNA序列的其它方法在Nelson和Long,(1989),Analytical Biochemistry 180,p.147-151中描述。該方法涉及3-步產(chǎn)生含有所需突變的PCR片段,所需突變是通過應(yīng)用化學(xué)合成的DNA鏈作為PCR反應(yīng)中的一種引物導(dǎo)入的??梢詮腜CR-產(chǎn)生的片段通過用限制內(nèi)切酶切割分離出攜帶突變的DNA片段并重新插入表達(dá)質(zhì)粒。
定域隨機突變隨機突變可有利地位于所述親代alpha-淀粉酶的部分。當(dāng)所述酶的一些區(qū)域已經(jīng)被鑒定為對于所述酶的指定性質(zhì)尤其重要時,且當(dāng)修飾預(yù)期產(chǎn)生具有改進性質(zhì)的變體時,此方法可例如為有利的。當(dāng)所述親代酶的三級結(jié)構(gòu)已被闡明并與所述酶的功能相關(guān)時,通??设b定上述區(qū)域。
定域的或區(qū)域特異性的隨機突變通過如上所述的應(yīng)用PCR產(chǎn)生的突變方法或本技術(shù)領(lǐng)域公知的任何其它適合的方法方便地實施??商鎿Q地,編碼待修飾的DNA序列的部分的DNA序列可,例如通過插入合適的載體進行分離,而且所述的部分隨后可通過利用上面討論的任何突變方法進行突變。
雜合體或野生型酶的變體含有糖-結(jié)合模塊(“CBM”)和alpha-淀粉酶催化模塊的野生型或雜交酶的淀粉降解過程中的性能可以通過蛋白質(zhì)工程來改善,如通過定點突變,通過定域隨機突變,通過合成地制備親代野生型酶或親代雜交酶的新變體,或通過任何其它合適的蛋白質(zhì)工程技術(shù)。
本發(fā)明預(yù)期的親代alpha-淀粉酶包括具有CBM的野生型真菌alpha-淀粉酶,尤其是從曲霉屬菌株可得到的真菌alpha-淀粉酶,所述的曲霉菌株如Aspergillus kawachii酸性alpha-淀粉酶和其變體或突變體,同源的alpha-淀粉酶和其它野生型或人工的alpha-淀粉酶,其結(jié)構(gòu)上和/或功能上類似于來自SEQ ID NO41中所示的Aspergillus kawachii的酸性alpha-淀粉酶。
當(dāng)來自Aspergillus kawachii的酸性alpha-淀粉酶是包含糖-結(jié)合模塊(“CBM”)的野生型alpha-淀粉酶的實例時,所述Aspergillus kawachii酸性alpha-淀粉酶催化模塊具有有限的特異活性,例如與來自黑曲霉菌的酸性alpha-淀粉酶的催化活性相比。此外,在常規(guī)的發(fā)酵過程中容易將川地曲霉alpha-淀粉酶的CBM從催化模塊切割下來,從而降低所述酶對于工業(yè)應(yīng)用的適合性。因此,所述川地曲霉alpha-淀粉酶作為用于生淀粉水解的工業(yè)酶具有幾個嚴(yán)重的缺點。可以應(yīng)用蛋白質(zhì)工程技術(shù)來得到親代酸性alpha-淀粉酶的更合適的變體,其中所述的催化活性和/或酶穩(wěn)定性已經(jīng)改善。
優(yōu)選的變體是如SEQ ID NO41所示的真菌alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQ ID NO41具有至少60%同源性,至少70%同源性,至少80%同源性或甚至至少90%同源性,其變體在一個或多個下列位置包含變化13、15、18、31、32、33、34、35、36、61、63、64、68、69、73、74、75、76、77、78、79、80、81、82、83、84、89、117、118、119、120、121、122、123、124、125、152、153、154、155、156、157、158、161、162、165、166、167、168、169、170、171、172、173、174、175、204、205、206、207、208、209、210、211、216、229、230、231、232、233、234、235、236、237、238、239、242、245、250、252、253、255、256、257、259、260、275、292、295、296、297、298、299、304、328、339、344、348、378、383、386、387、405、448和480,并更優(yōu)選在一個或多個下列位置31、33、36、74、75、77、84、120、153、154、155、156、157、158、162、166、169、170、199、232、233、235、238、239、245、256、257、331、336、339、340、342、348、378、383、386、387、405、448和480,其中(a)所述的變化獨立地,i)插入占據(jù)所述位置的氨基酸的氨基酸下游,ii)缺失占據(jù)所述位置的氨基酸,或iii)用不同的氨基酸取代占據(jù)所述位置的氨基酸,b)所述的變體相對于所述的親代真菌alpha-淀粉酶,具有提高的酸性alpha-淀粉酶活性和或改善的酶穩(wěn)定性和(c)每個位置對應(yīng)于SEQ ID NO43中所示的TAKA淀粉酶和/或SEQ ID NO41中所示的川地曲霉alpha-淀粉酶的氨基酸序列的位置。
更優(yōu)選的變體是如SEQ ID NO41所示的川地曲霉alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQ ID NO41具有至少60%同源性,至少70%同源性,至少80%同源性,或甚至至少90%同源性并在一個或多個下列位置包括變化13、15、18、31、32、33、34、35、36、61、63、64、68、69、73、74、75、76、77、78、79、80、81、82、83、84、89、117、118、119、120、121、122、123、124、125、152、153、154、155、156、157、158、161、162、165、166、167、168、169、170、171、172、173、174、175、204、205、206、207、208、209、210、211、216、229、230、231、232、233、234、235、236、237、238、239、242、245、250、252、253、255、256、257、259、260、275、292、295、296、297、298、299、304、328、339、344、348、378、383、386、387、405、448和480其中(a)所述的變化獨立地,i)插入占據(jù)所述位置的氨基酸的氨基酸下游,ii)缺失占據(jù)所述位置的氨基酸,或iii)用不同的氨基酸取代占據(jù)所述位置的氨基酸,b)所述的變體相對于所述的親代真菌alpha-淀粉酶,具有提高的酸性alpha-淀粉酶活性和或改善的酶穩(wěn)定性和(c)每個位置對應(yīng)于SEQ ID NO43中所示的TAKA淀粉酶和/或SEQ ID NO41中所示的川地曲霉alpha-淀粉酶的氨基酸序列的位置。還更優(yōu)選如SEQ IDNO41所示的川地曲霉alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQID NO41具有至少60%同源性,至少70%同源性,至少80%同源性,或甚至至少90%同源性,并在一個或多個下列位置包含變化31、33、36、74、75、77、84、120、153、154、155、156、157、158、162、166、169、170、199、232、233、235、238、239、245、256、257、331、336、339、340、342、348、378、383、386、387、405、448和480。
還更優(yōu)選如SEQ ID NO41所示的川地曲霉alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQ ID NO41具有至少60%同源性,至少70%同源性,至少80%同源性,或甚至至少90%同源性,并包含一種或多種下列的氨基酸取代G33A、I36K、S74A、D75Y、E77D、P120A、I153D、D154N、W155Y、D156E、N157D、L158Q、Q162E、E166L、T169N、I170T、E199K、E199L、D232L、N233D、N235D、L238Y、D239T、W256Y、Q257P、E331Q、S336A、D339K、D339N、V340D、和Y342A,而且最優(yōu)選的變體包含一種或多種下列的氨基酸取代S74A、E166L、E199L、D339K、和D156E,如包含多個氨基酸取代S74A/E166L/E199L的變體,其中所述的變體相對于如SEQ IDNO41所示的親代alpha-淀粉酶具有改進的活性和/或酶穩(wěn)定性。
所述變體可為如SEQ ID NO41所示的川地曲霉alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQ ID NO41具有至少60%同源性,至少70%同源性,至少80%同源性,或甚至至少90%同源性,并在一個或多個下列位點包含變化31、74、89、209、245、348、378、383、386、387、405、448、和480,其中(a)所述的變化獨立地,i)插入占據(jù)所述位置的氨基酸的氨基酸下游,ii)缺失占據(jù)所述位置的氨基酸,或iii)用不同的氨基酸取代占據(jù)所述位置的氨基酸,b)所述的變體相對于所述的親代真菌alpha-淀粉酶,具有提高的酸性alpha-淀粉酶活性和或改善的酶穩(wěn)定性。
優(yōu)選地,所述變體是如SEQ ID NO41所示的川地曲霉alpha-淀粉酶的變體或alpha-淀粉酶的變體,其與SEQ ID NO41具有至少60%同源性,至少70%同源性,至少80%同源性,或甚至至少90%同源性,并包含一個或多個下列的取代N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S、和N480R,其中所述的變體相對于如SEQ IDNO41所示的親代真菌alpha-淀粉酶具有增加的酸性alpha-淀粉酶活性和或改進的酶穩(wěn)定性。
最優(yōu)選的是如SEQ ID NO41所示的川地曲霉alpha-淀粉酶的變體,并包含下列取代N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S、和N480R。
所述變體可以應(yīng)用常規(guī)的蛋白質(zhì)工程技術(shù)制備。
所述的酶在植物中的表達(dá)編碼目標(biāo)酶,如雜交酶或野生型酶的變體或本發(fā)明的雜合體的DNA序列可以如下述在轉(zhuǎn)基因植物中轉(zhuǎn)化和表達(dá)。
所述的轉(zhuǎn)基因植物可為轉(zhuǎn)基因的植物可為雙子葉的(dicotyledonous)或單子葉的(monocotyledonous),簡稱雙子葉植物或單子葉植物。單子葉植物的實例是草(grasses),如草地早熟禾(meadow grass)(藍(lán)草(blue grass),早熟禾屬(Poa));飼用牧草(forage grass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperate grass),如Agrostis;和谷類,例如,小麥、燕麥、黑麥、大麥、稻、高粱和玉蜀黍(maize)(玉米)。
雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),蕓苔籽(oil rape seed)和緊密相關(guān)的模型生物體擬南芥(Arabidopsis thaliana)。
植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leave)、根(root)、果實(fruits)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyma)、維管組織(vasculartissues)、分生組織(meristems)。在本上下文中,具體的植物細(xì)胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細(xì)胞質(zhì)(cytoplasm)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無論什么組織來源,都被認(rèn)為是植物部分。同樣地,植物部分,如分離以促進本發(fā)明的應(yīng)用的具體組織和細(xì)胞也被認(rèn)為是植物部分,例如胚胎(embryos)、胚乳(endosperms)、糊粉(aleurone)和種皮(seed coat)。
上述植物、植物部分和植物細(xì)胞的子代也包括在本發(fā)明的范圍之內(nèi)。
表達(dá)目標(biāo)酶的轉(zhuǎn)基因的植物或植物細(xì)胞,可以依照本技術(shù)領(lǐng)域公知的方法構(gòu)建。簡言之,所述植物或植物細(xì)胞通過將一個或多個編碼目標(biāo)酶的表達(dá)構(gòu)建體整合入植物宿主基因組,并在轉(zhuǎn)基因的植物或植物細(xì)胞中增殖得到的改良的植物或植物細(xì)胞進行構(gòu)建。
方便地,所述的表達(dá)構(gòu)建體是DNA構(gòu)建體,其包括編碼目標(biāo)酶的基因,所述基因可操作地與在優(yōu)先選擇的植物或植物部分中表達(dá)所述基因所必需的適當(dāng)?shù)恼{(diào)控序列相連接。此外,所述表達(dá)構(gòu)建體可包含可選擇的標(biāo)記,其用于鑒別已經(jīng)整合入表達(dá)構(gòu)建體的宿主細(xì)胞,和將該構(gòu)建體導(dǎo)入所述植物所需的DNA序列(后者依賴于所采用的DNA導(dǎo)入方法)。
調(diào)控序列,如啟動子和終止子序列及任選的信號序列或轉(zhuǎn)運(transit)序列的選擇,例如,在需要所述酶何時、何地和怎樣表達(dá)的基礎(chǔ)上進行確定,例如,表達(dá)編碼本發(fā)明的酶的基因可為組成型的(constitutive)或誘導(dǎo)型的(inducible),或可為發(fā)育特異性的、階段特異性的或組織特異性的,而基因產(chǎn)物可靶向具體的細(xì)胞區(qū)室、組織或植物部分,如種子或葉。調(diào)控序列為,例如,由Tague et al.,1988,Plant,Phys.,86506,1988所描述的。
對于組成型表達(dá),可以應(yīng)用35S-CaMV啟動子、玉米泛素(maize ubiquitin)1啟動子和稻肌動蛋白(rice actin)1啟動子(Franck et al.,1980,Cell 21285-294;Christensen AH,Sharrock RA和Quail,1992,Maize polyubiquitingenesstructure,thermal perturbation of expression and transcript splicing,andpromoter activity following transfer to protoplasts by electroporation.Plant Mo.Biol.18,675-689;Zhang W,McElroy D.和Wu R 1991,Analysis of rice Actl 5’region activity in transgenic rice plants.Plant Cell 3,1155-1165)。器官特異性的啟動子可為,例如,來自貯藏庫組織(storage sink tissue),如種子、馬鈴薯塊莖和果實的啟動子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24275-303),或來自代謝庫組織(metabolic sink tissues),如分生組織(Ito et al.,1994,Plant Mol.Biol.24863-878),種子特異性的啟動子,諸如來自稻的谷蛋白(glutelin)啟動子、醇溶蛋白(prolamin)啟動子、球蛋白(globulin)啟動子或白蛋白(albumin)啟動子(Wu et al.,1998,Plant and Cell Physiology Vol.39,No.8 pp.885-889(1998)),由Conrad U.et al.,1998,Journal of Plant Physiology Vol.152,No.6pp.708-711(1998)描述的來自豆球蛋白(legumin)B4的蠶豆(Vicia faba)啟動子和來自蠶豆的未知的種子蛋白基因、來自種子油體蛋白(body protein)的啟動子(Chen et al.,Plant和cell physiology vol.39,No.9 pp.935-941(1998),來自歐洲油菜(Brassica napus)的貯藏蛋白napA啟動子,或本技術(shù)領(lǐng)域公知的任何其它種子特異性的啟動子,例如,在WO 91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或馬鈴薯的rbcs啟動子(Kyozuka et al.,1993,Plant Physiology Vol.102,No.3 pp.991-1000(1993)),小球藻病毒腺嘌呤甲基轉(zhuǎn)移酶(chlorella virus adenine methyltransferase)基因啟動子(Mitra,A.和Higgins,DW,Plant Molecular Biology Vol.26,No.1 pp.85-93(1994)),或來自稻的aldP基因啟動子(Kagaya et al.,Molecular and General Genetics Vol.248,No.6 pp.668-674(1995)),或傷口誘導(dǎo)的啟動子,如馬鈴薯pin2啟動子(Xu etal,Plant Molecular Biology Vol.22,No.4pp.573-588(1993))。同樣地,所述啟動子可通過非生物的處理誘導(dǎo),所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源應(yīng)用的激活所述啟動子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脫落酸(abscisic acid)、赤霉酸(gibberellic acid)和/或重金屬。
啟動子增強子元件也可用于在所述植物中實現(xiàn)本發(fā)明的酶的更高表達(dá)。例如,所述啟動子增強子元件可為內(nèi)含子(intron),其被置于啟動子和編碼所述酶的核苷酸序列之間。例如,Xu et al.,在前述引用中,公開了稻肌動蛋白1基因的第一個內(nèi)含子增強表達(dá)的用途。
可選擇的標(biāo)記基因和所述表達(dá)構(gòu)建體的任何其它部分,可選自本技術(shù)領(lǐng)域中可得到的那些。
所述的核酸構(gòu)建體,根據(jù)本技術(shù)領(lǐng)域公知的常規(guī)技術(shù),整合入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌(Agrobacterium)-介導(dǎo)的轉(zhuǎn)化、病毒-介導(dǎo)的轉(zhuǎn)化、顯微注射(micro injection)、粒子轟擊(particle bombardment)、生物射彈轉(zhuǎn)化(biolistic transformation)和電穿孔(Gasser et al.,Science,244,1293;Potrykus,Bio/Techn.8,535,1990;Shimamoto et al,Nature,338,274,1989)。
目前,根癌土壤桿菌(Agrobacterium tumefaciens)-介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)先選擇的方法(可參考Hooykas和Schilperoort,1992,Plant Molecular Biology 1915-38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對于這些植物其它的轉(zhuǎn)化方法通常是優(yōu)選的。目前,產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)先選擇的補充農(nóng)桿菌的方法,是用粒子(涂有轉(zhuǎn)化DNA的微觀的金或鎢粒子)轟擊胚胎愈傷組織(embryonic calli)或發(fā)育中的胚芽(developing embryos)(Christou,1992,Plant Journal 2275-281;Shimamoto,1994,Current Opinion Biotechnology 5158-162;Vasil et al.,1992,Bio/Technology 10667-674)。轉(zhuǎn)化單子葉植物的可替換的方法,是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh S.et al.,Plant Molecular Biology Vol.21,No.3 pp.415-428(1993)中所描述的。
轉(zhuǎn)化之后,篩選具有整合的表達(dá)構(gòu)建體的轉(zhuǎn)化體,并將其根據(jù)本技術(shù)領(lǐng)域中熟知的方法在全植物中再生。轉(zhuǎn)化步驟常常是為了在再生的過程中或在后面的世代中,通過應(yīng)用,例如,以兩個獨立的T-DNA構(gòu)建體共轉(zhuǎn)化或用特異性的重組酶(recombinase)位點特異性地切除選擇基因(selection gene),選擇性去除選擇基因而設(shè)計的。
淀粉加工本發(fā)明第一個方面的雜交酶或本發(fā)明第二個方面的變體可在第八個方面應(yīng)用于液化淀粉的過程,其中凝膠化的或顆粒狀淀粉底物,用所述的雜交酶在水介質(zhì)中處理。優(yōu)選地,所述過程包含水解凝膠化的或顆粒狀淀粉的漿體,尤其是將顆粒狀淀粉在低于所述顆粒狀淀粉的初始凝膠化溫度的溫度水解為可溶的淀粉水解物。
在優(yōu)選的實施方案中,所述淀粉漿體(slurry)除了與本發(fā)明第一個方面的雜交酶或第二個方面的變體接觸外,與選自下組的酶接觸真菌alpha-淀粉酶(EC 3.2.1.1)、beta-淀粉酶(E.C.3.2.1.2),和葡糖淀粉酶(E.C.3.2.1.3)。在一個實施方案中,進一步添加Termamyl-樣alpha-淀粉酶或脫支酶,如異淀粉酶(E.C.3.2.1.68)或支鏈淀粉酶(E.C.3.2.1.41)。在本發(fā)明的上下文中,Termamyl-樣alpha-淀粉酶是WO99/19467在第3頁第18行到第6頁第27行中定義的alpha-淀粉酶。
進行本發(fā)明的第七個方面的過程的淀粉漿體可具有20-55%干固體顆粒狀淀粉,優(yōu)選25-40%干固體顆粒狀淀粉,更優(yōu)選30-35%干固體顆粒狀淀粉。
進行本發(fā)明的第七個方面的過程之后,顆粒狀淀粉至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或優(yōu)選至少99%的干固體被轉(zhuǎn)化為可溶的淀粉水解物。
根據(jù)本發(fā)明,第七個方面的過程在低于初始凝膠化溫度的溫度進行。優(yōu)選進行所述過程的溫度為至少30℃、至少31℃、至少32℃、至少33℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少43℃、至少44℃、至少45℃、至少46℃、至少47℃、至少48℃、至少49℃、至少50℃、至少51℃、至少52℃、至少53℃、至少54℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、或優(yōu)選至少60℃。
進行本發(fā)明的第七個方面的過程的pH可為3.0至7.0的范圍,優(yōu)選3.5-6.0,或更優(yōu)選4.0-5.0。
本發(fā)明的過程中待加工的顆粒狀淀粉可具體地從塊莖、根、莖、豆類、谷類或整粒谷物中得到。更具體地,所述的顆粒狀淀粉可以從玉米、穗軸(cob)、小麥、大麥、黑麥、蜀黍、西米(sago)、木薯(cassava)、木薯淀粉(tapioca)、高粱、稻、豌豆、大豆、香蕉或馬鈴薯中得到。具體預(yù)期蠟質(zhì)(waxy)和非蠟質(zhì)(non-waxy)類型的玉米和大麥。待處理的顆粒狀淀粉可具有高度精制的淀粉質(zhì)量,優(yōu)選至少90%、至少95%、至少97%或至少99.5%純度或其可為含有原料的較粗的淀粉,所述的原料包括磨碎的整粒谷物,其包括非-淀粉部分,如胚芽殘余物(germ residue)和纖維。將所述的原料,如整粒谷物磨碎以打開其結(jié)構(gòu)并允許進一步的加工。根據(jù)本發(fā)明優(yōu)選兩種磨碎方法濕磨(wet milling)和干磨(dry milling)。進行干磨時,研磨并應(yīng)用所述的整個谷粒。濕磨使胚芽和粗磨粉(meal)(淀粉顆粒和蛋白)良好的分離,并在所述的淀粉水解產(chǎn)物用于制備糖漿的應(yīng)用中具有少數(shù)例外。干磨和濕磨在淀粉加工的技術(shù)領(lǐng)域中都是熟知的,并同樣預(yù)期用于本發(fā)明的方法。也可以應(yīng)用粗玉米粉并優(yōu)選磨碎的粗玉米粉。
在本發(fā)明的第七個方面的方法的實施方案中,所述的雜交酶用于產(chǎn)生燃料或飲料乙醇的過程,其包括將處理過的淀粉與酵母接觸。優(yōu)選所述的過程包括用酵母發(fā)酵,所述的發(fā)酵可同時或分別地/順序地在所述顆粒狀淀粉漿體水解之后進行。當(dāng)所述的發(fā)酵與所述的水解同時進行時,溫度優(yōu)選30℃-35℃,并更優(yōu)選31℃-34℃。
在另一個實施方案中,所述的顆粒狀淀粉漿體與多肽接觸,所述多肽包括CBM,但無催化模塊,即應(yīng)用松散的CBM。所述松散的CBM可為淀粉結(jié)合模塊、纖維素-結(jié)合模塊、甲殼質(zhì)-結(jié)合模塊、木聚糖-結(jié)合模塊、甘露聚糖-結(jié)合模塊和其它結(jié)合模塊。本上下文中優(yōu)選的CBM是微生物CBM,具體為細(xì)菌或真菌CBM。具體優(yōu)選的是丹麥專利申請PA 2003 01568中作為多肽序列SEQ ID NO1、SEQ ID NO2和SEQ ID NO3公開的淀粉結(jié)合模塊,或在本公開中如SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23所示的淀粉結(jié)合模塊。最優(yōu)選的CBM包括在本公開中如SEQ ID NO24和如SEQ ID NO25公開的CBM。本發(fā)明也優(yōu)選應(yīng)用任何與上述提及的CBM氨基酸序列的任一個具有至少50%、60%、70%、80%或甚至至少90%同源性的任何CBM。所述松散的CBM可以有效量應(yīng)用于所述的顆粒狀淀粉漿體。
所述的葡萄糖也可被發(fā)酵變?yōu)槠渌l(fā)酵產(chǎn)物,諸如檸檬酸、衣康酸、乳酸、葡糖酸;酮類;氨基酸,如谷氨酸(單谷氨酸鈉)(sodium monoglutaminate),和更復(fù)雜的化合物,如抗生素,如青霉素、四環(huán)素;酶;維生素,如核黃素、B12、beta-胡蘿卜素或激素,其難于合成地產(chǎn)生。
基于面團的產(chǎn)品所述的雜交酶可以用于制備基于-面團的可食用的產(chǎn)品,尤其是包含源自米曲霉的淀粉分解模塊,如SEQ ID NO30所示的氨基酸序列的雜交酶。用于制備基于-面團的可食用的產(chǎn)品的雜交酶具體是雜交酶,其包含SEQ ID NO30和/或SEQ ID NO30的氨基酸21-498或其任何變體所示的序列,所述的變體如包含選自下組的一種或多種取代的變體Q81R、K158D、K158V、S161D、S161N、Q163S、Q163A、D164S、Y175W、E176D、D177N、N264K、N264E、M266L、G466D、D468S和N470D。用于制備基于-面團的可食用的產(chǎn)品的雜交酶具體是雜交酶,其包含與本文SEQ ID NO30中列出的序列具有至少50%同源性,優(yōu)選至少60%、70%、80%、85%或至少90%,例如至少95%、97%、98%或至少99%,如100%同源性的氨基酸序列。
所述的面團通常包括面粉(具體為小麥面粉)和水。所述的面團例如通過添加化學(xué)發(fā)酵劑或酵母,通常為釀酒酵母(Saccharomyces cerevisiae)(面包酵母)進行發(fā)酵。
所述基于面團的產(chǎn)品通過發(fā)酵并例如通過烘烤或蒸加熱該面團來制備。實例為蒸的或烤的面包(尤其是白色的、全-粗粉或黑麥面包),通常以球或卷的形式,所述面團可包含一種或多種額外的酶,例如第二種淀粉酶(例如產(chǎn)麥芽糖alpha-淀粉酶),環(huán)糊精葡萄糖轉(zhuǎn)移酶,蛋白酶或肽酶,尤其是外肽酶,轉(zhuǎn)谷氨酰胺酶,脂肪酶,磷脂酶,纖維素酶,半纖維素酶(例如戊聚糖酶(pentopsanase)或木聚糖酶),糖基轉(zhuǎn)移酶,分支酶,或氧化酶,如葡萄糖氧化酶或?qū)τ邴溠刻潜葘τ谄咸烟蔷哂懈呋钚缘难趸浮?br>
所述的雜交酶應(yīng)用的劑量可以低于單獨應(yīng)用具有alpha-淀粉酶活性的催化模塊的劑量(基于重量相比)。
材料和方法購買的材料用于DNA操作的酶(例如限制性內(nèi)切酶、連接酶等)從New EnglandBiolabs,Inc.得到并根據(jù)生產(chǎn)商的說明書應(yīng)用。擴增的質(zhì)粒用Qiagen_PlasmidKit(Qiagen)回收。聚合酶鏈?zhǔn)椒磻?yīng)(PCR)以ExpandTMPCR系統(tǒng)(Roche)進行。QIAquickTMGel Extraction Kit(Qiagen)用于純化PCR片段和從瓊脂糖凝膠上切下的DNA片段。
菌株和質(zhì)粒Aspergillus kawachi菌株IFO4308用作CBM供體和接頭序列。黑曲霉菌株DSM 2761貢獻(xiàn)出所述的淀粉分解序列(WO89/01969)。美國臨時專利申請No.60/459902(10345.000-US)中描述的黑曲霉菌株MBin120用作宿主菌株。專利WO200295014中描述的曲霉表達(dá)質(zhì)粒pMT2188用作載體。所述pyrF缺陷的大腸桿菌菌株DB6507(ATCC 35673)用于增殖pHUda381和pHUda387。
質(zhì)粒pMT2188由基于黑曲霉中性淀粉酶II啟動子的表達(dá)盒和黑曲霉淀粉糖苷酶終止子(Tamg)組成,所述的啟動子融合于構(gòu)巢曲霉磷酸丙糖異構(gòu)酶非翻譯的前導(dǎo)序列(Pna2/tpi)。所述質(zhì)粒中也存在來自構(gòu)巢曲霉的曲霉屬選擇標(biāo)記amdS,其能夠在作為唯一氮源的乙酰胺中生長,來自釀酒酵母的URA3標(biāo)記,其能使pyrF缺陷的大腸桿菌菌株DB6507(ATCC 35673)生長,所述的DB6507增殖pHUda381和pHUda387。應(yīng)用釀酒酵母URA3基因作為選擇標(biāo)記轉(zhuǎn)化入大腸桿菌DB6507以如下方式完成大腸桿菌DB6507通過Mandel和Higa的方法(Mandel,M.和A.Higa(1970)J.Mol.Biol.45,154)制成感受態(tài)。在添加1g/l酪蛋白氨基酸、500μg/l硫胺素和10mg/l卡那霉素的固體M9培養(yǎng)基上篩選轉(zhuǎn)化體(Sambrook et.al(1989)Molecular cloning,a laboratory manual,2.edition,Cold Spring HarborLaboratory Press)。
培養(yǎng)基和底物Cove由342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺和30g/Lnoble瓊脂組成。Cove-2由30g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺和30g/L noble瓊脂組成。COVE鹽溶液由26g/L KCl、26g/L MgSO4·7H2O、76g/L KH2PO4和50ml/L Cove痕量金屬。COVE痕量金屬由0.04g/LNa2B4O7·10H2O、0.4g/L CuSO4·5H2O、1.2g/L FeSO4·7H2O、1.0g/L MnSO4·H2O、0.8g/L Na2MoO2·2H2O和10g/L ZnSO4·7H2O組成。YPG由4g/L酵母提取物、1g/L K2HPO4、0.5g/L MgSO4·7H2O和15g/L葡萄糖、pH6.0組成。STC由0.8M山梨醇、25mM Tris pH8和25mM CaCl2組成。STPC由STC緩沖液中的40% PEG4000組成。Cove top瓊脂糖由342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺和10g/L低熔點瓊脂糖組成。MLC由40g/L葡萄糖、50g/L大豆粉末、4g/L檸檬酸、pH5.0組成。GO-50由葡萄糖50g/L、KH2PO42g/L、MgSO4-7aq 2g/L、K2SO43g、檸檬酸3g/L、草酸50g/L、AMG痕量金屬溶液0.5m/L和尿素3g/L、pH5.0組成。AMG痕量金屬溶液由6.8g/LZnCl2·7H2O、2.5g/L CuSO4·5H2O、0.24g/L NiCl2·6H2O、13.9g/L FeSO4·7H2O、13.5g/L MnSO4·H2O和3g/L檸檬酸組成。
酸性alpha-淀粉酶活性根據(jù)本發(fā)明應(yīng)用時,任何酸穩(wěn)定的alpha-淀粉酶活性可以以AFAU(酸性真菌alpha-淀粉酶單位)測定,其是相對于酶標(biāo)準(zhǔn)物測定的。1AFAU定義為每小時在下述標(biāo)準(zhǔn)條件下降解5.260mg淀粉干物質(zhì)的酶量。
酸穩(wěn)定的alpha-淀粉酶,內(nèi)-alpha-淀粉酶(1,4-alpha-D-glucan-glucano-水解酶,E.C.3.2.1.1)在淀粉分子的內(nèi)部區(qū)域中水解alpha-1,4-糖苷鍵以形成具有不同鏈長的糊精和寡糖。與碘形成的顏色的強度直接與淀粉的濃度成正比。淀粉酶活性在具體的分析條件下,應(yīng)用淀粉濃度的降低的反向比色法進行測定。
λ=590nm藍(lán)/紫 t=23秒 脫色標(biāo)準(zhǔn)條件/反應(yīng)條件(每分鐘)底物 可溶性淀粉,大約0.17g/L緩沖液檸檬酸鹽,大約0.03M
碘(I2)0.03g/LCaCl2 1.85mMpH 2.50±0.05溫育溫度40℃反應(yīng)時間23秒波長590nm酶濃度 0.025AFAU/mL酶工作范圍 0.01-0.04AFAU/mL更詳細(xì)地描述此分析方法的文件夾EB-SM-0259.02/01,可根據(jù)要求從Novozymes A/S,Denmark得到,而且并入作為參考。
葡糖淀粉酶活性葡糖淀粉酶活性可以以淀粉糖苷酶單位(AGU)測定,所述的AGU定義為其每分鐘在標(biāo)準(zhǔn)條件37℃和pH4.3水解1微摩爾麥芽糖的酶量。底物麥芽糖23.2mM,緩沖液乙酸鹽(acetate)0.1M,反應(yīng)時間5分鐘。
可應(yīng)用自動分析儀系統(tǒng)。將變旋酶(mutarotase)加入葡萄糖脫氫酶試劑,以使任何存在的alpha-D-葡萄糖變?yōu)閎eta-D-葡萄糖。葡萄糖脫氫酶在上述的反應(yīng)中,特異性地與beta-D-葡萄糖反應(yīng),形成NADH,其作為初始葡萄糖濃度的量度應(yīng)用光度計在340nm測定。
AMG溫育底物 麥芽糖,23.2mM緩沖液乙酸鹽,0.1MpH4.30±0.05溫育溫度 37℃±1反應(yīng)時間 5分鐘酶工作范圍0.5-4.0AGU/mL顏色反應(yīng)GlucDH430U/L
變旋酶9U/LNAD 0.21mM緩沖液磷酸鹽0.12M;0.15M NaClpH7.60±0.05溫育溫度 37℃±1反應(yīng)時間 5分鐘波長 340nm更詳細(xì)地描述此分析方法的文件夾(EB-SM-0131.02/01)可根據(jù)向Novozymes A/S,Denmark的要求得到,其文件夾在此包括作為參考。
DNA操作除非另外說明,DNA操作和轉(zhuǎn)化應(yīng)用分子生物學(xué)的標(biāo)準(zhǔn)方法實施,如Sambrook et al.(1989)Molecular cloningA laboratory manual,Cold SpringHarbor lab.Cold Spring Harbor,NY;Ausubel,F(xiàn).M.et al.(eds.)″Currentprotocols in Molecular Biology″,John Wiley和Sons,1995;Harwood,C.R.和Cutting,S.M.(eds.)中所描述的。
實施例1從Aspergillus kawachii克隆糖結(jié)合模塊(CBM)為了從川地曲霉中克隆具有接頭的糖結(jié)合模塊(CBM),基于EMBL數(shù)據(jù)庫(EMBL#AB008370)中Aspergillus kawachii酸穩(wěn)定的alpha-淀粉酶的核苷酸序列設(shè)計引物CBM1(SEQ ID NO1)和CBM2(SEQ ID NO2)。CBM1和CBM2分別包含BamHI位點和SalI位點。
CBM15’-gaagggatccgatttttactagtacatccaaagccaccac-3’CBM25’-tttgtcgacctacctccacgtatcaaccaccgtctcc-3’用引物CBM1和CBM2,應(yīng)用來自川地曲霉(IFO4308)的基因組DNA作為模板進行PCR反應(yīng)?;旌戏磻?yīng)成分(1ng/microL的基因組DNA,250mM每種dNTP,引物每種250nM,0.1U/microL的1X緩沖液中的Taq聚合酶(Roche Diagnostics,Japan))并在如下條件下進行PCR。
步驟2至4重復(fù)30次。
擴增包含帶接頭區(qū)域的CBM的0.4kb片段。擴增的DNA通過Sal I和BamH I切斷,并連接入用Xho I和BamH I消化的pMT2188以創(chuàng)建pHUda381,所述的pHUda381具有帶接頭區(qū)域的來自Aspergillus kawachii的CBM、黑曲霉中性淀粉酶啟動子、構(gòu)巢曲霉TPI前導(dǎo)序列、黑曲霉葡糖淀粉酶終止子和構(gòu)巢曲霉amdS基因作為標(biāo)記。將所述的pHUda381測序以確認(rèn)正確的帶接頭序列的CBM的存在。所述帶接頭序列的CBM在SEQ ID NO5中顯示。
實施例2在黑曲霉中表達(dá)所述的雜交酶產(chǎn)生黑曲霉酸穩(wěn)定的alpha-淀粉酶基因的cDNA序列和黑曲霉酸穩(wěn)定的alpha-淀粉酶的cDNA克隆在WO 8901969(實施例1和3)中描述。用黑曲霉酸穩(wěn)定的alpha-淀粉酶的cDNA克隆作為模板的PCR反應(yīng)應(yīng)用引物(SEQ IDNO3)和(SEQ ID NO4)進行,以分別導(dǎo)入BamHI位點和SpeI位點。
(SEQ ID NO3)5’-tttggatccaccatgagattatcgacttcgagtctcttc-3’(SEQ ID NO4)5’-tttactagtagcagcagcagttgtggtcgtggttgttc-3’混合反應(yīng)組分(1ng/microL的模板DNA、250mM每種dNTP、每種引物250nM、0.1U/microL的1×緩沖液中的Taq聚合酶(Roche Diagnostics,Japan))并在如下條件下進行PCR。
步驟2至4重復(fù)30次。
所述1.5kb擴增的DNA片段通過SpeI和BamHI切斷,并連接入用SpeI和BamHI消化的pHUda381以創(chuàng)建表達(dá)質(zhì)粒pHUda387,所述的pHUda387包括與來自川地曲霉CBM融合的黑曲霉酸穩(wěn)定的alpha-淀粉酶cDNA。將所述的pHUda387測序以確認(rèn)在黑曲霉酸穩(wěn)定的alpha-淀粉酶cDNA序列中沒有發(fā)生變化。所述黑曲霉酸穩(wěn)定的alpha-淀粉酶cDNA序列在SEQ ID NO7中顯示。
將所述的pHUda387轉(zhuǎn)化入黑曲霉MBin120。所述宿主菌株在100ml非-選擇的YPG培養(yǎng)基中在32℃、120rpm的旋轉(zhuǎn)搖床上增殖16小時。細(xì)胞通過過濾收集,用0.6M KCl洗滌并重懸于含有終濃度600microL/ml商品化的beta-葡聚糖酶產(chǎn)品(GLUCANEXTM,Novozymes A/S)的20ml 0.6M KCl。將所述的懸液在32℃、80rpm溫育直至形成原生質(zhì)體,然后用STC緩沖液洗滌次。將所述的原生質(zhì)體用血紅蛋白計計數(shù)并在STC∶STPC∶DMSO為8∶2∶0.1的溶液中重懸和調(diào)節(jié)到2.5×107原生質(zhì)體/ml的終濃度。加入大約3微克質(zhì)粒DNA至100microL的原生質(zhì)體懸浮液,輕輕地混合并在冰上保溫20分鐘。加入1ml SPTC,并將所述的原生質(zhì)體懸浮液在37℃溫育30分鐘。加入10ml的50℃ Cove top瓊脂糖之后,將所述的反應(yīng)物倒入Cove瓊脂平板并將該平板在32℃保溫。5天后,從該Cove培養(yǎng)基中選擇轉(zhuǎn)化體。
將選擇的轉(zhuǎn)化體接種到100ml的MLC培養(yǎng)基中,并在30℃培養(yǎng)2天。將10ml的MLC培養(yǎng)基接種到100ml的GO-50培養(yǎng)基,并在30℃培養(yǎng)5天。通過離心得到上清液。
該上清中的酸穩(wěn)定的alpha-淀粉酶活性作為在OD590nm測定的淀粉-碘復(fù)合物的藍(lán)色的減少進行檢測。在樣品緩沖液中溶解的25microL的酶樣品(2mM檸檬酸鹽緩沖液[pH2.5]中的51.4mM氯化鈣)與135microL的底物溶液(100mM檸檬酸鹽緩沖液[pH2.5]中的0.6g/L淀粉[Merck 1253]和12g/L乙酸鈉)混合并在37℃保溫325秒。325秒之后,將90microL的碘溶液(1.2g/L的碘化鉀[Merck 5043]和0.12g/L的碘[Merck 4761])加入反應(yīng)混合物并在37℃保溫25秒。用分光光度計在590nm測定活性。在空白實驗中用25microL的蒸餾水代替酶樣品。
實施例3非-凝膠化淀粉的SSF中雜交酶的性能黑曲霉酸穩(wěn)定的alpha-淀粉酶和具有附加的糖-結(jié)合模塊的黑曲霉酸穩(wěn)定的alpha-淀粉酶的相對性能通過小-規(guī)模SSF(同時糖化發(fā)酵)發(fā)酵進行評價。應(yīng)用的劑量分別為0.3、0.5和1.0AFAU/g DS alpha-淀粉酶,其以0.5AGU/g DS劑量的純化的黑曲霉葡糖淀粉酶補充。簡單地,將大約1.9g的磨碎的玉米(黃#2馬齒型玉米(dent corn)在中試規(guī)模錘磨機中磨碎并通過2mm篩,11.2%含濕量(moisture content))加入16ml聚苯乙烯管(Falcon 352025)中。以合適的量加入含有3mg/ml青霉素的0.02N H2SO4溶液以使所述的干固體水平(DS)達(dá)34%及所述的pH達(dá)5.0。處理重復(fù)六次。
加入所述的酶之后,將所述的管用4.74×108酵母細(xì)胞/ml接種。給管加上螺旋蓋,在所述的蓋子上已經(jīng)用非常小的針刺破以允許氣體釋放,在稱重及在32℃保溫之前短暫渦旋。然后隨時間將所述的管稱重跟蹤發(fā)酵進展。稱重前將管短暫渦旋。CO2損失的量和乙醇的重量之間應(yīng)用的關(guān)系為CO2損失(g)×1.045=EtOH(g)。所述的結(jié)果顯示在表2中。
表2.50小時后以g乙醇/g DS表示的平均乙醇產(chǎn)量
95%置信區(qū)間+/-0.008在相等活性基礎(chǔ)上,具有附加的糖-結(jié)合模塊的黑曲霉酸穩(wěn)定的alpha-淀粉酶(雜合體)在所有測試的劑量都明顯地優(yōu)于黑曲霉酸穩(wěn)定的alpha-淀粉酶(天然酶)。所述的雜交酶比天然酶大約有效三倍(即黑曲霉酸穩(wěn)定的alpha-淀粉酶的性能的三倍弱(less)能夠相當(dāng)于具有附加的糖-結(jié)合模塊的黑曲霉酸穩(wěn)定的alpha-淀粉酶。
實施例4具有不同CBM、接頭序列和催化模塊組合的雜交酶性能構(gòu)建雜交酶變體,其包含所述的黑曲霉酸穩(wěn)定的alpha-淀粉酶(AA)和來自川地曲霉alpha-淀粉酶、黑曲霉AMG、T.emersonii AMG、Athelia rolfsiiAMG、或芽孢桿菌產(chǎn)麥芽糖alpha-淀粉酶(Novamyl)的CBM。在所有的變體中應(yīng)用來自川地曲霉alpha-淀粉酶(SEQ ID NO27)的接頭序列。
所述變體的性能應(yīng)用玉米淀粉(SIGMA S-9679)作為底物,黑曲霉葡糖淀粉酶G2 0.5AGU/g DS,變體1.0AFAU/g DS進行評價,并用葡萄糖B-test試劑盒(Wako Pure Chemicals 271-3141)定量釋放的葡萄糖。這些結(jié)果顯示在表3中。
構(gòu)建雜交酶變體,其包含所述的黑曲霉酸穩(wěn)定的alpha-淀粉酶和來自川地曲霉alpha-淀粉酶、黑曲霉AMG、或Athelia rolfsii AMG的CBM。還構(gòu)建具有不同接頭序列的變體。應(yīng)用的接頭序列為黑曲霉AMG接頭(SEQ IDNO26)、川地曲霉alpha-淀粉酶接頭(SEQ ID NO27)、Athelia rolfsii AMG接頭(SEQ ID NO28)和PEPT接頭(SEQ ID NO29)。也構(gòu)建了具有兩個CBD串接的變體(JA012)。
所述變體的性能如上述進行評價,只不過應(yīng)用黑曲霉葡糖淀粉酶G1而且所述變體劑量為0.3AFAU/g DS。這些結(jié)果顯示在表4中。
構(gòu)建雜交酶變體,其包含所述的接頭和來自具有不同催化模塊的川地曲霉alpha-淀粉酶的CBM。所應(yīng)用的催化模塊來自黑曲霉酸穩(wěn)定的alpha-淀粉酶,川地曲霉alpha-淀粉酶或米曲霉alpha-淀粉酶(FungamylTM)。所述變體的性能如上述進行評價,應(yīng)用黑曲霉葡糖淀粉酶G1而且所述變體劑量為0.3AFAU/g DS。這些結(jié)果顯示在表5中。
構(gòu)建雜交酶變體,其包含所述的接頭和來自具有不同催化模塊的川地曲霉alpha-淀粉酶或A.rolfsii AMG的CBM,所述的催化模塊來自黑曲霉酸穩(wěn)定的alpha-淀粉酶或米曲霉alpha-淀粉酶(FungamylTM)。所述變體的性能如上述進行評價,應(yīng)用黑曲霉葡糖淀粉酶G1而且所述變體劑量為0.3AFAU/g DS。這些結(jié)果顯示在表6中。
實施例5在催化模塊中具有一個或多個取代的JA017的變體。
應(yīng)用常規(guī)的蛋白質(zhì)工程方法構(gòu)建雜交酶的變體JA017(氨基酸序列顯示于SEQ ID NO40),其包含A.rolfsii AMG CBM、A.rolfsii接頭序列和在所述的催化模塊中具有一個或多個取代的米曲霉alpha淀粉酶催化模塊。表7列出了該變體中的取代。
表7.在催化模塊中具有一個或多個取代的JA017(SEQ ID NO40)的變體
所述變體在米曲霉中表達(dá)并通過葡萄糖釋放試驗鑒定pH穩(wěn)定性、熱穩(wěn)定性和對于生淀粉(raw starch)的性能。
JA085在pH4.5顯示比JA017熱穩(wěn)定性至少高5℃,而且甚至在pH3.0是穩(wěn)定的。
所述的新變體JA085和JA074在葡萄糖釋放試驗中顯示高比活性。JA085甚至在pH3.8持續(xù)釋放葡萄糖,而在此pH JA017迅速失活。JA074在pH4.0具有最高的葡萄糖產(chǎn)量,但在pH3.8失活。
表8-10列出以在pH4.5、55℃和60℃保溫30分鐘后的殘余活性表示的溫度穩(wěn)定性、比活性、pH穩(wěn)定性和多種變體葡萄糖釋放試驗中的活性。
表8.選擇的PE變體的溫度穩(wěn)定性和特異的活性。
表9a.溫度穩(wěn)定性表9b.pH穩(wěn)定性(32℃、1(pH4.5、1小時溫育) 小時溫育)
表10a.用純化的黑曲霉AMG G2在pH4.0進行葡萄糖釋放試驗中的性能。葡萄糖mg/ml。
表10b.用純化的黑曲霉AMG G2在pH3.8進行葡萄糖釋放試驗中的性能。葡萄糖mg/ml。
表11a.用純化的黑曲霉AMG G2表11b.用純化的黑曲霉AMG G2在pH3.9進行葡萄糖釋放試驗中 在pH3.6進行葡萄糖釋放試驗中的性能。葡萄糖mg/ml。 的性能。葡萄糖mg/ml。
實施例6Aspergillus kawachii酸性alpha-淀粉酶的變體適于水解生淀粉的Aspergillus kawachii酸性alpha-淀粉酶的變體可以通過包含催化模塊的序列的常規(guī)的蛋白質(zhì)工程產(chǎn)生。其中的變化能夠改善比活性和/或穩(wěn)定性的具體位點根據(jù)與下列真菌alpha-淀粉酶中的一種的相似性進行預(yù)測,所述的真菌alpha-淀粉酶具有指示的氨基酸序列和RCSB Protein DataBank(www.rcsb.org)中根據(jù)指出的標(biāo)識符(identifier)得到的三維結(jié)構(gòu)黑曲霉酸性alpha-淀粉酶(2aaa,本文中SEQ ID NO42)和來自米曲霉的alpha-淀粉酶(Taka淀粉酶)(6taa或7taa,本文中SEQ ID NO43)。通過比對每個催化三聯(lián)體的氨基酸殘基疊加兩種3D模型。這通過本領(lǐng)域公知的方法根據(jù)三對C-alpha原子的偏差進行,例如通過最小化三個偏差的平方和或通過比對以保持每個偏差低于0.8_,例如低于0.6_,低于0.4_,低于0.3_或低于0.2_。
可替換地,所述的疊加(superimposition)可以通過用常規(guī)方法比對所述的兩個氨基酸序列和最小化所有相應(yīng)的氨基酸殘基對的偏差的平方和來進行。所述的序列比對可通過常規(guī)方法,例如通過應(yīng)用來自UWGCG版本8的GAP軟件進行。
在顯示如下的來自川地曲霉、黑曲霉(aaa_new)和米曲霉(7taa)的三種alpha-淀粉酶的比對中,標(biāo)明了距離7taa.pdb結(jié)構(gòu)中的阿卡波糖(acarbose)底物10_之內(nèi)的殘基。這些殘基是變化的標(biāo)靶以賦予改進的比活性。
kawachi MRVSTSSIAL AVSLFGKLAL GLSAAEWRTQ SIYFLLTDRF GRTDNSTTAT 50aaa_new MRLSTSSLFL SVSLLGKLAL GLSAAEWRTQ SIYFLLTDRF GRTDNSTTAT7taa .......... .......... .ATPADWRSQ SIYFLLTDRF ARTDGSTTAT 29* * *kawachi CNTGDQIYCG GSWQGIINHL DYIQGMGFTA IWISPITEQL PQDTSDGEAY 100aaa_new CDTGDQIYCG GSWQGIINHL DYIQGMGFTA IWISPITEQL PQDTADGEAY7taa CNTADQKYCG GTWQGIIDKL DYIQGMGFTA IWITPVTAQL PQTTAYGDAY 79***** * ***********kawachi HGYWQQKIYY VNSNFGTADD LKSLSDALHA RGMYLMVDVV PNHMGYAGNG 150aaa_new HGYWQQKIYD VNSNFGTADD LKSLSDALHA RGMYLMVDVV PNHMGYAGNG7taa HGYWQQDIYS LNENYGTADD LKALSSALHE RGMYLMVDVV ANHMGYDGAG 129***** *** ******kawachi NDVDYSVFDP FDSSSYFHPY CLITDWDNLT MVQDCWEGDT IVSLPDLNTT 200aaa_new NDVDYSVFDP FDSSSYFHPY CLITDWDNLT MVQDCWEGDT IVSLPDLNTT7taa SSVDYSVFKP FSSQDYFHPF CFIQNYEDQT QVEDCWLGDN TVSLPDLDTT 179******* ** ***** ******kawachi ETAVRTIWYD WVADLVSNYS VDGLRIDSVE EVEPDFFPGY QEAAGVYCVG 250aaa_new ETAVRTIWYD WVADLVSNYS VDGLRIDSVL EVEPDFFPGY QEAAGVYCVG7taa KDVVKNEWYD WVGSLVSNYS IDGLRIDTVK HVQKDFWPGY NKAAGVYCIG 229****** *** *kawachi EVDNGNPALD CPYQKYLDGV LNYPIYWQLL YAFESSSGSI SNLYNMIKSV 300aaa_new EVDNGNPALD CPYQKVLDGV LNYPIYWQLL YAFESSSGSI SNLYNMIKSV7taa EVLDGDPAYT CPYQNVMDGV LNYPIYYPLL NAFKSTSGSM DDLYNMINTV 279********** ** ** *** * * *kawachi ASDCSDPTLL GNFIENHDNP RFASYTSDYS QAKNVLSYIF LSDGIPIVYA 350
aaa_new ASDCSDPTLL GNFIENHDNP RFASYTSDYS QAKNVLSYIF LSDGIPIVYA7taa KSDCPDSTLL GTFVENHDNP RFASYTNDIA LAKNVAAFII LNDGIPIIYA 329* ****** *kawachi GEEQHYSGGD VPYNREATWL SGYDTSAELY TWIATTNAIR KLAISADSDY 400aaa_new GEEQHYSGGK VPYNREATWL SGYDTSAELY TWIATTNAIR KLAISADSAY7taa GQEQHYAGGN DPANREATWL SGYPTDSELY KLIASANAIR NYAISKDTGF 379* *****kawachi ITYKNDPIYT DSNTIAMRKG TSGSQIITVL SNKGSSGSSY TLTLSGSGYT 450aaa_new ITYANDAFYT DSNTIAMRKG TSGSQVITVL SNKGSSGSSY TLTLSGSGyT7taa VTYKNWPIYK DDTTIAMRKG TDGSQIVTIL SNKGASGDSY TLSLSGAGYT 429kawachi SGTKLIEAYT CTSVTVDSNG DIPVPMASGL PRVLLPASVV DSSSLCGGSG 500aaa_new SGTKLIEAYT CTSVTVDSSG DIPVPMASGL PRVLLPASVV DSSSLCGGSG7taa AGQQLTEVIG CTTVTVGSDG NVPVPMAGGL PRVLYPTEKL AGSKICS... 474kawachi NTTTTTTAAT STSKATTSSS SSSAAATTSS SCTATSTTLP ITFEELVTTT 550aaa_new RLYVE..... .......... .......... .......... .......... 5057taa .......... .......... .......... .......... ..........
kawachi YGEEVYLSGS ISQLGEWHTS DAVKLSADDY TSSNPEWSVT VSLPVGTTFE 600aaa_new .......... .......... .......... .......... ..........
7taa .......... .......... .......... .......... ..........
601640kawachi YKFIKVDEGG SVTWESDPNR EYTVPECGSG SGETVVDTWR640aaa_new .......... .......... .......... ..........
7taa .......... .......... .......... ..........
增加比活性的具體變化是在“底物的10_距離”之內(nèi)的下列位置中一個取代或取代的組合13、15、18、32-36(即32、33、34、35、36)、61、63-64、68-69、73-84(例如73、74、75、76、77、78、79、80、81、82、83、84)、117-125(例如117、118、119、120、121、122、123、124、125)、152-158(例如152、153、154、155、156、157、158)、161-162、165-175(例如165、166、167、168、169、170、171、172、173、174、175)、204-211(例如204、205、206、207、208、209、210、211)、216、229-239(229、230、231、232、233、234、235、236、237、238、239)、242、250、252-253、255-257(例如255、256、257)、259-260、275、292、295-299(例如295、296、297、298、299)、304、328、339-344,依據(jù)上述比對中的7taa編號,其中在7taa中所述的N-末端是ATPAD(TAKA淀粉酶)。最引起關(guān)注的位置為33、36、74、75、77、120、153、154、155、156、157、158、162、166、169、170、199、232、233、235、238、239、256、257、331、336、339、340和342。所述的取代可以對于任何氨基酸殘基進行。
可以產(chǎn)生包含下列取代中的一個或其組合的變體G33A、I36K、S74A、D75Y、E77D、P120A、I153D、D154N、W155Y、D156E、N157D、L158Q、Q162E、E166L、T169N、I170T、E199K、E199L、D232L、N233D、N235D、L238Y、D239T、W256Y、Q257P、E331Q、S336A、D339K、D339N、V340D和Y342A。最引起關(guān)注的變體包括一個或多個下列取代;S74A、E166L、E199L、D339K和D156E。還更引起關(guān)注的是具有多重取代S74A/E166L/E199L的變體。
基于Aspergillus kawachii和黑曲霉酸性alpha-淀粉酶之間的相似性,預(yù)測下列取代以改進比活性;N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S和N480R,并能夠產(chǎn)生包含這些取代的命名為WA01的變體。
實施例7Aspergillus kawachii酸性alpha-淀粉酶的變體的性能實施例4中描述的雜合體JA007和JA001的序列分別等同于所述的川地曲霉酸性alpha-淀粉酶的序列(SEQ ID NO41)和在先前的實施例中描述的變體WA01的序列。由于已經(jīng)在幾種試驗中比較了兩個雜合體JA001和JA007,通過對于所述變體WA01的取代賦予的比活性的改進可以非常準(zhǔn)確地進行預(yù)測。變體WA01的比活性比所述川地曲霉野生型淀粉酶的比活性高1.7至1.8倍?;谒鰯?shù)據(jù)的預(yù)測在表12中顯示。
表12.雜合體JA007(和川地曲霉酸性alpha-淀粉酶一致)和雜合體JA001(和WA01一致,其為川地曲霉酸性alpha-淀粉酶的變體,其包含取代N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S和N480R)的性能
實施例8用具有或不具有CBD的酸性真菌alpha-淀粉酶水解生淀粉本實施例說明應(yīng)用不具有CBM的酸性真菌淀粉酶(SEQ ID NO8)或相應(yīng)的具有CBM的雜合體(JA001)將顆粒狀小麥淀粉或粗玉米粉轉(zhuǎn)化為葡萄糖。具有33%干固體(DS)顆粒狀淀粉的漿體通過在攪拌條件下將247.5g小麥淀粉或粗玉米粉加入502.5ml水來制備。將pH用HCl調(diào)節(jié)到4.5。將所述顆粒狀淀粉漿體分配入100ml藍(lán)色蓋子搖瓶,每個搖瓶75g。將所述的搖瓶在60℃水浴中以磁力攪拌進行溫育。在零小時,將所述的酶活性加入所述搖瓶中;葡糖淀粉酶(200AGU/kg DS)、酸性真菌淀粉酶(50AFAU/kg DS)和所述野生型黑曲霉酸性alpha-淀粉酶(SEQ ID NO8)或所述黑曲霉酸性alpha-淀粉酶,但其融合于來自川地曲霉的接頭和CBM(SEQ ID NO8融合于SEQ ID NO6)。具有/不具有(w/wo)CBM的黑曲霉酸性alpha-淀粉酶以100KNU/kg DS加入。在24、48、72和96小時后取樣。
應(yīng)用下列方法測定總的干固體淀粉。所述的淀粉通過加入過量的alpha-淀粉酶(300KNU/Kg干固體)并將所述樣品在95℃油浴放置45分鐘來進行完全地水解。隨后,將所述樣品冷卻到60℃并加入過量的葡糖淀粉酶(600AGU/kg DS),然后在60℃溫育2小時。
所述淀粉水解物中的可溶干固體通過檢測通過0.22microM過濾器過濾后的樣品的折射率來確定。糖分布通過HPLC來測定。葡萄糖的量作為DX計算。
所述結(jié)果顯示于表13-14(小麥淀粉)和15-16(粗玉米粉)中。
表13.可溶的干固體,作為來自小麥淀粉的總的干物質(zhì)的百分比。酶∶葡糖淀粉酶、酸性真菌alpha-淀粉酶和更多具有CBM或不具有CBM的酸性真菌alpha-淀粉酶。
表14.來自小麥淀粉的可溶性淀粉水解物的DX∶酶∶葡糖淀粉酶、酸性真菌淀粉酶和更多具有CBM或不具有CBM的酸性真菌alpha-淀粉酶。
表15.可溶的干固體,作為來自粗玉米粉的總的干物質(zhì)的百分比。酶∶葡糖淀粉酶、酸性真菌alpha-淀粉酶和更多具有CBM或不具有CBM的酸性真菌alpha-淀粉酶。
表16.來自粗玉米粉的可溶性淀粉水解物的DX∶酶∶葡糖淀粉酶、酸性真菌淀粉酶和更多具有CBM或不具有CBM的酸性真菌alpha-淀粉酶。
序列表<110>Udagawa,HiroakiTaira,RikakoTkagi,ShinobuAllain,EricHjort,CarstenVikso-Nielsen,Anders<120>用于淀粉加工的酶<130>10490.500-US<160>43<170>PatentIn version 3.2<210>1<211>40<212>DNA<213>人工的<220>
<223>引物<400>1gaagggatcc gatttttact agtacatcca aagccaccac 40<210>2<211>37<212>DNA<213>人工的<220>
<223>引物<400>2tttgtcgacc tacctccacg tatcaaccac cgtctcc 37<210>3<211>39<212>DNA<213>人工的<220>
<223>引物<400>3tttggatcca ccatgagatt atcgacttcg agtctcttc 39<210>4<211>38<212>DNA<213>人工的<220>
<223>引物
<400>4tttactagta gcagcagcag ttgtggtcgt ggttgttc 38<210>5<211>396<212>DNA<213>川地曲霉(Aspergillus kawachii)<220>
<221>CDS<222>(1)..(396)<400>5act agt aca tcc aaa gcc acc acc tcc tct tct tct tct tct gct gct 48Thr Ser Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala1 5 10 15gct act act tct tca tca tgc acc gca aca agc acc acc crc ccc atc 96Ala Thr Thr Ser Ser Ser Cys Thr Ala Thr Ser Thr Thr Leu Pro Ile20 25 30acc ttc gaa gaa ctc gtc acc act acc tac ggg gaa gaa gtc tac ctc144Thr Phe Glu Glu Leu Val Thr Thr Thr Tyr Gly Glu Glu Val Tyr Leu35 40 45agc gga tct arc tcc cag ctc gga gag tgg gat acg agt gac gcg gtg192Ser Gly Ser Ile Ser Gln Leu Gly Glu Trp Asp Thr Ser Asp Ala Val50 55 60aag ttg tcc gcg gat gat tat acc tcg agt aac ccc gag tgg tct gtt240Lys Leu Ser Ala Asp Asp Tyr Thr Ser Ser Asn Pro Glu Trp Ser Val65 70 75 80act gtg tcg ttg ccg gtg ggg acg acc ttc gag tat aag ttt att aag288Thr Val Ser Leu Pro Val Gly Thr Thr Phe Glu Tyr Lys Phe Ile Lys85 90 95gtc gat gag ggt gga agt gtg act tgg gaa agt gat ccg aat agg gag336Val Asp Glu Gly Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg Glu100 105 110tat act gtg cct gaa tgt ggg aat ggg agt ggg gag acg gtg gtt gat384Tyr Thr Val Pro Glu Cys Gly Asn Gly Ser Gly Glu Thr Val Val Asp115 120 125acg tgg agg tag396Thr Trp Arg130<210>6<211>131<212>PRT<213>川地曲霉(Aspergillus kawachii)<400>6Thr Ser Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala1 5 10 15
Ala Thr Thr Ser Ser Ser Cys Thr Ala Thr Ser Thr Thr Leu Pro Ile20 25 30Thr Phe Glu Glu Leu Val Thr Thr Thr Tyr Gly Glu Glu Val Tyr Leu35 40 45Ser Gly Ser Ile Ser Gln Leu Gly Glu Trp Asp Thr Ser Asp Ala Val50 55 60Lys Leu Ser Ala Asp Asp Tyr Thr Ser Ser Asn Pro Glu Trp Ser Val65 70 75 80Thr Val Ser Leu Pro Val Gly Thr Thr Phe Glu Tyr Lys Phe Ile Lys85 90 95Val Asp Glu Gly Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg Glu100 105 110Tyr Thr Val Pro Glu Cys Gly Asn Gly Ser Gly Glu Thr Val Val Asp115 120 125Thr Trp Arg130<210>7<211>1533<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1533)<400>7atg aga tta tcg act tcg agt ctc ttc ctt tcc gtg tct ctg ctg ggg 48Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15aag ctg gcc ctc ggg ctg tcg gct gca gaa tgg cgc act cag tcg att 96Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30tac ttc cta ttg acg gat cgg ttc ggt agg acg gac aat tcg acg aca144Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45gct aca tgc gat acg ggt gac caa atc tat tgt ggt ggc agt tgg caa192Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60
gga atc atc aac cat ctg gat tat atc cag ggc atg gga ttc acg gcc240Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80atc tgg atc tcg cct atc act gaa cag ctg ccc cag gat act gct gat288Ile Trp Ile Ser Pro IleThr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95ggt gaa gct tac cat gga tat tgg cag cag aag ata tac gac gtg aac336Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110tcc aac ttc ggc act gca gat gac ctc aag tcc ctc tca gat gcg ctt384Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125cat gcc cgc gga atg tac ctc atg gtg gac gtc gtc cct aac cac atg432His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140ggc tac gcc ggc aac ggc aac gat gta gac tac agc gtc ttc gac ccc480Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160ttc gat tcc tcc tcc tac ttc cac cca tac tgc ctg atc aca gat tgg528Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175gac aac ttg acc atg gtc caa gat tgt tgg gag ggt gac acc atc gta576Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190tct ctg cca gac cta aac acc acc gaa act gcc gtg aga aca atc tgg624Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205tat gac tgg gta gcc gac ctg gta tcc aat tat tca gtc gac gga ctc672Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220cgc atc gac agt gtc ctc gaa gtc gaa cca gac ttc ttc ccg ggc tac720Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240cag gaa gca gca ggt gtc tac tgc gtc ggc gaa gtc gac aac ggc aac768Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255cct gcc ctc gac tgc cca tac cag aag gtc ctg gac ggc gtc ctc aac816Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270tat ccg atc tac tgg caa ctc ctc tac gcc ttc gaa tcc tcc agc ggc864Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285agc atc agc aat ctc tac aac atg atc aaa tcc gtc gca agc gac tgc912Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300tcc gat ccg aca cta ctc ggc aac ttc atc gaa aac cac gac aat ccc960
Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320cgt ttc gcc tcc tac acc tcc gac tac tcg caa gcc aaa aac gtc ctc1008Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335agc tac atc ttc ctc tcc gac ggc atc ccc atc gtc tac gcc ggc gaa1056Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350gaa cag cac tac tcc ggc ggc aag gtg ccc tac aac cgc gaa gcg acc1104Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365tgg ctt tca ggc tac gac acc tcc gca gag ctg tac acc tgg ata gcc1152Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380acc acg aac gcg atc cgc aaa cta gcc atc tca gct gac tcg gcc tac1200Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400att acc tac gcg aat gat gca ttc tac act gac agc aac acc atc gca1248Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415atg cgc aaa ggc acc tca ggg agc caa gtc atc acc gtc ctc tcc aac1296Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430aaa ggc tcc tca gga agc agc tac acc ctg acc ctc agc gga agc ggc1344Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445tac aca tcc ggc acg aag ctg atc gaa gcg tac aca tgc aca tcc gtg1392Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460acc gtg gac tcg agc ggc gat att ccc gtg ccg atg gcg tcg gga tta1440Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480ccg aga gtt ctt ctg ccc gcg tcc gtc gtc gat agc tct tcg ctc tgt1488Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495ggc ggg agc gga aga aca acc acg acc aca act gct gct act agt1533Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Thr Ser500 505 510<210>8<211>511<212>PRT<213>黑曲霉(Aspergillus niger)<400>8Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15
Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255
Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495
Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Thr Ser500 505 510<210>9<211>102<212>PRT<213>Bacillus flavothermus<400>9Ile Ser Thr Thr Ser Gln Ile Thr Phe Thr Val Asn Asn Ala Thr Thr1 5 10 15Val Trp Gly Gln Asn Val Tyr Val Val Gly Asn Ile Ser Gln Leu Gly20 25 30Asn Trp Asp Pro Val His Ala Val Gln Met Thr Pro Ser Ser Tyr Pro35 40 45Thr Trp Thr Val Thr Ile Pro Leu Leu Gln Gly Gln Asn Ile Gln Phe50 55 60Lys Phe Ile Lys Lys Asp Ser Ala Gly Asn Val Ile Trp Glu Asp Ile65 70 75 80Ser Asn Arg Thr Tyr Thr Val Pro Thr Ala Ala Ser Gly Ala Tyr Thr85 90 95Ala Ser Trp Asn Val Pro100<210>10<211>99<212>PRT<213>芽孢桿菌屬菌種(Bacillus sp.)<400>10Thr Ser Asn Val Thr Phe Thr Val Asn Asn Ala Thr Thr Val Tyr Gly1 5 10 15Gln Asn Val Tyr Val Val Gly Asn Ile Pro Glu Leu Gly Ash Trp Asn20 25 30Ile Ala Asn Ala Ile Gln Met Thr Pro Ser Ser Tyr Pro Thr Trp Lys35 40 45Thr Thr Val Ser Leu Pro Gln Gly Lys Ala Ile Glu Phe Lys Phe Ile50 55 60
Lys Lys Asp Ser Ala Gly Asn Val Ile Trp Glu Asn Ile Ala Asn Arg65 70 75 80Thr Tyr Thr Val Pro Phe Ser Ser Thr Gly Ser Tyr Thr Ala Asn Trp85 90 95Asn Val Pro<210>11<211>102<212>PRT<213>Alcaliphilic Bacillus<400>11Thr Ser Thr Thr Ser Gln Ile Thr Phe Thr Val Asn Asn Ala Thr Thr1 5 10 15Val Trp Gly Gln Asn Val Tyr Val Val Gly Asn Ile Ser Gln Leu Gly20 25 30Asn Trp Asp Pro Val Asn Ala Val Gln Met Thr Pro Ser Ser Tyr Pro35 40 45Thr Trp Val Val Thr Val Pro Leu Pro Gln Ser Gln Asn Ile Gln Phe50 55 60Lys Phe Ile Lys Lys Asp Gly Ser Gly Asn Val Ile Trp Glu Asn Ile65 70 75 80Ser Asn Arg Thr Tyr Thr Val Pro Thr Ala Ala Ser Gly Ala Tyr Thr85 90 95Ala Asn Trp Asn Val Pro100<210>12<211>112<212>PRT<213>Hormoconis resinae<400>12Cys Gln Val Ser Ile Thr Phe Asn Ile Asn Ala Thr Thr Tyr Tyr Gly1 5 10 15Glu Asn Leu Tyr Val Ile Gly Asn Ser Ser Asp Leu Gly Ala Trp Asn20 25 30
Ile Ala Asp Ala Tyr Pro Leu Ser Ala Ser Ala Tyr Thr Gln Asp Arg35 40 45Pro Leu Trp Ser Ala Ala Ile Pro Leu Asn Ala Gly Glu Val Ile Ser50 55 60Tyr Gln Tyr Val Arg Gln Glu Asp Cys Asp Gln Pro Tyr Ile Tyr Glu65 70 75 80Thr Val Asn Arg Thr Leu Thr Val Pro Ala Cys Gly Gly Ala Ala Val85 90 95Thr Thr Asp Asp Ala Trp Met Gly Pro Val Gly Ser Ser Gly Asn Cys100 105 110<210>13<211>95<212>PRT<213>Lentinula edodes<400>13Val Ser Val Thr Phe Asn Val Asp Ala Ser Thr Leu Glu Gly Gln Asn1 5 10 15Val Tyr Leu Thr Gly Ala Val Asp Ala Leu Glu Asp Trp Ser Thr Asp20 25 30Asn Ala Ile Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Val Thr35 40 45Val Asp Leu Pro Gly Ser Thr Asp Val Gln Tyr Lys Tyr Ile Lys Lys50 55 60Asp Gly Ser Gly Thr Val Thr Trp Glu Ser Asp Pro Asn Met Glu Ile65 70 75 80Thr Thr Pro Ala Asn Gly Thr Tyr Ala Thr Asn Asp Thr Trp Arg85 90 95<210>14<211>107<212>PRT<213>粗糙鏈孢霉(Neurospora crassa)<400>14Cys Ala Ala Asp His Glu Val Leu Val Thr Phe Asn Glu Lys Val Thr
1 5 10 15Thr Ser Tyr Gly Gln Thr Val Lys Val Val Gly Ser Ile Ala Ala Leu20 25 30Gly Asn Trp Ala Pro Ala Ser Gly Val Thr Leu Ser Ala Lys Gln Tyr35 40 45Ser Ser Ser Asn Pro Leu Trp Ser Thr Thr Ile Ala Leu Pro Gln Gly50 55 60Thr Ser Phe Lys Tyr Lys Tyr Val Val Val Asn Ser Asp Gly Ser Val65 70 75 80Lys Trp Glu Asn Asp Pro Asp Arg Ser Tyr Ala Val Gly Thr Asp Cys85 90 95Ala Ser Thr Ala Thr Leu Asp Asp Thr Trp Arg100 105<210>15<211>115<212>PRT<213>Talaromyces byssochlamydioides<400>15Thr Thr Thr Gly Ala Ala Pro Cys Thr Thr Pro Thr Thr Val Ala Val1 5 10 15Thr Phe Asp Glu Ile Val Thr Thr Thr Tyr Gly Glu Thr Val Tyr Leu20 25 30Ser Gly Ser Ile Pro Ala Leu Gly Asn Trp Asp Thr Ser Ser Ala Ile35 40 45Ala Leu Ser Ala Val Asp Tyr Thr Ser Ser Asn Pro Leu Trp Tyr Val50 55 60Thr Val Asn Leu Pro Ala Gly Thr Ser Phe Glu Tyr Lys Phe Phe Val65 70 75 80Gln Gln Thr Asp Gly Thr Ile Val Trp Glu Asp Asp Pro Asn Arg Ser85 90 95Tyr Thr Val Pro Ala Asn Cys Gly Gln Thr Thr Ala Ile Ile Asp Asp100 105 110
Ser Trp Gln115<210>16<211>115<212>PRT<213>Geosmithia cylindrospora<400>16Thr Ser Thr Gly Ser Ala Pro Cys Thr Thr Pro Thr Thr Val Ala Val1 5 10 15Thr Phe Asp Glu Ile Val Thr Thr Ser Tyr Gly Glu Thr Val Tyr Leu20 25 30Ala Gly Ser Ile Ala Ala Leu Gly Asn Trp Asp Thr Asn Ser Ala Ile35 40 45Ala Leu Ser Ala Ala Asp Tyr Thr Ser Asn Asn Asn Leu Trp Tyr Val50 55 60Thr Val Asn Leu Ala Ala Gly Thr Ser Phe Gln Tyr Lys Phe Phe Val65 70 75 80Lys Glu Thr Asp Ser Thr Ile Val Trp Glu Asp Asp Pro Asn Arg Ser85 90 95Tyr Thr Val Pro Ala Asn Cys Gly Gln Thr Thr Ala Ile Ile Asp Asp100 105 110Thr Trp Gln115<210>17<211>139<212>PRT<213>Scorias spongiosa<400>17Ala Lys Val Pro Ser Thr Cys Ser Ala Ser Ser Ala Thr Gly Thr Cys1 5 10 15Thr Thr Ala Thr Ser Thr Phe Gly Gly Ser Thr Pro Thr Thr Ser Cys20 25 30Ala Thr Thr Pro Thr Leu Thr Thr Val Leu Phe Asn Glu Arg Ala Thr35 40 45
Thr Asn Phe Gly Gln Asn Val His Leu Thr Gly Ser Ile Ser Gln Leu50 55 60Gly Ser Trp Asp Thr Asp Ser Ala Val Ala Leu Ser Ala Val Asn Tyr65 70 75 80Thr Ser Ser Asp Pro Leu Trp Phe Val Arg Val Gln Leu Pro Ala Gly85 90 95Thr Ser Phe Gln Tyr Lys Tyr Phe Lys Lys Asp Ser Ser Asn Ala Val100 105 110Ala Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val Pro Leu Asn Cys115 120 125Ala Gly Thr Ala Thr Glu Asn Asp Thr Trp Arg130 135<210>18<211>126<212>PRT<213>Eupenicillium ludwigii<400>18Ser Thr Thr Thr Thr Ser Thr Thr Lys Thr Thr Thr Thr Ser Thr Thr1 5 10 15Thr Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp Leu Ile20 25 30Ala Thr Thr Tyr Tyr Gly Glu Asn Ile Lys Ile Ala Gly Ser Ile Ser35 40 45Gln Leu Gly Asp Trp Asp Thr Ser Asn Ala Val Ala Leu Ser Ala Ala50 55 60Asp Tyr Thr Ser Ser Asp His Leu Trp Phe Val Asp Ile Asp Leu Pro65 70 75 80Ala Gly Thr Val Phe Glu Tyr Lys Tyr Ile Arg Ile Glu Ser Asp Gly85 90 95Ser Ile Glu Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val Pro Ala100 105 110
Ala Cys Ala Thr Thr Ala Val Thr Glu Asn Asp Thr Trp Arg115 120 125<210>19<211>116<212>PRT<213>日本曲霉(Aspergillus japonicus)<400>19Lys Thr Ser Thr Thr Thr Ser Ser Cys Ser Thr Pro Thr Ser Val Ala1 5 10 15Val Thr Phe Asp Val Ile Ala Thr Thr Thr Tyr Gly Glu Asn Val Tyr20 25 30Ile Ser Gly Ser Ile Ser Gln Leu Gly Ser Trp Asp Thr Ser Ser Ala35 40 45Ile Ala Leu Ser Ala Ser Gln Tyr Thr Ser Ser Asn Asn Leu Trp Tyr50 55 60Ala Thr Val His Leu Pro Ala Gly Thr Thr Phe Gln Tyr Lys Tyr Ile65 70 75 80Arg Lys Glu Thr Asp Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg85 90 95Ser Tyr Thr Val Pro Ser Ser Cys Gly Val Ser Ser Ala Thr Glu Ser100 105 110Asp Thr Trp Arg115<210>20<211>133<212>PRT<213>Penicillium cf.miczynskii<400>20Thr Thr Thr Gly Gly Thr Thr Thr Ser Gln Gly Ser Thr Thr Thr Thr1 5 10 15Ser Lys Thr Ser Thr Thr Thr Ser Ser Cys Thr Ala Pro Thr Ser Val20 25 30Ala Val Thr Phe Asp Leu Ile Ala Thr Thr Val Tyr Asp Glu Asn Val35 40 45
Gln Leu Ala Gly Ser Ile Ser Ala Leu Gly Ser Trp Asp Thr Ser Ser50 55 60Ala Ile Arg Leu Ser Ala Ser Gln Tyr Thr Ser Ser Asn His Leu Trp65 70 75 80Tyr Val Ala Val Ser Leu Pro Ala Gly Gln Val Phe Gln Tyr Lys Tyr85 90 95Ile Arg Val Ala Ser Ser Gly Thr Ile Thr Trp Glu Ser Asp Pro Asn100 105 110Leu Ser Tyr Thr Val Pro Val Ala Cys Ala Ala Thr Ala Val Thr Ile115 120 125Ser Asp Thr Trp Arg130<210>21<211>116<212>PRT<213>Mzl Penicillium sp.
<400>21Thr Lys Thr Ser Thr Ser Thr Ser Cys Thr Thr Pro Thr Ala Val Ala1 5 10 15Val Thr Phe Asp Leu Ile Ala Thr Thr Thr Tyr Gly Glu Asn Ile Lys20 25 30Ile Ala Gly Ser Ile Ala Ala Leu Gly Ala Trp Asp Thr Asp Asp Ala35 40 45Val Ala Leu Ser Ala Ala Asp Tyr Thr Asp Ser Asp His Leu Trp Phe50 55 60Val Thr Gln Ser Ile Pro Ala Gly Thr Val Phe Glu Tyr Lys Tyr Ile65 70 75 80Arg Val Glu Ser Asp Gly Thr Ile Glu Trp Glu Ser Asp Pro Asn Arg85 90 95Ser Tyr Thr Val Pro Ala Ala Cys Ala Thr Thr Ala Val Thr Glu Ser100 105 110Asp Thr Trp Arg
115<210>22<211>114<212>PRT<213>Thysanophora sp<400>22Phe Thr Ser Thr Thr Lys Thr Ser Cys Thr Thr Pro Thr Ser Val Ala1 5 10 15Val Thr Phe Asp Leu Ile Ala Thr Thr Thr Tyr Gly Glu Ser Ile Arg20 25 30Leu Val Gly Ser Ile Ser Glu Leu Gly Asp Trp Asp Thr Gly Ser Ala35 40 45Ile Ala Leu His Ala Thr Asp Tyr Thr Asp Ser Asp His Leu Trp Phe50 55 60Val Thr Val Gly Leu Pro Ala Gly Ala Ser Phe Glu Tyr Lys Tyr Ile65 70 75 80Arg Val Glu Ser Ser Gly Thr Ile Glu Trp Glu Ser Asp Pro Asn Arg85 90 95Ser Tyr Thr Val Pro Ala Ala Cys Ala Thr Thr Ala Val Thr Glu Ser100 105 110Asp Thr<210>23<211>111<212>PRT<213>Humicola grisea var.thermoidea<400>23Ala Asp Ala Ser Glu Val Tyr Val Thr Phe Asn Glu Arg Val Ser Thr1 5 10 15Ala Trp Gly Glu Thr Ile Lys Val Val Gly Asn Val Pro Ala Leu Gly20 25 30Asn Trp Asp Thr Ser Lys Ala Val Thr Leu Ser Ala Ser Gly Tyr Lys35 40 45
Ser Asn Asp Pro Leu Trp Ser Ile Thr Val Pro Ile Lys Ala Thr Gly50 55 60Ser Ala Val Gln Tyr Lys Tyr Ile Lys Val Gly Thr Asn Gly Lys Ile65 70 75 80Thr Trp Glu Ser Asp Pro Asn Arg Ser Ile Thr Leu Gln Thr Ala Ser85 90 95Ser Ala Gly Lys Cys Ala Ala Gln Thr Val Asn Asp Ser Trp Arg100 105 110<210>24<211>108<212>PRT<213>黑曲霉(Aspergillus niger)<400>24Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr1 5 10 15Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu20 25 30Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr35 40 45Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly50 55 60Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val65 70 75 80Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys85 90 95Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg100 105<210>25<211>97<212>PRT<213>Aspergillus rolfsii<400>25Val Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val Tyr Gly Gln Asn1 5 10 15
Ile Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn Trp Thr Pro Ala20 25 30Asn Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ala Thr35 40 45Ile Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys Tyr Val Asn Ile50 55 60Asp Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser Asn Arg Glu Ile65 70 75 80Thr Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp Thr Trp Asp Glu85 90 95Ser<210>26<211>38<212>PRT<213>黑曲霉(Aspergillus niger)<400>26Thr Gly Gly Thr Thr Thr Thr Ala Thr Pro Thr Gly Ser Gly Ser Val1 5 10 15Thr Ser Thr Ser Lys Thr Thr Ala Thr Ala Ser Lys Thr Ser Thr Ser20 25 30Thr Ser Ser Thr Ser Ala35<210>27<211>31<212>PRT<213>川地曲霉(Aspergillus kawachii)<400>27Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser Thr Ser Lys Ala Thr1 5 10 15Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr Thr Ser Ser Ser20 25 30<210>28<211>11
<212>PRT<213>Athelia rolfsii<400>28Gly Ala Thr Ser Pro Gly Gly Ser Ser Gly Ser1 5 10<210>29<211>8<212>PRT<213>人工的<220>
<223>人工的<400>29Pro Glu Pro Thr Pro Glu Pro Thr1 5<210>30<211>498<212>PRT<213>米曲霉(Aspergillus oryzae)<400>30Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala1 5 10 15Pro Ala Leu Ala Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr20 25 30Phe Leu Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala35 40 45Thr Cys Asn Thr Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly50 55 60Ile Ile Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile65 70 75 80Trp Ile Thr Pro Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly85 90 95Asp Ala Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu100 105 110Asn Tyr Gly Thr Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His115 120 125
Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly130 135 140Tyr Asp Gly Ala Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe145 150 155 160Ser Ser Gln Asp Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu165 170 175Asp Gln Thr Gln Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser180 185 190Leu Pro Asp Leu Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr195 200 205Asp Trp Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg210 215 220Ile Asp Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn225 230 235 240Lys Ala Ala Gly Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro245 250 255Ala Tyr Thr Cys Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr260 265 270Pro Ile Tyr Tyr Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser275 280 285Met Asp Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro290 295 300Asp Ser Thr Leu Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg305 310 315 320Phe Ala Ser Tyr Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala325 330 335Phe Ile Ile Leu Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu340 345 350Gln His Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp355 360 365
Leu Ser Gly Tyr Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser370 375 380Ala Asn Ala Ile Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val385 390 395 400Thr Tyr Lys Asn Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met405 410 415Arg Lys Gly Thr Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys420 425 430Gly Ala Ser Gly Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr435 440 445Thr Ala Gly Gln Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr450 455 460Val Gly Ser Asp Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro465 470 475 480Arg Val Leu Tyr Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser485 490 495Ser Ser<210>31<211>1923<212>DNA<213>人工的<220>
<223>人工的<220>
<221>CDS<222>(1)..(1923)<400>31atg aga tta tcg act tcg agt ctc ttc ctt tcc gtg tct ctg ctg ggg 48Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15aag ctg gcc ctc ggg ctg tcg gct gca gaa tgg cgc act cag tcg att 96Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30tac ttc cta ttg acg gat cgg ttc ggt agg acg gac aat tcg acg aca144Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45
gct aca tgc gat acg ggt gac caa atc tat tgt ggt ggc agt tgg caa192Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60gga atc atc aac cat ctg gat tat atc cag ggc atg gga ttc acg gcc240Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80atc tgg atc tcg cct atc act gaa cag ctg ccc cag gat act gct gat288Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95ggt gaa gct tac cat gga tat tgg cag cag aag ata tac gac gtg aac336Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110tcc aac ttc ggc act gca gat gac ctc aag tcc ctc tca gat gcg ctt384Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125cat gcc cgc gga atg tac ctc atg gtg gac gtc gtc cct aac cac atg432His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140ggc tac gcc ggc aac ggc aac gat gta gac tac agc gtc ttc gac ccc480Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160ttc gat tcc tcc tcc tac ttc cac cca tac tgc ctg atc aca gat tgg528Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175gac aac ttg acc atg gtc caa gat tgt tgg gag ggt gac acc atc gta576Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190tct ctg cca gac cta aac acc acc gaa act gcc gtg aga aca atc tgg624Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205tat gac tgg gta gcc gac ctg gta tcc aat tat tca gtc gac gga ctc672Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220cgc atc gac agt gtc ctc gaa gtc gaa cca gac ttc ttc ccg ggc tac720Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240cag gaa gca gca ggt gtc tac tgc gtc ggc gaa gtc gac aac ggc aac768Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255cct gcc ctc gac tgc cca tac cag aag gtc ctg gac ggc gtc ctc aac816Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270tat ccg atc tac tgg caa ctc ctc tac gcc ttc gaa tcc tcc agc ggc864Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285
agc atc agc aat ctc tac aac atg atc aaa tcc gtc gca agc gac tgc 912Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300tcc gat ccg aca cta ctc ggc aac ttc atc gaa aac cac gac aat ccc 960Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320cgt ttc gcc tcc tac acc tcc gac tac tcg caa gcc aaa aac gtc ctc1008Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335agc tac atc ttc ctc tcc gac ggc atc ccc atc gtc tac gcc ggc gaa1056Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350gaa cag cac tac tcc ggc ggc aag gtg ccc tac aac cgc gaa gcg acc1104Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365tgg ctt tca ggc tac gac acc tcc gca gag ctg tac acc tgg ata gcc1152Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380acc acg aac gcg atc cgc aaa cta gcc atc tca gct gac tcg gcc tac1200Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400att acc tac gcg aat gat gca ttc tac act gac agc aac acc atc gca1248Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415atg cgc aaa ggc acc tca ggg agc caa gtc atc acc gtc ctc tcc aac1296Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430aaa ggc tcc tca gga agc agc tac acc ctg acc ctc agc gga agc ggc1344Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445tac aca tcc ggc acg aag ctg atc gaa gcg tac aca tgc aca tcc gtg1392Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460acc gtg gac tcg agc ggc gat att ccc gtg ccg atg gcg tcg gga tta1440Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480ccg aga gtt ctt ctg ccc gcg tcc gtc gtc gat agc tct tcg ctc tgt1488Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495ggc ggg agc gga aga aca acc acg acc aca act gct gct gct act agt1536Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser500 505 510aca tcc aaa gcc acc acc tcc tct tct tct tct tct gct gct gct act1584Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr515 520 525act tct tca tca tgt acc act ccc acc gcc gtg gct gtg act ttc gat1632
Thr Ser Ser Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp530 535 540ctg aca gct acc acc acc tac ggc gag aac atc tac ctg gtc gga tcg1680Leu Thr Ala Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser545 550 555 560atc tct cag ctg ggt gac tgg gaa acc agc gac ggc ata gct ctg agt1728Ile Ser Gln Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser565 570 575gct gac aag tac act tcc agc gac ccg ctc tgg tat gtc act gtg act1776Ala Asp Lys Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr580 585 590ctg ccg gct ggt gag tcg ttt gag tac aag ttt atc cgc att gag agc1824Leu Pro Ala Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser595 600 605gat gac tcc gtg gag tgg gag agt gat ccc aac cga gaa tac acc gtt1872Asp Asp Ser Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val610 615 620cct cag gcg tgc gga acg tcg acc gcg acg gtg act gac acc tgg cgg1920Pro Gln Ala Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg625 630 635 640tag1923<210>32<211>640<212>PRT<213>人工的<220>
<223>人工的<400>32Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Ieu Leu Gly1 5 10 15Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp
85 90 95Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335
Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser500 505 510Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr515 520 525Thr Ser Ser Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp530 535 540Leu Thr Ala Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser545 550 555 560Ile Ser Gln Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser565 570 575
Ala Asp Lys Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr580 585 590Leu Pro Ala Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser595 600 605Asp Asp Ser Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val610 615 620Pro Gln Ala Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg625 630 635 640<210>33<211>1890<212>DNA<213>人工的<220>
<223>人工的<220>
<221>CDS<222>(1)..(1890)<400>33atg aga tta tcg act tcg agt ctc ttc ctt tcc gtg tct ctg ctg ggg 48Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15aag ctg gcc ctc ggg ctg tcg gct gca gaa tgg cgc act cag tcg att 96Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30tac ttc cta ttg acg gat cgg ttc ggt agg acg gac aat tcg acg aca144Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45gct aca tgc gat acg ggt gac caa atc tat tgt ggt ggc agt tgg caa192Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60gga atc atc aac cat ctg gat tat atc cag ggc atg gga ttc acg gcc240Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80atc tgg atc tcg cct atc act gaa cag ctg ccc cag gat act gct gat288Ile Trp Ile Ser Pro Iie Thr Glu Gln Ieu Pro Gln Asp Thr Ala Asp85 90 95ggt gaa gct tac cat gga tat tgg cag cag aag ata tac gac gtg aac336Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110tcc aac ttc ggc act gca gat gac ctc aag tcc ctc tca gat gcg ctt384Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu
115 120 125cat gcc cgc gga atg tac ctc atg gtg gac gtc gtc cct aac cac atg432His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140ggc tac gcc ggc aac ggc aac gat gta gac tac agc gtc ttc gac ccc480Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160ttc gat tcc tcc tcc tac ttc cac cca tac tgc ctg atc aca gat tgg528Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175gac aac ttg acc atg gtc caa gat tgt tgg gag ggt gac acc atc gta576Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190tct ctg cca gac cta aac acc acc gaa act gcc gtg aga aca atc tgg624Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205tat gac tgg gta gcc gac ctg gta tcc aat tat tca gtc gac gga ctc672Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220cgc atc gac agt gtc ctc gaa gtc gaa cca gac ttc ttc ccg ggc tac720Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240cag gaa gca gca ggt gtc tac tgc gtc ggc gaa gtc gac aac ggc aac768Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255cct gcc ctc gac tgc cca tac cag aag gtc ctg gac ggc gtc ctc aac816Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270tat ccg atc tac tgg caa ctc ctc tac gcc ttc gaa tcc tcc agc ggc864Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285agc atc agc aat ctc tac aac atg atc aaa tcc gtc gca agc gac tgc912Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300tcc gat ccg aca cta ctc ggc aac ttc atc gaa aac cac gac aat ccc960Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320cgt ttc gcc tcc tac acc tcc gac tac tcg caa gcc aaa aac gtc ctc 1008Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335agc tac atc ttc ctc tcc gac ggc atc ccc atc gtc tac gcc ggc gaa 1056Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350gaa cag cac tac tcc ggc ggc aag gtg ccc tac aac cgc gaa gcg acc 1104Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365
tgg ctt tca ggc tac gac acc tcc gca gag ctg tac acc tgg ata gcc1152Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380acc acg aac gcg atc cgc aaa cta gcc atc tca gct gac tcg gcc tac1200Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400att acc tac gcg aat gat gca ttc tac act gac agc aac acc atc gca1248Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415atg cgc aaa ggc acc tca ggg agc caa gtc atc acc gtc ctc tcc aac1296Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430aaa ggc tcc tca gga agc agc tac acc ctg acc ctc agc gga agc ggc1344Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445tac aca tcc ggc acg aag ctg atc gaa gcg tac aca tgc aca tcc gtg1392Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460acc gtg gac tcg agc ggc gat att ccc gtg ccg atg gcg tcg gga tta1440Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480ccg aga gtt ctt ctg ccc gcg tcc gtc gtc gat agc tct tcg ctc tgt1488Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495ggc ggg agc gga aga aca acc acg acc aca act gct gct gct act agt1536Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser500 505 510aca tcc aaa gcc acc acc tcc tct tct tct tct tct gct gct gct act1584Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr515 520 525act tct tca tca gtc gag gtc act ttc gac gtt tac gct acc aca gta1632Thr Ser Ser Ser Val Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val530 535 540tat ggc cag aac atc tat atc acc ggt gat gtg agt gag ctc ggc aac1680Tyr Gly Gln Asn Ile Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn545 550 555 560tgg aca ccc gcc aat ggt gtt gca ctc tct tct gct aac tac ccc acc1728Trp Thr Pro Ala Asn Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr565 570 575tgg agt gcc acg atc gct ctc ccc gct gac acg aca atc cag tac aag1776Trp Ser Ala Thr Ile Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys580 585 590tat gtc aac att gac ggc agc acc gtc atc tgg gag gat gct atc agc1824Tyr Val Asn Ile Asp Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser595 600 605
aat cgc gag atc acg acg ccc gcc agc ggc aca tac acc gaa aaa gac1872Asn Arg Glu Ile Thr Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp610 615 620act tgg gat gaa tct tag1890Thr Trp Asp Glu Ser625<210>34<211>629<212>PRT<213>人工的<220>
<223>人工的<400>34Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Lcu Ile Thr Asp Trp165 170 175
Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Lcu Asp Gly Val Leu Asn260 265 270Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415
Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495Gly Gly Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser500 505 510Thr Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr515 520 525Thr Ser Ser Ser Val Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val530 535 540Tyr Gly Gln Asn Ile Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn545 550 555 560Trp Thr Pro Ala Asn Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr565 570 575Trp Ser Ala Thr Ile Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys580 585 590Tyr Val Asn Ile Asp Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser595 600 605Asn Arg Glu Ile Thr Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp610 615 620Thr Trp Asp Glu Ser625<210>35<211>1923<212>DNA<213>人工的
<220>
<223>人工的<220>
<221>CDS<222>(1)..(1923)<400>35atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg gca 48Met Val Ala Trp Trp Ser Leu Phe Lcu Tyr Gly Leu Gln Val Ala Ala1 5 10 15cct gct ttg gct gca acg cct gcg gac tgg cga tcg caa tcc att tat 96Pro Ala Leu Ala Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr20 25 30ttc ctt ctc acg gat cga ttt gca agg acg gat ggg tcg acg act gcg144Phe Leu Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala35 40 45act tgt aat act gcg gat cag aaa tac tgt ggt gga aca tgg cag ggc192Thr Cys Asn Thr Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly50 55 60atc atc gac aag ttg gac tat atc cag gga atg ggc ttc aca gcc atc240Ile Ile Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phc Thr Ala Ile65 70 75 80tgg atc acc ccc gtt aca gcc cag ctg ccc cag acc acc gca tat gga288Trp Ile Thr Pro Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly85 90 95gat gcc tac cat ggc tac tgg cag cag gat ata tac tct ctg aac gaa336Asp Ala Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu100 105 110aac tac ggc act gca gat gac ttg aag gcg ctc tct tcg gcc ctt cat384Asn Tyr Gly Thr Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His115 120 125gag agg ggg atg tat ctt atg gtc gat gtg gtt gct aac cat atg ggc432Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly130 135 140tat gat gga gcg ggt agc tca gtc gat tac agt gtg ttt aaa ccg ttc480Tyr Asp Gly Ala Gly Ser Ser Val Asp ryr Ser Val Phe Lys Pro Phe145 150 155 160agt tcc caa gac tac ttc cac ccg ttc tgt ttc att caa aac tat gaa528Ser Ser Gln Asp Tyr Phe His Pro Phe Cys Phc Ile Gln Asn Tyr Glu165 170 175gat cag act cag gtt gag gat tgc tgg cta gga gat aac act gtc tcc576Asp Gln Thr Gln Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser180 185 190ttg cct gat ctc gat acc acc aag gat gtg gtc aag aat gaa tgg tac624Leu Pro Asp Leu Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr195 200 205
gac tgg gtg gga tca ttg gta tcg aac tac tcc att gac ggc ctc cgt 672Asp Trp Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg210 215 220atc gac aca gta aaa cac gtc cag aag gac ttc tgg ccc ggg tac aac 720Ile Asp Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn225 230 235 240aaa gcc gca ggc gtg tac tgt atc ggc gag gtg ctc gac ggt gat ccg 768Lys Ala Ala Gly Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro245 250 255gcc tac act tgt ccc tac cag aac gtc atg gac ggc gta ctg aac tat 816Ala Tyr Thr Cys Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr260 265 270ccc att tac tat cca ctc ctc aac gcc ttc aag tca acc tcc ggc agc 864Pro Ile Tyr Tyr Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser275 280 285atg gac gac ctc tac aac atg atc aac acc gtc aaa tcc gac tgt cca 912Met Asp Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro290 295 300gac tca aca ctc ctg ggc aca ttc gtc gag aac cac gac aac cca cgg 960Asp Ser Thr Leu Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg305 310 315 320ttc gct tct tac acc aac gac ata gcc ctc gcc aag aac gtc gca gca1008Phe Ala Ser Tyr Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala325 330 335ttc atc atc ctc aac gac gga atc ccc atc atc tac gcc ggc caa gaa1056Phe Ile Ile Leu Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu340 345 350cag cac tac gcc ggc gga aac gac ccc gcg aac cgc gaa gca acc tgg1104Gln His Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp355 360 365ctc tcg ggc tac ccg acc gac agc gag ctg tac aag tta att gcc tcc1152Leu Ser Gly Tyr Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser370 375 380gcg aac gca atc cgg aac tat gcc att agc aaa gat aca gga ttc gtg1200Ala Asn Ala Ile Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val385 390 395 400acc tac aag aac tgg ccc atc tac aaa gac gac aca acg atc gcc atg1248Thr Tyr Lys Asn Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met405 410 415cgc aag ggc aca gat ggg tcg cag atc gtg act atc ttg tcc aac aag1296Arg Lys Gly Thr Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys420 425 430ggt gct tcg ggt gat tcg tat acc ctc tcc ttg agt ggt gcg ggt tac1344Gly Ala Ser Gly Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr435 440 445
aca gcc ggc cag caa ttg acg gag gtc att ggc tgc acg acc gtg acg1392Thr Ala Gly Gln Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr450 455 460gtt ggt tcg gat gga aat gtg cct gtt cct atg gca ggt ggg cta cct1440Val Gly Ser Asp Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro465 470 475 480agg gta ttg tat ccg act gag aag ttg gca ggt agc aag atc tgt agt1488Arg Val Leu Tyr Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser485 490 495agc tcg gga aga aca acc acg acc aca act gct gct gct act agt aca1536Ser Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser Thr500 505 510tcc aaa gcc acc acc tcc tct tct tct tct tct gct gct gct act act1584Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr Thr515 520 525tct tca tca tgc acc gca aca agc acc acc ctc ccc atc acc ttc gaa1632Ser Ser Ser Cys Thr Ala Thr Ser Thr Thr Leu Pro Ile Thr Phe Glu530 535 540gaa ctc gtc acc act acc tac ggg gaa gaa gtc tac ctc agc gga tct1680Glu Leu Val Thr Thr Thr Tyr Gly Glu Glu Val Tyr Leu Ser Gly Ser545 550 555 560atc tcc cag ctc gga gag tgg gat acg agt gac gcg gtg aag ttg tcc1728Ile Ser Gln Leu Gly Glu Trp Asp Thr Ser Asp Ala Val Lys Leu Ser565 570 575gcg gat gat tat acc tcg agt aac ccc gag tgg tct gtt act gtg tcg1776Ala Asp Asp Tyr Thr Ser Ser Asn Pro Glu Trp Ser Val Thr Val Ser580 585 590ttg ccg gtg ggg acg acc ttc gag tat aag ttt att aag gtc gat gag1824Leu Pro Val Gly Thr Thr Phe Glu Tyr Lys Phe Ile Lys Val Asp Glu595 600 605ggt gga agt gtg act tgg gaa agt gat ccg aat agg gag tat act gtg1872Gly Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val610 615 620cct gaa tgt ggg aat ggg agt ggg gag acg gtg gtt gat acg tgg agg1920Pro Glu Cys Gly Asn Gly Ser Gly Glu Thr Val Val Asp Thr Trp Arg625 630 635 640tag1923<210>36<211>640<212>PRT<213>人工的<220>
<223>人工的<400>36
Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala1 5 10 15Pro Ala Leu Ala Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr20 25 30Phe Leu Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala35 40 45Thr Cys Asn Thr Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly50 55 60Ile Ile Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phc Thr Ala Ile65 70 75 80Trp Ile Thr Pro Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly85 90 95Asp Ala Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu100 105 110Asn Tyr Gly Thr Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His115 120 125Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly130 135 140Tyr Asp Gly Ala Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe145 150 155 160Ser Ser Gln Asp Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu165 170 175Asp Gln Thr Gln Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser180 185 190Leu Pro Asp Leu Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr195 200 205Asp Trp Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg210 215 220Ile Asp Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn225 230 235 240Lys Ala Ala Gly Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro
245 250 255Ala Tyr Thr Cys Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr260 265 270Pro Ile Tyr Tyr Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser275 280 285Met Asp Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro290 295 300Asp Ser Thr Leu Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg305 310 315 320Phe Ala Ser Tyr Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala325 330 335Phe Ile Ile Leu Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu340 345 350Gln His Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp355 360 365Leu Ser Gly Tyr Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser370 375 380Ala Asn Ala Ile Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val385 390 395 400Thr Tyr Lys Asn Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met405 410 415Arg Lys Gly Thr Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys420 425 430Gly Ala Ser Gly Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr435 440 445Thr Ala Gly Gln Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr450 455 460Val Gly Ser Asp Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro465 470 475 480Arg Val Leu Tyr Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser485 490 495
Ser Ser Gly Arg Thr Thr Thr Thr Thr Thr Ala Ala Ala Thr Ser Thr500 505 510Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr Thr515 520 525Ser Ser Ser Cys Thr Ala Thr Ser Thr Thr Leu Pro Ile Thr Phe Glu530 535 540Glu Leu Val Thr Thr Thr Tyr Gly Glu Glu Val Tyr Leu Ser Gly Ser545 550 555 560Ile Ser Gln Leu Gly Glu Trp Asp Thr Ser Asp Ala Val Lys Leu Ser565 570 575Ala Asp Asp Tyr Thr Ser Ser Asn Pro Glu Trp Ser Val Thr Val Ser580 585 590Leu Pro Val Gly Thr Thr Phe Glu Tyr Lys Phe Ile Lys Val Asp Glu595 600 605Gly Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val610 615 620Pro Glu Cys Gly Asn Gly Ser Gly Glu Thr Val Val Asp Thr Trp Arg625 630 635 640<210>37<211>1830<212>DNA<213>人工的<220>
<223>人工的<220>
<221>CDS<222>(1)..(1830)<400>37atg aga tta tcg act tcg agt ctc ttc ctt tcc gtg tct ctg ctg ggg 48Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15aag ctg gcc ctc ggg ctg tcg gct gca gaa tgg cgc act cag tcg att 96Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30tac ttc cta ttg acg gat cgg ttc ggt agg acg gac aat tcg acg aca144
Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45gct aca tgc gat acg ggt gac caa atc tat tgt ggt ggc agt tgg caa192Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60gga atc atc aac cat ctg gat tat atc cag ggc atg gga ttc acg gcc240Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80atc tgg atc tcg cct atc act gaa cag ctg ccc cag gat act gct gat288Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95ggt gaa gct tac cat gga tat tgg cag cag aag ata tac gac gtg aac336Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn100 105 110tcc aac ttc ggc act gca gat gac ctc aag tcc ctc tca gat gcg ctt384Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125cat gcc cgc gga atg tac ctc atg gtg gac gtc gtc cct aac cac atg432His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140ggc tac gcc ggc aac ggc aac gat gta gac tac agc gtc ttc gac ccc480Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160ttc gat tcc tcc tcc tac ttc cac cca tac tgc ctg atc aca gat tgg528Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175gac aac ttg acc atg gtc caa gat tgt tgg gag ggt gac acc atc gta576Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190tct ctg cca gac cta aac acc acc gaa act gcc gtg aga aca atc tgg624Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205tat gac tgg gta gcc gac ctg gta tcc aat tat tca gtc gac gga ctc672Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220cgc atc gac agt gtc ctc gaa gtc gaa cca gac ttc ttc ccg ggc tac720Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240cag gaa gca gca ggt gtc tac tgc gtc ggc gaa gtc gac aac ggc aac768Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255cct gcc ctc gac tgc cca tac cag aag gtc ctg gac ggc gtc ctc aac816Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270tat ccg atc tac tgg caa ctc ctc tac gcc ttc gaa tcc tcc agc ggc864Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly
275 280 285agc atc agc aat ctc tac aac atg atc aaa tcc gtc gca agc gac tgc 912Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys290 295 300tcc gat ccg aca cta ctc ggc aac ttc atc gaa aac cac gac aat ccc 960Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320cgt ttc gcc tcc tac acc tcc gac tac tcg caa gcc aaa aac gtc ctc1008Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335agc tac atc ttc ctc tcc gac ggc atc ccc atc gtc tac gcc ggc gaa1056Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350gaa cag cac tac tcc ggc ggc aag gtg ccc tac aac cgc gaa gcg acc1104Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365tgg ctt tca ggc tac gac acc tcc gca gag ctg tac acc tgg ata gcc1152Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380acc acg aac gcg atc cgc aaa cta gcc atc tca gct gac tcg gcc tac1200Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400att acc tac gcg aat gat gca ttc tac act gac agc aac acc atc gca1248Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415atg cgc aaa ggc acc tca ggg agc caa gtc atc acc gtc ctc tcc aac1296Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430aaa ggc tcc tca gga agc agc tac acc ctg acc ctc agc gga agc ggc1344Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445tac aca tcc ggc acg aag ctg atc gaa gcg tac aca tgc aca tcc gtg1392Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460acc gtg gac tcg agc ggc gat att ccc gtg ccg atg gcg tcg gga tta1440Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480ccg aga gtt ctt ctg ccc gcg tcc gtc gtc gat agc tct tcg ctc tgt1488Pro Arg Val Leu Lcu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495ggc ggg agc gga aga ggt gct aca agc ccg ggt ggc tcc tcg ggt agt1536Gly Gly Ser Gly Arg Gly Ala Thr Ser Pro Gly Gly Ser Ser Gly Ser500 505 510gtc gag gtc act ttc gac gtt tac gct acc aca gta tat ggc cag aac1584Val Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val Tyr Gly Gln Asn515 520 525
atc tat atc acc ggt gat gtg agt gag ctc ggc aac tgg aca ccc gcc1632Ile Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn Trp Thr Pro Ala530 535 540aat ggt gtt gca ctc tct tct gct aac tac ccc acc tgg agt gcc acg1680Asn Gly Val Ala Lcu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ala Thr545 550 555 560atc gct ctc ccc gct gac acg aca atc cag tac aag tat gtc aac att1728Ile Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys Tyr Val Asn Ile565 570 575gac ggc agc acc gtc atc tgg gag gat gct atc agc aat cgc gag atc1776Asp Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser Asn Arg Glu Ile580 585 590acg acg ccc gcc agc ggc aca tac acc gaa aaa gac act tgg gat gaa1824Thr Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp Thr Trp Asp Glu595 600 605tct tag1830Ser<210>38<211>609<212>PRT<213>人工的<220>
<223>人工的<400>38Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly1 5 10 15Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile20 25 30Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr35 40 45Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln50 55 60Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala65 70 75 80Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp85 90 95Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn
100 105 110Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu115 120 125His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met130 135 140Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro145 150 155 160Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp165 170 175Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val180 185 190Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp195 200 205Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu210 215 220Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr225 230 235 240Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn245 250 255Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn260 265 270Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly275 280 285Ser Ile Ser Asn Leu Tyr Asn Met lle Lys Ser Val Ala Ser Asp Cys290 295 300Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro305 310 315 320Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu325 330 335Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu340 345 350
Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr355 360 365Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala370 375 380Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr385 390 395 400Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala405 410 415Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn420 425 430Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly435 440 445Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val450 455 460Thr Val Asp SeT Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu465 470 475 480Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys485 490 495Gly Gly Ser Gly Arg Gly Ala Thr Ser Pro Gly Gly Ser Ser Gly Ser500 505 510Val Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val Tyr Gly Gln Asn515 520 525Ile Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn Trp Thr Pro Ala530 535 540Asn Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ala Thr545 550 555 560Ile Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys Tyr Val Asn Ile565 570 575Asp Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser Asn Arg Glu Ile580 585 590
Thr Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp Thr Trp Asp Glu595 600 605Ser<210>39<211>1827<212>DNA<213>人工的<220>
<223>人工的<220>
<221>CDS<222>(1)..(1827)<400>39atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg gca 48Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala1 5 10 15cct gct ttg gct gca acg cct gcg gac tgg cga tcg caa tcc att tat 96Pro Ala Leu Ala Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr20 25 30ttc ctt ctc acg gat cga ttt gca agg acg gat ggg tcg acg act gcg144Phe Leu Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala35 40 45act tgt aat act gcg gat cag aaa tac tgt ggt gga aca tgg cag ggc192Thr Cys Asn Thr Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly50 55 60atc atc gac aag ttg gac tat atc cag gga atg ggc ttc aca gcc atc240Ile Ile Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile65 70 75 80tgg atc acc ccc gtt aca gcc cag ctg ccc cag acc acc gca tat gga288Trp Ile Thr Pro Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly85 90 95gat gcc tac cat ggc tac tgg cag cag gat ata tac tct ctg aac gaa336Asp Ala Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu100 105 110aac tac ggc act gca gat gac ttg aag gcg ctc tct tcg gcc ctt cat384Asn Tyr Gly Thr Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His115 120 125gag agg ggg atg tat ctt atg gtc gat gtg gtt gct aac cat atg ggc432Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly130 135 140tat gat gga gcg ggt agc tca gtc gat tac agt gtg ttt aaa ccg ttc480Tyr Asp Gly Ala Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe
145 150 155 160agt tcc caa gac tac ttc cac ccg ttc tgt ttc att caa aac tat gaa528Ser Ser Gln Asp Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu165 170 175gat cag act cag gtt gag gat tgc tgg cta gga gat aac act gtc tcc576Asp Gln Thr Gln Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser180 185 190ttg cct gat ctc gat acc acc aag gat gtg gtc aag aat gaa tgg tac624Leu Pro Asp Leu Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr195 200 205gac tgg gtg gga tca ttg gta tcg aac tac tcc att gac ggc ctc cgt672Asp Trp Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg210 215 220atc gac aca gta aaa cac gtc cag aag gac ttc tgg ccc ggg tac aac720Ile Asp Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn225 230 235 240aaa gcc gca ggc gtg tac tgt atc ggc gag gtg ctc gac ggt gat ccg768Lys Ala Ala Gly Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro245 250 255gcc tac act tgt ccc tac cag aac gtc atg gac ggc gta ctg aac tat816Ala Tyr Thr Cys Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr260 265 270ccc att tac tat cca ctc ctc aac gcc ttc aag tca acc tcc ggc agc864Pro Ile Tyr Tyr Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser275 280 285atg gac gac ctc tac aac atg atc aac acc gtc aaa tcc gac tgt cca912Met Asp Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro290 295 300gac tca aca ctc ctg ggc aca ttc gtc gag aac cac gac aac cca cgg960Asp Ser Thr Leu Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg305 310 315 320ttc gct tct tac acc aac gac ata gcc ctc gcc aag aac gtc gca gca 1008Phe Ala Ser Tyr Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala325 330 335ttc atc atc ctc aac gac gga atc ccc atc atc tac gcc ggc caa gaa 1056Phe Ile Ile Leu Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu340 345 350cag cac tac gcc ggc gga aac gac ccc gcg aac cgc gaa gca acc tgg 1104Gln His Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp355 360 365ctc tcg ggc tac ccg acc gac agc gag ctg tac aag tta att gcc tcc 1152Leu Ser Gly Tyr Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser370 375 380gcg aac gca atc cgg aac tat gcc att agc aaa gat aca gga ttc gtg 1200Ala Asn Ala Ile Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val385 390 395 400
acc tac aag aac tgg ccc atc tac aaa gac gac aca acg atc gcc atg1248Thr Tyr Lys Asn Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met405 410 415cgc aag ggc aca gat ggg tcg cag atc gtg act atc ttg tcc aac aag1296Arg Lys Gly Thr Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys420 425 430ggt gct tcg ggt gat tcg tat acc ctc tcc ttg agt ggt gcg ggt tac1344Gly Ala Ser Gly Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr435 440 445aca gcc ggc cag caa ttg acg gag gtc att ggc tgc acg acc gtg acg1392Thr Ala Gly Gln Gln Leu Thr Glu Val Tle Gly Cys Thr Thr Val Thr450 455 460gtt ggt tcg gat gga aat gtg cct gtt cct atg gca ggt ggg cta cct1440Val Gly Ser Asp Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro465 470 475 480agg gta ttg tat ccg act gag aag ttg gca ggt agc aag atc tgt agt1488Arg Val Leu Tyr Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser485 490 495agc tcg gga aga ggt gct aca agc ccg ggt ggc tcc tcg ggt agt gtc1536Ser Ser Gly Arg Gly Ala Thr Ser Pro Gly Gly Ser Ser Gly Ser Val500 505 510gag gtc act ttc gac gtt tac gct acc aca gta tat ggc cag aac atc1584Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val Tyr Gly Gln Asn Ile515 520 525tat atc ace ggt gat gtg agt gag ctc ggc aac tgg aca ccc gcc aat1632Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn Trp Thr Pro Ala Asn530 535 540ggt gtt gca ctc tct tct gct aac tac ccc acc tgg agt gcc acg atc1680Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ala Thr Ile545 550 555 560gct ctc ccc gct gac acg aca atc cag tac aag tat gtc aac att gac1728Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys Tyr Val Asn Ile Asp565 570 575ggc agc acc gtc atc tgg gag gat gct atc agc aat cgc gag atc acg1776Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser Asn Arg Glu Ile Thr580 585 590acg ccc gcc agc ggc aca tac acc gaa aaa gac act tgg gat gaa tct1824Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp Thr Trp Asp Glu Ser595 600 605tag1827<210>40<211>608<212>PRT<213>人工的
<220>
<223>人工的<400>40Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala1 5 10 15Pro Ala Leu Ala Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr20 25 30Phe Leu Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala35 40 45Thr Cys Asn Thr Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly50 55 60Ile Ile Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile65 70 75 80Trp Ile Thr Pro Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly85 90 95Asp Ala Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu100 105 110Asn Tyr Gly Thr Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His115 120 125Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly130 135 140Tyr Asp Gly Ala Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe145 150 155 160Ser Ser Gln Asp Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu165 170 175Asp Gln Thr Gln Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser180 185 190Leu Pro Asp Leu Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr195 200 205Asp Trp Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg210 215 220
Ile Asp Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn225 230 235 240Lys Ala Ala Gly Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro245 250 255Ala Tyr Thr Cys Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr260 265 270Pro Ile Tyr Tyr Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser275 280 285Met Asp Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro290 295 300Asp Ser Thr Leu Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg305 310 315 320Phe Ala Ser Tyr Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala325 330 335Phe Ile Ile Leu Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu340 345 350Gln His Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp355 360 365Leu Ser Gly Tyr Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser370 375 380Ala Asn Ala Ile Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val385 390 395 400Thr Tyr Lys Asn Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met405 410 415Arg Lys Gly Thr Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys420 425 430Gly Ala Ser Gly Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr435 440 445Thr Ala Gly Gln Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr450 455 460Val Gly Ser Asp Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro
465 470 475 480Arg Val Leu Tyr Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser485 490 495Ser Ser Gly Arg Gly Ala Thr Ser Pro Gly Gly Ser Ser Gly Ser Val500 505 510Glu Val Thr Phe Asp Val Tyr Ala Thr Thr Val Tyr Gly Gln Asn Ile515 520 525Tyr Ile Thr Gly Asp Val Ser Glu Leu Gly Asn Trp Thr Pro Ala Asn530 535 540Gly Val Ala Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ala Thr Ile545 550 555 560Ala Leu Pro Ala Asp Thr Thr Ile Gln Tyr Lys Tyr Val Asn Ile Asp565 570 575Gly Ser Thr Val Ile Trp Glu Asp Ala Ile Ser Asn Arg Glu Ile Thr580 585 590Thr Pro Ala Ser Gly Thr Tyr Thr Glu Lys Asp Thr Trp Asp Glu Ser595 600 605<210>41<211>640<212>PRT<213>川地曲霉(A spergillus kawachii)<220>
<221>mat_peptide<222>(22)..(640)<400>41Met Arg Val Ser Thr Ser Ser Ile Ala Leu Ala Val Ser Leu Phe Gly-20 -15 -10Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile-5 -1 1 5 10Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr15 20 25Ala Thr Cys Asn Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln30 35 40
Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala45 50 55Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ser Asp60 65 70 75Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Tyr Val Asn80 85 90Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu95 100 105His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met110 115 120Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro125 130 135Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp140 145 150 155Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val160 165 170Ser Leu Pro ASp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp175 180 185Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu190 195 200Arg Ile Asp Ser Val Glu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr205 210 215Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn220 225 230 235Pro Ala Leu Asp Cys Pro Tyr Gln Lys Tyr Leu Asp Gly Val Leu Asn240 245 250Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly255 260 265Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys270 275 280
Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro285 290 295Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu300 305 310 315Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Glu320 325 330Glu Gln His Tyr Ser Gly Gly Asp Val Pro Tyr Asn Arg Glu Ala Thr335 340 345Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala350 355 360Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Asp Tyr365 370 375Ile Thr Tyr Lys Asn Asp Pro Ile Tyr Thr Asp Ser Asn Thr Ile Ala380 385 390 395Met Arg Lys Gly Thr Ser Gly Ser Gln Ile Ile Thr Val Leu Ser Asn400 405 410Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly415 420 425Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val430 435 440Thr Val Asp Ser Asn Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu445 450 455Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys460 465 470 475Gly Gly Ser Gly Asn Thr Thr Thr Thr Thr Thr Ala Ala Thr Ser Thr480 485 490Ser Lys Ala Thr Thr Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr Thr495 500 505Ser Ser Ser Cys Thr Ala Thr Ser Thr Thr Leu Pro Ile Thr Phe Glu510 515 520
Glu Leu Val Thr Thr Thr Tyr Gly Glu Glu Val Tyr Leu Ser Gly Ser525 530 535Ile Ser Gln Leu Gly Glu Trp His Thr Ser Asp Ala Val Lys Leu Ser540 545 550 555Ala Asp Asp Tyr Thr Ser Ser Asn Pro Glu Trp Ser Val Thr Val Ser560 565 570Leu Pro Val Gly Thr Thr Phe Glu Tyr Lys Phe Ile Lys Val Asp Glu575 580 585Gly Gly Ser Val Thr Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val590 595 600Pro Glu Cys Gly Ser Gly Ser Gly Glu Thr Val Val Asp Thr Trp Arg605 610 615<210>42<211>505<212>PRT<213>黑曲霉(Aspergillus niger)<220>
<221>mat_peptide<222>(22)..(505)<400>42Met Arg Leu Ser Thr Ser Ser Leu Phe Leu Ser Val Ser Leu Leu Gly-20 -15 -10Lys Leu Ala Leu Gly Leu Ser Ala Ala Glu Trp Arg Thr Gln Ser Ile-5 -1 1 5 10Tyr Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr15 20 25Ala Thr Cys Asp Thr Gly Asp Gln Ile Tyr Cys Gly Gly Ser Trp Gln30 35 40Gly Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala45 50 55Ile Trp Ile Ser Pro Ile Thr Glu Gln Leu Pro Gln Asp Thr Ala Asp60 65 70 75Gly Glu Ala Tyr His Gly Tyr Trp Gln Gln Lys Ile Tyr Asp Val Asn
80 85 90Ser Asn Phe Gly Thr Ala Asp Asp Leu Lys Ser Leu Ser Asp Ala Leu95 100 105His Ala Arg Gly Met Tyr Leu Met Val Asp Val Val Pro Asn His Met110 115 120Gly Tyr Ala Gly Asn Gly Asn Asp Val Asp Tyr Ser Val Phe Asp Pro125 130 135Phe Asp Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Thr Asp Trp140 145 150 155Asp Asn Leu Thr Met Val Gln Asp Cys Trp Glu Gly Asp Thr Ile Val160 165 170Ser Leu Pro Asp Leu Asn Thr Thr Glu Thr Ala Val Arg Thr Ile Trp175 180 185Tyr Asp Trp Val Ala Asp Leu Val Ser Asn Tyr Ser Val Asp Gly Leu190 195 200Arg Ile Asp Ser Val Leu Glu Val Glu Pro Asp Phe Phe Pro Gly Tyr205 210 215Gln Glu Ala Ala Gly Val Tyr Cys Val Gly Glu Val Asp Asn Gly Asn220 225 230 235Pro Ala Leu Asp Cys Pro Tyr Gln Lys Val Leu Asp Gly Val Leu Asn240 245 250Tyr Pro Ile Tyr Trp Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly255 260 265Ser Ile Ser Asn Leu Tyr Asn Met Ile Lys Ser Val Ala Ser Asp Cys270 275 280Ser Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro285 290 295Arg Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Leu300 305 310 315Ser Tyr Ile Phe Leu Ser Asp Gly Ile Pro Ile Val ryr Ala Gly Glu320 325 330
Glu Gln His Tyr Ser Gly Gly Lys Val Pro Tyr Asn Arg Glu Ala Thr335 340 345Trp Leu Ser Gly Tyr Asp Thr Ser Ala Glu Leu Tyr Thr Trp Ile Ala350 355 360Thr Thr Asn Ala Ile Arg Lys Leu Ala Ile Ser Ala Asp Ser Ala Tyr365 370 375Ile Thr Tyr Ala Asn Asp Ala Phe Tyr Thr Asp Ser Asn Thr Ile Ala380 385 390 395Met Arg Lys Gly Thr Ser Gly Ser Gln Val Ile Thr Val Leu Ser Asn400 405 410Lys Gly Ser Ser Gly Ser Ser Tyr Thr Leu Thr Leu Ser Gly Ser Gly415 420 425Tyr Thr Ser Gly Thr Lys Leu Ile Glu Ala Tyr Thr Cys Thr Ser Val430 435 440Thr Val Asp Ser Ser Gly Asp Ile Pro Val Pro Met Ala Ser Gly Leu445 450 455Pro Arg Val Leu Leu Pro Ala Ser Val Val Asp Ser Ser Ser Leu Cys460 465 470 475Gly Gly Ser Gly Arg Leu Tyr Val Glu480<210>43<211>476<212>PRT<213>米曲霉(Aspergillus oryzae)<220>
<221>mat_peptide<222>(1)..(476)<400>43Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr1 5 10 15Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr20 25 30
Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys35 40 45Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro50 55 60Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His65 70 75 80Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr85 90 95Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met100 105 110Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala115 120 125Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp130 135 140Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln145 150 155 160Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu165 170 175Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly180 185 190Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val195 200 205Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly210 215 220Val Tyr Cys Ile Gly Glu Val Leu Asp Gly Asp Pro Ala Tyr Thr Cys225 230 235 240Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr245 250 255Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser Met Asp Asp Leu260 265 270
Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu275 280 285Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr290 295 300Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu305 310 315 320Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala325 330 335Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr340 345 350Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile355 360 365Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn370 375 380Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr385 390 395 400Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly405 410 415Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln420 425 430Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp435 440 445Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu ryr450 455 460Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser465 470 47權(quán)利要求
1.雜交酶,其包括催化模塊的氨基酸序列和糖結(jié)合模塊的氨基酸序列,a)其中所述催化模塊是氨基酸序列,其與SEQ ID NO8的氨基酸序列具有至少70%同源性或與SEQ ID NO30的氨基酸序列具有至少70%同源性;b)其中所述糖結(jié)合模塊氨基酸序列,其與選自SEQ ID NO9、SEQ IDNO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24或SEQ ID NO25的氨基酸序列具有至少50%同源性。
2.權(quán)利要求1的雜交酶,其中所述的雜交酶進一步包括接頭氨基酸序列,其連接催化模塊的氨基酸序列和糖結(jié)合模塊的氨基酸序列。
3.權(quán)利要求2的雜交酶,其中所述的接頭序列是選自SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29的接頭序列或與SEQ IDNO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29中所示的氨基酸序列相差不多于10個位置、不多于9個位置、不多于8個位置、不多于7個位置、不多于6個位置、不多于5個位置、不多于4個位置、不多于3個位置、不多于2個位置或不多于1個位置的接頭序列的接頭序列。
4.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO8的氨基酸序列具有至少70%同源性。
5.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO8的氨基酸序列具有至少80%同源性。
6.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO8的氨基酸序列具有至少90%同源性。
7.權(quán)利要求1的雜交酶,所述催化模塊是氨基酸序列,其與SEQ ID NO8的氨基酸序列具有至少95%同源性。
8.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO30的氨基酸序列具有至少70%同源性。
9.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO30的氨基酸序列具有至少80%同源性。
10.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO30的氨基酸序列具有至少90%同源性。
11.權(quán)利要求1的雜交酶,其中所述催化模塊是氨基酸序列,其與SEQ IDNO30的氨基酸序列具有至少95%同源性。
12.權(quán)利要求1的雜交酶,其中所述糖結(jié)合模塊是氨基酸序列,其與SEQID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23、SEQ ID NO24或SEQ ID NO25中所示的任一氨基酸序列具有至少60%同源性。
13.權(quán)利要求1的雜交酶,其中所述糖結(jié)合模塊是氨基酸序列,其與SEQID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23、SEQ ID NO24或SEQ ID NO25中所示的任一氨基酸序列具有至少70%同源性。
14.權(quán)利要求1的雜交酶,其中所述糖結(jié)合模塊是氨基酸序列,其與SEQID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23、SEQ ID NO24或SEQ ID NO25中所示的任一氨基酸序列具有至少80%同源性。
15.權(quán)利要求1的雜交酶,其中所述糖結(jié)合模塊是氨基酸序列,其與SEQID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23、SEQ ID NO24或SEQ ID NO25中所示的任一氨基酸序列具有至少90%同源性。
16.雜交酶,包括序列SEQ ID NO40的氨基酸21-498所示的米曲霉菌alpha淀粉酶的催化結(jié)構(gòu)域和與序列SEQ ID NO40的氨基酸21-498所示的氨基酸序列具有至少70%同源性的氨基酸序列。
17.與SEQ ID NO41具有至少80%同源性的變體alpha-淀粉酶,其中所述的變體在一個或多個選自13、15、18、31、32、33、34、35、36、61、63、64、68、69、73、74、75、76、77、78、79、80、81、82、83、84、89、117、118、119、120、121、122、123、124、125、152、153、154、155、156、157、158、161、162、165、166、167、168、169、170、171、172、173、174、175、204、205、206、207、208、209、210、211、216、229、230、231、232、233、234、235、236、237、238、239、242、245、250、252、253、255、256、257、259、260、275、292、295、296、297、298、299、304、328、339、344、348、378、383、386、387、405、448或480的位置包含變化,其中;a)所述的變化獨立地,i)插入占據(jù)所述位置的氨基酸的氨基酸下游,ii)缺失占據(jù)所述位置的氨基酸,或iii)用不同的氨基酸取代占據(jù)所述位置的氨基酸,b)所述的變體具有alpha-淀粉酶活性。
18.權(quán)利要求17的變體包括一個或多個下列取代G33A、I36K、S74A、D75Y、E77D、P120A、I153D、D154N、W155Y、D156E、N157D、L158Q、Q162E、E166L、T169N、I170T、E199K、E199L、D232L、N233D、N235D、L238Y、D239T、W256Y、Q257P、E331Q、S336A、D339K、D339N、V340D和Y342A。
19.權(quán)利要求17的變體在一個或多個下列位置包括變化31、74、89、209、245、348、378、383、386、387、405、448和480。
20.權(quán)利要求17的變體包括一個或多個下列取代N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S、N480R。
21.權(quán)利要求17的變體包括下列取代N31D、S74A、Y89D、E209L、Y245V、D348K、D378A、K383A、P386A、I387F、I405V、N448S、N480R。
22.分離的DNA序列,其編碼前述任一項權(quán)利要求所述的雜交酶或所述的變體。
23.DNA構(gòu)建體,其包括權(quán)利要求22的DNA序列。
24.表達(dá)載體,其包括權(quán)利要求22的DNA序列。
25.用權(quán)利要求24的載體轉(zhuǎn)化的宿主細(xì)胞,其中所述的宿主細(xì)胞能夠表達(dá)權(quán)利要求18的分離的DNA序列。
26.權(quán)利要求25的宿主細(xì)胞,其中所述的宿主細(xì)胞來自真菌、細(xì)菌、植物或哺乳動物。
27.用于液化淀粉的方法,其中凝膠化的或顆粒狀的淀粉底物在含水介質(zhì)中用權(quán)利要求1-21的任一項所述的雜交酶或所述的變體處理。
28.權(quán)利要求27的方法,其包括用酵母接觸所述處理過的淀粉以產(chǎn)生燃料乙醇或飲料乙醇。
29.權(quán)利要求27-28的任一項的方法,包括將所述處理過的淀粉發(fā)酵成為發(fā)酵產(chǎn)物,諸如檸檬酸、谷氨酸一鈉、葡糖酸、葡糖酸鈉、葡糖酸鈣、葡糖酸鉀、葡糖酸delta內(nèi)酯、異抗壞血酸鈉、衣康酸、乳酸、葡糖酸;酮類;氨基酸、谷氨酸(單谷氨酸鈉)、青霉素、四環(huán)素;酶;維生素,諸如核黃素、B12、beta-胡蘿卜素或激素。
30.權(quán)利要求27-28中任一項的方法,其中所述的淀粉漿體與包含糖結(jié)合模塊但無催化模塊的多肽接觸。
31.制備基于-面團的產(chǎn)品的方法,包括將權(quán)利要求1-21中任一項的雜交酶或變體加入面團。
32.雜交酶,其包括序列SEQ ID NO40的氨基酸21-498所示的米曲霉菌alpha淀粉酶的催化結(jié)構(gòu)域或與序列SEQ ID NO40的氨基酸21-498所示的氨基酸序列具有至少50%同源性的序列,和糖結(jié)合結(jié)構(gòu)域。
33.權(quán)利要求32的雜交酶,在一個或多個選自81、158、161、163、164、175、176、177、264、266、466、468或470的位置包括取代。
34.權(quán)利要求32的雜交酶,其包括一個或多個選自Q81R、K158D、K158V、S161D、S161N、Q163S、Q163A、D164S、Y175W、E176D、D177N、N264K、N264E、M266L、G466D、D468S或N470D的取代。
35.權(quán)利要求32的雜交酶,其包括一個或多個選自K158V、S161N、Q163A、D164S、N264K、M266L、G466D、D468S或N470D的取代。
36.權(quán)利要求32的雜交酶,其包括一個或多個選自Q81R、K158V、S161N、Q163A、D164S、Y175W、E176D、D177N、N264K、M266L、G466D、D468S或N470D的取代。
全文摘要
本發(fā)明涉及包括糖-結(jié)合模塊氨基酸序列和真菌alpha-淀粉酶氨基酸序列的雜交酶,并涉及包括糖-結(jié)合模塊和alpha-淀粉酶催化模塊的真菌野生型酶的變體。本發(fā)明也涉及所述的雜交酶或所述的變體在淀粉液化中的用途。
文檔編號C12N9/26GK1842596SQ200480024571
公開日2006年10月4日 申請日期2004年6月25日 優(yōu)先權(quán)日2003年6月25日
發(fā)明者平理佳子, 高木忍, 卡斯滕·約爾特, 安德斯·維克索-尼爾森, 埃里克·阿蘭, 宇田川?;? 福山志朗 申請人:諾維信公司, 諾維信北美公司