專利名稱:蛋白酶變體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及新的蛋白酶3D結(jié)構(gòu),以及親本蛋白酶的變體,尤其是性質(zhì)改變的變體,諸如改進(jìn)的熱穩(wěn)定性和/或改變的溫度活性圖譜(profile)。本發(fā)明還涉及編碼所述變體的DNA序列,它們在重組宿主細(xì)胞中的制備,以及利用所述變體的方法,尤其是在動物飼料以及清潔劑(detergent)的領(lǐng)域中。本發(fā)明還涉及產(chǎn)生和制備具有改變的性質(zhì)的蛋白酶變體的方法。優(yōu)選的親本蛋白酶是擬諾卡氏菌屬(Nocardiopsis)蛋白酶,諸如包含SEQ ID NO2,4,6,8,10,和21的成熟肽部分的蛋白酶。
背景技術(shù):
源自擬諾卡氏菌屬菌株的蛋白酶序列公開于WO 88/03947,WO01/58276,和DK 1996 00013(“蛋白酶10,”SEQ ID NOs1-2)。
JP 2003284571-A公開了擬諾卡氏菌TOA-1(FERM P-18676)來源的蛋白酶的氨基酸序列和相應(yīng)DNA序列,分別為SEQ ID NO2和1。所述序列已經(jīng)錄入GENESEQ數(shù)據(jù)庫,分別為GENESEQP no.ADF43564,和GENESEQN no.ADF43563。
JP 2-255081-A公開了源自擬諾卡氏菌OPC-210(FERM P-10508)的蛋白酶,然而沒有序列信息。該菌株不再可得,因為保藏已經(jīng)撤回。
DD 200432|8公開了源自達(dá)松維爾擬諾卡氏菌(Nocardiopsisdassonvillei)菌株ZIMET 43647的蛋白水解制備物,但沒有序列信息。該菌株不再可得。
其它擬諾卡氏菌屬蛋白酶序列公開于PCT/DK04/000433(“蛋白酶08,”本文的SEQ ID NOs9-10);PCT/DK04/000434(“蛋白酶11,”本文的SEQ IDNOs5-6);PCT/DK04/000432(“蛋白酶18,”本文的SEQ ID NOs3-4);和PCT/DK04/000435(“蛋白酶35,”本文的SEQ ID NOs7-8)。
本發(fā)明的目的是提供可選的蛋白酶,尤其用于動物飼料和/或清潔劑,尤其是新的和改進(jìn)的蛋白酶變體,優(yōu)選具有改變的性質(zhì),諸如改進(jìn)的熱穩(wěn)定性和/或改變的溫度活性圖譜。
發(fā)明內(nèi)容
本發(fā)明涉及親本蛋白酶的變體,包括位于選自以下區(qū)域組成的組的至少一個區(qū)域的至少一個位置中的取代6-18;22-28;32-39;42-58;62-63;66-76;78-100;103-106;111-114;118-131;134-136;139-141;144-151;155-156;160-176;179-181;和184-188;其中(a)所述變體具有蛋白酶活性;和(b)每個位置對應(yīng)SEQ ID NO2的氨基酸1-188的位置;和(c)所述變體與SEQ ID NO2的氨基酸1-188具有至少60%的同一性百分比。
本發(fā)明還涉及編碼所述蛋白酶變體的分離的核酸序列,包含所述核酸序列的核酸構(gòu)建體,載體和宿主細(xì)胞,以及制備和利用所述蛋白酶變體的方法。
圖1是蛋白酶10,蛋白酶18,蛋白酶11,蛋白酶35和蛋白酶08(分別為SEQ ID NOs2,4,6,8和10的成熟肽部分)的多重比對,其中還包括本發(fā)明的蛋白質(zhì)變體即蛋白酶22(SEQ ID NO21的氨基酸1-188);和圖2提供蛋白酶10(SEQ ID NO2的氨基酸1-188)的新3D結(jié)構(gòu)坐標(biāo)(coordinate),所述蛋白酶源自擬諾卡氏菌NRRL 18262。
發(fā)明詳述蛋白酶10的三維結(jié)構(gòu)蛋白酶10的結(jié)構(gòu)根據(jù)X射線晶體學(xué)方法獲得,所述方法顯示在例如X-Ray Structure Determination,Stout,G.K.and Jensen,L.H.,John Wiley & Sons,Inc.NY,1989中。利用同晶型取代法(isomorphous replacement)在2.2分辨率獲得的晶體結(jié)構(gòu)的結(jié)構(gòu)坐標(biāo)以標(biāo)準(zhǔn)PDB模式顯示于圖2(Protein DataBank,Brookhaven National Laboratory,Brookhaven,CT)。圖2的PDB圖譜涉及對應(yīng)SEQ ID NO2的殘基1-188的蛋白酶10的成熟肽部分。
分子動力學(xué)(MD)分子動力學(xué)(MD)模擬指示蛋白結(jié)構(gòu)中氨基酸的活動性(seeMcCammon,JA and Harvey,SC.,(1987),“Dynamics of proteins and nucleicacids”,Cambridge University Press)。所述蛋白動力學(xué)通常與晶體學(xué)B因子比較(見Stout,GH and Jensen,LH,(1989),“X-ray structure determination″,Wiley)。通過在例如不同溫度進(jìn)行MD模擬,模擬殘基的溫度相關(guān)的活動性。具有最高活動性或柔性(flexibility)(本文為各向同性波動(isotropicfluctuations))的區(qū)域可用于隨機誘變。應(yīng)理解見于蛋白質(zhì)特定區(qū)域的高活動性可通過取代這些殘基熱改進(jìn)。
利用程序CHARMM(Accelrys)和NAMD(University of Illinois atUrbana-Champaign),蛋白酶10的上述結(jié)構(gòu)接受300和400K的MD。從圖2的坐標(biāo)開始,氫和缺失的重原子分別利用CHARMM程序HBUILD和ICBUILD構(gòu)建。隨后所述結(jié)構(gòu)利用CHARMM偶聯(lián)物梯度(CONJ)最小化程序最小化,總共200個步驟。所述蛋白隨后置于70×70×70埃的盒子上然后用TIP3水分子溶劑化。總共加入11124個水分子然后最小化,保持蛋白質(zhì)坐標(biāo)固定,利用CHARMM Adopted Basis Newton Raphson(ABNR)最小化程序進(jìn)行20000步。該步驟隨后以每100步1K的速率被加熱到所需溫度,利用NAMD軟件。平衡50微微秒之后,進(jìn)行NVE系綜(ensemble)MD1納秒,兩個步驟均利用軟件NAMD進(jìn)行。分離點(cut-off)12埃用于非成鍵(non-bonded)反應(yīng)。周期性邊界條件在溶劑化步驟以后使用并用于所有隨后的步驟。各向同性均方根(RMS)波動利用CHARMM程序COOR DYNA計算。
以下圖示了得自MD模擬的突變結(jié)果的區(qū)域殘基160-170,殘基78-90,殘基43-50,殘基66-75,殘基22-28。
制備變體的策略氨基酸殘基的區(qū)域,以及單個氨基酸取代,基于圖2的3D結(jié)構(gòu)用于誘變,以及5種已知蛋白酶(圖1上5行)主要就改進(jìn)的熱穩(wěn)定性方面的比對。
涉及以下區(qū)域,參考(cf.)權(quán)利要求16-18;22-28;32-39;42-58;62-63;66-76;78-100;103-106;111-114;118-131;134-136;139-141;144-151;155-156;160-176;179-181;和184-188。
優(yōu)選對上述區(qū)域的以下位置的至少一種進(jìn)行誘變,參考權(quán)利要求3;6;7;8;9;10;12;13;16;17;18;22;23;24;25;26;27;28;32;33;37;38;39;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;58;62;63;66;67;68;69;70;71;72;73;74;75;76;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;103;105;106;111;113;114;118;120;122;124;125;127;129;130;131;134;135;136;139;140;141;144;145;146;147;148;149;150;151;155;156;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;179;180;181;184;185;186;187;和/或188。
涉及的具體突變體顯示在權(quán)利要求中,即權(quán)利要求4和15中的蛋白酶10,蛋白酶18,蛋白酶11,蛋白酶35以及蛋白酶08的變體;權(quán)利要求16中蛋白酶10的變體;權(quán)利要求17中蛋白酶18的變體;權(quán)利要求18中蛋白酶11的變體;權(quán)利要求19中蛋白酶35的變體;和權(quán)利要求20中蛋白酶08的變體。
本發(fā)明的各種概念也反應(yīng)在權(quán)利要求中,如下權(quán)利要求5和6中通過二硫橋的穩(wěn)定;權(quán)利要求7-8中的脯氨酸穩(wěn)定;權(quán)利要求9-10中的用帶負(fù)電的殘基取代暴露的中性殘基;權(quán)利要求11-12中的用帶正電的殘基取代暴露的中性殘基;權(quán)利要求13中蛋白內(nèi)的用體積較大的殘基取代小殘基;權(quán)利要求14中的在MD模擬以后推薦用于誘變的區(qū)域。
術(shù)語“至少一個/種”指“一或多個/種”即例如在區(qū)域的背景(context)中,,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16和17個/種;或在位置或取代的背景中1,2,3,4,5等,直到例如90個/種。
具體實施方案中,建議和/或接受誘變的區(qū)域的數(shù)目為至少1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16或至少17個。
另一具體實施方案中,建議和/或接受誘變的區(qū)域的數(shù)目不超過1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16或不超過17個。
具有蛋白酶活性的多肽具有蛋白酶活性的多肽,或蛋白酶,有時也指明為肽酶、蛋白酶、肽水解酶、或蛋白水解酶。蛋白酶可能具有起始于其任一末端的水解肽的外型,或在多肽鏈內(nèi)部起作用的內(nèi)型(內(nèi)肽酶)。內(nèi)肽酶顯示對N-和C-末端上阻斷的肽底物的活性,其與目的蛋白酶的特異性相關(guān)。
在此限定術(shù)語″蛋白酶″作為水解肽鍵的酶。蛋白酶的該定義也適用于本文術(shù)語“親本蛋白酶”和“蛋白酶變體”的蛋白酶部分。它包括屬于EC 3.4酶小組的任何酶(包括其13個亞類的每一類)。EC號碼是指來自NC-IUBMB,Academic Press,San Diego,加利福尼亞的酶命名法1992,包括分別刊登于Eur.J.Biochem.1994,223,1-5;Eur.J.Biochem.1995,232,1-6;Eur.J.Biochem.1996,237,1-5;Eur.J.Biochem.1997,250,1-6;和Eur.J.Biochem.1999,264,610-650supplements 1-5。有規(guī)律地補充和更新該命名法;參見例如world wide web(WWW)http://www.chem.qmw.ac.uk/iubmb/enzyme/index.html)。
根據(jù)其催化機理將蛋白酶分為下列小組絲氨酸蛋白酶(S)、半胱氨酸蛋白酶(C)、天冬氨酸蛋白酶(A)、金屬蛋白酶(M)、以及未知的或至今未分類的蛋白酶(U)、參見Handbook of Proteolytic Enzymes,A.J.Barrett,N.D.Rawlings,J.F.Woessner(編輯),Academic Press(1998),特別是綜合導(dǎo)言部分。
具體實施方案中,本發(fā)明所述和根據(jù)本發(fā)明使用的親本蛋白酶和/或蛋白酶變體選自下組(a)屬于EC 3.4.-.-酶小組的蛋白酶;(b)屬于上述手冊S組的絲氨酸蛋白酶;(c1)肽酶家族S2A的絲氨酸蛋白酶;和(c2)肽酶家族SlE的絲氨酸蛋白酶,其在Biochem.J.290205-218(1993)和2003年3月24日的MEROPS蛋白酶數(shù)據(jù)庫,版本(release)6.20(www.merops.ac.uk)中有描述。該數(shù)據(jù)庫在Rawlings,N.D.,O′Brien,E.A.& Barrett,A.J.(2002)MEROPSthe protease database.Nucleic Acids Res.30,343-346中有描述。
為了確定給出的蛋白酶是否是絲氨酸蛋白酶、S2A蛋白酶家族,參考上述參考文獻(xiàn)和其中所述的原則??蓪λ蓄愋偷牡鞍酌?、天然存在或野生型的蛋白酶、或遺傳改造或合成的蛋白酶進(jìn)行這種確定。
可利用任何分析測量蛋白酶活性,其中使用底物,包括與所述蛋白酶的特異性相關(guān)的肽鍵。pH-分析和溫度-分析同樣適于所述的蛋白酶。分析-pH-值的實例是pH 2、3、4、5、6、7、8、9、10、11或12。分析-溫度的實例是30、35、37、40、45、50、55、60、65、70、80、90或95℃。蛋白酶底物的實例是酪蛋白,例如天青精-交聯(lián)(Azurine-crosslinked)的酪蛋白(AZCL-酪蛋白)。適宜蛋白酶試驗的實例在試驗部分描述。
親本蛋白酶所述親本蛋白酶是蛋白酶,蛋白酶變體來源或可來源所述親本蛋白酶。為本發(fā)明的目的,任何蛋白酶可用作親本蛋白酶,只要產(chǎn)生的蛋白酶變體與蛋白酶10同源,蛋白酶10即源自擬諾卡氏菌NRRL 18262并包含SEQ IDNO2的氨基酸1-188的蛋白酶。
具體的實施方案中,所述親本蛋白酶同源于蛋白酶10。
本發(fā)明中,同源意指具有至少60%的同一性于SEQ ID NO2,即蛋白酶10的成熟肽部分的氨基酸1-188。同源性如下文氨基酸同源性中通常所述的那樣測定。
所述親本蛋白酶可為野生型或天然存在的多肽,或其等位基因變體,或其具有蛋白酶活性的片段,具體是其成熟部分。其也可是其變體和/或遺傳改造的或合成的多肽。
具體實施方案中,親本蛋白酶是i)細(xì)菌蛋白酶;ii)放線菌門(phylumActinobacteria)的蛋白酶;iv)放線菌目(order)的蛋白酶v)擬諾卡氏菌科的蛋白酶;vi)擬諾卡氏菌屬的蛋白酶;和/或源自以下種的蛋白酶vii)擬諾卡氏菌屬的種,諸如Nocardiopsis alba,Nocardiopsis antarctica,Nocardiopsiscomposta,達(dá)松維爾擬諾卡氏菌,Nocardiopsis exhalans,Nocardiopsishalophila,Nocardiopsis halotolerans,Nocardiopsis kunsanensis,Nocardiopsislisteri,Nocardiopsis lucentensis,Nocardiopsis metallicus,Nocardiopsis prasina,Nocardiopsis sp.,Nocardiopsis synnemataformans,Nocardiopsis trehalosi,Nocardiopsis tropica,Nocardiopsis umidischolae,或Nocardiopsisxinjiangensis。
所述菌株的實例是Nocardiopsis alba DSM 15647(蛋白酶08的野生型生產(chǎn)者),達(dá)松維爾擬諾卡氏菌NRRL 18133(蛋白酶M58-1的野生型生產(chǎn)者,描述見WO 88/03947),達(dá)松維爾擬諾卡氏菌亞種達(dá)松維爾DSM 43235(蛋白酶18的野生型生產(chǎn)者),Nocardiopsis prasina DSM 15648(蛋白酶11的野生型生產(chǎn)者),Nocardiopsis prasina DSM 15649(蛋白酶35的野生型生產(chǎn)者),Nocardiopsis sp.NRRL 18262(蛋白酶10的野生型生產(chǎn)者),諾卡氏菌FERM P-18676(描述見JP 2003284571-A)。
公眾可從多個培養(yǎng)物保藏中心獲得這些種的菌株,諸如美國典型培養(yǎng)物保藏中心(ATCC),Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH(DSMZ),Centraalbureau Voor Schimmelcultures(CBS),和Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center(NRRL),例如達(dá)松維爾擬諾卡氏菌亞種達(dá)松維爾DSM43235可公開獲自DSMZ(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH,Braunschweig,Germany)。
此外,所述肽可被鑒定并可利用適宜探針獲自包括分離自天然(例如土壤,肥料,水等)的微生物或DNA的其它來源。用于從天然環(huán)境分離微生物或DNA的技術(shù)是本領(lǐng)域已知的。所述核酸序列可隨后通過類似地篩選另一微生物的基因組或cDNA文庫衍生。一旦編碼多肽的核酸序列利用探針檢測到,所述序列可通過利用本領(lǐng)域技術(shù)人員已知的技術(shù)(見,例如Sambrook et al.,1989,見上文)分離或克隆。
所述親本蛋白酶也可以是上述任意氨基酸序列的成熟部分。成熟部分意指成熟氨基酸序列,并指在潛在的信號肽部分和/或原肽部分已經(jīng)被切除之后仍然保持的氨基酸序列部分。蛋白酶08,10,11,18,22和35的每一種的成熟部分在下附序列表中說明。
所述親本蛋白酶也可以是具體的氨基酸序列的片段,即具有從該氨基酸序列的氨基和/或羧基末端缺失的一或多個氨基酸的多肽。一個實施方案中,片段含有至少80,或至少90,或至少100,或至少110,或至少120,或至少130,或至少140,或至少150,或至少160,或至少170,或至少180,或至少185個氨基酸殘基。
所述親本蛋白酶也可以是等位基因變體,等位基因指占據(jù)同一染色體基因座的兩種或多種的可選形式的存在。等位基因變體通過突變天然產(chǎn)生,并導(dǎo)致群體內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?編碼的多肽中沒有改變),或編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是基因的等位基因變體編碼的多肽。
另一實施方案中,所述親本蛋白酶可以是遺傳改造的蛋白酶,例如上述野生型或天然親本蛋白酶,其包括一或多個氨基酸的取代,缺失和/或添加。換言之所述親本蛋白酶本身是蛋白酶變體,諸如蛋白酶22。所述親本蛋白酶的氨基酸序列可與一或多個氨基酸殘基的插入或缺失和/或通過不同氨基酸殘基對一或多個氨基酸殘基的取代所示的氨基酸序列不同。所述氨基酸殘基改變的性質(zhì)可為次要(minor)的,或主要的。主要性質(zhì)的氨基酸改變是例如,導(dǎo)致本發(fā)明的性質(zhì)改變的變體蛋白酶的那些。另一具體實施方案中,所述氨基酸改變是次要的性質(zhì),即不明顯影響所述蛋白質(zhì)的折疊和/或活性的保守氨基酸取代;小缺失,通常1-約30個氨基酸;小氨基-或羧基末端延伸,諸如氨基末端蛋氨酸殘基;達(dá)到約20-25個殘基的小接頭肽;或小的延伸,其促進(jìn)通過改變凈電荷或另一功能的純化,諸如多聚組氨酸通道(tract),抗原性表位或結(jié)合結(jié)構(gòu)域。
保守取代的實例是在堿性氨基酸(精氨酸、賴氨酸和組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天門冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸和纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)的組的范圍之內(nèi)。一般不改變特異活性的氨基酸取代是本領(lǐng)域已知的,并且在例如H.Neurath和R.L.Hill,1979,The Proteins,Academic Press,紐約中有描述。最通常發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly及反之。
遺傳改造的親本蛋白酶的其它實施例是合成蛋白酶,由人設(shè)計,并預(yù)期不見于自然。EP 897985公開了制備共有蛋白質(zhì)的方法。改組的蛋白酶是合成或遺傳改造的親本蛋白酶的其它實例,其可如本領(lǐng)域技術(shù)人員通常所知那樣制備,例如通過定點誘變,通過PCR(利用含有所需突變的PCR片段作為PCR反應(yīng)中的引物之一),或通過隨機誘變。還包括在合成蛋白酶的概念中的有任何雜合或嵌合蛋白酶,即包含源自至少兩種蛋白酶的部分氨基酸序列的組合的蛋白酶?;蚋慕M通常在例如WO 95/22625和WO96/00343中描述。蛋白酶基因的重組可通過合成改組由親本的特異性序列獨立制備,如Ness,J.E.et al,in Nature Biotechnology,Vol.20(12),pp.1251-1255,2002所述。設(shè)計這樣的合成寡核苷酸,其DNA序列簡并以提供設(shè)計所有見于親本蛋白酶的組的氨基酸并根據(jù)參照組裝基因的可能性。所述改組可針對全長序列或該序列的僅僅一部分進(jìn)行,然后與該基因的其余部分組合以產(chǎn)生全長序列。蛋白酶10,18,11,35,08和22(SEQ ID NO2,4,6,8,10,和21;具體是其成熟部分)中的2,3,4,5或所有6種是所述親本蛋白酶的實例,其可如上所述經(jīng)改組,以提供本發(fā)明的其它蛋白酶。
其它具體實施方案中,所述親本蛋白酶分別包括所述的氨基酸序列或其等位基因變體;或其具有蛋白酶活性的片段,或由上述物質(zhì)組成。
另一具體實施方案中,本發(fā)明的蛋白酶變體不等同于(not identical to)(i)SEQ ID NO2的氨基酸1-188,SEQ ID NO4的氨基酸1-188,SEQ ID NO6的氨基酸1-188,SEQ ID NO8的氨基酸1-188,和SEQ ID NO10的氨基酸1-188;(ii)SEQ ID NO2的氨基酸1-188;(iii)SEQ ID NO2的氨基酸1-188,其具有取代T87A;(iv)SEQ ID NO4的氨基酸1-188;(v)SEQ ID NO6的氨基酸1-188;(vi)SEQ ID NO8的氨基酸1-188;(vii)SEQ ID NO10的氨基酸1-188;(viii)源自達(dá)松維爾擬諾卡氏菌NRRL 18133的蛋白酶;(ix)具有SEQID NO21的氨基酸1-188的蛋白酶,如JP 2003284571-A中公開的;(x)具有GENESEQP登錄號ADF43564的蛋白酶;(xi)DK專利申請200400969中公開為SEQ ID NO2的蛋白酶,具體是其成熟部分;(xii)DK專利申請200400969中公開為SEQ ID NO4的蛋白酶,具體是其成熟部分;(xiii)DK專利申請2004 00969中公開為SEQ ID NO6的蛋白酶,具體是其成熟部分;(xiv)DK專利申請2004 00969中公開為SEQ ID NO8的蛋白酶,具體是其成熟部分;(xv)DK專利申請2004 00969中公開為SEQ ID NO10的蛋白酶,具體是其成熟部分;(xvi)DK專利申請2004 00969中公開為SEQ ID NO12的蛋白酶,具體是其成熟部分;和/或(xvii)與SEQ ID NO2具有至少60%同一性百分比的現(xiàn)有技術(shù)蛋白酶。
微生物分類學(xué)與分類學(xué)相關(guān)的問題可通過查詢分類數(shù)據(jù)庫解決,諸如NCBITaxonomy Browser,其可得自以下網(wǎng)址http://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/,和/或通過查詢分類手冊解決。為本發(fā)明的目的,所述分類優(yōu)選根據(jù)以下章節(jié)The road mapto the Manual by G.M.Garrity & J.G.Holt in Bergey′s Manual of SystematicBacteriology,2001,second edition,volume 1,David R.Bone,Richard W.Castenholz。
氨基酸同源性本發(fā)明涉及蛋白酶,即親本蛋白酶,和/或蛋白酶變體,其與SEQ ID NO21的氨基酸1-188有一定的同一性,所述親本和/或變體蛋白酶由此命名為“同源蛋白酶”。
為了本發(fā)明的目的,通過Needleman-Wunsch序列對比的程序″align″(即總的(global)序列對比)確定2個氨基酸序列之間的同一性程度,以及2個核苷酸序列之間的同一性程度。該程序用于多肽以及核苷酸序列的序列對比。使用默認(rèn)積分矩陣BLOSUM50用于多肽序列對比,而默認(rèn)同一性矩陣(default identity matrix)用于核苷酸序列對比。對于多肽,缺口的第一個殘基的罰分是-12,而對于核苷酸是-16。對于多肽,缺口的其它殘基的罰分是-2,對于核苷酸是-4。
″Align″屬于FASTA程序包版本v20u6(參見W.R.Pearson和D.J.Lipman(1988),″Improved Tools for Biological Sequence Analysis″,PNAS 852444-2448,和W.R.Pearson(1990)″Rapid and Sensitive Sequence Comparison withFASTP and FASTA,″Methods in Enzymology 18363-98)。FASTA蛋白質(zhì)序列對比使用Smith-Waterman算法而不限制缺口大小(參見″Smith-Waterman algorithm″,T.F.Smith和M.S.Waterman(1981)J.Mol.Biol.147195-197)。
蛋白質(zhì)序列的多重比對可利用“ClustalW”(Thompson,J.D.,Higgins,D.G.and Gibson,T.J.(1994)CLUSTAL Wimproving the sensitivity of progressivemultiple sequence alignment through sequence weighting,positions-specific gappenalties and weight matrix choice.Nucleic Acids Research,224673-4680)進(jìn)行。DNA序列的多重比對可利用蛋白質(zhì)比對作為模板,用DNA序列的相應(yīng)密碼子取代氨基酸來進(jìn)行。
具體實施方案中,同源蛋白酶具有的氨基酸序列與SEQ ID NO21的氨基酸1-188的同一性程度為至少60%,62%,64%,66%,68%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或至少約99%。
可選實施方案中,同源蛋白酶具有的氨基酸序列與SEQ ID NO2的同一性程度為至少50%,51%,52%,53%,54%,55%,56%,57%,58%,或至少59%。
其它具體實施方案中,所述親本蛋白酶,和/或蛋白酶變體包含成熟氨基酸序列,其與規(guī)定的氨基酸序列例如SEQ ID NO21的氨基酸1-188有不超過75,74,73,72,71,70,69,68,67,66,65,64,63,62,61,60,59,58,57,56,55,54,53,52,51,50,49,48,47,46,45,44,43,42,41,40,39,38,37,36,35,34,33,32,31,30,29,28,27,26,25,24,23,22,21,20,19,18,17,16,15,14,13,12,11,10,9,8,7,6,5,4,3,不超過2個,或僅僅一個氨基酸不同。
另一具體實施方案中,所述親本蛋白酶,和/或蛋白酶變體包含成熟氨基酸序列,其與規(guī)定的氨基酸序列例如SEQ ID NO21的氨基酸1-188有至少75,74,73,72,71,70,69,68,67,66,65,64,63,62,61,60,59,58,57,56,55,54,53,52,51,50,49,48,47,46,45,44,43,42,41,40,39,38,37,36,35,34,33,32,31,30,29,28,27,26,25,24,23,22,21,20,19,18,17,16,15,14,13,12,11,10,9,8,7,6,5,4,3,至少2個,或一個氨基酸不同。
核酸雜交可選,同源親本蛋白酶以及變體蛋白酶,可定義為由在非常低嚴(yán)謹(jǐn)條件下,優(yōu)選低嚴(yán)謹(jǐn)條件,更優(yōu)選中度嚴(yán)謹(jǐn)條件,更優(yōu)選中-高度嚴(yán)謹(jǐn)條件,甚至更優(yōu)選高度嚴(yán)謹(jǐn)條件,最優(yōu)選非常高度嚴(yán)謹(jǐn)條件下與SEQ ID NO1的核苷酸900-1466,或900-1463,或其亞序列或互補鏈雜交的核酸序列所編碼(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York)。亞序列可具有至少100個核苷酸,或至少200,300,400,或至少500個核苷酸。此外,所述亞序列可編碼具有相關(guān)酶活性的多肽片段。
對于長度至少100個核苷酸的長探針,非常低到非常高的嚴(yán)謹(jǐn)度條件定義為在以下條件的預(yù)雜交和雜交42℃,5X SSPE,0.3% SDS,200μg/ml剪切且變性的鮭精DNA,以及25%甲酰胺用于非常低和低嚴(yán)謹(jǐn)度,35%甲酰胺用于中度和中-高度嚴(yán)謹(jǐn)度,或50%甲酰胺用于高度和非常高度嚴(yán)謹(jǐn)度,然后進(jìn)行標(biāo)準(zhǔn)Southern印跡方法。
對于長度至少100核苷酸的長探針,所述載體物質(zhì)最終被洗滌三次,每次15分鐘,利用2x SSC,0.2%SDS,優(yōu)選至少在45℃(非常低嚴(yán)謹(jǐn)度),更優(yōu)選至少50℃(低嚴(yán)謹(jǐn)度),更優(yōu)選至少55℃(中度嚴(yán)謹(jǐn)度),更優(yōu)選至少60℃(中-高度嚴(yán)謹(jǐn)度),更優(yōu)選至少65℃(高嚴(yán)謹(jǐn)度),最優(yōu)選至少70℃(非常高嚴(yán)謹(jǐn)度)。
對于長度大約15-約70個核苷酸的短探針,嚴(yán)謹(jǐn)度條件定義為在比利用Bolton和McCarthy(1962,Proceedings of the National Academy of SciencesUSA 481390)的算法算出的Tm低5℃-10℃、在0.9M NaCl,0.09MTris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt’s溶液,1mM磷酸鈉,1mM磷酸二氫鈉,0.1mM ATP,和0.2mg酵母RNA每ml中進(jìn)行預(yù)雜交,雜交和雜交后洗滌,然后進(jìn)行標(biāo)準(zhǔn)Southern印跡方法。
對于長度大約15個-大約70個核苷酸的短探針,所述載體物質(zhì)在6XSCC+0.1%SDS中洗滌一次、15分鐘,并在比計算的Tm低5℃-10℃、利用6X SSC洗滌兩次,每次15分鐘。
位置編號本文中,位置編號的基礎(chǔ)是SEQ ID NO21的氨基酸1-188,蛋白酶10,其起始于A1、終止于T188,見圖1。親本蛋白酶,以及變體蛋白酶,與SEQID NO2相比可包含延伸,即在其N末端中,和/或C末端中。所述延伸的氨基酸將按本領(lǐng)域常規(guī)編號,即對于C末端延伸189,190,191,依此類推,對于N末端延伸-1,-2,-3,依此類推。
改變,諸如取代,缺失,插入本文中,然后在各種方式的實施例中,其中蛋白酶變體設(shè)計自或衍生自親本氨基酸序列氨基酸可用其它氨基酸取代;氨基酸可被缺失,氨基酸可被插入;以及任何數(shù)目所述改變的組合。
為本發(fā)明的目的,術(shù)語取代意圖包括任何數(shù)量的、任何類型的所述改變。這是合理的定義,因為,例如缺失可被認(rèn)為是給定位置nn的氨基酸AA用無()取代。所述取代可表示為AAnn()。同樣,僅僅一個氨基酸BB插入給定位置的氨基酸AA的下游可表示為()nnaBB。如果兩個氨基酸BB和CC插入位置nn的氨基酸AA的下游,所述取代(兩種取代的組合)可表示為()nnaBB+()nnbCC,由此產(chǎn)生位于親本序列中的氨基酸nn和nn+1之間的缺口,其用跟在前面的位置編號(本文為nn)的小寫的字母或下標(biāo)字母a,b,c等表示。在將新的序列與圖1的多重比對進(jìn)行比對時,在氨基酸nn和nn+1之間的比對產(chǎn)生的缺口的情況下,可以遵循類似的編號方法。缺口的每個位置都被賦予編號nna,nnb等。取代物之間的逗號(,)例如在T129E,D,Y,Q中,指“或者”,即T129被E或D或Y或Q取代。取代之間的加號(+),例如129D+135P指“和”,即這兩個單個取代組合在一個或相同蛋白酶變體中。
本發(fā)明中,術(shù)語“取代”指至少一處取代。至少一處指一或多處,例如,1,或2,或3,或4,或5,或6,或7,或8,或9,或10,或12,或14,或15,或16,或18或20,或22,或24,或25,或28,或30等處取代,以在原則上包括任何數(shù)目的取代。然而,本發(fā)明的變體,仍需例如與SEQ ID NO2具有至少60%的同一性,該百分比通過上述的程序確定。所述取代可用于權(quán)利要求1中所述的任何區(qū)域所包含的任何位置,且含有任何數(shù)目和類型的所述取代的組合的變體也包括在內(nèi)。本文術(shù)語取代也包括缺失,以及延伸,或插入,其可被加入對應(yīng)SEQ ID NO21的氨基酸1-188的序列的長度。
此外,術(shù)語“取代”包括對其它19種天然氨基酸中的任一種,或其它氨基酸諸如非天然氨基酸的取代。例如,位置22中氨基酸T的取代包括以下取代中的每一種22A,22C,22D,22E,22F,22G,22H,22I,22K,22L,22M,22N,22P,22Q,22R,22S,22V,22W,和22Y。其等同于命名22X,其中X代表任何氨基酸。這些取代也可稱為T22A,T22C,T22X等。同樣的命名類似地適用于本文所述的每個位置,包括本文所述取代的任何一種。
鑒定相應(yīng)的位置編號對于本發(fā)明的每種親本或變體蛋白酶中的每個氨基酸殘基,和/或根據(jù)本發(fā)明的用途,可能直接并且明確地指定其所對應(yīng)的SEQ ID NO2的氨基酸1-188的序列中的氨基酸殘基。對應(yīng)的殘基被賦予相同的編號;參比蛋白酶10序列。
如從圖1的編號所建,結(jié)合序列表中的編號,蛋白酶10,蛋白酶18,蛋白酶11,蛋白酶35,蛋白酶08,和蛋白酶22中每一個的每個氨基酸殘基,SEQ ID NO2中的相應(yīng)氨基酸殘基具有相同的編號。該編號可從圖1輕易獲知。至少在這六種蛋白酶的情況下,所述編號與賦予序列表中各個蛋白酶的成熟部分中的氨基酸殘基的編號相同。
對于另一蛋白酶(可為親本或變體蛋白酶)中的給定位置,SEQ ID NO2的對應(yīng)位置可總被發(fā)現(xiàn),如下另一親本蛋白酶的氨基酸序列,或變體蛋白酶氨基酸序列,稱為SEQ-X。對應(yīng)SEQ ID NO2的位置N的位置如下親本或變體蛋白酶氨基酸序列SEQ-X與SEQ ID NO2如上文標(biāo)題為氨基酸同源性的部分中所述進(jìn)行比對。可從所述比對清楚確定地得出對應(yīng)SEQ ID NO2的位置N的序列SEQ-X中的位置,其中利用下述的原則。
SEQ-X是目的蛋白酶的成熟部分??蛇x,其也包括信號肽部分,和/或原肽部分,或其可為成熟蛋白酶的片段,其具有蛋白酶活性,例如與SEQ IDNO2長度相同的片段,和/或當(dāng)如本文所述與SEQ ID NO2比對時,其可以是從A1延伸到T188的片段。
區(qū)域和位置本發(fā)明中,術(shù)語區(qū)域指親本蛋白酶氨基酸序列的至少一個位置,術(shù)語位置指示所述氨基酸序列的氨基酸殘基。一個實施方案中,區(qū)域指親本蛋白酶氨基酸序列的一或多個連續(xù)位置,例如1,2,3,4,5,6,7,8等,直到所述序列連續(xù)位置的任何數(shù)目。因此,區(qū)域可由僅僅一個位置組成,和其可由任何數(shù)目的連續(xù)位置,諸如,位置62和63;或位置111,112,113和114組成。為本發(fā)明的目的,這兩個區(qū)域分別命名為62-63,和111-114。這些區(qū)域或范圍的邊界包含在所述區(qū)域內(nèi)。
區(qū)域具體包括其包含的每個位置。例如,區(qū)域111-114具體包含位置111,112,113,114中的每一個。同樣的原則可類似地用于本發(fā)明所述的其它區(qū)域。
熱穩(wěn)定性為本發(fā)明的目的,術(shù)語熱穩(wěn)定在全文用于具體的多肽,指所述多肽的熔點溫度,即Tm,諸如利用Differential Scanning Calorimetry(DSC)在10mM磷酸鈉,50mM氯化鈉,pH 7.0,利用恒定掃描速率1.5℃/min測定的。
以下Tm在上述條件下測定76.5℃(蛋白酶10),83.0℃(蛋白酶18),78.3℃(蛋白酶08),76.6℃(蛋白酶35),73.7℃(蛋白酶11),和83.5℃(蛋白酶22)。
對于熱穩(wěn)定多肽,Tm為至少83.1℃。具體實施方案中,Tm至少84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或至少100℃。
可選,術(shù)語熱穩(wěn)定指熔點溫度為至少73.8,或至少76.7℃,或至少78.4℃,優(yōu)選至少74,75,76,77,78,79,80,81,82,或至少83℃,仍然利用DSC在pH 7.0測定。
為了測定Tm,通過SDS-PAGE測定純度至少90%(或91,92,93,94,95,96,97,or 98%)的多肽樣品可被使用。此外,酶樣品的濃度可為0.5-2.5mg/ml蛋白質(zhì)(或0.6-2.4,或0.7-2.2,或0.8-2.0mg/ml蛋白質(zhì)),如根據(jù)在280nm的吸光度以及基于從目的酶的氨基酸序列計算的消光系數(shù)測定的。
DSC在所需pH(例如pH 5.5,7.0,3.0,或2.5)發(fā)生,加熱速率恒定,例如1,1.5,2,3,4,5,6,7,8,9或10℃/min。
具體實施方案中,本發(fā)明的蛋白酶變體是熱穩(wěn)定的,優(yōu)選比親本蛋白酶的熱穩(wěn)定性更高。本發(fā)明中,優(yōu)選的親本蛋白酶是蛋白酶18,或蛋白酶10。
其它具體實施方案中,本發(fā)明蛋白酶變體的培養(yǎng)物上清被適宜稀釋,在65℃、利用0.1M檸檬酸滴定到i)pH 6.0,或ii)pH 4.0的0.2M Na2HPO4緩沖液中保溫4小時以后顯示殘余的活性為相對于未經(jīng)保溫的(冷凍的)對照的至少20%,所述活性利用Protazyme AK試驗在pH 8.5、37℃測定,如實施例2所述。在其它具體實施方案中,殘余的活性為至少25,30,35,40,45,50,55,60,65,70,75,或至少77%。
溫度活性圖譜具體實施方案中,本發(fā)明的蛋白酶變體顯示與例如蛋白酶10(或蛋白酶18,蛋白酶11,蛋白酶35,或蛋白酶08)相比的改變的溫度活性圖譜。例如,本發(fā)明的蛋白酶變體在pH 9、80℃顯示至少0.40,優(yōu)選至少0.45,0.50,0.55,0.60,0.65,0.70,0.75,0.80,0.85,0.90,或至少0.95的相對活性,術(shù)語“相對“指對目的蛋白酶測定的最大活性。對于蛋白酶22,所述活性是相對于在80℃的相對活性,其被設(shè)定為1.000(100%),對于蛋白酶10,在70℃的活性被設(shè)定為1.000(100%),見實施例3。作為另一實施例,本發(fā)明的蛋白酶變體在pH 9、90℃顯示至少0.10,優(yōu)選至少0.15,0.20,0.25,0.30,或至少0.35的相對活性。具體實施方案中,所述蛋白酶活性利用實施例1所述的Protazyme AK測定法測定。
低-過敏原性變體在特異的實施方案中,蛋白酶是低-過敏原的變體,設(shè)計成當(dāng)暴露于動物,包括人時,能產(chǎn)生減小的免疫反應(yīng)。術(shù)語免疫反應(yīng)可理解為經(jīng)暴露于蛋白酶的動物的免疫系統(tǒng)產(chǎn)生的任何反應(yīng)。免疫反應(yīng)的一個類型是在接觸的動物中導(dǎo)致IgE水平增加的變態(tài)反應(yīng)??衫帽绢I(lǐng)域已知的技術(shù)制備低-過敏原的變體。例如蛋白酶可與保護(hù)部分的聚合體部分或涉及免疫應(yīng)答的蛋白酶表位結(jié)合。與聚合體的結(jié)合作用可能涉及聚合體與蛋白酶的體外化學(xué)偶聯(lián),例如在WO 96/17929、WO 98/30682、WO 98/35026和/或WO99/00489所描述的。此外或備選地,結(jié)合作用可能另外涉及聚合體與蛋白酶的體內(nèi)偶聯(lián)??赏ㄟ^編碼蛋白酶的核苷酸序列的遺傳工程,在蛋白酶中插入編碼附加糖基化位點的共有序列,并且在能夠糖基化蛋白酶的宿主中表達(dá)蛋白酶而獲得這種結(jié)合作用,參見例如WO 00/26354。提供低過敏原變體的另一個方法是遺傳工程化編碼蛋白酶的核苷酸序列以導(dǎo)致蛋白酶自我寡聚化,影響可能遮蔽其它蛋白酶單體表位的蛋白酶單體,并且由此降低低聚物的抗原性。這種產(chǎn)物及其制劑在例如WO 96/16177中有描述??赏ㄟ^多種方法鑒定涉及免疫應(yīng)答的表位,例如在WO 00/26230和WO 01/83559中描述的噬菌體顯示方法,或在EP 561907中描述的隨機法。一旦已經(jīng)鑒定出表位,可改變其氨基酸序列以通過已知的基因操作技術(shù),例如定點誘變來產(chǎn)生免疫特性改變的蛋白酶(參見例如WO 00/26230、WO 00/26354和/或WO 00/22103),和/或可以以足夠的接近度使聚合體與表位進(jìn)行聚合體的結(jié)合作用而保護(hù)表位。
核酸序列和構(gòu)建體核酸構(gòu)建體本發(fā)明也涉及包括編碼本發(fā)明的蛋白酶變體的核酸序列的核酸序列。
如在此所使用的,術(shù)語″分離的核酸序列″是指基本上沒有其它核酸序列的核酸序列,例如通過瓊脂糖電泳所確定的,至少大約20%純、優(yōu)選至少大約40%純、更優(yōu)選至少大約60%純,更優(yōu)選至少大約80%純、以及最優(yōu)選至少大約90%純。例如,可通過用于遺傳工程以從其天然位置重新定位核酸序列至其可再生的不同位點的標(biāo)準(zhǔn)克隆方法來獲得分離的核酸序列。該克隆方法可包括切割和分離包括編碼多肽的核酸序列的所需核酸片段,將該片段插入到載體分子中,以及將重組載體整合到宿主細(xì)胞中,其中可復(fù)制該核酸序列的多個拷貝或克隆。該核酸序列可以是基因組、cDNA、RNA、半合成的、合成的起源、或其任何組合。
本發(fā)明的核酸序列可通過將至少一種突變導(dǎo)入親本蛋白酶編碼序列或其亞序列來制備,其中所述突變體核酸序列編碼變體蛋白酶。將突變導(dǎo)入核酸序列以將一種核苷酸交換為另一種核苷酸可通過定點誘病利用本領(lǐng)域已知的任何方法實現(xiàn),例如通過定點誘變,通過隨機誘變,或通過摻雜的(doped)、摻料的(spiked)或局部化的隨機誘變。
隨機誘變作為局部化的或區(qū)域特異性的隨機誘變在翻譯成所示目的氨基酸序列的基因的至少三個部分中或在整個基因內(nèi)適宜地進(jìn)行。當(dāng)所述誘變通過利用寡核苷酸進(jìn)行時,所述寡核苷酸可在合成位于將被改變的位置的寡核苷酸的過程中用三種非親本核苷酸摻雜的或摻料的??蛇M(jìn)行所述摻雜或摻料使得不需要的氨基酸的密碼子可被避免。所述摻雜的或摻料的寡核苷酸可通過任何技術(shù)利用例如PCR,LCR或任何被認(rèn)為合適的DNA聚合酶或連接酶摻入編碼蛋白酶的DNA。
優(yōu)選,所述的摻雜利用″恒定隨機摻雜″進(jìn)行,其中每個位置中的野生型和突變的百分比被預(yù)先確定。此外,所述摻雜可造成對導(dǎo)入具體核苷酸的偏好,并由此造成對一或多個具體氨基酸殘基的導(dǎo)入的偏好??蛇M(jìn)行摻雜例如使得允許在每個位置中導(dǎo)入90%的野生型和10%的突變。摻雜選擇方案中的其它考慮基于遺傳以及蛋白質(zhì)結(jié)構(gòu)的約束。
隨機誘變可優(yōu)選位于目的親本蛋白酶的一部分。這在例如當(dāng)酶的特定區(qū)域已經(jīng)被鑒定為對于該酶的給定性質(zhì)具有特定的重要性時是優(yōu)選的。
用于提供本發(fā)明變體的可選方法包括基因改組,例如WO 95/22625或WO 96/00343中所述,以及EP 897985中描述的共有序列衍生法(詳見″親本蛋白酶″部分)。
具體實施方案中,本發(fā)明的核酸不等同于(i)SEQ ID NO1的核苷酸900-1466,或900-1463,SEQ ID NO3的核苷酸499-1062,SEQ ID NO5的核苷酸,SEQ ID NO7的核苷酸496-1059,以及SEQ ID NO9的核苷酸502-1065;(ii)SEQ ID NO1的核苷酸900-1466;(iii)SEQ ID NO1的核苷酸900-1463;(iv)SEQ ID NO1的核苷酸900-1463,如DK 1996 00013中所述;(v)SEQ ID NO3的核苷酸499-1062;(vi)SEQ ID NO5的核苷酸496-1059;(vii)SEQ ID NO7的核苷酸496-1059;(viii)SEQ ID NO9的核苷酸502-1065;(xi)編碼源自達(dá)松維爾擬諾卡氏菌NRRL 18133的蛋白酶的成熟肽部分的核酸序列;(x)具有JP 2003284571-A中公開的SEQ ID NO1的核酸序列;(xi)核酸序列GENESEQN no.ADF43563;(xii)DK專利申請200400969中公開為SEQ ID NO1的核酸序列,具體是其成熟肽編碼部分;(xiii)DK專利申請200400969中公開為SEQ ID NO3的核酸序列,具體是其成熟肽編碼部分;(xiv)DK專利申請200400969中公開為SEQ ID NO5的核酸序列,具體是其成熟肽編碼部分;(xv)DK專利申請200400969中公開為SEQ ID NO7的核酸序列,具體是其成熟肽編碼部分;(xvi)DK專利申請2004 00969中公開為SEQ ID NO9的核酸序列,具體是其成熟肽編碼部分;(xvii)DK專利申請200400969中公開為SEQ ID NO11的核酸序列,具體是其成熟肽編碼部分;和/或(xviii)編碼與SEQ ID NO2的氨基酸1-188具有至少60%同一性的任何現(xiàn)有技術(shù)蛋白酶的核酸序列。
核酸構(gòu)建體核酸構(gòu)建體包含包括本發(fā)明的核酸序列,其中所述核酸序列與一個或多個指導(dǎo)編碼序列在合適的宿主細(xì)胞中在與調(diào)控序列相適合的條件下表達(dá)的控制序列進(jìn)行可操作地連接??衫斫獗磉_(dá)包括涉及產(chǎn)生多肽的步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。
表達(dá)載體編碼本發(fā)明蛋白酶的核酸變體可利用表達(dá)載體表達(dá),所述表達(dá)載體通常包括編碼啟動子,操縱子,核糖體結(jié)合位點,翻譯起始信號,以及可選阻遏基因或各種活化基因。
攜帶編碼本發(fā)明蛋白酶變體的DNA序列的重組表達(dá)載體可以是任何可方便地對其進(jìn)行重組DNA方法的載體,并且載體的選擇將通常依賴于其將被導(dǎo)入的宿主細(xì)胞。所述載體可以是這樣的載體,當(dāng)其被引入宿主細(xì)胞時,整合入宿主細(xì)胞基因組并與其整合進(jìn)入的染色體一起復(fù)制。
所述蛋白酶也可與至少一種其它目的動物飼料的酶共表達(dá),所述酶諸如α-淀粉酶,肌醇六磷酸酶(phylase),半乳聚糖酶(galactanase),木聚糖酶,內(nèi)切葡聚糖酶(endoglucanase),內(nèi)切-1,3(4)-β-葡聚糖酶,α-半乳糖苷酶(galactosidase)和/或蛋白酶。酶可以是從不同的載體、從1個載體,或利用兩種方法的混合而共表達(dá)的。當(dāng)利用不同的載體時,載體可能具有不同的可選擇標(biāo)記物和不同的復(fù)制原點。當(dāng)只利用1個載體時,可從一個或多個啟動子表達(dá)基因。如果在1個啟動子(二-或多-順反子)的調(diào)控下克隆,其中克隆基因的順序可能影響蛋白質(zhì)的表達(dá)水平。蛋白酶也可表達(dá)為融合蛋白質(zhì),即編碼蛋白酶的編碼已經(jīng)與編碼另一個蛋白質(zhì)的基因在框內(nèi)融合。該蛋白質(zhì)可以是另一個酶或來自另一個酶的功能域。
宿主細(xì)胞本發(fā)明也涉及包括本發(fā)明核酸序列的重組宿主細(xì)胞,其可有利地用于多肽的重組生產(chǎn)。將包括本發(fā)明核酸序列的載體導(dǎo)入宿主細(xì)胞以使得該載體保持作為染色體的整合部分或如早先所描述的作為染色體外自我復(fù)制的載體。術(shù)語″宿主細(xì)胞″包括由于復(fù)制期間發(fā)生突變而與親本細(xì)胞不相同的任何親本細(xì)胞的后代。宿主細(xì)胞的選擇在很大程度上取決于編碼多肽的基因及其來源。
所述宿主細(xì)胞可以是單細(xì)胞生物體,例如原核生物,或非單細(xì)胞生物體,例如真核細(xì)胞,諸如動物,哺乳動物,昆蟲或真菌細(xì)胞。優(yōu)選的動物細(xì)胞是非人動物細(xì)胞。
優(yōu)選的實施方案中,所述宿主細(xì)胞是真菌細(xì)胞,或酵母細(xì)胞,諸如假絲酵母屬(Candida)、漢遜氏酵母屬(Hansenula)、克魯維氏酵母屬(Kluyveromyces)、畢赤氏酵母屬(Pichia)、糖酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或Yarrowia細(xì)胞。真菌宿主細(xì)胞可以是絲狀真菌細(xì)胞,諸如枝頂孢屬(Acremonium)、曲霉屬(Aspergillus)、鐮刀菌屬(Fusarium)、腐殖菌屬(Humicola)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、脈孢菌屬(Neurospora)、青霉菌屬(Penicillium)、草根霉屬(Thielavia)、彎頸霉屬(Tolypocladium)或木霉屬(Trichoderma)的種的細(xì)胞,但不限于此。有用的單細(xì)胞是例如革蘭氏陽性細(xì)菌的細(xì)菌細(xì)胞,包括但不限于,芽胞桿菌屬細(xì)胞,例如,嗜堿性芽孢桿菌(Bacillusalkalophilus),解淀粉芽孢桿菌(Bacillus amyloliquefaciens),短小芽孢桿菌(Bacillus brevis),環(huán)狀芽孢桿菌(Bacillus circulans),Bacillus clausii,凝結(jié)芽孢桿菌(Bacillus coagulans),燦爛芽孢桿菌(Bacillus lautus),遲緩芽孢桿菌(Bacillus lentus),地衣芽孢桿菌(Bacillus licheniformis),巨大芽孢桿菌(Bacillus megaterium),嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus),枯草芽孢桿菌(Bacillus subtilis),和蘇云金芽孢桿菌(Bacillus thuringiensis),、或鏈霉菌屬細(xì)胞,諸如Streptomyces lividans或Streptomyces murinus,或擬諾卡氏菌屬細(xì)胞,或乳酸菌屬的細(xì)胞;或革蘭氏陰性細(xì)菌,例如大腸桿菌和假單胞菌種屬(pseudomonas sp.),乳酸菌包括但不限于乳球菌屬(Lactococcus)、乳桿菌屬(Lactobacillus)、明串珠菌屬(Leuconostoc)、鏈球菌屬(Streptcoccus)、小球菌屬(Pediococcus)和腸球菌屬(Enterococcus)的種。
制備方法本發(fā)明也涉及用于產(chǎn)生本發(fā)明蛋白酶變體的方法,包括(a)在有利于產(chǎn)生蛋白酶變體的條件下培養(yǎng)宿主細(xì)胞;以及(b)回收所述蛋白酶變體。
在本發(fā)明的生產(chǎn)方法中,在適于產(chǎn)生多肽的營養(yǎng)培養(yǎng)基中利用本領(lǐng)域已知的方法培養(yǎng)細(xì)胞。例如,可通過搖瓶培養(yǎng)、在實驗室或工業(yè)發(fā)酵罐中、在合適的培養(yǎng)基和在容許多肽表達(dá)和/或分離的條件下進(jìn)行小規(guī)模的或大規(guī)模的發(fā)酵(包括連續(xù)、分批、分批飼養(yǎng)、或固態(tài)發(fā)酵)而培養(yǎng)細(xì)胞。在包括碳和氮源和無機鹽的合適營養(yǎng)培養(yǎng)基中利用本領(lǐng)域已知的方法進(jìn)行培養(yǎng)??蓮墓?yīng)商獲得合適的培養(yǎng)基或可根據(jù)公開的組合物(例如,美國典型培養(yǎng)物保藏中心的目錄)制備合適的培養(yǎng)基。如果多肽分泌到營養(yǎng)培養(yǎng)基中,可直接從培養(yǎng)基回收多肽。如果多肽不分泌,可從細(xì)胞裂解物回收多肽。
可通過本領(lǐng)域已知的方法回收所得到的多肽。例如,可通過傳統(tǒng)方法從營養(yǎng)培養(yǎng)基回收多肽,包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。
可通過本領(lǐng)域已知的多種方法純化本發(fā)明的多肽,包括但不限于色譜法(例如,離子交換、親合、疏水性的、色譜聚焦、和大小排阻)、電泳方法(例如預(yù)備性的等電聚焦)、差異溶解度(例如,硫酸銨沉淀)、SDS-PAGE、或提取(參見例如Protein Purification,J.-C.Janson和Lars Ryden,編輯,VCHPublishers,紐約,1989)。
植物本發(fā)明也涉及轉(zhuǎn)基因植物、植物部分、或植物細(xì)胞,其已經(jīng)用編碼具有本發(fā)明的蛋白酶活性的多肽的核酸序列轉(zhuǎn)化以使得表達(dá)和產(chǎn)生可收回數(shù)量的多肽??蓮闹参锘蛑参锊糠只厥斩嚯?。備選地,包含重組多肽的植物或植物部分可用作改善食品或飼料的品質(zhì),例如改善營養(yǎng)價值、可口性(palatability)、和流變性,或破壞抗?fàn)I養(yǎng)因子。
在特定的實施方案中,該多肽指向種子中的胚乳貯存液泡。這可通過合成具有合適信號肽的前體而獲得,參見Horvath等人in PNAS,2000年2月15日,第97卷,no.4,第1914-1919頁。
轉(zhuǎn)基因的植物可以是雙子葉(雙子葉植物)或單子葉的(單子葉植物)或其改造的變體。單子葉植物的實例是草,例如草地早熟禾(meadow grass)(blue grass,早熟禾屬(Poa))、飼用牧草(forage grass),例如羊矛屬(Festuca)、黑麥草屬(Lolium)、寒地型牧草(temperate grass),例如剪股穎屬(Agrostis),以及谷類,例如小麥、燕麥、黑麥、大麥、水稻、高粱、triticale(小麥(Triticum)和黑麥(Secale)的穩(wěn)定的雜交體)和王蜀黍(玉米)。雙子葉植物的實例是煙草、豆類(legumes),例如向日葵(Helianthus)、棉花(Gossypium)、羽扇豆(lupin)、馬鈴薯、甜菜(sugar beet)、豌豆(pea)、菜豆(bean)和大豆(soybean),以及十字花科植物(Cruciferous)(十字花科(Brassicaceae)),例如花椰菜、油菜籽,以及緊密相關(guān)的模式生物體擬南芥(Arabidopsis thaliana)。如例如在美國專利號5,689,054和美國專利號6,111,168中所描述的低-肌醇六磷酸植物是工程化植物的實例。
雙子葉植物的實例是煙草、豆類,例如羽扇豆、馬鈴薯、甜菜、豌豆、菜豆和大豆,以及十字花科植物(十字花科),例如花椰菜、油菜籽,以及緊密相關(guān)的模式生物體擬南芥(Arabidopsis thaliana)。如例如在美國專利號5,689,054和美國專利號6,111,168中所描述的低-肌醇六磷酸植物是工程化植物的實例。植物部分的實例是莖干、愈傷組織、葉片、根、果實、種子和球根,以及包括這些部分的個別組織,例如表皮、葉肉、薄壁組織、維管組織、分生組織。也認(rèn)為特異的植物細(xì)胞隔室,例如葉綠體、質(zhì)外體、線粒體、液泡、過氧化物酶體和細(xì)胞質(zhì)是植物部分。此外,任何植物細(xì)胞,無論何種組織起源,都被認(rèn)為是植物部分。同樣地,也認(rèn)為例如有助于本發(fā)明應(yīng)用的分離的特異組織和細(xì)胞是植物部分,例如胚芽、胚乳、糊粉粒和種皮。
這些植物、植物部分和植物細(xì)胞的后代也包括在本發(fā)明的范圍內(nèi)。
可根據(jù)本領(lǐng)域已知的方法構(gòu)建表達(dá)本發(fā)明多肽的轉(zhuǎn)基因植物或植物細(xì)胞。簡而言之,通過將編碼本發(fā)明多肽的一個或多個表達(dá)構(gòu)建體整合到植物宿主基因組中構(gòu)建植物或植物細(xì)胞,并繁殖所得到的修飾植物或植物細(xì)胞成為轉(zhuǎn)基因植物或植物細(xì)胞。
便利地,表達(dá)構(gòu)建體是核酸構(gòu)建體,其包括與在選擇的植物或植物部分中為表達(dá)核酸序列所需要的適當(dāng)調(diào)控序列可操作連接的編碼本發(fā)明多肽的核酸序列。此外,表達(dá)構(gòu)建體可包括用于鑒定其中已經(jīng)整合入表達(dá)構(gòu)建體宿主細(xì)胞和為將構(gòu)建體導(dǎo)入所述植物必需的DNA序列的可選擇標(biāo)記物(后者取決于所使用的DNA導(dǎo)入方法)。
根據(jù)需要多肽在何時,何處以及如何表達(dá)來確定調(diào)控序列的選擇,例如啟動子和終止子序列以及任選的信號或轉(zhuǎn)運序列。例如,編碼本發(fā)明多肽的基因表達(dá)可以是組成性或可誘導(dǎo)的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可定向至例如種子或葉片的特異組織或植物部分。調(diào)控序列是例如Tague等人,1988,Plant Physiology 86506所描述的。
對于組成性的表達(dá),可使用下列可使用35S-CaMV啟動子(Franck等人,1980,Cell 21285-294)、玉米泛素1(Christensen AH,Sharrock RA和Quail 1992.Maize polyubiquitin genesstructure,thermal perturbation ofexpression and transcript splicing,and promoter activity following transfer toprotoplasts by electroporation)、或稻肌動蛋白1啟動子(Plant Mo.Biol.18,675-689.;Zhang W,McElroy D.和Wu R 1991,Analysis of rice Actl 5 aregionactivity in transgenic rice plants.Plant Cell 3,1155-1165)。器官特異性啟動子可以是例如,來自例如種子、馬鈴薯塊莖和果實的貯存庫(sink)組織的啟動子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24275-303)、或來自例如分生組織的代謝貯源組織的啟動子(Ito等人,1994,Plant Mol.Biol.24863-878),種子特異的啟動子,例如谷蛋白、醇溶谷蛋白、球蛋白、或來自稻的白蛋白啟動子(Wu等人,1998,Plant and Cell Physiology 39885-889)、來自豆球蛋白B4的蠶豆(Vicia faba)啟動子和來自蠶豆的未知種子蛋白質(zhì)基因(Conrad等人,1998,Journal of Plant Physiology 152708-711)、來自植物油體蛋白質(zhì)的啟動子(Chen等人,1998,Plant and Cell Physiology 39935-941)、來自蕓苔(Brassica napus)的貯存蛋白質(zhì)napA啟動子、或本領(lǐng)域已知的任何其它種子特異的啟動子,例如在WO 91/14772中所描述的。此外,啟動子可以是葉片特異的啟動子,例如來自水稻或番茄的rbcs啟動子(Kyozuka等人,1993,Plant Physiology 102991-1000,小球藻病毒腺嘌呤甲基轉(zhuǎn)移酶基因啟動子(Mitra和Higgins,1994,Plant Molecular Biology 2685-93)、或來自水稻的aldP基因啟動子(Kagaya等人,1995,Molecular andGeneral Genetics 248668-674)、或創(chuàng)傷可誘導(dǎo)的啟動子,例如馬鈴薯pin2啟動子(Xu等人,1993,Plant Molecular Biology 22573-588)。同樣,啟動子可以是通過非生物的處理,例如溫度、干旱或鹽堿度改變而可誘導(dǎo)的,或通過外部施用活化啟動子的物質(zhì),例如乙醇、雌激素、植物激素,如乙烯、脫落酸、赤霉酸和/或重金屬而進(jìn)行誘導(dǎo)。
也可使用啟動子增強子元件而在植物中獲得更高表達(dá)的蛋白酶。例如,啟動子增強子元件可以是置于啟動子和編碼本發(fā)明多肽的核苷酸序列之間的內(nèi)含子。例如,Xu等人,1993,上文公開了利用水稻肌動蛋白1基因的第一個內(nèi)含子以增強表達(dá)。
更進(jìn)一步地,可針對所述需要改善表達(dá)的植物品種優(yōu)化密碼子使用率(參見Horvath等人參考上文)。
可在本領(lǐng)域中選擇可利用的選擇性標(biāo)記基因和表達(dá)構(gòu)建體的任何其它部分。
根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)將核酸構(gòu)建體結(jié)合到植物基因組中,包括土壤桿菌-介導(dǎo)的轉(zhuǎn)化、病毒-介導(dǎo)的轉(zhuǎn)化、微注射、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等人,1990,Science 2441293;Potrykus,1990,Bio/Technology 8535;Shimamoto等人,1989,Nature 338274)。
目前,根瘤土壤桿菌-介導(dǎo)的基因轉(zhuǎn)移是選擇用于產(chǎn)生轉(zhuǎn)基因雙子葉植物的方法(關(guān)于綜述,參見Hooykas和Schilperoort,1992,Plant MolecularBiology 1915-38),并且它也可用于轉(zhuǎn)化單子葉植物,盡管對于這些植物其它的轉(zhuǎn)化方法一般是優(yōu)選的。目前,選擇用于產(chǎn)生轉(zhuǎn)基因單子葉植物的方法,補充土壤桿菌方法的是粒子轟擊(包被有轉(zhuǎn)化DNA的顯微黃金或鎢顆粒)胚愈傷組織或發(fā)育的胚芽(Christou,1992,Plant Journal 2275-281;Shimamoto,1994,Current Opinion Biotechnology5158-162;Vasil等人,1992,Bio/Technology 10667-674)。用于轉(zhuǎn)化單子葉植物的備選方法是基于如Omirulleh等人,1993,Plant Molecular Biology 21415-428所描述的原生質(zhì)體轉(zhuǎn)化。
轉(zhuǎn)化后,選擇其中已經(jīng)整合入表達(dá)構(gòu)建體的轉(zhuǎn)化體,并且根據(jù)本領(lǐng)域眾所周知的方法使其再生成為完全的植株。
本發(fā)明也涉及用于產(chǎn)生本發(fā)明多肽的方法,包括(a)在有利于產(chǎn)生多肽的條件下培養(yǎng)包括編碼具有本發(fā)明蛋白酶變體的核酸序列的轉(zhuǎn)基因植物或植物細(xì)胞;以及(b)回收該蛋白酶變體。
動物作為表達(dá)宿主本發(fā)明也涉及轉(zhuǎn)基因的非人動物和其產(chǎn)物或元件,其實例是例如乳汁和血液的體液、器官、肌肉和動物細(xì)胞。用于在例如哺乳動物細(xì)胞中表達(dá)蛋白質(zhì)的技術(shù)是本領(lǐng)域已知的,參見例如手冊Protein ExpressionA PracticalApproach,Higgins and Hames(編輯),Oxford University Press(1999),和其它3本該系列關(guān)于基因轉(zhuǎn)錄、RNA加工和翻譯后過程的手冊。一般說來,為了制備轉(zhuǎn)基因的動物,所選擇動物的選擇細(xì)胞是用編碼具有本發(fā)明蛋白酶活性的多肽的核酸序列轉(zhuǎn)化以便表達(dá)和產(chǎn)生該多肽??蓮膭游?,例如雌性動物的乳汁回收多肽,或表達(dá)該多肽可能對動物本身有益,例如有助于該動物的消化。下文在標(biāo)題為動物飼料和動物飼料添加劑的小節(jié)提及動物的實例。
考慮到從動物的乳汁回收蛋白酶,為了產(chǎn)生轉(zhuǎn)基因的動物,可將編碼蛋白酶變體的基因插入到所述動物的受精卵中,例如使用包括合適的乳蛋白啟動子和編碼蛋白酶的基因的轉(zhuǎn)基因表達(dá)載體。將轉(zhuǎn)基因表達(dá)載體微注射到受精卵中,并且優(yōu)選永久地整合到染色體中。一旦卵開始生長和分裂,將潛能胚胎植入到代孕母體中,并且鑒定攜帶轉(zhuǎn)基因的動物。因此可通過傳統(tǒng)的育種繁殖所得到的動物??蓮膭游锏娜橹兓嚯?,參見例如Meade,H.M.等人(1999)Expression of recombinant proteins in the milk of transgenicanimals,Gene expression systemsUsing nature for the art of expression.J.M.Fernandez and J.P.Hoeffler(編輯),Academic Press。
可選的,為了產(chǎn)生在其體和/或生殖細(xì)胞的基因組中攜帶核酸序列,包括包含編碼蛋白酶變體的轉(zhuǎn)基因的異種轉(zhuǎn)基因構(gòu)建體的轉(zhuǎn)基因非人動物,可如在WO 2000064247中所公開的,將轉(zhuǎn)基因與用于蛋白酶的唾液腺特異性表達(dá)的第一調(diào)控序列可操作地連接。
動物飼料和飼料添加劑術(shù)語動物包括所有的動物,包括人類。在特定的實施方案中,本發(fā)明蛋白酶變體和組合物可用作非人動物飼料添加劑。動物的實例是非反芻動物、和反芻動物,例如綿羊、山羊、馬和牛,例如肉用牛(beef cattle)、奶牛和仔牛犢。在特定的實施方案中,動物是非反芻動物動物。非反芻動物動物包括單胃動物,例如豬或家豬(swine)(包括但不限于,仔豬、生長豬和大母豬);家禽,例如火雞、鴨和雞(包括但不限于肉用小雞(broiler chicks)、產(chǎn)蛋雞(layer));仔牛犢;和魚(包括但不限于鮭魚(salmon)、鱒魚(trout)、羅非魚(tilapia)、鯰魚(catfish)和鯉魚(carps));以及甲殼類(包括但不限于蝦和對蝦)。
術(shù)語飼料或飼料組合物是指適于或旨在用于動物攝取的任何化合物、制劑、混合物、或組合物。可將飼料在日常飲食之前、之后或同時喂給動物。后者是優(yōu)選的。
本發(fā)明的組合物,意圖添加到動物飼料中時可稱為動物飼料添加劑。所述添加劑總是包含目的蛋白酶變體,優(yōu)選是穩(wěn)定化的液體或干燥組合物的形式。所述添加劑可包含動物飼料的其它組分或成分。所謂的動物飼料預(yù)混合物是所述的動物飼料添加劑的具體實例。預(yù)混合物可含有目的酶,以及其它至少一種維生素和/或至少一種礦物質(zhì)。
因此,在具體的實施方案中,除了組分多肽,本發(fā)明的組合物可包含或含有至少一種脂溶性維生素,和/或至少一種水溶性維生素,和/或至少一種痕量礦物質(zhì)。還包括至少一種大量礦物質(zhì)(macro mineral)。
脂溶性維生素的實例是維生素A、維生素D3、維生素E和維生素K,例如維生素K3。
水溶性維生素的實例是維生素B12、生物素和膽堿、維生素B1、維生素B2、維生素B6、煙酸、葉酸和泛酸(panthothenate)、例如Ca-D-泛酸。
微量礦物質(zhì)的實例是錳、鋅、鐵、銅、碘、硒和鈷。
大量礦物質(zhì)的實例是鈣、磷和鈉。
進(jìn)一步任選的,飼料-添加劑成分是著色劑,例如類胡蘿卜素諸如β-胡蘿卜素,蝦青素,和葉黃素(lutein);芳香族化合物、穩(wěn)定劑、多不飽和脂肪酸,活性氧產(chǎn)生種類、抗微生物的肽;和/或至少一種其他酶。
本發(fā)明的其它酶組分包括至少一種多肽,其具有淀粉酶,優(yōu)選α-淀粉酶活性,和/或至少一種具有木聚糖酶活性的多肽;和/或至少一種具有葡聚糖內(nèi)切酶活性的多肽;和/或至少一種具有內(nèi)切-1,3(4)-β-葡聚糖酶活性的多肽;和/或至少一種具有肌醇六磷酸酶活性的多肽;和/或至少一種具有半乳聚糖酶(galactanase)活性的多肽;和/或至少一種具有α-半乳糖苷酶活性的多肽;和/或至少一種其它具有蛋白酶活性的多肽(EC 3.4.-.-);和/或至少一種具有磷脂酶A1(EC 3.1.1.32),磷脂酶A2(EC 3.1.1.4),溶血磷脂酶(lysophospholipase)(EC 3.1.1.5),磷脂酶C(EC 3.1.4.3),和/或磷脂酶D(EC3.1.4.4)的多肽。
α-淀粉酶活性可如本領(lǐng)域已知測定,例如利用基于淀粉的底物。
木聚糖酶活性可利用任何測定法測定,其中采用的底物包括木聚糖中的1,4-β-D-木聚糖苷(xylosidic)內(nèi)切-連接。不同類型的底物可用于測定木聚糖酶活性,例如Xylazyme交聯(lián)的阿拉伯糖基木聚糖片(來自MegaZyme),或不可溶的粉末分散劑以及含氮-染色的阿拉伯糖基木聚糖的溶液。
內(nèi)切葡聚糖酶活性可利用本領(lǐng)域已知的任何內(nèi)切葡聚糖酶測定法測定。例如,可應(yīng)用各種含有纖維素或β-葡聚糖的底物。內(nèi)切葡聚糖酶測定法可利用AZCL-Barleyβ-葡聚糖,或優(yōu)選(1)AZCL-HE-纖維素,或(2)Azo-CM-纖維素作為底物。在兩種情況中,底物被降解后對其進(jìn)行在OD595的分光光度分析(參見用于AZCL-多糖的Megazyme法,其用于測定內(nèi)切水解酶,見http://www.megazyme.com/booklets/AZCLPOL.pdf)。
內(nèi)切-1,3(4)-β-葡聚糖酶活性可利用本領(lǐng)域已知的任何內(nèi)切-1,3(4)-β-葡聚糖酶測定法測定。用于內(nèi)切-1,3(4)-β-葡聚糖酶測定的優(yōu)選底物是交聯(lián)的含氮的、有顏色的β-葡聚糖Barley底物,其中所述測定基于分光光度測定原則。
肌醇六磷酸酶活性可利用任何適宜測定法測定,例如WO 98/28408的實施例4中描述的FYT測定法。
半乳聚糖酶可例如利用來自Megazyme的AZCL半乳聚糖測定,α-半乳糖苷酶可例如利用pNP-α-半乳糖苷測定。
為測定這些酶活性,測定法-pH和測定法-溫度應(yīng)調(diào)整為適于目的酶(優(yōu)選pH接近最佳pH的pH,接近最佳溫度的溫度)。優(yōu)選的測定法pH的范圍是2-10,優(yōu)選3-9,更優(yōu)選pH 3或4或5或6或7或8,例如pH 3或pH7。優(yōu)選的測定法溫度的范圍是20-90℃,優(yōu)選30-90℃,更優(yōu)選40-80℃,更優(yōu)選40-70℃,優(yōu)選40或45或50℃。所述酶活性通過參考適宜的盲性對照(blind)例如緩沖液盲性對照來定義。
抗微生物肽(AMP′s)的實例是CAP18、Leucocin A、Tritrpticin、protegrin-1、Thanatin、防衛(wèi)素(Defensin)、Lactoferrin、Lactoferricin和Ovispirin,例如Novispirin(Robert Lehrer,2000)、Plectasins、和抑制素(Statins),包括在WO 03/044049和WO 03/048148中公開的化合物和多肽,以及上述保持抗微生物活性的肽的變體或片段。
抗真菌多肽(AFP′s)的實例是巨大曲霉(Aspergillus giganteus),和黑曲霉(Aspergillus niger)肽,以及保持抗真菌活性的其變體和片段,如在WO 94/01459和WO 02/090384中所公開的。
多聚不飽和脂肪酸的實例是C18、C20和C22多聚不飽和脂肪酸,例如花生四烯酸、二十二碳六烯酸(docosohexaenoic acid)、二十碳五烯酸(eicosapentaenoic acid)和γ-亞油酸。
產(chǎn)生活性氧種類的實例是例如過硼酸鹽、過硫酸鹽、或過碳酸鹽的化學(xué)試劑;和例如氧化酶、加氧酶或合成酶。
通常脂溶或水溶性的維生素,以及微量礦物質(zhì)形成將加入飼料的所謂預(yù)混合料的部分,而通常將大量礦物質(zhì)單獨加入飼料。富集本發(fā)明蛋白酶的預(yù)混合料是本發(fā)明的動物飼料添加劑的實例。
在特定的實施方案中,本發(fā)明的動物飼料添加劑預(yù)期包括(或如必須包括時規(guī)定)在動物的日常飲食中,或以0.01至10.0%;更具體為0.05至5.0%;或0.2至1.0%的水平喂飼(%是指每100g飼料的g添加劑)。這特別地用于預(yù)混合料。
這些成分的營養(yǎng)需要量(以家禽和仔豬/豬例證)如WO 01/58275的表A所列。營養(yǎng)需要量是指在日常飲食中應(yīng)以指明的濃度提供這些成分。
可選的,本發(fā)明的動物飼料添加劑包括WO 01/58275的表A中列舉的至少一種單獨成分。在本文中,至少一種意味著任何一種、一種或多種、一種或2、或3、或4種等直到所有的13種、或直到所有的15種單獨成分。更具體地說,這個至少一種單一成分包括在本發(fā)明的添加劑中,其在飼料濃度中呈現(xiàn)的數(shù)量是在表A的第4欄、第5欄、或第6欄指明的范圍內(nèi)。
本發(fā)明也涉及動物飼料組合物。動物飼料組合物或日常飲食具有相對高含量的蛋白質(zhì)??扇鏦O 01/58275的表B中第2-3欄所指明的表征家禽和豬的調(diào)養(yǎng)飼料??扇缭摫鞡的第4欄中所指明的表征魚調(diào)養(yǎng)飼料。此外這種魚調(diào)養(yǎng)飼料通常具有200-310g/kg含量的粗脂肪。WO 01/58275對應(yīng)US 09/779334,其包含在本文作為參考。
本發(fā)明所述的動物飼料組合物具有50-800g/kg含量的粗蛋白,此外包括至少一種在此所要求保護(hù)的蛋白酶變體。
此外,或可選的(關(guān)于如上所述的粗蛋白含量),本發(fā)明的動物飼料組合物具有10-30MJ/kg的可代謝能量含量;和/或0.1-200g/kg的鈣含量;和/或0.1-200g/kg的有效磷含量;和/或0.1-100g/kg的甲硫氨酸含量;和/或0.1-150g/kg的甲硫氨酸加半胱氨酸含量;和/或0.5-50g/kg的賴氨酸含量。
在特定的實施方案中,代謝能量、粗蛋白、鈣、磷、甲硫氨酸、甲硫氨酸加半胱氨酸、和/或賴氨酸的含量是在WO 01/58275表B中第2、3、4或5中任何一項的范圍內(nèi)(R.2-5)。
通過將氮(N)乘以因子6.25來計算粗蛋白,即粗蛋白(g/kg)=N(g/kg)×6.25。通過Kjeldahl定氮法(A.O.A.C.,1984,Official Methods ofAnalysis第14版,Association of Official Analytical Chemists,Washington DC)確定含氮量。
可根據(jù)NRC出版物Nutrient requirements in swine,第9修訂版,1988,subcommittee on swine nutrition,committee on animal nutrition,board ofagriculture,national research council.National Academy Press,華盛頓,D.C.,第2-6頁,和用于家禽飼料-原料的能量值歐洲表,Spelderholt centre forpoultry research and extension,7361 DA Beekbergen,荷蘭,Grafisch bedrijfPonsen & looijen bv,Wageningen.ISBN 90-71463-12-5來計算可代謝能量。
根據(jù)例如Veevoedertabel 1997,gegevens over chemische samenstelling,verteerbaarheid en voederwaarde van voedermiddelen,Central Veevoederbureau,Runderweg 6,8219 pk Lelystad.ISBN 90-72839-13-7的飼料表來計算完全的動物調(diào)養(yǎng)飼料中的飲食性鈣、有效磷和氨基酸含量。
具體的實施方案中,本發(fā)明的動物飼料組合物含有至少一種蛋白。所述蛋白可以是動物蛋白,諸如肉和骨類粉,和/或魚粉(fish meal);或在具體實施方案中,其可以是植物蛋白質(zhì)。術(shù)語植物蛋白是指包括至少一種衍生自或起源于植物的蛋白質(zhì),包括修飾的蛋白質(zhì)和蛋白質(zhì)-衍生物的任何化合物、組合物、制劑或混合物。在特定的實施方案中,植物蛋白的蛋白質(zhì)含量是至少10、20、30、40、50、或60%(w/w)。
植物蛋白可衍生自植物蛋白來源,例如豆類和谷類,例如來自豆科(Fabaceae)(Leguminosae)、十字花科、藜科(Chenopodiaceae)、和禾本科(Poaceae)植物的材料,例如大豆粗粉、羽扇豆粗粉和油菜籽粉。
在特定的實施方案中,植物蛋白來源是來自一種或多種豆科植物,例如大豆、羽扇豆、豌豆或菜豆的材料。
在另一個特定的實施方案中,植物蛋白來源是來自一種或多種藜科植物,例如甜菜、制糖甜菜(sugar beet)、菠菜或奎藜籽(quinoa)的材料。
植物蛋白來源的其它實例是油菜籽,葵花籽,棉花籽和卷心菜。
大豆是優(yōu)選的植物蛋白來源。
植物蛋白來源的其它實例是谷類,例如大麥、小麥、黑麥、燕麥、王蜀黍(玉米)、稻(rice),triticale,和高粱。
在更進(jìn)一步的特定實施方案中,本發(fā)明的動物飼料組合物包含0-80%的玉米;和/或0-80%的高粱;和/或0-70%的小麥;和/或0-70%的大麥;和/或0-30%的燕麥;和/或0-40%的大豆粉;和/或0-10%的魚粉;0-25%肉和骨粉;和/或0-20%的乳清。
可將動物膳食(diet)制備成例如粉料(mash feed)(非顆粒)或顆粒(pelleted)飼料。一般地,混合碾磨的飼料-原料并且根據(jù)所述種屬的規(guī)格加入足夠數(shù)量的必需維生素和礦物質(zhì)??杉尤牍腆w的酶或液體酶制劑。例如,一般在混合步驟前或在混合期間加入固體酶制劑;而一般在壓丸(pelleting)步驟后加入液體酶制劑。也可將酶摻入到飼料添加劑或預(yù)混合料中。
膳食中的最終酶濃度是在每kg膳食0.01-200mg酶蛋白的范圍內(nèi),例如在每kg動物膳食0.5-25mg酶蛋白的范圍內(nèi)。
當(dāng)然應(yīng)該以有效量施加蛋白酶,即足夠用于改善溶解作用和/或增加飼料的營養(yǎng)價值的數(shù)量。目前預(yù)期施用酶的一種或多種數(shù)量如下(劑量范圍)0.01-200;0.01-100;0.5-100;1-50;5-100;10-100;0.05-50;或0.10-10,所有這些范圍是每kg飼料的mg蛋白酶的酶蛋白質(zhì)(ppm)。
為了確定每kg飼料的mg酶蛋白,從飼料組合物純化蛋白酶,利用相應(yīng)的分析確定純化蛋白酶的特異活性(見下面蛋白酶活性,底物和分析)。利用相同的分析也因而確定飼料組合物的蛋白酶活性,并且根據(jù)這2個測定,計算每kg飼料的mg酶蛋白方式的劑量。
將相同的原則用于確定飼料添加劑中的mg酶蛋白。當(dāng)然,如果可得到用于制備飼料添加劑或飼料的蛋白酶的樣品,由此樣品確定特異活性(不必從飼料組合物或添加劑純化蛋白酶)。
清潔劑組合物本發(fā)明的蛋白酶變體可加入清潔劑組合物并且因此成為清潔劑組合物的組分。
可將本發(fā)明的清潔劑組合物例如配制成為手洗或機洗清潔劑組合物,其包括適于預(yù)處理染色織物和漂洗加入的織物軟化劑組合物的洗滌添加劑組合物,或配制成為供普通家庭的硬表面清洗操作之用的清潔劑組合物,配制用于手工或機械洗滌的操作。
在特定的方面,本發(fā)明提供包括本發(fā)明蛋白酶的去污添加劑。去垢添加劑以及清潔劑組合物可包括一種或多種其它的酶,諸如其它蛋白酶,例如來自芽子包桿菌屬堿性蛋白酶脂肪酶、角質(zhì)酶、淀粉酶、糖酶、纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、和/或過氧化物酶。
總的來說,所選擇的酶的特性應(yīng)與所選擇的清潔劑相適合,(即最適pH,與其它酶促或非酶促成分的相容性等),并且該酶應(yīng)以有效量存在。
合適的脂肪酶包括細(xì)菌或真菌起源的脂肪酶。包括化學(xué)上改進(jìn)或蛋白質(zhì)工程化的突變體。有用脂肪酶的實例包括來自腐殖菌屬(同義語Thermomyces)的脂肪酶,例如來自如EP 258068和EP 305216中所描述的H.lanuginosa(T.lanuginosus)的脂肪酶,或來自如WO 96/13580中所描述的H.insolens的脂肪酶,假單胞菌屬(Pseudomonas)脂肪酶,例如來自產(chǎn)堿桿菌假單胞菌(P.alcaligenes)或類產(chǎn)堿桿菌假單胞菌(P.pseudoalcaligenes)(EP 218272)、洋蔥假單胞菌(P.cepacia)(EP 331376)、施氏假單胞菌(P.stutzeri)(GB 1,372,034)、熒光假單胞菌(P.fluorescens)、假單胞菌種菌株SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO96/12012)的脂肪酶,芽胞桿菌屬脂肪酶,例如來自枯草芽胞桿菌(Dartois等人(1993),Biochemica et biophysica Acta,1131,253-360)、嗜熱脂肪芽孢桿菌(JP 64/744992)或短小芽胞桿菌(B.pumilus)(WO 91/16422)的脂肪酶。其它的實例是,例如在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的脂肪酶變體。優(yōu)選的可商業(yè)購買的脂肪酶包括LipolaseTM和LipolaseUltraTM(Novozymes A/S)。
合適的淀粉酶(α-和/或β-)包括細(xì)菌或真菌起源的淀粉酶。包括化學(xué)上改進(jìn)或蛋白質(zhì)工程化的突變體。淀粉酶包括例如,從芽胞桿菌屬,例如地衣芽孢桿菌(B.licheniformis)的特殊菌株獲得的α-淀粉酶,其在GB 1,296,839中有詳細(xì)描述。有用淀粉酶的實例是在WO 94/02597、WO 94/18314、WO 96/23873、和WO 97/43424中描述的變體,特別是在下列一個或多個位置中有取代15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444??缮虡I(yè)購買的淀粉酶是NatalaseTM,SupramylTM,StainzymeTM,DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S)、RapidaseTM和PurastarTM(來自Genencor International Inc.)。
合適的纖維素酶包括細(xì)菌或真菌起源的纖維素酶。包括化學(xué)上改進(jìn)或蛋白質(zhì)工程化的突變體。合適的纖維素酶包括來自芽胞桿菌屬、假單胞菌屬、腐殖菌屬、鐮刀菌屬、草根霉屬(Thielavia)、枝頂孢屬(Acremonium)的纖維素酶,例如由US 4,435,307、US 5,648,263、US 5,691,178,US 5,776,757和WO89/09259中公開的Humicola insolens、嗜熱毀絲霉(myceliophthorathermophila)和尖孢鐮孢(Fusarium oxysporum)產(chǎn)生的真菌纖維素酶。特別合適的纖維素酶是具有顏色引人注意的好處(color care benefit)的堿性或中性的纖維素酶。這種纖維素酶的實例是在EP 0 495257、EP 531372、WO96/11262、WO 96/29397、WO 98/08940中描述的纖維素酶。其它的實例是例如在WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO98/12307和WO 99/01544中描述的纖維素酶變體??缮虡I(yè)購買的纖維素酶包括CelluzymeTM、和CarezymeTM(Novozymes A/S)、ClazinaseTM、和Puradax HATM(Genencor International Inc.)、和KAC-500(B)TM(Kao Corporation)。
合適的過氧化物酶/氧化酶包括植物、細(xì)菌或真菌起源的酶。包括化學(xué)上改進(jìn)或蛋白質(zhì)工程化的突變體。有用的過氧化物酶的實例包括來自鬼傘菌(Coprinus),例如灰蓋鬼傘(C.cinereus)的過氧化物酶,以及在WO93/24618、WO 95/10602和WO 98/15257中描述的其變體??缮虡I(yè)購買的過氧化物酶包括GuardzymeTM(Novozymes)。
可通過加入包含一種或多種酶的單獨添加劑,或通過加入包括所有這些酶的組合添加劑使清潔劑酶包括在清潔劑組合物中。例如可以顆粒、液體、勻漿等的形式配制本發(fā)明的去垢添加劑,即單獨的添加劑或組合添加劑。優(yōu)選的去垢添加劑制劑是顆粒,特別是無粉塵的顆粒、液體,特別是穩(wěn)定的液體、或勻漿。
可如在US 4,106,991和4,661,452中公開的生產(chǎn)無粉塵的顆粒,并且可通過本領(lǐng)域已知的方法任選進(jìn)行涂層。蠟狀涂層材料的實例是平均摩爾量為1000至20000的聚(環(huán)氧乙烷)產(chǎn)物(聚乙二醇,PEG);具有16至50個環(huán)氧乙烷單元的乙氧基壬基酚;其中包含12至20個碳原子并且存在15至80個環(huán)氧乙烷單位的乙氧基脂肪醇;脂肪醇;脂肪酸;以及脂肪酸的單和雙和三酸甘油酯。在GB 1483591中給出了適于通過流化床技術(shù)應(yīng)用的成膜涂層材料的實例。可根據(jù)已建立的方法,通過加入多元醇,例如丙二醇,糖或糖醇、乳酸或硼酸穩(wěn)定液體酶制劑??筛鶕?jù)EP 238216中公開的方法制備保護(hù)酶。
本發(fā)明的清潔劑組合物可以是任何便利的形式,例如棒狀、片劑、粉劑、顆粒、糊劑或液體。液體洗滌劑可以是含水的,一般包含達(dá)到70%的水和0-30%的有機溶劑,或是無水的。
清潔劑組合物包括一種或多種表面活性劑,其可以是非離子的,包括半極性的和/或陰離子和/或陽離子和/或兩性離子的。表面活性劑一般以按重量計0.1%至60%的水平存在。
當(dāng)包括在其中時,清潔劑通常包含大約1%至大約40%的陰離子表面活性劑,例如直鏈烷基苯磺酸鹽、α-烯烴磺酸鹽、烷基硫酸鹽(脂肪醇硫酸酯(fatty alcohol sulfate))、脂肪醇乙氧基硫酸酯、仲烷基磺酸鹽、α-磺基脂肪酸甲酯、烷基或烯基丁二酸(alkenylsuccinic acid)或肥皂。
當(dāng)包括在其中時,清潔劑通常包含大約0.2%至大約40%的非離子型表面活性劑,例如脂肪醇乙氧基化合物、壬基苯酚乙氧基化物、烷基多苷、烷基二甲基胺氧化物、乙氧基脂肪酸單乙醇酰胺、脂肪酸單乙醇酰胺、聚羥基烷基脂肪酸酰胺、或葡糖胺的N-?;鵑-烷基衍生物(″葡糖酰胺″)。
清潔劑可能包含0-65%的清潔劑增效助劑或絡(luò)合劑,例如沸石、二磷酸、三磷酸、膦酸酯(phosphonate)、碳酸酯、檸檬酸酯、次氮基三乙酸(氨三乙酸)、乙二胺四乙酸、二乙撐三胺五乙酸、烷基或烯基丁二酸、可溶性硅酸鹽或分層的硅酸鹽(例如來自Hoechst的SKS-6)。
清潔劑可包括一種或多種聚合物。實例是羧甲基纖維素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯基咪唑)、聚羧酸酯,例如聚丙烯酸酯、馬來酸/丙烯酸酯共聚合物和甲基丙烯酸月桂酯/丙烯酸酯共聚合物。
清潔劑可能包含包括H2O2來源的漂白系統(tǒng),例如可與過酸形式的漂白活化劑,例如四乙?;叶坊蛉甚;椒踊撬猁}(nonanoyloxybenzenesulfonate)結(jié)合的過硼酸鹽或過碳酸鹽。備選地,漂白系統(tǒng)可包括例如酰胺、二酰亞胺、或砜類型的過氧酸。
可利用傳統(tǒng)的穩(wěn)定劑,例如多元醇,例如丙二醇或甘油,糖或糖醇、乳酸、硼酸、或硼酸衍生物,例如芳族的硼酸酯、或苯基硼酸衍生物,例如4-甲?;交鹚醽矸€(wěn)定本發(fā)明的清潔劑組合物的酶,并且可如例如WO 92/19709和WO 92/19708中所述的配制組合物。
清潔劑也可包含其它的傳統(tǒng)清潔劑成分,例如織物調(diào)節(jié)劑,包括粘土、發(fā)泡劑、抑泡劑、防腐劑、污垢懸浮劑、抗污垢再沉積試劑、染料、殺菌劑、熒光增白劑、水溶增溶劑、晦暗抑制劑或芳香劑。
目前預(yù)期在清潔劑組合物中,可加入相當(dāng)于每升洗滌溶液0.01-100mg酶蛋白的數(shù)量的任何酶,特別是本發(fā)明的酶,優(yōu)選每升洗滌溶液0.05-5mg的酶蛋白,特別是每升洗滌溶液0.1-1mg的酶蛋白。
可將本發(fā)明的酶另外摻入在WO 97/07202中公開的清潔劑制劑。
產(chǎn)生蛋白酶變體的方法本發(fā)明涉及產(chǎn)生具有改進(jìn)的性質(zhì)的蛋白酶變體的方法,所述方法包括以下步驟(a)選出與SEQ ID NO2的氨基酸1-188具有至少60%同一性的親本蛋白酶;(b)通過同源性模型利用圖2所示結(jié)構(gòu)作為模型確定所述親本蛋白酶的3D結(jié)構(gòu);和/或根據(jù)圖1的比對,對親本蛋白酶進(jìn)行比對;(c)建議至少一種氨基酸取代,例如通過(i)在升高的溫度,對(b)的3D結(jié)構(gòu)進(jìn)行MD模擬,并鑒定高移動性(各向同性波動)的親本蛋白酶的氨基酸序列中的區(qū)域;(ii)通過半胱氨酸取代(C-C)導(dǎo)入二硫橋;(iii)導(dǎo)入脯氨酸取代(P);(iv)用帶負(fù)電的氨基酸殘基(E,D)取代暴露的中性氨基酸殘基;(v)用帶正電的氨基酸殘基(R,K)取代暴露的中性氨基酸殘基;(vi)用體積較大的氨基酸殘基(W)取代蛋白質(zhì)內(nèi)部的小氨基酸殘基;(vii)通過同源性比對和/或同源性模仿(modelling),根據(jù)步驟(c)(i)比較至少兩種相關(guān)的親本蛋白酶,并轉(zhuǎn)移這些蛋白酶主鏈之間的氨基酸殘基差異,優(yōu)選來自改進(jìn)的性質(zhì)的主鏈,其與不具有改進(jìn)的性質(zhì)的主鏈相比具有改進(jìn)的性質(zhì);(d)制備編碼包含至少一種氨基酸取代的親本蛋白酶的DNA序列,所述氨基酸取代是步驟(c)(ii)-(c)(vii)中所述的,或?qū)λ鲇H本DNA序列進(jìn)行隨機誘變,靶向步驟(c)(i)中鑒定的至少一個區(qū)域;(e)在宿主細(xì)胞中表達(dá)步驟(d)所得的DNA序列,和
(h)選擇表達(dá)具有改進(jìn)的形式的蛋白酶變體的宿主細(xì)胞。
本發(fā)明還涉及制備可通過或通過上述產(chǎn)生蛋白酶變體的方法獲得的蛋白酶變體的方法,包括(a)培養(yǎng)所述宿主細(xì)胞以產(chǎn)生包含所述變體的上清;和(b)回收所述變體。
本發(fā)明還涉及分離包含編碼可通過本發(fā)明的方法獲得的蛋白酶變體的核酸序列的分離的核酸序列,以及制備其的方法(a)培養(yǎng)所述宿主細(xì)胞以產(chǎn)生包含所述變體的上清;和(b)回收所述變體;轉(zhuǎn)基因植物或植物部分,能夠表達(dá)所述變體;轉(zhuǎn)基因,非人動物或其產(chǎn)物或組分,它們能夠表達(dá)變體;動物飼料以及動物飼料添加物,它們包含所述變體;通過其使用改進(jìn)動物飼料營養(yǎng)價值的方法,通過其使用處理蛋白質(zhì)諸如植物蛋白的方法;以及其在(i)動物飼料中;(ii)動物飼料的制備中;(iii)用于改進(jìn)動物飼料的營養(yǎng)價值;和/或(iv)用于處理蛋白質(zhì);和/或在清潔劑中的用途。
可選實施方案在可選實施方案中,使用術(shù)語“改變”替代“取代”作為蛋白質(zhì)分子中改變的通常用語。該可選實施方案包括為舉例說明權(quán)利要求1的每個權(quán)利要求,并具體包括本文所述的任何內(nèi)容,例如定義(除了取代的定義),即各個方面,具體的實施方案等。
親本蛋白酶的變體,其包含選自以下區(qū)域組成的組的至少一個區(qū)域的至少一個位置中的改變6-18;22-28;32-39;42-58;62-63;66-76;78-100;103-106;111-114;118-131;134-136;139-141;144-151;155-156;160-176;179-181;和184-188;其中(a)所述改變獨立地是(i)緊鄰所述位置下游的氨基酸插入,(ii)占據(jù)所述位置的氨基酸的缺失,和/或(iii)占據(jù)所述位置的氨基酸的取代;(b)所述變體具有蛋白酶活性;和(c)每個位置對應(yīng)SEQ ID NO2,優(yōu)選其氨基酸1-188的位置;和(d)所述變體與SEQ ID NO2,優(yōu)選其氨基酸1-188具有至少60%的同一性百分比。
術(shù)語“多肽變體”,“蛋白質(zhì)變體”,“酶變體”,“蛋白酶變體”或僅僅“變體“指本發(fā)明的多肽,其包含位于所述多肽的一或多個具體位置中的一或多種改變,諸如取代,插入,缺失,和/或截短。
術(shù)語“親本多肽”,“親本蛋白”,“親本酶”,“標(biāo)準(zhǔn)酶”,“親本蛋白酶”或僅僅“親本”指作為變體的基礎(chǔ)的多肽。該術(shù)語還指與變體進(jìn)行比較和比對的多肽。
術(shù)語“隨機化的文庫”,“變體文庫”,或僅僅“文庫”指變體多肽的文庫。變體文庫中的多樣性可通過在DNA三聯(lián)體的水平對編碼所述變體的基因進(jìn)行誘變產(chǎn)生,使得個體密碼子例如通過使用PCR反應(yīng)中部分隨機化的序列的引物來多樣化。描述了多種技術(shù),通過所述技術(shù)可通過多樣化基因中的數(shù)個核苷酸位置并重組它們產(chǎn)生多樣化重組文庫,例如其中這些位置相隔太遠(yuǎn)而不能被單個(摻料的或摻雜的)寡核苷酸引物覆蓋。這些技術(shù)包括各個多樣化的基因片段的體內(nèi)重組的利用,如WO 97/07205中第3頁,8-29行(Novozymes A/S)所述。它們也包括利用DNA改組技術(shù)產(chǎn)生全長基因文庫,其中多種基因片段被組合,且其中每個片段可例如通過摻料的誘變多樣化(Stemmer,Nature 370,pp.389-391,1994和US 5,811,238;US 5,605,793;和US 5,830,721)。可利用編碼蛋白質(zhì)“骨架”(野生型親本多肽)的基因作為模板多核苷酸,并將其于一或多種單鏈或雙鏈寡核苷酸組合,如WO98/41623和WO 98/41622(Novozymes A/S)所述。單鏈寡核苷酸可在合成過程中部分隨機化。雙鏈寡核苷酸可為PCR產(chǎn)物,在具體的區(qū)域中包含多樣性。所述情況中,可利用編碼骨架蛋白序列的相應(yīng)片段稀釋多樣性,以限制導(dǎo)入的改變的平均數(shù)目。
已經(jīng)確定了設(shè)計將在寡核苷酸或多核苷酸的合成過程中被插入具體密碼子位置中的核苷酸混合物(A;C;T;G)的方法,以導(dǎo)入偏向性,導(dǎo)致針對由具體密碼子編碼的一或多個所需氨基酸的組的大約所需的頻率分布。目的是產(chǎn)生變體文庫,其包含所述多肽一級序列中不同位置的多個已知氨基酸修飾的改變。這可在翻譯后導(dǎo)入,或通過化學(xué)修飾位點,或它們可通過編碼基因中的突變而被導(dǎo)入。所述修飾本身已經(jīng)被證實由于一種或其它原因而有益(例如降低抗原性,或改進(jìn)具體的活性,性能,穩(wěn)定性或其它特征)。在所述情況中,需要首先產(chǎn)生已知序列的多種組合的文庫。例如,如果已知12種單獨的突變,可結(jié)合親本蛋白編碼基因的(至少)12個片段,其中每個片段以兩種形式存在一種含有而另一種不含有所需的突變。通過改變那些片段的相對量,可設(shè)計文庫(大小212),其中每個基因的突變平均數(shù)可預(yù)測。這是組合突變的有用方法,它們本身產(chǎn)生一些,但是并非足夠的效果,而無需對于非常大的文庫進(jìn)行分選,后者是利用“摻料的誘變”(spiked mutagenesis)時通常的情況。另一種結(jié)合這些“已知突變”的方法是通過利用編碼已知突變的寡聚DNA的家族改組,所述DNA具有全長野生型的序列。
在根據(jù)本發(fā)明產(chǎn)生的或本發(fā)明涉及的各種變體的描述中,多種命名法以及所用常規(guī)方法下有詳細(xì)描述。參比的框架首先通過將變體多肽與親本酶進(jìn)行比對來定義。優(yōu)選的親本酶是蛋白酶10(SEQ ID NO21的氨基酸1-188)。優(yōu)選多種突變可根據(jù)SEQ ID NO21的氨基酸1-188的氨基酸序列定義。
變體中的取代表示為原始氨基酸-位置-取代的氨基酸;使用三字母或一字母編碼,包括編碼Xaa和X,表示任何氨基酸殘基。因此,術(shù)語”T82S”或”Thr82Ser”指,所述變體包含絲氨酸對蘇氨酸的取代,其中變體氨基酸位置中的絲氨酸相應(yīng)于親本酶中的位置82中的氨基酸,其中這兩種氨基酸如上述進(jìn)行比對。
如果原始氨基酸可以是任何氨基酸殘基,短注釋有時可用于僅僅表示位置,以及取代的氨基酸,例如位置-取代的氨基酸;或”82S”,所述注釋與一系列同源多肽尤其相關(guān)。
類似地,當(dāng)取代用氨基酸殘基的同一性不重要(immaterial)時原始氨基酸-位置;或”T82”當(dāng)原始氨基酸和取代的氨基酸為任何氨基酸,僅僅指示位置,例如”82”。
當(dāng)原始氨基酸和/或取代的氨基酸可包括超過一個,但不是全部氨基酸時,氨基酸通過逗號分開列出原始氨基酸-位置號-取代的氨基酸;或”T10E,D,Y”。
該命名法的多個實例如下所示蘇氨酸取代位置91中的組氨酸稱為”His91Thr”或”H91T”;或任何氨基酸殘基取代位置91中的組氨酸稱為”His91Xaa”或”H91X”或”His91”或”H91”。
對于其中原始氨基酸和/或取代的氨基酸可包含超過一個,但不是全部氨基酸的修飾,谷氨酸、天門冬氨酸或酪氨酸對于位置10中的蘇氨酸的取代”Thr10Glu,Asp,Tyr”或”T10E,D,Y”;其表示具體的變體”T10E”,”T10D”,和”T10Y”。
位置26中甘氨酸的缺失表示為”Gly26*”或”G26*”因此,超過一個氨基酸殘基的缺失,諸如位置26和27中的甘氨酸和谷氨酰胺的缺失稱為”Gly26*+Gln27*”或”G26*+Q27*”其它氨基酸殘基諸如賴氨酸在G26之后的插入表示為”Gly26GlyLys”或”G26GK”;或,當(dāng)將超過一個氨基酸殘基諸如賴氨酸和Ala插入G26之后,表示為”Gly26GlyLysAla”或”G26GKA”。
在這些情況中,插入的氨基酸殘基通過加入到被插入的氨基酸殘基以前的氨基酸殘基的位置編號的小寫字母(lower case letters)來編號。上述實例中,所述序列為親本 變體26 26 26a 26bGG K A如果與現(xiàn)有氨基酸殘基相同的殘基被插入,很清楚命名法中出現(xiàn)簡并性。例如如果甘氨酸被插入上述實例中的甘氨酸之后,則表示為”G26GG”。
由于丙氨酸存在于位置25,相同的實際改變可僅表示為”A25AG”親本 變體編號I25 26 25 26 26a序列 AGAGG編號II 25 25a 26所述情況對于本領(lǐng)域技術(shù)人員而言顯而易見,”G26GG”和相應(yīng)用于表示該類型插入的表示法由此包含等同的簡并性表示法。
通過類比,如果氨基酸序列片段在親本多肽和/或在變體中重復(fù),本領(lǐng)域技術(shù)人員顯而易見可包括等同的簡并性指征,當(dāng)其它改變而非所列插入諸如缺失和/或取代時也如此。例如,“AGAG”中兩個連續(xù)氨基酸“AG”從位置194-197的序列“AGAG”的缺失可記為“A194*+G1956*”或“A196*+G197*”親本 變體編號I194 195 196 197 194 195序列 AGAGAG編號II 196 197包含多種修飾的變體通過加號分離,例如“Arg170Tyr+Gly195Glu”或“R170Y+G195E”,其代表在位置170和195用酪氨酸和谷氨酸分別取代精氨酸和甘氨酸的修飾。因此,“Tyr167Gly,Ala,Ser,Thr+Arg170Gly,Ala,Ser,Thr”命名了以下變體“Tyr167Gly+Arg170Gly”,“Tyr167Gly+Arg170Ala”,“Tyr167Gly+Arg170Ser”,“Tyr167Gly+Arg170Thr”,“Tyr167Ala+Arg170Gly”,“Tyr167Ala+Arg170Ala”,“Tyr167Ala+Arg170Ser”,“Tyr167Ala+Arg170Thr”,“Tyr167Ser+Arg170Gly”,“Tyr167Ser+Arg170Ala”,“Tyr167Ser+Arg170Ser”,“Tyr167Ser+Arg170Thr”,“Tyr167Thr+Arg170Gly”,“Tyr167Thr+Arg170Ala”,“Tyr167Thr+Arg170Ser”,和“Tyr167Thr+Arg170Thr”。
該命名法具體涉及目的在于具有特定共同性質(zhì)的氨基酸殘基的取代,插入或缺失的修飾,所述修飾稱為保守氨基酸修飾。
各種實施方案以下是本發(fā)明的其它各種實施方案權(quán)利要求1-16和18-20之一的變體,其包含以下取代中的至少一種T10Y,A24S,V51T, E53Q,T82S,A86Q,T87S,I96A,G118N,S122R,N130S,L186I。
權(quán)利要求1-16和18-19之一的變體,其包含以下取代中的至少一種R38T;Q42G,P;R49T,Q;Q54N,R;A89S,T;H91S,T;N92S;S99A,Q;A120T;E125Q;T129Y,Q;M131L;T135N;Y147F;N151S;R165S;T166V,F(xiàn);F171Y;V179I,L;優(yōu)選以下取代中的至少一種R38T;N92S;A120T;E125Q;M131L;T135N;Y147F;N151S;R165S;和/或F171Y。
權(quán)利要求1-19之一的變體,其包含以下取代中的至少一種A25S,T44S,A62S,P95A,V100I,I114V,T176N,N180S,V184L,R185T。
權(quán)利要求1-20之一的變體,其具有改變的性質(zhì),諸如改進(jìn)的熱穩(wěn)定性和/或較高或較低的最佳溫度,諸如至少83.1℃的Tm,如通過DSC在10mM磷酸鈉,50mM氯化鈉,pH7.0中測定的那樣。
權(quán)利要求1-20之一的變體,其源自擬諾卡氏菌菌株,諸如Nocardiopsisalba,Nocardiopsis antarctica,Nocardiopsis prasina,Nocardiopsis composta,達(dá)松維爾擬諾卡氏菌,Nocardiopsis exhalans,Nocardiopsis halophila,Nocardiopsis halotolerans,Nocardiopsis kunsanensis,Nocardiopsis listeri,Nocardiopsis lucentensis,Nocardiopsis metallicus,Nocardiopsis sp.,Nocardiopsis synnemataformans,Nocardiopsis trehalosi,Nocardiopsis tropica,Nocardiopsis umidischolae,or Nocardiopsis xinjiangensis,優(yōu)選Nocardiopsisalba DSM 15647,達(dá)松維爾擬諾卡氏菌NRRL 18133,達(dá)松維爾擬諾卡氏菌亞種達(dá)松維爾(dassonvillei)DSM 43235,Nocardiopsis prasina DSM 15648,Nocardiopsis prasina DSM 15649,擬諾卡氏菌屬NRRL 18262,最優(yōu)選擬諾卡氏菌FERMP-18676。
組合物,諸如動物飼料添加劑,包括權(quán)利要求1-20之一的至少一種蛋白酶變體,和(a)至少一種脂溶性維生素;(b)至少一種水溶性維生素;和/或(c)至少一種痕量礦物質(zhì),可選還包含至少一種酶,其選自以下酶組成的組淀粉酶,半乳聚糖酶,α-半乳糖苷酶,木聚糖酶,內(nèi)切葡聚糖酶,內(nèi)切-1,3(4)-β-葡聚糖酶,肌醇六磷酸酶(phytase),磷脂酶,以及其它蛋白酶;如果需要還包含至少一種淀粉酶和/或磷脂酶。
本發(fā)明通過以下實施例進(jìn)一步描述,其不應(yīng)理解為限制本發(fā)明的范圍。
實施例實施例1蛋白酶測定法pNA測定法pNA底物Suc-AAPF-pNA(Bachem L-1400)。
溫度室溫(25℃)
分析(Assay)緩沖液100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01% Triton X-100,其用HCl或NaOH調(diào)節(jié)到pH值2.0,2.5,3.0,3.5,4.0,5.0,6.0,7.0,8.0,9.0,10.0,11.0,和12.0。
20μl蛋白酶(在0.01% Triton X-100中稀釋)與100μl分析緩沖液混合。所述測定通過加入100μl pNA底物(50mg溶于1.0ml DMSO,并用0.01%TritonX-100進(jìn)一步稀釋45x)開始。監(jiān)測OD405的增加作為蛋白酶活性的測定。
Protazyme AK測定法底物Protazyme AK片(交聯(lián)且染色的酪蛋白;來自Megazyme)溫度受控的(分析溫度).
分析緩沖液100mM琥珀酸,100mM HEPES,100mM CHES,100mMCABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,其用HCl或NaOH調(diào)節(jié)到pH值2.0,2.5,3.0,3.5,4.0,5.0,6.0,7.0,8.0,9.0,10.0和11.0。
Protazyme AK片通過溫和攪動懸于2.0ml 0.01%Triton X-100中。500μl該懸液以及500μl分析緩沖液在Eppendorf管中混合并置于冰上。加入20μl蛋白酶樣品(在0.01% Triton X-100中稀釋)。所述測定通過將Eppendorf管轉(zhuǎn)移到Eppendorf熱混合儀啟動,所述熱混合儀設(shè)定到測定溫度。所述管在Eppendorf熱混合儀上在其最高震搖速率(1400rpm)保溫15分鐘。所述保溫通過將所述管轉(zhuǎn)移回冰浴來終止。然后將所述管在冰冷離心儀中離心數(shù)分鐘,并將200μl上清轉(zhuǎn)移到微量滴定板。讀取OD650作為蛋白酶活性的測定值。盲性緩沖液包含在所述測定中(取代酶)。
實施例2制備并檢測蛋白酶變體四種包含SEQ ID NO2的氨基酸1-188(蛋白酶10)的氨基酸序列的蛋白酶變體,其中所述的氨基酸序列分別含有單個取代N47D,T127R,N92K,和Q54R,如下對于變體N47D所述進(jìn)行制備。
定點誘變利用Mega-引物法進(jìn)行,如Sarkar和Sommer,1990(BioTechniques 8404-407)所述。
N47D變體通過利用以下引物構(gòu)建,其中引物R10WT-CL29(SEQ ID NO11)是基因特異性的,引物RSWT126(SEQ ID NO12)是誘變性的
R10WT-CL295’CCGATTATGGAGCGGATTGAACATGCG 3’(SEQ IDNO11)RSWT1265’GTGACCATCGGCGACGGCAGGGGCGTCTTCG 3’(SEQID NO12),以通過PCR從下述構(gòu)建體擴增大約469bp的DNA片段。
用于上述擴增的蛋白酶10DNA構(gòu)建體是表達(dá)盒(SEQ ID NO13),用于并入枯草芽孢桿菌的基因組。所述構(gòu)建體含有編碼信號序列的DNA融合物,以及編碼蛋白酶10(SEQ ID NO14)的原蛋白和成熟蛋白的基因,啟動子結(jié)構(gòu),以及cat基因(其賦予對氯霉素的抗性)。為了促進(jìn)通過同源重組整合入基因組,大約3kb的枯草芽孢桿菌內(nèi)源基因側(cè)接區(qū)域被摻入蛋白酶10編碼序列的上游和下游。
產(chǎn)生的469bp片段自瓊脂糖凝膠純化(Sigma Aldrich cat.no.A6877)并作為Mega-引物與引物R10WT-CL39N(SEQ ID NO15)一起用于利用相同的模板進(jìn)行的第二次PCR。
R10WT-CL39N5’GGAGCTCTGAAAAAAAGGAGAGGATAAAGAATGAA3’(SEQ ID NO15)大約10kb的全長結(jié)構(gòu)通過長范圍PCR制備,利用寡核苷酸R10WT-CL28N(SEQ ID NO16),R10WT-CL28C(SEQ ID NO17),以及Roche Applied Science(cat no.11759060)的擴增長模板PCR系統(tǒng),根據(jù)提供商的說明進(jìn)行。
R10WT-CL28N5’GCGTTCCGATAATCGCGGTGACAATGCCG 3’(SEQID NO16)R10WT-CL28C5’TTCATGAGTCTGCGCCCTGAGATCCTCTG 3’(SEQID NO17)產(chǎn)生的大約1.2kb的片段被純化并在新的PCR反應(yīng)中利用擴增長模板PCR系統(tǒng)進(jìn)行組合,所述結(jié)構(gòu)的側(cè)翼序列通過兩次PCR反應(yīng)利用R10WT-2C-rev(SEQ ID NO18)和R10WT-CL28C(SEQ ID NO17);以及RSWT001(SEQ ID NO19)和R10WT-CL28N(SEQ ID NO16)作為引物組制備。產(chǎn)生的10kb片段可利用R10WT-CL28N(SEQ ID NO16)和R10WT-CL28C(SEQ ID NO17)作為引物擴增,以增加轉(zhuǎn)化體的數(shù)目。
R10WT-2C-rev5’TAATCGCATGTTCAATCCGCTCCATAATCG 3’(SEQID NO18)RSWT0015’CCCAACGGTTTCTTCATTCTTTATCCTCTCCTTTTTTTCAGAGC3’(SEQ ID NO19)低淀粉酶和蛋白酶枯草芽孢桿菌菌株(諸如WO92/11357和WO95/10603的菌株SHA273)的感受態(tài)細(xì)胞用各自產(chǎn)生的PCR片段轉(zhuǎn)化,并選出氯霉素抗性轉(zhuǎn)化體,通過DNA測序檢測以證實基因組上正確的突變的存在。
含有編碼蛋白酶10的枯草芽孢桿菌的細(xì)胞以及其四種變體的每一種用于保溫含有豐富培養(yǎng)基(PS-1100g/L Sucrose(Danisco cat.no.109-0429),40g/L crust soy,10g/L Na2HPO4.12H2O(Merck cat.no.6579),0.1ml/L Pluronic PE6100(BASF 102-3098))的燒瓶,培養(yǎng)在劇烈震搖下于30℃進(jìn)行5天。
培養(yǎng)后,上清液在0.2M Na2HPO4緩沖液中稀釋4倍,用0.1M檸檬酸滴定到pH 4.0或pH 6.0,然后一分為二份。一半在各pH于65℃保溫4小時,然后進(jìn)行冷凍。另一半立刻冷凍,作為對照。
測定殘余蛋白酶活性之前,所述樣品在50mM CHES-HEPES緩沖液pH8.5中稀釋10倍。活性利用實施例1所述Protazyme AK測定法的修飾版本測定,將一片底物溶解在4ml CHES-HEPES緩沖液pH 8.5中,在連續(xù)攪拌下混合1ml所述底物溶液和20ul稀釋的蛋白酶樣品,隨后將其在37℃保溫。所述底物應(yīng)具有正確的溫度,然后加入蛋白酶。15分鐘后,所述反應(yīng)通過加入100ul 1M NaOH終止,不溶性底物通過在15000rpm離心3分鐘沉淀,然后測定650nm的吸光度。所述值應(yīng)低于OD 3.0,可選所述蛋白酶樣品應(yīng)稀釋超過10倍然后進(jìn)行活性測定。
相對參與活性(%)通過用在65℃保溫的活性除以相應(yīng)對照的活性來計算。下表1的結(jié)果顯示所有四種變體與蛋白酶10相比具有改進(jìn)的熱穩(wěn)定性。
表1在65℃保溫4小時以后的殘余活性
實施例3蛋白酶變體22設(shè)計稱為″蛋白酶22″并包含位于權(quán)利要求1中所述的17個區(qū)域中的13個區(qū)域中的多種取代的蛋白酶變體。所述變體與蛋白酶10的成熟部分(SEQID NO2的氨基酸1-188)相比,包含以下取代T10Y,A25S,R38T,Q42P,T44S,R49K,Q54R,V56I,A62S,T82S,S99A,G118Ns,S120T,S122R,E125Q,T129Y,N130S,M131L,R165S,T166A,F(xiàn)171Y,T176N,V179L,N180S,V184L,和R185T。
蛋白酶22的成熟部分是SEQ ID NO21的氨基酸1-196。對應(yīng)SEQ ID NO21的DNA序列是SEQ ID NO20。
構(gòu)建SEQ ID NO20的DNA序列并導(dǎo)入芽孢桿菌宿主用于表達(dá)。表達(dá)的蛋白酶被純化,并作為α-裂解性蛋白酶(肽酶家族S1E和/或S2A)表征。
蛋白酶22的溫度活性關(guān)系利用實施例1的Protazyme AK試驗在pH9測定,蛋白酶10包含在內(nèi)作為對比物。結(jié)果顯示在下表2。
表2蛋白酶22和蛋白酶10在pH9的溫度圖譜
從這些結(jié)果可見,在pH9,蛋白酶22在較高的溫度具有最佳活性,所述溫度高于蛋白酶10的情況,即與前者的約70℃相比而言在約80℃。
利用差異掃描量熱法(DSC)測定蛋白酶22和蛋白酶10在pH7.0的溫度熱穩(wěn)定性。純化的蛋白酶在4℃用以下物質(zhì)滲析過夜10mM磷酸鈉,50mM氯化鈉,pH7.0,并在VP-DSC裝置(Micro Cal)上、以恒定掃描速率1.5℃/min、在20-100℃進(jìn)行。數(shù)據(jù)處理利用MicroCal Origin software進(jìn)行。
所得變性溫度或熔點Tm為對于蛋白酶22為83.5℃;對于蛋白酶10為76.5℃。
本文所述和要求的發(fā)明的范圍不限于公開的具體實施方案,這是由于這些實施方案意圖舉例本發(fā)明的數(shù)個方面。任何等同實施方案意圖包含在本發(fā)明范圍內(nèi)。事實上,根據(jù)本發(fā)明前述內(nèi)容,除本發(fā)明顯示并描述的修飾以外的對本發(fā)明的各種修飾對本領(lǐng)域技術(shù)人員顯而易見。所述修飾意圖包含在所附權(quán)利要求范圍內(nèi)。如有沖突,以本發(fā)明的公開包括定義為準(zhǔn)。
本發(fā)明引用的各對比文件,其全文包含在本發(fā)明作為參考。
序列表<110>諾維信公司(Novozymes A/S)<120>蛋白酶變體<130>10508<160>21<170>PatentIn version 3.2<210>1<211>1596<212>DNA<213>擬諾卡氏菌種NRRL 18262(“蛋白酶10”)(Nocardiopsis sp.NRRL 18262(″Protease10″))<220>
<221>CDS<222>(318)..(1463)<220>
<221>sig_peptide<222>(318)..(404)<220>
<221>mat_peptide<222>(900)..(1463)<400>1acgtttggta cgggtaccgg tgtccgcatg tggccagaat gcccccttgc gacagggaac60ggattcggtc ggtagcgcat cgactccgac aaccgcgagg tggccgttcg cgtcgccacg120ttctgcgacc gtcatgcgac ccatcatcgg gtgaccccac cgagctctga atggtccacc180gttctgacgg tctttccctc accaaaacgt gcacctatgg ttaggacgtt gtttaccgaa240tgtctcggtg aacgacaggg gccggacggt attcggcccc gatcccccgt tgatcccccc300aggagagtag ggacccc atg cga ccc tcc ccc gtt gtc tcc gcc atc ggt 350Met Arg Pro Ser Pro Val Val Ser Ala Ile Gly-190-185acg gga gcg ctg gcc ttc ggt ctg gcg ctg tcc ggt acc ccg ggt 395Thr Gly Ala Leu Ala Phe Gly Leu Ala Leu Ser Gly Thr Pro Gly-180-175-170gcc ctc gcg gcc acc gga gcg ctc ccc cag tca ccc acc ccg gag 440Ala Leu Ala Ala Thr Glv Ala Leu Pro Gln Ser Pro Thr Pro Glu-165-160-155gcc gac gcg gtc tcc atg cag gag gcg ctc cag cgc gac ctc gac 485Ala Asp Ala Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp-150-145-140ctg acc tcc gcc gag gcc gag gag ctg ctg gcc gcc cag gac acc 530Leu Thr Ser Ala Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr-135-130-125gcc ttc gag gtc gac gag gcc gcg gcc gag gcc gcc ggg gac gcc 575Ala Phe Glu Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala-120-115-110
tac ggc ggc tcc gtc ttc gac acc gag agc ctg gaa ctg acc gtc ctg 623Tyr Gly Gly Ser Val Phe Asp Thr Glu Ser Leu Glu Leu Thr Val Leu-105-100-95gtc acc gat gcc gcc gcg gtc gag gcc gtg gag gcc acc ggc gcc ggg 671Val Thr Asp Ala Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly-90 -85 -80acc gag ctg gtc tcc tac ggc atc gac ggt ctc gac gag atc gtc cag 719Thr Glu Leu Val Ser Tyr Gly Ile Asp Gly Leu Asp Glu Ile Val Gln-75 -70 -65gag ctc aac gcc gcc gac gcc gtt ccc ggt gtg gtc ggc tgg tac ccg 767Glu Leu Asn Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro-60 -55 -50 -45gac gtg gcg ggt gac acc gtc gtc ctg gag gtc ctg gag ggt tcc gga 815Asp Val Ala Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly-40 -35 -30gcc gac gtc agc ggc ctg ctc gcg gac gcc ggc gtg gac gcc tcg gcc 863Ala Asp Val Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala-25 -20 -15gtc gag gtg acc acg agc gac cag ccc gag ctc tac gcc gac atc atc 911Val Glu Val Thr Thr Ser Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile-10 -5 -1 1ggt ggt ctg gcc tac acc atg ggc ggc cgc tgt tcg gtc ggc ttc gcg 959Gly Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala5 10 15 20gcc acc aac gcc gcc ggt cag ccc ggg ttc gtc acc gcc ggt cac tgc 1007Ala Thr Asn Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys25 30 35ggc cgc gtg ggc acc cag gtg acc atc ggc aac ggc agg ggc gtc ttc 1055Gly Arg Val Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe40 45 50gag cag tcc gtc ttc ccc ggc aac gac gcg gcc ttc gtc cgc ggt acg 1103Glu Gln Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr55 60 65tcc aac ttc acg ctg acc aac ctg gtc agc cgc tac aac acc ggc ggg1151Ser Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly70 75 80tac gcc acg gtc gcc ggt cac aac cag gcc ccc atc ggc tcc tcc gtc 1199Tyr Ala Thr Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val85 90 95 100tgc cgc tcc ggc tcc acc acc ggt tgg cac tgc ggc acc atc cag gcc 1247Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala105 110 115cgc ggc cag tcg gtg agc tac ccc gag ggc acc gtc acc aac atg acc 1295Arg Gly Gln Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr120 125 130cgg acc acc gtg tgc gcc gag ccc ggc gac tcc ggc ggc tcc tac atc 1343Arg Thr Thr Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile135 140 145
tcc ggc acc cag gcc cag ggc gtg acc tcc ggc ggc tcc ggc aac tgc 1391Ser Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys150 155 160cgc acc ggc ggg acc acc ttc tac cag gag gtc acc ccc atg gtg aac 1439Arg Thr Gly Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn165 170 175 180tcc tgg ggc gtc cgt ctc cgg acc tgatccccgc ggttccaggc ggaccgacgg1493Ser Trp Gly Val Arg Leu Arg Thr185tcgtgacctg agtaccaggc gtccccgccg cttccagcgg cgtccgcacc ggggtgggac 1553cgggcgtggc cacggcccca cccgtgaccg gaccgcccgg cta 1596<210>2<211>382<212>PRT<213>擬諾卡氏菌種NRRL 18262(“蛋白酶10”)(Nocardiopsis sp.NRRL 18262(″Protease10″))<400>2Met Arg Pro Ser Pro Val Val Ser Ala Ile Gly Thr Gly Ala Leu-190-185-180Ala Phe Gly Leu Ala Leu Ser Gly Thr Pro Gly Ala Leu Ala Ala-175-170-165Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val-160-155-150Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala-145-140-135Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val-130-125-120Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser-115-110-105Val Phe Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala-100-95 -90Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val-85 -80 -75Ser Tyr Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala-70 -65 -60Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly-55 -50 -45Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser-40 -35 -30 -25Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr-20 -15 -10Thr Ser Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala-5 -1 1 5
Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala10 15 20Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly25 30 35 40Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val45 50 55Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr60 65 70Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val75 80 85Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly90 95 100Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser105 110 115 120Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val125 130 135Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln140 145 150Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly155 160 165Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val170 175 180Arg Leu Arg Thr185<210>3<211>1065<212>DNA<213>達(dá)松維爾擬諾卡氏菌達(dá)松維爾亞種DSM 43235(“蛋白酶18”)(Nocardiopsisdassonvillei subspecies dassonvillei DSM 43235(″Protease 18″))<220>
<221>CDS<222>(1)..(1062)<220>
<221>mat_peptide<222>(499)..(1062)<400>3gct ccg gcc ccc gtc ccc cag acc ccc gtc gcc gac gac agc gcc45Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala-165-160-155gcc agc atg acc gag gcg ctc aag cgc gac ctc gac ctc acc tcg90Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser-150-145-140gcc gag gcc gag gag ctt ctc tcg gcg cag gaa gcc gcc atc gag135Ala Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu-135-130-125
acc gac gcc gag gcc acc gag gcc gcg ggc gag gcc tac ggc ggc180Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly-120-115-110tca ctg ttc gac acc gag acc ctc gaa ctc acc gtg ctg gtc acc gac228Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp-105-100-95gcc tcc gcc gtc gag gcg gtc gag gcc acc gga gcc cag gcc acc gtc276Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val-90 -85 -80 -75gtc tcc cac ggc acc gag ggc ctg acc gag gtc gtg gag gac ctc aac324Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn-70 -65 -60ggc gcc gag gtt ccc gag agc gtc ctc ggc tgg tac ccg gac gtg gag372Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu-55 -50 -45agc gac acc gtc gtg gtc gag gtg ctg gag ggc tcc gac gcc gac gtc420Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val-40 -35 -30gcc gcc ctg ctc gcc gac gcc ggt gtg gac tcc tcc tcg gtc cgg gtg468Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val-25 -20 -15gag gag gcc gag gag gcc ccg cag gtc tac gcc gac atc atc ggc ggc516Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly-10 -5 -1 1 5ctg gcc tac tac atg ggc ggc cgc tgc tcc gtc ggc ttc gcc gcg acc564Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr10 15 20aac agc gcc ggt cag ccc ggt ttc gtc acc gcc ggc cac tgc ggc acc612Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr25 30 35gtc ggc acc ggc gtg acc atc ggc aac ggc acc ggc acc ttc cag aac660Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn40 45 50tcg gtc ttc ccc ggc aac gac gcc gcc ttc gtc cgc ggc acc tcc aac708Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn55 60 65 70ttc acc ctg acc aac ctg gtc tcg cgc tac aac tcc ggc ggc tac cag756Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln75 80 85tcg gtg acc ggt acc agc cag gcc ccg gcc ggc tcg gcc gtg tgc cgc804Ser Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg90 95 100tcc ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc aac852Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn105 110 115cag acc gtg cgc tac ccg cag ggc acc gtc tac tcg ctc acc cgc acc900Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr120 125 130
aac gtg tgc gcc gag ccc ggc gac tcc ggc ggt tcg ttc atc tcc ggc948Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly135 140 145 150tcg cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc tcc gtc996Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val155 160 165ggc ggc acg acc tac tac cag gag gtc acc ccg atg atc aac tcc tgg1044Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp170 175 180ggt gtc agg atc cgg acc taa1065Gly Val Arg Ile Arg Thr185<210>4<211>354<212>PRT<213>達(dá)松維爾擬諾卡氏菌達(dá)松維爾亞種DSM 43235(“蛋白酶18”)(Nocardiopsisdassonvillei subspecies dassonvillei DSM 43235(″Protease 18″))<400>4Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala-165-160-155Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser-150-145-140Ala Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu-135-130-125Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly-120-115-110Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp-105-100-95Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val-90 -85 -80 -75Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn-70 -65 -60Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu-55 -50 -45Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val-40 -35 -30Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val-25 -20 -15Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly-10 -5 -1 1 5Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr10 15 20Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr25 30 35
Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn40 45 50Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn55 60 65 70Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln75 80 85Ser Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg90 95 100Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn105 110 115Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr120 125 130Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly135 140 145 150Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val155 160 165Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp170 175 180Gly Val Arg Ile Arg Thr185<210>5<211>1062<212>DNA<213>Nocardiopsis prasina DSM 15648(″蛋白酶11″)<220>
<221>CDS<222>(1)..(1059)<220>
<221>mat_peptide<222>(496)..(1059)<400>5gcc acc gga ccg ctc ccc cag tca ccc acc ccg gag gcc gac gcc45Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala-165-160-155gtc tcc atg cag gag gcg ctc cag cgc gac ctc ggc ctg acc ccg90Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro-150-145-140ctt gag gcc gat gaa ctg ctg gcc gcc cag gac acc gcc ttc gag135Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu-135-130-125gtc gac gag gcc gcg gcc gcg gcc gcc ggg gac gcc tac ggc ggc180Val Asp GLu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly-120-115-110tcc gtc ttc gac acc gag acc ctg gaa ctg acc gtc ctg gtc acc gac228Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105 -100 -95-90gcc gcc tcg gtc gag gct gtg gag gcc acc ggc gcg ggt acc gaa ctc276Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu-85 -80 -75gtc tcc tac ggc atc gag ggc ctc gac gag atc atc cag gat ctc aac324Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn-70 -65 -60gcc gcc gac gcc gtc ccc ggc gtg gtc ggc tgg tac ccg gac gtg gcg372Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala-55 -50 -45ggt gac acc gtc gtc ctg gag gtc ctg gag ggt tcc gga gcc gac gtg420Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val-40 -35 -30agc ggc ctg ctc gcc gac gcc ggc gtg gac gcc tcg gcc gtc gag gtg468Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val-25 -20 -15 -10acc agc agt gcg cag ccc gag ctc tac gcc gac atc atc ggc ggt ctg516Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu-5 -1 1 5gcc tac acc atg ggc ggc cgc tgt tcg gtc gga ttc gcg gcc acc aac564Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn10 15 20gcc gcc ggt cag ccc gga ttc gtc acc gcc ggt cac tgt ggc cgc gtg612Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val25 30 35ggc acc cag gtg agc atc ggc aac ggc cag ggc gtc ttc gag cag tcc660Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser40 45 50 55atc ttc ccg ggc aac gac gcc gcc ttc gtc cgc ggc acg tcc aac ttc708Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe60 65 70acg ctg acc aac ctg gtc agc cgc tac aac acc ggc ggt tac gcc acc756Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr75 80 85gtc gcc ggc cac aac cag gcg ccc atc ggc tcc tcc gtc tgc cgc tcc804Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser90 95 100ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc ggc cag852Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln105 110 115tcg gtg agc tac ccc gag ggc acc gtc acc aac atg acc cgg acc acc900Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr120 125 130 135gtg tgc gcc gag ccc ggc gac tcc ggc ggc tcc tac atc tcc ggc aac948Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn140 145 150cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc cgc acc ggc996Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
155 160 165ggg acc acc ttc tac cag gag gtc acc ccc atg gtg aac tcc tgg ggc1044Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly170 175 180gtc cgt ctc cgg acc taa1062Val Arg Leu Arg Thr185<210>6<211>353<212>PRT<213>Nocardiopsis prasina DSM 15648(″蛋白酶11″)<400>6Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala-165-160-155Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro-150-145-140Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu-135-130-125Val Asp Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly-120-115-110Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp-105-100-95 -90Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu-85 -80 -75Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn-70 -65 -60Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala-55 -50 -45Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val-40 -35 -30Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val-25 -20 -15 -10Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu-5 -1 1 5Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn10 15 20Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val25 30 35Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser40 45 50 55Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe60 65 70Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
75 80 85Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser90 95 100Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln105 110 115Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr120 125 130 135Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn140 145 150Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly155 160 165Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly170 175 180Val Arg Leu Arg Thr185<210>7<211>1062<212>DNA<213>Nocardiopsis prasina DSM 15649(″蛋白酶35″)<220>
<221>CDS<222>(1)..(1059)<220>
<221>mat_peptide<222>(496)..(1059)<400>7gcc acc gga cca ctc ccc cag tca ccc acc ccg gag gcc gac gcc45Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala-165-160-155gtc tcc atg cag gag gcg ctc cag cgc gac ctc ggc ctg acc ccg90Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro-150-145-140ctt gag gcc gat gaa ctg ctg gcc gcc cag gac acc gcc ttc gag135Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu-135-130-125gtc gac gag gcc gcg gcc gag gcc gcc ggt gac gcc tac ggc ggc180Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly-120-115-110tcc gtc ttc gac acc gag acc ctg gaa ctg acc gtc ctg gtc acc gac228Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp-105-100-95 -90tcc gcc gcg gtc gag gcg gtg gag gcc acc ggc gcc ggg acc gaa ctg276Ser Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu-85 -80 -75gtc tcc tac ggc atc acg ggc ctc gac gag atc gtc gag gag ctc aac324Val Ser Tyr Gly Ile Thr Gly Leu Asp Glu Ile Val Glu Glu Leu Asn
-70 -65 -60gcc gcc gac gcc gtt ccc ggc gtg gtc ggc tgg tac ccg gac gtc gcg372Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala-55 -50 -45ggt gac acc gtc gtg ctg gag gtc ctg gag ggt tcc ggc gcc gac gtg420Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val-40 -35 -30ggc ggc ctg ctc gcc gac gcc ggc gtg gac gcc tcg gcg gtc gag gtg468Gly Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val-25 -20 -15 -10acc acc acc gag cag ccc gag ctg tac gcc gac atc atc ggc ggt ctg516Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu-5 -1 1 5gcc tac acc atg ggc ggc cgc tgt tcg gtc ggc ttc gcg gcc acc aac564Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn10 15 20gcc gcc ggt cag ccc ggg ttc gtc acc gcc ggt cac tgt ggc cgc gtg612Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val25 30 35ggc acc cag gtg acc atc ggc aac ggc cgg ggc gtc ttc gag cag tcc 660Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser40 45 50 55atc ttc ccg ggc aac gac gcc gcc ttc gtc cgc gga acg tcc aac ttc708Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe60 65 70acg ctg acc aac ctg gtc agc cgc tac aac acc ggc ggc tac gcc acc756Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr75 80 85gtc gcc ggt cac aac cag gcg ccc atc ggc tcc tcc gtc tgc cgc tcc804Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser90 95 100ggc tcc acc acc ggt tgg cac tgc ggc acc atc cag gcc cgc ggc cag852Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln105 110 115tcg gtg agc tac ccc gag ggc acc gtc acc aac atg acg cgg acc acc900Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr120 125 130 135gtg tgc gcc gag ccc ggc gac tcc ggc ggc tcc tac atc tcc ggc aac948Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn140 145 150cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc cgc acc ggc996Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly155 160 165ggg acc acc ttc tac cag gag gtc acc ccc atg gtg aac tcc tgg ggc1044Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly170 175 180gtc cgt ctc cgg acc taa1062Val Arg Leu Arg Thr
185<210>8<211>353<212>PRT<213>Nocardiopsis prasina DSM 15649(″蛋白酶35″)<400>8Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala-165-160-155Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro-150-145-140Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu-135-130-125Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly-120-115-110Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp-105-100-95 -90Ser Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu-85 -80 -75Val Ser Tyr Gly Ile Thr Gly Leu Asp Glu Ile Val Glu Glu Leu Asn-70 -65 -60Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala-55 -50 -45Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val-40 -35 -30Gly Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val-25 -20 -15 -10Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu-5 -1 1 5Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn10 15 20Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val25 30 35Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser40 45 50 55Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe60 65 70Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr75 80 85Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser90 95 100Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln105 110 115
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr120 125 130 135Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn140 145 150Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly155 160 165Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly170 175 180Val Arg Leu Arg Thr185<210>9<211>1068<212>DNA<213>Nocardiopsis alba DSM 15647(″蛋白酶08″)<220>
<221>CDS<222>(1)..(1065)<220>
<221>mat_peptide<222>(502)..(1065)<400>9gcg acc ggc ccc ctc ccc cag tcc ccc acc ccg gat gaa gcc gag45Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu-165-160-155gcc acc acc atg gtc gag gcc ctc cag cgc gac ctc ggc ctg tcc90Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser-150-145-140ccc tct cag gcc gac gag ctc ctc gag gcg cag gcc gag tcc ttc135Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe-135-130-125gag atc gac gag gcc gcc acc gcg gcc gca gcc gac tcc tac ggc180Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly-120-115-110ggc tcc atc ttc gac acc gac agc ctc acc ctg acc gtc ctg gtc acc228Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr-105-100-95gac gcc tcc gcc gtc gag gcg gtc gag gcc gcc ggc gcc gag gcc aag276Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys-90 -85 -80gtg gtc tcg cac ggc atg gag ggc ctg gag gag atc gtc gcc gac ctg324Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu-75 -70 -65 -60aac gcg gcc gac gct cag ccc ggc gtc gtg ggc tgg tac ccc gac atc372Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile-55 -50 -45cac tcc gac acg gtc gtc ctc gag gtc ctc gag ggc tcc ggt gcc gac420His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp
-40 -35 -30gtg gac tcc ctg ctc gcc gac gcc ggt gtg gac acc gcc gac gtc aag468Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys-25 -20 -15gtg gag agc acc acc gag cag ccc gag ctg tac gcc gac atc atc ggc516Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly-10 -5 -1 1 5ggt ctc gcc tac acc atg ggt ggg cgc tgc tcg gtc ggc ttc gcg gcc564Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala10 15 20acc aac gcc tcc ggc cag ccc ggg ttc gtc acc gcc ggc cac tgc ggc612Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly25 30 35acc gtc ggc acc ccg gtc agc atc ggc aac ggc cag ggc gtc ttc gag660Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu40 45 50cgt tcc gtc ttc ccc ggc aac gac tcc gcc ttc gtc cgc ggc acc tcg708Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser55 60 65aac ttc acc ctg acc aac ctg gtc agc cgc tac aac acc ggt ggt tac756Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr70 75 80 85gcg acc gtc tcc ggc tcc tcg cag gcg gcg atc ggc tcg cag atc tgc804Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys90 95 100cgt tcc ggc tcc acc acc ggc tgg cac tgc ggc acc gtc cag gcc cgc852Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg105 110 115ggc cag acg gtg agc tac ccc cag ggc acc gtg cag aac ctg acc cgc900Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg120 125 130acc aac gtc tgc gcc gag ccc ggt gac tcc ggc ggc tcc ttc atc tcc948Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser135 140 145ggc agc cag gcc cag ggc gtc acc tcc ggt ggc tcc ggc aac tgc tcc996Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser150 155 160 165ttc ggt ggc acc acc tac tac cag gag gtc aac ccg atg ctg agc agc1044Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser170 175 180tgg ggt ctg acc ctg cgc acc tga1068Trp Gly Leu Thr Leu Arg Thr185<210>10<211>355<212>PRT<213>Nocardiopsis alba DSM 15647(″蛋白酶08″)
<400>10Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu-165-160-155Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser-150-145-140Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe-135-130-125Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly-120-115-110Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr-105-100-95Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys-90 -85 -80Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu-75 -70 -65 -60Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile-55 -50 -45His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp-40 -35 -30Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys-25 -20 -15Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly-10 -5 -1 1 5Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala10 15 20Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly25 30 35Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu40 45 50Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser55 60 65Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr70 75 80 85Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys90 95 100Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg105 110 115Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg120 125 130Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser135 140 145Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser150 155 160 165
Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser170 175 180Trp Gly Leu Thr Leu Arg Thr185<210>11<211>27<212>DNA<213>人工的<220>
<223>引物<400>11ccgattatgg agcggattga acatgcg 27<210>12<211>31<212>DNA<213>人工的<220>
<223>引物<400>12gtgaccatcg gcgacggcag gggcgtcttc g31<210>13<211>10172<212>DNA<213>人工的<220>
<223>表達(dá)盒<220>
<221>源(source)<222>(1)..(3323)<223>包含yfmH-yfmD-yfmC-yfmB-yfmA基因的枯草芽孢桿菌(Bacillus subtilis)基因組序列<220>
<221>misc_recomb<222>(3561)..(4208)<223>提供氯霉素抗性的Cat基因<220>
<221>啟動子<222>(4523)..(5633)<223>包含mRNA穩(wěn)定序列的三聯(lián)PamyL-scBAN-CryIIIA啟動子<220>
<221>sig_peptide<222>(5658)..(5738)<220>
<221>CDS<222>(5658)..(6797)
<220>
<221>mat_peptide<222>(6234)..(6797)<220>
<221>源<222>(6839)..(7540)<223>枯草芽孢桿菌果膠酸裂解酶基因的部分<220>
<221>源<222>(7541)..(10172)<223>包含yflS-citM基因的枯草芽孢桿菌基因組DNA<400>13gagtatcgcc agtaaggggc gtttttgttt tctggttgtt ttcttcattt caggtttcgc60cctttccttg ccaaatataa gaaaaacggc gttccgataa tcgcggtgac aatgccgacc120ggtgattcat aaggaaatgc aatccatctg gccagaacat ctgcgtacac cagcaaaatg180gcaccgaaca gtgccgaaaa cggaagcacg tattgataat gttctccgat cagcttgcgg240acaatatgcg ggacgagcag cccgacaaag ccaatcggcc cggcgacggc tacggaagcg300ccggaaagaa ttaaaataat caaactgatc agaatcctga tgccgttcat attttgtcca360agcccttttg ctgtttcgtc tccgagaccg agaacagaaa cagaaccgga aaatacgagg420gcaagcccga tgccaatgac agaaaaagga gcgatggtta tgacgtcctg ccagttgctg480ccgtcgattg cgcctgtcat ccagtacaga acatcctcac ctgactcatt taaaataatg540atggcctgtg tcatagagga gaggaacaag tgcacggcca ttcctgacag cgccagcttg600acaggcgtca ttccgccgga tgaggcaatc atatacacaa tcgcgccgcc tgctgccgca660cccgcaaaag cgaatataac agatgaatag ggcgatgccg gcagaatgac gagagaagca720acaacaaaaa gcgatgcacc cgcattcaca ccgaaaattt ggggtgaagc cagaggattt780ctggtcatag cctgcatcag cgcccctgct acagctaggc tggcgccgac aaaaacgccg840attaatgtgc ggggaaggcg aagagtagag atgatgagct gttcctttga accgtcccat900acaaaaagat atttcaatga atctatgatg ctgatgtctg aggctcctac tgaaagattc960agcccaagcc caaatataaa aataatcagt gcaatgataa acatcatcag tcttgatgat1020gagcgccgtt tggctgaatg atacaacagt ctcacttcct tactgcgtct ggttgcaaaa1080acgaagaagc aaggattccc ctcgcttctc atttgtccta tttattatac acttttttaa1140gcacatcttt ggcgcttgtt tcactagact tgatgcctct gaatcttgtc caagtgtcac1200ggtccgcatc atagacttgt ccatttttca ccgctttgag atttttccag agcgggttcg1260ttttccactc atctacaatg gttttgcctt cgttggctga gatgaacaaa atatcaggat1320cgattttgct caattgctca aggctgacct cttgataggc gttatctgac ttcacagcgt1380gtgtaaagcc tagcatttta aagatttctc cgtcatagga tgatgatgta tgaagctgga1440aggaatccgc tcttgcaacg ccgagaacga tgttgcggtt ttcatctttc ggaagttcgg1500
cttttagatc gttgatgact tttttgtgct cggcaagctt ttcttttcct tcatcttctt1560tatttaatgc tttagcaatg gtcgtaaagc tgtcgatcgt ttcgtcatat gtcgcttcac1620ggctttttaa ttcaatcgtc ggggcgattt ttttcagctg tttataaatg tttttatggc1680gctcagcgtc agcgatgatt aaatcaggct tcaaggaact gatgacctca agattgggtt1740cgctgcgtgt gcctacagat gtgtaatcaa tggagctgcc gacaagcttt ttaatcatat1800cttttttgtt gtcatctgcg atgcccaccg gcgtaatgcc gagattgtga acggcatcca1860agaatgaaag ctcaagcaca accacccgct taggtgtgcc gcttactgtc gtttttcctt1920cttcgtcatg gatcactctg gaatccttag actcgctttt gccgcttccg ttgttattct1980ggcttgatga acagccggat acaatgaggc aggcgagcaa taaaacactc atgatggcaa2040tcaacttgtt agaataggtg cgcatgtcat tcttcctttt ttcagattta gtaatgagaa2100tcattatcac atgtaacact ataatagcat ggcttatcat gtcaatattt ttttagtaaa2160gaaagctgcg tttttactgc tttctcatga aagcatcatc agacacaaat aagtggtatg2220cagcgttacc gtgtcttcga gacaaaaacg catgggcgtt ggctttagag gtttcgaaca2280tatcagcagt gacataagga aggagagtgc tgagataacc ggacaatttc ttttctattt2340catctgttag tgcaaattca atgtcgccga tattcatgat aatcgagaaa acaaagtcga2400tatcgatatg aaaatgttcc tcggcaaaaa ccgcaagctc gtgaattcct ggtgaacatc2460cggcacgctt atggaaaatc tgtttgacta aatcactcac aatccaagca ttgtattgct2520gttctggtga aaagtattgc attagacata cctcctgctc gtacggataa aggcagcgtt2580tcatggtcgt gtgctccgtg cagcggcttc tccttaattt tgatttttct gaaaataggt2640cccgttccta tcactttacc atggacggaa aacaaatagc tactaccatt cctcctgttt2700ttctcttcaa tgttctggaa tctgtttcag gtacagacga tcgggtatga aagaaatata2760gaaaacatga aggaggaata tcgacatgaa accagttgta aaagagtata caaatgacga2820acagctcatg aaagatgtag aggaattgca gaaaatgggt gttgcgaaag aggatgtata2880cgtcttagct cacgacgatg acagaacgga acgcctggct gacaacacga acgccaacac2940gatcggagcc aaagaaacag gtttcaagca cgcggtggga aatatcttca ataaaaaagg3000agacgagctc cgcaataaaa ttcacgaaat cggtttttct gaagatgaag ccgctcaatt3060tgaaaaacgc ttagatgaag gaaaagtgct tctctttgtg acagataacg aaaaagtgaa3120agcttgggca taaagcaagg aaaaaaccaa aaggccaatg tcggcctttt ggtttttttg3180cggtctttgc ggtgggattt tgcagaatgc cgcaatagga tagcggaaca ttttcggttc3240tgaatgtccc tcaatttgct attatatttt tgtgataaat tggaataaaa tctcacaaaa3300tagaaaatgg gggtacatag tggccatcat ggccagctag catgcacatg ggatctggga3360ccaataataa tgactagaga agaaagaatg aagattgttc atgaaattaa ggaacgaata3420
ttggataaag tggggtattt ttaaaatata tatttatgtt acagtaatat tgacttttaa3480aaaaggattg attctaagaa gaaagcagac aagtaagcct cctaaattca ctttagataa3540aaatttagga ggcatatcaa atgaacttta ataaaattga tttagacaat tggaagagaa3600aagagatatt taatcattat ttgaaccaac aaacgacttt tagtataacc acagaaattg3660atattagtgt tttataccga aacataaaac aagaaggata taaattttac cctgcattta3720ttttcttagt gacaagggtg ataaactcaa atacagcttt tagaactggt tacaatagcg3780acggagagtt aggttattgg gataagttag agccacttta tacaattttt gatggtgtat3840ctaaaacatt ctctggtatt tggactcctg taaagaatga cttcaaagag ttttatgatt3900tatacctttc tgatgtagag aaatataatg gttcggggaa attgtttccc aaaacaccta3960tacctgaaaa tgctttttct ctttctatta ttccatggac ttcatttact gggtttaact4020taaatatcaa taataatagt aattaccttc tacccattat tacagcagga aaattcatta4080ataaaggtaa ttcaatatat ttaccgctat ctttacaggt acatcattct gtttgtgatg4140gttatcatgc aggattgttt atgaactcta ttcaggaatt gtcagatagg cctaatgact4200ggcttttata atatgagata atgccgactg tactttttac agtcggtttt ctaacgatac4260attaataggt acgaaaaagc aacttttttt gcgcttaaaa ccagtcatac caataactta4320agggtaacta gcctcgccgg aaagagcgaa aatgcctcac atttgtgcca cctaaaaagg4380agcgatttac atatgagtta tgcagtttgt agaatgcaaa aagtgaaatc agctggacta4440aaaggcatgg catgccttcg atagtttatt aatattagtg gagctcagtg agagcgaagc4500gaacacttga ttttttaatt ttctatcttt tataggtcat tagagtatac ttatttgtcc4560tataaactat ttagcagcat aatagattta ttgaataggt catttaagtt gagcatatta4620ggggaggaaa atcttggaga aatatttgaa gaacccgagg atctagatca ggtaccgcaa4680cgttcgcaga tgctgctgaa gagattatta aaaagctgaa agcaaaaggc tatcaattgg4740taactgtatc tcagcttgaa gaagtgaaga agcagagagg ctattgaata aatgagtaga4800aagcgccata tcggcgcttt tcttttggaa gaaaatatag ggaaaatggt acttgttaaa4860aattcggaat atttatacaa tatcatatgt atcacattga aaggaggggc ctgctgtcca4920gactgtccgc tgtgtaaaaa aaaggaataa aggggggttg acattatttt actgatatgt4980ataatataat ttgtataaga aaatggaggg gccctcgaaa cgtaagatga aaccttagat5040aaaagtgctt tttttgttgc aattgaagaa ttattaatgt taagcttaat taaagataat5100atctttgaat tgtaacgccc ctcaaaagta agaactacaa aaaaagaata cgttatatag5160aaatatgttt gaaccttctt cagattacaa atatattcgg acggactcta cctcaaatgc5220ttatctaact atagaatgac atacaagcac aaccttgaaa atttgaaaat ataactacca5280atgaacttgt tcatgtgaat tatcgctgta tttaattttc tcaattcaat atataatatg5340
ccaatacatt gttacaagta gaaattaaga cacccttgat agccttacta tacctaacat5400gatgtagtat taaatgaata tgtaaatata tttatgataa gaagcgactt atttataatc5460attacatatt tttctattgg aatgattaag attccaatag aatagtgtat aaattattta5520tcttgaaagg agggatgcct aaaaacgaag aacattaaaa acatatattt gcaccgtcta5580atggatttat gaaaaatcat tttatcagtt tgaaaattat gtattatgga gctctgaaaa5640aaaggagagg ataaaga atg aag aaa ccg ttg ggg aaa att gtc gca agc 5690Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser-190-185acc gca cta ctc att tct gtt gct ttt agt tca tcg atc gca tcg 5735Thr Ala Leu Leu Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser-180-175-170gct gcc acc gga gcg ctc ccc cag tca ccc acc ccg gag gcc gac 5780Ala Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp-165-160-155gcg gtc tcc atg cag gag gcg ctc cag cgc gac ctc gac ctg acc 5825Ala Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr-150-145-140tcc gcc gag gcc gag gag ctg ctg gcc gcc cag gac acc gcc ttc 5870Ser Ala Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe-135-130-125gag gtc gac gag gcc gcg gcc gag gcc gcc ggg gac gcc tac ggc 5915Glu Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly-120-115-110ggc tcc gtc ttc gac acc gag agc ctg gaa ctg acc gtc ctg gtc acc 5963Gly Ser Val Phe Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr-105-100-95gat gcc gcc gcg gtc gag gcc gtg gag gcc acc ggc gcc ggg acc gag 6011Asp Ala Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu-90 -85 -80 -75ctg gtc tcc tac ggc atc gac ggt ctc gac gag atc gtc cag gag ctc 6059Leu Val Ser Tyr Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu-70 -65 -60aac gcc gcc gac gcc gtt ccc ggt gtg gtc ggc tgg tac ccg gac gtg 6107Asn Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val-55 -50 -45gcg ggt gac acc gtc gtc ctg gag gtc ctg gag ggt tcc gga gcc gac 6155Ala Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp-40 -35 -30gtc agc ggc ctg ctc gcg gac gcc ggc gtg gac gcc tcg gcc gtc gag 6203Val Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu-25 -20 -15gtg acc acg agc gac cag ccc gag ctc tac gcc gac atc atc ggt ggt 6251Val Thr Thr Ser Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly-10 -5 -1 1 5ctg gcc tac acc atg ggc ggc cgc tgt tcg gtc ggc ttc gcg gcc acc 6299
Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr10 15 20aac gcc gcc ggt cag ccc ggg ttc gtc acc gcc ggt cac tgc ggc cgc 6347Asn Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg25 30 35gtg ggc acc cag gtg acc atc ggc aac ggc agg ggc gtc ttc gag cag 6395Val Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln40 45 50tcc gtc ttc ccc ggc aac gac gcg gcc ttc gtc cgc ggt acg tcc aac 6443Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn55 60 65 70ttc acg ctg acc aac ctg gtc agc cgc tac aac acc ggc ggg tac gcc 6491Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala75 80 85acg gtc gcc ggt cac aac cag gcc ccc atc ggc tcc tcc gtc tgc cgc 6539Thr Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg90 95 100tcc ggc tcc acc acc ggt tgg cac tgc ggc acc atc cag gcc cgc ggc 6587Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly105 110 115cag tcg gtg agc tac ccc gag ggc acc gtc acc aac atg acc cgg acc 6635Gln Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr120 125 130acc gtg tgc gcc gag ccc ggc gac tcc ggc ggc tcc tac atc tcc ggc 6683Thr Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly135 140 145 150acc cag gcc cag ggc gtg acc tcc ggc ggc tcc ggc aac tgc cgc acc 6731Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr155 160 165ggc ggg acc acc ttc tac cag gag gtc acc ccc atg gtg aac tcc tgg 6779Gly Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp170 175 180ggc gtc cgt ctc cgg acc taatcgcatg ttcaatccgc tccataatcg 6827Gly Val Arg Leu Arg Thr185gtcgacgcgg cggttcgcgt ccggacagca catcaccgaa atattatgga agaaaatatc6887agcaccatga cggccaaacg gatgcttcca acggtgctaa ctatatcacg atgtcctaca6947actattatca cgatcatgat aaaagctcca ttttcggatc aagtgacagc aaaacctccg7007atgacggcaa attaaaaatt acgctgcatc ataaccgcta taaaaatatt gtccagcgcg7067cgccgagagt ccgcttcggg caagtgcacg tatacaacaa ctattatgaa ggaagcacaa7127gctcttcaag ttatcctttt agctatgcat ggggaatcgg aaagtcatct aaaatctatg7187cccaaaacaa tgtcattgac gtaccgggac tgtcagctgc taaaacgatc agcgtattca7247gcgggggaac ggctttatat gactccggca cgttgctgaa cggcacacag atcaacgcat7307cggctgcaaa cgggctgagc tcttctgtcg gctggacgcc gtctctgcat ggatcgattg7367
atgcttctgc taatgtgaaa tcaaatgtta taaatcaagc gggtgcgggt aaattaaatt7427aagaaagtga aaaacacaaa gggtgctaac ctttgtgttt tttaattaat taaaatgttt7487attaacttag ttaaggagta gaatggaaaa ggggatcgga aaacaagtat ataggaggag7547acctatttat ggcttcagaa aaagacgcag gaaaacagtc agcagtaaag cttgttccat7607tgcttattac tgtcgctgtg ggactaatca tctggtttat tcccgctccg tccggacttg7667aacctaaagc ttggcatttg tttgcgattt ttgtcgcaac aattatcggc tttatctcca7727agcccttgcc aatgggtgca attgcaattt ttgcattggc ggttactgca ctaactggaa7787cactatcaat tgaggataca ttaagcggat tcgggaataa gaccatttgg cttatcgtta7847tcgcattctt tatttcccgg ggatttatca aaaccggtct cggtgcgaga atttcgtatg7907tattcgttca gaaattcgga aaaaaaaccc ttggactttc ttattcactg ctattcagtg7967atttaatact ttcacctgct attccaagta atacggcgcg tgcaggaggc attatatttc8027ctattatcag atcattatcc gaaacattcg gatcaagccc ggcaaatgga acagagagaa8087aaatcggtgc attcttatta aaaaccggtt ttcaggggaa tctgatcaca tctgctatgt8147tcctgacagc gatggcggcg aacccgctga ttgccaagct ggcccatgat gtcgcagggg8207tggacttaac atggacaagc tgggcaattg ccgcgattgt accgggactt gtaagcttaa8267tcatcacgcc gcttgtgatt tacaaactgt atccgccgga aatcaaagaa acaccggatg8327cggcgaaaat cgcaacagaa aaactgaaag aaatgggacc gttcaaaaaa tcggagcttt8387ccatggttat cgtgtttctt ttggtgcttg tgctgtggat ttttggcggc agcttcaaca8447tcgacgctac cacaaccgca ttgatcggtt tggccgttct cttattatca caagttctga8507cttgggatga tatcaagaaa gaacagggcg cttgggatac gctcacttgg tttgcggcgc8567ttgtcatgct cgccaacttc ttgaatgaat taggcatggt gtcttggttc agtaatgcca8627tgaaatcatc cgtatcaggg ttctcttgga ttgtggcatt catcatttta attgttgtgt8687attattactc tcactatttc tttgcaagtg cgacagccca catcagtgcg atgtattcag8747catttttggc tgtcgtcgtg gcagcgggcg caccgccgct tttagcagcg ctgagcctcg8807cgttcatcag caacctgttc gggtcaacga ctcactacgg ttctggagcg gctccggtct8867tcttcggagc aggctacatc ccgcaaggca aatggtggtc catcggattt atcctgtcga8927ttgttcatat catcgtatgg cttgtgatcg gcggattatg gtggaaagta ctaggaatat8987ggtagaaaga aaaaggcaga cgcggtctgc ctttttttat tttcactcct tcgtaagaaa9047atggattttg aaaaatgaga aaattccctg tgaaaaatgg tatgatctag gtagaaagga9107cggctggtgc tgtggtgaaa aagcggttcc atttttccct gcaaacaaaa ataatggggc9167tgattgcggc tctgctggtc tttgtcattg gtgtgctgac cattacgtta gccgttcagc9227atacacaggg agaacggaga caggcagagc agctggcggt tcaaacggcg agaaccattt9287
cctatatgcc gccggttaaa gagctcattg agagaaaaga cggacatgcg gctcagacgc9347aagaggtcat tgaacaaatg aaagaacaga ctggtgcgtt tgccatttat gttttgaacg9407aaaaaggaga cattcgcagc gcctctggaa aaagcggatt aaagaaactg gagcgcagca9467gagaaatttt gtttggcggt tcgcatgttt ctgaaacaaa agcggatgga cgaagagtga9527tcagagggag cgcgccgatt ataaaagaac agaagggata cagccaagtg atcggcagcg9587tgtctgttga ttttctgcaa acggagacag agcaaagcat caaaaagcat ttgagaaatt9647tgagtgtgat tgctgtgctt gtactgctgc tcggatttat tggcgccgcc gtgctggcga9707aaagcatcag aaaggatacg ctcgggcttg aaccgcatga gatcgcggct ctatatcgtg9767agaggaacgc aatgcttttc gcgattcgag aagggattat tgccaccaat cgtgaaggcg9827tcgtcaccat gatgaacgta tcggcggccg agatgctgaa gctgcccgag cctgtgatcc9887atcttcctat agatgacgtc atgccgggag cagggctgat gtctgtgctt gaaaaaggag9947aaatgctgcc gaaccaggaa gtaagcgtca acgatcaagt gtttattatc aatacgaaag10007tgatgaatca aggcgggcag gcgtatggga ttgtcgtcag cttcagggag aaaacagagc10067tgaagaagct gatcgacaca ttgacagagg ttcgcaaata ttcagaggat ctcagggcgc10127agactcatga attttcaaat aagctttatg cgattttagg gctgc10172<210>14<211>380<212>PRT<213>人工的<220>
<223>合成的構(gòu)建體<400>14Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu-190-185-180Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly-175-170-165Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met-160-155-150Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala-145-140-135Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu-130-125-120Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe-115-110-105Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala-100-95 -90Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
-85 -80 -75Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp-70 -65 -60 -55Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr-50 -45 -40Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu-35 -30 -25Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser-20 -15 -10Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr-5 -1 1 5 10Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly15 20 25Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln30 35 40Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro45 50 55Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr60 65 70Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly75 80 85 90His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr95 100 105Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser110 115 120Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala125 130 135Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln140 145 150Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr155 160 165 170Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu175 180 185Arg Thr<210>15<211>35<212>DNA<213>人工的<220>
<223>引物<400>15ggagctctga aaaaaaggag aggataaaga atgaa35
<210>16<211>29<212>DNA<213>人工的<220>
<223>引物<400>16gcgttccgat aatcgcggtg acaatgccg 29<210>17<211>29<212>DNA<213>人工的<220>
<223>引物<400>17ttcatgagtc tgcgccctga gatcctctg 29<210>18<211>30<212>DNA<213>人工的<220>
<223>引物<400>18taatcgcatg ttcaatccgc tccataatcg 30<210>19<211>44<212>DNA<213>人工的<220>
<223>引物<400>19cccaacggtt tcttcattct ttatcctctc ctttttttca gagc 44<210>20<211>1164<212>DNA<213>人工的<220>
<223>蛋白酶22<220>
<221>CDS<222>(1)..(1164)<220>
<221>sig_peptide<222>(1)..(81)
<220>
<221>mat_peptide<222>(577)..(1164)<400>20atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt45Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu-190-185-180att tca gtg gca ttt agc tca tct att gca tca gca gct aca gga90Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly-175-170-165gca tta ccg cag tct ccg aca ccg gaa gca gat gca gtc tca atg135Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met-160-155-150caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca180Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala-145-140-135gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa225Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu-130-125-120gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt270Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe-115-110-105gat aca gaa tca ctt gaa ctt aca gtt ctt gtt aca gat gca gca gca318Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala-100-95 -90gtt gaa gca gtt gaa gca aca gga gca gga aca gta ctt gtt tca tat366Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr-85 -80 -75gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat414Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp-70 -65 -60 -55gct gtt ccg ggc gtt gtt ggc tgg tat ccg gat gtt gct gga gat aca462Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr-50 -45 -40gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg510Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu-35 -30 -25ctg gca gac gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca558Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser-20 -15 -10gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat tat606Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr-5 -1 1 5 10atg ggc ggc aga tgc agc gtt ggc ttt gca gca aca aat gca tca ggc654Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly15 20 25caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aca gtt ggc aca cca702Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro
30 35 40gtt tca att ggc aat ggc aaa ggc gtt ttt gaa cga agc att ttt ccg750Val Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro45 50 55ggc aat gat tca gca ttt gtt aga ggc aca tca aat ttt gca ctt aca798Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr60 65 70aat ctg gtt tca aga tat aat tca ggc ggc tat gca aca gtt gca ggc846Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly75 80 85 90cat aat caa gca ccg att ggc tca gca gtt tgc aga tca ggc tca aca894His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr95 100 105aca ggc tgg cat tgc ggc aca att caa gca aga aat caa aca gtt agg942Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg110 115 120tat ccg caa ggc aca gtt tat agt ctg aca aga aca aca gtt tgt gca990Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala125 130 135gaa ccg ggc gat tca ggc ggc tca tat att agc ggc act caa gca caa1038Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln140 145 150ggc gtt aca tca ggc ggc tca ggc aat tgc agt gct ggc ggc aca acg1086Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr155 160 165 170tat tac caa gaa gtt aat ccg atg ctt agt tca tgg ggc ctt aca ctt1134Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu175 180 185aga aca caa tcg cat gtt caa tcc gct cca1164Arg Thr Gln Ser His Val Gln Ser Ala Pro190 195<210>21<211>388<212>PRT<213>人工的<220>
<223>合成的構(gòu)建體<400>21Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu-190-185-180Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly-175-170-165Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met-160-155-150Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala-145-140-135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu-130-125-120Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe-115-110-105Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala-100-95 -90Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr-85 -80 -75Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp-70 -65 -60 -55Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr-50 -45 -40Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu-35 -30 -25Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser-20 -15 -10Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr-5 -1 1 5 10Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly15 20 25Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro30 35 40yal Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro45 50 55Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr60 65 70Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly75 80 85 90His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr95 100 105Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg110 115 120Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala125 130 135Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln140 145 150Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr155 160 165 170Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu175 180 185Arg Thr Gln Ser His Val Gln Ser Ala Pro190 19權(quán)利要求
1.親代蛋白酶的變體,包括位于選自以下區(qū)域組成的組的至少一個區(qū)域的至少一個位置中的取代6-18;22-28;32-39;42-58;62-63;66-76;78-100;103-106;111-114;118-131;134-136;139-141;144-151;155-156;160-176;179-181;和184-188;其中(a)所述變體具有蛋白酶活性;和(b)每個位置對應(yīng)SEQ ID NO2的氨基酸1-188的位置;和(c)所述變體與SEQ ID NO2的氨基酸1-188具有至少60%的同一性百分比。
2.權(quán)利要求1的變體,其包含位于以下位置中至少一個位置的取代6;7;8;9;10;11;12;13;14;15;16;17;18;22;23;24;25;26;27;28;32;33;34;35;36;37;38;39;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;62;63;66;67;68;69;70;71;72;73;74;75;76;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;103;104;105;106;111;112;113;114;118;119;120;121;122;123;124;125;126;127;128;129;130;131;134;135;136;139;140;141;144;145;146;147;148;149;150;151;155;156;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;179;180;181;184;185;186;187;和/或188.
3.權(quán)利要求2的變體,其包含位于以下位置中至少一個位置的取代6;7;8;9;10;12;13;16;17;18;22;23;24;25;26;27;28;32;33;37;38;39;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;58;62;63;66;67;68;69;70;71;72;73;74;75;76;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;103;105;106;111;113;114;118;120;122;124;125;127;129;130;131;134;135;136;139;140;141;144;145;146;147;148;149;150;151;155;156;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;179;180;181;184;185;186;187;和/或188.
4.權(quán)利要求3的變體,其包含以下取代中的至少一種6C;7P;8C;9C;10E,D;12E,D;13E,D,P;16C;17C;18C;22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;24C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;25C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;32C;33C;37C;39R,K;42E,D;43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,V,W,Y;45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,S,V,W,Y;50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;52C;55C;56R,K;58E,D;62C;63C;66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;76C;78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,V,W,Y;83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;86C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,V,W,Y;88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;89C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,V,W,Y;90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;92P,R,K;93P;94C,P;95E,D;96E,D,P;97R,K;98P;99R,K;103C;105C,P;106C;111R,K;113E,D;118R,K;120E,D;122K;124R,K;125P;127R,K;129E,D;130E,D;134C;135P;136P;139C;140E,D;141C;144C;145C;146C;147W;148C;149C;150E,D;151P,E,D;155C;156C;160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,T,V,W,Y;166A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,W,Y;167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;172C;173C;174P;175P;176P;180R,K;181R,K;184P;187P;和/或188R,K。
5.權(quán)利要求1-4之一的變體,其包含以下取代對中的至少一種6C+103C;8C+105C;76C+85C;94C+149C;55C+63C;16C+145C;33C+144C;62C+173C;106C+141C;9C+17C;18C+156C;32C+144C;37C+52C;67C+71C;134C+170C;139C+163C;146C+148C;和/或155C+172C.
6.權(quán)利要求5的變體,其包含以下取代對中的至少一種6C+103C;8C+105C;76C+85C;94C+149C;55C+63C;16C+145C;33C+144C;62C+173C;和/或106C+141C。
7.權(quán)利要求1-4之一的變體,其包含以下取代中的至少一種81P;82P;151P;176P;24P;25P;92P;93P;94P;96P;98P;105P;136P;184P;187P;174P;7P;13P;23P;27P;125P;135P;和/或175P。
8.權(quán)利要求7的變體,其包含以下取代中的至少一種81P;82P;151P;176P;24P;25P;92P;93P;94P;96P;98P;105P;136P;184P;和/或187P。
9.權(quán)利要求1-4之一的變體,其包含以下取代中的至少一種95E,D;42E,D;84E,D;96E,D;47E,D;46E,D;150E,D;70E,D;13E,D;140E,D;10E,D;151E,D;129E,D;130E,D;166E,D;161E,D;120E,D;82E,D;58E,D;12E,D;81E,D;69E,D;113E,D;89E,D;和/或160E,D。
10.權(quán)利要求9的變體,其包含以下取代中的至少一種95E,D;42E,D;84E,D;96E,D;47E,D;46E,D;150E,D;70E,D;13E,D;和/或140E,D.
11.權(quán)利要求1-4之一的變體,其包含以下取代中的至少一種124R,K;72R,K;97R,K;127R,K;56R,K;122R,K;181R,K;180R,K;25R,K;92R,K;39R,K;99R,K;111R,K;24R,K;118R,K;162R,K;和/或188R,K。
12.權(quán)利要求11的變體,其包含以下取代中的至少一種124R,K;72R,K;97R,K;127R,K;56R,K;122R,K;181R,K;180R,K;25R,K;和/或92R,K。
13.權(quán)利要求1-4之一的變體,其包含以下取代中的至少一種147W;43W。
14.權(quán)利要求1-4之一的變體,其包含位于選自以下區(qū)域組成的組的至少一個區(qū)域中至少一個位置的取代(i)160-170,78-90,43-50,66-75,和22-28;(ii)160-170,78-90,43-50,和66-75;(iii)160-170,78-90,和43-50;(iv)160-170,和78-90;和/或(v)160-170。
15.權(quán)利要求1-4之一的變體,其包含以下取代中的至少一種6C;8C;13E,D;16C;24P;25K,P,R;33C;42E,D;46D,E;47D,E;55C;56R,K;62C;63C;70D,E;72K,R;76C;81P;82P;84D,E;85C;92P,R,K;93P;94C,P;95E,D;96E,D,P;97R,K;98P;103C;105C,P;106C;122R,K;124R,K;127R,K;136P;140E,D;141C;144C;145C;149C;150E,D;151P;173C;176P;180R,K;181R,K;184P;和/或187P;優(yōu)選47D,49K,92K,127R,和/或166A。
16.權(quán)利要求1-3之一的變體,其包含以下取代中的至少一種G6C;L7P;A8C;Y9C;T10E,D,Y;G12E,D;G13E,D,P;S16C;V17C;G18C;T22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;A24C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A24S);A25C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A25S);G26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;P28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;T32C;A33C;G37C;R38T;V39R,K;Q42E,D,G,P;V43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;T44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T44S);I45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;G46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;G48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;R49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y(優(yōu)選R49T,Q);G50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;V51T;F52C;E53Q;Q54N,R;S55C;V56I,R,K;P58E,D;A62C,S;A63C;R66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;G67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;S69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;N70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;F71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;L73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;T74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;L76C;S78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;R79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;Y80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;N81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;T82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T82S);G83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Y85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;A86C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A86Q);T87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T87S);V88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;A89C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A89T,S);G90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;H91T,S;N92P,R,K,S;Q93P;A94C,P;P95A,E,D;I96A,E,D,P;G97R,K;S98P;S99A,Q,R,K;V100I;S103C;S105C,P;T106C;C111R,K;T113E,D;I114V;G118N,R,K;S120T,E,D;S122R,K;P124R,K;E125P,Q;T127R,K;T129E,D,Y,Q;N130E,D,S;M131L;T134C;T135P,N;V136P;E139C;P140E,D;G141C;G144C;G145C;S146C;Y147F,W;I148C;S149C;G150E,D;T151P,E,D,S;G155C;V156C;G160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;G162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;C164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;R165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y(優(yōu)選R165S);T166A,C,D,F(xiàn),E,G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T166V,F(xiàn));G167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;T170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;F171Y;Y172C;Q173C;E174P;V175P;T176N,P;V179I,L;N180R,K,S;S 181R,K;V184L,P;R185T;L186I;R187P;和/或T188R,K;優(yōu)選以下取代中的至少一種T10Y,A25S,R38T, Q42P,T44S,N47D,R49K,Q54R,V56I,A62S,T82S,N92K,S99A,G118N,S120T, S122R,E125Q,T127R,T129Y,N130S,M131L,R165S,T166A,F(xiàn)171Y,T176N,V179L,N180S,V184L,和/或R185T。
17.權(quán)利要求1-3之一的變體,其包含以下取代中的至少一種G6C;L7P;A8C;Y9C;Y10E,D,T;G12E,D;G13E,D,P;S16C;V17C;G18C;T22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;S24A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S24A);A25C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A25S);G26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;P28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;T32C;A33C;G37C;T38R;V39R,K;G42E,D,P,Q;V43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;T44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T44S);I45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;G46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;G48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T49R,Q);G50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T51V;F52C;Q53E;N54Q,R;S55C;V56I,R,K;P58E,D;A62C,S;A63C;R66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;G67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;S69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;N70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;F71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;L73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;T74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;L76C;S78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;R79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;Y80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;N81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;S82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S82T);G83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Y85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;Q86A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y(優(yōu)選Q86A);S87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S87T);V88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;T89A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T89A,S);G90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T91H,S;S92P,R,K,N;Q93P;A94C,P;P95A,E,D;A96E,D,I,P;G97R,K;S98P;A99R,K,S;V100I;S103C;S105C,P;T106C;C111R,K;T113E,D;I114V;N118G,R,K;T120E,D,S;R122K,S;P124R,K;Q125E,P;T127R,K;Y129E,D,T;S130E,D,N;L131M;T134C;N135P,T;V136P;E139C;P140E,D;G141C;G144C;G145C;S146C;F147W,Y;I148C;S149C;G150E,D;S151P,E,D,T;G155C;V156C;G160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;G162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;C164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S165R);V166A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,W,Y(優(yōu)選V166F,T);G167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;T170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;Y171F;Y172C;Q173C;E174P;V175P;T176P,N;I179L;V N180R,K,S;S181R,K;V184L,P;R185T;I186L;R187P;和/或T188R,K;優(yōu)選以下取代中的至少一種S24A,A25S,G42P,T44S,N47D,T49K,T51V, Q53E,N54R,V56I,A62S,Q86A,S87T,T89A,T91H,S92N,S92K,A96I,T127R,N135T,F(xiàn)147Y,S151T,V166A,T176N,I179L,N180S,V184L,R185T,和/或I186L。
18.權(quán)利要求1-3之一的變體,其包含以下取代中的至少一種G6C;L7P;A8C;Y9C;T10E,D,Y;G12E,D;G13E,D,P;S16C;V17C;G18C;T22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;A24C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A24S);A25C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A25S);G26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;P28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;T32C;A33C;G37C;R38T;V39R,K;Q42E,D,G,P;V43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;S44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S44T);I45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;G46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;G48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y(優(yōu)選Q49R,T);G50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;V51T;F52C;E53Q;Q54N,R;S55C;I56R,K;P58E,D;A62C,S;A63C;R66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;G67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;S69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;N70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;F71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;L73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;T74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;L76C;S78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;R79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;Y80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;N81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;T82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T82S);G83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Y85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;A86C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A86Q);T87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T87S);V88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;A89C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A89T,S);G90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;H91T,S;N92P,R,K,S;Q93P;A94C,P;P95A,E,D;I96A,E,D,P;G97R,K;S98P;S99A,Q,R,K;V100I;S103C;S105C,P;T106C;C111R,K;T113E,D;I114V;G118N,R,K;S120E,D,T;S122R,K;P124R,K;E125P,Q;T127R,K;T129E,D,Q,Y;N130E,D,S;M131L;T134C;T135N,P;V136P;E139C;P140E,D;G141C;G144C;G145C;S146C;Y147F,W;I148C;S149C;G150E,D;N151P,E,D,T;G155C;V156C;G160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;G162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;C164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;R165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y(優(yōu)選R165S);T166A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T166F,V);G167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;T170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;F 171Y;Y 172C;Q 173C;E 174P;V175P;T176N,P;V179I,L;N180R,K,S;S181R,K;V184L,P;R185T;L186I;R187P;和/或T188R,K;優(yōu)選以下取代中的至少一種T10Y,A25S,R38T,Q42P,N47D,Q49K,Q54R,A62S,T82S,N92K,S99A,G118N,S120T, S122R,E125Q,T127R,T129Y,N130S,M131L,N151T,R165S,T166A,F(xiàn)171Y,T176N,V179L,N180S,V184L,和/或R185T。
19.權(quán)利要求1-3之一的變體,其包含以下取代中的至少一種G6C;L7P;A8C;Y9C;T10E,D,Y;G12E,D;G13E,D,P;S16C;V17C;G18C;T22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;A24C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A24S);A25C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A25S);G26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;P28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;T32C;A33C;G37C;R38T;V39R,K;Q42E,D,G,P;V43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;T44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T44S);I45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;G46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;G48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;R49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y(優(yōu)選R49Q,T);G50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;V51T;F52C;E53Q;Q54N,R;S55C;I56R,K;P58E,D;A62C,S;A63C;R66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;G67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;S69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;N70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;F71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;L73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;T74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;L76C;S78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;R79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;Y80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;N81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;T82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T82S);G83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Y85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;A86C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A86Q);T87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T87S);V88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;A89C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A89S,T);G90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;H91T,S;N92P,R,K,S;Q93P;A94C,P;P95A,E,D;I96A,E,D,P;G97R,K;S98P;S99A,Q,R,K;V100I;S103C;S105C,P;T106C;C111R,K;T113E,D;I114V;G118N,R,K;S120E,D,T;S122R,K;P124R,K;E125P,Q;T127R,K;T129E,D,Q,Y;N130E,D,S;M131L;T134C;T135N,P;V136P;E139C;P140E,D;G141C;G144C;G145C;S146C;Y147F,W;I148C;S149C;G150E,D;N151P,E,D,S,T;G155C;V156C;G160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;G162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;C164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;R165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y(優(yōu)選R165S);T166A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T166V);G167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;T170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;F171Y;Y172C;Q173C;E174P;V175P;T176N,P;V179I,L;N180R,K,S;S181R,K;V184L,P;R185T;L186I;R187P;和/或T188R,K;優(yōu)選以下取代中的至少一種T10Y,A25S,R38T,G42P,T44S,N47D,R49K,Q54R,A62S,T82S,N92K,S99A,G118N,S120T,S122R,E125Q,T127R,T129Y,N130S,M131L,N151T,R165S,T166A,F(xiàn)171Y,T176N,V179L,N180S,V184L,和/或R185T。
20.權(quán)利要求1-3之一的變體,其包含以下取代中的至少一種G6C;L7P;A8C;Y9C;T10E,D,Y;G12E,D;G13E,D,P;S16C;V17C;G18C;T22A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N23A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;A24C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選A24S);S25A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S25A);G26A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q27A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y;P28A,C,D,E,F(xiàn),G,H,I,K,L,M,N,Q,R,S,T,V,W,Y;T32C;A33C;G37C;T38R;V39R,K;P42E,D,G,Q;V43A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;S44A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S44T);I45A,C,D,E,F(xiàn),G,H,K,L,M,N,P,Q,R,S,T,V,W,Y;G46A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N47A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;G48A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Q49A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,S,T,V,W,Y(優(yōu)選Q49R,T);G50A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;V51T;F52C;E53Q;R54N,Q;S55C;V56I,R,K;P58E,D;S62A,C;A63C;R66A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;G67A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T68A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;S69A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;N70A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;F71A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T72A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;L73A,C,D,E,F(xiàn),G,H,I,K,M,N,P,Q,R,S,T,V,W,Y;T74A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;N75A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;L76C;S78A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;R79A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,S,T,V,W,Y;Y80A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;N81A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;T82A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T82S);G83A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G84A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;Y85A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W;A86C,D,E,F(xiàn),G,H,I,K,L,M,N,P,R,Q,S,T,V,W,Y(優(yōu)選A86Q);T87A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y(優(yōu)選T87S);V88A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,W,Y;S89A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S89A,T);G90A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S91H,T;S92P,R,K,N;Q93P;A94C,P;A95E,D,P;I96A,E,D,P;G97R,K;S98P;Q99A,R,K,S;I100V;S103C;S105C,P;T106C;C111R,K;T113E,D;V114I;G118N,R,K;T120E,D,S;S122R,K;P124R,K;Q125E,P;T127R,K;Q129E,D,Y,T;N130E,D,S;L131M;T134C;N135P,T;V136P;E139C;P140E,D;G141C;G144C;G145C;S146C;F147W,Y;I148C;S149C;G150E,D;S151P,E,D,T;G155C;V156C;G160A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S161A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y;G162A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;N163A,C,D,E,F(xiàn),G,H,I,K,L,M,P,Q,R,S,T,V,W,Y;C164A,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;S165A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,T,V,W,Y(優(yōu)選S165R);F166A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y(優(yōu)選F166,T,V);G167A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;G168A,C,D,E,F(xiàn),H,I,K,L,M,N,P,Q,R,S,T,V,W,Y;T169A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;T170A,C,D,E,F(xiàn),G,H,I,K,L,M,N,P,Q,R,S,V,W,Y;Y171F;Y172C;Q173C;E174P;V175P;T176N,P;L179I,V;S180R,K,N;S181R,K;L184P,V;T185R;L186I;R187P;和/或T188R,K;優(yōu)選以下取代中的至少一種T10Y,N47D,Q49K,V56I,T82S,S89A,S91H,S92N,S92K,A95P,Q99A,I100V,V114I,G118N,S122R,T127R,Q129Y,N130S,N135T,F(xiàn)147Y,S151T,和/或F166A.
21.分離的核酸序列,其包含編碼權(quán)利要求1-20之一的蛋白酶變體的核酸序列。
22.核酸構(gòu)建體,其包含權(quán)利要求21的核酸序列,所述核酸序列可操作連接于一或多個控制序列,其指導(dǎo)所述蛋白酶變體在適宜表達(dá)宿主中的產(chǎn)生。
23.重組表達(dá)載體,其包含權(quán)利要求22的核酸構(gòu)建體。
24.重組宿主細(xì)胞,其包含權(quán)利要求22的核酸構(gòu)建體和/或權(quán)利要求23的表達(dá)載體。
25.制備權(quán)利要求1-20之一的蛋白酶變體的方法,包括(a)培養(yǎng)權(quán)利要求24的宿主細(xì)胞以制備包含所述變體的上清;和(b)回收所述變體。
26.轉(zhuǎn)基因植物或植物部分,其能夠表達(dá)權(quán)利要求1-20之一的蛋白酶變體。
27.轉(zhuǎn)基因非人動物,或其產(chǎn)物,或其成分,能夠表達(dá)權(quán)利要求1-20之一蛋白酶變體。
28.動物飼料添加劑,包括權(quán)利要求1-20之一中至少一種蛋白酶變體,和(a)至少一種脂溶性維生素;(b)至少一種水溶性維生素;和/或(c)至少一種痕量礦物質(zhì)。
29.動物飼料組合物,其粗蛋白含量為50-800g/kg并包含權(quán)利要求1-20之一蛋白酶變體。
30.改進(jìn)動物飼料的營養(yǎng)價值的方法,其中權(quán)利要求1-20之一蛋白酶變體,和/或權(quán)利要求28或29之一的組合物被加入所述飼料。
31.處理蛋白質(zhì)的方法,包括將權(quán)利要求1-20之一蛋白酶變體,和/或權(quán)利要求28或29之一的組合物加入至少一種蛋白質(zhì)或蛋白質(zhì)來源的步驟。
32.權(quán)利要求1-20之一蛋白酶變體,和/或權(quán)利要求28或29之一的組合物在以下方面的用途(i)動物飼料中;(ii)動物飼料的制備中;(iii)用于改善動物飼料的營養(yǎng)價值;和/或(iv)用于處理蛋白質(zhì)。
33.權(quán)利要求1-20之一蛋白酶變體在清潔劑中的用途。
34.具有以下3D結(jié)構(gòu)的蛋白酶i)與圖2的3D結(jié)構(gòu)的坐標(biāo)提供的結(jié)構(gòu)重疊,ii)類似于圖2的3D結(jié)構(gòu)的坐標(biāo)提供的結(jié)構(gòu),iii)基本類似于圖2的3D結(jié)構(gòu)的坐標(biāo)提供的結(jié)構(gòu),或iv)與圖2的3D結(jié)構(gòu)的坐標(biāo)提供的結(jié)構(gòu)相同。
35.3D結(jié)構(gòu),包括圖2的坐標(biāo)提供的結(jié)構(gòu)或由圖2的坐標(biāo)提供的結(jié)構(gòu)組成。
36.權(quán)利要求35的3D結(jié)構(gòu),其具有蛋白酶活性。
全文摘要
本發(fā)明涉及編碼擬諾卡氏菌屬蛋白酶的新的3D結(jié)構(gòu),以及與擬諾卡氏菌屬蛋白酶同源的親本蛋白酶的變體,優(yōu)選具有改進(jìn)的熱穩(wěn)定性和/或具有改變的溫度活性圖譜。本發(fā)明還涉及編碼所述變體的DNA序列,它們在重組宿主中的制備,以及利用所述變體的方法,特別是在動物飼料以及清潔劑的領(lǐng)域中。本發(fā)明還涉及產(chǎn)生和制備具有改變的性質(zhì)的蛋白酶變體的方法。
文檔編號C12N15/57GK1867668SQ200480029772
公開日2006年11月22日 申請日期2004年10月8日 優(yōu)先權(quán)日2003年10月10日
發(fā)明者倫納多·德馬里亞, 卡斯滕·安德森, 拉斯·L·H·克里斯坦森, 索倫·F·拉森, 彼得·R·奧斯特加德 申請人:諾維信公司