專(zhuān)利名稱(chēng):表達(dá)超熱穩(wěn)定蛋白酶的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在工業(yè)應(yīng)用中作為酶使用的超熱穩(wěn)定蛋白酶,編碼該酶的基因以及通過(guò)遺傳工程技術(shù)產(chǎn)生該酶的方法。
背景技術(shù):
蛋白酶是一種切割蛋白中肽鍵的酶。許多上述酶已在動(dòng)物、植物和微生物中發(fā)現(xiàn)。蛋白酶可作為實(shí)驗(yàn)室使用的試劑和作為藥物以及在工業(yè)領(lǐng)域,如作為添加劑用于去垢劑,用于處理食品及用于利用逆反應(yīng)進(jìn)行化學(xué)合成。因此,可以說(shuō)該蛋白酶是工業(yè)上極其重要的酶。由于用于工業(yè)領(lǐng)域的蛋白酶需要高度的物理和化學(xué)穩(wěn)定性,在其它酶類(lèi)中熱穩(wěn)定酶是優(yōu)選使用的。因?yàn)檠挎邨U菌屬的細(xì)菌產(chǎn)生的蛋白酶表現(xiàn)為相對(duì)高的熱穩(wěn)定性,它們主要作為工業(yè)用途的蛋白酶。然而,在尋找更為優(yōu)異的酶中,想方設(shè)法從高溫下生長(zhǎng)的微生物中獲得該酶,例如,從芽孢桿菌屬的嗜熱細(xì)菌或超嗜熱菌中獲得。
例如,熟知的超嗜熱菌激烈熱球菌產(chǎn)生一種蛋白酶(應(yīng)用環(huán)境微生物學(xué),561992-1998(1990);FEMS微生物學(xué)通訊,7117-20(1990);遺傳微生物學(xué)雜志,1371193-1199(1991))。
此外,據(jù)報(bào)道嗜熱菌熱球菌屬菌株KOD1產(chǎn)生一種硫醇基蛋白酶(半胱氨酸蛋白酶)(應(yīng)用環(huán)境微生物學(xué),604559-4566(1994))。也已知超嗜熱菌熱球菌屬、葡萄嗜熱菌屬、棲熱擬芽孢桿菌屬產(chǎn)生蛋白酶(應(yīng)用微生物學(xué)生物技術(shù),34715-719(1991))。
如上面描述的來(lái)自嗜熱菌的蛋白酶具有高度熱穩(wěn)定性。因此,可預(yù)計(jì)它們可用于代替目前正使用的熱穩(wěn)定蛋白酶或用于還未考慮使用蛋白酶的領(lǐng)域。
然而,大部分產(chǎn)生這些酶的微生物僅在高溫下生長(zhǎng)。例如,激烈熱球菌需要在90-100℃培養(yǎng)。在上述高溫下培養(yǎng)從能量消耗的角度看是不利的。此外,來(lái)自超嗜熱菌的蛋白酶生產(chǎn)力比常規(guī)微生物蛋白酶的生產(chǎn)力低。所以,工業(yè)上從超嗜熱菌產(chǎn)生蛋白酶的方法存在問(wèn)題。
另外,用遺傳工程技術(shù)通過(guò)分離目的酶的基因并將其導(dǎo)入到容易培養(yǎng)的宿主微生物中產(chǎn)生該酶的方法,是本領(lǐng)域目前的常規(guī)方法。然而,該酶的基因?qū)氲剿拗髦胁⒉豢偸侨珙A(yù)期的那樣有效地表達(dá)。據(jù)信主要原因是導(dǎo)入基因的GC含量或密碼子使用與宿主的基因不同。
因此,需要對(duì)導(dǎo)入的每個(gè)基因和/或每個(gè)宿主優(yōu)化表達(dá)方法,以便達(dá)到符合設(shè)計(jì)用途的酶的合適生產(chǎn)力。
本發(fā)明的目的本發(fā)明的目的是提供工業(yè)使用有利的來(lái)自超嗜熱菌的蛋白酶,從該超嗜熱菌中分離編碼該蛋白酶的基因和提供利用該基因通過(guò)遺傳工程技術(shù)產(chǎn)生超熱穩(wěn)定性蛋白酶的方法,以便解決上面所述的問(wèn)題。
本發(fā)明概述由超嗜熱菌產(chǎn)生的蛋白酶中,一些種類(lèi)根據(jù)其氨基酸序列的同源性分類(lèi)為枯草桿菌蛋白酶型堿性蛋白酶。當(dāng)編碼該蛋白酶的基因被導(dǎo)入到枯草芽孢桿菌中時(shí)(枯草芽孢桿菌一般通過(guò)遺傳工程技術(shù)用于生產(chǎn)),該酶的生產(chǎn)力比由枯草芽孢桿菌內(nèi)源產(chǎn)生的蛋白的生產(chǎn)力更低。
本發(fā)明者經(jīng)深入的研究并發(fā)現(xiàn),通過(guò)把編碼來(lái)源于枯草桿菌蛋白酶信號(hào)肽的基因(信號(hào)序列)置于來(lái)源于超嗜熱菌待表達(dá)的蛋白酶基因的上游,然后修飾切割位點(diǎn)周?chē)陌被嵝蛄?,該目的基因?qū)⒃诳莶菅挎邨U菌中高效表達(dá)。此外,還發(fā)現(xiàn)通過(guò)把來(lái)源于目的超嗜熱菌的蛋白酶基因中酶活性非必需的部分缺失、可增加所述的酶的表達(dá)水平。至此,完成了本發(fā)明。
本發(fā)明概括如下。本發(fā)明的第一個(gè)發(fā)明是一種具有由序列表SEQ IDNO1給出的氨基酸序列的熱穩(wěn)定蛋白酶和一種具有如下氨基酸序列及熱穩(wěn)定蛋白酶活性的蛋白酶,在該氨基酸序列中,一個(gè)或幾個(gè)氨基酸殘基被缺失、替換、插入或添加到序列表SEQ ID NO1給出的氨基酸序列中形成。
本發(fā)明的第二個(gè)發(fā)明是一種編碼第一個(gè)發(fā)明的熱穩(wěn)定蛋白酶的基因和一種能與該基因雜交的熱穩(wěn)定蛋白酶基因。
本發(fā)明的第三個(gè)發(fā)明是通過(guò)遺傳工程技術(shù)將來(lái)源于超嗜熱菌的基因用于生產(chǎn)熱穩(wěn)定蛋白酶,其特征是該基因編碼如通式I表示的氨基酸序列SIG-Ala-Gly-Gly-Asn-PRO [I]其中,SIG代表來(lái)源于枯草桿菌蛋白酶信號(hào)肽的氨基酸序列,PRO代表待表達(dá)的蛋白的氨基酸序列。優(yōu)選地是,SIG是由序列表SEQ IDNO3給出的氨基酸序列。優(yōu)選地是,PRO是來(lái)源于超嗜熱菌的超熱穩(wěn)定蛋白酶的氨基酸序列,更優(yōu)選地是,來(lái)源于激烈熱球菌的蛋白酶的氨基酸序列。
本發(fā)明的第四個(gè)發(fā)明涉及一種通過(guò)遺傳工程技術(shù)產(chǎn)生蛋白質(zhì)的方法,其特征在于該方法包括培養(yǎng)已導(dǎo)入第三個(gè)發(fā)明的基因的芽孢桿菌屬細(xì)菌,然后從培養(yǎng)物中收集目的蛋白。
本發(fā)明的第五個(gè)發(fā)明是用于通過(guò)遺傳工程技術(shù)生產(chǎn)蛋白的一種質(zhì)粒,其特征在于第三個(gè)發(fā)明的基因已插入到質(zhì)粒中。
在氨基酸序列中一個(gè)至幾個(gè)氨基酸殘基諸如缺失、替換、插入或添加的突變,可在天然產(chǎn)生的蛋白及由本發(fā)明披露的蛋白中產(chǎn)生。上述突變可能由于編碼該蛋白的基因的多態(tài)性或突變產(chǎn)生,或者由于蛋白的體內(nèi)修飾或合成后純化過(guò)程中產(chǎn)生。不過(guò),已知上述突變蛋白表現(xiàn)的生理學(xué)和生物學(xué)活性與未突變的蛋白相等。這可用于如下蛋白中,在該蛋白中上述突變已人為地導(dǎo)入到其氨基酸序列中,在該情況下,可能產(chǎn)生大量的各種突變。例如,眾所周知的在人白介素-2(IL-2)的氨基酸序列中的半胱氨酸殘基被絲氨酸殘基替換的多肽仍保持白介素-2的活性(科學(xué),2241431(1984))。因此,具有在本發(fā)明披露的氨基酸序列中一個(gè)或幾個(gè)氨基酸殘基缺失、替換、插入或添加而形成的氨基酸序列及其蛋白酶活性與本發(fā)明的蛋白酶相等的蛋白酶也在本發(fā)明的范圍之內(nèi)。
至于本文所用的“(與特定的基因)雜交的基因”是一種具有的堿基序列與特定基因的序列相似的基因。有可能具有的堿基序列與特定基因的序列相似的基因編碼一種具有氨基酸序列的蛋白,其功能與由特定基因編碼的蛋白相似?;驂A基序列的相似性可通過(guò)在嚴(yán)格條件下確定基因或其部分互相之間是否形成雜交體(雜交)而檢查出來(lái)。通過(guò)使用該方法,能獲得所編碼的蛋白與特定基因編碼的蛋白具有相似功能的基因。這就是說(shuō)具有與本發(fā)明的基因的堿基序列相似的基因可通過(guò)使用本發(fā)明獲得的基因或其部分作為探針,按照熟知的方法進(jìn)行雜交而獲得。雜交可按如下方法進(jìn)行,例如,T.Maniatis等編著,分子克隆實(shí)驗(yàn)室手冊(cè)第二版,冷泉港實(shí)驗(yàn)室出版,1989,書(shū)中所描述的方法。更具體而言,雜交在下列條件下進(jìn)行。簡(jiǎn)言之,固定有DNAs的雜交膜在含有0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400,0.01%變性鮭精DNA的6×SSC(1×SSC表示為0.15MNaCl,0.015M檸檬酸鈉,pH7.0)中,和探針在50℃溫育12-20小時(shí)。溫育后,洗滌雜交膜直到固定的DNAs信號(hào)與背景能區(qū)別為止,開(kāi)始洗滌在含0.5%SDS的2×SSC中37℃下進(jìn)行,然后降低SSC濃度至0.1×和提高溫度至50℃。
另外,作為雜交的替代方法,可應(yīng)用基因擴(kuò)增方法(如,PCR方法),該法用本發(fā)明獲得的基因的部分堿基序列作為引物。因此所獲得的基因是否編碼具有目的功能的蛋白,能通過(guò)利用合適的宿主和合適的表達(dá)系統(tǒng)表達(dá)該基因,然后檢查所得到蛋白的活性的方法確定。
附圖簡(jiǎn)述
圖1是質(zhì)粒pSTC 3的限制性酶圖譜。
圖2比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖3比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖4比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖5比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖6是質(zhì)粒pSNP 1的限制性酶切圖譜。
圖7是質(zhì)粒pPS 1的限制性酶切圖譜。
圖8是質(zhì)粒pNAPS 1的限制性酶切圖譜。
發(fā)明詳述根據(jù)本發(fā)明的超熱穩(wěn)定蛋白酶包括來(lái)自各種超嗜熱菌的蛋白酶。例如,WO 95/34645描述的來(lái)自激烈熱球菌和速生熱球菌的蛋白酶。
來(lái)自激烈熱球菌DSM 3638的蛋白酶基因是從該菌株的基因組DNA文庫(kù)中,根據(jù)表達(dá)熱穩(wěn)定蛋白酶活性而分離得到。含有該基因的質(zhì)粒被命名為質(zhì)粒pTPR 12。用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM 109被命名并且表示為大腸桿菌JM 109/pTPR 12,于1994年5月24日(最初保藏日期)根據(jù)布達(dá)佩斯條約保藏在日本茨城縣筑波市東1丁目1番3號(hào),通商產(chǎn)業(yè)省工業(yè)技術(shù)院生命工學(xué)和人體技術(shù)研究所,登記號(hào)FERM BP-5103。
該蛋白酶下文命名為蛋白酶PFUL。蛋白酶PFUL是一種具有高度熱穩(wěn)定性并且甚至在95℃下也表現(xiàn)蛋白酶活性的蛋白酶。
已經(jīng)測(cè)定了來(lái)源于激烈熱球菌插入到質(zhì)粒pTPR 12的DNA片段的堿基序列。在該DNA片段中以2個(gè)DraI位點(diǎn)為邊界大約4.8kb的部分堿基序列插入到質(zhì)粒pTPR 12中,在序列表SEQ ID NO5中顯示。此外,根據(jù)堿基序列推導(dǎo)的基因產(chǎn)物的氨基酸序列在序列表SEQ IDNO6中顯示。換言之,在序列表SEQ ID NO6中顯示的氨基酸序列是蛋白酶PFUL的氨基酸序列。如在序列中顯示的那樣,蛋白酶PFUL由1398個(gè)氨基酸殘基組成,是一種超過(guò)150,000的高分子量蛋白酶。
將序列表SEQ ID NO6中顯示的蛋白酶PFUL的氨基酸序列與熟知的來(lái)源于微生物的蛋白酶的氨基酸序列進(jìn)行比較顯示,蛋白酶PFUL的第一個(gè)半部分的氨基酸序列與以枯草桿菌蛋白酶為代表的系列堿性絲氨酸蛋白酶有同源性(蛋白工程,4719-737(1991)),所存在的大約4個(gè)氨基酸殘基的極其高度同源性據(jù)信對(duì)蛋白酶的催化活性是重要的。
如上所述,發(fā)現(xiàn)來(lái)源于嗜溫菌的蛋白酶中的共同區(qū)域在由超嗜熱菌激烈熱球菌產(chǎn)生的蛋白酶PFUL的氨基酸序列中是保守的。因此,可預(yù)期由不是激烈熱球菌的超嗜熱菌產(chǎn)生的同源蛋白酶也具有該區(qū)域。
例如進(jìn)行PCR能篩選出編碼超熱穩(wěn)定蛋白酶的基因,用來(lái)自各種超嗜熱菌的染色體DNA作為模板,寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的組合作為引物。根據(jù)在蛋白酶PFUL基因中編碼顯示為與枯草桿菌蛋白酶高度同源的區(qū)域的堿基序列或蛋白酶PFUL的氨基酸序列之間相似的序列,合成這些寡核苷酸。寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的堿基序列分別在序列表SEQ ID NOS7、8、9和10中顯示。
由于根據(jù)本發(fā)明的蛋白酶來(lái)源于超嗜熱菌,能用屬于激烈熱球菌屬、熱球菌屬、葡萄嗜熱菌屬、熱擬芽孢桿菌屬等細(xì)菌。至于屬于熱球菌屬的細(xì)菌,例如能用速生熱球菌DSM 2476。該菌株可從DeutscheSammlung Von Mikroorganismen und Zellkulturen GmbH得到。當(dāng)用來(lái)源于速生熱球菌DSM 2476的染色體DNA作為模板和寡核苷酸PRO-1F和PRO-2R或寡核苷酸PRO-2F和Pro-4R的組合作為引物進(jìn)行PCR時(shí),能擴(kuò)增出特異的DNA片段,表明存在蛋白酶基因。此外,通過(guò)該DNA片段被插入到合適的質(zhì)粒載體中創(chuàng)造重組質(zhì)粒,然后用雙脫氧法測(cè)定該插入DNA片段的堿基序列,能推導(dǎo)出由該片段編碼的氨基酸序列。結(jié)果證明上述的DNA片段編碼的氨基酸序列與蛋白酶PFUL和來(lái)自各種微生物的堿性絲氨酸蛋白酶的氨基酸序列同源,以及PCR擴(kuò)增的DNA片段是從蛋白酶基因作為模板擴(kuò)增的。
下一步,用該P(yáng)CR-擴(kuò)增的DNA片段或如上所述的寡核苷酸作為探針,篩選來(lái)自超嗜熱菌的基因文庫(kù),能得到編碼超熱穩(wěn)定蛋白酶的基因(例如,由速生熱球菌產(chǎn)生的編碼超熱穩(wěn)定蛋白酶的基因)。
例如,用PCR-擴(kuò)增的DNA片段作為探針,針對(duì)文庫(kù)進(jìn)行噬菌斑雜交,能獲得含有目的基因的噬菌體克隆。通過(guò)把λGEM-11載體(Promega)和來(lái)自速生熱球菌DSM 2476用限制性酶Sau 3AI部分消化的染色體DNA的DNA片段連接起來(lái),然后用體外包裝方法將它們包裝到λ噬菌體顆粒中,產(chǎn)生上述的文庫(kù)。
通過(guò)分析由此獲得的一個(gè)噬菌體克隆中含有的DNA片段,發(fā)現(xiàn)蛋白酶基因存在于大約1.9kb的SacI片段中。此外,還發(fā)現(xiàn)通過(guò)測(cè)定其堿基序列該片段缺乏蛋白酶基因的5′區(qū)。用盒和盒引物(Takara Shuzo基因技術(shù)產(chǎn)物指導(dǎo),1994-1995,pp.250-251)用PCR能獲得5′區(qū)。因此,能獲得包括超熱穩(wěn)定蛋白酶5′區(qū)的DNA片段,在質(zhì)粒pTCS 6中缺乏5′區(qū)。此外,來(lái)源于速生熱球菌的整個(gè)超熱穩(wěn)定蛋白酶基因的堿基序列能從2個(gè)DNA片段的堿基序列確定。
在測(cè)定過(guò)的堿基序列中找到的可讀框的堿基序列在序列表的SEOID NO11中顯示,并且從該堿基序列推導(dǎo)的氨基酸序列在序列表的SEQ ID NO12中顯示。因而確定了來(lái)源于速生熱球菌編碼超熱穩(wěn)定蛋白酶基因的堿基序列和該蛋白酶的氨基酸序列。該蛋白酶被命名為蛋白酶TCES。
可構(gòu)建表達(dá)載體,在該載體中通過(guò)把2個(gè)DNA片段結(jié)合在一起重組整個(gè)蛋白酶TCES基因。然而,當(dāng)用大腸桿菌作為宿主時(shí),目的表達(dá)質(zhì)粒導(dǎo)入其中的轉(zhuǎn)化體沒(méi)有得到,可能由于在細(xì)胞中來(lái)自基因表達(dá)的產(chǎn)物的產(chǎn)生對(duì)大腸桿菌可能是有害的或致死的。在上述情況下,例如,可用枯草芽孢桿菌作為宿主,使蛋白酶分泌到細(xì)胞外,然后測(cè)定其活性。
至于枯草芽孢桿菌菌株,可用枯草芽孢桿菌DB 104,它是在“基因”83215-233(1989)描述過(guò)的熟知的菌株。至于克隆載體,用質(zhì)粒pUB 18-P43,它由Calgary大學(xué)Sui-Lam Wong博士饋贈(zèng)。該質(zhì)粒含有的卡那霉素抗性基因作為選擇標(biāo)志。
在質(zhì)粒載體pUB 18-P43中P43啟動(dòng)子的下游插入蛋白酶TCES基因所形成的重組質(zhì)粒被命名為質(zhì)粒pSTC 3。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名并表示為枯草芽孢桿菌DB 104/pST 3,于1995年12月1日(最初的保藏日期)根據(jù)布達(dá)佩斯條約保藏在通產(chǎn)省工業(yè)技術(shù)院生命工學(xué)和人體技術(shù)研究所,日本,茨城縣筑波市東1丁目1番3號(hào),登記號(hào)為FERM BP-5635。
質(zhì)粒pSTC 3的限制性酶圖譜在圖1顯示。在圖1中,粗線(xiàn)表示插入到質(zhì)粒載體pUB 18-P43中的DNA片段。
熱穩(wěn)定蛋白酶活性可在枯草芽孢桿菌DB 104/pSTC 3的培養(yǎng)物上清液中和細(xì)胞抽提液中找到。
從轉(zhuǎn)化體培養(yǎng)物中得到的蛋白酶粗酶制備物的主要特性如下(1)作用降解酪蛋白和明膠而產(chǎn)生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產(chǎn)生熒光物質(zhì)(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對(duì)-硝基酰苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產(chǎn)生黃色物質(zhì)(對(duì)硝基苯胺)。
(2)最適溫度在37-95℃下表現(xiàn)為酶活性,最適溫度為70-80℃。
(3)最適pH在pH5.5-9下表現(xiàn)為酶活性,最適pH為pH7-8。
(4)熱穩(wěn)定性在80℃處理3小時(shí)后仍保持90%或更高的酶活性。
當(dāng)把蛋白酶PFUL、蛋白酶TCES和枯草桿菌蛋白酶(枯草桿菌蛋白酶BNP′;核酸研究,117911-7925(1983))排列在一起,使同源區(qū)互相配對(duì)如在圖2-5顯示的那樣時(shí),發(fā)現(xiàn)蛋白酶PFUL的同源區(qū)之間和C-末端存在的序列,在蛋白酶TCES或枯草桿菌蛋白酶中未找到。根據(jù)這些結(jié)果,在激烈熱球菌中,除了蛋白酶PFUL外可能存在具有的分子量比蛋白酶PFUL更低并與蛋白酶TCES或枯草桿菌蛋白酶相似的蛋白酶。
因此,用來(lái)自同源區(qū)的DNA探針進(jìn)行針對(duì)從激烈熱球菌制備的染色體DNA的Southern雜交,并觀(guān)察到除蛋白酶PFUL基因外的信號(hào),這表明存在另一種蛋白酶基因。
這種新型的蛋白酶基因通過(guò)下列方法分離。
例如,通過(guò)合適的限制性酶消化來(lái)自激烈熱球菌的染色體DNA,然后按上面所述的方法對(duì)消化過(guò)的DNA進(jìn)行Southern雜交,可獲得含有編碼新蛋白酶基因的DNA片段。測(cè)定該DNA片段的堿基序列,以確認(rèn)該堿基序列編碼的氨基酸序列與上面提到的蛋白酶同源。如果該DNA片段不含有整個(gè)目的基因,剩余的部分可通過(guò)逆向PCR法或相似的方法進(jìn)一步獲得。
例如,當(dāng)用限制性酶SacI和SpeI(Takara Shuzo)消化來(lái)自激烈熱球菌的染色體DNA然后用于Southern雜交時(shí),觀(guān)察到大小大約為0.6kb的信號(hào)。該大小的DNA片段被重新得到,插入到質(zhì)粒載體pBluescriptSK(-)(Stratagene)中的SpeI-SacI位點(diǎn)之間,然后用產(chǎn)生的重組質(zhì)粒轉(zhuǎn)化大腸桿菌JM 109。用相同的探針,按上述Southern雜交所用的方法進(jìn)行集落雜交,從轉(zhuǎn)化體中能獲得目的片段插入其中的克隆。從獲得的克隆含有的質(zhì)粒是否擁有編碼所述的蛋白酶的序列,能用測(cè)定插入到質(zhì)粒中的DNA片段的堿基序列確定。因而確認(rèn)了在該質(zhì)粒中存在蛋白酶基因。該質(zhì)粒被命名為質(zhì)粒pSS 3。
發(fā)現(xiàn)從插入到質(zhì)粒pSS 3中的DNA片段的堿基序列推導(dǎo)的氨基酸序列與枯草桿菌蛋白酶、蛋白酶PFUL、蛋白酶TCES等的序列具有同源性。與蛋白酶PFUL基因不同的該蛋白酶基因的產(chǎn)物,其部分最近按上述的方法從激烈熱球菌中得到,被命名為蛋白酶PFUS。編碼該蛋白酶的N-末端和C-末端區(qū)的區(qū)域能用逆向PCR法獲得。
用于逆向PCR的引物可根據(jù)插入在質(zhì)粒pSS 3中的DNA片段的堿基序列制備。用合適的限制性酶消化來(lái)自激烈熱球菌的染色體DNA,然后將產(chǎn)生的DNA片段進(jìn)行分子內(nèi)連接反應(yīng)。通過(guò)用反應(yīng)混合物作模板和上述提到的引物進(jìn)行PCR,能獲得在質(zhì)粒pSS 3中含有的該蛋白酶基因片段側(cè)翼區(qū)相應(yīng)的DNA片段。由這些區(qū)域編碼的酶蛋白的氨基酸序列可通過(guò)分析所獲得的DNA片段的堿基序列而推導(dǎo)出來(lái)。此外,用來(lái)自激烈熱球菌的染色體DNA為模板可制備能擴(kuò)增整個(gè)蛋白酶PFUS基因的引物??稍O(shè)計(jì)引物NPF-4和NPR-4。引物NPF-4擁有的堿基序列緊鄰于蛋白酶PFUS基因的啟動(dòng)密碼子上游處,能把BamHI 5′位點(diǎn)引入到該序列上。引物NPR-4擁有的序列與蛋白酶PFUS基因3′部分互補(bǔ),可把SphI 5′位點(diǎn)引入到該序列上。
引物NPK-4和NPR-4的堿基序列在序列表的SEQ ID NOS13和14中顯示。用來(lái)自激烈熱球菌的染色體DNA為模板,這2個(gè)引物可用于擴(kuò)增整個(gè)蛋白酶PFUS的基因。
與蛋白酶TCES一樣,蛋白酶PFUS能在作為宿主的枯草芽孢桿菌中表達(dá)。表達(dá)蛋白酶PFUS的質(zhì)??砂从糜诘鞍酌窽CES的表達(dá)質(zhì)粒pSTC 3構(gòu)建。具體來(lái)說(shuō),通過(guò)把質(zhì)粒pSTC 3中的蛋白酶TCES基因用含有整個(gè)蛋白酶PFUS基因的DNA片段取代,可構(gòu)建表達(dá)蛋白酶PFUS的質(zhì)粒,所述的DNA片段用上述的引物由PCR擴(kuò)增得到。因而所構(gòu)建的表達(dá)質(zhì)粒被命名為質(zhì)粒pSNP 1。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSNP 1,并于1995年12月1日(最初保藏的日期)根據(jù)布達(dá)佩斯條約,保藏在通產(chǎn)省工業(yè)技術(shù)院生命工學(xué)和人體技術(shù)研究所,日本,茨城縣筑波市東1丁目1番3號(hào),登記號(hào)為FERMBP-5634。質(zhì)粒pSNP 1的限制性酶圖譜在圖6顯示。
在編碼蛋白酶PFUS基因中與可讀框相應(yīng)的堿基序列以及從該堿基序列推導(dǎo)的蛋白酶PFUS的氨基酸序列分別在序列表的SEQ ID NOS15和16中顯示。
熱穩(wěn)定蛋白酶活性在來(lái)自枯草芽孢桿菌DB 104/pSNP 1培養(yǎng)物的上清液中和細(xì)胞抽提液中發(fā)現(xiàn)。即,部分表達(dá)的蛋白酶PFUS被分泌到培養(yǎng)物上清液中。
從轉(zhuǎn)化體培養(yǎng)物中獲得的蛋白酶的主要特性如下(1)作用降解酪蛋白和膠原以產(chǎn)生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產(chǎn)生熒光物質(zhì)(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對(duì)-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產(chǎn)生黃色物質(zhì)(對(duì)硝基苯胺)。
(2)最適溫度在41-110℃下表現(xiàn)為酶活性,最適溫度為80-95℃。
(3)最適pH在pH 5-10下表現(xiàn)酶活性,最適pH為pH 6-8。
(4)熱穩(wěn)定性在95℃處理8小時(shí)后仍有90%或更高的酶活性。
(5)pH穩(wěn)定性在pH 5-11,95℃下處理60分鐘后仍保持95%或更高的酶活性。
(6)分子量在SDS-PAGE上出現(xiàn)的分子量大約為45 kDa。
使用獲得蛋白酶TCES基因和蛋白酶PFUS基因相似的方法,與蛋白酶TCES基因和蛋白酶PFUS基因同源的蛋白酶基因能從不是激烈熱球菌和速生熱球菌的超嗜熱菌中得到。
可制備大約1kb的DNA片段,該片段編碼在序列表SEQ ID NO6中顯示的蛋白酶PFUL的氨基酸序列從殘基323位至殘基650的序列,用該片段作探針,針對(duì)來(lái)自海葡萄嗜熱菌和解蛋白熱擬桿菌DSM 5265的染色體DNAs進(jìn)行基因組Southern雜交。結(jié)果,用PstI(TakaraShuzo)消化的來(lái)自海葡萄嗜熱菌染色體DNA大約4.8kb的位置和用XbaI消化的來(lái)自解蛋白熱擬桿菌染色體DNA大約3.5kb的位置觀(guān)察到信號(hào)。
根據(jù)這些結(jié)果,證明從海葡萄嗜熱菌和解蛋白熱擬桿菌來(lái)的染色體DNAs存在編碼蛋白酶PFUL、蛋白酶PFUS和蛋白酶TCES等基因同源的序列。用分離和鑒別編碼蛋白酶TCES和蛋白酶PFUS基因相似的方法,檢測(cè)DNA片段,可分離和鑒定在海葡萄嗜熱菌和解蛋白熱擬桿菌中編碼超熱穩(wěn)定蛋白酶的基因。
一般來(lái)說(shuō),為了通過(guò)遺傳工程技術(shù)大量制備蛋白,認(rèn)為應(yīng)用在宿主中有效地起作用的啟動(dòng)子而不用編碼目的蛋白的基因內(nèi)部結(jié)合的啟動(dòng)子是有利的。盡管用于構(gòu)建蛋白酶TCES和蛋白酶PFUS表達(dá)系統(tǒng)的P43啟動(dòng)子是來(lái)自枯草芽孢桿菌的啟動(dòng)子,它不能足夠有效地表達(dá)這2種蛋白酶。
因此,為了增加表達(dá)水平,可利用在枯草芽孢桿菌中高水平表達(dá)的基因,尤其是編碼分泌蛋白的基因??捎镁幋aα-淀粉酶或各種細(xì)胞外蛋白酶的基因。例如,可預(yù)期應(yīng)用枯草桿菌蛋白酶基因的啟動(dòng)子和編碼信號(hào)肽區(qū)可增加蛋白酶PFUS的表達(dá)水平。
具體而言,通過(guò)把整個(gè)蛋白酶PFUS基因置于編碼枯草桿菌蛋白酶基因信號(hào)肽及包括啟動(dòng)子區(qū)的區(qū)域下游,這樣2個(gè)基因的翻譯框能互相匹配,在枯草桿菌蛋白酶的啟動(dòng)子控制下蛋白酶PFUS能作為融合蛋白表達(dá)。
例如,編碼枯草桿菌蛋白酶E的基因能用作枯草桿菌蛋白酶基因,用在本發(fā)明中??墒褂冒芽莶輻U菌蛋白酶E基因的啟動(dòng)子和編碼信號(hào)肽的區(qū)域插入到質(zhì)粒pKW 2中,該質(zhì)粒在“細(xì)菌學(xué)雜志”1712657-2665(1989)中描述。包括啟動(dòng)子序列的5′上游區(qū)的堿基序列在該參考文獻(xiàn)(同上)中描述而編碼枯草桿菌蛋白酶區(qū)的堿基序列在“細(xì)菌學(xué)雜志”158411-418(1984)中描述。
根據(jù)這些序列,合成引入EcoRI位點(diǎn)位于該基因啟動(dòng)子序列上游的引物SUB 4和引入BamHI位點(diǎn)位于編碼枯草桿菌蛋白酶E的信號(hào)肽區(qū)下游的引物BmR1。引物SUB4和BmR1的堿基序列分別在序列表SEQID NOS17和18中顯示。用質(zhì)粒pKWZ作模板,經(jīng)PCR用引物SUB4和BmR1擴(kuò)增出大約0.3kb的DNA片段,該片段含有枯草桿菌蛋白酶E基因的啟動(dòng)子和編碼信號(hào)肽區(qū)。
置于該DNA片段下游的蛋白酶PFUS基因,可通過(guò)PCR法從激烈熱球菌的染色體DNA中獲得。引物NPF-4能用作和該基因5′區(qū)雜交的引物。根據(jù)該基因終止密碼子下游的堿基序列設(shè)計(jì)的引物NPM-1擁有SphI位點(diǎn),能用作和該基因3′區(qū)雜交的引物。引物NPM-1的序列在序列表的SEQ ID NO19中顯示。
存在于基因中的一個(gè)BamHI位點(diǎn)在所述的方法中會(huì)產(chǎn)生問(wèn)題,在該方法中,BamHI位點(diǎn)是用于連接蛋白酶PFUS基因和0.3kb DNA片段。依據(jù)在序列表SEQ ID NO15中顯示的蛋白酶PFUS基因的堿基序列,能制備經(jīng)PCR-誘變法消除BamHI位點(diǎn)的引物mutRR和mutFR。引物mutRR和mutFR的堿基序列分別在序列表SEQ ID NOS20和21中顯示。當(dāng)用這些引物消除BamHI位點(diǎn)時(shí),由該位點(diǎn)編碼的氨基酸殘基即甘氨酸,由于引入該位點(diǎn)的堿基替換,被纈氨酸所替換,所述的位點(diǎn)在序列表SEQ ID NO16中顯示的蛋白酶PFUS氨基酸序列中560位。
用這些引物能獲得連接有枯草桿菌蛋白酶E的啟動(dòng)子和編碼信號(hào)肽區(qū)的蛋白酶PFUS基因。具體而言,用來(lái)自激烈熱球菌的染色體DNA作模板及配對(duì)引物mutRR和NPF-4或配對(duì)引物mutFR和NPM-1,進(jìn)行2次PCRs。此外,用各自PCR擴(kuò)增的DNA片段作模板和引物NPF-4和NPM-1混合形成異源雙鏈,進(jìn)行第二輪PCR。因此,能擴(kuò)增出不含有內(nèi)部BamHI位點(diǎn)大約2.4kb的整個(gè)蛋白酶PFUS基因。
分離用BamHI和SphI消化的PCR擴(kuò)增的DNA片段獲得大約2.4kb的一個(gè)DNA片段,用該片段取代含有蛋白酶PFUS基因的質(zhì)粒pSNP 1中的BamHI-SphI片段。由此構(gòu)建的表達(dá)載體被命名為質(zhì)粒pPS 1。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104命名為枯草芽孢桿菌DB 104/PPS1。觀(guān)察含有質(zhì)粒pSNP 1的轉(zhuǎn)化體,發(fā)現(xiàn)在該轉(zhuǎn)化體培養(yǎng)物的上清液和抽提液中相似的蛋白酶活性,這表明該氨基酸替換不影響酶活性。質(zhì)粒pPS 1的限制性酶圖譜在圖7中顯示。
含有枯草桿菌蛋白酶E基因的啟動(dòng)子和編碼信號(hào)肽區(qū)的大約0.3kbDNA片段用EcoRI和BamHI消化,用于取代在質(zhì)粒pPS 1中含有的P43啟動(dòng)子和核糖體結(jié)合位點(diǎn)的EcoRI-BamHI片段。由此構(gòu)建的表達(dá)質(zhì)粒被命名為pNAPS 1。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPS 1。熱穩(wěn)定蛋白酶活性在該轉(zhuǎn)化體培養(yǎng)物的上清液,和細(xì)胞抽提液中找到,與枯草芽孢桿菌DB 104/pSNP 1相比較增加了表達(dá)水平。質(zhì)粒pNAPS 1的限制性酶圖譜在圖8中顯示。
從該轉(zhuǎn)化體表達(dá)的蛋白酶表現(xiàn)的酶學(xué)特性與上述的由枯草芽孢桿菌DB 104/pSNP 1表達(dá)的蛋白酶的那些特性相等。純化了由該轉(zhuǎn)化體表達(dá)的蛋白酶。分析純化蛋白酶N-末端氨基酸序列提出的氨基酸序列在序列表SEQ ID NO22中顯示。該序列與在序列表SEQ ID NO15中顯示的蛋白酶PFUS的氨基酸序列從133位至144位的序列相同,表明成熟的蛋白酶PFUS是從該部分開(kāi)始的多肽所組成的酶。根據(jù)這些結(jié)果呈現(xiàn)的成熟蛋白酶PFUS的氨基酸序列在序列表SEQ ID NO4中顯示。
盡管與枯草芽孢桿菌DB 104/pSNP 1(FERM BP-5634)產(chǎn)生的蛋白酶量相比較,由枯草芽孢桿菌DB 104/pNAPS 1產(chǎn)生的蛋白酶量增加,仍需要更高的生產(chǎn)力。通過(guò)修飾枯草芽孢桿菌信號(hào)肽和蛋白酶PFUS之間由pNAPS 1編碼的融合肽結(jié)合部分,以更有效地移去信號(hào)肽,預(yù)計(jì)能增加該蛋白酶的表達(dá)水平。在質(zhì)粒pNAPS 1中,由3個(gè)氨基酸殘基Ala-Gly-Ser組成的肽插入在序列表SEQ ID NO3中顯示的枯草桿菌蛋白酶E信號(hào)肽的C-末端氨基酸殘基(Ala)和蛋白酶PFUS的N-末端氨基酸殘基(Met)之間。通過(guò)把突變導(dǎo)入到質(zhì)粒pNAPS 1中編碼該肽的DNA中然后檢查已導(dǎo)入突變質(zhì)粒的轉(zhuǎn)化體的蛋白酶生產(chǎn)性,能獲得具有增加蛋白酶表達(dá)水平的轉(zhuǎn)化體。
首先,制備突變質(zhì)粒,其中在質(zhì)粒pNAPS 1中編碼融合蛋白,枯草桿菌蛋白酶E-蛋白酶PFUS的基因中3個(gè)氨基酸肽中編碼Ser的部分被修飾,這樣該部分的堿基序列編碼隨機(jī)的2個(gè)氨基酸殘基。上述突變質(zhì)??捎肞CR法產(chǎn)生。例如,具有用隨機(jī)的6個(gè)堿基替換編碼Ser密碼子(TCC)-的序列的引物SPOFO和SPORO(引物SPOFO和SPORO的堿基序列分別在序列表SEQ ID NOS24和25中顯示)和根據(jù)該區(qū)周?chē)膲A基序列制備的引物SUB 3和NPR-10,用于進(jìn)行PCR以獲得一個(gè)DNA片段,在與編碼Ser密碼子(Ser)相應(yīng)的部位的定向突變已引入了該DNA片段中。由得到的片段取代在質(zhì)粒pNAPS 1中相應(yīng)的區(qū)域能獲得含有導(dǎo)入突變的蛋白酶基因的突變質(zhì)粒。
通過(guò)由此獲得的突變質(zhì)粒導(dǎo)入到合適的宿主如枯草芽孢桿菌DB 104中,然后測(cè)定由轉(zhuǎn)化體表達(dá)的蛋白酶水平,那么就能獲得具有增加表達(dá)水平的轉(zhuǎn)化體。由測(cè)定所分離的轉(zhuǎn)化體獨(dú)立培養(yǎng)物中的活性確定蛋白酶的表達(dá)水平。另外,具有增加表達(dá)水平的轉(zhuǎn)化體可用含基質(zhì)的瓊脂平板方便地選出。
具體來(lái)說(shuō),突變質(zhì)粒導(dǎo)入其中的轉(zhuǎn)化體生長(zhǎng)在含有脫脂乳的瓊脂平板上。然后,平板培養(yǎng)在蛋白酶PFUS能表現(xiàn)其活性的溫度下,如在70℃下。在表達(dá)蛋白酶的轉(zhuǎn)化體集落周?chē)拿撝楸唤到舛兊们辶痢5鞍酌傅谋磉_(dá)水平能從清亮區(qū)的大小估計(jì)出來(lái)。
與枯草芽孢桿菌DB 104/pNAPS 1相比較由此得到的一種表達(dá)高水平蛋白酶活性的轉(zhuǎn)化體,被命名為枯草芽孢桿菌DB 104/pSPO 124。制備含有該轉(zhuǎn)化體的質(zhì)粒(該質(zhì)粒被命名為pSPO 124)。分析該質(zhì)粒的堿基序列顯示編碼Ser的部分轉(zhuǎn)變成堿基序列GGGAAT,那就是說(shuō),由該質(zhì)粒編碼的是一種Ser已轉(zhuǎn)變?yōu)镚ly-Asn的蛋白。
因此,通過(guò)把由4個(gè)氨基酸殘基Ala-Gly-Gly-Asn組成的肽置于枯草桿菌蛋白酶信號(hào)肽的下游,將其與目的蛋白的N-末端融合,然后表達(dá)融合蛋白,證明目的蛋白的表達(dá)水平能在作為宿主的芽孢桿菌屬細(xì)胞中增加。除了用于本發(fā)明的枯草桿菌蛋白酶E(來(lái)自枯草芽孢桿菌)外,來(lái)自解淀粉枯草桿菌的枯草桿菌蛋白酶BPN′(核酸研究,117911-7925(1983))、來(lái)自地衣枯草桿菌的枯草桿菌蛋白酶Carlsberg(核酸研究,138913-8926(1985))等都是熟知的由芽孢桿菌屬細(xì)菌產(chǎn)生的枯草桿菌蛋白酶。來(lái)自它們的信號(hào)肽能優(yōu)選地用于本發(fā)明,盡管它們的氨基酸序列互相間稍有不同。在芽孢桿菌屬細(xì)菌中起作用的各種啟動(dòng)子能用在本發(fā)明為控制表達(dá)所用的來(lái)自枯草桿菌蛋白酶E基因的啟動(dòng)子的部位。
關(guān)于被表達(dá)的蛋白沒(méi)有限制。只要獲得編碼蛋白的基因就可應(yīng)用本發(fā)明通過(guò)遺傳工程技術(shù)高水平地表達(dá)該蛋白。根據(jù)分類(lèi)學(xué)上與芽孢桿菌屬細(xì)菌不同的激烈熱球菌的蛋白可高水平表達(dá)的事實(shí),顯然本發(fā)明能用于表達(dá)不是本發(fā)明宿主的生物來(lái)源的蛋白。通過(guò)遺傳工程技術(shù),本發(fā)明優(yōu)選地用于生產(chǎn)蛋白酶PFUL、蛋白酶TCES以及結(jié)構(gòu)上與蛋白酶PFUS相似,來(lái)源于海葡萄嗜熱菌和解蛋白熱擬桿菌的蛋白酶。
依據(jù)和枯草桿菌蛋白酶的同源性,可考慮將蛋白酶PFUS表達(dá)為具有信號(hào)肽和前肽的前體蛋白,然后進(jìn)行加工以產(chǎn)生成熟的酶。此外,根據(jù)成熟蛋白酶PFUS酶的N-末端氨基酸序列分析的結(jié)果,可以設(shè)定該成熟酶是一種在序列表SEQ ID NO4中所示的氨基酸序列組成的酶。然而,純化的成熟蛋白酶PFUS的分子量大約為45kDa,比根據(jù)氨基酸序列計(jì)算的分子量更小,表明也進(jìn)行其C-末端肽的加工后,作為前肽表達(dá)的蛋白酶PFUS轉(zhuǎn)變成成熟的蛋白酶。
如果由加工過(guò)程移去的C-末端肽對(duì)酶活性或酶蛋白折疊成合適的結(jié)構(gòu)是非必需的,預(yù)期通過(guò)從該基因中缺失編碼該部分的區(qū)域然后表達(dá)蛋白酶,也可增加蛋白酶PFUS的表達(dá)水平。
從枯草芽孢桿菌DB 104/pNAPS 1獲得的成熟蛋白酶PFUS的分子量例如可用質(zhì)子光譜儀精確地測(cè)定。根據(jù)測(cè)定的分子量和按上述方法確定的成熟蛋白酶PFUS的N-末端氨基酸序列,發(fā)現(xiàn)該蛋白酶是一種與序列表SEQ ID NO15中所示的氨基酸序列133位Ala至552位Thr相應(yīng)的肽。此外,通過(guò)把終止密碼子導(dǎo)入到在質(zhì)粒pNAPS 1含有的蛋白酶PFUS基因中編碼552位Thr部分的附近區(qū)域,能構(gòu)建表達(dá)缺乏對(duì)其酶活性非必需的多肽的蛋白酶PFUS的質(zhì)粒。具體而言,用引物NPR 544和引物NPFE 81經(jīng)PCR獲得具有所設(shè)計(jì)的終止密碼子引入其中的堿基序列的DNA片段,引物NPR 544是在質(zhì)粒pNAPS 1中的蛋白酶PFUS基因從起始密碼子至第544位氨基酸殘基編碼密碼子的C-末端側(cè)(Ser)導(dǎo)入一個(gè)終止密碼子(TGA)(引物NPR 544的堿基序列在序列表的SEQ ID NO28中顯示),而引物NPFE 81擁有在該基因中從NspV位點(diǎn)上游區(qū)的堿基序列(引物NPFE 81的堿基序列在序列表的SEQ ID NO29中顯示)。然后用該片段取代質(zhì)粒pNAPS 1的相應(yīng)區(qū)域能獲得含有目的突變導(dǎo)入蛋白酶基因中的突變質(zhì)粒。該質(zhì)粒命名為質(zhì)粒pNAPSΔC。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPSΔC。
該轉(zhuǎn)化體表達(dá)蛋白酶活性,具有的特性與蛋白酶PFUS相同,其表達(dá)水平比枯草芽孢桿菌DB 104/pNAPS 1更高。
因此,可以發(fā)現(xiàn)在質(zhì)粒pNAPSΔC中含有的蛋白酶PFUS基因擁有表達(dá)該酶活性的足夠區(qū)域。在質(zhì)粒中存在的編碼蛋白酶PFUS區(qū)的堿基序列在序列表的SEQ ID NO2中顯示。由該堿基序列編碼的氨基酸序列在序列表的SEQ ID NO2中顯示。
此外,通過(guò)把在質(zhì)粒pNAPSΔC中相似的突變導(dǎo)入到質(zhì)粒pSPO 124的蛋白酶PFUS基因中,能表達(dá)缺乏其C-末端肽的蛋白酶PFUS。
具體而言,通過(guò)用NspV和SphI消化質(zhì)粒pNAPSΔC獲得的大約13kb的DNA片段和已被NspV和SphI消化的質(zhì)粒pSPO 124混合并連接,而構(gòu)建該目的質(zhì)粒。該質(zhì)粒被命名為質(zhì)粒pSO124ΔC。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名并表示為枯草芽孢桿菌DB 104/pSO124ΔC,于1997年5月16日(最初的保藏日期)根據(jù)布達(dá)佩斯條約保藏在通產(chǎn)省工業(yè)技術(shù)院生命工學(xué)和人體技術(shù)研究所,日本,茨城縣筑波市東1丁目1番3號(hào),登記號(hào)為FERM BP-6294。該轉(zhuǎn)化體的蛋白酶表達(dá)水平與枯草芽孢桿菌DB 104/pNAPS 1相比增加。
由轉(zhuǎn)化體枯草芽孢桿菌DB 104/pNAPSΔC和枯草芽孢桿菌DB 104/pSPO124ΔC產(chǎn)生的蛋白酶的酶學(xué)特性以及物理和化學(xué)特性,似乎與由枯草芽孢桿菌DB 104/pSNP 1產(chǎn)生的蛋白酶的那些特性相同。從該2個(gè)轉(zhuǎn)化體中的培養(yǎng)物中獲得的蛋白酶的主要特性如下(1)作用降解酪蛋白和膠原產(chǎn)生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產(chǎn)生熒光物質(zhì)(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對(duì)-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產(chǎn)生黃色物質(zhì)(對(duì)硝基苯胺)。
(2)最適溫度在40-110℃下表現(xiàn)酶活性,最適溫度為80-95℃。
(3)最適pH在pH 5-10下表現(xiàn)酶活性,最適pH為pH 6-8。
(4)熱穩(wěn)定性在95℃下處理8小時(shí)后保留90%或更高的酶活性。
(5)pH穩(wěn)定性在95℃,pH 5-11下處理60分鐘后保留95%或更高的酶活性。
(6)分子量在SDS-PAGE上表現(xiàn)的分子量大約45kDa。
因此,提供了具有高熱穩(wěn)定性的蛋白酶和其基因。此外,本發(fā)明披露了表達(dá)蛋白的新系統(tǒng),該系統(tǒng)使蛋白酶大量表達(dá)。用遺傳工程技術(shù)將該表達(dá)系統(tǒng)用于生產(chǎn)本發(fā)明的蛋白酶及各種蛋白。
下列的實(shí)施例更詳細(xì)地說(shuō)明本發(fā)明,但不能解釋為限制本發(fā)明的范圍。
實(shí)施例1(1)從激烈熱球菌中制備染色體DNA按下列條件培養(yǎng)激烈熱球菌DSM 3638。
含有1%蛋白胨,0.5%酵母抽提物,1%可溶性淀粉,3.5%Jamarine S固體物(Jamarine實(shí)驗(yàn)室),3.5%Jamarine S液體物(Jamarine實(shí)驗(yàn)室),0.003% MgSO4,0.001% NaCl,0.0001% FeSO4·7H2O,0.0001%CoSO4,0.0001% CaCl2·7H2O,0.0001% ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm H3BO3,0.1ppm KAl(SO4)2,0.1ppm Na2MoO4·2H2O,0.25ppmNiCl2·H2O的培養(yǎng)基放在2L的培養(yǎng)瓶中,120℃滅菌20分鐘,用氮?dú)獬渑菀砸迫ト芙獾难鯕?,然后將菌株接種到培養(yǎng)基中,在95℃下非振蕩條件培養(yǎng)16小時(shí)。培養(yǎng)后,通過(guò)離心收集細(xì)胞。
然后得到的細(xì)胞懸浮在4ml含有25%蔗糖的50mM Tris-HCl(pH8.0)中。加2ml的0.2M EDTA和0.8ml溶菌酶(5mg/ml)到懸液中?;旌弦涸?0℃下溫育1小時(shí)。然后往混合液中加入24ml的SET溶液(150mM NaCl, 1mM EDTA,20mM Tris-HCl,pH8.0),4ml的5%SDS和400μl的蛋白酶K(10mg/ml)。繼續(xù)在37℃下溫育1小時(shí)。反應(yīng)通過(guò)用苯酚-氯仿抽提混合物而終止。然后,進(jìn)行乙醇沉淀獲得大約3.2mg的染色體DNA。
實(shí)施例2(1)為構(gòu)建質(zhì)粒pNSP 1的引物合成為了合成用于擴(kuò)增整個(gè)蛋白酶PFUS基因的引物,含有該整個(gè)基因的質(zhì)粒pSNP 1從枯草芽孢桿菌DB 104/pSNP 1(FERM BP-5634)中分離,然后測(cè)定所獲得區(qū)域的堿基序列。根據(jù)該堿基序列,合成引入BamHI位點(diǎn)緊鄰于蛋白酶PFUS基因起始密碼子上游的引物NPF-4和能與該基因3′區(qū)雜交并含有SphI識(shí)別位點(diǎn)的引物NPM-1。引物NPF-4和NPM-1的堿基序列分別在序列表SEQ ID NOS13和19中顯示。
也合成移去BamHI位點(diǎn)的引物mutRR和mutFR,該BamHI位點(diǎn)位于蛋白酶PFUS基因中自起始密碼子下游大約1.7kb處。引物mutRR和mutFR的堿基序列分別在序列表的SEQ ID NOS20和21中顯示。
(2)制備質(zhì)粒pPS 1制備2套LA-PCR反應(yīng)混合液,然后進(jìn)行94℃ 30秒-55℃ 1分鐘-68℃ 3分鐘的30個(gè)循環(huán)反應(yīng),每套LA-PCR反應(yīng)混合液含有來(lái)自激烈熱球菌的染色體DNA為模板和引物NPF-4和mutRR的組合或引物mutFR和NPM-1的組合。用LA PCR試劑盒Ver.2(TakaraShuzo)制備LA-PCR反應(yīng)混合液。等份的反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,分別觀(guān)察到用引物NPF-4和mutRR擴(kuò)增出一條大約1.8kb的DNA片段而用引物mutFR和NPM-1擴(kuò)增出一條大約0.6kb的DNA片段。
用SUPREC-02(Takara Shuzo)從2套PCR反應(yīng)混合液中移去引物以制備擴(kuò)增的DNA片段。制備含有這2種擴(kuò)增的DNA片段但不含有引物或LA Taq的LA-PCR反應(yīng)混合液,94℃下熱變性10分鐘,在30分鐘內(nèi)冷卻至30℃,然后在30℃溫育15分鐘以形成異源雙鏈。接著,把LA Taq(Takara Shuzo)加到反應(yīng)混合液中,72℃下反應(yīng)30分鐘。然后把引物NPF-4和NPM-1加到反應(yīng)混合液中,然后該反應(yīng)混合液進(jìn)行94℃ 30分鐘-55℃ 1分鐘-68℃ 3分鐘的25個(gè)循環(huán)反應(yīng)。在反應(yīng)混合液中觀(guān)察到擴(kuò)增出一條大約2.4kb的DNA片段。
大約2.4kb的該DNA片段用BamHI和SphI(兩者均來(lái)自TakaraShuzo)消化。該片段和已被BamHI和SphI消化過(guò)移去整個(gè)蛋白酶PFUS基因的質(zhì)粒pSNP 1混合并連接,然后導(dǎo)入到枯草芽孢桿菌DB 104中。從產(chǎn)生的卡那霉素抗性的轉(zhuǎn)化體中制備質(zhì)粒,選出其中僅大約2.4kb片段一個(gè)分子插入的質(zhì)粒,并且命名為質(zhì)粒pPS 1。用該質(zhì)粒pPS 1轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pPS 1。
質(zhì)粒pPS 1的限制性酶圖譜在圖7中顯示。
(3)對(duì)枯草桿菌蛋白酶E基因的啟動(dòng)子-編碼信號(hào)肽區(qū)擴(kuò)增DNA片段為獲得枯草桿菌蛋白酶E基因的啟動(dòng)子-編碼信號(hào)肽區(qū)而合成引物。首先,根據(jù)在細(xì)菌學(xué)雜志,1712657-2665(1989)所描述的枯草桿菌蛋白酶E基因啟動(dòng)子區(qū)的堿基序列合成引物SUB 4,該引物能與該區(qū)上游序列雜交并含有1個(gè)EcoRI位點(diǎn)(引物SUB 4的堿基序列在序列表的SEQ ID NO17中顯示)。根據(jù)在細(xì)胞學(xué)雜志,158411-418(1984)中所描述的枯草桿菌蛋白酶E基因的堿基序列,合成能引入1個(gè)BamHI位點(diǎn)緊鄰于編碼信號(hào)肽區(qū)下游的引物BmR1(引物BmR1的堿基序列在序列表的SEQ ID NO18中顯示)。
制備含有在細(xì)菌學(xué)雜志,1712657-2665中所描述的枯草桿菌蛋白酶E基因的質(zhì)粒pKWZ作模板及引物SUB 4和BmR1的PCR反應(yīng)混合液,然后進(jìn)行94℃ 30秒-55℃ 1分鐘-68℃ 2分鐘的30個(gè)循環(huán)反應(yīng)。等份的反應(yīng)混合液進(jìn)行瓊脂糖凝膠電泳,并觀(guān)察到擴(kuò)增出一條大約0.3kb的DNA片段。
(4)構(gòu)建蛋白酶表達(dá)質(zhì)粒pNAPS 1用EcoRI(Takara Shuzo)和BamHI消化上述大約0.3kb的DNA片段,用實(shí)施例3中所述的方法已被EcoRI和BamHI消化的質(zhì)粒pPS1與DNA片段混合并連接,然后導(dǎo)入到枯草芽孢桿菌DB 104中。從產(chǎn)生的卡那霉素抗性的轉(zhuǎn)化體中制備質(zhì)粒,然后挑選出僅大約0.3kb的片段一個(gè)分子插入的質(zhì)粒,命名為質(zhì)粒pNAPS 1。用該質(zhì)粒pNAPS 1轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPS 1。
質(zhì)粒pNAPS 1的限制性酶圖譜在圖8中顯示。
(5)構(gòu)建質(zhì)粒pSNP 2為引入BamHI位點(diǎn)位于在上面提到的質(zhì)粒pNAPS 1中的枯草桿菌蛋白酶E基因的編碼信號(hào)肽區(qū)上游,合成引物SUB17R(引物SUB17R的堿基序列在序列表的SEQ ID NO23中顯示)。制備含有質(zhì)粒pNAPS1作模板及引物SUB17R和SUB4的PCR反應(yīng)混合液,進(jìn)行94℃ 30秒-55℃ 1分鐘-72℃ 1分鐘的25個(gè)循環(huán)反應(yīng)。用EcoRI和BamHI消化擴(kuò)增的大約0.21kb的DNA片段,以獲得一條大約0.2kb的DNA片段,該片段含有枯草桿菌蛋白酶E基因的啟動(dòng)子和SD序列。該片段和已被EcoRI和BamHI消化過(guò)的質(zhì)粒pNAPS1混合并連接。用該反應(yīng)混合液轉(zhuǎn)化枯草芽孢桿菌DB 104。從產(chǎn)生的卡那霉素抗性的轉(zhuǎn)化體中制備質(zhì)粒,然后挑選出大約0.2 kb的DNA片段插入的質(zhì)粒,命名為質(zhì)粒pSNP 2。
(6)產(chǎn)生高水平表達(dá)蛋白酶的突變質(zhì)粒為把位于質(zhì)粒pNAPS 1中枯草桿菌蛋白酶E基因的編碼信號(hào)肽區(qū)和蛋白酶PFUS基因的起始密碼子之間的編碼氨基酸殘基Ser的序列(堿基序列TCC)用編碼2個(gè)隨機(jī)氨基酸殘基的序列替換,合成引物SPOFO和SPORO(引物SPOFO和SPORO的堿基序列分別在序列表的SEQ ID NOS24和25中顯示)。合成引入的BamHI位點(diǎn)緊鄰于質(zhì)粒pNAPS 1的枯草桿菌蛋白酶E基因中編碼信號(hào)肽的上游的引物SUB3和在蛋白酶PFUS編碼區(qū)中含有SpeI位點(diǎn)的引物NPR-10(引物SUB3和NPR-10的堿基序列分別在序列表的SEQ ID NOS26和27中顯示)。
制備PCR反應(yīng)混合液,每種混合液含有以質(zhì)粒pNAPS 1作模板和引物SPOFP和NPR-10組合或引物SUB3和SPORO的組合,將反應(yīng)混合液進(jìn)行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的20個(gè)循環(huán)反應(yīng)。在2個(gè)反應(yīng)混合液中擴(kuò)增出的大約0.13kb和大約0.35kb的DNA片段混合在一起,在94℃變性10分鐘,逐漸冷卻到37℃以形成異源雙鏈。然后用Taq聚合酶(Takara Shuzo)的方法從異源雙鏈產(chǎn)生雙鏈DNA。制備含有由上獲得的雙鏈DNA作模板及引物SUB3和NPR-10的PCR反應(yīng)混合液,進(jìn)行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的25個(gè)循環(huán)反應(yīng)。用BamHI和SpeI消化擴(kuò)增的大約0.43kb的DNA片段所獲得的一條DNA片段和用BamHI和SpeI消化過(guò)的質(zhì)粒pSNP 2混合并連接。用反應(yīng)混合液轉(zhuǎn)化枯草芽孢桿菌DB 104。
將產(chǎn)生的卡那霉素抗性的轉(zhuǎn)化體接種在脫脂乳的平板上(用于高溫培養(yǎng)的LB-瓊脂培養(yǎng)基含有10μg/ml的卡那霉素和1%脫脂乳)以形成集落。接著,平板培養(yǎng)在70℃下,根據(jù)在集落周?chē)拿撝榈慕到獬潭龋瑱z查由各個(gè)轉(zhuǎn)化體表達(dá)的蛋白酶活性。結(jié)果,分離到一個(gè)表達(dá)特別高活性的克隆,從該克隆制備命名為質(zhì)粒pSPO 124的質(zhì)粒。用該質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSPO 124。分析質(zhì)粒pSPO 124的堿基序列,發(fā)現(xiàn)在質(zhì)粒pNAPS 1中編碼Ser的堿基序列被堿基序列GGGAAT所替換,那就是說(shuō)所編碼的蛋白中,Ser被轉(zhuǎn)換為2個(gè)氨基酸殘基Gly-Asn。另外,證明與蛋白酶PFUS基因的Pro(CCA)相應(yīng)的從起始密碼子計(jì)算的第25位密碼子轉(zhuǎn)變?yōu)榫幋aLeu的密碼子(CTA),這是與上面所述的突變同時(shí)發(fā)生的。
(7)構(gòu)建蛋白酶表達(dá)質(zhì)粒pNAPSΔC1個(gè)終止密碼子被導(dǎo)入在質(zhì)粒pNAPS 1中從蛋白酶PFUS基因的起始密碼子算起的第544位氨基酸殘基的C-末端側(cè),以構(gòu)建表達(dá)從該位點(diǎn)起缺乏下游區(qū)的蛋白酶的質(zhì)粒。合成引物NPR 544,該引物在該基因中編碼第544位氨基酸殘基的密碼子C-末端側(cè)導(dǎo)入一個(gè)終止密碼子(堿基序列TGA)和有一個(gè)SphI位點(diǎn)(引物NPR544的堿基序列在序列表的SEQ ID NO28中顯示)。此外,根據(jù)在該基因中從NspV位點(diǎn)上游部分的堿基序列,合成引物NPFE 81(引物NPFE 81的堿基序列在序列表的SEQ ID NO29中顯示)。
制備含有質(zhì)粒pNAPS 1作模板及引物NPFE 81和NPR 544的PCR反應(yīng)混合液,然后進(jìn)行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的20個(gè)循環(huán)反應(yīng)。擴(kuò)增出的大約0.61kb的DNA片段用NspV(Takara Shuzo)和SpeI消化,以獲得一條含有終止密碼子的大約0.13kb的DNA片段。該DNA片段和已被限制性酶NspV和SphI消化過(guò)的質(zhì)粒pNAPS 1混合并連接。用反應(yīng)混合液轉(zhuǎn)化枯草芽孢桿菌DB 104。從產(chǎn)生的卡那霉素抗性的轉(zhuǎn)化體中制備質(zhì)粒,選出大約0.13kb的DNA片段插入其中的質(zhì)粒,該質(zhì)粒被命名為質(zhì)粒pNAPSΔC。用該質(zhì)粒pNAPSΔC轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPSΔC。
(8)構(gòu)建蛋白酶表達(dá)質(zhì)粒pSPO124ΔC用NspV和SphI消化質(zhì)粒pNAPSΔC分離得到一條大約1.3kb的DNA片段,然后該片段與已被NspV和SphI消化過(guò)的質(zhì)粒pSPO 124混合并連接。用反應(yīng)混合液轉(zhuǎn)化枯草芽孢桿菌DB 104。從產(chǎn)生的卡那霉素抗性轉(zhuǎn)化體中制備質(zhì)粒,挑選出大約1.3kb的DNA片段插入的質(zhì)粒,并被命名為質(zhì)粒pSPO124ΔC。用該質(zhì)粒pSPO124ΔC轉(zhuǎn)化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSPO124ΔC。
實(shí)施例3(1)用含蛋白酶PFUS基因的質(zhì)粒轉(zhuǎn)化的枯草芽孢桿菌的培養(yǎng)和制備粗酶溶液用實(shí)施例2所述的方法將含有蛋白酶PFUS基因的質(zhì)粒pNAPS 1導(dǎo)入到枯草芽孢桿菌DB 104中出現(xiàn)的枯草芽孢桿菌DB 104/pNAPS 1,在2ml含有10μg/ml卡那霉素的LB培養(yǎng)基(蛋白胨10g/L,酵母抽提物5g/L,NaCl 5g/L,pH7.2)中,37℃下培養(yǎng)24小時(shí)。離心培養(yǎng)物以得到培養(yǎng)上清液(制備物1-S)和細(xì)胞。
把細(xì)胞懸浮在100μl的50mM Tris-HCl,pH7.5中,加2mg溶菌酶(Sigma)后37℃消化45分鐘。消化過(guò)的樣品在95℃熱處理10分鐘,然后通過(guò)離心收集上清液以獲得無(wú)細(xì)胞的抽提液(制備物1-L)。
相似地,從含有質(zhì)粒pSPO 124的枯草芽孢桿菌DB 104/pSPO 124、含有質(zhì)粒pNAPSΔC的枯草芽孢桿菌DB 104/pNAPSΔC或含有質(zhì)粒pSPO124ΔC的枯草芽孢桿菌DB 104/pSPO124ΔC中,獲得培養(yǎng)物上清液和無(wú)細(xì)胞的抽提液。來(lái)自枯草芽孢桿菌DB 104/pSPO 124的培養(yǎng)物上清液和無(wú)細(xì)胞抽提液分別稱(chēng)為124-S和124-L。來(lái)自枯草芽孢桿菌DB 104/pNAPSΔC的培養(yǎng)物上清液和無(wú)細(xì)胞抽提液分別稱(chēng)為ΔC-S和ΔC-L。來(lái)自枯草芽孢桿菌DB 104/pSPO124ΔC的培養(yǎng)物上清液和無(wú)細(xì)胞抽提液分別稱(chēng)為124ΔC-S和124ΔC-L。用這些制備物測(cè)定蛋白酶活性并測(cè)定在每個(gè)制備物中含有的蛋白酶濃度。
(2)比較蛋白酶的生產(chǎn)力用Suc-Ala-Ala-Pro-Phe-p-NA(Sigma)作底物光譜法測(cè)定酶水解反應(yīng)中產(chǎn)生的p-硝基苯胺的量確定蛋白酶PFUS的活性。簡(jiǎn)言之,適當(dāng)稀釋待測(cè)定其酶活性的酶制備液。50μl在100mM磷酸鹽緩沖液pH7.0中的1mM Suc-Ala-Ala-Pro-Phe-p-NA被加到50μl稀釋過(guò)的樣品溶液中。然后,使反應(yīng)在95℃進(jìn)行30分鐘。通過(guò)在冰上冷卻終止反應(yīng)后,測(cè)定在405nm的吸收值以計(jì)算出產(chǎn)生的對(duì)硝基苯胺的量。該酶的一個(gè)單位被定義為95℃每1分鐘產(chǎn)生1μmol對(duì)硝基苯胺的酶量。假定比活性為9.5單位/mg蛋白酶PFUS蛋白,根據(jù)所測(cè)定的酶活性計(jì)算在培養(yǎng)物上清液或細(xì)胞中表達(dá)的酶蛋白的量。
測(cè)定在實(shí)施例3-(1)制備的每種酶制備物的蛋白酶活性。根據(jù)測(cè)定結(jié)果計(jì)算的每種轉(zhuǎn)化體每1L培養(yǎng)物的蛋白酶PFUS的生產(chǎn)力在表1顯示。
在枯草芽孢桿菌DB 104/pSPO 124中,在細(xì)胞中的蛋白酶PFUS的生產(chǎn)力比枯草芽孢桿菌DB 104/pNAPS 1增加了3.6倍。在枯草芽孢桿菌DB 104/pNAPSΔC中,蛋白酶PFUS的生產(chǎn)力分別在培養(yǎng)物上清液中增加2.4倍而在細(xì)胞中增加2.2倍。此外,在枯草芽孢桿菌DB 104/pSPO124ΔC中,蛋白酶PFUS的生產(chǎn)力分別在培養(yǎng)物上清液中增加2倍而在細(xì)胞中增加2.4倍。每種細(xì)胞的生產(chǎn)力也增加。
在培養(yǎng)物上清液和細(xì)胞中產(chǎn)生的蛋白酶PFUS的總量,與枯草芽孢桿菌DB 104/pNAPS 1相比,分別在枯草芽孢桿菌DB 104/pSPO 124中增加2.1倍,在枯草芽孢桿菌DB 104/pNAPSΔC中增加2.1倍及在枯草芽孢桿菌DB 104/pSPO124ΔC中增加2.2倍。
表1蛋白酶PFUS的生產(chǎn)力(mg/L的培養(yǎng)物
>實(shí)施例4(1)制備純化的成熟蛋白酶PFUS的酶制備物按實(shí)施例2中所述的方法將編碼本發(fā)明的超熱穩(wěn)定蛋白酶的基因?qū)肟莶菅挎邨U菌DB 104中出現(xiàn)的2種菌株,枯草芽孢桿菌DB 104/pNAPS 1和枯草芽孢桿菌DB 104/pSPO124ΔC,分別接種到含有10μg/ml卡那霉素的5ml LB培養(yǎng)基中,37℃振蕩培養(yǎng)7小時(shí)。5ml的培養(yǎng)物接種到5L錐形瓶中500ml含10μg/ml卡那霉素的TM培養(yǎng)基(大豆粉末5g/L,聚胨10g/L,肉膏5g/L,酵母抽提物2g/L,葡萄糖10g/L,F(xiàn)eSO4·7H2O 10mg/L,MnSO4·4H2O 10mg/L,ZnSO4·7H2O 1mg/L,pH7.0)中,30℃振蕩培養(yǎng)3天。超聲處理所產(chǎn)生的培養(yǎng)物,在95℃熱處理30分鐘,然后離心收集上清液。加過(guò)硫酸銨到上清液中至25%的飽和度,然后由下一步離心獲得的上清液上樣到用含25%飽和過(guò)硫酸銨的25mM Tris-HCl緩沖液平衡過(guò)的微量制備甲基HIC柱(Bio-Rad)上。用相同的緩沖液洗滌凝膠后,吸附到柱上的蛋白酶PFUS用含40%乙醇的25mM Tris-HCl緩沖液(pH7.6)用分步洗脫法洗脫下來(lái)。由此獲得的含有蛋白酶PFUS的級(jí)分用NAP-25柱進(jìn)行凝膠過(guò)濾,該NAP-25柱預(yù)先用含20%乙腈的0.05%三氟乙酸平衡,在變性蛋白酶PFUS的同時(shí)脫鹽,然后獲得純化的蛋白酶PFUS的制備物。從枯草芽孢桿菌DB 104/pNAPS 1和枯草芽孢桿菌DB 104/pSPO124ΔC中得到的制備物分別稱(chēng)為NAPS-1和SPO-124ΔC。
2種純化的酶制備物在0.1% SDS-10%聚丙烯酰胺凝膠上電泳,然后用考馬斯亮藍(lán)R-250染色,結(jié)果顯示2種純化的酶制備物NAPS-1和SPO-124ΔC為單一的泳帶,估測(cè)的分子量大約為45kDa。
(2)成熟蛋白酶PFUS的N-末端氨基酸序列的分析用G1000A蛋白測(cè)序儀(Hewlett-Packard),通過(guò)自動(dòng)Edman法分析純化的酶制備物NAPS-1和SPO-124ΔC的N-末端氨基酸序列。2種純化的酶制備物的2個(gè)N-末端氨基酸序列在序列表的SEQID NO22中顯示。該序列與在序列表的SEQ ID NO15中所示的蛋白酶PFUS氨基酸序列從133位至144位的序列重合,表明NAPS-1和SPO-124ΔC二者是從該部分開(kāi)始的多肽所組成的酶。
(3)成熟蛋白酶PFUS的質(zhì)譜法分析對(duì)純化的酶制備物NAPS-1和SPO-124ΔC的質(zhì)譜法分析用API300四極三質(zhì)子分光儀(Perkin-Elmer Sciex)進(jìn)行。根據(jù)NAPS-1的估測(cè)分子量,43,744Da,說(shuō)明由枯草芽孢桿菌DB 104/pNAPS 1產(chǎn)生的成熟蛋白酶PFUS是一種在序列表SEQ ID NO15中所示的蛋白酶氨基酸序列從133位Ala至552位Thr的多肽組成的酶。此外,根據(jù)SPO-124ΔC的估測(cè)分子量42,906Da,說(shuō)明由枯草芽孢桿菌DB 104/pSPO124ΔC產(chǎn)生的成熟蛋白酶PFUS是一種由這樣的一種多肽組成的酶,該多肽為在序列表SEQ ID NO15中所示的蛋白酶PFUS從133位Ala至544位Ser的氨基酸序列,即是序列表SEQ ID NO2中所示的氨基酸序列。
序列表申請(qǐng)人名稱(chēng)TAKARA SHUZO CO.,LTD發(fā)明題目表達(dá)超熱穩(wěn)定蛋白的系統(tǒng)參考/摘要號(hào)660782目前申請(qǐng)?zhí)柲壳吧暾?qǐng)日在先申請(qǐng)?zhí)?51969/1997在先申請(qǐng)日1997,6月10日序列數(shù)29SEQ ID NO1的資料長(zhǎng)度412類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser410SEQ ID NO2的資料長(zhǎng)度1236類(lèi)型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型基因組DNA原始來(lái)源生物激烈熱球菌菌株DSM 3638序列描述GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC60TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT 120CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT 180CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA 240GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT 300CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT 360GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC 420TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT 480GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT 540GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA 600AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG 660ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA 720GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC 780CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT 840ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC 900AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA 960GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA1236SEQ ID NO3的資料長(zhǎng)度29類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr5 10 15Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala20 25SEQ ID NO4的資料長(zhǎng)度522類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽特征其它資料在428位的Xaa是Gly或Val序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr410 415 420Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp425 430 435Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
440 445 450Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp455 460 465Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu470 475 480Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro485 490 495Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp500 505 510Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly515 520SEQ ID NO5的資料長(zhǎng)度4765類(lèi)型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型基因組DNA原始來(lái)源生物激烈熱球菌菌株DSM 3638序列描述TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTTAGAT GGAGAGTGAG 3780GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380TCATTCTACT AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT 4560AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740TGGCATCATC AATTTTCTCT TTAAA4765SEQ ID NO6的資料長(zhǎng)度1398類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro20 25 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met140 145 150Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr170 175 180Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe200 205 210Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr290 295 300Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val335 340 345Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro530 535 540Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu785 790 795Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn890 895 900Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro905 910 915Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala920 925 930Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile935 940 945Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn950 955 960Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser965 970 975Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu980 985 990Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val99510001005Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr101010151020Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn102510301035Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser104010451050Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr105510601065Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr107010751080Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val108510901095Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
110011051110Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala111511201125Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly Asn113011351140Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr114511501155Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys116011651170Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val117511801185Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu119011951200Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu120512101215Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile122012251230Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro123512401245Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val125012551260Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile126512701275Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr128012851290Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe129513001305Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu131013151320Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu132513301335Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu134013451350Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly135513601365Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu137013751380Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu138513901395Gly Glu GluSEQ ID NO7的資料長(zhǎng)度35類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35SEQ ID NO8的資料長(zhǎng)度32類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述KSTCACGGAA CTCACGTDGC BGGHACDGTT GC 32SEQ ID NO9的資料長(zhǎng)度33類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33SEQ ID NO10的資料長(zhǎng)度34類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC34SEQ ID NO11的資料長(zhǎng)度1977類(lèi)型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型基因組DNA原始來(lái)源生物速生熱球菌菌株DSM 2476序列描述ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG60GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC 120GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG 180GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG 240CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA 300AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA 360AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT 420TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT 480GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG 540GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC 600GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC 660GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC 720GTCTCCACCA TCATCGCGGG TGTTAGCTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA 780AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200GACAAGGTCA AGACCGCCCT CATCGGAGAC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977SEQ ID NO12的資料長(zhǎng)度659類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly5 10 15Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val20 25 30Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro35 40 45Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val50 55 60Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala65 70 75Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr80 85 90Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu95 100 105Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr110 115 120Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln125 130 135Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val140 145 150Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Alu Ile155 160 165Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys170 175 180Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr185 190 195Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly200 205 210Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala215 220 225Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys245 250 255Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn275 280 285Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser290 295 300Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly350 355 360Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu380 385 390Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile425 430 435Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala440 445 450Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr545 550 555Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr560 565 570Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala575 580 585Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp590 595 600Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg605 610 615Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro620 625 630Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr635 640 645Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly650 655SEQ ID NO13的資料長(zhǎng)度28類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AGAGGGATCC ATGAAGGGGC TGAAAGCT 28SEQ ID NO14的資料長(zhǎng)度28類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AGAGGCATGC GCTCTAGACT CTGGGAGAGT28SEQ ID NO15的資料長(zhǎng)度1962類(lèi)型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型基因組DNA原始來(lái)源生物激烈熱球菌菌株DSM 3638序列描述ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC60GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 1620CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962SEQ ID NO16的資料長(zhǎng)度654類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly5 10 15Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu20 25 30Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly35 40 45Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser50 55 60Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val65 70 75Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His80 85 90Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu95 100 105Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val110 115 120Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu125 130 135Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val140 145 150Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile155 160 165Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val170 175 180Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp185 190 195Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala275 280 285Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly350 355 360Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu380 385 390Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile425 430 435Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala440 445 450Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala545 550 555Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp560 565 570Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly575 580 585Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu590 595 600Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn605 610 615Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp620 625 630Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr635 640 645Glu Leu Thr Ala Lys Val Tyr Tyr Gly650SEQ ID NO17的資料長(zhǎng)度25類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述TCTGAATTCG TTCTTTTCTG TATGG 25SEQ ID NO18的資料長(zhǎng)度20類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述TGTACTGCTG GATCCGGCAG 20SEQ ID NO19的資料長(zhǎng)度25類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AGAGGCATGC GTATCCATCA GATTTTTGAG 30SEQ ID NO20的資料長(zhǎng)度20類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AGTGAACGGA TACTTGGAAC 20SEQ ID NO21的資料長(zhǎng)度20類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GTTCCAAGTA TCCGTTCACT 20SEQ ID NO22的資料長(zhǎng)度12類(lèi)型氨基酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln5 10SEQ ID NO23的資料長(zhǎng)度24類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)
序列描述TCATGGATCC ACCCTCTCCT TTTA 24SEQ ID NO24的資料長(zhǎng)度26類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC 26SEQ ID NO25的資料長(zhǎng)度29類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GAGAGCTTTC AGCCCCTTCA TNNNNNNTCC GGCAGCCTGC GCAGACATG 29SEQ ID NO26的資料長(zhǎng)度27類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AGAGGGGGAT CCGTGAGAAG CAAAAAA 27SEQ ID NO27的資料長(zhǎng)度20類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GATGACTAGT AAGTCTCTAA20SEQ ID NO28的資料長(zhǎng)度20類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述AAGCCTGAGG TTGTTGCTCC20SEQ ID NO29的資料長(zhǎng)度29類(lèi)型核酸鏈型單鏈拓?fù)浣Y(jié)構(gòu)線(xiàn)性分子類(lèi)型其它核酸(合成的DNA)序列描述GGGCATGCTC ATGAACTTCC AGGCTGTGA 2權(quán)利要求
1.一種由如下氨基酸序列組成并具有熱穩(wěn)定蛋白酶活性的蛋白酶,在該氨基酸序列中,一個(gè)或多個(gè)氨基酸殘基從由序列表SEQ ID NO4表示的氨基酸序列的C-末端缺失。
2.根據(jù)權(quán)利要求1的蛋白酶,它由序列表SEQ ID NO1表示的氨基酸序列組成。
3.一種由如下氨基酸序列組成并具有熱穩(wěn)定蛋白酶活性的蛋白酶,在該氨基酸序列中,一至幾個(gè)氨基酸殘基被缺失、替換、插入或添加到由序列表SEQ ID NO1表示的氨基酸序列中。
4.一種編碼由如下氨基酸序列組成并具有熱穩(wěn)定蛋白酶活性的蛋白的基因,在該氨基酸序列中,從序列表SEQ ID NO4表示的氨基酸序列的C-末端缺失一個(gè)或多個(gè)氨基酸殘基。
5.根據(jù)權(quán)利要求4的蛋白酶基因,它編碼由序列表SEQ ID NO1表示的氨基酸序列。
6.根據(jù)權(quán)利要求5的蛋白酶基因,它由序列表SEQ ID NO2表示的堿基序列組成。
7.一種編碼由如下氨基酸序列組成并具有熱穩(wěn)定蛋白酶活性的蛋白的蛋白酶基因,在該氨基酸序列中,由序列表SEQ ID NO1表示的氨基酸序列缺失、替換、插入或添加一個(gè)至幾個(gè)氨基酸殘基。
8.一種與根據(jù)權(quán)利要求6的蛋白酶基因在嚴(yán)格條件下雜交且編碼具有熱穩(wěn)定蛋白酶活性的蛋白的蛋白酶基因。
9.一種編碼由通式I所示的氨基酸序列的基因SIG-Ala-Gly-Gly-Asn-PRO [I]其中SIG表示來(lái)源于枯草桿菌蛋白酶信號(hào)肽的氨基酸序列,PRO表示被表達(dá)的蛋白的氨基酸序列。
10.根據(jù)權(quán)利要求9的基因,其中SIG是由序列表SEQ ID NO3表示的氨基酸序列。
11.根據(jù)權(quán)利要求9的基因,其中PRO是一種來(lái)源于超嗜熱菌的超熱穩(wěn)定蛋白酶的氨基酸序列。
12.根據(jù)權(quán)利要求11的基因,其中PRO是一種來(lái)源于激烈熱球菌的蛋白酶的氨基酸序列。
13.根據(jù)權(quán)利要求12的基因,其中PRO包括根據(jù)權(quán)利要求1或2的蛋白酶的氨基酸序列。
14.根據(jù)權(quán)利要求13的基因,它包含在選自pSPO124或pSPO124ΔC的質(zhì)粒中。
15.根據(jù)權(quán)利要求9的基因,其中PRO包括根據(jù)權(quán)利要求2的蛋白酶的氨基酸序列。
16.一種產(chǎn)生蛋白的方法,包括培養(yǎng)導(dǎo)入了根據(jù)權(quán)利要求9至15中任一項(xiàng)的基因的芽孢桿菌屬細(xì)菌,并從該培養(yǎng)物中收集目的蛋白。
17.根據(jù)權(quán)利要求16產(chǎn)生蛋白的方法,其中芽孢桿菌屬細(xì)菌是枯草芽孢桿菌。
18.根據(jù)權(quán)利要求16產(chǎn)生蛋白的方法,其中借助于質(zhì)粒載體把根據(jù)權(quán)利要求9至15中任一項(xiàng)的基因?qū)氲窖挎邨U菌屬的細(xì)菌中。
19.根據(jù)權(quán)利要求18產(chǎn)生蛋白的方法,其中選自pSPO124或pSPO124ΔC的質(zhì)粒被導(dǎo)入到芽孢桿菌屬細(xì)菌中。
20.根據(jù)權(quán)利要求19產(chǎn)生蛋白的方法,包括培養(yǎng)枯草芽孢桿菌DB104/pSPO124ΔC FERM BP-6294,并從該培養(yǎng)物中收集目的蛋白。
21.一種把根據(jù)權(quán)利要求9至15中任一項(xiàng)的基因插入其中的質(zhì)粒載體。
22.根據(jù)權(quán)利要求21的質(zhì)粒載體,它選自pSPO124或pSPO124ΔC。
全文摘要
一種具有由序列表SEQ ID NO:1表示的氨基酸序列或經(jīng)缺失、替換、插入或添加一個(gè)至幾個(gè)氨基酸殘基從其產(chǎn)生的序列的超熱穩(wěn)定蛋白酶,一種編碼該超熱穩(wěn)定蛋白酶的基因和一種制備該蛋白酶的方法,目的是通過(guò)遺傳工程技術(shù)提供一種有利于工業(yè)應(yīng)用的超熱穩(wěn)定的蛋白酶。
文檔編號(hào)C12N15/75GK1260002SQ98805990
公開(kāi)日2000年7月12日 申請(qǐng)日期1998年6月4日 優(yōu)先權(quán)日1997年6月10日
發(fā)明者高蔵晃, 森下美緒, 下條智子, 淺田起代蔵, 加藤郁之進(jìn) 申請(qǐng)人:寶酒造株式會(huì)社