專利名稱:皂草苷分解酶及其基因以及大豆皂草精醇b的大量生產(chǎn)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及新型的皂草苷分解酶及其基因以及使用它們生產(chǎn)大豆皂草精醇B的新方法。
背景技術(shù):
大豆皂草精醇B(12-齊墩果烷-3,22,24-三醇)是豆科植物中含有的皂草苷類的糖苷配基之一,一直以來(lái)報(bào)道了它的各種生理活性。例如,報(bào)道了血小板凝集抑制作用、抗補(bǔ)體活性、預(yù)防和治療胃炎、風(fēng)濕病、全身性紅斑狼瘡等免疫疾病、自身免疫疾病或血栓病的作用(Chem.Pharm.Bull.24,121-129,1976、Chem.Pharm.Bull.30,2294-2297,1982、化學(xué)和生物21224-232,1983、特開昭61-37749號(hào))。還報(bào)道了對(duì)來(lái)自人結(jié)腸癌和人卵巢癌細(xì)胞增殖的抑制作用(特開昭61-37749號(hào)、特開平10-234396號(hào))。
作為生產(chǎn)大豆皂草精醇B的方法,例如有將大豆種子中以苷狀態(tài)含有的皂草苷類(大豆皂草苷I-V)的糖鏈進(jìn)行化學(xué)水解的方法。但是這種方法因酸解的條件而產(chǎn)生很多副產(chǎn)物,效率不高。另外,已知大豆種子還含有以大豆皂草精醇A(大豆皂草苷A1-A6)和大豆皂草精醇E作為糖苷配基的皂草苷類。因此從大豆中獲得大豆皂草精醇B時(shí),容易夾雜大豆皂草精醇A和大豆皂草精醇E,從其中只純化大豆皂草精醇B是很困難的。另外,大豆種子中含有的皂草苷的比例通常約為0.2%(藥學(xué)雜志104,162-168,1984),由于太少,因此需要更有效的生產(chǎn)方法。
作為使用微生物生產(chǎn)大豆皂草精醇B的方法,例如已知使用鏈霉菌屬(Streptomyces)(Chem.Pharm.Bull.32,1287-1293,1984)和青霉屬(Penicillium)(特開平10-234396號(hào))的方法。但是使用這些微生物時(shí),大豆皂草精醇B的生產(chǎn)性低、并不具實(shí)際應(yīng)用性。
有報(bào)道指出在使用曲霉屬(Aspergillus)微生物產(chǎn)生的酶(葡糖醛酸糖苷酶)或含有該酶的培養(yǎng)物水解葡糖苷酸皂草苷類,生產(chǎn)以葡糖醛酸作為還原末端的酸性寡糖的方法中,作為副產(chǎn)物,可獲得大豆皂草精醇B(特公平7-32714號(hào))。但是,該方法是酸性寡糖的生產(chǎn)方法,該報(bào)道中只是定性地確定了大豆皂草精醇B。該報(bào)道中雖然明確了具有目標(biāo)活性的酶的分子量,但并未闡明其氨基酸序列。
另一方面,本發(fā)明人調(diào)查了可有選擇地水解以大豆皂草精醇B為糖苷配基的苷,高效生產(chǎn)大豆皂草精醇B的微生物,結(jié)果發(fā)現(xiàn)了屬于新赤殼屬(Neocosmospora)或正青霉屬(Eupenicillium)的絲狀菌。發(fā)現(xiàn)將屬于新赤殼屬或正青霉屬的絲狀菌在含有皂草苷類(以大豆皂草精醇B為糖苷配基的苷)的培養(yǎng)基中培養(yǎng),大豆皂草精醇B在培養(yǎng)物中被高濃度生產(chǎn)、蓄積(參照國(guó)際公開WO01/81612號(hào))。
這樣的絲狀真菌例如有新赤殼屬的侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta var.vasinfecta PF1225)、正青霉屬的Eupenicillium brefeldianum PF1226菌株(參照國(guó)際公開WO01/81612號(hào))。
通過直接利用這些菌類,可以與培養(yǎng)基中添加的皂草苷類的量呈相關(guān)性地生產(chǎn)目標(biāo)物質(zhì)大豆皂草精醇B,但由于皂草苷類具表面活性作用,容易起泡,因此可添加到培養(yǎng)基中的皂草苷類的量受到限制。另外,可以預(yù)見添加了皂草苷類的培養(yǎng)物由于其表面活性作用而粘性增高。因此由該培養(yǎng)物生產(chǎn)目標(biāo)物質(zhì)時(shí),為了提高回收率,需要多次重復(fù)提取操作。通常采用大豆提取物作為可有效地提供皂草苷類的天然資源,但該大豆提取物中除了皂草苷類以外,通常還含有例如油脂、蛋白質(zhì)和多糖類等成分。因此,可添加到培養(yǎng)基中的皂草苷類的量最終與大豆提取物的純度相關(guān),高效的生產(chǎn)未必是件容易的事情。
作為不象傳統(tǒng)的方法依賴大豆提取物中的皂草苷含量,卻可有效地生成大豆皂草精醇B并保持高回收率的方法,需采取用皂草苷分解酶進(jìn)行酶反應(yīng)的大量生產(chǎn)大豆皂草精醇B的方法。
發(fā)明概要本發(fā)明人成功地從具有皂草苷分解活性的微生物中分離純化出具有皂草苷分解活性的蛋白質(zhì)(以下稱為“皂草苷分解酶”),并鑒別了編碼該蛋白質(zhì)的基因。本發(fā)明人還使用得到的基因,使其在不同的宿主中表達(dá),獲得了高活性的皂草苷分解酶。并進(jìn)一步使用該獲得的皂草苷分解酶進(jìn)行酶反應(yīng),高效地生產(chǎn)了大豆皂草精醇B。本發(fā)明基于上述認(rèn)識(shí)而完成。
本發(fā)明的目的在于提供具有皂草苷分解活性的蛋白質(zhì),具體地說,是可分解以大豆皂草精醇B為糖苷配基的苷而生產(chǎn)大豆皂草精醇B的蛋白質(zhì);編碼這樣的蛋白質(zhì)的多核苷酸;以及可使用它們大量生產(chǎn)大豆皂草精醇B的方法。
本發(fā)明的蛋白質(zhì)選自下述各項(xiàng)(a)含有選自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白質(zhì);(b)含有與包含上述(a)的氨基酸序列的蛋白質(zhì)具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì);或(c)含有上述(a)的氨基酸序列中缺失、置換、插入或添加1個(gè)或多個(gè)氨基酸殘基的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì)。
本發(fā)明的多核苷酸選自下述各項(xiàng)(i)由選自SEQ ID NO.1、3和5所示堿基序列的堿基序列構(gòu)成的多核苷酸;(ii)由與上述(i)的堿基序列構(gòu)成的多核苷酸具有至少70%同源性的堿基序列構(gòu)成,且編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸;(iii)由上述(i)的堿基序列中缺失、置換、插入或添加1個(gè)或多個(gè)堿基的堿基序列構(gòu)成,且編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸;和
(iv)與上述(i)的堿基序列構(gòu)成的多核苷酸在嚴(yán)格條件下雜交,且編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸。
本發(fā)明的重組載體中包含本發(fā)明的多核苷酸。
本發(fā)明的宿主是由上述重組載體轉(zhuǎn)化的宿主。
本發(fā)明的目標(biāo)蛋白質(zhì)的生產(chǎn)方法包括培養(yǎng)上述轉(zhuǎn)化宿主,從得到的培養(yǎng)物中收集具皂草苷分解活性的蛋白質(zhì)。
根據(jù)本發(fā)明,可獲得高活性的皂草苷分解酶。另外,使用該酶可以大量且高效地從皂草苷獲得大豆皂草精醇B。根據(jù)該方法,可以不依賴于例如大豆提取物中的皂草苷含量而獲得大豆皂草精醇B。
附圖簡(jiǎn)述
圖1表示質(zhì)粒pCB-SBe的結(jié)構(gòu)和限制性酶切圖。
圖2表示實(shí)施例5的重組皂草苷分解酶的最適pH結(jié)果。圖中,野生型SDN是指來(lái)自侵菅新赤殼侵菅變種PF1225菌株的皂草苷分解酶,重組型SDN是指重組皂草苷分解酶。
圖3表示實(shí)施例5的重組皂草苷分解酶的最適溫度的結(jié)果。圖中,野生型SDN是指來(lái)自侵菅新赤殼侵菅變種PF1225菌株的皂草苷分解酶,重組型SDN是指重組皂草苷分解酶。
圖4表示質(zhì)粒pCB-SDAe的結(jié)構(gòu)和限制性酶切圖。
圖5表示實(shí)施例8的重組皂草苷分解酶的最適pH的結(jié)果。圖中,野生型SDA是指來(lái)自曲霉屬種名待定PF1224菌株(Aspergillus sp.PF1224)的皂草苷分解酶,重組型SDA是指重組皂草苷分解酶。
圖6表示實(shí)施例8的重組皂草苷分解酶的最適溫度的結(jié)果。圖中,野生型SDA是指來(lái)自曲霉屬種名待定PF1224菌株的皂草苷分解酶,重組型SDA是指重組皂草苷分解酶。
圖7表示質(zhì)粒pCB-SDEs的結(jié)構(gòu)和限制性酶切圖。
圖8表示實(shí)施例12的重組皂草苷分解酶的最適pH的結(jié)果。圖中,野生型SDE是指來(lái)自Eupenicillium brefeldianum PF1226的皂草苷分解酶,重組型SDE是指重組皂草苷分解酶。
圖9表示實(shí)施例12的重組皂草苷分解酶的最適溫度的結(jié)果。圖中,野生型SDE是指來(lái)自Eupenicillium brefeldianum PF1226的皂草苷分解酶,重組型SDE是指重組皂草苷分解酶。
圖10表示比較SDN、SDA和SDE的同源性的結(jié)果。
發(fā)明詳述微生物保藏侵菅新赤殼侵菅變種PF1225菌株于2000年3月13日(原保藏日)保藏在獨(dú)立行政法人產(chǎn)業(yè)技術(shù)綜合研究所特許生物寄托中心(305-5466日本國(guó)茨城縣筑波市東1丁目1番地1中央第6)。保藏號(hào)為FERMBP-7475。
Eupenicillium brefeldianum PF1226于2000年3月13日(原保藏日)保藏在獨(dú)立行政法人產(chǎn)業(yè)技術(shù)綜合研究所特許生物寄托中心(305-5466日本國(guó)茨城縣筑波市東1丁目1番地1中央第6)。保藏號(hào)為FERMBP-7476。
曲霉屬種名待定PF1224菌株于2001年5月24日保藏在獨(dú)立行政法人產(chǎn)業(yè)技術(shù)綜合研究所特許生物寄托中心(305-5466日本國(guó)茨城縣筑波市東1丁目1番地1中央第6)。保藏號(hào)為FERM BP-8004。
綠色木霉MC300-1菌株(Trichodererma viride MC300-1)于1996年9月9日(原保藏日)保藏在獨(dú)立行政法人產(chǎn)業(yè)技術(shù)綜合研究所特許生物寄托中心(305-5466日本國(guó)茨城縣筑波市東1丁目1番地1中央第6)。保藏號(hào)為FERM BP-6047。
具皂草苷分解活性的蛋白質(zhì)從侵菅新赤殼侵菅變種PF1225菌株(FERM BP-7475)中分離、純化的皂草苷分解酶與迄今已知的任何一種皂草苷分解酶都不具有同源性,與來(lái)自分解葡糖苷酸皂草苷類的曲霉屬微生物產(chǎn)生的葡糖醛酸糖苷酶(由特公平7-32714號(hào)記載的分子量35,000和45,000的亞基構(gòu)成的約158,000的糖蛋白)的亞基結(jié)構(gòu)和分子量不同,因而可確認(rèn)其為新型的酶系。
進(jìn)一步對(duì)本發(fā)明的蛋白質(zhì)和上述公報(bào)公開的葡糖醛酸糖苷酶的同一性和相似性進(jìn)行了研究。由于難以獲得該公報(bào)記載的曲霉屬微生物,使用其他曲霉屬微生物進(jìn)行了研究。通過下述微生物學(xué)性狀鑒定所使用的曲霉屬種名待定PF1224菌株為半知菌綱曲霉屬(DeuteromycetesAspergillus)的絲狀菌。
(1)菌落特性在Czapek酵母提取物瓊脂培養(yǎng)基上生長(zhǎng)良好,在25℃下培養(yǎng)7天,菌落直徑達(dá)到80mm。呈黃色~黃綠色、羊毛狀菌落,大量形成分生孢子、菌核。背面呈淡褐色。在麥芽汁瓊脂培養(yǎng)基上生長(zhǎng)良好,在25℃下培養(yǎng)7天,菌落直徑達(dá)到80mm。呈黃色~黃綠色、羊毛狀菌落,大量形成分生孢子、菌核。背面呈土黃色。在37℃下培養(yǎng)時(shí),其生長(zhǎng)在兩種培養(yǎng)基上都稍受抑制。
(2)形態(tài)學(xué)特性分生孢子頭呈黃色~黃綠色、放射狀~近圓柱形狀。分生孢子梗表面粗糙、無(wú)色,泡囊為棒形~近球形,幾乎全部形成曲霉。曲霉為單列、雙列混雜,通常為雙列。梗基8~12×4~5μm,瓶梗為8~12×3~4μm。分生孢子呈球形~近球形、表面光滑,為4~6μm。
使用曲霉屬種名待定PF1224菌株鑒定被稱為葡糖醛酸糖苷酶的酶時(shí),本發(fā)明人發(fā)現(xiàn)從曲霉屬種名待定PF1224菌株分離、純化的皂草苷分解酶的分子量為90kDa、最適pH5-6、最適溫度為45-50℃(參照參考例)。
還鑒定了從Eupenicillium brefeldianum PF1226分離、純化的皂草苷分解酶的分子量為90kDa、最適pH5-6、最適溫度為45-50℃。
上述公報(bào)中未公開葡糖醛酸糖苷酶的氨基酸序列等信息,無(wú)法比較氨基酸序列的同源性,因此,由蛋白質(zhì)的分子量和亞基結(jié)構(gòu)進(jìn)行了比較判斷。結(jié)果表明本發(fā)明的蛋白質(zhì)是與上述公報(bào)記載的葡糖醛酸糖苷酶不同的蛋白質(zhì)。
如上所述,根據(jù)本發(fā)明,可提供選自下述的蛋白質(zhì)。
(a)含有選自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白質(zhì);(b)含有與包含上述(a)的氨基酸序列的蛋白質(zhì)具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì);或(c)含有上述(a)的氨基酸序列中缺失、置換、插入或添加1個(gè)或多個(gè)氨基酸殘基的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì)。
即,本發(fā)明的蛋白質(zhì)是含有與SEQ ID NO.2、4或6所示氨基酸序列同一或?qū)嵸|(zhì)上同一的氨基酸序列而構(gòu)成的蛋白質(zhì)。
這里,與SEQ ID NO.2、4或6所示氨基酸序列實(shí)質(zhì)上同一的氨基酸序列是指與這些SEQ ID NO.所示的任一種氨基酸序列的同源性典型地為50%以上,優(yōu)選70%以上,更優(yōu)選80%以上,進(jìn)一步優(yōu)選90%以上,更進(jìn)一步優(yōu)選95%以上,最優(yōu)選98%以上的氨基酸序列。
本說明書中所示的這些同源性的數(shù)值均是采用本領(lǐng)域技術(shù)人員公知的同源性搜索程序計(jì)算的數(shù)值,例如在FASTA、BLAST等中,通過使用缺省值(初始設(shè)定)的參數(shù)可以容易地計(jì)算。
例如同源性搜索程序Genetyx(Genetyx公司出品)中,使用缺省值的參數(shù)計(jì)算的同源性的數(shù)值分別為SDN和SDA之間的同源性為51%,SDA和SDE之間的同源性為52%,SDE和SDN之間的同源性為51%。
含有與SEQ ID NO.2、4或6所示氨基酸序列實(shí)質(zhì)上同一的氨基酸序列而構(gòu)成的蛋白質(zhì)是指包含在任何這些氨基酸序列中缺失、置換、插入或添加1個(gè)或多個(gè)氨基酸殘基的氨基酸序列、且具有皂草苷分解活性的蛋白質(zhì)。
這里,可缺失、置換、插入或添加的氨基酸殘基的數(shù)量?jī)?yōu)選為1-50個(gè)、更優(yōu)選1-30個(gè)、進(jìn)一步優(yōu)選1-10個(gè)、更進(jìn)一步優(yōu)選1-5個(gè)、最優(yōu)選1-2個(gè)。
本發(fā)明的一個(gè)更優(yōu)選的實(shí)施方案中,上述(b)的蛋白質(zhì)是由在上述氨基酸序列(a)中的1個(gè)或多個(gè)氨基酸殘基被保守性置換的氨基酸序列構(gòu)成、且具有皂草苷分解活性的蛋白質(zhì)。
這里的“保守性置換”是指不實(shí)質(zhì)性地改變蛋白質(zhì)的活性,將1個(gè)或多個(gè)氨基酸殘基用其它的化學(xué)性質(zhì)相似的氨基酸殘基置換。例如有某個(gè)疏水性殘基被其它疏水性殘基置換的情況、某個(gè)極性殘基被具有相同電荷的其它極性殘基置換的情況等??梢赃M(jìn)行這種保守性置換的功能相似的各種氨基酸都是本領(lǐng)域公知的。例舉具體的例子,非極性(疏水性)氨基酸有丙氨酸、纈氨酸、異亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸、甲硫氨酸等。極性(中性)氨基酸有甘氨酸、絲氨酸、蘇氨酸、酪氨酸、谷氨酰胺、天冬酰胺、半胱氨酸等。帶正電荷(堿性)的氨基酸有精氨酸、組氨酸、賴氨酸等。另外,帶負(fù)電荷(酸性)的氨基酸有天冬氨酸、谷氨酸等。
本發(fā)明中,“具有皂草苷分解活性的蛋白質(zhì)”是指可分解皂草苷的活性得到本領(lǐng)域人員證實(shí)的蛋白質(zhì),例如是指在與實(shí)施例5同樣的條件下測(cè)定時(shí),其皂草苷分解活性得到證實(shí)的蛋白質(zhì)。該蛋白質(zhì)可從后述的“具皂草苷分解活性的生物”中分離、純化。
本發(fā)明的蛋白質(zhì)例如可如下獲得。
培養(yǎng)具有皂草苷分解活性的生物,以皂草苷分解活性為指標(biāo),從該培養(yǎng)液中分離、純化具有皂草苷分解活性的蛋白質(zhì)。對(duì)得到的純化蛋白質(zhì)的氨基酸序列進(jìn)行分析,合成編碼該氨基酸序列的寡核苷酸,以該生物的DNA為模板進(jìn)行PCR(聚合酶鏈反應(yīng)),合成長(zhǎng)鏈探針。使用該探針,通過反向PCR或RACE(cDNA末端快速擴(kuò)增)法分析皂草苷分解酶基因的翻譯區(qū)的DNA序列。將這樣得到的皂草苷分解酶的翻譯區(qū)連接到在用于表達(dá)的宿主內(nèi)發(fā)揮功能的調(diào)節(jié)序列上,獲得表達(dá)載體。使用該表達(dá)載體轉(zhuǎn)化該宿主,通過培養(yǎng)該轉(zhuǎn)化體,可獲得皂草苷分解酶。
這里,“具有皂草苷分解活性的生物”只要是具有皂草苷分解活性的生物即可,并無(wú)特別限定,包括微生物、植物等。這樣的微生物例如包括新赤殼屬、曲霉屬或正青霉屬的絲狀菌。已知這些微生物在醬和醬油的釀造中使用,具有皂草苷分解活性。放線菌和桿菌等中也存在具皂草苷分解活性的微生物,因此可以認(rèn)為所述微生物中也包括這樣的生物。作為所述植物,例如預(yù)測(cè)豆科植物的皂草苷類的糖轉(zhuǎn)移酶中存在催化可逆反應(yīng)的物質(zhì),因此也包括這樣的植物體、植物細(xì)胞、來(lái)源于這樣的植物的愈傷組織或培養(yǎng)細(xì)胞。
根據(jù)本發(fā)明的另一個(gè)優(yōu)選實(shí)施方案,本發(fā)明的蛋白質(zhì)或多核苷酸來(lái)自微生物,更優(yōu)選來(lái)自絲狀菌微生物。這樣的絲狀菌微生物優(yōu)選為屬于新赤殼屬、曲霉屬或正青霉屬的絲狀菌。
這里,新赤殼屬的絲狀菌例如有侵菅新赤殼侵菅變種PF1225菌株(保藏號(hào)FERM BP-7475)或其突變菌株。曲霉屬的絲狀菌例如有曲霉屬種名待定PF1224菌株(保藏號(hào)FERM BP-8004)或其突變菌株。正青霉屬的絲狀菌例如有Eupenicillium brefeldianum PF1226(保藏號(hào)FERMBP-7476)或其突變菌株。
多核苷酸根據(jù)本發(fā)明,提供編碼本發(fā)明蛋白質(zhì)的多核苷酸。
本發(fā)明的典型的多核苷酸選自上述(i)~(iv)。
即,根據(jù)本發(fā)明的一個(gè)實(shí)施方案,多核苷酸由選自SEQ ID NO.1、3和5所示堿基序列的堿基序列構(gòu)成。
根據(jù)本發(fā)明的另一實(shí)施方案,多核苷酸由與SEQ ID NO.1、3或5所示堿基序列構(gòu)成的多核苷酸具有至少70%同源性的堿基序列構(gòu)成、且編碼具有皂草苷分解活性的蛋白質(zhì)。與由SEQ ID NO.1、3或5所示堿基序列構(gòu)成的多核苷酸的同源性優(yōu)選80%以上,更優(yōu)選90%以上,進(jìn)一步優(yōu)選95%以上,最優(yōu)選98%以上。
本說明書中所示的同源性的數(shù)值均可采用本領(lǐng)域技術(shù)人員公知的同源性搜索程序計(jì)算的數(shù)值,例如在FASTA、BLAST等中,通過使用缺省值(初始設(shè)定)的參數(shù)可以容易地計(jì)算。
根據(jù)本發(fā)明的另一個(gè)實(shí)施方案,多核苷酸由SEQ ID NO.1、3或5所示堿基序列中缺失、置換、插入或添加1個(gè)或多個(gè)堿基的堿基序列構(gòu)成,且編碼具有皂草苷分解活性的蛋白質(zhì)。
這里,可缺失、置換、插入或添加的堿基數(shù)量?jī)?yōu)選為1-50個(gè)、更優(yōu)選1-30個(gè)、進(jìn)一步優(yōu)選1-10個(gè)、更進(jìn)一步優(yōu)選1-5個(gè)、最優(yōu)選1-2個(gè)。
根據(jù)本發(fā)明又一個(gè)實(shí)施方案,多核苷酸與由SEQ ID NO.1、3或5所示堿基序列構(gòu)成的多核苷酸在嚴(yán)格條件下雜交,且編碼具有皂草苷分解活性的蛋白質(zhì)。根據(jù)本發(fā)明,多核苷酸中也包括與上述編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸互補(bǔ)的多核苷酸。
這里,“嚴(yán)格條件”是指控制為下述條件使包含編碼部分或全部本發(fā)明蛋白質(zhì)的氨基酸序列的堿基序列而構(gòu)成的探針與編碼同源體的基因雜交,另一方面,使所述探針不與具有特公平7-32714號(hào)記載的分子量的葡糖醛酸糖苷酶雜交。具體地說,例如有下述條件使用編碼標(biāo)記的SEQ ID NO.1、3或5所示氨基酸序列的全長(zhǎng)多核苷酸作為探針,按照ECL直接DNA/RNA標(biāo)記檢測(cè)系統(tǒng)(Amersham)的方法,首先進(jìn)行1小時(shí)的預(yù)雜交(42℃),然后摻入上述探針,進(jìn)行15小時(shí)的雜交(42℃),接著使用添加了0.4%SDS和6M尿素的0.5倍濃度SSC(SSC;15mM檸檬酸三鈉、150mM氯化鈉),在42℃下洗滌20分鐘,重復(fù)2次,再用5倍濃度SSC在室溫(約25℃)洗滌10分鐘,洗滌2次。
重組載體根據(jù)本發(fā)明,提供含有上述多核苷酸的重組載體。
本發(fā)明的重組載體的構(gòu)建順序和方法可以采用基因工程領(lǐng)域常用的手段。
本發(fā)明中可使用的表達(dá)載體有整合到宿主染色體DNA的表達(dá)載體、使具有可自我復(fù)制的自主復(fù)制序列的載體以質(zhì)粒狀態(tài)在宿主細(xì)胞內(nèi)存在的表達(dá)載體。例如pUC系列(pUC18或pUC118等)、pBluescript系列(pBluescriptII KS+等)和pBR322等質(zhì)粒。存在于宿主細(xì)胞內(nèi)的基因的拷貝數(shù)可以是1個(gè)或多個(gè)。
對(duì)于重組載體的調(diào)節(jié)序列,只要是在宿主中發(fā)揮功能的調(diào)節(jié)序列即可,沒有特別限定,例如可以使用啟動(dòng)子和終止子等。這樣的調(diào)節(jié)序列可以與編碼具皂草苷分解活性的蛋白質(zhì)的基因連接,并使基因表達(dá)。
與調(diào)節(jié)序列的連接例如可以按照常規(guī)方法,通過將編碼目標(biāo)蛋白質(zhì)的基因(目標(biāo)基因)的翻譯區(qū)順時(shí)方向插入啟動(dòng)子的下游來(lái)進(jìn)行。此時(shí),可以使目標(biāo)基因與編碼其它蛋白質(zhì)的翻譯區(qū)的外源基因連接,作為融合蛋白質(zhì)表達(dá)。
表達(dá)的具皂草苷分解活性的蛋白質(zhì)或具該活性的融合蛋白可以在用于表達(dá)的宿主細(xì)胞內(nèi)產(chǎn)生,也可以使其分泌到培養(yǎng)基中。
例如,由DNA序列分析和N末端氨基酸序列分析可知來(lái)自侵菅新赤殼侵菅變種PF1225菌株(FERM BP-7475)的皂草苷分解酶的N末端側(cè)具有26個(gè)氨基酸殘基的信號(hào)肽序列(參照實(shí)施例)。同樣方法確定了來(lái)自曲霉屬種名待定PF1224菌株的皂草苷分解酶和來(lái)自Eupenicillium brefeldianum PF1226的皂草苷分解酶的N末端側(cè)分別具有28個(gè)氨基酸殘基和17個(gè)氨基酸殘基的信號(hào)肽序列。
因此,例如使用木霉屬(Trichoderma)和曲霉屬等的絲狀菌作為宿主時(shí),可以直接利用該序列中含有的信號(hào)序列,使其分泌到培養(yǎng)基中。
另外,由推定氨基酸組成得出的預(yù)測(cè)分子量68kDa以及在大腸桿菌(Escherichia coli)和綠色木霉(Trichoderma viride)菌株中表達(dá)的蛋白質(zhì)的分子量約68kDa,可以推測(cè)分子量約77kDa的來(lái)自侵菅新赤殼侵菅變種PF1225菌株的皂草苷分解酶為糖蛋白。同樣,由推定氨基酸組成得出的預(yù)測(cè)分子量68kDa,可以推測(cè)分子量約90kDa的來(lái)自曲霉屬種名待定PF1224菌株的皂草苷分解酶和分子量約80kDa的在綠色木霉菌株中表達(dá)的蛋白質(zhì)為糖蛋白。另外,由推定氨基酸組成得出的預(yù)測(cè)分子量65kDa,可以推測(cè)分子量約90kDa的來(lái)自Eupenicillium brefeldianumPF1226的皂草苷分解酶為糖蛋白。
預(yù)計(jì)這些糖鏈不會(huì)對(duì)活性表達(dá)產(chǎn)生大的影響,但有望在耐熱性、最適pH的改變、保存穩(wěn)定性等方面產(chǎn)生效果,也可以進(jìn)行翻譯后的修飾例如添加各種糖鏈等。
本發(fā)明的重組載體還可以連接抗藥性基因和/或營(yíng)養(yǎng)需求型互補(bǔ)基因等選擇性標(biāo)記基因來(lái)構(gòu)建。
基因標(biāo)志可以根據(jù)選擇轉(zhuǎn)化體的方法來(lái)適當(dāng)選擇。例如可使用編碼抗藥性的基因或與營(yíng)養(yǎng)需求型互補(bǔ)的基因??顾幮曰蚶缬锌乖矫顾亍⒈骄`、寡霉素、潮霉素、G418、滿霉素、雙丙氨膦(bialaphos)、沙稻瘟菌素S、腐草霉素、膦絲菌素、氨芐青霉素、鏈霉素、卡那霉素等藥物的基因。與營(yíng)養(yǎng)需求型互補(bǔ)的基因例如有amdS、pyrG、argB、trpC、niaD、TRP1、LEU2、URA3等基因。另外也可含有用于各種氨基酸合成系統(tǒng)、維生素合成系統(tǒng)、核酸合成系統(tǒng)等表達(dá)的宿主原有的營(yíng)養(yǎng)需求型互補(bǔ)基因標(biāo)志,或經(jīng)各種突變處理使其具有營(yíng)養(yǎng)需求型、與該營(yíng)養(yǎng)需求型互補(bǔ)的基因標(biāo)志。
轉(zhuǎn)化體和目標(biāo)蛋白質(zhì)的生產(chǎn)根據(jù)本發(fā)明,提供由上述重組載體轉(zhuǎn)化的宿主。
可在本發(fā)明中使用的宿主只要是可正確地轉(zhuǎn)錄和翻譯編碼具皂草苷分解活性的蛋白質(zhì)的基因的生物即可,并沒有特別限定,例如有大腸桿菌和芽孢桿菌屬(Bacillus spp.)等的細(xì)菌、放線菌、酵母、木霉屬等的絲狀菌或上述微生物的突變菌株。
用于基因表達(dá)的重組載體向宿主的導(dǎo)入可以按照常規(guī)方法進(jìn)行。導(dǎo)入方法例如有電穿孔法、聚乙二醇法、農(nóng)桿菌法、鋰法或氯化鈣法等,可選擇對(duì)于宿主細(xì)胞來(lái)說效率較高的方法。
轉(zhuǎn)化體(轉(zhuǎn)化的宿主細(xì)胞)的培養(yǎng)可以按照常規(guī)方法,適當(dāng)選擇培養(yǎng)基、培養(yǎng)條件等來(lái)進(jìn)行。
作為培養(yǎng)基的常用成分,例如碳源可以使用葡萄糖、蔗糖、纖維素、飴糖、糊精、淀粉、甘油、糖蜜、動(dòng)植物油等。氮源可以使用大豆粉、麥胚、玉米漿、棉籽餅、肉浸汁、蛋白胨、酵母提取物、硫酸銨、硝酸鉀、尿素等。其它可根據(jù)需要添加有效生成鈉、鉀、鈣、鎂、鈷、氯、磷酸、硫酸和其它離子的無(wú)機(jī)鹽類,例如氯化鉀、硫酸鎂、磷酸二氫鉀、硫酸鋅、硫酸錳、硫酸銅等。另外還可根據(jù)需要添加各種維生素、氨基酸、核苷酸等微量營(yíng)養(yǎng)元素、抗生素等選擇性藥物。還可以適當(dāng)添加幫助轉(zhuǎn)化體生長(zhǎng)、促進(jìn)導(dǎo)入基因的表達(dá)的有機(jī)物和無(wú)機(jī)物。
培養(yǎng)可以在選擇性地含有上述成分的培養(yǎng)基上進(jìn)行。
作為培養(yǎng)方法,例如采用液體培養(yǎng)基時(shí),有好氣條件下的培養(yǎng)方法、振蕩培養(yǎng)法、通氣攪拌培養(yǎng)法或深層培養(yǎng)法。培養(yǎng)基的pH例如為pH5-pH8左右。通常條件下,培養(yǎng)溫度例如為14℃-40℃,優(yōu)選26℃-37℃。培養(yǎng)天數(shù)可在1天-25天左右的條件下進(jìn)行。
本發(fā)明的目標(biāo)蛋白質(zhì)的生產(chǎn)方法中,可從轉(zhuǎn)化細(xì)胞的培養(yǎng)物中獲得目標(biāo)基因表達(dá)產(chǎn)物-具皂草苷分解活性的蛋白質(zhì)??梢园凑粘R?guī)方法從培養(yǎng)物中獲得目標(biāo)蛋白質(zhì),例如將從培養(yǎng)物中提取(研磨處理、加壓破碎等)、回收(過濾、離心等)和/或純化(鹽析法、溶劑沉淀法等)等方法適當(dāng)組合來(lái)進(jìn)行。另外,在這些過程中,可以根據(jù)需要添加苯甲基磺酰氟(PMSF)、苯脒或亮抑蛋白酶肽等蛋白酶抑制劑。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,可通過使編碼具皂草苷分解活性的蛋白質(zhì)的基因在生成皂草苷類的植物體例如大豆、四季豆、豇豆、豌豆、花生、蠶豆或苜蓿等中表達(dá),形成含大豆皂草精醇B的植物體,由此直接獲得大豆皂草精醇B。這種情況下,也可以使用肌動(dòng)蛋白、遍在蛋白質(zhì)、花椰菜花葉病毒35S啟動(dòng)子等或在種子等部位特異性表達(dá)的基因的調(diào)節(jié)序列。
將編碼具皂草苷分解活性的蛋白質(zhì)的基因正確地連接到上述調(diào)節(jié)序列上,再根據(jù)需要將雙丙氨膦、卡那霉素或沙稻瘟菌素S等抗藥性標(biāo)志基因與其連接。可以通過基因槍法、PEG法、電穿孔法或微量注射法等直接導(dǎo)入方法或通過農(nóng)桿菌的Ti質(zhì)粒載體的間接導(dǎo)入法等將其導(dǎo)入植物細(xì)胞,制備轉(zhuǎn)化植物細(xì)胞。向植物細(xì)胞或植物導(dǎo)入基因的方法例如可以按照Vaeck M.等人的方法(Nature328,33-37,1987)實(shí)施。
可以通過本領(lǐng)域技術(shù)人員熟知的方法使上述轉(zhuǎn)化的植物細(xì)胞進(jìn)行再分化,獲得具完整植物體的轉(zhuǎn)化植物。還可以栽培該轉(zhuǎn)化植物,收獲該植物體和/或使編碼具皂草苷分解活性的蛋白質(zhì)的基因表達(dá)的器官例如種子等,采用適合其性狀的方法例如溶劑提取法等,由其中獲得大豆皂草精醇B。
大豆皂草精醇B的生產(chǎn)根據(jù)本發(fā)明的一個(gè)實(shí)施方案,提供大豆皂草精醇B的生產(chǎn)方法,所述方法使用含有可由上述轉(zhuǎn)化宿主得到的具皂草苷分解活性的蛋白質(zhì)的培養(yǎng)物,分解以大豆皂草精醇B為糖苷配基的苷。
根據(jù)本發(fā)明的另一個(gè)實(shí)施方案,還提供大豆皂草精醇B的生產(chǎn)方法,所述方法使用選自上述蛋白質(zhì)和可由上述轉(zhuǎn)化宿主得到的蛋白質(zhì)的至少一種蛋白質(zhì),分解以大豆皂草精醇B為糖苷配基的苷。
這里,“以大豆皂草精醇B為糖苷配基的苷”主要在豆科植物中含有,例如大豆皂草苷I、II、IV、V;小豆皂草苷II、V(azukisaponinII、V)、黃芪苷VIII、槐黃苷I(sophoaraflavoside I)等。
另外,作為含有以大豆皂草精醇B為糖苷配基的苷的物質(zhì),例如有用熱水、醇或含水醇從大豆或脫脂大豆(豆餅)中提取的物質(zhì),更優(yōu)選按照常規(guī)方法除去蛋白質(zhì)、糖、脂糖等雜質(zhì)的物質(zhì)。
根據(jù)本發(fā)明,使含有具皂草苷分解活性的蛋白質(zhì)的培養(yǎng)物、本發(fā)明的蛋白質(zhì)或可由本發(fā)明的宿主獲得的蛋白質(zhì)與上述含有以大豆皂草精醇B為糖苷配基的苷的物質(zhì)和/或所述苷作用,可獲得大豆皂草精醇B。
作為具體例子,例如將皂草苷(小城制藥)按照約1%-10%重量的比例溶解于水或緩沖液例如乙酸緩沖液或磷酸緩沖液等中,向其中添加皂草苷分解酶。使其在適當(dāng)溫度例如20℃-50℃下反應(yīng),將該反應(yīng)液用乙酸乙酯等有機(jī)溶劑萃取,可獲得大豆皂草精醇B。
實(shí)施例以下通過實(shí)施例詳述本發(fā)明,但本發(fā)明并不限定于此。
參考例1曲霉屬皂草苷分解酶的確認(rèn)將約1cm2曲霉屬種名待定PF1224菌株(FERM BP-8004)的PDA斜面培養(yǎng)物接種于裝有100ml TS培養(yǎng)基(2.0%可溶淀粉、1.0%葡萄糖、0.5%聚胨、0.6%麥胚、0.3%酵母提取液、0.2%豆餅和0.2%碳酸鈣(滅菌前為pH7.0))的500ml容量三角燒瓶中,在25℃振蕩培養(yǎng)3天。將4ml所得培養(yǎng)物接種于加入了100ml MY培養(yǎng)基(4.0%麥芽汁、2.0%酵母提取物、0.2%磷酸二氫鉀、0.2%硫酸銨、0.03%硫酸鎂七水合物、0.03%氯化鈣二水合物(pH7.0))和4.0%大豆皂草苷(小城制藥)的500ml容量三角燒瓶中,振蕩培養(yǎng)3天。
在以下的來(lái)自曲霉屬的皂草苷分解酶的純化中,以試驗(yàn)例1所示的皂草苷分解活性為指標(biāo)。
取約800ml上述培養(yǎng)液,用玻璃濾器(G3)過濾后進(jìn)行離心(8,000rpm、30分鐘),除去菌體碎片。向約570ml該培養(yǎng)上清中加入294g硫酸銨,通過離心(8,000rpm、30分鐘)回收產(chǎn)生的沉淀。將該沉淀溶解于約120ml緩沖液A(0.1M乙酸鈉緩沖液、1M硫酸銨(pH 5.8)),進(jìn)行ButylToyopearl 650S(26mm i.d.×330mm)(Tosoh Co.)的疏水層析。用從緩沖液B(0.1M磷酸鈉緩沖液、1M硫酸銨(pH5.8))到0.1M磷酸鈉緩沖液(pH5.8)的濃度梯度進(jìn)行洗脫,回收未吸附流分和1M至0.5M濃度硫酸銨洗脫的流分。
用Pellicon XL(截留分子量10,000)(Millipore)濃縮回收的流分,然后向其中加入1M Tris-鹽酸緩沖液和硫酸銨,使其濃度與緩沖液C(50mM Tris-鹽酸緩沖液、1M硫酸銨(pH 7.5))濃度相同,進(jìn)行6mlResource PHE(Amersham Biosciences)的疏水層析。用從緩沖液C到50mM Tris-鹽酸緩沖液(pH7.5)的濃度梯度進(jìn)行洗脫,回收未吸附流分。
用Ultrafree 15(截留分子量5,000)(Millipore)濃縮所得流分,進(jìn)行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝膠過濾層析。用緩沖液D(25mM磷酸鈉緩沖液、0.15M氯化鈉(pH5.8))進(jìn)行洗脫,回收截留分子量約為90kDa的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果觀察到在分子量約為90kDa處的單一條帶。
試驗(yàn)例1皂草苷分解活性的測(cè)定用PD-10柱(Amersham Biosciences)對(duì)含有目標(biāo)酶的酶液進(jìn)行脫鹽,使其與等量的2%皂草苷溶液混合,在37℃下反應(yīng)約16小時(shí)。將其用等量的乙酸乙酯萃取,將該萃取液通過TLC展開(所用溶劑系統(tǒng)為氯仿∶甲醇=95∶5)。利用香草醛-硫酸顯色反應(yīng)檢測(cè)Rf值為0.35的大豆皂草精醇B,從而測(cè)定目標(biāo)酶液的酶活性。
試驗(yàn)例2皂草苷分解活性的定量分析向50μl2%皂草苷溶液中加入稀釋的酶,定容為100μl,使其反應(yīng)30分鐘,接著用等量的乙酸乙酯萃取反應(yīng)液,將其中的50μl用450μl流動(dòng)相稀釋。取其中的10μl進(jìn)行下述條件的高效液相色譜,測(cè)定保留時(shí)間約為7.5分鐘的峰的高度。將其與大豆皂草精醇B的可信樣品的峰高比較,定量評(píng)價(jià)所述酶的皂草苷分解活性。
柱Inertsil ODS-2、5μm(4.6i.d.×250mm)
柱溫40℃流動(dòng)相乙腈∶甲醇∶水=50∶35∶15流動(dòng)相流速0.8ml/min實(shí)施例1來(lái)自新赤殼屬的皂草苷分解酶(SDN)的分離純化將約1cm2侵菅新赤殼侵菅變種PF1225菌株(FERM BP-7475)的PDA斜面培養(yǎng)物接種于裝有100ml TS培養(yǎng)基的500ml容量三角燒瓶中,在25℃振蕩培養(yǎng)3天。將4ml上述培養(yǎng)物接種于裝有100ml MY培養(yǎng)基和4.0%大豆皂草苷(小城制藥)的500ml容量三角燒瓶中,振蕩培養(yǎng)3天。
在以下的來(lái)自新赤殼屬的皂草苷分解酶的純化中,以試驗(yàn)例1所示的皂草苷分解活性為指標(biāo)。
將約800ml上述培養(yǎng)液用約2倍的水稀釋,通過離心(8,000rpm、30分鐘)除去菌體。向其中加入171g硫酸銨,離心(8,000rpm、30分鐘)除去產(chǎn)生的沉淀。再向該上清中加入573g硫酸銨,離心(8,000rpm、30分鐘)回收沉淀,將該沉淀溶解于70ml緩沖液C中。進(jìn)行ButylToyopearl650S(26mm i.d.×110mm)(Tosoh Co.)的疏水層析。用從緩沖液C到50mM Tris-鹽酸緩沖液(pH7.5)的濃度梯度進(jìn)行洗脫,回收未吸附流分。
向約500ml上述流分中加入約239g硫酸銨,離心回收得到的沉淀。接著將回收的沉淀溶解于4ml緩沖液B中,進(jìn)行苯基瓊脂糖FF(PhenylSepharose FF)(16mm i.d.×100mm)(Amersham Biosciences)的疏水層析。用從緩沖液B到0.1M磷酸鈉緩沖液(pH 5.8)的濃度梯度進(jìn)行洗脫,回收約0.4M濃度硫酸銨洗脫的流分。
接著將回收的流分進(jìn)行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝膠過濾層析。用緩沖液E(50mM Tris-鹽酸緩沖液、0.15M氯化鈉(pH7.5))進(jìn)行洗脫,回收截留分子量約為76,000的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果觀察到在分子量約為77kDa處的單一條帶。
實(shí)施例2皂草苷分解酶(SDN)的氨基酸序列分析2a)N末端側(cè)的氨基酸序列將如實(shí)施例1制備的流分進(jìn)行SDS-PAGE,轉(zhuǎn)印至PVDF膜(Immobilon-PSQ)(Millipore),然后水洗風(fēng)干。將其用蛋白質(zhì)測(cè)序儀492型(Applied Biosystem)進(jìn)行氨基酸序列分析。
分析得到的氨基酸序列如下所示。
N末端氨基酸序列ASPPASVPNNPSSEEITLQ(SEQ ID NO.7)2b)內(nèi)部氨基酸序列的分析(肽作圖)將實(shí)施例1中制備的流分進(jìn)行SDS-PAGE,使用考馬斯亮藍(lán)R250進(jìn)行蛋白質(zhì)染色。將其中分子量約為77kDa染色的單一條帶切下,用在50%乙腈中配制的0.2M碳酸氫銨緩沖液(pH8.0)進(jìn)行脫色,在室溫下風(fēng)干約2小時(shí)。
接著,將該凝膠條用含0.02%吐溫20的0.2M碳酸氫銨緩沖液(pH8.0)浸泡,然后加入胰蛋白酶(Promega),在37℃下反應(yīng)2天。回收反應(yīng)后的上清,再用60%乙腈和0.1%三氟乙酸將凝膠條洗滌3次。將該洗滌液與反應(yīng)上清合并,濃縮,通過Model 172μ制備HPLC系統(tǒng)(AppliedBiosystems)(RP-300 Aquiapore C18、220×2.1mm、由0.1%三氟乙酸、35%乙腈到0.085%三氟乙酸、35%乙腈的濃度梯度),分離如下所示的5種肽。
Trp26.8LVFNPSPKSEQ ID NO.8Trp27.59WNVAADGSGPSGEIRSEQ ID NO.9Trp32.07VTILHNPEGVAPITAK SEQ ID NO.10Trp39.43EHSDTIPWGVPYVPGSQ SEQ ID NO.11Trp41.3LTDYSFDWYSDIR SEQ ID NO.12
實(shí)施例3皂草苷分解酶(SDN)的克隆和序列分析3a)PCR制備長(zhǎng)鏈探針由侵菅新赤殼侵菅變種PF1225菌株(FERM BP-7475)培養(yǎng)菌體中制備基因組DNA,用其作為PCR模板。
基因組DNA的分離按照Horiuchi等人的方法(J.Bacteriol.170,272-278,1988)進(jìn)行。首先,通過離心(7,500rpm、10分鐘)回收在TS培養(yǎng)基上培養(yǎng)的菌體。將得到的菌體冷凍干燥,然后懸浮于TE(10mMTris-鹽酸緩沖液、1mM EDTA(pH8.0))中,在3%SDS溶液中、在60℃下處理30分鐘。接著用TE飽和苯酚萃取,由此除去菌體碎片。
將萃取液用乙醇沉淀后,用核糖核酸酶A(Nippon Gene)和蛋白酶K(和光純藥)處理,再用12%的聚乙二醇6000使核酸沉淀。將沉淀用TE飽和苯酚萃取,用乙醇沉淀,將該沉淀物溶解于TE,以此作為基因組DNA。
根據(jù)實(shí)施例2中得到的肽序列,合成編碼上述肽序列的如下所示的寡核苷酸,用其作為PCR引物。
引物N1CCIGCITCNGTNCCNAA SEQ ID NO.13引物N2CCIGCIAGYGTNCCNAA SEQ ID NO.14引物2ACCRTCIGCNGCNACRTT SEQ ID NO.15引物3ACCCCAIGGDATNGTRTC SEQ ID NO.16引物4AACICCYTCNGGRTTRTG SEQ ID NO.17使用TaKara Taq(寶酒造)進(jìn)行PCR,在94℃下進(jìn)行1分鐘的熱變性處理,然后將94℃30秒、45℃30秒和55℃3分鐘的一系列步驟進(jìn)行10個(gè)循環(huán),接著將94℃30秒、47℃30秒和60℃3分鐘的一系列步驟進(jìn)行20個(gè)循環(huán),擴(kuò)增片段。結(jié)果,在引物N1和引物4A的組合中,特異性擴(kuò)增了約0.8kb的片段。使用TOPO TA克隆試劑盒(Invitrogen)將其克隆進(jìn)入pCR2.1-TOPO中(pCR2.1-2)。
使用dRhodamine Terminator cycle sequencing ready reaction(Applied Biosystems)和ABIPRISM 310基因分析儀(Applied Biosystems)進(jìn)行DNA序列分析,解碼克隆進(jìn)入pCR2.1-2中的PCR產(chǎn)物,確定了SEQ ID NO.1所示序列中位置88至位置812的區(qū)得到擴(kuò)增。
3b)DNA印跡分析和使用反向PCR進(jìn)行的序列解碼DNA印跡分析中,對(duì)由EcoRI消化的基因組DNA進(jìn)行瓊脂糖凝膠電泳,轉(zhuǎn)印到Hibond N+(Amersham Biosciences)。使用ECF隨機(jī)引物標(biāo)記和檢測(cè)系統(tǒng)(Amersham Biosciences)進(jìn)行雜交,使用分子成象儀FX(Biorad)檢測(cè)條帶。
使用實(shí)施例3的3a)中得到的PCR產(chǎn)物作為探針,檢測(cè)出約2kb的條帶。
接著,用EcoRI消化基因組DNA,回收約2kb的片段,使用DNA連接試劑盒ver.2(寶酒造)進(jìn)行環(huán)化。以其作為模板,使用如下所示的反向PCR引物,通過LA Taq(寶酒造),在94℃進(jìn)行1分鐘熱變性處理后,將94℃30秒、50℃30秒和72℃4分30秒的一系列步驟重復(fù)25個(gè)循環(huán),擴(kuò)增片段。使用TOPO TA克隆試劑盒(Invitrogen)克隆這里被擴(kuò)增的約2kb的片段,并通過引物分析其序列。
反向PCR引物1TGACGCTGATACCAACGGCG SEQ ID NO.18反向PCR引物2CTAGTGGCAGTATTGGACAG SEQ ID NO.193c)使用3’RACE法和5’RACE法確定翻譯區(qū)以cDNA為模板,使用3’RACE法和5’RACE法進(jìn)行翻譯區(qū)的確定。cDNA的制備如下進(jìn)行。
與實(shí)施例1同樣,將在TS培養(yǎng)基中培養(yǎng)的1ml侵菅新赤殼侵菅變種PF1225菌株(FERM BP-7475)的培養(yǎng)液接種于裝有100ml含1%大豆皂草苷的MY培養(yǎng)基的500ml容量三角燒瓶中。將其在25℃下振蕩培養(yǎng)32小時(shí),然后用尼龍篩(50μm)過濾菌體,用液氮將過濾的菌體冷凍。使用研缽和研杵研磨冷凍菌體,由研磨的菌體中提取總RNA。使用ISOGEN(Nippon Gene),按照所附的方案進(jìn)行總RNA的提取。使用Oligotex-dT30<Super>(Roche Diagnostics),按照所附的方案,由總RNA中純化mRNA。
對(duì)于該mRNA,使用5’/3’RACE試劑盒(Roche Diagnostics),按照所附的方案進(jìn)行5’RACE和3’RACE,擴(kuò)增3’和5’區(qū)。此時(shí),在3’RACE方法中,使用AmpriTaq Gold(Applied Biosystem)進(jìn)行第一次PCR,使用PCR supermix high fidelity(Lifetech oriental Co.,Ltd)進(jìn)行第二次PCR。在5’RACE方法中,均使用PCR supermix high fidelity(Lifetechoriental Co.,Ltd)進(jìn)行第一次PCR和第二次PCR。
3’RACE和5’RACE的特異性引物序列如下所示。
用于第一次PCR的3’RACE特異性引物CCCAGGCCTTTAAGGATGGC SEQ ID NO.20用于第二次PCR的3’RACE特異性引物CTAGTGGCAGTATTGGACAG SEQ ID NO.19用于cDNA合成的5’RACE特異性引物TGACGCTGATACCAACGGCG SEQ ID NO.18用于第一次PCR的5’RACE特異性引物CTGCTTGAGGGTAATGGGCTC SEQ ID NO.21用于第二次PCR的5’RACE特異性引物ACAGACGCCGGAGGAGAAGCG SEQ ID NO.22如上所述,確定了SEQ ID NO.1所示SDN基因的翻譯區(qū)。這里,由實(shí)施例2a)的結(jié)果可知從翻譯起始位點(diǎn)的Met數(shù)起,SDN氨基酸序列的成熟蛋白質(zhì)的N末端位于位置27。
通過比較基因組DNA和cDNA的堿基序列來(lái)確定翻譯區(qū)中是否存在內(nèi)含子。證實(shí)該翻譯區(qū)中不存在內(nèi)含子。
實(shí)施例4皂草苷分解酶(SDN)在大腸桿菌中的表達(dá)以實(shí)施例3中得到的cDNA為模板,使用如下所示的用于在大腸桿菌中表達(dá)的引物進(jìn)行PCR。
使用PCR supermix high fidelity(Lifetech oriental Co.,Ltd),在94℃進(jìn)行1分鐘的熱變性處理后,將94℃30秒、50℃30秒和72℃2分鐘的一系列步驟進(jìn)行25個(gè)循環(huán),擴(kuò)增SDN基因的翻譯區(qū)。使用DNA連接試劑盒ver.2(寶酒造)使由限制酶NdeI和BamHI消化上述擴(kuò)增產(chǎn)物的片段和用同樣的限制酶消化的質(zhì)粒pET15b(Novagen)連接。按照常規(guī)方法,用其轉(zhuǎn)化大腸桿菌BL21(DE3)菌株,得到具有氨芐青霉素抗性的菌落。
用于在大腸桿菌中表達(dá)的N末端引物GGGCATATGGCTTCTCCTCCTGCTTCTG SEQ ID NO.23用于在大腸桿菌中表達(dá)的C末端引物GGGGGATCCTTAAGTGCCGCTCTGAGGACTACG SEQ ID NO.24將得到的菌落用于以下的試驗(yàn)。
將由菌落中收集的菌體在裝有50ml含有50μg/ml氨芐青霉素的LB培養(yǎng)基的250ml容量三角燒瓶中、在37℃下振蕩培養(yǎng)過夜,再取其中的2ml接種于裝有50ml含有50μg/ml氨芐青霉素的LB培養(yǎng)基的250ml容量三角燒瓶中,在37℃下振蕩培養(yǎng)3小時(shí)。向其中加入異丙基-β-D-硫代半乳糖吡喃糖苷,使終濃度為0.4mM,再誘導(dǎo)培養(yǎng)3小時(shí)。
通過離心收集獲得的培養(yǎng)菌體,使菌體在緩沖液F(50mM Tris-鹽酸緩沖液、2mM EDTA(pH8.0))中懸浮,然后再次通過離心回收菌體。將該菌體在-80℃冷凍,然后懸浮于5ml緩沖液F中,向其中添加溶菌酶和TritonX100,使終濃度分別為100μg/ml和0.1%,將其在室溫下靜置20分鐘。使用Sonifier 450(BRANSON),在冰冷卻下,以50%的占空度(duty cycle)進(jìn)行30秒的超聲波處理,重復(fù)2次,使細(xì)胞破碎,通過離心除去菌體碎片。
將這樣得到的菌體提取液作為粗酶液,按照試驗(yàn)例1進(jìn)行皂草苷分解活性的測(cè)定。
結(jié)果,在TLC中,從皂草苷分解酶的翻譯區(qū)被克隆的菌體提取液中只觀察到分解產(chǎn)物大豆皂草精醇B的斑點(diǎn)。
實(shí)施例5皂草苷分解酶(SDN)在綠色木霉中的表達(dá)5a)用于轉(zhuǎn)化的載體的構(gòu)建以實(shí)施例3得到的cDNA為模板,使用如下所示的用于在木霉屬中表達(dá)的引物,與實(shí)施例4同樣地進(jìn)行PCR。
使用DNA連接試劑盒ver.2(寶酒造)使由限制酶SmaI和PstI消化所得PCR產(chǎn)物的片段和用StuI和PstI消化的質(zhì)粒pCB1-M2(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例5)連接。將其用XbaI消化、脫磷酸,然后使其與來(lái)自粗糙脈孢菌(Neurospora crassa)pyr4基因的XbaI盒連接,構(gòu)建質(zhì)粒pCB-SBe(圖1)。
用于在木霉屬中表達(dá)的N末端引物GGGCCCGGGGCGCATCATGCACTTCTTTGACAAAGCGAC SEQ ID NO.25用于在木霉屬中表達(dá)的C末端引物GGGCTGCAGTTAAGTGCCGCTCTGAGGACTSEQ ID NO.26Pyr4基因的XbaI盒的構(gòu)建方法如下所示。
首先,用BglII消化pFB6(Biochem.Biophys.Res.Commun.112,284-289,1983),然后用HindIII進(jìn)行部分消化,回收約1.9kb的片段。將其連接到用BglII和HindIII消化的pLITMUS28(New EnglandBiolabs)。接著,將其用BglII消化,然后用DNA鈍化試劑盒(寶酒造)產(chǎn)生平端,與磷酸化接頭pXbaI(寶酒造)連接,構(gòu)建了pyr4基因的XbaI盒。
5b)來(lái)自綠色木霉的尿嘧啶需求型菌株的獲得將2支UV燈在30cm高度照射,一邊將約1.0×109CFU/ml的綠色木霉MC300-1菌株孢子懸浮液緩慢混合,一邊對(duì)該懸浮液照射UV。將其涂于選擇性培養(yǎng)基上,在28℃培養(yǎng)7天,然后篩選生長(zhǎng)菌株。
使用在基本培養(yǎng)基(0.2%磷酸二氫鉀、0.4%硫酸銨、0.03%尿素、0.03%硫酸鎂七水合物、0.03%氯化鈣、0.5%葡萄糖、2.5%瓊脂、0.01%痕量元素(5mg硫酸鐵七水合物、1.56mg硫酸錳七水合物、1.4mg硫酸鋅七水合物、2.0mg氯化鈷溶解于1L水中形成))中添加了10μg/ml尿苷和1.0mg/ml 5-氟乳清酸的培養(yǎng)基作為選擇性培養(yǎng)基。
5c)對(duì)綠色木霉的轉(zhuǎn)化和對(duì)各重組體的皂草苷分解活性的檢測(cè)將實(shí)施例5的5b)中得到的尿嘧啶需求型綠色木霉菌株接種于裝有50ml菌體形成培養(yǎng)基(1.0%酵母提取物、1.0%麥芽汁、2.0%聚胨、2.5%葡萄糖、0.1%磷酸氫二鉀、0.05%硫酸鎂七水合物(滅菌前pH 7.0))的200ml容量三角燒瓶中,在28℃下振蕩培養(yǎng)2天。通過離心從得到的培養(yǎng)液中回收菌絲體。接著由該菌絲體制備原生質(zhì)體,然后加入質(zhì)粒pCB-SBe的DNA溶液,進(jìn)行轉(zhuǎn)化(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例7)。
轉(zhuǎn)化體再生時(shí),使用在基本培養(yǎng)基中添加了0.5M蔗糖的培養(yǎng)基。再將生長(zhǎng)的菌落移種于基本培養(yǎng)基上,將在此生長(zhǎng)的菌落作為轉(zhuǎn)化體。
將質(zhì)粒pCB-SBe導(dǎo)入尿嘧啶需求型綠色木霉菌株,結(jié)果每1μgpCB-SBe獲得了3個(gè)轉(zhuǎn)化體。培養(yǎng)25株該轉(zhuǎn)化體(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例1),將培養(yǎng)上清進(jìn)行SDS-PAGE,只在轉(zhuǎn)化體中觀察到了顯示分子量約為68kDa的條帶。
使用該培養(yǎng)上清按照實(shí)施例1測(cè)定皂草苷的分解活性時(shí),在TLC中觀察到了分解產(chǎn)物大豆皂草精醇B的斑點(diǎn)。而在親本菌株-尿嘧啶需求型綠色木霉菌株中未觀察到該斑點(diǎn)。
5d)重組皂草苷分解酶(重組型SDN)的純化、以及與來(lái)自侵菅新赤殼侵菅變種PF1225菌株的皂草苷分解酶(野生型SDN)的活性比較將實(shí)施例5的5c)中得到的約700ml培養(yǎng)液離心(8,000rpm、30分鐘),除去菌體碎片。向約560ml該培養(yǎng)上清中加入64g硫酸銨,離心(8,000rpm、30分鐘)除去沉淀。再向約600ml該上清中加入74g硫酸銨,離心回收沉淀。向得到的沉淀中加入100ml 0.05M Tris-鹽酸緩沖液(pH7.5)和16g硫酸銨,進(jìn)行Butyl Toyopearl 650S(26mm i.d.×330mm)(Tosoh Co.)的疏水層析。用從緩沖液C到50mM Tris-鹽酸緩沖液(pH7.5)的濃度梯度進(jìn)行洗脫,回收未吸附流分和由1M至0.6M濃度硫酸銨洗脫的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)濃縮所得流分。然后向約8ml該濃縮液中加入1.3g硫酸銨和2ml 0.5M磷酸鈉緩沖液(pH5.8),進(jìn)行6ml Resource PHE(Amersham Biosciences)的疏水層析。用從緩沖液B到0.1M磷酸鈉緩沖液(pH5.8)的濃度梯度進(jìn)行洗脫,回收未吸附流分。
用Millipore公司制造的Ultrafree 15(截留分子量5,000)濃縮所得流分,將該濃縮液進(jìn)行Superdex 200pg(16mm i.d.×600mm)(AmershamBiosciences)的凝膠過濾層析。用緩沖液G(50mM磷酸鈉緩沖液、0.15M氯化鈉(pH7.0))進(jìn)行洗脫,回收截留分子量約為68,000的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果在分子量約68kDa處觀察到單一條帶。
如上所示,按照試驗(yàn)例2,對(duì)純化的重組皂草苷分解酶(以下稱為“重組型SDN”)和實(shí)施例1中純化得到的皂草苷分解酶(以下稱為“野生型SDN”)測(cè)定其最適pH和最適溫度。
最適pH的測(cè)定中,首先向50μl 2%皂草苷溶液中加入20μl 0.5M各緩沖液(乙酸鈉(pH4.5、pH5.0、pH5.8)、磷酸鈉(pH5.0、pH5.8、pH7.0)、Tris-鹽酸(pH7.0、pH8.0、pH9.0))和稀釋的酶液,配制100μl的溶液。將其在37℃反應(yīng)30分鐘,然后定量生成的大豆皂草精醇B的量。
結(jié)果如圖2所示。
最適溫度的測(cè)定中,首先向50μl 2%皂草苷溶液中加入20μl 0.5M磷酸鈉緩沖液(pH 5.8)和稀釋的酶液,配制100μl的溶液。將其在規(guī)定的各溫度下反應(yīng)30分鐘,然后定量純化的大豆皂草精醇B的量。
結(jié)果如圖3所示。
由這些結(jié)果可知通過SDS-PAGE確認(rèn)了分子量的差異,但在活性上未見有大的差異。
實(shí)施例6來(lái)自曲霉屬種名待定PF1224菌株的皂草苷分解酶(SDA)的氨基酸序列分析與實(shí)施例2的2b)同樣,切下從曲霉屬種名待定PF1224菌株(保藏號(hào)FERM BP-8004)中純化的皂草苷分解酶(SDA)(參考例1)的約90kDa的條帶,進(jìn)行片段化。將其與實(shí)施例2的2b)同樣地進(jìn)行HPLC,分離如下所示的4種肽。
Trp23.67LYNPDSPQPISAK SEQ ID NO.27Trp24.0LQFNPAPKSEQ ID NO.28Trp38.05VDWFSDLTSTGQVTGSK SEQ ID NO.29Trp24.5GEVSGSASVSIIHD SEQ ID NO.30實(shí)施例7SDA基因的克隆和序列分析7a)使用PCR制備長(zhǎng)鏈探針與實(shí)施例3同樣,從如參考例1中培養(yǎng)的菌體中分離基因組DNA。
根據(jù)實(shí)施例6中得到的肽序列,合成編碼該肽序列的如下所示的寡核苷酸,作為PCR引物。
引物23.67s1TAYAAYCCIGAYTCNCC SEQ ID NO.31引物23.67s2TAYAAYCCNGAYAGYCC SEQ ID NO.32引物24.0sCARTTYAAYCCIGCNCC SEQ ID NO.33引物24.0aGGIGCNGGRTTRAAYTG SEQ ID NO.34引物38.05a1AARTCNGARAACCARTC SEQ ID NO.35引物38.05a2AARTCRCTRAACCARTC SEQ ID NO.36與實(shí)施例3的3a)的方法同樣地進(jìn)行PCR。
結(jié)果,在上述引物中,引物24.0s和引物38.05a1的組合中,特異性地?cái)U(kuò)增了約1kb的片段,使用TOPO TA克隆試劑盒(Invitrogen)將其克隆進(jìn)入pCR2.1-TOPO中(pSDAPCR1)。
序列分析的結(jié)果表明克隆進(jìn)入pSDAPCR1中的片段是SEQ IDNO.3所示序列中位置709到位置1748的區(qū)被擴(kuò)增的片段。
7b)使用DNA印跡分析和大腸桿菌菌落文庫(kù)進(jìn)行篩選DNA印跡分析中,將BamHI、EcoRI、HindIII消化的基因組DNA在瓊脂糖凝膠中進(jìn)行電泳,將其轉(zhuǎn)印到Hibond N+(AmershamBiosciences)。使用ECF隨機(jī)引物標(biāo)記和檢測(cè)系統(tǒng)(Amersham Biosciences)進(jìn)行雜交,使用分子成象儀FX(Biorad)檢測(cè)條帶。
使用上述7a)得到的PCR產(chǎn)物作為探針時(shí),檢測(cè)到約10kb的BamHI、約20kb的EcoRI、約5kb的HindIII片段的條帶。
接著,用HindIII消化基因組DNA,回收約4kb-6kb的片段。將其連接到HindIII消化和脫磷酸處理的pUC18,使其轉(zhuǎn)化大腸桿菌DH5α菌株。使該大腸桿菌在添加了氨芐青霉素的LB瓊脂培養(yǎng)基中形成菌落,將得到的約1,000個(gè)菌落轉(zhuǎn)印到Hibond N+(AmershamBiosciences)。這里,以上述7a)得到的PCR產(chǎn)物作為探針,用DIG Hi-prim DNA標(biāo)記和檢測(cè)試劑盒(Roche Diagnostics),獲得了1種陽(yáng)性克隆(pSDAHind5/18)。該克隆含有約5kb的HindIII片段。
7c)使用3’RACE法和5’RACE法確定翻譯區(qū)與實(shí)施例3的3c)同樣,從參考例1中制備的曲霉屬種名待定PF1224菌株(保藏號(hào)FERM BP-8004)的培養(yǎng)菌體中提取總RNA,再使用mRNA快速預(yù)純化試劑盒(QuickPrep mRNA Purification kit)(AmershamBiosciences),按照所附方案分離mRNA。
對(duì)于該mRNA,使用5’/3’RACE試劑盒(Roche Diagnostics),進(jìn)行3’和5’區(qū)的擴(kuò)增。另外,使用LA Taq(寶酒造)進(jìn)行各個(gè)PCR。
3’RACE法和5’RACE特異性引物的序列如下所示。
用于第一次PCR的3’RACE特異性引物CCTCGATACCCGAGGGACCG SEQ ID NO.37用于第二次PCR的3’RACE特異性引物GATGGGTTGCATGTTATCGC SEQ ID NO.38用于cDNA合成的5’RACE特異性引物GCGATAACATGCAACCCATC SEQ ID NO.39用于第一次PCR的5’RACE特異性引物GACCACCTGGTTCAGTGGTG SEQ ID NO.40用于第二次PCR的5’RACE特異性引物GGGTTATAGAGTCTGGTAACG SEQ ID NO.41如上所述,確定了SEQ ID NO.3所示的SDA基因的翻譯區(qū)。這里,與實(shí)施例2a)同樣,對(duì)如參考例1純化的SDA蛋白質(zhì)分析其成熟N末端的氨基酸序列,結(jié)果表明從翻譯起始位點(diǎn)的Met數(shù)起,SDA氨基酸序列的成熟蛋白質(zhì)的N末端位于位置29。
通過比較基因組DNA和cDNA的堿基序列來(lái)確定翻譯區(qū)中是否存在內(nèi)含子。證實(shí)該翻譯區(qū)中不含有內(nèi)含子。
實(shí)施例8來(lái)自曲霉屬種名待定PF1224菌株的皂草苷分解酶(SDA)在綠色木霉中的表達(dá)8a)用于轉(zhuǎn)化的載體的構(gòu)建首先,以實(shí)施例7b中得到的pSDAHind5/18為模板,使用如下所示的在木霉屬中表達(dá)的引物,與實(shí)施例4同樣地進(jìn)行PCR。
用DNA連接試劑盒ver.2(寶酒造)使由限制酶StuI和XhoI消化所得PCR產(chǎn)物的片段和預(yù)先用StuI和XhoI消化的質(zhì)粒pCB1-M2(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例5)連接,構(gòu)建pCB-SDAe(圖4)。
用于在木霉屬中表達(dá)SDA的N末端引物GGGAGGCCTGCGCATCATGCATGTTGTCGCAAGTACCACSEQ ID NO.42用于在木霉屬中表達(dá)SDA的C末端引物GGGCTCGAGTACCTCAAGTCCCATTTGCCGGCTGCSEQ ID NO.438b)綠色木霉的轉(zhuǎn)化和各重組體的皂草苷分解活性的檢測(cè)以實(shí)施例5的5b)中得到的尿嘧啶需求型綠色木霉為宿主,與實(shí)施例5的5c)同樣,用共轉(zhuǎn)化的方法使pCB-SDAe和pyr4盒連接到pLITMUS28構(gòu)建的載體pPYR4(參照實(shí)施例5的5a))轉(zhuǎn)化。結(jié)果每1μgDNA獲得了約12株的轉(zhuǎn)化體。
培養(yǎng)上述獲得的轉(zhuǎn)化體(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例1)后,將其培養(yǎng)上清進(jìn)行SDS-PAGE,只在轉(zhuǎn)化體中觀察到顯示分子量約80kDa的條帶。
使用該培養(yǎng)上清,按照實(shí)施例1測(cè)定其皂草苷的分解活性時(shí),在TLC中觀察到分解產(chǎn)物大豆皂草精醇B的斑點(diǎn)。
8c)來(lái)自重組曲霉屬種名待定PF1224菌株的皂草苷分解酶(重組型SDA)的純化、以及與來(lái)自野生型曲霉屬種名待定PF1224菌株的皂草苷分解酶(野生型SDA)的活性比較將約600ml上述8b)所得培養(yǎng)液離心(8,000rpm、30分鐘)除去其菌體碎片。向得到的約500ml上清中加入57g硫酸銨,離心除去不溶解的殘?jiān)T傧蛟撋锨逯幸来渭尤?4g(40%飽和級(jí)分)和70g(60%飽和級(jí)分)硫酸銨,將得到的沉淀溶解于0.1M磷酸鈉緩沖液(pH5.8)中。向其中得到的60%飽和級(jí)分中加入硫酸銨,使?jié)舛葹?M,進(jìn)行ButylToyopearl 650S(26mm i.d.×250mm)(Tosoh Co.)的疏水層析。用從緩沖液A到0.1M磷酸鈉緩沖液(pH5.8)的濃度梯度進(jìn)行洗脫,回收從0.9M到0.2M濃度硫酸銨洗脫的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)和Ultrafree15(截留分子量10,000)濃縮所得流分,用PD-10柱(AmershamBiosciences)脫鹽,進(jìn)行6ml Resource Q(Amersham Biosciences)的離子交換層析。用50mM Tris-鹽酸緩沖液(pH7.5)到50mM Tris-鹽酸緩沖液、0.5M氯化鈉(pH7.5)的濃度梯度進(jìn)行洗脫,回收未吸附流分和由0.08M鹽濃度洗脫的流分。
用Ultrafree15(截留分子量10,000)(Millipore)濃縮所得流分,進(jìn)行Superdex 200 pg(16mm i.d.×600mm)(Amersham Biosciences)的凝膠過濾層析。用緩沖液G進(jìn)行洗脫,回收截留分子量約50kDa的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果在分子量約80kDa處觀察到單一條帶。另外,凝膠過濾的截留分子量與SDS-PAGE的分子量不同,這是由于該蛋白質(zhì)與載體非特異性吸附的緣故。
按照試驗(yàn)例2的方法,對(duì)于如上純化的重組型SDA和參考例1中純化的皂草苷分解酶(野生型SDA)測(cè)定其最適pH和最適溫度。
最適pH和最適溫度的測(cè)定與實(shí)施例5的5d)同樣進(jìn)行。
結(jié)果分別如圖5和圖6所示。
結(jié)果表明重組型SDA在pH7的磷酸鈉緩沖液中的比活性比野生型SDA低,但在Tris-鹽酸緩沖液中的比活性有提高。
實(shí)施例9來(lái)自Eupenicillium brefeldianum PF1226的皂草苷分解酶(SDE)的分離純化將約1cm2Eupenicillium brefeldianum PF1226(保藏號(hào)FERM BP-7476)的PDA斜面培養(yǎng)物接種于裝有100ml TS培養(yǎng)基的500ml容量三角燒瓶中,在25℃振蕩培養(yǎng)3天。將4ml上述培養(yǎng)物接種于裝有100mlMY培養(yǎng)基和1.0%大豆皂草苷(小城制藥)的500ml容量三角燒瓶中,振蕩培養(yǎng)7天。
將約1,000ml該培養(yǎng)液用玻璃濾器(G3)過濾,除去菌體碎片。向約640ml該培養(yǎng)上清中加入73g硫酸銨,離心(8,000rpm、30分鐘)除去生成的沉淀。再向約670ml該上清中加入256g硫酸銨,離心回收生成的沉淀。使該沉淀溶解于約50ml 0.1M乙酸鈉緩沖液(pH5.8),加入13.2g硫酸銨,加入水,使最終濃度為1M硫酸銨、0.1M磷酸鈉緩沖液。
離心分離該溶液后,進(jìn)行Butyl Toyopearl 650S(26mm i.d.×330mm)(Tosoh Co.)的疏水層析。用從緩沖液C到50mM Tris-鹽酸緩沖液的濃度梯度進(jìn)行洗脫,回收由0.7M至0.5M濃度硫酸銨洗脫的流分。
用Pellicon XL(截留分子量10,000)(Millipore)濃縮所得流分,然后加入磷酸鈉緩沖液和硫酸銨,使其構(gòu)成緩沖液A的組成,進(jìn)行6mlResource PHE(Amersham Biosciences)的疏水層析。用從緩沖液A到0.1M磷酸鈉緩沖液(pH5.8)的濃度梯度進(jìn)行洗脫,回收從1M到0.3M濃度硫酸銨洗脫的流分。
用Ultrafree15(截留分子量10,000)(Millipore)濃縮所得流分,用PD-10柱(Amersham Biosciences)脫鹽后,進(jìn)行6ml Resource Q(Amersham Biosciences)的離子交換層析。用20mM磷酸鈉緩沖液(pH7.0)到20mM磷酸鈉緩沖液、1M氯化鈉(pH7.0)的濃度梯度進(jìn)行洗脫,回收未吸附流分。
用Ultrafree15(截留分子量10,000)(Millipore)濃縮該流分,進(jìn)行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝膠過濾層析。用緩沖液G進(jìn)行洗脫,回收截留分子量約90kDa的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果在分子量約90kDa處觀察到單一條帶。
實(shí)施例10SDE的氨基酸序列分析10a)N末端側(cè)氨基酸序列與實(shí)施例2的2a)同樣,對(duì)實(shí)施例9中制備的流分進(jìn)行N末端側(cè)的氨基酸序列分析。結(jié)果得到所示的氨基酸序列。
N末端氨基酸序列STTPAPPQPEPI(SEQ ID NO.44)10b)肽作圖與實(shí)施例2的2b)同樣,切下實(shí)施例9中純化的SDE的約90kDa的條帶,進(jìn)行片段化。與實(shí)施例2的2b)同樣地,將其進(jìn)行HPLC,分離到如下所示的3種肽。
Trp20.73ADPAFSPDGTR SEQ ID NO.45Trp34.21LHPDDTHMGWSSFSEQ ID NO.46Trp36.26GFSGAGDEILYIGSTR SEQ ID NO.47實(shí)施例11SDE基因的克隆和序列分析11a)使用PCR制備長(zhǎng)鏈探針與實(shí)施例3同樣,從實(shí)施例9培養(yǎng)的菌體中分離基因組DNA。
根據(jù)實(shí)施例10中獲得的肽的序列,合成編碼這些肽序列的如下所示的寡核苷酸,作為PCR引物。
引物NsCCICARCCNGARCCNATSEQ ID NO.48引物20.37aCTRAAIGCNGGRTCNGCSEQ ID NO.49引物34.21aCCANCCCATRTGNGTRTC SEQ ID NO.50
與實(shí)施例3的3a)同樣地進(jìn)行PCR。
結(jié)果,在上述引物中,引物Ns和引物20.73a的組合中,特異性地?cái)U(kuò)增了約1kb的片段,使用TOPO TA克隆試劑盒(Invitrogen)將其克隆到pCR2.1-TOPO中(pSDEPCR5)。
序列分析的結(jié)果表明克隆到pSDEPCR5中的片段是SEQ ID NO.5所示序列中位置70到位置1247的區(qū)被擴(kuò)增的片段。
11b)使用DNA印跡分析和噬菌體文庫(kù)進(jìn)行篩選DNA印跡分析中,對(duì)PstI、SphI、XhoI消化的基因組DNA在瓊脂糖凝膠中進(jìn)行電泳,轉(zhuǎn)印到Hibond N+(Amersham Biosciences)。使用ECF隨機(jī)引物標(biāo)記和檢測(cè)系統(tǒng)(Amersham Biosciences)進(jìn)行雜交,使用分子成象儀FX(Biorad)檢測(cè)條帶。
使用上述11a)中得到的PCR產(chǎn)物作為探針,檢測(cè)出約3kbPstI、約4kbSphI、約6kbXhoI片段的條帶。
接著,用Sau3A1部分消化基因組DNA。使其與λEMBL3/BamHI載體(Stratagene)連接,使用MaxPlax包裝提取試劑盒(EPICENTRETECHNOLOGIES)進(jìn)行包裝。將約5×104PFU的該噬菌體文庫(kù)轉(zhuǎn)印到Hibond N+(Amersham Biosciences),以克隆進(jìn)入pSDEPCR5中的PCR片段作為探針,通過DIG Hi-prime DNA標(biāo)記和檢測(cè)試劑盒(RocheDiagnostics)獲得了5種陽(yáng)性克隆。從其中含有6kb XhoI片段的噬菌體DNA中回收該XhoI片段,克隆進(jìn)入pBluescriptII KS+(pSDEXho/IIKS+1)。
以pSDEXho/IIKS+1為模板,通過轉(zhuǎn)座子法確定SDE翻譯區(qū)的DNA序列如SEQ ID NO.5所示。
這里,實(shí)施例10a)的結(jié)果表明從翻譯起始位點(diǎn)的Met數(shù)起,SDE氨基酸序列的成熟蛋白質(zhì)的N末端位于位置18。
通過比較基因組和cDNA的DNA序列來(lái)確認(rèn)翻譯區(qū)中是否存在內(nèi)含子。證實(shí)該翻譯區(qū)中不存在內(nèi)含子。
實(shí)施例12來(lái)自Eupenicillium brefeldianum PF1226的皂草苷分解酶(SDE)在綠色木霉中的表達(dá)12a)用于轉(zhuǎn)化的載體構(gòu)建以實(shí)施例11中獲得的pSDEXho/IIKS+1為模板,使用如下所示的用于木霉屬分泌的引物,與實(shí)施例4同樣地進(jìn)行PCR。
用DNA連接試劑盒ver.2(寶酒造)使由限制酶SmaI和XhoI消化所得PCR產(chǎn)物得到的片段和預(yù)先由SmaI和XhoI消化的質(zhì)粒pCB1-M2(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例5)連接,構(gòu)建pCB-SDEs(圖7)。
用于在木霉屬中分泌SDE的N末端引物GGGCCCGGGCTCAGACTACCCCGGCACCTCCTCAGCC SEQ ID NO.51用于在木霉屬中分泌SDE的C末端引物GGGCTCGAGTACCTCATGCACCATTGAGCGGCTGGTGG SEQ ID NO.5212b)綠色木霉的轉(zhuǎn)化和各重組體的皂草苷分解活性的檢測(cè)以實(shí)施例5的5b)中得到的尿嘧啶需求型綠色木霉為宿主,與實(shí)施例5的5c)同樣,用共轉(zhuǎn)化的方法使pCB-SDEs和pyr4盒連接到pLITMUS28構(gòu)建的載體pPYR4(參照上述5a))進(jìn)行轉(zhuǎn)化。結(jié)果每1μg的DNA獲得了約28株的轉(zhuǎn)化體。
培養(yǎng)上述獲得的轉(zhuǎn)化體(參照國(guó)際公開第WO98/11239號(hào)的實(shí)施例1)后,將該培養(yǎng)上清進(jìn)行SDS-PAGE,只在轉(zhuǎn)化體中觀察到顯示分子量約67kDa的條帶。
按照試驗(yàn)例1,使用該培養(yǎng)上清測(cè)定皂草苷的分解活性時(shí),在TLC中觀察到分解產(chǎn)物大豆皂草精醇B的斑點(diǎn)。
12c)來(lái)自重組Eupenicillium brefeldianum PF1226的皂草苷分解酶(重組型SDE)的純化、以及與來(lái)自野生型Eupenicillium brefeldianumPF1226的皂草苷分解酶(野生型SDE)的活性比較將約900ml實(shí)施例12的12b)所得培養(yǎng)液離心(8,000rpm、30分鐘)除去菌體碎片。向得到的約690ml上清中加入78.7g硫酸銨,離心除去不溶解的殘?jiān)?。再向該上清中加?8.6g(40%飽和級(jí)分)硫酸銨,將得到的沉淀溶解于120ml 1M硫酸銨、0.1M磷酸鈉緩沖液(pH5.8)中。取其中的20ml進(jìn)行Butyl Toyopearl 650S(26mm i.d.×330mm)(TosohCo.)的疏水層析。用從緩沖液A到0.1M磷酸鈉緩沖液的濃度梯度進(jìn)行洗脫,回收從0.2M到0M硫酸銨濃度洗脫的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)和Ultrafree15(截留分子量5,000)濃縮該流分,用PD-10柱(Amersham Biosciences)脫鹽,進(jìn)行6ml Resource Q(Amersham Biosciences)的離子交換層析。用50mM Tris-鹽酸緩沖液(pH7.5)到50mM Tris-鹽酸緩沖液、0.5M氯化鈉(pH7.5)的濃度梯度進(jìn)行洗脫,回收由0M到0.1M鹽濃度洗脫的流分。
用Ultrafree15(截留分子量5,000)(Millipore)濃縮該流分,進(jìn)行Superdex 200 pg(16mm i.d.×600mm)(Amersham Biosciences)的凝膠過濾層析。用緩沖液G進(jìn)行洗脫,回收截留分子量約50kDa的流分。
對(duì)該流分進(jìn)行SDS-PAGE,結(jié)果在分子量約67kDa處觀察到單一條帶。另外,凝膠過濾的截留分子量與SDS-PAGE的分子量不同,這是由于該蛋白質(zhì)與載體非特異性吸附的緣故。
按照試驗(yàn)例2的方法,對(duì)于如上純化的重組型SDE和實(shí)施例9中純化的皂草苷分解酶(野生型SDE)測(cè)定其最適pH和最適溫度。
最適pH和最適溫度的測(cè)定與實(shí)施例5的5d)同樣進(jìn)行。
結(jié)果分別如圖8和圖9所示。
結(jié)果表明重組型SDE在Tris-鹽酸緩沖液中的活性比野生型SDE高,在高pH下的活性也得到提高。
序列表<110>明治制果株式會(huì)社(MEIJI SEIKA KAISHA,LTD.)<120>皂草苷分解酶及其基因以及大豆皂草精醇B的大量生產(chǎn)系統(tǒng)<130>M0713-PCT,M0713-AR,TW(136515px)<140>
<141>
<150>JP 2001/171604<151>2001-6-6<160>54<170>PatentIn Ver.2.1<210>1<211>1917<212>DNA<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<220>
<221>CDS<222>(1)..(1914)<220>
<221>mat_peptide<222>(79)..(1914)<300>
<400>1atg cac ttc ttt gac aaa gcg act gtc tac gct ata ctc tgc ggt agc48Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser-25 -20 -15
gtg gcc cag act gtt cac gct gca ccc tcc gct tct cct cct gct tct 96Val Ala Gln Thr Val His Ala Ala Pro Ser Ala Ser Pro Pro Ala Ser-10 -5 -1 1 5gtt cca aac cct cct tct cct gag ccc att acc ctc aag cag cta cct 144Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro10 15 20ctt cct ccc atc tcc cct agc gac gac gtc ggt gct tgc acg aag cag 192Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln25 30 35atc aac tct cgt gga acg gga tgt ctc gcc aac ggc gtt ttt gaa acg 240Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr40 45 50ttt cag tct ggt gac ttt tta cct gat gga aag cat gtc atc gcc atg 288Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met55 60 65 70gtc aac ttt act ggt gcg cct gct gct ccg gct gcg gga agc atc tac 336Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr75 80 85tct ggc ccg cag gtc atc atc gtc aag acg gat ggc aag aca ttt cct 384Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro90 95 100aac gga gac ccc tgg aag tgc atc acc tgt ggt gtc cct gag aag aac 432Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn105 110 115gcc gtt ggt atc agc gtc aag tat gac tac ccc cag gcc ttt aag gat 480Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp120 125 130
ggc aaa cgt ctt ctc atc gga cac aat att ctc gac tgc ggc acc aac 528Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn135 140 145 150cag ttg acg agc gag agc tgc aag cca gat aac acc cac atc tac cct 576Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro155 160 165atc cgc tgg aat gtt gct gcc gac ggt tcc ggc ccg agc ggt gaa atc 624Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile170 175 180cgt gag ctg cgg tta cac ccg gac aat gtc cat ctc gag ttt agc tct 672Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser185 190 195ttc acc ttt gct agt ggc agt att gga cag tat gcc tac ttt tct cgg 720Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg200 205 210ctc gtt ttc aat cct tcg ccc aag act gga act ccc ctt gcg ccg cgg 768Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg215 220 225 230tat gac ctg gaa aag gtt act att ctg cac aac ccc gag ggc gtt gcc 816Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala235 240 245cct atc acg gcc aag ggt aag gtt ctg tct ctg aac ccc cag gct att 864Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile250 255 260tcg gtt ggc gag gct cgt ggc ttc aac ggc gac gga act gag ctc act 912Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr265 270 275tat gtc gga agc aat att gag agc tgt aat aat gat gtc ttt gcc gtt 960
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val280 285 290cat ctt caa act gga gtt gtt cga cgt ctt acc aac cat ccc gag tat 1008His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr295 300 305 310cct gac cct ctg gct ttc tcg cct gat aac aaa tgg atg gct gtc atg 1056Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met315 320 325gat acc cgc gga agt ggt cgc aac atg ttt att gcc ggc atg cga gga 1104Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly330 335 340atc ccg ccc ctg gtt gat att gtt ggc ggt att ctg cca gcg tcg tct 1152Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser345 350 355cgc aac aac ggt ctt cgt cgc ttc ttc cag ccg tac ctg ctt gat ttt 1200Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe360 365 370tat ggt gac cgc ggt gac tac tac ggc caa aag atc aac gga gat aac 1248Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Ile Asn Gly Asp Asn375 380 385 390aat ggc gtg cct ggg agt ggt gcc atc aac gat cct gag tgg aac ggt 1296Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly395 400 405atg gct gat ccg aga tgg tct cct gac agc agg cag ctc gtc ttt tgg 1344Met Ala Asp Pro Arg Trp Ser Pro Asp Ser Arg Gln Leu Val Phe Trp410 415 420cag act cat acc gtc tcc cct tct tgt ggc ggc gcc aac cct ctc cct 1392Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro
425 430 435tgc tac cct tcg aaa gag caa ggt ggc cgt aac tat cgc atg tac atc 1440Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile440 445 450gcg acc ttt act agc cgc agc cca agc cct cct gcc ccg gtg aag gag 1488Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu455 460 465 470cac tcc gat acc atc ccc tgg ggc gtc ccg tac gtt ccc gga tct cag 1536His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln475 480 485gtt act cca aag cct ggc ttg gcg ggc ggt atc tac acg ctc tac ggc 1584Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly490 495 500aag gct tcg ggc gag gcc aag gtc aac atc acc tgg ggt gag gca ccc 1632Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro505 510 515gag att gga acc gtc agc gtc gtg tac aag gac tat tcg ctc gac ggc 1680Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly520 525 530aag agc ttc ctc aac ggg aac gag agc gtc acg ggg tct gtc gag aga 1728Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg535 540 545 550ctg act gac tat tct ttt gac tgg tat tcg gat att cgc cag acg gga 1776Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly555 560 565gct gtc aag gga acc aag aag acg agc cct ggt gga ttc cat gct aat 1824Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn570 575 580
att gat gtc atg atc aac gac ctg act tca act ggt act ctt acc acg1872Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr585 590 595act ctg gat ggt gtt gag tgg cgt agt cct cag agc ggc act taa1917Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr600 605 610<210>2<211>638<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>2Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser-25 -20 -15Val Ala Gln Thr Val His Ala Ala Pro Ser Ala Ser Pro Pro Ala Ser-10 -5 -1 1 5Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro10 15 20Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln25 30 35Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr40 45 50Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met55 60 65 70Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr75 80 85
Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro90 95 100Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn105 110 115Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp120 125 130Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn135 140 145 150Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro155 160 165Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile170 175 180Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser185 190 195Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg200 205 210Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg215 220 225 230Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala235 240 245Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile250 255 260Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr265 270 275
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val280 285 290His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr295 300 305 310Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met315 320 325Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly330 335 340Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser345 350 355Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe360 365 370Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Ile Asn Gly Asp Asn375 380 385 390Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly395 400 405Met Ala Asp Pro Arg Trp Ser Pro Asp Ser Arg Gln Leu Val Phe Trp410 415 420Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro425 430 435Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile440 445 450Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu455 460 465 470His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln
475 480 485Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly490 495 500Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro505 510 515Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly520 525 530Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg535 540 545 550Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly555 560 565Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn570 575 580Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr585 590 595Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr600 605 610<210>3<211>1902<212>DNA<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<220>
<221>CDS<222>(1)..(1899)
<220>
<221>mat_peptide<222>(85)..(1899)<400>3atg cat gtt gtc gca agt acc act gct ttt ctg ggc gtc gtt tct act 48Met His Val Val Ala Ser Thr Thr Ala Phe Leu Gly Val Val Ser Thr-25 -20 -15gtt gct ggg gta cac cat gtc aac aga gac acc agt caa cag atc cta 96Val Ala Gly Val His His Val Asn Arg Asp Thr Ser Gln Gln Ile Leu-10 -5 -1 1aaa cca cct gta cca gag cct att gtc gtc acc gag ctt ccc ttg cct 144Lys Pro Pro Val Pro Glu Pro Ile Val Val Thr Glu Leu Pro Leu Pro5 10 15 20cct gtc gcc gac agt aag gag ggc tct tgt act ccc gaa gtt agc cct 192Pro Val Ala Asp Ser Lys Glu Gly Ser Cys Thr Pro Glu Val Ser Pro25 30 35cac agg acc ggt tgt cta ctc aaa tcc tcc cag att cag agt gga aat 240His Arg Thr Gly Cys Leu Leu Lys Ser Ser Gln Ile Gln Ser Gly Asn40 45 50ttc ctt cct gac aac aat cat gtc ctt gtc agc tta aac ttc tca ggg 288Phe Leu Pro Asp Asn Asn His Val Leu Val Ser Leu Asn Phe Ser Gly55 60 65gct cca gca gct cca gat ccg gct agc att tat aat ggt acc cat ttg 336Ala Pro Ala Ala Pro Asp Pro Ala Ser Ile Tyr Asn Gly Thr His Leu70 75 80act ctg ata aag gct gat ggg acc aac ttt cct agt ggt gac cca tgg 384Thr Leu Ile Lys Ala Asp Gly Thr Asn Phe Pro Ser Gly Asp Pro Trp85 90 95 100
aag tgt att acc tgc ggc gtg ccg gaa gaa aac aag gtc ggc agc aca 432Lys Cys Ile Thr Cys Gly Val Pro Glu Glu Asn Lys Val Gly Ser Thr105 110 115gaa ctt tcg cca tat cct cag gcg ttt ttg gat ggc aag agg gcc tta 480Glu Leu Ser Pro Tyr Pro Gln Ala Phe Leu Asp Gly Lys Arg Ala Leu120 125 130att ggg acc aac atc gtt gat tgt ggc tcg gcg ctg ctt tca agt tca 528Ile Gly Thr Asn Ile Val Asp Cys Gly Ser Ala Leu Leu Ser Ser Ser135 140 145gac tgt aca ccg gat aaa gtg cat atc tac cca atc cgc tgg aat gtc 576Asp Cys Thr Pro Asp Lys Val His Ile Tyr Pro Ile Arg Trp Asn Val150 155 160aag gca gat ggc tca ggt tcc gga ggg aat ata cga gaa ttg cgc cta 624Lys Ala Asp Gly Ser Gly Ser Gly Gly Asn Ile Arg Glu Leu Arg Leu165 170 175 180cat ccg gac aat gtg cac tta ggg ttc aac tcc ttc acg ttc tct aat 672His Pro Asp Asn Val His Leu Gly Phe Asn Ser Phe Thr Phe Ser Asn185 190 195ggt caa cta gga cag ttt ggc tac ttt agt cga ctg cag ttt aac cca 720Gly Gln Leu Gly Gln Phe Gly Tyr Phe Ser Arg Leu Gln Phe Asn Pro200 205 210gcc ccg aag act ggc gaa cct cgc tca gcc cga tat gat ctg gtt aac 768Ala Pro Lys Thr Gly Glu Pro Arg Ser Ala Arg Tyr Asp Leu Val Asn215 220 225gtt acc aga ctc tat aac ccg gac agc cca cag cct atc agc gca aaa 816Val Thr Arg Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys230 235 240ggc aac gag tta ttg ttt aac cga tcg gct att gcc gtc ggt gag ctt 864
Gly Asn Glu Leu Leu Phe Asn Arg Ser Ala Ile Ala Val Gly Glu Leu245 250 255 260cga gga ttt acc gga cgt ggc aaa gaa gtc aca tat atc ggc aac cct 912Arg Gly Phe Thr Gly Arg Gly Lys Glu Val Thr Tyr Ile Gly Asn Pro265 270 275gtc gag tca tgc aac atc gac gta ttc gct gcc gac ctg aca acc gga 960Val Glu Ser Cys Asn Ile Asp Val Phe Ala Ala Asp Leu Thr Thr Gly280 285 290aag gtc cgt cgg att aca gat cac ccc gag tat gtc gat ccg atg gat 1008Lys Val Arg Arg Ile Thr Asp His Pro Glu Tyr Val Asp Pro Met Asp295 300 305gtc tct ccc gac gac aag tgg caa gtt atc ctc gat acc cga ggg acc 1056Val Ser Pro Asp Asp Lys Trp Gln Val Ile Leu Asp Thr Arg Gly Thr310 315 320ggt cga cag atg ttc atg gcc ggc atg cgc ggt att cca ccg atc atc 1104Gly Arg Gln Met Phe Met Ala Gly Met Arg Gly Ile Pro Pro Ile Ile325 330 335 340gac ctg ata gct act acg gtc gca tcc tct act cgc aac aac ggc cct 1152Asp Leu Ile Ala Thr Thr Val Ala Ser Ser Thr Arg Asn Asn Gly Pro345 350 355cgg cga ttt ttc cga cct tgg ctc ctg gac cac gat ggg gac cgt gga 1200Arg Arg Phe Phe Arg Pro Trp Leu Leu Asp His Asp Gly Asp Arg Gly360 365 370gac tac tat ggc cag caa atc aac ggg gac ggt gac ggc agc ccg gga 1248Asp Tyr Tyr Gly Gln Gln Ile Asn Gly Asp Gly Asp Gly Ser Pro Gly375 380 385agc atc aac gac cct aac tgg aac gcc ggg gca gat cca aag tgg tcc 1296Ser Ile Asn Asp Pro Asn Trp Asn Ala Gly Ala Asp Pro Lys Trp Ser
390 395 400cac gac ggc acg cgc ata gca tac ttc gag aac ctg gtt gtt tct cct 1344His Asp Gly Thr Arg Ile Ala Tyr Phe Glu Asn Leu Val Val Ser Pro405 410 415 420tct tgt ggc gga cag aac ccg ctg cct tgc cct aac tcc act gaa cca 1392Ser Cys Gly Gly Gln Asn Pro Leu Pro Cys Pro Asn Ser Thr Glu Pro425 430 435ggt ggt cgt gtc acc cgc ctg atg ctt gct cac ctg acc agc cgc gag 1440Gly Gly Arg Val Thr Arg Leu Met Leu Ala His Leu Thr Ser Arg Glu440 445 450ccg ctc gat ctt gaa ccc gtt gct cct gtc tct gat gaa gtt ccc tgg 1488Pro Leu Asp Leu Glu Pro Val Ala Pro Val Ser Asp Glu Val Pro Trp455 460 465ggt gtt cca tac gtg ccc gag agt gct cta cca gac cgt ccc ttt cca 1536Gly Val Pro Tyr Val Pro Glu Ser Ala Leu Pro Asp Arg Pro Phe Pro470 475 480gct gaa gga aat tac acc ttg aag gga gag gtg tca ggc tca gct tct 1584Ala Glu Gly Asn Tyr Thr Leu Lys Gly Glu Val Ser Gly Ser Ala Ser485 490 495 500gtg tca atc att cat gac aag acc att cca gca gcg atc aaa act atc 1632Val Ser Ile Ile His Asp Lys Thr Ile Pro Ala Ala Ile Lys Thr Ile505 510 515gca gtc acc tat cgc aac tat tcc gat gat ggg ttg cat gtt atc gca 1680Ala Val Thr Tyr Arg Asn Tyr Ser Asp Asp Gly Leu His Val Ile Ala520 525 530ggg tct gaa aga ttc acc aat act gtc gca tcc atg aca ata aac aag 1728Gly Ser Glu Arg Phe Thr Asn Thr Val Ala Ser Met Thr Ile Asn Lys535 540 545
gtc gac tgg ttt tcc gac ctt acg tct acc gga caa gtg acc gga agc 1776Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser550 555 560aag aag acc agt ccc ggt ggg ttc cat ctg gag att gat gct atg act 1824Lys Lys Thr Ser Pro Gly Gly Phe His Leu Glu Ile Asp Ala Met Thr565 570 575 580aac atc ttc atg gca aac gga acc ttg aca acc act atc gat gga aag 1872Asn Ile Phe Met Ala Asn Gly Thr Leu Thr Thr Thr Ile Asp Gly Lys585 590 595gtc tgg aag cag ccg gca aat ggg act tga 1902Val Trp Lys Gln Pro Ala Asn Gly Thr600 605<210>4<211>633<212>PRT<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<400>4Met His Val Val Ala Ser Thr Thr Ala Phe Leu Gly Val Val Ser Thr-25 -20 -15Val Ala Gly Val His His Val Asn Arg Asp Thr Ser Gln Gln Ile Leu-10 -5 -1 1Lys Pro Pro Val Pro Glu Pro Ile Val Val Thr Glu Leu Pro Leu Pro5 10 15 20Pro Val Ala Asp Ser Lys Glu Gly Ser Cys Thr Pro Glu Val Ser Pro25 30 35His Arg Thr Gly Cys Leu Leu Lys Ser Ser Gln Ile Gln Ser Gly Asn
40 45 50Phe Leu Pro Asp Asn Asn His Val Leu Val Ser Leu Asn Phe Ser Gly55 60 65Ala Pro Ala Ala Pro Asp Pro Ala Ser Ile Tyr Asn Gly Thr His Leu70 75 80Thr Leu Ile Lys Ala Asp Gly Thr Asn Phe Pro Ser Gly Asp Pro Trp85 90 95 100Lys Cys Ile Thr Cys Gly Val Pro Glu Glu Asn Lys Val Gly Ser Thr105 110 115Glu Leu Ser Pro Tyr Pro Gln Ala Phe Leu Asp Gly Lys Arg Ala Leu120 125 130Ile Gly Thr Asn Ile Val Asp Cys Gly Ser Ala Leu Leu Ser Ser Ser135 140 145Asp Cys Thr Pro Asp Lys Val His Ile Tyr Pro Ile Arg Trp Asn Val150 155 160Lys Ala Asp Gly Ser Gly Ser Gly Gly Asn Ile Arg Glu Leu Arg Leu165 170 175 180His Pro Asp Asn Val His Leu Gly Phe Asn Ser Phe Thr Phe Ser Asn185 190 195Gly Gln Leu Gly Gln Phe Gly Tyr Phe Ser Arg Leu Gln Phe Asn Pro200 205 210Ala Pro Lys Thr Gly Glu Pro Arg Ser Ala Arg Tyr Asp Leu Val Asn215 220 225Val Thr Arg Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys230 235 240
Gly Asn Glu Leu Leu Phe Asn Arg Ser Ala Ile Ala Val Gly Glu Leu245 250 255 260Arg Gly Phe Thr Gly Arg Gly Lys Glu Val Thr Tyr Ile Gly Asn Pro265 270 275Val Glu Ser Cys Asn Ile Asp Val Phe Ala Ala Asp Leu Thr Thr Gly280 285 290Lys Val Arg Arg Ile Thr Asp His Pro Glu Tyr Val Asp Pro Met Asp295 300 305Val Ser Pro Asp Asp Lys Trp Gln Val Ile Leu Asp Thr Arg Gly Thr310 315 320Gly Arg Gln Met Phe Met Ala Gly Met Arg Gly Ile Pro Pro Ile Ile325 330 335 340Asp Leu Ile Ala Thr Thr Val Ala Ser Ser Thr Arg Asn Asn Gly Pro345 350 355Arg Arg Phe Phe Arg Pro Trp Leu Leu Asp His Asp Gly Asp Arg Gly360 365 370Asp Tyr Tyr Gly Gln Gln Ile Asn Gly Asp Gly Asp Gly Ser Pro Gly375 380 385Ser Ile Asn Asp Pro Asn Trp Asn Ala Gly Ala Asp Pro Lys Trp Ser390 395 400His Asp Gly Thr Arg Ile Ala Tyr Phe Glu Asn Leu Val Val Ser Pro405 410 415 420Ser Cys Gly Gly Gln Asn Pro Leu Pro Cys Pro Asn Ser Thr Glu Pro425 430 435
Gly Gly Arg Val Thr Arg Leu Met Leu Ala His Leu Thr Ser Arg Glu440 445 450Pro Leu Asp Leu Glu Pro Val Ala Pro Val Ser Asp Glu Val Pro Trp455 460 465Gly Val Pro Tyr Val Pro Glu Ser Ala Leu Pro Asp Arg Pro Phe Pro470 475 480Ala Glu Gly Asn Tyr Thr Leu Lys Gly Glu Val Ser Gly Ser Ala Ser485 490 495 500Val Ser Ile Ile His Asp Lys Thr Ile Pro Ala Ala Ile Lys Thr Ile505 510 515Ala Val Thr Tyr Arg Asn Tyr Ser Asp Asp Gly Leu His Val Ile Ala520 525 530Gly Ser Glu Arg Phe Thr Asn Thr Val Ala Ser Met Thr Ile Asn Lys535 540 545Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser550 555 560Lys Lys Thr Ser Pro Gly Gly Phe His Leu Glu Ile Asp Ala Met Thr565 570 575 580Asn Ile Phe Met Ala Asn Gly Thr Leu Thr Thr Thr Ile Asp Gly Lys585 590 595Val Trp Lys Gln Pro Ala Asn Gly Thr600 605<210>5<211>1857
<212>DNA<213>Eupenicillium brefeldianum PF1226<220>
<221>CDS<222>(1)..(1854)<220>
<221>mat_peptide<222>(52)..(1854)<400>5atg cgt tgg agt ttc tct gtt gtc cta agc acg gct gcc ctt ggt ata 48Met Arg Trp Ser Phe Ser Val Val Leu Ser Thr Ala Ala Leu Gly Ile-15 -10 -5tcc tcg act acc ccg gca cct cct cag cca gag ccc att gaa gta gtt 96Ser Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile Glu Val Val-1 1 5 10 15gaa ctt ccc cta cct ccg gtt gca cca agc aac agt acg ggc gca tgc 144Glu Leu Pro Leu Pro Pro Val Ala Pro Ser Asn Ser Thr Gly Ala Cys20 25 30acg gca tcc atc aac ccc cac cgg aca ggc tgc att gcg cag gta tca 192Thr Ala Ser Ile Asn Pro His Arg Thr Gly Cys Ile Ala Gln Val Ser35 40 45gac tct ttc cag gct ggc gac ttt aca cct gat gga aac cat gtg gtc 240Asp Ser Phe Gln Ala Gly Asp Phe Thr Pro Asp Gly Asn His Val Val50 55 60atc acc gtg gag ttt gtt ggt gct ccg gcg gca cca gac cca gcc agc 288Ile Thr Val Glu Phe Val Gly Ala Pro Ala Ala Pro Asp Pro Ala Ser65 70 75ata tac tct ggg gaa cat atc atc ctc gtc aaa gca gac ggt aca acg 336
Ile Tyr Ser Gly Glu His Ile Ile Leu Val Lys Ala Asp Gly Thr Thr80 85 90 95ttc acc aat ggc gat gca tgg aaa tgc tta agc tgc ggt gtt cct tcc 384Phe Thr Asn Gly Asp Ala Trp Lys Cys Leu Ser Cys Gly Val Pro Ser100 105 110aaa aat gcc ctt agc ctc gac ccg cag aga gac tat cca cat gtg gct 432Lys Asn Ala Leu Ser Leu Asp Pro Gln Arg Asp Tyr Pro His Val Ala115 120 125aga aat tct cga caa gcc ctt tgg gga cac aat atc ctg gat tgc agt 480Arg Asn Ser Arg Gln Ala Leu Trp Gly His Asn Ile Leu Asp Cys Ser130 135 140ggc att cct ctg gtc agc gat gag tgc acg cca aac aag acg cat atc 528Gly Ile Pro Leu Val Ser Asp Glu Cys Thr Pro Asn Lys Thr His Ile145 150 155tat cca atc tac tgg ccc acc ggc acg aac agc tcg ggc agc act cgg 576Tyr Pro Ile Tyr Trp Pro Thr Gly Thr Asn Ser Ser Gly Ser Thr Arg160 165 170 175gaa atg cgt ctg cat cct gac gat acg cac atg ggc tgg agc tca ttc 624Glu Met Arg Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe180 185 190acc agt ggt ggt caa ttc gca tac ttt ggt cga ctg cag ttc cgt caa 672Thr Ser Gly Gly Gln Phe Ala Tyr Phe Gly Arg Leu Gln Phe Arg Gln195 200 205aat cca acc gac ggg aca ctt cgt gtt cca aga tat gat ctc gtc gat 720Asn Pro Thr Asp Gly Thr Leu Arg Val Pro Arg Tyr Asp Leu Val Asp210 215 220gtc aat ctg ctc gtc cag ccc aat ggt act gcg cct atc atg gcc cag 768Val Asn Leu Leu Val Gln Pro Asn Gly Thr Ala Pro Ile Met Ala Gln
225 230 235ggc tct gaa ctg aag atc cat aat gaa gct att aca gtt ggt gag ctt 816Gly Ser Glu Leu Lys Ile His Asn Glu Ala Ile Thr Val Gly Glu Leu240 245 250 255cgc gga ttc agc ggc gcc gga gac gag atc ctg tac att ggg tcg aca 864Arg Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr260 265 270cgt gag gca aac aac att gat ctc ttt gcg gtc cat atc act act ggc 912Arg Glu Ala Asn Asn Ile Asp Leu Phe Ala Val His Ile Thr Thr Gly275 280 285gct gtt cgc cgt ctc acc agt cac cct gag tacgct gat ccc att gcc960Ala Val Arg Arg Leu Thr Ser His Pro Glu Tyr Ala Asp Pro Ile Ala290 295 300ttt tca cat gac aac caa tgg ttc gtc acc atg gac act cgt ggc tca 1008Phe Ser His Asp Asn Gln Trp Phe Val Thr Met Asp Thr Arg Gly Ser305 310 315aat cga cag atg tgg atg gct ggg gag cgg tat att cct cct ctg att 1056Asn Arg Gln Met Trp Met Ala Gly Glu Arg Tyr Ile Pro Pro Leu Ile320 325 330 335gac ctg gtc act gtc aca gct gct tca tca act cgc aat aac ggc gcg 1104Asp Leu Val Thr Val Thr Ala Ala Ser Ser Thr Arg Asn Asn Gly Ala340 345 350cgc cgc ttc ttt cag cca atc ctg atc gat cgt tac ggt gat cgg gga 1152Arg Arg Phe Phe Gln Pro Ile Leu Ile Asp Arg Tyr Gly Asp Arg Gly355 360 365gac tac ttt ggt caa cga gtc aac tat caa ggc gac gga agc aat ggc 1200Asp Tyr Phe Gly Gln Arg Val Asn Tyr Gln Gly Asp Gly Ser Asn Gly370 375 380
agt gtc aac gac ccg aat tgg aat ggc aga gca gac cca gcc ttc tct 1248Ser Val Asn Asp Pro Asn Trp Asn Gly Arg Ala Asp Pro Ala Phe Ser385 390 395ccc gat gga act cgt atc gtc tat tgg cag gcc ttg gtg att cca cct 1296Pro Asp Gly Thr Arg Ile Val Tyr Trp Gln Ala Leu Val Ile Pro Pro400 405 410 415gcc tgc ggt ggt gca aat cca ctc ccc tgc cca gtg tca act gcc caa 1344Ala Cys Gly Gly Ala Asn Pro Leu Pro Cys Pro Val Ser Thr Ala Gln420 425 430gga ggt cga aca tac cga gtg atg ctg gca cgt ctt tca gat cgc aaa 1392Gly Gly Arg Thr Tyr Arg Val Met Leu Ala Arg Leu Ser Asp Arg Lys435 440 445cac acg gac cca gcc cct gtt ttt gct gcg cca gat tat att tct tgg 1440His Thr Asp Pro Ala Pro Val Phe Ala Ala Pro Asp Tyr Ile Ser Trp450 455 460gcg act ccg ttc cca cca ggt gca ggt ctt cct acg tct tat acc ctg 1488Ala Thr Pro Phe Pro Pro Gly Ala Gly Leu Pro Thr Ser Tyr Thr Leu465 470 475cct gcg ggt aac tac act ctc tac ggc aag gct act ggg ctt gca aat 1536Pro Ala Gly Asn Tyr Thr Leu Tyr Gly Lys Ala Thr Gly Leu Ala Asn480 485 490 495gcc acc ctg acc agg gac cca ctt ttc ggc agc ttt aag act gta tcc 1584Ala Thr Leu Thr Arg Asp Pro Leu Phe Gly Ser Phe Lys Thr Val Ser500 505 510gtc aac tac acg aat ttc tca gat gat ggc cag cac ttt atc aat ggc 1632Val Asn Tyr Thr Asn Phe Ser Asp Asp Gly Gln His Phe Ile Asn Gly515 520 525
tat gaa tct gtt act ctg acg ttg tct gcc tcg aac cct tgg ctt agc 1680Tyr Glu Ser Val Thr Leu Thr Leu Ser Ala Ser Asn Pro Trp Leu Ser530 535 540cat ttg gac tgg gtc tcc gat att gtg cag act ggt gct gtg aac gct 1728His Leu Asp Trp Val Ser Asp Ile Val Gln Thr Gly Ala Val Asn Ala545 550 555gtt aag gag act ggg tct ggt gga ttt cat ttg aca atc gat gca cag 1776Val Lys Glu Thr Gly Ser Gly Gly Phe His Leu Thr Ile Asp Ala Gln560 565 570 575gag aac att ttt gag gct aat ggg aca ctg act acg act gtt gat ggc 1824Glu Asn Ile Phe Glu Ala Asn Gly Thr Leu Thr Thr Thr Val Asp Gly580 585 590gtg acc tac cac cag ccg ctc aat ggt gca tga 1857Val Thr Tyr His Gln Pro Leu Asn Gly Ala595 600<210>6<211>618<212>PRT<213>Eupenicillium brefeldianum PF1226<400>6Met Arg Trp Ser Phe Ser Val Val Leu Ser Thr Ala Ala Leu Gly Ile-15 -10 -5Ser Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile Glu Val Val-1 1 5 10 15Glu Leu Pro Leu Pro Pro Val Ala Pro Ser Asn Ser Thr Gly Ala Cys20 25 30Thr Ala Ser Ile Asn Pro His Arg Thr Gly Cys Ile Ala Gln Val Ser
35 40 45Asp Ser Phe Gln Ala Gly Asp Phe Thr Pro Asp Gly Asn His Val Val50 55 60Ile Thr Val Glu Phe Val Gly Ala Pro Ala Ala Pro Asp Pro Ala Ser65 70 75Ile Tyr Ser Gly Glu His Ile Ile Leu Val Lys Ala Asp Gly Thr Thr80 85 90 95Phe Thr Asn Gly Asp Ala Trp Lys Cys Leu Ser Cys Gly Val Pro Ser100 105 110Lys Asn Ala Leu Ser Leu Asp Pro Gln Arg Asp Tyr Pro His Val Ala115 120 125Arg Asn Ser Arg Gln Ala Leu Trp Gly His Asn Ile Leu Asp Cys Ser130 135 140Gly Ile Pro Leu Val Ser Asp Glu Cys Thr Pro Asn Lys Thr His Ile145 150 155Tyr Pro Ile Tyr Trp Pro Thr Gly Thr Asn Ser Ser Gly Ser Thr Arg160 165 170 175Glu Met Arg Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe180 185 190Thr Ser Gly Gly Gln Phe Ala Tyr Phe Gly Arg Leu Gln Phe Arg Gln195 200 205Asn Pro Thr Asp Gly Thr Leu Arg Val Pro Arg Tyr Asp Leu Val Asp210 215 220Val Asn Leu Leu Val Gln Pro Asn Gly Thr Ala Pro Ile Met Ala Gln225 230 235
Gly Ser Glu Leu Lys Ile His Asn Glu Ala Ile Thr Val Gly Glu Leu240 245 250 255Arg Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr260 265 270Arg Glu Ala Asn Asn Ile Asp Leu Phe Ala Val His Ile Thr Thr Gly275 280 285Ala Val Arg Arg Leu Thr Ser His Pro Glu Tyr Ala Asp Pro Ile Ala290 295 300Phe Ser His Asp Asn Gln Trp Phe Val Thr Met Asp Thr Arg Gly Ser305 310 315Asn Arg Gln Met Trp Met Ala Gly Glu Arg Tyr Ile Pro Pro Leu Ile320 325 330 335Asp Leu Val Thr Val Thr Ala Ala Ser Ser Thr Arg Asn Asn Gly Ala340 345 350Arg Arg Phe Phe Gln Pro Ile Leu Ile Asp Arg Tyr Gly Asp Arg Gly355 360 365Asp Tyr Phe Gly Gln Arg Val Asn Tyr Gln Gly Asp Gly Ser Asn Gly370 375 380Ser Val Asn Asp Pro Asn Trp Asn Gly Arg Ala Asp Pro Ala Phe Ser385 390 395Pro Asp Gly Thr Arg Ile Val Tyr Trp Gln Ala Leu Val Ile Pro Pro400 405 410 415Ala Cys Gly Gly Ala Asn Pro Leu Pro Cys Pro Val Ser Thr Ala Gln420 425 430
Gly Gly Arg Thr Tyr Arg Val Met Leu AlaArg Leu Ser Asp Arg Lys435 440445His Thr Asp Pro Ala Pro Val Phe Ala Ala Pro Asp Tyr Ile Ser Trp450 455 460Ala Thr Pro Phe Pro Pro Gly Ala Gly Leu Pro Thr Ser Tyr Thr Leu465 470 475Pro Ala Gly Asn Tyr Thr Leu Tyr Gly Lys Ala Thr Gly Leu Ala Asn480 485 490 495Ala Thr Leu Thr Arg Asp Pro Leu Phe Gly Ser Phe Lys Thr Val Ser500 505 510Val Asn Tyr Thr Asn Phe Ser Asp Asp Gly Gln His Phe Ile Asn Gly515 520 525Tyr Glu Ser Val Thr Leu Thr Leu Ser Ala Ser Asn Pro Trp Leu Ser530 535 540His Leu Asp Trp Val Ser Asp Ile Val Gln Thr Gly Ala Val Asn Ala545 550 555Val Lys Glu Thr Gly Ser Gly Gly Phe His Leu Thr Ile Asp Ala Gln560 565 570 575Glu Asn Ile Phe Glu Ala Asn Gly Thr Leu Thr Thr Thr Val Asp Gly580 585 590Val Thr Tyr His Gln Pro Leu Asn Gly Ala595 600<210>7<211>19
<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>7Ala Ser Pro Pro Ala Ser Val Pro Asn Asn Pro Ser Ser Glu Glu Ile1 5 10 15Thr Leu Gln<210>8<211>8<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>8Leu Val Phe Asn Pro Ser Pro Lys1 5<210>9<211>15<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>9Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile Arg1 5 10 15<210>10<211>16<212>PRT
<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>10Val Thr Ile Leu His Asn Pro Glu Gly Val Ala Pro Ile Thr Ala Lys1 5 10 15<210>11<211>17<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>11Glu His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser1 5 10 15Gln<210>12<211>13<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400>12Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg1 5 10<210>13<211>17<212>DNA<213>人工序列
<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(3)<223>i<220>
<221>modified_base<222>(6)<223>i<400>13ccngcntcng tnccnaa 17<210>14<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(3)<223>i<220>
<221>modified_base<222>(6)<223>i<400>14
ccngcnagyg tnccnaa 17<210>15<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(6)<223>i<400>15ccrtcngcng cnacrtt 17<210>16<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(6)<223>i<400>16ccccanggda tngtrtc 17
<210>17<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(3)<223>i<400>17acnccytcng grttrtg 17<210>18<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>18tgacgctgat accaacggcg 20<210>19<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA
<400>19ctagtggcag tattggacag 20<210>20<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>20cccaggcctt taaggatggc 20<210>21<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>21ctgcttgagg gtaatgggct c21<210>22<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>22
acagacgccg gaggagaagc g21<210>23<211>28<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>23gggcatatgg cttctcctcc tgcttctg 28<210>24<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>24gggggatcct taagtgccgc tctgaggact acg 33<210>25<211>39<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>25gggcccgggg cgcatcatgc acttctttga caaagcgac 39
<210>26<211>30<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>26gggctgcagt taagtgccgc tctgaggact 30<210>27<211>13<212>PRT<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<400>27Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys1 5 10<210>28<211>8<212>PRT<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<400>28Leu Gln Phe Asn Pro Ala Pro Lys1 5<210>29<211>17<212>PRT
<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<400>29Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser1 5 10 15Lys<210>30<211>14<212>PRT<213>曲霉屬種名待定PF122菌株(Aspergillus sp.PF1224)<400>30Gly Glu Val Ser Gly Ser Ala Ser Val Ser Ile Ile His Asp1 5 10<210>31<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(9)<223>i<400>31tayaayccng aytcncc 17
<210>32<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>32tayaayccng ayagycc 17<210>33<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(12)<223>i<400>33carttyaayc cngcncc 17<210>34<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA
<220>
<221>modified_base<222>(3)<223>i<400>34ggngcnggrt traaytg 17<210>35<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>35aartcngara accartc 17<210>36<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>36aartcrctra accartc 17<210>37<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述合成DNA<400>37cctcgatacc cgagggaccg 20<210>38<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>38gatgggttgc atgttatcgc 20<210>39<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>39gcgataacat gcaacccatc 20<210>40<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述合成DNA<400>40gaccacctgg ttcagtggtg 20<210>41<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>41gggttataga gtctggtaac g21<210>42<211>39<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>42gggaggcctg cgcatcatgc atgttgtcgc aagtaccac 39<210>43<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>43gggctcgagt acctcaagtc ccatttgccg gctgc 35<210>44<211>12<212>PRT<213>Eupenicillium brefeldianum PF1226<400>44Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile1 5 10<210>45<211>11<212>PRT<213>Eupenicillium brefeldianum PF1226<400>45Ala Asp Pro Ala Phe Ser Pro Asp Gly Thr Arg1 5 10<210>46<211>13<212>PRT<213>Eupenicillium brefeldianum PF1226<400>46Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe1 5 10<210>47
<211>16<212>PRT<213>Eupenicillium brefeldianum PF1226<400>47Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr Arg1 5 10 15<210>48<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(3)<223>i<400>48ccncarccng arccnat 17<210>49<211>17<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<220>
<221>modified_base<222>(6)
<223>i<400>49ctraangcng grtcngc 17<210>50<211>18<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>50ccancccatr tgngtrtc18<210>51<211>37<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA<400>51gggcccgggc tcagactacc ccggcacctc ctcagcc 37<210>52<211>38<212>DNA<213>人工序列<220>
<223>人工序列的描述合成DNA
<400>52gggctcgagt acctcatgca ccattgagcg gctggtgg 38<210>53<211>1917<212>DNA<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<220>
<221>CDS<222>(1)..(1914)<220>
<221>mat_peptide<222>(79)..(1914)<400>53atg cac ttc ttt gac aaa gcg act gtc tac gct ata ctc tgc ggt agc 48Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser-25 -20 -15gtg gcc cag act gtt cac act gca ccc tcc gct tct cct cct gct tct 96Val Ala Gln Thr Val His Thr Ala Pro Ser Ala Ser Pro Pro Ala Ser-10 -5 -1 1 5gtt cca aac cct cct tct cct gag ccc att acc ctc aag cag cta cct 144Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro10 15 20ctt cct ccc atc tcc cct agc gac gac gtc ggt gct tgc acg aag cag 192Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln25 30 35atc aac tct cgt gga acg gga tgt ctc gcc aac ggc gtt ttt gaa acg 240
Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr40 45 50ttt cag tct ggt gac ttt tta cct gat gga aag cat gtc atc gcc atg288Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met55 60 65 70gtc aac ttt act ggt gcg cct gct gct ccg gct gcg gga agc atc tac336Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr75 80 85tct ggc ccg cag gtc atc atc gtc aag acg gat ggc aag aca ttt cct384Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro90 95 100aac gga gac ccc tgg aag tgc atc acc tgt ggt gtc cct gag aag aac432Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn105 110 115gcc gtt ggt atc agc gtc aag tat gac tac ccc cag gcc ttt aag gat480Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp120 125 130ggc aaa cgt ctt ctc atc gga cac aat att ctc gac tgc ggc acc aac528Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn135 140 145 150cag ttg acg agc gag agc tgc aag cca gat aac acc cac atc tac cct576Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro155 160 165atc cgc tgg aat gtt gct gcc gac ggt tcc ggc ccg agc ggt gaa atc624Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile170 175 180cgt gag ctg cgg tta cac ccg gac aat gtc cat ctc gag ttt agc tct672Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser
185 190 195ttc acc ttt gct agt ggc agt att gga cag tat gcc tac ttt tct cgg720Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg200 205 210ctc gtt ttc aat cct tcg ccc aag act gga act ccc ctt gcg ccg cgg768Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg215 220 225 230tat gac ctg gaa aag gtt act att ctg cac aac ccc gag ggc gtt gcc816Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala235240 245cct atc acg gcc aag ggt aag gtt ctg tct ctg aac ccc cag gct att864Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile250 255 260tcg gtt ggc gag gct cgt ggc ttc aac ggc gac gga act gag ctc act912Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr265 270 275tat gtc gga agc aat att gag agc tgt aat aat gat gtc ttt gcc gtt960Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val280 285 290cat ctt caa act gga gtt gtt cga cgt ctt acc aac cat ccc gag tat1008His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr295 300 305 310cct gac cct ctg gct ttc tcg cct gat aac aaa tgg atg gct gtc atg1056Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met315 320 325gat acc cgc gga agt ggt cgc aac atg ttt att gcc ggc atg cga gga1104Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly330 335 340
atc ccg ccc ctg gtt gat att gtt ggc ggt att ctg cca gcg tcg tct1152Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser345 350 355cgc aac aac ggt ctt cgt cgc ttc ttc cag ccg tac ctg ctt gat ttt1200Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe360 365 370tat ggt gac cgc ggt gac tac tac ggc caa aag ttc aac gga gat aac1248Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Phe Asn Gly Asp Asn375 380 385 390aat ggc gtg cct ggg agt ggt gcc atc aac gat cct gag tgg aac ggt1296Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly395 400 405atg gct gat ccg aga tgg tct cct gac cgc agg cag ctc gtc ttt tgg1344Met Ala Asp Pro Arg Trp Ser Pro Asp Arg Arg Gln Leu Val Phe Trp410415 420cag act cat acc gtc tcc cct tct tgt ggc ggc gcc aac cct ctc cct1392Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro425 430 435tgc tac cct tcg aaa gag caa ggt ggc cgt aac tat cgc atg tac atc1440Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile440 445 450gcg acc ttt act agc cgc agc cca agc cct cct gcc ccg gtg aag gag1488Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu455460 465 470cac tcc gat acc atc ccc tgg ggc gtc ccg tac gtt ccc gga tct cag1536His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln475 480 485
gtt act cca aag cct ggc ttg gcg ggc ggt atc tac acg ctc tac ggc1584Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly490 495 500aag gct tcg ggc gag gcc aag gtc aac atc acc tgg ggt gag gca ccc1632Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro505 510 515gag att gga acc gtc agc gtc gtg tac aag gac tat tcg ctc gac ggc1680Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly520 525 530aag agc ttc ctc aac ggg aac gag agc gtc acg ggg tct gtc gag aga1728Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg535 540 545 550ctg act gac tat tct ttt gac tgg tat tcg gat att cgc cag acg gga1776Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly555 560 565gct gtc aag gga acc aag aag acg agc cct ggt gga ttc cat gct aat1824Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn570 575 580att gat gtc atg atc aac gac ctg act tca act ggt act ctt acc acg1872Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr585 590 595act ctg gat ggt gtt gag tgg cgt agt cct cag agc ggc act taa1917Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr600 605 610<210>54<211>638<212>PRT<213>侵菅新赤殼侵菅變種PF1225菌株(Neocosmospora vasinfecta variety vasinfectaP1225)<400> 54Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser-25 -20 -15Val Ala Gln Thr Val His Thr Ala Pro Ser Ala Ser Pro Pro Ala Ser-10 -5 -1 1 5Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro10 15 20Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln25 30 35Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr40 45 50Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met55 60 65 70Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr75 80 85Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro90 95 100Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn105 110 115Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp120 125 130Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn135 140 145 150Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro
155 160 165Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile170 175 180Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser185 190 195Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg200 205 210Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg215 220 225 230Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala235 240 245Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile250 255 260Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr265 270 275Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val280 285 290His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr295 300 305 310Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met315 320 325Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly330 335 340Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser345 350 355
Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe360 365 370Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Phe Asn Gly Asp Asn375 380 385 390Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly395 400 405Met Ala Asp Pro Arg Trp Ser Pro Asp Arg Arg Gln Leu Val Phe Trp410 415 420Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro425 430 435Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile440 445 450Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu455 460 465 470His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln475 480 485Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly490 495 500Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro505 510 515Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly520 525 530Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg535 540 545 550
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly555 560 565Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn570 575 580Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr585 590 595Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr600 605 610
權(quán)利要求
1.蛋白質(zhì),該蛋白質(zhì)選自下述各項(xiàng)(a)由SEQ ID NO.2所示氨基酸序列構(gòu)成的蛋白質(zhì);和(b)由上述(a)所述序列中缺失、置換、插入或添加一個(gè)或幾個(gè)氨基酸殘基的修飾氨基酸序列構(gòu)成,且具皂草苷分解活性的蛋白質(zhì)。
2.多核苷酸,該多核苷酸編碼權(quán)利要求1所述的蛋白質(zhì)。
3.多核苷酸,該多核苷酸選自下述各項(xiàng)(i)由SEQ ID NO.1所示DNA序列構(gòu)成的多核苷酸;(ii)由上述(i)的序列中缺失、置換、插入或添加一個(gè)或幾個(gè)堿基的修飾DNA序列構(gòu)成,且編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸;和(iii)與具有包含上述(i)所述DNA序列的多核苷酸的DNA序列在嚴(yán)格條件下雜交,且編碼具皂草苷分解活性的蛋白質(zhì)的多核苷酸,其中所述嚴(yán)格條件包括于0.5%SSC、0.4%SDS和6M尿素中在42℃下洗滌。
4.權(quán)利要求2或3所述的多核苷酸,所述多核苷酸來(lái)自絲狀菌。
5.權(quán)利要求4所述的多核苷酸,其中所述絲狀菌屬于新赤殼屬(Neocosmospora)。
6.權(quán)利要求5所述的多核苷酸,其中屬于新赤殼屬的絲狀菌為侵菅新赤殼侵菅變種PF1225(Neocosmospora vasinfecta var.vasinfectaPF1225)(保藏號(hào)FERM BP-7475)。
7.重組載體,該重組載體含有權(quán)利要求2-6中任一項(xiàng)記載的多核苷酸。
8.宿主,該宿主是由權(quán)利要求7記載的重組載體轉(zhuǎn)化的。
9.權(quán)利要求8所述的宿主,該宿主是微生物。
10.權(quán)利要求9所述的宿主,該宿主是絲狀菌。
11.權(quán)利要求10所述的宿主,其中絲狀菌屬于木霉屬(Trichoderma)。
12.權(quán)利要求11所述的宿主,其中該宿主是綠色木霉MC300-1菌株(Trichoderma viride MC300-1)(保藏號(hào)FERM BP-6047)。
13.權(quán)利要求8-12中任一項(xiàng)所述的宿主,該宿主表達(dá)皂草苷分解酶。
14.目標(biāo)蛋白質(zhì)的生產(chǎn)方法,該方法包括培養(yǎng)權(quán)利要求8-13中任一項(xiàng)所述的宿主,從獲得的培養(yǎng)物中收集具皂草苷分解活性的蛋白質(zhì)。
15.大豆皂草精醇B的生產(chǎn)方法,該方法包括使用含有可由權(quán)利要求8-13中任一項(xiàng)所述的宿主獲得的具皂草苷分解活性的蛋白質(zhì)的培養(yǎng)物,分解以大豆皂草精醇B為糖苷配基的糖苷。
16.大豆皂草精醇B的生產(chǎn)方法,該方法包括使用至少一種選自以下的蛋白質(zhì)權(quán)利要求1所述的蛋白質(zhì)和可由權(quán)利要求8-13中任一項(xiàng)所述的宿主獲得的蛋白質(zhì),分解以大豆皂草精醇B為糖苷配基的糖苷。
全文摘要
本發(fā)明提供具皂草苷分解活性的蛋白質(zhì),具體地說是可分解以大豆皂草精醇B為糖苷配基的苷、生產(chǎn)大豆皂草精醇B的蛋白質(zhì);編碼該蛋白質(zhì)的多核苷酸;以及可使用它們大量生產(chǎn)大豆皂草精醇B的方法。本發(fā)明的蛋白質(zhì)涉及下述(a)、(b)或(c)(a)含有選自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白質(zhì);(b)含有與包含上述(a)的氨基酸序列的蛋白質(zhì)具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì);或(c)含有上述(a)的氨基酸序列中缺失、置換、插入或添加1個(gè)或多個(gè)氨基酸殘基的氨基酸序列,且具皂草苷分解活性的蛋白質(zhì)。
文檔編號(hào)C12N15/56GK1982444SQ200610125660
公開日2007年6月20日 申請(qǐng)日期2002年6月6日 優(yōu)先權(quán)日2001年6月6日
發(fā)明者渡邊學(xué), 御堂直樹, 田村隆由, 隅田奈緒美, 矢口貴志 申請(qǐng)人:明治制果株式會(huì)社