本發(fā)明涉及分子生物學(xué)技術(shù)領(lǐng)域,尤其涉及制備生產(chǎn)抗生素、特別是米爾貝霉素的重組工程化鏈霉菌的方法和獲得的重組鏈霉菌及其應(yīng)用。
發(fā)明背景
米爾貝霉素是一種大環(huán)內(nèi)酯類驅(qū)蟲藥物,日本三共株式會社于1967年發(fā)現(xiàn),經(jīng)過多年改良于1986年正式以商品名米爾貝肟(milbemycin oxime)上市。米爾貝肟是米爾貝霉素A3和米爾貝霉素A4的肟衍生物,米爾貝肟對控制和預(yù)防大部分常見寄生蟲疾病都有很好的效果。通常用來預(yù)防惡絲蟲病,控制線蟲、鉤蟲引發(fā)的犬、貓疾病及犬的鞭蟲病。由于米爾貝肟殺蟲活性高、毒性小,LD50是臨床推薦用量的2000倍以上,同時對阿維菌素類藥物敏感的犬毒性較小,所以具有很好的市場前景。
目前能產(chǎn)米爾貝霉素的菌株有米爾貝霉素鏈霉菌(Streptomyces milbemycinicus)、冰城鏈霉菌(Streptomyces bingchenggensis)、吸水鏈霉菌(Streptomyces hygroscopicus)例如吸水鏈霉菌金淚亞種(Streptomyces hygroscopicus subsp.aureolacrimosus)和灰產(chǎn)色鏈霉菌(Streptomyces griseochromogenes)。它們除主要產(chǎn)生有效組分米爾貝霉素A3/A4外,還可產(chǎn)生近三十多種米爾貝霉素類似物,其中常見的有C5-O-甲基米爾貝霉素B2、B3、β1、β2、α9和α10(US4144352)。這些類似物的產(chǎn)生不僅會降低米爾貝霉素A3/A4的產(chǎn)量,而且會嚴(yán)重影響米爾貝霉素A3/A4后期的分離純化。
向文勝等報(bào)道通過基因工程改造獲得了去除米爾貝霉素B2、B3、β1和β2以及南昌霉素的重組冰城鏈霉菌(CN 103468625 B)。但是還有一類米爾貝霉素類似物α9和α10(圖1)在米爾貝霉素提取純化過程中很難徹底去除(Takiguchi Y et al.1980,Milbemycins,a new family of macrolide antibiotics:fermentation,isolation and physico-chemical properties.J Antibiot(Tokyo).1980Oct;33(10):1120-7)。目前本領(lǐng)域尚未鑒別鏈霉菌中關(guān)于米爾貝霉素類似物α9和α10的合成途徑,因此沒有關(guān)于通過改造相關(guān)途徑而降低或去除米爾貝霉素類似物α9和α10的相關(guān)報(bào)道。本領(lǐng)域需要能夠在生產(chǎn)米爾貝霉素例如米爾貝霉素A3/A4的同時減少或阻斷雜質(zhì)組分例如米爾貝霉素類似物α9和α10的方法和手段。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明人意外地發(fā)現(xiàn)失活鏈霉菌中的本發(fā)明所述基因mpca2、mpca3、mpca4和mpca5中的至少一個時,使用該鏈霉菌生產(chǎn)米爾貝霉素時能夠去除雜質(zhì)組分米爾貝霉素類似物α9和α10,而不影響或者有利于米爾貝霉素的生產(chǎn),簡化米爾貝霉素提取純化工藝,降低生產(chǎn)成本。在某些情況中,使用本發(fā)明的重組鏈霉菌生產(chǎn)米爾貝霉素時不但能夠去除雜質(zhì)組分米爾貝霉素類似物α9和α10,還能夠提高有效組分米爾貝霉素A3/A4的發(fā)酵單位。
本發(fā)明提供了一種重組鏈霉菌,使用該重組鏈霉菌生產(chǎn)米爾貝霉素時,相對于使用相應(yīng)的野生型或起始鏈霉菌生產(chǎn)米爾貝霉素時,降低或完全去除米爾貝霉素類似物α9和α10雜質(zhì)組分含量。
在一個實(shí)施方案中,本發(fā)明提供了一種重組鏈霉菌,其中相對于相應(yīng)的野生型鏈霉菌或者產(chǎn)生該重組鏈霉菌的起始鏈霉菌,所述重組鏈霉菌選自如下的一個、兩個、三個或全部四個基因是失活的:
(i)編碼SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca2;
(ii)編碼SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca3;
(iii)編碼SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca4;
(iv)編碼SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca5。
在本文中,所述野生型鏈霉菌是指天然環(huán)境中存在的、并未進(jìn)行任何人工操作的鏈霉菌。
在本發(fā)明中,產(chǎn)生所述重組鏈霉菌的起始鏈霉菌是指對其進(jìn)行本發(fā)明所示遺傳操作例如基因失活的鏈霉菌。所述起始鏈霉菌可以是野生型鏈霉菌,也可以是具有其它遺傳修飾但是不具有本發(fā)明所述遺傳修飾的用于生產(chǎn)米爾貝霉素的鏈霉菌。
如本文所用,“重組”是指由于有意人為干預(yù)所獲得的具有所需修飾的菌株,例如與相應(yīng)天然(非重組)菌株相比,重組菌株低表達(dá)或者根本不表達(dá)特定天然基因或其活性。
在本發(fā)明中,術(shù)語“失活”包括部分失活和完全失活,是指基因功能部分或全部喪失,不能產(chǎn)生表達(dá)其編碼的蛋白質(zhì)、或蛋白質(zhì)表達(dá)水平降低或消除、或表達(dá)的蛋白質(zhì)的相關(guān)生物學(xué)活性被降低或消除,例如基因不能被轉(zhuǎn)錄或者轉(zhuǎn)錄的RNA不能被翻譯為具有相應(yīng)活性的蛋白質(zhì)、或者產(chǎn)生的蛋白質(zhì)的量或其活性與未進(jìn)行所述失活操作的基因翻譯的蛋白質(zhì)的量或活性相比是降低的或者被消除,例如降低至少5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%甚至更多、或者被消除(即降低100%)。
在本發(fā)明中,術(shù)語“消除”是指與未進(jìn)行所述遺傳操作例如失活操作之前的菌株中存在的相應(yīng)蛋白的活性相比,進(jìn)行遺傳操作后的菌株中蛋白的活性不可被檢測到。
在本發(fā)明中,“至少X%相同性”理解為是指要比較的兩個序列的氨基酸殘基之間的百分比相同性,其是在所述兩個序列的最佳排列對比后獲得的。所述最佳排列對比可以通過使用本領(lǐng)域已知的任何方法獲得,例如Smith and Waterman,Adv.Appl.Math.2:482(1981)的局部同源算法,Needleman and Wunsch,J.Mol.Biol.48:443(1970)的同源排列算法,Pearson and Lipman,Proc.Natl.Acad.Sci.85:2444(1988)的相似性搜索方法及這些算法的計(jì)算機(jī)執(zhí)行程序,如由NCBI站點(diǎn)上可用的BLAST P計(jì)算機(jī)軟件所使用的那些。
本領(lǐng)域技術(shù)人員可以合理推斷,在同一種屬中,與參考蛋白質(zhì)的氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的蛋白質(zhì)與參考蛋白質(zhì)在生物體中執(zhí)行相同的生物學(xué)功能。例如,在本發(fā)明所述鏈霉菌中,本領(lǐng)域技術(shù)人員能夠合理預(yù)期與SEQ ID NO:8所示氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的多肽與由SEQ ID NO:8所示氨基酸序列組成的多肽在生物體中執(zhí)行相同的生物學(xué)功能,因此失活與SEQ ID NO:8所示氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的多肽可以獲得與失活SEQ ID NO:8所示氨基酸序列的多肽相同的效果,例如降低或去除米爾貝霉素類似物α9和α10雜質(zhì)組分含量。
在本發(fā)明中,術(shù)語“基因mpca2”是指在表達(dá)后產(chǎn)生具有SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的蛋白的基因。在一個實(shí)施方案中,基因mpca2具有SEQ ID NO:7的974-2452位核苷酸所示的核苷酸序列。
在本發(fā)明中,術(shù)語“基因mpca3”是指在表達(dá)后產(chǎn)生具有SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的蛋白的基因。在一個實(shí)施方案中,基因mpca3具有SEQ ID NO:7的2449-3606位核苷酸所示的核苷酸序列。
在本發(fā)明中,術(shù)語“基因mpca4”是指在表達(dá)后產(chǎn)生具有SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的蛋白的基因。在一個實(shí)施方案中,基因mpca4具有SEQ ID NO:7的3828-4892位核苷酸所示的核苷酸序列。
在本發(fā)明中,術(shù)語“基因mpca5”是指在表達(dá)后產(chǎn)生具有SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的蛋白的基因。在一個實(shí)施方案中,基因mpca5具有SEQ ID NO:7的620-892位核苷酸所示的核苷酸序列。
在本發(fā)明中,術(shù)語“基因”的最廣泛的含義,包括脫氧核糖核苷酸序列,包含蛋白質(zhì)編碼區(qū)及參與基因表達(dá)的編碼區(qū)鄰近的序列。術(shù)語“基因”涵蓋了cDNA和基因的基因組形式?;虻幕蚪M形式或克隆含有由稱作“內(nèi)含子”或者“間插區(qū)”或者“間插序列”的非編碼序列中斷的編碼區(qū)。內(nèi)含子可含有調(diào)節(jié)元件如增強(qiáng)子。
如本文所用,編碼特定氨基酸序列的基因是指該基因在適當(dāng)生物體(例如產(chǎn)米爾貝霉素的鏈霉菌,特別是米爾貝霉素鏈霉菌)中表達(dá)時生成具有所述氨基酸序列的蛋白質(zhì)。所述基因包括編碼所述氨基酸序列的編碼序列,還可以包括調(diào)節(jié)所述基因表達(dá)的調(diào)控序列,例如啟動子等。例如,編碼SEQ ID NO:8所示氨基酸序列的基因mpca2是指mpca2基因在鏈霉菌例如米爾貝霉素鏈霉菌中表達(dá)時產(chǎn)生具有SEQ ID NO:8所示氨基酸序列的多肽;在本發(fā)明中,mpca2基因不僅涵蓋編碼SEQ ID NO:8所示氨基酸序列的核苷酸序列,也涵蓋了調(diào)節(jié)其表達(dá)的調(diào)控序列,例如啟動子等。
如本文所用,術(shù)語“肽”、“多肽”和“蛋白質(zhì)”可互換應(yīng)用,是指氨基酸殘基的聚合物。該術(shù)語也可用于天然發(fā)生的氨基酸聚合物,也可用于其保守修飾的變體及其中一或多個氨基酸殘基是相應(yīng)天然發(fā)生的氨基酸的人工化學(xué)類似物的氨基酸聚合物。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌選自重組米爾貝霉素鏈霉菌(例如重組CGMCC No.7677)、重組冰城鏈霉菌、重組吸水鏈霉菌例如重組吸水鏈霉菌金淚亞種和重組灰產(chǎn)色鏈霉菌。在進(jìn)一步的實(shí)施方案中,本發(fā)明所述重組鏈霉菌是重組米爾貝霉素鏈霉菌。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌是以保藏號CGMCC No.7677保藏在CGMCC的米爾貝霉素鏈霉菌的重組菌株,其中相對于CGMCC No.7677鏈霉菌,所述重組菌株選自如下的一個、兩個、三個或全部四個基因是失活的:
(i)編碼SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca2;
(ii)編碼SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca3;
(iii)編碼SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca4;
(iv)編碼SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca5。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌中的基因mpca2是失活的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的974-2452位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段是缺失或敲除的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的x-y位核苷酸是缺失或敲除的,其中x是974至1581的任一整數(shù),y是1834至2452的任一整數(shù)。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的1581-1834位核苷酸是缺失或敲除的。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌中的基因mpca3是失活的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的2449-3606位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段是缺失或敲除的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的x-y位核苷酸是缺失或敲除的,其中x是2449至2894的任一整數(shù),y是3305至3606的任一整數(shù)。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的2894-3305位核苷酸是缺失或敲除的。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌中的基因mpca4是失活的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的3828-4892位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段是缺失或敲除的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的x-y位核苷酸是缺失或敲除的,其中x是3828至3889的任一整數(shù),y是4495至4892的任一整數(shù)。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的3889-4495位核苷酸是缺失或敲除的。
在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌中的基因mpca5是失活的。在一個實(shí)施方案中,本發(fā)明所述重組鏈霉菌的基因組中SEQ ID NO:7所示的620-892位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段是缺失或敲除的。
在一個實(shí)施方案中,本發(fā)明所述基因失活是基因被敲除或替換?!扒贸笔侵富虻慕Y(jié)構(gòu)或調(diào)節(jié)機(jī)制的破壞。敲除可以通過例如靶向載體、置換載體或hit-and-run載體同源重組或者隨機(jī)插入基因捕獲載體致使完全或部分喪失基因功能。
本發(fā)明還提供了一種產(chǎn)生重組鏈霉菌的方法,包括失活鏈霉菌中選自如下的任一個、任兩個、任三個或全部基因:
(i)編碼SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca2;
(ii)編碼SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca3;
(iii)編碼SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca4;
(iv)編碼SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca5。
本領(lǐng)域中已知的任何適于鏈霉菌中的基因失活方法均可以用于進(jìn)行本發(fā)明的基因失活,例如包括但不限于基因替換、基因敲除、插入失活、移碼突變、定點(diǎn)誘變、基因部分缺失、基因沉默、RNAi、反義抑制等。對于通過上述方法失活基因可以參見本領(lǐng)域已知的教科書、技術(shù)手冊和參考文獻(xiàn)(例如Kieser T,Bibb M.Practical Streptomyces Genetics[M].Norwich:The John Innes Foundation,2000)。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括失活鏈霉菌中編碼SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca2。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的974-2452位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段。在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的x-y位核苷酸,其中x是974至1581的任一整數(shù),y是1834至2452的任一整數(shù)。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的1581-1834位核苷酸。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括失活鏈霉菌中編碼SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca3。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的2449-3606位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段。在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的x-y位核苷酸,其中x是2449至2894的任一整數(shù),y是3305至3606的任一整數(shù)。在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的2894-3305位核苷酸。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括失活鏈霉菌中編碼SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca4。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的3828-4892位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段。在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的x-y位核苷酸,其中x是3828至3889的任一整數(shù),y是4495至4892的任一整數(shù)。在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的3889-4495位核苷酸。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括失活鏈霉菌中編碼SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca5。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生重組鏈霉菌的方法,包括缺失或敲除鏈霉菌中SEQ ID NO:7所示的620-892位核苷酸或其片段、或具有與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的核苷酸序列的片段。
在一個實(shí)施方案中,本發(fā)明所述方法用于產(chǎn)生重組米爾貝霉素鏈霉菌(例如CGMCC No.7677)、重組冰城鏈霉菌、重組吸水鏈霉菌例如重組吸水鏈霉菌金淚亞種或重組灰產(chǎn)色鏈霉菌。
在一個實(shí)施方案中,本發(fā)明所述基因失活是通過基因敲除或替換實(shí)現(xiàn)的。
在一個實(shí)施方案中,本發(fā)明提供了一種產(chǎn)生以保藏號CGMCC No.7677保藏在CGMCC的米爾貝霉素鏈霉菌的重組菌株的方法,包括失活(例如敲除)CGMCC No.7677中的選自如下的一個、兩個、三個或全部四個基因:
(i)編碼SEQ ID NO:8所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca2;
(ii)編碼SEQ ID NO:9所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca3;
(iii)編碼SEQ ID NO:10所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca4;和
(iv)編碼SEQ ID NO:11所示氨基酸序列或與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的基因mpca5。
本發(fā)明還提供了一種生產(chǎn)米爾貝霉素的方法,包括使用本發(fā)明所述的重組鏈霉菌或根據(jù)本發(fā)明所述產(chǎn)生重組鏈霉菌的方法獲得的重組鏈霉菌,任選包括回收、分離和/或純化生產(chǎn)的米爾貝霉素。
本發(fā)明所述生產(chǎn)米爾貝霉素的方法可以采用本領(lǐng)域已知的合適步驟和條件(Takiguchi Y et al.1980,Milbemycins,a new family of macrolide antibiotics:fermentation,isolation and physico-chemical properties.J Antibiot(Tokyo).1980 Oct;33(10):1120-7),例如包括但不限于在適于米爾貝霉素產(chǎn)生的條件下培養(yǎng)本發(fā)明所述的重組鏈霉菌或根據(jù)本發(fā)明所述產(chǎn)生重組鏈霉菌的方法獲得的重組鏈霉菌,收獲產(chǎn)生的米爾貝霉素,任選進(jìn)行回收、分離和/或純化。
在一個實(shí)施方案中,本發(fā)明提供了一種生產(chǎn)米爾貝霉素的方法,包括:在適于米爾貝霉素產(chǎn)生的條件下培養(yǎng)本發(fā)明的重組鏈霉菌或通過本發(fā)明的方法獲得的重組鏈霉菌,收獲產(chǎn)生的米爾貝霉素,任選進(jìn)行回收、分離和/或純化。
在一個實(shí)施方案中,本發(fā)明提供了一種生產(chǎn)米爾貝霉素的方法,包括:將本發(fā)明所述重組鏈霉菌或通過本發(fā)明的方法獲得的重組鏈霉菌進(jìn)行種子培養(yǎng),然后接種發(fā)酵培養(yǎng)基并在適于米爾貝霉素產(chǎn)生的條件下進(jìn)行發(fā)酵,收獲發(fā)酵液,任選回收、分離和/或純化產(chǎn)生的米爾貝霉素。
本發(fā)明所述種子培養(yǎng)和發(fā)酵培養(yǎng)可以使用本領(lǐng)域已知的任何合適方法、條件和材料。所述種子培養(yǎng)基和發(fā)酵培養(yǎng)基可以使用本領(lǐng)域已知的任何合適的培養(yǎng)基。進(jìn)行純化的方法可以使用本領(lǐng)域已知的任何合適方法和技術(shù)進(jìn)行,例如包括但不限于層析萃取、結(jié)晶、樹脂吸附、離子交換吸附、色層分離和HPLC等。
本發(fā)明還涉及本發(fā)明的重組鏈霉菌、通過本發(fā)明的方法獲得的重組鏈霉菌、包含選自SEQ ID NO:8-11的任一氨基酸序列的多肽和/或編碼選自SEQ ID NO:8-11的任一氨基酸序列及與其具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列的核酸在制備重組鏈霉菌及在生產(chǎn)米爾貝霉素中的應(yīng)用。
本發(fā)明還涉及包含SEQ ID NO:8-11的任一氨基酸序列的多肽。
本發(fā)明還涉及至少包含SEQ ID NO:7所示的1581-1834位核苷酸、SEQ ID NO:7所示的2894-3305位核苷酸和/或SEQ ID NO:7所示的3889-4495位核苷酸的核酸。
在一個實(shí)施方案中,本發(fā)明涉及包含SEQ ID NO:7所示的974-2452位核苷酸、SEQ ID NO:7所示的2449-3606位核苷酸、SEQ ID NO:7所示的3828-4892位核苷酸、和/或SEQ ID NO:7所示的620-892位核苷酸的核酸。
附圖說明
圖1:米爾貝霉素類似物α9和α10質(zhì)譜檢測簡圖。圖1(a):α9質(zhì)譜峰圖;圖1(b):α10質(zhì)譜峰圖。
圖2:用于構(gòu)建文庫的粘粒載體SuperCos 1簡圖。
圖3:含有目標(biāo)基因片段的柯斯質(zhì)粒pSCM-7C11簡圖。
圖4:菌株發(fā)酵產(chǎn)物的HPLC檢測圖譜。圖4(a):原始菌株HS023發(fā)酵樣品;圖4(b):重組菌株HS023-102發(fā)酵樣品;圖4(c):重組菌株HS023-103發(fā)酵樣品;圖4(d):重組菌株HS023-104發(fā)酵樣品。
具體實(shí)施方式
本發(fā)明利用米爾貝霉素產(chǎn)生菌HS023(CGMCC No.7677)染色體基因組構(gòu)建Cosmid文庫。利用PCR-targeting或者構(gòu)建同源臂及加載抗性基因構(gòu)建基因(mpca2、mpca3、mpca4、mpca5)的敲除載體,通過接合轉(zhuǎn)移導(dǎo)入菌株HS023中,利用同源重組原理敲除目的基因,四個基因中敲除任何一個均可徹底阻斷雜質(zhì)組分米爾貝霉素類似物α9和α10的合成。
本領(lǐng)域技術(shù)人員可以借鑒本文內(nèi)容,適當(dāng)更改基因失活的突變位點(diǎn)以實(shí)現(xiàn)去除目標(biāo)雜質(zhì)。特別需要指出的是,所有類似的替換和改動對本領(lǐng)域技術(shù)人員來說是顯而易見的,它們都被視為包括在本發(fā)明。本發(fā)明的方法及應(yīng)用已經(jīng)通過較佳實(shí)施例進(jìn)行了描述,相關(guān)人員明顯能在不脫離本發(fā)明內(nèi)容、精神和范圍內(nèi)對本文所述的方法和應(yīng)用進(jìn)行改動或適當(dāng)變更與組合,來實(shí)現(xiàn)和應(yīng)用本發(fā)明技術(shù)。
本發(fā)明采用的試劑皆為普通市售品,皆可于市場購得。
其中,本發(fā)明采用:
原始鏈霉菌HS023保藏編號為CGMCC No.7677(CN 103789339 A);
大腸桿菌ET12567(pUZ8002)菌株(可購自優(yōu)寶生物,貨號:ST1130):轉(zhuǎn)化了質(zhì)粒pUZ8002(可購自E.coli Genetic Stock Center)的大腸桿菌ET12567(ATCC BAA-525)。參見MacNeil DJ等,Analysis of Streptomyces avermitilis genes required for avermectin biosynthesis utilizing a novel integration vector.Gene 111(1):61-8,1992。
阿泊拉霉素抗性基因來源載體pIJ773購自E.coli Genetic Stock Center;
制備采用的限制性內(nèi)切酶、PCR擴(kuò)增反應(yīng)相關(guān)試劑購自Takara公司;
阿泊拉霉素(Apra)、卡那霉素(Km)購自生工上海有限公司;
pMD19T購自Takara公司;
平末端化所用的試劑盒均為BKL,購自Takara公司;
去磷試劑盒FastAPTM,購自Thermo scientific fermentas公司;
III XL Packaging Extract購自Stratagene(USA)公司
下面結(jié)合實(shí)施例,進(jìn)一步闡述本發(fā)明:
實(shí)施例1:鏈霉菌總DNA的提取
取鏈霉菌HS023凍存管孢子懸液50μL接種于30mL TSB培養(yǎng)基(購自Bacto Tryptic Soy Broth.BD公司),28℃、220rpm培養(yǎng)48h后,于50mL離心管中,4000rpm離心10min,去上清,沉淀用30mL蔗糖-Tris緩沖液(其中蔗糖的質(zhì)量百分?jǐn)?shù)為10.3%,Tris-HCl的摩爾-體積濃度為10mM,pH值為8.0)洗滌2遍后,以5mL蔗糖-Tris緩沖液懸浮。加入質(zhì)量-體積溶度為100mg/mL溶菌酶溶液20μL,37℃水浴2h。加入質(zhì)量百分?jǐn)?shù)為10%的SDS溶液500μL,溫和顛倒直至基本澄清。加酚-氯仿-異戊醇(其中:酚-氯仿-異戊醇的體積比為25:24:1(pH值為8.0)溶液5mL,溫和顛倒數(shù)次后,4000rpm離心10min。取上層溶液4mL,加酚-氯仿-異戊醇(pH值為8.0)溶液4mL,溫和顛倒數(shù)次后4000rpm離心10min。接著取上層3mL溶液,加入摩爾-體積濃度為3mol/L的NaAc緩沖液(pH值為5.3)300μL、異丙醇3mL,溫和顛倒數(shù)次后,將結(jié)團(tuán)的沉淀挑到新的1.5mL離心管。沉淀用體積分?jǐn)?shù)為70%乙醇水溶液洗滌2遍后,室溫干燥。加入500μL Tris-HCl(pH8.0)溶解,得到鏈霉菌的總DNA。
實(shí)施例2:米爾貝霉素產(chǎn)生菌基因組文庫的構(gòu)建
應(yīng)用粘粒載體SuperCos 1(見圖2)構(gòu)建HS023基因組文庫。首先建立合適的部分酶切體系用Sau3A1對50-100μg的高分子量的染色體DNA進(jìn)行部分酶切,再用Tris飽和的苯酚:氯仿:異戊醇(25:24:1)抽提兩次,用氯仿:異戊醇(24:1)抽提一次。轉(zhuǎn)移上層水相至一個新的管子,加入0.1體積的3mol/L醋酸鈉、兩倍體積的乙醇,混勻,-20℃放置30min。離心沉淀DNA(12000r/min,10min),用70%乙醇洗滌DNA沉淀,干燥DNA沉淀,懸浮DNA沉淀于適當(dāng)體積的TE緩沖液中,4℃保存?zhèn)溆?。雙cos位點(diǎn)載體SuperCos 1先用NheI充分消化質(zhì)粒DNA,然后用CIAP充分處理,苯酚-氯仿抽提后乙醇沉淀回收,溶于適當(dāng)體積水中,進(jìn)一步用BamHI充分酶切,后苯酚-氯仿(pH8.0)抽提后,乙醇沉淀后溶于適當(dāng)體積TE中,4℃保存?zhèn)溆?。用過量載體和基因組片段混合,16℃連接過夜。連接完成后對連接混合物利用III XL Packaging Extract(Stratagene,USA)試劑盒,按照說明書進(jìn)行包裝反應(yīng)。包裝混合物按照轉(zhuǎn)染程序轉(zhuǎn)染宿主菌E.coli DH10B,涂布LB氨芐板。在獲得的抗性克隆中隨機(jī)挑取10個抽取質(zhì)粒,電泳檢測柯斯質(zhì)粒中的外源片段插入情況,結(jié)果顯示絕大多數(shù)的抗性克隆均有較大的插入。統(tǒng)計(jì)包裝混合物轉(zhuǎn)染后可以獲得的菌落數(shù)發(fā)現(xiàn),構(gòu)建的基因組文庫至少含有10000個以上的抗性克隆,文庫能夠?qū)蚪M實(shí)現(xiàn)很好的覆蓋。
實(shí)施例3:基因文庫篩選
設(shè)計(jì)通用引物PcaF/PcaR(SEQ ID NO:1/SEQ ID NO:2),利用菌落PCR篩選實(shí)施例2構(gòu)建的基因組文庫,共篩選1000個單菌落,獲得兩個可能含有目的序列的Cosmid,分別編號pSCM-7C11和pSCM-4C12,利用通用引物T7和T3兩端測序,結(jié)果顯示pSCM-7C11載體中四個基因位于序列中央(見圖3),適合后續(xù)的基因操作,同時對pSCM-7C11進(jìn)行測序,獲得四個基因的全序列(見序列SEQ ID NO:7)。
實(shí)施例4:基因敲除質(zhì)粒的構(gòu)建
根據(jù)實(shí)施例3測序結(jié)果,設(shè)計(jì)引物Pca10/Pca11(SEQ ID NO:3/SEQ ID NO:4),以pIJ773為模板,擴(kuò)增aac(3)IV-oriT抗性盒,用于PCR-Targeting失活Mpca4基因,具體方法參照Gust et al.(PCR-targeted Streptomyces gene replacement identifies a protein domain needed for biosynthesis of the sesquiterpene soil odor geosmin[J].Proc Natl Acad Sci USA,2003,100(4):1541-1546)所述并遵照執(zhí)行。最后將獲得由aac(3)-oriT替換mpca4基因部分序列的載體pSCM-7C11M4,用于鏈霉菌HS023中Mpca4基因的失活。利用相同原理構(gòu)建mpca3基因失活載體pSCM-7C11M3、mpca2基因失活載體pSCM-7C11M2(詳見表1)。
表1:構(gòu)建質(zhì)粒信息
說明:*序列位點(diǎn)是指SEQ ID NO:7序列上的序列位點(diǎn)
實(shí)施例5:mpca4基因失活重組鏈霉菌的獲得
將實(shí)施例4構(gòu)建的質(zhì)粒pSCM-7C11M4導(dǎo)入ET12567(pUZ8002)中,通過接合轉(zhuǎn)移方法(參考文獻(xiàn)Kieser T,Bibb M.Practical Streptomyces Genetics[M].Norwich:The John Innes Foundation,2000)導(dǎo)入到鏈霉菌HS023中,挑取單交換子;含有Km、Apra抗性的單交換子Apra抗性平板傳兩代,挑取單菌落,分別點(diǎn)種于Apra抗性平板和Km抗性平板,培養(yǎng)8天后,挑取KmS、ApraR的雙交換子提取基因組;利用相應(yīng)引物進(jìn)行PCR(引物PCA12/PCA13,SEQ ID NO:5/SEQ ID NO:6)驗(yàn)證是否為雙交換子;同時將PCR片段平末端克隆到pMD19T上送金斯瑞測序。PCR和測序雙重驗(yàn)證確保獲得的突變株為正確的雙交換子,獲得重組鏈霉菌HS023-104。
實(shí)施例6:mpca2和mpca3基因失活重組鏈霉菌的獲得
利用同實(shí)施例5相同的方法,分別獲得mpca2基因失活的重組鏈霉菌HS023-102和mpca3基因失活的重組鏈霉菌HS023-103。
實(shí)施例7:發(fā)酵驗(yàn)證
重組菌株以及原始菌株在YMS平板上30℃培養(yǎng)7天,進(jìn)種子培養(yǎng)基(蔗糖1%,脫脂奶粉0.1%,蛋白胨0.35%,酵母膏0.5%,K2PO4 0.05%,調(diào)節(jié)pH值為7.2,滅菌即得),28℃、250rpm培養(yǎng)40小時后進(jìn)發(fā)酵培養(yǎng)基(蔗糖16%,黃豆餅粉2%,酵母膏0.5%,麥芽膏0.5%,K2HPO4 0.05%,F(xiàn)eSO4·7H2O 0.005%,CaCO3 0.3%,MgSO4 0.05%;調(diào)節(jié)pH值為7.2,滅菌即得),接種量4%,28℃250rpm培養(yǎng)10天后放瓶,分別取1mL發(fā)酵液,用4mL無水甲醇浸泡過夜,離心取上清進(jìn)行HPLC檢測。HPLC分析條件,色譜柱:依利特Hypersil ODS2 5μm(4.6*250mm);流動相:85%甲醇;吸收波長240nm;流速:1ml/min。
檢測所得色譜圖如圖4所示,其中圖4(a)顯示本發(fā)明原始鏈霉菌經(jīng)發(fā)酵后,對發(fā)酵液進(jìn)行HPLC檢測的圖譜;圖4(b)、(c)和(d)分別顯示本發(fā)明實(shí)施例5和6獲得的重組鏈霉菌HS023-102、HS023-103和HS023-104發(fā)酵后,對發(fā)酵液進(jìn)行HPLC檢測的圖譜。
結(jié)果表明,本發(fā)明獲得的基因失活重組菌株,和原始菌株相比較,雜質(zhì)組份α9和α10徹底消除,菌株形態(tài)和發(fā)酵工藝未改變,且米爾貝霉素A3/A4的發(fā)酵單位較原始菌株最高增加30%。三個基因分別失活,均可以阻斷雜質(zhì)組份α9和α10的合成,而不影響米爾貝霉素A3/A4的合成(見表2)。
表2:菌株發(fā)酵數(shù)據(jù)
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
序列表
<110> 浙江海正藥業(yè)股份有限公司
<120> 生產(chǎn)米爾貝霉素的重組鏈霉菌及其制備方法和應(yīng)用
<130> I2017TC1592CS
<160> 11
<170> PatentIn version 3.3
<210> 1
<211> 26
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 1
ggaccggctg ttctacgact acgagg 26
<210> 2
<211> 25
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 2
ccgacggaga ccaatgtctg cacgt 25
<210> 3
<211> 59
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 3
cgtatctgcc cgacagcgtc agcgtgaccg aggccgtcca ttccggggat ccgtcgacc 59
<210> 4
<211> 58
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 4
gccatcagct cgccctgggc cttcatcacc ctcagcatct gtaggctgga gctgcttc 58
<210> 5
<211> 22
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 5
tccatcgtcg gctgaggcgt at 22
<210> 6
<211> 22
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 6
cgaccaattc ctggttcgca tg 22
<210> 7
<211> 5344
<212> DNA
<213> Streptomyces milbemycinicus
<400> 7
cgtacgccgc ctactaccgg cgctggtcgc tggtgtggga gagccaggcc ctgctgcgtg 60
ccgagccggt cgccggcgac cccgagctgg gcgggcgctt catcgagctg atcgatccgc 120
tgcgctaccc cgccgagggc ctgggcgacg acgcggtccg cgagatccgg cggctcaagg 180
cccggatgga atccgaacgc ctgccgcgcg gcgccgaccc caccacccac accaagctgg 240
gccgtggcgg cctgtccgac gtcgagtgga cggtgcagct gctccagatg cgccacggct 300
gggccgaacc gggcctgcgc accacccgca cccgcgaggc cctggccgcc gcccacgccg 360
ccgagctgat cggcgcggag gacgcgcaga ccctggacga ggcctgggtg ctggccaccc 420
gcgcgcgcaa cggcatcatg ctggtccgtg gccgccccgg taacacgttc cccagcggca 480
gccgcgaact ggcggcggtc tcccgttact tgggctacgg acccggcatg gtcggccaga 540
tgctcgacga ctaccgccgt acgacgcggc gggcgcgggc ggtggtggac cggctgttct 600
acgactacga gggctgagct cacactgact gggaacgcag ggacagcacg agatcggtga 660
tgctctccac gtccttgaag tggccgcccg tcaggtgggt ggccggcacc aggacaccga 720
gttcgtcccg cagatgggcc agcagccgcg cggtccggag cgagtccagg atgccccagg 780
ccagcagcgg tgtggtcggg gtgatctcgg cgaggtccgg gtcggcgacc aactcgtgcc 840
ggatatagcc gagaagcgtg tccagcaggg ccgagcgttc ggtgtcggac atgggaactc 900
caggtgttca agggcggagg cagggtggag tgcagggcgg tcaggcgcgt cggcagagtg 960
gggtgcaggg cggtcaggcg cggcggttcg gctccctcgt ccgcaactcc cgtgcgaggg 1020
cggcgcggtc ggtcttgccg ttggggccgc gggggatggc ctcgacggtg tgcaccgcgt 1080
cgatgatcat gtagctgggg agcagcgagg cgcagtgcct cttgaggtcg agcagttgtg 1140
gccgctgccc gggccgcggc acgacgacgg cgtggagccg tgccgcgtcg ctgctgcccg 1200
agacgaggac caccacgtcg ccgaccgccg ggtgcgcgcc gagggcggcc tccacctccc 1260
ccggctcgac ccggtgcccg cgcaccttcg ccaggtcgtc gaaccggccc agatactcca 1320
ggtcgccgtg ggcatcgcgg cggccgaggt ccccggtccg gtacgggccg tggtgcggcg 1380
ggcggcccca gtagcccagc atcacggtcg ggccgctgac gacgatctcc gccgtaccgt 1440
cgggccgggg ggccagacgt acgtcgttgc cgcagcaccc ggtgccgatc gggagcgggg 1500
tcgtacggac caggtcggcg gccgtcacct cgtaggacgt gcagacattg gtctccgtcg 1560
ggccgtacca gttgagcagc cgtacgccgg gccaggccgc gcgcagtcgc ttgatgtcct 1620
tgagcgggaa ggcttcgccc gcgaagacgc aggtgcgcag ggacagcggc ccccggtcca 1680
gcagccgccc ttggcgcatc aacagcagga acgccgacgg caccgagtac cagacggtga 1740
tccggcgccg ggcgagcacg tcgatgagct ggtcgggggc gtgggccagg gtgtcgggga 1800
cgaggtgtac cgaggctccg gcccggaagg cgccgtagag gtcgaacacc gacaggtcga 1860
aggtgaaggg cgcgtggttg gccagccggt cgccgggccg cagccgcagc ttttcggcgg 1920
cccagtcggt gaaggacagc gcgttgcggt ggctcaggca gacgcctttg ggctcgccgg 1980
tggagcccga ggtgtagagg atgtacgcgg ggtcgtcggg cgcggcgggg tggtgtgcgg 2040
ggcgtcgtcc cggctcggag gcgtcccgca gcgcggtgcg gtccaccacc tcgacgcgcg 2100
gaccgtccag gtcagccggg gcgggggcgt cgtcgaggtc ggtcaccacc agcgacgggc 2160
ggcagtccgc gatgatccgg cggacccggc cgatcgggtt cgaaggcgtc accggcacat 2220
agatcgctcc gatccgcagc acggcctgca tcagcgcgac cacctcggcg ctcttgcccg 2280
tccacagcag cacccggttc ccgggccgta cgcccgcgtc gagcagcgcc gcggcgtaac 2340
ggtcggcgag cgcgtcgagc cggccgtagc tgaggccgcc ggtcatatcg tggacggccg 2400
gcgcctccgg ggtgcgttcg gccgcctcga ccaccagtcg gtgcaggctc acagtcctat 2460
gctccttgcg atcaactgcc gctggatctc ggaggttccg gagaagacgg tcgtcggcag 2520
cgcgtccctg accgccgcct cgataccttc ctcgcgcaga cagccccggc cgccgaacaa 2580
ctgcatggca tccagcgaac tggccacggc cgcctcggag acggccagct tggacagcga 2640
cacccacagg gaggcgtccg ggtcgtcgcg gtccagtgcg tcgcaggccc ggtagagcag 2700
cagccgcccg ctctccagcc gcagcttcat atcgacgacg cggttgctca ccgactggaa 2760
ctcggccagc cgcttaccgg actgccgacg ctgccgtacg tgctccacgc accggtcgag 2820
cagccgctgc tgcactccca gatacaccgc gaagaggcag gaccgctccc accgcatgga 2880
gtgctggaag atcgcgccgc cttggcctgg ggcgccgagc acctgctcgt cgggtacgaa 2940
gcagtcgtcg aacgtcaccg ccgcggccgg acacgacagc agccccatct tgtccagcgg 3000
ctgccccacc gccagccctg gggcgccacg ctcgacgacg aacgcggtca cccccaggtg 3060
tccggcctgc ggatcggtgg tcgcgtacgt cacgaacaca tcggccaccg gtccattgct 3120
cacaaagctc tttgtgccgc tgagcagaaa accgtccgcg acccgccggg cggtcaccgt 3180
cagccgggcg acatccgagc cggattccgg ctccgtcatg gcgtttccgg cgatcagctc 3240
cccggagcac attcggggca gcagccgctt acgcgtatcg ggtggcgcga aatcgaggat 3300
cggcattccg caggagaaca gatgagcggc ggcggcgaac agaattccgg tgtccgcaca 3360
gccgcggccg gcggactcga atacgagcgc ggtgtccagc gcgccgagcc ccccgccgcc 3420
ctccgccgtc ggcacgctcg ccccgagcag ccccaggtcc gcaaggcggg accattcggc 3480
gcgggtgtac gccgacgccg acgccgtggg ctgatgatcg cccggcccgg cgggaaaggc 3540
ggtctgcgtt cgggccagga cgctggcgca acggtcgcgt tgttgtccgc tgagtgtgaa 3600
gtccatgggg ccgccctcct gtttcgggaa aagcgaattt caggtgtagc cgcaaagctc 3660
gacggtcgca agggagggga aaaagaaatt cacggactcc atcgtcggct gaggcgtatt 3720
cgagttggaa gcgaccgcct ctcttccgcg tcggcgtata cggagaaaag ccgaaccgaa 3780
attcacggac aggtgcgaag gggtgtacgt acatgcggac atcggatgtg tacatcgccg 3840
ccgtcgggac gtatctgccc gacagcgtca gcgtgaccga ggccgtccgg cagggacggc 3900
tggacgccgc cgaagcggag cggtccggtc tgctcggcgc ggccgtcgcg ggcgacaccc 3960
ccgcaccgga gatgggggtc cgcgcggtcc gtacggcctt ggggcgctgg ggcggcgata 4020
tctcggagct ggggctgctg ctctacgtcg agggttaccg ctgcggcccc gacggatggc 4080
ttccgcagtc gtatgtgatg cgcgaggcgg ttggcggcga tctgctggcg gtgggggtac 4140
ggcagggatg caacggggtc ttcggcgccc tcgaactggc ggcggcacat cttcggggcg 4200
gcggcagcga ggcggcgctg atcgtcgcgg ccgacaacat gggctcaccc ctggtggacc 4260
gctggcgggc gagcccgggg tatctcctcg ccgacggcgc ggcagcgctg gtgctcaccc 4320
ggtccgcggg cttcgcccgg ctgctgtccg tcaactccaa ggccgtaccg gaactcgaag 4380
ccctgcaccg cggcatccag ccactggatc cgtccggctc ggcccggcca gtgccgctcg 4440
agctcggcgc caggcagcgg gaattcctcg gcggtgacga cgcaccgaag gactggatgc 4500
tgagggtgat gaaggcccag ggcgagctga tggccaaaac ccttgaggag gcgggcatcg 4560
ccgccgagga catgacccgc gtcgtcaccg cccatgcgaa ccaggaattg gtcgacgcgt 4620
ggctgtcctc cctgggccgc accctggagc agtccgcctg gagcttcggc cgaagggtgg 4680
gccacctcat ggccggcgac cagctggcct ccttcgagca tctgctcatg gccggcgaga 4740
tcggccccgg cgaccgcgtc ctgctggtcg gctccggccc cggcctgggc atcgcggcag 4800
ccgtcgtgga gctcaccgcg ctcccgccgt gggtacccgg accccgcgcc cagtcagaca 4860
ccgtgacccc ggccgccgac gggtggcgct gaccgtgacg gcggccgcgc cgccgtacgg 4920
catctcaagc gtgcggcgtg aaacggcagg gcagccgcgt cattccgtgg atggacgtcc 4980
cggtcacaaa ctcgggctca cccgcctcga tatcgggcag catccgcagc agttcccgga 5040
agaggattct cagctgcgcc ctggcgagct gggcggccag gcagtagtgc gcaccgccac 5100
cgccgaagga cagctggggg ttgggatcgc gggcgaggtc aaaacgtccc ggttcgcgga 5160
agacggccgc gtcgcggttg cccgaggcgt agaacatcac caccttgtcc cctgccgaga 5220
tgtgccggcc gccgagccgg gtgggggcca ccgccgtacg gcggaaggtc agcacgggtg 5280
tggcgtagcg caggatctcc tccacggcgg ggccgatccg gccgtcgagg ccggccagca 5340
gcca 5344
<210> 8
<211> 492
<212> PRT
<213> Streptomyces milbemycinicus
<400> 8
Met Ser Leu His Arg Leu Val Val Glu Ala Ala Glu Arg Thr Pro Glu
1 5 10 15
Ala Pro Ala Val His Asp Met Thr Gly Gly Leu Ser Tyr Gly Arg Leu
20 25 30
Asp Ala Leu Ala Asp Arg Tyr Ala Ala Ala Leu Leu Asp Ala Gly Val
35 40 45
Arg Pro Gly Asn Arg Val Leu Leu Trp Thr Gly Lys Ser Ala Glu Val
50 55 60
Val Ala Leu Met Gln Ala Val Leu Arg Ile Gly Ala Ile Tyr Val Pro
65 70 75 80
Val Thr Pro Ser Asn Pro Ile Gly Arg Val Arg Arg Ile Ile Ala Asp
85 90 95
Cys Arg Pro Ser Leu Val Val Thr Asp Leu Asp Asp Ala Pro Ala Pro
100 105 110
Ala Asp Leu Asp Gly Pro Arg Val Glu Val Val Asp Arg Thr Ala Leu
115 120 125
Arg Asp Ala Ser Glu Pro Gly Arg Arg Pro Ala His His Pro Ala Ala
130 135 140
Pro Asp Asp Pro Ala Tyr Ile Leu Tyr Thr Ser Gly Ser Thr Gly Glu
145 150 155 160
Pro Lys Gly Val Cys Leu Ser His Arg Asn Ala Leu Ser Phe Thr Asp
165 170 175
Trp Ala Ala Glu Lys Leu Arg Leu Arg Pro Gly Asp Arg Leu Ala Asn
180 185 190
His Ala Pro Phe Thr Phe Asp Leu Ser Val Phe Asp Leu Tyr Gly Ala
195 200 205
Phe Arg Ala Gly Ala Ser Val His Leu Val Pro Asp Thr Leu Ala His
210 215 220
Ala Pro Asp Gln Leu Ile Asp Val Leu Ala Arg Arg Arg Ile Thr Val
225 230 235 240
Trp Tyr Ser Val Pro Ser Ala Phe Leu Leu Leu Met Arg Gln Gly Arg
245 250 255
Leu Leu Asp Arg Gly Pro Leu Ser Leu Arg Thr Cys Val Phe Ala Gly
260 265 270
Glu Ala Phe Pro Leu Lys Asp Ile Lys Arg Leu Arg Ala Ala Trp Pro
275 280 285
Gly Val Arg Leu Leu Asn Trp Tyr Gly Pro Thr Glu Thr Asn Val Cys
290 295 300
Thr Ser Tyr Glu Val Thr Ala Ala Asp Leu Val Arg Thr Thr Pro Leu
305 310 315 320
Pro Ile Gly Thr Gly Cys Cys Gly Asn Asp Val Arg Leu Ala Pro Arg
325 330 335
Pro Asp Gly Thr Ala Glu Ile Val Val Ser Gly Pro Thr Val Met Leu
340 345 350
Gly Tyr Trp Gly Arg Pro Pro His His Gly Pro Tyr Arg Thr Gly Asp
355 360 365
Leu Gly Arg Arg Asp Ala His Gly Asp Leu Glu Tyr Leu Gly Arg Phe
370 375 380
Asp Asp Leu Ala Lys Val Arg Gly His Arg Val Glu Pro Gly Glu Val
385 390 395 400
Glu Ala Ala Leu Gly Ala His Pro Ala Val Gly Asp Val Val Val Leu
405 410 415
Val Ser Gly Ser Ser Asp Ala Ala Arg Leu His Ala Val Val Val Pro
420 425 430
Arg Pro Gly Gln Arg Pro Gln Leu Leu Asp Leu Lys Arg His Cys Ala
435 440 445
Ser Leu Leu Pro Ser Tyr Met Ile Ile Asp Ala Val His Thr Val Glu
450 455 460
Ala Ile Pro Arg Gly Pro Asn Gly Lys Thr Asp Arg Ala Ala Leu Ala
465 470 475 480
Arg Glu Leu Arg Thr Arg Glu Pro Asn Arg Arg Ala
485 490
<210> 9
<211> 385
<212> PRT
<213> Streptomyces milbemycinicus
<400> 9
Met Asp Phe Thr Leu Ser Gly Gln Gln Arg Asp Arg Cys Ala Ser Val
1 5 10 15
Leu Ala Arg Thr Gln Thr Ala Phe Pro Ala Gly Pro Gly Asp His Gln
20 25 30
Pro Thr Ala Ser Ala Ser Ala Tyr Thr Arg Ala Glu Trp Ser Arg Leu
35 40 45
Ala Asp Leu Gly Leu Leu Gly Ala Ser Val Pro Thr Ala Glu Gly Gly
50 55 60
Gly Gly Leu Gly Ala Leu Asp Thr Ala Leu Val Phe Glu Ser Ala Gly
65 70 75 80
Arg Gly Cys Ala Asp Thr Gly Ile Leu Phe Ala Ala Ala Ala His Leu
85 90 95
Phe Ser Cys Gly Met Pro Ile Leu Asp Phe Ala Pro Pro Asp Thr Arg
100 105 110
Lys Arg Leu Leu Pro Arg Met Cys Ser Gly Glu Leu Ile Ala Gly Asn
115 120 125
Ala Met Thr Glu Pro Glu Ser Gly Ser Asp Val Ala Arg Leu Thr Val
130 135 140
Thr Ala Arg Arg Val Ala Asp Gly Phe Leu Leu Ser Gly Thr Lys Ser
145 150 155 160
Phe Val Ser Asn Gly Pro Val Ala Asp Val Phe Val Thr Tyr Ala Thr
165 170 175
Thr Asp Pro Gln Ala Gly His Leu Gly Val Thr Ala Phe Val Val Glu
180 185 190
Arg Gly Ala Pro Gly Leu Ala Val Gly Gln Pro Leu Asp Lys Met Gly
195 200 205
Leu Leu Ser Cys Pro Ala Ala Ala Val Thr Phe Asp Asp Cys Phe Val
210 215 220
Pro Asp Glu Gln Val Leu Gly Ala Pro Gly Gln Gly Gly Ala Ile Phe
225 230 235 240
Gln His Ser Met Arg Trp Glu Arg Ser Cys Leu Phe Ala Val Tyr Leu
245 250 255
Gly Val Gln Gln Arg Leu Leu Asp Arg Cys Val Glu His Val Arg Gln
260 265 270
Arg Arg Gln Ser Gly Lys Arg Leu Ala Glu Phe Gln Ser Val Ser Asn
275 280 285
Arg Val Val Asp Met Lys Leu Arg Leu Glu Ser Gly Arg Leu Leu Leu
290 295 300
Tyr Arg Ala Cys Asp Ala Leu Asp Arg Asp Asp Pro Asp Ala Ser Leu
305 310 315 320
Trp Val Ser Leu Ser Lys Leu Ala Val Ser Glu Ala Ala Val Ala Ser
325 330 335
Ser Leu Asp Ala Met Gln Leu Phe Gly Gly Arg Gly Cys Leu Arg Glu
340 345 350
Glu Gly Ile Glu Ala Ala Val Arg Asp Ala Leu Pro Thr Thr Val Phe
355 360 365
Ser Gly Thr Ser Glu Ile Gln Arg Gln Leu Ile Ala Arg Ser Ile Gly
370 375 380
Leu
385
<210> 10
<211> 354
<212> PRT
<213> Streptomyces milbemycinicus
<400> 10
Met Tyr Ile Ala Ala Val Gly Thr Tyr Leu Pro Asp Ser Val Ser Val
1 5 10 15
Thr Glu Ala Val Arg Gln Gly Arg Leu Asp Ala Ala Glu Ala Glu Arg
20 25 30
Ser Gly Leu Leu Gly Ala Ala Val Ala Gly Asp Thr Pro Ala Pro Glu
35 40 45
Met Gly Val Arg Ala Val Arg Thr Ala Leu Gly Arg Trp Gly Gly Asp
50 55 60
Ile Ser Glu Leu Gly Leu Leu Leu Tyr Val Glu Gly Tyr Arg Cys Gly
65 70 75 80
Pro Asp Gly Trp Leu Pro Gln Ser Tyr Val Met Arg Glu Ala Val Gly
85 90 95
Gly Asp Leu Leu Ala Val Gly Val Arg Gln Gly Cys Asn Gly Val Phe
100 105 110
Gly Ala Leu Glu Leu Ala Ala Ala His Leu Arg Gly Gly Gly Ser Glu
115 120 125
Ala Ala Leu Ile Val Ala Ala Asp Asn Met Gly Ser Pro Leu Val Asp
130 135 140
Arg Trp Arg Ala Ser Pro Gly Tyr Leu Leu Ala Asp Gly Ala Ala Ala
145 150 155 160
Leu Val Leu Thr Arg Ser Ala Gly Phe Ala Arg Leu Leu Ser Val Asn
165 170 175
Ser Lys Ala Val Pro Glu Leu Glu Ala Leu His Arg Gly Ile Gln Pro
180 185 190
Leu Asp Pro Ser Gly Ser Ala Arg Pro Val Pro Leu Glu Leu Gly Ala
195 200 205
Arg Gln Arg Glu Phe Leu Gly Gly Asp Asp Ala Pro Lys Asp Trp Met
210 215 220
Leu Arg Val Met Lys Ala Gln Gly Glu Leu Met Ala Lys Thr Leu Glu
225 230 235 240
Glu Ala Gly Ile Ala Ala Glu Asp Met Thr Arg Val Val Thr Ala His
245 250 255
Ala Asn Gln Glu Leu Val Asp Ala Trp Leu Ser Ser Leu Gly Arg Thr
260 265 270
Leu Glu Gln Ser Ala Trp Ser Phe Gly Arg Arg Val Gly His Leu Met
275 280 285
Ala Gly Asp Gln Leu Ala Ser Phe Glu His Leu Leu Met Ala Gly Glu
290 295 300
Ile Gly Pro Gly Asp Arg Val Leu Leu Val Gly Ser Gly Pro Gly Leu
305 310 315 320
Gly Ile Ala Ala Ala Val Val Glu Leu Thr Ala Leu Pro Pro Trp Val
325 330 335
Pro Gly Pro Arg Ala Gln Ser Asp Thr Val Thr Pro Ala Ala Asp Gly
340 345 350
Trp Arg
<210> 11
<211> 90
<212> PRT
<213> Streptomyces milbemycinicus
<400> 11
Met Ser Asp Thr Glu Arg Ser Ala Leu Leu Asp Thr Leu Leu Gly Tyr
1 5 10 15
Ile Arg His Glu Leu Val Ala Asp Pro Asp Leu Ala Glu Ile Thr Pro
20 25 30
Thr Thr Pro Leu Leu Ala Trp Gly Ile Leu Asp Ser Leu Arg Thr Ala
35 40 45
Arg Leu Leu Ala His Leu Arg Asp Glu Leu Gly Val Leu Val Pro Ala
50 55 60
Thr His Leu Thr Gly Gly His Phe Lys Asp Val Glu Ser Ile Thr Asp
65 70 75 80
Leu Val Leu Ser Leu Arg Ser Gln Ser Val
85 90