亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種手霉素類抗生素生物合成基因簇的制作方法

文檔序號:399436閱讀:466來源:國知局
專利名稱:一種手霉素類抗生素生物合成基因簇的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及微生物的基因工程領(lǐng)域,具體的說是一種手霉素A和中尼霉素的生物合成基因簇。
背景技術(shù)
手霉素類化合物是非常特殊的一類聚酮類天然產(chǎn)物,大多數(shù)是由鏈霉菌產(chǎn)生的抗生素,具有良好的生物活性。第一個手霉素化合物手霉素A是從鏈霉菌Sti^ptomyces parvulus TU64分離得到的(Buzzetti et al.,1963),然后在1973年發(fā)表了其結(jié)構(gòu) (Schroder et al.,1973),后來Zeeck等人給出了手霉素A的立體化學(xué)結(jié)構(gòu),進(jìn)一步修正了其結(jié)構(gòu)Geeck et al. ,1987 ;Sattler et al.,1998),手霉素化合物被認(rèn)為是一族新的抗生素,隨后又分離得到了有類似結(jié)構(gòu)的化合物如aSukamyCin(0mura et al.,1976 ; Kakinuma et al.,1979),U—62162 (Slechta et al.,1982)禾口 U—56407 (Brodasky et al., 1983),豐富了此族抗生素,以上這些手霉素類化合物的中心核心結(jié)構(gòu)是Hi-C7N結(jié)構(gòu)。而2005 年Li等從海洋鏈霉菌中分離得到了手霉素A和中尼霉素A、B(Li et al.,2005),中尼霉素中心芳香環(huán)結(jié)構(gòu)是P-C7N結(jié)構(gòu)單元,且有氯的取代,是第一個來自天然的Para-C7N結(jié)構(gòu)。
一些臨床上使用的利福霉素、絲裂霉素C等氨莎類抗生素,其結(jié)構(gòu)通常是脂肪族安莎鏈通過酰胺鍵連接在Hi-C7N芳香環(huán)結(jié)構(gòu)上,而Hi-C7N結(jié)構(gòu)單元是由特殊的3-氨基-5-羥基苯甲酸(AHBA)作為起始單元合成的(Floss 2006)。
手霉素類化合物看上去核心結(jié)構(gòu)具有類似Hi-C7N的結(jié)構(gòu)單元,但是Floss課題組通過前體喂養(yǎng)實驗發(fā)現(xiàn),手霉素A和asukamycin等核心結(jié)構(gòu)的前體物并不是AHBA,而是其異構(gòu)物 3-氨基-4 羥基苯甲酸(3,4-AHBA) (Hu et al.,1997 and 2004)。在 2010 年 Rui 等人解析了 asukamycin的生物合成基因簇(Rui et al.,2010),進(jìn)一步證實了前體物是3, 4-AHBA。
幾乎所有手霉素類化合物的側(cè)鏈上都存在C5N結(jié)構(gòu)2-氨基-3-羥基-2-環(huán)戊烯酮(2-amino-3-hydroxycyclopent-2-enone),C5N結(jié)構(gòu)單元的前體物是5-氨基酮戊酸(5-aminolevulinic acid,ALA),也是四吡咯的重要前體物,可以合成亞鐵血紅素、葉綠素、類咕啉等化合物。ALA在生物體內(nèi)通常有兩種合成途徑,C5途徑和Siemin(C4)途徑 (Petricek et al.,2006)。在(5途徑中,完整的谷氨酸碳骨架在谷氨酸t(yī)RNA連接酶、還原酶及一個氨基變位酶的作用下生成ALA,這個過程常存在于植物和大多數(shù)細(xì)菌中。而Siemin 途徑,則是甘氨酸和琥珀酰輔酶A在5-氨乙酰丙酸合成酶作用下直接生成ALA,這個途徑常被認(rèn)為存在于動物、真菌及許多光合細(xì)菌中(Avissar et al.,1989)。而最近的研究發(fā)現(xiàn) Shemin途徑也常存在于鏈霉菌的ALA合成過程中Oiang et al.,2010),還發(fā)現(xiàn)有的鏈霉菌同時具有C5和Shemin(C4)兩種途徑(Petricek et al. ,2006) ALA可以在5_氨乙酰丙酸輔酶A連接酶的作用下環(huán)化生成C5N結(jié)構(gòu)單元,然后在酰胺合成酶的作用下,進(jìn)入到手霉素類化合物的代謝過程。
手霉素化合物一般具有良好的生物活性,手霉素A是Ras蛋白法呢基轉(zhuǎn)移酶抑制劑(Hara et al.,1993)和白細(xì)胞介素_1 β轉(zhuǎn)換酶抑制劑(Tanaka et al.,1996);抗生素 U-62162和U-56407選擇性地抑制革蘭氏陽性細(xì)菌,而對革蘭氏陰性菌沒有抑制效果沖尼霉素A對乳腺癌及黑色素瘤具有顯著的抑制活性(IC5tl = 2. 41 μ g/mL);以商品農(nóng)藥作為對照,中尼霉素對農(nóng)作物病原真菌的抗菌效果明顯,優(yōu)于武夷菌素水劑、克菌康、寶麗安及百菌清等商品農(nóng)藥(李富超等,2009),具有很好的開發(fā)前景。
手霉素類化合物的生物活性與其結(jié)構(gòu)密切相關(guān),隨著手霉素A和中尼霉素整個生物合成基因簇的解析,可以從基因和酶催化兩個層次理解鏈霉菌進(jìn)行抗生素生物合成的機(jī)制,進(jìn)而可以實現(xiàn)手霉素A和中尼霉素結(jié)構(gòu)的定向改造以及利用組合生物合成手段創(chuàng)制生物活性更高的手霉素類化合物,并且實現(xiàn)手霉素類化合物產(chǎn)生菌的分子育種、發(fā)酵工藝優(yōu)化,高效積累手霉素類目標(biāo)化合物。發(fā)明內(nèi)容
本發(fā)明目的在于提供一種手霉素類抗生素生物合成基因簇。
為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為
一種手霉素生物合成基因簇所述手霉素生物合成基因簇堿基序列如SEQ ID NO. 1所示,其中手霉素生物合成基因簇為手霉素A和中尼霉素的生物合成基因簇,
1)手霉素A和中尼霉素的生物合成的結(jié)構(gòu)基因編碼3-氨基-4-羥基-苯甲酸 (3,4-AHBA)合成酶的chiAl ;編碼3-氨基-4-羥基-苯甲酸(3,4_AHBA)羧基腺苷酰蛋白的chiA2 ;編碼醛裂合酶的chiA3 ;編碼3-羥丁酰輔酶A脫氫酶的chiBl ;編碼芳香胺N乙酰轉(zhuǎn)移酶的chiB2 ;編碼3-氧乙?;d體蛋白合成酶III的chiB3 ;編碼3-氧乙?;d體蛋白合成酶III的chiB4 ;編碼?;d體蛋白的chiB5 ;編碼硫酯酶的chiB6 ;編碼3-氧乙?;d體蛋白還原酶的chiB7 ;編碼?;撍傅腸hiB8 ;編碼?;撍傅腸hiB9 ;編碼 I/II型酮合成酶相關(guān)的?;d體蛋白的chiCl ;編碼3-氨基-4-羥基-苯甲酸(3,4-AHBA) 載體蛋白的chiC2 ;編碼3-氧乙?;d體蛋白合成酶II的chiC3 ;編碼酮合成酶的chiC4 ; 編碼甲基丙二酰輔酶A變位酶的chiC5 ;編碼硫酯酶的chiC6 ;編碼酰胺合成酶的chiDl ;編碼5-氨乙酰丙酸合成酶的chiD2 ;編碼5-氨乙酰丙酸輔酶A連接酶的chiD3 ;編碼氧化酶的chiEl ;編碼黃素還原酶的chiE2 ;編碼黃素依賴的單加氧酶的chiE3 ;編碼黃素依賴的氧化還原酶的chiE4 ;共25個基因;
2)手霉素A和中尼霉素的生物合成的調(diào)節(jié)基因編碼LuxR家族轉(zhuǎn)錄調(diào)節(jié)子的 chiRl ;編碼TetR家族轉(zhuǎn)錄調(diào)節(jié)子的chiR2 ;編碼調(diào)節(jié)蛋白的chiR3 ;共3個基因;
3)手霉素A和中尼霉素的生物合成的轉(zhuǎn)運基因編碼抗藥性轉(zhuǎn)運蛋白的chiMl ; 編碼分泌蛋白酶的chiM2 ;共2個基因。
所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突變菌株。所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突變菌株。
所述手霉素A生物合成基因簇用于其編碼蛋白催化合成手霉素A及其類似物。對所述手霉素A生物合成基因簇的基因進(jìn)行遺傳改造獲得的突變體經(jīng)生物發(fā)酵得到手霉素A 的結(jié)構(gòu)類似物。
所述中尼霉素生物合成基因簇用于其編碼蛋白催化合成中尼霉素及其類似物。對中尼霉素生物合成基因簇的基因進(jìn)行遺傳改造獲得的突變體經(jīng)生物發(fā)酵得到中尼霉素的結(jié)構(gòu)類似物。
本發(fā)明提供了產(chǎn)生手霉素A和中尼霉素生物合成基因被阻斷或加倍的微生物體內(nèi)的途徑。
本發(fā)明提供的核苷酸序列或部分核苷酸序列,可以利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的方法或包括本發(fā)明序列的DNA作為探針以Southern雜交等方法從其他生物體中得到與手霉素A或中尼霉素生物合成同源的基因。
包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于從海洋鏈霉菌Mi^ptomyces griseoaurantiacus M045的基因組文庫中定位更多的文庫質(zhì)粒, 這些文庫質(zhì)粒至少包含本發(fā)明中的部分序列,也包含鏈霉菌M045基因組中鄰近區(qū)域以前未克隆的DNA。
包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列可以被修飾或突變。途徑包括插入、置換或缺失,聚合酶鏈?zhǔn)椒磻?yīng),錯誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點特異性突變,不同序列的重新連接,序列的不同部分或與其他來源的同源序列進(jìn)行定向進(jìn)化,或通過紫外或化學(xué)試劑進(jìn)行誘變等。
包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通過合適的表達(dá)系統(tǒng),包括鏈霉菌、芽孢桿菌、假單胞菌、大腸桿菌、酵母、植物和動物等,進(jìn)行異源表達(dá)獲得相應(yīng)的酶或高活性的代謝產(chǎn)物。
手霉素A和中尼霉素生物合成的修飾基因、調(diào)節(jié)基因、膜蛋白相關(guān)基因的核苷酸序列提供了通過缺失或改造這些修飾基因、調(diào)節(jié)基因、轉(zhuǎn)運基因而得到手霉素A和中尼霉素結(jié)構(gòu)類似物,或者使手霉素A和中尼霉素類似物產(chǎn)量提高的途徑。
本發(fā)明所提供的氨基酸序列可以用來分離所需要的蛋白并可用于抗體的制備。
本發(fā)明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物學(xué)活性,或提高了產(chǎn)量或優(yōu)化了蛋白動力學(xué)特征或其他致力于得到的性質(zhì)。
本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在異源宿主中表達(dá)并通過DNA芯片技術(shù)了解它們在宿主代謝鏈中的功能。
本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通過遺傳重組來構(gòu)建重組載體以獲得新型生物合成途徑,也可以通過插入、置換、缺失或失活進(jìn)而獲得新型生物合成途徑。
本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通過中斷手霉素A或中尼霉素生物合成的一個或幾個步驟而得到新的手霉素或中尼霉素結(jié)構(gòu)類似物或前體。包含DNA片段或基因可以用來提高手霉素、中尼霉素或其衍生物的產(chǎn)量,本發(fā)明提供了在基因工程微生物中提高產(chǎn)量的途徑。
本發(fā)明所提供的聚酮合成酶可以通過缺失、插入或失活來自于相同或不同的聚酮合成酶系統(tǒng)的一個或多個聚酮合成酶結(jié)構(gòu)域、模塊或基因而產(chǎn)生新的聚酮化合物。本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用來構(gòu)建聚酮合成酶庫或聚酮合成酶衍生庫或組合庫。
本發(fā)明所提供的手霉素A骨架的后修飾基因提供了通過遺傳修飾得到類似物的途徑,所包含的催化從手霉素A到中尼霉素的氧化反應(yīng)可有其他應(yīng)用,包括進(jìn)行鹵素的取代。綜上,本發(fā)明所提供的包含手霉素A和中尼霉素生物合成相關(guān)的所有基因和蛋白信息可以幫助人們理解手霉素類天然產(chǎn)物的生物合成機(jī)制,為進(jìn)一步遺傳改造提供了材料和知識。本發(fā)明所提供的基因及其蛋白質(zhì)也可以用來尋找和發(fā)現(xiàn)可用于醫(yī)藥、工業(yè)或農(nóng)業(yè)的化合物或基因、蛋白。


圖1為本發(fā)明實施例提供的手霉素A、中尼霉素A、中尼霉素Kasukamycin的化學(xué)結(jié)構(gòu)。
圖2為本發(fā)明實施例提供的手霉素A和中尼霉素基因簇的結(jié)構(gòu)組成圖。
圖3為本發(fā)明實施例提供的構(gòu)建的基因敲除載體PHZ132D2。
圖4為本發(fā)明實施例提供的從鏈霉菌M045野生菌株及突變株基因組上擴(kuò)增硫鏈絲菌素的抗性基因tsr電泳圖(圖中M :Trans2K Plus II DNA Marker(TransGen Biotech) ;1 空白對照;w 野生菌株;a-e 轉(zhuǎn)化子;ρ :ρΗΖ132質(zhì)粒陽性對照。)。
圖5為本發(fā)明實施例提供的以tsr為探針,進(jìn)行總基因組DNA的酶切Southern Blot 分析圖(其中m ADNA/EcoR I+Hind III marker ;w 野生菌株;a_e 轉(zhuǎn)化子;ρ ρΗΖ 132質(zhì)粒陽性對照。)。
圖6為本發(fā)明實施例提供的HPLC分析鏈霉菌Μ045野生菌株(w)和突變菌株(a, b,c)代謝產(chǎn)物的變化圖(其中化合物1 中尼霉素A ;化合物2 中尼霉素B ;化合物3 手霉素A ;化合物4 中尼霉素Al ;化合物6 手霉素Al。)。
圖7為本發(fā)明實施例提供的中尼霉素A、中尼霉素B、手霉素A、中尼霉素Al、中尼霉素Bi、手霉素Al的化學(xué)結(jié)構(gòu)。
圖8為本發(fā)明實施例提供的5-氨乙酰丙酸合成酶(chiD2)和連接酶(chiD3)參與的C5N結(jié)構(gòu)單元合成的Siemin途徑。
具體實施方式
本發(fā)明中所述的手霉素A和中尼霉素的生物合成基因簇包含30個基因的核苷酸序列或互補(bǔ)序列(序列1),具體為(1)負(fù)責(zé)手霉素A和中尼霉素的生物合成的結(jié)構(gòu)基因共25個基因:chiAl, chiA2,chiA3,編碼蛋白負(fù)責(zé)中心結(jié)構(gòu)C7N的生物合成;chiBl, chiB2, chiB3, chiB4, chiB5, chiB6, chiB7, chiB8, chiB9, chiCl, chiC2, chiC3, chiC4, chiC5, chiC6,編碼蛋白負(fù)責(zé)兩個聚酮側(cè)鏈的生物合成;chiDl,chiD2, chiD3,編碼蛋白負(fù)責(zé)C5N結(jié)構(gòu)的生物合成;chiEl,chiE2,chiE3, chiE4,編碼氧化酶,負(fù)責(zé)手霉素A環(huán)氧結(jié)構(gòu)形成,以及氯的取代和基團(tuán)重排;( 負(fù)責(zé)手霉素A和中尼霉素的生物合成的調(diào)節(jié)基因chiRl,chiR2, chiR3,共3個基因;C3)負(fù)責(zé)手霉素A和中尼霉素的生物合成的轉(zhuǎn)運基因chiMl,chiM2,共 2個基因。
chiAl位于基因簇的核苷酸序列第23831-M949堿基處,長度1119堿基對,編碼 3-氨基-4-羥基-苯甲酸(3,4-AHBA)合成酶,372個氨基酸;
chiA2位于基因簇的核苷酸序列第2507546493堿基處,長度1419堿基對,編碼 3-氨基-4-羥基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白,472個氨基酸;
chiA3位于基因簇的核苷酸序列第14395-15195堿基處,長度801堿基對,編碼醛裂合酶,266個氨基酸;
chiBl位于基因簇的核苷酸序列第2^41-23734堿基處,長度894堿基對,編碼 3-羥丁酰輔酶A脫氫酶,297個氨基酸;
chiB2位于基因簇的核苷酸序列第21942-2^08堿基處,長度867堿基對,編碼芳香胺N乙酰轉(zhuǎn)移酶,288個氨基酸;
chiB3位于基因簇的核苷酸序列第20308-21357堿基處,長度1050堿基對,編碼 3-氧乙酰基載體蛋白合成酶III,349個氨基酸;
chiB4位于基因簇的核苷酸序列第18314-19336堿基處,長度1023堿基對,編碼 3-氧乙?;d體蛋白合成酶III,340個氨基酸;
chiB5位于基因簇的核苷酸序列第19409-19639堿基處,長度231堿基對,編碼酰基載體蛋白,76個氨基酸;
chiB6位于基因簇的核苷酸序列第21378-21935堿基處,長度558堿基對,編碼硫酯酶,185個氨基酸;
chiB7位于基因簇的核苷酸序列第2743848142堿基處,長度705堿基對,編碼 3-氧乙?;d體蛋白還原酶,234個氨基酸;
chiB8位于基因簇的核苷酸序列第沈490力6966堿基處,長度477堿基對,編碼?;撍?,158個氨基酸;
chiB9位于基因簇的核苷酸序列第26969-27421堿基處,長度453堿基對,編碼?;撍?,150個氨基酸;
chiCl位于基因簇的核苷酸序列第15248-155 堿基處,長度279堿基對,編碼I/ II型酮合成酶相關(guān)的?;d體蛋白,92個氨基酸;
chiC2位于基因簇的核苷酸序列第15523-15789堿基處,長度267堿基對,編碼 3-氨基-4-羥基-苯甲酸(3,4-AHBA)載體蛋白,88個氨基酸;
chiC3位于基因簇的核苷酸序列第15779-16969堿基處,長度1191堿基對,編碼 3-氧乙酰基載體蛋白合成酶II,396個氨基酸;
chiC4位于基因簇的核苷酸序列第16966-17853堿基處,長度888堿基對,編碼酮合成酶,295個氨基酸;
chiC5位于基因簇的核苷酸序列第85-222堿基處,長度138堿基對,編碼甲基丙二酰輔酶A變位酶,45個氨基酸;
chiC6位于基因簇的核苷酸序列第17850-18317堿基處,長度468堿基對,編碼硫酯酶,155個氨基酸;
chiDl位于基因簇的核苷酸序列第65四_8109堿基處,長度1581堿基對,編碼酰胺合成酶,5 個氨基酸;
chiD2位于基因簇的核苷酸序列第8114-9340堿基處,長度1227堿基對,編碼 5-氨乙酰丙酸合成酶,408個氨基酸;
chiD3位于基因簇的核苷酸序列第9452-10990堿基處,長度1539堿基對,編碼 5-氨乙酰丙酸輔酶A連接酶,512個氨基酸;
chiEl位于基因簇的核苷酸序列第5239-6423堿基處,長度1185堿基對,編碼氧化酶,394個氨基酸;
chiE2位于基因簇的核苷酸序列第19639-20196堿基處,長度558堿基對,編碼黃素還原酶,185個氨基酸;
chiE3位于基因簇的核苷酸序列第12173-11064堿基處,長度1110堿基對,編碼黃素依賴的單加氧酶,369個氨基酸;
chiE4位于基因簇的核苷酸序列第觀209力擬67堿基處,長度1059堿基對,編碼黃素依賴的氧化還原酶,352個氨基酸;
chiRl位于基因簇的核苷酸序列第3639-4331堿基處,長度693堿基對,編碼LuxR 家族轉(zhuǎn)錄調(diào)節(jié)子,230個氨基酸;
chiR2位于基因簇的核苷酸序列第4964-4377堿基處,長度588堿基對,編碼TetR 家族轉(zhuǎn)錄調(diào)節(jié)子,195個氨基酸;
chiR3位于基因簇的核苷酸序列第644-3439堿基處,長度2796堿基對,編碼調(diào)節(jié)蛋白,931個氨基酸;
chiMl位于基因簇的核苷酸序列第12510-14039堿基處,長度1530堿基對,編碼抗藥性轉(zhuǎn)運蛋白,509個氨基酸;
chiM2位于基因簇的核苷酸序列第四514_30914堿基處,長度1401堿基對,編碼分泌蛋白酶,466個氨基酸;
序列表SEQID No. 1 為
atgcggaaggccgccgagggcgaggacaacgtcctctatcccatgaaggaggcgctcgcc60
gcaggtgccacgatcggggaagtgtgtgacacattgcgggaagtgtggggaacgtaccgt120
ccaaacgatgtcttttgacgaggaaaatttctcgtaatgtcgcccgacgcacgggctcgg180
ggctcccgttgtgagaaacggcacggtccgagcccgtttagggccctcacgggaaccctt240
tccacggccttcgcggtcggccggcgggcacacctccggacgtcccggaatactccgcca300
CgCgCCgCCCggcgaaaggtagactcggccgaaaagttcgaacagttcgactccagggaa360
tggggaattgccgagtaatgcccactgccggaatgaccgcctcaaacgaccgaattcagc420
cattgtttatccctgaattggttcatctttcaagagtctctcgctgtcgtccctgacgcg480
cggccgtccaggccgctccctgccaccgcgcgctccctctccccacagtccatgtcgtcg540
cgccatgccaggagtactcatgctcagccaggaccagcgttccggggtcgcagtgccgcg600
cccggacgatccgcagcccgtacggttccgggtactggggccgctcgccgtccagggcag660
ggacggccgggccatcccggtgcccgggacgaagcagcgggcggtgctcggttatctgct720
gctgcaccccaaccaggtcgtcgccaccagCCggCtggtCgacgccctgtggccgggcag780
aaagcccgtcaccgcccggaagatggtgcagaacgccgtctccgcgctccgtaccgcact840
CgCCCggggCaacgggccggacgacgaggtggtcctgctgacccacgcgcccggctatct900
gctgcgcgtcgaccccgagctgatcgacctgcaccgctccCggCggCtggccgagcaggg960
acggcgcgaaCtggCCgCCggctcgccggcCgCCgCggCCgagtccttccgccaggcgct1020
ggcgcagtggaacggcgcggtcctcgcggatctcgtggaggccggggcctcctggccgga1080
actcgccgcgatgtccgaggagcgccaggcgatccgtgaggaccgcgccgacgccgaact1140
gcgctgcggccggcaccagacggtgctcggcgagttacgtctcctcgccgaggctgaccc1200
gctgaacgagCggCtgtgCgcactcctcatgctcgcgctgcaccgcaacggcaaacccgt1260
cgaggccctggagctctaccggcgccaacgggacctgatcgccgagaggttcgacagcga1320
gcccacccgggaactgcgggacctcgagcgggcggtgcgcacccgggacccggccatcga1380
cccgcccgcaccggcgcagacggtcccgcccctcgccccgcccgaggaggtcgccgcgga1440
cctcgcggcggaccggtcggCgCCCCCggCggcgacccgcgccgtgttccgcccgccgcc1500
CggtgCgCCCccctcggcgctggtcaccgaggccctcccgtcggcccccgtgctcgccac1560
gcccaccggggaggacgccccgccggggcaCgCggCgggggaacgcaaacggctgagcgc1620
cgtcctggtgcgggtcgagcCgCCggCCgCCgtCgggggCgacgacgcggaggccttcga1680
catccgcttccgcgaggtgtCggCCgtggtcgcggaggaggccgcgcggtacggcggaac1740
CgtggCCggCcggatcggctccacgctgctgatgctcttcggggtgttccgcagccgggt1800
ggacgacgcgctgcgcgccgtgcgcgccgggcacgcggtgcacgaccggctgctgcggct1860
cgccctgcccctcggcgtcgtacccggggcgggacgggtgcgggtggcggtgtcgaccgg1920
ggacgcgctggtccggttcaccgaggcgggccaggacgccgcgcccatggtcgtcggcgc1980
cctgctcgaccagtgcctgcgccagctggagtccgccgagccgggccacatcaaactgtg2040
cgacgccaccCgCCgggCCgCCCggCtggtcaccgccgggctcggcgacccgctggacag2100
cggctcggcctccgccgccgtggcggccctcggccggtccCCggCCgCgCcgggtgcgag2160
ggccccgctggtggaacgcgaggccgaactggacgtgctgaccgccctgttcaaccaggc2220
ggtgcgcaccggcaggccgcaccagatcagcgtgctcggcgaacccggcgtgggcaagac2280
caggctggtccaggagttcgCCCggCtggtgggtgcgcgcgcggaggacgcgcacctgct2340
gcggctgcggatgcccgtcctcggccgccccaccggccggaccgcgctcggggaactggt2400
cggcctgtgcgcgggtctgcac ccggcggacccgccgcacaccgtcgacgacaagctctc2460
ggcggcgctgcggcgctggctcggcccgcgggtggtggaccgcgagacggtcctcggcca2520
tctgcgcgccctggtcgccccggcgcacacCggCggCgtCctcgacggcgaggcggtcgc2580
cgcctgccggcggatgctggaggcgctcgcggcggagcggcccctggtgctcgtcctgga2640
ggacctgcacctcgcggacgacggggtgctggacttcgtcgacggcctggccgagtcctc2700
ggcccggatcccgctgctggtcgtcaccaccgcgcgtcccgacctgatcgaacgccggcc2760
cacctggggcggcgggggctaccgcacgacgagcaccatgcacctggaacccctgagcca2820
ggacgcctcggcgcgcctggtgagccggttgtgggaacagtggggcgtgcggcgcaccct2880
cgaccggtccgacctcacctcggtgacgggcggcattccgctcttcgtcgtggagtacgc2940
cgccctgttcgggcggccctcgccggcggagcgggcggaggtctgcggcgcgtggccgga3000
gcatctgcccgagcgggtcagggcggtggtgaccgagcacatcgacgccctgcgcccgca3060
ggccaaggcggtgctgcgggacgcctcggtccaggggccccggttctggtcggaggccgt3120
CgCggCCgtgggcgggcgggaggtggccgagtgcgagcggtggctcgcccatctcgaacg3180
ccgccacttcctggtccgggccgaccgcagctccatcccgggctcggacgagtacgtctt3240
ccgcagcgcctgggtgcgcgaggtgacccggctgtcggtgctgcagcccgcccgccggga3300
ggggcggcggcgggcggacgcctggctcgcggagcgggcggcggggatccggtgactgtc3360
cagtggaccgggagtggaactgtgcctctaCggtCCgggCcgggtcgctgacatgcttct3420
CCCggggCCggagagagcactggtccccggggagacccgagggcacgcgcgtgacacggc3480
gcaccgccaccggctccgggacagatccgcaacgcaccaccagatgggtccagttcgtat3540
tagggggatgaccgatgtcgtacgttcagacgcaacccgcctcacccaccgcgcccaccg3600
ctctgacggcCgCCCggCCggtgctcacggtcctgccgaacgaggtcgcgCgCCgggggg3660
tccgcagcctgctcgacggtcccggccacggacgcgccgtggtggcctgccccgctcccg3720
aggaggccgcggccctgctgcgcgccgagcggttcggcctgctgatcgtctcggccgcct3780
acggcgaggcgcgcctggccgaactggtcggggagagttcccggtcggacgtgaagtcgc3840
tgctgctgctggacagcgcggagcccgagtacattccgtggatcgccgccatcccgttcg3900
acggctatgtgatgcaggaggacctgacgccggattcgatggcggaggcactgcggcgtc3960
tggagcggggcaagctgccgatacccgacacgctcgcccggctcttcatccggcacgccg4020
gccgcagccggggcacgcaccgcagcccccgggtccagctcacgccgagggagcaggcgg4080
tcctcgggctcatcgcggaggggctgagcaaccggatgatcgcgcaccggttcggcatct4140
cggagcacggggtgaagcgccacgtggccaacctgctggccaagttcaactgctccaacc4200
gtgcccaggcggtctcggtggcactgcagcagggactgctggcctgacgtCCCCgCgCCg4260
gcgcccctccCCCgggCCgttcccggtggggatcagtccgtcgaggacagggcgtgccac4320
gcgccctcggccatggcggcggcctcgaccggttccggtgccagcagccagtggcgcagg4380
acgccgatgaaggcgccggccgcgcagtgcgcccgcagcgCggtgCCggCgccgttccgc4440
ggcccggccggggaggcggtgagetgccgcgccacctcctcggcgaccagttgctgcagc4500
cggttcaggaaccgggcggagccgcaggggcccagcatgcgccggtagagcacgagttgg4560
gactccacgtgccggaagacgtcggcgaaggccggcggtgtcctgaccgggccgtccacc4620
agggggcagcgggcgagcaccgccaccagcgcggtcagctcgtcctccatggcgtccagc4680
agcagcgcgtcccggtcgctgtagtgctggtagacggtggcgcggttcaccgtcgcccgt4740
tcggccacgtgggccacggtgatgcccgacagctcgcgctcggcggccagttcgagtgcc4800
gccgaccgcagcagcgcccgggtccgcagcacccgcggatcgacgcgcttggcgccgtgg4860
tctgtcgtcgtgtcgggcattcgcccagattacacctgtacccaacaggtgtcgcagagt4920
gatccggccgggccgaggggCggtgCCCggCCggCCgCgCCCgCCCggtggtccggggcg4980
gccggacgggCgCCgCCgggCgggCgCCCCgaacggcccgcccggacgggtctgggcgcc5040
cggcgggggcttcgtgaggatggccgaccagtgacggccacacaacggaggaacccgatg5100
accgcaagcgatcggaacccagtcggcggcCCCggggCCgaggtggacgtgtgcgtgacc5160
ggcggcggctcgaccgcgctcctcgcggcgctgctctgcgCgCgggCCggccgctcggtg5220
ctgctcgtggcccccgaggcggagttcgagCCggCCggCgcgggcatctcccccctggtg5280
gccccgccgaccctcggcctgctcgccggggagggcgtcgaggaggaactgctgggggcc5340
ggtcagcgcatcctcggcgccgacgaccacgggcgggacgggctcctctcCCgCtggCgg5400
tactacgacctccccggcatcgcccgcccctacgggctgacggtgccgaccggcacgctg5460
gtgcaggcgctgctcgcccggctgcgcgccgaaccgtccgcgaccgtgcgcaccggccgt5520
cgggtgaccgccctcggccaggacgaggacggtgtcctcctcaccttcgccgacaccacc5580
gcaggcaccaccggtgacggtgccgggggcggggccgaggaacgggtgagggcacggtac5640
gcggtcgccgcggacggccggcactccccgctgcgcgacctgagcggcatcaccgtccgc5700
gacacaccgttcgggcgtccgggctggctggtggccgcgccggtcgtgccgaggcgcgag5760
cccgtgctgctcgtgcggcaCCCggCCCCgcaggcgctgttcaccgtgcccacgccgggc5820
gactcgatggccgtcgtgtggtgccccgaccgggagcagggcgaggctctcgggcaggcg5880
gacccggaggtgttcgccgggcagatcaagacggtcgaccccgagctcgccgactggctc5940
ggcgaggtccgcgaccgcacctccccggtgttccggatcgacttcgcgatgtggcaggcc600010
gcgtcctggcgccggggccgggtgctgctgctcggcgagtccgcgcacgggatgcacacg6060
ctcggcgggcagggactcaaccagtccctgcacagcgccgcctcgctggcCCgCgCggtg6120
gacgaggcgctcgcgcacaaggaccccacgcgggtggaggcgtacgagcggatccgccgg6180
ccgcacgtggagcggctgcaggaactgcagtggaacacccCggCgCtgCgctcctacgag6240
gccgagccgcctcggcgcggcgcccaccaggacttcgtcgaggtgatgacgacgctgcag6300
ccggagctcgccgagcagctCggtgCCggCgcccgctgaggacgccgtcaccccacgcac6360
ccgcaccgccgaggcgaccggctcgcccggctcgtccacgcccccgcaccactcaccgca6420
gcacgcatcgaatcgaggtcgaccatggctctaccggacggctggtgggcaccgcacgac6480
ggttatgtcgcgcgggtactgtccgcgctgaccgcccagccggatcgcatcgccgtgcac6540
tggcggcaacaggccctgaccggaggcgagttcgccgcctCggtCgCCgtgacggccgcg6600
cgactgcgggagctgggcgcCgggCCgggCgccgtggtgggcgtcctgaccgcgtccaac6660
agtcccgacatgctgcgggtccgctacgcggcccacctgctgggcgcggccgtctgccac6720
gtgcggtccaccaaccccggcacctccgggccggcactgcccgtcggggaacagctccgc6780
atcctcctcgacacccgggtCCgggtgCtgttcaccgacgcggagaacgcCggCCgCgCC6840
cgggaactcgccgagcgcgcCCggggCCgtgtcgccctcgccgaggccggtgccccgggg6900
gacgtgcgggagccggccgcCgtgCCgtggcgaccgcgcgCCCtggCggtgatcgggttc6960
accagcggcagcaccggccgtcccaaggggatcaggctgtCggCggCggCctgggacaac7020
ctcgtggaggtgaccgggcaggccttcaccggcgaggcggggacggccgcccggctgctg7080
gtgacgaccccgctgagccataccgtggccaccatggcggacgccgtgctggccggcggt7140
ggcaccgtcgtcctgcacgaggagttcgcgccggagcccgtcctgcgggcactgaccggg7200
caccggatcagccacaccttcatggccaccgcgcagctgtaccagctgctcgaccacgcg7260
ccgctgcgggaggccgacctgtccgcgctgcgccagctcatctacaccggcagcgccgcc7320
gcgcccgcccgtgtcgccgaggccgtccgtctgctcgggcCggtgCtggtgcagggctac7380
gggaccagcgagagcggccggatcaccctgctgcaccccggcgaccaccaggatcccggg7440
ctgcactccaCCgtgggCCgcccgttccccgagaacgagatcgccgtccacgaccccgag7500
accgaggaggagctccccccgggcgcgacgggcgaggtgtgggtgcgctccccgcacctg7560
atggacggctactgggccgacccggcgctgagcatgcgcacgctgcgccggggctggtac7620
cggaccggcgacctcggccggatcgacgagCggggCtgCCtgtccctgctcggccggatc7680
gcggacgtggtcaagacggacggggtgctggtccatccggcggtcgtcgagcggcggatc7740
ctcacgctccccggcatcgcgcaggccgccgtcttcgcggtgcgcgacccggatctcgtc7800
gagcacctcaaggccgccgtCgtgCCCCggCCgggtgCgCggatcgaggccgaggacgtg7860
cgggcgcacctcgccgcgggcctcggcgccgggcacgtgcccgaggaggtcctgatcctc7920
gacgcgctgccgctgaacgccgggggcaagccggacaagcgccggctccgtctcgcctgg7980
cacggcaccacccattcgaacacccccgtacgagaggtgagttgacgccatgaaccgact8040
cctggaccacttcgccggtgaactggaggccctcggcgggcagcgcagggacttcctgga8100
gatcggccgcCgCgCCggCCgcttccccagtgctctcgcccggctgcaggacgccccctc8160
cgacgtggagatcagcgtctggtgcagcaacgactacctcggcatgggccagcacccctc8220
ggtgctggaggcggccaagaacgccgtcgacgccttcggcgccggctcgggcggctcccg8280
caacatcggcggcacgaacttctaccacgtgctgctcgaacaggaactggccgagctgca8340
cggcaaggag gcggcgctggtcttctcctccggttacacggccaacgacggggcgctgac8400
ggtgctcgcg ggccgggcgccgggcacgctggtcttctccgacgcgctgaaccacgcctc8460
gatcatcgac ggactgcggcacagcggcgccgagaagcgcatcttccgccacaacgacgt8520
cgcccacctg cgggagctgctggccgccgccgatcccgagcggcccaagctgatcgtgct8580
ggagtcggtg tactcgatgtccggggacgtggcgccgctcgccgagttcgcggacctggc8640
ggaggagttc cacgcggccacgttcgtcgacgaggtgcacgcggtgggcatgtacggccc8700
gcagggcgcc ggcatcgccgcccgggagggcatcgccgaccggttcaccgtgttcatggg8760
cacgctcgcg aagggattcggcacggcgggcgggtacatcgccggtccggccgacctggt8820
ggacgcggtg cgcgccctgtCCCggCCgttcatcttcaccacctcgctcccgccggccac8880
cgcggccagc gcgctggcggcggtgcagcacctgcgctcctcggaggcggagcgggaccg8940
gctcgcggcc aacgccgggctgctgcaccggctgctgggcgagcggcggatcccgttcgt9000
ctcggacgag tcgcacatcgtgtcggtgttcgtcggggacgacgcgcagtgccgccgggc9060
ctcggcgatcctgctggagcggcacggcatctacgtgcagccgatcaacgcgcccagcgt9120
CCgggCgggCgaggagatcctgcgggtggcgccctccgcgacgcacaccctcggtgacgt9180
ggagaagttcgccgaggctctggacggcatctggcaggaactgggcatccCgCgCggCgg9240
ggtccgcggcgcctgaccccCggCgggCCCgcgcgtccgtgccgggcgcgCggCgCCCgC9300
CCCgtCCCgtcccggcaccctcgcccggaggcgcatgaccggccgggcggaacggagttg9360
atgacccatgtccctctcgctggccgccgtgctcgccgagCCggCCgCCCgacgcccgga9420
ccacccggcgatcgtcttcgacgggcaggaggtgtcgtacgcccggctgtggcaccgggc9480
gcggagctacgcggccgtgctcggtgagcggggggtccggcccggtgaccgggtggccct9540
cctgctgtccaacacaccgcacttcgccatggcctacttcggtgccctcgCggCCggtgC9600
CgtCgtggtgccggtgcacgcgctgctgaaggcggaggagatcgcctacgtgctgcgcga9660
cagcggggccCgCCtgCtggtctgcgggggcgccttcctcggcgagggcgccaaggcggc9720
cgagatggcgggcgtcgaggtgctgaccgtcctcgccccgggggagccggCggCgCgCCg9780
cctcgacctcctggccgagcggtccgcgccggtggagacgtacctgccgcgcgcccccgc9840
cgacgcggccgtcgtcctgtacacctccggtaccacgggccggcccaagggcgcggtgct9900
cacgcatctgaacctcacgatgaacatcggcgtcacgatgctctcccccttcgacttcca9960
cgccggggacgtgctgctctgcccgctgccgctgttccacaccttcgggcagatctgcgg10020
catgggggtgtgcttccgggcgggggcgacgatggtgctgatgccctccttcgacgcgga10080
ggaggccctcgagctgatgtgccgtcacccCCgCgCggtgttcatgggcgtccccaccat10140
gtacctggcgctgctcgacgCCgCCCgCgCgcggcgggcgCCCggCCggCcgctcctcgc10200
ccgcgcctactccggggggtCCgCgCtgCCggtgaaggtgctggaggaggtcgaggaggt10260
cttcgactgcccggtgtacgagggttacggcctgacggagacctcgccggtggtcgccta10320
caaccagccgggcctgccccggcgtcccggcaccgtgggcCtgCCggtgtggggcgtccg10380
ggtggccgtcaccgcggccgacacggcggaggtcgtcccgCtgCCgCCCggcgaggtggg10440
cgaggtcgtcgtgcgcgggcacaacgtgatggccgggtacCtgggCCgCCccgaggccac10500
cgccgaggtgctggtggacggctggttccgcaccggcgacCtgggCgtCCtggacgagga10560
gggccggctgaccctggtggaccgcaagaaggacatggtggtgcggggcgggtacaacgt10620
gtatccgcgcgagatcgaggaggtgctgtcccggcatccggcgatcgcgcaggtcgcggt10680
gatcggcgtgccccacccccgttacggcgaggaggtgtgcgcggtggtgcgcaccccgcc10740
cggcacggacggcaccgcgcggctcggtgccgagatcgtggcgtggagcagggaacggct10800
ggccggccacaagtacccgcggcgcgtggagttcgtggactccttcccgctgggtccgag10860
cgggaaggtgctcaagcgggagctcgcggcCCggttCgCggcgtagggcgtacggcggcg10920
ggcgctgcccggcatccctcggggtgccgggcagcgcccgtcgtggtgtggtccgcgggt10980
cacctgccggagagggcgcgggcgaggtccgccgtccaggtgtaggagtcggtgacgccc11040
ttgagggagccgttgaaccggggggcgacgaagcgggcgaggagttcgaggctgcgatgg11100
gtggcctcgcggtccgcccagtccatcacgttgaccagcaggcgcccgaagccgccggtc11160
tcctgctgcacgtcccggatggcctcggtgacctcgtcgacggagccgacgagggtgccg11220
cgctgctcgatcagttcctccagcagcgcgCgggCCtCggcgcgtgaggcgacgggcggg11280
gtgccgagcagggcccagtaCtCgttgCggtaccgggtccagccgtcgacgatctcgtcc11340
agggcccggtcccggctctccgacacgtgcacggtcagcgcgacccgccactcggcccgg11400
tccagtttgtggccgtgctcggcggcggactcctcggcgtgctgccactggccgacgagg11460
tcgccgatccggctgcccggCttCggCgggatgccgaaggacagcggggcgatgccgtac11520
tggccggccagccgcatgccgaacggggagacggcgctggagaccgccatcggcagtccg11580
gccggggtgctcggccgcaggtgcagccgcgcgtcgcgcagccggaaccagtcggtctcc11640
cgggtgacggggccctccccggcgaccagttggcggatgacgtccagggaCtCggCggtg11700
CggCgCCgggtgtccgccgggtcgatgccgaggaagtgcatgtcggtggggatggagccg11760
gccccgacgccgagggtgaaCCggCCgCgggtgaggtggtcgagctggagggcgcgcgtg11820
gccaccatgaaggggtggtggtagggcaggctcaccacgccggtgccgaggcggatgtgc11880
CgggtgCgCtCggCggCggtggcgaggaacagctcgggcgaaccgacggtcccccagccg11940
gccgagtggtgttcacccacccacagttcctcgtagccgagccggtcgagccactcggcg12000
agttccagatcccgccacaggctcagggcggggtcctcgcccagcgggtgcaggggcgac12060
aagaaggctccgaagctcatccggtccatggggctcctcactcacggaagtcgtggcgct12120
cgtgacggtcgtgccgagtctgtcgccgggggcccgggctttcgccccccgaacggaccg12180
gtccttccacggccccgaacaccgtggccgaacgcggtggccggacgcggcccgccgtac12240
gggcaccccggccgggcaccCCggCCgggCaccctccggcggccctacccgacacatgtt12300
gccaatccaacatatgttgtggaacgctgagcgtcatcgttcgtgacccactgcacaccg12360
gcaaccccgtgcgcggccggctcacgcgcccctgtccgtacccgcgacaagagaaagaga12420
ccgacgtgacgacccagcaggaacggaccccggcggaggagtccgaacgcatcggtcccg12480
atctgtggtggctcgccgccatcatggccttcggcagcttcgccgggctcctcgacgcca12540
ccatcaccaatgtcgccatcggtccgctggcctcggccttcgacgccgagatcgccaccg12600
tgcagtgggtggtgacgggctatctgctggccatcaccgccacgctcccgctcggcgcct12660
gggcgatggcCCggttCggggcccgcgagacactgctcttctcccaggcggtgttcctcc12720
tcggttccctgctctcggggCtggCCtgggacgcccccagcctgatcggcttccgggtgc12780
tccagggcatCggCggCggCctcgccctccccgtcggccaggccctcatcgcccaggcgg12840
CCgggCCCCgccgcctcaccaagctgatgtccctggtcacCgtgCCCgCCctgttcgccc12900
CgCtggtCggcccctcgctcggcggtgtgctggtcgaccacgcgagctggcggtggatct12960
tcctgatcaaCgtgCCgttCtgcctggccaccatcggcctgatcctgtggcgggtgcgca13020
acgtcatcgccccgacgaaggacgccgtcctggacaccctCggCCtggtgctgctcgttc13080
ccgccctcgccgggctgatctacgggttctccgaggccggCgCggCCggCgggttcaccg13140
ggacgcgcgccctcgcgggcCtgggCgCCggggtcgtgctcggcaccgccttcgtcgcgc13200
acgccctgcgccggcgcagcgaggccgtcctcgacctgcggctgttccgcgtacgggact13260
tcgcggccgggaacctggccagcatggtcatggccgtcgcgatgtacggcgtcctcatcc13320
cgctcccgctgtacttccaggtcgtccagggcaccagcgtgctggagtccgccctgatgc13380
tgctcccccagagcctcggctacctcgtcgcggtgtccctgctgcagcggctgaccgtgg13440
ccctcggcgtgcgcaccgtcaccctggccggtgtcgtcctCgtCggCgtgggcacgctgc13500
cctacgtcgtcatcgacgccgatccgagccgcttcctgctgggcgcggcgctggtggtgc13560
ggggtctggggctcggcgcctcgatgatgccgacgatgacggccgccttcagcagcgtgc13620
ccaaggaggtggtgccccgcgccaccagtgccttccacgtcttccagcgcatcggtgcct13680
cgctgggcacggccgtgctcacggtggtgctccagaacgaggccctgcgtcatctgcccg13740
aggaggtgccgggcctggccgccgtcgcgcccggcagtgccgtcgcccacgggctggcct13800
cgtccttccgggcgccgttctggtgggcgctggccttcacggcgctcgcgCtggtgCCgg13860
ccttcttcctgccgggccgcCgCCCggCCtccgctgccgacgaggccgacggggccgcgg13920
CgCgtCCggggacggcacccgtgctgtccgagtagccgccggtcccgtcgcacccgtcgg13980
ctccggctccgcggagccccgggccacggcaacccccgcggttcctccgcatcacccctc14040
acgcgccccgcgcggacgacgcagcacgcgtcctccgcgcggggcgcctcgcgtgcacgc14100
ccggcaccggaccgcctcacggctccgcctcccccaccgccctgcccgacCgggCCCCCt14160
cgcgctgcctgtccggccacctcctcgggcgtgctcccgttgcccctgccggagggccac14220
cccgttcgaggattccgcgcCCggCCCgCCcgccacagactcggatcaccaacagccgac14280
gcctgtgcgggcggacagggggaatggacgatggtggcactcgacaccggggcggcggtc14340
CgCCtggCCCggttgtcacggcaccgggacggacgcttcctcttcgtgcccatggaccac14400
tcggtggccgacgggccgatCgttCCggCCtcgcgcttcaacgacctggtcgcctccgtg14460
gtcgcgggcggcgccgacgcgatcgtggtgcacaagggccgggcccgcacggtcgacccg14520
gccctgctgcgcgactgcgcgctgatcgtgcacctgagcgccagtaccccgcactccccc14580
gacgccgacgccaaggtgctggtcggcgcggtggaggaggcggtgcgtctcggcgccgac14640
gcggtcagcgtgcacgtgaacatgggctccgacaccgaggcccgccagctcgccgacctc14700
ggcacggtggccgaggcctgccagcagtggtcggtgccgctgctggccatggtctacccg14760
cgcgggccccggatcgccgacccgcacgacccggcgctcctcgcccacgcggtcaacgtg14820
gcggccgacctgggcgccacgctggtgaagaccacctcaccgctgcccctgtcggagctg14880
tccgcggtcaccgcgagctgcccgatcccggtcctggtggCCggCggCggcgaccaggac14940
ggtgacctcaccgccttcgccaccgccgccgtggagtcggggtgcgcgggactggccgtc15000
ggccgccgggtgtttctcagcccctccccgaccgccgccctcaaggccctggcctccgtg15060
gtgcacgccgacccgccggtggggccactcggcgtcgacgccgccgtctgacgtcccgtc15120
tcccggcggaaaccgcagcccacccgcgtcggaaggaagacacatgcgcgacgagatccg15180
cgagttcgtcctcaccaccatccgtgaggtgatgaacctgccgctgtccgagaacgtcac15240
ggacgacaccccgctcggcgagaacggcctcggcctggaatcgctgtcccggctggaact15300
catgatccagctcgagagcgcctacggcatcgaggtccccgaggcggacagcgacgccca15360
gcaggacgcgaccctcggcgagttcgtggaCgCCgtggtggccctgcgcggcacggcggt15420
cgccgacggagccggccggtgacggacgacaccgccctcggcgcgctgctgcgcgactgc15480
gggctgctgaccaccgactccttcgacgacgacaccgaactcgtcctcgactcgctcacc15540
ctcgtctggctcgcccacctcctcgaggaacagcacggcatcaccgtgtccgtcgaggac15600
gagaacggcctggcctcctgCgCCtCggtgcgggacctgcgccggttcctcgccgaggcg15660
gcggagggcacccacacctctgcggagatccttcatggctcatgacgtcgcgatcaccgg15720
ccacggggtcctcaccgcgttcggcttcggtgaacaggccctgctggacggggtgttcgg15780
gggccggcccggcttcaccccggtcacccgcttcgaccccacgccctaccgggccgggca15840
tgccgccacctacgagggcgagggccccgagatccccggggtgccggtcaaacccggggt15900
gacaccgggacagttcgaggtcctggtcgcCtgCgCCgCCgccgcgctggagatggccgg15960
cacggacggcgccggcgcccCggtgCtgCtcggcaccaacggcgaccactccgccgcccc16020
ggacttctggtcgggcaccggcgcgcgcaccgccgccgacccccgcaccctcgacagcct16080
ccccgcccgcctgcccgagctgctcgcccgcgaactgggtctgggggcgccccggacggc16140
cttcgtgaacgcctgcgtggccggcaccaacgccctcgccCggggCgCggaactgatccg16200
ccgcggcctcgccgacacggtggtgtgcgggggcgcctacctggtcaccgaggacgtgtt16260
cgccaagttcgactccgggcgtgcgctgtcccccgaggacgccgtgcgccccttcgacgc16320
cggccgccaggggctgctgcacggcgacggggtcgccgtcCtggtgCtggaggccgccga16380
ccgggcacgggcccgcggcgcccgcgtcctcgccgggctcaccggctggggcatggcggc16440
cgacgcccaccacgtcatccagccgcatccgcggggggacggactggcccgggcggcccg16500
CgCCgCgCtgCgCCgggCgggcgcggagcccgggcggatcggctacgtcaacgcgcacgg16560
caccggcaccccgctcaacgacgtggcggagaccgcggcgctgcaccaggtgttcggcga16620
gggcgtccacggcgttccggtgagctccaccaagagcagcaccggtcacatgctcgaggc16680
caccggggcggtggaggccgtcatcacgatgctcgccctgcgcgagggcctgttgccgcc16740
caccctcggcaccctggagcccgaccccgcgtgcgacctggaccacgtgcgggacaccgc16800
CCggCCggCCcggatcacccacgcgctgtccctgaacgccgccttcggcggggtggacgc16860
cgcactcgtactggaggcgccgtgaccgtcccggacacccacccgcgcacccatcggacg16920
gcaggcccgtCCgCCCCggCgcgcgccctcctctcggcggcctgccgcacCCCCtggggC16980
ggcgcggcgaCCgggCtgCCcggcgcggcaccggtcgaactgccccgcgtcaccggcttc17040
gtgacctcccgcttcagccccctcgtgcacagcgtggccaccgagtgcctgggcgcgccc17100
ggctccgcggacgacctcgtCggCgCggCCgggccgcgtaccgggacggtcctggccacg17160
atgttcggggacacggtgacgctggacacggccacccggcggctgaccgagggccaggtg17220
cacagcccgctgctgttcttccagtccgtcaccacctcgatcctcggccggctgggccag17280
tcgtacggcatcaccggccccgtcgagtgcctctcggtcgcccgcgacggagccggcgag17340
gccctctcggccgccgatctgatgctggagcaggaggacatcgaccgcgtgctgctggtc17400
ggcgtcgagctcgccgccaatgagcgggccacctggatccaccggcgcatcaccgggccg17460
gacggtccggacccgctgcccgacggggactgcgccgtcgccctgctgctcgcccgcacg17520
gacgagggcaCCgggCgggtgctcctgcgcgccggcgcggggagcggttccccggcggac17580
CgggCCCCggcggacgcccgccactcccgcttcggctggctggcgcccctggtggcggcc17640
gccgaggccgtgcgcccgccggagggcgggCCCgtgCCgCgcccggtccgtgtgccgggc17700
cggtacggctacgtggtcgccccggcggacCgggCCgCggCgCCCgCCgCtccgggaggt17760
ccggcatgacggccgccgaatccgcccccggcacgctggtggcgcgcatgggcatcgaga17820
tcgtcgaggaggacccccggCggCtCgtCgcccggatgcccctgacggggaaccgccaga17880
tgtacggcttcctgcacggaggggccagcgcggccttcgcgcaggcgctcgccacgcacg17940
CCgCCgCCCtggaggccggcCCCggCggCCgggtcaccggccaggagctgtcctgcaccc18000
accaccgggcggcccgcggcgagggctgggtggaaggggtgtgcaccccgctgtacctcg18060
gcgacgcgttcggcacctacgacgtggccgtccacgaccggcgcggcaaccggatcgcct18120
CggCCCggCtcacctgccggCtgCggCgggCCgCCggCCCgtccgctcgccccgcgccca18180
ccggggagtccgcactttccagggagcccgcactttccgaggagtccgcatgagcacgac18240
cgagcccgtggaggacagggccgcggtactggccggcgtcgggggctgggtgcccccgca18300
cgtcgtcaccaacgacgacctctccgcccatctcgacacctccgacgaatggatccgcac18360
ccgcaccggcatccggaccaggcaccgggtctcccccggcatggccacctccgacctcgc18420
ggtggaggccggacggcgggcgctggactcctccggcgacgaccgggccggggccgtcgt18480
cctggccaccacgacacccgaccggatctgcccggccaccgcccccgacgtggccgcccg18540
gctcggcctggccggggtccccgccttcgacgtctccgccgtgtgcaccggcttcctgta18600
CgggCtggCgaccgcggcggggctgatcgccaccggcgtcgccgaacgcgtcctgctcat18660
cggggcggacgcgttcaccaccatcgtcgacccgacggaccgctcgaccgccgtcatctt18720
cgccgacggcgcgggggccgtcgtcctgcgggccggccggccggaggagcCCggCgCgCt18780
CggCCCggtggtgctgggcaccgacgggaccctcagccatctgatccgggtaccggcggg18840
CggCtCgCggcagcgctcgctggcccccacgcacgcgccgggcgagcagttcttccagat18900
ggagggccgggacacgttccggcacgccgtggaccggatggcgaccgcctcgcgccaggc18960
CgtCgCggCCgcgggctggtcgatggggggcgtcgaccggCtggCCgCgCaccaggccaa19020
cgcgcggatcctgcacgcggtggccgaccggctcggcatccccgccgagcaccagctctc19080
caacatcgccgaggtcggcaacacgggcgccgcctccatcccgctgctgctggcccagtc19140
cgccgcggacggcggcctggaggccgggcaccgcaccctgctcaccgccttcggcggcgg19200
tctcgcctggggcgcgaccacgctcacctggcccaagctgtcggccggctgagagcgccg19260
gccgccccgcgccacgccatccacctcccccacggagactcgtacccaaggagacgaccc19320
gaccatgttcacagcactgcgtgacatcctCgtCggCCCgttcaaggtcgatccggagaa19380
ggtcacccccgaggcgaccctggagcagctcggcctcgactcgctgtccgtcgtcgaact19440
ctcgctgatcctggagaaggacctcggagtgagcgtcaccgacgacgagttgctgcagac19500
cccgacgatcggcgccatggccgagctgatcggcgagcgcggcgccccggtctgatgccc19560
acctcgacgagcccgagcggccatgcccccgcggtccggcgggaggcgagcgacggcgag19620
gcctaccgccgcgcgatgggacggttccccaccggggtcgccatcctgacgcaggggtgc19680
ggaccgctgaCCCgggCggtgaccgtcaactcggtcacctccgtgtccctggacccgcaa19740
CtgCtgtCggtctgcctcggcgaggacagcacggtcctcgaaccgctgctgcgggccggg19800
cacttcaccgtgaacctgctgtccagcgcgcaacgcgagtCCtgCgCgCgcttcgccggc19860
cggagccggccgaccggggccgacgcccacgaggaactcggcgggagccggggggacaac19920
ggctgcctggtcgtcgagggCgCgCtggCCgccctggagtgccgggtcgacggcacggta19980
CgggCCggCgaccacgtcatCgtCCtgggCcgggtcgagacgctgcaccaCggtCCggCC20040
gaggcggagccgctggtcttctacggcggcggctaccgctggctggccccgcccgccccc20100
ggcccgcgctgacccggacactcccgcccgtcccccaccacgccaccaggcacggcgccc20160
cccgcacaccggcacacctgCCCgtgCgCCgcacggcacgccgcccgacacgaaggagcc20220
atcatgtccgaccacccgaggaccgccgaggcacagccgtgcggcgtgggcatcagggcc20280
atcggccagtacctgcccgagcgggtcgtcaccaacgccgacctggagcggatgatcgac20340
accagcgccgagtggatcaccgagaagatcggcatccactCCCggCggttcgcggcggag20400
agcgacaccaccgccacgatgggcgcgagcgcgctcctcgacgcgtgcacccgctccggc20460
gtcgacccggactctatcgacctggtgatetgcggcaccgtcacccccgacctcatggcg20520
ccggccaccgCggtgtCCgtcatgcggcacgcggggctgacccaggccgtggccttcgac20580
gtgaacagcggcggctgcgccggttccgtcttcgcgctcgacgtggccgccaagtacgtg20640
cgctccggcgcctaccgcagggtcgccgtggtgctcgccgacaccgtcaccaagctgctg20700
gacccgaccgaccggatgaccgcggtcatcttcggcgacgccgcggcctgctatctcgtc20760
gagccggtggtgcccggcagcggcgtcaccaccaccgtgctgagcaacgacccgagcggc20820
taccactcggcgctggtctcccgggacccggtcaccgacgccgagggcaaggaggtccac20880
tccgccttcgggcagaacttcatccgcatcgtcgggcgcgacatccgcaacttcgccctg20940
gagaacatcccgggcttcgtccgcaagctggcggaggaggagaacctcactccggaggac21000
ctcgacatggtggtgctccaccaggccaaccggcgcatcgtcgaggggatcatggacgcc21060
ctgcgcctgccgtacgagcggacgtccatcaacgtggaccgcttcggcaacacctcggcc21120
gccggttccgtgctcgccctgcgcgaggcggtggacgacggccggatcaccgccggcgac21180
cgggtggtgctggtc tccttCggggCCgggctgagcgtgggcggcgcgctgatgcgctgg21240
aacgccccgcaggacttcctCgCCgCCCCgtgaggaacagcgcgaggaatcccgtgcgga21300
gccaggagccgaccgtcgcggagacacccgcgcggacccgtgccggggccCCggtCgtgC21360
CgCCCgggCtgccgatccggctcggttcgctggacccggccgaactggtcaccagcaccc21420
tcggcgtgcggatcaccgagtggcgcaccggccggctcgtcggcaccctgcccctcgcgg21480
gcaaccgcgaccggtacgggcggctcgacggggccgccctggccgtcctggccgagacgc21540
tcggctcggtCgCCgCCgCgctcgacctcggggagggcggcatcgtgctgggccaggaac21600
tgtccctggcgcaccacgaggaggtcaccggggaggggagcgtcaccggggtctgcaccc21660
ctctgcaccgcggcgaggacgtcgccacctacgaggtccacgtcaccgacacgcacgccc21720
gccgggtgtgcacggcccgcctcacctgcaccctgcgccgcaccgcgcgccccccggccc21780
gccccgccggcccgcctggaCCggCCggCCccgtcaccgaaacccccgcgcccaccggca21840
ggaaggtctgaaccgccatgcagtctcaccggccgccacgggacccgtactgggaccgga21900
tcggctatcaCggCCCgCtggagccgaccctcgacgtgctgcgcgagatctgccgcaagc21960
acgtcctggaggtgcccttcgaggccctggaggggcccgagggcatccgtccggtcatcg22020
accgggcgggcgtctacgacaagatcgtgacccggcacggCggcggcttctgcctccagg22080
ccaacgggctgctctctcaccacctgcgggagatcggcttcgacgtgaccgtgctggccg22140
cgcacatctgggtcccgcaccgcgagtacttcagcaagggcggcgaccacctgatcatgc22200
tggtccggctggacggcagggagtggctggtggacgccagctacacccacctcgtctacg22260
tcgaccccatcgagctggtccccggcgagcagcgccaggaCggCtgggtgtaccgcgtgc22320
gggccgaggacggctggtacgtggtccagcgccggggcgagcgggagtggctgccgctct22380
accggttcgtgccggaggcgcacacggtggaggacttcgaggagtcggtcgccttccacc22440
tcgacggggagaccgtctcggagaccacccgcacgctgatgtgctcgcgtggcatccgcg22500
gcggcaaggtctccctggtcaacaacgtgctcacgatcgccgagcacggcacggtgacca22560
cccgtcaggtgcgcgacgcgcgggactgcgcgcagatcatggcgcgcatcttccgcggtc22620
accggggtctcgccgagcggggcctgcgcatctgggagcggatgcgggaggaacgcgagg22680
CCgCCgggtCggcgccgcggcccacggccgcgcagggcgcctgactcccgcaccggacaa22740
cgacggaggacgtctgatgacgatcgacagcagcacacccgtcgccgtggtgggggcggg22800
cgtcatgggcgcggggctggcccaggtcgcCgCCgCCgCgggacacgaggtggtgctcca22860
cagccggcgggaggccaccctgcgccgggccctcgccggcatcggcgcctccctggaacg22920
ggcggccgcgCgCggCgggggcgcgcgggcggaggatcccggcacgacgctcgcccggat22980
ccgcaccacgacggacctgggggacgtcgcCggCtgCgCggtcgccgtggagtcggtcgc23040
cgaggacgtcgacctgaagcggcgcgtcttcgccgagctggaccggctctgcccgccggg23100
cgccctgctggccaccaacacctccggcattcccgtcaccgagatcgccgcggccaccgg23160
CCggCCgggCtccgtcgtgggcacgcacttcttctcacccgtgccgcgcatggagctgtg23220
cgagatcgtgCggggCCgggagaccaccgacgccaccgtcgccgcggcgcgctccttcgc23280
cgaggggatcggcaagagctgcgtggtggtggagaaggacCtgCCCggtttcgtcaccac23340
ccgtctgatcatcgccttcgtcctggaggcggtccgcctggtggagacgggcatctgccg23400
ggccgaggacgtggaccgtgcctgccgtctCgCCttCgggcacgcgatgggaccgctggc23460
caccgccgaccaggccgggctcgacgtgctgcgcgaggtcgccgccgggctggccaagga23520
gtacacccacccggtcttcgccacccccggcctgctggacCggCtggtCgcggagggccg23580
gcacggccgcaagaccgggcgcggcttccacgtctacgacgacaccacccccgcgcccac23640
ccgcccctgaccccgatcccccagctcccgactcccgactcccgactcccatttttcagc23700
tttcagttttcagctccgcttcacaccaccaccggaaggttctcccgtgaagttcgcctg23760
gatcgacctgcgttccacccacgacgacctgcgtgccggcgtggtcgacgccgccgtcca23820
cgcccgcctcgaaggagtgctcgacgaccggctcgaggttctgcgcaccctgccgcccac23880
cgtcaccaaggtcctgctccCCgCgCCCggcgacccgctgcccgccgaggccgccgacgt23940
cgccgacatcgtgctgacccgggtcggcaccgccgccgagctcgacaagctcaagctgga24000
gagcgagagcgacccggcccgcacggccgcgttcgtggaggtcgtcgacgacgccaccct24060
caaggtcgcctgcgaggcggCCCgggCgCtgcccaacacgctcgtgaagttccgcgaccc24120
gaccaagatcccgctggagatcgtgatcgccgccgccgaccacagcccgggccggctcat24180
ctgcgaggccggcgacctggaggaggcgggcatcgtcgtcgacgtcctggagaagggctc24240
cgacgggctgctcctggcgcccaaggacgccaatgacgtgttcggtctgaCCgggCtgCt24300
ccgcggcagcagccccgatctgtcgctcaccaccctcaccgtgcggtccatcgagcacaa24360
CggCCtgggCgaccgggtgtgcgtcgacacctgctcgcacttcgggcaggacgagggcat24420
cctcgtcggctcgtacgcgcacgggttcgtcctgtgcgtcagcgagacccacccgctgcc24480
gtacatgcccacgcgtcccttccgggtcaaCgCCggCgCCctgcactcctacgtcctggg24540
cgaggacaaccgcaccaactacctcagcgagctccaggcgggcagcacggtgctcggtgt24600
caccacggagggcaagacccgccggatcgtggtgggccgggtcaagctggagtcccgccc24660
catgctgaccatccgggcggtgtcggagtccggtacggaggtcagcctcaccgtccagga2472018
cgactggcac gtacgggtgc tgggcccggg ggccgccgtc ctgaacgtca ccgaactgaa24780
ggccggggac cagctcctcg gctacctggc cgacgacaag cgccatgtgg gctggccggt24840
cggcgagttc tgcatcgaga agtagcccgg agaacggtcg cggcggagac gggtccgccc24900
cgtctccgccggcccggcccggccccgcccggccccgcgcccggcacacgcgcgctcgcg24960
cacttcgcgcacacggaaggaaaggatgcgatggctgtggactcggccgccccggacttc25020
gggcgatggctcgacacggcgctcaccggcgacgacctggacgaggaggtctgggggcat25080
gccggacgggcgatgtccttcggccggatgcggaaggagacggcccgcacgcgggaggtc25140
CtggCggCCCacggcatcggccccgacagcaccgtcgccgtccagctcctgcccagcttc25200
accctgctgtggacggtgttCgCCgCCtggtcggcgggcgcccaggtgatgctgatggac25260
ccccggctcacccccgcggagaccacccggctgctggacctgtgcgaaccgcagttccac25320
ctcgccgtcgagggaccggtgccgctgtcggcgccgttccgcgaggagtgcgagatcgtg25380
gtcctgccccgccgctcgggCCggCCCgCgcagagtgcccaccgcctggtgcagttcagc25440
tcgggctccaCCggCCtgCCcaaggtcatcgggcgcaccgggcggtcgctgctcgacgaa25500
ctggagcgtttcgcccggctgcccgacatgccccggcacggtgaacgcctgctcctgctc25560
agctcgatggcgtactccttcgggctcatcgggggcgtgctgcacagcctgcggaccggc25620
gtctcgctgcacttcagcggcagtacccagccgcgcgagctgctgcggctgctcgcggag25680
cgggagatccacgcgctgttcggggtgccggtccacttcgacctgctgagCCgggtCggC25740
CgCCCCggCggcctgccgtccctgcggctcgcggtgtccggcggggaaccgctgcggccc25800
gaggtcttcacgcgcttcgaggaggccttcggtgtacggatcgggcaggcctacggcatg25860
acggaggcgggcatcatcgccaccgacctgaccggccgggCCgCgCCgCCggccgtgggc25920
acccccgcccccggcatgcggaccgaggtggcggacggcaCCCtgCgggtgcggctcccc25980
gaggatccgtatctgcacgcggaccggtccgggcgctacgcggacggctggctcgacacc26040
cacgaccgctgccgggtccggccggaggacggggtcctggagatcctcggccggaacgac26100
tcgacggtgatgatcggcggcctcaacgtcgacctcaccgaggtcgagtcggtggtgctg26160
gcacatccgtcggtgacggaCgCggtggtggtgtacggcgaggcgatcgaggcccatctc26220
gtcgccgaaccgacgctggccaagggtgagttgctggcctggtgccgagagcggctgagc26280
ccgcacaagctgcccaaggcgctgcacttcgtgcggaagctgccgcgcaccgcgaacggg26340
aagacggtccgcaaccgcgagctgctgcacgcgagccgggagcgggaacggcaggtgatc26400
atccggtgatcgacccctcgtacgcgggcacccgccatccgcgcttcgacgccgaggtcg26460
agcgcggccggctgcgatccttcgccgccgcggtgggtctggacgaggccgtcttccacg26520
acgtcgacgcggcgcgtgcggccggccatccggacctgccCgtCCCgCCCaccttcctgt26580
tcggcctggaactggagcattcgcaggacacactcgccgcgatgggagtcgagatggcgc26640
gggtcctcca catcgagcag ggcttcgtct accactcgac ggcgcacgcc ggtgaccggc26700
tcaccttcgcgccggtcctcgtgtccgtccgcgctcaccggggagcacgtctgcagctcc26760
tcgccacggagacggccgtcacccggcgggacggcaccccggtggccgacctccgccagg26820
tcctcgcggtccgcgaggacCCCgCCgCgCgggatgcgcggagcacgggggctgcctcgt26880
gagggtggacCCggCCggCCtcgccgtcggcaccgaactgcccgagctggtgccaccgcc26940
cgtgacccgggcgatgctcgccctgtacgcCggggCCtCgggcgaccacaacccgatcca27000
catcgactcggacgcggcggtggccgccgggctcgaggacgtcatcgcccacggcatgct27060
ctcgatggcgttcctgggccgcatgctcacCgCCCgggtgcccgtggaggacctggtgtc27120
CttCCgggtgaccttccgcgcgccgaccccggtgcacgccaggccgcgctgcaccgcccg27180
ggtcgtctccgtcgatccgcccgccgacgggagcgacggtccccgcacggcacggctcga27240
cctcaccgtacggctggaggacggccccgtgaccgtgcgcggcgaagcggtcgtacgcct27300
gcgggacaccggtgcggtccccgctccgccccactgatcgaggaggctcgacgatggcac27360
gatccgtgctggtcacgggaggcaaccgcggcatcggccgCgCCgtCgCCcaggcgttcg27420
cccgccagggcgaccgggtggcggtcacccaccggggttcCggggCgCCCcccgggatgc27480
tgggcgtcaagtgcgacgtcaccgacgccgcccaggtggaCgCCgCgttCgcggaggccg27540
aggccgcccaCggCCCggtggaggtgctggtgtccaacgccggcatcaccgacgacgcgc27600
tgctgctgcggatgccggaggagcggttcgCCCgggtgCtggacaccaacctcgccggcg27660
cctaccgggtggtgcggcgcgcggtgcccggcatgctgcggatgcggcgcggccggatcg27720
tgctgatgtcctcggtgtccgggctgtccggtgccgtcggccaggccaactacgcggcga27780
gcaaggcgggcatggtgggcatggcgaggtCgCtggCCCgggagctgggcgggcgcggga27840
tcaccgtgaaCgtggtCgCCCCggggCtggtcctgacggacatggccgagaccgtctccg27900
ccgcccgcaaggagcagatgCtCgCCggggtgccgctcgggcggcacgccgagcccgagg27960
acgtggcggggccggtgcgctggctcgcctcggaggaggccgggtacatcaccggggccg28020
tgctgcccgtcgacggcggcctgggcatggggcactgacgtggtcggcgaCgCgCggCgC28080
gcggcggacacggagcgggcCggCgggCCgggaggggagcactgatgcggatcgcgatgg28140
cactgccgtacgcggggagcggcttccgggagacggcggcCCggCtggtggactacgagc28200
gggccgggctggaccgggtcaccgtccgggaggcctacggctgggacgcggtcagtcagt28260
tggggtatctggcggcggtcaccgtacgtgtggagctcgcctccggcgtcctgccgctgc28320
ccacccgcacgcccgcgctgctggcgatgaCggCggCCggcctcgaccacgtgtccggcg28380
gccggttcgtgctcgggctgggtgtgtcgggaccgcaggtggtcgagggtttccacgggg28440
tgccggccgaCgCgCCgCtggcccggacccgcgcggtggtcggcatctgccggaccgtgt28500
ggcggcgcgagccgttgacgtaccgggaccggcactatcgcatcccgctgaccgccgagg28560
acggcggaacggggctgggcaagccgctgaagctgatcaaccggcccgagcgcgaccgga28620
tcccgatcgtgctggccgcgatggggccgcgcagcgtcgcCCtggCCgCCgagatcgccg28680
agggctgggagccgatctggttccaccccgagcgggccgggcaggtgtggggcggggcgc28740
tggccgagggcgccgcgcgacgcgctcccgCgCtgggCgCgctcgacgtcgtcgccccgg28800
tgcacctggcgatcggcgcggccgaggagtCgCgtgCCCtggcggcggtccgcgccgaca28860
tggccctgtaCgCgggCggCatgggcgcccgcggccgcaacttctaccacgacctcatgt28920
gccgcttcggatacccggaggaggccgggcgcgtgcaggagctgtatctcgccggacgtc28980
ggcaggaggccgccgaggccgtcccggaggaactggcgcgggcggtctccctggtgggca29040
ccgaggacgtggtgcgcaagcgggtggccgcgttccgcgaggccggcgtcaccacactga29100
gcgtcgtccccacggccgccacccatgccgcccgggtggaCgCggtggggcggctgaggg29160
atctggccggccccttcggctgacggaggcggaagcggacggcgaacgcggaagcggaag29220
CgggCtCgggCgCCCggCCgccgacggcggggagcccagcctcctgcccggccgcccccg29280
gccccgtccgccgcgcacctgccccacccggcccgcgcggtactgaacgcgggcgtacgg29340
gcgcacgtatggagggacggcgcccgacgaCCggggCgCtccgtacggtggtggcccgcc29400
ggcggtgttc agcggttcgg gagccctgca tgaggcacgt acgacgacgg atcgtccgac29460gcgggatacg gctgtcggcc gtcggcggga ttctcctggg gggcctgatg gtcacccagg29520ccatggccac cgagccggcc ggcggcacac cggcgcccgg cgcgcacgcc gccggttcct29580ccgtcgagtc ggccgccgcg cggggcgccg ggctcgtctc ccggctcggc accgggcgca29640ccgccggcac ctggatcggc gccgacggcc gccccgtggt cgccgtgacc gacgcggggg29700cggccgggac ggtgcgggag gccggggccc gcgccgaggt ggtgcggcac agcatggacg29760agttgaggtc cgccacgaag agcctgcgca cggcgccccg ggtcacgggc accgcctggt29820ccgtggacta cacccgcaac gaggtcgtgg tacgggcgga ccccaccgtc tccgccggtg29880actggtcgcg gctgacgcga ctcgccgatt ccctgggcgg cagggtgcgg atggagcgca29940cgaagaccga gttcaccacc aggctgaacg gggcgcagcc catgttctcc accggcggcc30000gctgttcggc cgggtacaac gtgaccgacg ggcagggttc cttcatcctc accgccggtc30060actgcgggcc caagggcgcg gtgtggttcg ccgaccaggg gggcgcgacc gagctcggcc30120agacggtgtc ctcccgcttc cccggcaacg acttctcgct catccggtac ggcaacgggc30180agtcggccgg ggcggacacc aacgtgatcg cgatcggcgg cggcaagggc gtgcgcatcg30240cgggggcggg agacgcggcg gtgggccagc gggtgttccg cagcggcagc acgagcgggc30300tgcgcgacgg caaggtgacc gggctggacg cgacggtcaa ctaccccgag gggacggtga30360ccgggctcat cgagacggac gtgtgcgccg aaccgggtga cagcgggggg ccgttgttct30420ccgacgggct cgcgctgggg gtcacctcgg gcggcagcgg ggactgcgag agcgggggga30480cgacgttctt ccagccgctc cggacggcga tgagcgcgct gggcgtgcgg ctggcggggg30540acggctcggg cgggaaaccg tcctcggcgg cggccggtgc gccggagccc tcggcctccg30600cctcccaggg agcggtgatc gcccccgggt cggcgaaccc cggcgcggtc gagcaggtcg30660gtgcgggggc ggccccctcg ctcgccgccc ggctcaccga tccggggacg gtgggcccgg30720ggctgctggt cctcgcgggg agcatggtgg cgtgggtggc ggcgcggtac atccgctcgg30780agcgggaccg ggaggcctac cgcaggcagt acgcccgcag ctggagctga30830(a)序列特征參長度30830參類型堿基序列參鏈型單鏈參拓?fù)浣Y(jié)構(gòu)線性(b)分子類型雙鏈DNA(c)假設(shè)否(d)反義否(e)最初來源海洋鏈霉菌 Streptomyces griseoaurantiacus M045(f)特異性名稱DNA以下結(jié)合具體實施例,對本發(fā)明作進(jìn)一步說明。1、海洋鏈霉菌M045基因組DNA的提取從斜面保存的鏈霉菌M045菌落上,用接種環(huán)刮下孢子,劃線接種于M2+固體培養(yǎng) 基上,28°C恒溫培養(yǎng)3-4天,待長出豐富的灰白色孢子,用接種鏟切割下0. 5cm2瓊脂塊,接 種于250mL液體M2+培養(yǎng)基中,恒溫振蕩培養(yǎng)3_4天。收獲培養(yǎng)液,8000rpm、4°C離心lOmin,棄去上清液,沉淀用50mL滅菌的雙蒸水重懸。
進(jìn)行海洋鏈霉菌M045基因組DNA抽提取20mL混懸的菌液,分裝于10個2mL的離心管,12000rpm、4°C離心IOmin ;棄去上清,沉淀用ImL滅菌雙蒸水重懸,12000rpm、4°C離心IOmin ;棄去上清,沉淀用ImLTE緩沖液重懸,12000rpm、4°C離心IOmin ;重復(fù)洗滌一次; 沉淀的菌體用1. 5mL的TE重懸,制成菌體混懸液,加入50mg/mL的溶菌酶200 μ L,37°C水浴過夜;加入lOmg/mL的蛋白酶K 20μ L,37°C水浴;然后加入20%的SDS至濃度為2%, 60°C水浴30min ; 12000rpm、4°C離心15min,取上清,每一管上清分裝于兩個1. 5mL離心管中,分別加入每管上清液體積的1/2體積的Tri s飽和酚,每管上清液體積的1/2體積的氯仿異戊醇(其中氯仿和異戊醇按體積比為M 1混合),緩慢搖動5min,12000rpm、4°C 離心15min ;取上清,加入與上清液等體積的氯仿異戊醇(其中氯仿和異戊醇按體積比為M 1混合),緩慢搖動5min, 12000rpm、4°C離心15min ;重復(fù)抽提一次;取上清,加入上清液1/10體積的5mol/L醋酸鉀,緩慢混勻,然后加入上清液2倍體積的無水乙醇(_20°C 預(yù)冷),緩慢搖動,至出現(xiàn)大量絮狀沉淀;用槍頭把絮狀沉淀挑出,置于新的1.5mL離心管中,加入70 %乙醇洗滌,12000rpm、4°C離心15min,棄去上清,并使沉淀中的乙醇揮干;將所獲得的DNA沉淀用50 μ L ddH20溶解,取5 μ L,用1 %瓊脂糖凝膠電泳檢測,剩余樣品置于-20°C保存。
上述海洋鏈霉菌M045,于2009年7月3日保藏于“中國生物菌種保藏管理委員會普通微生物中心”,其保藏登記號為=CGMCC 3161。
M2+固體培養(yǎng)基為麥芽提取物lg,葡萄糖0. 4g,酵母提取物0. 4g,瓊脂粉1. Sg,人工海水50mL,去離子水50mL。
M2+液體培養(yǎng)基為麥芽提取物lg,葡萄糖0. 4g,酵母提取物0. 4g,人工海水50mL, 去離子水50mLo
2.海洋鏈霉菌M045全基因組shotgun測序
利用Roche 454 GS FLX第二代測序技術(shù)進(jìn)行規(guī)模測序,獲得的數(shù)據(jù)利用GS de novo Assembler Software進(jìn)行拼接,最后獲得海洋鏈霉菌M045的基因組草圖。其為線性基因組,7,712,377bp,GC含量72. 73%。該基因組中,預(yù)測得到6839個開放閱讀框(ORFs), 614個預(yù)測蛋白是其特有的,發(fā)現(xiàn)660個paralog蛋白家族,4416個預(yù)測蛋白可以歸到COG 數(shù)據(jù)庫,預(yù)測234個蛋白屬于分泌蛋白,1352個蛋白屬于跨膜蛋白,106個蛋白是脂蛋白。
3.海洋鏈霉菌M045基因組fosmid文庫構(gòu)建和篩選
取鏈霉菌M045的大片段基因組DNA溶液200 μ L,按照每管10 μ L分別置于20 個200 μ L的離心管中。然后用10 μ L的微量進(jìn)樣器(Agilent,IOyL Syringe)反復(fù)吹打 40次,以剪切DNA,獲得40kb左右的DNA片段,然后按照EPICENTRE公司的CopyControl Fosmid Library Production Kit構(gòu)建fosmid文庫,庫容為6萬左右克隆。
中尼霉素和手霉素A具有2-氨基-3-羥基-2-環(huán)戊烯酮 (2-amino-3-hydroxycyclo pent-2-enone)的C5N結(jié)構(gòu),它是由5-氨乙酰丙酸合成酶和 5-氨乙酰丙酸輔酶A連接酶催化生成的,其中5-氨乙酰丙酸合成酶催化最關(guān)鍵的第一步反應(yīng)。根據(jù)鏈霉菌M045基因組的序列,設(shè)計5-氨乙酰丙酸合成酶基因(chiD》的引物 ALASlF (5,ATGAACCGACTCCTGGAC3,)和 ALAS839R(5,AGCGAGGTGGTGAAGATGAAC3,)。以鏈霉菌M045的基因組DNA為模板,進(jìn)行PCR擴(kuò)增,反應(yīng)程序為94°C,5min ; (94°C,50sec, 55°C,50sec,72°C,lmin) X30cycles ;72°C, IOmin0擴(kuò)增產(chǎn)物經(jīng)測序,與基因組上的chiD2序列完全一致,ALAS1F/ALAS839R可以作為篩選引物進(jìn)行fosmid文庫的菌落PCR篩選。于是完成了 192個fosmid克隆的菌液PCR篩選,獲得2個有陽性擴(kuò)增片段的克隆R)s0036Bl和 Fos0036E8o通過fosmid末端序列分析,對Fos0036E8進(jìn)行完整fosmid的測序。
4、手霉素A和中尼霉素的生物合成基因簇分析
如圖1所示,手霉素A和中尼霉素屬于手霉素類化合物。手霉素A最早是從鏈霉菌 Streptomyces parvulus TU64分離得到的(Buzzetti et al.,1963),手霉素化合物被認(rèn)為是一族新的抗生素,隨后又分離得到有類似結(jié)構(gòu)的化合物如asukamyCin(0mura et al., 1976 ;Kakinuma et al.,1979),U—62162(Slechta et al. ,1982)禾口 U—56407(Brodasky et al.,1983),豐富了此族抗生素,以上這些手霉素類化合物的核心結(jié)構(gòu)是Hi-C7N結(jié)構(gòu)。而中尼霉素是從海洋鏈霉菌中分離得到的(Li et al.,2005),中尼霉素中心芳香環(huán)結(jié)構(gòu)是P-C7N 結(jié)構(gòu)單元,且有氯的取代,是第一個來自天然的Para-C7N結(jié)構(gòu),同時在該海洋鏈霉菌中分離得到手霉素A。經(jīng)序列分析,獲得了海洋鏈霉菌M045染色體上30,830bp的連續(xù)區(qū)域,GC含量為74. 48%,生物信息學(xué)分析包含了 32個開放讀碼框(如圖2)其中有兩個序列很短, 為未定功能蛋白chiUl/U2 ;chiAl/A2/A3三個功能基因編碼的蛋白參與了核心C7N結(jié)構(gòu)的合成和轉(zhuǎn)運;chiBl/B2/B3/B4/B5/B6/B7/B8/B9參與了 upper聚酮鏈的合成和延伸;chiCl/ C2/C3/C4/C5C6/B7/B8/B9 參與了 lower 聚酮鏈的合成和延伸;chiDl/D2/D3 參與了 C5N 結(jié)構(gòu)單元的合成和連接;chiEl/E2/E3/E4是合成過程中的氧化還原酶,其中chiE4可能催化了氯的取代和lower聚酮鏈的重排,從而使手霉素A轉(zhuǎn)化為中尼霉素A ;chiMl/M2是轉(zhuǎn)運和分泌蛋白,用于藥物的轉(zhuǎn)運;chiRl/R2/R3是轉(zhuǎn)錄調(diào)控因子。
5、5_氨乙酰丙酸合成酶基因(chiD》基因敲除載體的構(gòu)建
目前在放線菌中已經(jīng)建立了非常成熟的基因克隆和功能分析系統(tǒng),其中最為常用的是基于同源交換的基因敲除和基因置換技術(shù)。質(zhì)粒PHZ132具有硫鏈絲菌素抗性標(biāo)記,攜帶鏈霉菌質(zhì)粒PSG5的復(fù)制子,該復(fù)制子是一個溫敏型復(fù)制子。PHZ132在30°C 培養(yǎng)時具有良好的遺傳及結(jié)構(gòu)穩(wěn)定性,而在37°C培養(yǎng)時質(zhì)粒會丟失,因此pHZ132可以用來在放線菌中用于基因敲除實驗研究。而載體PHZ132具有單一的BamH I酶切位點,因此把BamH I的酶切位點引入5-氨乙酰丙酸合成酶基因的擴(kuò)增引物中(ChiD2F 5' ATCGGATCCATGAACCGACTCCTGGAC 3’ ;ChiD2R :5’ CTA GGATCCAGCGAGGTGGTGAAGATGAAC 3’)。將帶有BamH I酶切位點的chiD2基因和經(jīng)過BamHI酶切的pHZ132線性載體,用 T4Ligase (TaKaRa)進(jìn)行連接,16°C連接過夜,然后利用氯化鈣法轉(zhuǎn)化Ε. Coli ToplO感受態(tài)菌株,37°C培養(yǎng)過夜,獲得大腸桿菌-鏈霉菌穿梭質(zhì)粒PHZ132D2,如圖3。
6、大腸桿菌-鏈霉菌間的接合轉(zhuǎn)移
鏈霉菌M045單孢子懸液的制備加2mL無菌水于鏈霉菌M045孢子生長豐富的 M2+固體培養(yǎng)基,用接種環(huán)輕輕刮下瓊脂表面的孢子,并用無菌水清洗幾次;將菌懸液用無菌吸管轉(zhuǎn)入裝有無菌玻璃珠的三角瓶內(nèi),在搖床上或手動搖動30min,盡可能用力破壞孢子鏈;然后將此孢子懸液倒在裝有脫脂棉花的漏斗中進(jìn)行過濾,以除去菌絲和不小心刮下的瓊脂;5000rpm,4°C離心lOmin,去上清;用2XYT培養(yǎng)基(胰蛋白胨lg,酵母粉lg,氯化鈉 lg, dd H2O IOOmL, ρΗ7· 0)洗滌兩次,每次 10mL,5000rpm,4°C離心 IOmin ;最后加入 2. 5mL 2 X YT培養(yǎng)基重懸孢子液,制成101(lCfU/mL的孢子懸液,立即用于接合轉(zhuǎn)移或懸浮于20 %的甘油溶液中,貯于_80°C冰箱中。
供體菌感受態(tài)細(xì)胞制備將含有oriT的大腸桿菌-鏈霉菌穿梭質(zhì)粒PHZ132D2轉(zhuǎn)入大腸桿菌ET12567(pUZ80(^)中,得到供體菌株ET12567 (pUZ8002,pHZ132D2);挑單菌落接種于5mL LB培養(yǎng)基(加入作用濃度為25 μ g/mL卡那霉素和氯霉素以及50 μ g/mL氨芐青霉素)中,37°C培養(yǎng)過夜;將過夜培養(yǎng)的菌液按0. 的比例接種到20mL新鮮的LB培養(yǎng)基(含有25 μ g/mL卡那霉素和氯霉素以及50 μ g/mL氨芐青霉素)中,37°C培養(yǎng)至0D_ = 0. 4-0. 6 ;5000rpm,4°C離心lOmin,沉淀菌體,用新鮮的LB培養(yǎng)基(不含抗生素)洗滌兩次,目的是把原來培養(yǎng)液里的抗生素充分洗掉。最后將菌體懸浮于5mL LB培養(yǎng)基中,分裝 0. 5mL于10個1. 5mL離心管中,_80°C備用。
接合轉(zhuǎn)移將制備好的鏈霉菌M045單孢子懸液,50°C水浴熱激活30min,37°C預(yù)萌發(fā)2. 5hr,冷卻至室溫;將供體菌ET12567 (pUZ8002, pHZ132D2)與鏈霉菌M045單孢子懸液各0. 5mL于1.5mL離心管中混合,IOOOOrpm離心lOsec,棄去大部分上清;用管底殘留的少量液體進(jìn)行重懸,然后把懸浮液涂布于含有l(wèi)Ommol/L氯化鎂的MS培養(yǎng)基(甘露醇2g,大豆蛋白胨2g,瓊脂粉2g,dd H2O 50mL,海水50mL,天然pH值)上培養(yǎng)Mhr,然后用 ImL含硫鏈絲菌素(作用濃度25 μ g/mL)和萘啶酮酸(作用濃度50 μ g/mL)的水溶液覆蓋。繼續(xù)培養(yǎng)大約20天至平板上長出鏈霉菌的灰白色孢子。
7、鏈霉菌M045突變株的分子檢測
因為pHZ132D2是溫敏性質(zhì)粒,轉(zhuǎn)入鏈霉菌M045后,通過添加抗生素,并在37°C培養(yǎng),可以提高陽性轉(zhuǎn)化子的篩選效率。在高溫下培養(yǎng),可以使游離質(zhì)粒PHZ132D2上的鏈霉菌復(fù)制子失活不能自主復(fù)制,而只能通過與染色體上的同源片段進(jìn)行交換,隨著宿主基因組的復(fù)制而復(fù)制,由此就發(fā)生了基因中斷。通過硫鏈絲菌素抗性基因(tsr)的PCR檢測,野生菌株w完全沒有擴(kuò)增信號,轉(zhuǎn)化株a,b,c有很強(qiáng)的擴(kuò)增信號,同陽性對照的擴(kuò)增片段大小一致(如圖4),載體pHZ132D2已經(jīng)成功導(dǎo)入a,b,c轉(zhuǎn)化菌株內(nèi)。用DIG DNA Labeling Kit(Roche)標(biāo)記抗性基因tsr作為探針,進(jìn)行突變株的Southern blot檢測,突變株a,b, c具有陽性的雜交信號,野生菌株w沒有陽性信號(如圖5),可以認(rèn)為載體pHZ132D2已經(jīng)整合在鏈霉菌突變株的基因組上。
8、鏈霉菌M045突變株代謝產(chǎn)物的化學(xué)分析
從鏈霉菌M045及其突變株固體平板上,用接種環(huán)刮下孢子,劃線接種于禮+固體培養(yǎng)基上,37°C恒溫培養(yǎng)3-4天,待長出豐富的灰白色孢子,用接種鏟切割下0. 5cm2瓊脂塊, 接種于250mL液體M2+培養(yǎng)基中,37°C恒溫振蕩培養(yǎng)3_4天,將發(fā)酵液冷凍干燥,得到固體粉末。
用乙酸乙酯浸泡干燥后的固體粉末3-4次,在乙酸乙酯浸泡的過程中,用超聲波清洗儀破碎,以利于代謝產(chǎn)物的溶出。把乙酸乙酯相用旋轉(zhuǎn)蒸發(fā)儀濃縮蒸干,得到粗提物, 稱重,分別用氯仿甲醇(3 2)溶液溶解,使?jié)舛葹?0mg/mL,轉(zhuǎn)移到小玻璃瓶中,4°C保存。
使用Agilent-1200液相色譜系統(tǒng),檢測代謝產(chǎn)物的變化,并利用島津公司的 LCMS-IT-T0F系統(tǒng)分析代謝產(chǎn)物的分子組成。色譜柱選擇安捷倫Eclipse XDB-C18柱, 250 X 4. 6mm, 5 μ m。檢測波長為2Mnm,柱溫25°C,流速lmL/min,流動相洗脫條件是
時間(miη)溶劑Α:水溶劑B:乙腈2 6 O O 112 3% % % % %石束 5 2 2 2 22 士-P 9 7 6 4 2 2/fO /O / /O /^u / ο ft/ ft/ ft/ ft/08 8 8 8 812 3 5 7 9
通過HPLC和LC-MS分析,鏈霉菌M045野生株代謝產(chǎn)物中,中尼霉素A、中尼霉素B 和手霉素A的流出峰分別出現(xiàn)在18. 4、19. 5和21分鐘,如圖6所示。中尼霉素A的C7N上的兩個羥基,很容易氧化為羰基形成中尼霉素B,這也是圖6-w中尼霉素A的峰面積要小于中尼霉素B的原因。
鏈霉菌M045突變株a、b和c的代謝產(chǎn)物中,中尼霉素A和B的流出峰消失,手霉素A有很弱的峰,說明通過chiD2基因的失活,突變株不能再合成目的產(chǎn)物。突變株在6. 3 分鐘出現(xiàn)新的流出峰,通過質(zhì)譜分析,分子量為472. 1889,其為中尼霉素Al (化合物4)的分子量,中尼霉素A結(jié)構(gòu)上的C5N結(jié)構(gòu)被羥基所替換形成中尼霉素Al,分子式為C26H31ClNO515 在10. 7分鐘的流出峰,通過質(zhì)譜分析分子量為454. 2439,是手霉素Al (化合物6)的分子量,同樣C5N結(jié)構(gòu)被羥基所替換,分子式為C26H32N06。如圖7所示化學(xué)結(jié)構(gòu)。
通過分子檢測分析,載體PHZ132D2已經(jīng)整合到鏈霉菌M045基因組,5_氨乙酰丙酸合成酶(chiD》基因被阻斷,通關(guān)對代謝產(chǎn)物的化學(xué)分析,鏈霉菌M045突變株不能再合成 C5N結(jié)構(gòu),而是進(jìn)行中間產(chǎn)物中尼霉素Al和手霉素Al的積累。進(jìn)一步證實了,中尼霉素和手霉素A結(jié)構(gòu)中的C5N結(jié)構(gòu)是通過5-氨乙酰丙酸合成酶(chiD2)和連接酶(chiD3)參與的Siemin途徑合成的,如圖8。
9、手霉素類化合物的異源表達(dá)
從海洋鏈霉菌 Sti^ptomyces griseoaurantiacus M045 的基因組 fosmid 文庫中, 篩選到含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,利用OMEGA Bio-Tek公司的E.Z.N.A. BAC/PAC DNA Kit提取含有完整的手霉素A或中尼霉素生物合成基因簇的 fosmid,將該fosmid轉(zhuǎn)化到天藍(lán)色鏈霉菌、變鉛青鏈霉菌(Sti^ptomyces lividans) TK24、 或含有Red重組系統(tǒng)的大腸桿菌中,從而可以使鏈霉菌或大腸桿菌產(chǎn)生手霉素A或中尼霉素;在轉(zhuǎn)化后的宿主菌中,對基因簇的相關(guān)基因進(jìn)行插入、置換或缺失,從而使宿主菌可以合成手霉素類化合物的結(jié)構(gòu)類似物。
權(quán)利要求
1.一種手霉素生物合成基因簇,其特征在于所述手霉素生物合成基因簇堿基序列如 SEQ ID NO. 1所示,其中手霉素生物合成基因簇為手霉素A和中尼霉素的生物合成基因簇, 1)手霉素A和中尼霉素的生物合成的結(jié)構(gòu)基因編碼3-氨基-4-羥基-苯甲酸(3,4-AHBA) 合成酶的chiAl ;編碼3-氨基-4-羥基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2 ;編碼醛裂合酶的chiA3 ;編碼3-羥丁酰輔酶A脫氫酶的chiBl ;編碼芳香胺N乙酰轉(zhuǎn)移酶的 chiB2 ;編碼3-氧乙?;d體蛋白合成酶III的chiB3 ;編碼3-氧乙酰基載體蛋白合成酶 III的chiB4;編碼?;d體蛋白的chiB5 ;編碼硫酯酶的chiB6 ;編碼3-氧乙酰基載體蛋白還原酶的chiB7 ;編碼?;撍傅腸hiB8 ;編碼酰基脫水酶的chiB9 ;編碼I/II型酮合成酶相關(guān)的酰基載體蛋白的chiCl ;編碼3-氨基-4-羥基-苯甲酸(3,4-AHBA)載體蛋白的 chiC2 ;編碼3-氧乙?;d體蛋白合成酶II的chiC3 ;編碼酮合成酶的chiC4 ;編碼甲基丙二酰輔酶A變位酶的chiC5 ;編碼硫酯酶的chiC6 ;編碼酰胺合成酶的chiDl ;編碼5-氨乙酰丙酸合成酶的chiD2 ;編碼5-氨乙酰丙酸輔酶A連接酶的chiD3 ;編碼氧化酶的chiEl ; 編碼黃素還原酶的chiE2 ;編碼黃素依賴的單加氧酶的chiE3 ;編碼黃素依賴的氧化還原酶的chiE4 ;共25個基因;2)手霉素A和中尼霉素的生物合成的調(diào)節(jié)基因編碼LuxR家族轉(zhuǎn)錄調(diào)節(jié)子的chiRl ;編碼TetR家族轉(zhuǎn)錄調(diào)節(jié)子的chiR2 ;編碼調(diào)節(jié)蛋白的chiR3 ;共3個基因;3)手霉素A和中尼霉素的生物合成的轉(zhuǎn)運基因編碼抗藥性轉(zhuǎn)運蛋白的chiMl ;編碼分泌蛋白酶的chiM2 ;共2個基因。
2.按權(quán)利要求1所述的手霉素生物合成基因簇,其特征在于所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突變菌株。
3.按權(quán)利要求1所述的手霉素生物合成基因簇,其特征在于所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突變菌株。
4.按權(quán)利要求1所述的手霉素生物合成基因簇,其特征在于所述手霉素A生物合成基因簇用于其編碼蛋白催化合成手霉素A及其類似物。
5.按權(quán)利要求4所述的手霉素生物合成基因簇,其特征在于對所述手霉素A生物合成基因簇的基因進(jìn)行遺傳改造獲得的突變體經(jīng)生物發(fā)酵得到手霉素A的結(jié)構(gòu)類似物。
6.按權(quán)利要求1所述的手霉素生物合成基因簇,其特征在于所述中尼霉素生物合成基因簇用于其編碼蛋白催化合中尼霉素及其類似物。
7.根據(jù)權(quán)利要求6所述的手霉素生物合成基因簇,其特征在于對中尼霉素生物合成基因簇的基因進(jìn)行遺傳改造獲得的突變體經(jīng)生物發(fā)酵得到中尼霉素的結(jié)構(gòu)類似物。
全文摘要
本發(fā)明涉及微生物的基因工程領(lǐng)域,具體的說是一種手霉素A和中尼霉素的生物合成基因簇。所述手霉素生物合成基因簇堿基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇為手霉素A和中尼霉素的生物合成基因簇,(1)負(fù)責(zé)手霉素A和中尼霉素生物合成的結(jié)構(gòu)基因25個;(2)負(fù)責(zé)手霉素A和中尼霉素生物合成的調(diào)節(jié)基因3個;(3)負(fù)責(zé)手霉素A和中尼霉素生物合成的轉(zhuǎn)運基因2個。通過對上述生物合成基因的遺傳改造可以得到手霉素A和中尼霉素的結(jié)構(gòu)類似物,本發(fā)明所提供的基因及其所編碼的蛋白質(zhì),可以用來尋找和發(fā)現(xiàn)可用于醫(yī)藥、工業(yè)和農(nóng)業(yè)的化合物、基因和蛋白。
文檔編號C12N15/54GK102517309SQ20111032863
公開日2012年6月27日 申請日期2011年10月19日 優(yōu)先權(quán)日2011年10月19日
發(fā)明者劉兆普, 姜鵬, 李富超, 秦松, 陳華新 申請人:中國科學(xué)院海洋研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1