三欣卡辛的生物合成基因簇及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于微生物基因資源和基因工程領(lǐng)域,具體涉及抗菌抗瘧及抗腫瘤抗生素 三欣卡辛(Trioxacarcin)的生物合成基因簇的克隆、分析、功能研究及其應(yīng)用,三欣卡辛的 產(chǎn)量提高以及中間體化合物的結(jié)構(gòu)闡明。
【背景技術(shù)】
[0002] 三欣卡辛類化合物(Trioxacarcins,結(jié)構(gòu)如圖1所示),是1981年由日本科 學(xué)家Fusao Tomita從北海道札幌市土壤中分離得到。這類化合物呈現(xiàn)淡黃色到黃色, 在 366nm 下發(fā)出淡綠色熒光[J. Antibiot. (Tokyo) 12, 1519-1524 (1981) ]。Rajendra P. Maskey等人隨后在2004年也對這類化合物在另外一個海洋來源的鏈霉菌Streptomyces sp. isolateB86523 進行分離[J. Antibiot. (Tokyo) 57, 71 (2004)]。
[0003] 三欣卡辛類化合物它是由鏈霉菌Streptomyces bottropensis D0-45所產(chǎn)生 的一類化合物,具有良好的抗菌、抗瘧及抗腫瘤活性。其中對于革蘭氏陽性菌(Bacillus subtilis, Staphylococcus aureus)均有一定的活性,對革蘭氏陰性菌(Escherichia coli)也具有中等的活性。trioxacarcin A,trioxacarcin D具有非常高的抗痕活性,與 青蒿素(artemisinin)活性相當(dāng);對于肺癌腫瘤細胞,有良好的活性(IC90=0.74ng/ml)。 [Nucleic Acids Research, 2008, 36, 3508 - 3514]
[0004] 人們在隨后的發(fā)酵中分離發(fā)現(xiàn)七種三欣卡辛類似物,包括trioxacarcins A_F[58]及gutingimycin,它們具有共同的蒽醌骨架結(jié)構(gòu),其中含氧三元環(huán)是最重要的 活性位點,同時糖苷配基上的乙?;彩欠浅V匾幕钚曰鶊F,它的藥效作用機理可能 是與DNA結(jié)合,最終鳥嘌呤核苷酸中含氮堿基七位氮原子親核進攻三元含氧環(huán),發(fā)生 開環(huán)后鳥噪呤堿基留在三欣卡辛分子結(jié)構(gòu)上形成gutingimycin。[Angew. Chem. Int. Ed. 2004, 43, 1281 - 1281]
[0005] 三欣卡辛分子由三部分組成:蒽環(huán)骨架、三并含氧螺環(huán)結(jié)構(gòu)以及兩個不同的?;?化修飾的脫氧己糖單元。其中的蒽環(huán)骨架是以II型PKS的方式合成的。II型PKS由miniPKS 以及相關(guān)的負責(zé)折疊、環(huán)化、氧化還原以及其他修飾的后修飾酶組成。人們認為miniPKS 一般由丙二酰-ACP經(jīng)過脫羧產(chǎn)生的乙酸單元轉(zhuǎn)移至KS活性位點而起始,而后KS催化ACP 上丙二酰硫酯脫去二氧化碳形成碳負離子與KS上?;l(fā)生Claisen縮合在ACP上形成相 應(yīng)的硫酯結(jié)構(gòu),接著轉(zhuǎn)移至KS活性位點而完成兩碳單元的延伸。當(dāng)聚酮通道充滿時,聚酮 酰-ACP離開體系發(fā)生隨后的酮基還原、環(huán)化、氧化等后修飾。闡明蒽環(huán)骨架的合成機理對 于豐富人們對蒽環(huán)類天然產(chǎn)物的認識、改造蒽環(huán)類天然產(chǎn)物的合成路徑以產(chǎn)生價值更高的 "非天然"天然產(chǎn)物都有重要意義。
[0006] 分子的三元含氧螺環(huán)和脫氧糖基均是藥效基團,而且結(jié)構(gòu)比較新穎,但是目前的 對其合成途徑還不甚了解,推測其合成機制是比較獨特的。因此,闡明這兩個基團的合成過 程,理解其生物合成的酶學(xué)機制,將大大提升人們對抗菌抗腫瘤天然產(chǎn)物構(gòu)效關(guān)系及生物 合成原理的認識。在闡明了三欣卡辛生物合成的酶學(xué)機制的基礎(chǔ)上,人們還可以通過敲除 和添加相關(guān)的生物合成基實現(xiàn)對三欣卡辛分子的改造,以期獲得活性更高、專一性更強、毒 性更低的中間體和衍生物。同時,三欣卡辛生物合成機理的闡明,對人們深入理解芳香聚酮 類化合物、理解復(fù)雜的氧化后修飾作用必然會起到很大的幫助。進一步還可以將三欣卡辛 生物合成基因簇中負責(zé)含氧雜環(huán)和負責(zé)脫氧糖基合成的基因應(yīng)用到現(xiàn)有的某些藥物的生 物合成過程中,通過組合生物合成改造現(xiàn)有的某些藥物,提高其生理活性或降低其對人體 的毒性。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是提供三欣卡辛生物合成相關(guān)的基因簇及其應(yīng)用。
[0008] 本發(fā)明的第一方面,提供了一種三欣卡辛的生物合成基因簇,所述基因簇包括以 下三欣卡辛生物合成所涉及的56個基因 :
[0009] 1) 13 個 II 型聚酮合成酶 PKS 相關(guān)基因:即 txn5_8, txnl3, txnl7, txnl9, txn27, txn36, txn39, txn41, txn43, txn46 :
[0010] txn5位于基因簇核苷酸序列第19560-17875位,編碼酰基轉(zhuǎn)移酶,長度為562個氨 基酸;
[0011] txn6位于基因簇核苷酸序列第19990-19718位,編碼酰基承載蛋白,長度為91個 氨基酸;
[0012] txn7位于基因簇核苷酸序列第21275-20055位,編碼鏈延伸因子,長度為407個氨 基酸;
[0013] txn8位于基因簇核苷酸序列第22534-21272位,編碼酮基合成酶,長度為421個氨 基酸;
[0014] txnl3位于基因簇核苷酸序列第28909-27953位,編碼芳香化酶,長度為319個氨 基酸;
[0015] txnl7位于基因簇核苷酸序列第33234-34016位,編碼酮基還原酶,長度為261個 氨基酸;
[0016] txnl9位于基因簇核苷酸序列第35711-36748位,編碼脫氫酶,長度為346個氨基 酸;
[0017] txn27位于基因簇核苷酸序列第45439-44318位,編碼環(huán)氧水解酶,長度為374個 氨基酸;
[0018] txn36位于基因簇核苷酸序列第55665-55138位,編碼芳香環(huán)羥化雙加氧酶亞基, 長度為176個氨基酸;
[0019] txn39位于基因簇核苷酸序列第57618-58403位,編碼短鏈脫氫酶,長度為262個 氨基酸;
[0020] txn41位于基因簇核苷酸序列第58987-59901位,編碼環(huán)化酶,長度為305個氨基 酸;
[0021] txn43位于基因簇核苷酸序列第61547-61101位,編碼芳香環(huán)羥化雙加氧酶亞基, 長度為149個氨基酸;
[0022] txn46位于基因簇核苷酸序列第64276-63554位,編碼氧化還原酶,長度為241個 氨基酸;
[0023] 2)4個負責(zé)起始單元合成相關(guān)基因;即txnl2, txnl4_16 ;
[0024] txnl2位于基因簇核苷酸序列第27815-26076位,編碼蘋果酸輔酶A (CoA)合成酶, 長度為580個氨基酸;
[0025] txnl4位于基因簇核苷酸序列第30020-28986位,編碼3-氧代?;??;休d蛋 白(ACP)合成酶,長度為345個氨基酸;
[0026] txnl5位于基因簇核苷酸序列第31680-30049位,編碼2-異蘋果酸合酶,長度為 544個氨基酸;
[0027] txnl6位于基因簇核苷酸序列第33014-31761位,編碼酰基輔酶A轉(zhuǎn)移酶,長度為 418個氨基酸;
[0028] 3) 13個負責(zé)邊鏈糖基合成相關(guān)基因,即txnl-4, txn28-32, txn42,45,49,50 ;
[0029] txnl位于基因簇核苷酸序列第12861-13853位,編碼dTDP-葡萄糖4, 6-脫水酶, 長度為331個氨基酸;
[0030] txn2位于基因簇核苷酸序列第14848-13976位,編碼dTDP葡萄糖合酶,長度為 291個氨基酸;
[0031] txn3位于基因簇核苷酸序列第15503-16486位,編碼丙酮酸脫氫酶α亞基,長度 為328個氨基酸;
[0032] txn4位于基因簇核苷酸序列第16520-17557位,編碼丙酮酸脫氫酶β亞基,長度 為346個氨基酸;
[0033] txn28位于基因簇核苷酸序列第46543-45557位,編碼NAD-己糖-4-酮基還原酶, 長度為329個氨基酸;
[0034] txn29位于基因簇核苷酸序列第47181-46540位,編碼dTDP-4-脫氧葡萄 糖-3, 5-異構(gòu)酶,長度為214個氨基酸;
[0035] txn30位于基因簇核苷酸序列第48428-47187位,編碼NDP-己糖-3碳-甲基轉(zhuǎn)移 酶,長度為414個氨基酸;
[0036] txn31位于基因簇核苷酸序列第48662-50128位,編碼NDP-脫氧葡萄糖-2, 3-脫 水酶,長度為489個氨基酸;
[0037] txn32位于基因簇核苷酸序列第50125-51090位,編碼NDP-己糖-3-酮基還原酶, 長度為322個氨基酸;
[0038] txn42位于基因簇核苷酸序列第61080-59929位,編碼糖基轉(zhuǎn)移酶,長度為384個 氨基酸;
[0039] txn45位于基因簇核苷酸序列第63460-62186位,編碼糖基轉(zhuǎn)移酶,長度為425個 氨基酸;
[0040] txn49位于基因簇核苷酸序列第68041-66848位,編碼?;D(zhuǎn)移酶,長度為398個 氨基酸;
[0041] txn50位于基因簇核苷酸序列第69353-68070位,編碼糖基轉(zhuǎn)移酶,長度為428個 氨基酸;
[0042] 4) 13個負責(zé)復(fù)雜的三并元含氧螺環(huán)后修飾基因,即txn21, txn23_26,txn35, txn3 7,txn40,txn44, txn47, txn51-53 ;
[0043] txn21位于基因簇核苷酸序列第38405-37200位,編碼p450細胞色素氧化酶,長度 為402個氨基酸;
[0044] txn23位于基因簇核苷酸序列第40945-39710位,編碼鐵氧化還原蛋白,長度為 412個氨基酸;
[0045] txn24位于基因簇核苷酸序列第41268-40945位,編碼鐵氧化還原蛋白,長度為 108個氨基酸;
[0046] txn25位于基因簇核苷酸序列第41505-42989位,編碼三肽氨基肽酶,長度為495 個氨基酸;
[0047] txn26位于基因簇核苷酸序列第44290-43061位,編碼p450細胞色素氧化酶,長度 為410個氨基酸;
[0048] txn35位于基因簇核苷酸序列第55060-53840位,編碼p450細胞色素氧化酶,長度 為407個氨基酸;
[0049] txn37位于基因簇核苷酸序列第56938-55823位,編碼氧化酶,長度為372個氨基 酸;
[0050] txn40位于基因簇核苷酸序列第58430-58966位,編碼黃素還原酶類似的氧化還 原酶,長度為179個氨基酸;
[0051] txn44位于基因簇核苷酸序列第61741-62106位,編碼未知功能蛋白,長度為122 個氨基酸;
[0052] txn47位于基因簇核苷酸序列第65379-64357位,編碼氧甲基轉(zhuǎn)移酶,長度為341 個氨基酸;
[0053] txn51位于基因簇核苷酸序列第70423-69404位,編碼氧甲基轉(zhuǎn)移酶,長度為340 個氨基酸;
[0054] txn52位于基因簇核苷酸序列第71697-70474位,編碼p450細胞色素氧化酶,長度 為408個氨基酸;
[0055] txn53位于基因簇核苷酸序列第72753-71731位,編碼氧甲基轉(zhuǎn)移酶,長度為341 個氨基酸;
[0056] 5) 2 個抗性基因,即 txn33, txn38 ;
[0057] txn33位于基因簇核苷酸序列第52661-51159位,編碼抗性蛋白,長度為501個氨 基酸;
[0058] txn38位于基因簇核苷酸序列第57431-56967位,編碼抗性蛋白,長度為155個氨 基酸;
[0059] 6) 7 個調(diào)芐基因,即 txnO, txn9_ll, txnl8, txn34, txn55 ;
[0060] txnO位于基因簇核苷酸序列第11766-12050位,編碼LuxR家族調(diào)節(jié)因子,長度為 93個氨基酸;
[0061] txn9位于基因簇核苷酸序列第23673-22882位,編碼SARP家族調(diào)控因子,長度為 264個氨基酸;
[0062] txnlO位于基因簇核苷酸序列第24216-25400位,編碼雙組份激酶,長度為395個 氨基酸;
[0063] txnll位于基因簇核苷酸序列第25422-26033位,編碼雙組份激酶調(diào)節(jié)因子,長度 為204個氨基酸;
[0064] txnl8位于基因簇核苷酸序列第34147-35649位,編碼外排蛋白,長度為501個氨 基酸;
[0065] txn34位于基因簇核苷酸序列第53757-52738位,編碼轉(zhuǎn)錄因子調(diào)節(jié)蛋白,長度為 340個氨基酸;
[0066] txn55位于基因簇核苷酸序列第74585-73725位,編碼SARP家族調(diào)控因子,長度為 287個氨基酸;
[0067] 7)其他未知功能基因,即 txn20, txn22, txn48, txn54 ;
[0068] txn2