施方式中,術(shù)語(yǔ)"C2 s炔基"指具有2~8個(gè)碳原子的直鏈或支鏈 炔基,例如乙炔基、丙炔基、異丙炔基、丁炔基、異丁炔基、仲丁炔基、叔丁炔基、或類似基團(tuán)。
[0078] 在本發(fā)明優(yōu)選的實(shí)施方式中,術(shù)語(yǔ)"鹵素"指F、Cl、Br和I。
[0079] 如本文所用,術(shù)語(yǔ)"藥學(xué)上可接受的鹽"指本發(fā)明化合物與酸或堿所形成的適合用 作藥物的鹽。藥學(xué)上可接受的鹽包括無機(jī)鹽和有機(jī)鹽。一類優(yōu)選的鹽是本發(fā)明化合物與酸 形成的鹽。可以由陽(yáng)離子與本發(fā)明化合物上的帶電荷基團(tuán)(例如氨基)形成鹽。合適的陽(yáng) 離子包括氫離子、鈉離子、鉀離子、鎂離子、鈣離子和銨離子。適合形成鹽的堿包括但并不限 于:堿金屬和堿土金屬的氫氧化物(如NaOH、Κ0Η)、堿金屬和堿土金屬的氧化物、堿金屬和 堿土金屬的碳酸鹽(如Na 2C03)、氨水等。
[0080] 在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方式中,所述化合物結(jié)構(gòu)如下所示:
[0081]
m-m.
[0082] 本發(fā)明的化合物可以作為制備其他林可酰胺類抗生素結(jié)構(gòu)類似物,并用于水解產(chǎn) 生正丙基脯氨酸、二糖化合物GlcN-Ins、和/麥角硫因等下游產(chǎn)物。
[0083] 在本發(fā)明的較佳地實(shí)施方式中,通過將化合物1,2或5水解制備正丙基脯氨酸。
[0084] 在本發(fā)明的較佳地實(shí)施方式中,制備正丙基脯氨酸(PPL)的過程如下所示:
[0085]
[0086] 在本發(fā)明的較佳地實(shí)施方式中,通過將化合物1或3水解制備二糖化合物 GlcN-Ins。GlcN-Ins可用作化學(xué)合成Mycothiol的原料(化學(xué)合成方法參考文獻(xiàn):0rg. Lett. 6, 365-368,2004 ;0rg. Lett. 12, 2630-2633,2010)〇
[0087] 在本發(fā)明的較佳地實(shí)施方式中,制備二糖化合物GlcN-Ins的過程如下所示:
[0088]
[0089] 在本發(fā)明的較佳地實(shí)施方式中,通過將化合物2或4水解制備麥角硫因。
[0090] 在本發(fā)明的較佳地實(shí)施方式中,制備麥角硫因的過程如下所示:
[0091]
[0092] 出發(fā)菌株
[0093] 如本文所用,術(shù)語(yǔ)"本發(fā)明出發(fā)菌株"或"本發(fā)明出發(fā)微生物"指編號(hào)為NRRL ISP-5355的林可鏈霉菌(Streptomycin lincolnensis)。本發(fā)明的出發(fā)菌株保存在美國(guó)農(nóng) 業(yè)研究菌種保藏中心(NRRL),編號(hào)為 Streptomycin lincolnensis NRRL ISP-5355。應(yīng)理 解,出發(fā)菌株不僅包括編號(hào)為Streptomycin lincolnensis NRRL ISP-5355的菌株,還包括 其衍生菌株。
[0094] 工程菌株
[0095] 本發(fā)明還提供了可用于生產(chǎn)本發(fā)明化合物的工程菌。
[0096] 在本發(fā)明的一個(gè)優(yōu)選例中,提供了幾種生產(chǎn)本發(fā)明林可霉素生物合成中間產(chǎn)物的 林可鏈霉菌(Streptomycin lincolnensis)突變菌株。
[0097] 活性成分的制備
[0098] 本發(fā)明提供了一種制備式I化合物的方法,包括步驟:
[0099] 對(duì)經(jīng)基因改造的林可鏈霉菌(Streptomycin lincolnensis)工程菌株進(jìn)行發(fā)酵;
[0100] 從培養(yǎng)基中提取式I化合物。
[0101] 離心棄去菌體,上層菌液采用大孔樹脂吸附,蒸餾水洗滌后采用甲醇浸泡,過濾除 去大孔樹脂,濾液經(jīng)減壓濃縮抽干,獲得的膏狀物先用凝膠柱進(jìn)行粗分,再用HPLC制備進(jìn) 一步純化,最終得到目標(biāo)產(chǎn)物。
[0102] 功能性基因
[0103] 早在1995年,Peschke等就已經(jīng)通過三個(gè)林可霉素抗性基因 ImrA,ImrB和 ImrC于S. lincolnensis78_ll中染色體步移獲得了 35kb林可霉素生物合成族[Mol Microbiol. 1995, 16(6) :1137-1156]。捷克 Janata研究小組也于2008年在S. lincolnensis ATCC 25466林可霉素低產(chǎn)菌株中克隆到38217bp的林可霉素生物合成基因簇,通過生 物信息學(xué)分析,此基因簇包含30個(gè)閱讀框(0RF),由27個(gè)推定的生物合成及調(diào)控基 因(lmb)以及3個(gè)抗性相關(guān)基因(lmr)組成,在S.coelicolor M145和S.coelicolor CH 999中進(jìn)行異源表達(dá)證實(shí)了此基因簇已包含有完整的林可霉素合成相關(guān)基因 [Folia Microbiol. 2008, 53(5) :395-401]。然而通過序列分析推斷出的各個(gè)基因產(chǎn)物同已知的蛋 白質(zhì)序列進(jìn)行比對(duì),有幾個(gè)基因完全找不到同源蛋白,無法推測(cè)功能。而即使能從同源蛋白 比對(duì)推測(cè)出其可能的功能,大部分基因在林可霉素生物合成過程中的功能仍然未知。
[0104] 本發(fā)明中所涉及的林可霉素生物合成基因簇較佳地可參考文獻(xiàn)[Folia Microbiol. 2008, 53(5):395-401]。
[0105] 在本發(fā)明的一個(gè)優(yōu)選地實(shí)施方式中,ImbE基因的多核苷酸序列如下所示:
[0106] ATGACTCAGTGCCTGCTGACCGTCCACGCGCACCCGGACGACGAGGCCTCCCGCGGCGGCGCCACGGTC GCCCACTACACCGCGCAGGGCGTCCGCGCCGTCCTGGTCACCTGTACCGACGGCGGCGCCGGCGAGGTGCTCAACCC CGCCGTCACCGACGACTTCACCCCCGAACGGTTCGTCGCCGTCCGCAGCGCCGAACTCGACGCCAGCGCACGGAACC TGGGCTACTCGGCCGTGCACCGGCTCGGCTACCGCGACTCCGGCATGGACGGCACGGCGGGCGGCGCCGAGGCCTTC GTACGGGCCCCGCTCGACGAGGCCGCCACCCGCCTCGCCCGGGTGATCGCGGACGAACGCCCCGACGTGGTGATCGG ATACGGCACCAACCACACCCGCGACCCGCACCCCGACCACATCCGCGCGAACGAAGTGCTGACGCGCGCCGTCGACC TCCTCGACCACACACCCGCCGTCTACCACATCGCCTTCTCGCGACGTCGCCACCGCGCCTTGCACCAGGCCTGCGTC GACAGCGGGGTGCCCAGCCCGTACGAGGGCGGCCTGAGCGCCCCGCCGGGCGCCTTCGACGACGAGTGGATCACCAC ACTCGTCGACGTGACCAAGGGCGACGCCGTCGAGCGCAGGCTCGACGCGCTGCGCAGTCACGTGACCCAAGTACCGC CCGCCTCCGGCTGGTTCGCGCTGTCACCGCAGCAGCTGCGGGACGCCTTCCCGTACGAGGAGTACACCCGCGTCGGC GCCGCGCCCCGGGAAGCCGTGGTGCACGACCTGTTCACCGCTCCCGCGTGA(SEQ ID NO. :1)
[0107] 在本發(fā)明的一個(gè)優(yōu)選地實(shí)施方式中,lmbE3457基因的多核苷酸序列如下所示:
[0108] ATGGCCGTGCACGCCCACCCCGACGACGAGTCGAGCAAGGGCGCGGCCACCATGGCGAAGTACGTGTCC GAGGGGGTGGACGTGCTGGTCGTGACCTGCACGGGAGGGGAGCGCGGCTCCATCCTCAACCCCAAGCTCCAGGGGGA CGCGTATATCGAGGAGCACATCCATGAGGTGCGCAAGAAGGAGATGGACGAGGCGAGAGAGATCCTCGGCGTCAAGC AGGAGTGGCTCGGGTTCGTCGACTCGGGCCTGCCCGAGGGGGACCCGCTGCCGCCGCTGCCGGAGGGCTGTTTCGCC CTGGAGGACGTCGACAAGGCGGCCGGTGAGCTGGTGAAGAAGATCCGCTCGTTCCGTCCCCAGGTGATCACCACCTA CGACGAGAACGGCGGCTACCCGCACCCCGACCACATCATGACCCACAAGATCTCGATGGTGGCGTTCGAGGGTGCCG CGGACACCGAGAAGTACCCGGAGCAGGAGTTCGGCCCCGCGTACCAGCCGCAGAAGATCTACTACAACCAGGGCTTC AACCGTGAGCGCACCGAGGCCCTGCACAACGCGCTGGTCGAGCGCGGCCTGGAGTCCCCCTACGGCGACTGGCTCAA GCGCTGGGAGGAGTCCGGGATGCAGCAGCGGACGCTCACCACGCACGTCCCGTGTGCCGAGTTCTACGAGATCCGCG ACAAGGCCCTGATCGCCCACGCCACGCAGATCGACCCCGACGGCGGCTGGTTCCGGGTGCCGCTGGATCTCCAGAAG GAGGTCTGGCCGACCGAGGAGTACGAGCTCGCGAAGTCCCTCGTCGATACTTCCCTCCCCGAGGCGGACCTCTTTGC GGGCATCCGCGACAATGCCTGA(SEQ ID NO. :2)
[0109] 在本發(fā)明的一個(gè)優(yōu)選地實(shí)施方式中,ImbV基因的多核苷酸序列如下所示:
[0110] TTGCAGCGCAAGGGACTGGCCCGGCTCGGGTCGGGTGTCACGGCACTGGCCGACGAGGGAAGACACCTG CGGGCCTGGCTCACGAGCGCCGACGCGGCGGCGTGGCGACGGCCCACACGCTGTGCGGAGTGGAACGTCCGGGACGT CGTCGCGCACCTGGCGAGCGGCGAGCTGTACAACCAGGCATGCGTGCACGACGACATCGCCTCGCTCGGCGAGTGGG CCGACGACGAGGCGTACAACGTCGGCCAGGTGGAGATGCGCCGCCACCTGAGCCACCGCGACGTCTTCGCGGAGTGG GACGAGCGCCACCGGGACGTGGTGGCCGCCTGGGGGGCCATGGACCCGGCCGACCCGCTCACCACGAGCTGGGGACC GTACCTGGTCGGCCTGCAGGCGTGGCACATCGCGTCGGAGTACGCGACCCACGCCGACGACATCGGGGTCCCCGTCC CCGCGGAGCGGGCCGCCTCCCGGCTCGACTGGCGCCTCGCCTTCTCCCAGTACGCGGTCGAGGAGTGCGAGCTGGGC CTTACGGTCGAGCCCGCCGAGGGCGACAGTGTGCTCGTGCGGGACGGGGCCGGGGCCGGGGCCGAACTCGTACTGAC CCGTGAGCAGTTCGTGGCCGCGGTCAGCGCCCGGCTGCCGTACGACGCCGTCGCCGACGACCCCGCCGTTCACGCGC TGCTACGGCGCATGACGGTGCTGGTGGGGCCGTGA(SEQ ID NO. :3)
[0111] 在本發(fā)明的一個(gè)優(yōu)選地實(shí)施方式中,mshA基因的多核苷酸序列如下所示:
[0112] GTGAGCCAGTACGTCAGCAGGCTCCAGCGTCGCTCCCAGGCCGCCACCCCCCGGCTGCGCCTGCACCGC CGCCCCCGCCGCGTCGCCATGCTCTCCGTGCACACCTCGCCGCTGCACCAGCCGGGCACCGGCGACGCGGGCGGCAT GAACGTCTACATCGTGGAGCTCGCCCAGCGCCTCGCCGCGATCAACATCGAGGTGGAGATCTTCACGCGGGCGACCA CCGGCGGACTCCCGCACTCGGTCGAGCTCGCCCCGGGCGTCCTCGTCCGGCATGTCGACGCCGGCCCGTACGAGGGC CTGGCCAAGGAGGAGCTGCCCGCGCAGCTGTGCGCCTTCACGCACGGCGTGATGCAGGCGTGGGCGGGCCACCGCCC CGGCTACTACGACCTGGTGCACTCGCACTACTGGCTTTCCGGCCACGTCGGCTGGCTCGCCGCCCAGCGCTGGGGCA CCCCCCTGGTGCACGCCATGCACACCATGGCCAAGGTCAAGAACGCCAACCTGGCCGACGGCGACACCCCCGAGCCC GCCGCCCGTGTCATCGGCGAGACCCAGATCGTCGCCGCAGCGGACCGCCTCATCGCCAACACCGCCGAGGAGCGCGA CGAACTCGTACGGCACTACGCCGCCGACCCCGACAAGGTCGCGGTCGTGCACCCCGGCGTGAACCTCGACCGCTTCC GCCCCGCCGACGGCCGCGCGGCCGCCCGCGCCCGCCTCGGGCTGCCCCAGGACGCCCTGATCCCGCTGTTCGCGGGC CGCATCCAGCCCCTGAAGGCCCCCGACGTGCTCCTGCGCGCCGTGGCGGTCCTCCTGGACGAACGCCCCGACCTGCG CTCCCGCCTCCTCGTCCCGGTCGTCGGCGGTCTCAGCGGCAGCGGCCTCGCCAAGCCGGAGGGCCTCCAGAAGCTGG CCTCCCGCCTCGGTATCGCGGACGTCGTACGGTTCCACCCGCCCGTCGGGCAGGAGCAGCTCGCCGACTGGTTCCGG GCCGCCTCCGTGCTCGTCATGCCGTCGTACA