專利名稱:新基因簇的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及微生物遺傳資源和基因工程領(lǐng)域,并且尤其涉及免疫抑制劑薩菲菌素 A及相關(guān)類似物的生物合成基因簇的克隆、序列分析、體內(nèi)功能驗(yàn)證及其應(yīng)用。
背景技術(shù):
免疫抑制劑薩菲菌素A(SFA)是由鏈霉菌A92-308110 (Sti^ptomyces sp. A92-308110,也稱為淡黃鏈霉菌(Sti^ptomyces flaveolus)或鏈霉菌DSM9954)產(chǎn)生的聚酮化合物-肽混合天然產(chǎn)物(Sanglier等,1999 ;Fehr等,1999 ;WO 97/02285)。至今已經(jīng)公開(kāi)了 20多種薩菲菌素結(jié)構(gòu)類似物的分離,SFA在這些類似物中具有最高的免疫抑制活性之一(Kallen等,2005 ;Sanglier等,1999)。從結(jié)構(gòu)上來(lái)看SFA中22元大環(huán)內(nèi)酯骨架由聚酮化合物碳鏈和三肽鏈組成。該肽鏈包含一個(gè)天然氨基酸纈氨酸,以及兩個(gè)非天然氨基酸⑶-m-酪氨酸和(S)-六氫噠嗪-3-羧酸((幻-piperazic acid),它們以酰氨鍵連接, 并且六氫噠嗪-3-羧酸1位氮原子參與酰氨鍵的形成,這是在迄今分離的所有含有六氫噠嗪-3-羧酸結(jié)構(gòu)的天然產(chǎn)物中唯一一例。此外,一個(gè)螺環(huán)單元通過(guò)一條聚酮化合物長(zhǎng)鏈和大環(huán)內(nèi)酯相連,形成提籃式結(jié)構(gòu)。螺環(huán)部分含有九個(gè)手性中心(SFA總共具有17個(gè)),中間含有一個(gè)季碳中心,這在目前描述的天然產(chǎn)物中是獨(dú)特的。已從鏈霉菌Α92-308110(淡黃鏈霉菌)的發(fā)酵肉湯中直接分離了一系列類似物,包括薩菲菌素B、C、D、E、F、G、H、I、J、 K 和 L(Fehr 等,1999,Sanglier 等,1999,W098/07743)。特別地,已顯示薩菲菌素 B(SFB) 在MLR測(cè)試法中具有比SFA更高的免疫抑制活性(Sanglier等,1999)。盡管經(jīng)過(guò)大量的努力實(shí)現(xiàn)了 SFA及其大環(huán)類似物的總合成Gedrani等2003 ;Nicolau等,1999 ;I^aquette等, 2002 ;Metternich等,1999),但是沒(méi)有對(duì)其生物合成途徑進(jìn)行具體的體內(nèi)和體外研究。SFA具有強(qiáng)的免疫抑制活性(Powell和Zheng,2006),抑制HIV和HCV感染(Zander 等,2003 ;Sokolskaja等,2004 ;Watashi等,2005),以及阻止由于線粒體膜通透性轉(zhuǎn)運(yùn)孔 (MPTP)病理性開(kāi)放導(dǎo)致的嚴(yán)重的心臟細(xì)胞死亡(Clarke等,2002)。與目前臨床使用的免疫抑制劑,諸如環(huán)孢菌素(CsA) JK506和雷帕霉素(rapamycin)相比,SFA有相似的作用機(jī)制,但是又具有不同的效應(yīng)靶點(diǎn)(H^rtel等,2006,Zhang&Liu.,2001 ;Zenke等,2001)。CsA 作用于親環(huán)蛋白A(CypA) (Handschumacher等,1984),F(xiàn)K506和雷帕霉素與HiBP結(jié)合形成復(fù)合物Gchreiber,1991);而CsA-CypA復(fù)合物及H(506-FKBP復(fù)合物與相同的目標(biāo)蛋白鈣依賴磷酸酶(calcineurin)相互作用,由此抑制鈣依賴磷酸酶的絲氨酸/蘇氨酸磷酸酶活性,并且阻斷細(xì)胞因子產(chǎn)生,尤其是阻斷了白細(xì)胞介素2 (IL-2)的轉(zhuǎn)錄,其最終導(dǎo)致T細(xì)胞阻滯在(VG1期(Liu等,1991)。Rap-FKBP復(fù)合物與蛋白激酶FRAP (也稱為RAFT或mTOR) 相互作用(Brown等,1994),并且阻止了 T細(xì)胞上IL-2受體的磷酸化,使T細(xì)胞生長(zhǎng)被阻斷在Gl-S期。而已顯示SFA與親環(huán)蛋白諸如親環(huán)蛋白A和B結(jié)合,并且抑制它們的異構(gòu)酶活性(Zenke等,2001),目前SFA-CypA復(fù)合物的效應(yīng)蛋白仍然未知。由于現(xiàn)在仍未能發(fā)現(xiàn)SFA-CypA復(fù)合物的效應(yīng)蛋白,所以提示SFA的免疫抑制活性并不是通過(guò)SFA-CypA復(fù)合物直接介導(dǎo)的。近3年來(lái),眾多的科學(xué)小組研究發(fā)現(xiàn),SFA可以競(jìng)爭(zhēng)性阻止NF- κ B與P53基因上游的轉(zhuǎn)錄位點(diǎn)結(jié)合從而活化P53,進(jìn)而抑制信號(hào)通路下游的Cyclin E-cdk2的磷酸化,由此抑制應(yīng)答IL-2引起的Rb高磷酸化,使得細(xì)胞對(duì)IL-2不敏感,其使得細(xì)胞停留在Gl-S期ahang&LiudOOl)。其次,SFA以一種未知的機(jī)制在不影響人類樹(shù)突細(xì)胞生長(zhǎng)的情況下抑制了 IL-12p7°的產(chǎn)生(Meinschulte等,200;3)。IL_12p7° 在調(diào)控Thl和NK細(xì)胞增殖方面起著關(guān)鍵的作用,是連接先天性免疫和獲得性免疫的橋梁。 此外,由于現(xiàn)有可商購(gòu)的免疫抑制藥物會(huì)產(chǎn)生嚴(yán)重的腎毒性和中樞神經(jīng)系統(tǒng)毒性副作用 (Paquette等,200 ,因此阻礙了它們?cè)谝恍┟庖呤д{(diào)疾病方面的應(yīng)用(例如,鈣依賴磷酸酶(calcineurin)同時(shí)是CsA和Π(506的免疫抑制活性和毒性的根本原因)。為了開(kāi)發(fā)可替代的免疫抑制劑或免疫修飾劑,其他組已經(jīng)將SFA作為新一代低毒的高效免疫抑制劑進(jìn)行了一些開(kāi)發(fā)(W097/02285)。利用X射線衍射對(duì)SFA大環(huán)片段和CypA之間結(jié)構(gòu)-活性關(guān)系研究表明三肽結(jié)構(gòu)嵌入在CypA的溝內(nèi)并且對(duì)結(jié)合至關(guān)重要,而分別位于17位和14位上的側(cè)鏈羥基和羰基對(duì)于結(jié)合不太重要;飽和C18-C20位反式二烯的缺失使結(jié)合常數(shù)降低7倍,提示反式二烯對(duì)構(gòu)象有穩(wěn)定作用Gedrani等,200 。計(jì)算機(jī)建模研究顯示SFA螺環(huán)單元也對(duì)穩(wěn)定SFA-CypA 的結(jié)合有貢獻(xiàn)(Pemberton等,2003)。完整的SFA-CypA復(fù)合物的晶體結(jié)構(gòu)顯示SFA-CypA和 CsA-CypA的結(jié)合區(qū)域基本相同,并且SFA和CsA都主要和W121、R55、H126、N102和Q63殘基相互作用;大環(huán)和螺環(huán)部分之間的C24-C32鏈和CypA的I57、T119和W121殘基有范德華作用,另外與CypA的晶體結(jié)構(gòu)相比,SFA聚酮化合物長(zhǎng)鏈的存在改變了 W121側(cè)鏈取向;螺環(huán)單元中,只有甲基C45和CypA的157和F60的側(cè)鏈原子有范德華作用(Kallen等,2005)。SFA-CypA復(fù)合物可以以二聚體形式穩(wěn)定存在,如通過(guò)凝膠過(guò)濾色譜所證實(shí)的那樣。根據(jù)晶體分析發(fā)現(xiàn),除了螺二環(huán)和α-酮基丁酸酯部分之外,SFA所有的剩余部分都深深的埋入二聚體中;Ε,Ε- 二烯區(qū)域C18-C22雖然不參與和CypA的直接接觸,但卻和二聚體中相鄰SFA的間位酪氨酸有范德華作用,其有利于復(fù)合物中二聚體的締合;兩個(gè)SFA分子在C18-C22中彼此間有范德華力作用;并且,二聚體復(fù)合物中一個(gè)CypA分子的W121和另一 CypA分子的R148有直接氫鍵連接。應(yīng)用已知產(chǎn)生SFA的鏈霉菌,即鏈霉菌Α92_308110(淡黃鏈霉菌),本發(fā)明人克隆了其生物合成基因簇,并采用微生物學(xué)、分子生物學(xué)、生物化學(xué)及有機(jī)化學(xué)相結(jié)合的方法進(jìn)一步研究SFA的生物合成。通過(guò)對(duì)生物合成的研究,揭示了產(chǎn)生諸如六氫噠嗪-3-羧酸的獨(dú)特化學(xué)結(jié)構(gòu)的酶學(xué)機(jī)理。在此基礎(chǔ)上,對(duì)SFA的生物合成途徑進(jìn)行了遺傳修飾,并產(chǎn)生了新的化合物。由于本發(fā)明能夠商業(yè)應(yīng)用重組DNA技術(shù)和生物合成工程,以提高薩菲菌素的產(chǎn)量和新薩菲菌素類似物的產(chǎn)生,因此本發(fā)明尤其有用。發(fā)明概述本發(fā)明有利地提供了參與產(chǎn)生生物合成基因產(chǎn)物、尤其是薩菲菌素生物合成的新 DNA序列和蛋白質(zhì)。該基因和蛋白的特定實(shí)施方案在所附序列表和以下描述中得以詳細(xì)描述。SEQ ID No. 1提供了負(fù)責(zé)薩菲菌素A生物合成的的核酸。因此,本發(fā)明涉及一種由鏈霉菌A92-308110 (淡黃鏈霉菌)(可從DSMZ, Braunschweig,Germany作為鏈霉菌DSM 9954獲得)產(chǎn)生的免疫抑制性的聚酮化合物-非核糖體肽天然產(chǎn)物SFA的生物合成基因簇的克隆、序列分析、功能驗(yàn)證、體外生化分析及其應(yīng)用。此外,對(duì)產(chǎn)生薩菲菌素的生物合成途徑的編碼基因進(jìn)行了靶向改變,導(dǎo)致了產(chǎn)生新薩菲菌素類似物的微生物菌株。本發(fā)明允許通過(guò)對(duì)參與薩菲菌素A生物合成的基因和蛋白的生物合成工程,從而直接操作薩菲菌素A及相關(guān)的化學(xué)結(jié)構(gòu)。這些化學(xué)修飾可能是由于結(jié)構(gòu)的復(fù)雜性而不能或不容易通過(guò)化學(xué)方法而實(shí)現(xiàn)的。以這一方式分離和表征的基因簇使得能夠靶向優(yōu)化薩菲菌素和薩菲菌素類似物的產(chǎn)生,例如,通過(guò)加倍基因簇、或該基因簇的一部分,通過(guò)應(yīng)用質(zhì)粒載體和非天然啟動(dòng)子過(guò)量表達(dá)基因(尤其是正向調(diào)控基因),或通過(guò)失活負(fù)向調(diào)控子。此外,該測(cè)序的和所表征的基因簇使得能夠靶向性生物合成制備薩菲菌素類似物,其許多實(shí)例均包括在本發(fā)明中。實(shí)例包括以下 失活編碼參與分別的生物合成步驟的蛋白的基因,例如通過(guò)基因破壞(例如參見(jiàn),WO 2004/007709 ;WO 2004/058976) 替換編碼參與分別的生物合成步驟的蛋白的基因,通過(guò)基因替換或通過(guò)破壞并隨后分開(kāi)表達(dá)來(lái)自其它生物合成途徑的基因(例如,參見(jiàn)feiisser等,2001 ;W0 01/79520 ; WO 2005/054266 ;W02005/054265)。 用來(lái)自其它PKS或NRPS簇的模塊或結(jié)構(gòu)域替換聚酮化合物合酶(“H(S”)或非核糖體肽合酶(“NRPS”)中的分別的模塊或結(jié)構(gòu)域,從而使得產(chǎn)生新的薩菲菌素類似物 (例如,如在 Oliynyk 等,1996 ;W098/01546 ;WO 00/01827 ;Staunton 和 Wilkinson,2001 ; Sheehan等,2006中所描述的那樣。) 應(yīng)用該基因序列以鑒定來(lái)自其它生物的相關(guān)生物合成簇,例如通過(guò)用作DNA探針(參見(jiàn)例如,Shen 等,2002 ;Liu 等,2002 ;Li 等,2004 ;Huang 等,2005 Jia 等,2006 ;Fang 等,2008)。因此,根據(jù)本發(fā)明的第一方面,提供了分離的核酸分子,其包含(a)包含SEQ ID No. 1的薩菲菌素A生物合成基因簇核酸;(b)與(a)的核酸具有至少80%序列同一性(例如,至少85%或90%或95%或 96%或97%或98%或99%的序列同一性),并且其編碼的多肽和由(a)的核酸編碼的那些多肽具有用于制備聚酮化合物或聚酮化合物起始單元的相同的用酶活性和調(diào)控活性;(c)核酸,其編碼與由(a)的核酸編碼的一種或多種多肽具有至少80%氨基酸序列同一性(例如,至少85%或90%或95%或96%或97%或98%或99%的序列同一性)的一種或多種多肽,并且其編碼的一種或多種多肽具有制備聚酮化合物或聚酮化合物起始單元或前體所需的一種或多種酶活性或調(diào)控活性;
(d) (a)、(b)或(C)的核酸部分,其編碼聚酮化合物合酶或非核糖體肽合酶多肽; 或者任一聚酮化合物合酶或非核糖體肽合酶多肽、或聚酮化合物起始單元或前體生物合成基因產(chǎn)物或聚酮化合物生物合成調(diào)控多肽的酶活性模塊;或(e) (d)的核酸部分,其編碼聚酮化合物合酶或非核糖體肽合酶多肽的酶活性結(jié)構(gòu)域;或者任一聚酮化合物合酶或非核糖體肽合酶多肽、或聚酮化合物起始單元或前體生物合成基因產(chǎn)物或聚酮化合物生物合成調(diào)控多肽的酶活性模塊的酶活性結(jié)構(gòu)域。在下述內(nèi)容中將詳細(xì)描述本發(fā)明的這一方面和其他方面。定義本文所使用的冠詞“一”、“一個(gè)”涉及一個(gè)或超過(guò)一個(gè)(即至少一個(gè))該冠詞的文法客體。例如,“一種類似物”的意思是一種類似物或超過(guò)一種類似物。本文所使用的術(shù)語(yǔ)“類似物”是指與另一化學(xué)物結(jié)構(gòu)上類似、但是在構(gòu)成上有細(xì)微區(qū)別的化合物(如通過(guò)另一原子置換一個(gè)原子,或存在或缺失特定的官能團(tuán))。本文所使用的術(shù)語(yǔ)“聚酮化合物”是指由涉及聚酮化合物合酶(PKS)的生物合成產(chǎn)生的任何分子。這還可以包括來(lái)自非核糖體肽合酶(NRPQ結(jié)構(gòu)域的一些元件和/或其他生物合成修飾,諸如甲基化或羥基化。本文所使用的術(shù)語(yǔ)“雜化聚酮化合物(hybrid polyketide) ”是指由涉及聚酮化合物合酶(PKS)的生物合成產(chǎn)生的任何分子,其中通過(guò)人為干預(yù)改變了編碼該聚酮化合物合酶的基因簇,從而產(chǎn)生不同的生物合成產(chǎn)物。這還可以包括來(lái)自非核糖體肽合酶結(jié)構(gòu)域的一些元件和/或其他生物合成修飾,諸如甲基化或羥基化。改變本身可包括但不限于,結(jié)構(gòu)域(例如,?;D(zhuǎn)移酶結(jié)構(gòu)域)的定向誘變,來(lái)自相同或異源PKS或NRPS簇的結(jié)構(gòu)域、模塊或基因的置換。如本文所使用的術(shù)語(yǔ)“高嚴(yán)格條件”是指其中僅有非常密切相關(guān)或同一的DNA序列可雜交的條件。這在Southern雜交中通常通過(guò)升高洗滌緩沖液的溫度來(lái)實(shí)現(xiàn)。對(duì)于寡核苷酸探針,可在比Tm高5°C的溫度對(duì)完全匹配的序列進(jìn)行雜交步驟,其中應(yīng)用公式計(jì)算Tm, 諸如Tm = 4X (GC堿基對(duì)數(shù))+2X (AT堿基對(duì)數(shù))。在以下標(biāo)題“核酸雜交”中給出了高嚴(yán)格條件的實(shí)例。本文所使用的與核酸序列、尤其是薩菲菌素生物合成簇或其部分相關(guān)的術(shù)語(yǔ)“異源宿主”是指天然不含有此類核酸序列的宿主。本文所使用的術(shù)語(yǔ)“異源”,例如與薩菲菌素PKS或NRPS的結(jié)構(gòu)域或模塊相關(guān)時(shí), 其意思是在該P(yáng)KS或NRPS中不天然存在的結(jié)構(gòu)域或模塊。本文所使用的術(shù)語(yǔ)“非天然的”,例如與薩菲菌素PKS或NRPS的結(jié)構(gòu)域或模塊相關(guān)時(shí),其意思是在該P(yáng)KS或NRPS中不天然存在于該位置中的結(jié)構(gòu)域或模塊;例如其可能是異源的(即,來(lái)自不同的PKS或NRPS),或其可以是存在于該同一 PKS或NRPS的不同位置。本發(fā)明化合物諸如式(I)化合物的可藥用鹽包括從可藥用無(wú)機(jī)的或有機(jī)的酸或堿形成的常規(guī)鹽,以及季銨酸加成鹽。合適的酸鹽的更具體實(shí)例包括鹽酸鹽、氫溴酸鹽、硫酸鹽、磷酸鹽、硝酸鹽、高氯酸鹽、富馬酸鹽、醋酸鹽、丙酸鹽、琥珀酸鹽、乙醇酸鹽、蟻酸鹽、 乳酸鹽、馬來(lái)酸鹽、酒石酸鹽、檸檬酸鹽、棕櫚酸鹽、丙二酸鹽、羥基馬來(lái)酸鹽、苯醋酸鹽、谷氨酸鹽、苯甲酸鹽、水楊酸鹽、富馬酸鹽、甲苯磺酸鹽、甲磺酸鹽、萘-2-磺酸鹽、苯磺酸羥萘甲酸鹽、氫碘酸鹽、蘋果酸鹽、硬脂酸鹽、單寧酸鹽等。鹽酸鹽是特別有益的。其他酸,諸如
12草酸,盡管其本身不是可藥用的,但可用于制備用作中間體的有用鹽,獲得本發(fā)明的化合物及其可藥用鹽。合適的堿鹽的更具體的實(shí)例包括鈉鹽、鋰鹽、鉀鹽、鎂鹽、鋁鹽、鈣鹽、鋅鹽、 N,N' -二芐乙烯二胺鹽、氯普魯卡因鹽、膽堿鹽、二乙醇胺鹽、乙二胺鹽、N-甲葡糖胺鹽和普魯卡因鹽。下文提及根據(jù)本發(fā)明的化合物時(shí),其包括式(I)化合物及它們的可藥用鹽。烷基、烯基和炔基可以是直鏈或支鏈的。烷基,例如C1-C4烷基的實(shí)例包括甲基、乙基、正丙基、異丙基和正丁基。發(fā)明詳述根據(jù)本發(fā)明的全基因簇包含M個(gè)基因(SEQ ID NO 1)的核苷酸序列或其互補(bǔ)序列,其包括· 1個(gè)非核糖體肽合酶(NRPQ基因sfaD,其包含共包含3個(gè)模塊,10個(gè)功能結(jié)構(gòu)域,并且負(fù)責(zé)大環(huán)骨架的肽部分的形成;· 5個(gè)線性聚酮化合物合酶(I3KS)基因sfaE、sfaF、sfaG、sfaH、sfal,負(fù)責(zé)螺環(huán)、 聚酮化合物長(zhǎng)鏈和大環(huán)骨架聚酮化合物部分的形成;· 1個(gè)重復(fù)型聚酮化合物合酶基因sfaK,其包含4個(gè)功能結(jié)構(gòu)域,負(fù)責(zé)在生物合成不尋常的7-碳延伸單元途經(jīng)中使用的特殊6-碳前體的生物合成;· 3個(gè)基因,sfaA, sfaB、sfaj,其負(fù)責(zé)非天然氨基酸前體結(jié)構(gòu)單元的生物合成;· 7 個(gè)基因,sfaM, sfaN、sfaP、sfaQ、sfaL、sfaR、sfaO,其負(fù)責(zé)前體諸如用于起始單元的那些前體的生物合成;· 1個(gè)調(diào)控基因sfaC,其與SFA發(fā)酵產(chǎn)量相關(guān);· 1個(gè)MbtH蛋白的編碼基因,sfaS,認(rèn)為與NRPS的調(diào)控相關(guān)聯(lián);以及· 5 個(gè)未知功能基因 sfaUl、sfaU2、sfaVl、sfaV2、sfaV3。因此,本發(fā)明還提供了包含以下一種或多種的分離核酸分子(a)選自sfaE、 sfaF, sfaG、sfaH和sfal的線性PKS基因,或(b)NPRS基因sfaD,或(C)重復(fù)型PKS基因 sfaK,或(d)選自 sfaA、sfaB、sfaj、sfaM、sfaN、sfaP、sfaQ、sfaL、sfaO 的起始單元或前體生物合成基因,或(e)調(diào)控基因sfaC,或(f)MtbH蛋白編碼基因sfaS,或(g)或巴豆酰輔酶 A還原酶基因sfaR,或(h)選自sfaUU sfaU2、sfaVl、sfaV2和sfaV3的未知功能基因。前述基因一般地由編碼SEQ ID No. 2-25的蛋白質(zhì)的核酸定義。具體地,本發(fā)明提供了分離的核酸分子,其包含以下一種或多種(a)選自SEQ ID No. 1 殘基 30707-37360 處的 sfaE、SEQ ID No. 1 殘基 37394-50014 處的 sfaF、SEQ ID No. 1 殘基 50017-60903 處的 sfaG、SEQ ID No. 1 殘基 60918-85823 處的 sfaH 和 SEQ ID No. 1 殘基85823-96040處的sfal的線性PKS基因,或(b) SEQ ID No. 1殘基19885-30714處的 NPRS 基因 sfaD,或(c) SEQ ID No. 1 殘基 97396-101840 處的重復(fù)型 PKS 基因 sfaK,或(d) 選自 SEQ ID No. 1 殘基 17024-17854 處的 sfaA、SEQ ID No. 1 殘基 17851-19191 處的 sfaB、 SEQ ID No. 1 殘基 96225-97391 處的 sfaj、SEQ ID No. 1 殘基 103210-103929 處的 sfaM、 SEQ ID No. 1 殘基 104001-105023 處的 sfaN、SEQ ID No. 1 殘基 105366-107216 處的 sfaP、 SEQ ID No. 1 殘基 107366-108145 處的 sfaQ、SEQ ID No. 1 殘基 101936-103213 處的 sfaL、 SEQ ID No. 1殘基105091-105345處的sfaO的起始單元或前體生物合成基因,或(e) SEQ ID No. 1 殘基 19193-19888 處的調(diào)控基因 sfaC,或(f) SEQ ID No. 1 殘基 109583-109798 處的MtbH蛋白編碼基因sfaS,或(g)或SEQ ID No. 1殘基108150-109511處的巴豆酰輔酶A還原酶基因 sfaR,或(h)選自 SEQ ID No. 1 殘基 14973-15413 處的 sfaUl、SEQ ID No. 1 殘基 15596-16063 處的 sfaU2、SEQ ID No. 1 殘基 109776-110312 處的 sfaVl、SEQ ID No. 1 殘基 111285-111743 處的 sfaV2 和 SEQ ID No. 1 殘基 112218-112652 處的 sfaV3 的未知功能基因;或包含編碼一種或多種與上述基因編碼的那些多肽相同的多肽、但其僅由于遺傳密碼的豐余性而不同的核酸序列;或包含在高嚴(yán)格條件下能與一種或多種上述基因序列雜交的核酸序列;或包含這樣的核酸序列,所述核酸序列與一種或多種上述基因序列具有至少 70%、75%、80%、85%、90%、95%、96%、97%、98%或 99% 同一性,并編碼與相應(yīng)的基因產(chǎn)物具有相同功能的多肽;或包含編碼一種或多種和前述基因編碼的一種或多種多肽具有至少80%氨基酸序列同一性(例如,至少85%或90%或95%或96%或97%或98%或99%序列同一性)、并且具有相同功能的多肽的核酸序列;或包含一種或多種前述基因的至少50、 100,200或500個(gè)連續(xù)核苷酸的片段;或任一前述核酸序列的互補(bǔ)序列。還提供了分離的核酸分子,其包含以下一種或多種(a)來(lái)自PKS基因的模塊或結(jié)構(gòu)域,其中所述的PKS基因選自SEQ ID No. 1殘基30707-37360處的sfaE、SEQ ID No. 1 殘基 37394-50014 處的 sfaF、SEQ ID No. 1 殘基 50017-60903 處的 sfaG、SEQ ID No. 1 殘基 60918-85823 處的 sfaH 或 SEQ ID No. 1 殘基 85823-96040 處的 sfal,或(b) SEQ ID No. 1殘基19885-30714處的NPRS基因sfaD的模塊或結(jié)構(gòu)域,或(c) SEQ ID No. 1殘基 97396-101840處的重復(fù)型PKS基因sfaK的模塊或結(jié)構(gòu)域;或包含編碼與上述基因編碼的那些多肽相同的多肽的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域、但其僅由于遺傳密碼的豐余性而不同的核酸序列;或包含在高嚴(yán)格條件下能與一種或多種上述核酸分子雜交的核酸序列;或包含這樣的核酸序列,所述核酸序列與一種或多種上述核酸分子具有至少70%的同一性,并編碼與相應(yīng)的基因產(chǎn)物的模塊或結(jié)構(gòu)域具有相同功能的多肽;或包含編碼一種或多種和由前述基因的模塊或結(jié)構(gòu)域編碼的一種或多種多肽具有至少80%氨基酸序列同一性、并且具有相同功能的多肽的核酸序列;或包含前述基因的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域的至少50個(gè)連續(xù)核苷酸的片段;或任一前述核酸序列的互補(bǔ)序列?;虻哪K或結(jié)構(gòu)域是基因中的一部分,其編碼相應(yīng)基因產(chǎn)物的模塊或結(jié)構(gòu)域。還提供了基于SEQ ID No. 1的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中一個(gè)或多個(gè)(例如,一個(gè))結(jié)構(gòu)域、模塊或基因被缺失、被突變以使酶功能或調(diào)節(jié)功能失活或減少活性,被突變以具有改變的功能,或由替代物替換,或其中插入了一個(gè)或多個(gè)(例如,一個(gè))非天然的結(jié)構(gòu)域、模塊或基因,例如,其中由(a)來(lái)自薩菲菌素A生物合成基因簇其他位置的結(jié)構(gòu)域、模塊或基因或(b)與薩菲菌素A生物合成基因簇異源的結(jié)構(gòu)域、模塊或基因替換一個(gè)或多個(gè)(例如,一個(gè))結(jié)構(gòu)域、模塊或基因,或其中一個(gè)或多個(gè)(例如,一個(gè))結(jié)構(gòu)域、模塊或基因被突變,以使酶功能或調(diào)節(jié)功能失活或減少活性。例如,提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了一個(gè)或多個(gè)選自 sfaE、F、G、H和I的PKS基因,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊,例如由此插入了一個(gè)或多個(gè)來(lái)自SFA生物合成基因簇其他位置、或來(lái)自異源聚酮化合物生物合成基因簇的結(jié)構(gòu)域或模塊??蓞⒖紙D7看到PKS基因sfaE、F、G、H和I的模塊。因此,所述模塊可一般地包含 KS-AT-ACP 或 KS-AT-DH-KR-ACP 或 KS-AT-KR-ACP 或 KS-AT-DH-ER-KR-ACP 結(jié)構(gòu)域。
例如-AT結(jié)構(gòu)域可由具有不同底物特異性的來(lái)自異源PKS或來(lái)自該SFAPKS中其他位置的AT結(jié)構(gòu)域替換;和/或-DH結(jié)構(gòu)域可被缺失或使其失活;和/或-可將來(lái)自SFA PKS或來(lái)自異源PKS的DH結(jié)構(gòu)域插入模塊中;-ER結(jié)構(gòu)域可被缺失或使其失活;和/或-可將來(lái)自SFAPKS或來(lái)自異源PKS的ER結(jié)構(gòu)域插入模塊中;-給定模塊(意思是當(dāng)存在時(shí)的DH-KR或DH-ER-KR或KR結(jié)構(gòu)域)中的還原環(huán)可由具有不同元件的還原環(huán)替換。在一個(gè)實(shí)施方案中,模塊13的AT結(jié)構(gòu)域可由具有不同底物特異性(例如,對(duì)甲基丙二?;哂刑禺愋?的來(lái)自SFA PKS或來(lái)自異源H(S的AT結(jié)構(gòu)域替換。這一特定的突變導(dǎo)致在14位中引入甲基。在一個(gè)實(shí)施方案中,模塊1、3、6、7、8、10、11中13中的一個(gè)或多個(gè)模塊的DH結(jié)構(gòu)
域被缺失或失活。這些特定的突變導(dǎo)致將一個(gè)或多個(gè)羥基引入分子,例如在位置21和/或 25。還提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了 NRPS基因sfaD,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。還提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了調(diào)節(jié)基因sfaC,以提高或降低其活性,或該基因被缺失。還提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了重復(fù)型PKS基因sfaK, 由此一個(gè)或多個(gè)結(jié)構(gòu)域被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然結(jié)構(gòu)域,例如由此插入了一個(gè)或多個(gè)來(lái)自SFA生物合成基因簇其他位置、或來(lái)自異源聚酮化合物生物合成基因簇的結(jié)構(gòu)域??蓞⒖紙D7看到重復(fù)型PKS基因sfaK的模塊。因此,該模塊包含KS-AT-ACP-KR 結(jié)構(gòu)域。還提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中缺失了選自sfaA、B、J、M、N、P、 Q、L和0的一個(gè)或多個(gè)起始單元或前體生物合成基因,或?qū)ζ溥M(jìn)行了修飾,以降低它們的活性,或?qū)λ鼈冞M(jìn)行修飾或替換以改變它們的底物選擇性。還提供了產(chǎn)生雜化聚酮化合物的基因簇核酸,其中一個(gè)或多個(gè)起始單元或前體生物合成基因或一個(gè)或多個(gè)含有一個(gè)或多個(gè)起始單元或前體生物合成基因的操縱子被缺失、 或被突變以失活、或與天然基因或操縱子相比在產(chǎn)生所述起始單元或前體方面的活性減少。本發(fā)明這一方面的更優(yōu)選的實(shí)施方案包括編碼SEQ ID No. 1的PKS或NRPS 的結(jié)構(gòu)域的分離的核酸,殘基 19885-30714、30707-37360、37394-50014、50017-60903、 60918-85823、85823-96040。這些核酸可單獨(dú)使用,或與編碼其他PKS或NRPS結(jié)構(gòu)域或模塊的核酸聯(lián)合作為中間體使用,例如,用于構(gòu)建重組載體。本發(fā)明還提供了用于鑒定、分離和克隆包括任一個(gè)上述DNA片段的核酸的方法。 優(yōu)選的方法例如包括以下步驟
a)建立基因組DNA庫(kù)(例如,粘粒文庫(kù))b)在本發(fā)明DNA序列的幫助下篩選這一庫(kù)c)分離鑒定為陽(yáng)性的克隆。用于鑒定參與薩菲菌素生物合成的DNA片段的一般方法例如包括以下步驟a.可通過(guò)對(duì)粘粒文庫(kù)實(shí)施DNA印跡法,用來(lái)自SEQ ID No. 1的DNA片段(例如 Ikb)作為探針,找出與薩菲菌素簇同源的克隆片段,從而分離與薩菲菌素基因簇同源的 DNA片段。b.然后獲得看起來(lái)與探針雜交的粘粒,并DNA測(cè)序。c.然后通過(guò)用經(jīng)標(biāo)記的上述分離的粘粒作為探針探測(cè)粘粒文庫(kù),獲得含有重疊 DNA的粘粒,從而分離相鄰DNA區(qū)域。其他方法描述于Maniatis等,1998,Sambrook and Russell,2001 以及Kieser 等, 1999。本發(fā)明還提供了編碼一種未知功能蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID NO 2所示,并且命名為sfaUl,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置 14976至堿基位置1M13所示。本發(fā)明還提供了編碼另一未知功能蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID NO 3所示,并且命名為sfaU2,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置 15596至堿基位置16063所示。本發(fā)明還提供了編碼苯丙氨酸間位羥化酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO 4所示,并且命名為sfaA,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置 17024至堿基位置17邪4所示。本發(fā)明還提供了編碼鳥(niǎo)氨酸N5-加氧酶的核苷酸序列。其編碼的氨基酸序列如 SEQ ID NO :5所示,并且命名為sfaB,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 17851至堿基位置19191所示。本發(fā)明還提供了編碼轉(zhuǎn)錄調(diào)控因子的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO 6所示,并且命名為sfaC,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置19193至堿基位置19888所示。本發(fā)明還提供了編碼非核糖體肽合成酶的核苷酸序列,其中所述的非核糖體肽合成酶包含功能結(jié)構(gòu)域C、A、PCP、C、A、PCP、C、A、PCP、C,并且負(fù)責(zé)大環(huán)骨架的肽部分的生物合成。其編碼的氨基酸序列如SEQ ID NO :7所示,并且命名為sfaD,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置19885至堿基位置30714所示。本發(fā)明還提供了編碼聚酮化合物合酶的核苷酸序列,其中所述的聚酮化合物合酶包含功能結(jié)構(gòu)域ACP、KS、AT、DH、ER、KR、ACP,并且負(fù)責(zé)螺環(huán)部分的前體的生物合成。其編碼的氨基酸序列如SEQ ID NO 8所示,并且命名為sfaE,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置30707至堿基位置37360所示。本發(fā)明還提供了對(duì)應(yīng)用2-乙基丙二酰-S-硫酯 (2-ethylmalonamyl-S-thioester)底物起始PKS生物合成特異的加載結(jié)構(gòu)域(loading domain),其由來(lái)自sfaE的第一個(gè)ACP組成,其相應(yīng)的核苷酸序列如SEQ ID NO=I中堿基位置30707至堿基位置31082所示。
本發(fā)明還提供了編碼聚酮化合物合酶的核苷酸序列,其中所述的聚酮化合物合酶包含功能結(jié)構(gòu)域KS、AT、ACP、KS、AT、KR、ACP、KS、AT、KR、ACP,并且負(fù)責(zé)聚酮化合物長(zhǎng)鏈的生物合成。其編碼的氨基酸序列如SEQ ID N0:9所示,并且命名為sfaF,其相應(yīng)的核苷酸序列如SEQID NO 1中堿基位置37394至堿基位置50014所示。本發(fā)明還提供了編碼聚酮化合物合酶的核苷酸序列,其中所述的聚酮化合物合酶包含功能結(jié)構(gòu)域KS、AT、KR、ACP、KS、AT、DH、ER、KR、ACP,并且負(fù)責(zé)大部分聚酮化合物長(zhǎng)鏈的生物合成。其編碼的氨基酸序列如SEQ ID N0:10所示,并且命名為sfaG,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置50017至堿基位置60903所示。本發(fā)明還提供了編碼聚酮化合物合酶的核苷酸序列,其中所述的聚酮化合物合酶包含功能結(jié)構(gòu)域 KS、AT、DH、KR、ACP、KS、AT、DH、KR、ACP、KS、AT、KR、ACP、KS、AT、DH、KR、 ACP、KS、AT、DH、KR、ACP,并且負(fù)責(zé)大環(huán)骨架的聚酮化合物部分之一部分的生物合成。其編碼的氨基酸序列如SEQ ID NO: 11所示,并且命名為sfaH,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置60918至堿基位置85823所示。本發(fā)明還提供了編碼聚酮化合物合酶的核苷酸序列,其中所述的聚酮化合物合酶包含功能結(jié)構(gòu)域KS、AT、KR、ACP、KS、AT、KR、ACP,并且負(fù)責(zé)大環(huán)骨架的聚酮化合物部分之一部分的生物合成。其編碼的氨基酸序列如SEQ ID N0:12所示,并且命名為sfal,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置85823至堿基位置96040所示。本發(fā)明還提供了編碼鋅指脫氫酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO: 13所示,并且命名為sfaj,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置96225至堿基位置97391所示。本發(fā)明還提供了編碼包含功能結(jié)構(gòu)域KS、AT、ACP、KR的重復(fù)型聚酮化合物合酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID N0:14所示,并且命名為sfaK,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置97396至堿基位置101943所示。本發(fā)明還提供了編碼?;D(zhuǎn)移酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO 15所示,并且命名為sfaL,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置101936至堿基位置103213所示。本發(fā)明還提供了編碼短鏈脫氫酶/還原酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO 16所示,并且命名為sfaM,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置 103210至堿基位置1039 所示。本發(fā)明還提供了編碼?;岷厦傅暮塑账嵝蛄小F渚幋a的氨基酸序列如SEQ ID NO 17所示,并且命名為sfaN,其相應(yīng)的核苷酸序列如SEQ ID NO=I中堿基位置104001至堿基位置105023所示。本發(fā)明還提供了編碼游離?;d體蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID NO 18所示,并且命名為sfaO,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置 105091至堿基位置105345所示。本發(fā)明還提供了編碼天冬酰胺合酶類似物的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO: 19所示,并且命名為sfaP,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 105366至堿基位置107216所示。本發(fā)明還提供了編碼游離硫酯酶的核苷酸序列。其編碼的氨基酸序列如SEQ IDNO 20所示,并且命名為sfaQ,其相應(yīng)的核苷酸序列如SEQ ID NO 1中堿基位置107366至堿基位置108145所示。本發(fā)明還提供了編碼巴豆酰輔酶A還原酶的核苷酸序列。其編碼的氨基酸序列如SEQ ID NO :21所示,并且命名為sfaR,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 108150至堿基位置109511所示。本發(fā)明還提供了編碼MbtH家族蛋白的核苷酸序列,其編碼的氨基酸序列如SEQ ID NO :22所示,并且命名為sfaS,其相應(yīng)的核苷酸序列如SEQID NO 1中堿基位置109583至堿基位置109798所示。本發(fā)明還提供了編碼一種未知功能蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID N0:23所示,并且命名為sfaVl,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 109776至堿基位置110312所示。本發(fā)明還提供了編碼另一未知功能蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID NO : 所示,并且命名為sfaV2,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 111285至堿基位置111743所示。本發(fā)明還提供了編碼另一未知功能蛋白的核苷酸序列。其編碼的氨基酸序列如 SEQ ID N0:25所示,并且命名為sfaV3,其相應(yīng)的核苷酸序列如SEQ ID NO :1中堿基位置 112218至堿基位置112652所示。SEQ ID NO 1的互補(bǔ)序列可根據(jù)DNA堿基互補(bǔ)原則得到。SEQ ID NO 1的核苷酸序列或部分核苷酸序列可以通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或用合適的限制性酶酶切相應(yīng)的 DNA、或使用其他合適的技術(shù)得到。本發(fā)明還提供了獲得至少包含部分SEQ ID NO :1中DNA 序列的重組DNA質(zhì)粒的方法。本發(fā)明還提供了含有間斷的SFA生物合成基因的微生物的方法,至少其中之一的基因包含有SEQ ID NO :1所示的核苷酸序列。根據(jù)本發(fā)明的核苷酸序列或部分核苷酸序列可通過(guò)基于聚合酶鏈?zhǔn)椒磻?yīng)(PCR) 的方法獲得,或與SFA生物合成基因相似的基因可通過(guò)利用包含根據(jù)本發(fā)明序列的DNA片段作為探針以Southern雜交法等方法從其他生物體中得到。包含根據(jù)本發(fā)明的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于從鏈霉菌A92-308110(淡黃鏈霉菌)基因組文庫(kù)中鑒定更多的文庫(kù)質(zhì)粒。這些文庫(kù)質(zhì)粒至少包含根據(jù)本發(fā)明的部分序列,并且還包含有來(lái)自鏈霉菌A92-308110(淡黃鏈霉菌)基因組中鄰近區(qū)域的未克隆的DNA。因此,例如根據(jù)本發(fā)明任一方面的核酸或核苷酸序列是DNA。根據(jù)本發(fā)明的核苷酸序列或至少部分核苷酸序列可以被修飾或突變。這些方法包括插入、替換或缺失,聚合酶鏈?zhǔn)椒磻?yīng),易錯(cuò)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性誘變,不同序列的重新連接,序列的不同部分或與其他來(lái)源的同源序列進(jìn)行DNA改組(DNA shuffling),或通過(guò)UV或化學(xué)試劑誘變等。本發(fā)明還提供了包含上述核酸的重組載體,諸如DNA表達(dá)載體。載體一般含有前述DNA以及一種或多種啟動(dòng)子或其他調(diào)控元件。本發(fā)明的這些載體和方法使得本領(lǐng)域技術(shù)人員獲得能產(chǎn)生聚酮化合物的重組宿主細(xì)胞。因此,本發(fā)明提供了制備聚酮化合物,諸如薩菲菌素A或薩菲菌素A類似物的方法,所述方法包括培養(yǎng)轉(zhuǎn)化的宿主細(xì)胞,其中所述宿主細(xì)
18胞被包含編碼SEQ ID No. 1所述全部或部分薩菲菌素基因簇的核酸的表達(dá)載體轉(zhuǎn)化。本發(fā)明另一方面還提供了可由前述方法產(chǎn)生的、非薩菲菌素A的聚酮化合物。希望的是載體包含編碼功能HiS的核酸,當(dāng)在合適的培養(yǎng)基中培養(yǎng)時(shí),其能夠產(chǎn)生薩菲菌素A或薩菲菌素A 類似物。在一些實(shí)施方案中,轉(zhuǎn)化的宿主細(xì)胞能天然地產(chǎn)生薩菲菌素A。在一些實(shí)施方案中,轉(zhuǎn)化的宿主細(xì)胞不能天然地產(chǎn)生薩菲菌素A。本發(fā)明另一方面還提供了此類轉(zhuǎn)化的宿主細(xì)胞。一個(gè)具體的實(shí)施方案是用包含編碼所有或部分薩菲菌素A生物合成基因簇的核酸的載體(例如,其編碼由SEQ ID No. 1的核酸例示的薩菲菌素A生物合成基因簇)轉(zhuǎn)化的宿主細(xì)胞,其中所述的宿主細(xì)胞不天然產(chǎn)生薩菲菌素A。因此,本發(fā)明還提供了 -由任一前述核酸編碼的一個(gè)多肽或多個(gè)多肽;-由前述編碼一個(gè)或多個(gè)聚酮化合物生物合成蛋白的核酸編碼的聚酮化合物合酶;以及-由模塊核酸或基因簇編碼的雜化蛋白,其中至少一個(gè)結(jié)構(gòu)域或模塊或基因?qū)υ撍_菲菌素A生物合成基因簇而言是非天然的。另一方面,本發(fā)明提供了包含選自SEQ ID No. 2-25的序列的分離多肽;由SEQ ID No. 2-25的多肽中至少10、50、100、200或500個(gè)連續(xù)氨基酸組成的分離的多肽;與上述序列具有至少50%、60%、80%、85%、90%、95%、97%或99%同源性的分離的多肽,其中所述同源性通過(guò)BLASTP (Altschul等,1990)使用缺省參數(shù)確定。本發(fā)明還提供了制備雜化聚酮化合物的方法,所述方法包括用重組載體轉(zhuǎn)化宿主細(xì)胞,其中所述的載體包含編碼SEQ ID No. 1所述全部或部分薩菲菌素基因簇的核酸并且其中至少一個(gè)結(jié)構(gòu)域或模塊或基因?qū)λ_菲菌素A生物合成基因簇而言是非天然的,然后培養(yǎng)該轉(zhuǎn)化的宿主細(xì)胞。本發(fā)明提供了可由前述方法產(chǎn)生的、非薩菲菌素A的聚酮化合物。包含根據(jù)本發(fā)明的核苷酸序列或至少部分核苷酸序列的克隆基因可以通過(guò)合適的表達(dá)系統(tǒng)在異源宿主中表達(dá)以得到相應(yīng)的或更高的酶活性或其他生物活性或產(chǎn)量。這些異源宿主包括鏈霉菌、假單孢菌、大腸桿菌、芽孢桿菌、酵母、植物和動(dòng)物等。本領(lǐng)域技術(shù)人員公知聚酮化合物基因簇可在異源宿主中表達(dá)(Pfeifer等, 2001)。因此,本發(fā)明包括轉(zhuǎn)化薩菲菌素生物合成基因簇,其具有或沒(méi)有抗性或調(diào)控基因、 可以是完整的、工程化的、含有突變或含有缺失,用于補(bǔ)充異源宿主。用于轉(zhuǎn)化上述定義的如此大的DNA片段的方法和載體是本領(lǐng)域公知的(Rawlings,2001 ;Staunton和flfeissman, 2001),或在本文公開(kāi)的方法中得以提供。在本發(fā)明中,優(yōu)選的異源宿主細(xì)胞株是原核生物,更優(yōu)選是放線菌或大腸桿菌,甚至更優(yōu)選包括但不限于吸水鏈霉菌(S. hygroscopicus)、吸水鏈霉菌中的 ^J 禾中(S. hygroscopicus sp.)、 7K 9 M ^ M 9 M ^^ (S. hygroscopicus var. ascomyceticus)、筑波鏈霉菌(Streptomyces tsukubaensis)、天藍(lán)色鏈霉菌 (Streptomyces coelicolor)、變鉛青鏈霉菌(Streptomyces lividans)、紅色糖多孢 |if (Saccharopolyspora erythraea) > 1 Ijl β lif (Streptomyces fradiae) > ji, Ijl β 菌(Streptomyces avermitiliis)、肉桂色鏈霉菌(Streptomyces cinnamonensis)、龜裂鏈霉菌(Streptomyces rimosus)、白色鏈霉菌(Streptomyces albus)、灰褐鏈霉菌(Streptomyces griseofuscus)、黃色長(zhǎng)抱鏈霄菌(Streptomyces longisporoflavus) > 委內(nèi)瑞拉鏈霉菌(Streptomyces venezuelae)、灰略紅小單孢菌(Micromonospora griseorubida)、地中海擬無(wú)枝菌酸菌(Amycolatopsis mediterranei)或游動(dòng)方文線菌 N902-10(Actinoplanes sp. N902-10)。因此,在其他方面,本發(fā)明提供了新的菌株,其中失活或缺失了一個(gè)或多個(gè)編碼薩菲菌素生物合成的基因。在其他方面,本發(fā)明提供了新的菌株,其中失活、缺失、或通過(guò)非天然例如異源結(jié)構(gòu)域或模塊替換了 PKS基因sfaE、sfaF, sfaG、sfaH或sfal的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域。 這些菌株可產(chǎn)生新的薩菲菌素。特別地提供了基于產(chǎn)SFA菌株的工程菌株,其中修飾了一個(gè)或多個(gè)選自sfaE、F、G、H和I的PKS基因,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊,例如由此插入了一個(gè)或多個(gè)來(lái)自SFA生物合成基因簇其他位置、或來(lái)自異源聚酮化合物生物合成基因簇的結(jié)構(gòu)域或模塊。在其他方面,本發(fā)明提供了新的菌株,其中失活、缺失、或通過(guò)非天然例如異源結(jié)構(gòu)域或模塊替換了 NRPS基因SfaD的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域。這些菌株可產(chǎn)生新的薩菲菌素。特別地提供了基于產(chǎn)SFA菌株的工程菌株,其中修飾了 NRPS基因sfaD,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。本發(fā)明的其他方面還包括-基于產(chǎn)SFA菌株的工程菌株,其中調(diào)控基因SfaC被修飾以增加或減少其活性,或被缺失,或與其相關(guān)的控制SfaC表達(dá)的調(diào)控元件(諸如啟動(dòng)子)被修飾、替換或缺失。例如,其中調(diào)控基因SfaC或其控制被修飾以增加其活性或表達(dá)水平的菌株可以以更高的產(chǎn)量產(chǎn)生SFA(或SFA類似物)。例如,可通過(guò)應(yīng)用過(guò)量表達(dá)sfaC的啟動(dòng)子(諸如permE)例如在載體(諸如Kieser等,1999中描述的那些)中以及任選地與可選擇標(biāo)記(諸如阿泊拉霉素)一起在菌株中過(guò)量表達(dá)sfaC。-工程菌株,其不是天然產(chǎn)SFA菌株(即,異源宿主),含有在一個(gè)或多個(gè)異源啟動(dòng)子控制下的SFA生物合成基因簇。通過(guò)使用強(qiáng)啟動(dòng)子,此類菌株可用于通過(guò)包括培養(yǎng)該菌株以及任選地分離SFA等的方法高產(chǎn)量地產(chǎn)生SFA。-用于產(chǎn)生更高水平的薩菲菌素的方法,其包括過(guò)量表達(dá)sfaC。-基于產(chǎn)SFA菌株的工程菌株,其中一個(gè)或多個(gè)選自sfaA、B、J、M、N、P、Q、L和O 的起始單元或前體生物合成基因已被缺失,或被修飾以降低它們的活性,或被修飾或替換以改變它們的底物特異性。前述基于產(chǎn)SFA菌株的工程菌株若適當(dāng)補(bǔ)料則可產(chǎn)生SFA或SFA類似物。工程菌株可具有任意的上述修飾或其全部組合,并且可具有其他的基因修飾。根據(jù)本發(fā)明的氨基酸序列可以用來(lái)分離所需要的蛋白,并可用于抗體的制備。包含根據(jù)本發(fā)明的氨基酸序列或至少部分序列的多肽可能在缺失或替換某些氨基酸之后仍具有生物活性或甚至具有新的生物學(xué)活性,或者其他期望的性質(zhì),諸如提高了產(chǎn)量或優(yōu)化了蛋白動(dòng)力學(xué)或其他。包含根據(jù)本發(fā)明的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在異
權(quán)利要求
1.分離的核酸分子,其包含(a)包含SEQID No. 1的薩菲菌素A生物合成基因簇核酸;(b)核酸,其與(a)的核酸具有至少80%序列同一性并且其編碼的多肽和由(a)的核酸編碼的那些多肽具有用于制備聚酮化合物或聚酮化合物起始單元的相同的酶活性和調(diào)控活性;(c)核酸,其編碼與由(a)的核酸編碼的一種或多種多肽具有至少80%氨基酸序列同一性的一種或多種多肽,并且其編碼的一種或多種多肽具有制備聚酮化合物或聚酮化合物起始單元或前體所需的一種或多種酶活性或調(diào)控活性;(d)(a)、(b)或(c)的核酸部分,其編碼聚酮化合物合酶或非核糖體肽合酶多肽;或者任一聚酮化合物合酶或非核糖體肽合酶多肽、或聚酮化合物起始單元或前體生物合成基因產(chǎn)物或聚酮化合物生物合成調(diào)控多肽的酶活性模塊;或(e)(d)的核酸部分,其編碼聚酮化合物合酶或非核糖體肽合酶多肽的酶活性結(jié)構(gòu)域; 或者任一聚酮化合物合酶或非核糖體肽合酶多肽、或聚酮化合物起始單元或前體生物合成基因產(chǎn)物或聚酮化合物生物合成調(diào)控多肽的的酶活性模塊的酶活性結(jié)構(gòu)域。
2.分離的核酸分子,其包含以下一種或多種(a)選自sfaE、sfaF、sfaG、sfaH和sfal 的線性PKS基因,或(b)NPRS基因sfaD,或(c)重復(fù)型PKS基因sfaK,或(d)選自sfaA、 sfaB、sfaJ、sfaM、sfaN、sfaP、sfaQ、sfaL、sfaO的起始單元或前體生物合成基因,或(e)調(diào)控基因sfaC,或(f)MtbH蛋白編碼基因sfaS,或(g)或巴豆酰輔酶A還原酶基因sfaR,或 (h)選自 sfaUl、sfaU2、sfaVl、sfaV2 和 sfaV3 的未知功能基因。
3.分離的核酸分子,其包含以下一種或多種(a)選自SEQID No. 1殘基30707-37360 處的 sfaE、SEQ ID No. 1 殘基 37394-50014 處的 sfaF、SEQ ID No. 1 殘基 50017-60903 處的 sfaG、SEQ ID No. 1 殘基 60918-85823 處的 sfaH 和 SEQ ID No. 1 殘基 85823-96040 處的sfal的線性PKS基因,或(b) SEQ ID No. 1殘基19885-30714處的NPRS基因sfaD,或 (c)SEQ ID No. 1 殘基 97396-101840 處的重復(fù)型 PKS 基因 sfaK,或(d)選自 SEQ ID No. 1 殘基 17024-17854 處的 sfaA、SEQ ID No. 1 殘基 17851-19191 處的 sfaB、SEQ ID No. 1 殘基 96225-97391 處的 sfaj、SEQ ID No. 1 殘基 103210-103929 處的 sfaM、SEQ ID No. 1 殘基 104001-105023 處的 sfaN、SEQ ID No. 1 殘基 105366-107216 處的 sfaP、SEQ ID No. 1 殘基 107366-108145 處的 sfaQ、SEQ ID No. 1 殘基 101936-103213 處的 sfaL、SEQ ID No. 1 殘基105091-105345處的sfaO的起始單元或前體生物合成基因,或(e) SEQ ID No. 1殘基 19193-19888 處的調(diào)控基因 sfaC,或(f) SEQ ID No. 1 殘基 109583-109798 處的 MtbH 蛋白編碼基因sfaS,或(g)或SEQ ID No. 1殘基108150-109511處的巴豆酰輔酶A還原酶基因 sfaR,或(h)選自 SEQ ID No. 1 殘基 14973-15413 處的 sfaUl、SEQ ID No. 1 殘基 15596-16063 處的 sfaU2、SEQ ID No. 1 殘基 109776-110312 處的 sfaVl、SEQ ID No. 1 殘基 111285-111743 處的sfaV2和SEQ ID No. 1殘基112218-112652處的sfaV3的未知功能基因;或包含編碼一種或多種與上述基因編碼的那些多肽相同的多肽、但其僅由于遺傳密碼的豐余性而不同的核酸序列;或包含在高嚴(yán)格條件下能與一種或多種上述基因序列雜交的核酸序列;或包含這樣的核酸序列,所述核酸序列與一種或多種上述基因序列具有至少70%的同一性,并編碼與相應(yīng)的基因產(chǎn)物具有相同功能的多肽;或包含編碼一種或多種和前述基因編碼的一種或多種多肽具有至少80%氨基酸序列同一性、并且具有相同功能的多肽的核酸序列;或包含一種或多種前述基因的至少50個(gè)連續(xù)核苷酸的片段;或任一前述核酸序列的互補(bǔ)序列。
4.分離的核酸分子,其包含以下一種或多種(a)來(lái)自PKS基因的模塊或結(jié)構(gòu)域, 其中所述的PKS基因選自SEQ ID No. 1殘基30707-37360處的sfaE、SEQ ID No. 1殘基 37394-50014 處的 sfaF、SEQ ID No. 1 殘基 50017-60903 處的 sfaG、SEQ ID No. 1 殘基 60918-85823 處的 sfaH 或 SEQ ID No. 1 殘基 85823-96040 處的 sfal,或(b) SEQ ID No. 1殘基19885-30714處的NPRS基因sfaD的模塊或結(jié)構(gòu)域,或(c)SEQ ID No. 1殘基 97396-101840處的重復(fù)型PKS基因sfaK的模塊或結(jié)構(gòu)域;或包含編碼與上述基因編碼的那些多肽相同的多肽的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域、但其僅由于遺傳密碼的豐余性而不同的核酸序列;或包含在高嚴(yán)格條件下能與一種或多種上述核酸分子雜交的核酸序列;或包含這樣的核酸序列,所述核酸序列與一種或多種上述核酸分子具有至少70%的同一性,并編碼與相應(yīng)的基因產(chǎn)物的模塊或結(jié)構(gòu)域具有相同功能的多肽;或包含編碼一種或多種和由前述基因的模塊或結(jié)構(gòu)域編碼的一種或多種多肽具有至少80%氨基酸序列同一性、并且具有相同功能的多肽的核酸序列;或包含前述基因的一個(gè)或多個(gè)模塊或結(jié)構(gòu)域的至少50個(gè)連續(xù)核苷酸的片段;或任一前述核酸序列的互補(bǔ)序列。
5.基于SEQID No. 1的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中SEQID No. 1的一個(gè)或多個(gè)結(jié)構(gòu)域、模塊或基因被缺失、被突變以使酶功能或調(diào)節(jié)功能失活或減少活性,被突變以具有改變的功能,或由替代物替換,或其中插入了一個(gè)或多個(gè)非天然的結(jié)構(gòu)域、模塊或基因。
6.根據(jù)權(quán)利要求5的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中一個(gè)或多個(gè)結(jié)構(gòu)域、模塊或基因(a)被來(lái)自薩菲菌素A生物合成基因簇其他位置的結(jié)構(gòu)域、模塊或基因替換;或 (b)被與薩菲菌素A生物合成基因簇異源的結(jié)構(gòu)域、模塊或基因替換。
7.根據(jù)權(quán)利要求5的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中一個(gè)或多個(gè)結(jié)構(gòu)域、模塊或基因被突變,以使酶功能或調(diào)節(jié)功能失活或減少活性。
8.根據(jù)權(quán)利要求5-7任一項(xiàng)的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了一個(gè)或多個(gè)選自sfaE、F、G、H和I的PKS基因,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。
9.根據(jù)權(quán)利要求5-8任一項(xiàng)的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了NRPS基因sfaD,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或 使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。
10.根據(jù)權(quán)利要求5-9任一項(xiàng)的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了調(diào)節(jié)基因sfaC,以提高或降低其活性,或該基因被缺失。
11.根據(jù)權(quán)利要求5-10任一項(xiàng)的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中修飾了重復(fù)型PKS基因sfaK,由此一個(gè)或多個(gè)結(jié)構(gòu)域被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然結(jié)構(gòu)域。
12.根據(jù)權(quán)利要求5-11任一項(xiàng)的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中缺失了選自 sfaA, B、J、M、N、P、Q、L和0的一個(gè)或多個(gè)起始單元或前體生物合成基因,或?qū)ζ溥M(jìn)行了修飾以降低它們的活性,或?qū)λ鼈冞M(jìn)行了修飾或替換以改變它們的底物特異性。
13.根據(jù)權(quán)利要求5的產(chǎn)生雜化聚酮化合物的基因簇核酸,其中一個(gè)或多個(gè)起始單元或前體生物合成基因或一個(gè)或多個(gè)含有一個(gè)或多個(gè)起始單元或前體生物合成基因的操縱子被缺失、或被突變以失活、或與天然基因或操縱子相比在產(chǎn)生所述起始單元或前體方面的活性減少。
14.根據(jù)權(quán)利要求1-13任一項(xiàng)的核酸,其為DNA。
15.由根據(jù)權(quán)利要求14的核酸編碼的一個(gè)多肽或多個(gè)多肽。
16.聚酮化合物合酶,其由根據(jù)權(quán)利要求14的編碼一個(gè)或多個(gè)聚酮化合物生物合成蛋白的核酸編碼。
17.載體,其包含根據(jù)權(quán)利要求14的DNA以及一個(gè)或多個(gè)啟動(dòng)子或其他調(diào)控元件。
18.用根據(jù)權(quán)利要求17的載體轉(zhuǎn)化的宿主細(xì)胞。
19.用包含編碼全部或部分薩菲菌素A生物合成基因簇的核酸的載體轉(zhuǎn)化的宿主細(xì)胞,其中所述宿主細(xì)胞不天然地產(chǎn)生薩菲菌素A。
20.產(chǎn)生薩菲菌素A的方法,其包括培養(yǎng)根據(jù)權(quán)利要求18或權(quán)利要求19的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。
21.產(chǎn)生聚酮化合物的方法,其包括培養(yǎng)根據(jù)權(quán)利要求18或權(quán)利要求19的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。
22.由根據(jù)權(quán)利要求1-13任一項(xiàng)的模塊核酸或基因簇編碼的雜化蛋白,其中至少一個(gè)結(jié)構(gòu)域或模塊或基因?qū)λ_菲菌素A生物合成基因簇而言是非天然的。
23.可由根據(jù)權(quán)利要求20或21的方法產(chǎn)生的聚酮化合物,并且其不是薩菲菌素A。
24.式(I)或(II)的化合物,或其可藥用鹽
25.根據(jù)權(quán)利要求24的化合物,其中代表OH,R3代表H,以及R4和R5, R6和R7以及R8 和&代表鍵,并且Rltl代表CH2CH2C (0) CH3。
26.根據(jù)權(quán)利要求24的化合物,其中R5代表OH,R6代表H以及R2和R3^R6和R7以及R8 和&代表鍵,并且Rltl代表CH2CH2C (0) CH3。
27.根據(jù)權(quán)利要求24的化合物,其中R7代表OH,R8代表H以及R4和R5^R6以及R2和R3 和&代表鍵,并且Rltl代表CH2CH2C (0) CH3。
28.根據(jù)權(quán)利要求M的化合物,其中&代表0H,R9代表H以及R4和R5A6和R7以及& 和R3代表鍵,并且Rltl代表CH2CH2C (0) CH3。
29.根據(jù)權(quán)利要求M-觀任一項(xiàng)的化合物,其中R1代表部分C。
30.根據(jù)權(quán)利要求M-四任一項(xiàng)的化合物,其中R11代表H。
31.選自以下的化合物,或其可藥用鹽
32.藥物組合物,其包含根據(jù)權(quán)利要求31的化合物或其可藥用鹽,以及一種或多種可藥用稀釋劑或載體。
33.基于產(chǎn)薩菲菌素A菌株的工程菌株,其中調(diào)控基因SfaC被修飾以增加或減少其活性,或被缺失,或控制SfaC表達(dá)的調(diào)控元件被修飾、替換或缺失。
34.根據(jù)權(quán)利要求33的工程菌株,其中調(diào)控基因SfaC或其控制被修飾以增加其活性或表達(dá)水平。
35.基于產(chǎn)薩菲菌素A菌株的工程菌株,其中選自sfaA、B、J、Μ、N、P、Q、L和0的一個(gè)或多個(gè)起始單元或前體生物合成基因已被缺失,或被修飾以降低它們的活性,或被修飾或替換以改變它們的底物特異性。
36.基于產(chǎn)薩菲菌素A菌株的工程菌株,其中修飾了選自sfaE、F、G、H和I的一個(gè)或多個(gè)PKS基因,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。
37.基于產(chǎn)薩菲菌素A菌株的工程菌株,其中修飾了NRPS基因sfaD,由此一個(gè)或多個(gè)結(jié)構(gòu)域或模塊被缺失、被突變以使酶功能失活或減少活性或使得具有改變的功能,或由替代物替換,或由此插入一個(gè)或多個(gè)非天然的結(jié)構(gòu)域或模塊。
全文摘要
本發(fā)明涉及新的分離的DNA序列,其包含全部或部分編碼薩菲菌素合酶的基因簇、參與非核糖體肽/聚酮化合物混合化合物的生物合成的加工及調(diào)控基因,或具有改變的生物合成能力的突變體,由該DNA或突變體編碼的多肽或其突變體,含有該DNA或其突變體的載體,由該DNA、其突變體或載體轉(zhuǎn)化的宿主細(xì)胞,以及產(chǎn)生薩菲菌素化合物的方法。本發(fā)明還提供了具有親環(huán)蛋白抑制活性的化合物,其用作免疫抑制劑、抗病毒劑或心臟保護(hù)劑。
文檔編號(hào)C12N15/09GK102224242SQ200980146616
公開(kāi)日2011年10月19日 申請(qǐng)日期2009年9月24日 優(yōu)先權(quán)日2008年9月24日
發(fā)明者劉 文, 姜楠, 瞿旭東 申請(qǐng)人:中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所