專利名稱:低成本生產(chǎn)肽的制作方法
背景技術(shù):
許多種蛋白和肽對人類健康(和其它)目的是有用的和有價值的。例如,有一大類具有確定抗生素特性的抗微生物肽(AMP)。這些肽具有廣闊的應(yīng)用潛能,如用作治療、抗感染、消毒、和防腐-如果可以很經(jīng)濟(jì)地生產(chǎn)這些肽的話。
其它種類的小肽包括激素,也具有廣闊的治療用途。
抗菌肽是多種生物天然抗菌防御機(jī)制的一種天然成分,多種生物包括哺乳動物類、鳥類、爬行動物、昆蟲類、和植物。有多種抗菌肽,和這些肽有多種天然來源。已經(jīng)命名了一些種類的天然AMP。例如蛙中的爪蟾抗菌肽(參見如如Zasloff等(1987));蠶蛾中的抗菌蛋白(attacins)和殺菌肽(參見如Bowman等(1983));兔、人和其它哺乳動物中的防衛(wèi)素(參見如Pardi等(1992));牛中的indolicidins和細(xì)菌素(參見如Selstde等(1992)和Niidome等(1999));和蜜蜂中的apidaecins(參見如Casteels等(1989)),還可參見如WO00/31729。
另外,節(jié)肢動物(蟹、蝦、鱟、蜘蛛、蝎)和低等無脊椎動物(蚯蚓、moluscs、和海綿)可以產(chǎn)生抗微生物肽AMP。微生物也可以產(chǎn)生AMP,包括粘細(xì)菌、放線菌、真細(xì)菌、真菌(包括子囊菌和擔(dān)子菌)、和原生動物,如阿巴米蟲。參見如表1
表1作者和年代 引文 物種(1999) JP2854872B2 鱟Aszodi等(1999) US5,891,851(Hoechst AG) 放線菌Bachere等(1999)WO99/05270A2 蝦Bowman等(1983) The EMBO Joural 2571-576 蠶蛾,抗菌蛋白Attacins和殺菌肽Casteels等(1989) The EMBO Joural 82387- 蜜蜂,2391 ApidaecinsCho等(1998)Biochimica et Biophysica Acta環(huán)節(jié)動物148067-76Gulavita等(1996) US5,516,755(Harbor Branch海綿Oceanographic Institution)Haeberli等(2000) Toxicon 38373-380 蜘蛛Hetru等(2000) Biochemical Journal J蝎345653-664Lwanaga等(1998)Frontiers in Bioscience 蟹3D973-84Leippe等(1999) Developmental and阿巴米蟲ComparativeImmunology 23267-79Logeman等(1991)EP525508A2(Max Planck擔(dān)子菌Institute)Mitta等(1999) Journal of Cell Science Moluscs1124233-4242Niidome等(1999)Peptide Science 36403-406 牛、細(xì)菌素Pardi等(1992) Biochemistry 3111357-11364 兔和人,防衛(wèi)素Ryals等(1998) US5,716,849(Novartis)粘細(xì)菌Selsted等(1992)J.Biological Chemistry 哺乳動物2674292-4295)Ulbrich等(1998)US5,824,874(Hoechst) 子囊菌Zasloff等(1987)PNAS 845449-5453 蛙、爪蟾抗菌肽發(fā)現(xiàn)一些AMP和結(jié)構(gòu)類似的肽對癌細(xì)胞具有選擇抗性。參見如WO97/33908(CSIRO)和WO90/12866(路易斯安那州立大學(xué)LouisianaState University)。通過對天然類似物的修飾(參見如US5,994,306;Intrabiotics)、依據(jù)肽結(jié)構(gòu)/活性關(guān)系的一般原則進(jìn)行設(shè)計(參見如US5,861,478;Helix Biomedix)、或甚至通過隨機(jī)組合物的篩選(參見如US5,504,190;Torrey Pines Institute),可以合成AMP和抗腫瘤肽序列(參見如US5,994,306;Intrabiotics)。
典型的AMP長度約為10-50個氨基酸。這些肽一般富含堿性氨基酸(賴氨酸和精氨酸),因此一般是陽離子(具有凈正電荷)。天然狀態(tài)的AMP是兩親性的(即一部分分子是親水性的而另一部分是疏水性的)。雖然經(jīng)過廣泛的研究,但是AMP的作用模式仍然是科學(xué)界爭論的主題。在一些情況下,數(shù)據(jù)表明這些兩親性肽在膜上聯(lián)合起來組成孔或通道,參見如Durell等(1992),Biophysical Journal 631623-1631。在另外一些情況下,AMP表現(xiàn)為通過與膜締合形成一個毯狀物而使膜破裂,參見如Shai等(1995),Biochemistry 3411479-88。這導(dǎo)致微生物細(xì)胞膜去極化并且流失掉必須的細(xì)胞成分,從而使微生物破裂并殺死微生物。
AMP具有廣譜抗菌活性,這是把AMP作為藥物抗生素使用的令人感興趣的一個方面。隨著致病微生物對傳統(tǒng)化學(xué)抗生素抗性的日益廣泛的傳播,人們對用抗菌肽作為傳統(tǒng)抗生素的替代品越來越感興趣,這當(dāng)然是在抗菌肽能夠被很經(jīng)濟(jì)地生產(chǎn)的情況下。
AMP具有廣闊的應(yīng)用潛能,用作治療(參見如美國專利號6,132,775;紐約大學(xué)),用作抗感染(參見如美國專利號6,071,879;Oklahoma大學(xué)),用作消毒(參見如Jaynes等(1996),CLAOJ.22114-7),用作防腐(參見如WO00/01400;Assoc.Cape Cod Inc),和食品安全(參見如Padgett等(1998),Journal of Food Protection611330-1335)。AMP和AMP類似肽也應(yīng)用于腫瘤和病毒的治療(參見如Egal等(1991),International Journal of Antimicrobial Agents1357-60),包括逆轉(zhuǎn)錄病毒(參見如Tamamura等(1998),Bioorganicand Medicinal Chemistry 6231-238)。另外還考慮使用AMP來控制植物疾病,這主要通過轉(zhuǎn)基因植物的途徑,參見如Norelli等(1999),Phytopathology 89S56。
然而,大量生產(chǎn)AMP或其它小肽序列是昂貴的(并且是困難/效率很低的),這限制了它們在大規(guī)模治療和相關(guān)用途中的實際應(yīng)用。例如,AMP(和其它肽或蛋白)的化學(xué)合成是非常昂貴的。
已經(jīng)在微生物中合成生產(chǎn)了具有治療或功能(如催化)價值的異源蛋白產(chǎn)品。參見如Swartz,J.R(2001),Current Opinion inBiotechnology 12195-201。這種生產(chǎn)多肽的方法在一些方面優(yōu)于固相合成,包括序列正確性、方便、低成本、和生產(chǎn)較長多肽/蛋白的能力。微生物生產(chǎn)方法對特定種類的蛋白和多肽可以是方便和低成本的,但是這項技術(shù)不能普遍地應(yīng)用,并且其限制因素通常是顯而易見的。這些限制因素包括1)低產(chǎn)率,2)錯誤折疊和非活性蛋白的積累,3)抑制微生物生長,和4)在檢測或分離/純化多肽方面的困難,尤其是對于那些低分子量多肽。
已經(jīng)嘗試把小肽作為較大融合蛋白的一部分來進(jìn)行生物生產(chǎn),以提高整體蛋白產(chǎn)量。例如,美國專利號6,242,219和6,274,344(Xoma公司)涉及一種衍生自殺菌/提高滲透性蛋白(BPI)的肽與載體蛋白的融合(并可從其裂解的)。US6,242,219專利同時涉及肽從載體上的酸溶解和裂解。在肽和載體之間可以應(yīng)用Asp-Pro鍵。US6,274,344專利表明對于載體可以進(jìn)行陽離子化,如同BPI。
在細(xì)菌中,小肽非常容易被原有的蛋白酶降解。包括AMP的小肽在天然中可以作為多聚肽前體的一部分來生產(chǎn)。Casteel-Josson等(1993),EMBO Journal,12(4)1569-1578。昆蟲神經(jīng)肽(短肽)也是通過類似的方式進(jìn)行天然的生產(chǎn)。參見如Rao等(1996),Gene171-5。然而,在體外重復(fù)天然過程是相當(dāng)困難的。例如,把所需DNA片段的多個拷貝以一種易于裂解的方式進(jìn)行裝配和表達(dá)是一項艱難和高代價的過程。關(guān)于擴(kuò)增克隆DNA片段的多個拷貝的技術(shù)背景,一般可參見Cohen等(1986),DNA 5(4)334-345,該文獻(xiàn)涉及應(yīng)用DNA片段的串聯(lián)重復(fù)來生產(chǎn)具有預(yù)期重復(fù)結(jié)構(gòu)的多聚體(使用了多瘤病毒DNA作為單體);和參見Kim等(1988),Gene,711-8,該文獻(xiàn)涉及克隆DNA串聯(lián)多聚體的擴(kuò)增(其中單體具有不對稱的粘性末端)。
因此,在小肽的合成生產(chǎn)上存在障礙,尤其是AMP難以生物合成。另外,AMP由于短極易被蛋白酶降解,并且對于細(xì)菌和其它微生物具有明顯的毒性。因此,在生物反應(yīng)器中實際上是要避免產(chǎn)生這些天然活性原料的。此外,AMP一般帶正電荷/陽離于,在生物合成生產(chǎn)中還存在其它一些障礙,這在下面進(jìn)行詳細(xì)解釋。
例如已經(jīng)嘗試使用重組子大腸桿菌(E.coli)來生物合成生產(chǎn)AMP。然而,即使有的話,產(chǎn)量(迄今為止)也是非常低的。確定地說,AMP對細(xì)菌和其它微生物是有毒的。因此,當(dāng)一種培養(yǎng)物(例如,大腸桿菌)產(chǎn)生了一定量的AMP時,AMP一般會殺死培養(yǎng)物。美國專利號5,206,154(Xoma公司)要求保護(hù)了一種融合到一種載體(araB)上的殺菌肽,目的在于抑制殺菌肽的活性。即使這種方法是成功的,AMP的相對產(chǎn)量,相對于載體,也將是低的。
還嘗試了首先生產(chǎn)它們的多聚/多聯(lián)前體,然后裂解產(chǎn)生活性單體的方法來合成生產(chǎn)AMP。然而,這種生產(chǎn)AMP的方法仍然存在問題。
應(yīng)用多聚肽前體來生產(chǎn)AMP的嘗試提出了有關(guān)生物合成的獨(dú)特、特別困難的難題。尤其是,因為單個AMP具有較高的陽離子/正電荷,因此包含多個AMP單體的多聚蛋白必然會是一個巨大的、高度陽離子的蛋白。需要指出的是,帶正電荷的新生的AMP多聚體(AMP富含堿性氨基酸殘基導(dǎo)致多聚體是陽性的)與帶負(fù)電荷的涉及轉(zhuǎn)錄和翻譯的DNA和/或RNA(酸性)相互作用,從而擾亂了正常細(xì)胞進(jìn)程并且阻止了所需AMP生產(chǎn)到一定的物質(zhì)水平。參見如Lee等(1996),Genetic Analysis;Biomolecular Engineering,13139-145(涉及包含93bp爪蟾抗菌肽單體的串聯(lián)多聚體構(gòu)建物的擴(kuò)增;其中指出應(yīng)當(dāng)通過使多聚體融合到帶陰離子電荷的蛋白上從而中和帶正電荷的多聚體氨基酸)。產(chǎn)品肽的蛋白酶降解是另外的一個需要注意的問題。
在以融合蛋白的形式來生產(chǎn)AMP方面已經(jīng)進(jìn)行了多種嘗試,其中AMP所帶的正電荷被載體蛋白平衡或中和。WO96/28559(英國哥倫比亞大學(xué)(University of British Columbia);Hancock等)涉及一種由陰離子AMP部分和陽離子/LPS結(jié)合部分組成的融合蛋白,據(jù)說后者可以抑制陽離子部分的抗微生物活性。
美國專利號5,593,866(英國哥倫比亞大學(xué)(University of BritishColumbia))描述了應(yīng)用陽離子/陰離子融合來嘗試生物合成生產(chǎn)AMP.該專利公開了一種殺菌肽/蜂毒肽融合,包含前面18個氨基酸的殺菌肽和后面8個氨基酸的蜂毒肽。其中描述的載體肽的例子包括來自金黃色葡萄球菌(S.aures)的GST蛋白和來自銅綠假單胞菌(P.aeruginosa)的外膜蛋白、F蛋白。應(yīng)用溴化氰來切割融合來恢復(fù)肽的活性。該專利要求保護(hù)了大腸桿菌(Escherichia coli)、金黃色葡萄球菌(Staphylococcus aureus)、和銅綠假單胞菌(Pseudomonasaeruginosa)在生產(chǎn)融合蛋白中的用途。該專利還提出發(fā)明中的AMP可被應(yīng)用于抑制大腸桿菌(E.coli)、銅綠假單胞菌(P.aeruginosa)、陰溝腸桿菌(E.cloacae)、鼠傷寒沙門氏菌(S.typhimurium)、和金黃色葡萄球菌(S.aureus)。該專利還涉及一種在羧基末端含有兩個附加的賴氨酸殘基的AMP;據(jù)報道這出乎預(yù)料地使AMP的抗菌活性得到加倍的提高。
Lee等(1998),J.Microbiol.Biotechnol.,8(1)34-41,使用了一種麥芽糖結(jié)合蛋白融合到爪蟾抗菌肽多聚體,試圖獲得合適的表達(dá)。他們使用了單體之間的Xa切割位點(diǎn)。該文獻(xiàn)指出不管在AMP核心是否具有附加的氨基酸殘基,經(jīng)過Xa位點(diǎn)切割得到的AMP出乎預(yù)料地保持了活性。
Lee等(February 1998;Protein Expression and Purification,vol.12,no.1,pp.53-60)使用了一種酸性肽的串聯(lián)重復(fù)融合到堿性/正電荷AMP上(蟾蜍素buforin II)上。在每個酸性肽的末端加上一個半胱氨酸殘基作為臨界元件。其中使用了溴化氰作為切割試劑。
Lee等(June 1999),J.Microbiol.and Biotech.,9(3)303-310,使用了一種蟾蜍素II AMP融合到富含半胱氨酸酸性肽上。Zhang等(1998),Biochemical and Biophysical Research Communications,247674-680,涉及一種包含殺菌肽/爪蟾抗菌肽的融合蛋白,和一種包含陰離子前導(dǎo)區(qū)域、RepA區(qū)域、和細(xì)胞膜結(jié)合區(qū)域的載體蛋白。
WO98/54336(Kim,Lee,等;Samyang Genex and Korea AdvancedInstitute Science;還可參見美國專利號6,183,922)涉及使用一種AMP(蟾蜍素II)與一種至少含有兩個半胱氨酸殘基的酸性肽(Guamerin)的融合。該申請指出酸性肽需要與堿性/正電荷AMP進(jìn)行中和,目的是為了防止電荷引力和防止在AMP翻譯過程中與DNA和RNA相互反應(yīng)。同時還指出對于多肽兩個位點(diǎn)的正確折疊和促進(jìn)相互反應(yīng)來說半胱氨酸殘基是必須的。WO98/54336不同于US5,593,866之處在于,它指出單獨(dú)的一個普通酸性載體蛋白基因不能使堿性抗菌肽得到充分的表達(dá)。要想解決這個問題,需要酸性肽至少要有兩個半胱氨酸殘基。類似于WO98/54336,WO96/28559同樣指出在陰離子肽中使用半胱氨酸殘基來作為解決問題的途徑。
WO99/64611(Samyang Genec Corp.)涉及使用包含一種purF基因和一種AMP的融合。另外的Samyang Genex公司的申請,WO00/34312涉及使用羥胺從融合配體上裂解堿性肽/蛋白。美國專利6,255,279和WO99/48912(Korea Advanced Institute)記載了AMP在洗口藥和眼藥膏方面可能存在的用途。WO97/22624(Beiersdorf AG)涉及串聯(lián)多聚體在抗菌化妝品制備、除臭劑等方面的使用用途。
WO00/31279(Micrologix Biotech Inc.)涉及一種多區(qū)域融合蛋白,其由多聚體AMP融合到一種酸性肽(細(xì)胞膜結(jié)合區(qū)域),其中必須在每個AMP單體之間有一個用于電荷平衡(即消除陽離子肽成分所帶的電荷)的陰離子間隔物。該申請使用了小的間隔物(即提供一定濃度的負(fù)電荷)以提高AMP在細(xì)胞所產(chǎn)生的總蛋白中的相對產(chǎn)量;該種多聚體可自動融合到載體蛋白(細(xì)胞膜結(jié)合區(qū)域)。雖然該申請簡要記載了70%的甲酸可以作為切割劑,但是該申請的實施例部分使用了溴化氰(CNBr)來切割(在甲硫氨酸殘基處)多區(qū)域蛋白以產(chǎn)生活性單體。WO00/31279指出融合蛋白可以是一種不溶解的蛋白?!安蝗芙怆摹痹诒旧暾堉兄傅氖恰耙环N多肽,當(dāng)細(xì)胞破碎和離心(如10,000×g到15,000×g)使細(xì)胞殘片沉淀,產(chǎn)生基本上不溶解的成分,進(jìn)行SDS聚丙烯酰胺凝膠電泳,并用考馬斯亮藍(lán)染色”。
在現(xiàn)有技術(shù)中沒有提示使用熒光假單胞菌(Pseudomonasfluorescens)能夠或利于AMP的生產(chǎn)。銅綠假單胞菌(Pseudomonasaeruginosa)和熒光假單胞菌(Pseudomonas fluorescens)已經(jīng)被用于商品化生產(chǎn)維生素B12。參見Schenectady County Community College網(wǎng)站。已知特定的熒光假單胞菌菌株具有抗真菌特性。參見如美國專利號6,048,713。已知一些熒光假單胞菌菌株可以生產(chǎn)抗生素并可以被用于這些抗生素的生產(chǎn)。參見如美國專利號4,108,724。還可參見美國專利號5,348,742。同時也已知熒光假單胞菌被用于生產(chǎn)殺蟲蛋白毒素的用途。參見如美國專利號5,840,554;5,527,883;5,128,130;和5,055,294(Mycogen Corporation)。熒光假單胞菌還可被用于環(huán)境污染的生物補(bǔ)救。參見如美國專利號5,711,945和4,853,334。
在上述所有的肽表達(dá)系統(tǒng)中,據(jù)報道在細(xì)胞培養(yǎng)條件下,從轉(zhuǎn)基因表達(dá)得到的多肽的產(chǎn)量通常在幾微克每升到約100mg/L的范圍內(nèi)。因此,現(xiàn)有技術(shù)仍然需要一種能夠使產(chǎn)量顯著增高的轉(zhuǎn)基因多肽表達(dá)系統(tǒng)。因此,迫切需要利用微生物發(fā)酵經(jīng)濟(jì)高效生產(chǎn)包括AMP在內(nèi)的小肽的方法。
發(fā)明概述一種生物合成生產(chǎn)小肽的方法,所述方法包括提供至少一種微生物細(xì)胞;和至少一種核酸,所述微生物細(xì)胞能夠從該核酸表達(dá)出載體-肽融合多肽,該多肽包含(a)至少一個高度表達(dá)的載體多肽,其通過可裂解的接頭連接到(b)上,(b)至少一個肽多聚體,該肽多聚體包含至少兩個串聯(lián)排列的小肽單元,每一個小肽單元通過切割位點(diǎn)連接到至少一個鄰近的小肽單元上,所述切割位點(diǎn)包含至少一個Asp-Pro二肽;將所述核酸轉(zhuǎn)染到所述微生物細(xì)胞內(nèi),獲得轉(zhuǎn)化的微生物細(xì)胞;將所述轉(zhuǎn)化的微生物細(xì)胞置于細(xì)胞能夠表達(dá)所述核酸以生產(chǎn)出由此編碼的載體-肽融合多肽的條件下;任選地,從轉(zhuǎn)化的微生物細(xì)胞中回收所述載體-肽融合蛋白;任選地,進(jìn)行切割反應(yīng),從所述肽多聚體上切割所述載體多肽;進(jìn)行切割反應(yīng),以將多聚體的小肽單元從彼此間切割下來,由此獲得小肽;和任選地,進(jìn)行末端切割反應(yīng),以除去存在于小肽末端的切割位點(diǎn)的氨基酸殘基,或可切割接頭的氨基酸殘基,或者二者。
上述方法,其中所述微生物細(xì)胞是一種細(xì)菌細(xì)胞。上述方法,其中所述細(xì)菌細(xì)胞屬于γ(gamma)蛋白菌。上述方法,其中所述細(xì)菌細(xì)胞屬于假單胞菌屬。上述方法,其中所述細(xì)菌細(xì)胞屬于熒光假單胞菌族。上述方法,其中所述細(xì)菌細(xì)胞是熒光假單胞菌。上述方法,其中所述細(xì)菌細(xì)胞是熒光假單胞菌變種A。
上述方法,其中把小肽連接到一起的每一個切割位點(diǎn)包含至少一個Gly-Asp-Pro三肽。上述方法,其中把小肽連接到一起的每一個切割位點(diǎn)是一個Gly-Asp-Pro三肽。上述方法,其中肽多聚體包含至少三個串聯(lián)排列的肽單元。上述方法,其中所述肽多聚體中的每一個肽單元表達(dá)取向相同。上述方法,其中所述肽多聚體的小肽單元具有完全相同的氨基酸序列。上述方法,其中所述高度表達(dá)載體多肽是在微生物細(xì)胞中高效表達(dá)的一種蛋白的N末端片段。上述方法,其中所述N末端片段長度約或至少10個氨基酸殘基。上述方法,其中所述蛋白是玫瑰紅紅球菌(Rhodococcus rhodochrous)TDTM-003鹵烷脫鹵素酶(SEQID NO30)。
一種核酸,從中可表達(dá)出一種載體-肽融合多肽,該多肽包含(a)至少一個高度表達(dá)的載體多肽,其通過可切割接頭連接到(b)上,(b)至少一個肽多聚體,該肽多聚體包含至少兩個串聯(lián)排列的小肽單元,每一個小肽單元通過切割位點(diǎn)連接到至少一個相鄰的小肽單元上,切割位點(diǎn)包含至少一個Asp-Pro二肽。上述核酸,其中所述核酸是一種載體。上述核酸,其中所述載體是一種質(zhì)粒。上述核酸,其中所述核酸是通過如下方法制備的,該方法包括退火和包括假回文序列在內(nèi)的寡聚物的連接,形成多聚多核苷酸文庫,該多聚多核苷酸包含串聯(lián)的編碼肽單元的寡核苷酸并通過編碼切割位點(diǎn)的核苷酸連接,所述文庫既包含其中編碼肽單元的寡核苷酸部分以相同取向排列的多聚多核苷酸,還包含其中編碼肽單元的寡核苷酸部分以不同取向排列的多聚多核苷酸,隨后用合適的限制性內(nèi)切酶處理多聚多核苷酸,僅使那些編碼肽單元的寡核苷酸部分以不同取向排列的多聚多核苷酸被水解。一種含有上述核酸的微生物細(xì)胞。
通過上述方法生產(chǎn)的小肽。根據(jù)本發(fā)明,其中小肽是抗菌肽(AMP)。
附圖1顯示了DNA片段的裝配過程,編碼單AMP亞基的DNA以合適的取向連接成一個多聚結(jié)構(gòu),并且隨后如下面的描述連接到質(zhì)粒中。
附圖2顯示多聚亞基以預(yù)期取向進(jìn)行的裝配。
附圖3A顯示應(yīng)用假回文序列間隔區(qū)來裝配正確取向的基因(編碼以Asp-Pro二肽連接的AMP),形成多聚體/多聯(lián)體?;蛘承阅┒艘灶A(yù)期取向進(jìn)行連接,結(jié)果產(chǎn)生了編碼Asp-Pro二肽的非回文序列。
附圖3B顯示了不正確的“頭對頭”或“尾對尾”連接所生成的可被Pvu I裂解的回文序列。
附圖3C顯示了不正確的“頭對頭”或“尾對尾”連接所生成的可被BamH I裂解的回文序列。
附圖4顯示了實施例9和10中的融合/克隆。中間黑色條帶表示一個用于免疫印跡檢測的T7表位標(biāo)記(AMP多聚體的前導(dǎo)片段部分)。白色條帶表示多聚體的尾部非編碼區(qū)序列。
序列的簡要說明SEQ ID NO1顯示D2A21抗微生物核心肽的氨基酸序列。
SEQ ID NO2顯示用于編碼SEQ ID NO1的肽的DNA序列。
SEQ ID NO3顯示用于編碼SEQ ID NO4的肽的DNA序列。
SEQ ID NO4顯示帶有三個附加的氨基酸殘基的D2A21抗微生物肽單體核心的氨基酸序列,該附加的氨基酸殘基用作肽連接/切割位點(diǎn)以裝配成多聚體。
SEQ ID NO5是用于編碼SEQ ID NO6所示的4A二聚體的DNA序列(使用大腸桿菌表達(dá)載體pET21b)。
SEQ ID NO6顯示了4A二聚體的氨基酸序列(包含前導(dǎo)片段,兩個以三肽接頭隔開的AMP,和一個非轉(zhuǎn)錄尾區(qū)片段)。
SEQ ID NO7顯示了D2A21’AMP單體的氨基酸序列。
SEQ ID NO8顯示了優(yōu)選的編碼Asp-Pro可切割二肽接頭的六核酸序列。
SEQ ID NO9顯示了AB4三聚體的氨基酸序列(含有一個前導(dǎo)片段,三個以三肽接頭隔開的AMP,和一個非轉(zhuǎn)錄尾區(qū)片段)。
SEQ ID NO10是用于編碼SEQ ID NO9所示AB4三聚體的DNA序列(在大腸桿菌表達(dá)載體pET21b中)。
SEQ ID NO11顯示了TF3三聚體的氨基酸序列。
SEQ ID NO12顯示了用于編碼SEQ ID NO11所示TF3三聚體的DNA序列(在熒光假單胞菌表達(dá)載體Pmyc1803中)。
SEQ ID NO13是D4E1AMP的氨基酸序列。
SEQ ID NO14是D4E1三聚體的氨基酸序列。
SEQ ID NO15是用于編碼SEQ ID NO14所示D4E1三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYCI803和大腸桿菌表達(dá)載體pET24b中)。
SEQ ID NO16是D4E1四聚體的氨基酸序列。
SEQ ID NO17是用于編碼SEQ ID NO16所示D4E1四聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO18是D4E1五聚體的氨基酸序列。
SEQ ID NO19是用于編碼SEQ ID NO18所示D4E1五聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET24b中)。
SEQ ID NO20是二氫葉酸還原酶(DHFR)蛋白的氨基酸序列。
SEQ ID NO21是編碼SEQ ID NO20所示脫鹵素蛋白的DHFR基因的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO22是DHFR/TF3三聚體融合體的氨基酸序列。
SEQ ID NO23是用于編碼SEQ ID NO22所示融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO24是DHFR/D4E1三聚體融合體的氨基酸序列。
SEQ ID NO25是用于編碼SEQ ID NO24所示融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO26是DHFR/D4E1四聚體融合的氨基酸序列。
SEQ ID NO27是用于編碼SEQ ID NO26所示融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO28是DHFR/D4E1五聚體融合體的氨基酸序列。
SEQ ID NO29是用于編碼SEQ ID NO28所示融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO30是脫鹵素酶蛋白的全長氨基酸序列。
SEQ ID NO31是用于編碼SEQ ID NO30所示脫鹵素酶蛋白的DNA序列。
SEQ ID NO32是“3I”融合體的氨基酸序列(脫鹵素酶/D2A21’三聚體)。
SEQ ID NO33是用于編碼SEQ ID NO32所示“3I”融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET21b中)。
SEQ ID NO34是“4C”結(jié)構(gòu)的氨基酸序列(截去123個氨基酸的脫鹵素酶/D2A21’三聚體融合體)。
SEQ ID NO35是用于編碼“4C”結(jié)構(gòu)的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET21b中)。
SEQ ID NO36是編碼16A(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO37是16A(D2A21)三聚體的氨基酸序列。
SEQ ID NO38是編碼21A(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO39是21A(D2A21)三聚體的氨基酸序列。
SEQ ID NO40是編碼21B(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO41是21B(D2A21)三聚體的氨基酸序列。
SEQ ID NO42是編碼JP2(D2A21)二聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
SEQ ID NO43是JP2(D2A21)二聚體的氨基酸序列。
SEQ ID NO44是被截短的脫鹵素酶/D4E1五聚體融合體的氨基酸序列。
SEQ ID NO45是編碼SEQ ID NO44所述融合蛋白的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)。
優(yōu)選實施方式的詳細(xì)說明本發(fā)明提供了高效和低成本生產(chǎn)包括抗微生物肽(AMP)在內(nèi)的小肽的方法。根據(jù)本發(fā)明,細(xì)菌(和其它合適的微生物)優(yōu)選熒光假單胞菌(P.fluorescens)進(jìn)行大規(guī)模發(fā)酵,用于生產(chǎn)肽/AMP。根據(jù)本發(fā)明,優(yōu)選生產(chǎn)AMP,然而本發(fā)明的組分可以單獨(dú)或組合后用于或適用于生產(chǎn)其它類型的具有治療或催化用途的肽。
單獨(dú)和/或組合后的本發(fā)明的成分出乎預(yù)料地有利于應(yīng)用熒光假單胞菌來生產(chǎn)AMP和其它所需小肽。本發(fā)明廣義上涉及應(yīng)用熒光假單胞菌生產(chǎn)肽,包括AMP。因此,本發(fā)明包括一種生產(chǎn)抗微生物肽的方法,其中所述方法包含,優(yōu)選在熒光假單胞菌細(xì)胞中表達(dá)編碼所述肽的多核苷酸。雖然優(yōu)選在熒光假單胞菌中生產(chǎn)AMP,但是本發(fā)明的組分可以單獨(dú)或組合后用于或適用于應(yīng)用其它微生物和生產(chǎn)AMP之外的肽。根據(jù)本發(fā)明公開的內(nèi)容,這對本領(lǐng)域技術(shù)人員來說是顯而易見的。
根據(jù)本發(fā)明,在細(xì)菌(優(yōu)選熒光假單胞菌)中生產(chǎn)無毒的串聯(lián)/多聚前體,然后經(jīng)過切割產(chǎn)生活性單體,從而生產(chǎn)高水平的AMP(或其它小肽)。用這種方式生產(chǎn)AMP一般消除了AMP的毒性(因為它們具有在細(xì)菌細(xì)胞膜上裝配成孔的能力)。通常用此方式生產(chǎn)肽還有助于小肽避免不需要的蛋白水解酶降解,對此小肽是特別敏感的。
本發(fā)明的一個方面是多聚體。本發(fā)明的多聚體可以包含兩個、三個、四個、五個或更多的肽/AMP亞基。根據(jù)多聚體中所需的單體數(shù)目,可以修改本發(fā)明實施例中的結(jié)構(gòu)。
本發(fā)明提供了一種高效和低成本生產(chǎn)包括抗微生物肽(AMP)在內(nèi)的小肽的方法。根據(jù)本發(fā)明的表達(dá)系統(tǒng),意外地發(fā)現(xiàn)可以提供規(guī)定產(chǎn)量的轉(zhuǎn)基因多肽,超過1g/L,通常約為5g/L。上述產(chǎn)量表明相比于在工業(yè)應(yīng)用中已經(jīng)報道的那些系統(tǒng),上述系統(tǒng)具有實質(zhì)上的進(jìn)步。
在一個特別優(yōu)選實施方式中,細(xì)菌(和其它合適的微生物),優(yōu)選熒光假單胞菌(P.fluorescens)進(jìn)行大規(guī)模發(fā)酵,用于生產(chǎn)肽。雖然根據(jù)本發(fā)明,優(yōu)選生產(chǎn)的肽是AMP,和優(yōu)選微生物是熒光假單胞菌,但是本發(fā)明的組分,單獨(dú)和組合后可以用于或適用于應(yīng)用其它類型的微生物生產(chǎn)其它類型的肽。
在此,術(shù)語“肽”指一種包含至少兩個氨基酸的寡聚肽或多聚肽分子,該分子的氨基酸通過肽鍵依次連接。根據(jù)本發(fā)明的肽是任一如下的寡聚肽或多聚肽分子功能肽、結(jié)構(gòu)肽、其片段、其前體、上述任一肽的組合、和/或上述任一肽的多聯(lián)體。
正如上述所提到的,可用于本發(fā)明的肽包括那些功能肽、結(jié)構(gòu)肽、其片段、其前體、上述任一肽的組合、和/或上述任一肽的多聯(lián)體。
可用的功能肽包括,但不限于此,如生物-活性肽(即在生物實體中在生物功能或活性的起始、加強(qiáng)、延伸、衰減、終止、或抑制過程中起激發(fā)、誘導(dǎo)或其它作用的肽,生物實體如生物有機(jī)體、細(xì)胞、培養(yǎng)物、組織、器官、或細(xì)胞器);催化肽;顯微結(jié)構(gòu)和納米結(jié)構(gòu)活性肽(即構(gòu)成微結(jié)構(gòu)或納米結(jié)構(gòu)的機(jī)械組成部分,在其中或與其連接共同發(fā)揮活性的肽,如活動、能量傳導(dǎo));和刺激單(如調(diào)味肽、著色劑、增味劑,外激素、攻擊素、拒食劑、和驅(qū)避劑)。
可用的生物活性肽包括,但不限于此,如免疫活性肽(如抗原肽、變態(tài)原肽,肽免疫調(diào)節(jié)劑、肽免疫鋼制劑);信號和信號傳導(dǎo)肽(如肽激素、細(xì)胞因子、和神經(jīng)遞質(zhì)、受體、激動和拮抗肽、靶多肽和分泌信號肽);和生物抑制肽(如有毒的、殺蟲的、或生物機(jī)能的肽,如肽毒素和抗微生物肽)。
可用的結(jié)構(gòu)肽包括,但不限于此,如肽適應(yīng)性配體(aptamers)、折疊肽(如在另一分子中啟動或誘導(dǎo)形成或保持生理結(jié)構(gòu)的肽);粘著啟動肽(如粘性肽、細(xì)胞-粘著-啟動肽);界面活性肽(如表面活性肽和乳化劑);微結(jié)構(gòu)和納米結(jié)構(gòu)-構(gòu)筑肽(即形成微-或納米結(jié)構(gòu)的機(jī)械部分的結(jié)構(gòu)肽);和前活化肽(如肽或蛋白的前導(dǎo)、前體和前導(dǎo)-前體肽、inteins)。
本發(fā)明廣義上涉及應(yīng)用熒光假單胞菌生產(chǎn)AMP和其它小肽。本發(fā)明的組分,單獨(dú)和/或組合后,意外地有利于應(yīng)用熒光假單胞菌生產(chǎn)包括AMP在內(nèi)的小肽。本發(fā)明中的多種組分可以單獨(dú)或組合后用于其它微生物(和用于其它目的),根據(jù)本發(fā)明公開的內(nèi)容,這對于本領(lǐng)域技術(shù)人員來說將是顯而易見的。
根據(jù)本發(fā)明,在細(xì)菌(優(yōu)選熒光假單胞菌)中生產(chǎn)無毒的串聯(lián)/多聚前體,然后經(jīng)過切割產(chǎn)生活性單體,從而生產(chǎn)高水平的AMP(或其它小肽)。用這種方式生產(chǎn)AMP一般消除了AMP的毒性(因為它們具有在細(xì)菌細(xì)胞膜上裝配成孔的能力)。通常用此方式生產(chǎn)肽還有助于小肽避免不需要的蛋白水解酶降解,對此小肽是特別敏感的。
本發(fā)明提供了具有與現(xiàn)有技術(shù)提示和教導(dǎo)不同的結(jié)構(gòu)特性的多聚體(尤其是AMP多聚體)和AMP(和其它肽)。本發(fā)明提供了一種新的連接AMP/肽單體形成多聚體的方法。本發(fā)明也提供了一種新的從多聚體上切割單體的方法。本發(fā)明優(yōu)選的串聯(lián)前體在單個AMP/肽亞基(單體)之間包含Asp-Pro肽鍵/酸性切割位點(diǎn)。特別優(yōu)選Gly-Asp-Pro鍵。這樣可以低成本、高效切割多聚體以產(chǎn)生活性單體。優(yōu)選稀釋的無機(jī)物或有機(jī)酸作為切割試劑。在現(xiàn)有技術(shù)中沒有教導(dǎo)多聚體中每一個肽/AMP單體拷貝之間的此類切割/切割位點(diǎn)的應(yīng)用。
同時還公開了一種在多聚體構(gòu)建物中以正確取向裝配多個編碼肽的多核苷酸拷貝的方法,同時引入合適的切割位點(diǎn)。為了在多聚體中引入合適的切割位點(diǎn),本發(fā)明提供了編碼切割位點(diǎn)的DNA序列,其中相應(yīng)的DNA序列使肽/AMP“基因”的多個拷貝以預(yù)期取向進(jìn)行低成本、高效的裝配。不同于其它已知的基因建構(gòu)方法,本發(fā)明的該方面是與提供特定化學(xué)切割以產(chǎn)生最小限度修飾的活性AMP/肽產(chǎn)物的方法相一致的。
本發(fā)明還提供了融合蛋白,優(yōu)選包含融合到一種載體多肽/蛋白上的本發(fā)明的多聯(lián)體/多聚體。該融合可以進(jìn)一步提高所需肽AMP的回收率。在本申請的實施方式中,應(yīng)用了一種載體多肽,優(yōu)選將載體多肽融合到多聚體的N末端。然而,本發(fā)明的多聚體可以適用于多種表達(dá)體系,并不僅限于末端融合。本發(fā)明中載體多肽的種類也是獨(dú)特的。
本發(fā)明另一令人驚奇的方面是本發(fā)明優(yōu)選的陽離子AMP多聚體缺乏電荷平衡。進(jìn)一步,本發(fā)明優(yōu)選的融合蛋白(優(yōu)選包含融合到載體多肽上的AMP多聚體)也缺乏電荷平衡。因此AMP是陽離子帶正電荷的。本發(fā)明驚奇地發(fā)現(xiàn),不需要補(bǔ)償多聚體構(gòu)建物中多個AMP拷貝的正電荷。這與以前的教導(dǎo)相反,即在載體蛋白和/或多聚體中必須加入足夠數(shù)量的帶負(fù)電荷的氨基酸,以充分補(bǔ)償(或至少顯著中和)AMP所帶的凈正電荷。因此本發(fā)明去掉了在現(xiàn)有多聚AMP結(jié)構(gòu)微生物表達(dá)技術(shù)中必須的步驟。本發(fā)明的這一方面也尤其有利于應(yīng)用除AMP之外的其它陽離子肽。
因此,本發(fā)明可以應(yīng)用比已往更廣范圍的載體多肽。本發(fā)明出人預(yù)料的提示,不必把載體蛋白限制在陰離子范圍內(nèi)(即大約與AMP陽離子相當(dāng)?shù)年庪x子),應(yīng)當(dāng)選擇那些在目的宿主中可以很好表達(dá)的作為優(yōu)選載體蛋白或多肽。
本發(fā)明的多聚體和多聚融合蛋白優(yōu)選作為不溶解的蛋白內(nèi)含物的形式進(jìn)行生產(chǎn)。本發(fā)明的熒光假單胞菌非常適用于生成這些形式的多聚體。在細(xì)菌中表達(dá)后,優(yōu)選本發(fā)明的串聯(lián)前體分隔成不溶解的、失活的蛋白內(nèi)含體。在生產(chǎn)之后,濃稠的內(nèi)含體可以通過機(jī)械的方法使之與宿主細(xì)胞分離。在用溶劑和離液劑溶解后,如需要,可以用稀酸切割多聯(lián)體,產(chǎn)生活性AMP/肽單體??商娲陀欣模跛崮軌蛉芙鈨?nèi)含物并可切割多聯(lián)體生成預(yù)期的肽產(chǎn)物,該步驟是低成本的。相對于固相合成方法,本發(fā)明的過程能夠降低成本。
因此,本發(fā)明提供了一種簡單的利用微生物低成本生產(chǎn)肽的系統(tǒng)。本發(fā)明肽表達(dá)系統(tǒng)甚至可以被用于低成本生產(chǎn)抗微生物肽。優(yōu)選熒光假單胞菌表達(dá)系統(tǒng)。在AMP作為優(yōu)選肽的同時,本發(fā)明的表達(dá)系統(tǒng)還可以被用于低成本生產(chǎn)其它種類的肽。因為避開了胞內(nèi)蛋白酶的不利影響并具有了降低AMP毒性的特性,因此本發(fā)明的酸-切割/載體-多聯(lián)體系統(tǒng)使重組肽的表達(dá)過程更力口溫和。從而可以通過簡單的、低成本的分離如離心或過濾,從多種宿主污染物(其它細(xì)胞膜成分/殘留物)中分離所需的肽。然后所需的分餾物可以通過酸處理容易地轉(zhuǎn)化為活性形式。在此描述的熒光假單胞菌發(fā)酵系統(tǒng)與低成本的生產(chǎn)過程的高效偶聯(lián)提供了一種具有較高競爭力的生產(chǎn)和純化天然肽的過程。
本發(fā)明提供了具有與已往技術(shù)提示或教導(dǎo)不同的結(jié)構(gòu)特性的多聚體和肽(包括AMP)。本發(fā)明提供了一種新的連接肽/AMP單體形成多聚體的方法。本發(fā)明優(yōu)選的串聯(lián)前體在單個(抗微生物)肽亞基(單體)之間包含Asp-Pro肽鍵/切割位點(diǎn)。特別優(yōu)選Gly-Asp-Pro鍵。優(yōu)選稀酸、或有機(jī)、無機(jī)酸酸作為切割試劑。這樣可以低成本、高效切割多聚體生成活性單體。
在現(xiàn)有技術(shù)中沒有教導(dǎo)每一個單體(AMP)拷貝之間的此類切割/切割位點(diǎn)的應(yīng)用;人們通常應(yīng)當(dāng)能夠料到額外的氨基酸殘基會破壞或負(fù)面影響肽/AMP的活性。因此,在單體之間應(yīng)用酸-不穩(wěn)定性Asp-Pro鍵,經(jīng)過切割,產(chǎn)生了保持抗微生物活性的衍生AMP。本發(fā)明因此在廣義上涉及此種延伸的AMP(在N-末端和C-末端有附加的氨基酸殘基)、涉及在單體之間有Asp-Pro切割位點(diǎn)(還有Gly-Asp-Pro鍵)的AMP多聚體、和涉及編碼這些具體成分的多核苷酸。本發(fā)明還通常涉及稀酸在從AMP多聚體上切割A(yù)MP單體的用途。
本發(fā)明令人驚奇的一個方面是本發(fā)明的切割位點(diǎn)及其優(yōu)選的稀酸切割產(chǎn)生了活性單體,每個單體包括肽/AMP核心和N-末端、C-末端附加的氨基酸殘基。優(yōu)選的,在每一個經(jīng)酸切割多聚體所生成的AMP單體上,有大約三個附加的氨基酸殘基-在C-末端有兩個殘基和在N-末端有一個殘基。單體的例子包括AMP核心加上在AMP核心氨基末端的一個脯氨酸殘基,和在C末端的甘氨酸和天冬氨酸殘基。令人驚奇的是這樣的單體保留了卓越的(抗微生物)活性,因為先前的技術(shù)提示肽/AMP上殘留的氨基酸,特別是AMP/陽離子核心肽的兩個末端的酸性/陰離子殘基,會破壞肽(AMP)的活性(抗微生物)。根據(jù)現(xiàn)有的理論不能推測出這種“延伸”的肽具有活性;人們一般會認(rèn)為它應(yīng)當(dāng)缺乏預(yù)期的活性。因此,本發(fā)明的該方面尤其有利于用于生產(chǎn)陽離子肽,尤其是AMP。
本發(fā)明的另一方面涉及新的從多聚體上切割單體的方法。根據(jù)本發(fā)明,優(yōu)選使用有機(jī)酸,特別是稀酸如0.025N HCl或10%醋酸,作切割試劑,用于從多聚體(和如需要從載體多肽)上分離活性肽/AMP單體。雖然根據(jù)本發(fā)明,有多種適用的切割試劑(在上面和技術(shù)背景部分中的多個參考文獻(xiàn)記載了多種切割試劑),但是本發(fā)明優(yōu)選稀酸有如下幾個原因。一個有利因素是經(jīng)過優(yōu)選的稀的有機(jī)酸切割所得到的單體是天然產(chǎn)物;一些切割試劑會產(chǎn)生非天然的不需要的衍生物。例如,用溴化氰作切割試劑的情況。甲酸也會產(chǎn)生不需要的甲?;臍埢?。同時甲酸也是難以清除的(在用甲酸切割多聚體和抽提單體之后,甲酸將難以與含水產(chǎn)物分離,因為它和水組成最大的共沸混合物。這導(dǎo)致水比甲酸沸騰的早得多,這延長了去除甲酸的步驟。)。因此,優(yōu)選用稀酸,而不用甲酸。這與現(xiàn)有提示是相對立的。
本發(fā)明的肽/抗微生物肽優(yōu)選通過細(xì)胞首先表達(dá)出多聚體前體,包含至少兩個肽/AMP單體。優(yōu)選的生產(chǎn)方法進(jìn)一步包括用稀酸切割A(yù)MP/肽多聚體以釋放AMP/肽單體。在特別優(yōu)選實施方式中,由所述切割產(chǎn)生的AMP單體是SEQ ID NO7所示肽。在多聚體實例中,多聚體包含SEQ ID NO6所示的氨基酸序列。在此列舉了多種其它的肽和多聚體。多種其它的肽單體可以替代特別優(yōu)選的AMP單體。編碼上述討論、舉例和/或提示的肽/蛋白的多核苷酸和構(gòu)造均包括在本發(fā)明范圍內(nèi)。
為了使多聚體具有合適的切割位點(diǎn),編碼切割位點(diǎn)的相應(yīng)的DNA序列也必須使多個肽/AMP“基因”拷貝以預(yù)期的取向進(jìn)行高效和低成本的裝配。同時公開了一種在多聚體構(gòu)建物中以優(yōu)選取向裝配多個肽/AMP編碼多核苷酸拷貝,并同時引入合適切割位點(diǎn)的方法。載體-AMP融合多肽中的高效表達(dá)載體多肽應(yīng)當(dāng)選擇那些在微生物宿主細(xì)胞中高效表達(dá)的任一蛋白或多肽,這樣的例子包括thoredoxin、麥芽糖結(jié)合蛋白、和除腈水解酶外的水解酶。在使用水解酶的優(yōu)選實例中,可以選擇高效表達(dá)的一種糖苷酶9EC3.2.1)或高度表達(dá)的一種脫鹵素酶(EC3.8.1)。高效表達(dá)的糖苷酶的優(yōu)選實例是半乳糖苷酶,如β-半乳糖苷酶(EC3.2.1.23)。高效表達(dá)的脫鹵素酶的實例是鹵烷脫鹵素酶(EC3.8.1.5),如來自玫瑰紅紅球菌(Rhodococcus rhodochrous)TDTM-003的鹵烷脫鹵素酶(SEQ ID NO30),微生物保藏號ATCC55388,保藏于美國典型培養(yǎng)物保藏中心(ATCC)(P.O.Box 1549,Manassas,VA20108 USA,located at 10801 University Blvd.,Manassas,VA20110 USA)。
因為載體蛋白將在起始部位即N-末端進(jìn)行表達(dá),因此載體-肽結(jié)構(gòu)的一部分、結(jié)構(gòu)的N-末端部分既可能包含整個的經(jīng)過選擇可高效表達(dá)的蛋白或多肽也可能是其N-末端片段。優(yōu)選的,結(jié)構(gòu)的N-末端部分是經(jīng)過選擇的可高效表達(dá)的蛋白或多肽的N-末端片段。優(yōu)選的,N-末端片段長度為至少為10個氨基酸殘基。在一個優(yōu)選實例中,N-末端片段長度為約或至少15個氨基酸殘基。在一個優(yōu)選實例中,N-末端片段長度為約或至少20個氨基酸殘基。在一個優(yōu)選實例中,N-末端片段長度少于150,更優(yōu)選約或少于120,更加優(yōu)選約或少于100,更加優(yōu)選約或少于80,和更加優(yōu)選約或少于60個氨基酸殘基。在一個優(yōu)選實例中N-末端片段長度為約10-150,更優(yōu)選約10-120,更加優(yōu)選約15-100,更加優(yōu)選約15-80,和更加優(yōu)選約20-60個氨基酸殘基。在一個優(yōu)選實例中,N-末端片段長度約為50或約40或約30或約20個氨基酸殘基。在一個優(yōu)選實例中,載體多肽選擇那些不是高陰離子的,在這里高陰離子是指pKa或pI小于或等于5.5。因此,優(yōu)選pKa或pI大于5.5的載體多肽。
可從經(jīng)選擇的可高度表達(dá)的多肽的N-末端氨基酸序列得到本發(fā)明載體多肽的氨基酸序列。參考四類氨基酸描述了在選擇載體多肽時首先需要考慮電荷平衡。在一個優(yōu)選實例中載體多肽的氨基酸序列完全等同于經(jīng)選擇可高效表達(dá)的多肽的N-末端部分;在一個優(yōu)選實例中,它是N-末端部分氨基酸序列的保守性變體。在此,短語“保守性變體”是指氨基酸序列的保守性突變形式,在本發(fā)明中是指經(jīng)選擇的載體蛋白的氨基酸序列的保守性突變形式。氨基酸序列的保守性突變是指選自以下七組的一個或多個氨基酸替換酸性Asp,Glu;不帶電荷的極性氨基Asn,Gln;堿性Lys,Ary,His;微電荷或非極性Gly,Ala;非極性烴基Val,Leu,Iie;極性醇Ser,Thr;芳香族Phe,Trp,Tyr。保守性變體的一個優(yōu)選實例中,少于75%和更優(yōu)選少于50%的氨基酸殘基發(fā)生突變;優(yōu)選達(dá)到或約33%,更優(yōu)選達(dá)到或約30%,更優(yōu)選達(dá)到或約25%,更加優(yōu)選達(dá)到或約20%,更加優(yōu)選達(dá)到或約10%,和更加優(yōu)選達(dá)到或約5%的氨基酸殘基發(fā)生突變。在這里,載體蛋白的氨基酸殘基既可以完全等同于也可以是高效表達(dá)多肽的保守性變體,其多肽編碼序列是所選宿主細(xì)胞的優(yōu)選密碼子。
雖然以下載體多肽的實例長度約為120-160個氨基酸,但是使用長度為約20個氨基酸的載體多肽也是成功的。例如,與所觀測到的實施例中公開的大的載體多肽結(jié)構(gòu)的表達(dá)量相比,使用玫瑰紅紅球菌(Rhodococcus rhodochrous)鹵烷脫鹵素酶的N-末端20-mer片段表達(dá)AMP多聯(lián)體時沒有減少載體-肽融合蛋白的表達(dá)量。
根據(jù)本發(fā)明的肽是在一種微生物中生物合成生產(chǎn)的,即在微生物宿主細(xì)胞中。在此所用的詞語“微生物”和“微生物的”是指真菌(包括絲狀真菌和酵母)和細(xì)菌。優(yōu)選的絲狀真菌包括如曲霉屬(Aspergillus)、金孢子菌屬(Chrysosporium)、鏈孢霉屬(Neurospora)和木霉屬(Trichoderma);優(yōu)選的酵母包括如假絲酵母屬(Candida)、克魯維氏酵母屬(Kluyveromyces)、畢赤氏酵母屬(Pichia)、糖酵母屬(Saccharomyces)、裂殖糖酵母屬(Schizosaccharomyces)、Yarrowia、接合糖酵母屬(Zygosaccharomyces)。在一個優(yōu)選實例中,微生物是一種細(xì)菌。
在一個優(yōu)選實例中,其中選擇了一種細(xì)菌作為微生物宿主細(xì)胞,該細(xì)菌屬于硬壁菌門(Firmicutes),更加優(yōu)選屬于桿菌屬(Bacilli)。當(dāng)選擇桿菌屬細(xì)菌作為宿主細(xì)胞時,優(yōu)選芽孢桿菌科(Bacillales)和乳桿菌科(Lactobacillales)。在一個可選擇的優(yōu)選實例中,使用細(xì)菌作為宿主細(xì)胞,細(xì)菌屬于放線菌(Actinobacteria)門,其中優(yōu)選的實例包括棒狀桿菌屬(Corynebacterium)、紅球菌屬(Rhodococcus)、和鏈霉菌屬(Streptomyces)。
在一個特別優(yōu)選的實施方式中使用了細(xì)菌宿主細(xì)胞,細(xì)菌屬于蛋白菌(Proteobacteria)門,更優(yōu)選屬于γ-蛋白菌。當(dāng)選擇γ-蛋白菌作為宿主細(xì)胞時,優(yōu)選腸桿菌(Enterobacteriales)和假單胞菌(Pseudomonadales)。當(dāng)選擇腸桿菌屬細(xì)菌時,優(yōu)選腸桿菌科,更加優(yōu)選大腸桿菌(Escherichia)或沙雷氏菌(Serratia)。優(yōu)選的大腸桿菌例子是大腸埃希氏桿菌(E.coli);優(yōu)選的沙雷氏菌例子是粘質(zhì)沙雷氏菌(S.marcescens)。
當(dāng)選擇假單胞菌細(xì)菌時,優(yōu)選屬于假單胞菌科(Pseudomonadaceae),和更加優(yōu)選屬于假單胞菌屬(Pseudomonas)。當(dāng)選擇假單胞菌屬細(xì)菌作為宿主細(xì)胞時,優(yōu)選屬于綠針假單胞菌類(P.chlororaphis)和熒光假單胞菌類(P.fluorescens),包含綠針假單胞菌類,如桔黃假單胞菌(P.aurantiaca)、綠針假單胞菌(P.chlororaphis)、莓實假單胞菌(P.fragi)、P.lundensis、和腐臭假單胞菌(P.taetrolens);和熒光假單胞菌類,如P.azotoformans、P.brenneri、P.cedrina、P.congelans、P.corrugata、P.costantinii、P.extremorientalis、熒光假單胞菌、P.fulgida、P.gessardii、P.libanensis、P.mandelii、萵苣葉斑病假單胞菌(P.marginalis)、P.mediterranea、P.migulae、霉味假單胞菌(P.mucidolens)、P.orientalis、P.poae、P.rhodesiae、類黃假單胞菌(P.synxantha)、托拉氏假單胞菌(P.tolaasii)、P.tricvalis、和P.veronii。
更加優(yōu)選,細(xì)菌宿主細(xì)胞屬于假單胞菌屬、熒光類,優(yōu)選熒光假單胞菌。當(dāng)選擇熒光假單胞菌時,優(yōu)選選自熒光假單胞菌變種A、熒光假單胞菌變種B、熒光假單胞菌變種C、熒光假單胞菌變種G、熒光假單胞菌Pf-5、熒光假單胞菌Pf0-1、或熒光假單胞菌SBW25。熒光假單胞菌變種A是特別優(yōu)選的。
根據(jù)本發(fā)明生產(chǎn)的小肽,長度至少為兩個氨基酸。優(yōu)選的,小肽長度約或至少5個,更優(yōu)選約或至少10個,更加優(yōu)選約或至少15個,更加優(yōu)選約或至少20個,和更加優(yōu)選約或至少25個氨基酸。優(yōu)選的,小肽長度為約或少于300個,更加優(yōu)選約或少于250個,更加優(yōu)選約或少于200個,更加優(yōu)選約或少于180個,更加優(yōu)選約或少于150個,和更加優(yōu)選約或少于120個氨基酸。當(dāng)小肽長度少于120個氨基酸時,優(yōu)選約或少于100個,更優(yōu)選約或少于80個,更加優(yōu)選約或少于60個,更加優(yōu)選約或少于50個,更加優(yōu)選約或少于40個,和更加優(yōu)選約或少于30個氨基酸。
在一個優(yōu)選實例中,小肽長度約為2-100個,更加優(yōu)選約為5-80個,更加優(yōu)選約為5-60個,更加優(yōu)選約為5-50個,更加優(yōu)選約為10-40個,更加優(yōu)選約為15-40個,和更加優(yōu)選約為20-30個氨基酸。
在一個可選擇優(yōu)選實例中,小肽長度約為5-300個,更加優(yōu)選約為10-250個,更加優(yōu)選約為15-200個,更加優(yōu)選約為20-180個,更加優(yōu)選約為25-150個,和更加優(yōu)選約為30-120個氨基酸。
小肽的氨基酸序列可以完全等同于,并來自生物有機(jī)體的天然肽;或合成序列,即可以是人們通過應(yīng)用基因工程技術(shù)或過程進(jìn)行人工干預(yù),獲得隨機(jī)或定向的結(jié)果。在一個優(yōu)選實例中,小肽的氨基酸序列來自于生物有機(jī)體,有機(jī)體優(yōu)選嗜溫性生物有機(jī)體。
在一個優(yōu)選實例中,根據(jù)本發(fā)明過程生產(chǎn)的小肽可以進(jìn)行進(jìn)一步的處理,除去由切割位點(diǎn)肽、可切割接頭肽、或兩者所引入的末端氨基酸殘基。這個過程可以使用現(xiàn)有技術(shù)已知的酶或化學(xué)的方法。
正如在此描述的,本發(fā)明所使用的轉(zhuǎn)基因包含表達(dá)肽多聚體構(gòu)建物,也就是肽多聯(lián)體,上游部分(即相應(yīng)的N-末端部分)的載體多肽。名詞“多聚體”在此是指肽多聚體,指的是一種包含兩個、三個、或更多肽單元的多肽。因此,肽多聚體至少是一個二聚體。在一個優(yōu)選實例中,肽多聚體至少是一個三聚體。肽多聚體構(gòu)建物不僅僅包括至少兩個小肽(肽單元),還包括至少一個在肽之間并串聯(lián)到肽上的肽基切割位點(diǎn)。在一個優(yōu)選實例中,肽多聚體長度約或少于600個氨基酸。優(yōu)選的,肽多聚體長度約或少于500個,更優(yōu)選約或少于450個,更加優(yōu)選約或少于400個,更加優(yōu)選約或少于350個,更加優(yōu)選約或少于300個,更加優(yōu)選約或少于250個,更加優(yōu)選約或少于200個,更加優(yōu)選約或少于150個氨基酸。優(yōu)選的,肽多聚體長度約或至少10個,更優(yōu)選約或至少15個,更加優(yōu)選約或至少20個,更加優(yōu)選約或至少25個,更加優(yōu)選約或至少30個,更加優(yōu)選約或至少40個,更加優(yōu)選約或至少50個,更加優(yōu)選約或至少60個,更加優(yōu)選約或至少70個,更加優(yōu)選約或至少80個,更加優(yōu)選約或至少90個,和更加優(yōu)選約或至少100個氨基酸。在一個優(yōu)選實例中,肽多聚體長度約10-約600個,更優(yōu)選約15-約500個,更加優(yōu)選約20-約450個,更加優(yōu)選約25-約400個,和更加優(yōu)選約30-約300個氨基酸。
綜上所述,在此提供的結(jié)果表明本發(fā)明獨(dú)特連環(huán)的肽/AMP構(gòu)建物能夠在微生物中高效生產(chǎn),特別優(yōu)選在細(xì)菌中,和最優(yōu)選在熒光假單胞菌中。AMP基因的連環(huán)化對于抗微生物肽似乎具有兩個顯著的影響降低了毒性(在細(xì)胞內(nèi)和細(xì)胞外),和提高了胞內(nèi)分隔作用和內(nèi)含體的形成,因此降低了對蛋白酶的敏感性,和進(jìn)一步減輕了毒性作用。發(fā)現(xiàn)肽/AMP基因的連環(huán)化能夠有效促進(jìn)所需肽的充分表達(dá)的同時,使用載體多肽(脫鹵素酶是其中一個例子)能使肽/AMP的表達(dá)水平更高。優(yōu)選一起使用多聚體/多聯(lián)體和載體多肽,特別是在熒光假單胞菌中,以促進(jìn)較高的表達(dá)。
本發(fā)明還提供了融合蛋白,優(yōu)選包含本發(fā)明融合到載體多肽/蛋白上的多聯(lián)體/多聚體。該融合能夠進(jìn)一步提高所需肽的回收率。全長蛋白的截短形式(脫鹵素酶的N-末端123個殘基是其中一個例子)也能夠象全長蛋白一樣(或好于)作為融合配偶體。這種截短的蛋白可能不會完全折疊,和可能比全長蛋白溶解性更差。這些融合蛋白還能分級成不溶解的裂解物組分。不適合的蛋白片段類型可以很容易地聚集并沉淀,有利于從暴露于蛋白酶的溶液中抽提肽/AMP多聯(lián)體。
基因連環(huán)化和應(yīng)用特定融合均有利于構(gòu)成無毒、高效表達(dá)的肽/AMP構(gòu)建物。內(nèi)含體的形式可以促進(jìn)表達(dá)肽的積累,這不是本發(fā)明所獲得的高表達(dá)水平的唯一的原因。例如,發(fā)現(xiàn)DHFR(二氫葉酸還原酶)-AMP(單體)融合強(qiáng)烈地分配成內(nèi)含體;然而該構(gòu)建物仍然對熒光假單胞菌具有毒性。DHFR-AMP內(nèi)含體的SDS-PAGE分析顯示AMP肽已經(jīng)從DHFR融合蛋白上被切割下來了。這種蛋白水解作用使細(xì)胞暴露于自由態(tài)(并具有毒性)AMP。AMP分子的連環(huán)化,特別是融合到載體多肽(如DHFR或脫鹵素酶),在蛋白水解作用的情況下,為細(xì)胞提供了一種額外的保護(hù)。
在本申請的實例中,使用了載體多肽,優(yōu)選將載體多肽融合到多聚體的N-末端。然而,本發(fā)明的多聚體可以適用于多種表達(dá)系統(tǒng),不僅僅限于末端融合。本發(fā)明載體多肽可以應(yīng)用多種途徑進(jìn)行使用,不僅僅限于實施例(例如應(yīng)用單體而不是多聚體)。
此處的臨界參數(shù)能夠?qū)崿F(xiàn)大范圍內(nèi)再生產(chǎn)表達(dá)構(gòu)建物,以提高肽/AMP表達(dá)。構(gòu)建物的高效表達(dá)與由熒光假單胞菌發(fā)酵帶來的吸引力、低成本相結(jié)合,共同實現(xiàn)了新穎、大規(guī)模應(yīng)用,來經(jīng)濟(jì)地生產(chǎn)肽/AMP。本實施例中的過程可以應(yīng)用高濃度發(fā)酵。優(yōu)選的,使用大規(guī)模發(fā)酵的熒光假單胞菌。與已知的現(xiàn)有技術(shù)相比,本發(fā)明能夠大大提高肽/AMP的產(chǎn)量。
本發(fā)明另外一個令人驚奇的方面是陽離子AMP多聚體可以缺乏電荷平衡。而且,本發(fā)明的融合(包含融合到載體多肽/蛋白上的多聚體)也可以缺乏電荷平衡。即,AMP通常是帶陽離子/正電荷的。本發(fā)明涉及令人驚奇的發(fā)現(xiàn),也就是,不用必須補(bǔ)償多聚體構(gòu)建物中的多個AMP拷貝所帶的正電荷。多聚體和本發(fā)明的融合令人驚奇的是,單體或完整融合中不需要電荷平衡。本發(fā)明消除了該因素,而這在先前記載的多聚AMP構(gòu)建物中是必須的。在生物生產(chǎn)AMP方面現(xiàn)有技術(shù)中作出了一些嘗試,即首先生產(chǎn)多聚和/或融合蛋白形式的失活A(yù)MP;然而,上述嘗試提示必須通過載體蛋白加入或加到多聚體上足夠數(shù)量的帶負(fù)電荷的氨基酸,以充分補(bǔ)償AMP所帶的正電荷。需要一些類型的酸性蛋白(在多聚體和/或載體)來平衡掉AMP的堿性(pH)。先前的技術(shù)提示,在翻譯過程中,新生的AMP或AMP多聚體(是陽離子/正電荷/堿性)與翻譯過程中涉及的核酸分子相互作用,并且這導(dǎo)致翻譯過程的停止。因此,先前所選擇的載體蛋白帶有足夠平衡或抵消AMP所帶電荷的負(fù)電荷。
本發(fā)明令人驚奇和有利地提供了既可優(yōu)選自陽離子的,又可優(yōu)選自不足以顯著補(bǔ)償AMP/AMP多聚體所帶正電荷的陰離子的載體蛋白。也就是說,多聚體AMP和AMP融合所帶的凈正電荷不需要通過酸性/負(fù)電荷氨基酸殘基進(jìn)行顯著的補(bǔ)償和/或平衡。本發(fā)明令人驚奇地不同于以前的技術(shù)啟示;本發(fā)明的多聚體和融合沒有補(bǔ)償性的帶負(fù)電荷的氨基酸片段。而且,本發(fā)明多核苷酸不是這樣一種成分,即從根本上對應(yīng)于需要顯著減少所編碼AMP累積的正電荷的形式。而且本發(fā)明的間隔物和載體多肽(還有AMP亞基)沒有加入半胱氨酸,這與現(xiàn)有技術(shù)所提示的是相反的。
下表(表2)表示,有四類氨基酸可用于本發(fā)明目的,即兩類是不帶電荷的氨基酸(非極性的和極性不帶電荷的),和另兩類(酸性和堿性)是給蛋白/肽帶來電荷的氨基酸。在此,所用“酸性”氨基酸為蛋白引入負(fù)電荷,和“堿性”氨基酸為蛋白引入正電荷。
表2氨基酸分類 氨基酸的實例非極性 Ala,Val,Leu,Ile,Pro,Met,Phe,Trp極性不帶電荷Gly,Ser,Thr,Cys,Tyr,Asn,Gln酸性Asp,Glu堿性Lys,Ary,His關(guān)于電荷平衡的本發(fā)現(xiàn)是,根據(jù)本發(fā)明不需要應(yīng)用一種大得多的多聚體和載體多肽。因此,本發(fā)明可以應(yīng)用比先前技術(shù)所描述的更廣范圍的多聚體和載體多肽。本發(fā)明提供陽離子多聚體。本發(fā)明載體多肽的類型也是新穎的。本發(fā)明令人驚奇地表明不需要把載體蛋白限制在足夠陰離子載體蛋白范圍內(nèi)(大約與AMP多聚體的陽離子相當(dāng)?shù)年庪x子),本發(fā)明提示,優(yōu)選的載體是在宿主中能夠很好表達(dá)的蛋白或多肽片段。表達(dá)水平優(yōu)選占細(xì)胞蛋白總量的2%-25%。本發(fā)明還提供了一般不溶解的載體多肽,這有助于融合蛋白從細(xì)胞質(zhì)溶液中析出,并形成不溶解的內(nèi)含體/蛋白集合體。本發(fā)明的載體多肽有助于串聯(lián)的肽/AMP的提取;這可以有助于提高肽/AMP的回收率,通過降低肽/AMP對細(xì)胞質(zhì)蛋白酶的敏感,和降低毒性肽如AMP的細(xì)胞內(nèi)活性。
優(yōu)選以一種不溶解的蛋白內(nèi)含體的形式生產(chǎn)本發(fā)明多聚融合蛋白。本發(fā)明的熒光假單胞菌非常適合用這種形式生產(chǎn)多聚AMP。
正如上面所提到的,本發(fā)明包括多核苷酸構(gòu)建物,其中每一個這樣的構(gòu)建物包含一種編碼本發(fā)明所討論或提到的氨基酸片段的DNA片段。優(yōu)選的,編碼本發(fā)明多聚體和/或融合蛋白的DNA片段被恰當(dāng)?shù)剡B接于或定位于功能性相關(guān)的另外核苷酸序列,從而該DNA片段能夠在宿主中表達(dá),產(chǎn)生所需的肽。例如,熒光假單胞菌中的一個啟動子連接到一個編碼序列,從而該啟動子影響該編碼序列的轉(zhuǎn)錄。一般來說,“可操縱連接”的意思是被連接的序列是連續(xù)的,和需要加入到閱讀框內(nèi)兩個連續(xù)的蛋白編碼區(qū)。然而,已知特定的基因元件,如增強(qiáng)子,能夠在非連續(xù)狀態(tài)下進(jìn)行可操縱連接。
制備好的用于導(dǎo)入原核或真核宿主(即載體)中的DNA構(gòu)建物通常包含一個可被宿主識別的復(fù)制系統(tǒng),包括編碼預(yù)期多肽的DNA片段,和優(yōu)選還包括恰當(dāng)連接于多肽編碼片段上的轉(zhuǎn)錄和翻譯起始調(diào)控序列。表達(dá)系統(tǒng)(表達(dá)載體)可以包括,例如復(fù)制起始點(diǎn)或自主復(fù)制序列(ARS)和表達(dá)控制序列,一個啟動子,一個增強(qiáng)子,和過程必須的信息位點(diǎn),如核糖體結(jié)合位點(diǎn),RNA剪接位點(diǎn),轉(zhuǎn)錄終止子序列,和mRNA穩(wěn)定序列。還可包括信號肽用于啟動多肽的分泌,或用于使蛋白穿越或結(jié)合到細(xì)胞膜上。
表達(dá)和克隆載體一般包含一種選擇標(biāo)記,即和載體一起轉(zhuǎn)化,編碼宿主細(xì)胞生存或生長必須蛋白的一種基因。雖然該標(biāo)記基因可以被另外一種多核苷酸序列攜帶著一起轉(zhuǎn)導(dǎo)到宿主細(xì)胞,但更多情況下該基因保留在克隆載體中。在選擇性條件下,只有轉(zhuǎn)導(dǎo)了該標(biāo)記基因的那些宿主細(xì)胞能夠生存和/或生長。通常選擇基因編碼的蛋白(a)能夠提供抗生物抗性或其它毒性物質(zhì),如安比西林、新霉素、氨甲碟呤等;(b)補(bǔ)足營養(yǎng)缺陷;或(c)提供從限定性生長培養(yǎng)基中不能獲得的臨界營養(yǎng)。恰當(dāng)?shù)倪x擇性標(biāo)記的選擇依賴于宿主細(xì)胞;在現(xiàn)有技術(shù)中不同宿主的合適的標(biāo)記是已知的。
也可以應(yīng)用包含預(yù)定核酸序列的雜交探針來檢測轉(zhuǎn)化體。優(yōu)選的,在低、溫和、和/或高嚴(yán)格條件下進(jìn)行雜交反應(yīng),例如,Keller,G.H.,M.M.Manak(1987),DNA Probes,Stockton Press,New York,NY,pp.169-170。本發(fā)明范圍內(nèi)的多核苷酸也可以用這種方法進(jìn)行檢測。
在此所用“重組”多核苷酸是指兩個獨(dú)立的核酸序列片段的結(jié)合,其中序列通過人工操作結(jié)合到一起(通過基因工程技術(shù)或化學(xué)合成技術(shù))。由此,人們能夠把異源多核苷酸片段結(jié)合到一起,每一片段具有預(yù)期的功能,從而生成一種具有預(yù)期功能組合的多核苷酸。在此,“分離的”多肽和/或“純化的”蛋白是指它們處于與天然狀態(tài)下在一起的其它分子不再混合的一種狀態(tài)。因此,“分離的”和/或“純化的”意味著其中有了人的參與。
根據(jù)本發(fā)明,由所述微生物細(xì)胞生產(chǎn)的多聚體、融合蛋白、和/或AMP優(yōu)選占到所述微生物細(xì)胞細(xì)胞蛋白總量的約2%-25%。這些微生物細(xì)胞優(yōu)選經(jīng)過生長(使之生殖)產(chǎn)生所述微生物細(xì)胞的大規(guī)模培養(yǎng)物,并優(yōu)選產(chǎn)生的多聚體、融合蛋白、和/或AMP占到該培養(yǎng)物所產(chǎn)生的總細(xì)胞蛋白量的2%-25%。
另外,本發(fā)明的一個方面是包含本發(fā)明多肽和/或蛋白的微生物細(xì)胞。在本文中,轉(zhuǎn)基因宿主細(xì)胞是指經(jīng)過基因修飾,包含本發(fā)明分離的DNA分子。可以通過已知的適合特定類型細(xì)胞的技術(shù)進(jìn)行該DAN的轉(zhuǎn)導(dǎo),包括但不限于,轉(zhuǎn)化、脂質(zhì)轉(zhuǎn)染、電穿孔、和物理轟擊。轉(zhuǎn)基因細(xì)胞還包括具有異源DNA的人工“轉(zhuǎn)化”細(xì)胞的“天然”后代。優(yōu)選異源DNA共同存在于宿主細(xì)胞基因組中;該項技術(shù)在現(xiàn)有技術(shù)中是已知的。還可通過非-基因組質(zhì)粒使多肽嚴(yán)格保留于并在后代細(xì)胞中表達(dá),該項技術(shù)也是現(xiàn)有技術(shù)已知的。
本領(lǐng)域技術(shù)人員均知,DNA序列可以基于基因密碼和習(xí)慣用密碼子的基礎(chǔ)上進(jìn)行變化。編碼本發(fā)明所討論和所列舉的肽和蛋白的所有DNA序列均包括在本發(fā)明范圍內(nèi)。
另外,本領(lǐng)域技術(shù)人員均知,實施例中所列舉的多核苷酸和蛋白/肽可能發(fā)生不會顯著改變蛋白/肽預(yù)期活性的等位基因變化。所有等同的變化均包括在本發(fā)明范圍內(nèi)??梢愿鶕?jù)上述表1所列的氨基酸類型進(jìn)行保守性氨基酸替換。在此情況下,可以進(jìn)行非保守性變化,而不顯著改變本文所述蛋白/肽的預(yù)期活性/功能。
所有的專利、專利申請、在先的申請、和本文參考或引證的公開物在此全文引作參考,與本說明書所明確教導(dǎo)的并不矛盾。
下面是詳細(xì)描述本發(fā)明生產(chǎn)過程的實施例。這些實施例應(yīng)當(dāng)不是限制性的。除非另有說明,所有的百分率均是重量百分率,所有的溶劑混合物比例均是體積比。
實施例1-多聚AMP的設(shè)計和生產(chǎn)使用D2A21抗微生物肽作為本發(fā)明策略的示范AMP。AMP核心是一個由苯氨酸、甘氨酸和賴氨酸組成的具有α-螺旋結(jié)構(gòu)的23個氨基酸殘基的肽Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe AlaPhe Ala Phe(SEQ ID NO1)合成編碼該AMP的基因,然后構(gòu)建在細(xì)菌中表達(dá)D2A21前體的質(zhì)粒。首先,化學(xué)合成編碼D2A21肽的DNA序列。SEQ ID NO2是用于編碼SEQ ID NO1所述D2A21肽的DNA序列。將DNA分子和它的非編碼區(qū)連接在一起組成多聚體/串聯(lián)體。在每個AMP單體(經(jīng)連接組成多聚體)之間需要酸-不穩(wěn)定性Asp-Pro切割位點(diǎn),從而可使多聚體切割成活性單體。因此,經(jīng)修飾的“AMP核心”,為合成后進(jìn)行的多聚體產(chǎn)物的酸水解(產(chǎn)生功能行單體)提供了接頭/切割位點(diǎn)。在一個實例中,在D2A21 DNA序列的末端加入了9個附加的DNA殘基(堿基),在D2A21肽的氨基末端加上了Asp-Pro序列,在其c-末端加上了Gly。參見下面的SEQ ID NO4.SEQ ID NO3使用于編碼SEQ IDNO4的DNA序列。在Asp-Pro序列的N-末端加上了一個Gly殘基,以降低切割反應(yīng)中任何潛在的“鄰位基團(tuán)”效應(yīng)。加上三個附加的氨基酸殘基的AMP核心的氨基酸序列是
Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala LysPhe Ala Phe Ala Phe Gly(SEQ ID NO4)然后將這些亞基的多個拷貝連接在一起。然后用弱酸在側(cè)面序列天冬氨酸和脯氨酸之間,進(jìn)行切割。
下面是一個二聚體(即4A二聚體)的實例(SEQ ID NO6),其具有兩個D2A21抗微生物肽,通過Gly-Asp/Pro切割序列相連接(兩個SEQ ID NO3拷貝連接在一起),并在側(cè)面加上短序列的無關(guān)的肽。(例如,如下顯示了在多聚體的C-末端加上了六個組氨酸殘基,從而利于多聚體在固定Ni上的親和純化。參見如下面的實施例5。)SEQ IDNO5提供了用于編碼下述多聚體的DNA序列。
Met Ala Ser Met Thr Gly Gly Gln Gln Met 10Gly Arg Asp Pro Phe Ala Lys Lys Phe Ala 20Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe 30Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro 40Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys 50Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala 60Phe Ala Phe Gly Asp Pro Asn Ser Ser Ser 70Val Asp Lys Leu Ala Ala Ala Leu Glu His 80His His His His His 85(SEQ ID NO6)可以看出,Asp-Pro酸切割位點(diǎn)在殘基13和14、39和40、65和66之間。因此,上述多聚體經(jīng)酸處理,產(chǎn)生兩個AMP單體(氨基酸14-39和40-65),每個均被稱作D2A21’。下面是所得到的D2A21’單體的序列Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys LysPhe Ala Lys Phe Ala Phe Ala Phe Gly Asp(SEQ ID NO7)與SEQ ID NO1所示的D2A21核心肽相比,D2A21’在N-末端包含一個附加的脯氨酸,并在其C-末端有一個Gly-Asp二肽。令人驚奇地發(fā)現(xiàn)D2A21’擁有等同于D2A21核心/親本肽的抗微生物活性。
因為天冬氨酸和谷氨酸均是酸性(帶負(fù)電荷)氨基酸殘基,賴氨酸、精氨酸和組氨酸是堿性(帶正電荷)氨基酸殘基,因此在多聚體中下面SEQ ID NO6所示的帶電荷的氨基酸的排列是顯而易見的·在前導(dǎo)序列中(SEQ ID NO6前面的13個氨基酸),有一個精氨酸(帶正電荷;SEQ ID NO6的殘基12)和一個天冬氨酸(帶負(fù)電荷;SEQ ID NO6的殘基13),·末端有一個天冬氨酸(帶負(fù)電荷,殘基39)的第一個D2A21亞基(SEQ ID NO6的氨基酸14-39),首位有9個賴氨酸(帶正電荷),·末端有一個天冬氨酸(殘基65)的第二個D2A21肽(氨基酸40-65),有9個賴氨酸,和·在非轉(zhuǎn)錄尾區(qū)(氨基酸65-85)有一個天冬氨酸和一個谷氨酸(都帶負(fù)電荷)和6個組氨酸(帶正電荷)。
SEQ ID NO6的85個氨基酸殘基所帶的電荷如下表示,其總“O”代表中性氨基酸殘基,“+”代表帶正電荷/堿性的氨基酸殘基,和“-”代表酸性/負(fù)電荷殘基OOOOOOOOOOO+- (前導(dǎo)片段的13個氨基酸)OOO++OO++O++OO++OO+OOOOOO-(26個氨基酸的D2A21’)OOO++OO++O++OO++OO+OOOOOO-(D2A21’)OOOOOO-OOOOOO-++++++ (非轉(zhuǎn)錄尾區(qū)片段的20個氨基酸)因此,很清楚地看到在SEQ ID NO6所示的多聚體中有25個正電荷的殘基和僅5個帶負(fù)電荷的殘基。兩個AMP(每個有9個賴氨酸)中的18個賴氨酸殘基所帶的正電荷不會被前導(dǎo)序列和接頭序列中的3個天冬氨酸、和尾區(qū)的一個谷氨酸和天冬氨酸殘基所補(bǔ)償。另外,令人驚奇的是前導(dǎo)序列包含一個帶正電荷殘基(精氨酸),和尾區(qū)序列包含6個帶負(fù)電荷的組氨酸。先前的技術(shù)提示不能應(yīng)用具有帶正電荷的附加、非嚴(yán)格限制的氨基酸的多聚體。更令人驚奇的是,在D2A21’附加的三個殘基中,其中一個是酸性的,與核心D2A21肽相比,這并沒有影響到D2A21’的活性。
實施例2-合成具有多個拷貝和正確取向的AMP單元的構(gòu)建物肽產(chǎn)品的生產(chǎn)成本歸因于肽合成和肽純化的成本。肽多聚物的大規(guī)?;瘜W(xué)合成費(fèi)時費(fèi)力;固相肽合成,需要13-18個步驟,需要2-19小時才能完成,在多聚物合成過程中(Mergler和Durieux,2000)需這導(dǎo)致反應(yīng)混合物中累積了多種不同的副產(chǎn)物(尤其對于長肽的合成)。因此,合成的成本會很高(將近1,000,000美元每公斤),并且純化的成本根據(jù)所需的純化水平也會達(dá)到或超出這個數(shù)。很明顯,這個成本大大超出了可接受成本,因此限制了它的大規(guī)模應(yīng)用。
AMP通常包含周期性排列的琉水并帶正電荷(堿性)的側(cè)鏈(參見Hancock和Lehrer,1998,或Blondelle等,1999)。AMP是兩親性分子;當(dāng)肽形成空間結(jié)構(gòu)(螺旋或9折疊)時,殘基的周期性排列為疏水的并帶電荷的副鏈提供了空間上的隔離。電荷和疏水性的隔離能夠使AMP結(jié)合到微生物的外膜上。一旦結(jié)合,肽能夠插入膜脂雙分子層并自動排成裂解孔(Hancock等,1995),這導(dǎo)致細(xì)胞內(nèi)容物的釋放,造成微生物在幾分鐘內(nèi)死亡。已經(jīng)報道了,AMP分子插入微生物膜并隨即排列成孔,損壞膜的結(jié)構(gòu)完整性,從而殺死微生物。雖然詳細(xì)的作用機(jī)制還不完全清楚,但根據(jù)這些肽的預(yù)測的結(jié)構(gòu)特性,能夠在體外設(shè)計活性AMP分子。
為了抑制寡聚化/裝配過程,并降低產(chǎn)物的溶解性,我們設(shè)計并生成了一種表達(dá)構(gòu)建體,其中AMP產(chǎn)物表達(dá)成“頭-尾”連接的多聚物(串聯(lián)體)。設(shè)計的該AMP串聯(lián)體降低了溶解性,并且空間/結(jié)構(gòu)可塑的AMP適合插入膜并殺死微生物宿主細(xì)胞。不溶解的串聯(lián)多肽以不溶解內(nèi)古體的形式在細(xì)胞中積累。之后,通過裂解細(xì)胞,洗去可溶的宿主相關(guān)雜質(zhì),得到串聯(lián)體。
所有的基因都有用來判斷是否正確(有義)表達(dá)的5’和3’端。相同的DNA分子連接成多聚體基因需要所有的亞基以“頭-尾”取向進(jìn)行連接(以DNA分子的5’端-3’端)。每個錯誤取向的亞基不僅僅造成錯誤的表達(dá)(反義表達(dá)),而且影響相鄰亞基的正確表達(dá)。隨著串聯(lián)體亞基數(shù)量的增加,亞基隨機(jī)連接成正確取向的可能性就會變得非常非常小。在大多數(shù)情況下,可以應(yīng)用“強(qiáng)制”克隆技術(shù)來有效實現(xiàn)正確取向的連接,其中即可以使用兩種不同的限制性內(nèi)切酶,又可以使用一組IIS內(nèi)切酶(Lee,J.H.,等,1996,Kim和Szybalski,1988)。然而,這些一般的策略不能用于生產(chǎn)幾乎不修飾的可切割肽串聯(lián)體,因在這些方法中需要在肽的末端加入大量的氨基酸(正如前面所預(yù)期的降低肽的活性)。本發(fā)明的連接策略適用于編碼小的可切割氨基酸序列的DNA的末端。
本發(fā)明還公開了串聯(lián)體的構(gòu)建方法,即把“假回文間隔區(qū)”連接到AMP亞基上。該方法能夠產(chǎn)生亞基正確取向的多聚體,即一種“頭-尾”排列形式(為了消除帶有無用排列的克隆)。參見附圖1,2和3A-3C。編碼AMP單體的合成的DNA包含一個附加的不連續(xù)的序列,當(dāng)發(fā)生錯誤連接時,該序列形成回文對稱的六核酸內(nèi)切酶切割位點(diǎn)。DNA亞基完成連接(或期間)后,裝配錯誤的串聯(lián)體可以很方面地被合適的內(nèi)切酶通過DNA消化而降解。如附圖2和3所示,PvuI識別不需要的B-B端,和BamHI識別不需要的A-A端。
應(yīng)用極性相反的、基于“假回文對稱”序列的自對稱DNA序列重疊,經(jīng)過寡核苷酸融合,生成了這些串聯(lián)體,假回文對稱的序列是5’GATCCG3’。該序列形成可編碼序列的核心,在AMP單體的連接處形成酸不穩(wěn)定性切割位點(diǎn),即Gly-Asp-Pro。附圖3描述了該序列的上述過程,A到C。因為這些序列的末端是自對稱的,它們可以彼此連接或首位銜接。在它們首位銜接的情況下,在結(jié)合處形成pvu I和Bam HI限制性內(nèi)切酶位點(diǎn)。如果彼此連接,則不會形成限制性位點(diǎn)。后者的情況還產(chǎn)生帶有預(yù)期末端的串聯(lián)體產(chǎn)物。事實上,發(fā)生在兩個自對稱寡核苷酸之間的、形成內(nèi)切酶位點(diǎn)的連接占到所有連接產(chǎn)物的三分之二,一般只有三分之一的連接被用于裝配含有預(yù)期末端的產(chǎn)物。優(yōu)選的,連接得到的預(yù)期產(chǎn)物不包含在連接部位形成的內(nèi)切酶位點(diǎn)。
完成連接和消化過程后,得到的串聯(lián)體應(yīng)當(dāng)是正確裝配的(相同的有義取向)。然后,純化得到預(yù)期大小的串聯(lián)體,并插入表達(dá)質(zhì)粒中。選擇合適的六核酸序列(GATCCG(SEQ ID NO8)),它編碼一種可切割的將AMP亞基連接在一起的肽接頭,例如,Asp-Pro可切割二肽接頭。
使用該方法,合成了D2A21’串聯(lián)體,并插入大腸桿菌表達(dá)質(zhì)粒pET21b的多克隆位點(diǎn)區(qū)的BamH I位點(diǎn)。轉(zhuǎn)化大腸桿菌后,獲得了兩個克隆,克隆4A和AB4,分別包含兩個和三個D2A21’單體。上面已經(jīng)提供了4A二聚體的序列。SEQ ID NO9SEQ ID NO10分別提供了AB4三聚體及其編碼DNA的序列。雖然純化了較大的D2A21’多聚體(有6、7、和8個亞基的串聯(lián)體),并連接到了表達(dá)質(zhì)粒中,但我們進(jìn)一步的實例主要集中在二聚體和三聚體上。
實施例3-AMP串聯(lián)多肽在大腸桿菌中的表達(dá)將4A二聚體和AB4三聚體質(zhì)粒轉(zhuǎn)導(dǎo)到大腸桿菌BL21(DE3)株系。將轉(zhuǎn)化的克隆接種到液體生長培養(yǎng)基中。培養(yǎng)物在37℃振搖培養(yǎng)。當(dāng)培養(yǎng)物濃度達(dá)到A600每l,在培養(yǎng)物中加入1PTG9異丙基半乳糖苷,最終濃度為1mM,進(jìn)行基因轉(zhuǎn)導(dǎo),培養(yǎng)物在37℃培養(yǎng)3個小時。轉(zhuǎn)導(dǎo)后,收獲細(xì)胞,裂解,并離心,分離可溶/細(xì)胞原生質(zhì)和不溶解的細(xì)胞成分。通過SDS-PAG正電泳分析提取物。在表達(dá)二聚(4A)或三聚(AB4)D2A21’構(gòu)建物的誘導(dǎo)培養(yǎng)物樣品中,明顯觀察到誘導(dǎo)產(chǎn)生的蛋白條帶。正如所預(yù)期的,在不包含AMP基因的培養(yǎng)物樣品中,通過SDS-PAGE分析沒有觀察到上述條帶。
D2A21’肽富含賴氨酸、苯丙氨酸和甘氨酸。為了檢測向生長培養(yǎng)基中加入附加氨基酸是否能夠提高D2A21’串聯(lián)產(chǎn)物水平,我們在誘導(dǎo)后立即向培養(yǎng)物中加入了0.5g/l的苯丙氰駿和賴氨酸。該追加步驟顯著提高了D2A21’三聚體在大腸稈菌中的產(chǎn)量。
實施例4-在大腸桿菌中表達(dá)的AB4的純化和分級將編碼AB4基因的質(zhì)粒轉(zhuǎn)導(dǎo)到大腸桿菌表達(dá)宿主BL21(DE3),將所產(chǎn)生的抗生物抗性的克隆接種到含有誘導(dǎo)培養(yǎng)基的培養(yǎng)瓶中,在37℃下使培養(yǎng)物生長到A600nm每l,然后用1mM的IPTG 37℃下誘導(dǎo)三個小時。誘導(dǎo)后,通過離心收集培養(yǎng)物,裂解并離心,使可溶的細(xì)胞成分(如胞質(zhì))。與不溶解的細(xì)胞成分(如細(xì)胞膜或蛋白內(nèi)含體)分離。AB4 D2A21’三聚體能夠在大腸桿菌中很好地表達(dá)并容易分級成不溶解的亞細(xì)胞組分。
為了檢測AB4蛋白是否形成內(nèi)含體和是否與細(xì)胞膜有關(guān),不溶解的組分用緩沖去污劑洗滌。AB4蛋白不能被1%的triton X-100(一種非父性去污劑)抽提。去污劑溶液能夠使膜脂和蛋白溶解。陰離子去污劑如SDS能夠使AB4蛋白很好地溶解。產(chǎn)生該結(jié)果一點(diǎn)也不奇怪,因為陰離子去污劑和陽離子肽之間發(fā)生的強(qiáng)烈的有利反應(yīng)是預(yù)料之中的。相反,AB4三聚體不能被陽離子去污劑溶解??梢詰?yīng)用陽離子去污劑,從AB4蛋白中選擇性去除可溶的宿主相關(guān)雜質(zhì)。
AB4蛋白不能被非離子去污劑,如triton X-100溶解,該發(fā)現(xiàn)提示,該蛋白沒有與膜結(jié)合。另外,數(shù)據(jù)表明AB4蛋白在細(xì)胞中形成內(nèi)含體。從優(yōu)化過程的觀點(diǎn)看,這是有利的,因為內(nèi)含體產(chǎn)物可以使用低成本的物理技術(shù)如離心或過濾的方法從許多污染物中純化出來。
實施例5-可溶性多肽的純化為了描述細(xì)菌表達(dá)串聯(lián)體,應(yīng)用固相Ni++層析純化了4A(D2A21)二聚體。大多數(shù)的二聚體分隔物屬于可溶的細(xì)胞質(zhì)組分,不同于實施例4中的三聚體,三聚體屬于不溶解的組分。從表達(dá)4A二聚D2A21’串聯(lián)體的細(xì)胞制備大腸桿菌裂解物,并經(jīng)過固相Ni層析柱。用緩沖液洗滌層析柱以去除未結(jié)合的物質(zhì),然后用0.5M pH為7.8的咪唑洗脫串聯(lián)體。Ni++純化的二聚體表現(xiàn)為單一條帶,分子量約13kDa;純化二聚體的高分子量可能歸因于該肽所具有的高陽離子特性。Ni層析柱的產(chǎn)量低于預(yù)期值,可能因為兩性肽與固相載體之間的緊密的非特異性相互反應(yīng),或因為多聚體與載體的結(jié)合很弱。透析純化的蛋白,在進(jìn)行功能和生化分析之前除去咪唑。
純化二聚體的MALDI質(zhì)譜分析表明N-末端的甲硫氨酸被去掉了(預(yù)期的MW=9,497.1;觀測到的純化二聚體的MW=9,499.4)。該變化在蛋白表達(dá)系統(tǒng)中是常見的。使用下面實施例7中的方案,透析得到的D2A21二聚體,檢測不到抗微生物活性。這表明肽的抗微生物活性通過連環(huán)化而變?nèi)趿恕?br>
實施例6-從多聚體上產(chǎn)生肽單體為了檢測從列舉的串聯(lián)體是否能夠得到D2A21’,用50%的甲酸(或水,作為對照)處理純化的(非活性)前體,混合物加熱到70℃處理24小時。切割完成后,用快速真空泵真空干燥樣品,然后在分析前,用TrisCl/NaOH進(jìn)行中和。通過SDS-PAGE分析樣品。分析結(jié)果表明,正如所預(yù)料的,前體肽被甲酸切割(沒有被水切割)。在甲酸處理樣品的早些時候(6小時),觀察到了不連續(xù)的梯度切割中間物和未切割的原料。在別處討論了其它的酸處理;切割肽的關(guān)鍵是降低pH值(在本發(fā)明公開內(nèi)容的啟示下,本領(lǐng)域技術(shù)人員均能認(rèn)識到的)。
實施例7-切割多聚體得到的單體的活性切割下來的肽(實施例5和6中的樣品)的抗微生物活性,通過測定抑制大腸桿菌生長的劑量來檢測。將樣品與大腸桿菌BL21(DE3)株系共同溫育,過夜,然后測定其抑制微生物生長的能力。
AMP樣品依次稀釋到96孔反應(yīng)板的水中。大腸桿菌BL21(DE3)細(xì)胞的過夜培養(yǎng)物以1∶50的比例稀釋到LB肉湯培養(yǎng)基中,并取250μl加入到96孔反應(yīng)板。在37℃下溫育1小時,然后在每一反應(yīng)孔中加入50μl稀釋的肽(或水)。該反應(yīng)板37℃溫育過夜,然后通過測定600nm下的吸收來檢測培養(yǎng)物濃度。
發(fā)現(xiàn)經(jīng)甲酸處理得到的二聚體樣品具有顯著的抗微生物活性,而經(jīng)水處理的二聚體不具備活性。
這些試驗清楚的表明可以通過酸切割D2A21’串聯(lián)體前體生產(chǎn)抗微生物肽。然而,為了進(jìn)一步說明預(yù)期的D2A21’肽確實是從反應(yīng)中得到的產(chǎn)物,我們應(yīng)用RP-HPLC、LC/MS、和MALDI質(zhì)譜技術(shù)分析了切割產(chǎn)物。試驗結(jié)果表明細(xì)菌表達(dá)的二聚體和三聚體經(jīng)過切割能夠獲得好的D2A21’。我們還利用這些分析技術(shù)來說明不溶解的AB4三聚體經(jīng)酸處理后能夠獲得D2A21’產(chǎn)物。
實施例8-AMP串聯(lián)多肽在熒光假單胞菌中的表達(dá)串聯(lián)的D2A21’基因(二聚體或三聚體),亞克隆到熒光假單胞菌表達(dá)質(zhì)粒pMYC1803中。質(zhì)粒pMYC1803衍生自pTJS260(參見美國專利號5,169,760到Wilcox),攜帶了一個四環(huán)素抗性標(biāo)記和來自于RSF1010質(zhì)粒的復(fù)制子和移動子。雖然生產(chǎn)中應(yīng)用了不同的表達(dá)載體,但“TF3”三聚體本質(zhì)上與“AB4”三聚體是相同的。參見SEQ IDNO11和12。另外,我們還使用了“JP2”二聚體、“16A”三聚體、“21A”三聚體和“21B”三聚體。參見SEQ ID NO36和37的16A三聚體,SEQ ID NO38和39的21A三聚體,SEQ ID NO40和4121B三聚體,和SEQ ID NO42和43的JP2二聚體。帶有AMP表達(dá)質(zhì)粒的熒光假單胞菌細(xì)胞接種到已知成分的培養(yǎng)基上,所得到的培養(yǎng)物在加入0.3mM的IPTG后,進(jìn)行生長和誘導(dǎo)。在誘導(dǎo)前和后不同的時間點(diǎn),收集等分試樣培養(yǎng)物;這些培養(yǎng)物立即進(jìn)行分析,以確定細(xì)胞的生長、蛋白的生產(chǎn)、內(nèi)含體的形成和質(zhì)粒的穩(wěn)定性。
在誘導(dǎo)英關(guān)假單胞菌培養(yǎng)物中發(fā)現(xiàn)表達(dá)了大量的三聚D2A21’,特別是TF3三聚體克隆。然而,這些構(gòu)建物在熒光假單胞菌中的表達(dá)水平一般低于在大腸桿菌中的表達(dá)水平。在熒光假單胞菌中,二聚D2A21’構(gòu)建物表現(xiàn)出了更加明顯的的較低表達(dá)。
免疫印跡分析來自誘導(dǎo)培養(yǎng)物的提取物,結(jié)果表明,在熒光假單胞菌樣品中,二聚體發(fā)生了一定程度的降解(和一些三聚D2A21’前體的限制性降解)。在大腸桿菌提取物中也發(fā)現(xiàn)了二聚體在一定程度上的降解(和三聚體的限制性降解)。串聯(lián)前體的降解能夠?qū)е庐a(chǎn)生一些成熟的、能夠殺死生物的D2A21’(如果降解發(fā)生在或鄰近Asp-Pro連接)。這限制了串聯(lián)體的進(jìn)一步表達(dá)。注意到,大腸桿菌BL21(DE3)表達(dá)體系的誘導(dǎo)時間(3小時)遠(yuǎn)低于熒光假單胞菌(48小時)的誘導(dǎo)間隔,熒光假單胞菌體系中較長的誘導(dǎo)期導(dǎo)致系統(tǒng)對于毒性D2A21’片段的逐漸累積更加敏感。
實施例9-D2A21串聯(lián)體融合上述實施例清楚表明連環(huán)化的D2A21’AMP降低了肽的毒性。在埃希氏大腸桿菌和熒光假單胞菌中發(fā)現(xiàn),當(dāng)基因中D2A21’亞基從一個增長為兩個再到三個時,D2A21’前體的表達(dá)也隨之提高了。在埃希氏大腸桿菌和熒光假單胞菌中,三聚D2A21’多肽表現(xiàn)出了非常顯著的表達(dá)水平。為了進(jìn)一步提高產(chǎn)品水平,我們檢查了多種蛋白序列融合到D2A21’三聚體后對串聯(lián)體表達(dá)的影響。
例如,我們把焦點(diǎn)集中在兩個融合配偶體上來自于埃希氏大腸桿菌的二氫葉酸脫氫酶(DHFR)和來自于玫瑰紅紅球菌的鹵烷脫鹵素酶。選擇脫鹵素酶蛋白,是因為它在熒光假單胞菌中表達(dá)水平相當(dāng)高。DHFR載體多肽pI值為4.77,電荷為-10.77(中性為pH7)。全長的脫鹵素酶載體多肽pI值為4.95,電荷為-17.25(中性為pH7)。下面所討論的截短的脫鹵素酶載體肽,pI為5.31,電荷為-7.53(中性為pH7)。這些數(shù)值是用Vector Nti軟件計算的。
(a)DHFR將DHFR基因(參見SEQ ID Nos20和21)融合到TF3(參見SEQID NO11)的N-末端。參見SEQ ID Nos22和23。表示在附圖4中。還構(gòu)建了DHFR/D4E1三聚體(參見SEQ ID Nos24和25)、四聚體(參見SEQ ID Nos26和27)、五聚體(參見SEQ ID Nos28和29)的N-末端融合。
通過SDS-PAGE電泳分析,雖然沒有觀察到顯著的誘導(dǎo)蛋白條帶,但對表達(dá)這些融合,特別是DHFR-三聚D2A21’融合(DHFR-D2A21串聯(lián)體構(gòu)建物的MW34-36kDa)的熒光假單胞菌誘導(dǎo)提取物進(jìn)行免疫印跡分析,發(fā)現(xiàn)了誘導(dǎo)蛋白條帶。
(b)脫鹵素酶下面討論了附圖4中的3I和4C融合我們構(gòu)建了編碼以下融合蛋白的融合基因,脫鹵素酶(Newman,等1999)蛋白(參見SEQ ID Nos30和31)翻譯后融合到D2A21’三聚串聯(lián)體(AB4)的N-末端,形成“3I”融合(參見SEQ ID Nos32和33)。為了提高AMP融合到脫鹵素酶序列的比率,構(gòu)建了另外一個融合,即將截短的僅包含蛋白首位123個殘基的脫鹵素酶蛋白片段融合到AB4三聚體的N-末端。附帶說一下,DHFR和脫鹵素酶蛋白都是弱陰離子,脫鹵素酶的帶電荷的殘基均勻地分布在整個蛋白中。因此,該123個氨基酸的片段也是弱陰離子。該構(gòu)建物被稱為“4C”。參見SEQ ID Nos34和35。在上述兩種情況下,載體的C-末端融合到多聚體的N-末端。
首先應(yīng)用載體pET24-b在大腸桿菌中表達(dá)脫鹵素酶-D2A21’融合。誘導(dǎo)后,裂解誘導(dǎo)后的細(xì)胞,通過離心收集內(nèi)含體(和另外不溶解的成分如細(xì)胞膜)。該脫鹵素酶-D2A21’串聯(lián)融合能夠在E.coli中很好表達(dá)。尤其是全長的脫鹵素酶-D2A21’融合,在振搖培養(yǎng)瓶中累積量能達(dá)到300mg/升。在可溶性裂解物(細(xì)胞質(zhì))組分中沒有檢測到脫鹵素酶-D2A21’蛋白;所有的脫鹵素酶均在不溶解的組分中。
實施例10-在熒光假單胞菌中的融合我們將兩個脫鹵素酶/三聚D2A21’融合(3I和4C)亞克隆到pMYC1803質(zhì)粒中,用于在熒光假單胞菌中表達(dá)。表達(dá)質(zhì)粒通過電穿孔導(dǎo)入熒光假單胞菌,所得到的轉(zhuǎn)化克隆接種到含有確定的最低限度培養(yǎng)基的振搖培養(yǎng)瓶中。培養(yǎng)物培養(yǎng)在32℃下,并使用IPTG誘導(dǎo)。在隨后的48小時誘導(dǎo)間隔內(nèi),在不同時間點(diǎn)收集等分試樣,并離心從培養(yǎng)基上收集的細(xì)胞。細(xì)胞進(jìn)行重懸浮,并在裂解緩沖液中裂解,通過離心使可溶的(細(xì)胞質(zhì))和不溶解的組分分開,然后傾倒至不同的試管。使用SDS-PAGE分析可溶的和不溶解的組分。
在AB4三聚體克隆取得足夠表達(dá)的同時,與單獨(dú)的AB4三聚體相比,3I(全長脫鹵素酶/AB4三聚體)融合蛋白在大腸桿菌和熒光假單胞菌中獲得了更高水平的表達(dá)。在表達(dá)截短的脫鹵素酶/D2A21’三聚體(4C)的熒光假單胞菌培養(yǎng)物的不溶解組分中,發(fā)現(xiàn)了強(qiáng)的具有特定分子量的誘導(dǎo)蛋白條帶。從上述細(xì)胞的相應(yīng)可溶組分中,僅發(fā)現(xiàn)了非常少量的誘導(dǎo)蛋白,這表明這些蛋白在熒光假單胞菌中有效地形成了內(nèi)含體。在誘導(dǎo)的前15個小時中,累積了相當(dāng)大量的蛋白,但是在隨后的33小時中幾乎沒有蛋白的累積。
在熒光假單胞菌中,與在大腸桿菌相比,從表達(dá)全長脫鹵素酶-D2A21’三聚體,即克隆3I,的培養(yǎng)物的不溶解組分中觀察了較低水平的誘導(dǎo)蛋白。從上述培養(yǎng)物的可溶樣品中發(fā)現(xiàn)了誘導(dǎo)條帶,盡管其分子量略低于預(yù)期分子量(~37kDa)。在熒光假單胞菌中產(chǎn)生了大量的4C(三聚體/截短的融合)。在20升發(fā)酵液中含量超過1g/升。
實施例11-進(jìn)一步的生產(chǎn)后加工裂解和沖洗內(nèi)含體后,在脫鹵素酶-D2A21’的后續(xù)生成過程中,下一步驟是溶解由誘導(dǎo)的E.coliBL21(DE3)細(xì)胞制備的內(nèi)含體中的融合蛋白。我們試驗了多種化學(xué)試劑,包括離液劑,如8M的鹽酸胍或脲,和有機(jī)溶劑混合物,如10%丁醇、40%HOAc/40%甲醇/20%水、50%HOAc、50%HOAC/2%吡啶。上述溶液加入內(nèi)含體制品中,充分混合懸浮液。通過離心使液相和固相分離,檢測液相中的可溶性蛋白部分。參見表3。鹽酸胍、脲、醋酸和醋酸/乙腈混合物最能有效溶解脫鹵素酶-D2A21’三聚體融合。即使少量的吡啶也能大大阻抗醋酸對融合蛋白的溶解。不管兩個構(gòu)建物之間存在顯著的分子量差異,全長和截短的脫鹵素酶融合表現(xiàn)出了相似的提取特性。有效溶解融合蛋白的溶液既能使蛋白變性(脲和鹽酸胍),也能促進(jìn)肽的溶解性(醋酸和乙腈/醋酸)。
表3提取物 全長脫鹵素酶截短的脫鹵素酶8M鹽酸胍 +++ +++8M脲 ++++++++10%丁醇 - -50%醋酸 +++ +++50%醋酸/2%吡啶 - -40%醋酸/40%乙腈+++ ++40%醋酸/40%甲醇+ +40%醋酸/40%乙醇+ +水 - -“-”=不溶解;“++++”=非常有效溶解為了得到表3中的結(jié)果,其中包含粗提不溶解脫鹵素酶-D2A21’的樣品分別用每種溶液處理,充分混合,并離心。傾出上清液,并檢測蛋白成分。
實施例12-從串聯(lián)體生產(chǎn)和定性AMP產(chǎn)物鹽酸胍或脲溶解的蛋白用HCl、甲酸、或醋酸酸化至pH1-1.5。樣品加熱到60℃維持24-28小時。每隔24小時,收集等分試樣并用TrisCl/NaOH中和pH。用反相HPLC分析酸切割產(chǎn)物。在鹽酸60℃處理24小時后,觀察到了最大峰,保留時間為10.2分鐘。這個保留時間與合成的D2A21’保留時間相同。保留時間為10.2的肽峰的分子量為3,044.7,與預(yù)期的D2A21’基本相同。還觀察到保留時間為10.6分鐘的小峰,和保留時間為9.1分鐘的一個顯著峰(該峰在鹽酸處理的樣品中沒有發(fā)現(xiàn))。這些峰隨著時間不斷地累積,表明它們可能是相關(guān)產(chǎn)物。用脲溶解的樣品沒有觀察到峰;這可能是因為在稀釋到移動相時發(fā)生了樣品沉積。酸切割產(chǎn)物含有顯著的AMP活性,上述結(jié)果表明多聚體的水解產(chǎn)生了具有生物活性的AMP單體。
用甲酸在60℃下消化純化的AMP三聚體,觀察到了相似的結(jié)果。切割后的三聚體具有很強(qiáng)的抗微生物活性。HPLC分析結(jié)果顯示,存在一定數(shù)量的化學(xué)成分(除了9.1和10.6分鐘洗脫出的單體以外),我們假定一些或全部的峰是D2A21’產(chǎn)物的衍生物。為了驗證上述假定,我們使用MALDI-TOF質(zhì)譜儀分析了甲酸消化D2A21’三聚體所得到的產(chǎn)物。在質(zhì)譜中發(fā)現(xiàn)了一個質(zhì)量為3,045.1的最大峰;該質(zhì)量非常接近D2A21’產(chǎn)物的預(yù)期質(zhì)量3,044.7。除了該峰,還發(fā)現(xiàn)了其它加合物峰。發(fā)現(xiàn)了一個質(zhì)量為2,929.8的小峰。該峰可能是D2A21’的衍生物的峰,其失去了C-末端的天冬氨酸殘基(該成分(D2A21”)的預(yù)期分子量是2,929.6)。雖然在該樣品中D2A21”成分的量相對較少,但當(dāng)切割反應(yīng)進(jìn)行較長的時間,或在鉸高溫度下進(jìn)行時,發(fā)現(xiàn)產(chǎn)生大量的D2A21”。
在質(zhì)譜中還發(fā)現(xiàn)幾個其它有規(guī)律的間隔峰。切割產(chǎn)物隨后的LC-MS分析顯示D2A21”峰的保留時間略高于親本D2A21’的保留時間。這些峰在D2A21’和D2A21”峰附近聚戍一串。這些加合物峰和親本峰的質(zhì)量相差28amu。因為該質(zhì)量相當(dāng)一個甲酰基化合物的分子量,因此,我們的數(shù)據(jù)表明在切割反應(yīng)期間,肽被甲酸進(jìn)行了甲?;O旅娴陌l(fā)現(xiàn)也支持該結(jié)論,即在用醋酸或稀鹽酸切割D2A21’三聚體時,沒有觀察到+28amu的加合物。
實施例13-酸切割副產(chǎn)物對活性的影響為了檢測肽產(chǎn)物失去其C-末端天冬氨酸殘基或肽產(chǎn)物發(fā)生了甲酰化,是否影響其抗微生物活性,用甲酸、稀鹽酸或水處理高純度的合成D2A21’,60℃處理24小時。真空干燥濃縮樣品,然后用Tris-氫氧化鈉進(jìn)行中和,然后用MALDI-TOF質(zhì)譜儀進(jìn)行分析。對于串聯(lián)的D2A21’前體,用甲酸處理時產(chǎn)生了D2A21”和甲酰化的副產(chǎn)物,而用稀鹽酸處理的樣品沒有產(chǎn)生甲酰化的副產(chǎn)物。正如所預(yù)料的,在水處理24小時的樣品中沒有發(fā)現(xiàn)任何種類的產(chǎn)物。有趣的是,比較用甲酸和鹽酸切割的MALDI質(zhì)譜和HPLC分析的結(jié)果,表明鹽酸切割反應(yīng)產(chǎn)物中,D2A21’產(chǎn)物對D2A21”副產(chǎn)物的比率高于甲酸切割產(chǎn)物。用10%醋酸進(jìn)行切割反應(yīng),同樣觀察到較高的產(chǎn)物對副產(chǎn)物比率。
C-末端切割和甲銑化反應(yīng)發(fā)生在高溫下,在較低溫度(4℃)下,用酸處理的樣品沒有友現(xiàn)存在D2A21”和甲酰化的肽產(chǎn)物。
為了檢測這些處理對肽活性的影響,在完全相同的條件下,應(yīng)用標(biāo)準(zhǔn)的生長抑制分析方法,測定了每種樣品的抗微生物活性。在所有酸處理或水處理樣品中,在抗微生物活性方面沒有發(fā)現(xiàn)顯著的區(qū)別。該結(jié)果表明,D2A21”產(chǎn)物或甲?;a(chǎn)物的形成沒有影響肽的抗微生物活性。不過,用稀鹽酸或醋酸切割的肽產(chǎn)物沒有非天然的副產(chǎn)物,而用甲酸(和其它)水解肽則產(chǎn)生了非天然的副產(chǎn)物。
實施例14-D4E1串聯(lián)體/可選擇的AMP;及其融合另外,選擇了DE4E1抗微生物肽進(jìn)一步實施本發(fā)明的多聚體/連環(huán)化方案。D4E1具有β-片層結(jié)構(gòu)。D4E1核心AMP包含一個17個氨基酸殘基的序列Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu(FKLRAKIKVRLRAKIKL)(SEQ ID NO13)化學(xué)合成DNA序列,然后構(gòu)建在細(xì)菌中表達(dá)的D4E1多聚體(參見SEQ ID NO13)。首先將D4E1’克隆到pET24b,應(yīng)用上述構(gòu)建D2A21’串聯(lián)體的方法。使附加的殘基位于核心D4E1序列的側(cè)面,相似于D2A21’;事實上,該構(gòu)建物在D4E1序列的N-末端含有一個附加的額外的Asp-Pro二肽。因此該DNA序列編碼一個21個氨基酸的肽,該肽包含核心D4E1 AMP和在核心AMP N-末端、C-末端的Asp-Pro。預(yù)期,串聯(lián)的D4E1’肽的酸水解會產(chǎn)生單個n-末端pro殘基和c-末端gly-asp殘基,然而,出現(xiàn)了D2A21’構(gòu)建物的情況。
Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile LysLeu Gly Asp Pro(D4E1,Seq ID13)生成了2、3、4、和5多聚體,盡管當(dāng)它們轉(zhuǎn)導(dǎo)到大腸桿菌株系BL21(DE3)時沒有表現(xiàn)出表達(dá)優(yōu)勢。參見SEQ ID Nos14-17的三聚體和四聚體序列。一個21個氨基酸的序列位于細(xì)菌前體產(chǎn)物的側(cè)面,該序列在C-末端有一個6X組氨酸標(biāo)簽,并在其N-末端有一個含有T7標(biāo)簽的12個氨基酸的前導(dǎo)序列。該D4E1五聚體的氨基酸序列如下所示Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Lys Leu Arg18Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe37Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro56Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu75Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys94Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu113Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Asn Ser Ser Ser Val Asp Lys Leu132Ala Ala Ala Leu Glu His His His His His His143(SEQ ID NO18)編碼上述蛋白的DNA序列是SEQ ID NO19。
下面給出了電荷分布情況,其中O表示非極性、極性、疏水性或不帶電荷的殘基,+表示帶正電荷的殘基,-表示帶負(fù)電荷的殘基。
OOOOOOOOOOO+ (來自pET24b的前導(dǎo)序列)-OO+O+O+O+O+O+O+O+OO-O (D4E1五聚體)-OO+O+O+O+O+O+O+O+OO-O-OO+O+O+O+O+O+O+O+OO-O-OO+O+O+O+O+O+O+O+OO-O-OO+O+O+O+O+O+O+O+OO-O-OOOOOO-+OOOOO-++++++ (非轉(zhuǎn)錄尾區(qū)序列)
應(yīng)用上述裝配D2A21串聯(lián)體的方法生成D4E1串聯(lián)體。
通過內(nèi)切酶消化進(jìn)行串聯(lián)體的取向分析,并用瓊脂糖凝膠電泳進(jìn)行驗證。凝膠純化串聯(lián)體條帶。隨后,用T4連接酶將DNA連接到pET24b(大腸桿菌)表達(dá)質(zhì)粒的兩個BamH I位點(diǎn)之間。連接物轉(zhuǎn)導(dǎo)到大腸桿菌株系DH5α文庫細(xì)胞,并篩選卡那霉素抗性??敲顾乜剐灾攴謩e進(jìn)行單克隆。之后,將每種克隆接種到LB/Kam培養(yǎng)基中,并在37℃下,過夜培養(yǎng)。提取細(xì)胞DNA,并進(jìn)行限制性消化分析。還通過DNA測序分析插入正確的質(zhì)粒。
然后使用通常所用的PCK技術(shù),將D4E1的三聚體、四聚體和五聚體轉(zhuǎn)導(dǎo)到熒光假單胞菌表達(dá)載體,pMYCI1803。應(yīng)用PCR技術(shù)使用編碼序列的N-末端和C-末端引物,將經(jīng)過測序驗證的D4E1串聯(lián)體亞克隆到pMYC1803表達(dá)質(zhì)粒。
用瓊脂糖凝膠電泳鑒定PCR產(chǎn)物,然后用各自的酶進(jìn)行消化,并連接到Pmyc1803表達(dá)質(zhì)粒的Spe I位點(diǎn)和Kpn I位點(diǎn)之間,表達(dá)載體轉(zhuǎn)導(dǎo)到細(xì)菌JM109株系感受態(tài)細(xì)胞,并在LB和含有四環(huán)素(Tet)的瓊脂培養(yǎng)基上進(jìn)行平板培養(yǎng)。隨后,單個克隆接種到LB/Tet培養(yǎng)基上并過夜生長。然后,收集細(xì)胞并提取DNA和進(jìn)行測序。通過SDS-PAGE電泳檢測表達(dá)水平。因為需要更高的表達(dá)水平。在pMYC1803中,將D4E1的三聚體、四聚體和五聚體融合刮編碼DHFR的載體序列的N-末端。
(a)D4E1-DHFR在pMYC1803中的融合體用Nhe I和Kpn I內(nèi)切酶消化經(jīng)驗證的D4E1 pMYC1803重組質(zhì)粒,提取D4E1串聯(lián)體;SEQ ID NO24和25是三聚體融合體,SEQ IDNO27和27是四聚體融合體。用瓊脂糖凝膠電泳驗證并定量分析DNA片段。將DNA連接到表達(dá)載體pMYC1803的Nhe和Kpn I位點(diǎn),該載體在Spe I和Nhe I位點(diǎn)之間包含一段編碼DHFR(二氫葉酸還原酶)的上游序列。連接體轉(zhuǎn)導(dǎo)到JM109感受態(tài)細(xì)胞,并在LB/Tet瓊脂糖培養(yǎng)基上平板培養(yǎng)。隨后,單個克隆在LB/Tet培養(yǎng)基上37℃生長過夜。應(yīng)用上面描述的方法,收集細(xì)胞;用Spe I和Nhe I組合、或Nhe和Kpn I組合對DNAs進(jìn)行限制性消化。限制性消化產(chǎn)物用瓊脂糖凝膠電泳進(jìn)行分析。但是,DHFE-D4K1融合還有望獲得更高水平的表達(dá)。
(b)pMYC1803中脫鹵素酶融合嵌合體使用常用的擴(kuò)增(PCR)和連接技術(shù),將D4E1五聚體(SEQ IDNO18)融合到截短的脫鹵素酶(如同SEQ ID NO34的4C融合)。
在構(gòu)建融合到脫鹵素酶上的pMYC1803 D4E1五聚體過程中,以pMYC1803 DHFR D4E1五聚體作為D4E1的模板。參見SEQ ID NO44和45。在構(gòu)建融合到脫鹵素酶上的pMYC1803 D4E1五聚體過程中,以pMYC1803脫鹵素酶4C質(zhì)粒作為截短的脫鹵素酶(前面的123個氨基酸)的DNA模板。合成編碼C-末端脫鹵素酶和N-端T7標(biāo)簽的有義和反義DNA序列。
使用有義5’引物和C-末端3’Kpn I引物從D4E1DHFR上(SEQ IDNO28和29)擴(kuò)增D4E1五聚體。反義3’引物和N-末端5’Spe I引物用于從4C上擴(kuò)增截短的脫鹵素酶轉(zhuǎn)錄本(SEQ ID NO34和35)。
用瓊脂糖凝膠電泳鑒定兩種PCR產(chǎn)物。定量上述PCR片段并隨后以相同質(zhì)量比進(jìn)行混合,并用Nhe I內(nèi)切酶進(jìn)行限制性消化,用PCR引物進(jìn)行編碼,并隨后連接。連接后的反應(yīng)物作為模板,應(yīng)用5’Spe I引物和3’Kpn I引物進(jìn)行PCR擴(kuò)增,擴(kuò)增出完整的脫鹵素酶和D4E1融合序列。隨后,應(yīng)用瓊脂糖凝膠電泳驗證PCR。然后,用Spe I和Kpn I限制性酶消化PCR產(chǎn)物。將PCR產(chǎn)物連接到熒光假單胞菌株系MB214表達(dá)載體,pMYC1803中,在其Spe I和Kpn I位點(diǎn)之間。連接物轉(zhuǎn)導(dǎo)到JM109感受態(tài)細(xì)胞中并在LB/Tet瓊脂培養(yǎng)基中進(jìn)行平板培養(yǎng)。隨后,單個克隆在37℃LB/Tet培養(yǎng)基中生長過夜。同樣收集細(xì)胞。提取的DNA作為PCR模板,用于擴(kuò)增融合到D4E1序列的脫鹵素酶。帶有融合序列的質(zhì)粒DNA進(jìn)行DNA測序。參見SEQ ID NO45。
熒光假單胞菌的表達(dá)研究結(jié)果顯示了誘導(dǎo)肽和用酸處理/切割后的D4E1單體肽的高水平表達(dá)。含有該表達(dá)質(zhì)粒的熒光假單胞菌株系MB214,在20升發(fā)酵罐中,產(chǎn)生了每升發(fā)酵液至少1g的產(chǎn)物。
序列表<110>Krebs,Joseph F.
Zorner,Paul S.
Tomlinson,Ian<120>低成本生產(chǎn)肽<130>61727A<150>US 60/374,644<151>2002-04-22<160>45<170>專利軟件3.1<210>1<211>23<212>PRT<213>人工序列<220>
<223>核心D2A21抗微生物肽的氨基酸序列<400>1Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe1 5 10 15Ala Lys Phe Ala Phe Ala Phe20<210>2<211>69<212>DNA<213>人工序列<220>
<223>編碼SEQ ID NO1的肽的DNA序列<400>2ttcgcgaaga agtttgcgaa aaagttcaag aaatttgcca agaagtttgc caagttcgca60ttcgcgttc69
<210>3<211>78<212>DNA<213>人工序列<220>
<223>編碼SEQ ID NO4的肽的DNA序列<400>3gatccgttcg cgaagaagtt tgcgaaaaag ttcaagaaat ttgccaagaa gtttgccaag60ttcgcattcg cgttcggc 78<210>4<211>26<212>PRT<213>人工序列<220>
<223>有三個附加氨基酸殘基的核心D2A21抗微生物肽單體的氨基酸序列,該附加氨基酸殘基用作裝配多聚體的連接/切割位點(diǎn)<400>4Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys1 5 10 15Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly20 25<210>5<211>255<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO6的4A二聚體的DNA序列(使用大腸桿菌表達(dá)載體pET21b)<400>5atggctagca tgactggtgg acagcaaatg ggtcgggatc cgttcgcgaa gaagtttgcg60aaaaagttca agaaattcgc gaagaagttt gccaagttcg cattcgcgtt cggggatccg120ttcgcgaaga agtttgcgaa aaagttcaag aaattcgcga agaagtttgc caagttcgca180
ttcgcgttcg gggatccgaa ttcgagctcc gtcgacaagc ttgcggccgc actcgagcac240caccaccacc accac 255<210>6<211>85<212>PRT<213>人工序列<220>
<223>4A二聚體的氨基酸序列<400>6Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Ala1 5 10 15Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys20 25 30Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys35 40 45Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly50 55 60Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His65 70 75 80His His His His His85<210>7<211>26<212>PRT<213>人工序列<220>
<223>D2A21’AMP單體的氨基酸序列<400>7Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys1 5 10 15
Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp20 25<210>8<211>6<212>DNA<213>人工序列<220>
<223>編碼Asp-Pro可切割二肽接頭的優(yōu)選六核苷酸序列<400>8gatccg 6<210>9<211>159<212>PRT<213>人工序列<220>
<223>AB4三聚體的氨基酸序列<400>9Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Ala1 5 10 15Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys20 25 30Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys35 40 45Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly50 55 60Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys65 70 75 80Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Ser Arg Arg Ser85 90 95Leu Arg Lys Ser Ser Arg Asn Leu Pro Arg Ser Leu Pro Ser Ser His100 105 110
Ser Arg Ser Val Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro115 120 125His Ser Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys130 135 140Pro Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro Leu Ser Asn Asn145 150 155<210>10<211>480<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO9 AB4三聚體的DNA序列(在大腸桿菌表達(dá)載體pET21b中)<400>10atggctagca tgactggtgg acagcaaatg ggtcgggatc cgttcgcgaa gaagtttgcg60aaaaagttca agaaatttgc caagaagttt gccaagttcg cattcgcgtt cggcgatccg120ttcgcgaaga agtttgcgaa aaagttcaag aaatttgcca agaagtttgc caagttcgca180ttcgcgttcg gcgatccgtt cgcgaagaag tttgcgaaaa agttcaagaa atttgccaag240aagtttgcca agttcgcatt cgcgttcggc gatccttcgc gaagaagttt gcgaaaaagt300tcaagaaatt tgccaagaag tttgccaagt tcgcattcgc gttcggtgat ccgaattcga360gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg420ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag480<210>11<211>159<212>PRT<213>人工序列<220>
<223>TF3三聚體的氨基酸序列<400>11Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Ala
1 5 10 15Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys20 25 30Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys35 40 45Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly50 55 60Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys65 70 75 80Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Ser Arg Arg Ser85 90 95Leu Arg Lys Ser Ser Arg Asn Leu Pro Arg Ser Leu Pro Ser Ser His100 105 110Ser Arg Ser Val Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro115 120 125His Ser Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys130 135 140Pro Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro Leu Ser Asn Asn145 150 155<210>12<211>481<212>DNA<213>人工序列<220>
<223>編碼SEQ ID NO11 TF3三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>12atggctagca tgactggtgg acagcaaatg ggtcgggatc cgttcgcgaa gaagtttgcg60aaaaagttca agaaatttgc caagaagttt gccaagttcg cattcgcgtt cggcgatccg120ttcgcgaaga agtttgcgaa aaagttcaag aaatttgcca agaagtttgc caagttcgca180
ttcgcgttcg gcgatccgtt cgcgaagaag tttgcgaaaa agttcaagaa atttgccaag240aagtttgcca agttcgcatt cgcgttcggc gatccttcgc gaagaagttt gcgaaaaagt300tcaagaaatt tgccaagaag tttgccaagt tcgcattcgc gttcggtgat ccgaattcga360gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg420ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactaa480t481<210>13<211>17<212>PRT<213>人工序列<220>
<223>D4E1 AMP的氨基酸序列<400>13Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys1 5 10 15Leu<210>14<211>99<212>PRT<213>人工序列<220>
<223>D4E1三聚體的氨基酸序列<400>14Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Lys1 5 10 15Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly20 25 30Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg35 40 45
Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys50 55 60Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro65 70 75 80Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His His His85 90 95His His His<210>15<211>300<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO14 D4E1三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET24b中)<400>15atggctagca tgactggtgg acagcaaatg ggtcgggatc cgttcaaact gcgtgctaaa60atcaaagttc gtctgcgtgc taaaatcaaa ctgggtgacc ctgatccgtt caaactgcgt120gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa180ctgcgtgcta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg240aattcgagct ccgtcgacaa gcttgcggcc gcactcgagc accacoacca ccaccactga300<210>16<211>121<212>PRT<213>人工序列<220>
<223>D4E1四聚體的氨基酸序列<400>16Met Ala Ser Thr Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Lys1 5 10 15Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly
20 25 30Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg35 40 45Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Val Lys50 55 60Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro65 70 75 80Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys85 90 95Leu Gly Asp Pro Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala100 105 110Ala Leu Glu His His His His His His115 120<210>17<211>366<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO16 D4E1四聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>17atggctagca cgactggtgg acagcaaatg ggtcgggatc cgttcaaact gcgtgctaaa60atcaaagttc gtctgcgtgc taaaatcaaa ctgggtgacc ctgatccgtt caaactgcgt120gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa180ctgcgtgtta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg240ttcaaactgc gtgctaaaat caaagttcgt ctgcgtgcta aaatcaaact gggtgaccct300gatccgaatt cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac360cactga 366
<210>18<211>143<212>PRT<213>人工序列<220>
<223>D4E1五聚體的氨基酸序列<400>18Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Lys1 5 10 15Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly20 25 30Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg35 40 45Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys50 55 60Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro65 70 75 80Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys85 90 95Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg100 105 110Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Asn Ser Ser Ser115 120 125Val Asp Lys Leu Ala Ala Ala Leu Glu His His His His His His130 135 140<210>19<211>432<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO18 D4E1五聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET24b中)
<400>19atggctagca tgactggtgg acagcaaatg ggtcgggatc cgttcaaact gcgtgctaaa60atcaaagttc gtctgcgtgc taaaatcaaa ctgggtgacc ctgatccgtt caaactgcgt120gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa180ctgcgtgcta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg240ttcaaactgc gtgctaaaat caaagttcgt ctgcgtgcta aaatcaaact gggtgaccct300gatccgttca aactgcgtgc taaaatcaaa gttcgtctgc gtgctaaaat caaactgggt360gaccctgatc cgaattcgag ctccgtcgac aagcttgcgg ccgcactcga gcaccaccac420caccaccact ga432<210>20<211>162<212>PRT<213>人工序列<220>
<223>二氫葉酸還原酶(DHFR)蛋白的氨基酸序列<400>20Met Val Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met1 5 10 15Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys20 25 30Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu35 40 45Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser50 55 60Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu65 70 75 80Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly85 90 95
Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu100 105 110Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr115 120 125Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp130 135 140Ala Gln Asn Ser His Ser Tyr Glu Phe Glu Ile Leu Glu Arg Arg Gly145 150 155 160Ser Ala<210>21<211>486<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO20二氫葉酸還原酶蛋白的DHFR基因的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>21atggtcagtc tgattgcggc gttagcggta gatcgcgtta tcggcatgga aaacgccatg60ccgtggaacc tgcctgccga tctcgcctgg tttaaacgca acaccttaaa taaacccgtg120attatgggcc gccatacctg ggaatcaatc ggtcgtccgt tgccaggacg caaaaatatt180atcctcagca gtcaaccggg tacggacgat cgcgtaacgt gggtgaagtc ggtggatgaa240gccatcgcgg cgtgtggtga cgtaccagaa atcatggtga ttggcggcgg tcgcgtttat300gaacagttct tgccaaaagc gcaaaaactg tatctgacgc atatcgacgc agaagtggaa360ggcgacaccc atttcccgga ttacgagccg gatgactggg aatcggtatt cagcgaattc420cacgatgctg atgcgcagaa ctctcacagc tatgagtttg agattctgga gcggcgggga480tccgcc 486<210>22
<211>321<212>PRT<213>人工序列<220>
<223>DHFR/TF3三聚體融合體的氨基酸序列<400>22Met Val Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met1 5 10 15Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys20 25 30Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu35 40 45Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser50 55 60Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu65 70 75 80Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly85 90 95Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu100 105 110Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr115 120 125Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp130 135 140Ala Gln Asn Ser His Ser Tyr Glu Phe Glu Ile Leu Glu Arg Arg Gly145 150 155 160Ser Ala Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro165 170 175Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe180 185 190
Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala195 200 205Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala210 215 220Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe225 230 235 240Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Ser Arg245 250 255Arg Ser Leu Arg Lys Ser Ser Arg Asn Leu Pro Arg Ser Leu Pro Ser260 265 270Ser His Ser Arg Ser Val Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu275 280 285Arg Pro His Ser Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu290 295 300Thr Lys Pro Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro Leu Ser Asn305 310 315 320Asn<210>23<211>967<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO22融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>23atggtcagtc tgattgcggc gttagcggta gatcgcgtta tcggcatgga aaacgccatg60ccgtggaacc tgcctgccga tctcgcctgg tttaaacgca acaccttaaa taaacccgtg120attatgggcc gccatacctg ggaatcaatc ggtcgtccgt tgccaggacg caaaaatatt180atcctcagca gtcaaccggg tacggacgat cgcgtaacgt gggtgaagtc ggtggatgaa240gccatcgcgg cgtgtggtga cgtaccagaa atcatggtga ttggcggcgg tcgcgtttat300
gaacagttct tgccaaaagc gcaaaaactg tatctgacgc atatcgacgc agaagtggaa360ggcgacaccc atttcccgga ttacgagccg gatgactggg aatcggtatt cagcgaattc420cacgatgctg atgcgcagaa ctctcacagc tatgagtttg agattctgga gcggcgggga480tccgccatgg ctagcatgac tggtggacag caaatgggtc gggatccgtt cgcgaagaag540tttgcgaaaa agttcaagaa atttgccaag aagtttgcca agttcgcatt cgcgttcggc600gatccgttcg cgaagaagtt tgcgaaaaag ttcaagaaat ttgccaagaa gtttgccaag660ttcgcattcg cgttcggcga tccgttcgcg aagaagtttg cgaaaaagtt caagaaattt720gccaagaagt ttgccaagtt cgcattcgcg ttcggcgatc cttcgcgaag aagtttgcga780aaaagttcaa gaaatttgcc aagaagtttg ccaagttcgc attcgcgttc ggtgatccga840attcgagctc cgtcgacaag cttgcggccg cactcgagca ccaccaccac caccactgag900atccggctgc taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat960aactaat 967<210>24<211>261<212>PRT<213>人工序列<220>
<223>DHFR/D4E1三聚體融合體的氨基酸序列<400>24Met Val Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met1 5 10 15Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys20 25 30Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu35 40 45Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu65 70 75 80Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly85 90 95Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu100 105 110Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr115 120 125Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp130 135 140Ala Gln Asn Ser His Ser Tyr Glu Phe Glu Ile Leu Glu Arg Arg Gly145 150 155 160Ser Ala Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro165 170 175Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys180 185 190Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg195 200 205Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg210 215 220Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro225 230 235 240Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His245 250 255His His His His His260<210>25<211>786<212>DNA
<213>人工序列<220>
<223>用于編碼SEQ ID NO24融合體的DNA序理(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>25atggtcagtc tgattgcggc gttagcggta gatcgcgtta tcggcatgga aaacgccatg60ccgtggaacc tgcctgccga tctcgcctgg tttaaacgca acaccttaaa taaacccgtg120attatgggcc gccatacctg ggaatcaatc ggtcgtccgt tgccaggacg caaaaatatt180atcctcagca gtcaaccggg tacggacgat cgcgtaacgt gggtgaagtc ggtggatgaa240gccatcgcgg cgtgtggtga cgtaccagaa atcatggtga ttggcggcgg tcgcgtttat300gaacagttct tgccaaaagc gcaaaaactg tatctgacgc atatcgacgc agaagtggaa360ggcgacaccc atttcccgga ttacgagccg gatgactggg aatcggtatt cagcgaattc420cacgatgctg atgcgcagaa ctctcacagc tatgagtttg agattctgga gcggcgggga480tccgccatgg ctagcatgac tggtggacag caaatgggtc gggatccgtt caaactgcgt540gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa600ctgcgtgcta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg660ttcaaactgc gtgctaaaat caaagttcgt ctgcgtgcta aaatcaaact gggtgaccct720gatccgaatt cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac780cactga 786<210>26<211>283<212>PRT<213>人工序列<220>
<223>DHFR/D4E1四聚體融合體的氨基酸序列<400>26Met Val Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met
1 5 10 15Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys20 25 30Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu35 40 45Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser50 55 60Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu65 70 75 80Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly85 90 95Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu100 105 110Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr115 120 125Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp130 135 140Ala Gln Asn Ser His Ser Tyr Glu Phe Glu Ile Leu Glu Arg Arg Gly145 150 155 160Ser Ala Met Ala Ser Thr Thr Gly Gly Gln Gln Met Gly Arg Asp Pro165 170 175Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys180 185 190Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg195 200 205Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg210 215 220Val Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro225 230 235 240
Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys245 250 255Ile Lys Leu Gly Asp Pro Asp Pro Asn Ser Ser Ser Val Asp Lys Leu260 265 270Ala Ala Ala Leu Glu His His His His His His275 280<210>27<211>852<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO26融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>27atggtcagtc tgattgcggc gttagcggta gatcgcgtta tcggcatgga aaacgccatg60ccgtggaacc tgcctgccga tctcgcctgg tttaaacgca acaccttaaa taaacccgtg120attatgggcc gccatacctg ggaatcaatc ggtcgtccgt tgccaggacg caaaaatatt180atcctcagca gtcaaccggg tacggacgat cgcgtaacgt gggtgaagtc ggtggatgaa240gccatcgcgg cgtgtggtga cgtaccagaa atcatggtga ttggcggcgg tcgcgtttat300gaacagttct tgccaaaagc gcaaaaactg tatctgacgc atatcgacgc agaagtggaa360ggcgacaccc atttcccgga ttacgagccg gatgactggg aatcggtatt cagcgaattc420cacgatgctg atgcgcagaa ctctcacagc tatgagtttg agattctgga gcggcgggga480tccgccatgg ctagcacgac tggtggacag caaatgggtc gggatccgtt caaactgcgt540gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa600ctgcgtgcta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg660ttcaaactgc gtgttaaaat caaagttcgt ctgcgtgcta aaatcaaact gggtgaccct720gatccgttca aactgcgtgc taaaatcaaa gttcgtctgc gtgctaaaat caaactgggt780
gaccctgatc cgaattcgag ctccgtcgac aagcttgcgg ccgcactcga gcaccaccac840caccaccact ga852<210>28<211>305<212>PRT<213>人工序列<220>
<223>DHFR/D4E1五聚體融合體的氨基酸序列<400>28Met Val Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met1 5 10 15Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys20 25 30Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu35 40 45Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser50 55 60Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu65 70 75 80Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly85 90 95Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu100 105 110Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr115 120 125Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp130 135 140Ala Gln Asn Ser His Ser Tyr Glu Phe Glu Ile Leu Glu Arg Arg Gly145 150 155 160Ser Ala Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro
165 170 175Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys180 185 190Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg195 200 205Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg210 215 220Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro225 230 235 240Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys245 250 255Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys260 265 270Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Asn Ser275 280 285Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His His His His His290 295 300His305<210>29<211>918<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO28融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>29atggtcagtc tgattgcggc gttagcggta gatcgcgtta tcggcatgga aaacgccatg60ccgtggaacc tgcctgccga tctcgcctgg tttaaacgca acaccttaaa taaacccgtg120attatgggcc gccatacctg ggaatcaatc ggtcgtccgt tgccaggacg caaaaatatt180
atcctcagca gtcaaccggg tacggacgat cgcgtaacgt gggtgaagtc ggtggatgaa240gccatcgcgg cgtgtggtga cgtaccagaa atcatggtga ttggcggcgg tcgcgtttat300gaacagttct tgccaaaagc gcaaaaactg tatctgacgc atatcgacgc agaagtggaa360ggcgacaccc atttcccgga ttacgagccg gatgactggg aatcggtatt cagcgaattc420cacgatgctg atgcgcagaa ctctcacagc tatgagtttg agattctgga gcggcgggga480tccgccatgg ctagcatgac tggtggacag caaatgggtc gggatccgtt caaactgcgt540gctaaaatca aagttcgtct gcgtgctaaa atcaaactgg gtgaccctga tccgttcaaa600ctgcgtgcta aaatcaaagt tcgtctgcgt gctaaaatca aactgggtga ccctgatccg660ttcaaactgc gtgctaaaat caaagttcgt ctgcgtgcta aaatcaaact gggtgaccct720gatccgttca aactgcgtgc taaaatcaaa gttcgtctgc gtgctaaaat caaactgggt780gaccctgatc cgttcaaact gcgtgctaaa atcaaagttc gtctgcgtgc taaaatcaaa840ctgggtgacc ctgatccgaa ttcgagctcc gtcgacaagc ttgcggccgc actcgagcac900caccaccacc accactga 918<210>30<211>293<212>PRT<213>Rhodococcus rhodochrous TDTM003<220>
<223>全長脫鹵素酶蛋白的氨基酸序列<400>30Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45
Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Cys165 170 175Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205Ile Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala245 250 255Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270Tyr Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285
Trp Leu Pro Ala Leu290<210>31<211>879<212>DNA<213>玫瑰紅紅球菌TDTM003<220>
<223>用于編碼SEQ ID NO30脫鹵素酶蛋白的DNA序列<400>31atgtcagaaa tcggtacagg cttccccttc gacccccatt atgtggaagt cctgggcgag60cgtatgcact acgtcgatgt tggaccgcgg gatggcacgc ctgtgctgtt cctgcacggt120aacccgacct cgtcctacct gtggcgcaac atcatcccgc atgtagcacc gagtcatcgg180tgcattgctc cagacctgat cgggatggga aaatcggaca aaccagacct cgattatttc240ttcgacgacc acgtccgcta cctcgatgcc ttcatcgaag ccttgggttt ggaagaggtc300gtcctggtca tccacgactg gggctcagct ctcggattcc actgggccaa gcgcaatccg360gaacgggtca aaggtattgc atgtatggaa ttcatccggc ctatcccgac gtgggacgaa420tggccggaat tcgcccgtga gaccttccag gccttccgga ccgccgacgt cggccgagag480ttgatcatcg atcagaacgc tttcatcgag ggtgtgctcc cgaaatgcgt cgtccgtccg540cttacggagg tcgagatgga ccactatcgc gagcccttcc tcaagcctgt tgaccgagag600ccactgtggc gattccccaa cgagatcccc atcgccggtg agcccgcgaa catcgtcgcg660ctcgtcgagg catacatgaa ctggctgcac cagtcacctg tcccgaagtt gttgttctgg720ggcacacccg gcgtactgat ccccccggcc gaagccgcga gacttgccga aagcctcccc780aactgcaaga cagtggacat cggcccggga ttgcactacc tccaggaaga caacccggac840cttatcggca gtgagatcgc gcgctggctc cccgcactc 879<210>32
<211>446<212>PRT<213>人工序列<220>
<223>“3I”融合體的氨基酸序列(脫鹵素酶/D2A21’三聚體)<400>32Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Cys165 170 175Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190
Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205Ile Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala245 250 255Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270Tyr Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285Trp Leu Pro Ala Leu Gly Gln Gln Met Gly Arg Asp Pro Phe Ala Lys290 295 300Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe305 310 315 320Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe325 330 335Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp340 345 350Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys355 360 365Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Ser Arg Arg Ser Leu370 375 380Arg Lys Ser Ser Arg Asn Leu Pro Arg Ser Leu Pro Ser Ser His Ser385 390 395 400Arg Ser Val Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro His405 410 415Ser Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys Pro420 425 430
Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro Leu Ser Asn Asn435 440 445<210>33<211>1341<212>DNA<213>人工序列<220>
<223>用于編碼SEQ ID NO32“3I”融合體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET21b中)<400>33atgtcagaaa tcggtacagg cttccccttc gacccccatt atgtggaagt cctgggcgag60cgtatgcact acgtcgatgt tggaccgcgg gatggcacgc ctgtgctgtt cctgcacggt120aacccgacct cgtcctacct gtggcgcaac atcatcccgc atgtagcacc gagtcatcgg180tgcattgctc cagacctgat cgggatggga aaatcggaca aaccagacct cgattatttc240ttcgacgacc acgtccgcta cctcgatgcc ttcatcgaag ccttgggttt ggaagaggtc300gtcctggtca tccacgactg gggctcagct ctcggattcc actgggccaa gcgcaatccg360gaacgggtca aaggtattgc atgtatggaa ttcatccggc ctatcccgac gtgggacgaa420tggccggaat tcgcccgtga gaccttccag gccttccgga ccgccgacgt cggccgagag480ttgatcatcg atcagaacgc tttcatcgag ggtgtgctcc cgaaatgcgt cgtccgtccg540cttacggagg tcgagatgga ccactatcgc gagcccttcc tcaagcctgt tgaccgagag600ccactgtggc gattccccaa cgagatcccc atcgccggtg agcccgcgaa catcgtcgcg660ctcgtcgagg catacatgaa ctggctgcac cagtcacctg tcccgaagtt gttgttctgg720ggcacacccg gcgtactgat ccccccggcc gaagccgcga gacttgccga aagcctcccc780aactgcaaga cagtggacat cggcccggga ttgcactacc tccaggaaga caacccggac840cttatcggca gtgagatcgc gcgctggctc cccgcactcg gacagcaaat gggtcgggat900
ccgttcgcga agaagtttgc gaaaaagttc aagaaatttg ccaagaagtt tgccaagttc960gcattcgcgt tcggcgatcc gttcgcgaag aagtttgcga aaaagttcaa gaaatttgcc1020aagaagtttg ccaagttcgc attcgcgttc ggcgatccgt tcgcgaagaa gtttgcgaaa1080aagttcaaga aatttgccaa gaagtttgcc aagttcgcat tcgcgttcgg cgatccttcg1140cgaagaagtt tgcgaaaaag ttcaagaaat ttgccaagaa gtttgccaag ttcgcattcg1200cgttcggtga tccgaattcg agctccgtcg acaagcttgc ggccgcactc gagcaccacc1260accaccacca ctgagatccg gctgctaaca aagcccgaaa ggaagctgag ttggctgctg1320ccaccgctga gcaataacta a 1341<210>34<211>276<212>PRT<213>人工序列<220>
<223>“4C”結(jié)構(gòu)物的氨基酸序列(123個氨基酸的截短的脫鹵素酶/D2A21’三聚體融合)<400>34Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly
100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Gly Gln Gln Met Gly115 120 125Arg Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala130 135 140Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys145 150 155 160Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe165 170 175Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe180 185 190Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp195 200 205Pro Ser Arg Arg Ser Leu Arg Lys Ser Ser Arg Asn Leu Pro Arg Ser210 215 220Leu Pro Ser Ser His Ser Arg Ser Val Ile Arg Ile Arg Ala Pro Ser225 230 235 240Thr Ser Leu Arg Pro His Ser Ser Thr Thr Thr Thr Thr Thr Glu Ile245 250 255Arg Leu Leu Thr Lys Pro Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro260 265 270Leu Ser Asn Asn275<210>35<211>831<212>DNA<213>人工序列<220>
<223>用于編碼“4C”結(jié)構(gòu)物的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803和大腸桿菌表達(dá)載體pET21b)
<400>35atgtcagaaa tcggtacagg cttccccttc gacccccatt atgtggaagt cctgggcgag60cgtatgcact acgtcgatgt tggaccgcgg gatggcacgc ctgtgctgtt cctgcacggt120aacccgacct cgtcctacct gtggcgcaac atcatcccgc atgtagcacc gagtcatcgg180tgcattgctc cagacctgat cgggatggga aaatcggaca aaccagacct cgattatttc240ttcgacgacc acgtccgcta cctcgatgcc ttcatcgaag ccttgggttt ggaagaggtc300gtcctggtca tccacgactg gggctcagct ctcggattcc actgggccaa gcgcaatccg360gaacgggtcg gacagcaaat gggtcgggat ccgttcgcga agaagtttgc gaaaaagttc420aagaaatttg ccaagaagtt tgccaagttc gcattcgcgt tcggcgatcc gttcgcgaag480aagtttgcga aaaagttcaa gaaatttgcc aagaagtttg ccaagttcgc attcgcgttc540ggcgatccgt tcgcgaagaa gtttgcgaaa aagttcaaga aatttgccaa gaagtttgcc600aagttcgcat tcgcgttcgg cgatccttcg cgaagaagtt tgcgaaaaag ttcaagaaat660ttgccaagaa gtttgccaag ttcgcattcg cgttcggtga tccgaattcg agctccgtcg720acaagcttgc ggccgcactc gagcaccacc accaccacca ctgagatccg gctgctaaca780aagcccgaaa ggaagctgag ttggctgctg ccaccgctga gcaataacta a 831<210>36<211>801<212>DNA<213>人工序列<220>
<223>編碼16A(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>36atgtcagaaa tcggtacagg cttccccttc gacccccatt atgtggaagt cctgggcgag60cgtatgcact acgtcgatgt tggaccgcgg gatggcacgc ctgtgttgtt cctgcacggt120aacccgacct cgtcctacct gtggcgcaac atcatcccgc atgtagcacc gagtcatcgg180
tgcattgctc cagacctgat cgggatggga aaatcggaca aaccagacct cgattatttc240ttcgacgacc acgtccgcta cctcgatgcc ttcatcgaag ccttgggttt ggaagaggtc300gtcctggtca tccacgactg gggctcagct ctcggattcc actgggccaa gcgcaatccg360gaacgggtca tggctagcat gactggtgga cagcaaatgg gtcgggatcc gttcaaactg420cgtgctaaaa tcaaagttcg tctgcgtgct aaaatcaaac tgggtgaccc tgatccgttc480aaactgcgtg ctaaaatcaa agttcgtctg cgtgctaaaa tcaaactggg tgaccctgat540ccgttcaaac tgcgtgctaa aatcaaagtt cgtctgcgtg ctaaaatcaa actgggtgac600cctgatccgt tcaaactgcg tgctaaaatc aaagttcgtc tgcgtgctaa aatcaaactg660ggtgaccctg atccgttcaa actgcgtgct aaaatcaaag ttcgtctgcg tgctaaaatc720aaactgggtg accctgatcc gaattcgagc tccgtcgaca agcttgcggc cgcactcgag780caccaccacc accaccactg a 801<210>37<211>140<212>PRT<213>人工序列<220>
<223>16A(D2A21)三聚體的氨基酸序列<400>37Met Ala Ser Met Gly Arg Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys1 5 10 15Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly20 25 30Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys35 40 45Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys50 55 60Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala
65 70 75 80Phe Ala Phe Gly Asp Pro Ser Arg Arg Ser Leu Arg Lys Ser Ser Arg85 90 95Asn Leu Pro Arg Ser Leu Pro Ser Ser His Ser Arg Ser Val Ile Arg100 105 110Ile Arg Ala Pro Ser Asn Thr Arg Ala Gln Asn Glu Arg Leu Ser Arg115 120 125Gln Thr Gly Pro Phe Val Leu Ser Val Val Cys Arg130 135 140<210>38<211>411<212>DNA<213>人工序列<220>
<223>編碼21A(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>38atgggtcggg atccgttcgc gaagaagttt gcgaaaaagt tcaagaaatt tgccaagaag60tttgccaagt tcgcattcgc gttcggcgat ccgttcgcga agaagtttgc gaaaaagttc120aagaaatttg ccaagaagtt tgccaagttc gcattcgcgt tcggcgatcc gttcgcgaag180aagtttgcga aaaagttcaa gaaatttgcc aagaagtttg ccaagttcgc attcgcgttc240ggcgatcctt cgcgaagaag tttgcgaaaa agttcaagaa atttgccaag aagtttgcca300agttcgcatt cgcgttcggt gatccgaatt cgagctccgt ctaatactcg agcccaaaac360gaaaggctca gtcgacagac tgggcctttc gttttatctg ttgtttgtcg g 411<210>39<211>137<212>PRT<213>人工序列<220>
<223>21A(D2A21)三聚體的氨基酸序列
<400>39Met Gly Arg Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys1 5 10 15Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe20 25 30Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala35 40 45Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys Phe Ala Lys50 55 60Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe65 70 75 80Gly Asp Pro Ser Arg Arg Ser Leu Arg Lys Ser Ser Arg Asn Leu Pro85 90 95Arg Ser Leu Pro Ser Ser His Ser Arg Ser Val Ile Arg Ile Arg Ala100105 110Pro Ser Asn Thr Arg Ala Gln Asn Glu Arg Leu Ser Arg Gln Thr Gly115 120 125Pro Phe Val Leu Ser Val Val Cys Arg130 135<210>40<211>420<212>DNA<213>人工序列<220>
<223>編碼21B(D2A21)三聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>40atggctagca tgggtcggga tccgttcgcg aagaagtttg cgaaaaagtt caagaaattt60gccaagaagt ttgccaagtt cgcattcgcg ttcggcgatc cgttcgcgaa gaagtttgcg120aaaaagttca agaaatttgc caagaagttt gccaagttcg cattcgcgtt cggcgatccg180
ttcgcgaaga agtttgcgaa aaagttcaag aaatttgcca agaagtttgc caagttcgca240ttcgcgttcg gcgatccttc gcgaagaagt ttgcgaaaaa gttcaagaaa tttgccaaga300agtttgccaa gttcgcattc gcgttcggtg atccgaattc gagctccgtc taatactcga360gcccaaaacg aaaggctcag tcgacagact gggcctttcg ttttatctgt tgtttgtcgg420<210>41<211>140<212>PRT<213>人工序列<220>
<223>21B(D2A21)三聚體的氨基酸序列<400>41Met Ala Ser Met Gly Arg Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys1 5 10 15Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly20 25 30Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys35 40 45Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala Lys Lys50 55 60Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys Phe Ala65 70 75 80Phe Ala Phe Gly Asp Pro Ser Arg Arg Ser Leu Arg Lys Ser Ser Arg85 90 95Asn Leu Pro Arg Ser Leu Pro Ser Ser His Ser Arg Ser Val Ile Arg100 105 110Ile Arg Ala Pro Ser Asn Thr Arg Ala Gln Asn Glu Arg Leu Ser Arg115 120 125Gln Thr Gly Pro Phe Val Leu Ser Val Val Cys Arg130 135 140
<210>42<211>168<212>DNA<213>人工序列<220>
<223>編碼JP2(D2A21)二聚體的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>42atggcggatc cgttcgcgaa gaagtttgcg aaaaagttca agaaatttgc caagaagttt60gccaagttcg cattcgcgtt cggcgatccg ttcgcgaaga agtttgcgaa aaagttcaag120aaatttgcca agaagtttgc caagttcgca ttcgcgttcg gcgattaa 168<210>43<211>55<212>PRT<213>人工序列<220>
<223>在熒光假單胞菌表達(dá)載體pMYC1803中的D2A21二聚體的JP2氨基酸序列<400>43Met Ala Asp Pro Phe Ala Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe1 5 10 15Ala Lys Lys Phe Ala Lys Phe Ala Phe Ala Phe Gly Asp Pro Phe Ala20 25 30Lys Lys Phe Ala Lys Lys Phe Lys Lys Phe Ala Lys Lys Phe Ala Lys35 40 45Phe Ala Phe Ala Phe Gly Asp50 55<210>44<211>266<212>PRT<213>人工序列<220>
<223>截短的脫鹵素酶/D4E1五聚體融合體的氨基酸序列
<400>44Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Met Ala Ser Met Thr115 120 125Gly Gly Gln Gln Met Gly Arg Asp Pro Phe Lys Leu Arg Ala Lys Ile130 135 140Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe145 150 155 160Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu165 170 175Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu180 185 190Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp Pro Phe Lys Leu Arg Ala195 200 205Lys Ile Lys Val Arg Leu Arg Ala Lys Ile Lys Leu Gly Asp Pro Asp210 215 220Pro Phe Lys Leu Arg Ala Lys Ile Lys Val Arg Leu Arg Ala Lys Ile
225 230 235 240Lys Leu Gly Asp Pro Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala245 250 255Ala Ala Leu Glu His His His His His His260 265<210>45<211>801<212>DNA<213>人工序列<220>
<223>編碼SEQ ID NO44融合蛋白的DNA序列(在熒光假單胞菌表達(dá)載體pMYC1803中)<400>45atgtcagaaa tcggtacagg cttccccttc gacccccatt atgtggaagt cctgggcgag60cgtatgcact acgtcgatgt tggaccgcgg gatggcacgc ctgtgttgtt cctgcacggt120aacccgacct cgtcctacct gtggcgcaac atcatcccgc atgtagcacc gagtcatcgg180tgcattgctc cagacctgat cgggatggga aaatcggaca aaccagacct cgattatttc240ttcgacgacc acgtccgcta cctcgatgcc ttcatcgaag ccttgggttt ggaagaggtc300gtcctggtca tccacgactg gggctcagct ctcggattcc actgggccaa gcgcaatccg360gaacgggtca tggctagcat gactggtgga cagcaaatgg gtcgggatcc gttcaaactg420cgtgctaaaa tcaaagttcg tctgcgtgct aaaatcaaac tgggtgaccc tgatccgttc480aaactgcgtg ctaaaatcaa agttcgtctg cgtgctaaaa tcaaactggg tgaccctgat540ccgttcaaac tgcgtgctaa aatcaaagtt cgtctgcgtg ctaaaatcaa actgggtgac600cctgatccgt tcaaactgcg tgctaaaatc aaagttcgtc tgcgtgctaa aatcaaactg660ggtgaccctg atccgttcaa actgcgtgct aaaatcaaag ttcgtctgcg tgctaaaatc720aaactgggtg accctgatcc gaattcgagc tccgtcgaca agcttgcggc cgcactcgag780caccaccacc accaccactg a 80權(quán)利要求
1.一種生物合成生產(chǎn)小肽的方法,所述方法包括A)提供1)至少一個微生物細(xì)胞;和2)至少一種核酸,所述微生物細(xì)胞能夠從該核酸表達(dá)出載體-肽融合多肽,所述融合多肽包含(a)至少一個高度表達(dá)的載體多肽,其通過可切割接頭連接到(b)上,(b)至少一個肽多聚體,該肽多聚體包含至少兩個串聯(lián)排列的小肽單元,每一個小肽單元通過切割位點(diǎn)被連接到至少一個相鄰的小肽單元上,所述切割位點(diǎn)包含至少一個Asp-Pro二肽,B)將所述核酸轉(zhuǎn)染到所述微生物細(xì)胞內(nèi),獲得轉(zhuǎn)化的微生物細(xì)胞;C)將所述轉(zhuǎn)化的微生物細(xì)胞置于細(xì)胞能夠表達(dá)該核酸以生產(chǎn)出由此編碼的載體-肽融合多肽的條件下;D)任選地,從轉(zhuǎn)化的微生物細(xì)胞回收所述載體-肽融合多肽;E)任選地,進(jìn)行切割反應(yīng),從所述肽多聚體上切割所述載體多肽;F)進(jìn)行切割反應(yīng),以將多聚體的小肽單元從被此間切割下來,由此獲得小肽;和G)任選地,進(jìn)行末端切割反應(yīng),除去存在于小肽末端的切割位點(diǎn)氨基酸殘基、或可切割接頭氨基酸殘基、或兩者。
2.根據(jù)權(quán)利要求1的方法,其中所述微生物細(xì)胞是一種細(xì)菌細(xì)胞。
3.根據(jù)權(quán)利要求2的方法,其中所述細(xì)菌細(xì)胞屬于Y-蛋白菌。
4.根據(jù)權(quán)利要求3的方法,其中所述細(xì)菌細(xì)胞屬于假單胞菌屬。
5.根據(jù)權(quán)利要求4的方法,其中所述細(xì)菌細(xì)胞屬于熒光假單胞菌族。
6.根據(jù)權(quán)利要求5的方法,其中所述細(xì)菌細(xì)胞是熒光假單胞菌。
7.根據(jù)權(quán)利要求6的方法,其中所述細(xì)菌細(xì)胞是熒光假單胞菌變種A。
8.根據(jù)權(quán)利要求1的方法,其中每一個將小肽單元連接在一起的切割位點(diǎn)含有至少一個Gly-Asp-Pro三肽。
9.根據(jù)權(quán)利要求8的方法,其中每一個將小肽單元連接在一起的切割位點(diǎn)是Giy-Asp-Pro三肽。
10.根據(jù)權(quán)利要求1的方法,其中肽多聚體包含至少三個串聯(lián)排列的肽單元。
11.根據(jù)權(quán)利要求1的方法,其中每一個肽單元在所述肽多聚體中以相同取向進(jìn)行表達(dá)。
12.根據(jù)權(quán)利要求1的方法,其中所述肽多聚體的小肽單元具有相同的氨基酸序列。
13.根據(jù)權(quán)利要求1的方法,其中所述高度表達(dá)的載體多肽是一種在微生物細(xì)胞中高度表達(dá)的蛋白的N-末端片段。
14.根據(jù)權(quán)利要求13的方法,其中所述N-末端片段長度為約或至少10個氨基酸殘基。
15.根據(jù)權(quán)利要求14的方法,其中所述蛋白是玫瑰紅紅球菌TDTM-003鹵烷脫鹵素酶(SEQ ID NO30)。
16.一種能夠由其表達(dá)載體-肽融合多肽的核酸,該載體-肽融合多肽含有(a)至少一個高度表達(dá)的載體多肽,其通過可切割接頭連接到(b)上,(b)至少一個肽多聚體,該肽多聚體包含至少兩個串聯(lián)排列的小肽單元,通過包含至少一個Asp-Pro二肽的切割位點(diǎn),每一個小肽單元被連接到至少一個相鄰的小肽單元上。
17.根據(jù)權(quán)利要求16的核酸,其中所述核酸是一種載體。
18.根據(jù)權(quán)利要求17的核酸,其中所述載體是一種質(zhì)粒。
19.根據(jù)權(quán)利要求16的核酸,其中所述核酸是通過如下方法制備的,該方法包括退火和包括假回文寡聚物在內(nèi)的寡聚物的連接,形成多聚多核苷酸文庫,該多聚多核苷酸包含串聯(lián)的編碼肽單元的寡核苷酸并通過編碼切割位點(diǎn)的核苷酸連接,所述文庫既包含其中編碼肽單元的寡核苷酸部分以相同取向排列的多聚多核苷酸,還包含其中編碼肽單元的寡核苷酸部分以不同取向排列的多聚多核苷酸,隨后用合適的限制性內(nèi)切酶處理多聚多核苷酸,僅使那些編碼肽單元的寡核苷酸部分以不同取向排列的多聚多核苷酸被水解。
20.包含根據(jù)權(quán)利要求16的核酸的微生物細(xì)胞。
21.根據(jù)權(quán)利要求1的方法生產(chǎn)的小肽。
22.根據(jù)權(quán)利要求1-15任一項所述的過程,其中小肽是抗微生物肽(AMP)。
23.根據(jù)權(quán)利要求16-19任一項所述的核酸,其中小肽是抗微生物肽。
24.根據(jù)權(quán)利要求20的微生物細(xì)胞,其中小肽是抗微生物肽。
25.根據(jù)權(quán)利要求21的小肽,其中小肽是抗微生物肽。
全文摘要
本發(fā)明涉及一種使用微生物進(jìn)行低成本生產(chǎn)包括抗微生物肽(AMP)在內(nèi)的肽的方法。本方法與迄今已知現(xiàn)有技術(shù)相比能夠大大提高肽/AMP的產(chǎn)量。同時本方法出人意料地使用熒光假單胞菌(Pseudomonas fluorescens)來生產(chǎn)AMP和其它的肽。本發(fā)明還提供了幾種組分,可以單獨(dú)或組合使用。本發(fā)明提供了肽/AMP與前體串聯(lián)的產(chǎn)物。本發(fā)明也提供了新的把單體裝配成多聚體,和切割多聚體以產(chǎn)生活性單體的方法。本發(fā)明也涉及應(yīng)用這些融合到載體肽上的多聚體來生產(chǎn)融合蛋白。更合適地,多聚體和融合蛋白(多聚體和載體多肽)都缺少電荷平衡。令人驚奇地發(fā)現(xiàn),在多聚體構(gòu)建物中沒必要給多個AMP拷貝補(bǔ)償正電荷。因此,本發(fā)明可以使用更為廣泛的多聚體和載體肽。
文檔編號C12N1/21GK1662657SQ03814541
公開日2005年8月31日 申請日期2003年4月22日 優(yōu)先權(quán)日2002年4月22日
發(fā)明者J·F·克雷布斯, P·S·策納, I·A·湯姆林森 申請人:陶氏環(huán)球技術(shù)公司