專利名稱:在植物中表達(dá)多蛋白的遺傳學(xué)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種增強(qiáng)蛋白表達(dá)水平的方法,尤其通過在植物的一個(gè)單獨(dú)的轉(zhuǎn)錄單元內(nèi)共表達(dá)兩個(gè)或多個(gè)蛋白來增強(qiáng)蛋白的表達(dá)。本發(fā)明還涉及植物中兩個(gè)或多個(gè)蛋白的共表達(dá)和分泌,涉及發(fā)明方法中所應(yīng)用的接頭序列,涉及發(fā)明中應(yīng)用的DNA構(gòu)建體以及用發(fā)明中的這種構(gòu)建體所轉(zhuǎn)化的植物。
由于許多應(yīng)用都基于通過基因轉(zhuǎn)移所進(jìn)行的植物遺傳學(xué)改變,協(xié)同表達(dá)兩個(gè)或多個(gè)轉(zhuǎn)基因是可取的。例如,在植物中,編碼具有不同生化靶點(diǎn)的抗菌蛋白的轉(zhuǎn)基因的共表達(dá)能夠產(chǎn)生增強(qiáng)的抗病水平,產(chǎn)生較廣闊范圍的病原體抗性,或者產(chǎn)生更難被病原體變異適應(yīng)所克服的抵抗性。其他例子包括,通過共表達(dá)包含在一條生物合成途徑中的多個(gè)轉(zhuǎn)基因,在轉(zhuǎn)基因植物中產(chǎn)生一種特殊的代謝物。要獲得表達(dá)多個(gè)轉(zhuǎn)基因的轉(zhuǎn)基因植物,存在不同的方法。一種常用的選擇方案是,通過單獨(dú)的轉(zhuǎn)化作用分別導(dǎo)入每一個(gè)轉(zhuǎn)基因,并將不同的單一轉(zhuǎn)基因表達(dá)品系雜交。這種方法的缺點(diǎn)是,在產(chǎn)生的后代中,不同的轉(zhuǎn)基因?qū)⒈徊迦氩煌奈恢?。這會使隨后的育種過程復(fù)雜化。而且,這種方法不適用于營養(yǎng)繁殖的作物,例如馬鈴薯、許多觀賞植物和果樹。
第二種可能性是,把不同的轉(zhuǎn)基因作為一個(gè)單獨(dú)轉(zhuǎn)化載體內(nèi)連接的表達(dá)盒來導(dǎo)入,每一表達(dá)盒有自己的啟動(dòng)子和終止子。在這種情況下,這樣一組轉(zhuǎn)基因?qū)⒆鳛橐粋€(gè)單一的基因位點(diǎn)來分離。然而已經(jīng)發(fā)現(xiàn),轉(zhuǎn)基因植物中相同啟動(dòng)子的多個(gè)拷貝的存在,經(jīng)常抑制轉(zhuǎn)基因的轉(zhuǎn)錄(Matzke,M.A.和Matzke,A.J.M.,1998,細(xì)胞和分子生物學(xué)54,94-103)。在一項(xiàng)把載體導(dǎo)入植物的實(shí)驗(yàn)中,其中的載體包含四個(gè)相連接的轉(zhuǎn)基因,每一轉(zhuǎn)基因由一個(gè)CaMV35S啟動(dòng)子驅(qū)動(dòng),Van denElzen P.J.等(Phil.Trans.Soc.Lon.B.,1993,342:271-278)發(fā)現(xiàn),所分析的轉(zhuǎn)基因品系中沒有一個(gè)能在相當(dāng)高的水平表達(dá)全部的四個(gè)轉(zhuǎn)基因。為了避免這個(gè)問題,可以在所應(yīng)用的每一個(gè)表達(dá)盒中使用不同的啟動(dòng)子。然而,目前只有有限的可供選擇的啟動(dòng)子組,在表達(dá)水平、細(xì)胞類型和進(jìn)化專一性以及對環(huán)境因素的反應(yīng)上具有相仿的特性。
第三個(gè)選項(xiàng)是用所謂的內(nèi)部核糖體進(jìn)入位點(diǎn)分隔不同的編碼區(qū)域,從一個(gè)轉(zhuǎn)錄單元產(chǎn)生多個(gè)蛋白。內(nèi)部核糖體進(jìn)入位點(diǎn)使核糖體在mRNA的內(nèi)部位置重復(fù)翻譯。盡管內(nèi)部核糖體進(jìn)入位點(diǎn)在動(dòng)物體系得到了很好的證明(Kaminiski A.等.,1994,genet.Eng.16,115-155),但是目前還不知道這些位點(diǎn)在來自植物的核-編碼基因中是否也起作用。多順反子性的基因在插入植物葉綠體基因組時(shí)能夠被表達(dá)(Daniell H.等.,1998,自然生物技術(shù)16,345-348),但是這種情況下的基因產(chǎn)物被限定在葉綠體,而葉綠體并不總是外源蛋白優(yōu)選的沉積位點(diǎn)。
最后,第四種策略是基于水解斷裂一個(gè)由單個(gè)轉(zhuǎn)錄單元編碼的多蛋白前體,而產(chǎn)生多個(gè)蛋白。例如,馬鈴薯Y病毒組(Potyviruses)把它們的基因組RNA翻譯成一個(gè)單一的多蛋白前體,該前體包含的蛋白水解結(jié)構(gòu)域能夠順式斷裂多蛋白前體(Dougherty,W.G.和Carrington,J.C.,1988,植物病理學(xué)綜述年刊26,123-143)。Beckvon Bodman,S.et al.,(1995,生物/技術(shù)13,587-591)已經(jīng)利用馬鈴薯Y病毒組方法共表達(dá)了參與甘露堿生物合成的兩種酶。這兩種生物合成酶與一個(gè)來源于馬鈴薯Y病毒組多蛋白前體的蛋白酶一起被融合在一個(gè)開放閱讀框中,而鄰接區(qū)域被8個(gè)氨基酸長的間隔區(qū)分開,間隔區(qū)代表了蛋白酶的特異裂解位點(diǎn)。用這種結(jié)構(gòu)轉(zhuǎn)化的植物合成了苷露堿,表明這兩種酶已經(jīng)以某種方式產(chǎn)生了至少有部分功能的形式,盡管在植物(inplanta)中沒有為推測的裂解作用提出直接的證據(jù)。這種方法的缺點(diǎn)是,病毒蛋白需要與感興趣的蛋白共表達(dá),這并不總是可取的。最近,Urwin P.E.等(1998,植物學(xué)204,472-479)已經(jīng)證明可以共表達(dá)用一個(gè)來自植物金屬硫蛋白樣蛋白的蛋白酶敏感前肽接合的兩個(gè)不同的蛋白酶抑制因子。在轉(zhuǎn)基因擬南芥(Arabidopsis thaliana)中已經(jīng)發(fā)現(xiàn),由一個(gè)半胱氨酸蛋白酶抑制子(oryzacystatin from vice)、一個(gè)來源于豌豆金屬硫蛋白樣蛋白的前肽和一個(gè)絲氨酸蛋白酶抑制子組成的一個(gè)多蛋白前體被裂解。然而僅是部分裂解,因?yàn)樵谵D(zhuǎn)基因植物中也能檢測到?jīng)]被裂解的多蛋白前體。由于該多蛋白前體不包含一個(gè)引導(dǎo)肽,所以預(yù)測翻譯產(chǎn)物將沉積在細(xì)胞溶質(zhì)中。衍生出前肽的金屬硫蛋白也不包含一個(gè)引導(dǎo)肽(Evans IM 1990,歐洲生物化學(xué)協(xié)會聯(lián)合會刊(FEBS Lett.262,29~32)),因此它的加工必須在胞質(zhì)中進(jìn)行。
對一些應(yīng)用而言,胞質(zhì)加工和沉積是一個(gè)缺陷。許多蛋白,尤其是糖基化蛋白或有多個(gè)二硫鍵的蛋白,必須在分泌途徑合成(包括內(nèi)質(zhì)網(wǎng)和高爾基器),以折疊成一種有功能的形式(Bednarek和Raikhel1992,植物分子生物學(xué)20,133-150)。另外,對于一些應(yīng)用,例如抗菌蛋白的表達(dá),細(xì)胞外間隙是優(yōu)選的沉積位點(diǎn),因?yàn)榇蠖鄶?shù)微生物至少早期感染過程發(fā)生在細(xì)胞外間隙。指定到細(xì)胞外間隙的蛋白也是通過分泌途徑合成的,但是除了引導(dǎo)肽以外還缺少額外的靶向信息(Bednarek和Raikhel 1992,植物分子生物學(xué)20,133-150)。這種方法的其它應(yīng)用事例在WO 95/24486和WO95/17514中有所描述。
申請者意外發(fā)現(xiàn),用一個(gè)多蛋白前體構(gòu)建體轉(zhuǎn)化的植物中,植物防衛(wèi)素的表達(dá)水平遠(yuǎn)高于其在用單一的植物防衛(wèi)素構(gòu)建體轉(zhuǎn)化的植物中的表達(dá)。
因此,本發(fā)明提供了在轉(zhuǎn)基因植物中提高一種蛋白表達(dá)水平的方法,該方法包括在所述植物的基因組插入一個(gè)DNA序列。該DNA序列包含一個(gè)啟動(dòng)子區(qū)域和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分(component)蛋白分子。
這里描述的加工系統(tǒng)不僅可以用來共表達(dá)兩個(gè)或多個(gè)不同蛋白,而且可以用來獲得一個(gè)蛋白尤其是小蛋白的高表達(dá)。所觀察到的促進(jìn)翻譯效率的原因目前還不清楚??赡軞w于mRNA長度或原始翻譯產(chǎn)物長度的影響。
優(yōu)選一個(gè)信號序列有效地連接在蛋白編碼區(qū)之間。
這里所表述的“信號序列”是用來定義編碼引導(dǎo)肽的一個(gè)序列,該引導(dǎo)肽使新生多肽進(jìn)入內(nèi)質(zhì)網(wǎng),而且引導(dǎo)肽在這種轉(zhuǎn)位作用之后被切除。
信號序列可以來自任何適合的來源并且可能天然聯(lián)合有它要被連接的啟動(dòng)子。我們已經(jīng)發(fā)現(xiàn),來自植物蛋白防衛(wèi)素家族的信號序列(Broekaert et a1,1995植物生理學(xué)108,1353-1358;Broekaertet al,1997,Crit,Rev,Plant Sci 16,297-323),尤其適合在本發(fā)明方法中使用。
這樣,在一個(gè)更加優(yōu)選的實(shí)施方案中,提供了一種在轉(zhuǎn)基因植物中提高蛋白表達(dá)水平的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。
本發(fā)明的這種方法尤其適合長度在100個(gè)氨基酸或少于100個(gè)氨基酸的蛋白的表達(dá)。
本發(fā)明提供了一種簡便高效的方法,即在植物中把兩個(gè)或多個(gè)蛋白作為一個(gè)單獨(dú)的轉(zhuǎn)錄單元共表達(dá),在轉(zhuǎn)錄單元中,兩種蛋白被一種可裂解的連接物連接。這樣設(shè)計(jì)這種結(jié)構(gòu),以便在植物的分泌途徑中發(fā)生裂解作用,把蛋白釋放到胞外。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3'-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。
根據(jù)本發(fā)明的所有方面,兩個(gè)或兩個(gè)以上的蛋白編碼區(qū)最好不編碼相同的蛋白,即,本發(fā)明的方法允許在一個(gè)單一的轉(zhuǎn)錄單元中產(chǎn)生不同的蛋白質(zhì)。根據(jù)本發(fā)明的方法,要表達(dá)的DNA序列不是植物中天然用來產(chǎn)生多蛋白的序列,即該DNA序列的一個(gè)或多個(gè)組分對于植物宿主是異種的。
這里描述的多蛋白表達(dá)方法不包括象國際專利申請公開No.WO95/24486中SEQ ID NO.14,15,16,17或18中所描述的,使用如Ib-AMP基因表達(dá)的接頭前肽,將三個(gè)各自編碼Rs-AFP2蛋白的編碼區(qū)分開并將其插入植物基因組。相適應(yīng)地,本發(fā)明的方法中不使用WO95/24486中SEQ ID NO.14,15,16,17或18所描述的天然Ib-AMP基因的接頭前肽。
在另一個(gè)方面,本發(fā)明提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。前提條件是,當(dāng)接頭前肽來源于國際專利申請公開No.WO95/24486中SEQ ID NO.14,15,16,17或18所描述的Ib-AMP基因時(shí),它不分隔三個(gè)各自編碼Rs-AFP2蛋白的編碼區(qū)。
Rs-AFP2的序列在1993年3月18日發(fā)布的國際專利申請公開No.WO93/05153中有完整描述。
啟動(dòng)子序列可能自然地連接有信號序列,也/或者可能自然地聯(lián)合有它要連接的蛋白編碼序列,或者它可能是植物中任何其它的轉(zhuǎn)錄啟動(dòng)子。啟動(dòng)子可能是一個(gè)組成性的啟動(dòng)子或者可能是一個(gè)可誘導(dǎo)啟動(dòng)子。
這里所描述的本發(fā)明在所有方面和所有實(shí)施例中使用的一種優(yōu)選的接頭前肽,在多蛋白編碼-DNA被表達(dá)的植物細(xì)胞分泌途徑中,從所述的DNA編碼多蛋白前體中裂解。接頭前肽優(yōu)選這樣的設(shè)計(jì)或選擇,以便使前肽被天然存在于植物細(xì)胞分泌途徑的蛋白酶降解,其中編碼多蛋白的DNA在分泌途徑表達(dá)?;ㄒ嘶ㄈ~病毒的特殊啟動(dòng)子例如35SRNA的Penh 25S啟動(dòng)子,這樣的蛋白酶的例子包括枯草桿菌蛋白酶樣蛋白酶。
因此,在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方案中,提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。所述接頭前肽在表達(dá)DNA編碼多蛋白的植物細(xì)胞分泌途徑中,從所述的DNA編碼多蛋白前體中裂解。
這里所描述的多蛋白表達(dá)方法不包括象國際專利申請公開No.WO95/24486中SEQ ID NOs 14,15,16,17或18中所描述的,使用來源于Ib-AMP基因的接頭前肽將三個(gè)各自編碼Rs-AFP2蛋白的編碼區(qū)分開并將其插入植物基因組。
在本發(fā)明的一些實(shí)施方案中,接頭前肽不是從病毒得來的。
在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方案中,提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3'-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被轉(zhuǎn)錄后加工成組分蛋白分子。所述接頭前肽在表達(dá)DNA編碼多蛋白的植物細(xì)胞分泌途徑中,從所述的DNA編碼多蛋白前體中裂解。其中前肽的裂解是由天然存在于植物分泌途徑的蛋白酶進(jìn)行的。
接頭前肽可能是一種天然包含發(fā)生在植物分泌途徑中的蛋白酶加工位點(diǎn)的肽,例如這里將進(jìn)一步描述的Ib-AMP基因來源的內(nèi)部前肽。接頭前肽或者可能是一種在任一端或兩端都已經(jīng)設(shè)計(jì)有蛋白酶加工位點(diǎn)的肽,其利于序列的裂解。在前肽具有一個(gè)這樣的蛋白酶加工位點(diǎn)的地方,可以再加入一個(gè)蛋白酶加工位點(diǎn)。如果需要或期望,可以包括重復(fù)的加工位點(diǎn),例如包含六個(gè)以上重復(fù)的加工位點(diǎn)。
例如,正如這里所充分描述的,又一個(gè)蛋白酶加工位點(diǎn)已經(jīng)被加到DNA序列的3’-末端。該DNA序列編碼來自大麗花和莧屬植物的C-末端前肽,其在N-末端天然具有一個(gè)未知分泌途徑的蛋白酶加工位點(diǎn),并且這些肽尤其適合在本發(fā)明的方法中應(yīng)用。已經(jīng)描述了某些包含C-末端前肽序列的大麗花序列,并在共同未決的英國專利No.9818003.7中要求保護(hù)。
然而,另一策略基于使用病毒例如小核糖核酸病毒的序列,例如口蹄疫病毒(FMDV)RNA的被稱作2A序列的20個(gè)氨基酸序列,導(dǎo)致多蛋白的裂解(Ryan and Drew 1994,EMPO雜志,13,928-933)。然而在這個(gè)例子中,為了避免不需要的氨基酸在蛋白產(chǎn)物中的滯留,聯(lián)合一個(gè)產(chǎn)生N-末端的序列,例如一個(gè)植物來源的序列或片段,來形成一個(gè)嵌合的前肽。
在本發(fā)明中,我們已經(jīng)建立了新的策略來制造在分泌途徑被裂解的人造多蛋白前體。第一種策略基于使用一個(gè)IbAMP基因來源的前肽。IbAMP是來自鳳仙花(Impatiens balsamina)的一個(gè)基因,編碼一種獨(dú)特的多蛋白前體,該前體特有一個(gè)引導(dǎo)肽和6個(gè)連續(xù)的抗菌肽,每一抗菌肽側(cè)面與16到28個(gè)氨基酸長度變化的前肽相連接(Tailor R.H.et al.,1997,生物化學(xué)雜志272,24480-24487)。并不知道IbAMP前體在它來源的植物中是怎樣并在何處進(jìn)行加工的。來自IbAMP的一個(gè)內(nèi)部前肽被用來分隔兩個(gè)不同的植物防衛(wèi)素編碼區(qū),這兩個(gè)編碼區(qū)一個(gè)來源于蘿卜種子(RsAFP2,Terras F.R.G.etal.,1992,生物化學(xué)267,15301-15309;Terras et al,1995,植物細(xì)胞學(xué),7,573-588),一個(gè)來自大麗花種子(DmAMP1,Osborn R.W.et al.,1995,歐洲生物化學(xué)協(xié)會聯(lián)合會刊368,257-262)。
另一策略基于使用來自DmAMP1前體或AcAMP2前體或者它們的片段的C-末端前肽(De Bolle M.F.C.ET AL.,1993,植物分子生物學(xué)22,1187-1190)。選擇這些C-末端前肽的根據(jù)是,我們以前觀察到它們在轉(zhuǎn)基因煙草中能被明顯裂解而不影響它們在前體中所連接的成熟蛋白的細(xì)胞外沉積(R.W.Osborn and S.Attenborough,個(gè)人通信;De Bolle M.F.C.et al.,1996,植物分子生物學(xué)31,993-1008),表明這種斷裂是由存在于液泡除外的分泌途徑中的一種蛋白酶所進(jìn)行的。要把這些C-末端前肽轉(zhuǎn)化為內(nèi)部前肽,在前肽的C-末端部分設(shè)計(jì)了一個(gè)枯草桿菌蛋白酶樣蛋白酶加工位點(diǎn)。
枯草桿菌蛋白酶樣蛋白酶是在最后兩個(gè)殘基是堿性的識別位點(diǎn)特異斷裂的酶(Barr,P.J.,1991,細(xì)胞66,1-3;Park C.M.etal.,1994,分子微生物學(xué),11,155-164)。盡管枯草桿菌蛋白酶樣蛋白酶在真菌(例如Kex2樣蛋白酶)和高等動(dòng)物(例如弗林蛋白酶)中被很好地證明,但近來的證據(jù)表明這些酶也存在于植物中(Kinal H.et al.,1995,植物細(xì)胞7,677-688;Tornero P.et al.,1997,生物化學(xué)雜志272,14412-14419),包括擬南芥屬植物(Ribeiro A.et al.,1995,植物細(xì)胞7,785-794)。
我們已經(jīng)發(fā)現(xiàn),包含一個(gè)引導(dǎo)肽和兩個(gè)由任何上述內(nèi)部前肽相互分隔的不同植物防衛(wèi)素的多蛋白前體,能夠在轉(zhuǎn)基因植物中被加工,同時(shí)釋放兩種植物防衛(wèi)素。確實(shí)發(fā)生了這種裂解,這樣至少植物防衛(wèi)素的大部分沉積在細(xì)胞外間隙。因此,前體的加工在分泌途徑或細(xì)胞外間隙發(fā)生。在轉(zhuǎn)基因植物中被裂解的不同前肽沒有顯示出原始序列同源性。然而所有的序列都似乎富含小氨基酸A,V,S和T,并且都包含由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基所組成的二肽序列。盡管在本發(fā)明實(shí)施例中證明的前肽裂解沒有明顯地發(fā)生在液泡中,但如果期望蛋白在液泡中沉積,可能也可以使用來自液泡蛋白(例如2S的白蛋白)的內(nèi)部前肽。這里所述的共表達(dá)實(shí)驗(yàn)中使用了兩個(gè)不同的植物防衛(wèi)素,但預(yù)測當(dāng)在多蛋白前體結(jié)構(gòu)中應(yīng)用其它類型的蛋白或者使用兩個(gè)以上的成熟蛋白域時(shí),將得到相同結(jié)果。
要在分泌途徑中把多蛋白指向一個(gè)特殊的細(xì)胞器,可以把一個(gè)適合的靶向序列加到一個(gè)或多個(gè)多蛋白編碼區(qū)域。例如,一個(gè)內(nèi)質(zhì)網(wǎng)靶向序列,例如編碼KDEL(SEQ ID NO 65)的序列,可以被加到一個(gè)或多個(gè)成熟蛋白編碼區(qū),或者一個(gè)液泡靶向的序列(Chispeel和Raikhel 1992,細(xì)胞學(xué)68,613-616)可以被加到一個(gè)或多個(gè)蛋白編碼區(qū)的3’-或5’-末端。近來的一個(gè)例子是,證明大麥凝集素的羧基末端前肽指定異源蛋白以不同方式分泌到液泡中(Bednarek和Raikhel 1991,植物細(xì)胞學(xué)3,1195-1206;De Bolle等,1996,植物分子生物學(xué)31,933-1008)。
根據(jù)這里所述的的本發(fā)明的所有方面和方法,優(yōu)選所使用的接頭前肽的序列至少有40%包括選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者包括2到5個(gè)選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸。
所述的疏水殘基優(yōu)選丙氨酸、纈氨酸、亮氨酸、甲硫氨酸和/或異亮氨酸,而所述親水殘基優(yōu)選天冬氨酸、谷氨酸、賴氨酸和/或精氨酸。
更優(yōu)選地,接頭前肽在它N-或C-末端裂解位點(diǎn)的7個(gè)殘基內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)連續(xù)堿性殘基或者2到5個(gè)混合酸堿性殘基的序列。
根據(jù)這里所述的的本發(fā)明的所有方面,尤其優(yōu)選所使用的接頭前肽的序列至少有40%由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸組成。并且接頭前肽在它N-或C-末端裂解位點(diǎn)的7個(gè)殘基內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)連續(xù)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基序列。
也優(yōu)選使用富含小氨基酸A,V,S和T,并且包含由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基所組成的二肽序列的接頭前肽,在翻譯中提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成為組分蛋白分子。
這里所用的術(shù)語“富含”表示A,V,A和T殘基的存在比根據(jù)氨基酸隨機(jī)分布所預(yù)計(jì)的更加頻繁。
更優(yōu)選接頭前肽在其N-末端和/或C-末端的7個(gè)氨基酸內(nèi)有一個(gè)二肽序列,該二肽序列由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基組成,其中所述的二肽序列在接頭前肽的每一末端可能相同或不同。
在一個(gè)更優(yōu)選的實(shí)施方案中,所述二肽序列選自EE,ED和/或KK。
特別期望接頭前肽擁有距離足夠遠(yuǎn)的兩個(gè)(或多個(gè))蛋白域,以便它們能夠獨(dú)立地適當(dāng)折疊。為了這一目的,接頭前肽適合至少10個(gè)氨基酸長而更優(yōu)選至少15個(gè)氨基酸長。更加有利的是,接頭前肽不與它所連接的任一個(gè)二級結(jié)構(gòu)單元相互作用并因此自身沒有特別的二級結(jié)構(gòu)或形成單獨(dú)的二級結(jié)構(gòu),如α螺旋。
在這里描述的本發(fā)明的這一和其它所有方面和實(shí)施例中,提供裂解位點(diǎn)的接頭前肽序列,優(yōu)選包括一個(gè)從自然資源如植物或病毒,或其變體,或者這些中任一個(gè)的片段中可分離到的接頭序列。特別是,接頭前肽可以從一種植物蛋白,或片段,或其變體或衍生物中分離,這提供了適合的裂解位點(diǎn)。特別的例子包括一個(gè)可裂解的接頭前肽,來自大麗花基因C-末端的前肽區(qū),正如在共同未決的英國專利申請No.9818003.7中所描述和要求的。
在應(yīng)用病毒序列時(shí),優(yōu)選一個(gè)嵌合前肽元件。
這里表達(dá)的“變體”是指氨基酸序列內(nèi)部的一個(gè)或多個(gè)氨基酸被其它氨基酸替代,使氨基酸序列不同于它們所來源的基本序列。氨基酸替代可以被認(rèn)為是“保守的”,其中的氨基酸被一個(gè)具有廣泛相似特性的不同氨基酸代替。非保守性替代是氨基酸被不同類型的氨基酸代替。概括地講,不改變多肽的生物活性,將不可能有非保守的替代。相適應(yīng)地,變體與基本序列間至少有85%,優(yōu)選至少90%的相似性。
在本發(fā)明范圍中,相互間具有至少85%相似性的兩個(gè)氨基酸序列在一個(gè)相似的位置至少有85%相似(同樣的或保守替代的)的氨基酸殘基,當(dāng)最佳排列時(shí),提供了3個(gè)缺口。前提條件是,就缺口而言,總共不超過15個(gè)氨基酸殘基受到影響。同樣地,相互間具有至少90%相似性的兩個(gè)氨基酸序列在一個(gè)相似的位置至少有90%同樣或保守替代的氨基酸殘基,當(dāng)最佳排列時(shí),提供了3個(gè)缺口。前提條件是,就缺口而言,總共不超過15個(gè)氨基酸殘基受到影響。
為了本發(fā)明的這一目的,規(guī)定一個(gè)保守氨基酸,與未改變蛋白相比,不改變蛋白活性/功能。特別可以在以下各組內(nèi)的氨基酸間進(jìn)行保守替代。
(ⅰ)丙氨酸,絲氨酸,甘氨酸和蘇氨酸(ⅱ)谷氨酸和天冬氨酸(ⅲ)精氨酸和賴氨酸(ⅳ)異亮氨酸,亮氨酸,纈氨酸和甲硫氨酸(ⅴ)苯丙氨酸,酪氨酸和色氨酸序列的相似性可以用本領(lǐng)域已知的序列排列算法來進(jìn)行測定,序列排列算法例如,Myers和Miller(生物科學(xué)的計(jì)算應(yīng)用4,11-17(1988))以及Wilbur和Lipman(美國國家科學(xué)院院刊80,726-30(1983))所描述的Clustal方法,還有Watterman和Eggert方法(分子生物學(xué)雜志(1987)197,723-728)。可以從美國威斯康星州,53715,Madison,1228 Selfpark大街的DNAstar公司獲得的MegAlign Lipman Pearson成對方法(使用默認(rèn)參數(shù)),作為Lasergene因方法的一部分也可以被使用。
特別地,接頭前肽是從一種可以從植物蛋白分離的序列,而更優(yōu)選從植物抗菌蛋白的前體中分離。所述植物抗菌蛋白如一種防衛(wèi)素或一種橡膠蛋白(hevein)類型的抗菌肽(Broekaert等1997,植物科學(xué)綜述評論16,297-323)。接頭前肽最優(yōu)選來自一種防衛(wèi)素和/或一種橡膠蛋白類型的抗菌肽,尤其是來自Dm-AMP1和Ac-AMP2的C-末端前肽,其序列如圖2所述(SEQ ID NO 5和SEQ ID NO 8)。
也優(yōu)選使用從鳳仙花屬植物的抗菌肽來源的接頭前肽。Ib-AMP基因包括5個(gè)前肽區(qū),所有的前肽區(qū)都適用于本發(fā)明,并在國際專利申請公告WO95/24486的第29頁和40-42頁充分描述,其內(nèi)容在此引入作為參考。可以使用來自Dm-AMP和Ac-AMP基因的全部或部分C-末端前肽。
在一個(gè)特別優(yōu)選的實(shí)施方案中,使用的接頭前肽包括一個(gè)自然存在的接頭前肽序列,其被進(jìn)行了修改,以便使其裂解后,來自該序列的氨基酸在蛋白產(chǎn)物上的殘余減少,優(yōu)選沒有殘余。適當(dāng)?shù)母淖兛梢杂孟挛乃枋龅某R?guī)方法來測定。在最簡單的形式上,分離本發(fā)明的蛋白產(chǎn)物并分析它們是否包含來自前肽連接物的任何殘留的氨基酸。接頭序列然后可以被修改除去一些或所有這些殘基,前提條件是能保留翻譯后裂解的功能。
“片段”這一術(shù)語是指氨基酸已經(jīng)從中刪除的序列,優(yōu)選從其一個(gè)末端區(qū)刪除氨基酸。這樣的片段包括上面提到的天然序列的修改形式。
本發(fā)明的一個(gè)接頭前肽如果作為一個(gè)翻譯后的裂解位點(diǎn),可能包括來源不同的一個(gè)或多個(gè)這種片段。接頭前肽序列的例子是這里所示的SEQ ID NOs3,4,6,7,21,22,23,24,25,26,27,28和29以及其充當(dāng)前肽的變體。其中具體的例子是SEQ IDNOs3,4,6,7,21,22,23,24,25,26,27,28和29自身。
前肽序列尤其包括SEQ ID NOs3,4,6或7。
根據(jù)本發(fā)明一個(gè)優(yōu)選的實(shí)施例,進(jìn)一步提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。其中接頭前肽來自一種防衛(wèi)素和/或一種橡膠蛋白類型的抗菌肽,該前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成各組分蛋白分子。
在這里,特別優(yōu)選使用如圖2中所描述的Dm-AMP1和Ac-AMP2來源的C-末端前肽作為可裂解的連接物,即提供一個(gè)可裂解的連接位點(diǎn)。可能有必要按照前肽的選擇,在任一端或兩端都設(shè)計(jì)一個(gè)額外的特異性蛋白酶識別位點(diǎn),以利于序列的裂解。適當(dāng)?shù)奶禺愋缘鞍酌缸R別位點(diǎn)包括枯草桿菌蛋白酶樣蛋白酶識別位點(diǎn),識別一個(gè)由兩個(gè)堿性殘基組成的二肽序列,或一個(gè)由一個(gè)疏水殘基、任一殘基、一個(gè)堿性殘基和一個(gè)堿性殘基組成的四肽序列或一個(gè)由一個(gè)堿性殘基、任一殘基、一個(gè)堿性殘基和一個(gè)堿性殘基組成的四肽。在本發(fā)明的方法中尤其優(yōu)選使用枯草桿菌蛋白酶樣蛋白酶識別位點(diǎn)。
根據(jù)本發(fā)明的一個(gè)更優(yōu)選的實(shí)施方案,進(jìn)一步提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。所述前肽提供了一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成各組分蛋白分子。其中已經(jīng)在該接頭前肽的任一端或兩端設(shè)計(jì)了一個(gè)額外的特異性蛋白酶識別位點(diǎn),以利于序列的裂解。
根據(jù)本發(fā)明的一個(gè)更優(yōu)選的實(shí)施方案,進(jìn)一步提供了一種在轉(zhuǎn)基因植物中表達(dá)多個(gè)蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域連接一個(gè)信號序列。該信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。其中接頭前肽來自一種防衛(wèi)素和/或一種橡膠蛋白類型的抗菌肽,該前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成各組分蛋白分子。其中已經(jīng)在該接頭前肽的任一端或兩端設(shè)計(jì)了一個(gè)額外的特異性蛋白酶識別位點(diǎn),以利于序列的裂解。
本發(fā)明進(jìn)一步提供使用從植物來源蛋白中分離的前肽,作為轉(zhuǎn)基因植物中通過分泌途徑合成的多蛋白前體中的可裂解連接物。前肽優(yōu)選從一種植物防衛(wèi)素或一種橡膠蛋白類型的抗菌肽的前體中分離(Broekaert等1997,植物科學(xué)綜述評論16,297-323)。前肽可能也優(yōu)選從一種來源于鳳仙花屬植物的抗菌肽中分離。
在本發(fā)明的另一個(gè)方面,提供使用一種前肽作為轉(zhuǎn)基因植物通過分泌途徑合成的多蛋白前體中的可裂解連接物。其中至少40%的前肽序列由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸組成。
更優(yōu)選接頭前肽在其N-末端或C-末端斷裂位點(diǎn)的7個(gè)氨基酸內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基的序列。
尤其優(yōu)選接頭前肽的序列至少有40%由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸組成。并且接頭前肽在它N-或C-末端裂解位點(diǎn)的7個(gè)殘基內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基序列。
在本發(fā)明的一個(gè)深入的方面,提供使用一種肽序列作為一個(gè)可裂解的接頭序列,該肽序列富含小氨基酸A,V,S和T,并且包含由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基所組成的二肽序列。其中所述的序列是從一種植物防衛(wèi)素或一種橡膠蛋白類型的抗菌蛋白中分離的。
本發(fā)明的方法可以用來獲得任何期望蛋白的有效表達(dá)和分泌,并且尤其適合表達(dá)那些必須在分泌途徑自然合成以便被折疊成一種功能形式的蛋白質(zhì),例如糖基化蛋白和那些有二硫鍵的蛋白。另外,非常有利于參與病原體侵襲植物引起的防衛(wèi)作用的蛋白被有效地分泌到細(xì)胞外間隙,因?yàn)檫@通常是病原體攻擊的最初位點(diǎn)。發(fā)明的這些方法為多個(gè)蛋白的細(xì)胞外運(yùn)送提供了一種有效的手段。
本發(fā)明的方法還尤其適合生產(chǎn)小肽,生產(chǎn)的小肽然后可以用于防染處理目的。即,轉(zhuǎn)基因植物或其來源的種子可以直接被用來作為食品,從而被動(dòng)免疫受者。
根據(jù)本發(fā)明的方法,能夠表達(dá)的蛋白例子包括抗真菌蛋白,其在國際專利申請公告WO92/15691,WO92/21699,WO93/05153,WO93/04586,WO94/11511,WO95/04754,WO95/18229,WO95/24486,WO97/21814和WO97/21815中有所描述,抗真菌蛋白包括Rs-AFP1,Rs-AFP2,Dm-AMP1,Dm-AMP2,Hs-AFP1,Ah-AMP1,Ct-AMP1,Ct-AMP2,Bn-AFP1,Bn-AFP2,Br-AFP1,Br-AFP2,Sa-AFP1,Sa-AFP2,Cb-AMP1,Cb-AMP2,Ca-AMP1,Bm-AMP1,Ace-AMP1,Ac-AMP1,Ac-AMP2,Mj-AMP1,Mj-AMP2,Ib-AMP1,Ib-AMP2,Ib-AMP3,Ib-AMP4,PR-1類型的蛋白,例如殼多糖酶,葡聚糖酶如β-3和β-1,6葡聚糖酶,殼質(zhì)結(jié)合的凝集素,玉米素,滲透蛋白,硫堇和核糖體非活性蛋白以及從它們或抗真菌蛋白來源的表現(xiàn)85%序列同一性的肽,優(yōu)選超過90%的序列同一性,更優(yōu)選大于95%的序列同一性的任何所述蛋白,其中序的列同一性如上面所規(guī)定。
可裂解的接頭用來連接兩個(gè)或多個(gè)感興趣的蛋白并提供裂解位點(diǎn)使多蛋白翻譯后在此加工成各組分蛋白分子。
在本發(fā)明的一個(gè)深入的方面提供了一個(gè)DNA構(gòu)建體,該構(gòu)建體所包括的一個(gè)DNA序列包含有一個(gè)啟動(dòng)子區(qū)連接一個(gè)植物來源的信號序列,所述信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。其中所述的接頭前肽提供一個(gè)翻譯后裂解位點(diǎn)。
適合地,蛋白編碼區(qū)編碼不同蛋白。前肽接頭序列的優(yōu)選實(shí)施例如上詳述。
在本發(fā)明這方面的一個(gè)優(yōu)選的實(shí)施方案中提供了一種DNA構(gòu)建體,其中所述編碼接頭前肽的DNA序列編碼一個(gè)來自Ib-AMP基因的內(nèi)部前肽。在本發(fā)明這方面的一個(gè)更加優(yōu)選的實(shí)施方案中提供了一種DNA構(gòu)建體,其中所述編碼接頭前肽的DNA序列編碼來自Dm-AMP或Ac-AMP基因的C-末端前肽。
在本發(fā)明的一個(gè)特別優(yōu)選的實(shí)施方案中提供了如上所述的一種DNA構(gòu)建體,其中當(dāng)編碼接頭前肽的DNA序列來源于Dm-AMP基因或Ac-AMP基因時(shí),其在任一端點(diǎn)或兩個(gè)端點(diǎn)都額外包括一個(gè)或多個(gè)蛋白酶識別位點(diǎn)。
在本發(fā)明的一個(gè)深入方面提供了一種DNA構(gòu)建體,該構(gòu)建體所包括的一個(gè)DNA序列包含有一個(gè)啟動(dòng)子區(qū)連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3'-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開,該DNA序列編碼來源于Dm-AMP基因或Ac-AMP基因的C-末端前肽。其中所述的接頭前肽提供一個(gè)翻譯后裂解位點(diǎn)。
在本發(fā)明的一個(gè)特別優(yōu)選的實(shí)施例中提供了如上所述的一種DNA構(gòu)建體,其中來源于Dm-AMP基因或Ac-AMP基因的編碼接頭前肽的DNA序列,在其任一端點(diǎn)或兩個(gè)端點(diǎn)都額外包括一個(gè)或多個(gè)蛋白酶識別位點(diǎn)。
在本發(fā)明的另一個(gè)深入方面,提供了一種根據(jù)本發(fā)明上述任意方面的DNA構(gòu)建體所轉(zhuǎn)化的轉(zhuǎn)基因植物。
在本發(fā)明的一個(gè)深入方面提供了由一個(gè)DNA序列轉(zhuǎn)化的一種轉(zhuǎn)基因植物,該DNA序列包含有一個(gè)啟動(dòng)子區(qū)連接到一個(gè)信號序列,所述信號序列被連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3'-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開。其中所述的接頭前肽在翻譯上提供了一個(gè)裂解位點(diǎn)。
在這方面的一個(gè)優(yōu)選的實(shí)施例,所述接頭前肽至少有40%的序列由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸組成。
所述疏水殘基優(yōu)選丙氨酸、纈氨酸、亮氨酸、甲硫氨酸和/或異亮氨酸,而所述親水殘基優(yōu)選天冬氨酸、谷氨酸、賴氨酸和/或精氨酸。
更優(yōu)選接頭前肽在其N-末端或C-末端斷裂位點(diǎn)的7個(gè)氨基酸內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基的序列。
特別優(yōu)選接頭前肽至少有40%的序列由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的延伸或者選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的延伸組成。并且接頭前肽在它N-或C-末端裂解位點(diǎn)的7個(gè)殘基內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基序列。
在本發(fā)明這方面的一個(gè)更優(yōu)選的實(shí)施方案中,提供裂解位點(diǎn)的DNA序列編碼一個(gè)肽序列,該肽序列富含小氨基酸A,V,S和T,并且包含由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基所組成的二肽序列。
在本發(fā)明這方面的一個(gè)特別優(yōu)選的實(shí)施方案中,提供裂解位點(diǎn)的DNA序列編碼一個(gè)來源于Ib-AMP基因的肽序列,例如圖2所述。在本發(fā)明這方面的一個(gè)更加特別優(yōu)選的實(shí)施方案中,提供裂解位點(diǎn)的DNA序列編碼來自如圖2所述的Dm-AMP1和Ac-AMP2的C-末端前肽,該C-末端前肽可能被隨意設(shè)計(jì)包含有一個(gè)編碼枯草桿菌蛋白酶-樣蛋白酶識別位點(diǎn)的DNA序列。
本發(fā)明的一個(gè)深入方面提供了一個(gè)包含上述DNA構(gòu)建體的載體。
這里所描述的某些接頭序列是新的,這些接頭序列及其編碼序列形成了本發(fā)明的一個(gè)深入的方面。因此,特別提供了一種核酸,其編碼SEQ ID NO 4,6,7,29,21,22,23,24,25,26,27,28的一個(gè)接頭前肽或圖34所示的接頭前肽及其變體。特殊的變體在C-末端連接有SEQ ID NO 77。
正如本領(lǐng)域的技術(shù)人員將明顯看到的那樣,DNA序列的各組分的序列,即,根據(jù)本發(fā)明方法所用的信號序列、接頭序列、蛋白序列、終止子序列可以從它的已知氨基酸序列來預(yù)測,編碼蛋白的DNA可以用一種標(biāo)準(zhǔn)的核酸合成儀來制造??商娲兀幋a本發(fā)明各組分的DNA可以從自然資源中適當(dāng)分離產(chǎn)生。
通過引用下列非限制的實(shí)施例和附圖來進(jìn)一步闡明本發(fā)明。其中
圖1示DmAMP1基因編碼區(qū)的核酸序列(SEQ ID NO 1)和相應(yīng)的氨基酸序列(SEQ ID NO 2)。相應(yīng)于成熟DmAMP1的氨基酸被下劃線。相應(yīng)于內(nèi)含子的核酸下劃雙線。
圖2示來自載體結(jié)構(gòu)的編碼區(qū)(SEQ ID NO 3-8)的簡圖。在內(nèi)部前肽下面的氨基酸序列代表接頭前肽所來源的前肽序列。
圖3顯示了植物轉(zhuǎn)化載體pFAJ3105的圖示。
圖4顯示了植物轉(zhuǎn)化載體pFAJ3106的圖示。
圖5顯示了植物轉(zhuǎn)化載體pFAJ3107的圖示。
圖6顯示了植物轉(zhuǎn)化載體pFAJ3108的圖示。
圖7顯示了植物轉(zhuǎn)化載體pFAJ3109的圖示。
圖8顯示了包含在pFAJ3105質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 9)和相應(yīng)的氨基酸序列(SEQID NO 10)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。
圖9顯示了包含在pFAJ3106質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 11)和相應(yīng)的氨基酸序列(SEQID NO 12)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。
圖10顯示了包含在pFAJ3107質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 13)和相應(yīng)的氨基酸序列(SEQID NO 14)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。
圖11顯示了包含在pFAJ3108質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 15)和相應(yīng)的氨基酸序列(SEQID NO 16)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。
圖12顯示了包含在pFAJ3109質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 17)和相應(yīng)的氨基酸序列(SEQID NO 18)。在相應(yīng)于成熟DmAMP1的氨基酸下面劃線。
圖13顯示了一些用構(gòu)建的pFAJ3105轉(zhuǎn)化的轉(zhuǎn)基因植物和一些用構(gòu)建的pFAJ3109轉(zhuǎn)化的轉(zhuǎn)基因個(gè)體的Dm-AMP1表達(dá)水平(作為總的可溶性蛋白的百分比)。
圖14顯示了對用pFAJ3105(A)或pFAJ3109(B)轉(zhuǎn)化的葉子粗提物的C8-二氧化硅柱進(jìn)行的反相-高壓液相色譜(RP-HPLC)分析。提取物如材料和方法中所述來制備。用0.1%三氟乙酸中一定濃度梯度的乙腈來洗脫柱子(0-35分鐘,15%-50%的乙腈溶在0.1%的三氟乙酸中)。洗脫物被即時(shí)監(jiān)測以測定214nm的光吸收(上部的軌跡圖),分級分離,并進(jìn)行酶聯(lián)免疫吸附測定來檢測DmAMP1(下部的柱狀圖,實(shí)心柱)和RsAFP2(下部的柱狀圖,空心柱)。用箭頭在A214色譜圖上表示出DmAMP1和RsAFP2確切的洗脫位置。
圖15顯示了用3105構(gòu)建使轉(zhuǎn)化的擬南芥屬植物(轉(zhuǎn)化株14)細(xì)胞外液體部分的反相色譜(RPC)結(jié)果。反相色譜法在一個(gè)用0.1%三氟乙酸平衡的C8-二氧化硅柱(Microsorb-MV,4.6×250mm,Rainin)上實(shí)行。裝柱后,以1ml/min的流速用0.1%的三氟乙酸洗脫柱子20分鐘,然后應(yīng)用在0.1%三氟乙酸中15%到50%線性梯度的乙腈洗脫35分鐘。即時(shí)測定280nm的光吸收(實(shí)線)并用一個(gè)傳導(dǎo)監(jiān)控器即時(shí)測定乙腈的濃度(虛線)。收集各部分并用酶聯(lián)免疫吸附測定來檢測DmAMP1-CRP和RsAFP2-CRP。使用粗體的峰號表示DmAMP1-CRP的存在,用斜體的峰號表示RsAFP2-CRP的存在。
圖16顯示了用3105構(gòu)建體轉(zhuǎn)化的擬南芥屬植物(轉(zhuǎn)化株14)的提取物的反相色譜(RPC)結(jié)果。樣品是來自離子交換色譜法的兩個(gè)不同的部分,指示DmAMP1-CRPs或RsAFP2-CRPs的存在,也就是說,那些部分在0.17-0.33M的NaCl(A)和0.33-0.49M的NaCl之間洗脫。反相色譜法按照圖14的圖注實(shí)行。即時(shí)測定280nm的光吸收(實(shí)線)并用一個(gè)傳導(dǎo)監(jiān)控器即時(shí)測定乙腈的濃度(虛線)。收集各部分并用酶聯(lián)免疫吸附測定來檢測DmAMP1-CRP和RsAFP2-CRP。使用粗體的峰號表示DmAMP1-CRP的存在,用斜體的峰號表示RsAFP2-CRP的存在。
圖17顯示了由pFAJ3105、pFAJ3106和pFAJ3108構(gòu)建體編碼的多蛋白前體的氨基酸序列。虛線表示為了簡潔而從完整序列作了省略。斜體書寫的序列是DmAMP1的引導(dǎo)肽,下劃線的序列是成熟的DmAMP1,黑體的序列是接頭肽。下劃雙線的序列是成熟的RsAFP2。箭頭指代根據(jù)N-末端測序和純化的DmAMP1-CRP和RsAFP2-CRP的質(zhì)譜分析得到的加工位點(diǎn)。
圖18顯示了用pFAJ3106構(gòu)建體轉(zhuǎn)化的擬南芥屬植物(轉(zhuǎn)化株9)細(xì)胞外液體部分的反相色譜(RPC)結(jié)果。反相色譜法的執(zhí)行和各部分的分析如圖15的圖注所述。使用粗體的峰號表示DmAMP1-CRP的存在,用斜體的峰號表示RsAFP2-CRP的存在。
圖19顯示了用3108構(gòu)建體轉(zhuǎn)化的擬南芥屬植物(轉(zhuǎn)化株9)提取物的反相色譜(RPC)結(jié)果。樣品是來自離子交換色譜法的一個(gè)部分,指示DmAMP1-CRPs或RsAFP2-CRPs的存在,也就是說,那些部分在0.17-0.33M的NaCl之間洗脫并指示DmAMP1-CRPs的存在。反相色譜法的執(zhí)行和各部分的分析如圖15的圖注所述。使用粗體的峰號表示DmAMP1-CRP的存在。
圖20是pFAJ3105、pFAJ3343、pFAJ3344、pFAJ3345、pFAJ3346和pFAJ3369構(gòu)建體的編碼區(qū)示意圖。完整的箭頭表示實(shí)驗(yàn)確定的裂解位點(diǎn)。開放的箭頭表示假定的裂解位點(diǎn)??s寫詞SP DmAMP1:DmAMP1的信號肽區(qū)(參見圖1);DmAMP1:DmAMP1的成熟蛋白區(qū)(參見圖1);RsAFP2:RsAFP2的成熟蛋白區(qū)(Terras等,1995,植物細(xì)胞,7,573-588)。充分出示了接頭肽序列(SEQ ID NO 3,29,21-24分別出示)。
圖21是具有SEQ ID NO 24接頭肽的pFAJ3367構(gòu)建體編碼區(qū)的示意圖。縮寫詞SP DmAMP1:DmAMP1的信號肽區(qū)(參見圖1);DmAMP1:DmAMP1的成熟蛋白區(qū)(參見圖1);RsAFP2:RsAFP2的成熟蛋白區(qū)(Terras等,1995,植物細(xì)胞,7,573-588);HsAFP1:HsAFP1的成熟蛋白區(qū)(Osborn等,1995,歐洲生物化學(xué)協(xié)會聯(lián)合會刊368,257-262);AceAMP1:AceAMP1的成熟蛋白區(qū)(Cammue等,植物生理學(xué)109,445-455)。
圖22是pFAJ3106-2、pFAJ3107-2和pFAJ3108-2構(gòu)建體編碼區(qū)的示意圖。縮寫詞SP DmAMP1:DmAMP1的信號肽區(qū)(參見圖1);DmAMP1:DmAMP1的成熟蛋白區(qū)(參見圖1);RsAFP2:RsAFP2的成熟蛋白區(qū)(Terras等,1995,植物細(xì)胞,7,573-588);RSKex2p:Kex2蛋白酶的識別序列(IGKR)(Jiang和Rogers,1999,植物生理學(xué)18,23-32);AcAMP1:AcAMP1的成熟蛋白區(qū)(De Bolle等,植物分子生物學(xué)31,997-1008)。接頭前肽序列如SEQ ID NOs 25,26和27中所分別充分展示的那樣。
圖23是pFAJ3368和pFAJ3370構(gòu)建體編碼區(qū)的示意圖。開放箭頭指示假定的裂解位點(diǎn)??s寫詞SP DmAMP1:DmAMP1的信號肽區(qū)(參見圖1);DmAMP1:DmAMP1的成熟蛋白區(qū)(參見圖1);RsAFP2:RsAFP2的成熟蛋白區(qū)(Terras等,1995,植物細(xì)胞,7,573-588);2A序列口蹄疫病毒多蛋白的裂解識別位點(diǎn)。接頭前肽序列如SEQ IDNO 28中所分別充分展示的那樣。
圖24顯示了包含在pFAJ3343質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 30)和相應(yīng)的氨基酸序列(SEQID NO 31)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO29)。
圖25顯示了包含在pFAJ3344質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 32)和相應(yīng)的氨基酸序列(SEQID NO 33)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO21)。
圖26顯示了包含在pFAJ3345質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 34)和相應(yīng)的氨基酸序列(SEQID NO 35)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO22)。
圖27顯示了包含在pFAJ3346質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 36)和相應(yīng)的氨基酸序列(SEQID NO 37)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO23)。
圖28顯示了包含在pFAJ3369質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 38)和相應(yīng)的氨基酸序列(SEQID NO 39)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO24)。
圖29顯示了包含在pFAJ3347質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列和相應(yīng)的氨基酸序列。在相應(yīng)于成熟DmAMP1、成熟RsAFP2、成熟HsAFP1和成熟AceAMP1的氨基酸下面分別劃單線、雙線、虛線和點(diǎn)線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQID NO 24)。
圖30顯示了包含在pFAJ3106-2質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 42)和相應(yīng)的氨基酸序列(SEQID NO 43)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO 4)。
圖31顯示了包含在pFAJ3107-2質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 44)和相應(yīng)的氨基酸序列(SEQID NO 45)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO 6)。
圖32顯示了包含在pFAJ3108-2質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 46)和相應(yīng)的氨基酸序列(SEQID NO 47)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO 7)。
圖33顯示了包含在pFAJ3370質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 48)和相應(yīng)的氨基酸序列(SEQID NO 49)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。接頭肽用粗體字體表示(SEQ ID NO 28),并具有用粗斜體表示的相應(yīng)于2A序列的氨基酸。
圖34顯示了包含在pFAJ3368質(zhì)粒NcoⅠ和SacⅠ位點(diǎn)之間的開放閱讀框區(qū)域的核酸序列(SEQ ID NO 50)和相應(yīng)的氨基酸序列(SEQID NO 51)。在相應(yīng)于成熟DmAMP1和成熟RsAFP2的氨基酸下面分別劃單線和雙線。相應(yīng)于內(nèi)部接頭肽的氨基酸用粗體(SEQ ID NO24)。接頭肽用粗體字體表示,并具有用粗斜體表示的相應(yīng)于2A序列的氨基酸。
下列實(shí)施例對本發(fā)明進(jìn)行說明。
實(shí)施例1克隆DmAMP1 cDNA和DmAMP1基因克隆程序和多聚酶鏈反應(yīng)(PCR)程序按標(biāo)準(zhǔn)規(guī)程執(zhí)行(Sambrook等,1989,分子克隆實(shí)驗(yàn)手冊,第2版,Cold Spring Harbor實(shí)驗(yàn)室出版,Cold Spring Harbor,紐約)。用從光滑大麗花(Dahliamerckii)收集的接近干燥的種子建立一個(gè)cDNA文庫。用Jepson I等人的方法(1991,植物分子生物學(xué)報(bào)告9,131-138),從這些種子中純化出總RNA。從2g的光滑大麗花種子中獲得0.6mg的總RNA。用PolyATract磁珠(Promega)從0.2mg總RNA中分離出將近2μg的poly-A+RNA。
利用一個(gè)ZAP-cDNA合成試劑盒(Stratagene),用poly-A+RNA構(gòu)建一個(gè)cDNA文庫。在第一和第二股鏈合成之后,把cDNA和載體DNA連接在一起。在用Gigapack Gold(Stratagene)包裹提取物進(jìn)行的噬菌體組裝之后,得到將近1×105個(gè)噬菌斑形成單位(pfu)。使用基于DmAMP1的N-末端序列CEKASKTW(SEQ ID NO.14)的寡核苷酸AFP-5(5’-TG(T,C)GANAANGCN(A,T)(G,C)NAA(A,G)ACNTGG)(SEQ ID NO.13)(Osborn R.W.等,1995,歐洲生物化學(xué)協(xié)會聯(lián)合會刊368,257-262)和基于DmAMP1的C-末端序列MCFCYFNC(SEQ ID NO.53)的AFP-3EX(5’-CA(A,G)AANTANCANAAA(A,G)CACAT)(SEQ ID NO.52)以及從光滑大麗花葉子中分離的基因組DNA,生成一種144個(gè)堿基對的PCR產(chǎn)物,并從瓊脂糖凝膠中分離出來。PCR產(chǎn)物被克隆進(jìn)pBluescript。插入的10個(gè)轉(zhuǎn)化體被測序。序列代表3個(gè)近乎同源的DmAMP1-類基因,其中的PCR克隆4編碼所觀察到的成熟DmAMP1。用32P CTP標(biāo)記的144個(gè)堿基對的PCR產(chǎn)物混合物被用來探測從含有cDNA文庫總共6×104個(gè)噬菌斑形成單位的培養(yǎng)盤中制得的Hybond N(Amersham)濾片。獲得了30個(gè)可能的陽性信號。挑取22個(gè)噬菌斑并再進(jìn)行兩輪的篩選。體內(nèi)切除后,13個(gè)克隆通過DNA測序來表征。4類DmAMP1相關(guān)肽由13個(gè)cDNA克隆編碼。三種形式的DmAMP1成熟蛋白區(qū)在4種類型中體現(xiàn)。一種類型(Dm2.5類型)包括一個(gè)可能相應(yīng)于DmAMP2的成熟蛋白區(qū)(OsbornR.W.等,1995,歐洲生物化學(xué)協(xié)會聯(lián)合會刊368,257-262)。沒有一個(gè)cDNA編碼一種相當(dāng)于所觀察的成熟DmAMP1肽序列的成熟蛋白區(qū)。
應(yīng)用PCR克隆4的序列(上述)和從cDNA推論的肽N-末端和C-末端信息,設(shè)計(jì)了兩對寡核甘酸用于擴(kuò)增編碼DmAMP1的基因。來自光滑大麗花的基因組DNA與寡核甘酸MATAFP-5P(5’-ATGGC(C,G)AAN(A,C)(A,G)NTC(A,G)GTTGCNTT)(SEQ ID NO.66)和MATAFP-5(5’-AAACACATGTGTTTCCCATT)(SEQ ID NO.54)一起被應(yīng)用于PCR反應(yīng),PCR產(chǎn)物被克隆到pBluescript并對克隆測序。含有DmAMP1基因5’部分的一個(gè)克隆被鑒定。來自光滑大麗花的基因組DNA與MATAFP-3(5’-AGCGTGTCATGTGCGTAAT)(SEQ ID NO.55)和DM25MAT-3(5’-TAAAGAAACCGACCCTTTCACGG)(SEQ ID NO.56)一起被用于PCR反應(yīng),PCR產(chǎn)物被克隆到pBluescript并對克隆測序。含有DmAMP1基因5’部分的一個(gè)克隆被鑒定。成熟基因的5’和3’區(qū)域被結(jié)合起來組裝DmAMP1基因的編碼區(qū)序列(圖1)。
DmAMP1基因編碼的前體含有一個(gè)28個(gè)氨基酸的引導(dǎo)肽、一個(gè)50個(gè)氨基酸的成熟蛋白和一個(gè)40個(gè)氨基酸的C-末端前肽。開放閱讀框被定位在引導(dǎo)肽區(qū)域內(nèi)部的一個(gè)92個(gè)堿基對的內(nèi)含子打斷。為了從DmAMP1基因序列中刪除內(nèi)含子,并允許把含有或不合C-末端前肽區(qū)的DmAMP1的編碼區(qū)克隆進(jìn)一個(gè)表達(dá)盒載體,執(zhí)行了兩個(gè)PCR反應(yīng)。其分別用引物DMVEC-3(5’ATGCATCCATGGTGAATCGGTTGCGTTCTCCGCGTTCGTTCTGATCCTTTCGTGCTCGATCTCAGATATCGCATCCGTTAGTGGAGAACTATGCGAGAAA)(SEQ ID NO.57)和DMVEC-2(5’AAACCGACCGAGCTCACGGATGTTCAACGTTTGGAAC)(SEQ ID NO.58),以及DMVEC-3和DMVEC4(5’-AGCAAGCTTTTCGGGAGCTCAATTGAAGTAA)(SEQ ID NO.59)。DMVEC-3引導(dǎo)DmAMP1基因的頂部鏈,相應(yīng)于沒有內(nèi)含子的引導(dǎo)肽區(qū)并在轉(zhuǎn)錄起點(diǎn)導(dǎo)入一個(gè)NcoⅠ位點(diǎn)。DMVEC-2基因引導(dǎo)DmAMP1基因底部鏈3’-末端的C-末端前肽區(qū)并在轉(zhuǎn)錄停止密碼子的后面導(dǎo)入一個(gè)SacⅠ位點(diǎn)。DMVEC-4基因引導(dǎo)DmAMP1基因底部鏈3’-末端的成熟蛋白區(qū),并且在該區(qū)后面融合一個(gè)終止密碼,在終止密碼子的后面導(dǎo)入一個(gè)SacⅠ位點(diǎn)。
兩個(gè)PCR產(chǎn)物都用NcoⅠ和SacⅠ切割,它們由于成熟蛋白區(qū)的一個(gè)內(nèi)部NcoⅠ位點(diǎn)的存在而把PCR產(chǎn)物裂解成兩個(gè)片段。產(chǎn)生的NcoⅠ-SacⅠ和NcoⅠ-NcoⅠ片段被順序地克隆到pMJB1質(zhì)粒。pMJB1質(zhì)粒是一個(gè)表達(dá)盒載體,依次含有一個(gè)HindⅢ位點(diǎn),增強(qiáng)的花椰花椰菜葉病35S RNA(CaMV35S)啟動(dòng)子(Kay R等,1987,科學(xué)236,1299-1302),一個(gè)XhoⅠ位點(diǎn),煙草花葉病毒(TMV)5’未翻譯的引導(dǎo)序列(Gallie D.R.和Walbot V.,1992,核酸相關(guān)研究20,4631-4638),一個(gè)多聚連接物包括NcoⅠ、SmaⅠ、KpnⅠ和SacⅠ位點(diǎn),根瘤菌3’未翻譯的終止區(qū)(Bevan M.W.等,1983,自然304,184-187)以及一個(gè)EcoRⅠ位點(diǎn)。產(chǎn)生的質(zhì)粒被分別稱為pDMAMPE(引導(dǎo)肽區(qū),成熟蛋白區(qū)和C-末端前肽區(qū))和pDMAMPD(引導(dǎo)肽區(qū)和成熟蛋白區(qū))。編碼區(qū)通過DNA測序來鑒定。
實(shí)施例2構(gòu)建植物轉(zhuǎn)化載體為了研究在植物中表達(dá)多蛋白基因的可能性,使四個(gè)不同植物轉(zhuǎn)化載體與兩個(gè)不同的植物防衛(wèi)素共表達(dá)。這兩個(gè)具有抗真菌特性并富含半胱氨酸的植物防衛(wèi)素就是RsAFP2和DmAMP1.來自DmAMP1 cDNA的一個(gè)引導(dǎo)肽,DmAMP1的成熟蛋白區(qū),一個(gè)內(nèi)部前肽區(qū)和RsAFP2的成熟蛋白區(qū)都是這些構(gòu)建物的多蛋白前體區(qū)的特征。四種構(gòu)建體只有內(nèi)部前肽不同(圖2)。
·3105構(gòu)建體用IbAMP的一個(gè)內(nèi)部前肽分隔DmAMP1和RsAFP2。
·3106構(gòu)建體在C-末端有一個(gè)前肽,由DmAMP1前肽的一部分和一個(gè)假定的枯草桿菌蛋白酶-樣蛋白酶加工位點(diǎn)(IGKR)(SEQ ID NO.67)組成。
·3107構(gòu)建體除了采用完整的DmAMP1前肽以外,其它與3106結(jié)構(gòu)相同。
·3108構(gòu)建體在C-末端有一個(gè)前肽,由DmAMP1前肽和一個(gè)假定的枯草桿菌蛋白酶-樣蛋白酶加工位點(diǎn)(IGKR)組成。
3106,3107和3108構(gòu)建物的理論基礎(chǔ)是基于我們的發(fā)現(xiàn),當(dāng)在煙草中分別作為Ac-AMP21-和DmAMP1-前蛋白原表達(dá)時(shí),AcAMP2和DmAMP1的C-末端前肽在N-末端被裂解掉,而這種加工不減少成熟蛋白到非原生質(zhì)體的分配(De Bolle等,1996,植物分子生物學(xué)31,993-1008;R.W.Osborn和S.Attenborough,個(gè)人通訊)。這表示加工酶在分泌途徑或在非原生質(zhì)體中。另一方面,這些構(gòu)建體內(nèi)部前肽C-末端的裂解可能由一個(gè)枯草桿菌蛋白酶樣的蛋白酶執(zhí)行,已知酵母中的一個(gè)這樣的蛋白酶成員(Kex2)在高爾基器裂解蛋白(Wilcox C.A和Fuller R.S.,1991,細(xì)胞生物學(xué)雜志115,297),而番茄中的一個(gè)成員在非原質(zhì)體執(zhí)行裂解(Tornero P.等,1997,生物化學(xué)雜志272,14412-14419)。在非原生質(zhì)體沉積的蛋白通常通過包括高爾基器的分泌途徑合成。非原生質(zhì)體是設(shè)計(jì)在轉(zhuǎn)基因植物中的抗菌蛋白更喜歡的沉積位點(diǎn)(Jongedijk E等,1995,Euphytica 85,173-180;De Bolle等,1996,植物分子生物學(xué)31,993-1008)。也構(gòu)建一個(gè)只表達(dá)DMAMP1的構(gòu)建體(3109構(gòu)建體,圖7)。
圖3-7分別顯示了所制備的植物轉(zhuǎn)化載體pFAJ3105、pFAJ3106、pFAJ3107、pFAJ3108和pFAJ3109的示意圖。包含在這些質(zhì)粒XhoⅠ和SacⅠ位點(diǎn)之間的核甘酸序列,包括抗菌蛋白編碼區(qū),在圖8-13中介紹。包含在pFAJ3105質(zhì)粒XhoⅠ和SacⅠ位點(diǎn)之間的區(qū)域(圖8所示),按照Pont-Kindom G.A.D.的兩步PCR程序(1994,生物技術(shù)16,1010-1011)來構(gòu)建。引物OWB175(5’AGGAAGTTCATTTGG)和(SEQ ID NO.68),OWB278(5’GCCTTTGGCACAACTTCTGTCCTGGCTCCACGTCCTCTGGGGTAGCCACCTCGTCAGCAGCGTTGGAACAATTGAAGTAACAAACAC)(SEQ ID NO.60)在第一個(gè)PCR反應(yīng)中被應(yīng)用,并用質(zhì)粒pDMAMPE作為模板。第二個(gè)PCR反應(yīng)使用質(zhì)粒pFRG4(Terras F.R.G.等,1995,植物細(xì)胞7,573-588)作為模板,用第一個(gè)PCR反應(yīng)產(chǎn)物、引物OWB175和引物OWB172(5’TTAGAGCTCCTATTAACAAGGAAAGTAGC(SEQ ID NO.61),SacⅠ位點(diǎn)下劃線)的混合物作為引物。形成的PCR產(chǎn)物用XhoⅠ和SacⅠ消化并克隆到表達(dá)盒載體pMJB1(參見上面)。所產(chǎn)生的質(zhì)粒被稱作pFAJ3099,其中的表達(dá)盒用HindⅢ(側(cè)面連接花椰花椰菜葉病毒35S啟動(dòng)子的5’末端)和EcoRⅠ(側(cè)面連接胭脂堿合成酶終止子的3’末端)來消化,并克隆到植物轉(zhuǎn)化載體pGPTVbar的相應(yīng)位點(diǎn)(Becker D等,1992,植物分子生物學(xué)20,1195-1197)以產(chǎn)生pFAJ3105質(zhì)粒。
質(zhì)粒pFAJ3106、pFAJ3107和pFAJ3108的構(gòu)建類似,除了第一次PCR反應(yīng)中的引物OWB278分別用下列引物代替OWB279( 5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATGAGTTCGGCTTTAAGTTTGTC)(SEQ ID NO.62);OWB303(5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATCGGAGTTCAACGTTTGGAACC)(SEQ ID NO.63);OWB304(5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATAGTTTTGGTGGCAGCAACATCAGGCTTGGTGATCCACAGTAGTAGTACTGGCACAATTGAAGTAACAGAAACAC)(SEQ ID NO.64);質(zhì)粒pFAJ3109是通過把質(zhì)粒pDMAMPD的HindⅢ-EcoRⅠ片段(參見上面)克隆到植物轉(zhuǎn)化載體pGPTVbar的相應(yīng)位點(diǎn)(參見上面)來構(gòu)建的。
實(shí)施例3植物轉(zhuǎn)化按照Bechtold N.等的花序滲入法(1993,C.R.科學(xué)學(xué)會316,1194-1199),用重組的根瘤土壤桿菌轉(zhuǎn)化擬南芥(Arabidopsisthaliana)的Columbia-O生態(tài)型。轉(zhuǎn)化株在沙子/珍珠巖混合物中選擇,用含有終濃度為5mg/l的除草劑Basta(Agrevo)的水地下灌溉以有活性膦絲菌素成分。
實(shí)施例4測定靶蛋白,包括酶聯(lián)免疫吸附(ELISA)測定和蛋白分析在用RsAFP2(按照Tetras F.R.G.等,1992,生物化學(xué)雜志267,15301-15309中的描述純化)或DmAMPl按照Osborn R.W.等,1995,歐洲生物化學(xué)協(xié)會聯(lián)合會刊368,257-262中的描述純化)注射的兔子體內(nèi)引發(fā)抗血清?;救鏟ennninckx I.A.M.A.等(1996,植物細(xì)胞8,2309-2323)所描述的那樣,把酶聯(lián)免疫吸附(ELISA)測定作為一種競爭型分析來建立。用溶在涂層緩沖液中的50ng/mlRsAFP2或DmAMPl來處理ELISA微量滴定板。初級抗血清在含3%(質(zhì)量/體積)明膠和0.05%(體積比)Tween20的PBS中稀釋成1000-和2000-倍的溶液(DmAMP1和RsAFP2,分別地)來使用。
總蛋白量根據(jù)Bradford(1976,生物化學(xué)年刊72,248-254)的方法,用牛血清白蛋白作為標(biāo)準(zhǔn)物來測量。
擬南芥植物的葉子在液氮中勻漿并用一種由10mM NaH2PO4、15mMNa2HPO4、100mM KCl、1.5mM NaCl組成的緩沖液抽提。組織勻漿在85℃加熱10分鐘并在冰上冷卻。加熱處理的提取物在15000×g離心15分鐘并被注入到一個(gè)反相高壓液相色譜柱(RT-HPLC),該柱由用0.1%(體積比)三氟乙酸(TFA)平衡過的C8二氧化硅(0.46×25cm,Rainin)組成。柱子以1ml/min的流速用0.1%(體積比)三氟乙酸中15%到50%(體積比)線性梯度的乙腈洗脫35分鐘。測定洗脫物在214nm的光吸收,收集1ml的各級分,分級分離并在最后重新溶入水中。這些級分用于酶聯(lián)免疫吸附(ELISA)測定。
實(shí)施例5制備細(xì)胞內(nèi)提取物通過把擬南芥屬植物的葉子浸入一個(gè)含有提取緩沖液(10mMNaH2PO4、15mM Na2HPO4、100mM KCl、1.5mM NaCl)的燒杯中,從植物葉子中收集細(xì)胞內(nèi)液體。盛有葉子的燒杯被放在真空容器中并連續(xù)六輪抽真空2分鐘,然后突然真空釋放。浸透的葉子被輕輕地放到一個(gè)離心管里,與管底刻度分離。1800×g離心15分鐘后從底部收集細(xì)胞內(nèi)液體。將葉子再一次真空浸透并離心,得到的(細(xì)胞外)液體與第一步真空所得的部分結(jié)合。在這一步之后,在一個(gè)Phastprep(BI0101/Savant)往復(fù)震蕩器中對葉子進(jìn)行抽提,并且通過離心(10,000×g10分鐘)凈化抽提物。產(chǎn)生的上清被認(rèn)為是胞內(nèi)提取物。
在一系列用上述結(jié)構(gòu)轉(zhuǎn)化的T1轉(zhuǎn)基因擬南芥屬植物的葉子中,分析DmAMP1和RsAFP2的表達(dá)水平。在表1中給出上述基于酶聯(lián)免疫吸附測定的表達(dá)分析結(jié)果。
表1Dm-AMP1和Rs-AFP2在轉(zhuǎn)基因擬南芥屬植侏中的表達(dá)水平
在上表不“nd”指未作實(shí)驗(yàn)。
大多用3105、3106、3107和3108多蛋白構(gòu)建體轉(zhuǎn)化的測試株,明顯表達(dá)DmAMP1-CRPs(DmAMP1-交叉反應(yīng)蛋白)和RsAFP2-CRPs(PsAFP2-交叉反應(yīng)蛋白)。DmAMP1-CRP和RsAFP2-CRP表達(dá)水平之間基本上有一個(gè)很好的相關(guān)性。然而,RsAFP2-CRP的水平大體上比DmAMP1-CRP的水平低2-5倍。而檢測抽提物中RsAFP2-CRPs的酶聯(lián)免疫吸附測定不如DmAMP1-CRPs的酶聯(lián)免疫吸附測定可信。在RsAFP2的酶聯(lián)免疫吸附測定中,轉(zhuǎn)基因植物提取物稀釋液產(chǎn)生的劑量-反應(yīng)曲線偏離了那些含有真正RsAFP2的標(biāo)準(zhǔn)稀釋液的劑量-反應(yīng)曲線,表明提取物中的大多數(shù)Rs-AFP2-CRPs在免疫學(xué)上不同于RsAFP2自身。用3106、3107和3108構(gòu)建體轉(zhuǎn)化的植物的提取物與用3105構(gòu)建體轉(zhuǎn)化的植物的提取物相比,前者從RsAFP2標(biāo)準(zhǔn)劑量-反應(yīng)曲線的偏離更明顯。
沒有一種提取物在Dm-AMP1的酶聯(lián)免疫吸附測定中,在劑量-反應(yīng)曲線上偏離Dm-AMP1的標(biāo)準(zhǔn)物。用3105、3106、3107或3108多蛋白構(gòu)建體轉(zhuǎn)化的植株與那些用單一蛋白構(gòu)建體3109轉(zhuǎn)化的植株相比,前者的DmAMP-CRP水平遠(yuǎn)高于后者。這也在圖3中舉例說明,其中對用多蛋白構(gòu)建體3105轉(zhuǎn)化的植物的DmAMP1-CRP表達(dá)水平和用單一蛋白構(gòu)建體3109轉(zhuǎn)化的植物的DmAMP1-CRP表達(dá)水平進(jìn)行了比較。迄今為止,還沒有文獻(xiàn)報(bào)道說轉(zhuǎn)基因植物的一種肽的表達(dá)水平能高達(dá)總蛋白的4%(例如,植株3105-15和3105-18中的DmAMP1-CRP水平,參見表1)。因此,應(yīng)用多蛋白構(gòu)建體似乎導(dǎo)致了明顯增強(qiáng)的表達(dá)水平,這是一個(gè)意外的發(fā)現(xiàn)。
實(shí)施例6分離從多蛋白前體加工的蛋白轉(zhuǎn)基因植株選自用3105結(jié)構(gòu)(植株1)或3106結(jié)構(gòu)(植株2)轉(zhuǎn)化的群體。并且所選植株被進(jìn)一步繁殖以獲得轉(zhuǎn)基因純合子植物。為了分析DmAMP1和RsAFP2在這些植株中是否被正確加工,如實(shí)施例1中所述制備植物的提取物并通過在C8-二氧化硅柱上進(jìn)行的反相-高壓液相色譜法來分離。收集各級分并如實(shí)施例4所述,用酶聯(lián)免疫吸附測定鑒定是否存在與DmAMP1抗體或RsAFP2抗體有交叉反應(yīng)的化合物。如圖15所示,在用3105構(gòu)建體轉(zhuǎn)化以及用3106構(gòu)建體轉(zhuǎn)化植株中,DmAMP1-CRPs在一個(gè)與真正DmAMP1相同或非常相近的位置洗脫。同樣,在3105和3106構(gòu)建體的轉(zhuǎn)化株中都檢測到RsAFP2-CRPs在一個(gè)與真正RsAFP2相同或非常相近的位置洗脫。沒有一種組分與抗-DmAMP1和抗-RsAFP2的抗體都反應(yīng),這表明提取物中不存在沒有被裂解的融合蛋白。在非轉(zhuǎn)化的植株中沒有發(fā)現(xiàn)交叉反應(yīng)的化合物。
這樣看來,3105構(gòu)建體(IbAMP內(nèi)部前肽作為接頭肽)和3106構(gòu)建體(具有枯草桿菌蛋白酶-樣蛋白酶位點(diǎn)的部分DmAMP1 C-末端前肽作為接頭肽)轉(zhuǎn)錄單元的原始翻譯產(chǎn)物以某種方式被加工,產(chǎn)生分離的DmAMP1-CRPs和RsAFP2-CRPs,在色譜性質(zhì)上似乎分別與DmAMP1和RsAFP2相同或非常相近。
實(shí)施例7共表達(dá)的植物防衛(wèi)素的亞細(xì)胞定位分析為了檢測共表達(dá)的植物防衛(wèi)素是被分泌到細(xì)胞外還是沉積在細(xì)胞內(nèi),從用3105構(gòu)建體(植株2)、3106構(gòu)建體(植株2)或3108構(gòu)建體(植株12)轉(zhuǎn)化的純合子轉(zhuǎn)基因阿布屬植株的葉子中獲得細(xì)胞外液和細(xì)胞內(nèi)提取組分。細(xì)胞溶質(zhì)的葡萄糖-6-磷酸脫氫酶被用作標(biāo)記物,檢測細(xì)胞外液被細(xì)胞內(nèi)部組分污染的情況。如表2所示,葡萄糖-6-磷酸脫氫酶以大約80/20的比例在細(xì)胞內(nèi)提取部分和細(xì)胞外液體部分之間分配。相反,發(fā)現(xiàn)所檢測轉(zhuǎn)基因植物的大多數(shù)DmAMP1-CRP和RsAFP2-CRP含量在細(xì)胞外液體部分中。這些結(jié)果表明,從多蛋白前體釋放的兩種植物防衛(wèi)素都主要沉積在非原生質(zhì)體。因此,所有多蛋白結(jié)構(gòu)裂解的加工步驟一定在非原生質(zhì)體或分泌途徑即內(nèi)質(zhì)網(wǎng)、高爾基器或在高爾基器和非原生質(zhì)體之間進(jìn)行運(yùn)輸?shù)男∨葜邪l(fā)生。
表2從轉(zhuǎn)基因擬南芥屬植物獲取的細(xì)胞外液(EF)和細(xì)胞內(nèi)提取(IE)成分中,葡萄糖-6-磷酸脫氫酶(GPD)活性、DmAMP1和RsAFP2的相對豐度。構(gòu)建體 相對豐度(%)1GPDDmAMP1 RsAFP2EFIEEFIE EFIEpFAJ31051783937928pFAJ31061783946604pFAJ310820809827525
1相對豐度用細(xì)胞外液和細(xì)胞內(nèi)提取部分含量總和的百分?jǐn)?shù)表示。
實(shí)施例8純化從多蛋白前體3105構(gòu)建體加工而來的蛋白來自3105構(gòu)建體轉(zhuǎn)化群體的轉(zhuǎn)基因植株14被進(jìn)一步繁殖,以獲得轉(zhuǎn)基因的純合子植物。在這一轉(zhuǎn)化植株葉子制備的細(xì)胞外液中,通過反相色譜技術(shù)純化DmAMP1-CRPs和RsAFP2-CRPs。為了達(dá)到這個(gè)目的,葉子用一種含50mM MES(pH6)的緩沖液和一種蛋白酶抑制物混合物(1mM苯甲基磺酰氟,1mM N-乙基順丁烯二酰亞胺,5mM EDTA和0.02mM胃酶抑素A)在真空浸透,離心收集細(xì)胞外液。用這一勻漿處理過程避免了將DmAMP1-CRPs和RsAFP2-CRPs暴露給隔開的蛋白酶。收集的細(xì)胞外液通過在C8-二氧化硅柱上(Microsorb-MV,4.6×250mm,Rainin)進(jìn)行的反相-高壓液相色譜來分析,分別用抗DmAMP1和RsAFP2的抗體,通過酶聯(lián)免疫吸附測定檢測各部分的DmAMP1-CRPs和RsAFP2-CRPs存在情況。圖15顯示了用3105構(gòu)建體轉(zhuǎn)化的擬南芥屬轉(zhuǎn)基因植株14的這種分析結(jié)果。DmAMP1-CRPs在兩個(gè)峰洗脫,后一個(gè)洗脫峰的位置非常接近真正DmAMP1的洗脫位置。發(fā)現(xiàn)RsAFP2-CRPs在一個(gè)與DmAMP1-CRPs的峰很好分離的峰洗脫,并且洗脫位置非常接近真正RsAFP2的洗脫位置。沒有一部分與抗-DmAMP1和抗-RsAFP2的抗體都反應(yīng),這表明細(xì)胞外液中不存在沒有被裂解的融合蛋白。基于DmAMP1-CRPs和RsAFP2-CRPs的峰值面積分別與其他一系列由真正的DmAMP1和RsAFP2組成的標(biāo)準(zhǔn)物的峰值面積的比較,可以斷定3105構(gòu)建體轉(zhuǎn)化株的提取物包含大約等量的DmAMP1-CRPs和RsAFP2-CRPs。通過分析從轉(zhuǎn)基因株制備的細(xì)胞外液,得到非常相似的色譜圖(結(jié)果未出示),表明DmAMP1-CRPs和RsAFP2-CRPs的色譜形式與所檢測的轉(zhuǎn)基因株無關(guān)。
為了檢測基于細(xì)胞外液制備的純化過程是否反映了轉(zhuǎn)基因擬南芥植物葉子中DmAMP1-CRPs和RsAFP2-CRPs的真實(shí)組成,開發(fā)了一個(gè)替代的純化過程,該過程從葉子的粗提物開始。為此目的,葉子在液氮中勻漿并用50mM含有一種蛋白酶抑制劑混合物(1mM苯甲基磺酰氟,1mM N-乙基順丁烯二酰亞胺,5mM EDTA和0.02mM胃酶抑素A)的MES(pH6)提取。勻漿物通過離心(10000×g,10分鐘)凈化。上清然后通過離子交換層析(ICE)和隨后的反相色譜分離(RPC)。在每次分離之后,收集各部分并用抗DmAMP1和RsAFP2的抗體通過兩種不同的酶聯(lián)免疫吸附測定分別檢測DmAMP1-CRPs和RsAFP2-CRPs。通過使提取物經(jīng)過一個(gè)pH6的陽離子交換柱(Mono S,5×50mm,Pharmacia),來進(jìn)行離子交換層析。當(dāng)用pH 6的50mM N-嗎啉代乙磺酸(MES)中0-0.5M線性梯度的NaCl洗脫柱子時(shí),在0.17-0.33MNaCl之間洗脫的部分檢測有DmAMP1-CRPs,而RsAFP2-CRPs在0.24-0.49M NaCl之間洗脫。含有DmAMP1-CRPs或RsAFP2-CRPs的各級分被集中成兩部分(0.17-0.33M NaCl;0.24-0.49M NaCl),其中每一部分都在C8-二氧化硅柱上(Microsorb-MV,4.6×250mm,Rainin)進(jìn)行反相色譜分析,用一個(gè)線性濃度梯度的乙腈洗脫(圖16)。DmAMP1-CRPs在兩個(gè)峰洗脫,后一個(gè)洗脫峰的位置非常接近真正DmAMP1的洗脫位置。發(fā)現(xiàn)RsAFP2-CRPs在一個(gè)與DmAMP1-CRPs的峰很好分離的峰洗脫,并且洗脫位置非常接近真正RsAFP2的洗脫位置。仍然沒有一部分與抗-DmAMP1和抗-RsAFP2的抗體都反應(yīng),表明提取物中不存在沒有被裂解的融合蛋白。
從細(xì)胞外液純化的不同DmAMP1-CRPs和RsAFP2-CRPs受到N-末端序列分析(程序如Cammue等在1992,生物化學(xué)雜志,2228-2233中描述)還受到基質(zhì)輔助激光解吸流失電離時(shí)間(Matrix-assistedtaser desorption ioniration-time of flight)(MALDI-TOF)的質(zhì)譜分析(Mann和Talbo,1996,當(dāng)前生物技術(shù)評論7,11-19)。C-末端氨基酸的測定基于實(shí)驗(yàn)測得的預(yù)測理論質(zhì)譜的最好近似值(表3)。較小的DmAMP1-CRPs,p3105EF1和較大的DmAMP1-CRP,p3105EF2(蛋白編碼如圖15和表3),都與成熟DmAMP1有完全相同的N-末端序列。p3105EF1和p3105EF2與真正的DmAMP1相比較,它們有與C-末端一個(gè)額外存在的絲氨酸殘基相一致的色譜。然而,當(dāng)p3105EF2的色譜(在實(shí)驗(yàn)誤差內(nèi))完全相應(yīng)于為具有一個(gè)C-末端絲氨酸的DmAMP1(此后稱為DmAMP1+S)所預(yù)測的色譜時(shí),p3105EF1的色譜對于DmAMP1+S的預(yù)測色譜,大約超過了8道爾頓。因此,蛋白可能是具有還原二硫鍵的DmAMP1+S衍生物。根據(jù)N-末端序列和質(zhì)譜數(shù)據(jù),RsAFP2-CRP的p3105EF3部分是一個(gè)在N-末端具有額外五肽序列DVEPG的RsAFP2衍生物。這個(gè)蛋白更多被稱為DVEPG+RsAFP2。用同樣的方法分析從總的葉子提取物中所純化的不同DmAMP1-CRPs和RsAFP2-CRPs。分析結(jié)果表明總的葉子提取物中存在相同的分子形式,即DmAMP1+S,一種推定的DmAMP1+S還原形式,以及DVEPG+RsAFP2(參見下文實(shí)施例10的表3)。
包括主要加工產(chǎn)物的純化級分,DmAMP1+S以及DVEPG+RsAFP2,分別根據(jù)Cammue等所述的方法(1992,生物化學(xué)267,2228-2233),用黃色鐮孢(Fusarium culmorum)進(jìn)行抗菌活性檢測,以所檢測生物體50%生長抑制所需要的蛋白濃度來表示特異的抗菌活性,DmAMP1+S與真正DmAMP1的特異抗菌活性相同。純化DVEPG+RsAFP2的特異抗菌活性大約低于真正RsAFP2的2倍。DVEPG+RsAFP2抗菌活性的輕微下降很可能是由于N-末端5個(gè)氨基酸的存在。然而,我們的數(shù)據(jù)證明轉(zhuǎn)基因植物中多蛋白前體的加工可能導(dǎo)致釋放生物活性蛋白。
對3105構(gòu)建體轉(zhuǎn)化的植物中產(chǎn)生的AFPs進(jìn)行分析,揭示前體顯然通過三個(gè)裂解步驟來加工(圖17)(ⅰ)前體在引導(dǎo)肽的C-末端以與作用于真正DmAMP1前體相同的方式進(jìn)行裂解;(ⅱ)前體在接頭肽第一個(gè)氨基酸的C-末端裂解,這樣釋放了DmAMP1+S;(ⅲ)前體在接頭肽第五個(gè)末尾殘基的N-末端進(jìn)一步加工,這樣釋放了DVEPG+RsAFP2。還不知道哪些蛋白酶引起了這些觀測的裂解,也不知道涉及了多少蛋白酶。接頭肽的裂解可能只包括蛋白酶內(nèi)切,或者是蛋白內(nèi)切酶和在裂解產(chǎn)物末端進(jìn)一步剪切的外肽酶協(xié)同作用的結(jié)果。接頭肽C-末端的加工在E和D兩個(gè)酸性殘基之間進(jìn)行,這對酸性殘基可能是一個(gè)特異性蛋白內(nèi)切酶的靶序列。以前已經(jīng)從擬南芥植物種子中純化了一種能夠在兩個(gè)連續(xù)酸性殘基之間進(jìn)行裂解的天冬氨酸蛋白內(nèi)切酶(D’Hont等,1993,生物化學(xué)雜志268,20884-20891)。值得提到的是,在IbAMP1多蛋白前體的六個(gè)內(nèi)部前肽中有五個(gè)的ED序列恰好發(fā)生在前肽的C-末端(Tailor等,1997,生物化學(xué)雜志272,24480-24487)。六個(gè)IbAMP1內(nèi)部前肽中的一個(gè),更準(zhǔn)確說是在3105構(gòu)建體中所用的那個(gè),其ED序列不發(fā)生在前肽的C-末端,而被4個(gè)氨基酸從C-末端分開。鳳仙花中這個(gè)前肽的加工可能包括ED序列的裂解以及隨后用一種氨肽酶對所產(chǎn)生蛋白進(jìn)行的N-末端局部修剪。
所期望的是,一種類似于3105構(gòu)建體中應(yīng)用的IbAMP1前肽但其ED二肽被移到C-末端的前肽,將產(chǎn)生一種裂解產(chǎn)物,該產(chǎn)物在內(nèi)部前肽C-末端定位的蛋白中只有一個(gè)或沒有額外的N-末端氨基酸。換句話說,C-末端已經(jīng)具有一個(gè)ED序列的另一種IbAMP1前肽(Tailor等,1997,生物化學(xué)雜志272,24480-24487)或一個(gè)相關(guān)序列可以對加工的準(zhǔn)確度提供同樣的改進(jìn)。
實(shí)施例9純化從多蛋白前體結(jié)構(gòu)pFAJ3106中加工而來的蛋白來自用pFAJ3106結(jié)構(gòu)轉(zhuǎn)化的擬南芥屬植物群體的轉(zhuǎn)基因株9被進(jìn)一步繁殖,獲得轉(zhuǎn)基因的純合子植物。通過反相色譜法從葉子細(xì)胞外液中純化DmAMP1-CRPs和RsAFP2-CRPs,細(xì)胞外液的制備方法與上面實(shí)施例8所描述的pFAJ3105構(gòu)建體轉(zhuǎn)化株細(xì)胞外液的制備方法相同。在圖18中顯示了分離物的色譜圖。DmAMP1-CRPs在兩個(gè)峰洗脫,稱為pFAJ3106EF1和pFAJ3106EF2,這兩部分都與DmAMP1有相同的N-末端序列(參見下面實(shí)施例10的表3)。pFAJ3106EF2的質(zhì)譜相應(yīng)于為一個(gè)具有額外賴氨酸的DmAMP1衍生物所預(yù)測的質(zhì)譜。因此我們斷定它是前體在信號肽裂解位點(diǎn)和接頭肽C-末端第一個(gè)殘基(賴氨酸)之后進(jìn)行裂解的產(chǎn)物;這個(gè)蛋白更多被稱作DmAMP1+K。
通過N-末端氨基酸測序發(fā)現(xiàn)RsAFP2-CRP部分的起始序列是LIGKRQK。因此,這種被稱為LIGKRQK+RsAFP2的蛋白,來源于前體N-末端在接頭肽第六個(gè)末端殘基(谷氨酰胺)的裂解。建議的參與加工pFAJ3106結(jié)構(gòu)的裂解步驟如圖17所示。
實(shí)施例10純化從多蛋白前體構(gòu)建體pFAJ3108中加工而來的蛋白來自用pFAJ3108構(gòu)建體轉(zhuǎn)化的擬南芥屬植物群體的轉(zhuǎn)基因株9被進(jìn)一步繁殖,獲得轉(zhuǎn)基因的純合子植物。按照一種基于上面實(shí)施例8所述的用于3105轉(zhuǎn)化株的離子交換層析和反相色譜的程序,從這一轉(zhuǎn)化株的葉子總粗提物中純化DmAMP1-CRPs和RsAFP2-CRPs。在圖19中顯示了離子交換層析和反相色譜分離的色譜圖。離子交換層析分離產(chǎn)生兩個(gè)包含DmAMP1-CRPs的峰。然而,在任何一個(gè)洗脫級分都不能檢測到RsAFP2-CRPs。因?yàn)橛胮FAJ3108結(jié)構(gòu)轉(zhuǎn)化的植物的粗提物和細(xì)胞外液部分明顯存在RsAFP2-CRPs(參見表1和表2),所以RsAFP2-CRPs一定是在分離過程中丟失了。最可能的解釋是,RsAFP2-CRPs沒有被0.5M的NaCl從離子交換層析柱中洗脫出來,0.5M NaCl是洗脫梯度所用的最高濃度。含有DmAMP1-CRPs的成分通過反相色譜分離,產(chǎn)生兩個(gè)DmAMP1-CRP峰。通過N-末端測序和MALDI-TOF色譜檢測來分析這種成分,揭示它是一種C-末端具有一個(gè)額外丙氨酸的DmAMP1衍生物(DmAMP1+A)。這種蛋白是前體在信號肽裂解位點(diǎn)和接頭肽C-末端第一個(gè)殘基(丙氨酸)進(jìn)行裂解的產(chǎn)物(圖17)。
表3顯示了如圖15、16、18和19所述純化的DmAMP1-CRP和RsAFP2-CRP成分,通過MALDI-TOF-質(zhì)譜法或EI-質(zhì)譜法測定的質(zhì)譜以及通過自動(dòng)化Edman降解測定的N-末端序列。也出示了在實(shí)驗(yàn)質(zhì)譜和理論質(zhì)譜之間給出最好一致性的預(yù)測的C-末端序列。
實(shí)施例11pFAJ3105構(gòu)建體的改造從對pFAJ3105構(gòu)建體轉(zhuǎn)化的擬南芥屬植物進(jìn)行的分析可以明顯看出,多蛋白前體確實(shí)被裂解了(參見表3,圖17)。然而裂解是這樣發(fā)生的,來自接頭肽的一個(gè)氨基酸保持依附到從接頭肽N-末端定位的成熟蛋白,并且5個(gè)氨基酸保持依附到從接頭肽C-末端定位的成熟蛋白(參見圖17)。依附到成熟蛋白的接頭肽-來源的氨基酸可能會干擾這些成熟蛋白的功能性狀,為了減少這些氨基酸的數(shù)量,已經(jīng)設(shè)計(jì)了許多構(gòu)建體,以便獲得在更接近(或恰好優(yōu)選在)成熟蛋白的邊界發(fā)生的裂解。
在pFAJ3343構(gòu)建體中,已經(jīng)刪除了pFAJ3105中編碼接頭肽N-末端殘基的密碼子。預(yù)計(jì)發(fā)生的成熟DmAMP1的裂解不額外帶有任何來自接頭肽的氨基酸(圖20)。在pFAJ3344、pFAJ3345和pFAJ3346構(gòu)建體中,pFAJ3105的接頭肽C-末端密碼子已經(jīng)被改變,分別刪除了最后的2個(gè)、4個(gè)和5個(gè)殘基。預(yù)計(jì)pFAJ3344、pFAJ3345和pFAJ3346構(gòu)建體裂解后,保持依附在RsAFP2 N-末端的殘基數(shù)量將分別是3個(gè)、1個(gè)和0個(gè)(圖20)。可以構(gòu)建其它結(jié)構(gòu),其中減少了pFAJ3105構(gòu)建體中接頭肽區(qū)的N-或C-末端殘基數(shù)目。
在pFAJ3105構(gòu)建體中,接頭肽來自IbAMP前體的第四個(gè)內(nèi)部前肽(Tailor R.H.等,1997,生物化學(xué)雜志272,24480-24487)。在pFAJ3369構(gòu)建體中,這個(gè)接頭肽被IbAMP前體的第一個(gè)內(nèi)部前肽替代(Tailor R.H.等,1997,同上)。在后一個(gè)接頭前肽中,成對的酸性殘基發(fā)生在C-末端。預(yù)計(jì)發(fā)生的裂解只有一個(gè)殘基將保持依附在RsAFP2的N-末端(圖20)。
實(shí)施例12構(gòu)建一種構(gòu)建體,用來表達(dá)一種具有4個(gè)成熟蛋白區(qū)的多蛋白在pFAJ3367結(jié)構(gòu)中多蛋白區(qū)的組成是DmAMP1 cDNA的信號肽區(qū),后面有四個(gè)不同抗菌肽的編碼區(qū),每一個(gè)被IbAMP前體的第一個(gè)內(nèi)部前肽區(qū)分隔開。四個(gè)不同抗菌蛋白的編碼區(qū)順序是(見圖21)1.植物防衛(wèi)素DmAMP1(Osborn R.W.等,1995,歐洲生物化學(xué)聯(lián)合會刊368,257-262)2.植物防衛(wèi)素RsAFP2(Terras F.R.G.等,1995,植物細(xì)胞7,573-588)3.植物防衛(wèi)素HsAFP1(Osborn R.W.等,1995,歐洲生物化學(xué)聯(lián)合會刊368,257-262)4.脂質(zhì)轉(zhuǎn)移蛋白-樣蛋白AcAMP1(Cammue B.P.A.等,1995,植物生理學(xué)109,445-455)這一構(gòu)建體將產(chǎn)生四種不同的成熟抗菌蛋白(DmAMP1、RsAFP2、HsAFP1和AcAMP1),每一種蛋白都被分泌到細(xì)胞外間隙。
可以構(gòu)建其它構(gòu)建體,含有其它成熟肽區(qū)并帶有上述任何其它接頭肽。
實(shí)施例13構(gòu)建體pFAJ3106、pFAJ3107和DFAJ3108的改造由構(gòu)建體pFAJ3106、pFAJ3107和pFAJ3108構(gòu)建體編碼的多蛋白,包含在C-末端具有Kex2識別位點(diǎn)IGKR的接頭肽。Jiang L.和Rogers J.C.(1999,植物雜志18,23-32)已經(jīng)證明,在轉(zhuǎn)基因煙草中,含有一個(gè)IGKR位點(diǎn)的多蛋白不被分開或很少被分開。在IGKR序列被IGKRIGKRIGKR序列(SEQ ID NO.77)替代的多蛋白中,發(fā)現(xiàn)裂解得到提高。
構(gòu)建體FAJ3106-2、pFAJ3107-2和pFAJ3108-2除了IGKR編碼區(qū)被一個(gè)編碼IGKRIGKRIGKR的區(qū)域替代以外,其它與構(gòu)建體pFAJ3106、pFAJ3107和pFAJ3108都相同(圖22)。由這些構(gòu)建體編碼的多蛋白在接頭肽的N-末端和C-末端都能被有效斷裂。
可以構(gòu)建其它構(gòu)建體,其中減少了構(gòu)建體pFAJ3106、pFAJ3107和pFAJ3108中接頭肽區(qū)的N-或C-末端殘基數(shù)目。
實(shí)施例14基于含有2A序列的雜合接頭肽的多蛋白構(gòu)建體口蹄疫病毒(FMDV)的RNA被翻譯成一個(gè)多蛋白,該多蛋白的裂解依賴于一個(gè)被稱為2A序列的20個(gè)氨基酸的序列(Ryan和Drew,1994,EMBO雜志13,928-933)。由2A序列連接的多蛋白的裂解發(fā)生在2A序列的第19個(gè)氨基酸(G)和第20個(gè)氨基酸(P)之間,裂解作用通過一個(gè)與加工酶顯然無關(guān)的加工過程來進(jìn)行,并且其發(fā)生可能歸于G和P之間肽鍵的非正常形式(Halpin等,1999,植物雜志17,453-459)。Halpin等(1999,植物雜志17,453-459)已經(jīng)證明包含F(xiàn)MDV 2A序列作為一個(gè)接頭肽的多蛋白在植物中表達(dá)時(shí),被有效地?cái)嗔?。然而,利用FMDV 2A序列作為一個(gè)接頭肽的一個(gè)主要的缺點(diǎn)是,裂解不在接頭肽的N-末端發(fā)生。因此,相應(yīng)于FMDV 2A序列前19個(gè)殘基的一段比較長的19個(gè)氨基酸的延伸保持依附于成熟蛋白的C-末端。這段額外的19個(gè)氨基酸的延伸可能會干擾它所連接的蛋白的功能性狀。
為了解決接頭前肽裂解后不完全去除的問題,提議使用雜合的接頭肽,在其N-末端是在構(gòu)建體pFAJ3105、pFAJ3106、pFAJ3107或構(gòu)建體pFAJ3108中所描述的接頭肽的一部分,在其C-末端是FMDV 2A序列的一部分(或這種肽的一部分)?;谶@一原則的例子是pFAJ3370構(gòu)建體和pFAJ3368構(gòu)建體(圖23)。pFAJ3370構(gòu)建體具有與pFAJ3150構(gòu)建體相同的一個(gè)多蛋白區(qū),除了pFAJ3370構(gòu)建體多蛋白區(qū)的接頭肽是一個(gè)29氨基酸的肽,該肽由IbAMP前體第四個(gè)內(nèi)部前肽的前9個(gè)氨基酸(Tailor R.H.等,1997,生物化學(xué)雜志272,24480-24487)繼之以FMDV 2A序列全部20個(gè)氨基酸組成。這個(gè)接頭肽的裂解將釋放一個(gè)C-末端具有一個(gè)額外絲氨酸的成熟DmAMP1以及一個(gè)N-末端具有一個(gè)額外脯氨酸的成熟RsAFP2。
構(gòu)建體pFAJ3368與構(gòu)建體pFAJ3370相同,除了C-末端成熟蛋白區(qū)(在該情況下編碼RsAFP2)被一個(gè)編碼這個(gè)成熟蛋白區(qū)及之前一個(gè)信號肽區(qū)的區(qū)域(在該情況下編碼具有自身信號肽的RsAFP2)代替。如果在FMDV 2A序列G和P之間的裂解發(fā)生在多蛋白轉(zhuǎn)位到內(nèi)質(zhì)網(wǎng)之前,那么預(yù)計(jì)pFAJ3368構(gòu)建體與pFAJ3370構(gòu)建體相比,將使兩種成熟蛋白蛋白更好地定位到細(xì)胞外間隙。在這種情況下,分泌的成熟蛋白將由C-末端具有一個(gè)額外絲氨酸的DmAMP1和沒有附加氨基酸的RsAFP2組成。如果在FMDV 2A序列G和P之間的裂解發(fā)生在多蛋白轉(zhuǎn)位到內(nèi)質(zhì)網(wǎng)之后,那么預(yù)計(jì)依附在RsAFP2的信號肽不能被有效去除,這種情況下pFAJ3370構(gòu)建體將比pFAJ3368構(gòu)建體更優(yōu)選。
序列表<110>曾尼卡有限公司Broekaert,Willem FFrancois,Isabelle EJAEvans,Ian JDe Bolle,Miguel FCRay,John A<120>遺傳方法<130>PPD 50348/WO<140><141><150>GB 9818001.1<151>1998-08-18<150>GB 9826753.7<151>1998-12-04<160>81<170>PatentIn Vet.2.1<210>1<211>446<212>DNA<213>光滑大麗花<220><221>CDS<222>(1)..(64)<220><221>CDS<222>(157)..(446)<400> 1atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt ctg atc ctt ttc48Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15gtg ctc gcc atc tca g gttatcaaat ctttagttca tttattgaat atgatagtat 104Val Leu Ala Ile Ser20ttatattctt ttatggtttt atgtgttctg acaagttgca aatattgagt ag at atc 161Asp Ilegca tcc gtt agt gga gaa cta tgc gag aaa gct agc aag aca tgg tcg 209Ala Ser Val Ser Gly Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser25 30 35gga aac tgt ggc aat acg gga cat tgt gac aac caa tgt aaa tca tgg 257Gly Asn Cys Gly Asn Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp40 45 50 55gag ggt gcg gcc cat gga gcg tgt cat gtg cgt aac ggg aaa cac atg 305Glu Gly Ala Ala His Gly Ala Cys His Val Arg Asn Gly Lys His Met60 65 70tgt ttc tgt tac ttc aat tgt aaa aaa gcc gaa aag ctt gct caa gac 353Cys Phe Cys Tyr Phe Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp75 80 85aaa ctt aaa gcc gaa caa ctc gct caa gac aaa ctt aat gcc caa aag 401Lys Leu Lys Ala Glu Gln Leu Ala Gln Asp Lys Leu Asn Ala Gln Lys90 95 100ctt gac cgt gat gcc aag aaa gtg gtt cca aac gtt gaa cat ccg446Leu Asp Arg Asp Ala Lys Lys Val Val Pro Asn Val Glu His Pro105 110 115<210>2<211>118<212>蛋白質(zhì)<213>光滑大麗花<400>2Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ala Gln85 90 95Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys Val Val100 105 110Pro Asn Val Glu His Pro115<210>3<211>16<212>蛋白質(zhì)<213>人工序列<220><223>人工序列描述接頭前肽<400> 3Ser Asn Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu Pro Gly1 5 10 15<210>4<211>20<212>蛋白質(zhì)<213>人工序列<220><223>人工序列描述接頭前肽<400>4Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ile Gly Lys Arg20<210>5<21l>40<212>蛋白質(zhì)<213>大麗花<400> 5Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys20 25 30Val Val Pro Asn Val Glu His Pro35 40<210>6<211>44<212>蛋白質(zhì)<213>人工序列<220><223>人工序列描述接頭前肽<400>6Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys20 25 30Val Val Pro Asn Val Glu His Pro Ile Gly Lys Arg35 40<210>7<211>20<212>蛋白質(zhì)<213>人工序列<220><223>人工序列描述接頭前肽<400> 7Ala Ser Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr Lys Thr1 5 10 15Ile Gly Lys Arg20<210>8<211>3l<212>蛋白質(zhì)<213>尾穩(wěn)莧<400>8Ala Ser Thr Thr Val Asp Mis Gln Ala Asp Val Ala Ala Thr Lys Thr1 5 10 15Ala Lys Asn Pro Thr Asp Ala Lys Leu Ala Gly Ala Gly Ser Pro20 25 30<210>9<211>522<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(513)<400>9ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc rca gat arc gca tcc gtt agt gga159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp IIe Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt tcc aac gct gct gac gag gtg gct acc cca gag gac gtg gag351Asn Cys Ser Asn Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu80 85 90cca gga cag aag ttg tgc caa agg cca agt ggg aca tgg tca gga gtc399Pro Gly Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val95 100 105tgt gga aac aat aac gca tgc aag aat cag tgc att aga ctt gag aaa447Gys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys110 115 120gca cga cat gga tct tgc aac tat gtc ttc cca gct cac aag tgt atc495Ala Arg His Gly Set Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile125 130 135 140tgc tac ttt cct tgt taa taggagctc 522Cys Tyr Phe Pro Cys145<210>10<211>145<212>蛋白質(zhì)<213>人工序列<223>人工序列描述合成序列<400>10Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Ser Asn65 70 75 80Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu Pro Gly Gln Lys85 90 95Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn100 105 110Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly115 120 125Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro130 135 140Cys145<210>11<211>534<212>DNA<213>人工序列<220><223>人工序列描述接頭前肽<220><221>CDS<222>(76)..(525)<400>11ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr TrD Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa rca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt aaa aaa gcc gaa aag ctt gct caa gac aaa ctt aaa gcc gaa 351Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu80 85 90caa ctG atc gga aag agg cag aag ttg tgc caa agg cca agt ggg aca 399Gln Leu Ile Gly Lya Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr95 100 105tgg tca gga gtc tgt gga aac aat aac gca tgc aag aat cag tgc att 447Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile110 115 120aga ctt gag aaa gca cga cat gga tct tgc aac tat gtc ttc cca gct 495Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala125 130 135 140cac aag tgt atc tgc tac ttt cct tgt taa taggagctc 534His Lys Cys Ile Cys Tyr Phe Pro Cys145<210>12<211>149<212>蛋白質(zhì)<213>人工序列<223>人工序列描述合成序列<400>12Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ile Gly85 90 95Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val100 105 110Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys115 120 125Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile130 135 140Cys Tyr Phe Pro Cys145<210>13<211>24<212>DNA<213>人工序列<220><223>人工序列描述寡核苷酸<220><221>misc_特征<222>(6,9,12,15,21)<223>n是任何殘基<400>13tgyganaang cnwsnaarac ntgg 24<210>14<211>8<212>蛋白質(zhì)<213>光滑大麗花<400>14Cys Glu Lys Ala Ser Lys Thr Trp1 5<210>15<211>606<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(597)<400>15ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe cys Tyr Phe65 70 75aat tgt aaa aaa gcc gaa aag ctt gct caa gac aaa ctt aaa gcc gaa 351Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu80 85 90caa ctc gct caa gac aaa ctt aat gcc caa aag ctt gac cgt gat gcc 399Gln Leu Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala95 100 105aag aaa gtg gtt cca aac gtt gaa cat ccg atc gga aag agg cag aag 447Lys Lys Val Val Pro Asn Val Glu His Pro Ile Gly Lys Arg Gln Lys110 115 120ttg tgc caa agg cca agt ggg aca tgg tca gga gtc tgt gga aac aat 495Leu Cys Gln ArG Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn125 130 135 140aac gca tgc aag aat cag tgc att aga ctt gag aaa gca cga cat gga 543Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly145 150 155tct tgc aac tat gtc rtc cca gct cac aag tgt atc tgc tac ttt cct 591Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro160 165 170tgt taa taggagctc 606Cys<210>16<211>173<212>蛋白質(zhì)<213>人工序列<223>人工序列描述合成序列<400> 16Met Val Asn Arg Ser Val Ala Phe Sar Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Sar Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ala Gln85 90 95Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys Val Val100 105 110Pro Asn Val Glu His Pro Ile Gly Lys Arg Gln Lys Leu Cys Gln Arg115 120 125Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys130 135 140Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr145 150 155 160Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro Cys165 170<210>17<211>534<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(525)<400>17ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt gcc agt act act gtg gat cac caa gct gat gtt gct gcc acc 351Asn Cys Ala Ser Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr80 85 90aaa act atc gga aag agg cag aag ttg tgc caa agg cca agt ggg aca 399Lys Thr Ile Gly Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr95 100 105tgg tca gga gtc tgt gga aac aat aac gca tgc aag aat cag tgc att 447Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile110 115 120aga ctt gag aaa gca cga cat gga tct tgc aac tat gtc ttc cca gct 495Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala125 130 135 140cac aag tgt atc tgc tac ttt cct tgt taa taggagctc 534His Lys Cys Ile Cys Tyr Phe Pro Cys145<210>18<211>149<212>蛋白質(zhì)<213>人工序列<223>人工序列描述合成序列<400>18Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Ala Ser65 70 75 80Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr Lys Thr Ile Gly85 90 95Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val100 105 110Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys115 120 125Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile130 135 140Cys Tyr Phe Pro Cys145<210>19<211>316<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(312)
權(quán)利要求
1.一種在轉(zhuǎn)基因植物中提高一種或多種蛋白表達(dá)水平的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域,其中啟動(dòng)子區(qū)域可操作地連接有兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’-終止區(qū),其中所述的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開,所述前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。
2.根據(jù)權(quán)利要求1的方法,其中所說的啟動(dòng)子區(qū)被可操作地連接到一個(gè)信號序列,該信號序列被可操作地連接到兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’-終止區(qū)。
3.一種在轉(zhuǎn)基因植物中表達(dá)多蛋白的方法,包括在所述植物的基因組插入一個(gè)DNA序列,該DNA序列包含一個(gè)啟動(dòng)子區(qū)域,其中啟動(dòng)子區(qū)域可操作地連接到一個(gè)信號序列,該信號序列可操作地連接兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’-終止區(qū),其中所說的蛋白編碼區(qū)由一個(gè)編碼接頭前肽的DNA序列相互分隔開,所說的前肽提供一個(gè)裂解位點(diǎn),表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。
4.根據(jù)上述任一項(xiàng)權(quán)利要求的方法,其中所述接頭前肽的序列至少有40%由選自丙氨酸、纈氨酸、異亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5個(gè)連續(xù)疏水殘基的一段序列或者由選自天冬氨酸、谷氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、蘇氨酸、谷氨酰胺和天冬酰胺的2到5個(gè)親水殘基的一段序列組成。
5.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中所述接頭前肽在其N-或C-末端裂解位點(diǎn)的7個(gè)殘基內(nèi)有一個(gè)具有2到5個(gè)連續(xù)酸性殘基、2到5個(gè)連續(xù)堿性殘基或者2到5個(gè)連續(xù)的混合酸堿性殘基的序列。
6.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中編碼所述接頭前肽的DNA序列編碼一種可以從植物蛋白,或病毒分離到的前肽,或它的變體,或者其中任一個(gè)的片段,其提供了一個(gè)裂解位點(diǎn),從而使表達(dá)的多蛋白在該位點(diǎn)被翻譯后加工成組分蛋白分子。
7.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中編碼所述接頭前肽的DNA序列編碼一種可以從植物蛋白中分離到的前肽或其片段。
8.根據(jù)權(quán)利要求6或7的方法,其中編碼所述接頭前肽的DNA序列編碼一個(gè)嵌合的前肽,包括一種可以從一種或多種植物和/或一種病毒中分離到的前肽,或者它的變體或其中任一個(gè)的片段。
9.根據(jù)權(quán)利要求7或8的方法,其中的植物蛋白是植物防衛(wèi)素的前體,或者橡膠蛋白類型的抗菌蛋白。
10.根據(jù)權(quán)利要求9的方法,其中的植物蛋白是來源于鳳仙花屬的抗菌蛋白。
11.根據(jù)權(quán)利要求10的方法,其中的前肽包括SEQ ID NO.3,29,21,22,23或24。
12.根據(jù)權(quán)利要求8的方法,其中的前肽包括來自Dm-AMP1或Ac-AMP2的C-末端前肽或它的片段,或其中任何一個(gè)的變體。
13.根據(jù)權(quán)利要求12的方法,其中的前肽包括SEQ ID NO.4,6,7,25,26或27。
14.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中的前肽是嵌合的前肽。
15.根據(jù)權(quán)利要求13的方法,其中的嵌合前肽包括病毒前肽或它的片段,以及從植物蛋白分離的前肽或它的片段。
16.根據(jù)權(quán)利要求15的方法,其中的病毒是小核糖核酸病毒。
17.根據(jù)權(quán)利要求15或16的方法,其中的嵌合前肽包括病毒前肽序列的SEQ ID NO.28。
18.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中的接頭前肽在任一個(gè)末端或兩個(gè)末端都設(shè)計(jì)有一個(gè)蛋白酶加工位點(diǎn)。
19.根據(jù)權(quán)利要求18的方法,其中的蛋白酶加工位點(diǎn)是一個(gè)枯草桿菌蛋白酶樣的蛋白酶的加工位點(diǎn)。
20.根據(jù)權(quán)利要求2或3的方法,其中的信號序列來自植物防衛(wèi)素基因。
21.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中多蛋白中的一個(gè)或多個(gè)是防衛(wèi)蛋白。
22.將一種在分泌途徑可裂解的植物接頭前肽應(yīng)用于轉(zhuǎn)基因植物中的合成多蛋白前體。
23.根據(jù)權(quán)利要求22的前肽的應(yīng)用,其中前肽來自植物蛋白或者來自病毒。
24.根據(jù)權(quán)利要求22或權(quán)利要求23前肽的應(yīng)用,其中的前肽來自植物蛋白并且該蛋白是一種植物防衛(wèi)素的前體,或者來自橡膠蛋白類型的抗菌蛋白,或者可以從鳳仙花屬植物中分離。
25.將一種前肽用作轉(zhuǎn)基因植物分泌途徑中合成的多蛋白前體的可裂解接頭,其中所說的前肽接頭如在權(quán)利要求4或權(quán)利要求5中所定義的一樣。
26.使用一個(gè)富含小氨基酸A,V,S和T,并且包含由兩個(gè)酸性殘基、兩個(gè)堿性殘基或一個(gè)酸性殘基和一個(gè)堿性殘基所組成的二肽序列的前肽,作為一個(gè)可裂解的接頭序列,其中所述的序列可以從一種植物防衛(wèi)素或一種橡膠蛋白類型的抗菌肽中分離。
27.一種DNA構(gòu)建體,包括可操作地連接有一個(gè)植物來源的信號序列的啟動(dòng)子區(qū),其中所說信號序列被可操作連接到一個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’終止區(qū),其中所述的蛋白編碼區(qū)被一個(gè)編碼接頭前肽的DNA序列相互分隔開,所述前肽提供一個(gè)翻譯后的裂解位點(diǎn)。
28.一種DNA構(gòu)建體,包括可操作地連接有兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’終止區(qū)的啟動(dòng)子區(qū),其中所述的蛋白編碼區(qū)被一個(gè)編碼接頭前肽的DNA序列相互分隔開,該DNA序列來自Dm-AMP基因或來自Ac-AMP基因并編碼C-末端前肽,所述前肽提供了一個(gè)翻譯后的裂解位點(diǎn)。
29.根據(jù)權(quán)利要求27或28的DNA構(gòu)建體,其中編碼接頭前肽的DNA序列在其任一個(gè)末端或兩個(gè)末端都額外包含一個(gè)或多個(gè)蛋白酶識別位點(diǎn)。
30.一種載體,包含根據(jù)權(quán)利要求19-21任一項(xiàng)DNA構(gòu)建體。
31.一種轉(zhuǎn)基因植物,它是用根據(jù)權(quán)利要求27-30中任一項(xiàng)的DNA構(gòu)建體或載體轉(zhuǎn)化的。
32.使用DNA構(gòu)建體或者包含所述構(gòu)建體的載體來提高轉(zhuǎn)基因植物中蛋白的表達(dá)水平,所述DNA結(jié)構(gòu)體包含一個(gè)DNA序列,該DNA序列包括一個(gè)可操作地連接有兩個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3’終止區(qū)的啟動(dòng)子區(qū),其中所述的蛋白編碼區(qū)被一個(gè)編碼接頭前肽的DNA序列相互分隔開,所述前肽提供了一個(gè)翻譯后的裂解位點(diǎn)。
33.一種核酸,它編碼SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的肽或圖34所示的接頭肽,或者其中任一個(gè)的變體。
34.根據(jù)權(quán)利要求33的核酸,它編碼SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的肽或圖34所示的接頭肽。
35.根據(jù)權(quán)利要求33的核酸,它編碼在SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的C-末端包含有SEQ ID NO.77的肽,或者編碼圖34所示的接頭肽。
全文摘要
一種表達(dá)或提高轉(zhuǎn)基因植物中一種或多種蛋白質(zhì)的表達(dá)水平的方法,包括向所述植物的基團(tuán)組中插入一種DNA序列,所述DNA序列包括和2個(gè)或多個(gè)蛋白編碼區(qū)和一個(gè)3′終止子區(qū)的可操作地連接的啟動(dòng)子區(qū),其中所說的蛋白編碼區(qū)被編碼接頭前肽的DNA序列所分隔開,其中所說的前肽提供了斷裂位點(diǎn)從而使所表面的多蛋白被翻譯后加工成為成分蛋白分子。特別是,還包括了信號肽序列從而使翻譯后加工在植物的分泌途徑進(jìn)行。本發(fā)明還描述了在本方法中所使用的合適的接頭序列和DNA構(gòu)建體。
文檔編號C12R1/91GK1315999SQ9981029
公開日2001年10月3日 申請日期1999年8月17日 優(yōu)先權(quán)日1998年8月18日
發(fā)明者W·F·布雷凱特, I·E·J·A·弗蘭科伊斯, M·F·C·德波勒, I·J·埃文斯, J·A·雷 申請人:曾尼卡有限公司