專(zhuān)利名稱(chēng):Arcelin-5啟動(dòng)子及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及植物遺傳學(xué)領(lǐng)域。更具體地,本發(fā)明涉及植物中的基因表達(dá)。本發(fā)明提供了能在植物中高水平轉(zhuǎn)錄外源核酸序列的啟動(dòng)子,以及修飾、制備和應(yīng)用所述啟動(dòng)子的方法。本發(fā)明還提供了含有高表達(dá)啟動(dòng)子的轉(zhuǎn)化的宿主細(xì)胞,轉(zhuǎn)基因植物,和種子,以及它們的制備和應(yīng)用方法。
背景技術(shù):
植物和種子為人類(lèi)和牲畜提供食用蛋白的重要來(lái)源。但植物和種子的蛋白營(yíng)養(yǎng)通常不全面。例如,很多植物和種子蛋白缺少一或多種必需氨基酸。這種缺陷可通過(guò)遺傳手段強(qiáng)化天然蛋白、使它們具有營(yíng)養(yǎng)更全面的氨基酸組成(或其它一些所需特點(diǎn))來(lái)克服?;蛘?,可將具有所需特性的非天然(或異源)蛋白引入植物或種子。這些方法可用于制備具有重要的農(nóng)業(yè)特性(如殺蟲(chóng)特性)、營(yíng)養(yǎng)特性和藥用特性的蛋白。
盡管目前已有多種分子工具,但由于基因工程蛋白的積累量不足,致使對(duì)植物和種子的遺傳修飾仍常常受到限制。多種細(xì)胞內(nèi)過(guò)程可能影響蛋白積累總量,所述過(guò)程包括轉(zhuǎn)錄、翻譯、蛋白裝配和折疊、甲基化、磷酸化、轉(zhuǎn)運(yùn)、以及蛋白裂解。對(duì)一或多種這樣的過(guò)程進(jìn)行干預(yù)可增加基因工程改造的植物和種子中所產(chǎn)生的蛋白的量。
例如,提高胞質(zhì)中mRNA的穩(wěn)態(tài)水平通??稍黾臃g出的蛋白的積累量。很多因素可導(dǎo)致胞質(zhì)中mRNA的穩(wěn)態(tài)水平提高,包括由啟動(dòng)子強(qiáng)度所控制的轉(zhuǎn)錄速度和其它調(diào)節(jié)特性,mRNA加工的效力,和mRNA的總體穩(wěn)定性。
在這些因素中,基因的啟動(dòng)子部分起關(guān)鍵作用。沿啟動(dòng)子區(qū),可集合轉(zhuǎn)錄機(jī)制并啟動(dòng)轉(zhuǎn)錄。這一早期步驟與產(chǎn)生蛋白質(zhì)的后續(xù)階段相比常常為限速步驟。在啟動(dòng)子位置發(fā)生的轉(zhuǎn)錄起始可通過(guò)多種途徑調(diào)節(jié)。例如,在有特定化合物存在的情況下誘導(dǎo)啟動(dòng)子,僅在特定組織中表達(dá)基因,或?qū)幋a序列進(jìn)行組成型表達(dá)。因此,可將編碼序列與具有不同調(diào)節(jié)特性的啟動(dòng)子可操作連接,以此修飾編碼序列的轉(zhuǎn)錄。
來(lái)自種子貯藏蛋白的基因的啟動(dòng)子通常能進(jìn)行高水平的表達(dá)。例如,菜豆(Phaseolus vulgaris)的種子通常包含大量的菜豆蛋白(36-46%,w/w),球蛋白-2(5-12%),清蛋白(12-16%)和谷醇溶蛋白(2-4%)。因此,來(lái)自這些基因的啟動(dòng)子可用于表達(dá)高水平的異源結(jié)構(gòu)核酸序列。
但即使是這些強(qiáng)啟動(dòng)子的轉(zhuǎn)錄活性在不同植物之間也有差異。例如,多種啟動(dòng)子在煙草、矮牽牛和擬南芥中比7Sα’啟動(dòng)子具有更強(qiáng)的活性。但這些啟動(dòng)子沒(méi)有一種被證實(shí)在轉(zhuǎn)基因大豆植物中具有可比擬的活性。因此,在一種植物物種或品種中具有功能的啟動(dòng)子,在另一種植物物種或品種中可能不具有相似水平或形式的功能。
Romero等報(bào)道了一種新的種子蛋白,它來(lái)自產(chǎn)于Arcelia,Mexico的菜豆(P.vulgaris)(登錄號(hào)PI 325690;CIAT 12882B)。因此將這種蛋白稱(chēng)為Arcelin(Andreas等,1986;Osborn等,1986)。后來(lái)又報(bào)道了數(shù)種Arcelin變體(例如,登錄號(hào)為PI 417683的Arcelin-3(CIAT No.G12922);登錄號(hào)為PI417775的Arcelin-4(CIAT No.G12949))。其中一種變體,Arcelin-5由Lioi等報(bào)道(Lioi and Bollini,1989)。Arcelin-5的cDNA由Goossens等描述(Goossens等,1994)。
Arcelin-5的一種基因組克隆包括未限定的5’和3’區(qū),據(jù)報(bào)道它在轉(zhuǎn)基因植物中表達(dá)。該未限定區(qū)包括Arcelin-5編碼區(qū)5’側(cè)的約1.8kb堿基對(duì)。在擬南芥和Phaseolus acutifolius中都報(bào)道了表達(dá)(Goossens等,1999)。但這種表達(dá)比最初鑒定出Arcelin-5的野生型菜豆中的表達(dá)水平低??梢?jiàn),遺傳背景對(duì)于調(diào)節(jié)Arcelin-5的表達(dá)很重要。而且,由于Goosens使用的是Arcelin-5的完整基因組克隆,因此Arcelin-5啟動(dòng)子的相對(duì)強(qiáng)度并不清楚。盡管報(bào)道了各種Arcelin的表達(dá),但目前對(duì)這類(lèi)Arcelin啟動(dòng)子在諸如玉米和大豆等作物中的效力仍一無(wú)所知。所以該領(lǐng)域仍需要能在重要的作物物種(如玉米和大豆)中進(jìn)行相對(duì)高水平轉(zhuǎn)錄的啟動(dòng)子。
發(fā)明簡(jiǎn)述本發(fā)明提供了能在植物中高水平轉(zhuǎn)錄異源結(jié)構(gòu)核酸序列的啟動(dòng)子,以及修飾、制備、和應(yīng)用所述啟動(dòng)子的方法。本發(fā)明還提供了含有高表達(dá)的所述啟動(dòng)子的組合物、轉(zhuǎn)化的宿主細(xì)胞、轉(zhuǎn)基因植物、和種子,以及它們的制備和應(yīng)用方法。
本發(fā)明包括并提供了一種轉(zhuǎn)化的大豆植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含具有與SEQ ID NO1至少94%相同的核酸序列的啟動(dòng)子;可操作連接至結(jié)構(gòu)核酸序列;其中所述啟動(dòng)子與所述結(jié)構(gòu)核酸序列來(lái)源不同。
本發(fā)明包括并提供了一種轉(zhuǎn)基因大豆植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含具有與SEQ ID NO1至少94%相同的核酸序列的啟動(dòng)子;可操作連接至結(jié)構(gòu)核酸序列;其中所述啟動(dòng)子與所述結(jié)構(gòu)核酸序列來(lái)源不同。
本發(fā)明包括并提供了一種轉(zhuǎn)化的大豆植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ ID NO1至少94%相同。
本發(fā)明包括并提供了一種轉(zhuǎn)基因大豆植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ ID NO1至少94%相同。
本發(fā)明包括并提供了一種轉(zhuǎn)化的植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ ID NO1至少94%相同。
本發(fā)明包括并提供了一種轉(zhuǎn)基因植物細(xì)胞,它含有一種核酸分子,所述分子沿5’-3’方向依次包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ ID NO1至少94%相同。
本發(fā)明包括并提供了一種轉(zhuǎn)化植物細(xì)胞的方法。所述方法主要包括提供一種核酸分子并用所述核酸分子來(lái)轉(zhuǎn)化植物細(xì)胞,其中所述核酸分子沿5’-3’方向包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ IDNO1至少94%相同。
本發(fā)明包括并提供了一種制備轉(zhuǎn)基因植物的方法。所述方法主要包括提供一種核酸分子、用所述核酸分子來(lái)轉(zhuǎn)化植物細(xì)胞、并在能產(chǎn)生植物的條件下培養(yǎng)已被轉(zhuǎn)化的植物細(xì)胞,其中所述核酸分子沿5’-3’方向包含啟動(dòng)子以及與其可操作連接的異源結(jié)構(gòu)核酸序列。所述啟動(dòng)子優(yōu)選在嚴(yán)格條件下與SEQ ID NO1或其互補(bǔ)序列雜交;或者與SEQ ID NO1至少94%相同。
序列簡(jiǎn)述SEQ ID NO1是菜豆引進(jìn)種基因型(exotic genotype)G02771 Arcelin-5啟動(dòng)子序列的截短型。
SEQ ID NO2是菜豆引進(jìn)種基因型G02771 Arcelin-5啟動(dòng)子序列的截短型。
SEQ ID NO3是GmHSP17.9 5’UTR序列。
SEQ ID NO4是PetHSP70 5’UTR序列。
SEQ ID NO5是GmdSSU 5’UTR序列。
SEQ ID NO6是ADR12 3’終止子序列。
SEQ ID NO7是E9 3’終止子序列。
SEQ ID NO8是Arc5 3’終止子序列。
SEQ ID NO9是Arcelin-3啟動(dòng)子序列,如圖1所示。
SEQ ID NO10是Arcelin-4啟動(dòng)子序列,如圖1所示。
SEQ ID NO11是Arcelin-5啟動(dòng)子序列,如圖1所示。
SEQ ID NO12是Arcelin-3啟動(dòng)子序列,如圖4a-e所示。
SEQ ID NO13是Arcelin-4啟動(dòng)子序列,如圖4a-e所示。
SEQ ID NO14是Arcelin-5啟動(dòng)子序列,如圖4a-e所示。
圖1是Arcelin-3,Arcelin-4,和Arcelin-5啟動(dòng)子的部分核酸序列的序列比對(duì)。序列之間的差異已經(jīng)標(biāo)明。
圖2比較了Arcelin-3,Arcelin-4,和Arcelin-5啟動(dòng)子在瞬時(shí)轉(zhuǎn)化的大豆組織中的啟動(dòng)子活性。
圖3比較了Arcelin啟動(dòng)子與7Sα’啟動(dòng)子在轉(zhuǎn)基因大豆種子中的啟動(dòng)子活性。
圖4a,4b,4c,4d,和4e顯示Arcelin-3,Arcelin-4,和Arcelin-5啟動(dòng)子全長(zhǎng)核酸序列的序列比對(duì)。
圖5顯示各種具有Arcelin-5啟動(dòng)子序列的構(gòu)建體。
圖6顯示pMON55540的質(zhì)粒圖譜。
圖7為柱形圖,顯示具有Arcelin-5啟動(dòng)子序列的各種構(gòu)建體的活性。
定義以下定義有助于理解發(fā)明詳述。
術(shù)語(yǔ)“Arcelin-5啟動(dòng)子”是指由Arcelin-5編碼序列的轉(zhuǎn)錄起始位點(diǎn)的5’側(cè)區(qū)域衍生或構(gòu)建的啟動(dòng)子區(qū)。Arcelin-5啟動(dòng)子進(jìn)一步被限定為不同于Arcelin-1(Osborn等Science,240207-210,1988),-2(John等,Gene 86171-176,1990),-3,或-4(Mirkov等,Plant Mol.Biol.,261103-1113,1994)啟動(dòng)子。
術(shù)語(yǔ)“編碼序列”,“結(jié)構(gòu)序列”以及“結(jié)構(gòu)核酸序列”是指一種包含有序排列的核酸的物理結(jié)構(gòu)。所述核酸以一組核酸三聯(lián)體的形式排列,其中每一個(gè)三聯(lián)體形成一個(gè)密碼子。每一密碼子編碼一種具體的氨基酸。因此,編碼序列、結(jié)構(gòu)序列、和結(jié)構(gòu)核酸序列編碼一系列氨基酸,這些氨基酸形成蛋白、多肽、或肽序列。編碼序列,結(jié)構(gòu)序列,和結(jié)構(gòu)核酸序列可以包含在較大的核酸分子、載體等結(jié)構(gòu)中。此外,這些序列中核酸的有序排列可以用序列表、附圖、附表、電子媒介等形式進(jìn)行描述。
術(shù)語(yǔ)“DNA序列”和“核酸序列”是指一種包含有序排列的核酸的物理結(jié)構(gòu)。所述DNA序列或核酸序列可以包含在較大的核酸分子、載體等結(jié)構(gòu)中。此外,這些序列中核酸的有序排列可以用序列表、附圖、附表、電子媒介等形式進(jìn)行描述。
術(shù)語(yǔ)“表達(dá)”是指基因轉(zhuǎn)錄,產(chǎn)生相應(yīng)的mRNA,并翻譯該mRNA以產(chǎn)生相應(yīng)的基因產(chǎn)物(即,肽,多肽,或蛋白)。
術(shù)語(yǔ)“反義RNA的表達(dá)”是指對(duì)DNA進(jìn)行轉(zhuǎn)錄,從而產(chǎn)生第一種RNA分子,后者能與第二種RNA分子雜交。RNA-RNA雜合體的形成可抑制第二種RNA分子翻譯出基因產(chǎn)物。
術(shù)語(yǔ)“基因”是指編碼肽、多肽、蛋白、或RNA分子的染色體DNA、質(zhì)粒DNA、cDNA、合成的DNA、或其它DNA。
“同源性”是指兩個(gè)或多個(gè)核酸序列或氨基酸序列之間以位置同一性百分比表示的相似性(即,序列相似性或同一性)。同源性還指不同的核酸或蛋白之間相似的功能特性的概念。
術(shù)語(yǔ)“異源”是指兩個(gè)或更多個(gè)不同來(lái)源的核酸序列或蛋白序列之間的關(guān)系。例如,啟動(dòng)子如果在自然界通常的情況中不與編碼序列組合在一起,那么該啟動(dòng)子相對(duì)于該編碼序列是異源的。此外,一個(gè)具體序列可以相對(duì)于它插入至其中的細(xì)胞或生物為“異源”的(即,并非該具體細(xì)胞或生物所天然具有的)。
“雜交”是指一條核酸鏈與一條互補(bǔ)鏈通過(guò)堿基配對(duì)來(lái)相連的能力。當(dāng)兩條核酸鏈中的互補(bǔ)核酸序列在適當(dāng)條件下彼此相遇,就可發(fā)生雜交。
術(shù)語(yǔ)“可操作相連”是指兩個(gè)或更多個(gè)核酸區(qū)域或核酸序列的功能性空間排列。例如,啟動(dòng)子區(qū)相對(duì)于核酸序列的位置可以使該核酸序列在該啟動(dòng)子區(qū)的指導(dǎo)下進(jìn)行轉(zhuǎn)錄。此時(shí),該啟動(dòng)子區(qū)與該核酸序列“可操作相連”。
術(shù)語(yǔ)“啟動(dòng)子”或“啟動(dòng)子區(qū)”是指通常發(fā)現(xiàn)于編碼序列上游(5’)的、能指導(dǎo)該核酸序列轉(zhuǎn)錄為mRNA的一種核酸序列。啟動(dòng)子或啟動(dòng)子區(qū)通常提供RNA聚合酶的識(shí)別位點(diǎn)以及轉(zhuǎn)錄的正確起始所需的其它因子。本文中,啟動(dòng)子或啟動(dòng)子區(qū)包括通過(guò)插入或缺失調(diào)節(jié)區(qū),對(duì)啟動(dòng)子進(jìn)行隨機(jī)或定點(diǎn)誘變等方式而進(jìn)行改變的啟動(dòng)子。啟動(dòng)子的活性或強(qiáng)度如下測(cè)量將其在細(xì)胞或組織中產(chǎn)生的RNA的量,或積累的蛋白的量,與已經(jīng)評(píng)估過(guò)轉(zhuǎn)錄活性的啟動(dòng)子進(jìn)行比較。
術(shù)語(yǔ)“重組載體”是指諸如質(zhì)粒、粘粒、病毒、自我復(fù)制序列、噬菌體、線(xiàn)性或環(huán)狀單鏈或雙鏈DNA或RNA核苷酸序列等任何物質(zhì)。重組載體可以來(lái)自任何來(lái)源,它能進(jìn)行基因組整合或自我復(fù)制,它包含與一或多個(gè)核酸序列可操作相連的啟動(dòng)子核酸序列。重組載體通常用于將所述可操作相連的序列引入適當(dāng)?shù)乃拗鳌?br>
“調(diào)節(jié)序列”是指位于編碼序列上游(5’)、內(nèi)部或下游(3’)的核苷酸序列。編碼序列的轉(zhuǎn)錄和表達(dá)通常受到調(diào)節(jié)序列存在與否的影響。
術(shù)語(yǔ)“充分同源”是指,根據(jù)本文所述BestFit程序(版本10;GeneticsComputer Group,Inc.,University of Wisconsin Biotechnology Center,Madison,WI)以默認(rèn)參數(shù)測(cè)定,序列同一性至少90%的兩個(gè)序列。
術(shù)語(yǔ)“轉(zhuǎn)化”是指核酸引入受體宿主的過(guò)程。術(shù)語(yǔ)“宿主”是指細(xì)菌細(xì)胞,真菌,動(dòng)物和動(dòng)物細(xì)胞,植物和植物細(xì)胞,或任何植物部分或組織包括原生質(zhì)體,愈傷組織,根,塊莖,種子,莖,葉,幼苗,胚和花粉。
優(yōu)選實(shí)施方案詳述本發(fā)明提供能在植物中高水平轉(zhuǎn)錄異源結(jié)構(gòu)核酸序列的啟動(dòng)子,以及修飾、制備和應(yīng)用該啟動(dòng)子的方法。本發(fā)明還提供含有該高表達(dá)啟動(dòng)子的組合物,轉(zhuǎn)化的宿主細(xì)胞,轉(zhuǎn)基因植物,和種子,以及它們的制備和應(yīng)用方法。
啟動(dòng)子本發(fā)明提供一種啟動(dòng)子,它具有與SEQ ID NO1雜交的核酸序列,其互補(bǔ)鏈,或其任何片段。本發(fā)明還提供一種啟動(dòng)子,它具有SEQ ID NO1的核酸序列,其互補(bǔ)鏈,或其任何片段。
本發(fā)明提供一種啟動(dòng)子,它具有與SEQ ID NO2雜交的核酸序列,其互補(bǔ)鏈,或其任何片段。本發(fā)明還提供一種啟動(dòng)子,它具有SEQ ID NO2的核酸序列,其互補(bǔ)鏈,或其任何片段。
本發(fā)明提供一種啟動(dòng)子,它具有與SEQ ID NO14雜交的核酸序列,其互補(bǔ)鏈,或其任何片段。本發(fā)明還提供一種啟動(dòng)子,它具有SEQ ID NO14的核酸序列,其互補(bǔ)鏈,或其任何片段。
核酸雜交是DNA操作領(lǐng)域技術(shù)人員已知的技術(shù)。一對(duì)具體核酸的雜交特性可指示它們的相似性或同一性。
可用低嚴(yán)格度條件選出與靶核酸序列同一性較低的核酸序列。所述條件可以是,約0.15M-約0.9M氯化鈉,約20℃-約55℃。
可用高嚴(yán)格度條件選出與已公開(kāi)的核酸序列(Sambrook等,1989)同一性較高的核酸序列。
高嚴(yán)格度條件通常包括在約2X-約10X SSC(由含有3M氯化鈉和0.3M檸檬酸鈉的20X SSC原液,pH 7.0用蒸餾水稀釋而成),約2.5X-約5X Denhardt溶液(由含有1%(w/v)牛血清白蛋白,1%(w/v)ficoll,和1%(w/v)聚乙烯吡硌烷酮的50X原液用蒸餾水稀釋而成),約10mg/mL-約100mg/mL魚(yú)精DNA,以及約0.02%(w/v)-約0.1%(w/v)SDS中進(jìn)行核酸雜交,于大約50℃-大約70℃保溫?cái)?shù)小時(shí)-過(guò)夜。優(yōu)選高嚴(yán)格度條件為6X SSC,5X Denhardt溶液,100mg/mL魚(yú)精DNA,和0.1%(w/v)SDS,55℃保溫?cái)?shù)小時(shí)。
雜交之后通常進(jìn)行數(shù)個(gè)洗滌步驟。洗滌組合物通常包含約0.5X-約10X SSC,以及0.01%(w/v)-約0.5%(w/v)SDS,約20℃-約70℃保溫15分鐘。優(yōu)選地,當(dāng)在0.1X SSC中65℃洗滌至少一次以后,核酸片段仍保持雜交。
啟動(dòng)子的核酸序列優(yōu)選在低或高嚴(yán)格度條件下與SEQ ID NO1,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選,啟動(dòng)子在高嚴(yán)格度條件下與SEQ ID NO1,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO1至少有85%相同的核酸序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98,或99%相同。最優(yōu)選啟動(dòng)子包含或就是SEQ ID NO1。
啟動(dòng)子的核酸序列優(yōu)選在低或高嚴(yán)格度條件下與SEQ ID NO2,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選,啟動(dòng)子在高嚴(yán)格度條件下與SEQ ID NO2,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO2至少有85%相同的核酸序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98,或99%相同。最優(yōu)選啟動(dòng)子包含或就是SEQ ID NO2。
啟動(dòng)子的核酸序列優(yōu)選在低或高嚴(yán)格度條件下與SEQ ID NO14,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選,啟動(dòng)子在高嚴(yán)格度條件下與SEQ ID NO14,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO14至少有85%相同的核酸序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98,或99%相同。最優(yōu)選啟動(dòng)子包含或就是SEQ ID NO14。
序列同一性百分比優(yōu)選用序列分析軟件包(版本10;Genetics ComputerGroup,Inc.,University of Wisconsin Biotechnology Center,Madison,WI)的“Best Fit”或“Gap”程序來(lái)確定?!癎ap”是利用Needleman和Wunsch的算法(Needleman and Wunsch,1970)來(lái)找出兩個(gè)序列的對(duì)比排列,它使匹配數(shù)最大并使空隙數(shù)最小?!癇estFit”是對(duì)兩個(gè)序列之間的最相似片段進(jìn)行最佳對(duì)比排列,它還插入空隙以便使匹配數(shù)最大,它利用Smith和Waterman的局部同源性算法(Smith and Waterman,1981;Smith等,1983)。同一性百分比最優(yōu)選用“Best Fit”程序來(lái)確定。
本發(fā)明還提供了SEQ ID NO1的核酸分子片段,與具有SEQ ID NO1的核酸分子雜交的核酸分子片段,與SEQ ID NO1有序列同一性的核酸分子片段,以及上述任一種分子的互補(bǔ)體。
本發(fā)明還提供了SEQ ID NO2的核酸分子片段,與具有SEQ ID NO2的核酸分子雜交的核酸分子片段,與SEQ ID NO2有序列同一性的核酸分子片段,以及上述任一種分子的互補(bǔ)體。
本發(fā)明還提供了SEQ ID NO14的核酸分子片段,與具有SEQ ID NO14的核酸分子雜交的核酸分子片段,與SEQ ID NO14有序列同一性的核酸分子片段,以及上述任一種分子的互補(bǔ)體。
在另一實(shí)施方案中,所述片段的長(zhǎng)度為250-15個(gè)核苷酸,更優(yōu)選150-15個(gè)核苷酸,更優(yōu)選100-15個(gè)核苷酸,50-15個(gè)核苷酸或25-15個(gè)核苷酸。在另一優(yōu)選實(shí)施方案中,所述片段的長(zhǎng)度為250-50個(gè)核苷酸,更優(yōu)選150-15個(gè)核苷酸,更優(yōu)選100-50個(gè)核苷酸,50-25個(gè)核苷酸或25-20個(gè)核苷酸。在另一實(shí)施方案中,所述片段的長(zhǎng)度為250-100個(gè)核苷酸,更優(yōu)選150-100個(gè)核苷酸,更優(yōu)選100-75個(gè)核苷酸。
啟動(dòng)子活性啟動(dòng)子的活性或強(qiáng)度可用RNA的量或該RNA所特別產(chǎn)生的蛋白積累量相對(duì)于細(xì)胞性RNA或蛋白的總量來(lái)定量。所述啟動(dòng)子優(yōu)選表達(dá)可操作連接的核酸序列,其水平占細(xì)胞性RNA或蛋白總量的2.5%以上;更優(yōu)選占5,6,7,8,或9%以上;還更優(yōu)選占10,11,12,13,14,15,16,17,18,或19%以上;最優(yōu)選占20%以上。
或者,啟動(dòng)子的活性或強(qiáng)度可表示為已知啟動(dòng)子(其轉(zhuǎn)錄活性已經(jīng)過(guò)評(píng)估)的相對(duì)量。例如,可將一種了解不多的啟動(dòng)子與報(bào)告序列(例如,GUS)可操作相連,并將其引入特定類(lèi)型的細(xì)胞。用類(lèi)似方法制備已知啟動(dòng)子(例如7Sα’啟動(dòng)子),將其引入相同的細(xì)胞內(nèi)環(huán)境中。通過(guò)比較相對(duì)于已知啟動(dòng)子而言的報(bào)告分子表達(dá)量,可確定未知啟動(dòng)子的轉(zhuǎn)錄活性。在此公開(kāi)的啟動(dòng)子的活性?xún)?yōu)選在相同的細(xì)胞內(nèi)環(huán)境中與7Sα’啟動(dòng)子的活性強(qiáng)度相同。細(xì)胞內(nèi)環(huán)境優(yōu)選canola,大豆,或玉米;最優(yōu)選大豆。
結(jié)構(gòu)核酸序列本發(fā)明的啟動(dòng)子可與異源結(jié)構(gòu)核酸序列可操作相連。該結(jié)構(gòu)核酸序列通常是希望提高轉(zhuǎn)錄水平的任何核酸序列。優(yōu)選結(jié)構(gòu)核酸序列編碼一種適于摻入人或動(dòng)物膳食之中的多肽。適當(dāng)?shù)慕Y(jié)構(gòu)核酸序列包括編碼下列蛋白的那些種子貯藏蛋白,抗除草劑蛋白,抗病蛋白,脂肪酸生物合成酶,維生素E生物合成酶,氨基酸生物合成酶,或殺蟲(chóng)蛋白。優(yōu)選的結(jié)構(gòu)核酸序列包括,但不限于,γ甲基轉(zhuǎn)移酶、葉綠基異戊烯轉(zhuǎn)移酶、β-酮脂酰-CoA合酶、脂酰CoA還原酶、脂酰CoA脂醇轉(zhuǎn)酰酶、鄰氨基苯甲酸合酶、蘇氨酸脫氨酶、乙酰羥酸合成酶、天冬氨酸激酶、二羥酸合成酶、天冬氨酸激酶、二氫吡啶甲酸合成酶、硫酯酶、7Sα’種子貯藏蛋白、11S種子貯藏蛋白、大豆球蛋白、β-conglycinin、菜豆蛋白、玉米球蛋白-1、玉米醇溶蛋白、種子清蛋白、或種子凝集素。
或者,可通過(guò)設(shè)計(jì)啟動(dòng)子和結(jié)構(gòu)核酸序列來(lái)下調(diào)特定的核酸序列。這通常通過(guò)將啟動(dòng)子與反義取向的結(jié)構(gòu)核酸序列相連來(lái)實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員很熟悉這類(lèi)反義技術(shù)。簡(jiǎn)短說(shuō),轉(zhuǎn)錄出反義核酸序列后,它與互補(bǔ)核酸序列雜交并使后者被封閉(sequester)在細(xì)胞內(nèi)側(cè)。這種雙鏈RNA分子不能通過(guò)細(xì)胞的翻譯機(jī)制翻譯出蛋白。如此一來(lái),由于后續(xù)翻譯步驟中斷,細(xì)胞中的互補(bǔ)序列被有效下調(diào)。
任何核酸序列都可以通過(guò)這種方式進(jìn)行負(fù)調(diào)節(jié)。這種調(diào)節(jié)作用的目標(biāo)包括含有較少量的必需氨基酸、但在特定組織中以相對(duì)較高的水平表達(dá)的多肽。例如,β-conglycinin和大豆球蛋白都能在種子中大量表達(dá),但在營(yíng)養(yǎng)方面欠缺必需氨基酸。這種反義方法也可以用于有效除去植物性食品中的其它不想要的蛋白,如拒食劑(例如,凝集素),清蛋白,和變應(yīng)原。
修飾的結(jié)構(gòu)核酸序列本發(fā)明的啟動(dòng)子還可與異源的修飾型結(jié)構(gòu)核酸序列相連??梢詫?duì)結(jié)構(gòu)核酸序列進(jìn)行修飾,以便提供各種所需特性。例如,可以對(duì)結(jié)構(gòu)核酸序列進(jìn)行修飾以增加必需氨基酸的含量,促進(jìn)對(duì)氨基酸序列的翻譯,改變翻譯后修飾(例如,磷酸化位點(diǎn)),將翻譯出的產(chǎn)物轉(zhuǎn)運(yùn)至細(xì)胞的內(nèi)側(cè)或外側(cè)的空間中,增加蛋白的穩(wěn)定性,插入或刪除細(xì)胞信號(hào)傳遞基序,等等。
在一優(yōu)選實(shí)施方案中,結(jié)構(gòu)核酸序列被強(qiáng)化,使得能編碼如下的多肽,該多肽中至少1種,更優(yōu)選2,3,或4中選自下組的必需氨基酸的含量增加組氨酸,賴(lài)氨酸,甲硫氨酸和苯丙氨酸。必要時(shí),也可以添加非必需氨基酸以強(qiáng)化多肽的結(jié)構(gòu)和營(yíng)養(yǎng)性。特別適于這類(lèi)強(qiáng)化作用的結(jié)構(gòu)核酸序列包括,編碼表達(dá)水平相對(duì)較高和/或必需氨基酸的含量特別低的天然多肽的那些。實(shí)例如種子貯藏蛋白,如大豆球蛋白和β-conglycinin。其它合適的目標(biāo)包括菜豆蛋白,凝集素,玉米醇溶蛋白和清蛋白。
在另一實(shí)施方案中,結(jié)構(gòu)核酸序列經(jīng)過(guò)修飾后,相對(duì)于改造前的結(jié)構(gòu)核酸序列,能編碼瘤胃抗性增強(qiáng)和/或?qū)Φ鞍琢呀庑越到庾饔玫目剐栽鰪?qiáng)的多肽。修飾的結(jié)構(gòu)核酸序列通常編碼適于摻入動(dòng)物膳食中的任何多肽。修飾的結(jié)構(gòu)核酸序列優(yōu)選編碼在給定的植物組織中以相對(duì)較高的濃度表達(dá)的多肽,如種子貯藏蛋白。
結(jié)構(gòu)核酸序列中的密碼子應(yīng)用特點(diǎn)由于遺傳密碼的簡(jiǎn)并性,可以用不同的核苷酸密碼子編碼給定的氨基酸。宿主細(xì)胞常常表現(xiàn)出優(yōu)選的密碼子應(yīng)用模式。優(yōu)選結(jié)構(gòu)核酸序列經(jīng)過(guò)構(gòu)建能利用給定宿主細(xì)胞的密碼子應(yīng)用模式。這通常能增強(qiáng)該結(jié)構(gòu)核酸序列在轉(zhuǎn)化的宿主細(xì)胞中的表達(dá)??蓪?duì)上述任一種核酸或氨基酸序列進(jìn)行修飾,以反映容納它們的宿主細(xì)胞或生物優(yōu)選的密碼子應(yīng)用特性。在植物中修飾結(jié)構(gòu)核酸序列,使密碼子應(yīng)用最優(yōu)化的方法可參見(jiàn)美國(guó)專(zhuān)利5,689,052。
對(duì)結(jié)構(gòu)核酸序列的其它修飾上述結(jié)構(gòu)核酸序列中的其它變化可編碼出與改造前的蛋白相比等效或更優(yōu)秀的蛋白。突變包括對(duì)基序序列進(jìn)行缺失,插入,截短,取代,融合,改組等。
對(duì)結(jié)構(gòu)核酸序列的突變可通過(guò)特定方式或隨機(jī)方式引入,這兩種方式都是分子生物學(xué)領(lǐng)域技術(shù)人員已知的。定點(diǎn)誘變技術(shù)有很多種,它們通常利用寡核苷酸將突變引入結(jié)構(gòu)核酸序列中的特定位置。實(shí)例包括單鏈挽救(Kunkel等,1985),唯一位點(diǎn)的消除(Deng和Nickloff,1992),缺口保護(hù)(Vandeyar等,1988),及PCR(Costa等,1996)。隨機(jī)或非特異性突變,可通過(guò)化學(xué)試劑產(chǎn)生(綜述參見(jiàn),Singer和Kusmierek,1982),如亞硝基胍(Cerda-Olmedo等,1968;Guerola等,1971)和2-氨基嘌呤(Rogan和Bessman,1970);或通過(guò)生物學(xué)方法產(chǎn)生,如由突變株傳代(Greener等,1997)。
修飾可以在氨基酸序列中導(dǎo)致保守或非保守的改變。保守改變?cè)醋詫?duì)結(jié)構(gòu)核酸序列進(jìn)行不改變蛋白的最終氨基酸序列的添加、缺失、取代等。在一個(gè)優(yōu)選實(shí)施方案中,蛋白包含0-500個(gè)保守改變,更優(yōu)選0-300個(gè)保守改變,還更優(yōu)選0-150個(gè)保守改變,最優(yōu)選0-75個(gè)保守改變。
非保守改變包括能導(dǎo)致氨基酸序列發(fā)生改變的那些添加、缺失和取代。在一優(yōu)選實(shí)施方案中,蛋白包含0-250個(gè)非保守氨基酸改變,更優(yōu)選0-100個(gè)非保守氨基酸改變,還更優(yōu)選0-50個(gè)非保守氨基酸改變,最優(yōu)選0-30非保守氨基酸改變。
產(chǎn)生上述改變的其它方法可參見(jiàn)Ausubel等(1995);Bauer等(1985);Craik(1985);Frits Eckstein等(1982);Sambrook等(1989);Smith等(1981);以及Osuna等(1994)。
可以對(duì)本發(fā)明的蛋白序列以及編碼它們的核酸節(jié)段進(jìn)行修飾但保留所述分子的所需特性。以下是關(guān)于對(duì)蛋白的氨基酸序列進(jìn)行改變來(lái)產(chǎn)生等效,或者可能更優(yōu)良的第二代分子的討論。氨基酸改變可以通過(guò)改變結(jié)構(gòu)核酸序列的密碼子來(lái)實(shí)現(xiàn),密碼子參見(jiàn)表1。
表1氨基酸的密碼子簡(jiǎn)并性
可以在不明顯損失所需活性的前題下,將蛋白序列中特定的氨基酸取代為其它氨基酸。從這一點(diǎn)上來(lái)看,可以在所公開(kāi)的蛋白序列的肽序列,或它們的相應(yīng)核酸序列中進(jìn)行多種改變而不明顯損失生物活性。
在制造這類(lèi)改變時(shí),可考慮氨基酸的疏水/親水傾向性指數(shù)。氨基酸的疏水/親水傾向性指數(shù)在賦于蛋白質(zhì)以交互式生物功能方面的重要性已為領(lǐng)域內(nèi)廣泛理解(Kyte和Doolittle,1982)??梢越邮艿氖?,氨基酸的相對(duì)疏水/親水傾向性決定所得蛋白的二級(jí)結(jié)構(gòu),而后者又限定了該蛋白與其它分子,如酶,底物,受體,DNA,抗體,抗原等的相互作用。
每種氨基酸基于其疏水性和荷電特性而分配了一個(gè)疏水/親水傾向性指數(shù)。具體是異亮氨酸(+4.5);纈氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/半胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);蘇氨酸(-0.7);絲氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);組氨酸(-3.2);谷氨酸/谷氨酰胺/天冬氨酸/天冬酰胺(-3.5);賴(lài)氨酸(-3.9);精氨酸(-4.5)。
本領(lǐng)域已知,特定氨基酸可以被具有相似疏水/親水傾向性指數(shù)或評(píng)分的其它氨基酸取代,所得蛋白質(zhì)仍具有相似的生物活性,即,仍能獲得生物功能性蛋白。在制造這類(lèi)改變時(shí),疏水/親水傾向性指數(shù)在±2以?xún)?nèi)的氨基酸的取代為優(yōu)選,在±1以?xún)?nèi)的為更優(yōu)選,在±0.5以?xún)?nèi)的為最優(yōu)選。
本領(lǐng)域也能理解,可以在親水性的基礎(chǔ)上有效地進(jìn)行相似氨基酸的取代。美國(guó)專(zhuān)利4,554,101(Hopp,T.P.,1985年11月19日授權(quán))稱(chēng),一種蛋白質(zhì)上受其鄰接氨基酸的親水性控制的最大局部平均親水性與該蛋白的生物學(xué)特性相關(guān)。氨基酸的親水值如下精氨酸/賴(lài)氨酸(+3.0);天冬氨酸/谷氨酸(+3.0±1);絲氨酸(+0.3);天冬酰胺/谷氨酰胺(+0.2);甘氨酸(0);蘇氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸/組氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);纈氨酸(-1.5);亮氨酸/異亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
可理解,一種氨基酸可以被具有相似的親水評(píng)分值的另一種氨基酸取代,所得蛋白質(zhì)仍具有相似的生物活性,即,仍能獲得生物功能性蛋白。在制造這類(lèi)改變時(shí),疏水/親水傾向性指數(shù)在±2以?xún)?nèi)的氨基酸的取代為優(yōu)選,在±1以?xún)?nèi)的為更優(yōu)選,在±0.5以?xún)?nèi)的為最優(yōu)選。
綜上所述,氨基酸取代因此是基于氨基酸側(cè)鏈取代基的相對(duì)相似性,例如,它們的疏水性,親水性,電荷,大小,等等。涉及上述多種特性的取代實(shí)例為本領(lǐng)域眾所周知,它們包括精氨酸和賴(lài)氨酸;谷氨酸和天冬氨酸;絲氨酸和蘇氨酸;谷氨酰胺和天冬酰胺;纈氨酸,亮氨酸,和異亮氨酸。對(duì)于不能預(yù)計(jì)有利的那些改變,如果能使所得的蛋白質(zhì)與原始未經(jīng)改造的多肽相比,瘤胃抗性增強(qiáng)和/或?qū)Φ鞍琢呀庑越到庾饔玫目剐栽鰪?qiáng),則也可以使用。
重組載體上述任何啟動(dòng)子和結(jié)構(gòu)核酸序列都可提供在重組載體中。重組載體通常按5’至3’方向依次包含能指導(dǎo)結(jié)構(gòu)核酸序列轉(zhuǎn)錄的啟動(dòng)子,以及結(jié)構(gòu)核酸序列。重組載體還可根據(jù)需要而包含3’轉(zhuǎn)錄終止子,3’聚腺苷酸化信號(hào),其它非翻譯核酸序列,轉(zhuǎn)位及靶向核酸序列,選擇標(biāo)記,增強(qiáng)子,和操縱子。
制備重組載體的方式為本領(lǐng)域已知。制備特別適于植物轉(zhuǎn)化的重組載體的方法可參見(jiàn)美國(guó)專(zhuān)利4,971,908,4,940,835,4,769,061和4,757,011。對(duì)這些類(lèi)型的載體已有綜述(Rodriguez等,1988;Glick等,1993)。
用于在高等植物中進(jìn)行核酸表達(dá)的典型載體為本領(lǐng)域已知,包括來(lái)自根癌土壤桿菌(Agrobacterium tumefaciens)的腫瘤誘導(dǎo)(Ti)質(zhì)粒的載體(Rogers等,1987)。其它可用于植物轉(zhuǎn)化的重組載體,包括pCaMVCN轉(zhuǎn)移控制載體,也已有記載(Fromm等,1985)。
重組載體中的啟動(dòng)子重組載體中所用的啟動(dòng)子優(yōu)選能在植物中高水平轉(zhuǎn)錄異源結(jié)構(gòu)核酸序列。更優(yōu)選,所述啟動(dòng)子與SEQ ID NO1,其互補(bǔ)鏈,或其任何片段雜交。適當(dāng)?shù)碾s交條件如上所述。優(yōu)選啟動(dòng)子的核酸序列在低度或高度嚴(yán)格條件下與SEQ ID NO1,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選啟動(dòng)子在高度嚴(yán)格條件下與SEQ ID NO1,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO1有至少85%相同的序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98或99%相同。最優(yōu)選啟動(dòng)子包含或者本身就是SEQ ID NO1。計(jì)算兩個(gè)或更多個(gè)核酸序列的同一性百分比的優(yōu)選方法如上所述。在另一實(shí)施方案中,啟動(dòng)子是如上所述的片段。
在另一實(shí)施方案中,所述啟動(dòng)子與SEQ ID NO2,其互補(bǔ)鏈,或其任何片段雜交。適當(dāng)?shù)碾s交條件如上所述。優(yōu)選啟動(dòng)子的核酸序列在低度或高度嚴(yán)格條件下與SEQ ID NO2,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選啟動(dòng)子在高度嚴(yán)格條件下與SEQ ID NO2,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO2有至少85%相同的序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98或99%相同。最優(yōu)選啟動(dòng)子包含或者本身就是SEQ ID NO2。計(jì)算兩個(gè)或更多個(gè)核酸序列的同一性百分比的優(yōu)選方法如上所述。在另一實(shí)施方案中,啟動(dòng)子是如上所述的片段。
在另一實(shí)施方案中,所述啟動(dòng)子與SEQ ID NO14,其互補(bǔ)鏈,或其任何片段雜交。適當(dāng)?shù)碾s交條件如上所述。優(yōu)選啟動(dòng)子的核酸序列在低度或高度嚴(yán)格條件下與SEQ ID NO14,其互補(bǔ)鏈,或其任何片段雜交。最優(yōu)選啟動(dòng)子在高度嚴(yán)格條件下與SEQ ID NO14,其互補(bǔ)鏈,或其任何片段雜交。
在另一實(shí)施方案中,啟動(dòng)子包含與SEQ ID NO14有至少85%相同的序列,更優(yōu)選至少86,87,88,89,90,91,92,93,94,95,96,97,98或99%相同。最優(yōu)選啟動(dòng)子包含或者本身就是SEQ ID NO14。計(jì)算兩個(gè)或更多個(gè)核酸序列的同一性百分比的優(yōu)選方法如上所述。在另一實(shí)施方案中,啟動(dòng)子是如上所述的片段。
重組載體中的附加啟動(dòng)子重組載體中還可提供一個(gè)或更多個(gè)附加啟動(dòng)子。這些啟動(dòng)子可與上述任何結(jié)構(gòu)核酸序列可操作相連。或者,所述啟動(dòng)子可與其它核酸序列,如編碼轉(zhuǎn)位肽、可選擇的標(biāo)記蛋白的那些序列、或反義序列,可操作相連。
這些附加啟動(dòng)子可根據(jù)載體所要插入的細(xì)胞類(lèi)型來(lái)選擇。在細(xì)菌、酵母和植物中具有功能的啟動(dòng)子為本領(lǐng)域已知。附加的啟動(dòng)子還可以根據(jù)它們的調(diào)節(jié)特性來(lái)選擇。這些特性的實(shí)例包括對(duì)轉(zhuǎn)錄活性、誘導(dǎo)能力、組織特異性、以及發(fā)育階段特異性的強(qiáng)化作用。已有文獻(xiàn)描述了植物中的誘導(dǎo)型啟動(dòng)子,病毒來(lái)源的或合成的啟動(dòng)子,組成型啟動(dòng)子,時(shí)間調(diào)節(jié)型啟動(dòng)子,以及空間調(diào)節(jié)型啟動(dòng)子(Poszkowski等,1989;Odell等,1985;Chau等,1989)。
常用的組成型啟動(dòng)子包括CaMV 35S啟動(dòng)子(Odell,J.T.等,1985),增強(qiáng)型CaMV 35S啟動(dòng)子,玄參花葉病毒(FMV)啟動(dòng)子(Richins等,1987),甘露氨酸合成酶(mas)啟動(dòng)子,胭脂氨酸合成酶(nos)啟動(dòng)子,以及章魚(yú)氨酸合成酶(ocs)啟動(dòng)子。
有用的誘導(dǎo)型啟動(dòng)子包括由水楊酸或聚丙烯酸誘導(dǎo)的啟動(dòng)子(PR-1;Williams,S.W.等,1992),由于應(yīng)用安全劑而誘導(dǎo)的啟動(dòng)子(安全劑如取代的苯磺酰胺除草劑;Hershey,H.P.and Stoner,T.D.,1991),熱休克啟動(dòng)子(Ou-Lee等,1986;Ainley等,1990),來(lái)源于菠菜亞硝酸根還原酶結(jié)構(gòu)核酸序列的硝酸根誘導(dǎo)型啟動(dòng)子(Back等,1991),激素誘導(dǎo)型啟動(dòng)子(Yamaguchi-Shinozaki等,1990;Kares等,1990),與RuBP羧化酶和LHCP家族的小亞單位結(jié)合的光誘導(dǎo)型啟動(dòng)子(Kuhlemeier等,1989;Feinbaum,R.L.等,1991;Weisshaar,B.等,1991;Lam,E.and Chua,N.H.,1990;Castresana,C.等,1988;Schulze-Lefert等,1989)。
有用的組織特異性、發(fā)育調(diào)節(jié)型啟動(dòng)子的實(shí)例包括β-conglycinin 7Sα’啟動(dòng)子(Doyle,J.J.等,1986;Slighton and Beachy,1987),和種子-特異性啟動(dòng)子(Knutzon,D.S.等,1992;Bustos,M.M.等,1991;Lam and Chua,1991;Stayton等,1991)??捎糜谠诜N子質(zhì)體中優(yōu)先表達(dá)的植物功能性啟動(dòng)子,包括來(lái)自植物貯藏蛋白的啟動(dòng)子,以及來(lái)自與含油種子中脂肪酸生物合成有關(guān)的蛋白的啟動(dòng)子。這類(lèi)啟動(dòng)子的實(shí)例包括下列結(jié)構(gòu)核酸序列的5’調(diào)節(jié)區(qū)napin(Kridl等,1991),菜豆蛋白,玉米醇溶蛋白,大豆胰蛋白酶抑制劑,ACP,硬脂酰-ACP去飽和酶,和油質(zhì)蛋白。對(duì)種子-特異性調(diào)節(jié)作用的描述可參見(jiàn)EP 0 255 378。
另一例組織特異性啟動(dòng)子是凝集素啟動(dòng)子,它特異于種子組織。大豆種子中的凝集素蛋白由單個(gè)結(jié)構(gòu)核酸序列(Lel)編碼,該序列僅在種子成熟期表達(dá),它占種子中總mRNA的大約2-5%。凝集素結(jié)構(gòu)核酸序列和種子特異性啟動(dòng)子目前已被全面鑒定,并用于指導(dǎo)轉(zhuǎn)基因煙草植物中的種子特異性表達(dá)(Vodkin等,1983;Lindstrom等,1990)。
重組載體中特別優(yōu)選的附加啟動(dòng)子包括攜帶在根癌土壤桿菌腫瘤誘導(dǎo)質(zhì)粒上的胭脂氨酸合成酶(nos)啟動(dòng)子,甘露氨酸合成酶(mas)啟動(dòng)子,以及章魚(yú)氨酸合成酶(ocs)啟動(dòng)子;花椰菜花葉病毒(CaMV)19S和35S啟動(dòng)子;增強(qiáng)型CaMV 35S啟動(dòng)子;玄參花葉病毒(FMV)35S啟動(dòng)子;核酮糖-1,5-二磷酸羧化酶(ssRUBISCO)小亞單位的光誘導(dǎo)型啟動(dòng)子;煙草EIF4A啟動(dòng)子(Mandel等,1995);谷物蔗糖合成酶1(Yang和Russell,1990);谷醇脫氫酶l(Vogel等,1989);谷物光收獲復(fù)合物(Simpson,1986);谷物熱休克蛋白(Odell等,1985);擬南芥殼多糖酶啟動(dòng)子(Samac等,1991);花椰菜LTP(脂轉(zhuǎn)移蛋白)啟動(dòng)子(Pyee等,1995);矮牽牛查耳酮異構(gòu)酶(Van Tunen等,1988);菜豆甘氨酸富集蛋白1(Keller等,1989);土豆patatin(Wenzler等,1989);玉米遍在蛋白啟動(dòng)子(Christensen等,1992);以及水稻肌動(dòng)蛋白啟動(dòng)子(McElroy等,1990)。
附加啟動(dòng)子優(yōu)選具有種子選擇性,組織選擇性,為組成型或誘導(dǎo)型。最優(yōu)選的啟動(dòng)子為胭脂氨酸合成酶(nos),章魚(yú)氨酸合成酶(ocs),甘露氨酸合成酶(mas),花椰菜花葉病毒19S和35S(CaMV19S,CaMV35S),增強(qiáng)型CaMV(eCaMV),核酮糖-1,5-二磷酸羧化酶(ssRUBISCO),玄參花葉病毒(FMV),CaMV衍生的AS4,煙草RB7,小麥POX1,煙草EIF-4,凝集素蛋白(Lel),或水稻RC2的啟動(dòng)子。
重組核酸載體中的結(jié)構(gòu)核酸序列重組載體中的啟動(dòng)子優(yōu)選與結(jié)構(gòu)核酸序列可操作相連。結(jié)構(gòu)核酸序列及其修飾形式的實(shí)例見(jiàn)上文詳述。本發(fā)明的啟動(dòng)子可與相對(duì)于該啟動(dòng)子為異源的結(jié)構(gòu)核酸序列可操作相連。一方面,結(jié)構(gòu)核酸序列一般可以是需要提高轉(zhuǎn)錄水平的任何核酸序列。結(jié)構(gòu)核酸序列優(yōu)選編碼適于摻入人或動(dòng)物膳食中的多肽。適當(dāng)?shù)慕Y(jié)構(gòu)核酸序列包括編碼種子貯藏蛋白,除草劑抗性蛋白,疾病抗性蛋白,脂肪酸生物合成酶,維生素E生物合成酶,氨基酸生物合成酶,或殺蟲(chóng)蛋白的那些。優(yōu)選的結(jié)構(gòu)核酸序列包括,但不限于,γ甲基轉(zhuǎn)移酶、葉綠基異戊烯轉(zhuǎn)移酶、β-酮脂酰-CoA合酶、脂酰CoA還原酶、脂酰CoA脂醇轉(zhuǎn)酰酶、鄰氨基苯甲酸合酶、蘇氨酸脫氨酶、乙酰羥酸合成酶、天冬氨酸激酶、二羥酸合成酶、天冬氨酸激酶、二氫吡啶甲酸合成酶、硫酯酶、7Sα’種子貯藏蛋白、11S種子貯藏蛋白、大豆球蛋白、β-conglycinin、菜豆蛋白、玉米球蛋白-1、玉米醇溶蛋白、種子清蛋白、或種子凝集素。
或者,可設(shè)計(jì)啟動(dòng)子和結(jié)構(gòu)核酸序列以便下調(diào)特定核酸序列。這通常通過(guò)將啟動(dòng)子與反義方向的結(jié)構(gòu)核酸序列相連來(lái)實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員很熟悉這類(lèi)反義技術(shù)。簡(jiǎn)短說(shuō),轉(zhuǎn)錄出反義核酸序列后,它與互補(bǔ)核酸序列雜交并使后者被封閉在細(xì)胞內(nèi)側(cè)。這種雙鏈RNA分子不能通過(guò)細(xì)胞的翻譯機(jī)制翻譯為蛋白。這就使細(xì)胞內(nèi)的互補(bǔ)核酸序列由于后續(xù)翻譯步驟的中斷而被有效下調(diào)。
任何核酸序列都可能以這種方式進(jìn)行負(fù)調(diào)節(jié)。這類(lèi)調(diào)節(jié)作用的目標(biāo)可包括必需氨基酸含量低、但在特定組織中以相對(duì)較高水平表達(dá)的多肽。例如,β-conglycinin和大豆球蛋白都在種子中大量表達(dá),但在營(yíng)養(yǎng)方面缺少必需氨基酸。這種反義方法也可用于有效除去植物來(lái)源的食物中其它不想要的蛋白,如拒食劑(例如,凝集素),清蛋白,和變應(yīng)原。
帶有附加的結(jié)構(gòu)核酸序列的重組載體重組載體還可包含一或多個(gè)附加的結(jié)構(gòu)核酸序列。這些附加結(jié)構(gòu)核酸序列通常為適于在重組載體中使用的任何序列。這樣的結(jié)構(gòu)核酸序列包括上述任一種結(jié)構(gòu)核酸序列及其修飾形式。附加結(jié)構(gòu)核酸序列還可與上述任一種啟動(dòng)子可操作相連。所述一或多個(gè)結(jié)構(gòu)核酸序列可分別與不同(separate)啟動(dòng)子可操作相連?;蛘?,多個(gè)結(jié)構(gòu)核酸序列可與單個(gè)啟動(dòng)子可操作相連(即,單個(gè)操縱子)。
附加結(jié)構(gòu)核酸序列優(yōu)選編碼種子貯藏蛋白,除草劑抗性蛋白,疾病抗性蛋白,脂肪酸生物合成酶,維生素E生物合成酶,氨基酸生物合成酶,或殺蟲(chóng)蛋白。優(yōu)選的結(jié)構(gòu)核酸序列包括,但不限于,γ甲基轉(zhuǎn)移酶、葉綠基異戊烯轉(zhuǎn)移酶、β-酮脂酰-CoA合酶、脂酰CoA還原酶、脂酰CoA脂醇轉(zhuǎn)酰酶、鄰氨基苯甲酸合酶、蘇氨酸脫氨酶、乙酰羥酸合成酶、天冬氨酸激酶、二羥酸合成酶、天冬氨酸激酶、二氫吡啶甲酸合成酶、硫酯酶、7Sα’種子貯藏蛋白、11S種子貯藏蛋白、大豆球蛋白、β-conglycinin、菜豆蛋白、玉米球蛋白-1、玉米醇溶蛋白、種子清蛋白、或種子凝集素。
或者,可將第二種結(jié)構(gòu)核酸序列設(shè)計(jì)成能下調(diào)特定的核酸序列。這通常通過(guò)將第二種結(jié)構(gòu)氨基酸按照反義方向與啟動(dòng)子可操作相連來(lái)實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員很熟悉這類(lèi)反義技術(shù)。該方法也已在上文中簡(jiǎn)述。任何核酸序列都可能以這種方式進(jìn)行負(fù)調(diào)節(jié)。優(yōu)選的目標(biāo)核酸序列包含低含量的必需氨基酸、但在特定組織中以相對(duì)較高水平表達(dá)。例如,β-conglycinin和大豆球蛋白都在種子中大量表達(dá),但在營(yíng)養(yǎng)方面缺少必需氨基酸。這種反義方法也可用于有效除去植物來(lái)源的食物中其它不想要的蛋白,如拒食劑(例如,凝集素),清蛋白,和變應(yīng)原。
選擇標(biāo)記重組載體還可包含選擇標(biāo)記。能用作選擇標(biāo)記的核酸序列產(chǎn)生細(xì)胞表型,使這些細(xì)胞比不含該標(biāo)記的細(xì)胞更容易被鑒定。
選擇標(biāo)記的實(shí)例包括,但不限于neo基因(Potrykus等,1985),它編碼卡那霉素抗性基因,可用卡那霉素,G418等進(jìn)行篩選;bar基因,它編碼bialaphos抗性;突變的EPSP合成酶基因(Hinchee等,1988),它編碼草甘膦抗性;腈水解酶基因,它賦予對(duì)溴苯腈的抗性(Stalker等,1988);突變的乙酰乳酸合成酶基因(ALS),它賦予對(duì)咪唑啉酮或磺脲的抗性(歐洲專(zhuān)利申請(qǐng)0154204);綠色熒光蛋白(GFP);以及氨甲喋呤抗性DHFR基因(Thillet等,1988)。
選擇標(biāo)記的其它實(shí)例包括β-葡萄糖醛酸糖苷酶或uidA基因(GUS),它編碼一種酶,該酶的多種顯色底物是已知的(Jefferson(I),1987;Jefferson(II)等,1987);一種R-座基因,它編碼一種產(chǎn)物,該產(chǎn)物調(diào)節(jié)植物組織中花色素苷(紅色)的產(chǎn)生(Dellaporta等,1988);β-內(nèi)酰胺酶基因(Sutcliffe等,1978),它編碼一種酶,該酶的多種顯色底物是已知的(例如,PADAC,一種顯色的頭孢菌素);螢光素酶基因(Ow等,1986);xylE基因(Zukowsky等,1983),它編碼一種兒茶酚雙加氧酶,此酶可轉(zhuǎn)化顯色型兒茶酚;α-淀粉酶基因(Ikatu等,1990);酪氨酸酶基因(Katz等,1983),它編碼一種能將酪氨酸氧化為DOPA和多巴醌(dopaquinone,進(jìn)一步濃縮為黑色素)的酶;α-半乳糖苷酶,可使顯色的α-半乳糖底物發(fā)生轉(zhuǎn)變。
術(shù)語(yǔ)“選擇標(biāo)記”還包括編碼選擇標(biāo)記的基因,所述選擇標(biāo)記是指其檢測(cè)可作為鑒定或篩選轉(zhuǎn)化細(xì)胞的手段的那些。實(shí)例包括編碼可通過(guò)抗體相互作用予以鑒定的分泌型抗原的標(biāo)記物,或甚至可通過(guò)催化檢測(cè)的分泌型酶。分泌型選擇標(biāo)記蛋白可分為數(shù)類(lèi),包括可通過(guò)(例如,ELISA)檢測(cè)的小分子可擴(kuò)散型蛋白,可在胞外溶液中檢測(cè)到的小分子活性酶(例如,α-淀粉酶,β-內(nèi)酰胺酶,膦絲菌素轉(zhuǎn)移酶),或者插入或陷落在細(xì)胞壁中的蛋白(如包含前導(dǎo)序列的蛋白,如發(fā)現(xiàn)于延伸的表達(dá)單元中的蛋白,或煙草PR-S)。其它可能的選擇標(biāo)記基因?qū)Ρ绢I(lǐng)域技術(shù)人員而言是顯而易見(jiàn)的。
選擇標(biāo)記優(yōu)選為GUS,綠色熒光蛋白(GFP),新霉素磷酸轉(zhuǎn)移酶II(nptII),螢光素酶(LUX),抗生素抗性編碼序列,或除草劑(例如,草甘膦)抗性編碼序列。選擇標(biāo)記最優(yōu)選卡那霉素,潮霉素,或除草劑抗性標(biāo)記。
重組載體中的其它元件各種具有順式作用的非翻譯5’和3’調(diào)節(jié)序列也可以包括在重組核酸載體中。任何這類(lèi)調(diào)節(jié)序列可在重組載體中伴有其它調(diào)節(jié)序列??赏ㄟ^(guò)設(shè)計(jì)或改變這類(lèi)組合來(lái)產(chǎn)生所需的調(diào)節(jié)特征。調(diào)節(jié)序列的組合的實(shí)例包括,但不限于表2所列的那些。
3’非翻譯區(qū)通常提供轉(zhuǎn)錄終止信號(hào),聚腺苷酸化信號(hào),后者在值物中能導(dǎo)致腺苷酸添加在mRNA的3’末端。這可通過(guò)下述序列的3’區(qū)實(shí)現(xiàn)胭脂氨酸合成酶(nos)編碼序列,大豆7Sα’貯藏蛋白編碼序列,Arcelin-5編碼序列,清蛋白編碼序列,以及豌豆ssRUBISCO E9編碼序列。特別優(yōu)選的3’核酸序列包括Arcelin-5 3’,nos 3’,E9 3’,adrl2 3’,7Sα’3’,11S 3’,USP 3’,以及清蛋白3’。
位于距聚腺苷酸化位點(diǎn)數(shù)百個(gè)堿基對(duì)的下游處的核酸序列通常可終止轉(zhuǎn)錄。這些區(qū)是轉(zhuǎn)錄的mRNA進(jìn)行有效腺苷酸化所必需的。
重組載體中還可摻入翻譯增強(qiáng)子。因此,重組載體優(yōu)選包含一或多個(gè)5’非翻譯前導(dǎo)序列,以便增強(qiáng)核酸序列的表達(dá)。這類(lèi)增強(qiáng)子序列預(yù)計(jì)能增強(qiáng)或改變所得mRNA的翻譯效力。優(yōu)選的5’核酸序列包括dSSU 5’,PetHSP705’,和GmHSP17.95’。
重組載體還可包含編碼轉(zhuǎn)位肽的核酸序列。這種肽可用于將蛋白引到胞外空間,葉綠體,或細(xì)胞內(nèi)側(cè)或外側(cè)的其它空間中(參見(jiàn),例如歐洲專(zhuān)利申請(qǐng)
發(fā)明者王 琦, 帕特里克·杜波依斯, 梁繼紅, 蒂姆·烏爾馬索夫 申請(qǐng)人:孟山都技術(shù)公司