專利名稱:單子葉植物中的淀粉胚乳特異性和/或萌芽胚特異性表達的制作方法
專利說明單子葉植物中的淀粉胚乳特異性和/或萌芽胚特異性表達 發(fā)明鄰域 本發(fā)明涉及農(nóng)業(yè)生物技術(shù)領(lǐng)域。在本文中公開了對淀粉胚乳和/或萌芽胚具有表達特異性的表達構(gòu)建體、包含此類表達構(gòu)建體的轉(zhuǎn)基因植物以及產(chǎn)生和使用此類DNA構(gòu)建體和轉(zhuǎn)基因植物的方法。
背景技術(shù):
在農(nóng)學(xué)重要的谷物作物中,種子形成是植物發(fā)育的最終目標。收獲種子用于食品、飼料及工業(yè)產(chǎn)品。這些種子的用途和價值由種子中所含有的蛋白質(zhì)、油及淀粉決定。于是,所產(chǎn)生種子的質(zhì)量和數(shù)量可能在受精前至種子成熟的任何時點上受環(huán)境條件影響。尤其,在受精時刻及其附近的脅迫可以明顯影響種子發(fā)育。包括谷類在內(nèi)的禾本科(Poaceae)成員產(chǎn)生干燥的單種子果實。嚴格說,這種類型的果實是穎果,但通常叫做谷粒(kernal或grain)。穎果的果皮或囊果皮包圍種子并且與種皮緊密結(jié)合。種子由胚或胚原基構(gòu)成并且胚乳由珠心表皮和種皮包裹。因此,谷粒包含種子和種子的外衣或囊果皮。種子包含胚及胚乳。(R.Carl Hoseney in“Principles ofCereal Science and Technology”特意地完整引用作為參考)。
能育的谷物植物含有通常分別稱作雄花穗和谷穗的雄性繁殖組織和雌性繁殖組織。雄花穗組織形成單倍體花粉粒,每一花粉粒內(nèi)具有兩個核,其中在花開期被散播時,所述的花粉粒與雌性谷穗的穗絲接觸。谷穗可以位于散播花粉的相同植物上,或位于不同植物上?;ǚ奂毎l(fā)育成稱作花粉管的結(jié)構(gòu),其中所述的花粉管向下延伸經(jīng)單個雌性穗絲抵達胚珠。兩個雄性核移動穿過花粉管以抵達位于穗絲基部的單倍體雌性卵。兩個雄性核中的一個雄性核與單倍體雌性卵核融合并且使該卵核受精以形成合子,其中所述的合子在染色體數(shù)目上是二倍體并且將變成谷粒內(nèi)的胚。另一個雄性核與第二個雌性卵核融合并且使該卵核受精以形成初生胚乳核,其中所述的初生胚乳核在染色體數(shù)目上是三倍體并且將變成谷物植物谷?;蚍N子中的胚乳。未受精的胚珠不產(chǎn)生谷粒并且未受精的組織最終退化。
谷粒由多個部分組成,其中某些部分衍生自母體組織并且其它部分來自受精過程。谷粒從母體繼承多種組織,包括保護性周邊囊果皮和花梗。花梗是將谷粒連接至穗軸并且提供從母體組織至谷粒的營養(yǎng)轉(zhuǎn)移的短柱樣組織。谷粒含有因受精活動而產(chǎn)生的組織,包括新胚和胚乳。胚是下一世代的縮微祖先,含有用于新生幼齡谷物植物的根和枝條生長的細胞。胚還是谷粒內(nèi)貯藏油和蛋白質(zhì)的一種組織。胚乳也充當(dāng)營養(yǎng)組織并且提供為胚萌發(fā)及初期生長所需的貯藏淀粉、蛋白質(zhì)和油形式的能量。
鑒于高等植物中在胚及谷粒發(fā)育期間存在的復(fù)雜調(diào)節(jié),以及鑒于谷粒通常是動物及人類營養(yǎng)的主要來源,為改善此類營養(yǎng)源所需要的重要工具包括可以驅(qū)動營養(yǎng)增強基因表達的遺傳啟動子。另一方面,胚對脅迫高度敏感。對植物的脅迫可以因生物介質(zhì)和非生物介質(zhì)引起。例如,脅迫的生物原因包括病原體感染、昆蟲采食及由另一種植物(如槲寄生)寄生以及反芻動物啃食。非生物性脅迫例如包括過量或不充分的可用水、不充分光照、極端溫度、合成性化學(xué)品(如除草劑)、大風(fēng)、土壤極端pH、有限的營養(yǎng)獲得性和空氣污染。然而,利用多種躲避或忍受脅迫的內(nèi)部機制及外部機制,植物存活下來并且經(jīng)常枝繁葉茂,甚至在不利條件下也是如此。植物對脅迫的生理應(yīng)答反應(yīng)反映了在基因表達上的改變。
盡管操作脅迫誘導(dǎo)型基因可能在改善植物對脅迫耐受方面發(fā)揮重要作用,然而已經(jīng)證實當(dāng)脅迫不存在時,脅迫誘導(dǎo)型基因的組成型表達不利地影響植物生長及發(fā)育(Kasuga 1999)。因此,本領(lǐng)域需要具有驅(qū)動時間差異表達和/或空間差異表達的啟動子,以提供在特定細胞或特定組織中在關(guān)鍵時間處控制并指導(dǎo)基因表達的手段,尤其旨在提供脅迫耐受性或回避性。尤其,玉米的干旱脅迫和/或密度脅迫經(jīng)常導(dǎo)致減產(chǎn),一般是因植物不能在谷穗頂端內(nèi)結(jié)實并填充種子,這是一種稱作“頂端谷粒流產(chǎn)”或俗稱為“nosing back”的病癥。為了在不利環(huán)境下穩(wěn)定植物發(fā)育及谷物產(chǎn)量,調(diào)節(jié)對發(fā)育著的谷穗及其谷粒的激素和碳供應(yīng)是有意義的。因此,需要在非生物脅迫條件下在雌性繁殖組織中驅(qū)動基因表達的啟動子。
植物生物技術(shù)領(lǐng)域內(nèi)另一個眾所周知的問題是標記缺失(marker-deletion)。選擇性標記在轉(zhuǎn)化過程用于選擇并鑒定轉(zhuǎn)化的生物,然而在已經(jīng)鑒定轉(zhuǎn)化的生物后,該選擇性標記一般不提供有用功能并且成為消費者不接受這些“基因食品”產(chǎn)品的主要原因(Kuiper 2001),并且?guī)缀醯貌坏讲灰赃@些機制為基礎(chǔ)的標記(Hare 2002)。因此,反復(fù)嘗試以開發(fā)這樣的技術(shù),其中借助此技術(shù)可以從植物基因組中切除標記DNA(Ow1995;Gleave 1999)。本領(lǐng)域技術(shù)人員熟悉用于位點定向地去除已重組導(dǎo)入的核酸序列的多種系統(tǒng)。這些系統(tǒng)主要基于使用序列特異性的重組酶。已描述多種序列特異性重組系統(tǒng),如噬菌體P1的Cre/lox系統(tǒng)(Dale 1991;Russell 1992;Osborne 1995)、酵母FLP/FRT系統(tǒng)(Kilby 1995;Lyznik1996)、Mu噬菌體Gin重組酶、大腸桿菌Pin重組酶、質(zhì)粒pSR1的R/RS系統(tǒng)(Onouchi1995;Sugita2000)、attP/噬菌體λ系統(tǒng)(Zubko2000)。這些已知方法在現(xiàn)有技術(shù)內(nèi)的一個已知缺點是在整個植物范圍內(nèi)切除的不均一性,因此導(dǎo)致嵌合式的切除模式,這需要繁瑣的額外選擇和再生輪次。
還描述了在種子或谷粒成熟期間賦予表達增強的啟動子(如大麥(barley)的大麥醇溶蛋白啟動子;見美國專利申請20040088754)。在雙子葉植物中指導(dǎo)胚特異性或種子特異性表達的啟動子(例如大豆(soybean)伴大豆球蛋白啟動子;Chen 1988;油菜籽蛋白啟動子,Kridl 1991)通常不能在單子葉植物中指導(dǎo)相似的表達。不幸地是,相當(dāng)少的啟動子被鑒定為特異性指導(dǎo)此方面的生理學(xué)(見例如US20040163144)。
章魚堿合酶(ocs)基因啟動子和甘露氨酸合酶(mas)基因啟動子已經(jīng)用來在轉(zhuǎn)基因植物中指導(dǎo)表達連接的基因。然而,這些啟動子的應(yīng)用已經(jīng)因為在轉(zhuǎn)基因植物某些組織中的弱表達水平而受到限制(DiRita1987;Harpster 1988;Sanger 1990)。例如,ocs啟動子在轉(zhuǎn)基因煙草中指導(dǎo)差異明顯的細胞特異性表達模式(Kononowicz 1992)。mas基因在葉和莖內(nèi)顯示弱表達,但在根中具有較強的表達并且顯示一定程度的傷口誘導(dǎo)性和植物生長素誘導(dǎo)性(Langridge 1989;Teeri 1989;;Saito 1991;Guevara-Garcia1993)。描述了用于在植物中表達基因的嵌合啟動子,其中所述的嵌合啟動子包含與根癌農(nóng)桿菌(Agrobactrium tumerfeciens)冠癭堿合酶啟動子有效連接的根癌農(nóng)桿菌冠癭堿合酶上游激活序列(Ni 1995;US 5,955,646)。表征最充分的序列是所謂“超級啟動子”,這種嵌合構(gòu)建體包含衍生自根癌農(nóng)桿菌章魚堿合酶基因的三個上游激活序列并與衍生自根癌農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接。雖然廣泛用于雙子葉植物,然而該啟動子對單子葉植物的應(yīng)用經(jīng)驗非常有限。Kononov等(AComparative Study of the Activity of the Super-promoter with OtherPromoters in Maize(1999)第20屆crown gall年會,德克薩斯-豪斯頓大學(xué)醫(yī)學(xué)院;摘要集,第36頁;Comparative Study of the Activity of theSuper-promoter and Other Promoters in Maize(1998)第19屆crown gall年會,普渡大學(xué),West Lafayette,印第安納州])證實在多種類型組織中的表達。表達在全部組織內(nèi)是幾乎相同的,但在根內(nèi)升高。與遍在蛋白啟動子相反,據(jù)報道內(nèi)含子序列存在與否不影響超級啟動子的轉(zhuǎn)錄活性。
因此本領(lǐng)域中首要需要如此啟動子序列,該序列允許在種子發(fā)育期間在淀粉胚乳中的表達以及在種子早期萌發(fā)期間在胚中的表達。另外,本領(lǐng)域中其次迫切需要這樣的啟動子序列,該序列允許以如此方式強烈地表達介導(dǎo)切除的酶以至所得植物基本上沒有標記。
對于本領(lǐng)域中的首要需要,描述了一些種子特異性啟動子或谷粒特異性啟動子,包括與編碼植物種子貯藏蛋白的基因(如編碼大麥醇溶蛋白、稻(rice)的稻谷蛋白、水稻素、谷醇溶蛋白或球蛋白;小麥(wheat)的麥醇溶蛋白或麥谷蛋白;玉米(maize)的玉米醇溶蛋白或谷蛋白;燕麥(oat)的谷蛋白;高粱(sorghum)的高粱醇溶蛋白;黍(millet)pennisetins或黑麥(rye)的裸麥醇溶蛋白的基因)連接的那些啟動子。然而,這些啟動子的表達經(jīng)常具有泄露性或其表達水平低。此外,已經(jīng)指出用多重轉(zhuǎn)基因(“堆積”)對作物植物改良正越來越有意義。例如,單個玉米雜交體可以包含賦予昆蟲抗性和特定除草劑抗性的重組DNA構(gòu)建體。需要適宜的調(diào)節(jié)序列以驅(qū)動這些轉(zhuǎn)基因或其它目的轉(zhuǎn)基因按需要表達。此外,重要的是調(diào)節(jié)性元件應(yīng)當(dāng)彼此明顯不同。與利用相似調(diào)節(jié)序列驅(qū)動多重基因表達相關(guān)的擔(dān)憂包括,但不限于(a)整合前在質(zhì)粒內(nèi)或整合后在植物基因組中,沿同源區(qū)域的配對、交叉及間插區(qū)域丟失;(b)由相反方向彼此鄰近的序列的兩個拷貝導(dǎo)致的發(fā)夾環(huán),以及切除和丟失這些調(diào)節(jié)區(qū)域的可能性;(c)相同啟動子區(qū)域的不同拷貝間對結(jié)合啟動子特異性轉(zhuǎn)錄因子或其它調(diào)節(jié)性DNA結(jié)合蛋白的競爭。
因此,本領(lǐng)域中迫切需要鑒定可以用于在經(jīng)濟重要的植物尤其在單子葉植物中表達選擇的轉(zhuǎn)基因的新序列。因此,本發(fā)明目的是提供用于胚乳和/或胚偏好性或特異性表達的新穎和備選的表達盒。該目的由本發(fā)明實現(xiàn)。
發(fā)明概述 本發(fā)明的第一實施方案涉及包含表達盒的單子葉植物,所述表達盒包含 a)嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列, ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列, 與該嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接 b)至少一個核酸序列,其相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并且適用于賦予植物選自如下的性狀或特性 i)抗至少一種脅迫因子的增強抗性, ii)提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量, iii)提高的產(chǎn)量,和 iv)靶向的序列切除。
優(yōu)選地,衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列和/或衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列源自根癌農(nóng)桿菌菌株。
優(yōu)選地,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列引起所述的異源DNA主要在淀粉胚乳或萌芽胚中表達。
形成本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可能有多種形式。優(yōu)選地,所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含至少三個衍生自根癌農(nóng)桿菌章魚堿合酶基因的上游激活序列,其中所述的上游激活序列與至少一個衍生自根癌農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接。更優(yōu)選地,所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列還包含至少一個衍生自根癌農(nóng)桿菌甘露氨酸合酶基因的上游激活序列。
在一個優(yōu)選的實施方案中,衍生自根癌農(nóng)桿菌的甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列由選自如下的序列描述 i)SEQ ID NO2或3描述的序列, ii)SEQ ID NO2或3所述序列中至少50個連續(xù)堿基的片段, iii)與SEQ ID NO2或3所述的序列具有至少60%序列同一性的核苷酸序列, iv)能夠與SEQ ID NO2或3所述的序列、或其互補序列(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5MNaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; v)能夠與包含SEQ ID NO2或3所述序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸的核酸(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5MNaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列。
在另一個優(yōu)選的實施方案中,衍生自根癌農(nóng)桿菌的章魚堿合酶基因的上游激活序列由選自如下的序列描述 i)SEQ ID NO1描述的序列, ii)SEQ ID NO1所述序列的至少50個連續(xù)堿基的片段, iii)與SEQ ID NO1所述的序列具有至少60%序列同一性的核苷酸序列, iv)能夠與SEQ ID NO1所述序列、或其互補序列(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mMEDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mMEDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; v)能夠與包含SEQ ID NO1所述的序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸的核酸(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5MNaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列. 在更優(yōu)選的實施方案中,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含來自章魚堿合酶基因的上游激活序列和來自甘露氨酸合酶基因的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的特定組合。
在更優(yōu)選的實施方案中,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列由選自如下的序列描述 i)SEQ ID NO4描述的序列, ii)SEQ ID NO4所述序列的至少50個連續(xù)堿基的片段, iii)與SEQ ID NO4所述序列具有至少60%序列同一性的核苷酸序列, iv)能夠與SEQ ID NO4所述序列、或其互補序列(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mMEDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mMEDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; v)能夠與包含SEQ ID NO4所述序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸的核酸(優(yōu)選地在等同于如此條件下,即在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌下)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列。
在ii)、iii)、iv)、v)和vi)下所述的序列優(yōu)選地能夠在單子葉植物細胞或單子葉植物生物中調(diào)節(jié)轉(zhuǎn)錄,它們更優(yōu)選地能夠誘導(dǎo)淀粉胚乳特異性表達和/或胚特異性表達。優(yōu)選地,在iv)或v)下所述的序列在嚴格條件下與所述的靶序列雜交。
在另一個優(yōu)選的實施方案中,本發(fā)明的表達盒不包含具有表達增強特性的與所述嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列有效連接的內(nèi)含子。有效連接的多核苷酸可以編碼如任一SEQ ID NO6、8、10、12、14、16、18、20、22、43、45、47、49、50、51或53所述的多肽或其功能等同物,其中所述的功能等同物能夠帶來與任一所述多肽所致的相同表型。下文給出更多實例。
核酸序列在嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列控制下的表達可以導(dǎo)致表達蛋白質(zhì)或表達反義RNA、有義RNA或雙鏈RNA。
可以有利獲得的脅迫抗性優(yōu)選地對抗非生物性或生物性脅迫因子。生物性脅迫因子可以選自真菌抗性、線蟲抗性、昆蟲抗性、病毒抗性和細菌抗性。優(yōu)選地,生物性脅迫因子是種子攜帶的(主要是真菌疾病,例如主要在小麥中的普通腥黑穗病(小麥光腥黑穗菌(Tilletia tritici));主要在大麥中的條紋病條紋病(大麥條紋病菌(Pyrenophora graminea))和散黑穗病(麥散黑粉菌(Ustilago nuda))。
非生物性脅迫因子可以選自水脅迫抗性、干旱抗性、寒冷抗性、鹽抗性、高的植物群體密度和紫外線抗性。優(yōu)選地,脅迫抗性通過誘導(dǎo)早期萌發(fā)勢而實現(xiàn)。
本領(lǐng)域技術(shù)人員已知可獲得此類脅迫抗性的多種核酸序列。所述的序列可以包括,但不限于編碼參與植物激素生物合成、植物激素調(diào)節(jié)、細胞周期調(diào)節(jié)或糖代謝的多肽的多核苷酸。
本發(fā)明可應(yīng)用于全部單子葉植物如玉米、小麥、稻、大麥、燕麥、黑麥、高粱、黍、tricalate、香蕉(banana)、黑麥草(ryegrass)或薏苡(coix),然而優(yōu)選地適用于禾本科中產(chǎn)生谷粒的谷類植物如玉米、小麥、稻、大麥、燕麥、黑麥、高粱、黍或tricalate,優(yōu)選玉米、大麥和小麥,最優(yōu)選玉米。
本發(fā)明的又一實施方案涉及本發(fā)明單子葉植物的種子、部分和細胞。優(yōu)選地,植物部分選自細胞、原生質(zhì)體、細胞組織培養(yǎng)物、愈傷組織、細胞團塊、胚、花粉、胚珠、種子、花、谷粒、谷穗、穗軸、葉、外殼、柄、根、根尖、花藥和穗絲。
本發(fā)明的又一個實施方案涉及用于賦予單子葉植物增強的脅迫抗性的方法,該方法包括步驟 a)構(gòu)建表達盒,為將包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,和 ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列的至少一個嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接到相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并且適用于賦予植物增強的抗脅迫抗性的至少一個核酸序列,并且 b)將所述的表達盒插入單子葉植物中以提供轉(zhuǎn)基因植物,其中所述的植物表達所述的異源核酸序列,和 c)選擇轉(zhuǎn)基因植物,其中所述的轉(zhuǎn)基因植物與不包含所述表達盒但是在其它方面與該轉(zhuǎn)基因植物相同的植物相比,表現(xiàn)出對至少一個脅迫因子的增強的抗性。
本領(lǐng)域技術(shù)人員已知可獲得此類脅迫抗性的多種核酸序列。所述序列可以包括但不限于編碼參與植物激素生物合成、植物激素調(diào)節(jié)、細胞周期調(diào)節(jié)或糖代謝的多肽的多核苷酸。脅迫因子優(yōu)選地如上定義。待表達(例如表達為有義RNA、反義RNA或雙鏈RNA)的異源核酸序列可以編碼如任一SEQ ID NO6、8、16、18、20、43、45、47、49、50、51或53所述的多肽(或其部分;優(yōu)選地是至少5個、更優(yōu)選至少10個、最優(yōu)選至少30個連續(xù)氨基酸的部分),或其功能等同物,其中所述的功能等同物能夠帶來與任一所述多肽所致的相同表型。優(yōu)選的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列如上所述,最優(yōu)選超級啟動子。
本發(fā)明的又一個實施方案涉及用于賦予單子葉植物提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量的方法,所述方法包括步驟 a)構(gòu)建表達盒,為將包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,和 ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列的至少一個嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接到相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并且適用于賦予植物提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量的至少一個核酸序列,并且 b)將所述的表達盒插入單子葉植物中以提供轉(zhuǎn)基因植物,其中所述的植物表達所述的異源核酸序列,和 c)選擇轉(zhuǎn)基因植物,其中所述轉(zhuǎn)基因植物與不包含所述的表達盒但是在其它方面與該轉(zhuǎn)基因植物相同的植物相比,表現(xiàn)出提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量。
營養(yǎng)質(zhì)量可以包含選自維生素、類胡蘿卜素、抗氧化劑、不飽和脂肪酸和多不飽和脂肪酸的至少一種化合物的增加的含量。待表達(例如表達為有義RNA、反義RNA或雙鏈RNA)的異源核酸序列可以編碼如任一的SEQID NO10、12或14所述的多肽(或其部分;優(yōu)選地是至少5個、更優(yōu)選至少10個、最優(yōu)選至少30個連續(xù)氨基酸的部分),或其功能等同物,其中所述的功能等同物能夠帶來與任一所述多肽所致的相同表型。
營養(yǎng)質(zhì)量及待表達的相應(yīng)異源核酸序列如上定義。更具體的實例在下文給出。優(yōu)選的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列如上所述,最優(yōu)選超級啟動子。
本發(fā)明的又一個實施方案涉及用于賦予單子葉植物提高的產(chǎn)量的方法,所述方法包括步驟 a)構(gòu)建表達盒,為將包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,和 ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列,的至少一個嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接到相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并且適用于賦予植物提高的產(chǎn)量的至少一個核酸序列,并且 b)將所述的表達盒插入單子葉植物中以提供轉(zhuǎn)基因植物,其中所述的植物表達所述的異源核酸序列,和 c)選擇轉(zhuǎn)基因植物,其中所述轉(zhuǎn)基因植物與不包含所述的表達盒但是在其它方面與該轉(zhuǎn)基因植物相同的植物相比,表現(xiàn)提高的產(chǎn)量。
提高的產(chǎn)量及待表達的相應(yīng)異源核酸序列如上定義。提高的產(chǎn)量可以因較高的脅迫抗性引起。因此,待表達的異源核酸序列可以編碼如任一SEQ ID NO6、8、16、18、20、43、45、47、49、50、51或53所述的多肽(或其部分;優(yōu)選地是至少5個、更優(yōu)選至少10個、最優(yōu)選至少30個連續(xù)氨基酸的部分),或其功能等同物,其中所述的功能等同物能夠帶來與任一所述多肽所致的相同表型。優(yōu)選的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列如上所述,最優(yōu)選超級啟動子。
本發(fā)明的又一個實施方案涉及用于從單子葉植物中切除靶序列(例如標記序列)的方法,所述方法包括步驟 a)構(gòu)建表達盒,為將包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,和 ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列,的至少一個嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接到相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并且適合于誘導(dǎo)從單子葉植物中切除標記序列的至少一個核酸序列,并且 b)將所述的表達盒插入包含至少一個標記序列的單子葉植物中以提供轉(zhuǎn)基因植物,其中所述的植物表達所述的異源核酸序列,和 c)選擇顯示切除所述標記的轉(zhuǎn)基因植物。
通過多種方法實現(xiàn)切除,所述方法包括但不限于 -使用位點特異性重組酶通過位點特異性重組而誘導(dǎo)序列缺失,其中所述的位點特異性重組酶由本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列表達, -通過誘導(dǎo)的同源重組而誘導(dǎo)序列缺失,其中待缺失的序列在側(cè)翼分布有這樣的序列,所述序列具有允許在序列間發(fā)生同源重組的方向、足夠長度和相互同源性,其中同源重組由位點特異性內(nèi)切核酸酶(優(yōu)選歸巢內(nèi)切核酸酶、更優(yōu)選歸巢內(nèi)切核酸酶I-SceI)所產(chǎn)生的位點特異性雙鏈斷口而誘導(dǎo),其中所述的位點特異性內(nèi)切核酸酶由本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列表達。
待表達的異源核酸序列編碼如SEQ ID NO22所述的多肽(或其部分;優(yōu)選至少5個、更優(yōu)選至少10個、最優(yōu)選至少30個連續(xù)氨基酸的部分),或其功能等同物,其中所述的功能等同物能夠帶來與任一所述多肽所致的相同表型。優(yōu)選的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列如上所述,最優(yōu)選超級啟動子。下文描述為實現(xiàn)序列切除而待表達的優(yōu)選異源核酸序列(例如編碼位點特異性重組酶或內(nèi)切核酸酶)。
本發(fā)明的又一個實施方案涉及用于核酸序列在單子葉植物中的淀粉胚乳和/或萌芽胚特異性或偏好地表達的方法,所述方法包括步驟 a)構(gòu)建表達盒,為將包含 i)至少一個衍生自根癌農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列, ii)至少一個衍生自根癌農(nóng)桿菌章魚堿合酶基因的上游激活序列,的至少一個嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接到相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列是異源的至少一個核酸序列,和 b)將所述的表達盒插入單子葉植物中以提供轉(zhuǎn)基因植物,以及 c)選擇轉(zhuǎn)基因植物,其中所述轉(zhuǎn)基因植物表現(xiàn)出所述異源核酸序列的淀粉胚乳和/或萌芽胚特異性或偏好性表達。
本發(fā)明用于淀粉胚乳和/或萌芽胚特異性或偏好性表達的方法將導(dǎo)致表達異源核酸序列,其中所述異源核酸序列賦予單子葉植物選自如下的至少一個性狀或特性 i)抗至少一個脅迫因子的增強抗性, ii)提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量, iii)提高的產(chǎn)量,和 iv)選擇標記切除。
優(yōu)選的所述性狀及實現(xiàn)這些性狀的序列在下文中詳述。
優(yōu)選應(yīng)用本發(fā)明方法的單子葉植物可以選自玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、黑麥草或薏苡。植物優(yōu)選地是選自玉米、小麥、大麥、稻、燕麥、黑麥和高粱,甚至更優(yōu)選地來自玉米、小麥和稻的谷類植物,植物最優(yōu)選地是玉米植物。
在本發(fā)明的一個優(yōu)選的實施方案中,從本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列中表達的核苷酸序列不編碼β-葡糖醛酸糖苷酶(GUS),或不是用于實現(xiàn)GUS介導(dǎo)性染色目的而表達GUS基因的方法。
附圖簡述
圖1超級啟動子∷GUS∷終止子融合構(gòu)建體(pBPSMM225)的圖譜。該質(zhì)粒包含有表達構(gòu)建體,其中所述的表達構(gòu)建體含有與β-葡糖醛酸糖苷酶基因(GUS包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)有效連接的超級啟動子,以及胭脂堿合酶(NOS)終止子。SM盒表示選擇標記(ahas)盒。
圖2在不同發(fā)育階段(A-F)的玉米中受超級啟動子控制的GUS表達。用虛線標出具有明顯GUS染色的區(qū)域。
(A)在5葉期的葉和根 (B)谷穗(授粉前) (C)在谷穗上的谷粒(授粉后5日) (D)谷粒(授粉后20日) (E)谷粒(授粉后30日) (F)谷粒(干燥) 本圖代表來自15個T1單拷貝株系的可重復(fù)性表達圖式。
圖3在不同萌發(fā)期的的玉米谷粒內(nèi)受超級啟動子控制的GUS表達。轉(zhuǎn)基因植物的谷粒在潮濕濾紙上溫育后進行評價。用虛線標出具有明顯GUS染色的區(qū)域。
在潮濕濾紙上溫育(水吸漲)后的(G)谷粒;G1至G8水吸漲的第0、3、5、8、16、24、120和168小時。
本圖代表來自15個T1單拷貝株系的可重復(fù)性表達圖式。
定義 除非另外指明,技術(shù)術(shù)語根據(jù)常規(guī)用法使用。分子生物學(xué)中常見術(shù)語的定義可以在Lewin,Genes V,Oxford University Press出版,1994年(ISBN 0-19-854187-9);Kendrew等(編者),The Encyclopedia of MolecularBiology,Blackwell Science Ltd.出版,1994年(ISBN 0-632-02182-9)以及Robert A.Meyers(編輯),Molecular Biology and BiotechnologyaComprehensive Desk Reference,VCH Publishers,Inc.出版,1995年(ISBN1-56081-569-8)中找到。
應(yīng)當(dāng)理解本發(fā)明不限于如此所述的特定方法學(xué),方案,細胞系,植物種或植物屬,構(gòu)建體及試劑。還應(yīng)當(dāng)理解本文中所用術(shù)語的目的僅是描述具體的實施方案,并且不意圖限制本發(fā)明范圍,本發(fā)明的范圍僅受后續(xù)權(quán)利要求書限制。必須指出的是如本文中所用并且在后續(xù)權(quán)利要求書中,單數(shù)形式“一”、“一個”和“該”包括復(fù)數(shù)指稱,除非上下文另外清楚聲明。因此例如,對“一個載體”的指稱是對一個或多個載體的指稱并包括本領(lǐng)域技術(shù)人員已知的它的等同物等。
術(shù)語“約”在本文中用來意指大約、粗略地、左右或在范圍內(nèi)。當(dāng)術(shù)語“約”隨數(shù)字范圍使用時,該術(shù)語通過使界限值擴展高于及低于前述值而修飾該范圍。通常,在本文中使用術(shù)語“約”來以(高于或低于)20%、優(yōu)選10%以上或以下的變異而修飾高于和低于所述值的數(shù)字值。
如本文中所用,詞匯“或”意指特定列表的任一成員并且還包括該列表中成員的任一組合。
術(shù)語“基因”廣義地用來指與生物學(xué)功能相關(guān)的任何核酸節(jié)段。因此,基因包括編碼序列和/或為表達這些編碼序列所需要的調(diào)節(jié)序列。例如,基因指表達mRNA或功能性RNA的或編碼特定蛋白質(zhì)的核酸片段,并且包括調(diào)節(jié)序列?;蜻€包括例如形成對其它蛋白質(zhì)的識別序列的非表達DNA節(jié)段?;蚩梢垣@得自多種來源,包括自目的來源克隆或或自已知或預(yù)測的序列信息合成,并且可以包括設(shè)計以具有所需要參數(shù)的序列。
術(shù)語“天然的”或“野生型”基因指在未轉(zhuǎn)化細胞(即不具有已知突變的細胞)的基因組中存在的基因。
“標記基因”編碼可選擇或可篩選的性狀。
術(shù)語“嵌合基因”指任何基因,其中該基因含有 1)包括自然界中不一起存在的調(diào)節(jié)性序列和編碼序列的DNA序列,或 2)編碼不天然地結(jié)合在一起的蛋白質(zhì)的部分的序列,或 3)不天然地結(jié)合在一起的啟動子的部分。
因此,嵌合基因可以包含源自不同來源的調(diào)節(jié)序列和編碼序列,或包含源自相同來源,但是以不同于自然界中存在的方式排列的調(diào)節(jié)序列和編碼序列。
“轉(zhuǎn)基因”指已經(jīng)通過轉(zhuǎn)化而導(dǎo)入基因組并且得以穩(wěn)定維持的基因。轉(zhuǎn)基因可以包括例如對待轉(zhuǎn)化的特定植物的基因為異源或同源的基因。此外,轉(zhuǎn)基因可以包含插入至非本原生物的天然基因或包含嵌合基因。術(shù)語“內(nèi)源基因”指位于其在生物基因組中天然位置中的天然基因。“外來的”基因指通常不存在于宿主細胞內(nèi),但通過基因轉(zhuǎn)移而導(dǎo)入的基因。
例如用于探測或擴增反應(yīng)中的與本發(fā)明核苷酸序列相對應(yīng)的“寡核苷酸”可以是約30個或更少核苷酸長度(例如9、12、15、18、20、21或24個或在9和30個之間的任一數(shù)目)。通常,特異性引物多達14個核苷酸長度。為了最佳的特異性和成本效率,可以優(yōu)選16至24個核苷酸長度的引物。本領(lǐng)域中技術(shù)人員完全能夠針對使用方法如PCR法設(shè)計引物。根據(jù)需要,可以用本文中公開的基因的整個限制性片段完成探測,其中所述的限制性片可以是100個或甚至1,000個核苷酸長度。
在本文中可互換地使用術(shù)語“多肽”、“肽”、“寡肽”、“多肽”、“基因產(chǎn)物”、“表達產(chǎn)物”和“蛋白質(zhì)”,以指示連續(xù)氨基酸殘基的聚合物或寡聚體。如本文中所用,術(shù)語“氨基酸序列”或“多肽序列”指代表氨基酸殘基的一系列縮寫、字母、字符或詞。氨基酸可以由其通常已知的三字母符號或由IUPAC-IUB生物化學(xué)命名委員會(IUPAC-IUB Biochemical NomenclatureCommission)推薦的單字母符號在本文中指稱。本文中所用的縮寫是用于氨基酸的常規(guī)單字母代碼氨基酸A,丙氨酸;B,天冬氨酸(asparagine)或天冬氨酸;C,半胱氨酸;D天冬氨酸;E,谷氨酸(glutamate),谷氨酸(glutamic acid);F,苯丙氨酸;G,甘氨酸;H組氨酸;I異亮氨酸;K,賴氨酸;L,亮氨酸;M,甲硫氨酸;N,天冬氨酸;P,脯氨酸;Q,谷氨酰胺;R,精氨酸;S,絲氨酸;T,蘇氨酸;V,纈氨酸;W,色氨酸;Y,酪氨酸;Z,谷氨酰胺或谷氨酸(見L.Stryer,Biochemistry,1988,W.H.Freeman and Company,New York)。如本文中所用的氨基酸序列中的字母“X”可以代表任一氨基酸殘基。
“編碼序列”指編碼特定氨基酸序列并且不包括非編碼序列的DNA序列或RNA序列。它可以形成“未打斷的編碼序列”(即無內(nèi)含子),如在cDNA中的情況,或它可以包括通過適宜的剪接點界定的一個或多個內(nèi)含子。“內(nèi)含子”是RNA中這樣的序列,該序列包含于初級轉(zhuǎn)錄物內(nèi),但在細胞內(nèi)經(jīng)切割和RNA再連接而被去除,以產(chǎn)生可以翻譯成蛋白質(zhì)的成熟mRNA。
術(shù)語“可讀框”和“ORF”指在編碼序列的翻譯起始密碼子和終止密碼子之間所編碼的氨基酸序列。術(shù)語“起始密碼子”和“終止密碼子”指編碼序列內(nèi)分別指示蛋白質(zhì)合成(mRNA翻譯)起始和鏈終止的毗鄰三核苷酸單元(“密碼子”)。
“功能性RNA”指反義RNA、核酶或其它非翻譯的RNA。
術(shù)語“RNA轉(zhuǎn)錄物”指通過RNA聚合酶催化的DNA序列轉(zhuǎn)錄所產(chǎn)生的產(chǎn)物。當(dāng)RNA轉(zhuǎn)錄物是該DNA序列的完全互補性拷貝時,此RNA稱作初級轉(zhuǎn)錄物,或RNA轉(zhuǎn)錄物可以是衍生自初級轉(zhuǎn)錄物的翻譯后加工中的RNA序列并且稱作成熟RNA。“信使RNA”(mRNA)指沒有內(nèi)含子并可以由細胞翻譯成蛋白質(zhì)的RNA?!癱DNA”指與mRNA互補并且衍生自其中的單鏈DNA或雙鏈DNA。
“轉(zhuǎn)錄調(diào)節(jié)核苷酸序列”、“調(diào)節(jié)序列”和”合適的調(diào)節(jié)序列”均指可影響已接合(或功能性連接)的待轉(zhuǎn)錄核苷酸序列的轉(zhuǎn)錄、RNA加工或穩(wěn)定性或者翻譯的核苷酸序列。轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可以相對于待轉(zhuǎn)錄的核苷酸序列具有多種定位。轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可以位于待轉(zhuǎn)錄序列(例如編碼序列)的上游(5’非編碼序列),在其內(nèi)或下游(3’非編碼序列)。轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可以選自增強子、啟動子、翻譯前導(dǎo)序列、內(nèi)含子、5’-非翻譯序列、3’-非翻譯序列和加A信號序列。它們包括天然序列及合成性序列以及可以是合成性序列與天然序列組合的序列。如以上指出,術(shù)語“轉(zhuǎn)錄調(diào)節(jié)核苷酸序列”不限于啟動子。然而,本發(fā)明的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列優(yōu)選地包含至少一個啟動子序列(例如位于能夠誘導(dǎo)下游序列轉(zhuǎn)錄的基因的轉(zhuǎn)錄起始處上游的序列)。在一個優(yōu)選的實施方案中,本發(fā)明的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含相應(yīng)基因的啟動子序列和(任選地且優(yōu)選地)所述基因的天然5’非翻譯區(qū)。此外,還可以采用所述基因的3’非翻譯區(qū)和/或聚腺苷酸化區(qū)域。
“啟動子”指通過提供對RNA聚合酶和為正確轉(zhuǎn)錄所需要的其它因子(例如反式作用轉(zhuǎn)錄因子)的識別而控制編碼序列表達的核苷酸序列,通常位于其編碼序列的上游(5′)?!皢幼印卑▽ζ涮砑诱{(diào)節(jié)性元件(例如順式元件)以控制表達的最小啟動子,其中所述的最小啟動子是包含起到指示轉(zhuǎn)錄起點作用的TATA盒和其它序列的短DNA序列?!皢幼印边€指包括最小啟動子和能夠控制編碼序列或功能性RNA表達的調(diào)節(jié)性元件的核苷酸序列。這種類型的啟動子序列由近端的上游元件和更遠的上游元件組成。更遠的上游元件常稱作增強子。因此,“增強子”是這樣的DNA序列,該DNA序列可以刺激啟動子活性并且可以是啟動子的固有元件或是為增強啟動子的水平或組織特異性而插入的異源元件。增強子能夠在(正常或倒轉(zhuǎn))兩個方向上發(fā)揮作用,并且甚至當(dāng)被移到啟動子的上游或下游時還能夠履行功能。增強子和其他上游啟動子元件結(jié)合介導(dǎo)其效應(yīng)的序列特異性DNA結(jié)合蛋白。啟動子可以完整地衍生自天然基因或包含源自自然界發(fā)現(xiàn)的不同啟動子的不同元件,或甚至包含合成性DNA節(jié)段。啟動子還可以含有參與蛋白質(zhì)因子結(jié)合的DNA序列,其中所述的蛋白質(zhì)因子控制應(yīng)答于生理條件或發(fā)育條件的轉(zhuǎn)錄起始的效率。如本文中所用,術(shù)語“順式元件”指賦予整體控制基因表達某個方面的順式作用轉(zhuǎn)錄調(diào)節(jié)元件。順式元件可以起到結(jié)合轉(zhuǎn)錄因子、結(jié)合調(diào)節(jié)轉(zhuǎn)錄的反式作用蛋白質(zhì)因子的作用。一些順式元件結(jié)合多于一種轉(zhuǎn)錄因子,并且轉(zhuǎn)錄因子可以與多于一種的順式元件以不同親和力相互作用。本發(fā)明的啟動子受歡迎地含有可以導(dǎo)致或調(diào)節(jié)基因表達的順式元件??梢酝ㄟ^多種技術(shù)鑒定順式元件,其中所述的技術(shù)包括缺失分析(即從啟動子的5’端或內(nèi)部缺失一個或多個核苷酸;使用DNA酶I足跡法的DNA結(jié)合蛋白分析、甲基化干擾、電泳遷移率移動分析、通過連接介導(dǎo)的PCR進行體內(nèi)(in vivo)基因組足跡法和其它常規(guī)分析;或通過與已知順式元件基序的常規(guī)DNA序列比較方法的DNA序列相似性分析。順式元件的精細結(jié)構(gòu)可以通過誘變(或替換)一個或多個核苷酸或通過其它常規(guī)方法進一步研究。順式元件可以通過化學(xué)合成或通過從包含如此元件的啟動子中分離而得到,并且可以合成具有額外的側(cè)翼核苷酸的順式元件,其中所述的額外側(cè)翼核苷酸含有用于促進亞序列操作的限制酶位點。
“起始位點”是在作為已轉(zhuǎn)錄序列的部分的環(huán)繞第一核苷酸的位置,其中所述的位置又定義為位置+1。相對于該位點,對基因及其調(diào)控區(qū)域的全部其它序列進行編號。下游序列(即3’方向的其它蛋白質(zhì)編碼序列)命名為正數(shù),而上游序列(大部分是5’方向的調(diào)控區(qū)域)命名為負數(shù)。
在上游激活作用缺乏時無活性或具有明顯降低的啟動子活性的啟動子元件、特別是TATA元件稱作“最小啟動子或核心啟動子”。在合適的轉(zhuǎn)錄因子存在下,最小啟動子起到允許轉(zhuǎn)錄的作用?!白钚幼踊蚝诵膯幼印币虼藘H由對于轉(zhuǎn)錄起始所需要的全部基礎(chǔ)元件組成,例如TATA盒和/或起始子。
術(shù)語“內(nèi)含子”指在基因中DNA的部分(間插序列),其中所述的部分不編碼由基因所產(chǎn)生蛋白質(zhì)的部分并且在轉(zhuǎn)錄自該基因的mRNA輸出離開細胞核之前,從該mRNA中被剪接出來。內(nèi)含子序列指內(nèi)含子的核酸序列。因此,內(nèi)含子是DNA序列中這樣的區(qū)域,該區(qū)域隨編碼序列(外顯子)一起轉(zhuǎn)錄但是在成熟mRNA形成期間被去除。內(nèi)含子可以位于實際的編碼區(qū)域內(nèi)或位于前mRNA(未剪接mRNA)的5’或3’非翻譯前導(dǎo)序列中。初級轉(zhuǎn)錄物中的內(nèi)含子被切除并且編碼序列同時而精確地被連接以形成成熟的mRNA。內(nèi)含子與外顯子的接點形成剪接位點。內(nèi)含子的序列始于GU并且止于AG。此外,已經(jīng)描述植物中AU-AC內(nèi)含子的兩個實例來自擬南芥菜(Arabidopsis thaliana)的RecA樣蛋白質(zhì)基因的內(nèi)含子14和G5基因的內(nèi)含子7是AT-AC內(nèi)含子。除了其它序列之外,含有內(nèi)含子的前mRNA還具有對于精確剪接內(nèi)含子所必需的三個短序列。這些序列是5’剪接位點、3’剪接位點和分枝點。mRNA剪接是在初級mRNA轉(zhuǎn)錄物內(nèi)存在的間插序列(內(nèi)含子)的去除和外顯子序列的接合或連接。這又稱作順式剪接,其中所述的順式剪接使同一RNA上的兩個外顯子接合,并去除間插序列(內(nèi)含子)。內(nèi)含子的功能性元件包含由剪接體中(例如剪接在內(nèi)含子末端的共有序列的)特定蛋白質(zhì)成分結(jié)合和識別的序列。功能性元件與剪接體的相互作用導(dǎo)致從成熟前mRNA中去除內(nèi)含子序列并使外顯子序列再連接。內(nèi)含子具有對于精確剪接內(nèi)含子所必需(盡管不充分)的三個短序列。這些序列序列是5’剪接位點、3’剪接位點和分枝點。分枝點序列對于植物中剪接和剪接位點的選擇是重要的。分枝點序列通常位于3’剪接位點上游10-60個核苷酸。植物序列在分枝點處顯示序列變異性,共有序列是CURAY或YURAY。
“組成型表達”指使用組成型啟動子或可調(diào)節(jié)啟動子的表達?!皸l件性表達”和“可調(diào)型表達”指受可調(diào)節(jié)啟動子控制的表達。
“組成型啟動子”指這樣的啟動子,該啟動子能夠使受該啟動子控制的可讀框(ORF)在全部或幾乎全部植物組織中在全部或幾乎全部植物發(fā)育期期間表達。每一轉(zhuǎn)錄激活元件均不顯示絕對的組織特異性,但是以其中轉(zhuǎn)錄最活躍的植物部分中所達到水平的至少1%的水平在植物的絕大部分中介導(dǎo)轉(zhuǎn)錄激活。
“可調(diào)節(jié)啟動子”指這樣的啟動子,該啟動子不以組成型方式而以時間調(diào)節(jié)方式和/或空間調(diào)節(jié)方式指導(dǎo)基因表達,并且包括組織特異性啟動子和誘導(dǎo)型啟動子??烧{(diào)節(jié)啟動子包括天然序列、合成性序列以及這樣的序列,其可以是合成性序列與天然序列的組合。不同啟動子可以指導(dǎo)基因在不同的組織或細胞類型中或在不同發(fā)育期或應(yīng)答于不同環(huán)境條件的表達。不斷發(fā)現(xiàn)多種類型用于植物細胞的新啟動子,眾多實例可以在Okamuro等(1989)的編著內(nèi)找到。植物中有用的常見可調(diào)節(jié)啟動子包括,但不限于安全劑誘導(dǎo)型啟動子、衍生自四環(huán)素誘導(dǎo)型系統(tǒng)的啟動子、衍生自水楊酸誘導(dǎo)型系統(tǒng)的啟動子、衍生自醇誘導(dǎo)型系統(tǒng)的啟動子、衍生自糖皮質(zhì)激素誘導(dǎo)型系統(tǒng)的啟動子、衍生自病原體誘導(dǎo)型系統(tǒng)的啟動子和衍生自蛻皮激素誘導(dǎo)型系統(tǒng)的啟動子。
“組織特異性啟動子”指并非在全部植物細胞中表達而僅在特定器官(如葉或種子)、在特定組織(如胚或子葉)的一種或多種細胞類型中,或在特定細胞類型(如葉薄壁組織細胞或種子貯藏細胞)中表達的可調(diào)節(jié)啟動子。這些啟動子還包括例如在早期或晚期胚發(fā)生、在正在發(fā)育的種子或果實的果實成熟期間、在充分分化的葉或在衰老發(fā)生時,以時間方式調(diào)節(jié)的啟動子。
“誘導(dǎo)型啟動子”指可以由外部的刺激(如化學(xué)品、光線、激素、脅迫或病原體)在一種或多種細胞類型中開啟的那些可調(diào)節(jié)啟動子。
“有效連接的”或“功能性連接的”優(yōu)選地指將多個核酸序列連接為單個核酸片段,以至于一個核酸序列的功能受另一個核酸序列的影響。例如,將調(diào)節(jié)性DNA序列稱作與編碼RNA或多肽的DNA序列“有效連接”或“連接”,如果這樣安放這兩種序列以至于調(diào)節(jié)性DNA序列影響編碼性DNA序列的表達(即編碼序列或功能性RNA受啟動子的轉(zhuǎn)錄性控制)。編碼序列可以有義方向或反義方向與調(diào)節(jié)序列有效連接。
“表達”指植物中內(nèi)源基因、ORF或其部分或轉(zhuǎn)基因的轉(zhuǎn)錄和/或翻譯。例如,在反義構(gòu)建體的例子中,表達可以僅指反義DNA的轉(zhuǎn)錄。此外,表達指有義RNA(mRNA)或功能性RNA的轉(zhuǎn)錄和穩(wěn)定累積。表達還可以指蛋白質(zhì)的產(chǎn)生。
“特異性表達”是限于一種或一些植物組織(空間限制)和/或一個或一些植物發(fā)育期(時間限制)的基因產(chǎn)物的表達。已知幾乎不存在真正的特異性啟動子似乎優(yōu)選地在某些組織中開啟,而在其它組織中可能不存在活性或僅有少量活性。這種現(xiàn)象稱作滲漏表達。然而,本發(fā)明中的特異性表達意指在一種或一些植物組織中的優(yōu)選表達。
(具有或沒有增強子的)啟動子的“表達模式”是顯示所述啟動子在植物中何處及在哪個發(fā)育期啟動轉(zhuǎn)錄的表達水平模式。將一組啟動子的表達模式稱為是互補性的,當(dāng)一個啟動子的表達模式與另一個啟動子的表達模式顯示很少重疊時。啟動子的表達水平可以通過測量已轉(zhuǎn)錄的標準報道m(xù)RNA的‘穩(wěn)態(tài)’濃度來確定。該測量是間接的,因為報道m(xù)RNA的濃度不僅僅取決于它的合成速率,還取決于mRNA降解速率。因此,穩(wěn)態(tài)水平是合成速率和降解速率的結(jié)果。然而當(dāng)轉(zhuǎn)錄的序列相同時,可以認為降解速率以固定速率進行,并且該值因此可以起到測量合成速率的作用。當(dāng)以這種方式比較啟動子時,本領(lǐng)域中技術(shù)人員可用的技術(shù)是雜交、S1-RNA酶分析法、RNA印跡法和競爭性RT-PCR。所列技術(shù)無論如何不代表全部可用的技術(shù),僅描述了用來分析mRNA的轉(zhuǎn)錄活性和表達水平的常用方法。在幾乎全部啟動子中的轉(zhuǎn)錄開始點分析已經(jīng)揭示通常在轉(zhuǎn)錄開始處不存在單個堿基,而是存在或多或少簇集的起始位點集合,其中每個起始位點構(gòu)成mRNA的一些開始點。因為這種分布在啟動子與啟動子之間不同,故每一群體內(nèi)的報道m(xù)RNA序列將彼此不同。由于每一mRNA種類或多或少地傾向于降解,因而不能對不同的報道m(xù)RNA預(yù)期單一的降解速率。已經(jīng)證實對于多種真核生物啟動子序列,起始位點(“起始子”)周圍的序列在決定由所述特定啟動子指導(dǎo)的RNA表達水平中發(fā)揮重要作用。這種序列還包括已轉(zhuǎn)錄序列的部分。因此,啟動子與報道序列的直接融合將導(dǎo)致次優(yōu)水平的轉(zhuǎn)錄。通常用于分析表達模式和表達水平的方法是測定細胞內(nèi)蛋白質(zhì)累積的‘穩(wěn)態(tài)’水平。本領(lǐng)域中技術(shù)人員已知通常使用的候選報道基因是β-葡糖醛酸糖苷酶(GUS)、氯霉素乙?;D(zhuǎn)移酶(CAT)和具有熒光特性的蛋白質(zhì)如來自維多利亞水母(Aequora victoria)的綠色熒光蛋白(GFP)。然而原則上,眾多其它蛋白質(zhì)是合適用于此目的,只要蛋白質(zhì)不干擾重要的植物功能。多種工具適用于定量和確定定位??梢暂p易地產(chǎn)生或獲得這樣的檢測系統(tǒng),該檢測系統(tǒng)基于例如免疫化學(xué)、酶、熒光的檢測和定量。蛋白質(zhì)水平可以使用蛋白質(zhì)表達的原位分析法在植物組織提取物或在完整組織中測定。通常,用一種嵌合啟動子報道構(gòu)建體轉(zhuǎn)化的單個株系在它們的報道基因表達水平上不同。還經(jīng)常觀察到此類轉(zhuǎn)化體不表達任何可檢測產(chǎn)物(RNA或蛋白質(zhì))的現(xiàn)象。通常將表達的變異性歸咎于‘位置效應(yīng)’,雖然決定這種無活性的分子機制往往不明。
“過量表達”指轉(zhuǎn)基因細胞或轉(zhuǎn)基因生物中這樣的表達水平,其超過在正?;蛭崔D(zhuǎn)化(非轉(zhuǎn)基因)細胞或生物中的表達水平。
“5’非編碼序列”或“5’-非翻譯序列”或“-區(qū)域”指位于編碼序列5’(上游)的核苷酸序列。該核苷酸序列存在于完全加工的mRNA的起始密碼子上游并且可以影響初級轉(zhuǎn)錄物至mRNA的加工、mRNA穩(wěn)定性或翻譯效率(Turner 1995)。
“3’非編碼序列”或“3’-非翻譯序列”或“-區(qū)域”指位于編碼序列3’(下游)的核苷酸序列并且包括加A信號序列和其它序列,其中所述的其它序列編碼能夠影響mRNA加工或基因表達的調(diào)節(jié)信號。加A信號通常以影響聚腺苷酸添加至mRNA前體的3’末端。對不同3’非編碼序列的使用由Ingelbrecht等,1989示例。
術(shù)語“翻譯前導(dǎo)序列”指基因在啟動子和編碼序列之間的DNA序列部分,該部分轉(zhuǎn)錄成RNA并且存在于完全加工的mRNA的翻譯起始密碼子的上游(5′)。翻譯前導(dǎo)序列可以影響初級轉(zhuǎn)錄物至mRNA的加工、mRNA穩(wěn)定性或翻譯效率。
“信號肽”指多肽的氨基末端延伸,其與多肽一起被翻譯形成前體肽并且是前體肽進入分泌途徑內(nèi)所需要的。術(shù)語“信號序列”指編碼信號肽的核苷酸序列。如本文中所用的術(shù)語“轉(zhuǎn)運肽”指已表達多肽的部分(優(yōu)選地在多肽的氨基末端延伸),該部分與多肽一起被翻譯形成前體肽并且是前體肽進入細胞器(如質(zhì)體(例如葉綠體)或線粒體)內(nèi)所需要的。術(shù)語“轉(zhuǎn)運序列”指編碼轉(zhuǎn)運肽的核苷酸序列。
“反義抑制”指產(chǎn)生能夠抑制來自內(nèi)源基因或轉(zhuǎn)基因的蛋白質(zhì)表達的反義RNA轉(zhuǎn)錄物。
“基因沉默”指病毒基因、轉(zhuǎn)基因或內(nèi)源核基因的同源依賴性抑制。基因沉默可以是轉(zhuǎn)錄水平的,此時抑制是因受影響基因轉(zhuǎn)錄降低所致,或是轉(zhuǎn)錄后的,此時抑制是因與受影響基因同源的RNA種類的周轉(zhuǎn)(降解)增加所致(English 1996)。基因沉默包括病毒誘導(dǎo)的基因沉默(Ruiz等1998)。
如本文中所用的術(shù)語“異源DNA序列”、“外源DNA節(jié)段”或“異源核酸”均指源自對特定宿主細胞為外來的來源中的序列,或若來自相同來源,則相對于其原初形式受到了修飾。因此,宿主細胞內(nèi)的異源基因包括對特定宿主細胞是內(nèi)源性的,但已經(jīng)(例如通過利用DNA改組)被修飾的基因。該術(shù)語還包括天然存在的DNA序列的非天然存在的多重拷貝。因此,本術(shù)語指這樣的DNA節(jié)段,其對于細胞是外來或異源的,或雖然對該細胞是同源的,但是處于宿主細胞核酸中該節(jié)段通常不存在的位置內(nèi)。表達外源DNA節(jié)段以便產(chǎn)生外源多肽?!巴础盌NA序列是這樣的DNA序列,其與導(dǎo)入該DNA序列的宿主細胞天然地相關(guān)。
在核苷酸序列同一性上下文中“同源于”指兩種核酸分子的核苷酸序列之間或兩種蛋白質(zhì)分子的氨基酸序列之間的相似性。此類同源性的評估通過在如本領(lǐng)域中技術(shù)人員充分理解的嚴格條件下(如在Haines和Higgins(編者),Nucleic Acid Hybridization,IRL Press,Oxford,U.K.中描述)的DNA-DNA雜交或DNA-RNA雜交或通過兩種核酸或兩種蛋白質(zhì)之間的序列相似性比較而提供。
術(shù)語“基本上相似”指代表本文中所公開的擬南芥菜序列或歐洲油菜(Brassica napus)序列的功能性和/或結(jié)構(gòu)性等同物或直向同源物的核苷酸和氨基酸序列。
在最廣泛的意義上,當(dāng)在本文中用于核苷酸序列時,術(shù)語“基本上相似”意指核苷酸序列是編碼這樣的多肽的基因的部分,其中所述多肽基本上具有如作為參考核苷酸序列的基因所編碼的多肽那樣的相同結(jié)構(gòu)和功能,例如,該核苷酸序列包含來自基因(其中該基因是對應(yīng)于參考核苷酸序列的基因的直向同系物)的啟動子以及與本文中特別例舉啟動子序列在結(jié)構(gòu)上相關(guān)的啟動子序列,即基本上相似的啟動子序列與本文中例舉的啟動子序列的互補序列在高嚴格條件或極高嚴格條件下雜交。例如,僅反映遺傳密碼子簡并性而總是編碼與特定氨基酸序列相同的氨基酸序列的改變的核苷酸序列與編碼這種特定氨基酸序列的核苷酸序列基本上相似。術(shù)語“基本上相似”還包括在其中例如序列已經(jīng)被修飾以優(yōu)化在特定細胞中表達的核苷酸序列以及編碼相對于參考序列所編碼(未修飾)多肽,具有一個或多個氨基酸替換的變體多肽的核苷酸序列,其中所述的替換不改變變體多肽相對于未修飾多肽的活性。
在最廣義的含義上,當(dāng)本文中用于多肽時,術(shù)語“基本上相似”意指多肽基本上具有與參考多肽相同的結(jié)構(gòu)和功能。此外,與特定序列基本上相似的氨基酸序列是這樣的氨基酸序列,其中整體氨基酸同一性是本發(fā)明序列的至少60%或更高。產(chǎn)生等效核苷酸或氨基酸序列的修飾完全處于本領(lǐng)域的常規(guī)技術(shù)范圍內(nèi)?;旧舷嗨频亩嚯呐c參考多肽之間的氨基酸序列同一性百分數(shù)是至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%并且甚至是90%或更高、例如91%、92%、93%、94%、95%、96%、97%、98%、高達至少99%。除了具有基本上相同的功能以外,兩種多肽彼此基本上相似的一個指標是與所述一種多肽特異性結(jié)合的物質(zhì)(例如抗體)也與另一種多肽特異性結(jié)合。
序列比較可以使用Smith-Waterman序列比對算法(見例如Waterman(1995))開展。優(yōu)選地使用具有如下參數(shù)的localS程序(1.16版本)匹配1、錯配罰分0.33,開放空位罰分2,空位延伸罰分2。
此外,將與參考核苷酸序列“基本上相似”的核苷酸序列稱作與參考核苷酸序列“等效”。技術(shù)人員認識到本發(fā)明所包括的等效核苷酸序列還可以由它們在低嚴格、中等嚴格和/或嚴格條件(例如0.1×SSC、0.1%SDS、65℃)下與本權(quán)利要求書字面意思范圍內(nèi)的核苷酸序列雜交的能力加以定義。
當(dāng)談及多核苷酸或多肽片段時,“基本上相同活性”的含義是該片段具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%并且甚至90%或更高,例如91%、92%、93%、94%、95%、96%、97%、98%、高達至少99%的全長多核苷酸或全長多肽的活性。
“靶基因”指在復(fù)制子上表達所需要的靶編碼序列、功能性RNA或蛋白質(zhì)的基因。靶基因?qū)?fù)制子的復(fù)制不是必需的。此外,靶基因可以包含插入非本源生物中的非病毒天然基因,或嵌合基因,并且將受合適的調(diào)節(jié)序列控制。因此,靶基因內(nèi)的調(diào)節(jié)序列可以來自任何來源,包括病毒。靶基因可以包括對待轉(zhuǎn)化特定植物的基因為異源的或同源的編碼序列。然而,靶基因不包括天然病毒基因。一般的靶基因包括,但不限于編碼結(jié)構(gòu)蛋白、種子貯藏蛋白、賦予除草劑抗性的蛋白質(zhì)和賦予昆蟲抗性的蛋白質(zhì)的基因。由靶基因編碼的蛋白質(zhì)稱作“外來蛋白質(zhì)”。植物中靶基因的表達通常產(chǎn)生改變的植物性狀。
術(shù)語“改變的植物性狀”意指轉(zhuǎn)基因植物中相對于野生型或非轉(zhuǎn)基因植物宿主的任何表型改變或基因型改變。
“復(fù)制基因”指編碼病毒復(fù)制蛋白的基因。除了復(fù)制蛋白的ORF之外,復(fù)制基因還可以含有其它的交疊或非交疊的ORF,如在自然界中病毒序列內(nèi)所發(fā)現(xiàn)那樣。盡管對復(fù)制是非必需的,這些額外的ORF可以增強復(fù)制和/或病毒的DNA累積。此類額外ORF的實例分別是ACMV和TGMV雙粒病毒組中的AC3和AL3。
“嵌合的反式作用復(fù)制基因”指例如這樣的復(fù)制基因,在該復(fù)制基因中復(fù)制蛋白的編碼序列處在修飾的植物啟動子而不是病毒天然復(fù)制基因的啟動子控制下,或指修飾的病毒天然復(fù)制基因,例如在其中位點特定的序列插入受轉(zhuǎn)錄而不翻譯的5’區(qū)域內(nèi)。此類嵌合基因還包括插入結(jié)合在減弱病毒復(fù)制蛋白基因轉(zhuǎn)錄的啟動子與轉(zhuǎn)錄起點之間的復(fù)制蛋白的已知位點。
“染色體整合的”指外來基因或DNA構(gòu)建體通過共價鍵整合至宿主DNA。在基因未發(fā)生“染色體整合”時,它們可以進行“瞬時表達”?;虻乃矔r表達指這樣的基因表達,其中所述的基因未整合至宿主染色體中,但是例如作為自主復(fù)制的質(zhì)?;虮磉_盒的部分或作為另一種生物系統(tǒng)(如病毒)的部分獨立地發(fā)揮作用。
術(shù)語“轉(zhuǎn)化”指核酸片段轉(zhuǎn)移至宿主細胞的基因組中,產(chǎn)生遺傳穩(wěn)定的遺傳。含有已轉(zhuǎn)化的核酸片段的宿主細胞稱作“轉(zhuǎn)基因”細胞并且包含轉(zhuǎn)基因細胞的生物稱作“轉(zhuǎn)基因生物”。植物和植物細胞的轉(zhuǎn)化方法實例包括農(nóng)桿菌介導(dǎo)性轉(zhuǎn)化(De Blaere 1987)和粒子轟擊技術(shù)(US 4,945,050)。完整植物可以通過技術(shù)人員眾所周知的方法自轉(zhuǎn)基因細胞再生(見例如,F(xiàn)romm1990)。
“轉(zhuǎn)化的”、“轉(zhuǎn)基因的”和”重組的”指其中已經(jīng)導(dǎo)入異源核酸分子的宿主生物如細菌或植物。核酸分子可以穩(wěn)定整合至通常本領(lǐng)域中已知并公開的基因組中(Sambrook 1989;Innis 1995;Gelfand 1995;Innis & Gelfand1999)。PCR的已知方法包括,但不限于使用成對引物、巢式引物、單特異性引物、簡并引物、基因特異性引物、載體特異性引物、部分錯配引物等的方法。例如,“轉(zhuǎn)化的”、“轉(zhuǎn)化體”和“轉(zhuǎn)基因”植物或愈傷組織已經(jīng)通過轉(zhuǎn)化方法產(chǎn)生并含有整合至其染色體內(nèi)的外來基因。術(shù)語“未轉(zhuǎn)化的”指未經(jīng)歷轉(zhuǎn)化過程的正常植物。
“瞬時轉(zhuǎn)化的”指其中轉(zhuǎn)基因和外來DNA(例如通過如農(nóng)桿菌介導(dǎo)性轉(zhuǎn)化或生物射彈轟擊的方法)已經(jīng)導(dǎo)入,但是沒有對穩(wěn)定維持加以選擇的細胞。
“穩(wěn)定轉(zhuǎn)化”指轉(zhuǎn)化后已經(jīng)在選擇性培養(yǎng)基上進行選擇并再生的細胞。
“瞬時表達”指在其中病毒或轉(zhuǎn)基因在由病毒感染或由如農(nóng)桿菌介導(dǎo)性轉(zhuǎn)化、電穿孔或生物射彈轟擊的方法而導(dǎo)入,但是沒有對穩(wěn)定維持進行選擇的細胞內(nèi)的表達。
“遺傳穩(wěn)定的”和“可遺傳的”指穩(wěn)定維持于植物中并經(jīng)過連續(xù)世代由子代穩(wěn)定遺傳的染色體性整合的遺傳元件。
“原代轉(zhuǎn)化體”和”T0世代”指具有如最初所轉(zhuǎn)化組織(即轉(zhuǎn)化以來沒有經(jīng)歷減數(shù)分裂和受精)那樣相同的遺傳世代的轉(zhuǎn)基因植物。
“次代轉(zhuǎn)化體”和”T1、T2、T3等世代”指源自經(jīng)歷一個或多個減數(shù)分裂循環(huán)和受精循環(huán)的原代轉(zhuǎn)化體的轉(zhuǎn)基因植物。它們可以通過原代轉(zhuǎn)化體或次代轉(zhuǎn)化體的自我受精或原代轉(zhuǎn)化體或次代轉(zhuǎn)化體與其它已轉(zhuǎn)化或未轉(zhuǎn)化的植物雜交而衍生。
“野生型”指沒有任何已知突變的天然存在的病毒或生物。
術(shù)語“基因組”或“基因組DNA”指宿主生物的可遺傳性遺傳信息。所述基因組DNA包含細胞核DNA(又稱作染色體DNA),還包含質(zhì)體(例如葉綠體)和其它細胞器(例如線粒體)的DNA。術(shù)語“基因組”或“基因組DNA”優(yōu)選地指細胞核的染色體DNA。
術(shù)語“染色體DNA”或“染色體DNA序列”應(yīng)當(dāng)理解為獨立于細胞周期狀態(tài)的細胞核的基因組DNA。染色體DNA因此可以組織在染色體或染色單體中,它們可是是壓縮的或松散的??梢酝ㄟ^本領(lǐng)域中已知的多種方法例如聚合酶鏈式反應(yīng)(PCR)分析、DNA印跡分析、熒光原位雜交(FISH)和原位PCR證實和分析對染色體DNA的插入。
術(shù)語“核酸”指脫氧核糖核苷酸或核糖核苷酸及其單鏈或雙鏈形式的由含有糖、磷酸酯和堿基(嘌呤或嘧啶)的單體(核苷酸)組成的聚合物。除非專門界定,否則該術(shù)語包括含有天然核苷酸的已知類似物的核酸,其中所述的核酸具有如參考核酸那樣的相似結(jié)合特性并且以如天然存在的核苷酸那樣的相似方式進行代謝。除非另外說明,特定的核酸序列還內(nèi)在地包括其保守性修飾的變體(例如簡并密碼子替換)和互補性序列和明確說明的序列。具體地,簡并密碼子替換可以通過生成這樣的序列而實現(xiàn),在所述的序列中一個或多個所選擇(或全部)密碼子的第三位置由混合的堿基和/或脫氧次黃苷殘基替換(Batzer 1991;Ohtsuka 1985;Rossolini 1994)?!昂怂崞巍笔墙o定的核酸分子的部分。在高等植物中,脫氧核糖核酸(DNA)是遺傳材料,而核糖核酸(RNA)參與將DNA內(nèi)所包含的信息轉(zhuǎn)移至蛋白質(zhì)。術(shù)語“核苷酸序列”指可能是單鏈或雙鏈的DNA或RNA的聚合物,其中所述的聚合物任選地含有能夠摻入DNA或RNA聚合物中的合成的、非天然的或改變的核苷酸堿基。術(shù)語“核酸”或“核酸序列”還可以與基因、cDNA、DNA和由基因編碼的RNA互換地使用。
本發(fā)明包括分離的或基本上純化的核酸或蛋白質(zhì)組合物。在本發(fā)明的上下文中,“分離的”或“純化的”DNA分子或“分離的”或“純化的”多肽是這樣的DNA分子或多肽,其因人為作用而脫離其天然環(huán)境存在并且因此不是自然的產(chǎn)物。分離的DNA分子或多肽可以以純化的形式存在或可以存在于非天然環(huán)境(例如轉(zhuǎn)基因宿主細胞)內(nèi)。例如“分離的”或“純化的”核酸分子或蛋白質(zhì)或其生物活性部分在通過重組技術(shù)產(chǎn)生時,基本上沒有其它的細胞材料或培養(yǎng)基,或在化學(xué)地合成時,基本上沒有化學(xué)前體或其它化學(xué)品。優(yōu)選地,“分離的”核酸(優(yōu)選地是蛋白質(zhì)編碼序列)沒有在該核酸來源的生物的基因組DNA中天然分布在該核酸側(cè)翼的序列(即所述序列位于所述核酸的5′和3′末端)。例如,在多種實施方案中,分離的核酸分子可以含有少于約5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在該核酸來源的細胞的基因組DNA內(nèi)天然分布在該核酸分子側(cè)翼的核苷酸序列。基本上沒有細胞材料的蛋白質(zhì)包括這樣的蛋白質(zhì)制品或多肽制品,所述制品具有少于約30%、20%、10%、5%(干重)的雜質(zhì)蛋白質(zhì)。當(dāng)重組產(chǎn)生本發(fā)明的蛋白質(zhì)或其生物活性部分時,培養(yǎng)基優(yōu)選地占少于約30%、20%、10%、或5%(干重)的化學(xué)前體或非目的蛋白質(zhì)化學(xué)品。本發(fā)明的核苷酸序列包括天然存在的序列和突變(變體)形式。此類變體將仍具有所需要的活性,即啟動子活性或由未變異核苷酸序列中可讀框所編碼的產(chǎn)物的活性。
關(guān)于序列(例如多肽或核酸序列例如本發(fā)明的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列),術(shù)語“變體”意指基本上相似的序列。對于包含可讀框的核苷酸序列,變體包括因遺傳密碼子簡并性而編碼天然蛋白質(zhì)中相同氨基酸序列的序列。諸如此類的天然存在的等位變體可以用眾所周知的分子生物學(xué)技術(shù)(例如用聚合酶鏈式反應(yīng)(PCR)和雜交技術(shù))鑒定。變體核苷酸序列還包括以合成方式衍生的核苷酸序列,例如通過使用位點定向誘變生成并編碼天然蛋白質(zhì)(對于可讀框而言)的那些核苷酸序列,以及編碼相對于天然蛋白質(zhì),具有氨基酸替換的多肽的那些核苷酸序列。通常,本發(fā)明的核苷酸序列變體對天然(野生型或內(nèi)源性)核苷酸序列具有至少40、50、60,至70%,例如優(yōu)選71%、72%、73%、74%、75%、76%、77%、78%、至79%,通常至少80%,例如81%-84%、至少85%,例如86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%,至98%和99%的核苷酸序列同一性。
特定核酸序列的“保守性修飾的變異”指編碼相同或基本上相同的氨基酸序列的那些核酸序列,或當(dāng)核酸序列不編碼氨基酸序列時,涉及基本上相同的序列。因為遺傳密碼子簡并性,大量的功能相同的核酸編碼任何給定的多肽。例如,密碼子CGT、CGC、CGA、CGG、AGA和AGG均編碼氨基酸精氨酸。因此,在密碼子指定為精氨酸的位置上,可以將該密碼子改變成所述的任何對應(yīng)密碼子,而不改變所編碼的蛋白質(zhì)。此類核酸變異是“沉默變異”,其為“保守性修飾的變異”中的一種類型。除非另外指出,本文中所述的編碼多肽的每種核酸序列還描述了每種可能的沉默變異。技術(shù)人員將認識到可以通過標準技術(shù)在核酸中修飾每個密碼子(ATG例外,該密碼子通常是僅用于甲硫氨酸的密碼子)以產(chǎn)生功能性相同的分子,因此,編碼多肽的核酸的每種“沉默變異”包含在每種所描述的序列中。
可以“優(yōu)化”本發(fā)明的核酸分子以增強在目的植物中的表達(見例如,WO 91/16432;Perlak 1991;Murray 1989)。以此方式,可以利用植物優(yōu)選的密碼子合成基因或基因片段內(nèi)的可讀框(見例如,Campbell和Gowri,1990年對宿主-優(yōu)選的密碼子用途的討論)。因此,可以優(yōu)化核苷酸序列用于在任何植物中的表達。已經(jīng)認識到基因序列的全部或任何部分可以是優(yōu)化的或合成性的,也即還可以使用合成性或部分優(yōu)化的序列。變異的核苷酸序列和蛋白質(zhì)還包括衍生自誘變方法和重組方法(如DNA改組)的序列和蛋白質(zhì)。用這種方法,可以操作一種或多種不同的編碼序列以產(chǎn)生具有所需特性的新多肽。以這種方式,從相關(guān)序列的多核苷酸群體中生成重組多核苷酸文庫,其中所述的多核苷酸群體包含具有相當(dāng)?shù)男蛄型恍圆⒖梢赃M行體外(in vitro)或體內(nèi)同源重組的序列區(qū)域。本領(lǐng)域中已知用于這種DNA改組的策略(見例如,Stemmer 1994;Stemmer 1994;Crameri 1997;Moore 1997;Zhang 1997;Crameri 1998和US 5,605,797,9,11,13,15和17,837,458)。
就“變體”多肽而言,意指通過蛋白質(zhì)氨基末端和/或羧基末端缺失(所謂截短)或添加一個或多個氨基酸;在天然蛋白質(zhì)內(nèi)一個或多個位點處缺失或添加一個或多個氨基酸或在天然蛋白質(zhì)內(nèi)一個或多個位點處替換一個或多個氨基酸而衍生自天然蛋白質(zhì)的肽。此類變體可以因遺傳多態(tài)性或因人類操作產(chǎn)生。用于此類操作的方法通常在本領(lǐng)域中是已知的。
因此,多肽可以通過多種方法(包括氨基酸替換、缺失、截短和插入)改變。用于此類操作的方法通常在本領(lǐng)域中是已知的。例如,多肽的氨基酸序列變體可以通過DNA突變而制備。用于誘變和核苷酸序列變異的方法在本領(lǐng)域中是眾所周知的(見例如,Kunkel 1985;Kunkel 1987;US4,873,192;Walker和Gaastra,1983及其中引用的參考文獻)。可以在Dayhoff等(1978)的模型中找到對沒有影響目的蛋白生物學(xué)活性的適宜氨基酸替換的指導(dǎo)。優(yōu)選是保守性替換,如將一個氨基酸交換為具相似特性的其它氨基酸。在編碼的序列中改變、增加或缺失單個氨基酸或小百分比例的氨基酸(一般少于5%,更一般地少于1%)的分別的替換、缺失或添加是“保守性修飾的變異”,其中改變導(dǎo)致氨基酸用化學(xué)相似的氨基酸替換。本技術(shù)領(lǐng)域眾所周知提供功能相似的氨基酸的保守性替換表。如下五個組分別含有可以相互實施保守性替換的氨基酸脂肪族甘氨酸(G)、丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I);芳族苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);含硫甲硫氨酸(M)、半胱氨酸(C);堿性精氨酸(R)、賴氨酸(K)、組氨酸(H);酸性天冬氨酸(D)、谷氨酸(E)、天冬氨酸(N)、谷氨酰胺(Q)。還見Creighton,1984。此外,在所編碼序列中改變、增加或缺失單個氨基酸或小百分數(shù)的氨基酸的分別的替換、缺失或添加也是“保守性修飾的變異”。
“表達盒”或“表達構(gòu)建體”如本文中所用意指能夠指導(dǎo)特定核苷酸序列在適宜宿主細胞中表達的DNA序列,所述的DNA序列包含與目的核苷酸序列有效連接的啟動子,該啟動子任選地與終止信號和/或其它調(diào)節(jié)性元件有效連接。表達盒還可以包含對于正確翻譯核苷酸序列所需要的序列。編碼區(qū)域通常編碼目的蛋白,然而還可以從有義方向或反義方向編碼功能性目的RNA(例如反義RNA)或非翻譯的RNA。包含目的核苷酸序列表達盒可以是嵌合的,這意味表達盒的成分中的至少一個成分相對于表達盒其它成分中的至少一個成分是異源的。表達盒還可以是這樣表達盒,該表達盒天然存在,但是已經(jīng)以用來異源表達的重組形式獲得。表達盒可以完全在細胞外進行裝配(例如通過重組克隆技術(shù))。然而,表達盒還可以部分地使用內(nèi)源性成分進行裝配。例如,可以通過在內(nèi)源性序列的上游放置(或插入)啟動子序列而獲得表達盒,其中所述的內(nèi)源性序列因此與所述的啟動子序列功能性連接并受其控制。類似地,可以在內(nèi)源性啟動子序列下游放置(或插入)待表達的核酸序列,因而形成表達盒。表達盒中的核苷酸序列的表達可以受組成型啟動子控制或受誘導(dǎo)型啟動子控制,其中所述的誘導(dǎo)型啟動子僅在宿主細胞接觸某些特定外部刺激時才啟動轉(zhuǎn)錄。在多細胞生物的例子中,啟動子還可以對特定組織或特定器官或特定發(fā)育階段特定(例如,本發(fā)明的種子特異性或種子偏好性啟動子)是特異性的。在優(yōu)選的實施方案中,此類表達盒將包含與本發(fā)明的目的核苷酸序列連接的轉(zhuǎn)錄起始區(qū)。優(yōu)選提供這樣的表達盒,其具有多個用于插入將受調(diào)節(jié)區(qū)域轉(zhuǎn)錄性調(diào)節(jié)的目的基因的限制性位點。表達盒還可以含有可選擇標記基因。該盒將包括在5′-3′方向的轉(zhuǎn)錄、轉(zhuǎn)錄和翻譯起始區(qū)、目的DNA序列以及在植物中有功能的轉(zhuǎn)錄和翻譯終止區(qū)。終止區(qū)可以是轉(zhuǎn)錄起始區(qū)本身的,可以是目的DNA序列本身的或可以衍生自其它來源。便于使用的終止區(qū)可以從根癌農(nóng)桿菌的Ti-質(zhì)粒獲得,如章魚堿合酶終止區(qū)和胭脂堿合酶終止區(qū)并且如下描述其它終止區(qū)(還見Guerineau 1991;Proudfoot 1991;Sanfacon 1991;Mogen 1990;Munroe 1990;Ballas 1989;Joshi 1987)。
將“載體”定義為尤其包括處于雙鏈或單鏈的直鏈或環(huán)狀形式的任何質(zhì)粒、粘粒、噬菌體或農(nóng)桿菌雙元載體,其可能或不可能自我傳播或運動,并且可以通過整合至細胞基因組中而轉(zhuǎn)化原核生物宿主或真核生物宿主,或者以染色體外方式存在(例如具有復(fù)制起點的自主復(fù)制性質(zhì)粒)。
具體包括穿梭載體,該載體意指能夠天然地或因設(shè)計而在兩種不同宿主生物中復(fù)制的DNA載體,其中所述的宿主生物可以自放線菌(actinomycete)及相關(guān)物種、細菌和真核生物(例如高等植物、哺乳動物、酵母或真菌細胞)。
載體中的核酸優(yōu)選地受到用于在宿主細胞(如微生物細胞例如細菌細胞或植物細胞)內(nèi)轉(zhuǎn)錄的適宜啟動子或其它調(diào)節(jié)性元件控制并與之有效連接。載體可以是在多種宿主中有功能的雙功能表達載體。在基因組DNA的例子中,載體可以含有自身的啟動子或其它調(diào)節(jié)性元件,并且在cDNA的例子中,載體可以受用于在宿主細胞中表達的適宜啟動子或其它調(diào)節(jié)性元件控制。
“克隆載體”通常含有一個或少數(shù)限制性內(nèi)切核酸酶識別位點(其中可以以可確定的方式在所述的限制性內(nèi)切核酸酶識別位點內(nèi)插入外來DNA序列而不丟失載體的基本生物學(xué)功能)和適用于鑒定并選擇用該克隆載體已轉(zhuǎn)化的細胞的標記基因。標記基因一般包括提供四環(huán)素抗性、潮霉素抗性或氨芐青霉素抗性的基因。
“轉(zhuǎn)基因植物”是具有一個或多個含有表達載體的植物細胞的植物。
“植物組織”包括分化和未分化的組織或植物,包括但不限于根、莖、枝條、葉、花粉、種子、腫瘤組織和多種形式的細胞及培養(yǎng)物,如單個細胞、原生質(zhì)體、胚和愈傷組織。植物組織可以位于植物中或位于器官、組織或細胞培養(yǎng)物中。
如下術(shù)語用來描述在兩種或多種核酸或多核苷酸之間的序列關(guān)系(a)“參考序列”、(b)“比較窗口”、(c)“序列同一性”、(d)“序列同一性百分數(shù)”和(e)“相當(dāng)?shù)耐恍浴薄?br>
(a)如本文中所用,“參考序列”是用作序列比較基礎(chǔ)的已定義的序列。參考序列可以是指定序列的部分或整體;例如,作為全長cDNA或基因序列的節(jié)段或完整的cDNA或基因序列。
(b)如本文中所用,“比較窗口”指多核苷酸序列中連續(xù)的指定節(jié)段,其中與參考序列(其不包含添加或缺失)相比,在比較窗口中的多核苷酸序列可以包含添加或缺失(即空位)以便最佳比對兩種序列。通常,比較窗口是至少20個連續(xù)核苷酸長度并且任選地可以是30、40、50、100個連續(xù)核苷酸長度或更長。本領(lǐng)域技術(shù)人員理解為了避免因在多核苷酸序列中包含空位而與參考序列的高度相似性,通常導(dǎo)入并從匹配數(shù)中扣減空位罰分。
用于比較的序列比對方法在本領(lǐng)域中是眾所周知的。因此,可以使用數(shù)學(xué)算法完成對任一兩種序列間同一性百分數(shù)的確定。優(yōu)選的非限制性的數(shù)學(xué)算法實例是Myers和Miller(1988)算法;Smith等(1981)局部同源性算法;Needleman和Wunschde(1970)同源性比對算法;Pearson和Lipman(1988)搜索相似性方法;Karlin和Altschul,(1990)算法,改良的Karlin和Altschul(1993)算法。
可以利用這些數(shù)學(xué)算法的計算機執(zhí)行以比較序列而確定序列同一性。這類執(zhí)行包括,但不限于在PC/Gene程序(可從Intelligenetics,MountainView,Calif.獲得)的CLUSTAL;ALIGN程序(版本2.0)和在WisconsinGenetics Software Package,版本8(可從Genetics計算機Group(GCG),575 Science Drive,Madison,Wis.,USA獲得)內(nèi)的GAP、BESTFIT、BLAST、FASTA和TFASTA。使用默認執(zhí)行參數(shù),可以開展使用這些程序的比對。已充分描述了CLUSTAL程序(Higgins 1988,1989;Corpet 1988;Huang 1992;Pearson 1994)。ALIGN程序以上述Myers和Miller的算法為基礎(chǔ)。Altschul等,1990的BLAST程序以上述Karlin和Altschul的算法為基礎(chǔ)。優(yōu)選地使用Clustal W算法(Thompson 1994;例如在軟件Vector NTITM,版本9;Invitrogen Inc.),記分矩陣BLOSUM62MT2,默認設(shè)置(空位開口罰分15/19,空位延伸罰分6.66/0.05;空位分離罰分范圍8;比對延誤的%同一性40;使用殘基特異性空位和親水性殘基空位)開展多重比對(即多于2種序列)。
用于開展BLAST分析的軟件可從National Center for BiotechnologyInformation(http://www.ncbi.nlm.nih.gov/)公開獲得。該算法包括首先通過確定提交序列中的短字長度W而確定高記分序列對(HSP),其中在與數(shù)據(jù)庫序列內(nèi)長度相同的字比對時,所述的提交序列達到或滿足某些正值的閾值記分T。T稱作鄰近字記分閾值(Altschul 1990)。這些初始鄰近字命中充當(dāng)種子,其中所述的種子啟動了搜索以發(fā)現(xiàn)含有這些種子的更長HSP。字命中隨后在兩個方向上沿著每個序列盡可能遠地延伸,只要可以增加累積性比對記分。對核苷酸序列,使用參數(shù)M(對一對匹配殘基的反向記分;總是>0)和N(對錯配殘基的罰分記分;總是<0)計算累積性記分。對于氨基酸序列,使用記分計分矩陣來計算累積性記分。當(dāng)累積性比對記分從最大的已實現(xiàn)值上以量X降低時,停止在每一方向上字命中延伸,累積性記分因一個或多個負記分性殘基比對的累積或抵達兩種序列中任一序列的末尾而變成零或以下。
除了計算序列同一性百分數(shù)之外,BLAST算法還開展兩種序列之間相似性的統(tǒng)計分析(見例如Karlin和Altschul(1993).One measure ofsimilarity provided by the BLAST algorithm is the smallest sumprobability(P(N)),這提供兩種核苷酸序列或氨基酸序列之間的匹配可能偶然發(fā)生的概率指示。例如,若在測試核酸序列與參考核酸序列的比較中的最小總和概率少于約0.1,更優(yōu)選地少于約0.01和最優(yōu)選地少于約0.001,則認為測試核酸序列與參考序列是相似的。
為獲得用于比較目的的空位比對,可以利用如A.ltschul等1997所述的Gapped BLAST(在BLAST 2.0內(nèi))?;蛘?,可以使用PSI-BLAST(在BLAST 2.0內(nèi))來開展探測分子間遠緣關(guān)系的多重搜索。見上述Altschul等。當(dāng)利用BLAST、Gapped BLAST、PSI-BLAST時,可以使用各自程序的默認執(zhí)行參數(shù)(例如BLASTN用于核苷酸序列、BLASTX用于蛋白質(zhì))。BLASTN程序(用于核苷酸序列)默認使用字長度(W)11、期望(E)10、界限值100、M=5、N=-4并比較兩條鏈。對于氨基酸序列,BLASTP程序默認使用字長度(W)3、期望(E)10和BLOSUM62記分矩陣(見Henikoff和Henikoff,1989)。見http://www.ncbi.nlm.nih.gov。比對還可以通過目測以人工方式開展。
為了本發(fā)明的目的,優(yōu)選地使用具有默認執(zhí)行參數(shù)的BlastN程序(版本1.4.7或更新版本)或任何等效程序開展核苷酸序列的比較,以確定與本文中公開的啟動子序列的序列同一性百分數(shù)?!暗刃С绦颉币庵溉我恍蛄斜容^程序,即與優(yōu)選程序所生成的對應(yīng)比對相比,所述任一的序列比較程序?qū)λ儐柕娜魏蝺煞N序列生成了具有相同核苷酸匹配或相同氨基酸殘基匹配和相同序列同一性百分數(shù)的比對。
(c)如本文中所用,“序列同一性”或”同一性”在兩種核酸或兩種多肽序列上下文中,意指在兩種序列中,當(dāng)在指定的比較窗口范圍內(nèi)進行最大一致性比對時的相同的殘基。當(dāng)談及蛋白質(zhì)時使用序列同一性百分數(shù),認識到不相同的殘基位置經(jīng)常因保守性氨基酸替換而不同,其中氨基酸殘基被替換為具有相似化學(xué)特性(例如電荷或疏水性)的其它氨基酸殘基并且因此不改變分子的功能特性。當(dāng)序列在保守性替換上相異時,可以上調(diào)序列同一性百分數(shù)以校正替換的保守性本質(zhì)。由于此類保守性替換而相異的序列稱作具有“序列相似性”或“相似性”。本領(lǐng)域技術(shù)人員眾所周知進行這種調(diào)整的方法。通常,這種方法包括計算保守性替換為部分錯配而非完全錯配,因此增加序列同一性百分數(shù)。因此例如,當(dāng)給予相同的氨基酸1記分并且給予非保守性替換0記分時,則給予保守性替換在0和1之間的記分。例如如在程序PC/GENE(Intelligenetics,Mountain View,Calif.)所執(zhí)行的那樣進行保守性替換分值的計算。
(d)如本文中所用,“序列同一性百分數(shù)”意指通過在比較窗口中比較兩個優(yōu)化比對的序列所測定的值,其中與用于優(yōu)化比對兩種序列的參考序列(其不包含添加或缺失)相比時,多核苷酸序列在比較窗口中的部分可以包含添加或缺失(即空位)。如此計算該百分數(shù),即通過確定在兩種序列內(nèi)均存在相同核酸堿基或相同氨基酸殘基的位置數(shù)來產(chǎn)生匹配位置,匹配的位置數(shù)除以在比較窗口中的總位置數(shù),并將結(jié)果乘以100以產(chǎn)生序列同一性百分數(shù)。
(e)(i)術(shù)語多核苷酸序列的“相當(dāng)同一性”意指包含如此序列的多核苷酸,其中所述的序列在使用所述比對程序之一,使用標準參數(shù)與參考序列比較時,具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%,優(yōu)選至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更優(yōu)選至少90%、91%、92%、93%或94%并且最優(yōu)選至少95%、96%、97%、98%或99%的序列同一性??紤]到密碼子簡并性、氨基酸相似性、讀碼框位置等,本領(lǐng)域技術(shù)人員將認識到可以適當(dāng)調(diào)整這些值以確定兩種核苷酸序列所編碼的蛋白質(zhì)的相應(yīng)同一性。用于這些目的氨基酸序列的相當(dāng)同一性通常意指至少60%或70%、更優(yōu)選至少80%、90%以及最優(yōu)選至少95%的序列同一性。
核苷酸序列是基本相同的另一個指標是兩種分子是否在嚴格條件下(見下文)彼此雜交。通常,選擇的嚴格條件是在定義的離子強度和pH上低于特定序列的熱解鏈溫度(Tm)約5℃。然而,嚴格條件包括范圍在約1℃至約20℃的溫度,這取決于如本文中另外定義的所需要的嚴格程度。若核酸編碼的多肽基本上相同,則在嚴格條件下彼此不雜交的核酸仍是基本上相同的。例如當(dāng)核酸拷貝使用遺傳密碼子所允許的最大密碼子簡并性產(chǎn)生時,這種情況可以存在。當(dāng)?shù)谝环N核酸所編碼的多肽與第二種核酸所編碼的多肽發(fā)生免疫交叉反應(yīng)時,即為兩種核酸序列是基本相同的一個指標。
(ii)術(shù)語“相當(dāng)?shù)耐恍浴痹陔牡纳舷挛闹惺侵鸽陌@樣的序列,該序列對指定比較窗口中的參考序列具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、優(yōu)選地80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更優(yōu)選至少90%、91%、92%、93%或94%或甚至更優(yōu)選是95%、96%、97%、98%或99%的序列同一性。優(yōu)選地,使用Needleman和Wunsch(1970)的同源性比對算法實施優(yōu)化比對。當(dāng)一種肽與針對第二種肽的抗體發(fā)生免疫交叉反應(yīng)時,即為兩種肽序列是基本相同的一個指標。因此,例如在兩種肽僅因保守性替換而相異時,這種肽與第二種肽基本上相同。
對于序列比較,通常一種序列充當(dāng)對受試序列加以比較的參考序列。當(dāng)使用序列比較算法時,將受試序列和參考序列輸入計算機,根據(jù)需要指定亞序列坐標,并指定序列算法程序參數(shù)。基于指定的程序參數(shù),序列比較算法隨后計算受試序列相對于參考序列的序列同一性百分數(shù)。
如上指出,核苷酸序列是基本相同的另一個指標是兩種分子在嚴格條件下彼此雜交。短語“特異性雜交至”指一種分子僅與特定核苷酸序列(此時所述序列存在于(例如總細胞的)DNA或RNA的復(fù)雜混合物中在嚴格條件下結(jié)合、配對或雜交?!盎旧辖Y(jié)合”指探針核酸與靶核酸之間的互補性雜交并且包括可通過降低雜交介質(zhì)的嚴格性而容忍的少量錯配,以實現(xiàn)所需要的檢測靶核酸序列。
“嚴格雜交條件”和“嚴格雜交洗滌條件”在核酸雜交實驗如Southern和Northern雜交的上下文中是序列依賴性的,并且在不同環(huán)境參數(shù)下不同。Tm是(在定義的離子強度和pH下)50%靶序列與完全匹配的探針雜交的溫度。特異性通常是雜交后洗滌的函數(shù),關(guān)鍵因子是終末洗滌溶液的離子強度和溫度。對DNA-DNA雜交體,Tm可以從Meinkoth和Wahl,1984的等式中估計 Tm=81.5℃+16.6(log10M)+0.41(%GC)-0.61(%form)-500/L 其中M是單價陽離子的體積摩爾濃度,%GC是DNA中鳥嘌呤和胞嘧啶的百分含量。%form是雜交溶液中的甲酰胺百分含量并且L是雜交體的堿基對長度。對于每1%的錯配,Tm降低約1℃;因此,可以調(diào)節(jié)Tm、雜交條件和/或洗滌條件以便與具有目的同一性的序列雜交。例如,若尋求具有>90%同一性的序列,則Tm可以減少10℃。通常,選擇的嚴格條件是在定義的離子強度和pH處低于特定序列及其互補序列的熱解鏈溫度約5℃。然而,非常嚴格的條件可以使用在比熱解鏈溫度I低1、2、3或4℃的雜交和/或洗滌;中等嚴格的條件可以使用在比熱解鏈溫度I低6、7、8、9或10℃的雜交和/或洗滌;低嚴格條件可以使用在比熱解鏈溫度I低11、12、13、14、15或20℃的雜交和/或洗滌。使用該等式、雜交組合物和洗滌組合物以及需要的T,技術(shù)人員將理解雜交溶液和/或洗滌溶液的嚴格性的變化被內(nèi)在地描述。若所需的錯配程度導(dǎo)致T小于45℃(水溶液)或32℃(甲酰胺溶液),優(yōu)選增加SSC的濃度以至可以使用較高的溫度。對核酸雜交的全面指南可在Tijssen,1993中找到。通常,所選的高度嚴格雜交條件和洗滌條件是在定義的離子強度和pH處低于特定序列的熱解鏈溫度Tm約5℃。
高度嚴格洗滌條件的實例是0.15M NaCl,在72℃洗滌約15分鐘。嚴格洗滌條件的實例是0.2×SSC,在65℃洗滌15分鐘(見Sambrook,下文對于SSC緩沖液的描述)。低嚴格性洗滌往往先于高嚴格性洗滌進行,以去除背景探針信號。對雙鏈體(例如超過100個核苷酸)的中等嚴格洗滌的實例是1×SSC,在45℃洗滌15分鐘。對雙鏈體(例如超過100個核苷酸)的低嚴格性洗滌的實例是4×至6×SSC,在40℃洗滌15分鐘。對于短探針(例如約10個至50個核苷酸),嚴格條件通常包括于pH7.0至8.3處低于約1.5M的鹽濃度,更優(yōu)選地是約0.01至1.0M的Na離子濃度(或其它鹽),并且溫度一般是至少約30℃并且對于長探針(例如>50個核苷酸)是至少約60℃。嚴格條件還可以通過添加去穩(wěn)定劑(如甲酰胺)實現(xiàn)。通常,當(dāng)信號與噪音比是在特定雜交分析中對不相關(guān)的探針所觀察到的信號與噪音比2倍(或更高)時,表明檢測到特異性雜交。在嚴格條件下彼此不雜交的核酸,如果它們所編碼的多肽是基本上相同的,則它們?nèi)曰旧鲜窍嗤?。例如?dāng)使用遺傳密碼子所允許的最大密碼子簡并性產(chǎn)生核酸的拷貝時,這種情況可以出現(xiàn)。
選擇極嚴格條件等同于對特定探針的Tm。用于具有多于100個互補性殘基的互補性核酸在濾紙上在Southern或RNA印跡中雜交的嚴格條件的實例是50%甲酰胺,例如在50%甲酰胺、1M NaCl、1%SDS中在37℃雜交并在0.1×SSC在60℃至65℃洗滌。示例性的低嚴格條件包括使用含30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸鈉)緩沖溶液在37℃雜交并在1×至2×SSC(20×SSC=3.0M NaCl/0.3M檸檬酸三鈉)中在50℃至55℃洗滌。示例性的中度嚴格條件包括使用含40%至45%甲酰胺、1.0M NaCl、1%SDS在37℃雜交并在0.5X至1×SSC中在55℃至60℃洗滌。
如下是可以用來克隆直向同源性核苷酸序列的成組雜交/洗滌條件的實例,其中所述的直向同源性核苷酸序列與本發(fā)明的參考核苷酸序列基本上相同直向同源性核苷酸序列優(yōu)選地與參考核苷酸序列在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mMEDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌。
“DNA改組”是在DNA分子中導(dǎo)入、優(yōu)選地隨機導(dǎo)入突變或重排的方法或在兩種或多種DNA分子之間產(chǎn)生、優(yōu)選地隨機產(chǎn)生DNA序列交換的方法。因DNA改組產(chǎn)生的DNA分子是改組的DNA分子,該DNA分子是衍生自至少一個模板DNA分子的非天然存在的DNA分子。改組的DNA優(yōu)選地編碼變體多肽,其中所述的變體多肽相對于模板DNA所編碼的多肽受到修飾并可以具有相對于模板DNA所編碼多肽的改變的生物學(xué)活性。
“重組DNA分子”是使用例如在Sambrook等,1989中所述的重組DNA技術(shù)和方法而連接的DNA序列的組合,其中使用所述的重組DNA技術(shù)和方法將DNA序列連接在一起。
本發(fā)明尤其用于單子葉植物中的應(yīng)用。術(shù)語“單子葉植物”包括具有多個倍性水平的植物,所述的倍性水平包括非整倍體、多倍體、二倍體、單倍體和半合子。還包括成熟的植物、種子、枝條和幼苗,和部分、繁殖材料(例如種子和果實)以及衍生自其中的培養(yǎng)物,例如細胞培養(yǎng)物。一年生和多年生單子葉植物是用于產(chǎn)生轉(zhuǎn)基因植物的優(yōu)選宿主生物。本發(fā)明的單子葉植物優(yōu)選地是禾本科植物(Gramineae)。
術(shù)語“禾本科(Gramineae或Graminaceae)”如本文中所用意圖包含禾本科的全部植物物種,尤其用作食品原料或飼料原料的那些植物物種,如稻、玉米、小麥或其它的谷類物種如麥、黍和高粱、黑麥、triticale或燕麥,和甘蔗以及全部牧草物種。此外包括成熟植物、種子、枝條和幼苗,和部分、繁殖材料以及衍生自其中的培養(yǎng)物,例如細胞培養(yǎng)物。成熟的植物指超過幼苗發(fā)育期的任何發(fā)育期的植物。術(shù)語“幼苗”指處在早期發(fā)育階段的不成熟年幼植物,在所述的發(fā)育早期幼苗仍依賴種子中(例如在胚乳、外胚乳或子葉內(nèi))所貯藏的同化產(chǎn)物。包括竹亞科(Bambusoideae)(例如bamboo屬)、Andropogonoideae(例如甘蔗屬(Saccharum)、高粱屬(Sorghum)或玉蜀黍?qū)?Zea))、蘆竹族(Arundineae)(例如蘆葦屬(Phragmites))、稻亞科(Oryzoideae)(例如稻屬(Oryza))、黍亞科Panicoideae(例如黍?qū)?Panicum)、狼尾草屬Pennisetum和狗尾草屬Setaria)、早熟禾亞科(Pooideae)(羊茅亞科(Festuciadeae))(例如早熟禾屬(Poa)、羊茅屬(Festuca)、黑麥草屬(Lolium)、三毛草屬(Trisetum)、剪股穎屬(Agrostis)、梯牧草屬(Phleum)、鴨茅屬(Dactylis)、看麥娘屬(Alopecurus)、燕麥屬(Avena)、小麥屬(Triticum)、黑麥屬(Secale)和大麥屬(Hordeum))的全部屬。優(yōu)選燕麥(Avena sativa)(燕麥)、簕竹屬(Bambusa sp.)某些種和印度箣(Bambusa bambos)(bamboo)、甘蔗(Saccharum officinarum)(甘蔗sugarcane)、栽培二粒小麥(Triticum dicoccum)(二粒小麥(Emmer wheat))、栽培一粒小麥(Triticum monococcum)(一粒小麥(Einkorn wheat))、斯卑爾脫小麥(Triticum spelta)(斯卑爾脫小麥(spelta wheat))、硬粒小麥(Triticumdurum)(小麥)、圓錐小麥(Triticum turgidum)、普通小麥(Triticumaestivum)(小麥)、玉蜀黍(玉米(maize)/玉米(corn))、稷(Panicummiliaceum)(普通黍)、Pennisetum thiphoides(Bulrush millet)、大麥(Hordeum vulgare或H.sativum)(大麥)、稻(Oryza sativa)(稻)、水生菰(Zizania aquatica)(野生稻(wild rice))、黑麥(Secale cereale)(黑麥)、高粱(Sorghum bicolor)(S.vulgare)(高粱)。更優(yōu)選小麥(Triticum spp.)、稻(Oryza spp.)、大麥(Hordeum spp.)、燕麥(Avena spp.)、黑麥(Secale spp.)、玉米(玉蜀黍)、高粱和黍(Pennisettum spp)。優(yōu)選小麥家族的全部小麥種(包冬小麥和春小麥)、更具體地是普通小麥(Triticum spp.common(T.aestivum))、硬粒小麥(T.durum)、斯卑爾脫小麥(T.spelta)、栽培二粒小麥、圓錐小麥和栽培一粒小麥并特別優(yōu)選普通小麥。本發(fā)明的方法可以用來產(chǎn)生來自春小麥(例如Bobwhite、Marshall、PIVOT1、UC702和Panewawa)和來自冬小麥(例如HY368、Neeley、FL302、RH91、R332、R1269和R585)的轉(zhuǎn)基因植物。其它合適的小麥基因型包括,不限于YecoraRojo、Karl和Anza。然而,應(yīng)當(dāng)指出本發(fā)明不限于某些品種,而是高度基因型非依賴性的。
詞語“植物”指任何植物,尤其指農(nóng)學(xué)有用的植物(例如種子植物),并且“植物細胞”是植物的結(jié)構(gòu)單元和生理單元,其包含細胞壁,然而還可以指原生質(zhì)體。植物細胞可以是分離的單個細胞或培養(yǎng)的細胞形式,或作為更高級有機體單元的部分,其中更高級有機體單元例如是植物組織,或分化成為植物任何發(fā)育期上均存在的結(jié)構(gòu)的植物器官。此類結(jié)構(gòu)包括一種或多種植物器官,包括,但不限于果實、枝條、莖、葉、花瓣等。優(yōu)選地、術(shù)語“植物”包括完整植物、枝條營養(yǎng)器官/結(jié)構(gòu)(例如葉、莖和塊莖)、根、花和花器官/結(jié)構(gòu)(例如苞片、萼片、花瓣、雄蕊、心皮、花藥和胚珠)、種子(包括胚、胚乳和種皮)和果實(成熟子房)、植物組織(例如維管組織、基本組織等)和細胞(例如保衛(wèi)細胞、卵細胞、毛狀體等),和前述對象的子代。
“顯著增加”是大于測量技術(shù)內(nèi)固有誤差的增加,優(yōu)選地是約2倍或更多倍的增加。
“明顯少于”意指減少大于測量技術(shù)內(nèi)固有的誤差,優(yōu)選地是約2倍或更多倍的減少。
發(fā)明詳述 本發(fā)明提供了用于在單子葉植物、尤其在玉米(zea mays)中實現(xiàn)淀粉胚乳特異性和胚特異性表達譜的方法和主題。
本發(fā)明的第一個實施方案涉及包含表達盒的單子葉植物,所述表達盒包含 a)嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,其包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列, ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列, 與該嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接 b)至少一個核酸序列,其相對于所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列為異源的并適用于賦予植物選自如下的性狀或特性 i)抗至少一個脅迫因子的增強抗性, ii)提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量, iii)提高的產(chǎn)量,和 iv)靶向的序列切除。
表達構(gòu)建體中所采用的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)令人驚訝地在種子(谷粒)發(fā)育和萌發(fā)中展示出高度特異性。這與本領(lǐng)域在雙子葉植物和單子葉植物中所報導(dǎo)的表達模式形成鮮明對比,其中組成型表達模式在所有組織中均得到報導(dǎo)(Ni M等(1995)Plant J 7(4)661-676;US5,955,646;Kononov等,A Comparative Study of the Activity of theSuper-promoter with Other Promoters in Maize(1999)第20屆crown gall年會,德克薩斯-豪斯頓大學(xué)醫(yī)學(xué)院;摘要集,第36頁;Comparative Studyof the Activity of the Super-promoter and Other Promoters in Maize(1998)第19屆crown gall年會,普渡大學(xué),West Lafayette,印第安納州])。然而,對于單子葉植物,先前僅用GUS基因測試了表達。
優(yōu)選地,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列引起所述異源DNA主要在淀粉胚乳或萌芽胚中表達。由嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)調(diào)節(jié)的表達存在于在授粉后5日和20日之間種子(谷粒)發(fā)育開始期間的淀粉胚乳中。因為該情況,所述序列具有種子成熟或谷粒成熟特異性。本文中“種子成熟或谷粒成熟”指起于受精并止于種子干燥的時期,其中在受精中可代謝的食物儲備(例如蛋白質(zhì)、脂類、淀粉等)沉積在正在發(fā)育的種子中,尤其在包括胚乳的種子貯藏器官內(nèi),導(dǎo)致種子增大和填充。轉(zhuǎn)錄活性隨后在萌發(fā)期期間,又首先在淀粉胚乳中啟動到極高水平,并且隨后在16小時與24小時吸漲之間幾乎完全“關(guān)閉”直至萌芽胚具有極高表達水平。表達隨后在萌發(fā)開始后約7日停止。萌發(fā)期間除淀粉胚乳和胚以外,在任何組織內(nèi)檢測不到明顯表達。這種表達模式對如下應(yīng)用特別有用 i)增強脅迫因子抗性現(xiàn)有技術(shù)中如上所述,胚對各種生物性和非生物性脅迫因子(干旱、寒冷、疾病等)非常敏感。這些脅迫因子直接影響產(chǎn)量和作物質(zhì)量。本領(lǐng)域中已知的絕大多數(shù)啟動子在胚期沒有表達能力或具有低表達能力。本文中公開的轉(zhuǎn)錄調(diào)節(jié)特異性尤其用來按需要表達脅迫抗性基因,即在合適時間到達高水平。此外,由于淀粉胚乳中的特異性,有可能尋求解決脅迫抗性的新途徑。因為淀粉胚乳是滋養(yǎng)胚的組織,故可以通過改善胚的養(yǎng)分補充而提高脅迫抗性。
ii)提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)的表達模式允許轉(zhuǎn)化種子(谷粒)成分或允許改變種子中成分的分布。例如,可以將糖類(淀粉)轉(zhuǎn)化成油或其它高價值成分(例如維生素)或可以使成分從胚乳轉(zhuǎn)移至胚,因而提供具有改善的營養(yǎng)價值的籽苗。
iii)提高產(chǎn)量提高的產(chǎn)量部分地與脅迫抗性(見以上i))相關(guān)。然而,嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)的表達模式甚至允許在無脅迫因子下通過優(yōu)化胚生長而增加產(chǎn)量,其中胚的生長將直接影響幼苗生長。還可以實現(xiàn)田間條件下更早的萌發(fā)以及會引起更高或更早產(chǎn)量的其它性狀。
iv)靶向的序列切除。如上所述,均一地切除序列(尤其標記序列)是生物技術(shù)領(lǐng)域內(nèi)未解決的問題。絕大多數(shù)植物表現(xiàn)出嵌合樣切除模式,既有成功切除的區(qū)域,又有未切除的區(qū)域。當(dāng)生物不是由眾多植物組成時,為實現(xiàn)均一或基本均一的切除,優(yōu)選地需要在發(fā)育早期激活切除機制。此外需要強烈的激活(即切除介導(dǎo)酶的表達)。這兩種要求均由本文中公開的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)的表達模式滿足。早期胚萌發(fā)中的強烈轉(zhuǎn)錄活性允許在該時期有效地切除標記,由此產(chǎn)生無靶序列(例如無標記)的植物。
取決于發(fā)育時間,嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)的表達模式分別對淀粉胚乳或胚是特異性的。
“萌芽胚特異性轉(zhuǎn)錄”在本發(fā)明上下文中意指轉(zhuǎn)錄調(diào)節(jié)元件以如此方式轉(zhuǎn)錄核酸序列,以至于所述核酸序列在萌發(fā)植物、優(yōu)選在萌芽胚中的轉(zhuǎn)錄占RNA總量大于90%,優(yōu)選地大于95%,更優(yōu)選地大于99%,其中所述的RNA從整個植物、種子或籽苗中的特定發(fā)育期期間的所述核酸序列轉(zhuǎn)錄。
“淀粉胚乳特異性轉(zhuǎn)錄”在本發(fā)明上下文中意指轉(zhuǎn)錄調(diào)節(jié)元件以如此方式轉(zhuǎn)錄核酸序列,以至于所述核酸序列在淀粉胚乳中的轉(zhuǎn)錄占RNA總量大于90%,優(yōu)選地大于95%,更優(yōu)選地大于99%,其中所述的RNA從整個植物、種子或籽苗中的特定發(fā)育期期間的所述核酸序列轉(zhuǎn)錄。
1.嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列 在最常見的形式下,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含 i)至少一個衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,和 ii)至少一個衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列. 術(shù)語“衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列”意指這樣的序列,其至少包含在農(nóng)桿菌、優(yōu)選在根癌農(nóng)桿菌中負責(zé)調(diào)節(jié)甘露氨酸合酶表達的功能性元件。
優(yōu)選地,衍生自農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列和/或衍生自農(nóng)桿菌章魚堿合酶基因的上游激活序列源自根癌農(nóng)桿菌菌株。
甘露氨酸合酶基因的啟動子序列在本領(lǐng)域中眾所周知。例如,甘露氨酸合酶基因mas 1′和2′共有雙重的雙向啟動子和479bp基因間區(qū)。這些基因編碼用于合成甘露氨酸的兩步驟途徑的酶(Ellis 1984;Komro 1985)。mas基因的轉(zhuǎn)錄是趨異的,并且基因間區(qū)含有轉(zhuǎn)錄兩種基因所必需的全部順式作用元件(DiRita 1987;Fox 1992;Leung 1991;Guevara-Garcia 1993)。用于甘露氨酸合酶基因的轉(zhuǎn)錄元件公開于DiRita 1987,Gelvin,見上文,F(xiàn)ox 1992;Leung 1991;Langridge 1989。此外,T-DNA的全部序列公開于Barker 1983。
術(shù)語“上游激活序列”(UAS)指在天然狀態(tài)下優(yōu)選地在天然轉(zhuǎn)錄起點之前至少100堿基對并可以影響表達的序列。T-DNA基因含有在植物環(huán)境中有功能并與植物調(diào)節(jié)區(qū)域具有相似性的區(qū)域。例如,絕大多數(shù)植物啟動子含有通過結(jié)合反式作用因子而限定或影響啟動子的強度和組織特異性表達模式的順式作用元件,如上游激活序列(“UAS”)(常稱作“增強子”)。Atchison,(1988)Annu.Rev.Cell Biol.4127-53。給定啟動子的整體強度以及其表達模式可以受順式作用元件的組合和空間方向以及存在與這些元件相互作用的核因子影響。Dynan,(1989)Cell 581-4。雖然最初在原核生物質(zhì)粒中,然而T-DNA基因具有在植物中轉(zhuǎn)錄所需要的全部序列元件(啟動子和UAS)。例如,T-DNA基因含有設(shè)定轉(zhuǎn)錄起點的TATA盒并經(jīng)常含有距轉(zhuǎn)錄起點大于100bp的調(diào)節(jié)轉(zhuǎn)錄水平的上游元件。見Gelvin,TRANSGENIC PLANTS(Academic Press 1993)。章魚堿合酶基因和甘露氨酸合酶基因的UAS在此方面特別有用。這些UAS可以隨后與啟動子序列或與衍生自不同根癌農(nóng)桿菌的冠癭堿合酶基因中的上游激活序列及啟動子序列有效連接。具有上游激活序列的兩種T-DNA基因是章魚堿合酶(ocs)基因和甘露氨酸合酶(mas)基因。ocs基因編碼使精氨酸與焦磷酸縮合以形成章魚堿產(chǎn)物。Hack和Kemp,(1980)Plant Physiol.65949-55。位于ocs基因上游的16個堿基對回文序列能夠激活瞬時表達系統(tǒng)內(nèi)異源性玉米adh1啟動子。Ellis等,(1987)EMBO J.611-16;Ellis等,(1987)EMBO J.63203-08。該回文序列對穩(wěn)定轉(zhuǎn)化的煙草(tobacco)愈傷組織中的ocs啟動子活性也是必需的。Leisner和Gelvin,(1988)Proc.Nat′l Acad.Sci.USA852553-57;Leisner和Gelvin,(1989)Plant Cell 1925-36。
轉(zhuǎn)錄元件,如冠癭堿合酶基因的啟動子和上游激活序列可以基于可獲得的序列信息而輕易得到。例如,用于章魚堿合酶基因的轉(zhuǎn)錄元件公布于Leisner等,(1988)Proc.Nat′l Acad.Sci USA 852553-57;Leisner等,(1989)Plant Cell 1925-936。
形成本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可能有多種形式。優(yōu)選地,所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含至少三個衍生自根癌農(nóng)桿菌章魚堿合酶基因的上游激活序列,與至少一個衍生自根癌農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列有效連接。更優(yōu)選地,所述嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列還包含至少一個衍生自根癌農(nóng)桿菌甘露氨酸合酶基因的上游激活序列。
在更優(yōu)選的實施方案中,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列包含來自章魚堿合酶基因的上游激活序列和來自甘露氨酸合酶基因的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的特定組合。在更優(yōu)選的實施方案中,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列是超級啟動子。術(shù)語“超級啟動子”如本文中所用意指如SEQ ID NO4所述的來自章魚堿合酶基因的上游激活序列與來自甘露氨酸合酶基因的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的特定組合,如本文中所用,該術(shù)語還包含如SEQ ID NO4所述的超級啟動子的衍生物和變體。
術(shù)語“衍生”當(dāng)在DNA區(qū)域如啟動子、轉(zhuǎn)錄調(diào)節(jié)性核酸序列或上游激活序列的上下文中使用時,指如此情況,其中“衍生的”DNA區(qū)域從天然存在的DNA區(qū)域或其它來源的DNA區(qū)域中或者以它們?yōu)榛A(chǔ)而獲得?!把苌摹盌NA區(qū)域可以通常因設(shè)計的突變而與天然存在的DNA區(qū)域或其它來源的DNA區(qū)域相異。
短語“有效連接的”指第一個序列與第二個序列在位置上充分接近以至于第一個序列可以影響第二個序列或影響受第二個序列控制下的區(qū)域。例如,UAS可以有效地與轉(zhuǎn)錄調(diào)節(jié)性核酸序列(例如啟動子)連接,因而UAS增強啟動子的轉(zhuǎn)錄強度。在這種情況下,UAS通常在啟動子的5′處。接下來,UAS和啟動子可以有效地與基因連接以至于該基因?qū)⒃谕ǔN挥谠摶?′的UAS/啟動子組合的控制下表達。通常,啟動子總是在距離轉(zhuǎn)錄起點約30-50個堿基對范圍內(nèi)并且距離翻譯起點數(shù)百個堿基對范圍內(nèi)。激活性序列通常位于啟動子的數(shù)百個堿基對范圍內(nèi)。例如,激活性最強的序列位于受增強的啟動子約300至400個堿基對范圍內(nèi)。在其中采用多于一種激活性序列的本發(fā)明實施方案中,激活性序列通常地彼此距離約100至200個堿基對范圍內(nèi)。
1.1本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列及其功能性元件的衍生物和變體 除本文中公開的具體嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)及其特定元件(例如UAS序列和啟動子序列)之外,本文中公開的本發(fā)明預(yù)計還可以采用所述序列的衍生物和變體。
“變體”或“衍生物”意指基本上相似的序列,在所述序列中已經(jīng)修飾、去除或添加一個或多個堿基。這類衍生物和變體包括這樣的序列,其與原始序列(例如如SEQ ID NO4所述的序列)相比受到修飾或衍生自相似但不同的生物。因此,變體或衍生物可以包含一個或多個突變(包括但不限于一個或多個核苷酸的插入、缺失、替換、變異、倒置等)。對于核苷酸序列,天然存在的變體可以使用眾所周知的分子生物學(xué)技術(shù)(例如用如下文概述的聚合酶鏈式反應(yīng)(PCR)和雜交技術(shù))進行鑒定。變異的核苷酸序列還包括合成衍生的核苷酸序列,如通過位點定向誘變生成的那些核苷酸序列。通常,本發(fā)明特定核苷酸序列的變體與特定核苷酸序列在使用默認執(zhí)行參數(shù),通過本文其它處所述的序列比對程序時所確定的具有至少約60%、70%,通常至少約75%、80%、85%、優(yōu)選地至少約90%、91%、92%、93%、94%、95%、96%、97%并且更優(yōu)選地至少約98%、99%或更多的序列同一性。
特定的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)及其特定元件(例如UAS序列和啟動子序列)的衍生物可以包括,但不限于序列缺失、單個或多個點突變、在特定限制酶位點處的改變、添加功能性元件或分子性修飾的其它方法。這種修飾可以增強或可以不增強,或可以改變或可以不改變所述序列的轉(zhuǎn)錄調(diào)節(jié)活性。
例如,本領(lǐng)域技術(shù)人員可以界定序列中的功能性元件并缺失任何非必需元件。可以修飾或組合功能性元件以便為任何的具體應(yīng)用而增加本發(fā)明序列的應(yīng)用或表達。本發(fā)明轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的功能等效片段還可以通過去除或缺失非必需序列,但不缺失必需序列來獲得??s小轉(zhuǎn)錄調(diào)節(jié)核苷酸序列至其必需的轉(zhuǎn)錄介導(dǎo)性元件可以通過在體外trial-and-arrow缺失突變或在計算機(in silico)上使用啟動子元件搜索常用程序來實現(xiàn)。對啟動子活性必需的區(qū)域經(jīng)常表現(xiàn)出某些已知啟動子元件的簇集。此類分析可以使用可獲得的計算機算法如PLACE(“Plant Cis-acting Regulatory DNAElements”;Higo 1999,BIOBASE數(shù)據(jù)庫“Transfac”(BiologischeDatenbanken GmbH,Braunschweig;Wingender 2001)或數(shù)據(jù)庫PlantCARE(Lescot 2002)開展。尤其優(yōu)選轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的等效片段,其中所述的等效片段通過缺失編碼mRNA 5’非翻譯區(qū)的區(qū)域獲得,由此僅提供(非轉(zhuǎn)錄的)啟動子區(qū)域。5’非翻譯區(qū)可以輕易地通過本領(lǐng)域中已知方法(如5’-RACE分析)確定。因此,一些本發(fā)明的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列是其它序列的等效片段(見下文表2)。
如上所示,還可能隨機地制備并隨后分析本發(fā)明啟動子的缺失突變體。采用這種策略,制備了一系列構(gòu)建體,其中每種構(gòu)建體含有克隆的不同部分(亞克隆),并且隨后篩選這些構(gòu)建體的活性。用于篩選活性的合適方法是將含有已缺失節(jié)段的缺失型啟動子構(gòu)建體與可選擇標記或可篩選標記連接,并且僅分離表達標記基因的那些細胞。以這種方式,鑒定多個不同的缺失型啟動子構(gòu)建體,其中所述的缺失型啟動子構(gòu)建體保留所需要的或甚至增強的活性。因此通過比較所選擇的構(gòu)建體而鑒定對活性為必需的最小節(jié)段。隨后該節(jié)段可以用來構(gòu)建載體用于表達外源基因。
用于在編碼任何啟動子序列的DNA節(jié)段中誘變或產(chǎn)生缺失的方法對于本領(lǐng)域技術(shù)人員是眾所周知并且公開于例如US 6,583,338,其中所述文獻在本文中完整引用作為參考。本發(fā)明的某些變異核苷酸序列保留生物學(xué)活性(即調(diào)節(jié)具有如以上所定義表達模式的轉(zhuǎn)錄)。調(diào)節(jié)性序列變體的一個實例是通過從較長的啟動子中開展一個或多個缺失而形成的啟動子。有時候可以缺失啟動子的5’部分直至接近轉(zhuǎn)錄起點的TATA盒,而不取消啟動子活性,如Zhu等,(1995)The Plant Cell 71681-1689所述。去除DNA序列的部分的常規(guī)方法是使用外切核酸酶并結(jié)合DNA擴增以便產(chǎn)生雙鏈DNA克隆的單方向巢式缺失。用于此目的的商業(yè)試劑盒以商品名Exo-SizeTM(New England Biolabs,Beverly,Mass.)出售。生物學(xué)活性的變體還例如包括具有一個或多個核苷酸替換、缺失或插入的本發(fā)明天然啟動子序列。
衍生物和變體還包括來自農(nóng)桿菌(例如根癌農(nóng)桿菌)和其它物種(如其它土源細菌)的同系物、旁向同源物和直向同源物?!巴滴铩笔潜绢I(lǐng)域中用來指示與參考序列具有高度序列相關(guān)性的多核苷酸或多肽序列的類屬性術(shù)語。這種相關(guān)性可以通過確定如前文定義的同一性和/或相似性的程度加以定量。術(shù)語“直向同系物”和“旁向同源物”屬于這個類屬性術(shù)語。“旁向同源物”指相同物種內(nèi)功能相似的多核苷酸或多肽。“直向同源物”指這樣的多核苷酸或多肽,其是在另一個物種中該多核苷酸或多肽的功能等同物。直向同源基因優(yōu)選地意指編碼直向同源蛋白質(zhì)的基因。更具體地,術(shù)語“直向同系物”指從一個物種內(nèi)獲得的多肽或蛋白質(zhì),其中所述的多肽或蛋白質(zhì)是來自不同物種的多肽或蛋白質(zhì)的功能性對應(yīng)物。直向同源物之間的序列差異是物種形成的結(jié)果。
優(yōu)選地,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)的變體或衍生物的轉(zhuǎn)錄調(diào)節(jié)活性基本上與本文中具體公開的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)的轉(zhuǎn)錄調(diào)節(jié)活性(即以如上所述的淀粉胚乳特異性和萌芽胚特異性方式調(diào)節(jié)表達)相同(或等效)。除了這種轉(zhuǎn)錄調(diào)節(jié)活性以外,衍生物或變體的轉(zhuǎn)錄調(diào)節(jié)活性還可以與其親本序列的活性不同,尤其在表達水平方面。表達水平可以高于或低于親本序列的表達水平。這兩種偏離可能是有利的,這取決于待表達的目的核酸序列。優(yōu)選這類功能性等效序列,其與親本序列相比,偏離親本序列表達水平不大于50%、優(yōu)選25%、更優(yōu)選10%(如優(yōu)選地通過mRNA表達或蛋白質(zhì)(例如報道基因)表達加以判斷)。更優(yōu)選這樣的等效序列,該等效序列與它的親本序列相比表現(xiàn)增加的表達,優(yōu)選地增加至少50%,更優(yōu)選地至少100%,最優(yōu)選地至少500%。此類表達模式優(yōu)選地使用有效地與所述轉(zhuǎn)錄調(diào)節(jié)核苷酸序列連接的報道基因證實。在本上下文中的優(yōu)選報道基因(Schenborn 1999)是綠色熒光蛋白(GFP)(Chui 1996;Leffel 1997)、氯霉素乙酰轉(zhuǎn)移酶、螢光素酶(Millar 1992)、β-葡糖醛酸糖苷酶或β-半乳糖苷酶。尤其優(yōu)選β-葡糖醛酸糖苷酶(Jefferson1987)。分析轉(zhuǎn)錄性調(diào)節(jié)的其它方法在本領(lǐng)域眾所周知并且包括RNA印跡和RT-PCR(見例如以上提到的本文中引用作為參考的Sambrook等)。
在一個優(yōu)選的實施方案中,衍生自根癌農(nóng)桿菌甘露氨酸合酶基因啟動子的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列由選自如下的序列描述 i)SEQ ID NO2或3描述的序列, ii)SEQ ID NO2或3所述序列中至少50個連續(xù)堿基、優(yōu)選地至少100個連續(xù)堿基,更優(yōu)選地200個連續(xù)堿基的片段, iii)與SEQ ID NO2或3所述的序列具有至少60%、優(yōu)選至少70%或80%、更優(yōu)選至少85%或90%、最優(yōu)選至少95%或98%的序列同一性的核苷酸序列, iv)能夠與SEQ ID NO2或3所述的序列、或其互補序列(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下,例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5MNaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; v)能夠與包含SEQ ID NO2或3所述序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸(如50或100個、優(yōu)選地150或200個、更優(yōu)選地250或400個連續(xù)核苷酸、最優(yōu)選地全部序列)的核酸(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下;例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列。
在另一個優(yōu)選的實施方案中,衍生自根癌農(nóng)桿菌章魚堿合酶基因的上游激活序列由選自如下的序列描述 i)SEQ ID NO1描述的序列, ii)SEQ ID NO1所述序列中至少50個連續(xù)堿基、優(yōu)選地至少100個連續(xù)堿基,更優(yōu)選地200個連續(xù)堿基的片段, iii)與SEQ ID NO1所述的序列具有至少60%、優(yōu)選至少70%或80%、更優(yōu)選至少85%或90%、最優(yōu)選至少95%或98%的序列同一性的核苷酸序列, iv)能夠與SEQ ID NO1所述的序列、或其互補序列(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下;例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; v)能夠與包含SEQ ID NO1所述序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸(如50或100個、優(yōu)選地150或200個、更優(yōu)選地250或400個連續(xù)核苷酸、最優(yōu)選地全部序列)的核酸(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下;例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更優(yōu)選地是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列。
因此,在更優(yōu)選的實施方案中,嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列由選自如下的序列描述 i)SEQ ID NO4描述的序列, ii)SEQ ID NO4所述序列中至少50個連續(xù)堿基、優(yōu)選地至少100個連續(xù)堿基,更優(yōu)選地200個連續(xù)堿基的片段, iii)與SEQ ID NO4所述的序列具有至少60%、優(yōu)選至少70%或80%、更優(yōu)選至少85%或90%、最優(yōu)選至少95%或98%的序列同一性的核苷酸序列 iv)能夠與SEQ ID NO4所述的序列、或其互補序列(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下;例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; v)能夠與包含SEQ ID NO4所述的序列、或其互補序列中50個至200個或更多個連續(xù)核苷酸(如50或100個、優(yōu)選地150或200個、更優(yōu)選地250或400個連續(xù)核苷酸、最優(yōu)選地全部序列)的核酸(在如定義部分中所定義的優(yōu)選地在低嚴格條件下,更優(yōu)選地在中等嚴格條件下,最優(yōu)選地在高嚴格條件下;例如在這樣的條件下,其中所述的條件等同于在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交及在50℃于2×SSC、0.1%SDS中洗滌,更希望是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃在1×SSC、0.1%SDS中洗滌,還更希望是在50℃在7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.5×SSC、0.1%SDS中洗滌,優(yōu)選地在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在50℃于0.1×SSC、0.1%SDS中洗滌,更優(yōu)選地是在50℃于7%十二烷基硫酸鈉(SDS)、0.5M NaPO4、1mM EDTA中雜交并在65℃于0.1×SSC、0.1%SDS中洗滌)雜交的核苷酸序列; vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互補序列或反向互補序列。
任一以上定義的所述嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列的在ii)、iii)、iv)、v)和vi)下所述的序列優(yōu)選地能夠調(diào)節(jié)在單子葉植物細胞或單子葉植物生物中的轉(zhuǎn)錄,它們更優(yōu)選地能夠誘導(dǎo)淀粉胚乳特異性表達和/或胚特異性表達。優(yōu)選地,在iv)或v)下所述的序列在嚴格條件下與所述的靶序列雜交。
優(yōu)選地,核苷酸序列同一性通過使用具有默認執(zhí)行參數(shù)(字長度(W)11、期望(E)10、截止值100、M=5、N=-4并比較兩條鏈)的BlastN程序(版本1.4.7或更新版本)或任何等效程序來確定。
在雜交技術(shù)中,使用已知核苷酸序列的全部或部分作為與其它相應(yīng)核苷酸序列選擇性雜交的探針,其中所述的其它相應(yīng)核苷酸序列在來自所選生物的已克隆的基因組DNA片段或cDNA片段(即基因組文庫或cDNA文庫)群體中存在。雜交探針可以是基因組DNA片段、cDNA片段、RNA片段或其它的寡核苷酸,并且可以用可檢測基團如32P或任何其它可檢測標記物加以標記。因此,例如,用于雜交的探針可以通過標記基于本發(fā)明序列的合成性寡核苷酸來制造。用于制備雜交探針的方法和用于構(gòu)建cDNA文庫和基因組文庫的方法通常在本領(lǐng)域中已知并且公布在Sambrook等(1989)中。通常,與本文中所公開序列雜交的序列將與已公開的序列具有至少約60%至70%并且甚至約80%、85%、90%、95%至98%或更多的同一性。即,序列的序列相似性可以變化,共有至少約60%至70%并且甚至約80%、85%、90%、95%至98%的序列相似性。
1.2本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的可誘導(dǎo)型變體 在一個優(yōu)選的實施方案中,本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)以如此方式加以修飾,以至于該序列因應(yīng)用外在的化合物或其它刺激物而變成可誘導(dǎo)的。
當(dāng)用于啟動子時,術(shù)語“可誘導(dǎo)的”為本領(lǐng)域技術(shù)人員所充分理解。大體上,處于誘導(dǎo)型啟動子控制下的表達在應(yīng)答所施加的刺激(所述刺激可以在細胞內(nèi)產(chǎn)生或外在地提供)時“開啟”或增加。刺激的本質(zhì)在啟動子之間相異。無論表達水平在刺激不存在下是多少,來自任一誘導(dǎo)型啟動子的表達在合適刺激存在下增加。優(yōu)選的情況是在其中表達水平因有效改變表型特征的量的相關(guān)刺激存在而增加。因此可以使用這樣的誘導(dǎo)型(或“可開啟的”)啟動子,該啟動子在刺激不存在下產(chǎn)生過于低下而不能帶來所需表型的基礎(chǔ)表達水平(并且實際上可能是零水平)。在施加刺激時,增加(或開啟)表達至導(dǎo)致表達的水平。誘導(dǎo)型啟動子的眾多實例對本領(lǐng)域技術(shù)人員將是已知的,這些誘導(dǎo)型啟動子可以與本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)組合。
誘導(dǎo)物可以是物理刺激,如光、熱、干旱(低濕度)、創(chuàng)傷等。然而,誘導(dǎo)物優(yōu)選地是外部施加的化學(xué)物質(zhì)。優(yōu)選當(dāng)外在地施加這種化學(xué)誘導(dǎo)物時,可誘導(dǎo)的切除啟動子僅導(dǎo)致有效連接的內(nèi)切核酸酶基因的功能性表達,這導(dǎo)致受控的、可掌握的表達和缺失。
已經(jīng)開發(fā)用于植物中的誘導(dǎo)型啟動子和阻遏型啟動子(綜述Gatz,Annu Rev Plant Physiol Plant Mol Biol 1997,4889-108),所述啟動子基于例如細菌阻遏物(Gatz C和Quail PH(1988)Proc.Natl Acad.Sci.USA851394-1397)、動物類固醇(Aoyarna T和Chua NH(1997)Plant J.11605-612;Martinez A等(1999)Plant J.1997-106)或真菌調(diào)節(jié)性元件(Caddick MX等(1998)Nature Biotechnol 16177-180)。受化學(xué)配體正調(diào)控的啟動子系統(tǒng)(誘導(dǎo)型系統(tǒng))包括四環(huán)素(脫氧土霉素)誘導(dǎo)型′Triple-Op′啟動子(Gatz C和Quail PH(1988)Proc Natl Acad Sci USA 851394-1397;Gatz C等(1991)Mol Gen Genet 277229-237;Gatz C等(1992)Plant J.2397-404)、糖皮質(zhì)激素誘導(dǎo)型′GAL4-UAS′啟動子(Aoyarna T和Chua NH(1997)Plant J.11605-612)、蛻皮激素誘導(dǎo)型′GRHEcR′啟動子(Martinez A等(1999)Plant J.1997-106)和乙醇誘導(dǎo)型alcA啟動子(Caddick MX等(1998)Nature Biotechnol 16177-180)。已經(jīng)用來調(diào)節(jié)基因表達的激素例如包括雌激素、三苯氧胺、托瑞米芬和蛻皮激素(Ramkumar和Adler(1995)Endocrinology 136536-542)。還見,Gossen和Bujard(1992)Proc.Natl.Acad.Sci.USA 895547;Gossen等(1995)Science 2681766。在四環(huán)素誘導(dǎo)型系統(tǒng)中,四環(huán)素或脫氧土霉素調(diào)節(jié)阻遏物與啟動子的結(jié)合,因而調(diào)節(jié)來自該啟動子的表達。
誘導(dǎo)型表達系統(tǒng)可以劃分為正調(diào)節(jié)系統(tǒng)和負調(diào)節(jié)系統(tǒng)。對于正調(diào)節(jié)系統(tǒng),通過添加相應(yīng)的誘導(dǎo)物誘導(dǎo)表達,對于負調(diào)節(jié)系統(tǒng),通過移去誘導(dǎo)物(此時稱作阻遏物更合適)誘導(dǎo)表達。負調(diào)節(jié)(可阻遏的)系統(tǒng)的實例是四環(huán)素失活的′Top10′啟動子和衍生物(Bohner S等(1999)Plant J.1987-95;Weinmann P等(1994)Plant J 5559-569)。Top10啟動子序列含有緊密地結(jié)合四環(huán)素阻遏物多肽TetR的Tn10tet操縱基因(tet-OP)DNA序列的7個拷貝串聯(lián)重復(fù)(Lederer T等(1995)Anal Biochem 232190-196)。該元件與例如CaMV 35S啟動子的截短形式(核苷酸位置-53至0)融合。Top10啟動子序列由有效充當(dāng)人造轉(zhuǎn)錄因子的反式激活蛋白識別。該反式激活蛋白是TetR的氨基酸1-207(Postle K等(1984)Nucl Acids Res 124849-4963)與來自單純皰疹病毒的轉(zhuǎn)錄激活結(jié)構(gòu)域(VP16)的氨基酸363-490(Triezenberg SJ等(1988)Gene Dev.2718-729)間的嵌合融合蛋白,并標記為′TetR/VP16′或tTA(四環(huán)素反式激活蛋白)。在四環(huán)素不存在時,tTA的TetR部分以高親和力結(jié)合Top10啟動子中的tet-OP DNA序列(Hinrichs W等(1994)Science264418-420;Lederer T等(1995)Anal Biochem 232190-196;Lederer T等(1996)Biochemistry 357439-7446)。這種相互作用使tTA的VP16結(jié)構(gòu)域在位置上接近于Top10啟動子TATA盒,促使轉(zhuǎn)基因轉(zhuǎn)錄。然而,在四環(huán)素存在時,TetR發(fā)生降低其對Top10啟動子的親和力至非特異性結(jié)合水平(Lederer T等(1996)Biochemistry 357439-7446)的構(gòu)象改變(Hinrichs W等(1994)Science 264418-420;Orth P等(1998)J Mol Biol 279439-447)。因此,抑制tTA與Top10啟動子的結(jié)合,并關(guān)閉轉(zhuǎn)錄。在植物中使用Top10啟動子系統(tǒng)尤其有利。首先,Top10啟動子在tTA不存在下無功能。第二,轉(zhuǎn)錄性控制是嚴格的并受四環(huán)素的嚴密控制。第三,四環(huán)素在植物細胞中沒有天然存在的類似物,否則這種類似物將干擾啟動子的調(diào)節(jié)作用。第四,用來阻遏Top10啟動子的四環(huán)素水平極低,通常是1μg/ml數(shù)量級,并且對植物沒有明顯的次級效應(yīng)(Weinmann P等(1994)Plant J 5559-569)。最后,可以如此實現(xiàn)對啟動子功能所需要的兩種轉(zhuǎn)化的偶聯(lián),即同一植物通過首先用35S∷tTA質(zhì)粒構(gòu)建體轉(zhuǎn)化并隨后用驅(qū)動目的基因的Top10啟動子轉(zhuǎn)化,或者通過使已用適宜構(gòu)建體獨立地進行轉(zhuǎn)化的轉(zhuǎn)基因植物交配。Top10啟動子已經(jīng)成功地用于煙屬(Nicotiana sp.)(Weinmann P等(1994)Plant J5559-569)以及小立碗蘚(Physcomitrella patens)(Zeidler M等(1996)PlantMol Biol 30199-205)。或者,可以采用正調(diào)節(jié)的基于四環(huán)素的誘導(dǎo)型表達系統(tǒng)。尤其優(yōu)選誘導(dǎo)型可逆四環(huán)素系統(tǒng),該系統(tǒng)允許僅在添加四環(huán)素或四環(huán)素的脂可溶性衍生物即強力霉素(dox,Gossen M.等(1995)Science2681766-1769;Jiang DM等(2001)J.Neurochem.76(6);1745-1755)時上調(diào)表達。
還可以采用直接應(yīng)答于生理活性刺激如熱休克(Prandl R等(1995)Plant Mol.Biol.2873-82;1995;Severin K和Schoeffl F(1990)Plant Mol.Biol.15827-834)、脅迫信號作用分子(Suehara KI等(1996)J.Ferm.Bioeng.82,51-55)或重金屬(McKenzie,MJ等(1998)Plant Physiol.116,969-977)的誘導(dǎo)型啟動子。不過,優(yōu)選化學(xué)誘導(dǎo)型啟動子系統(tǒng)。
誘導(dǎo)型表達系統(tǒng)已經(jīng)在數(shù)個植物物種中使用,包括煙草(Gatz C等(1991)Mol.Gen.Genet.277229-237)、馬鈴薯(potato)(Kumar A等(1996)Plant J.9147-158)、番茄(Thompson AJ和Myatt SC(1997)Plant Mol.Biol.34687-692)和擬南芥菜(Aoyarna T和Chua NH(1997)Plant J.11605-612)。
其它實例包括蛻皮激素應(yīng)答元件(No等,(1997)Proc.Natl.Acad.Sci.USA 933346)。誘導(dǎo)型啟動子的其它實例包括在用化學(xué)安全劑如N,N-二烯丙基-2,2-二氯乙酰胺(PCT申請?zhí)朩O 90/08826和WO 93/01294)處理時被特異性誘導(dǎo)的谷胱苷肽-S-轉(zhuǎn)移酶II啟動子以及來自曲霉屬(Aspergillus)的在alcR基因產(chǎn)物存在下用環(huán)己酮(Lockington等,(1985)Gene33137-149;Felenbok等(1988)Gene 73385-396;Gwynne等(1987)Gene51205-216)以及乙醇誘導(dǎo)的alcA啟動子。啟動子的化學(xué)誘導(dǎo)物可以與其它活性化學(xué)品或惰性載體在施用至生物之前進行組合。例如,農(nóng)學(xué)有用的其它化學(xué)組合物如殺蟲劑或肥料以及載體和溶劑可以與誘導(dǎo)物進行組合。
同樣可以使用誘導(dǎo)型啟動子的其它實例,包括PRP1啟動子(Ward等,(1993)Plant.Mol.Biol.22361-366)、水楊酸誘導(dǎo)型啟動子(WO 95/19443)、苯磺酰胺誘導(dǎo)型啟動子(EP-A-0388186)、四環(huán)素誘導(dǎo)型啟動子(Gatz等,(1992)Plant J.2397-404)、脫落酸誘導(dǎo)型啟動子(EP-A 335528)、水楊酸誘導(dǎo)型啟動子(WO 95/19443)或乙醇誘導(dǎo)型(Salter MG等(1998)Plant J.16127-132)或環(huán)己酮誘導(dǎo)型(WO 93/21334)啟動子。
其它優(yōu)選的啟動子是受生物性或非生物脅迫誘導(dǎo)的啟動子,例如,PRP1基因的病原體誘導(dǎo)型啟動子(Ward等,Plant Mol Biol 1993,22361-366)、番茄熱誘導(dǎo)型hsp80啟動子(US 5,187,267)、馬鈴薯寒冷誘導(dǎo)型α-淀粉酶啟動子(WO 96/12814)或創(chuàng)傷誘導(dǎo)的pinII啟動子(EP375091)。
1.3用于本發(fā)明的表達盒和載體的額外調(diào)節(jié)性元件和功能性元件 本發(fā)明的表達盒可以包含其它調(diào)節(jié)性元件。該術(shù)語在此上下文中應(yīng)當(dāng)廣義地理解為意指包含可以影響表達盒的構(gòu)建或功能的所有序列。調(diào)節(jié)性元件可以例如調(diào)節(jié)原核生物生物或真核生物生物中的轉(zhuǎn)錄和/或翻譯。在優(yōu)選的實施方案中,本發(fā)明的表達盒包含位于待表達的核酸序列下游(在3’-方向上)的轉(zhuǎn)錄終止序列和任選額外的調(diào)節(jié)性元件,其中所述的轉(zhuǎn)錄終止序列和調(diào)節(jié)性元件分別與待表達的核酸序列(或轉(zhuǎn)錄調(diào)節(jié)核苷酸序列)有效連接。
其它的調(diào)節(jié)性元件可以包含可調(diào)節(jié)表達調(diào)節(jié)特性的其它啟動子、最小啟動子或啟動子元件。尤其優(yōu)選的是以上更為詳細描述的可誘導(dǎo)性。例如可以使表達依賴于某些脅迫因子,如水脅迫、脫落素(Lam 1991)或熱脅迫(Schoffl 1989)。此外,可以采用可實現(xiàn)在其它生物(如大腸桿菌(E.coli)或農(nóng)桿菌)中表達的其它啟動子或啟動子元件。此類調(diào)節(jié)性元件可以在細菌啟動子如amy和SPO2的啟動子序列或在酵母啟動子或真菌啟動子(如ADC1、MFa、AC、P-60、CYC1、GAPDH、TEF、rp28和ADH)的啟動子序列中找到。
此外,考慮了可以使用與來自多于一種啟動子中的元件結(jié)合的啟動子。例如,US 5,491,288公開了花椰菜花葉病毒啟動子與組蛋白啟動子組合,因此,來自本文中所公開啟動子的元件可以與來自其它啟動子的元件組合。用于植物轉(zhuǎn)基因表達的啟動子包括誘導(dǎo)型啟動子、病毒啟動子、合成性啟動子、組成型啟動子(Odell 1985)、時間調(diào)節(jié)的啟動子、空間調(diào)節(jié)的啟動子、組織特異性啟動子和空間-時間調(diào)節(jié)的啟動子。
多種5’和3’轉(zhuǎn)錄調(diào)節(jié)序列可用于本發(fā)明。轉(zhuǎn)錄終止子負責(zé)終止轉(zhuǎn)錄和正確的mRNA多聚腺苷酸作用。3’非翻譯的調(diào)節(jié)性DNA序列優(yōu)選地包括約50至約1,000個、更優(yōu)選約100至約1,000個核苷酸堿基對并含有植物轉(zhuǎn)錄終止序列和翻譯終止序列。適宜的轉(zhuǎn)錄終止子和已知在植物中有功能的那些轉(zhuǎn)錄終止子包括CaMV 35S終止子、tml終止子、胭脂堿合酶終止子、豌豆(pea)rbcS E9終止子、用于T7轉(zhuǎn)錄物的來自根癌農(nóng)桿菌章魚堿合酶基因的終止子和來自馬鈴薯或番茄的蛋白酶抑制物I或II基因的3’端,不過,還可以采用本領(lǐng)域技術(shù)人員已知的其它3’元件?;蛘?,還可以使用γ薏苡醇溶蛋白終止子、油質(zhì)蛋白3終止子或來自薏苡屬(Coix)的其它終止子。
優(yōu)選的3’元件包括根癌農(nóng)桿菌胭脂堿合酶基因(Bevan 1983)的那些3’元件、用于T7轉(zhuǎn)錄物的來自根癌農(nóng)桿菌章魚堿合酶基因的終止子和來自馬鈴薯或番茄的蛋白酶抑制物I或II基因的3’端。
由于轉(zhuǎn)錄起點與編碼序列起點之間的DNA序列,即非翻譯的前導(dǎo)序列,可以影響基因表達,還可以希望采用特定的前導(dǎo)序列。預(yù)計優(yōu)選的前導(dǎo)序列包括這樣的前導(dǎo)序列,其包括預(yù)測將指導(dǎo)所連接基因最佳表達的序列,即包括可以增加或維持mRNA穩(wěn)定性并防止不恰當(dāng)?shù)姆g啟動的優(yōu)選的共有前導(dǎo)序列。本領(lǐng)域技術(shù)人員因本公開而知道選擇此類序列。最優(yōu)選衍生自植物中高表達基因的序列。
優(yōu)選的調(diào)節(jié)性元件還包括基因的5’非翻譯區(qū)、內(nèi)含子和3’非翻譯區(qū)。
已經(jīng)發(fā)現(xiàn)在轉(zhuǎn)基因植物中增強基因表達的此類序列包括內(nèi)含子序列(詳見下文)和病毒前導(dǎo)序列(例如來自TMV、MCMV和AMV;Gallie 1987)。例如,已知衍生自病毒的許多非翻譯的前導(dǎo)序列增強表達。具體而言,已經(jīng)證實來自煙草花葉病毒(TMV)、玉米褪綠斑駁病毒(MCMV)和苜?;ㄈ~病毒(AMV)的前導(dǎo)序列有效地增強表達(例如Gallie 1987;Skuzeski1990)。本領(lǐng)域中已知的其它前導(dǎo)序列包括但不限于微小RNA病毒前導(dǎo)序列,例如EMCV前導(dǎo)序列(腦心肌炎病毒5’非編碼區(qū))(Elroy-Stein1989);馬鈴薯Y病毒前導(dǎo)序列,例如TEV前導(dǎo)序列(煙草蝕紋病毒);MDMV前導(dǎo)序列(玉米矮花葉病毒);人免疫球蛋白重鏈結(jié)合蛋白(BiP)前導(dǎo)序列(Macejak 1991);來自苜?;ㄈ~病毒衣殼蛋白mRNA(AMV RNA 4)的非翻譯前導(dǎo)序列(Jobling 1987);煙草花葉病毒前導(dǎo)序列(TMV),(Gallie1989)和玉米褪綠斑駁病毒前導(dǎo)序列(MCMV)(Lommel 1991)。還見Della-Cioppa 1987。根據(jù)需要還可以包括調(diào)節(jié)性元件如TMVΩ元件(Gallie1989)。增強子的額外實例包括來自CaMV 35S啟動子、章魚堿合酶基因(Ellis等,1987)、稻肌動蛋白I基因、玉米醇脫氫酶基因(Callis 1987)、玉米皺縮I基因(Vasil 1989)的元件、TMVΩ元件(Gallie 1989)和來自非植物的真核生物(例如酵母;Ma 1988)的啟動子??梢詷?gòu)建根據(jù)本發(fā)明使用的載體以包括ocs增強子元件。ocs增強子元件首先被鑒定為來自ultilane的章魚堿合酶(ocs)基因中的16bp回文增強子(Ellis 1987)并且在至少10種其它啟動子中存在(Bouchez 1989)。當(dāng)在植物轉(zhuǎn)化中應(yīng)用時,增強子元件如ocs元件并且特別該元件多重拷貝的使用將起到增加來自臨近啟動子的轉(zhuǎn)錄水平的作用。
表達盒還可以含有增強翻譯和/或mRNA穩(wěn)定性的序列如內(nèi)含子(例如來自Adh1、bronze1、肌動蛋白1、肌動蛋白2(WO 00/760067)或蔗糖合酶內(nèi)含子;見The Maize Handbook,第116章,編者Freeling和Walbot,Springer,New York(1994))。在一個實施方案中,增強子內(nèi)含子是稻肌動蛋白1內(nèi)含子1(US 5,641,876,在本文中完整引用作為參考)、稻肌動蛋白2內(nèi)含子1(US 6,429,357,在本文中完整引用作為參考)、Adh內(nèi)含子1(Callis 1987)或蔗糖合酶內(nèi)含子(Vasil 1989)。
然而,內(nèi)含子序列對于實現(xiàn)本文中所述的表達模式并非必需。記住內(nèi)含子的總體表達調(diào)節(jié)特性,這是令人驚訝的觀察結(jié)果。在另一個優(yōu)選的實施方案中,本發(fā)明的表達盒不包含具有表達增強特性的與所述嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列(例如超級啟動子)有效連接的內(nèi)含子。
額外的優(yōu)選調(diào)節(jié)性元件是增強子序列或多聚腺苷酸作用序列。優(yōu)選的多聚腺苷酸作用序列是來自植物基因或農(nóng)桿菌T-DNA基因(例如OCS(章魚堿合酶)基因或NOS(胭脂堿合酶)基因的終止子序列)的那些序列。
本發(fā)明的表達盒(或衍生自其的載體)可以包含額外的功能性元件,其中應(yīng)當(dāng)將所述的功能性元件廣義地理解為影響表達盒或載體或包含表達盒或載體的轉(zhuǎn)基因生物的構(gòu)建、增殖或功能的所有元件。此類功能性元件可以包括復(fù)制起點(以允許在細菌中的復(fù)制;pBR322的ORI或P15A ori;Sambrook 1989),或農(nóng)桿菌T-DNA轉(zhuǎn)移所需要的元件(例如T-DNA左邊界和/或右邊界)。
此外,表達盒可以構(gòu)建并用于轉(zhuǎn)基因植物細胞中的特定基因產(chǎn)物的細胞內(nèi)靶向或指導(dǎo)蛋白質(zhì)移至細胞外環(huán)境。這通常通過將編碼轉(zhuǎn)運肽或信號肽序列的DNA序列與特定基因的編碼序列連接而實現(xiàn)。得到的轉(zhuǎn)運肽或信號肽將使蛋白質(zhì)分別轉(zhuǎn)運至特定的細胞內(nèi)或細胞外目的地并隨后以翻譯后方式被切除。轉(zhuǎn)運肽或信號肽通過促進蛋白質(zhì)穿過細胞內(nèi)膜(液泡、囊泡、質(zhì)體和線粒體膜)的轉(zhuǎn)運而起作用,而信號肽指導(dǎo)蛋白質(zhì)穿過細胞外膜。通過促進蛋白質(zhì)轉(zhuǎn)運至內(nèi)部區(qū)室和細胞外部,這些序列可以增加基因產(chǎn)物累積,保護基因產(chǎn)物免遭蛋白分解性降解。這些序列還允許來自高表達基因的其它mRNA序列與基因的編碼序列連接。由于經(jīng)核糖體翻譯的mRNA比裸mRNA更穩(wěn)定,基因前面存在可翻譯的mRNA可以增加來自該基因的mRNA轉(zhuǎn)錄物的整體穩(wěn)定性并且因而增加基因產(chǎn)物合成。因為通常從初始翻譯產(chǎn)物中以翻譯后方式去除轉(zhuǎn)運序列和信號序列,故使用這些序列允許添加可以不存在于最終多肽中的被額外翻譯的序列。為增強蛋白質(zhì)的穩(wěn)定性,可能需要某些蛋白質(zhì)的靶向性分布(US 5,545,818)。
1.4本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列、表達盒和載體的裝配 就本發(fā)明的任一嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列、表達盒或載體而言,有效連接可以通過多種本領(lǐng)域中已知方法(包括體外方法和體內(nèi)方法)實現(xiàn)。因此,本發(fā)明的任一嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列、表達盒或載體可以通過使用本領(lǐng)域中眾所周知的標準重組技術(shù)和克隆技術(shù)實現(xiàn)(見例如Maniatis 1989;Silhavy 1984;Ausubel 1987)。眾多方式或方法已經(jīng)得到開發(fā)并用于基因克隆。這些方法的實例是通過限制酶消化并連接匹配末端的克隆法、直接從PCR產(chǎn)物的T-A克隆法、TOPO-連接的單向克隆法和基于重組的克隆法。基于重組的克隆法是可得到的最通用克隆方法之一,原因是其克隆效率高及廣泛應(yīng)用于克隆多種基因,而無論是否存在可用限制酶位點。重組克隆法使用λ重組系統(tǒng)來將基因克隆至含有用于λ重組酶裝置的重組序列的載體內(nèi)。重組克隆法使用位點特異性重組酶,這種重組酶(在某些情況下連同相關(guān)的蛋白質(zhì))識別核酸分子中的特定堿基序列并交換在這些序列側(cè)翼的核酸節(jié)段。重組酶和相關(guān)蛋白統(tǒng)稱為“重組蛋白”。位點特異性重組酶是存在于眾多生物(例如病毒和細菌)內(nèi)并已經(jīng)表征為同時具有內(nèi)切核酸酶特性和連接酶特性的蛋白質(zhì)。多種已知的位點特異性重組酶屬于重組酶的整合酶家族,包括來自噬菌體λ的整合酶/att系統(tǒng)。來自噬菌體λ的整合酶/att系統(tǒng)的一個應(yīng)用實例是如公布于US 5,888,732和US 6,277,608和美國公開的專利申請2002/0007051A1和國際申請WO 02/081711A1中的LR克隆反應(yīng),其中所述文獻在本文中引用作為參考。LR克隆反應(yīng)可作為GATEWAYTM克隆技術(shù)(可從Invitrogen Corporation,Carlsbad,California獲得)自商業(yè)途徑獲得。LR克隆反應(yīng)由包含λ重組蛋白Int、Xis和大腸桿菌編碼的蛋白質(zhì)IHF的LR克隆酶酶混合物催化。
表達盒還可以通過將本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)插入植物基因組中得以裝配。這種插入將產(chǎn)生與已經(jīng)存在于基因組中的目的核酸序列的有效連接。通過插入,目的核酸因嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的轉(zhuǎn)錄調(diào)節(jié)特性而以淀粉胚乳特異性和萌芽胚特異性方式得到表達。插入可以是定向的或隨機的。優(yōu)選地,插入是定向的并且通過例如同源重組實現(xiàn)。通過這種方法,天然啟動子可以替換為本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列,因而調(diào)節(jié)了內(nèi)源基因的表達模式。轉(zhuǎn)錄調(diào)節(jié)核苷酸序列還可以用如此方式插入以至表達內(nèi)源基因的反義mRNA,從而誘導(dǎo)基因沉默。
例如,有效連接可以包含以如此方式依次地排列具有待表達核酸序列的本發(fā)明嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)和任選額外的調(diào)節(jié)性元件,例如多聚腺苷酸作用元件或轉(zhuǎn)錄終止元件、增強子、內(nèi)含子等,以至于轉(zhuǎn)錄調(diào)節(jié)核苷酸序列可以實現(xiàn)在適宜條件下在表達目的核酸序列的過程中的功能。術(shù)語“適宜條件”優(yōu)選地意指植物細胞中存在表達盒。優(yōu)選這樣的排列,在其中待表達的目的核酸序列以如此方式放置在本發(fā)明嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的下游(即在3’-方向上),以至共價地連接這兩種序列。任選地,額外的序列可以插入這兩種序列之間。此類序列可以例如是接頭或多克隆位點。此外,可以插入編碼融合蛋白的部分的序列(此時將表達由目的核酸所編碼蛋白質(zhì)的融合蛋白)。優(yōu)選地,待表達的目的核酸序列與本發(fā)明的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列之間的距離不大于200堿基對,優(yōu)選地不大于100堿基對,更優(yōu)選地不大于50堿基對。
實際上,任一DNA組合物可以用于遞送到受體單子葉植物或單子葉植物細胞內(nèi),以便最終產(chǎn)生本發(fā)明能育的轉(zhuǎn)基因植物。例如,可以采用載體或質(zhì)粒形式的DNA節(jié)段或片段或直鏈DNA節(jié)段或片段等,在某些例子中,它們含有僅在植物中表達的DNA元件。本領(lǐng)域技術(shù)人員因本公開而知道構(gòu)建可與本發(fā)明組合使用的載體(見例如Sambrook 1989;Gelvin1990)。
本發(fā)明還提供了含有本發(fā)明表達盒的適用于植物轉(zhuǎn)化的重組載體或其它DNA構(gòu)建體(包括但不限于粘粒、YAC(酵母人工染色體)、BAC(細菌人工染色體)和植物人工染色體)以及包含表達盒或載體(例如包含質(zhì)粒)的單子葉植物宿主細胞。表達盒或載體可以(優(yōu)選地)增大已轉(zhuǎn)化單子葉植物的基因組或可以在染色體外得以維持。本發(fā)明的表達盒或載體可以存在于植物細胞的細胞核、葉綠體、線粒體和/或質(zhì)體中。優(yōu)選地本發(fā)明的表達盒或載體包含在植物細胞核的染色體DNA中。在某些實施方案中,考慮了人們可能希望在單子葉植物轉(zhuǎn)化中利用勝任復(fù)制(replication-competent)的病毒載體。此類載體包括例如,小麥矮化病毒(WDV)“穿梭”載體,如pW1-11和PW1-GUS(Ugaki 1991)。這些載體能夠在玉米細胞和大腸桿菌中自主復(fù)制,并且可以為檢測遞送至轉(zhuǎn)基因細胞內(nèi)的DNA提供增加的靈敏度。復(fù)制型載體還可以用于遞送在側(cè)翼具有來自轉(zhuǎn)座元件(如Ac、Ds或Mu)的DNA序列的基因。
本發(fā)明的DNA構(gòu)建體及衍生自其的任一載體可以包含其它功能性元件。術(shù)語“其它功能性元件”應(yīng)當(dāng)作廣義的理解。該術(shù)語優(yōu)選地指所有這樣的元件,其影響所述DNA構(gòu)建體或包含所述DNA構(gòu)建體的載體或包含所述DNA構(gòu)建體和載體的細胞或生物的產(chǎn)生、繁殖、功能、用途或價值。這些其它功能性元件可以包括,但是決不應(yīng)當(dāng)限于 i)確保本發(fā)明表達盒或載體在例如大腸桿菌中復(fù)制的復(fù)制起點??梢蕴岬降膶嵗荗RI(DNA復(fù)制起點、pBR322ori或P15A ori(Sambrook等Molecular Cloning.A Laboratory Manual,第二版.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989), ii)能夠并且促進插入一個或多個核酸序列的多克隆位點(MCS), iii)使同源重組或向宿主生物基因組中插入成為可能的序列, iv)用于向植物基因組中轉(zhuǎn)移和整合的元件(例如使植物細胞中的農(nóng)桿菌介導(dǎo)性轉(zhuǎn)移成為可能的邊界序列),例如T-DNA的右邊界或左邊界或vir區(qū)。
用于本文轉(zhuǎn)化的導(dǎo)入的重組DNA分子可以是環(huán)狀或直鏈的、雙鏈或單鏈的。通常,DNA為嵌合DNA(如質(zhì)粒DNA)形式,其中所述的嵌合DNA也可以含有側(cè)翼存在調(diào)節(jié)序列的編碼區(qū),所述的調(diào)節(jié)序列促進存在于所得植物中的重組DNA表達。通常,導(dǎo)入的重組DNA分子相對較小,即小于約30kb以使對任何物理的、化學(xué)的或酶的降解的易感性最小化,其中所述降解的易感性隨核苷酸分子大小增加而升高。如上指出,優(yōu)選地預(yù)先選擇并限定導(dǎo)入植物基因組中的蛋白質(zhì)、RNA轉(zhuǎn)錄物或其混合物的數(shù)量,例如,可以形成所導(dǎo)入DNA的1個至約5-10個此類產(chǎn)物。
本發(fā)明還提供單子葉植物(優(yōu)選轉(zhuǎn)基因植物)、來自這種植物的種子和部分和來自這種植物的子代植物,包括雜交種和近交種。
本發(fā)明還提供植物育種方法,例如旨在制備雜交的能育轉(zhuǎn)基因植物。該方法包括使包含本發(fā)明特定表達盒的能育轉(zhuǎn)基因植物與自身雜交或與第二種植物(例如缺少這種特定表達盒的植物)雜交,以制備包含特定表達盒的雜交的能育轉(zhuǎn)基因植物的種子。隨后種植該種子以獲得雜交的能育轉(zhuǎn)基因植物。植物優(yōu)選地可以是單子葉植物(優(yōu)選地如以上定義)。雜交的能育轉(zhuǎn)基因植物可以具有經(jīng)雌性親代或經(jīng)雄性親代遺傳的特定表達盒。第二種植物可以是近交植物。雜交的能育轉(zhuǎn)基因植物可以是雜交種。本發(fā)明還包括任一這些雜交的能育轉(zhuǎn)基因植物的種子。
2.通過本發(fā)明的表達盒所表達的有利性狀或特性 本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列(例如超級啟動子)用來調(diào)節(jié)植物的表型。需要并且可使用本文中公開的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列的有利表達模式(即淀粉胚乳和萌芽胚-特異性表達)實現(xiàn)轉(zhuǎn)基因植物表型的多種改變。這些結(jié)果可以通過在植物中表達異源產(chǎn)物或增加內(nèi)源性產(chǎn)物的表達而實現(xiàn)。或者,這些結(jié)果可以通過在植物中減少一種或多種內(nèi)源性產(chǎn)物(尤其酶或輔因子)的表達而實現(xiàn)。通常,可以使用嵌合的轉(zhuǎn)錄調(diào)節(jié)核苷酸序列來表達植物中與所述啟動子有效連接的核酸節(jié)段(例如可讀框)或其部分、反義序列、編碼有義RNA序列或雙鏈RNA序列的序列或轉(zhuǎn)基因。這些改變導(dǎo)致轉(zhuǎn)化植物的表型改變。
對用于在本發(fā)明的單子葉植物宿主細胞中表達的異源DNA的選擇取決于轉(zhuǎn)化目的。轉(zhuǎn)化作物植物的主要目的之一是增加植物在商業(yè)上需要、農(nóng)學(xué)重要的性狀或終產(chǎn)物性狀。
雖然眾多核酸序列適合由本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)表達,最優(yōu)選地,核酸在表達時賦予單子葉植物選自如下的性狀或特性 i)抗至少一個脅迫因子的增強的抗性, ii)提高的種子營養(yǎng)質(zhì)量或籽苗營養(yǎng)質(zhì)量, iii)提高的產(chǎn)量,和 iv)選擇標記切除。
2.1基本原理 已知用于控制表達的兩種基本方法過量表達和過低表達。過量表達可以通過插入所選擇基因的一個或多于一個的額外拷貝實現(xiàn),然而,不清楚最初用核苷酸序列的一個或多于一個的額外拷貝轉(zhuǎn)化的植物或其子代是否影響過低表達和過量表達。對于過低表達,存在兩種基本方法,它們通常在本領(lǐng)域中稱作“反義下調(diào)”和“有義下調(diào)”(有義下調(diào)還稱作“共抑制”)。通常將這些方法稱作“基因沉默”。這兩種方法導(dǎo)致靶基因表達的抑制。
因此,受嵌合的轉(zhuǎn)錄調(diào)節(jié)性序列控制的核酸序列的表達可以導(dǎo)致蛋白質(zhì)表達,或反義RNA、有義RNA或雙鏈RNA表達。
備選地,外源DNA序列可以設(shè)計旨在下調(diào)特定的核酸序列。這一般通過將處于反義方向的外源DNA或DNA(其設(shè)計目的是在轉(zhuǎn)錄后產(chǎn)生形成發(fā)夾的RNA分子)與本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)有效連接而完成?;蛞种瓶梢杂行古c性狀相關(guān)的天然植物基因,例如旨在向植物提供天然基因編碼的蛋白質(zhì)的降低水平或受影響的代謝物增加或減少的水平。例如,本發(fā)明的嵌合的轉(zhuǎn)錄調(diào)節(jié)核酸序列(例如超級啟動子)可以有效地與設(shè)計的異源DNA連接以至于形成抑制玉米胚中天然基因的發(fā)夾形RNA。
如本文中所用的“基因抑制”意指眾所周知的任一方法,其中所述方法用于抑制RNA轉(zhuǎn)錄物或抑制翻譯自RNA轉(zhuǎn)錄物的蛋白質(zhì)產(chǎn)生,包括轉(zhuǎn)錄后基因抑制和轉(zhuǎn)錄性抑制。轉(zhuǎn)錄后基因抑制由雙鏈RNA介導(dǎo),其中所述的雙鏈RNA與作為抑制靶向的基因具有同源性。稱作反義抑制、共抑制和RNA干擾的基因抑制方法的共同特征是這樣的基因抑制,其中所述的基因抑制通過從包含至少部分轉(zhuǎn)錄單位的反向重復(fù)序列的外源DNA構(gòu)建體中轉(zhuǎn)錄的RNA引起。轉(zhuǎn)錄性抑制可以由已轉(zhuǎn)錄的與執(zhí)行所謂啟動子反式抑制的啟動子DNA序列具有同源性的雙鏈RNA介導(dǎo)。
更具體地,在US 5,107,065和US 5,759,829中公開了通過插入具有反義方向DNA的外源DNA構(gòu)建體來調(diào)節(jié)植物細胞中基因表達的轉(zhuǎn)錄后基因抑制,其中所述文獻在本文中完整引用作為參考。使用此類用于基因抑制的反義方向DNA構(gòu)建體所轉(zhuǎn)化的轉(zhuǎn)基因植物可以包含排列為反向重復(fù)序列的DNA,如Redenbaugh等在“Safety Assessment of GeneticallyEngineered Flavr Savr TM Tomato,CRC Press,Inc.(1992)中所公開。反向重復(fù)序列插入物可以包含T-DNA構(gòu)建體的部分或全部,例如轉(zhuǎn)錄終止子序列的反向重復(fù)序列。
在US 5,283,184和US 5,231,020中公開了通過插入具有有義方向DNA的外源DNA構(gòu)建體來調(diào)節(jié)植物細胞中基因表達的轉(zhuǎn)錄后基因抑制,其中所述每一篇文獻在本文中引用作為參考。
導(dǎo)致基因抑制的不同類型的外源DNA排列對本領(lǐng)域技術(shù)人員而言是已知的并且包括但不限于如下內(nèi)容。國際公開WO 94/01550公開了在其中用自我互補的3’節(jié)段進行穩(wěn)定的反義RNA的DNA構(gòu)建體。在轉(zhuǎn)錄的RNA中形成發(fā)夾的其它雙鏈元件在國際
發(fā)明者H-S·宋, C·E·羅奇, C·達曼 申請人:巴斯福植物科學(xué)有限公司