專利名稱:源自玉米的表達盒的制作方法
技術領域:
本發(fā)明包括用于在植物中表達重組基因產(chǎn)物的表達盒,該表達盒包含源自靶基因的調(diào)控序列,例如來自HSP70、Ubil58和Ubi361基因的調(diào)控序列。背景在農(nóng)業(yè)生物技術中,植物可以根據(jù)需要進行修飾。達到這一目的的一種方法是通過采用現(xiàn)代基因工程技術。例如,通過將目的基因引入到植物中,所述植物可以被特異地修飾為表達所希望的表型性狀。為此,最通常地用包含啟動子區(qū)、編碼區(qū)和終止區(qū)的異源基因來轉(zhuǎn)化植物。當對異源基因進行基因工程改造以便在植物中表達時,啟動子的選擇常常是至關重要的因素。啟動子由對于該啟動子的功能來說必需的幾個區(qū)域構成。這些區(qū)域中的一些是模塊化的組件,換句話說,它們可以分開地進行使用以賦予啟動子活動,或者它們可與其他元件裝配在一起從而構建出新的啟動子(Komarnytsky和Borisjuk,Genetic Engineering25 :113-141 (2003)) 0這些啟動子區(qū)域的第一個區(qū)域位于緊接編碼序列的上游并形成“核心啟動子區(qū)域”,其包含偶聯(lián)元件,通常緊接轉(zhuǎn)錄起始位點的上游的20-70個堿基對。核心啟動子區(qū)域常常包含TATA盒和起始子元件以及起始位點。核心啟動子區(qū)域的準確長度不是固定的,但通常是可有效識別的。在大多數(shù)啟動子中通常存在這樣這樣的區(qū)域,只是有一些變化。位于各種經(jīng)充分表征的元件之間的堿基序列似乎是較不重要的。核心啟動子區(qū)域常常被稱為最小啟動子區(qū)域,因為它本身是有功能的從而能夠促進基礎水平的轉(zhuǎn)錄。核心啟動子區(qū)域的存在將某一序列定義為啟動子如果該區(qū)域不存在,則該啟動子是無功能的。核心區(qū)域的作用是將通用轉(zhuǎn)錄機吸引至啟動子以進行轉(zhuǎn)錄起始。但是,核心啟動子區(qū)域不足以提供完整的啟動子活動。一系列的調(diào)控序列構成了啟動子的其余部分。所述調(diào)控序列決定了表達水平、表達的空間和時間模式,以及對于一些啟動子,還決定了在誘導條件下的表達(通過外部因素例如光、溫度、化學藥品和激素進行調(diào)控)。調(diào)控序列可以是6-100堿基對的DNA序列的短區(qū)域,其定義了反式作用因子例如轉(zhuǎn)錄因子的結合位點。調(diào)控序列也可以是增強子,能夠從遠離核心啟動子區(qū)域之處(有時經(jīng)過從核心區(qū)域開始的幾千個堿基)發(fā)揮作用的DNA序列的更長區(qū)域。調(diào)控序列活性可受到反式作用因子(包括通用轉(zhuǎn)錄機、轉(zhuǎn)錄因子和染色質(zhì)裝配因子)的影響。某些啟動子能夠在植物的所有組織中指導相對類似水平的RNA合成。這些啟動子稱為“組成型啟動子”或“不依賴于組織的”啟動子。根據(jù)它們指導RNA合成的效力,組成型啟動子可以分為強、中等和弱的類別。由于在許多情況下需要在植物的不同組織中同時表達嵌合基因以便獲得所述基因的所需功能,因而組成型啟動子在這方面是特別有用的。雖然已經(jīng)從植物和植物病毒中發(fā)現(xiàn)了許多組成型啟動子并進行了表征,但是對于分離出更新型的組成型啟動子(合成或天然的)仍具有日益增長的興趣,這些更新型的組成型啟動子能夠控制以不同表達水平的嵌合基因的表達,以及用于基因疊加(gene stacking)的在同一轉(zhuǎn)基因植物中多個基因的表達。最常用的啟動子包括胭脂氨酸合酶(NOS)啟動子(Ebert等人,Proc. Natl.Acad. Sci. USA 84:5745-5749(1987));章魚堿合酶(OCS)啟動子;花椰菜花葉病毒屬啟動子,例如花椰菜花葉病毒(CaMV) 19S啟動子(Lawton等人,Plant Mol. Biol. 9 315-324(1987))、CaMV 35S 啟動子(Odell 等人,Nature 313 :810-812 (1985))和玄參花葉病毒35S啟動子(Sanger等人,Plant Mol. Biol. 14,43343 (1990));來自核酮糖二磷酸羧化酶-加氧酶的小亞基的光誘導型啟動子(Pellegrineschi等人,Biochem.Soc. Trans. 23(2) :247-250(1995)) ;Adh 啟動子(Walker 等人,Proc. Natl. Acad. Sci.USA 84 :6624-66280(1987));蔗糖合酶啟動子(Yang 等人,Proc. Natl. Acad. Sci.USA 87 :414-44148(1990)) ;R 基因復合體啟動子(Chandler 等人,Plant Cell I
1175-1183(1989));葉綠素a/b結合蛋白基因啟動子;等等。概述鑒于這些需求,本發(fā)明的目標是提供能夠在植物細胞中驅(qū)動表達的核酸,優(yōu)選地分離的核酸,其中所述核酸序列包含由選自SEQ ID NO :13-33的序列所表示的基因的5’-非翻譯區(qū)、第一外顯子、第一內(nèi)含子和第二外顯子的一部分。本發(fā)明還涉及選自SEQ IDNO :1-3的核酸序列。另一方面,包含所述核酸的所述植物細胞可以是單子葉植物細胞或雙子葉植物細胞。另外一方面,包含所述核酸的所述植物細胞可以是玉米細胞或煙草細胞。另一方面,本發(fā)明的目標涉及表達異源基因的方法,所述方法包括構建表達盒,該表達盒包含選自 prZmHSP70 (SEQ ID NO :1)、prZmUbil58 (SEQ ID NO 2)和 prZmUbi361 (SEQID N03)的啟動子,其中所述表達盒在植物、植物細胞或植物組織或其部分中是有功能的;和,產(chǎn)生包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述異源基因得到表達。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于單子葉植物。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于玉米。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于雙子葉植物。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于煙草或大豆。另一方面,本發(fā)明也涉及植物、植物細胞或植物組織或其部分,其包含表達盒,該表達盒包含選自 prZmHSP70 (SEQ ID NO :1)、prZmUbil58 (SEQ ID NO :2)和 prZmUbi361 (SEQID NO 3)的啟動子。本發(fā)明還涉及包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織或其部分屬于單子葉植物。本發(fā)明還涉及包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織或其部分屬于玉米。本發(fā)明還涉及包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織或其部分屬于雙子葉植物。本發(fā)明還涉及包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織或其部分屬于煙草或大豆。另外一方面,本發(fā)明也涉及表達盒,其包含選自prZmHSP70(SEQ ID NO 1),prZmUbil58(SEQ ID NO :2)和 prZmUbi361 (SEQ ID NO :3)的啟動子。另外一方面,本發(fā)明涉及通過表達異源基因的方法產(chǎn)生的植物、植物細胞或植物組織或其部分,所述方法包括構建表達盒,該表達盒包含選自prZmHSP70 (SEQ ID NO :1)、prZmUbil58(SEQ ID NO :2)和 prZmUbi361 (SEQ ID NO :3)的啟動子,其中所述表達盒在植物、植物細胞或植物組織或其部分中是有功能的;和,產(chǎn)生包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述異源基因得到表達。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于單子葉植物。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于玉米。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細胞或植物組織或其部分屬于雙子葉植物。本發(fā)明還涉及在植物、植物細胞或植物組織或其部分中表達異源基因,其中所述植物、植物細
胞或植物組織或其部分選自從煙草和大豆。另一方面,本發(fā)明也涉及所述植物、植物細胞或植物組織或其部分的后代,其包含選自prZmHSP70(SEQ ID NO :1)、prZmUbil58 (SEQ ID NO:2)和prZmUbi361(SEQ ID NO :3)的啟動子。本發(fā)明也涉及源自所述植物、植物細胞或植物組織或其部分的所述后代的種子。本發(fā)明還涉及源自種子的谷物,所述種子源自所述植物、植物細胞或植物組織或其部分的所述后代。另外一方面,本發(fā)明還涉及能夠在植物細胞中驅(qū)動表達的核酸序列,其中所述核酸序列包含選自下列的核酸序列(a)與SEQ ID NO :1_3之一至少80%同一的核酸序列;(b)為SEQ ID NO :1-3之一的功能性片段的核酸序列;和(c)在嚴格條件下與SEQ ID NO 1-3之一雜交的核酸序列。序列表中的序列的簡要說明SEQ ID NO 1 是 prZmHSP70 的核苷酸序列SEQ ID NO :2 是 prZmUbil58 的核苷酸序列SEQ ID NO :3 是 prZmUbi361 的核苷酸序列SEQ ID NO 4是ZmHSP70 二元構建體15907的核苷酸序列SEQ ID NO 5是ZmUbi 158 二元構建體17239的核苷酸序列SEQ ID NO 6是ZmUbi361 二元構建體17282的核苷酸序列SEQ ID NO 7是TMV- 的翻譯增強子的核苷酸序列SEQ ID NO 8是玉米-優(yōu)化的Kozak序列的核苷酸序列SEQ ID NO 9是玉米-優(yōu)化的Kozak序列的核苷酸序列SEQ ID NO : 10是ZmHSP70_GUS表達盒的核苷酸序列SEQ ID NO : 11是ZmUbi 158-GUS表達盒的核苷酸序列SEQ ID NO : 12是ZmUbi361_GUS表達盒的核苷酸序列SEQ ID NO : 13 是 ZmUbil CTRL_U29159. 1_3_AT 探針的核苷酸序列SEQ ID N0:14 是 ZmHSP70ZM052966_S_AT 探針的核苷酸序列SEQ ID NO : 15 是 ZmUbil58CTRL_ZMU29158_3_AT 探針的核苷酸序列SEQ ID NO : 16 是 ZmUbi361ZM066361_S_AT 探針的核苷酸序列SEQ ID NO : 17 是 cDNA GenBank 登錄號 X73474 的核苷酸序列SEQ ID NO : 18 是 cDNA TIGR 登錄號 TC279798 的核苷酸序列
SEQIDNO :19 是 gDNA GenBank 登錄號 AX099713 的核苷酸序列SEQIDNO 20 是 gDNA GenBank 登錄號 CL315596. I 的核苷酸序列SEQIDNO 21是玉米基因組序列重疊群MAGI_102343的核苷酸序列SEQIDNO 22是天然ZmHSP70基因(AY222837)的核苷酸序列SEQIDNO 23 是 cDNA GenBank 登錄號 Q41751 的核苷酸序列SEQIDNO 24 是 gDNA GenBank 登錄號 AC196154 的核苷酸序列SEQIDNO :25 是 gDNA GenBank 登錄號 S94466 的核苷酸序列SEQIDNO 26是玉米基因組序列重疊群MAGI_6372的核苷酸序列SEQIDNO :27是天然ZmUbi 158基因的核苷酸序列SEQIDNO 28 是共有 cDNA TIGR 登錄號 TC369342_cDNA 的核苷酸序列SEQIDNO :29 是 gDNA GenBank 登錄號 AC196194 的核苷酸序列SEQIDNO :30 是 gDNA GenBank 登錄號 U29162. I 的核苷酸序列SEQIDNO 31是玉米基因組序列重疊群MAGI_11628的核苷酸序列SEQIDNO 32是玉米基因組序列重疊群MAGI_56231的核苷酸序列SEQIDNO 33是天然ZmUbi361基因的核苷酸序列SEQIDNO 34是ZmHSP70裝配構建體15902的核苷酸序列SEQIDNO 35是ZmUbi 158裝配構建體17222的核苷酸序列SEQIDNO 36是ZmUbi361裝配構建體17267的核苷酸序列SEQIDNO :37 是 pCR2. I 的核苷酸序列SEQIDNO :38 是 pN0V6901 的核苷酸序列SEQIDNO :39是1104bp的ZmHSP70的5’ -非轉(zhuǎn)錄序列的核苷酸序列SEQIDNO 40是304bp的ZmHSP70的5’ -非翻譯前導序列的核苷酸序列SEQIDNO 41是1602bp ZmHSP70內(nèi)含子的核苷酸序列SEQIDNO 42是ZmHSP70的459bp 3’ -非翻譯序列的核苷酸序列SEQIDNO :43是3’ -非轉(zhuǎn)錄ZmHSP70序列的535bp的核苷酸序列SEQIDNO 44是源自ZmHSP70的終止子的核苷酸序列SEQIDNO 45是1506bp的ZmUbi 158的5’ -非轉(zhuǎn)錄序列的核苷酸序列SEQIDNO 46是163bp的ZmUbi 158的5’ -非翻譯前導序列的核苷酸序列SEQIDNO 47是煙草蝕刻病毒翻譯增強子的核苷酸序列SEQIDN0:48是2386bp ZmUbil58第一內(nèi)含子的核苷酸序列SEQIDNO 49是ZmUbi 158的341bp 3’ -非翻譯序列的核苷酸序列SEQIDNO 50是660bp的3’ -非轉(zhuǎn)錄ZmUbil58序列的核苷酸序列SEQIDNO 51是1501bp的ZmUbi361的5,-非轉(zhuǎn)錄序列的核苷酸序列SEQIDNO 52是ZmUbi361的260bp 5’ -非翻譯前導序列的核苷酸序列SEQIDNO 53是1329bp ZmUbi361內(nèi)含子的核苷酸序列SEQIDNO 54是源自ZmUbi361的終止子的核苷酸序列SEQIDNO 55是源自ZmUbi 158的終止子的核苷酸序列SEQIDNO 56是ZmUbi361的65bp 3’ -非翻譯序列的核苷酸序列SEQIDNO 57是936bp的3’ -非轉(zhuǎn)錄ZmUbi361序列的核苷酸序列
SEQ ID NO :58 是 pCR4_T0P0 的核苷酸序列SEQ ID NO :59是載體17680的核苷酸序列SEQ ID NO 60是載體18271的核苷酸序列SEQ ID NO 61是載體18272的核苷酸序列定義術語“開放閱讀框架(ORF) ”是指在編碼序列的翻譯起始密碼子和終止密碼子之間所編碼的氨基酸序列。術語“起始密碼子”和“終止密碼子”是指,在編碼序列中的分別界
定蛋白合成(mRNA翻譯)的起始和鏈終止的三個相鄰核苷酸的單元(‘密碼子’)。術語“非生物脅迫”是指能對植物產(chǎn)生有害影響的非生命環(huán)境因素,例如霜凍、干旱、過熱、疾風等。術語“核酸”是指高分子量的多核苷酸,其可以是單鏈的或雙鏈的,由包含糖、磷酸和堿基(其為嘌呤或嘧啶)的單體(核苷酸)組成?!昂怂崞巍笔侵附o定核酸分子的一部分。在高等植物中,脫氧核糖核酸(DNA)是遺傳物質(zhì),而核糖核酸(RNA)參與把DNA中所含信息轉(zhuǎn)移到蛋白質(zhì)中?!盎蚪M”是在生物的每個細胞中所含的遺傳物質(zhì)的整體。術語“核苷酸序列”是指DNA或RNA的聚合物,其可以是單鏈的或雙鏈的,可選地包含能夠摻入到DNA或RNA聚合物中的合成的、非天然的或改變的核苷酸堿基。除非另外指明,否則本發(fā)明的具體核酸序列也隱含地涵蓋其經(jīng)保守修飾的變體(例如簡并密碼子置換)和互補序列以及明確指明的序列。特別地,簡并密碼子置換可以通過產(chǎn)生其中一個或多個所選(或所有)密碼子的第三個位置用混合堿基和/或脫氧肌苷殘基置換的序列來達到(Batzer等人,Nucleic Acid Res. 19:5081(1991) ;0htsuka 等人,J. Biol. Chem. 260 :2605-2608 (1985);和 Rossolini 等人,Mol. Cell. Probes 8 :91-98 (1994))。術語“核酸”與基因、cDNA 和由基因編碼的mRNA可互換使用?!翱刹僮鬟B接”是指核酸序列聯(lián)合成單個核酸片段,從而一個核酸序列的功能受到另一個核酸序列的影響。例如,當啟動子能夠影響編碼序列或功能性RNA的表達時,該啟動子與該編碼序列或功能性RNA是可操作連接的(即該編碼序列或功能性RNA處于該啟動子的轉(zhuǎn)錄控制之下)。可以將以有義或反義方向的編碼序列可操作連接至調(diào)控序列?!皢幼印笔侵高@樣的核苷酸序列,其通過提供關于RNA聚合酶和其他對于正確轉(zhuǎn)錄所需要的因子的識別來控制編碼序列的表達?!皢幼诱{(diào)控序列”可以包含近端和更遠端的上游元件和/或下游元件。啟動子調(diào)控序列影響相關聯(lián)的編碼序列的轉(zhuǎn)錄、RNA加工或穩(wěn)定性、或者翻譯。啟動子調(diào)控序列包括增強子、非翻譯前導序列、內(nèi)含子、外顯子和多腺苷酸化信號序列。它們包括天然序列和合成序列,以及可以為合成序列和天然序列的組合的序列?!霸鰪娮印笔强梢源碳幼踊钚缘暮塑账嵝蛄校⑶铱梢允菃幼拥墓逃性蛘弑徊迦胍栽鰪妴幼拥乃交蚪M織特異性的異源元件。編碼序列可以存在于雙鏈DNA分子的任一條鏈上,并且即使位于啟動子上游或下游均能夠發(fā)揮功能。術語“啟動子”的含義包括“啟動子調(diào)控序列”。“初級轉(zhuǎn)化體”和“T0代”是指與最初被轉(zhuǎn)化的組織屬于相同遺傳代的轉(zhuǎn)基因植物(即,自轉(zhuǎn)化以來未經(jīng)過減數(shù)分裂和受精)?!按渭夀D(zhuǎn)化體”和“T1、T2、T3等代”是指通過一個或多個減數(shù)分裂和受精周期后從初級轉(zhuǎn)化體來源的轉(zhuǎn)基因植物。它們可以通過初級或次級轉(zhuǎn)化體的自體受精,或者通過初級或次級轉(zhuǎn)化體與其他轉(zhuǎn)化或未轉(zhuǎn)化的植物的雜交而獲得?!盎颉笔侵副磉_mRNA、功能性RNA或特定蛋白質(zhì)的核酸片段,包括調(diào)控序列。術語“天然基因”是指在自然界中發(fā)現(xiàn)的基因。術語“嵌合基因”是指包含下述序列的任何基因
I)不是在自然界中一起發(fā)現(xiàn)的DNA序列,包括調(diào)控序列和編碼序列;2)編碼不是天然鄰接的蛋白質(zhì)的部分的序列;或3)不是天然鄰接的啟動子的部分。因此,嵌合基因可包含源自不同來源的調(diào)控序列和編碼序列,或者包含源自相同來源但以與在自然界中所發(fā)現(xiàn)的方式不同的方式進行排列的調(diào)控序列和編碼序列?!稗D(zhuǎn)基因”是指通過轉(zhuǎn)化而引入到基因組中并且穩(wěn)定維持的基因。例如,轉(zhuǎn)基因可包括對于待轉(zhuǎn)化的特定植物的基因來說異源的或同源的基因。此外,轉(zhuǎn)基因可包括插入到非天然生物中的天然基因,或者嵌合基因。術語“內(nèi)源基因”是指在生物的基因組中處于其天然位置處的天然基因?!巴庠础被蚴侵冈谒拗魃镏型ǔ2淮嬖诘?、但通過基因轉(zhuǎn)移而引入到該生物中的基因。如在本文中所使用的,“表達盒”,表示能夠在合適的宿主細胞中指導特定核苷酸序列的表達的DNA序列,包含可操作連接至目的核苷酸序列(其可操作連接至終止信號)的啟動子。它也通常包含對于核苷酸序列的正確翻譯來說所需要的序列。編碼區(qū)通常編碼目的蛋白,但也可編碼目的功能性RNA,例如反義RNA或非翻譯RNA (以有義或反義方向)。包含目的核苷酸序列的表達盒可以是嵌合的,這意味著它的至少一個組分相對于它的至少一個其他組分來說是異源的?!皟?nèi)含子”是指DNA的間插性部分,它幾乎只在真核生物基因中出現(xiàn),但它在基因產(chǎn)物中并不翻譯成氨基酸序列。內(nèi)含子通過稱為“剪接”的過程而被從未成熟mRNA上移除,從而形成mRNA,所述稱為“剪接”的過程保持外顯子不變。對于本發(fā)明,術語“內(nèi)含子”的定義包括對于源自靶基因的內(nèi)含子的核苷酸序列的修飾?!巴怙@子”是指攜帶蛋白質(zhì)或其部分的編碼序列的DNA部分。外顯子由間插性非編碼序列(內(nèi)含子)間隔開。對于本發(fā)明,術語“外顯子”的定義包括對于源自靶基因的外顯子的核苷酸序列的修飾。基因的表達或過表達涉及基因的轉(zhuǎn)錄和mRNA翻譯成前體蛋白質(zhì)或成熟蛋白質(zhì)?!胺戳x抑制”是指能夠抑制靶蛋白表達的反義RNA轉(zhuǎn)錄物的產(chǎn)生?!斑^表達”是指在轉(zhuǎn)基因生物中超過了在正?;蚍寝D(zhuǎn)化生物中的產(chǎn)生水平的基因產(chǎn)物的產(chǎn)生。“共抑制”是指能夠抑制相同或基本上類似的外源或內(nèi)源基因的表達或轉(zhuǎn)錄物積累的有義RNA轉(zhuǎn)錄物的產(chǎn)生。共抑制的機制可以在DNA水平(例如DNA甲基化)上、在轉(zhuǎn)錄水平上或在轉(zhuǎn)錄后水平上。術語“組成型啟動子”是指在所有或大多數(shù)發(fā)育階段中在植物的所有或大多數(shù)組織中有活性的啟動子。如其他分類為組成型的啟動子一樣,在不同組織或不同階段中,絕對表達水平可以存在一些變化。在本文中,術語“組成型啟動子”或“不依賴于組織的啟動子”可互換使用?!胺蛛x的核酸片段”是指核糖核苷酸(RNA)或脫氧核糖核苷酸(DNA)的聚合物,其是單鏈的或雙鏈的,可選的包含合成的、非天然的或改變的核苷酸堿基。以DNA形式存在的分離的核酸片段可包含cDNA、基因組DNA或合成DNA的一個或多個區(qū)段。在本文中,術語“多核苷酸”、“多核苷酸序列”、“核酸序列”和“核酸片段” / “分離的核酸片段”可互換使用。這些術語涵蓋核苷酸序列等。多核苷酸可以是RNA或DNA的聚合物,其是單鏈的或雙鏈的,可選地包含合成的、非天然的或改變的核苷酸堿基。以DNA聚合物形式存在的多核苷酸可包含cDNA、基因組DNA、合成DNA或其混合物的一個或多個區(qū)段。核苷酸(通常以其5'-單磷酸形式存在)由如下的單字母名稱來指代“A”指腺苷酸或脫氧腺苷酸(分別對于RNA或DNA),“C”指胞苷酸或脫氧胞苷酸,“G”指鳥苷酸或脫氧鳥苷酸,“U”指尿苷酸,“T”指脫氧胸苷酸,“R”指嘌呤(A或G),“Y”指嘧啶(C或T),“K”指G或T,“H”指A或C或T,“ I ”指肌苷,和“N”指任意核苷酸?!爱愒春怂崞巍笔侵覆慌c本發(fā)明的植物啟動子序列一起天然地出現(xiàn)的序列。雖然這種核苷酸序列對于啟動子序列來說是異源的,但它對于植物宿主來說可以是同源的、或天然的、或異源的、或外源的。但是,應當認識到,即時啟動子可以與它們的天然編碼序列一起使用,以便增加或降低表達,從而導致經(jīng)轉(zhuǎn)化的種子中表型的變化。在本文中,術語“在功能上等價的子片段”和“功能等價子片段”可互換使用。這些術語是指分離的核酸片段的一部分或子序列,其中保留了改變基因表達或產(chǎn)生某一表型的能力,無論該片段或子片段是否編碼活性酶。例如,該片段或子片段可用于嵌合基因的設
計,以便在經(jīng)轉(zhuǎn)化的植物中產(chǎn)生所需的表型??梢酝ㄟ^在合適的相對于植物啟動子序列的方向上連接核酸片段或其子片段(無論其是否編碼活性酶),來設計嵌合基因以用于共抑制或反義。如在本文中所使用的,術語“基本上類似”和“基本上相應于”是指這樣的核酸片段,其中一個或多個核苷酸堿基處的變化不影響該核酸片段介導基因表達或產(chǎn)生某一表型的能力。這些術語也指本發(fā)明的核酸片段的修飾,例如刪除或插入一個或多個核苷酸,所述核苷酸基本上不會改變所得核酸片段的功能性質(zhì),相對于初始的未修飾的片段而言。因此,應當理解,正如本領域技術人員將會意識到的,本發(fā)明除了特定的示例性序列外還涵蓋其他序列?!?'-非編碼序列”是指位于編碼序列下游的DNA序列,并且包括多腺苷酸化識別序列和其他編碼能夠影響mRNA加工或基因表達的調(diào)控信號的序列。多腺苷酸化信號的特征通常是影響聚腺苷酸束向mRNA前體的3'-末端的添加。Ingelbrecht等人,PlantCell I :671-680(1989)例示了同的3' _非編碼序列的使用?!稗D(zhuǎn)化”是指將核酸片段轉(zhuǎn)移到宿主生物的基因組中,從而導致遺傳上穩(wěn)定的遺傳。包含轉(zhuǎn)化的核酸片段的宿主生物稱為“轉(zhuǎn)基因”生物?!八矔r表達”是指在宿主生物的所選擇的某些細胞類型中常常為報道基因(例如^ -葡糖醛酸糖苷酶(⑶S),熒光蛋白基因GFP、ZS-YELLOfflNU AM-CYANU DS-RED)的暫時表達,其中通過轉(zhuǎn)化方法暫時引入轉(zhuǎn)基因基因。本文中所使用的標準重組DNA和分子克隆方法在本領域中是眾所周知的,并且更全面地描述在下列文獻中Sambrook,J.等人,Molecular Cloning A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory Press Cold Spring Harbor, N.Y, 1989(此后簡稱為 “Sambrook 等人,1989”) ;*Ausubel, E M.,Brent, R.,Kingston, R. E.,Moore,D. D. , Seidman, J. G. , Smith, J. A.和 Struhl, K.,編輯,Current Protocols in MolecularBiology, John Wiley and Sons New York, 1990 (此后簡稱為 “Ausubel 等人,1990”)。“PCR”或“聚合酶鏈反應”是用于合成大量的特定DNA區(qū)段的技術,其由一系列重復的循環(huán)構成(Perkin Elmer Cetus Instruments,Norwalk,Conn.)。通常,使雙鏈 DNA 熱變性,讓與靶區(qū)段的3'-邊界互補的兩個引物在低溫下退火,然后在中等溫度下延伸。一組這三個連續(xù)步驟構成一個循環(huán)。如在本文中所使用的,短語“嚴格雜交條件”是指這樣的條件,在該條件下多核苷酸與其靶子序列雜交(通常在復雜的核酸混合物中),但本質(zhì)上不與其他序列雜交。嚴格條件是序列依賴性的,并且在不同的情況下可以是不同的。更長的序列通常在更高的溫度下特異性地進行雜交。關于核酸雜交的廣泛指導可在Tijssen(1993)中找到。一般地,在確定的離子強度和PH下,對于特定序列,將嚴格條件選擇為比熱解鏈點(Tm)低約5-10°C。Tm是在平衡時50%的與靶互補的探針與靶序列雜交(由于靶序列是過量存在的,因而在Tm時,50%的探針在平衡時被占據(jù))時的溫度(在確定的離子強度、pH和核酸濃度下)。示例性的嚴格雜交在65°C,優(yōu)選地60°C,和最優(yōu)選地55°C的溫度下,在含0. I % SDS的雙倍強度(2X)的檸檬酸鹽緩沖鹽水(SSC)中進行,隨后在相同溫度下,但用具有降低的SSC濃度的緩沖液來漂洗支持物。此類濃度降低的緩沖液通常為含0. 1% SDS的1/10強度的SSC(0. IXSSC),優(yōu)選地為含0. 1% SDS的0. 2X SSC,和最優(yōu)選地為含0. 1% SDS的半強度的SSC (0. 5XSSC)。詳細說明本文所公開的啟動子核苷酸序列和方法可用于調(diào)節(jié)任何異源核酸序列在宿主植物中的表達,以便改變植物的表型。表型的各種變化是令人感興趣的,包括但不限于更改植物中的脂肪酸組成、改變植物的氨基酸組成、改變植物的病原體防御系統(tǒng)、改變植物對于環(huán)境的應答,等等。這些結果可以通過提供在植物中異源產(chǎn)物的表達或內(nèi)源產(chǎn)物的增加的表達來達到。備選地,所述結果可以通過提供在植物中一種或多種內(nèi)源產(chǎn)物(特別是酶或輔因子)的表達的減少來達至IJ。這些變化導致經(jīng)轉(zhuǎn)化的植物的表型的變化。目的基因反映了在作物開發(fā)中所涉及的那些基因的商業(yè)市場和利益。目的作物和市場不斷變化,并且由于發(fā)展中國家打開世界市場,新的作物和技術也將出現(xiàn)。此外,由于我們對于農(nóng)藝學特征和性狀(例如產(chǎn)量和雜種優(yōu)勢)的理解不斷增加,用于轉(zhuǎn)化的基因的選擇將會相應地變化。轉(zhuǎn)基因(也稱為異源基因)的類別包括但不限于編碼重要的農(nóng)藝學性狀、抗蟲性、抗病性、除草劑抗性、不育性、谷物或種子特征和商業(yè)產(chǎn)物的基因。目的基因一般包括在油、淀粉、碳水化合物或營養(yǎng)物代謝中所涉及的那些基因,以及影響種子大小、植物發(fā)育、植物生長調(diào)節(jié)和產(chǎn)量改善的那些基因。植物發(fā)育和生長的調(diào)節(jié)也指植物的各種部分(例如花、種子、根、葉和苗)的發(fā)育和生長調(diào)節(jié)。其他商業(yè)上所希望的性狀為賦予冷、熱、鹽和干旱抗性的基因和蛋白質(zhì)。抗病性和/或抗蟲性基因可編碼對于具有極大的產(chǎn)量降低效應的有害生物的抗性,所述有害生物例如為炭疽病、大豆花葉病毒、大豆胞囊線蟲、根結線蟲、褐斑病、霜霉病、紫斑病、種子腐爛和幼苗疾病(其通常由腐霉屬物種(Pythium sp.)、疫霉屬物種(Phytophthora sp.)、絲核菌屬物種(Rhizoctonia sp.)、間座殼屬物種(Diaporthesp.)這些真菌引起)。細菌性枯萎病是由細菌丁香假單胞菌大豆致病變種(Pseudomonassyringae pv. Glycinea)引起的。賦予抗蟲性的基因包括,例如蘇云金芽孢桿菌(Bacillusthuringiensis)毒性蛋白基因(美國專利號 5,366,892、5,747,450、5,737,514、5,723,756、5,593,881 ;和 Geiser 等人,(1986)Gene48 :109);凝集素(Van Damme 等人,(1994)Plant Mol. Biol. 24 :825);等等。
除草劑抗性性狀可包括編碼對于其作用為抑制乙酰乳酸合酶(ALS)的作用的除草劑的抗性的基因,所述除草劑特別是磺酰脲類型的除草劑(例如,包含導致此類抗性的突變(特別是34和/或11狀突變)的乙酰乳酸合酶ALS基因)。ALS基因突變體編碼對于除草劑綠磺隆的抗性。草甘膦乙酰轉(zhuǎn)移酶(GAT)是來自地衣芽孢桿菌(Bacilluslicheniformis)的N-乙酰轉(zhuǎn)移酶,其通過基因改組進行優(yōu)化以用于廣譜除草劑草甘膦的乙?;?,從而形成在轉(zhuǎn)基因植物中草甘膦耐受性的新機制的基礎(Castle等人,(2004)Science 304,1151-1154)。對于本領域技術人員來說,顯而易見可使用其他除草劑抗性性狀??梢孕揎棻景l(fā)明的啟動子序列,優(yōu)選地分離的啟動子序列,以提供異源核苷酸序列的一系列組成型表達水平。因此,可利用小于完整的啟動子區(qū)域,并且保留驅(qū)動編碼序列表達的能力。但是,應當認識到,mRNA的表達水平可隨著刪除啟動子序列的部分而降低。在一些情況下,減少的表達可能是所希望的。啟動子序列的修飾可改變表達的不依賴于組織的、組成型的性質(zhì)。因此,與 SEQ ID NO =1-380%,81%,82%,83%,84%,85%,86%,87%,
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 同一的 SEQ ID NO:1-3的片段可能仍然如本說明書所例示的那樣發(fā)揮功能。為鑒定適合于表達盒開發(fā)的玉米候選基因及其調(diào)控序列,為了在所有樣品中表現(xiàn)出最高平均信號的探針,分析了來自發(fā)育表達譜系列的玉米表達譜數(shù)據(jù)。對于每個探針計算平均信號,然后基于平均信號將每個探針進行排序。在該分析中,代表ZmUbiU—種經(jīng)充分表征的組成型表達盒)的CTRL U29159. 1-3AT探針(SEQ ID NO 13)排名第7位。該分析是選擇用于組成型表達盒構建的3個另外啟動子候選物的基礎ZmHSP70,排名第2位(SEQ ID NO 23) ;ZmUbil58,排名第 3 位(SEQ ID NO 30);和 ZmUbi361,排名第 10 位(SEQID N0:38)。表I中的數(shù)據(jù)(前10位,組成型)概括了結果。表I.組織中的表達的相對信號強度探針集
權利要求
1.能夠在植物細胞中驅(qū)動表達的核酸序列,其中所述核酸序列包含由選自SEQID NO13-33的序列所表示的基因的5’-非翻譯區(qū)、第一外顯子、第一內(nèi)含子和第二外顯子的一部分。
2.權利要求I的核酸序列,其中所述核酸序列選自SEQID N0:l-3。
3.權利要求I的核酸序列,其中所述植物細胞是單子葉植物細胞。
4.權利要求I的核酸序列,其中所述植物細胞是玉米細胞。
5.權利要求I的核酸序列,其中所述植物細胞是雙子葉植物細胞。
6.權利要求I的核酸序列,其中所述植物細胞是煙草細胞。
7.表達異源基因的方法,其包括 a)構建表達盒,該表達盒包含選自prZmHSP70(SEQ ID NO : I)、pr ZmUbi 158 (SEQ ID NO:2)和prZmUbi361(SEQ ID NO 3)的啟動子,其中所述表達盒在植物、植物細胞或植物組織中是有功能的;和 b)產(chǎn)生包含所述表達盒的植物、植物細胞或植物組織或其部分,其中所述異源基因得到表達。
8.權利要求7的方法,其中所述植物、植物細胞或植物組織或其部分屬于單子葉植物。
9.權利要求8的方法,其中所述植物、植物細胞或植物組織或其部分屬于玉米。
10.植物、植物細胞或植物組織或其部分,其包含表達盒,該表達盒包含選自prZmHSP70 (SEQ ID NO : I)、prZmUbil58 (SEQ ID NO :2)和 prZmUbi361 (SEQ ID NO :3)的啟動子。
11.權利要求10的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織屬于單子葉植物。
12.權利要求10的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織屬于玉米。
13.權利要求10的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織屬于雙子葉植物。
14.權利要求10的植物、植物細胞或植物組織或其部分,其中所述植物、植物細胞或植物組織屬于煙草。
15.表達盒,其包含選自prZmHSP70(SEQ ID NO :1)、prZmUbil58 (SEQ ID NO :2)和prZmUbi361(SEQ ID NO :3)的啟動子。
16.通過權利要求7的方法產(chǎn)生的一種植物、植物細胞或植物組織或其部分。
17.權利要求16的植物、植物細胞或植物組織或其部分的后代。
18.源自權利要求17的后代的種子,其中所述種子包含選自SEQID NO :1_3的核酸序列。
19.源自權利要求18的種子的谷物,其中所述谷物包含選自SEQID NO :1_3的核酸序列。
20.能夠在植物細胞中驅(qū)動表達的核酸序列,其中所述核酸序列包含選自下列的核酸序列 a)與SEQID NO :1_3之一至少80%同一的核酸序列; b)為SEQID NO :1-3之一的功能性片段的核酸序列;和c)在嚴格條件下與SEQ ID NO :1-3之一雜交的核酸序列?!?br>
全文摘要
本發(fā)明包括用于在植物中表達重組基因產(chǎn)物的表達盒,其包含源自靶基因的調(diào)控序列,例如來自HSP70、Ubi158和Ubi361基因的調(diào)控序列。使用發(fā)育表達譜數(shù)據(jù)來鑒定了幾種候選基因,以用于強的組成型表達盒開發(fā)。開發(fā)了三種表達盒。它們基于ZmHSP70、ZmUbi158和ZmUBI361基因。
文檔編號C07H21/00GK102803283SQ201080027047
公開日2012年11月28日 申請日期2010年6月8日 優(yōu)先權日2009年6月11日
發(fā)明者M·L·努西奧 申請人:先正達參股股份有限公司