專利名稱::組成型植物啟動子的制作方法
技術領域:
:本發(fā)明涉及一類強組成型植物啟動子及其用途。所述啟動子可用于同源蛋白或異源蛋白在植物或植物細胞中的表達,或者用于活性核酸分子例如正義RNA和/或反義RNA的表達。本發(fā)明提供具有啟動子活性的核酸序列以及嵌合基因、載體和包含它們的重組(轉(zhuǎn)基因)細胞和生物體。本發(fā)明還提供制備包含所述啟動子的轉(zhuǎn)基因細胞和生物體(尤其是植物和植物細胞)的方法。此外,本發(fā)明提供胞質(zhì)半胱氨酸合酶蛋白以及編碼它們的核酸序列。
背景技術:
:在本領域中已知有很多種植物啟動子,它們是用于在轉(zhuǎn)基因植物或植物細胞中表達蛋白或肽或者用于沉默基因或基因家族的有用工具。它們包括組成型啟動子、誘導型啟動子、發(fā)育調(diào)節(jié)型啟動子、組織優(yōu)選的啟動子或組織特異性啟動子。通常使用的組成型啟動子的實例如下花椰菜花葉病毒(CaMV)分離株CM1841(Gardneretal.,1981,NucleicAcidsResearch9,2871-2887)、CabbB-S(Francketal.,1980,Cell21,285-294)和CabbB-JI(HullandHowell,1987,Virology86,482-493)的35S啟動子或增強型35S啟動子(“35S啟動子”);0dell等人(1985,Nature313,810-812)或US5164316中記載的35S啟動子、來自泛素家族的啟動子(例如Christensenetal.,1992,PlantMol.Biol.18,675-689、EP0342926的玉米泛素啟動子,亦見Cornejoetal.1993,PlantMol.Biol.23,567-581)、gos2啟動子(dePateretal.,1992PlantJ.2,837-844)、emu啟動子(Lastetal.,1990,Theor.Appl.Genet.81,581-588)、擬南芥肌動蛋白啟動子例如An等人(1996,PlantJ.10,107-121)所記載的啟動子、水稻肌動蛋白啟動子例如Zhang等人(1991,ThePlantCell3,1155-1165)所記載的啟動子和US5,641,876中記載的啟動子或者WO00/70067中記載的水稻肌動蛋白2啟動子;木薯葉脈花葉病毒的啟動子(WO97/48819、Verdagueretal.1998,PlantMol.Biol.37,1055-1067)、來自地三葉草矮化病毒的pPLEX系列啟動子(WO96/06932,特別是S7啟動子)、乙醇脫氫酶啟動子例如pAdhlS(GenBank登錄號X04049、X00581)、US6051753和EP426641中記載的玄參花葉病毒啟動子、組蛋白基因啟動子例如來自擬南芥的Ph4a748啟動子(PlantMol.Biol.8179-191)、CoYMV(鴨跖草黃斑駁病毒)啟動子(Medberryetal.1992,ThePlantCell4185-192)等等。然而,現(xiàn)有組成型啟動子的一個共同的缺點是它們的活性經(jīng)常會發(fā)生變化,例如器官或發(fā)育調(diào)節(jié)的表達或者脅迫誘導的表達改變。本發(fā)明人發(fā)現(xiàn)CaMV35S啟動子在轉(zhuǎn)基因植物中的活性對非生物脅迫(特別是當所述轉(zhuǎn)基因植物生長在西班牙的田地中所引起的熱脅迫)是敏感的。因此,需要提供對一種或多種生物和/或非生物脅迫不敏感的新的組成型啟動子。另外,按照調(diào)節(jié)的觀點需要將來自植物的啟動子用于形成轉(zhuǎn)基因植物。另外,不優(yōu)選把來自于能夠感染植物的病毒的病毒啟動子用于宿主植物種的轉(zhuǎn)化,這是因為所述病毒感染所述植物可以引起所述轉(zhuǎn)基因啟動子的沉默(Seemanpillaietal.,2003,MolPlantMicrobeInteract.16(5)429-38;Al-Kaffetal.,2000,NatBiotechnol.18995-9)?;虔B加方法也需要不同的組成型啟動子,這是因為使用多個相同的啟動子也會產(chǎn)生沉默(Yangetal.,2005,PlantMolBiol.58351-66)。
發(fā)明內(nèi)容本發(fā)明提供一種轉(zhuǎn)基因植物、植物細胞或者植物組織或器官,包括整合至其基因組中的嵌合基因,其特征在于所述嵌合基因包含可操作地連接至同源或異源核酸序列上的組成型啟動子,其中所述啟動子選自于(a)SEQIDNO1或SEQIDNO2或者SEQIDNO6-9的任一條的核酸序列,或者克隆至載體pKG8135或pKG8137中的啟動子序列,所述兩個載體均保藏于CBS(荷蘭真菌保藏所,CentraalbureauvoorSchimmelcultures,Uppsalalaan8,3584CTUtrecht,TheNetherlands,2006年8月3日,登錄號分別為CBS120175和CBS120176);(b)SEQIDNO1或SEQIDNO2或者(a)中所述的任一條序列的功能片段;(c)與SEQIDNO1或2或者(a)中所述的任一條序列有至少70%的序列同一性的核酸序列;(d)(c)的核酸序列的功能片段。本發(fā)明還提供導入植物細胞后具有啟動子活性的分離的核酸序列,其中所述核酸序列包含選自于以下的序列(a)SEQIDNO1或SEQIDNO2或者SEQIDNO6-9的任一條的核酸序列,或者克隆至載體pKG8135或pKG8137中的啟動子序列,所述兩個載體均保藏于CBS(CentraalbureauvoorSchimmelcultures,Uppsalalaan8,3584CTUtrecht,TheNetherlands,2006年8月3日,登錄號分別為CBS120175和CBS120176);(b)SEQIDNO1或SEQIDNO2或者(a)中所述的任一條序列的片段;(c)與SEQIDNO1或2或者(a)中所述的任一條序列有至少70%的序列同一性的核酸序列;(d)(c)的核酸序列的片段。包含上述序列的載體、嵌合基因和宿主細胞也是本發(fā)明的實施方案。在另一個實施方案中,將胞質(zhì)植物半胱氨酸合酶基因的啟動子用于正義和/或反義核酸序列在轉(zhuǎn)基因植物、植物細胞或者植物組織或器官中組成型表達。此外,本發(fā)明提供一種制備轉(zhuǎn)基因植物或植物細胞的方法,包含以下的步驟(a)形成包含上述啟動子的嵌合基因或包含有該嵌合基因的載體,該啟動子可操作地連接有待轉(zhuǎn)錄的核酸序列,并且任選地還連接3’UTR核酸序列;(b)用所述嵌合基因或載體轉(zhuǎn)化植物或植物細胞;以及,任選地,(c)再生成轉(zhuǎn)基因植物或植物細胞。在又一個實施方案中提供了包含SEQIDNO3或4的核苷酸序列的分離的核酸分子。一般定義術語“核酸序列”(或核酸分子)是指單鏈或雙鏈形式的DNA或RNA分子,特別是具有根據(jù)本發(fā)明的啟動子活性的DNA或者編碼蛋白或蛋白片段的DNA。“分離的核酸序列”是指脫離分離它的天然環(huán)境的核酸序列,例如在細菌宿主細胞中或者在植物核基因組或質(zhì)基因組中的核酸序列。術語“蛋白”或“多肽”可互換使用,指由氨基酸鏈組成的分子,不涉及具體的作用模式、大小、3-維結構或來源。蛋白的“片段”或“部分”因此仍然可以指的是“蛋白”?!胺蛛x的蛋白”用來指脫離其天然環(huán)境例如在體外或者在重組細菌或植物宿主細胞中的蛋白。術語“基因”意為包含這樣一個區(qū)域(轉(zhuǎn)錄區(qū)域)的DNA序列,該區(qū)域在細胞中被轉(zhuǎn)錄成RNA分子(例如mRNA),可操作地連接合適的轉(zhuǎn)錄調(diào)控區(qū)域(例如啟動子)?;蛞虼丝梢园瑤讉€可操作連接的序列例如啟動子、包含例如參與翻譯起始的序列的5’非翻譯前導序列(也被稱為5’UTR,它對應于翻譯起始密碼子上游的轉(zhuǎn)錄mRNA序列)、(蛋白)編碼區(qū)(cDNA或基因組DNA)和包含例如轉(zhuǎn)錄終止位點和多腺苷酸化位點(如AAUAAA或其變體等)的3’非翻譯序列(也被稱為3’非翻譯區(qū)即3’UTR)?!扒逗匣颉?或重組基因)是指不是在一個物種中正常天然存在的任何基因,特別是核酸序列中存在而在天然中沒有聯(lián)系的一個或多個部分的基因。例如,啟動子在天然中與部分或全部的轉(zhuǎn)錄區(qū)域或者與另一調(diào)節(jié)區(qū)域沒有聯(lián)系。術語“嵌合基因”可以理解為包括表達構建體,其中的啟動子或轉(zhuǎn)錄調(diào)節(jié)序列可操作地連接至一條或多條正義序列(例如編碼序列)或者至反義序列(所述正義鏈的反向互補序列)或反向重復序列(正義的和反義的,由此所述RNA轉(zhuǎn)錄物在轉(zhuǎn)錄中形成雙鏈RNA)?!?’UTR”即“3’非翻譯序列”(也經(jīng)常被稱為3’非翻譯區(qū)或3’端)是指在基因的編碼序列的下游存在的核酸序列,它包含例如轉(zhuǎn)錄終止位點和(在大部分但非全部的真核mRNA中的)多腺苷酸化信號(例如AAUAAA或其變體等)。在轉(zhuǎn)錄終止后,可以切除所述mRNA轉(zhuǎn)錄物下游的多腺苷酸化信號并且加上多A的尾,該尾參與所述mRNA到細胞質(zhì)(進行翻譯的位置)的轉(zhuǎn)運?!盎虻谋磉_”所指的過程是可操作地連接有合適的調(diào)節(jié)區(qū)域(特別是啟動子)的DNA區(qū)域被轉(zhuǎn)錄成有生物活性的RNA,即它能夠被翻譯成具有生物活性的蛋白或肽(或活性肽片段)或者它自身具有活性(例如在轉(zhuǎn)錄后的基因沉默中或RNAi中具有活性)。在某些實施方案中的活性蛋白是指由于存在阻遏域而具有顯性負性功能的蛋白。編碼序列優(yōu)選在正義方向上并編碼所需的、有生物活性的蛋白或肽或者活性肽片段。在基因沉默方法中,所述DNA序列優(yōu)選以反義DNA或反向重復DNA的形式存在,包含反義方向或正義和反義方向的靶基因的短序列?!爱愇槐磉_”是指基因在正常情況下不表達的組織中表達?!稗D(zhuǎn)錄調(diào)節(jié)序列”在本文中被定義為能夠調(diào)節(jié)可操作地連接于所述轉(zhuǎn)錄調(diào)節(jié)序列的核酸序列的轉(zhuǎn)錄水平的核酸序列。本文定義的轉(zhuǎn)錄調(diào)節(jié)序列因此將包含啟動轉(zhuǎn)錄(啟動子元件)、維持和調(diào)節(jié)轉(zhuǎn)錄(包括例如弱化子或增強子,也包括沉默子)必需的所有序列元件。雖然主要提及的是編碼序列上游(5’)的轉(zhuǎn)錄調(diào)節(jié)序列,但是在編碼序列下游(3’)存在的調(diào)節(jié)序列也囊括在該定義中。本文使用的術語“啟動子”是指起到控制一個或多個基因轉(zhuǎn)錄作用的核酸片段,它位于所述基因轉(zhuǎn)錄起始位點(轉(zhuǎn)錄起點被標示為序列的+1位置,相對于該位置的任何上游核苷酸使用負數(shù)標示)的轉(zhuǎn)錄方向的上游(5’),并且在結構上鑒定為存在DNA-依賴的RNA聚合酶結合位點、轉(zhuǎn)錄起始位點和任何其他DNA結構域(順式作用序列),包括但不限于轉(zhuǎn)錄因子結合位點、阻遏蛋白和激活蛋白結合位點以及本領域技術人員已知起到直接或間接調(diào)節(jié)由該啟動子轉(zhuǎn)錄的量的任何其他核苷酸序列。位于轉(zhuǎn)錄起始(+1)上游的真核順式作用序列的實例包括TATA盒(通常在轉(zhuǎn)錄起點的大約-20至-30的位置)、CAAT盒(通常在相對于轉(zhuǎn)錄起點的大約-75的位置)、5’增強子或沉默子元件等?!敖M成型”啟動子是大多數(shù)生理和發(fā)育條件下在大多數(shù)組織(或器官)都有活性的啟動子。更優(yōu)選地,組成型啟動子在所有主要器官(例如至少葉、莖、根、種子、果實和花)的基本上所有的生理和發(fā)育條件下都是有活性的。最優(yōu)選地,所述啟動子在所有器官的大多數(shù)(優(yōu)選所有)生理和發(fā)育條件下都是有活性的?!罢T導型”啟動子是生理調(diào)控的啟動子(例如通過外部給予某些化合物)或發(fā)育調(diào)控的啟動子?!敖M織特異的”啟動子僅在特定類型的組織或細胞中有活性。對所述啟動子活性的闡述因此可以指所述啟動子轉(zhuǎn)錄可操作連接于其下游(3’)的核酸序列的條件?!坝薪M成型活性的啟動子”或它在植物或植物細胞中是“組成型的”因此是指在所述植物或植物細胞中在大多數(shù)組織(或器官)的大多數(shù)生理和發(fā)育條件下能轉(zhuǎn)錄的核酸序列。“對一種或多種生物和/或非生物脅迫不敏感”的啟動子或者其活性“在暴露一種或多種生物和/或非生物脅迫條件下不降低”的啟動子是指在正常生理或發(fā)育條件下具有啟動子活性的核酸序列,并且由此當生物和/或非生物脅迫施于包含所述啟動子的生物體(如植物)、細胞、組織或器官的時候所述活性不降低或者至少不顯著降低?!懊{迫”是指物理、化學或生物來源的作用在植物或植物細胞上的條件或壓力,它可以引起植物的產(chǎn)量降低和/或質(zhì)量下降但對植物不是致死的。“非脅迫條件”在本文中指生理和發(fā)育正?;蜃罴训臈l件?!吧锩{迫”是指由生物的(活的)因素例如真菌、病毒、泡桐叢枝病類菌原體(mycoplasmalikeorganism)、昆蟲、細菌、線蟲等(即特別是植物昆蟲和病原體)引起的脅迫。“非生物脅迫”是指由非生物的(無生命的)因素例如溫度脅迫(冷/冰凍、熱)、鹽度(鹽)、風、金屬、晝長(光周期)、水分脅迫(例如過少或過多的水,即干旱、脫水、漬水等)、創(chuàng)傷、輻射等引起的脅迫。本文使用的術語“可操作地連接”是指多聚核苷酸元件之間以一種功能關系的連接。當核酸與另一核酸序列處于功能關系時該核酸是“可操作地連接的”。例如,若啟動子或轉(zhuǎn)錄調(diào)節(jié)序列影響編碼序列的轉(zhuǎn)錄,則它們可操作地連接至該編碼序列。可操作連接意思是被連接的DNA序列通常是鄰接的,并且在需要把兩個蛋白編碼區(qū)域連接時,是鄰接且在一個閱讀框內(nèi)的,從而產(chǎn)生“嵌合蛋白”。“嵌合蛋白”或“雜合蛋白”是由多種蛋白“結構域”(或基序)構成的蛋白,這類蛋白自身在自然界中并不存在,而是被連接形成的功能蛋白,它展現(xiàn)出被連接的結構域(例如DNA結合域或引起顯性負性功能的功能阻遏域)的功能性。嵌合蛋白還可以是天然存在的兩種或多種蛋白的融合蛋白。本文使用的術語“結構域”意思是具有特定結構或功能的蛋白的任何部分或結構域,該蛋白的所述部分或結構域可以被轉(zhuǎn)移至另一種蛋白用于提供至少具有所述結構域的功能特征的新的雜合蛋白。術語“靶向肽”指把蛋白靶向至胞內(nèi)細胞器例如質(zhì)體(優(yōu)選葉綠體、線粒體)或者至細胞外間隙(分泌信號肽)的氨基酸序列。編碼靶向肽的核酸序列可以與編碼蛋白氨基末端(N-末端)的核酸序列融合(在閱讀框內(nèi))?!昂怂針嫿w”或“載體”在本文可理解為使用重組DNA技術產(chǎn)生并用于把外源DNA送遞至宿主細胞的人造核酸分子。載體骨架可以是例如雙元或超雙元載體(例如參見US5,591,616、US2002138879和WO95/06722)、共整合載體或T-DNA載體(這是本領域已知的并且如本文其他部分所述),其中整合有嵌合基因,或者,若已存在合適的轉(zhuǎn)錄調(diào)節(jié)序列/啟動子,則僅所需合適序列(如編碼序列、反義序列或反向重復序列)被整合于該轉(zhuǎn)錄調(diào)節(jié)序列/啟動子的下游。載體通常包含有利于將其用于分子克隆的另外的遺傳元件,例如可選擇標記、多克隆位點等等(見下文)?!八拗骷毎薄ⅰ爸亟M宿主細胞”或“轉(zhuǎn)化的細胞”是指將至少一種核酸分子引入所述細胞出現(xiàn)的新個體細胞(或生物體)的術語,所述核酸分子尤其包含編碼需要的蛋白的嵌合基因或者包含在轉(zhuǎn)錄時產(chǎn)生沉默靶基因/基因家族的反義RNA或反向重復RNA(或發(fā)夾RNA)的核酸序列。所述宿主細胞優(yōu)選是植物細胞,但也可以是細菌細胞、真菌細胞(包括酵母細胞)等等。所述宿主細胞可以包含作為染色體外(附加型)復制分子的核酸構建體,或者更優(yōu)選地包含整合進入宿主細胞的核基因組或質(zhì)體基因組中的嵌合基因。術語“可選擇標記”是本領域普通技術人員熟悉的術語,并且在本文是描述當其被表達的時候可以用于選擇包含所述可選擇標記的一種或多種細胞的任何遺傳實體??蛇x擇標記基因產(chǎn)物賦予例如抗生素抗性或者更優(yōu)選除草劑抗性或其他可選擇的性狀,例如表型特征(例如色素沉著的變化)或營養(yǎng)需求。術語“報告物”主要用于指可見的標記物例如綠色熒光蛋白(GFP)、eGFP、螢光素酶、GUS等等。術語基因或蛋白的“直系同源物(ortholog)”在本文中是指在另一個物種中存在的同源基因或蛋白,它與所述基因或蛋白有相同的功能,但是(通常)從含有所述基因的物種分化的時間點開始出現(xiàn)序列的分化(即從共同祖先通過物種形成演化的基因)。因此可以同時基于序列比較(例如基于整條序列或特定區(qū)域的序列同一性百分比)和功能分析在其他植物種中識別一個植物種的基因的直系同源物。術語“同源的”和“異源的”是指核酸或氨基酸序列與其宿主細胞或生物體之間的關系,特別是在轉(zhuǎn)基因生物體的情況下。因此同源序列可以在宿主細胞中天然存在(例如用番茄基因轉(zhuǎn)化的番茄植物),而異源序列不會在宿主細胞中天然存在(如用馬鈴薯植物的序列轉(zhuǎn)化的番茄植物)。根據(jù)上下文所述術語“同源”或“同源的”可以替代地指來自共同祖先序列的序列(例如它們可以是直系同源物)?!皣栏耠s交條件”可以用于鑒定核苷酸序列,它與給定核苷酸序列基本一致。雜交條件的嚴格度是序列依賴的并且在不同的環(huán)境中會有差異。通常,選擇在確定的離子強度和pH下較具體序列的熱熔點(Tm)低約5℃的嚴格條件。Tm是(在確定的離子強度和pH下)50%的靶序列雜交到完全匹配探針的溫度。選擇典型的嚴格條件,其中在pH7下鹽濃度約為約0.02摩,溫度不低于60℃。降低鹽濃度和/或增加溫度可提高嚴格度。RNA-DNA雜交(使用例如100個核苷酸的探針的RNA印跡法)的嚴格條件為例如包含于63℃在0.2XSSC中至少洗滌一次,每次20分鐘,或者與之等價的條件。DNA-DNA雜交(使用例如100個核苷酸的探針的RNA印跡法)的嚴格條件為例如包含于至少50℃(通常約55℃)的溫度下在0.2XSSC中洗滌至少一次(通常2次),每次20分鐘,或者與之等價的條件。亦見Sambrooketal.(1989)和SambrookandRussell(2001)?!靶蛄型恍浴焙汀靶蛄邢嗨菩浴蓖ㄟ^使用全局或局部比對算法(取決于這兩個序列的長度)比對兩個肽或兩個核苷酸序列可以確定。相似長度的序列優(yōu)選使用在全長上獲得序列最佳比對的全局比對算法(例如NeedlemanWunsch)比對,而大體上不同長度的序列優(yōu)選使用局部比對算法(例如SmithWaterman)比對。如果序列(通過使用例如默認參數(shù)的程序GAP或BESTFIT的最佳比對時)共有至少某一最低限度的序列同一性(在下文中定義)百分數(shù)時,那么可以認為它們是“大體一致的”或“基本相似的”。GAP使用Needleman和Wunsch全局比對算法在其整個長度(全長)上比對兩個序列,它使匹配的數(shù)目最大化并使空位的數(shù)目最小化。全局比對適宜在兩個序列具有相似長度時確定序列的同一性。通常使用GAP的默認參數(shù),其空位產(chǎn)生罰分=50(核苷酸)/8(蛋白),空位擴展罰分=3(核苷酸)/2(蛋白)。對核苷酸而言,使用的默認打分矩陣是nwsgapdna,而對蛋白而言,默認打分矩陣是Blosum62(Henikoff&Henikoff,1992,PNAS89,915-919)。序列比對和序列同一性百分數(shù)得分的確定可通過使用計算機程序例如軟件包GCGWisconsin(版本10.3,從AccelrysInc.,9685ScrantonRoad,SanDiego,CA92121-3752USA獲得),或者使用開放源碼軟件例如版本2.10.0的EmbossWIN中的程序“needle”(使用全局NeedlemanWunsch算法)或“water”(使用局部SmithWaterman算法)可以確定序列比對和序列同一性百分數(shù)的值,使用的是與上文GAP相同的參數(shù)或者是默認設置(同時適用于“needle”和“water”并且同時適用于蛋白和DNA比對,默認空位開放罰分是10.0,且默認空位擴展罰分是0.5;蛋白的默認打分矩陣是Blossum62,DNA的是DNAFull)。如果序列大體上具有不同的總長度,優(yōu)選局部比對例如使用SmithWaterman算法。或者,可以通過使用FASTA、BLAST等算法搜索公共數(shù)據(jù)庫確定相似性或同一性的百分數(shù)。在該文本及其權利要求書中,動詞“包含”及其變化形式使用其非限制含義,意為包括該詞之后接著的條目,但是并不排除沒有明確指出的條目。另外,用不定冠詞“a(一)”或“an(一種)”提及要素并不排除存在超過一種所述要素的可能性,除非文中清楚地要求有且僅有一種該要素。不定冠詞“a(一)”或“an(一種)”因此通常指“至少一種”。還需要理解,如果在本文中提及“序列”通常是指具有某個亞基(例如氨基酸)序列的現(xiàn)存的實體分子。每當提及制備根據(jù)本發(fā)明的一種“植物”或“多種植物”(或數(shù)種植物)的時候,需要理解的是,除非另外指出,在本文中還包括植物部分(細胞、組織或器官、種子、切除或收獲的部分、葉、幼苗、花、花粉、果實、莖、根、胼胝體、原生質(zhì)體等等)、保留其親本區(qū)別性特征(例如存在轉(zhuǎn)基因)的植物的子代或克隆繁殖例如通過自交或雜交獲得的種子(例如雜種種子(通過兩個自交的親本系雜交獲得))、雜交植物及來源于它們的植物部分。具體實施例方式在西班牙的田間試驗中測試含CaMV35S啟動子(單35S啟動子,在Francketal.,1980,Cell21,285-294中有記載)的轉(zhuǎn)基因植物,發(fā)現(xiàn)所述35S啟動子的活性受夏季高溫的影響。在較老的葉中出現(xiàn)表達的完全喪失。因此,本發(fā)明人啟動了這樣一種分離植物啟動子的計劃,所述植物啟動子在植物細胞和器官中有組成型活性,并且基本上對一種或多種生物和/或非生物脅迫不敏感,原因在于這樣的啟動子有希望用于控制核酸序列在轉(zhuǎn)基因植物特別是在其發(fā)育過程中或在成熟時會暴露于一種或多種脅迫條件的植物中的表達。使用cDNA-AFLP從番茄植物分離了強的且組成型啟動子的基因,該啟動子在脅迫條件例如干旱脅迫、冷脅迫、熱脅迫、病原體脅迫(CMV感染)、晝長變化、輻射(如UV誘導的脅迫)、水脅迫(過多或過少的水)等等下其保持強的、組成型的轉(zhuǎn)錄特征(見實施例)。通過分離相應的啟動子,發(fā)現(xiàn)一類在植物中進行(或能夠進行)強的、組成型表達的啟動子。所述啟動子強度至少與所述CaMV35S啟動子的強度相當并且在某些宿主物種(番茄)中顯著地高于所述CaMV35S啟動子的強度。此外,當包含所述啟動子的植物或植物部分處于多種生物和/或非生物脅迫條件下時,所述啟動子的活性不出現(xiàn)降低(即保持強的且組成型的)。這些啟動子在本文中被稱為“AA6啟動子”。核酸序列、嵌合基因和載體在一個實施方案中提供在植物細胞中具有啟動子活性的分離的核酸序列(優(yōu)選基因組DNA序列或合成DNA序列),所述核酸序列在植物和植物組織或器官中顯示強的、組成型轉(zhuǎn)錄活性。所述啟動子優(yōu)選在所有植物器官(至少在主要器官)中都是有活性的,并且所述啟動子強度至少基本上等于(或者大于)35S的強度(所述CaMV35S啟動子由Francketal.記載,見上文)。當轉(zhuǎn)基因植物或者植物組織或器官受到一種或多種非生物和/或生物脅迫時,所述核酸序列的啟動子活性優(yōu)選不降低或至少不顯著降低。在該方面顯著降低是指啟動子活性與相同組織或器官在非脅迫條件下的活性相比在統(tǒng)計上顯著(量的)降低1%或更多(例如2%、3%、5%、10%等,上限至100%)。因此,在脅迫條件下所述啟動子優(yōu)選保持是強的和組成型的(優(yōu)選在所有器官中,特別是至少在主要植物器官中)。在一個實施方案中提供了組成型AA6啟動子,它含有SEQIDNO1(“3kb”啟動子)或SEQIDNO2(“5kb”啟動子)、SEQIDNO6-9的任一個(SEQIDNO6和8是“3kb”啟動子而SEQIDNO7和9是“5kb”啟動子,與SEQIDNO1和2相比它們具有某些核苷酸的二義性(ambiguity)或者稍有不同的序列)、克隆進pKG8135(CBS120175)或pKG8137(CBS120176)的啟動子序列或者這些序列任一條的活性(功能)片段,所述活性(功能)片段至少在植物中具有啟動子活性,例如SEQIDNO1或2、SEQIDNO6-9或者pKG8135(CBS120175)或pKG8137(CBS120176)中的啟動子的至少200、300、400、500、600、800、900、1000、1200、1500、2000、2500、2800、2900、3000、3500、4000、4500或更多的連續(xù)核苷酸?!盎钚云巍被颉肮δ芷巍被蛘摺熬哂袉幼踊钚缘钠巍敝傅暮怂崞文軌蛟谥参锛毎?、器官和植物中,優(yōu)選至少在與SEQIDNO1和2、SEQIDNO6-9或者pKG8135(CBS120175)或pKG8137(CBS120176)中的啟動子的相同組織和器官中進行組成型轉(zhuǎn)錄。這可以通過下文描述的方法測試,即通過把這樣一個片段(優(yōu)選可操作連接有一個報告基因)轉(zhuǎn)化植物細胞,并定性(空間-時間的轉(zhuǎn)錄)和/或定量地測定所述啟動子活性。本文中提及SEQIDNO1時,需要了解還提及了SEQIDNO6或8的任一條,或者pKG8135(CBS120175)中存在的序列,并且該句可以被解讀為指這些啟動子序列的任一條。類似地,本文中提及SEQIDNO2時,需要了解還提及了SEQIDNO7或9的任一條,或者pKG8137(CBS120175)中存在的序列,并且該句可以被解讀為指這些啟動子序列的任一條。在一個實施方案中,啟動子片段的強度在量上基本等于或高于SEQIDNO1和/或2的強度(并且因此基本等于或高于35S的強度)。由于SEQIDNO1和2是緊接翻譯起始密碼子(mRNA上的AUG或DNA上的ATG)上游的序列,所以優(yōu)選通過刪除SEQIDNO1和/或2的5’端產(chǎn)生活性片段。因此所述片段優(yōu)選包含SEQIDNO1或2的3’區(qū)域的至少200個、300個、400個、500個等的核苷酸(如上文)。顯而易見地,DNA片段可以通過多種途徑例如使用從頭DNA合成、限制性內(nèi)切酶或末端核酸酶等產(chǎn)生。然而,除去某些順式作用元件(例如增強子序列)可能導致啟動子活性降低。因此在一個不同的實施方案中,所述啟動子片段的強度在量上低于SEQIDNO1和/或2的強度(并且因此也低于35S的強度)。對于某些應用優(yōu)選強度降低的啟動子。本領域技術人員使用本領域已知的方法可以容易地確定所述全長啟動子和任何啟動子片段的活性,并且可以與35S或者與本文提供的啟動子比較強度和組織特異性。例如Medberry等人(PlantCell,1992,Vol.4185-192)記載了使用短暫表達測定比較啟動子強度的方法。SEQIDNO1和2的啟動子及其功能片段優(yōu)選地對于可能暴露于包含所述啟動子的植物或植物的一種或多種細胞、組織或器官的至少一種(但優(yōu)選多種,最優(yōu)選任一種)生物和/或非生物脅迫是不敏感的(見下文)。因此在暴露于脅迫條件下活性保持為組成型的和強的。本發(fā)明還提供上述AA6啟動子的“變體”以及這些變體的功能片段。這些變體包括與SEQIDNO1和/或SEQIDNO2基本類似的核酸序列(以及這些變體序列的功能片段,如上述),并且它們具有組成型啟動子的活性即能夠在植物、植物細胞、組織或器官(最優(yōu)選至少在與SEQIDNO1和2的相同組織和器官)中提供組成型轉(zhuǎn)錄。與SEQIDNO1和/或2“基本類似”的序列是與SEQIDNO1和/或與SEQIDNO2(在全長上)有至少約50、55、60、65、70、75、80、85、90、95、96、97、98、99%或更高的核酸序列同一性、并且在植物或植物細胞中有啟動子活性的核酸序列,測定核酸序列同一性使用的是Needleman和Wunsch兩兩比對(GCG的程序“GAP”或Embosswin的“needle”,版本2.10.0),且空位產(chǎn)生罰分=50、空位擴展罰分=3。在一個優(yōu)選的實施方案中,所述變體(和功能片段)的活性在所有的組織和器官中都是強的,即在量上至少相當于(或強于)SEQIDNO1或2。在另一個實施方案中,這些變體(及其功能片段)的活性對一種或多種生物和/或非生物脅迫是不敏感的,即保持是強的和組成型的。多種方法例如核酸雜交、PCR技術、計算機(insilico)分析和核酸合成等很明顯可以用于識別、合成或分離本文提供的核酸序列的變體或功能片段。例如,核酸雜交可用于識別其他植物物種或變種中的DNA序列,它們在嚴格的或中度嚴格的雜交條件下與SEQIDNO1或2或者它們的片段雜交?;蛘?,可以使用已知算法例如BLAST、FASTA等就變體序列對序列數(shù)據(jù)庫進行計算機搜索。以這種方式從番茄的其他植物種或變種或者同時從其他生物體分離變體序列是可行的。本文特別包括在番茄的其他變種或在其他植物種特別是茄屬的種(將在下文中描述)發(fā)現(xiàn)的相同基因的其他等位基因(胞質(zhì)半胱氨酸合酶基因及其同系同源物)的啟動子。例如,可以從一個或多個植物種、一個或多個變種或者一個物種或變種的不同組織構建cDNA文庫??梢詮乃鯿DNA文庫篩選半胱氨酸合酶cDNA(使用例如源自SEQIDNO4(番茄半胱氨酸合酶cDNA)或者其片段或變體的探針或引物)。同樣,可以使用差異顯示方法(例如cDNA-AFLP)來識別半胱氨酸合酶轉(zhuǎn)錄物,如實施例中所述。TAIL-PCR(Liuetal.1995,Genomics25(3)674-81;Liuetal.2005,MethodsMolBiol.286341-8)、Linker-PCR或反向PCR(IPCR)等方法可以用于分離所述基因的上游轉(zhuǎn)錄調(diào)節(jié)區(qū)。可以使用多種方法確定核酸序列(或變體的片段)是否具有組成型啟動子活性即是否能夠在所有器官中進行組成型轉(zhuǎn)錄,所述活性是否是“強的”,以及所述核酸序列的活性是否對轉(zhuǎn)基因細胞、組織、器官或生物體(特別是植物或植物細胞)會暴露的至少一種(但更優(yōu)選多種,最優(yōu)選任一種)生物和/或非生物脅迫是敏感的。通??梢苑譃槎ㄐ苑椒ê投糠椒ā6ㄐ苑椒?例如組織GUS染色)用于確定所述啟動子的空間-時間的活性(在某個組織或器官中,或者在某些環(huán)境/發(fā)育條件下,所述啟動子是否具有活性?),而定量方法(例如熒光GUS測定)還與對照比較將所述活性水平定量。合適的對照是例如以空載體轉(zhuǎn)化的植物(陰性對照)、以包含CaMV35S等其他啟動子的構建體轉(zhuǎn)化的植物或者未轉(zhuǎn)化的植物。為了測定并任選地定量相對或絕對活性,克隆的核酸分子或合成的核酸分子例如SEQIDNO1、2或其變體或者它們?nèi)我粭l的片段可以被可操作地連接至已知的核酸序列(例如gusA等報告基因或者編碼具體蛋白的任一基因)上,并且使用已知方法用于轉(zhuǎn)化植物細胞。在某些實施方案中,所述細胞不需要以穩(wěn)定的方式轉(zhuǎn)化,即可以使用短暫表達測定(例如原生質(zhì)體轉(zhuǎn)染或農(nóng)桿菌滲入法)確定所述啟動子在所述細胞、組織或器官中是否有活性以及所述啟動子驅(qū)動轉(zhuǎn)錄的程度。所述啟動子的活性例如可以通過檢測下游核酸序列的RNA轉(zhuǎn)錄物的水平測定(以及可選擇地定量)。這可以使用定量方法例如定量RT-PCR或其他基于PCR的方法等實現(xiàn)?;蛘?,可以測定并定量所述報告蛋白或其活性。例如,如果所述報告基因是gus基因,那么可以如實施例中所述使用熒光GUS測定。以這種方式,處于正常生理(非脅迫)條件下的轉(zhuǎn)化植物或植物細胞的定量啟動子活性水平可以與暴露于一種或多種生物或非生物脅迫的植物或植物細胞的水平比較。而且,相對或絕對活性水平可以與組成型對照啟動子例如35S啟動子、雙35S啟動子或者SEQIDNO1和/或2比較。應理解優(yōu)選地使用統(tǒng)計學方法確定平均啟動子活性水平并對其進行比較。因此,在某一時間根據(jù)本發(fā)明的啟動子在哪些組織或器官是有活性的(空間-時間活性)測試可例如通過用啟動子-報告基因構建體轉(zhuǎn)化植物或植物細胞,并分析各組織在各個發(fā)育階段的RNA轉(zhuǎn)錄物或報告蛋白(或其活性)。一項簡單的測試使用例如組織化學GUS染色,從而通過對藍色的視覺評估來指示在各種組織中以及在各個發(fā)育階段的活性。如前述,所述啟動子活性優(yōu)選是組成型的,并且還優(yōu)選在植物和植物細胞特別是在引入所述序列的宿主物種或變種中是強的。組成型活性是指可操作地連接有所述啟動子的任何核酸序列的轉(zhuǎn)錄物優(yōu)選在大多數(shù)組織(或器官)中在大多數(shù)(正常、非脅迫)生理和發(fā)育條件下都產(chǎn)生。在一個實施方案中,根據(jù)本發(fā)明的啟動子至少在實施例中測試的組織或器官例如葉(嫩葉和老葉)、根、花、種子、莖(主莖)、果實(例如幼果和成熟果實)、發(fā)芽的種子等中是有活性的。優(yōu)選地,根據(jù)本發(fā)明的啟動子在所有植物物種(雙子葉物種和單子葉物種)中都提供強的、組成型活性。例如,已經(jīng)發(fā)現(xiàn)SEQIDNO1和SEQIDNO2在多種植物種例如番茄、煙草、蕓苔、甜瓜和萵苣中提供強的組成型表達(見實施例)。在其驅(qū)動連接于其下游(3,)的核酸序列表達的能力方面,可以使用多種已知方法定量地確定根據(jù)本發(fā)明的AA6啟動子(包括片段或變體)的強度(定量的活性)。例如可以使用定量RT-PCR或RNA印跡法定量轉(zhuǎn)錄的轉(zhuǎn)錄物(mRNA)的量。優(yōu)選地,所述啟動子強度在正常(非脅迫)條件下至少基本等于CaMV35S(Francketal.,見上文)的強度。因此“強的”是指所述啟動子強度優(yōu)選至少大約等于,但更優(yōu)選強于35S在正常的、非脅迫的條件下的強度。最優(yōu)選地,在多種組織和器官中的平均量的啟動子活性至少等于CaMV35S啟動子的活性,或者高于CaMV35S啟動子平均活性至少5%、10%、20%、30%、35%、40%、45%、50%、55%、60%、70%、75%或更多。應理解應比較相同拷貝數(shù)和配型水平的轉(zhuǎn)化體例如半合子轉(zhuǎn)基因或純合子轉(zhuǎn)基因。優(yōu)選地,鑒定并比較單拷貝的轉(zhuǎn)化體。在脅迫條件、至少選自于本文其他部分描述的一種或多種脅迫下,所述AA6啟動子的表達保持是強組成型的。因此,根據(jù)本發(fā)明的啟動子的強度在以下條件下保持基本不變或者至少不降低(或不顯著地降低)含有所述啟動子的植物組織或器官或者植物暴露于至少選自以下一個優(yōu)選幾個脅迫條件干旱脅迫、熱脅迫、水脅迫(水過多和水過少兩種)、病原體脅迫(例如CMV等病毒感染、真菌感染、細菌感染等)、昆蟲脅迫(例如昆蟲咬食)、創(chuàng)傷、鹽脅迫、輻射脅迫等。另外,定量測定可以用于確定所述強度。例如,可以把含有所述啟動子的重組植物從正常的溫度環(huán)境轉(zhuǎn)移至溫暖的環(huán)境(例如約27℃至最高約50℃)中,并且在各種組織中所述啟動子的活性可以與在正常溫度下和在溫暖溫度條件下的相同組織中的活性比較。上述AA6啟動子的變體還包括植物半胱氨酸合酶基因特別是胞質(zhì)半胱氨酸合酶基因的任何分離核酸啟動子(即編碼半胱氨酸合酶的植物基因的啟動子,特別是胞質(zhì)同源異構體),它在植物中顯示強的和組成型活性并且對于一種或多種生物和/或非生物脅迫優(yōu)選是基本上不敏感的。如上文所述,其他的植物半胱氨酸合酶基因也可能具有強組成型啟動子,在一種或多種脅迫條件下,該啟動子保持組成型表達。植物半胱氨酸合酶基因是編碼半胱氨酸合酶的基因,該酶也被稱為O-乙酰基-L-絲氨酸[硫醇]-裂合酶(O-acetyl-L-serine[thiol]-lyase)(EC4.2.99.8)。雖然已經(jīng)克隆了數(shù)個半胱氨酸合酶基因(見例如TC162833,參見實施例),但是沒有描述它們的啟動子在驅(qū)動同源或異源序列在轉(zhuǎn)基因植物中強組成型表達中的有效性。因此可以分離這些已知或未知的半胱氨酸合酶基因的啟動子并就其活性進行篩選。例如,cDNA-AFLP、其他基于PCR的方法或RNA印跡雜交可以用于分離或識別其他的半胱氨酸合酶基因特別是那些內(nèi)源地并組成型地產(chǎn)生半胱氨酸合酶mRNA的基因,并且也處于一種或多種脅迫條件下。然后選擇那些具有需要表達模式的半胱氨酸合酶基因并可以使用已知方法克隆它們的啟動子。在一個優(yōu)選的實施方案中,啟動子獲自植物的半胱氨酸合酶基因,該植物屬于茄科(Solanaceae)例如茄屬(Solanum)(包括重新分類的番茄(Lycopersicon)屬種)、煙草屬(Nicotiana)、辣椒屬(Capsicum)、碧冬茄屬(Petunia)、咖啡屬(coffea)等的種。根據(jù)本發(fā)明的啟動子優(yōu)選不是雜草植物例如擬南芥的啟動子,并且優(yōu)選不是Gutierrez-Alcala等人(J.ofExp.Botany56,p24872494)中所記載的擬南芥的OASA1基因的啟動子或其片段。除了SEQIDNO4中提供的半胱氨酸合酶基因(編碼SEQIDNO5的半胱氨酸合酶)之外,可以鑒別其他的半胱氨酸合酶基因并分離它們的啟動子。可以使用如上文所述的多種方法。因此,在本發(fā)明的一個實施方案中,提供了植物(胞質(zhì))半胱氨酸合酶基因的啟動子,它在植物和/或植物細胞中具有組成型活性,藉此,當所述植物或植物細胞、組織或器官暴露于一種或多種例如上描述的生物和/或非生物脅迫時,所述活性不降低或者不顯著地降低。這些啟動子包含(a)獲自植物并且驅(qū)動植物半胱氨酸合酶基因表達的任何啟動子,特別是編碼蛋白SEQIDNO5的任何基因的啟動子;(b)那些編碼與SEQIDNO5有至少30、40、50、60、70、80、90、95、99%或更多的氨基酸同一性(在全長上)的半胱氨酸合酶的植物基因的啟動子;(c)驅(qū)動核酸序列表達的植物啟動子,該核酸序列編碼半胱氨酸合酶,并且由此與SEQIDNO4有至少30、40、50、60、70、80、90、95、98、99%或更多的核苷酸序列同一性(在全長上)。在另一個實施方案中,提供了植物半胱氨酸合酶基因的啟動子用于同源或異源的核酸序列在重組細胞或生物體(特別是植物細胞或植物)中組成型過量表達的用途。該用途包含將所述啟動子可操作地連接于一條同源或異源的核酸序列并且轉(zhuǎn)化植物或植物細胞,如上文所述。雖然上文聚焦于根據(jù)本發(fā)明的啟動子在植物和植物細胞中的用途,但是使用啟動子在其它細胞和生物體例如細菌、真菌(包括酵母例如畢赤酵母屬、漢森酵母屬等)、哺乳動物、人的細胞或細胞系等任何原核或真核細胞或生物體中表達同源或異源的核酸序列也是本發(fā)明的實施方案。根據(jù)本發(fā)明的嵌合基因和載體在本發(fā)明的一個實施方案中,具有啟動子活性的任何上述的核酸序列用于制備嵌合基因和包含這些嵌合基因的載體,這些載體用于把所述嵌合基因轉(zhuǎn)移至宿主細胞中,并且在宿主細胞例如源自一種或多種轉(zhuǎn)化細胞的細胞、組織、器官或整個生物體中表達可操作地連接的同源或異源的核酸序列。宿主細胞優(yōu)選是植物細胞。任何植物例如單子葉植物或雙子葉植物都可以是合適的宿主,所述植物例如玉米(maize/corn)(玉蜀黍?qū)?Zea)的種例如玉米(Z.mays)、大芻草(Z.diploperennis)(chapule)、繁茂大芻草(Zealuxurians)(危地馬拉大芻草)、Zeamays亞種huehuetenangensis(SanAntonioHuista大芻草)、墨西哥玉米(Z.mayssubsp.mexicana)(墨西哥大芻草)、Z.mays亞種parviglumis(巴爾薩斯大芻草(Balsasteosinte))、Z.perennis(多年生大芻草)和Z.ramosa)、小麥(小麥屬的種)、大麥(barley)(例如大麥(Hordeumvulgare))、燕麥(oat)(例如燕麥(Avenasativa))、高粱(sorghum)(高粱(Sorghumbicolor))、黑麥(rye)(黑麥(Secalecereale))、大豆(soybean)(大豆屬(Glycine)的多個種例如大豆(G.max))、棉花(棉屬的種例如陸地棉、海島棉)、蕓苔屬的多個種(例如甘藍型油菜、芥菜、甘藍、蕪青等)、向日葵(sunflower)(向日葵(Helianthusannus))、煙草(煙草屬的種)、苜蓿(alfalfa)(紫花苜蓿(Helianthusannus))、稻(稻屬的種例如秈稻栽培種或日本稻蝗栽培種)、牧草、珍珠粟(pearlmillet)(狼尾草屬的種例如珍珠粟(Pennisetumglaucum))、樹類物種、蔬菜類物種例如番茄屬(Lycopersicon)的亞種(最近被重新分類為茄屬),如番茄(tomato)(普通番茄(L.esculentum),異名番茄(Solanumlycopersicum))例如櫻桃番茄、變種cerasiforme或現(xiàn)代番茄(currenttomato)、變種pimpinellifolium或樹番茄(treetomato)(S.betaceum,異名樹番茄(Cyphomandrabetaceae))、馬鈴薯(potato)(馬鈴薯(Solanumtuberosum))和其他茄屬物種例如茄子(eggplant)(茄子(Solanummelongena))、人參果(pepino)(人參果(S.muricatum))、cocona(S.sessiliflorum)和naranjilla(S.quitoense);辣椒類(peppers)(辣椒(Capsicumannuum)、小米椒(Capsicumfrutescens))、豌豆(pea)(例如豌豆(Pisumsativum))、菜豆(bean)(例如菜豆屬(Phaseolus)的種)、胡蘿卜(carrot)(胡蘿卜(Daucuscarota))、萵苣屬的種(例如萵苣(Lactucasativa)、山萵苣(Lactucaindica)、宿根萵苣(Lactucaperennis))、黃瓜(cucumber)(黃瓜(Cucumissativus))、甜瓜(melon)(甜瓜(Cucumismelo))、西葫蘆(zucchini)(西葫蘆(Cucurbitapepo))、南瓜(squash)(筍瓜(Cucurbitamaxima)、西葫蘆(Cucurbitapepo)、灰籽南瓜(Cucurbitamixta))、圓橙南瓜(pumpkin)(西葫蘆(Cucurbitapepo))、西瓜(watermelon)(西瓜(Citrulluslanatus),異名西瓜(Citrullusvulgaris))、肉質(zhì)果的物種(葡萄、桃、李、草莓、芒果、甜瓜)、觀賞植物的物種(例如玫瑰、碧冬茄屬、菊屬、百合、郁金香、大丁草屬的種)、木本樹(例如楊屬、柳屬、櫟屬、桉屬的種)、纖維植物例如亞麻(flax)(亞麻(Linumusitatissimum))和大麻(hemp)(大麻(Cannabissativa))。在一個實施方案中優(yōu)選蔬菜類物種特別是茄屬的種(包括番茄屬的種)。因此,可以轉(zhuǎn)化例如以下屬的種南瓜屬(Cucurbita)、玫瑰屬(Rosa)、葡萄屬(Vitis)、胡桃屬(Juglans)、草莓屬(Fragaria)、百脈根屬(Lotus)、苜蓿屬(Medicago)、驢食草屬(Onobrychis)、三葉草屬(Trifolium)、胡盧巴屬(trigonella)、豇豆屬(Vigna)、柑桔屬(Citrus)、亞麻屬(Linum)、老鸛草屬(Geranium)、木薯屬(Manihot)、胡蘿卜屬(Daucus)、鼠耳芥屬(Arabidopsis)、蕓苔屬(Brassica)、蘿卡屬(Raphanus)、白芥屬(Sinapis)、顛茄屬(Atropa)、辣椒屬(Capsicum)、曼陀羅屬(Datura)、黃瓜屬(Cucumis)、莨菪屬(Hyoscyamus)、番茄屬(Lycopersicon)、茄屬(Solanum)、煙草屬(Nicotiana)、蘋果屬(Malus)、碧冬茄屬(Petunia)、毛地黃屬(Digitalis)、Majorana、菊苣屬(Ciahorium)、向日葵屬(Helianthus)、萵苣屬(Lactuca)、雀麥屬(Bromus)、西瓜屬(Citrullus)、天門冬屬(Asparagus)、金魚草屬(Antirrhinum)、Heterocallis、Nemesis、天竺葵屬(Pelargonium)、黍?qū)?Panieum)、狼尾草屬(Pennisetum)、毛莨屬(Ranunculus)、千里光屬(Senecio)、智利喇叭花屬(Salpiglossis)、紫水晶屬(Browaalia)、大豆屬(Glycine)、豌豆屬(Pisum)、菜豆屬(Phaseolus)、棉屬(Gossypium)、大豆屬(Glycine)、黑麥草屬(Lolium)、羊茅屬(Festuca)、剪股穎屬(Agrostis)。另一個優(yōu)選是南瓜屬(Cucurbita)、蕓苔屬(Brassica)、番茄屬(Lycopersicon)、茄屬(Solanum)、稻屬(Oryza)和玉蜀黍?qū)?Zea)中的每個成員。一個優(yōu)選是燕麥屬(Avena)、苜蓿屬(Medicago)、辣椒屬(Capsicum)、煙草屬(Nicotiana)、萵苣屬(Lactuca)、豌豆屬(Pisum)、黃瓜屬(Cucumis)、南瓜屬(Cucurbita)、蕓苔屬(Brassica)、茄屬(Solanum)(包括番茄屬(Lycopersicon))、稻屬(Oryza)和玉蜀黍?qū)?Zea)中的每個成員。嵌合基因的構建以及用于把嵌合基因?qū)胨拗骷毎幕蚪M的載體的構建是本領域普遍公知的。為了形成嵌合基因,使用標準的分子生物學技術,將AA6啟動子序列可操作地連接至另一條待在宿主細胞中轉(zhuǎn)錄的核酸序列。所述啟動子序列可以已經(jīng)存在于載體中,從而將待轉(zhuǎn)錄的核酸序列簡單地插入到所述載體中所述啟動子序列的下游。然后,所述載體用于轉(zhuǎn)化宿主細胞,并且所述嵌合基因優(yōu)選被插入到核基因組或質(zhì)體基因組、線粒體基因組或葉綠體基因組中,從而由于所述啟動子的活性使得下游核酸序列被表達(例如,McBrideetal.,1995Bio/Technology13,362;US5,693,507)。因此,嵌合基因優(yōu)選包含上述的AA6啟動子,所述啟動子可操作地連接有同源或異源的核酸序列,并且后面任選有3’非翻譯核酸序列(3’UTR)。所述同源或異源的核酸序列可以是編碼蛋白或肽的序列,或者它可以是能被轉(zhuǎn)錄成活性RNA分子的核酸序列,所述活性RNA分子例如適合于在宿主細胞或生物體中沉默基因或基因家族的正義和/或反義RNA(dsRNA)。通過常規(guī)的方式可以將包含AA6啟動子的嵌合基因穩(wěn)定地插入到單個的植物細胞的核基因組中,并且這種轉(zhuǎn)化植物細胞可通過常規(guī)的方式用于產(chǎn)生由于所述嵌合基因組成型表達導致表型改變的轉(zhuǎn)化植物。在這方面,在根癌農(nóng)桿菌(Agrobacteriumtumefaciens)中的T-DNA載體(包含可操作地連接有另一條核酸序列的AA6啟動子(或者如上述的變體或片段))可用于轉(zhuǎn)化植物細胞,并且之后使用例如在EP0116718、EP0270822、PCT公開文本W(wǎng)O84/02913和公布的歐洲專利申請EP0242246中以及在Gouldetal.(1991,PlantPhysiol.95,426-434)中記載的方法可以從所述轉(zhuǎn)化的植物細胞再生成轉(zhuǎn)化植物。用于農(nóng)桿菌介導的植物轉(zhuǎn)化的T-DNA載體的構建是本領域公知的。所述T-DNA載體可以是如EP0120561和EP0120515中所記載的雙元載體或者是可以通過同源重組整合進農(nóng)桿菌Ti-質(zhì)粒中的共整合載體(如EP0116718中的描述)。每個優(yōu)選的T-DNA載體都包含可操作連接有待轉(zhuǎn)錄的核酸序列的AA6啟動子,所述啟動子位于T-DNA邊界序列之間,或者至少位于其右邊界序列的左邊。邊界序列在Gielenetal.(1984,EMBOJ3,835-845)中有記載。當然,其他類型的載體也可以通過例如以下的方法用于轉(zhuǎn)化植物細胞直接基因轉(zhuǎn)移(例如在EP0223247中記載的,或者如US2005/055740和WO2004/092345中記載的粒子轟擊或微粒轟擊)、花粉介導的轉(zhuǎn)化(例如在EP0270356和WO85/01856中記載的)、例如在US4,684,611中記載的原生質(zhì)體轉(zhuǎn)化、植物病毒介導的轉(zhuǎn)化、脂質(zhì)體介導的轉(zhuǎn)化(例如在US4,536,475中記載的)以及其他方法例如那些用于轉(zhuǎn)化某些玉米系(如US6,140,553;Frommetal.,1990,Bio/Technology8,833-839;Gordon-Kammetal.,1990,ThePlantCell2,603-618)和稻系(Shimamotoetal.,1989,Nature338,274-276;Dattaetal.1990,Bio/Technology8,736-740)的記載方法,以及一般用于轉(zhuǎn)化單子葉植物的方法(WO92/09696)。對棉花轉(zhuǎn)化亦見WO00/71733,對稻轉(zhuǎn)化亦見WO92/09696、WO94/00977和WO95/06722中記載的方法。對高粱轉(zhuǎn)化亦見例如JeoungJMetal.2002,Hereditas13720-8或ZhaoZYetal.2000,PlantMolBiol.44789-98。對番茄或煙草轉(zhuǎn)化亦見AnG.etal.,1986,PlantPhysiol.81301-305;HorschR.B.etal.,1988,PlantMolecularBiologyManualA5,Dordrecht,Netherlands,KluwerAcademicPublishers.第1-9頁;KoornneefM.etal.,1986,NevinsD.J.andR.A.Jones編著,TomatoBiotechnology,NewYork,NY,USA,AlanR.Liss,Inc.第169-178頁。類似地,從轉(zhuǎn)化細胞選擇并再生轉(zhuǎn)化植物是本領域公知的。很明顯,對于不同物種和甚至單個物種的不同變種或栽培種,可以具體地調(diào)整方案以用于高頻地再生轉(zhuǎn)化體。除核基因組的轉(zhuǎn)化外,本發(fā)明還包括質(zhì)體基因組(優(yōu)選葉綠體基因組)的轉(zhuǎn)化。質(zhì)體基因組轉(zhuǎn)化的一個優(yōu)點是可以減少所述轉(zhuǎn)基因擴散的風險。質(zhì)體基因組轉(zhuǎn)化可以按本領域的公知進行,例如見SidorovVAetal.1999、PlantJ.19209-216或LutzKAetal.2004,PlantJ.37(6)906-13??梢詫⑦@樣產(chǎn)生的轉(zhuǎn)化植物用于常規(guī)的植物育種方案中以產(chǎn)生更多的包含轉(zhuǎn)基因的轉(zhuǎn)化植物。使用例如DNA印跡分析、基于PCR的方法或Technology測試(ThirdWaveTechnologies,Inc.)可以選擇單拷貝轉(zhuǎn)化體。通過所述嵌合基因的存在可以容易地從非轉(zhuǎn)換的細胞或植物中區(qū)分出轉(zhuǎn)化的細胞或植物。還可以將所述轉(zhuǎn)基因的插入位點兩側(cè)的植物DNA序列測序,從而可以開發(fā)一種用于常規(guī)使用的“事件特異性”檢測方法。見例如WO01/41558,它記載了基于例如整合序列和側(cè)翼(基因組)序列的突出事件檢測試劑盒(eliteeventdetectionkit)(例如PCR檢測試劑盒)。在一個實施方案中,將待轉(zhuǎn)錄并任選待翻譯的(如果它為編碼序列)核酸序列插入到植物基因組中,因此待轉(zhuǎn)錄的序列在合適的3’端轉(zhuǎn)錄調(diào)節(jié)信號(“3’端”)(即轉(zhuǎn)錄物形成和多腺苷酸化信號)的上游(即5’)。多腺苷酸化和轉(zhuǎn)錄物形成信號包括胭脂堿合成酶基因(“3’nos”)(Depickeretal.,1982J.Molec.Appl.Genetics1,561-573)、章魚堿合成酶基因(“3’ocs”)(Gielenetal.,1984,EMBOJ3,835-845)和T-DNA基因7(“3’基因7”)(VeltenandSchell,1985,NucleicAcidsResearch13,6981-6998)的多腺苷酸化和轉(zhuǎn)錄物形成信號,所述信號在轉(zhuǎn)化的植物細胞中作為3’-非翻譯DNA序列等等。在一個優(yōu)選的實施方案中,使用的3’端序列是植物半胱氨酸合酶基因的3’端序列,并且還優(yōu)選所述半胱氨酸合酶基因有AA6啟動子。本文提供的合適的3’端序列是SEQIDNO3或其片段或變體。SEQIDNO3的變體包括的核酸序列與SEQIDNO3有至少50、60、65、70、75、80、85、90、95、98、99%或更大的核酸序列同一性。SEQIDNO3的片段或SEQIDNO3變體的片段包括的核酸序列含有SEQIDNO3或SEQIDNO3變體的至少50、100、150、200、250、300或更多的連續(xù)核苷酸。這些3’端序列也是本文的實施方案,并且可以用于構建任何的嵌合基因和載體,即還與不同的啟動子組合。待表達核酸序列在一個實施方案中是編碼蛋白或肽(包括雜合蛋白或肽或者融合蛋白)的序列。所述編碼序列可以是任何來源的,即可以來源于植物、真菌(包括酵母)、動物、細菌、合成、病毒等等。它還可以包含編碼靶向肽例如分泌信號肽或質(zhì)體靶向信號的序列。編碼序列還可以在閱讀框內(nèi)連接至編碼選擇性或顯示性標記的基因例如賦予卡那霉素抗性的neo(或nptII)基因(EP0242236)等,從而細胞表達的融合蛋白可以容易地被檢測到。雖然可以使用任何基因的編碼區(qū)(cDNA或基因組DNA),但是以下基因的編碼區(qū)的實例優(yōu)選可操作地連接至根據(jù)本發(fā)明的AA6啟動子1.病毒核酸序列的反向重復序列(例如病毒外殼蛋白基因的正義和反義序列;亦見下文);2.疾病信號轉(zhuǎn)導通路基因或疾病抗性基因;3.非生物脅迫反應相關基因(例如SHINE轉(zhuǎn)錄因子或CBF/DREB基因);4.次級代謝物生物合成基因,包括用于生產(chǎn)治療產(chǎn)物的基因和/或藥理學重要的產(chǎn)物的基因,或者有產(chǎn)業(yè)價值的化合物的基因。明顯地,其他基因例如影響農(nóng)藝性狀的基因(例如有除草劑抗性的基因(例如EPSPS基因、bar或PAT基因)、影響產(chǎn)量或質(zhì)量性質(zhì)的基因(例如蛋白組成)等等)也可以可操作地連接至本發(fā)明的AA6基因。根據(jù)本發(fā)明的嵌合基因或載體還可以用于轉(zhuǎn)化微生物例如細菌(例如大腸埃希氏菌(Escherichiacoli)、假單胞菌(pseudomonas)、農(nóng)桿菌(Agrobacterium)、芽胞桿菌(Bacillus)等)、真菌、藻類或昆蟲,或者所述基因或載體可以用于操作病毒。用本發(fā)明的、整合進合適的克隆載體的核酸序列轉(zhuǎn)化細菌可以以常規(guī)的方式進行,優(yōu)選使用如Maillonetal.(1989,F(xiàn)EMSMicrobiol.Letters60,205-210)和WO90/06999中所記載的常規(guī)電穿孔技術。對于編碼序列在原核宿主細胞中的表達,可以相應優(yōu)化所述核酸序列的密碼子選擇(類似地,對于編碼序列在植物細胞中的表達,可以根據(jù)公知優(yōu)化所述核酸序列的密碼子選擇)。應該去除內(nèi)含子序列,并且為優(yōu)化表達可以根據(jù)公知進行其他的調(diào)整。為了在單子葉植物例如草種(例如玉米或稻)中獲得增強的核酸序列的表達,可將內(nèi)含子優(yōu)選單子葉植物的內(nèi)含子加入到嵌合基因中。例如,已經(jīng)顯示將玉米Adh1基因的內(nèi)含子插入5’端調(diào)節(jié)區(qū)會增強在玉米中的表達(Calliset.al.,1987,GenesDevelop.11183-1200)。類似地,US5,859,347中記載的HSP70內(nèi)含子可用于增強表達。因此,一個或多個內(nèi)含子可以可選地插入至根據(jù)本發(fā)明的任何啟動子序列中,或者至5’UTR或編碼序列中。在另一個實施方案中,AA6啟動子用于制備用于基因沉默的嵌合基因和載體,從而將所述啟動子可操作地連接至靶基因(待沉默的內(nèi)源基因或基因家族)的正義和/或反義核酸序列。在又一個實施方案中,靶基因還可以是侵入植物病原體例如病毒的基因或基因家族。例如,病毒外殼蛋白基因的反向重復序列可以用于制備病毒抗性植物。病毒外殼蛋白基因例如在WO96/21031中記載的?!盎虺聊笔侵敢粋€或多個靶基因的基因表達下調(diào)或完全抑制。抑制性RNA用于減少或消除基因表達在本領域中已經(jīng)是公知,并且是多篇綜述的主題(例如Baulcombe,1996,PlantCell81833-1844;Stametal.,1997,PlantJournal1263-82;DepickerandVanMontagu,1997,Curr.OpinionCellBiol.9373-382)。大量可用的技術可以完成植物中的基因沉默,例如產(chǎn)生靶基因全部或部分的反義RNA的嵌合基因(見例如EP0140308B1、EP0240208B1和EP0223399B1)或產(chǎn)生正義RNA的嵌合基因(也被稱為共抑制),見EP0465572B1。然而迄今為止最成功的方法是同時產(chǎn)生靶基因的正義和反義RNA(“反向重復序列”),它在細胞中形成雙鏈RNA(dsRNA)并沉默一個或多個靶基因。dsRNA產(chǎn)生和基因沉默用方法和載體在EP1068311、EP983370A1、EP1042462A1、EP1071762A1和EP1080208A1中有記載。根據(jù)本發(fā)明的載體因此可以包含可操作地連接有靶基因的正義和/或反義DNA片段的AA6啟動子。靶基因序列的短(正義和反義)片段例如編碼或非編碼序列的至少約17、18、19、20、21、22、23、24或25個核苷酸可能是足夠的。還經(jīng)常使用更長例如至少約100、200、250、300、400、500、1000、1500個核苷酸或更長的序列。優(yōu)選地,正義和反義片段被一條間隔序列例如內(nèi)含子分開,在形成dsRNA雙鏈時它形成環(huán)(或發(fā)夾)。靶基因的任何一段都可以用于制備基因沉默的載體和轉(zhuǎn)基因植物,在所述植物中所述靶基因或基因家族被沉默。產(chǎn)生發(fā)夾構建體的一種方便的方法是使用pHANNIBAL和pHELLSGATE等通用載體、基于技術的載體(見Wesleyetal.2004,MethodsMo1Biol.265117-30;Wesleyetal.2003,MethodsMolBiol.236273-86和Helliwell&Waterhouse2003,Methods30(4)289-95),所有這些文獻通過引用的方式納入本文。通過選擇靶基因的保守核酸序列,可以在宿主植物中沉默基因家族的成員。如果靶基因是侵入病原體的基因或基因家族,那么所述病原體的靶基因?qū)怀聊⑶宜鲋参飳λ霾≡w有抗性。本文還包括包含AA6啟動子的轉(zhuǎn)基因植物,該啟動子可操作地連接至靶基因核酸序列的正義和/或反義DNA片段,并且所述植物表現(xiàn)出靶基因沉默表型。所述表型將依賴于基因的功能,并且可以是肉眼可見或不可見的化學或分子變化。這些嵌合基因和載體因此也可以用于確定或驗證基因的功能。根據(jù)本發(fā)明的嵌合基因可以穩(wěn)定地引入到宿主的基因組中,或者可以作為附加體單元存在。根據(jù)本發(fā)明的轉(zhuǎn)基因細胞和生物體本文提供了通過上文的方法獲得的轉(zhuǎn)基因細胞和生物體特別是植物、植物細胞、組織或器官。這些細胞和生物體的特征在于在它們的細胞或基因組中存在嵌合基因,在于存在根據(jù)本發(fā)明的AA6啟動子。另外,mRNA轉(zhuǎn)錄物或翻譯的蛋白可以改變細胞或生物體例如植物細胞或植物的表型。雖然AA6啟動子是組成型的,但是其在基因組中的位置可以影響所述啟動子的活性以及所述嵌合基因的表達水平。因此,可以通過例如分析拷貝數(shù)(DNA印跡分析)、mRNA轉(zhuǎn)錄物水平(例如RNA印跡分析或RT-PCR)或者通過分析所述核酸序列編碼的蛋白的存在和水平(例如蛋白印跡分析后的SDS-PAGE;ELISA測定、免疫細胞學測定等)選擇表達高的、組成型水平蛋白或正義和/或反義轉(zhuǎn)錄物(當使用沉默構建體的時候)的轉(zhuǎn)化體(“事件”或“轉(zhuǎn)化事件”)。還可以測試所述轉(zhuǎn)化體在一種或多種生物和/或非生物脅迫條件下的表達穩(wěn)定性,并可就其它用途識別和選擇那些在一種或多種需要的條件下保持高的、組成型表達的事件??梢詫⑺鲛D(zhuǎn)基因植物用于傳統(tǒng)育種方法例如雜交、自交、回交等中。通過所述轉(zhuǎn)化體的自交可以產(chǎn)生所述轉(zhuǎn)基因的純合植物。育種方法是本領域公知的并且在植物育種的標準教科書例如Allard,R.W.,PrinciplesofPlantBreeding(1960)NewYork,NY,Wiley,第485頁;Simmonds,N.W.,PrinciplesofCropImprovement(1979),London,UK,Longman,第408頁;Sneep,J.etal.,(1979)BreedingofVegetableCrops(第135-171頁)TomatoBreeding、MarkJ.Basset編者(1986),TheTomatocropascientificbasisforimprovement、Atherton,J.G.&J.Rudich編著,PlantBreedingPerspectives(1986);Fehr,PrinciplesofCultivarDevelopment—TheoryandTechnique(1987)NewYork,NY,MacMillan中有記載。還可以將轉(zhuǎn)基因細胞或生物體用于細胞培養(yǎng)中(植物細胞培養(yǎng)、細菌或真菌細胞培養(yǎng)例如酵母培養(yǎng)、人或哺乳動物細胞培養(yǎng)、昆蟲細胞培養(yǎng))例如用于大規(guī)模產(chǎn)生重組蛋白。在一個實施方案中提供了細胞培養(yǎng)物,它包含含有根據(jù)本發(fā)明的AA6啟動子的細胞。根據(jù)本發(fā)明的方法和用途本文還提供一種用于制備轉(zhuǎn)基因植物或植物細胞的方法,包含以下的步驟(a)產(chǎn)生含有根據(jù)本發(fā)明的AA6啟動子和/或AA63’UTR的嵌合基因或載體,所述AA6啟動子和/或AA63’UTR可操作地連接有待表達的核酸序列;(b)用所述嵌合基因或載體轉(zhuǎn)化植物或植物細胞;并且,任選地,(c)再生成一株或多株轉(zhuǎn)基因植物。而且,可以識別符合以下條件的轉(zhuǎn)基因植物在非脅迫條件下提供強的、組成型的啟動子活性,并且當所述植物暴露于一種或多種生物和/或非生物脅迫時所述啟動子活性保持基本不變(至少不降低或不顯著地降低)。可以將所述植物用于常規(guī)的農(nóng)業(yè)和育種方法中。具體地,可以在以下的環(huán)境中培養(yǎng)它們而不降低其所述啟動子的活性使所述植物處于一種或多種生物和/或非生物脅迫條件下。因此,可提供一種方法用于把轉(zhuǎn)基因植物培養(yǎng)在例如以下的區(qū)域而所述啟動子活性不降低或者至少不顯著地降低具有高溫或低溫、強風、高鹽、高土壤污染物、高水平或低水平的水、干旱時段(droughtspell)的區(qū)域;高疾病或昆蟲壓力、高輻射等的區(qū)域。序列SEQIDNO1“3kb”(2986bp)AA6啟動子SEQIDNO2“5kb”(5000bp)AA6啟動子SEQIDNO3番茄半胱氨酸合酶基因(AA6基因)的3’UTRSEQIDNO4番茄半胱氨酸合酶cDNA(AA6cDNA)SEQIDNO5SEQIDNO4編碼的蛋白(番茄胞質(zhì)半胱氨酸合酶)SEQIDNO6具有一些二義性核苷酸的“3kb”AA6啟動子SEQIDNO7具有一些二義性核苷酸的“5kb”AA6啟動子SEQIDNO8pKG8135的“3kb”AA6啟動子,重新測序并且在大腸埃希氏菌保藏種CBS120175中SEQIDNO9pKG8137的“5kb”AA6啟動子,重新測序并且在大腸埃希氏菌保藏種CBS120176中附圖圖1pKG1562的載體圖譜圖2pKG1700的載體圖譜圖3pKG8135、pKG8136和pKG8137的載體圖譜。如下的非限制實施例描述了根據(jù)本發(fā)明的AA6啟動子的用途。除非在實施例中另外聲明,否則所有重組DNA技術都是按照在Sambrooketal.(1989)MolecularCloningALaboratoryManualSecondEdition,ColdSpringHarborLaboratoryPress和SambrookandRussell(2001)MolecularCloningALaboratoryManual第3版,ColdSpringHarborLaboratoryPress,NY中,以及在Ausubeletal.(1994)CurrentProtocolsinMolecularBiology,CurrentProtocols,USA的第1和2卷中記載的標準方法完成。用于植物分子實驗的標準材料和方法在R.D.D.Croy的、由BIOSScientificPublicationsLtd(UK)和BlackwellScientificPublications,UK共同出版的PlantMolecularBiologyLabfax(1993)中有記載。實施例實施例1-材料和方法使用cDNA對普通番茄變種(Lycopersiconesculentum)Moneyberg進行差異表達分析。對普通番茄變種(Lycopersiconesculentum)Moneyberg進行脅迫條件下的表達測試。使用載體pKG8136、pKG8137和pKG1700在煙草(Nicotianatabacum)變種SR1和普通番茄變種RZ52201進行轉(zhuǎn)化。依照以下參考文獻中的記載進行植物轉(zhuǎn)化番茄和煙草轉(zhuǎn)化AnG.,B.D.WatsonandC.C.Chiang.1986.Transformationoftobacco,tomato,potato,andArabidopsisthalianausingabinaryTivectorsystem.PlantPhysiol.81301-305。煙草轉(zhuǎn)化HorschR.B.,J.Fry,N.Hoffman,J.Neidermeyer,S.G.RogersandR.T.Fraley.1988.Leafdisctransformation.PlantMolecularBiologyManualA5.Dordrecht,Netherlands,KluwerAcademicPublishers.第1-9頁。番茄轉(zhuǎn)化KoornneefM.,M.Jongsma,R.Weide,P.ZabelandJ.Hille.1986.Transformationoftomato.NevinsD.J.andR.A.Jones,eds.TomatoBiotechnology.NewYork,NY,USA,AlanR.Liss,Inc.第169-178頁。使用來自CLONTECHLaboratoriesInc.的SMARTRACEcDNA擴增試劑盒進行5’和3’端RACE。通過來自InvitrogenBV的OriginalTA試劑盒使用質(zhì)粒2.1進行PCR產(chǎn)物的克隆。通過BaseClear(P.O.Box1336,2302BH,Leiden,TheNetherlands)進行DNA測序。轉(zhuǎn)化載體整合進入根癌農(nóng)桿菌(Agrobacteriumtumefaciens)變種GV2260中。使用組織GUS測定進行啟動子活性的定性分析用含Xgluc底物的磷酸緩沖液(1mg/ml的5-溴-4-氯-吲哚基葡萄糖苷酸、40mM的K2HPO4、10mM的KH2PO4,pH7.4)在大氣氧的存在下于37℃將各種植物部分攪拌孵育過夜。通過用乙醇重復洗滌使所述樣品脫色。非轉(zhuǎn)基因植物作為陰性對照。使用熒光GUS測定進行啟動子活性的定量分析從嫩葉材料制備總蛋白樣品;從每株測試植物的不同部分收集大小和發(fā)育階段基本相同的葉片來制備樣品。在磷酸緩沖液(77.4mM的Na2HPO4、22.6mM的NaH2PO4)中使用金屬珠將新鮮葉片材料磨碎,然后離心并收集上清。熒光GUS測定使用來自MolecularProbes,Inc.的NanoOrange試劑盒測定每種上清液的一等份中的蛋白濃度。將蛋白樣品稀釋以標準化總蛋白濃度。將各等份的蛋白樣品與底物4-甲基傘形酮酰-β-d-葡萄糖醛酸苷(4-methyl-umbelliferyl-β-d-glucuronide,MUG)(終濃度為1mg/ml)于37℃孵育過夜。在0時間和孵育過夜后進行熒光測定除去各等份的反應混合物,并加入Na2CO3溶液(終濃度為1.1M)以終止反應,然后測定355nm激發(fā)引起的460nm下的發(fā)射光。實施例2選擇用于分離啟動子的基因使用(VolkmuthW.,etal.,2003,Genome-WideAnalysisoftheArabidopsisTranscriptome,OMICS,7,2;Vos,P.andStanssensP.,2002,AFLP-basedtranscriptprofiling,CurrentProtocolsinMolecularBiology,unit25B.5.,Ausubel,F(xiàn).M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.Smith,J.A.,Struhl,K.,JohnWileyandSons,NewYork;和Vosetal.,1995,AFLPanewtechniqueforDNAfingerprinting,NucleicAcidsResearch234407-4414)對來自各種發(fā)育階段的番茄植物材料(嫩葉、老葉、莖、根、離體葉、離體莖、離體根、胼胝體、未成熟和成熟綠色果實、轉(zhuǎn)紅期果實、紅色果實、花、總苗)的cDNA進行差異分析。使用所有可能的Taq1/Mse1引物結合Taq1引物的兩個選擇性核苷酸和Mse1引物的三個選擇性核苷酸產(chǎn)生表達譜。接著使用KeygeneN.V.專用軟件(Improve)產(chǎn)生基因片段表達譜并存儲于數(shù)據(jù)庫中。選擇了12種Taq1/Mse1引物組合對應的13種候選轉(zhuǎn)錄物,它們在所有取樣的組織中都顯示了強的、組成型的表達。然后在生物和非生物脅迫的各種組織中通過測定候選基因的表達。三周齡的番茄植物(Moneyberg)在以下的各個脅迫條件下培養(yǎng)14天黃瓜花葉病毒(CMV)感染、高溫(白天37℃,晚上25℃)、低溫(白天10℃,晚上5℃)、干旱脅迫(維持植物不死亡的最少量的水,白天37℃,晚上25℃)和收獲前2天的創(chuàng)傷(用鑷子弄碎葉)。收集以下的材料嫩葉、老葉、莖、根和花芽。從這些材料制備cDNA,并且使用用擴增所述13種選擇的候選轉(zhuǎn)錄物(引物序列見下文)所需的相同引物組合(并且還使用與少有的選擇性核苷酸的引物組合)進行差異分析。選擇了7種在所有上述脅迫條件下都持續(xù)有強的、組成型的表達的轉(zhuǎn)錄物。擴增半胱氨酸合酶基因(AA6)片段的(+2/+2)AFLP引物的引物序列是將所述候選cDNAAFLP片段從凝膠中切下、純化、克隆并測序。然后將所述序列信息用于設計RACEPCR的引物。進行5’和3’端SMART-RACE-PCR(Clontech)以產(chǎn)生所述7個候選基因的延伸基因片段,把它們克隆到pCR2.1(Invitrogen)中并且隨后進行測序(BaseClear,P.O.Box1336,2302BH,Leiden,TheNetherlands)。用來自公共數(shù)據(jù)庫的同源EST裝配延伸的基因片段。這產(chǎn)生了5個候選基因的全長cDNA片段。用10種不同限制性內(nèi)切酶消化的番茄基因組DNA并以cDNA的5’端片段作為探針使用DNA印跡法對所述5個基因進行拷貝計數(shù)的評估。相同探針也與已有的MoneybergBAC庫(KeygeneN.V.)雜交。其中一條全長cDNA(命名為IS158-53;SEQIDNO4)表現(xiàn)出與番茄胞質(zhì)半胱氨酸合酶基因(番茄|TC162833。UP|Q9FS27(Q9FS27)同源物)很高的同源性。TC162833和SEQIDNO4都編碼相同的氨基酸序列(SEQIDNO5),但兩個核苷酸在核酸水平有差異。SEQIDNO4的位置207的核苷酸“C”在TC162833中為“T”,而SEQIDNO4的位置372的核苷酸“A”在TC162833中為“G”。即使在生物和非生物脅迫條件下SEQIDNO4也是組成型表達的,它在番茄基因組中以低拷貝數(shù)(約2個拷貝)存在并且與KeygeneN.V.番茄BAC庫的BAC9很好地雜交,從而進行其啟動子的分離。如下文所述,選擇其全長cDNA與番茄半胱氨酸合酶基因(SEQIDNO4)同源的基因的啟動子。實施例3AA6啟動子序列的分離以來自BAC9的基因組DNA為模板用針對命名為半胱氨酸合酶的番茄基因的衍生序列而設計的引物(引物序列見下文)進行接頭PCR(linkerPCR)。獲得半胱氨酸合酶UTR的5’和3’序列。使用Moneyberg番茄的基因組DNA作為模板,通過長片段PCR(longrangePCR)獲得3’UTR序列(SEQIDNO3)。針對半胱氨酸合酶序列設計的引物對啟動子5′-GTTCGATGAGGACACTCTCGC-3及巢式引物5′-CAATTAAAGTTGCTAAGCGTCCTGA-3′對終止子5′-TCAGTTACATCCTTGGCAATTCC-3′及巢式引物5′-CAGAGAACATGACTGTGGAGCC-3′實施例4轉(zhuǎn)化載體的構建半胱氨酸合酶5’上游區(qū)域的兩個AA6啟動子DNA的片段(一條為5000bp(SEQIDNO2),另一條為2986bp(SEQIDNO1))與gusA編碼區(qū)一塊被連接到具有內(nèi)源性半胱氨酸合酶終止子(SEQIDNO3)或nos終止子的質(zhì)粒pKG1562(載體骨架,包含胭脂堿合酶啟動子驅(qū)動的nptII)中。所述構建體被命名為pKG8135,包含(見圖3)2986bp的半胱氨酸合酶5’上游區(qū)域(SEQIDNO1)gusA3’nospKG8136包含(見圖3)5000bp的半胱氨酸合酶5’上游區(qū)域(SEQIDNO2)gusA3’nospKG8137包含(見圖3)5000bp的半胱氨酸合酶5’上游區(qū)域(SEQIDNO2)gusA3’半胱氨酸合酶(SEQIDNO3)使用如下的一種對照構建體(見圖2)pKG1700,包含CaMV35S啟動子(Francketal.,同上)gusA3’nos使用的轉(zhuǎn)化載體的載體圖譜詳見圖1-3。將質(zhì)粒pKG8135、pKG8136、pKG8137和pKG1700引入至根癌農(nóng)桿菌中。在卡那霉素選擇下轉(zhuǎn)化并再生煙草(變種SR1)和番茄(變種RZ52201),并且培養(yǎng)原代再生物(T0)以結籽。實施例5轉(zhuǎn)化體的表達分析由于在這些載體中gusA的表達受AA6啟動子或CaMV35S啟動子驅(qū)動,在植物中產(chǎn)生的β-D-葡糖醛酸糖苷酶(GUS)水平指示所述啟動子的效力。使用5-溴-4-氯-吲哚基葡萄糖苷酸(XGluc)作為底物進行確定GUS存在的組織染色測定。對煙草和番茄T1植物(從原代轉(zhuǎn)化體自交得到)的從幼苗到開花植物之中的多個發(fā)育階段對葉組織進行染色實驗。另外,在成熟煙草和番茄系的一系列材料包括花芽、開的花、花柱(煙草)、花柄、頂端分生組織芽、葉、葉柄、主莖、根、種子和果實(番茄)上以及在萌發(fā)的種子和幼苗進行GUS的組織染色實驗。當gusA被AA6啟動子的長片段(SEQIDNO2)或短片段(SEQIDNO1)或者CaMV35S啟動子驅(qū)動的時候,在煙草和番茄的所有測試的組織中檢測GUS的表達。視覺(染色顏色)對比表明了AA6啟動子片段與CaMV35S啟動子在煙草和番茄中的表現(xiàn)是相同的。以4-甲基傘形酮酰-β-d-葡萄糖醛酸苷(MUG)為底物使用熒光測定進行GUS表達的定量分析。在煙草和番茄的嫩葉中均比較5000bp片段AA6啟動子(pKG8137)驅(qū)動的GUS表達與CaMV35S啟動子(pKG1700)驅(qū)動的GUS表達。使用DNA印跡法選擇單拷貝的植物;使用HindIII限制性內(nèi)切酶消化來自煙草和番茄植物的基因組DNA并以nptII片段作為探針,使用XbaI作為限制性內(nèi)切酶重復該過程。由于每個T-DNA插入物包含各一個拷貝的nptII和gusA,nptII的拷貝數(shù)可反映gusA的拷貝數(shù)。還通過使用測定(ThirdWaveTechnologies,Inc.)確定拷貝數(shù),所述測定檢測nptII基因的存在情況以及與已知的番茄或煙草內(nèi)對照相比nptII基因的相對量;把該測定用于T1代可以區(qū)分半合子個體和純合子個體。從pKG8137和pKG1700的半合子和純合子單拷貝轉(zhuǎn)化體以及煙草和番茄植物的零拷貝對照制備總蛋白提取物。使用NanoOrangeTM試劑盒(MolecularProbes)測定蛋白含量,然后通過用提取緩沖液稀釋將所述樣品中的蛋白濃度標準化。在加入MUG底物后測定初始熒光(355nm的激發(fā)濾光片;460nm的發(fā)射濾光片)。然后孵育樣品并且測定由甲基傘形酮(MU)斷裂產(chǎn)生的熒光。計算孵育的每小時熒光的增加。形成了顯示GUS酶(Sigma-AldrichChemieB.V.)在非轉(zhuǎn)基因煙草或番茄總蛋白提取物(等于測試樣品的總蛋白含量)的背景中的活性的校正曲線。通過樣品的熒光數(shù)據(jù)和校正曲線計算GUS酶在轉(zhuǎn)基因測試樣品中的濃度(mU/mg的總蛋白提取物)。重復實驗的統(tǒng)計分析表明,在純合子單拷貝植物中,在煙草中AA6啟動子(pKG8137)與CaMV35S啟動子驅(qū)動的GUS表達水平?jīng)]有顯著不同,而在番茄中,由AA6啟動子引起的GUS表達比由CaMV35S啟動子引起的表達高達最高至79%(數(shù)據(jù)系列在下文表中顯示)。GUS在煙草中的表達表1每個半合子煙草植物品系的平均GUS活性(表示為mU/mg的總植物蛋白提取物)及其均值的標準差和標準誤(SEM)。表2每個純合子煙草植物品系的平均GUS活性(表示為mU/mg的總植物蛋白提取物)及其均值的標準差和標準誤(SEM)。如我們可以看到的,在轉(zhuǎn)基因煙草葉(轉(zhuǎn)基因的半合子植物和純合植物兩者)中AA6啟動子(5kb啟動子)的平均啟動子活性基本上等于35S啟動子的啟動子活性。GUS在番茄中的表達表3每個半合子番茄植物品系的平均GUS活性(表示為mU/mg的總植物蛋白提取物)及其均值的標準差和標準誤(SEM)。表4每個純合番茄植物品系的平均GUS活性(表示為mU/mg的總植物蛋白提取物)及其均值的標準差和標準誤(SEM)。如可以在表4中看到的,AA6啟動子(5kb啟動子)在番茄中的平均啟動子活性比35S啟動子在轉(zhuǎn)基因番茄葉(轉(zhuǎn)基因的半合子植物和純合植物兩者)中的啟動子活性顯著高(以35S的活性為標準,在數(shù)據(jù)系列1中,高約52%,在數(shù)據(jù)系列2中,高約79%)。實施例6在其他植物種中的啟動子活性已經(jīng)試驗并驗證了AA6和CaMV35S啟動子在其他植物中驅(qū)動的GUS表達的比較。用驅(qū)動轉(zhuǎn)基因表達的AA6啟動子測試的物種列表包括(除了上文所示的煙草和番茄之外)萵苣、甜瓜和蕓苔,在它們每個之中都表現(xiàn)了組成型的表達。實施例7“3kb”和“5kb”AA6啟動子的重新測序重新測序載體pKG8135和pKG8137(圖3)中存在的核酸序列以檢查序列并辨別二義性。在SEQIDNO6(“3kb”啟動子)和SEQIDNO7(“5kb”啟動子)的序列列表中標出了二義性的位置,其中還鑒定了在這些二義性的位置最可能的核苷酸(見下文的表)。由于核苷酸的二義性,所以存在最低限度的序列差異SEQIDNO1與SEQIDNO8和6分別有99.6%和99.7%的序列同一性(使用“needle”,空位開放=10.0,空位擴展=0.5;DNAFull矩陣)。SEQIDNO2與SEQIDNO9和7分別有99.6%和99.8%的序列同一性(使用“needle”,空位開放=10.0,空位擴展=0.5;DNAFull矩陣)。二義性和二義性的辨別序列表<110>KeyGeneNV<120>組成型植物啟動子<130>P6005193PCT1<150>PCT/NL2005/050083<151>2005-12-16<160>9<170>PatentInversion3.3<210>1<211>2986<212>DNA<213>番茄(Lycopersiconesculentum)<400>1<210>2<211>5000<212>DNA<213>番茄(Lycopersiconesculentum)<400>2<210>3<211>347<212>DNA<213>番茄(Lycopersiconesculentum)<400>3<210>4<211>975<212>DNA<213>番茄(Lycopersiconesculentum)<400>4<210>5<211>325<212>PRT<213>番茄(Lycopersiconesculentum)<400>5<210>6<211>2987<212>DNA<213>番茄(Lycopersiconesculentum)<220><221>misc_difference<222>(679)..(679)<223>W可能是T<220><221>misc_difference<222>(682)..(682)<223>W可能是A<220><221>misc_difference<222>(683)..(683)<223>W可能是T<220><221>misc_difference<222>(691)..(691)<223>插入A似乎是可行的<220><221>misc_difference<222>(864)..(864)<223>Y很可能是T<220><221>misc_difference<222>(1269)..(1269)<223>R很可能是A<220><221>misc_difference<222>(1559)..(1559)<223>R很可能是A<220><221>misc_difference<222>(1560)..(1560)<223>M很可能是C<220><221>misc_difference<222>(1561)..(1561)<223>D很可能是T<220><221>misc_difference<222>(1916)..(1916)<223>R很可能是A<220><221>misc_difference<222>(2085)..(2085)<223>Y很可能是T<220><221>misc_difference<222>(2101)..(2101)<223>Y很可能是C<220><221>misc_difference<222>(2463)..(2463)<223>Y很可能是T<220><221>misc_difference<222>(2526)..(2526)<223>A很可能被刪除<220><221>misc_difference<222>(2534)..(2534)<223>R很可能是G<220><221>misc_difference<222>(2681)..(2681)<223>K很可能是G<220><221>misc_difference<222>(2920)..(2920)<223>R很可能是A<400>6<210>7<211>5003<212>DNA<213>番茄(Lycopersiconesculentum)<220><221>misc_difference<222>(35)..(35)<223>插入G似乎是可行的<220><221>misc_difference<222>(240)..(240)<223>Y很可能是T<220><221>misc_difference<222>(768)..(769)<223>WY很可能是AT<220><221>misc_difference<222>(1558)..(1558)<223>R很可能是A<220><221>misc_difference<222>(1742)..(1742)<223>Y很可能是T<220><221>misc_difference<222>(2016)..(2016)<223>插入T似乎是可行的<220><221>misc_difference<222>(2695)..(2699)<223>WTGWW很可能是TTGAT<220><221>misc_difference<222>(2707)..(2707)<223>插入A似乎是可行的<220><221>misc_difference<222>(2880)..(2880)<223>Y很可能是T<220><221>misc_difference<222>(3285)..(3285)<223>R很可能是A<220><221>misc_difference<222>(3575)..(3577)<223>RMD很可能是ACT<220><221>misc_difference<222>(3932)..(3932)<223>R很可能是A<220><221>misc_difference<222>(4101)..(4101)<223>Y很可能是T<220><221>misc_difference<222>(4117)..(4117)<223>Y很可能是C<220><221>misc_difference<222>(4479)..(4479)<223>Y很可能是T<220><221>misc_difference<222>(4542)..(4542)<223>A很可能被刪除<220><221>misc_difference<222>(4550)..(4550)<223>R很可能是G<220><221>misc_difference<222>(4697)..(4697)<223>K很可能是G<220><221>misc_difference<222>(4936)..(4936)<223>R很可能是A<400>7<210>8<211>2986<212>DNA<213>番茄(Lycopersiconesculentum)<400>8<210>9<211>5002<212>DNA<213>番茄(Lycopersiconesculentum)<400>9權利要求1.一種包含整合于其基因組中的嵌合基因的轉(zhuǎn)基因植物、植物細胞或者植物組織或器官,其特征在于所述嵌合基因包含可操作地連接到同源或異源核酸序列上的組成型啟動子,其中所述啟動子選自于(a)SEQIDNO1或SEQIDNO2的核酸序列;(b)SEQIDNO1或SEQIDNO2的功能片段;(c)與SEQIDNO1或2有至少70%的序列同一性的核酸序列;(d)(c)的核酸序列的功能片段。2.根據(jù)權利要求1的植物、植物細胞、植物組織或器官,其中所述啟動子活性在所述植物、細胞、組織或器官暴露于一種或多種生物和/或非生物脅迫時不顯著降低。3.一條在引入植物細胞后具有啟動子活性的分離的核酸序列,其中所述核酸序列包含選自于以下的序列(a)SEQIDNO1或SEQIDNO2的核酸序列;(b)SEQIDNO1或SEQIDNO2的片段;(c)與SEQIDNO1或2有至少70%的序列同一性的核酸序列;(d)(c)的核酸序列的片段。4.根據(jù)權利要求1(b)或3(b)的片段,其中所述片段包含SEQIDNO1或SEQIDNO2的至少200個連續(xù)核苷酸。5.一種嵌合基因,所述嵌合基因包含與根據(jù)權利要求3或4的核酸序列可操作地連接的同源或異源的核酸序列以及任選的3’UTR序列。6.根據(jù)權利要求5的嵌合基因,其中所述3’UTR序列是SEQIDNO3、SEQIDNO3的片段或與SEQIDNO3有至少70%的序列同一性的核酸序列。7.一種載體,所述載體含有根據(jù)權利要求3或4的核酸序列或者根據(jù)權利要求5或6的嵌合基因。8.一種轉(zhuǎn)基因植物或植物細胞,所述植物或植物細胞含有根據(jù)權利要求5或6的嵌合基因。9.胞質(zhì)的植物半胱氨酸合酶基因的啟動子用于在轉(zhuǎn)基因植物、植物細胞或者植物組織或器官中組成型地表達正義和/或反義核酸序列的用途。10.根據(jù)權利要求9的用途,其中所述胞質(zhì)的植物半胱氨酸合酶基因編碼SEQIDNO5的蛋白。11.一種制備轉(zhuǎn)基因植物或植物細胞的方法,包含以下的步驟(a)形成根據(jù)權利要求5或6的嵌合基因或者根據(jù)權利要求7的載體;(b)用所述嵌合基因或載體轉(zhuǎn)化植物或植物細胞;以及,任選地,(c)再生成轉(zhuǎn)基因植物。12.一種分離的核酸分子,包含SEQIDNO3或4的核苷酸序列。全文摘要提供了在本文中稱為AA6啟動子的強組成型植物啟動子,該啟動子在生物和/或非生物脅迫條件下保持強組成型活性。還提供了含有AA6啟動子的轉(zhuǎn)基因細胞和生物體,具體是植物細胞和植物,以及使用AA6啟動子在細胞和生物體中表達核酸序列的方法。文檔編號C12N15/82GK101370939SQ200680052639公開日2009年2月18日申請日期2006年12月12日優(yōu)先權日2005年12月16日發(fā)明者M·T·J·德鮑思,N·E·M·克瓦埃德福里格,B·G·J·費爾蘭斯-昂斯騰克,L·K·瓦喬斯基申請人:關鍵基因公司