專(zhuān)利名稱(chēng):除草劑的靶基因和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及從鼠耳芥屬(Arabidopsis)分離的編碼幼苗生長(zhǎng)所必需的蛋白質(zhì)的基因?;谠摶?qū)τ谡IL(zhǎng)和發(fā)育的重要性,本發(fā)明還包括將這些蛋白質(zhì)用作除草劑靶標(biāo)的方法。本發(fā)明還可以用于鑒定是潛在除草劑的抑制劑的篩選方法。本發(fā)明還可以應(yīng)用于開(kāi)發(fā)除草劑耐受性植物、植物組織、植物種子和植物細(xì)胞。
應(yīng)用除草劑控制農(nóng)作物田間不需要的植物例如雜草幾乎已成為一種全球性手段。每年除草劑的銷(xiāo)售超過(guò)150億美元。盡管有這種廣泛應(yīng)用,但雜草的控制對(duì)于農(nóng)民而言仍然是一個(gè)重要而耗資很大的問(wèn)題。
除草劑的有效應(yīng)用需要合理的安排。例如,使用的時(shí)間和方法以及雜草植物的發(fā)育階段對(duì)于使用除草劑獲得良好的雜草控制是關(guān)鍵的。由于有多種雜草種類(lèi)可以抵抗除草劑,所以制備有效的新除草劑變得越來(lái)越重要。目前可以采用以重組DNA技術(shù)進(jìn)行的大批量篩選方法發(fā)現(xiàn)新的除草劑。植物的生長(zhǎng)和發(fā)育所必需的代謝酶可以通過(guò)標(biāo)準(zhǔn)分子生物學(xué)技術(shù)來(lái)重組制備,并作為除草劑的靶標(biāo)應(yīng)用于新的該酶活性抑制劑的篩選中。通過(guò)此篩選發(fā)現(xiàn)的新抑制劑然后可以用作除草劑控制不需要的植物。
不幸的是,表現(xiàn)出更大的效力、更廣的雜草范圍以及能夠更快地在土壤中降解的除草劑可能也具有更大的危害農(nóng)作物的植物毒性。該問(wèn)題的一個(gè)解決方法是開(kāi)發(fā)抵抗或耐受除草劑的農(nóng)作物。耐受除草劑的農(nóng)作物雜種或品體使得可以應(yīng)用這些除草劑來(lái)殺滅雜草而又不伴隨對(duì)農(nóng)作物造成傷害的危險(xiǎn)。耐受性的開(kāi)發(fā)能夠允許除草劑應(yīng)用于原先由于對(duì)該除草劑敏感而不能或限制性地(例如出苗前使用)使用該除草劑的農(nóng)作物上。例如,Anderson等的美國(guó)專(zhuān)利4,761,373針對(duì)多種咪唑啉酮或磺胺類(lèi)除草劑的抗性植物。一種改變的乙酰羥酸合成酶(AHAS)賦予了該抗性。Goodman等的美國(guó)專(zhuān)利4,975,374涉及到含有編碼突變的谷氨酰胺合成酶(GS)的基因的植物細(xì)胞和植物,這些植物細(xì)胞和植物抵抗已知抑制GS的除草劑例如膦絲菌素和甲硫氨酸磺基肟(methionine sulfoximine)的抑制。Bedbrook等的美國(guó)專(zhuān)利5,013,659針對(duì)表達(dá)突變的乙酰乳酸合成酶的植物,該酶使得該植物能夠抵抗磺酰脲除草劑的抑制。Somers等的美國(guó)專(zhuān)利5,162,602公開(kāi)了耐受環(huán)己烷二酮和芳氧基苯氧基丙酸除草劑抑制的植物。該耐受性由改變的乙酰輔酶A羧化酶(ACCase)賦予。
盡管有以上描述的進(jìn)展,但對(duì)于不需要或有害的植物生長(zhǎng)(例如雜草)仍存頑固性和亟待解決的問(wèn)題。而且,隨著人口的持續(xù)生長(zhǎng),將出現(xiàn)日愈增加的食品短缺。因此,對(duì)于尋找新的有效而經(jīng)濟(jì)的除草劑,存在一種長(zhǎng)期感受到但未滿足的需求。
為了清楚起見(jiàn),將本說(shuō)明書(shū)中使用到的某些術(shù)語(yǔ)定義和介紹如下嵌合的用以指DNA序列,例如載體或基因,是由一種以上不同來(lái)源的DNA序列組成的其中這些不同來(lái)源的DNA序列通過(guò)重組DNA技術(shù)融合在一起,形成一種天然不存在的,尤其是在待轉(zhuǎn)化的植物中不存在的DNA序列。
輔因子酶催化反應(yīng)中所必需的天然反應(yīng)物,例如有機(jī)分子或金屬離子。輔因子例如NAD(P)、核黃素(包括FAD和FMN)、葉酸、鉬蝶呤(molybdopterin)、硫胺素、生物素、硫辛酸、泛酸和輔酶A、S-腺苷甲硫氨酸、吡哆醛磷酸、輔酶Q、甲基萘醌類(lèi)。任選地,輔因子可以再生和重利用。
DNA改組DNA改組是一種快速容易并有效地在DNA分子中引入,優(yōu)選隨機(jī)地引入突變或重排,或在兩種或多種DNA分子之間產(chǎn)生,優(yōu)選隨機(jī)地產(chǎn)生DNA序列交換的方法。從DNA改組獲得的DNA分子是一種改組的DNA分子,該分子是來(lái)源于至少一種模板DNA分子的天然所不存在的DNA分子。該改組DNA編碼就模板DNA所編碼的酶而言修飾的酶,而且相對(duì)于模板DNA所編碼的酶而言優(yōu)選具有改變的生物學(xué)活性。
酶活性在本文中指酶催化底物轉(zhuǎn)化成產(chǎn)物的能力。酶的底物包含該酶的天然底物,還包含也能被該酶轉(zhuǎn)化成產(chǎn)物或產(chǎn)物類(lèi)似物的該天然底物的類(lèi)似物。酶活性的測(cè)量通過(guò)在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)中的產(chǎn)物量,或在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)混合物中剩余的底物量來(lái)進(jìn)行。還可以通過(guò)在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)混合物中剩余的未使用輔因子的量,或通過(guò)在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)混合物中用掉的輔因子的量來(lái)測(cè)量酶活性。還可以通過(guò)在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)混合物中剩余的自由能供體或富含能量分子(例如ATP、磷酸烯醇丙酮酸、乙酰磷酸或磷酸肌酸)的量,或通過(guò)在一個(gè)確定的時(shí)間段之后測(cè)定反應(yīng)混合物中已用自由能供體或富含能量分子(例如ADP、丙酮酸、乙酸或肌酸)的量來(lái)測(cè)量酶活性。
表達(dá)是指植物中內(nèi)源性基因或轉(zhuǎn)基因的轉(zhuǎn)錄和/或翻譯。例如對(duì)于反義結(jié)構(gòu),表達(dá)可以僅指該反義DNA的轉(zhuǎn)錄。
基因是指編碼序列和相關(guān)的調(diào)節(jié)序列,其中該編碼序列轉(zhuǎn)錄成RNA例如mRNA、rRNA、tRNA、snRNA、有義RNA或反義RNA。調(diào)節(jié)序列的例子是啟動(dòng)子序列、5’和3’非翻譯序列和終止序列。還可以存在的元件是例如內(nèi)含子。
除草劑用以殺死或抑制植物、植物細(xì)胞、植物種子或植物組織生長(zhǎng)的化學(xué)制品。
異源DNA序列天然情況下與所導(dǎo)入的宿主細(xì)胞不相關(guān)的DNA序列,包括天然存在DNA序列的非天然存在的多拷貝,以及其中本身同源的DNA序列可操作地與非天然的序列連接的遺傳結(jié)構(gòu)。
同源DNA序列與其導(dǎo)入的宿主細(xì)胞天然相關(guān)的DNA序列。
抑制劑通過(guò)例如失活對(duì)于植物的生長(zhǎng)或生存所必需的生物合成酶等蛋白質(zhì)的酶活性、受體、信號(hào)轉(zhuǎn)導(dǎo)蛋白質(zhì)、結(jié)構(gòu)基因產(chǎn)物或運(yùn)輸?shù)鞍?,造成植物異常生長(zhǎng)的化學(xué)制品。在本發(fā)明的上下文中,抑制劑是指改變植物的245基因、5283基因、2490基因、3963基因或4036基因所編碼的酶活性的化學(xué)制品。更一般地,抑制劑通過(guò)與該245基因、5283基因、2490基因、3963基因或4036基因所編碼的基因產(chǎn)物相互作用造成宿主細(xì)胞的異常生長(zhǎng)。
等基因的除了可能由于存在或不存在異源DNA序列而不同外,遺傳上一致的植物。
分離的在本發(fā)明的上下文中,分離的DNA分子或分離的酶是指通過(guò)人為操作使其脫離天然環(huán)境而存在并因此不是自然產(chǎn)物的DNA分子或酶。分離的DNA分子或酶可以以純化形式存在,或可以存在于非天然環(huán)境中例如存在于轉(zhuǎn)基因宿主細(xì)胞中。
標(biāo)記基因編碼可篩選或可選擇的性狀的基因。
成熟蛋白質(zhì)正常定向到細(xì)胞器例如葉綠體,并且已從其中除去了轉(zhuǎn)運(yùn)肽的蛋白質(zhì)。
最小啟動(dòng)子在沒(méi)有上游激活時(shí)無(wú)活性或具有大大降低的啟動(dòng)子活性的啟動(dòng)子元件,尤其是TATA元件。當(dāng)存在適合的轉(zhuǎn)錄因子時(shí),該最小啟動(dòng)子發(fā)揮功能允許轉(zhuǎn)錄。
修飾的酶活性與天然存在于植物中的酶活性(即在沒(méi)有人為地對(duì)這些活性進(jìn)行直接或間接的操作的情況下天然存在的酶活性)不同的酶活性,該修飾的酶活性耐受抑制天然存在的酶活性的抑制劑。
植物是指任何植物,尤其是種子植物。
植物細(xì)胞植物的結(jié)構(gòu)和生理單位,包含原生質(zhì)和細(xì)胞壁。植物細(xì)胞可以是分離的單個(gè)細(xì)胞或培養(yǎng)細(xì)胞形式、或作為更高級(jí)的組織單位例如植物組織或植物器官等的部分。
植物材料是指植物的葉、莖、根、花或花的部分、果實(shí)、花粉、花粉管、胚珠、胚囊、卵細(xì)胞、合子、胚、種子、插條、細(xì)胞或組織培養(yǎng)物、或任何其它的植物部分或植物產(chǎn)物。
前蛋白(pre-protein)正常定向到細(xì)胞器例如葉綠體,并且仍含有其轉(zhuǎn)運(yùn)肽的蛋白質(zhì)。
重組DNA分子采用重組DNA技術(shù)連接在一起的DNA序列的組合。
選擇標(biāo)記基因其表達(dá)并不賦予轉(zhuǎn)化細(xì)胞選擇優(yōu)勢(shì),但其表達(dá)使得該轉(zhuǎn)化細(xì)胞表型上不同于非轉(zhuǎn)化細(xì)胞的基因。
顯著增加大于測(cè)量技術(shù)固有的誤差范圍的酶活性增加,優(yōu)選在有抑制劑時(shí)比野生型酶的活性增加大約2倍或更多,更優(yōu)選增加大約5倍或更多,最優(yōu)選增加大約10倍或更多。
顯著降低是指酶反應(yīng)產(chǎn)物量的降低超過(guò)測(cè)量技術(shù)固有的誤差范圍。優(yōu)選在沒(méi)有抑制劑時(shí)比野生型酶的活性降低大約2倍或更多,更優(yōu)選降低大約5倍或更多,最優(yōu)選降低大約10倍或更多。
術(shù)語(yǔ)“基本相似”當(dāng)在本文中用于核苷酸序列時(shí),以其最廣泛的含義,是指相應(yīng)于參考序列的核苷酸序列,其中該相應(yīng)序列所編碼的多肽具有與該參考核苷酸序列編碼的多肽基本相似的結(jié)構(gòu)和功能,例如僅在不影響多肽功能的氨基酸中發(fā)生改變。期望的是,該基本相似的核苷酸序列編碼由該參考核苷酸序列編碼的多肽。術(shù)語(yǔ)“基本相似”特別旨在包括其中序列已被修飾以優(yōu)化其在特定細(xì)胞中的表達(dá)的核苷酸序列。該基本相似的核苷酸序列與參考核苷酸序列之間的一致性百分?jǐn)?shù)希望是至少65%、更希望是至少75%、優(yōu)選至少85%、更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%。序列比較采用Smith-Waterman序列比對(duì)算法(見(jiàn)例如Waterman,M.S.,計(jì)算生物學(xué)入門(mén)圖譜、序列和基因組(Introduction to Computional BiologyMaps,Sequences andgenomes),Chapman & Hall,倫敦1995,ISBN 0-412-99391-0)進(jìn)行。使用1.16版localS程序,參數(shù)如下匹配1,錯(cuò)配罰分0.33,開(kāi)始斷缺區(qū)罰分2,延長(zhǎng)的斷缺區(qū)罰分2。與參考核苷酸序列“基本相似”的核苷酸序列可以與該參考核苷酸序列在如下條件下雜交7%十二烷基磺酸鈉(SDS)、0.5M NaPO4、1mM EDTA中50℃雜交并在2×SSC、0.1%SDS中50℃進(jìn)行洗滌,更期望的是在7%十二烷基磺酸鈉(SDS)、0.5M NaPO4、1mM EDTA中50℃雜交并在1×SSC、0.1%SDS中50℃進(jìn)行洗滌,甚至更期望的是在7%十二烷基磺酸鈉(SDS)、0.5M NaPO4、1mM EDTA中50℃雜交并在0.5×SSC、0.1%SDS中50℃進(jìn)行洗滌,優(yōu)選在7%十二烷基磺酸鈉(SDS)、0.5MNaPO4、1mMEDTA中50℃雜交并在0.1×SSC、0.1%SDS中50℃進(jìn)行洗滌,更優(yōu)選在7%十二烷基磺酸鈉(SDS)、0.5MNaPO4、1mM EDTA中50℃雜交并在0.1×SSC、0.1%SDS中65℃進(jìn)行洗滌。本文所用術(shù)語(yǔ)“245基因”、“5283基因”、“2490基因”、“3963基因”、或“4036基因”是指分別含有SEQ ID NO1、SEQ ID NO3、SEQID NO5、SEQ ID NO7或SEQ ID NO9,或分別含有與SEQ ID NO1、SEQID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9基本相似的核苷酸序列的DNA分子。245基因、5283基因、2490基因、3963基因或4036基因的同系物分別包括編碼與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10有至少30%一致性的氨基酸序列的核苷酸序列,一致性的測(cè)量采用以下描述的參數(shù)進(jìn)行,其中由這些同系物編碼的氨基酸序列分別具有245、5283、2490、3963或4036蛋白質(zhì)的生物學(xué)活性。
術(shù)語(yǔ)“基本相似”,當(dāng)在本文中用于蛋白質(zhì)時(shí),是指相應(yīng)于參考蛋白質(zhì)的蛋白質(zhì),其中該蛋白質(zhì)具有與該參考蛋白質(zhì)基本相同的結(jié)構(gòu)和功能,例如僅在不影響該多肽功能的氨基酸序列中有改變。當(dāng)用于蛋白質(zhì)或氨基酸序列時(shí),采用BLAST分析的默認(rèn)參數(shù)值,基本相似的蛋白質(zhì)或氨基酸序列和參考蛋白質(zhì)或氨基序列之間的一致性百分?jǐn)?shù)期望是至少65%、更期望至少75%、優(yōu)選至少85%、更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%。本文所用術(shù)語(yǔ)“245蛋白質(zhì)”、“5283蛋白質(zhì)”、“2490蛋白質(zhì)”、“3963蛋白質(zhì)”、或“4036蛋白質(zhì)”分別是指由含有與SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9基本相似的核苷酸序列的DNA分子編碼的氨基酸序列。245蛋白質(zhì)、5283蛋白質(zhì)、2490蛋白質(zhì)、3963蛋白質(zhì)或4036蛋白質(zhì)的同系物分別是與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10有至少30%一致性的氨基酸序列,一致性的測(cè)量采用以下描述的參數(shù)進(jìn)行,其中這些同系物分別具有245、5283、2490、3963或4036蛋白質(zhì)的生物學(xué)活性。
本領(lǐng)域技術(shù)人員還熟悉確定“基本相似的”和參考的核苷酸序列、或蛋白質(zhì)或氨基酸序列之間一致性百分?jǐn)?shù)的其它分析工具,例如GAP分析。因此,在本發(fā)明中,“基本相似”也采用Wisconsin大學(xué)GCG,GAP的SEQWEB應(yīng)用程序以及默認(rèn)的GAP分析參數(shù)來(lái)確定,該GAP分析基于Needleman和Wunsch的算法(Needleman和Wunsch(1970),分子生物學(xué)雜志(J.Mol.Biol.)48443-453)。
因此,對(duì)于“245基因”并采用上述GAP分析時(shí),“基本相似”是指編碼與SEQ ID NO2有至少47%一致性、更優(yōu)選至少60%一致性、甚至更優(yōu)選至少75%一致性、甚至更優(yōu)選至少85%一致性、甚至更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的蛋白質(zhì)的核苷酸序列。
對(duì)于“5283基因”并采用上述GAP分析時(shí),“基本相似”是指編碼與SEQ ID NO4有至少74%一致性、更優(yōu)選至少80%一致性、甚至更優(yōu)選至少85%一致性、甚至更優(yōu)選至少90%一致性、甚至更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的蛋白質(zhì)的核苷酸序列。而且,“基本相似”還優(yōu)選指與SEQ ID NO3有至少80%一致性、更優(yōu)選至少90%一致性、甚至更優(yōu)選95%一致性、甚至更優(yōu)選至少99%一致性的核苷酸序列,其中所述核苷酸序列比較采用上述GAP分析進(jìn)行。
對(duì)于“2490基因”并采用上述GAP分析時(shí),“基本相似”是指編碼與SEQ ID NO6有至少82%一致性、更優(yōu)選至少85%一致性、甚至更優(yōu)選至少90%一致性、甚至更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的蛋白質(zhì)的核苷酸序列。而且,“基本相似”還優(yōu)選指與SEQ ID NO5有至少87%一致性、更優(yōu)選至少90%一致性、甚至更優(yōu)選95%一致性、甚至更優(yōu)選至少99%一致性的核苷酸序列,其中所述核苷酸序列比較采用上述GAP分析進(jìn)行。
對(duì)于“3963基因”并采用上述GAP分析時(shí),“基本相似”是指編碼與SEQ ID NO8有至少40%一致性、更優(yōu)選至少60%一致性、更優(yōu)選至少80%一致性、甚至更優(yōu)選至少90%一致性、甚至更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的蛋白質(zhì)的核苷酸序列。而且,“基本相似”還優(yōu)選指與SEQ ID NO7有至少49%一致性、更優(yōu)選至少60%一致性、甚至更優(yōu)選至少80%一致性、更優(yōu)選至少90%一致性、更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的核苷酸序列,其中所述核苷酸序列比較采用上述GAP分析進(jìn)行。
對(duì)于“4036基因”并采用上述GAP分析時(shí),“基本相似”是指編碼與SEQ ID NO10有至少67%一致性、更優(yōu)選至少80%一致性、更優(yōu)選至少85%一致性、甚至更優(yōu)選至少90%一致性、甚至更優(yōu)選至少95%一致性、甚至更優(yōu)選至少99%一致性的蛋白質(zhì)的核苷酸序列。
而且,采用如上所述的GAP分析,“245基因的同系物”包括編碼與SEQ ID NO2有至少24%一致性、更優(yōu)選至少30%一致性、甚至更優(yōu)選至少40%一致性、甚至更優(yōu)選至少45%一致性、甚至更優(yōu)選至少55%一致性、甚至更優(yōu)選至少65%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列的核苷酸序列,其中該同系物所編碼的氨基酸序列具有245蛋白質(zhì)的生物學(xué)活性。
而且,采用如上所述的GAP分析,“5283基因的同系物”包括編碼與SEQ ID NO4有至少23%一致性、更優(yōu)選至少40%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少74%一致性的氨基酸序列的核苷酸序列,其中該同系物所編碼的氨基酸序列具有5283蛋白質(zhì)的生物學(xué)活性。
而且,采用如上所述的GAP分析,“2490基因的同系物”包括編碼與SEQ ID NO6有至少30%一致性、更優(yōu)選至少30%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少80%一致性的氨基酸序列的核苷酸序列,其中該同系物所編碼的氨基酸序列具有2490蛋白質(zhì)的生物學(xué)活性。
而且,采用如上所述的GAP分析,“3963基因的同系物”包括編碼與SEQ ID NO8有至少34%一致性、更優(yōu)選至少40%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列的核苷酸序列,其中該同系物所編碼的氨基酸序列具有3963蛋白質(zhì)的生物學(xué)活性。
而且,采用如上所述的GAP分析,“4036基因的同系物”包括編碼與SEQ ID NO10有至少44%一致性、更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列的核苷酸序列,其中該同系物所編碼的氨基酸序列具有4036蛋白質(zhì)的生物學(xué)活性。
當(dāng)采用上述關(guān)于蛋白質(zhì)或氨基酸序列的GAP分析時(shí),對(duì)于“245基因”,“基本相似”的蛋白質(zhì)或氨基酸序列與參考蛋白質(zhì)或氨基酸序列(在此為SEQ ID NO2)之間的一致性百分?jǐn)?shù)為至少47%、更優(yōu)選至少60%、甚至更優(yōu)選至少75%、甚至更優(yōu)選至少85%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%。“245蛋白質(zhì)的同系物”包括與SEQ ID NO2有至少24%一致性、更優(yōu)選至少30%一致性、甚至更優(yōu)選至少40%一致性、甚至更優(yōu)選至少45%一致性、甚至更優(yōu)選至少55%一致性、甚至更優(yōu)選至少65%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列,其中該245蛋白質(zhì)的同系物具有245蛋白質(zhì)的生物學(xué)活性。
對(duì)于“5283基因”,當(dāng)采用上述GAP分析時(shí),基本相似的蛋白質(zhì)或氨基酸序列與參考蛋白質(zhì)或氨基酸序列(在此為SEQ ID NO4)之間的一致性百分?jǐn)?shù)為至少74%、更優(yōu)選至少80%、甚至更優(yōu)選至少85%、甚至更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%。“5283蛋白質(zhì)的同系物”包括與SEQ ID NO4有至少23%一致性、更優(yōu)選至少40%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少74%一致性的氨基酸序列,其中該5283蛋白質(zhì)的同系物具有5283蛋白質(zhì)的生物學(xué)活性。
對(duì)于“2490基因”,當(dāng)采用上述GAP分析時(shí),基本相似的蛋白質(zhì)或氨基酸序列與參考蛋白質(zhì)或氨基酸序列(在此為SEQ ID NO6)之間的一致性百分?jǐn)?shù)為至少82%、更優(yōu)選至少85%、更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%。“2490蛋白質(zhì)的同系物”包括與SEQ IDNO6有至少30%一致性、更優(yōu)選至少30%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少80%一致性的氨基酸序列,其中該2490蛋白質(zhì)的同系物具有2490蛋白質(zhì)的生物學(xué)活性。
對(duì)于“3963基因”,當(dāng)采用上述GAP分析時(shí),“基本相似”的蛋白質(zhì)或氨基酸序列與參考蛋白質(zhì)或氨基酸序列(在此為SEQ ID NO8)之間的一致性百分?jǐn)?shù)為至少40%、更優(yōu)選至少60%、更優(yōu)選至少80%、甚至更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%?!?963蛋白質(zhì)的同系物”包括與SEQ ID NO8有至少34%一致性、更優(yōu)選至少40%一致性、甚至更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列,其中該3963蛋白質(zhì)的同系物具有3963蛋白質(zhì)的生物學(xué)活性。
對(duì)于“4036基因”,當(dāng)采用上述GAP分析時(shí),“基本相似”的蛋白質(zhì)或氨基酸序列與參考蛋白質(zhì)或氨基酸序列(在此為SEQ ID NO10)之間的一致性百分?jǐn)?shù)為至少67%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少90%、甚至更優(yōu)選至少95%、甚至更優(yōu)選至少99%?!?036蛋白質(zhì)的同系物”包括與SEQ ID NO10有至少44%一致性、更優(yōu)選至少50%一致性、甚至更優(yōu)選至少60%一致性、甚至更優(yōu)選至少75%一致性的氨基酸序列,其中該4036蛋白質(zhì)的同系物具有4036蛋白質(zhì)的生物學(xué)活性。
底物底物是在酶天然執(zhí)行其功能的生物化學(xué)途徑中被該酶天然識(shí)別并轉(zhuǎn)化成產(chǎn)物的分子,或是在類(lèi)似于天然存在的反應(yīng)的酶反應(yīng)中被該酶識(shí)別并轉(zhuǎn)化成產(chǎn)物的該分子的修飾版本。
耐受性當(dāng)暴露于足以抑制天然未修飾植物正常生長(zhǎng)或功能的量的抑制劑或除草劑時(shí),保持基本正常的生長(zhǎng)或功能的能力。
轉(zhuǎn)化將異源DNA引入細(xì)胞、組織或植物的程序。轉(zhuǎn)化的細(xì)胞、組織或植物應(yīng)理解為不僅包括轉(zhuǎn)化程序的終產(chǎn)物,也包括其轉(zhuǎn)基因后代。
轉(zhuǎn)基因的用優(yōu)選含有可操作地與目的DNA序列連接的適合啟動(dòng)子的重組DNA分子穩(wěn)定轉(zhuǎn)化的。SEQ ID NO1鼠耳芥屬245基因的cDNA序列SEQ ID NO2 SEQ ID NO1所示鼠耳芥屬245 DNA序列所編碼的氨基序列SEQ ID NO3鼠耳芥屬5283基因的cDNA序列SEQ ID NO4 SEQ ID NO3所示鼠耳芥屬5283 DNA序列所編碼的氨基序列SEQ ID NO5鼠耳芥屬2490基因的cDNA序列SEQ ID NO6 SEQ ID NO5所示鼠耳芥屬2490 DNA序列所編碼的氨基序列SEQ ID NO7鼠耳芥屬3963基因的cDNA序列SEQ ID NO8 SEQ ID NO7所示鼠耳芥屬3963 DNA序列所編碼的氨基序列SEQ ID NO9鼠耳芥屬4036基因的cDNA序列SEQ ID NO10 SEQ ID NO9所示鼠耳芥屬4036 DNA序列所編碼的氨基序列SEQ ID NO11寡核苷酸SLP346forSEQ ID NO12鼠耳芥屬245基因的部分基因組序列SEQ ID NO13鼠耳芥屬245基因cDNA序列的3’UTRSEQ ID NO14鼠耳芥屬5283基因的基因組序列SEQ ID NO15寡核苷酸SLP328SEQ ID NO16寡核苷酸LW60SEQ ID NO17鼠耳芥屬5283基因cDNA序列的5’UTRSEQ ID NO18鼠耳芥屬5283基因cDNA序列的3’UTRSEQ ID NO19鼠耳芥屬2490基因的基因組序列SEQ ID NO20鼠耳芥屬2490基因cDNA的5’UTRSEQ ID NO21鼠耳芥屬2490基因cDNA序列的3’UTRSEQ ID NO22寡核苷酸SLP369SEQ ID NO23寡核苷酸SLP370SEQ ID NO24鼠耳芥屬3963基因的基因組序列SEQ ID NO25寡核苷酸-21SEQ ID NO26鼠耳芥屬3963基因cDNA序列的3’UTRSEQ ID NO27鼠耳芥屬4036基因的基因組序列SEQ ID NO28鼠耳芥屬4036基因的cDNA編碼序列,包括來(lái)自載培品種Landsberg的cDNA和Columbia的基因組序列之間的差異。SEQ ID NO29 SEQ ID NO28所示鼠耳芥屬4036 DNA序列所編碼的氨基酸序列本發(fā)明包括分離的DNA分子,其含有與選自SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的核苷酸序列。優(yōu)選根據(jù)本發(fā)明的DNA分子,其中該序列編碼與選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列基本相似的氨基酸序列。進(jìn)一步優(yōu)選根據(jù)本發(fā)明的DNA分子,其中該序列是選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQID NO7和SEQ ID NO9的任意一個(gè)序列。進(jìn)一步優(yōu)選根據(jù)本發(fā)明的DNA分子,其中該序列編碼選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列的氨基酸序列。進(jìn)一步優(yōu)選根據(jù)本發(fā)明的DNA分子,其中所述核苷酸序列是植物的核苷酸序列。更優(yōu)選根據(jù)本發(fā)明的DNA分子,其中該植物是鼠耳芥(Arabidopsisthaliana)。進(jìn)一步優(yōu)選根據(jù)本發(fā)明的DNA分子,其中該蛋白質(zhì)具有選自245活性、5283活性、2490活性、396活性和4036活性的任意一種活性。本發(fā)明還包括氨基酸序列,其含有與選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的核苷酸序列所編碼的氨基酸序列。優(yōu)選根據(jù)本發(fā)明的氨基酸序列,其含有選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ IDNO9的任意一個(gè)序列所編碼的氨基酸序列。本發(fā)明的再一個(gè)目標(biāo)是含有與選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ IDNO10的任意一個(gè)序列基本相似的氨基酸序列的氨基酸序列。優(yōu)選根據(jù)本發(fā)明的氨基酸序列,其中該序列是選自SEQ ID NO2、SEQ ID NO4、SEQID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列。進(jìn)一步優(yōu)選根據(jù)本發(fā)明的DNA序列,其中該蛋白質(zhì)具有選自245、5283、2490、3963和4036活性的任意一種活性。本發(fā)明包括氨基酸序列,其含有選自SEQ IDNO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列所編碼的氨基酸序列的至少20個(gè)連續(xù)氨基酸殘基。本發(fā)明還包括含有選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的氨基酸序列的至少20個(gè)連續(xù)氨基酸殘基的氨基酸序列。本發(fā)明的一個(gè)目標(biāo)是含有可操作地與本發(fā)明DNA分子連接的啟動(dòng)子的表達(dá)盒。本發(fā)明還包括含有根據(jù)本發(fā)明的表達(dá)盒的重組載體,其中所述載體能夠被穩(wěn)定地轉(zhuǎn)化至宿主細(xì)胞中。本發(fā)明還包括含有根據(jù)本發(fā)明的表達(dá)盒的宿主細(xì)胞,其中所述核苷酸序列能夠在所述細(xì)胞中表達(dá)。優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是真核細(xì)胞。更優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞選自昆蟲(chóng)細(xì)胞、酵母細(xì)胞和植物細(xì)胞。而且更優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是原核細(xì)胞。更優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是細(xì)菌細(xì)胞。本發(fā)明包括含有根據(jù)本發(fā)明的植物細(xì)胞的植物或種子。優(yōu)選根據(jù)本發(fā)明的植物,其中所述植物耐受選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑。
本發(fā)明還包括如下方法,該方法包括獲得含有異源DNA分子的宿主細(xì)胞,其中所述異源DNA分子編碼具有245活性、5283活性、2490活性、3963活性或4036活性的蛋白質(zhì);和在所述宿主細(xì)胞中表達(dá)所述蛋白質(zhì)。優(yōu)選該宿主細(xì)胞是細(xì)菌細(xì)胞、酵母細(xì)胞或昆蟲(chóng)細(xì)胞。
本發(fā)明還包括制備編碼具有改變活性的基因產(chǎn)物的核苷酸序列的方法,其中所述活性選自245活性、5283活性、2490活性、3963活性和4036活性,該方法包括a)改組權(quán)利要求1的核苷酸序列,b)表達(dá)所獲得的改組核苷酸序列,和c)選擇與選自所述未修飾核苷酸序列的基因產(chǎn)物的245活性、5283活性、2490活性、3963活性和4036活性相比,改變的選自245活性、5283活性、2490活性、3963活性和4036活性的活性。
優(yōu)選根據(jù)本發(fā)明的方法,其中該核苷酸序列是選自SEQ ID NO1、SEQID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列。本發(fā)明包括通過(guò)根據(jù)本發(fā)明的該方法可以獲得的改組DNA分子。本發(fā)明包括通過(guò)根據(jù)本發(fā)明的該方法制備的改組DNA分子。本發(fā)明還包括根據(jù)本發(fā)明的該方法獲得的改組DNA分子,其中所述改組DNA分子編碼的基因產(chǎn)物對(duì)選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑具有增強(qiáng)的耐受性。本發(fā)明的再一個(gè)目標(biāo)是含有可操作地與本發(fā)明核苷酸序列連接的啟動(dòng)子的表達(dá)盒。本發(fā)明還包括含有根據(jù)本發(fā)明的表達(dá)盒的重組載體,其中所述載體能夠被穩(wěn)定地轉(zhuǎn)化至宿主細(xì)胞中。本發(fā)明的再一個(gè)目標(biāo)是含有根據(jù)本發(fā)明的表達(dá)盒的宿主細(xì)胞,其中所述核苷酸序列能夠在所述細(xì)胞中表達(dá)。優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是真核細(xì)胞。還優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞選自昆蟲(chóng)細(xì)胞、酵母細(xì)胞和植物細(xì)胞。還優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是原核細(xì)胞。還優(yōu)選根據(jù)本發(fā)明的宿主細(xì)胞,其中所述宿主細(xì)胞是細(xì)菌細(xì)胞。本發(fā)明的一個(gè)目標(biāo)是含有根據(jù)本發(fā)明的植物細(xì)胞的植物或種子。優(yōu)選根據(jù)本發(fā)明的植物,其中所述植物耐受選自抑制245活性、5283活性、2490活性、3963活性和4036活性的抑制劑。本發(fā)明還包括篩選與選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列所編碼的蛋白質(zhì)相互作用的化合物的方法,包括a)表達(dá)分別含有選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列,或含有與選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的序列的DNA分子,以產(chǎn)生相應(yīng)蛋白質(zhì),b)對(duì)推測(cè)能夠與步驟(a)中表達(dá)的蛋白質(zhì)相互作用的化合物進(jìn)行測(cè)試,和c)選擇在步驟(b)中與蛋白質(zhì)相互作用的化合物。
本發(fā)明的另一個(gè)目標(biāo)是鑒定選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑的方法,包括(a)向植物細(xì)胞中分別引入含有選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列的核苷酸序列,并具有選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的DNA分子,或與其基本相似的核苷酸序列,或它們的同系物,以致所述序列能夠以高于野生型表達(dá)水平的水平進(jìn)行功能性表達(dá),(b)在有利于抑制的條件下將所述植物細(xì)胞與待測(cè)試化合物合并,以檢測(cè)該化合物抑制選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的能力,
(c)在步驟(b)的條件下測(cè)量植物的生長(zhǎng),和(d)在相同條件下,將所述植物細(xì)胞的生長(zhǎng)與具有選自245活性、5283活性、2490活性、3963活性和4036活性的未改變活性的植物細(xì)胞之生長(zhǎng)進(jìn)行比較,和(e)選擇在步驟(d)中抑制植物細(xì)胞生長(zhǎng)的所述化合物。
本發(fā)明包括根據(jù)本發(fā)明的方法能夠鑒別的具有除草劑活性的化合物。本發(fā)明還包括鑒定具有除草劑活性的化合物的方法,包括(a)在有利于相互作用的條件下將根據(jù)本發(fā)明的蛋白質(zhì)與待測(cè)試的化合物合并,以測(cè)試該化合物與所述蛋白質(zhì)相互作用的能力,(b)選擇在步驟(a)中鑒定的能夠與所述蛋白質(zhì)相互作用的化合物,(c)給植物施用步驟(b)中所鑒定的化合物,以檢測(cè)除草劑活性,和(d)選擇具有除草劑活性的化合物。
本發(fā)明包括根據(jù)本發(fā)明的方法能夠鑒定的具有除草劑活性的化合物。本發(fā)明的再一個(gè)目標(biāo)是用于抑制植物生長(zhǎng)的方法,包括給所述植物施用抑制本發(fā)明氨基酸序列的活性的化合物,施用量為足以抑制所述植物生長(zhǎng)的量。
優(yōu)選根據(jù)本發(fā)明的方法,其中該化合物是根據(jù)本發(fā)明的方法能夠鑒定的具有除草劑活性的化合物。本發(fā)明包括改良農(nóng)作物的方法,包括給根據(jù)本發(fā)明的除草劑耐受性植物或種子施用可根據(jù)本發(fā)明方法鑒定的具有除草劑活性的化合物,施用量是對(duì)不需要的植物產(chǎn)生抑制但又不顯著抑制該除草劑耐受性植物或種子的生長(zhǎng)的量。本發(fā)明的一個(gè)目標(biāo)是含有與選自下組的任意一個(gè)序列基本相似的核苷酸序列的DNA分子SEQ IDNO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29。
本發(fā)明的一個(gè)目標(biāo)是提供一種鑒定新除草劑的有效而有利的方法。本發(fā)明的一個(gè)特點(diǎn)是鑒定了表現(xiàn)出與肽釋放因子2(Craigen等(1985)美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.),823616-3620;Craigen和Caskey(1987)Biochimie 691031-1041;Ito等(1998)美國(guó)國(guó)家科學(xué)院院刊,958165-8169)具有序列相似性的鼠耳芥屬基因,在本文中稱(chēng)作245基因。本發(fā)明的另一個(gè)特點(diǎn)是發(fā)現(xiàn)該245基因是幼苗生長(zhǎng)和發(fā)育所必需的。本發(fā)明的一個(gè)優(yōu)點(diǎn)在于,該新發(fā)現(xiàn)的必需基因包含一種新的除草劑作用方式,其使得本領(lǐng)域的技術(shù)人員能夠容易而快速地鑒定出新的除草劑。
本發(fā)明的另一個(gè)特點(diǎn)是鑒定了表現(xiàn)出與下列基因具有序列相似性的鼠耳芥屬基因,在本文中稱(chēng)作5283基因粟酒裂殖酵母(Schizosaccharomyces pombe)的一個(gè)未定性基因;釀酒酵母(Saccharomyces cerevisiae)中編碼mRNA前體拼接所必需的一個(gè)因子的PRP31基因(Weidenhammer等(1996)核酸研究(Nucleic Acids Res.)241164-1170;Weidenhammer等(1997)分子細(xì)胞生物學(xué)(Mol.CellBio1.),173580-3585);Pisum sativum中編碼支架結(jié)構(gòu)附著區(qū)(SAR)DNA結(jié)合蛋白的SARBP-1和SARBP-2(Rzepecki等(1995)Acta Biochim.Pol.,4175-81);釀酒酵母中編碼能消除IKB之生長(zhǎng)抑制性作用的蛋白質(zhì)的SIK1基因(Morin等(1995)細(xì)胞生長(zhǎng)和分化(Cell Growth &Differentiation),6789-798)。該SIK1基因產(chǎn)物又稱(chēng)作Nop56,其表現(xiàn)出是一種必需的核仁蛋白質(zhì)(Gautier等(1997),分子細(xì)胞生物學(xué),177088-7098)。本發(fā)明的另一個(gè)特點(diǎn)在于,發(fā)現(xiàn)該5283基因是幼苗生長(zhǎng)和發(fā)育所必需的。本發(fā)明的一個(gè)優(yōu)點(diǎn)是,該新發(fā)現(xiàn)的必需基因包含一種新的除草劑作用方式,其使得本領(lǐng)域的技術(shù)人員能夠容易而快速地鑒定出新的除草劑。
本發(fā)明的再一個(gè)特點(diǎn)是,鑒定了在鼠耳芥屬中編碼與葉綠體被膜蛋白具有序列相似性的蛋白質(zhì)的基因,本文中稱(chēng)作2490基因(Ko等(1995)生物化學(xué)雜志(The Journal of Biological Chem.)27028601-28608;Wu等(1994)生物化學(xué)雜志26932264-32271;Pang等(1997)生物化學(xué)雜志27225623-23627)。本發(fā)明的另一個(gè)特點(diǎn)在于,發(fā)現(xiàn)該2490基因是幼苗生長(zhǎng)和發(fā)育所必需的。本發(fā)明的一個(gè)優(yōu)點(diǎn)是,該新發(fā)現(xiàn)的必需基因包含一種新的除草劑作用方式,其使得本領(lǐng)域的技術(shù)人員能夠容易而快速地鑒定出新的除草劑。
本發(fā)明的再一個(gè)特點(diǎn)是鑒定了在鼠耳芥屬中編碼與許多DNA修復(fù)蛋白質(zhì)具有序列相似性的蛋白質(zhì)的基因,在本文中稱(chēng)作3963基因,其中所述DNA修復(fù)蛋白質(zhì)包括Schizosaccharomyces pombe的Rad32p(Genbank索取號(hào)Q09683);人(Homo sapiens)的bMrell(Genbank索取號(hào)U37359);和釀酒酵母的Mrellp(Genbank索取號(hào)U60829)(Johzuka和Ogawa(1995)遺傳學(xué)(Genetics),1391521-1532;Paull和Gellert(1998)分子細(xì)胞(Molecular Cell)1969-979)。本發(fā)明的另一個(gè)特點(diǎn)在于,發(fā)現(xiàn)該3963基因是幼苗生長(zhǎng)和發(fā)育所必需的。本發(fā)明的一個(gè)優(yōu)點(diǎn)是,該新發(fā)現(xiàn)的必需基因包含一種新的除草劑作用方式,其使得本領(lǐng)域的技術(shù)人員能夠容易而快速地鑒定出新的除草劑。
本發(fā)明的再一個(gè)特點(diǎn)是,鑒定了在鼠耳芥屬中編碼與許多生物的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶(reductoisomerase)具有序列相似性的蛋白質(zhì)的基因,本文中稱(chēng)作4036基因,其中所述生物包括集胞藍(lán)細(xì)菌屬(Synechocystis)(SWISS-PROTQ55663)、枯草芽孢桿菌(Bacillussubtilis)(SWISS-PROT 031753)、和大腸桿菌(Escherichia coli)(SWISS-PROT P45568)(Takahashi等(1998)美國(guó)國(guó)家科學(xué)院院刊,959879-9884)。本發(fā)明的一個(gè)重要而出乎意料的特點(diǎn)是,發(fā)現(xiàn)該4036基因是幼苗生長(zhǎng)和發(fā)育所必需的。本發(fā)明的一個(gè)優(yōu)點(diǎn)是,該新發(fā)現(xiàn)的必需基因包含一種新的除草劑作用方式,其使得本領(lǐng)域的技術(shù)人員能夠容易而快速地鑒定出新的除草劑。
本發(fā)明的一個(gè)目標(biāo)是為開(kāi)發(fā)具有除草劑活性的化合物提供植物中的必需基因。遺傳結(jié)果顯示,當(dāng)鼠耳芥屬中245基因、5283基因、2490基因、3963基因或4036基因發(fā)生突變時(shí),在純合狀態(tài)所獲表型是幼苗致死的。這提示由該突變基因編碼的基因產(chǎn)物具有著關(guān)鍵性作用。
采用T-DNA插入誘變,本發(fā)明的發(fā)明者已闡明,由鼠耳芥屬245基因、鼠耳芥屬5283基因、鼠耳芥屬2490基因、鼠耳芥屬3963基因或4036基因編碼的活性(本文中稱(chēng)作245、5283、2490、3963或4036活性)在鼠耳芥屬幼苗中是必需的。這意味著,抑制植物中該蛋白質(zhì)功能的化學(xué)制品很可能對(duì)植物產(chǎn)生有害影響,并是潛在的良好除草劑候選物。因此本發(fā)明提供應(yīng)用下述基因序列所編碼的純化的蛋白質(zhì)鑒定其抑制劑的方法,該抑制劑然后可以用作除草劑以抑制例如農(nóng)作物生長(zhǎng)田間不需要植物的生長(zhǎng),所述農(nóng)作物尤其是農(nóng)業(yè)經(jīng)濟(jì)上重要的農(nóng)作物例如玉米和其它谷類(lèi)作物例如小麥、黑麥、燕麥、高粱、稻、大麥、黍、草皮草和飼料草等等,以及棉花、甘蔗、甜菜、產(chǎn)油料種子的歐洲油菜和大豆。
本發(fā)明公開(kāi)了來(lái)源于鼠耳芥屬的命名為245基因的核苷酸序列。該cDNA克隆的核苷酸序列顯示于SEQ ID NO1,而相應(yīng)的氨基酸序列顯示于SEQ ID NO2。其部分基因組DNA序列的核苷酸序列顯示于SEQ IDNO12。本發(fā)明還包括與SEQ ID NO1所示核苷酸序列基本相似的核苷酸序列。本發(fā)明還包括其氨基酸序列與SEQ ID NO2所示氨基酸序列基本相似的植物蛋白質(zhì)。該蛋白質(zhì)能夠在鑒定是潛在除草劑的抑制劑的篩選試驗(yàn)中應(yīng)用。
本發(fā)明還公開(kāi)了來(lái)源于鼠耳芥屬的命名為5283基因的核苷酸序列。該cDNA克隆的核苷酸序列顯示于SEQ ID NO3,而相應(yīng)的氨基酸序列顯示于SEQ ID NO4。其基因組DNA序列的核苷酸序列顯示于SEQ ID NO14。本發(fā)明還包括與SEQ ID NO3所示核苷酸序列基本相似的核苷酸序列。本發(fā)明還包括其氨基酸序列與SEQ ID NO4所示氨基酸序列基本相似的植物蛋白質(zhì)。該蛋白質(zhì)能夠在鑒定是潛在除草劑的抑制劑的篩選試驗(yàn)中應(yīng)用。
本發(fā)明還公開(kāi)了來(lái)源于鼠耳芥屬的命名為2490基因的核苷酸序列。該cDNA克隆的核苷酸序列顯示于SEQ ID NO5,而相應(yīng)的氨基酸序列顯示于SEQ ID NO6。其基因組DNA序列的核苷酸序列顯示于SEQ ID NO19。本發(fā)明還包括與SEQ ID NO5所示核苷酸序列基本相似的核苷酸序列。本發(fā)明還包括其氨基酸序列與SEQ ID NO6所示氨基酸序列基本相似的植物蛋白質(zhì)。該蛋白質(zhì)能夠在鑒定是潛在除草劑的抑制劑的篩選試驗(yàn)中應(yīng)用。
本發(fā)明還公開(kāi)了來(lái)源于鼠耳芥屬的命名為3963基因的核苷酸序列。該cDNA克隆的核苷酸序列顯示于SEQ ID NO7,而相應(yīng)的氨基酸序列顯示于SEQ ID NO8。其基因組DNA序列的核苷酸序列顯示于SEQ ID NO24,它含有來(lái)自標(biāo)注為MDK4.6的MDK4克隆部分和基于本發(fā)明人報(bào)道cDNA克隆的3’末端添加序列的基因組DNA序列。本發(fā)明還包括與SEQ ID NO7所示核苷酸序列基本相似的核苷酸序列。本發(fā)明還包括其氨基酸序列與SEQ ID NO8所示氨基酸序列基本相似的植物蛋白質(zhì)。該蛋白質(zhì)能夠在鑒定是潛在除草劑的抑制劑的篩選試驗(yàn)中應(yīng)用。
本發(fā)明還公開(kāi)了來(lái)源于鼠耳芥屬的命名為4036基因的核苷酸序列。該cDNA克隆的核苷酸序列顯示于SEQ ID NO9,而相應(yīng)的氨基酸序列顯示于SEQ ID NO10。其基因組DNA序列的核苷酸序列顯示于SEQ ID NO27。通過(guò)來(lái)自于栽培品種Landsberg的cDNA克隆和來(lái)自于栽培品種Columbia的基因組序列的比較,觀察到13個(gè)核苷酸差異;下面的表1進(jìn)一步明確了這些差異。除了這13個(gè)核苷酸差異外,SEQ ID NO28與SEQ ID NO9相同。SEQ ID NO28的相應(yīng)氨基酸序列顯示于SEQ ID NO29。本發(fā)明還包括與SEQ ID NO9所示核苷酸序列基本相似的核苷酸序列。本發(fā)明還包括其氨基酸序列與SEQ ID NO10和SEQ ID NO29所示氨基酸序列基本相似的植物蛋白質(zhì)。該蛋白質(zhì)能夠在鑒定是潛在除草劑的抑制劑的篩選試驗(yàn)中應(yīng)用。
在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明涉及用于鑒定在植物中能夠抑制245、5283、2490、3963或4036活性的化學(xué)制品的方法,優(yōu)選包括步驟a)獲得轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞,優(yōu)選穩(wěn)定轉(zhuǎn)化的轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞,其含有編碼具有245、5283、2490、3963或4036活性的酶的非天然核苷酸序列并能夠超量表達(dá)具有酶活性的245、5283、2490、3963或4036(全長(zhǎng)的或截短但仍有活性的)基因產(chǎn)物;b)給該轉(zhuǎn)基因植物、植物細(xì)胞、組織或部分和等基因非轉(zhuǎn)化植物、植物細(xì)胞、組織或部分施用化學(xué)制品;c)測(cè)量在施用該化學(xué)制品之后該轉(zhuǎn)基因和非轉(zhuǎn)化植物、植物細(xì)胞、組織的生長(zhǎng)和生活力;d)比較在施用化學(xué)制品后轉(zhuǎn)基因和非轉(zhuǎn)化植物、植物細(xì)胞、組織的生長(zhǎng)和生活力;和e)選擇抑制非轉(zhuǎn)化植物、植物細(xì)胞、組織或部分的生活力或生長(zhǎng),但不顯著抑制該等基因的轉(zhuǎn)基因植物、植物細(xì)胞、組織或部分的生活力或生長(zhǎng)的化學(xué)制品。在一個(gè)優(yōu)選的實(shí)施方案中,具有245、5283、2490、3963或4036活性的酶由來(lái)源于植物,優(yōu)選鼠耳芥的核苷酸序列編碼,期望是該核苷酸序列分別與SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9所示核苷酸序列一致或基本相似。在另一個(gè)實(shí)施方案中,具有245、5283、2490、3963或4036活性的酶分別由能夠編碼SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10的氨基酸序列的核苷酸序列所編碼。在再一個(gè)實(shí)施方案中,具有245、5283、2490、3963或4036活性的酶分別具有與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10所示氨基酸序列一致或基本相似的氨基酸序列。
本發(fā)明還包含具有修飾的245、5283、2490、3963或4036活性,并因此耐受正常對(duì)天然存在的245、5283、2490、3963或4036活性具有抑制性的除草劑水平之抑制的植物、植物組織、植物種子和植物細(xì)胞。本發(fā)明所包含的除草劑耐受性植物包括那些本來(lái)將會(huì)是正常抑制性除草劑的潛在靶標(biāo)的植物,尤其是以上提及的農(nóng)業(yè)經(jīng)濟(jì)上重要的作物。根據(jù)該實(shí)施方案,用含有與編碼修飾的245、5283、2490、3963或4036基因的核苷酸編碼序列可操作地連接、并在植物中起作用的適合啟動(dòng)子的重組DNA分子轉(zhuǎn)化,優(yōu)選穩(wěn)定轉(zhuǎn)化植物、植物組織、植物種子或植物細(xì)胞,其中所述修飾的基因耐受正常情況下抑制野生型未修飾245、5283、2490、3963或4036基因產(chǎn)物活性的濃度的除草劑的抑制。還可以通過(guò)給植物提供多拷貝的野生型245、5283、2490、3963或4036基因,或通過(guò)在較野生型強(qiáng)的啟動(dòng)子控制下的野生型245、5283、2490、3963或4036基因的超量表達(dá),增加除草劑敏感的野生型245、5283、2490、3963或4036蛋白質(zhì)的表達(dá),來(lái)賦予植物修飾的245、5283、2490、3963或4036活性。然后通過(guò)常規(guī)篩選技術(shù)對(duì)由此產(chǎn)生的轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞進(jìn)行篩選,籍此分離、分析并開(kāi)發(fā)出除草劑耐受性株系。作為替代方法,可以應(yīng)用隨機(jī)或位點(diǎn)特異性誘變產(chǎn)生除草劑耐受性株系。
因此,本發(fā)明提供用含有分離自植物編碼具有245、5283、2490、3963或4036活性之酶的核苷酸序列的DNA分子轉(zhuǎn)化的植物、植物細(xì)胞、植物種子或植物組織,其中該DNA表達(dá)245、5283、2490、3963或4036活性,并且其中該DNA分子賦予該植物、植物細(xì)胞、植物種子、或植物組織對(duì)正常抑制天然存在的245、5283、2490、3963或4036活性的除草劑量的耐受性。根據(jù)該實(shí)施方案的一個(gè)實(shí)施例,具有245、5283、2490、3963或4036活性的酶分別由與SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中所示核苷酸序列一致或基本相似的核苷酸序列編碼,或分別具有與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10中所示氨基酸序列一致或基本相似的氨基酸序列。
本發(fā)明還提供用于抑制植物生長(zhǎng)的方法,包括步驟給該植物施用抑制植物中天然存在的245、5283、2490、3963或4036活性的化學(xué)制品。在一個(gè)相關(guān)方面,本發(fā)明指向用于在含有許多種植作物種子或植物的田間選擇性地抑制不需要植物的生長(zhǎng)的方法,包括步驟(a)任選地種植除草劑耐受性農(nóng)作物或農(nóng)作物種子,它們是對(duì)抑制天然存在的245、5283、2490、3963或4036活性的除草劑具有耐受性的植物或植物種子;和(b)向田間的這些除草劑耐受性農(nóng)作物或農(nóng)作物種子以及不需要植物施用除草劑,施用量為抑制天然存在的245、5283、2490、3963或4036活性的除草劑量,其中該除草劑抑制雜草的生長(zhǎng),但不顯著抑制農(nóng)作物的生長(zhǎng)。
在對(duì)本發(fā)明的以下描述和非限制性實(shí)施例進(jìn)行研究之后,本領(lǐng)域的技術(shù)人員將明了本發(fā)明的其它目標(biāo)和優(yōu)點(diǎn)。
正如以下實(shí)施例所顯示的,新基因結(jié)構(gòu)的鑒定,以及245基因、5283基因、2490基因、3963基因或4036基因?qū)τ谡5闹参锷L(zhǎng)和發(fā)育的重要性,采用T-DNA插入誘變?cè)谑蠖鎸僦惺状潍@得闡明。由于已經(jīng)確立了245、5283、2490、3963或4036功能在植物中的重要性,并已鑒定了編碼這些必需活性的基因,由此發(fā)明人提供一種用于新除草劑開(kāi)發(fā)的重要搜尋工具。
鑒定分離幼苗致死突變的鼠耳芥屬插入突變株是鑒定必需基因的第一步。用收集自在其基因組中含有T-DNA插入片斷的單一T1植株的T2種子作為起始材料,鑒定分離出純合幼苗致死突變的那些株系。這些株系可以通過(guò)以下步驟發(fā)現(xiàn)將種子置于含有殺真菌劑苯菌靈和maxim的基本植物生長(zhǎng)培養(yǎng)基上,并于室溫光照下培養(yǎng)7天和14天之后鑒別不能存活的幼苗。不能存活的表型包括改變的色素形成或改變的形態(tài)。這些表型可以直接在培養(yǎng)皿中或在幼苗移植后在土壤中觀察到。
當(dāng)一個(gè)株系被鑒定為分離幼苗致死后,確定T-DNA中的抗性標(biāo)記是否與該致死性共分離(Errampalli等(1991)植物細(xì)胞(The Plant Cell),3149-157)。共分離分析通過(guò)將這些種子置于含有選擇劑的培養(yǎng)基上,并給幼苗對(duì)于該試劑的抗性或敏感性進(jìn)行評(píng)分來(lái)實(shí)現(xiàn)。應(yīng)用的選擇劑的例子有潮霉素或膦絲菌素。將大約35株抗性幼苗移植至土壤中,并在其后代中檢測(cè)幼苗致死的分離。在T-DNA插入破壞必需基因的情況中,在每一個(gè)植株上都會(huì)出現(xiàn)該抗性表型與該幼苗致死表型的共分離。因此,在這種情況下,所有抗性植株在下一代中分離幼苗致死;這個(gè)結(jié)果表明每一個(gè)抗性植株對(duì)于引起這兩個(gè)表型的DNA而言都是雜合的。
對(duì)于表現(xiàn)出T-DNA抗性標(biāo)記與幼苗致死表型共分離的那些株系,進(jìn)行Southern分析作為對(duì)每個(gè)插入片斷的分子性質(zhì)進(jìn)行定性的最初步驟。Southern采用分離自雜合子的基因組DNA以及能夠與T-DNA載體DNA雜交的探針來(lái)進(jìn)行。應(yīng)用該Southern分析的結(jié)果,選擇適當(dāng)?shù)南拗菩悦高M(jìn)行質(zhì)粒拯救,以分子克隆位于T-DNA插入片斷一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)該方法獲得的質(zhì)粒通過(guò)限制性酶消化進(jìn)行分析,以便根據(jù)質(zhì)粒的消化圖譜將它們分類(lèi)。對(duì)于每一種類(lèi)型的質(zhì)??寺。_定其DNA序列。分析所獲得的序列是否存在非T-DNA載體的序列。如果發(fā)現(xiàn)這樣的序列,則將它們用于搜索DNA和蛋白質(zhì)數(shù)據(jù)庫(kù),該搜索采用BLAST和BLAST2程序進(jìn)行(Altschul等(1990)分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。通過(guò)標(biāo)準(zhǔn)的分子生物學(xué)程序鑒定每個(gè)基因的其它基因組和cDNA序列。
鼠耳芥屬245基因是通過(guò)從標(biāo)記的幼苗致死系#245分離T-DNA邊界側(cè)翼的DNA鑒定的。位于T-DNA邊界側(cè)翼的鼠耳芥屬DNA區(qū)域與基因組調(diào)查序列F17K7TR(索取號(hào)#B24357)99%一致。本發(fā)明人第一次闡明了該245基因產(chǎn)物是植物的正常生長(zhǎng)和發(fā)育所必需的,并通過(guò)蛋白質(zhì)同源性明確了245基因產(chǎn)物的功能。本發(fā)明公開(kāi)了鼠耳芥屬245基因的cDNA核苷酸序列,以及鼠耳芥屬245蛋白質(zhì)的氨基酸序列。相應(yīng)于該cDNA克隆的核苷酸序列顯示于SEQ ID NO1,而編碼該蛋白質(zhì)的氨基酸序列顯示于SEQ ID NO2。在SEQ ID NO13’發(fā)現(xiàn)的UTR顯示于SEQ ID NO13。相應(yīng)于其部分基因組DNA的核苷酸序列顯示于SEQ ID NO12。本發(fā)明還包括來(lái)源于植物的分離氨基酸序列,其中所述氨基酸序列與SEQ ID NO1中所示核苷酸序列編碼的氨基酸序列一致或基本相似,其中所述氨基酸序列具有245活性。采用BLAST和BLAST2程序以及默認(rèn)的設(shè)定值,245基因的序列表現(xiàn)出與多種原核種類(lèi)的肽釋放因子2相似。顯著的相似種類(lèi)包括大腸桿菌(RF-2)[Swiss-Prot索取號(hào)#P07012];鼠傷寒沙門(mén)氏菌(Salmonella typhimurium)(RF-2 Salty)[Swiss-Prot索取號(hào)#P28353];和結(jié)核分枝桿菌(Mycobacterium tuberculosis)(RF-2prfB)[Swiss-Prot索取號(hào)#005782]。對(duì)以下蛋白質(zhì)序列和245基因采用GAP分析,獲得以下與245蛋白質(zhì)的序列一致性大腸桿菌(RF-2)[Swiss-Prot索取號(hào)#P07012](27.2%一致);鼠傷寒沙門(mén)氏菌(RF-2 Salty)[Swiss-Prot索取號(hào)#P28353](24.6%一致);和結(jié)核分枝桿菌(RF-2prfB)[Swiss-Prot索取號(hào)#005782](27.2%一致)。此外,集胞藍(lán)細(xì)菌屬(GenPept索取號(hào)#BAA18577)(31.5%一致);和鼠耳芥第5號(hào)染色體的P1克隆MAB16(索取號(hào)#AB018112NID)(46.2%一致)。
鼠耳芥屬5283基因是通過(guò)從標(biāo)記的幼苗致死系#5283分離T-DNA邊界側(cè)翼的DNA鑒定的。位于T-DNA邊界側(cè)翼的該鼠耳芥屬DNA區(qū)域與鼠耳芥屬一個(gè)已測(cè)序的BAC的內(nèi)部區(qū)域(BAC T13D8,1號(hào)染色體)一致。該BAC克隆含有116,177bp序列,其中一個(gè)非常小的部分相應(yīng)于含有該5283基因的基因組區(qū)域。盡管已有此BAC的信息,但本發(fā)明人第一次闡明了該5283基因產(chǎn)物是植物的正常生長(zhǎng)和發(fā)育所必需的,并通過(guò)蛋白質(zhì)同源性明確了5283基因產(chǎn)物的功能。本發(fā)明公開(kāi)了鼠耳芥屬5283基因的cDNA核苷酸序列,以及鼠耳芥屬5283蛋白質(zhì)的氨基酸序列。相應(yīng)于該cDNA克隆的核苷酸序列顯示于SEQ ID NO3,而編碼該蛋白質(zhì)的氨基酸序列顯示于SEQ ID NO4。相應(yīng)于其基因組DNA的核苷酸序列顯示于SEQID NO14。相應(yīng)于該cDNA序列的5’UTR的核苷酸序列顯示于SEQ IDNO17,而相應(yīng)于該cDNA序列的3’UTR的核苷酸序列顯示于SEQ ID NO18。本發(fā)明還包括來(lái)源于植物的分離氨基酸序列,其中所述氨基酸序列與SEQID NO3中所示核苷酸序列編碼的氨基酸序列一致或基本相似,其中所述氨基酸序列具有5283活性。采用BLAST和BLAST2程序以及默認(rèn)的設(shè)定值,5283蛋白質(zhì)的序列表現(xiàn)出與如下序列的相似性粟酒裂殖酵母的SPBC119.13c[GENPEPT索取號(hào)#CAA17928];植物的SAR DNA結(jié)合蛋白[SARBP-1Genbank索取號(hào)#AF061962和SARBP-2Genbank索取號(hào)#AF061963];和釀酒酵母的prp31和SIK1p(Nop56)[PRP31Swiss Prot索取號(hào)#Q12460]。采用GAP分析以下蛋白質(zhì)序列和5283蛋白質(zhì),獲得以下與5283蛋白質(zhì)的序列一致性粟酒裂殖酵母的SPBC119.13c[GENPEPT索取號(hào)#CAA17928](40.5%一致);植物的SAR DNA結(jié)合蛋白[SARBP-1Genbank索取號(hào)#AF061962(23.5%一致)和SARBP-2Genbank索取號(hào)#AF061963(24.2%一致)];和釀酒酵母的prp31和SIK1p(Nop56)[PRP31Swiss Prot索取號(hào)#Q12460](24.1%一致)。此外,鼠耳芥(GenPept索取號(hào)#AAC18800)與5283蛋白質(zhì)獲得73.8%的一致性。
鼠耳芥屬2490基因是通過(guò)從標(biāo)記的幼苗致死系#2490分離T-DNA邊界側(cè)翼的DNA鑒定的。位于T-DNA邊界側(cè)翼的該鼠耳芥屬DNA區(qū)域與鼠耳芥屬一個(gè)已測(cè)序的P1克隆的內(nèi)部區(qū)域(P1 MTG13,第5號(hào)染色體)一致。該P(yáng)1克隆含有50,641bp序列,其中的一小部分相應(yīng)于含有該2490基因的基因組區(qū)域。通過(guò)測(cè)定144K24 EST克隆(獲自Michigan州立大學(xué))的序列,獲得含有2490蛋白質(zhì)完整編碼序列的2490 cDNA序列。盡管已有此BAC和EST的序列信息,但本發(fā)明人第一個(gè)明確地確立了該完整基因序列,并闡明了該2490基因產(chǎn)物是植物的正常生長(zhǎng)和發(fā)育所必需的,并且通過(guò)蛋白質(zhì)同源性明確了2490基因產(chǎn)物的功能。本發(fā)明公開(kāi)了鼠耳芥屬2490基因的cDNA核苷酸序列,以及鼠耳芥屬2490蛋白質(zhì)的氨基酸序列。相應(yīng)于該cDNA克隆的核苷酸序列顯示于SEQ ID NO5,而編碼該蛋白質(zhì)的氨基酸序列顯示于SEQ ID NO6。在SEQ ID NO5的5’端發(fā)現(xiàn)的UTR序列顯示于SEQ ID NO20,而在SEQ ID NO5的3’端發(fā)現(xiàn)的UTR序列顯示于SEQ ID NO21。相應(yīng)于其基因組DNA的核苷酸序列顯示于SEQ ID NO19。本發(fā)明還包括來(lái)源于植物的分離氨基酸序列,其中所述氨基酸序列與SEQ ID NO5中所示核苷酸序列編碼的氨基酸序列一致或基本相似,其中所述氨基酸序列具有2490活性。采用BLAST和BLAST2程序以及默認(rèn)的設(shè)定值,2490蛋白質(zhì)的序列表現(xiàn)出與歐洲油菜的葉綠體被膜Toc36(bce42B)(Ko等(1995)生物化學(xué)雜志27028601-28608;Wu等(1994)生物化學(xué)雜志26932264-32271;Pang等(1997)生物化學(xué)雜志27225623-25627)的相似性。采用GAP分析2490蛋白和歐洲油菜的葉綠體被膜蛋白Toc36(bce42B)(Genbank索取號(hào)#X79091),獲得與2490蛋白質(zhì)的81.7%一致性。
鼠耳芥屬3963基因是通過(guò)從標(biāo)記的幼苗致死系#3963分離T-DNA邊界側(cè)翼的DNA鑒定的。位于T-DNA邊界側(cè)翼的該鼠耳芥屬DNA區(qū)域與第5號(hào)染色體的P1克隆MDK4(Genbank索取號(hào)AB010695)中的基因組序列100%一致。本發(fā)明人第一個(gè)闡明了該3963基因產(chǎn)物是植物的正常生長(zhǎng)和發(fā)育所必需的,并通過(guò)蛋白質(zhì)同源性明確了3963基因產(chǎn)物的功能。本發(fā)明公開(kāi)了鼠耳芥屬3963基因的cDNA核苷酸序列,以及鼠耳芥屬3963蛋白質(zhì)的氨基酸序列。相應(yīng)于該cDNA克隆的核苷酸序列顯示于SEQ IDNO7,而編碼該蛋白質(zhì)的氨基酸序列顯示于SEQ ID NO8。在SEQ ID NO7的3’端發(fā)現(xiàn)的UTR序列顯示于SEQ ID NO26。相應(yīng)于其基因組DNA的核苷酸序列顯示于SEQ ID NO24。本發(fā)明還包括來(lái)源于植物的分離氨基酸序列,其中所述氨基酸序列與SEQ ID NO7中所示核苷酸序列編碼的氨基酸序列一致或基本相似,其中所述氨基酸序列具有3963活性。采用BLAST和BLAST2程序以及默認(rèn)的設(shè)定值,3963基因序列表現(xiàn)出與許多DNA修復(fù)蛋白質(zhì)的相似性,這些DNA修復(fù)蛋白質(zhì)包括粟酒裂殖酵母的Rad32p(Genbank索取號(hào)Q09683);人的hMre11(Genbank索取號(hào)U37359);和釀酒酵母的Mre11p(Genbank索取號(hào)U60829)。采用GAP分析以下蛋白質(zhì)序列和3963蛋白質(zhì),獲得以下與5283蛋白質(zhì)的序列一致性粟酒裂殖酵母的Rad32p(Genbank索取號(hào)Q09683)(37.5%一致);人的hMre11(Genbank索取號(hào)U37359)(39.4%一致);和釀酒酵母的Mre11p(Genbank索取號(hào)U60829)(34.7%一致)。
鼠耳芥屬4036基因是通過(guò)從標(biāo)記的幼苗致死系#4036分離T-DNA邊界側(cè)翼的DNA鑒定的。位于T-DNA邊界側(cè)翼的該鼠耳芥屬DNA區(qū)域與來(lái)自鼠耳芥屬第5號(hào)染色體的P1克隆MQB2的公開(kāi)基因組序列(Genbank索取號(hào)#AB009053)100%一致。本發(fā)明人第一個(gè)闡明了該4036基因產(chǎn)物是植物的正常生長(zhǎng)和發(fā)育所必需的,并通過(guò)蛋白質(zhì)同源性明確了4036基因的功能。本發(fā)明公開(kāi)了鼠耳芥屬4036基因的cDNA編碼核苷酸序列,以及鼠耳芥屬4036蛋白質(zhì)的氨基酸序列。相應(yīng)于栽培品種Landsberg的cDNA以及兩個(gè)栽培品種的cDNA的核苷酸序列分別顯示于SEQ ID NO9和SEQ ID NO28。編碼這些蛋白質(zhì)的相應(yīng)氨基酸序列顯示于SEQ ID NO10和SEQ ID NO29。相應(yīng)于該基因組DNA的核苷酸序列顯示于SEQ ID NO27。通過(guò)比較來(lái)源于栽培品種Lansberg的cDNA克隆和來(lái)源于栽培品種Columbia的基因組序列,觀察到13個(gè)核苷酸序列差異,這些變異列于下表1中。
表1.在來(lái)源于栽培品種Lansberg的4036 cDNA克隆和來(lái)源于栽培品種Columbia的4036基因組序列之間所觀察到的核苷酸差異
*SEQ ID NO9用作核苷酸編號(hào)的參考**氨基酸殘基Ala(丙氨酸);Asn(天冬酰胺);Asp(天冬氨酸);Gln(谷氨酰胺);Ile(異亮氨酸);Leu(亮氨酸);Lys(賴氨酸);Phe(苯丙氨酸);Pro(脯氨酸);Ser(絲氨酸);和Val(纈氨酸)本發(fā)明還包括來(lái)源于植物的分離氨基酸序列,其中所述氨基酸序列與SEQ ID NO9中所示核苷酸序列所編碼的氨基酸序列一致或基本相似,其中所述氨基酸序列具有4036活性。采用BLAST和BLAST2程序以及默認(rèn)的設(shè)定值,4036基因序列表現(xiàn)出與多種生物的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶的相似性,這些生物包括集胞藍(lán)細(xì)菌屬(SWISS-PROTQ55663)、枯草芽孢桿菌(SWISS-PROT 031753)、和大腸桿菌(SWISS-PROT P45568)(Takahashi等(1998)美國(guó)國(guó)家科學(xué)院院刊959879-9884)。采用GAP分析以下蛋白質(zhì)序列和4036蛋白質(zhì),獲得以下與4036蛋白質(zhì)的序列一致性集胞藍(lán)細(xì)菌屬的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶(SWISS-PROTQ55663)(66.1%一致)、枯草芽孢桿菌的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶(SWISS-PROT 031753)(45.4%一致)、和大腸桿菌的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶(SWISS-PROT P45568)(Takahashi等(1998)美國(guó)國(guó)家科學(xué)院院刊959879-9884)(44.6%一致)。
為了在宿主生物中重組產(chǎn)生245、5283、2490、3963或4036活性,將編碼具有245、5283、2490、3963或4036活性之蛋白質(zhì)的核苷酸序列插入設(shè)計(jì)用于所選宿主的表達(dá)盒中,并將其導(dǎo)入待重組產(chǎn)生該活性的宿主細(xì)胞中。例如,SEQ ID NO1或與作為3’UTR的SEQ ID NO13相連的SEQ ID NO1、與SEQ ID NO1基本相似的核苷酸序列、或245編碼序列的同系物可以用于重組產(chǎn)生具有245活性的蛋白質(zhì)。對(duì)于適合所述宿主的特定調(diào)節(jié)序列例如啟動(dòng)子、信號(hào)序列、5’和3’非翻譯序列、和增強(qiáng)子的選擇屬于本領(lǐng)域的常規(guī)技術(shù)水平范圍內(nèi)??梢詫⒑邪凑_閱讀框可操作地連接在一起的單個(gè)元件的所獲分子插入能夠被轉(zhuǎn)化至宿主細(xì)胞的載體中。對(duì)于宿主生物例如大腸桿菌、酵母和昆蟲(chóng)細(xì)胞,以及桿狀病毒表達(dá)載體例如來(lái)源于苜蓿銀紋夜蛾(Autographica californica)核型多角體病毒(AcMNPV)基因組的載體,用于重組產(chǎn)生蛋白質(zhì)的適合表達(dá)載體和方法是熟知的(見(jiàn)例如Luckow和Summers,Bio/Technol.647(1988)。優(yōu)選的桿狀病毒/昆蟲(chóng)系統(tǒng)是pAcHLT(Phamingen,San Diego,CA),用于存在線性苜蓿銀紋夜蛾桿狀病毒DNA(Pharmigen.San Diego,CA)時(shí)轉(zhuǎn)染草地夜蛾(Spodoptera frugiperda)sf9細(xì)胞(ATCC)。所獲病毒用于轉(zhuǎn)染HighFive Tricoplusia ni細(xì)胞(Invitrogen,La Jolla,CA)。以相似方式獲得5283、2490、3963或4036活性的重組產(chǎn)生。
在一個(gè)優(yōu)選實(shí)施方案中,編碼具有245、5283、2490、3963或4036活性之蛋白質(zhì)的核苷酸序列來(lái)源于真核生物,例如哺乳動(dòng)物、蠅或酵母,但優(yōu)選來(lái)源于植物。在再一個(gè)優(yōu)選實(shí)施方案中,該核苷酸序列分別與SEQ IDNO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中所示核苷酸序列一致或基本相似,或分別編碼具有245、5283、2490、3963或4036活性的蛋白質(zhì),其氨基酸序列分別與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10中所示氨基酸序列一致或基本相似。SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中所示核苷酸序列編碼鼠耳芥屬245蛋白質(zhì)、鼠耳芥屬5283蛋白質(zhì)、鼠耳芥屬2490蛋白質(zhì)、鼠耳芥屬3963蛋白質(zhì)或鼠耳芥屬4036蛋白質(zhì),其氨基酸序列分別顯示于SEQ ID NO2、SEQ IDNO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10。在另一個(gè)優(yōu)選實(shí)施方案中,該核苷酸序列來(lái)源于原核生物,優(yōu)選細(xì)菌例如大腸桿菌。
可以采用各種標(biāo)準(zhǔn)技術(shù)分離和純化重組制備的具有245、5283、2490、3963或4036活性的蛋白質(zhì)??梢圆捎玫膶?shí)際技術(shù)將取決于所選宿主生物、蛋白質(zhì)是否設(shè)計(jì)為分泌的、以及本發(fā)明技術(shù)人員所熟知的其它因素(見(jiàn)例如Ausubel,F(xiàn).等,“當(dāng)代分子生物學(xué)實(shí)驗(yàn)指南(Current Protocols inMolecular Biology)”,第16章,John Wiley & Sons公司出版(1994))。
重組產(chǎn)生的具有245、5283、2490、3963或4036活性的蛋白質(zhì)可以用于多種目的。例如,它們可以用于體外分析以對(duì)未鑒定出其靶標(biāo)的已知除草劑化學(xué)制品進(jìn)行篩選,以確定其是否對(duì)245、5283、2490、3963或4036活性產(chǎn)生抑制。這樣的體外分析還可以用作更一般的篩選,以鑒定抑制該酶活性并由此成為新的除草劑候選分子的化學(xué)制品。或者,可以應(yīng)用重組產(chǎn)生的具有245、5283、2490、3963或4036活性的蛋白質(zhì),闡明這些分子的復(fù)雜結(jié)構(gòu)并進(jìn)一步分析它們與抑制劑結(jié)合的特點(diǎn),以便合理地設(shè)計(jì)新的抑制性除草劑以及酶的除草劑耐受形式。
體外抑制劑分析發(fā)現(xiàn)分別與SEQ ID NO1、SEQ ID NO3、SEQ IDNO5、SEQ ID NO7或SEQ ID NO9的基因產(chǎn)物相互作用的小分子配體一旦一個(gè)蛋白質(zhì)已被鑒定為潛在的除草劑靶標(biāo)之后,下一步是開(kāi)發(fā)允許對(duì)大量化學(xué)制品進(jìn)行篩選的分析試驗(yàn),以確定與該蛋白質(zhì)相互作用的化學(xué)制品。盡管開(kāi)發(fā)針對(duì)已知功能的蛋白質(zhì)的分析試驗(yàn)是簡(jiǎn)單的,但開(kāi)發(fā)關(guān)于未知功能的蛋白質(zhì)的分析試驗(yàn)則較為困難。該難題可通過(guò)使用能在不了解蛋白質(zhì)的生物學(xué)功能時(shí)檢測(cè)蛋白質(zhì)與化合物之間相互作用的技術(shù)來(lái)克服。本文給出了三種方法的簡(jiǎn)短描述,它們包括熒光相關(guān)光譜學(xué)、表面增強(qiáng)激光解吸/電離(surface-enhanced laser desorption/ionization)、和biacore技術(shù)。
熒光相關(guān)光譜學(xué)(FCS)的理論出現(xiàn)于1972年,但僅在近年才有了實(shí)施FCS的技術(shù)(Madge等,(1972)Phys.Rev.Lett.,29705-708;Malti等(1997)美國(guó)國(guó)家科學(xué)院院刊,9411753-11757)。FCS測(cè)量在小樣品體積中熒光分子的平均擴(kuò)散速率。該樣品的大小可以低至103個(gè)熒光分子,該樣品的體積可以低至單個(gè)細(xì)菌的細(xì)胞質(zhì)。擴(kuò)散速率是分子質(zhì)量的函數(shù),并隨著質(zhì)量的增加而降低。因此可以將FCS應(yīng)用于蛋白質(zhì)-配體的相互作用分析,方法是測(cè)量結(jié)合導(dǎo)致的質(zhì)量改變以及由此引起的分子擴(kuò)散速率的改變。在一個(gè)典型實(shí)驗(yàn)中,將待分析的目標(biāo)表達(dá)成在N或C端插有序列標(biāo)記物例如聚組氨酸序列的重組蛋白質(zhì)。該表達(dá)在大腸桿菌、酵母或昆蟲(chóng)細(xì)胞中進(jìn)行。通過(guò)層析純化該蛋白質(zhì)。例如,可以利用聚組氨酸標(biāo)記物使表達(dá)的蛋白質(zhì)與金屬鏊合柱例如鏊合在亞氨基二乙酸瓊脂糖上的Ni2+結(jié)合。然后用熒光標(biāo)記物例如羧基四甲基羅丹明或BODIPY(Molecular Probes,Eugene,OR)標(biāo)記該蛋白質(zhì)。之后將該蛋白質(zhì)在溶液中暴露給可能的配體,并采用可獲自Carl Zeiss公司(Thornwood,NY)的儀器通過(guò)FCS測(cè)量其擴(kuò)散速率。通過(guò)該蛋白質(zhì)擴(kuò)散速率的改變確定配體的結(jié)合。
表面增強(qiáng)激光解吸/電離(SELDI)是Hutchens和Yip在20世紀(jì)80年代后期發(fā)明的(Hutchens和Yip(1993)Rapid Commun.Mass Spectrom.7576-580)。當(dāng)與飛行時(shí)間質(zhì)譜儀(TOF)偶聯(lián)時(shí),SELDI提供了一種快速分析保留在芯片上的分子的方法。通過(guò)將靶蛋白質(zhì)共價(jià)結(jié)合在芯片上,并通過(guò)MS分析與該蛋白質(zhì)結(jié)合的小分子,能夠?qū)ELDI應(yīng)用于配體-蛋白質(zhì)相互作用分析(Worrall等(1998)分析生物化學(xué)(Anal.Biochem.)70750-756)。在一個(gè)典型的實(shí)驗(yàn)中,按用于FCS的所述方式表達(dá)待分析的目標(biāo)。然后將純化的蛋白質(zhì)用于該分析,而不需要進(jìn)一步制備。通過(guò)利用聚組氨酸標(biāo)記物或通過(guò)其它相互作用例如離子交換或疏水相互作用,將該蛋白質(zhì)與SELDI芯片結(jié)合。然后通過(guò)例如能夠以順序方式吸取配體的遞送系統(tǒng)(自動(dòng)進(jìn)樣器),將由此制備的芯片暴露給可能的配體。然后對(duì)該芯片進(jìn)行遞增嚴(yán)緊度的洗滌,例如用含有遞增離子強(qiáng)度的緩沖溶液進(jìn)行一系列洗滌。每次洗滌之后,通過(guò)將該芯片送至SELDI-TOF,分析結(jié)合的物質(zhì)。特異地與靶標(biāo)結(jié)合的配體將通過(guò)需要洗脫它們的洗滌嚴(yán)緊性來(lái)鑒定。
Biacore以固定在表層的蛋白質(zhì)與配體的結(jié)合導(dǎo)致的表層反射率的改變?yōu)榛A(chǔ)。在該系統(tǒng)中,將大量小配體順序地注入帶有固定化蛋白質(zhì)的一個(gè)2-5μl的小室中。通過(guò)表面等離子共振(surface plasmonresonance,SPR)記錄該表面反射的激光,以檢測(cè)結(jié)合。一般,針對(duì)表面層的給定質(zhì)量濃度變化的反射率改變實(shí)際上對(duì)于所有蛋白質(zhì)和肽都是相同的,這就允許可以將一個(gè)單一的方法應(yīng)用于任何蛋白質(zhì)(Liedberg等(1983)Sensors Actuators 4299-304;Malmquist(1993)自然(Nature)361186-187)。在一個(gè)典型的實(shí)驗(yàn)中,按用于FCS的所述方式表達(dá)待分析的目標(biāo)。然后無(wú)需進(jìn)一步制備即可將該純化蛋白質(zhì)用于該分析。通過(guò)利用聚組氨酸標(biāo)記物或通過(guò)其它相互作用例如離子交換或疏水相互作用,使該蛋白質(zhì)與Biacore芯片結(jié)合。然后通過(guò)整合在Biacore(Uppsala,瑞典)出售的儀器中用于以順序方式吸取配體的遞送系統(tǒng)(自動(dòng)進(jìn)樣器),將由此制備的芯片暴露給可能的配體。記錄芯片上的SPR信號(hào),反射率的改變反映了固定的靶標(biāo)與配體之間的相互作用。信號(hào)動(dòng)力學(xué)開(kāi)關(guān)速率的分析使得可以區(qū)分非特異和特異相互作用。
而且,對(duì)于與多肽相互作用的小分子配體的分析也是抑制劑分析。例如,用于鑒定必需植物基因例如245、5283、2490、3963或4036基因的抑制劑的此類(lèi)抑制劑分析包括步驟a)在存在如下蛋白質(zhì)功能的可疑抑制劑的情況下,使植物的245、5283、2490、3963或4036蛋白質(zhì)與其底物反應(yīng);b)比較存在此可疑抑制劑時(shí)的酶活性速度和相同條件下不存在該可疑抑制劑時(shí)的酶活性速度;和c)確定該可疑抑制劑是否抑制了245、5283、2490、3963或4036蛋白質(zhì)。
例如,可以通過(guò)該分析中245、5283、2490、3963或4036活性的降低或完全抑制,確定對(duì)植物245、5283、2490、3963或4036蛋白質(zhì)的抑制性作用。該確定可以通過(guò)比較在有和無(wú)該候選抑制劑的情況下反應(yīng)過(guò)程中用掉的底物或產(chǎn)生的中間物或產(chǎn)物的量來(lái)實(shí)現(xiàn)。
在一個(gè)實(shí)施方案中,將例如通過(guò)體外篩選鑒定的可疑除草劑,以不同濃度施用給植物。優(yōu)選將該可疑除草劑噴灑在植物上。在施用了該可疑除草劑之后,記錄其對(duì)植物產(chǎn)生的影響,例如死亡或生長(zhǎng)抑制。
在另一個(gè)實(shí)施方案中,針對(duì)245、5283、2490、3963或4036活性之抑制劑的體內(nèi)篩選方法,應(yīng)用能夠超量表達(dá)具有245、5283、2490、3963或4036活性的核苷酸序列的轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞,其中該245、5283、2490、3963或4036基因產(chǎn)物在該轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞中具有酶活性。該核苷酸序列優(yōu)選來(lái)自真核生物,例如酵母,但優(yōu)選來(lái)自植物。在一個(gè)更優(yōu)選的實(shí)施方案中,該核苷酸序列與SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中所示核苷酸序列一致或基本相似,或編碼具有245、5283、2490、3963或4036活性的酶,其氨基酸序列分別與SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10中所示氨基酸序列一致或基本相似。在另一個(gè)優(yōu)選實(shí)施方案中,該核苷酸序列來(lái)源于原核生物,優(yōu)選細(xì)菌例如大腸桿菌。
然后將化學(xué)制品施用于該轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞以及等基因的非轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞,并在施用了該化學(xué)制品后確定和比較該轉(zhuǎn)基因和非轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞的生長(zhǎng)或生活力。選擇能夠抑制非轉(zhuǎn)基因植物的生長(zhǎng),但又不影響轉(zhuǎn)基因植物的生長(zhǎng)的化合物,作為245、5283、2490、3963或4036活性的抑制劑。
本發(fā)明還指向耐受如下除草劑的植物、植物組織、植物種子和植物細(xì)胞,該除草劑抑制這些植物中天然存在的245、5283、2490、3963或4036活性,其中該耐受性分別由改變的245、5283、2490、3963或4036活性賦予。改變的245、5283、2490、3963或4036活性可以根據(jù)本發(fā)明通過(guò)增加除草劑敏感的野生型245、5283、2490、3963或4036基因的表達(dá)賦予植物,例如通過(guò)提供額外的野生型245、5283、2490、3963或4036基因,和/或通過(guò)例如用強(qiáng)啟動(dòng)子驅(qū)動(dòng)表達(dá)的方式分別超量表達(dá)內(nèi)源性245、5283、2490、3963或4036基因來(lái)進(jìn)行。還可以通過(guò)分別在植物中表達(dá)與SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9基本相似的核苷酸序列或它們的同系物來(lái)獲得改變的245、5283、2490、3963或4036活性。更進(jìn)一步地,可以通過(guò)在植物中分別表達(dá)修飾的除草劑耐受性245、5283、2490、3963或4036基因,賦予該植物改變的245、5283、2490、3963或4036活性。還可以應(yīng)用這些技術(shù)的組合。代表性植物包括為了達(dá)到其通常預(yù)期的目的而應(yīng)用這些除草劑的任何植物。優(yōu)選農(nóng)業(yè)經(jīng)濟(jì)上重要的農(nóng)作物例如棉花、大豆、產(chǎn)油料種子的歐洲油菜、甜菜、玉米、稻、小米、大麥、燕麥、黑麥、高粱、小米、草皮、飼料草、草皮草等等。
通過(guò)增加表達(dá)分別實(shí)現(xiàn)改變的245活性或5283、2490、3963或4036活性,結(jié)果分別導(dǎo)致植物細(xì)胞中245活性或5283、2490、3963或4036活性的水平可以至少足以克服由如下施用量的除草劑造成的生長(zhǎng)抑制,所述施用量為足以抑制對(duì)照植物的正常生長(zhǎng)的量。表達(dá)的酶水平一般是天然表達(dá)量的至少2倍,優(yōu)選至少5倍,更優(yōu)選至少10倍。增加的表達(dá)可以是由于植物細(xì)胞中分別多拷貝的野生型245基因或5283、2490、3963或4036基因;在該基因中編碼序列的多次出現(xiàn)(即基因擴(kuò)增),或內(nèi)源性基因的非編碼調(diào)節(jié)序列中的突變?cè)斐傻摹>哂性摳淖兊幕蚧钚缘闹参锟梢酝ㄟ^(guò)本領(lǐng)域已知的方法在植物中直接篩選獲得(見(jiàn)例如美國(guó)專(zhuān)利5,162,602和美國(guó)專(zhuān)利4,761,373,以及其中引用的參考文獻(xiàn))。這些植物還可以通過(guò)本領(lǐng)域已知的遺傳工程技術(shù)獲得。除草劑敏感性245基因或5283、2490、3963或4036基因表達(dá)的分別增加還可以通過(guò)用如下重組或嵌合DNA分子轉(zhuǎn)化植物細(xì)胞來(lái)實(shí)現(xiàn),所述DNA分子含有能夠在植物細(xì)胞中驅(qū)動(dòng)相連的結(jié)構(gòu)基因表達(dá)的啟動(dòng)子,而且該啟動(dòng)子可操作地與分別編碼245蛋白質(zhì)或5283、2490、3963或4036蛋白質(zhì)的同源或異源結(jié)構(gòu)基因或它們的同系物相連。優(yōu)選地,該轉(zhuǎn)化是穩(wěn)定的,籍此提供可遺傳的轉(zhuǎn)基因性狀。
根據(jù)該實(shí)施方案,用如下重組DNA分子穩(wěn)定轉(zhuǎn)化植物、植物組織、植物種子或植物細(xì)胞,該DNA分子含有可操作地與分別編碼除草劑耐受形式245、5283、2490、3963或4036蛋白質(zhì)的編碼序列連接的并能在植物中起作用的適合啟動(dòng)子。該酶的除草劑耐受形式具有至少一個(gè)氨基酸替代、添加或缺失,它們賦予了對(duì)抑制該酶未修飾天然存在形式的除草劑的耐受性。然后通過(guò)常規(guī)篩選技術(shù)篩選由此產(chǎn)生的轉(zhuǎn)基因植物、植物組織、植物種子或植物細(xì)胞,籍此分離除草劑耐受株系,并對(duì)其進(jìn)行表征和開(kāi)發(fā)。以下描述了分別用于獲得編碼除草劑耐受形式245、5283、2490、3963或4036蛋白質(zhì)的基因的方法一個(gè)一般的策略涉及對(duì)微生物的直接或間接的誘變過(guò)程。例如,可以使用誘變劑例如UV光,或者乙基或甲基甲磺酸,對(duì)可遺傳操作的微生物例如大腸桿菌或釀酒酵母進(jìn)行體內(nèi)隨機(jī)誘變。誘變程序描述于例如Miller,分子遺傳學(xué)實(shí)驗(yàn)(Experiments in Molecular Genetics),ColdSpring Harbor Laboratory,Cold Spring Harbor,NY(1972);Davis等,高級(jí)細(xì)菌遺傳學(xué)(Advanced Bacterial Genetics),Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1980);Sherman等,酵母遺傳學(xué)方法(Methods in Yeast Genetics),Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1983);和美國(guó)專(zhuān)利4,975,374。選擇用于誘變的微生物分別含有正常的抑制劑敏感性245、5283、2490、3963或4036基因,并依賴于該基因所賦予的活性。在存在對(duì)未修飾基因產(chǎn)生抑制的抑制劑濃度時(shí),生長(zhǎng)該誘變細(xì)胞。選擇存在抑制劑時(shí)比未誘變的微生物生長(zhǎng)更好的誘變微生物菌落(即表現(xiàn)出對(duì)該抑制劑的抗性),用于進(jìn)一步分析。通過(guò)克隆或通過(guò)PCR擴(kuò)增,從這些菌落分離出分別賦予對(duì)該抑制劑的耐受性的245、5283、2490、3963或4036基因,并闡明它們的序列。然后將編碼改變的基因產(chǎn)物的序列克隆回該微生物,以驗(yàn)證它們賦予抑制劑耐受性的能力。
獲得植物245、5283、2490、3963或4036基因的突變除草劑耐受性等位基因的方法,涉及在植物中進(jìn)行直接篩選。例如,可以通過(guò)將經(jīng)本領(lǐng)域已知方法消毒的種子置于含有遞增濃度抑制劑的簡(jiǎn)單極限鹽培養(yǎng)基平板上,確定誘變的245、5283、2490、3963或4036基因?qū)κ蠖鎸?、大豆或玉米等植物生長(zhǎng)抑制的影響。所述濃度的范圍是百萬(wàn)分之0.001、0.003、0.01、0.03、0.1、0.3、1、3、10、30、110、300、1000和3000(ppm)。能夠重復(fù)檢測(cè)到顯著生長(zhǎng)抑制的最低劑量被用于隨后的實(shí)驗(yàn)中。該最低劑量的確定在本領(lǐng)域中是常規(guī)的。
利用植物材料的誘變?cè)黾釉谒x擇的群體中抗性等位基因發(fā)生的頻率。誘變的種子材料來(lái)自各種來(lái)源,包括化學(xué)或物理誘變的種子,或化學(xué)或物理誘變的花粉(Neuffer,用于生物研究的玉米(Maize forBiological Research)Sheridan編,Univ.Press,Grand Forks,ND.,第61-64頁(yè)(1982)),然后用此花粉對(duì)植物受精,并收集獲得的M1突變種子。典型地,對(duì)于鼠耳芥屬,從經(jīng)化學(xué)制品例如乙基甲磺酸或經(jīng)物理因素例如γ射線或快中子誘變的種子生長(zhǎng)出的植物獲得后代種子,即M2種子(Lehie Seeds,Tucson,AZ),將該種子以高達(dá)10,000個(gè)種子/平板(直徑10cm)的密度接種在含有合適抑制劑濃度的極限鹽培養(yǎng)基上,以對(duì)耐受性進(jìn)行篩選。將接種后持續(xù)生長(zhǎng)并保持綠色7-21天的幼苗移植到土壤中,并使其生長(zhǎng)至成熟并結(jié)籽。測(cè)試這些種子的后代對(duì)于該除草劑的耐受性。如果該耐受性性狀是顯性的,其種子以3∶1/抗性敏感性的比例分離的植物被認(rèn)為在M2代是抗性雜合的。產(chǎn)生所有抗性種子的植物被認(rèn)為在M2代是抗性純合的。這種在完整種子上進(jìn)行的誘變并對(duì)它們的M2代種子進(jìn)行篩選還可以在其它物種例如大豆上進(jìn)行(見(jiàn)例如美國(guó)專(zhuān)利5,084,082)。或者,可以通過(guò)用經(jīng)化學(xué)或物理方法誘變的花粉進(jìn)行受精,獲得用于除草劑耐受性篩選的突變種子。
按以下舉例說(shuō)明的方法,驗(yàn)證該除草劑耐受性的遺傳基礎(chǔ)分別是245、5283、2490、3963或4036基因。首先,采用PCR,以及分別基于SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中所示鼠耳芥屬cDNA編碼序列的引物,更優(yōu)選基于用來(lái)產(chǎn)生耐受性等位基因的植物的未改變245、5283、2490、3963或4036基因序列的引物,從表現(xiàn)出對(duì)該除草劑具有抗性的植物分別分離出該245、5283、2490、3963或4036基因的等位基因。在對(duì)這些等位基因測(cè)序以確定編碼序列中是否存在突變之后,用這些推測(cè)的賦予耐受性的等位基因轉(zhuǎn)化植物,并測(cè)試這些等位基因賦予該植物耐受此抑制劑的能力。這些植物可以是鼠耳芥屬植物,或可以是其生長(zhǎng)分別對(duì)245、5283、2490、3963或4036的抑制劑敏感的任何其它植物。其次,相對(duì)于已知的限制性片斷長(zhǎng)度多態(tài)性(RFLP)(見(jiàn)例如Chang等,美國(guó)國(guó)家科學(xué)院院刊856856-6860(1988);Nam等,植物細(xì)胞(Plant Cell)1699-705(1989))、斷裂的擴(kuò)增多態(tài)序列(CAPS)(Konieczny和Ausubel(1993)植物雜志(The Plant Jounal),4(2)403-410)、或SSLPs(Bell和Ecker(1994)基因組(Genomics),19137-144),對(duì)插入的245、5283、2490、3963或4036基因進(jìn)行作圖。采用相同的標(biāo)記獨(dú)立地對(duì)該245、5283、2490、3963或4036抑制劑耐受性性狀分別作圖。若耐受性分別是由于245、5283、2490、3963或4036基因中的突變引起的,則該耐受性性狀在圖譜上的位置將難以與245、5283、2490、3963或4036基因的位置區(qū)分開(kāi)來(lái)。
獲得245、5283、2490、3963或4036基因的除草劑耐受性等位基因的另一種方法是在植物細(xì)胞培養(yǎng)物中進(jìn)行篩選。將目的植物的植物組織例如胚、葉盤(pán)等的外植體,或活躍生長(zhǎng)的愈傷組織或懸浮培養(yǎng)物,生長(zhǎng)在含有遞增濃度的抑制性除草劑或適用于實(shí)驗(yàn)室環(huán)境的類(lèi)似抑制劑的培養(yǎng)基上。記錄不同培養(yǎng)物的生長(zhǎng)改變程度。在某些培養(yǎng)物中,出現(xiàn)出甚至在有正常抑制性濃度的抑制劑情況下也能持續(xù)生長(zhǎng)的快速生長(zhǎng)變異集落。這種較快的生長(zhǎng)變異體的發(fā)生頻率能夠通過(guò)在將該組織或細(xì)胞暴露給抑制劑之前用化學(xué)或物理誘變劑進(jìn)行處理來(lái)提高。按前面段落中描述的方法分別分離并檢測(cè)該245、5283、2490、3963或4036基因的推測(cè)賦予耐受性的等位基因。然后可以改造那些被鑒定為賦予除草劑耐受性的等位基因,以獲得最佳表達(dá),并用其轉(zhuǎn)化植物?;蛘撸梢詮暮羞@些等位基因的組織或細(xì)胞培養(yǎng)物再生植物。
再一個(gè)方法涉及在細(xì)菌或酵母中分別對(duì)野生型除草劑敏感植物的245、5283、2490、3963或4036基因進(jìn)行誘變,之后在含有抑制性濃度(即足以造成異常生長(zhǎng)、抑制生長(zhǎng)或引起細(xì)胞死亡的濃度)的該抑制劑的培養(yǎng)基上培養(yǎng)該微生物,然后篩選在該抑制劑存在時(shí)正常生長(zhǎng)的那些集落。更具體地,將植物cDNA,例如分別編碼245、5283、2490、3963或4036蛋白質(zhì)的鼠耳芥屬cDNA,克隆至本來(lái)缺少該245、5283、2490、3963或4036活性的微生物中。然后通過(guò)本領(lǐng)域已知的幾種化學(xué)或酶學(xué)方法之任意一種,例如亞硫酸氫鈉(Shortle等,酶學(xué)方法(Methods Enzymol.)100457-468(1983));甲氧胺(Kadonaga等,核酸研究131733-1745(1985));寡核苷酸指導(dǎo)的飽和誘變(Hutchinson等,美國(guó)國(guó)家科學(xué)院院刊83710-714(1986));或各種聚合酶錯(cuò)誤摻入策略(見(jiàn)例如Shortle等,美國(guó)國(guó)家科學(xué)院院刊791588-1892(1982);Shiraishi等,基因(Gene)64313-319(1988);和Leung等,技術(shù)(Technique)111-15(1989)),對(duì)該轉(zhuǎn)化的微生物進(jìn)行體內(nèi)誘變或體外誘變。挑取在存在正常抑制性濃度的抑制劑時(shí)生長(zhǎng)正常的菌落,并通過(guò)重復(fù)再次劃線進(jìn)行純化。純化它們的質(zhì)粒,并通過(guò)將其重新轉(zhuǎn)化至分別缺少245、5283、2490、3963或4036活性的微生物中,測(cè)試其賦予對(duì)該抑制劑的耐受性的能力。然后確定通過(guò)該測(cè)試的質(zhì)粒的cDNA插入片斷的DNA序列。
也可以采用涉及體外重組,又稱(chēng)DNA改組的方法,分別獲得除草劑抗性245、5283、2490、3963或4036蛋白質(zhì)。通過(guò)DNA改組,分別向編碼245、5283、2490、3963或4036活性的核苷酸序列中引入突變,優(yōu)選隨機(jī)突變。DNA改組還導(dǎo)致分別在245、5283、2490、3963或4036基因內(nèi)的序列重組和重排,或分別在兩個(gè)或多個(gè)不同的245、5283、2490、3963或4036基因之間的序列重組或交換。這些方法使得可以分別產(chǎn)生無(wú)數(shù)的突變245、5283、2490、3963或4036編碼序列。對(duì)這些突變基因或改組基因進(jìn)行篩選,以鑒別期望的性質(zhì)例如改良的除草劑耐受性,或鑒別提供對(duì)不同類(lèi)型抑制劑化學(xué)的廣譜耐受性的突變。這些篩選完全屬于本領(lǐng)域的常規(guī)技術(shù)范圍之內(nèi)。
在一個(gè)優(yōu)選的實(shí)施方案中,分別從至少一個(gè)245、5283、2490、3963或4036基因模板分別形成誘變的245、5283、2490、3963或4036基因,其中分別將該模板245、5283、2490、3963或4036基因斷裂成具有期望大小的雙鏈隨機(jī)片斷,并包含步驟向所獲得的該雙鏈隨機(jī)片斷群體加入一或多個(gè)單鏈或雙鏈寡核苷酸,其中所述寡核苷酸含有與該雙鏈隨機(jī)片斷一致的區(qū)域和異源的區(qū)域;將獲得的該雙鏈隨機(jī)片斷和寡核苷酸混合物變性為單鏈片斷;在導(dǎo)致所述單鏈片斷在所述的一致區(qū)域退火以形成退火片斷對(duì)的條件下,將獲得的該單鏈片斷群體與聚合酶一起孵育,所述一致區(qū)域足以使一對(duì)中的一個(gè)成員引發(fā)另一個(gè)的復(fù)制,由此形成誘變的雙鏈多核苷酸;再重復(fù)第二步和第三步至少兩個(gè)循環(huán),其中下一個(gè)循環(huán)第二步中的所獲混合物包括來(lái)自前一個(gè)循環(huán)第三步的誘變雙鏈多核苷酸,并且此下一個(gè)循環(huán)形成進(jìn)一步誘變的雙鏈多核苷酸,其中該誘變多核苷酸分別是對(duì)于分別抑制天然存在的245、5283、2490、3963或4036活性的除草劑具有增強(qiáng)耐受性的突變245、5283、2490、3963或4036基因。在一個(gè)優(yōu)選實(shí)施方案中,該雙鏈隨機(jī)片斷群體中單個(gè)種類(lèi)雙鏈隨機(jī)片斷的濃度不少于總DNA重量的1%。在又一優(yōu)選實(shí)施方案中,該模板雙鏈多核苷酸含有至少大約100種多核苷酸。在另一個(gè)優(yōu)選實(shí)施方案中,該雙鏈隨機(jī)片斷的大小從大約5bp至大約5kb。在又一優(yōu)選實(shí)施方案中,該方法的第四個(gè)步驟包括重復(fù)該第二和第三個(gè)步驟至少10個(gè)循環(huán)。該方法描述于例如Stemmer等(1994)自然370389-391,美國(guó)專(zhuān)利5,605,793,美國(guó)專(zhuān)利5,811,238,和Crameri等(1998)自然391288-291,以及WO97/20078,這些文獻(xiàn)以參考文獻(xiàn)方式并入本文。
在另一個(gè)優(yōu)選實(shí)施方案中,按例如Zhao等(1998)自然生物技術(shù)(Nature Biotechnology)16258-261中描述的方法,通過(guò)交錯(cuò)延伸方法(StEP),對(duì)兩個(gè)或多個(gè)不同的245基因的任意組合進(jìn)行體外誘變。此兩或多個(gè)245基因用作PCR擴(kuò)增的模板,PCR反應(yīng)的延伸循環(huán)優(yōu)選在比聚合酶的最佳聚合溫度低的溫度下進(jìn)行。以相似的方式,對(duì)5283、2490、3963或4036基因進(jìn)行StEP。例如,當(dāng)采用具有大約72℃最佳溫度的熱穩(wěn)定聚合酶時(shí),該延伸反應(yīng)的溫度期望低于72℃,更期望低于65℃,優(yōu)選低于60℃,更優(yōu)選該延伸反應(yīng)的溫度為55℃。此外,該P(yáng)CR循環(huán)的延伸反應(yīng)持續(xù)時(shí)間期望比本領(lǐng)域通常所用的短,更期望是少于30秒,優(yōu)選少于15秒,更優(yōu)選該延伸反應(yīng)的持續(xù)時(shí)間為5秒。在每一個(gè)延伸反應(yīng)中僅聚合一個(gè)短的DNA片斷,使得每一個(gè)循環(huán)的變性和退火之后可以在起始DNA分子之間交換作為延伸產(chǎn)物的模板,籍此在延伸產(chǎn)物中產(chǎn)生多樣性。PCR反應(yīng)中循環(huán)的最佳數(shù)目分別取決于待誘變的245、5283、2490、3963或4036基因的長(zhǎng)度,但期望大于40個(gè)循環(huán),更期望大于60個(gè)循環(huán),優(yōu)選采用80個(gè)以上的循環(huán)。對(duì)于245、5283、2490、3963或4036基因各自的每種組合,最佳延伸條件和最佳的PCR循環(huán)數(shù)可以按本領(lǐng)域熟知方法進(jìn)行確定。該P(yáng)CR反應(yīng)的其它參數(shù)與本領(lǐng)域通常采用的基本相同。用于該擴(kuò)增反應(yīng)的引物優(yōu)選設(shè)計(jì)為能與位于該245、5283、2490、3963或4036基因之外的DNA序列,例如與分別含有該245、5283、2490、3963或4036基因的載體的DNA序列退火,籍此分別用于該P(yáng)CR反應(yīng)的不同245、5283、2490、3963或4036基因優(yōu)選包含在不同的載體中。這些引物期望與分別位于245、5283、2490、3963或4036序列之外不足500bp,優(yōu)選不足200bp,更優(yōu)選分別距離245、5283、2490、3963或4036序列不足120bp的序列退火。優(yōu)選該245、5283、2490、3963或4036序列分別被限制性位點(diǎn)圍繞,這些限制性位點(diǎn)包括在PCR反應(yīng)期間擴(kuò)增的DNA序列中,籍此利于該擴(kuò)增產(chǎn)物克隆至適合的載體中。在另一個(gè)優(yōu)選的實(shí)施方案中,按WO98/05765中所描述的方法,分別制備帶有粘性末端的245、5283、2490、3963或4036基因片斷??梢酝ㄟ^(guò)將分別相應(yīng)于245、5283、2490、3963或4036基因一部分的第一寡核苷酸與第二寡核苷酸相連,來(lái)制備該粘性末端,其中該第二寡核苷酸是該基因中所不存在的,或是與第一寡核苷酸所相應(yīng)的基因部分不相鄰的該基因一部分,并且該第二寡核苷酸含有至少一個(gè)核糖核苷酸。采用第一寡核苷酸作為模板,第二寡核苷酸作為引物,制備雙鏈DNA。切割該核糖核苷酸,并將其除去。還除去位于該核糖核苷酸5’端的核苷酸,結(jié)果獲得具有粘性末端的雙鏈片斷。這些片斷通過(guò)連接被隨機(jī)地重新組裝起來(lái),獲得新的基因序列組合。
在本發(fā)明中,采用任何單個(gè)的245、5283、2490、3963或4036基因,或245、5283、2490、3963或4036基因的任何組合用于體外重組,例如,分別獲自植物例如鼠耳芥的245、5283、2490、3968或4036基因,例如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9中分別顯示的245、5283、2490、3963或4036基因,或分別來(lái)自大腸桿菌的245樣、5283樣、2490樣、3963樣或4036樣基因(Craigen等(1985)美國(guó)國(guó)家科學(xué)院院刊823616-3620;Craigen和Caskey(1987)Biochimie,691031-1041;Ito等(1998)美國(guó)國(guó)家科學(xué)院院刊958165-8169;所有這些文獻(xiàn)均以參考文獻(xiàn)方式并入本文)。在本發(fā)明中采用了單個(gè)的完整245、5283、2490、3963或4036基因或其部分。將分別通過(guò)以上描述的方法獲得的突變245、5283、2490、3963或4036基因文庫(kù)克隆至適合的表達(dá)載體中,并用該所獲得的載體轉(zhuǎn)化適當(dāng)宿主,例如衣藻(chlamydomonas)等藻類(lèi)、酵母或細(xì)菌。適當(dāng)?shù)乃拗鲀?yōu)選本身缺少245、5283、2490、3963或4036活性的宿主,例如大腸桿菌。將分別用含有245、5283、2490、3963或4036基因文庫(kù)的載體轉(zhuǎn)化的宿主細(xì)胞培養(yǎng)在含有抑制性濃度之抑制劑的培養(yǎng)基上,并篩選在存在抑制劑時(shí)生長(zhǎng)的那些菌落。挑取存在正常抑制性濃度的抑制劑時(shí)生長(zhǎng)的菌落,并通過(guò)重復(fù)再劃線進(jìn)行純化。純化它們的質(zhì)粒,然后測(cè)定通過(guò)該測(cè)試的質(zhì)粒中cDNA插入片斷的DNA序列。
可以采用與用于分別鑒定245、5283、2490、3963或4036活性之抑制劑的方法(抑制劑分析實(shí)驗(yàn),見(jiàn)上)相同的方法,分別對(duì)耐受抑制劑的修飾245、5283、2490、3963或4036基因進(jìn)行鑒定,改動(dòng)如下首先,在一個(gè)反應(yīng)混合物中分別用突變的245、5283、2490、3963或4036蛋白質(zhì)替代抑制劑分析實(shí)驗(yàn)中的野生型245、5283、2490、3963或4036蛋白質(zhì)。其次,兩個(gè)反應(yīng)混合物中都存在野生型酶的抑制劑。第三點(diǎn),比較突變活性(存在抑制劑和突變酶時(shí)的活性)和未突變活性(存在抑制劑和野生型酶時(shí)的活性),以確定當(dāng)與未突變活性比較時(shí),在突變活性中是否觀察到酶活性的顯著增加。突變活性是存在適合的底物和該抑制劑時(shí)以任何方式測(cè)量的突變酶活性。未突變活性是存在適合底物和該抑制劑時(shí)以任何方式測(cè)量的野生型酶活性。
除了用于產(chǎn)生除草劑耐受性植物外,分別編碼除草劑耐受性245、5283、2490、3963或4036蛋白質(zhì)的基因還可以用作植物細(xì)胞轉(zhuǎn)化方法中的篩選標(biāo)記。例如,經(jīng)異源DNA序列轉(zhuǎn)化的植物、植物組織、植物種子或植物細(xì)胞也可以用分別編碼改變的245、5283、2490、3963或4036活性并能夠被植物表達(dá)的序列轉(zhuǎn)化。將該轉(zhuǎn)化細(xì)胞轉(zhuǎn)移至含有該酶抑制劑的培養(yǎng)基上,該抑制劑的量將足以抑制不表達(dá)該修飾編碼序列的植物細(xì)胞的生長(zhǎng)或存活,其中僅有轉(zhuǎn)化細(xì)胞可以生長(zhǎng)。該方法可以應(yīng)用于能夠被修飾的245、5283、2490、3963或4036基因轉(zhuǎn)化的任何植物細(xì)胞,而且可以和任何目的異源DNA序列一起使用。該異源DNA序列和該修飾基因的表達(dá)可以由同一個(gè)在植物細(xì)胞中起作用的啟動(dòng)子驅(qū)動(dòng),或由不同的啟動(dòng)子驅(qū)動(dòng)。
可以采用常規(guī)重組DNA技術(shù)分別將245、5283、2490、3963或4036基因的野生型或除草劑耐受性形式,或它們的同系物摻入植物或細(xì)菌細(xì)胞中。一般地,這涉及到采用本領(lǐng)域已知的標(biāo)準(zhǔn)克隆程序分別將編碼該245、5283、2490、3963或4036基因的DNA分子插入表達(dá)系統(tǒng)中,對(duì)于該表達(dá)系統(tǒng)該DNA分子是異源的(即正常并不存在的)。該載體含有使該插入蛋白質(zhì)編碼序列在含有該載體的宿主細(xì)胞中轉(zhuǎn)錄和翻譯的必需元件。本領(lǐng)域已知的大量載體系統(tǒng)都可以使用,例如質(zhì)粒、噬菌體病毒和其它修飾病毒。還可以對(duì)該表達(dá)系統(tǒng)的成分進(jìn)行修飾以增加表達(dá)。例如,可以使用截短序列、核苷酸替代、核苷酸優(yōu)化或其它的修飾。在適合條件下本領(lǐng)域已知的表達(dá)系統(tǒng)均可用于轉(zhuǎn)化實(shí)際上任何農(nóng)作物植物細(xì)胞。分別含有野生型或除草劑耐受型245、5283、2490、3963或4036基因的異源DNA優(yōu)選穩(wěn)定轉(zhuǎn)化并整合至宿主細(xì)胞的基因組中。在另一個(gè)優(yōu)選實(shí)施方案中,分別含有野生型或除草劑耐受型245、5283、2490、3963或4036基因的異源DNA序列位于自我復(fù)制載體上。自我復(fù)制載體的例子是病毒,尤其是雙生病毒。轉(zhuǎn)化細(xì)胞可以再生成全株,以致該選擇形式的245、5283、2490、3963或4036基因在該轉(zhuǎn)基因植物中賦予除草劑耐受性。
首先將期望在轉(zhuǎn)基因植物中表達(dá)的基因序列組裝在表達(dá)盒中,位于能夠在植物中表達(dá)的適合啟動(dòng)子之后。該表達(dá)盒還可以含有對(duì)于該異源DNA序列的表達(dá)所要求或可選擇的任何其它序列。這些序列包括但不限于轉(zhuǎn)錄終止子、增強(qiáng)表達(dá)的外來(lái)序列(例如內(nèi)含子)、關(guān)鍵序列、和旨在使該基因產(chǎn)物靶向特定細(xì)胞器和細(xì)胞區(qū)室的序列。然后可以容易地將這些表達(dá)盒轉(zhuǎn)移到下文描述的植物轉(zhuǎn)化載體上。以下描述了典型表達(dá)盒的各種成分。
用于表達(dá)盒的啟動(dòng)子的選擇將決定該異源DNA序列在該DNA序列轉(zhuǎn)化的植物中的空間和時(shí)間表達(dá)模式。所選啟動(dòng)子將使異源DNA序列在特定的細(xì)胞類(lèi)型(例如葉的表皮細(xì)胞、葉肉細(xì)胞、根的皮層細(xì)胞)中或在特定的組織或器官(例如根、葉或花)中表達(dá),并且該選擇將反映出基因產(chǎn)物積累的期望定位。或者,該選擇的啟動(dòng)子可以驅(qū)動(dòng)該基因在各種誘導(dǎo)條件下表達(dá)。啟動(dòng)子的強(qiáng)度即其啟動(dòng)轉(zhuǎn)錄的能力是不同的。根據(jù)所用的宿主細(xì)胞系統(tǒng),可以使用本領(lǐng)域已知的許多適合啟動(dòng)子之任意一種。例如,對(duì)于組成型表達(dá),可以采用CaMV 35S啟動(dòng)子、水稻肌動(dòng)蛋白啟動(dòng)子或泛素啟動(dòng)子。對(duì)于可調(diào)節(jié)的表達(dá),可以采用來(lái)自煙草或鼠耳芥屬的可化學(xué)誘導(dǎo)的PR-1啟動(dòng)子(見(jiàn)例如美國(guó)專(zhuān)利5,689,044)。
可以獲得多種轉(zhuǎn)錄終止子用于表達(dá)盒中。這些轉(zhuǎn)錄終止子負(fù)責(zé)在該異源DNA序列之外的轉(zhuǎn)錄終止以及該DNA序列的正確聚腺苷酸化。適合的轉(zhuǎn)錄終止子是那些已知在植物中起作用的轉(zhuǎn)錄終止子,包括CaMV 35S終止子、tml終止子、胭脂堿合成酶終止子和豌豆rbcS E9終止子。這些既可用于單子葉植物又可用于雙子葉植物。
已經(jīng)發(fā)現(xiàn)有許多序列可以增強(qiáng)轉(zhuǎn)錄單位中的基因表達(dá),可以將這些序列與本發(fā)明的基因聯(lián)合使用以增強(qiáng)這些基因在轉(zhuǎn)基因植物中的表達(dá)。例如,各種內(nèi)含子序列例如玉米Adhl基因的內(nèi)含子已表現(xiàn)出可以增強(qiáng)表達(dá),尤其是單子葉細(xì)胞中的表達(dá)。此外,還知道許多來(lái)源于病毒的非翻譯前導(dǎo)序列可以增強(qiáng)表達(dá),并且這些序列在雙子葉細(xì)胞中尤其有效。
任選地,為了在目的農(nóng)作物種中獲得最佳表達(dá)可以通過(guò)改變所選基因的編碼序列,以遺傳改造該編碼序列。修飾編碼序列以實(shí)現(xiàn)在特定農(nóng)作物種中最佳表達(dá)的方法是熟知的(見(jiàn)例如Perlak等,美國(guó)國(guó)家科學(xué)院院刊883324(1991);和Koziel等,Bio/technol.11194(1993);Fennoy和Bailey-Serres,核酸研究215294-5300(1993))??紤]到植物基因中以及高等植物、綠藻和藍(lán)細(xì)菌中密碼子的選擇而修飾編碼序列的方法是熟知的(見(jiàn)Murray等,核酸研究17477-498(1989)中表4;Campbell和Gowri植物生理學(xué)(Plant Physiol.)921-11(1990))。
存在于植物中用于基因產(chǎn)物定向的各種機(jī)制是已知的,并且已經(jīng)對(duì)控制這些機(jī)制發(fā)揮作用的序列有了較詳細(xì)的特性分析。例如,基因產(chǎn)物導(dǎo)向葉綠體是由在多種蛋白質(zhì)氨基末端發(fā)現(xiàn)的信號(hào)序列控制的,這些蛋白質(zhì)在輸入葉綠體的過(guò)程中被裂解形成成熟蛋白質(zhì)(例如Comai等,生物化學(xué)雜志26315104-15109(1998))。其它基因產(chǎn)物定位于其它細(xì)胞器例如線粒體和過(guò)氧化物酶體(例如Unger等,植物分子生物學(xué)(PlantMolec.Biol.)13411-418(1989))。還可以對(duì)編碼這些產(chǎn)物的cDNA進(jìn)行操作,以實(shí)現(xiàn)由DNA序列編碼的異源產(chǎn)物向這些細(xì)胞器的定向。此外,也已經(jīng)對(duì)引起DNA序列所編碼的產(chǎn)物導(dǎo)向其它細(xì)胞區(qū)室的序列進(jìn)行了表征。氨基末端序列負(fù)責(zé)導(dǎo)向ER、質(zhì)外體、以及從糊粉細(xì)胞向細(xì)胞外分泌(Koehler & Ho,植物細(xì)胞(Plant Cell)2769-783(1990))。此外,氨基端序列聯(lián)合羧基端序列負(fù)責(zé)基因產(chǎn)物的液泡定向(Shinshi等,植物分子生物學(xué)(Plant Molec.Biol.)14357-368(1990))。通過(guò)將上述的適合靶向序列與目的異源DNA序列融合在一起,可能指導(dǎo)該產(chǎn)物到達(dá)任何細(xì)胞器或細(xì)胞區(qū)室。
可以用于植物轉(zhuǎn)化的許多轉(zhuǎn)化載體是植物轉(zhuǎn)化領(lǐng)域的普通技術(shù)人員所已知的,并且可以將本發(fā)明有關(guān)的基因聯(lián)合任何這樣的載體一起使用。載體的選擇將取決于用于轉(zhuǎn)化的優(yōu)選轉(zhuǎn)化技術(shù)和靶物種。對(duì)于某些靶物種,可能優(yōu)選不同的抗生素或除草劑選擇標(biāo)記。常規(guī)用于轉(zhuǎn)化的選擇標(biāo)記包括賦予卡那霉素以及相關(guān)抗生素抗性的nptll基因(Messing &Vierra,基因(Gene)19259-268(1982);Bevan等,自然304184-187(1983))、賦予除草劑膦絲菌素抗性的bar基因(White等,核酸研究181062(1990);Spencer等,理論應(yīng)用遺傳學(xué)(Theor.Appl.Genet.)79625-631(1990))、賦予抗生素潮霉素抗性的hph基因(Blochinger和Diggelmann,分子細(xì)胞生物學(xué)(Mol.Cell Biol.)42929-2931)、以及賦予氨甲蝶呤抗性的dhfr基因(Bourouis等,EMBO J.2(7)1099-1104(1983))、和賦予草甘膦抗性的EPSPS基因(美國(guó)專(zhuān)利4,940,935和5,188,642)。
對(duì)于采用根癌農(nóng)桿菌(Agrobacterium tumefaciens)的轉(zhuǎn)化,有許多載體可用。這些載體典型地帶有至少一個(gè)T-DNA邊界序列,包括載體例如pBIN19(Bevan,核酸研究(1984))。適用于農(nóng)桿菌轉(zhuǎn)化的典型載體包括二元載體pCIB200和pCIB2001,以及二元載體pCIB10及其潮霉素選擇衍生物(見(jiàn)例如美國(guó)專(zhuān)利5,639,949)。
不使用根癌農(nóng)桿菌的轉(zhuǎn)化避免了在所選轉(zhuǎn)化載體中對(duì)于T-DNA序列的要求,從而除了以上描述的含有T-DNA序列的那些載體之外,還可以利用缺少這些序列的載體。不依賴農(nóng)桿菌的轉(zhuǎn)化技術(shù)包括通過(guò)微粒轟擊、原生質(zhì)體攝取(例如PEG和電穿孔)和顯微注射進(jìn)行的轉(zhuǎn)化。載體的選擇很大程度上取決于對(duì)于轉(zhuǎn)化物種的優(yōu)選篩選方法。適用于非農(nóng)桿菌轉(zhuǎn)化的典型載體包括pCIB3064、pSOG19和pSOG35。(見(jiàn)例如美國(guó)專(zhuān)利5,639,949)。
一旦目的編碼序列被克隆到表達(dá)系統(tǒng)中,即可將其轉(zhuǎn)化植物細(xì)胞。植物轉(zhuǎn)化和再生的方法是本領(lǐng)域所熟知的。例如,Ti質(zhì)粒載體以及直接DNA攝取、脂質(zhì)體、電穿孔、顯微注射和微粒轟擊已經(jīng)被用于遞送外源DNA。此外,還可以利用來(lái)自農(nóng)桿菌屬的細(xì)菌轉(zhuǎn)化植物細(xì)胞。
用于雙子葉植物的轉(zhuǎn)化技術(shù)是本領(lǐng)域所熟知的,包括基于農(nóng)桿菌的技術(shù)和不需農(nóng)桿菌的技術(shù)。非農(nóng)桿菌技術(shù)包括原生質(zhì)體或細(xì)胞直接攝取外源遺傳物質(zhì)。這可以通過(guò)PEG或電穿孔介導(dǎo)的攝取、微粒轟擊介導(dǎo)的遞送或顯微注射來(lái)完成。在所有情況下可以采用本領(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)將轉(zhuǎn)化細(xì)胞再生成全株。
大多數(shù)單子葉植物物種的轉(zhuǎn)化目前也已成為常規(guī)技術(shù)。優(yōu)選的技術(shù)包括采用PEG或電穿孔技術(shù)直接將基因轉(zhuǎn)移至原生質(zhì)體中、微粒轟擊導(dǎo)入愈傷組織、以及農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化。
在另一個(gè)優(yōu)選實(shí)施方案中,將編碼具有糞卟啉原氧化酶活性的多肽的核苷酸序列直接轉(zhuǎn)化至質(zhì)體基因組中。通過(guò)同源重組將基因插入在每個(gè)植物細(xì)胞中存在的幾千個(gè)拷貝的環(huán)狀質(zhì)體基因組中,這樣與核表達(dá)基因相比該質(zhì)體表達(dá)利用了巨大拷貝數(shù)的優(yōu)勢(shì),從而使表達(dá)水平可以容易地超過(guò)可溶性總植物蛋白質(zhì)的10%。在一個(gè)優(yōu)選的實(shí)施方案中,將所述核苷酸序列插入質(zhì)體靶向載體中,并轉(zhuǎn)化至期望植物宿主的質(zhì)體基因組中。從而獲得對(duì)于含有該核苷酸序列的質(zhì)體基因組而言同質(zhì)的植物,并且該植物優(yōu)選能夠高效表達(dá)該核苷酸序列。
質(zhì)體轉(zhuǎn)化技術(shù)廣泛描述于例如美國(guó)專(zhuān)利5,451,513、5,545,817、5,545,818和5,877,462,PCR申請(qǐng)WO95/16783和WO97/32977,以及McBride等(1994)美國(guó)國(guó)家科學(xué)院院刊91,7301-7305,所有這些文獻(xiàn)均完整地以參考文獻(xiàn)方式并入本文。用于質(zhì)體轉(zhuǎn)化的基本技術(shù)包括采用例如生物轟擊(biolistics)或原生質(zhì)體轉(zhuǎn)化(如氯化鈣或PEG介導(dǎo)的轉(zhuǎn)化),將位于選擇標(biāo)記兩側(cè)的克隆質(zhì)體DNA區(qū)域和所述核苷酸序列導(dǎo)入適合的靶組織中。該1-1.5kb的側(cè)翼區(qū)域,又稱(chēng)靶向序列,有利于和質(zhì)體基因組的同源重組,并因此使得可以對(duì)質(zhì)體基因組的特定區(qū)域進(jìn)行置換或修飾。最初,賦予壯觀霉素和/或鏈霉素抗性的葉綠體16S rRNA和rps12基因中的點(diǎn)突變被用作轉(zhuǎn)化的選擇標(biāo)記(Svab,Z.,Hajdukiewicz,P.,和Maliga,P.(1990)美國(guó)國(guó)家科學(xué)院院刊87,8526-8530;Staub,J.M.和Maliga,P.(1992)植物細(xì)胞(Plant Cell)4,39-45)。在這些標(biāo)記之間存在的克隆位點(diǎn)使得可以構(gòu)建用于引入外源基因的質(zhì)體靶向載體(Staub,J.M.和Maliga,P.(1993)EMBO J.12,601-606)。通過(guò)用顯性選擇標(biāo)記置換掉該隱性rRNA或r蛋白質(zhì)抗生素抗性基因,可以獲得實(shí)質(zhì)性增加的轉(zhuǎn)化頻率,所述顯性選擇標(biāo)記是編碼壯觀霉素脫毒酶氨基糖苷-3’-腺苷轉(zhuǎn)移酶的細(xì)菌aadA基因(Svab,Z.,和Maliga,P.(1993)美國(guó)國(guó)家科學(xué)院院刊90,913-917)。其它對(duì)于質(zhì)體轉(zhuǎn)化有用的選擇標(biāo)記是本領(lǐng)域已知的,并包括在本發(fā)明的范圍內(nèi)。
可以分別利用本發(fā)明野生型或改變形式的245、5283、2490、3963或4036基因,賦予多種植物細(xì)胞除草劑耐受性,這些植物細(xì)胞包括裸子植物、單子葉植物和雙子葉植物的植物細(xì)胞。盡管可以將該基因插入屬于該廣泛類(lèi)型的任何植物細(xì)胞中,但在農(nóng)作物植物細(xì)胞中尤其有用,這些農(nóng)作物例如水稻、小麥、大麥、黑麥、玉米、馬鈴薯、胡蘿卜、甘著、甜菜、菜豆、豌豆、菊苣、萵苣、卷心菜、花椰菜、嫩莖花椰菜、蕪菁、蘿卜、菠菜、蘆筍、洋蔥、大蒜、茄子、胡椒、芹菜、胡蘿卜、南瓜、西葫蘆、夏南瓜、黃瓜、蘋(píng)果、梨、溫柏、甜瓜、李子、櫻桃、桃子、油桃、杏、草莓、葡萄、覆盆子、黑莓、菠蘿、鱷梨、木瓜、芒果、香蕉、大豆、煙草、番茄、高粱、甘蔗。
可以將賦予植物除草劑耐受性的野生型245、5283、2490、3963或4036基因的分別高水平表達(dá),和/或除草劑耐受形式的245、5283、2490、3963或4036基因的分別表達(dá),聯(lián)合其它重要的生產(chǎn)和質(zhì)量特性,通過(guò)本領(lǐng)域已知的育種方法和技術(shù)摻入植物株系中。
通過(guò)在農(nóng)作物植物或可以再生出農(nóng)作物植物的植物細(xì)胞培養(yǎng)物中直接篩選,分別獲得除草劑耐受性245、5283、2490、3963或4036等位基因之后,可以采用傳統(tǒng)的育種技術(shù)將這些等位基因引入商業(yè)品種中,以開(kāi)發(fā)除草劑耐受性農(nóng)作物,而無(wú)需對(duì)該等位基因進(jìn)行遺傳操作和用其轉(zhuǎn)化該植物。
通過(guò)參考以下詳細(xì)實(shí)施例,對(duì)本發(fā)明作了進(jìn)一步描述。除非另行指出,提供這些實(shí)施例的目的僅在舉例說(shuō)明,而非旨在限制。
實(shí)施例此處所用標(biāo)準(zhǔn)重組DNA和分子克隆技術(shù)是本領(lǐng)域所熟知的,描述于Sambrook等編,分子克隆(Molecular Cloning),Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1989);和T.J.Silhavy,M.L.Berman,和L.W.Enquist,基因融合實(shí)驗(yàn)(Experiments With GeneFusions),Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984);和Ausubel,F(xiàn).M.等,當(dāng)代分子生物學(xué)實(shí)驗(yàn)指南,GreenePublishing Assoc.和Wiley-Interscience出版(1987);Relter等,鼠耳芥屬研究方法(Methods in Arabidopsis Research),World ScientificPress(1992);和Schultz等,植物分子生物學(xué)手冊(cè)(Plant MolecularBiology Manual),Kluwer Academic Publishers(1998)。這些文獻(xiàn)描述了用于從T-DNA誘變的鼠耳芥屬群體中標(biāo)記和克隆基因;植物感染和轉(zhuǎn)化;篩選以鑒定幼苗突變體;共分離分析;和質(zhì)粒拯救的所有步驟的標(biāo)準(zhǔn)技術(shù)。
實(shí)施例1來(lái)自T-DNA誘變鼠耳芥屬群體的標(biāo)記幼苗致死系#245的序列分析采用質(zhì)粒拯救技術(shù)分子克隆T-DNA誘變所產(chǎn)生的位于T-DNA插入片段一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)限制性酶消化分析以該方式獲得的質(zhì)粒,以便基于消化圖譜對(duì)這些質(zhì)粒進(jìn)行分類(lèi)。對(duì)于每一類(lèi)質(zhì)??寺。_定其DNA序列。分析所獲序列是否存在非T-DNA載體序列。采用slp346for引物(SEQ ID NO11)對(duì)通過(guò)質(zhì)粒拯救方法回收的質(zhì)粒進(jìn)行測(cè)序。引物slp346for提供了緊鄰T-DNA左邊界的側(cè)翼序列的信息。通過(guò)對(duì)來(lái)自245突變純合子的基因組DNA的PCR,確證質(zhì)粒拯救。該P(yáng)CR實(shí)驗(yàn)采用一個(gè)錨定在預(yù)測(cè)的側(cè)翼序列中的引物和slp346for引物(錨定在T-DNA插入片斷內(nèi))?;谫|(zhì)粒拯救克隆的序列,找到具有期望大小的PCR產(chǎn)物,證實(shí)了有效拯救。將從引物slp346for獲得序列用于核苷酸序列數(shù)據(jù)庫(kù)的BLASTx檢索(Altschul等(1990),分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST檢索結(jié)果顯示,該回收的植物側(cè)翼序列表現(xiàn)出與許多原核生物的肽釋放因子2蛋白質(zhì)的高度相似性。該BLAST結(jié)果指出,該T-DNA插入發(fā)生在第一個(gè)鑒定的植物來(lái)源肽釋放因子2的ORF中。通過(guò)采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增鼠耳芥屬的基因組DNA,分離包含肽釋放因子序列相似性的DNA片段。將該片段用于探測(cè)λYES載體中的鼠耳芥屬cDNA文庫(kù)(Elledge等,(1991)美國(guó)國(guó)家科學(xué)院院刊881731-1735)。采用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)分離陽(yáng)性噬菌體克隆,并對(duì)其進(jìn)行特性分析。從該噬菌體切下所獲cDNA克隆,并確定其核苷酸序列。該DNA序列顯示于SEQ IDNO1。采用BLASTx搜索核苷酸序列數(shù)據(jù)庫(kù),分析推導(dǎo)的氨基酸序列(Altschul等(1990)分子生物學(xué)雜志215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST的搜索結(jié)果顯示,該回收的245 cDNA表現(xiàn)出與同一套原核生物的肽釋放因子的序列相似性。
實(shí)施例2來(lái)自T-DNA誘變鼠耳芥屬群體的標(biāo)記幼苗致死系#5283的序列分析采用質(zhì)粒拯救技術(shù)分子克隆T-DNA誘變所產(chǎn)生的位于T-DNA插入片段一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)限制性酶消化分析以該方式獲得的質(zhì)粒,以便基于消化圖譜對(duì)這些質(zhì)粒進(jìn)行分類(lèi)。對(duì)于每一類(lèi)質(zhì)??寺?,確定其DNA序列。分析所獲序列是否存在非T-DNA載體序列。采用slp346for引物(SEQ ID NO11)對(duì)通過(guò)質(zhì)粒拯救方法回收的質(zhì)粒進(jìn)行測(cè)序。引物slp346for提供了緊鄰T-DNA左邊界的側(cè)翼系列的信息。通過(guò)對(duì)來(lái)自5283突變雜合子的基因組DNA的PCR,確證質(zhì)粒拯救。該P(yáng)CR實(shí)驗(yàn)采用一個(gè)錨定在預(yù)測(cè)的側(cè)翼序列中的引物和slp348for引物(SEQ IDNO15)(錨定在T-DNA插入片段內(nèi))?;谫|(zhì)粒拯救克隆的序列,找到具有期望大小的PCR產(chǎn)物,證實(shí)了有效拯救。
將從引物slp346for獲得序列用于對(duì)核苷酸序列數(shù)據(jù)庫(kù)進(jìn)行BLASTn檢索(Altschul等(1990),分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST檢索結(jié)果顯示,該回收序列與位于鼠耳芥屬第1號(hào)染色體中的基因組DNA BACT13D8(Genbank索取號(hào)AC004473)一致。設(shè)計(jì)與BAC T13D8序列中#32,964-32,987位核苷酸反向互補(bǔ)的引物L(fēng)W60(SEQ ID NO16)(5’-aaacgcttaccatatctctttcta-3’),并用于確定該T-DNA插入片段下游的序列;該實(shí)驗(yàn)鑒定了右邊界的連接處。該T-DNA插入所發(fā)生的基因組DNA區(qū)域包括標(biāo)注的BAC T13D8序列的#32,879至#32,885位堿基,結(jié)果導(dǎo)致一個(gè)6堿基缺失。該插入發(fā)生在BAC T13D8上注釋為編碼與釀酒酵母SIK1P蛋白質(zhì)相似的蛋白質(zhì)(Genbank索取號(hào)U20237)的序列上游90個(gè)核苷酸處。通過(guò)采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增鼠耳芥屬的基因組DNA,分離包含BAC T13D8序列#33,025位堿基至#34,338位堿基的DNA片段。將該片段用于探測(cè)IYES載體中的鼠耳芥屬cDNA文庫(kù)(Elledge等,(1991)美國(guó)國(guó)家科學(xué)院院刊881731-1735)。采用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)分離陽(yáng)性噬菌體克隆,并對(duì)其進(jìn)行特性分析。從該噬菌體切下所獲cDNA克隆,并確定其核苷酸序列。鑒定了一個(gè)全長(zhǎng)克隆。采用tBLASTn檢索核苷酸序列數(shù)據(jù)庫(kù),分析推導(dǎo)的氨基酸序列(Altschul等(1990)分子生物學(xué)雜志215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST的檢索結(jié)果顯示,該回收的5283 cDNA序列來(lái)源于位于鼠耳芥屬第1號(hào)染色體的相同基因組序列BAC T13D8。除了以下不同之外,該cDNA序列的內(nèi)含子/外顯子邊界與就鼠耳芥屬SIK1P同系物(Genbank索取號(hào)AC004473)所預(yù)測(cè)的相同。對(duì)于5283 cDNA起始密碼子由#32975位堿基-#32977位堿基編碼,之后緊接一個(gè)從#32978至#33199位堿基的內(nèi)含子。
實(shí)施例3來(lái)自T-DNA誘變鼠耳芥屬群體的標(biāo)記幼苗致死系#2490的序列分析采用質(zhì)粒拯救技術(shù)分子克隆T-DNA誘變所產(chǎn)生的位于T-DNA插入片段一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)限制性酶消化分析以該方式獲得的質(zhì)粒,以便基于消化圖譜對(duì)這些質(zhì)粒進(jìn)行分類(lèi)。對(duì)于每一類(lèi)質(zhì)粒克隆,確定其DNA序列。分析所獲序列是否存在非T-DNA載體序列。采用SLP346for引物(5’GCG6ACATCTACATTTTTGA3’SEQ ID NO11),對(duì)通過(guò)質(zhì)粒拯救方法回收的質(zhì)粒進(jìn)行測(cè)序。引物SLP346for提供了緊鄰T-DNA左邊界的側(cè)翼序列的信息。作為含有T-DNA左邊界的質(zhì)粒,回收該T-DNA插入片段兩端的克隆。通過(guò)Southern印跡分析比較來(lái)自植物2490突變雜合子的基因組DNA和來(lái)自植物野生型2490基因純合子的基因組DNA,驗(yàn)證質(zhì)粒拯救。從使用SLP369(5’CAGACCA CAATACCTTCAAAAATA3’SEQ IDNO22)和SLP370(5’CCATTGTGTCTCCCTCC CGCTGTT3’SEQ ID NO23)引物產(chǎn)生的PCR產(chǎn)物,制備Southern印跡的探針。在該2490雜合子中找到另一個(gè)BamH1片段,驗(yàn)證了有效拯救。
將從以上克隆獲得的序列用于對(duì)核苷酸序列數(shù)據(jù)庫(kù)進(jìn)行BLASTn檢索(Altschul等(1990),分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。該檢索結(jié)果顯示,該回收序列與鼠耳芥屬第5號(hào)染色體P1克隆MTG13(Genbank # AB008270)中的基因組DNA一致。當(dāng)將該插入事件發(fā)生處的基因組DNA區(qū)域用于Genbank EST數(shù)據(jù)庫(kù)的BLASTn檢索時(shí),鑒定了來(lái)源于兩個(gè)EST末端的4個(gè)序列144K24(144K24 T7 Genbank # T76608和144K24XP Genbank #AA404903)和GBGF153(5’端Genbank#F15182和3’端Genbank#F15181)。確定了144K24 EST的完整序列,該序列編碼2490基因的完整可讀框(ORF)。該EST的BLAST分析指出,該2490蛋白質(zhì)與歐洲油菜(Brassicanapus)Toc36蛋白質(zhì)(Genbank # X79091;Ko等(1995)生物化學(xué)雜志27028601-28608;Wu等(1994)生物化學(xué)雜志26932264-32271;Pang等(1997)生物化學(xué)雜志27225623-25627)有序列相似性。該Toc36蛋白質(zhì)還被稱(chēng)作bce44B、Com44和Cim44。由于含有該2490 ORF的基因組DNA直到目前仍沒(méi)有被正確地標(biāo)釋?zhuān)员景l(fā)明人第一個(gè)提供了該2490基因的正確ORF和序列相似性的實(shí)驗(yàn)資料。
實(shí)施例4來(lái)自T-DNA誘變鼠耳芥屬群體的標(biāo)記幼苗致死系#3963的序列分析采用質(zhì)粒拯救技術(shù)分子克隆T-DNA誘變所產(chǎn)生的位于T-DNA插入片段一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)限制性酶消化分析以該方式獲得的質(zhì)粒,以便基于消化圖譜對(duì)這些質(zhì)粒進(jìn)行分類(lèi)。對(duì)于每一類(lèi)質(zhì)??寺?,確定其DNA序列。分析所獲序列是否存在非T-DNA載體序列。采用-21引物(5’TGTAAAACGACGGCCAGT 3’SEQ ID NO25),對(duì)通過(guò)質(zhì)粒拯救方法回收的質(zhì)粒進(jìn)行測(cè)序。引物-21提供了緊鄰T-DNA右邊界的側(cè)翼序列的信息。通過(guò)從3963突變雜合子PCR擴(kuò)增基因組DNA,驗(yàn)證質(zhì)粒拯救。該P(yáng)CR實(shí)驗(yàn)采用一個(gè)錨定在預(yù)測(cè)的側(cè)翼序列中的引物和-21引物(錨定在該T-DNA插入片段中)。基于該質(zhì)粒拯救克隆的序列,找到具有期望大小的PCR產(chǎn)物,證實(shí)了有效拯救。將從引物-21獲得的序列用于對(duì)核苷酸序列數(shù)據(jù)庫(kù)進(jìn)行BLASTn檢索(Altschul等(1990),分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST檢索結(jié)果顯示,該回收的植物側(cè)翼序列與第5號(hào)染色體上P1克隆MDK4(Genbank索取號(hào)AB010695)中的基因組序列100%一致。該T-DNA插入片段發(fā)生在標(biāo)注的P1克隆MDK4序列的#36342位堿基處,在鑒定為MDK4.6的基因中。該回收側(cè)翼序列的tBLASTX分析顯示出與釀酒酵母DNA修復(fù)蛋白質(zhì)Mre11p(Genbank索取號(hào)U60829)的序列相似性。通過(guò)采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增鼠耳芥屬基因組DNA,分離編碼該鼠耳芥屬3963蛋白質(zhì)部分的片段。該片段被用于探測(cè)λYES載體中的鼠耳芥屬cDNA文庫(kù)(Elledge等(1991)美國(guó)國(guó)家科學(xué)院院刊881731-1735)。采用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)分離陽(yáng)性噬菌體克隆,并對(duì)其進(jìn)行特性分析。從該噬菌體切下所獲cDNA克隆,并確定其核苷酸序列。鑒定了一個(gè)cDNA克隆。該cDNA序列顯示于SEQ ID NO7。采用BLASTx檢索核苷酸序列數(shù)據(jù)庫(kù),分析推導(dǎo)的氨基酸序列(Altschul等(1990),分子生物學(xué)雜志215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST結(jié)果顯示,該回收的3963 cDNA表現(xiàn)出與許多DNA修復(fù)蛋白質(zhì)的序列相似性,這些蛋白質(zhì)包括粟酒裂殖酵母的Rad32p(Genbank索取號(hào)Q09683);人的hMrell(Genbank索取號(hào)U37359);和釀酒酵母的Mrellp(Genbank索取號(hào)U60829)。由于含有該3963開(kāi)發(fā)閱讀框(ORF)的基因組DNA就外顯子/內(nèi)含子邊界而言在現(xiàn)有技術(shù)中未有正確標(biāo)注,所以本發(fā)明人第一個(gè)提供了3963基因正確ORF的實(shí)驗(yàn)資料。現(xiàn)有技術(shù)指出這些外顯子/內(nèi)含子邊界35662-35817、36015-36172、36315-36405、36528-36647、36728-36796、36865-36956、37045-37 147、37247-37354、37476-37538、37785-37862、38060-38122、38211-38271、38753-38835、38979-39092、39468-39766、39879-40002、40161-40370。相應(yīng)于本文公開(kāi)的部分cDNA的外顯子/內(nèi)含子邊界是位置不詳?shù)?’末端(第一個(gè)知道的堿基在第36147位)、36147-36172、36315-36405、36528-36647、36728-36796、36865-36956、37045-37147、37247-37354、37476-37538、37610-37681、37785-39092、39212-39290、39377-39445、39532-39776、39879-40002、40161-40363、40478-40508(終止子開(kāi)始于40509)。
實(shí)施例5來(lái)自T-DNA誘變鼠耳芥屬群體的標(biāo)記幼苗致死系#4036的序列分析采用質(zhì)粒拯救技術(shù)分子克隆T-DNA誘變所產(chǎn)生的位于T-DNA插入片段一側(cè)或兩側(cè)的鼠耳芥屬基因組DNA。通過(guò)限制性酶消化分析以該方式獲得的質(zhì)粒,以便基于消化圖譜對(duì)這些質(zhì)粒進(jìn)行分類(lèi)。對(duì)于每一類(lèi)質(zhì)??寺?,確定其DNA序列。分析所獲序列是否存在非T-DNA載體序列。采用slp346引物(5’GCGGACATCTACATTTTTGA3’SEQ ID NO11),對(duì)通過(guò)質(zhì)粒拯救方法回收的質(zhì)粒進(jìn)行測(cè)序。引物slp346提供了緊鄰T-DNA左邊界的側(cè)翼序列的信息。通過(guò)PCR擴(kuò)增來(lái)自4036插入突變雜合子的模板基因組DNA,驗(yàn)證質(zhì)粒拯救。該實(shí)驗(yàn)采用一個(gè)錨定在預(yù)測(cè)的側(cè)翼序列中的引物和slp328引物(5’ACCTTAGGCGACTTTTGAAC3’;SEQ ID NO15;錨定在該T-DNA插入片段中)。基于該質(zhì)粒拯救克隆的序列,找到具有期望大小的PCR產(chǎn)物,證實(shí)了有效拯救。
將從上述克隆獲得的序列用于對(duì)核苷酸序列數(shù)據(jù)庫(kù)進(jìn)行BLASTn檢索(Altschul等(1990),分子生物學(xué)雜志(J.Mol.Biol.)215403-410;Altschul等(1997)核酸研究253389-3402)。該BLAST檢索結(jié)果顯示,該植物側(cè)翼序列與來(lái)自鼠耳芥屬第5號(hào)染色體的P1 MQB2公開(kāi)基因組序列(Genbank索取號(hào)AB003053)100%一致。該T-DNA插入發(fā)生在標(biāo)注的P1克隆的#31,380位堿基處,并中斷了鑒定為MQB2.6的基因。由該中斷的可讀框(ORF)編碼的蛋白質(zhì)表現(xiàn)出與許多生物的1-脫氧-D-木酮糖5-磷酸還原異構(gòu)酶的相似性,這些生物包括集胞藍(lán)細(xì)菌屬(Synechocystis sp.)(SWISS-PROTQ55663)、枯草芽孢桿菌(SWISS-PROTO31753)和大腸桿菌(SWISS-PROT P45568)(Takahashi等(1998)美國(guó)國(guó)家科學(xué)院院刊959879-9884)。用Web GeneMark軟件(Borodovsky,M.和Mcininch J.(1993)計(jì)算機(jī)和化學(xué)(Computers & Chemistry)17123-133),對(duì)含有該ORF的基因組區(qū)域進(jìn)行重新標(biāo)注。然后針對(duì)該預(yù)測(cè)ORF的5’和3’末端設(shè)計(jì)引物,并采用來(lái)自pFL61鼠耳芥屬cDNA文庫(kù)的DNA(Minet等(1992)植物雜志(Plant J.)2417-422)作為模板進(jìn)行PCR。TA連接和克隆所獲PCR產(chǎn)物(Original TA克隆試劑盒,Invitrogen),并對(duì)其進(jìn)行測(cè)序。由于含有該4036 ORF的基因組DNA就外顯子/內(nèi)含子邊界而言在現(xiàn)有技術(shù)中未有正確標(biāo)注,所以本發(fā)明人第一個(gè)提供了4036基因的正確ORF的實(shí)驗(yàn)資料。現(xiàn)有技術(shù)指出這些外顯子/內(nèi)含子邊界33490..33356、31293..31207、30971..30846、30780..30718、30622..30473、30345..30288、30194..30083、29996..29892、29805..29684、29394..29248、29162..28997。在本發(fā)明的序列中,第31928位堿基標(biāo)記為該cDNA起始密碼子的第一個(gè)堿基,第28996位堿基標(biāo)記為該cDNA終止密碼子的第一個(gè)堿基。含有該起始密碼子的外顯子的3’末端是31836,而含有該終止密碼子的外顯子的5’末端是29161。本文公開(kāi)的該cDNA的內(nèi)部外顯子/內(nèi)含子邊界是31640..31448、31294..31202、30965..30843、30777..30722、30636..30473、30355..30287、30193..30082、29995..29891、29804..29684、29394..29247。
實(shí)施例6a在大腸桿菌中表達(dá)重組245蛋白質(zhì)將相應(yīng)于cDNA克隆SEQ ID NO1的蛋白質(zhì)編碼區(qū)亞克隆至前面所描述的表達(dá)載體中,并采用廠家的條件轉(zhuǎn)化大腸桿菌。具體的實(shí)例包括質(zhì)粒例如pBluescript(Stratagene,La Jolla,CA)、pFLAG(International Biotechnologies,Inc.,New Haven,CT)、和pTrcHis(Invitrogen,La Jolla,CA)。培養(yǎng)大腸桿菌,并驗(yàn)證245活性的表達(dá)。采用標(biāo)準(zhǔn)技術(shù)分離賦予245活性的蛋白質(zhì)。
實(shí)施例6b在大腸桿菌中表達(dá)重組5283蛋白質(zhì)將相應(yīng)于cDNA克隆SEQ ID NO3的蛋白質(zhì)編碼區(qū)亞克隆至前面所描述的表達(dá)載體中,并采用廠家的條件轉(zhuǎn)化大腸桿菌。具體的實(shí)例包括質(zhì)粒例如pBluescript(Stratagene,La Jolla,CA)、pFLAG(International Biotechnologies,Inc.,New Haven,CT)、和pTrcHis(Invitrogen,La Jolla,CA)。培養(yǎng)大腸桿菌,并驗(yàn)證5283活性的表達(dá)。采用標(biāo)準(zhǔn)技術(shù)分離賦予5283活性的蛋白質(zhì)。
實(shí)施例6c在大腸桿菌中表達(dá)重組2490蛋白質(zhì)將相應(yīng)于cDNA克隆SEQ ID NO5的蛋白質(zhì)編碼區(qū)亞克隆至前面所描述的表達(dá)載體中,并采用廠家的條件轉(zhuǎn)化大腸桿菌。具體的實(shí)例包括質(zhì)粒例如pBluescr ipt(Stratagene,La Jolla,CA)、pFLAG(International Biotechnologies,Inc.,New Haven,CT)、和pTrcHis(Invitrogen,La Jolla,CA)。培養(yǎng)大腸桿菌,并驗(yàn)證2490活性的表達(dá)。采用標(biāo)準(zhǔn)技術(shù)分離賦予2490活性的蛋白質(zhì)。
實(shí)施例6d在大腸桿菌中表達(dá)重組3963蛋白質(zhì)將相應(yīng)于cDNA克隆SEQ ID NO7的蛋白質(zhì)編碼區(qū)亞克隆至前面所描述的表達(dá)載體中,并采用廠家的條件轉(zhuǎn)化大腸桿菌。具體的實(shí)例包括質(zhì)粒例如pBluescript(Stratagene,La Jolla,CA)、pFLAG(International Biotechnologies,Inc.,New Haven,CT)、和pTrcHis(Invitrogen,La Jolla,CA)。培養(yǎng)大腸桿菌,并驗(yàn)證3963活性的表達(dá)。采用標(biāo)準(zhǔn)技術(shù)分離賦予3963活性的蛋白質(zhì)。
實(shí)施例6e在大腸桿菌中表達(dá)重組4036蛋白質(zhì)將相應(yīng)于cDNA克隆SEQ ID NO9的蛋白質(zhì)編碼區(qū)亞克隆至前面所描述的表達(dá)載體中,并采用廠家的條件轉(zhuǎn)化大腸桿菌。具體的實(shí)例包括質(zhì)粒例如pBluescript(Stratagene,La Jolla,CA)、pFLAG(International Biotechnologies,Inc.,New Haven,CT)、和pTrcHis(Invitrogen,La Jolla,CA)。培養(yǎng)大腸桿菌,并驗(yàn)證4036活性的表達(dá)。采用標(biāo)準(zhǔn)技術(shù)分離賦予4036活性的蛋白質(zhì)。
實(shí)施例7通過(guò)DNA改組體外重組245、5283、2490、3963或4036基因通過(guò)PCR分別擴(kuò)增SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7或SEQ ID NO9的核苷酸序列?;旧习匆衙枋龅姆椒?Stemmer等(1994)PNAS 9110747-10751)通過(guò)DNasel處理消化該所獲得的DNA片段,并從該反應(yīng)混合物中除去PCR引物。在沒(méi)有引物的情況下進(jìn)行PCR反應(yīng),之后在有引物的情況下進(jìn)行PCR反應(yīng),兩者均按已描述的方法進(jìn)行(Stemmer等(1994)PNAS 9110747-10751)。將所獲得的DNA片段克隆至用于大腸桿菌的pTRC99a(Phamacia,產(chǎn)品號(hào)27-5007-01)中,或克隆至用于酵母的pESC載體中(Stratagene產(chǎn)品目錄)中;然后采用Biorad Gene Pulser以及廠家的條件,通過(guò)電穿孔轉(zhuǎn)化分別缺少245、5283、2490、3963或4036活性的細(xì)菌或酵母株。將該轉(zhuǎn)化細(xì)菌或酵母培養(yǎng)在含有抑制性濃度的245、5283、2490、3963或4036活性抑制劑的培養(yǎng)基上,選擇存在該抑制劑時(shí)生長(zhǎng)的菌落。挑取在有正常抑制性濃度的抑制劑時(shí)生長(zhǎng)的菌落,并通過(guò)重復(fù)再劃線進(jìn)行純化。純化它們的質(zhì)粒,然后確定通過(guò)該測(cè)試的質(zhì)粒cDNA插入片段的DNA序列。
在相似的反應(yīng)中,將分別含有鼠耳芥245、5283、2490、3963或4036基因、編碼蛋白質(zhì)的PCR擴(kuò)增DNA片段,和分別含有來(lái)自大腸桿菌的245、5283、2490、3963或4036基因的PCR擴(kuò)增DNA片段在體外重組,并按以上所述回收獲得的對(duì)抑制劑具有提高的耐受性的變異體。
實(shí)施例8a通過(guò)交錯(cuò)延伸方法體外重組245基因?qū)⒕幋a245蛋白質(zhì)的鼠耳芥245基因和大腸桿菌245基因各克隆至pBluescript載體的多位點(diǎn)接頭中。采用“反向引物”和“M13-20引物”(Stratagene產(chǎn)品目錄),基本按已描述的方法(Zhao等(1998)自然生物技術(shù)16258-261),進(jìn)行PCR反應(yīng)。用適合的限制性酶消化擴(kuò)增的PCR片段,并將其克隆至pTRC99a中,按實(shí)施例7所描述的方法篩選突變的245基因。
實(shí)施例8b通過(guò)交錯(cuò)延伸方法體外重組5283基因?qū)⒕幋a5283蛋白質(zhì)的鼠耳芥5283基因和大腸桿菌5283基因各克隆至pBluescript載體的多位點(diǎn)接頭中。采用“反向引物”和“M13-20引物”(Stratagene產(chǎn)品目錄),基本按已描述的方法(Zhao等(1998)自然生物技術(shù)16258-261),進(jìn)行PCR反應(yīng)。用適合的限制性酶消化擴(kuò)增的PCR片段,并將其克隆至pTRC99a中,按實(shí)施例7所描述的方法篩選突變的5283基因。
實(shí)施例8c通過(guò)交錯(cuò)延伸方法體外重組2490基因?qū)⒕幋a2490蛋白質(zhì)的鼠耳芥2490基因和大腸桿菌2490基因各克隆至pBluescript載體的多位點(diǎn)接頭中。采用“反向引物”和“M13-20引物”(Stratagene產(chǎn)品目錄),基本按已描述的方法(Zhao等(1998)自然生物技術(shù)16258-261),進(jìn)行PCR反應(yīng)。用適合的限制性酶消化擴(kuò)增的PCR片段,并將其克隆至pTRC99a中,按實(shí)施例7所描述的方法篩選突變的2490基因。
實(shí)施例8d通過(guò)交錯(cuò)延伸方法體外重組3963基因?qū)⒕幋a3963蛋白質(zhì)的鼠耳芥3963基因和大腸桿菌3963基因各克隆至pBluescript載體的多位點(diǎn)接頭中。采用“反向引物”和“M13-20引物”(Stratagene產(chǎn)品目錄),基本按已描述的方法(Zhao等(1998)自然生物技術(shù)16258-261),進(jìn)行PCR反應(yīng)。用適合的限制性酶消化擴(kuò)增的PCR片段,并將其克隆至pTRC99a中,按實(shí)施例7所描述的方法篩選突變的3963基因。
實(shí)施例8e通過(guò)交錯(cuò)延伸方法體外重組4036基因?qū)⒕幋a4036蛋白質(zhì)的鼠耳芥4036基因和大腸桿菌4036基因各克隆至pBluescript載體的多位點(diǎn)接頭中。采用“反向引物”和“M13-20引物”(Stratagene產(chǎn)品目錄),基本按已描述的方法(Zhao等(1998)自然生物技術(shù)16258-261),進(jìn)行PCR反應(yīng)。用適合的限制性酶消化擴(kuò)增的PCR片段,并將其克隆至pTRC99a中,按實(shí)施例7所描述的方法篩選突變的4036基因。
實(shí)施例9體外結(jié)合分析例如分別根據(jù)實(shí)施例6a、6b、6c、6d或6e,獲得重組245、5283、2490、3963或4036蛋白質(zhì)。采用本領(lǐng)域熟知的技術(shù),將該蛋白質(zhì)固定在適于配體結(jié)合分析的芯片上。根據(jù)本領(lǐng)域所熟知的方法將固定在該芯片上的蛋白質(zhì)暴露于溶液中的樣品化合物。當(dāng)該樣品化合物與該固定的蛋白質(zhì)接觸后,實(shí)施能夠檢測(cè)到蛋白質(zhì)-配體相互作用的測(cè)量方法。這些測(cè)量方法的例子有以上描述的SELDI、biacore和FCS。以這種方式可以容易地發(fā)現(xiàn)與該蛋白質(zhì)結(jié)合的化合物,并對(duì)其作進(jìn)一步的特性分析。
以上公開(kāi)的實(shí)施方案是舉例說(shuō)明用的。本發(fā)明的公開(kāi)將使本領(lǐng)域的技術(shù)人員擁有許多本發(fā)明的變化。所有這些明顯和可預(yù)見(jiàn)的變化均包含在所附的權(quán)利要求之內(nèi)。
序列表<110>Novartis AG<120>除草劑的靶基因和方法<130>組合的除草劑靶基因<140><141><160>29<170>PatentIn Ver.2.1<210>1<211>1119<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(1119)<400> 1atg gat gac atg gac acc gtc tac aag caa ttg gga ttg ttt tca cta 48Met Asp Asp Met Asp Thr Val Tyr Lys Gln Leu Gly Leu Phe Ser Leu1 5 10 15aag aag aag att aaa gat gtt gtt ctt aag gct gag atg ttt gca ccg 96Lys Lys Lys Ile Lys Asp Val Val Leu Lys Ala Glu Met Phe Ala Pro20 25 30gat gct ctt gag ctt gaa gaa gag cag tgg ata aag caa gaa gaa aca 144Asp Ala Leu Glu Leu Glu Glu Glu Gln Trp Ile Lys Gln Glu Glu Thr35 40 45atg cgt tac ttt gat tta tgg gat gat ccc gct aaa tct gat gag att 192Met Arg Tyr Phe Asp Leu Trp Asp Asp Pro Ala Lys Ser Asp Glu Ile50 55 60ctt ctc aaa tta gct gat cga gct aaa gca gtc gat tcc ctc aaa gac 240Leu Leu Lys Leu Ala Asp Arg Ala Lys Ala Val Asp Ser Leu Lys Asp65 70 75 80ctc aaa tac aag gct gaa gaa gct aag ctg atc ata caa ttg ggt gag 288Leu Lys Tyr Lys Ala Glu Glu Ala Lys Leu Ile Ile Gln Leu Gly Glu85 90 95atg gat gct ata gat tac agt ctc ttt gag caa gcc tat gat tca tca 336Met Asp Ala Ile Asp Tyr Ser Leu Phe Glu Gln Ala Tyr Asp Ser Ser100 105 110ctc gat gta agt aga tcg ttg cat cac tat gag atg tct aag ctt ctt 384Leu Asp Val Ser Arg Ser Leu His His Tyr Glu Met Ser Lys Leu Leu
115 120 125agg gat caa tat gac gct gaa ggc gct tgt atg att atc aaa tct gga 432Arg Asp Gln Tyr Asp Ala Glu Gly Ala Cys Met Ile Ile Lys Ser Gly130 135 140tct cca ggc gca aaa tct cag ata tgg aca gag caa gtt gta agt atg 480Ser Pro Gly Ala Lys Ser Gln Ile Trp Thr Glu Gln Val Val Ser Met145 150 155 160tat atc aaa tgg gca gaa agg cta ggc caa aac gcg cgg gtg gct gag 528Tyr Ile Lys Trp Ala Glu Arg Leu Gly Gln Asn Ala Arg Val Ala Glu165 170 175aaa tgt agt tta ttg agt aat aaa agt ggc gta agt tca gcc acg ata 576Lys Cys Ser Leu Leu Ser Asn Lys Ser Gly Val Ser Ser Ala Thr Ile180 185 190gag ttt gaa ttc gag ttt gct tat ggt tat ctc tta ggt gag cga ggt 624Glu Phe Glu Phe Glu Phe Ala Tyr Gly Tyr Leu Leu Gly Glu Arg Gly195 200 205gtg cac cgc ctt atc ata agt tcc act tct aat gag gaa tgt tca gcg 672Val His Arg Leu Ile Ile Ser Ser Thr Ser Asn Glu Glu Cys Ser Ala210 215 220act gtt gat atc ata cca cta ttc ttg aga gca tct cct gat ttt gaa 720Thr Val Asp Ile Ile Pro Leu Phe Leu Arg Ala Ser Pro Asp Phe Glu225 230 235 240gta aag gaa ggt gat ttg att gta tcg tat cct gca aaa gag gat cac 768Val Lys Glu Gly Asp Leu Ile Val Ser Tyr Pro Ala Lys Glu Asp His245 250 255aaa ata gct gag aat atg gtt tgt atc cac cat att ccg agt gga gta 816Lys Ile Ala Glu Asn Met Val Cys Ile His His Ile Pro Ser Gly Val260 265 270aca cta caa tct tca gga gaa aga aac cgg ttt gca aac agg atc aaa 864Thr Leu Gln Ser Ser Gly Glu Arg Asn Arg Phe Ala Asn Arg Ile Lys275 280 285gct cta aac cgg ttg aag gcg aag cta ctt gtg ata gca aaa gag caa 912Ala Leu Asn Arg Leu Lys Ala Lys Leu Leu Val Ile Ala Lys Glu Gln290 295 300aag gtt tcg gat gta aat aaa atc gac agc aag aac att ttg gaa ccg 960Lys Val Ser Asp Val Asn Lys Ile Asp Ser Lys Asn Ile Leu Glu Pro305 310 315 320cgg gaa gaa acc agg agt tat gtc tct aag ggt cac aag atg gtg gtt 1008Arg Glu Glu Thr Arg Ser Tyr Val Ser Lys Gly His Lys Met Val Val325 330 335gat aga aaa acc ggt tta gag att ctg gac ctg aaa tcg gtc ttg gat 1056Asp Arg Lys Thr Gly Leu Glu Ile Leu Asp Leu Lys Ser Val Leu Asp340 345 350gga aac att gga cca ctc ctt gga gct cat att agc atg aga aga tca 1104Gly Asn Ile Gly Pro Leu Leu Gly Ala His Ile Ser Met Arg Arg Ser355 360 365att gat gcg att tag 1119Ile Asp Ala Ile370<210>2<211>372<212>PRT<213>鼠耳芥<400>2Met Asp Asp Met Asp Thr Val Tyr Lys Gln Leu Gly Leu Phe Ser Leu1 5 10 15Lys Lys Lys Ile Lys Asp Val Val Leu Lys Ala Glu Met Phe Ala Pro20 25 30Asp Ala Leu Glu Leu Glu Glu Glu Gln Trp Ile Lys Gln Glu Glu Thr35 40 45Met Arg Tyr Phe Asp Leu Trp Asp Asp Pro Ala Lys Ser Asp Glu Ile50 55 60Leu Leu Lys Leu Ala Asp Arg Ala Lys Ala Val Asp Ser Leu Lys Asp65 70 75 80Leu Lys Tyr Lys Ala Glu Glu Ala Lys Leu Ile Ile Gln Leu Gly Glu85 90 95Met Asp Ala Ile Asp Tyr Ser Leu Phe Glu Gln Ala Tyr Asp Ser Ser100 105 110Leu Asp Val Ser Arg Ser Leu His His Tyr Glu Met Ser Lys Leu Leu115 120 125Arg Asp Gln Tyr Asp Ala Glu Gly Ala Cys Met Ile Ile Lys Ser Gly130 135 140Ser Pro Gly Ala Lys Ser Gln Ile Trp Thr Glu Gln Val Val Ser Met145 150 155 160Tyr Ile Lys Trp Ala Glu Arg Leu Gly Gln Asn Ala Arg Val Ala Glu165 170 175Lys Cys Ser Leu Leu Ser Asn Lys Ser Gly Val Ser Ser Ala Thr Ile180 185 190Glu Phe Glu Phe Glu Phe Ala Tyr Gly Tyr Leu Leu Gly Glu Arg Gly195 200 205Val His Arg Leu Ile Ile Ser Ser Thr Ser Asn Glu Glu Cys Ser Ala210 215 220Thr Val Asp Ile Ile Pro Leu Phe Leu Arg Ala Ser Pro Asp Phe Glu225 230 235 240Val Lys Glu Gly Asp Leu Ile Val Ser Tyr Pro Ala Lys Glu Asp His245 250 255Lys Ile Ala Glu Asn Met Val Cys Ile His His Ile Pro Ser Gly Val260 265 270Thr Leu Gln Ser Ser Gly Glu Arg Asn Arg Phe Ala Asn Arg Ile Lys275 280 285Ala Leu Asn Arg Leu Lys Ala Lys Leu Leu Val Ile Ala Lys Glu Gln
290295 300Lys Val Ser AspVal Asn Lys Ile Asp Ser Lys Asn Ile Leu Glu Pro305310 315 320Arg Glu Glu Thr Arg Ser Tyr Val Ser Lys Gly His Lys Met Val Val325 330 335Asp Arg Lys Thr Gly Leu Glu Ile Leu Asp Leu Lys Ser Val Leu Asp340 345 350Gly Asn Ile Gly Pro Leu Leu Gly Ala His Ile Ser Met Arg Arg Ser355 360 365Ile Asp Ala Ile370<210>3<211>1458<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(1458)<400> 3atg gca act ctt gaa gat tct ttc ctt gct gat ttg gac gag tta tct 48Met Ala Thr Leu Glu Asp Ser Phe Leu Ala Asp Leu Asp Glu Leu Ser1 5 10 15gac aat gaa gca gaa ttg gac gag aat gat ggt gat gtt gga aag gaa 96Asp Asn Glu Ala Glu Leu Asp Glu Asn Asp Gly Asp Val Gly Lys Glu20 25 30gaa gaa gat gtt gat atg gat atg gct gat tta gag aca ctt aac tat 144Glu Glu Asp Val Asp Met Asp Met Ala Asp Leu Glu Thr Leu Asn Tyr35 40 45gat gat ctc gat aat gtt tct aag ctg cag aag agt cag aga tat gct 192Asp Asp Leu Asp Asn Val Ser Lys Leu Gln Lys Ser Gln Arg Tyr Ala50 55 60gat att atg cat aaa gta gag gag gct ctt ggg aaa gat tct gat gga 240Asp Ile Met His Lys Val Glu Glu Ala Leu Gly Lys Asp Ser Asp Gly65 70 75 80gct gag aaa gga act gtc ttg gaa gat gat cct gag tat aag ctt att 288Ala Glu Lys Gly Thr Val Leu Glu Asp Asp Pro Glu Tyr Lys Leu Ile85 90 95gtg gat tgt aat cag ctt tcg gtc gat att gag aat gaa atc gtt att 336Val Asp Cys Asn Gln Leu Ser Val Asp Ile Glu Asn Glu Ile Val Ile100 105 110gtc cac aac ttt atc aaa gac aag tac aag ctt aag ttt caa gag ctt 384Val His Asn Phe Ile Lys Asp Lys Tyr Lys Leu Lys Phe Gln Glu Leu115 120 125gag tcg ttg gtt cat cac cct att gac tat gca tgt gtt gtg aag aag 432Glu Ser Leu Val His His Pro Ile Asp Tyr Ala Cys Val Val Lys Lys130 135 140att ggg aat gag acg gat ttg gct ctt gtt gat ctc gct gac ctt ctt 480Ile Gly Asn Glu Thr Asp Leu Ala Leu Val Asp Leu Ala Asp Leu Leu145 150 155 160cct tca gct att atc atg gtt gtt tca gtt act gct tta act acg aaa 528Pro Ser Ala Ile Ile Met Val Val Ser Val Thr Ala Leu Thr Thr Lys165 170 175ggg agt gca ctg cca gag gat gtt ttg caa aag gtg tta gag gct tgt 576Gly Ser Ala Leu Pro Glu Asp Val Leu Gln Lys Val Leu Glu Ala Cys180 185 190gat cgg gct tta gat ctt gat tcc gca agg aag aag gtc ctt gag ttt 624Asp Arg Ala Leu Asp Leu Asp Ser Ala Arg Lys Lys Val Leu Glu Phe195 200 205gtt gaa agt aag atg gga tct att gca cct aat ctt tct gct att gtt 672Val Glu Ser Lys Met Gly Ser Ile Ala Pro Asn Leu Ser Ala Ile Val210 215 220ggg agt gct gtt gca gcc aaa ctc atg ggg act gct gga ggt ttg tca 720Gly Ser Ala Val Ala Ala Lys Leu Met Gly Thr Ala Gly Gly Leu Ser225 230 235 240gca ctt gct aaa atg cct gcg tgt aat gtt caa gtt ctt ggc cac aag 768Ala Leu Ala Lys Met Pro Ala Cys Asn Val Gln Val Leu Gly His Lys245 250 255agg aag aac ctt gct ggg ttt tct tct gca acg tct cag tcc cgt gtg 816Arg Lys Asn Leu Ala Gly Phe Ser Ser Ala Thr Ser Gln Ser Arg Val260 265 270ggt tat ctg gag cag aca gag att tac caa agc acg cct cct gga ctt 864Gly Tyr Leu Glu Gln Thr Glu Ile Tyr Gln Ser Thr Pro Pro Gly Leu275 280 285cag gct cgc gct ggc agg ctc gtg gct gca aaa tca act ttg gca gca 912Gln Ala Arg Ala Gly Arg Leu Val Ala Ala Lys Ser Thr Leu Ala Ala290 295 300aga gtt gat gct act aga ggg gat ccg tta ggg ata agt gga aaa gct 960Arg Val Asp Ala Thr Arg Gly Asp Pro Leu Gly Ile Ser Gly Lys Ala305 310 315 320ttc agg gag gag atc cgt aag aag att gag aaa tgg caa gaa cct cct 1008Phe Arg Glu Glu Ile Arg Lys Lys Ile Glu Lys Trp Gln Glu Pro Pro325 330 335cct gca aga cag cct aag cca ctt cct gtt cct gat tct gaa ccg aag 1056Pro Ala Arg Gln Pro Lys Pro Leu Pro Val Pro Asp Ser Glu Pro Lys
340 345 350aaa aga agg ggt ggt cgc cgt cta aga aaa atg aaa gaa agg tat caa 1104Lys Arg Arg Gly Gly Arg Arg Leu Arg Lys Met Lys Glu Arg Tyr Gln355 360 365gta aca gat atg agg aag ctg gcc aac aga atg gcg ttt ggt aca cct 1152Val Thr Asp Met Arg Lys Leu Ala Asn Arg Met Ala Phe Gly Thr Pro370 375 380gaa gag agc tcc ctc ggt gat gga cta gga gaa ggt tat gga atg ctt 1200Glu Glu Ser Ser Leu Gly Asp Gly Leu Gly Glu Gly Tyr Gly Met Leu385 390 395 400ggc cag gca gga agc aac agg ctg cga gta tcc agt gtt ccg agc aag 1248Gly Gln Ala Gly Ser Asn Arg Leu Arg Val Ser Ser Val Pro Ser Lys405 410 415ctt aag att aat gct aag gtc gcc aaa aag ctt aaa gaa agg cag tat 1296Leu Lys Ile Asn Ala Lys Val Ala Lys Lys Leu Lys Glu Arg Gln Tyr420 425 430gcg ggt ggt gcg act acc tct ggt ttg aca tcg agc ctg gct ttc act 1344Ala Gly Gly Ala Thr Thr Ser Gly Leu Thr Ser Ser Leu Ala Phe Thr435 440 445cct gtg cag gga ata gag ttg tgc aat cct cag cag gct tta gga tta 1392Pro Val Gln Gly Ile Glu Leu Cys Asn Pro Gln Gln Ala Leu Gly Leu450 455 460gga agt ggg act caa agc act tac ttc tca gag tca gga acc ttc tcg 1440Gly Ser Gly Thr Gln Ser Thr Tyr Phe Ser Glu Ser Gly Thr Phe Ser465 470 475 480aag ctg aag aag atc taa 1458Lys Leu Lys Lys Ile485<210>4<211>485<212>PRT<213>鼠耳芥<400>4Met Ala Thr Leu Glu Asp Ser Phe Leu Ala Asp Leu Asp Glu Leu Ser1 5 10 15Asp Asn Glu Ala Glu Leu Asp Glu Asn Asp Gly Asp Val Gly Lys Glu20 25 30Glu Glu Asp Val Asp Met Asp Met Ala Asp Leu Glu Thr Leu Asn Tyr35 40 45Asp Asp Leu Asp Asn Val Ser Lys Leu Gln Lys Ser Gln Arg Tyr Ala50 55 60Asp Ile Met His Lys Val Glu Glu Ala Leu Gly Lys Asp Ser Asp Gly65 70 75 80Ala Glu Lys Gly Thr Val Leu Glu Asp Asp Pro Glu Tyr Lys Leu Ile85 90 95Val Asp Cys Asn Gln Leu Ser Val Asp Ile Glu Asn Glu Ile Val Ile100 105 110Val His Asn Phe Ile Lys Asp Lys Tyr Lys Leu Lys Phe Gln Glu Leu115 120 125Glu Ser Leu Val His His Pro Ile Asp Tyr Ala Cys Val Val Lys Lys130 135 140Ile Gly Asn Glu Thr Asp Leu Ala Leu Val Asp Leu Ala Asp Leu Leu145 150 155 160Pro Ser Ala Ile Ile Met Val Val Ser Val Thr Ala Leu Thr Thr Lys165 170 175Gly Ser Ala Leu Pro Glu Asp Val Leu Gln Lys Val Leu Glu Ala Cys180 185 190Asp Arg Ala Leu Asp Leu Asp Ser Ala Arg Lys Lys Val Leu Glu Phe195 200 205Val Glu Ser Lys Met Gly Ser Ile Ala Pro Asn Leu Ser Ala Ile Val210 215 220Gly Ser Ala Val Ala Ala Lys Leu Met Gly Thr Ala Gly Gly Leu Ser225 230 235 240Ala Leu Ala Lys Met Pro Ala Cys Asn Val Gln Val Leu Gly His Lys245 250 255Arg Lys Asn Leu Ala Gly Phe Ser Ser Ala Thr Ser Gln Ser Arg Val260 265 270Gly Tyr Leu Glu Gln Thr Glu Ile Tyr Gln Ser Thr Pro Pro Gly Leu275 280 285Gln Ala Arg Ala Gly Arg Leu Val Ala Ala Lys Ser Thr Leu Ala Ala290 295 300Arg Val Asp Ala Thr Arg Gly Asp Pro Leu Gly Ile Ser Gly Lys Ala305 310 315 320Phe Arg Glu Glu Ile Arg Lys Lys Ile Glu Lys Trp Gln Glu Pro Pro325 330 335Pro Ala Arg Gln Pro Lys Pro Leu Pro Val Pro Asp Ser Glu Pro Lys340 345 350Lys Arg Arg Gly Gly Arg Arg Leu Arg Lys Met Lys Glu Arg Tyr Gln355 360 365Val Thr Asp Met Arg Lys Leu Ala Asn Arg Met Ala Phe Gly Thr Pro370 375 380Glu Glu Ser Ser Leu Gly Asp Gly Leu Gly Glu Gly Tyr Gly Met Leu385 390 395 400Gly Gln Ala Gly Ser Asn Arg Leu Arg Val Ser Ser Val Pro Ser Lys405 410 415Leu Lys Ile Asn Ala Lys Val Ala Lys Lys Leu Lys Glu Arg Gln Tyr420 425 430Ala Gly Gly Ala Thr Thr Ser Gly Leu Thr Ser Ser Leu Ala Phe Thr435 440 445Pro Val Gln Gly Ile Glu Leu Cys Asn Pro Gln Gln Ala Leu Gly Leu450 455 460Gly Ser Gly Thr Gln Ser Thr Tyr Phe Ser Glu Ser Gly Thr Phe Ser465 470 475 480Lys Leu Lys Lys Ile485<210>5<211>1344<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(1344)<400>5atg gag aac ctt acc cta gtt tct tgc tca gct tct tct cca aag ctg 48Met Glu Asn Leu Thr Leu Val Ser Cys Ser Ala Ser Ser Pro Lys Leu1 5 10 15tta att gga tgc aat ttc act tcc tcg ctg aaa aac cct act ggg ttt 96Leu Ile Gly Cys Asn Phe Thr Ser Ser Leu Lys Asn Pro Thr Gly Phe20 25 30tct cgt cgg act cct aat att gtc ctc cgg tgt tcc aaa ata tct gcc 144Ser Arg Arg Thr Pro Asn Ile Val Leu Arg Cys Ser Lys Ile Ser Ala35 40 45tct gct caa tct caa tct ccc tct tcg cgt ccg gag aac act gga gaa 192Ser Ala Gln Ser Gln Ser Pro Ser Ser Arg Pro Glu Asn Thr Gly Glu50 55 60atc gtg gtt gtg aaa cag aga agc aaa gct ttt gca agt ata ttt tct 240Ile Val Val Val Lys Gln Arg Ser Lys Ala Phe Ala Ser Ile Phe Ser65 70 75 80tcg agt cgt gat caa cag aca act tct gtt gct tcc cct agt gtg cct 288Ser Ser Arg Asp Gln Gln Thr Thr Ser Val Ala Ser Pro Ser Val Pro85 90 95gtg cca cca cca tct tca tca acc ata gga tca cca ctt ttc tgg att 336Val Pro Pro Pro Ser Ser Ser Thr Ile Gly Ser Pro Leu Phe Trp Ile100 105 110ggt gtt ggt gtt ggt cta tca gct ttg ttc tca tat gta act tca aat 384Gly Val Gly Val Gly Leu Ser Ala Leu Phe Ser Tyr Val Thr Ser Asn115 120 125tta aag aaa tat gca atg caa aca gct atg aag acg atg atg aac caa 432Leu Lys Lys Tyr Ala Met Gln Thr Ala Met Lys Thr Met Met Asn Gln130 135 140atg aat acg caa aat agc cag ttt aat aat tct gga ttc cca tca gga 480Met Asn Thr Gln Asn Ser Gln Phe Asn Asn Ser Gly Phe Pro Ser Gly145 150 155 160tca cct ttt ccg ttt cca ttt cct cct caa aca agt cct gct tcc tcg 528Ser Pro Phe Pro Phe Pro Phe Pro Pro Gln Thr Ser Pro Ala Ser Ser165 170 175cca ttc caa tct caa tcc cag tct tca ggt gct acc gtt gat gtg aca 576Pro Phe Gln Ser Gln Ser Gln Ser Ser Gly Ala Thr Val Asp Val Thr180 185 190gcg aca aaa gta gag aca cct cct tca act aaa ccg aaa cct aca cct 624Ala Thr Lys Val Glu Thr Pro Pro Ser Thr Lys Pro Lys Pro Thr Pro195 200 205gca aag gat ata gag gtg gat aag cca agt gtt gtc tta gag gca agc 672Ala Lys Asp Ile Glu Val Asp Lys Pro Ser Val Val Leu Glu Ala Ser210 215 220aaa gag aag aaa gaa gaa aag aac tat gcc ttt gaa gac att tca ccc 720Lys Glu Lys Lys Glu Glu Lys Ash Tyr Ala Phe Glu Asp Ile Ser Pro225 230 235 240gag gaa acc aca aaa gaa agc cca ttt agc aac tat gca gaa gtc tct 768Glu Glu Thr Thr Lys Glu Ser Pro Phe Ser Asn Tyr Ala Glu Val Ser245 250 255gaa act aat tcc ccc aaa gaa act cgc ttg ttt gag gat gtc ttg caa 816Glu Thr Asn Ser Pro Lys Glu Thr Arg Leu Phe Glu Asp Val Leu Gln260 265 270aat gga gct ggt ccg gca aat ggt gcc act gct tca gag gtt ttt caa 864Asn Gly Ala Gly Pro Ala Asn Gly Ala Thr Ala Ser Glu Val Phe Gln275 280 285tct ttg ggt ggt ggg aaa gga ggg ccg ggt tta tct gta gaa gct tta 912Ser Leu Gly Gly Gly Lys Gly Gly Pro Gly Leu Ser Val Glu Ala Leu290 295 300gag aaa atg atg gaa gat cca aca gtc cag aag atg gtt tac cca tac 960Glu Lys Met Met Glu Asp Pro Thr Val Gln Lys Met Val Tyr Pro Tyr305 310 315 320ttg cct gag gag atg agg aac cca gaa act ttc aaa tgg atg ctt aaa 1008Leu Pro Glu Glu Met Arg Asn Pro Glu Thr Phe Lys Trp Met Leu Lys325 330 335aat cct cag tac cgt caa caa cta cag gac atg ttg aat aat atg agt 1056Asn Pro Gln Tyr Arg Gln Gln Leu Gln Asp Met Leu Asn Asn Met Ser340 345 350ggg agt ggt gaa tgg gac aag cga atg aca gat aca ttg aag aat ttt 1104Gly Ser Gly Glu Trp Asp Lys Arg Met Thr Asp Thr Leu Lys Asn Phe355 360 365gac ctg aat agt cct gaa gtg aag caa caa ttc aat caa ata gga cta 1152Asp Leu Asn Ser Pro Glu Val Lys Gln Gln Phe Asn Gln Ile Gly Leu370 375 380act cca gaa gaa gtc ara tct aag atc atg gag aac cct gat gtt gcc 1200Thr Pro Glu Glu Val Ile Ser Lys Ile Met Glu Asn Pro Asp Val Ala385 390 395 400atg gca ttc cag aat cct aga gtc caa gca gcg tta atg gaa tgc tca 1248Met Ala Phe Gln Asn Pro Arg Val Gln Ala Ala Leu Met Glu Cys Ser405 410 415gag aac cca atg aac atc atg aag tac caa aac gac aaa gag gta atg 1296Glu Asn Pro Met Asn Ile Met Lys Tyr Gln Asn Asp Lys Glu Val Met420 425 430gat gtg ttc aac aag ata tcg cag ctc ttc cca gga atg acg ggt tga 1344Asp Val Phe Asn Lys Ile Ser Gln Leu Phe Pro Gly Met Thr Gly435 440 445<210>6<211>447<212>PRT<213>鼠耳芥<400> 6Met Glu Asn Leu Thr Leu Val Ser Cys Ser Ala Ser Ser Pro Lys Leu1 5 10 15Leu Ile Gly Cys Asn Phe Thr Ser Ser Leu Lys Asn Pro Thr Gly Phe20 25 30Ser Arg Arg Thr Pro Asn Ile Val Leu Arg Cys Ser Lys Ile Ser Ala35 40 45Ser Ala Gln Ser Gln Ser Pro Ser Ser Arg Pro Glu Asn Thr Gly Glu50 55 60Ile Val Val Val Lys Gln Arg Ser Lys Ala Phe Ala Ser Ile Phe Ser65 70 75 80Ser Ser Arg Asp Gln Gln Thr Thr Ser Val Ala Ser Pro Ser Val Pro85 90 95Val Pro Pro Pro Ser Ser Ser Thr Ile Gly Ser Pro Leu Phe Trp Ile100 105 110Gly Val Gly Val Gly Leu Ser Ala Leu Phe Ser Tyr Val Thr Ser Asn115 120 125Leu Lys Lys Tyr Ala Met Gln Thr Ala Met Lys Thr Met Met Asn Gln130 135 140Met Asn Thr Gln Asn Ser Gln Phe Asn Asn Ser Gly Phe Pro Ser Gly145 150 155 160Ser Pro Phe Pro Phe Pro Phe Pro Pro Gln Thr Ser Pro Ala Ser Ser165 170 175Pro Phe Gln Ser Gln Ser Gln Ser Ser Gly Ala Thr Val Asp Val Thr180 185 190Ala Thr Lys Val Glu Thr Pro Pro Ser Thr Lys Pro Lys Pro Thr Pro195 200 205Ala Lys Asp Ile Glu Val Asp Lys Pro Ser Val Val Leu Glu Ala Ser210 215 220Lys Glu Lys Lys Glu Glu Lys Asn Tyr Ala Phe Glu Asp Ile Ser Pro225 230 235 240Glu Glu Thr Thr Lys Glu Ser Pro Phe Ser Asn Tyr Ala Glu Val Ser245 250 255Glu Thr Asn Ser Pro Lys Glu Thr Arg Leu Phe Glu Asp Val Leu Gln260 265 270Asn Gly Ala Gly Pro Ala Asn Gly Ala Thr Ala Ser Glu Val Phe Gln275 280 285Ser Leu Gly Gly Gly Lys Gly Gly Pro Gly Leu Ser Val Glu Ala Leu290 295 300Glu Lys Met Met Glu Asp Pro Thr Val Gln Lys Met Val Tyr Pro Tyr305 310 315 320Leu Pro Glu Glu Met Arg Asn Pro Glu Thr Phe Lys Trp Met Leu Lys325 330 335Asn Pro Gln Tyr Arg Gln Gln Leu Gln Asp Met Leu Asn Asn Met Ser340 345 350Gly Ser Gly Glu Trp Asp Lys Arg Met Thr Asp Thr Leu Lys Asn Phe355 360 365Asp Leu Asn Ser Pro Glu Val Lys Gln Gln Phe Asn Gln Ile Gly Leu370 375 380Thr Pro Glu Glu Val Ile Ser Lys Ile Met Glu Asn Pro Asp Val Ala385 390 395 400Met Ala Phe Gln Asn Pro Arg Val Gln Ala Ala Leu Met Glu Cys Ser405 410 415Glu Asn Pro Met Asn Ile Met Lys Tyr Gln Asn Asp Lys Glu Val Met420 425 430Asp Val Phe Asn Lys Ile Ser Gln Leu Phe Pro Gly Met Thr Gly435 440 445<210>7<211>2163<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(2163)<400>7atg tct agg gag gat ttt agt gat aca crt cga gta ctt gtt gca act 48Met Ser Arg Glu Asp Phe Ser Asp Thr Leu Arg Val Leu Val Ala Thr1 5 10 15gat tgc cac ttg ggc tac atg gag aag gat gaa att agg cgg cat gat 96Asp Cys His Leu Gly Tyr Met Glu Lys Asp Glu Ile Arg Arg His Asp20 25 30tca ttt aag gct ttc gaa gag ata tgt tct ata gct gag gag aaa cag 144Ser Phe Lys Ala Phe Glu Glu Ile Cys Ser Ile Ala Glu Glu Lys Gln35 40 45gtg gac ttc tta ctc ctc gga ggt gat ctt ttt cat gag aat aaa ccc 192Val Asp Phe Leu Leu Leu Gly Gly Asp Leu Phe His Glu Asn Lys Pro50 55 60tct aga act acg tta gtt aaa gcc att gaa att crt cgt cgc cac tgt 240Ser Arg Thr Thr Leu Val Lys Ala Ile Glu Ile Leu Arg Arg His Cys65 70 75 80ctg aat gat aaa cca gtg cag ttt caa gta gtc agc gac cag aca gta 288Leu Asn Asp Lys Pro Val Gln Phe Gln Val Val Ser Asp Gln Thr Val
85 90 95aat ttt cag aat gcg ttt ggt caa gtc aat tac gag gat cca cac ttc 336Asn Phe Gln Asn Ala Phe Gly Gln Val Asn Tyr Glu Asp Pro His Phe100 105 110aat gta ggc ttg ccc gtg ttc agt att cat gga aac cat gat gat cca 384Asn Val Gly Leu Pro Val Phe Ser Ile His Gly Asn His Asp Asp Pro115 120 125gcc gga gtg gac aat ctt tct gca att gat att ctt tcc gca tgc aac 432Ala Gly Val Asp Asn Leu Ser Ala Ile Asp Ile Leu Ser Ala Cys Asn130 135 140ctt gtg aac tat ttt gga aag atg gtt ctt ggt ggt tct ggt gtt ggc 480Leu Val Asn Tyr Phe Gly Lys Met Val Leu Gly Gly Ser Gly Val Gly145 150 155 160cag att act ctc tac cct ata ctt atg aag aag ggc tca aca acc gtg 528Gln Ile Thr Leu Tyr Pro Ile Leu Met Lys Lys Gly Ser Thr Thr Val165 170 175gct ctc tat ggt tta gga aac atc agg gat gaa cgt ctc aat aga atg 576Ala Leu Tyr Gly Leu Gly Asn Ile Arg Asp Glu Arg Leu Asn Arg Met180 185 190ttt cag acc cca cat gct gtc caa tgg atg agg cct gaa gtt caa gaa 624Phe Gln Thr Pro His Ala Val Gln Trp Met Arg Pro Glu Val Gln Glu195 200 205gga tgt gat gtt tct gac tgg ttc aac att ctg gtg ctt cat caa aat 672Gly Cys Asp Val Ser Asp Trp Phe Asn Ile Leu Val Leu His Gln Asn210 215 220agg gtg aaa tca aac ccc aaa aat gca ata agt gag cac ttt ctt cca 720Arg Val Lys Ser Asn Pro Lys Asn Ala Ile Ser Glu His Phe Leu Pro225 230 235 240cgt ttc ctc gac ttc att gtg tgg ggc cat gag cat gaa tgc cta atc 768Arg Phe Leu Asp Phe Ile Val Trp Gly His Glu His Glu Cys Leu Ile245 250 255gac ccc cag gag gta tct gga atg ggc ttc cac atc aca caa cca gga 816Asp Pro Gln Glu Val Ser Gly Met Gly Phe His Ile Thr Gln Pro Gly260 265 270tct tct gtg gca aca tca ctt att gat ggg gaa tcg aag cca aaa cat 864Ser Ser Val Ala Thr Ser Leu Ile Asp Gly Glu Ser Lys Pro Lys His275 280 285gtt ctt ctc tta gaa atc aag gga aat caa tat cgt cct acg aag ata 912Val Leu Leu Leu Glu Ile Lys Gly Asn Gln Tyr Arg Pro Thr Lys Ile290 295 300cct ttg aca tct gtg agg cct ttt gag tat aca gag att gtt tta aag 960Pro Leu Thr Ser Val Arg Pro Phe Glu Tyr Thr Glu Ile Val Leu Lys305 310 315 320gat gaa agt gat att gat ccc aat gat caa aac tca att ctg gaa cac 1008Asp Glu Ser Asp Ile Asp Pro Asn Asp Gln Asn Ser Ile Leu Glu His325 330 335ttg gat aaa gtg gtc aga aat cta ata gag aaa gct agc aaa aaa gct 1056Leu Asp Lys Val Val Arg Asn Leu Ile Glu Lys Ala Ser Lys Lys Ala340 345 350gtt aac aga tca gag atc aaa ctc cca ttg gtt cga atc aag gta gat 1104Val Asn Arg Ser Glu Ile Lys Leu Pro Leu Val Arg Ile Lys Val Asp355 360 365tat tct gga ttt atg acg ata aat cct caa aga ttt gga cag aaa tat 1152Tyr Ser Gly Phe Met Thr Ile Asn Pro Gln Arg Phe Gly Gln Lys Tyr370 375 380gtg gga aag gtt gca aat ccc cag gac att ttg ata ttt tcc aag gct 1200Val Gly Lys Val Ala Asn Pro Gln Asp Ile Leu Ile Phe Ser Lys Ala385 390 395 400tct aag aag ggt cgg agc gaa gcc aac atc gat gat tct gag cgg ctt 1248Ser Lys Lys Gly Arg Ser Glu Ala Asn Ile Asp Asp Ser Glu Arg Leu405 410 415cgt cca gaa gaa ctg aac cag cag aat ata gaa gct tta gta gct gaa 1296Arg Pro Glu Glu Leu Asn Gln Gln Asn Ile Glu Ala Leu Val Ala Glu420 425 430agc aac ctg aaa atg gag atc ctt cca gtt aac gat ctg gat gtt gct 1344Ser Asn Leu Lys Met Glu Ile Leu Pro Val Asn Asp Leu Asp Val Ala435 440 445ctt cac aat ttt gtg aac aag gat gat aaa cta gcc ttc tac tca tgc 1392Leu His Asn Phe Val Asn Lys Asp Asp Lys Leu Ala Phe Tyr Ser Cys450 455 460gtt cag tac aat ctt caa gag act cgt ggt aaa ctt gca aag gat tca 1440Val Gln Tyr Asn Leu Gln Glu Thr Arg Gly Lys Leu Ala Lys Asp Ser465 470 475 480gat gcc aag aaa ttt gag gaa gat gac ttg att ctt aaa gtg gga gag 1488Asp Ala Lys Lys Phe Glu Glu Asp Asp Leu Ile Leu Lys Val Gly Glu485 490 495tgc tta gag gaa cgc ttg aaa gat agg tcc act cga ccc act ggt tcc 1536Cys Leu Glu Glu Arg Leu Lys Asp Arg Ser Thr Arg Pro Thr Gly Ser500 505 510tca cag ttt tta tcc act gga ttg act tca gag aat ttg aca aaa gga 1584Ser Gln Phe Leu Ser Thr Gly Leu Thr Ser Glu Asn Leu Thr Lys Gly515 520 525agc agt ggc atc gcg aat gct tcg ttc agt gat gat gaa gac aca act 1632Ser Ser Gly IleA la Asn Ala Ser Phe Ser Asp Asp Glu Asp Thr Thr530 535 540cag atg tct ggt tta gct cct ccc act aga gga cga aga ggt tca tcc 1680Gln Met Ser Gly Leu Ala Pro Pro Thr Arg Gly Arg Arg Gly Ser Ser545 550 555 560act gct aat aca act cgt ggt aga gct aaa gcc cca acc aga gga cga 1728Thr Ala Asn Thr Thr Arg Gly Arg Ala Lys Ala Pro Thr Arg Gly Arg565 570 575ggc cgt ggt aag gcc tca agt gcg atg aag caa acc act ctt gat agt 1776Gly Arg Gly Lys Ala Ser Ser Ala Met Lys Gln Thr Thr Leu Asp Ser580 585 590tct ctt ggt ttc cgc cag tct caa aga tct gct tcg gct gct gct tca 1824Ser Leu Gly Phe Arg Gln Ser Gln Arg Ser Ala Ser Ala Ala Ala Ser595 600 605gct gcc ttc aaa agt gct tcc acc att gga gaa gat gat gta gat tct 1872Ala Ala Phe Lys Ser Ala Ser Thr Ile Gly Glu Asp Asp Val Asp Ser610 615 620cct tca agc gaa gaa gtc gag cct gaa gat ttt aac aaa cct gac agc 1920Pro Ser Ser Glu Glu Val Glu Pro Glu Asp Phe Asn Lys Pro Asp Ser625 630 635 640agt tcg gag gac gat gag agc act aaa ggc aaa gga cgt aaa aga cca 1968Ser Ser Glu Asp Asp Glu Ser Thr Lys Gly Lys Gly Arg Lys Arg Pro645 650 655gct act act aag aga ggc aga ggt aga ggt tct ggg act tca aaa cgt 2016Ala Thr Thr Lys Arg Gly Arg Gly Arg Gly Ser Gly Thr Ser Lys Arg660 665 670ggt aga aaa aac gaa agc tct tct tca ctt aat agg cta ctc agt agc 2064Gly Arg Lys Asn Glu Ser Ser Ser Ser Leu Asn Arg Leu Leu Ser Ser675 680 685aaa gac gat gac gag gac gaa gat gat gaa gac aga gaa aag aag ctt 2112Lys Asp Asp Asp Glu Asp Glu Asp Asp Glu Asp Arg Glu Lys Lys Leu690 695 700aac aaa tct cag cct cgg gtt aca agg aac tat gga gct cta aga aga 2160Asn Lys Ser Gln Pro Arg Val Thr Arg Asn Tyr Gly Ala Leu Arg Arg705 710 715 720taa 2163<210>8<211>720<212>PRT<213>鼠耳芥<400>8Met Ser Arg Glu Asp Phe Ser Asp Thr Leu Arg Val Leu Val Ala Thr1 5 10 15Asp Cys His Leu Gly Tyr Met Glu Lys Asp Glu Ile Arg Arg His Asp20 25 30Ser Phe Lys Ala Phe Glu Glu Ile Cys Ser Ile Ala Glu Glu Lys Gln35 40 45Val Asp Phe Leu Leu Leu Gly Gly Asp Leu Phe His Glu Asn Lys Pro50 55 60Ser Arg Thr Thr Leu Val Lys Ala Ile Glu Ile Leu Arg Arg His Cys65 70 75 80Leu Asn Asp Lys Pro Val Gln Phe Gln Val Val Ser Asp Gln Thr Val85 90 95Asn Phe Gln Asn Ala Phe Gly Gln Val Asn Tyr Glu Asp Pro His Phe100 105 110Asn Val Gly Leu Pro Val Phe Ser Ile His Gly Asn His Asp Asp Pro115 120 125Ala Gly Val Asp Asn Leu Ser Ala Ile Asp Ile Leu Ser Ala Cys Asn130 135 140Leu Val Asn Tyr Phe Gly Lys Met Val Leu Gly Gly Ser Gly Val Gly145 150 155 160Gln Ile Thr Leu Tyr Pro Ile Leu Met Lys Lys Gly Ser Thr Thr Val165 170 175Ala Leu Tyr Gly Leu Gly Asn Ile Arg Asp Glu Arg Leu Asn Arg Met180 185 190Phe Gln Thr Pro His Ala Val Gln Trp Met Arg Pro Glu Val Gln Glu195 200 205Gly Cys Asp Val Ser Asp Trp Phe Asn Ile Leu Val Leu His Gln Asn210 215 220Arg Val Lys Ser Asn Pro Lys Asn Ala Ile Ser Glu His Phe Leu Pro225 230 235 240Arg Phe Leu Asp Phe Ile Val Trp Gly His Glu His Glu Cys Leu Ile245 250 255Asp Pro Gln Glu Val Ser Gly Met Gly Phe His Ile Thr Gln Pro Gly260 265 270Ser Ser Val Ala Thr Ser Leu Ile Asp Gly Glu Ser Lys Pro Lys His275 280 285Val Leu Leu Leu Glu Ile Lys Gly Asn Gln Tyr Arg Pro Thr Lys Ile290 295 300Pro Leu Thr Ser Val Arg Pro Phe Glu Tyr Thr Glu Ile Val Leu Lys305 310 315 320Asp Glu Ser Asp Ile Asp Pro Asn Asp Gln Asn Ser Ile Leu Glu His325 330 335Leu Asp Lys Val Val Arg ASn Leu Ile Glu Lys Ala Ser Lys Lys Ala340 345 350Val Asn Arg Ser Glu Ile Lys Leu Pro Leu Val Arg Ile Lys Val Asp355 360 365Tyr Ser Gly Phe Met Thr Ile Asn Pro Gln Arg Phe Gly Gln Lys Tyr370 375 380Val Gly Lys Val Ala Asn Pro Gln Asp Ile Leu Ile Phe Ser Lys Ala385 390 395 400Ser Lys Lys Gly Arg Ser Glu Ala Asn Ile Asp Asp Ser Glu Arg Leu405 410 415Arg Pro Glu Glu Leu Asn Gln Gln Asn Ile Glu Ala Leu Val Ala Glu420 425 430Ser Asn Leu Lys Met Glu Ile Leu Pro Val Asn Asp Leu Asp Val Ala435 440 445Leu His Asn Phe Val Asn Lys Asp Asp Lys Leu Ala Phe Tyr Ser Cys450 455 460Val Gln Tyr Asn Leu Gln Glu Thr Arg Gly Lys Leu Ala Lys Asp Ser465 470 475 480Asp Ala Lys Lys Phe Glu Glu Asp Asp Leu Ile Leu Lys Val Gly Glu485 490 495Cys Leu Glu Glu Arg Leu Lys Asp Arg Ser Thr Arg Pro Thr Gly Ser500 505 510Ser Gln Phe Leu Ser Thr Gly Leu Thr Ser Glu Asn Leu Thr Lys Gly515 520 525Ser Ser Gly Ile Ala Asn Ala Ser Phe Ser Asp Asp Glu Asp Thr Thr530 535 540Gln Met Ser Gly Leu Ala Pro Pro Thr Arg Gly Arg Arg Gly Ser Ser545 550 555 560Thr Ala Asn Thr Thr Arg Gly Arg Ala Lys Ala Pro Thr Arg Gly Arg565 570 575Gly Arg Gly Lys Ala Ser Ser Ala Met Lys Gln Thr Thr Leu Asp Ser580 585 590Ser Leu Gly Phe Arg Gln Ser Gln Arg Ser Ala Ser Ala Ala Ala Ser595 600 605Ala Ala Phe Lys Ser Ala Ser Thr Ile Gly Glu Asp Asp Val Asp Ser610 615 620Pro Ser Ser Glu Glu Val Glu Pro Glu Asp Phe Asn Lys Pro Asp Ser625 630 635 640Ser Ser Glu Asp Asp Glu Ser Thr Lys Gly Lys Gly Arg Lys Arg Pro645 650 655Ala Thr Thr Lys Arg Gly Arg Gly Arg Gly Ser Gly Thr Ser Lys Arg660 665 670Gly Arg Lys Asn Glu Ser Ser Ser Ser Leu Asn Arg Leu Leu Ser Ser675 680 685Lys Asp Asp Asp Glu Asp Glu Asp Asp Glu Asp Arg Glu Lys Lys Leu690 695 700Asn Lys Ser Gln Pro Arg Val Thr Arg Asn Tyr Gly Ala Leu Arg Arg705 710 715 720<210>9<21l>1434<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(1434)<400>9atg atg aca tta aac tca cta tct cca gct gaa tcc aaa gct att tct 48Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15ttc ttggat acc tcc agg ttc aat cca atc cct aaa ctc tca ggt ggg 96Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30ttt agt ttg agg agg agg gat caa ggg aga ggt ttt gga aaa ggt gtt 144Phe Ser Leu Arg Arg Arg Asp Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45aag tgt tca gtg aaa gtg cag cag caa caa caa cct cct cca gca tgg 192Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60cct ggg aga gct gtt cct gag gcg cct cgt caa tct tgg gat gga cca 240Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80aaa ccc atc tct atc gtt gga tct act ggt tcc atc ggc act cag aca 288Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr85 90 95ttg gat att gtg gct gag aat cct gac aaa ttt aga gtt gtg gct cta 336Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110gct gct ggt tcg aat gtt act cta ctt gct gat cag gta agg aga ttt 384Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe115 120 125aag cct gcg ttg gtt gct gtt aga aac gag tca ctg att aat gag ctt 432Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140aaa gag gct tta gct gat ttg gac tat aaa ccc gag att att cca gga 480Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Pro Glu Ile Ile Pro Gly145 150 155 160gag cta gga gtg att gag gtt gcc cga cat cct gaa gct gta acc gtt 528Glu Leu Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175gtt acc gga ata gta ggt tgt gcg gga ctg aag cct acg gtt gct gca 576Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala180 185 190att gaa gca gga aag gac att gct ctt gca aac aaa gag aca tta atc 624Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile195 200 205gca ggt ggt cct ttc gtg ctt ccg ctt gcc aac aaa cat aat gta aag 672Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys210 215 220att ctt ccg gca gat tca gaa cat tct gcc ata ttt cag tgt att caa 720Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240ggt ttg cct gaa ggc gct ctg cgc aag ata atc ttg act gca tct ggt 768Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255gga gct ttt agg gat tgg cct gtc gaa aag cta aag gaa gtt aaa gta 816Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val260 265 270gcg gat gcg ttg aag cat cca aac tgg aac atg gga aag aaa atc act 864Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285gtg gac tct gct acg ctt ttc aac aag ggt ctt gag gtc att gaa gcg 912Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala290 295 300cat tat ttg ttt gga gct gag tat gac gat ata gag att gtc att cat 960His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320cct caa agt atc ata cat tcc atg att gaa aca cag gat tca tct gtg 1008Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335ctt gct caa ttg ggt tgg cct gat atg cgt tta ccg att ctc tac acc 1056Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350atg tca tgg ccc gat aga gtt cct tgt tct gaa gta act tgg cct aga 1104Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg355 360 365ctt gac ctt tgc aaa ctc ggt tca ttg act ttc aag aaa cca gac aat 1152Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380gtg aaa tac cca tcc atg gat ctt gct tat gct gct gga cga gct gga 1200Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400ggc aca atg act gga gtt ctc agc gcc gcc aat gag aaa gct gtt gaa 1248Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415atg ttt att gat gaa aag ata agc tat ttg gat atc ttc aag gtt gtg 1296Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val420 425 430gaa tta aca tgc gat aaa cat cga aac gag ttg gta aca tca ccg tct 1344Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445ctt gaa gag att gtt cac tat gac ttg tgg gca cgt gaa tat gcc gcg 1392Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala
450 455 460gat gtg cag ctt tct tct ggt gct agg cca gtt cat gca tga 1434Asp Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 475<210>10<211>477<212>PRT<213>鼠耳芥<400>10Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30Phe Ser Leu Arg Arg Arg Asp Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr85 90 95Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe115 120 125Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Pro Glu Ile Ile Pro Gly145 150 155 160Glu Leu Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala180 185 190Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala ASn Lys Glu Thr Leu Ile195 200 205Ala Gly Gly Pro Phe Val Leu Pro Leu Ala ASn Lys His Asn Val Lys210 215 220Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val260 265 270Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285Val Asp Ser Ala Thr Leu Phe ASn Lys Gly Leu Glu Val Ile Glu Ala290 295 300His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg355 360 365Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val420 425 430Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala450 455 460Asp Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 475<210>11<211>20<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>11gcggacatct acatttttga 20<210>12<211>1353<212>DNA<213>鼠耳芥<400> 12gctgggtaag tagatcgttg catcactatg agatgtctaa gcttcttagg gatcaatatg 60acgctgaagg cgcttgtatg attatcaaat ctggatctcc aggcgcaaaa tctcaggtca 120gtttcatcat tctcaaggca cttacagttt ccaactcttt gcttgtaact tagtttctgt 180ttgttcttaa acatattttg aggatttgca gatatggaca gagcaagttg taagtatgta 240tatcaaatgg gcagaaaggc taggccaaaa cgcgcgggtg gctgagaaat gtagtttatt 300gagtaataaa agtggcgtaa gttcagccac gatagagttt gaattcgagt ttgcttatgg 360ttatctctta ggtgagcgag gtgtgcaccg ccttatcata agttccactt ctaatgaggt 420atacattata agttataact ctctttctcg taactaatca ctttcgtgtc cattatcatg 480gcccgggaaa gaattaaaag aggttttctt tgcgccagga atgttcagcg actgttgata 540tcataccact attcttgaga gcatctcctg attttgaagt aaaggaaggt gatttgattg 600tatcgtatcc tgcaaaagag gatcacaaaa tagctgagaa tatggtttgt atccaccata 660ttccgagtgg agtaacacta caatcttcag gtattcttga gtgtgttgtt agttgttaca 720ctttggttta ctgcatttta tgcagattat ataacatgag gtttttgatg caggagaaag 780aaaccggttt gcaaacagga tcaaagctct aaaccggttg aaggcgaagc tacttgtgat 840agcaaaagag caaaaggttt cggatgtaaa taaaatcgac agcaagaaca ttttggaacc 900gcgggaagaa accaggagtt atgtctctaa gggtcacaag atggtggttg atagaaaaac 960cggtttagag attctggacc tgaaatcggt cttggatgga aacattggac cactccttgg 1020agctcatatt agcatgagaa gatcaattga tgcgatttag gcttaatcaa ttggtacttt 1080aattgctttt tgttttgtat ccaaaaagca acaaatggtt gcttgtgtgt gtatatatat 1140aaccttcttg tccagaacca tatatgattc taaccatcaa acaaagataa gaattggtga 1200ctatgtgcta tactctacaa tatcaccatg aatacttcaa actagacttt tgataaattt 1260tgaaacggtt attaccaata aaacgaaaac catgaaactc ttgttttaat tatcagattc 1320gagaaagttg tgtacaaaca tagctgagaa ggg 1353<210>13<211>184<212>DNA<213>鼠耳芥<400>13gcttaatcaa ttggtacttt aattgctttt tggtttgtat cccaaaagca acaaatggkt 60gcttgtgtgt gtatatatat aaccttcttg gccagaacca tatatgawtc taaccattaa 120accaagatta gaattggtga ctaaaaaaaa agaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180aaaa 184<210>14<211>2170<212>DNA<213>鼠耳芥<400>14atggtaagcg tttctttaac tctattttct tcattgtttc agttattggc gattgtattc 60tctgtttatt gtaatcgtat tgtgttaatt ttgatttgac tcatcttctc taaagttcaa 120tttcaaaatt agggattccg agatcataga tattgctttg tttccgagat ttgagttatt 180cttaagcttg ttttactaac tttcaatatg ttggatttgt tataggcaac tcttgaagat 240tctttccttg ctgatttgga cgagttatct gacaatgaag cagaattggt gagtgttaaa 300acacttttga ttactattat ctgtttactt ggaggagcta tgattgtaat tgtagtttgt 360ttgattatac atatgcagga cgagaatgat ggtgatgttg gaaaggaaga agaagatgtt 420gatatggata tggctgattt agagacactt aactatgatg atctcgataa tgtttctaag 480ctgcagaaga gtcagagata tgctgatatt atgcataaag tagaggaggc tcttgggaaa 540gattctgatg gagctgagaa aggaactgtc ttggaagatg atcctgagta taagcttatt 600gtggattgta atcagctttc ggtcgatatt gagaatgaaa tcgttattgt ccacaacttt 660atcaaagaca agtacaagct taagtttcaa gagcttgagt cgttggttca tcaccctatt 720gactatgcat gtgttgtgaa gaagattggg aatgagacgg atttggctct tgttgatctc 780gctgaccttc ttccttcagc tattatcatg gttgtttcag ttactgcttt aactacgaaa 840gggagtgcac tgccagagga tgttttgcaa aaggtgttag aggcttgtga tcgggcttta 900gatcttgatt ccgcaaggaa gaaggtcctt gagtttgttg aaagtaagat gggatctatt 960gcacctaatc tttctgctat tgttgggagt gctgttgcag ccaaactcat ggggactgct 1020ggaggtttgt cagcacttgc taaaatgcct gcgtgtaatg ttcaagttct tggccacaag 1080aggaagaacc ttgctgggtt ttcttctgca acgtctcagt cccgtgtggg ttatctggag 1140cagacagaga tttaccaaag cacgcctcct ggacttcagg ctcgcgctgg caggctcgtg 1200gctgcaaaat caactttggc agcaagagtt gatgctacta gaggggatcc gttagggata 1260agtggaaaag ctttcaggga ggagatccgt aagaagattg agaaatggca agaacctcct 1320cctgcaagac agcctaagcc acttcctgtt cctgattctg aaccgaagaa aagaaggggt 1380ggtcgccgtc taagaaaaat gaaagaaagg tagccttttt catcctactt tgtgtcctta 1440attactgtag attgagttct attcacctgt atttattttg ttgcattctt acgtttctct 1500ttaaatcagg tatcaagtaa cagatatgag gaagctggcc aacagaatgg cgtttggtac 1560acctgaagag agctccctcg gtaatatatc ttgtagttac acttgttaat ggccacttat 1620aaggcactta gtctaatatc tactcttcat gatgataggt gatggactag gagaaggtta 1680tggaatgctt ggccaggcag gaagcaacag gctgcgagta tccagtgttc cgagcaagct 1740taagattaat gctaaggtcg ccaaaaagta agtgttcctc tatttctcct gtgttttttc 1800ggatttatca tgttaatatt tttactctta caaattatcc tgccctgttc ttcttccatc 1860atatctcatt tgcgtcttta tatcaattac tttttcaggc ttaaagaaag gcagtatgcg 1920ggtggtgcga ctacctctgg tttgacatcg agcctggctt tcactcctgt gcaggtacaa 1980acatttcatt cgattcttga caaaagtttg atcctgtgtt ccatttgcat cactgtctga 2040ctccaattgg ttatctattt gacagggaat agagttgtgc aatcctcagc aggctttagg 2100attaggaagt gggactcaaa gcacttactt ctcagagtca ggaaccttct cgaagctgaa 2160gaagatctaa2170<210>15<211>20<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>15accttaggcg acttttgaac 20<210>16<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>16aaacgcttac catatctctt tcta24<210>17<211>113<212>DNA<213>鼠耳芥<400>17aaacactagt cgctcgctgc tcttcaattt tcttctcgaa tctaatcgat tgatttctcc 60ttcgattctt caggagaatc actgaagctt ttgcctccca agtagaaaga gat113<210>18<211>218<212>DNA<213>鼠耳芥<400>18aatatggaag acagagatnc aagtcttgaa aagccgagca ctaaaagtgt aaaaatgaac 60caaaggtgga aagaaactgc tttctctatc tcatgtctgt tttaaggttt cttcggtcac 120ttaagagaca aaaggcattg ttttgatcac tctttggaaa cgttttataa attttatttt 180tgtattagag ccaaaaaaaa aaaaaaaaaa aaaaaaaa 218<210>19<211>4140<212>DNA<213>鼠耳芥<400>19cagtacactt agctacactg gatccaagtc tagtgctaaa ctcaaacctc gtggttttag 60accaaaatct cttcttcttc gtttccttct tcctcatcat atctttcatc ttctccacca 120gaatttgttt taggctctcc ttcttctgtt tctttttctc ccaaagaaac aattagatat 180ggagaacctt accctagttt cttgctcagc ttcttctcca aagctgttaa ttggatgcaa 240tttcacttcc tcgctgaaaa accctactgg gttttctcgt cggactccta atattgtcct 300ccggtgttcc aaaatatctg cctctgctca atctcaatct ccctcttcgc gtccggagaa 360cactggagaa atcggttagt ttgcaaattc cactcgacac tctattatag caaatgccaa 420aattttccgg aaaaatttcc agtttattac ttttatctat cttattgaaa ctcaaattgc 480gaaccctttt cgactggttt aatatgagct tatgaattgc tatatctctt aaaaaaatcc 540acactttgtg aatttgcaat ttgaattctt gtagaaacca ttcattgtta gaattgttta 600ctttaagttt atgttcgatt tgcagtggtt gtgaaacaga gaagcaaagc ttttgcaagt 660atattttctt cgagtcgtga tcaacagaca acttctgttg cttcccctag tgtgcctgtg 720ccaccaccat cttcatcaac catgtaattt tcctggtttt ggacaatgtg cttagtttgt 780atgtcgtttg attcttggtt attaaattgt gttttttctt ttttcttgta gaggatcacc 840acttttctgg attggtgttg gtgttggtct atcagctttg ttctcatatg tgagtatcaa 900gattccttcc taattttttt ttcctctata aatattcttt cttgcttcaa tattgattaa 960taagtgcttg accttttttc ttttctgatg gcattgcagg taacttcaaa tttaaaggta 1020cagatacttg gccctctggt tttacgggac ttttgttctc tagtctgttg cagaaccacg 1080attttatgct tcatgtcaac tctagtgtat tgtgctcatg tatctgagat agttttattc 1140actaaactgg ttatcttaac aaggtgaact gtttgctcac acttgttgaa ccgtttatat 1200aagcatcgaa cttttgcctc tctttttttg ggtagtcact tgattcgtag atggtaacct 1260acataccatt atggttttag tgatgcaact caggtattca gacttatagt cattttcgca 1320actccagtat ttgattgaaa tatattatac aagttgtcat tgctttctct cattattctc 1380taaccggctg ttactctctt tggatttttt tttttgcttt ggtttagaaa tatgcaatgc 1440aaacagctat gaagacgatg atgaaccaaa tgaatacgca aaatagccag tttaataatt 1500ctggattccc atcaggatca ccttttccgt ttccatttcc tcctcaaaca agtcctgctt 1560cctcgccatt ccaatctcaa tcccagtctt caggtgctac cgttgatgtg acagcgacaa 1620aagtagagac acctccttca actaaaccga aacctacacc tgcaaaggat atagaggtgg 1680ataagccaag tgttgtctta gaggcaagca aagagaagaa agaagaaaag aactatggta 1740gattcttttt ctgtttcaga aatcaacgtc ttttcatttg tattctcaat tttgactttc 1800ttcctttctc attttccaag cttctaactt ggaagctgat ttacttttgg atgcagcctt 1860tgaagacatt tcacccgagg aaaccacaaa agaaagccca tttagcaact atgcagaagt 1920ctctgaaact aattccccca aagaaactcg cttgtttgag gatgtaagtt tcgttttctt 1980ttgtatttcc acagcacacc aagtggtgat ttaaaaacgt gacatagttt tgctaacctt 2040ctatgctctc ttattgatct ctgggtgaag gtcttgcaaa atggagctgg tccggcaaat 2100ggtgccactg cttcagaggt ttttcaatct ttgggtgagt tattgaattt cagttttcat 2160cactatcagc gcactgtgca tgattcatga ttaaggctac ggatttcaat tttattttat 2220agcatatgcc aacaattata aacaaaggaa gatatgaaat tggtgataaa gaggaatgag 2280ttggcttcaa aaggatctac tccgttactt ttgtccttct gctagtcgtt gatctgtatt 2340ggtataacca tataagactt gcaggatatt accttggcaa tctgtttcat atctcatgtg 2400ttatgattct tttttcttat atgctcacgt tattgtctct cttttcctta ttctaaattt 2460aaaactgaat cctgagtctg tctattgttt acacaggtgg tgggaaagga gggccgggtt 2520tatctgtaga agctttagag aaaatgatgg aagatccaac agtccagaag atggtttacc 2580cgtaactcat cttccctagc acattgtctt taaatgcatc cattaagttt atctttaaaa 2640ctggttgctt agtggacatt tggtaacatt gcatgtataa atgcagatac ttgcctgagg 2700agatgaggaa cccagaaact ttcaaatgta agtcttttaa tatttaatcc tgctatcatt 2760cttttattag tcctcatttt tacatatttc taaagactaa aggttacatg actagctttt 2820gaatgatgta attcgtttat aggttgatcc aatggttatc taaatttaaa atacagtttg 2880gtacttattg tctccgcttg gaattttgta gggatgctta aaaatcctca gtaccgtcaa 2940caactacagg acatgttgta agagctccat tttacgaaca atttagttgt ttccattgct 3000tttaagaatg tctaaactat gtaattaaga aatactcttg tttgtttctt ttcatgaatt 3060taggaataat atgagtggga gtggtgaatg ggacaagcga atgacagata cattgaagaa 3120ttttgacctg aatagtcctg aagtgaagca acaattcagt aagacaaatc tcagtttgta 3180ccaagttaat agtacgttaa ataggtctga tactcaatga ttgaatctgt atttgtcaga 3240tcaaatagga ctaactccag aagaagtcat atctaagatc atggagaacc ctgatgttgc 3300catggcattc cagaatccta gagtccaagc agcgttaatg gaagtacgtt ttcttttaac 3360ctgaataaga gaattgctta attttacccc acttctttct tcatacaaaa cagaaaccaa 3420ttacattctt gttgttgttg cagtgctcag agaacccaat gaacatcatg aagtaccaaa 3480acgacaaaga ggtaataata ctgccacttc tccattgccc aaaaaggcga ttactttttt 3540aagaaatttg aggttattat acattgattg caggtaatgg atgtgttcaa caagatatcg 3600cagctcttcc caggaatgac gggttgaaaa agctcacgtc tttggttcta tcaaaaatgt 3660cacattgtct ttagcttttt gtagggagaa aaaaatgttt ttttttttgc aaagagtctt 3720cagttttggt cagatcagag aattgtgtac catgttaatc ttaaacgcgg tcgggaattg 3780gagtcgtgtg aaaacgccgc tgctgttgtt tggtatgaat attatacaat agaatttgtt 3840gtcttaccaa aaaaagtcta tgaagacact gaagagcaaa ttattatttt taagggaaaa 3900tttccaaaat aaacttcatg tattcaaaat ttgcttgaaa aaacctcaat tttttttgtt 3960tgagattgtg tgaataaatc tgccaatatt ttgttttagc aatttaaaaa attgaagttt 4020ttttctcgca aattttaaat agttgtgatt tattttggaa ttttacctta tttttaatat 4080ccaaaaggag aagtgacgtg gcgatatcga agcggtttaa tgaagtgatg gccccatctt 4140<210>20<211>77<212>DNA<213>鼠耳芥<400>20ccacgcgtcc gctccaccag aatttgtttt aggctctcct tcttctgttt ctttttctcc 60caaagaaaca attagat77<210>21<211>354<212>DNA<213>鼠耳芥<400>21aaaagctcac gtctttggtt ctatcaaaaa tgtcacattg tctttagctt tttgtaggga 60gaaaaaaatg tttttttttt tgcaaagagt cttcagtttt ggtcagatca gagaattgtg 120taccatgtta atcttaaacg cggtcgggaa ttggagtcgt gtgaaaacgc cgctgctgtt 180gtttggtatg aatattatac aatagaattt gttgtcttac caaaaaaagt ctatgaagac 240actgaagagc aaattattat ttttaaggga aaatttccaa aataaacttc atgtattcaa 300aatttgcttg aaaaaacctc aatttttttt gttgaaaaaa aaaaaaaaaa aaaa 354<210>22<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>22cagaccacaa taccttcaaa aata24<210>23<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>23ccattgtgtctccctcccgc tgtt 24<210>24<211>5077<212>DNA<213>鼠耳芥<400>24atgattgtaa aacttgacag ggaggatttt agtgatacac ttcgagtact tgttgcaact 60gattgccact tgggctacat ggagaaggat gaaattaggc ggcatgattc atttaaggct 120ttcgaagaga tatgttctat agctgaggag aaacaggtct ggtattcagt atctatccct 180tgccagtatt atcttgcgtt tgaatcatct aacatattat cttaaataaa aatcttctcc 240caatattatg agtagtaaac agtgttctac ctaattttaa caaaaattca accaattgcg 300aggaagaatt ctcagaaagt ttcatatctt cttttttcac tcttttgaaa caggtggact 360tcttactcct cggaggtgat ctttttcatg agaataaacc ctctagaact acgttagtta 420aagccattga aattcttcgt cgccactgtc tgaatgataa accagtgcag tttcaagtag 480tcagcgacca gacagtaaat tttcagaatg cgtgagactc tatcctttct gctattaatc 540taatcataac aggaaataat ttcaactgaa ctaattaatt ggcaaattgg ctcaaattcg 600tgtatagatc tacgtattct tattaatccc ttgacattat tttctggcta caggtttggt 660caagtcaatt acgaggatcc acacttcaat gtaggcttgc ccgtgttcag tattcatgga 720aaccatgatg atccagccgg agtggtacat cacttacatc tgcatgctct tgttatgcaa 780actcatttga ataggtatat agaactggat tagttagtga ataggtattt tattgtgttt 840ttgttctatg tctcttatgg ctacaggaca atctttctgc aattgatatt ctttccgcat 900gcaaccttgt gaactatttt ggaaagatgg ttcttggtgg ttctggtgtt ggccagatta 960ctctctaccc tatacttatg aagaaggttg gtgtaaagaa tttctaacct agacacctgg 1020ctccccctga cttcttggac tatcatttaa tcaaattaat gtttagggct caacaaccgt 1080ggctctctat ggtttaggaa acatcaggga tgaacgtctc aatagaatgt ttcaggtaat 1140ccagaggacc ctcacctttt gctatacaat tgttaattgt gttaatattt attggtttca 1200cagaccccac atgctgtcca atggatgagg cctgaagttc aagaaggatg tgatgtttct 1260gactggttca acattctggt gcttcatcaa aataggttga ttccattgct ataacatctt 1320ttagatcgtt ttcttactca ttctgtatca gaaaatttga tactgtattc atatgacttg 1380cagggtgaaa tcaaacccca aaaatgcaat aagtgagcac tttcttccac gtttcctcga 1440cttcattgtg tggggccatg agcatgaatg cctaatcgac ccccaggtcc atgaaaaatt 1500tgatttttgg agttattgca tttaaataag agtgagccac aatgttactt gcctctttga 1560gctaaaagct attaaacttt tgaaggaggt atctggaatg ggcttccaca tcacacaacc 1620aggatcttct gtggcaacat cacttattga tggggaatcg aagccaaaac atgttcttct 1680cttagaaatc aaggttcttc agcaaacaat ctgaaatttc atcttcactt tattcgtact 1740tcattttctg gtcttttttc ctccttttca atcaagcatg taagcttgag tgacttaaaa 1800tatatgactt acagggaaat caatatcgtc ctacgaagat acctttgaca tctgtgaggc 1860cttttgagta tacagaggta aagtttactt ttccttaata tgttatggtg gtggcagact 1920tctttgctta catattttca aagtgcagat tgttttaaag gatgaaagtg atattgatcc 1980caatgatcaa aactcaattc tggaacactt ggataaagtg gtacctattc cctcttctca 2040tagttcatgt ggatatcttt tctcctgccc tttttgaata accagtcact gaatgtctct 2100actaatatct acaaaattgt taggtcagaa atctaataga gaaagctagc aaaaaagctg 2160ttaacagatc agagatcaaa ctcccattgg ttcgaatcaa ggtaacttgt ttccaagttt 2220tcttcaaact gctgcaaatt ctagcaacac tcatataatt aaacctttat tttctaaccc 2280aactctagag gctaggcttt gccagtttga tgcatgcaca cccatagcca caaacagata 2340attgttatta agaatattaa atgactgaca aaagactaag atctgcttca tctttcaggt 2400agattattct ggatttatga cgataaatcc tcaaagattt ggacagaaat atgtgggaaa 2460ggtacctaga aattagttac tgtaacatga tggtcaccat acttctttga atgttggcta 2520actaatgaca aagtcccaaa cacttacagg ttgcaaatcc ccaggacatt ttgatatttt 2580ccaaggcttc taagaagggt cggagcgaag gtaagggcat tggtgtacta gtaatttata 2640caattttgtt tggattagat tgatgcacgt gcttttactc taacttgtaa tagcttatct 2700ggcaaaaatt acggttaagt agtgtatctg agatatagta atgtagaaca atatgggcct 2760atgataacct cctttgttgt tttattgtcg gtattataat tctcgtcata tatatcatga 2820ctactaactt tctgttgtgt ggagcttgat attgatgtat tgagtgttaa ttttctttct 2880gttccacttt tcttgttata gttcatgttt cttcgtgtgt aacctatagc atcaaaattt 2940tgcgaatctt atggattatc tctagttagt atatattgga aatttgccat tttgataatt 3000tttttgtcta gtgaattgaa tggcaatgat gcatgtcctg atggttgtcc agtgatccag 3060ttatgatata tttcaatctt ccatttcaca gccaacatcg atgattctga gcggcttcgt 3120ccagaagaac tgaaccagca gaatatagaa gctttagtag ctgaaagcaa cctggtacat 3180cctgcaacct tctttcctta tgattgtgtt attatcgtca acccctgtag aactttgcca 3240cagaatgata tagacttggg tagttaccaa atgggcatga gtacactatg ggatgatcat 3300tctattttct tccgcagaaa atggagatcc ttccagttaa cgatctggat gttgctcttc 3360acaattttgt gaacaaggat gataaactag ccttctactc atgcgttcag tacaatcttc 3420aagagactcg tgtatgtact attttttact tcaccattca atacaaagtt ctgcatagga 3480tattattttt atttcgtagc acgtccttgt tattgctttt atgatttatc tcttccctct 3540ttttgtacag ggtaaacttg caaaggattc agatgccaag aaatttgagg aagatgactt 3600gattcttaaa gtgggagagt gcttagaggc aagaagatat agattcagtt agttctgccg 3660cagattatga gaaccagcag aatattgatc tcacttgcat tattgttcgt gcaggaacgc 3720ttgaaagata ggtccactcg acccactggt tcctcacagt ttttatccac tggattgact 3780tcagaggttt aaattctctt ttttagattt tccttgcctc tgtccttccg ttggtttctc 3840acagtgctat tttctacctg agattggtac agaatttgac aaaaggaagc agtggcatcg 3900cgaatgcttc gttcagtgat gatgaagaca caactcagat gtctggttta gctcctccca 3960ctagaggacg aagaggttca tccactgcta atacaactcg tggtagagct aaagccccaa 4020ccagaggacg aggccgtggt aaggcctcaa gtgcgatgaa gcaaaccact cttgatagtt 4080ctcttggttt ccgccagtct caaaggtaac tttttgacag cacatttaac cagtttaggg 4140taggattcac ggacgtgcaa ggaaatgatt ggcatcacta gctagctaat gttatgtccc 4200taatttgtct ttcatagatc tgcttcggct gctgcttcag ctgccttcaa aagtgcttcc 4260accattggag aagatgatgt agattctcct tcaagcgaag aagtcgagcc tgaagatttt 4320aacaaacctg acagcagttc ggtatggact attccttaca ctgttattca tttgttcact 4380accataagaa agcccatgta aaaacttgac aacatataac ttttggcatt cttatttctc 4440tatttgaagt aaattttgcg tttttacttt tcctgattct tgtttgatat ccactaaagg 4500aggacgatga gagcactaaa ggcaaaggac gtaaaagacc agctactact aagagaggca 4560gaggtagagg ttctgggact tcaaaacgtg gtagaaaaaa cgaaagctct tcttcactta 4620ataggctact cagtagcaaa gacgatgacg aggacgaaga tgatgaagac agagaaaaga 4680agcttaacaa atctcagcct cgggtttgtt aatcacatct attttccctt ctttcgctgc 4740ttattagcag gttttagtaa gttgttgtta accatttgag atcaaagctc acttaatagt 4800acaatttgaa tatgcaggtt acaaggaact atggagctct aagaagataa atacatatca 4860aaccccaatc tctgacatca caacgaagct tcatttttct gttattttct agcgacctct 4920caagcggaac aacttctgaa gaagagaaat tagtactaac aagagttctg tgagatgatg 4980tacagagaat tttgtagtgt ttttttttct tgctcttttt aaggttacgt tgttgatgaa 5040tgaggcaata tgattaacgt cagtaagaag tctaaaa 5077<210>25<211>18<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸<400>25tgtaaaacga cggccagt 18<210>26<211>255<212>DNA<213>鼠耳芥<400>26atacatatca aaccccaatc tctgacatca caacgaagct tcatttttct gttattttct 60agcgacctct caagcggaac aacttctgaa gaagagaaat tagtactaac aagagttctg 120tgagatgatg tacagagaat tttgtagtgt ttttttttct tgctcttttt aaggttacgt 180tgttgatgaa tgaggcaata tgattaacgt cagtaagaag tctaaaaaaa aaaaaaaaaa 240aaaaaaaaaa aaaaa 255<210>27<211>2935<212>DNA<213>鼠耳芥<400>27tcatgcatga actggcctag caccagaaga aagctgcaca ttcgcggcat attcacgtgc 60ccacaagtca tagtgaacaa tctcttcaag agacggtgat gttaccaact cgtttcgatg 120tttatcgcat gttaattcca caaccttgaa gatatccaaa tagcttatcc tgtaaacaaa 180agtgagaata taaacaattg tgattcgtat caagaacttc attgagatgc tcaaaactga 240aaaataattc ttacttttca tcaatgaaca tttcaacagc tttctcattg gcggcgctga 300gaactccagt cattgtgcct ccagctcgtc cagcagcata agcaagatcc atggatgggt 360atttcacatt gtctggtttc ttgaaagtca atgaaccgag tctgccaaaa tccacaattg 420taaacaactt ttggttttag gtgctgaatg ctgatagata aggcagtggt cctaacccag 450tttaactgat ccacaccaaa acagtagcaa aataaccaat tgcaaaacca aaccgaagac 540cgattcggtt tcatttttta tcttatctaa acaacctaaa accaaactga aaacaagatt 600ggggaacttt tcttggtgat aattaaaatt ttcaactaag cttagcttca cacttgataa 660acagagagta tataaatgtg gttagcttac ttgcaaaggt caagtcttgg ccaagttact 720tcagaacaag gaactctatc gggccatgac atggtgtaga gaatcggtaa acgcatatca 780ggccaaccca attgagcaag cacagatgaa tcctgtggaa caaaacaaat acatgttata 840cagttatttt tttaaaaccg gaaaaataat aatttagtta gtaatgtttc agcaagacct 900gtgtttcaat catggaatgt atgatacttt gcggatgaat gacaatctct atatcgtcat 960actcagctcc aaacaaataa tgcgcttcaa tgacctcaag accctgtttc aaaaaatcaa 1020gaactcatct accttgatca aaggtatttt caaaatcaga gtttaacctt aggagaaaat 1080aatcttaacc ttgttgaaaa gcgtagcaga gtccacagtg attttctttc ccatgttcca 1140gtttggatgc ttcaacgcat ccgctacttt aacttccttt agcttttcga caggccaatc 1200cctttttcaa aatccagtga aaagtttcca ttaaccaaac gagaattgag aagaaaaaaa 1260gtctatgcag agagagaaga atatcgaaac aaacctaaaa gctccaccag atgcagtcaa 1320gattatcttg cgcagagcgc cttcaggcaa accttgaata cactagagaa cataaaagaa 1380gatttttcac tcaaattgcc agaggttgaa cttgcattaa gaccaacgct gaactcaata 1440tgaaagttga ggtacttaat tctatgtgat ttgtgatacc tgaaatatgg cagaatgttc 1500tgaatctgcc ggaagaatct ttacattatg tttgttggca agcggaagca cgaaaggacc 1560acctgcgatt aatgtctctt tgtttgcaag agcaatgtcc tttcctgctt caattgcagc 1620aaccgtaggc tgcagtaaaa ataagcaaca agctttatca tctgcaactt tcttttttca 1680tatcctctta ataaggttta ataacaaaaa attagagtat atacctttag tcccgcacaa 1740cctactattc cggtaacaac ggttacagct tcaggatgtc gggcaacctg ttgatgaaca 1800taataagtaa aaacctatct acactacaat caaaactaac aaatgaacta acctcaatca 1860ctccttgctc tcctggaata atctcgagtt tatagtccaa atcagctaaa gcctctttaa 1920gctcattaat cagtgactcg tttctaacag caaccaatgc aggcttaaat ctccttacct 1980gccaccattc aaaatagaat cacagaacca tactatagag atttcttgag attgcagaag 2040caaaagccta aaccagaacc tgatttctct ggtttgatct gatacataac gagttaatac 2100tatcttgctt atgatactac cactgaactg agaattaaac tgaattccaa gtggtctgaa 2160tgacaaattg gagagactca atactaattt ttttacaaat gaagccaact tacctgatca 2220gcaagtagag taacattcga accagcagct agagccacaa ctctgaattt gtcaggattc 2280tcagccacaa tatccaatgt ctgcaaaatg gaagttcttg tcgataaaaa tgatgcaaca 2340ataactcagt aagaaaaaaa tatcattctt ctatgagtct agtcattcat aagacaaact 2400taaagtctgg tcatactcaa gaactgcaca ataatgcctt aatcgaaata aaacctgagt 2460gccaatagaa ccagtagatc caacgataga gatgggtttt ggtccatccc aagattgacg 2520aggcgcctca gggacagctc tcccaggcca tgctggagga ggttgttgtt gctgctgcac 2580tttcactgaa cacttaacac cttttccaaa acctctccct tgattcctcc tcctcaaact 2640aaacccacct gtgaaacact ccaaagatgt aaaatttaaa actctacgac ctaaagcaaa 2700ccaaaaaaaa tcgaattgaa gaaataacag attacctaga tagagaaatt cacaagagcc 2760taagacaact aatgaaagtt tgcaacttta atcgaaaaga gagttgacca aggaggagga 2820aagaagagag gaagaagaag aaacctgaga gtttagggat tggattgaac ctggaggtat 2880ccaagaaaga aatagctttg gattcagctg gagatagtga gtttaatgtc atcat 2935<210>28<211>1434<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)..(1434)<400>28atg atg aca tta aac tca cta tct cca gct gaa tcc aaa gct att tct 48Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15ttc ttg gat acc tcc agg ttc aat cca atc cct aaa ctc tca ggt ggg 96Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30ttt agt ttg agg agg agg rat caa ggg aga ggt ttt gga aaa ggt gtt 144Phe Ser Leu Arg Arg Arg Xaa Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45aag tgt tca gtg aaa gtg cag cag caa caa caa cct cct cca gca tgg 192Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60cct ggg aga gct gty cct gag gcg cct cgt caa tct tgg gat gga cca 240Pro Gly Arg Ala Xaa Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80aaa ccc atc tct atc gtt gga tct act ggt tcy aty ggc act cag aca 288Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Xaa Xaa Gly Thr Gln Thr85 90 95ttg gat att gtg gct gag aat cct gac aaa tty aga gtt gtg gct cta 336Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110gct gct ggt tcg aat gtt act cta ctt gct gat cag gta agg aga ttt 384Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe115 120 125aag cct gcr ttg gtt gct gtt aga aac gag tca ctg att aat gag ctt 432Lys Pro Xaa Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140aaa gag gct tta gct gat ttg gac tat aaa cyc gag att att cca gga 480Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Xaa Glu Ile Ile Pro Gly145 150 155 160gag cwa gga gtg att gag gtt gcc cga cat cct gaa gct gta acc gtt 528Glu Xaa Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175gtt acc gga ata gta ggt tgt gcg gga ctg mag cct acg gtt gct gca 576Val Thr Gly Ile Val Gly Cys Ala Gly Leu Xaa Pro Thr Val Ala Ala180 185 190att gaa gca gga aag gac att gct ctt gca aac aaa gag aca tta atc 624Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile195 200 205gca ggt ggt cct ttc gtg ctt ccg ctt gcc aac aaa cat aat gta aag 672Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Ash Val Lys210 215 220att ctt ccg gca gat tca gaa cat tct gcc ata ttt cag tgt att caa 720Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240ggt ttg cct gaa ggc gct ctg cgc aag ata atc ttg act gca tct ggt 768Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255gga gct ttt agg gat tgg cct gtc gaa aag cta aag gaa gtt aaa gta 816Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val260 265 270gcg gat gcg ttg aag cat cca aac tgg aac atg gga aag aaa atc act 864Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285gtg gac tct gct acg ctt ttc aac aag ggt ctt gag gtc att gaa gcg 912Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala290 295 300cat tat ttg ttt gga gct gag tat gac gat ata gag att gtc att cat 960His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320cck caa agt atc ata cat tcc atg att gaa aca cag gat tca tct gtg 1008Xaa Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335ctt gct caa ttg ggt tgg cct gat atg cgt tta ccg att ctc tac acc 1056Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350atg tca tgg ccc gat aga gtt cct tgt tct gaa gta act tgg ccw aga 1104Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Xaa Arg355 360 365ctt gac ctt tgc aaa ctc ggt tca ttg act ttc aag aaa cca gac aat 1152Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380gtg aaa tac cca tcc atg gat ctt gct tat gct gct gga cga gct gga 1200Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400ggc aca atg act gga gtt ctc agc gcc gcc aat gag aaa gct gtt gaa 1248Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415atg tty att gat gaa aag ata agc tat ttg gat atc ttc aag gtt gtg 1296Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val420 425 430gaa tta aca tgc gat aaa cat cga aac gag ttg gta aca tca ccg tct 1344Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445ctt gaa gag att gtt cac tat gac ttg tgg gca cgt gaa tat gcc gcg 1392Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala450 455 460rat gtg cag ctt tct tct ggt gct agg cca gtt cat gca tga 1434Xaa Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 475<210>29<211>477<212>PRT<213>鼠耳芥<400>29Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30Phe Ser Leu Arg Arg Arg Xaa Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60Pro Gly Arg Ala Xaa Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Xaa Xaa Gly Thr Gln Thr85 90 95Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe115 120 125Lys Pro Xaa Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Xaa Glu Ile Ile Pro Gly145 150 155 160Glu Xaa Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175Val Thr Gly Ile Val Gly Cys Ala Gly Leu Xaa Pro Thr Val Ala Ala180 185 190Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile195 200 205Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys210 215 220Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys glu Val Lys Val260 265 270Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala290 295 300His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320Xaa Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Xaa Arg355 360 365Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val420 425 430Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala450 455 460Xaa Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 47權(quán)利要求
1.分離的DNA分子,其含有與選自SEQ ID NO1、SEQ ID NO3、SEQID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的核苷酸序列。
2.權(quán)利要求1的DNA分子,其中該序列編碼與選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列基本相似的氨基酸序列。
3.權(quán)利要求1的DNA分子,其中該序列是選自SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列。
4.權(quán)利要求1的DNA分子,其中該序列編碼選自SEQ ID NO2、SEQID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列的氨基酸序列。
5.根據(jù)權(quán)利要求1的DNA分子,其中所述核苷酸序列是植物的核苷酸序列。
6.權(quán)利要求5的DNA分子,其中該植物是鼠耳芥。
7.權(quán)利要求1的DNA分子,其中該蛋白質(zhì)具有選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性。
8.氨基酸序列,其含有與選自SEQ ID NO1、SEQ ID NO3、SEQ IDNO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的核苷酸序列所編碼的氨基酸序列。
9.權(quán)利要求8的氨基酸序列,其含有由選自SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列編碼的氨基酸序列。
10.氨基酸序列,其含有與選自SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列基本相似的氨基酸序列。
11.權(quán)利要求10的氨基酸序列,其中該序列是選自SEQ ID NO2、SEQID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的任意一個(gè)序列。
12.權(quán)利要求8的氨基酸序列,其中該蛋白質(zhì)具有選自245、5283、2490、3963和4036活性的任意一種活性。
13.氨基酸序列,其含有由選自SEQ ID NO1、SEQ ID NO3、SEQ IDNO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列所編碼的氨基酸序列的至少20個(gè)連續(xù)氨基酸殘基。
14.氨基酸序列,其含有選自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10的氨基酸序列的至少20個(gè)連續(xù)氨基酸殘基。
15.含有可操作地與根據(jù)權(quán)利要求1的DNA分子連接的啟動(dòng)子的表達(dá)盒。
16.含有根據(jù)權(quán)利要求15的表達(dá)盒的重組載體,其中所述載體能夠被穩(wěn)定地轉(zhuǎn)化至宿主細(xì)胞中。
17.含有根據(jù)權(quán)利要求15的表達(dá)盒的宿主細(xì)胞,其中所述核苷酸序列能夠在所述細(xì)胞中表達(dá)。
18.根據(jù)權(quán)利要求17的宿主細(xì)胞,其中所述宿主細(xì)胞是真核細(xì)胞。
19.根據(jù)權(quán)利要求17的宿主細(xì)胞,其中所述宿主細(xì)胞選自昆蟲(chóng)細(xì)胞、酵母細(xì)胞和植物細(xì)胞。
20.根據(jù)權(quán)利要求17的宿主細(xì)胞,其中所述宿主細(xì)胞是原核細(xì)胞。
21.根據(jù)權(quán)利要求17的宿主細(xì)胞,其中所述宿主細(xì)胞是細(xì)菌細(xì)胞。
22.含有權(quán)利要求19的植物細(xì)胞的植物或種子。
23.權(quán)利要求22的植物,其中所述植物對(duì)選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑具有耐受性。
24.制備編碼具有改變活性的基因產(chǎn)物的核苷酸序列的方法,所述活性選自245活性、5283活性、2490活性、3963活性和4036活性,該方法包括a)改組權(quán)利要求1的核苷酸序列,b)表達(dá)獲得的改組核苷酸序列,和c)與選自所述未修飾核苷酸序列基因產(chǎn)物的245活性、5283活性、2490活性、3963活性和4036活性的活性比較,選擇改變的選自245活性、5283活性、2490活性、3963活性和4036活性的活性。
25.權(quán)利要求24的方法,其中該核苷酸序列是選自SEQ ID NO1、SEQID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列。
26.通過(guò)權(quán)利要求24的方法可以獲得的改組DNA分子。
27.通過(guò)權(quán)利要求24的方法制備的改組DNA分子。
28.通過(guò)權(quán)利要求24的方法獲得的改組DNA分子,其中所述改組DNA分子編碼對(duì)選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑具有增強(qiáng)耐受性的基因產(chǎn)物。
29.表達(dá)盒,其含有可操作地與根據(jù)權(quán)利要求26的核苷酸序列連接的啟動(dòng)子。
30.含有根據(jù)權(quán)利要求29的表達(dá)盒的重組載體,其中所述載體能夠被穩(wěn)定地轉(zhuǎn)化至宿主細(xì)胞中。
31.含有根據(jù)權(quán)利要求29的表達(dá)盒的宿主細(xì)胞,其中所述核苷酸序列能夠在所述細(xì)胞中表達(dá)。
32.根據(jù)權(quán)利要求31的宿主細(xì)胞,其中所述宿主細(xì)胞是真核細(xì)胞。
33.根據(jù)權(quán)利要求31的宿主細(xì)胞,其中所述宿主細(xì)胞選自昆蟲(chóng)細(xì)胞、酵母細(xì)胞和植物細(xì)胞。
34.根據(jù)權(quán)利要求31的宿主細(xì)胞,其中所述宿主細(xì)胞是原核細(xì)胞。
35.根據(jù)權(quán)利要求31的宿主細(xì)胞,其中所述宿主細(xì)胞是細(xì)菌細(xì)胞。
36.含有權(quán)利要求33的植物細(xì)胞的植物或種子。
37.權(quán)利要求36的植物,其中所述植物對(duì)選自抑制245、5283、2490、3963和4036活性的抑制劑具有耐受性。
38.篩選與選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7和SEQ ID NO9的任意一個(gè)序列所編碼的蛋白質(zhì)相互作用的化合物的方法,包括a)表達(dá)含有選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7和SEQ ID NO9的任意一個(gè)序列,或與選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的任意一個(gè)序列基本相似的序列的DNA分子,以產(chǎn)生相應(yīng)的蛋白質(zhì),b)測(cè)試懷疑能夠與步驟(a)中表達(dá)的蛋白質(zhì)相互作用的化合物,和c)選擇在步驟(b)中與所述蛋白質(zhì)相互作用的化合物。
39.鑒定選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制劑的方法,包括a)將含有選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7和SEQ ID NO9的任意一個(gè)序列的核苷酸序列并具有選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的DNA分子,或與之基本相似的核苷酸序列,或它們的同系物,導(dǎo)入植物細(xì)胞,以致所述序列能夠以高于野生型表達(dá)水平的水平進(jìn)行功能性表達(dá),b)在有利于抑制發(fā)生的條件下將所述植物細(xì)胞與待測(cè)試的化合物合并,以檢測(cè)該化合物對(duì)選自245活性、5283活性、2490活性、3963活性和4036活性的任意一種活性的抑制能力,c)在步驟b)的條件下測(cè)量植物細(xì)胞的生長(zhǎng),和d)在相同條件下,比較所述植物細(xì)胞的生長(zhǎng)和具有選自245活性、5283活性、2490活性、3963活性和4036活性的未改變活性的植物細(xì)胞的生長(zhǎng),和e)選擇在步驟d)中抑制植物細(xì)胞生長(zhǎng)的所述化合物。
40.根據(jù)權(quán)利要求39的方法可鑒定的具有除草劑活性的化合物。
41.鑒定具有除草劑活性的化合物的方法,包括a)在有利于相互作用的條件下,使權(quán)利要求8的蛋白質(zhì)與待測(cè)化合物混合,以測(cè)試該化合物與所述蛋白質(zhì)相互作用的能力,b)選擇在步驟(a)中鑒定的能夠與所述蛋白質(zhì)相互作用的化合物。c)給植物施用步驟(b)中鑒定的化合物,以測(cè)試其除草劑活性,和d)選擇具有除草劑活性的化合物。
42.根據(jù)權(quán)利要求41的方法可鑒定的具有除草劑活性的化合物。
43.抑制植物生長(zhǎng)的方法,包括以足以抑制所述植物生長(zhǎng)的量給所述植物施用抑制權(quán)利要求8的氨基酸序列的活性的化合物。
44.權(quán)利要求41的方法,其中該化合物是根據(jù)權(quán)利要求39的方法可鑒定的具有除草劑活性的化合物。
45.改良農(nóng)作物的方法,包括給選自權(quán)利要求23的植物或種子和權(quán)利要求37的植物或種子的除草劑耐受性植物或種子,施用根據(jù)選自權(quán)利要求38的方法、權(quán)利要求39的方法和權(quán)利要求41的方法的方法可鑒定的具有除草劑活性的化合物,施用量為抑制不需要的植物的生長(zhǎng)但不顯著抑制該除草劑耐受性植物或種子的生長(zhǎng)的量。
46.DNA分子,其含有與選自SEQ ID NO11、SEQ ID NO12、SEQ IDNO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29的任意一個(gè)序列基本相似的核苷酸序列。
全文摘要
本發(fā)明涉及分離自鼠耳芥屬的編碼幼苗生長(zhǎng)必需蛋白質(zhì)的基因?;谶@些基因?qū)τ谡IL(zhǎng)和發(fā)育的重要性,本發(fā)明還包括應(yīng)用這些蛋白質(zhì)開(kāi)發(fā)新的除草劑的方法。本發(fā)明還可以用于鑒別是潛在除草劑的抑制劑的篩選分析方法中。還可以應(yīng)用本發(fā)明開(kāi)發(fā)除草劑耐受性植物、植物組織、植物種子和植物細(xì)胞。
文檔編號(hào)C12N1/19GK1341151SQ00803955
公開(kāi)日2002年3月20日 申請(qǐng)日期2000年1月13日 優(yōu)先權(quán)日1999年1月15日
發(fā)明者J·Z·萊文, G·J·巴德茲澤維斯克, S·L·波特勒維斯, L·維格里啻格勞弗 申請(qǐng)人:辛根塔參與股份公司