一種水稻雌雄育性相關(guān)的蛋白、其編碼基因及其應用
【技術(shù)領域】
[0001] 本發(fā)明屬于植物基因工程技術(shù)領域,特別是涉及一種水稻雌雄育性相關(guān)的蛋白、 其編碼基因及其應用。
【背景技術(shù)】
[0002] 雄性不育在植物界中很普遍,據(jù)大量文獻檢索,已經(jīng)在43科,162屬,320個種和 297個種間雜種中發(fā)現(xiàn)了雄性不育現(xiàn)象,并且這個數(shù)目還在不斷增加。由于雄性不育是雜 種優(yōu)勢利用的基礎,幾十年來對雄性不育機理的探索一直是一個非?;钴S的研究領域,特 別是近年來對雄性不育的分子生物學研究更是成果豐碩,不斷有關(guān)于雄性不育分子機制的 文章總結(jié)這方面的研究成果并提出了若干相應理論和假設,豐富了雜種優(yōu)勢利用的理論基 礎,提高了人們對雄性不育機理的認識。近年來應用現(xiàn)代細胞生物學技術(shù)對多種雄性不育 農(nóng)作物的花藥敗育過程做了研究,取得了一些新的結(jié)果。
[0003] 相比雄性不育,植物雌性不育的研究起步較晚,認識程度也較淺。該類現(xiàn)象的相關(guān) 報道始于上個世紀50年代。目前,人們已在水稻、玉米、小麥、蘭花、百合、甘藍型油菜等十 幾種植物中發(fā)現(xiàn)了雌性不育現(xiàn)象。正常植物雌性器官發(fā)育主要指子房的發(fā)育(包括胚珠發(fā) 育和胚囊形成),如果雌性器官胚珠或卵細胞發(fā)育受阻或直至敗育,就表現(xiàn)出植物雌性不育 現(xiàn)象。大部分研究工作還停留在形態(tài)解剖學和細胞遺傳學水平,近年來比較多的開展了酶 水平及膜水平調(diào)控機制的研究,也有部分工作結(jié)合雄性不育機制的研究對雌性不育進行了 探討,但大多數(shù)采用被子植物為研究材料。到目前為止,對配子體發(fā)生的研究還處于描述和 細胞學、胚胎學水平上,對控制它們的發(fā)生、發(fā)育的分子基礎了解還很少。
[0004] 目前已報道了一些水稻雄性不育基因和少量雌性不育基因的染色體定位,其中少 數(shù)基因已經(jīng)被分離克隆。但是在水稻種同時控制水稻雌性和雄性不育的基因尚未有被分離 克隆的報道,水稻雌雄育性協(xié)同控制的分子基礎還不清楚。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種水稻雌雄育性相關(guān)的蛋白、其編碼基因、含有該編碼基 因的載體和細胞及其應用。
[0006] 為達到上述目的,本發(fā)明的技術(shù)方案為:
[0007] 應用圖位克隆技術(shù)從水稻材料XF2中一個不育突變體中獲得一種雌雄育性相關(guān) 的基因,該基因的缺失導致水稻雄性雌性器官的發(fā)育障礙,命名為雌雄不育基因(XF2)。
[0008] 在此基礎上,本發(fā)明提供一種水稻雌雄育性相關(guān)基因,所述基因具有SEQ ID NO. 1 所示的核苷酸序列。
[0009] 同時,本發(fā)明提供一種水稻雌雄育性相關(guān)蛋白,其一級結(jié)構(gòu)為如SEQ ID NO. 2所示 的氨基酸序列;或為如SEQ ID NO. 2所示的氨基酸序列經(jīng)過一個或多個氨基酸殘基的取代、 缺失或添加而形成的具有與其功能相同的衍生的蛋白;或為與SEQ ID NO. 2所示的氨基酸 序列至少有70%的同源性并具有與其功能相同的衍生的蛋白。
[0010] 本文中,所述的"不育"的植物是指一種植物,其在適當?shù)纳L條件下生長至一定 的階段(如成熟階段)時,比在相同條件下生長的同類植物的結(jié)實率顯著降低(如降低 40% ;較佳地降低60% ;更佳地降低80% ;最佳地降低95 %或更多)。
[0011] 本發(fā)明還包括多肽,可以是重組多肽、天然多肽、合成多肽,優(yōu)選的是重組多肽。本 發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學合成的產(chǎn)物,或是使用重組技術(shù)從原核或真 核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所 用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或 不包括起始的甲硫氨酸殘基。
[0012] 本發(fā)明還包括XF2蛋白的片段、衍生物和類似物。本文中,術(shù)語"片段"、"衍生物" 和"類似物"是指基本上保持本發(fā)明的XF2蛋白相同的生物學功能或活性的多肽。本發(fā)明 的多肽片段、衍生物或類似物可以是(1)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選 保守型氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳 密碼編碼的,或(2)在一個或多個氨基酸殘基中具有取代基團的多肽,或(3)成熟多肽與另 一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(4)附 加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此 多肽的序列或蛋白序列,或融合蛋白)。根據(jù)本文的定義,這些片段、衍生物和類似物屬于本 領域技術(shù)人員公知的范圍。
[0013] 在本發(fā)明中,XF2蛋白指具有SEQ ID NO. 2序列的多肽。還包括與SEQ ID NO. 2序 列的蛋白相同功能的、SEQ ID NO. 2序列的變異形式。這些變異形式包括(但并不限于): 若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個或更少1-8個或 1-5個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數(shù)個(通 常為20個以內(nèi),較佳地為10個以內(nèi),更佳地為5個以內(nèi))氨基酸。例如,在本領域內(nèi),用性 能相似的氨基酸進行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末端和/或N末端 添加一個或數(shù)個統(tǒng)稱也不會改變蛋白質(zhì)的功能。還包括XF2蛋白的活性片段和活性衍生 物。
[0014] 多肽的變異形式包括:同源序列、保守性變異體、等位變異體、天然突變體、誘導突 變體、在高或低的嚴謹度條件下能與XF2蛋白編碼DNA雜交的DNA所編碼的蛋白、以及利用 XF2蛋白的抗血清獲得的多肽或蛋白。所述的同源序列是指具有與SEQ ID NO. 2序列有至 少50 %,較佳地至少60 %,70 %,80 %,更佳地至少85 %,90 %,95 %相同性的多肽。本發(fā)明 還提供了其他的多肽,如包含XF2蛋白或其片段的融合蛋白。除了幾乎全長的多肽外,本發(fā) 明還包括了 XF2蛋白的可溶性片段。通常,該片段具有XF2蛋白的至少約20個連續(xù)的氨基 酸,通常至少約30個連續(xù)氨基酸,較佳地至少約50個連續(xù)氨基酸,更佳地至少約100個連 續(xù)的氨基酸,最佳地至少約150個連續(xù)氨基酸。
[0015] 本發(fā)明還提供XF2蛋白或多肽的類似物。這些類似物與天然的XF2蛋白的差異可 以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這 些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術(shù)得到,如通過輻射或 暴露于誘變劑而產(chǎn)生的隨機誘變,還可以通過定點誘變法或其他的已知的分子生物學的技 術(shù)。類似物還包括具有不同于天然L-氨基酸殘基(如D-氨基酸)的類似物,以及具有非 天然存在的或合成的氨基酸(如β-氨基酸)的類似物。應理解,本發(fā)明的多肽并不限于 上述例舉的代表性多肽。
[0016] 修飾(通常不改變一級結(jié)構(gòu))形式包括:體內(nèi)或體外的多肽的化學衍生形式如乙 ?;螋然?。修飾還包括糖基化。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨 酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化 了溶解性能的多肽。
[0017] 在本發(fā)明中還包括XF2蛋白保守性變異蛋白(多肽),與SEQ ID NO. 2的氨基酸序 列相比,有至多20個,較佳地至多10個,更佳地至多5個,最佳地至多3個氨基酸被性質(zhì)相 似或相近的氨基酸所替代而形成的多肽,且保留與SEQ ID NO. 2序列的蛋白相同的功能。
[0018] 本發(fā)明還提供了編碼本發(fā)明XF2蛋白或其保守性變異多肽的多核苷酸序列。
[0019] 本發(fā)明的多聚核苷酸(基因)可以是DNA形式或RNA形式。DNA形式包括cDNA、 基因組DNA或人工合成的DNA。DNA可以是單鏈或是雙鏈的。DNA可以是編碼鏈或非編碼 鏈。編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO. 3所示的編碼區(qū)序列相同或者是簡并的 變異體。如本文所用,"簡并的變異體"在本發(fā)明中是指編碼具有SEQ ID NO. 2的蛋白質(zhì),但 與SEQ ID NO. 3所示的編碼區(qū)序列有差別的核苷酸序列。
[0020] 編碼SEQ ID NO. 2的成熟多肽的多核苷酸包括:只編碼成熟多肽的編碼序列;成 熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列) 以及非編碼序列。
[0021] 本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多 肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或 非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本 領域所知的,等位變異體是一個多核苷酸的替換形式,他可能是一個或多個核苷酸的取代、 缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
[0022] 本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少 70%,進一步較佳地至少80%,更佳地至少90%相同性的多核苷酸。本發(fā)明特別涉及在嚴 格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,"嚴格條件"是指:(1)在 較低的離子強度和較高溫度下的雜交和洗脫,如〇. 2XSSC,0. 1% SDS,60°C ;或(2)雜交時 加有變性劑,如50% (V/V)甲酰胺,0. 1%小牛血清/0. lFicoll,42°C等;或(3)僅在兩條序 列之間的相同性至少在70%以上,較佳地至少80%以上,更佳地90%以上,更好是95%以 上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ ID N0:2所示的成熟多肽有 相同的生物學功能和活性。
[0023] 本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,"核酸片段"的長度至 少含有15個核苷酸,較好是至少30個核苷酸,更好地是至少50個核苷酸,最好是至少100 個核苷酸以上。