專利名稱:改善植物的多核苷酸和方法
技術領域:
本發(fā)明涉及產生具有升高的種子產量的植物的組合物和方法。
背景技術:
隨著世界人口的增長,農業(yè)研究的一個主要目標是提高作物植物物種的谷粒產量。直到最近這樣的提高是基于按照想要的特性進行植物的選擇性育種。 但是對于很多植物來說,子代中產生的異源遺傳贈送不引起與其親代中一樣的所需特性,因此限制了選擇性育種方法的有效性。如今分子生物學的進展使得可以對植物和動物的種質進行遺傳操作。植物的遺傳工程包括分離并操作遺傳材料以及后續(xù)的將該材料導入植物。這個技術已經引起能夠表達藥物和其它化學物的植物的開發(fā)、具有增強的害蟲抗性、增強的壓力耐受的植物的開發(fā)和表達其它有益特性的植物的開發(fā)??梢酝ㄟ^開發(fā)比同等的野生型植物產生更多的種子或谷粒的植物而達到植物作物植物的谷粒產量的改善。因此,業(yè)界需要相對于正常培育的對應物來說具有增加的種子產量的植物。本發(fā)明的一個目標是提供開發(fā)具有改善的種子或谷粒種子產量的植物品種的改善的組合物和/或方法,或至少為公眾提供有用的選擇。
發(fā)明內容
在第一個方面,本發(fā)明提供了產生具有改變的種子產量的植物的方法,該方法包括使用下列多核苷酸轉化植物a)編碼具有SEQ ID NO=I的氨基酸序列的多肽或多肽變體的多核苷酸,其中變體能夠調節(jié)植物中的種子產量;b)包含a)中的多核苷酸的長度為至少15個核苷酸的片段的多核苷酸,或c)包含a)中的多核苷酸的長度為至少15個核苷酸的互補物的多核苷酸。在一個具體實施方式
中,變體與具有SEQ ID NO 1的氨基酸序列的多肽具有至少 70%的序列同一性。優(yōu)選地變體源自植物物種并且包含SEQ ID NO 32的序列。在一個具體實施方式
中,變體源自單子葉植物物種并且包含SEQ ID N0:33的序列。在優(yōu)選的具體實施方式
中,變體包含選自SEQ ID NO :2_31任一項的氨基酸序列。在優(yōu)選的具體實施方式
中,多肽或變體是谷氨酸鹽脫羧酶。在優(yōu)選的具體實施方式
中,a)中的多核苷酸編碼具有SEQ ID NO=I的氨基酸序列的多肽。在優(yōu)選的具體實施方式
中,以含有多核苷酸的遺傳構建體轉化植物。
在另一個具體實施方式
中,本發(fā)明提供了產生具有改變的種子產量的植物的方法,該方法包括使用下列多核苷酸轉化植物細胞或植物a)包含SEQ ID NO :34的核苷酸序列的多核苷酸或其變體,其中變體編碼能夠調節(jié)植物中的種子產量的多肽;b)包含a)中的多核苷酸的長度為至少15個核苷酸的片段的多核苷酸,或c)包含a)中的多核苷酸的長度為至少15個核苷酸的互補物的多核苷酸。在一個具體實施方式
中,變體包含SEQ ID NO :35_65任一項的序列。在一個優(yōu)選的具體實施方式
中,a)中的多核苷酸或變體編碼一個多肽,該多肽為谷氨酸鹽脫羧酶。在另一個具體實施方式
中,a)中的多核苷酸包含SEQ ID NO 34的序列。在另一個具體實施方式
中,a)中的多核苷酸包含SEQ ID NO 34的編碼序列。在優(yōu)選的具體實施方式
中,以含有多核苷酸的遺傳構建體轉化植物。優(yōu)選地,通過本發(fā)明的方法產生的植物相對于合適的對照植物具有升高的種子產量。在另一個具體實施方式
中,產生具有改變的種子產量的植物的方法包括使用遺傳構建體轉化植物細胞或植物,所述遺傳構建體能夠改變調節(jié)種子產量的多肽的表達。在一個具體實施方式
中,由于使用遺傳構建體(其能夠下調正向調節(jié)種子產量的多肽的表達)轉化植物細胞或植物,所以該方法產生相對于合適的對照具有降低的種子產量的植物。在優(yōu)選的具體實施方式
中,由于使用遺傳構建體(其能夠上調正向調節(jié)種子產量的多肽的表達)轉化植物細胞或植物,所以該方法產生相對于合適的對照具有升高的種子產量的植物。在另一個方面,本發(fā)明提供了根據本發(fā)明的方法產生的植物細胞或植物。優(yōu)選地,根據本發(fā)明的方法產生的植物相對于合適的對照植物具有升高的種子產量。在另一個方面,本發(fā)明提供了分離的多核苷酸,其與編碼包含SEQ ID NO :1的氨基酸序列的多肽的核苷酸序列具有至少75%的序列同一性,其中多核苷酸編碼能夠調節(jié)植物中種子產量的多肽。在一個具體實施方式
中,所述核苷酸序列包含SEQ ID NO 34的序列。在另一個具體實施方式
中,所述核苷酸序列包含SEQ ID NO 34的全長編碼序列。在另一個方面,本發(fā)明提供了編碼與SEQ ID NO 1的氨基酸序列具有至少70%同一性的多肽的多核苷酸。優(yōu)選地,多肽能夠調節(jié)植物中的種子產量。優(yōu)選地,多肽是谷氨酸鹽脫羧酶。在另一個方面,本發(fā)明提供了編碼包含SEQ ID NO 1的氨基酸序列的多肽的分離的多核苷酸。在另一個具體實施方式
中,多核苷酸包含SEQ ID NO 34的序列。在另一個具體實施方式
中,多核苷酸包含SEQ ID NO 34的全長編碼序列。在另一個方面,本發(fā)明提供了包含SEQ ID NO :34的序列的分離的多核苷酸或其變
5體,其中該變體來自黑麥草或羊茅并且編碼能夠調節(jié)植物中種子產量的多肽。 在一個具體實施方式
中,多肽是谷氨酸鹽脫羧酶。在一個具體實施方式
中,分離的多核苷酸包含SEQ ID NO 34的序列。在另一個方面,本發(fā)明提供了與SEQ ID NO 1的氨基酸序列具有至少83%序列同一性的分離的多肽,其中多肽能夠調節(jié)植物中的種子產量。在一個具體實施方式
中,分離的多肽包含SEQ ID NO=I的氨基酸序列。在另一個方面,本發(fā)明提供了編碼本發(fā)明的多肽的分離的多核苷酸。在另一個方面,本發(fā)明提供了分離的多核苷酸,其包含a)包含長度為至少15個核苷酸的本發(fā)明的多核苷酸的片段的多核苷酸;b)包含長度為至少15個核苷酸的本發(fā)明的多核苷酸的互補物的多核苷酸;或c)包含長度為至少15個核苷酸的能夠與本發(fā)明的多核苷酸雜交的序列的多核苷酸。在另一個方面,本發(fā)明提供了包含本發(fā)明的多核苷酸的遺傳構建體。在一個具體實施方式
中,遺傳構建體是表達構建體。在一個具體實施方式
中,構建體包含與多核苷酸可操作連接的啟動子。在另一個具體實施方式
中,構建體包含與多核苷酸可操作連接的終止子。優(yōu)選地,啟動子、終止子或二者來自與多核苷酸不同的來源。在一個具體實施方式
中,不同的來源是不同的物種。在另一個方面,本發(fā)明提供了包含本發(fā)明的遺傳構建體或表達構建體的載體。在另一個方面,本發(fā)明提供了經遺傳修飾以表達本發(fā)明的多核苷酸或本發(fā)明的多肽的宿主細胞。在另一個方面,本發(fā)明提供了包含本發(fā)明的遺傳構建體或表達構建體的宿主細胞。在另一個方面,本發(fā)明提供了經遺傳修飾以表達本發(fā)明的多核苷酸或本發(fā)明的多肽的植物細胞。在另一個方面,本發(fā)明提供了包含本發(fā)明的遺傳構建體或表達構建體的植物細胞。在另一個方面,本發(fā)明提供了包含本發(fā)明的植物細胞的植物。在另一個方面,本發(fā)明提供了選擇相對于合適的對比物具有改變的種子產量的植物的方法,該方法包括測試植物的本發(fā)明的多核苷酸表達的改變。在另一個方面,本發(fā)明提供了選擇相對于合適的對照具有改變的種子產量的植物的方法,該方法包括測試植物的本發(fā)明的多肽表達的改變。在另一個方面,本發(fā)明提供了根據本發(fā)明的方法產生的植物細胞或植物。在另一個方面,本發(fā)明提供了根據本發(fā)明的方法選擇的植物。在另一個方面,本發(fā)明提供了一群或一組根據本發(fā)明的方法選擇的植物。另一個方面,本發(fā)明提供了針對本發(fā)明的多肽產生的抗體。本發(fā)明的多核苷酸和多核苷酸變體可以來自于任何物種和/或可以通過合成或重組產生。在一個具體實施方式
中,多核苷酸或變體來自于植物物種。
在另一個具體實施方式
中,多核苷酸或變體來自于裸子植物物種。在另一個具體實施方式
中,多核苷酸或變體來自于被子植物物種。在另一個具體實施方式
中,多核苷酸或變體來自于雙子葉植物物種。在另一個具體實施方式
中,多核苷酸或變體來自于單子葉植物物種。本發(fā)明的多肽和多肽變體可以來自于任何物種和/或可以通過合成或重組產生。在一個具體實施方式
中,多肽或變體來自于植物物種。在另一個具體實施方式
中,多肽或變體來自于裸子植物物種。在另一個具體實施方式
中,多肽或變體來自于被子植物物種。在另一個具體實施方式
中,多肽或變體來自于雙子葉植物物種。在另一個具體實施方式
中,多肽或變體來自于單子葉植物物種。本發(fā)明的植物細胞和植物可以來自于任何物種。在一個具體實施方式
中,植物細胞或植物來自于裸子植物物種。在另一個具體實施方式
中,植物細胞或植物來自于被子植物物種。在另一個具體實施方式
中,植物細胞或植物來自于雙子葉植物物種。在另一個具體實施方式
中,植物細胞或植物來自于單子葉植物物種。優(yōu)選的雙子葉植物的屬包括桃屬(Amygdalus)、腰果屬(Anacardium)、落花生屬(Arachis)、蕓苔屬(Brassica)、木豆屬(Cajanus)、大麻屬(Cannabis)、紅花屬 (Carthamus)、山核桃屬(Carya)、木棉屬(Ceiba)、鷹咀豆屬(Cicer)、椰子屬(Cocos)、芫荽屬(Coriandrum)、小冠花屬(Coronilla)、棉屬(Cossypium)、野百合屬(Crotalaria)、 扁豆屬(Dolichos)、油棕屬(Elaeis)、大豆屬(Glycine)、棉屬(Gossypium)、向日葵屬(Helianthus)、山黧豆屬(Lathyrus)、兵豆屬(Lens)、胡枝子屬(Lespedeza)、亞麻屬(Linum)、百脈根屬(Lotus)、羽扇豆屬(Lupinus)、澳洲堅果屬(Macadamia)、苜蓿屬(Medicago)、草木犀屬(Melilotus)、黎豆屬(Mucuna)、木犀欖屬(Olea)、紅豆草屬 (Onobrychis)、烏足豆屬(Ornithopus)、罌粟屬(Papaver)、菜豆屬(Phaseolus)、刺葵屬 (Phoenix)、黃連木屬(Pistacia)、豌豆屬(Pisum)、櫻桃屬(I^unus)、葛屬(Pueraria)、 茶薦子屬(Ribes)、蓖麻屬(Ricinus)、胡麻屬(Sesamum)、可可屬(Theobroma)、車軸草屬 (Trifolium)、胡蘆巴屬(Trigonella)、蠶豆屬(Vicia)和豇豆屬(Vigna)。優(yōu)選的雙子葉植物的種包括扁1 (Amygdalus communis),腰果 (Anacardiumoccidentale)、花生(Arachis hypogaea)、花生(Arachis hypogea)、 甘藍型油菜(Brassica napus Rape)、黑芥(Brassica nigra)、白菜(Brassica campestris)、 (Cajanus cajan)、£口貞 7^(Cajanus indicus) > ) (Cannabis sativa)、紅花(Carthamus tinctorius)、美國山核桃(Carya illinoinensis)、爪唾 7^ 豐帛(Ceibapentandra)> 0 ^ S (Cicer arietinum)、!〒(Cocos nucifera)> ^ ^ (Coriandrumsativum)、繡 求(Coronilla varia) > ^ (Cossypium hirsutum)
) (Crotalariajuncea) > Ji(Dolichos lablab)、油胃(Elaeis guineensis) > M yjfl (Gossypiumarboreum)、中國棉(Gossypium nanking)、海島棉(Gossypium barbadense)、 草棉(Gossypium herbaceum)、陸地棉(Gossypium hirsutum)、大豆(Glycine max)、 野大豆(Glycine ussuriensis)、寬葉蔓豆(Glycine gracilis)、向曰葵(Helianthus annus)、I夾卩十山 H 豆(Lathyrus angustifolius)、!t # 山 H 豆(Lathyrus luteus)、Lathyrusmutabi 1 isΛ Lathyrus sericea、Lathyrus striata、Lathyrus uliginosus、 ill 黧豆(Lathyrussativus)、兵豆(Lens culinaris)、雞目艮草(Lespedeza stipulacea)、 亞麻(Linumusitatissimum)、百脈根(Lotus corniculatus)、白習習扇豆(Lupinus albus)、褐斑苜猜(Medicago arabica)、木本苜猜(Medicago arborea)、黃花苜猜 (Medicago falcate)、南苜猜(Medicago hispida)、Medicago officinalis、紫花苜蓿(Medicago sativa)、蒺藜狀苜蓿(Medicago tribuloides)、澳洲堅果(Macadamia integrifolia) Λ(Melilotus albus) Λ ^IJ^iSls. (Mucuna pruriens) Λ ift^tjl
(Olea europaea)、紅豆草(Onobrychis viciifolia)、鋸齒 草(Ornithopus sativus)、綠 S. (Phaseolusaureus) Λ Phaseolus aureus cerasifera、Phaseolus aureus cerasus、 Phaseolus aureuscoccineus、 Phaseolus aureus domestica、 Phaseolus aureus lunatus、Phaseolus aureusmaheleb、Phaseolus aureus mungo、Phaseolus aureus persica、Phaseolus aureuspseudocerasus、Phaseolus aureus vulgaris、(Papaver somniferum)、寬葉菜豆(Phaseolus acutifolius)、海φ (Phoenix dactylifera)、阿月渾子(Pistacia vera)、豌豆(Pisum sativum)、扁桃(Prunus amygdalus)、杏(Prunus armeniaca)、里予葛(Pueraria thunbergiana)、漂穗醋栗(Ribes nigrum)、紅醋栗(Ribes rubrum)、歐洲醋栗(Ribes grossularia)、篦麻(Ricinus communis)、芝麻(Sesamum indicum)、(Trifolium augustifolium)、(Trifolium diffusum)、雜三葉草(Trifolium hybridum)、絳三葉(Trifolium incarnatum)、球三葉草(Trifolium ingrescens)、 紅三葉(Trifoliumpratense)、白三葉(Trifolium repens)、波斯三葉草(Trifolium resupinatum)、地三葉草(Trifolium subterraneum)、可可樹(Theobroma cacao)、亞歷山大三葉草(Trifolium alexandrinum)、香豆子(Trigonella foenumgraecum)、Vigna angustifolia、Vigna atropurpurea、Vigna calcarata、Vigna dasycarpa、Vigna ervilia、 Vigna oxycoccos、Vigna pannonica、長虹顯(Vigna sesquipedalis)、虹顯(Vigna sinensis)、(Vignavillosa)、香豆(Vicia faba)、大巢菜(Vicia sative)禾口小豆(Vigna angularis)0優(yōu)選的單子葉植物的屬包括冰草屬(Agropyron)、蔥屬(Al 1 ium)、看麥娘屬(Alopecurus)、須芒草屬(Andropogon)、燕麥草屬(Arrhenatherum)、天門冬屬 (Asparagus)、燕麥屬(Avena)、簕竹屬(Bambusa)、孔穎草屬(Bothrichloa)、格蘭馬草屬(Bouteloua)、雀麥屬(Bromus)、蒺藜草屬(Cenchrus)、虎尾草屬(Chloris)、香茅屬 (Cymbopogon)、狗牙根屬(Cynodon)、鴨茅屬(Dactylis)、雙花草屬(Dichanthium)、馬唐屬(Digitaria)、摻屬(Eleusine)、披鹼草屬(Elymus)、畫眉草屬(Eragrostis)、蕎麥屬 (Fagopyrum)、羊茅屬(Festuca)、大麥屬(Hordeum)、毒麥屬(Lolium)、禾酉屬(Oryza)、黍屬(Panicum)、雀稗屬(Paspalum)、狼尾草屬(Pennisetum)、薦草屬(Phalaris)、梯牧草屬 (Phleum)、早熟禾屬(Poa)、甘蔗屬(Saccharum)、黑麥屬(Secale)、狗尾草屬(Setaria)JP 第安草屬(Sorghastrum)、高粱屬(Sorghum)、小麥屬(Triticum)、香果蘭屬(Vanilla)、小黑麥屬(X Triticosecale)和玉蜀黍屬(Zea)。優(yōu)選的單子葉植物的種包括冰草(Agropyron desertorum)、長穗偃麥草(Agropyron elongatum)、叢生小麥草(Agropyron spicatum)、細蓮冰草 (Agropyrontrachycaulum)> 毛冰 草(Agropyron trichophorum)、大蔥(Alliumfistulosum)、大蒜(Allium, sativum)、草原看麥娘(Alopecurus pratensis)、須芒草(Andropogongerardi)、燕麥草(Arrhenatherum elatius)、石習桕(Asparagus officinalis)、燕麥(Avena sativa)、佛肚竹(Bambusa vulgaris)、Bothrichloa barbinodis、白羊草(Bothrichloa ischaemum)、垂 H 草(Bouteloua curipendula) Λ 格蘭馬草(Boutelouagracilis)、直立雀麥(Bromus erectus)、纖毛漠藜草(Cenchrus ciliaris)、# #、|、丨 ^ ^ ^ (Chloris gayana) λ M # ^ (Cymbopogon nardus)、^] f t艮 (Cynodon dactylon)、甲鳥茅(Dactylis glomerata)、雙花草(Dichanthium annulatum)、 俯仰馬唐(Digitariadecumbens)、禾參子(Eleusine coracan)、窄穎賴草(Elymus angustus)、彎葉_眉草(Eragrostis curvula)、苔鼓(Eragrostis tef)、養(yǎng)麥(Fagopyrum esculentum)、軸革旦養(yǎng)麥(Fagopyrum tataricum)、高羊茅(Festuca arundinacea)、二棱大麥(Hordeumdistichum)、大麥(Hordeum vulgare)、漂麥草(Lolium perenne)、多花漂麥草(Loliummultiflorum)、水禾§ (Oryza sativa)、禾術米(Panicum italicium)、大黍 (Panicummaximum)、黍(Panicum miliaceum)、毛花雀禾卑(Paspalum dilatatum)、狼尾草 (Pennisetum clandestinum)、iiH (Pennisetum glaucum)、!H (Phalarisarundinacea)、 梯牧草(Phleum bertolinii)、羊肉草(Poa fendleriana)、林地早熟禾(Poa nemoralis)、 力^里予 (Saccharum robustum)、tt胃(Saccharum sinense) λ ^ (Secale cereale) Λ 非洲狗尾草(Setaria sphacelata)、擬高梁(Sorghastrumnutans)、甜高粱(So rghum dochna)、假高梁(Sorghum halepense)、高梁(Sorghumbicolor)、小麥(Triticum aestivum)、二粒小麥(Triticum dicoccum)、小漂麥(XTriticosecale)、玉米(Zea mays)、 冰草(Agropyron cristatum)、中間偃麥草(Agropyronintermedium)、藍蓮冰草(Agropyron smithii)、火蔥(Allium ascalonicum)、洋蔥(Alliumcepa)、萬頭(Allium chinense)、 韭蔥(Allium porrum)、北蔥(Allium schoenoprasum)、莜麥(Avena nuda)、佛肚竹 (Bambusa vulgaris) Λ Bothrichloa saccharoides、馬胃(Bouteloua eriopoda) Λ 芒雀麥(Bromus inermis) Λ 草地雀麥(Bromusriparius) Λ Dactylis aristatum、 Dactylis sericeum、南非馬唐(Digitaria smutsii)、俄羅斯野麥(Εlymus junceus)、羊茅(Festuca ovina)、草甸羊茅(Festuca pratensis)、紫羊茅(Festuca rubra)、紫黍草 (Panicum purpurascens)、柳枝稷(Panicumvirgatum)、百喜草(Paspalum notatum)、象草(Pennisetum purpureum)、稚[I谷(Pennisetum spicatum)、貓尾草(Phleum pratense) Λ 草地早熟禾(Poa pratensis)、甘蔴(Saccharum officinarum)、云南害!]手密(Saccharum spontaneum)、蘇丹草(Sorghum sudanense)、硬粒小麥(Triticum durum)、一粒小麥 (Triticummonococcum)、香莢蘭(Vanilla fragrans)禾口玉米(Zea mays)。優(yōu)選的植物來自毒麥屬和車軸草屬。特別優(yōu)選的種是黑麥草和白三葉。特別優(yōu)選的單子葉植物的種是黑麥草和水稻。術語“植物”包括完整植物、植物的任何部分、繁殖體和植物的子代。術語“繁殖體”意思是可用于再生或繁殖(無論有性的還是無性的)的任何植物部分,包括種子和插條(cutting)。詳細描述一般性定義本說明書中所用的術語“包含(comprising)”意思是“至少部分由……組成”。當解讀本說明書中每個包括術語“包含”的陳述時,還可以存在除了跟在該術語之后的那個或那些特征之外的特征。相關的術語例如“包含(comprise)”和“包含(comprises) ”應以相同的方式解讀。在本說明書中,當提及專利說明書、其它外部文獻或其它信息來源時,這一般是為了提供上下文以討論本發(fā)明特征的目的。除非另有特別指明,否則提及這樣的外部文獻不應被解釋為承認這樣的文獻或這樣的信息來源在任何管轄內是現(xiàn)有技術或構成本領域公知常識的部分。多核苷酸和片段本文所用的術語“多核苷酸”意思是單鏈或雙鏈的任何長度的脫氧核糖核苷酸或核糖核苷酸的聚合物,但優(yōu)選為至少15個核苷酸,并且包括(作為非限制性例子)基因的編碼和非編碼序列、正義和反義序列互補物、外顯子、內含子、基因組DNA、cDNA、pre-mRNA、 mRNA、rRNA、siRNA、miRNA, tRNA、核糖酶、重組多肽、分離的和純化的天然產生的DNA或RNA 序列、合成的RNA和DNA序列、核酸探針、引物和片段。本文提供的多核苷酸序列的“片段”是能夠與目標靶特異性雜交的連續(xù)核苷酸的亞序列,例如,長度為至少15個核苷酸的序列。本發(fā)明的片段包含本發(fā)明的多核苷酸的連續(xù)核苷酸的15個核苷酸,優(yōu)選至少20個核苷酸,更優(yōu)選至少30個核苷酸,更優(yōu)選至少50 個核苷酸,更優(yōu)選至少50個核苷酸,最優(yōu)選至少60個核苷酸。多核苷酸序列的片段可用于反義、基因沉默、三螺旋或核糖酶技術,或作為引物、探針被包括在微陣列內,或用于本發(fā)明的基于多核苷酸的選擇方法。術語“引物”是指短的多核苷酸,通常具有自由的3’ OH基團,其與模板雜交并用于啟動與靶標互補的多核苷酸的聚合。術語“探針”是指用于在基于雜交的檢驗中檢測與探針互補的多核苷酸序列的短的多核苷酸。探針可以由本文定義的多核苷酸的“片段”組成。多肽和片段本文所用的術語“多肽”包括任意長度的氨基酸鏈,但是優(yōu)選為至少5個氨基酸, 包括全長的蛋白,其中氨基酸殘基通過共價肽鍵連接。本發(fā)明的多肽可以是純化的天然產物,或者可以部分或全部使用重組或合成技術產生。該術語可以指多肽、多肽的聚集體例如二體或其它多聚體、融合多肽、多肽片段、多肽變體或其衍生物。多肽的“片段”是多肽的亞序列,其實現(xiàn)生物活性所需要的功能和/或提供多肽的三維結構。該術語可以指能夠實現(xiàn)上述酶學活性的多肽、多肽的聚集體例如二體或其它多聚體、融合多肽、多肽片段、多肽變體或其衍生物。對于本文公開的多核苷酸或多肽的序列所用的術語“分離的”是指脫離其天然細胞環(huán)境的序列。分離的分子可以通過任何方法或方法的組合獲得,包括生物化學、重組和合成技術。術語“重組體”是指脫離其天然環(huán)境中環(huán)繞它的序列的多核苷酸序列,和/或與那些不存在于其天然環(huán)境中的序列進行重組的多核苷酸序列?!爸亟M的”多肽序列通過翻譯“重組的”多核苷酸序列而產生。關于本發(fā)明的多核苷酸或多肽的術語“源自”(源自特定的屬或種)意思是該多核苷酸或多肽與那些在該屬或種中天然發(fā)現(xiàn)的多核苷酸或多肽具有相同的序列。因此可通過合成或重組產生源自特定的屬或種的多核苷酸或多肽。變體本文所用的術語“變體”是指與具體指明的序列不同的多核苷酸或多肽的序列,其中刪除、替換或添加了一個或多個核苷酸或氨基酸殘基。變體可以是天然產生的等位基因變體,或非天然產生的變體。變體可以來自相同的物種或其它物種,可以包括同源物、旁系同源物和直系同源物。在一些具體實施方式
中,本發(fā)明的多肽和多肽的變體與本發(fā)明的多肽或多肽變體具有相同或相似的生物學活性。提及多肽和多肽時的術語“變體”包括本文定義的所有形式的多肽和多肽。多核苷酸變體變體多核苷酸序列相對于指明的多核苷酸序列優(yōu)選顯示出至少50%,更優(yōu)選至少 51%,更優(yōu)選至少52%,更優(yōu)選至少53%,更優(yōu)選至少M%,更優(yōu)選至少55%,更優(yōu)選至少 56 %,更優(yōu)選至少57 %,更優(yōu)選至少58 %,更優(yōu)選至少59 %,更優(yōu)選至少60 %,更優(yōu)選至少 61%,更優(yōu)選至少62%,更優(yōu)選至少63%,更優(yōu)選至少64%,更優(yōu)選至少65%,更優(yōu)選至少 66 %,更優(yōu)選至少67 %,更優(yōu)選至少68 %,更優(yōu)選至少69 %,更優(yōu)選至少70 %,更優(yōu)選至少 71%,更優(yōu)選至少72%,更優(yōu)選至少73%,更優(yōu)選至少74%,更優(yōu)選至少75%,更優(yōu)選至少 76 %,更優(yōu)選至少77 %,更優(yōu)選至少78 %,更優(yōu)選至少79 %,更優(yōu)選至少80 %,更優(yōu)選至少 81%,更優(yōu)選至少82%,更優(yōu)選至少83%,更優(yōu)選至少84%,更優(yōu)選至少85%,更優(yōu)選至少 86 %,更優(yōu)選至少87 %,更優(yōu)選至少88 %,更優(yōu)選至少89 %,更優(yōu)選至少90 %,更優(yōu)選至少 91%,更優(yōu)選至少92%,更優(yōu)選至少93%,更優(yōu)選至少94%,更優(yōu)選至少95%,更優(yōu)選至少 96 %,更優(yōu)選至少97 %,更優(yōu)選至少98 %,最優(yōu)選至少99 %的同一性。在指明的多核苷酸序列的至少20個核苷酸位置,優(yōu)選至少50個核苷酸位置,更優(yōu)選至少100個核苷酸位置,最優(yōu)選其全長的比較窗口中找到同一性??梢愿鶕韵路绞酱_定多核苷酸的序列同一性。使用bl2seq(Tatiana A. Tatusova, Thomas L. Madden (1999), " Blast 2 sequences-a new tool for comparingprotein and nucleotide sequences" , FEMS Microbiol Lett. 174 :247-250) 中的BLASTN (來自程序的BLAST套裝軟件(the BLAST suite of programs),版本 2. 2.5[2002 年 11 月])(其可以公開地從 NCBI (ftp://ftp, ncbi. nih. Rov/blast/)獲得) 將主題多核苷酸序列與候選多核苷酸序列進行比較。使用blkeq的缺省參數,只是需要關閉低復雜性部分的濾除??梢允褂靡韵碌膇mix命令行參數測定多核苷酸序列的同一性bl2seq-i nucleotideseql-j nucleotideseq2_F F -ρ blastn參數-F F關閉低復雜性部分的濾除。參數-P為序列對選擇合適的算法。blkeq 程序在行“同一性=”中以相同核苷酸的數字和百分率報告序列同一性。也可以使用全域序列比對程序(例如Needleman,S. B.和Wunsch,C. D. (1970) J. Mol. Biol. 48,443-453)在候選和主題多核苷酸序列之間的重疊的全長上計算多核苷酸的序列同一'性??梢栽?EMBOSS 程序包(Rice,P. Longden, I.和 Bleasby,A. EMBOSS The European Molecular Biology Open Software Suite,Trends in GeneticsJune 2000,vol 16,No 6. pp. 276-277 其可以從http://www. hRmp. mrc. ac. uk/Software/EMBOSS/獲得)的 needle程序中找到Needleman-Wunsch全域比對算法的完全應用。歐洲生物信息學研究所服務器也提供工具而在http:/WWW. ebi. ac. uk/emboss/align/上在線進行兩個序列之間的EMBOSS-needle全域比對?;蛘呖梢允褂肎AP程序,其計算兩個序列的最佳全域比對而無處罰末端空隙。 在以下文章中描述了 GAP :Huang,X. (1994)0n Global Sequence Alignm ent. Computer Applications in the Biosciences 10,227-235。本發(fā)明的多核苷酸變體還包括那些與一個或多個具體指明的序列顯示相似性的序列,其可能保留那些序列的功能等同性,并且不能合理地被預計通過隨機的機會產生。這樣的關于多肽的序列相似性可以使用從NCBI (ftp //ftp, ncbi. nih. Rov/blast/)來自程序的BLAST套裝軟件(版本2. 2. 5[2002年11月])公開獲得的bl2seq程序來確定。可以使用以下的imix命令行參數測定多核苷酸序列的相似性bl2seq-i nucleotideseq l_j nucleotideseq2_F F -ρ tblastx參數-F F關閉低復雜性部分的濾除。參數-P為序列對選擇合適的算法。該程序在序列間找到相似性區(qū),對于每個這樣的區(qū)域報告一個“E值”,E值是在含有隨機序列的固定參考大小的數據庫中可以預期隨機見到這樣的匹配的預期次數。該數據庫的大小在 bl2seq程序中設定為缺省值。對于小的E值(遠小于1),E值大約是這樣的隨機匹配發(fā)生的概率。當與任何一個具體指明的序列相比時,變體多核苷酸序列優(yōu)選顯示出1X10,以下,更優(yōu)選1X 10_2°以下,更優(yōu)選1 X 10_3°以下,更優(yōu)選1 X 10_4°以下,更優(yōu)選1 X 10_5°以下, 更優(yōu)選1 X10,以下,更優(yōu)選1 X 10_7°以下,更優(yōu)選1 X 10_8°以下,更優(yōu)選1 X 10,以下,更優(yōu)選1 X 10,°以下,更優(yōu)選1 X 以下,最優(yōu)選1 X 10_12°以下的E值?;蛘?,本發(fā)明的變體多核苷酸在嚴謹條件下與指明的多核苷酸序列或其互補物雜 、-父。術語“在嚴謹條件下雜交”及其語法等同物是指在確定的溫度和鹽濃度的條件下,多核苷酸分子與靶多核苷酸分子(例如固定于DNA或RNA印跡例如Southern印跡或 Northern印跡上的靶多核苷酸分子)雜交的能力??梢酝ㄟ^最初在低嚴謹條件下雜交然后將嚴謹度增加至需要的嚴謹度來確定在嚴謹雜交條件下的雜交能力。對于長度為大約100個堿基以上的多核苷酸分子,通常的嚴謹雜交條件為不低于原態(tài)雙鏈的熔解溫度(Tm)的25至30°C (例如,10°C )以下(一般性參見,Sambrook等人 Eds,1987,Molecular Cloning,A Laboratory Manual,2nd Ed. ColdSpring Harbor Press ; Ausubel 等人,1987, Current Protocols in Molecular Biology, Greene Publishing)。 對于大約100個堿基以上的多核苷酸分子,其Tm值可以根據公式Tm = 81.5+0.41% (G+C-log(Na+). (Sambrook 等人,Eds, 1987,MolecularCloning,A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press ;Bolton andMcCarthy, 1962, PNAS 84 :1390)計算。對于長度為100個堿基以上的多核苷酸,通常的嚴謹條件為下列的雜交條件例如在6X SSC, 0.2% SDS的溶液中預先洗滌;在65°C,6X SSC, 0.2% SDS中雜交過夜;然后在65°C,IX SSC,0. 1% SDS中洗滌兩次,每次30分鐘,然后在65°C,0. 2X SSC, 0. 1% SDS中洗滌兩次, 每次30分鐘。對于長度為100個堿基以下的多核苷酸分子,示例性的嚴謹雜交條件為Tm以下5 至10°C。平均來講,長度為IOObp以下的多核苷酸分子的Tm大約下降(500/寡核苷酸長度)°C。對于被稱作肽核酸(PNA)的DNA類似物(Nielsen等人,Science. 1991 Dec6 ; 254 (5037) 1497-500),其iTm值比DNA-DNA或DNA-RNA雜交體的要高,可以使用根據Giesen 等人,Nucleic Acids Res. 1998 Nov 1 ;26 (21) :5004-6 描述的公式計算。具有 100 個堿基以下長度的DNA-PNA雜交體的示例性的嚴謹雜交條件為Tm以下5至10°C。本發(fā)明的變體多核苷酸還包括這樣的多核苷酸其與本發(fā)明的序列不同,但是由于遺傳密碼的簡并性的結果,其編碼與本發(fā)明的多核苷酸編碼的多肽具有相似活性的多肽。不改變多肽的氨基酸序列的序列改變是“沉默變異”。除了 ATG(蛋氨酸)和TGG(色氨酸)之外,可以通過本領域承認的技術改變同一個氨基酸的其它密碼子,例如為了在特定宿主生物中使密碼子的表達最優(yōu)化。本發(fā)明還包括在編碼的多肽序列中引起一個或幾個氨基酸的保守性替換而不顯著改變其生物學活性的多核苷酸序列的改變。本領域技術人員將知道進行表型沉默氨基酸替換的方法(參見,例如Bowie等人,1990,Science 247,1306)。可以使用從NCBI (ftp //ftp, ncbi. nih. Rov/blast/)公開獲得的來自程序的 BLAST套裝軟件(版本2. 2. 5 [2002年11月])的blkeq程序通過如上所述的tblastx算法來確定由于編碼的多肽序列中的沉默變異和保守性替換而產生的變體多核苷酸。多肽變體提及多肽時的術語“變體”包括天然產生的、重組的和合成產生的多肽。變體多肽序列相對于本發(fā)明的序列優(yōu)選顯示出至少50%,更優(yōu)選至少51%,更優(yōu)選至少52%,更優(yōu)選至少53 %,更優(yōu)選至少M %,更優(yōu)選至少55 %,更優(yōu)選至少56 %,更優(yōu)選至少57 %,更優(yōu)選至少58 %,更優(yōu)選至少59 %,更優(yōu)選至少60 %,更優(yōu)選至少61 %,更優(yōu)選至少62 %,更優(yōu)選至少63 %,更優(yōu)選至少64 %,更優(yōu)選至少65 %,更優(yōu)選至少66 %,更優(yōu)選至少67 %,更優(yōu)選至少68 %,更優(yōu)選至少69 %,更優(yōu)選至少70 %,更優(yōu)選至少71 %,更優(yōu)選至少72 %,更優(yōu)選至少73 %,更優(yōu)選至少74 %,更優(yōu)選至少75 %,更優(yōu)選至少76 %,更優(yōu)選至少77 %,更優(yōu)選至少78 %,更優(yōu)選至少79 %,更優(yōu)選至少80 %,更優(yōu)選至少81 %,更優(yōu)選至少82 %,更優(yōu)選至少83 %,更優(yōu)選至少84 %,更優(yōu)選至少85 %,更優(yōu)選至少86 %,更優(yōu)選至少87 %,更優(yōu)選至少88 %,更優(yōu)選至少89 %,更優(yōu)選至少90 %,更優(yōu)選至少91 %,更優(yōu)選至少92 %,更優(yōu)選至少93 %,更優(yōu)選至少94 %,更優(yōu)選至少95 %,更優(yōu)選至少96 %,更優(yōu)選至少97 %,更優(yōu)選至少98 %,最優(yōu)選至少99 %的同一性。在本發(fā)明的多肽的至少20個氨基酸位置,優(yōu)選至少50個氨基酸位置,更優(yōu)選至少100個氨基酸位置,最優(yōu)選其全長的比較窗口中找到同一性??梢愿鶕韵路绞酱_定多肽的序列同一性。使用blkeq中的BLASTP(來自程序的BLAST套裝軟件,版本2. 2. 5 [2002年11月])(其可以公開地從NCBI (ftp://ftp.ncbi. nih. Rov/blast/)獲得)將主題多肽序列與候選多肽序列進行比較。使用blkeq的缺省參數,只是需要關閉低復雜性區(qū)的濾除。也可以使用全域序列比對程序在候選和主題多核苷酸序列之間的重疊的全長上計算多肽的序列同一性。如上文討論的EMB0SS_needle(可以從http:/www. ebi. ac. uk/ emboss/align/獲得)禾口 GAP(Huang,X. (1994)On GlobalSequence Alignment. Computer Applications in the Biosciences 10,227-235)也是合適的用于計算多肽的序列同一性的全域序列比對程序。上面描述的BLASTP用途優(yōu)選用于確定根據本發(fā)明的多肽變體。本發(fā)明的多肽變體還包括那些與一個或多個具體指明的序列顯示相似性的序列, 其可能保留那些序列的功能等同性,并且不能合理地被預計通過隨機的機會產生。這樣的關于多肽的序列相似性可以使用從NCBI (ftp //ftp, ncbi. nih. Rov/blast/)公開獲得的來自程序的BLAST套裝軟件(版本2. 2. 5[2002年11月])的blkeq程序來確定??梢允褂靡韵碌膇mix命令行參數測定多肽序列的相似性bl2seq-i peptideseql-j peptideseq2_F F -ρ blastp當與任何一個具體指明的序列相比時,變體多肽序列優(yōu)選顯示出1X10,以下,更優(yōu)選1 X 10_2°以下,更優(yōu)選1 X 10_3°以下,更優(yōu)選1 X 10_4°以下,更優(yōu)選1 X 10_5°以下,更優(yōu)選1 X 10_6°以下,更優(yōu)選1 X 10_7°以下,更優(yōu)選1 X 10_8°以下,更優(yōu)選1 X 10_9°以下,更優(yōu)選 1 X10-1°°以下,更優(yōu)選1 X 10_110以下,更優(yōu)選1 X 10_120以下,更優(yōu)選1 X 10_130以下,更優(yōu)選 1 X 10_140以下,更優(yōu)選1 X 10_150以下,更優(yōu)選1 X 10_16°以下,更優(yōu)選1 X 10_170以下,更優(yōu)選 1 X10-·以下,更優(yōu)選1 X 10_190以下,更優(yōu)選1 X 10_200以下,更優(yōu)選1 X 10_210以下,更優(yōu)選 IXlO-220以下,最優(yōu)選1 X 10—222以下的E值。參數-F F關閉低復雜性部分的濾除。參數-P為序列對選擇合適的算法。該程序在序列間找到相似性區(qū),對于每個這樣的區(qū)域報告一個“E值”,E值是在含有隨機序列的固定參考大小的數據庫中可以預期隨機見到這樣的匹配的預期次數。對于小的E值(遠小于 1),E值大約是這樣的隨機匹配發(fā)生的概率。本發(fā)明還包括所描述的多肽序列的一個或幾個氨基酸的保守性替換(而不顯著改變其生物學活性)。本領域技術人員將知道進行表型沉默氨基酸替換的方法(參見,例如 Bowie 等人,1990,Science 247,1306)。構建體、載體及其成分術語“遺傳構建體”是指這樣的多核苷酸分子,其通常為雙鏈DNA,其中可以插入另一個多核苷酸分子(插入的多核苷酸分子)例如但不限于,cDNA分子。遺傳構建體可以含有允許插入的多核苷酸分子轉錄的,以及可選的將轉錄本翻譯成多肽的必需元件。插入的多核苷酸分子可以源自宿主細胞,或者可以源自不同的細胞或生物和/或可以是重組的多核苷酸。一旦進入宿主細胞,遺傳構建體可以整合進入宿主的染色體DNA。遺傳構建體可以與載體相連。術語“載體”是指這樣的多核苷酸分子,其通常為雙鏈DNA,用于將遺傳構建體運送至宿主細胞。載體能夠在至少一個另外的宿主系統(tǒng)例如大腸桿菌(E.coli)中復制。術語“表達構建體”是指包括允許插入的多核苷酸分子轉錄的,以及可選的將轉錄本翻譯成多肽的必需元件的遺傳構建體。表達構建體通常以5’至3’方向包含a)在構建體轉化進入的宿主細胞中有功能的啟動子;b)要表達的多核苷酸;和c)在構建體轉化進入的宿主細胞中有功能的終止子。術語“編碼區(qū)域”或“開放讀碼框”(ORF)是指基因組DNA序列或cDNA序列的正義鏈,其能夠在合適的調控序列的控制下產生轉錄產物和/或多肽。編碼序列由5’翻譯起始密碼子和3’翻譯終止密碼子的存在而鑒別。當插入遺傳構建體中時,當“編碼序列”與啟動子和終止子序列可操作地連接時,“編碼序列”能夠表達。 “可操作地連接”意思是要表達的序列置于調控元件(包括啟動子、組織特異性調控元件、時間調控元件、增強子、抑制子和終止子)的控制之下。術語“非編碼區(qū)域”是指在翻譯起始位點上游和翻譯終止位點下游的非翻譯序列。 這些序列也被分別稱為5’UTR和3’UTR。這些區(qū)域包括轉錄起始和終止以及調節(jié)翻譯效率所需的元件。終止子是終止轉錄的序列,存在于基因的3’非翻譯末端,被翻譯的序列的下游。終止子是mRNA穩(wěn)定性的重要決定者,在一些情況下,發(fā)現(xiàn)終止子具有空間調控功能。術語“啟動子”是指調節(jié)基因轉錄的位于編碼區(qū)域上游的非轉錄順式調控元件。啟動子包含順式起始元件(其指明轉錄的起始位點)和保守性的盒例如TATA盒,以及被轉錄因子結合的基序。“轉基因”是從一個生物中取出并通過轉化被導入一個不同生物的多核苷酸。轉基因可以源自相同的物種或來自與轉基因所導入的生物的物種不同的物種?!胺聪蛑貜汀笔侵貜托蛄?,其中重復的后一半在互補鏈中,例如(5,) GATCTA.......TAGATC (3,)(3,) CTAGAT.......ATCTAG (5,)通讀轉錄將產生這樣的轉錄本,其進行互補性堿基配對以形成發(fā)夾結構,只要在重復區(qū)域之間有3-5pb的間隔子?!稗D基因植物”是指由于遺傳操作或轉化的結果而含有新的遺傳材料的植物。新的遺傳材料可以源自于得到的轉基因植物相同的物種或來自不同物種。術語“改變本發(fā)明的多核苷酸或多肽的表達”和“本發(fā)明的多核苷酸或多肽的改變的表達”包括這樣的情況對應于本發(fā)明的多核苷酸的基因組DNA被修飾,因而引起本發(fā)明的多核苷酸或多肽的改變的表達??梢酝ㄟ^遺傳轉化或本領域已知的用于誘導突變的其它方法進行基因組DNA的修飾?!案淖兊谋磉_”可以與信使RNA和/或產生的多肽的量的增加或減少相關,也可以由于產生的多核苷酸和多肽的序列改變而引起多肽的活性改變。術語“種子產量”是指植物產生的種子或谷粒的大小和/或質量和/或數目。因此,相對于相同年齡或等同發(fā)育階段的合適的對照植物來說,具有增加的種子產量的植物具有增加的大小和/或質量和/或數目的種子或谷粒。相反,相對于相同年齡或等同發(fā)育階段的合適的對照植物來說,具有減少的種子產量的植物具有增加的大小和/或質量和/ 或數目的種子或谷粒。合適的對照植物可以包括相同物種和品種的非轉化植物,或以對照構建體轉化的相同的物種和品種的植物。提及種子產量時的術語“改變的”包括種子產量的減少或增加。提及種子產量時的術語“調節(jié)”包括減少或增加種子的產量。本發(fā)明提供了產生和/或選擇相對于合適的對照植物來說具有改變的種子產量的植物的方法,包括具有增加的和減少的種子產量的植物以及通過這樣的方法產生的植物。本發(fā)明提供了編碼調節(jié)植物中種子產量的多肽(SEQ ID N0:1)的多核苷酸(SEQ ID N0:34)。本發(fā)明提供了編碼SEQ ID NO 1的多肽的變體(SEQ ID NO 2-31)的SEQ IDNO 34的多核苷酸的變體(SEQ ID NO :35-65)。本申請人還鑒定了存在于SEQ ID NO :1_31 中的共有多肽序列(SEQ ID NO :32)和存在于選自SEQ ID NO :1_31的單子葉植物的序列中的第二個共有多肽序列(SEQ ID N0:33)。分離或產生多核苷酸的方法可以使用本領域技術人員已知的各種技術分離本發(fā)明的多核苷酸分子。舉例來說,可以通過使用 Mullis 等人,Eds. 1994 The Polymerase Chain Reaction, Biridiauser (通過引用并入本文)中描述的聚合酶鏈式反應(PCR)分離這樣的多核苷酸。 可以使用本文定義的源自本發(fā)明的多核苷酸序列的引物擴增本發(fā)明的多肽。分離本發(fā)明的多核苷酸或可用于本發(fā)明的方法的多核苷酸的其它方法包括使用全部或部分的本文列出的作為雜交探針的多核苷酸。將標記的多核苷酸探針與固定于固體支持物(例如硝酸纖維素膜或尼龍膜)上的多核苷酸雜交的技術可用于篩選基因組或 cDNA庫。示例性的雜交和洗滌條件為于65°C在5. OX SS°C,0. 5 %十二烷基硫酸鈉,IX Denhardt' s溶液中雜交20小時;在1. OX SSC, 1% (w/v)十二烷基硫酸鈉中洗滌(三次, 每次在55°C洗滌20分鐘),可選地在60°C,0. 5X SSC, 1 % (w/v)十二烷基硫酸鈉中洗滌1 次(20分鐘)??蛇x地,可以在60°C,0. IX SSC, 1% (w/v)十二烷基硫酸鈉的條件下再洗滌一次(20分鐘)??梢酝ㄟ^本領域熟知的技術產生本發(fā)明的多核苷酸片段,例如限制性內切酶消化和寡核苷酸合成。多核苷酸序列的一部分可用于本領域熟知的方法以鑒定相應的全長多核苷酸序列。這樣的方法包括基于 PCR 的方法,5,RACE (Frohman ΜΑ, 1993,MethodsEnzymol. 218 340-56)和基于雜交的方法,基于計算機/數據庫的方法。另外,舉例來說,反向PCR允許獲得從基于已知區(qū)域的引物開始,本文公開的多核苷酸序列側翼的未知序列(Triglia等人, 1998,Nucleic Acids Res 16,8186,通過引用并入本文)。該方法使用幾個限制性酶以在基因的已知區(qū)域產生合適的片段。然后該片段通過分子內的連接而環(huán)化并用作PCR的模板。 從已知的區(qū)域設計分散引物(divergent primer)。為了物理組合全長克隆,可以使用標準分子生物學方法(Sambrook等人,Molecular Cloning :A Laboratory Manual,2nd Ed. Cold SpringHarbor Press,1987)。當從特定物種產生轉基因植物時,以序列或源自該物種的序列轉化這樣的植物可能是有益的。該益處可以緩解公眾對于跨物種轉化而產生轉基因生物的擔心。另外,當某基因的下調是想要的結果時,可能需要使用與植物(希望其中的表達降低)中的序列相同 (或至少高度相似)的序列。由于這些原因(除了其它的之外),所以需要能夠鑒定并分離幾個不同植物物種中特定基因的直系同源物。可以通過所描述的方法鑒定變體(包括直系同源物)。鑒定變體的方法物理方法可以使用基于PCR的方法鑒定變體多核苷酸(Mullis等人,Eds. 1994 ThePolymerase Chain Reaction, Birkhauser)。通常,用于通過PCR擴增變體多核苷酸分子的引物的多核苷酸序列可以基于編碼相應氨基酸序列的保守性區(qū)域的序列。或者,可以使用本領域技術人員熟知的庫篩選方法(Sambrook等人,
16MolecularCloning :A Laboratory Manual,2nd Ed. Cold Spring Harbor Press,1987)。當鑒定探針序列的變體時,雜交和/或洗滌的嚴謹度通常比尋找完整序列匹配時要低。還可以通過物理方法鑒定多肽變體,例如通過使用針對本發(fā)明多肽產生的抗體來蹄選表達庫(Sambrook 等人,Molecular Cloning :A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press, 1987)或通過這樣的抗體的幫助從天然來源鑒定多肽。基于計算機的方法還可以使用公共的結構域序列比對算法和序列相似性搜索工具(以搜索序列數據庫)(公共的結構域數據庫包括Genbank,EMBL, Swiss-Prot, PIR和其它)通過本領域技術人員熟知的基于計算機的方法鑒定多核苷酸和多肽的變體。參見例如Nucleic Acids Res. 29 =I-IOand 11_16,2001,例如在線來源。相似性搜索檢索并比對靶序列以與待分析的序列(即待查詢序列)進行比較。序列對比算法使用得分陣距以分配給每個比對一個總體分值。用于在序列數據庫中鑒定變體的示例性的程序家族為程序的BLAST套裝軟件(版本 2. 2. 5[2002 年 11 月])包括 BLASTN,BLASTP, BLASTX, tBLASTN 禾口 tBLASTX,可以從(ftp//ftp, ncbi. nih. gov/blast/)或從 National Center for BiotechnologyInformation(NCBI), National Library of Medicine,Building 38A,Room 8N805,Bethesda,MD 20894 USA公開地獲得。NCBI服務器還提供使用程序篩選一些可公開獲得的序列數據庫的工具。BLASTN比較待查詢核苷酸序列和數據庫核苷酸序列。BLASTP 比較待查詢氨基酸序列和數據庫蛋白序列。BLASTX比較以所有讀碼框翻譯的待查詢核苷酸序列和數據庫蛋白序列。tBLASTN比較待查詢蛋白序列和以所有讀碼框動態(tài)翻譯的數據庫核苷酸序列。tBLASTX比較待查詢核苷酸序列的六框翻譯和數據庫核苷酸序列的六框翻譯。可以以缺省參數使用BLAST程序或者按照需要改變參數以改善篩選。BLAST家族算法(包括BLASTN,BLASTP和BLASTX)的使用在Altschul等人的論文 Nucleic Acids Res. 25 :3389_3402,1997 中有描述。BLASTN, BLASTP, BLASTX, tBLASTN, tBLASTX或相似算法產生的待查詢序列對于一個或多個數據庫序列的“命中”比對并鑒定序列的相似部分。命中按照相似度的順序和序列重疊的長度而排列。對數據庫序列的命中一般代表只有待查詢序列的序列長度的一部分
上重疊。BLASTN, BLASTP, BLASTX, tBLASTN 和 tBLASTX 算法還產生比對的“預計”值。預計值(E)表示當搜索含有隨機連續(xù)序列的相同大小的數據庫時能夠“預計”隨機見到的命中的數目。預計值用作顯著性臨界值以確定對數據庫的命中是否表示真實的相似性。例如, 分配給多核苷酸命中的E值為0. 1被解讀為意思是在所篩選的數據庫大小的數據庫中,可以在具有相似得分的序列比對的部分上能夠簡單地通過隨機預計見到0. 1個匹配。對于在比對和匹配部分上具有0. 01或更低的E值的序列,使用BLASTN,BLASTP, BLASTX, tBLASTN 或tBLASTX算法在該數據庫中隨機發(fā)現(xiàn)匹配的概率是或更低??梢允褂肈bCLUSTAL (Thompson J. D.,Plewnial F.,Thierry J. -C.禾Π Poch 0. (2000)Rapid and reliable global multiple alignments of protein sequences detected bydatabase searches. Nucleic Acid Research, Vol. 28, No 15 :2919_2926, http://www. ebi. ac. uk/cgi-bin/dbclustal/submit)或 CLUSTALff (Thompson,J. D. , Higgins, D. G.和 Gibson, Τ. J. (1994)CLUSTALff improving the sensitivity ofprogressive multiple sequence alignment through sequence weighting, positions—specific gap penalties and weight matrix choice. Nucleic Acids Research, 22 :4673-4680, http://www-iRbmc. u~strasbR. fr/BioInfo/Clustalff/Top. html)或 T-COFFEE(Cedric Notredame, Desmond G. Higgins, Jaap Heringa, T-Coffee A novelmethod for fast and accurate multiple sequence alignment, J. Mol. Biol. (2000)302 :205-217))或 PILEUP (其使用累進的成對比對)(Feng 和 Doolittle,1987, J. Mol. Evo 1. 25,351)進行一組相關序列的多重序列比對。可以獲得模式識別軟件應用以尋找基序或標志序列。例如,MEME(MultipleEm for Motif Elicitation)在一組序列中尋找基序和標志序列,MAST (Mot if Alignment and Search Tool)使用這些基序在待查詢序列中鑒定相似或相同的基序。MAST的結果作為一系列的具有合適的統(tǒng)計學數據的比對和所發(fā)現(xiàn)的基序的可視概況而提供。MEME和MAST由 University of California, San Diego 開發(fā)。PR0SITE (Bairoch 禾口 Bucher,1994,Nucleic Acids Res. 22,3583 ;Hofmann 等人, 1999,Nucleic Acids Res. 27,215)是鑒定從基因組或cDNA序列翻譯而來的未鑒定的蛋白的功能的方法。PR0SITE數據庫(www, expasy. org/prosite)含有生物學顯著模式和概述, 其被設計為可以使用合適的計算機工具將新的序列分配給已知的蛋白家族或確定在序列中存在何種已知的結構域(Falquet 等人,2002,Nucleic Acids Res. 30,235) Prosearch 是一種可以按照給定序列模式或標志搜索SWISS-PR0T和EMBL數據庫的工具。分離多肽的方法可以使用本領域熟知的肽合成方法(例如使用固相技術(例如Mewart等人, 1969,in Solid-Phase Peptide Synthesis, WH Freeman Co, San Francisco California) 直接合成肽或自動化合成(例如使用Applied Biosystems 431A肽合成儀(Foster City, California)))來制備本發(fā)明的多肽,包括變體多肽。也可以在這樣的合成中產生突變形式的多肽。還可以使用本領域已知的各種技術(例如Deutscher,1990,Ed, Methods inEnzymology,Vol. 182,Guide to Protein Purification)從天然來源純化本發(fā)明的多月太和變體多肽?;蛘呖梢栽诤线m的宿主細胞中重組表達本發(fā)明的多肽和變體多肽并按照以下討論從細胞中分離本發(fā)明的多肽和變體多肽。產生構建體和載體的方法本發(fā)明的遺傳構建體包含一個或多個本發(fā)明的多核苷酸序列和/或編碼本發(fā)明的多肽的多核苷酸,可用于轉化例如細菌、真菌、昆蟲、哺乳動物或植物生物。本發(fā)明的遺傳構建體包括本文定義的表達構建體。用于產生和使用遺傳構建體和載體的方法是本領域熟知的,在Sambrook等人, Molecular Cloning :A Laboratory Manual,2nd Ed. Cold Spring Harbor Press,1987 ; Ausubel 等人,Current Protocols in Molecular Biology, Greene Publishing, 1987)中
有一般性描述。產生包含構建體和載體的宿主細胞的方法
技術領域:
本發(fā)明提供了包含本發(fā)明的遺傳構建體或載體的宿主細胞。宿主細胞可以源自例如細菌、真菌、昆蟲、哺乳動物或植物生物。包含本發(fā)明的遺傳構建體(例如表達構建體)的宿主細胞可用于本領域熟知的方法(例如 Sambrook 等人,Molecular Cloning :A Laboratory Manual, 2nd Ed. ColdSpring Harbor Press, 1987 ;Ausubel 等人,Current Protocols in Molecular Biology, Greene Publishing, 1987)以重組產生本發(fā)明的多肽。這樣的方法可以包括在合適的培養(yǎng)基中在適合于或有益于表達本發(fā)明多肽的條件下培養(yǎng)宿主細胞。然后可以通過本領域熟知的方法(例如 Deutscher,Ed,1990,Methods in Enzymology, Vol 182,Guide to Protein Purification)將所表達的重組多肽(其可選地可以被分泌到培養(yǎng)物中)從培養(yǎng)基、宿主細胞或培養(yǎng)基中分離出來。本發(fā)明的宿主細胞還可用于生產由所表達的本發(fā)明多肽產生的酶產物的方法。這樣的方法可以包括可選地當存在用于所表達的本發(fā)明多肽的另外的酶底物時,在適合表達本發(fā)明的重組多肽的培養(yǎng)基中培養(yǎng)本發(fā)明的宿主細胞。然后可以通過各種本領域標準方法將產生的酶產物從宿主細胞或培養(yǎng)基中分離出來。產生包含構建體和載體的植物細胞和植物的方法本發(fā)明還提供了包含本發(fā)明的遺傳構建體的植物細胞和為了改變本發(fā)明的多核苷酸或多肽的表達而修飾的植物細胞。包含這樣的細胞的植物也構成本發(fā)明的一個方面??梢酝ㄟ^本發(fā)明的方法產生具有改變的種子產量的植物。這樣的方法可以包括以構建體(其被設計為改變能夠調節(jié)這樣的植物細胞和植物中種子產量的多核苷酸或多肽的表達)轉化植物細胞和植物。這樣的方法還包括以構建體(其被設計為改變能夠調節(jié)這樣的植物細胞和植物中種子產量的一個或多個多核苷酸或多肽的表達)的組合轉化植物細胞和植物。在 Draper 等人,1988, Plant Genetic Transformation and Gene Expression. ALaboratory Manual. Blackwell Sci.Pub. Oxford, p. 365 ;Potrykus 和 Spangenburg, 1995, Gene Transfer to Plants. Springer-Verlag, Berlin.;和 Gelvin 等人,1993, PlantMolecular Biol. Manual. Kluwer Acad. Pub. Dordrecht 中描述了以多核苷酸轉化植物細胞、植物及其部分的方法。在Galun和Breiman,1997,Transgenic Plants. ImperialCollege Press,London中提供了關于轉基因植物(包括轉化技術)的綜述。遺傳操作植物的方法一些遺傳操作植物的策略是可以獲得的(例如Birch,1997,Ann Rev Plant PhysPlant Mol Biol,48,297)。例如,策略可被設計為在正常表達多核苷酸/多肽的植物細胞、器官和/或特定發(fā)育階段中增加多核苷酸/多肽的表達,或者在不正常表達多核苷酸 /多肽的細胞、組織、器官和/或特定發(fā)育階段中異位表達多核苷酸/多肽。所表達的多核苷酸/多肽可以源自待轉化的植物物種或者可以源自不同的植物物種。可以將轉化策略設計為在正常表達多核苷酸/多肽的植物細胞、組織、器官或特定發(fā)育階段中減少多核苷酸/多肽的表達。這樣的策略被稱為基因沉默策略。轉基因植物中用于基因表達的遺傳構建體通常包括用于驅動一個或多個克隆的多核苷酸表達的啟動子、終止子和檢測在轉化植物中存在遺傳構建體的選擇性標記序列。適合用于本發(fā)明的構建體中的啟動子在單子葉植物或雙子葉植物的細胞、組織或器官中是功能性的,包括細胞、組織和器官特異性的啟動子,細胞周期特異性啟動子,時間啟動子,可誘導啟動子,在多數植物組織中有活性的組成性啟動子和重組啟動子。啟動子的選擇將取決于所需要的克隆的多核苷酸的時間和空間的表達。啟動子可以是那些通常與目標轉基因相連的啟動子或源自其它植物、病毒和植物病原性細菌和真菌的基因的啟動子。本領域技術人員無需經過過量實驗即能夠選擇適合用于使用包含本發(fā)明的多核苷酸序列的遺傳構建體而改變和調節(jié)植物特性的啟動子。組成性植物啟動子的例子包括CaMV 35S 啟動子,胭脂堿合成酶啟動子和章魚堿合成酶啟動子,以及來自玉米的Ubi 1啟動子。在科技文獻中描述了在特異性組織中有活性的,對內部發(fā)育信號或外部非生物或生物的壓力有反應的植物啟動子。在例如WO 02/00894 (通過引用并入本文)中描述了示例性的啟動子。通常用于植物轉化遺傳構建體的示例性的終止子包括例如花椰菜花葉病毒 (CaMV) 35S終止子、根癌土壤桿菌(Agrobacterium tumefaciens)胭脂堿合成酶或章魚堿合成酶終止子、玉米(Zea mays) zin基因終止子、水稻(Oryza sativa) ADP-葡萄糖焦磷酸化酶終止子和馬鈴薯(Solanum tuberosum)PI-II終止子。通常用于植物轉化的選擇性標記包括新霉素磷酸轉移酶II基因(NPT II),其賦予卡那霉素抗性;aadA基因,其賦予奇霉素和鏈霉素抗性;草丁膦乙酰轉移酶(bar基因), 其賦予Ignite (AgrEvo)和Basta (Hoechst)抗性;以及潮霉素磷酸轉移酶基因(hpt),其賦予潮霉素抗性。還考慮到可用于分析植物和植物組織中的啟動子表達的包含報告基因(其編碼表達對于宿主來說為外源的活性(通常為酶活性和/或可見信號(例如熒光素酶、GUS、 GFP))的序列)的遺傳構建體的使用。關于報告基因的文獻見綜述=Herrera-Estrella等人,1993,Nature 303,209 禾口 Schrott,1995,In =Gene Transfer toPlants(Potrykus, Τ., Spangenbert. Eds)Springer Verlag. Berline, pp.325—336。基因沉默策略可聚集在基因本身或影響編碼多肽的表達的調控元件?!罢{控元件” 在本文中以最可能寬的意義使用且包括其它的與目標基因相互作用的基因。設計為減少本發(fā)明的多核苷酸/多肽的表達或使其沉默的遺傳構建體可以包括本發(fā)明的多核苷酸的反義拷貝。在這樣的構建體中,多核苷酸被置于相對于啟動子和終止子的反義方向。通過將多核苷酸或多核苷酸的部分倒置而獲得“反義”多核苷酸,從而所產生的轉錄本將與基因的mRNA轉錄本互補,例如5’ GATCTA 3’(編碼鏈) 3’ CTAGAT 5’(反義鏈)3,CUAGAU 5,mRNA5,GAUCUCG 3,反義 RNA設計用于基因沉默的遺傳構建體還可以包括反向重復?!胺聪蛑貜汀笔侵貜托蛄校?其中重復的后一半在互補鏈中,例如5,GATCTA.......TAGATC-3,3’ CTAGAT.......ATCTAG-5’ 形成的轉錄本可以進行互補性堿基配對以形成發(fā)夾結構。發(fā)夾結構的形成通常需要在重復區(qū)域之間有3-5pb的間隔子。 另一個沉默方法包括使用靶向等同于miRNA的轉錄本的小的反義RNA(Llave等人,2002,Science 297,2053).也明確考慮到這樣的對應于本發(fā)明的多核苷酸的小的反義RNA的使用。本文所用的術語遺傳構建體還包括小的反義RNA和其它這樣的影響基因沉默的多肽。以本文定義的表達構建體進行轉化還可能通過被稱為正義抑制的過程引起基因沉默(例如 Napoli 等人,1990,Plant Cell 2,279 ;de Carvalho Niebel 等人,1995,Plant Cell,7,347)。在一些情況下,正義抑制可以包括全部或部分編碼序列的過表達,但還可以包括基因的非編碼區(qū)域例如內含子或5’或3’非翻譯區(qū)域(UTR)的表達??梢允褂们逗系牟糠终x構建體協(xié)調地使多個基因沉默(Abbott等人,2002,Plant Physiol. 128(3) 844-53 Jones等人,1998,Planta 204:499-505)。使用這樣的正義抑制策略以使本發(fā)明的多核苷酸的表達沉默也考慮在內。設計用于基因沉默的遺傳構建體中的多核苷酸插入物可以對應于編碼序列和/ 或非編碼序列,例如啟動子和/或內含子和/或5’或3’ UTR序列,或相應的基因。其它的基因沉默策略包括顯性負性方法和使用核糖酶構建體(Mclntyre,1996, Transgenic Res,5,257)0可以通過基因本身的突變或其調控元件的突變引起轉錄前沉默。這樣的突變可以包括點突變、移框、插入、刪除和取代。以下的代表性文獻公開了可以用于遺傳轉化下列植物物種的遺傳轉化規(guī)程水稻(Alam等人,1999,Plant Cell R印.18,572);玉米(美國專利系列號5,177,010和 5, 981, 840);小麥(Ortiz 等人,1996,Plant Cell Rep. 15,1996,877);番茄(美國專利系列號 5,159,135);馬鈴薯(Kumar 等人,1996 Plant J. 9,:821);木薯(Li 等人,1996 Nat. Biotechnology 14,736);萵苣(Michelmore 等人,1987,Plant Cell Rep. 6,439); 煙草(Horsch等人,1985,Science 227,1229);棉花(美國專利系列號5,846,797和 5,004,863);草(美國專利號 5,187,073,6. 020,539);薄荷(Niu 等人,1998,Plant Cell Rep. 17,165);柑橘屬植物(Pena 等人,1995,Plant Sci. 104,183);香菜(Krens 等人, 1997,Plant Cell Rep, 17, 39);香蕉(美國專利系列號5,792,935);大豆(美國專利號 5,416,011 ;5,569,834 ;5,824,877 ;5,563,04455 和 5,968,830);菠蘿(美國專利系列號 5, 952, 543);白楊(美國專利號4,795,855);一般性單子葉植物(美國專利號5,591,616 和6,037,522);蕓苔(美國專利號5,188,958 ;5, 463,174和5,750,871);和谷類(美國專利號6,074,877)。其它的物種也考慮在內,本領域技術人員使用的合適的方法和規(guī)程可以在科學文獻中獲得。本領域已知的幾個其它方法可以用于改變本發(fā)明的核苷酸和/或多肽的表達。 這樣的方法包括但不限于Tilling(Till等人,2003,Methods Mol Biol,2 %,205),所謂的 “Deletagene” 技術(Li 等人,2001,Plant Journal 27 (3),235)以及使用人工轉錄因子,例如合成的鋅指轉錄因子(例如Jouvenot等人,2003,Gene Therapy 10,513) 還可以在植物中表達另外的靶向特定多肽的抗體或其片段(Jobling等人,2003,Nat. Biotechnol. ,21(1),35).還可以使用轉座子標簽方法??梢酝ㄟ^一些技術例如相顯示 (Dyax Corporation)來鑒定與本發(fā)明的多肽相互作用的其它多肽。這樣的相互作用的肽可以在植物中表達或者應用到植物中以影響本發(fā)明的多肽的活性。以上每個改變本發(fā)明的核苷酸和/或多肽的表達的方法的使用被特別考慮在內。
21
選擇植物的方法還提供了選擇具有改變的種子產量的植物的方法。這樣的方法包括測試植物中的本發(fā)明的多核苷酸或多肽的表達的改變。這樣的方法可用于年幼的年齡或早期發(fā)育階段 (當改變的種子產量不是必須可見時)以加速朝向改善的種子產量的育種程序。多核苷酸例如信使RNA的表達經常被用作相應的多肽表達的指示。示例性的測定多核苷酸表達的方法包括但不限于Northern分析、RT-PCR和點雜交分析(Sambrook等人, Molecular Cloning :A Laboratory Manual,2nd Ed. Cold SpringHarbor Press,1987)。因此本發(fā)明的多核苷酸或多核苷酸的部分可用作如本文定義的用于鑒定具有改變的種子產量的植物的方法的探針或引物。本發(fā)明的多肽可用作雜交實驗中的探針,或基于PCR的實驗中的引物,其被設計為鑒定這樣的植物。或者可以產生針對本發(fā)明的多肽的抗體。產生和使用抗體的方法在本領域中是標準的(參見例如Antibodies, A Laboratory Manual,Harlow A Lane,Eds,ColdSpring Harbour Laboratory,1998)。這樣的抗體可用于檢測調節(jié)植物中種子產量的多肽的表達的改變的方法。這樣的方法可以包括 ELISA (Kemeny,1991,A PracticalGuide to ELISA,NY Pergamon Press)禾口 Western 分析(Towbin 禾口 Gordon,1994,JImmunol Methods,72,313)。這些分析多核苷酸或多肽表達并選擇具有改變的表達的植物的方法在被設計為產生具有改變的種子產量的品種的常規(guī)育種程序中是有用的。植物可以種植本發(fā)明的植物并且自交或與不同植物株進行雜交,可以鑒定所產生的具有需要的表型特征的雜交體。可以種植兩代或兩代以上以確保主題表型特征被穩(wěn)定地保持和遺傳。從這樣的標準育種方法產生的植物也構成本發(fā)明的一個方面??梢酝ㄟ^本發(fā)明的方法改變植物中的種子產量。這樣的方法可以包括以本發(fā)明的構建體(其被設計為改變調節(jié)這樣的植物細胞和植物中的種子產量的多核苷酸或多肽的表達)轉化植物細胞和植物。這樣的方法還包括以本發(fā)明的構建體和一個或多個其它構建體(其被設計為改變調節(jié)植物中種子產量的一個或多個多核苷酸或多肽的表達)的組合轉化植物細胞和植物。在Boyes DC 等人,2001,Plant Cell. 13(7) :1499-510 ;Lancashire P.D 等人, 1991,Ann. Appl. Biol. 119 :560-601和下面的實施例1中提供了示例性的檢測植物中種子
產量的方法。也可以廣泛地說本發(fā)明單獨地或聯(lián)合地存在于本申請說明書中提及的或指明的部分、元素和特征,以及任意兩個或兩個以上所述部分、元素和特征的任意或所有組合中, 和本發(fā)明相關的領域中具有已知同等物的本文提到的特異性完整物,這樣的已知同等物被認為包含在本文中,如同單獨列出一樣。
將通過參考隨附的附圖更好地理解本發(fā)明,其中圖1顯示了對其中0RF56多肽作為種子序列的uniref 100數據庫(版本 2. OMP-WashU
)進行 BLASTP 搜索的輸出總結。圖2 顯示了多肽(SEQ ID NO :1 至 31)(包括 0RF56 及其變體)的 “Prettyplot,,比對,并顯示了本申請人鑒定的存在于所有序列中的共有區(qū)域。圖3顯示了本發(fā)明的多肽(包括0RF56 SEQ ID NO :1和來自SEQ ID NO 1的所有變體的序列)的“Prettyplot”比對,并顯示了本申請人鑒定的存在于所有這些序列中的共有GAD區(qū)域。圖4顯示了本發(fā)明的多肽(包括0RF56 SEQ ID NO 1和SEQ ID NO :2_31的序列變體)的另一個“Prettyplot”比對,并顯示了本申請人鑒定的存在于所有這些序列中的共有CaM區(qū)域。圖5顯示了用于植物轉化的過表達載體的示意圖,其包含以正義方向克隆的 0RF56(SEQ ID NO 66)。圖6顯示了來自0RF56 TO轉基因植物的基因組DNA(以限制性酶消化并以0RF56 編碼序列的片段探測,從而確定基因拷貝數并鑒定獨立轉化事件)的DNA凝膠印跡分析。圖7a_7d顯示了觀察到的轉基因0RF56 Tl植物系的生長參數(與表現(xiàn)最好的野生型對照(日本晴(Nipponbare))比較)。其中,圖7a是從實驗1中測量的植物高度;圖 7b是從實驗1中測量的植物分蘗;圖7c是從實驗2中測量的植物高度;圖7d是從實驗1 中測量的植物分蘗。圖8a-8e顯示了轉基因0RF56 Tl植物系的種子和谷粒的特性(與表現(xiàn)最好的野生型對照(日本晴)比較)。其中,圖8a是不同的0RF56 Tl系中每株植物的種子產量;圖 8b是不同的0RF56 Tl系中每株植物的種子總數;圖8c是每個0RF56T1系中單個種子的平均質量;圖8d是不同的0RF56 Tl系中種子產量的二項分布;圖8e是不同的0RF56 Tl系中種子產量分布的偏移。圖9顯示了從產量最高的對照植物(日本晴)和0RF56 Tl植物收獲的種子/谷粒。圖10顯示了 0RF56多肽序列(SEQ ID NO 1)和來自單子葉植物物種的公開的所有其它變體序列的比對。顯示了 GAD區(qū)域內的完全保守性基序的位置。在SEQ ID NO 32 中顯示了完全保守性基序的序列。圖11顯示了 0RF56多肽序列(SEQ ID NO 1)和來自雙子葉植物物種的公開的所有其它變體序列的比對。顯示了 GAD區(qū)域內的完全保守性基序的位置。這個序列基序在所有雙子葉植物序列和所有單子葉植物序列中是完全保守的(見圖10),并被顯示于SEQ ID NO :33ο
具體實施例方式現(xiàn)在將通過參考以下非限制性實施例解釋本發(fā)明。實施例1.通過在植物中表達本發(fā)明的多核苷酸改變種子產量
0RF56在 ViaLactia Biosciences Ltd proprietary ryegrass (黑麥草)Gene Thresher (OrionGenomics)基因組庫中鑒定了一個多核苷酸,將其稱為0RF56 (SEQ ID NO: 34)。0RF56似乎編碼是谷氨酸鹽脫羧酶(GAD)的多肽(SEQ ID NO :1)。GAD催化谷氨酸鹽向二氧化碳和Y-氨基丁酸鹽(GABA)的反應。相信GAD對于胞漿pH的調節(jié)以及基礎形態(tài)學發(fā)育是必不可少的。GABA的合成在正常生長條件下和對壓力(例如冷、熱、水或機械壓力)反應時(Bouche 等人,2004 ;Mayer 等人,1990 =Patterson 和 Graham 1987 ;Wallace 等人,1984)受到高度調控。已經表明GABA在向日葵中刺激乙烯的產生,表面上看是通過引起ACC合成酶mRNA積累的增加、ACC水平的增加、ACC氧化酶mRNA水平的增加和ACC氧化酶活性的增加,這提示GABA可能在信號傳導中發(fā)揮作用(Kathiresan等人,1997)。已經報道高水平的GABA破壞花粉管生長,從而破壞結實(seed set),而低水平的GABA則被報道是刺激性的(Updegraff和I^reuss 2004)。0RF56編碼的谷氨酸鹽脫羧酶含有兩個主要結構域GAD催化結構域和第二個鈣調蛋白結合結構域(CaM)。已經顯示CaM通過結合至C-末端“擴展”(在GAD的原核生物(例如大腸桿菌)或哺乳動物的形式中未發(fā)現(xiàn)C-末端“擴展”)而刺激GAD活性。截掉此結構域產生較短的更分叉的延遲變綠的且缺少花粉的植物 (Baum等人,1996 ;Akama和Takaiwa 2007)。GAD的翻譯后修飾可能引起觀察到的不同的表型。GAD在水溶液中是單體。通常來講,肽的疏水性區(qū)域中的Trp殘基與CaM的C-末端結構域(圖4中加框的殘基)的結合啟動肽復合物的形成。然后,CaM的N-末端的葉結合至距離Trp殘基10-12個殘基的肽區(qū)域的疏水性和帶正電的殘基(Yuan和Vogel 1998)。但是,在多年生黑麥草(Perennial Ryegrass)中,SEQ ID 1 (CaM結合結構域)缺少疏水性殘基Trp,而是以疏水性環(huán)境中的極性但不帶電的Cys殘基替換。多年生黑麥草CaM結構域中的負電荷還以這樣的方式被配置=CaM的N-末端的葉與GAD的N-或C-末端的區(qū)域的相互作用將不是積極有利的,從而促進第二個或多個GAD肽與CaM的N-末端區(qū)域中的疏水性表面的結合。這實質上引起GAD-Ca2+-CaM復合物的二聚體化或多聚體化。存在使GAD進行這樣的二聚體化的可能性,這似乎是由Ca2+-CaM結合所誘導(Yuan和Vogel 1998)。在植物中,存在牽牛花GAD寡聚化的證據并且在牽?;ㄖ兄挥泄丫刍腉AD似乎有活性的(Baum 等人,1996)。另外有報道指出從大麥中提取的活性GAD的各種同種型具有 256kDa和 120kDa的質量(Inatomi和Slaughter 1975)。也有報道指出在存在2-巰基乙醇時,大麥 GAD的活性顯示出可逆的抑制。綜合這些證據,可合理預計CaM結構域中的Cys殘基(該位置上正常為Trp殘基)在穩(wěn)定二聚體化的GAD-Ca2+-CaM復合物中發(fā)揮作用。0RF56 變體使用0RF56編碼的多肽序列作為種子序列以進行對imiref 100數據庫 (2. OMP-WashU
)的WU_blastp搜索,從而鑒定0RF56的變體。在圖1中顯示了 WU-blastp輸出總結?;趯矓祿熘械南嚓P分值和注釋的評價,鑒定了小于或等于5. 5e-169的界限e值以從不相關蛋白中區(qū)分0RF56的變體。使用DbCLUSTAL(Thompson J. D. ,Plewnial F. ,Thierry J. -C.和Poch 0. :2000)(其為流行的多重比對程序ClustalW 的界面)對所選的變體序列進行比對。使用另一個稱為I^rettyplot的EMBOSS工具顯示比對的序列,如圖2所示。0RF56的變體多肽序列在序列表中列為SEQ ID NO :2_31。相應的多核苷酸序列列為 SEQ ID NO 35-65。除了四個變體多肽序列之外,所有的變體多肽序列似乎均具有正確的GAD催化結構域和正確的CaM結合結構域。四個序列(多肽SEQ ID NO :11,15,22和四;多核苷酸SEQ ID NO 61至66)似乎具有正確的有變體CaM結合結構域的GAD催化結構域。使用ft~ettypl0t比對鑒定了存在于0RF56和所有的鑒定出的0RF56變體中的保守性GAD多肽序列區(qū)域,如圖3所示。還使用Prettyplot比對鑒定了存在于多肽序列SEQ ID NO :1_31中的另一個 保守性CaM多肽序列區(qū)域,如圖4所示。在所有的變體序列的GAD區(qū)域中鑒定了完全保守性多肽序列基序,如SEQ IDNO 32所示。在來自單子葉植物物種的所有變體序列的GAD區(qū)域中也鑒定了完全保守性多肽序列基序,如SEQ ID N0:33所示。用于通過植物轉化過表達0RF56的載體的構建通過標準分子生物學技術產生了用于過表達0RF56的載體。在圖5中顯示了雙載體的示意圖。在SEQ ID NO :66中顯示了載體的序列。植物轉化可以使用雙質粒載體DNA通過冷凍/解凍(Chen等人1994)或電穿孔方法 (denDulk-Ras A 禾口 Hooykgrns PJ.) ^ IH ± ^ ff ^ (Agrobacterium tumefaciens) 菌株。通過電穿孔將純化的0RF56質粒DNA導入土壤桿菌菌株EHA105,將懸浮液在26 °C孵育30分鐘。將一小等份植板于含有100mg/L的卡那霉素的AB基本培養(yǎng)基 (Schmidt-Eisenlohr等人1999)。在26°C將板孵育3天,使用構建體特異性引物測定單個克隆中質粒的存在并確認轉化。土壤桿菌培養(yǎng)物在26°C生長于含有100mg/L的卡那霉素的AG基本培養(yǎng)基中 (200rpm搖動)。在5,OOOrpm離心5分鐘以沉淀土壤桿菌懸浮液,在含有1 %葡萄糖和3% 蔗糖的基礎MS培養(yǎng)基(pH*5.2)中洗滌一次并懸浮于含有200 μ M乙酰丁香酮的相同培養(yǎng)基中達到OD6J). 6-0.8。使用含有雙載體0RF56的根癌土壤桿菌共培養(yǎng)至少1,000個未成熟水稻(Oryza sativa)cv.日本晴胚胎。在無菌水中洗滌來自水稻的未成熟種子,然后以含有1. 25%活性氯的次氯化鈉和10 μ LTWeen 20進行表面滅菌20分鐘。滅菌后,以無菌水將這些種子洗滌幾次并在無菌濾紙(3M)上吸干。使用無菌鉗子人工將種子去殼,以無菌刀分離胚胎。將分離的胚胎浸沒于IOmL培養(yǎng)管中的土壤桿菌懸浮液中,在IOOrpm持續(xù)搖動30分鐘。排掉多余的液體,將胚胎在無菌濾紙上吸干,然后將其置于含有MS培養(yǎng)基(Murashige和Skoog, 1964)(補充了 3%蔗糖,葡萄糖,2mg/L 2,4-D,0. lmg/L BA,400 μ M 乙酰丁香酮)的共培養(yǎng)培養(yǎng)基(PH為5. 2)中在黑暗中共培養(yǎng)4天。共培養(yǎng)之后,將形成愈傷組織的胚胎每兩周在選擇性培養(yǎng)基(由補充了 3%蔗糖,葡萄糖,2mg/L 2,4-D (2,4-二氯苯氧基乙酸), 0. lmg/L BA(芐基腺嘌呤)MS的培養(yǎng)基組成,并含有50mg/L潮霉素和300mg/L特美汀 (替卡西林+克拉維酸))上次培養(yǎng)一次,直至至少30個健康愈傷組織顯示綠色斑點(指示達到健康的芽的出現(xiàn))。將含有綠色斑點的愈傷組織轉移至不含2,4-D的選擇性培養(yǎng)基以再生最少10個轉化植物。使再生植物生根然后移植到6英寸含有土壤的罐子中,植物在溫室中生長。進行DNA凝膠印跡分析(圖6)以確定基因拷貝數并鑒定5個獨立轉化事件。從轉化的植物(TO)中收獲Tl種子。Tl植物表型分型將來自Southern陽性的TO植物的30粒種子種植于單個的含有椰子殼泥炭土 (cocopeat)的杯子中,將其中的20個健康植物移植到溫室。使用CRD以來自隨機數字表的隨機數字排列這些植物。 在兩個單獨的實驗中進行Tl植物表型分型。第一個實驗包括來自TO事件11四105 和1129106和日本晴(野生型對照)的子代系,第二個實驗包括來自TO事件11四102、 11四103和11四04和日本晴(野生型對照)的子代系。TO系的表型分析
在下面表1中顯示了 TO植物的生理狀態(tài)
表1. TO系的生理測定
生產性分蘗/分
TO系花粉生殖力植物高度(cm)種子產量
蘗總數目
112910272. 2%9/964. 330
112910391. 5%14/1569. 630
112910479. 7%9/965. 650
112910585. 6%8/884. 2130
112910681. 5%7/775. 5160
Tl系的表型分析
移植后每周測定一次植物高度和分蘗數目,.直至達到結實。圖7a、b、C和d描述
了對這些植物觀察到的生長參數?;跇藴式y(tǒng)計學分析,轉基因0RF56植物(Tl)的植物高度和分蘗能力沒有差異??梢哉f轉基因0RF56植物在評估的所有方面均是正常的(數據未顯示),除了種子產量;發(fā)現(xiàn)所分析的植物子代中的一個的種子產量高達正常種子產量的 3. 55 倍。圖8a、b、C、d和e描述了每個植物的種子產量、每個植物的種子總數、每個系中的單個種子的平均質量、不同系中種子產量的二項分布和所分析的系中種子產量分布的偏移。從這些分析中可以看出種子產量的增加是種子數目增加的結果而不是單個種子重量增加的結果(圖8a、b和c)。鑒于該分析是在Tl中使用分離群進行的,所以在所研究的轉基因群體中的種子產量特性的二項分布中觀察到偏移是不足為奇的(圖8d和e)。常規(guī)育種技術(例如單粒傳法)可以固定增加種子產量的特性。在圖9中顯示了來自野生型日本晴的最大種子產量的植物和T10RF56植物的種子產量。參考文獻Adams et al.,1991,Science 252 :1651-1656.Akama, K and Takaiwa(2007) J Exp Bot. :58(10)2699-2707.Baum G, Lev-Yadun S, Fridmann Y, Arazi Τ, Katsnelson H, Zik Μ, and Fromm H (1996) EMBO J. :15(12)2988-2996.Bouche N, Fait A, Zik M,F(xiàn)romm H. (2004) Plant Mol Biol. ;55 (3) :315-25.Chen H, Nelson RS, Sherwood JL. (1994)Biotechniques ; 16 (4) :664-8,670.Chen et al.,2002,Nucleic Acids Res. 31 :101-105den Dulk-Ras A, Hooykaas PJ. (1995)Methods Mol Biol. ;55 :63-72.Inatomi, K and Slaughter, JC (1975)Biochem J. 147 :479-484.
Kathiresan A, Tung P, Chinnappa CC, Reid DM(1997)Plant Physiol.115 129-135.Lee et al. ,2003,PNAS 99 :12257_12262Lee and Lee,2003 Plant Physiol. 132 :517_529Mayer RR, Cherry JH,Rhodes D (1990)Plant Physiol. 94 :796-810.Murashige T,Skoog F (1962)Physiol Plant 15 473-497Patterson BD, Graham D(1987)In(DD Davies ed) " The Biochemistry of Plants" , Vol12, Academic Press, New York,pp.153-199.Richmond and Somerville 2000, Current Opinion in Plant Biology.3 108-116Ruan et al. ,2004, Trends in Biotechnology 22:23—30.Schmidt-Eisenlohr H, Domke N, Angerer C, Wanner G, Zambryski PC, Baron C. (1999) J. Bacteriol. ;181 (24) :7485_92·Sun et al.,2004,BMC Genomics 5 :1· 1-1. 4Thompson, J. D.,Higgins, D. G. and Gibson, T. J. (1994) CAB I OS, 10,19-29.Updegraff E, Preuss D(2004)in International Arabidopsis Conference, GermanyVelculescu et al. , 1995, Science 270 484-487Wallace W, Secor J, Schrader LE(1984)Plant Physiol. 75 :170—175.Yuan, T and Vogel, HJ(1998) J Biol. Chem. 273(46)30328-30335.以上實施例解釋了本發(fā)明的實施。本領域技術人員將認識到可以不脫離本發(fā)明的精神和范圍而作出各種改變和修飾。序列總結
權利要求
1.一種產生具有改變的種子產量的植物的方法,該方法包括使用下列多核苷酸轉化植物a)編碼具有SEQID NO :1的氨基酸序列的多肽或多肽變體的多核苷酸,其中變體能夠調節(jié)植物中的種子產量;b)包含a)中的多核苷酸的長度為至少15個核苷酸的片段的多核苷酸,或c)包含a)中的多核苷酸的長度為至少15個核苷酸的互補物的多核苷酸。
2.根據權利要求1所述的方法,其中變體與具有SEQID NO :1的氨基酸序列的多肽具有至少70%的序列同一性。
3.根據權利要求1或2所述的方法,其中變體源自植物物種并且包含SEQIDNO :32的氨基酸序列。
4.根據權利要求1至3任一項所述的方法,其中變體源自單子葉植物物種并且包含SEQ ID NO 33的氨基酸序列。
5.根據權利要求1至3任一項所述的方法,其中變體包含選自SEQID NO :2_31任一項的氨基酸序列。
6.根據權利要求1至5任一項所述的方法,其中變體是谷氨酸鹽脫羧酶。
7.根據權利要求1所述的方法,其中a)中的多核苷酸編碼具有SEQID NO 1的氨基酸序列的多肽。
8.—種產生具有改變的種子產量的植物的方法,該方法包括使用下列多核苷酸轉化植物細胞或植物a)包含SEQID NO :34的核苷酸序列的多核苷酸或其變體,其中變體編碼能夠調節(jié)植物中的種子產量的多肽;b)包含a)中的多核苷酸的長度為至少15個核苷酸的片段的多核苷酸,或c)包含a)中的多核苷酸的長度為至少15個核苷酸的互補物的多核苷酸。
9.根據權利要求8所述的方法,其中變體與SEQID NO 34具有至少70%的序列同一性。
10.根據權利要求8所述的方法,其中變體與SEQID NO :34的編碼序列具有至少70% 的序列同一性。
11.根據權利要求8所述的方法,其中變體包含SEQID NO :35-65任一項的序列。
12.根據權利要求8所述的方法,其中變體包含SEQID N0:35-65任一項的編碼序列。
13.根據權利要求8至12任一項所述的方法,其中多肽為谷氨酸鹽脫羧酶。
14.根據權利要求8所述的方法,其中a)中的多核苷酸包含SEQID N0:34的序列。
15.根據權利要求8所述的方法,其中a)中的多核苷酸包含SEQID NO :34的編碼序列。
16.根據權利要求1至15任一項所述的方法,其中相對于合適的對照植物,所產生的植物具有增加的種子產量。
17.根據權利要求1至16任一項所述的方法產生的植物細胞或植物。
18.一種分離的多核苷酸,其編碼與SEQ ID NO :1的氨基酸序列具有至少75%的序列同一性的多肽,其中多核苷酸編碼能夠調節(jié)植物中種子產量的多肽。
19.根據權利要求18所述的分離的多核苷酸,其中多肽是谷氨酸鹽脫羧酶。
20.根據權利要求18所述的分離的多核苷酸,其包含SEQID NO:34的序列。
21.根據權利要求18所述的分離的多核苷酸,其包含SEQID NO:34的編碼序列。
22.—種分離的多肽,其與SEQ ID NO :1的氨基酸序列具有至少83%的序列同一性,其中多肽能夠調節(jié)植物中的種子產量。
23.根據權利要求22所述的分離的多肽,其中多肽是谷氨酸鹽脫羧酶。
24.根據權利要求22所述的分離的多肽,其包含SEQID NO :1的氨基酸序列。
25.一種包含權利要求18至21任一項的多核苷酸的遺傳構建體。
26.一種遺傳構建體,其包括由至少一個下列組成的多核苷酸a)權利要求18-21任一項的多核苷酸的長度為至少15個核苷酸的片段;b)權利要求18-21任一項的多核苷酸的長度為至少15個核苷酸的互補物;或c)長度為至少15個核苷酸的能夠與權利要求18-21任一項的多核苷酸雜交的序列。
27.根據權利要求26所述的遺傳構建體,其包含與多核苷酸可操作地連接的啟動子序列。
28.根據權利要求26或27所述的遺傳構建體,其包含與多核苷酸可操作地連接的終止子序列。
29.一種經遺傳修飾以表達權利要求18至21任一項的多核苷酸或權利要求22至24 任一項的多肽的宿主細胞。
30.一種包含權利要求25至28任一項的遺傳構建體的宿主細胞。
31.一種經遺傳修飾以表達權利要求18至21任一項的多核苷酸或權利要求22至24 任一項的多肽的植物細胞。
32.一種包含權利要求25至28任一項的遺傳構建體的植物細胞。
33.一種包含權利要求31或32的植物細胞的植物。
34.一種選擇相對于合適的對照植物具有改變的種子產量的植物的方法,該方法包括測試植物中的權利要求18至21任一項的多核苷酸的改變的表達。
35.一種選擇相對于合適的對照植物具有改變的種子產量的植物的方法,該方法包括測試植物中的權利要求22至24任一項的多肽的改變的表達。
36.一組根據權利要求34或35的方法選擇的植物。
37.一種針對權利要求22至24任一項的多肽產生的抗體。
全文摘要
本發(fā)明提供了產生具有改變的種子產量的植物的方法,所述方法包括以遺傳構建體轉化植物,所述遺傳構建體包括編碼具有SEQ ID NO1的氨基酸序列的多肽或其變體或片段的多核苷酸。本方法還提供了用于產生具有改變的種子產量的植物的分離的多肽、多核苷酸、構建體和載體。本方法還提供了經轉化的含有并表達多肽、多核苷酸和構建體的植物細胞和植物。本發(fā)明還提供了根據本發(fā)明的方法產生的植物。
文檔編號C12N15/29GK102159714SQ200880117208
公開日2011年8月17日 申請日期2008年10月24日 優(yōu)先權日2007年10月26日
發(fā)明者C·J·史密斯-埃斯皮諾薩, C·J·布賴恩特, J·R·菲利普斯, K·M·埃爾伯勒, M·比斯瓦, S·普蒂格 申請人:維亞拉克什亞生物科學有限公司