專利名稱:具有改變的生長(zhǎng)特征的植物及其制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是改變植物生長(zhǎng)特征的方法。更具體地,本發(fā)明涉及的是通過(guò)改變植物中seedyl核酸的表達(dá)和/或seedyl蛋白的水平和/或活性,改變植物生長(zhǎng)特征的方法。本發(fā)明還涉及相對(duì)于相應(yīng)的野生型植物具有改變的生長(zhǎng)特征、改變的seedyl核酸表達(dá)和/或改變的seedyl蛋白水平和/或活性的植物。
背景技術(shù):
不斷增加的世界人口以及用于農(nóng)業(yè)的可耕種土地供應(yīng)的減少推動(dòng)了提高農(nóng)業(yè)效率的研究。用于作物和園藝改良的傳統(tǒng)方法使用選擇性育種技術(shù)確定具有合意特征的植物。但是,這種選擇性育種技術(shù)具有幾個(gè)缺點(diǎn),即這些技術(shù)通常是勞動(dòng)密集型的,產(chǎn)生的植物通常含有異源遺傳組分,這些遺傳組分不一定總是能夠?qū)е聫挠H本植物向后代傳遞合意性狀。分子生物學(xué)的進(jìn)展使人類能夠?qū)?dòng)物和植物的種質(zhì)進(jìn)行改變。植物的遺傳工程需要對(duì)遺傳物質(zhì)(通常是以DNA或RNA的形式)進(jìn)行分離和操作,接下來(lái)將該遺傳物質(zhì)引入植物中。這種技術(shù)能夠提供具有各種不同的改良的經(jīng)濟(jì)、農(nóng)藝或園藝性狀的作物或植物。產(chǎn)量是一種具有特別經(jīng)濟(jì)意義的性狀。產(chǎn)量通常定義為自作物產(chǎn)生的可測(cè)量的經(jīng)濟(jì)價(jià)值。這可以用量和/或質(zhì)來(lái)確定。不僅僅可以通過(guò)抵御作物或植物通常經(jīng)受的脅迫,而且還可以通過(guò)改變植物的固有生長(zhǎng)特征,提高作物產(chǎn)量。產(chǎn)量直接取決于幾個(gè)生長(zhǎng)特征,例如,生長(zhǎng)速率、生物量的生產(chǎn)、植物的構(gòu)造、器官的數(shù)目和大小(例如分支、分蘗、莖、花的數(shù)目)、種子的生產(chǎn)等等。根的發(fā)育和營(yíng)養(yǎng)物質(zhì)的攝取可能也是確定產(chǎn)量的重要的因素。
改變一種或者多種植物生長(zhǎng)特征的能力在作物改進(jìn)、植物育種、裝飾植物的生產(chǎn)、樹(shù)木栽培、園藝、林學(xué)、藻類或植物的生產(chǎn)等領(lǐng)域有許多應(yīng)用(例如用作生物反應(yīng)器、用于藥物、抗體或疫苗等物質(zhì)的生產(chǎn),或者用于有機(jī)廢物的生物轉(zhuǎn)化或者對(duì)于高產(chǎn)量的藻類和植物而言用作燃料)。
發(fā)明內(nèi)容
現(xiàn)在已經(jīng)發(fā)現(xiàn)在植物中改變seedyl核酸的表達(dá)和/或改變植物中seedyl蛋白的水平和/或活性可以產(chǎn)生相對(duì)于相應(yīng)的野生型植物具有改變的生長(zhǎng)特征的植物。
這里seedyl蛋白質(zhì)定義為從N端到C端按照以下順序包含下列各項(xiàng)的蛋白質(zhì)(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
seedyl核酸/基因在這里定義為編碼seedyl蛋白的核酸或基因。術(shù)語(yǔ)“seedyl基因”、“seedyl核酸”和“編碼seedyl蛋白的核酸”在這里可以交換使用。正如這里定義的,術(shù)語(yǔ)seedyl核酸/基因還包括該序列的互補(bǔ)序列以及相應(yīng)的RNA、DNA、cDNA或基因組DNA。seedyl核酸可以全部或者部分合成,它可以是雙鏈核酸或者單鏈核酸。該術(shù)語(yǔ)還包括由于遺傳密碼子的簡(jiǎn)并性產(chǎn)生的變體以及被一個(gè)或多個(gè)間插序列中斷的變體。
seedyl核酸/基因或者seedyl蛋白質(zhì)可以是野生型的,即天然或者內(nèi)源核酸或蛋白質(zhì)。該核酸可以來(lái)自相同或不同的物種,該核酸通過(guò)例如轉(zhuǎn)化作為轉(zhuǎn)基因引入。通過(guò)有意的人工操作,可以使該基因在組成和/或基因組環(huán)境方面與其天然形式相比有顯著改變。因此只要核酸在植物中表達(dá)時(shí)導(dǎo)致改變的植物生長(zhǎng)特征,該核酸可以來(lái)自任何來(lái)源(或者直接或者間接(如果接下來(lái)被改變的話))。核酸可以從微生物來(lái)源例如細(xì)菌、酵母或者真菌中,或者從植物、藻類、昆蟲(chóng)或者動(dòng)物(包括人)來(lái)源中分離。優(yōu)選地,seedyl核酸分離自植物。該核酸可以從雙子葉植物物種中分離,優(yōu)選來(lái)自茄科(Solanaceae),更優(yōu)選來(lái)自煙草屬(Nicotiana)。更為優(yōu)選地,seedyl核酸編碼如以上描述的seedyl蛋白。最優(yōu)選地,seedyl核酸是SEQ ID NO1或者其一部分表示的核酸,或者是能夠與SEQ ID NO1表示的序列雜交的核酸,或者是編碼SEQ ID NO2表示的氨基酸或者其同源衍生物或者其活化片段的核酸,其中的同源物與SEQ ID NO 2表示的序列具有至少20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%98%或者99%的序列一致性,優(yōu)選的級(jí)別隨一致性的增加而增加。
本發(fā)明提供了改變植物生長(zhǎng)特征的方法,包括改變植物中seedyl蛋白的編碼核酸的表達(dá)和/或改變植物中seedyl蛋白的水平和/或活性,其中所述的seedyl蛋白從N端到C端按照以下順序包含下列各項(xiàng)(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,其中的生長(zhǎng)特征相對(duì)于相應(yīng)野生型植物的生長(zhǎng)特征被改變。
本發(fā)明還提供了迄今未知的seedyl蛋白,該seedyl蛋白從N端到C端按照以下順序包含下列各項(xiàng)(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,條件是seedyl蛋白不是保存于GenBank中具有NCBI登錄編號(hào)AL161572的擬南芥屬(Arabidopsis)蛋白(SEQ ID NO 12)。
根據(jù)特定的實(shí)施方案,根據(jù)SEQ ID NO15的基序是由(P/X)X((V/L/H)(Q/H)(V/I)W(N/X)NA(A/P)(F/C)D表示的基序,其中X可以是任何氨基酸,且其中(P/X)優(yōu)選是P或者是A或T或Q或者另一種氨基酸(V/L/H)優(yōu)選是V或L或H(Q/H)是Q或H(V/I)是V或者是T或S或者另一種氨基酸(A/P)優(yōu)選是A或者是P(F/C)優(yōu)選是F或者是C。
根據(jù)特定的實(shí)施方案,根據(jù)SEQ ID NO 17的基序是由(I/V/A)(D/E)XE(I/M)XX(I/V)(E/Q)XE(I/X)XRL(S/X)(S/X)(R/K)LXXLR(L/V/T/I)X(K/Q)表示的基序,其中X可以是任何氨基酸,且其中(I/V/A)優(yōu)選是I或V或者是A(D/E)是D或E(I/M)優(yōu)選是I或者是M(I/V)優(yōu)選是I或者是V
(E/Q)優(yōu)選是E或者是Q(I/X)優(yōu)選是I或者是M或者是V或者任何其他氨基酸(S/X)優(yōu)選是S或者是T或者任何其他氨基酸(S/X)優(yōu)選是S或者是T或L或I或A(R/K)優(yōu)選是R或者是K(L/V/T/I)優(yōu)選是L或T或V或I(K/Q)優(yōu)選是K或Q且該基序是卷曲螺旋基序。
根據(jù)特定的實(shí)施方案,根據(jù)SEQ ID NO 18的基序是由LP(R/K)I(R/X)(T/I)(M/X)(P/R)XX(D/X)(E/G)(S/T)(P/L)RDSG(C/X)(A/X)KR(V/X)(A/I)(D/E)(L/R)(V/X)(G/A)K表示的基序,其中X可以是任何氨基酸,且其中(R/K)是R或K(R/X)優(yōu)選是R或者是S或K(T/I)優(yōu)選是T或是I(M/X)優(yōu)選是M或L或A或V(P/R)是P或R(D/X)優(yōu)選是D或者是G或T或N(E/G)優(yōu)選是E或者是G(S/T)優(yōu)選是S或者是T(P/L)優(yōu)選是P或者是L(C/X)優(yōu)選是C或者是P或A(A/X)優(yōu)選是A或者是V或I(A/I)優(yōu)選是A或是I(D/E)是D或E(L/R)優(yōu)選是L或者是R(V/X)優(yōu)選是V或者是Q或N或I(G/A)優(yōu)選是G或者是A。
本發(fā)明還提供了迄今未知的分離的seedyl核酸/基因,其選自(i)SEQ ID NO1,5或7中的任何一個(gè)表示的核酸或者上述任何一個(gè)的互補(bǔ)核酸;(ii)SEQ ID NO2,4,6,8或10表示的氨基酸序列的編碼核酸;(iii)上述(i)或(ii)的同源物、衍生物或者活性片段的編碼核酸;(iv)能夠與上述(i)、(ii)或(iii)的核酸雜交的核酸;(v)由于遺傳密碼的原因而與上述(i)到(iv)中任何一個(gè)核酸簡(jiǎn)并的核酸;(vi)屬于上述(i)到(v)中任何一個(gè)核酸的等位變體的核酸;(vii)屬于上述(i)到(vi)中任何一個(gè)核酸的可變剪接變體的核酸;(viii)與上述(i)到(vii)中定義的任何一個(gè)或多個(gè)序列具有至少21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,60%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%(優(yōu)選的級(jí)別隨一致性的增加而增加)序列一致性的蛋白質(zhì)的編碼核酸。
(ix)根據(jù)上述(i)到(viii)任何一項(xiàng)的核酸的一部分;其中上述(i)到(ix)的核酸編碼如上定義的seedyl蛋白,條件是該分離的核酸不是保存于GenBank中具有登錄編碼AK063941的稻cDNA(SEQ ID NO 3)、以AC144618,AC139356,AC144482或AC135566保存的苜蓿屬植物(Medicago)BAC克隆、以AL61572保存的擬南芥屬植物(Arabidopsis)cDNA(SEQ ID NO 11)或者以AY108162保存的玉蜀黍(Zea mays)EST(SEQ ID NO 9)。
可以通過(guò)在特定的細(xì)胞或組織中改變基因的表達(dá)和/或改變基因產(chǎn)物(即,多肽)的活性和/或水平,實(shí)現(xiàn)對(duì)seedyl核酸表達(dá)的改變和/或?qū)eedyl蛋白的活性和/或水平的改變。如這里所使用的,術(shù)語(yǔ)“改變”(在改變表達(dá)、活性和/或水平的上下文中)指的是增加、降低或者時(shí)間或地點(diǎn)的改變。所述的seedyl基因或蛋白質(zhì)的改變的表達(dá)、活性和/或水平與相應(yīng)的野生型植物中seedyl基因或蛋白質(zhì)的表達(dá)、活性和/或水平相比是改變的。改變的基因表達(dá)可以由內(nèi)源seedyl基因的表達(dá)水平改變所致和/或可以由于引入植物中的seedyl基因的表達(dá)水平改變所致。類似地,seedyl蛋白質(zhì)的水平和/或活性可以由于內(nèi)源seedyl核酸/基因的表達(dá)改變和/或由于引入植物中的seedyl核酸/基因的表達(dá)改變而被改變??梢酝ㄟ^(guò)提高Seedyl蛋白質(zhì)自身的水平來(lái)提高seedyl蛋白的活性。在seedyl蛋白水平?jīng)]有任何提高甚至seedyl蛋白水平下降的情況下活性也可以被提高。當(dāng)多肽的固有性質(zhì)被改變時(shí)(例如通過(guò)制備比野生型更具活性的突變體)這種情況就可能出現(xiàn)。突變可以導(dǎo)致蛋白質(zhì)構(gòu)象的改變,從而導(dǎo)致蛋白質(zhì)活性和/或水平更高??梢酝ㄟ^(guò)例如引入遺傳改變(優(yōu)選在seedyl基因座處)實(shí)現(xiàn)基因/核酸表達(dá)的改變和/或基因產(chǎn)物/蛋白質(zhì)的活性和/或水平的改變。如這里所定義的,基因的基因座指的是包括目標(biāo)基因以及編碼區(qū)域上或下游10kb的基因組區(qū)域。
可以通過(guò)例如以下方法的任何一個(gè)(或多個(gè))引入遺傳改變TDNA激活,TILLING、定點(diǎn)誘變、同源重組,或者在植物中引入和表達(dá)編碼seedyl蛋白或者其同源物、衍生物或者活化片段的核酸。在引入遺傳改變之后,接著是對(duì)seedyl蛋白表達(dá)和/或活性和/或水平的增加的篩選,其中所述表達(dá)和/或活性和/或水平的增加導(dǎo)致產(chǎn)生具有改變的生長(zhǎng)特征的植物。
T-DNA激活標(biāo)簽(Hayashi et al.Science(1992)1350-1353)涉及將通常含有啟動(dòng)子(也可以是翻譯增強(qiáng)子或者內(nèi)含子)的T-DNA插入到目標(biāo)基因或者基因編碼區(qū)域上或下游10kb的基因組區(qū)域中,插入方式使啟動(dòng)子指導(dǎo)所述靶基因的表達(dá)。通常靶基因天然啟動(dòng)子對(duì)靶基因表達(dá)的調(diào)控被破壞,基因受到新引入的啟動(dòng)子的控制。啟動(dòng)子通常被嵌入T-DNA中。該T-DNA通過(guò)例如農(nóng)桿菌(Agrobacterium)感染隨機(jī)插入植物基因組中,使靠近該插入的T-DNA的基因過(guò)表達(dá)。產(chǎn)生的轉(zhuǎn)基因植物由于靠近該引入的啟動(dòng)子的基因的過(guò)表達(dá)而表現(xiàn)出顯性表型。要引入的啟動(dòng)子可以是任何能夠指導(dǎo)基因在期望生物體(在本例中是植物)中表達(dá)的啟動(dòng)子。例如,組成型的、組織偏好的、細(xì)胞類型偏好的以及誘導(dǎo)型的啟動(dòng)子都適宜用于T-DNA激活。
還可以使用TILLING技術(shù)(在基因組中定向誘導(dǎo)局部損傷))在seedyl基因的基因座中引入遺傳改變。這是一種誘變技術(shù),它可用于seedyl核酸的誘變變體的產(chǎn)生和/或鑒定以及分離中。TILLING還允許對(duì)攜帶這種突變變體的植物進(jìn)行篩選。與處于天然形式的基因相比,這些突變體可以甚至表現(xiàn)出更高的seedyl活性。TILLING將高密度誘變與高通量篩選方法組合在一起。TILLING通常的步驟是(a)EMS誘變(Redei and Koncz,1992;Feldmann et al.,1994;Lightner andCaspar,1998);(b)個(gè)體的DNA制備和合并;(c)目標(biāo)區(qū)域的PCR擴(kuò)增;(d)變性和退火形成異源雙鏈;(e)DHPLC,其中合并物中存在的異源雙鏈作為色譜圖中額外的峰被檢測(cè)出來(lái);(f)鑒定突變體個(gè)體;以及(g)對(duì)突變體PCR產(chǎn)物進(jìn)行測(cè)序。TILLING的方法在本領(lǐng)域內(nèi)是眾所周知的(McCallum Nat Biotechnol.2000 Apr;18(4)455-7,綜述見(jiàn)Stemple 2004(TILLING--a high-throughput harvest forfunctional genomics.Nat Rev Genet.2004 Feb;5(2)145-50.))。
可以使用定點(diǎn)誘變產(chǎn)生seedyl核酸或者其部分的變體。有幾種方法實(shí)現(xiàn)定點(diǎn)誘變;最為常見(jiàn)的方法是基于PCR的方法(currentprotocols in molecular biology.Wiley Eds.http://www.4ulr.com/products/currentprotocols/index.html)。
TDNA激活、TILLING和定點(diǎn)誘變是能夠產(chǎn)生在本發(fā)明的方法中有用的新等位基因和seedyl核酸變體的技術(shù)的示例。
同源重組可以將選定的核酸引入基因組中規(guī)定的選定位置。同源重組是在生物科學(xué)中常規(guī)用于低等生物體例如酵母或苔蘚(例如劍葉蘚屬(physcomitrella))的標(biāo)準(zhǔn)技術(shù)。在植物中進(jìn)行同源重組的方法不僅僅在模式植物中有所描述(Offringa et al.Extrachromosomalhomologous recombination and gene targeting in plant cellsafter Agrobacterium-mediated transformation,1990 EMBO J.1990Oct;9(10)3077-84),而且對(duì)于作物植物,例如稻也有所描述(Terada R,Urawa H,Inagaki Y,Tsugane K,Iida S.Efficient genetargeting by homologous recombination in rice.Nat Biotechnol.2002.Iida and TeradaA tale of two integrations,transgeneand T-DNAgene targeting by homologous recombination in rice.Curr Opin Biotechnol.2004 Apr;15(2)132-8)。靶核酸不必被定向到seedyl基因的基因座,而可以引入到例如高表達(dá)的區(qū)域。靶核酸可以是用于替代內(nèi)源基因的改良的等位基因或者可以在內(nèi)源基因之外另外引入。
引入遺傳改變的優(yōu)選方法是在植物中引入和表達(dá)seedyl核酸/基因或者其一部分,或者能夠與seedyl核酸/基因雜交的序列,其中所述核酸編碼seedyl蛋白或者其同源物、衍生物或者活性片段。在本例中,遺傳改變不必位于seedyl基因的基因座中。核酸可以通過(guò)例如轉(zhuǎn)化引入植物中。
因此,本發(fā)明提供了改變植物生長(zhǎng)特征的方法,包括在植物中引入和表達(dá)seedyl核酸/基因或者其一部分,或者能夠與seedyl核酸/基因雜交的序列,其中該核酸編碼seedyl蛋白或者其同源物、衍生物或者活性片段。
有利地,還可以分別使用SEQ ID NO 1或2的變體核酸和變體氨基酸實(shí)施根據(jù)本發(fā)明的方法。術(shù)語(yǔ)seedyl核酸或者seedyl蛋白質(zhì)包括了變體核酸和變體氨基酸。變體核酸編碼如上描述的seedyl蛋白,即那些從N端到C端按照以下順序包含下列各項(xiàng)的蛋白(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,變體seedyl蛋白質(zhì)是那些從N端到C端按照以下順序包含下列各項(xiàng)的蛋白(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
在實(shí)施根據(jù)本發(fā)明的方法時(shí)有用的適宜變體核酸以及氨基酸序列包括(i)seedyl核酸/基因的部分;(ii)能夠與seedyl核酸/基因雜交的序列;(iii)seedyl核酸/基因的可變剪接變體;(iv)seedyl核酸/基因的的等位變體;(v)seedyl蛋白的同源物、衍生物以及活性片段。
變體seedyl核酸的示例是seedyl核酸的部分。可以有利地使用seedyl核酸的功能部分實(shí)施根據(jù)本發(fā)明的方法。部分指的是從原始(較大的)DNA分子制備或者來(lái)源的DNA片段,該DNA部分在引入植物中并表達(dá)后使植物具有改變的生長(zhǎng)特征,且該部分編碼如上描述的seedyl蛋白。該部分可以包含許多基因,并含有或者不含有其他控制元件或者可以含有間隔序列。可以通過(guò)在核酸中進(jìn)行一個(gè)或多個(gè)缺失和/或截短制備核酸的部分。向核酸中引入截短和缺失的技術(shù)在本領(lǐng)域內(nèi)是眾所周知的。適宜用于根據(jù)本發(fā)明方法中的核酸部分可以根據(jù)實(shí)施例部分中描述的方法,通過(guò)簡(jiǎn)單地使用待測(cè)功能的核酸部分替換實(shí)際實(shí)施例中使用的序列即可確定。
另一變體seedyl核酸的示例是能夠與如上所述的seedyl核酸(例如SEQ ID NO 1,3,5,7,9或11中的任何一個(gè)表示的seedyl核酸)雜交的序列。這些雜交序列是如上定義的seedyl蛋白的編碼序列。適宜用于根據(jù)本發(fā)明方法中的雜交序列可以根據(jù)實(shí)施例部分中描述的方法,通過(guò)簡(jiǎn)單地使用雜交序列替換實(shí)際實(shí)施例中使用的序列即可確定。
如這里使用的,術(shù)語(yǔ)“雜交”是一個(gè)過(guò)程,其中實(shí)質(zhì)上同源互補(bǔ)的核苷酸序列互相退火。雜交過(guò)程可以完全在溶液中進(jìn)行,即兩條互補(bǔ)核酸都在溶液中。分子生物學(xué)中依賴于這一過(guò)程的工具包括聚合酶鏈?zhǔn)椒磻?yīng)(PCR;以及所有基于PCR的方法),差式雜交、隨機(jī)引物延伸、核酸酶S1作圖、引物延伸、逆轉(zhuǎn)錄、cDNA合成、RNA差異顯示以及DNA序列測(cè)定。雜交過(guò)程還可以這樣進(jìn)行將互補(bǔ)核酸中的一個(gè)固定在基質(zhì)(例如磁性小珠、Sepharose小珠或者任何其他樹(shù)脂)上。分子生物學(xué)中依賴于這一過(guò)程的工具包括多聚(A+)mRNA的分離。雜交過(guò)程還可以這樣進(jìn)行將互補(bǔ)核酸中的一個(gè)固定在固相支持物,例如硝化纖維素或尼龍膜上,或者通過(guò)例如影印技術(shù)固定在例如硅質(zhì)玻璃支持物上(后者被稱為核酸陣列或者微陣列或者核酸芯片)。分子生物學(xué)中依賴于這一過(guò)程的工具包括RNA和DNA凝膠印跡分析,菌落雜交、噬菌斑雜交、原位雜交以及微陣列雜交。為了使雜交出現(xiàn),核酸分子一般通過(guò)熱或者化學(xué)方式變性以熔解雙鏈成為兩條單鏈和/或從單鏈核酸中除去發(fā)夾或者其他二級(jí)機(jī)構(gòu)。雜交的嚴(yán)謹(jǐn)性受到溫度、鹽濃度以及雜交緩沖液組成等條件的影響。用于雜交的高嚴(yán)謹(jǐn)性條件包括高溫和/或低鹽濃度(鹽包括NaCl和檸檬酸三鈉)和/或在雜交緩沖液中含有甲酰胺和/或降低雜交緩沖液中化合物例如SDS(去污劑)的濃度和/或從雜交緩沖液中除去化合物如硫酸葡聚糖或聚乙二醇(促進(jìn)分子聚集)。常規(guī)的雜交條件在例如Sambrook(2001)Molecular Cloninga laboratory manual,3rd Edition Cold Spring Harbor LaboratoryPress,CSH,New York中有描述,但是技術(shù)人員應(yīng)當(dāng)理解可以根據(jù)已知或者預(yù)期的同源性和/或核酸長(zhǎng)度設(shè)計(jì)多種不同的雜交條件。在分離與前面描述的本發(fā)明DNA序列異源的核酸時(shí)特別優(yōu)選的是足夠低的嚴(yán)謹(jǐn)性雜交條件(至少開(kāi)始是這樣的)。低嚴(yán)謹(jǐn)性條件的示例包括4-6xSSC/0.1-0.5%w/v SDS,37-45℃ 2-3小時(shí)。根據(jù)參與雜交的核酸的來(lái)源和濃度,可以使用其他嚴(yán)謹(jǐn)性條件,例如中等嚴(yán)謹(jǐn)性條件。中等嚴(yán)謹(jǐn)性條件的示例包括1-4x SSC/0.25%w/v SDS,≥45℃ 2-3小時(shí)。高嚴(yán)謹(jǐn)性條件的示例包括0.1-1x SSC/0.1%w/v SDS,60℃1-3小時(shí)。技術(shù)人員應(yīng)當(dāng)知道在雜交和漂洗過(guò)程中可以被改變的以及可能會(huì)保持或者改變嚴(yán)謹(jǐn)性條件的各種不同參數(shù)??梢詮牡偷膰?yán)謹(jǐn)性條件開(kāi)始逐漸增加直至出現(xiàn)了如上描述的雜交seedyl核酸。造成異源性的因素包括等位性、遺傳密碼的簡(jiǎn)并性以及偏好密碼子使用的差異。
變體seedyl的另一個(gè)示例是seedyl核酸/基因的可變剪接變體。還可以使用seedyl核酸的可變剪接變體實(shí)施根據(jù)本發(fā)明的方法。如這里所使用的,術(shù)語(yǔ)“可變剪接變體”包括如下核酸變體,在該變體中,內(nèi)含子和/或外顯子被選擇切除、替換或者添加。這種剪接變體可以在自然界中找到或者可以使用本領(lǐng)域眾所周知的技術(shù)人工制備。剪接變體優(yōu)選是SEQ ID NO 1,3,5,7,9或11中任何一個(gè)所表示的序列的剪接變體。適宜用于根據(jù)本發(fā)明方法中的剪接變體可以例如根據(jù)實(shí)施例部分中描述的方法,通過(guò)簡(jiǎn)單地使用剪接變體替換實(shí)際實(shí)施例中使用的序列而容易地確定。
seedyl變體的另一個(gè)示例是等位變體。便利地,還可以使用seedyl核酸的等位變體(優(yōu)選為SEQ ID NO 1,3,5,7,9或11中任何一個(gè)所表示的seedyl核酸序列的等位變體)實(shí)施根據(jù)本發(fā)明的方法。在自然界中存在等位變體且本發(fā)明的方法包括在根據(jù)本發(fā)明的方法中使用這些分離的天然等位基因。等位變體包括單核苷酸多態(tài)性(SNPs),以及小插入/缺失多態(tài)性(INDELs)。INDELs的大小通常小于100bp。在大多數(shù)生物體的天然存在的多態(tài)品系中,SNP和INDEL形成最大的一組序列變體。適宜用在根據(jù)本發(fā)明方法中的等位變體可以根據(jù)實(shí)施例部分中描述的方法,通過(guò)簡(jiǎn)單地使用等位變體替換實(shí)際實(shí)施例中使用的序列而容易地確定。
seedyl氨基酸變體的示例包括seedyl蛋白,優(yōu)選SEQ ID NO 2,4,6,8,10或12中的任何一個(gè)表示的seedyl蛋白的同源物、衍生物和活性片段。seedyl蛋白的同源物、衍生物和活性片段是那些從N端到C端按照以下順序包含以下各項(xiàng)的蛋白(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
優(yōu)選的seedyl的同源物、衍生物和活性片段具有卷曲螺旋結(jié)構(gòu)域,優(yōu)選位于蛋白的N端半部分,更優(yōu)選位于氨基酸位置25和250之間,更優(yōu)選位于位置50和150之間。卷曲螺旋結(jié)構(gòu)域通常決定了蛋白質(zhì)的折疊。
seedyl蛋白的“同源物”包括相對(duì)于所討論的未改變蛋白具有氨基酸替代、缺失和/或插入,且與其所來(lái)源的未改變蛋白相比具有相似生物學(xué)和功能活性的肽、寡肽、多肽、蛋白質(zhì)和酶。為了制備這些同源物,可以使用具有類似性質(zhì)(例如類似的疏水性、親水性、抗原性、形成或者中斷α-螺旋結(jié)構(gòu)或β-折疊結(jié)構(gòu)的傾向性)的其他氨基酸代替蛋白質(zhì)的氨基酸。保守替代表格在本領(lǐng)域內(nèi)是眾所周知的(參見(jiàn)例如Creighton(1984)Proteins.W.H.Freeman and Company)。
seedyl蛋白同源物與SEQ ID NO 2,4,6,8,10或12中的任何一個(gè)具有20%和99.99%之間數(shù)值的百分比一致性,即按照優(yōu)選度增加的順序,與未改變的蛋白具有至少20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,或50%的序列一致性或相似性(功能一致性),或者與未改變的蛋白具有至少60%的序列一致性或相似性,或者與未改變的蛋白具有至少70%的序列一致性或相似性。通常,同源物與未改變的蛋白具有至少75%或80%的序列一致性或相似性,優(yōu)選至少85%,86%,87%,88%,89%的序列一致性或相似性,更優(yōu)選與未改變的蛋白具有至少90%,91%,92%,93%,94%的序列一致性或相似性,最優(yōu)選與未改變的蛋白具有至少95%,96%,97%,98%或99%的序列一致性或相似性。百分比一致性是比較全序列得到的。適宜用于根據(jù)本發(fā)明方法中的同源物可以例如根據(jù)實(shí)施例部分中描述的方法,通過(guò)簡(jiǎn)單地使用同源序列替換實(shí)際實(shí)施例中使用的序列而容易地確定。
可以使用比對(duì)程序計(jì)算百分比一致性,本領(lǐng)域內(nèi)眾所周知這些比對(duì)程序。例如,可以使用程序GAP或者needle(EMBOSS程序包)或stretcher(EMBOSS程序包)或者比對(duì)程序X(作為Vector NTI 5.5軟件包的一個(gè)組件),使用標(biāo)準(zhǔn)的參數(shù)(例如空位罰分5,空位開(kāi)放罰分15,空位擴(kuò)展罰分6.6),計(jì)算百分比一致性。
用于搜索和鑒定seedyl同源物或者編碼seedyl同源物的DNA序列的方法在本領(lǐng)域技術(shù)人員掌握的范圍內(nèi)。這些方法包括使用本發(fā)明的SEQ ID NO 1和2或3到10提供的序列(優(yōu)選是計(jì)算機(jī)可讀形式的本發(fā)明的核酸)篩選序列數(shù)據(jù)庫(kù)。這些序列信息可以例如從公共數(shù)據(jù)庫(kù)中得到,公共數(shù)據(jù)庫(kù)包括但是不止限于Genbank(http://www.ncbi.nlm.nih.gov/web/Genbank),歐洲分子生物學(xué)實(shí)驗(yàn)室核酸數(shù)據(jù)庫(kù)(EMBL)(http://www.ebi.ac.uk/ebi-docs/embl-db.html)或者它們的版本或者M(jìn)IPS數(shù)據(jù)庫(kù)(http://mips.gsf.de/)。用于比對(duì)和比較序列的不同搜索算法和軟件在本領(lǐng)域內(nèi)是眾所周知的。這些軟件包括GAP,BESTFIT,BLAST,F(xiàn)ASTA和TFASTA。GAP使用Needleman和Wunsch(J.Mol.Biol.48443-453,1970)的算法,通過(guò)使匹配最大化,并使缺口的數(shù)目最小,找到兩個(gè)完整序列的比對(duì)。BLAST算法計(jì)算百分比序列一致性,并且對(duì)兩個(gè)序列之間的相似性進(jìn)行統(tǒng)計(jì)分析。被稱為BLAST程序的程序組有5個(gè)不同的執(zhí)行程序三個(gè)用于核苷酸序列查詢(BLASTN,BLASTX,和TBLASTX),兩個(gè)用于蛋白質(zhì)序列查詢(BLASTP和TBLASTN)(Coulson,Trends inBiotechnology76-80,1994;Birren et al.,GenomeAnalysis,1543,1997)。用于進(jìn)行BLAST分析的軟件可以從國(guó)家生物信息中心公開(kāi)獲得。
SEQ ID NO2的同源物可以在許多不同生物中找到。最近的同源物在植物界中找到。例如,從煙草(SEQ ID NO 2),稻(SEQ ID NO 4),苜蓿(medicago)(SEQ ID NO 6),甘蔗(SEQ ID NO 8),玉米(SEQ IDNO 10)以及擬南芥屬(Arabidopsis)(SEQ ID NO 12)中分離出seedyl蛋白。此外,來(lái)自其他生物體的EST已經(jīng)存放于GenBank中,例如來(lái)自葡萄(Vitis vinifera)(登錄編號(hào)CA816066),來(lái)自火炬松(Pinustaeda)(登錄編號(hào)BM903108),來(lái)自Saccharus sp.(登錄編號(hào)CA228193和CA256020),來(lái)自甜橙(Citrus sinsensis)(登錄編號(hào)CF833583),白雪花(Plumbago zeylanica)(登錄編號(hào)CB817788),來(lái)自玉米(Zea mays)(登錄編號(hào)CF637447,AW282224,CD058812,AY108162,CD059048,CF041861,AW067243),來(lái)自普通小麥(Triticum aestiyum)(CA727065,BJ264506,BJ259034),來(lái)自大麥(Hordeum vulgare)(登錄編號(hào)BU997034,CA727065,CA031127,BQ762011),來(lái)自歐洲油菜(Brassica napus)(CD817460),來(lái)自樹(shù)棉(Gossypium arboreum)(BG446106,BM360339),來(lái)自花菱草(Eschscholzia californica)(CD478368),來(lái)自歐洲山楊(Populustremula)(BU821376)和來(lái)自甜菜(Beta vulgaris)(BQ594009)的EST。隨著更多基因組的測(cè)序,將鑒定到許多其它的seedyl同源物。
確定結(jié)構(gòu)域或者基序也是本領(lǐng)域技術(shù)人員所掌握的,涉及例如計(jì)算機(jī)可讀形式的本發(fā)明的核酸,使用比對(duì)軟件程序以及使用可以公開(kāi)獲得的關(guān)于蛋白質(zhì)結(jié)構(gòu)域、保守基序和盒子的信息。蛋白質(zhì)結(jié)構(gòu)域信息在PRODOM(http://www.biochem.ucl.ac.uk/bsm/dbbrowser/jj/prodomsrchjj.html),PIR(http://pir.georgetown.edu/)或pFAM(http://pfam.wustl.edu/)數(shù)據(jù)庫(kù)中可以獲得。用于基序搜索的序列分析程序可以用于以上提到的片段、區(qū)域和保守結(jié)構(gòu)域的鑒定。優(yōu)選的計(jì)算機(jī)程序包括但是不止限于,MEME,SIGNALSCAN和GENESCAN。MEME算法(3.0版)可以在GCG程序包中找到;或者在因特網(wǎng)站點(diǎn)http://www.sdsc.edu/MEME/meme上找到。SIGNALSCAN4.0版信息可以從因特網(wǎng)站點(diǎn)http://biosci.cbs.umn.edu/software/sigscan.html上獲得。GENESCAN可以從因特網(wǎng)站點(diǎn)http://gnomic.stanford.edu/GENESCANW.html上找到。
兩種特殊形式的同源性,直向同源和平行進(jìn)化同源是用于描述基因的祖先關(guān)系的進(jìn)化概念。術(shù)語(yǔ)“平行進(jìn)化同源”涉及物種基因組內(nèi)的基因重復(fù)。術(shù)語(yǔ)“直向同源”涉及的是由于祖先關(guān)系以及不同物種的形成而致的在不同生物體中的同源基因。這里的術(shù)語(yǔ)“同源物”也包括平行進(jìn)化同源物和直向同源物。
在例如單子葉植物物種中,直向同源物可以通過(guò)進(jìn)行所謂的相互Blast搜索容易地找到。這可以通過(guò)第一Blast檢索來(lái)實(shí)現(xiàn),第一Blust檢索涉及用所討論的序列(例如SEQ ID NO1或SEQ ID NO2)對(duì)任何序列數(shù)據(jù)庫(kù)例如可以公開(kāi)獲得的NCBI數(shù)據(jù)庫(kù)(可以在http://www.ncbi.nlm.nih.gov上找到)進(jìn)行Blast搜索。如果找到稻中的直向同源物,則用所討論的序列對(duì)例如可從NCBI獲得的來(lái)自稻(Oryza sativa Nipponbare)的28,469個(gè)全長(zhǎng)cDNA克隆進(jìn)行Blast搜索。如果從核苷酸開(kāi)始,則可以使用BLASTn或tBLASTX,從蛋白質(zhì)開(kāi)始則可以使用BLASTP或TBLASTN,其中使用標(biāo)準(zhǔn)的缺省值??梢詫?duì)Blast搜索的結(jié)果進(jìn)行過(guò)濾。然后將過(guò)濾后的結(jié)果或者未過(guò)濾的結(jié)果中的全長(zhǎng)序列針對(duì)所討論序列的來(lái)源生物體的序列進(jìn)行返回Blast搜索(第二Blast搜索)。然后比較第一和第二Blast搜索的結(jié)果。如果第二Blast搜索的結(jié)果以具有最高相似性的命中形式給出seedyl核酸或蛋白,則找到直向同源物;如果生物體中的一個(gè)是煙草,則找到平化進(jìn)行同源物。對(duì)于大家族,可以使用ClustalW,接下來(lái)做鄰接樹(shù)(neighbour joining tree),以輔助觀察聚類。
根據(jù)SEQ ID NO2的seedyl蛋白的示例同源物包括SEQ ID NO 4(稻),SEQ ID NO 8(甘蔗)和SEQ ID NO 10(玉米),SEQ ID NO 6(苜蓿)以及SEQ ID NO 12(擬南芥)表示的的seedyl蛋白。SEQ IDNO 8(甘蔗)和SEQ ID NO 10(玉米)表示的蛋白只是部分的,但是本領(lǐng)域的技術(shù)人員可以使用常規(guī)技術(shù)例如cDNA文庫(kù)的菌落雜交或者使用基于特異引物和簡(jiǎn)并引物的組合的PCR,容易地確定蛋白質(zhì)及編碼cDNA的相應(yīng)全長(zhǎng)序列。
在本發(fā)明的方法中有用的另一個(gè)seedyl變體是seedyl衍生物。術(shù)語(yǔ)“衍生物”指的是與天然存在形式的蛋白質(zhì)的氨基酸序列例如SEQID NO2表示的氨基酸序列相比,可以包含天然和非天然氨基酸殘基的替代、缺失或者添加的肽、寡肽、多肽、蛋白質(zhì)和酶。seedyl蛋白的“衍生物”包括與多肽天然形式的氨基酸序列相比,可以包含天然存在的改變的、糖基化的、?;陌被釟埢蛘叻翘烊淮嬖诘陌被釟埢碾?、寡肽、多肽、蛋白質(zhì)和酶。與其來(lái)源的氨基酸序列相比,衍生物還可以包含一個(gè)或多個(gè)非氨基酸替代物,例如與氨基酸序列共價(jià)或非共價(jià)結(jié)合的報(bào)告分子或者其他配基,例如結(jié)合以促進(jìn)衍生物的檢測(cè)的報(bào)告分子,以及與天然蛋白質(zhì)的氨基酸序列有關(guān)的非天然存在的氨基酸殘基。
蛋白質(zhì)的“替代變體”是那些在氨基酸序列中至少一個(gè)殘基已被去掉并且一個(gè)不同的殘基代替它插入的蛋白質(zhì)。氨基酸替代通常是單個(gè)殘基的,但是也可以成簇出現(xiàn),這取決于對(duì)多肽施加的功能限制;插入通常是大約1到10個(gè)氨基酸殘基左右,缺失的范圍大致從1到20個(gè)殘基。優(yōu)選地,氨基酸替代包含保守氨基酸替代。
蛋白質(zhì)的“插入變體”是那些一個(gè)或多個(gè)氨基酸殘基被引入到蛋白質(zhì)中預(yù)先確定位置的蛋白。插入可以包含氨基端和/或羧基端的融合以及單個(gè)或多個(gè)氨基酸的序列內(nèi)插入。一般地,氨基酸序列內(nèi)的插入小于氨基或者羧基端的融合,其大約是1到10個(gè)殘基左右。氨基或羧基端融合蛋白或肽的示例包括在酵母雙雜交系統(tǒng)中使用的轉(zhuǎn)錄激活物的結(jié)合結(jié)構(gòu)域或激活結(jié)構(gòu)域,噬菌體外殼蛋白、(組氨酸)6標(biāo)簽、谷胱甘肽S轉(zhuǎn)移酶標(biāo)簽、蛋白A、麥芽糖結(jié)合蛋白、二氫葉酸還原酶、Tag·100表位、c-myc表位、FLAG-表位、lacZ、CMP(鈣調(diào)蛋白結(jié)合肽)、HA表位、蛋白C表位和VSV表位。
蛋白質(zhì)的“缺失變體”被表征為蛋白質(zhì)的一個(gè)或多個(gè)氨基酸被去掉。蛋白質(zhì)的氨基酸變體可以使用本領(lǐng)域內(nèi)眾所周知的肽合成技術(shù)(例如固相肽合成等)或者通過(guò)重組DNA操作容易地制備。操作DNA序列以產(chǎn)生蛋白質(zhì)的替代、插入或者缺失變體的方法是本領(lǐng)域內(nèi)眾所周知的。例如在DNA中預(yù)先確定的位置進(jìn)行替代突變的技術(shù)對(duì)于本領(lǐng)域內(nèi)的技術(shù)人員是眾所周知的,包括M13誘變、T7-Gen體外誘變(USB,Cleveland,OH)、QuickChange定點(diǎn)誘變(Stratagene,San Diego,CA)、PCR介導(dǎo)的定點(diǎn)誘變或者其他定點(diǎn)誘變方案。
在本發(fā)明的方法中有用的另一個(gè)seedyl蛋白質(zhì)/氨基酸變體是seedyl蛋白的活性片段。seedyl蛋白的“活性片段”包括seedyl蛋白的連續(xù)氨基酸殘基,這些殘基保持了與天然存在的蛋白相似的生物和/或功能活性。有用的片段是那些屬于以上所述的seedyl蛋白定義范圍內(nèi)的片段。優(yōu)選地,這些片段起始于第二或第三或更內(nèi)部的甲硫氨酸殘基之一。這些片段來(lái)自從內(nèi)部ATG密碼子開(kāi)始的蛋白質(zhì)翻譯。
為了確定保守基序的存在,使用適宜的軟件例如Align X或clustal X比對(duì)序列,用于指明保守殘基(參加例如圖3)。軟件包例如MEME3.0版也可以用于確定序列中的基序。該軟件可以在http://meme.sdsc.edu/meme/從UCSD,SDSC和NBCR獲得。可以使用軟件Coils 2.0,鑒定卷曲螺旋結(jié)構(gòu)域。該軟件可以從http://www.ch.embnet.org/software/COILS_form.html獲得。在SEQID NO 15,16,17和18表示的基序中“X”表示任何氨基酸。
根據(jù)本發(fā)明的一個(gè)優(yōu)選方面,涉及在植物或者植物部分中提高或者增加seedyl核酸的表達(dá)。使基因或者基因產(chǎn)物表達(dá)提高的方法在本領(lǐng)域中有詳細(xì)書(shū)面記載,包括例如由(強(qiáng))啟動(dòng)子驅(qū)動(dòng)的過(guò)表達(dá),及使用轉(zhuǎn)錄增強(qiáng)子或者翻譯增強(qiáng)子。如這里所使用的,術(shù)語(yǔ)”過(guò)表達(dá)“指的是附加于原來(lái)野生型表達(dá)水平上的任何形式的表達(dá)。優(yōu)選地,seedyl核酸相對(duì)于與其有效連接的啟動(dòng)子是有義的方向?;蛘呖梢酝ㄟ^(guò)植物育種技術(shù)選擇具有更好表現(xiàn)的野生型seedyl核酸的等位基因。
seedyl基因的表達(dá)可以通過(guò)對(duì)細(xì)胞提取物進(jìn)行Northern或者Southern印跡分析而研究。細(xì)胞中seedyl蛋白的水平可以通過(guò)對(duì)細(xì)胞提取物進(jìn)行Western印跡分析而研究。
根據(jù)本發(fā)明的另一個(gè)實(shí)施方案,提供了促進(jìn)可用于根據(jù)本發(fā)明的方法中的核苷酸序列引入和/或表達(dá)的遺傳構(gòu)建體和載體。因此,本發(fā)明提供了包含下列的遺傳構(gòu)建體(i)編碼如上定義的seedyl蛋白的seedyl核酸。
(ii)一個(gè)或多個(gè)能夠調(diào)控(i)的核酸表達(dá)的控制序列;以及任選地(iii)轉(zhuǎn)錄終止序列。
根據(jù)本發(fā)明的方法,這種遺傳構(gòu)建體被引入到植物或者植物部分中。
在根據(jù)本發(fā)明的方法中有用的構(gòu)建體可以使用本領(lǐng)域內(nèi)技術(shù)人員眾所周知的重組DNA技術(shù)構(gòu)建。基因構(gòu)建體可以插入到載體中,載體可以是商業(yè)化的,適于轉(zhuǎn)化植物且適于在被轉(zhuǎn)化的細(xì)胞中表達(dá)目標(biāo)基因。
遺傳構(gòu)建體可以是表達(dá)載體,其中所述的核酸與一個(gè)或多個(gè)控制序列有效連接,從而允許核酸在原核和/或真核宿主細(xì)胞中表達(dá)。
根據(jù)(i)的核酸可以是任何如上定義的seedyl核酸,優(yōu)選地是由SEQ ID NO 1,3,5,7,9或者11中任何一個(gè)表示的seedyl核酸。(ii)的控制序列優(yōu)選是種子偏好的啟動(dòng)子,例如谷醇溶蛋白(prolamin)啟動(dòng)子。
使用包含目標(biāo)序列(該序列與一個(gè)或多個(gè)控制序列(至少有啟動(dòng)子)有效連接)的載體轉(zhuǎn)化植物。術(shù)語(yǔ)“調(diào)控元件”、“控制序列”全部在這里可以互換使用,并且從廣義理解為指的是能夠使與其相連接(即有效連接)的序列表達(dá)的調(diào)控核酸。上面提到的術(shù)語(yǔ)包括了啟動(dòng)子?!皢?dòng)子”包括來(lái)自經(jīng)典真核基因組基因的轉(zhuǎn)錄調(diào)控序列(包括精確轉(zhuǎn)錄起始所需的TATA盒子,具有或者沒(méi)有CCAAT盒子序列)以及響應(yīng)于發(fā)育和/或外界刺激或者以組織特異的形式改變基因表達(dá)的其他調(diào)控元件(即上游激活序列、增強(qiáng)子和沉默子)。該術(shù)語(yǔ)還包括經(jīng)典原核基因的轉(zhuǎn)錄調(diào)控序列,其中其可以包括-35盒子序列和/或-10盒子轉(zhuǎn)錄調(diào)控序列。術(shù)語(yǔ)“調(diào)控元件”也包括合成的融合分子或者衍生物,其使核酸分子在細(xì)胞、組織或者器官中表達(dá)或者使表達(dá)激活或提高。如這里使用的,術(shù)語(yǔ)“有效連接”指的是啟動(dòng)子序列和目標(biāo)基因之間的功能性連接,這樣使啟動(dòng)子序列能夠起始目標(biāo)基因的轉(zhuǎn)錄。
便利地,可以使用任何類型的啟動(dòng)子來(lái)驅(qū)動(dòng)seedyl核酸的表達(dá)。優(yōu)選地,能夠改變seedyl基因表達(dá)的核酸與來(lái)自植物的啟動(dòng)子(優(yōu)選來(lái)自植物的組織偏好啟動(dòng)子)有效連接。如這里描述的,術(shù)語(yǔ)“組織偏好的”指的是主要在至少一種組織或者器官中表達(dá)的啟動(dòng)子。優(yōu)選地,組織偏好的啟動(dòng)子是種子偏好啟動(dòng)子或者種子特異啟動(dòng)子,更優(yōu)選是胚乳偏好啟動(dòng)子,更優(yōu)選是從編碼種子貯存蛋白的基因中分離出的啟動(dòng)子,最優(yōu)選是從谷醇溶蛋白基因中分離的啟動(dòng)子,例如SEQ ID NO 14表示的稻谷醇溶蛋白啟動(dòng)子或者與稻谷醇溶蛋白啟動(dòng)子有相似強(qiáng)度的啟動(dòng)子和/或具有相似表達(dá)模式的啟動(dòng)子??梢詫?dòng)子與報(bào)告基因偶聯(lián)并且檢查報(bào)告基因在植物組織中的功能,從而對(duì)相似強(qiáng)度和/或相似的表達(dá)模式進(jìn)行分析。一個(gè)眾所周知的報(bào)告基因是β葡糖醛酸糖苷酶,使用顯色的GUS染色呈現(xiàn)β葡糖醛酸糖苷酶在植物組織中的活性。
優(yōu)選的種子特異啟動(dòng)子和其他組織特異啟動(dòng)子的示例示于表A中,這些啟動(dòng)子或者其衍生物在實(shí)施本發(fā)明的方法中是有用的。
表A
任選地,還可以在引入植物的構(gòu)建體中使用一個(gè)或多個(gè)終止序列。術(shù)語(yǔ)“終止子”包括如下控制序列,該序列是位于轉(zhuǎn)錄單位末端的DNA序列,傳遞對(duì)初級(jí)轉(zhuǎn)錄物進(jìn)行3′加工和多聚腺苷酸化及終止轉(zhuǎn)錄的信號(hào)。其它調(diào)控元件可以包括轉(zhuǎn)錄和翻譯增強(qiáng)子。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)當(dāng)知道終止子和增強(qiáng)子序列,它們可能適用于實(shí)施本發(fā)明。這些序列是已知的或者可以被本領(lǐng)域技術(shù)人員容易地獲得。
本發(fā)明的遺傳構(gòu)建體還可以包含復(fù)制起點(diǎn)序列,這是在特定細(xì)胞類型中進(jìn)行維持和/或復(fù)制所需要的。一個(gè)示例是當(dāng)遺傳構(gòu)建體需要在細(xì)菌細(xì)胞中作為附加體遺傳元件(例如質(zhì)?;蚩滤官|(zhì)粒分子)維持時(shí)。優(yōu)選的復(fù)制起點(diǎn)包括,但是不止限于,fl-ori和colE1。
遺傳構(gòu)建體可以任選地包含選擇標(biāo)記基因。如這里使用的,術(shù)語(yǔ)“選擇標(biāo)記基因”包括如下任何賦予細(xì)胞表型的基因,其中該基因在細(xì)胞中的表達(dá)將有助于鑒定和/或篩選使用本發(fā)明的核酸構(gòu)建體轉(zhuǎn)染或者轉(zhuǎn)化的細(xì)胞。適宜的標(biāo)記可以選自賦予抗生素抗性或者除草劑抗性的標(biāo)記,引入新的代謝性狀或者允許目測(cè)篩選的標(biāo)記。選擇標(biāo)記基因的示例包括賦予抗生素抗性的基因(例如使新霉素和卡那霉素磷酸化的nptII或者使潮霉素磷酸化的hpt),賦予抗除草劑抗性的基因(例如提供對(duì)Basta的抗性的bar;提供抗草甘膦(glyphosate)抗性的aroA或者gox),或者提供代謝性狀的基因(例如使植物可以用甘露糖作為唯一碳源的manA)。可視的標(biāo)記基因?qū)е骂伾?例如β-葡糖醛酸糖苷酶,GUS),發(fā)光(例如螢光素酶)或者熒光(綠色熒光蛋白,GFP以及其衍生物)的形成。
在優(yōu)選的實(shí)施方案中,遺傳構(gòu)建體包含來(lái)自稻的谷醇溶蛋白啟動(dòng)子,其以有義方向與seedyl核酸有效連接。這種還包含終止序列的表達(dá)盒子的一個(gè)示例是SEQ ID NO 13。
根據(jù)本發(fā)明另一個(gè)實(shí)施方案,提供了制備具有改變的生長(zhǎng)特征的植物的方法,包括改變植物中seedyl核酸或者seedyl蛋白的表達(dá)和/或活性和/或水平。
根據(jù)一個(gè)特定的實(shí)施方案,本發(fā)明提供了制備具有改變的生長(zhǎng)特征的轉(zhuǎn)基因植物的方法,該方法包括(i)向植物或者植物部分中引入編碼seedyl蛋白的seedyl核酸;(ii)在促進(jìn)再生和成熟植物生長(zhǎng)的條件下培養(yǎng)植物細(xì)胞。
有利地,(i)的核酸可以是任何上面提到的seedyl核酸。
蛋白質(zhì)自身和/或核酸自身可以被直接引入植物細(xì)胞或者植物自身(包括引入組織、器官或者任何其他植物部分)。根據(jù)本發(fā)明的優(yōu)選特性,核酸優(yōu)選地通過(guò)轉(zhuǎn)化引入植物中。
如這里提到的,術(shù)語(yǔ)“轉(zhuǎn)化”包括外源多核苷酸向宿主細(xì)胞內(nèi)的轉(zhuǎn)移,而不考慮轉(zhuǎn)移所使用的方法??梢允褂帽景l(fā)明的遺傳構(gòu)建體轉(zhuǎn)化接下來(lái)能夠進(jìn)行克隆增殖(不論是通過(guò)器官發(fā)生或者胚胎發(fā)生)的植物組織,然后從轉(zhuǎn)化的植物組織再生出整株植物。根據(jù)對(duì)于所轉(zhuǎn)化的特定物種可以獲得的并且是最為適宜的克隆增殖系統(tǒng),所選擇的特定組織可以有所不同。示例性的組織靶標(biāo)包括葉盤(pán)、花粉、胚胎、子葉、下胚軸、雌配子體、愈傷組織、已有的分生組織(例如頂端分生組織、腋芽以及根分生組織),以及誘導(dǎo)的分生組織(例如子葉分生組織和下胚軸分生組織)。多核苷酸可以瞬時(shí)或者穩(wěn)定引入到宿主細(xì)胞中,并且可以以非整合形式例如作為質(zhì)粒維持。備選地并且優(yōu)選地,轉(zhuǎn)基因可以穩(wěn)定整合在宿主基因組中。然后可以以本領(lǐng)域技術(shù)人員知道的方式將產(chǎn)生的轉(zhuǎn)化植物細(xì)胞再生為轉(zhuǎn)化植物。
植物物種的轉(zhuǎn)化現(xiàn)在是相當(dāng)常規(guī)的技術(shù)。便利地,可以使用幾種轉(zhuǎn)化方法中的任何一種將目標(biāo)基因引入適宜的祖先細(xì)胞。轉(zhuǎn)化方法包括使用增加自由DNA攝取的化學(xué)藥品、脂質(zhì)體、電穿孔、將DNA直接注射到植物中,粒子槍轟擊、使用病毒或者花粉的轉(zhuǎn)化以及微粒轟擊??梢詮南铝蟹椒ㄖ羞x擇用于原生質(zhì)體的鈣/聚乙二醇方法(Krens,F(xiàn).A.et al.,1882,Nature 296,72-74;Negrutiu I.et al.,June1987,Plant Mol.Biol.8,363-373);原生質(zhì)體電穿孔(Shilto R.D.et al.,1985 Bio/Technol 3,1099-1102);向植物材料中的微注射(Crossway A.et al.,1986,Mol.Gen Genet 202,179-185);DNA或者RNA包被的粒子轟擊(Klein T.M.et al.,1987,Nature 327,70);使用(非整合的)病毒感染等。
優(yōu)選通過(guò)農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化,使用用于稻轉(zhuǎn)化的任何眾所周知的方法,例如下列中的任何一項(xiàng)中描述的方法,制備表達(dá)seedyl基因的轉(zhuǎn)基因稻植物發(fā)表的歐洲專利申請(qǐng)EP 1198985 A1,Aldemita andHodges(Planta,199,612-617,1996);Chan et al.(Plant Mol.Biol.22(3)491-506,1993),Hiei et al.(Plant J.6(2)271-282,1994),這些公開(kāi)材料在這里全部引用作為參考。就玉米轉(zhuǎn)化而言,優(yōu)選的方法是Ishida et al.(Nat.Biotechnol.1996 Jun;14(6)745-50)或Frame et al.(Plant Physiol.2002 May;129(1)13-22)描述的方法,這些公開(kāi)材料在這里全部引用作為參考。
一般在轉(zhuǎn)化之后,基于植物可表達(dá)基因(與目標(biāo)基因共轉(zhuǎn)移)所編碼的一個(gè)或多個(gè)標(biāo)記的存在,對(duì)植物細(xì)胞或者細(xì)胞分組進(jìn)行篩選,之后將轉(zhuǎn)化的材料再生為整株植物。
在DNA轉(zhuǎn)移和再生之后,可以對(duì)推斷為轉(zhuǎn)化的植物進(jìn)行研究,例如使用Southern分析,以檢查目標(biāo)基因的存在、拷貝數(shù)和/或基因組的組織結(jié)構(gòu)。備選地或者另外地,可以使用Northern和/或Western分析對(duì)新引入的DNA的表達(dá)水平進(jìn)行監(jiān)測(cè),這兩種技術(shù)對(duì)于本領(lǐng)域中具有普通技術(shù)的人員是眾所周知的。
可以使用各種不同的方法例如克隆增殖或者經(jīng)典的育種技術(shù),對(duì)再生的轉(zhuǎn)化植物進(jìn)行增殖。例如第一代(或者T1)轉(zhuǎn)化植物可以自交產(chǎn)生純合的第二代(或者T2)轉(zhuǎn)化體,T2植物再通過(guò)經(jīng)典育種技術(shù)進(jìn)行繁殖。
產(chǎn)生的轉(zhuǎn)化生物體可以采取多種形式。例如,它們可以是轉(zhuǎn)化細(xì)胞和非轉(zhuǎn)化細(xì)胞的嵌合體;克隆轉(zhuǎn)化體(例如所有細(xì)胞都被轉(zhuǎn)化而含有表達(dá)盒子);轉(zhuǎn)化和未轉(zhuǎn)化組織的嫁接物(例如在植物中,轉(zhuǎn)化的根狀莖嫁接到未轉(zhuǎn)化的接穗上)。
本發(fā)明還包括可以通過(guò)本發(fā)明的方法獲得的植物。因此本發(fā)明提供了可以通過(guò)本發(fā)明的方法獲得的植物,與野生型植物相比,該獲得的植物具有改變的生長(zhǎng)特征。
本發(fā)明顯然延及通過(guò)這里描述的任何方法產(chǎn)生的任何植物細(xì)胞或者植物以及其所有的植物部分和繁殖體。本發(fā)明還延及通過(guò)上述方法中的任何一種產(chǎn)生的原代轉(zhuǎn)化或者轉(zhuǎn)染的細(xì)胞、組織、器官或者整株的后代,唯一的要求是后代的表型和/或基因型特征與通過(guò)本發(fā)明的方法產(chǎn)生的親本中出現(xiàn)的表型和/或基因型特征相同,即具有改變的生長(zhǎng)特征。
因此本發(fā)明還包括包含如上定義的分離的seedyl核酸的宿主細(xì)胞。根據(jù)本發(fā)明優(yōu)選的宿主細(xì)胞是植物細(xì)胞或者來(lái)自昆蟲(chóng)、動(dòng)物、酵母、真菌、藻類或細(xì)菌的細(xì)胞。本發(fā)明還涉及植物的可收獲部分,例如但是不止限于種子、花、雄蕊、葉、花瓣、果實(shí)、莖、莖培養(yǎng)物、根狀莖、根、塊莖和球莖。
如這里所使用的,術(shù)語(yǔ)“植物”包括整株植物,植物的祖先和后代以及植物部分,包括種子、枝條、莖、根(包括塊莖)以及植物細(xì)胞、組織和器官。因此術(shù)語(yǔ)“植物”還包括懸浮培養(yǎng)物、胚胎、分生組織區(qū)域、愈傷組織、葉、配子體、孢子體、花粉以及小孢子。在根據(jù)本發(fā)明的方法中特別有用的植物包括屬于綠色植物界(Viridiplantae)超家族的所有植物,特別是單子葉和雙子葉植物,包括用作飼料或者草料的豆科植物、裝飾植物、食物作物、樹(shù)或者灌木,選自金合歡屬(Acacia spp.),槭樹(shù)屬(Acer spp.),獼猴桃屬(Actinidia spp.),七葉樹(shù)屬(Aesculus spp.),新西蘭貝殼杉(Agathis australis),阿馬拉合歡(Albizia amara),Alsophilatricolor,須芒草屬(Andropogon spp.),落花生屬(Arachis spp),檳榔(Areca catechu),Astelia fragrans,鷹嘴紫云英(Astragaluscicer),多小葉紅蘇木(Baikiaea plurijuga),樺木屬(Betulaspp.),蕓苔屬(Brassica spp.),木欖(Bruguiera gymnorrhiza),非洲柚木(Burkea africana),紫鉚(Butea frondosa),面包果樹(shù)(Cadaba farinose),朱纓花屬(Calliandra spp),大葉茶(Camelliasinensis),美人蕉(Canna indica),辣椒屬(Capsicum spp.),決明屬(Cassia spp.),Centroema pubescens,木瓜屬(Chaenomelesspp.),肉桂(Cinnamomum cassia),小果咖啡(Coffea arabica),Colophospermum mopane,Coronillia varia,栒子木(Cotoneasterserotina),山楂屬(Crataegus spp.),甜瓜屬(Cucumis spp.),柏木屬(Cupressus spp.),新西蘭銀蕨(Cyathea dealbata),榲桲(Cydonia oblonga),日本柳杉(Cryptomeria japonica),香茅屬(Cymbopogon spp.),新西蘭銀蕨(Cynthea dealbata),榲桲(Cydonia oblonga),黃檀(Dalbergia monetaria),大葉骨碎補(bǔ)(Davallia divaricata),山馬蝗屬(Desmodium spp.),樹(shù)蕨(Dicksonia squarosa),Diheteropogon amplectens,Dioclea spp,鐮扁豆屬(Dolichos spp.),Dorycnium rectum,塔鐘稗(Echinochloapyramidalis),Ehrartia spp.,龍爪稷(Eleusine coracana),麩屬(Eragrestis spp.),刺桐屬(Erythrina spp.),桉屬(Eucalyptusspp.),希氏假烏木(Euclea schimperi),金茅(Eulalia villosa),蕎麥屬(Fagopyrum spp.),費(fèi)約果(Feijoa sellowiana),草莓屬(Fragaria spp.),千斤拔屬(Flemingia spp),蔓露兜(Freycinetiabanksii),老鸛草(Geranium thunbergii),銀杏(Ginkgo biloba),爪哇大豆(Glycine javanica),南洋櫻屬(Gliricidia spp),陸地棉(Gossypium hirsutum),銀樺屬(Grevillea spp.),非洲紅木(Guibourtia coleosperma),巖黃芪屬(Hedysarum spp.),Hemarthiaaltissima,扭黃茅(Heteropogon contortus),大麥(Hordeumvulgare),泰國(guó)苞茅(Hyparrhenia rufa),小連翹(Hypericumerectum),Hyperthelia dissoluta,野生木藍(lán)(Indigo incamata),鳶尾屬(Iris spp.),Leptarrhena pyrolifolia,胡枝子屬(Lespediza spp.),Lettuca spp.,銀合歡(Leucaena leucocephala),Loudetia simplex,Lotonus bainesii,百脈根屬(Lotus spp.),Macrotyloma axillare,蘋(píng)果屬(Malus spp.),木薯(Manihotesculenta),紫苜蓿(Medicago sativa),水杉(Metasequoiaglyptostroboides),大蕉(Musa sapientum),煙草屬(Nicotianumspp.),驢食豆屬(Onobrychis spp.),Ornithopus spp.,稻屬(Oryzaspp.),非洲盾柱樹(shù)(Peltophorum africanum),狼尾草屬(Pennisetum spp.),鱷梨(Perseag ratissima),碧冬茄屬(Petuniaspp.),菜豆屬(Phaseolus spp.),檳榔竹(Phoenix canariensis),新西蘭劍麻(Phormium cookianum),石楠屬(Photinia spp.),白云杉(Picea glauca),松屬(Pinus spp.),碗豆(Pisum sativum),新西蘭羅漢松(Podocarpus totara),Pogonarthria fleckii,Pogonarthria squarrosa,楊屬(Populus spp.),牧豆樹(shù)(Prosopiscineraria),花旗松(Pseudotsuga menziesii),Pterolobiumstellatum,西洋梨(Pyrus communis),櫟屬(Quercus spp.),傘形花石斑木(Rhaphiolepsis umbellate),美味棒花棕(Rhopalostylissapida),火炬樹(shù)(Rhus natalensis),歐洲醋栗(Ribesgrossularia),茶藨子屬(Ribes spp.),洋槐(Robiniapseudoacacia),薔薇屬(Rosa spp.),懸鉤子屬(Rubus spp.),柳屬(Salix spp.),Schyzachyrium sanguineum,金松(Sciadopitysverticillata),北美紅杉(Sequoia sempervirens),巨杉(Sequoiadendron giganteum),兩色蜀黍(Sorghum bicolor),菠菜屬(Spinacia spp.),鼠尾草(Sporobolus fimbriatus),Stiburusalopecuroides,Stylosanthos humilis,葫蘆茶屬(Tadehagi spp),落羽杉(Taxodium distichum),阿拉伯黃背草(Themeda triandra),車軸草屬(Trifolium spp.),小麥屬(Triticum spp.),異葉鐵杉(Tsuga heterophylla),越桔屬(Vaccinium spp.),野豌豆屬(Viciaspp.),葡萄(Vitis vinifera),錐穗沃森花(Watsonia pyramidata),馬蹄蓮(Zantedeschia aethiopica),玉米(Zea mays),莧,洋薊,蘆筍,嫩莖花椰菜,孢子甘藍(lán),卷心菜,canola,胡蘿卜,花椰菜,芹菜,collard greens,亞麻,羽衣甘藍(lán),小扁豆,油籽油菜,秋葵,洋蔥,馬鈴薯,稻,大豆,草莓,甜菜,甘蔗,向日葵,番茄,南瓜,茶,樹(shù)木?;蛘?,藻類和其他非綠色植物界可以用于本發(fā)明的方法。根據(jù)本發(fā)明的優(yōu)選實(shí)施方案,植物是作物植物例如大豆、向日葵、canola、紫花苜蓿、油菜、棉花、番茄、馬鈴薯或者煙草。再優(yōu)選地,植物是單子葉植物例如甘蔗。更優(yōu)選地,植物是谷物例如稻、玉米、小麥、大麥、粟、黑麥、高粱或者燕麥。
便利地,本發(fā)明提供了改變植物生長(zhǎng)特征的方法,所述改變的生長(zhǎng)特征選自增加的產(chǎn)量、增加的生物量、改變的植物結(jié)構(gòu)(plantarchitecture)中的任何一項(xiàng)或多項(xiàng)。
再優(yōu)選地,增加的產(chǎn)量是增加的種子產(chǎn)量。
術(shù)語(yǔ)“增加的產(chǎn)量”包括在植物的一種或多種可收獲部分中生物量與相應(yīng)的野生型植物的總生物量相比增加。該術(shù)語(yǔ)還包括種子產(chǎn)量的增加,種子產(chǎn)量的增加包括相對(duì)于相應(yīng)的野生型植物而言下列各項(xiàng)的增加種子生物量(種子重量)和/或種子(飽滿的)數(shù)量和/或種子大小和/或種子體積。種子大小和/或體積的增加也可能影響種子的組成。種子產(chǎn)量的增加可能是由于花的數(shù)目和/或大小的增加所致。產(chǎn)量的增加也可能使收獲指數(shù)增加,收獲指數(shù)表示為總生物量與可收獲的部分例如種子的產(chǎn)量之比。
使用本發(fā)明的方法可以提高植物的種子產(chǎn)量,因此本發(fā)明方法特別適合應(yīng)用于作物植物,優(yōu)選為種子作物和谷物。因此,本發(fā)明的方法對(duì)于例如油菜、向日葵、豆科(例如大豆、豌豆、蠶豆)、亞麻、羽扇豆(lupinus)、canola以及谷物例如稻、玉米、小麥、大麥、粟、燕麥和黑麥等植物特別有用。
再優(yōu)選地,增加的生物量包括增加的地上植物組織生物量(在這里定為地上植物面積)。
備選地或另外,與相應(yīng)的野生型植物相比,根據(jù)本發(fā)明的植物具有增加的地上面積。
再優(yōu)選地,所述改變的植物結(jié)構(gòu)包括與相應(yīng)的野生型植物相比增加的復(fù)總狀花序數(shù)量以及增加的生物量。
本發(fā)明還涉及使用seedyl核酸和/或蛋白用于改變植物的生長(zhǎng)特征。
根據(jù)本發(fā)明的另一個(gè)方面,seedyl核酸和/或seedyl蛋白可以用于育種程序。在這種育種程序的一個(gè)示例中,鑒定可以與seedyl核酸/基因遺傳連接的DNA標(biāo)記。然后該DNA標(biāo)記可以用于育種程序,以篩選相對(duì)于相應(yīng)的野生型植物具有改變的生長(zhǎng)特征的植物。
根據(jù)本發(fā)明的方法產(chǎn)生如上面所描述的具有改變的生長(zhǎng)特征的植物。這些有利的特征還可以與其他經(jīng)濟(jì)上有益的性狀(例如其它提高產(chǎn)量的性狀,對(duì)各種不同脅迫的耐受,改變各種不同結(jié)構(gòu)特性和/或生化和/或生理特性的性狀)相組合。
現(xiàn)在參考以下的附圖對(duì)本發(fā)明進(jìn)行描述,其中圖1示意表示了入口克隆,在pDONR201骨架中于用于Gateway克隆的AttL1和AttL2位點(diǎn)內(nèi)含有CDS0689。CDS0689是煙草(Nicotiana tabacum)BY2 CDS0689 seedyl編碼序列的內(nèi)部代碼。該載體還含有細(xì)菌的卡那霉素抗性盒子以及細(xì)菌的復(fù)制起點(diǎn)。
圖2是用于在稻(Oryza satiua)中表達(dá)煙草BY2 seedyl基因(CDS0689)的二元載體的圖譜,所述基因在稻的谷醇溶蛋白R(shí)P6啟動(dòng)子(PRO0090)控制下。該載體含有來(lái)自Ti質(zhì)粒的T-DNA,該T-DNA由左邊界(LB重復(fù),LB Ti C58)和右邊界(RB重復(fù),RB Ti C58)限定。從左邊界到右邊界,該T-DNA含有用于抗生素篩選轉(zhuǎn)化植物的可選擇標(biāo)記盒子;用于目測(cè)篩選轉(zhuǎn)化植物的可篩選標(biāo)記盒子;用于表達(dá)煙草BY2 seedyl基因(CDS0689)的PRO0090-CDS0689-玉米醇溶蛋白和rbcS-deltaGA雙終止子盒子。該載體還含有來(lái)自pBR322的復(fù)制起點(diǎn)用于細(xì)菌復(fù)制,以及含有選擇標(biāo)記(Spe/SmeR)用于使用壯觀霉素和鏈霉素對(duì)細(xì)菌進(jìn)行篩選。
圖3顯示了seedyl氨基酸和從EST推導(dǎo)出來(lái)的氨基酸(均來(lái)自植物)的N端和C端比對(duì)。使用VNTI軟件包的Align X程序進(jìn)行該比對(duì)。用條指示基序1,2,3和4。
圖4顯示了根據(jù)本發(fā)明的核酸、蛋白和基序的序列。
實(shí)施例現(xiàn)在參考以下的實(shí)施例對(duì)本發(fā)明進(jìn)行描述,實(shí)施例僅僅用于舉例說(shuō)明。
除非有其他說(shuō)明,否則根據(jù)Sambrook(2001)Molecular Cloninga laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York;或者Ausubel et al.(1988),CurrentProtocols in Molecular Biology,Current Protocols中卷1和2中描述的標(biāo)準(zhǔn)實(shí)驗(yàn)方案實(shí)施重組DNA技術(shù)。用于植物分子工作的標(biāo)準(zhǔn)材料和方法在R.D.D.Croy所著,BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的PlantMolecular Biology Labfase(1993)中有描述。
實(shí)施例1seedyl編碼基因的克隆對(duì)同步化的煙草BY2細(xì)胞培養(yǎng)物(Nicotiana tabacum L.cv.Bright Yellow-2)進(jìn)行cDNA-AFLP,鑒定了受到細(xì)胞周期調(diào)節(jié)的BY2已表達(dá)序列標(biāo)簽并且選出進(jìn)行進(jìn)一步克隆。接下來(lái)使用這些已表達(dá)序列標(biāo)簽篩選煙草cDNA文庫(kù),分離全長(zhǎng)的目標(biāo)cDNA,即編碼本發(fā)明seedyl蛋白的cDNA(CDS0689)。
BY2細(xì)胞的同步化按照下面的方法使用蚜棲菌素將細(xì)胞阻斷在早S期,從而使煙草BY2(Nicotiana tabacum L.cv.Bright Yellow-2)培養(yǎng)細(xì)胞懸液同步化。根據(jù)描述(Nagata et al.Int.Rev.Cytol.132,1-30,1992)的方法維持培養(yǎng)的Nicotiana tabacum L.cv.Bright Yellow-2細(xì)胞懸液。將7日齡的靜置培養(yǎng)物用添加蚜棲菌素(Sigma-Aldrich,St.Louis,MO;5mg/l)的新鮮培養(yǎng)基10倍稀釋,由此進(jìn)行同步化,蚜棲菌素是DNA聚合酶α的抑制藥物。24小時(shí)后,使用新鮮培養(yǎng)基洗幾次以解除對(duì)細(xì)胞的阻斷,并使細(xì)胞繼續(xù)它們的細(xì)胞周期進(jìn)程。
RNA提取和cDNA合成使用LiCl沉淀(Sambrook et al,2001)制備總DNA,使用Oligotex柱(Qiagen,Hilden,Germany)根據(jù)生產(chǎn)商的說(shuō)明從500mg的總RNA中提取poly(A+)RNA。使用生物素化的oligo-dT25引物(Genset,Paris,F(xiàn)rance)和SuperscriptII(Life Technologies,Gaithersburg,MD),通過(guò)逆轉(zhuǎn)錄從1mg的poly(A+)RNA合成第一鏈cDNA。使用大腸桿菌連結(jié)酶(Life Technologies)和DNA聚合酶I(USB,Cleveland,OH)以及RNAse-H(USB)進(jìn)行鏈置換,以進(jìn)行第二鏈的合成。
cDNA-AFLP分析500ng的雙鏈cDNA用于根據(jù)描述(Vos et al.,Nucleic Acids Res.23(21)4407-4414,1995;Bachem et al.,Plant J.9(5)745-53,1996)進(jìn)行AFLP分析。使用的限制酶是BstYI和MseI(Biolabs),消化分兩步進(jìn)行。在使用一個(gè)酶進(jìn)行第一次限制消化后,3′末端片段利用其生物素化的尾巴收集在Dyna小珠(Dynal,Oslo,Norway)上,而其他的片段被洗掉。使用第二個(gè)酶消化之后,收集釋放的限制片段用作接下來(lái)的AFLP步驟中的模板。使用無(wú)選擇性核苷酸的MseI引物與最3′端核苷酸是T或者C的BstYI引物組合進(jìn)行預(yù)擴(kuò)增。PCR的條件如以前的描述(Vos et al.,1995)。得到的擴(kuò)增混合物稀釋600倍,取5ml使用P33標(biāo)記的BstYI引物和Amplitaq-Gold聚合酶(RocheDiagnostics,Brussels,Belgium)進(jìn)行選擇性擴(kuò)增。擴(kuò)增產(chǎn)物使用Sequigel系統(tǒng)(Biorad)在5%聚丙烯酰胺凝膠上分離。干燥的凝膠對(duì)Kodak Biomax底片進(jìn)行曝光,并且用phospholmager(AmershamPharmacia Biotech,Little Chalfont,UK)掃描。
AFLP片段的表征從凝膠中分離對(duì)應(yīng)于差異表達(dá)的轉(zhuǎn)錄物的條帶(其中的(部分)轉(zhuǎn)錄物對(duì)應(yīng)CDSO689),洗脫的DNA在與選擇性擴(kuò)增的相同條件下進(jìn)行再擴(kuò)增。使用選擇性BstYI引物或者將片段克隆到pGEM-Teasy(Promega,Madison,WI)中后對(duì)再擴(kuò)增的聚合酶鏈?zhǔn)椒磻?yīng)產(chǎn)物進(jìn)行直接測(cè)序,或者對(duì)單個(gè)的克隆進(jìn)行測(cè)序,獲得序列信息。使用BLSAT序列比對(duì)(Altschul et al.,Nucleic Acids Res.25(17)3389-3402 1997)將獲得的序列與公眾可以獲得的數(shù)據(jù)庫(kù)中的核苷酸和蛋白質(zhì)序列進(jìn)行比較。在可以獲得的情況下,用更長(zhǎng)的EST或者分離的cDNA序列代替標(biāo)簽序列以提高找到顯著同源性的機(jī)會(huì)。接下來(lái)從商品化煙草cDNA文庫(kù)中擴(kuò)增出對(duì)應(yīng)于CDS0689的物理cDNA克隆,操作如下。
煙草CDS0689 seedyl基因(CDS0689)的克隆使用從正在活躍分裂中的未同步化的BY2煙草細(xì)胞中分離的poly(A+)RNA制備平均插入物為1400bp的cDNA文庫(kù)。這些文庫(kù)插入物克隆到包含attB gateway盒子(Life Technologies)的載體pCMVSPORT6.0中。從該文庫(kù)中選出46000個(gè)克隆,排列于384孔微量滴定板中,接下來(lái)一式兩份點(diǎn)樣在尼龍濾膜上。使用幾百個(gè)放射性標(biāo)記的標(biāo)簽的混合物作為探針(其中BY2-標(biāo)簽對(duì)應(yīng)于CDS0689序列)篩選排列的克隆。分離陽(yáng)性克隆(其中與BY2-標(biāo)簽反應(yīng)的克隆對(duì)應(yīng)于CDS0689序列)、測(cè)序并且與標(biāo)簽序列比對(duì)?;蛘?,如果與標(biāo)簽雜交失敗,則按照下述通過(guò)PCR擴(kuò)增篩選對(duì)應(yīng)于標(biāo)簽的全長(zhǎng)cDNA。使用primer3程序(http://www-genome.wi.mit.edu/genome_software/other/primer3.html)設(shè)計(jì)標(biāo)簽特異的引物,并且與通用載體引物組合擴(kuò)增出部分cDNA插入物。來(lái)自50.000,100.000,150.000,和300.000個(gè)cDNA克隆的DNA混合物用作PCR擴(kuò)增的模板。從瓊脂糖凝膠中分離擴(kuò)增產(chǎn)物,克隆、測(cè)序并且與標(biāo)簽進(jìn)行比對(duì)。按照以上的描述得到的包含CDS0689序列的載體,被稱為入口克隆(entryclone)。
實(shí)施例2具有PRO0090-CDS0689盒子的用于轉(zhuǎn)化的載體構(gòu)建體接下來(lái)用入口克隆與p0830進(jìn)行GatewayTMLR反應(yīng),p0830是用于稻轉(zhuǎn)化的目的載體。該載體在T-DNA邊界內(nèi)含有如下功能性元件植物選擇標(biāo)記;植物篩選標(biāo)記;以及用于與已經(jīng)克隆在入口克隆中的目標(biāo)序列進(jìn)行LR體內(nèi)重組的Gateway盒子。用于胚乳特異表達(dá)的稻谷醇溶蛋白R(shí)P6啟動(dòng)子(PRO0090)位于該Gateway盒子的上游。
在LR重組步驟后,產(chǎn)生的如圖2所示的表達(dá)載體轉(zhuǎn)化到農(nóng)桿菌中,接下來(lái)轉(zhuǎn)化到稻植物中。使轉(zhuǎn)化的稻植物生長(zhǎng)并且檢查如實(shí)施例3中描述的各種不同的參數(shù)。
實(shí)施例3對(duì)使用谷醇溶蛋白::seedyl(PRO0090-CDS0689)轉(zhuǎn)化的稻植物進(jìn)行評(píng)價(jià)以及結(jié)果產(chǎn)生了大約15到20株獨(dú)立的T0稻轉(zhuǎn)化體。將初級(jí)轉(zhuǎn)化體從組織培養(yǎng)室中轉(zhuǎn)移至溫室進(jìn)行生長(zhǎng),收獲T1種子。保留四個(gè)轉(zhuǎn)化事件(其中的T1后代中轉(zhuǎn)基因的存在/不存在按照3∶1的比例分離)。對(duì)于這些事件中的每一個(gè),通過(guò)監(jiān)測(cè)篩選標(biāo)記的表達(dá)選擇大約10株含有轉(zhuǎn)基因(雜合子和純合子)的T1幼苗以及大約10株沒(méi)有轉(zhuǎn)基因(零合子(nullizygote))的T1幼苗。
選擇在T1中已具有改進(jìn)農(nóng)藝參數(shù)的兩個(gè)事件(每個(gè)事件60株植物,30株是轉(zhuǎn)基因陽(yáng)性,30株是轉(zhuǎn)基因陰性)在T2中進(jìn)行重新評(píng)價(jià)。T1和T2植物轉(zhuǎn)移到溫室中,對(duì)營(yíng)養(yǎng)生長(zhǎng)參數(shù)和種子參數(shù)進(jìn)行評(píng)價(jià),見(jiàn)如下描述。
統(tǒng)計(jì)分析t檢驗(yàn)和F檢驗(yàn)雙因子ANOVA(方差分析)用作統(tǒng)計(jì)模型,對(duì)植物的表型特征進(jìn)行整體評(píng)價(jià)。對(duì)于使用目標(biāo)基因轉(zhuǎn)化的所有事件的所有植物,對(duì)所有測(cè)定的參數(shù)進(jìn)行F檢驗(yàn)。進(jìn)行F檢驗(yàn)以檢查基因?qū)θ哭D(zhuǎn)化事件的影響并且確定基因的整體影響或者”整體基因影響“。由F檢驗(yàn)的數(shù)值確定的顯著性數(shù)據(jù)表明”基因“的影響,意味著觀察到的表型不僅僅由基因的存在或者位置導(dǎo)致。對(duì)于F檢驗(yàn)而言,整體基因影響的顯著性閾值設(shè)定在5%可能性水平。
營(yíng)養(yǎng)生長(zhǎng)測(cè)定選擇的轉(zhuǎn)基因植物生長(zhǎng)在溫室中。給每株植物予獨(dú)特的條碼標(biāo)記,使表型數(shù)據(jù)與相應(yīng)的植物清楚地相互聯(lián)系起來(lái)。選擇的轉(zhuǎn)基因植物在10cm直徑的小盆中在以下的環(huán)境設(shè)置條件下生長(zhǎng)于土壤中光周期=11.5小時(shí),日光強(qiáng)度=300001ux或者更高,日間溫度=28℃或更高,夜間溫度=22℃,相對(duì)濕度=60-70%。轉(zhuǎn)基因植物和對(duì)應(yīng)的零合子在隨機(jī)的位置并肩生長(zhǎng)。從播種階段直至成熟階段每株植物幾次通過(guò)數(shù)碼成像間并且照相。每個(gè)時(shí)間點(diǎn)從至少6個(gè)不同角度對(duì)每株植物進(jìn)行數(shù)碼成像(2048×1536像素,16萬(wàn)色)。以下描述的參數(shù)是使用圖像分析軟件從所有植物的所有數(shù)字圖像中自動(dòng)產(chǎn)生的。
(a)地上植物面積通過(guò)計(jì)數(shù)區(qū)別于背景的地上植物部分的像素的總數(shù),確定植物的地上面積。針對(duì)在同一時(shí)刻從不同角度拍攝的照片,對(duì)該數(shù)值進(jìn)行平均,通過(guò)標(biāo)化將其轉(zhuǎn)化為用平方毫米表示的物理面積數(shù)值。實(shí)驗(yàn)顯示用這種方法測(cè)定的地上植物面積與植物地上部分的生物量是相關(guān)的。
(b)原發(fā)復(fù)總狀花序(primary panicles)的數(shù)目手工計(jì)數(shù)最高的復(fù)總狀花序以及在垂直比對(duì)時(shí)與最高的復(fù)總狀花序重合的所有復(fù)總狀花序,將其作為原發(fā)復(fù)總狀花序。
與種子相關(guān)的參數(shù)的測(cè)定將T1和T2植物的成熟的初級(jí)復(fù)總狀花序收獲、裝袋、條碼標(biāo)記,然后在烤箱中37℃干燥3天。然后使復(fù)總狀花序脫粒,收集所有的種子并且計(jì)數(shù)。使用鼓風(fēng)裝置將飽滿的谷殼與空的谷殼分開(kāi)。棄掉空的谷殼,對(duì)剩余的級(jí)分再次計(jì)數(shù)。在分析天平上對(duì)飽滿的谷殼稱重。這個(gè)步驟產(chǎn)生了下述的一組與種子相關(guān)的參數(shù)。
(c)飽滿種子的數(shù)目通過(guò)計(jì)數(shù)分離步驟后剩余的飽滿的谷殼,確定飽滿種子的數(shù)目。
(d)每株植物總的種子產(chǎn)量對(duì)從植物收獲的所有飽滿的谷殼進(jìn)行稱重,測(cè)定總的種子產(chǎn)量。
結(jié)果顯示了轉(zhuǎn)基因品系的陽(yáng)性植物和相應(yīng)零合子(陰性)植物的%差異。在表1到4中給出的數(shù)值表示的是兩株T1品系的平均值和兩株T2品系的平均值。
表1seedyl轉(zhuǎn)基因T1和T2植物的地上面積的表型數(shù)據(jù)概況
表2seedyl轉(zhuǎn)基因T1和T2植物的第一級(jí)復(fù)總狀花序數(shù)目的表型數(shù)據(jù)概況
表3seedyl轉(zhuǎn)基因T1和T2植物的飽滿種子數(shù)目的表型數(shù)據(jù)概況
表4seedyl轉(zhuǎn)基因T1和T2植物的每株植物種子總重量的表型數(shù)據(jù)概況
序列表<110>CropDesign N.V.
<120>具有改變的生長(zhǎng)特征的植物及其制備方法<130>CD-105-PCT<150>US 60/528,113<151>2003-12-09<150>EP 03104280.7<151>2003-11-19<160>18<170>PatentIn version 3.3<210>1<211>1428<212>DNA<213>煙草<220>
<221>misc_feature<223>seedyl編碼序列(CDS0689)<400>1atgagtgtgt tacaataccc agaagggatt gacccagcag atgttcagat atggaacaat 60gcagcatttg ataatggaga ttctgaagat ttgtcttcgc tgaaacgttc ttggtctcct 120ctgaaacccc tttcggttag gccatcagat tcctttgaat ctgatttgtc aagtaaggaa 180aatcaaactc ctttatttga gaattcatct gttaatctct catctccgtt acccataaag 240ccacttaacc ctaatggggc tctggaaaat tcaagactca agccgaacaa gcccaattcc 300aaacagagtc ttgatgagat ggcggctaga aagagcggaa agggaaatga tttccgtgat 360gagaagaaaa tagacgagga aattgaagaa attcagatgg agattagtag gttgagttca 420agattagagg ctttgagaat tgaaaaggct gagaaaactg ttgctaagac tgttgaaaag 480cgaggaaggg ttgtggcagc aaagtttatg gagccaaaac aaagtgttat taagattgaa 540gagcgtatat caatgagtgc aagaacaaag gtggagcaga gaaggggtct tagtttagga 600ccatctgaga tttttactgg aacgcggcgg cgagggttga gtatggggcc atcagatatt 660ctagcaggga caacaaaggc acggcaattg ggaaagcaag agatgattat tactcctatt 720cagccaatac aaaacaggcg aaagtcgtgt ttttggaagc ttcaagagat tgaagaagag 780ggaaaaagtt caagccttag tcctaaatca agaaaaactg ctgcaagaac aatggttaca 840acaaggcagg cagttactac aattgcatca aagaagaatt tgaaaaaaga tgatggactt 900ttgagttcag ttcagccaaa gaagttgttt aaagatctcg aaaagtctgc tgctgctaat 960aagaagcccc agaggccggg gagggttgtg gctagtaggt ataatcagag tacaattcag 1020tcatcagtag tgagaaagag gtctttacct gaaaatgata aggatgagag taagagaaat 1080gataagaaac ggtcgttatc tgtagggaaa acgcgtgtgt ctcaaactga gagcaagaat 1140ttgggtactg aaagtagggt gaaaaagaga tgggaaattc ctagtgagat tgtagttcat 1200ggaaacacag agagtgagaa atctccacta agcattattg tgaagcctga tttgcttccg 1260cgaattagga ttgctcggtg tgtgaatgag actcttaggg attctggacc tgctaaaaga 1320atgatagagt tgataggcaa gaaatcgttt ttcagtagtg atgaagataa ggagccacct 1380gtctgtcaag ttttaagttt tgcagaggaa gatgctgaag aggaataa 1428<210>2<211>475<212>PRT<213>煙草
<220>
<221>MISC_FEATURE<223>seedyl蛋白(CDS0689)<400>2Met Ser Val Leu Gln Tyr Pro Glu Gly Ile Asp Pro Ala Asp Val Gln1 5 10 15Ile Trp Asn Asn Ala Ala Phe Asp Asn Gly Asp Ser Glu Asp Leu Ser20 25 30Ser Leu Lys Arg Ser Trp Ser Pro Leu Lys Pro Leu Ser Val Arg Pro35 40 45Ser Asp Ser Phe Glu Ser Asp Leu Ser Ser Lys Glu Asn Gln Thr Pro50 55 60Leu Phe Glu Asn Ser Ser Val Asn Leu Ser Ser Pro Leu Pro Ile Lys65 70 75 80Pro Leu Asn Pro Asn Gly Ala Leu Glu Asn Ser Arg Leu Lys Pro Asn85 90 95Lys Pro Asn Ser Lys Gln Ser Leu Asp Glu Met Ala Ala Arg Lys Ser100 105 110Gly Lys Gly Asn Asp Phe Arg Asp Glu Lys Lys Ile Asp Glu Glu Ile115 120 125Glu Glu Ile Gln Met Glu Ile Ser Arg Leu Ser Ser Arg Leu Glu Ala130 135 140Leu Arg Ile Glu Lys Ala Glu Lys Thr Val Ala Lys Thr Val Glu Lys145 150 155 160Arg Gly Arg Val Val Ala Ala Lys Phe Met Glu Pro Lys Gln Ser Val165 170 175Ile Lys Ile Glu Glu Arg Ile Ser Met Ser Ala Arg Thr Lys Val Glu180 185 190Gln Arg Arg Gly Leu Ser Leu Gly Pro Ser Glu Ile Phe Thr Gly Thr195 200 205Arg Arg Arg Gly Leu Ser Met Gly Pro Ser Asp Ile Leu Ala Gly Thr210 215 220Thr Lys Ala Arg Gln Leu Gly Lys Gln Glu Met Ile Ile Thr Pro Ile225 230 235 240Gln Pro Ile Gln Asn Arg Arg Lys Ser Cys Phe Trp Lys Leu Gln Glu245 250 255Ile Glu Glu Glu Gly Lys Ser Ser Ser Leu Ser Pro Lys Ser Arg Lys260 265 270Thr Ala Ala Arg Thr Met Val Thr Thr Arg Gln Ala Val Thr Thr Ile275 280 285
Ala Ser Lys Lys Asn Leu Lys Lys Asp Asp Gly Leu Leu Ser Ser Val290 295 300Gln Pro Lys Lys Leu Phe Lys Asp Leu Glu Lys Ser Ala Ala Ala Asn305 310 315 320Lys Lys Pro Gln Arg Pro Gly Arg Val Val Ala Ser Arg Tyr Asn Gln325 330 335Ser Thr Ile Gln Ser Ser Val Val Arg Lys Arg Ser Leu Pro Glu Asn340 345 350Asp Lys Asp Glu Ser Lys Arg Asn Asp Lys Lys Arg Ser Leu Ser Val355 360 365Gly Lys Thr Arg Val Ser Gln Thr Glu Ser Lys Asn Leu Gly Thr Glu370 375 380Ser Arg Val Lys Lys Arg Trp Glu Ile Pro Ser Glu Ile Val Val His385 390 395 400Gly Asn Thr Glu Ser Glu Lys Ser Pro Leu Ser Ile Ile Val Lys Pro405 410 415Asp Leu Leu Pro Arg Ile Arg Ile Ala Arg Cys Val Asn Glu Thr Leu420 425 430Arg Asp Ser Gly Pro Ala Lys Arg Met Ile Glu Leu Ile Gly Lys Lys435 440 445Ser Phe Phe Ser Ser Asp Glu Asp Lys Glu Pro Pro Val Cys Gln Val450 455 460Leu Ser Phe Ala Glu Glu Asp Ala Glu Glu Glu465 470 475<210>3<211>1336<212>DNA<213>稻<220>
<221>misc_feature<223>seedyl編碼序列<400>3atggaggagg acccgctcat cccgctggtc cacgtctgga acaacgccgc cttcgacgac 60tcctcgtgtt ccagatcggc ttggctcccc caaagccccg ccgtcgcggc cgtccgcaag 120ggcgacaagg agaatcaccg ccccgaggtt gttgatgtcg ccgccggcta cgacgtcgag 180gccgagatcg gccacatcga ggcggagatc ctgcgcctct cgtcccggct ccaccatctc 240cgcgtctcca agcagccgga gcccaaccgc gacgacgctc cgatggggga gatggtcgcg 300aaggtgaggc cccggccgag gggcctcagc ctcgggcccc tggatgtgat ctccatcgtc 360aatcgtgaga agcatccgct gcgcaccaag cagcctccgg cgacgcgggg cagggggctc 420agcctcgggc ccatggagat cgccgcggcg aaccctaggg tgcccgcggc ggcgcagcat 480cagcaacagc aacgcgctgg cacggcgcgg atcctgaagc caatcaagga gcctccggtg 540cagcgtcgca ggggcgtcag cctcgggccg ttggagatcc accacggcgt cggcagcaag 600gcaccagcgg cggcgcgagc caagccgttc accaccaagc tcaacgccat tcgagaagaa 660acccgaccct ccaagcaatt cgccgtcccc gccaagccat ggccgtcgag caatacaagg 720cagacactgg actcgaggca aggaacagca gcaagtcgag cgaaggcgag gagcccgagc 780
cccaggccca ggaggcaatc caatggcaag gctactgaca caaggggagg caacaaggtg 840gtggatgagc tcaagcccaa aggtgcgtcg tcaagtcaga gcggcagcgc cgccgccgcc 900gccactgcca agaggatggc ggggagctcc aagatgaggg tcatcccgag ccgctacagc 960ctcactcctg gcgcttccct tggaagcagt ggagcacagg agaggcgacg caagcagtct 1020ctcccaggat catcagggga tgcgaaccag aatgaggaaa tcagagcgaa ggtcatcgag 1080ccttccaatg atccactctc tcctcaaacg atctccaagg ttgctgaaat gctcccaaag 1140atcaggacca tgccgcctcc tgacgagagc cctcgcgatt ccggatgcgc caagcgggtt 1200gccgaattgg tcgggaagcg ctcgttcttc acggctgcag ccgaggacgg gcgggcgctc 1260gacgtcgaag cacccgaggc ggtcgcagaa gcttgagatg aaccaccatg gtttgatccg 1320ttccttccat cagctc 1336<210>4<211>431<212>PRT<213>稻<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>4Met Glu Glu Asp Pro Leu Ile Pro Leu Val His Val Trp Asn Asn Ala1 5 10 15Ala Phe Asp Asp Ser Ser Cys Ser Arg Ser Ala Trp Leu Pro Gln Ser20 25 30Pro Ala Val Ala Ala Val Arg Lys Gly Asp Lys Glu Asn His Arg Pro35 40 45Glu Val Val Asp Val Ala Ala Gly Tyr Asp Val Glu Ala Glu Ile Gly50 55 60His Ile Glu Ala Glu Ile Leu Arg Leu Ser Ser Arg Leu His His Leu65 70 75 80Arg Val Ser Lys Gln Pro Glu Pro Asn Arg Asp Asp Ala Pro Met Gly85 90 95Glu Met Val Ala Lys Val Arg Pro Arg Pro Arg Gly Leu Ser Leu Gly100 105 110Pro Leu Asp Val Ile Ser Ile Val Asn Arg Glu Lys His Pro Leu Arg115 120 125Thr Lys Gln Pro Pro Ala Thr Arg Gly Arg Gly Leu Ser Leu Gly Pro130 135 140Met Glu Ile Ala Ala Ala Asn Pro Arg Val Pro Ala Ala Ala Gln His145 150 155 160Gln Gln Gln Gln Arg Ala Gly Thr Ala Arg Ile Leu Lys Pro Ile Lys165 170 175Glu Pro Pro Val Gln Arg Arg Arg Gly Val Ser Leu Gly Pro Leu Glu180 185 190Ile His His Gly Val Gly Ser Lys Ala Pro Ala Ala Ala Arg Ala Lys195 200 205
Pro Phe Thr Thr Lys Leu Asn Ala Ile Arg Glu Glu Thr Arg Pro Ser210 215 220Lys Gln Phe Ala Val Pro Ala Lys Pro Trp Pro Ser Ser Asn Thr Arg225 230 235 240Gln Thr Leu Asp Ser Arg Gln Gly Thr Ala Ala Ser Arg Ala Lys Ala245 250 255Arg Ser Pro Ser Pro Arg Pro Arg Arg Gln Ser Asn Gly Lys Ala Thr260 265 270Asp Thr Arg Gly Gly Asn Lys Val Val Asp Glu Leu Lys Pro Lys Gly275 280 285Ala Ser Ser Ser Gln Ser Gly Ser Ala Ala Ala Ala Ala Thr Ala Lys290 295 300Arg Met Ala Gly Ser Ser Lys Met Arg Val Ile Pro Ser Arg Tyr Ser305 310 315 320Leu Thr Pro Gly Ala Ser Leu Gly Ser Ser Gly Ala Gln Glu Arg Arg325 330 335Arg Lys Gln Ser Leu Pro Gly Ser Ser Gly Asp Ala Asn Gln Asn Glu340 345 350Glu Ile Arg Ala Lys Val Ile Glu Pro Ser Asn Asp Pro Leu Ser Pro355 360 365Gln Thr Ile Ser Lys Val Ala Glu Met Leu Pro Lys Ile Arg Thr Met370 375 380Pro Pro Pro Asp Glu Ser Pro Arg Asp Ser Gly Cys Ala Lys Arg Val385 390 395 400Ala Glu Leu Val Gly Lys Arg Ser Phe Phe Thr Ala Ala Ala Glu Asp405 410 415Gly Arg Ala Leu Asp Val Glu Ala Pro Glu Ala Val Ala Glu Ala420 425 430<210>5<211>1860<212>DNA<213>Medicago trunculata<220>
<221>misc_feature<223>seedyl編碼序列<400>5aaaaacgtta aggactaaaa atataataaa atttaagtag ggattcataa tggaagcacc 60cctatttaca gggatcttaa atataattaa ccctaatatt tatgacagaa acccttttga 120aatcacatcg gagcgtgtat gagtagccgt ttcacatcca acggccagta agagcgtaac 180tttatttctt ccctcttcaa tctccaacgg tcacataatc tcttccaaat acaaataatt 240ccctctttca acctcactct tcatttcttc aacccaaacc caaaaaacta atcagattct 300tcttaaatct tgaaaccttt ctcccaaaag cacttaaata aaaaagcact taaccatgaa 360
taacacaaac aacaacaaca ttcttcttca ttccacacag gttcaagtgt ggaacaacgc 420agcattcgat ggtgaagatt tcgccatgaa ttcatcttct gattccatca aagagaatct 480aaacccatcc gcattcaaca ttgttccttc ttcaaacaaa agaactattg atgatgaaat 540tgcggaaatt gaaagtgaaa ttaagcgatt aacttcgaag ctggaattgc ttcgtgttga 600aaaagctgaa agaaaaatcg cttctgaaaa gcgtgttagt ggaattggta ctggaagaat 660agtagcagcg aagtttatgg aaccgaagaa aaacgttaca ccgaaacgaa acggtgtcgt 720tttcaaggag gagacaccga aacgaaacgg tgtcgtttcg gatacgccga aatctagggt 780taattggaga agagggatga gtttaggtcc gatggagatt gccgggaaag tgatggcacc 840gccggcgatg acgattactc cggcgacggt gaatcggagg aagtcttgtt tctggaaacc 900gcaggaaagt tgtgaagtaa tgccgtcggg gattactccg gcgacggtga ataggaggaa 960atcttgtttt ttgaaacctc aagaaagttg tgaagaaaat cgaagaaaaa cgatttgcaa 1020accgaatttg aatttgaatt caaattcagt taattctgcg gttggatcga ttaagcgtgt 1080gaagaagaaa gatgaagaaa ttgctcaggt tcaaccgaag aagctgtttg aaggtgaaaa 1140atcagtgaag aaatcgttga aacaaggtag aattgttgca agccggtata attccggtgg 1200tggtggtggt gatgcgagga aaagatcgtt ttcggagaat aataagggtt tagggagtga 1260aatcagggct aagaagagat gggagatacc aattgaagaa gtggatgtga gtggttttgt 1320tatgttaccg aagatttcga caatgaggtt tgttgatgag agtcctagag attctggtgc 1380tgttaaaaga gttgctgaat tgaatggaaa aagatcttac ttttgtgatg aagatgagga 1440ggagagagtg atggtggagg aagaaggtgg ttctgtttgt caggttttga attttgctga 1500agatgatgat gatgatgatg attatggtga acaagggtaa ttgtggaaat tggaattgat 1560ttgtttttgt ggggttgtgt ggaactggct atgttctgct tgattctttt gcattttggt 1620gtgaaactaa agatgaggtg aaaagtttat gcttgttaaa ttggattggt ttatatgttt 1680tgaaataata acaacaagca tgtgtcttgc ttaataattg tatattgttt tgtttgtttt 1740ataatgatat ggatttaatt tgtatacaca atataatata gtatgcattg agagagtttt 1800tcgttcagta ttcattctga ttttagtgtt tatctcattc tagaagattg tattttgttg 1860<210>6<211>394<212>PRT<213>Medicago trunculata<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>6Met Asn Asn Thr Asn Asn Asn Asn Ile Leu Leu His Ser Thr Gln Val1 5 10 15Gln Val Trp Asn Asn Ala Ala Phe Asp Gly Glu Asp Phe Ala Met Asn20 25 30Ser Ser Ser Asp Ser Ile Lys Glu Asn Leu Asn Pro Ser Ala Phe Asn35 40 45Ile Val Pro Ser Ser Asn Lys Arg Thr Ile Asp Asp Glu Ile Ala Glu50 55 60Ile Glu Ser Glu Ile Lys Arg Leu Thr Ser Lys Leu Glu Leu Leu Arg65 70 75 80Val Glu Lys Ala Glu Arg Lys Ile Ala Ser Glu Lys Arg Val Ser Gly85 90 95Ile Gly Thr Gly Arg Ile Val Ala Ala Lys Phe Met Glu Pro Lys Lys100 105 110Asn Val Thr Pro Lys Arg Asn Gly Val Val Phe Lys Glu Glu Thr Pro115 120 125
Lys Arg Asn Gly Val Val Ser Asp Thr Pro Lys Ser Arg Val Asn Trp130 135 140Arg Arg Gly Met Ser Leu Gly Pro Met Glu Ile Ala Gly Lys Val Met145 150 155 160Ala Pro Pro Ala Met Thr Ile Thr Pro Ala Thr Val Asn Arg Arg Lys165 170 175Ser Cys Phe Trp Lys Pro Gln Glu Ser Cys Glu Val Met Pro Ser Gly180 185 190Ile Thr Pro Ala Thr Val Asn Arg Arg Lys Ser Cys Phe Leu Lys Pro195 200 205Gln Glu Ser Cys Glu Glu Asn Arg Arg Lys Thr Ile Cys Lys Pro Asn210 215 220Leu Asn Leu Asn Ser Asn Ser Val Asn Ser Ala Val Gly Ser Ile Lys225 230 235 240Arg Val Lys Lys Lys Asp Glu Glu Ile Ala Gln Val Gln Pro Lys Lys245 250 255Leu Phe Glu Gly Glu Lys Ser Val Lys Lys Ser Leu Lys Gln Gly Arg260 265 270Ile Val Ala Ser Arg Tyr Asn Ser Gly Gly Gly Gly Gly Asp Ala Arg275 280 285Lys Arg Ser Phe Ser Glu Asn Asn Lys Gly Leu Gly Ser Glu Ile Arg290 295 300Ala Lys Lys Arg Trp Glu Ile Pro Ile Glu Glu Val Asp Val Ser Gly305 310 315 320Phe Val Met Leu Pro Lys Ile Ser Thr Met Arg Phe Val Asp Glu Ser325 330 335Pro Arg Asp Ser Gly Ala Val Lys Arg Val Ala Glu Leu Asn Gly Lys340 345 350Arg Ser Tyr Phe Cys Asp Glu Asp Glu Glu Glu Arg Val Met Val Glu355 360 365Glu Glu Gly Gly Ser Val Cys Gln Val Leu Asn Phe Ala Glu Asp Asp370 375 380Asp Asp Asp Asp Asp Tyr Gly Glu Gln Gly385 390<210>7<211>674<212>DNA<213>甘蔗屬物種<220>
<221>misc_feature
<223>seedyl編碼序列(部分5’端)<220>
<221>misc_feature<222>(362)..(362)<223>n可以是a,c,g或t<220>
<221>misc_feature<222>(372)..(372)<223>n可以是a,c,g或t<220>
<221>misc_feature<222>(674)..(674)<223>n可以是a,c,g或t<400>7cgcaccgcga gtttcgaaaa accaacctat cgcgcctcag atcacgcgag gacgcgaggg 60gaagcaggaa tccctccgct cccagccgcc tcctccgctc acccatcgat cgatcgtccg 120tccggtccag ggggctctcc ggcggcggtg gcgatggagg aggacccgct catcccgctg 180gtgcacgtct ggaacaacgc cgccttcgac cacgcctcct cctccgcgtg gcacgcccac 240tcccctgtgc ccgcgagcgc acgtcgcgag gcggaggggg acaaggagaa ccaccgcccc 300gaccccgacc ccgacgtcga ggcggagatc ggccacatcg aggcggagat cctgcgcctg 360tnctcccgcc tncaccacct tcgcacctcc aagcagtcgg agccgtccaa gcgcggagag 420gtcgcgcccg cgcccgcggc gaaggcgaaa gcggcggcgg cggcgcggct gcggacgcgg 480gggctcagcc tgggcccgct cgacgtcgcc gctgccggta accccaaccc gctcaccacc 540gacaaccagc agcagcagcc gcgtgccgcg cagggtctga agccgatcaa gcaggccacg 600gcggcggcgg gcaagggcgt aagacttggg ccccttcgac atggtcggcg cgaaccctag 660ggtccctccg cccn674<210>8<211>166<212>PRT<213>甘蔗屬物種<220>
<221>MISC_FEATURE<223>seedyl蛋白<220>
<221>MISC_FEATURE<223>seedyl蛋白(部分N端)<220>
<221>MISC_FEATURE<222>(70)..(70)<223>Xaa可以是任何氨基酸<400>8Met Glu Glu Asp Pro Leu Ile Pro Leu Val His Val Trp Asn Asn Ala1 5 10 15Ala Phe Asp His Ala Ser Ser Ser Ala Trp His Ala His Ser Pro Val20 25 30Pro Ala Ser Ala Arg Arg Glu Ala Glu Gly Asp Lys Glu Asn His Arg35 40 45
Pro Asp Pro Asp Pro Asp Val Glu Ala Glu Ile Gly His Ile Glu Ala50 55 60Glu Ile Leu Arg Leu Xaa Ser Arg Leu His His Leu Arg Thr Ser Lys65 70 75 80Gln Ser Glu Pro Ser Lys Arg Gly Glu Val Ala Pro Ala Pro Ala Ala85 90 95Lys Ala Lys Ala Ala Ala Ala Ala Arg Leu Arg Thr Arg Gly Leu Ser100 105 110Leu Gly Pro Leu Asp Val Ala Ala Ala Gly Asn Pro Asn Pro Leu Thr115 120 125Thr Asp Asn Gln Gln Gln Gln Pro Arg Ala Ala Gln Gly Leu Lys Pro130 135 140Ile Lys Gln Ala Thr Ala Ala Ala Gly Lys Gly Val Arg Leu Gly Pro145 150 155 160Leu Arg His Gly Arg Arg165<210>9<211>876<212>DNA<213>玉蜀黍<220>
<221>misc_feature<223>seedyl編碼序列(部分3’端)<220>
<221>misc_feature<222>(869)..(869)<223>n=a,c,g或t<400>9ccacgcgtcc ggccgttcga gaggaggaag gccagcgttc caaggagcac gccgtccccg 60ccagaccgtg gccatccagc aatgccaggc acccactgga tgccaggcaa ggcaccgcag 120caagcagagc caaggcgagg agcgggagca taagccccag caggttcagg aggcagtcca 180cttccaaggc tgccgagaca agagcgggaa atgccaagcc tacagaggcg acgaggggag 240ggagcgaagc ggtcaatcac accagcaatg tagccacgac gaagaggccg gcggggagct 300ccaaggtcag ggttgtcccg agccgctaca gcatcccacc tggctcctcc ctagcagctg 360tgacacaagg caaccgatgc aagcagtctc tcccaggatc ggctactgag accagagtaa 420atctcactga gccgccgaac gacgagttgt ctcctgaaga acttgccaag gttgcagagc 480tgctcccaag gattaggacc atgccgcctt ctgatgagag cccgcgtgac tcgggatgtg 540ccaagcgtgt tgctgatttg gtcgggaagc gatccttctt cactgctgca ggggacgatg 600gcaatctcgt tacgccctac caggcacggg tggttgaact tgaatcaccc gaggcagcag 660cagaagaagc agaagcttga gaagtttgtc tttgatcaat tccgaagtgg cttgcatctg 720ggcgtggcct ctttttgcag tgtgtgctac tacatagtct actgttacat tcatatcata 780tcacatttcc tattttttcc cccttgagac attgcttagt acttttgtgt tgccttgtga 840aaagagagtg gaaggttcat ctgctgatnc cttgtt876<210>10<211>224<212>PRT<213>玉蜀黍
<220>
<221>MISC_FEATURE<223>seedyl蛋白(部分C端)<400>10Thr Arg Pro Ala Val Arg Glu Glu Glu Gly Gln Arg Ser Lys Glu His1 5 10 15Ala Val Pro Ala Arg Pro Trp Pro Ser Ser Asn Ala Arg His Pro Leu20 25 30Asp Ala Arg Gln Gly Thr Ala Ala Ser Arg Ala Lys Ala Arg Ser Gly35 40 45Ser Ile Ser Pro Ser Arg Phe Arg Arg Gln Ser Thr Ser Lys Ala Ala50 55 60Glu Thr Arg Ala Gly Asn Ala Lys Pro Thr Glu Ala Thr Arg Gly Gly65 70 75 80Ser Glu Ala Val Asn His Thr Ser Asn Val Ala Thr Thr Lys Arg Pro85 90 95Ala Gly Ser Ser Lys Val Arg Val Val Pro Ser Arg Tyr Ser Ile Pro100 105 110Pro Gly Ser Ser Leu Ala Ala Val Thr Gln Gly Asn Arg Cys Lys Gln115 120 125Ser Leu Pro Gly Ser Ala Thr Glu Thr Arg Val Asn Leu Thr Glu Pro130 135 140Pro Asn Asp Glu Leu Ser Pro Glu Glu Leu Ala Lys Val Ala Glu Leu145 150 155 160Leu Pro Arg Ile Arg Thr Met Pro Pro Ser Asp Glu Ser Pro Arg Asp165 170 175Ser Gly Cys Ala Lys Arg Val Ala Asp Leu Val Gly Lys Arg Ser Phe180 185 190Phe Thr Ala Ala Gly Asp Asp Gly Asn Leu Val Thr Pro Tyr Gln Ala195 200 205Arg Val Val Glu Leu Glu Ser Pro Glu Ala Ala Ala Glu Glu Ala Glu210 215 220<210>11<211>1257<212>DNA<213>擬南芥<220>
<221>misc_feature<223>seedyl編碼序列<400>11atgacatcaa ttgaggcaac agaaacgctt aacgctcctc caaagcttca gatctggaac 60
aacgctgcct tcgacgatgg agattctcaa atcacttccg ccatcgaagc ttcttcttgg 120tctcacctca acgaatcatt cgattccgat tgtagcaagg agaatcagtt tccgatttcg 180gtttcctctt cgctccaatc ctcagtctcg atcaccgaag ctccgtcagc aaaatccaag 240accgtgaaga ccaaatccgc cgcagatcgg agtaaaaagc gagatatcga tgcagagatc 300gaagaagtag agaaggagat cggacgatta tcgacgaaat tggagtcgct ccgattagag 360aaggcggagc aaaccgcaag aagcattgct atacgtggaa gaatcgttcc ggcgaagttc 420atggaatcat ctcagaaaca agtgaaattc gacgattcgt gttttacagg atcgaaatca 480agagccactc gtagaggcgt tagtcttgga ccagcggaga tattcaattc cgcgaagaaa 540tctgaaactg tgactcctct tcaatcagct cagaatcgac gcaagtcttg tttctttaag 600cttcctggaa tcgaagaagg tcaagtgacg acacgaggta aaggaagaac gagtttgagt 660ctgagtccga gatctcgcaa agcgaaaatg acggcagctc agaagcaagc agctacgacg 720gtggggtcaa agagagctgt gaagaaagaa gaaggagttc tcttaacaat ccagcctaag 780aggctattca aagaagatga aaagaatgtt tctttaagga aaccattgaa accaggaaga 840gttgtggcta gtaggtacag tcaaatgggt aaaacgcaga ctggagagaa agatgttagg 900aaaaggtcgt tgcctgagga tgaagagaaa gagaatcata agaggtcgga gaagagaaga 960gcttctgatg aaagtaacaa gagtgaaggg agagtgaaga agagatggga gattccaagt 1020gaagttgatc tgtatagcag tggtgagaac ggtgacgagt ctcctatagt taaggagcta 1080cctaagatca gaacgcttcg tcgtgtggga gggagccctc gtgattcagg tgctgctaag 1140agagttgcag aattacaagc caaggatcgt aacttcactt tttgccagct tctgaagttt 1200gaagaatgaa tgatccgctt atcaatttga gtaaaatcca caactcttgt tgtggtt 1257<210>12<211>402<212>PRT<213>擬南芥<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>12Met Thr Ser Ile Glu Ala Thr Glu Thr Leu Asn Ala Pro Pro Lys Leu1 5 10 15Gln Ile Trp Asn Asn Ala Ala Phe Asp Asp Gly Asp Ser Gln Ile Thr20 25 30Ser Ala Ile Glu Ala Ser Ser Trp Ser His Leu Asn Glu Ser Phe Asp35 40 45Ser Asp Cys Ser Lys Glu Asn Gln Phe Pro Ile Ser Val Ser Ser Ser50 55 60Leu Gln Ser Ser Val Ser Ile Thr Glu Ala Pro Ser Ala Lys Ser Lys65 70 75 80Thr Val Lys Thr Lys Ser Ala Ala Asp Arg Ser Lys Lys Arg Asp Ile85 90 95Asp Ala Glu Ile Glu Glu Val Glu Lys Glu Ile Gly Arg Leu Ser Thr100 105 110Lys Leu Glu Ser Leu Arg Leu Glu Lys Ala Glu Gln Thr Ala Arg Ser115 120 125Ile Ala Ile Arg Gly Arg Ile Val Pro Ala Lys Phe Met Glu Ser Ser130 135 140Gln Lys Gln Val Lys Phe Asp Asp Ser Cys Phe Thr Gly Ser Lys Ser
145 150 155 160Arg Ala Thr Arg Arg Gly Val Ser Leu Gly Pro Ala Glu Ile Phe Asn165 170 175Ser Ala Lys Lys Ser Glu Thr Val Thr Pro Leu Gln Ser Ala Gln Asn180 185 190Arg Arg Lys Ser Cys Phe Phe Lys Leu Pro Gly Ile Glu Glu Gly Gln195 200 205Val Thr Thr Arg Gly Lys Gly Arg Thr Ser Leu Ser Leu Ser Pro Arg210 215 220Ser Arg Lys Ala Lys Met Thr Ala Ala Gln Lys Gln Ala Ala Thr Thr225 230 235 240Val Gly Ser Lys Arg Ala Val Lys Lys Glu Glu Gly Val Leu Leu Thr245 250 255Ile Gln Pro Lys Arg Leu Phe Lys Glu Asp Glu Lys Asn Val Ser Leu260 265 270Arg Lys Pro Leu Lys Pro Gly Arg Val Val Ala Ser Arg Tyr Ser Gln275 280 285Met Gly Lys Thr Gln Thr Gly Glu Lys Asp Val Arg Lys Arg Ser Leu290 295 300Pro Glu Asp Glu Glu Lys Glu Asn His Lys Arg Ser Glu Lys Arg Arg305 310 315 320Ala Ser Asp Glu Ser Asn Lys Ser Glu Gly Arg Val Lys Lys Arg Trp325 330 335Glu Ile Pro Ser Glu Val Asp Leu Tyr Ser Ser Gly Glu Asn Gly Asp340 345 350Glu Ser Pro Ile Val Lys Glu Leu Pro Lys Ile Arg Thr Leu Arg Arg355 360 365Val Gly Gly Ser Pro Arg Asp Ser Gly Ala Ala Lys Arg Val Ala Glu370 375 380Leu Gln Ala Lys Asp Arg Asn Phe Thr Phe Cys Gln Leu Leu Lys Phe385 390 395 400Glu Glu<210>13<211>3074<212>DNA<213>人工序列<220>
<223>[PRO00090-CDS0689-終止子]表達(dá)盒的序列
<400>13cttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta 60ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag 120ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac 180aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt 240attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt 300gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat 360ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttc tttgctaccc 420atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag 480gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt 540aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa 600aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agtaatttaa 660atcaactagg gatatcacaa gtttgtacaa aaaagcaggc tggtaccggt ccggaattcc 720cgggatatcg tcgacccacg cgtccgctga cgcgtgggtt ccactacatc aagacatcta 780ctacactcat cttttttgca cttattgggt gtaaattttt gaaacccagt tgagaaaaat 840gagtgtgtta caatacccag aagggattga cccagcagat gttcagatat ggaacaatgc 900agcatttgat aatggagatt ctgaagattt gtcttcgctg aaacgttctt ggtctcctct 960gaaacccctt tcggttaggc catcagattc ctttgaatct gatttgtcaa gtaaggaaaa 1020tcaaactcct ttatttgaga attcatctgt taatctctca tctccgttac ccataaagcc 1080acttaaccct aatggggctc tggaaaattc aagactcaag ccgaacaagc ccaattccaa 1140acagagtctt gatgagatgg cggctagaaa gagcggaaag ggaaatgatt tccgtgatga 1200gaagaaaata gacgaggaaa ttgaagaaat tcagatggag attagtaggt tgagttcaag 1260attagaggct ttgagaattg aaaaggctga gaaaactgtt gctaagactg ttgaaaagcg 1320aggaagggtt gtggcagcaa agtttatgga gccaaaacaa agtgttatta agattgaaga 1380gcgtatatca atgagtgcaa gaacaaaggt ggagcagaga aggggtctta gtttaggacc 1440atctgagatt tttactggaa cgcggcggcg agggttgagt atggggccat cagatattct 1500agcagggaca acaaaggcac ggcaattggg aaagcaagag atgattatta ctcctattca 1560gccaatacaa aacaggcgaa agtcgtgttt ttggaagctt caagagattg aagaagaggg 1620aaaaagttca agccttagtc ctaaatcaag aaaaactgct gcaagaacaa tggttacaac 1680aaggcaggca gttactacaa ttgcatcaaa gaagaatttg aaaaaagatg atggactttt 1740gagttcagtt cagccaaaga agttgtttaa agatctcgaa aagtctgctg ctgctaataa 1800gaagccccag aggccgggga gggttgtggc tagtaggtat aatcagagta caattcagtc 1860atcagtagtg agaaagaggt ctttacctga aaatgataag gatgagagta agagaaatga 1920taagaaacgg tcgttatctg tagggaaaac gcgtgtgtct caaactgaga gcaagaattt 1980gggtactgaa agtagggtga aaaagagatg ggaaattcct agtgagattg tagttcatgg 2040aaacacagag agtgagaaat ctccactaag cattattgtg aagcctgatt tgcttccgcg 2100aattaggatt gctcggtgtg tgaatgagac tcttagggat tctggacctg ctaaaagaat 2160gatagagttg ataggcaaga aatcgttttt cagtagtgat gaagataagg agccacctgt 2220ctgtcaagtt ttaagttttg cagaggaaga tgctgaagag gaataatgtg taataaaggg 2280agctgctaac tcttttcatg ctctttcaat tttcaatcct gccttttaat ttttgttcat 2340tcgtgccttt taattgaatg gggaagcatt cttttgcttc ctcaaactgg tattctagct 2400tctgaattac attgtatggt acaatatgaa taaggttttg tcttccggca ggttgtccaa 2460gttagttttt agcttaaaat agatgcggca gcggccgctc tagagtatcc ctcgaggggc 2520ccaagcttac gcgtacccag ctttcttgta caaagtggtg atatcacaag cccgggcggt 2580cttctaggga taacagggta attatatccc tctagatcac aagcccgggc ggtcttctac 2640gatgattgag taataatgtg tcacgcatca ccatgggtgg cagtgtcagt gtgagcaatg 2700acctgaatga acaattgaaa tgaaaagaaa aaaagtactc catctgttcc aaattaaaat 2760tcattttaac cttttaatag gtttatacaa taattgatat atgttttctg tatatgtcta 2820atttgttatc atccgggcgg tcttctaggg ataacagggt aattatatcc ctctagacaa 2880cacacaacaa ataagagaaa aaacaaataa tattaatttg agaatgaaca aaaggaccat 2940atcattcatt aactcttctc catccatttc catttcacag ttcgatagcg aaaaccgaat 3000aaaaaacaca gtaaattaca agcacaacaa atggtacaag aaaaacagtt ttcccaatgc 3060cataatactc gaac3074<210>14<211>668<212>DNA<213>稻
<220>
<221>misc_feature<223>谷醇溶蛋白R(shí)P6啟動(dòng)子序列<400>14ccttctacat cggcttaggt gtagcaacac gactttatta ttattattat tattattatt 60attattttac aaaaatataa aatagatcag tccctcacca caagtagagc aagttggtga 120gttattgtaa agttctacaa agctaattta aaagttattg cattaactta tttcatatta 180caaacaagag tgtcaatgga acaatgaaaa ccatatgaca tactataatt ttgtttttat 240tattgaaatt atataattca aagagaataa atccacatag ccgtaaagtt ctacatgtgg 300tgcattacca aaatatatat agcttacaaa acatgacaag cttagtttga aaaattgcaa 360tccttatcac attgacacat aaagtgagtg atgagtcata atattatttt tcttgctacc 420catcatgtat atatgatagc cacaaagtta ctttgatgat gatatcaaag aacattttta 480ggtgcaccta acagaatatc caaataatat gactcactta gatcataata gagcatcaag 540taaaactaac actctaaagc aaccgatggg aaagcatcta taaatagaca agcacaatga 600aaatcctcat catccttcac cacaattcaa atattatagt tgaagcatag tagtagaatc 660caacaaca 668<210>15<211>7<212>PRT<213>人工序列<220>
<223>基序1核心序列<220>
<221>MISC_FEATURE<222>(2)..(2)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(5)..(6)<223>Xaa可以是任何氨基酸<400>15Trp Xaa Asn Ala Xaa Xaa Asp1 5<210>16<211>6<212>PRT<213>人工序列<220>
<223>基序2核心序列<220>
<221>MISC_FEATURE<222>(4)..(5)<223>Xaa可以是任何氨基酸<400>16Lys Glu Asn Xaa Xaa Pro1 5<210>17<211>15
<212>PRT<213>人工序列<220>
<223>基序3(卷曲螺旋)核心序列<220>
<221>MISC_FEATURE<222>(2)..(2)<223>Xaa可以是1至6個(gè)氨基酸的鏈<220>
<221>MISC_FEATURE<222>(4)..(5)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(8)..(10)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(12)..(13)<223>Xaa可以是任何氨基酸<400>17Glu Xaa Glu Xaa Xaa Arg Leu Xaa Xaa Xaa Leu Xaa Xaa Leu Arg1 5 10 15<210>18<211>15<212>PRT<213>人工序列<220>
<223>基序4核心序列<220>
<221>MISC_FEATURE<222>(3)..(3)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(5)..(5)<223>Xaa可以是1至10個(gè)氨基酸的鏈<220>
<221>MISC_FEATURE<222>(10)..(11)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(14)..(14)<223>Xaa可以是1至6個(gè)氨基酸的鏈<400>18
Leu Pro Xaa Ile Xaa Arg Asp Ser Gly Xaa Xaa Lys Arg Xaa Lys1 5 10 1權(quán)利要求
1.相對(duì)于相應(yīng)野生型植物改變植物的生長(zhǎng)特征的方法,包括改變?cè)谥参镏衧eedy1核酸的表達(dá)和/或改變植物中seedy1蛋白的水平和/或活性。
2.根據(jù)權(quán)利要求1的方法,其中所述的表達(dá)和/或活性和/或水平的改變可以通過(guò)在seedy1基因的基因座中引入遺傳修飾而實(shí)現(xiàn)。
3.根據(jù)權(quán)利要求2的方法,其中所述的遺傳修飾通過(guò)下列中的任何一項(xiàng)或者多項(xiàng)實(shí)現(xiàn)T-DNA激活、tilling、定點(diǎn)誘變、同源重組或者在植物中引入和表達(dá)seedy1核酸/基因或者其部分或者能夠與seedy1核酸/基因雜交的序列,所述的核酸編碼seedy1蛋白或者其同源物、衍生物或活性片段。
4.根據(jù)權(quán)利要求2或3的方法,其中所述的seedy1核酸/基因或者其部分或者能夠與所述seedy1核酸/基因雜交的序列在植物中過(guò)表達(dá)。
5.根據(jù)權(quán)利要求1到4的任何一項(xiàng)的方法,其中所述的seedy1核酸來(lái)自植物,優(yōu)選來(lái)自雙子葉植物,更優(yōu)選來(lái)自茄科,更優(yōu)選來(lái)自煙草屬。
6.根據(jù)權(quán)利要求1到5的任何一項(xiàng)的方法,其中所述的seedy1核酸與種子偏好啟動(dòng)子有效連接。
7.根據(jù)權(quán)利要求6的方法,其中所述的種子偏好啟動(dòng)子是谷醇溶蛋白啟動(dòng)子。
8.根據(jù)權(quán)利要求1到7的任何一項(xiàng)的方法,其中所述的改變的生長(zhǎng)特征選自下列中的任何一項(xiàng)或者多項(xiàng)增加的產(chǎn)量、增加的生物量以及改變的植物結(jié)構(gòu),其中每一項(xiàng)均相對(duì)于相應(yīng)的野生型植物而言。
9.根據(jù)權(quán)利要求8的方法,其中所述的增加的產(chǎn)量是增加的種子產(chǎn)量。
10.根據(jù)權(quán)利要求8的方法,其中所述的改變的結(jié)構(gòu)包含增加的生物量和增加的復(fù)總狀花序數(shù)目。
11.通過(guò)根據(jù)權(quán)利要求1-10中任何一項(xiàng)的方法可以獲得的植物或者植物細(xì)胞。
12.遺傳構(gòu)建體,其包含(i)編碼seedy1蛋白的seedy1核酸;(ii)能夠調(diào)控(i)的核酸表達(dá)的一個(gè)或多個(gè)控制序列;以及任選的(iii)轉(zhuǎn)錄終止序列。
13.根據(jù)權(quán)利要求12的構(gòu)建體,其中所述的控制序列是啟動(dòng)子,優(yōu)選是種子偏好的啟動(dòng)子。
14.用根據(jù)權(quán)利要求12或13的構(gòu)建體轉(zhuǎn)化的植物或者植物細(xì)胞。
15.產(chǎn)生具有改變的生長(zhǎng)特征的轉(zhuǎn)基因植物的方法,該方法包括(i)向植物或者植物部分中引入編碼seedy1蛋白的seedy1核酸;(ii)在促進(jìn)再生和成熟植物生長(zhǎng)的條件下培養(yǎng)植物細(xì)胞。
16.相對(duì)于相應(yīng)野生型植物或者植物細(xì)胞具有改變的生長(zhǎng)特征的轉(zhuǎn)基因植物或者植物細(xì)胞,其中所述改變的生長(zhǎng)特征由引入所述植物或植物細(xì)胞中的seedy1核酸引起。
17.根據(jù)權(quán)利要求11、14或16中任何一項(xiàng)的轉(zhuǎn)基因植物或植物細(xì)胞,其中所述的植物是單子葉植物例如甘蔗,或者其中所述的植物是作物植物例如大豆、向日葵、canola、紫花苜蓿、油菜籽(rapeseed)、棉花、番茄、馬鈴薯或者煙草,或者其中植物是谷物例如稻、玉米、小麥、大麥、粟、黑麥、高粱或者燕麥。
18.根據(jù)權(quán)利要求11、14、16或17中任何一項(xiàng)的植物的可收獲部分,其中所述的可收獲部分優(yōu)選是種子。
19.分離的seedy1核酸和/或seedy1蛋白用于改變植物的生長(zhǎng)特征的用途,其中所述生長(zhǎng)特征選自下列中的任何一個(gè)或多個(gè)增加的產(chǎn)量、增加的生物量以及改變的植物結(jié)構(gòu)。
20.分離的seedy1核酸和/或seedy1蛋白用于植物育種的用途。
21.分離的seedy1蛋白,其從N端到C端按照下面的順序包含下面各項(xiàng)(i)與SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)與SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)與SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中該基序是卷曲螺旋基序;以及(iv)與SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,條件是所述seedy1蛋白不是保存于GenBank中具有NCBI登錄編號(hào)AL161572的擬南芥屬植物蛋白(SEQ ID NO 12)。
22.根據(jù)權(quán)利要求21的分離的seedy1蛋白,其中根據(jù)SEQ ID NO15的基序是由(P/X)X((V/L/H)(Q/H)(V/I)W(N/X)NA(A/P)(F/C)D表示的基序,其中X可以是任何氨基酸,且其中(P/X)優(yōu)選是P或者是A或T或Q或者另一種氨基酸(V/L/H)優(yōu)選是V或L或H(Q/H)是Q或H(V/I)是V或者是T或S或者另一種氨基酸(A/P)優(yōu)選是A或者是P(F/C)優(yōu)選是F或者是C。
23.根據(jù)權(quán)利要求21的分離的seedy1蛋白,其中根據(jù)SEQ ID NO17的基序是由(I/V/A)(D/E)XE(I/M)XX(I/V)(E/Q)XE(I/X)XRL(S/X)(S/X)(R/K)LXXLR(L/V/T/I)X(K/Q)表示的基序,其中X可以是任何氨基酸,且其中(I/V/A)優(yōu)選是I或V或者是A(D/E)是D或E(I/M)優(yōu)選是I或者是M(I/V)優(yōu)選是I或者是V(E/Q)優(yōu)選是E或者是Q(I/X)優(yōu)選是I或者是M或者是V或者任何其他氨基酸(S/X)優(yōu)選是S或者是T或者任何其他氨基酸(S/X)優(yōu)選是S或者是T或L或I或A(R/K)優(yōu)選是R或者是K(L/V/T/I)優(yōu)選是L或T或V或I(K/Q)優(yōu)選是K或Q并且該基序是卷曲螺旋基序。
24.根據(jù)權(quán)利要求21的分離的seedy1蛋白,其中根據(jù)SEQ ID NO18的所述基序是由LP(R/K)I(R/X)(T/I)(M/X)(P/R)XX(D/X)(E/G)(S/T)(P/L)RDSG(C/X)(A/X)KR(V/X)(A/I)(D/E)(L/R)(V/X)(G/A)K表示的基序,其中X可以是任何氨基酸,且其中(R/K)是R或K(R/X)優(yōu)選是R或者是S或K(T/I)優(yōu)選是T或I(M/X)優(yōu)選是M或L或A或V(P/R)是P或R(D/X)優(yōu)選是D或者是G或T或N(E/G)優(yōu)選是E或者是G(S/T)優(yōu)選是S或者是T(P/L)優(yōu)選是P或者是L(C/X)優(yōu)選是C或者是P或A(A/X)優(yōu)選是A或者是V或I(A/I)優(yōu)選是A或是I(D/E)是D或E(L/R)優(yōu)選是L或者是R(V/X)優(yōu)選是V或者是Q或N或I(G/A)優(yōu)選是G或者是A。
25.分離的seedy1核酸/基因,其選自(i)SEQ ID NO1,5或7中的任何一個(gè)表示的核酸或者上述任何一個(gè)的互補(bǔ)核酸;(ii)SEQ ID NO2,4,6,8或10表示的氨基酸序列的編碼核酸;(iii)上述(i)或(ii)的同源物、衍生物或者活性片段的編碼核酸;(iv)能夠與上述(i)、(ii)或(iii)的核酸雜交的核酸;(v)上述(i)到(iv)核酸中任何一個(gè)的遺傳密碼簡(jiǎn)并核酸;(vi)屬于上述(i)到(v)中任何一個(gè)核酸的等位變體的核酸;(vii)屬于上述(i)到(vi)中任何一個(gè)核酸的可變剪接變體的核酸;(viii)與上述(i)到(vii)中定義的任何一個(gè)或多個(gè)序列具有至少21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,60%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%序列一致性的蛋白質(zhì)的編碼核酸,其中優(yōu)選的級(jí)別隨一致性的增加而增加;(ix)根據(jù)上述(i)到(viii)任何一項(xiàng)的核酸的部分;其中上述(i)到(ix)的核酸編碼seedy1蛋白,條件是該分離的核酸不是保存于GenBank中具有登錄號(hào)AK063941的稻cDNA(SEQ ID NO3)、以AC144618,AC139356,AC144482或AC135566保存的苜蓿屬植物BAC克隆、以AL61572保存的擬南芥屬植物cDNA(SEQ ID NO 11)或者以AY108162保存的玉蜀黍EST(SEQ ID NO 9)。
全文摘要
本發(fā)明涉及的是相對(duì)于相應(yīng)野生型植物改變植物的生長(zhǎng)特征的方法,包括改變植物中seedyl核酸的表達(dá)和/或改變植物中seedyl蛋白的水平和/或活性。本發(fā)明還涉及新的構(gòu)建體和新的seedyl核酸和蛋白序列。
文檔編號(hào)C12N15/82GK1902219SQ200480039892
公開(kāi)日2007年1月24日 申請(qǐng)日期2004年11月19日 優(yōu)先權(quán)日2003年11月19日
發(fā)明者V·弗蘭卡德, V·米洛諾夫 申請(qǐng)人:作物培植股份有限公司