本發(fā)明屬于植物基因工程領域,涉及一種與水稻粒長及落粒性相關的蛋白及其編碼基因與應用。
背景技術:
稻屬(oryzal.)植物包含兩個極為重要的栽培作物,即亞洲栽培稻(o.satival.)和非洲栽培稻(oryzaglaberrimasteud.),分別獨立起源于亞洲和非洲。
非洲栽培稻是大約3000年前獨立起源于非洲的栽培稻,和亞洲栽培稻是由不同的祖先物種馴化而來。16世紀中葉,葡萄牙人便將亞洲栽培稻引入西非,導致非洲栽培稻的物種迅速減少,所以現(xiàn)在的種植區(qū)域和面積遠小于亞洲栽培稻。目前,亞洲栽培稻已在全球范圍內(nèi)廣泛種植,為世界上近一半人口提供食物來源。非洲栽培稻局限分布于非洲的西部,是當?shù)刂饕募Z食作物之一,對非洲的文明和當?shù)亟?jīng)濟起到了積極的作用。然而,與開展了廣泛研究的亞洲栽培稻相比,非洲栽培稻的相關研究十分匱乏,迄今對非洲栽培稻的群體遺傳結構和進化歷史知之甚少。
但是,非洲栽培稻具有早熟、抗病、耐干旱等特性,在特殊生態(tài)環(huán)境中有一定的生產(chǎn)優(yōu)勢。因此,提高非洲栽培稻的收獲產(chǎn)量具有一定的應用價值。
技術實現(xiàn)要素:
本發(fā)明的目的是提供一種與水稻粒長及落粒性相關的蛋白及其編碼基因與應用。
本發(fā)明所提供的蛋白質,命名為gl4,具體為如下任一:
a)由序列表中序列1所示的氨基酸序列組成的蛋白質;
b)由序列表中序列2所示的氨基酸序列組成的蛋白質;
c)將a)或b)所限定的氨基酸序列經(jīng)過一個或幾個氨基酸殘基的取代和/或缺失和/或添加,且與植物種子的粒長和/或落粒性相關的蛋白質;
d)與a)-c)中任一所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性,且與植物種子的粒長和/或落粒性相關的蛋白質。
其中,(c)和(d)所示的蛋白質可為來源于水稻的蛋白質。
為了便于所述蛋白質的純化,可在所述蛋白質的氨基末端或羧基末端連接上如下表所示的標簽。
表:標簽的序列
編碼所述蛋白質的核酸分子也屬于本發(fā)明的保護范圍。
所述核酸分子可以是dna,如cdna、基因組dna或重組dna;所述核酸分子也可以是rna,如mrna、hnrna或trna等。
在本發(fā)明的一個實施例中,所述核酸分子具體為編碼所述蛋白質的基因,所述基因具體可為如下任一所示的dna分子:
1)序列表中序列3的第2341-4346位所示的dna分子;
2)序列表中序列4的第2322-4333位所示的dna分子;
3)序列表中序列5所示的dna分子;
4)序列表中序列6所示的dna分子;
5)在嚴格條件下與1)-4)中任一限定的dna分子雜交且編碼所述蛋白質的dna分子;
6)與1)-5)中任一限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性,且編碼所述蛋白質的dna分子。
上述嚴格條件可為用6×ssc,0.5%sds的溶液,在65℃下雜交,然后用2×ssc,0.1%sds和1×ssc,0.1%sds各洗膜一次。
含上述核酸分子的重組載體、表達盒、轉基因細胞系或重組菌也屬于本發(fā)明的保護范圍。
所述重組載體可為重組表達載體,也可為重組克隆載體。
所述重組表達載體可用現(xiàn)有的植物表達載體構建。所述植物表達載體包括雙元農(nóng)桿菌載體和可用于植物微彈轟擊的載體等,如pcambia1300、pcubi1390、pchf3、pgreen0029、pcambia3301、pbi121、pbin19、pcambia2301、pcambia1301-ubin或其它衍生植物表達載體。所述植物表達載體還可包含外源基因的3’端非翻譯區(qū)域,即包含聚腺苷酸信號和任何其它參與mrna加工或基因表達的dna片段。所述聚腺苷酸信號可引導聚腺苷酸加入到mrna前體的3’端。使用所述基因構建重組表達載體時,在其轉錄起始核苷酸前可加上任何一種增強型、組成型、組織特異型或誘導型啟動子,例如花椰菜花葉病毒(camv)35s啟動子、泛素基因ubiquitin啟動子(pubi)、脅迫誘導型啟動子rd29a等,它們可單獨使用或與其它的植物啟動子結合使用;此外,使用本發(fā)明的基因構建重組表達載體時,還可使用增強子,包括翻譯增強子或轉錄增強子,這些增強子區(qū)域可以是atg起始密碼子或鄰接區(qū)域起始密碼子等,但必需與編碼序列的閱讀框相同,以保證整個序列的正確翻譯。所述翻譯控制信號和起始密碼子的來源是廣泛的,可以是天然的,也可以是合成的。翻譯起始區(qū)域可以來自轉錄起始區(qū)域或結構基因。為了便于對轉基因植物細胞或植物進行鑒定及篩選,可對所用重組表達載體進行加工,如加入可在植物中表達的編碼可產(chǎn)生顏色變化的酶或發(fā)光化合物的基因、具有抗性的抗生素標記物或是抗化學試劑標記基因等。也可不加任何選擇性標記基因,直接以逆境篩選轉化植株。
在本發(fā)明中,所述重組表達載體中啟動所述基因轉錄的啟動子為水稻內(nèi)源啟動子,具體如序列表中序列4的第1-2321位或序列3的第19-2340位所示。
更為具體的,在本發(fā)明的一個實施例中,所述重組表達載體為在pcambia1300載體的多克隆位點處(具體為xbai和hindiii)插入序列表中序列4所示dna片段后得到的重組質粒。在本發(fā)明的另一個實施例中,所述重組表達載體為將序列表中序列3所示dna片段與pcambia1300載體同源重組后所得的重組質粒。
所述表達盒由能夠啟動所述基因表達的啟動子,所述基因,以及轉錄終止序列組成。
所述蛋白質或所述核酸分子或所述重組載體、表達盒、轉基因細胞系或重組菌在如下任一中的應用也屬于本發(fā)明的保護范圍:
(a)增加植物種子的籽粒長度;
(b)選育籽粒長度增加的植物品種;
(c)提高植物種子的落粒性;
(d)選育落粒性提高的植物品種。
其中,所述選育籽粒長度增加的植物品種的方法以及所述選育落粒性提高的植物品種的方法,均具體可包括將所述基因表達量較高的植株作為親本進行雜交的步驟。
本發(fā)明還保護一種培育籽粒長度增加和/或落粒性提高的植物的方法。
本發(fā)明所提供的培育籽粒長度增加和/或落粒性提高的植物的方法,可包括如下步驟:提高受體植物中權利要求1所述蛋白質的表達量和/或活性,從而得到籽粒長度增加和/或落粒性提高的植物。
本發(fā)明還保護一種培育轉基因植物的方法。
本發(fā)明所提供的培育轉基因植物的方法,具體可包括如下(a1)和(a2)的步驟:
(a1)向受體植物中導入所述蛋白質的編碼基因,得到表達所述編碼基因的轉基因植物;
(a2)從步驟(a1)所得轉基因植物中得到與所述受體植物相比,具有如下(b1)和/或(b2)所示性狀的轉基因植物:
(b1)籽粒長度增加;
(b2)落粒性提高。
所述蛋白質在所述轉基因植物中的表達量高于所述受體植物;所述基因具體可為如下任一所示的dna分子:
1)序列表中序列3的第2341-4346位所示的dna分子;
2)序列表中序列4的第2322-4333位所示的dna分子;
3)序列表中序列5所示的dna分子;
4)序列表中序列6所示的dna分子;
5)在嚴格條件下與1)-4)中任一限定的dna分子雜交且編碼所述蛋白質的dna分子;
6)與1)-5)中任一限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性,且編碼所述蛋白質的dna分子。
上述嚴格條件可為用6×ssc,0.5%sds的溶液,在65℃下雜交,然后用2×ssc,0.1%sds和1×ssc,0.1%sds各洗膜一次。
所述基因具體可通過上述任一所述重組表達載體導入所述受體植物中,得到所述轉基因植物。具體可通過使用ti質粒、ri質粒、植物病毒載體、直接dna轉化、顯微注射、電導、農(nóng)桿菌介導、基因槍等常規(guī)生物學方法將所述重組表達載體轉化植物細胞或組織,并將轉化的植物組織培育成植株。
在本發(fā)明中,所述植物可為單子葉植物,如禾本科植物,具體如水稻,更加具體如非洲水稻。
在本發(fā)明的一個實施例中,所述受體植物具體為非洲栽培稻品種irgc102305。
實驗證明,將可表達序列表中序列1或序列2所示蛋白質的重組表達載體轉化非洲栽培稻品種irgc102305,與相同條件下的未經(jīng)轉基因的非洲栽培稻品種irgc102305植株相比,轉基因水稻的籽粒長度更長,落粒性更強。本發(fā)明所提供的gl4蛋白及其編碼基因在提高植物種子的籽粒長度和落粒性方面具有重要意義,將在培育高產(chǎn)植物新品種中發(fā)揮重要作用。
附圖說明
圖1為株系gil25與非洲稻品種irgc102305的籽粒長度以及落粒性比較。
圖2為gl4基因定位示意圖。
圖3為實施例2中轉入pgl4-1載體的轉基因株系的pcr鑒定結果。
圖4為實施例2中轉入pgl4-1載體的轉基因株系與非洲稻品種irgc102305的籽粒長度以及落粒性比較。圖中,pgl4-1表示轉入pgl4-1載體的轉基因株系。
圖5為實施例2中不同遺傳材料的籽粒長度統(tǒng)計結果。
圖6為實施例3中轉入pgl4-2載體的轉基因株系與非洲稻品種irgc102305的籽粒長度以及落粒性比較。圖中,pgl4-2表示轉入pgl4-2載體的轉基因株系。
圖7為實施例3中不同遺傳材料的籽粒長度統(tǒng)計結果。
具體實施方式
下述實施例中所使用的實驗方法如無特殊說明,均為常規(guī)方法。
下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
非洲稻品種irgc102305和非洲野生稻w1411:可從國際水稻所獲得,網(wǎng)址為:
http://www.irgcis.irri.org:81/grc/irgcishome.html;或者
https://shigen.nig.ac.jp/rice/oryzabase/strain/wildcore/list。
pcambia1300載體:記載于“zhuzuofeng,tanlubin,fuyongcai,liufengxia,caihongwei,xiedaoxin,wufeng,wujianzhong,matsumototakashi,sunchuanqing.geneticcontrolofinflorescencearchitectureduringricedomestication.naturecommun,2013,4:2200doi:10.1038/ncomms3200.”一文,公眾可從申請人處獲得,僅可用于重復本發(fā)明實驗使用。
實施例1、調控非洲稻籽粒大小及落粒性基因的定位
非洲稻品種irgc102305與非洲野生稻w1411雜交,再將irgc102305作為輪回親本,多次回交獲得一個在籽粒大小上與irgc102305差別明顯的株系gil25,且其籽粒易落(圖1),將其與irgc102305雜交構建了一個包含186個單株的f2分離群體。在這個f2群體中,籽粒長度和落粒性都與標記rm3335與rm5608緊密連鎖,且將gl4基因定位在這兩個基因之間。然后將分離群體擴大到6500個單株,發(fā)現(xiàn)落粒性與籽粒大小共分離。并根據(jù)標記rm3335與rm5608之間的序列設計引物,最終將gl4基因定位到標記m3與m4之間的5.9kb上(圖2)。且所有籽粒較長的株系表現(xiàn)出落粒性,籽粒較短的株系表現(xiàn)出不落粒性。在網(wǎng)站http://ensembl.gramene.org/oryza_glaberrima上根據(jù)非洲栽培稻irgc96717(cg14)序列預測,該區(qū)間只含有一個候選基因orgla04g0254300。因此該基因就是gl4基因,控制非洲栽培稻的籽粒長度。株系gil25與非洲野生稻w1411的gl4基因序列相同。
實施例2、gl4轉基因非洲稻的獲得及其功能驗證
一、表達載體的構建
根據(jù)非洲野生稻w1411的基因orgla04g0254300以及啟動子序列設計引物,并在引物兩端分別引入限制性內(nèi)切酶xbai和hindiii識別位點及保護堿基,引物序列如下:
pgl4-1f:5’-tgctctagagctggccgtagaagtcaag-3’(帶下劃線堿基為限制性內(nèi)切酶xbai識別位點及保護堿基,其后的序列為序列4的第1-19位);
pgl4-1r:5’-acaaagcttgtatagctcagcacgagc-3’(帶下劃線堿基為限制性內(nèi)切酶hindiii識別位點及保護堿基,其后的序列為序列4的第4876-4893位的反向互補序列)。
利用ctab法提取非洲野生稻w1411的全基因組dna。以此dna為模板,擴增長度約為4.8kb的dna片段,其序列為“tgctctaga+序列4+aagctttgt”。用試劑盒回收,將其克隆入植物表達載體pcambia1300的酶切位點xbai和hindiii之間,得到非洲栽培稻的植物表達載體,測序正確后命名為pgl4-1。
pgl4-1的結構描述如下:將序列表中序列4所示dna片段替換pcambia1300的酶切位點xbai和hindiii之間的小片段后得到的重組質粒。
序列4的第1-2321位為非洲野生稻w1411內(nèi)源的gl4基因啟動子序列,第2322-4333位為含有內(nèi)含子的gl4基因序列(第3156-3994位為內(nèi)含子序列)。對應的不含內(nèi)含子的gl4基因cds序列如序列表中序列6所示。序列4的第2322-4333位以及序列6均編碼序列表中序列2所示的gl4蛋白。
二、轉化非洲栽培稻及pcr鑒定
將步驟一構建的載體pgl4-1通過基因槍法轉化進籽粒較短且不落粒的非洲栽培稻品種irgc102305,用含潮霉素的nb培養(yǎng)基進行2輪篩選,再經(jīng)預分化,分化得到轉基因植株。實驗同時設置向非洲栽培稻品種irgc102305中轉入pcambia1300空載體的對照。
通過pcr鑒定轉基因植株。具體操作如下:取生長期轉化植株以及空載體對照植株和非洲栽培稻品種irgc102305的葉片,使用ctab法提取總dna,使用如下引物針對pcambia1300載體上自帶的潮霉素抗性基因進行pcr鑒定:
hptf:5’-gtctccgacctgatgcagctctcgg-3’;
hptr:5’-gtccgtcaggacattgttggag-3’。
鑒定結果如圖3所示,泳道1為dnamarkeriii(北京拓英坊科技有限公司產(chǎn)品),目的條帶大小為520bp。泳道2-15為轉基因陽性植株,泳道16為雙蒸水,泳道17為未轉基因的非洲栽培稻品種irgc102305,泳道18為陽性對照pcambia1300載體。
三、轉基因稻的功能鑒定
經(jīng)步驟二潮霉素抗性篩選及pcr鑒定共獲得12株轉基因植株。以這12株轉基因植株,以及轉入pcambia1300空載體的對照和未經(jīng)轉基因處理的非洲栽培稻品種irgc102305為實驗材料。觀察各實驗材料的籽粒表型以及落粒性,并統(tǒng)計3個轉基因株系、3個空載對照株系和非洲栽培稻品種irgc102305的籽粒長度,每個系10株。
結果顯示:
與空載對照和未經(jīng)轉基因處理的非洲栽培稻品種irgc102305相比,經(jīng)步驟二潮霉素抗性篩選及pcr鑒定的轉基因植株其籽粒全部為較長籽粒,且更易落粒(圖4)。
統(tǒng)計3個轉基因株系、3個空載對照株系和非洲栽培稻品種irgc102305的籽粒長度,結果如圖5所示。其中,pgl4-1-1、pgl4-1-2和pgl4-1-3表示隨機選取的3個轉基因株系,vector-1、vector-2和vector-3表示隨機選取的3個空載對照株系,irgc102305-1表示未經(jīng)轉基因處理的非洲栽培稻品種irgc102305。由圖可見,非洲栽培稻irgc102305的籽粒長度為8.25厘米,轉入空載體的陽性單株籽粒長度為8.21-8.27厘米,轉入pgl4-2載體的陽性單株籽粒長度為9.36-9.42厘米。轉入pgl4-2的陽性單株籽粒長度相對于轉入空載的陽性單株和受體材料irgc102305都有明顯提高(t測驗,p<0.05)。因此,序列2所示的gl4蛋白(序列4的第2322-4333位或序列6所示的gl4基因)可用于調控籽粒長度和落粒性。
實施例3、關鍵變異的獲得及驗證
一、關鍵變異的獲得
利用qpcr的方法比較非洲野生稻w1411和非洲栽培稻品種irgc102305的gl4表達水平發(fā)現(xiàn),gl4在這兩種材料中表達量無明顯差異。對非洲野生稻w1411和非洲栽培稻品種irgc102305的gl4基因的編碼區(qū)序列比對發(fā)現(xiàn),一共有五處變異:g294a,c766t,c1466t,a1515g和gccgcc681-686缺失(變異是非洲栽培稻品種irgc102305相對于非洲野生稻w1411而言的)。通過16份野生稻和67份非洲栽培稻的gl4基因序列比對發(fā)現(xiàn),c766t與籽粒長度以及落粒性關聯(lián)程度最高。
二、表達載體的構建
以非洲栽培稻品種irgc102305的基因組為模板,設計如下兩個引物對pgl4-2af/pgl4-2ar和pgl4-2bf/pgl4-2br,其中帶下劃線且為粗體的堿基為人為引入,為的是回復c766t突變,斜體且?guī)聞澗€部分為pcambia1300載體序列。
pgl4-2af:5’-tacccggggatcctctaggctggccgtagaagtcaag-3’;
pgl4-2ar:5’-cgacgacggcggcggctgaggaggaggtgggtggtg-3’。
pgl4-2bf:5’-agccgccgccgtcgtcgctgca-3’;
pgl4-2br:5’-tgtaaaacgacggccagtgccacttgtatagctcagcacgagc-3’。
以非洲栽培稻品種irgc102305的基因組為模板,分別以引物對pgl4-2af/pgl4-2ar和pgl4-2bf/pgl4-2br進行擴增,分別獲得長度約為3.1kb和1.8kb的片段,切膠回收后,通過同源重組酶將這兩個片段與pcambia1300載體相連接,獲得一個包含gl4上游2kb以及下游560bp的重組載體,測序正確后命名為pgl4-2。pgl4-2載體所嵌入的片段除上述c766t位置與非洲栽培稻irgc102305不同外,其他序列與irgc102305完全相同。在c766t位置,載體pgl4-2為堿基c,而非洲栽培稻品種irgc102305為堿基t。
pgl4-2載體的結構描述為:將序列表中序列3所示dna片段與pcambia1300載體同源重組(上下游同源臂分別為序列3的第1-18位和第4906-4931位)后所得的重組載體。
其中,序列3的第1-18位和4906-4931位為pcambia1300載體上的序列,第19-2340位為非洲栽培稻品種irgc102305內(nèi)源的gl4基因啟動子序列,第2341-4346位為gl4基因(第3169-4007位為內(nèi)含子序列)。對應的不含內(nèi)含子的gl4基因cds序列如序列表中序列5所示。序列3的第2341-4346位以及序列5均編碼序列表中序列1所示的gl4蛋白。
三、轉化非洲栽培稻及pcr鑒定
將步驟一構建的載體pgl4-2通過基因槍法轉化進籽粒較短且不落粒的非洲栽培稻品種irgc102305,用含潮霉素的nb培養(yǎng)基進行2輪篩選,再經(jīng)與分化,分化得到轉基因植株。實驗同時設置向非洲栽培稻品種irgc102305中轉入pcambia1300空載體的對照。通過pcr鑒定轉基因植株。具體如實施例2步驟二。
四、轉基因稻的功能鑒定
經(jīng)步驟二潮霉素抗性篩選及pcr鑒定共獲得15株轉基因植株。以這15株轉基因植株,以及轉入pcambia1300空載體的對照和未經(jīng)轉基因處理的非洲栽培稻品種irgc102305為實驗材料。觀察各實驗材料的籽粒表型以及落粒性,并統(tǒng)計3個轉基因株系、3個空載對照株系和非洲栽培稻品種irgc102305的籽粒長度,每個系10株。
結果顯示:
與空載對照和未經(jīng)轉基因處理的非洲栽培稻品種irgc102305相比,經(jīng)步驟二潮霉素抗性篩選及pcr鑒定共獲得15株轉基因植株其籽粒全部為較長籽粒(圖6)。
統(tǒng)計3個轉基因株系、3個空載對照株系和非洲栽培稻品種irgc102305的籽粒長度,結果如圖7所示。其中,pgl4-2-1、pgl4-2-2和pgl4-2-3表示隨機選取的3個轉基因株系,vector-1、vector-2和vector-3表示隨機選取的3個空載對照株系,irgc102305-1表示未經(jīng)轉基因處理的非洲栽培稻品種irgc102305。由圖可見,非洲栽培稻irgc102305的籽粒長度為8.25厘米,轉入空載體的陽性單株籽粒長度為8.21-8.27厘米,轉入pgl4-2載體的陽性單株籽粒長度為9.24-9.28厘米。轉入pgl4-2的陽性單株籽粒長度相對于轉入空載的陽性單株和受體材料irgc102305都有明顯提高(t測驗,p<0.05)。因此,序列1所示的gl4蛋白(序列3的第2341-4346位或序列5所示的gl4基因)可用于調控籽粒長度和落粒性。
<110>中國農(nóng)業(yè)大學
<120>與水稻粒長及落粒性相關的蛋白及其編碼基因與應用
<130>gncln170814
<160>6
<170>patentinversion3.5
<210>1
<211>388
<212>prt
<213>人工序列
<220>
<223>
<400>1
metserglyserseralaalaaspproserproseralaserthrala
151015
glyalaalaalaserproleualaleuleuargalahisglyhisgly
202530
hisleuthrproproseralaalathrglyproalapropropropro
354045
serproalaserglyseralaproargasptyrarglysglyasntrp
505560
thrleuhisgluthrleuileleuilethralalysargleuaspasp
65707580
aspargargalaglyvalglyglyglyalaalaalaglyglyglygly
859095
alaglyserproprothrproargseralagluglnargtrplystrp
100105110
valgluasntyrcystrplysasnglycysleuargserglnasngln
115120125
cysasnasplystrpaspasnleuleuargasptyrlyslysvalarg
130135140
asptyrgluserargvalalaalaalaalavalthrglyglyalaala
145150155160
alaalaasnseralaproleuprosertyrtrpthrmetgluarghis
165170175
gluarglysaspcysasnleuprothrasnleualaprogluvaltyr
180185190
aspalaleusergluvalleuserargargalaalaargargglygly
195200205
alathrilealaprothrproproproproproleualaleupropro
210215220
proproproproproserproprolysproleuvalalaglnglnhis
225230235240
hishishishisglyhishishishisproproproproglnpropro
245250255
proserserleuglnleuproproalavalvalalaproproproala
260265270
servalserglyalaglugluglumetserglyserserglusergly
275280285
glugluglugluglyserglyglygluproglualalysargargarg
290295300
leuserargleuglyserservalvalargseralathrvalvalala
305310315320
argthrleuvalalacysgluglulysarggluargarghisargglu
325330335
leuleuglnleuglugluargargleuargleugluglugluargthr
340345350
gluvalargargglnglyphealaglyleuilealaalavalasnser
355360365
leuserseralailehisalaleuvalserasphisargserglyasp
370375380
serserglyarg
385
<210>2
<211>390
<212>prt
<213>非洲稻
<400>2
metserglyserseralaalaaspproserproseralaserthrala
151015
glyalaalaalaserproleualaleuleuargalahisglyhisgly
202530
hisleuthrproproseralaalathrglyproalapropropropro
354045
serproalaserglyseralaproargasptyrarglysglyasntrp
505560
thrleuhisgluthrleuileleuilethralalysargleuaspasp
65707580
aspargargalaglyvalglyglyglyalaalaalaglyglyglygly
859095
alaglyserproprothrproargseralagluglnargtrplystrp
100105110
valgluasntyrcystrplysasnglycysleuargserglnasngln
115120125
cysasnasplystrpaspasnleuleuargasptyrlyslysvalarg
130135140
asptyrgluserargvalalaalaalaalavalthrglyglyalaala
145150155160
alaalaasnseralaproleuprosertyrtrpthrmetgluarghis
165170175
gluarglysaspcysasnleuprothrasnleualaprogluvaltyr
180185190
aspalaleusergluvalleuserargargalaalaargargglygly
195200205
alathrilealaprothrproproproproproleualaleupropro
210215220
proproproproproproproserproprolysproleuvalalagln
225230235240
glnhishishishishisglyhishishishisproproproprogln
245250255
proproproserserleuglnleuproproalavalvalalapropro
260265270
proalaservalserglyalaglugluglumetserglyserserglu
275280285
serglyglugluglugluglyserglyglygluproglualalysarg
290295300
argargleuserargleuglyserservalvalargseralathrval
305310315320
valalaargthrleuvalalacysgluglulysarggluargarghis
325330335
arggluleuleuglnleuglugluargargleuargleuglugluglu
340345350
argthrgluvalargargglnglyphealaglyleuilealaalaval
355360365
asnserleuserseralailehisalaleuvalserasphisargser
370375380
glyaspserserglyarg
385390
<210>3
<211>4931
<212>dna
<213>人工序列
<220>
<223>
<400>3
tacccggggatcctctaggctggccgtagaagtcaagcccatctcacagtctgcagatcg60
cttctttttacaacccaacgggccattttcagaggcgtcacccgtaaatccttgggccaa120
tgtgacccaatcaatttcgtgaaaagtactccgtagcaaacaacgcgcgcgcgttccctg180
caaaaaacgccggaaaacgcattgccgagcgagccgtttcagcaaataagggatcgttag240
actttatcagtgactgtatgaaacttttatatatgtgtgtgttcttaggacttaaaagat300
aatgctgaaaaatttatttcaaaatttaaattttggttttgacttattataaatttttgg360
ggcaaccgatggggctatgaggctatgagctatccatccatccatagcgcaacgtgtgac420
agcgtgaggtgacaagatggaaaaccgtgagccgcgccaccggtgtaaaccccctccctt480
cacgcgcgtttactttgcaagcaaaggacaaggaaaaaagccgtaattggcgaagaatgt540
tcttggatttgattagcagcggtacggtaacacctctagcttgcatttgcatggtagggt600
gatttggctaggagagcaggatcatccacgcattcaattttcctcatttctttttgcagg660
ctcaatagaggagaggaggggcctagctagccccaagataatgcagcaaaaaggagagaa720
gagaacatgtcatccagtccaaagtgcaaacgtctctatacaaatggaacatatggagtg780
gacctaagcctagttgcttctgtgtcccaagctcccaagtgtcaaagccttaatgtgcaa840
aaccacatctgtggggactcctgaaagcaaactaaatgattgcaaaagagttcgtttatt900
cacctatttatttatttattttattttctttccatgtgtctgttgtttgatactttgatt960
gatcatgtgctaaactgcagaaaaaaccaacaggcccagagtaccggcgaaaaggctcct1020
cgatgaaaagtgcagggattctgggggagttgccagtgcgccaccgttggatttttgcac1080
acatataaacagggctctgctgcacctctcacatagtaacatatatagggacggttccac1140
caagcacgtttgggaaatggttttttgagcaacatctcatgcgaacaatttaggcactat1200
ttacttgtaccttcaccttgtacgtgtgctccatcccatagctgcattatttgcataaat1260
ccttttaattgcatatatacatactctctccatattttttttaataaatggcgtatttca1320
ctttttatcacaccatgtcttttaataagacgaaatatcaaatgtgtgacaaaaaaatca1380
ataatgtcatctattaaaagacagattaagtatatgagaggcatttaattatttgccacc1440
tttgatgttttacaatttatcactcgtgtgacatagacgcatagggtaacaaattgcgaa1500
acatcaagtaatctgtgagtagcaaatacttaaatatctcctaatatgttagcattgcac1560
ccaactttatatcaaaactctataactatattgagctttgtcctgcccatggtaaagtgt1620
ggggttaaagtgttaaaaagctattggtagcagtatctagtatggcgtggcaggccggtg1680
cagataaaaggggccccgggttttgcccggaaatgaggagaggacgccccggcagctagc1740
ggacgctttgcatttgcatgcatggtgctctctacttctcccctccgttcccacggcaaa1800
tgcaaaacgcatgctagtatttggcaccattagcctaagatagtagtatcagagtgttac1860
agaaagaatataattatgtagtagtatagtaattaattaaagcctgcgattaaggtaaag1920
cagcagtgcagttacaaacctaaacaaacaagagtcagcgaactgaaaagaagaccggga1980
agaagaagggaaaaaaaaaagacccgaacagagttttgatgagcagtgtcaggtctgtca2040
catgagatgagagcgaagtagctcagctcagctcagcccccactcgctcacatggaacgc2100
ctctgctccccgcgactacttaaccagctaaacgctcggttgattaggagagaagaaaaa2160
aacgagggaaaaaacggtggaaacacacgcaaaacacacaacgccgtgaggccttgtaaa2220
tacgggcgacgccgacgcgcatcgctacccgaacaccaaacgcctcagcttgccttggct2280
ctcgcgagtcgctacgcccgcgacgacacggccgcgccgcgcgcgcgcgagcgagcgagc2340
atgtcgggctcctctgctgccgacccctcgccatccgcgtcgaccgcgggggcggcggcc2400
tcgccgctcgcgctgctccgcgcgcacgggcacgggcacctcacgccgccgtcggcggcg2460
acggggccggcgccgccgccgccgtcgccggcgtcggggtcggcgccgcgggactaccgc2520
aaggggaactggacgctccacgagacgctcatcctcatcaccgccaagcgtctcgacgac2580
gaccgccgcgccggcgttgggggtggcgcggcggctggtggcggtggcgccggatcgccg2640
ccgacgccgaggtcggcggagcagcggtggaagtgggtggagaactactgctggaagaac2700
ggctgcctccgcagccagaaccagtgcaatgacaagtgggacaacctcctccgcgactac2760
aagaaggtccgcgactacgagtcccgcgtcgccgccgccgccgtcaccggcggcgcggcc2820
gccgccaactccgcccccctcccgtcgtactggacgatggagcggcacgagcgcaaggac2880
tgcaacctccccaccaacctggcgccggaggtctacgacgcgctctccgaggtgctctcc2940
cgccgcgcggcgcgacgcggcggcgccacgatcgcgcccaccccgccgccaccaccgctc3000
gcgctgccgccgccgccgccgccgccctcgccgccgaagcctctcgtcgcgcagcagcac3060
caccaccatcacggccatcaccaccacccacctcctcctcagccgccgccgtcgtcgctg3120
cagctccctccggcggtcgtggctccgccgccggcgtccgtttccggtaatggtcggtgc3180
gcgcaccgtacacttaatactcgtagtagctgttacatcccctcccctccaaaccattta3240
ctactgttctctcacactgacatgtggggcccacctcgcagcgagctgagctccgccact3300
atacgttattaaaagcccgcgttatgattgggctagttacgttgttgagttgagctggtc3360
gtaattatttactaccgctactttttttttacctttttaccgtggggttcgggagagggt3420
ggtcgcggtaataataatgtcctcaactcaggggttgggagaataaagctgcgtgcagtg3480
tggtgcagttcatgcatgggaaaggtgatgcgaatccggatattttatgggggtttaatt3540
gaaagatttactccacgacgatactaccctgtactcctgccatgctgcaagcatgcgtaa3600
tgcgttacattgcgaaatcactcgctttgaaagaaaaaaaagcctaaaactttggagcaa3660
aaaaaaagcaccttttgttttctcctcgtgcatgcatgccgcgctgcctatcttgaacta3720
ctttggacttttgtatcgatcagcaaaactatacctatattagcagtaattaatactaca3780
tttgtagatatcctttgactgttctatcttatttttgataattaaaaaaattagttacat3840
ttaaaaatgctatttatattttatcatctaataacaataaaagtattagttaaatattaa3900
acgttggatatgaatagtttaaaactgtattgttttggggcggagggagtaattgattga3960
tggattaattaagtggttgactaatgtgtgtgtgatttatttgtgtagcggaggaggaga4020
tgtcggggtcgtcggagtcgggggaggaggaggaggggtcgggcggggagccggaggcga4080
agcggcggcggctgagccggctggggtcgagcgtggtgaggagcgcgacggtggtggcga4140
ggacgctggtggcgtgcgaggagaagcgggagcgccggcaccgggagctgctgcagctgg4200
aggagcggcggctgcgcctcgaggaggagcgcaccgaggtccgccgccagggcttcgccg4260
gcctcatcgccgccgtcaacagcctctcctccgccatccacgccctcgtctccgaccacc4320
gcagcggcgactcctccggccgatgatcgccattgcaatcatatgcaatgcagcaaggac4380
gatcgatgtaaataacccatggagatgcatggatcgaggcatcggattattatgtttgga4440
atggctgcaagaagaggagtagctaggctaggggattaatttttttttttttgagtgtgc4500
atcgccatcgcgtcgtctgcgagtattgggagtacggtgcattgcatgcacaacgcctcc4560
gtttcttgatttctttctttctctcctgtgtcctgtgatttttttgttgtttattctttt4620
cgtgcaattagtggagagactggcaggtgtgtggtgtgaatgatcgaaatggttagtgtg4680
gctgctgctggtggtgctgttgctgttgctgcgttttttcttctcgggtgttgggtttgt4740
cgtggacggcgatcattagcggcacagtggatgagagagctgagctctagctgcaggtcg4800
cttggtctcgctgcgctgtcatgtgatcactactgcgcatgggggccacggttaccgcta4860
tagctgctgcaactgcgtgcgagaacgagctcgtgctgagctatacaagtggcactggcc4920
gtcgttttaca4931
<210>4
<211>4893
<212>dna
<213>非洲稻
<400>4
gctggccgtagaagtcaagcccatctcacagtctgcagatcgcttctttttacaacccaa60
cgggccattttcagaggcgtcacccgtaaatccttgggccaatgtgacccaatcaatttc120
gtgaaaagtactccgtagcaaacaacgcgcgcgcgttccctgcaaaaaacgccggaaaac180
gcattgccgagcgagccgtttcagcaaataagggatcgttagactttatcagtggctgta240
tgaaacttttatatatgtgtgtgttcttaggacttaaaagataatgctgaaaaatttatt300
tcaaaatttaaattttggttttgacttattataaatttttggggcaaccgatggggctat360
gaggctatgagctatccatccatccatagcgcaacgtgtgacagcgtgaggtgacaagat420
ggaaaaccgtgagccgcgccaccggtgtaaaccccctcccttcacgcgcgtttactttgc480
aagcaaaggacaaggaaaaaagccgtaattggcgaagaatgttcttggatttgattagca540
gcggtacggtaacacctctagcttgcatttgcatggtagggtgatttggctaggagagca600
ggatcatccacgcattcaattttcctcatttctttttgcaggctcaatagaggagaggag660
gggcctagctagcaccaagataatgcagcaaaaaggagagaagagaacatgtcatccagt720
ccaaagtgcaaacgtctctatacaaatggaacatatggagtggacctaagcctagttgct780
tctgtgtcccaagctcccaagtgtcaaagccttaatgtgcaaaaccacatctgtggggac840
tcctgaaagcaaactaaatgattgcaaaagagttcgtttattcacctatttatttattta900
ttttattttctttccatgtgtctgttgtttgatactttgattgatcatgtgctaaactgc960
agaaaaaaccaacaggcccagagtaccggcgaaaaggctcctcgatgaaaagtgcaggga1020
ttctgggggagttgccagtgcgccaccgttggatttttgcacacatataaacagggctct1080
gctgcacctctcacatagtaacatatatagggacggttccaccaagcacgtttgggaaat1140
ggttttttgagcaacatctcatgcgaacaatttaggcactatttacttgtaccttcacct1200
tgtacgtgtgctccatcccatagctgcattatttgcataaatccttttaattgcatatat1260
acatactctctccatattttttttaataaatggcgtatttcactttttatcacaccatgt1320
cttttaataagacgaaatatcaaatgtgtgacaaaaaaatcaataatgtcatctattaaa1380
agacagattaagtatatgagaggcatttaattatttgccacctttgatgttttacaattt1440
atcactcgtgtgacatagacgcatagggtaacaaattgcgaaacatcaagtaatctgtga1500
gtagcaaatacttaaatatctcctaatatgttagcattgcacccaactttatatcaaaac1560
tctataactatattgagctttgtcctgcccatggtaaagtgtggggttaaagtgttaaaa1620
agctattggtagcagtatctagtatggcgtggcaggccggtgcagataaaaggggccccg1680
ggttttgcccggaaatgaggagaggacgccccggcagctagcggacgctttgcatttgca1740
tgcatggtgctctctacttctccctccgttcccacggcaaatgcaaaacgcatgctagta1800
tttggcaccattagcctaagatagtagtatcagagtgttacagaaagaatataattatgt1860
agtagtatagtaattaattaaagcctgcgattaaggtaaagcagcagtgcagttacaaac1920
ctaaacaaacaagagtcagcgaactgaaaagaagaccgggaagaagaagggaaaaaaaaa1980
agacccgaacagagttttgatgagcagtgtcaggtctgtcacatgagatgagagcgaagt2040
agctcagctcagctcagcccccactcgctcacatggaacgcctctgctccccgcgactac2100
ttaaccagctaaacgctcggttgattaggagagaagaaaaaaacgagggaaaaaacggtg2160
gaaacacacgcaaaacacacaacgccgtgaggccttgtaaatacgggcgacgccgacgcg2220
catcgctacccgaacaccaaacgcctcagcttgccttggctctcgcgagtcgctacgccc2280
gcgacgacacggccgcgccgcgcgcgcgcgagcgagcgagcatgtcgggctcctctgctg2340
ccgacccctcgccatccgcgtcgaccgcgggggcggcggcctcgccgctcgcgctgctcc2400
gcgcgcacgggcacgggcacctcacgccgccgtcggcggcgacggggccggcgccgccgc2460
cgccgtcgccggcgtcggggtcggcgccgcgggactaccgcaaggggaactggacgctcc2520
acgagacgctcatcctcatcaccgccaagcgtctcgacgacgaccgccgcgccggcgttg2580
ggggtggcgcggcggctggtggcggtggcgccgggtcgccgccgacgccgaggtcggcgg2640
agcagcggtggaagtgggtggagaactactgctggaagaacggctgcctccgcagccaga2700
accagtgcaatgacaagtgggacaacctcctccgcgactacaagaaggtccgcgactacg2760
agtcccgcgtcgccgccgccgccgtcaccggcggcgcggccgccgccaactccgcccccc2820
tcccgtcgtactggacgatggagcggcacgagcgcaaggactgcaacctccccaccaacc2880
tggcgccggaggtctacgacgcgctctccgaggtgctctcccgccgcgcggcgcgacgcg2940
gcggcgccacgatcgcgcccaccccgccgccaccaccgctcgcgctgccgccgccgccgc3000
cgccgccgccgccctcgccgccgaagcctctcgtcgcgcagcagcaccaccaccatcacg3060
gccatcaccaccacccacctcctcctcagccgccgccgtcgtcgctgcagctccctccgg3120
cggtcgtggctccgccgccggcgtccgtttccggtaatggtcggtgcgcgcaccgtacac3180
ttaatactcgtagtagctgttacatcccctcccctccaaaccatttactactgttctctc3240
acactgacatgtggggcccacctcgcagcgagctgagctccgccactatacgttattaaa3300
agcccgcgttatgattgggctagttacgttgttgagttgagctggtcgtaattatttact3360
accgctactttttttttacctttttaccgtggggttcgggagagggtggtcgcggtaata3420
ataatgtcctcaactcaggggttgggagaataaagctgcgtgcagtgtggtgcagttcat3480
gcatgggaaaggtgatgcgaatccggatattttatgggggtttaattgaaagatttactc3540
cacgacgatactaccctgtactcctgccatgctgcaagcatgcgtaatgcgttacattgc3600
gaaatcactcgctttgaaagaaaaaaaagcctaaaactttggagcaaaaaaaaagcacct3660
tttgttttctcctcgtgcatgcatgccgcgctgcctatcttgaactactttggacttttg3720
tatcgatcagcaaaactatacctatattagcagtaattaatactacatttgtagatatcc3780
tttgaccgttctatcttatttttgataattaaaaaaattagttacatttaaaaatactat3840
ttatattttatcatctaataacaataaaagtattagttaaatattaaacgttggatatga3900
atagtttaaaactgtattgttttggggcggagggagtaattgattgatggattaattaag3960
tggttgactaatgtgtgtgtgatttatttgtgtagcggaggaggagatgtcggggtcgtc4020
ggagtcgggggaggaggaggaggggtcgggcggggagccggaggcgaagcggcggcggct4080
gagccggctggggtcgagcgtggtgaggagcgcgacggtggtggcgaggacgctggtggc4140
gtgcgaggagaagcgggagcgccggcaccgggagctgctgcagctggaggagcggcggct4200
gcgcctcgaggaggagcgcaccgaggtccgccgccagggcttcgccggcctcatcgccgc4260
cgtcaacagcctctcctccgccatccacgccctcgtctccgaccaccgcagcggcgactc4320
ctccggccgatgatcgccattgcaatcatatgcaatgcagcaaggacgatcgatgtaaat4380
aacccatggagatgcatggatcgaggcatcggattattatgtttggaatggctgcaagaa4440
gaggagtagctaggctaggggattaatttttttttttttgagtgtgcatcgccatcgcgt4500
cgtctgcgagtattgggagtacggtgcattgcatgcacaacgcctccgtttcttgatttc4560
tttctttctctcctgtgtcctgtgatttttttgttgtttattcttttcgtgcaattagtg4620
gagagactggcaggtgtgtggtgtgaatgatcgaaatggttagtgtggctgctgctggtg4680
gtgctgttgctgttgctgcgttttttcttctcgggtgttgggtttgtcgtggacggcgat4740
cattagcggcacagtggatgagagagctgagctctagctgcaggtcgcttggtctcgctg4800
cgctgtcatgtgatcactactgcgcatgggggccacggttaccgctatagctgctgcaac4860
tgcgtgcgagaacgagctcgtgctgagctatac4893
<210>5
<211>1167
<212>dna
<213>人工序列
<220>
<223>
<400>5
atgtcgggctcctctgctgccgacccctcgccatccgcgtcgaccgcgggggcggcggcc60
tcgccgctcgcgctgctccgcgcgcacgggcacgggcacctcacgccgccgtcggcggcg120
acggggccggcgccgccgccgccgtcgccggcgtcggggtcggcgccgcgggactaccgc180
aaggggaactggacgctccacgagacgctcatcctcatcaccgccaagcgtctcgacgac240
gaccgccgcgccggcgttgggggtggcgcggcggctggtggcggtggcgccggatcgccg300
ccgacgccgaggtcggcggagcagcggtggaagtgggtggagaactactgctggaagaac360
ggctgcctccgcagccagaaccagtgcaatgacaagtgggacaacctcctccgcgactac420
aagaaggtccgcgactacgagtcccgcgtcgccgccgccgccgtcaccggcggcgcggcc480
gccgccaactccgcccccctcccgtcgtactggacgatggagcggcacgagcgcaaggac540
tgcaacctccccaccaacctggcgccggaggtctacgacgcgctctccgaggtgctctcc600
cgccgcgcggcgcgacgcggcggcgccacgatcgcgcccaccccgccgccaccaccgctc660
gcgctgccgccgccgccgccgccgccctcgccgccgaagcctctcgtcgcgcagcagcac720
caccaccatcacggccatcaccaccacccacctcctcctcagccgccgccgtcgtcgctg780
cagctccctccggcggtcgtggctccgccgccggcgtccgtttccggtgcggaggaggag840
atgtcggggtcgtcggagtcgggggaggaggaggaggggtcgggcggggagccggaggcg900
aagcggcggcggctgagccggctggggtcgagcgtggtgaggagcgcgacggtggtggcg960
aggacgctggtggcgtgcgaggagaagcgggagcgccggcaccgggagctgctgcagctg1020
gaggagcggcggctgcgcctcgaggaggagcgcaccgaggtccgccgccagggcttcgcc1080
ggcctcatcgccgccgtcaacagcctctcctccgccatccacgccctcgtctccgaccac1140
cgcagcggcgactcctccggccgatga1167
<210>6
<211>1173
<212>dna
<213>人工序列
<400>6
atgtcgggctcctctgctgccgacccctcgccatccgcgtcgaccgcgggggcggcggcc60
tcgccgctcgcgctgctccgcgcgcacgggcacgggcacctcacgccgccgtcggcggcg120
acggggccggcgccgccgccgccgtcgccggcgtcggggtcggcgccgcgggactaccgc180
aaggggaactggacgctccacgagacgctcatcctcatcaccgccaagcgtctcgacgac240
gaccgccgcgccggcgttgggggtggcgcggcggctggtggcggtggcgccgggtcgccg300
ccgacgccgaggtcggcggagcagcggtggaagtgggtggagaactactgctggaagaac360
ggctgcctccgcagccagaaccagtgcaatgacaagtgggacaacctcctccgcgactac420
aagaaggtccgcgactacgagtcccgcgtcgccgccgccgccgtcaccggcggcgcggcc480
gccgccaactccgcccccctcccgtcgtactggacgatggagcggcacgagcgcaaggac540
tgcaacctccccaccaacctggcgccggaggtctacgacgcgctctccgaggtgctctcc600
cgccgcgcggcgcgacgcggcggcgccacgatcgcgcccaccccgccgccaccaccgctc660
gcgctgccgccgccgccgccgccgccgccgccctcgccgccgaagcctctcgtcgcgcag720
cagcaccaccaccatcacggccatcaccaccacccacctcctcctcagccgccgccgtcg780
tcgctgcagctccctccggcggtcgtggctccgccgccggcgtccgtttccggtgcggag840
gaggagatgtcggggtcgtcggagtcgggggaggaggaggaggggtcgggcggggagccg900
gaggcgaagcggcggcggctgagccggctggggtcgagcgtggtgaggagcgcgacggtg960
gtggcgaggacgctggtggcgtgcgaggagaagcgggagcgccggcaccgggagctgctg1020
cagctggaggagcggcggctgcgcctcgaggaggagcgcaccgaggtccgccgccagggc1080
ttcgccggcctcatcgccgccgtcaacagcctctcctccgccatccacgccctcgtctcc1140
gaccaccgcagcggcgactcctccggccgatga1173