專利名稱:長葉紅砂耐鹽特有基因序列Rt-st11787在植物抗鹽基因工程中的應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于植物生物技術(shù)領(lǐng)域,具體地說,涉及一種特有鹽生植物長葉紅砂的耐鹽性狀基因。本發(fā)明選用內(nèi)蒙古東阿拉善-西鄂爾多斯地區(qū)特有耐鹽植物長葉紅砂為試材,運用Illumina/Solexa轉(zhuǎn)錄組深度測序獲得長葉紅砂耐鹽基因,對候選長葉紅砂耐鹽基因進(jìn)行生物信息學(xué)分析,了解基因的功能及其履行的生物學(xué)功能。
背景技術(shù):
長葉紅砂(Reaumuria trigyna Maxim.),又名黃花紅砂、黃花琵琶柴,隸屬于檉柳科(Tamaricaceae)琵琶柴屬(Reaumuria Linn.),為古地中海殘遺珍稀植物,是亞洲中部地區(qū)東阿拉善_西鄂爾多斯特有種,為該地區(qū)重要牧草之一,其生存環(huán)境極端惡劣, 為典型的高原干旱半干旱季風(fēng)氣候區(qū),該地區(qū)終年干旱、低溫、高鹽,年均降水量140. 9 302. 2mm,年均溫度6. 0 9. 2°C,土壤含鹽量可達(dá)0. 4%。長葉紅砂是典型的泌鹽鹽生植物, 葉表面和幼莖表面分布著大量的8細(xì)胞鹽腺,這一結(jié)構(gòu)可有效的將植物體內(nèi)過量的鹽分排出體外,研究表明該植物可在500mM NaCl脅迫下正長生長。隨著人類活動范圍的不斷擴大如基礎(chǔ)設(shè)施建設(shè)用地、過度放牧等對生長在該地區(qū)的植物提出了巨大的生存挑戰(zhàn)?,F(xiàn)在該物種已被列為內(nèi)蒙古自治區(qū)珍稀瀕危植物。對長葉紅砂研究的意義不僅僅在于對瀕危物種的保護(hù)上,更重要的是對于這一生存在極端環(huán)境下的植物的基因水平上的開發(fā)和利用。目前對長葉紅砂的研究主要集中在形態(tài)學(xué)、耐鹽生理機理、激素及水分調(diào)節(jié)及生物多樣性上, 而關(guān)于該物種鹽誘導(dǎo)及特有耐鹽基因的克隆及利用方面仍均無報道。誕生于20世紀(jì)70年代的Sanger法是最早廣泛應(yīng)用的DNA測序技術(shù),也是完成人類基因組計劃的基礎(chǔ)。但隨著科學(xué)技術(shù)的不斷發(fā)展,2005年以來,以Roche公司的454技術(shù)、Illumina公司的Solexa技術(shù)和ABI公司的SOLiD技術(shù)為標(biāo)志的新一代測序技術(shù)相繼誕生。新一代測序技術(shù)又稱作深度測序技術(shù),主要特點是測序通量高、測序時間和成本顯著下降。把這種高通量測序技術(shù)應(yīng)用到由mRNA逆轉(zhuǎn)錄生成的cDNA上,從而獲得來自不同基因的mRNA片段在特定樣本中的含量,這就是mRNA測序或mRNA-seq。同樣原理,各種類型的轉(zhuǎn)錄本都可以用深度測序技術(shù)進(jìn)行高通量定量檢測,統(tǒng)稱作RNA-seq或RNA測序。目前,在已經(jīng)推出的幾種新一代測序平臺中,Illumina/Solexa測序平臺上的 RNA-seq應(yīng)用最廣。該技術(shù)已被應(yīng)用到科學(xué)研究的各個領(lǐng)域,如2009年發(fā)表在Science 上的有關(guān)家蠶馴化相關(guān)基因的研究中得到354個馴化候選基因,其中包括產(chǎn)絲重要相關(guān)基因Sgf-I ;水稻研究領(lǐng)中發(fā)現(xiàn)在家養(yǎng)水稻及野生型水稻間有517個基因存在SNPs,目前 452個源于野生稻的基因已被轉(zhuǎn)入栽培稻中進(jìn)行表達(dá),其中24個基因在苗期表現(xiàn)出明顯的表型差異,16個基因已經(jīng)申請專利并被受理;此外,還運用該技術(shù)從基因組水平對青藏高原上藏人對高海拔的適應(yīng)性給出了遺傳學(xué)的解析,結(jié)果發(fā)現(xiàn),西藏自治區(qū)2個村莊的50個藏民的外顯子組,與40個北京漢人基因組數(shù)據(jù)進(jìn)行比對,鑒定出一些高原適應(yīng)候選相關(guān)基因。這些基因上發(fā)生的優(yōu)異變異可被認(rèn)為是西藏地區(qū)人類生存和繁衍后代的長期選擇的重要結(jié)果。據(jù)文獻(xiàn)報道,關(guān)于RNA-seq技術(shù)的缺點尚未出現(xiàn),但就該技術(shù)存在的難點和所面對的挑戰(zhàn)進(jìn)行了相關(guān)的描述。其中很重要的一點是高通量測序技術(shù)數(shù)據(jù)處理中的生物信息學(xué)挑戰(zhàn),也就是在測序所得數(shù)據(jù)做后續(xù)處理中怎樣克服系統(tǒng)誤差及解決偏好性的問題。以差異表達(dá)基因為基礎(chǔ)的分析中,由于基因表達(dá)水平都是通過讀段(reads)計數(shù)來估計的, 表達(dá)水平較高或轉(zhuǎn)錄本較長的基因擁有更多的讀段,更容易被多數(shù)統(tǒng)計方法識別為差異表達(dá)基因。這種偏好可能對后續(xù)分析帶來影響。針對這種偏好性,Young等人發(fā)展了一種方法, 較好的避開了這種偏好性。另外,在植物耐鹽基因克隆及利用方明,目前大多集中在模式植物擬南芥、鹽芥或水稻,小麥等作物上。對野生天然強抗耐鹽植物的研究還比較少見, 尤其是結(jié)合高通量測序技術(shù)系統(tǒng)性發(fā)掘和篩選通過環(huán)境長期篩選出的鹽脅迫相關(guān)基因。本發(fā)明獲得的耐鹽性狀基因正是利用新一代測序技術(shù)對內(nèi)蒙古特有耐鹽植物長葉紅砂轉(zhuǎn)錄組進(jìn)行深度測序所得。
發(fā)明內(nèi)容
本發(fā)明的目的是利用二代測序技術(shù)i 1 lumina/so 1 exa系統(tǒng),對內(nèi)蒙古東阿拉善-鄂爾多斯特有鹽生植物長葉紅砂(室內(nèi)培養(yǎng)幼苗)轉(zhuǎn)錄組進(jìn)行De novo深度測序。對測序結(jié)果進(jìn)行生物信息學(xué)分析后,得到該物種轉(zhuǎn)錄組中全部與非生物脅迫相關(guān)的基因序列 (全長或部分)。最終篩選出NaCl處理前后在轉(zhuǎn)錄組水平表達(dá)量變化最明顯的耐鹽相關(guān)基因序列。本發(fā)明的實施方案是選用內(nèi)蒙古東阿拉善_西鄂爾多斯地區(qū)特有耐鹽植物長葉紅砂為試材,運用Illumina/Solexa轉(zhuǎn)錄組深度測序獲得長葉耐鹽基因,對候選長葉紅砂耐鹽基因進(jìn)行生物信息學(xué)分析,了解基因的功能及其履行的生物學(xué)功能。該方法除通量大、 速度快、成本低的優(yōu)點外,還可應(yīng)用于無全基因組背景的物種的研究上,并且,該方法產(chǎn)生的海量數(shù)據(jù),可以為后續(xù)深入研究某一物種特定代謝機理提供可靠信息。本發(fā)明的一個目的在于提供新的長葉紅砂耐鹽性狀的基因,定名為Rt_stll787, 其序列為SEQ ID No :1或SEQ IDNo 2所示的序列。本發(fā)明的另一個目的在于提供上述基因編碼的多肽。本發(fā)明的再一個目的在于提供含有上述基因序列的表達(dá)載體。根據(jù)本發(fā)明的一方面,一種在NaCl脅迫下表達(dá)量明顯上升的基因Rt_stll787,來源于長葉紅砂(Reaumuria trigyna Maxim.),名稱為Rt_stll787,其核苷酸序列如序列表中SEQ ID NO :1所示,其編碼區(qū)如序列表中SEQ ID NO :2所示,其編碼的325個氨基酸序列,如序列表中SEQ ID N0:3所示。該基因是參與滲透脅迫通路MAPK信號級聯(lián)系統(tǒng)前體 MAPKK家族成員。具體地說,本發(fā)明提供了含有下述序列之一的分離的多核苷酸(1)序列表中的 SEQ ID NO 1 和 SEQ ID NO 2 ;(2)與序列表中SEQ ID NO :1或SEQ ID NO :2限定的DNA序列具有90%以上同源性,且編碼相同功能蛋白質(zhì)的DNA序列;上述涉及的多核苷酸還包括取代、缺失、和插入變體以及等位變體、剪接變體、片段、衍生物等,其中可以通過取代、缺失、插入或衍生一個或多個核苷酸。優(yōu)選的這些多核苷酸是那些具有同樣耐鹽性狀的功能。本領(lǐng)域 技術(shù)人員可以理解的是,上述的分離的多核苷酸也包括那些與SEQ ID NO 1或SEQ ID NO :2所示序列具有較高同源性的序列,例如同源性大于90%、甚至95%、甚至 98%的序列;還包括那些在嚴(yán)謹(jǐn)條件下可與SEQ ID NO. 1或SEQ ID NO 2所示序列雜交的序列;或者可與SEQ ID NO. 1或SEQ ID NO 2所示序列互補的序列。根據(jù)本發(fā)明的另一方面,本發(fā)明亦提供包括一種或多種上述多核苷酸的重組載體。在優(yōu)選的實施方案中,這種重組載體包括上述的多核苷酸,它編碼含SEQ ID N0:3的多肽,其含SEQ ID NO :1或SEQ ID NO 2的序列所示的多核苷酸。本發(fā)明同時提供了將本發(fā)明的新基因Rt_stll787應(yīng)用于植物抗鹽基因工程中的技術(shù)方案。本發(fā)明從長葉紅砂中成功地分離獲得了在NaCl脅迫下表達(dá)量明顯上升的基因 Rt-stll787,這給利用基因工程手段改造植物從而提高其抗鹽能力提供了方向和靶點,對于植物在高NaCl脅迫環(huán)境下的育種試驗具有重要意義。具體來說,本發(fā)明的具體實施方案之一是將Rt_stll787基因應(yīng)用于植物基因工程以提高植物在高NaCl脅迫環(huán)境下生存能力的途徑。以上概括的描述了本發(fā)明,可通過參照本文提供的某些具體實施例進(jìn)一步理解本發(fā)明,這些實施例僅是為了說明而不是限制本發(fā)明。
圖1 對建好的測序文庫用Illumina HiSeq 2000進(jìn)行測序的流程圖;圖2 =Unigene生物信息學(xué)分析的流程圖,clean reads代表測序所得原始 reads (讀段)去掉只含adaptor (接頭)序列的部分,Unigenes代表經(jīng)組裝所得序列;圖3 將測序組裝所得的65340條imigene通過COG注釋到25個分子家族,縱軸代表Unigenes的數(shù)量,橫軸各字母代表25種基因功能分類其中A代表RNA加工和修改 (RNA processing and modification) ;B代表染色質(zhì)結(jié)構(gòu)禾口動力學(xué)(Chromatin structure and dynamics) ;C 代表能源生產(chǎn)禾口轉(zhuǎn)換(Energy production and conversion) ;D 代表細(xì)胞周期調(diào)控,細(xì)胞分裂,染色體分離(Cell cycle control, cell division, chromosome partitioning) ;E ^ M S1 St is % ^ ilt (Amino acid transport and metabolism) ;F 代表核苷酸轉(zhuǎn)運與代謝(Nucleotide transport and metabolism) ;G 代表碳水化合物運輸和代謝(Carbohydrate transport and metabolism) ;H代表運輸和代謝的輔酶(Coenzyme transport and metabolism) ;I代表脂質(zhì)轉(zhuǎn)運和代謝(Lipid transport and metabolism) ;J 代表番羽譯、核糖體結(jié)構(gòu)禾口合成(Translation, ribosomal structure and biogenesis) ;K 代表轉(zhuǎn)錄(Transcription) ;L 代表復(fù)制,重組和修復(fù) (Replication, recombination and repair) ;M 代表細(xì)胞壁 / 膜 / 胞膜合成(Cell wall/ membrane/envelope biogenesis) ;N ft Ifig云力(Cell motility) ;0if Bff % (Post-translational modification) ;P ^^c|/l^^is%^ilt (Inorganic ion transport and metabolism) ;Q代表生物合成,運輸和代謝的次生代謝產(chǎn)物(Secondary metabolites biosynthesis, transport and catabolism) ;R 代表一般功能預(yù)測(General function prediction only) ;S 代表功能未知(Function unknown) ;T 代表信號轉(zhuǎn)導(dǎo)機制(Signal transduction mechanisms) ;U 代表 細(xì)胞內(nèi),分泌禾口膜泡運輸胞(Intracellular trafficking, secretion, and vesicular transport) ;V 代表防 M l/l ffj!j (Defense mechanisms) ;W 代表胞夕卜結(jié)構(gòu)(Extracellular structures) ;Y 代表核結(jié)構(gòu)(Nuclear structure) ;Z 代表細(xì)胞骨架(Cytoskeleton);圖4 在5032條差異表達(dá)基因,其中上調(diào)(T43相對于C21表達(dá)量增加)基因2370 條,下調(diào)(C21相對于T43表達(dá)量增加)基因2662條,圖中由兩條曲線劃分出三個區(qū)域,偏上區(qū)域代表上調(diào)差異表達(dá)基因,偏下區(qū)域代表下調(diào)差異表達(dá)基因,中間區(qū)域為未檢測到的差異表達(dá)基因(Not detected expression genes)。
具體實施例方式實施例1.長葉紅砂幼苗培養(yǎng)長葉紅砂種子于2008年9月采自內(nèi)蒙古自治區(qū)東阿拉善-西鄂爾多斯地區(qū),挑選飽滿種子用10%次氯酸鈉滅菌15min,滅菌ddH20沖洗三遍,播種于裝有40ml MS培養(yǎng)基的 150ml三角瓶中。暗培養(yǎng)72h后在25°C、濕度70%、16h:8h光照/黑暗的條件下培養(yǎng)。幼苗生長至IOcm(大約15d)左右,轉(zhuǎn)移至25cm高,直徑5cm的大試管中培養(yǎng),每兩天換一次滅菌l/2H0agland營養(yǎng)液,每次約50ml。挑選三株長勢相近的長葉紅砂幼苗為實驗試材, NaCl處理前,適當(dāng)剪取三株幼苗莖葉;對幼苗進(jìn)行IOOmM NaCl處理后,于0. 5h、lh、2h、4h 及8h收取適量幼苗,NaCl濃度也隨即增加到200mM,8h后收取材料并重復(fù)該步直至收獲到 400mM NaCl處理材料為止,所有材料在收獲后應(yīng)迅速保存在液氮中備用。實施例2.RNA_seq cDNA文庫的制備a. total RNA 的提取采用plant plus RNA regent (DP437,Tiangen,Bei jing)根據(jù)用法說明進(jìn)行總 RNA 的提取,對所得總RNA進(jìn)行45分鐘DNase I (TaKaRa)消化,取1. 5 μ 1進(jìn)行1 %瓊脂糖凝膠電泳,Nanovue plus測定260/2800D值均在1. 9 2. 1之間、260/230均大于2. 0。將對照及鹽脅迫處理樣品分別等量混合,得到兩樣本RNA池C21、T43。最后對兩樣品做Agilent 2100檢測。b.測序文庫的制備 總RNA用帶有01 igo (dT)的磁珠富集mRNA后將mRNA片段化,以mRNA為模板,用六堿基隨機引物(random hexamers)合成cDNA第一鏈,然后加入緩沖液、dNTPs、RNaseH和 DNA polymerase I合成cDNA第二鏈。反轉(zhuǎn)錄產(chǎn)物經(jīng)QiaQuick PCR試劑盒純化后做末端修復(fù)、加poly (A)并連接測序接頭,瓊脂糖凝膠電泳進(jìn)行片段大小選擇后進(jìn)行PCR擴增,建好的測序文庫用Illumina HiSeq 2000進(jìn)行測序(流程圖可見附圖1)。實施例3.測序結(jié)果組裝及生物信息學(xué)分析a.測序結(jié)果組裝使用短reads組裝軟件SOAPdenovo (組裝軟件)做轉(zhuǎn)錄組從頭組裝。SOAPdenovo 首先將具有一定長度overlap (重疊)的reads (讀段)連成更長的片段,這些通過reads overlap關(guān)系得到的不含N的組裝片段我們稱之稱為Contig。將reads比對回Contig,通過paired-end reads能確定來自同一轉(zhuǎn)錄本的不同 Contig以及這些Contig之間的距離,SOAPdenovo將這些Contig連在一起,中間未知序列用N表示,這樣就得到Scaffold。進(jìn)一步利用paired-end reads對Scaffold做補洞處理, 最后得到含N最少,兩端不能再延長的序列,我們稱之為Unigene。如果同一物種做了多個樣品測序,則不同樣品組裝得到的Unigene可通過序列聚類軟件TGICL做進(jìn)一步序列拼接和去冗余處理,得到盡可能長的非冗余Unigene。 b. unigene生物信息學(xué)分析(分析流程見附圖2)通過blastx將Unigene序列比對到蛋白數(shù)據(jù)庫nr、Swiss-Prot、KEGG禾口 C0G(evalue < 0. 00001),得到跟給定Unigene具有最高序列相似性的蛋白,從而得到該 Unigene的蛋白功能注釋信息。GO注釋將組裝所得的65340條unigene注釋到三個ontology,分別是分子功能(molecular function)、所處的細(xì)胞位置(cellular component)、參與的生物過程 (biological process)。對于GO注釋而言,Gene Ontology (簡稱GO)是一個國際標(biāo)準(zhǔn)化的基因功能分類體系,提供了一套動態(tài)更新的標(biāo)準(zhǔn)詞匯表(controlled vocabulary)來全面描述生物體中基因和基因產(chǎn)物的屬性。GO總共有三個ontology (本體),分別描述基因的分子功能(molecular function)、所處的細(xì)胞位置(cellular component)、參與的生物過程(biological process)。GO的基本單位是term (詞條、節(jié)點),每個term都對應(yīng)一個屬性。GO功能分析一方面給出差異表達(dá)基因的GO功能分類注釋;另一方面給出差異表達(dá)基因的GO功能顯著性富集分析。COG注釋將所得unigene注釋到25個分子家族,主要包括細(xì)胞結(jié)構(gòu)、生物化學(xué)代謝、分子過程、信號轉(zhuǎn)導(dǎo)、基因表達(dá)以及刺激響應(yīng)等,如附圖3所示。對于COG注釋而言, COG 是 Cluster of Orthologous Groups of proteins (蛋白相鄰類的聚簇)的縮寫。構(gòu)成每個COG的蛋白都是被假定為來自于一個祖先蛋白,并且因此或者是orthologs或者是 Paralogs0 Orthologs是指來自于不同物種的由垂直家系(物種形成)進(jìn)化而來的蛋白,并且典型的保留與原始蛋白有相同的功能。Paralogs是那些在一定物種中的來源于基因復(fù)制的蛋白,可能會進(jìn)化出新的與原來有關(guān)的功能。對于KEGG(京都基因與基因組百科全書)而言,它是基因組破譯方面的數(shù)據(jù)庫。在后基因時代一個重大挑戰(zhàn)是如何使細(xì)胞和有機體在計算機上完整的表達(dá)和演繹,讓計算機利用基因信息對更高層次和更復(fù)雜細(xì)胞活動和生物體行為作出計算推測。為達(dá)到此目的, 人們建立了一個在相關(guān)知識基礎(chǔ)上的網(wǎng)絡(luò)推測計算工具。在給出染色體中一套完整的基因的情況下,它可以對蛋白質(zhì)交互(互動)網(wǎng)絡(luò)在各種細(xì)胞活動起的作用作出預(yù)測。KEGG的 Pathway數(shù)據(jù)庫整合當(dāng)前在分子互動網(wǎng)絡(luò)(比如通道,聯(lián)合體)的知識。實施例4.差異表達(dá)基因的獲得和其功能注釋經(jīng)測序共得非冗余序列65340條,比較C21及T43兩樣本測序結(jié)果得到差異表達(dá)基因信息,差異表達(dá)基因篩選參照Audic S.等人發(fā)表在Genome Research上的基于測序的差異基因檢測方法,公式如下P(X)( λ為基因A的真實轉(zhuǎn)錄數(shù))
χ 假設(shè)觀測到基因A對應(yīng)的reads (測序所產(chǎn)生的短片段)數(shù)為X,已知在一個大文庫中,每個基因的表達(dá)量只占所有基因表達(dá)量的一小部分,在這種情況下,p(X)的分布服從泊松分布。已知,樣本一能比對到所有Unigene的總reads數(shù)為Ni,樣本二能比對到所有Unigene的總reads數(shù)為N2,基因A在樣本一中對應(yīng)的reads數(shù)為X,在樣本二中對應(yīng)的 reads數(shù)為y,則基因A在兩樣本中表達(dá)量相等的概率可由以下公式計算
權(quán)利要求
1.長葉紅砂(Reaumuriatrigyna Maxim.)耐鹽性狀基因Rt_stll787,其序列為SEQ ID No :1或SEQ ID No 2所示的序列。
2.一種分離的多核苷酸,其序列為與權(quán)利要求1中所示的核苷酸序列互補的核苷酸序列。
3.由權(quán)利要求1或2中所述的核苷酸序列編碼的多肽。
4.權(quán)利要求3所述的多肽,其序列為如SEQID No. 3所示的序列。
5.含有權(quán)利要求1或2中所述的多核苷酸的表達(dá)載體。
6.權(quán)利要求1或2中所述的分離的多核苷酸在植物抗鹽基因工程中的應(yīng)用。
全文摘要
本發(fā)明涉及一種特有鹽生植物長葉紅砂(Reaumuria trigyna Maxim.)的耐鹽性狀基因Rt-st11787。本發(fā)明選用內(nèi)蒙古東阿拉善-西鄂爾多斯地區(qū)特有耐鹽植物長葉紅砂為試材,運用Illumina/Solexa轉(zhuǎn)錄組深度測序獲得長葉紅砂耐鹽相關(guān)基因,對候選長葉紅砂耐鹽基因進(jìn)行生物信息學(xué)分析,最終篩選出NaCl處理前后在轉(zhuǎn)錄組水平表達(dá)量變化明顯的一種耐鹽性狀基因Rt-st11787。這給利用基因工程手段改造植物從而提高其抗鹽能力提供了方向和靶點,對于植物在高NaCl脅迫環(huán)境下的育種試驗具有重要意義。
文檔編號C12N15/63GK102206649SQ201110071360
公開日2011年10月5日 申請日期2011年3月24日 優(yōu)先權(quán)日2011年3月24日
發(fā)明者黨振華, 王召明, 王迎春, 祁智 申請人:內(nèi)蒙古和信園蒙草抗旱綠化股份有限公司, 內(nèi)蒙古大學(xué)