本發(fā)明涉及分子生物學(xué)技術(shù)領(lǐng)域,具體涉及一種響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法。
背景技術(shù):
高通量rna測(cè)序技術(shù)是現(xiàn)代基因組學(xué)研究最重要的技術(shù)手段,在整個(gè)生物學(xué)領(lǐng)域具有廣泛的應(yīng)用。隨著測(cè)序數(shù)據(jù)的大量積累,基因組學(xué)研究得到快速發(fā)展。在利用高通量rna測(cè)序技術(shù)運(yùn)用于差異表達(dá)基因即編碼rna的研究基礎(chǔ)上,越來越多的研究關(guān)注到基因組的非編碼rna上。這些非編碼rna包括mirnas、sirnas、lncrnas、circularrna等,其中mirnas由于其具有獨(dú)特二級(jí)結(jié)構(gòu)以及與靶基因的作用方式已經(jīng)廣泛地被證明在植物生長發(fā)育和響應(yīng)逆境脅迫的轉(zhuǎn)錄調(diào)控方面具有重要作用。而lncrnas是一類長度超過200nt,不具有蛋白編碼能力的非編碼rna,其不具有保守的二級(jí)結(jié)構(gòu),可以通過多種方式影響靶基因的轉(zhuǎn)錄調(diào)控。因此,高通量的開展lncrnas的功能注釋工作對(duì)于今后的非編碼rna的功能研究具有重要意義。
目前,已有的研究主要通過計(jì)算非編碼rna與編碼rna共表達(dá)關(guān)系的方法將lncrnas與共表達(dá)的mrna分為一組,利用mrna的注釋信息來完成lncrnas的功能注釋。該方法不僅需要大量的表達(dá)數(shù)據(jù)用于共表達(dá)分析,同時(shí)將缺失脅迫響應(yīng)特異表達(dá)lncrnas的功能注釋信息。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的第一目的在于提供了一種植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法,包括以下步驟:
步驟s1,篩選植物響應(yīng)逆境脅迫的lncrnas;
步驟s2,篩選對(duì)植物響應(yīng)逆境脅迫的lncrnas的候選靶基因;
步驟s3,植物響應(yīng)逆境脅迫的lncrnas的靶基因的功能注釋;
步驟s4,對(duì)響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)富集分析;
步驟s5,逆境脅迫響應(yīng)lncrnas特異二級(jí)結(jié)構(gòu)功能預(yù)測(cè)。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s1中所述逆境脅迫為低溫處理或高鹽處理;優(yōu)選地,所述低溫處理為4℃處理6小時(shí);所述高鹽處理為150mmnacl處理6小時(shí)。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s1中l(wèi)ncrnas篩選標(biāo)準(zhǔn)為①長度大于200nt;②最小讀長覆蓋率為5;③開放閱讀框小于300nt;④利用cpc分析、cnci分析編碼蛋白能力(閾值為cpcscore<0,cnciscore<0)。⑤利用cuffdiff進(jìn)行l(wèi)ncrnas差異表達(dá)分析(最小閾值為:差異倍數(shù)>2或<0.5,p-值<0.05,q-值<0.05)。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s2中對(duì)順式作用靶基因篩選規(guī)則為在篩選對(duì)逆境脅迫響應(yīng)lncrnas的上下游10kb范圍內(nèi)的基因;對(duì)反式作用靶基因篩選規(guī)則為①利用blast進(jìn)行序列互補(bǔ)計(jì)算,參數(shù)設(shè)置為e-value=1e-10,identity=90%。②利用rnaplex進(jìn)行熱力學(xué)上的互補(bǔ)計(jì)算,參數(shù)設(shè)置為e=-70。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s3中對(duì)植物響應(yīng)逆境脅迫的lncrnas的靶基因的功能注釋的方法為:利用ncbi核酸數(shù)據(jù)庫(https://blast.ncbi.nlm.nih.gov/blast.cgi)進(jìn)行功能注釋;利用agrigo(http://bioinfo.cau.edu.cn/agrigo/)對(duì)候選基因goterm進(jìn)行富集分析。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s4中對(duì)響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)富集分析方法為利用rnamotif2008對(duì)脅迫響應(yīng)的lncrnas特異二級(jí)結(jié)構(gòu)進(jìn)行富集分析。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述分析中篩選的參數(shù)設(shè)置為:①預(yù)測(cè)motif數(shù)量4-6個(gè);②stem數(shù)量4-6;③loop數(shù)量1-3個(gè)④分布模式為一般模式(normal)。共獲得富集的lncrnas二級(jí)結(jié)構(gòu)4個(gè)。
優(yōu)選地,本發(fā)明所述的植物響應(yīng)逆境脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋方法中,所述步驟s5中逆境脅迫響應(yīng)lncrnas特異二級(jí)結(jié)構(gòu)功能預(yù)測(cè)方法為根據(jù)脅迫響應(yīng)lncrnas特異二級(jí)結(jié)構(gòu)富集結(jié)構(gòu)及l(fā)ncrnas靶基因的功能注釋結(jié)果,對(duì)lncrnas特異二級(jí)結(jié)構(gòu)的功能進(jìn)行預(yù)測(cè)。
本發(fā)明還提供了上述方法在響應(yīng)逆境脅迫的植物lncrnas二級(jí)結(jié)構(gòu)功能注釋與預(yù)測(cè)中的用途。
即本發(fā)明提供一種響應(yīng)逆境脅迫的植物lncrnas二級(jí)結(jié)構(gòu)功能注釋的方法,結(jié)合生物信息學(xué)與差異表達(dá)分析對(duì)植物逆境脅迫響應(yīng)lncrnas的二級(jí)結(jié)構(gòu)進(jìn)行注釋,不但極大地提高了實(shí)驗(yàn)的效率、精準(zhǔn)性以及靈活性并顯著地降低了實(shí)驗(yàn)成本。
附圖說明
圖1為植物lncrnas響應(yīng)逆境脅迫的二級(jí)結(jié)構(gòu)功能注釋的方法流程示意圖;圖2毛白楊響應(yīng)高溫的lncrnas二級(jí)結(jié)構(gòu)功能注釋結(jié)果;
圖3小葉楊響應(yīng)滲透脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋結(jié)果。
具體實(shí)施方式
根據(jù)本發(fā)明一個(gè)典型的實(shí)施方式,待測(cè)樣本為小葉楊1年生植株。對(duì)其進(jìn)行高溫(42℃,6小時(shí))處理,立即采取葉片用于提取總rnas。利用ribo-zerorrna試劑盒對(duì)核糖體rna進(jìn)行去除。利用smart試劑盒進(jìn)行鏈特異性cdna文庫構(gòu)建。利用illuminahiseqtm2500測(cè)序平臺(tái)完成cdna文庫測(cè)序,測(cè)序深度為10×。去除接頭以及冗余序列,通過cufflinks軟件拼接轉(zhuǎn)錄本,篩選長度大于200nt、最小讀長覆蓋率為5、cpcscore<0、cnciscore<0以及與對(duì)照差異表達(dá)倍數(shù)大于2(p<0.05)的lncrnas。預(yù)測(cè)差異表達(dá)的lncrnas順式及反式作用靶基因,并對(duì)靶基因的表達(dá)模式進(jìn)行解析,篩選差異表達(dá)的靶基因作為候選基因(最小閾值為:差異倍數(shù)>2或<0.5,p-值<0.05,q-值<0.05)。對(duì)于候選基因,利用ncbi核酸數(shù)據(jù)庫(https://blast.ncbi.nlm.nih.gov/blast.cgi)進(jìn)行功能注釋。利用agrigo(http://bioinfo.cau.edu.cn/agrigo/)對(duì)候選基因goterm進(jìn)行富集分析。利用rnamotif2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)對(duì)脅迫響應(yīng)的lncrnas特異二級(jí)結(jié)構(gòu)進(jìn)行富集分析。根據(jù)脅迫響應(yīng)的lncrnas特異二級(jí)結(jié)構(gòu)富集結(jié)構(gòu)及l(fā)ncrnas靶基因的功能注釋結(jié)果,對(duì)lncrnas特異二級(jí)結(jié)構(gòu)的功能進(jìn)行預(yù)測(cè)。
以下通過具體實(shí)施例進(jìn)一步對(duì)本發(fā)明的技術(shù)方案進(jìn)行說明,應(yīng)理解以下僅為本發(fā)明的示例性說明,并不用于限制本發(fā)明權(quán)利要求的保護(hù)范圍。
實(shí)施例1
對(duì)毛白楊1年生植株進(jìn)行高溫(42℃,6小時(shí))處理,提取其總rna用于響應(yīng)高溫脅迫的lncrnas二級(jí)結(jié)構(gòu)功能注釋。
s1,利用ribo-zerorrna試劑盒對(duì)核糖體rna進(jìn)行去除。利用smart試劑盒進(jìn)行鏈特異性cdna文庫構(gòu)建。利用illuminahiseqtm2500測(cè)序平臺(tái)完成cdna文庫測(cè)序,測(cè)序深度為10×。去除接頭以及冗余序列,通過cufflinks軟件拼接轉(zhuǎn)錄本,篩選長度大于200nt、最小讀長覆蓋率為5、cpcscore<0、cnciscore<0lncrnas,共獲得3631個(gè)。篩選差異倍數(shù)大于10且小于20(p-值<0.05,q-值<0.05)的lncrnas,共16個(gè)(見表1)。
表1毛白楊響應(yīng)高溫逆境脅迫的lncrnas
s2,在14個(gè)響應(yīng)高溫脅迫的lncrna上下游各10kb范圍內(nèi)篩選順式作用靶基因,共獲得31個(gè)(見表2)。利用blast進(jìn)行序列互補(bǔ)計(jì)算,參數(shù)設(shè)置為e-value=1e-10,identity=90%以及利用rnaplex進(jìn)行熱力學(xué)上的互補(bǔ)計(jì)算,參數(shù)設(shè)置為e=-70。共獲得反式作用靶基因30個(gè)(見表3)。根據(jù)差異表達(dá)靶基因篩選標(biāo)準(zhǔn)(p-值<0.05,q-值<0.05)篩選獲得候選靶基因42個(gè)(見表4)。
表2毛白楊響應(yīng)低溫逆境脅迫的lncrnas順式作用靶基因
表3毛白楊響應(yīng)高溫逆境脅迫的lncrnas反式作用靶基因
表4毛白楊響應(yīng)高溫逆境脅迫的lncrnas靶基因功能注釋
s3,對(duì)于候選基因,利用ncbi核酸數(shù)據(jù)庫(https://blast.ncbi.nlm.nih.gov/blast.cgi)進(jìn)行功能注釋(見表4)。利用agrigo(http://bioinfo.cau.edu.cn/agrigo/)對(duì)候選基因goterm進(jìn)行富集分析(見表5)。
表5毛白楊響應(yīng)高溫逆境脅迫的lncrnas靶基因功能富集分析
s4,利用rnamotif2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)對(duì)脅迫響應(yīng)的lncrnas特異二級(jí)結(jié)構(gòu)進(jìn)行富集分析。篩選參數(shù)設(shè)置如下:①預(yù)測(cè)motif數(shù)量4-6個(gè);②stem數(shù)量4-6;③loop數(shù)量1-3個(gè)④分布模式為一般模式(normal)。共獲得富集的lncrnas二級(jí)結(jié)構(gòu)4個(gè)(見圖2)。
s5,利用lncrnas靶基因的功能注釋結(jié)果,對(duì)lncrnas特異二級(jí)結(jié)構(gòu)的功能進(jìn)行預(yù)測(cè)(見圖2)。
如圖2所示,結(jié)構(gòu)序列1,go:go:0019725細(xì)胞自動(dòng)調(diào)節(jié);
結(jié)構(gòu)序列2:go:0042592穩(wěn)定作用;
結(jié)構(gòu)序列3:go:0045454,細(xì)胞氧化還原內(nèi)穩(wěn)態(tài);
結(jié)構(gòu)序列4:go:0065008,生物質(zhì)量的監(jiān)管。
實(shí)施例2
對(duì)1年生小葉楊植株進(jìn)行滲透脅迫處理(30%聚乙二醇6000,6小時(shí)),提取其總rna用于對(duì)響應(yīng)滲透脅迫的lncrnas二級(jí)結(jié)構(gòu)的功能注釋。
s1,利用ribo-zerorrna試劑盒對(duì)核糖體rna進(jìn)行去除。利用smart試劑盒進(jìn)行鏈特異性cdna文庫構(gòu)建。利用illuminahiseqtm2500測(cè)序平臺(tái)完成cdna文庫測(cè)序,測(cè)序深度為10×。去除接頭以及冗余序列,通過cufflinks軟件拼接轉(zhuǎn)錄本,篩選長度大于200nt、最小讀長覆蓋率為5、cpcscore<0、cnciscore<0lncrnas,共獲得7360個(gè)。篩選差異倍數(shù)大于0.03且小于0.2(p-值<0.05,q-值<0.05)條件下共19個(gè)lncrnas。(見表6)。
表6小葉楊響應(yīng)滲透逆境脅迫lncrnas
s2,在19個(gè)響應(yīng)高溫脅迫的lncrna上下游10kb范圍內(nèi)篩選順式作用靶基因,共獲得53個(gè)(見表7)。利用blast進(jìn)行序列互補(bǔ)計(jì)算,參數(shù)設(shè)置為e-value=1e-10,identity=90%以及利用rnaplex進(jìn)行熱力學(xué)上的互補(bǔ)計(jì)算,參數(shù)設(shè)置為e=-70。共獲得反式作用靶基因71個(gè)(見表8)。根據(jù)差異表達(dá)靶基因篩選標(biāo)準(zhǔn)(p-值<0.05,q-值<0.05)篩選獲得候選靶基因102個(gè)(見表9)
表7小葉楊響應(yīng)滲透逆境脅迫的lncrnas順式作用靶基因
表8小葉楊響應(yīng)滲透逆境脅迫的lncrnas反式作用靶基因
表9小葉楊響應(yīng)滲透逆境脅迫的lncrnas靶基因功能注釋
s3,對(duì)于候選基因,利用ncbi核酸數(shù)據(jù)庫(https://blast.ncbi.nlm.nih.gov/blast.cgi)進(jìn)行功能注釋(見表9)。利用agrigo(http://bioinfo.cau.edu.cn/agrigo/)對(duì)候選基因goterm進(jìn)行富集分析(見表10)。
表10小葉楊響應(yīng)滲透逆境脅迫的lncrnas靶基因功能富集分析
s4,利用rnamotif2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)對(duì)響應(yīng)脅迫的lncrnas特異二級(jí)結(jié)構(gòu)進(jìn)行富集分析。篩選參數(shù)設(shè)置如下:①預(yù)測(cè)motif數(shù)量4-6個(gè);②stem數(shù)量4-6;③loop數(shù)量1-3個(gè)④分布模式為一般模式(normal)。共獲得富集的lncrnas二級(jí)結(jié)構(gòu)3個(gè)(見圖3)
s5,利用lncrnas靶基因的功能注釋結(jié)果,對(duì)lncrnas特異二級(jí)結(jié)構(gòu)的功能進(jìn)行預(yù)測(cè)(見圖3)。
如圖3所示,結(jié)構(gòu)序列1,go:0006979,抗氧化作用;
結(jié)構(gòu)序列2:go:0016310,磷酸化作用;
結(jié)構(gòu)序列3:go:0005509,鈣離子綁定。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。