本發(fā)明屬于生物技術領域,具體地說,涉及一種薩能奶山羊胎兒成纖維細胞miRNA的篩選與鑒定方法。
背景技術:
截止目前,miRNA的鑒別及發(fā)現(xiàn)主要有三種方法:miRNA cDNA文庫測序法,生物信息學預測法和正向遺傳性篩選。
生物信息學已經發(fā)現(xiàn)了大量新miRNA,但該方法存在一個弊端:它是通過對已知miRNA序列或者前體序列規(guī)律的總結去鑒別新miRNA,因此導致預測結果精確度不高,而且容易出現(xiàn)假陽性和假陰性。正向遺傳學篩選是分子生物學家最初使用的一種研究方法,它是通過生物個體或細胞基因組的自發(fā)突變或人工誘變產生的變異表型而鑒定候選miRNA。使用該方法最早鑒定發(fā)現(xiàn)了lin-4,let-7,后來通過這種方法又鑒別發(fā)現(xiàn)了果蠅中的miR-278、miR-14以及線蟲中的lsy-6??墒牵ㄟ^正向遺傳學篩選鑒別候選miRNA的效率比較低;如果miRNAs只是單個堿基發(fā)生突變、缺失、錯位或堿基的改變僅僅使表型發(fā)生微小的差異甚至沒有變化,造成許多候選miRNAs的鑒別發(fā)生遺漏,因此該方法已經慢慢被淘汰。
miRNA cDNA文庫測序法包括直接克隆法和高通量測序法,直接克隆法效率相對比較低,費時費力,具有明顯的局限性。相對于克隆測序技術,高通量測序具有高效性、精確性以及快速性等優(yōu)點,提取RNA接頭連接反轉錄后只進行PCR擴增,直接上機測序即可,不需要克隆過程,再將測序結果進行生物信息學分析及靶基因預測等,從而獲得新miRNA。目前,高通量測序技術已經廣泛應用到各種植物及動物的miRNA研究當中。目前,現(xiàn)有技術中還沒有一種薩能奶山羊胎兒成纖維細胞miRNA的篩選與鑒定方法。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種薩能奶山羊胎兒成纖維細胞miRNA的篩選與鑒定方法,該方法利用高通量測序技術及生物信息學技術對薩能奶山羊胎兒成纖維細胞miRNA進行鑒定并作GO功能分析及KEGG通路分析。
其具體技術方案為:
一種薩能奶山羊胎兒成纖維細胞miRNA的篩選與鑒定方法,包括以下步驟:
步驟1、薩能奶山羊胎兒成纖維細胞的獲得:
選取5只奶山羊做同期發(fā)情,與最后一次配種30天B超檢查妊娠狀況,選成功妊娠并與40-45天通過手術法無菌取出胎兒,用含雙抗PBS沖洗三遍,放入無血清培養(yǎng)基快速帶回實驗室。在細胞室內無菌除去頭、四肢、內臟,剩余皮膚組織酒精沖洗三遍,PBS沖洗三遍,然后剪成1mm3小塊貼在細胞培養(yǎng)皿進行培養(yǎng),每三天換一次培養(yǎng)基,待細胞鋪滿90%時消化傳代,并作生長曲線及核型分析;
步驟2、RNA提?。?/p>
取對數生長期的細胞用trizol法提取RNA,該實驗用到的所有物品包括1000mL、200μL、10μL tip頭、槍頭盒、Enpendoff管必須用0.1%的DEPC水或無RNA酶水浸泡6h以上或直接過夜,包裝好后高壓滅菌20-30min,65℃烘干備用;用到的所有研缽、玻璃器皿、金屬器械用錫箔紙包裝好后放于180℃烘箱中烘烤8h以上,自然降溫備用,提取的總RNA經微量分光光度計檢查純度及濃度,合適以后送華大基因進行高通量測序;
步驟3、文庫構建及高通量測序
取上述總RNA經PAGE膠純化、反轉錄,然后以HiSeq2000為測序平臺進行高通量測序構建cDNA文庫;
步驟4、數據處理
薩能奶山羊胎兒成纖維細胞樣品在HiSeq2000平臺測序后得到冗余數據,對該原始數據首先要進行去低質量序列,去接頭序列以及去污染序列處理,獲得干凈序列即clean reads,然后再進行下一步生物信息學分析;
將獲得的clean reads與綿羊全基因組數據庫進行blast比對,用SOAPv1.11軟件分析序列表達差異及分布情況,為了使每個unique sRNA有唯一的注釋,我們采用如下優(yōu)先規(guī)則:rRNAetc>known miRNA>repeat>exon>intron,由于rRNAetc是經Genbank數據庫和Rfam數據庫比對獲得,實驗規(guī)定兩個數據庫間的優(yōu)先順序為Genbank>Rfam,沒有比對上任何注釋信息的sRNA用unann表示。
為進一步分析候選miRNA二級結構,該實驗用Mfold3.2軟件]和RNAfold在線軟件預測新miRNA頸環(huán)結構及最小自由能,用MIREAPv0.2軟件再進一步深入分析每一個候選序列,參數設置如下:
(1)miRNA序列長度為18-26nt
(2)miRNA參考序列長度為20-24nt
(3)Drosha/Dicer酶切位點最少為3個
(4)miRNA在參考序列上最大拷貝數為20
(5)miRNA前體允許的最大自由能為200kcal/mol
(6)miRNA和miRNA*之間最大空格數為35
(7)miRNA和miRNA*之間最小配對數為14
(8)miRNAand miRNA*之間最大凸環(huán)為4。
進一步,步驟3中具體操作過程依據Small RNA Sample Preparation Kit(Illumina,USA)試劑盒說明書步驟進行,簡單過程如下:
(1)首先通過15%聚丙酰胺凝膠電泳分離總RNA,切割片段為18-30nt部分,然后進行分離純化、膠回收;
(2)通過T4RNA連接酶分別在3’端和5’端添加3’((PO4)-CTGTAGGCACCATCAA-(NH2)-(CH2)6)和5’(ATCGTAGGCACCUGAAA)接頭序列
(3)將成功添加接頭序列的RNA進行反轉錄成cDNA,然后25個循環(huán)進行PCR擴增。
(4)90bp左右的PCR擴增產物經PAGE膠純化回收以后其產物在深圳華大科技HiSeq2000平臺進行測序。
(5)測序片段去除低質量序列、接頭序列、重復序列以及污染序列后進行信息生物學分析。
進一步,步驟4中進行去低質量序列,去接頭序列以及去污染序列處理的過程具體如下:
(1)去除有5’接頭序列的reads;
(2)去除沒有3’接頭序列的reads;
(3)去除測序質量較低的reads;
(4)去除沒有插入片段的reads;
(5)去除含有polyA的reads;
(6)去除小于18核苷酸的片段。
與現(xiàn)有技術相比,本發(fā)明的有益效果:
本發(fā)明通過高通量測序,獲得16395039 total_reads,取出冗余數據后獲得clean_reads 16150181,其中Unique sRNAS 205857。生物信息學分析獲得已知miRNA 44條,候選新miRNA247條。已知miRNA靶基因數量5401,靶基因位點數為6069;候選miRNA靶基因數量8401,靶基因位點數位10832。
附圖說明
圖1是:高通量測序準備流程圖;
圖2是:生物信息學分析流程圖;
圖3是:部分候選新miRNA前體二級結構。
具體實施方式
下面結合附圖和具體實施方案對本發(fā)明的技術方案作進一步詳細地說明。
一種薩能奶山羊胎兒成纖維細胞miRNA的篩選與鑒定方法,包括以下步驟:
步驟1、薩能奶山羊胎兒成纖維細胞的獲得:
選取5只奶山羊做同期發(fā)情,與最后一次配種30天左右B超檢查妊娠狀況,選成功妊娠并與40-45天左右通過手術法無菌取出胎兒,用含雙抗PBS沖洗三遍,放入無血清培養(yǎng)基快速帶回實驗室。在細胞室內無菌除去頭、四肢、內臟,剩余皮膚組織酒精沖洗三遍,PBS沖洗三遍,然后剪成1mm3小塊貼在細胞培養(yǎng)皿進行培養(yǎng),每三天換一次培養(yǎng)基,待細胞鋪滿90%時消化傳代,并作生長曲線及核型分析;
步驟2、RNA提?。?/p>
取對數生長期的細胞用trizol法提取RNA,該實驗用到的所有物品包括1000mL、200μL、10μL tip頭、槍頭盒、Enpendoff管等均必須用0.1%的DEPC水或無RNA酶水浸泡6h以上或直接過夜,包裝好后高壓滅菌20-30min,65℃烘干備用;用到的所有研缽、玻璃器皿、金屬器械等用錫箔紙包裝好后放于180℃烘箱中烘烤8h以上,自然降溫備用,提取的總RNA經微量分光光度計檢查純度及濃度,合適以后送華大基因進行高通量測序;
步驟3、文庫構建及高通量測序
取上述總RNA經PAGE膠純化、反轉錄,然后以HiSeq2000為測序平臺進行高通量測序構建cDNA文庫,建庫過程及生物信息學分析流程如圖1、圖2;
具體操作過程依據Small RNA Sample Preparation Kit(Illumina,USA)試劑盒說明書步驟進行,簡單過程如下:
(1)首先通過15%聚丙酰胺凝膠電泳分離總RNA,切割片段為18-30nt部分,然后進行分離純化、膠回收;
(2)通過T4RNA連接酶分別在3’端和5’端添加3’((PO4)-CTGTAGGCACCATCAA-(NH2)-(CH2)6)和5’(ATCGTAGGCACCUGAAA)接頭序列
(3)將成功添加接頭序列的RNA進行反轉錄成cDNA,然后25個循環(huán)進行PCR擴增。
(4)90bp左右的PCR擴增產物經PAGE膠純化回收以后其產物在深圳華大科技HiSeq2000平臺進行測序。
(5)測序片段去除低質量序列、接頭序列、重復序列以及污染序列后進行信息生物學分析。
步驟4、數據處理
薩能奶山羊胎兒成纖維細胞樣品在HiSeq2000平臺測序后得到冗余數據,對該原始數據首先要進行去低質量序列,去接頭序列以及去污染序列等處理,獲得干凈序列即clean reads,然后再進行下一步生物信息學分析。其處理過程具體如下:
(1)去除有5’接頭序列的reads;
(2)去除沒有3’接頭序列的reads;
(3)去除測序質量較低的reads;
(4)去除沒有插入片段的reads;
(5)去除含有polyA的reads;
(6)去除小于18核苷酸的片段;
將獲得的clean reads與綿羊全基因組數據庫(International Sheep Genomics Consortium:ISGC)進行blast比對,用SOAPv1.11軟件分析序列表達差異及分布情況,為了使每個unique sRNA有唯一的注釋,我們采用如下優(yōu)先規(guī)則:rRNAetc>known miRNA>repeat>exon>intron,由于rRNAetc是經Genbank數據庫和Rfam數據庫比對獲得,實驗規(guī)定兩個數據庫間的優(yōu)先順序為Genbank>Rfam,沒有比對上任何注釋信息的sRNA用unann表示。
為進一步分析候選miRNA二級結構,該實驗用Mfold3.2軟件]和RNAfold在線軟件預測新miRNA頸環(huán)結構及最小自由能,用MIREAPv0.2軟件再進一步深入分析每一個候選序列,參數設置如下:
(1)miRNA序列長度為18-26nt
(2)miRNA參考序列長度為20-24nt
(3)Drosha/Dicer酶切位點最少為3個
(4)miRNA在參考序列上最大拷貝數為20
(5)miRNA前體允許的最大自由能為200kcal/mol
(6)miRNA和miRNA*之間最大空格數為35
(7)miRNA和miRNA*之間最小配對數為14
(8)miRNA and miRNA*之間最大凸環(huán)為4。
以上所述,僅為本發(fā)明較佳的具體實施方式,本發(fā)明的保護范圍不限于此,任何熟悉本技術領域的技術人員在本發(fā)明披露的技術范圍內,可顯而易見地得到的技術方案的簡單變化或等效替換均落入本發(fā)明的保護范圍內。