本發(fā)明涉及分子生物學技術(shù)領(lǐng)域,更特別地,涉及一種用于構(gòu)建多樣品全長轉(zhuǎn)錄組混合文庫的方法。
背景技術(shù):
轉(zhuǎn)錄組測序(Transcr iptomesequencing)主要通過高通量測序研究特定組織或細胞在某個時期轉(zhuǎn)錄出來的mRNA。轉(zhuǎn)錄組測序可全面快速地獲得某一物種特定細胞或組織在某一狀態(tài)下的幾乎所有的轉(zhuǎn)錄本及基因序列,可以用于研究基因結(jié)構(gòu)和基因功能、可變剪接和新轉(zhuǎn)錄本預(yù)測等。
傳統(tǒng)的二代轉(zhuǎn)錄組測序由于其讀長短的特點,建庫時需要進行打斷,無法直接獲得單個RNA分子由5ˊ到3ˊ的全部序列。基于PacBio三代測序平臺的全長轉(zhuǎn)錄組測序,無需打斷,能夠直接讀取反轉(zhuǎn)錄的全長cDNA,能夠有效的獲取高質(zhì)量的單個RNA分子的全部序列,準確辨別二代測序無法識別的同源異構(gòu)體(isoform)、同源基因、超家族基因或等位基因表達的轉(zhuǎn)錄本。
目前已有的全長轉(zhuǎn)錄組建庫并不支持多樣品混合建庫流程,即使混樣建庫,也僅僅是將樣品混合到一起,測序數(shù)據(jù)并不能進行有效區(qū)分。在二代轉(zhuǎn)錄組測序技術(shù)中,是可以進行多樣品混合建庫的,但由于三代測序的全長轉(zhuǎn)錄組建庫并不需要進行打斷,按照二代建庫的方法添加標簽序列會非常繁瑣,因此,需要一種新的構(gòu)建多樣品全長轉(zhuǎn)錄組混合文庫的方法。
技術(shù)實現(xiàn)要素:
為解決以上問題,本發(fā)明提供了一種構(gòu)建多樣品全長轉(zhuǎn)錄組混合文庫的方法,在逆轉(zhuǎn)錄過程中使用帶有鑒別標簽的引物分別對不同樣品中的mRNA進行逆轉(zhuǎn)錄,合成cDNA,然后將所述來自不同樣品中的cDNA混合并進行處理得到所述文庫。本發(fā)明的方法通過在逆轉(zhuǎn)錄引物中加入一段特異的標簽序列,使得逆轉(zhuǎn)錄產(chǎn)物帶上特有的標簽,在對不同樣品使用帶有不同標簽序列的引物逆轉(zhuǎn)錄以及后續(xù)PCR擴增后,都可通過該標簽來鑒別逆轉(zhuǎn)錄產(chǎn)物和PCR產(chǎn)物初始來自于哪個樣品,從而實現(xiàn)混合樣品建庫。
優(yōu)選地,所述帶有鑒別標簽的引物按5’-3’的順序包括以下區(qū)段:擴增區(qū)序列、標簽區(qū)序列和Poly(A)錨定區(qū)序列,所述Poly(A)錨定區(qū)序列包括多個胸苷,所述標簽區(qū)序列為區(qū)別來自不同樣品的cDNA的特異性序列,所述擴增區(qū)序列為用于PCR擴增的序列。其中擴增區(qū)序列用于在逆轉(zhuǎn)錄后進行PCR擴增時擴增引物的錨定,Poly(A)錨定區(qū)序列用于錨定mRNA上的Poly(A),標簽區(qū)序列用于區(qū)分樣品的來源。
優(yōu)選地,所述帶有鑒別標簽的引物的3’末端還依次包含核苷酸V和N,其中,V表示A、C或G,所述N表示A、T、C或G,并且所述帶有鑒別標簽的引物為滿足V和N的條件的所有序列的混合物。通過在引物3’末端加入V和N,使得逆轉(zhuǎn)錄的起始位點位于mRNA的Poly(A)的5’端,而不是Poly(A)中部或3’端,減小了逆轉(zhuǎn)錄產(chǎn)物的無效長度。
優(yōu)選地,所述標簽區(qū)序列的長度為10-18nt,標簽區(qū)序列需要有合適的長度以保持其相互之間的特異性,以及與基因組序列之間的特異性。
具體地,所述方法包括以下步驟:
S1:使用所述帶有不同標簽的引物別對不同樣品中的mRNA進行逆轉(zhuǎn)錄,合成cDNA;
S2:取得自各樣品的cDNA等量混合;
S3:按片段大小篩選片段;
S4:PCR擴增所篩選的片段;
S5:向S4擴增的片段添加接頭;
S6:用核酸外切酶消化S5得到的片段,消化后純化DNA片段即得到所述文庫。
進一步地,S3篩選的片段的大小為0.5-10KB。
優(yōu)選地,S4PCR擴增時所用的混合cDNA的總量為0.1-10μg,該cDNA總量的設(shè)置有助于將PCR過程中的循環(huán)數(shù)限制在合理范圍。
優(yōu)選地,在S4PCR擴增后,S5添加測序接頭之前,還包括以下步驟:
S7:DNA損傷修復;
S8:末端修復。
優(yōu)選地,在S6后還包括S9:文庫質(zhì)檢,確定文庫大小。
本發(fā)明基于三代全長轉(zhuǎn)錄組建庫無需進行打斷的特征,在實驗開始的第一步-全長cDNA的擴增中引入標簽序列,加入標簽序列后即可進行混樣,有效的簡化了操作流程,節(jié)約了試劑耗材用量,降低了實驗成本,并且實現(xiàn)了在同一個文庫中進行多個樣本混合建庫的流程。
附圖說明
圖1為構(gòu)建多樣品轉(zhuǎn)錄組混合文庫的方法的流程圖;
圖2為帶有鑒別標簽序列的引物的示意圖;
圖3為單個樣品PCR擴增后的安捷倫2100檢測圖;
圖4為混合樣品片段篩選后PCR擴增的安捷倫2100檢測圖。
具體實施方式
以下結(jié)合實例對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
對植物不同的6個組織-根、木質(zhì)莖、樹皮、葉、花、果實分別提取總RNA后進行混合文庫構(gòu)建,建立三個文庫,1-1.5kb,1.5-2kb,2-6kb,采用PACBIO RSII分別各測序1個cell,流程圖如圖1所示。具體實驗過程如下:
1.合成帶標簽的cDNA
本步操作在無RNase的超凈臺中進行,不同組織樣本分開單獨操作,且每個樣本對應(yīng)的標簽是唯一無重復的,本次實驗使用的逆轉(zhuǎn)錄引物的結(jié)構(gòu)示意圖如圖2所示,具體序列如表1所示。
表1逆轉(zhuǎn)錄使用的帶標簽的引物
1)將6個0.2mL的PCR管置于冰上,加入以下試劑:樣品1-6的總RNA1μg(按濃度換算體積)、帶標簽的引物(12μM,BC1-BC6)1μL、無核酸酶水補充至4.5μL。
2)輕柔渦旋混勻,瞬時離心,置于PCR儀上,運行如下程序:72℃3min,42℃2min,72℃到42℃降溫速率設(shè)置為0.1℃/s;
3)上述反應(yīng)結(jié)束后,將反應(yīng)產(chǎn)物添加至表2所示的逆轉(zhuǎn)錄反應(yīng)體系中,輕柔渦旋混勻,瞬時離心,在PCR儀上運行如下程序:42℃90min,70℃10min;
表2逆轉(zhuǎn)錄反應(yīng)體系
4)單樣品的PCR擴增
取新的1.5mL EP管,按表3配制PCR體系,充分混勻,瞬時離心,PCR程序為:98℃2min;98℃20s、65℃30s、72℃3.5min,15循環(huán);72℃5min。反應(yīng)完成后按照AMPure PB磁珠的操作說明使用1倍體積的磁珠進行純化,最后加入11μL的無核酸酶水洗脫;取1μL純化產(chǎn)物,使用無核酸酶水稀釋10倍,取2μL稀釋液進行Qubit定量,確定PCR產(chǎn)物的濃度與總量;取1μL稀釋液進行安捷倫2100檢測,確定片段的大小分布。如圖3所示,所有PCR產(chǎn)物的安捷倫2100檢測片段分布非常一致,片段大小分布由0.7K-5K,其主峰在1.8K。
表3單樣品PCR擴增體系
2.等量混樣
根據(jù)Qubit定量結(jié)果,每個樣本各取500ng的PCR產(chǎn)物進行混樣,混樣后的PCR產(chǎn)物總量為3μg。
3.BluePippin片段篩選
按照Bluepippin的操作說明進行目的片段的篩選,本次篩選的片段范圍為1-1.5KB、1.5-2KB、2-6KB;篩選完成后按照AMPure PB磁珠的操作說明使用1倍體積的磁珠進行純化,最后加入20μL的無核酸酶水洗脫。
4.混合樣品的PCR擴增放大
按表4配制PCR體系,2)充分混勻,瞬時離心,進行如下PCR程序:98℃2min;98℃20s、65℃30s、72℃Zmin,X循環(huán);72℃5min。其中,1-2K的延伸時間為2min,6循環(huán);2-3K的延伸時間為3min,8循環(huán);3-6K的延伸時間為5min,8循環(huán)。反應(yīng)完成后使用1倍體積的AMPure PB磁珠進行純化,最后使用37uL的無核酸酶水進行洗脫;使用安捷倫2100檢測篩選后擴增的PCR產(chǎn)物長度分布,結(jié)果如圖4所示,其第一個峰為擴增的1-1.5K的PCR產(chǎn)物,第二個峰為擴增的1.5-2K的PCR產(chǎn)物,第三個峰為擴增的2-6K的PCR產(chǎn)物,表明擴增片段大小與篩選范圍一致。
表4混合樣品PCR體系
5.DNA損傷修復
按表5配制DNA損傷修復體系,充分混勻,瞬時離心,37℃孵育20min,置于冰上。
表5DNA損傷修復體系
6.末端修復
按表6配制DNA損傷修復體系,充分混勻,瞬時離心,25℃孵育5min;使用1倍體積的AMPure PB磁珠進行純化,最后使用31uL的無核酸酶水進行洗脫。
表6末端修復體系
7.連接接頭
按表7配制接頭連接體系,充分混勻,瞬時離心,25℃孵育15min,65℃孵育10min使連接酶失活。
表7接頭連接體系
8.核酸外切酶消化
按表8配制核酸外切酶消化體系,充分混勻,瞬時離心,37℃孵育1h;孵育結(jié)束后使用1倍體積的AMPure PB磁珠進行純化,最后使用11μL的無核酸酶水洗脫。
表8核酸外切酶消化體系
9.文庫質(zhì)檢
取1μL文庫,稀釋5倍,取2μL稀釋液進行Qubit定量,計算文庫濃度;取1μL稀釋液進行2100檢測,確定文庫大小。
10上機測序
根據(jù)文庫質(zhì)檢的結(jié)果,按照PacBio測序的操作說明對1-1.5KB、1.5-2KB、2-6KB的混樣文庫分別進行上機測序,三個混樣文庫各測序1個芯片;
對測序結(jié)果進行分析,混樣文庫不同barcode的全長轉(zhuǎn)錄本識別比例差異誤差在±30%以內(nèi)。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。