2b-RAD混合建庫技術(shù)的制作方法
【專利摘要】本發(fā)明屬于分子基因組學領域,尤其涉及簡化基因組測序【技術(shù)領域】。更具體而言,本發(fā)明涉及一種2b-RAD混合建庫技術(shù)。本發(fā)明設計了20個2b-RAD混合建庫的條碼物接頭和1個通用接頭,其中所述通用接頭為SEQ ID No.31和32配對,并且SEQ ID No.1-10分別與SEQ ID No.21-30配對組成10個條碼物接頭和所述通用接頭用來進行BsaXI酶切后的建庫;SEQ ID No.11-20分別與SEQ ID No.21-30配對組成10個條碼物接頭和所述通用接頭用來進行AlfI酶切后的建庫。
【專利說明】2b-RAD混合建庫技術(shù)
【技術(shù)領域】
[0001] 本發(fā)明屬于分子基因組學領域,尤其涉及簡化基因組測序【技術(shù)領域】。
【背景技術(shù)】
[0002] 簡化基因組測序(reduced-representation sequencing)技術(shù)是近幾年在 二代測序基礎上發(fā)展起來的一系列技術(shù)的總稱,主要包括RAD (restriction-site associated DNA)、GBS (genotyping-by-sequencing)、雙酶切 GBS (two-enzyme genotyping-by-sequencing)、雙酶切 RAD(double digest restriction-site associated DNA)等技術(shù)。
[0003] 這些技術(shù)的基本原理是樣品DNA經(jīng)酶切處理后,對其進行上機測序。測序都只是 對樣品酶切位點周邊區(qū)域進行測序,而不是對全基因組進行測序。從已經(jīng)發(fā)表的文獻來看, 每個樣本的下機數(shù)據(jù)量僅為全基因組大小的〇. 05-0. 5X (不同簡化基因組測序技術(shù)之間有 差異)。由于簡化基因組測序技術(shù)數(shù)據(jù)量小、且又能夠均勻分布于整個基因組,所以這些技 術(shù)在低成本基因分型方面正得到越來越廣泛的應用,已經(jīng)被大量用于基因分型之后的遺傳 連鎖圖構(gòu)建、群體遺傳多樣性評估、種群進化分析等方面。
[0004] 在目前發(fā)表的文獻中,簡化基因組測序技術(shù)主要在Illumina Hiseq平臺上進行。 因為簡化基因組測序技術(shù)單個樣本數(shù)據(jù)量小,而Illumina Hiseq測序儀單泳道(lane)容 量較大(例如單泳道的SE50原始數(shù)據(jù)產(chǎn)量在7. 5G左右,PE50的原始數(shù)據(jù)產(chǎn)量在15G左右), 所以Illumina Hiseq測序儀單個泳道可容納幾十甚至上百個簡化基因組測序的樣本。面 對如此多的樣本,目前發(fā)表的文獻都采取混合(pooling)建庫的方式(見圖1):首先對樣 本DNA進行酶切,之后在粘性末端的一端連上一段含有條碼物(barcode)序列的條碼物接 頭(圖1中的接頭1),在另外一端的粘性末端連上一段通用接頭(圖2中的接頭2),然后將 連好接頭的DNA混合起來作為一個樣品(即混合物),最后對這個樣品進行末端修復、加A、 PCR、切膠純化等其余建庫操作。這種建庫方式,只在酶切及連接接頭這兩步需要對每個樣 本進行操作(即一樣一庫),而在混合之后,則相當于只對一個樣本進行操作(即多樣一庫), 與常規(guī)Illumina Hiseq建庫的一樣一庫相比,這樣就大大節(jié)省了人力與時間。
[0005] Illumina Hiseq平臺的常規(guī)測序文庫,比如小片段文庫、轉(zhuǎn)錄本文庫等,同樣面臨 一個泳道容納多個樣本的問題。目前的解決方式是在建庫進行到PCR步驟時,在兩條PCR 引物的其中一條上加入一段索引(index),這段引物稱為索引引物,(圖2中的PCR引物2)。 另一段引物稱為通用引物(圖2中的PCR引物1)。目前,Illumina Hiseq平臺可使用的索 引引物有1〇〇多個。這樣,在PCR產(chǎn)物中將會帶有索引,混合上機后根據(jù)索引就可區(qū)分樣本。 這樣就能混合足夠多的樣本,使測序儀的所有容量都被使用,測序成本降到最低。這種建庫 是以一樣一庫的方式進行,即要對每個樣本分別建庫,然后在上機時混合起來測序。不如簡 化基因組的多樣一庫來得簡便。
[0006] 表1對簡化基因組測序技術(shù)建庫方式與小片段建庫方式做了比較。
[0007] 表1小片段測序與簡化基因組測序建庫方式比較
[0008]
【權(quán)利要求】
1.2b-RAD混合建庫的條碼物接頭,其中SEQ ID No. 1-10分別與SEQ ID No. 21-30配對 組成10個條碼物接頭用來進行BsaXI酶切后的建庫。 2. 2b-RAD混合建庫的條碼物接頭,其中SEQ ID No. 11-20分別與SEQ ID No. 21-30配 對組成10個條碼物接頭用來進行Α1Π 酶切后的建庫。
3. 權(quán)利要求1的2-10個條碼物接頭和通用接頭組成的試劑盒,其中所述通用接頭為 SEQ ID No. 31和32配對,所述條碼物接頭選自SEQ ID No. 1-10分別與SEQ ID No. 21-30 配對組成10個條碼物接頭。
4. 權(quán)利要求2的2-10個條碼物接頭和通用接頭組成的試劑盒,其中所述通用接頭為 SEQ ID No. 31和32配對,所述條碼物接頭選自SEQ ID No. 11-20分別與SEQ ID No. 21-30 配對組成10個條碼物接頭。
5. 本發(fā)明提供了一種用于2b-RAD的混合建庫技術(shù),所述混合建庫技術(shù)使用權(quán)利要求1 或2的至少2-10個條碼物接頭。
6. 權(quán)利要求5的方法,所述方法包括如下步驟: 1) 首先對所述樣本的基因組DNA進行酶切,所述酶為BsaXI酶; 2) 將所述樣本進行分組,每η個樣本歸為一組,樣本數(shù)如果不是η的整數(shù)倍,則最后不 足η個的樣本分為一組;建庫時,為每組的每個樣品選擇一個權(quán)利要求1的條碼物接頭,同 一組中每個樣品的每個條碼物接頭各不相同,每組樣本在加完相應的條碼物接頭后和通用 接頭混合為一個樣,即η樣1庫;不足η個的樣本在加完條碼物接頭和所述通用接頭后也混 合為一個樣,其中η選自整數(shù)2-10 ; 3) 對上述混合樣進行PCR擴增,擴增時對每個混合樣使用包括不同索引引物的引物 對; 4) 將上述擴增產(chǎn)物進行測序; 5) 對于測序的下機數(shù)據(jù),首先使用所述索引引物中的索引對每個文庫進行區(qū)分,然后 根據(jù)所述條碼物接頭中條碼物對每個文庫中的每個樣本進行區(qū)分。
7. 權(quán)利要求5的方法,所述方法包括如下步驟: 1) 首先對所述樣本的基因組DNA進行酶切,所述酶為Α1Π 酶; 2) 將所述樣本進行分組,每η個樣本歸為一組,樣本數(shù)如果不是η的整數(shù)倍,則最后不 足η個的樣本分為一組;建庫時,為每組的每個樣品選擇一個權(quán)利要求2的條碼物接頭,同 一組中每個樣品的每個條碼物接頭各不相同,每組樣本在加完相應的條碼物接頭后和通用 接頭混合為一個樣,即η樣1庫;不足η個的樣本在加完條碼物接頭和所述通用接頭后也混 合為一個樣,其中η選自整數(shù)2-10 ; 3) 對上述混合樣進行PCR擴增,擴增時對每個混合樣使用包括不同索引引物的引物 對; 4) 將上述擴增產(chǎn)物進行測序; 5) 對于測序的下機數(shù)據(jù),首先使用所述索引引物中的索引對每個文庫進行區(qū)分,然后 根據(jù)所述條碼物接頭中條碼物對每個文庫中的每個樣本進行區(qū)分。
8. 權(quán)利要求6或7的方法,其中步驟2)中的通用接頭為SEQ ID No. 31和32配對。
9. 權(quán)利要求6或7的方法,其中步驟4)中測序是Illumina Hiseq平臺測序。
【文檔編號】C12Q1/68GK104232627SQ201310233439
【公開日】2014年12月24日 申請日期:2013年6月13日 優(yōu)先權(quán)日:2013年6月13日
【發(fā)明者】郭鈺, 原輝, 劉勇, 方東明, 楊巍 申請人:深圳華大基因科技有限公司