專利名稱:一種對6磷酸葡萄糖脫氫酶基因進行測序的方法及試劑盒的制作方法
技術(shù)領域:
本發(fā)明涉及基因工程領域,更具體地說,涉及一種對6磷酸葡萄糖脫氫酶基因進行測序的方法及試劑盒。
背景技術(shù):
6 憐酸葡萄糖脫氧酶(Glucose-6-phosphate dehydrogenase, G6PD)基因位于染色體Xq28區(qū)域,由13個外顯子及12個內(nèi)含子組成,全長20Kb,是典型的看家基因。目前, 全世界已經(jīng)發(fā)現(xiàn)的突變類型超過140種,我國已發(fā)現(xiàn)至少30種。G6H)基因突變具有以下特點多為單個堿基置換的錯義突變;大多數(shù)基因突變屬于轉(zhuǎn)化型突變,常發(fā)生在cpg 二核苷酸內(nèi)的c-t的轉(zhuǎn)換;具有種族和地區(qū)異質(zhì)性;尚未發(fā)現(xiàn)整個基因或大片段基因的缺失,也未見無義突變及移碼突變;除外顯子I外,基因突變遍及其余外顯子;具有復合突變。Gero是細胞內(nèi)單磷酸己糖分解代謝過程中所必需,它能催化單磷酸己糖脫氫產(chǎn)生煙酰胺腺嘌呤二核苷酸(Nicotinamide adenine dinucleotide, NADPH),后者在 NADPH 氧化酶的作用下產(chǎn)生H202,從而在細胞內(nèi)發(fā)揮殺菌作用。因此,對G6H)基因進行測序,確定該樣本中的G6H) 基因的序列,具有重要的意義。目前,對G6H)基因進行測序的常見方法為Sanger測序法,通過Sanger測序法能夠?qū)δ繕藚^(qū)域進行區(qū)域檢測,但是Sanger測序法每次只能對一個樣品的G6H)基因的某一段區(qū)域(不大于900bp)進行測序,檢測效率低,測序成本高,且由于sanger測序原理的限制,在檢測帶有雜合子的樣品的信號時會出現(xiàn)雙峰乃至多峰,導致測序所得的測序峰圖紊亂,甚至無法分析得到的序列信息,測序失敗。大量的研究已經(jīng)證實,PCR產(chǎn)物直接測序法僅能于混合模板中檢測出比例> 20%的模板,且無法得出發(fā)生突變位點的精確變異比例。而現(xiàn)有技術(shù)中基于Sanger測序法的試劑盒存在同樣的缺陷。因此,需要一種檢測6磷酸葡萄糖脫氫酶基因的新方法和新試劑盒,能夠同時對 G6PD基因的多個區(qū)域進行區(qū)域檢測,提高了檢測效率,同時還能提高檢測的準確性和靈敏度,并能進一步同時對大量樣品進行檢測。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種對6磷酸葡萄糖脫氫酶基因進行測序的方法及試劑盒,能同時對Gero基因的多個目標區(qū)域進行區(qū)域檢測,提高了檢測效率,同時還能提高檢測的準確性和靈敏度,并還能進一步同時對大量樣品進行檢測。本發(fā)明是這樣實現(xiàn)的,一種對6磷酸葡萄糖脫氫酶基因進行測序的方法,包括以下步驟A.利用Gero基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,并基于擴增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區(qū)域?qū)亩鄠€單分子擴增產(chǎn)物;
C.同時對所述多個單分子擴增產(chǎn)物進行高通量基因測序,得到所述多個目標區(qū)域的序列信息。其中,所述步驟A包括以下步驟
toon] Al.利用Gero基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,得到與所述多個目標區(qū)域?qū)臄U增產(chǎn)物;A2.利用接頭元件,與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。其中,步驟A2包括以下步驟A21.對與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行片段化,得到片段化產(chǎn)物;A22.利用接頭元件,與片段化產(chǎn)物進行連接,構(gòu)建測序文庫。步驟A所述的目標區(qū)域測序文庫的長度無特殊限制,優(yōu)選為25bp 500bp。更優(yōu)選為50bp 200bp,更優(yōu)選為70bp 130bp。其中,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物;A222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物;A223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物; A224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。其中,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;A222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。其中,步驟A2所述接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫進行標記。該第一標簽序列,優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限。進一步的,該第一標簽序列堿基數(shù)為3 20,更優(yōu)選為4 10。其中,步驟A所述的特異性引物與目標區(qū)域完全互補或部分互補。進一步的,每個目標區(qū)域?qū)奶禺愋砸镏?,至少一條引物與該目標區(qū)域部分互補,該部分互補的引物的5’端包含有第二標簽序列。該第二標簽序列,用于在擴增目標區(qū)域過程中,對不同待測樣品的目標區(qū)域擴增產(chǎn)物進行標記。該第二標簽序列,優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限。進一步的,該第二標簽序列堿基數(shù)為3 20,更優(yōu)選為4 10。其中,所述步驟A中同一樣品的G6ro基因的各目標區(qū)域的擴增,同時進行或部分同時進行或分別獨立進行。其中,所述步驟A中的G6H)基因特異性引物包括SEQ ID NO :1和SEQ ID NO :24, 以及 SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO : 10、SEQ ID NO 12、SEQ ID NO: 14、SEQ ID NO: 16、SEQ ID NO: 18、SEQ ID NO :20 和 SEQ ID NO :22 中的至少一條,SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO :11、SEQ ID NO 13, SEQ ID NO :15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21 和 SEQ ID NO :23 中的至少一條。其中,步驟B所述的單分子擴增的方法為乳液PCR、橋式PCR中的至少一種。其中,步驟C所述的高通量測序技術(shù)為基于聚合酶的合成測序法或基于連接酶的連接測序法。本發(fā)明的還提供了一種能夠用于本發(fā)明的任一種測序方法的試劑盒,本發(fā)明是這樣實現(xiàn)的,一種對6磷酸葡萄糖脫氫酶基因進行測序的試劑盒,包括
Loose] Gero基因特異性引物,用于對待測樣品中的多個目標區(qū)域進行擴增;接頭元件,用于與擴增產(chǎn)物結(jié)合構(gòu)建測序文庫。其中,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。其中,所述接頭元件中的至少一個接頭包含有第一標簽序列,該第一標簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫進行標記。該第一標簽序列優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限,該第一標簽序列的堿基數(shù)優(yōu)選為3 20。其中,所述Gero基因特異性引物與目標區(qū)域完全互補或部分互補。進一步的,每個目標區(qū)域?qū)腉ero基因特異性引物中,至少一條引物與該目標區(qū)域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區(qū)域過程中,對不同待測樣品的目標區(qū)域擴增產(chǎn)物進行標記。該第二標簽序列優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限,該第二標簽的堿基數(shù)優(yōu)選為3 20,更優(yōu)選為4 10。其中,所述G6PD基因特異性引物包括SEQ ID NO :1和SEQ ID NO :24,以及SEQ ID N0:2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO 10,SEQ ID NO :12、SEQ ID NO: 14、SEQ ID NO: 16、SEQ ID NO: 18、SEQ ID NO :20 和 SEQ ID NO :22 中的至少一條,SEQ ID NO 3,SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO 1USEQ ID NO :13、SEQ ID NO: 15、SEQ ID NO: 17、SEQ ID NO: 19、SEQ ID NO :21 和 SEQ ID NO :23 中的至少一條。與現(xiàn)有技術(shù)相比,本發(fā)明的方法及試劑盒通過高通量測序技術(shù)對G6H)基因的多個目標區(qū)域同時進行深度測序,提高了檢測效率,同時還能提高檢測的準確性和靈敏度,并能進一步對大量樣品同時進行多區(qū)域測序。
圖
圖
圖
圖
圖
圖
圖
圖
圖程圖
圖10是本發(fā)明另一個實施例中利用片段化產(chǎn)物和接頭元件構(gòu)建測序文庫的方法流程圖;圖11是本發(fā)明另一個實施例中利用片段化產(chǎn)物和接頭元件構(gòu)建測序文庫的方法流程圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。本發(fā)明所述的目標區(qū)域,為Gero基因上的任意序列,可根據(jù)需要進行選擇,包括但不限于基因的內(nèi)部序列、基因的外部調(diào)控區(qū)域,所述基因的內(nèi)部序列,包括但不限于基因的內(nèi)含子區(qū)域、外顯子區(qū)域、同時含有內(nèi)含子與外顯子的區(qū)域。圖I示出了本發(fā)明的一種對6磷酸葡萄糖脫氫酶基因進行測序的方法流程,該方法包括以下步驟Si.利用Gero基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,并基于擴增產(chǎn)物構(gòu)建測序文庫;S2.對測序文庫進行單分子擴增,得到與所述多個目標區(qū)域?qū)亩鄠€單分子擴增產(chǎn)物;S3.同時對所述多個單分子擴增產(chǎn)物進行高通量基因測序,得到所述多個目標區(qū)域的序列信息。本方法通過高通量測序技術(shù)對待測樣品的目標區(qū)域進行深度測序,該方法能同時對Gero基因的多個目標區(qū)域進行檢測,提高了檢測效率,同時還能提高檢測的準確性和靈敏度,準確得到這些區(qū)域的序列信息,包括已知突變和未知突變的各突變位點的變異情況, 以及各突變位點發(fā)生變異的頻率。此外,通過控制各目標區(qū)域擴增產(chǎn)物的大小,可免去了片段化步驟,減少了實驗步驟,提高了實驗效率,降低了成本。通過本方法所得的序列信息,可用于各種科學研究,包括但不限于人群序列分析、 基因功能研究、蛋白功能研究。需要說明的是步驟SI中所述待測樣品為能提取核酸的任意形式的樣品,包括但不限于全血、 血清、血漿和組織樣品;所述組織樣品包括但不限于石蠟包埋組織、新鮮組織和冰凍切片。步驟SI所得測序文庫中,存在多種測序文庫分子,對測序文庫進行單分子擴增, 即是指,將測序文庫中的多種文庫分子,以極微量(甚至單分子)的形式在空間上隔離(但這些文庫分子整體上還是屬于同一個反應體系),并且在各自的空間內(nèi)實現(xiàn)擴增,以提升各種分子在后續(xù)測序反應中的信號?,F(xiàn)有技術(shù)中,Sanger測序技術(shù)每次只能對一個樣品的某一段區(qū)域進行測序,要實現(xiàn)對多個目標區(qū)域的測序,只能是通過多次反應來實現(xiàn)。而在本發(fā)明中,測序文庫中的各個分子經(jīng)過單分子擴增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應可同時進行,相互之間互不干擾。因此,可以同時對大量的(成百萬上千萬,甚至上億、數(shù)十億的)單分子拷貝陣列同時進行測序反應,然后通過采集相應的信號,進而獲得所需的序列信息,且測序的靈敏度較Sanger更高。其中,步驟Si所述Gero基因特異性引物與目標區(qū)域完全互補或部分互補。進一步的,每對針對G6ro基因目標區(qū)域的引物中,至少有一條引物與目標區(qū)域部分互補,且該引物的5’端帶有第二標簽序列。該第二標簽序列,用于在擴增目標區(qū)域過程中,對不同待測樣品的目標區(qū)域擴增產(chǎn)物進行標記。該第二標簽序列,優(yōu)選為帶有特定序列的核酸分子,其堿基數(shù)不限。該第二標簽序列的堿基數(shù)優(yōu)選為3 20,更優(yōu)選為4 10。此外,所述特異性引物還可帶有其它標記物,包括但不限于生物素標記、多聚組氨酸標記、抗原、抗體,從而使得目標區(qū)域擴增產(chǎn)物的純化極為方便。另外,同一待測樣品的不同目標區(qū)域的擴增可同時進行或分別獨立進行或部分同時進行。在具體的實驗過程中,可根據(jù)需要選用上述任一種方案進行。如果分別對各目標區(qū)域進行分別擴增的話,能夠通過測定擴增產(chǎn)物的量來確保步驟SI中用于構(gòu)建目標區(qū)域測序文庫的目標區(qū)域擴增產(chǎn)物的分子數(shù)保持一致,不會因為擴增步驟而導致同一待測樣品的不同目標區(qū)域拷貝數(shù)不同,進而影響后續(xù)的測序反應結(jié)果。當然,當各目標區(qū)域的大小相近,GC含量也相近的時候,通過合理的設計引物,利用多重PCR技術(shù),步驟SI可對多個目標區(qū)域進行同時擴增,且保證各目標區(qū)域之間的擴增效率保持基本一致,這樣就能夠有效的提聞實驗效率,降低反應的成本。當待測樣品有多個時,不同樣品的目標區(qū)域的擴增必須分別進行。其中,步驟SI所述目標區(qū)域包括G6H)基因的外顯子I、外顯子2、外顯子3、外顯子 4、外顯子5、外顯子6、外顯子7、外顯子8、外顯子9、外顯子10、外顯子U、外顯子12、外顯子13中的至少一個。進一步的,所述G6H)基因特異性引物包括SEQ ID NO :1和SEQ ID NO :24,以及 SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO :10、SEQ ID NO :12、 SEQ ID NO 14,SEQ ID NO : 16、SEQ ID NO : 18、SEQ ID N0:20 和 SEQ ID N0:22 中的至少一條,SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO :11、SEQ ID NO 13、SEQ ID NO: 15、SEQ ID NO: 17、SEQ ID NO: 19、SEQ ID NO :21 和 SEQ ID NO :23 中的至少一條。在選擇上述特定序列的引物過程中,需遵循一個基本原則,S卩,所選用的引物在后續(xù)的擴增過程中不會出現(xiàn)對Gero基因中的同一片段擴增多次的現(xiàn)象。在一個實施例中,步驟SI的具體實現(xiàn)過程是Sll.利用G6H)基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,得到與所述多個目標區(qū)域?qū)臄U增產(chǎn)物;S12.利用接頭元件,與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。需要說明的是步驟Sll中,對同一待測樣品中的多個目標區(qū)域的擴增,可同時進行或分別獨立進行或部分同時進行??筛鶕?jù)實際情況,如擴增特異性引物的退火溫度,擴增的目標區(qū)域的大小、GC含量,擴增的目標區(qū)域的數(shù)量等,進行相應的調(diào)整。不同待測樣品的目標區(qū)域的擴增必須分別進行。步驟S12中,所述接頭元件與擴增產(chǎn)物的連接方式,可以采用多種方式實現(xiàn),包括接頭元件與擴增產(chǎn)物直接連接,或?qū)U增產(chǎn)物進行處理之后再進行連接。步驟S12中的接頭元件,用于構(gòu)建測序文庫,可包括一種或多種接頭。其中,步驟S12所述接頭元件中的至少一個接頭包含有第一標簽序列,該第一標簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫進行標記。這樣,在分別獲得目標區(qū)域測序文庫后,不同的待測樣品的目標區(qū)域測序文庫可以混合在同一個反應體系中,進行單分子擴增反應,進而同時進行高通量測序。提高測序反應的效率,降低了樣品檢測的成本。該第一標簽序列優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限。進一步的, 該第一標簽序列的堿基數(shù)為3 20,這樣,每次至少能夠?qū)?3個樣品進行同時檢測。在綜合考慮各種情況后,如標簽的特異性、接頭的成本、接頭的長度等,第一標簽序列的堿基數(shù)優(yōu)選為4 10。通過第二標簽和第一標簽的結(jié)合,本發(fā)明的發(fā)明每次能夠檢測至少43X43 個樣品,即4096個樣品。接頭的修飾方式有多種,包括但不限于被生物素化或甲基化,或同時被生物素化和甲基化。在一個實施例中,該接頭被生物素化,并與未生物素化的片段化產(chǎn)物連接,生物素的存在有利于構(gòu)建的測序文庫的分離純化。在另一個實施例中,該接頭被甲基化,并與未甲基化的片段化產(chǎn)物連接,然后用僅切割甲基化DNA的限制性內(nèi)切酶消化連接產(chǎn)物,因為只有成功連接的連接產(chǎn)物才能被切割,所以只有成功連接的連接物被切割,從而確保酶切產(chǎn)物的單一性。接頭的結(jié)構(gòu)形式也有多種,包括但不限于平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭。構(gòu)建測序文庫過程中可以使用一種或多種接頭。其中,突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭均能夠有效防止在連接過程中多個接頭自連現(xiàn)象的發(fā)生。針對接頭的上述接頭形式,以下將提供多個實施例。在第一實施例中,接頭元件采用平末端接頭,該接頭是雙鏈完全互補的核酸分子。在第二實施例中,接頭元件采用突出末端接頭,該接頭是雙鏈核酸分子,該雙鏈核酸分子至少包括一突出末端。該突出末端的堿基數(shù)無具體限制,優(yōu)選為I 10個堿基。根據(jù)該雙鏈核酸分子的結(jié)構(gòu),突出末端接頭可分成兩類,分別是單突出末端接頭、雙突出末端接頭。如圖2所示的單突出末端接頭,其一端為平末端,另一端為突出末端。其中帶有分叉接頭的單突出末端接頭能夠防止接頭自連。為了防止一端為平末端的單突出末端接頭自連,可對平末端上的3’ OH進行修飾(包括但不限于用氨基封閉羥基),或?qū)⑵侥┒松系?’ 磷酸基團去除。如圖3所示的雙突出末端接頭,其含有兩個突出末端,這兩個突出末端可在一條核苷酸鏈上(圖3a)或在不同的核苷酸鏈上(圖3b)。當這兩個突出末端在不同的核酸鏈上時,他們相互之間不互補,以防在連接時出現(xiàn)接頭自連。在第三實施例中,接頭元件采用帶莖環(huán)結(jié)構(gòu)的接頭,如圖4所示。該接頭為單鏈核酸分子,該單鏈核酸分子包括第一互補配對區(qū)I、莖環(huán)區(qū)2和第二互補配對區(qū)3(圖4a),第一互補配對區(qū)I能夠與第二互補配對區(qū)3互補配對,且它們形成的互補配對區(qū)包括至少一個限制性內(nèi)切酶識別位點,而通過該酶切識別位點,特定的酶能夠?qū)⑶o環(huán)區(qū)切開或切除,從而將單鏈核酸分子變成雙鏈核酸分子,以便于后續(xù)的操作。優(yōu)選的,如圖4b所示,帶莖環(huán)結(jié)構(gòu)的接頭還可帶有突出末端4,該突出末端可位于單鏈核酸分子的5’端或3’端。突出末端 4的存在能夠進一步的防止接頭自連現(xiàn)象的發(fā)生。該突出末端優(yōu)選為T。在第四實施例中,接頭元件采用分叉接頭,如圖5所示,該接頭是雙鏈核酸分子, 包括互補區(qū)和分叉區(qū),所述分叉區(qū)的兩條單鏈各包含至少一個擴增引物結(jié)合位點。優(yōu)選的, 所述分叉接頭的互補區(qū)包括至少一個限制性內(nèi)切酶識別位點,該酶切識別位點可以在建庫過程中酶切形成末端,以便于進行后續(xù)的操作。該分叉接頭的分叉設計能夠在建庫過程避免多個接頭自連現(xiàn)象的出現(xiàn);所述分叉區(qū)上包含的擴增引物結(jié)合位點,可以直接用于結(jié)合擴增引物,進行擴增反應其中,所述分叉接頭的分叉區(qū)的每條鏈各含有N個核苷酸;優(yōu)選的,9 < NS 30。 其中,所述分叉接頭的配對區(qū)互補配對的核苷酸對數(shù)不限;優(yōu)選的,互補配對的核苷酸對數(shù)為7 15,更優(yōu)選的,互補配對的核苷酸對數(shù)為9 13。其中,所述分叉接頭的配對區(qū)的3’末端為突出末端或平末端。優(yōu)選的,所述分叉接頭的配對區(qū)的3’末端為突出末端,該突出末端可與所述片段化產(chǎn)物的粘性末端互補配對, 提聞了連接效率,以利于構(gòu)建測序文庫反應的順利進行。優(yōu)選的,所述分叉接頭為T末端分叉接頭,該接頭的配對區(qū)的3’末端為突出末端, 且突出末端最后一個堿基為T ;例如圖6所示的T末端分叉接頭,圖中N為A、T、C、G堿基中的任一種。優(yōu)選的,所述分叉接頭的配對區(qū)的3’末端為突出末端,且突出末端的核苷酸包括通用堿基。其中,突出末端的堿基數(shù)無特殊限制,優(yōu)選為I 4。例如圖7所示的分叉接頭, 圖中N為A、T、C、G堿基中的任一種,X為通用堿基。優(yōu)選的,所述分叉接頭為雙脫氧接頭,該接頭的配對區(qū)的3’末端為平末端,且3’ 末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸;例如圖8所示的雙脫氧分叉接頭,圖中N 為A、T、C、G堿基中的任一種,dd表示該3’末端最后一個核苷酸為帶有雙脫氧堿基的胞嘧啶核苷酸。應當說明的是,上述接頭元件只是部分實施例,并不用以限制本發(fā)明的保護范圍。關(guān)于步驟S12的實現(xiàn)方式在一個實施例中,步驟S12采用接頭元件與擴增產(chǎn)物直接連接的方式,構(gòu)建出測序文庫。在另一個實施例中,當目標區(qū)域擴增產(chǎn)物較大時或者需要構(gòu)建的目標區(qū)域測序文庫較小時,則對擴增產(chǎn)物進行片段化處理之后,片段化產(chǎn)物再與接頭元件進行連接,構(gòu)建測序文庫,如圖9所示,步驟S12包括以下步驟S121.對與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行片段化,得到片段化產(chǎn)物;S122.利用接頭元件,與片段化產(chǎn)物進行連接,構(gòu)建測序文庫。通過片段化步驟S121將目標區(qū)域擴增產(chǎn)物變成較小的片段化產(chǎn)物,從而有助于對目標區(qū)域的進一步深度測序。此外,還可以通過片段化處理,將不同的擴增產(chǎn)物變成長短相似的片段化產(chǎn)物,能夠有助于后續(xù)的統(tǒng)一測序。需要說明的是
步驟S121中,所述片段化目標區(qū)域擴增產(chǎn)物的方法有多種,包括但不限于超聲法、噴霧法、化學剪切法和酶切法??筛鶕?jù)實際情況,采用相適應的方法進行實驗。所述片段化處理之后還可包括片段化產(chǎn)物的分離純化以及末端修飾的步驟。根據(jù)測序的片段長度需要,對于片段化得到的核酸片段,進行目的核酸片段的分離純化,分離方法可以采用常用方法,如凝膠電泳、蔗糖梯度或氯化銫梯度沉降、柱層析分離等。根據(jù)所使用的片段化方法,對所得的目的核酸片段進一步的末端修飾,包括但不限于磷酸化或去磷酸化、末端補平和末端加A,以便于后續(xù)的接頭元件連接。上述目的核酸片段長短不限,優(yōu)選為25bp 500bp,更優(yōu)選為30bp 200bp,更優(yōu)選為40bp lOObp。步驟S121所述片段化產(chǎn)物的長度不限,優(yōu)選為25bp 500bp,更優(yōu)選為30bp 200bp,更優(yōu)選為40bp IOObp間。在實現(xiàn)對目標區(qū)域的測序的前提下,隨著目標區(qū)域測序文庫分子中含有的目標區(qū)域片段長度的減短,高通量測序技術(shù)的對目標區(qū)域的測序深度加深;而測序深度越深,即對目標區(qū)域的每一個堿基位置的測序次數(shù)越多,測序結(jié)果越準確, 對樣品中的少量突變的檢測就越靈敏;這樣就能夠有效防止因為樣品中帶有突變的目標區(qū)域的比例偏低,而導致該突變的測序信號的絕對值偏低,發(fā)生測序結(jié)果不準確的現(xiàn)象。為了實現(xiàn)對目標區(qū)域測序文庫大小的限制,可在步驟S121或S122之后,對片段化產(chǎn)物或目標區(qū)域測序文庫進行分離純化。分離純化的方法有多種,包括但不限于凝膠方法、蔗糖梯度或氯化銫梯度沉降和柱層析分離??筛鶕?jù)實際情況,采用相適應的方法進行實驗。根據(jù)上述接頭元件,針對步驟S122,下面將通過多個實施例和附圖對本步驟進行進一步的說明。在本發(fā)明的一個實施例中,直接在片段化產(chǎn)物的兩端接上接頭形成測序文庫。所述接頭可采用上述的平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。在本發(fā)明的另一個實施例中,如圖10所示,步驟S122具體可由以下步驟實現(xiàn)S1221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物;S1222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物;S1223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物;S1224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。在步驟S1221中,所述第一接頭可采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,所述第一接頭包含有II S型限制性內(nèi)切酶酶切識別位點;所述的II s型限制性內(nèi)切酶為切割位點在識別序列之外的限制性內(nèi)切酶,包括但不限于Acu
I、AlwI、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM
II、BseRI、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、Mbo II、Mly I、Mme I、Mnl I、NmeAIII、 Ple I、Sap I、SfaN I 和 TspDT I,優(yōu)選為 Acu I、Bsg I、EcoP15 I 或 Mme I。當所述第一接頭為分叉接頭時,該II s型限制性內(nèi)切酶酶切識別位點位于互補區(qū);當所述第一接頭為帶莖環(huán)結(jié)構(gòu)的接頭時,限制性內(nèi)切酶識別位點與莖環(huán)結(jié)構(gòu)之間的距離,較II S型限制性內(nèi)切酶酶切識別位點與莖環(huán)結(jié)構(gòu)之間的距離近。若片段化產(chǎn)物經(jīng)過末端修復酶修復,以及末端加A反應,所述第一接頭優(yōu)選為帶T
11末端的分叉接頭。若片段化產(chǎn)物只是經(jīng)過末端修復酶修復,將片段化產(chǎn)物的末端補平,則所述第一接頭優(yōu)選雙脫氧接頭。在步驟S1222中,環(huán)化第一連接產(chǎn)物有多種實現(xiàn)方式。在本發(fā)明的一實施例中,步驟S1222包括以下步驟S12221.利用酶切引物對第一連接產(chǎn)物進行擴增,得擴增產(chǎn)物;S12222.對擴增產(chǎn)物進行酶切,使得擴增產(chǎn)物形成粘性末端,并自身環(huán)化成環(huán)化產(chǎn)物。所述酶切引物的3’端分別與第一連接產(chǎn)物的兩個末端部分互補,5’端均含有限制性內(nèi)切酶識別位點。經(jīng)過步驟S12221的擴增形成的擴增產(chǎn)物,其兩個末端均含有限制性內(nèi)切酶識別位點,然后在相應的酶的作用下,使擴增產(chǎn)物的兩端形成粘性末端,且這兩個粘性末端互補,能夠進行自身環(huán)化。在本發(fā)明的另一個實施例中,所述第一接頭包含有2個酶切識別位點,其中一個為限制性內(nèi)切酶識別位點,用于使步驟S1222形成的第一連接產(chǎn)物的兩端在相應的酶的作用下,形成粘性末端,且它們之間互補,能夠進行自身環(huán)化。另一個為II s型限制性內(nèi)切酶酶切識別位點,用于在步驟S1223中,利用識別該酶切位點的酶識別環(huán)化產(chǎn)物,進行酶切, 進而得到酶切產(chǎn)物。應當說明,以上兩個實施例僅為本發(fā)明中的兩種實現(xiàn)環(huán)化第一連接產(chǎn)物的實施方案,對于本發(fā)明的保護范圍不做任何具體的限制。在步驟S1223中,利用能夠識別第一接頭上的酶切識別位點,并切割環(huán)化產(chǎn)物 (DNA)但不切割第一接頭的酶進行酶切。所述第一接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。步驟S1224中,所述弟_■接頭可為平末〗而接頭、關(guān)出末〗而接頭、帶環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,可帶有生物素標記。所述第三接頭可為平末端接頭、突出末端接頭、 帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種。第二接頭與第三接頭可相同或不同。優(yōu)選的,所述第二接頭和第三接頭相同,均為分叉接頭。更優(yōu)選的,所述分叉接頭為T末端分叉接頭或雙脫氧分叉接頭。需要特別說明的是,步驟S1222與S1223之間還可包括步驟S1222A :滾環(huán)擴增環(huán)化產(chǎn)物,得滾環(huán)擴增產(chǎn)物。通過步驟S1222A,能夠保證后續(xù)的酶切步驟S1223有足夠的原材料。又或者,在步驟S1221與S1222之間還可包括步驟S1221A :利用擴增引物對第一連接產(chǎn)物進行擴增,得擴增產(chǎn)物。所述擴增引物分別與第一連接產(chǎn)物兩端的接頭序列互補。 通過步驟S1221A,能夠保證后續(xù)的環(huán)化步驟有足夠的原材料。本方案可避免在步驟S1222之后進行滾環(huán)擴增,而用步驟S1222之前的步驟 S1221A進行普通的PCR擴增代替,可有效減少后續(xù)酶切步驟中,II s型限制性內(nèi)切酶的用量。其中,所述第一接頭優(yōu)選為分叉接頭。其中,所述分叉接頭的互補區(qū)可包含至少一個酶切識別位點。所述酶切識別位點可為普通的限制性內(nèi)切酶識別位點,也可為II S型限制性內(nèi)切酶酶切識別位點。其中,步驟S122IA所述擴增弓I物優(yōu)選為生物素化引物,有利于擴增產(chǎn)物的回收純化。其中,步驟S1221A所述擴增引物帶有至少一個特異性酶切識別位點。若擴增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟S1222中利用尿嘧啶特異性切除試劑進行酶切,然后再進行連接環(huán)化。若擴增引物所帶特異性酶切識別位點為限制性內(nèi)切酶識別位點,則步驟S1222中利用相應的限制性內(nèi)切酶進行酶切,然后再進行連接環(huán)化。在本發(fā)明的另一個實施例中,如圖11所示,步驟S122具體可由以下步驟實現(xiàn)S1221’ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;S1222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;S1223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。需要說明的是在步驟S1221’中,所述第四接頭可采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,所述第四接頭包含有II S型限制性內(nèi)切酶酶切識別位點;當所述第四接頭為分叉接頭時,該II s型限制性內(nèi)切酶酶切識別位點位于互補區(qū);當所述第四接頭為帶莖環(huán)結(jié)構(gòu)的接頭時,限制性內(nèi)切酶識別位點與莖環(huán)結(jié)構(gòu)之間的距離,較II s型限制性內(nèi)切酶酶切識別位點與莖環(huán)結(jié)構(gòu)之間的距離近。在步驟S1222’中,利用能夠識別第四接頭上的酶切識別位點,并切割環(huán)化產(chǎn)物 (DNA)但不切割第四接頭的酶進行酶切。所述第四接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。若片段化產(chǎn)物經(jīng)過末端修復酶修復,以及末端加A反應,所述第四接頭優(yōu)選為帶T末端的分叉接頭。若片段化產(chǎn)物只是經(jīng)過末端修復酶修復,則所述第四接頭優(yōu)選雙脫氧接頭。在步驟S1223’中,所述弟五接頭可為平末纟而接頭、關(guān)出末纟而接頭、帶環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,可帶有生物素標記。在本發(fā)明的另一個實施例中,步驟SI22具體包括以下步驟S1221”.直接在片段化產(chǎn)物的兩端接上帶莖環(huán)結(jié)構(gòu)的接頭,形成帶莖環(huán)結(jié)構(gòu)的片段化產(chǎn)物;S1222”.利用限制性內(nèi)切酶,將帶莖環(huán)結(jié)構(gòu)的片段化產(chǎn)物的莖環(huán)區(qū)切開或切除,從而形成測序文庫。本技術(shù)方案利用帶莖環(huán)結(jié)構(gòu)的接頭,防止了多個接頭自連現(xiàn)象的發(fā)生。當通過上述幾個方案形成的測序文庫的數(shù)量過少,不利于后續(xù)的單分子擴增步驟時,還可以進行以下步驟利用與目標區(qū)域測序文庫兩端的接頭部分互補的引物,以所得的測序文庫為模板進行擴增,得擴增后的測序文庫。該步驟可滿足后續(xù)實驗對目標測序文庫的量的要求。其中,步驟S2所述的單分子擴增是指對目標區(qū)域測序文庫中的分子,以極微量 (甚至單分子)的形式在空間上隔離(但這些文庫分子整體上還是屬于同一個反應體系), 并且在各自的空間內(nèi)實現(xiàn)擴增,以提升各種分子在后續(xù)測序反應中的信號。所述單分子擴增的方法包括但不限于乳液PCR(Emulsion PCR, EPCR)、橋式PCR。所述EPCR最大的特點是可以形成數(shù)目龐大的獨立反應空間以進行DNA擴增。基本過程是在PCR反應前,將包含PCR所有反應成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨立的PCR反應空間。理想狀態(tài)下,每個小水滴只含一個DNA模板(目標區(qū)域測序文庫分子)和一個磁珠,磁珠上含有與目標區(qū)域測序文庫分子的共有序列(由接頭元件引入)互補的引物,在PCR反應后,磁珠表面就固定有拷貝數(shù)目巨大的同來源的DNA模板擴增產(chǎn)物。EPCR的具體步驟可參考PCR amplification from single DNA molecules on magnetic beads in emulsion application for high-throughput screening of transcription factor targets, Takaaki Kojima, Yoshiaki Takei, Miharu Ohtsuka et al, Nucleic Acids Research, 2005, Vol. 33, No. 17 ;Dual primer emulsion PCR for nextgeneration DNA sequencing, Ming Yan Xu, Anthony D. Aragon, Monica R. Mascarenas et al, BioTechniques48 409-412 (May 2010) ;BEAMing single-molecule PCR on microparticles in water-in-oil emulsions,F(xiàn)rank Diehl, Meng Li,Yiping He,nature methods,Vol. 3, No. 7,July 2006 等。所述橋式PCR的基本原理是,橋式PCR的引物被固定在固相載體上,PCR過程中 PCR擴增產(chǎn)物會被固定在固相載體上,且PCR擴增產(chǎn)物能夠與固相載體上的引物互補配對,成橋狀,然后互補配對的引物以與其成橋的擴增產(chǎn)物為模板進行擴增。通過控制初始模板加入的量,橋式PCR反應完成后,擴增產(chǎn)物在固相載體上以一簇簇的形式存在,且每一簇的擴增產(chǎn)物為同來源的DNA模板擴增產(chǎn)物。其具體的原理和實施方案可參考以下文獻 CN20061009879. X、US6227604。如前所述,現(xiàn)有技術(shù)中,Sanger測序技術(shù)由于自身的技術(shù)限制,每次只能對一個樣品的某一段區(qū)域進行測序。為了一次性實現(xiàn)對樣品中多個區(qū)域的同時檢測,本發(fā)明在測序方法上采取高通量基因測序方法。高通量基因測序相對Sanger測序法檢測序列信息更為方便靈敏,測序文庫中的各個分子經(jīng)過單分子擴增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應可同時進行,相互之間互不干擾。 因此,可以同時對大量的(成百萬上千萬,甚至數(shù)億、數(shù)十億的)單分子拷貝陣列同時進行測序反應,然后通過采集相應的信號,進而準確的獲得所需的序列信息,且測序的靈敏度較 Sanger更高。尤其是對多個目標區(qū)域的擴增產(chǎn)物進行了片段化處理,相當于對相同序列的目標區(qū)域分子的每個堿基的測序次數(shù)增加了,能夠進一步提高測序的靈敏度。其中,步驟S3所述的高通量測序技術(shù)包括但不限于基于聚合酶的合成測序法、 基于連接酶的連接測序法?;诰酆厦傅暮铣蓽y序法是基于帶可去除標記的核苷酸進行的。在每次合成反應中,每個模板鏈至多只能延伸一次,基于聚合酶的合成測序法的大致流程如下a.測序引物通過互補配對結(jié)合在單分子擴增產(chǎn)物共有的已知序列上(該單分子擴增產(chǎn)物固定在引物-固相載體復合物上),在DNA聚合酶的作用下,以帶可去除標記的核苷酸進行單堿基延伸合成反應,收集該次加入核苷酸的標記信號,即可得到與測序引物3’ 最末端堿基互補的單分子擴增產(chǎn)物(固定在引物-固相載體復合物上)的下一位的堿基序列信息。b.切除可去除標記,然后在DNA聚合酶的作用下,以帶可去除標記的核苷酸繼續(xù)進行單堿基延伸合成反應,收集加入核苷酸的標記信號,即可得到與測序引物3’末端堿基互補的單分子擴增產(chǎn)物的下兩位的堿基序列信息。重復b步驟,直至不能繼續(xù)進行合成反應為止,從而獲得單分子擴增產(chǎn)物的全部序列信息?;谶B接酶的連接測序法是均是基于帶熒光標記的寡核苷酸探針進行的。其中一種連接酶的連接測序法是基于在特定位置帶有熒光標記的寡核苷酸探針進行的,該寡核苷酸探針帶有η個堿基,從其5’端數(shù)起的第a位帶有熒光標記,其中不同的堿基對應特定的熒光標記,因為該寡核苷酸探針的3’端或5’端進行了特定的修飾,寡核苷酸探針之間不能直接相互連接,每次連接反應,每個單分子擴增產(chǎn)物只能連接一個寡核苷酸探針。該連接測序法的大致流程如下A.測序引物通過互補配對結(jié)合在單分子擴增產(chǎn)物共有的已知序列上(該單分子擴增產(chǎn)物固定在引物-固相載體復合物上)上,利用上述的寡核苷酸探針,在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得與單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前第a位堿基序列信息。B.切除寡核苷酸上的熒光標記,在連接酶的作用下,以上述的寡核苷酸探針為原料,繼續(xù)進行連接反應,然后采集熒光信號,從而得單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前第2a位的堿基序列信息。重復B步驟,直至不能繼續(xù)進行連接反應為止,從而獲得單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前第a、2a、3a、4a......位的堿基序列信息。然后將測序引物及其所連接的寡核苷酸探針從單分子擴增產(chǎn)物上變性洗脫下來, 換用與之前的測序引物相比3’末端或5’末端少一個堿基的引物重復上述反應,從而獲得
單分子擴增產(chǎn)物共有的已知序列的3 ’末端后或5 ’末端前第a-1、2a-l、3a_l、4a_l......位
的堿基序列信息。重復此步驟,最后獲得單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’
末端如第a_ (a~l)、2a_ (a-1)、3a_ (a-1)、4a_ (a-1)......位的喊基序列/[目息,從而獲得單
鏈擴增產(chǎn)物的全部序列信息。另一種連接酶的連接測序法同樣也是基于帶有熒光標記的寡核苷酸探針進行的, 該寡核苷酸探針帶有η個堿基,分為h(h ( η)組,同一組寡核苷酸探針的不同熒光標記對應同一特定位置的不同堿基序列,不同組之間的區(qū)別在于不同熒光標記對應的特定位置不同,因為該寡核苷酸探針的3’端或5’端進行了特定的修飾,寡核苷酸探針之間不能直接相互連接,每次連接反應,每個單分子擴增產(chǎn)物只能連接一個寡核苷酸探針。該連接測序法的大致流程如下a.測序引物通過互補配對結(jié)合在單分子擴增產(chǎn)物共有的已知序列上(該單分子擴增產(chǎn)物固定在引物-固相載體復合物上)上,利用上述寡核苷酸探針中的一組(熒光標記對應的堿基位置為x,x < h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得與單鏈擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前第X位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴增產(chǎn)物上變性洗脫下來。b.然后重新將測序引物結(jié)合在單分子擴增產(chǎn)物上,換用與a步驟不同的寡核苷酸探針組(熒光標記對應的堿基位置為1,I ( h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得與單鏈擴增產(chǎn)物共有的已知序列的3’末端后或 5’末端前第I位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴增產(chǎn)物上變性洗脫下來。c.重復步驟b,直至h組寡核苷酸探針均分別進行過一次連接反應,從而獲得單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前第1、2.......h位的堿基序列信息。換用與之前的測序引物相比3’末端或5’末端多一個或多個通用堿基的引物按上述原理進行反應,能夠延長獲得的單分子擴增產(chǎn)物共有的已知序列的3’末端后或5’末端前的堿基序列的讀長。這種基于連接酶的連接測序法的原理和具體實施方案可參考CN200710170507. I?;诰酆厦傅暮铣蓽y序法與焦磷酸測序法有一定的相似之處,因此,理論上來說, 焦磷酸測序法同樣能夠適用于本發(fā)明的檢測方法。但是現(xiàn)有的焦磷酸測序法在測序過程中采用的是天然dNTP,使得其在測序過程中,對待測序文庫上可能存在的連續(xù)單堿基重復序列的測定存在困難;而基于聚合酶的合成測序法中的核苷酸帶有的可去除標記,能夠保證每次只延伸一個堿基;基于連接酶的連接測序發(fā)中的帶熒光標記的探針的3’端或5’端進行了修飾,保證每個單分子擴增產(chǎn)物的片段上只連接一個熒光探針;因此本發(fā)明的基于聚合酶的合成測序法和基于連接酶的連接測序法的準確性較焦磷酸測序高。此外,因為現(xiàn)有的焦磷酸測序儀器中的蝕刻光纖玻片(PTP板)上的小孔較大 (55 UmX 44 μ m),用于容納測序之前的乳液PCR所得的擴增產(chǎn)物(乳液PCR的擴增產(chǎn)物被固定在10 μ m的珠上),這大大限制了焦磷酸測序法的測序通量,使得其測序反應的試劑成本較高。此外,焦磷酸測序法在測序過程中還需往蝕刻光纖玻片(PTP板)的小孔內(nèi)加入含有多種蛋白的復合物以保證測序反應的順利進行,而這將大大提高測序反應的試劑成本。相對的,基于聚合酶的合成測序法和基于連接酶的連接測序法可通過Iym的磁珠或者玻片來固定單分子擴增的產(chǎn)物,使得其通量更高,且除了需要帶有可去除標記的核苷酸或在3’端或5’端進行了修飾的熒光標記的探針外,所需的其他試劑無特殊要求,這就大大降低了測序反應的試劑成本。在獲得相同數(shù)據(jù)量的情況下,基于聚合酶的合成測序法和基于連接酶的連接測序法的測序成本為焦磷酸測序法的二千分之一或更少。因此本發(fā)明方案中采用的是基于聚合酶的合成測序法或基于連接酶的連接測序法對單分子擴增產(chǎn)物進行測序。在本發(fā)明的一具體實施例中,同時檢測G6H)基因的I至13外顯子。設計分別用于擴增這些外顯子的特異性引物E1F(SEQ ID NO 1) EIR(SEQ ID NO :2)、E2F(SEQ ID NO 3)和 E2R(SEQ ID NO 4)、E3F(SEQ ID NO 5)和 E3R(SEQ ID NO 6)、E4F(SEQ ID NO 7)和 E4R(SEQ ID NO :8)、E5F (SEQ ID NO 9)和 E5R(SEQ ID NO :10)、E6F(SEQ ID NO :11) 和 E6R(SEQ ID NO : 12)、E7F (SEQ ID NO :13)和 E7R(SEQ ID NO : 14)、E8F (SEQ ID NO :15) 和 E8R(SEQ ID NO :16)、E9F(SEQ ID NO :17)和 E9R(SEQ ID NO : 18)、E10F(SEQ ID NO :19)
ElOR (SEQ ID NO :20)、El IF (SEQ ID NO :21) El IR (SEQ ID NO :22)、E12-13F (SEQ ID NO 23)和 E12-13R(SEQ ID NO :24)?!⒋郎y樣品DNA的提取利用市場上常見的核酸提取試劑盒分別提取全血樣品(I至10)、石蠟組織樣品 (11至20)的DNA,并分別做上相應的標記,上述20個樣本中,I至5和11至15為女性樣本;6至10和16至20為男性樣本;以突變型質(zhì)粒I (含有突變型序列SEQ ID NO 27)、野生型質(zhì)粒I (含有野生型序列SEQ ID NO 28)、突變型質(zhì)粒2 (含有突變型序列SEQ ID NO
1629)、野生型質(zhì)粒2 (含有野生型序列SEQ ID NO 30)、突變型質(zhì)粒3 (含有突變型序列SEQ ID NO :31、野生型質(zhì)粒3 (含有野生型序列SEQ ID NO 32)為對照,上述對照樣品編號分別為 21、22、23、24、25、26。二、Gero基因目標區(qū)域的擴增利用上述的G6ro基因特異性引物,對G6ro基因的目標區(qū)域進行擴增,得擴增產(chǎn)物。各Gero基因的目標區(qū)域的擴增是分別進行的。反應體系如下
0184]上游引物(10 μ M)2 μ L ;0185]下游引物(10 μ Μ)2 μ L ;0186]dNTP (各 2. 5mM)4μ L ;0187]待測樣品DNA20ng ;0188]Ex Taq(5U/μ L)0. 25 μ L ;0189]IOXEx Taq Buffer5 μ L ;0190]ddH20 加至 50 μ L。0191]PCR反應條件如下0192]95 °C 3min ;0193]94°C 30s, 58°C 30s, 72°C30s ;重復0194]72 °C 7min。利用PCR清潔試劑盒,分別對各樣品的擴增產(chǎn)物進行清潔,除去未擴增的引物和 dNTP,回收擴增產(chǎn)物。三、構(gòu)建測序文庫此步驟可有多種實施方案,本發(fā)明的一個實施例中,包括以下兩個步驟I.擴增產(chǎn)物的片段化利用超聲法進行片段化處理。具體操作為測定回收后的擴增產(chǎn)物濃度,并按等摩爾數(shù)將同一樣品的G6ro基因的不同目標區(qū)域的回收后的擴增產(chǎn)物進行混合,得混合液,并做上相應的標記。 將每個樣品的混合液(約50 μ L)加入至400 μ L的TE buffer中,在430W功率條件下超聲4s,間隔20s,反復5次,得片段化產(chǎn)物。利用1%瓊脂糖凝膠對各樣品的片段化產(chǎn)物進行分離純化,切膠回收大小在40bp至IOObp之間的片段化產(chǎn)物。2.構(gòu)建測序文庫在構(gòu)建目標區(qū)域測序文庫之前,需對切膠回收的片段化產(chǎn)物分別進行末端修飾, 以便于接頭元件的連接。在本實施例中,對切膠回收的片段化產(chǎn)物的末端修飾包括磷酸化、 末端補平和末端加A反應。
0204]具體實現(xiàn)如下0205]I)磷酸化以及末端補平反應0206]體系為0207]切膠回收的片段化產(chǎn)物20 μ L (約 2000ng)0208]IOmM dNTPI. 5μ L ;0209]T4 DNA 聚合酶(5U/ μ L)I μ L ;0210]Klenow DNA聚合酶O. I μ L ;
T4 多核苷酸激酶(10U/yL) O. 5uL;IOm MATPI. 5μ L ;10XΤ4連接酶緩沖液IOyL;加ddH20 至 100 μ L。反應條件為20°C孵育20min。反應結(jié)束后利用回收試劑盒進行純化回收。2)末端加A尾反應體系為磷酸化以及末端補平后的回收產(chǎn)物 60 μ L(約IOOOng);Klenow 緩沖液(NEB Buffer2)10 μ L ;IOmM dATP2 μ L ;Klenow 酶(3,to 5,exo minus, IOU/ μ L) I μ L ;加ddH20 至 100μ L。反應條件為37°C孵育30min。反應結(jié)束后利用純化試劑盒純化回收。3)連接接頭I本實施例中,采用如圖6所示的T末端分叉接頭作為接頭1,同一樣品的所使用的 T末端分叉接頭相同,不同樣品的T末端分叉接頭不同,區(qū)別在于標簽序列不同,不同樣品對應的標簽序列如下表I所示。表I各樣品建庫過程中的第一接頭上的標簽序列
樣本編號標簽序列 (5,—3,)樣本編號標簽序列 (5,—3,)樣本編號標簽序列 (5,~>3,)IAGCT11GACT21CGAT2AGTC12GATC22CGTA3ATGC13GTCA23CTGA4ATCG14GTAC24CTAG5ACTG15GCAT25CAGT6ACGT16GCTA26CATG7AAGG17ACAC8AACC18AGAG9TTGG19TCTC10TTCC20TGTG在T4連接酶的作用下,上述T末端分叉接頭分別與加A尾后純化回收的產(chǎn)物進行連接,形成帶接頭I的片段。連接體系為加A尾后純化回收的產(chǎn)物接頭IIOmM ATPT4DNA 連接酶(10U/ μ L)10 X Τ4連接酶緩沖液
50 μ L (約 500ng); 2 μ L (約 3000ng); 5 μ L ;
I μ L ;
10μ L ;
加 ddH20 至 100 μ L。
反應條件為16°C孵育4h以上。反應結(jié)束后利用純化試劑盒純化回收。
4) PCR擴增帶接頭I的片段
擴增體系為
帶接頭I的片段約 300ng ;
IOXEx Taq Buffer100μ L ;
Primer F(100 μ M, SEQIDNO 33) 10μ L ;
Primer R(100 μ M, SEQIDNO 34) 10μ L ;
Ex Taq (5U/μ L)7. 5μ L ;
dNTP (各 2· 5mM)80 μ L ;
ddH20 up to 1000 μ L。
PCR反應條件如下
95 °C 3min ;
94°C 30s, 58°C 30s, 72°C30s ;重復25個循環(huán);
72 °C 7min。
利用PCR清潔試劑盒,分別對各樣品的擴增產(chǎn)物進行清潔,除去未擴增的引物和
dNTP,回收帶接頭I的片段的擴增產(chǎn)物。5)11 s型限制性內(nèi)切酶酶切利用Acu I酶切回收后的帶接頭I的片段的擴增產(chǎn)物,反應體系如下回收后的帶接頭I的片段的擴增產(chǎn)物 60 μ L (3 5 μ g);10XNEB Buffer 48μ L ;Acu I (NEB)2 μ L(IOU);SAM (3. 2mM)I μ L (終濃度 50 μ Μ);ddH20 up to 80 μ L。反應條件37°C孵育lh。反應結(jié)束后利用純化試劑盒純化回收酶切產(chǎn)物。6)連接接頭2利用如圖7所示的突出末端分叉接頭作為接頭2,與回收的酶切產(chǎn)物進行連接,得
測序文庫,連接體系如下回收的酶切產(chǎn)物2yg;接頭2 (IOpM)luL;10 T4DNA 連接酶(3U/ μ L)I μ L ;10 X Τ4連接酶緩沖液2 μ L ;加ddH20 至 100μ L。連接條件,14°C孵育2h。反應結(jié)束后利用純化試劑盒純化回收,然后變性形成單鏈,得測序文庫。四、對測序文庫進行單分子擴增測定步驟三所獲得的26個測序文庫各自的濃度,然后按同等濃度混合,然后進行單分子擴增,得單分子擴增產(chǎn)物,所述單分子擴增的方法可采用EPCR或橋式PCR。優(yōu)選為EPCR擴增,單分子擴增引物優(yōu)選為SEQ ID NO 25和SEQ ID NO :26。
五、對單分子擴增產(chǎn)物進行高通量測序所述測序方法可采用基于合成酶的合成測序法,也可采用基于連接酶的連接測序法。對測序結(jié)果進行生物信息學分析,即可得到上述26個樣品的Gero基因序列信息如下樣本2為G1376T雜合子;樣本3為G1388A雜合子;樣本6為C1024T半合子;樣本11為G1388A突變純合子;樣本14為A95G雜合子;樣本19為G1376T半合子;上述樣本只存在上述突變;其它樣本均為野生型。對照樣品的檢測結(jié)果均與對照樣品本身含有的基因序列相符。應當說明,本實施例只是本發(fā)明的一個具體實施例,對本發(fā)明無任何限定作用,例如G6H)基因特異性引物的具體序列以及組合均可進行相應的替換,除此之外,本實施例中的多個步驟均可參照前述的方法進行替換,在此不再贅述。針對本發(fā)明的對G6ro基因進行測序的方法的靈敏度,本發(fā)明采用下述實施例進行驗證。通過常規(guī)設計,構(gòu)建分別含有G6H)基因外顯子2野生型序列(SEQ ID NO 28)和突變型序列(SEQ ID NO 27)的質(zhì)粒,含有G6H)基因外顯子9野生型序列(SEQ ID NO 30) 和突變型序列(SEQ ID NO 29)的質(zhì)粒。然后配置突變率分別為20%、10%、5%、3%、1%、0%的質(zhì)粒混合液。以含有1000 個拷貝質(zhì)粒的上述質(zhì)?;旌弦簽槟0?,然后按參照上一實施例的方法進行檢測。檢測結(jié)果見表2。表2 G6H)基因靈敏度實驗檢測結(jié)果
權(quán)利要求
1.一種對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,包括以下步驟A.利用Gero基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,并基于擴增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區(qū)域?qū)亩鄠€單分子擴增產(chǎn)物;C.同時對所述多個單分子擴增產(chǎn)物進行高通量基因測序,得到所述多個目標區(qū)域的序列信息。
2.根據(jù)權(quán)利要求I所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,所述步驟A包括以下步驟Al.利用G6ro基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,得到與所述多個目標區(qū)域?qū)臄U增產(chǎn)物;A2.利用接頭元件,與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。
3.根據(jù)權(quán)利要求2所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,所述步驟A2包括以下步驟A21.對與所述多個目標區(qū)域?qū)臄U增產(chǎn)物進行片段化,得到片段化產(chǎn)物;A22.利用接頭元件,與所述片段化產(chǎn)物進行連接,構(gòu)建測序文庫。
4.根據(jù)權(quán)利要求3所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物;A222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物;A223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物;A224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。
5.根據(jù)權(quán)利要求3所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;A222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。
6.根據(jù)權(quán)利要求2至5任一項所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,步驟A2所述的接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫進行標記。
7.根據(jù)權(quán)利要求I至5任一項所述的對6磷酸葡萄糖脫氫酶基因進行測序的方法,其特征在于,每個目標區(qū)域?qū)奶禺愋砸镏?,至少有一條引物與該目標區(qū)域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區(qū)域過程中,對不同待測樣品的目標區(qū)域擴增產(chǎn)物進行標記。
8.—種對6磷酸葡萄糖脫氫酶基因進行測序的試劑盒,其特征在于,包括G6ro基因特異性引物,用于對待測樣品中的多個目標區(qū)域進行擴增;接頭元件,用于與擴增產(chǎn)物結(jié)合構(gòu)建測序文庫。
9.根據(jù)權(quán)利要求8所述的對6磷酸葡萄糖脫氫酶基因進行測序的試劑盒,其特征在于,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。
10.根據(jù)權(quán)利要求8所述的對6磷酸葡萄糖脫氫酶基因進行測序的試劑盒,其特征在于,所述接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫進行標記。
11.根據(jù)權(quán)利要求8至10任一項所述的對6磷酸葡萄糖脫氫酶基因進行測序的試劑盒,其特征在于,每個目標區(qū)域?qū)奶禺愋砸镏校辽儆幸粭l引物與該目標區(qū)域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區(qū)域過程中,對不同待測樣品的目標區(qū)域擴增產(chǎn)物進行標記。
全文摘要
本發(fā)明涉及基因工程領域,提供了一種對6磷酸葡萄糖脫氫酶基因進行測序的方法及試劑盒,該方法包括以下步驟A.利用G6PD基因特異性引物,對待測樣品中的多個目標區(qū)域進行擴增,并基于擴增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區(qū)域?qū)亩鄠€單分子擴增產(chǎn)物;C.同時對所述多個單分子擴增產(chǎn)物進行高通量基因測序,得到所述多個目標區(qū)域的序列信息。該方法及其相應的試劑盒利用高通量測序技術(shù)對多個目標區(qū)域同時進行區(qū)域測序,提高了檢測效率,同時還能提高檢測的準確性和靈敏度,并能進一步同時對大量樣品進行多區(qū)域檢測。
文檔編號C12Q1/68GK102586422SQ20111044519
公開日2012年7月18日 申請日期2011年12月27日 優(yōu)先權(quán)日2011年12月27日
發(fā)明者盛司潼 申請人:盛司潼