本發(fā)明涉及基因檢測
技術(shù)領(lǐng)域:
,尤其涉及一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建方法、檢測方法和試劑盒。
背景技術(shù):
:地中海貧血(簡稱地貧)是全世界的高發(fā)病率遺傳病之一,是由于人體基因突變或者缺失而導(dǎo)致α,β-珠蛋白肽鏈合成速率的不平衡,從而引起的溶血性貧血。地貧常見的兩種類型是α-地貧和β-地貧,α-地貧相關(guān)基因為HBA2和HBA1,β-地貧相關(guān)基因為HBB。地貧集中在熱帶和亞熱帶地區(qū),多發(fā)生于地中海沿岸國家,其次為中東、印度、巴基斯坦、東南亞、中國南方和北非,美國是移民國家,其發(fā)生率也較高。我國長江以南各省是地貧高發(fā)區(qū),廣東、廣西、海南、中國臺灣和香港等地受累人口超過2億。中國人群中,α-地貧的基因型別常見的有-αSEA、-α3.7、-α4.2、αCS、αQS和αWS,β-地貧常見的有26種基因突變型別。目前地貧尚無根治的方法,只能依靠傳統(tǒng)方法治療,即以輸血治療為主,價格昂貴,因此產(chǎn)前篩查和診斷對預(yù)防該種出生缺陷疾病具有重大意義。1997年,盧煜明發(fā)現(xiàn)孕婦外周血漿中存在來自于胎兒的游離DNA,這一發(fā)現(xiàn)為通過孕婦外周血無創(chuàng)產(chǎn)前診斷和檢測胚胎基因型提供了新的可能,隨著高通量測序技術(shù)的應(yīng)用,無創(chuàng)產(chǎn)前檢測胚胎染色體異常(如21、18、13染色體非整倍體變異)以及部分大的拷貝數(shù)變異已經(jīng)成功應(yīng)用于臨床產(chǎn)前篩查和診斷,但是孕婦體內(nèi)胎兒游離DNA僅占孕婦血漿中總游離DNA的3%-6%,對于胎兒無創(chuàng)式的遺傳性疾病的檢測帶來挑戰(zhàn)。不斷有研究人員嘗試通過孕婦外周血游離DNA對胎兒地貧基因做出檢測,由于孕婦外周血中存在大量母源游離DNA,所以如何有效區(qū)分胚胎基因的突變,對檢測方法的靈敏度提出了很高的要求。目前臨床報道產(chǎn)前檢測地貧基因突變的方法有幾種:傳統(tǒng)的羊膜穿刺、腹絨毛活檢等,由于是有創(chuàng)傷性的操作,可能伴有胎兒損傷、流產(chǎn)或?qū)m內(nèi)感染等風(fēng)險。利用母體血漿中游離胎兒DNA的無創(chuàng)產(chǎn)前診斷也有些研究。ChiuRW通過使用實時熒光PCR技術(shù)實現(xiàn)了對父源codons41/424bp缺失的有效檢測,還有科研工作者發(fā)展了針對其他β地貧點突變的檢測方法,但由于檢測突變多為點突變,方法的特異性有待提高。對于α地貧突變的研究也有報道,WaruneeTungwiwat等人,建立了基于熒光定量PCR檢測α0缺失的方法,然而該方法的靈敏度有待提高。此外,多種高靈敏度的技術(shù)方法也被嘗試用于無創(chuàng)地貧檢測,如質(zhì)譜、數(shù)字PCR、COLD-PCR等。但這些基于單一位點的PCR技術(shù)的檢測方法存在一定的局限性,如血漿DNA低含量及高度片段化的特點,很可能會帶來PCR的假陰性。這種方法只能夠檢測與母親不同的特異性父源突變是否存在,而無法進(jìn)一步確定母源突變的存在與否?;诟咄繙y序技術(shù)的孕婦血漿游離DNA的全基因組測序或者目標(biāo)區(qū)域捕獲測序可以更加準(zhǔn)確的實現(xiàn)對胎兒地貧基因的檢測,但全基因組測序的成本以及分析方法的復(fù)雜性和需要父母單體型等限制了在臨床上的應(yīng)用;目標(biāo)區(qū)域捕獲測序由于其目標(biāo)區(qū)域捕獲效率低,僅能實現(xiàn)對胎兒αSEA缺失純雜合型的區(qū)分,并且還存在分型錯誤的可能。鑒于此,需要提供一種高精確度的無創(chuàng)產(chǎn)前胎兒地貧基因突變檢測方法。技術(shù)實現(xiàn)要素:本發(fā)明提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建方法、檢測方法和試劑盒,能夠準(zhǔn)確、高效地檢測α-SEA型地貧基因突變,其結(jié)果與羊水穿刺檢測分型一致,但安全性、無創(chuàng)性和高效性方面明顯優(yōu)于羊水穿刺檢測。根據(jù)本發(fā)明的第一方面,本發(fā)明提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建方法,上述文庫用于通過高通量測序進(jìn)行無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變的檢測,上述方法包括:(a)對母體外周血游離DNA連接帶有特異標(biāo)簽序列和任選的樣本標(biāo)簽序列的接頭序列;(b)使用預(yù)文庫擴(kuò)增引物序列對上一步的連接產(chǎn)物進(jìn)行預(yù)文庫擴(kuò)增,其中上述預(yù)文庫擴(kuò)增引物序列與上述接頭序列互補(bǔ)結(jié)合;(c)將上一步得到的預(yù)文庫分為上游預(yù)文庫和下游預(yù)文庫,分別使用上游特異性引物組1和下游特異性引物組1對上述上游預(yù)文庫和下游預(yù)文庫進(jìn)行特異性擴(kuò)增,分別得到上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,其中,上述上游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的上游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1;上述下游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的下游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1;(d)對上述上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,分別使用上游特異性引物組2和下游特異性引物組2進(jìn)行特異性擴(kuò)增,分別得到上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2,其中,上述上游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的上游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2;上述下游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的下游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2;并且,上述上游特異性引物組2相比上述上游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點,上述下游特異性引物組2相比上述下游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點;上述上游特異性引物組2和上述下游特異性引物組2的5’端含有用于高通量測序文庫的接頭序列;(e)將上述上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2混合后,使用兩端的通用引物進(jìn)行擴(kuò)增,得到可上機(jī)測序的文庫。進(jìn)一步地,上述上游特異性引物組1和下游特異性引物組1的5'端帶有用于分離擴(kuò)增產(chǎn)物的修飾,優(yōu)選帶有生物素修飾。進(jìn)一步地,上述上游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與上述上游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合;上述下游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與上述下游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合。進(jìn)一步地,上述用于擴(kuò)增α-SEA型地貧基因的上游引物1序列如SEQIDNO:1所示;上述用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1序列如SEQIDNO:2-11所示;上述用于擴(kuò)增α-SEA型地貧基因的下游引物1序列如SEQIDNO:12所示;上述用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1序列如SEQIDNO:13-22所示;上述用于擴(kuò)增α-SEA型地貧基因的上游引物2序列如SEQIDNO:23所示;上述用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2序列如SEQIDNO:24-33所示;上述用于擴(kuò)增α-SEA型地貧基因的下游引物2序列如SEQIDNO:34所示;上述用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2序列如SEQIDNO:35-44所示。根據(jù)本發(fā)明的第二方面,本發(fā)明提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測方法,包括對第一方面的方法構(gòu)建的文庫進(jìn)行高通量測序得到測序讀長(reads);然后,根據(jù)位點的唯一的特異標(biāo)簽序列的總深度和突變等位基因(allele)的深度,計算胎源DNA含量并對地貧相關(guān)的突變進(jìn)行分型以分析α-SEA型地貧基因突變情況。根據(jù)本發(fā)明的第三方面,本發(fā)明提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建試劑盒,上述文庫用于通過高通量測序進(jìn)行無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變的檢測,上述試劑盒包括:(a)上游特異性引物組1和下游特異性引物組1,分別用于對上游預(yù)文庫和下游預(yù)文庫進(jìn)行特異性擴(kuò)增,以分別得到上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,其中,上述上游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的上游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1;上述下游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的下游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1;(b)上游特異性引物組2和下游特異性引物組2,分別用于對上述上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1進(jìn)行特異性擴(kuò)增,以分別得到上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2,其中,上述上游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的上游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2;上述下游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的下游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2;并且,上述上游特異性引物組2相比上述上游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點,上述下游特異性引物組2相比上述下游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點;上述上游特異性引物組2和上述下游特異性引物組2的5’端含有用于高通量測序文庫的接頭序列。進(jìn)一步地,上述上游特異性引物組1和下游特異性引物組1的5'端帶有用于分離擴(kuò)增產(chǎn)物的修飾,優(yōu)選帶有生物素修飾。進(jìn)一步地,上述上游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與上述上游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合;上述下游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與上述下游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合。進(jìn)一步地,上述用于擴(kuò)增α-SEA型地貧基因的上游引物1序列如SEQIDNO:1所示;上述用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1序列如SEQIDNO:2-11所示;上述用于擴(kuò)增α-SEA型地貧基因的下游引物1序列如SEQIDNO:12所示;上述用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1序列如SEQIDNO:13-22所示;上述用于擴(kuò)增α-SEA型地貧基因的上游引物2序列如SEQIDNO:23所示;上述用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2序列如SEQIDNO:24-33所示;上述用于擴(kuò)增α-SEA型地貧基因的下游引物2序列如SEQIDNO:34所示;上述用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2序列如SEQIDNO:35-44所示。進(jìn)一步地,上述試劑盒還包括:(c)接頭序列,其帶有特異標(biāo)簽序列和任選的樣本標(biāo)簽序列,用于連接母體外周血游離DNA,以得到連接產(chǎn)物;(d)預(yù)文庫擴(kuò)增引物序列,其與上述接頭序列互補(bǔ)結(jié)合,用于對上述連接產(chǎn)物進(jìn)行預(yù)文庫擴(kuò)增;(e)通用引物,用于在上述上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2混合后,對混合產(chǎn)物進(jìn)行擴(kuò)增,以得到可上機(jī)測序的文庫;優(yōu)選地,上述接頭序列如SEQIDNO:45-46所示;上述預(yù)文庫擴(kuò)增引物序列如SEQIDNO:47-48所示;上述通用引物如SEQIDNO:49-50所示。本發(fā)明的方法和試劑盒,能夠通過以母體游離血漿DNA為原始材料,構(gòu)建α-SEA型地貧基因突變檢測的文庫,并通過對文庫進(jìn)行高通量測序而實現(xiàn)α-SEA型地貧基因突變檢測。關(guān)鍵在于,在文庫構(gòu)建中,對母體外周血游離DNA片段連接特異性的接頭,然后創(chuàng)造性地將接頭連接產(chǎn)物預(yù)擴(kuò)增產(chǎn)物分成兩部分,分別獨立地使用針對目標(biāo)位點(如α-SEA型地貧基因)的上、下游引物進(jìn)行兩輪特異性擴(kuò)增,能夠高特異性地富集目標(biāo)位點,顯著提高引物擴(kuò)增特異性。并且在擴(kuò)增過程中,分別使用用于計算胎兒游離DNA比例的多個SNP位點的上游引物組和下游引物組進(jìn)行擴(kuò)增,具體地,針對SNP位點也使用不同的引物進(jìn)行兩輪特異性擴(kuò)增,能夠高效、準(zhǔn)確的計算胎兒DNA比例。從而,在高通量測序之后,能夠依據(jù)測序讀長計算胎源DNA含量并對地貧相關(guān)的突變進(jìn)行分型,有效區(qū)分胚胎基因的突變。進(jìn)一步地,發(fā)明人特別針對地貧基因設(shè)計了高效的引物,以及計算胎兒DNA比例的多個SNP位點的引物。使用本發(fā)明的文庫構(gòu)建方法,優(yōu)選地在使用本發(fā)明提供的引物序列組的情況下,能夠準(zhǔn)確、高效地檢測α-SEA型地貧基因突變,其結(jié)果與羊水穿刺檢測分型一致,但安全性、無創(chuàng)性和高效性方面明顯優(yōu)于羊水穿刺檢測。附圖說明圖1為本發(fā)明實施例的無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建方法和突變檢測方法的流程示意圖;圖2為本發(fā)明實施例的上下游特異性引物、通用引物與模板結(jié)合的相對位置關(guān)系示意圖;圖3為本發(fā)明實施例的無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測的預(yù)文庫(a)和終文庫(b)的2%凝膠電泳檢測圖譜,M表示Marker,A10-A15表示6個示例性的樣本。具體實施方式下面通過具體實施方式結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)說明。如圖1所示,本發(fā)明實施例的無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建方法包括步驟:S1:對母體外周血游離DNA連接帶有特異標(biāo)簽序列和任選的樣本標(biāo)簽序列的接頭序列。母體外周血游離DNA,即孕婦的外周血游離DNA,其中包括母源血游離DNA和胎源游離DNA。接頭序列帶有特異標(biāo)簽序,該特異標(biāo)簽序可以是一段n個(例如8或10個)堿基長度的隨機(jī)序列,使得每一接頭序列均不同于其它接頭序列,也就是說,接頭序列用于區(qū)分其連接的母體外周血游離DNA,使得每一母體外周血游離DNA片段都帶有特異性的接頭序列,便于后續(xù)測序之后的序列信息分析中能夠區(qū)分不同母體外周血游離DNA片段。由于在高通量測序中,每次都能產(chǎn)生海量的測序數(shù)據(jù),因此往往將不同來源(例如來源于不同母體的外周血游離DNA)的樣本混庫(pooling)進(jìn)行測序,因此接頭序列還可以帶有一段樣本標(biāo)簽序列(index),其用于區(qū)分不同來源的樣本。S2:使用預(yù)文庫擴(kuò)增引物序列對上一步的連接產(chǎn)物進(jìn)行預(yù)文庫擴(kuò)增,其中預(yù)文庫擴(kuò)增引物序列與接頭序列互補(bǔ)結(jié)合。進(jìn)行預(yù)文庫擴(kuò)增(或稱“預(yù)擴(kuò)增”)是為了增加接頭連接產(chǎn)物的量,因為接頭連接產(chǎn)物中有些分子的拷貝數(shù)可能偏低,在后續(xù)分成上、下游兩部分進(jìn)行特異性擴(kuò)增時,這些拷貝數(shù)偏低的分子可能不能得到有效擴(kuò)增,而預(yù)擴(kuò)增增加接頭連接產(chǎn)物的量,使得各種拷貝數(shù)的分子都能得到有效擴(kuò)增。S3:將上一步得到的預(yù)文庫分為上游預(yù)文庫和下游預(yù)文庫,分別使用上游特異性引物組1和下游特異性引物組1對上游預(yù)文庫和下游預(yù)文庫進(jìn)行特異性擴(kuò)增,分別得到上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1。本發(fā)明將預(yù)文庫分為上游預(yù)文庫和下游預(yù)文庫分別進(jìn)行兩輪特異性擴(kuò)增,能夠顯著提高引物擴(kuò)增特異性。上、下游分開獨立擴(kuò)增的有益效果包括:一方面,由于二代高通量測序讀長(reads)短的原因,上游特異性引物與下游特異性引物需要比較靠近擴(kuò)增目標(biāo)位點(或目標(biāo)區(qū)域),不分開難以有效擴(kuò)增到目標(biāo)片段,而上、下游分開獨立擴(kuò)增能夠有效擴(kuò)增到目標(biāo)片段;另一方面,上、下游分開獨立擴(kuò)增能夠在序列的一端保留接頭序列,便于后續(xù)高通量測序的進(jìn)行。本發(fā)明實施例中,擴(kuò)增目標(biāo)位點(或目標(biāo)區(qū)域)包括α-SEA型地貧基因和用于計算胎兒游離DNA比例的多個SNP位點兩種,相應(yīng)的,上游特異性引物組1和下游特異性引物組1也均分別包括兩種引物,即上游特異性引物組1包括:用于擴(kuò)增α-SEA型地貧基因的上游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1;下游特異性引物組1包括:用于擴(kuò)增α-SEA型地貧基因的下游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1。如圖2示出了本發(fā)明實施例中用于擴(kuò)增α-SEA型地貧基因的上游引物1(USP1)和用于擴(kuò)增α-SEA型地貧基因的下游引物1(DSP1)與模板結(jié)合的相對位置關(guān)系。可以看出,USP1和DSP1分別位于擴(kuò)增目標(biāo)位點——或稱檢測點(即-SEA型缺失斷裂點)的左右兩側(cè),一般而言USP1和DSP1的3’端距離檢測點較近,例如幾個堿基、十幾個堿基的距離,其中一個原因是,二代高通量測序的讀長序列(reads)較短,例如100bp左右,如果USP1和DSP1的3’端距離檢測點較遠(yuǎn)的話,可能二代高通量測序不能有效地測到檢測點。用于計算胎兒游離DNA比例的多個SNP位點的上、下游特異性引物與模板結(jié)合的相對位置關(guān)系與圖2的示意圖相同。為了能夠分離上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,上游特異性引物組1和下游特異性引物組1的5'端可以帶有用于分離擴(kuò)增產(chǎn)物的修飾,優(yōu)選帶有生物素修飾,生物素能夠與親和素結(jié)合,因此上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1可以通過生物素-親和素親和結(jié)合從反應(yīng)體系中分離出來。S4:對上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,分別使用上游特異性引物組2和下游特異性引物組2進(jìn)行特異性擴(kuò)增,分別得到上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2。只有一輪特異性引物擴(kuò)增的情況下,可能會有非特異性擴(kuò)增產(chǎn)物的存在。因此,需要進(jìn)行第二輪特異性引物擴(kuò)增,該第二輪的特異性引物擴(kuò)增使用的特異性引物也包括上游特異性引物和下游特異性引物。在本發(fā)明實施例中,類似于第一輪特異性引物擴(kuò)增,第二輪特異性引物擴(kuò)增使用的上游特異性引物組2包括:用于擴(kuò)增α-SEA型地貧基因的上游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2;下游特異性引物組2包括:用于擴(kuò)增α-SEA型地貧基因的下游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2。如圖2示出了本發(fā)明實施例中用于擴(kuò)增α-SEA型地貧基因的上游引物2(USP2)和用于擴(kuò)增α-SEA型地貧基因的下游引物2(DSP2)與模板結(jié)合的相對位置關(guān)系??梢钥闯?,USP2相比USP1更靠近-SEA型缺失斷裂點,DSP2相比DSP1更靠近-SEA型缺失斷裂點。用于計算胎兒游離DNA比例的多個SNP位點的上、下游引物組2與模板結(jié)合的相對位置關(guān)系與圖2的示意圖相同??傊嫌翁禺愋砸锝M2相比上游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點,下游特異性引物組2相比下游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點。在具體實施例中,上游特異性引物組1中針對特定目標(biāo)位點的引物(例如針對α-SEA型地貧基因的USP1)的3’端,與上游特異性引物組2中針對該目標(biāo)位點的引物(例如針對α-SEA型地貧基因的USP2)的5’端有10-15個堿基的重合;類似地,下游特異性引物組1中針對特定目標(biāo)位點的引物(例如針對α-SEA型地貧基因的DSP1)的3’端,與下游特異性引物組2中針對該目標(biāo)位點的引物(例如針對α-SEA型地貧基因的DSP2)的5’端有10-15個堿基的重合。此處“3’端”和“5’端”,分別是指靠近3’末端和5’末端的一段序列。這種重合,主要是考慮USP1和DSP1原本距離檢測點(例如-SEA型缺失斷裂點)較近,堿基的重合能夠在進(jìn)一步提高擴(kuò)增特異性的同時,充分有效利用結(jié)合空間。為了便于高通量測序的進(jìn)行,上游特異性引物組2和下游特異性引物組2的5’端可以含有用于高通量測序文庫的接頭序列。具體的,使用何種高通量測序平臺,則采用該平臺對應(yīng)的接頭序列。S5:將上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2混合后,使用兩端的通用引物進(jìn)行擴(kuò)增,得到可上機(jī)測序的文庫。如圖2所示,通用引物(UNP)能夠結(jié)合接頭序列,通過通用引物擴(kuò)增即可得到上機(jī)測序的文庫。上機(jī)測序通過高通量測序?qū)崿F(xiàn)。高通量測序技術(shù)可以選自Illumina/GenomeAnalyzer/Hiseq/Miseq/NEXTseqCN500、AppliedBiosystemsSOLID和lifeTechnologies/IonTorrent。具體的,使用何種高通量測序技術(shù),則通用引物也采用該高通量測序技術(shù)對應(yīng)的引物。在本發(fā)明的一個實施例中,用于擴(kuò)增α-SEA型地貧基因的上游引物1序列如SEQIDNO:1所示;用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1序列如SEQIDNO:2-11所示;用于擴(kuò)增α-SEA型地貧基因的下游引物1序列如SEQIDNO:12所示;用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1序列如SEQIDNO:13-22所示;用于擴(kuò)增α-SEA型地貧基因的上游引物2序列如SEQIDNO:23所示;用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2序列如SEQIDNO:24-33所示;用于擴(kuò)增α-SEA型地貧基因的下游引物2序列如SEQIDNO:34所示;用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2序列如SEQIDNO:35-44所示。本發(fā)明實施例還提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測方法,包括對本發(fā)明實施例構(gòu)建的文庫進(jìn)行高通量測序得到測序讀長(reads);然后,根據(jù)位點的唯一的特異標(biāo)簽序列的總深度和突變等位基因(allele)的深度,計算胎源DNA含量并對地貧相關(guān)的突變進(jìn)行分型以分析α-SEA型地貧基因突變情況。本發(fā)明實施例還提供一種無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變檢測文庫構(gòu)建試劑盒,上述文庫用于通過高通量測序進(jìn)行無創(chuàng)產(chǎn)前胎兒α-SEA型地貧基因突變的檢測,上述試劑盒包括:(R1)上游特異性引物組1和下游特異性引物組1,分別用于對上游預(yù)文庫和下游預(yù)文庫進(jìn)行特異性擴(kuò)增,以分別得到上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1,其中,上游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的上游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1;下游特異性引物組1包括用于擴(kuò)增α-SEA型地貧基因的下游引物1以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1;(R2)上游特異性引物組2和下游特異性引物組2,分別用于對上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1進(jìn)行特異性擴(kuò)增,以分別得到上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2,其中,上游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的上游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2;下游特異性引物組2包括用于擴(kuò)增α-SEA型地貧基因的下游引物2以及用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2。其中,上游特異性引物組2相比上游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點,下游特異性引物組2相比下游特異性引物組1更靠近對應(yīng)的擴(kuò)增目標(biāo)位點;上游特異性引物組2和下游特異性引物組2的5’端含有用于高通量測序文庫的接頭序列。在優(yōu)選的實施例中,上游特異性引物組1和下游特異性引物組1的5'端帶有用于分離擴(kuò)增產(chǎn)物的修飾,優(yōu)選帶有生物素修飾,以便從體系中分離上游特異性擴(kuò)增產(chǎn)物1和下游特異性擴(kuò)增產(chǎn)物1。在優(yōu)選的實施例中,上游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與上游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合;下游特異性引物組1中針對特定目標(biāo)位點的引物的3’端,與下游特異性引物組2中針對該目標(biāo)位點的引物的5’端有10-15個堿基的重合。在本發(fā)明的一個實施例中,用于擴(kuò)增α-SEA型地貧基因的上游引物1序列如SEQIDNO:1所示;用于計算胎兒游離DNA比例的多個SNP位點的上游引物組1序列如SEQIDNO:2-11所示;用于擴(kuò)增α-SEA型地貧基因的下游引物1序列如SEQIDNO:12所示;用于計算胎兒游離DNA比例的多個SNP位點的下游引物組1序列如SEQIDNO:13-22所示;用于擴(kuò)增α-SEA型地貧基因的上游引物2序列如SEQIDNO:23所示;用于計算胎兒游離DNA比例的多個SNP位點的上游引物組2序列如SEQIDNO:24-33所示;用于擴(kuò)增α-SEA型地貧基因的下游引物2序列如SEQIDNO:34所示;用于計算胎兒游離DNA比例的多個SNP位點的下游引物組2序列如SEQIDNO:35-44所示。在優(yōu)選的實施例中,試劑盒還包括:(R3)接頭序列,其帶有特異標(biāo)簽序列和任選的樣本標(biāo)簽序列,用于連接母體外周血游離DNA,以得到連接產(chǎn)物;(R4)預(yù)文庫擴(kuò)增引物序列,其與上述接頭序列互補(bǔ)結(jié)合,用于對上述連接產(chǎn)物進(jìn)行預(yù)文庫擴(kuò)增;(R5)通用引物,用于在上述上游特異性擴(kuò)增產(chǎn)物2和下游特異性擴(kuò)增產(chǎn)物2混合后,對混合產(chǎn)物進(jìn)行擴(kuò)增,以得到可上機(jī)測序的文庫。在本發(fā)明的一個實施例中,接頭序列如SEQIDNO:45-46所示;預(yù)文庫擴(kuò)增引物序列如SEQIDNO:47-48所示;通用引物如SEQIDNO:49-50所示。以下通過實施例詳細(xì)說明本發(fā)明的技術(shù)方案和技術(shù)效果,應(yīng)當(dāng)理解,實施例僅是示例性的,不能理解為對本發(fā)明保護(hù)范圍的限制。實施例1、針對α地中海貧血基因-αSEA突變位點設(shè)計合成引物:上游引物和下游引物分別位于檢測點左側(cè)和右側(cè)。同側(cè)的特異性引物1的3’端和特異性引物2的5’端有10-15個堿基的重合。特異性引物1的5'端有生物素修飾。特異性引物2的5’端含有用于高通量測序文庫的接頭序列。具體的,引物序列如表1所示。表12、帶有特異標(biāo)簽序列和樣本標(biāo)簽序列(index)的接頭序列:ADT-F:CAAGCAGAAGACGGCATACGAGATNNNNNNNNATTAAGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQIDNO:45);ADT-R:pGATCGGAAGAGC(SEQIDNO:46)。其中,NNNNNNNN是特異標(biāo)簽序列,ATTAAGG是樣本標(biāo)簽序列(index),以上接頭序列需要退火成雙鏈。3、預(yù)文庫擴(kuò)增引物序列:pre-lib-primer-F:CAAGCAGAAGACGGCATACGA(SEQIDNO:47);pre-lib-primer-R:GCTCTTCCGATCT(SEQIDNO:48)。4、終文庫擴(kuò)增引物序列(通用引物):Seq-lib-primer-F:CAAGCAGAAGACGGCATACGA(SEQIDNO:49);Seq-lib-primer-R:ATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTC(SEQIDNO:50)。5、本發(fā)明實施例的檢測方法和檢測試劑盒,具體建庫步驟為:1)提取2ml孕婦血漿游離DNA。2)游離DNA末端修復(fù),配置反應(yīng)體系(反應(yīng)一)如表2所示。表2試劑體積(μL)DNA40.5T4DNA連接酶緩沖液+10mMATP510mMdNTP混合液2T4DNA聚合酶(Enzymatics公司)1T4DNA磷酸化酶(Enzymatics公司)0.5rTaq(Takara公司)1總體積50充分混勻,瞬時離心,在熱循環(huán)儀上進(jìn)行如下反應(yīng):37℃,20min;72℃,20min;4℃保存。3)DNA片段連接帶有特異標(biāo)簽序列和樣本標(biāo)簽序列的接頭序列,配置反應(yīng)體系(反應(yīng)二)如表3所示。表3試劑體積(μL)反應(yīng)一50DNA連接酶緩沖液27DNA連接酶(Enzymatics公司)1接頭序列(SEQIDNO:45-46)2總體積80充分混勻,瞬時離心,在熱循環(huán)儀上進(jìn)行如下反應(yīng):20℃,15min;65℃,10min;4℃保存。4)反應(yīng)結(jié)束后,立即使用30μLXPbeads純化,26μL超純水或者洗脫液中洗脫。5)PCR預(yù)擴(kuò)增在冰上配置如下反應(yīng)體系,如表4所示。表4充分混勻,瞬時離心,在熱循環(huán)儀上進(jìn)行如下反應(yīng):95℃,3min,1循環(huán);(95℃,15s,62℃,30s,72℃,30s)10循環(huán);72℃,5min,1循環(huán);4℃保存。6)反應(yīng)終產(chǎn)物使用50μLXPbeads回收純化,使用Qubit定量,5μL反應(yīng)產(chǎn)物2%凝膠電泳檢測,結(jié)果如圖3a所示,表明預(yù)文庫構(gòu)建成功。取兩等份預(yù)文庫,分別命名為上游預(yù)文庫和下游預(yù)文庫,每份100ng,進(jìn)行下一步擴(kuò)增。7)特異性擴(kuò)增1每份樣品預(yù)文庫為上游預(yù)文庫和下游預(yù)文庫,分別使用對應(yīng)的上、下游特異性引物1和特異性引物2,直到使用通用引物擴(kuò)增時將每份樣品上、下游引物擴(kuò)增產(chǎn)物合并,再使用通用引物擴(kuò)增。在冰上配置如下反應(yīng)體系,如表5所示。表5PCR反應(yīng)程序如下:95℃,10min,1循環(huán);(95℃,30s,62℃,30s,72℃,1min)20循環(huán);72℃,7min,1循環(huán);4℃保存。8)5μL反應(yīng)產(chǎn)物2%瓊脂糖凝膠電泳,剩余產(chǎn)物1.2XXP回收,24μL超純水或者洗脫液洗脫,洗脫液進(jìn)行下一步擴(kuò)增。9)特異性擴(kuò)增2在冰上配置如下反應(yīng)體系,如表6所示。表6PCR反應(yīng)程序如下:95℃,10min,1循環(huán);(95℃,30s,62℃,30s,72℃,1min)15循環(huán);72℃,7min,1循環(huán);4℃保存。10)5μL反應(yīng)產(chǎn)物2%瓊脂糖凝膠電泳,剩余產(chǎn)物1.2XXP回收,每一個樣品的上下游擴(kuò)增產(chǎn)物可以合并回收,最終26μL超純水或者洗脫液洗脫,洗脫液進(jìn)行通用引物擴(kuò)增。11)通用引物擴(kuò)增在冰上配置如下反應(yīng)體系,如表7所示。表7PCR反應(yīng)程序如下:98℃,45s,1循環(huán);(98℃,15s,60℃,30s,72℃,30s)10循環(huán);72℃,1min,1循環(huán);4℃保存。12)5μL反應(yīng)產(chǎn)物2%凝膠電泳檢測,結(jié)果如圖3b所示,表明終文庫構(gòu)建成功。剩余產(chǎn)物1.0XXP回收,最后使用30ul洗脫液洗脫,即為最終上機(jī)文庫。13)文庫質(zhì)控后,IlluminaNEXTseqCN500進(jìn)行75PE測序。14)測序數(shù)據(jù)信息分析過濾掉低質(zhì)量測序讀長(reads)后,對于每一對pair-endreads根據(jù)所連接的分子標(biāo)簽序列和擴(kuò)增引物序列歸類,當(dāng)reads起始部分序列與實驗加入的引物序列和分子標(biāo)簽序列不一致時,reads將被過濾掉。保留下來的pair-endreads用BWAMEM人類參考基因組(hg19)比對,按同起始、同終止位置且分子標(biāo)簽一致的序列聚類到同一組,得到唯一的分子標(biāo)簽組序列,將唯一的分子標(biāo)簽組序列重新比對到參考基因組(BWAMEM),用GATK軟件對Indel周圍的序列重新比對,用samtools軟件進(jìn)行SNP和小的插入缺失檢測,用FACTERA軟件進(jìn)行—SEA缺失檢測。根據(jù)位點的唯一的分子標(biāo)簽組序列的總深度和相關(guān)SNP位點等位基因(allele)的深度,計算胚胎DNA含量,并對胎兒地貧相關(guān)的SNP、INDEL,--SEA型缺失進(jìn)行分型。根據(jù)上述實施例,對14例地中海貧血攜帶者的孕婦進(jìn)行無創(chuàng)產(chǎn)前地中海貧血基因檢測,結(jié)果如下表8所示。表8結(jié)果顯示,本發(fā)明實施例對–αSEA地中海貧血基因突變無創(chuàng)產(chǎn)前檢測和羊水穿刺檢測分型一致,表明本發(fā)明的方法能夠準(zhǔn)確、高效地檢測α-SEA型地貧基因突變,其結(jié)果與羊水穿刺檢測分型一致,但安全性、無創(chuàng)性和高效性方面明顯優(yōu)于羊水穿刺檢測。以上內(nèi)容是結(jié)合具體的實施方式對本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實施只局限于這些說明。對于本發(fā)明所屬
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。SEQUENCELISTING<110>人和未來生物科技(長沙)有限公司<120>無創(chuàng)產(chǎn)前胎兒αSEA型地貧基因突變檢測文庫構(gòu)建方法、檢測方法和試劑盒<130>17I23913<160>50<170>PatentInversion3.3<210>1<211>30<212>DNA<213>引物序列<400>1tcgtcgcggcctggggttcacttggggggc30<210>2<211>30<212>DNA<213>引物序列<400>2tgtagagcagaaaggtatgggctcaactag30<210>3<211>33<212>DNA<213>引物序列<400>3ctcttttattctatacttctctaatactcacct33<210>4<211>30<212>DNA<213>引物序列<400>4gttctccctgttccggggacatcaccttcc30<210>5<211>30<212>DNA<213>引物序列<400>5gatttttagggcagtgaaactcctctacag30<210>6<211>30<212>DNA<213>引物序列<400>6ttagtcttactttgcttttttaaattagct30<210>7<211>25<212>DNA<213>引物序列<400>7tgttaggatgtacacacattttaat25<210>8<211>30<212>DNA<213>引物序列<400>8agacattactgctttgaagactttgtgtat30<210>9<211>30<212>DNA<213>引物序列<400>9cctatcgccaagtggtgagacaatcgccga30<210>10<211>30<212>DNA<213>引物序列<400>10tttagtcatgaagttttctgagtgccagtg30<210>11<211>30<212>DNA<213>引物序列<400>11gtaataataacaacactaatggcggtaaac30<210>12<211>29<212>DNA<213>引物序列<400>12tgaactcctggacttaagtgatcctcctg29<210>13<211>30<212>DNA<213>引物序列<400>13tataatcccacaccactctttgtttgctct30<210>14<211>33<212>DNA<213>引物序列<400>14accctataatgctctgtgaaacacctatttgtt33<210>15<211>30<212>DNA<213>引物序列<400>15aagatggccagggaagtgtgagtgacccta30<210>16<211>30<212>DNA<213>引物序列<400>16cagcgttatatgttctacaggtttagacaa30<210>17<211>25<212>DNA<213>引物序列<400>17tgggaaggctgcatggtgaatataa25<210>18<211>30<212>DNA<213>引物序列<400>18ttcaagcattcactgaaggtcttggaacgt30<210>19<211>25<212>DNA<213>引物序列<400>19tagaaccttttggactagttatgcc25<210>20<211>30<212>DNA<213>引物序列<400>20caagtgaaaggggtccgatggtactcactg30<210>21<211>30<212>DNA<213>引物序列<400>21aatcttcagtggggatgtagcacattttgc30<210>22<211>30<212>DNA<213>引物序列<400>22atcatgttggcaacatgcttggagatcccc30<210>23<211>49<212>DNA<213>引物序列<400>23agatgtgtataagagacaggttcacttggggggcgccttggggaggttc49<210>24<211>49<212>DNA<213>引物序列<400>24agatgtgtataagagacagtatgggctcaactagctatgttacaacttc49<210>25<211>52<212>DNA<213>引物序列<400>25agatgtgtataagagacagcttctctaatactcacctgttctaatgagattt52<210>26<211>44<212>DNA<213>引物序列<400>26agatgtgtataagagacaggggacatcaccttccagtctccaag44<210>27<211>49<212>DNA<213>引物序列<400>27agatgtgtataagagacaggaaactcctctacagcatactgtaatgatg49<210>28<211>49<212>DNA<213>引物序列<400>28agatgtgtataagagacaggcttttttaaattagctcttcatgcagcac49<210>29<211>44<212>DNA<213>引物序列<400>29agatgtgtataagagacagcacacattttaatattttggtacca44<210>30<211>49<212>DNA<213>引物序列<400>30agatgtgtataagagacaggaagactttgtgtatactaaatgtgggtaa49<210>31<211>49<212>DNA<213>引物序列<400>31agatgtgtataagagacaggtgagacaatcgccgagcagtgagaccatc49<210>32<211>49<212>DNA<213>引物序列<400>32agatgtgtataagagacagttctgagtgccagtggaactgtcctggttc49<210>33<211>49<212>DNA<213>引物序列<400>33agatgtgtataagagacagctaatggcggtaaacaccatcatcatcttg49<210>34<211>49<212>DNA<213>引物序列<400>34agatgtgtataagagacagtcctggacttaagtgatcctcctgccccag49<210>35<211>49<212>DNA<213>引物序列<400>35agatgtgtataagagacagccactctttgtttgctctattttggttctc49<210>36<211>52<212>DNA<213>引物序列<400>36agatgtgtataagagacagtctgtgaaacacctatttgttagataaattgat52<210>37<211>49<212>DNA<213>引物序列<400>37agatgtgtataagagacaggaagtgtgagtgaccctaggggttgtgccc49<210>38<211>49<212>DNA<213>引物序列<400>38agatgtgtataagagacagttctacaggtttagacaagtgtatcctaac49<210>39<211>49<212>DNA<213>引物序列<400>39agatgtgtataagagacaggctgcatggtgaatataagaactgaattct49<210>40<211>49<212>DNA<213>引物序列<400>40agatgtgtataagagacagctgaaggtcttggaacgtatcccctgtgga49<210>41<211>49<212>DNA<213>引物序列<400>41agatgtgtataagagacagttttggactagttatgccactcctgaggag49<210>42<211>49<212>DNA<213>引物序列<400>42agatgtgtataagagacaggtccgatggtactcactgctcagcaatagg49<210>43<211>49<212>DNA<213>引物序列<400>43agatgtgtataagagacagggatgtagcacattttgctatttgagatgg49<210>44<211>49<212>DNA<213>引物序列<400>44agatgtgtataagagacagacatgcttggagatccccagatcaaaggtg49<210>45<211>73<212>DNA<213>引物序列<220><221>misc_feature<222>(25)..(32)<223>nisa,c,g,ort<400>45caagcagaagacggcatacgagatnnnnnnnnattaagggtgactggagttcagacgtgt60gctcttccgatct73<210>46<211>12<212>DNA<213>引物序列<400>46gatcggaagagc12<210>47<211>21<212>DNA<213>引物序列<400>47caagcagaagacggcatacga21<210>48<211>13<212>DNA<213>引物序列<400>48gctcttccgatct13<210>49<211>21<212>DNA<213>引物序列<400>49caagcagaagacggcatacga21<210>50<211>43<212>DNA<213>引物序列<400>50aatgatacggcgaccaccgagatctacactcgtcggcagcgtc43當(dāng)前第1頁1 2 3