本發(fā)明涉及測(cè)序
技術(shù)領(lǐng)域:
,用于受檢樣本建庫中的分子接頭及應(yīng)用;同時(shí)應(yīng)用于超低頻基因突變檢測(cè)的分子接頭及應(yīng)用;尤其是具有鑒別功能的分子接頭制備及構(gòu)建待測(cè)樣本測(cè)序文庫的方法。
背景技術(shù):
:腫瘤是異質(zhì)性細(xì)胞的混合體,測(cè)序可以檢測(cè)其中的罕見突變,二代測(cè)序具有多樣本、多基因的優(yōu)勢(shì),同時(shí)還可以發(fā)現(xiàn)未知的突變位點(diǎn),所以二代測(cè)序可以用于腫瘤的早期篩查和診斷,復(fù)發(fā)監(jiān)控,療效評(píng)估等。ctDNA是腫瘤患者體液中游離的DNA(circulatingtumorDNA,ctDNA),來自于腫瘤細(xì)胞壞死或凋亡等過程釋放,存在于血液、尿液、腦脊液等體液中。ctDNA釋放入血,攜帶有腫瘤的相關(guān)信息,因此通過ctDNA的檢測(cè)可以反映腫瘤相關(guān)基因的特異性變異,進(jìn)而了解腫瘤的特征。因血漿中ctDNA含量極低,實(shí)驗(yàn)過程復(fù)雜,樣本用量及實(shí)驗(yàn)次數(shù)受限制,且樣本準(zhǔn)備及測(cè)序前期文庫構(gòu)建及雜交捕獲過程中存在損失,因此利用高通量測(cè)序(二代測(cè)序)技術(shù)獲取的有效數(shù)據(jù)率偏低;加之血漿中ctDNA樣本容易受基因組DNA的污染,導(dǎo)致測(cè)序背景噪音過高;此外測(cè)序過程中文庫富集、后續(xù)的雜交捕獲及測(cè)序都存在不同程度的氧化損傷,產(chǎn)生假陽性突變,將掩蓋樣本中的罕見突變,特別是血漿中有限的ctDNA,限制了檢測(cè)靈敏度。因此受檢樣本連接上傳統(tǒng)的接頭只能通過分子標(biāo)簽區(qū)分不同的樣本,然而因樣本DNA量太低、背景信號(hào)過高、假陽性突變等原因,數(shù)據(jù)分析時(shí)很難剔除干擾,無法真實(shí)反映樣本DNA所攜帶的腫瘤信息,尤其是ctDNA的檢測(cè)。技術(shù)實(shí)現(xiàn)要素:基于上述問題,本發(fā)明的目的是根據(jù)illumina測(cè)序平臺(tái),優(yōu)化illumina測(cè)序接頭設(shè)計(jì)出具有穩(wěn)定性好、與樣本DNA連接效率高、具有校正功能的分子接頭。該分子接頭能夠檢測(cè)突變頻率低至0.05%突變位點(diǎn)。一種分子接頭,該分子接頭是呈鑰匙狀結(jié)構(gòu)的核苷酸序列,包括非互補(bǔ)環(huán)狀序列、互補(bǔ)雙鏈序列和位于互補(bǔ)雙鏈序列5’端的校正標(biāo)簽,(1)非互補(bǔ)環(huán)狀序列中脫氧尿嘧啶dU兩側(cè)序列包含CACACGTCTGAACTCCAGTCACdUACACTCTTTCCCTACACGACG;(2)互補(bǔ)雙鏈序列3’端含有能夠與隨機(jī)堿基互補(bǔ)配對(duì)的延伸區(qū)且3’端經(jīng)化學(xué)修飾為具有防止核酸酶降解的功能;(3)互補(bǔ)雙鏈序列5’-3’依次為保護(hù)堿基、酶切識(shí)別堿基、4-12個(gè)隨機(jī)堿基。(4)校正標(biāo)簽5’→3’由保護(hù)堿基和4-12個(gè)隨機(jī)堿基組成,且5’端經(jīng)化學(xué)修飾為具有防止核酸酶降解的功能。在一種實(shí)施方式中,所述非互補(bǔ)環(huán)狀序列長(zhǎng)度為42-54bp,所述互補(bǔ)雙鏈序列長(zhǎng)度為10-22bp。在一種實(shí)施方式中,所述校正標(biāo)簽5’端經(jīng)磷酸基團(tuán)修飾;所述互補(bǔ)雙鏈序列3’端倒數(shù)第一個(gè)堿基與倒數(shù)第二個(gè)堿基之間硫化修飾。在一種實(shí)施方式中,校正標(biāo)簽中為8個(gè)隨機(jī)堿基。在一種優(yōu)選的實(shí)施方式中,分子接頭序列為:PHO-5’-TTCTACAGTACNNNNNNNNAGATCGGAAGAG.....CACACGTCTGAACTCCAGTCACdUACACTCTTTCCCTACACGACG....CTCTTCCGATC*T-3……注:PHO代表5’端磷酸化,這里的N表示A/T/G/C中任何一個(gè)堿基,dU代表脫氧尿嘧啶,dU左邊與右邊下劃線為互補(bǔ)區(qū)域,*代表硫化修飾,虛線“……”代表延伸區(qū),斜體部分為限制性內(nèi)切酶識(shí)別區(qū)。一種構(gòu)建待測(cè)樣本測(cè)序文庫的方法,利用上述任一項(xiàng)所述的分子接頭作為測(cè)序文庫的接頭,然后執(zhí)行:1)加入DNA聚合酶,梯度退火延伸后用能夠產(chǎn)生T粘性末端的限制性內(nèi)切酶酶切并純化;2)樣本DNA打斷,制備DNA混合物,DNA末端修復(fù);3)接頭連接:接頭與末端修復(fù)后的DNA連接;4)USER酶切除脫氧尿嘧啶dU;5)文庫DNA引入上機(jī)barcode序列,PCR擴(kuò)增;6)PCR擴(kuò)增之后的文庫經(jīng)測(cè)序并獲取測(cè)序數(shù)據(jù)。在一種實(shí)施方式中,測(cè)序文庫的構(gòu)建方法在步驟1)中,所述的梯度退火中所用的退火延伸步驟見下表:在步驟3)中所述的接頭與末端修復(fù)后的DNA摩爾比為15:1。在步驟5)中所述的barcode序列長(zhǎng)度為6-8bp。在步驟6)對(duì)所述的PCR擴(kuò)增之后的文庫進(jìn)行150bp雙端測(cè)序。利用上述任一項(xiàng)所述的分子接頭的應(yīng)用,該分子接頭用于鑒別樣本測(cè)序文庫構(gòu)建過程中真實(shí)突變和操作過程引入的假陽性突變。利用上述任一項(xiàng)所述的分子接頭的應(yīng)用,其特征在于:該分子接頭連接血漿游離DNA或組織DNA。本發(fā)明有益效果是:(1)本發(fā)明設(shè)計(jì)了獨(dú)特的鑰匙狀閉環(huán)接頭,此外5’端磷酸化修飾、3’端硫代修飾可防止接頭被核酸酶水解,相對(duì)于普通Y型接頭更穩(wěn)定;(2)非互補(bǔ)環(huán)狀區(qū)引入脫氧尿嘧啶dU堿基,該堿基經(jīng)USER酶切開之后,暴露引物結(jié)合位點(diǎn),可通過PCR擴(kuò)增文庫過程中引入不同的分子標(biāo)簽(barcode),便于標(biāo)記多個(gè)不同樣本,更充分體現(xiàn)二代測(cè)序的高通量特征之一,從而使得該分子接頭具有更大適用性;(3)最重要的是本發(fā)明在互補(bǔ)雙鏈區(qū)域增加校正標(biāo)簽(即8個(gè)隨機(jī)堿基),在樣本原始的DNA分子上引入校正標(biāo)簽,給每一個(gè)DNA分子的每條鏈都做上獨(dú)特標(biāo)記,數(shù)據(jù)分析時(shí)通過此校正標(biāo)簽可以找到多條包含有樣本同一個(gè)DNA分子單條鏈的原始數(shù)據(jù)信息;通過校正標(biāo)簽互補(bǔ)原則,可以找到另外一條互補(bǔ)鏈的數(shù)據(jù)信息,多條信息比對(duì),可區(qū)分出真實(shí)突變和操作過程引入的假陽性突變,以此剔除干擾數(shù)據(jù)保留真實(shí)突變,增加低頻突變檢測(cè)靈敏度(詳見圖6和圖7),使得最終所得突變信息更真實(shí)反映樣本DNA所攜帶的腫瘤信息,尤其是ctDNA的檢測(cè)。能夠檢測(cè)突變頻率低至0.05%的突變位點(diǎn),且檢測(cè)結(jié)果準(zhǔn)確。另外,本發(fā)明的標(biāo)簽接頭制備簡(jiǎn)單,從而本發(fā)明的測(cè)序系統(tǒng)操作簡(jiǎn)單,實(shí)施容易;(4)基于該分子接頭構(gòu)建待測(cè)樣本測(cè)序文庫,采用特殊的一步法退火延伸制備,對(duì)退火條件進(jìn)行優(yōu)化,操作簡(jiǎn)便且所制備接頭片段單一,更有利于接頭與樣本DNA連接,磷酸化修飾及酶切產(chǎn)生黏性末端也增加了接頭與樣本DNA的連接效率。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,并可依照說明書的內(nèi)容予以實(shí)施,以下以本發(fā)明的較佳實(shí)施例并配合附圖詳細(xì)說明如下。附圖說明圖1.是本發(fā)明鑰匙狀分子接頭制備過程;圖2.是本發(fā)明鑰匙狀分子接頭與血漿游離DNA連接文庫2100結(jié)果圖;圖3.是本發(fā)明鑰匙狀分子接頭與組織DNA連接文庫2100結(jié)果圖;圖4.是本發(fā)明鑰匙狀分子接頭與細(xì)胞DNA連接文庫(0.1%摻和組)2100結(jié)果;圖5.是本發(fā)明文庫兩輪捕獲后real-timePCR檢測(cè)EGFR擴(kuò)增曲線;圖6.是本發(fā)明分子接頭校正原理示意圖;圖7.是本發(fā)明分子接頭校正實(shí)例(細(xì)胞DNA文庫0.1%摻和組)。具體實(shí)施方式下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。實(shí)施例1接頭退火延伸步驟(1)鑰匙狀分子接頭序列為SEQIDNo.1(圖1):PHO-5’-TTCTACAGTACNNNNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCACdUACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3……注:PHO代表5’端磷酸化,這里的N表示A/T/G/C中任何一個(gè)堿基,dU代表脫氧尿嘧啶,dU左邊與右邊下劃線為互補(bǔ)區(qū)域,*代表硫化修飾,虛線“……”代表延伸區(qū),斜體部分為限制性內(nèi)切酶識(shí)別區(qū)。(2)鑰匙狀接頭采用一步法退火延伸所需試劑:接頭序列(金唯智生物科技有限公司合成)、KAPAHiFiHotstatReadyMix(KAPA公司kk2602)、滅菌超純水(3)鑰匙狀接頭采用一步法退火延伸步驟:將合成的干粉狀接頭序列加滅菌超純水溶解,終濃度100uM。按照表1配比進(jìn)行混合反應(yīng)液,混合均勻,表1鑰匙狀接頭一步法退火延伸體系按照表2在PCR儀設(shè)置程序反應(yīng):表2鑰匙狀接頭一步法退火延伸步驟(4)退火延伸后純化步驟:退火延伸后得到的原始接頭用2倍體積預(yù)冷無水乙醇和1/3體積3mol/ml醋酸鈉進(jìn)行純化。-20℃沉降30min,4℃12000rpm離心20min,用70%無水乙醇洗滌兩遍,4℃12000rpm離心5min。室溫晾干,超純水溶解。(5)接頭經(jīng)酶切并純化上述接頭經(jīng)能夠產(chǎn)生T粘性末端的限制性內(nèi)切酶HPYCH4Ⅲ(NEBR0618S)37℃酶切3h得黏性末端,粘性末端提高接頭與樣本DNA連接效率,具體酶切體系如表3所示:表3接頭酶切體系組分用量接頭DNA1ug10×cutsmartbuffer5uLHPYCH4Ⅲ酶2uL滅菌水2uL酶切完經(jīng)無水乙醇純化,具體步驟見上述步驟(4)。實(shí)施例2血漿和組織樣本DNA文庫構(gòu)建本實(shí)施例樣本來自沈陽軍區(qū)總醫(yī)院,5例臨床確診為肺癌III期腺癌患者,取術(shù)前用藥前配套血漿(2ml)和組織樣本,提取游離DNA(cfDNA)和組織DNA,組織DNA經(jīng)超聲打斷成150-250bp大小,cfDNA和組織打斷DNA經(jīng)安捷倫2100生物分析儀質(zhì)控合格后,按照下述步驟分別構(gòu)建文庫。(1)樣本DNA末端修復(fù)按照表4配置混合反應(yīng),采用KAPALTPLibraryPreparationKit(KK8233)EndRepair,血漿cfDNA全部投入,片段化DNA樣本投入量100ng。表4.樣本DNA末端修復(fù)體系片段化DNA樣本(150bp)50ulKAPAEndRepairBuffer(10X)7ulKAPAEndRepairEnzymeMix5ulWater8ul總體積70ul放置于BioRADPCR儀中20℃30分鐘,使用120ulAgencourtAMPureXPbeads磁珠(貝克曼公司A63881)進(jìn)行純化,30ul滅菌超純水洗脫。(2)接頭連接按照表5配置混合反應(yīng),接頭與末端修復(fù)后的DNA摩爾比為10:1,放置PCR儀20℃15分鐘。表5.接頭與樣本DNA連接體系末端修復(fù)后的DNA30ul5×KAPALigationBuffer10ulKAPAT4DNALigase5ul鑰匙狀接頭5ul總體積50ul(3)USER酶(NEB公司M5505S)進(jìn)行酶切向上述連接反應(yīng)液中加入3ulUSER酶切除脫氧尿嘧啶dU,37℃30分鐘。使用45ulAmpureXPbeads進(jìn)行純化,15ul滅菌超純水洗脫(按需求進(jìn)行大小片段篩選)。(4)文庫富集文庫富集引物參考Illumina儀器及試劑中引物序列要求進(jìn)行設(shè)計(jì)SEQIDNo.2:Primeri5:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*TSEQIDNo.3:Primeri7:CAAGCAGAAGACGGCATACGAGATxxxxxxxx(index8個(gè)堿基)GTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C按照表6配置混合反應(yīng)表6.文庫富集體系上述連接后的DNA15ul2×KAPAHiFiHotstatReadyMix25ul10×Illuminai7primer/indexprimer5ul10×Illuminai5primer5ul總體積50ul按照表7在PCR儀設(shè)置程序反應(yīng):表7.文庫富集PCR程序使用45ulAmpureXPbeads進(jìn)行純化。文庫濃度測(cè)定取出2ul純化之后的文庫進(jìn)行濃度測(cè)定,濃度測(cè)定采用dsDNAHSAssayKits(Q32854)在2.0Fluorometer儀器進(jìn)行測(cè)定。經(jīng)測(cè)定本發(fā)明分子接頭與樣本DNA連接擴(kuò)增之后,20ul滅菌超純水洗脫,血漿樣本游離DNA文庫濃度為10-25ng/ul,組織樣本DNA文庫濃度35-65ng/ul,該濃度可用于后續(xù)上機(jī)測(cè)序。實(shí)試?yán)?已知突變位點(diǎn)的細(xì)胞DNA靈敏度實(shí)驗(yàn)用于本實(shí)施例的細(xì)胞樣本來自中國科學(xué)院典型培養(yǎng)物保藏委員會(huì)細(xì)胞庫,其中H1975細(xì)胞株(已知EGFRL858和T790M突變)、H1650細(xì)胞株(已知EGFR19號(hào)外顯子缺失)、陰性MRC細(xì)胞株(無EGFR突變)。H1975細(xì)胞與H1650細(xì)胞提取DNA,超聲打斷后按照質(zhì)量比1:1混合,再與陰性細(xì)胞株MRC片段化DNA樣本按照1%、0.1%、0.05%、0%摻合,進(jìn)行文庫構(gòu)建,再進(jìn)行兩輪特異性雜交捕獲,捕獲之后的文庫通過熒光定量PCR法對(duì)相應(yīng)變異位點(diǎn)進(jìn)行檢測(cè),最后經(jīng)雙端測(cè)序,以此來判斷分子接頭檢測(cè)靈敏度。具體文庫構(gòu)建方法與實(shí)施例2同。文庫2100質(zhì)檢取2ul文庫進(jìn)行Agilent2100Bioanalyzer,結(jié)果見圖2和圖3。從圖2可以看出,本發(fā)明的鑰匙狀分子接頭與血漿游離DNA連接文庫目的片段落在260-450bp區(qū)間內(nèi),且主要集中在260-320bp,文庫片段大小正常且可用于后續(xù)上機(jī)。從圖3組織樣本文庫DNA片段主要集中在300-480bp,無接頭殘留,文庫片段大小正常且可用于后續(xù)上機(jī)。從圖4可以看出,本發(fā)明的鑰匙狀分子接頭與細(xì)胞DNA(0.1%)連接構(gòu)建文庫目的片段落在300-550bp,無接頭殘留,文庫片段大小正常且可用于后續(xù)上機(jī)。文庫經(jīng)兩輪特異性雜交捕獲后real-timePCR檢測(cè)如圖5所示,文庫經(jīng)兩輪特異性雜交捕獲后,1%、0.1%、0.05%三個(gè)陽性突變摻合組仍然可以特異性擴(kuò)增出EGFR內(nèi)控、L858R、T790M及19號(hào)外顯子缺失,說明分子接頭與樣本DNA成功連接,且經(jīng)文庫構(gòu)建、特異性捕獲之后樣本DNA突變信息未丟失。雙端測(cè)序利用Illumina公司NextSeq500進(jìn)行150bp雙端測(cè)序,測(cè)序數(shù)據(jù)獲得,樣品區(qū)分及鑰匙狀分子接頭的識(shí)別,針對(duì)上述獲得的測(cè)序數(shù)據(jù),運(yùn)行Illuminabcl2fastq2ConversionSoftwarev2.15軟件進(jìn)行樣本區(qū)分,進(jìn)一步,將高通量測(cè)序下機(jī)數(shù)據(jù)經(jīng)過質(zhì)控過濾,文庫數(shù)據(jù)Q20平均值為0.98,得到最終測(cè)序數(shù)據(jù)。校正假陽性如圖6.分子接頭校正原理示意圖顯示了本發(fā)明分子接頭的校正原理,校正標(biāo)簽給每一個(gè)DNA分子的每條鏈都做上獨(dú)特的標(biāo)記,數(shù)據(jù)分析時(shí),通過此校正標(biāo)簽可以找到多條包含有樣本同一個(gè)DNA分子單條鏈的原始數(shù)據(jù)信息,單條鏈的原始數(shù)據(jù)內(nèi)部比對(duì),可以初步反映單條鏈的可能突變情況。通過校正標(biāo)簽互補(bǔ)配對(duì)的原則,可以找到另外一條互補(bǔ)鏈的數(shù)據(jù)信息,通過互補(bǔ)鏈內(nèi)部的數(shù)據(jù)信息比對(duì),可以初步反映互補(bǔ)鏈的可能突變情況。樣本DNA兩條鏈做最終比對(duì),可區(qū)分出真實(shí)突變和操作過程引入的假陽性突變,以此剔除干擾數(shù)據(jù)保留真實(shí)突變,增加低頻突變檢測(cè)靈敏度,使得最終所得突變信息更真實(shí)反映樣本DNA所攜帶的腫瘤信息,尤其是ctDNA的檢測(cè)。圖7為本發(fā)明分子接頭校正假陽性突變的實(shí)例(細(xì)胞DNA文庫0.1%摻和組),樣本DNA因?qū)嶒?yàn)操作導(dǎo)致堿基A突變成T,經(jīng)校正標(biāo)簽校正其為假陽性,將其剔除后得到真實(shí)結(jié)果。樣本突變頻率情況表8.針對(duì)樣本已知的突變位點(diǎn)所在序列區(qū)域進(jìn)行統(tǒng)計(jì)樣本正常序列突變序列實(shí)際突變比例理論突變比例A(1%)7238710.98%1%B(0.1%)675470.1%0.1%C(0.05%)623740.068%0.05%D(0%)6809000實(shí)際突變比例是由實(shí)際檢測(cè)出的突變序列(已扣除假陽性)與正常序列數(shù)的比值,理論突變比例是混樣時(shí)的預(yù)設(shè)置比例,從統(tǒng)計(jì)結(jié)果看出實(shí)際突變比例與理論突變比例一致。<110>江蘇為真生物醫(yī)藥技術(shù)股份有限公司<120>一種分子接頭及其應(yīng)用<160>3<210>1<211>88<212>DNA<213>人工序列<220><223>分子接頭序列<220><221>misc_feature<222>(14)...(21)<223>n=a或g或c或t<400>1ttctacagtacnnnnnnnnagatcggaagagcacacgtctgaactccagtcacyacactc60tttccctacacgacgctcttccgatcst88<210>2<211>58<212>DNA<213>人工序列<220><223>引物序列<220><221>misc_feature<222>(14)...(21)<400>1aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatc*t58<210>3<211>65<212>DNA<213>人工序列<220><223>引物序列<220><221>misc_feature<222>(14)...(21)<223>x=a或g或c或tcaagcagaagacggcatacgagatxxxxxxxxgtgactggagttcagacgtgtgctcttc60cgat*c65當(dāng)前第1頁1 2 3