本公開內(nèi)容一般涉及表觀遺傳學(xué),并且更具體地涉及經(jīng)由評(píng)價(jià)DNA甲基化狀態(tài)來(lái)評(píng)價(jià)基因組功能的表觀遺傳調(diào)節(jié)的系統(tǒng)、試劑盒和方法。
發(fā)明背景
表觀遺傳學(xué)是表觀基因組的研究,其包括發(fā)生而不改變基礎(chǔ)核苷酸序列的DNA和染色質(zhì)的功能相關(guān)的化學(xué)修飾。表觀基因組的兩個(gè)主要組分是DNA甲基化和組蛋白修飾。
表觀遺傳修飾調(diào)節(jié)DNA中的基因表達(dá),并且可以通過(guò)調(diào)節(jié)涉及治療試劑的代謝和區(qū)室化的基因表達(dá)來(lái)影響在個(gè)體中的醫(yī)學(xué)治療的功效,以及可以改變治療試劑的靶的表達(dá)。異常表觀遺傳變化與許多疾病例如癌癥、心血管疾病和神經(jīng)系統(tǒng)疾病相關(guān)。
DNA甲基化是首個(gè)發(fā)現(xiàn)的表觀遺傳標(biāo)記且是研究最多的。在哺乳動(dòng)物中,它主要涉及甲基(-CH3)對(duì)CpG二核苷酸的胞嘧啶殘基的碳-5位置的酶促添加,并且阻遏與之結(jié)合的轉(zhuǎn)錄因子。像這樣,DNA的高度甲基化區(qū)域趨于是更少轉(zhuǎn)錄活性的。
DNA甲基化影響動(dòng)物中的劑量補(bǔ)償、印記、基因組穩(wěn)定性和發(fā)育(例如干細(xì)胞分化和胚胎發(fā)育)。另外,它已與轉(zhuǎn)座子元件沉默和宿主病原體相互作用聯(lián)系。DNA甲基化對(duì)于植物中的基因組完整性同樣是重要的。
用于評(píng)價(jià)DNA甲基化狀態(tài)(即甲基化組)的目前方法集中于單獨(dú)基因座,使用方法例如甲基化特異性聚合酶鏈反應(yīng)(PCR)或基質(zhì)輔助激光解吸/電離時(shí)間飛行質(zhì)譜(MALDI-TOF-MS),或在全基因組規(guī)模上使用微陣列、簡(jiǎn)化的表觀亞硫酸氫鹽測(cè)序(RRBS)或全基因組鳥槍亞硫酸氫鹽測(cè)序(WGBS)。WGBS是特別有吸引力的,因?yàn)樗詥螇A基對(duì)分辨率測(cè)量DNA甲基化狀態(tài),并且允許評(píng)價(jià)在基因組中的每個(gè)可甲基化位置處的甲基化百分比。然而,當(dāng)通常僅每個(gè)基因組的小部分是感興趣的時(shí),對(duì)于多個(gè)個(gè)體的整個(gè)基因組生成此類數(shù)據(jù)仍是昂貴的。
評(píng)價(jià)甲基化的基于DNA測(cè)序的方法采用化學(xué)處理(例如亞硫酸氫鹽(BS))來(lái)區(qū)分甲基化的胞嘧啶殘基與未甲基化的胞嘧啶殘基。簡(jiǎn)言之,BS將DNA中的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基,其在后續(xù)擴(kuò)增或測(cè)序反應(yīng)期間替換為胸腺嘧啶殘基。然而,5-甲基胞嘧啶(5-mC)和5-羥甲基胞嘧啶(5-hmC)殘基對(duì)轉(zhuǎn)換抗性,并且因此作為胞嘧啶殘基保存。像這樣,BS轉(zhuǎn)換在DNA中引入特異性變化,取決于各個(gè)胞嘧啶殘基的甲基化狀態(tài),所述特異性變化獲得關(guān)于DNA序列的甲基化狀態(tài)的單核苷酸分辨率信息。
不幸的是,BS轉(zhuǎn)換需要大DNA樣品(例如>10 μg),因?yàn)榭量虠l件可降解約90%的樣品。另外,它使基因組的尺寸在擴(kuò)增后有效倍增,因?yàn)榫幋a(或有義)和非編碼(或反義)鏈的擴(kuò)增產(chǎn)物不再是互補(bǔ)的。此外,當(dāng)僅一些可甲基化胞嘧啶殘基實(shí)際上是甲基化的時(shí),可發(fā)生部分轉(zhuǎn)換,因此使傳統(tǒng)探針和測(cè)定法設(shè)計(jì)復(fù)雜且混淆后續(xù)分析。通過(guò)BS轉(zhuǎn)換引入的復(fù)雜性已阻礙靶向DNA富集方法的發(fā)展,所述靶向DNA富集方法將促進(jìn)DNA甲基化的研究。
出于前述原因,存在用于經(jīng)由DNA甲基化狀態(tài)評(píng)價(jià)基因組功能的表觀遺傳調(diào)節(jié)的另外系統(tǒng)、試劑盒和方法的需要。
發(fā)明概述
本發(fā)明包括經(jīng)由靶向富集測(cè)序評(píng)價(jià)DNA甲基化狀態(tài)的“轉(zhuǎn)換隨后捕獲(convert-then-capture)”方法。有利地,轉(zhuǎn)換隨后捕獲方法允許使用少量DNA,而不妥協(xié)高分子復(fù)雜性,同時(shí)達(dá)到高重現(xiàn)性、減少每個(gè)樣品所需的成本和時(shí)間,并且導(dǎo)致改善的測(cè)序覆蓋深度。轉(zhuǎn)換隨后捕獲方法還允許通過(guò)全基因組測(cè)序(WGS)的評(píng)價(jià)。
該方法可通過(guò)從靶生物獲得DNA樣品來(lái)開始。一旦獲得DNA樣品,該方法可以包括由樣品制備DNA文庫(kù)。隨后,該方法可包括用轉(zhuǎn)換試劑例如亞硫酸氫鹽(HSO3?),將制備的DNA文庫(kù)中的未甲基化的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基。然而,5-mC殘基不被轉(zhuǎn)換為尿嘧啶殘基??蛇x地或另外,該方法可包括用轉(zhuǎn)換試劑例如高釕酸鉀(KRuO4),將制備的DNA文庫(kù)中的5-hmC殘基轉(zhuǎn)換為5-甲?;奏ぃ?-fC)殘基。5-fC殘基是中間產(chǎn)物,其隨后可由亞硫酸氫鹽轉(zhuǎn)換為尿嘧啶殘基。再次,5-mC殘基不被轉(zhuǎn)換為尿嘧啶殘基。
在轉(zhuǎn)換胞嘧啶和5-hmC殘基且擴(kuò)增(例如通過(guò)PCR)后,該方法包括用如本文描述的基于溶液的捕獲探針庫(kù)從轉(zhuǎn)換的DNA文庫(kù)中捕獲目的片段。在捕獲后,該方法可包括擴(kuò)增且純化捕獲的核酸片段,隨后為測(cè)序。此外,該方法可包括分析序列以獲得關(guān)于DNA甲基化狀態(tài)的信息,并且可以進(jìn)一步包括比較所捕獲的核酸片段的序列和甲基化狀態(tài)與參考基因組的序列和甲基化狀態(tài)。
在一個(gè)實(shí)施方案中,本發(fā)明是用于捕獲目的核酸序列的溶液相捕獲探針庫(kù),該探針庫(kù)包括三類捕獲探針:第一類是可以與僅含有尿嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;第二類是可以與僅含有胞嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;并且第三類是可以與含有尿嘧啶殘基代替一些可甲基化的胞嘧啶殘基和胞嘧啶殘基代替其他可甲基化的胞嘧啶殘基的目的序列雜交的探針。在該實(shí)施方案的變化中,捕獲探針是長(zhǎng)度約50 bp至約150 bp,例如長(zhǎng)度約75 bp。探針可以具有約50% G+C。進(jìn)一步地,在探針庫(kù)內(nèi),三類捕獲探針各自為探針庫(kù)的約33%。
在另一個(gè)實(shí)施方案中,本發(fā)明是評(píng)價(jià)目的核酸序列的DNA甲基化狀態(tài)的方法,該方法包括下述步驟:用捕獲探針庫(kù)溶液中捕獲目的核酸序列的轉(zhuǎn)換且擴(kuò)增的核酸片段,所述捕獲探針庫(kù)包括三類捕獲探針,其中:第一類是可以與僅含有尿嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;第二類是可以與僅含有胞嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;并且第三類是可以與含有尿嘧啶殘基代替一些可甲基化的胞嘧啶殘基和胞嘧啶殘基代替其他可甲基化的胞嘧啶殘基的目的序列雜交的探針;擴(kuò)增所捕獲的核酸片段,以獲得所擴(kuò)增的捕獲的核酸片段群體;測(cè)序所擴(kuò)增的捕獲的核酸片段,以獲得所捕獲的核酸片段的核苷酸序列;且分析所捕獲的核酸片段的核苷酸序列,以獲得關(guān)于DNA甲基化狀態(tài)的信息。在該實(shí)施方案的變化中,該方法進(jìn)一步包括獲得基因組DNA樣品且由基因組DNA樣品制備DNA文庫(kù)的起始步驟。在該實(shí)施方案中,所轉(zhuǎn)換的核酸片段通過(guò)用轉(zhuǎn)換試劑例如載脂蛋白B編輯復(fù)雜催化亞基1、亞硫酸氫鹽、胞嘧啶脫氨酶、亞硝酸和高釕酸鉀,將DNA文庫(kù)中的未甲基化的胞嘧啶殘基和/或5-羥甲基胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基來(lái)獲得。在其他變化中,該方法進(jìn)一步包括下述步驟:將所捕獲的核酸片段的核苷酸序列和甲基化狀態(tài)與參考基因組的核苷酸序列和甲基化狀態(tài)比較。
在還另外的實(shí)施方案中,本發(fā)明是用于評(píng)價(jià)DNA甲基化狀態(tài)的系統(tǒng),該系統(tǒng)包括:具有三類捕獲探針的溶液相捕獲探針庫(kù)試劑盒,第一類是可以與僅含有尿嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;第二類是可以與僅含有胞嘧啶殘基代替可甲基化的胞嘧啶殘基的目的序列雜交的探針;并且第三類是可以與含有尿嘧啶殘基代替一些可甲基化的胞嘧啶殘基和胞嘧啶殘基代替其他可甲基化的胞嘧啶殘基的目的序列雜交的探針;以及選自下述的至少一種另外的試劑盒:DNA取樣試劑盒、DNA文庫(kù)制備試劑盒、DNA轉(zhuǎn)換試劑盒、DNA擴(kuò)增試劑盒、DNA測(cè)序試劑盒以及生物信息學(xué)設(shè)計(jì)和分析軟件。DNA轉(zhuǎn)換試劑盒可以包含選自下述的轉(zhuǎn)換試劑:載脂蛋白B編輯復(fù)雜催化亞基1、亞硫酸氫鹽、胞嘧啶脫氫酶、亞硝酸和高釕酸鉀。
附圖簡(jiǎn)述
圖1顯示了比較“轉(zhuǎn)換隨后捕獲”工作流與替代“捕獲隨后轉(zhuǎn)換”工作流的示意圖,指出三個(gè)分子瓶頸步驟(三角形)的系列定位,所述三個(gè)分子瓶頸步驟導(dǎo)致在關(guān)于后者的序列數(shù)據(jù)中增加的復(fù)制率和大量輸入樣品DNA的需要。
圖2是顯示通過(guò)亞硫酸氫鹽(BS)轉(zhuǎn)換生成的增加的靶序列復(fù)雜性的圖解,當(dāng)使用轉(zhuǎn)換隨后捕獲概念(TCGCAGCGCGA,SEQ.ID. NO: 3)時(shí),所述靶序列復(fù)雜性對(duì)于探針設(shè)計(jì)和制造是成問(wèn)題的。
圖3是顯示使用“搖擺”核苷酸來(lái)改善制造效率且允許捕獲比以其他方式可行的更大和更復(fù)雜的靶的優(yōu)點(diǎn)的圖解。
圖4顯示了該方法對(duì)三種人細(xì)胞系的表現(xiàn)。
圖5顯示了比較不同量的輸入DNA的實(shí)驗(yàn)。
圖6顯示了得自來(lái)自相同來(lái)源的分開樣品的數(shù)據(jù),以評(píng)價(jià)重現(xiàn)性。
圖7顯示了體外甲基化樣品的分析。
發(fā)明詳述
概述
提供了用于評(píng)價(jià)(即捕獲、測(cè)序和分析)關(guān)于DNA甲基化狀態(tài)的信息的示例性系統(tǒng)、試劑盒和方法,并且是基于轉(zhuǎn)換隨后捕獲概念。該概念與目前方法形成對(duì)比,所述目前方法在很大程度上基于首先捕獲目的核酸序列,并且隨后將目的核酸序列中的未甲基化胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基。雖然已知方法僅需要在捕獲期間的簡(jiǎn)單探針組,但不幸的是,它們需要大量DNA樣品,并且僅提供關(guān)于就DNA單鏈而言的DNA甲基化狀態(tài)的信息。當(dāng)例如未甲基化的胞嘧啶殘基并未完全轉(zhuǎn)換成尿嘧啶殘基時(shí),或當(dāng)胞嘧啶至胸腺嘧啶(C至T)多態(tài)性存在于核酸序列中時(shí),這是特別成問(wèn)題的。在這種情況下,會(huì)喪失在另一條鏈中含有的任何此類信息的利益,并且獲得關(guān)于DNA甲基化狀態(tài)的不正確信息??傊阎椒▽?dǎo)致高樣品輸入(例如>10 μg),并且導(dǎo)致在目的靶向區(qū)域上不完全的數(shù)據(jù)覆蓋、低分子復(fù)雜性(即高重復(fù)讀數(shù)率)、增加的測(cè)序成本和結(jié)果的弱重現(xiàn)性。
本文描述的工作因此是顯示上文指出的缺點(diǎn)可以通過(guò)轉(zhuǎn)換隨后捕獲概念得到解決的首例。本發(fā)明概念經(jīng)由具有至少三類捕獲探針的混合物的溶液相捕獲探針庫(kù)解決了該缺點(diǎn)。靶向甲基化的DNA的一種探針(或多種探針)、靶向未甲基化的DNA的一種探針(或多種探針)、和由于C或T的隨機(jī)摻入識(shí)別兩者的一種“搖擺”探針(或多種探針)。此外,每類探針可以包括探針的混合物,所述探針與目的核酸序列的一條或另一條鏈在溶液中結(jié)合/雜交,從而改善測(cè)序深度和可靠性??紤]到獨(dú)特的溶液相捕獲探針庫(kù),本發(fā)明的方法需要低樣品輸入(例如約1 μg或更少),提供可用于評(píng)價(jià)DNA甲基化狀態(tài)的高分子復(fù)雜性(即低重復(fù)讀數(shù)率),高樣品流通量和高重現(xiàn)性。
系統(tǒng)、試劑盒和方法可用于各種應(yīng)用例如診斷和研究中。就診斷應(yīng)用而言,本領(lǐng)域技術(shù)人員可以通過(guò)經(jīng)由異常DNA甲基化評(píng)價(jià)是否存在表觀遺傳變化,來(lái)測(cè)定用于受試者的適當(dāng)醫(yī)學(xué)治療,所述異常DNA甲基化調(diào)節(jié)涉及治療劑的代謝和區(qū)室化的基因表達(dá),或甚至調(diào)節(jié)治療試劑的靶表達(dá)。以相似方式,本領(lǐng)域技術(shù)人員可以監(jiān)控療法對(duì)DNA甲基化模式的作用,以確定治療功效,預(yù)測(cè)副作用或檢測(cè)藥物抗性的出現(xiàn)。同樣地,本領(lǐng)域技術(shù)人員可以經(jīng)由異常DNA甲基化,來(lái)評(píng)價(jià)受試者是否具有與表觀遺傳變化連鎖的疾病或病癥,例如癌癥、心血管疾病和神經(jīng)系統(tǒng)疾病??蛇x地,本領(lǐng)域技術(shù)人員可以鑒定與人或其他生物中的正常表型性狀相關(guān)或者預(yù)測(cè)人或其他生物(包括例如農(nóng)業(yè)上重要的動(dòng)物和植物)中的正常表型性狀的甲基化模式。此外,本領(lǐng)域技術(shù)人員可以檢測(cè)由環(huán)境因素(例如通過(guò)改變基因表達(dá)模式引起有害效應(yīng)的毒素)在生物中引起的甲基化模式中的變化。
就研究應(yīng)用而言,本領(lǐng)域技術(shù)人員可以確定DNA高甲基化或低甲基化對(duì)基因表達(dá)、染色質(zhì)結(jié)構(gòu)和穩(wěn)定性以及表觀遺傳性狀的作用。
就附圖而言,本發(fā)明包括轉(zhuǎn)換隨后捕獲概念。圖1提供了轉(zhuǎn)換隨后捕獲工作流與目前實(shí)踐的捕獲隨后轉(zhuǎn)換工作流的比較。通過(guò)實(shí)心三角形指示的工作流步驟是其中發(fā)生選擇過(guò)程的步驟,其減少樣品復(fù)雜性和因此減少信息含量(“分子瓶頸”)。例如,在MethylSeq Library Prep中,由于銜接子連接僅10%-50%有效,所以樣品DNA喪失。同樣地,在BS轉(zhuǎn)換步驟中,約90%的DNA被嚴(yán)苛的化學(xué)過(guò)程破壞。此外,在捕獲步驟中,并非所有靶向文庫(kù)片段均被探針捕獲。捕獲隨后轉(zhuǎn)換工作流具有串聯(lián)的三個(gè)分子選擇步驟,其是附加的且嚴(yán)重限制通過(guò)工作流進(jìn)行的DNA和信息量。捕獲隨后轉(zhuǎn)換工作流包括相同的三個(gè)步驟,但并非全部串聯(lián),使得在前兩個(gè)選擇步驟(MethylSeq Library Prep、BS轉(zhuǎn)換)后的PCR擴(kuò)增步驟增加存在的文庫(kù)片段的絕對(duì)拷貝數(shù),使得第三個(gè)選擇步驟(捕獲)對(duì)樣品復(fù)雜性具有更少的負(fù)面影響,所述樣品復(fù)雜性已通過(guò)來(lái)自極小分子群體的取樣引起。出于這些原因,轉(zhuǎn)換隨后捕獲方法在工作流開始時(shí)需要少得多的樣品DNA輸入,并且可以允許更多信息一直流動(dòng)到結(jié)束。
圖2顯示了在捕獲前的BS轉(zhuǎn)換如何增加靶復(fù)雜性。顯示了假定的十一bp捕獲靶,具有在CpG背景下的三個(gè)可甲基化的胞嘧啶。小圖A顯示了對(duì)于該11 bp序列的八種可能的甲基化模式(狀態(tài))。小圖B顯示了在BS轉(zhuǎn)換和擴(kuò)增后,原始DNA的子代鏈如何不再互補(bǔ),并且因此潛在靶序列的數(shù)目再次倍增至十六。捕獲隨后轉(zhuǎn)換概念靶向天然DNA,其中DNA的甲基化狀態(tài)與捕獲無(wú)關(guān),并且因此僅需要一種(1)探針來(lái)靶向該基因座。相比之下,轉(zhuǎn)換隨后捕獲工作流將需要十六種(16)探針。
圖3顯示了在寡核苷酸探針制造中的“搖擺”堿基(小圖B)降低寡核苷酸數(shù)目,所述寡核苷酸必須獨(dú)立制造,以匹配靶序列的所有可能的部分甲基化模式。在現(xiàn)有方法(小圖A)中,匹配部分甲基化模式所需的所有寡核苷酸(探針)分開進(jìn)行制造。在“搖擺”方法中,C或T的隨機(jī)摻入生成必要復(fù)雜性,同時(shí)使用少得多的個(gè)別寡核苷酸合成反應(yīng)。
系統(tǒng)
本發(fā)明的系統(tǒng)可以包括溶液相(或溶液中)捕獲探針庫(kù)試劑盒以及下述的至少一種:DNA收集或取樣試劑盒;DNA文庫(kù)制備/擴(kuò)增試劑盒;DNA轉(zhuǎn)換試劑盒(例如用于化學(xué)和/或酶促處理,以給DNA的表觀遺傳修飾“加上標(biāo)簽”用于后續(xù)測(cè)量);擴(kuò)增/測(cè)序試劑盒;以及生物信息學(xué)設(shè)計(jì)和分析軟件。
如本文使用的,“試劑盒”意指如本文描述的任何制造(例如包裝或容器),其包括至少一種試劑,例如核酸探針或探針庫(kù)等等,用于特異性擴(kuò)增、捕獲、加上標(biāo)簽/轉(zhuǎn)換或檢測(cè)DNA。
如本文使用的,“探針”意指能夠與特別預(yù)期的靶生物分子選擇性結(jié)合的任何分子,所述靶生物分子例如待由探針結(jié)合、捕獲或雜交的目的核酸序列。
DNA取樣試劑盒可以包括組分例如注射器,手術(shù)刀,棉簽,收集、制備和/或穩(wěn)定化緩沖液或穩(wěn)定材料,和樣品容器。用于收集或取樣DNA的試劑盒由例如Bode Technology(Lorton,VA)、DNA Genotek Inc.(Ontario,加拿大)、Isohelix,Inc.(Kent,United Kingdom)和Norgen Biotek Corp.(Ontario,加拿大)商購(gòu)可得。
DNA文庫(kù)制備和擴(kuò)增試劑盒可以包括組分例如測(cè)序銜接子,酶例如裂解酶、末端修復(fù)酶混合物或聚合酶、核酸酶,PCR引物,緩沖液,脫氧核糖核苷酸,核糖核苷酸,純化和/或分離柱、珠或基質(zhì),以及用于文庫(kù)制備/擴(kuò)增的內(nèi)部對(duì)照和質(zhì)量控制測(cè)定。用于制備DNA文庫(kù)的試劑盒由例如EMD Millipore Corp.(Billerica,Mass.)、Illumina(San Diego,Cal.)、Life Technologies(Grand Island,NY)、Lucigen(Middleton,Wisc.)、New England BioLabs Inc.(Ipswich,Mass.)、Qiagen(Germantown,Md.)、和Roche Molecular Systems(Pleasanton,Cal.)商購(gòu)可得。
DNA轉(zhuǎn)換試劑盒含有用于獲得轉(zhuǎn)換的DNA樣品的試劑。如本文使用的,“轉(zhuǎn)換的DNA”意指其中一個(gè)或多個(gè)未甲基化的胞嘧啶殘基已脫氨以變成尿嘧啶殘基的DNA分子?!稗D(zhuǎn)換的DNA”意指其中一個(gè)或多個(gè)5-hmC殘基已氧化以變成5-fmC殘基的DNA分子。例如,5-hmC已顯示在BS轉(zhuǎn)換期間表現(xiàn)如同它的前體5-mC。因此,可能需要再訪問(wèn)BS測(cè)序數(shù)據(jù),以驗(yàn)證檢測(cè)到的經(jīng)修飾的堿基是5-mC還是5-hmC殘基。這些試劑盒可包括但不限于組分例如轉(zhuǎn)換試劑、裂解緩沖液、旋轉(zhuǎn)柱或其他反應(yīng)容器、蛋白酶K、其他試劑例如DNA保護(hù)緩沖液等等。用于轉(zhuǎn)換胞嘧啶殘基的試劑盒由例如Life Technologies,New England BioLabs Inc.,Qiagen和Zymo Research(Irvine,Cal.)商購(gòu)可得。
DNA轉(zhuǎn)換試劑盒還可以包括用于將5-hmC轉(zhuǎn)換為對(duì)用BS的轉(zhuǎn)換敏感的中間形式的組分,以區(qū)分5-mC和5-hmC殘基。這些試劑盒可以包括但不限于組分例如對(duì)照序列(例如5-mC和5-hmC對(duì)照),蛋白酶K,核苷酸,酶例如Mspl和HpaII、T4 β-葡糖基轉(zhuǎn)移酶、DNA聚合酶,UDP-葡萄糖,引物,緩沖液,反應(yīng)容器等等。用于轉(zhuǎn)換5-hmC殘基的試劑盒由例如Cambridge Epigenetix(Cambridge,United Kingdom)、Enzo Life Sciences(Farmingdale,NY)、New England BioLabs Inc.和Thermo Scientific(Waltham,Mass.)商購(gòu)可得。
DNA測(cè)序試劑盒可以包括組分例如酶(聚合酶、核酸酶),引物,稀釋、反應(yīng)和洗滌緩沖液,磁珠和核苷酸。用于測(cè)序核酸分子的試劑盒由Affymetrix(Santa Clara,Cal.)Fisher Scientific、Life Technologies、Pacific Biosciences和Qiagen商購(gòu)可得。
系統(tǒng)可以包括生物信息學(xué)設(shè)計(jì)和分析軟件。參見例如美國(guó)專利申請(qǐng)公開號(hào)2006/0014164和2010/0161607。設(shè)計(jì)軟件可以用于計(jì)算機(jī)芯片設(shè)計(jì)探針,其以所需特異性與靶向、轉(zhuǎn)換基因組中的目的區(qū)域結(jié)合/雜交,并且可以包括用于避免重復(fù)區(qū)且利用“搖擺”堿基以解決擴(kuò)增后的轉(zhuǎn)換靶序列的序列復(fù)雜性的方法。分析軟件可以用于例如修剪來(lái)自實(shí)驗(yàn)的序列讀數(shù)輸出的文庫(kù)銜接子序列,比對(duì)/作圖序列讀數(shù)與其在參考基因組中的位置,測(cè)量在各個(gè)可甲基化位點(diǎn)處的甲基化速率,分析與系統(tǒng)中包括的對(duì)照相關(guān)的數(shù)據(jù),并且鑒定相對(duì)于參考序列在樣品DNA中的序列變體。用于分析來(lái)自BS轉(zhuǎn)換的DNA的序列數(shù)據(jù)的軟件由例如Novocraft(Selangor,Malaysia)和CLC bio(Cambridge,Mass)商購(gòu)可得。
如本文使用的,“可甲基化的胞嘧啶殘基”意指在CG二核苷酸的背景下或CHG和CHH(其中H是腺嘌呤(A)、胞嘧啶(C)或胸腺嘧啶(T)殘基)的非CG背景下的那些殘基。
考慮到前文,考慮示例性系統(tǒng)包括DNA取樣試劑盒、DNA文庫(kù)制備/擴(kuò)增試劑盒、DNA轉(zhuǎn)換試劑盒、擴(kuò)增/測(cè)序試劑盒、溶液相捕獲探針庫(kù)試劑盒、以及生物信息學(xué)設(shè)計(jì)和分析軟件的完全補(bǔ)足。
陽(yáng)性對(duì)照和陰性對(duì)照可以包括在試劑盒中,以驗(yàn)證依照本發(fā)明概念采用的試劑的活性和正確使用。對(duì)照可以包括已知對(duì)于DNA甲基化的存在陽(yáng)性或陰性的樣品,例如來(lái)自組織或細(xì)胞系的DNA或RNA制劑等等。對(duì)照的設(shè)計(jì)和使用是標(biāo)準(zhǔn)的并且完全在本領(lǐng)域技術(shù)人員的常規(guī)能力內(nèi)。
試劑盒
如上文指出的,涵蓋本發(fā)明的試劑盒(分開或作為上文描述的系統(tǒng)的部分)可以包括用于轉(zhuǎn)換的DNA的靶向、溶液相捕獲的探針庫(kù),其具有至少三個(gè)(3)探針類型,其各自針對(duì)目的核酸序列,并且靶向序列中的CG、CHG和/或CHH位點(diǎn)(其中H是A、C或T殘基)。
探針可以通過(guò)本領(lǐng)域技術(shù)人員合成,或衍生自適當(dāng)?shù)纳镏苿?。同樣地,探針可以特別設(shè)計(jì)為標(biāo)記的??梢杂米魈结樀姆肿拥睦影ǖ幌抻诙嗪塑账崂鏡NA或DNA,以及蛋白質(zhì)、抗體和有機(jī)分子。
合成用于用作探針的多核苷酸的方法是本領(lǐng)域眾所周知的,例如適當(dāng)序列的克隆和消化,以及直接化學(xué)合成(例如噴墨沉積和電化學(xué)合成)??寺《嗪塑账岬姆椒ɡ缭贑opeland等人(2001)Nat. Rev. Genet. 2:769-779;Current Protocols in Molecular Biology(Ausubel等人編輯,John Wiley & Sons 1995);Molecular Cloning:A Laboratory Manual,第3版(Sambrook & Russell編輯,Cold Spring Harbor Press 2001);和PCR Cloning Protocols,第2版(Chen & Janes編輯,Humana Press 2002)中描述。指導(dǎo)多核苷酸的直接化學(xué)合成的方法包括但不限于Reese(1978)Tetrahedron 34:3143-3179和Narang等人(1979)Methods Enzymol. 68:90-98的磷酸三酯法;Brown等人(1979)Methods Enzymol. 68:109-151的磷酸二酯法;Beaucage等人(1981)Tetrahedron Lett. 22:1859-1862的氨基磷酸二乙酯法;以及Fodor等人(1991)Science 251:767-773;Pease等人(1994)Proc. Natl. Acad. Sci. USA 91:5022-5026;和Singh-Gasson等人(1999)Nature Biotechnol. 17:974-978;以及美國(guó)專利號(hào)4,485,066的固體支持物法。還參見Peattie(1979)Proc. Natl. Acad. Sci. USA 76:1760-1764;以及EP專利號(hào)1721908;國(guó)際專利申請(qǐng)公開號(hào)WO 2004/022770和WO 2005/082923;美國(guó)專利申請(qǐng)公開號(hào)2009/0062521和2011/0092685;以及美國(guó)專利號(hào)6,521,427;6,818,395;7,521,178和7,910,726。
考慮到探針庫(kù)特別是關(guān)于第三種探針類型的復(fù)雜性和多樣性,合成用于探針庫(kù)的探針的優(yōu)選方法是通過(guò)光刻技術(shù)。
兩種光刻技術(shù)是本領(lǐng)域已知的。在一種技術(shù)中,光刻掩模用于將光導(dǎo)向合成表面的特定區(qū)域,以實(shí)現(xiàn)光不穩(wěn)定的保護(hù)基團(tuán)(PLPG)的局限性脫保護(hù)。PLPG的使用提供了用于生物聚合物(例如多核苷酸)微陣列的基于光刻合成的基礎(chǔ),是本領(lǐng)域眾所周知的。用于基于光刻的生物聚合物合成的常用PLPG包括但不限于α-甲基-6-硝基胡椒基-氧羰基(MeNPOC;Pease等人(1994)Proc. Natl. Acad. Sci. USA 91:5022-5026)、2-(2-硝基苯基)-丙氧羰基(NPPOC;Hasan等人(1997)Tetrahedron 53:4247-4264)、硝基藜蘆基氧羰基(NVOC;Fodor等人(1991)Science 251:767-773)和2-硝基芐氧羰基(NBOC;Patchornik等人(1970)21:6333-6335)。還參見美國(guó)專利號(hào)7,598,019;7,759,513和8,445,734。
“掩蔽”法因此包括利用支架(mount)(例如“掩模”)合成聚合物,所述支架銜接基質(zhì)且提供了在基質(zhì)和支架之間的反應(yīng)器間距。參見例如美國(guó)專利號(hào)5,143,854和5,445,934。
其他技術(shù)是MAS,其中光通過(guò)數(shù)字投影技術(shù)例如數(shù)字微鏡裝置(DMD)導(dǎo)向合成表面的特異性區(qū)域,實(shí)現(xiàn)PLPG的局限性脫保護(hù)。還參見Singh-Gasson等人(1999),同上。采用小型鋁鏡的固態(tài)陣列的典型DMD可以形成約786,000至約4.2百萬(wàn)各個(gè)光像素的圖案。DMD因此產(chǎn)生替代傳統(tǒng)微陣列中使用的物理掩模的“虛擬掩?!薄?/p>
這些虛擬掩模用通過(guò)計(jì)算機(jī)控制的各個(gè)可尋址鋁鏡反映紫外(UV)線的所需模式。DMD控制例如在反應(yīng)室中的顯微鏡載玻片上投射的UV光模式,其與DNA合成儀聯(lián)接。UV光選擇性切割在精確位置處的UV不穩(wěn)定的保護(hù)基團(tuán),在所述精確位置中將偶聯(lián)下一個(gè)核苷酸。模式以平行的組合方式用DNA合成化學(xué)進(jìn)行協(xié)調(diào),使得可以在單一微陣列中合成最高達(dá)約4.2百萬(wàn)獨(dú)特的探針特征。參見美國(guó)專利號(hào)5,096,279;5,535,047;5,583,688;5,600,383;6,375,903;6,493,867 7,037,659;7,183,406. 7,785,863;7,846,660;8,008,005;8,026,094;8,030,056和8,415,101;以及美國(guó)專利申請(qǐng)公開號(hào)2001/0010843;2004/0110212和2007/0140906。還參見Hornbeck,“Digital Light Processing and MEMs:Reflecting the Digital Display Needs of the Networked Society,” SPIE/EOS European Symposium on Lasers,Optics and Vision for Productivity and Manufacturing I(Besancon,F(xiàn)rance Jun. 10-14 1996)。
MAS因此消除了關(guān)于曝光掩模的耗時(shí)和昂貴生產(chǎn)的需要。應(yīng)理解本文公開的系統(tǒng)、試劑盒和方法可以包括和/或利用上文描述的各種探針合成技術(shù)中的任一種;然而,考慮到第三種探針庫(kù)的復(fù)雜性,在微陣列上的MAS是優(yōu)選技術(shù)。
一旦合成,核酸探針就從微陣列表面處切割/取出且摻入試劑盒內(nèi)。從微陣列表面處取出核酸探針的方法是本領(lǐng)域眾所周知的,并且可以包括化學(xué)切割、酶促切割、來(lái)自DNA寡核苷酸模板的RNA轉(zhuǎn)錄和原位PCR。參見例如Saboulard等人(2005)Biotechniques 39:363-368。
如本文使用的,“微陣列”意指在固體或半固體支持物的表面上的二維特征排列。單一微陣列或在一些情況下,多重微陣列(例如3、4、5個(gè)或更多個(gè)微陣列)可以定位在一個(gè)固體支持物上。微陣列的大小取決于在一個(gè)固體支持物上的微陣列數(shù)目。微陣列數(shù)目/固體支持物越高,陣列必須越小以適合在固體支持物上。微陣列可以以任何形狀進(jìn)行設(shè)計(jì),但優(yōu)選是正方形或矩形。
如本文使用的,“特征”意指在微陣列表面上的限定區(qū)域,具有生物分子例如肽、核酸、碳水化合物等等與之附著。當(dāng)與其他特征相比較時(shí),一個(gè)特征可以含有具有不同特性例如不同序列或取向的生物分子。特征的大小由兩個(gè)因素決定:(1)陣列上的特征數(shù)目,陣列上的特征數(shù)目越大,每個(gè)單一特征越??;和(2)用于照射一個(gè)特征的各個(gè)可尋址鋁鏡元件的數(shù)目。用于照射一個(gè)特征的鏡元件數(shù)目越高,每個(gè)單一特征越大。微陣列上的特征數(shù)目受限于DMD中存在的鏡元件(像素)數(shù)目。來(lái)自Texas Instruments,Inc.的DMD目前含有4.2百萬(wàn)鏡元件(像素)。在一個(gè)單一微陣列內(nèi)的特征數(shù)目因此目前受限于該數(shù)目。
如本文使用的,“固體支持物”或“半固體支持物”意指任何固體材料,其具有有機(jī)分子可以通過(guò)鍵形成附著或者通過(guò)電子或靜電相互作用例如共價(jià)鍵或通過(guò)特異性官能團(tuán)的復(fù)合物形成吸附的表面積。載體可以是材料的組合,例如在玻璃上的塑料、在玻璃上的碳等等,并且可以用作用于構(gòu)建三個(gè)探針類型的微陣列的表面。功能表面可以是簡(jiǎn)單的有機(jī)分子,但還可以包含共聚物、樹枝狀聚合物、分子刷等等。
如本文使用的,“塑料”意指合成材料,例如具有官能化表面的有機(jī)構(gòu)件塊(單體)的同共聚物或異共聚物,使得有機(jī)分子可以通過(guò)共價(jià)鍵形成附著或者通過(guò)電子或靜電相互作用例如通過(guò)經(jīng)由官能團(tuán)的鍵形成吸附。優(yōu)選地,“塑料”意指聚烯烴,其為通過(guò)烯烴(例如乙烯丙烯二烯單體聚合物、聚異丁烯)聚合衍生的聚合物。更優(yōu)選地,塑料是具有限定光學(xué)特性的聚烯烴,如Topas?(Topas Advanced Polymers,Inc.;Florence,Ky.)或Zeonor/Ex?(Zeon Chemicals L.P.;Louisville,Ky.)。
如本文使用的,“官能團(tuán)”意指眾多原子組合中的任一種,其形成化學(xué)分子的部分,自身經(jīng)歷特征性反應(yīng),并且影響分子的剩余部分的反應(yīng)性。典型的官能團(tuán)包括但不限于羥基、羧基、醛基、羰基、氨基、疊氮基、炔基、巰基和腈。潛在反應(yīng)性官能團(tuán)包括例如胺、羧酸、醇、雙鍵等等。
像這樣,第一類探針是可以結(jié)合目的核酸序列的一條鏈或另一條鏈的探針,其中所有胞嘧啶殘基均為未甲基化的,并且因此在轉(zhuǎn)換期間轉(zhuǎn)換為尿嘧啶殘基。探針長(zhǎng)度的范圍可以從長(zhǎng)度約50 bp到約150 bp,并且具有任何核苷酸組成,具有約10%至約90% G+C的范圍。
第二類是可以結(jié)合目的核酸序列的一條鏈或另一條鏈的探針,其中所有胞嘧啶殘基均為甲基化的,并且因此不轉(zhuǎn)換為尿嘧啶殘基。探針長(zhǎng)度的范圍可以從長(zhǎng)度約50 bp到約150 bp,并且具有任何核苷酸組成,具有約10%至約90% G+C的范圍。
第三類是可以結(jié)合目的核酸序列的一條鏈或另一條鏈的探針,其中一些胞嘧啶殘基是未甲基化的,并且因此轉(zhuǎn)換為尿嘧啶殘基,并且其他是甲基化的,并且因此不轉(zhuǎn)換為尿嘧啶殘基(即“搖擺”探針)。如本文使用的,“搖擺探針”意指其中與CG、CHG和CHH的每個(gè)可甲基化位點(diǎn)互補(bǔ)的殘基可變地由用于每種探針?lè)肿拥陌奏せ蛐叵汆奏埢M成的那些探針。這些探針的制造可以通過(guò)下述來(lái)完成:當(dāng)合成探針的該位置時(shí),引入C和T核苷酸的混合物(例如亞磷酰胺(phosporamidites)),使得C或T隨機(jī)摻入。像這樣,搖擺探針幫助捕獲部分甲基化的DNA片段,而無(wú)需分開合成與所有可能部分甲基化的靶互補(bǔ)的所有可能探針。探針長(zhǎng)度的范圍可以從長(zhǎng)度約50 bp到約150 bp,并且具有任何核苷酸組成,具有約10%至約90% G+C的范圍。
通常,通過(guò)三個(gè)探針類型靶向的目的核酸序列可以具有任何大小,例如范圍為約100個(gè)堿基對(duì)(bp)至約250百萬(wàn)個(gè)堿基對(duì)(Mbp)。
捕獲探針試劑盒的其他組分包括雜交緩沖液、阻斷試劑(例如cot1 DNA、來(lái)自人或其他生物的完整基因組DNA、捕獲對(duì)照DNA片段或克隆、銜接子阻斷寡核苷酸)、PCR引物、酶和緩沖液、DNA純化柱或珠、和鏈霉親和素包被的順磁珠??紤]其他類型的探針還可以包括在試劑盒中。其他探針的例子包括但不限于對(duì)照探針。陽(yáng)性對(duì)照和/或陰性對(duì)照可以包括在試劑盒中,以驗(yàn)證依照本發(fā)明概念采用的試劑的活性和正確使用。對(duì)照可以包括已知對(duì)于DNA甲基化的一種或多種形式的存在陽(yáng)性或陰性的樣品,例如來(lái)自組織或細(xì)胞系的DNA或RNA制劑等等,真核生物或原核生物。對(duì)照的設(shè)計(jì)和使用是標(biāo)準(zhǔn)的并且完全在本領(lǐng)域技術(shù)人員的常規(guī)能力內(nèi)。
方法
考慮到前述系統(tǒng)和試劑盒,涵蓋本發(fā)明概念的體外方法包括評(píng)價(jià)DNA甲基化狀態(tài)(即捕獲、測(cè)序和分析DNA)。該方法一般通過(guò)從受試者例如動(dòng)物或植物中收集或獲得DNA樣品開始。然而,在一些情況下,DNA樣品可以得自諸如培養(yǎng)細(xì)胞或者甚至原核細(xì)胞或病毒的來(lái)源。在其他情況下,DNA樣品可以是合成核酸分子。
如本文使用的,“樣品”意指可以從其中提取或分離基因組DNA的細(xì)胞、組織、器官或體液的任何收集。樣品同樣可以意指從其中可以獲得DNA的實(shí)驗(yàn)室制劑。此類樣品的例子包括細(xì)胞、組織或器官、體液和涂片的標(biāo)本。樣品可以通過(guò)各種技術(shù)包括刮擦或擦拭區(qū)域、使用針抽吸細(xì)胞或體液、或取出組織樣品來(lái)收集或獲得。當(dāng)樣品是體液時(shí),它可以包括從其中可以分離基因組DNA的血液、淋巴、尿、唾液、抽吸物或任何其他身體分泌物或其衍生物。用于收集各種機(jī)體樣品或活組織檢查樣本的方法是本領(lǐng)域眾所周知的,并且無(wú)需詳細(xì)描述。
取決于樣品類型,基因組DNA可能需要從細(xì)胞組分中提取或分離。分離多核苷酸例如DNA的方法是本領(lǐng)域眾所周知的。參見例如Molecular Cloning:A Laboratory Manual,第3版(Sambrook等人編輯,Cold Spring Harbor Press 2001);和Current Protocols in Molecular Biology(Ausubel等人編輯,John Wiley & Sons 1995)。
在獲得分離的DNA樣品后,該方法可以包括用甲基化的(或未甲基化的)銜接子和尿嘧啶耐受性聚合酶,由DNA樣品制備DNA文庫(kù)。制備DNA文庫(kù)用于測(cè)序甲基化模式的方法是本領(lǐng)域眾所周知的。參見例如Carless(2009)Methods Mol. Biol. 523:217-234;Feng等人(2011)Methods Mol. Biol. 733:223-238;和Zhang等人(2009)Methods Mol Biol. 507:177-187。通常,制備DNA文庫(kù)的方法可以分成下述階段:(1)使DNA樣品破碎;(2)需要時(shí)使破碎的DNA樣品末端鈍化;(3)將甲基化的或未甲基化的寡核苷酸銜接子與目的核酸序列連接;(4)純化銜接子連接的目的核酸序列;和(5)用例如尿嘧啶耐受性聚合酶擴(kuò)增純化的、銜接子連接的目的核酸序列。優(yōu)選使用甲基化的銜接子,因?yàn)樗鼈儾皇芎罄m(xù)轉(zhuǎn)換影響。
如本文使用的,“尿嘧啶耐受性聚合酶”意指在擴(kuò)增(例如PCR)期間可以耐受具有dUTP的核酸模板的酶(即,具有減少的擴(kuò)增偏差或具有改善的預(yù)讀功能)。尿嘧啶耐受性聚合酶由例如Cambridge Epigenetix(Cambridge,UK),Enzymatics Inc.(Beverly,Mass.)和Kapa Biosystems(Woburn,Mass.)商購(gòu)可得。
通過(guò)三個(gè)探針類型靶向的目的核酸序列可以來(lái)自人基因組或任何其他生物,對(duì)于其部分或完全基因組DNA、或者部分或完全轉(zhuǎn)錄物序列是可獲得的,或可以由相關(guān)生物推斷。同樣地,通過(guò)三個(gè)探針類型靶向的目的核酸序列可以包括一種或多種基因的編碼區(qū)或調(diào)節(jié)區(qū),并且在人或其他脊椎動(dòng)物中,一般將包括尤其是在涉及關(guān)鍵途徑的基因中或附近的多個(gè)CpG位點(diǎn)。
在本發(fā)明的方法中,約0.5 μg至約1.0 μg DNA可以用作起始材料。用于監(jiān)控例如BS轉(zhuǎn)換或捕獲過(guò)程自身的功效的對(duì)照核酸可以在此時(shí)加入。如果并非已經(jīng)破碎,則樣品中的DNA可以使用機(jī)械剪切方法(例如超聲處理),破碎至約180 bp至約220 bp的平均大小。片段末端可以使用聚合酶及其他酶(例如DNA聚合酶和Klenow片段)的混合物進(jìn)行修復(fù),以產(chǎn)生平端的5'磷酸化的片段。dAMP可以加入dsDNA文庫(kù)片段的3'末端(即“A-加尾”),以促進(jìn)甲基化文庫(kù)銜接子的后續(xù)連接。具有3’-dTMP突出端的甲基化的dsDNA文庫(kù)銜接子隨后可以與A-加尾的文庫(kù)片段連接。
在制備DNA文庫(kù)后,該方法可以包括經(jīng)由用轉(zhuǎn)換試劑轉(zhuǎn)換,將銜接子連接的目的核酸序列中的未甲基化的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基。將未甲基化的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基的方法是本領(lǐng)域眾所周知的。參見例如Frommer等人(1992)Proc. Natl. Acad. Sci. USA 89:1827-1831;Hayatsu等人(1970)J. Am. Chem. Soc. 92:724-726;Hayatsu等人(1970)Biochem. 9:2858-2865;Shapiro等人(1970)J. Am. Chem.Soc. 92:422-424;和Shiraishi & Hayatsu(2004)DNA Res. 11:409-415.See also,Boyd & Zon(2004)Anal. Biochem. 326:278-280;Callinan & Feinberg(2006)Hum. Mol. Genet. 15:R95-R101;El-Maarri(2003)Adv. Exp. Med. Biol. 544:197-204;Fraga & Esteller(2002)BioTechniques 33:632,634,636-649;Grunau等人(2001)Nucleic Acids Res. 29:E65;Ivanov等人(2013)Nucleic Acids Res. 41:e72;Laird(2003)Nat. Rev. Cancer 3:253-266;Hayatsu等人(2004)Acids Symp. Ser.(Oxf)261-262;Mill等人(2006)Biotechniques41:603-607;和Shiraishi & Hayatsu(2004)DNA Res. 11:409-415。
如本文使用的,“轉(zhuǎn)換試劑”意指使胞嘧啶脫氨為尿嘧啶殘基的試劑。轉(zhuǎn)換試劑因此將未甲基化的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基,但不轉(zhuǎn)換5-mC殘基。轉(zhuǎn)換試劑的例子包括但不限于載脂蛋白B編輯復(fù)雜催化亞基1(APOBEC1)、亞硫酸氫鹽、胞嘧啶脫氫酶和亞硝酸。
在一些情況下,例如用于區(qū)分5-mC與5-hmC殘基,可以使用另外的轉(zhuǎn)換試劑。通常,轉(zhuǎn)換5-hmC殘基的方法可以分成下述階段:(1)變性,(2)轉(zhuǎn)換,和(3)清潔/純化所轉(zhuǎn)換的核酸序列。轉(zhuǎn)換試劑盒是商購(gòu)可得的,可用于將5-hmC轉(zhuǎn)換為5-fmC,并且包括但不限于TrueMethyl? Kit(Cambridge Epigenetix)、BioArray? 5-hmC Methylation Kit(Enzo Life Sciences)、EpiMark? 5-hmC和5-mC Analysis Kit(New England BioLabs)、EpiJET 5-hmC Analysis Kit(Thermo Scientific)。
在將未甲基化的胞嘧啶殘基(和/或5-hmC殘基)轉(zhuǎn)換為尿嘧啶殘基后,轉(zhuǎn)換的DNA文庫(kù)可以通過(guò)連接介導(dǎo)的PCR(LM-PCR)使用尿嘧啶耐受性聚合酶進(jìn)行擴(kuò)增。
在擴(kuò)增后,該方法可以包括用如本文描述的溶液相捕獲探針庫(kù)試劑盒,從擴(kuò)增且轉(zhuǎn)換的DNA文庫(kù)中溶液中捕獲一種或多種目的核酸序列/片段。通常,捕獲轉(zhuǎn)換的核酸序列的方法可以分成下述階段:(1)變性,(2)捕獲,和(3)純化/分離。溶液中捕獲的方法是本領(lǐng)域眾所周知的,并且在例如美國(guó)專利申請(qǐng)公開號(hào)2009/0105081和2009/0246788中描述。
轉(zhuǎn)換且捕獲的核酸序列/片段隨后可以進(jìn)行擴(kuò)增。擴(kuò)增核酸序列的方法是本領(lǐng)域眾所周知的。參見例如Saiki等人(1988)Science 239: 487-491;Current Protocols in Molecular Biology(Ausubel等人編輯,John Wiley & Sons 1995);Molecular Cloning:A Laboratory Manual,第3版(Sambrook & Russell編輯,Cold Spring Harbor Press 2001);和PCR Cloning Protocols,第2版(Chen & Janes eds.,Humana Press 2002)。
擴(kuò)增、捕獲的核酸序列/片段隨后可以通過(guò)本領(lǐng)域技術(shù)人員已知的任何方法進(jìn)行測(cè)序,以研究目的區(qū)域中的DNA甲基化模式。在測(cè)序后,捕獲的片段可以進(jìn)行分析,以獲得關(guān)于DNA甲基化狀態(tài)的信息,并且可以進(jìn)一步包括比較捕獲的核酸片段的序列和甲基化狀態(tài)與參考基因組的序列和甲基化狀態(tài)。如上所述,生物信息學(xué)分析軟件是本領(lǐng)域眾所周知的。
實(shí)施例
實(shí)施例1
轉(zhuǎn)換隨后捕獲概念的基準(zhǔn)技術(shù)表現(xiàn)
約0.5 μg至約1.0 μg DNA可以用作起始材料。用于監(jiān)控例如BS轉(zhuǎn)換或捕獲過(guò)程自身的功效的對(duì)照核酸可以在此時(shí)加入。DNA樣品可以使用機(jī)械剪切方法(例如超聲處理),破碎至約180 bp至約220 bp的平均大小。片段末端可以使用聚合酶及其他酶(例如DNA聚合酶和Klenow片段)的混合物進(jìn)行修復(fù),以產(chǎn)生平端的5'磷酸化的片段。dAMP可以加入dsDNA文庫(kù)片段的3'末端(即“A-加尾”),以促進(jìn)甲基化文庫(kù)銜接子的后續(xù)連接。具有3’-dTMP突出端的甲基化的dsDNA文庫(kù)銜接子隨后可以在反應(yīng)中與A-加尾的文庫(kù)片段連接,所述反應(yīng)含有連接緩沖液、A-加尾的DNA、DNA連接酶(通常為1個(gè)單位)、和具有3’-dTMP突出端的甲基化的dsDNA文庫(kù)銜接子(通常為1-5 μM終濃度)。連接反應(yīng)可以在約20℃下溫育約20分鐘。銜接的文庫(kù)片段可以使用DNA純化柱或珠由緩沖液、鹽和未連接的銜接子進(jìn)行純化。
在制備DNA文庫(kù)后,該方法可以包括經(jīng)由用轉(zhuǎn)換試劑(例如載脂蛋白B編輯復(fù)雜催化亞基1(APOBEC1)、BS、胞嘧啶脫氫酶和亞硝酸)轉(zhuǎn)換,將銜接子連接的目的核酸序列中的未甲基化的胞嘧啶殘基轉(zhuǎn)換為尿嘧啶殘基。在一些情況下,例如用于區(qū)分5-mC與5-hmC殘基,可以使用另外的轉(zhuǎn)換試劑。
在將未甲基化的胞嘧啶殘基(和/或5-hmC殘基)轉(zhuǎn)換為尿嘧啶殘基后,轉(zhuǎn)換的DNA文庫(kù)可以通過(guò)連接介導(dǎo)的PCR(LM-PCR)使用尿嘧啶耐受性聚合酶在反應(yīng)中進(jìn)行擴(kuò)增,所述反應(yīng)包括:約20 ul轉(zhuǎn)換的DNA文庫(kù)、約25 ul 2x尿嘧啶耐受性聚合酶主混合物(含有聚合酶、dNTP和緩沖液)、約3 ul兩種LM-PCR引物的混合物(5 uM原料濃度;引物序列:
5’-AATGATACGGCGACCACCGAGA-3’ – SEQ ID NO:1和
5’-CAAGCAGAAGACGGCATACGAG-3’ – SEQ ID NO:2)
和約2 ul水。
示例性熱循環(huán)條件可以如下:
?步驟1:在約95℃下約2分鐘;
?步驟2:在約98℃下約30秒;
?步驟3:在約60℃下約30秒;
?步驟4:在約72℃下約4分鐘;
?步驟5:回到步驟2且重復(fù)十一(11)次;
?步驟6:在約72℃下約10分鐘;和
?步驟7:在4℃下保持。
在擴(kuò)增后,該方法可以包括用如本文描述的溶液相捕獲探針庫(kù)試劑盒,從擴(kuò)增且轉(zhuǎn)換的DNA文庫(kù)中溶液中捕獲一種或多種目的核酸序列/片段。轉(zhuǎn)換且捕獲的核酸序列/片段隨后可以通過(guò)在兩個(gè)相同反應(yīng)中(以保持體積很低)的PCR進(jìn)行擴(kuò)增,其中每個(gè)反應(yīng)可以包括:約20 ul捕獲的DNA文庫(kù)、約25 ul 2x尿嘧啶耐受性聚合酶主混合物(含有聚合酶、dNTP和緩沖液)、和約5 ul兩種LM-PCR引物的混合物(5 uM原料濃度:
5’-AATGATACGGCGACCACCGAGA-3’ – SEQ ID NO:1和
5’-CAAGCAGAAGACGGCATACGAG-3’ – SEQ ID NO:2)。
示例性熱循環(huán)條件可以如下:
?步驟1:在約98℃下約45秒;
?步驟2:在約98℃下約15秒;
?步驟3:在約60℃下約30秒;
?步驟4:在約72℃下約30秒;
?步驟5:回到步驟2且重復(fù)十五(15)次;
?步驟6:在約72℃下約1分鐘;和
?步驟7:在4℃下保持。
擴(kuò)增、捕獲的核酸序列/片段隨后可以通過(guò)本領(lǐng)域技術(shù)人員已知的任何方法進(jìn)行測(cè)序,以研究目的區(qū)域中的DNA甲基化模式。在測(cè)序后,捕獲的片段可以進(jìn)行分析,以獲得關(guān)于DNA甲基化狀態(tài)的信息。
實(shí)施例2
將本發(fā)明的方法應(yīng)用于一系列人細(xì)胞系
將如實(shí)施例1中所述的方法應(yīng)用于從幾個(gè)人細(xì)胞系中分離的DNA。構(gòu)建針對(duì)人基因組hg19中的目的區(qū)域的3.2 Mbp捕獲設(shè)計(jì)。目的區(qū)域包括來(lái)自細(xì)胞系IMR90(正常人肺成纖維細(xì)胞),跨越一系列經(jīng)由roadmap MethylC Seq預(yù)測(cè)的甲基化占據(jù)的500種基因啟動(dòng)子。圖4顯示了捕獲測(cè)定的表現(xiàn)。測(cè)定捕獲431個(gè)預(yù)測(cè)的二價(jià)結(jié)構(gòu)域,且鑒定在基因CDKN2A、H19-IGF2、XIST以及Y染色體上的區(qū)域中的4個(gè)大的連續(xù)印跡區(qū)域。
實(shí)施例3
比較三個(gè)人細(xì)胞系中的甲基化模式
圖5顯示了關(guān)于三個(gè)人細(xì)胞系IMR90(成纖維細(xì)胞)、NA04671(伯基特氏淋巴瘤)和NA12762(正常B淋巴細(xì)胞)中的甲基化序列的鑒定的數(shù)據(jù)。DNA樣品及其混合物基本上如實(shí)施例1中所述進(jìn)行分析。數(shù)據(jù)顯示幾乎理想的表現(xiàn)(822倍富集相對(duì)于972倍可能的最大值);基因組DNA的低的最低限度可接受的輸入(750 ug);低重復(fù)讀數(shù)率(<10%);在>10x 讀數(shù)深度時(shí)靶序列的>83%覆蓋,僅具有2.6 M讀數(shù)。結(jié)果指出與關(guān)于IMR90公開的數(shù)據(jù)(Lister等人(2009)Nature 462:315-322)相比較的2.5x覆蓋。該方法進(jìn)一步揭示與正常細(xì)胞相比較,在癌癥中的高甲基化和低甲基化區(qū)域(數(shù)據(jù)未示出)。圖6顯示了得自來(lái)自相同來(lái)源(NA04671)的分開樣品的數(shù)據(jù)的高重現(xiàn)性。
實(shí)施例4
將該方法應(yīng)用于體外甲基化的DNA
該實(shí)施例利用具有基因DNMT1和DNMT3A的雙重敲除的甲基化缺陷人結(jié)腸直腸癌細(xì)胞系HCT116。從細(xì)胞系中分離的DNA與CG甲基轉(zhuǎn)移酶一起溫育0、15和60分鐘,以獲得各種程度的甲基化。所得到的DNA樣品及其混合物(0 + 60分鐘溫育的50/50混合物)基本上如實(shí)施例1中所述進(jìn)行分析。圖7上的結(jié)果顯示如預(yù)期的,在與CG甲基轉(zhuǎn)移酶的增加溫育后,檢測(cè)到增加的甲基化程度。
雖然本發(fā)明已就具體實(shí)例而言進(jìn)行詳細(xì)描述,但對(duì)于本領(lǐng)域技術(shù)人員顯而易見的是可以在本發(fā)明的范圍內(nèi)作出各種修飾。因此,本發(fā)明的范圍不應(yīng)受本文描述的實(shí)例限制,而是受下文呈現(xiàn)的權(quán)利要求限制。