本申請要求于2014年6月13日提交的美國臨時申請?zhí)?2/012,188的優(yōu)先權(quán),其全部內(nèi)容通過引用并入本文。
技術(shù)領(lǐng)域
本文中提供的實(shí)施方案涉及用于下一代測序的方法和組合物。一些實(shí)施方案包括從與表面接觸的靶核酸制備模板文庫,以及對該表面上的文庫進(jìn)行測序。
發(fā)明背景
幾種下一代測序技術(shù)可用于快速和經(jīng)濟(jì)地測定基因組的整個序列。通常,在測序之前從靶基因組DNA樣品制備模板核酸文庫。樣品制備通常包括DNA片段化步驟,其將較大的DNA鏈斷裂成更適合下一代測序技術(shù)的較小的DNA片段。通常,將銜接子(adaptor)附著于DNA片段的末端,這可以通過DNA末端修復(fù),然后是銜接子連接實(shí)現(xiàn),或最近通過使用轉(zhuǎn)座體(transposome)系統(tǒng)實(shí)現(xiàn)。轉(zhuǎn)座體(其是轉(zhuǎn)座酶和轉(zhuǎn)座子序列的復(fù)合物)的使用允許同時進(jìn)行基因組片段化和片段的銜接子連接,從而簡化文庫制備。文庫制備方法通常是勞動密集型的,并且需要在不同階段的幾個手動操作步驟。因此,需要更有效的流線化文庫制備方法。
發(fā)明概述
本發(fā)明的一個實(shí)施方案是制備用于測序的靶核酸群體的方法,包括:(a)提供具有包含捕捉部分的表面的基底;(b)使所述表面與包含多個模板核酸和轉(zhuǎn)座體的反應(yīng)體積接觸,其中每個轉(zhuǎn)座體包含轉(zhuǎn)座子序列和轉(zhuǎn)座酶,其中所述模板核酸通過使靶核酸與多個轉(zhuǎn)座體接觸來制備;和(c)將模板核酸與捕捉部分締合。一些實(shí)施方案進(jìn)一步包括,(d)測序締合的模板核酸。一些實(shí)施方案進(jìn)一步包括在(c)之后和(d)之前擴(kuò)增締合的模板核酸。在一些實(shí)施方案中,表面的捕捉部分是固定在表面上的捕捉探針。在一些實(shí)施方案中,表面的捕捉部分是第一親和部分,并且模板核酸包含對第一親和部分具有親和力的第二親和部分。在一些實(shí)施方案中,所述擴(kuò)增包括橋式擴(kuò)增。在一些實(shí)施方案中,(a)還包括提供包含靶核酸和轉(zhuǎn)座體的樣品。在一些實(shí)施方案中,樣品包含聚合酶或連接酶。
在一些實(shí)施方案中,通過在表面的存在下使靶核酸與多個轉(zhuǎn)座體接觸來制備模板核酸。在一些實(shí)施方案中,通過在表面與包含多個模板核酸和轉(zhuǎn)座酶的反應(yīng)體積接觸之前使靶核酸與多個轉(zhuǎn)座體接觸來制備模板核酸。在一些實(shí)施方案中,在使表面與反應(yīng)體積接觸之后,將聚合酶或連接酶添加到反應(yīng)體積中。在一些實(shí)施方案中,在使表面與反應(yīng)體積接觸之前,將聚合酶或連接酶添加到反應(yīng)體積中。在一些實(shí)施方案中,(c)包括用聚合酶或連接酶延伸模板核酸。在一些實(shí)施方案中,捕捉探針包括核酸。在一些實(shí)施方案中,(c)包括使模板核酸與捕捉探針雜交。在一些實(shí)施方案中,(c)包括制備單鏈模板核酸。在一些實(shí)施方案中,(c)包括使捕捉探針和模板核酸與重組酶接觸。
在一些實(shí)施方案中,模板核酸,捕捉探針和/或表面各自包含親和部分。在一些實(shí)施方案中,親和部分選自生物素,抗生物素蛋白和鏈霉抗生物素蛋白。在一些實(shí)施方案中,(c)包括將模板核酸的親和部分與捕捉探針的親和部分結(jié)合。在一些實(shí)施方案中,(c)包括將模板核酸的親和部分與表面的親和部分結(jié)合。在一些實(shí)施方案中,轉(zhuǎn)座子序列包含選自條形碼,測序引物和片段化位點(diǎn)的序列。一些實(shí)施方案進(jìn)一步包括切割片段化位點(diǎn)。在一些實(shí)施方案中,在(c)之后切割位點(diǎn)。在一些實(shí)施方案中,至少一個轉(zhuǎn)座子包含兩個轉(zhuǎn)座子序列。在一些實(shí)施方案中,轉(zhuǎn)座子序列是不同的。在一些實(shí)施方案中,在(b)之后除去轉(zhuǎn)座酶。在一些實(shí)施方案中,在(c)之后除去轉(zhuǎn)座酶。在一些實(shí)施方案中,通過使轉(zhuǎn)座酶與蛋白酶接觸來除去轉(zhuǎn)座酶。在一些實(shí)施方案中,通過使轉(zhuǎn)座酶與十二烷基硫酸鈉(SDS)接觸來除去轉(zhuǎn)座酶。在一些實(shí)施方案中,轉(zhuǎn)座酶選自Tn5,Tn5的變體,超活性(hyperactive)的Tn5,Tn10和Mu。
在一些實(shí)施方案中,至少一個轉(zhuǎn)座體不同于至少一個其它轉(zhuǎn)座體。在一些實(shí)施方案中,使用模板核酸在表面上的接近性(proximity)確定從模板核酸獲得的序列在靶核酸序列的線性表示(linear representation)中的接近性。在一些實(shí)施方案中,表面上彼此更接近(in closer proximity to one another)的模板核酸確定為包含與較不接近(less close proximity)的模板核酸相比在靶核酸序列的表示中更接近的序列。在一些實(shí)施方案中,靶核酸序列的表達(dá)包括單倍型信息。
在一些實(shí)施方案中,靶核酸選自DNA和RNA。在一些實(shí)施方案中,靶核酸選自基因組DNA和cDNA。在一些實(shí)施方案中,靶核酸是基因組DNA。
在一些實(shí)施方案中,基底選自至少一個珠,載玻片,流動池,通道,浸漬片和孔。在一些實(shí)施方案中,表面包含每mm2至少約10,000個締合的模板核酸。在一些實(shí)施方案中,表面包含每mm2至少約100,000個締合的模板核酸。在一些實(shí)施方案中,表面包含每mm2至少約1,000,000個締合的模板核酸。
本發(fā)明的一個實(shí)施方案是用于對靶核酸進(jìn)行測序的反應(yīng)容器,其包括:基底,其包含具有與其附著的多個捕捉探針的表面;以及與所述表面流體連通的反應(yīng)體積,其包含:多個轉(zhuǎn)座子,每個轉(zhuǎn)座子包含轉(zhuǎn)座子序列和轉(zhuǎn)座酶,通過使靶核酸與多個轉(zhuǎn)座體接觸而制備的多個模板核酸,聚合酶,dNTP和/或連接酶。在一些實(shí)施方案中,捕捉探針附著于表面上的形成重復(fù)模式的位點(diǎn)處。在一些實(shí)施方案中,捕捉探針被限制在表面上的位點(diǎn),并且在位點(diǎn)之間的間隙區(qū)域處不存在。在一些實(shí)施方案中,反應(yīng)體積同時包括用于反應(yīng)步驟的反應(yīng)物,所述反應(yīng)步驟包括:將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中;用所述聚合酶和/或連接酶延伸所述模板核酸;以及將所述模板核酸與所述捕捉探針締合。在一些實(shí)施方案中,反應(yīng)步驟包括:將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中;用聚合酶將模板核酸延伸至少幾個堿基,然后連接。
在一些實(shí)施方案中,反應(yīng)體積被配置用于包括在蛋白酶存在下去除轉(zhuǎn)座酶的反應(yīng)步驟。在一些實(shí)施方案中,反應(yīng)體積被配置用于在重組酶存在下將模板核酸與捕捉探針締合。在一些實(shí)施方案中,反應(yīng)體積被配置用于擴(kuò)增與捕捉探針締合的模板核酸。在一些實(shí)施方案中,擴(kuò)增是橋式擴(kuò)增。在一些實(shí)施方案中,反應(yīng)體積包括試劑,其用于將轉(zhuǎn)座子序列序貫轉(zhuǎn)座到靶核酸中;然后用聚合酶或連接酶延伸模板核酸;然后將模板核酸與捕捉探針締合。在一些實(shí)施方案中,反應(yīng)體積包括用于將轉(zhuǎn)座子序列序貫轉(zhuǎn)座到靶核酸中;然后用聚合酶延伸模板核酸至少幾個堿基的試劑和連接酶。在一些實(shí)施方案中,反應(yīng)體積包含在蛋白酶存在下除去轉(zhuǎn)座酶的試劑。在一些實(shí)施方案中,反應(yīng)體積包含用于除去轉(zhuǎn)座酶的SDS。在一些實(shí)施方案中,反應(yīng)體積包含用于在重組酶存在下將模板核酸與捕捉探針締合的試劑。
在一些實(shí)施方案中,反應(yīng)體積包含用于擴(kuò)增與捕捉部分締合的模板核酸的試劑。在一些實(shí)施方案中,表面的捕捉部分是固定在表面上的捕捉探針。在一些實(shí)施方案中,表面的捕捉部分是第一親和部分,并且模板核酸包含對第一親和部分具有親和力的第二親和部分。在一些實(shí)施方案中,模板核酸與捕捉探針締合。在一些實(shí)施方案中,捕捉探針包括核酸。在一些實(shí)施方案中,模板核酸與捕捉探針雜交。在一些實(shí)施方案中,模板核酸中的至少一種和捕捉探針中的至少一種各自包含親和部分。在一些實(shí)施方案中,親和部分選自生物素,抗生物素蛋白和鏈霉抗生物素蛋白。在一些實(shí)施方案中,捕捉探針包含重組酶。在一些實(shí)施方案中,將模板核酸中的至少一種的親和部分附著到捕捉探針中的至少一種的親和部分。在一些實(shí)施方案中,將模板核酸中的至少一種的親和部分附著到表面的親和部分。在一些實(shí)施方案中,轉(zhuǎn)座酶選自Tn5,Tn5的變體,超活性的Tn5,Tn10和Mu。在一些實(shí)施方案中,轉(zhuǎn)座子序列包含選自條形碼,測序引物和/或片段化位點(diǎn)的序列。在一些實(shí)施方案中,轉(zhuǎn)座體包含兩個轉(zhuǎn)座子。在一些實(shí)施方案中,轉(zhuǎn)座子序列彼此不同。
在一些實(shí)施方案中,靶核酸選自DNA和RNA。在一些實(shí)施方案中,靶核酸選自基因組DNA和cDNA。在一些實(shí)施方案中,靶核酸是基因組DNA。
在一些實(shí)施方案中,基底選自至少一種珠,載玻片,流動池,通道,浸漬片和孔。在一些實(shí)施方案中,使模板核酸與捕捉探針締合。在一些實(shí)施方案中,表面包含每mm2至少約10,000個模板核酸。在一些實(shí)施方案中,表面包含每mm2至少約100,000個模板核酸。在一些實(shí)施方案中,表面包含每mm2至少約1,000,000個模板核酸。
在一些實(shí)施方案中,從靶核酸序列的線性表示中從兩個模板核酸獲得的序列接近性信息指示模板核酸在表面上的接近性。在一些實(shí)施方案中,與較不接近的模板核酸相比,表面上彼此更接近的模板核酸包含在靶核酸序列的表示中更接近的序列。在一些實(shí)施方案中,靶核酸序列的表達(dá)包含單倍型表示。
本發(fā)明的一個實(shí)施方案是包含本文公開的任何反應(yīng)容器的流動池。
本發(fā)明的一個實(shí)施方案是用于對靶核酸測序的系統(tǒng),其包含:本文中公開的任何反應(yīng)容器;用于調(diào)節(jié)反應(yīng)容器的溫度的熱循環(huán)儀;和用于收集來自反應(yīng)容器的信號的檢測器。一些實(shí)施方案包括處理器,其包含調(diào)節(jié)反應(yīng)容器的溫度以實(shí)施步驟的的指令,所述步驟包括:將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中,用聚合酶或連接酶延伸模板核酸,并將模板核酸與捕捉探針締合。在一些實(shí)施方案中,在連接之前用聚合酶將模板核酸延伸至少一個堿基。在一些實(shí)施方案中,調(diào)節(jié)反應(yīng)容器的溫度以實(shí)施步驟的指令包括擴(kuò)增與捕捉探針締合的模板核酸。在一些實(shí)施方案中,擴(kuò)增是橋式擴(kuò)增。
附圖簡述
圖1顯示了用于無PCR(PCR-free)自動化文庫制備的簡化工作流的示例性實(shí)施方案,其中(A)將基因組DNA與標(biāo)簽化(tagmentation)溶液混合,所述標(biāo)簽化溶液包含可插入基因組DNA中并且使基因組DNA片段化的轉(zhuǎn)座體,DNA聚合酶和dNTP;(B)將標(biāo)簽化反應(yīng)體積裝載到筒(例如MySeq筒)上;(C)將筒裝載到調(diào)節(jié)筒溫度的系統(tǒng)中,執(zhí)行測序反應(yīng)并獲得測序信息??梢酝ㄟ^系統(tǒng)在筒內(nèi)裝載包含基因組DNA的標(biāo)簽化反應(yīng)。
圖2A,2B,2C顯示出了具有簇的缺口大小分布(gap size distribution)的圖,其中圖2A,圖2B,圖2C分別顯示出了來自泳道1、2和3的結(jié)果。X軸是插入物的大小(以bp計(jì)),并且y軸是插入物的百分比。
圖3A,圖3B,圖3C,圖3D分別顯示來自大腸桿菌(E.coli),人,紅桿菌屬(Rhodobacter)和蠟樣芽孢桿菌(Bacillus cereus)的基因組DNA的樣品的插入物的缺口大小分布的圖。
圖4顯示了用sybr綠染色的HiSeq Flow cell(Illumina Inc.,San Diego,CA)上的區(qū)塊(tiles)。
發(fā)明詳述
本文中提供的實(shí)施方案涉及用于下一代測序的方法和組合物。一些實(shí)施方案包括從與表面接觸的靶核酸制備模板文庫,以及對該表面上的文庫進(jìn)行測序。
通常,制備用于下一代測序的測序模板文庫的方法包括多個步驟和容器之間的反應(yīng)體積的轉(zhuǎn)移。在一些方法中,將轉(zhuǎn)座子序列插入靶核酸,如基因組DNA。在一些方法中,轉(zhuǎn)座子序列的插入可以將靶核酸片段化為多個修飾的核酸。插入的轉(zhuǎn)座子序列可以包括測序引物位點(diǎn),擴(kuò)增引物位點(diǎn)和/或可以與表面(如流動池)上的捕捉探針退火的位點(diǎn)。在一些方法中,用有尾引物擴(kuò)增經(jīng)修飾的核酸以添加測序引物位點(diǎn),擴(kuò)增引物位點(diǎn)和/或可與表面上的捕捉探針退火的位點(diǎn)。將經(jīng)修飾的核酸捕獲在表面上,通過橋式擴(kuò)增來擴(kuò)增以在表面上形成簇,并測序。通常,包括洗滌步驟和反應(yīng)容器之間轉(zhuǎn)移的多個步驟可以是低效的。
本文中提供的一些實(shí)施方案包括用于制備用于下一代測序的測序模板文庫的方法和組合物,其中在單個反應(yīng)體積中制備文庫(例如“單罐(single pot)”反應(yīng)或不包括在反應(yīng)完成之前物理去除試劑或產(chǎn)物的反應(yīng))。在一些實(shí)施方案中,制備與表面,如流動池接觸的文庫,并在表面上測序。在一些實(shí)施方案中,在單個反應(yīng)體積中制備文庫,并使反應(yīng)體積與表面接觸并在表面上測序(例如,裝載到其中發(fā)生文庫制備和測序反應(yīng)的流動池中)。有利地,一些此類實(shí)施方案提高了從靶核酸獲得的測序模板的產(chǎn)率(yield)以及用于制備和測序模板文庫的時間的效率。例如,在一些實(shí)施方案中,由于效率的提高,在模板文庫制備期間擴(kuò)增核酸的需要降低。
在一些實(shí)施方案中,模板核酸在表面上的物理接近性與那些模板的序列在它們來源的靶核酸的線性表示中的接近性有關(guān)。因此,在表面上從靶基因組核酸制備模板文庫可以有利地維持單倍型或定相信息。換言之,可以保留鄰接(contiguity)信息。不希望受任何一種理論的束縛,在一些實(shí)施方案中,轉(zhuǎn)座子序列插入靶核酸并使其片段化,催化插入的轉(zhuǎn)座酶保持在切割位點(diǎn)的每個末端,并且在除去轉(zhuǎn)座酶前,經(jīng)修飾的核酸在表面上固定化。在一些實(shí)施方案中,在彼此間具有給定距離的橋式擴(kuò)增的簇將具有來自原始基因組DNA的相同區(qū)段的顯著概率。
在一些實(shí)施方案中,在表面(如流動池)上捕獲靶核酸,使其原位片段化,并允許擴(kuò)散和作為種子,形成以初始捕獲位點(diǎn)為中心的簇云。在測序后,在組裝期間,可以使用距離度量(例如,流動池中的簇之間的標(biāo)準(zhǔn)化物理分離)來評估兩個讀取是否應(yīng)該組裝在一起,被考慮定相,或用于校正彼此中的錯誤(例如,來自相同初始分子的互補(bǔ)鏈)。
圖1描繪了在本文中提供的一些方法和組合物的情況中有用的工作流的實(shí)施方案。在該實(shí)施方案中,(A)將某一個量的基因組DNA轉(zhuǎn)移到標(biāo)簽化溶液中以產(chǎn)生標(biāo)簽化反應(yīng);(B)將標(biāo)簽化反應(yīng)加載到MiSeq筒(Illumina Inc.,San Diego CA)中;和(C)將柱裝載到MiSeq儀器(Illumina Inc.,San Diego CA)中。自動化腳本在流動池內(nèi)實(shí)施標(biāo)簽化反應(yīng)。在標(biāo)簽化期間產(chǎn)生的文庫分子通過標(biāo)簽化反應(yīng)中存在的DNA聚合酶延伸,并隨后與固定在流動池表面上的寡核苷酸雜交。通過橋式擴(kuò)增將每個捕獲的分子擴(kuò)增成簇。將簇的核酸線性化,將測序引物與線性分子雜交,并對分子進(jìn)行測序。操作者將基因組DNA與標(biāo)簽化溶液混合并將標(biāo)簽化反應(yīng)加載到測序儀,如MiSeq筒和MiSeq儀器上。此類示例工作流去除了上游樣品制備步驟,因?yàn)榇祟惒襟E在流動池內(nèi)進(jìn)行。
如本文中所用,“核酸”包括連接在一起的至少兩個核苷酸單體。實(shí)例包括但不限于DNA,如基因組或cDNA;RNA,如mRNA,sRNA或rRNA;或DNA和RNA的雜合體。從以下實(shí)例和本文其它地方顯而易見,核酸可以具有天然存在的核酸結(jié)構(gòu)或非天然存在的核酸類似物結(jié)構(gòu)。核酸可以含有磷酸二酯鍵;然而,在一些實(shí)施方案中,核酸可以具有其它類型的主鏈,包括例如磷酰胺,硫代磷酸酯,二硫代磷酸酯,O-甲基亞磷酰胺和肽核酸主鏈和連接。核酸可以具有正的骨架;非離子主鏈和非核糖基主鏈。核酸也可以包含一個或多個碳環(huán)糖。在本文中的方法或組合物中使用的核酸可以是單鏈或備選地如規(guī)定的雙鏈。在一些實(shí)施方案中,核酸可以含有雙鏈和單鏈序列的部分,例如,如通過叉式銜接子所證明的。核酸可以包含脫氧核糖核苷酸和核糖核苷酸的任何組合,以及堿基的任何組合,包括尿嘧啶,腺嘌呤,胸腺嘧啶,胞嘧啶,鳥嘌呤,肌苷,黃嘌呤,次黃嘌呤,異胞嘧啶,異鳥嘌呤和堿基類似物,如硝基吡咯(包括3-硝基吡咯)和硝基吲哚(包括5-硝基吲哚)等。在一些實(shí)施方案中,核酸可以包括至少一個混雜堿基。混雜堿基可以與多于一種不同類型的堿基進(jìn)行堿基配對,并且例如當(dāng)包括在寡核苷酸引物或插入物中時可以是有用的,所述寡核苷酸引物或插入物用于在復(fù)雜核酸樣品,如基因組DNA樣品中隨機(jī)雜交?;祀s堿基的實(shí)例包括可與腺嘌呤,胸腺嘧啶或胞嘧啶配對的肌苷。其它實(shí)例包括次黃嘌呤,5-硝基吲哚,無環(huán)5-硝基吲哚,4-硝基吡唑,4-硝基咪唑和3-硝基吡咯。可以使用可與至少兩種,三種,四種或更多類堿基進(jìn)行堿基配對的混雜堿基。
如本文中所用,“核苷酸序列”包括核酸聚合物中核苷酸單體的順序和類型。核苷酸序列是核酸分子的特征并且可以以多種形式中的任一種表示,包括例如描述,圖像,電子介質(zhì),符號系列,數(shù)字系列,字母系列,系列顏色等。信息可以例如以單核苷酸分辨率,以較高分辨率(例如指示核苷酸亞基的分子結(jié)構(gòu))或以較低分辨率(例如指示染色體區(qū)域,如單倍型區(qū)塊)表示。一系列“A”,“T”,“G”和“C”字母是公知的序列,其表示可以在單核苷酸分辨率下與DNA分子的實(shí)際序列相關(guān)聯(lián)的DNA。除了在系列中用“U”代替“T”外,類似的表示法用于RNA。
如本文中使用,“單倍型”包括在多于一種基因座處的一組等位基因,所述基因座由僅來自其親本之一的個體繼承。單倍型可以包括來自染色體的全部或部分的兩個或更多個基因座。等位基因包括例如單核苷酸多態(tài)性(SNP),短串聯(lián)重復(fù)(STR),基因序列,染色體插入,染色體缺失等。術(shù)語“定相等位基因”是指來自特定染色體或其部分的特定等位基因的分布。因此,兩個等位基因的“相位”可以指一個或多個染色體上的兩個或多個等位基因的相對位置的表征或表示。
如本文中使用,“流動池”包括具有表面的室,一種或多種流體試劑可以流過所述表面。通常,流動池將具有入口開口和出口開口以促進(jìn)流體的流動??梢匀菀椎赜糜诒竟_內(nèi)容的方法中的流動池和相關(guān)流體系統(tǒng)和檢測平臺的實(shí)例描述于例如Bentley et al.,Nature 456:53-59(2008),WO 04/018497;US 7,057,026;WO 91/06678;WO 071123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281,及美國專利申請公開號2008/0108082,其各自通過引用整體并入本文。
靶核酸
本文中提供的方法和組合物的一些實(shí)施方案包括靶核酸。在一些實(shí)施方案中,靶核酸包括基因組DNA或cDNA。在一些實(shí)施方案中,使用線粒體或葉綠體DNA。在一些實(shí)施方案中,靶核酸包括RNA或其衍生物,如mRNA或cDNA。本文中所述的一些實(shí)施方案可利用以一個拷貝(即單個分子)存在或者備選以多個拷貝(即具有相同序列的核酸分子的整體)存在的單個靶核酸種類。其它實(shí)施方案可以利用多種不同的靶核酸種類(例如,具有多種不同核苷酸序列的核酸分子)。因此,多個靶核酸可以包括彼此都相同的多個靶核酸,所述多種序列中一些靶核酸彼此相同且一些靶核酸彼此不同的多種不同的靶核酸,或所有靶核酸與所述多種序列中的所有其它靶核酸不同的多個靶核酸。靶核酸可以從獲自單個生物體的核酸分子或從包括多于一種生物體的來源獲得的核酸分子群制備。靶核酸可以來自單細(xì)胞;來自單個生物體的多個細(xì)胞,組織或體液;來自同一物種的幾種生物體的細(xì)胞,組織或體液;或來自多個物種(如宏基因組(metagenomic)樣品一樣),如來自環(huán)境樣品。核酸分子的來源包括但不限于細(xì)胞器,細(xì)胞,組織,器官或生物體。
在一些實(shí)施方案中,使靶核酸與轉(zhuǎn)座子接觸,使得轉(zhuǎn)座子催化轉(zhuǎn)座子序列插入靶核酸中以提供經(jīng)修飾的核酸。
轉(zhuǎn)座體
本文中提供的方法和組合物的一些實(shí)施方案包括轉(zhuǎn)座體。在一些實(shí)施方案中,轉(zhuǎn)座體包括與一個或多個轉(zhuǎn)座子序列結(jié)合的轉(zhuǎn)座酶。轉(zhuǎn)座酶包括能夠與包含轉(zhuǎn)座子元件或轉(zhuǎn)座酶元件的轉(zhuǎn)座子序列形成功能性復(fù)合物,并催化所述轉(zhuǎn)座子序列插入或轉(zhuǎn)座到靶核酸中以提供經(jīng)修飾的核酸的酶。例如,在體外轉(zhuǎn)座反應(yīng)中,將轉(zhuǎn)座子序列插入靶DNA中以提供經(jīng)修飾的DNA。通過轉(zhuǎn)座酶可以將轉(zhuǎn)座子序列插入到靶核酸中的隨機(jī)或基本上隨機(jī)的位點(diǎn)處。轉(zhuǎn)座酶還包括來自反轉(zhuǎn)錄轉(zhuǎn)座子的整合酶和逆轉(zhuǎn)錄病毒轉(zhuǎn)座酶。示例性轉(zhuǎn)座酶包括但不限于Mu,Tn10,Tn5和超活性(hyperactive)Tn5(Goryshin and Reznikoff,J.Biol.Chem.,273:7367(1998))。與本文中提供的一些方法和組合物一起使用的轉(zhuǎn)座酶的實(shí)施方案包括公開于美國專利申請公開號2010/0120098中公開的那些轉(zhuǎn)座酶,其通過引用整體并入本文。轉(zhuǎn)座酶和轉(zhuǎn)座子元件的更多實(shí)施方案包括超活性Tn5轉(zhuǎn)座酶和Tn5型轉(zhuǎn)座酶元件(Goryshin and Reznikoff,J.Biol.Chem.,273:7367(1998),其通過引用整體并入本文),MuA轉(zhuǎn)座酶和包含R1和R2末端序列的Mu轉(zhuǎn)座酶元件(Mizuuchi,Cell,35:785,(1983)and Savilahti,et al.,EMBO J.,14:4893,15(1995),通過引用整體并入本文)。與超活性Tn5轉(zhuǎn)座酶(例如,EZ-Tn5TM轉(zhuǎn)座酶,Epicentre Biotechnologies,Madison,Wisconsin)形成復(fù)合物的實(shí)例轉(zhuǎn)座酶元件闡述于WO 2012/061832;U.S.2012/0208724,U.S.2012/0208705和WO 2014018423,其各自通過引用整體并入本文。用于本文提供的一些方法和組合物的轉(zhuǎn)座酶和轉(zhuǎn)座子序列的更多實(shí)施方案包括金黃色葡萄球菌(Staphylococcus aureus)Tn552(Colegio et al.,J.Bacteriol.,183:2384-8(2001);Kirby et al.,Mol.Microbiol.,43:173-86(2002)),Ty1(Devine&Boeke,Nucleic Acids Res.,22:3765-72(1994)和WO 95/23875),轉(zhuǎn)座子Tn7(Craig,Science 271:1512(1996);Craig,Curr Top Microbiol Immunol.,204:27-48(1996)),Tn/O和IS10(Kleckner et al.,Curr Top Microbiol Immunol.,204:49-82(1996)),Mariner轉(zhuǎn)座酶(Lampe et al.,EMBO J.,15:5470-9,(1996)),Tel(Plasterk,Curro Topics Microbiol.Immunol.,204:125-43,(1996)),P元件(Gloor,Methods Mol.Biol.,260:97-114,(2004)),Tn3(Ichikawa&Ohtsubo,J BioI.Chem.265:18829-32,(1990)),細(xì)菌插入序列(Ohtsubo&Sekine,Curro Top.Microbiol.Immunol.204:1-26,(1996)),逆轉(zhuǎn)錄病毒(Brown,et al.,Proc Natl Acad Sci USA,86:2525-9,(1989))和酵母的反轉(zhuǎn)錄轉(zhuǎn)座子(Boeke&Corces,Annu Rev Microbiol.43:403-34,(1989))。更多實(shí)例包括IS5,Tn10,Tn903,IS911和轉(zhuǎn)座酶家族酶的工程化改造形式(Zhang et al.,PLoS Genet.5:el000689.Epub 2009Oct 16;and Wilson et al.Microbiol.Methods 71:332-5(2007))。更多實(shí)例包括MuA轉(zhuǎn)座酶(參見例如Rasila TS,et al.,(2012)PLoS ONE 7(5):e37922.doi:10.1371/journal.pone.0037922)。Tn5轉(zhuǎn)座酶的變體,如具有氨基酸取代,插入,缺失和/或與其它蛋白質(zhì)或肽的融合,公開于美國專利:5,925,545;5,965,443;7,083,980;7,608,434;和美國專利申請14/686,961。專利和專利申請通過引用整體并入本文。在一些實(shí)施方案中,相對于如美國專利申請14/686,961中所公開的野生型蛋白質(zhì),Tn5轉(zhuǎn)座酶在位置54、56、372、212、214、251和338處包含一個或多個取代。在一些實(shí)施方案中,Tn5野生型蛋白或其變體可以進(jìn)一步包含融合多肽。在一些實(shí)施方案中,融合至轉(zhuǎn)座酶的多肽結(jié)構(gòu)域可以包含例如延伸因子Ts。本段中引用的每個參考文獻(xiàn)通過引用整體并入本文。
如本文所用,捕捉部分包括捕捉探針和親和部分。在一些實(shí)施方案中,捕捉探針可以是核酸。捕捉探針可以與模板核酸締合(例如雜交)。親和部分可以是結(jié)合對的成員。在一些情況下,表面可包含結(jié)合對的第一成員,且捕捉探針可包含結(jié)合對的第二成員。在一些情況下,捕捉探針可以被固定到表面,并且靶核酸可以包含結(jié)合對的第一成員,并且捕捉探針可以包含結(jié)合對的第二成員。結(jié)合對的實(shí)例包括但不限于生物素/鏈霉抗生物素蛋白,配體-受體,激素-受體和抗原-抗體。
在一些實(shí)施方案中,轉(zhuǎn)座子序列包含雙鏈核酸。轉(zhuǎn)座子元件包括核酸分子或它的包括與轉(zhuǎn)座酶或整合酶形成轉(zhuǎn)座體的核苷酸序列的部分。在一些實(shí)施方案中,轉(zhuǎn)座子元件能夠在轉(zhuǎn)座反應(yīng)中與轉(zhuǎn)座酶形成功能性復(fù)合物。本文提供了轉(zhuǎn)座子元件的實(shí)例,并且包括19-bp外端(“OE”)轉(zhuǎn)座子末端,內(nèi)端(“IE”)轉(zhuǎn)座子末端或由例如野生型或突變體Tn5轉(zhuǎn)座酶識別的“馬賽克末端(mosaic end)”("ME")轉(zhuǎn)座子末端,或R1和R2轉(zhuǎn)座子末端(參見例如美國專利申請公開號2010/0120098,其通過引用整體并入本文)。轉(zhuǎn)座子元件可以包括適于在體外轉(zhuǎn)座反應(yīng)中與轉(zhuǎn)座酶或整合酶形成功能性復(fù)合物的任何核酸或核酸類似物。例如,轉(zhuǎn)座子末端可以包含DNA,RNA,修飾的堿基,非天然堿基,修飾的主鏈,并且可以包含一條或兩條鏈中的切口。
在一些實(shí)施方案中,轉(zhuǎn)座子序列可以包括轉(zhuǎn)座子元件和另外的序列。在一些實(shí)施方案中,另外的序列可以在轉(zhuǎn)座反應(yīng)中插入靶核酸中。另外的序列可以包括引物結(jié)合位點(diǎn),如測序引物位點(diǎn)和擴(kuò)增引物位點(diǎn)。另外的序列還可以包括切割位點(diǎn),錨定位點(diǎn),報告標(biāo)簽和條形碼。
在一些實(shí)施方案中,引物結(jié)合位點(diǎn)可以包括用于測序引物以在測序反應(yīng)中與核酸退火的序列。在一些實(shí)施方案中,引物結(jié)合位點(diǎn)可包括針對引物的在擴(kuò)增反應(yīng)或其它延伸反應(yīng)中與核酸退火的序列。
在一些實(shí)施方案中,切割位點(diǎn)可以包括轉(zhuǎn)座子序列中的位點(diǎn),其中共價鍵的斷裂產(chǎn)生兩個片段。例如,包含切割位點(diǎn)的轉(zhuǎn)座子序列可以插入靶核酸中,然后修飾的核酸可以通過在插入的切割位點(diǎn)處的鍵斷裂而片段化。在一些實(shí)施方案中,切割位點(diǎn)包括限制性內(nèi)切酶識別序列和/或限制酶切割位點(diǎn)。在一些實(shí)施方案中,切割位點(diǎn)可以包括核酸中的至少一種核糖核苷酸,其在其它情況下可以包含脫氧核糖核苷酸并且可以用RNA酶切割??梢允褂媚軌蜻x擇性切割脫氧核糖核苷酸和核糖核苷酸之間的磷酸二酯鍵的化學(xué)切割劑,包括例如金屬離子,如稀土金屬離子(例如La3+,特別是Tm3+、Yb3+或Lu3+,Fe(3)或Cu(3)),或暴露于升高的pH。在一些實(shí)施方案中,切割位點(diǎn)可以包括切口酶(即斷裂雙鏈核酸的一條鏈的切口內(nèi)切核酸酶)的一個或多個識別序列。因此,片段化位點(diǎn)可以包括第一切口酶識別序列和任選地第二切口酶識別序列。第一和第二切口酶識別序列可以彼此相同或彼此不同。在一些實(shí)施方案中,切割位點(diǎn)可以包括一個或多個核苷酸類似物,其包含無堿基位點(diǎn)并且允許在某些化學(xué)劑,如多胺,N,N'-二甲基乙二胺(DMED)存在下在片段化位點(diǎn)處切割(參見例如,美國專利申請公開號2010/0022403,其通過引用整體并入本文)。在一些實(shí)施方案中,無堿基位點(diǎn)可以通過修飾切割位點(diǎn)內(nèi)的尿嘧啶核苷酸來創(chuàng)建,例如使用尿嘧啶DNA糖基化酶(UDG)酶。然后可以通過用內(nèi)切核酸酶(例如Endo IV內(nèi)切核酸酶,AP裂合酶,F(xiàn)PG糖基化酶/AP裂合酶,Endo VIII糖基化酶/AP裂合酶),熱或堿處理,在無堿基位點(diǎn)處切割包含無堿基位點(diǎn)的多核苷酸鏈。無堿基位點(diǎn)還可以在除脫氧尿苷之外的核苷酸類似物上產(chǎn)生,并通過用內(nèi)切核酸酶,熱或堿處理以類似的方式切割。例如,8-氧代-鳥嘌呤可以通過暴露于FPG糖基化酶而轉(zhuǎn)化為無堿基位點(diǎn)。脫氧肌苷可以通過暴露于AlkA糖基化酶而轉(zhuǎn)化為無堿基位點(diǎn)。然后,可以通常通過用合適的內(nèi)切核酸酶,如Endo IV或AP裂合酶處理切割如此產(chǎn)生的無堿基位點(diǎn)(參見例如,U.S.2011/0014657,其通過引用整體并入本文)。在另一個實(shí)例中,切割位點(diǎn)可包括允許通過用高碘酸鹽(例如高碘酸鈉)處理切割的二醇連接。在另一個實(shí)例中,切割位點(diǎn)可以包括允許用化學(xué)還原劑,例如三(2-羧乙基)-磷酸鹽酸鹽(TCEP)切割的二硫化物基團(tuán)。在一些實(shí)施方案中,切割位點(diǎn)可以包括可光切割的部分。光化學(xué)切割可以通過利用光能斷裂共價鍵的多種方法中的任一種來進(jìn)行。用于光化學(xué)切割的位點(diǎn)可以由核酸中的非核苷酸化學(xué)部分提供,如亞磷酰胺[4-(4,4'-二甲氧基三苯甲基氧基)丁酰胺基甲基)-1-(2-硝基苯基)-乙基]-2-氰乙基-(N,N-二異丙基)-亞磷酰胺)(Glen Research,Sterling,Va.,USA,產(chǎn)品目錄號10-4913-XX)。
在一些實(shí)施方案中,轉(zhuǎn)座子序列可以包括錨定位點(diǎn)。在一些實(shí)施方案中,錨定位點(diǎn)可以包括可以特異性結(jié)合捕捉探針的序列。在一些實(shí)施方案中,錨定位點(diǎn)包含與包含核酸的捕捉探針互補(bǔ)和/或基本上互補(bǔ)的序列。在一些實(shí)施方案中,錨定位點(diǎn)可以包括配體或受體,其結(jié)合包含相應(yīng)受體或配體的捕捉探針的。換言之,錨定位點(diǎn)和捕捉探針可以包含配體/受體對。在一些實(shí)施方案中,配體或受體可以通過修飾的核苷酸與轉(zhuǎn)座子序列的錨定位點(diǎn)締合。配體和受體的實(shí)例包括分別能結(jié)合鏈霉抗生物素蛋白或鎳的生物素或多聚His。其它實(shí)例包括本領(lǐng)域已知的配體對及其受體,例如抗生物素蛋白-生物素,鏈霉抗生物素蛋白-生物素,以及生物素,鏈霉抗生物素蛋白或抗生物素蛋白的衍生物,包括但不限于2-亞氨基生物素(2-iminobiotin),脫硫生物素,NeutrAvidin(Molecular Probes,Eugene,Oreg.),CaptAvidin(Molecular Probes)等;結(jié)合蛋白/肽,包括麥芽糖-麥芽糖結(jié)合蛋白(MBP),鈣-鈣結(jié)合蛋白/肽(CBP);抗原抗體,包括表位標(biāo)簽,包括c-MYC,HA,VSV-G,HSV,V5和FLAG TagTM,及其相應(yīng)的抗表位抗體;半抗原,例如二硝基苯和地高辛配基(digoxigenin)及其相應(yīng)的抗體;適體及其相應(yīng)靶標(biāo);多聚His標(biāo)簽(例如戊-His和己-His)及其結(jié)合配偶體,包括相應(yīng)的固定化金屬離子親和層析(IMAC)材料和抗聚His抗體;熒光團(tuán)和抗熒光團(tuán)抗體;核酸鏈及其互補(bǔ)鏈等。
在一些實(shí)施方案中,轉(zhuǎn)座子序列可以包括報告標(biāo)簽。有用的報告標(biāo)簽包括本領(lǐng)域已知的多種可識別標(biāo)簽,標(biāo)記物或基團(tuán)中的任一種。在某些實(shí)施方案中,報告標(biāo)簽可以發(fā)射信號。信號的實(shí)例包括熒光,化學(xué)發(fā)光,生物發(fā)光,磷光,放射性,量熱或電化學(xué)發(fā)光的那些。示例性的報告標(biāo)簽包括熒光團(tuán),放射性同位素,色原,酶,包括表位標(biāo)簽的抗原,半導(dǎo)體納米晶體如量子點(diǎn),重金屬,染料,磷光基團(tuán),化學(xué)發(fā)光基團(tuán),電化學(xué)檢測部分,結(jié)合蛋白,磷光體(phosphors),稀土螯合物,過渡金屬螯合物,近紅外染料,電化學(xué)發(fā)光標(biāo)記物和質(zhì)譜儀相容的報告標(biāo)簽,如質(zhì)量標(biāo)簽,電荷標(biāo)簽和同位素??梢耘c本文的方法和組合物一起使用的更多的報告標(biāo)簽包括光譜標(biāo)記物,如熒光染料(例如異硫氰酸熒光素,德克薩斯紅,羅丹明等);放射性標(biāo)記(例如,3H、125I、35S、14C、32P、33P等);酶(例如,辣根過氧化物酶,堿性磷酸酶等);光譜比色標(biāo)記物,如膠體金或有色玻璃或塑料(例如聚苯乙烯,聚丙烯,乳膠等);珠;磁性標(biāo)簽;電標(biāo)簽;熱標(biāo)簽;和質(zhì)量標(biāo)簽。
在一些實(shí)施方案中,轉(zhuǎn)座子序列可以包括條形碼。在一些實(shí)施方案中,轉(zhuǎn)座子群體可以包括這樣的轉(zhuǎn)座子序列,其包含相同條形碼,一個或多個不同條形碼,或其中每個轉(zhuǎn)座子序列可以包括不同的條形碼。在一些實(shí)施方案中,插入到靶核酸中的條形碼可以用于鑒定靶核酸。在一些實(shí)施方案中,條形碼可用于鑒定靶核酸中的插入事件。在一些實(shí)施方案中,轉(zhuǎn)座體群中的每個轉(zhuǎn)座體包括具有不同條形碼的轉(zhuǎn)座子序列,所述條形碼可用于鑒定靶核酸中的插入位點(diǎn)。在一些實(shí)施方案中,條形碼可用于鑒定在切割位點(diǎn)處片段化后的插入位點(diǎn),例如條形碼跨越切割位點(diǎn)的地方。示例條形碼及其制備和使用的方法闡述于國際公開號WO 2012/061832;美國專利申請公開號2012/0208724,美國專利申請公開號2012/0208705和PCT申請流水號PCT/US2013/031023,其各自通過引用整體并入本文。
在一些實(shí)施方案中,轉(zhuǎn)座體包括兩個轉(zhuǎn)座子序列。在一些實(shí)施方案中,每個轉(zhuǎn)座子序列包括轉(zhuǎn)座子元件。在一些實(shí)施方案中,每個轉(zhuǎn)座子序列可以包括引物結(jié)合位點(diǎn),如測序引物位點(diǎn)和擴(kuò)增引物位點(diǎn),另外的序列還可以包括錨定位點(diǎn),報告標(biāo)簽和條形碼。轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中可導(dǎo)致在插入位點(diǎn)處靶核酸的切割。在一些實(shí)施方案中,轉(zhuǎn)座體的轉(zhuǎn)座酶可以保持于靶核酸的切割位點(diǎn)的每個末端,保持靶核酸的切割片段的物理接近性。
在一些實(shí)施方案中,轉(zhuǎn)座子序列可以包括彼此連接的兩個轉(zhuǎn)座子元件。接頭可以包括在插入物中,使得第一轉(zhuǎn)座子元件與第二轉(zhuǎn)座子元件連續(xù)。特別有用的插入物是形成“環(huán)狀”復(fù)合物的插入物,如國際公開號WO 2012/061832;美國專利申請公開號2012/0208724,美國專利申請公開號2012/0208705和PCT申請流水號PCT/US2013/031023中列出,其各自通過引用整體并入本文。在此類結(jié)構(gòu)中,具有連續(xù)轉(zhuǎn)座子元件的單個插入物與形成“環(huán)狀”復(fù)合體的兩個轉(zhuǎn)座酶亞基結(jié)合。環(huán)狀復(fù)合物可用于將插入物放置到靶核酸中,同時保持初始靶核酸的排序信息,并且不會使得到的修飾的核酸聚合物片段化。插入環(huán)狀轉(zhuǎn)座子元件提供將插入物添加到靶核酸中,而不必使靶核酸片段化。
本文中提供的方法和組合物的一些實(shí)施方案包括使用具有表面的基底。在一些實(shí)施方案中,表面包含多個將修飾的核酸結(jié)合到表面的捕捉探針?;卓梢允嵌S或三維的,并且可以是平面表面(例如,玻璃載玻片)或可以是成形的。有用的材料包括玻璃(例如可控孔徑玻璃(CPG)),石英,塑料(如聚苯乙烯(低交聯(lián)和高交聯(lián)聚苯乙烯),聚碳酸酯,聚丙烯和聚(甲基丙烯酸甲酯)),丙烯酸共聚物,聚酰胺,硅,金屬(例如烷基硫醇衍生化的金(alkanethiolate-derivatized gold)),纖維素,尼龍,膠乳,葡聚糖,凝膠基質(zhì)(例如,硅膠),聚丙烯醛(polyacrolein)或復(fù)合材料。合適的三維固體支持物包括例如球體,微粒,珠,膜,載玻片,板,微機(jī)械加工芯片(micro machined chip),管(例如毛細(xì)管),微孔,微流體裝置,通道,過濾器或適合于錨定核酸或其它捕捉探針的任何其它結(jié)構(gòu)。固體支持物可以包括平面微陣列或能夠具有包括核酸群或引物或其它捕捉探針的區(qū)域的矩陣。實(shí)例包括核苷衍生化的CPG和聚苯乙烯載玻片;衍生化的磁性載玻片;用聚乙二醇接枝的聚苯乙烯等??梢允褂酶鞣N方法將捕捉探針(如核酸)附著,錨定或固定到固體支持物的表面。附著可以通過直接或間接鍵合到表面來實(shí)現(xiàn)。鍵合可以通過共價連接進(jìn)行(參見例如Joos et al.(1997)Analytical Biochemistry,247:96-101;Oroskar et al.(1996)Clin.Chem.,42:1547-1555;and Khandjian(1986)Mol.Bio.Rep.,11:107-11,其各自通過引用整體并入本文)。優(yōu)選的附著是核酸的末端核苷酸與整合在表面上的環(huán)氧化物的直接胺鍵合。鍵合也可以通過非共價鍵連接。例如,生物素-鏈霉抗生物素蛋白(Taylor et al.(1991)1.Phys.D:Appl.Phys.,24:1443,其通過引用整體并入本文)和地高辛配基與抗地高辛配基(Smith et al.,Science,253:1122(1992),其通過引用整體并入本文)是用于將核酸錨定于表面的常用工具。核酸與表面的附著可以通過中間結(jié)構(gòu)如珠,顆?;蚰z。通過凝膠將核酸附著到陣列以可購自Illumina Inc.(San Diego,CA)或記載于美國專利申請公開號2010/10111768;美國專利申請公開號2012/0270305;和US 8,563,477(其各自通過引用整體并入本文)的流動池例示。
在一些實(shí)施方案中,捕捉探針可以包括與錨定序列互補(bǔ)或基本上互補(bǔ)的核酸,受體或配體,如本文中提供的。在一些實(shí)施方案中,捕捉探針包含重組酶,其結(jié)合包含非互補(bǔ)鏈的雙鏈核酸區(qū)域,如雙鏈核酸中的“氣泡”。
在一些實(shí)施方案中,基底可具有連續(xù)或整體表面。因此,核酸片段可以附著在空間隨機(jī)位置處,其中最近鄰片段(或從片段衍生的最近鄰簇)之間的距離將是可變的。所得到的陣列可以具有特征的可變或隨機(jī)空間模式。在一些實(shí)施方案中,本文中列出的方法中使用的基底可包括以重復(fù)模式存在的捕捉探針陣列。在一些此類實(shí)施方案中,捕捉探針提供核酸可以附著的位置。在一些實(shí)施方案中,重復(fù)模式是六角形模式,直線模式,網(wǎng)格模式,具有反射對稱性的模式,具有旋轉(zhuǎn)對稱性的模式等。修飾的核酸附著的捕捉探針各自可具有是,或小于約1mm2、500μm2、100μm2、25μm2、10μm2、5μm2、1μm2、500nm2、或100nm2,或由前述值中的任何兩個定義的范圍的面積?;蛘?另外,每個特征可具有是,或大于約100nm2、250nm2、500nm2、1μm2、2.5μm2、5μm2、10μm2、100μm2、或500μm2,或由上述任何兩個值定義的面積。由陣列上的片段(無論是模式化的還是空間隨機(jī)的)的擴(kuò)增產(chǎn)生的核酸的簇或集落可以類似地具有在上述范圍中或者選自上面列舉的上限和下限之間的面積。
幾種商品化的測序平臺依賴于具有孔的基底,所述孔在序列檢測步驟期間提供了檢測試劑(例如,可購自454LifeSciences(Roche的子公司,Basel Switzerland)的平臺中的焦磷酸鹽或可購自Ion Torrent(Life Technologies的子公司,Carlsbad California)的平臺中的質(zhì)子)擴(kuò)散的屏障。
本文中提供的一些實(shí)施方案包括擴(kuò)增靶核酸,經(jīng)修飾的核酸或其片段的部分??梢允褂帽绢I(lǐng)域中已知的任何合適的擴(kuò)增方法。在一些實(shí)施方案中,在固體支持物上擴(kuò)增核酸片段。例如,在一些實(shí)施方案中,使用橋式擴(kuò)增方法來擴(kuò)增核酸片段,如通過美國專利號5,641,658;美國專利公開號2002/0055100;美國專利號7,115,400;美國專利公開號2004/0096853;10美國專利公開號No.2004/0002090;美國專利公開號2007/0128624;和美國專利公開號2008/0009420的公開內(nèi)容例示,其各自以全文引用的方式并入本文中。
橋式擴(kuò)增方法允許將擴(kuò)增產(chǎn)物固定在固體支持物上,以形成由固定的核酸分子的簇(或“集落”)組成的陣列。這種陣列上的每個簇或集落由多個相同的固定的多核苷酸鏈和多個相同的固定的互補(bǔ)多核苷酸鏈形成。如此形成的陣列在本文中可以稱為“聚簇陣列”。當(dāng)由固定的多核苷酸鏈和固定的互補(bǔ)鏈的退火對形成時,固相擴(kuò)增反應(yīng)的產(chǎn)物是所謂的“橋式”結(jié)構(gòu),其中兩條鏈優(yōu)選通過共價附著固定在5'端的固體支持物上。橋式擴(kuò)增方法是其中使用固定的核酸模板產(chǎn)生固定的擴(kuò)增子的方法的實(shí)例。其它合適的方法也可用于從根據(jù)本文提供的方法產(chǎn)生的固定化核酸片段產(chǎn)生固定的擴(kuò)增子。例如,可以通過固相PCR,固相MDA,固相RCA等形成一個或多個簇或集落,無論每對擴(kuò)增引物中的一個或兩個引物是否被固定化。
應(yīng)當(dāng)理解,本文中所述或本領(lǐng)域通常已知的任何擴(kuò)增方法可以與通用引物或靶物特異性引物一起使用以擴(kuò)增固定的DNA片段。用于擴(kuò)增的合適方法包括但不限于聚合酶鏈?zhǔn)椒磻?yīng)(PCR),鏈置換擴(kuò)增(SDA),轉(zhuǎn)錄介導(dǎo)的擴(kuò)增(TMA)和基于核酸序列的擴(kuò)增(NASBA),例如描述于美國專利號8,003,354,其全部內(nèi)容通過引用并入本文。上述擴(kuò)增方法可用于擴(kuò)增一種或多種目的核酸。例如,PCR,多重PCR,SDA,TMA,NASBA等可以用于擴(kuò)增固定的核酸片段。在一些實(shí)施方案中,特異性針對目標(biāo)核酸的引物包括在擴(kuò)增反應(yīng)中。
用于擴(kuò)增核酸的其它合適方法可包括寡核苷酸延伸和連接,滾環(huán)擴(kuò)增(RCA)(Lizardi et al.,Nat.Genet.19:225-232(1998),其通過引用整體并入本文)和寡核苷酸連接測定(OLA)(參見例如美國專利號7,582,420,5,185,243,5,679,524和5,573,907;EP 0320308;EP 0336731;EP 0439182;WO 90101069;WO 89/12696;和WO 89109835,其通過引用整體并入本文)。應(yīng)當(dāng)理解,可以設(shè)計(jì)這些擴(kuò)增方法以擴(kuò)增固定的核酸片段。例如,在一些實(shí)施方案中,擴(kuò)增方法可以包括連接探針擴(kuò)增或寡核苷酸連接測定(OLA)反應(yīng),其包含特異性針對目標(biāo)核酸的引物。在一些實(shí)施方案中,擴(kuò)增方法可包括引物延伸-連接反應(yīng),其含有特異性針對目標(biāo)核酸的引物。作為可以特異性設(shè)計(jì)以擴(kuò)增目標(biāo)核酸的引物延伸和連接引物的非限制性實(shí)例,擴(kuò)增可包括用于GoldenGate測定(Illumina,Inc.,San Diego,CA)的引物,如通過美國專利號7,582,420和7,611,869例示,其各自通過引用整體并入本文。
等溫擴(kuò)增技術(shù)可以用于本公開的方法中。示例性的等溫擴(kuò)增方法包括但不限于多重置換擴(kuò)增(MDA),例如由Dean et al.,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)例示,或等溫鏈置換核酸擴(kuò)增,如以美國專利號6,214,587例示,其各自通過引用整體并入本文??捎糜诒竟_的其它非基于PCR的方法包括例如在例如Walker et al.,Molecular Methods for Virus Detection,Academic Press,Inc.,1995;美國專利號5,455,166和5,130,238,及Walker et al.,Nucl.Acids Res.20:1691-96(1992)中描述的鏈置換擴(kuò)增(SDA)或超分支鏈置換擴(kuò)增(hyperbranched strand displacement amplification),其描述于例如Lage et al.,Genome Research 13:294-307(2003)中,其各自通過引用整體并入本文。
擴(kuò)增反應(yīng),條件和組分的另外描述在美國專利號7,670,810中闡述,其通過引用整體并入本文。其它有用的等溫擴(kuò)增技術(shù)包括重組酶促進(jìn)的擴(kuò)增技術(shù),如由TwistDx(Cambridge,UK)以TwistAmpTM試劑盒商業(yè)銷售的那些。重組酶促進(jìn)的擴(kuò)增試劑和反應(yīng)條件的有用組分闡述于US 5,223,414和US 7,399,590中,其各自通過引用整體并入本文。也可以使用依賴于解旋酶的擴(kuò)增,例如,如Xu et al.EMBO Rep 5:795-800(2004),其通過引用以其整體并入本文。實(shí)現(xiàn)動力學(xué)排阻擴(kuò)增的條件可以是特別有用的并且描述于例如US 2013/0338042中,其通過引用整體并入本文。
在一些實(shí)施方案中,可能期望需要進(jìn)行再接種(re-seeding)步驟。例如,修飾的核酸片段可以在表面區(qū)域內(nèi)的位置捕獲,在擴(kuò)增過程的一個或多個循環(huán)上復(fù)制,其原始片段和/或其擴(kuò)增子可以從該位置釋放,釋放的核酸可以在相同區(qū)域中的其它位置捕獲,并且可以擴(kuò)增新捕獲的核酸。在一個實(shí)施方案中,修飾的核酸片段在再接種前通過第一次延伸進(jìn)行復(fù)制,并在不同位置重新捕獲,所述位置可以緊鄰第一捕獲點(diǎn)或甚至遠(yuǎn)離它。在一個具體的實(shí)例中,可以對接種在表面上的片段進(jìn)行單一循環(huán)的橋式擴(kuò)增,而不是在從表面釋放時洗掉原始模板片段,模板片段可以在新位置在表面上再接種,所述新位置鄰近于其最初接種的位置。后續(xù)輪次的橋式擴(kuò)增將允許在原始種子位置和再接種位置兩者的簇生長。使用此類方法,可以在表面的區(qū)域創(chuàng)建重復(fù)的集落以提供技術(shù)重復(fù)。在上述實(shí)例的一些實(shí)施方案中,轉(zhuǎn)座子序列可以包含獨(dú)特的分子標(biāo)識符(UMI)。UMI將允許跟蹤文庫分子,并且能夠確定共享相同UMI(和基因組序列)的簇源自相同的原始文庫分子。對技術(shù)重復(fù)的序列的分析可以提供錯誤檢查的益處。例如,僅在近端簇(被鑒定為技術(shù)重復(fù))的子集中出現(xiàn)的觀察到的序列變體可以被鑒定為擴(kuò)增錯誤,而發(fā)生在被鑒定為特定片段的技術(shù)重復(fù)的所有簇中的序列變體更多可能是真正的變體。
本文中所述的方法的一些實(shí)施方案可以包括對源自靶核酸的片段進(jìn)行測序的步驟。一個實(shí)例是合成測序(SBS)。在SBS中,監(jiān)測核酸引物沿著核酸模板(例如,靶核酸或其擴(kuò)增子的片段)延伸以確定模板中的核苷酸序列。引物可以與存在于如上所述的插入物中的引發(fā)位點(diǎn)雜交?;A(chǔ)化學(xué)過程可以是聚合(例如,通過聚合酶催化)。在特定的基于聚合酶的SBS實(shí)施方案中,將熒光標(biāo)記的核苷酸以模板依賴性方式添加至引物中(從而延伸引物),使得添加至引物的核苷酸的順序和類型的檢測可用于確定模板。使用本文闡述的步驟,附著在陣列的不同位置處的多個不同核酸片段可以在由于其在陣列中的位置而能夠區(qū)分針對不同模板發(fā)生的事件的條件下經(jīng)受SBS技術(shù)。
在一些實(shí)施方案中,流動池提供用于容納通過本公開的方法產(chǎn)生并且經(jīng)受SBS或其它檢測技術(shù)的核酸片段陣列的方便的形式,所述檢測技術(shù)牽涉循環(huán)中的試劑的重復(fù)遞送。例如,為了啟動第一SBS循環(huán),可以使一種或多種標(biāo)記的核苷酸,DNA聚合酶等流入/通過容納核酸片段陣列的流動池。可以檢測陣列的那些位點(diǎn),其中引物延伸(例如通過引物與位于附著于核酸片段的插入物上的引發(fā)位點(diǎn)的雜交)引起經(jīng)標(biāo)記的核苷酸被摻入。任選地,核苷酸可以進(jìn)一步包括一旦核苷酸已經(jīng)添加到引物就終止進(jìn)一步引物延伸的可逆終止性質(zhì)。例如,具有可逆終止劑部分的核苷酸類似物可以添加到引物中,使得隨后的延伸不能發(fā)生,直到遞送去封閉劑以去除該部分。因此,對于使用可逆終止的實(shí)施方案,可以將去封閉試劑遞送到流動池(在檢測發(fā)生之前或之后)??梢栽诟鱾€遞送步驟之間進(jìn)行洗滌。然后可以重復(fù)該循環(huán)“n”次以將引物延伸n個核苷酸,從而檢測長度“n”的序列??梢匀菀椎剡m用于與由本公開的方法產(chǎn)生的陣列一起使用的示例性SBS程序,流體系統(tǒng)和檢測平臺描述于例如Bentley et al.,Nature 456:53-59(2008),WO 04/018497;US 7,057,026;WO 91/06678;WO 071123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281,及美國專利申請公開號2008/0108082,其各自通過引用整體并入本文。
在一些實(shí)施方案中,可以使用利用循環(huán)反應(yīng)的其它測序程序,例如焦磷酸測序。由于特定核苷酸被摻入新生核酸鏈中,焦磷酸測序檢測無機(jī)焦磷酸(PPi)的釋放(Ronaghi,et al.,Analytical Biochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi et al.Science 281(5375),363(1998);US 6,210,891;US 6,258,568和US.6,274,320,其各自通過引用整體并入本文)。在焦磷酸測序中,釋放的PPi可以通過由ATP硫酸化酶轉(zhuǎn)化為三磷酸腺苷(ATP)來檢測,并且可以通過螢光素酶產(chǎn)生的光子檢測產(chǎn)生的ATP水平。因此,可以通過發(fā)光檢測系統(tǒng)監(jiān)測測序反應(yīng)。用于基于熒光的檢測系統(tǒng)的激發(fā)輻射源對于焦磷酸測序程序不是必需的??捎糜趯⒔沽姿釡y序應(yīng)用于本公開的方法的有用的流體系統(tǒng),檢測器和程序描述于例如WO 2012058096,美國專利申請公開號2005/0191698,US 7,595,883,和US 7,244,559,其各自通過引用整體并入本文。連接測序反應(yīng)也是有用的,包括例如Shendure et al.Science 309:1728-1732(2005);US 5,599,675;和US 5,750,341中描述,其各自通過引用整體并入本文。一些實(shí)施方案可以包括雜交測序程序,如例如描述于Bains et al.,Journal of Theoretical Biology 135(3),303-7(1988);Drmanac et al.,Nature Biotechnology 16,54-58(1998);Fodor et al.,Science 251(4995),767-773(1995);及WO 1989110977,其各自通過引用整體并入本文。
在一些實(shí)施方案中,如連接測序和雜交測序程序,存在于陣列位點(diǎn)處的靶核酸片段(或其擴(kuò)增子)經(jīng)歷寡核苷酸遞送和檢測的重復(fù)循環(huán)。用于本文或本文引用的參考文獻(xiàn)中所述的SBS方法的流體系統(tǒng)可容易地適用于遞送用于連接測序或雜交測序程序的試劑。通常,寡核苷酸是經(jīng)熒光標(biāo)記的,并且可以使用與關(guān)于本文中或本文引用的參考文獻(xiàn)中的SBS程序所述的熒光檢測器類似的熒光檢測器來檢測。
一些實(shí)施方案可以利用涉及DNA聚合酶活性的實(shí)時監(jiān)測的方法。例如,可以通過帶有熒光團(tuán)的聚合酶和y-磷酸標(biāo)記的核苷酸之間的熒光共振能量轉(zhuǎn)移(FRET)相互作用或者用Zeromode波導(dǎo)(ZMW)來檢測核苷酸摻入?;贔RET的測序的技術(shù)和試劑描述于例如Levene et al.Science 299,682-686(2003);Lundquist et al.Opt.Lett.33,1026-1028(2008);和Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008),其公開內(nèi)容通過引用整體并入本文。
一些SBS實(shí)施方案包括檢測在將核苷酸摻入延伸產(chǎn)物中時釋放的質(zhì)子。例如,基于檢測釋放的質(zhì)子的測序可以使用可購自Ion Torrent(Guilford,CT,Life Technologies子公司)的電檢測器和相關(guān)技術(shù)或美國專利申公開號2009/10026082 AI;美國專利申公開號2009/10127589AI;美國專利申公開號2010/10137143;或美國專利申公開號2010/10282617(其各自以全文引用的方式并入本文中)中描述的測序方法和系統(tǒng)。
在一些實(shí)施方案中,本方法的測序步驟可包括納米孔測序技術(shù),例如Deamer&Akeson Trends Biotechnol.18,147-151(2000);Deamer&Branton,Acc.Chem.Res.35:817-825(2002);和Li et al.,Nat.Mater.2:611-615(2003)中描述的,其各自通過引用整體并入本文。在此類實(shí)施方案中,靶核酸片段通過納米孔。納米孔可以是合成孔或生物膜蛋白,例如α-溶血素。當(dāng)靶核酸通過納米孔時,可以通過測量孔的電導(dǎo)率的波動來鑒定每個堿基。(美國專利號7,001,792;Soni&Meller Clin.Chem.53,1996-2001(2007);Healy,Nanomed.2:459-481(2007);及Cockroft et al.,1.Am.Chem.Soc.130:818-820(2008),其各自通過引用整體并入本文)。在一些實(shí)施方案中,單個納米孔的位置類似于本文示例的陣列上的位點(diǎn)或特征。納米孔彼此的接近性可以與它們讀取的片段序列的接近性相關(guān),例如,以便于將那些片段裝配成它們來源的較大序列。
在一些實(shí)施方案中,本文中所述的測序步驟可以有利地以多重形式進(jìn)行,使得同時操作多種不同的靶核酸。在具體實(shí)施方案中,可以在共同的反應(yīng)容器中或在特定基底的表面上處理不同的靶核酸。這允許以多重方式方便地遞送測序試劑,除去未反應(yīng)的試劑和檢測摻入事件。在使用表面結(jié)合的靶核酸或其片段的實(shí)施方案中,靶核酸或片段可以是陣列形式。在陣列形式中,靶核酸的片段通??梢砸钥臻g可區(qū)分的方式偶聯(lián)到表面,例如使用本文所述的附著技術(shù)。陣列可以包括在每個位點(diǎn)(也稱為特征)處的靶核酸片段的單拷貝,或者具有相同序列的多個拷貝可以存在于每個位點(diǎn)或特征??梢酝ㄟ^擴(kuò)增方法如橋式擴(kuò)增或乳液PCR產(chǎn)生多個拷貝。
模板核酸的制備
本文提供的方法的一些實(shí)施方案包括制備用于與基底(例如流動池)接觸來進(jìn)行測序的模板核酸。在一些實(shí)施方案中,通過插入轉(zhuǎn)座子序列修飾靶核酸;通過插入轉(zhuǎn)座子序列或通過隨后的切割步驟使修飾的核酸片段化;可以通過用有尾引物擴(kuò)增或與引物連接將另外的序列添加到片段化的核酸片段的一個或多個末端;片段由表面上的捕捉探針捕獲;可以通過橋式擴(kuò)增來擴(kuò)增捕獲的片段;并且捕獲的片段在表面上被測序。在一些實(shí)施方案中,用于測序的核酸在與表面接觸的反應(yīng)體積中被原位制備。
本文中提供的方法的一些實(shí)施方案包括(a)提供具有表面的基底,所述表面包含附著于其上的多個捕捉探針;(b)使所述表面與包含多個模板核酸和轉(zhuǎn)座體的反應(yīng)體積接觸,每個轉(zhuǎn)座體包含轉(zhuǎn)座子序列和轉(zhuǎn)座酶;其中所述模板核酸通過使靶核酸與多個轉(zhuǎn)座體接觸來制備,和(c)將所述模板核酸與所述捕捉探針締合。一些實(shí)施方案還包括(d)對締合的模板核酸測序。
在一些實(shí)施方案中,基底是具有表面的流動池,所述表面包含附著于表面的捕捉探針,如P7和P5序列或與其互補(bǔ)的序列。P7和P5探針描述于例如美國專利號8,563,477和Bentley et al.,Nature 456:53-59(2008),其各自通過引用整體并入本文。在一些實(shí)施方案中,反應(yīng)體積包含靶核酸,包含轉(zhuǎn)座子序列的多個轉(zhuǎn)座體。本文描述了與本文中提供的方法一起使用的轉(zhuǎn)座體。
在一些實(shí)施方案中,反應(yīng)體積包含靶核酸的多個核酸片段(所述核酸片段包含轉(zhuǎn)座子序列)和多個轉(zhuǎn)座體。在一些實(shí)施方案中,反應(yīng)體積還包括連接酶,聚合酶,dNTP和/或引物以擴(kuò)增核酸片段或?qū)⒘硗獾男蛄羞B接至核酸片段。在一些實(shí)施方案中,當(dāng)反應(yīng)體積與基底接觸時,發(fā)生轉(zhuǎn)座子序列向靶核酸中的插入。
在一些實(shí)施方案中,在反應(yīng)體積與基底接觸之前發(fā)生轉(zhuǎn)座子序列至靶核酸中的插入。在一些實(shí)施方案中,可以制備多個反應(yīng)體積,每個反應(yīng)體積包含不同的靶核酸。每個靶核酸可以基于通過轉(zhuǎn)座子附著到核酸的條形碼來鑒定,所述轉(zhuǎn)座子包含含有條形碼的轉(zhuǎn)座子序列。因此,可以用具有一組轉(zhuǎn)座子的多個轉(zhuǎn)座體處理多個核酸中的單個核酸,使得單個核酸可通過唯一條形碼鑒定(所述唯一條形碼通過轉(zhuǎn)座體附著于所述單個核酸),所述轉(zhuǎn)座子具有不同條形碼。
在一些實(shí)施方案中,轉(zhuǎn)座體包括兩個轉(zhuǎn)座子序列,其中每個轉(zhuǎn)座子序列包括轉(zhuǎn)座子元件。在一些實(shí)施方案中,兩個轉(zhuǎn)座子序列中的一個或多個包括引物結(jié)合位點(diǎn),錨定位點(diǎn)和/或條形碼。在一些實(shí)施方案中,轉(zhuǎn)座子序列包含P7和P5序列或與其互補(bǔ)的序列。
在一些實(shí)施方案中,將轉(zhuǎn)座子序列插入雙鏈靶核酸產(chǎn)生具有單鏈缺口的經(jīng)修飾的雙鏈核酸。在一些實(shí)施方案中,使用聚合酶和/或連接酶填充單鏈缺口。
在一些實(shí)施方案中,用有尾引物擴(kuò)增核酸片段。用有尾引物擴(kuò)增導(dǎo)致將序列添加到擴(kuò)增的核酸片段的一個或多個末端。在一些實(shí)施方案中,另外的序列可以包括引物結(jié)合位點(diǎn)和/或錨定位點(diǎn)。
在一些實(shí)施方案中,將雙鏈核酸片段解鏈成單鏈片段。單鏈核酸片段可用于本文中列出方法的一個或多個步驟中。
在一些實(shí)施方案中,通過捕捉探針經(jīng)由錨定位點(diǎn)捕獲核酸片段或擴(kuò)增的核酸片段。在一些實(shí)施方案中,錨定位點(diǎn)是通過探針和片段上的互補(bǔ)序列的雜交捕獲片段的核酸。例如,雜交可以由包含P7和P5序列或與其互補(bǔ)的序列的錨定位點(diǎn)或捕獲探針介導(dǎo)。
在一些實(shí)施方案中,擴(kuò)增所捕獲的核酸。在一些實(shí)施方案中,擴(kuò)增是橋式擴(kuò)增?;蛘?另外,可使用本文中列出的其它擴(kuò)增方法。
在一些實(shí)施方案中,在表面上測序經(jīng)捕獲的核酸,例如使用本文中列出的方法。
獲得單倍型信息
靶核酸,如基因組DNA可以包括多于單個單倍型。例如,人基因組DNA含有兩組DNA分子,每組有母本和父本序列的不同組合。本文中提供的一些實(shí)施方案可用于從單個核酸分子的片段或其拷貝獲得序列信息??梢垣@得關(guān)于序列的單倍型結(jié)構(gòu)或相位的其它信息。所述方法的優(yōu)點(diǎn)是確定靶核酸中序列區(qū)域的單倍型或相位的能力,所述靶核酸大于物理測序的靶核酸的片段。
在一些實(shí)施方案中,維持基底上某些片段的物理接近性。在一些實(shí)施方案中,與在線性靶核酸的序列中彼此較不接近的片段的序列相比,在線性靶核酸的序列中彼此更接近的片段的序列在表面上彼此具有更接近的物理接近性。片段的物理接近性可用于確定片段序列在衍生片段的靶序列的表示中的接近性。可以通過多種方法保留某些片段的物理接近性。
在一些實(shí)施方案中,通過插入轉(zhuǎn)座子序列片段化靶核酸。然而,在其它實(shí)施方案中,轉(zhuǎn)座酶的存在可以將兩個片段保持在一起,例如,美國專利申請流水號61/919,529中描述,其全部內(nèi)容通過引用并入本文。在一些實(shí)施方案中,可以在表面上捕獲片段之后除去轉(zhuǎn)座酶。在一些實(shí)施方案中,反應(yīng)體積可包括減少片段擴(kuò)散使得靶核酸的鄰近片段保持緊密接近的試劑。
在一些實(shí)施方案中,獲得單倍型信息的方法包括比較針對表面上的近端位置確定的互補(bǔ)序列以鑒定序列錯誤。在一些實(shí)施方案中,表面上任何兩個片段種類的相對接近性可以提供對從兩個片段獲得的序列信息的比對有用的信息。具體地,在表面上來源于任意兩個給定片段的簇之間的距離可以與兩個簇來自相同的靶多核苷酸分子的概率正相關(guān),如WO 2012/025250,美國專利申請流水號61/919,529和美國專利申請流水號13/790,220中更加詳細(xì)描述,其各自以全文引用的方式并入本文中。
作為實(shí)例,在一些實(shí)施方案中,衍生自在流動池表面捕獲的長核酸分子的片段出現(xiàn)在穿過流動池表面的線中(例如,如果核酸在片段化或擴(kuò)增之前被延伸出來)或在表面上的云(cloud)中。此外,然后可以產(chǎn)生固定的核酸的物理圖譜。因此,物理圖關(guān)聯(lián)擴(kuò)增固定的核酸后的簇的物理關(guān)系。具體地,物理圖譜用于計(jì)算從任何兩個簇獲得的序列數(shù)據(jù)連接的概率,如在WO 2012/025250,美國專利申請流水號61/919,529和美國專利申請流水號13/790,220的并入材料中描述,其各自以全文引用的方式并入本文中。
在一些實(shí)施方案中,通過使表面成像以建立固定的核酸分子在整個表面上的位置來產(chǎn)生物理圖譜。在一些實(shí)施方案中,通過將成像劑添加固體支持物并檢測來自成像劑的信號來成像固定的核酸。在一些實(shí)施方案中,成像劑是可檢測標(biāo)記物。合適的可檢測標(biāo)記物包括但不限于質(zhì)子,半抗原,放射性核素,酶,熒光標(biāo)記物,化學(xué)發(fā)光標(biāo)記物和/或生色劑。例如,在一些實(shí)施方案中,成像劑是嵌入染料或非插入DNA結(jié)合劑??梢允褂萌绫绢I(lǐng)域中已知的任何合適的嵌入染料或非插入DNA結(jié)合劑,包括但不限于在美國專利申請公開號2012/0282617中列出的,其通過引用整體并入本文。
在某些實(shí)施方案中,多個經(jīng)修飾的核酸分子流到包含多個納米通道的流動池上。如本文中所用,術(shù)語納米通道是指可以遞送核酸分子的窄通道。遞送可牽涉在沿著通道的長度的方向上延伸核酸分子。在一些實(shí)施方案中,鏈的數(shù)目是,或不超過1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000個單獨(dú)的長核酸鏈,或由任何兩個前述值限定的范圍,其被延伸穿過每個納米通道。在一些實(shí)施方案中,單獨(dú)的納米通道被物理屏障隔開,所述物理屏障防止靶核酸的單個長鏈與多個納米通道相互作用。在一些實(shí)施方案中,固體支持物包含,或至少包含,10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000或100000個納米通道,或由任何兩個的上述值限定的范圍。
在一些實(shí)施方案中,已經(jīng)修飾核酸以包括具有切割位點(diǎn)的插入物,并且一旦已經(jīng)將核酸遞送到通道(例如經(jīng)由沿著通道延伸)后,切割位點(diǎn)會得到切割。可以任選地擴(kuò)增所得片段以沿著通道的表面形成簇。然后,可以例如通過在這些通道之一的長度向下追蹤簇,或者以其它方式解決簇在通道表面上的接近性實(shí)施鄰近定位(contiguity mapping)。作為實(shí)例,具有1000個或更多個納米通道的流動池可用于對具有短“定位”讀出的生物體的基因組進(jìn)行測序,所述納米通道在納米通道中具有定位的固定化片段化產(chǎn)物。在一些實(shí)施方案中,納米通道中定位的固定化片段化產(chǎn)物可以用于解析單倍型。在一些實(shí)施方案中,納米通道中定位的固定化片段化產(chǎn)物可用于解決定相問題。
反應(yīng)容器
本文中提供的方法和組合物的一些實(shí)施方案包括用于對靶核酸測序的反應(yīng)容器。在一些實(shí)施方案中,反應(yīng)容器可以包括包含具有附著于其上的多個捕獲探針的表面的基底;以及與所述表面流體連通的反應(yīng)體積,其包含:轉(zhuǎn)座酶,通過使靶核酸與多個轉(zhuǎn)座體接觸而制備的多個模板核酸,每個轉(zhuǎn)座體包含轉(zhuǎn)座子序列和轉(zhuǎn)座酶,以及聚合酶和dNTP或連接酶。在一些實(shí)施方案中,通過轉(zhuǎn)座體片段化的靶核酸在連接之前用聚合酶延伸至少一個堿基。在一些實(shí)施方案中,流動池包括反應(yīng)容器。在一些實(shí)施方案中,反應(yīng)容器可以包括流動池的通道和/或孔。
在一些實(shí)施方案中,在表面上模式化捕獲探針。在一些實(shí)施方案中,捕獲探針被限制在表面上的位點(diǎn)。
在一些實(shí)施方案中,反應(yīng)體積包括配置用于反應(yīng)步驟的液體(例如具有pH緩沖液的水性液體),所述反應(yīng)步驟包括:將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中;用聚合酶延伸模板核酸,隨后連接;以及將所述模板核酸與所述捕獲探針締合。在一些實(shí)施方案中,液體配置用于包括在蛋白酶或SDS的存在下去除轉(zhuǎn)座酶的反應(yīng)步驟。在一些實(shí)施方案中,液體配置用于在重組酶存在下將模板核酸與捕獲探針締合。在一些實(shí)施方案中,液體配置用于擴(kuò)增與捕獲探針締合的模板核酸。在一些實(shí)施方案中,擴(kuò)增是橋式擴(kuò)增。在一些實(shí)施方案中,反應(yīng)體積包括試劑,其用于將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中;用所述聚合酶和/或連接酶延伸所述模板核酸;以及將所述模板核酸與所述捕獲探針締合。在一些實(shí)施方案中,反應(yīng)體積包含在蛋白酶或SDS的存在下除去轉(zhuǎn)座酶的試劑。在一些實(shí)施方案中,反應(yīng)體積包含用于在重組酶存在下將模板核酸與捕獲探針締合的試劑。在一些實(shí)施方案中,反應(yīng)體積包含用于擴(kuò)增與捕獲探針締合的模板核酸的試劑。
在一些實(shí)施方案中,將模板核酸與捕獲探針締合。在一些實(shí)施方案中,捕獲探針包括核酸。在一些實(shí)施方案中,使模板核酸與捕獲探針雜交。在一些實(shí)施方案中,模板核酸的至少一種,捕獲探針的至少一種和/或表面各自包含親和部分。在一些實(shí)施方案中,親和部分選自生物素,抗生物素蛋白和鏈霉抗生物素蛋白。在一些實(shí)施方案中,捕獲探針包含重組酶。在一些實(shí)施方案中,將模板核酸中至少一種的親和部分附著于捕獲探針中的至少一種的親和部分或表面的親和部分。
在一些實(shí)施方案中,轉(zhuǎn)座酶選自Tn5,Tn5的變體,超活性Tn5,Tn10和Mu。在一些實(shí)施方案中,轉(zhuǎn)座子序列包含選自條形碼,測序引物和片段化位點(diǎn)的序列。在一些實(shí)施方案中,轉(zhuǎn)座體包含兩個轉(zhuǎn)座子序列。在一些實(shí)施方案中,轉(zhuǎn)座子序列是不同的。
在一些實(shí)施方案中,靶核酸選自DNA和RNA。在一些實(shí)施方案中,靶核酸選自基因組DNA和cDNA。在一些實(shí)施方案中,靶核酸是基因組DNA。
在一些實(shí)施方案中,表面包含或包含每mm2至少約10,000個模板核酸,每mm2至少約100,000個模板核酸,每mm2至少約1,000,000個模板核酸。
在一些實(shí)施方案中,使用從靶核酸序列的線性表示中的兩個模板核酸獲得的序列信息的接近性來確定模板核酸在表面上的接近性。在一些實(shí)施方案中,表面上彼此更接近的模板核酸確定為包含與較不接近的模板核酸相比在靶核酸序列的表示中更接近的序列。在一些實(shí)施方案中,靶核酸序列的表示包括單倍型或定相信息。
本文中提供的方法和組合物的一些實(shí)施方案包括用于對靶核酸進(jìn)行測序的系統(tǒng),其包含本文中提供的反應(yīng)容器,用于調(diào)節(jié)反應(yīng)容器的溫度的熱循環(huán)儀;和用于收集來自反應(yīng)容器的信號的檢測器。
一些實(shí)施方案還包括處理器,其包括調(diào)節(jié)反應(yīng)容器的溫度以進(jìn)行步驟的的指令,所述步驟包括:將轉(zhuǎn)座子序列轉(zhuǎn)座到靶核酸中,用聚合酶或聚合酶和連接酶的組合延伸模板核酸,以及將模板核酸與捕獲探針或與表面的捕獲部分締合。在一些實(shí)施方案中,調(diào)節(jié)反應(yīng)容器的溫度以進(jìn)行步驟的指令包括擴(kuò)增與捕獲探針締合的模板核酸。在一些實(shí)施方案中,擴(kuò)增是橋式擴(kuò)增。
實(shí)施例
實(shí)施例1:在流動池上進(jìn)行自動化文庫制備
以下實(shí)施例證明了轉(zhuǎn)座文庫的自動化制備和流動池上進(jìn)行文庫測序的實(shí)施方案。
從大腸桿菌分離未剪切的基因組DNA。用各種量的DNA與31.25μl標(biāo)簽化溶液(25μl 2xIllumina Tagment DNA緩沖液;5μl Tn5轉(zhuǎn)座體;0.25μl Taq DNA聚合酶;和1μl 10mM dNTP)制備幾個反應(yīng)體積,總體積為50μl。各種量的DNA包括:2μg,1μg,0.5μg,0.3μg,0.1μg,0.05μg和0.02μg。通過使用cBOT儀器(Illumina,Inc.,San Diego,CA)將每個反應(yīng)體積加載到流動池上。
流動池的初始溫度設(shè)定為20℃,并且所描述的所有溫度變化以1℃/s的變溫速率(ramp rate)進(jìn)行。首先,將160μl洗滌緩沖液以60μl/分鐘流過流動池的每個泳道;并以60μl/分鐘將20μl空氣泵入每個入口管內(nèi)。
將每個50μl反應(yīng)體積泵入相應(yīng)的流動池道中,接著用25μl空氣將反應(yīng)溶液推入流動池上的泳道內(nèi)。將流動池的溫度升高至55℃,然后溫育5分鐘;60℃1分鐘;65℃;1分鐘;70℃1分鐘;和74℃1分鐘。為了將雙鏈DNA產(chǎn)物變性為單鏈DNA,將流動池加熱至94℃持續(xù)5分鐘。為了使單鏈DNA與固定在流動池表面上的表面捕獲寡核苷酸雜交,將流動池的溫度降低至40℃持續(xù)5分鐘。為了通過延伸捕獲寡核苷酸來復(fù)制雜交的DNA分子,將流動池的溫度升高至74℃持續(xù)1.5分鐘。為了從流動池泳道洗滌反應(yīng)溶液,將流動池溫度降低至60℃,并將160μl洗滌緩沖液以60μl/min流過流動池的每個泳道。
用28個等溫橋式擴(kuò)增循環(huán)擴(kuò)增固定的DNA模板。將每個雙鏈簇線性化,用0.1M NaOH除去線性化的P5鏈,通過特異性堿基切割除去反向鏈,留下正向鏈。使測序引物與簇中模板的3'末端上的銜接子上的互補(bǔ)序列雜交。在GAIIx基因組分析儀(Illumina,Inc.San Diego,CA)上進(jìn)行測序,通過合成測序讀取進(jìn)行所配對的末端測序,并持續(xù)36個序列循環(huán)。
表1顯示了測序量度,其中包括高達(dá)約700k/mm2的簇密度和具有可接受水平的簇通過濾光器(PF)和良好質(zhì)量分?jǐn)?shù)(%>=Q30)的簇。觀察到簇密度與所用基因組DNA量之間的逆相關(guān)。表2總結(jié)了結(jié)果并且顯示與大腸桿菌參考基因組成功比對的約93%的簇。用更大量的基因組DNA獲得更長的插入物。圖2A-C分別包括泳道1、2和3的插入物尺寸分布的圖。
表1
表2
實(shí)施例2:從各種基因組DNA來源制備文庫
在本實(shí)施例的實(shí)施方案中,從來自各種生物體的基因組DNA制備轉(zhuǎn)位文庫并測序。該實(shí)施例包括用于使用HiSeq流動池C3F68ACXX(Illumina Inc.,San Diego,CA)進(jìn)行自動化樣品制備實(shí)驗(yàn)的材料和方法。
從各種生物體(包括大腸桿菌,人,紅桿菌屬和蠟狀芽孢桿菌)制備50ng/μl基因組DNA的儲備溶液。紅桿菌屬具有相對富含GC的基因組,并且蠟狀芽孢桿菌具有相對富含AT的基因組。通過混合以下組分制備標(biāo)簽化溶液:132μl H2O;88μl 5X Nextera反應(yīng)緩沖液;8.8μl 10mM dNTP;2.2μl Taq DNA聚合酶(5U/μl);和44μl轉(zhuǎn)座體。用31.25μl標(biāo)簽化溶液和300ng或500ng基因組DNA制備50μl反應(yīng)體積。將每個反應(yīng)體積混合并使用cBOT儀器(Illumina Inc.,San Diego,CA)轉(zhuǎn)移到HiSeq流動池(Illumina Inc.,San Diego,CA)上的泳道。在表3的條件下進(jìn)行標(biāo)簽化和橋式擴(kuò)增反應(yīng)。
表3
獲得測序數(shù)據(jù)。表4和表5各自顯示出了來自流動池上的一些道的區(qū)塊的測序量度。圖3A,3B,3C和3D分別顯示來自大腸桿菌,人,紅桿菌屬和蠟樣芽孢桿菌的基因組DNA的樣品的插入物的缺口大小分布。
在平行實(shí)驗(yàn)中,通過用sybr綠染色顯現(xiàn)流動池上每個泳道的區(qū)塊上的簇,并用熒光顯微鏡成像。圖4顯示用sybr綠染色的流動池上的每個泳道的區(qū)塊,其中反應(yīng)體積含有以下量的DNA:泳道1:300ng大腸桿菌基因組DNA;泳道2:500ng大腸桿菌基因組DNA;泳道3:300ng人基因組DNA;泳道4:500ng人基因組DNA;泳道5:300ng紅桿菌屬基因組DNA;泳道6:500ng紅桿菌屬基因組DNA;泳道7:300ng蠟狀芽孢桿菌基因組DNA;和泳道8:500ng蠟狀芽孢桿菌基因組DNA。
表4
表5
如本文中使用,術(shù)語“包括”與“包含”,“含有”或“特征在于”同義,它們是包括性的或開放式的,并且不排除另外的未記載的要素或方法步驟。
如本文中使用,術(shù)語“每個”當(dāng)用于指代項(xiàng)的集合時,旨在鑒定集合中的單個項(xiàng),但不一定指的是集合中的每個項(xiàng)。如果明確披露或上下文另有明確規(guī)定,則可能發(fā)生例外。
以上描述公開了本發(fā)明的幾種方法和材料。本發(fā)明易于對方法和材料的修改,以及制造方法和設(shè)備的改變??紤]到本公開或本文公開的本發(fā)明的實(shí)踐,此類修改對于本領(lǐng)域技術(shù)人員將變得顯而易見。因此,不意圖本發(fā)明限于本文公開的具體實(shí)施方案,但是它涵蓋了落入本發(fā)明的真實(shí)范圍和精神內(nèi)的所有修改和替代。
本文中引用的所有參考文獻(xiàn),包括但不限于公開的和未公開的申請,專利和文獻(xiàn)參考文獻(xiàn)通過引用以其整體并入本文,并且由此成為本說明書的一部分。在通過引用并入的出版物和專利或?qū)@暾埮c本說明書中包含的公開內(nèi)容相矛盾的程度下,本說明書旨在取代和/或優(yōu)先于任何此類矛盾材料。