本公開一般涉及富集多核苷酸的方法,更具體地涉及使用crispr-cas系統(tǒng)富集多核苷酸的方法及其應(yīng)用。
發(fā)明背景
存在有期望在多核苷酸群體中(例如在全基因組中)富集靶多核苷酸的多種方法和應(yīng)用。此類方法和應(yīng)用包括但不限于確定序列的存在以診斷病癥或疾病。
目前用于序列特異性dna富集的許多方法涉及多個步驟,并且需要相對大量的樣品核酸,并且通常是困難的、繁瑣的、費(fèi)力的、費(fèi)時的、低效的和昂貴的。此外,目前用于雙鏈dna的靶向富集的方法需要在序列特異性靶向之前創(chuàng)建單鏈dna。它們還需要更長的時間將探針與靶dna雜交。因此,需要能夠?qū)崿F(xiàn)快速和有效的序列特異性多核苷酸富集的新方法。本公開通過提供使用crispr-cas系統(tǒng)富集多核苷酸的方法來滿足這種需要。還提供相關(guān)優(yōu)點(diǎn)。
在許多細(xì)菌和古細(xì)菌中,聚簇規(guī)則間隔短回文重復(fù)(crispr)涉及保護(hù)細(xì)胞免受噬菌體和接合接合質(zhì)粒的干擾途徑(marraffiniandsontheimer,2010,natrevgenet.11(3):181-190)。crispr由短重復(fù)序列陣列組成,所述短重復(fù)序列由稱為間隔區(qū)的類似大小的獨(dú)特可變dna序列間隔開,所述序列通常來自噬菌體或質(zhì)粒dna(barrangouetal.,2007,science315:1709-12;bolotinetal.,2005,microbiology151:2551-61;mojicaetal.,2005,jmolevol60:174-82)。因此,crispr序列提供了過去感染的適應(yīng)性、可遺傳的記錄并且表達(dá)crisprrna(crrna)-靶向侵入性核酸的小rna(marraffiniandsontheimer,2010,natrevgenet.11(3):181-190)。crispr通常與編碼與crispr相關(guān)的蛋白質(zhì)的crispr相關(guān)(cas)基因相關(guān)。cas蛋白可以提供破壞由crrna靶向的侵入性外來核酸的機(jī)制。crispr與cas(crispr相關(guān)的)基因一起包含對細(xì)菌和古細(xì)菌中侵入性外來核酸提供獲得性抗性的適應(yīng)性免疫系統(tǒng)(barrangouetal.,2007,science315:1709-12)。
發(fā)明概述
本公開提供了用于富集多核苷酸的方法,并且更具體地涉及使用crispr-cas系統(tǒng)富集靶dna序列的方法及其應(yīng)用。
一方面,本文提供了用于富集靶核酸的方法,包括提供內(nèi)切核酸酶系統(tǒng),所述內(nèi)切核酸酶系統(tǒng)具有:聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,和crispr相關(guān)的(cas)蛋白或其變體,其中所述crrna或其衍生物包含與所述靶核酸的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域;使所述靶核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,并且分離所述復(fù)合物,從而富集所述靶核酸。
在一些實(shí)施方案中,所述方法還包括從復(fù)合物中分離靶核酸。在一些實(shí)施方案中,所述方法還包括擴(kuò)增靶定核酸。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)還包含反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,crrna或其衍生物是含有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,內(nèi)切核酸酶系統(tǒng)是標(biāo)記的。在一些實(shí)施方案中,用生物素標(biāo)記crrna。在一些實(shí)施方案中,本文提供的方法還包括加入鏈霉親合素,從而分離復(fù)合物。在一些實(shí)施方案中,cas蛋白或其衍生物用捕獲標(biāo)簽標(biāo)記。
在一些實(shí)施方案中,一種或多種以下cas9復(fù)合物組分可以用結(jié)合標(biāo)簽標(biāo)記:cas9酶,crrna,tracrrna和靶向置換環(huán)的dna探針標(biāo)記。在一些實(shí)施方案中,結(jié)合標(biāo)簽是生物素或其功能類似物。
在某些實(shí)施方案中,當(dāng)cas9酶用結(jié)合標(biāo)簽標(biāo)記時,蛋白質(zhì)可以是加化學(xué)標(biāo)簽的。例如,cas9可以化學(xué)生物素化。作為另一個實(shí)例,可以通過加入編碼與cas9基因的融合物的額外序列創(chuàng)建融合物。在此類實(shí)施方案中有用的融合物的一個實(shí)例是avitagtm,其采用單一生物素在獨(dú)特的15個氨基酸的肽標(biāo)簽上的高度靶向的酶綴合。
在用結(jié)合標(biāo)簽標(biāo)記crrna的某些實(shí)施方案中,可以使用摻入一種或多種生物素化核苷酸(如生物素化尿嘧啶)的體外轉(zhuǎn)錄(ivt)標(biāo)記整個crrna。在一些實(shí)施方案中,可以將生物素化學(xué)或酶促加入crrna,例如在crrna的3’末端加入2個生物素基團(tuán)(雙生物素)。
在用結(jié)合標(biāo)簽標(biāo)記tracrrna的某些實(shí)施方案中,可以使用摻入一種或多種生物素化核苷酸(如生物素化尿嘧啶)的體外轉(zhuǎn)錄(ivt)標(biāo)記整個tracrrna。在一些實(shí)施方案中,可以將生物素化學(xué)或酶促加入tracrrna,例如在tracrrna的3’端加入2個生物素基團(tuán)(雙生物素)。
在用結(jié)合標(biāo)簽標(biāo)記靶向置換環(huán)的探針的某些實(shí)施方案中,可以通過在寡核苷酸探針的5’端加入生物素基團(tuán)合成具有感興趣的特定序列的寡核苷酸。例如,可以在合成期間將一個或多個生物素化的亞磷酰胺(phosphoramadites)摻入寡核苷酸中。
在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域并且能夠產(chǎn)生雙鏈dna斷裂。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是h840a。在一些實(shí)施方案中,cas9蛋白含有兩個失活的核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,兩個失活的核酸酶結(jié)構(gòu)域包含切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,所述第一突變是d10a,并且所述第二突變是h840a。
在另一方面,本文提供了用于富集靶雙鏈核酸的方法,包括:提供內(nèi)切核酸酶系統(tǒng),所述內(nèi)切核酸酶系統(tǒng)具有:聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,以及crispr相關(guān)(cas)蛋白或其變體,其中所述crrna或其衍生物包含與所述靶雙鏈核酸的第一鏈的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域;使所述靶雙鏈核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成第一復(fù)合物;使標(biāo)記的核酸與所述靶雙鏈核酸的第二鏈雜交以形成第二復(fù)合物,所述靶雙鏈核酸的第二鏈與所述crrna或其衍生物不互補(bǔ),并且分離所述第二復(fù)合物,從而富集靶核酸。
在一些實(shí)施方案中,所述方法還包括從復(fù)合物中分離靶核酸。在一些實(shí)施方案中,所述方法還包括擴(kuò)增靶定核酸。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)還包含反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,如上所述標(biāo)記內(nèi)切核酸酶系統(tǒng)。在一些實(shí)施方案中,用生物素標(biāo)記crrna。在一些實(shí)施方案中,本文提供的方法還包括加入鏈霉親合素,從而分離復(fù)合物。
在一些實(shí)施方案中,cas蛋白或其衍生物用捕獲標(biāo)簽標(biāo)記。在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域并且能夠產(chǎn)生雙鏈核酸斷裂。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是h840a。在一些實(shí)施方案中,cas9蛋白含有兩個失活的核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,兩個失活的核酸酶結(jié)構(gòu)域包含切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,所述第一突變是d10a,并且所述第二突變是h840a。
在一些實(shí)施方案中,本文提供的方法還包括使靶核酸進(jìn)行片段標(biāo)簽化(tagmentingthetargetnucleicacid)。在一些實(shí)施方案中,本文提供的方法還包括加入轉(zhuǎn)座酶,其中所述crrna或其衍生物含有轉(zhuǎn)座子末端。在一些實(shí)施方案中,轉(zhuǎn)座子末端是嵌合末端(me),并且其中轉(zhuǎn)座酶是tn5轉(zhuǎn)座酶。在一些實(shí)施方案中,本文提供的方法還包括將轉(zhuǎn)座子末端加入靶核酸,并使靶核酸進(jìn)行片段標(biāo)簽化,其中所述內(nèi)切核酸酶系統(tǒng)進(jìn)一步包含轉(zhuǎn)座酶。
在一些實(shí)施方案中,轉(zhuǎn)座酶結(jié)合核酸內(nèi)切酶系統(tǒng)的核苷酸序列。在一些實(shí)施方案中,轉(zhuǎn)座酶和cas蛋白形成融合蛋白。在一些實(shí)施方案中,轉(zhuǎn)座子末端是嵌合末端(me),并且其中轉(zhuǎn)座酶是tn5轉(zhuǎn)座酶。
在另一方面,本文提供了用于富集靶核酸的方法,包括:從受試者的血漿或血清獲得細(xì)胞游離dna(cellfreedna,cfdna)群體,所述含有靶核酸的細(xì)胞游離dna群體;提供內(nèi)切核酸酶系統(tǒng),其具有:聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,和crispr相關(guān)的(cas)蛋白或其變體,其中所述crrna或其衍生物包含與靶核酸的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域;使所述靶核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,以及分離所述復(fù)合物,從而富集所述靶核酸。
在一些實(shí)施方案中,靶核酸包含單核苷酸變體(snv)。在一些實(shí)施方案中,該方法還包括從復(fù)合物中分離靶核酸。在一些實(shí)施方案中,所述方法還包括擴(kuò)增靶定核酸。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,如上所述標(biāo)記內(nèi)切核酸酶系統(tǒng)。在一些實(shí)施方案中,用生物素標(biāo)記crrna。在一些實(shí)施方案中,本文提供的方法還包括加入鏈霉親合素,從而分離復(fù)合物。在一些實(shí)施方案中,cas蛋白或其衍生物用捕獲標(biāo)簽標(biāo)記。
在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域并且能夠產(chǎn)生雙鏈dna斷裂。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是h840a。在一些實(shí)施方案中,cas9蛋白含有兩個失活的核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,兩個失活的核酸酶結(jié)構(gòu)域包含切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,所述第一突變是d10a,并且所述第二突變是h840a。
在一些實(shí)施方案中,靶核酸在細(xì)胞游離dna的胎兒細(xì)胞級份中,并且其中所述細(xì)胞游離dna來自母體血漿。在一些實(shí)施方案中,受試者是癌癥患者。
另一方面,本文提供了檢測單核苷酸變體(snv)的方法,包括:從受試者的血漿或血清中獲得細(xì)胞游離dna的群體;提供第一內(nèi)切核酸酶系統(tǒng),其具有:第一聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,和第一crispr相關(guān)的(cas)蛋白或其變體,其中所述第一crrna或其衍生物包含與第一靶核酸的區(qū)域互補(bǔ)的第一靶物特異性核苷酸區(qū)域,并且其中所述第一cas蛋白具有核酸酶活性;使用核酸內(nèi)切酶系統(tǒng)切割第一靶核酸,以及使用聚合酶鏈?zhǔn)椒磻?yīng)(pcr)擴(kuò)增第二靶核酸,其中第二靶核酸包含第一靶核酸的單核苷酸變體形式。
在一些實(shí)施方案中,本文提供的第一內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,本文提供的第一內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,靶核酸是雙鏈dna(dsdna)。在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。
在一些實(shí)施方案中,本文提供的方法還包括:提供第二內(nèi)切核酸酶系統(tǒng),其具有:第二聚類的規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,和第二crispr相關(guān)的(cas)蛋白質(zhì)或其變體,其中所述第二crrna或其衍生物含有與所述第二靶核酸的區(qū)域互補(bǔ)的第二靶物特異性核苷酸區(qū)域;使所述第二靶核酸與所述第二內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,以及分離所述復(fù)合物,從而富集所述第二靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括從復(fù)合物中分離第二靶核酸。在一些實(shí)施方案中,第二內(nèi)切核酸酶系統(tǒng)進(jìn)一步包含反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,第二crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,第二內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,第二靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,如上所述標(biāo)記第二內(nèi)切核酸酶系統(tǒng)。在一些實(shí)施方案中,第二crrna用生物素標(biāo)記。在一些實(shí)施方案中,本文提供的方法還包括加入鏈霉親合素,從而分離復(fù)合物。在一些實(shí)施方案中,第二cas蛋白或其衍生物用捕獲標(biāo)簽標(biāo)記。
在一些實(shí)施方案中,第二cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域并且能夠產(chǎn)生雙鏈核酸斷裂。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是h840a。在一些實(shí)施方案中,cas9蛋白含有兩個失活的核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,兩個失活的核酸酶結(jié)構(gòu)域包含切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,所述第一突變是d10a,并且所述第二突變是h840a。
在一些實(shí)施方案中,靶核酸在細(xì)胞游離dna的胎兒細(xì)胞級份中,并且其中所述細(xì)胞游離dna來自母體血漿。在一些實(shí)施方案中,受試者是癌癥患者。
在另一方面,本文提供了用于標(biāo)記靶核酸的方法,包括提供第一核酸酶系統(tǒng),所述第一核酸酶系統(tǒng)具有:第一聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物,和第一crispr相關(guān)-(cas)蛋白或其變體,其中所述第一crrna或其衍生物包含與所述靶核酸的第一區(qū)互補(bǔ)的第一靶物特異性核苷酸區(qū),并且其中所述第一cas蛋白包含一個失活的核酸酶結(jié)構(gòu)域;使包含所述靶核酸的雙鏈核酸與所述第一核酸酶系統(tǒng)接觸,以在所述靶核酸的第一區(qū)產(chǎn)生第一單鏈切口,并標(biāo)記所述靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括通過標(biāo)記分離靶核酸,從而富集靶核酸。在一些實(shí)施方案中,本文提供的方法還包括擴(kuò)增靶核酸。
在一些實(shí)施方案中,本文提供的第一核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)。在一些實(shí)施方案中,第一crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,第一核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,第一cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體含有一個失活的核酸酶結(jié)構(gòu)域,其包含切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,所述突變是d10a。在一些實(shí)施方案中,第一cas9蛋白或其變體含有一個失活的核酸酶結(jié)構(gòu)域,其在結(jié)構(gòu)域中包含切割與第一crrna不互補(bǔ)的靶核酸鏈的突變。在一些實(shí)施方案中,所述突變是h840a。在一些實(shí)施方案中,本文提供的方法還包括進(jìn)行切口平移。在一些實(shí)施方案中,切口平移通過使用選自dnapol1,bst和taq的切口平移聚合酶進(jìn)行。在一些實(shí)施方案中,切口平移在含有生物素化dntp的反應(yīng)混合物中進(jìn)行。在一些實(shí)施方案中,生物素化的dntp是生物素化的dutp。在一些實(shí)施方案中,本文提供的方法還包括加入磁性鏈霉親合素珠以富集生物素化的靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括提供第二核酸酶系統(tǒng),其具有:第二crrna或其衍生物,和第二cas蛋白或其變體,其中第二crrna或其衍生物包含與所述靶核酸的第二區(qū)互補(bǔ)的第二靶物特異性核苷酸區(qū)域,并且其中所述第二cas蛋白含有一個失活的核酸酶結(jié)構(gòu)域,并使含有所述靶核酸的雙鏈核酸與所述第二核酸酶系統(tǒng)接觸,以在靶核酸的第二區(qū)產(chǎn)生第二單鏈切口,其中所述靶核酸的第一區(qū)不同于所述靶核酸的第二區(qū)。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口在靶核酸的相同鏈上。在一些實(shí)施方案中,靶核酸的相同鏈上的第一單鏈切口和第二單鏈切口之間的間隔為1bp至20bp。在一些實(shí)施方案中,所述方法還包括進(jìn)行切口平移。在一些實(shí)施方案中,切口平移通過使用切口平移聚合酶phi29進(jìn)行。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上;其中所述第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與所述第一crrna互補(bǔ)的靶核酸鏈的所述結(jié)構(gòu)域中的第一突變,并且其中所述第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域包含在切割與第二crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是d10a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上;其中所述第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與所述第一crrna不互補(bǔ)的靶核酸鏈的所述結(jié)構(gòu)域中的第一突變,并且其中所述第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域含有切割與所述第二crrna不互補(bǔ)的所述結(jié)構(gòu)域中的靶核酸鏈。在一些實(shí)施方案中,第一突變和第二突變都是h840a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的不同鏈上;第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與所述第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,所述第一突變是d10a,并且所述第二突變是h840a。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為20bp至500bp。
在一些實(shí)施方案中,本文提供的方法還包括加入捕獲探針;以及用所述捕獲探針交換在所述第一單鏈切口和所述第二單鏈切口之間的單鏈核酸產(chǎn)物,其中所述捕獲探針能夠與同所述單鏈核酸產(chǎn)物互補(bǔ)的核酸雜交。
在一些實(shí)施方案中,捕獲探針的序列與單鏈核酸產(chǎn)物的序列具有10%至100%的同一性。在一些實(shí)施方案中,捕獲探針是生物素化的探針,并且可以如上所述進(jìn)行標(biāo)記。在一些實(shí)施方案中,本文提供的方法還包括加入磁性鏈霉親合素珠以富集靶核酸。在一些實(shí)施方案中,捕獲探針含有突出核苷酸序列,突出核苷酸序列與固定在表面上的寡核苷酸互補(bǔ)。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口在靶核酸的相反鏈上,從而產(chǎn)生第一雙鏈核酸斷裂末端。在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上;第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與所述第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變是d10a,并且第二突變是h840a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相反鏈上;第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,核酸酶結(jié)構(gòu)域包含切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域包含切割與所述第二crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是d10a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相反鏈上;第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,核酸酶結(jié)構(gòu)域包含切割與第一crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas蛋白,所述核酸酶結(jié)構(gòu)域含有在切割與第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是h840a。
在一些實(shí)施方案中,本文提供的方法還包括將銜接頭連接至第一雙鏈dna斷裂末端。在一些實(shí)施方案中,銜接頭是生物素化的。在一些實(shí)施方案中,本文提供的方法還包括加入磁性鏈霉親合素珠以富集靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括提供第三核酸酶系統(tǒng),其具有:第三crrna或其衍生物,和第三cas蛋白或其變體,其中所述第三crrna或其衍生物包含與所述靶核酸的第三區(qū)域基本上互補(bǔ)的第三靶物特異性核苷酸區(qū)域,并且其中所述第三cas蛋白包含一個失活的核酸酶結(jié)構(gòu)域;提供第四核酸酶系統(tǒng),其具有:第四crrna或其衍生物,和第四cas蛋白或其變體,其中所述第四crrna或其衍生物包含與所述靶核酸的第四區(qū)基本上互補(bǔ)的第四靶物特異性核苷酸區(qū),并且其中所述第四cas蛋白含有一個失活的核酸酶結(jié)構(gòu)域;和使含有靶核酸的雙鏈核酸與第三和第四核酸酶系統(tǒng)接觸,以在靶核酸的第三區(qū)域產(chǎn)生第三單鏈切口,在靶核酸的第四區(qū)域產(chǎn)生第四單鏈切口,其中在所述第三單鏈切口和所述第四單鏈切口在所述靶核酸的相反鏈上,從而產(chǎn)生第二雙鏈核酸斷裂末端,所述第二雙鏈核酸斷裂末端不同于第一個雙鏈核酸斷裂末端。在一些實(shí)施方案中,所述方法還包括將銜接頭連接至第二雙鏈核酸斷裂末端。
在另一方面,本文提供了用于富集靶核酸的方法,包括:提供用crrna組編程的cas9蛋白群體,其中所述crrna組含有與靶序列的一系列不同區(qū)域互補(bǔ)的crrna核酸;使靶核酸與用該crrna組編程的cas9蛋白群體接觸以產(chǎn)生一系列核酸片段,并將銜接頭連接到至少一個核酸片段,其中cas9蛋白保留兩個核酸酶結(jié)構(gòu)域。
在一些實(shí)施方案中,該crrna組含有與靶核酸的兩個不同區(qū)域互補(bǔ)的crrna。在一些實(shí)施方案中,靶核酸是雙鏈dna。在一些實(shí)施方案中,靶核酸是基因組dna、染色體dna、基因組或部分基因組。
在另一方面,本文提供了用于對靶核酸進(jìn)行測序的方法,包括:提供用crrna組編程的cas9蛋白群體,其中所述crrna組包含與靶核酸間的一系列不同區(qū)域互補(bǔ)的crrna;使靶核酸與用所述crrna組編程的cas9蛋白群體接觸以產(chǎn)生一系列核酸片段,并對所述一系列核酸片段測序。
在一些實(shí)施方案中,本文提供了用于對靶核酸測序的方法,包括:提供多個cas9蛋白群體,每個cas9蛋白群體用不同的crrna組編程,其中每個crrna組包含與靶核酸間的不同系列區(qū)域互補(bǔ)的crrna;在單獨(dú)的反應(yīng)中使靶核酸與多個cas9蛋白群體中的每一個接觸,以產(chǎn)生不同系列的核酸片段,并對所述核酸片段測序。
在一些實(shí)施方案中,多個cas9蛋白質(zhì)群體包含三個cas9蛋白質(zhì)群體,并且其中由三個cas9蛋白質(zhì)群體中的每一個產(chǎn)生的核酸片段含有與由cas9蛋白的三個群體的至少另一個產(chǎn)生的核酸片段的重疊序列。在一些實(shí)施方案中,cas9蛋白保留兩個核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,靶核酸是雙鏈dna。在一些實(shí)施方案中,靶核酸是基因組dna,染色體dna,基因組或部分基因組。在一些實(shí)施方案中,該方法還包括將銜接頭連接到核酸片段上。在一些實(shí)施方案中,本文提供的方法還包括將含有靶dna的dna樣品稀釋為單倍體含量。在一些實(shí)施方案中,對核酸片段測序包括下列一種或多種:使用通過合成測序,橋式pcr,鏈終止測序,通過雜交測序,納米孔測序和通過連接測序。
附圖簡述
圖1顯示了本文提供的用于使用crispr-cas系統(tǒng)富集靶dna序列的方法。在圖的右部分顯示內(nèi)切核酸酶系統(tǒng)-靶dna復(fù)合物。
圖2a-2b舉例說明了本文提供的使用含有野生型cas9蛋白的crispr-cas系統(tǒng)富集靶dna序列(野生型braf)的方法。在圖2a中,在提供crispr-cas系統(tǒng)之前,首先用alwni消化含有野生型braf序列的質(zhì)粒。在圖2b中,在提供crispr-cas系統(tǒng)之前,首先用bgll消化含有野生型braf序列的質(zhì)粒。圖2c-2d舉例說明了本文提供的使用含有cas9切口酶的crispr-cas系統(tǒng)富集靶dna序列(野生型braf)的方法。圖2c顯示了來自cas9切口酶介導(dǎo)的從nextera質(zhì)粒文庫的片段的富集。圖2d顯示cas9切口酶介導(dǎo)的從nextera質(zhì)粒文庫富集片段的富集結(jié)果。
圖3是示意圖,其顯示了使用crispr-cas系統(tǒng)富集靶dna測序的方法,其中指導(dǎo)rna與靶dna的鏈的結(jié)合參見用于由核酸探針進(jìn)一步標(biāo)記的置換環(huán)。
圖4a-4f顯示了本文提供的方法,其進(jìn)一步包括使靶dna進(jìn)行片段標(biāo)簽化。圖4a顯示了使富集的靶dna進(jìn)行片段標(biāo)簽化的方法。圖4b顯示了使用含有me序列的指導(dǎo)rna的方法。圖4c顯示了使用含有連接到指導(dǎo)rna的tn5二聚體的cripr-cas系統(tǒng)的方法。圖4d顯示了使用含有與cas9蛋白融合的tn5二聚體的cripr-cas系統(tǒng)的方法。圖4e顯示了使用tn5和cas9蛋白質(zhì)富集靶核酸的方法。圖4f顯示了cas9介導(dǎo)的靶向測序的方法,其包括進(jìn)行片段標(biāo)簽化步驟。
圖5是顯示富集和檢測多核苷酸變體的方法的示意圖。
圖6a顯示cas9融合蛋白的表達(dá)。圖6b舉例說明了cas9切口酶(m10)的純化。圖6c-d顯示了測試野生型cas9蛋白和cas9切口酶的活性的活性測定的結(jié)果。圖6e顯示了cas9切口酶的序列特異性。
圖7a-7c顯示了使用cas9切口酶和切口平移富集靶雙鏈dna序列的方法。圖7a是顯示使用cas9切口酶和切口平移的方法的示意圖。圖7b顯示在切口平移期間摻入dgtp和dutp。圖7c顯示cas9切口平移的結(jié)果。
圖8a-8e顯示了使用用于富集靶dna的cas9切口酶在靶dna的相同鏈上產(chǎn)生兩個連續(xù)單鏈切口的方法。圖8a是示意圖,其顯示使用用于富集靶dna的cas9切口酶在靶dna的相同鏈上產(chǎn)生兩個連續(xù)單鏈切口的方法。圖8b顯示了產(chǎn)生雙切口的結(jié)果。圖8c顯示了使用各種cas9切口酶濃度產(chǎn)生雙切口的結(jié)果。圖8d顯示在變性溫度下產(chǎn)生雙切口的結(jié)果。圖8e是顯示cas9切口dna的富集結(jié)果的柱狀圖。
圖9是顯示使用突出端捕獲探針富集靶dna序列的方法的示意圖。
圖10是顯示將dna標(biāo)志(dna條形碼)摻入雙鏈dna的方法的示意圖。
圖11a顯示了使用用于富集靶dna的cas9切口酶在靶dna的相反鏈上產(chǎn)生兩個連續(xù)單鏈切口的方法。圖11b顯示了在進(jìn)行片段標(biāo)簽化之前將片段稀釋為單倍體含量(haploidcontent)的方法。
圖12a顯示了使用多種wtcas9富集雙鏈dna的方法。圖12b-12c顯示了使用crispr-cas系統(tǒng)進(jìn)行dna測序的方法。圖12b是顯示使用cas9介導(dǎo)的dna片段化的靶向測序方法的示意圖。圖12c是顯示使用cas9介導(dǎo)的片段化的靶向單倍型測序的示意圖。
圖13顯示了cas9切割測定的實(shí)例的流程圖;
圖14圖示了圖13的cas9切割測定的步驟;
圖15顯示使用圖13的cas9切割測定單獨(dú)或在包含braf質(zhì)粒dna和基因組dna的混合物中的braf質(zhì)粒dna的片段化的瓊脂糖凝膠的照片;
圖16顯示了圖15的片段化braf質(zhì)粒dna的cas9介導(dǎo)的下拉(富集)的瓊脂糖凝膠的照片;
圖17顯示hindiii消化的噬菌體λdna的片段大小分布的照片;
圖18顯示cas9介導(dǎo)的λhindiii-dna片段的切割的瓊脂糖凝膠的照片;
圖19顯示了圖18的靶向和切割的λdna片段的cas9介導(dǎo)的下拉(富集)的瓊脂糖凝膠的照片;
圖20顯示cas9-切口酶介導(dǎo)的λhindiii片段的下拉的瓊脂糖凝膠的照片;
圖21顯示了用于多重富集的crrna設(shè)計的λdna和9個cas9靶位置的基因組圖譜;
圖22顯示了cas9-切口酶文庫富集方案的流程圖;
圖23顯示對于使用圖22的文庫富集方案制備的λdna富集文庫,百分比總深度和百分比gc含量(作為λ基因組中位置的函數(shù))的圖;
圖24顯示了使用圖22的文庫富集方案制備的基因組文庫中內(nèi)源brafdna序列的富集的柱狀圖;和
圖25顯示了hindiii消化的λdna的crrna設(shè)計和用于crrna合成的ivt反應(yīng)的正向和反向鏈的實(shí)例的數(shù)據(jù)表。
發(fā)明詳述
本公開提供了使用crispr-cas系統(tǒng)的快速和有效富集靶核酸的方法。本公開還提供了使用crispr-cas系統(tǒng)富集和/或檢測多核苷酸變體的方法。本公開進(jìn)一步提供了crispr-cas系統(tǒng)介導(dǎo)的靶向測序的方法。
crispr-cas系統(tǒng)通常可以分為三種主要類型(i-iii型),其基于核心元件含量和序列進(jìn)一步細(xì)分為10個亞型(makarovaetal.,2011,natrevmicrobiol9:467-77)。這些crispr-cas系統(tǒng)的兩個關(guān)鍵元件是cas蛋白和crisprrna(crrna)。crrna由短重復(fù)序列組成,所述短重復(fù)序列與衍生自侵入者dna的間隔序列間插。cas蛋白具有各種活性,例如核酸酶活性。因此,crispr-cas系統(tǒng)提供了用于靶向特定序列以及在序列上的某些酶活性的機(jī)制。
典型的i型crispr-cas系統(tǒng)含有具有單獨(dú)的解旋酶和dna酶活性的cas3蛋白。例如,在1-e型系統(tǒng)中,將crrna摻入稱為級聯(lián)(用于抗病毒防御的crispr相關(guān)復(fù)合物)的多亞基效應(yīng)物復(fù)合物中(brounsetal.,2008,science321:960-4),其結(jié)合靶dna并觸發(fā)cas3蛋白的降解(sinkunasetal.,2011,emboj30:1335-1342;beloglazovaetal.,2011,emboj30:616-627)。
ii型crispr-cas系統(tǒng)包括簽名cas9蛋白(signaturecas9protein),能夠產(chǎn)生crrna并裂解靶dna的單一蛋白質(zhì)(約160kda)。cas9蛋白通常含有兩個核酸酶結(jié)構(gòu)域,靠近氨基末端的ruvc樣核酸酶結(jié)構(gòu)域和靠近蛋白質(zhì)中間的hnh(或mcra樣)核酸酶結(jié)構(gòu)域。cas9蛋白的每個核酸酶結(jié)構(gòu)域?qū)S糜谇懈铍p螺旋的一條鏈(jineketal.,2012,science337(6096):816–821)。
iii型crispr-cas系統(tǒng)含有聚合酶和ramp模塊。iii型系統(tǒng)可以進(jìn)一步分為亞類iii-a和iii-b。iii-a型crispr-cas系統(tǒng)已顯示靶向質(zhì)粒,并且iii-a系統(tǒng)的聚合酶樣蛋白參與靶dna的切割(marraffiniandsontheimer,2008,science322:1843–1845)。類型iii-bcrispr-cas系統(tǒng)也已顯示靶向rna(haleetal.,2009,cell139:945–956)。
本公開部分地涉及利用crispr-cas系統(tǒng)及其衍生物用于靶物特異性富集。在一個實(shí)施方案中,本公開涉及使用衍生自ii型crispr-cas系統(tǒng)的crispr-cas系統(tǒng)富集靶dna。如所討論的,ii型crispr-cas系統(tǒng)包含其他元件中的兩個關(guān)鍵元件:crrna和cas9蛋白。本文提供的crrna和cas9部分都可以由用戶工程化或程序化,實(shí)現(xiàn)本文提供的用于核酸富集,檢測和/或測序的各種方法。
當(dāng)前的靶物特異性富集方案需要在與探針的靶物特異性雜交之前制備單鏈核酸。在本公開提供的各種優(yōu)點(diǎn)中,本公開提供了富集方法,其可以跳過首先產(chǎn)生單鏈核酸的這個步驟,并且能夠直接靶向雙鏈核酸,例如雙鏈dna(dsdna)。直接靶向雙鏈dna(部分或完全雙鏈)的方法與單鏈富集策略相比具有獨(dú)特的優(yōu)點(diǎn)。例如,單鏈基因組dna與靶向區(qū)域的非特異性雜交降低了特異性,并且通常需要大量的嚴(yán)格洗滌或其它耗時的步驟;并且單鏈富集方案通常使用cot-1或其它阻斷dna以減少非特異性雜交。這些添加劑不需要來自雙鏈dna富集方案,降低了所需試劑的成本和數(shù)量。此外,從雙鏈dna制備測序文庫比從單鏈dna更容易。因此,雙鏈dna的富集使得文庫制備(例如,進(jìn)行片段標(biāo)簽化)在富集后發(fā)生。對于另一個實(shí)例,由于特異性(樹狀結(jié)構(gòu)和非特異性雜交是雙鏈dna富集的較少問題,與單鏈dna富集方案相比,潛在更大的dna片段可以更好地特異性富集。若考慮單倍型分型和裝配背景中的靶向測序,則這是特別重要的優(yōu)點(diǎn)。此外,由于可潛在富集更長的dna片段,我們對靶探針設(shè)計的位置具有更大的靈活性,例如,我們可以避免高多態(tài)性區(qū)域,但仍然捕獲這些區(qū)域。此外,需要使用更少的探針來捕獲大區(qū)域,從而降低捕獲探針成本和設(shè)計兩者。
此外,目標(biāo)特異性雜交的目前方案具有緩慢的動力學(xué)并且通常需要高溫。本公開提供了提供更快的動力學(xué)和更容易的富集工作流的酶驅(qū)動序列靶向方法。因為在目前方法中與靶核酸的雜交是酶驅(qū)動的,所以該方法可以等溫發(fā)生。在一些實(shí)施方案中,本文的方法提供在20-37℃的dna的等溫靶向。此外,本文系統(tǒng)中的指導(dǎo)rna(例如crrna)提供序列特異性以及允許多重靶向富集(例如,用多種方式制備的更多探針靶向多個靶向區(qū)域,包括來自寡核苷酸合并物的ivt)的靈活編程。本公開還提供了用于富集和/或檢測具有更高靈敏度和特異性的多核苷酸變體的方法。此外,本發(fā)明還提供了使用crispr-cas系統(tǒng)的靶向測序的方法。
定義
如本文所用,術(shù)語“包括”、“包含”、“含有”、“具有”,及其變型意圖覆蓋非排他性納入,使得包括、包含或含有要素或要素列表的過程、方法、過程產(chǎn)品、物質(zhì)組合物不僅包括那些要素,而且可以包括未明確列出的此類過程、方法、過程產(chǎn)品、物質(zhì)組合物所固有的要素。
如本文所用,單數(shù)形式“一”,“一個”和“該”包括復(fù)數(shù)指示物,除非內(nèi)容另有明確指示。因此,例如,提及“一種蛋白質(zhì)”包括兩種或多種蛋白質(zhì)的混合物等。
如本文所用,術(shù)語“約”或“大約”是指在給定值或范圍的5%內(nèi)。
如本文所用,術(shù)語“核酸”是指核苷酸單體的單鏈和雙鏈聚合物,包括通過核苷酸間磷酸二酯鍵連接的2’-脫氧核糖核苷酸(dna)和核糖核苷酸(rna),或核苷酸間類似物,和相關(guān)的抗衡離子,例如h+,nh4+,三烷基銨,四烷基銨,mg2+,na+等。核酸可以是多核苷酸或寡核苷酸。核酸可以完全由脫氧核糖核苷酸,完全由核糖核苷酸組成,或其嵌合混合物組成。核苷酸單體單元可以包括本文所述的任何核苷酸,包括但不限于天然存在的核苷酸和核苷酸類似物。核酸的大小范圍通常為幾個單體單元,例如5-40個,數(shù)千個單體核苷酸單元。核酸包括但不限于基因組dna,edna,hnrna,mrna,rrna,trna,片段化核酸,從亞細(xì)胞器官如線粒體或葉綠體獲得的核酸,以及從微生物或dna獲得的核酸或rna病毒,其可以存在于生物樣品之上或之中。
如本文所用,術(shù)語“靶核酸”旨在表示作為分析或作用的目標(biāo)的核酸。分析或作用包括使核酸經(jīng)受復(fù)制、擴(kuò)增、測序和/或核酸探詢的其它程序。靶核酸可以包括除了待分析的靶序列之外的核苷酸序列。例如,靶核酸可以包括一個或多個銜接頭,包括作為引物結(jié)合位點(diǎn)的銜接頭,其位于待分析的靶核酸序列的側(cè)翼。與捕獲寡核苷酸或捕獲引物雜交的靶核酸可以含有以下述方式延伸超過捕獲寡核苷酸的5’或3’末端的核苷酸,使得不是所有的靶核酸都適合延伸。
如本文所用,當(dāng)用于指代rna、crrna或其衍生物或其他核苷酸時,術(shù)語“靶物特異性”是指包括靶多核苷酸序列特異性核苷酸序列的多核苷酸,即能夠選擇性退火至靶多核苷酸(例如靶dna)的鑒定區(qū)域的核苷酸序列。靶物特異性核苷酸可以具有單個種類的寡核苷酸,或者其可以包括具有不同序列的兩個或更多個種類。因此,靶物特異性核苷酸可以是兩個或更多個序列,包括3、4、5、6、7、8、9或10個或更多個不同的序列。在一個實(shí)施方案中,crrna或其衍生物包含與靶dna序列的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域。在一個實(shí)施方案中,crrna或其衍生物可以含有除靶物特異性核苷酸區(qū)域之外的其它核苷酸序列。在一個實(shí)施方案中,其他核苷酸序列可以來自tracrrna序列。
如本文所用,術(shù)語“互補(bǔ)的”當(dāng)用于指多核苷酸時意指包括能夠在某些條件下選擇性退火至靶多核苷酸的鑒定區(qū)域的核苷酸序列的多核苷酸。如本文所用,術(shù)語“基本上互補(bǔ)的”和語法等價物旨在表示包括在某些條件下能夠特異性退火至靶多核苷酸的鑒定區(qū)域的核苷酸序列的多核苷酸。退火是指一個核酸與另一個核酸的核苷酸堿基配對相互作用,其導(dǎo)致形成雙鏈體,三鏈體或其他更高序結(jié)構(gòu)。主要相互作用通常是通過watson-crick和hoogsteen型氫鍵鍵合的核苷酸堿基特異性,例如a:t、a:u和g:c。在某些實(shí)施方案中,堿基堆積和疏水相互作用也可以有助于雙鏈體穩(wěn)定性。多核苷酸與靶核酸的互補(bǔ)或基本互補(bǔ)區(qū)域退火的條件是本領(lǐng)域公知的,例如,如nucleicacidhybridization,apracticalapproach,hamesandhiggins,eds.,irlpress,washington,d.c.(1985)和wetmuranddavidson,mol.biol.31:349(1968)中描述。退火條件將取決于具體應(yīng)用,并且可以由本領(lǐng)域技術(shù)人員無需過度的實(shí)驗常規(guī)確定。
如本文所用,術(shù)語“雜交”是指其中兩個單鏈多核苷酸非共價結(jié)合以形成穩(wěn)定的雙鏈多核苷酸的過程。得到的雙鏈多核苷酸是“雜合物”或“雙鏈體”。雜交條件通常包括小于約1m,更通常小于約500mm且可以小于約200mm的鹽濃度。雜交緩沖液包括緩沖鹽溶液,如5%sspe或本領(lǐng)域已知的其它此類緩沖液。雜交溫度可以低至5℃,但通常大于22℃,更通常大于約30℃,通常超過37℃。雜交通常在嚴(yán)格條件(即探針將與其靶亞序列雜交,但不與其它不相容的序列雜交的條件)下進(jìn)行。嚴(yán)格條件是序列依賴性的,并且在不同情況下是不同的,并且可以由本領(lǐng)域技術(shù)人員常規(guī)地確定。
在“多核苷酸”的上下文中,如本文所用的術(shù)語“變體”和“衍生物”是指包含已經(jīng)通過引入核苷酸取代,缺失或添加改變的多核苷酸或多核苷酸的片段的核苷酸序列的多核苷酸。多核苷酸的變體或衍生物可以是包含多核苷酸的核苷酸序列的部分的融合多核苷酸。如本文所用的術(shù)語“變體”或“衍生物”還指已經(jīng)例如通過將任何類型的分子共價附著至多核苷酸化學(xué)修飾的多核苷酸或其片段。例如但不限于,多核苷酸或其片段可以通過例如乙?;?,磷酸化,甲基化等進(jìn)行化學(xué)修飾。變體或衍生物以不同于天然存在的或起始核苷酸或多核苷酸(在所附著的分子的類型或位置上)的方式修飾。變體或衍生物還包括天然存在于核苷酸或多核苷酸上的一個或多個化學(xué)基團(tuán)的缺失。多核苷酸或多核苷酸的片段的變體或衍生物可以使用本領(lǐng)域技術(shù)人員已知的技術(shù)通過化學(xué)修飾進(jìn)行化學(xué)修飾,包括但不限于特異性化學(xué)切割、乙?;?、配制等。此外,多核苷酸或多核苷酸的片段的變體或衍生物可以含有一種或多種dntp或核苷酸類似物。多核苷酸變體或衍生物可以具有與本文所述的多核苷酸或多核苷酸片段相似或相同的功能。與本文所述的多核苷酸或多核苷酸的片段相比,多核苷酸變體或衍生物可具有額外的或不同的功能。
如本文所用,術(shù)語“dntp”是指脫氧核苷三磷酸。ntp是指核糖核苷三磷酸,例如用于合成crrna或tracrrna的那些。嘌呤堿基(pu)包括腺嘌呤(a)、鳥嘌呤(g)及其衍生物和類似物。嘧啶堿基(py)包括胞嘧啶(c)、胸腺嘧啶(t)、尿嘧啶(u)及其衍生物和類似物。通過說明而非限制的方式,這些衍生物或類似物的實(shí)例是用報告基團(tuán)修飾、生物素化、胺修飾、放射性標(biāo)記、烷基化的那些衍生物或類似物,并且還包括硫代磷酸酯、亞磷酸酯(phosphate)、環(huán)原子修飾的衍生物。報道基團(tuán)可以是熒光基團(tuán)如熒光素,化學(xué)發(fā)光基團(tuán)如魯米諾(luminal),鋱螯合劑如n-(羥乙基)乙二胺三乙酸,其能夠通過延遲熒光檢測,等等。
如本文所用,術(shù)語“核苷酸類似物”是指具有修飾的核苷酸堿基部分,修飾的戊糖部分和/或修飾的磷酸酯部分,并且在多核苷酸的情況下,修飾的核苷酸間連接的合成類似物,如其他地方一般性描述的(例如scheit,nucleotideanalogs,johnwiley,newyork,1980;englisch,angew.chem.int.ed.engl.30:613-29,1991;agarwal,protocolsforpolynucleotidesandanalogs,humanapress,1994;以及s.vermaandf.eckstein,ann.rev.biochem.67:99-134,1998)。示例性的磷酸類似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯,二硒代磷酸酯、苯胺磷酸硫醇酯(phosphoroanilothioate)、苯胺磷酸酯(phosphoranilidate)、氨基磷酸酯、硼磷酸酯,包括相關(guān)的抗衡離子,例如h+、nh4+、na+(若存在此類抗衡離子的話)。示例性修飾的核苷酸堿基部分包括但不限于5-甲基胞嘧啶(5mc);c-5-丙炔基類似物,包括但不限于c-5丙炔基-c和c-5丙炔基-u;2,6-二氨基嘌呤,也稱為2-氨基腺嘌呤或2-氨基-da);次黃嘌呤,假尿苷,2-硫代嘧啶,異胞嘧啶(isoc),5-甲基異c和異鳥嘌呤(isog;參見例如美國專利號5,432,272)。示例性的修飾的戊糖部分包括但不限于鎖核酸(lna)類似物,包括但不限于bz-a-lna,5-me-bz-c-lna,dmf-g-lna和t-lna(參見例如theglenreport,16(2):5,2003;koshkinetal.,tetrahedron54:3607-30,1998)和2’-或3’-修飾,其中2’-或3’-位是氫,羥基,烷氧基(例如甲氧基,乙氧基,烯丙氧基,異丙氧基,丁氧基,異丁氧基和苯氧基),疊氮基,氨基,烷基氨基,氟,氯或溴。修飾的核苷酸間連接包括磷酸酯類似物,具有非手性和不帶電亞基間連接的類似物(例如sterchak,e.p.etal.,organicchern.,52:4202,1987)和具有非手性亞基間連接的不帶電荷的基于嗎啉代的聚合物(參見,美國專利號5,034,506)。一些核苷酸間連接類似物包括嗎啉酯,縮醛和聚酰胺連接的雜環(huán)。
如本文所用,術(shù)語“連接”及其語法等價物旨在表示在兩個或更多個核酸(例如寡核苷酸和/或多核苷酸)的末端之間形成共價鍵或連接,通常在模板驅(qū)動的反應(yīng)中。鍵或連接的性質(zhì)可以廣泛變化,并且連接可以酶促或化學(xué)地進(jìn)行。如本文所用,通常進(jìn)行酶促連接以在一個寡核苷酸的5’碳末端核苷酸與另一個核苷酸的3’碳之間形成磷酸二酯連接。模板驅(qū)動的連接反應(yīng)描述于以下參考文獻(xiàn)中:美國專利號4,883,750;5,476,930;5,593,826;和5,871,921,其全部內(nèi)容通過引用并入本文。術(shù)語“連接”還包括磷酸二酯鍵的非酶形成,以及寡核苷酸末端之間的非磷酸二酯共價鍵的形成,如硫代磷酸酯鍵,二硫鍵等。
如本文所用,術(shù)語“銜接頭”是可以連接到其他核酸末端的單鏈或雙鏈核酸分子。在一個實(shí)施方案中,銜接頭是短的,化學(xué)合成的雙鏈核酸分子,其可用于連接兩個其他核酸分子的末端。在一個實(shí)施方案中,銜接頭是在5’和/或3’末端包含單鏈核苷酸突出端的雙鏈核酸(例如,寡核苷酸)。在一些實(shí)施方案中,單鏈突出端是1、2或更多個核苷酸。在一些實(shí)施方案中,銜接頭包含用于克隆或分析“插入物”的另外的核酸序列。在一些實(shí)施方案中,銜接頭包含用于分析或純化“插入物”的標(biāo)記或親和標(biāo)簽。術(shù)語“插入物”指感興趣的核酸序列。在一些實(shí)施方案中,插入物是在5’和/或3’末端包含單鏈核苷酸突出端的雙鏈dna。在一些實(shí)施方案中,單鏈突出端是1、2或更多個核苷酸。
如本文所用,術(shù)語“切口平移”是指通過使用聚合酶用其標(biāo)記的類似物替換來自單鏈核酸缺口的核酸的一些核苷酸,產(chǎn)生有標(biāo)簽的核酸序列的過程。術(shù)語“切口平移聚合酶”是指在切口平移過程中使用的聚合酶,例如dna聚合酶。在一個實(shí)施方案中,切口平移聚合酶是dna聚合酶i,其延長3’羥基末端,通過5’-3’核酸外切酶活性除去核苷酸,用dntp替代它們。
如本文所用,術(shù)語“片段標(biāo)簽化”是指在準(zhǔn)備好通過使用轉(zhuǎn)座酶介導(dǎo)的片段化和標(biāo)簽化測序和簇形成的溶液中將核酸(例如dna)轉(zhuǎn)化為銜接頭修飾的模板。該過程通常涉及通過轉(zhuǎn)座酶復(fù)合物修飾核酸,所述轉(zhuǎn)座酶復(fù)合物包含與包含轉(zhuǎn)座子末端序列的銜接頭復(fù)合的轉(zhuǎn)座酶。片段標(biāo)簽化導(dǎo)致核酸的同時片段化和銜接頭與雙鏈體片段的兩條鏈的5’端的連接。在除去轉(zhuǎn)座酶的純化步驟之后,通過pcr將另外的序列加入加銜接片段的末端。
如本文所用,術(shù)語“轉(zhuǎn)座體復(fù)合物”是指非共價結(jié)合于雙鏈核酸的轉(zhuǎn)座酶。例如,復(fù)合物可以是在支持非共價復(fù)合物形成的條件下與雙鏈轉(zhuǎn)座子dna預(yù)溫育的轉(zhuǎn)座酶。雙鏈轉(zhuǎn)座子dna可以包括但不限于tn5dna,tn5dna的一部分,轉(zhuǎn)座子末端組合物,轉(zhuǎn)座子末端組合物的混合物或能夠與轉(zhuǎn)座酶(如超活性tn5轉(zhuǎn)座酶)相互作用的其他雙鏈dna。
“轉(zhuǎn)座酶”是指能夠與含有轉(zhuǎn)座子末端的組合物(例如轉(zhuǎn)座子,轉(zhuǎn)座子末端,轉(zhuǎn)座子末端組合物)形成功能性復(fù)合物并催化含有轉(zhuǎn)座子末端的組合物插入或轉(zhuǎn)座成與其例如在體外轉(zhuǎn)座反應(yīng)中一起溫育的雙鏈靶核酸的酶。如本文所示的轉(zhuǎn)座酶還可以包括來自反轉(zhuǎn)錄轉(zhuǎn)座子(retrotransposons)和逆轉(zhuǎn)錄病毒的整合酶。轉(zhuǎn)座酶、轉(zhuǎn)座體和轉(zhuǎn)座體復(fù)合物通常是本領(lǐng)域技術(shù)人員已知的,如us2010/0120098的公開內(nèi)容所例示的,其內(nèi)容通過引用整體并入本文。盡管本文描述的許多實(shí)施方案涉及tn5轉(zhuǎn)座酶和/或超活性tn5轉(zhuǎn)座酶,但應(yīng)當(dāng)理解,出于其意圖的目的能夠以足夠的效率插入轉(zhuǎn)座子末端以將靶核酸進(jìn)行5’標(biāo)簽化和片段化的任何轉(zhuǎn)座系統(tǒng)可用于本發(fā)明。在具體的實(shí)施方案中,優(yōu)選的轉(zhuǎn)座系統(tǒng)能夠?qū)⑥D(zhuǎn)座子末端以隨機(jī)或幾乎隨機(jī)的方式插入以將靶核酸進(jìn)行5’-標(biāo)簽化和片段化。
如本文所用,術(shù)語“轉(zhuǎn)座反應(yīng)”是指其中一個或多個轉(zhuǎn)座子插入靶核酸,例如在隨機(jī)位點(diǎn)或幾乎隨機(jī)位點(diǎn)的反應(yīng)。轉(zhuǎn)座反應(yīng)中的基本成分是轉(zhuǎn)座酶和dna寡核苷酸,其展示轉(zhuǎn)座子的核苷酸序列,包括轉(zhuǎn)移的轉(zhuǎn)座子序列及其互補(bǔ)序列(非轉(zhuǎn)移的轉(zhuǎn)座子末端序列)以及形成功能轉(zhuǎn)座或轉(zhuǎn)座體復(fù)合物所需的其它成分。根據(jù)需要或期望,dna寡核苷酸可以進(jìn)一步包含額外的序列(例如,銜接頭或引物序列)。在一些實(shí)施方案中,本文提供的方法通過使用由高活性tn5轉(zhuǎn)座酶和tn5型轉(zhuǎn)座子末端形成的轉(zhuǎn)座復(fù)合物(goryshinandreznikoff,1998,j.biol.chem.,273:7367)或通過mua轉(zhuǎn)座酶和包含r1和r2末端序列的mu轉(zhuǎn)座子末端(mizuuchi,1983,cell,35:785;savilahtietal.,1995,emboj.,14:4893)例示。然而,出于其意圖的目的能夠以隨機(jī)或幾乎隨機(jī)的方式以足夠的效率插入轉(zhuǎn)座子末端以對靶dna進(jìn)行5’-標(biāo)簽化和片段化的任何轉(zhuǎn)座系統(tǒng)都可以用于本發(fā)明??捎糜诒痉椒ǖ谋绢I(lǐng)域已知的轉(zhuǎn)座系統(tǒng)的實(shí)例包括但不限于金黃色葡萄球菌tn552(colegioetal.,2001,jbacterid.,183:2384-8;kirbyetal.,2002,moimicrobiol,43:173-86),tyi(devineandboeke,1994,nucleicacidsres.,22:3765-72andinternationalpatentapplicationno.wo95/23875),轉(zhuǎn)座子tn7(craig,1996,science.271:1512;craig,1996,reviewin:currtopmicrobiolimmunol,204:27-48),tn10和is10(kleckneretal.,1996,currtopmicrobiolimmunol,204:49-82),mariner轉(zhuǎn)座酶(lampeetal.,1996,emboj.,15:5470-9),tci(plasterk,1996,currtopmicrobiolimmunol,204:125-43),p元件(gloor,2004,methodsmoibiol,260:97-114),tnj(ichikawaandohtsubo,1990,jbiolchem.265:18829-32),細(xì)菌插入序列(ohtsuboandsekine,1996,curr.top.microbiol.immunol.204:1-26),逆轉(zhuǎn)錄病毒(brownetal.,1989,procnatlacadsciusa,86:2525-9)和酵母的反轉(zhuǎn)錄轉(zhuǎn)座子(boekeandcorces,1989,annurevmicrobiol.43:403-34)。用于將轉(zhuǎn)座子末端插入靶序列的方法可以使用任何合適的轉(zhuǎn)座子系統(tǒng)在體外進(jìn)行,對于所述轉(zhuǎn)座子系統(tǒng)可獲得合適的體外轉(zhuǎn)座系統(tǒng)或可以基于本領(lǐng)域的知識開發(fā)。通常,用于本文提供的方法中的合適的體外轉(zhuǎn)座系統(tǒng)至少需要具有足夠純度,足夠濃度和足夠的體外轉(zhuǎn)座活性的轉(zhuǎn)座酶和轉(zhuǎn)座酶藉此與具有能夠催化轉(zhuǎn)座反應(yīng)的相應(yīng)轉(zhuǎn)座酶形成功能性復(fù)合物的轉(zhuǎn)座子末端??捎糜诒景l(fā)明的合適的轉(zhuǎn)座酶轉(zhuǎn)座子末端序列包括但不限于與轉(zhuǎn)座酶形成復(fù)合物的野生型,衍生物或突變體轉(zhuǎn)座子末端序列,所述轉(zhuǎn)座酶選自轉(zhuǎn)座酶的野生型,衍生物或突變形式。
術(shù)語“轉(zhuǎn)座子末端”(te)指僅展現(xiàn)出與轉(zhuǎn)座酶或整合酶形成復(fù)合物必需的核苷酸序列(“轉(zhuǎn)座子末端序列”)的雙鏈核酸,例如雙鏈dna,所述轉(zhuǎn)座酶或整合酶在體外轉(zhuǎn)座反應(yīng)中具有功能。在一些實(shí)施方案中,轉(zhuǎn)座子末端能夠在轉(zhuǎn)座反應(yīng)中與轉(zhuǎn)座酶形成功能性復(fù)合物。作為非限制性實(shí)例,轉(zhuǎn)座子末端可包括19-bp外端(“oe”)轉(zhuǎn)座子末端、內(nèi)端(“ie”)轉(zhuǎn)座子末端或“嵌合末端(mosaicend)”轉(zhuǎn)座子末端(其由突變體或突變體tn5轉(zhuǎn)座酶識別),或r1和r2轉(zhuǎn)座子末端,如us2010/0120098的公開內(nèi)容中列出,其內(nèi)容通過引用整體并入本文。轉(zhuǎn)座子末端可以包括適合于在體外轉(zhuǎn)座反應(yīng)中與轉(zhuǎn)座酶或整合酶形成功能性復(fù)合物的任何核酸或核酸類似物。例如,轉(zhuǎn)座子末端可以包括dna,rna,修飾的堿基,非天然堿基,修飾的主鏈,并且可以包括一條或兩條鏈中的切口。雖然術(shù)語“dna”有時與轉(zhuǎn)座子末端的組成結(jié)合在本公開中使用,但應(yīng)理解任何合適的核酸或核酸類似物可用于轉(zhuǎn)座子末端。
如本文所用,術(shù)語“固體表面”,“固體支持物”和其它語法等價物在本文中是指適合于或可修飾為適合于附著多核苷酸的任何材料??赡艿幕装ǖ幌抻诓AШ透男曰蚬δ芑A?,塑料(包括丙烯酸樹脂,聚苯乙烯和苯乙烯和其它材料的共聚物,聚丙烯,聚乙烯,聚丁烯,聚氨酯,teflontm等),多糖,尼龍或硝化纖維,陶瓷,樹脂,二氧化硅或基于二氧化硅的材料,包括硅和改性硅,碳,金屬,無機(jī)玻璃,塑料,光纖束和多種其它聚合物。在一些實(shí)施方案中,固體支持物和固體表面位于流動池裝置內(nèi)。在一些實(shí)施方案中,固體支持物包含適合于以有序模式固定化分子的圖案化表面?!皥D案化表面”是指在固體支持物的暴露層中或上的不同區(qū)域的排列。在一些實(shí)施方案中,固體支持物包括表面中的孔或凹陷的陣列。固體支持物的組成和幾何形狀可隨其用途而變化。在一些實(shí)施方案中,固體支持物是平面結(jié)構(gòu),如載玻片,芯片,微芯片和/或陣列。因此,基底的表面可以是平面層的形式。在一些實(shí)施方案中,固體支持物包含流動池的一個或多個表面。如本文所用的術(shù)語“流通池”是指包括一種或多種流體試劑可以流過的固體表面的室。可容易地用于本公開的方法中的流動池和相關(guān)流體系統(tǒng)和檢測平臺的實(shí)例描述于例如bentleyetal.,nature456:53-59(2008),wo04/018497;us7,057,026;wo91/06678;wo07/123744;us7,329,492;us7,211,414;us7,315,019;us7,405,281,以及us2008/0108082,其各自通過引用并入本文。在一些實(shí)施方案中,固體支持物或其表面是非平面的,如管或容器的內(nèi)表面或外表面。在一些實(shí)施方案中,固體支持物包含微球或珠。本文中的“微球”,“珠”,“顆?!被蛘Z法等價物旨在表示由各種材料制成的小離散顆粒,包括但不限于塑料,陶瓷,玻璃和聚苯乙烯。在某些實(shí)施方案中,微球體是磁性微球體或珠粒。或者/另外,珠??梢允嵌嗫椎?。珠粒尺寸范圍從納米,例如100nm,至幾毫米,例如1mm。
如本文所用,術(shù)語“crispr-cas系統(tǒng)”是指下述酶系統(tǒng),其包括含有與靶多核苷酸區(qū)域互補(bǔ)或基本互補(bǔ)的核苷酸序列的引導(dǎo)rna序列和具有核酸酶活性的蛋白質(zhì)。crispr-cas系統(tǒng)包括i型crispr-cas系統(tǒng),ii型crispr-cas系統(tǒng),iii型crispr-cas系統(tǒng)及其衍生物crispr-cas系統(tǒng)包括衍生自天然產(chǎn)生的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)可含有工程化和/或程序化的指導(dǎo)rna。
如本文所用,術(shù)語“指導(dǎo)rna”是指含有與靶dna序列的區(qū)域互補(bǔ)或基本互補(bǔ)的序列的rna。指導(dǎo)rna可以含有除了與靶dna序列的區(qū)域互補(bǔ)或基本上互補(bǔ)的區(qū)域以外的核苷酸序列。指導(dǎo)rna可以是crrna或其衍生物,例如crrna:tracrrna嵌合體。
如本文所用,術(shù)語“核酸酶”是指能夠切割核酸的核苷酸亞基之間的磷酸二酯鍵的酶;術(shù)語“內(nèi)切核酸酶”是指能夠切割多核苷酸鏈內(nèi)的磷酸二酯鍵的酶;并且術(shù)語“切口酶”是指僅切割dna雙鏈體的單鏈的內(nèi)切核酸酶。術(shù)語“cas9切口酶”是指衍生自cas9蛋白的切口酶,通常通過使cas9蛋白的一個核酸酶結(jié)構(gòu)域失活。
在多肽的上下文中,如本文所用的術(shù)語“變體”和“衍生物”是指包含已經(jīng)通過引入氨基酸殘基取代,缺失或添加改變的多肽或多肽片段的氨基酸序列的多肽。多肽的變體或衍生物可以是包含多肽的氨基酸序列的部分的融合蛋白。本文所用的術(shù)語“變體”或“衍生物”還指多肽或多肽的片段,其已經(jīng)例如通過將任何類型的分子共價附著至多肽而化學(xué)修飾。例如但不限于,多肽或多肽片段可以通過例如糖基化、乙?;⒕垡叶蓟?、磷酸化、酰胺化,通過已知的保護(hù)/封閉基團(tuán)的衍生化、蛋白水解切割、與細(xì)胞配體或其它蛋白質(zhì)連接等化學(xué)修飾。變體或衍生物以不同于天然存在的或起始的肽或多肽(在附著的分子的類型或位置上)的方式修飾。變體或衍生物進(jìn)一步包括天然存在于肽或多肽上的一個或多個化學(xué)基團(tuán)的缺失。可以使用本領(lǐng)域技術(shù)人員已知的技術(shù)通過化學(xué)修飾來化學(xué)修飾多肽或多肽的片段的變體或衍生物,所述技術(shù)包括但不限于特異性化學(xué)切割,乙?;?,配制,衣霉素(tunicamycin)的代謝合成等。此外,多肽或多肽的片段的變體或衍生物可以含有一個或多個非經(jīng)典氨基酸。多肽變體或衍生物可以具有與本文所述多肽或多肽片段相似或相同的功能。與本文所述多肽或多肽片段相比,多肽變體或衍生物可具有額外的或不同的功能。
如本文所用,術(shù)語“標(biāo)記”是指此類過程,其中修飾組分(例如rna或蛋白質(zhì)),例如結(jié)合另一分子,以便于促進(jìn)該組分及其相關(guān)元件的分離。在一個實(shí)施方案中,標(biāo)記crispr-cas系統(tǒng)中的rna。在一些實(shí)施方案中,用生物素化的dntp標(biāo)記rna。在一些實(shí)施方案中,用另一多核苷酸探針標(biāo)記rna。多核苷酸探針可以包含與rna的區(qū)域基本上互補(bǔ)的序列。在一些實(shí)施方案中,用銜接頭標(biāo)記rna末端。在一個實(shí)施方案中,蛋白質(zhì)(例如cas蛋白)用捕獲標(biāo)簽標(biāo)記。如本文所用的術(shù)語“捕獲標(biāo)簽”是指在下拉方案中用作靶物的分子。在一些實(shí)施方案中,捕獲標(biāo)簽是親和標(biāo)簽。如本文所用的術(shù)語“親和標(biāo)簽”是指在某些條件下(稱為“結(jié)合條件”)對另一物質(zhì)具有親和力并“結(jié)合”以形成“特異性結(jié)合對”的分子。例如,生物素和鏈霉親合素,生物素和親合素或地高辛(digoxigenin)和結(jié)合地高辛的特異性抗體是“特異性結(jié)合對”的實(shí)例。
在一些實(shí)施方案中,一種或多種以下cas9復(fù)合物組分可以用結(jié)合標(biāo)簽標(biāo)記:cas9酶,crrna,tracrrna和靶向置換環(huán)的dna探針標(biāo)記。在一些實(shí)施方案中,結(jié)合標(biāo)簽是生物素或其功能類似物。
在用結(jié)合標(biāo)簽標(biāo)記cas9酶的某些實(shí)施方案中,可以對蛋白質(zhì)以化學(xué)方式加標(biāo)簽。例如,化學(xué)生物素化cas9可以。作為另一個實(shí)例,可以通過添加編碼與cas9基因的融合物的額外序列參見融合。在這些實(shí)施方案中有用的融合物的一個實(shí)例是avitagtm,其采用單一生物素在獨(dú)特的15個氨基酸的肽標(biāo)簽上的高度靶向的酶綴合。
在用結(jié)合標(biāo)簽標(biāo)記crrna的某些實(shí)施方案中,可以使用摻入一種或多種生物素化核苷酸(如例如生物素化尿嘧啶)的體外轉(zhuǎn)錄(ivt)標(biāo)記整個crrna。在一些實(shí)施方案中,生物素可以化學(xué)或酶促加入crrna,例如在crrna的3’末端加入2個生物素基團(tuán)(雙生物素)。
在用結(jié)合標(biāo)簽標(biāo)記tracrrna的某些實(shí)施方案中,可以使用摻入一種或多種生物素化核苷酸(例如生物素化尿嘧啶)的體外轉(zhuǎn)錄(ivt)標(biāo)記整個tracrrna。在一些實(shí)施方案中,生物素可以化學(xué)或酶促加入tracrrna中,例如在tracrrna的3’端加入2個生物素基團(tuán)(雙生物素)。
在用結(jié)合標(biāo)簽標(biāo)記靶向置換環(huán)的探針的某些實(shí)施方案中,可以通過在寡核苷酸探針的5’端加入生物素基團(tuán)來合成具有感興趣的特定序列的寡核苷酸。例如,可以在合成期間將一個或多個生物素化的磷酸酰胺摻入寡核苷酸中。
如本文所用,在富集靶多核苷酸的上下文中,術(shù)語“富集”是指在多核苷酸群體中導(dǎo)致更高百分比的靶多核苷酸的過程。在一個實(shí)施方案中,百分比增加約5%,10%,20%,30%,40%,50%,60%,70%,80%,90%或100%。在一個實(shí)施方案中,百分比增加約2倍,5倍,10倍,50倍或100倍。在一個實(shí)施方案中,靶多核苷酸基本上從多核苷酸群體中分離。
如本文所用,術(shù)語“檢測”核酸分子或其片段是指確定核酸分子的存在,通常當(dāng)核酸分子或其片段已經(jīng)完全或部分地與樣品或組合物分開,并且還可以包括確定核酸分子或其片段的電荷與質(zhì)量比,質(zhì)量,量,吸光度,熒光或其它性質(zhì)。
如本文所用,術(shù)語“單核苷酸多態(tài)性(snp)”是指當(dāng)基因組(或其他共有序列)中的單個核苷酸-a,t,c或g在物種成員之間(或個體中配對的染色體之間)不同時發(fā)生的dna序列變異。
如本文所用,術(shù)語“單核苷酸變體(snv)”是指包括單核苷酸多態(tài)性(snp)或點(diǎn)突變位點(diǎn)的一種基因型或多核苷酸。
如本文所用,術(shù)語“受試者”和“患者”可互換使用。如本文所用,受試者優(yōu)選為哺乳動物,例如非靈長類動物(例如牛,豬,馬,貓,狗,大鼠等)或靈長類動物(例如猴和人)。在具體實(shí)施方案中,受試者是人。在一個實(shí)施方案中,受試者是具有癌癥的哺乳動物(例如,人)。
如本文所用,術(shù)語“單倍型”,“單倍體基因型”和本文其他語法等價物是指存在于單個母本或父本染色體上的一組核苷酸序列多態(tài)性或等位基因,通常作為單位遺傳。
如本文所用,當(dāng)在基因組或染色體的上下文中使用時,術(shù)語“定相測序”,“單倍型測序”和其他語法等價物是指分別確定單個基因組或單個染色體的核酸序列,其中核酸序列從單個基因組或單個染色體的測序獲得。當(dāng)在染色體片段的上下文中使用時,術(shù)語“定相測序”,“單元型測序”和其它語法等價物是指確定單個染色體片段的核酸序列,其中該核酸序列是從單個染色體片段的測序獲得。
富集多核苷酸的方法
在一個方面,本公開提供了使用衍生自crispr-cas系統(tǒng)的內(nèi)切核酸酶系統(tǒng)富集靶核酸的方法。本公開部分地基于crispr-cas系統(tǒng)與靶核酸特異性結(jié)合的能力。通過crispr-cas系統(tǒng)的這種靶物特異性結(jié)合提供了有效富集靶核酸的方法,例如通過下拉與靶核酸相關(guān)的crispr-cas元件。crispr-cas介導(dǎo)的核酸富集繞過傳統(tǒng)上在靶物特異性結(jié)合之前產(chǎn)生單鏈核酸的所需步驟,并且能夠直接靶向雙鏈核酸,如雙鏈dna(dsdna)。此外,crispr-cas介導(dǎo)的核酸結(jié)合是酶驅(qū)動的,因此它可以提供更快的動力學(xué)和更容易的工作流程用于在較低溫度和/或等溫反應(yīng)條件下富集。
在一個實(shí)施方案中,本公開提供了用于富集靶核酸的方法,包括:提供具有聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物的內(nèi)切核酸酶系統(tǒng),和crispr相關(guān)(cas)蛋白或其變體,其中所述crrna或其衍生物包含與所述靶核酸的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域;使所述靶核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,以及分離所述復(fù)合物,從而富集所述靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括從復(fù)合物中分離靶核酸。在一個實(shí)施方案中,一旦crispr-cas系統(tǒng)已經(jīng)發(fā)現(xiàn)靶定區(qū)域,則其可以結(jié)合到表面,例如在平板中。這可以防止復(fù)合物過早解離,從而提高捕獲的效率。在一些實(shí)施方案中,本文提供的方法還包括擴(kuò)增靶核酸序列。
如圖1所示,提供了crispr-cas系統(tǒng),例如ii型crispr-cas系統(tǒng),并且酶系統(tǒng)接觸靶dna以形成復(fù)合物。圖1的右側(cè)部分顯示了crispr-cas系統(tǒng)-靶dna復(fù)合物。如圖所示,引導(dǎo)rna用例如生物素化的dutp標(biāo)記,因此可以通過下拉標(biāo)記的rna來分離復(fù)合物。
在一些實(shí)施方案中,本文提供的靶核酸是雙鏈dna(dsdna)。某些crispr-cas系統(tǒng),例如ii型crispr-cas系統(tǒng),以酶驅(qū)動和序列特異性方式結(jié)合雙鏈dna。因此,本文提供的一個優(yōu)點(diǎn)是直接靶向雙鏈dna,而不是加工的單鏈dna,用于富集。
本文提供的內(nèi)切核酸酶系統(tǒng)衍生自crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是i型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是iii型crispr-cas系統(tǒng)或其衍生物。本文提供的crispr-cas系統(tǒng)包括衍生自天然存在的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)還可以包含工程化和/或程序化的指導(dǎo)rna。例如,在一些實(shí)施方案中,使用含有t7啟動子的合成雙鏈dna模板,通過體外轉(zhuǎn)錄合成crrna和tracrrna。tracrrna具有固定序列,而靶序列指示crrna序列的部分。將等摩爾的crrna和tracrrna混合并在55℃加熱30秒。cas9在37℃下以相同的摩爾濃度加入,并與rna混合物溫育10分鐘。然后將10-20倍摩爾過量的cas9復(fù)合物加入靶dna中。切割/結(jié)合反應(yīng)可以在15分鐘內(nèi)發(fā)生。
crispr-cas系統(tǒng)的關(guān)鍵要素包括指導(dǎo)rna,例如crrna和cas蛋白。crrna或其衍生物包含與靶核酸的區(qū)域互補(bǔ)或基本上互補(bǔ)的靶物特異性核苷酸區(qū)域。在一些實(shí)施方案中,crrna或其衍生物包含允許將酶特異性靶向互補(bǔ)雙鏈dna的用戶可選擇的rna序列。在一些實(shí)施方案中,用戶可選擇的rna序列含有與靶dna序列的區(qū)域互補(bǔ)或基本上互補(bǔ)的20-50個核苷酸。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的100%堿基對匹配。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的90%-100%,80%-100%或70%-100%的堿基對匹配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在一個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在兩個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在三個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在四個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在五個堿基對錯配。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,本文提供的crrna或其衍生物是具有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。嵌合單指導(dǎo)rna(sgrna)描述于jineketal.,2012,science337,816-821中,其全部內(nèi)容并入本文。在一個實(shí)施方案中,本文提供的cas蛋白或其變體可以通過嵌合sgrna指導(dǎo)后面有5’-ngg原間隔物(protospacer)相鄰基序(pam)的任何基因組基因座。
在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。來自嗜熱鏈球菌(s.thermophilus)crispr-cas系統(tǒng)的分離的cas9-crrna復(fù)合物以及從分離的組分體外組裝的復(fù)合物證明其結(jié)合于具有與crrna互補(bǔ)的核苷酸序列的合成寡脫氧核苷酸和質(zhì)粒dna兩者。已經(jīng)顯示cas9具有兩個核酸酶結(jié)構(gòu)域-ruvc-和hnh-活性位點(diǎn)/核酸酶結(jié)構(gòu)域,并且這兩個核酸酶結(jié)構(gòu)域負(fù)責(zé)相對的dna鏈的切割。在一些實(shí)施方案中,cas9蛋白來源于嗜熱鏈球菌crispr-cas系統(tǒng)的cas9蛋白。在一些實(shí)施方案中,cas9蛋白是具有約1,409個氨基酸殘基的多結(jié)構(gòu)域蛋白。
在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域,并且能夠切割相對的dna鏈并產(chǎn)生雙鏈dna斷裂。本方法部分基于令人驚奇的發(fā)現(xiàn),即保留兩個核酸酶結(jié)構(gòu)域的野生型cas9蛋白可以在dna切割后以足夠的強(qiáng)度和長度保留在結(jié)合位點(diǎn),使得能夠?qū)na內(nèi)切核酸酶系統(tǒng)復(fù)合物通過內(nèi)切核酸酶系統(tǒng)下拉。如圖2a-2b所示,將含有野生型cas9蛋白的crispr-cas系統(tǒng)加入含有靶braf序列的溶液中。該系統(tǒng)用生物素化的dutp標(biāo)記,并加入鏈霉親合素珠以下拉系統(tǒng)與其相關(guān)的dna片段。如圖2a-2b的右圖所示,從珠洗脫中檢測到切割的dna片段,表明切割后酶系統(tǒng)和dna之間的關(guān)聯(lián)。
在其它實(shí)施方案中,cas9蛋白或其變體是cas9切口酶,并且能夠產(chǎn)生單鏈核酸缺口,例如單鏈dna切口。cas9蛋白的切口酶變體在創(chuàng)建切口后與靶核酸保持在一起,因此其可以用于靶物特異性富集。在一些實(shí)施方案中,僅突變和失活ruvc-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,僅突變和失活hnh-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是h840a。
在一些實(shí)施方案中,本方法可用于富集核酸片段文庫中的靶核酸片段,例如使用illumina的nextera文庫制備物制備。圖2c顯示了cas9切口酶介導(dǎo)的從nextera質(zhì)粒文庫制備的片段的富集。如圖所示,含有braf靶位點(diǎn)的質(zhì)粒首先進(jìn)行tn5介導(dǎo)的片段標(biāo)簽化以產(chǎn)生dna片段群體。然后將包含cas9切口酶和靶向braf序列的生物素標(biāo)記的crrna的crispr-cas9系統(tǒng)加入片段中。crispr-cas9系統(tǒng)特異性結(jié)合含有braf序列的dna片段。通過使用鏈霉親合素珠下拉生物素及其相關(guān)組分,富含含有braf序列的dna片段。從蛋白質(zhì)洗脫后,可以將富集的dna片段進(jìn)一步進(jìn)行dna擴(kuò)增和測序。
在其它實(shí)施方案中,cas9蛋白或其變體是cas9蛋白的核酸酶無效變體,其中ruvc-和hnh-活性位點(diǎn)/核酸酶結(jié)構(gòu)域都是突變的。cas9蛋白的核酸酶無效變體與雙鏈dna結(jié)合,但不切割dna,因此其也可用于靶物特異性dna富集。在一些實(shí)施方案中,cas9蛋白具有兩個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,cas9蛋白具有第一突變d10a和第二突變h840a。
可以通過下拉其相關(guān)的crispr-cas系統(tǒng)來分離靶核酸。在一些實(shí)施方案中,標(biāo)記內(nèi)切核酸酶系統(tǒng),并且通過標(biāo)記物下拉將酶-核酸復(fù)合物。在一些實(shí)施方案中,標(biāo)記crrna或其衍生物。在一個實(shí)施方案中,如上所述,用生物素標(biāo)記crrna。在其他實(shí)施方案中,如上所述標(biāo)記tracrrna。在其它實(shí)施方案中,cas蛋白或其變體用捕獲標(biāo)簽標(biāo)記。蛋白質(zhì)捕獲標(biāo)簽包括但不限于gst,myc,血凝素(ha),綠色熒光蛋白(gfp),flag,his標(biāo)簽,tap標(biāo)簽和fc標(biāo)簽。本領(lǐng)域公認(rèn)的其它蛋白質(zhì)捕獲標(biāo)簽,例如親和標(biāo)簽,也可以用于本發(fā)明的方法中。本領(lǐng)域技術(shù)人員將認(rèn)識到,選擇用于純化步驟的方案將特異于所使用的標(biāo)簽。在一些實(shí)施方案中,抗cas蛋白抗體或其片段,例如抗cas9抗體,也可用于分離復(fù)合物。
在另一方面,指導(dǎo)rna與靶雙鏈核酸的區(qū)域的結(jié)合破壞靶核酸的兩條鏈之間的相互作用,從而產(chǎn)生環(huán)結(jié)構(gòu),暴露與指導(dǎo)rna不互補(bǔ)鏈的鏈。該暴露的鏈可以與本文提供的另一種核苷酸探針雜交。本文方法提供的一個優(yōu)點(diǎn)是富集的雙特異性:一個來自crrna的和另一個來自探針。在一個實(shí)施方案中,本公開提供了用于富集靶雙鏈核酸的方法,包括提供具有聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物的內(nèi)切核酸酶系統(tǒng)和crispr相關(guān)的cas)蛋白或其變體,其中所述crrna或其衍生物包含與所述靶雙鏈核酸的第一鏈的區(qū)域互補(bǔ)的靶物特異性核苷酸區(qū)域;使所述靶雙鏈核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成第一復(fù)合物;使標(biāo)記的核酸與所述靶雙鏈核酸的第二鏈雜交以形成第二復(fù)合物,所述靶雙鏈核酸的第二鏈與所述crrna或其衍生物不互補(bǔ),并且分離第二復(fù)合物,從而富集靶核酸。
如圖3所示,crrna(指導(dǎo)rna或grna)與靶雙鏈dna的一條鏈雜交以形成復(fù)合物,并產(chǎn)生置換環(huán)。提供標(biāo)記的(例如,生物素標(biāo)記的)核酸探針,靶向該置換環(huán)并與靶雙鏈dna的另一條鏈雜交,以形成標(biāo)記的復(fù)合物。然后可以通過下拉標(biāo)記的復(fù)合物來富集靶雙鏈dna。
在一些實(shí)施方案中,本公開的方法還包括將靶雙鏈dna序列與第二復(fù)合物分離。在一些實(shí)施方案中,本申請的方法還包括擴(kuò)增靶向的雙鏈dna序列。
在一些實(shí)施方案中,本文提供的靶核酸是雙鏈dna(dsdna)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是i型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是iii型crispr-cas系統(tǒng)或其衍生物。本文提供的crispr-cas系統(tǒng)包括來源于天然產(chǎn)生的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)還可以包含工程化和/或程序化的指導(dǎo)rna。
在一些實(shí)施方案中,crrna或其衍生物含有允許將酶特異性靶向互補(bǔ)雙鏈dna的用戶可選擇的rna序列。在一些實(shí)施方案中,用戶可選擇的rna序列含有與靶dna序列的區(qū)域互補(bǔ)或基本上互補(bǔ)的20-50個核苷酸。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的100%堿基對匹配。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的90%-100%,80%-100%或70%-100%的堿基對匹配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在一個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在兩個,三個,四個或五個堿基對錯配。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,本文提供的crrna或其衍生物是具有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一個實(shí)施方案中,本文提供的cas蛋白或其變體可以通過嵌合sgrna指導(dǎo)后面有5’-ngg原間隔物相鄰基序(pam)的任何基因組基因座。
在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白衍生自嗜熱鏈球菌crispr-cas系統(tǒng)的cas9蛋白。在一些實(shí)施方案中,cas9蛋白是約1,409個氨基酸殘基的多結(jié)構(gòu)域蛋白。
在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域,并且能夠切割相對的dna鏈并產(chǎn)生雙鏈dna斷裂。在其它實(shí)施方案中,cas9蛋白或其變體是cas9切口酶,并且能夠產(chǎn)生單鏈核酸切口,例如單鏈dna切口。在一些實(shí)施方案中,僅突變和失活ruvc-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,僅突變和失活hnh-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是h840a。在其它實(shí)施方案中,cas9蛋白或其變體是cas9蛋白的核酸酶無效變體,其中ruvc-和hnh-活性位點(diǎn)/核酸酶結(jié)構(gòu)域都被突變。cas9蛋白的核酸酶無效變體與雙鏈dna結(jié)合,但不切割dna,因此其也可用于靶物特異性dna富集。在一些實(shí)施方案中,cas9蛋白具有兩個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,cas9蛋白具有第一突變d10a和第二突變h840a。
在另一方面,可以片段化靶核酸并連接到銜接頭,制備好用于其它程序如測序。在一些實(shí)施方案中,靶核酸進(jìn)一步進(jìn)行轉(zhuǎn)座酶介導(dǎo)的片段標(biāo)簽化,其導(dǎo)致靶核酸的片段化和銜接頭連接到雙鏈dna片段的兩條鏈的5’端。任選地,可以將靶核酸片段化,并且可以使用如美國公開號2010/0120098中所述的片段標(biāo)簽化或轉(zhuǎn)座將銜接頭加入5’和3’末端,其通過引用整體并入本文。簡言之,轉(zhuǎn)座反應(yīng)是其中一個或多個轉(zhuǎn)座子在隨機(jī)位點(diǎn)插入靶核酸的反應(yīng)。轉(zhuǎn)座反應(yīng)中的基本成分是轉(zhuǎn)座酶和dna寡核苷酸,其展示轉(zhuǎn)座子的核苷酸序列,包括轉(zhuǎn)移的轉(zhuǎn)座子序列及其互補(bǔ)序列(非轉(zhuǎn)移的轉(zhuǎn)座子末端序列)以及形成功能轉(zhuǎn)座或轉(zhuǎn)座體復(fù)合物所需的其它成分。根據(jù)需要或期望,dna寡核苷酸可以進(jìn)一步包括另外的序列(例如,銜接頭或引物序列)。適用于本文提供的方法的示例性轉(zhuǎn)座復(fù)合物包括但不限于由高活性tn5轉(zhuǎn)座酶和tn5型轉(zhuǎn)座子末端或由mua轉(zhuǎn)座酶和包含r1和r2末端的mu轉(zhuǎn)座子末端形成的那些序列(參見,例如,goryshinandreznikoff,j.biol.chem.273:7367,1998;andmizuuchi,cell35:785,1983;savilahtietal.,emboj.14:4893,1995;本文參考)。然而,出于其意圖的目的能夠以足夠的效率插入轉(zhuǎn)座子末端以將靶核酸標(biāo)簽化的任何轉(zhuǎn)座系統(tǒng)可以用于所提供的方法中??捎糜谒峁┑姆椒ǖ囊阎D(zhuǎn)座系統(tǒng)的其它實(shí)例包括但不限于金黃色葡萄球菌tn552,ty1,轉(zhuǎn)座子tn7,tn/o和is10,mariner轉(zhuǎn)座酶,tel,p元件,tn3,細(xì)菌插入序列,逆轉(zhuǎn)錄病毒和逆轉(zhuǎn)錄轉(zhuǎn)座子(參見例如colegioetal.,2001,j.bacteriol.183:2384-8;kirbyetal.,2002,mol.microbiol.43:173-86;devineandboeke,1994,nucleicacidsres.,22:3765-72;internationalpatentapplicationno.wo95/23875;craig,1996,science271:1512;craig,1996,reviewin:currtopmicrobiolimmunol.204:27-48;kleckneretal.,1996,currtopmicrobiolimmunol.204:49-82;lampeetal.,1996,emboj.15:5470-9;plasterk,1996,currtopmicrobiolimmunol204:125-43;gloor,2004,methodsmol.biol.260:97-114;ichikawaandohtsubo,1990,jbiol.chem.265:18829-32;ohtsuboandsekine,1996,curr.top.microbiol.immunol.204:1-26;brownetal.,1989,procnatlacadsciusa86:2525-9;boekeandcorces,1989,annurevmicrobiol.43:403-34;其全部內(nèi)容通過引用并入本文)。在一些實(shí)施方案中,本公開的方法還包括除去轉(zhuǎn)座酶并通過pcr加入改編(adapted)的dna片段的末端。
在一些實(shí)施方案中,在靶核酸富集后進(jìn)行片段標(biāo)簽化。在一個實(shí)施方案中,如圖4a和4f所示,加入含有cas9蛋白和crrna-tracrrna嵌合體的crispr-cas系統(tǒng),并結(jié)合靶dna序列以形成復(fù)合物。cas9蛋白用捕獲標(biāo)簽標(biāo)記,通過所述捕獲標(biāo)簽分離復(fù)合物。然后從復(fù)合物中分離目標(biāo)dna并進(jìn)行片段標(biāo)簽化。
在一些實(shí)施方案中,crispr-cas系統(tǒng)中的rna,例如crrna或其衍生物,sgrna和tracrrna或其衍生物含有轉(zhuǎn)座子末端,并且本發(fā)明的方法還包括加入轉(zhuǎn)座酶。加入的轉(zhuǎn)座酶可以裝配在轉(zhuǎn)座子末端,并且靶dna因此被轉(zhuǎn)座酶切割。在一些實(shí)施方案中,轉(zhuǎn)座子末端是嵌合末端(me),并且轉(zhuǎn)座酶是tn5轉(zhuǎn)座酶。在一個實(shí)施方案中,如圖4b所示,crispr-cas系統(tǒng)含有攜帶轉(zhuǎn)座子末端(me)的標(biāo)記的cas9蛋白和crrna-tracrrna嵌合體。加入系統(tǒng)并結(jié)合靶dna序列以形成復(fù)合物。加入轉(zhuǎn)座酶(tn5)并裝配在me序列上,從而切割dna。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括轉(zhuǎn)座酶,因此轉(zhuǎn)座酶是內(nèi)切核酸酶系統(tǒng)的一部分,并且本公開的方法還包括將轉(zhuǎn)座子末端加入靶dna序列;和通過轉(zhuǎn)座酶將靶dna序列進(jìn)行片段標(biāo)簽化。在一些實(shí)施方案中,轉(zhuǎn)座酶結(jié)合核酸內(nèi)切酶系統(tǒng)的核苷酸序列。在一些實(shí)施方案中,轉(zhuǎn)座酶結(jié)合crrna或其衍生物。在一些實(shí)施方案中,轉(zhuǎn)座酶結(jié)合tracrrna或其衍生物。在一些實(shí)施方案中,轉(zhuǎn)座酶結(jié)合sgrna或具有crrna多核苷酸和tracrrna多核苷酸的嵌合多核苷酸。在一些實(shí)施方案中,轉(zhuǎn)座子末端是嵌合末端(me),并且轉(zhuǎn)座酶是tn5轉(zhuǎn)座酶。如圖4c所示,在一個實(shí)施方案中,轉(zhuǎn)座酶(tn5)通過連接到crrna-tracrrna嵌合體的適體結(jié)合內(nèi)切核酸酶系統(tǒng)。因此,tn5在不借助me序列的情況下與系統(tǒng)結(jié)合。加入含有tn5的內(nèi)切核酸酶系統(tǒng)并結(jié)合靶dna。然后,將me序列加入dna,因此可以通過tn5將dna進(jìn)行片段標(biāo)簽化。如圖4d所示,在另一個實(shí)施方案中,本文提供的轉(zhuǎn)座酶和本文提供的cas蛋白形成融合蛋白。加入含有tn5的內(nèi)切核酸酶系統(tǒng)并結(jié)合靶dna。然后,將me序列加入dna,因此可以通過tn5將dna片段標(biāo)簽化,并且可以引入序列,例如索引(index)或通用引物序列。
圖4e顯示了使用本文提供的方法富集靶核酸的方法。如圖所示,將tn5系統(tǒng)和crispr-cas9系統(tǒng)加入含有靶核酸的核酸群體中。crispr-cas9系統(tǒng)含有具有兩個核酸酶結(jié)構(gòu)域的cas9。因此,tn5系統(tǒng)和crispr-cas9系統(tǒng)都可以切割核酸,并且在切割后,這兩個系統(tǒng)都與核酸的切割末端保持在一起。標(biāo)記crispr-cas9系統(tǒng),藉此可以下拉靶核酸。在用蛋白酶處理后,釋放從靶核酸產(chǎn)生的dna片段,并且可以進(jìn)行進(jìn)一步的擴(kuò)增和/或文庫制備。
在另一方面,本公開提供了使用crispr-cas系統(tǒng)富集和/或檢測細(xì)胞游離dna群體中的靶核酸的方法。血漿或血清中的細(xì)胞游離dna在許多醫(yī)學(xué)領(lǐng)域作為非侵入性診斷工具具有巨大的潛力。例如,已經(jīng)研究了細(xì)胞游離胎兒dna,甚至優(yōu)化用于測試不相容的rhd因子,x連鎖遺傳疾病的性別確定,單基因病癥的測試,先兆子癇的鑒定等。例如,對母體血漿中的細(xì)胞游離dna的胎兒細(xì)胞級份測序是檢測與胎兒染色體非整倍性(anueploidy)相關(guān)的拷貝數(shù)變化的可靠方法。另一種情況,對從癌癥患者分離的細(xì)胞游離dna(也稱為循環(huán)腫瘤dna)測序已用于檢測與治療決定相關(guān)的關(guān)鍵基因中的突變。本公開提供了用于改善細(xì)胞游離dna中的靶dna序列的富集和/或檢測的方法。
在一些實(shí)施方案中,本公開提供了用于富集靶核酸的方法,包括從受試者的血漿或血清獲得細(xì)胞游離dna(cfdna)群體,包含靶核酸的細(xì)胞游離dna群體;提供具有聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物和crispr相關(guān)的(cas)蛋白或其變體的內(nèi)切核酸酶系統(tǒng),其中所述crrna或其衍生物包含靶物特異性與靶核酸的區(qū)域互補(bǔ)的核苷酸區(qū)域;使所述靶核酸與所述內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,以及分離所述復(fù)合物,從而富集所述靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括從復(fù)合物中分離靶dna序列。在一些實(shí)施方案中,本文提供的方法還包括擴(kuò)增靶dna序列。在一些實(shí)施方案中,本文提供的靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是i型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是iii型crispr-cas系統(tǒng)或其衍生物。本文提供的crispr-cas系統(tǒng)包括來源于天然產(chǎn)生的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)還可以包含工程化和/或程序化的指導(dǎo)rna。
在一些實(shí)施方案中,crrna或其衍生物包含允許將酶特異性靶向互補(bǔ)雙鏈dna的用戶可選擇的rna序列。在一些實(shí)施方案中,用戶可選擇的rna序列含有與靶dna序列的區(qū)域互補(bǔ)或基本上互補(bǔ)的20-50個核苷酸。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的100%堿基對匹配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在一個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在兩個,三個,四個或五個堿基對錯配。
在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)還包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,本文提供的crrna或其衍生物是具有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一個實(shí)施方案中,本文提供的cas蛋白或其變體可以通過嵌合sgrna指導(dǎo)后面有5’-ngg原間隔物相鄰基序(pam)的任何基因組座位。
在一些實(shí)施方案中,cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白衍生自嗜熱鏈球菌crispr-cas系統(tǒng)的cas9蛋白。在一些實(shí)施方案中,cas9蛋白是約1,409個氨基酸殘基的多結(jié)構(gòu)域蛋白。
在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域,并且能夠切割相對的dna鏈并產(chǎn)生雙鏈dna斷裂。在其它實(shí)施方案中,cas9蛋白或其變體是cas9切口酶,并且能夠產(chǎn)生單鏈核酸切口,例如單鏈dna切口。在一些實(shí)施方案中,僅突變和失活ruvc-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,僅突變和失活hnh-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是h840a。在其它實(shí)施方案中,cas9蛋白或其變體是cas9蛋白的核酸酶無效變體,其中ruvc-和hnh-活性位點(diǎn)/核酸酶結(jié)構(gòu)域都被突變。cas9蛋白的核酸酶無效變體與雙鏈dna結(jié)合,但不切割dna,因此其也可用于靶物特異性dna富集。在一些實(shí)施方案中,cas9蛋白具有兩個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,cas9蛋白具有第一突變d10a和第二突變h840a。
在一些實(shí)施方案中,靶dna在細(xì)胞游離dna的胎兒細(xì)胞級份中,并且細(xì)胞游離dna來自母體血漿。用于提取細(xì)胞游離胎兒dna的方案是本領(lǐng)域已知的(參見例如lietal.,2004,clinicalchemistry50(6):1002-1011;andlietal.,2005,thejournaloftheamericanmedicalassociation293(7):843-849,其通過引用整體并入本文)。用于從母體血漿提取胎兒dna的許多方案使用胎兒dna的大小以將其與母體dna區(qū)分開。用于從母血中分離血漿的典型步驟包括離心,然后分離和純化細(xì)胞游離dna(參見例如chiuetal.,2001,clinicalchemistry47(9):1607-1613)。任選地,由legler等人開發(fā)的方案可用于提取細(xì)胞游離胎兒dna(參見legleretal.2007,prenataldiagnosis27(9):824-829)。任選地,可以將甲醛加入母體血液樣品中以增加細(xì)胞游離胎兒dna的百分比。已經(jīng)表明,甲醛可以穩(wěn)定完整細(xì)胞,并抑制母體dna的進(jìn)一步釋放(參見例如dhallanetal.2004,thejournaloftheamericanmedicalassociation291(9):1114-1119)。
在一些實(shí)施方案中,受試者是癌癥患者。腫瘤本身通常是腫瘤dna的主要來源。然而,通過活組織檢查獲取dna是侵入性的并且有風(fēng)險(如果完全可能的話)。從死亡腫瘤細(xì)胞釋放的血流中的細(xì)胞游離循環(huán)腫瘤dna提供了另一種用于檢測腫瘤中存在的體細(xì)胞突變的有用工具。在早期和晚期階段兩者的許多類型的癌癥中已經(jīng)鑒定了具有突變的細(xì)胞游離循環(huán)腫瘤dna。此外,已顯示細(xì)胞游離循環(huán)dna的量隨著癌癥的進(jìn)展而增加。因此,細(xì)胞游離循環(huán)dna也可以用作監(jiān)測腫瘤進(jìn)展和測試患者的腫瘤是否會響應(yīng)靶向藥物治療的方式(參見例如bettegowdaetal.,2014,sci.transl.med,6(224):24)。本公開提供了用于富集和/或檢測來自癌癥患者的細(xì)胞游離循環(huán)dna中的靶dna序列的方法。在一個實(shí)施方案中,癌癥患者具有胰腺,卵巢,結(jié)腸直腸,膀胱,胃食管,乳腺,黑素瘤,肝細(xì)胞或頭頸癌。在一些實(shí)施方案中,癌癥患者具有腦,腎,前列腺或甲狀腺癌。在一些實(shí)施方案中,癌癥患者具有癌。在一些實(shí)施方案中,癌癥患者具有肉瘤。在一些實(shí)施方案中,癌癥患者具有淋巴瘤或白血病。在一些實(shí)施方案中,本文提供的方法用于診斷癌癥。在一些實(shí)施方案中,本文提供的方法用于監(jiān)測腫瘤進(jìn)展和/或測試腫瘤患者對靶向藥物治療的反應(yīng)。
在一些實(shí)施方案中,靶核酸包含單核苷酸變體(snv)。在一些實(shí)施方案中,snv含有單核苷酸多態(tài)性(snp)。在一些實(shí)施方案中,snv包含點(diǎn)突變。單核苷酸多態(tài)性(snp)是常見類型的遺傳變異,其包括在dna位置中的多態(tài)性,其中兩個或更多個替代堿基在人群中以可觀的頻率發(fā)生(通常大于或等于1%)。點(diǎn)突變是頻率小于1%的基因變異。單核苷酸多態(tài)性(snp)和點(diǎn)突變代表人類基因組中最大的多樣性來源。這些單核苷酸多態(tài)性(snp)和點(diǎn)突變可以作為用于在人類基因組圖譜上定位疾病的生物標(biāo)記,因為它們通常位于與某種疾病相關(guān)的基因附近。因此,單核苷酸多態(tài)性(snp),點(diǎn)突變和類似突變的檢測對于臨床活動,人類健康和遺傳疾病的控制是非常重要的。通過測序細(xì)胞游離dna來檢測胎兒或癌癥相關(guān)的snv可能是困難的,因為這些變體通常以總細(xì)胞游離dna的非常低的百分比(通常為0.1%和更低)存在。本公開提供的一個優(yōu)點(diǎn)是用于檢測和/或富集具有snv的dna序列的更靈敏的方法。在一個實(shí)施方案中,本公開的方法允許檢測在0.1%至0.01%頻率范圍內(nèi)存在于細(xì)胞游離dna樣品中的snv。在一個實(shí)施方案中,本文提供的方法富集和/或檢測細(xì)胞游離dna樣品中在0.01%至0.05%頻率范圍內(nèi)存在的snv。在一些實(shí)施方案中,本文提供的方法富集和/或檢測以約0.01%,0.02%,0.03%,0.04%,0.05%,0.06%,0.07%,0.08%,0.09%,0.01%,0.02%或0.1%頻率存在于細(xì)胞游離dna樣品中的snv。
作為實(shí)例而非限制,在圖5中顯示在過量野生型等位基因(b-raf)存在下的稀有突變體等位基因(b-rafv600e)的富集。在一個實(shí)施方案中,圖5的左圖,在使用之前,用諸如生物素的標(biāo)簽修飾crispr-cas系統(tǒng)以促進(jìn)結(jié)合的靶dna的回收。crispr-cas系統(tǒng)編程為包含cas9蛋白的核酸酶無效變體和具有與突變體等位基因(b-rafv600e)互補(bǔ)的序列的引導(dǎo)rna。將突變體等位基因b-rafv600e與含有過量野生型等位基因dna片段的純化的細(xì)胞游離dna混合。將crispr-cas系統(tǒng)加入含有突變等位基因(b-rafv600e)和過量的野生型等位基因(b-raf)的混合物中。crispr-cas系統(tǒng)特異性結(jié)合含有突變等位基因(b-rafv600e)的多核苷酸以形成復(fù)合物,但該酶不切割dna。使用鏈霉親合素包被的珠從混合物中拉出復(fù)合物。然后,從復(fù)合物中分離突變等位基因(b-rafv600e)。洗滌后,使用v600e等位基因位點(diǎn)側(cè)翼的引物組通過pcr擴(kuò)增帶有突變等位基因的富集dna。然后,可以對擴(kuò)增子進(jìn)行測序。
作為對含有snv的靶核酸序列的直接富集的替代,本公開還提供了通過使用crispr-cas系統(tǒng)破壞不含snv的其它基因型或多核苷酸來富集含有snv的核酸序列的方法。在一些實(shí)施方案中,本公開提供了用于檢測單核苷酸變體(snv)的方法,包括從受試者的血漿或血清中獲得細(xì)胞游離dna的群體;提供具有第一聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物和第一crispr相關(guān)的(cas)蛋白或其變體的第一內(nèi)切核酸酶系統(tǒng),其中所述第一crrna或其衍生物包含與第一靶核酸的區(qū)域互補(bǔ)的第一靶物特異性核苷酸區(qū)域,并且其中所述第一cas蛋白具有核酸酶活性;使用核酸內(nèi)切酶系統(tǒng)切割第一靶核酸,以及使用聚合酶鏈?zhǔn)椒磻?yīng)(pcr)擴(kuò)增第二靶核酸,其中第二靶核酸包含第一靶核酸的單核苷酸變體形式。
如圖5右圖所示,使用與野生型等位基因(b-raf)互補(bǔ)的指導(dǎo)rna,而不是使用與突變等位基因互補(bǔ)的指導(dǎo)rna。此外,cas9蛋白在兩個核酸酶結(jié)構(gòu)域中保留核酸酶活性。因此,crispr-cas系統(tǒng)結(jié)合野生型等位基因并將其切割。因為系統(tǒng)在野生型等位基因序列中產(chǎn)生雙鏈斷裂,所以這些序列不能用作隨后的pcr反應(yīng)的模板。因此,只有攜帶突變等位基因的細(xì)胞游離dna將作為模板并被擴(kuò)增。
在一些實(shí)施方案中,本文提供的第二靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,本文提供的第一內(nèi)切核酸酶系統(tǒng)是i型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的內(nèi)切核酸酶系統(tǒng)是iii型crispr-cas系統(tǒng)或其衍生物。本文提供的crispr-cas系統(tǒng)包括來源于天然產(chǎn)生的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)還可以包含工程化和/或程序化的指導(dǎo)rna。
在一些實(shí)施方案中,第一crrna或其衍生物包含允許將酶特異性靶向互補(bǔ)雙鏈核酸的用戶可選擇的rna序列。在一些實(shí)施方案中,用戶可選擇的rna序列含有與第一靶dna序列的區(qū)域互補(bǔ)的20-50個核苷酸。在一些實(shí)施方案中,crrna的第一靶物特異性核苷酸區(qū)域具有與第一靶核酸的區(qū)域的100%堿基對匹配。在一些實(shí)施方案中,在crrna的第一靶物特異性核苷酸區(qū)域和第一靶核酸的區(qū)域之間存在一個堿基對錯配。在一些實(shí)施方案中,在crrna的第一靶物特異性核苷酸區(qū)域和第一靶核酸的區(qū)域之間存在兩個,三個,四個或五個堿基對錯配。
在一些實(shí)施方案中,本文提供的第一內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,本文提供的第一crrna或其衍生物是具有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一個實(shí)施方案中,本文提供的第一cas蛋白或其變體可以通過嵌合sgrna指導(dǎo)后面有5’-ngg原間隔物相鄰基序(pam)的任何基因組座位。
在一些實(shí)施方案中,第一cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白衍生自嗜熱鏈球菌crispr-cas系統(tǒng)的cas9蛋白。在一些實(shí)施方案中,cas9蛋白是約1,409個氨基酸殘基的多結(jié)構(gòu)域蛋白。在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域,并且能夠切割相對的dna鏈并產(chǎn)生雙鏈dna斷裂。
在一些實(shí)施方案中,第二靶核酸包含單核苷酸變體(snv)。在一些實(shí)施方案中,snv含有單核苷酸多態(tài)性(snp)。在一些實(shí)施方案中,snv包含點(diǎn)突變。在一個實(shí)施方案中,本公開的方法允許檢測在0.1%至0.01%頻率范圍內(nèi)存在于細(xì)胞游離dna樣品中的snv。在一個實(shí)施方案中,本文提供的方法富集和/或檢測在0.01%至0.05%頻率范圍內(nèi)在細(xì)胞游離dna樣品中存在的snv。在一些實(shí)施方案中,本文提供的方法富集和/或檢測以約0.01%,0.02%,0.03%,0.04%,0.05%,0.06%,0.07%,0.08%,0.09%或0.1%頻率存在于細(xì)胞游離dna樣品中的snv。
或者,可以提供兩種內(nèi)切核酸酶系統(tǒng):第一內(nèi)切核酸酶系統(tǒng)用于消化不含snv的核酸,并且第二內(nèi)切核酸酶系統(tǒng)用于用snv下拉核酸。在一些實(shí)施方案中,本文的方法還包括提供具有第二聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物和第二crispr相關(guān)的(cas)蛋白或其變體的第二內(nèi)切核酸酶系統(tǒng),其中所述第二crrna或其衍生物包含與所述第二靶核酸的區(qū)域互補(bǔ)的第二靶物特異性核苷酸區(qū)域;使所述第二靶核酸與所述第二內(nèi)切核酸酶系統(tǒng)接觸以形成復(fù)合物,以及分離所述復(fù)合物,從而富集所述第二目標(biāo)核酸。
在一些實(shí)施方案中,本文提供的方法還包括從復(fù)合物中分離第二靶核酸。在一些實(shí)施方案中,本文提供的第二靶核酸是雙鏈dna(dsdna)。
在一些實(shí)施方案中,本文提供的第二內(nèi)切核酸酶系統(tǒng)是i型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,本文提供的第二內(nèi)切核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,本文提供的第二內(nèi)切核酸酶系統(tǒng)是iii型crispr-cas系統(tǒng)或其衍生物。本文提供的crispr-cas系統(tǒng)包括來源于天然產(chǎn)生的crispr-cas系統(tǒng)的工程化和/或程序化的核酸酶系統(tǒng)。crispr-cas系統(tǒng)可以包含工程化和/或突變的cas蛋白。crispr-cas系統(tǒng)還可以包含工程化和/或程序化的指導(dǎo)rna。
在一些實(shí)施方案中,第二crrna或其衍生物包含允許將酶特異性靶向互補(bǔ)雙鏈dna的用戶可選擇的rna序列。在一些實(shí)施方案中,用戶可選擇的rna序列含有與靶dna序列的區(qū)域互補(bǔ)或基本上互補(bǔ)的20-50個核苷酸。在一些實(shí)施方案中,crrna的靶物特異性核苷酸區(qū)域具有與靶核酸的區(qū)域的100%堿基對匹配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在一個堿基對錯配。在一些實(shí)施方案中,在crrna的靶物特異性核苷酸區(qū)域和靶核酸的區(qū)域之間存在兩個,三個,四個或五個堿基對錯配。
在一些實(shí)施方案中,本文提供的第二內(nèi)切核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)或其衍生物。在一些實(shí)施方案中,本文提供的crrna或其衍生物是包含與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。
在一些實(shí)施方案中,第二cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白衍生自嗜熱鏈球菌crispr-cas系統(tǒng)的cas9蛋白。在一些實(shí)施方案中,cas9蛋白是約1,409個氨基酸殘基的多結(jié)構(gòu)域蛋白。
在一些實(shí)施方案中,cas9蛋白或其變體保留兩個核酸酶結(jié)構(gòu)域,并且能夠切割相對的dna鏈并產(chǎn)生雙鏈dna斷裂。在其它實(shí)施方案中,cas9蛋白或其變體是cas9切口酶,并且能夠產(chǎn)生單鏈核酸切口,例如單鏈dna切口。在一些實(shí)施方案中,僅突變和失活ruvc-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,僅突變和失活hnh-核酸酶結(jié)構(gòu)域。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是d10a。在一些實(shí)施方案中,cas9蛋白含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一個實(shí)施方案中,突變是h840a。在其它實(shí)施方案中,cas9蛋白或其變體是cas9蛋白的核酸酶無效變體,其中ruvc-和hnh-活性位點(diǎn)/核酸酶結(jié)構(gòu)域都被突變。在一些實(shí)施方案中,cas9蛋白具有兩個失活的核酸酶結(jié)構(gòu)域,其具有在切割與crrna互補(bǔ)的鏈的結(jié)構(gòu)域中的第一突變和在切割與crrna不互補(bǔ)的鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,cas9蛋白具有第一突變d10a和第二突變h840a。
在一些實(shí)施方案中,第二靶核酸在細(xì)胞游離dna的胎兒細(xì)胞級份中,并且細(xì)胞游離dna來自母體血漿。在一些實(shí)施方案中,受試者是癌癥患者。在一個實(shí)施方案中,癌癥患者具有胰腺,卵巢,結(jié)腸直腸,膀胱,胃食管,乳腺,黑素瘤,肝細(xì)胞或頭頸癌。在一些實(shí)施方案中,癌癥患者具有腦,腎,前列腺或甲狀腺癌。在一些實(shí)施方案中,癌癥患者具有癌。在一些實(shí)施方案中,癌癥患者具有肉瘤。在一些實(shí)施方案中,癌癥患者具有淋巴瘤或白血病。在一些實(shí)施方案中,本文提供的方法用于診斷癌癥。在一些實(shí)施方案中,本文提供的方法用于監(jiān)測腫瘤進(jìn)展和/或測試腫瘤患者對靶向藥物治療的反應(yīng)。
在另一方面,本公開提供了使用含有切口酶的crispr-cas系統(tǒng)標(biāo)記靶核酸序列的方法。本文提供的切口酶可以將靶物特異性切口引入雙鏈核酸。切口可以進(jìn)一步用于插入捕獲標(biāo)簽,如生物素化的dntp,寡核苷酸探針或雙鏈核酸銜接頭,用于靶核酸的富集策略。單鏈核酸富集方案的當(dāng)前方法需要產(chǎn)生雜交產(chǎn)物的“樹結(jié)構(gòu)”,并且這種結(jié)構(gòu)通常降低特異性。本文提供的方法直接靶向雙鏈核酸,因此避免了創(chuàng)建這種“樹結(jié)構(gòu)”的需要。此外,本文提供的方法能夠富集長核酸片段。
在一些實(shí)施方案中,本文提供的方法包括產(chǎn)生一個單鏈切口,并且從該切口進(jìn)行切口平移以引入用于回收靶核酸的捕獲標(biāo)記物。在其他實(shí)施方案中,本文提供的方法包括在靶核酸的相同鏈上產(chǎn)生兩個連續(xù)的單鏈切口。兩個切口之間的單鏈核酸產(chǎn)物可以被用于回收靶核酸的捕獲標(biāo)記物替代。在其他實(shí)施方案中,本文提供的方法包括在靶核酸的相對鏈上產(chǎn)生兩個連續(xù)的單鏈切口,并因此產(chǎn)生可以連接到銜接頭用于富集的雙鏈核酸斷裂。
在一些實(shí)施方案中,本公開提供了用于標(biāo)記靶核酸的方法,包括提供具有第一聚簇規(guī)則間隔短回文重復(fù)(crispr)rna(crrna)或其衍生物的第一核酸酶系統(tǒng)和第一crispr相關(guān)的(cas)蛋白或其變體,其中所述第一crrna或其衍生物含有與所述靶核酸的第一區(qū)互補(bǔ)的第一靶物特異性核苷酸區(qū),并且其中所述第一cas蛋白包含一個失活的核酸酶結(jié)構(gòu)域;使包含所述靶核酸的雙鏈核酸與所述第一核酸酶系統(tǒng)接觸,以在所述靶核酸的第一區(qū)產(chǎn)生第一單鏈切口,并標(biāo)記所述靶核酸。在一些實(shí)施方案中,本文的方法進(jìn)一步包括通過標(biāo)記分離靶核酸,從而富集靶核酸。在一些實(shí)施方案中,本文提供的方法還包括擴(kuò)增靶核酸。
在一些實(shí)施方案中,本文提供的第一核酸酶系統(tǒng)進(jìn)一步包括反式激活crrna(tracrrna)。在一些實(shí)施方案中,本文提供的第一crrna或其衍生物是具有與tracrrna多核苷酸融合的crrna多核苷酸的多核苷酸。在一些實(shí)施方案中,本文提供的第一核酸酶系統(tǒng)是ii型crispr-cas系統(tǒng)或其衍生物。在一些實(shí)施方案中,第一cas蛋白或其變體是cas9蛋白或其變體。在一些實(shí)施方案中,cas9蛋白或其變體包含一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,突變是d10a。在一些實(shí)施方案中,第一cas9蛋白或其變體含有一個失活的核酸酶結(jié)構(gòu)域,其具有在切割與第一crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變。在一些實(shí)施方案中,突變是h840a。如圖6a-6b所示,純化的cas9切口酶具有序列特異性切口活性。
在一些實(shí)施方案中,本公開的方法還包括進(jìn)行切口平移。在一些實(shí)施方案中,本文提供的切口平移通過使用選自dnapol1,bst和taq的切口平移聚合酶進(jìn)行。本領(lǐng)域已知的其他切口平移聚合酶也包括在本文提供的方法中。在一些實(shí)施方案中,本文提供的切口平移在含有生物素化dntp的反應(yīng)混合物中進(jìn)行。在一些實(shí)施方案中,本文提供的生物素化dntp是生物素化的dutp。在一些實(shí)施方案中,本公開的方法還包括加入磁性鏈霉親合素珠以富集生物素化的靶dna。
如圖7a中顯示,crispr-cas系統(tǒng)含有cas9切口酶,其中失活兩個核酸酶結(jié)構(gòu)域之一,例如d10a和h840cas9突變體。crispr-cas系統(tǒng)還含有指導(dǎo)rna,例如crrna和crrna-tracrrna嵌合體,其含有與靶dna序列基本上互補(bǔ)的序列。酶系統(tǒng)結(jié)合靶雙鏈dna并產(chǎn)生單鏈切口。該缺口充當(dāng)使用切口平移聚合酶如bst的切口平移的起始點(diǎn)。在切口平移期間,生物素化的dntp用于產(chǎn)生生物素標(biāo)記的dna片段,使得可以通過加入磁性鏈霉抗生物素珠來分離靶dna,如圖7a的左圖所示。在一些實(shí)施方案中,為了防止非特異性切口平移,可以使用本領(lǐng)域已知的各種方法(例如使用dna連接酶)除去cas9切割之前存在于dna中的切口,并且也可以用聚合酶填充或補(bǔ)回(chewedback)3’和5’突出端,如圖7a右圖中所示。在一些實(shí)施方案中,可以首先用dna聚合酶,連接酶和激酶的混合物處理靶定的dna,以除去任何預(yù)先存在的切口和隱性末端。將修復(fù)的dna與cas9切口酶復(fù)合物一起溫育,在基因組的靶定區(qū)域引入單鏈切口,其用于與生物素化核苷酸的切口平移反應(yīng)。在下拉測定中,用鏈霉親合素包被的珠富集基因組的生物素化的靶定區(qū)域。
在一些實(shí)施方案中,本公開的方法還包括提供具有第二crrna或其衍生物和第二cas蛋白或其變體的第二核酸酶系統(tǒng),其中所述第二crrna或其衍生物包含與所述靶核酸的第二區(qū)互補(bǔ)的第二靶物特異性核苷酸區(qū)域,并且其中所述第二cas蛋白含有一個失活的核酸酶結(jié)構(gòu)域,并且使含有所述靶核酸的雙鏈核酸與所述第二核酸酶系統(tǒng)接觸,以在靶核酸的第二區(qū)產(chǎn)生第二單鏈切口,其中所述靶核酸的第一區(qū)不同于所述靶核酸的第二區(qū)。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口在靶核酸的相同鏈上。在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上,并且第一cas9蛋白和第二cas9蛋白都含有在切割與其各自的crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變,使得第一單鏈切口和第二單鏈切口位于靶核酸的相同鏈上。在一些實(shí)施方案中,第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域含有切割與所述第二crrna互補(bǔ)的靶核酸鏈的所述結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是d10a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上,并且第一cas9蛋白和第二cas9蛋白都含有切割與其相應(yīng)的crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的突變,使得第一單鏈切口和第二單鏈切口位于靶核酸的相同鏈上。在一些實(shí)施方案中,第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與第一crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域含有切割與第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是h840a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的不同鏈上,并且兩個cas9蛋白保留不同的核酸酶結(jié)構(gòu)域,使得第一單鏈切口和第二單鏈切口在靶核酸的相同鏈上。在一些實(shí)施方案中,第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變是d10a,并且所述第二突變是h840a。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為20個堿基對(bp)至10kp。在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為20個堿基對(bp)至5kp。在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為20個堿基對(bp)至1000bp。在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為20個堿基對(bp)至500bp。在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口之間的間隔為約20bp,30bp,40bp,50bp,60bp,70bp,80bp,90bp,100bp,200bp,300bp,400bp或500bp。
在一些實(shí)施方案中,本公開的方法還包括加入捕獲探針;并且用捕獲探針交換第一單鏈切口和第二單鏈切口之間的單鏈核酸產(chǎn)物,其中捕獲探針能夠與與單鏈核酸產(chǎn)物互補(bǔ)的核酸鏈雜交。在一些實(shí)施方案中,捕獲探針的序列與單鏈核酸產(chǎn)物的序列10%至100%相同。在一些實(shí)施方案中,捕獲探針的序列與單鏈核酸產(chǎn)物的序列約10%,20%,30%,40%,50%,60%,70%,80%或90%相同。在一些實(shí)施方案中,本文提供的捕獲探針是生物素化的探針。在一些實(shí)施方案中,本公開的方法還包括加入磁性鏈霉親合素珠以富集靶核酸。
圖8a顯示了一個實(shí)施方案,其中cas9切口酶在靶dna的相同鏈上產(chǎn)生兩個連續(xù)的單鏈切口。如圖所示,加入兩個酶系統(tǒng),每個靶向靶dna序列的不同區(qū)域,因此在相同鏈上產(chǎn)生兩個連續(xù)的單鏈切口。然后用捕獲探針(例如生物素化的捕獲探針)替換兩個切口之間的單鏈dna產(chǎn)物,用于富集步驟。
在另一個實(shí)施方案中,如圖9所示,捕獲探針包含突出核苷酸序列,突出核苷酸序列與固定在表面上的寡聚物基本上互補(bǔ)。因此,突出端可以用于通過將突出端退火到固定在表面上的互補(bǔ)寡聚物來下拉靶dna。在一個實(shí)施方案中,突出端包含或互補(bǔ)于通用
在其它實(shí)施方案中,本文提供的方法可用于在重復(fù)區(qū)域中引入特定缺口。在一個實(shí)施方案中,捕獲探針具有“發(fā)夾”或是具有與靶dna互補(bǔ)的5’和3’區(qū)的錯配探針,如圖10所示。結(jié)果,每個重復(fù)單元被獨(dú)特標(biāo)志物(或條形碼)替換,允許引入標(biāo)志。標(biāo)志可以用于重復(fù)區(qū)域的組裝或計數(shù)重復(fù)的精確數(shù)目。
某些聚合酶(例如phi29)可以從缺口啟動切口平移。因此,在其他實(shí)施方案中,靶核酸的相同鏈上的第一單鏈切口和第二單鏈切口之間的間隔為1bp至20bp。在一些實(shí)施方案中,本文提供的方法可以進(jìn)一步包括進(jìn)行切口平移。在一些實(shí)施方案中,切口平移通過使用切口平移聚合酶phi29進(jìn)行。
在一些實(shí)施方案中,第一單鏈切口和第二單鏈切口在靶dna序列的相反鏈上,從而產(chǎn)生第一雙鏈dna斷裂末端。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相同鏈上;第一cas蛋白是具有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,其具有切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是具有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與所述第二crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變是d10a,并且第二突變是h840a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相反鏈上;第一cas蛋白是含有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與第一crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是具有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域具有切割與所述第二crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是d10a。
在一些實(shí)施方案中,靶核酸的第一區(qū)和靶核酸的第二區(qū)在靶核酸的相反鏈上;第一cas蛋白是具有一個失活的核酸酶結(jié)構(gòu)域的第一cas9蛋白,其具有切割與第一crrna不互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第一突變,并且第二cas蛋白是具有一個失活的核酸酶結(jié)構(gòu)域的第二cas9蛋白,所述核酸酶結(jié)構(gòu)域含有切割與所述第二crrna互補(bǔ)的靶核酸鏈的結(jié)構(gòu)域中的第二突變。在一些實(shí)施方案中,第一突變和第二突變都是h840a。
在一些實(shí)施方案中,在相對接近的核酸位置產(chǎn)生切口,并可產(chǎn)生平端斷裂。在一些實(shí)施方案中,在彼此相對較遠(yuǎn)處產(chǎn)生切口,并且可產(chǎn)生具有5’或3’突出端的粘性末端斷裂。在一些實(shí)施方案中,本發(fā)明的方法還包括將銜接頭連接到雙鏈核酸斷裂末端。在一些實(shí)施方案中,本公開的銜接頭是生物素化的。在一些實(shí)施方案中,本公開的方法包括加入磁性鏈霉親合素珠以富集靶核酸。
在一些實(shí)施方案中,本文提供的方法還包括提供具有第三crrna或其衍生物和第三cas蛋白或其變體的第三核酸酶系統(tǒng),其中所述第三crrna或其衍生物含有與所述靶核酸的第三區(qū)域基本上互補(bǔ)的第三靶物特異性核苷酸區(qū)域,并且其中所述第三cas蛋白含有一個失活的核酸酶結(jié)構(gòu)域;提供具有第四crrna或其衍生物和第四cas蛋白或其變體的第四核酸酶系統(tǒng),其中所述第四crrna或其衍生物包含與靶核酸的第四區(qū)基本上互補(bǔ)的第四靶物特異性核苷酸區(qū)酸,并且其中所述第四cas蛋白含有一個失活的核酸酶結(jié)構(gòu)域;并且使含有靶核酸的雙鏈核酸與第三和第四核酸酶系統(tǒng)接觸,以在靶核酸的第三區(qū)域產(chǎn)生第三單鏈切口,并且在靶核酸的第四區(qū)域產(chǎn)生第四單鏈切口,其中所述第三單鏈切口和所述第四單鏈切口在所述靶核酸的相反鏈上,從而產(chǎn)生第二雙鏈核酸斷裂末端,所述第二雙鏈核酸斷裂末端不同于第一個雙鏈核酸斷裂末端。
在一些實(shí)施方案中,第一和第二雙鏈核酸中斷末端之間的核酸片段可以含有10至數(shù)千個核苷酸。在一些實(shí)施方案中,可以加入捕獲探針,如單鏈寡聚物,dna啞鈴(dnadumbbells)和雙鏈dna銜接頭以標(biāo)記核酸片段。在一些實(shí)施方案中,本文提供的方法還包括將銜接頭連接至第二雙鏈核酸斷裂末端。
如圖11a所示,提供了兩對crispr-cas系統(tǒng)。每對酶包含兩個cas9切口酶,并且兩個cas9切口酶可以在dna的相反鏈上產(chǎn)生單鏈dna切口。因此,每對酶產(chǎn)生雙鏈dna斷裂末端,并且在靶dna序列的周圍或兩端產(chǎn)生兩個雙鏈dna斷裂末端。在一個實(shí)施方案中,兩個雙鏈dna斷裂末端之間的dna片段為約10kb。在一些實(shí)施方案中,兩個雙鏈dna斷裂末端之間的dna片段為約1kb,2kb,3kb,4kb,5kb,6kb,7kb,8kb或9kb。dna片段可以進(jìn)一步連接到靶物特異性生物素化的pcr銜接頭,藉此可以富集靶dna。
富集的雙鏈核酸可以進(jìn)一步進(jìn)行測序。在一個實(shí)施方案中,將富集的dna進(jìn)行片段標(biāo)簽化以成為較小的片段并引入到測序銜接頭。如圖11b所示,在一些實(shí)施方案中,本文提供的方法還包括在片段標(biāo)簽化前稀釋。在一個實(shí)施方案中,在pcr和/或片段標(biāo)簽化之前將富集的dna稀釋成單倍體含量。
在一些實(shí)施方案中,進(jìn)行nextera文庫制備(可得自illumina,inc,sandiego,ca)以片段化輸入dna并引入測序引物,然后將片段化的dna與本文提供的crispr-cas系統(tǒng)接觸以形成復(fù)合物。將復(fù)合物下拉,并且可以例如使用edta,熱,sds和rna酶從復(fù)合物中釋放靶dna。然后可以進(jìn)行測序。
在另一方面,本公開提供了使用包含兩個核酸酶結(jié)構(gòu)域的多種野生型cas9富集雙鏈dna的方法。在一些實(shí)施方案中,本文提供了用于富集靶核酸的方法,包括:提供用crrna組編程的cas9蛋白群體,其中所述crrna組包含與靶核酸的一系列不同區(qū)域互補(bǔ)的crrna;使靶核酸與用該crrna組編程的cas9蛋白群體接觸以產(chǎn)生一系列核酸片段,并將銜接頭連接到至少一個核酸片段上,其中cas9蛋白保留兩個核酸酶結(jié)構(gòu)域。
在一些實(shí)施方案中,該crrna組含有與靶核酸的兩個不同區(qū)域互補(bǔ)的crrna。本文提供的方法可用于富集長dna片段。在一些實(shí)施方案中,兩個不同區(qū)域之間的間隔長于10kb。
在一些實(shí)施方案中,靶核酸是雙鏈dna。在一些實(shí)施方案中,靶核酸是基因組dna,染色體dna,基因組或部分基因組。
如圖12a所示,各自含有兩個核酸酶結(jié)構(gòu)域的兩種cas9蛋白用于處理雙鏈核酸。每個cas9編程有靶向雙鏈dna上不同區(qū)域的crrna,因此反應(yīng)在兩個切割位點(diǎn)之間產(chǎn)生雙鏈dna片段。可以將dna片段連接到銜接頭上,并準(zhǔn)備用于其他過程和/或分析,例如下拉和測序。
在另一方面,本公開提供了cas9介導(dǎo)的核酸片段化和靶向測序的方法。本公開提供了在用戶定義的區(qū)域中以序列特異性方式使dna片段化并產(chǎn)生用于隨后測序的核酸片段的方法,例如適合于用于摻入illumina測序文庫的dna片段。在一些實(shí)施方案中,本文提供的靶核酸測序方法包括提供用crrna組編程的cas9蛋白質(zhì)群體,其中所述crrna組包含與靶核酸間的一系列不同區(qū)域互補(bǔ)的crrna;使靶核酸與用所述crrna組編程的cas9蛋白群體接觸以產(chǎn)生一系列核酸片段,并對所述一系列核酸片段測序。
在一些實(shí)施方案中,核酸的靶向片段化可以通過制備用靶向靶核酸間平鋪(tiled)的區(qū)域的crrna編程的cas9蛋白質(zhì)群體來實(shí)現(xiàn)。在一些實(shí)施方案中,本文提供的cas9蛋白保留兩個核酸酶結(jié)構(gòu)域,它們可以產(chǎn)生雙鏈核酸斷裂,并因此產(chǎn)生一系列核酸片段。這些核酸片段可以進(jìn)一步進(jìn)行核酸測序工作流程。
可以用多個cas9蛋白群體分開處理相同的核酸樣品,所述多個cas9蛋白群體由靶向靶核酸間平鋪的區(qū)域的不同crrna組編程。由每個群體產(chǎn)生的核酸片段與由另一個群體產(chǎn)生的核酸片段重疊。更可靠和全面的測序數(shù)據(jù)可以通過對具有重疊序列的核酸片段測序來實(shí)現(xiàn)。在一些實(shí)施方案中,本文提供的靶核酸測序方法包括提供多個cas9蛋白群體,每個cas9蛋白群體用不同組的crrna編程,其中每組crrna含有與靶核酸間的不同系列區(qū)域互補(bǔ)的crrna;在單獨(dú)的反應(yīng)中使靶核酸與多個cas9蛋白群體中的每一個接觸以產(chǎn)生不同系列的核酸片段,并對核酸片段進(jìn)行測序。
在一些實(shí)施方案中,多個cas9蛋白質(zhì)群體包括三個cas9蛋白質(zhì)群體,并且其中由三個cas9蛋白質(zhì)群體中的每一個產(chǎn)生的核酸片段含有與由cas9蛋白的三個群體的至少另一個產(chǎn)生的核酸片段的重疊序列。如圖12b所示,用cas9蛋白處理10kb靶dna,所述cas9蛋白用靶向靶dna序列間具有約500bp間隔的區(qū)域的三組crrna編碼。每組crrna包含約57個crrna。cas9蛋白保持與切割的dna的末端非共價締合,通過用蛋白酶或去污劑處理樣品可以釋放切割的靶dna。然后,合并切割產(chǎn)物并轉(zhuǎn)化為測序文庫,例如使用illumina的truseqnano工作流程??梢栽趩为?dú)的反應(yīng)中使用不同組的crrna進(jìn)行切割。例如,如圖12b所示,在3個管(罐1,罐2和罐3)中進(jìn)行切割,具有用產(chǎn)生大約500bp大小的重疊片段的crna重建的cas9復(fù)合物的三個文庫。這種重疊片段可以提高測序精確度。
在一些實(shí)施方案中,本公開提供了用于靶向單倍型測序(定相測序)的方法。在一些實(shí)施方案中,本文提供的方法還包括將含有靶dna的dna樣品稀釋為單倍體含量。相或單倍型信息(其指二倍體生物體中兩條同源染色體的獨(dú)特內(nèi)容)提供了一種有用的工具,以更好地理解人類dna序列和表型(包括疾病)之間的關(guān)系。本公開提供了使用crispr-cas系統(tǒng)的單元型測序的方法。單倍型測序工作流可以利用cas9蛋白保持在切割的dna的末端的能力。由于cas9蛋白保持與切割的dna的末端締合,這創(chuàng)建了大小與靶序列中cas9靶區(qū)域之間的數(shù)目和距離成比例的dna的單倍型區(qū)段。在一些實(shí)施方案中,在切割后,反應(yīng)可以在微量滴定孔中稀釋至亞單倍型水平,然后可以用蛋白酶處理以釋放連接的片段,并且轉(zhuǎn)化為測序文庫,例如使用可獲自illumina,inc.(sandiego,ca)的truseqnano文庫制備方法。
如圖12c所示,用cas9蛋白處理10kb靶dna,所述cas9蛋白用靶向靶dna序列間具有約500bp間隔的區(qū)域的crrna組編碼。切割后,將反應(yīng)在微量滴定孔中稀釋至亞單倍型水平。然后,可以通過用蛋白酶或去污劑處理樣品釋放切割的靶dna。然后,合并切割產(chǎn)物并轉(zhuǎn)化為測序文庫,例如使用illumina的truseqnano工作流程??梢允褂镁哂胁煌Mcrrna的多個反應(yīng)進(jìn)行切割。例如,如圖12c所示,在3個管(罐1,罐2和罐3)中進(jìn)行切割,所述管具有用產(chǎn)生大約500bp大小的重疊片段的crna重建的3個cas9復(fù)合物文庫。此類重疊片段可以提高單倍型測序精確度。
在一些實(shí)施方案中,本文提供的靶核酸是雙鏈dna。在一些實(shí)施方案中,本文提供的靶核酸是基因組dna,染色體dna,基因組或部分基因組。
在一些實(shí)施方案中,可以例如使用有限循環(huán)聚合酶鏈反應(yīng)(pcr)擴(kuò)增核酸片段以引入其它末端序列或銜接頭,例如索引,通用引物和簇形成和測序所需的其它序列。
在一些實(shí)施方案中,核酸片段的測序包括使用下列一種或多種:合成測序,橋式pcr,鏈終止測序,雜交測序,納米孔測序和連接測序。
在一些實(shí)施方案中,本文提供的方法中使用的測序方法是合成測序(sbs)。在sbs中,監(jiān)測核酸引物沿核酸模板(例如靶核酸或其擴(kuò)增子)的延伸以確定模板中的核苷酸序列。根本的化學(xué)過程可以是聚合(例如,通過聚合酶催化)。在特定的基于聚合酶的sbs實(shí)施方案中,以模板依賴性方式將熒光標(biāo)記的核苷酸加入引物(從而延伸引物),使得加入引物的核苷酸的順序和類型的檢測可用于確定模板的序列。
可以使用使用循環(huán)反應(yīng)的其他測序程序,如焦磷酸測序。焦磷酸測序檢測在特定核苷酸被摻入新生核酸鏈時無機(jī)焦磷酸(ppi)的釋放(ronaghi,etal.,analyticalbiochemistry242(1),84-9(1996);ronaghi,genomeres.11(1),3-11(2001);ronaghietal.science281(5375),363(1998);us6,210,891;us6,258,568andus.6,274,320,其各自通過引用并入本文)。在焦磷酸測序中,可以通過atp硫酸化酶立即轉(zhuǎn)化為三磷酸腺苷(atp)來檢測釋放的ppi,并且可以通過螢光素酶產(chǎn)生的光子檢測產(chǎn)生的atp的水平。因此,可以通過發(fā)光檢測系統(tǒng)監(jiān)測測序反應(yīng)。用于基于熒光的檢測系統(tǒng)的激發(fā)輻射源對于焦磷酸測序程序不是必需的??梢赃m于將焦磷酸測序應(yīng)用于根據(jù)本公開產(chǎn)生的擴(kuò)增子的有用的流體系統(tǒng),檢測器和程序例如描述于以下文獻(xiàn)中:wipopat.app.ser.no.pct/us11/57111,us2005/0191698a1,us7,595,883,以及us7,244,559,其各自通過引用并入本文。
一些實(shí)施方案可以利用涉及dna聚合酶活性的實(shí)時監(jiān)測的方法。例如,核苷酸摻入可以通過帶熒光團(tuán)的聚合酶和γ-磷酸鹽標(biāo)記的核苷酸之間的熒光共振能量轉(zhuǎn)移(fret)相互作用或者用zeromode波導(dǎo)(zmw)來檢測。用于基于fret的測序的技術(shù)和試劑描述于例如leveneetal.science299,682–686(2003);lundquistetal.opt.lett.33,1026–1028(2008);korlachetal.proc.natl.acad.sci.usa105,1176–1181(2008),其公開內(nèi)容通過引用并入本文。
一些sbs實(shí)施方案包括檢測在將核苷酸摻入延伸產(chǎn)物中時釋放的質(zhì)子。例如,基于檢測釋放的質(zhì)子的測序可以使用可從iontorrent(guilford,ct,alifetechnologiessubsidiary)購得的電檢測器和相關(guān)技術(shù)或us2009/0026082a1;us2009/0127589a1;us2010/0137143a1;或us2010/0282617a1(其各自通過引用并入本文)中描述的測序方法和系統(tǒng)。本文中列出的使用動力學(xué)排除法擴(kuò)增靶核酸的方法可以容易地應(yīng)用于用于檢測質(zhì)子的基底。更具體地,本文中列出的方法可用于產(chǎn)生用于檢測質(zhì)子的擴(kuò)增子的克隆群體。
另一種有用的測序技術(shù)是納米孔測序(參見,例如,deameretal.trendsbiotechnol.18,147–151(2000);deameretal.acc.chem.res.35:817-825(2002);lietal.nat.mater.2:611–615(2003),其公開內(nèi)容通過引用并入本文)。在一些納米孔實(shí)施方案中,從靶核酸除去的靶核酸或單個核苷酸通過納米孔。當(dāng)核酸或核苷酸通過納米孔時,可以通過測量孔的電導(dǎo)率的波動來鑒定每種核苷酸類型。(u.s.patentno.7,001,792;sonietal.clin.chem.53,1996–2001(2007);healy,nanomed.2,459–481(2007);cockroftetal.j.am.chem.soc.130,818–820(2008),其公開內(nèi)容通過引用并入本文)。
從前面的描述中,顯而易見的是,可以對本文所述的本發(fā)明進(jìn)行變化和修改以采用其進(jìn)行各種用途和條件。這些實(shí)施方案也在所附權(quán)利要求書的范圍內(nèi)。
本文對變量的任何定義中的要素列表的列舉包括該變量作為列出的要素的任何單個要素或組合(或子組合)的定義。本文實(shí)施方案的敘述包括作為任何單個實(shí)施方案或與任何其它實(shí)施方案或其部分組合的實(shí)施方案。
本說明書中提及的所有專利和出版物通過引用并入本文,其程度如同每個獨(dú)立的專利和出版物具體且單獨(dú)地指明通過引用并入一樣。
通過說明而非限制的方式提供以下實(shí)施例。
實(shí)施例
實(shí)施例1:使用含有野生型cas9蛋白的crispr-cas系統(tǒng)富集靶dna
本實(shí)施例例示了使用含有保留兩個核酸酶結(jié)構(gòu)域兩者的核酸酶活性的野生型cas9蛋白的crispr-cas系統(tǒng)富集靶dna序列的方法。圖2a的左圖顯示了實(shí)驗的方案。首先,用限制酶alwni(其在braf序列外產(chǎn)生dna斷裂)處理含有野生型braf序列的3550bp的質(zhì)粒。其次,加入含有野生型cas9蛋白和生物素標(biāo)記的指導(dǎo)rna的crispr-cas系統(tǒng)。指導(dǎo)rna含有與野生型braf序列互補(bǔ)的序列,因此酶系統(tǒng)識別并結(jié)合braf序列的區(qū)域以形成復(fù)合物。cas9核酸在braf區(qū)域切割以產(chǎn)生兩個dna片段:一個是2250bp,而另一個是1300bp。第三,然后加入可以結(jié)合生物素的鏈霉親合素珠。最后,在洗滌珠子并用蛋白酶洗脫后,將cas9下拉的上清液和珠洗脫樣品進(jìn)行聚丙烯酰胺凝膠電泳,并且通過磷光成像(phosphorimaging)使結(jié)果顯現(xiàn)。實(shí)驗使用對照crrna,用生物素化dutp(ivt)完全標(biāo)記的crrna和在3’末端具有2個生物素基團(tuán)的crrna(biosynthesis)進(jìn)行。凝膠電泳結(jié)果顯示在圖2a的右圖中。如所示,當(dāng)使用對照crrna時,兩個dna片段(一個約2250bp和一個約1300bp)存在于cas9下拉上清液中。但這些dna片段不在珠洗脫中。相比之下,當(dāng)使用ivt生物素化的crrna或biosynthesis雙生物素crrna時,如果可檢測的話,cas9下拉上清液中的兩個dna片段的量大大降低。相反,兩個dna片段存在于珠洗脫中。
還使用bgl1限制性酶進(jìn)行實(shí)驗。具體地,實(shí)驗的方案在圖2b的左圖中顯示。首先,用限制酶bgl1(其在braf序列外產(chǎn)生兩個dna斷裂)處理含有野生型braf序列的3550bp的質(zhì)粒。結(jié)果,將質(zhì)粒分成兩個dna片段:一個是含有braf序列的2464bp,而另一個是1118bp。其次,加入含有野生型cas9蛋白和生物素標(biāo)記的指導(dǎo)rna的crispr-cas系統(tǒng)。指導(dǎo)rna含有與野生型braf序列互補(bǔ)的序列,因此酶系統(tǒng)識別并結(jié)合2464bp片段內(nèi)的braf序列區(qū)域以形成復(fù)合物。cas9核酸酶在braf區(qū)域切割以產(chǎn)生兩個dna片段:一個是1854bp,而另一個是610bp。第三,然后加入可以結(jié)合生物素的鏈霉親合素珠。最后,在洗滌珠并用蛋白酶洗脫后,將cas9下拉的上清液和珠洗脫樣品進(jìn)行聚丙烯酰胺凝膠電泳,并且通過磷光成像使結(jié)果顯現(xiàn)。結(jié)果顯示在圖2b的右圖中。如所示,當(dāng)crrna未被生物素化時,上清液含有三個具有1854bp,1118bp和610bp的dna片段;但是這三種dna片段在珠洗脫中不存在。相比之下,當(dāng)使用生物素化的crrna時,珠洗脫包含兩個具有1854bp和610bp的dna片段。應(yīng)注意,當(dāng)用250mmnacl洗滌鏈霉親合素珠時,珠洗脫液含有指示非特異性結(jié)合的可檢測的1118bpdna片段。當(dāng)使用高鹽洗滌(500mmnacl)時,顯示了改善的結(jié)合特異性。如所示,當(dāng)用500mmnacl洗滌珠時,1118bp片段的量在珠洗脫中顯著降低。
這些實(shí)驗的結(jié)果顯示野生型cas9蛋白在切割后保留在dna末端,并且這種結(jié)合足以下拉核酸酶-dna復(fù)合物用于富集。
實(shí)施例2:自低復(fù)雜性nextera質(zhì)粒文庫的cas9切口酶介導(dǎo)的片段富集
本實(shí)施例例示了使用含有cas9切口酶的crispr-cas系統(tǒng)富集dna片段的方法。如圖2c所示,含有braf靶位點(diǎn)的質(zhì)粒首先進(jìn)行tn5介導(dǎo)的片段標(biāo)簽化以產(chǎn)生dna片段群體。然后,將包含cas9切口酶和靶向braf序列的生物素標(biāo)記的crrna的crispr-cas9系統(tǒng)加入片段中。crispr-cas9系統(tǒng)特異性結(jié)合含有braf序列的dna片段。通過使用鏈霉親合素珠下拉生物素及其相關(guān)組分,富含含有braf序列的dna片段。從蛋白質(zhì)洗脫后,將富集的dna片段進(jìn)一步進(jìn)行dna擴(kuò)增和測序。測序的結(jié)果顯示在圖2d中。如圖所示,成功地富集含有braf序列的靶dna片段。
實(shí)施例3:將通過crispr-cas系統(tǒng)富集的靶dna進(jìn)行片段標(biāo)簽化
靶質(zhì)粒含有跨越v600密碼子的braf序列的一部分。生物素化的crrna設(shè)計成靶向跨越v600密碼子的20bp。將50ng靶質(zhì)粒dna用cas9復(fù)合物(生物素化的)和bgli限制酶在1×neb緩沖液3.1中在20μl反應(yīng)中在37℃下切割15分鐘。反應(yīng)溫度和珠結(jié)合溫度可以升高至48℃以減少cas9與非靶dna的背景(非特異性)結(jié)合。高達(dá)500mmnacl也可用于結(jié)合反應(yīng)和洗滌以減少背景結(jié)合。將20ul
實(shí)施例4:cas9蛋白的純化和cas9蛋白的活性和特異性的測試
圖9a顯示了bl21細(xì)胞中cas9融合蛋白的表達(dá)。用編碼四種mbp_cas9融合變體的表達(dá)載體轉(zhuǎn)化bl21細(xì)胞:野生型和三種突變體,包括單突變體d10a,h840a和d10a_h840a雙突變體。在37℃下良好通氣培養(yǎng)細(xì)胞培養(yǎng)物,在od600為1下用iptg(0.2mm)誘導(dǎo),轉(zhuǎn)移至17℃,并在充分通氣下再培養(yǎng)16小時。將細(xì)胞沉淀,裂解,并通過sds_page分析誘導(dǎo)前(在圖中表示為1)和后(圖中用2表示)的細(xì)胞蛋白質(zhì)。在iptg誘導(dǎo)后樣品中約250kda條帶的存在證實(shí)了所有四種mbp_cas9融合蛋白的表達(dá)。
m10acas9切口酶的純化示于實(shí)施例2中。使用表達(dá)有his標(biāo)簽的cas9m10切口酶的1l細(xì)胞培養(yǎng)物產(chǎn)生細(xì)胞裂解物,然后通過his柱運(yùn)行以進(jìn)行純化。然后用緩沖液(butter)洗柱。最后,從柱中洗脫蛋白質(zhì)。從細(xì)胞裂解物,清洗前的his柱,流過清洗緩沖液(follow-throughwashingbuffer)和洗脫液采集樣品。具體地,在bl21細(xì)胞(泳道1)中表達(dá)含有n末端六組氨酸標(biāo)簽的mbp_cas9融合蛋白,用his柱層析純化,并使用tev消化(泳道2)除去his_mbp標(biāo)簽。離子交換層析用于從未消化的mbp_cas9融合物和完全加工的cas9(泳道4)的剩余物(leftover)中分離his_mbp標(biāo)簽(泳道3)。通過凝膠電泳分析樣品,并且結(jié)果示于圖6b中。如所示,檢測到m10acas9切口酶并在洗脫液中富集。
分析野生型cas9和cas9切口酶兩者的活性。通過用t7rna聚合酶體外轉(zhuǎn)錄產(chǎn)生兩種crrna和一種tracrrna,純化,并且每種crrna(10um)與tracrrna以相等的摩爾比退火。在cas9切割緩沖液(20mmhepesph7.5,150mmkcl,10mmmgcl2,0.5mmdtt)中,將每種crrna:tracrrna雙鏈體(1um)與純化的cas9野生型或d10a切口酶(0.5um)在37℃下溫育10分鐘。將形成的復(fù)合物與相應(yīng)的靶dna擴(kuò)增子(0.025um)溫育不同的時間。通過加入edta(10mm)終止反應(yīng),并用zymodna純化-濃縮柱純化復(fù)合物。在8%tbe-尿素paag上分離純化的dna,并用sybrgold染色顯色。
如圖6c左側(cè)的圖所示,310bp靶擴(kuò)增子描繪為兩條黑線,表示在頂圖上由野生型cas9切割的兩條dna鏈,或者在底圖上d10a切口酶僅對頂鏈產(chǎn)生切口。cas9wt和d10a切口酶識別位點(diǎn)距離靶擴(kuò)增子的5’端為160個堿基。用包含互補(bǔ)crrna(1和2)的野生型cas9(wt)或d10a切口酶cas9(d10a)分別消化兩個擴(kuò)增子(1和2)。在8%tbe-尿素凝膠上分析切割產(chǎn)物。如所示,在與0.5umcas9復(fù)合物在37℃溫育3小時后有效切割100ng擴(kuò)增子dna。
還用m10acas9切口酶在37℃處理310bp擴(kuò)增子(如圖6d右圖所示)30分鐘、60分鐘或90分鐘。結(jié)果顯示在圖6d的左圖中。如所示,當(dāng)cas9切口酶和crrna都存在于復(fù)合物中時,如箭頭所示檢測到有切口的產(chǎn)物。隨著反應(yīng)時間增加,產(chǎn)生更多的有切口的產(chǎn)物。
接下來,測試純化的m10acas9切口酶的切口產(chǎn)生特異性。通過用t7rna聚合酶體外轉(zhuǎn)錄產(chǎn)生兩種crrna和一種tracrrna,純化,并且每種crrna(10um)與tracrrna以相等的摩爾比退火。在cas9切割緩沖液(20mmhepesph7.5,150mmkcl,10mmmgcl2,0.5mmdtt)中,將每種crrna:tracrrna雙鏈體(1um)與純化的d10a切口酶(0.5um)在37℃下溫育10分鐘。將形成的復(fù)合物與互補(bǔ)和不互補(bǔ)的靶dna擴(kuò)增子(0.025um)溫育72小時。通過加入edta(50mm)終止反應(yīng),在6%tbe-尿素paag上分離并用sybrgold染色顯現(xiàn)。
圖6e左側(cè)的小圖顯示了310bp靶擴(kuò)增子,描繪為兩條黑線,代表具有被d10a切口酶切割的頂鏈的兩條dna鏈。d10a切口酶識別位點(diǎn)距離靶擴(kuò)增子的5’端為160個堿基。用與互補(bǔ)的或非互補(bǔ)crrna:tracrrna雙鏈體形成的d10a切口酶復(fù)合物將兩個擴(kuò)增子(1和2)單獨(dú)消化72小時。如圖6e所示,僅當(dāng)靶擴(kuò)增子和crrna互補(bǔ)時,觀察到切口產(chǎn)物。
實(shí)施例5切口平移
在本實(shí)施例中,使用鏈霉親合素移位測定(streptavidinshiftassay)分析在切口平移期間摻入不同生物素-dntp的效率。在進(jìn)行切口平移并將各種dntp摻入翻譯產(chǎn)物后,將鏈霉親合素加入反應(yīng)產(chǎn)物中,并通過與生物素標(biāo)記的dntp結(jié)合而與翻譯產(chǎn)物形成復(fù)合物。然后,進(jìn)行電泳遷移率移位測定以分析翻譯產(chǎn)物。
具體地,將3ug源自含有nb.btsi切口內(nèi)切核酸酶識別位點(diǎn)的人基因組的hla區(qū)的120bp長的擴(kuò)增子在37℃下與5單位的nb.btsi在cutsmarttm緩沖液(50mm乙酸鉀,20mmtris-乙酸鹽,10mm乙酸鎂,100μg/mlbsa,ph7.9)中溫育1小時。通過用t7rna聚合酶體外轉(zhuǎn)錄產(chǎn)生一個crrna和一個tracrrna,純化,并且將crrna(10um)以等摩爾比與tracrrna退火。將crrna:tracrrna雙鏈體(1um)與純化的cas9d10a切口酶(0.5um)在cas9切割緩沖液(20mmhepesph7.5,150mmkcl,10mmmgcl2,0.5mmdtt)中37℃溫育10分鐘。將形成的復(fù)合物與靶dna擴(kuò)增子(0.025um)溫育3小時。通過加入edta(10mm)終止反應(yīng),并用zymodna純化-濃縮柱純化復(fù)合物。采用純化的dna用于切口平移反應(yīng)。將包含10ngdna擴(kuò)增子,50μm每種dntp,10μm生物素-dgtp或生物素-dutp,切口平移緩沖液和2單位的bstdna聚合酶的20ul切口平移反應(yīng)在37℃溫育30分鐘,用edta(50mm)終止,并用zymodna純化-濃縮柱純化。將純化的dna分開,并且一半在室溫下與10μg鏈霉親合素一起溫育10分鐘。在8%tbepaag上分離所有樣品并用sybrgold染色顯現(xiàn)。
結(jié)果示于圖7b中。左圖顯示了當(dāng)在切口平移期間使用生物素-dgtp時的凝膠位移測定結(jié)果。右圖顯示了在切口平移期間使用生物素-dutp時的凝膠移位測定結(jié)果。如所示,生物素-dgtp比生物素-dutp更有效地?fù)饺耄卜翘禺愋缘負(fù)饺敕乔锌赿na中。
使用bst聚合酶和生物素-dutp舉例說明使用切口平移的dna富集。分析了三種靶dna序列:hla-a3(100bp),1037(300bp)和1216(300bp)。然后,使用定量pcr定量dna富集。在用切口內(nèi)切核酸酶nb.btsi切口的120bp擴(kuò)增子上和在用cas9d10a切口酶切口的300bp擴(kuò)增子上進(jìn)行切口平移。用生物素-dgtp(圖i)或生物素-dutp(圖ii)補(bǔ)充切口翻譯反應(yīng)混合物。切口平移后,取每個樣品的一半用于鏈霉親合素移位測定(s.a),隨后在8%tbe-paag上進(jìn)行分析。在該切口平移實(shí)驗中,使用bstdna聚合酶。
具體地,將來自含有nb.btsi切口內(nèi)切核酸酶識別位點(diǎn)的人基因組的hla區(qū)的3μg擴(kuò)增子在37℃下與5單位的nb.btsi在cutsmarttm緩沖液(50mm乙酸鉀,20mmtris-乙酸鹽,10mm乙酸鎂,100μg/mlbsa,ph7.9)中溫育1小時。通過用t7rna聚合酶體外轉(zhuǎn)錄產(chǎn)生兩種crrna和一種tracrrna,純化,并且每種crrna(10um)與tracrrna以相等的摩爾比退火。將crrna:tracrrna雙鏈體(1um)與純化的cas9d10a切口酶(0.5um)在cas9切割緩沖液(20mmhepesph7.5,150mmkcl,10mmmgcl2,0.5mmdtt)中于37℃溫育10分鐘。將形成的復(fù)合物與靶dna擴(kuò)增子(0.025um)溫育3小時。通過加入edta(10mm)終止反應(yīng),并用zymodna純化-濃縮柱純化復(fù)合物。在基因組dna文庫背景(使用illumina的v2nextera文庫制備試劑盒根據(jù)制造商方案(可獲自illunimainc.,sandiego,ca)制備)中,采用純化的dna進(jìn)行切口平移反應(yīng)。將含有0.5ngdna擴(kuò)增子,100ng基因組dna文庫,50um每種dntp,10um生物素-dutp,切口平移緩沖液和2單位bstdna聚合酶的20ul切口平移反應(yīng)在37℃下溫育30分鐘,并且用edta(10mm)終止。用40μl鏈霉親合素磁珠下拉的生物素化的dna用100nggdna和100μgbsa預(yù)結(jié)合。因此,用高和低鹽洗滌緩沖液洗滌珠,并且用naoh從珠洗脫靶向的擴(kuò)增子,隨后進(jìn)行ph中和。通過qpcr使用對靶向擴(kuò)增子和人alusx5重復(fù)序列(用作標(biāo)準(zhǔn)化對照)特異性的引物分析適當(dāng)稀釋的洗脫物質(zhì)和輸入對照。
結(jié)果顯示于圖7c中,左圖呈現(xiàn)了在靶擴(kuò)增子切口平移后鏈霉親合素下拉測定法中富集的三種不同擴(kuò)增子(hla_a3、1037和1216)的qpcr分析結(jié)果。將有切口(切口)和沒有切口(無切口)的靶dna擴(kuò)增子摻入100ng的基因組dna文庫中,用或不用生物素-dutp(生物素/無生物素)進(jìn)行切口平移,并用磁性鏈霉親合素珠將所得的生物素化dna下拉。右圖呈現(xiàn)了在下拉測定中攜帶的基因組dna文庫的qpcr分析的結(jié)果?;疑珬l代表標(biāo)準(zhǔn)化的cq值,條上方的數(shù)字描繪不同擴(kuò)增子和基因組dna文庫的倍數(shù)富集。如所示,僅在切口平移反應(yīng)混合物中含有切口靶物和生物素-dutp的條件下觀察到靶dna的富集。
實(shí)施例6:通過使用含cas9切口酶的crispr-cas系統(tǒng)產(chǎn)生雙切口來富集靶dna
在本實(shí)施例中例示了通過在相同dna鏈上使用crispr-cas系統(tǒng)產(chǎn)生雙切口來富集靶dna。用兩個cas9切口酶系統(tǒng)處理230bp的雙鏈dna。每個系統(tǒng)可以在相同dna鏈上產(chǎn)生缺口,如圖8b的左圖所示。
通過用t7rna聚合酶體外轉(zhuǎn)錄產(chǎn)生兩種crrna和一種tracrrna,純化,并且量每種crrna(10um)與tracrrna以相等的摩爾比退火。在cas9切割緩沖液(20mmhepesph7.5,150mmkcl,10mmmgcl2,0.5mmdtt)中,將每種crrna:tracrrna雙鏈體(1um)與純化的cas9切口酶(0.5um)在37℃下溫育15分鐘。拉出形成的復(fù)合物并與靶dna擴(kuò)增子(0.025um)溫育指定時間。通過用zymodna純化-濃縮柱的復(fù)合物純化停止反應(yīng),并在8%tbe-尿素paag上分析。結(jié)果顯示在圖8b的右圖中。如圖所示,發(fā)生雙切口產(chǎn)生,如63bpdna片段所證明的。
作為在相同鏈上雙切口產(chǎn)生的結(jié)果產(chǎn)生的63bp單鏈dna片段可以用如上所述的探針置換,其在本實(shí)施例中例示。用cas9切口酶系統(tǒng)處理至2.5ng的300bp擴(kuò)增子后,加入60mer生物素化探針并與靶dna雜交。具體地,在含有一種或兩種crrna:tracrrna雙鏈體(0.05um)的cas9復(fù)合物(0.1um)的cas9切割緩沖液中將靶dna(0.005um)產(chǎn)生切口3小時。通過用zymodna純化-濃縮柱進(jìn)行復(fù)合物純化來停止切口產(chǎn)生反應(yīng)。將所得純化的dna(4nm)與100倍摩爾過量的生物素化捕獲探針混合,并將含有100ng人基因組文庫dna的不同等分試樣在85℃,75℃,70℃,65℃,60℃溫育2分鐘,隨后逐漸冷卻至40℃。無切口的靶擴(kuò)增子與沒有生物素化捕獲探針的樣品一起經(jīng)歷相同的變性-退火條件。用鏈霉親合素包被的磁珠將形成的帶切口的擴(kuò)增子和生物素化捕獲探針的異雙鏈體下拉,并用基因組dna封閉以防止非特異性靶擴(kuò)增子結(jié)合。因此,用高和低鹽洗滌緩沖液洗滌兩次珠,并且用naoh從珠洗脫靶向的擴(kuò)增子,隨后進(jìn)行ph中和。通過qpcr使用對靶向擴(kuò)增子和人alusx5重復(fù)(用作標(biāo)準(zhǔn)化對照)特異性的引物分析適當(dāng)稀釋的洗脫材料和輸入對照。
結(jié)果示于圖8e中。如所示,當(dāng)不加入捕獲探針時,沒有富集;在完全變性條件下,對于所有靶dna都觀察到富集。在部分變性條件下,觀察到有切口的dna的靶向富集。qpcr結(jié)果顯示在用兩個cas9切口酶對相同鏈上產(chǎn)生切口的擴(kuò)增子的成功富集。
在本實(shí)施例中還例示了通過在使用crispr-cas系統(tǒng)對相對dna鏈上產(chǎn)生雙切口來富集靶dna。如圖8c所示,進(jìn)行300bp擴(kuò)增子的相對鏈上的切口產(chǎn)生,并使用凝膠電泳分析產(chǎn)生的片段。
具體地,將靶dna在37℃下在具有cas9切口產(chǎn)生反應(yīng)的不同組分的cas9切割緩沖液中溫育3小時,如凝膠圖像的頂部所示。通過用zymodna純化-濃縮柱進(jìn)行復(fù)合物純化來停止切口產(chǎn)生反應(yīng)。將洗脫樣品的等分試樣在天然8%paag上加載。結(jié)果示于圖8c中。頂部兩條帶代表原始dna擴(kuò)增子,并且在具有兩種crrna的泳道中更快的遷移條帶代表有切口的產(chǎn)物。
圖8d顯示在75℃下短暫溫育后原始和有切口的靶向擴(kuò)增子的8%paag凝膠分析。將靶dna在cas9切割緩沖液中在37℃在cas9切口產(chǎn)生緩沖液的不同組分的cas9切割緩沖液中溫育3小時,如凝膠圖像的頂部所示。通過用zymodna純化-濃縮柱進(jìn)行復(fù)合物純化來停止切口產(chǎn)生反應(yīng)。將洗脫樣品的等分試樣在75℃溫育3分鐘,立即轉(zhuǎn)移到冰上,并在凝膠上加載。頂部兩條帶代表原始dna擴(kuò)增子,具有兩種crrna中單種的泳道中更快的遷移條帶對應(yīng)于有切口的產(chǎn)物。如所示,產(chǎn)生具有適當(dāng)大小的單鏈dna。
實(shí)施例7:cas9介導(dǎo)的braf靶dna的靶物富集
圖13顯示了cas9切割測定1300的實(shí)例的流程圖。cas9切割測定1300可以包括但不限于以下步驟。
在步驟1310,通過限制性內(nèi)切核酸酶消化使包含靶dna序列的質(zhì)粒線性化。在一個實(shí)例中,靶dna序列是brafdna序列,并且通過alwni限制性內(nèi)切核酸酶消化使質(zhì)粒線性化。
在步驟1315,形成cas9內(nèi)切核酸酶復(fù)合物,并切割靶向的brafdna序列。cas9內(nèi)切核酸酶復(fù)合物包含cas9內(nèi)切核酸酶,靶物特異性crrna和輔助tracrrna。crrna和tracrrna形成“指導(dǎo)rna”,其將cas9內(nèi)切核酸酶靶向到用于雙鏈dna切割的靶定dna序列。在一個實(shí)例中,cas9內(nèi)切核酸酶是切割靶dna序列的兩條鏈的野生型cas9內(nèi)切核酸酶。在一個實(shí)例中,用標(biāo)簽如生物素標(biāo)簽標(biāo)記crrna和/或tracrrna(即,crrna和tracrrna是生物素化的)。在另一個實(shí)例中,crrna和tracrrna是未標(biāo)記的。
在任選的步驟1320,使用鏈霉親合素包被的磁響應(yīng)珠分離cas9復(fù)合物。其中具有片段化靶brafdna的cas9復(fù)合物通過生物素化的crrna和tracrrna和鏈霉親合素包被的珠之間形成的生物素-鏈霉親合素結(jié)合復(fù)合物結(jié)合到鏈霉親合素包被的珠的表面。
在步驟1325,使用蛋白酶反應(yīng)消化cas9內(nèi)切核酸酶以釋放靶向且切割的brafdna片段。通過例如瓊脂糖凝膠電泳檢測釋放的brafdna片段。
圖14圖示了圖13的cas9切割測定1300的步驟。即,質(zhì)粒1410包括靶brafdna序列1415。在cas9切割測定1300的步驟1310,通過alwni限制性內(nèi)切核酸酶消化使質(zhì)粒1410線性化。在該實(shí)例中,質(zhì)粒1410的大小約為3582bp。在cas9切割測定1300的步驟1315,形成包含cas9內(nèi)切核酸酶1420,靶物特異性crrna1425(例如,braf特異性crrna)和tracrrna1430的cas9復(fù)合物。靶物特異性crrna1425和tracrrna1430形成“靶向rna”,其將cas9內(nèi)切核酸酶1420靶向質(zhì)粒1410中的靶brafdna序列1415。在該實(shí)例中,靶物特異性crrna1425和tracrrna1430是生物素化的。在另一個實(shí)例(未顯示)中,靶物特異性crrna1425和tracrrna1430不是標(biāo)記的。靶物brafdna序列1415被cas9內(nèi)切核酸酶1420切割以產(chǎn)生一對cas9切割片段1435,即約1242bp的片段1435a和約2340bp的片段1435b,每個包含靶brafdna序列1415的一部分。在cas9切割測定1300的任選步驟1320,鏈霉親合素包被的磁響應(yīng)珠用于“下拉”cas9復(fù)合物和其中的片段1435a和1435b。在cas9切割測定1300的步驟1325,使用蛋白酶反應(yīng)消化cas9內(nèi)切核酸酶1420,并釋放片段1435a和1435b。
圖15顯示了使用圖13的cas9切割測定1300單獨(dú)或在包含braf質(zhì)粒dna和基因組dna的混合物中的braf質(zhì)粒dna片段化的瓊脂糖凝膠的照片1500。在該實(shí)例中,cas9內(nèi)切核酸酶是野生型內(nèi)切核酸酶。使用非生物素化的crrna和tracrrna進(jìn)行陰性對照反應(yīng)(“陰性對照”)。使用生物素化的crrna和tracrrna進(jìn)行陽性對照反應(yīng)(“陽性對照”)。使用體外轉(zhuǎn)錄試劑盒(即,biotinivt試劑盒)制備crna和tracrrna。雙生物素化的crrna和tracrrna也獲自bio-synthesisinc.。通常,雙生物素化的crrna或tracrrna產(chǎn)生更好的下拉結(jié)果。使用體外轉(zhuǎn)錄(asf3507(ampliscribetmt7-flashtm轉(zhuǎn)錄試劑盒(epicentre,illumina))制備非生物素化的crrna和tracrrna。使用單獨(dú)的braf質(zhì)粒dna(“braf”),基因組dna(“gdna”),braf質(zhì)粒dna加上基因組dna的混合物(即50%braf+50%gdna或25%braf+75%gdna,按重量百分比計)進(jìn)行實(shí)驗。通過瓊脂糖凝膠電泳檢測切割片段(即,2340bp和1242bp片段)。數(shù)據(jù)顯示,在陰性對照(“陰性對照”)和陽性對照(“陽性對照”)反應(yīng)兩者中,cas9復(fù)合物使靶向的braf質(zhì)粒dna片段化,而沒有顯著切割基因組dna(gdna)。數(shù)據(jù)還顯示,在braf質(zhì)粒dna和基因組dna的混合樣品中靶向的braf質(zhì)粒dna的切割沒有受到基因組dna的量顯著影響,即不同量的gdna不會中斷cas9對braf質(zhì)粒的切割。
圖16顯示圖15的片段化braf質(zhì)粒dna的cas9介導(dǎo)的下拉(富集)的瓊脂糖凝膠的照片1600。在該實(shí)例中,使用鏈霉親合素包被的磁珠來下拉并分離cas9復(fù)合物(圖13的cas9切割測定1300的任選步驟1320),然后進(jìn)行片段化的靶定dna序列的蛋白酶消化和洗脫(cas9切割測定1300的步驟1325)。通過瓊脂糖凝膠電泳檢查上清液(sn)級分和珠洗脫級分(“珠粒”)的brafdna切割片段(即,2340bp和1242bp片段)。數(shù)據(jù)顯示,在陰性對照樣品(陰性對照)中,僅在上清液級份(sn)中檢測到braf裂解片段和人基因組dna(gdna)。在陽性對照樣品(對照)和混合的braf+gdna樣品中,在洗脫的珠級分中檢測到braf裂解片段。在洗脫的珠級分中還檢測到由cas9復(fù)合物非特異性下拉的基因組dna(由箭頭指示)。
為了確定可以使用cas9復(fù)合物下拉的最大片段,將hindiii消化的λdna片段用于cas9切割和下拉測定。
圖17顯示hindiii消化的噬菌體λdna的片段大小分布的照片1700。設(shè)計四種不同的crrna以靶向和切割λdna的23.13kb,9.4kb,4.4kb和2.3kbhindiii片段。每個λhindiii片段的預(yù)期的cas9介導(dǎo)的切割片段大小示于表1中。
圖18顯示cas9介導(dǎo)的λhindiii-dna片段切割的瓊脂糖凝膠的照片1800。在該實(shí)例中,使用500nm野生型cas9內(nèi)切核酸酶,500nm雙生物素標(biāo)記(db)tracrrna,500nmcrrna(未標(biāo)記)和500nghindiii消化的λdna形成cas9復(fù)合物。切割反應(yīng)在1xcutsmart緩沖液中進(jìn)行。靶向23.13,9.4,4.4和2.3kb的λhindiii片段的的crrna分別由23130crrna,9416crrna,4361crrna和2322crrna命名。對于每個hindiii消化的λ片段,用圓圈指示預(yù)期的cas9介導(dǎo)的切割片段的位置。箭頭指示每個未切割的λhindiii片段的預(yù)期位置。使用braf質(zhì)粒dna和雙生物素(db)標(biāo)記的tracrrna和/或雙生物素(db)標(biāo)記的crrna作為切割和下拉對照樣品。數(shù)據(jù)顯示cas9介導(dǎo)的所有片段大小的切割,即23.13,9.4,4.4和2.3kb的λhindiii片段。
圖19顯示圖18的靶向且切割的λdna片段的cas9介導(dǎo)的下拉(富集)的瓊脂糖凝膠的照片1900。基本上如參考圖16所述進(jìn)行下拉測定,除了將500mmnacl加入珠洗滌緩沖液中。對于每個hindiii消化的λ片段,用圓圈指示預(yù)期的cas9介導(dǎo)的切割片段的位置。實(shí)箭頭指示每個未切割的hindiii消化的λ片段的預(yù)期位置。使用braf質(zhì)粒dna和雙生物素(db)標(biāo)記的tracrrna和/或雙生物素(db)標(biāo)記的crrna作為切割和下拉對照樣品。數(shù)據(jù)顯示切割的λdna片段的cas9介導(dǎo)的下拉。在洗脫的珠粒級分中也觀察到cas9復(fù)合物的脫靶結(jié)合(非特異性結(jié)合)(由虛線箭頭指示)。
使用cas9內(nèi)切核酸酶的d10a突變切口酶形式(命名為“cas9-切口酶”)重復(fù)參照圖19描述的hindiii消化的λ片段下拉測定。cas9-切口酶在雙鏈dna中產(chǎn)生單鏈斷裂,但不產(chǎn)生雙鏈斷裂(即,其不切割hindiii消化的λ片段)。
圖20顯示hindiii消化的λ片段的cas9-切口酶介導(dǎo)的下拉的瓊脂糖凝膠的照片2000。在該實(shí)例中,在37℃下進(jìn)行下拉,并將500mmnacl加入珠洗滌緩沖液中。對于每個hindiii消化的λ片段(即,23.13,9.4,4.4和2.3kb,分別命名為23130crrna,9416crrna,4361crrna和2322crrna),實(shí)心黑色箭頭表示未切割片段的預(yù)期位置。使用線性化的braf質(zhì)粒dna(3582bp)作為下拉對照。數(shù)據(jù)顯示,如所預(yù)期的,hindiii消化的λ片段和線性化的braf質(zhì)粒dna不被cas9-切口酶切割。數(shù)據(jù)還顯示線性化的braf質(zhì)粒dna被cas9-切口酶下拉。僅觀察到23.13kb和2.3kb片段(由圓圈指示)的hindiii消化的λ片段的下拉。在洗脫的珠粒級分中也觀察到cas9-切口酶復(fù)合物的脫靶結(jié)合(非特異性結(jié)合)(由虛線箭頭指示)。觀察到的脫靶結(jié)合的模式不同于用野生型cas9復(fù)合物觀察到的模式。
隨后的實(shí)驗(未顯示)已經(jīng)證明,使用cas9切割和下拉溫育溫度為48℃和500mmnacl的更嚴(yán)格的下拉條件,以及在48℃和在存在500mmnacl下的嚴(yán)格珠清洗可用于實(shí)質(zhì)性改善下拉反應(yīng)的特異性。
為了評價文庫富集方案中cas9-切口酶的多重復(fù)用能力,針對λdna的9個不同區(qū)域設(shè)計了9個crrna和生物素化探針。圖21顯示λdna的基因組圖譜2100(基因組大?。?8502bp)?;蚪M圖譜2100上的圓圈位點(diǎn)表示λdna的靶向區(qū)域。生物素化探針是靶向cas9-d10a切口酶復(fù)合物中每個靶物λdna區(qū)域的置換環(huán)的寡核苷酸。目標(biāo)λdna區(qū)域在λ基因組的位置6723、11720、16782、21700、26189、32617、37557、42587和46423處(由圓圈指示)。
圖22顯示了cas9-切口酶文庫富集方案2200的流程圖。文庫富集方案2200可以包括但不限于以下步驟。
在步驟2210,輸入dna(例如,50ng)用于文庫制備和靶定序列的富集。在一個實(shí)例中,dna是如參考圖21所述的λdna。在另一個實(shí)例中,dna是參考圖24更詳細(xì)描述的人基因組dna。
在步驟2215,將輸入dna進(jìn)行片段標(biāo)簽化。在一個實(shí)例中,使用nexteratm片段標(biāo)簽化的文庫制備方案(illuminainc.)將λdna進(jìn)行片段標(biāo)簽化。在片段標(biāo)簽化反應(yīng)完成后,使用例如zymoclean&concentratortm試劑盒(zymoresearch)純化片段標(biāo)簽化的λdna。
在步驟2220,擴(kuò)增經(jīng)片段標(biāo)簽化的dna。在一個實(shí)例中,使用10個循環(huán)的pcr擴(kuò)增來擴(kuò)增經(jīng)片段標(biāo)簽化的λdna。在經(jīng)片段標(biāo)簽化的λdna的pcr擴(kuò)增后,使用例如基于spri珠的純化方案(例如,來自beckman的ampurexp)純化擴(kuò)增的片段。
在步驟2225,使用針對每個靶定dna區(qū)域的crrna,tracrrna和cas9-切口酶形成cas9-切口酶復(fù)合物。在一個實(shí)例中,tracrrna是未標(biāo)記的。在另一個實(shí)例中,tracrrna是生物素化的。在一個實(shí)例中,在48℃下進(jìn)行復(fù)合物形成。在另一個實(shí)施例中,在37℃下進(jìn)行復(fù)合物形成。
在步驟2230,進(jìn)行基于磁珠的下拉反應(yīng)以捕獲靶向的dna序列。在一個實(shí)例中,使用靶向cas9-切口酶復(fù)合物中每個λdna區(qū)域的置換環(huán)的生物素化探針和鏈霉親合素包被的磁珠下拉靶向的λdna序列。在另一個實(shí)例中,使用cas9-切口酶復(fù)合物中的生物素化的tracrrna序列和鏈霉親合素包被的磁珠下拉靶向的λdna序列。在基于珠的下拉反應(yīng)之后,使用基于珠的洗滌方案洗滌珠和其上的cas9-切口酶復(fù)合物。
在步驟2235,擴(kuò)增通過cas9-切口酶復(fù)合物與鏈霉親合素包被的磁珠結(jié)合的靶定dna序列。在一個實(shí)例中,使用15至20個循環(huán)的pcr擴(kuò)增來擴(kuò)增靶向的λdna序列。在靶向λdna序列的基于珠的擴(kuò)增后,使用基于spri珠的純化方案(例如,ampurexp)純化和洗脫靶向的λdna序列。在一個實(shí)例中,使用8μl洗脫緩沖液洗脫靶向的λdna序列。
在步驟2240,對分離的靶dna序列進(jìn)行測序。在一個實(shí)例中,使用miseq系統(tǒng)(illuminainc.)進(jìn)行測序。文庫富集方案2200結(jié)束。
圖23顯示了使用圖22的文庫富集方案2200制備的λdna富集文庫,百分比總深度和gc含量百分比(作為λ基因組中位置的函數(shù))的圖2300。在該實(shí)例中,使用500mmnacl和48℃的溫育溫度進(jìn)行cas9-切口酶復(fù)合物形成和珠洗滌方案步驟。使用靶向cas9-d10a切口酶復(fù)合物中每個靶向λdna區(qū)域的置換環(huán)的生物素化探針來下拉復(fù)合物。曲線2300顯示了每個靶向區(qū)域的百分比總深度的線2310和gc含量百分比(作為λ基因組中位置的函數(shù))的線2315。數(shù)據(jù)顯示9個靶向λ區(qū)中的8個的顯著富集。數(shù)據(jù)還顯示不同的靶向區(qū)域顯示不同的富集百分比。靶富集的可變性可能是由于例如序列差異或其他參數(shù),如crrna的二級結(jié)構(gòu)或與crrna高度相似性的脫靶序列的數(shù)目。數(shù)據(jù)還顯示觀察到的富集是真實(shí)的,而不僅僅是gc含量的函數(shù)。
圖24顯示了使用圖22的文庫富集方案2200制備的人基因組文庫中內(nèi)源brafdna序列富集的柱狀圖2400。在該實(shí)例中,使用相對于基因組dna(50ng基因組dna)40倍,100倍或250倍摩爾過量的cas9-切口酶形成cas9-切口酶復(fù)合物(文庫富集方案2200的步驟2225)。使用500mmnacl,48℃的溫育溫度和1小時或過夜(on)溫育(“結(jié)合時間”)進(jìn)行cas9-切口酶復(fù)合物形成。使用不同濃度的對靶向brafdna序列特異性的生物素化探針進(jìn)行cas9-切口酶復(fù)合物的下拉(文庫富集方案2200的步驟2230),溫育時間為45分鐘。在下拉反應(yīng)之后,使用含有500mmnacl的1xcutsmart緩沖液在48℃將珠和其上的cas9-切口酶復(fù)合物洗滌70分鐘。使用20個循環(huán)的pcr擴(kuò)增靶向的brafdna序列(文庫富集方案2200的步驟2235)。在靶向brafdna序列的基于珠的擴(kuò)增后,使用基于spri珠的純化方案純化和洗脫(8μl洗脫體積)靶向的brafdna序列。使用miseq系統(tǒng)進(jìn)行測序(文庫富集方案2200的步驟2240)。圖上的每個條表示文庫。文庫通過“gdna-切口酶-生物素化探針(bp)-結(jié)合時間-pcr循環(huán)”命名。例如,條形圖2400中的第一個條形標(biāo)記為“gdna1-40x切口酶-bp-1hr-20cyc_2”,并且表示使用相對于dna文庫的40x摩爾過量的cas9-切口酶,40x摩爾過量的生物素化探針,結(jié)合時間(復(fù)合物形成時間)1小時,以及20個循環(huán)的基于珠的pcr擴(kuò)增制備的文庫。數(shù)據(jù)顯示使用100xcas9-切口酶,100x生物素化探針,1小時結(jié)合時間(復(fù)合物形成)和20個循環(huán)的基于珠的pcr擴(kuò)增制備的文庫具有最高水平的靶物富集(即,文庫“gdna2-100x切口酶-bp-1hr-20cyc“)。圖的左側(cè)部分來自珠洗脫,并且具有sup1,sup2名稱的圖右側(cè)部分來自下拉(富集)后的上清液。gdna1,gdna2等指從相同的人gdna樣品制備的但具有不同的雙重索引(nexterasampleprep方案)的文庫,用于在miseq儀器上測序。
圖25顯示了hindiii消化的λdna的crrna設(shè)計的實(shí)例的數(shù)據(jù)表2500,以及用于crrna合成的ivt反應(yīng)的正向和反向鏈。