背景技術(shù):
1、cas酶以及其相關(guān)的成簇規(guī)則間隔短回文重復(fù)序列(crispr)向?qū)Ш颂呛怂?rna)似乎是原核免疫系統(tǒng)的普遍存在(約45%的細(xì)菌,約84%的古菌)的組分,用于通過(guò)crispr-rna導(dǎo)向的核酸切割來(lái)保護(hù)此類(lèi)微生物免受非自身核酸,如傳染性病毒和質(zhì)粒的侵害。雖然編碼crispr?rna元件的脫氧核糖核酸(dna)元件在結(jié)構(gòu)和長(zhǎng)度上可能相對(duì)保守,但其crispr相關(guān)(cas)蛋白是高度多樣化的,含有多種核酸相互作用結(jié)構(gòu)域。雖然早在1987年就觀察到crispr?dna元件,但crispr/cas復(fù)合物的可編程核酸內(nèi)切酶切割能力直到最近才被認(rèn)識(shí)到,從而引起重組crispr/cas系統(tǒng)在各種dna操縱和基因編輯應(yīng)用中的使用。
技術(shù)實(shí)現(xiàn)思路
1、在一些方面,本公開(kāi)提供了一種融合蛋白,其包括:(a)2類(lèi)v型cas效應(yīng)子;以及(b)功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。在一些實(shí)施例中,所述功能結(jié)構(gòu)域源自人組蛋白1中心球狀結(jié)構(gòu)域、hmgn1、cbx5或硫磺礦硫化葉菌(saccharolobus?solfataricus)sso7d。在一些實(shí)施例中,所述cas效應(yīng)子源自cast基因座。在一些實(shí)施例中,所述cas效應(yīng)子包括與seq?id?no:113-116中的任一者或其變體的cas結(jié)構(gòu)域具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%或至少約99%序列同一性的序列。在一些實(shí)施例中,所述功能結(jié)構(gòu)域包括與seq?id?no:109-112中的任一者或其變體具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、或至少約99%序列同一性的序列。在一些實(shí)施例中,所述融合蛋白包括與seq?id?no:113-116中的任一者或其變體具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、或至少約99%序列同一性的序列。
2、在一些方面,本公開(kāi)提供了一種融合蛋白,其包括:(a)tniq蛋白;以及(b)功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。在一些實(shí)施例中,所述tniq蛋白源自cast基因座。在一些實(shí)施例中,所述tniq蛋白包括與seq?id?no:117-120中的任一者或其變體的tniq結(jié)構(gòu)域具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%或至少約99%序列同一性的序列。在一些實(shí)施例中,所述功能結(jié)構(gòu)域包括與seq?idno:109-112中的任一者或其變體具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、或至少約99%序列同一性的序列。在一些實(shí)施例中,所述融合蛋白包括與seq?id?no:117-120中的任一者或其變體具有至少80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、或至少約99%序列同一性的序列。
3、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:第一雙鏈核酸,所述第一雙鏈核酸包括被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用的貨物核苷酸序列;cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子和工程化向?qū)Ф嗪塑账?,所述工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述靶核苷酸序列雜交;以及tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與所述cas效應(yīng)子復(fù)合物結(jié)合,其中所述tn7型轉(zhuǎn)座酶復(fù)合物包括tnsb亞基。在一些實(shí)施例中,所述貨物核苷酸序列側(cè)接有左側(cè)轉(zhuǎn)座酶識(shí)別序列和右側(cè)轉(zhuǎn)座酶識(shí)別序列。在一些實(shí)施例中,所述系統(tǒng)進(jìn)一步包括包含所述靶核酸位點(diǎn)的第二雙鏈核酸。在一些實(shí)施例中,靶核酸包括鄰近所述靶核酸位點(diǎn)的與所述cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,所述pam序列位于所述靶核酸位點(diǎn)的3'。在一些實(shí)施例中,所述pam序列位于所述靶核酸位點(diǎn)的5'。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述2類(lèi)v型cas效應(yīng)子結(jié)合。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200或其變體具有至少80%同一性的序列的多肽。在一些實(shí)施例中,所述tnsb亞基包括具有與seq?id?no:2、13、17或65或其變體具有至少80%同一性的序列的多肽。在一些實(shí)施例中,所述tn7型轉(zhuǎn)座酶復(fù)合物包括包含與seq?id?no:3-4、14-15、18-19或66-67中的任一者或其變體具有至少80%同一性的序列的至少一個(gè)或至少兩個(gè)、三個(gè)多肽。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95或104-105中的任一者或其變體具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?idno:106、107、108、5、45-63、68-75或96-103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%序列同一性的序列。在一些實(shí)施例中,所述左側(cè)重組酶序列包括與seq?id?no:9、11、36-38、76或78或其變體具有至少80%同一性的序列。在一些實(shí)施例中,所述右側(cè)重組酶序列包括與seq?id?no:8、10、39-44、77、79或93或其變體具有至少80%同一性的序列。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子和所述tn7型轉(zhuǎn)座酶復(fù)合物由包括少于約10千堿基的多核苷酸序列編碼。
4、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到包括靶核苷酸序列的靶核酸位點(diǎn)中的方法,所述方法包括在細(xì)胞內(nèi)表達(dá)本文所描述的任何方面或?qū)嵤├南到y(tǒng)或?qū)⒈疚乃枋龅娜魏畏矫婊驅(qū)嵤├南到y(tǒng)引入到細(xì)胞中。
5、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸位點(diǎn)中的方法,所述方法包括使包括所述貨物核苷酸序列的第一雙鏈核酸與以下接觸:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子和至少一個(gè)工程化向?qū)Ф嗪塑账?,所述至少一個(gè)工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述靶核苷酸序列雜交;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與所述cas效應(yīng)子復(fù)合物結(jié)合,其中所述tn7型轉(zhuǎn)座酶復(fù)合物包括tnsb亞基;以及第二雙鏈核酸,所述第二雙鏈核酸包括所述靶核酸位點(diǎn)。在一些實(shí)施例中,所述貨物核苷酸序列側(cè)接有左側(cè)轉(zhuǎn)座酶識(shí)別序列和右側(cè)轉(zhuǎn)座酶識(shí)別序列。在一些實(shí)施例中,靶核酸包括鄰近所述靶核酸位點(diǎn)的與所述cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,所述pam序列位于所述靶核酸位點(diǎn)的3'。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述2類(lèi)v型cas效應(yīng)子結(jié)合。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200或其變體具有至少80%同一性的序列的多肽。在一些實(shí)施例中,所述tnsb亞基包括具有與seq?id?no:2、13、17或65或其變體具有至少80%同一性的序列的多肽。在一些實(shí)施例中,所述tn7型轉(zhuǎn)座酶復(fù)合物包括包含與seq?idno:3-4、14-15、18-19或66-67中的任一者或其變體具有至少80%同一性的序列的至少一個(gè)或至少兩個(gè)多肽。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95或104-105中的任一者或其變體具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,所述左側(cè)重組酶序列包括與seq?id?no:9、11、36-38、76或78或其變體具有至少80%同一性的序列。在一些實(shí)施例中,所述右側(cè)重組酶序列包括與seqid?no:8、10、39-44、77、79或93或其變體具有至少80%同一性的序列。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子和所述tn7型轉(zhuǎn)座酶復(fù)合物由包括少于約10千堿基的多核苷酸序列編碼。
6、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:第一雙鏈核酸,所述第一雙鏈核酸包括被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用的貨物核苷酸序列;cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子和工程化向?qū)Ф嗪塑账?,所述工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述靶核苷酸序列雜交;以及tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與所述cas效應(yīng)子復(fù)合物結(jié)合,其中所述tn7型轉(zhuǎn)座酶復(fù)合物包括tnsb、tnsc和tniq組分,其中:(a)所述2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者或其變體具有至少80%序列同一性的序列的多肽;(b)所述tn7型轉(zhuǎn)座酶復(fù)合物包括具有與seq?id?no:2-4、13-15、17-19和65-67中的任一者或其變體具有至少80%序列同一性的序列的tnsb、tnsc和tniq組分。在一些實(shí)施例中,所述轉(zhuǎn)座酶復(fù)合物與所述cas效應(yīng)子復(fù)合物非共價(jià)地結(jié)合。在一些實(shí)施例中,所述轉(zhuǎn)座酶復(fù)合物與所述cas效應(yīng)子復(fù)合物共價(jià)地連接。在一些實(shí)施例中,所述轉(zhuǎn)座酶復(fù)合物在單個(gè)多肽中與所述cas效應(yīng)子復(fù)合物融合。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子包括具有與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者或其變體具有至少80%序列同一性的序列的多肽。在一些實(shí)施例中,所述tn7型轉(zhuǎn)座酶復(fù)合物包括具有與seq?id?no:2-4、13-15、17-19和65-67中的任一者或其變體具有至少80%序列同一性的序列的tnsb、tnsc和tniq組分。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子是cas12k效應(yīng)子。在一些實(shí)施例中,所述貨物核苷酸序列側(cè)接有左側(cè)轉(zhuǎn)座酶識(shí)別序列和右側(cè)轉(zhuǎn)座酶識(shí)別序列。在一些實(shí)施例中,所述系統(tǒng)進(jìn)一步包括包含所述靶核酸位點(diǎn)的第二雙鏈核酸。在一些實(shí)施例中,靶核酸包括鄰近所述靶核酸位點(diǎn)的與所述cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,所述pam序列位于所述靶核酸位點(diǎn)的5'或3'。在一些實(shí)施例中,所述pam序列包括seq?id?no:31。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岜慌渲贸膳c所述2類(lèi)v型cas效應(yīng)子結(jié)合。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95或104-105中的任一者或其變體具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:106、107、108、5、45-63、68-75或96-103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%序列同一性的序列。在一些實(shí)施例中,所述左側(cè)重組酶序列包括與seq?id?no:9、11、36-38、76或78中的任一者或其變體具有至少80%同一性的序列。在一些實(shí)施例中,所述右側(cè)重組酶序列包括與seq?idno:8、10、39-44、77、79或93中的任一者具有至少80%同一性的序列。在一些實(shí)施例中,所述2類(lèi)v型cas效應(yīng)子和所述tn7型轉(zhuǎn)座酶復(fù)合物由包括少于約10千堿基的多核苷酸序列編碼。在一些實(shí)施例中:(a)所述2類(lèi)v型cas效應(yīng)子包括與seq?id?no:1、81、82、83或85中的任一者或其變體具有至少80%序列同一性的序列;(b)所述左側(cè)重組酶序列包括與seq?id?no:9、11、36、37或38中的任一者或其變體具有至少80%序列同一性的序列;(c)所述右側(cè)重組酶序列包括與seq?id?no:8、39、40、41、42、43、44或93中的任一者或其變體具有至少80%同一性的序列;(d)所述工程化向?qū)Ф嗪塑账幔?i)包括與seq?id?no:6或其變體的至少約46-80個(gè)核苷酸具有至少80%序列同一性的序列;或(ii)包括與seq?id?no:5、45-63、68-75或96-103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%同一性的序列;(e)所述tnsb、tnsc和tniq組分包括具有與seq?id?no:2-4或其變體具有至少80%同一性的序列的多肽;或者(f)所述pam序列包括seq?id?no:31。在一些實(shí)施例中:(a)所述2類(lèi)v型cas效應(yīng)子包括與seqid?no:12或其變體具有至少80%序列同一性的序列;(b)所述左側(cè)重組酶序列包括與seqid?no:76或其變體具有至少80%序列同一性的序列;(c)所述右側(cè)重組酶序列包括與seqid?no:77或其變體具有至少80%同一性的序列;(d)所述工程化向?qū)Ф嗪塑账幔?i)包括與seq?id?no:32或104或其變體的至少約46-80個(gè)核苷酸具有至少80%序列同一性的序列;或(ii)包括與seq?id?no:107或102中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%同一性的序列;(e)所述tnsb、tnsc和tniq組分包括具有與seq?id?no:13-15或其變體具有至少80%同一性的序列的多肽。在一些實(shí)施例中:(a)所述2類(lèi)v型cas效應(yīng)子包括與seq?id?no:16或其變體具有至少80%序列同一性的序列;(b)所述左側(cè)重組酶序列包括與seq?id?no:78或其變體具有至少80%序列同一性的序列;(c)所述右側(cè)重組酶序列包括與seq?id?no:79或其變體具有至少80%同一性的序列;(d)所述工程化向?qū)Ф嗪塑账幔?i)包括與seq?idno:33或105或其變體的至少約46-80個(gè)核苷酸具有至少80%序列同一性的序列;或(ii)包括與seq?id?no:108或103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%同一性的序列;(e)所述tnsb、tnsc和tniq組分包括具有與seq?id?no:17-19或其變體具有至少80%同一性的序列的多肽。
7、在一些方面,本公開(kāi)提供了一種工程化核酸酶系統(tǒng),其包括:包括ruvc結(jié)構(gòu)域的核酸內(nèi)切酶,其中所述核酸內(nèi)切酶源自未培養(yǎng)的微生物,并且其中所述核酸內(nèi)切酶是與seqid?no:1、12、16、20-30、64、80-85和200中的任一者或其變體具有至少80%同一性的2類(lèi)v-k型cas效應(yīng)子;以及工程化向?qū)na,其中所述工程化向?qū)na被配置成與所述核酸內(nèi)切酶形成復(fù)合物,并且所述工程化向?qū)na包括被配置成與靶核酸序列雜交的間隔子序列。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95或104-105中的任一者或其變體具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:106、107、108、5、45-63、68-75或96-103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%同一性的序列。在一些實(shí)施例中,靶核酸包括鄰近所述靶核酸位點(diǎn)的與所述cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,所述pam序列位于所述靶核酸位點(diǎn)的5'。在一些實(shí)施例中,所述pam序列包括seq?id?no:31。在一些實(shí)施例中:(a)所述2類(lèi)v-k型cas效應(yīng)子包括與seq?id?no:1、81、82、83或85中的任一者或其變體具有至少80%序列同一性的序列;(b)所述左側(cè)重組酶序列包括與seq?id?no:9、11、36、37或38中的任一者或其變體具有至少80%序列同一性的序列;(c)所述右側(cè)重組酶序列包括與seq?id?no:8、39、40、41、42、43、44或93中的任一者或其變體具有至少80%同一性的序列;(d)所述工程化向?qū)Ф嗪塑账幔?i)包括與seq?id?no:6或其變體的至少約46-80個(gè)核苷酸具有至少80%序列同一性的序列;或(ii)包括與seq?id?no:5、45-63、68-75或96-103中的任一者或其變體的非簡(jiǎn)并核苷酸具有至少80%同一性的序列;(e)所述tnsb、tnsc和tniq組分包括具有與seq?id?no:2-4或其變體具有至少80%同一性的序列的多肽;或者(f)所述pam序列包括seq?id?no:31。
8、根據(jù)以下具體實(shí)施方式,本領(lǐng)域的技術(shù)人員將顯而易知本公開(kāi)的另外的方面和優(yōu)勢(shì),在具體實(shí)施方式中僅示出和描述本公開(kāi)的說(shuō)明性實(shí)施例。如將認(rèn)識(shí)到,本公開(kāi)能夠具有其它并且不同的實(shí)施例,并且其若干細(xì)節(jié)能夠在各種明顯的方面進(jìn)行修改,所有這些都不脫離本公開(kāi)。因此,附圖和說(shuō)明書(shū)本質(zhì)上被視為是說(shuō)明性的而非限制性的。
9、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子、小原核核糖體蛋白亞基s15和被配置成與靶核酸位點(diǎn)雜交的工程化向?qū)Ф嗪塑账?;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與所述cas效應(yīng)子復(fù)合物結(jié)合并包括tnsb、tnsc和tniq組分;雙鏈核酸,所述雙鏈核酸被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用并包括貨物核苷酸序列;以及功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
10、在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物非共價(jià)地結(jié)合。在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物共價(jià)地連接。在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物融合。
11、在一些實(shí)施例中,貨物核苷酸序列側(cè)接由tn7型轉(zhuǎn)座酶復(fù)合物識(shí)別的左側(cè)轉(zhuǎn)座酶識(shí)別序列和右側(cè)轉(zhuǎn)座酶識(shí)別序列。在一些實(shí)施例中,左側(cè)重組酶序列包括與seq?id?no:9、11、36-38、76和78中的任一者具有至少80%同一性的序列。在一些實(shí)施例中,右側(cè)重組酶序列包括與seq?id?no:8、10、39-44、77、79和93中的任一者具有至少80%同一性的序列。
12、在一些實(shí)施例中,靶核酸包括與cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,pam序列包括seq?id?no:31。在一些實(shí)施例中,pam序列位于距靶核酸位點(diǎn)約50個(gè)至約70個(gè)堿基對(duì)處。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的3'。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的5'。
13、在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子是cas12k效應(yīng)子。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者具有至少80%同一性的序列的多肽。在一些實(shí)施例,2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者具有至少90%同一性的序列的多肽。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子包括包含seq?id?no:1、12、16、20-30、64、80-85和200中的任一者的序列的多肽。
14、在一些實(shí)施例中,tnsb組分包括具有與seq?id?no:2、13、17和65中的任一者具有至少80%同一性的序列的多肽。在一些實(shí)施例,tnsb組分包括具有與seq?id?no:2、13、17和65中的任一者具有至少90%同一性的序列的多肽。在一些實(shí)施例中,tnsb組分包括具有seqid?no:2、13、17和65中的任一者的序列的多肽。在一些實(shí)施例中,tn7型轉(zhuǎn)座酶復(fù)合物至少包括第一多肽和第二多肽,所述第一多肽和所述第二多肽各自獨(dú)立地包括與seq?id?no:3-4、14-15、18-19和66-67中的任一者具有至少80%同一性的序列。在一些實(shí)施例中,tn7型轉(zhuǎn)座酶復(fù)合物至少包括第一多肽和第二多肽,所述第一多肽和所述第二多肽各自獨(dú)立地包括與seq?id?no:3-4、14-15、18-19和66-67中的任一者具有至少90%同一性的序列。在一些實(shí)施例中,tn7型轉(zhuǎn)座酶復(fù)合物至少包括第一多肽和第二多肽,所述第一多肽和所述第二多肽各自獨(dú)立地包括seq?id?no:3-4、14-15、18-19和66-67中的任一者的序列。
15、在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95、104-105和202中的任一者具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:106、107、108、5、45-63、68-75、96-103和165中的任一者具有至少80%序列同一性的序列。
16、在一些實(shí)施例中,功能結(jié)構(gòu)域源自人組蛋白1中心球狀結(jié)構(gòu)域、hmgn1、cbx5或硫磺礦硫化葉菌sso7d。在一些實(shí)施例中,功能結(jié)構(gòu)域包括與seq?id?no:109-112中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,融合蛋白包括與seq?id?no:113-116中的任一者具有至少80%同一性的序列。
17、在一些實(shí)施例中,tn7轉(zhuǎn)座酶復(fù)合物包括tniq蛋白。在一些實(shí)施例中,tniq蛋白與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,tniq蛋白包括與seq?id?no:117-120中的任一者的tniq結(jié)構(gòu)域具有至少80%序列同一性的序列。
18、在一些實(shí)施例中,小原核核糖體蛋白亞基s15包括與seq?id?no:167-169中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,小原核核糖體蛋白亞基s15由與seqid?no:161-163中的任一者具有至少80%序列同一性的序列編碼。
19、在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子和tn7型轉(zhuǎn)座酶復(fù)合物由包括少于約10千堿基的多核苷酸序列編碼。
20、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子和被配置成與靶核酸位點(diǎn)雜交的工程化向?qū)Ф嗪塑账?,其中所述cas效應(yīng)子復(fù)合物包括包含與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者具有至少80%序列同一性的序列的多肽;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與cas效應(yīng)子復(fù)合物結(jié)合并包括tnsb、tnsc和tniq組分;所述tnsb、tnsc或tniq組分包括與seq?id?no:2-4、13-15、17-19和65-67中的任一者具有至少80%序列同一性的序列;雙鏈核酸,所述雙鏈核酸被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用并包括貨物核苷酸序列;以及功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
21、在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物非共價(jià)地結(jié)合。在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物共價(jià)地連接。在一些實(shí)施例中,cas效應(yīng)子復(fù)合物與tn7型轉(zhuǎn)座酶復(fù)合物融合。
22、在一些實(shí)施例中,貨物核苷酸序列側(cè)接由tn7型轉(zhuǎn)座酶復(fù)合物識(shí)別的左側(cè)轉(zhuǎn)座酶識(shí)別序列和右側(cè)轉(zhuǎn)座酶識(shí)別序列。在一些實(shí)施例中,左側(cè)重組酶序列包括與seq?id?no:9、11、36-38、76和78中的任一者具有至少80%同一性的序列。在一些實(shí)施例中,右側(cè)重組酶序列包括與seq?id?no:8、10、39-44、77、79和93中的任一者具有至少80%同一性的序列。
23、在一些實(shí)施例中,靶核酸包括與cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,pam序列包括seq?id?no:31。
24、在一些實(shí)施例中,pam序列位于距靶核酸位點(diǎn)約50個(gè)至約70個(gè)堿基對(duì)處。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的3'。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的5'。
25、在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子是cas12k效應(yīng)子。在一些實(shí)施例,2類(lèi)v型cas效應(yīng)子包括包含與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者具有至少90%同一性的序列的多肽。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子包括包含seq?id?no:1、12、16、20-30、64、80-85和200中的任一者的序列的多肽。
26、在一些實(shí)施例中,tnsb、tnsc或tniq組分包括與seq?id?no:2-4、13-15、17-19和65-67中的任一者具有至少90%序列同一性的序列。
27、在一些實(shí)施例中,tnsb、tnsc或tniq組分包括seq?id?no:2-4、13-15、17-19和65-67中的任一者的序列。在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95、104-105和202中的任一者具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。
28、在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:106、107、108、5、45-63、68-75、96-103和165中的任一者具有至少80%序列同一性的序列。
29、在一些實(shí)施例中,功能結(jié)構(gòu)域源自人組蛋白1中心球狀結(jié)構(gòu)域、hmgn1、cbx5或硫磺礦硫化葉菌sso7d。在一些實(shí)施例中,功能結(jié)構(gòu)域包括與seq?id?no:109-112中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,融合蛋白包括與seq?id?no:113-116中的任一者具有至少80%同一性的序列。
30、在一些實(shí)施例中,tn7轉(zhuǎn)座酶復(fù)合物包括tniq蛋白。在一些實(shí)施例中,tniq蛋白與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,tniq蛋白包括與seq?id?no:117-120中的任一者的tniq結(jié)構(gòu)域具有至少80%序列同一性的序列。
31、在一些實(shí)施例中,cas效應(yīng)子復(fù)合物進(jìn)一步包括小原核核糖體蛋白亞基s15。在一些實(shí)施例中,小原核核糖體蛋白亞基s15包括與seq?id?no:167-169中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,小原核核糖體蛋白亞基s15由與seq?id?no:161-163中的任一者具有至少80%序列同一性的序列編碼。
32、在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子和tn7型轉(zhuǎn)座酶復(fù)合物由包括少于約10千堿基的多核苷酸序列編碼。
33、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物被配置成與靶核酸位點(diǎn)雜交并包括:i)2類(lèi)v型cas效應(yīng)子,所述2類(lèi)v型cas效應(yīng)子包括與seq?id?no:1、81、82、83和85中的任一者具有至少80%序列同一性的序列,以及ii)工程化向?qū)Ф嗪塑账?,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:5、6、45-63、68-75和96-103中的任一者具有至少80%同一性;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與cas效應(yīng)子復(fù)合物結(jié)合并包括tnsb、tnsc和tniq組分,所述tnsb、tnsc或tniq組分包括與seq?id?no:2-4中的任一者具有至少80%同一性的序列;雙鏈核酸,所述雙鏈核酸被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用,并且按5'至3'順序包括:左側(cè)重組酶序列,所述左側(cè)重組酶序列包括與seq?id?no:9、11、36、37和38中的任一者具有至少80%序列同一性的序列;貨物核苷酸序列;以及右側(cè)重組酶序列,所述右側(cè)重組酶序列包括與seq?id?no:8、39-44和93中的任一者具有至少80%同一性的序列;以及(b)功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
34、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物被配置成與靶核酸位點(diǎn)雜交并包括:i)2類(lèi)v型cas效應(yīng)子,所述2類(lèi)v型cas效應(yīng)子包括與seq?id?no:12具有至少80%序列同一性的序列;以及ii)工程化向?qū)Ф嗪塑账?,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:32、102、104和107中的任一者具有至少80%同一性;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與cas效應(yīng)子復(fù)合物結(jié)合并包括tnsb、tnsc和tniq組分,所述tnsb、tnsc或tniq組分包括與seq?id?no:13-15中的任一者具有至少80%同一性的序列;雙鏈核酸,所述雙鏈核酸被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用,并且按5'至3'順序包括:左側(cè)重組酶序列,所述左側(cè)重組酶序列包括與seq?id?no:76具有至少80%同一性的序列;貨物核苷酸序列;以及右側(cè)重組酶序列,所述右側(cè)重組酶序列包括與seq?id?no:77具有至少80%同一性的序列;以及功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
35、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物被配置成與靶核酸位點(diǎn)雜交并包括:i)2類(lèi)v型cas效應(yīng)子,所述2類(lèi)v型cas效應(yīng)子包括與seq?id?no:16具有至少80%序列同一性的序列;以及ii)工程化向?qū)Ф嗪塑账?,所述工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:33、103、105和108中的任一者具有至少80%同一性;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物被配置成與cas效應(yīng)子復(fù)合物結(jié)合并包括tnsb、tnsc和tniq組分,所述tnsb、tnsc或tniq組分包括與seq?id?no:17-19中的任一者具有至少80%同一性的序列;雙鏈核酸,所述雙鏈核酸被配置成與tn7型轉(zhuǎn)座酶復(fù)合物相互作用,并且按5'至3'順序包括:左側(cè)重組酶序列,所述左側(cè)重組酶序列包括與seq?id?no:78具有至少80%序列同一性的序列;貨物核苷酸序列;以及右側(cè)重組酶序列,所述右側(cè)重組酶序列包括與seq?id?no:79具有至少80%同一性的序列;以及功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
36、在一些實(shí)施例中,靶核酸包括與cas效應(yīng)子復(fù)合物相容的pam序列。在一些實(shí)施例中,pam序列包括seq?id?no:31。在一些實(shí)施例中,pam序列位于距靶核酸位點(diǎn)約50個(gè)至約70個(gè)堿基對(duì)處。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的3'。在一些實(shí)施例中,pam序列位于靶核酸位點(diǎn)的5'。
37、在一些實(shí)施例中,功能結(jié)構(gòu)域源自人組蛋白1中心球狀結(jié)構(gòu)域、hmgn1、cbx5或硫磺礦硫化葉菌sso7d。在一些實(shí)施例中,功能結(jié)構(gòu)域包括與seq?id?no:109-112中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,2類(lèi)v型cas效應(yīng)子與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,融合蛋白包括與seq?id?no:113-116中的任一者具有至少80%同一性的序列。
38、在一些實(shí)施例中,tn7轉(zhuǎn)座酶復(fù)合物包括tniq蛋白。在一些實(shí)施例中,tniq蛋白與功能結(jié)構(gòu)域融合以形成融合蛋白。在一些實(shí)施例中,tniq蛋白包括與seq?id?no:117-120中的任一者的tniq結(jié)構(gòu)域具有至少80%序列同一性的序列。
39、在一些實(shí)施例中,cas效應(yīng)子復(fù)合物進(jìn)一步包括小原核核糖體蛋白亞基s15。在一些實(shí)施例中,小原核核糖體蛋白亞基s15包括與seq?id?no:167-169中的任一者具有至少80%序列同一性的序列。在一些實(shí)施例中,小原核核糖體蛋白亞基s15由與seq?id?no:161-163中的任一者具有至少80%序列同一性的序列編碼。
40、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸中的靶核酸位點(diǎn)中的系統(tǒng),所述系統(tǒng)包括:cas效應(yīng)子復(fù)合物,所述cas效應(yīng)子復(fù)合物包括2類(lèi)v型cas效應(yīng)子、小原核核糖體蛋白亞基s15和工程化向?qū)Ф嗪塑账?,工程化向?qū)Ф嗪塑账崮軌蚺c靶核酸雜交;tn7型轉(zhuǎn)座酶復(fù)合物,所述tn7型轉(zhuǎn)座酶復(fù)合物與所述cas效應(yīng)子復(fù)合物可操作地連接并包括tnsb、tnsc和tniq組分;雙鏈核酸,所述雙鏈核酸按5'至3'順序包括:左側(cè)重組酶識(shí)別序列;貨物核苷酸序列;以及右側(cè)重組酶識(shí)別序列,所述左側(cè)重組酶識(shí)別序列和所述右側(cè)重組酶識(shí)別序列能夠由所述tn7型轉(zhuǎn)座酶復(fù)合物識(shí)別;以及功能結(jié)構(gòu)域,所述功能結(jié)構(gòu)域包括dna結(jié)合結(jié)構(gòu)域(dbd)或染色質(zhì)調(diào)節(jié)結(jié)構(gòu)域(cmd)。
41、在一些方面,本公開(kāi)提供了一種工程化核酸酶系統(tǒng),其包括:包括ruvc結(jié)構(gòu)域的核酸內(nèi)切酶,所述核酸內(nèi)切酶源自未培養(yǎng)的微生物并是2類(lèi)v-k型cas效應(yīng)子,所述2類(lèi)v-k型cas效應(yīng)子與seq?id?no:1、12、16、20-30、64、80-85和200中的任一者包括至少80%同一性;以及工程化向?qū)na,所述工程化向?qū)na被配置成與所述核酸內(nèi)切酶形成復(fù)合物并包括被配置成與靶核酸序列雜交的間隔子序列。
42、在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚òcseq?id?no:5-6、32-33、94-95、104-105和202中的任一者具有至少80%同一性的至少約46-80個(gè)連續(xù)核苷酸的序列。在一些實(shí)施例中,工程化向?qū)Ф嗪塑账岚ㄅcseq?id?no:106、107、108、5、45-63、68-75、96-103和165中的任一者具有至少80%同一性的序列。
43、在一些方面,本公開(kāi)提供了一種用于將貨物核苷酸序列轉(zhuǎn)座到靶核酸位點(diǎn)中的方法,所述方法包括將本公開(kāi)的系統(tǒng)引入到細(xì)胞。
44、在一些方面,本公開(kāi)提供了一種細(xì)胞,其包括本公開(kāi)的系統(tǒng)。在一些實(shí)施例中,細(xì)胞是真核細(xì)胞。在一些實(shí)施例中,細(xì)胞是哺乳動(dòng)物細(xì)胞。在一些實(shí)施例中,細(xì)胞是永生化細(xì)胞。在一些實(shí)施例中,細(xì)胞是昆蟲(chóng)細(xì)胞。在一些實(shí)施例中,所述細(xì)胞是酵母細(xì)胞。
45、在一些實(shí)施例中,所述細(xì)胞是植物細(xì)胞。在一些實(shí)施例中,所述細(xì)胞是真菌細(xì)胞。在一些實(shí)施例中,所述細(xì)胞是原核細(xì)胞。在一些實(shí)施例中,所述細(xì)胞是a549、hek-293、hek-293t、bhk、cho、hela、mrc5、sf9、cos-1、cos-7、vero、bsc?1、bsc?40、bmt?10、wi38、hela、saos、c2c12、l細(xì)胞、ht1080、hepg2、huh7、k562、原代細(xì)胞或其衍生物。在一些實(shí)施例中,所述細(xì)胞是工程化細(xì)胞。在一些實(shí)施例中,所述細(xì)胞是穩(wěn)定細(xì)胞。