相關(guān)應(yīng)用和引用參考本申請要求分別于2013年7月2日和10月5日提交的均具有博德參考號BI-2011/008A、標(biāo)題為“用于改變基因產(chǎn)物的表達(dá)的CRISPR-CAS系統(tǒng)和方法(CRISPR-CASSYSTEMSANDMETHODSFORALTERINGEXPRESSIONOFGENEPRODUCTS)”的美國臨時(shí)專利申請61/842,322和美國專利申請14/054,414的優(yōu)先權(quán)。還要求分別于2012年12月12日、2013年1月2日、2013年3月15日以及2013年6月17日提交的分別具有博德參考號BI-2011/008/WSGR案卷號44063-701.101、BI-2011/008/WSGR案卷號44063-701.102、博德參考號BI-2011/008/VP案卷號44790.02.2003以及BI-2011/008/VP案卷號44790.03.2003、標(biāo)題均為“用于序列操縱的系統(tǒng)、方法和組合物(SYSTEMSMETHODSANDCOMPOSITIONSFORSEQUENCEMANIPULATION)”的美國臨時(shí)專利申請61/736,527、61/748,427、61/791,409以及61/835,931的優(yōu)先權(quán)。參考了美國臨時(shí)專利申請61/758,468;61/769,046;61/802,174;61/806,375;61/814,263;61/819,803以及61/828,130,這些臨時(shí)專利申請各自的標(biāo)題為“用于序列操縱的系統(tǒng)、方法以及組合物的工程化以及優(yōu)化”,分別提交于2013年1月30日;2013年2月25;2013年3月15;2013年3月28;2013年4月20;2013年5月6日以及2013年5月28日。還參考了美國臨時(shí)專利申請61/835,936、61/836,127、61/836,101、61/836,080以及61/835,973,每個(gè)提交于2013年6月17日。前述申請、以及在其中或在它們的審查程序期間引用的所有文獻(xiàn)或(“申請引用文獻(xiàn)”)以及在這些申請引用文獻(xiàn)中引用或參考的所有文獻(xiàn)、以及在本文中引用或參考的所有文獻(xiàn)(“本文引用的文獻(xiàn)”)、在本文中引用的文獻(xiàn)中引用或參考的所有文獻(xiàn),連同針對在本文中提及或通過引用結(jié)合在本文中的任何文獻(xiàn)中的任何產(chǎn)品的任何制造商的說明書、說明、產(chǎn)品規(guī)格、和產(chǎn)品表,特此通過引用并入本文,并且可以在本發(fā)明的實(shí)踐中采用。更具體地說,所有參考的文獻(xiàn)均通過引用并入本文,其程度如同每個(gè)單獨(dú)的文獻(xiàn)被確切地并單獨(dú)地指明通過引用而并入本文。
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及用于控制涉及序列靶向的基因表達(dá)的系統(tǒng)、方法、和組合物,該序列靶向例如可使用涉及規(guī)律間隔成簇短回文重復(fù)序列(CRISPR)及其組分的載體系統(tǒng)的、基因組微擾或基因編輯。關(guān)于聯(lián)邦資助研究的聲明本發(fā)明是在美國國立衛(wèi)生研究院頒發(fā)的NIH先鋒獎(jiǎng)(PioneerAward)DP1MH100706的政府支持下完成的。美國政府享有本發(fā)明的某些權(quán)利。
背景技術(shù):
:在基因組測序技術(shù)和分析方法中的最新進(jìn)展顯著加速了對與范圍廣泛的生物功能和疾病相關(guān)聯(lián)的遺傳因子進(jìn)行編目和映射的能力。精確的基因組靶向技術(shù)對于通過允許個(gè)體遺傳元件的選擇性干擾而使得因果性遺傳變異的統(tǒng)性逆向工程成為可能、以及推進(jìn)合成生物學(xué)、生物技術(shù)應(yīng)用、和醫(yī)學(xué)應(yīng)用是需要的。雖然基因組編輯技術(shù),如設(shè)計(jì)師鋅指、轉(zhuǎn)錄激活子樣效應(yīng)因子(TALE)、或歸巢大范圍核酸酶(homingmeganuclease)對于產(chǎn)生靶向的基因組干擾是可得的,但是仍然需要負(fù)擔(dān)得起的、易于建立的、可擴(kuò)展的、并且便于靶向真核基因組內(nèi)的多個(gè)位置的新的基因組工程技術(shù)。技術(shù)實(shí)現(xiàn)要素:對于具有一系列廣泛應(yīng)用的序列靶向的替代性且穩(wěn)健的系統(tǒng)和技術(shù)存在著迫切需要。本發(fā)明著手解決這種需要并且提供了相關(guān)優(yōu)點(diǎn)。CRISPR/Cas或CRISPR-Cas系統(tǒng)(兩個(gè)術(shù)語在本申請通篇可互換地使用)不要求產(chǎn)生靶向特異性序列的定制蛋白,而是通過一個(gè)短RNA分子識別一個(gè)特異性DNA靶標(biāo),可以對單個(gè)Cas酶進(jìn)行程序設(shè)計(jì),換句話說可以使用所述短RNA分子將Cas酶募集到一個(gè)特異性DNA靶標(biāo)。將該CRISPR-Cas系統(tǒng)添加到基因組測序技術(shù)和分析方法的組庫中可以顯著使該方法論簡化并且提高對與范圍廣泛的生物功能和疾病相關(guān)聯(lián)的遺傳因子進(jìn)行編目和映射的能力。為了有效而無有害作用地利用CRISPR-Cas系統(tǒng)用于基因組編輯,了解這些基因組工程工具的工程化和優(yōu)化方面是至關(guān)重要的,這些方面是請求保護(hù)的本發(fā)明的方面。在一個(gè)方面,本發(fā)明提供了一種改變或修飾一種或多種基因產(chǎn)物的表達(dá)的方法,該方法可以包括向包含并表達(dá)編碼該一種或多種基因產(chǎn)物的DNA分子的細(xì)胞中引入一種工程化的非天然存在的CRISPR-Cas系統(tǒng),該系統(tǒng)可以包括一種Cas蛋白和一種或多種指導(dǎo)RNA,該一種或多種指導(dǎo)RNA靶向這些DNA分子,由此該一種或多種指導(dǎo)RNA靶向編碼該一種或多種基因產(chǎn)物的DNA分子的基因組座位并且該Cas蛋白切割編碼該一種或多種基因產(chǎn)物的DNA分子的該基因組座位,由此該一種或多種基因產(chǎn)物的表達(dá)被改變或修飾;并且,其中該Cas蛋白和該指導(dǎo)RNA并不共同天然存在。本發(fā)明包括,兩種或更多種基因產(chǎn)物的表達(dá)可以被改變或修飾。本發(fā)明進(jìn)一步包括,該指導(dǎo)RNA包括一種融合到tracr序列上的指導(dǎo)序列。在一個(gè)優(yōu)選實(shí)施例中,該細(xì)胞是一種真核細(xì)胞,在一個(gè)更優(yōu)選的實(shí)施例中,該細(xì)胞是一種哺乳動物細(xì)胞并且在一個(gè)仍更優(yōu)選的實(shí)施例中,該哺乳動物細(xì)胞是一種人類細(xì)胞。本發(fā)明還包括,該Cas蛋白可以包括一個(gè)或多個(gè)核定位信號(NLS)。在一些實(shí)施例中,該Cas蛋白是一種II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該Cas蛋白是一種Cas9蛋白。在一些實(shí)施例中,該Cas9蛋白是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物的突變的Cas9。該蛋白可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該Cas蛋白是密碼子優(yōu)化的,用于在真核細(xì)胞中進(jìn)行表達(dá)。在一些實(shí)施例中,該Cas蛋白指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。在本發(fā)明的一個(gè)另外的方面,該基因產(chǎn)物的表達(dá)被降低并且該基因產(chǎn)物是一種蛋白質(zhì)。本發(fā)明包括,引入細(xì)胞中是經(jīng)由一種遞送系統(tǒng)該遞送系統(tǒng)可以包括病毒粒子、脂質(zhì)體、電穿孔、顯微注射或綴合。在另一個(gè)方面,本發(fā)明提供了一種改變或修飾一種或多種基因產(chǎn)物的表達(dá)的方法,該方法包括向包含并表達(dá)編碼該一種或多種基因產(chǎn)物的DNA分子的細(xì)胞中引入一種工程化的非天然存在的載體系統(tǒng),該載體系統(tǒng)可以包括一種或多種載體,該一種或多種載體包括:a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種或多種與編碼該一種或多種基因產(chǎn)物的DNA分子的基因組座位中的靶序列雜交的CRISPR-Cas系統(tǒng)指導(dǎo)RNA上,b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到一種Cas蛋白上,其中組分(a)和(b)位于該系統(tǒng)的相同或不同載體上,由此這些指導(dǎo)RNA靶向編碼該一種或多種基因產(chǎn)物的DNA分子的基因組座位并且該Cas蛋白切割編碼該一種或多種基因產(chǎn)物的DNA分子的該基因組座位,由此該一種或多種基因產(chǎn)物的表達(dá)被改變或修飾;并且,其中該Cas蛋白和這些指導(dǎo)RNA并不共同天然存在。本發(fā)明包括,兩種或更多種基因產(chǎn)物的表達(dá)可以被改變或修飾。本發(fā)明進(jìn)一步包括,該指導(dǎo)RNA包括一種融合到tracr序列上的指導(dǎo)序列。在一個(gè)優(yōu)選實(shí)施例中,該細(xì)胞是一種真核細(xì)胞,在一個(gè)更優(yōu)選的實(shí)施例中,該細(xì)胞是一種哺乳動物細(xì)胞并且在一個(gè)仍更優(yōu)選的實(shí)施例中,該哺乳動物細(xì)胞是一種人類細(xì)胞。本發(fā)明還包括,該系統(tǒng)的載體可以進(jìn)一步包括一個(gè)或多個(gè)NLS。在一些實(shí)施例中,該Cas蛋白是一種II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該Cas蛋白是一種Cas9蛋白。在一些實(shí)施例中,該Cas9蛋白是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物的突變的Cas9。該蛋白可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該Cas蛋白是密碼子優(yōu)化的,用于在真核細(xì)胞中進(jìn)行表達(dá)。在一些實(shí)施例中,該Cas蛋白指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。在本發(fā)明的一個(gè)另外的方面,該基因產(chǎn)物的表達(dá)被降低并且該基因產(chǎn)物是一種蛋白質(zhì)。本發(fā)明包括,引入細(xì)胞中是經(jīng)由一種遞送系統(tǒng)該遞送系統(tǒng)可以包括病毒粒子、脂質(zhì)體、電穿孔、顯微注射或綴合。本發(fā)明還提供了一種工程化的非天然存在的載體系統(tǒng),該載體系統(tǒng)可以包括一種或多種載體,該一種或多種載體包括:a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種或多種與編碼一種或多種基因產(chǎn)物的DNA分子的基因組座位中的靶序列雜交的CRISPR-Cas系統(tǒng)指導(dǎo)RNA上,b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到一種Cas蛋白上,其中組分(a)和(b)位于該系統(tǒng)的相同或不同載體上,由此這些指導(dǎo)RNA在細(xì)胞中靶向編碼該一種或多種基因產(chǎn)物的DNA分子的基因組座位并且該Cas蛋白切割編碼該一種或多種基因產(chǎn)物的DNA分子的該基因組座位,由此該一種或多種基因產(chǎn)物的表達(dá)被改變或修飾;并且,其中該Cas蛋白和這些指導(dǎo)RNA并不共同天然存在。本發(fā)明包括,兩種或更多種基因產(chǎn)物的表達(dá)可以被改變或修飾。本發(fā)明進(jìn)一步包括,該指導(dǎo)RNA包括一種融合到tracr序列上的指導(dǎo)序列。在一個(gè)優(yōu)選實(shí)施例中,該細(xì)胞是一種真核細(xì)胞,在一個(gè)更優(yōu)選的實(shí)施例中,該細(xì)胞是一種哺乳動物細(xì)胞并且在一個(gè)仍更優(yōu)選的實(shí)施例中,該哺乳動物細(xì)胞是一種人類細(xì)胞。本發(fā)明還包括,該系統(tǒng)的載體可以進(jìn)一步包括一個(gè)或多個(gè)NLS。在一些實(shí)施例中,該Cas蛋白是一種II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該Cas蛋白是一種Cas9蛋白。在一些實(shí)施例中,該Cas9蛋白是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物的突變的Cas9。該蛋白可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該Cas蛋白是密碼子優(yōu)化的,用于在真核細(xì)胞中進(jìn)行表達(dá)。在一些實(shí)施例中,該Cas蛋白指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。在本發(fā)明的一個(gè)另外的方面,該基因產(chǎn)物的表達(dá)被降低并且該基因產(chǎn)物是一種蛋白質(zhì)。本發(fā)明包括,引入細(xì)胞中是經(jīng)由一種遞送系統(tǒng)該遞送系統(tǒng)可以包括病毒粒子、脂質(zhì)體、電穿孔、顯微注射或綴合。在仍另一個(gè)方面,本發(fā)明提供了一種工程化的可編程的非天然存在的CRISPR-Cas系統(tǒng),該系統(tǒng)可以包括一種Cas蛋白以及一種或多種指導(dǎo)RNA,該一種或多種指導(dǎo)RNA在細(xì)胞中靶向編碼一種或多種基因產(chǎn)物的DNA分子的基因組座位,并且該Cas蛋白切割編碼該一種或多種基因產(chǎn)物的DNA分子的基因組座位,由此該一種或多種基因產(chǎn)物的表達(dá)被改變或修飾;并且,其中該Cas蛋白和這些指導(dǎo)RNA并不共同天然存在。本發(fā)明包括,兩種或更多種基因產(chǎn)物的表達(dá)可以被改變或修飾。本發(fā)明進(jìn)一步包括,該指導(dǎo)RNA包括一種融合到tracr序列上的指導(dǎo)序列。在一個(gè)優(yōu)選實(shí)施例中,該細(xì)胞是一種真核細(xì)胞,在一個(gè)更優(yōu)選的實(shí)施例中,該細(xì)胞是一種哺乳動物細(xì)胞并且在一個(gè)仍更優(yōu)選的實(shí)施例中,該哺乳動物細(xì)胞是一種人類細(xì)胞。本發(fā)明還包括,該CRISPR-Cas系統(tǒng)可以進(jìn)一步包括一個(gè)或多個(gè)NLS。在一些實(shí)施例中,該Cas蛋白是一種II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該Cas蛋白是一種Cas9蛋白。在一些實(shí)施例中,該Cas9蛋白是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物的突變的Cas9。該蛋白可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該Cas蛋白是密碼子優(yōu)化的,用于在真核細(xì)胞中進(jìn)行表達(dá)。在一些實(shí)施例中,該Cas蛋白指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。在本發(fā)明的一個(gè)另外的方面,該基因產(chǎn)物的表達(dá)被降低并且該基因產(chǎn)物是一種蛋白質(zhì)。本發(fā)明包括,引入細(xì)胞中是經(jīng)由一種遞送系統(tǒng)該遞送系統(tǒng)可以包括病毒粒子、脂質(zhì)體、電穿孔、顯微注射或綴合。在一個(gè)方面,本發(fā)明提供了包括一種或多種載體的載體系統(tǒng)。在一些實(shí)施例中,該系統(tǒng)包括:(a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種tracr配對序列以及用于在該tracr配對序列的上游插入一個(gè)或多個(gè)指導(dǎo)序列的一個(gè)或多個(gè)插入位點(diǎn),其中當(dāng)表達(dá)時(shí),該指導(dǎo)序列引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)靶序列的序列特異性結(jié)合,其中該CRISPR復(fù)合物包括與以下各項(xiàng)復(fù)合的一種CRISPR酶:(1)雜交到該靶序列的指導(dǎo)序列,以及(2)雜交到該tracr序列的tracr配對序列;和(b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到編碼所述CRISPR酶的酶編碼序列,該CRISPR酶包括一個(gè)核定位序列;其中組分(a)和(b)位于該系統(tǒng)的相同或不同載體上。在一些實(shí)施例中,組分(a)進(jìn)一步包括在該第一調(diào)節(jié)元件的控制之下在tracr配對序列的下游的tracr序列。在一些實(shí)施例中,組分(a)進(jìn)一步包括可操作地連接到該第一調(diào)節(jié)元件的兩個(gè)或更多個(gè)指導(dǎo)序列,其中當(dāng)表達(dá)時(shí),該兩個(gè)或更多個(gè)指導(dǎo)序列中的每個(gè)引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)不同靶序列的序列特異性結(jié)合。在一些實(shí)施例中,該系統(tǒng)包括在一種第三調(diào)節(jié)元件(諸如一個(gè)聚合酶III啟動子)控制之下的tracr序列。在一些實(shí)施例中,當(dāng)最佳比對時(shí),沿著該tracr配對序列的長度,該tracr序列展現(xiàn)至少50%、60%、70%、80%、90%、95%、或99%序列互補(bǔ)性。確定最佳比對在本領(lǐng)域的普通技術(shù)人員的能力范圍內(nèi)。例如,存在公開和可商購的比對算法和程序,諸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。在一些實(shí)施例中,該CRISPR復(fù)合物包括一個(gè)或多個(gè)核定位序列,該一個(gè)或多個(gè)核定位序列具有足夠強(qiáng)度來在真核細(xì)胞的細(xì)胞核中驅(qū)動所述CRISPR復(fù)合物以可檢測到的量積聚。不希望受理論限制,認(rèn)為核定位序列對于真核生物中的CRISPR復(fù)合物活性不是必要的,但包括此類序列增強(qiáng)該系統(tǒng)的活性,尤其對于靶向細(xì)胞核中的核酸分子而言。在一些實(shí)施例中,該CRISPR酶是II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該CRISPR酶是Cas9酶。在一些實(shí)施例中,該Cas9酶是肺炎鏈球菌、化膿鏈球菌、或嗜熱鏈球菌Cas9,并且可包括源自于這些生物體的突變的Cas9。該酶可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該CRISPR酶是密碼子優(yōu)化的以便在真核細(xì)胞中表達(dá)。在一些實(shí)施例中,該CRISPR酶引導(dǎo)在該靶序列位置處的一條或兩條鏈的切割。在一些實(shí)施例中,該第一調(diào)節(jié)元件是一種聚合酶III啟動子。在一些實(shí)施例中,該第二調(diào)節(jié)元件是一種聚合酶II啟動子。在一些實(shí)施例中,該指導(dǎo)序列在長度上是至少15個(gè)、16個(gè)、17個(gè)、18個(gè)、19個(gè)、20個(gè)、25個(gè)核苷酸,或10-30個(gè)之間、或15-25個(gè)之間、或15-20個(gè)之間的核苷酸。通常,并且貫穿本說明書,術(shù)語“載體”是指一種核酸分子,它能夠運(yùn)送與其連接的另一種核酸分子。載體包括但不限于,單鏈、雙鏈、或部分雙鏈的核酸分子;包括一個(gè)或多個(gè)自由端、無自由端(例如環(huán)狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領(lǐng)域已知的其他多種多樣的多核苷酸。一種類型的載體是“質(zhì)?!保涫侵钙渲锌梢岳缤ㄟ^標(biāo)準(zhǔn)分子克隆技術(shù)插入另外的DNA片段的環(huán)狀雙鏈DNA環(huán)。另一種類型的載體是病毒載體,其中病毒衍生的DNA或RNA序列存在于用于包裝病毒(例如,逆轉(zhuǎn)錄病毒、復(fù)制缺陷型逆轉(zhuǎn)錄病毒、腺病毒、復(fù)制缺陷型腺病毒、以及腺相關(guān)病毒)的載體中。病毒載體還包含由用于轉(zhuǎn)染到一種宿主細(xì)胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細(xì)菌復(fù)制起點(diǎn)的細(xì)菌載體和附加型哺乳動物載體)能夠在它們被導(dǎo)入的宿主細(xì)胞中自主復(fù)制。其他載體(例如,非附加型哺乳動物載體)在引入宿主細(xì)胞后整合到該宿主細(xì)胞的基因組中,并且由此與該宿主基因組一起復(fù)制。而且,某些載體能夠指導(dǎo)它們可操作連接的基因的表達(dá)。這樣的載體在此被稱為“表達(dá)載體”。在重組DNA技術(shù)中使用的普通表達(dá)栽體通常是質(zhì)粒形式。重組表達(dá)載體可包含處于適合于在宿主細(xì)胞中的核酸表達(dá)的形式的本發(fā)明的核酸,這意味著這些重組表達(dá)載體包含基于待用于表達(dá)的宿主細(xì)胞而選擇的一種或多種調(diào)節(jié)元件,所述調(diào)節(jié)元件可操作地連接至待表達(dá)的核酸序列。在重組表達(dá)載體內(nèi),“可操作地連接”旨在表示感興趣的核苷酸序列以一種允許該核苷酸序列的表達(dá)的方式被連接至該一種或多種調(diào)節(jié)元件(例如,處于一種體外轉(zhuǎn)錄/翻譯系統(tǒng)中或當(dāng)該載體被引入到宿主細(xì)胞中時(shí),處于該宿主細(xì)胞中)。術(shù)語“調(diào)節(jié)元件”旨在包括啟動子、增強(qiáng)子、內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)、和其他表達(dá)控制元件(例如轉(zhuǎn)錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調(diào)節(jié)序列例如描述于戈德爾(Goeddel),《基因表達(dá)技術(shù):酶學(xué)方法》(GENEEXPRESSIONTECHNOLOGY:METHODSINENZYMOLOGY)185,學(xué)術(shù)出版社(AcademicPress),圣地亞哥(SanDiego),加利福尼亞州(1990)中。調(diào)節(jié)元件包括指導(dǎo)一個(gè)核苷酸序列在許多類型的宿主細(xì)胞中的組成型表達(dá)的那些序列以及指導(dǎo)該核苷酸序列只在某些宿主細(xì)胞中表達(dá)的那些序列(例如,組織特異型調(diào)節(jié)序列)。組織特異型啟動子可主要指導(dǎo)在感興趣的期望組織中的表達(dá),所述組織例如肌肉、神經(jīng)元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細(xì)胞類型(例如淋巴細(xì)胞)。調(diào)節(jié)元件還可以時(shí)序依賴性方式(如以細(xì)胞周期依賴性或發(fā)育階段依賴性方式)指導(dǎo)表達(dá),該方式可以是或者可以不是組織或細(xì)胞類型特異性的。在一些實(shí)施例中,一個(gè)載體包含一個(gè)或多個(gè)polIII啟動子(例如1、2、3、4、5、或更多個(gè)polIII啟動子)、一個(gè)或多個(gè)polII啟動子(例如1、2、3、4、5、或更多個(gè)polII啟動子)、一個(gè)或多個(gè)polI啟動子(例如1、2、3、4、5、或更多個(gè)polI啟動子)、或其組合。polIII啟動子的實(shí)例包括但不限于U6和H1啟動子。polII啟動子的實(shí)例包括但不限于逆轉(zhuǎn)錄勞斯肉瘤病毒(RSV)LTR啟動子(任選地具有RSV增強(qiáng)子)、巨細(xì)胞病毒(CMV)啟動子(任選地具有CMV增強(qiáng)子)[參見,例如,波沙特(Boshart)等人,《細(xì)胞》(Cell)41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。還被術(shù)語“調(diào)節(jié)元件”涵蓋的是增強(qiáng)子元件,如WPRE;CMV增強(qiáng)子;在HTLV-I的LTR中的R-U5’片段《分子細(xì)胞生物學(xué)》(Mol.Cell.Biol.,第8(1)卷,第466-472頁,1988);SV40增強(qiáng)子;以及在兔β-珠蛋白的外顯子2與3之間的內(nèi)含子序列(《美國國家科學(xué)院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。本領(lǐng)域技術(shù)人員將理解,表達(dá)載體的設(shè)計(jì)可取決于諸如待轉(zhuǎn)化的宿主細(xì)胞的選擇、所希望的表達(dá)水平等因素。一種載體可以被引入到宿主細(xì)胞中而由此產(chǎn)生轉(zhuǎn)錄物、蛋白質(zhì)、或肽,包括由如本文所述的核酸編碼的融合蛋白或肽(例如,規(guī)律間隔成簇短回文重復(fù)序列(CRISPR)轉(zhuǎn)錄物、蛋白質(zhì)、酶、其突變體形式、其融合蛋白,等等)。有利的載體包括慢病毒以及腺相關(guān)病毒,并且也可選擇此類型的載體以靶向具體類型的細(xì)胞。在一個(gè)方面,本發(fā)明提供了一種真核宿主細(xì)胞,該真核宿主細(xì)胞包括:(a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種tracr配對序列以及用于在該tracr配對序列的上游插入一個(gè)或多個(gè)指導(dǎo)序列的一個(gè)或多個(gè)插入位點(diǎn),其中當(dāng)表達(dá)時(shí),該指導(dǎo)序列引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)靶序列的序列特異性結(jié)合,其中該CRISPR復(fù)合物包括與以下各項(xiàng)復(fù)合的一種CRISPR酶:(1)雜交到該靶序列的指導(dǎo)序列,以及(2)雜交到該tracr序列的tracr配對序列;和/或(b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到編碼所述CRISPR酶的酶編碼序列,該CRISPR酶包括一個(gè)核定位序列。在一些實(shí)施例中,該宿主細(xì)胞包括組分(a)以及(b)。在一些實(shí)施例中,組分(a)、組分(b)、或組分(a)和(b)穩(wěn)定地整合到該宿主真核細(xì)胞的一個(gè)基因組中。在一些實(shí)施例中,組分(a)進(jìn)一步包括在該第一調(diào)節(jié)元件的控制之下在tracr配對序列的下游的tracr序列。在一些實(shí)施例中,組分(a)進(jìn)一步包括可操作地連接到該第一調(diào)節(jié)元件的兩個(gè)或更多個(gè)指導(dǎo)序列,其中當(dāng)表達(dá)時(shí),該兩個(gè)或更多個(gè)指導(dǎo)序列中的每個(gè)引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)不同靶序列的序列特異性結(jié)合。在一些實(shí)施例中,該真核宿主細(xì)胞進(jìn)一步包括一種第三調(diào)節(jié)元件,諸如一種聚合酶III啟動子,該第三調(diào)節(jié)元件可操作地連接到所述tracr序列。在一些實(shí)施例中,當(dāng)最佳比對時(shí),沿著該tracr配對序列的長度,該tracr序列展現(xiàn)至少50%、60%、70%、80%、90%、95%、或99%序列互補(bǔ)性。該酶可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該CRISPR酶是密碼子優(yōu)化的以便在真核細(xì)胞中表達(dá)。在一些實(shí)施例中,該CRISPR酶引導(dǎo)在該靶序列位置處的一條或兩條鏈的切割。在一些實(shí)施例中,該CRISPR酶缺少DNA鏈切割活性。在一些實(shí)施例中,該第一調(diào)節(jié)元件是一種聚合酶III啟動子。在一些實(shí)施例中,該第二調(diào)節(jié)元件是一種聚合酶II啟動子。在一些實(shí)施例中,該指導(dǎo)序列在長度上是至少15個(gè)、16個(gè)、17個(gè)、18個(gè)、19個(gè)、20個(gè)、25個(gè)核苷酸,或10-30個(gè)之間、或15-25個(gè)之間、或15-20個(gè)之間的核苷酸。在一個(gè)方面,本發(fā)明提供一種非人的真核生物;優(yōu)選地一種多細(xì)胞真核生物,包括根據(jù)所述實(shí)施例中任一個(gè)的一種真核宿主細(xì)胞。在其他方面,本發(fā)明提供一種真核生物;優(yōu)選地一種多細(xì)胞真核生物,包括根據(jù)所述實(shí)施例中任一個(gè)的一種真核宿主細(xì)胞。在這些方面的一些實(shí)施例中,該生物體可以是一種動物;例如一種哺乳動物。另外,該生物體可以是一種節(jié)肢動物,諸如一種昆蟲。該生物體也可以是一種植物。進(jìn)一步,該生物體可以是一種真菌。在一個(gè)方面,本發(fā)明提供了一種試劑盒,該試劑盒包括在此所述的組分中的一種或多種。在一些實(shí)施例中,該試劑盒包括一種載體系統(tǒng)以及用于使用該試劑盒的說明書。在一些實(shí)施例中,該載體系統(tǒng)包括:(a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種tracr配對序列以及用于在該tracr配對序列的上游插入一個(gè)或多個(gè)指導(dǎo)序列的一個(gè)或多個(gè)插入位點(diǎn),其中當(dāng)表達(dá)時(shí),該指導(dǎo)序列引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)靶序列的序列特異性結(jié)合,其中該CRISPR復(fù)合物包括與以下各項(xiàng)復(fù)合的一種CRISPR酶:(1)雜交到該靶序列的指導(dǎo)序列,以及(2)雜交到該tracr序列的tracr配對序列;和/或(b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到編碼所述CRISPR酶的酶編碼序列,該CRISPR酶包括一個(gè)核定位序列。在一些實(shí)施例中,該試劑盒包括位于該系統(tǒng)的相同或不同載體上的組分(a)和(b)。在一些實(shí)施例中,組分(a)進(jìn)一步包括在該第一調(diào)節(jié)元件的控制之下在tracr配對序列的下游的tracr序列。在一些實(shí)施例中,組分(a)進(jìn)一步包括可操作地連接到該第一調(diào)節(jié)元件的兩個(gè)或更多個(gè)指導(dǎo)序列,其中當(dāng)表達(dá)時(shí),該兩個(gè)或更多個(gè)指導(dǎo)序列中的每個(gè)引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)不同靶序列的序列特異性結(jié)合。在一些實(shí)施例中,該系統(tǒng)進(jìn)一步包括一種第三調(diào)節(jié)元件,諸如一種聚合酶III啟動子,該第三調(diào)節(jié)元件可操作地連接到所述tracr序列。在一些實(shí)施例中,當(dāng)最佳比對時(shí),沿著該tracr配對序列的長度,該tracr序列展現(xiàn)至少50%、60%、70%、80%、90%、95%、或99%序列互補(bǔ)性。在一些實(shí)施例中,該CRISPR酶包括一個(gè)或多個(gè)核定位序列,該一個(gè)或多個(gè)核定位序列具有足夠強(qiáng)度來在真核細(xì)胞的細(xì)胞核中驅(qū)動所述CRISPR酶以可檢測到的量積聚。在一些實(shí)施例中,該CRISPR酶是II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該CRISPR酶是Cas9酶。在一些實(shí)施例中,該Cas9酶是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物體的突變的Cas9。該酶可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該CRISPR酶是密碼子優(yōu)化的以便在真核細(xì)胞中表達(dá)。在一些實(shí)施例中,該CRISPR酶引導(dǎo)在該靶序列位置處的一條或兩條鏈的切割。在一些實(shí)施例中,該CRISPR酶缺少DNA鏈切割活性。在一些實(shí)施例中,該第一調(diào)節(jié)元件是一種聚合酶III啟動子。在一些實(shí)施例中,該第二調(diào)節(jié)元件是一種聚合酶II啟動子。在一些實(shí)施例中,該指導(dǎo)序列在長度上是至少15個(gè)、16個(gè)、17個(gè)、18個(gè)、19個(gè)、20個(gè)、25個(gè)核苷酸,或10-30個(gè)之間、或15-25個(gè)之間、或15-20個(gè)之間的核苷酸。在一個(gè)方面,本發(fā)明提供了修飾在一種真核細(xì)胞中的靶多核苷酸的方法。在一些實(shí)施例中,該方法包括允許一種CRISPR復(fù)合物結(jié)合到該靶多核苷酸上以實(shí)施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR復(fù)合物包括與雜交到在所述靶多核苷酸內(nèi)的一個(gè)靶序列上的指導(dǎo)序列復(fù)合的CRISPR酶,其中所述指導(dǎo)序列連接到一種tracr配對序列上,該tracr配對序列進(jìn)而雜交到一種tracr序列上。在一些實(shí)施例中,所述切割包括通過所述CRISPR酶切割在該靶序列位置的一條或兩條鏈。在一些實(shí)施例中,所述切割導(dǎo)致靶基因的轉(zhuǎn)錄降低。在一些實(shí)施例中,該方法進(jìn)一步包括通過與外源模板多核苷酸同源重組修復(fù)所述切割的靶多核苷酸,其中所述修復(fù)導(dǎo)致一種突變,包括所述靶多核苷酸的一個(gè)或多個(gè)核苷酸的插入、缺失、或取代。在一些實(shí)施例中,所述突變導(dǎo)致在從包含該靶序列的基因表達(dá)的蛋白質(zhì)中的一個(gè)或多個(gè)氨基酸改變。在一些實(shí)施例中,該方法進(jìn)一步包括將一種或多種載體遞送到所述真核細(xì)胞,其中該一種或多種載體驅(qū)動下列一者或多者的表達(dá):該CRISPR酶、連接到該tracr配對序列上的指導(dǎo)序列、以及該tracr序列。在一些實(shí)施例中,所述載體被遞送到受試者內(nèi)的真核細(xì)胞中。在一些實(shí)施例中,所述修飾發(fā)生在細(xì)胞培養(yǎng)物中的所述真核細(xì)胞中。在一些實(shí)施例中,該方法進(jìn)一步包括在所述修飾之前從受試者中分離所述真核細(xì)胞。在一些實(shí)施例中,該方法進(jìn)一步包括使所述真核細(xì)胞和/或從中衍生的細(xì)胞返回到所述受試者中。在一個(gè)方面,本發(fā)明提供了修飾一種多核苷酸在真核細(xì)胞中的表達(dá)的方法。在一些實(shí)施例中,該方法包括允許一種CRISPR復(fù)合物結(jié)合到該多核苷酸上,這樣使得所述結(jié)合導(dǎo)致所述多核苷酸的表達(dá)增加或降低;其中該CRISPR復(fù)合物包括與雜交到在所述多核苷酸內(nèi)的一個(gè)靶序列上的指導(dǎo)序列復(fù)合的CRISPR酶,其中所述指導(dǎo)序列連接到一種tracr配對序列上,該tracr配對序列進(jìn)而雜交到一種tracr序列上。在一些實(shí)施例中,該方法進(jìn)一步包括將一種或多種載體遞送到所述真核細(xì)胞,其中該一種或多種載體驅(qū)動下列一者或多者的表達(dá):該CRISPR酶、連接到該tracr配對序列上的指導(dǎo)序列、以及該tracr序列。在一個(gè)方面,本發(fā)明提供了一種產(chǎn)生包含突變的疾病基因的模式真核細(xì)胞的方法。在一些實(shí)施例中,疾病基因是與患有或產(chǎn)生一種疾病的風(fēng)險(xiǎn)的增加相關(guān)聯(lián)的任何基因。在一些實(shí)施例中,該方法包括(a)將一種或多種載體引入真核細(xì)胞中,其中該一種或多種載體驅(qū)動以下一者或多者的表達(dá):CRISPR酶、連接到tracr配對序列上的指導(dǎo)序列、以及tracr序列;以及(b)允許一種CRISPR復(fù)合物結(jié)合到一個(gè)靶多核苷酸上以實(shí)施在所述疾病基因內(nèi)的該靶多核苷酸的切割,其中該CRISPR復(fù)合物包含與(1)雜交到該靶多核苷酸內(nèi)的該靶序列上的指導(dǎo)序列、和(2)雜交到該tracr序列上的該tracr配對序列復(fù)合的CRISPR酶,由此產(chǎn)生包含突變的疾病基因的模式真核細(xì)胞。在一些實(shí)施例中,所述切割包括通過所述CRISPR酶切割在該靶序列位置的一條或兩條鏈。在一些實(shí)施例中,所述切割導(dǎo)致靶基因的轉(zhuǎn)錄降低。在一些實(shí)施例中,該方法進(jìn)一步包括通過與外源模板多核苷酸同源重組修復(fù)所述切割的靶多核苷酸,其中所述修復(fù)導(dǎo)致一種突變,包括所述靶多核苷酸的一個(gè)或多個(gè)核苷酸的插入、缺失、或取代。在一些實(shí)施例中,所述突變導(dǎo)致在從包含該靶序列的基因表達(dá)的蛋白質(zhì)中的一個(gè)或多個(gè)氨基酸改變。在一個(gè)方面,本發(fā)明提供了一種用于研發(fā)生物活性劑的方法,該生物活性劑調(diào)制與疾病基因相關(guān)的細(xì)胞信號傳導(dǎo)事件。在一些實(shí)施例中,疾病基因是與患有或產(chǎn)生一種疾病的風(fēng)險(xiǎn)的增加相關(guān)聯(lián)的任何基因。在一些實(shí)施例中,該方法包括(a)使一種測試化合物與所述實(shí)施例中的任一項(xiàng)的一種模式細(xì)胞接觸;并且(b)檢測讀數(shù)變化,該變化指示與所述疾病基因的所述突變關(guān)聯(lián)的細(xì)胞信號傳導(dǎo)事件的減少或增加,從而開發(fā)調(diào)制與所述疾病基因關(guān)聯(lián)的所述細(xì)胞信號傳導(dǎo)事件的所述生物活性劑。在一個(gè)方面,本發(fā)明提供包括在tracr配對序列上游的指導(dǎo)序列的一種重組多核苷酸,其中當(dāng)表達(dá)時(shí)該指導(dǎo)序列引導(dǎo)一種CRISPR復(fù)合物與存在于真核細(xì)胞中的一個(gè)對應(yīng)的靶序列的序列特異性結(jié)合。在一些實(shí)施例中,該靶序列是存在于真核細(xì)胞中的病毒序列。在一些實(shí)施例中,該靶序列是原癌基因或癌基因。在一個(gè)方面,本發(fā)明提供了一種通過在一個(gè)或多個(gè)細(xì)胞中的基因中引入一個(gè)或多個(gè)突變來選擇一個(gè)或多個(gè)細(xì)胞的方法,該方法包括:將一種或多種載體引入一個(gè)或多個(gè)細(xì)胞中,其中該一種或多種載體驅(qū)動以下一者或多者的表達(dá):CRISPR酶、連接到tracr配對序列上的指導(dǎo)序列、tracr序列、以及編輯模板;其中該編輯模板包含消除CRISPR酶切的一個(gè)或多個(gè)突變;允許該編輯模板與在有待選擇的一個(gè)或多個(gè)細(xì)胞中的靶多核苷酸同源重組;允許CRISPR復(fù)合物結(jié)合到靶多核苷酸上以實(shí)施在所述基因內(nèi)的靶多核苷酸的切割,其中該CRISPR復(fù)合物包含與(1)雜交到該靶多核苷酸內(nèi)的靶序列上的指導(dǎo)序列、和(2)雜交到該tracr序列上的tracr配對序列復(fù)合的CRISPR酶,其中該CRISPR復(fù)合物到該靶多核苷酸上的結(jié)合誘導(dǎo)細(xì)胞死亡,由此允許選擇其中已經(jīng)引入一個(gè)或多個(gè)突變的一個(gè)或多個(gè)細(xì)胞。在一些實(shí)施例中,該CRISPR酶是II型CRISPR系統(tǒng)酶。在一些實(shí)施例中,該CRISPR酶是一種Cas9蛋白。在一些實(shí)施例中,該Cas9蛋白是肺炎鏈球菌、化膿鏈球菌或嗜熱鏈球菌Cas9,并且可包括源自于這些生物的突變的Cas9。該酶可以是一種Cas9同系物或直向同源物。在一些實(shí)施例中,該酶是密碼子優(yōu)化的,用于在真核細(xì)胞中進(jìn)行表達(dá)。在一些實(shí)施例中,該酶指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。在一個(gè)優(yōu)選的實(shí)施例中,該CRISPR酶是Cas9。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,該有待選擇的細(xì)胞可以是真核細(xì)胞。本發(fā)明的方面允許選擇特異細(xì)胞,而不需要選擇標(biāo)記或可能包括反選擇系統(tǒng)的兩步法。本發(fā)明的方面包括內(nèi)源基因組中的位點(diǎn)特異性基因敲除:本發(fā)明與使用基于鋅指和TAL效應(yīng)物的位點(diǎn)特異性核酸酶技術(shù)相比是有利的,因?yàn)樗鼰o需詳盡的設(shè)計(jì)并且可用于同時(shí)敲除同一基因組內(nèi)的多個(gè)基因。在一個(gè)另外的方面,本發(fā)明包括位點(diǎn)特異性基因組編輯。本發(fā)明與使用天然或人工位點(diǎn)特異性核酸酶或重組酶相比是有利的,因?yàn)樗梢阅軌蛞胛稽c(diǎn)特異性雙鏈斷裂,以促進(jìn)靶向的基因組座位處的同源重組。在另一個(gè)方面,本發(fā)明包括DNA序列特異性干擾??梢允褂帽景l(fā)明失活基于有害DNA的生物(如微生物、病毒或甚至癌細(xì)胞)的基因組,通過直接造這些生物的基因組中的特定位點(diǎn)處引入斷裂。本發(fā)明提供了多元基因組工程化的方法和組合物,因?yàn)楸景l(fā)明的CRISPR-Cas系統(tǒng)可以通過使用多個(gè)序列特異性CRISPR間隔子元件或指導(dǎo)序列而容易地靶向基因組中的多個(gè)位點(diǎn)。因此,本發(fā)明的目的在于,在本發(fā)明中不涵蓋任何先前已知的產(chǎn)品、制造該產(chǎn)品的過程、或使用該產(chǎn)品的方法,使得申請人保留和特此披露放棄任何先前已知的產(chǎn)品、過程、或方法的權(quán)利。進(jìn)一步指出的是,在本發(fā)明的范圍之內(nèi),本發(fā)明并不旨在涵蓋任何產(chǎn)品、過程、或該產(chǎn)品的制造或使用該產(chǎn)品的方法,其不符合USPTO(35U.S.C.§112,第一段)或EPO(EPC的第83條)的書面說明和可實(shí)施性要求,使得申請人保留和特此公開放棄任何先前描述的產(chǎn)品、制造該產(chǎn)品的過程、或使用該產(chǎn)品的方法的權(quán)利。應(yīng)當(dāng)指出的是,在本披露中并且尤其是在權(quán)利要求書和/或段落中,術(shù)語如“包含(comprises)”、“包含(comprised)”、“包含(comprising)”等等可具有在美國專利法中屬于它的含義;例如,它們可以表示“包括(includes)”、“包括(included)”、“包括(including)”等等;并且術(shù)語如“基本上由……組成(consistingessentiallyof)”和“基本上由……組成(consistsessentiallyof)”具有在美國專利法中歸于它們的含義,例如,它們允許未被清楚敘述的要素,但是排除在現(xiàn)有技術(shù)中發(fā)現(xiàn)或者影響本發(fā)明的基本或新穎特征的要素。這些和其他實(shí)施例披露于以下詳細(xì)說明中,或者據(jù)其顯而易見并且由其涵蓋。附圖簡述本發(fā)明的新穎特征在所附權(quán)利要求書中具體提出。通過參考對說明性實(shí)施例進(jìn)行敘述的以下詳細(xì)說明,將獲得對本發(fā)明的特征和優(yōu)點(diǎn)的更好理解,在這些實(shí)施例中利用了本發(fā)明的原理,并且在這些附圖中:圖1顯示了該CRISPR系統(tǒng)的示意模型。來自化膿鏈球菌(黃色)的Cas9核酸酶經(jīng)由合成的指導(dǎo)RNA(sgRNA)而被靶向基因組DNA,該指導(dǎo)RNA包含一個(gè)20個(gè)nt的指導(dǎo)序列(藍(lán)色)和一個(gè)支架(紅色)。與DNA靶(藍(lán)色)的指導(dǎo)序列堿基對,直接地在必要的5’-NGG原型間隔子鄰近基序(PAM;紅紫色)的上游,并且Cas9在該P(yáng)AM(紅色三角形)的上游約3bp介導(dǎo)了雙鏈斷裂(DSB)。圖2A-F顯示了一個(gè)示例性CRISPR系統(tǒng)、一個(gè)可能的作用機(jī)制、一個(gè)在真核細(xì)胞中的表達(dá)的示例性適應(yīng)性改變、以及評估核定位和CRISPR活性的試驗(yàn)的結(jié)果。圖2C按照出現(xiàn)次序分別披露了SEQIDNOS23-24。圖2E按照出現(xiàn)次序分別披露了SEQIDNOS25-27。圖2F按照出現(xiàn)次序分別披露了SEQIDNOS28-32。圖3A-D顯示了針對示例性靶標(biāo)的SpCas9特異性的評估結(jié)果。圖3A按照出現(xiàn)次序分別披露了SEQIDNOS33、26和34-44。圖3C披露了SEQIDNO:33。圖4A-G顯示了一個(gè)示例性載體系統(tǒng)以及它在指導(dǎo)真核細(xì)胞中的同源重組中的使用結(jié)果。圖4E披露了SEQIDNO:45。圖4F按照出現(xiàn)次序分別披露了SEQIDNOS46-47。圖4G按照出現(xiàn)次序分別披露了SEQIDNOS48-52。圖5提供了原型間隔子序列的表(按照出現(xiàn)次序分別是SEQIDNOS16、15、14、53-58、18、17以及59-63),并且總結(jié)了基于示例性膿鏈球菌和嗜熱鏈球菌CRISPR系統(tǒng)設(shè)計(jì)的原型間隔子靶標(biāo)的修飾效率結(jié)果,這些CRISPR系統(tǒng)具有針對人類和小鼠基因組中的座位的相應(yīng)PAM。用Cas9以及前-crRNA/tracrRNA或嵌合RNA轉(zhuǎn)染細(xì)胞,在轉(zhuǎn)染72小時(shí)之后進(jìn)行分析?;趤碜灾甘炯?xì)胞系的Surveyor分析結(jié)果,計(jì)算了indel(插入缺失)百分比(對于所有原型間隔子靶標(biāo)N=3,誤差為S.E.M.,N.D.表示使用Surveyor測定未檢測到,并且N.T.表示在本研究中未檢測)。圖6A-C顯示了對于Cas9介導(dǎo)的基因靶向而言的不同tracrRNA轉(zhuǎn)錄本的比較。圖6A按照出現(xiàn)次序分別披露了SEQIDNOS64-65。圖7顯示了對于雙鏈斷裂誘導(dǎo)的微插入和微缺失的檢測的surveyor核酸酶試驗(yàn)的示意圖。圖8A-B顯示了用于CRISPR系統(tǒng)元件在真核細(xì)胞中的表達(dá)的示例性雙順反子表達(dá)載體。圖8A按照出現(xiàn)次序分別披露了SEQIDNOS66-68。圖8B按照出現(xiàn)次序分別披露了SEQIDNOS69-71。圖9A-C顯示了在人類基因組中在鄰近的化膿鏈球菌SF370座位1PAM(NGG)(圖9A)和嗜熱鏈球菌LMD9座位2PAM(NNAGAAW)(圖9B)之間的距離、以及對于每個(gè)PAM就染色體而言的距離(Chr)(圖9C)的直方圖。圖10A-D顯示了一個(gè)示例性CRISPR系統(tǒng)、一個(gè)針對在真核細(xì)胞中的表達(dá)的示例性適應(yīng)性改變、以及評估CRISPR活性的試驗(yàn)的結(jié)果。圖10B按照出現(xiàn)次序分別披露了SEQIDNOS72-73。圖10C披露了SEQIDNO:74。圖11A-C顯示了用于靶向哺乳動物細(xì)胞中的基因組座位的CRISPR系統(tǒng)的示例性操縱。圖11A披露了SEQIDNO:75。圖11B按照出現(xiàn)次序分別披露了SEQIDNOS76-78。圖12A-B顯示了在哺乳動物中的crRNA加工的Northern印跡分析的結(jié)果。圖12A披露了SEQIDNO:79。圖13A-B顯示了在人PVALB和小鼠Th座位中的原型間隔子的示例性選擇。圖13A披露了SEQIDNO:80。圖13B披露了SEQIDNO:81。圖14顯示了在人EMX1座位中的嗜熱鏈球菌CRISPR系統(tǒng)的示例性原型間隔子和相應(yīng)PAM序列靶標(biāo)。圖14披露了SEQIDNO:74。圖15提供了用于Surveyor、RFLP、基因組測序、以及Northern印跡分析的引物和探針的序列表(按照出現(xiàn)次序分別是SEQIDNOS82-93)。圖16A-C顯示了具有嵌合RNA的CRISPR系統(tǒng)的示例性操縱以及在真核細(xì)胞中的系統(tǒng)活性的SURVEYOR分析的結(jié)果。圖16A披露了SEQIDNO:94。圖17A-B顯示了在真核細(xì)胞中的CRISPR系統(tǒng)活性的SURVEYOR分析的結(jié)果的圖示。圖18顯示了使用UCSC基因組瀏覽器進(jìn)行的在人類基因組中的一些化膿鏈球菌Cas9靶位點(diǎn)的示例性可視化。圖18按照出現(xiàn)次序分別披露了SEQIDNOS95-173。圖19A-D顯示了揭示五個(gè)Cas9家族的系統(tǒng)發(fā)生分析的環(huán)狀描繪,這五個(gè)家族包括三組大的Cas9(約1400個(gè)氨基酸)和兩組小的Cas9(約1100個(gè)氨基酸)。圖20A-F顯示了揭示五個(gè)Cas9家族的系統(tǒng)發(fā)生分析的線性描繪,這五個(gè)家族包括三組大的Cas9(約1400個(gè)氨基酸)和兩組小的Cas9(約1100個(gè)氨基酸)。圖21A-D顯示了經(jīng)由同源重組的基因組編輯。(a)SpCas9切口酶的示意圖,具有在RuvCI催化結(jié)構(gòu)域中的D10A突變。(b)示意圖,表示使用有義或反義單鏈寡核苷酸作為修復(fù)模板在人EMX1座位處的同源重組(HR)。以上紅色箭頭表示sgRNA切割位點(diǎn);用于基因分型的PCR引物(表J和K)表示為右圖中的箭頭。圖21C按照出現(xiàn)次序分別披露了SEQIDNOS174-176、174、177以及176。(c)由HR修飾的區(qū)域的序列。d,對于野生型(wt)和切口酶(D10A)SpCas9介導(dǎo)的在EMX1靶標(biāo)1座位的indel的SURVEYOR分析(n=3)。箭頭指示預(yù)期片段大小的位置。圖22A-B顯示了用于SpCas9的單個(gè)載體設(shè)計(jì)。圖22A按照出現(xiàn)次序分別披露了SEQIDNOS178-180。圖22B披露了SEQIDNO:181。本文的這些圖僅僅是出于說明性的目的,并且不一定是按比例繪制的。具體實(shí)施方式術(shù)語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互換地使用。它們是指具有任何長度的核苷酸的聚合形式,是脫氧核糖核苷酸或核糖核苷酸、或其類似物。多核苷酸可具有任何三維結(jié)構(gòu),并且可以執(zhí)行已知或未知的任何功能。以下是多核苷酸的非限制性實(shí)例:基因或基因片段的編碼區(qū)或非編碼區(qū)、根據(jù)連接分析定義的多個(gè)座位(一個(gè)座位)、外顯子、內(nèi)含子、信使RNA(mRNA)、轉(zhuǎn)運(yùn)RNA、核糖體RNA、短發(fā)夾RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重組多核苷酸、分支多核苷酸、質(zhì)粒、載體、任何序列的分離的DNA、任何序列的分離的RNA、核酸探針、和引物。多核苷酸可以包含一個(gè)或多個(gè)經(jīng)修飾的核苷酸,如甲基化的核苷酸和核苷酸類似物。如果存在,可以在聚合物組裝之前或之后進(jìn)行核苷酸結(jié)構(gòu)的修飾。核苷酸的序列可以被非核苷酸組分中斷。多核苷酸可以在聚合后,如通過與標(biāo)記的組分綴合來進(jìn)一步修飾。在本發(fā)明的多個(gè)方面,術(shù)語“嵌合RNA”、“嵌合指導(dǎo)RNA”、“指導(dǎo)RNA”、“單個(gè)指導(dǎo)RNA”以及“合成指導(dǎo)RNA”是可互換地使用的并且是指包括指導(dǎo)序列、tracr序列以及tracr配對序列的多核苷酸序列。術(shù)語“指導(dǎo)序列”是指在指定靶位點(diǎn)的指導(dǎo)RNA內(nèi)約20bp的序列,并且可與術(shù)語“指導(dǎo)”或“間隔子”互換地使用。術(shù)語“tracr配對序列”也可與術(shù)語“(一個(gè)或多個(gè))同向重復(fù)”互換地使用。一種示例性CRISPR-Cas系統(tǒng)示于圖1中。如本文所用的術(shù)語“野生型”是本領(lǐng)域技術(shù)人員所理解的術(shù)語,并且表示生物、菌株、基因的典型形式或者當(dāng)它在自然界存在時(shí)區(qū)別于突變體或變體形式的特征。如本文所用的術(shù)語“變體”應(yīng)當(dāng)被理解為表示具有衍生自在自然界中存在的模式的性質(zhì)的展示。術(shù)語“非天然存在的”或“工程化的”可互換地使用并且表面人工的參與。這些術(shù)語,當(dāng)指核酸分子或多肽時(shí),表示該核酸分子或多肽至少基本上從它們在自然界中或如發(fā)現(xiàn)于自然界中的與其結(jié)合的至少另一種組分游離出來。“互補(bǔ)性”是指核酸與另一個(gè)核酸序列借助于傳統(tǒng)的沃森-克里克或其他非傳統(tǒng)類型形成一個(gè)或多個(gè)氫鍵的能力。互補(bǔ)百分比表示一個(gè)核酸分子中可與一個(gè)第二核酸序列形成氫鍵(例如,沃森-克里克堿基配對)的殘基的百分比(例如,10個(gè)之中有5、6、7、8、9、10個(gè)即為50%、60%、70%、80%、90%、和100%互補(bǔ))?!巴耆パa(bǔ)”表示一個(gè)核酸序列的所有連續(xù)殘基與一個(gè)第二核酸序列中的相同數(shù)目的連續(xù)殘基形成氫鍵。如本文使用的“基本上互補(bǔ)”是指在一個(gè)具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個(gè)或更多個(gè)核苷酸的區(qū)域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補(bǔ)程度,或者是指在嚴(yán)格條件下雜交的兩個(gè)核酸。如本文使用的對于雜交的“嚴(yán)格條件”是指與靶序列具有互補(bǔ)性的一個(gè)核酸主要地與該靶序列雜交并且基本上不雜交到非靶序列上的條件。嚴(yán)格條件通常是序列依賴性的,并且取決于許多因素而變化。一般而言,該序列越長,則該序列特異性地雜交到其靶序列上的溫度就越高。嚴(yán)格條件的非限制性實(shí)例描述于蒂森(Tijssen)(1993)的《生物化學(xué)和分子生物學(xué)中的實(shí)驗(yàn)室技術(shù)-核酸探針雜交》(LaboratoryTechniquesInBiochemistryAndMolecularBiology-HybridizationWithNucleicAcidProbes),第I部分,第二章,“雜交原理概述和核酸探針分析策略”(“Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassay”),愛思唯爾(Elsevier),紐約。“雜交”是指其中一個(gè)或多個(gè)多核苷酸反應(yīng)形成一種復(fù)合物的反應(yīng),該復(fù)合物經(jīng)由這些核苷酸殘基之間的堿基的氫鍵鍵合而穩(wěn)定化。氫鍵鍵合可以借助于沃森-克里克堿基配對、Hoogstein結(jié)合或以任何其他序列特異性方式而發(fā)生。該復(fù)合物可包含形成一個(gè)雙鏈體的兩條鏈、形成多鏈復(fù)合物的三條或多條鏈、單個(gè)自我雜交鏈、或這些的任何組合。雜交反應(yīng)可以構(gòu)成一個(gè)更廣泛的過程(如PCR的開始、或經(jīng)由一種酶的多核苷酸的切割)中的一個(gè)步驟。能夠與一個(gè)給定序列雜交的序列被稱為該給定序列的“互補(bǔ)物”。如本文使用的“表達(dá)”是指藉此從DNA模板轉(zhuǎn)錄成多核苷酸(如轉(zhuǎn)錄成mRNA或其他RNA轉(zhuǎn)錄物)的過程和/或轉(zhuǎn)錄的mRNA隨后藉此翻譯成肽、多肽或蛋白質(zhì)的過程。轉(zhuǎn)錄物和編碼的多肽可以總稱為“基因產(chǎn)物”。如果多核苷酸來源于基因組DNA,表達(dá)可以包括真核細(xì)胞中mRNA的剪接。術(shù)語“多肽”、“肽”和“蛋白質(zhì)”在本文可互換地使用,是指具有任何長度的氨基酸的聚合物。該聚合物可以是可以是直鏈或支鏈的,它可以包含修飾的氨基酸,并且它可以被非氨基酸中斷。這些術(shù)語還涵蓋已經(jīng)被修飾的氨基酸聚合物;這些修飾例如二硫鍵形成、糖基化、脂化(lipidation)、乙?;⒘姿峄?、或任何其他操縱,如與標(biāo)記組分的綴合。如本文使用的術(shù)語“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及D和L旋光異構(gòu)體、以及氨基酸類似物和肽模擬物。術(shù)語“受試者”、“個(gè)體”和“患者”在本文中是可互換地使用的,指的是脊椎動物,優(yōu)選地是哺乳動物,更加優(yōu)選地是人類。哺乳動物包括但不限于鼠類、猴、人、農(nóng)畜、體育用動物和寵物。也包括體內(nèi)獲得或體外培養(yǎng)的一種生物實(shí)體的組織、細(xì)胞及其子代。術(shù)語“治療劑(therapeuticagent)”、“可用于治療的試劑(therapeuticcapableagent)”或“處理劑(treatmentagent)”是可互換地使用的,并且是指在給予受試者時(shí)賦予某種有益影響的一種分子或化合物。該有益影響包括診斷確定的實(shí)現(xiàn);改進(jìn)一種疾病、癥狀、障礙、或病理學(xué)病況;減少或預(yù)防一種疾病、癥狀、障礙或病況的發(fā)作;并且總體上對抗一種疾病、癥狀、障礙或病理學(xué)病況。如此處使用的,“治療(treatment)”或“進(jìn)行治療(treating)”或“減輕”或“改善”是可互換地使用的。這些術(shù)語是指如下途徑,該途徑用于獲得有益或希望的結(jié)果,包括但不限于一種治療益處和/或一種預(yù)防益處。治療益處意指治療中的一種或多種疾病、病況、或癥狀上的任何治療上相關(guān)的改進(jìn)或?qū)ζ涞挠绊?。對于預(yù)防益處,該組合物可給予至處于發(fā)展一種具體的疾病、病況、或癥狀的風(fēng)險(xiǎn)的受試者,或給予至報(bào)告了一種疾病的一個(gè)或多個(gè)生理學(xué)癥狀的受試者,盡管該疾病、病況、或癥狀可能還沒有體現(xiàn)出來。術(shù)語“有效量”或“治療有效量”是指一種藥劑的足以實(shí)現(xiàn)有益或希望的結(jié)果的量。治療有效量可依賴于正治療的受試者和疾病病狀、受試者的重量和年齡、疾病病況的嚴(yán)重度、給藥方式等中一項(xiàng)或多個(gè)而改變,并可以由本領(lǐng)域普通技術(shù)人員容易地確定。該術(shù)語也適用通過此處描述的顯像方法中的任一項(xiàng)提供一種檢測用圖像的一個(gè)劑量。具體劑量可依賴于以下中一個(gè)或多個(gè)而變化:所選擇的具體藥劑、所遵循的給藥方案、是否與其他化合物組合給予、給予時(shí)間、待顯像的組織、以及攜帶它的物理遞送系統(tǒng)。除非另有說明,本發(fā)明的實(shí)踐采用免疫學(xué)、生物化學(xué)、化學(xué)、分子生物學(xué)、微生物學(xué)、細(xì)胞生物學(xué)、基因組學(xué)和重組DNA的常規(guī)技術(shù),這些在本領(lǐng)域的技能之內(nèi)。參見薩姆布魯克(Sambrook)、弗里奇(Fritsch)和馬尼亞蒂斯(Maniatis),《分子克?。簩?shí)驗(yàn)室手冊》(MOLECULARCLONING:ALABORATORYMANUAL),第2次編輯(1989);《當(dāng)代分子生物學(xué)實(shí)驗(yàn)手冊》(CURRENTPROTOCOLSINMOLECULARBIOLOGY)(F.M.奧蘇貝爾(F.M.Ausubel)等人編輯,(1987));《酶學(xué)方法》(METHODSINENZYMOLOGY)系列(學(xué)術(shù)出版公司):《PCR2:實(shí)用方法》(PCR2:APRACTICALAPPROACH)(M.J.麥克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)編輯(1995))、哈洛(Harlow)和拉內(nèi)(Lane)編輯(1988)《抗體:實(shí)驗(yàn)室手冊》(ANTIBODIES,ALABORATORYMANUAL),以及《動物細(xì)胞培養(yǎng)》(ANIMALCELLCULTURE)(R.I.弗雷謝尼(R.I.Freshney)編輯(1987))。本發(fā)明的若干方面涉及包括一種或多種載體的載體系統(tǒng),或載體本身。載體可以被設(shè)計(jì)為用于在原核或真核細(xì)胞中表達(dá)CRISPR轉(zhuǎn)錄物(例如核酸轉(zhuǎn)錄物、蛋白質(zhì)、或酶)。例如,CRISPR轉(zhuǎn)錄物可表達(dá)于例如大腸桿菌的細(xì)菌細(xì)胞、昆蟲細(xì)胞(使用桿狀病毒表達(dá)載體)、酵母細(xì)胞、或哺乳動物細(xì)胞中。適合的宿主細(xì)胞進(jìn)一步討論于Goeddel(戈德爾),《基因表達(dá)技術(shù):酶學(xué)方法》(GENEEXPRESSIONTECHNOLOGY:METHODSINENZYMOLOGY)185,學(xué)術(shù)出版社(AcademicPress),圣地亞哥(SanDiego),加利福尼亞州(Calif.)(1990年)中。可替代地,重組表達(dá)載體可在體外例如使用T7啟動子調(diào)節(jié)序列和T7聚合酶來轉(zhuǎn)錄和翻譯。載體可以被引入原核生物中并且在其中增殖。在一些實(shí)施例中,原核生物用來擴(kuò)增有待引入真核細(xì)胞中的載體的多個(gè)拷貝,或者作為有待引入真核細(xì)胞中的載體的產(chǎn)生中的中間載體(例如,擴(kuò)增質(zhì)粒作為病毒載體包裝系統(tǒng)的一部分)。在一些實(shí)施例中,原核生物用來擴(kuò)增一個(gè)載體的多個(gè)拷貝并且表達(dá)一種或多種核酸,如提供用于遞送到宿主細(xì)胞或宿主生物中的一種或多種蛋白質(zhì)的來源。蛋白質(zhì)在原核生物中的表達(dá)最經(jīng)常在大腸桿菌中用含有指導(dǎo)融合或非融合蛋白的表達(dá)的組成型或誘導(dǎo)型啟動子的載體來進(jìn)行。融合載體將多個(gè)氨基酸添加到在其中編碼的蛋白質(zhì)上,如該重組蛋白的氨基端上。這樣的融合載體可以用于一個(gè)或多個(gè)目的,如:(i)增加重組蛋白的表達(dá);(ii)增加重組蛋白的溶解性;以及(iii)通過在親和純化中充當(dāng)配體來輔助重組蛋白的純化。通常,在融合表達(dá)載體中,將蛋白切割位點(diǎn)引入至融合部分與重組蛋白的接合處以使得能夠在純化融合蛋白之后將重組蛋白與融合部分分離。這類酶以及它們的同源識別序列包括因子Xa、凝血酶以及腸激酶。示例性融合表達(dá)載體包括pGEX(發(fā)瑪西亞生物技術(shù)有限公司(PharmaciaBiotechInc);史密斯和約翰遜,1988,《基因》(Gene)67:31-40)、pMAL(紐英倫生物技術(shù)公司(NewEnglandBiolabs),貝弗利(Beverly),馬薩諸塞州(Mass.))以及pRIT5(發(fā)瑪西亞公司,皮斯卡塔韋(Piscataway),新澤西州(N.J.)),它們分別將谷胱甘肽S-轉(zhuǎn)移酶(GST)、麥芽糖E結(jié)合蛋白或蛋白A融合至靶重組蛋白。適合的誘導(dǎo)型非融合大腸桿菌表達(dá)載體的實(shí)例包括pTrc(Amrann(阿姆蘭)等人,(1988年)《基因》(Gene)69:301-315)以及pET11d(Studier(斯圖迪爾)等人,《基因表達(dá)技術(shù):酶學(xué)方法》(GENEEXPRESSIONTECHNOLOGY:METHODSINENZYMOLOGY)185,學(xué)術(shù)出版社(AcademicPress),圣地亞哥(SanDiego),加利福尼亞州(Calif.)(1990年)60-89。在一些實(shí)施例中,載體是酵母表達(dá)載體。用于在酵母釀酒中表達(dá)的載體的實(shí)例包括pYepSec1(巴爾戴利(Baldari)等人,1987.《歐洲分子生物學(xué)學(xué)會雜志》(EMBOJ)6:229-234)、pMFa(庫爾堅(jiān)(Kurjan)和赫斯庫伍特茲(Herskowitz),1982.《細(xì)胞》(Cell)30:933-943)、pJRY88(舒爾茨(Schultz)等人,1987.《基因》(Gene)54:113-123)、pYES2(InvitrogenCorporation(英杰公司),SanDiego(圣地亞哥),Calif(加利福尼亞州))、以及picZ(InvitrogenCorp(英杰公司),SanDiego(圣地亞哥),Calif(加利福尼亞州))。在一些實(shí)施例中,使用桿狀病毒載體,載體驅(qū)動昆蟲細(xì)胞中的蛋白質(zhì)表達(dá)。可用于在培養(yǎng)的昆蟲細(xì)胞(例如,SF9細(xì)胞)中表達(dá)蛋白質(zhì)的桿狀病毒載體包括pAc系列(史密斯(Smith)等人,1983.《分子細(xì)胞生物學(xué)》(Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和薩莫斯(Summers),1989.《病毒學(xué)》(Virology)170:31-39)。在一些實(shí)施例中,使用哺乳動物表達(dá)載體,載體能夠驅(qū)動一種或多種序列在哺乳動物細(xì)胞中表達(dá)。哺乳動物表達(dá)載體的實(shí)例包括pCDM8(錫德(Seed),1987.《自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人,1987.《歐洲分子生物學(xué)學(xué)會雜志》(EMBOJ.)6:187-195)。當(dāng)用于哺乳動物細(xì)胞中時(shí),表達(dá)載體的控制功能典型地由一種或多種調(diào)節(jié)元件提供。例如,常用的啟動子來源于多瘤、腺病毒2、巨細(xì)胞病毒、猴病毒40、以及本文所述和本領(lǐng)域已知的其他病毒。對于用于原核細(xì)胞和真核細(xì)胞兩者的其他適合的表達(dá)系統(tǒng)參見例如薩姆布魯克(Sambrook)等人的《分子克隆實(shí)驗(yàn)指南》(MolecularCloning:ALaboratoryManual.)(第2版)的第16和第17章,冷泉港實(shí)驗(yàn)室(ColdSpringHarborLaboratory),冷泉港實(shí)驗(yàn)室出版社(ColdSpringHarborLaboratoryPress),冷泉港(ColdSpringHarbor),紐約,1989。在一些實(shí)施例中,重組哺乳動物表達(dá)載體能夠指導(dǎo)核酸優(yōu)先在特定細(xì)胞類型中表達(dá)(例如,使用組織特異型調(diào)節(jié)元件來表達(dá)核酸)。組織特異型調(diào)節(jié)元件是本領(lǐng)域中已知的。適合的組織特異型啟動子的非限制性實(shí)例包括白蛋白啟動子(肝臟特異性的;平克特(Pinkert)等人,1987.《基因發(fā)育》(GenesDev.)1:268-277),淋巴特異性啟動子(卡里曼(Calame)和伊頓(Eaton),1988.《免疫學(xué)進(jìn)展》(Adv.Immunol)43:235-275),特別是T細(xì)胞受體的啟動子(維納圖(Winoto)和巴爾迪莫(Baltimore),1989.《歐洲分子生物學(xué)學(xué)會雜志》(EMBOJ.)8:729-733)和免疫球蛋白(巴納吉(Baneiji)等人,1983.《細(xì)胞》(Cell)33:729-740;奎恩(Queen)和巴爾迪莫(Baltimore),1983.《細(xì)胞》(Cell)33:741-748),神經(jīng)元特異性啟動子(例如,神經(jīng)絲啟動子;伯恩(Byrne)和魯?shù)聽?Ruddle),1989.《美國科學(xué)院院刊》(Proc.Natl.Acad.SciUSA)86:5473-5477),胰腺特異性啟動子(艾德蘭德(Edlund)等人,1985.《科學(xué)》(Science)230:912-916),以及乳腺特異性啟動子(例如,乳清啟動子;美國專利號4,873,316和歐洲申請公開號264,166)。還涵蓋發(fā)育型調(diào)節(jié)啟動子,例如,鼠科動物同源框蛋白(hox)啟動子凱賽爾((Kessel)和格魯斯(Gruss),1990.《科學(xué)》(Science)249:374-379)和α-甲胎蛋白啟動子(卡姆皮斯(Campes)和蒂爾曼(Tilghman),1989.《基因發(fā)育》(GenesDev.)3:537-546)。在一些實(shí)施例中,調(diào)節(jié)元件可操作地連接至CRISPR系統(tǒng)的一個(gè)或多個(gè)元件,從而驅(qū)動該CRISPR系統(tǒng)的該一個(gè)或多個(gè)元件的表達(dá)。一般而言,CRISPR(規(guī)律間隔成簇短回文重復(fù)),也稱為SPIDR(SPacer間隔開的同向重復(fù)),構(gòu)成通常對于特定細(xì)菌物種而言特異性的DNA基因座的家族。該CRISPR座位包含在大腸桿菌中被識別的間隔開的短序列重復(fù)(SSR)的一個(gè)不同類(石野(Ishino)等人,《細(xì)菌學(xué)雜志》(J.Bacteriol.),169:5429-5433[1987];和中田(Nakata)等人,《細(xì)菌學(xué)雜志》(J.Bacteriol.),171:3553-3556[1989])、以及相關(guān)基因。類似的間隔開的SSR已經(jīng)鑒定于地中海富鹽菌(Haloferaxmediterranei)、化膿鏈球菌、魚腥藻屬、和結(jié)核分枝桿菌中(參見,格魯恩(Groenen)等人,《分子微生物學(xué)》(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,《新發(fā)感染性疾病》(Emerg.Infect.Dis.),5:254-263[1999];馬斯波爾(Masepohl)等人,《生物化學(xué)與生物物理學(xué)學(xué)報(bào)》(Biochim.Biophys.Acta)1307:26-30[1996];以及莫吉卡(Mojica)等人,《分子微生物學(xué)》,17:85-93[1995])。這些CRISPR座位典型地不同于其他SSR的重復(fù)結(jié)構(gòu),這些重復(fù)已被稱為規(guī)律間隔的短重復(fù)(SRSR)(詹森(Janssen)等人,《OMICS:整合生物學(xué)雜志》(OMICSJ.Integ.Biol.),6:23-33[2002];以及莫吉卡(Mojica)等人,《分子微生物學(xué)》(Mol.Microbiol.),36:244-246[2000])。一般而言,這些重復(fù)是以簇存在的短元件,其被具有基本上恒定長度的獨(dú)特間插序列規(guī)律地間隔開(莫吉卡(Mojica)等人,[2000],同上)。雖然重復(fù)序列在菌株之間是高度保守的,許多間隔開的重復(fù)和這些間隔區(qū)的序列一般在菌株與菌株之間不同(馮·埃姆登(vanEmbden)等人,《細(xì)菌學(xué)雜志》(J.Bacteriol.),182:2393-2401[2000])。已經(jīng)在40種以上的原核生物中鑒定出CRISPR座位(參見,例如,詹森(Janssen)等人,《分子微生物學(xué)》(Mol.Microbiol.),43:1565-1575[2002];以及莫吉卡(Mojica)等人,[2005]),包括但不限于:氣火菌屬(Aeropyrum)、熱棒菌屬(Pyrobaculum)、硫化葉菌屬(Sulfolobus)、古球菌屬(Archaeoglobus)、鹽盒菌屬(Halocarcula)、甲烷桿菌屬(Methanobacterium)、甲烷球菌屬(Methanococcus)、甲烷八疊球菌屬(Methanosarcina)、甲烷火菌屬(Methanopyrus)、焦球菌屬(Pyrococcus)、嗜酸菌屬(Picrophilus)、熱原體屬(Thermoplasma)、棒桿菌屬(Corynebacterium)、分枝桿菌屬(Mycobacterium)、鏈霉菌屬(Streptomyces)、產(chǎn)水菌屬(Aquifex)、紫單胞菌屬(Porphyromonas)、綠菌屬(Chlorobium)、棲熱菌屬(Thermus)、芽孢桿菌屬(Bacillus)、利斯特菌屬(Listeria)、葡萄球菌屬(Staphylococcus)、梭菌屬(Clostridium)、好熱厭氧桿菌屬(Thermoanaerobacter)、支原體屬(Mycoplasma)、梭桿菌屬(Fusobacterium)、固氮弓菌屬(Azarcus)、色桿菌屬(Chromobacterium)、奈瑟球菌屬(Neisseria)、亞硝化單胞菌屬(Nitrosomonas)、脫硫弧菌屬(Desulfovibrio)、地桿菌屬(Geobacter)、粘球菌屬(Myxococcus)、彎曲桿菌屬(Campylobacter)、類桿菌屬(Wolinella)、不動桿菌屬(Acinetobacter)、歐文菌屬(Erwinia)、埃希菌屬(Escherichia)、軍團(tuán)菌屬(Legionella)、甲基球菌屬(Methylococcus)、巴斯德菌屬(Pasteurella)、發(fā)光細(xì)菌屬(Photobacterium)、沙門菌屬(Salmonella)、黃單胞菌屬(Xanthomonas)、耶爾森菌屬(Yersinia)、密螺旋體屬(Treponema)、和棲熱袍菌屬(Thermotoga)。一般而言,“CRISPR系統(tǒng)”統(tǒng)稱為轉(zhuǎn)錄物和涉及CRISPR相關(guān)(“Cas”)基因的表達(dá)或指導(dǎo)其活性的其他元件,包括編碼Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配對序列(涵蓋“同向重復(fù)”和在內(nèi)源CRISPR系統(tǒng)背景下的tracrRNA加工的部分同向重復(fù))、指導(dǎo)序列(在內(nèi)源CRISPR系統(tǒng)背景下也稱為“間隔子(spacer)”)、或來自CRISPR座位的其他序列和轉(zhuǎn)錄物。在一些實(shí)施例中,CRISPR系統(tǒng)的一個(gè)或多個(gè)元件來源于I型、II型、或III型CRISPR系統(tǒng)。在一些實(shí)施例中,CRISPR系統(tǒng)的一個(gè)或多個(gè)元件來源于包含內(nèi)源CRISPR系統(tǒng)的特殊生物,如化膿鏈球菌。一般而言,CRISPR系統(tǒng)的特征為促進(jìn)在靶序列的位點(diǎn)處的CRISPR復(fù)合物(在內(nèi)源CRISPR系統(tǒng)的背景下也稱為前間區(qū))的形成的元件。在CRISPR復(fù)合物形成的背景下,“靶序列”是指指導(dǎo)序列被設(shè)計(jì)為對其具有互補(bǔ)性的序列,其中在靶序列與指導(dǎo)序列之間的雜交促進(jìn)CRISPR復(fù)合物的形成。完全互補(bǔ)性不是必需的,條件是存在足夠互補(bǔ)性以引起雜交并且促進(jìn)一種CRISPR復(fù)合物的形成。一個(gè)靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些實(shí)施例中,靶序列位于細(xì)胞的細(xì)胞核或細(xì)胞質(zhì)中。在一些實(shí)施例中,該靶序列可位于真核細(xì)胞的一個(gè)細(xì)胞器例如線粒體或葉綠體內(nèi)??杀挥糜谥亟M到包括該靶序列的靶基因座中的序列或模板被稱為“編輯模板”或“編輯多核苷酸”或“編輯序列”。在本發(fā)明的方面,外源的模板多核苷酸可被稱為編輯模板。在本發(fā)明的一個(gè)方面,該重組是同源重組。典型地,在內(nèi)源CRISPR系統(tǒng)的背景下,CRISPR復(fù)合物(包含雜交到靶序列上并且與一種或多種Cas蛋白復(fù)合的指導(dǎo)序列)的形成導(dǎo)致在該靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多個(gè)堿基對之內(nèi))的一條鏈或兩條鏈的切割。不希望受到理論的束縛,該tracr序列(其可以包含或其組成為野生型tracr序列的全部或部分(例如野生型tracr序列的約或多于約20、26、32、45、48、54、63、67、85個(gè)、或更多個(gè)核苷酸))也可以形成CRISPR復(fù)合物的一部分,如通過沿著該tracr序列的至少一部分雜交到與該指導(dǎo)序列可操作地連接的tracr配對序列的全部或部分上。在一些實(shí)施例中,該tracr序列與一個(gè)tracr配對序列具有足夠的互補(bǔ)性以進(jìn)行雜交,并參與一種CRISPR復(fù)合物的形成。至于該靶序列,據(jù)信不需要完全互補(bǔ)性,只要足以具備功能性。在一些實(shí)施例中,當(dāng)最佳比對時(shí),沿著該tracr配對序列的長度,該tracr序列具有至少50%、60%、70%、80%、90%、95%、或99%序列互補(bǔ)性。在一些實(shí)施例中,將驅(qū)動CRISPR系統(tǒng)的一個(gè)或多個(gè)元件的表達(dá)的一種或多種載體引入到宿主細(xì)胞中,使得該CRISPR系統(tǒng)的這些元件的表達(dá)在一個(gè)或多個(gè)靶位點(diǎn)指導(dǎo)CRISPR復(fù)合物的形成。例如,Cas酶、連接到tracr配對序列上的指導(dǎo)序列、以及tracr序列可以各自可操作地連接到在分開的載體上的分開的調(diào)節(jié)元件上??商娲?,從相同或不同調(diào)節(jié)元件表達(dá)的二個(gè)或更多個(gè)元件可以結(jié)合在單個(gè)載體中,其中提供該CRISPR系統(tǒng)的任何組分的一種或多種另外的載體不包括在該第一載體中。結(jié)合在單個(gè)載體中的CRISPR系統(tǒng)元件可以按照任何適合的取向排列,如一個(gè)元件相對于第二元件位于5’(“上游”)或3’(“下游”)。一個(gè)元件的編碼序列可以位于第二元件的編碼序列的同一條鏈或相對鏈上,并且取向?yàn)橄嗤蛳鄬Φ姆较?。在一些?shí)施例中,單個(gè)啟動子驅(qū)動編碼CRISPR酶的轉(zhuǎn)錄物以及該指導(dǎo)序列、tracr配對序列(任選地可操作地連接到該指導(dǎo)序列上)、和嵌入在一個(gè)或多個(gè)內(nèi)含子序列之內(nèi)(例如,各自在不同的內(nèi)含子中,兩個(gè)或更多個(gè)在至少一個(gè)內(nèi)含子中,或者全部都在單個(gè)內(nèi)含子中)的tracr序列中的一者或多者的表達(dá)。在一些實(shí)施例中,該CRISPR酶、指導(dǎo)序列、tracr配對序列、和tracr序列可操作地連接到相同的啟動子上并且從其表達(dá)。SpCas9的單個(gè)載體構(gòu)建體示于圖22中。在一些實(shí)施例中,一個(gè)載體包含一個(gè)或多個(gè)插入位點(diǎn),如限制性核酸內(nèi)切酶識別序列(也稱為“克隆位點(diǎn)”)。在一些實(shí)施例中,一個(gè)或多個(gè)插入位點(diǎn)(例如,約或多于約1、2、3、4、5、6、7、8、9、10個(gè)、或更多個(gè)插入位點(diǎn))位于一種或多種載體的一個(gè)或多個(gè)序列元件的上游和/或下游。在一些實(shí)施例中,一個(gè)載體包含在tracr配對序列的上游、并且任選地在可操作地連接到該tracr配對序列上的調(diào)節(jié)元件的下游的插入位點(diǎn),使得在將指導(dǎo)序列插入到該插入位點(diǎn)中之后并且在表達(dá)時(shí)該指導(dǎo)序列引導(dǎo)CRISPR復(fù)合物與真核細(xì)胞中的靶序列的序列特異性結(jié)合。在一些實(shí)施例中,一個(gè)載體包含一個(gè)或多個(gè)插入位點(diǎn),每個(gè)插入位點(diǎn)位于兩個(gè)tracr配對序列之間,從而允許在每個(gè)位點(diǎn)插入指導(dǎo)序列。在這樣一種安排中,兩個(gè)或更多個(gè)指導(dǎo)序列可以包含單指導(dǎo)序列的兩個(gè)或更多個(gè)拷貝、兩個(gè)或更多個(gè)不同的指導(dǎo)序列、或這些的組合。當(dāng)使用多個(gè)不同的指導(dǎo)序列時(shí),可以使用單個(gè)表達(dá)構(gòu)建體使CRISPR活性靶向到細(xì)胞內(nèi)的多個(gè)不同的相應(yīng)靶序列。例如,單個(gè)載體可以包含約或多于約1、2、3、4、5、6、7、8、9、10、15、20個(gè)、或更多個(gè)指導(dǎo)序列。在一些實(shí)施例中,可以提供約或多于約1、2、3、4、5、6、7、8、9、10個(gè)、或更多個(gè)這樣的含有靶序列的載體,并且任選地將其遞送到細(xì)胞中。在一些實(shí)施例中,一個(gè)載體包含可操作地連接到編碼CRISPR酶(如Cas蛋白)的酶編碼序列上的調(diào)節(jié)元件。Cas蛋白的非限制性實(shí)例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也稱為Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同系物、或其修飾形式。這些酶是已知的;例如,化膿鏈球菌Cas9蛋白的氨基酸序列可見于SwissProt數(shù)據(jù)庫登錄號Q99ZW2下。在一些實(shí)施例中,未修飾的CRISPR酶如Cas9具有DNA切割活性。在一些實(shí)施例中,該CRISPR酶是Cas9,并且可以是來自化膿鏈球菌或肺炎鏈球菌的Cas9。在一些實(shí)施例中,該CRISPR酶指導(dǎo)在靶序列位置處(例如在該靶序列之內(nèi)和/或在該靶序列的互補(bǔ)物之內(nèi))的一條鏈或兩條鏈的切割。在一些實(shí)施例中,該CRISPR酶指導(dǎo)距離靶序列的第一個(gè)或最后一個(gè)核苷酸約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500個(gè)、或更多個(gè)堿基對之內(nèi)的一條鏈或兩條鏈的切割。在一些實(shí)施例中,一個(gè)載體編碼相對于相應(yīng)的野生型酶被突變的CRISPR酶,使得該突變的CRISPR酶缺乏切割含有一個(gè)靶序列的靶多核苷酸的一條鏈和兩條鏈的能力。例如,在來自化膿鏈球菌的Cas9的RuvCI催化結(jié)構(gòu)域中的天冬氨酸到丙氨酸取代(D10A)將Cas9從切割兩條鏈的核酸酶轉(zhuǎn)化成切口酶(切割單條鏈)。致使Cas9為切口酶的其他突變實(shí)例包括而不限于H840A、N854A、和N863A。在本發(fā)明的方面,切口酶可以經(jīng)由同源重組用于基因組編輯。例如,圖21顯示了經(jīng)由同源重組的基因組編輯。圖21(a)顯示了SpCas9切口酶的示意圖,具有在RuvCI催化結(jié)構(gòu)域中的D10A突變。(b)示意圖,表示使用有義或反義單鏈寡核苷酸作為修復(fù)模板在人EMX1座位處的同源重組(HR)。(c)由HR修飾的區(qū)域的序列。(d)對于野生型(wt)和切口酶(D10A)SpCas9介導(dǎo)的在EMX1靶標(biāo)1座位處的indel而言的SURVEYOR分析(n=3)。箭頭指示預(yù)期片段大小的位置。在一些實(shí)施例中,一種Cas9切口酶可與一種或多種指導(dǎo)序列組合使用,例如,兩種引導(dǎo)序列,其分別靶向該DNA靶的有義以及反義鏈。此組合允許兩個(gè)鏈被切口并且用以誘導(dǎo)NHEJ。申請人已證明(數(shù)據(jù)未顯示)兩種切口酶靶標(biāo)(即,在相同位置靶向DNA的不同鏈的sgRNA)在誘導(dǎo)誘變的NHEJ方面的效力。一種單切口酶(具有單個(gè)sgRNA的Cas9-D10A)不能夠誘導(dǎo)NHEJ并且建立indel,但申請人已經(jīng)顯示,雙切口酶(Cas9-D10A以及在相同位置靶向不同鏈的兩個(gè)sgRNA)在人胚胎干細(xì)胞(hESC)中可以這樣做。該效率在hESC中是約50%的核酸酶(即,不具有D10突變的常規(guī)Cas9)。作為一個(gè)另外的實(shí)例,Cas9的兩個(gè)或更多個(gè)催化結(jié)構(gòu)域(RuvCI、RuvCII、和RuvCIII)可以被突變?yōu)楫a(chǎn)生實(shí)質(zhì)上缺乏所有DNA切割活性的突變的Cas9。在一些實(shí)施例中,D10A突變與H840A、N854A、或N863A突變的一者或多者相組合,以便產(chǎn)生實(shí)質(zhì)上缺乏所有DNA切割活性的Cas9酶。在一些實(shí)施例中,當(dāng)該突變的CRISPR酶的DNA切割活性比它的非突變形式低約25%、10%、5%、1%、0.1%、0.01%、或更少時(shí),則該酶被考慮為實(shí)質(zhì)上缺乏所有DNA切割活性。其他突變可能是有用的;其中Cas9或其他CRISPR酶是來自除化膿鏈球菌外的物種,可產(chǎn)生相應(yīng)氨基酸的突變以實(shí)現(xiàn)類似效果。在一些實(shí)施例中,編碼CRISPR酶的酶編碼序列經(jīng)密碼子優(yōu)化,以便在特定的細(xì)胞如真核細(xì)胞中表達(dá)。這些真核細(xì)胞可以是特定生物的那些或來源于特定生物,如哺乳動物,包括但不限于人、小鼠、大鼠、兔、狗、或非人類靈長動物。一般而言,密碼子優(yōu)化是指通過用在宿主細(xì)胞的基因中更頻繁地或者最頻繁地使用的密碼子代替天然序列的至少一個(gè)密碼子(例如約或多于約1、2、3、4、5、10、15、20、25、50個(gè)、或更多個(gè)密碼子同時(shí)維持該天然氨基酸序列而修飾一個(gè)核酸序列以便增強(qiáng)在感興趣宿主細(xì)胞中的表達(dá)的方法。不同的物種對于具有特定氨基酸的某些密碼子展示出特定的偏好。密碼子偏好性(在生物之間的密碼子使用的差異)經(jīng)常與信使RNA(mRNA)的翻譯效率相關(guān),而該翻譯效率則被認(rèn)為依賴于(除其他之外)被翻譯的密碼子的性質(zhì)和特定的轉(zhuǎn)運(yùn)RNA(tRNA)分子的可用性。細(xì)胞內(nèi)選定的tRNA的優(yōu)勢一般反映了最頻繁用于肽合成的密碼子。因此,可以將基因定制為基于密碼子優(yōu)化在給定生物中的最佳基因表達(dá)。密碼子利用率表可以容易地獲得,例如在密碼子使用數(shù)據(jù)庫(“CodonUsageDatabase”)中,并且這些表可以通過不同的方式調(diào)整適用。參見,中村Y.(NakamuraY.)等人,“從國際DNA序列數(shù)據(jù)庫中制表的密碼子使用:2000年的狀態(tài)”(CodonusagetabulatedfromtheinternationalDNAsequencedatabases:statusfortheyear2000)《核酸研究》(Nucl.AcidsRes.)28:292(2000年)。用于密碼子優(yōu)化特定的序列以便在特定的宿主細(xì)胞中表達(dá)的計(jì)算機(jī)算法也是可得的,如基因制造(GeneForge)(Aptagen公司;雅各布斯(Jacobus),PA),也是可得的。在一些實(shí)施例中,在編碼CRISPR酶的序列中的一個(gè)或多個(gè)密碼子(例如1、2、3、4、5、10、15、20、25、50個(gè)、或更多個(gè)、或所有密碼子)相應(yīng)于對于特定氨基酸最頻繁使用的密碼子。一般而言,指導(dǎo)序列是與靶多核苷酸序列具有足夠互補(bǔ)性以便與該靶序列雜交并且指導(dǎo)CRISPR復(fù)合物與該靶序列的序列特異性結(jié)合的任何多核苷酸序列。在一些實(shí)施例中,當(dāng)使用適合的比對算法進(jìn)行最佳比對是,在指導(dǎo)序列與其相應(yīng)的靶序列之間的互補(bǔ)程度是約或多于約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多??梢允褂糜糜诒葘π蛄械娜魏芜m合的算法來確定最佳比對,其非限制性實(shí)例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯羅斯-惠勒變換(Burrows-WheelerTransform)的算法(例如伯羅斯-惠勒比對工具(BurrowsWheelerAligner))、ClustalW、ClustalX、BLAT、Novoalign(Novocraft技術(shù)公司)、ELAND(億明達(dá)公司(Illumina),圣地亞哥,加利福尼亞州)、SOAP(在soap.genomics.org.cn可獲得)、以及Maq(在maq.sourceforge.net可獲得)。在一些實(shí)施例中,指導(dǎo)序列在長度上為約或多于約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個(gè)、或更多個(gè)核苷酸。在一些實(shí)施例中,一個(gè)指導(dǎo)序列在長度上為少于約75、50、45、40、35、30、25、20、15、12個(gè)、或更少的核苷酸??梢酝ㄟ^任何適合的測定法來評估指導(dǎo)序列指導(dǎo)CRISPR復(fù)合物與靶序列的序列特異性結(jié)合的能力。例如,足以形成CRISPR復(fù)合物的CRISPR系統(tǒng)的組分,包括有待測試的指導(dǎo)序列在內(nèi),可以例如通過用編碼該CRISPR序列的組分的載體進(jìn)行轉(zhuǎn)染而被提供到具有相應(yīng)靶序列的宿主細(xì)胞中,隨后通過如本文所述的測量員測定來評估在該靶序列之內(nèi)的優(yōu)先切割。類似地,通過提供該靶序列、包括有待測試的指導(dǎo)序列在內(nèi)的CRISPR復(fù)合物的組分、和不同于該測試指導(dǎo)序列的對照指導(dǎo)序列,并且比較在該測試指導(dǎo)序列與該對照指導(dǎo)序列反應(yīng)之間的靶序列處的結(jié)合或切割率,可以在一個(gè)試管中評估靶多核苷酸序列的切割。其他測定法是可能的,并且將由本領(lǐng)域技術(shù)人員想到。指導(dǎo)序列可以被選擇為靶向任何靶序列。在一些實(shí)施例中,該靶序列是在細(xì)胞的基因組內(nèi)的序列。示例性靶序列包括在靶基因組中為獨(dú)特的那些。例如,對于化膿鏈球菌Cas9,在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位點(diǎn),其中NNNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在該基因組中單次出現(xiàn)。在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGG的化膿鏈球菌Cas9靶位點(diǎn),其中NNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在該基因組中單次出現(xiàn)。對于嗜熱鏈球菌CRISPR1Cas9,在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXXAGAAW(SEQIDNO:1)的Cas9靶位點(diǎn),其中NNNNNNNNNNNNXXAGAAW(SEQIDNO:2)(N是A、G、T、或C;X可以是任何物;并且W是A或T)在該基因組中單次出現(xiàn)。在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXXAGAAW(SEQIDNO:3)的嗜熱鏈球菌CRISPR1Cas9靶位點(diǎn),其中NNNNNNNNNNNXXAGAAW(SEQIDNO:4)(N是A、G、T、或C;X可以是任何物;并且W是A或T)在該基因組中單次出現(xiàn)。對于化膿鏈球菌Cas9,在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGGXG的Cas9靶位點(diǎn),其中NNNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在該基因組中單次出現(xiàn)。在基因組中的獨(dú)特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGGXG的化膿鏈球菌Cas9靶位點(diǎn),其中NNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在該基因組中單次出現(xiàn)。在這些序列的每一個(gè)中,“M”可以是A、G、T、或C,并且在序列鑒定中不必考慮為是獨(dú)特的。在一些實(shí)施例中,指導(dǎo)序列被選擇為降低在該指導(dǎo)序列內(nèi)的二級結(jié)構(gòu)程度??梢酝ㄟ^任何適合的多核苷酸折疊算法來確定二級結(jié)構(gòu)。一些算法是基于計(jì)算最小吉布斯(Gibbs)自由能。一種這樣的算法的實(shí)例是mFold,正如祖克(Zuker)和施蒂格勒(Stiegler)《核酸研究》(NucleicAcidsRes.)9(1981),133-148)所描述。折疊算法的另一個(gè)實(shí)例是使用由維也納大學(xué)(UniversityofVienna)的理論化學(xué)研究所(InstituteforTheoreticalChemistry)研發(fā)的在線網(wǎng)絡(luò)服務(wù)器RNAfold(參見例如A.R.格魯伯(A.R.Gruber)等人,2008,《細(xì)胞》(Cell)106(1):23-24;以及PA卡爾(PACarr)和GM丘奇(GMChurch),2009,《自然生物技術(shù)》(NatureBiotechnology)27(12):1151-62)。另外的算法可以發(fā)現(xiàn)于通過引用結(jié)合在此的美國申請序列號61/836,080(代理人案號44790.11.2022;博德參考號BI-2013/004A)中。一般而言,tracr配對序列包括與tracr序列具有足夠互補(bǔ)性以促進(jìn)下列一項(xiàng)或多項(xiàng)的任何序列:(1)在含有相應(yīng)tracr序列的細(xì)胞中的側(cè)翼為tracr配對序列的指導(dǎo)序列的切除;以及(2)在靶序列處的CRISPR復(fù)合物的形成,其中該CRISPR復(fù)合物包含雜交到tracr序列上的tracr配對序列。通常,互補(bǔ)程度是就tracr配對序列與tracr序列沿著這兩個(gè)序列的較短者的長度的最佳比對而言。可以通過任何適合的比對算法來確定最佳比對,并且可以可以進(jìn)一步對二級結(jié)構(gòu)做出解釋,如在該tracr序列或tracr配對序列之內(nèi)的自我互補(bǔ)性。在一些實(shí)施例中,在進(jìn)行最佳比對時(shí),在該tracr序列與tracr配對序列之間沿著這兩者的較短者的長度的互補(bǔ)程度是約或多于約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。圖10B以及11B中提供了一個(gè)tracr序列以及一個(gè)tracr配對序列之間的最佳比對的實(shí)例說明。在一些實(shí)施例中,該tracr序列在長度上為約或多于約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50個(gè)、或更多個(gè)核苷酸。在一些實(shí)施例中,該tracr序列和tracr配對序列被包含在單個(gè)轉(zhuǎn)錄物中,使得在這兩者之間的雜交產(chǎn)生具有二級結(jié)構(gòu)(如發(fā)夾)的轉(zhuǎn)錄物。用于在發(fā)夾結(jié)構(gòu)中使用的優(yōu)選環(huán)形成序列在長度上為四個(gè)核苷酸,并且最優(yōu)選地具有序列GAAA。然而,可以使用更長或更短的環(huán)序列,正如可替代的序列。這些序列優(yōu)選地包括三聯(lián)體(例如,AAA)、和另外的核苷酸(例如C或G)。環(huán)形成序列的實(shí)例包括CAAA和AAAG。在本發(fā)明的一個(gè)實(shí)施例中,該轉(zhuǎn)錄物或轉(zhuǎn)錄的多核苷酸序列具有至少兩個(gè)或更多個(gè)發(fā)夾。在優(yōu)選的實(shí)施例中,該轉(zhuǎn)錄物具有兩個(gè)、三個(gè)、四個(gè)或五個(gè)發(fā)夾。在本發(fā)明的一個(gè)另外的實(shí)施例中,該轉(zhuǎn)錄物具有至多五個(gè)發(fā)夾。在一些實(shí)施例中,該單個(gè)轉(zhuǎn)錄物進(jìn)一步包括一種轉(zhuǎn)錄終止序列;優(yōu)選地這是一個(gè)polyT序列,例如六個(gè)T的核苷酸。圖11B中的下面部分中提供了這樣的發(fā)夾結(jié)構(gòu)的實(shí)例說明,其中最終“N”的序列5’的部分以及環(huán)的上游對應(yīng)于該tracr配對序列,并且該環(huán)的序列3’的部分對應(yīng)于該tracr序列。另外的包含指導(dǎo)序列、tracr配對序列、和tracr序列的單個(gè)多核苷酸的非限制性實(shí)例如下(列出為5’到3’),其中“N”代表指導(dǎo)序列的堿基,小寫字體的第一區(qū)代表tracr配對序列,且小寫字體的第二區(qū)代表tracr序列,并且該最后的多聚T序列代表轉(zhuǎn)錄終止子:(1)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQIDNO:5);(2)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQIDNO:6);(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT(SEQIDNO:7);(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(SEQIDNO:8);(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT(SEQIDNO:9);以及(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(SEQIDNO:10)。在一些實(shí)施例中,序列(1)到(3)與來自嗜熱鏈球菌CRISPR1的Cas9結(jié)合使用。在一些實(shí)施例中,序列(4)到(6)與來自化膿鏈球菌CRISPR1的Cas9結(jié)合使用。在一些實(shí)施例中,該tracr序列是一個(gè)與包含該tracr配對序列的轉(zhuǎn)錄物分開的轉(zhuǎn)錄物(例如在圖11B的頂部部分中所示的)。在一些實(shí)施例中,該CRISPR酶是包含一個(gè)或多個(gè)異源蛋白結(jié)構(gòu)域(例如除了該CRISPR酶之外的約或多于約1、2、3、4、5、6、7、8、9、10個(gè)、或更多個(gè)結(jié)構(gòu)域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白質(zhì),以及任選地在任何兩個(gè)結(jié)構(gòu)域之間的連接序列??梢匀诤系紺RISPR酶上的蛋白質(zhì)結(jié)構(gòu)域的實(shí)例包括但不限于,表位標(biāo)簽、報(bào)告基因序列、以及具有下列活性的一者或多者的蛋白質(zhì)結(jié)構(gòu)域:甲基酶活性、脫甲基酶活性、轉(zhuǎn)錄激活活性、轉(zhuǎn)錄阻抑活性、轉(zhuǎn)錄釋放因子活性、組蛋白修飾活性、RNA切割活性和核酸結(jié)合活性。表位標(biāo)簽的非限制性實(shí)例包括組氨酸(His)標(biāo)簽、V5標(biāo)簽、FLAG標(biāo)簽、流感病毒血凝素(HA)標(biāo)簽、Myc標(biāo)簽、VSV-G標(biāo)簽、和硫氧還蛋白(Trx)標(biāo)簽。報(bào)告基因的實(shí)例包括,但不限于,谷胱甘肽-S-轉(zhuǎn)移酶(GST)、辣根過氧化物酶(HRP)、氯霉素乙酰轉(zhuǎn)移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、螢光素酶、綠色熒光蛋白(GFP)、HcRed、DsRed、青熒光蛋白(CFP)、黃色熒光蛋白(YFP)、以包括藍(lán)色熒光蛋白(BFP)的自發(fā)熒光蛋白。CRISPR酶可以融合到編碼一種蛋白質(zhì)或蛋白質(zhì)片段的基因序列上,所述蛋白質(zhì)或蛋白質(zhì)片段結(jié)合DNA分子或結(jié)合其他細(xì)胞分子,其包括,但不限于,麥芽糖結(jié)合蛋白(MBP)、S-tag、LexADNA結(jié)合結(jié)構(gòu)域(DBD)融合物、GAL4DNA結(jié)合結(jié)構(gòu)域融合物、以及單純皰疹病毒(HSV)BP16蛋白融合物??梢孕纬砂珻RISPR酶的融合蛋白的一部分的另外的結(jié)構(gòu)域描述于US20110059502中,通過引用將其并入本文。在一些實(shí)施例中,使用標(biāo)記的CRISPR酶來鑒定靶序列的位置。在本發(fā)明的一個(gè)方面,可以將一種報(bào)告基因引入細(xì)胞中,以編碼充當(dāng)測量基因產(chǎn)物的表達(dá)的改變或修飾的標(biāo)記物的基因產(chǎn)物,該報(bào)告基因包括但不限于谷胱甘肽-S-轉(zhuǎn)移酶(GST)、辣根過氧化物酶(HRP)、氯霉素乙酰轉(zhuǎn)移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、熒光素酶、綠色熒光蛋白(GFP)、HcRed、DsRed、青色熒光蛋白(CFP)、黃色熒光蛋白(YFP)以及自體熒光蛋白(包括藍(lán)色熒光蛋白(BFP))。在本發(fā)明的一個(gè)另外的實(shí)施例中,可以經(jīng)由載體將編碼該基因產(chǎn)物的DNA分子引入該細(xì)胞中。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,該基因產(chǎn)物是熒光素酶。在本發(fā)明的一個(gè)另外的實(shí)施例中,該基因產(chǎn)物的表達(dá)被降低。在一些方面,本發(fā)明提供了以下方法,這些方法包括向宿主細(xì)胞遞送一種或多種多核苷酸,如或如在此描述的一種或多種載體、其一種或多種轉(zhuǎn)錄本和/或一種或多種自其轉(zhuǎn)錄的蛋白。本發(fā)明充當(dāng)一種使得可以靶向修飾基于DNA的基因組的基礎(chǔ)平臺。它可以多種遞送系統(tǒng)配合,包括但不限于病毒、脂質(zhì)體、電穿孔、顯微注射以及綴合。在一些方面,本發(fā)明進(jìn)一步提供了通過這樣的方法產(chǎn)生的細(xì)胞以及包括這樣的細(xì)胞或由這樣的細(xì)胞產(chǎn)生的生物體(例如動物、植物、或真菌)。在一些實(shí)施例中,將與(并且任選地與其復(fù)合)指導(dǎo)序列組合的CRISPR酶遞送至細(xì)胞。可以使用常規(guī)的病毒和非病毒基的基因轉(zhuǎn)移方法將核酸引入哺乳動物細(xì)胞或靶組織中。可以使用這樣的方法向培養(yǎng)物中或宿主生物中的細(xì)胞給予編碼CRISPR系統(tǒng)的組分的核酸。非病毒載體遞送系統(tǒng)包括DNA質(zhì)粒、RNA(例如在此描述的載體的轉(zhuǎn)錄本)、裸核酸以及與遞送賦形劑(如脂質(zhì)體)復(fù)合的核酸。病毒載體遞送系統(tǒng)包括DNA和RNA病毒,在被遞送至細(xì)胞后它們具有游離型或整合型基因組。關(guān)于基因療法程序的綜述,參見安德森(Anderson),《科學(xué)》(Science)256:808-813(1992);納貝爾(Nabel)&費(fèi)爾格納(Felgner),TIBTECH11:211-217(1993);三谷(Mitani)&卡斯基(Caskey),TIBTECH11:162-166(1993);狄龍(Dillon),TIBTECH11:167-175(1993);米勒(Miller),《自然》(Nature)357:455-460(1992);范·布朗特(VanBrunt),《生物技術(shù)》(Biotechnology)6(10):1149-1154(1988);維涅(Vigne),《恢復(fù)神經(jīng)學(xué)和神經(jīng)科學(xué)》(RestorativeNeurologyandNeuroscience)8:35-36(1995);克雷默(Kremer)&佩里科德特(Perricaudet),《英國醫(yī)學(xué)公報(bào)》(BritishMedicalBulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,在《微生物學(xué)和免疫學(xué)當(dāng)前主題》(CurrentTopicsinMicrobiologyandImmunology)中多爾夫勒(Doerfler)和博姆(編輯)(1995);以及余(Yu)等人,《基因療法》(GeneTherapy)1:13-26(1994)。核酸的非病毒遞送方法包括脂轉(zhuǎn)染、核轉(zhuǎn)染、顯微注射、基因槍、病毒顆粒、脂質(zhì)體、免疫脂質(zhì)體、聚陽離子或脂質(zhì):核酸共軛物、裸DNA、人工病毒體以及DNA的試劑增強(qiáng)性攝取。脂轉(zhuǎn)染描述于例如美國專利號5,049,386、4,946,787和4,897,355中并且脂轉(zhuǎn)染試劑是市售的(例如,TransfectamTM和LipofectinTM)。適于多核苷酸的有效的受體識別脂轉(zhuǎn)染的陽離子和中性脂質(zhì)包括Felgner(費(fèi)爾格納),WO91/17424;WO91/16024的那些。遞送可以針對細(xì)胞(例如體外或離體給予)或靶組織(例如體內(nèi)給予)。脂質(zhì):核酸復(fù)合物(包括靶向的脂質(zhì)體,如免疫脂質(zhì)復(fù)合物)的制備是本領(lǐng)域的技術(shù)人員熟知的(參見例如,克麗絲特爾(Crystal),《科學(xué)》(Science)270:404-410(1995);布萊澤(Blaese)等人,《癌癥基因療法》(CancerGeneTher.)2:291-297(1995);貝爾(Behr)等人,《生物共軛化學(xué)》(BioconjugateChem.)5:382-389(1994);雷米(Remy)等人,《生物共軛化學(xué)》5:647-654(1994);高(Gao)等人,《基因療法》(GeneTherapy)2:710-722(1995);艾哈邁德(Ahmad)等人,《癌癥研究》(CancerRes.)52:4817-4820(1992);美國專利號4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。使用RNA或DNA病毒基的系統(tǒng)遞送核酸利用將病毒靶向體內(nèi)的特定細(xì)胞并將病毒有效負(fù)荷(payload)運(yùn)至細(xì)胞核中的高度進(jìn)化的過程。可以將病毒載體直接給予至患者(體內(nèi))或可以使用它們在體外處理細(xì)胞,并且任選地,可以將修飾的細(xì)胞給予至患者(離體)。常規(guī)的病毒基的系統(tǒng)可以包括用于基因轉(zhuǎn)移的逆轉(zhuǎn)錄病毒載體、慢病毒載體、腺病毒載體、腺相關(guān)病毒載體以及單純皰疹病毒載體。用逆轉(zhuǎn)錄病毒、慢病毒和腺相關(guān)病毒基因轉(zhuǎn)移方法整合進(jìn)宿主基因組中是可能的,這通常導(dǎo)致插入轉(zhuǎn)基因的長期表達(dá)。另外,已經(jīng)在不同細(xì)胞類型和靶組織中觀察到高轉(zhuǎn)導(dǎo)效率??梢酝ㄟ^摻入外源包膜蛋白,擴(kuò)展靶細(xì)胞的潛在靶群而改變逆轉(zhuǎn)錄病毒的向性。慢病毒載體是能夠轉(zhuǎn)導(dǎo)或感染非分裂細(xì)胞并典型地產(chǎn)生較高病毒效價(jià)的逆轉(zhuǎn)錄病毒載體。因此,逆轉(zhuǎn)錄病毒基因轉(zhuǎn)移系統(tǒng)的選擇將依賴于靶組織。逆轉(zhuǎn)錄病毒載體由順式作用長末端重復(fù)組成,這些長末端重復(fù)具有包裝多達(dá)6-10kb的外源序列的能力。最低量的順式作用LTR對于載體的復(fù)制和包裝而言是足夠的,然后使用這些載體將治療基因整合進(jìn)靶細(xì)胞中,以提供永久的轉(zhuǎn)基因表達(dá)。廣泛使用的逆轉(zhuǎn)錄病毒載體包括基于鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人類免疫缺陷病毒(HIV)及其組合的那些(參見例如,布赫謝爾(Buchscher)等人,《病毒學(xué)雜志》(J.Virol.)66:2731-2739(1992);約翰(Johann)等人,《病毒學(xué)雜志》66:1635-1640(1992);佐姆內(nèi)爾費(fèi)爾特(Sommnerfelt)等人,《病毒學(xué)》(Virol.)176:58-59(1990);威爾遜(Wilson)等人,《病毒學(xué)雜志》63:2374-2378(1989);米勒(Miller)等人,《病毒學(xué)雜志》65:2220-2224(1991);PCT/US94/05700)。在瞬時(shí)表達(dá)是優(yōu)選的應(yīng)用中,可以使用腺病毒基系統(tǒng)。腺病毒基載體在許多細(xì)胞類型中能夠具有非常高的轉(zhuǎn)導(dǎo)效并且無需細(xì)胞分裂。用這樣的載體,已經(jīng)獲得了較高的效價(jià)和表達(dá)水平??梢栽谙鄬唵蔚南到y(tǒng)中大量地產(chǎn)生此載體。還可以使用腺相關(guān)病毒(“AAV”)載體轉(zhuǎn)導(dǎo)具有靶核酸的細(xì)胞,例如,在體外產(chǎn)生核酸和肽,以及用于體內(nèi)和離體基因療法程序(參見例如,韋斯特(West)等人,《病毒學(xué)》(Virology)160:38-47(1987);美國專利號4,797,368;WO93/24641;科丁(Kotin),《人類基因療法》(HumanGeneTherapy)5:793-801(1994);繆斯科斯卡(Muzyczka),《臨床研究雜志》(J.Clin.Invest.)94:1351(1994))。重組AAV載體的構(gòu)建描述于多個(gè)出版物中,包括美國專利號5,173,414;特拉特斯金(Tratschin)等人,《分子與細(xì)胞生物學(xué)》(Mol.Cell.Biol.)5:3251-3260(1985);特拉特斯金等人,《分子與細(xì)胞生物學(xué)》4:2072-2081(1984);埃爾莫奈特(Hermonat)&繆斯科斯卡(Muzyczka),《美國國家科學(xué)院院刊》(PNAS)81:6466-6470(1984);以及薩穆爾斯基(Samulski)等人,《病毒學(xué)雜志》(J.Virol.)63:03822-3828(1989)。典型地使用包裝細(xì)胞形成能夠感染宿主細(xì)胞的病毒粒子。這樣的細(xì)胞包括包裝腺病毒的293細(xì)胞和包含逆轉(zhuǎn)錄病毒的ψ2細(xì)胞或PA317細(xì)胞。在基因療法中使用的病毒載體通常由將核酸載體包裝進(jìn)病毒粒子的細(xì)胞系產(chǎn)生。這些載體典型地包含包裝并且隨后整合進(jìn)宿主所需的最低量序列,其他病毒序列由用于有待表達(dá)的一個(gè)或多個(gè)多核苷酸的表達(dá)盒替換。失去的病毒功能典型地由包裝細(xì)胞系反式地提供。例如,在基因療法中使用的AAV載體典型地僅具有來自AAV基因組的ITR序列,這些序列為包裝并整合進(jìn)宿主基因組所需。將病毒DNA包裝進(jìn)以下細(xì)胞系中,該細(xì)胞系包含編碼輔助質(zhì)粒的其他AAV基因,即rep和cap,但缺少ITR序列。該細(xì)胞系還可以被作為輔助者的腺病毒感染。該輔助病毒促進(jìn)AAV載體的復(fù)制和從輔助質(zhì)粒表達(dá)AAV基因。由于缺少ITR序列,未以顯著的量包裝該輔助質(zhì)粒??梢酝ㄟ^例如與AAV相比腺病毒更加敏感的熱處理減少腺病毒的污染。用于將核酸遞送至細(xì)胞的另外的方法是本領(lǐng)域的技術(shù)人員已知的。參見例如通過引用結(jié)合在此的US20030087817。在一些實(shí)施例中,用一種或多種在此描述的載體瞬時(shí)地或非瞬時(shí)地轉(zhuǎn)染宿主細(xì)胞。在一些實(shí)施例中,當(dāng)細(xì)胞天然地出現(xiàn)在受試者體內(nèi)時(shí)將其轉(zhuǎn)染。在一些實(shí)施例中,被轉(zhuǎn)染的細(xì)胞取自受試者。在一些實(shí)施例中,該細(xì)胞來源于取自受試者的細(xì)胞,如細(xì)胞系。用于組織培養(yǎng)的多種多樣的細(xì)胞系在本領(lǐng)域是已知的。細(xì)胞系的實(shí)例包括但不限于,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、HepG2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細(xì)胞、BALB/3T3小鼠胚胎成纖維細(xì)胞、3T3Swiss、3T3-L1、132-d5人類胎兒成纖維細(xì)胞;10.1小鼠成纖維細(xì)胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細(xì)胞、BEAS-2B、bEnd.3、BHK-21、BR293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHODhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLT1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細(xì)胞、K562細(xì)胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細(xì)胞系、Peer、PNT-1A/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2細(xì)胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細(xì)胞系、U373、U87、U937、VCaP、維洛(Vero)細(xì)胞、WM39、WT-49、X63、YAC-1、YAR及其轉(zhuǎn)基因變種。細(xì)胞系可獲得自本領(lǐng)域的技術(shù)人員已知的多種來源(參見例如,美國典型培養(yǎng)物保藏中心(AmericanTypeCultureCollection)(ATCC)(馬納薩斯(Manassus),弗吉尼亞州))。在一些實(shí)施例中,使用用一種或多種在此描述的載體轉(zhuǎn)染的細(xì)胞建立新的細(xì)胞系,該新的細(xì)胞系包括一種或多種載體來源的序列。在一些實(shí)施例中,使用用如在此描述的CRISPR系統(tǒng)的組分轉(zhuǎn)染(如通過用一種或多種載體進(jìn)行瞬時(shí)轉(zhuǎn)染或用RNA進(jìn)行轉(zhuǎn)染)且通過CRISPR復(fù)合物的活性修飾的細(xì)胞建立新的細(xì)胞系,該新的細(xì)胞系包括以下細(xì)胞,這些細(xì)胞包含吸水但是缺少任何其他外源序列。在一些實(shí)施例中,在評估一種或多種測試化合物中使用用一種或多種在此描述的載體瞬時(shí)或非瞬時(shí)轉(zhuǎn)染的細(xì)胞或來源于這樣的細(xì)胞的細(xì)胞系。本發(fā)明的方面涉及產(chǎn)生用于研究疾病的遺傳變異的哺乳動物細(xì)胞的等基因系。本發(fā)明的一個(gè)另外的方面涉及產(chǎn)生轉(zhuǎn)基因的或病毒介導(dǎo)的遞送的基因修飾的動物模型。本發(fā)明還包括用于產(chǎn)生在生物醫(yī)學(xué)、農(nóng)業(yè)和工業(yè)上有用的產(chǎn)品的微生物、細(xì)胞、植物、動物或合成的生物的基因組修飾。在仍另一個(gè)方面,本發(fā)明包括基因療法??梢詫⒈景l(fā)明用作生物學(xué)研究工具,用于理解基因組,例如基因敲除研究。本發(fā)明涉及許多其他方法和組合物,這些方法和組合物依賴于基礎(chǔ)編輯能力和重寫基因組的DNA成分以及基于DNA的生物的靶向失活。本發(fā)明還可以用作治療,用于靶向細(xì)菌感染、病毒感染等的具體菌株。在一些實(shí)施例中,使用一種或多種在此描述的載體產(chǎn)生非人轉(zhuǎn)基因動物或轉(zhuǎn)基因植物。在一些實(shí)施例中,該轉(zhuǎn)基因動物是一種哺乳動物,如小鼠、大鼠或兔。在某些實(shí)施例中,該生物體或受試者是植物。在某些實(shí)施例中,該生物體或受試者或植物是藻類。用于產(chǎn)生轉(zhuǎn)基因植物和動物的方法在本領(lǐng)域是已知的,并且通常以如在此描述的細(xì)胞轉(zhuǎn)染方法開始。還提供了轉(zhuǎn)基因動物,正如轉(zhuǎn)基因植物一樣,尤其是作物和藻類。轉(zhuǎn)基因動物或植物可用于在除了提供疾病模型之外的應(yīng)用中。通過表達(dá)例如比通常在野生型中可見的更高的蛋白質(zhì)、碳水化合物、營養(yǎng)素或維生素水平,這些應(yīng)用可包括食物或飼料生產(chǎn)。在這方面,轉(zhuǎn)基因植物,尤其是豆類和塊莖類,以及動物,尤其是哺乳動物,如家畜(奶牛、綿羊、山羊和豬),而且還有禽類和食用昆蟲,是優(yōu)選的。轉(zhuǎn)基因藻類或其他植物,如油菜,可以在植物油或生物燃料例如像醇類(尤其是甲醇和乙醇)的生產(chǎn)中特別有用。這些可以被工程化為表達(dá)或過表達(dá)高水平的油或醇類,以供在油或生物燃料行業(yè)中使用。在一個(gè)方面,本發(fā)明提供了修飾真核細(xì)胞中的靶多核苷酸的方法,這些方法可以在體內(nèi)、離體或在體外。在一些實(shí)施例中,該方法包括從人或非人動物或植物(包括微藻)取樣細(xì)胞或細(xì)胞群,并且修飾該細(xì)胞或這些細(xì)胞。培養(yǎng)可以發(fā)生在離體的任何階段。該細(xì)胞或這些細(xì)胞甚至可以被重新引入該非人動物或植物(包括微藻)中。在一個(gè)方面,本發(fā)明提供了用于修飾在一種真核細(xì)胞中的靶多核苷酸的方法。在一些實(shí)施例中,該方法包括允許一種CRISPR復(fù)合物結(jié)合到該靶多核苷酸上以實(shí)施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR復(fù)合物包括與雜交到在所述靶多核苷酸內(nèi)的一個(gè)靶序列上的指導(dǎo)序列復(fù)合的CRISPR酶,其中所述指導(dǎo)序列連接到一種tracr配對序列上,該tracr配對序列進(jìn)而雜交到一種tracr序列上。在一個(gè)方面,本發(fā)明提供了修飾一種多核苷酸在真核細(xì)胞中的表達(dá)的方法。在一些實(shí)施例中,該方法包括允許一種CRISPR復(fù)合物結(jié)合到該多核苷酸上,這樣使得所述結(jié)合導(dǎo)致所述多核苷酸的表達(dá)增加或降低;其中該CRISPR復(fù)合物包括與雜交到在所述多核苷酸內(nèi)的一個(gè)靶序列上的指導(dǎo)序列復(fù)合的CRISPR酶,其中所述指導(dǎo)序列連接到一種tracr配對序列上,該tracr配對序列進(jìn)而雜交到一種tracr序列上。隨著作物基因組學(xué)的最新進(jìn)展,使用CRISPR-Cas系統(tǒng)進(jìn)行有效且符合成本效益的基因編輯和操縱的能力將允許快速選擇并比較單個(gè)和多元遺傳操作,以轉(zhuǎn)化這樣的基因組,以便改善生產(chǎn)并增強(qiáng)性狀。在此方面,參考美國專利和出版物:美國專利號6,603,061-農(nóng)桿菌介導(dǎo)的植物轉(zhuǎn)化法(Agrobacterium-MediatedPlantTransformationMethod);美國專利號7,868,149-植物基因組序列及其用途(PlantGenomeSequencesandUsesThereof)以及US2009/0100536-轉(zhuǎn)具有增強(qiáng)的農(nóng)藝性狀的基因植物(TransgenicPlantswithEnhancedAgronomicTraits),將每者的所有內(nèi)容和披露通過引用以其全文結(jié)合在此。在本發(fā)明的實(shí)踐中,莫雷爾(Morrell)等人“作物基因組學(xué):進(jìn)展與應(yīng)用(Cropgenomics:advancesandapplications)”《遺傳學(xué)自然評論》(NatRevGenet.)2011年12月29日;13(2):85-96的內(nèi)容和披露也通過引用以其全文結(jié)合在此。在植物中,病原體常常是宿主特異性的。例如,番茄尖鐮孢菌番茄?;?Fusariumoxysporumf.sp.lycopersici)引起番茄枯萎病,而且只攻擊番茄,并且香石竹尖鐮孢禾柄銹菌小麥?;?F.oxysporumf.dianthiiPucciniagraminisf.sp.tritici)只攻擊小麥。植物具有抵抗大多數(shù)病原體的現(xiàn)有的和誘導(dǎo)性的防御??缰参锎耐蛔兒椭亟M事件導(dǎo)致產(chǎn)生敏感性的遺傳變異性,特別是當(dāng)病原體以比植物更高的頻率繁殖時(shí)。在植物中可以存在非宿主抗性,例如,該宿主和病原體是不相容的。還可以存在水平抗性,例如典型地由許多基因控制的針對所有種的病原體的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的針對病原體的某些種而不是其他種的完全抗性。在基因?qū)蛩街?,植物和病原體一起演化,并且在一者中的遺傳變化使在另一者中的變化平衡。因此,使用自然變異,育種者針對產(chǎn)率、質(zhì)量、均勻性、耐性、抗性將最有用的基因進(jìn)行結(jié)合??剐曰虻膩碓窗ㄌ烊换蛲鈦砥贩N、傳家寶品種(HeirloomVarieties)、近緣野生植物、以及誘導(dǎo)的突變,例如用誘變劑處理植物材料。利用本發(fā)明,向植物育種者提供了一種新的誘導(dǎo)突變的工具。因此,本領(lǐng)域的技術(shù)人員可以分析抗性基因的來源的基因組,并且在具有所希望的特征或性狀的品種方面,采用本發(fā)明來誘導(dǎo)抗性基因的發(fā)生,這樣具有比先前的誘變劑更好的精確性,并且因此加速并改良植物育種計(jì)劃。在一個(gè)方面,本發(fā)明提供了以下試劑盒,這些試劑盒包含披露于以上方法和組合物中的元件中的任何一個(gè)或多個(gè)。在一些實(shí)施例中,該試劑盒包括一種載體系統(tǒng)以及用于使用該試劑盒的說明書。在一些實(shí)施例中,該載體系統(tǒng)包括:(a)一種第一調(diào)節(jié)元件,該第一調(diào)節(jié)元件可操作地連接到一種tracr配對序列以及用于在該tracr配對序列的上游插入一種指導(dǎo)序列的一個(gè)或多個(gè)插入位點(diǎn),其中當(dāng)表達(dá)時(shí),該指導(dǎo)序列引導(dǎo)CRISPR復(fù)合物在真核細(xì)胞中與一個(gè)靶序列的序列特異性結(jié)合,其中該CRISPR復(fù)合物包括與以下各項(xiàng)復(fù)合的一種CRISPR酶:(1)雜交到該靶序列的指導(dǎo)序列,以及(2)雜交到該tracr序列的tracr配對序列;和/或(b)一種第二調(diào)節(jié)元件,該第二調(diào)節(jié)元件可操作地連接到編碼所述CRISPR酶的酶編碼序列,所述CRISPR酶包括核定位序列的。元件可以單獨(dú)地或組合地提供,并且可以被提供于任何適合的容器中,如小瓶、瓶子或管。在一些實(shí)施例中,該試劑盒包括一種或多種語言,例如多于一種語言的說明書。在一些實(shí)施例中,試劑盒包括一種或多種用于在利用在此描述的元件中的一種或多種的方法中使用的試劑。試劑可以被提供于任何適合的容器中。例如,試劑盒可以提供一種或多種反應(yīng)或存儲緩沖液。可以按在具體測定中可用的形式或按在使用之前需要添加一種或多種其他組分的形式(例如按濃縮或凍干形式)提供試劑。緩沖液可以是任何緩沖液,包括但不限于碳酸鈉緩沖液、碳酸氫鈉緩沖液、硼酸鹽緩沖液、Tris緩沖液、MOPS緩沖液、HEPES緩沖液及其組合。在一些實(shí)施例中,該緩沖液是堿性的。在一些實(shí)施例中,該緩沖液具有從約7至約10的pH。在一些實(shí)施例中,該試劑盒包括一個(gè)或多個(gè)寡核苷酸,該一個(gè)或多個(gè)寡核苷酸對應(yīng)于一個(gè)用于插入進(jìn)載體中的指導(dǎo)序列,以便可操作地連接該指導(dǎo)序列和一個(gè)調(diào)節(jié)元件。在一些實(shí)施例中,該試劑盒包括一個(gè)同源重組模板多核苷酸。在一個(gè)方面,本發(fā)明提供了用于使用CRISPR系統(tǒng)的一個(gè)或多個(gè)元件的方法。本發(fā)明的CRISPR復(fù)合物提供了用于修飾靶多核苷酸的有效手段。本發(fā)明的CRISPR復(fù)合物具有多種多樣的實(shí)用性,包括修飾(例如,缺失、插入、轉(zhuǎn)位、失活、激活)多種細(xì)胞類型中的靶多核苷酸。正因?yàn)槿绱?,本發(fā)明的CRISPR復(fù)合物在例如基因療法、藥物篩選、疾病診斷以及預(yù)后中具有廣闊的應(yīng)用譜。示例性CRISPR復(fù)合物包括與一種指導(dǎo)序列復(fù)合的CRISPR酶,該指導(dǎo)序列與靶多核苷酸內(nèi)的靶序列雜交。該指導(dǎo)序列與一種tracr配對序列連接,該tracr配對序列進(jìn)而與一種tracr序列雜交。CRISPR復(fù)合物的靶多核苷酸可以是對真核細(xì)胞而言內(nèi)源或外源的任何多核苷酸。例如,該靶多核苷酸可以是一種駐留在真核細(xì)胞的細(xì)胞核中的多核苷酸。該靶多核苷酸可以是一個(gè)編碼基因產(chǎn)物(例如,蛋白質(zhì))的序列或一個(gè)非編碼序列(例如,調(diào)節(jié)多核苷酸或無用DNA)。不希望被理論所束縛,據(jù)信該靶序列應(yīng)該與PAM(原型間隔子鄰近基序)相關(guān);也就是說,與由CRISPR復(fù)合物識別的短序列相關(guān)。對PAM的精確序列和長度要求取決于使用的CRISPR酶而不同,但是PAM典型地是臨近原型間隔子(也就是說,靶序列)的2-5個(gè)堿基對序列。在以下實(shí)例部分中給出PAM序列的實(shí)例,并且熟練人員將能夠鑒定與給定的CRISPR酶一起使用的另外的PAM序列。CRISPR復(fù)合物的靶多核苷酸可以包括多個(gè)疾病相關(guān)基因和多核苷酸以及信號傳導(dǎo)生化途徑相基因和多核苷酸,如分別提交于2012年12月12日和2013年1月2日、標(biāo)題均為用于序列操縱的系統(tǒng)方法和組合物(SYSTEMSMETHODSANDCOMPOSITIONSFORSEQUENCEMANIPULATION)的分別具有博德(Broad)參考號BI-2011/008/WSGR案卷號44063-701.101和BI-2011/008/WSGR案卷號44063-701.102的美國臨時(shí)專利申請61/736,527和61/748,427中所列舉,將所有這些申請的內(nèi)容通過引用以其全文結(jié)合在此。靶多核苷酸的實(shí)例包括與信號傳導(dǎo)生化途徑相關(guān)的序列,例如信號傳導(dǎo)生化途徑相關(guān)基因或多核苷酸。靶多核苷酸的實(shí)例包括疾病相關(guān)基因或多核苷酸?!凹膊∠嚓P(guān)”基因或多核苷酸是指與非疾病對照的組織或細(xì)胞相比,在來源于疾病影響的組織的細(xì)胞中以異常水平或以異常形式產(chǎn)生轉(zhuǎn)錄或翻譯產(chǎn)物的任何基因或多核苷酸。在改變的表達(dá)與疾病的出現(xiàn)和/或進(jìn)展相關(guān)的情況下,它可以是一個(gè)以異常高的水平被表達(dá)的基因;它可以是一個(gè)以異常低的水平被表達(dá)的基因。疾病相關(guān)基因還指具有一個(gè)或多個(gè)突變或直接負(fù)責(zé)或與一個(gè)或多個(gè)負(fù)責(zé)疾病的病因?qū)W的基因連鎖不平衡的遺傳變異的基因。轉(zhuǎn)錄的或翻譯的產(chǎn)物可以是已知的或未知的,并且可以處于正?;虍惓K?。疾病相關(guān)基因和多核苷酸的實(shí)例可獲得自約翰斯·霍普金斯大學(xué)的麥考斯克-納森遺傳醫(yī)學(xué)研究所(McKusick-NathansInstituteofGeneticMedicine,JohnsHopkinsUniversity)(巴爾的摩,馬里蘭州)和國立醫(yī)學(xué)圖書館的國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NationalLibraryofMedicine)(貝塞斯達(dá),馬里蘭州)。疾病相關(guān)基因和多核苷酸的實(shí)例列于表A和B中。在萬維網(wǎng)上可獲得的疾病具體信息可獲得自約翰斯·霍普金斯大學(xué)的麥考斯克-納森遺傳醫(yī)學(xué)研究所(McKusick-NathansInstituteofGeneticMedicine,JohnsHopkinsUniversity)(巴爾的摩,馬里蘭州)和國立醫(yī)學(xué)圖書館的國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NationalLibraryofMedicine)(貝塞斯達(dá),馬里蘭州)。信號傳導(dǎo)生化途徑相關(guān)基因和多核苷酸的實(shí)例列于表C中。這些基因和途徑的突變可以導(dǎo)致產(chǎn)生不當(dāng)?shù)牡鞍踪|(zhì)或以不當(dāng)?shù)牧坑绊懝δ艿牡鞍踪|(zhì)。通過引用而特此結(jié)合來自2012年12月12日提交的美國臨時(shí)申請61/736,527和2013年1月2日提交的61/748,427的基因、疾病和蛋白質(zhì)的另外的實(shí)例。這樣的基因、蛋白質(zhì)和途徑可以是CRISPR復(fù)合物的靶多核苷酸。表A表B:表C:本發(fā)明的實(shí)施例還涉及與敲除基因、擴(kuò)增基因以及修復(fù)與DNA重復(fù)不穩(wěn)定性和神經(jīng)障礙相關(guān)的具體突變有關(guān)的方法和組合物(羅伯特D.·威爾斯(RobertD.Wells)、蘆沢哲夫(TetsuoAshizawa),遺傳不穩(wěn)定性與神經(jīng)疾病(GeneticInstabilitiesandNeurologicalDiseases),第二版,學(xué)術(shù)出版社(AcademicPress),2011年10月13日-《醫(yī)學(xué)》(Medical))。已經(jīng)發(fā)現(xiàn)串聯(lián)重復(fù)序列的特定方面對超過二十種人類疾病負(fù)責(zé)(重復(fù)不穩(wěn)定新見:RNA·DNA雜交體的作用(Newinsightsintorepeatinstability:roleofRNA·DNAhybrids),麥基弗EI(McIvorEI)、波拉克U(PolakU)、納皮爾拉拉M(NapieralaM),《RNA生物學(xué)》(RNABiol.)2010年9月-10月;7(5):551-8)??梢岳肅RISPR-Cas系統(tǒng)修正基因組不穩(wěn)定性缺陷。本發(fā)明的一個(gè)另外的方面涉及利用CRISPR-Cas系統(tǒng)修正EMP2A和EMP2B基因缺陷,這些基因已經(jīng)被鑒定為與拉福拉病(Laforadisease)相關(guān)。拉福拉病是一種由可以作為青年期的癲癇發(fā)作而開始的進(jìn)行性肌陣攣性癲癇表征的常染色體隱性病癥。該疾病的少數(shù)病可以由尚未鑒定的基因的突變引起。該疾病引起發(fā)作、肌肉痙攣、行走困難、癡呆,并且最終引起死亡。當(dāng)前沒有療法被證明有效對抗疾病進(jìn)展。與癲癇相關(guān)的其他遺傳異常還可以靶向CRISPR-Cas系統(tǒng)并且基礎(chǔ)遺傳學(xué)進(jìn)一步描述于由朱利亞諾阿文濟(jì)尼(GiulianoAvanzini)、杰弗里L(fēng).諾貝爾斯(JeffreyL.Noebels)編輯的《癲癇與遺傳癲癇遺傳學(xué)》(GeneticsofEpilepsyandGeneticEpilepsies),馬里亞尼兒科神經(jīng)學(xué)基金會(MarianiFoundationPaediatricNeurology):20;2009)中。在本發(fā)明的又另一個(gè)方面,該CRISPR-Cas系統(tǒng)可以用來矯正幾種基因突變引起的眼部缺陷,其進(jìn)一步描述于《眼的遺傳疾病》(GeneticDiseasesoftheEye),第二次編輯,由伊萊亞斯(Elias)I.特拉布勒西(Traboulsi)編輯,牛津大學(xué)出版社,2012年。本發(fā)明的若干另外的方面涉及修正與范圍廣泛的遺傳性疾病相關(guān)的缺陷,這些遺傳性疾病在專題小節(jié)遺傳性障礙(GeneticDisorders)下被進(jìn)一步描述于國立衛(wèi)生研究院的網(wǎng)站(網(wǎng)址為health.nih.gov/topic/GeneticDisorders)。遺傳性腦病可以包括但不限于,腎上腺腦白質(zhì)營養(yǎng)不良、胼胝體發(fā)育不全、艾卡爾迪綜合征(AicardiSyndrome)、阿爾佩斯病(Alpers'Disease)、阿爾茨海默病、巴特綜合征(BarthSyndrome)、巴藤病(BattenDisease)、CADASIL、小腦變性、費(fèi)波瑞病(Fabry'sDisease)、格斯特曼-施特勞斯納病(Gerstmann-Straussler-ScheinkerDisease)、亨廷頓病以及其他三聯(lián)體重復(fù)障礙、萊氏病(Leigh'sDisease)、萊施-奈恩綜合征、門克斯病、線粒體肌病以及NINDS空洞腦(Colpocephaly)。這些疾病在小節(jié)遺傳性腦部障礙(GeneticBrainDisorders)下被進(jìn)一步描述于國立衛(wèi)生研究院的網(wǎng)站。在一些實(shí)施例中,該病癥可以是瘤形成。在一些實(shí)施例中,在該病癥是瘤形成的情況下,有待被靶向的基因是列于表A中的那些基因中的任一種(在這種情況下是PTEN等)。在一些實(shí)施例中,該病癥可以是年齡相關(guān)性黃斑變性。在一些實(shí)施例中,該病癥可以是一種精神分裂癥障礙。在一些實(shí)施例中,該病癥可以是一種三核苷酸重復(fù)障礙。在一些實(shí)施例中,該病癥可以是脆性X綜合征。在一些實(shí)施例中,該病癥可以是一種分泌酶相關(guān)障礙。在一些實(shí)施例中,該病癥可以是一種朊病毒相關(guān)障礙。在一些實(shí)施例中,該病癥可以是ALS。在一些實(shí)施例中,該病癥可以是一種藥物成癮。在一些實(shí)施例中,該病癥可以是自閉癥。在一些實(shí)施例中,該病癥可以是阿爾茨海默病。在一些實(shí)施例中,該病癥可以是炎癥。在一些實(shí)施例中,該病癥可以是帕金森病。與帕金森病相關(guān)的蛋白質(zhì)的實(shí)例包括但不限于α-突觸核蛋白、DJ-1、LRRK2、PINK1、帕金蛋白、UCHL1、Synphilin-1以及NURR1。成癮相關(guān)的蛋白質(zhì)的實(shí)例可以包括例如ABAT。炎癥相關(guān)蛋白的實(shí)例可以包括例如由Ccr2基因編碼的單核細(xì)胞趨化蛋白-1(MCP1)、由Ccr5基因編碼的C-C趨化因子受體類型5(CCR5)、由Fcgr2b基因編碼的IgG受體IIB(FCGR2b,亦稱CD32)或由Fcer1g基因編碼的FcεR1g(FCER1g)蛋白。心血管疾病相關(guān)蛋白的實(shí)例可以包括例如IL1B(白介素1,β)、XDH(黃嘌呤脫氫酶)、TP53(腫瘤蛋白p53)、PTGIS(前列腺素I2(前列腺環(huán)素)合酶)、MB(肌紅蛋白)、IL4(白介素4)、ANGPT1(血管生成素1)、ABCG8(ATP-結(jié)合盒,亞家族G(WHITE),成員8)或CTSK(組織蛋白酶K)。阿爾茨海默病相關(guān)蛋白的實(shí)例可以包括例如由VLDLR基因編碼的極低密度脂蛋白受體蛋白(VLDLR)、由UBA1基因編碼的泛素樣改性劑激活酶1(UBA1)或由UBA3基因編碼的NEDD8-激活酶E1催化亞基蛋白(UBE1C)。自閉癥譜系障礙相關(guān)蛋白的實(shí)例可以包括例如由BZRAP1基因編碼的苯二氮卓受體(外周)相關(guān)蛋白1(BZRAP1)、由AFF2基因編碼的AF4/FMR2家族成員2蛋白(AFF2)(亦稱MFR2)、由FXR1基因編碼的脆性X智力遲鈍常染色體同系物1蛋白(FXR1)或由FXR2基因編碼的脆性X智力遲鈍常染色體同系物2蛋白(FXR2)。黃斑變性相關(guān)蛋白的實(shí)例可以包括例如由ABCR基因編碼的ATP-結(jié)合盒,亞家族A(ABC1)成員4蛋白(ABCA4)、由APOE基因編碼的載脂蛋白E蛋白(APOE)或由CCL2基因編碼的趨化因子(C-C基序)配體2蛋白(CCL2)。精神分裂癥相關(guān)蛋白的實(shí)例可以包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B及其組合。涉及腫瘤抑制的蛋白質(zhì)的實(shí)例可以包括例如ATM(共濟(jì)失調(diào)性毛細(xì)血管擴(kuò)張突變的)、ATR(共濟(jì)失調(diào)性毛細(xì)血管擴(kuò)張和Rad3相關(guān)的)、EGFR(表皮生長因子受體)、ERBB2(v-erb-b2紅白血病病毒癌基因同系物2)、ERBB3(v-erb-b2紅白血病病毒癌基因同系物3)、ERBB4(v-erb-b2紅白血病病毒癌基因同系物4)、Notch1、Notch2、Notch3或Notch4。與分泌酶障礙相關(guān)的蛋白質(zhì)的實(shí)例可以包括例如PSENEN(早老素增強(qiáng)子2同系物(秀麗隱桿線蟲))、CTSB(組織蛋白酶B)、PSEN1(早老素1)、APP(淀粉樣蛋白β(A4)前體蛋白)、APH1B(前咽缺陷1同系物B(秀麗隱桿線蟲))、PSEN2(早老素2(阿爾茨海默病4))或BACE1(β-位點(diǎn)APP-切割酶1)。與肌萎縮性側(cè)索硬化相關(guān)的蛋白質(zhì)的實(shí)例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎縮性側(cè)索硬化2)、FUS(融合在肉瘤中)、TARDBP(TARDNA結(jié)合蛋白)、VAGFA(血管內(nèi)皮生長因子A)、VAGFB(血管內(nèi)皮生長因子B)以及VAGFC(血管內(nèi)皮生長因子C)及其任何組合。與朊病毒病相關(guān)的蛋白質(zhì)的實(shí)例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎縮性側(cè)索硬化2)、FUS(融合在肉瘤中)、TARDBP(TARDNA結(jié)合蛋白)、VAGFA(血管內(nèi)皮生長因子A)、VAGFB(血管內(nèi)皮生長因子B)以及VAGFC(血管內(nèi)皮生長因子C)及其任何組合。與朊病毒病癥中的神經(jīng)退行性疾病相關(guān)的蛋白質(zhì)的實(shí)例可以包括例如A2M(α-2-巨球蛋白)、AATF(凋亡拮抗轉(zhuǎn)錄因子)、ACPP(前列腺的酸性磷酸酶)、ACTA2(肌動蛋白α2平滑肌主動脈)、ADAM22(ADAM金屬肽酶結(jié)構(gòu)域)、ADORA3(腺苷A3受體)或ADRA1D(α-1D腎上腺素能受體(Alpha-1Dadrenergicreceptor或Alpha-1Dadrenoreceptor))。與免疫缺陷相關(guān)的蛋白質(zhì)的實(shí)例可以包括例如A2M[α-2-巨球蛋白];AANAT[芳烷基胺N-乙酰轉(zhuǎn)移酶];ABCA1[ATP-結(jié)合盒,亞家族A(ABC1),成員1];ABCA2[ATP-結(jié)合盒,亞家族A(ABC1),成員2];或ABCA3[ATP-結(jié)合盒,亞家族A(ABC1),成員3]。與三核苷酸重復(fù)障礙相關(guān)的蛋白質(zhì)的實(shí)例包括例如AR(雄激素受體)、FMR1(脆性X智力遲鈍1)、HTT(亨廷頓蛋白)或DMPK(強(qiáng)直性肌營養(yǎng)不良蛋白激酶)、FXN(弗氏共濟(jì)失調(diào)蛋白(frataxin))、ATXN2(共濟(jì)失調(diào)蛋白2)。與神經(jīng)傳遞障礙相關(guān)的蛋白質(zhì)的實(shí)例包括例如SST(生長抑素)、NOS1(一氧化氮合酶1(神經(jīng)元的))、ADRA2A(腎上腺素能的,α-2A-,受體)、ADRA2C(腎上腺素能的,α-2C-,受體)、TACR1(速激肽受體1)或HTR2c(5-羥色胺(血清素)受體2C)。神經(jīng)發(fā)育相關(guān)序列的實(shí)例包括例如A2BP1[共濟(jì)失調(diào)蛋白2-結(jié)合蛋白1]、AADAT[氨基己二酸氨基轉(zhuǎn)移酶],AANAT[芳烷基胺N-乙酰轉(zhuǎn)移酶]、ABAT[4-氨基丁酸氨基轉(zhuǎn)移酶]、ABCA1[ATP-結(jié)合盒,亞家族A(ABC1),成員1]或ABCA13[ATP-結(jié)合盒,亞家族A(ABC1),成員13]??捎帽景l(fā)明系統(tǒng)治療的優(yōu)選病癥的另外的實(shí)例可以選自:艾卡迪-古鐵雷斯綜合征(Aicardi-GoutièresSyndrome);亞歷山大?。话?赫恩登-達(dá)德利綜合征(Allan-Herndon-DudleySyndrome);POLG相關(guān)障礙;α-甘露糖苷貯積癥(II和III型);阿爾斯特倫綜合征(Syndrome);安格曼;綜合征;共濟(jì)失調(diào)-毛細(xì)血管擴(kuò)張;神經(jīng)元蠟樣-脂褐質(zhì)沉積;β-地中海貧血;雙側(cè)視神經(jīng)萎縮和1型(嬰兒)視神經(jīng)萎縮;視網(wǎng)膜母細(xì)胞瘤(雙側(cè)的);卡納萬病(CanavanDisease);腦-眼-面-骨骼綜合征(CerebrooculofacioskeletalSyndrome)1[COFS1];腦腱黃瘤病;科尼利亞迪蘭吉綜合征(CorneliadeLangeSyndrome);MAPT相關(guān)障礙;遺傳性朊病毒?。坏吕f綜合征(DravetSyndrome);早期發(fā)病家族性阿爾茨海默??;弗里德賴希共濟(jì)失調(diào)[FRDA];多發(fā)性畸形;巖藻糖苷貯積癥;福山(Fukuyama)先天性肌營養(yǎng)不良;半乳糖唾液酸貯積癥;戈謝病(GaucherDisease);有機(jī)酸血癥;噬血細(xì)胞淋巴組織細(xì)胞增生癥;早衰癥;粘脂貯積癥II;嬰兒游離唾液酸貯積??;PLA2G6相關(guān)神經(jīng)變性;耶韋爾和朗格-尼爾森綜合征(JervellandLange-NielsenSyndrome);結(jié)合性大皰性表皮松解;亨廷頓?。豢死?KrabbeDisease)(嬰兒的);線粒體DNA相關(guān)雷吉綜合征(MitochondrialDNA-AssociatedLeighSyndrome)和NARP;萊施-奈恩綜合征;LIS1相關(guān)無腦回;洛氏綜合征(LoweSyndrome);槭糖尿??;MECP2復(fù)制綜合征;ATP7A相關(guān)銅轉(zhuǎn)運(yùn)障礙;LAMA2相關(guān)肌營養(yǎng)不良;芳基硫酸酯酶A缺乏;I、II或III型粘多糖貯積癥;過氧化物酶體生物發(fā)生障礙,齊薇格譜系綜合征(ZellwegerSyndromeSpectrum);伴隨腦鐵累積障礙的神經(jīng)變性;酸性鞘磷脂酶缺乏;C型尼曼-皮克?。桓拾彼崮X?。籄RX相關(guān)障礙;尿素循環(huán)障礙;COL1A1/2相關(guān)成骨不全;線粒體DNA缺失綜合征;PLP1相關(guān)障礙;佩里綜合征(PerrySyndrome);費(fèi)倫-麥克德米德綜合征(Phelan-McDermidSyndrome);II型糖原貯積癥(蓬佩病(PompeDisease))(嬰兒的);MAPT相關(guān)障礙;MECP2相關(guān)障礙;1型肢近端型點(diǎn)狀軟骨發(fā)育不全(RhizomelicChondrodysplasiaPunctataType1);羅伯茨綜合征(RobertsSyndrome);桑德霍夫病(SandhoffDisease);辛德勒病(SchindlerDisease)-1型;腺苷脫氨酶缺乏;史-倫-奧三氏綜合征;脊髓性肌萎縮;嬰兒發(fā)病脊髓小腦性共濟(jì)失調(diào);己糖胺酶A缺乏;1型致死性發(fā)育不良;膠原VI型相關(guān)障礙;I型烏謝爾綜合征(UsherSyndrome);先天性肌營養(yǎng)不良;沃爾夫-赫奇霍恩綜合征(Wolf-HirschhornSyndrome);溶酶體酸脂酶缺乏;以及著色性干皮病。如將是顯而易見的,設(shè)想的是可以使用本發(fā)明系統(tǒng)靶向任何感興趣的多核苷酸序列。使用本發(fā)明系統(tǒng)進(jìn)行治療可能是有用的病癥或疾病的一些實(shí)例被包括在上表中并且當(dāng)前與那些病癥相關(guān)的基因的實(shí)例也被提供于此。然而,示例的基因并不是窮盡性的。實(shí)例以下實(shí)例出于說明本發(fā)明的不同實(shí)施例的目的而給出并且并不意在以任何方式限制本發(fā)明。本發(fā)明實(shí)例連同在此描述的方法目前代表優(yōu)選的實(shí)施例,是示例性的,并且并不旨在限制本發(fā)明的范圍。涵蓋在如由權(quán)利要求書的范圍所定義的本發(fā)明的精神內(nèi)的在此的變化以及其他用途是本領(lǐng)域普通技術(shù)人員可以想到的。實(shí)例1:真核細(xì)胞的細(xì)胞核中的CRISPR復(fù)合物活性一個(gè)示例性II型CRISPR系統(tǒng)是來自化膿鏈球菌SF370的II型CRISPR座位,該座位包含四個(gè)基因Cas9、Cas1、Cas2和Csn1的聚簇以及兩個(gè)非編碼RNA元件tracrRNA和由非重復(fù)序列的短段(間隔子,每個(gè)約30bp)間隔開的重復(fù)序列(同向重復(fù))的特征性陣列。在此系統(tǒng)中,以四個(gè)連續(xù)步驟產(chǎn)生靶向的DNA雙鏈斷裂(DSB)(圖2A)。第一步,從CRISPR座位轉(zhuǎn)錄兩個(gè)非編碼RNA前-crRNA陣列和tracrRNA。第二步,將tracrRNA雜交到前-crRNA的同向重復(fù)上,然后將其加工成含有單獨(dú)的間隔子序列的成熟crRNA。第三步,該成熟crRNA:tracrRNA復(fù)合物經(jīng)由在crRNA的間隔子區(qū)與原型間隔子DNA之間形成異源雙鏈體而將Cas9指向由原型間隔子和對應(yīng)的PAM組成的DNA靶標(biāo)。最后,Cas9介導(dǎo)PAM上游的靶DNA的切割,以在原型間隔子內(nèi)產(chǎn)生一個(gè)DSB(圖2A)。此實(shí)例描述了一種用于將此RNA可編程的核酸酶系統(tǒng)適配成指導(dǎo)真核細(xì)胞的細(xì)胞核中的CRISPR復(fù)合物活性的示例性過程。細(xì)胞培養(yǎng)和轉(zhuǎn)染在37℃下,伴隨5%CO2孵育,將人類胚腎(HEK)細(xì)胞系HEK293FT(生命技術(shù)公司)維持在補(bǔ)充有10%胎牛血清(??陕」?HyClone))、2mMGlutaMAX(生命技術(shù)公司)、100U/mL青霉素及100μg/mL鏈霉素的杜爾貝科改良伊格爾培養(yǎng)基(Dulbecco’smodifiedEagle’sMedium)(DMEM)中。在37℃下,在5%CO2下,用補(bǔ)充有5%胎牛血清(??陕」?、2mMGlutaMAX(生命技術(shù)公司)、100U/mL青霉素及100μg/mL鏈霉素的DMEM維持小鼠neuro2A(N2A)細(xì)胞系(ATCC)。在轉(zhuǎn)染前一天,將HEK293FT或N2A細(xì)胞以200,000個(gè)細(xì)胞/孔的密度接種到24孔板(康寧公司(Corning))中。遵循制造商推薦的方案,使用Lipofectamine2000(生命技術(shù)公司)轉(zhuǎn)染細(xì)胞。對于24孔板的每個(gè)孔,使用總共800ng的質(zhì)粒。基因組修飾的Surveyor測定和測序分析如上所述,用質(zhì)粒DNA轉(zhuǎn)染HEK293FT或N2A細(xì)胞。轉(zhuǎn)染后,在基因組DNA提取之前,將細(xì)胞在37℃下孵育72小時(shí)。遵循制造商的方案,使用QuickExtractDNA提取試劑盒(Epicentre)提取基因組DNA。簡言之,將細(xì)胞重懸于QuickExtract溶液中并在65℃下孵育15分鐘并且在98℃下孵育10分鐘。將提取的基因組DNA立即加工或存儲在-20℃下。對于每個(gè)基因而言,PCR擴(kuò)增圍繞CRISPR靶位點(diǎn)的基因組區(qū)域,并且遵循制造商的方案,使用QiaQuickSpin柱(凱杰公司(Qiagen))純化產(chǎn)物。將總共400ng的純化的PCR產(chǎn)物與2μl10XTaq聚合酶PCR緩沖液(Enzymatics公司)和超純水混合,至終體積為20μl,并使其經(jīng)受重退火過程,以使得可以形成異源雙鏈體:95℃持續(xù)10min,以-2℃/s95℃降至85℃,以-0.25℃/s85℃降至25℃,并且在25℃保持1分鐘。重退火后,遵循制造商推薦的方案,將產(chǎn)物用Surveyor核酸酶和Surveyor增強(qiáng)子S(轉(zhuǎn)基因組學(xué)公司(Transgenomics))處理,并且在4%-20%NovexTBE聚丙烯酰胺凝膠(生命技術(shù)公司)上進(jìn)行分析。將凝膠用SYBRGoldDNA染色劑(生命技術(shù)公司)染色30分鐘并用GelDoc凝膠成像系統(tǒng)(伯樂公司(Bio-rad))成像。定量是基于作為切割的DNA的部分的量度的相對條帶強(qiáng)度。圖7提供了此Surveyor測定的一個(gè)示意圖。用于檢測同源重組的限制性片段長度多態(tài)性測定。將HEK293FT和N2A細(xì)胞用質(zhì)粒DNA轉(zhuǎn)染,并且如上所述,在基因組DNA提取之前,將其在37℃下孵育72小時(shí)。使用引物在同源重組(HR)模板的同源臂外PCR擴(kuò)增靶基因組區(qū)域。將PCR產(chǎn)物分離在1%瓊脂糖凝膠上并用MinEluteGelExtraction試劑盒(凱杰公司)提取。將純化產(chǎn)物用HindIII(費(fèi)爾芒斯公司(Fermentas))消化并在6%NovexTBE聚丙烯酰胺凝膠(生命技術(shù)公司)上進(jìn)行分析。RNA二級結(jié)構(gòu)預(yù)測和分析使用質(zhì)心結(jié)構(gòu)預(yù)測算法,使用由維也納大(UniversityofVienna)的理論化學(xué)研究所(InstituteforTheoreticalChemistry)研發(fā)的在線網(wǎng)絡(luò)服務(wù)器RNAfold進(jìn)行RNA二級結(jié)構(gòu)預(yù)測(參見例如A.R.格魯伯(A.R.Gruber)等人,2008,《細(xì)胞》(Cell)106(1):23-24;以及PA卡爾(PACarr)和GM丘奇(GMChurch),2009,《自然生物技術(shù)》(NatureBiotechnology)27(12):1151-62)。RNA純化將HEK293FT細(xì)胞如上所述地維持和轉(zhuǎn)染。通過胰酶消化收獲細(xì)胞,隨后在磷酸鹽緩沖生理鹽水(PBS)中洗滌。遵循制造商的方案,用TRI試劑(西格瑪公司)提取總細(xì)胞RNA。使用Naonodrop(賽默飛世爾科技公司(ThermoScientific))對提取的總RNA進(jìn)行定量并標(biāo)準(zhǔn)化至同一濃度。哺乳動物細(xì)胞中的crRNA和tracrRNA表達(dá)的Northern印跡分析將RNA與等體積的2X加樣緩沖液(Ambion)混合,加熱至95℃持續(xù)5min,在冰上冷凍1min,并且然后在將凝膠預(yù)跑膠至少30分鐘后,加樣到8%變性聚丙烯酰胺凝膠(SequaGel,國家診斷(NationalDiagnostics))上。將樣品以40W極限電泳1.5小時(shí)。之后,在室溫下,將RNA轉(zhuǎn)移到半干轉(zhuǎn)移設(shè)備(伯樂公司(Bio-rad))中的300mA的HybondN+膜(通用電氣醫(yī)療公司(GEHealthcare))上,持續(xù)1.5小時(shí)。使用StratageneUVCrosslinkertheStratalinker(Stratagene)上的自動交聯(lián)按鈕將RNA交聯(lián)到該膜上。在42℃下,伴隨旋轉(zhuǎn),將該膜在ULTRAhyb-Oligo雜交緩沖液(Ambion)中預(yù)雜交30min,并且然后添加探針并雜交過夜。探針訂購自IDT并將其用具有T4多核苷酸激酶(新英格蘭生物實(shí)驗(yàn)室(NewEnglandBiolabs)))的[γ-32P]ATP(珀金埃爾默公司)標(biāo)記。將該膜用預(yù)加溫的(42℃)2xSSC、0.5%SDS洗滌一次,持續(xù)1min,隨后在42℃下洗滌兩次,持續(xù)30分鐘。將該膜在室溫下向熒光屏暴露一小時(shí)或過夜并且然后用感光成像儀(Typhoon)掃描。細(xì)菌CRISPR系統(tǒng)構(gòu)建和評價(jià)從具有用于吉布森拼接(GibsonAssembly)的側(cè)翼同源臂的化膿鏈球菌SF370基因組DNAPCR擴(kuò)增CRISPR座位元件(包括tracrRNA、Cas9和前導(dǎo)子)。將兩個(gè)BsaI類型IIS位點(diǎn)引入在兩個(gè)同向重復(fù)之間,以促進(jìn)間隔子的方便插入(圖8)。使用GibsonAssemblyMasterMix(NEB)將PCR產(chǎn)物克隆進(jìn)EcoRV-消化的pACYC184中,在tet啟動子的下游。省略其他內(nèi)源CRISPR系統(tǒng)元件,Csn2的最后50bp除外。將編碼具有互補(bǔ)突出端的間隔子的寡聚物(整合DNA技術(shù)公司(IntegratedDNATechnology))克隆進(jìn)BsaI-消化的載體pDC000(NEB)中并且然后用T7連接酶(Enzymatics公司)連接,以產(chǎn)生pCRISPR質(zhì)粒。包含具有在哺乳動物細(xì)胞中的PAM表達(dá)的間隔子的激發(fā)質(zhì)粒(圖6A中所示出的表達(dá)構(gòu)建體,其中功能性是如顯示于圖6B中的Surveyor測定的結(jié)果所確定的)。將轉(zhuǎn)錄起始位點(diǎn)標(biāo)為+1,并且還指示了轉(zhuǎn)錄終止子和通過Northern印跡探測的序列。還通過Northern印跡確認(rèn)了加工的tracrRNA的表達(dá)。圖6C顯示了提取自293FT細(xì)胞的總RNA的Northern印跡分析的結(jié)果,用攜帶長或短tracrRNA以及SpCas9和DR-EMX1(1)-DR的U6表達(dá)構(gòu)建體轉(zhuǎn)染這些細(xì)胞。左圖和右圖分別是來自用或沒用SpRNA酶III轉(zhuǎn)染的293FT細(xì)胞。U6指示用靶向人類U6snRNA的探針進(jìn)行印跡的加樣對照。短tracrRNA表達(dá)構(gòu)建體的轉(zhuǎn)染產(chǎn)生豐富水平的加工形式的tracrRNA(~75bp)。在Northern印跡上檢測極低量的長tracrRNA。為了促進(jìn)轉(zhuǎn)錄精確起始,選擇基于RNA聚合酶III的U6啟動子,以驅(qū)動tracrRNA的表達(dá)(圖2C)。類似地,研發(fā)基于U6啟動子的構(gòu)建體,以表達(dá)由單個(gè)間隔子組成的前-crRNA陣列,該單個(gè)間隔子側(cè)翼為兩個(gè)同向重復(fù)(DR,還被術(shù)語“tracr配對序列”所涵蓋;圖2C)。將起始間隔子設(shè)計(jì)成靶向人EMX1座位(圖2C)中的33-堿基對(bp)靶位點(diǎn)(滿足Cas9的NGG識別基序的30-bp原型間隔子加3-bpCRISPR基序(PAM)序列),該座位是大腦皮層的發(fā)育中的一個(gè)關(guān)鍵基因。為了測試CRISPR系統(tǒng)(SpCas9、SpRNA酶III、tracrRNA以及前-crRNA)在哺乳動物細(xì)胞中的異源表達(dá)是否可以實(shí)現(xiàn)哺乳動物染色體的靶向切割,用CRISPR組分的組合轉(zhuǎn)染HEK293FT細(xì)胞。由于哺乳動物細(xì)胞核中的DSB通過導(dǎo)致形成indel的非同源末端連接(NHEJ)途徑而部分地修復(fù),使用Surveyor測定檢測靶EMX1座位處的潛在的切割活性(圖7)(參見例如格斯欽(Guschin)等人,2010,《分子生物學(xué)方法》(MethodsMolBiol)649:247)。所有四種CRISPR組分的共轉(zhuǎn)染能夠在原型間隔子中誘導(dǎo)高達(dá)5.0%切割(參見圖2D)。所有CRISPR組分(減去SpRNA酶III)的共轉(zhuǎn)染在原型間隔子中也誘導(dǎo)高達(dá)4.7%indel,表明可能存在能夠輔助crRNA成熟的內(nèi)源性哺乳動物RNA酶,如例如相關(guān)的切丁酶(Dicer)和Drosha酶。除去剩余的三種組分中的任何組分消除CRISPR系統(tǒng)的基因組切割活性(圖2D)。包含已證實(shí)切割活性的靶座位的擴(kuò)增子的桑格測序:在43個(gè)測序的克隆中,發(fā)現(xiàn)5個(gè)突變的等位基因(11.6%)。使用多種指導(dǎo)序列的類似實(shí)驗(yàn)產(chǎn)生了高達(dá)29%的indel百分比(參見圖3-6、10和11)。這些結(jié)果定義了一種在哺乳動物細(xì)胞中的有效的CRISPR介導(dǎo)的基因組修飾的三組分系統(tǒng)。為了優(yōu)化切割效率,申請人還測試了tracrRNA的不同亞型是否影響切割效率并且發(fā)現(xiàn),在實(shí)例系統(tǒng)中,僅僅短(89-bp)轉(zhuǎn)錄本形式能夠介導(dǎo)人類EMX1基因組座位的切割(圖6B)。圖12提供了哺乳動物細(xì)胞中的crRNA加工的另外的Northern印跡分析。圖12A示出了一個(gè)示意圖,顯示了側(cè)翼為兩個(gè)同向重復(fù)(DR-EMX1(1)-DR)的單個(gè)間隔子的表達(dá)載體。靶向人EMX1座位原型間隔子1(參見圖6)的30bp間隔子和同向重復(fù)序列顯示于圖12A下方的序列中。直線指示其反向互補(bǔ)系列用于產(chǎn)生供EMX1(1)crRNA檢測用的Northern印跡探針的區(qū)域。圖12B顯示了提取自293FT細(xì)胞的總RNA的Northern印跡分析,用攜帶DR-EMX1(1)-DR的U6表達(dá)構(gòu)建體轉(zhuǎn)染這些細(xì)胞。左圖和右圖分別是來自用或沒用SpRNA酶III轉(zhuǎn)染的293FT細(xì)胞。DR-EMX1(1)-DR僅在存在SpCas9和短tracrRNA的情況下被加工為成熟crRNA并且不依賴于SpRNA酶III的存在。檢測的來自轉(zhuǎn)染的293FT總RNA的成熟crRNA是約33bp并且比來自化膿鏈球菌的39-42bp成熟crRNA短。這些結(jié)果證明,CRISPR系統(tǒng)可以被移植進(jìn)真核細(xì)胞中并被重新編程,以促進(jìn)內(nèi)源哺乳動物靶多核苷酸的切割。圖2示出了描述于此實(shí)例中的細(xì)菌CRISPR系統(tǒng)。圖2A示出了一個(gè)示意圖,顯示了來自化膿鏈球菌SF370的CRISPR座位和通過此系統(tǒng)CRISPR介導(dǎo)的DNA切割的建議機(jī)制。加工自同向重復(fù)-間隔子陣列的成熟crRNA指導(dǎo)Cas9到以下基因組靶標(biāo),這些靶標(biāo)由互補(bǔ)原型間隔子和原型間隔子相鄰基序(PAM)組成。靶標(biāo)-間隔子堿基配對后,Cas9介導(dǎo)靶DNA中的雙鏈斷裂。圖2B示出了具有使得導(dǎo)入到哺乳動物細(xì)胞核中成為可能的核定位信號(NLS)的化膿鏈球菌Cas9(SpCas9)和RNA酶III(SpRNA酶III)的工程化。圖2C示出了由組成型EF1a啟動子驅(qū)動的SpCas9和SpRNA酶III以及由RNAPol3啟動子U6驅(qū)動的tracrRNA和前-crRNA陣列(DR-間隔子-DR)的哺乳動物表達(dá),上述啟動子促進(jìn)轉(zhuǎn)錄精確起始和終止。將來自具有令人滿意的PAM序列的人EMX1座位的原型間隔子用作前-crRNA陣列中的間隔子。圖2D示出了SpCas9介導(dǎo)的次要插入和缺失的Surveyor核酸酶測定。使用和不使用SpRNA酶III、tracrRNA以及攜帶EMX1-靶間隔子的前-crRNA陣列表達(dá)SpCas9。圖2E示出了靶座位與EMX1-靶向crRNA之間的堿基配對的一個(gè)示意表示以及一個(gè)顯示了與SpCas9切割位點(diǎn)鄰近的微小缺失的示例性色譜圖。圖2F示出了從43個(gè)克隆擴(kuò)增子的測序分析鑒定出的突變的等位基因,這些擴(kuò)增子顯示出多種微小插入和缺失。破折號指示缺失的堿基,并且非比對或錯(cuò)配堿基指示插入或突變。比例尺=10μm。為了進(jìn)一步簡化該三組分系統(tǒng),改編嵌合的crRNA-tracrRNA雜交體設(shè)計(jì),其中成熟crRNA(包括一種指導(dǎo)序列)可以經(jīng)由莖-環(huán)而融合到部分tracrRNA上,以模擬天然的crRNA:tracrRNA雙鏈體。為了增加共遞送效率,產(chǎn)生雙順反子表達(dá)載體,以驅(qū)動嵌合的RNA和SpCas9在轉(zhuǎn)染細(xì)胞中的共表達(dá)。平行地,使用該雙順反子載體表達(dá)前-crRNA(DR-指導(dǎo)序列-DR)與SpCas9,以誘導(dǎo)用分開表達(dá)的tracrRNA加工為crRNA(比較圖11B的頂圖和底圖)。圖8提供了前-crRNA陣列(圖8A)或嵌合的crRNA(由圖8B中的指導(dǎo)序列插入位點(diǎn)的下游和EF1α啟動子的上游的短線表示)與hSpCas9的雙順反子表達(dá)載體的示意圖,顯示了各種元件的位置和指導(dǎo)序列插入點(diǎn)。圖8B中的圍繞指導(dǎo)序列插入位點(diǎn)的位置的展開的序列還顯示了部分DR序列(GTTTTAGAGCTA)(SEQIDNO:11)和部分tracrRNA序列(TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT)(SEQIDNO:12)??梢允褂猛嘶鸬墓押塑账釋⒅笇?dǎo)序列插入在BbsI位點(diǎn)之間。寡核苷酸的序列設(shè)計(jì)顯示在圖8中的示意圖的下方,其中指示了適當(dāng)?shù)倪B接適配子。WPRE表示土撥鼠肝炎病毒轉(zhuǎn)錄后調(diào)節(jié)元件。通過靶向與上述相同的EMX1座位而測試嵌合RNA介導(dǎo)的切割效率。使用擴(kuò)增子的Surveyor測定和桑格測序兩者,申請人確認(rèn)嵌合RNA設(shè)計(jì)以大約4.7%的修飾率促進(jìn)人EMX1座位的切割(圖3)。通過設(shè)計(jì)靶向人EMX1和PVALB以及小鼠Th座位中的多個(gè)位點(diǎn)的嵌合RNA,通過靶向人類和小鼠細(xì)胞兩者中的另外的基因組座位而測試CRISPR介導(dǎo)的切割在真核細(xì)胞中的普遍性。圖13示出了人類PVALB(圖13A)和小鼠Th(圖13B)座位中的一些另外的靶向原型間隔子的篩選。提供了各自的最后的外顯子內(nèi)的基因座位位和三個(gè)原型間隔子的位置的示意圖。加下劃線的序列包括30bp的原型間隔子序列和對應(yīng)于PAM序列的3’端處的3bp。分別在DNA序列的上方和下方指示了有義鏈和反義鏈上的原型間隔子。人類PVALB和小鼠Th座位分別達(dá)到了6.3%和0.75%的修飾率,證明了CRISPR系統(tǒng)跨多種生物在修飾不同座位方面的廣闊適用性(圖5)。雖然對于每個(gè)座位而言,使用嵌合的構(gòu)建體僅伴隨三分之一的間隔子檢測切割,但是當(dāng)使用共表達(dá)的前-crRNA安排時(shí),所有靶序列都被切割,伴隨達(dá)到27%的有效的indel產(chǎn)生(圖6和13)。圖11提供了可以被重新編程為靶向哺乳動物細(xì)胞中的多個(gè)基因組座位的SpCas9的另外的圖解。圖11A提供了人EMX1座位的示意圖,顯示了五個(gè)原型間隔子的位置,由加下劃線的序列指示。圖11B提供了前-crRNA/trcrRNA復(fù)合物的示意圖,顯示了前-crRNA和tracrRNA的同向重復(fù)區(qū)之間的雜交(頂部),以及嵌合RNA設(shè)計(jì)的示意圖,包括一個(gè)20bp指導(dǎo)序列和由部分同向重復(fù)組成的tracr配對和tracr序列以及以發(fā)夾結(jié)構(gòu)雜交的tracrRNA序列(底部)。比較人EMX1座位中的五個(gè)原型間隔子處的Cas9介導(dǎo)的切割的效率的Surveyor測定的結(jié)果示于圖11C中。使用加工的前-crRNA/tracrRNA復(fù)合物(crRNA)或嵌合的RNA(chiRNA)靶向每個(gè)原型間隔子。由于RNA的二級結(jié)構(gòu)對于分子間相互作用可以是決定性的,使用基于最小自由能和玻爾茲曼(Boltzmann)加權(quán)結(jié)構(gòu)集合的結(jié)構(gòu)預(yù)測算法比較基因組靶向?qū)嶒?yàn)中使用的所有指導(dǎo)序列的假定的二級結(jié)構(gòu)(參見例如格魯貝爾(Gruber)等人,2008,《核酸研究》(NucleicAcidsResearch),36:W70)。分析揭示到在大多數(shù)情況下,在嵌合的crRNA背景下有效的指導(dǎo)序列基本上不含二級結(jié)構(gòu)基序,而無效的指導(dǎo)序列更可能形成可以阻止與靶原型間隔子DNA進(jìn)行堿基配對的內(nèi)部二級結(jié)構(gòu)。因此,可能的是,當(dāng)使用嵌合的crRNA時(shí),間隔子二級結(jié)構(gòu)的變異性可能影響CRISPR介導(dǎo)的干擾的效率。SpCas9的另外的載體設(shè)計(jì)顯示于圖22中,示出了摻入連接到指導(dǎo)寡核苷酸的插入位點(diǎn)的U6啟動子和連接到SpCas9編碼序列上的Cbh啟動子的單個(gè)表達(dá)載體。顯示于圖22b中的載體包括一個(gè)連接到H1啟動子上的tracrRNA編碼序列。在細(xì)菌測定中,所有的間隔子均促進(jìn)有效的CRISPR干擾(圖3C)。這些結(jié)果表明,可能存在影響哺乳動物細(xì)胞中的CRISPR活性效率的另外的因素。為了研究CRISPR介導(dǎo)的切割的特異性,使用一系列具有單點(diǎn)突變的EMX1-靶向嵌合的crRNA分析指導(dǎo)序列中的單核苷酸突變對哺乳動物基因組中的原型間隔子切割的影響(圖3A)。圖3B示出了比較當(dāng)與不同突變的嵌合的RNA配對時(shí)Cas9的切割效率的Surveyor核酸酶測定的結(jié)果。PAM的5’的高達(dá)12-bp的單堿基錯(cuò)配基本上消除了由SpCas9進(jìn)行的基因組切割,而在離上游位置更遠(yuǎn)處具有突變的間隔子保留針對原始原型間隔子靶標(biāo)的活性(圖3B)。除PAM之外,SpCas9在間隔子的最后12-bp內(nèi)具有單堿基特異性。此外,CRISPR能夠像一對靶向同一EMX1原型間隔子的TALE核酸酶(TALEN)一樣有效地介導(dǎo)基因組切割。圖3C提供了一個(gè)示意圖,顯示了靶向EMX1的TALEN的設(shè)計(jì)并且圖3D顯示了比較TALEN和Cas9的效率的Surveyor凝膠(n=3)。已經(jīng)通過易錯(cuò)NHEJ機(jī)制建立了一套用于在哺乳動物細(xì)胞中實(shí)現(xiàn)CRISPR介導(dǎo)的基因編輯的組分,測試CRISPR刺激同源重組(HR)的能力,同源重組是一種用于使得基因組中的編輯精確的高保真基因修復(fù)途徑。野生型SpCas9能夠介導(dǎo)位點(diǎn)特異的DSB,這些DSB可以通過NHEJ和HR兩者進(jìn)行修復(fù)。另外,將SpCas9的RuvCI催化結(jié)構(gòu)域中的天冬氨酸至丙氨酸取代(D10A)工程化,以將核酸酶轉(zhuǎn)化為切口酶(SpCas9n;示于圖4A中)(參見例如薩普拉諾薩克斯(Sapranausaks)等人,2011,《核酸研究》(NucleicAcidsResearch),39:9275;加索納斯(Gasiunas)等人,2012,《美國國家科學(xué)院院刊》(Proc.Natl.Acad.Sci.USA),109:E2579),這樣使得帶切口的基因組DNA經(jīng)歷高保真同源定向修復(fù)(HDR)。Surveyor測定確認(rèn)到,SpCas9n在EMX1原型間隔子靶標(biāo)處不產(chǎn)生indel。如圖4B所示,EMX1-靶向嵌合的crRNA與SpCas9的共表達(dá)在靶位點(diǎn)中產(chǎn)生indel,而與SpCas9n的共表達(dá)不產(chǎn)生indel(n=3)。此外,327個(gè)擴(kuò)增子的測序未檢測到由SpCas9n誘導(dǎo)的任何indel。選擇相同的座位,以通過用靶向EMX1、hSpCas9或hSpCas9n的嵌合RNA以及用于在原型間隔子附近引入一對限制酶切位點(diǎn)(HindIII和NheI)的HR模板共轉(zhuǎn)染HEK293FT細(xì)胞而測試CRISPR介導(dǎo)的HR。圖4C提供了HR策略的示意圖,包含重組點(diǎn)的相對位置和引物退火序列(箭頭)。SpCas9和SpCas9n的確催化將HR模板整合進(jìn)EMX1座位中。PCR擴(kuò)增靶區(qū)域,隨后用HindIII進(jìn)行限制酶切消化揭示了對應(yīng)于期望片段尺寸的切割產(chǎn)物(顯示于圖4D中的限制性片段長度多態(tài)性分析中的箭頭),其中SpCas9和SpCas9n介導(dǎo)類似水平的HR效率。申請人使用基因組擴(kuò)增子的桑格測序進(jìn)一步證實(shí)了HR(圖4E)。這些結(jié)果證明了CRISPR促進(jìn)哺乳動物基因組中的靶向基因插入的實(shí)用性。鑒于14-bp(來自間隔子的12-bp和來自PAM的2-bp)特異地靶向野生型SpCas9,切口酶的可獲得性可以顯著減少脫靶修飾的可能性,因?yàn)閱捂湐嗔巡皇且族e(cuò)NHEJ途徑的底物。構(gòu)建模擬具有陣列的間隔子的CRISPR座位的天然構(gòu)造的表達(dá)構(gòu)建體(圖2A),以測試多元序列靶向的可能性。使用編碼一對EMX1-和PVALB-靶向間隔子的單CRISPR陣列,在兩個(gè)座位處都檢測到了有效的切割(圖4F,顯示了crRNA陣列的示意設(shè)計(jì)和顯示出切割的有效修飾的Surveyor印跡兩者)。使用針對由119bp間隔開的EMX1內(nèi)的兩個(gè)靶標(biāo)的間隔子通過共存DSB還檢測到了較大基因組區(qū)的靶向缺失,并且檢測到了1.6%缺失效率(182個(gè)擴(kuò)增子中的3個(gè);圖4G)。這證明,CRISPR系統(tǒng)可以介導(dǎo)單個(gè)基因組中的多元編輯。實(shí)例2:CRISPR系統(tǒng)修飾和替代方案使用RNA編程序列特異的DNA切割的能力定義了一個(gè)新類別的針對多種研究和工業(yè)應(yīng)用的基因組工程化工具??梢赃M(jìn)一步改善CRISPR系統(tǒng)的若干方面,以增加CRISPR靶向的效率和通用性。優(yōu)化的Cas9活性可以依賴于處于比存在于哺乳動物細(xì)胞核中的游離Mg2+高的水平的游離Mg2+的可獲得性(參見例如季聶克(Jinek)等人,2012,《科學(xué)》(Science),337:816),并且對恰好位于原型間隔子的下游的NGG基序的偏好限制靶向人類基因組中的平均每12-bp的能力(圖9,評價(jià)了人類染色體序列的正鏈和負(fù)鏈兩者)。這些約束中的一些可以通過探索CRISPR座位跨微生物宏基因組的多樣性而克服(參見例如馬卡洛娃(Makarova)等人,2011,《自然微生物學(xué)綜述》(NatRevMicrobiol),9:467)。可以通過類似于實(shí)例1中描述的方法將其他CRISPR座位移植進(jìn)哺乳動物細(xì)胞環(huán)境中。例如,圖10示出了來自嗜熱鏈球菌LMD-9的CRISPR1的用于在哺乳動物細(xì)胞中進(jìn)行異源表達(dá)的II型CRISPR系統(tǒng)的適應(yīng),以實(shí)現(xiàn)CRISPR介導(dǎo)的基因組編輯。圖10A提供了來自嗜熱鏈球菌LMD-9的CRISPR1的示意圖。圖10B示出了嗜熱鏈球菌CRISPR系統(tǒng)的表達(dá)系統(tǒng)的設(shè)計(jì)。使用組成型EF1α啟動子表達(dá)人類密碼子優(yōu)化的hStCas9。使用促進(jìn)轉(zhuǎn)錄精確起始的U6啟動子表達(dá)tracrRNA和crRNA的成熟版本。示出了來自成熟crRNA和tracrRNA的序列。crRNA序列中的由小寫字母“a”指示的單個(gè)堿基用于除去作為RNApolIII轉(zhuǎn)錄終止子的polyU序列。圖10C提供了一個(gè)示意圖,顯示了靶向人EMX1座位的指導(dǎo)序列。圖10D顯示了使用Surveyor測定的靶座位中的hStCas9介導(dǎo)的切割的結(jié)果。RNA指導(dǎo)間隔子1和2分別誘導(dǎo)了14%和6.4%。在這兩個(gè)原型間隔子位點(diǎn)處跨生物復(fù)制物的切割活性的統(tǒng)計(jì)分析還提供于圖5中的。圖14提供了嗜熱鏈球菌CRISPR系統(tǒng)的另外的原型間隔子和在人EMX1座位中的對應(yīng)的PAM序列靶標(biāo)示意圖。兩個(gè)原型間隔子序列被凸顯并且通過相對于對應(yīng)的凸顯序列為3’加下劃線而指示滿足NNAGAAW基序的對應(yīng)的PAM序列。兩個(gè)原型間隔子均靶向反義鏈。實(shí)例3:樣品靶序列選擇算法設(shè)計(jì)一個(gè)軟件程序,以基于指定的CRISPR酶的希望的指導(dǎo)序列長度和CRISPR基序序列(PAM),在輸入DNA序列的兩條鏈上鑒定候選CRISPR靶序列。例如,可以通過在輸入序列和該輸入序列的反向互補(bǔ)體兩者上檢索5’-Nx-NGG-3’而鑒定來自化膿鏈球菌的Cas9的具有PAM序列NGG的靶位點(diǎn)。同樣地,可以通過在輸入序列和該輸入序列的反向互補(bǔ)體兩者上檢索5’-Nx-NNAGAAW-3’而鑒定化膿鏈球菌CRISPR1的Cas9的具有PAM序列NNAGAAW的靶位點(diǎn)。同樣地,可以通過在輸入序列和該輸入序列的反向互補(bǔ)體兩者上檢索5’-Nx-NGGNG-3’而鑒定化膿鏈球菌CRISPR3的Cas9的具有PAM序列NGGNG的靶位點(diǎn)??梢酝ㄟ^程序固定或由使用者指定Nx中的值“x”,如20。由于在DNA靶位點(diǎn)的基因組中出現(xiàn)多次可以導(dǎo)致非特異的基因組編輯,因此在鑒定所有潛在的位點(diǎn)后,基于序列在相關(guān)參比基因組中出現(xiàn)的次數(shù),該程序?qū)⑵錇V出。對于其序列特異性是通過‘種子(seed)’序列(如來自PAM序列的11-12bp5’,包括PAM序列本身)確定的那些CRISPR酶,過濾步驟可以基于該種子序列。因此,為了避免另外的基因組座位處的編輯,基于種子:PAM序列在相關(guān)基因組中出現(xiàn)的次數(shù)過濾結(jié)果??梢栽试S使用者選擇種子序列的長度。處于通過過濾器的目的,還可以允許使用者指定種子:PAM序列在基因組中出現(xiàn)的次數(shù)。默認(rèn)篩選獨(dú)特序列。通過改變種子序列的長度和該序列在基因組中出現(xiàn)的次數(shù)兩者而改變過濾水平。該程序可以另外或可替代地通過提供鑒定的一個(gè)或多個(gè)靶序列的反向互補(bǔ)體而提供與報(bào)告的一個(gè)或多個(gè)靶序列互補(bǔ)的指導(dǎo)序列的序列。一些靶位點(diǎn)在人類基因組中的示例性可視化提供于圖18中。用于優(yōu)化序列選擇的方法和算法的另外的細(xì)節(jié)可以發(fā)現(xiàn)于通過引用結(jié)合在此的美國申請序列號61/064,798(代理人案號44790.11.2022;博德參考號BI-2012/084)中。實(shí)例4:多種嵌合的crRNA-tracrRNA雜交體的評價(jià)此實(shí)例描述了針對具有摻入不同長度的野生型tracrRNA序列的tracr序列的嵌合的RNA(chiRNAs;在單個(gè)轉(zhuǎn)錄本中包括指導(dǎo)序列、tracr配對序列以及tracr序列)而獲得的結(jié)果。圖16a示出了嵌合RNA和Cas9的雙順反子表達(dá)載體的示意圖。Cas9由CBh啟動子驅(qū)動并且嵌合的RNA由U6啟動子驅(qū)動。嵌合的指導(dǎo)RNA由接合到tracr序列的20bp指導(dǎo)序列(N)組成(從下鏈的第一個(gè)“U”到該轉(zhuǎn)錄本的結(jié)尾),其在如指示的各點(diǎn)被截短。指導(dǎo)和tracr序列由tracr-配對序列GUUUUAGAGCUA(SEQIDNO:13),隨后是環(huán)序列GAAA隔開。人EMX1和PVALB座位處的Cas9介導(dǎo)的indel的SURVEYOR測定的結(jié)果分別示于圖16b和16c中。箭頭指示預(yù)期的SURVEYOR片段。ChiRNA由其“+n”標(biāo)志指示,并且crRNA是指指導(dǎo)和tracr序列被表達(dá)為分開的轉(zhuǎn)錄本的雜交體RNA。一式三份地進(jìn)行的這些結(jié)果的定量示于圖17a和17b的直方圖中,分別對應(yīng)于圖16b和16c(“N.D.”指示未檢測到indel)。原型間隔子ID及其對應(yīng)的基因組靶標(biāo)、原型間隔子、PAM序列以及鏈位置提供于表D中。將指導(dǎo)序列設(shè)計(jì)成與整個(gè)原型間隔子序列互補(bǔ)(在雜交體系統(tǒng)中的分開的轉(zhuǎn)錄本的情況下),或僅為部分加下劃線(在嵌合的RNA的情況下)。表D:用于優(yōu)化指導(dǎo)序列的另外的細(xì)節(jié)可以發(fā)現(xiàn)于通過引用結(jié)合在此的美國申請序列號61/836,127(代理人案號44790.08.2022;博德參考號BI-2013/004G)中。初始,靶向人HEK293FT細(xì)胞中的EMX1座位內(nèi)的三個(gè)位點(diǎn)。使用SURVEYOR核酸酶測定評估每種chiRNA的基因組修飾效率,該測定檢測由DNA雙鏈斷裂(DSB)及其通過非同源末端連接(NHEJ)DNA損傷修復(fù)途徑進(jìn)行的隨后修復(fù)造成的突變。被指定為chiRNA(+n)的構(gòu)建體指示,野生型tracrRNA的直達(dá)第+n個(gè)核苷酸被包括在嵌合的RNA構(gòu)建體中,其中48、54、67和85的值用于n。嵌合的RNA在所有三個(gè)EMX1靶位點(diǎn)處都包含長片段的野生型tracrRNA(chiRNA(+67)和chiRNA(+85))介導(dǎo)的DNA切割,其中chiRNA(+85)尤其展示出比以分開的轉(zhuǎn)錄本形式表達(dá)指導(dǎo)序列和tracr序列的對應(yīng)的crRNA/tracrRNA雜交體顯著更高水平的DNA切割(圖16b和17a)。還使用chiRNA靶向PVALB座位中的兩個(gè)位點(diǎn),其不產(chǎn)生使用雜交體系統(tǒng)(作為分開的轉(zhuǎn)錄本而表達(dá)的指導(dǎo)序列和tracr序列)的可檢測的切割。chiRNA(+67)和chiRNA(+85)能夠在兩個(gè)PVALB原型間隔子處介導(dǎo)顯著的切割(圖16c和17b)。對于EMX1和PVALB座位中的所有五個(gè)靶標(biāo),伴隨增加的tracr序列長度觀察到一致增加的基因組修飾效率。不希望受任何理論的束縛,由tracrRNA的3’端形成的二級結(jié)構(gòu)可以在增強(qiáng)CRISPR復(fù)合物形成率方面發(fā)揮一定作用。實(shí)例5:Cas9多樣性CRISPR-Cas系統(tǒng)是一種由跨細(xì)菌和古生菌的相異物種利用的針對侵入型外源DNA的獲得性免疫機(jī)制。II型CRISPR-Cas9系統(tǒng)由一套編碼負(fù)責(zé)將外源DNA“捕獲(acquisition)”進(jìn)CRISPR座位中的蛋白質(zhì)的基因以及一套編碼負(fù)責(zé)“執(zhí)行(execution)”DNA切割機(jī)制的蛋白質(zhì)的基因組成;這些包括DNA核酸酶(Cas9)、非編碼反式激活cr-RNA(tracrRNA)以及側(cè)翼為同向重復(fù)的外源DNA衍生的間隔子陣列(crRNA)。當(dāng)被Cas9成熟后,tracRNA和crRNA雙鏈體指導(dǎo)Cas9核酸酶到由間隔子指導(dǎo)序列規(guī)定的靶DNA序列,并且在靶DNA中介導(dǎo)短序列基序附近的DNA中的雙鏈斷裂,該導(dǎo)短序列基序?yàn)榍懈钏璨⑶覍τ诿糠NCRISPR-Cas系統(tǒng)而言是特異的。II型CRISPR-Cas系統(tǒng)發(fā)現(xiàn)在整個(gè)細(xì)菌界中并且在用于靶標(biāo)切割的Cas9蛋白序列和尺寸、tracrRNA和crRNA同向重復(fù)序列、這些元件的基因組組織以及基序要求方面高度相異。一個(gè)物種可以具有多種相異的CRISPR-Cas系統(tǒng)。申請人評價(jià)了來自基于與已知Cas9的序列同源性和與已知亞結(jié)構(gòu)域直向同源的結(jié)構(gòu)鑒定的細(xì)菌種類的207個(gè)假定的Cas9,這些亞結(jié)構(gòu)域包括HNH內(nèi)切核酸酶結(jié)構(gòu)域和RuvC內(nèi)切核酸酶結(jié)構(gòu)域[信息來自尤金庫寧(EugeneKoonin)和基拉馬卡洛娃(KiraMakarova)]?;诖颂椎牡鞍踪|(zhì)序列保守的系統(tǒng)發(fā)生分析揭示了五個(gè)Cas9家族,包括三組大的Cas9(~1400個(gè)氨基酸)和兩組小的Cas9(~1100個(gè)氨基酸)(參見圖19和20A-F)。Cas9和Cas9酶轉(zhuǎn)化為切口酶或DNA結(jié)合蛋白的突變及其具有的改變的功能性的用途的另外的細(xì)節(jié)可以發(fā)現(xiàn)于通過引用結(jié)合在此的美國申請序列號61/836,101和61/835,936(代理人案號分別為44790.09.2022和4790.07.2022并且博德參考號分別為BI-2013/004E和BI-2013/004F)中。實(shí)例6:Cas9直向同源物申請人分析了Cas9直向同源物,以鑒定相關(guān)的PAM序列和對應(yīng)的嵌合的指導(dǎo)RNA。具有一套展開的PAM提供了跨基因組的更廣泛的靶向并且還顯著增加獨(dú)特靶位點(diǎn)的數(shù)目并且提供了在基因組中鑒定具有增加水平的特異性的新穎的Cas9的潛力??梢酝ㄟ^測試每種Cas9容忍指導(dǎo)RNA及其DNA靶標(biāo)之間的錯(cuò)配的能力評價(jià)Cas9直向同源物的特異性。例如,已經(jīng)通過測試指導(dǎo)RNA中的突變對切割效率的影響表征了SpCas9的特異性。用指導(dǎo)序列與靶DNA之間的單個(gè)或多個(gè)錯(cuò)配建立指導(dǎo)RNA文庫。基于這些發(fā)現(xiàn),可以基于以下準(zhǔn)則選擇SpCas9的靶位點(diǎn):為了最大化SpCas9編輯具體基因的特異性,應(yīng)該在感興趣的座位內(nèi)選擇一個(gè)靶位點(diǎn),這樣使得潛在的‘脫靶’基因組序列遵守以下四個(gè)約束:首先,它們的后面不應(yīng)該是具有的5’-NGG或NAG序列的PAM。其次,它們與靶序列的整體序列相似性應(yīng)該是最小化的。第三,最大數(shù)目的錯(cuò)配應(yīng)該位于脫靶位點(diǎn)的PAM-近側(cè)區(qū)內(nèi)。最后,最大數(shù)目的錯(cuò)配應(yīng)該是連續(xù)的或由少于四個(gè)堿基隔開??梢允褂妙愃频姆椒ㄔu價(jià)其他Cas9直向同源物的特異性和建立在靶標(biāo)種類的基因組內(nèi)選擇特定靶位點(diǎn)的標(biāo)準(zhǔn)。如前所述,基于此套的蛋白質(zhì)序列保守的系統(tǒng)發(fā)生分析揭示了五個(gè)Cas9家族,包括三組大的Cas9(~1400個(gè)氨基酸)和兩組小的Cas9(~1100個(gè)氨基酸)(參見圖19和20A-F)。Cas直向同源物的另外的細(xì)節(jié)可以發(fā)現(xiàn)于通過引用結(jié)合在此的美國申請序列號61/836,101和61/835,936(代理人案號分別為44790.09.2022和4790.07.2022并且博德參考號分別為BI-2013/004E和BI-2013/004F)中。實(shí)例7:使用Cas9靶向并操縱植物基因而對植物(微藻)進(jìn)行工程化遞送Cas9的方法方法1:申請人使用在組成型啟動子(如Hsp70A-RbcS2或β2-微管蛋白)的控制之下表達(dá)Cas9的載體遞送Cas9和指導(dǎo)RNA。方法2:申請人使用在組成型啟動子(如Hsp70A-RbcS2或β2-微管蛋白)的控制之下表達(dá)Cas9和T7聚合酶的載體遞送Cas9和T7聚合酶。將使用包含驅(qū)動指導(dǎo)RNA的T7啟動子的載體遞送該指導(dǎo)RNA。方法3:申請人將Cas9mRNA和體外轉(zhuǎn)錄的指導(dǎo)RNA遞送到藻類細(xì)胞中。RNA可以在體外轉(zhuǎn)錄。Cas9mRNA將由Cas9的編碼區(qū)以及來自的Cop1的3’UTR組成,以保證Cas9mRNA的穩(wěn)定。用于同源重組,申請人提供了一個(gè)另外的同源定向修復(fù)模板。在位于Cop1的3’UTR之后的β-2微管蛋白啟動子的控制之下驅(qū)動Cas9的表達(dá)的盒的序列。TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT(SEQIDNO:19)在位于Cop1的3’UTR之后的β-2微管蛋白啟動子的控制之下驅(qū)動T7聚合酶的表達(dá)的盒的序列:TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACatgcctaagaagaagaggaaggttaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgacaaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtacgattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaaGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT(SEQIDNO:20)由T7啟動子驅(qū)動的指導(dǎo)RNA的序列(T7啟動子,N表示靶向序列):gaaatTAATACGACTCACTATANNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt(SEQIDNO:21)基因遞送:來自衣藻資源中心(ChlamydomonasResourceCenter)的萊茵衣藻株CC-124和CC-125將被用于電穿孔。電穿孔方案遵循來自GeneArtChlamydomonasEngineering試劑盒的標(biāo)準(zhǔn)推薦方案。而且,申請人產(chǎn)生組成性地表達(dá)Cas9的萊茵衣藻系。這可以通過使用pChlamy1(使用PvuI線性化)并選擇潮霉素抗性菌落而完成。以下是包含Cas9的pChlamy1的序列。以此方式實(shí)現(xiàn)基因敲除,簡單地需要遞送指導(dǎo)RNA的RNA。對于同源重組,申請人遞送了指導(dǎo)RNA以及線性化同源重組模板。pChlamy1-Cas9:TGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGTTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGTCGCTGAGGCTTGACATGATTGGTGCGTATGTTTGTATGAAGCTACAGGACTGATTTGGCGGGCTATGAGGGCGGGGGAAGCTCTGGAAGGGCCGCGATGGGGCGCGCGGCGTCCAGAAGGCGCCATACGGCCCGCTGGCGGCACCCATCCGGTATAAAAGCCCGCGACCCCGAACGGTGACCTCCACTTTCAGCGACAAACGAGCACTTATACATACGCGACTATTCTGCCGCTATACATAACCACTCAGCTAGCTTAAGATCCCATCAAGCTTGCATGCCGGGCGCGCCAGAAGGAGCGCAGCCAAACCAGGATGATGTTTGATGGGGTATTTGAGCACTTGCAACCCTTATCCGGAAGCCCCCTGGCCCACAAAGGCTAGGCGCCAATGCAAGCAGTTCGCATGCAGCCCCTGGAGCGGTGCCCTCCTGATAAACCGGCCAGGGGGCCTATGTTCTTTACTTTTTTACAAGAGAAGTCACTCAACATCTTAAAATGGCCAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGGAGATTCGAGGTACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAACATATGATTCGAATGTCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGACACAAGAATCCCTGTTACTTCTCGACCGTATTGATTCGGATGATTCCTACGCGAGCCTGCGGAACGACCAGGAATTCTGGGAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGCCGCTGGCCCGCCGAGCCCTGGAGGAGCTCGGGCTGCCGGTGCCGCCGGTGCTGCGGGTGCCCGGCGAGAGCACCAACCCCGTACTGGTCGGCGAGCCCGGCCCGGTGATCAAGCTGTTCGGCGAGCACTGGTGCGGTCCGGAGAGCCTCGCGTCGGAGTCGGAGGCGTACGCGGTCCTGGCGGACGCCCCGGTGCCGGTGCCCCGCCTCCTCGGCCGCGGCGAGCTGCGGCCCGGCACCGGAGCCTGGCCGTGGCCCTACCTGGTGATGAGCCGGATGACCGGCACCACCTGGCGGTCCGCGATGGACGGCACGACCGACCGGAACGCGCTGCTCGCCCTGGCCCGCGAACTCGGCCGGGTGCTCGGCCGGCTGCACAGGGTGCCGCTGACCGGGAACACCGTGCTCACCCCCCATTCCGAGGTCTTCCCGGAACTGCTGCGGGAACGCCGCGCGGCGACCGTCGAGGACCACCGCGGGTGGGGCTACCTCTCGCCCCGGCTGCTGGACCGCCTGGAGGACTGGCTGCCGGACGTGGACACGCTGCTGGCCGGCCGCGAACCCCGGTTCGTCCACGGCGACCTGCACGGGACCAACATCTTCGTGGACCTGGCCGCGACCGAGGTCACCGGGATCGTCGACTTCACCGACGTCTATGCGGGAGACTCCCGCTACAGCCTGGTGCAACTGCATCTCAACGCCTTCCGGGGCGACCGCGAGATCCTGGCCGCGCTGCTCGACGGGGCGCAGTGGAAGCGGACCGAGGACTTCGCCCGCGAACTGCTCGCCTTCACCTTCCTGCACGACTTCGAGGTGTTCGAGGAGACCCCGCTGGATCTCTCCGGCTTCACCGATCCGGAGGAACTGGCGCAGTTCCTCTGGGGGCCGCCGGACACCGCCCCCGGCGCCTGATAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT(SEQIDNO:22)。對于所有修飾的萊茵衣藻細(xì)胞而言,申請人使用了PCR、SURVEYOR核酸酶測定和DNA測序,以驗(yàn)證成功的修飾。雖然已經(jīng)在此示出并描述了本發(fā)明的優(yōu)選實(shí)施例,但是對本領(lǐng)域的普通技術(shù)人員而言應(yīng)該顯而易見是這樣的實(shí)施例僅以舉例方式提供。在不偏離本發(fā)明的情況下眾多變化、改變和取代現(xiàn)在將被本領(lǐng)域的普通技術(shù)人員想到。應(yīng)該理解的是,在實(shí)踐本發(fā)明中可以采用在此描述的本發(fā)明的實(shí)施例的不同替代方案。旨在按照以下權(quán)利要求限定本發(fā)明的范圍,并且在這些權(quán)利要求范圍內(nèi)的方法和結(jié)構(gòu)及其等同物也包括在本發(fā)明的范圍內(nèi)。參考文獻(xiàn):1.烏爾諾夫,F(xiàn).D.(Urnov,F(xiàn).D.)、雷巴爾,E.J.(Rebar,E.J.)、福爾摩斯,M.C.(Holmes,M.C.)、張,H.S.(Zhang,H.S.)&格雷戈里,P.D.(Gregory,P.D.)用工程化的鋅指核酸酶進(jìn)行的基因組編輯(Genomeeditingwithengineeredzincfingernucleases).《遺傳學(xué)自然評論》(NatRevGenet.)11,636-646(2010)。2.博格丹奧韋(Bogdanove),A.J.&沃伊塔斯(Voytas),D.F.TAL效應(yīng)物:用于DNA靶向的可定制蛋白(TALeffectors:customizableproteinsforDNAtargeting).《科學(xué)》(Science)333,1843-1846(2011)。3.斯托達(dá)德(Stoddard),B.L.復(fù)位內(nèi)切核酸酶結(jié)構(gòu)以及功能(Homingendonucleasestructureandfunction).生物物理學(xué)季評(Q.Rev.Biophys.)38,49-95(2005)。4.貝(Bae),T.&施內(nèi)溫德(Schneewind),O.用可誘導(dǎo)的逆篩選在金黃色葡萄球菌中進(jìn)行的等位基因置換(AllelicreplacementinStaphylococcusaureuswithinduciblecounter-selection).質(zhì)粒(Plasmid)55,58-63(2006)。5.孫(Sun)g,C.K.,Li,H.,克拉維瑞斯(Claverys),J.P.&莫里森(Morrison),D.A.一種rpsL盒,janus,用于通過陰性篩選在肺炎鏈球菌中進(jìn)行基因置換(AnrpsLcassette,janus,forgenereplacementthroughnegativeselectioninStreptococcuspneumoniae).應(yīng)用與環(huán)境微生物學(xué)(Appl.Environ.Microbiol).67,5190-5196(2001)。6.沙蘭(Sharan),S.K.,托馬森(Thomason),L.C.,庫茲涅佐夫(Kuznetsov),S.G.&考特(Court),D.L.重組工程:基于同源重組的基因工程方法(Recombineering:ahomologousrecombination-basedmethodofgeneticengineering).《自然方案》(Nat.Protoc.)4,206-223(2009)。7.季聶克(Jinek),M.等人在自適應(yīng)細(xì)菌免疫中的可編程雙重-RNA-引導(dǎo)DNA核酸內(nèi)切酶(Aprogrammabledual-RNA-guidedDNAendonucleaseinadaptivebacterialimmunity).《科學(xué)》(Science)337,816-821(2012)。8.Deveau,H.,Garneau,J.E.&莫萬諾(Moineau),S.CRISPR/Cas系統(tǒng)及其在噬菌體-細(xì)菌相互作用中的角色(CRISPR/Cassystemanditsroleinphage-bacteriainteractions).微生物學(xué)年鑒(Annu.Rev.Microbiol.)64,475-493(2010)。9.霍瓦特(Horvath),P.&巴爾朗勾(Barrangou),R.CRISPR/Cas,細(xì)菌和古細(xì)菌的免疫系統(tǒng)(CRISPR/Cas,theimmunesystemofbacteriaandarchaea).《科學(xué)》(Science)327,167-170(2010)。10.特恩斯(Terns),M.P.&特恩斯(Terns),R.M.基于CRISPR的適應(yīng)性免疫系統(tǒng)(CRISPR-basedadaptiveimmunesystems).微生物學(xué)現(xiàn)行觀點(diǎn)(Curr.Opin.Microbiol.)14,321-327(2011)。11.范德奧斯特,J.(vanderOost,J.),捷雷,M.M.(Jore,M.M.),韋斯特拉,E.R.(Westra,E.R.)倫德格倫,M.(Lundgren,M.)&布龍斯,S.J.(Brouns,S.J.)在原核生物中基于CRISPR的適應(yīng)性以及可繼承免疫(CRISPR-basedadaptiveandheritableimmunityinprokaryotes).《生物化學(xué)科學(xué)趨勢》(Trends.Biochem.Sci.)34,401-407(2009)。12.布龍斯,S.J.(Brouns,S.J.)等人在原核生物中小CRISPRRNA引導(dǎo)抗病毒防御(SmallCRISPRRNAsguideantiviraldefenseinprokaryotes).《科學(xué)》(Science)321,960-964(2008)。13.卡特,J.(Carte,J.),王,R.(Wang,R.),李,H.(Li,H.),特恩斯,R.M.(Terns,R.M.)&特恩斯,M.P.(Terns,M.P.)Cas6是在原核生物中產(chǎn)生引導(dǎo)RNA用于入侵物防御的內(nèi)切核糖核酸酶(Cas6isanendoribonucleasethatgeneratesguideRNAsforinvaderdefenseinprokaryotes).《基因與發(fā)育》(GenesDev.)22,3489-3496(2008)。14.德爾特科娃,E.(Deltcheva,E.)等人通過反式編碼的小RNA和宿主因子RNA酶III熟化CRISPRRNA(CRISPRRNAmaturationbytrans-encodedsmallRNAandhostfactorRNaseIII).《自然》(Nature)471,602-607(2011)。15.哈托姆-阿斯蘭,A.(Hatoum-Aslan,A.),曼伊夫,I.(Maniv,I.)&馬拉菲尼,L.A.(Marraffini,L.A.)成熟成簇的、整齊間隔的、短回文重復(fù)RNA(crRNA)長度是通過在前體加工位點(diǎn)錨定的標(biāo)尺機(jī)構(gòu)測量的(Matureclustered,regularlyinterspaced,shortpalindromicrepeatsRNA(crRNA)lengthismeasuredbyarulermechanismanchoredattheprecursorprocessingsite).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)108,21218-21222(2011)。16.華維茨,R.E.(Haurwitz,R.E.),吉耐克,M.(Jinek,M.),威登赫夫特,B.(Wiedenheft,B.),周,K.(Zhou,K.)&杜德那,J.A.(Doudna,J.A.)通過CRISPR內(nèi)切核酸酶進(jìn)行序列-以及結(jié)構(gòu)-特異性RNA加工(Sequence-andstructure-specificRNAprocessingbyaCRISPRendonuclease).《科學(xué)》(Science)329,1355-1358(2010)。17.德沃,H.(Deveau,H.)等人在嗜熱鏈球菌中對CRISPR編碼的抗性的噬菌體響應(yīng)(PhageresponsetoCRISPR-encodedresistanceinStreptococcusthermophilus).《細(xì)菌學(xué)雜志》(J.Bacteriol.)190,1390-1400(2008)。18.加斯諾斯,G.(Gasiunas,G.)、巴郎鎬,R.(Barrangou,R.)、霍瓦特,P.(Horvath,P.)&西克斯尼斯(Siksnys,V.)Cas9-crRNA核糖核蛋白復(fù)合體在細(xì)菌中針對獲得性免疫介導(dǎo)特異的DNA切割(Cas9-crRNAribonucleoproteincomplexmediatesspecificDNAcleavageforadaptiveimmunityinbacteria).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)(2012)。19.馬卡洛娃,K.S.(Makarova,K.S.),阿韋德,L.(Aravind,L.),沃爾夫,Y.I.(Wolf,Y.I.)&庫寧,E.V.(Koonin,E.V.)Cas蛋白家族的統(tǒng)一以及CRISPR-Cas系統(tǒng)的起源和進(jìn)化的簡單情境(UnificationofCasproteinfamiliesandasimplescenariofortheoriginandevolutionofCRISPR-Cassystems).《生物定向》(Biol.Direct.)6,38(2011)。20.巴爾朗勾,R.(Barrangou,R.)RNA介導(dǎo)的可編程DNA切割(RNA-mediatedprogrammableDNAcleavage).《自然生物技術(shù)》(Nat.Biotechnol.)30,836-838(2012)。21.布龍斯,S.J.(Brouns,S.J.)《分子生物學(xué)》(Molecularbiology).免疫的瑞士軍刀(ASwissarmyknifeofimmunity).《科學(xué)》(Science)337,808-809(2012)。22.卡羅爾,D.(Carroll,D.)基因靶向的一種CRISPR途徑(ACRISPRApproachtoGeneTargeting).《分子療法》(Mol.Ther.)20,1658-1660(2012)。23.必考爾德,D.(Bikard,D.),哈托姆-阿斯蘭,A.(Hatoum-Aslan,A.),穆奇達(dá),D.(Mucida,D.)&馬拉菲尼,L.A.(Marraffini,L.A.)CRISPR干擾可防止在體內(nèi)細(xì)菌感染過程中的天然轉(zhuǎn)化和毒力獲取(CRISPRinterferencecanpreventnaturaltransformationandvirulenceacquisitionduringinvivobacterialinfection).《細(xì)胞宿主微生物》(CellHostMicrobe)12,177-186(2012)。24.薩普拉諾斯卡斯(Sapranauskas,R.)等人嗜熱鏈球菌CRISPR/Cas系統(tǒng)在大腸桿菌中提供免疫力(TheStreptococcusthermophilusCRISPR-CassystemprovidesimmunityinEscherichiacoli).《核酸研究》(NucleicAcidsRes.)(2011)。25.塞梅諾娃,E.(Semenova,E.)等人.規(guī)律間隔成簇短回文重復(fù)序列(CRISPR)RNA是通過種子序列給出的(Interferencebyclusteredregularlyinterspacedshortpalindromicrepeat(CRISPR)RNAisgovernedbyaseedsequence).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)(2011)。26.威登赫夫特,B.(Wiedenheft,B.)等人.來自細(xì)菌性免疫系統(tǒng)的RNA引導(dǎo)復(fù)合體通過種子序列相互作用增強(qiáng)靶識別(RNA-guidedcomplexfromabacterialimmunesystemenhancestargetrecognitionthroughseedsequenceinteractions).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)(2011)。27.扎娜,D.(Zahner,D.)&哈肯貝克,R.(Hakenbeck,R.)肺炎鏈球菌β-半乳糖苷酶是一種表面蛋白(TheStreptococcuspneumoniaebeta-galactosidaseisasurfaceprotein).《細(xì)菌學(xué)雜志》(J.Bacteriol.)182,5919-5921(2000)。28.馬拉菲尼,L.A.(Marraffini,L.A.),迪登特,A.C.(Dedent,A.C.)&施內(nèi)溫德,O.(Schneewind,O.)將蛋白錨定到革蘭氏陽性菌的被膜的分選酶和技術(shù)(Sortasesandtheartofanchoringproteinstotheenvelopesofgram-positivebacteria).《微生物學(xué)與分子生物學(xué)綜述》(Microbiol.Mol.Biol.Rev.)70,192-221(2006)。29.莫塔梅迪,M.R.(Motamedi,M.R.),茲格提,S.K.(Szigety,S.K.)&羅森伯格,S.M.(Rosenberg,S.M.)大腸桿菌中的雙鏈斷裂修復(fù)重組:體內(nèi)DNA復(fù)制機(jī)制的物理證據(jù)(Double-strand-breakrepairrecombinationinEscherichiacoli:physicalevidenceforaDNAreplicationmechanisminvivo).《基因與發(fā)育》(GenesDev).13,2889-2903(1999)。30.霍薩卡,T.(Hosaka,T.)等人核糖體蛋白S12中的新穎突變K87E在大腸桿菌的后期生長階段過程中增強(qiáng)蛋白合成活性(ThenovelmutationK87EinribosomalproteinS12enhancesproteinsynthesisactivityduringthelategrowthphaseinEscherichiacoli).《分子遺傳學(xué)基因組學(xué)》(Mol.Genet.Genomics)271,317-324(2004)。31.科斯坦蒂諾,N.(Costantino,N.)&考特,D.L.(Court,D.L.)在錯(cuò)配修復(fù)突變體中增強(qiáng)水平的λ紅介導(dǎo)的重組體(EnhancedlevelsoflambdaRed-mediatedrecombinantsinmismatchrepairmutants).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)100,15748-15753(2003)。32.埃德加,R.(Edgar,R.)&奇姆龍,U.(Qimron,U.)腸桿菌CRISPR系統(tǒng)保護(hù)溶素原免受λ溶源化作用以及原噬菌體誘導(dǎo)(TheEscherichiacoliCRISPRsystemprotectsfromlambdalysogenization,lysogens,andprophageinduction).《細(xì)菌學(xué)雜志》(J.Bacteriol.)192,6291-6294(2010)。33.馬拉菲尼,L.A.(Marraffini,L.A.)&松塞摩爾,E.J.(Sontheimer,E.J.)在CRISPRRNA指導(dǎo)的免疫過程中的自我辨別對非自我辨別(Selfversusnon-selfdiscriminationduringCRISPRRNA-directedimmunity).《自然》(Nature)463,568-571(2010)。34.費(fèi)舍爾,S.(Fischer,S.)等人古生菌免疫系統(tǒng)可檢測多個(gè)原型間隔子鄰近基序(PAM)以靶向入侵物DNA(AnarchaealimmunesystemcandetectmultipleProtospacerAdjacentMotifs(PAMs)totargetinvaderDNA).《生物化學(xué)雜志》(J.Biol.Chem.)287,33351-33363(2012)。35.歌德博格斯道蒂爾,S.(Gudbergsdottir,S.)等人當(dāng)用載體傳播的病毒和質(zhì)?;蛞约霸烷g隔子激發(fā)時(shí),硫化裂片菌CRISPR/Cas以及CRISPR/Cmr系統(tǒng)的動態(tài)性能(DynamicpropertiesoftheSulfolobusCRISPR-CasandCRISPR/Cmrsystemswhenchallengedwithvector-borneviralandplasmidgenesandprotospacers).《分子微生物學(xué)》(Mol.Microbiol.)79,35-49(2011)。36.王,H.H.(Wang,H.H.)等人通過共選擇MAGE進(jìn)行的基因組規(guī)模啟動子工程((Genome-scalepromoterengineeringbycoselectionMAGE).《自然方法》(NatMethods)9,591-593(2012)。37.叢,L.(Cong,L.)等人使用CRISPR/Cas系統(tǒng)的多重基因組工程化(MultiplexGenomeEngineeringUsingCRISPR/CasSystems).《科學(xué)》(Science)出版中(2013)。38.瑪麗,P.(Mali,P.)等人通過Cas9進(jìn)行的RNA引導(dǎo)的人類基因組工程(RNA-GuidedHumanGenomeEngineeringviaCas9).《科學(xué)》(Science)出版中(2013)。39.霍斯金斯,J.(Hoskins,J.)等人.細(xì)菌肺炎鏈球菌菌株R6的基因組(GenomeofthebacteriumStreptococcuspneumoniaestrainR6).《細(xì)菌學(xué)雜志》(J.Bacteriol.)183,5709-5717(2001)。40.哈維爾斯泰因,L.S.(Havarstein,L.S.),庫馬拉斯瓦米,G.(Coomaraswamy,G.)&莫里森,D.A.(Morrison,D.A.)未修飾的十七肽信息素誘導(dǎo)針對肺炎鏈球菌中的遺傳轉(zhuǎn)化的感受態(tài)(AnunmodifiedheptadecapeptidepheromoneinducescompetenceforgenetictransformationinStreptococcuspneumoniae).《美國科學(xué)院院刊》(Proc.Natl.Acad.Sci.U.S.A.)92,11140-11144(1995)。41.堀之內(nèi),S.(Horinouchi,S.)&維斯布盧姆,B.(Weisblum,B.)指定可誘導(dǎo)氯霉素抗性的一種質(zhì)粒pC194的核苷酸序列以及功能性圖(NucleotidesequenceandfunctionalmapofpC194,aplasmidthatspecifiesinduciblechloramphenicolresistance)《細(xì)菌學(xué)雜志》(J.Bacteriol.)150,815-825(1982)。42.荷頓(Horton),R.M.DNA的體外重組和誘變:基因拼接一起專用的基因.分子生物學(xué)方法(MethodsMol.Biol.)15,251-261(1993)。43.波德比爾斯基(Podbielski),A.,斯佩萊博格(Spellerberg),B.,沃伊施尼克(Woischnik),M.,波爾(Pohl),B.&魯提肯(Lutticken),R.用于組A鏈球菌(GAS)中的基因失活以及表達(dá)分析的新系列的質(zhì)粒載體(NovelseriesofplasmidvectorsforgeneinactivationandexpressionanalysisingroupAstreptococci(GAS)).基因(Gene)177,137-147(1996)。44.胡斯曼(Husmann),L.K.,斯科特(Scott),J.R.,林達(dá)爾(Lindahl),G.&斯坦伯格(Stenberg),L.Arp蛋白即M蛋白家族的一員的表達(dá)不足夠抑制化膿鏈球菌的噬菌體細(xì)胞增多(ExpressionoftheArpprotein,amemberoftheMproteinfamily,isnotsufficienttoinhibitphagocytosisofStreptococcuspyogenes).傳染以及免疫(Infectionandimmunity)63,345-348(1995)。45.吉布森(Gibson),D.G.等人幾百千堿基的DNA分子的酶拼接(EnzymaticassemblyofDNAmoleculesuptoseveralhundredkilobases).自然:方法6(NatMethods6),343-345(2009)。46.加爾諾,J.E.(Garneau,J.E.)等人CRISPR/Cas細(xì)菌免疫系統(tǒng)切割噬菌體和質(zhì)粒DNA(TheCRISPR/CasbacterialimmunesystemcleavesbacteriophageandplasmidDNA).《自然》(Nature)468,67-71(2010年11月04日)。47.巴郎鎬R.(BarrangouR.)等人CRISPR在原核生物中提供了對抗病毒的獲得性抗性(CRISPRprovidesacquiredresistanceagainstvirusesinprokaryotes).《科學(xué)》(Science)2007年3月23日;315(5819):1709-12。48.石野Y.(IshinoY.)等人在大腸桿菌中負(fù)責(zé)堿性磷酸酶同工酶轉(zhuǎn)化的iap基因的核苷酸序列以及基因產(chǎn)物的鑒定(Nucleotidesequenceoftheiapgene,responsibleforalkalinephosphataseisozymeconversioninEscherichiacoli,andidentificationofthegeneproduct).《細(xì)菌學(xué)雜志》(JBacteriol.)1987年12月;169(12):5429-33。49.莫吉卡F.J.M.(MojicaF.J.M)等人規(guī)律間隔的重復(fù)序列家族在古生菌、細(xì)菌和線粒體的基因組中的生物學(xué)意義(BiologicalsignificanceofafamilyofregularlyspacedrepeatsinthegenomesofArchaea,Bacteriaandmitochondria).《分子微生物學(xué)》(MolecularMicrobiology)(2000)36(1),244-246。50.詹森R.(JansenR.)等人在原核生物中鑒定與DNA重復(fù)相關(guān)的基因(IdentificationofgenesthatareassociatedwithDNArepeatsinprokaryotes).《分子微生物學(xué)》(MolecularMicrobiology)(2002)43(6),1565-1575。當(dāng)前第1頁1 2 3