根據(jù)35U.S.C.§119,本申請要求2014年2月11日提交的美國臨時(shí)申請61/938,608的權(quán)益,該申請的全部教導(dǎo)均通過引用并入本文。
背景技術(shù):
大的DNA構(gòu)建體的理性操作是當(dāng)前合成生物學(xué)和基因組工程工作的主要挑戰(zhàn)。近年來,已經(jīng)開發(fā)了多種技術(shù)來應(yīng)對這一挑戰(zhàn)并提高能生成突變的特異性和速度。此外,適應(yīng)性突變是進(jìn)化的核心驅(qū)動(dòng)因素,但其豐度和對細(xì)胞表型的相對貢獻(xiàn)即使在大部分充分研究的生物中也知之甚少。這在很大程度上可以歸因于與觀察和重建這些基因型以及將其存在與感興趣的表型進(jìn)行關(guān)聯(lián)相關(guān)的技術(shù)挑戰(zhàn)。例如,依賴于隨機(jī)誘變的基因組編輯方法導(dǎo)致包含許多突變的復(fù)雜的基因型,每一個(gè)突變的相對貢獻(xiàn)難以解析。而且,由于缺乏關(guān)于各個(gè)突變的信息,難以確定等位基因之間的上位相互作用(epistatic interactions)。
技術(shù)實(shí)現(xiàn)要素:
成簇規(guī)律間隔短回文重復(fù)序列(Clustered Regularly Interspersed Short Palindromic Repeat)(CRISPR)存在于許多細(xì)菌基因組中,并已被發(fā)現(xiàn)在適應(yīng)性細(xì)菌免疫中發(fā)揮重要作用。這些陣列的轉(zhuǎn)錄產(chǎn)生CRISPR RNA,它引導(dǎo)CRISPR/cas復(fù)合物序列特異性結(jié)合至細(xì)胞中的DNA靶標(biāo),導(dǎo)致基因阻抑或DNA裂解。這些復(fù)合物的特異性允許針對菌株工程化的新型體內(nèi)應(yīng)用。
本文描述了理性、多路操作開放閱讀框內(nèi)的染色體(例如,以生成蛋白質(zhì)文庫)或在染色體的任何區(qū)段中的多個(gè)基因的方法,其中使用不同的CRISPR系統(tǒng)。這些方法提供了比先前可用的方法更有效的組合基因組工程化。
擴(kuò)展CRISPR的多路化(multiplexing)能力提出了當(dāng)前的一個(gè)技術(shù)挑戰(zhàn),并且將能夠使用這些系統(tǒng)生成高通量格式的理性文庫。這樣的進(jìn)展對于力圖重構(gòu)復(fù)雜的遺傳網(wǎng)絡(luò)以實(shí)現(xiàn)最佳生產(chǎn)的代謝和蛋白質(zhì)工程領(lǐng)域具有廣泛深遠(yuǎn)的意義。
所述方法包括向細(xì)胞中引入CRISPR系統(tǒng)的組件,包括CRISPR關(guān)聯(lián)的核酸酶Cas9和序列特異性指導(dǎo)RNA(gRNA),從而利用CRISPR系統(tǒng)誘導(dǎo)序列指導(dǎo)的雙鏈斷裂的能力導(dǎo)致序列指導(dǎo)的雙鏈斷裂??蓪RISPR系統(tǒng)的組件,包括CRISPR關(guān)聯(lián)的核酸酶Cas9和序列特異性指導(dǎo)RNA(gRNA),引入至細(xì)胞中,在一個(gè)或多個(gè)載體如質(zhì)粒上編碼。DNA重組工程盒(cassette)或編輯寡核苷酸可被理性地設(shè)計(jì)為包含位于靶基因座內(nèi)的所需突變以及可被CRISPR系統(tǒng)識別的在靶基因座外部的常見位置中的突變。所述方法可以用于許多應(yīng)用,包括改變感興趣的途徑。
在一個(gè)實(shí)施方案中,所述方法是一種基因組工程化方法,其包括:(a)向細(xì)胞中引入載體,該載體編碼:(i)編輯盒,其包含與所述細(xì)胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)核苷酸的突變(被稱為所需突變)的區(qū)域,如相對于該靶區(qū)域的、在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變,和前間隔區(qū)鄰近基序(protospacer adjacent motif)(PAM)突變;(ii)啟動(dòng)子;以及(iii)至少一個(gè)指導(dǎo)RNA(gRNA),該gRNA包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA),從而產(chǎn)生包含所述載體的細(xì)胞;(b)使包含所述載體的細(xì)胞維持在表達(dá)Cas9的條件下,其中Cas9核酸酶在所述載體上編碼、在第二載體上編碼或在細(xì)胞的基因組上編碼,導(dǎo)致產(chǎn)生包含所述載體并且不包含所述PAM突變的細(xì)胞和包含所述載體和PAM突變的細(xì)胞;(c)在適合于細(xì)胞活力的條件下培養(yǎng)(b)的產(chǎn)物,從而產(chǎn)生活細(xì)胞;(d)獲得在(c)中產(chǎn)生的活細(xì)胞;以及(e)對在(d)中獲得的至少一個(gè)活細(xì)胞的載體的編輯寡核苷酸進(jìn)行測序,并鑒定所述至少一個(gè)密碼子的突變。
在另一個(gè)實(shí)施方案中,所述方法是一種通過可追蹤C(jī)RISPR富集重組工程化的基因組工程化方法,其包括:(a)向第一細(xì)胞群體中引入載體,該載體編碼:(i)至少一個(gè)編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)核苷酸的突變的區(qū)域,如相對于該靶區(qū)域在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變,和(b)前間隔區(qū)鄰近基序(PAM)突變;(ii)至少一個(gè)啟動(dòng)子;以及(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA),以及(b)募集Cas9核酸酶的區(qū)域(RNA),從而產(chǎn)生包含所述載體的第二細(xì)胞群體;(b)使所述第二細(xì)胞群體維持在表達(dá)Cas9核酸酶的條件下,其中所述Cas9核酸酶在所述載體、第二載體上或在所述第二細(xì)胞群體的細(xì)胞的基因組上編碼,導(dǎo)致在不包含PAM突變的細(xì)胞中的DNA裂解和這類細(xì)胞的死亡;(c)獲得在(b)中產(chǎn)生的活細(xì)胞;以及(d)通過對所述第二細(xì)胞群體的至少一個(gè)細(xì)胞的載體的編輯寡核苷酸進(jìn)行測序,鑒定所述至少一個(gè)密碼子的突變。
以上實(shí)施方案中的任意一個(gè)可以進(jìn)一步包括合成和/或獲得編輯寡核苷酸群體。任意一個(gè)實(shí)施方案可以進(jìn)一步包括擴(kuò)增所述編輯寡核苷酸群體。在任意一個(gè)所述實(shí)施方案中,所述載體可以進(jìn)一步包含間隔區(qū)、至少兩個(gè)引發(fā)位點(diǎn),或間隔區(qū)和至少兩個(gè)引發(fā)位點(diǎn)兩者。在一些實(shí)施方案中,所述編輯盒包含靶區(qū)域,該靶區(qū)域包含PAM突變的100個(gè)核苷酸內(nèi)的至少一個(gè)密碼子的突變。
還描述了一種載體,其包含:
(i)編輯盒,其包含與細(xì)胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
進(jìn)一步的實(shí)施方案為一種載體,其包含:
(i)編輯盒,其包含與細(xì)胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
進(jìn)一步的實(shí)施方案為一種載體,其包含:
(i)至少一個(gè)編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)核苷酸的突變的區(qū)域,以及(b)前間隔區(qū)鄰近基序(PAM)突變;
(ii)至少一個(gè)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA),以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
所述載體的另一個(gè)實(shí)施方案為一種載體,其包含:
(i)至少一個(gè)編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變的區(qū)域,以及(b)前間隔區(qū)鄰近基序(PAM)突變;
(ii)至少一個(gè)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA),和(b)募集Cas9核酸酶的區(qū)域(RNA)。
在任意一個(gè)所述實(shí)施方案中,所述載體可以進(jìn)一步包含間隔區(qū);至少兩個(gè)引發(fā)位點(diǎn);或間隔區(qū)和至少兩個(gè)引發(fā)位點(diǎn)。在突變是在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變的那些載體中,所述編輯盒所述突變可以在例如PAM突變的100個(gè)核苷酸內(nèi)。
還描述了一種包含通過本文所述方法產(chǎn)生的細(xì)胞群體的文庫。細(xì)胞群體的文庫可以包含具有本文所述的任何載體的細(xì)胞。例如,細(xì)胞群體可以包含一種載體,該載體包含:
(i)編輯盒,其包含與細(xì)胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
在進(jìn)一步的實(shí)施方案中,細(xì)胞群體可以包含一種載體,該載體包含:
(i)編輯盒,其包含與細(xì)胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動(dòng)子;以及
(iii)至少一個(gè)指導(dǎo)RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補(bǔ)的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
在進(jìn)一步的實(shí)施方案中,所述方法是一種CRISPR輔助的理性蛋白質(zhì)工程化(組合基因組工程化)方法,該方法包括:
(a)通過將以下物質(zhì)引入至第一細(xì)胞群體中(例如通過共轉(zhuǎn)化)來構(gòu)建包含重組DNA如重組染色體或質(zhì)粒中的重組DNA的供體文庫:(i)一個(gè)或多個(gè)編輯寡核苷酸,如理性設(shè)計(jì)的寡核苷酸,其使第一單個(gè)前間隔區(qū)鄰近基序(PAM)的缺失與鄰近PAM的基因(鄰近基因)中的至少一個(gè)密碼子的突變偶聯(lián),和(ii)指導(dǎo)RNA(gRNA),其靶向位于染色體的開放閱讀框的5'側(cè)的核苷酸序列,從而產(chǎn)生包含第一細(xì)胞群體的供體文庫,該第一細(xì)胞群體包含具有靶向密碼子突變的重組染色體;
(b)例如通過重組染色體的PCR擴(kuò)增來擴(kuò)增在(a)中構(gòu)建的供體文庫,其使用來自所述編輯寡核苷酸的合成特征,并同時(shí)在所述基因的3'末端處并入第二PAM缺失(終點(diǎn)(destination)PAM缺失),從而使靶向密碼子突變與終點(diǎn)PAM缺失直接偶聯(lián)如共價(jià)偶聯(lián),并產(chǎn)生攜帶所述終點(diǎn)PAM缺失和靶向密碼子突變的重獲(retrieved)的供體文庫;以及
(c)將攜帶終點(diǎn)PAM缺失和靶向密碼子突變的供體文庫與終點(diǎn)gRNA質(zhì)粒引入(例如,共轉(zhuǎn)化)至第二細(xì)胞群體中,從而產(chǎn)生包含靶向密碼子突變的終點(diǎn)文庫,該第二細(xì)胞群體通常為稚細(xì)胞群體。
所述第一細(xì)胞群體和所述第二細(xì)胞群體(例如,稚細(xì)胞群體)通常是這樣的群體:其中細(xì)胞全部為相同的類型,并且可以是原核生物或真核生物,例如但不限于細(xì)菌、哺乳動(dòng)物細(xì)胞、植物細(xì)胞、昆蟲細(xì)胞。
在一些實(shí)施方案中,所述方法進(jìn)一步包括使所述終點(diǎn)文庫維持在產(chǎn)生蛋白質(zhì)的條件下。
在一些實(shí)施方案中,所述第一細(xì)胞表達(dá)具有Cas9核酸酶活性的多肽。在一些實(shí)施方案中,在誘導(dǎo)型啟動(dòng)子的控制下表達(dá)具有Cas9核酸酶活性的多肽。
在一些實(shí)施方案中,所述編輯寡核苷酸與存在于所述第一細(xì)胞中的(一個(gè)、一個(gè)或多個(gè)、至少一個(gè))靶核酸互補(bǔ)。在一些實(shí)施方案中,所述編輯寡核苷酸靶向所述第一細(xì)胞中的多于一個(gè)靶位點(diǎn)或基因座。在一些實(shí)施方案中,所述編輯寡核苷酸的核酸序列[所需密碼子]包含相對于靶核酸的一個(gè)或多個(gè)置換、缺失、插入,或置換、缺失和插入的任意組合。在一些實(shí)施方案中,理性地設(shè)計(jì)所述編輯寡核苷酸;在進(jìn)一步的實(shí)施方案中,通過隨機(jī)誘變或通過使用簡并引物寡核苷酸產(chǎn)生所述編輯寡核苷酸。在一些實(shí)施方案中,所述編輯寡核苷酸來源于核酸的集合(文庫)。
在一些實(shí)施方案中,所述gRNA在質(zhì)粒上編碼。在一些實(shí)施方案中,通過轉(zhuǎn)化,例如通過編輯寡核苷酸和指導(dǎo)(g)RNA的共轉(zhuǎn)化,將所述編輯寡核苷酸和所述gRNA引入至所述第一細(xì)胞中。在一些實(shí)施方案中,將所述編輯寡核苷酸和所述gRNA依次引入至所述第一細(xì)胞中。在其他實(shí)施方案中,將所述編輯寡核苷酸和所述gRNA同時(shí)引入至所述第一細(xì)胞中。
在一些實(shí)施方案中,重獲供體文庫進(jìn)一步包括(a)篩選細(xì)胞以供并入所述編輯寡核苷酸,和(b)選擇被確認(rèn)已并入所述編輯寡核苷酸的細(xì)胞。在一些實(shí)施方案中,重獲供體文庫進(jìn)一步包括處理重獲的供體文庫。
在一些實(shí)施方案中,所述終點(diǎn)細(xì)胞/稚細(xì)胞表達(dá)具有Cas9核酸酶活性的多肽。在一些實(shí)施方案中,在誘導(dǎo)型啟動(dòng)子的控制下表達(dá)具有Cas9核酸酶活性的多肽。
還描述了一種CRISPR輔助的理性蛋白質(zhì)工程化方法,其包括:
(a)將(i)包含編輯寡核苷酸的合成dsDNA編輯盒和(ii)表達(dá)靶向正好在感興趣的基因上游的基因組序列的指導(dǎo)RNA(gRNA)的載體,在發(fā)生所述編輯寡核苷酸的多路重組工程化和通過gRNA的選擇性富集的條件下引入(例如,共轉(zhuǎn)化)至第一細(xì)胞群體中,從而產(chǎn)生供體文庫;
(b)擴(kuò)增具有缺失與感興趣的基因的3'端鄰近的前間隔區(qū)鄰近基序(PAM)(終點(diǎn)PAM)的寡核苷酸的供體文庫,從而產(chǎn)生擴(kuò)增的供體文庫,該擴(kuò)增的供體文庫包含已缺失終點(diǎn)PAM(具有3’PAM缺失)的dsDNA編輯盒、理性密碼子突變和P1位點(diǎn);
(c)用酶如限制酶(例如,BsaI)處理所述擴(kuò)增的供體文庫以去除P1位點(diǎn);以及
(d)用在(c)中處理的擴(kuò)增的供體文庫和終點(diǎn)gRNA共轉(zhuǎn)化稚細(xì)胞群體,從而產(chǎn)生共轉(zhuǎn)化細(xì)胞群體,該共轉(zhuǎn)化細(xì)胞群體包含已經(jīng)缺失終點(diǎn)PAM(具有3'PAM缺失)的dsDNA編輯盒、理性密碼子突變和終點(diǎn)gRNA。
在所描述的全部實(shí)施方案中,突變可以是所需的任何類型,如一個(gè)或多個(gè)插入、缺失、置換,或者前述突變中兩個(gè)或三個(gè)的任意組合(例如,插入和缺失;插入和置換;缺失和置換;置換和插入;插入、缺失和置換)。插入、缺失和置換可以是任何數(shù)目的核苷酸的插入、缺失和置換。它們可以在密碼子(編碼區(qū))中和/或在非編碼區(qū)中。
附圖說明
圖1A和1B顯示了CRISPR輔助的理性蛋白質(zhì)工程化(CARPE)的概覽。圖1A顯示了供體文庫構(gòu)建的示意圖。使合成dsDNA編輯盒與表達(dá)靶向在感興趣的基因上游的基因組序列的指導(dǎo)RNA(gRNA)的載體共轉(zhuǎn)化。該共轉(zhuǎn)化經(jīng)由編輯寡核苷酸的多路重組工程化生成供體文庫,該編輯寡核苷酸通過gRNA選擇性地富集。隨后使用使得與所述基因的3'端鄰近的PAM(終點(diǎn)PAM)發(fā)生突變(缺失)的寡核苷酸擴(kuò)增供體文庫。圖1B顯示了最終蛋白質(zhì)文庫生成的示意圖。用BsaI處理供體文庫以去除P1位點(diǎn),并將具有3’PAM缺失和理性密碼子突變的dsDNA盒的文庫與終點(diǎn)gRNA共轉(zhuǎn)化以生成最終蛋白質(zhì)文庫。
圖2顯示了來自galK供體文庫構(gòu)建產(chǎn)生的克隆的DNA序列,證實(shí)了以高效率并入編輯寡核苷酸的P1特征以及在靶向密碼子位置(下劃線)處的突變。P1的序列由SEQ ID NO:1提供。
圖3A顯示了引物設(shè)計(jì)。圖3B顯示了相對于引物數(shù)目的預(yù)期密度。
圖4A顯示了接頭與構(gòu)建體結(jié)果。圖4B顯示了與基于乳液PCR的追蹤相關(guān)的10個(gè)編輯(edit)。
圖5是用于代謝工程化的理性蛋白質(zhì)編輯的示意圖。
圖6是生成CRISPR富集的理性蛋白質(zhì)文庫的示意圖。
圖7是CARPE的設(shè)置和證明的示意圖。
圖8顯示了迭代(iterative)CRISPR共選擇的策略。
圖9顯示了使用CARPE的多路蛋白質(zhì)工程化的策略。
圖10顯示了使用CARPE構(gòu)建galK供體文庫。
圖11A顯示了使用CARPE的基于CRISPR的多路編輯的示意圖。圖11B顯示了使用通過可追蹤C(jī)RISPR富集重組工程化的基因組工程化(GEn-TraCER),基于CRISPR的多路編輯的示意圖。
圖12顯示了代表性的GEn-TraCER載體(構(gòu)建體),其包含用于編輯galK的密碼子24的編輯盒、啟動(dòng)子和間隔區(qū)。
圖13顯示了使用GEn-TraCER的galK編輯的結(jié)果。上面的圖顯示了來自已經(jīng)用galK密碼子24編輯GEn-TraCER載體轉(zhuǎn)化的細(xì)胞的染色體和載體(質(zhì)粒)的DNA測序結(jié)果,其表明該載體上的編輯盒(寡核苷酸)可以作為允許高效追蹤所需基因組編輯(突變)的“反式條形碼”被測序。下面的圖示出了細(xì)胞的DNA測序色譜,其顯示出未編輯的野生型表型(紅色)。該方法允許鑒定具有既攜帶未編輯的野生型等位基因又?jǐn)y帶編輯的/突變的等位基因的多個(gè)染色體的細(xì)胞。
圖14A-14C顯示了GEn-TraCER的示意圖。圖14A顯示了設(shè)計(jì)組件的概覽。GEn-TraCER盒含有指導(dǎo)RNA(gRNA)序列,以靶向細(xì)胞基因組中的特定位點(diǎn)并引起dsDNA裂解。與靶區(qū)域互補(bǔ)的同源性區(qū)域使得PAM和其他附近的所需位點(diǎn)發(fā)生突變。將經(jīng)歷重組的細(xì)胞選擇性地富集為高豐度。對載體中的GEn-TraCER編輯盒的測序使得能夠追蹤基因組編輯/突變。圖14B顯示了針對密碼子145處的大腸桿菌galK基因的示例性編輯盒設(shè)計(jì)。用最近的可用PAM突變刪除PAM,該突變可以針對在最近的可用PAM位置處的同義變化而進(jìn)行。這實(shí)現(xiàn)了在PAM缺失位點(diǎn)處具有1-2個(gè)核苷酸的“沉默疤痕(silent scar)”的誘變。圖14C顯示了可以使用基于陣列的合成方法合成GEn-TraCER盒,從而實(shí)現(xiàn)至少104-106個(gè)盒的平行合成,以用于系統(tǒng)靶向和同時(shí)評價(jià)在全基因組規(guī)模下對數(shù)以千計(jì)的突變的適合性。
圖15A顯示了GEn-TraCER載體的概況。圖15B顯示了用于在大腸桿菌galK基因中生成Y145*突變的代表性GEn-TraCER的一部分,其中該P(yáng)AM突變和突變的密碼子相隔17個(gè)核苷酸。代表性GEn-TraCER的該部分的核酸序列由SEQ ID NO:28提供,而反向互補(bǔ)序列由SEQ ID NO:33提供。
圖16A-16C顯示了GEn-TraCER設(shè)計(jì)的對照。圖16A顯示了編輯盒的大小對所述方法的效率的影響。圖16B顯示了PAM突變/缺失與所需突變之間的距離對所述方法的效率的影響。圖16C顯示了MutS系統(tǒng)的存在與否對所述方法的效率的影響。
具體實(shí)施方式
細(xì)菌和古細(xì)菌CRISPR系統(tǒng)已成為用于精確基因組編輯的強(qiáng)大的新工具。已經(jīng)在體外特別好地表征了來自釀膿鏈球菌(Streptococcus pyogenes)的II型CRISPR系統(tǒng),并且已經(jīng)建立了簡單的設(shè)計(jì)規(guī)則以便對其雙鏈DNA(dsDNA)結(jié)合活性重編程序(Jinek等人Science(2012)337(6096):816-821)。CRISPR介導(dǎo)的基因組編輯方法在很多種生物中的使用在文獻(xiàn)中快速積累,該生物包括細(xì)菌(Cong等人Science(2013)339(6121):819-823)、釀酒酵母(DiCarlo等人Nucleic Acids Res.(2013)41:4336-4343)、秀麗隱桿線蟲(Waaijers等人Genetics(2013)195:1187-1191)和各種哺乳動(dòng)物細(xì)胞系(Cong等人Science(2013)339(6121):819-823;Wang等人Cell(2013)153:910-918)。像其他基于內(nèi)切核酸酶的基因組編輯技術(shù),如鋅指核酸酶(ZFN)、歸巢核酸酶和TALENS一樣,CRISPR系統(tǒng)介導(dǎo)精確基因組編輯的能力源自于靶標(biāo)識別的高度特異性的性質(zhì)。例如,來自大腸桿菌和釀膿鏈球菌系統(tǒng)的I型CRISPR系統(tǒng)要求CRISPR RNA(crRNA)與14-15堿基對識別靶標(biāo)之間有完全的互補(bǔ)性,這表明自然地采用了CRISPR系統(tǒng)的免疫功能(Jinek等人Science(2012)337(6096):816-821;Brouns等人Science(2008)321:960-964;Semenova等人PNAS(2011)108:10098-10103)。
本文描述了基因組編輯方法,其采用內(nèi)切核酸酶,如由cas9基因編碼的Cas9核酸酶,以在DNA如基因組DNA中進(jìn)行定向基因組進(jìn)化/產(chǎn)生變化(缺失、置換、添加)。cas9基因可以獲自任何來源,如細(xì)菌,如細(xì)菌釀膿鏈球菌。cas9的核酸序列和/或Cas9的氨基酸序列可以相對于天然存在的cas9和/或Cas9的序列發(fā)生突變;突變可以是例如一個(gè)或多個(gè)插入、缺失、置換或前述的兩個(gè)或三個(gè)的任意組合。在這樣的實(shí)施方案中,所得到的突變的Cas9可以具有相對于天然存在的Cas9增強(qiáng)或降低的核酸酶活性。
圖1A、1B和11A顯示了被稱為CRISPR輔助的理性蛋白質(zhì)工程化(CARPE)的CRISPR介導(dǎo)的基因組編輯方法。CARPE是一個(gè)兩階段的構(gòu)建過程,它依賴于將來自單鏈DNA(ssDNA)或雙鏈DNA(dsDNA)編輯盒的定向突變直接并入基因組中的“供體”和“終點(diǎn)”文庫的生成。在供體構(gòu)建的第一階段(圖1A)中,將理性設(shè)計(jì)的編輯寡核苷酸與指導(dǎo)RNA(gRNA)共轉(zhuǎn)化至細(xì)胞中,該gRNA雜交至/靶向靶DNA序列,如位于開放閱讀框的5'側(cè)的序列或其他感興趣的序列。CARPE的關(guān)鍵創(chuàng)新是編輯寡核苷酸的設(shè)計(jì),它使單個(gè)前間隔區(qū)鄰近基序(PAM)的缺失或突變與鄰近基因中的一個(gè)或多個(gè)所需密碼子的突變偶聯(lián),從而使得能夠在單一轉(zhuǎn)化中生成整個(gè)供體文庫。隨后使用來自編輯寡核苷酸的合成特征,通過擴(kuò)增重組染色體,例如通過PCR反應(yīng),來重獲供體文庫;同時(shí)在所述基因的3'末端處并入第二PAM缺失或突變。因此,該方法將密碼子靶向突變與PAM缺失直接共價(jià)偶聯(lián)。在CARPE的第二階段(圖1B)中,將攜帶終點(diǎn)PAM缺失/突變和靶向突變(一個(gè)或多個(gè)核苷酸如在一個(gè)或多個(gè)密碼子中的一個(gè)或多個(gè)核苷酸的所需突變)的PCR擴(kuò)增的供體文庫與終點(diǎn)gRNA載體共轉(zhuǎn)化至稚細(xì)胞中,以生成表達(dá)理性設(shè)計(jì)的蛋白質(zhì)文庫的細(xì)胞群體。
在CRISPR系統(tǒng)中,CRISPR反式激活(tracrRNA)和間隔區(qū)RNA(crRNA)引導(dǎo)靶區(qū)域的選擇。如本文所用的,靶區(qū)域是指細(xì)胞或細(xì)胞群體的核酸中需要至少一個(gè)核苷酸的突變?nèi)缭谥辽僖粋€(gè)密碼子(一個(gè)或多個(gè)密碼子)中的至少一個(gè)核苷酸的突變的任何基因座。靶區(qū)域可以是例如基因組基因座(靶基因組序列)或染色體外的基因座。tracrRNA和crRNA可被表達(dá)為單一的嵌合RNA分子,其被稱為單一指導(dǎo)RNA、指導(dǎo)RNA或gRNA。gRNA的核酸序列包含第一核酸序列(也被稱為第一區(qū)域,它與靶區(qū)域的區(qū)域互補(bǔ))和第二核酸序列(也被稱為第二區(qū)域,它形成莖環(huán)結(jié)構(gòu)并用來將Cas9募集至靶區(qū)域)。在一些實(shí)施方案中,gRNA的第一區(qū)域與在靶基因組序列上游的區(qū)域互補(bǔ)。在一些實(shí)施方案中,gRNA的第一區(qū)域與靶區(qū)域的至少一部分互補(bǔ)。gRNA的第一區(qū)域可以與靶基因組序列完全互補(bǔ)(100%互補(bǔ))或包含一個(gè)或多個(gè)錯(cuò)配,條件是它與靶基因組序列充分互補(bǔ)以特異性地雜交/引導(dǎo)和募集Cas9。在一些實(shí)施方案中,gRNA的第一區(qū)域?yàn)橹辽?5、16、17、18、19、20、21、22、23、24、25、26、27、28、29個(gè)或至少30個(gè)核苷酸的長度。在一些實(shí)施方案中,gRNA的第一區(qū)域?yàn)橹辽?0個(gè)核苷酸的長度。在一些實(shí)施方案中,由第二核酸序列形成的莖環(huán)結(jié)構(gòu)為至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、7、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100個(gè)核苷酸的長度。在特定的實(shí)施方案中,該莖環(huán)結(jié)構(gòu)為80至90或82至85個(gè)核苷酸的長度,并且在進(jìn)一步的特定實(shí)施方案中,形成莖環(huán)結(jié)構(gòu)的gRNA的第二區(qū)域?yàn)?3個(gè)核苷酸的長度。
在一些實(shí)施方案中,使用CARPE方法引入至第一細(xì)胞中的(供體文庫的)gRNA的序列與引入至第二細(xì)胞/稚細(xì)胞中的(終點(diǎn)文庫的)gRNA的序列相同。在一些實(shí)施方案中,將多于一個(gè)gRNA引入至第一細(xì)胞群體和/或第二細(xì)胞群體。在一些實(shí)施方案中,所述多于一個(gè)gRNA分子包含與多于一個(gè)靶區(qū)域互補(bǔ)的第一核酸序列。
在CARPE方法中,用于在所述方法中使用的也被稱為編輯寡核苷酸的雙鏈DNA盒可以獲自或來源于許多來源。例如,在一些實(shí)施方案中,dsDNA盒來源于已經(jīng)通過非同源性隨機(jī)重組(NRR)多樣化的核酸文庫;這樣的文庫被稱為NRR文庫。在一些實(shí)施方案中,例如通過基于陣列的合成來合成所述編輯寡核苷酸。所述編輯寡核苷酸的長度可能依賴于獲得該編輯寡核苷酸所使用的方法。在一些實(shí)施方案中,所述編輯寡核苷酸為約50-200個(gè)核苷酸、75-150個(gè)核苷酸或80-120個(gè)核苷酸的長度。
編輯寡核苷酸包含(a)與細(xì)胞的核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個(gè)密碼子的突變(被稱為所需突變)的區(qū)域,和(b)前間隔區(qū)鄰近基序(PAM)突變。該P(yáng)AM突變可以是一個(gè)或多個(gè)核苷酸的任何插入、缺失或置換,其使PAM的序列發(fā)生突變,使得其不再被CRISPR系統(tǒng)識別。包含這樣的PAM突變的細(xì)胞可以被稱為對CRISPR介導(dǎo)的殺傷“有免疫力”。相對于靶區(qū)域的序列的所需突變可以是在靶區(qū)域的至少一個(gè)密碼子處的一個(gè)或多個(gè)核苷酸的插入、缺失和/或置換。
僅為了說明的目的,以下參考細(xì)菌基因描述了CARPE方法。所述方法可以應(yīng)用于任何感興趣的基因,包括來自包括細(xì)菌和古細(xì)菌在內(nèi)的任何原核生物或來自任何真核生物的基因,包括酵母和哺乳動(dòng)物(包括人)基因。對大腸桿菌基因組中的galK基因進(jìn)行CARPE方法,這部分地是由于針對該基因的活性測定的可用性。使用BW23115親代菌株和pSIM5載體(Datta等人Gene(2008)379:109-115)進(jìn)行所述方法以介導(dǎo)重組工程化。將cas9基因克隆至pBTBX-2骨架中,處于pBAD啟動(dòng)子的控制下,以允許通過添加阿拉伯糖控制裂解活性。使用來自NNK文庫的dsDNA盒對選擇性并入合成dsDNA盒(127bp)的能力進(jìn)行評估,該NNK文庫由簡并引物和/或由作為27,000個(gè)成員的文庫的一部分合成的理性設(shè)計(jì)的寡核苷酸(oligo)經(jīng)由微陣列技術(shù)構(gòu)建。在這兩種情況下,將寡核苷酸設(shè)計(jì)為使galK基因產(chǎn)物的活性位點(diǎn)殘基發(fā)生突變?;谟冕槍alK基因座的引物獲得的擴(kuò)增子大小的變化,驗(yàn)證了供體菌株文庫的高度有效的恢復(fù)(recovery)。對來自NRR文庫的這些菌落PCR產(chǎn)物的測序表明,來自dsDNA盒的合成引發(fā)位點(diǎn)(P1)以約90-100%的效率并入。這表明可以在不依靠通常在其他基于重組工程化的編輯方法中使用的易錯(cuò)mutS敲除菌株(Costantino等人PNAS(2003)100:15748-15753;Wang等人Nature(2009)460:894-898)的情況下,以高效率生成這些文庫。密碼子突變的效率有所降低(約20%),這可能是由于在等位基因替換過程中的mutS校正。終點(diǎn)文庫中克隆的初步評估表明,當(dāng)構(gòu)建的兩個(gè)階段都在mutS+背景下進(jìn)行時(shí),最終密碼子編輯效率約為10%。
使用不將PAM與密碼子突變共價(jià)連接而是依賴于它們在復(fù)制過程中彼此的接近性的替代方案,完成與其他近來發(fā)表的可共選擇編輯方案的比較(Wang等人Nat.Methods(2012)9:591-593)。在這些非共價(jià)的實(shí)驗(yàn)中,使用與上述相同的編輯寡核苷酸,并使用靶向相同供體/終點(diǎn)PAM位點(diǎn)的ssDNA寡核苷酸努力針對其插入進(jìn)行共選擇。產(chǎn)生的突變體的菌落篩選揭示了PAM突變體的恢復(fù)的高效率。然而,對于dsDNA編輯盒的插入似乎沒有強(qiáng)大的共選擇。這可能是由于PAM缺失寡核苷酸與生成相當(dāng)大的染色體缺失的編輯盒在相對重組工程化效率上的巨大差異。
可以例如通過在轉(zhuǎn)移到野生型供體菌株之前在mutS缺乏的菌株中進(jìn)行供體構(gòu)建以試圖防止在供體構(gòu)建階段中突變的損失,來評估改善CARPE方法的最終編輯效率的能力。此外,可以例如通過對包括dxs、metA和folA在內(nèi)的多個(gè)必需基因使用CARPE來評估CARPE方法的通用性。已經(jīng)使用描述的gRNA設(shè)計(jì)策略有效地靶向必需基因。結(jié)果還表明,盡管在供體文庫創(chuàng)建過程中發(fā)生了基因破壞,但可以在重組工程化后1-3小時(shí)內(nèi)有效地構(gòu)建并重獲供體文庫。
本文還提供了使用CRISPR介導(dǎo)的系統(tǒng)的可追蹤精確基因組編輯方法,其被稱為通過可追蹤C(jī)RISPR富集重組工程化的基因組工程化(GEn-TraCER)。GEn-TraCER方法使用編碼編輯盒和gRNA的單個(gè)載體獲得高效率的編輯/突變。當(dāng)與平行DNA合成如基于陣列的DNA合成一起使用時(shí),GEN-TraCER提供了數(shù)以千計(jì)的精確編輯/突變的單步生成,并使得通過對載體上的編輯盒進(jìn)行測序而不是通過對細(xì)胞的基因組(基因組DNA)進(jìn)行測序來定位突變成為可能。所述方法在蛋白質(zhì)和基因組工程化應(yīng)用方面以及對于突變?nèi)鐚?shí)驗(yàn)室進(jìn)化實(shí)驗(yàn)中鑒定的突變的重建具有廣泛應(yīng)用。
GEn-TraCER方法和載體將包含所需突變和PAM突變的編輯盒與編碼單一載體上的gRNA的基因組合起來,這使得在單一反應(yīng)中生成突變的文庫成為可能。如圖11B所示,所述方法包括將包含含有所需突變和PAM突變的編輯盒的載體引入至細(xì)胞或細(xì)胞群體中。在一些實(shí)施方案中,引入載體的細(xì)胞還編碼Cas9。在一些實(shí)施方案中,隨后將編碼Cas9的基因引入至細(xì)胞或細(xì)胞群體中。在該細(xì)胞或細(xì)胞群體中包括Cas9和gRNA的CRISPR系統(tǒng)的表達(dá)得到激活;gRNA將Cas9募集至靶區(qū)域,在靶區(qū)域中發(fā)生dsDNA裂解。不希望受到任何特定理論的束縛,與靶區(qū)域互補(bǔ)的編輯盒的同源區(qū)域使得PAM和靶區(qū)域的一個(gè)或多個(gè)密碼子發(fā)生突變。該細(xì)胞群體中沒有整合PAM突變的細(xì)胞經(jīng)歷由Cas9介導(dǎo)的dsDNA裂解引起的未編輯的細(xì)胞死亡。該細(xì)胞群體中整合了PAM突變的細(xì)胞不經(jīng)歷細(xì)胞死亡;它們保持存活并且選擇性地富集為高豐度。獲得活細(xì)胞并提供靶向突變的文庫。
使用GEn-TraCER的可追蹤基因組編輯方法包括:(a)將編碼至少一個(gè)編輯盒、啟動(dòng)子和至少一個(gè)gRNA的載體引入至細(xì)胞或細(xì)胞群體中,從而產(chǎn)生包含該載體的細(xì)胞或細(xì)胞群體(第二細(xì)胞群體);(b)使第二細(xì)胞群體維持在表達(dá)Cas9的條件下,其中Cas9核酸酶在該載體、第二載體上或在第二細(xì)胞群體的細(xì)胞的基因組上編碼,導(dǎo)致第二細(xì)胞群體中不包含PAM突變的細(xì)胞的DNA裂解和死亡,而第二細(xì)胞群體中包含PAM突變的細(xì)胞存活;(c)獲得活細(xì)胞;以及(d)對第二細(xì)胞群體的至少一個(gè)細(xì)胞中的載體的編輯盒進(jìn)行測序,以鑒定至少一個(gè)密碼子的突變。
在一些實(shí)施方案中,還將編碼cas9的單獨(dú)載體引入至細(xì)胞或細(xì)胞群體中??墒褂帽绢I(lǐng)域已知的任何方法或技術(shù)將載體引入至細(xì)胞或細(xì)胞群體中。例如,可以通過標(biāo)準(zhǔn)方案如轉(zhuǎn)化(包括化學(xué)轉(zhuǎn)化和電穿孔)、轉(zhuǎn)導(dǎo)和粒子轟擊引入載體。
編輯盒包含(a)區(qū)域,該區(qū)域識別(雜交)細(xì)胞或細(xì)胞群體中核酸的靶區(qū)域,與該細(xì)胞的核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個(gè)密碼子中的至少一個(gè)核苷酸的突變(被稱為所需突變),和(b)前間隔區(qū)鄰近基序(PAM)突變。該P(yáng)AM突變可以是一個(gè)或多個(gè)核苷酸的任何插入、缺失或置換,其使PAM的序列發(fā)生突變,使得突變的PAM(PAM突變)不被CRISPR系統(tǒng)識別。包含如PAM突變的細(xì)胞可以被稱為對CRISPR介導(dǎo)的殺傷“有免疫力”。相對于靶區(qū)域的序列的所需突變可以是在靶區(qū)域的至少一個(gè)密碼子處的一個(gè)或多個(gè)核苷酸的插入、缺失和/或置換。在一些實(shí)施方案中,所述編輯盒上PAM突變與所需突變之間的距離為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個(gè)核苷酸。在一些實(shí)施方案中,PAM突變位于距離編輯盒的末端至少9個(gè)核苷酸的位置處。在一些實(shí)施方案中,所需突變位于距離編輯盒的末端至少9個(gè)核苷酸的位置處。
在一些實(shí)施方案中,相對于靶區(qū)域的序列的所需突變?yōu)楹怂嵝蛄械牟迦?。插入靶區(qū)域中的核酸序列可以為任意長度。在一些實(shí)施方案中,插入的核酸序列為至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或至少2000個(gè)核苷酸的長度。在核酸序列插入靶區(qū)域中的實(shí)施方案中,所述編輯盒包含長度為至少30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或至少60個(gè)核苷酸并且與靶區(qū)域同源的區(qū)域。
術(shù)語“GEn-TraCER盒”可以用來指編輯盒、啟動(dòng)子、間隔區(qū)序列和編碼gRNA的基因的至少一部分。在一些實(shí)施方案中,在GEn-TraCER盒上編碼gRNA的基因的部分編碼gRNA中與靶區(qū)域互補(bǔ)的部分。在一些實(shí)施方案中,gRNA中與靶區(qū)域互補(bǔ)的部分為至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或至少30個(gè)核苷酸的長度。在一些實(shí)施方案中,gRNA中與靶區(qū)域互補(bǔ)的部分為24個(gè)核苷酸的長度。在一些實(shí)施方案中,GEn-TraCER盒進(jìn)一步包含至少兩個(gè)引發(fā)位點(diǎn)。在一些實(shí)施方案中,所述引發(fā)位點(diǎn)可以用于通過例如PCR來擴(kuò)增GEn-TraCER盒。在一些實(shí)施方案中,使用gRNA中與靶區(qū)域互補(bǔ)的部分作為引發(fā)位點(diǎn)。
在GEn-TraCER方法中,用于在所述方法中使用的編輯盒和GEn-TraCER盒可以獲自或來源于許多來源。例如,在一些實(shí)施方案中,例如通過基于陣列的合成來合成所述編輯盒。在一些實(shí)施方案中,例如通過基于陣列的合成來合成所述GEn-TraCER盒。所述編輯盒和/或GEn-TraCER盒的長度可依賴于獲得編輯盒和/或GEn-TraCER盒所使用的方法。在一些實(shí)施方案中,所述編輯盒為約50-300個(gè)核苷酸、75-200個(gè)核苷酸或80-120個(gè)核苷酸的長度。在一些實(shí)施方案中,所述GEn-TraCER盒為約50-300個(gè)核苷酸、75-200個(gè)核苷酸或80-120個(gè)核苷酸的長度。
在一些實(shí)施方案中,所述方法還包括例如通過基于陣列的合成獲得GEn-TraCER盒以及構(gòu)建所述載體。構(gòu)建載體的方法是本領(lǐng)域普通技術(shù)人員已知的,并且可以包括將GEn-TraCER盒連接至載體中。在一些實(shí)施方案中,在構(gòu)建載體之前例如通過PCR來擴(kuò)增GEn-TraCER盒或GEn-TraCER盒的亞組(庫)。
在表達(dá)Cas9的條件下維持或培養(yǎng)包含所述載體并且還編碼Cas9的細(xì)胞或細(xì)胞群體。可以控制Cas9表達(dá)。本文描述的方法包括使細(xì)胞維持在Cas9表達(dá)被激活的條件下,這導(dǎo)致產(chǎn)生Cas9。表達(dá)Cas9的具體條件將取決于諸如用來調(diào)節(jié)Cas9表達(dá)的啟動(dòng)子的性質(zhì)等因素。在一些實(shí)施方案中,在誘導(dǎo)物分子如阿拉伯糖的存在下,Cas9表達(dá)受到誘導(dǎo)。當(dāng)包含編碼Cas9的DNA的細(xì)胞或細(xì)胞群體在誘導(dǎo)物分子的存在下時(shí),發(fā)生Cas9的表達(dá)。在一些實(shí)施方案中,在阻抑物分子的存在下,Cas9表達(dá)受到抑制。當(dāng)包含編碼Cas9的DNA的細(xì)胞或細(xì)胞群體在不存在阻抑Cas9表達(dá)的分子時(shí),發(fā)生Cas9的表達(dá)。
從經(jīng)歷由Cas9介導(dǎo)的殺傷引起的未編輯的細(xì)胞死亡的細(xì)胞中獲得或分離出保持存活的細(xì)胞群體的細(xì)胞;這可以通過例如將所述細(xì)胞群體涂布在培養(yǎng)表面上以允許活細(xì)胞生長(該活細(xì)胞隨后可用于評估)來完成。
使用GEn-TraCER方法,通過對所述群體的活細(xì)胞(整合了PAM突變的細(xì)胞)中載體上的編輯盒進(jìn)行測序,與PAM突變偶聯(lián)的所需突變是可追蹤的。這允許在不需要對細(xì)胞的基因組進(jìn)行測序的情況下容易地鑒定突變。所述方法包括對編輯盒進(jìn)行測序以鑒定一個(gè)或多個(gè)密碼子的突變??梢詫ψ鳛樗鲚d體的組件的編輯盒進(jìn)行測序,或在從所述載體中分離出編輯盒和任選擴(kuò)增之后進(jìn)行測序??梢允褂帽绢I(lǐng)域已知的任何測序方法如通過Sanger測序進(jìn)行測序。
本文所述的方法可以在CRISPR系統(tǒng)可起作用(例如,靶向和裂解DNA)的任何類型的細(xì)胞(包括原核細(xì)胞和真核細(xì)胞)中進(jìn)行。在一些實(shí)施方案中,該細(xì)胞是細(xì)菌細(xì)胞,如埃希氏菌屬的種(Escherichia spp.)(例如,大腸桿菌)。在其他實(shí)施方案中,該細(xì)胞是真菌細(xì)胞,如酵母細(xì)胞,例如,酵母屬的種(Saccharomyces spp.)。在其他實(shí)施方案中,該細(xì)胞是藻細(xì)胞、植物細(xì)胞、昆蟲細(xì)胞或哺乳動(dòng)物細(xì)胞,包括人細(xì)胞。
“載體”是包含所需序列或有待遞送至細(xì)胞或在細(xì)胞中表達(dá)的序列的多種核酸中的任意一種。例如,可以通過限制和連接或通過重組將所需序列包含在載體中。載體通常由DNA組成,盡管RNA載體也是可用的。載體包括但不限于:質(zhì)粒、粘粒(fosmid)、噬菌粒、病毒基因組和人工染色體。
在GEN-TraCER方法中有用的載體包含至少一個(gè)如本文所述的編輯盒、啟動(dòng)子和至少一個(gè)編碼gRNA的基因。在一些實(shí)施方案中,載體上包含多于一個(gè)編輯盒(例如2、3、4、5、6、7、8、9、10個(gè)或更多個(gè)編輯盒)。在一些實(shí)施方案中,所述多于一個(gè)編輯盒與不同的靶區(qū)域同源(例如,存在不同的編輯盒,每一個(gè)編輯盒與不同的靶區(qū)域同源)??商娲鼗虺酥猓鲚d體可以包含編碼多于一個(gè)gRNA(例如,2、3、4、5、6、7、8、9、10個(gè)或更多個(gè)gRNA)的多于一個(gè)基因。在一些實(shí)施方案中,所述多于一個(gè)gRNA含有與不同靶區(qū)域的一部分互補(bǔ)的區(qū)域(例如,存在不同的gRNA,每一個(gè)gRNA與不同靶區(qū)域的一部分互補(bǔ))。
在一些實(shí)施方案中,將包含至少一個(gè)編輯盒、啟動(dòng)子和編碼gRNA的一部分的基因的GEn-TraCER盒連接至編碼gRNA的另一部分的載體中。經(jīng)連接,來自GEn-TraCER盒的gRNA的部分與gRNA的另一部分連接并形成功能性gRNA。
啟動(dòng)子和編碼gRNA的基因可操作地連接。在一些實(shí)施方案中,所述方法包括引入編碼Cas9的第二載體。在這樣的實(shí)施方案中,該載體可以進(jìn)一步包含與編碼Cas9的基因可操作地連接的一個(gè)或多個(gè)啟動(dòng)子。如本文所用的,“可操作地”連接意指啟動(dòng)子影響或調(diào)節(jié)諸如編碼gRNA的基因或編碼Cas9的基因等基因的編碼DNA的轉(zhuǎn)錄。該啟動(dòng)子可以是天然啟動(dòng)子(在引入載體的細(xì)胞中存在的啟動(dòng)子)。在一些實(shí)施方案中,該啟動(dòng)子是誘導(dǎo)型或阻抑型啟動(dòng)子(調(diào)節(jié)該啟動(dòng)子以允許諸如編碼gRNA的基因或編碼Cas9的基因等基因的誘導(dǎo)型或阻抑型轉(zhuǎn)錄),如通過分子(例如,誘導(dǎo)物或阻抑物)的存在或不存在調(diào)節(jié)的啟動(dòng)子。表達(dá)gRNA所需的啟動(dòng)子的性質(zhì)可以根據(jù)物種或細(xì)胞類型而變化,并且將被本領(lǐng)域普通技術(shù)人員所認(rèn)識到。
在一些實(shí)施方案中,所述方法包括在引入包含至少一個(gè)如本文所述的編輯盒、啟動(dòng)子和至少一個(gè)gRNA的載體之前或同時(shí),將編碼Cas9的單獨(dú)載體引入至細(xì)胞或細(xì)胞群體中。在一些實(shí)施方案中,將編碼Cas9的基因整合到細(xì)胞或細(xì)胞群體的基因組中??稍谝氚辽僖粋€(gè)如本文所述的編輯盒、啟動(dòng)子和至少一個(gè)gRNA的載體之前,或在引入包含至少一個(gè)如本文所述的編輯盒、啟動(dòng)子和至少一個(gè)gRNA的載體之后,將編碼Cas9的DNA整合到細(xì)胞基因組中?;蛘?,核酸分子,如編碼Cas9的DNA,可以由整合到基因組中的DNA表達(dá)。在一些實(shí)施方案中,將編碼Cas9的基因整合到細(xì)胞的基因組中。
在本文所述的GEn-TraCER方法中有用的載體可以進(jìn)一步包含間隔區(qū)序列、兩個(gè)或更多個(gè)引發(fā)位點(diǎn),或者間隔區(qū)序列和兩個(gè)或更多個(gè)引發(fā)位點(diǎn)兩者。在一些實(shí)施方案中,位于GEn-TraCER盒側(cè)翼的引發(fā)位點(diǎn)的存在允許編輯盒、啟動(dòng)子和gRNA核酸序列的擴(kuò)增。
實(shí)施例
實(shí)施例1:使用CARPE方法編輯galK
對大腸桿菌基因組中的半乳糖激酶基因galK實(shí)施CARPE方法;有許多試驗(yàn)可用來評估基因產(chǎn)物的活性。使用大腸桿菌BW23115親代菌株和pSIM5載體進(jìn)行實(shí)驗(yàn)(Datta等人.Gene(2008)379:109-115)以介導(dǎo)重組工程化。將編碼Cas9的基因克隆至pBTBX-2骨架中,處于pBAD啟動(dòng)子的控制下,以允許通過向培養(yǎng)基中添加阿拉伯糖來控制Cas9裂解活性。
首先,測試選擇性地并入合成dsDNA盒(127bp)的能力。該合成dsDNA盒來源于NNR文庫,該NNR文庫由簡并引物或由作為27,000個(gè)成員的文庫的一部分合成的理性設(shè)計(jì)的寡核苷酸經(jīng)由微陣列技術(shù)構(gòu)建。在這兩種情況下,將寡核苷酸設(shè)計(jì)為使galK基因產(chǎn)物的活性位點(diǎn)殘基發(fā)生突變,以及含有合成引發(fā)位點(diǎn)P1(SEQ ID NO:1)?;谑褂冕槍alK基因座的引物通過菌落PCR獲得的擴(kuò)增子大小的變化,驗(yàn)證了供體菌株文庫的高度有效的恢復(fù)。對來自NNR文庫的菌落PCR產(chǎn)物的測序表明,來自dsDNA盒的合成引發(fā)位點(diǎn)(P1)以約90-100%的效率并入(圖2)。這一驚人且出乎意料的結(jié)果表明,可以在不依靠通常在其他基于重組工程化的編輯方法中使用的易錯(cuò)mutS缺乏的菌株(Costantino等人PNAS(2003)100:15748-15753;Wang等人Nature(2009)460:894-898)的情況下,以高效率生成文庫。然而,密碼子突變的效率有所降低(約20%),這可能是由于在等位基因替換過程中的mutS校正。在此項(xiàng)工作中,當(dāng)構(gòu)建的兩個(gè)階段都在mutS+背景下進(jìn)行時(shí),最終密碼子編輯效率約為10%。
為了提高CARPE方法的最終編輯效率和通用性,可以在轉(zhuǎn)移到mutS+供體菌株之前在mutS缺乏的菌株中進(jìn)行供體構(gòu)建,以試圖防止在供體構(gòu)建階段中突變的損失。
實(shí)施例2:使用CARPE方法靶向必需基因
為了測試CARPE方法的通用性,如上所述對包括dxs、metA和folA在內(nèi)的多種必需基因使用該方法。可以使用gRNA設(shè)計(jì)策略靶向必需基因(圖3)。
來自靶向dxs基因的CARPE實(shí)驗(yàn)的數(shù)據(jù)也表明,盡管在供體文庫創(chuàng)建過程中發(fā)生基因破壞,但在重組工程化后1-3小時(shí)內(nèi)有效構(gòu)建并重獲供體文庫是可能的。
實(shí)施例3:使用CARPE方法調(diào)整異戊烯醇的生產(chǎn)
經(jīng)由細(xì)菌生產(chǎn)尋求用于工業(yè)生產(chǎn)的更好的生物燃料,需要進(jìn)行現(xiàn)有技術(shù)基因組設(shè)計(jì)、工程化和篩選所需產(chǎn)物的能力。先前我們證明了單獨(dú)改變大腸桿菌基因組中每個(gè)基因的表達(dá)水平的能力(Warner等人Nat.Biotechnol(2010)28:856-862)。該方法(被稱為可追蹤多路重組工程化(TRMR))產(chǎn)生了約8000個(gè)基因組修飾的細(xì)胞的文庫(約4000個(gè)過表達(dá)的基因和約4000個(gè)敲減的基因)。隨后在不同條件下篩查該文庫,這使得能夠更深入地了解基因產(chǎn)物的活性并在這些選擇下產(chǎn)生表現(xiàn)更好的菌株。TRMR允許改變兩個(gè)水平的蛋白質(zhì)表達(dá)(過表達(dá)的和敲減的)但不能實(shí)現(xiàn)開放閱讀框(ORF)的修飾。在此,我們的目的是產(chǎn)生ORF修飾的大文庫,并對整個(gè)代謝途徑進(jìn)行工程化以最優(yōu)化生物燃料的生產(chǎn)。
產(chǎn)生這樣的理性設(shè)計(jì)(相比于隨機(jī)誘變)的文庫的主要困難是將所需突變插入靶細(xì)胞中的效率。重組工程化——在大腸桿菌中進(jìn)行基因組修飾的典型方法——使用來自λ噬菌體的重組基因來促進(jìn)外來DNA向宿主基因組中的插入。然而,該方法具有低效率,并且可通過添加抗生素抗性基因隨后選擇(如在TRMR中)或通過遞歸誘導(dǎo)重組事件(即,通過MAGE(Wang等人Nature(2008)460:894-898))來克服。本文所述的CARPE方法提高了重組工程化效率,包括使用CRISPR系統(tǒng)從群體中去除所有非重組細(xì)胞。CRISPR是近來發(fā)現(xiàn)的細(xì)菌和古細(xì)菌針對入侵噬菌體和質(zhì)粒的基于RNA的適應(yīng)性防御機(jī)制(Bhaya等人Ann.Rev.of Genetics(2011)45:273-297)。該系統(tǒng)經(jīng)歷巨大工程化,以使得能夠使用兩個(gè)質(zhì)粒來允許序列引導(dǎo)的雙鏈斷裂,一個(gè)質(zhì)粒編碼CRISPR相關(guān)的核酸酶Cas9,而第二個(gè)質(zhì)粒編碼序列特異性指導(dǎo)RNA(gRNA),gRNA將Cas9引導(dǎo)至其獨(dú)特的位置(Qi等人Cell(2013)45:273-297)。CARPE方法利用CRISPR系統(tǒng)以序列依賴性方式誘導(dǎo)DNA斷裂并因此導(dǎo)致細(xì)胞死亡的能力。我們產(chǎn)生了DNA重組工程化盒,它除了ORF內(nèi)的所需突變以外還包含在被CRISPR機(jī)制所針對的基因的開放閱讀框外部的常見位置中的突變。這種將所需突變與由于PAM突變/缺失而避免CRISPR介導(dǎo)的死亡相連接/偶聯(lián)的方法使得能夠顯著富集在全部細(xì)胞群體內(nèi)的工程化細(xì)胞。
使用DXS途徑進(jìn)一步闡釋所述方法。DSX途徑導(dǎo)致產(chǎn)生異戊烯焦磷酸(IPP),IPP導(dǎo)致萜類和類萜化合物的生物合成。有趣的是,如果添加所需基因,IPP還可以是番茄紅素或異戊烯醇的前體。番茄紅素使得細(xì)菌菌落呈紅色,并因此可容易地篩選,而異戊烯醇被認(rèn)為是具有比乙醇更高的能量密度和更低的水混溶性的‘第二代’生物燃料。選擇以下三種蛋白質(zhì)進(jìn)行工程化:1)DSX,所述途徑的第一個(gè)限速酶,2)IspB,其將代謝流從DXS途徑轉(zhuǎn)移,和3)NudF,已證明其在大腸桿菌和枯草芽孢桿菌(B.subtilis)中均將IPP轉(zhuǎn)化為異戊烯醇(Withers等人App.Environ.Microbiol(2007)73:6277-6283;Zheng等人Biotechnol.for biofuels(2013)6:57))。將采用針對菌落顏色量化開發(fā)的新的圖像分析工具針對增加的番茄紅素產(chǎn)量來篩選編碼DXS和IspB的基因的突變。NudF活性通過經(jīng)GC/MS測量異戊烯醇水平而直接測定,并且通過將會用作生物傳感器的異戊烯醇營養(yǎng)缺陷型細(xì)胞而間接測定。該方法提供了以高準(zhǔn)確度和效率將大的突變文庫理性工程化至大腸桿菌基因組中的能力,以及產(chǎn)生高產(chǎn)率異戊烯醇的菌株。
實(shí)施例4:使用GEn-TraCER方法編輯galK
使用GEn-TraCER方法編輯galK基因,galK基因已用作在大腸桿菌中重組工程化的模式系統(tǒng)(Yu等人2000)。構(gòu)建的第一GEn-TraCER盒被設(shè)計(jì)為在galK的密碼子24處引入終止密碼子代替框內(nèi)PAM,被稱為galK_Q24(圖12)。使用自定義的python腳本設(shè)計(jì)構(gòu)建體和載體以高通量地生成必要突變。
使用環(huán)形聚合酶克隆(CPEC)法將對照盒克隆至由Qi等人Cell(2013)描述的gRNA載體中。采用以下引物使骨架線性化:CCAGAAATCATCCTTAGCGAAAGCTAAGGAT(SEQ ID NO:29)和GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCT(SEQ ID NO:30)。
GenTRACER盒作為gblock定購,并使用以下引物進(jìn)行擴(kuò)增:
ATCACGAGGCAGAATTTCAGATAAAAAAAATCCTTAGCTTTCGCTAAGGATGATTTCTGG(SEQ ID NO:31),
ACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC(SEQ ID NO:32)。
使用CPEC將組件縫合在一起,并將組件轉(zhuǎn)化至大腸桿菌中以生成載體。使用合并的寡核苷酸文庫以多路的方式執(zhí)行該程序,其中克隆效率為104-105CFU/μg的數(shù)量級。
在30℃下,在含有50μg/mL卡那霉素和34μg/mL氯霉素的LB中,使攜帶pSIM5(λ-RED質(zhì)粒)和X2-cas9質(zhì)粒的大腸桿菌MG1655細(xì)胞生長至對數(shù)中期(0.4-0.7OD)。在42℃下誘導(dǎo)pSIM5載體的重組工程化功能15min,隨后在冰上放置10min。隨后通過沉淀并用10mL冷卻H2O洗滌2次而使細(xì)胞成為電感受態(tài)細(xì)胞。將細(xì)胞用100ng的GEn-TraCER質(zhì)粒(也編碼羧芐青霉素抗性)轉(zhuǎn)化并在37℃下恢復(fù)3hr。將50-100μL的細(xì)胞接種到含有50μg/mL卡那霉素和100μg/ml羧芐青霉素的合適的培養(yǎng)基中,以選擇性地富集CRISPR編輯的菌株。在補(bǔ)充有半乳糖的MacConkey瓊脂上使用紅色/白色篩選,計(jì)算galK基因的編輯效率。
基于MacConkey瓊脂上的篩選,觀察到galK_Q24*設(shè)計(jì)有約100%的編輯效率。有趣的是,不同于需要錯(cuò)配修復(fù)敲除來達(dá)到高效率的寡核苷酸介導(dǎo)的重組工程化方法(Li等人2003;Sawitzke等人2011;Wang等人2011),在錯(cuò)配修復(fù)機(jī)制完整或不完整的情況下在菌株中沒有影響。
隨后通過Sanger測序驗(yàn)證染色體和載體序列。
如所預(yù)期的,載體中設(shè)計(jì)的突變反映在染色體上(圖13),這表明突變存在于兩個(gè)位置中并且該質(zhì)粒充當(dāng)反式作用條形碼(反式條形碼)或基因組編輯的記錄。
所述設(shè)計(jì)適合于通過生成由同義PAM突變(圖14B,ΔPAM)組成的“沉默可選擇疤痕”,在基因組規(guī)模上理性誘變蛋白質(zhì)編碼框,以針對Cas9介導(dǎo)的裂解“免疫”該細(xì)胞,而使翻譯產(chǎn)物未受到干擾。我們推斷沉默疤痕可以允許以高效率共選擇在密碼子附近的編輯或其他感興趣的特征。評估同源性臂長和galK中PAM突變/缺失與所需突變之間的距離的影響,并比較其效率(圖16B)。當(dāng)用相同的PAM編輯將同源性臂長從80個(gè)核苷酸延伸至100個(gè)核苷酸時(shí),觀察到在galK位置145處的突變效率顯著增加(分別為約5%和45%)。
實(shí)施例5:使用GEn-TraCER方法重建突變
使用自定義的自動(dòng)化設(shè)計(jì)軟件將GEn-TraCER方法擴(kuò)展至基因組規(guī)模,該軟件允許用簡單的用戶輸入定義來靶向基因組周圍的位點(diǎn)。通過重建來自近來報(bào)道的大腸桿菌熱適應(yīng)研究(Tenaillon等人2012)的全部非同義點(diǎn)突變來測試所述方法。該研究表征了在來自獨(dú)立繁殖的菌株的115個(gè)隔離株中發(fā)生的全套突變。該數(shù)據(jù)集提供了突變的多樣化來源,該來源的單獨(dú)適合性影響進(jìn)一步闡明了這一復(fù)雜表型的機(jī)械基礎(chǔ)。在密碼子使用和ΔPAM中,在可能的情況下,這些突變中的每一個(gè)均以2倍冗余度重建,以便在下游適合性分析中實(shí)現(xiàn)PAM和靶密碼子突變的統(tǒng)計(jì)校正。
實(shí)施例6:使用GEn-TraCER方法調(diào)整遺傳相互作用
通過在大腸桿菌基因組中每個(gè)基因的上游整合被環(huán)境因素(氧水平、碳源、應(yīng)力)動(dòng)態(tài)調(diào)節(jié)的啟動(dòng)子來生成啟動(dòng)子重置(rewiring)文庫。使用GEn-TraCER方法生成菌株,該菌株具有可能有利于例如對用于生產(chǎn)的感興趣化學(xué)品的耐受性的重置的基因型。