本申請要求于2015年11月17日提交的美國臨時申請?zhí)?2/256,514的權(quán)益,并且要求于2016年1月29日提交的美國臨時申請?zhí)?2/288,974的權(quán)益,二者通過引用完全結(jié)合在本文中。
發(fā)明背景
研發(fā)對活細胞的基因組進行精確的靶向改變的有效且可靠的工具是生物醫(yī)學(xué)研究者的長遠目標(biāo)。最近,一種基于來自釀膿鏈球菌(Streptococcus pyogenes)的細菌CRISPR-相關(guān)蛋白-9核酸酶(Cas9)的新技術(shù)已經(jīng)產(chǎn)生了值得注意的興奮和興趣,例如,參見,Cong等人(2013)Science,339,819-823。在過去兩年間已經(jīng)進行了多方嘗試,以試圖利用該CRISPR/Cas9系統(tǒng)以高靶標(biāo)特異性的方式操作基因組序列和基因功能。
另一方面,研究嘗試提高CRISPR/Cas9誘導(dǎo)的DNA切割的同源性定向修復(fù)(HDR)的效率,用以實現(xiàn)在基因組中的精確的靶向DNA插入:Yu等人在2015年成功地鑒定了幾種提高HDR效率的小化學(xué)分子[24];Maruyama等人在2015年抑制了非同源末端連接(NHEJ)途徑,從而提高基因組編輯的HDR效率[25];Zhu等人在2015年開發(fā)了iCRISPR系統(tǒng),從而最優(yōu)化費力的策略并且避免用于人多能干細胞(hPSC)中的基因敲入的藥物選擇步驟[26];Merkle等人在2015年設(shè)計了一種策略:利用生物信息學(xué)鑒定在靶向的等位基因上物理分離CRISPR靶位點,從而提高基因敲入的精確性[15]。然而,在這些研究中,在介導(dǎo)大DNA片段的敲入方面,特別是在人多能干細胞(hPSCs)中的敲入方面仍然是效率低的。最近,Li等人在2015年和Hisano等人在2015年開發(fā)了Cas9-介導(dǎo)的供體載體(donor vector),其在斑馬魚中表現(xiàn)出高效的DNA插入,并且該系統(tǒng)被證實是可遺傳的[27,28]。然而,該系統(tǒng)不是在人細胞中設(shè)計并檢驗的,由此,仍然亟需用于人細胞(包括hPSC)的優(yōu)化的系統(tǒng)。
RNA-指導(dǎo)的基因組改造已經(jīng)廣泛用于細胞生物學(xué)研究。原始的CRISPR/Cas9系統(tǒng)表現(xiàn)出市場潛力,并且在最近兩年被授予一些美國專利[29-34]。它們中的一些已經(jīng)處在商業(yè)開發(fā)階段。我們之前的發(fā)明,美國臨時專利號62/256,514,提供優(yōu)化的CRISPR/Cas9系統(tǒng),其包括靈活的供體載體和有用的步驟,具有成為生物學(xué)研究者的用戶友好的工具試劑盒產(chǎn)品的重大潛力。另外,本發(fā)明的潛在的應(yīng)用包括在臨床情形中的多種應(yīng)用,包括疾病診斷和基因修正。
具體而言,本發(fā)明的Cas9-介導(dǎo)的基因組編輯系統(tǒng)適合用于人細胞并且具有一些優(yōu)點。例如,這些改進的系統(tǒng)成功地滿足了在人細胞(包括人胚胎干細胞(ESCs)和誘導(dǎo)的多能干細胞(iPSCs))中的高HR效率的需要。與之前已知的方法相比,在人ESCs中的HR效率已經(jīng)提高多至5倍。并且,本發(fā)明提供通用的基因組編輯系統(tǒng),其具有也用于低等脊椎動物的潛力。另外,所述系統(tǒng)是用戶友好的,包括一些供體構(gòu)建體的設(shè)計,使得這些系統(tǒng)對于研究和臨床情境中的多種不同的應(yīng)用是非常有價值的。
在本發(fā)明中,為Cas9-介導(dǎo)的基因組編輯系統(tǒng)在不同基因組基因座和條件中的應(yīng)用提供進一步的證據(jù)。進一步證明了不依賴同源性的報道子整合的分子基礎(chǔ)和效率;并且提供了用于在沉默的基因的基因座處的NHEJ-介導(dǎo)的有效敲入的另外的方法和系統(tǒng)。另外,研究了NHEJ-介導(dǎo)的敲入系統(tǒng)的脫靶效應(yīng)。
并且,公開了向GAPDH基因座的3’-UTR處的CPF1-誘導(dǎo)的DSBs中不依賴同源性敲入報道基因的另外的方法和系統(tǒng),其證明了對定向整合的偏好性。由此,本申請公開了用于使用CRISPR/CPF1通過NHEJ介導(dǎo)的單向優(yōu)選的(unidirection-preferred)敲入的方法和系統(tǒng)。
本申請還公開了報道基因不依賴同源性的雙色插入敲入的另外的方法和系統(tǒng)。因此,本申請公開了用于使用CRISPR/Cas9通過NHEJ介導(dǎo)的雙向敲入的方法和系統(tǒng)。
另外,公開了在多個基因組等位基因上的一個靶基因中不依賴同源性敲入多種報道基因的方法和系統(tǒng),這證明產(chǎn)生了單種或兩種陽性細胞群體。因此,本申請公開了向多個等位基因中NHEJ-介導(dǎo)敲入多種顏色熒光報道基因的構(gòu)建體、方法和系統(tǒng)。
發(fā)明概述
本發(fā)明提供用于基于CRISPR/Cas9和CRISPR/Cpf1的基因編輯的新的細胞系、多核苷酸構(gòu)建體、組合物、試劑盒和系統(tǒng),其允許人們進行關(guān)于基因組序列的機制和調(diào)節(jié)的研究以及鑒定能夠調(diào)節(jié)所述基因組編輯事件的化合物。
本文公開的基因編輯系統(tǒng)包括兩種一般類型:第一種是涉及兩次插入事件的類型,而第二種僅涉及一次插入事件。對于第一種類型,本發(fā)明提供整合構(gòu)建體、供體構(gòu)建體、轉(zhuǎn)化的宿主細胞、組合物、試劑盒以及使用該基因編輯系統(tǒng)的多種方法。更具體而言,在整合構(gòu)建體中,典型地包括啟動子,其從5′到3′可操作地連接用于報道基因的第一非功能性編碼片段、中斷片段(interrupter segment)和用于報道基因的第二非功能性編碼片段,從而使得所述啟動子不表達功能性報道蛋白。在一些實施方案中,所述整合構(gòu)建體還包含兩個基因組同源序列,一個位于啟動子的5′端,另一個位于用于報道基因的第二非功能性編碼片段的3′端。這兩個基因組同源序列與細胞預(yù)先確定的遺傳基因座的基因組序列的兩個片段同源,從而使得這兩個基因組同源序列的存在允許整合構(gòu)建體與所述細胞在該預(yù)先確定的遺傳基因座處的基因組序列之間的同源重組。在一些實施方案中,所述整合構(gòu)建體是環(huán)形構(gòu)建體,例如,質(zhì)粒。在一些實施方案中,報道基因編碼綠色熒光蛋白(GFP)。在一些實施方案中,兩個基因組同源序列中的每一個長度為約100-5000個、200-2500個或500-1500個核苷酸,優(yōu)選長度為1000個核苷酸。在一些實施方案中,整合構(gòu)建體中的啟動子與報道基因異源(即,取自兩個不同的物種或已經(jīng)被重組修飾過)。在一些實施方案中,用于報道基因的第一和第二非功能性編碼片段,當(dāng)沒有中斷片段而連接在一起時,編碼功能性報道基因蛋白。所述中斷片段可以是任意長度的,只要其中斷報道基因的表達即可。在一些實施方案中,中斷序列長度為約10-2000個、15-1000個、20-500個或25-100個核苷酸,優(yōu)選長度為30個核苷酸。在一些實施方案中,中斷片段包含三個終止密碼子,其分別在不同的閱讀框中,從而完全消除報道基因的表達。在一些實施方案中,預(yù)先確定的遺傳基因座包含看家基因。
還為第一種類型的基因編輯系統(tǒng)提供供體構(gòu)建體,其從5′至3′包含第一報道基因同源片段、間隔片段和第二報道基因同源片段。第一和第二報道基因同源片段與整合構(gòu)建體中用于報道基因的第一和第二非功能性編碼片段同源,從而使得這兩個報道基因同源片段的存在允許在整合構(gòu)建體與供體構(gòu)建體之間的同源重組,從而形成用于功能性報道基因的編碼序列。在一些實施方案中,第一和第二報道基因同源片段中的每一個長度為約100-1000個、200-800個或250-500個核苷酸,優(yōu)選長度為250個、500個或800個核苷酸。在一些實施方案中,間隔片段長度為約10-2000個、15-1000個、20-500個或25-100個核苷酸,例如,長度為30個核苷酸或726個核苷酸。在一些實施方案中,間隔片段編碼功能性報道基因蛋白。
本公開內(nèi)容的另一個方面是包含上文以及也在本申請的多個部分中所述的整合構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在一些實施方案中,所述整合構(gòu)建體已經(jīng)結(jié)合到細胞的基因組中。在一些實施方案中,所述細胞還包含供體構(gòu)建體。在一個實施方案中,宿主細胞包括在所有LIG4基因的基因座中具有大的缺失的LO2細胞系,所述大的缺失通過缺乏DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
進一步公開的是包含所述細胞的組合物,所述細胞包含整合構(gòu)建體、供體構(gòu)建體、編碼sgRNA的DNA分子和編碼Cas9蛋白的DNA分子,所述sgRNA能夠與用于報道基因的第一非功能性編碼片段或中斷片段內(nèi)的靶位點序列(典型地長度約20個核苷酸的片段,但是可以在約10-50個、15-45個或20-40個核苷酸間變化,例如,約20個、25個或30個核苷酸)雜交。
另外公開了用于檢測CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)整合構(gòu)建體;(2)供體構(gòu)建體;(3)編碼能夠與用于報道基因的第一非功能性編碼片段或中斷片段內(nèi)的靶位點序列雜交的sgRNA的DNA分子;和(4)編碼Cas9蛋白的DNA分子。
還公開了使用第一類型的基因編輯系統(tǒng)的方法。公開了用于檢測CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的方法,所述方法包括下述步驟:(i)使包含整合構(gòu)建體的細胞與下述接觸:供體構(gòu)建體、編碼能夠與用于報道基因的第一非功能性編碼片段或中斷片段內(nèi)的靶序列位點(例如,約20個核苷酸的片段)雜交的sgRNA的DNA分子、和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號。
公開的另一種方法是鑒定用于CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,其包括下述步驟:(i)在存在和不存在候選化合物的條件下,使權(quán)利要求7的細胞與下述接觸:權(quán)利要求5的供體構(gòu)建體、編碼能夠與用于報道基因的第一非功能性編碼片段或中斷片段內(nèi)的約20個核苷酸的片段雜交的sgRNA的DNA分子、和編碼Cas9蛋白的DNA分子;和(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑。
對于其中僅發(fā)生一次整合事件的第二類型的基因編輯系統(tǒng),本發(fā)明提供包含下述的供體構(gòu)建體:(1)用于報道基因的編碼序列;(2)位于報道基因編碼序列的5′端的第一基因組同源片段;和(3)位于報道基因編碼序列的3′端的第二基因組同源片段,其中所述第一和第二基因組同源片段與預(yù)先確定的基因組序列同源。在一些實施方案中,第一和第二基因組同源片段與在細胞預(yù)先確定的遺傳基因座的兩個基因組序列片段同源,使得這兩個基因組同源片段的存在允許在所述供體構(gòu)建體與所述細胞在預(yù)先確定的遺傳基因座的基因組序列之間的同源重組。在一些實施方案中,所述供體構(gòu)建體是環(huán)形構(gòu)建體,例如,質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。在一些實施方案中,兩個基因組同源片段中的每一個長度約為100-5000個、200-2500個或500-1500個核苷酸,優(yōu)選長度為1000個核苷酸。在一些實施方案中,所述預(yù)先確定的遺傳基因座包含看家基因。
本公開內(nèi)容的另一方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述宿主細胞包括在所有LIG4基因的基因座中具有大的缺失的LO2細胞系,所述基因座中大的缺失是通過缺少DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
進一步公開的是包含下述的組合物:細胞,供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段(典型地,長度約為20個核苷酸的靶位點序列,但是可以在約10-50個、15-45個或20-40個核苷酸間變化,例如,約20個、25個或30個核苷酸)雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子;和(3)編碼Cas9蛋白的DNA分子。
還提供使用所述供體構(gòu)建體來檢測CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段(例如,靶序列位點)雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;和(ii)檢測由報道基因蛋白產(chǎn)生的信號。
另外,公開的是用于鑒定CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑的方法,所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:供體構(gòu)建體、編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑(homology-directed repair pathway)的抑制劑。
作為第二種類型的基因編輯系統(tǒng)的變型(variation),公開了包含下述的供體構(gòu)建體:(1)報道基因的編碼序列;和(2)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段,任選地具有一個位于所述報道基因編碼序列的5′端或多聚腺苷酸片段的3′端的靶序列位點,或具有兩個靶序列位點,其中一個位于所述報道基因編碼序列的5′端,另一個位于多聚腺苷酸片段的3′端。優(yōu)選的構(gòu)建體形式是環(huán)形形式,諸如質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。
本公開內(nèi)容的另一個方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述宿主細胞包括在所有LIG4基因的基因座中具有大的缺失(deletion)的LO2細胞系,所述基因座中大的缺失通過缺少DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
還公開了包含下述的組合物:細胞、供體構(gòu)建體、編碼能夠與靶序列位點雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼能夠與靶序列位點雜交的sgRNA的DNA分子;和(3)編碼Cas9蛋白的DNA分子。
公開了利用這種類型的構(gòu)建體檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:這種變型的供體構(gòu)建體、編碼分別能夠與所述靶序列位點之一雜交的一種或兩種sgRNAs的一種或兩種DNA分子、和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號。
另外公開的是使用該種供體構(gòu)建變型來鑒定CRISPR-介導(dǎo)的非同源末端連接修復(fù)途徑的增強劑的方法。所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:所述供體構(gòu)建體、一種或兩種編碼一種或兩種分別能夠與所述靶序列位點之一雜交的sgRNAs的DNA分子、和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)與不存在所述化合物相比,當(dāng)在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且與不存在所述化合物相比,當(dāng)在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的非同源末端連接修復(fù)途徑的抑制劑。在一些實施方案中,步驟(i)中的細胞與編碼兩種sgRNAs的兩種DNA分子接觸,所述兩種sgRNAs中的一種能夠與所述供體構(gòu)建體內(nèi)的靶序列位點雜交,并且另一種能夠與預(yù)先確定的基因組區(qū)域中的非編碼序列雜交。
作為第二類型的基因編輯系統(tǒng)的另一種變型,公開了這樣的供體構(gòu)建體,其包含:(1)報道基因的編碼序列;(2)在所述報道基因編碼序列的5′端的雙順反子;(3)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段;(4)位于所述雙順反子元件的5′端的第一基因組同源性片段;和(5)位于所述報道基因編碼序列的3′端的第二基因組同源性片段,其中所述第一和第二基因組同源性片段與預(yù)先確定的基因組序列同源。在一個實施方案中,位于報道子編碼序列的3’端的第二基因組同源性片段是在多聚腺苷酸(polyA)片段的3’端。在一個實施方案中,所述供體構(gòu)建體還包含在第一基因組同源性片段的5′端或在第二基因組同源性片段的3′端的靶序列位點。構(gòu)建體的優(yōu)選形式是環(huán)形,諸如質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。在一些實施方案中,所述雙順反子元件與所述報道基因是異源的。在一些實施方案中,所述預(yù)先確定的基因組序列包含看家基因。在一些實施方案中,所述預(yù)先確定的基因組序列包含沉默的基因。在一些實施方案中,第一和第二基因組同源性片段中的每一個長度約為100-5000個、200-2500個、500-1500個或優(yōu)選約1000個核苷酸。在一個實施方案中,所述供體構(gòu)建體可以包含一個或多個報道基因。在一個實施方案中,所述供體構(gòu)建體可以包含兩個編碼兩種不同的報道基因的編碼序列。在另一個實施方案中,所述供體構(gòu)建體可以包含兩種報道基因。在另一個實施方案中,所述供體構(gòu)建體可以包含兩個拷貝的報道基因,優(yōu)選在所述供體構(gòu)建體內(nèi)的不同方向上包含兩個拷貝的報道基因(即,兩個定向供體構(gòu)建體)。在另一個實施方案中,所述供體構(gòu)建體可以包括單一切割線性化的供體質(zhì)粒。在另一個實施方案中,所述供體構(gòu)建體可以包含雙切割線性化的構(gòu)體質(zhì)粒。在一個實施方案中,所述供體構(gòu)建體可以進一步包含在所述雙順反子元件的5’端的第一LoxP基因和在所述多聚腺苷酸(polyA)片段的3’端的第二LoxP序列。
本公開內(nèi)容的另一個方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述供體構(gòu)建體可以進一步包含在第一基因組同源性片段的5′端或在第二基因組同源性片段的3′端的靶序列位點。在一個實施方案中,所述宿主細胞包括在所有LIG4基因的基因座中具有大的缺失的LO2細胞系,所述基因座中大的缺失通過缺少DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
另外公開的是包含下述的組合物:細胞,供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子;和(3)編碼Cas9蛋白的DNA分子。
還公開使用這種類型的構(gòu)建體來檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:這種變型的供體構(gòu)建體,編碼一種或兩種分別能夠與靶序列位點中的一個雜交的sgRNA的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
公開了使用這種類型的構(gòu)建體平行檢測CRISPR-介導(dǎo)的同源性定向修復(fù)和非同源末端連接途徑的方法,所述方法包括下述步驟:(i)使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)和供體構(gòu)建體內(nèi)的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;其中不存在編碼能夠與所述供體構(gòu)建體雜交的sgRNA的DNA分子涉及(pertain to)同源性定向修復(fù)途徑,并且包括編碼能夠與所述供體構(gòu)建體雜交的sgRNA的DNA分子涉及非同源末端連接修復(fù)途徑;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
公開了使用這種類型的構(gòu)建體鑒定CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑的方法,所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的抑制劑。
作為第二種類型的基因編輯系統(tǒng)的另一種變型,公開了這樣的供體構(gòu)建體,其包含:(1)報道基因的編碼序列;(2)在所述報道基因編碼序列的5′端的通用且組成型的啟動子;(3)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段;(4)位于所述通用且組成型的啟動子的5′端的第一基因組同源性片段;和(5)位于所述報道基因編碼序列的3′端的第二基因組同源性片段,其中所述第一和第二基因組同源性片段與預(yù)先確定的基因組序列同源。在一個實施方案中,位于報道子編碼序列的3’端的第二基因組同源性片段在所述多聚腺苷酸(poly A)片段的3’端。在一個實施方案中,所述供體構(gòu)建體還包含在第一基因組同源性片段的5′端或在第二基因組同源性片段的3′端的靶序列位點。構(gòu)建體的優(yōu)選形式是環(huán)形,諸如質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。在一些實施方案中,所述通用且組成型的啟動子與所述報道基因是異源的。在一些實施方案中,所述預(yù)先確定的基因組序列包含看家基因。在一些實施方案中,所述預(yù)先確定的基因組序列包含沉默的基因。在一些實施方案中,第一和第二基因組同源性片段中的每一個長度約為100-5000個、200-2500個、500-1500個、或優(yōu)選約1000個核苷酸。
本公開內(nèi)容的另一個方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述供體構(gòu)建體可以進一步包含在第一基因組同源性片段的5′端或在第二基因組同源性片段的3′端的靶序列位點。在一個實施方案中,所述宿主細胞包括在所有LIG4基因的基因座中具有大的缺失的LO2細胞系,所述基因座中大的缺失通過缺少DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
另外公開的是包含下述的組合物:細胞,供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子;和(3)編碼Cas9蛋白的DNA分子。
公開了使用這種類型的構(gòu)建體檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:這種變型的供體構(gòu)建體,編碼能夠雜交到在預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
還公開使用這種類型的構(gòu)建體檢測在沉默的基因組基因座中CRISPR-介導(dǎo)的同源性定向報道子敲入的方法,所述方法包括下述步驟:(i)使細胞與下述接觸:上文所述的供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)在多次傳代后,檢測由報道基因蛋白產(chǎn)生的信號。在一個實施方案中,多次傳代是指不少于5代。
公開了使用這種類型的構(gòu)建體用于CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的方法,所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的抑制劑。
作為第二種類型的基因編輯系統(tǒng)的另一種變型,公開了這樣的供體構(gòu)建體,其包含:(1)報道基因的編碼序列;(2)在所述報道基因編碼序列的5′端的雙順反子元件;(3)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段,任選地具有位于所述報道基因編碼序列的5′端的一個靶序列位點,或具有兩個靶序列位點,一個位于所述報道基因編碼序列的5′端并且另一個位于所述多聚腺苷酸(polyA)片段的3′端。構(gòu)建體的優(yōu)選形式是環(huán)形,諸如質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。在一些實施方案中,所述雙順反子元件與所述報道基因是異源的。在一個實施方案中,所述供體構(gòu)建體還包含位于所述雙順反子元件的5’端的第一基因組同源性片段;和位于所述報道基因的3’端的第二基因組同源性片段,其中所述第一和第二基因組同源性片段與預(yù)先確定的基因組序列同源。在一些實施方案中,所述預(yù)先確定的基因組序列包含看家基因。在一些實施方案中,所述預(yù)先確定的基因組序列包含沉默的基因。在一些實施方案中,第一和第二基因組同源性片段中的每一個長度約為100-5000個、200-2500個、500-1500個或優(yōu)選約1000個核苷酸。在一個實施方案中,所述供體構(gòu)建體可以包含一種或多種報道基因。在一個實施方案中,所述供體構(gòu)建體可以包含編碼兩種不同的報道基因的兩個編碼序列。在另一個實施方案中,所述供體構(gòu)建體可以包含兩種報道基因。在另一個實施方案中,所述供體構(gòu)建體可以包含兩個拷貝的報道基因,優(yōu)選在所述供體構(gòu)建體內(nèi)的不同方向上包含兩個拷貝的報道基因(即,兩個定向的供體構(gòu)建體)。在另一個實施方案中,所述供體構(gòu)建體可以包括單一切割線性化的供體質(zhì)粒。在另一個實施方案中,所述供體構(gòu)建體可以包含雙切割線性化的構(gòu)體質(zhì)粒。在一個實施方案中,所述供體構(gòu)建體可以進一步包含在所述雙順反子元件的5’端的第一LoxP序列和在所述多聚腺苷酸(polyA)片段的3’端的第二LoxP序列。
本公開內(nèi)容的另一個方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述供體構(gòu)建體還包含兩個靶序列位點,一個位于所述報道基因編碼序列的5′端,并且另一個位于所述多聚腺苷酸(polyA)片段的3′端。在一個實施方案中,所述宿主細胞包括在所有LIG4基因的基因座中具有大的缺失的LO2細胞系,所述基因座中大的缺失通過缺少DNA連接酶IV蛋白的表達而確定。在一個實施方案中,缺乏DNA連接酶IV蛋白的表達可以通過本領(lǐng)域中常規(guī)使用的多種方法中的一種確定,例如,通過蛋白質(zhì)印跡確定。在一個實施方案中,所述宿主細胞可以包括人的體細胞。
另外公開的是包含下述的組合物:細胞,供體構(gòu)建體,編碼一種或兩種分別能夠與所述靶序列位點中的一個雜交的sgRNA的一種或兩種DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼一種或兩種分別能夠與所述靶序列位點中的一個雜交的sgRNA的一種或兩種DNA分子;和(3)編碼Cas9蛋白的DNA分子。
還公開使用這種類型的構(gòu)建體來檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:這種變型的供體構(gòu)建體,編碼一種或兩種分別能夠與靶序列位點中的一個雜交的sgRNAs的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
公開了使用這種類型的構(gòu)建體鑒定CRISPR-介導(dǎo)的非同源末端連接修復(fù)途徑的增強劑的方法,所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:上述供體構(gòu)建體,編碼一種或兩種分別能夠與靶序列位點中的一個雜交的sgRNA的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的抑制劑。
在第二種類型的基因編輯系統(tǒng)的另一種變型中,公開了這樣的供體構(gòu)建體,其包含:(1)報道基因的編碼序列;(2)在所述報道基因編碼序列的5′端的通用且組成型的啟動子;和(3)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段,任選地具有位于所述報道基因編碼序列的5′端的一個靶序列位點,或具有兩個靶序列位點,一個位于所述報道基因編碼序列的5′端并且另一個位于所述多聚腺苷酸(polyA)片段的3′端。構(gòu)建體的優(yōu)選形式是環(huán)形,諸如質(zhì)粒。在一些實施方案中,所述報道基因編碼綠色熒光蛋白(GFP)或抗藥基因。在一些實施方案中,所述通用且組成型的啟動子與所述報道基因是異源的。在一個實施方案中,所述供體構(gòu)建體還包含位于所述通用且組成型的啟動子的5’端的第一基因組同源性片段;和位于所述報道基因的3’端的第二基因組同源性片段,其中所述第一和第二基因組同源性片段與預(yù)先確定的基因組序列同源。在一些實施方案中,所述預(yù)先確定的基因組序列包含看家基因。在一些實施方案中,所述預(yù)先確定的基因組序列包含沉默的基因。在一些實施方案中,第一和第二基因組同源性片段中的每一個長度約為100-5000個、200-2500個、500-1500個或優(yōu)選約1000個核苷酸。在一個實施方案中,所述供體構(gòu)建體是恒定表達構(gòu)建體(constant expression construct),諸如CE NH-供體。
本公開內(nèi)容的另一個方面是包含上文并且還在本申請的各個部分中所述的供體構(gòu)建體的宿主細胞。所述細胞可以是干細胞或體細胞,并且所述細胞可以是人細胞或動物細胞。在一些實施方案中,所述細胞是人干細胞。在優(yōu)選的實施方案中,所述供體構(gòu)建體已經(jīng)結(jié)合在細胞的基因組中。在一個實施方案中,所述供體構(gòu)建體可以進一步包含兩個靶序列位點,一個位于所述報道基因編碼序列的5′端,并且另一個位于多聚腺苷酸(polyA)片段的3′端。
另外公開的是包含下述的組合物:細胞,供體構(gòu)建體,一種或兩種編碼一種或兩種分別能夠與所述靶序列位點中的一個雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子。
另外,公開了用于檢測CRISPR-介導(dǎo)的同源定向修復(fù)途徑的試劑盒。其典型地包括這些成分:(1)供體構(gòu)建體;(2)編碼分別能夠與所述靶序列位點中的一個雜交的一種或兩種sgRNA的一種或兩種DNA分子;和(3)編碼Cas9蛋白的DNA分子。
公開了使用這種類型的構(gòu)建體來檢測CRISPR-介導(dǎo)的非同源末端連接途徑(non-homologous end joining pathway)的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:這種變型的供體構(gòu)建體,編碼分別能夠與靶序列位點中的一個雜交的一種或兩種sgRNA的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。在一個實施方案中,步驟(i)中的細胞與編碼兩種sgRNA的兩種DNA分子接觸,其中一種sgRNA能夠與所述供體構(gòu)建體內(nèi)的靶序列位點雜交,并且第二sgRNA能夠與預(yù)先確定的基因組區(qū)域內(nèi)的非編碼序列雜交。
公開了使用這種類型的構(gòu)建體來鑒定CRISPR-介導(dǎo)的非同源末端連接修復(fù)途徑的增強劑的方法,所述方法包括下述步驟:(i)在存在和不存在候選化合物的條件下,使細胞與下述接觸:上述供體構(gòu)建體,編碼各自能夠與所述靶序列位點中的一個雜交的一種或兩種sgRNA的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子;并且(ii)檢測由所述報道基因蛋白產(chǎn)生的信號;并且(iii)當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更高的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的增強劑,并且當(dāng)與不存在所述化合物相比,在存在所述化合物的條件下檢測到更低的報道基因蛋白信號時,確定所述化合物為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的抑制劑。
作為第二種類型的基因編輯系統(tǒng)的另一種變型,公開了這樣的供體構(gòu)建體,其包含:(1)第一報道基因的編碼序列;(2)第二報道基因的編碼序列;(3)位于第一報道基因編碼序列的3′端的多聚腺苷酸(PolyA)片段;(4)位于第二報道子的3’端的多聚腺苷酸(PolyA)片段;其中所述第一和第二報道基因的第一和第二編碼序列處在不同的方向;和(5)位于第二報道基因的5’端的靶序列位點。在一個實施方案中,上述供體構(gòu)建體包含在非定向整合后能夠表達第一或第二報道基因的雙色供體構(gòu)建體。在一個實施方案中,由所述供體構(gòu)建體表達的報道基因依賴于供體構(gòu)建體在整合后的方向。
公開了使用這種類型的構(gòu)建體檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與靶序列位點雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
作為第二種類型的基因編輯系統(tǒng)的另一種變型,公開了這樣的供體構(gòu)建體,其包含:(1)第一報道基因的編碼序列;(2)第二報道基因的編碼序列;(3)位于第一報道基因編碼序列的3′端的多聚腺苷酸(PolyA)片段;(4)位于第二報道子的3’端的多聚腺苷酸(PolyA)片段;其中所述第一和第二報道基因的第一和第二編碼序列處在不同的方向;和(5)位于第二報道基因的5’端的靶序列位點。在一個實施方案中,上述供體構(gòu)建體包含在非定向整合后能夠表達第一或第二報道基因的雙色供體構(gòu)建體。在一個實施方案中,由所述供體構(gòu)建體表達的報道基因依賴于供體構(gòu)建體在整合后的方向。
公開了使用這種類型的構(gòu)建體檢測CRISPR-介導(dǎo)的非同源末端連接途徑的方法。所述方法包括下述步驟:(i)使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與靶序列位點雜交的sgRNA的DNA分子;和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
按照一個方面,提供用于利用CRISPR/Cpf1通過非同源末端連接介導(dǎo)單向優(yōu)選的敲入的供體構(gòu)建體、方法和系統(tǒng)。在一個實施方案中,公開了CRISPR/Cpf1供體構(gòu)建體,其包含:(1)報道基因的編碼序列;(2)在所述報道基因編碼序列的5′端的雙順反子元件;(3)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段;和(4)位于所述雙順反子元件的5′端的靶序列位點;其中在所述雙順反子元件5’端的靶序列位點在經(jīng)受Cpf1時能夠產(chǎn)生錯開的(staggered)DNA雙鏈斷裂。
在一個實施方案中,本發(fā)明還提供用于檢測CRISPR/Cpf1-介導(dǎo)的NHEJ修復(fù)途徑的方法,所述方法包括下述步驟:(i)使細胞與下述接觸:上述供體構(gòu)建體,編碼能夠與靶序列位點雜交的sgRNA的DNA分子;和編碼Cpf1蛋白的DNA分子;并且(ii)檢測由報道基因產(chǎn)生的信號。
按照一個方面,提供用于向多個基因組等位基因中非同源末端連接整合多種報道基因的構(gòu)建體、方法和系統(tǒng)。在一個實施方案中,公開了這樣的供體構(gòu)建體,其包括多個分別具有不同報道基因的編碼序列的供體構(gòu)建體;(2)位于每種報道基因編碼序列的5′端的靶序列位點;和(3)位于報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段。在一個實施方案中,所述供體構(gòu)建體還包含在多個供體構(gòu)建體中的每一個中的不同的熒光報道基因。在另一個實施方案中,所述供體構(gòu)建體還包含在多個供體構(gòu)建體中的每一個中的不同的抗藥報道基因。在另一個實施方案中,人隔離子(insulator)序列的串聯(lián)重復(fù)作為阻斷元件,以減少在sg-A靶序列位點的5′端的靶基因的表達,所述sg-A靶序列位點位于報道基因編碼序列的5′端。
在一個實施方案中,提供了用于檢測CRISPR-介導(dǎo)的非同源末端連接的方法,所述方法包括下述步驟:(i)使細胞與下述接觸:供體構(gòu)建體(其中所述供體構(gòu)建體包括多個供體構(gòu)建體,其分別具有不同報道基因的編碼序列,位于每種報道基因編碼序列的5′端的靶序列位點,和位于報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段),編碼能夠與靶序列位點雜交的sgRNA的DNA分子和編碼Cas9蛋白的DNA分子;并且(ii)檢測由報道基因蛋白產(chǎn)生的信號。
附圖簡述
圖1斷裂GFP報道質(zhì)粒設(shè)計和在靶基因座HDR-介導(dǎo)的PGK-Puro2a(B)cGFP敲入的靶向策略的示意圖。(A)在HEK293T-AAVS1(b)GFP和H1-(b)GFP報道細胞系中靶向人AAVS1基因組基因座。(B)在E14-Rosa26(B)cGFP報道細胞系中靶向小鼠Rosa26基因座。
圖2在基因組上敲入斷裂的GFP報道基因座的供體質(zhì)粒設(shè)計和靶向策略的示意圖
。(A)(B)cGFP供體-HDR.1-3。(B)(B)cGFP供體-HDR.A-B。
圖3在HEK293T-AAVS1(b)GFP報道細胞系中由Cas9系統(tǒng)誘導(dǎo)的HDR-介導(dǎo)的基因靶向。(A)使用基因組DNA的PCR證實PGK-Puro2a(B)cGFP報道載體在基因組上AAVS1基因座的敲入。(B)T7E1測定顯示Cas9/sg-X靶向基因組的效率。(C)FACS結(jié)果顯示由切口酶Cas9D10A和野生型Cas9(wtCas9)與sg-X組合誘導(dǎo)的(B)cGFP供體-HDR.1-3的HDR-介導(dǎo)的敲入。(D)FACS結(jié)果顯示由切口酶Cas9D10A和野生型Cas9(wtCas9)與sg-Y組合誘導(dǎo)的(B)cGFP供體-HDR.B的HDR-介導(dǎo)的敲入。
圖4報道載體基因組整合到H1-(b)GFP報道系(reporter line)中和Cas9系統(tǒng)誘導(dǎo)的DSB。(A)使用基因組DNA的PCR證實PiggyBac_(B)cGFP報道載體在基因組上AAVS1基因座的敲入。(B)T7E1測定顯示Cas9/sg-X的基因組DSB效率。
圖5直接檢測CRISPR/Cas9-誘導(dǎo)的HDR-介導(dǎo)的報道子在GAPDH 3’-UTR的插入的系統(tǒng)的設(shè)計。(A)上圖顯示sg-1-4靶向的位點、用于T7E1測定的引物對和在T7E1測定中使用不同的sgRNAs的預(yù)測的切割圖譜的示意圖。中間圖顯示在mTeSR1培養(yǎng)基中在基質(zhì)膠(Matrigel)上培養(yǎng)的H1人ESCs,并且T7E1測定顯示在人H1 ESC(上部圖)和所選的體細胞系(下部圖)中Cas9/sg-1、2或3的基因組靶向效率。下圖:T7E1測定顯示在所選的人體細胞系中Cas9/sg-1的基因組靶向效率。(B)sg-1-3靶向位點、供體質(zhì)粒設(shè)計和在GAPDH外顯子9中HDR-介導(dǎo)的2a-copGFP報道子敲入的靶向策略的示意圖。虛線顯示在基因組基因座和質(zhì)粒DNA之間的同源性部分。顯示了用于檢測報道子敲入的PCR引物的位置。
圖6在不同的人細胞系中,HDR-介導(dǎo)的GAPDH供體-HDR.1基因靶向的變化的頻率。(A)FACS結(jié)果顯示使用或不使用sg-1在人細胞系LO2和HK2中HDR-介導(dǎo)的2a-copGFP敲入的變化頻率。將供體質(zhì)粒和野生型Cas9轉(zhuǎn)染到所有樣品中。從Cas9/sg-1靶向的細胞分選GFP+細胞(在每幅圖中在虛線右側(cè)門控的(gated)綠色信號)用于進一步的分析。(B)使用從a得到的GFP+細胞分離的基因組DNA進行PCR。引物結(jié)合位點在a中表示。在通過HDR將2a-copGFP整合到基因組中后,引物對XJ-45/46擴增5’-連接(1350bp)和XJ-47/48檢測3’-連接(1473bp)。引物XJ-45/48擴增兩個DNA片段,其代表野生型(2480bp)和修飾的等位基因(3241bp)。所有的PCR分析以預(yù)測的尺寸擴增DNA片段,表明2a-copGFP通過HDR正確整合到基因組中。(C)從這些連接(junction)擴增的PCR片段的測序結(jié)果。檢測到在5’和3’-連接中的預(yù)測的修飾,這表明2a-copGFP通過Cas9/sg-1-誘導(dǎo)的DSBs的HDR-介導(dǎo)的修復(fù)的精確整合。(D)H1人ESCs和不同的人的體細胞系的FACS分析,顯示在存在野生型(wt)或D10A Cas9和sg-1的條件下HDR-介導(dǎo)的2a-copGFP的整合。將細胞樣品用Cas9/sgRNAs和供體質(zhì)粒共轉(zhuǎn)染,并在轉(zhuǎn)染后四天進行分析。
圖7NHEJ修復(fù)介導(dǎo)報道基因向CRISPR/Cas9-誘導(dǎo)的DSBs中的有效的插入。(A)供體質(zhì)粒設(shè)計和NHEJ介導(dǎo)的ires-eGFP報道子在GAPDH 3’-UTR的插入的靶向策略的示意圖。產(chǎn)生兩個NHEJ-供體質(zhì)粒。一個質(zhì)粒在ires-eGFP報道子(GAPDH供體-NHEJ.1)的5’攜帶單個sg-A靶位點,另一個質(zhì)粒在ires-eGFP(GAPDH供體-NHEJ.2)的5’和3’兩側(cè)攜帶兩個sg-A靶位點。(B)在LO2細胞中的FACS分析顯示在存在野生型或切口酶D10A Cas9的條件下,由供體和sgRNAs的不同組合誘導(dǎo)的NHEJ-介導(dǎo)的ires-eGFP報道子的插入。(C)對于用sgl、sg-2或sg-3、用GAPDH供體-NHEJ.1或GAPDH供體-NHEJ.2轉(zhuǎn)染的GFP+細胞都通過基因組PCR進行分析。用于連接(junction)檢測的引物對顯示在(A)中。PCR擴增顯示在預(yù)測尺寸的DNA片段,這表明ires-eGFP供體在GAPDH 3’-UTR的正確整合。(D)上圖顯示在GAPDH基因組基因座中的sg-1、2和3靶位點、在單一切割供體GAPDH供體-NHEJ.1中的sg-A靶位點和在基因組與供體DNA之間切割與重新連接的位置的示意圖。下圖顯示來自通過GAPDH供體-NHEJ.1產(chǎn)生的GFP+細胞的連接PCRs(在C中,上圖)的測序結(jié)果。分別分析Cas9/sg-A/sg-1、2或3誘導(dǎo)的整合的5’-和3’-連接。在每個連接中,顯示了多個測序結(jié)果。在連接序列中,不同sgRNA靶位點和PAMs的核苷酸以不同顏色表示:綠色表示sg-1,藍色表示sg-2,橙色表示sg-3,并且紫色表示sg-A。來自供體模板的序列用灰色顯示,基因組DNA用黑色顯示。這些結(jié)果表明供體在預(yù)測的sgRNA靶位點的插入以及在5’和3’-連接中的頻繁插入/缺失(indels)。(E)上圖顯示GAPDH基因組基因座中的sg-1、2和3靶位點、雙切割供體中的sg-A靶位點和基因組與供體之間的切割和重新連接的位置的示意圖。下圖顯示來自用GAPDH供體-NHEJ.2產(chǎn)生的GFP+細胞的連接PCRs的測序結(jié)果(在C中,下圖)。分別分析Cas9/sg-A/sg-1、2或3誘導(dǎo)的整合的5’-和3’-連接。在每個連接中,顯示了多個測序結(jié)果。在連接序列中,不同sgRNA靶位點和PAMs的核苷酸用不同的顏色顯示:綠色表示sg-1,藍色表示sg-2,橙色表示sg-3,并且紫色表示sg-A。來自供體模板的序列用灰色顯示,基因組DNA用黑色顯示。這些結(jié)果證實供體在預(yù)測的sgRNA靶位點的插入,并且在5’和3’-連接二者中都發(fā)現(xiàn)頻繁的插入/缺失。
圖8基因組PCR檢測非GFP表達整合中的基因組與供體片段的重新連接。(A)示意圖顯示使用單一切割供體GAPDH供體-NHEJ.1(左圖)或使用雙切割供體GAPDH供體-NHEJ.2(右圖),在NHEJ介導(dǎo)的ires-eGFP報道子敲入過程中可能發(fā)生的不同類型的整合。(B)使用基因組DNA的PCR檢測表示供體與片段的非GFP表達整合的連接片段。
圖9不同人細胞系中的NHEJ和HDR-靶向的比較。(A)示意圖顯示sg-1-4靶向位點以及它們在GAPDH供體-HDR.2和基因組中的位置。基因組中在GAPDH外顯子9中的同源臂區(qū)用棕色突出顯示。(B)在LO2細胞中獲得的由用Cas9和sg-1、2、3、4或3&4共轉(zhuǎn)染的GAPDH供體-HDR.2誘導(dǎo)的HDR或NHEJ-介導(dǎo)的插入的FACS結(jié)果。(C)FACS結(jié)果顯示在H1人ESCs中CRISPR/Cas9-誘導(dǎo)的HDR或NHEJ-介導(dǎo)的GAPDH供體-NHEJ.1、GAPDH供體-NHEJ.2或GAPDH供體-HDR.2報道子的插入。GAPDH供體-NHEJ.1和GAPDH供體-NHEJ.2模板與sg-1或sg-2組合進行檢驗。GAPDH供體-HDR.2與Cas9/sg-1、2或4組合進行檢驗。在核染(nucleofection)后四天進行FACS分析。(D)在檢驗的人ESCs和體細胞系中Cas9/sg-1-誘導(dǎo)的NHEJ和HDR-靶向的總結(jié)。顯示的數(shù)據(jù)是GFP+細胞的百分數(shù),表示為平均數(shù)±s-e.m.,并且來源于獨立的實驗(n=3)。來自人ESCs的數(shù)據(jù)來源于兩次獨立的實驗(n=2)。***:p<0.001;**:p<0.01;*:p<0.05;ns:不顯著的p>0.05。(E)上圖顯示在用Cas9/sg-1誘導(dǎo)的HDR-靶向中的5’-連接的測序結(jié)果。第二圖顯示基因組和GAPDH供體-HDR.2中sg-2和sg-3靶位點以及在用Cas9/sg-2或sg-3經(jīng)由NHEJ修復(fù)誘導(dǎo)的整合過程中的切割和重新連接的位置的示意圖。第三圖顯示5-連接的測序結(jié)果。第四圖顯示在用Cas9/sg-4誘導(dǎo)的整合的5’-連接中的測序結(jié)果。下圖顯示在通過用Cas9/sg-3和sg-4共轉(zhuǎn)染誘導(dǎo)的整合的5’-連接中的測序結(jié)果。
圖10在H1人ESCs中在OCT4和ACTB 3’-UTR處CRISPR/Cas9-誘導(dǎo)的NHEJ-介導(dǎo)的ires-eGFP報道子敲入。(A)FACS結(jié)果顯示在H1人ESCs中在OCT43’-UTR處CRISPR/Cas9-偶聯(lián)的NHEJ-介導(dǎo)的ires-eGFP報道子的整合。將單一切割的NHEJ供體用Cas9/sgOCT4共轉(zhuǎn)染。(B)FACS結(jié)果顯示在H1人ESCs中在ACTB 3’-UTR處CRISPR/Cas9-偶聯(lián)的NHEJ-介導(dǎo)的ires-eGFP報道子的整合。將單一切割的NHEJ供體用Cas9/sgACTB共轉(zhuǎn)染。在核染后四天進行FACS分析。GFP+細胞門控在每幅圖中虛線右側(cè)。(C)示意圖顯示在OCT4基因組基因座中sgOCT4靶位點的放大圖和使用單一切割供體的CRISPR/Cas9-偶聯(lián)的基于NHEJ的靶向策略。(D)關(guān)于在用單一切割NHEJ供體/Cas9/sgOCT4轉(zhuǎn)染時產(chǎn)生的分選的GFP+細胞中的整合連接的基因組PCR(圖3,C)。使用引物F5/R3的PCR檢測5’-連接,而使用引物F4/R5的擴增檢測在OCT43’-UTR處NHEJ-介導(dǎo)的單一切割供體的整合的3’-連接。(E)在B中擴增的整合連接的序列。分別分析5’-和3’-連接。對于每個連接,顯示了多個序列。不同sgRNA靶位點和PAMs的核苷酸用顏色編碼(color-coded)。來自供體模板的序列用灰色顯示,側(cè)鄰整合連接的基因組DNA用黑色顯示。
圖11通過不依賴同源性的敲入方法,無選擇地產(chǎn)生敲入克隆。(A)在以低密度接種轉(zhuǎn)染了單一切割的NH-供體/Cas9/sg-A/sg-2或sg-3(未分選)的細胞后10天觀察到的單細胞集落的亮視野和熒光圖像。在兩種樣品中都觀察到GFP+(白色箭頭)和GFP-集落(未標(biāo)記的)。(B)顯示在所選的個體克隆中的GFP表達的熒光圖像,所述個體克隆是從轉(zhuǎn)染了單一切割的NH-供體/Cas9/sg-A/sg-2的細胞分離的。(C)從轉(zhuǎn)染了單一切割的NH-供體/Cas9/sg-A/sg-2的細胞分離的13個GFP+克隆的PCR。使用引物F3/R3*檢測5’-整合連接;并且示意性顯示它們的位置(上圖)。此處使用引物R3*替代引物R3以獲得最佳的擴增。PCR擴增顯示預(yù)計尺寸的DNA片段,這表明ires-eGFP報道子在GAPDH 3’-UTR處的正確整合。
圖12常規(guī)NHEJ修復(fù)介導(dǎo)大的報道基因的有效敲入。(A)上圖顯示在LIG4基因座sgLIG4-i-iv靶標(biāo)位置的示意圖。將這些sgRNAs組合并與Cas9一起共轉(zhuǎn)染到LO2細胞中,以產(chǎn)生LIG4敲除克隆。下圖是蛋白質(zhì)印跡,表明在得到的LIG4無效(null)克隆中丟失DNA連接酶IV,以及通過向這些細胞中轉(zhuǎn)染LIG4cDNA構(gòu)建體而引入的LIG4表達。(B)LIG4敲除LO2細胞的FACS分析。在野生型和敲除LIG4的LO2細胞中,通過單一切割的NH-供體/Cas9/sg-A/sg-2誘導(dǎo)不依賴同源性的敲入,并且使用2a-copGFP(+HAs)供體/Cas9/sg-2引入基于HDR的敲入。在兩種LIG4空克隆#S16和#T8中觀察到NH-靶向的急劇減少和LIG4過表達挽救(左圖)。在LIG4無效細胞中還觀察到HDR敲入的顯著增加(右圖)。(C)FACS結(jié)果表明使用大尺寸供體的NHEJ-介導(dǎo)的敲入。將12k和34k NK-供體與Cas9/sg-A/sg-2一起共轉(zhuǎn)染到野生型LO2細胞中。對照在沒有sg-2或sg-A情況下轉(zhuǎn)染。將GFP+細胞門控在每幅圖中虛線的右側(cè)。同時,平行轉(zhuǎn)染恒定表達GFP的12k(PB)和34k(AD)GFP-載體;并且在第2天通過FACS檢驗的轉(zhuǎn)染效率顯示在下圖中。(D)PCR檢測C中轉(zhuǎn)染的細胞(未分選的)中的報道子整合。引物對F3/R3檢測整合在GAPDH 3’-UTR處的12k和34k NH-供體的5’-連接。PCR擴增顯示預(yù)計尺寸的DNA片段。
圖13HDR-和NHEJ-介導(dǎo)的報道子敲入之間的比較。(A)顯示sg-1-4靶位點以及它們在基因組GAPDH基因座的位置和ires-eGFP(+HAs)供體-1,2,2.A與2.B質(zhì)粒的設(shè)計的放大圖的示意圖。ires-eGFP(+HAs)供體-1中使用的同源臂(HA)區(qū)域用灰色突出顯示,在供體-2、2.A和2.B中使用的HAs以紫色突出顯示。供體-2.A在3’攜帶單個sg-A靶位點,供體-2.B在ires-eGFP(+HAs)盒的5’攜帶一個sg-A靶位點。(B)用ires-eGFP(+HAs)供體-1/Cas9和sg-1、2、3或4轉(zhuǎn)染的LO2細胞的FACS分析。由于在基因組和供體上的不同的靶位點,sg-1誘導(dǎo)了HDR-介導(dǎo)的敲入;sg-2和sg-3誘導(dǎo)了基于NHEJ的敲入;并且sg-4主要通過完整的5’同源臂、經(jīng)由基于HDR的敲入產(chǎn)生GFP+細胞。(C)FACS分析顯示使用環(huán)形和線性供體模板的HDR-介導(dǎo)的敲入。ires-eGFP(+HAs)供體-2、2.A或2.B與Cas9/sg-1或Cas9/sg-2一起轉(zhuǎn)染。在sg-A(線性)的存在下以及在不存在sg-A(環(huán)形)的條件下,都檢驗供體-2.A和2.B。Cas9/sg-A在ires-eGFP(+HAs)盒的3’切割供體-2.A,并且線性化的供體2.A通過HDR-介導(dǎo)的敲入產(chǎn)生GFP+細胞。明顯地,Cas9/sg-A在ires-eGFP(+HAs)盒的5’切割供體-2.B,并且線性化的供體2.B通過NHEJ-和HDR-介導(dǎo)的兩種敲入產(chǎn)生GFP+細胞。(D)FACS結(jié)果表明NHEJ-和HDR-介導(dǎo)的在ACTB、SOX17和T基因的基因座的報道子敲入。上圖顯示分別用于在ACTB和SOX17或T基因的基因座敲入的ires-eGFP和PGK-eGFP報道子的示意圖。單一切割的NH-供體與Cas9/sg-A/sgACTB-i或sgACTB-ii一起共轉(zhuǎn)染以靶向ACTB基因座(左下圖,上兩排);而CE NH-供體與Cas9/sg-A/sgSOX17-i、sgSOX17-ii或sgT-i一起共轉(zhuǎn)染,以靶向SOX17或T基因的基因座(右下圖,上兩排)。將攜帶ires-eGFP的ACTB HDR-供體和包含PGK-eGFP的SOX17和T HDR-供體與Cas9和相應(yīng)的sgRNAs一起共轉(zhuǎn)染,以檢驗基于HDR的敲入(下圖,底排)。對照樣品在沒有基因特異性的sgRNA或sg-A的情況下轉(zhuǎn)染。在轉(zhuǎn)染后第5天進行FACS分析,以進行ACTB基因座的檢測。在FACS分析之前,將轉(zhuǎn)染了包含PGK-eGFP的供體的細胞(用于在SOX17和T基因座的檢測)維持五代。將GFP+細胞門控在每幅圖中虛線的右側(cè)。(E).FACS結(jié)果表明在檢驗的多種體細胞系中Cas9/sg-1誘導(dǎo)的、HDR介導(dǎo)的報道子敲入。檢驗了野生型和攜帶D10A突變的切口酶Cas9二者。
圖14 NHEJ-介導(dǎo)的在沉默的基因組基因座的報道子敲入。(A)FACS結(jié)果表明在OCT4、NANOG、T和PAX6基因的基因座的多個位置NHEJ-介導(dǎo)的PGK-eGFP報道子的敲入。將CE NH-供體與Cas9和相應(yīng)的sgRNAs、與或不與sg-A一起共轉(zhuǎn)染到LO2細胞中。在FACS分析之前,將轉(zhuǎn)染的細胞維持五代。將GFP+細胞門控在每幅圖中虛線的右側(cè)。(B)LO2細胞中OCT4、NANOG、ACTB、GAPDH、SOX17、T和PAX6基因的表達的qRT-PCR分析。包括表達OCT4和NANOG的H1人ESCs和表達SOX17、T和PAX6的分化的細胞作為參比。所示的數(shù)據(jù)為平均數(shù)±s.d.,n=3。
圖15在具有l(wèi)oxp位點的沉默基因的基因座的不依賴同源性的敲入。(A)在沉默基因的基因座,Cas9誘導(dǎo)的不依賴同源性的敲入的示意圖。內(nèi)源性sgRNA誘導(dǎo)基因組DSBs,并且sg-A誘導(dǎo)對供體質(zhì)粒的切割。用于沉默基因靶向的NH-S供體4包含用于敲入選擇的PGK-eGFP-pA盒、用于報道子應(yīng)用的ires-td Tomato-pA和用于在熒光選擇后缺失不需要的部分的LoxP位點。NH-S供體1、2和3具有類似的功能目的。(B)NH-S供體4用于在GADPH 3’-UTR基因座的報道子敲入。流量監(jiān)視顯示關(guān)于td-Tomato表達的陽性信號,其表示成功的敲入,并且表明該種類型的供體的功能性作用。(C)進行NH-S供體4的流式分析以檢測在Soxl和Foxa2位點的3’-UTR的敲入。與對照組相比,高得多的GFP陽性比率表示在該位點的成功的敲入。
圖16報道基因的不依賴同源性的雙色插入敲入。(A)Cas9誘導(dǎo)的NHEJ-介導(dǎo)的兩次定向(two directional)熒光敲入的示意圖。內(nèi)源性的sgRNA誘導(dǎo)基因組DSBs,并且sg-A誘導(dǎo)在供體質(zhì)粒上的切割。兩次定向熒光供體包含用于報道子應(yīng)用的eGFP-pA盒與TD tomato-pA盒。NHEJ-介導(dǎo)的非定向整合包括兩次定向敲入。使用該新的供體,一次定向整合可以產(chǎn)生eGFP表達(圖16,A,左側(cè)),并且另一次定向整合可以產(chǎn)生TD tomato表達(圖16,A,右側(cè))。(B)使用靶向GAPDH 5’-UTR的SgGAPDH介導(dǎo)非定向整合。利用流式分析進行敲入檢測。使用該兩次定向熒光供體,Cas9/sg-A/sgGAPDH介導(dǎo)的敲入產(chǎn)生GFP+/TD-、GFP-/Td+和GFP+/TD+細胞群,這表明該新的供體對于非定向整合的功能性作用。
圖17向基因組中CPF1-誘導(dǎo)的DSBs中不依賴同源性敲入報道基因。(A)在GAPDH基因座的3’-UTR,CPF1誘導(dǎo)的不依賴同源性的敲入的示意圖。sgGAPDH靶向內(nèi)源性GAPDH基因座,并且sg-A誘導(dǎo)供體質(zhì)粒的切割。使用兩個供體,即,互補性供體(C供體)和非互補性供體(NC供體)。(B)FACS分析顯示由CPF1-誘導(dǎo)的DSBs介導(dǎo)的報道子整合。spCas9誘導(dǎo)的NHEJ介導(dǎo)的敲入作為陽性對照。使用C供體的CPF1產(chǎn)生比使用NC供體介導(dǎo)的(2.69%)高得多的敲入效率(7.04%),這表明優(yōu)選的定向整合。
圖18在多個基因組等位基因上的一個靶基因中不依賴同源性敲入多種報道基因。(A)通過Cas9誘導(dǎo)的NHEJ-介導(dǎo)的敲入的多個等位基因敲除策略的示意圖。內(nèi)源性sgRNA在內(nèi)源性基因的基因座的5’-UTR誘導(dǎo)基因組DSBs,并且sg-A誘導(dǎo)供體質(zhì)粒的切割。提供多種供體質(zhì)粒用于同時敲入。整合了不同的報道子,被靶向的細胞表現(xiàn)出不同的熒光顏色或抗藥性。這意味著NH-隔離子供體eGFP敲入表達GFP,NH-隔離子供體TD Tomato敲入表達TD tomato,NH-隔離子供體puro和NH-隔離子供體Hygro分別表現(xiàn)出嘌呤霉素和潮霉素抗性。(B)關(guān)于在MRE11基因座的靶向結(jié)果的流式分析,所述靶向使用NH-隔離子供體eGFP和NH-隔離子供體tdTomato二者。GFP或tdTomato(單)-陽性細胞表示至少一種等位基因被修飾(圖18,右圖)。雙陽性細胞群體表示那些細胞在兩個等位基因中攜帶敲入。
表1.sgRNAs結(jié)合的DNA序列。
表2.用于靶向GAPDH基因座的sgRNAs的潛在的脫靶位點。
表3.用于克隆和整合檢測的引物。
發(fā)明詳述
I.介紹
基因靶向允許能夠在活細胞內(nèi)用設(shè)計的供體模板替換內(nèi)源性基因組DNA片段,允許引入寬范圍的設(shè)計的改變[1]。自二十世紀(jì)八十年代以來,該技術(shù)已經(jīng)廣泛地用于產(chǎn)生遺傳修飾的小鼠,變成在活的哺乳動物中分析基因功能的基本和首要的工具[2]?;谠摷夹g(shù)的大量基因的廣泛研究已經(jīng)在涉及哺乳動物發(fā)育、機制和遺傳病的基因調(diào)控的許多方面刷新了我們的理解[3]。
研究人細胞長期需要基因組編輯工具,特別是在最近關(guān)于產(chǎn)生人多能干細胞(hPSCs)(包括人胚胎干細胞(ESCs)和人誘導(dǎo)的多能干細胞(iPSCs))的技術(shù)的廣告之后[4,5]。這些細胞能夠強健地自我更新,同時在培養(yǎng)物中保持多能性。由此,它們擁有提供產(chǎn)生臨床移植所需的幾乎任何功能細胞類型的無限和自體資源的巨大潛力[6]。然而,駕馭這些細胞的完全的潛能需要有效的基因靶向,目前這是不能實現(xiàn)的,但是,對于在進一步考慮臨床應(yīng)用之前了解涉及種系定型(lineage commitment)的基因調(diào)節(jié)、修正患者iPSCs中引起疾病的突變或消除人ESCs中潛在的免疫刺激性抗原是重要的[7,8]。
在最近兩年內(nèi),已經(jīng)建立的一種新的內(nèi)切核酸酶系統(tǒng),即,成簇的規(guī)律間隔性短回文重復(fù)(clustered regularly interspaced short palindromic repeat,CRISPR)和CRISPR相關(guān)的9(Cas9),來介導(dǎo)精確的同源重組(HR),并且用于報道子敲入、基因敲除和基因修正[9-11]。在CRISPR/Cas9系統(tǒng)中,小的導(dǎo)向RNA(sgRNA)與Cas9核酸酶通過在其3’端的支架結(jié)構(gòu)締合。sgRNA以堿基配對方式退火到基因組DNA中的靶序列(典型地約20個核苷酸)上,其鄰近5′-NGG-3′原間隔區(qū)相鄰的基序(protospacer adiacent motifs,PAM)。隨后,在存在于PAM的3-bp上游處的靶標(biāo)DNA處引入雙鏈DNA斷裂(DSB)。與其他DSBs相似,CRISPR/Cas9系統(tǒng)通過兩種不同的機制引發(fā)DNA修復(fù)過程,包括非同源末端連接(NHEJ)和同源性定向的修復(fù)(HDR)途徑。
NHEJ途徑通過經(jīng)由機制靈活的過程連接斷裂的末端而修復(fù)DNA DSBs。其通常導(dǎo)致隨機的小的插入或缺失(插入/缺失),由此其是易錯的[12]。已經(jīng)利用CRISPR/Cas9-引入的DNA切割之后的NHEJ修復(fù)在編碼蛋白的基因中產(chǎn)生功能缺失的等位基因[13],但是認為,當(dāng)需要靶向插入大片段時,這具有有限的潛力。另一方面,HDR途徑介導(dǎo)鏈交換過程,從而基于現(xiàn)有的模板準(zhǔn)確修復(fù)DNA損傷[14]。提供了用攜帶同源臂的供體模板精確替代內(nèi)源性基因組中的DNA片段的途徑,由此允許向活細胞中引入寬范圍的設(shè)計的遺傳修飾[1]。
然而,認為低HDR效率是CRISPR/Cas9系統(tǒng)在hPSCs中的臨床應(yīng)用的主要挑戰(zhàn)。研究表明,在人ESC/iPSC中的HR表現(xiàn)出低效率,約為10E-5[15]。背后的原因還沒有完全理解。另外,盡管由脫靶突變引起的安全性考慮是CRISPR/Cas9系統(tǒng)的另一個挑戰(zhàn),但是一些研究已經(jīng)研究并推斷脫靶突變在hPSC中非常低,由此其不是進一步的研究和臨床應(yīng)用的主要關(guān)注問題[2-4]。迄今為止,提高hPSC中精確的CRISPR-介導(dǎo)的基因編輯的效率以滿足臨床需要是至關(guān)重要的和急需的。
在之前的公開內(nèi)容美國臨時專利號62/256,514中,發(fā)明人構(gòu)建了通用報道子系統(tǒng)來檢測人ESCs和體細胞系中CRISPR-介導(dǎo)的大DNA片段的基因組整合。本發(fā)明的系統(tǒng)靶向編碼看家基因GAPDH的基因組基因座,所述看家基因在幾乎所有的細胞類型中恒定且普遍表達。該靶向基因座與熒光蛋白(copGFP或eGFP)報道子的組合應(yīng)用將允許人們直接且實時地觀察在所用的任何人細胞類型中的基因靶向事件。數(shù)據(jù)顯示,該報道子系統(tǒng)可以在轉(zhuǎn)染后4-5天內(nèi)直接穩(wěn)健地檢測HDR-介導(dǎo)的基因靶向,其可以作為用于藥物篩選或提高HDR效率以及基于HDR的基因靶向的機制研究的優(yōu)良的通用平臺。
另一方面,通過靶向相同的基因座,本發(fā)明人構(gòu)建了另一種檢測NHEJ介導(dǎo)的基因靶向的系統(tǒng)。發(fā)現(xiàn)本文所述的系統(tǒng)和靶向策略建立了一種通過NHEJ途徑進行基因靶向的新方法。NHEJ靶向的效率高得多,在體細胞系中達到多至20%,并且在人ESCs中達到多至1.7%,無需任何的預(yù)先選擇或富集步驟。相關(guān)的方法和載體構(gòu)建提供了一種在人細胞中(特別是在人ESCs/iPSCs中)實現(xiàn)高效的基因靶向的有希望且用戶友好的工具。更重要的是,本發(fā)明的系統(tǒng)可以是通用的,由此具有在多種其他的人細胞類型中以及在其他物種(包括低等脊椎動物,如斑馬魚和青蛙(爪蟾屬(Xenopus)))中應(yīng)用的潛能,在sgRNA的構(gòu)建中具有較少的改變。
在本發(fā)明中,本發(fā)明人為Cas9-介導(dǎo)的基因組編輯系統(tǒng)在各種基因組基因座和條件下的應(yīng)用提供進一步的證據(jù)。進一步證明了不依賴同源性的報道子整合的分子基礎(chǔ)和效率;并且提供了用于NHEJ-介導(dǎo)的在沉默的基因的基因座處有效的敲入的另外的方法和系統(tǒng)。另外,研究了NHEJ-介導(dǎo)的敲入系統(tǒng)的脫靶效應(yīng)。
此外,本申請公開了向在GAPDH基因座的3’-UTR處的CPF1-誘導(dǎo)的DSBs中不依賴同源性敲入報道基因的另外的方法和系統(tǒng),這證明對于定向整合的偏好性。由此,本申請公開了用于使用CRISPR/CPF1通過NHEJ介導(dǎo)的單向優(yōu)選的敲入的構(gòu)建體、方法和系統(tǒng)。
本申請還公開了不依賴同源性的報道基因的雙色插入敲入的另外的方法、構(gòu)建體和系統(tǒng)。由此,本申請公開了用于使用CRISPR/Cas9通過NHEJ介導(dǎo)的雙向敲入的方法、構(gòu)建體和系統(tǒng)。
另外,本申請公開了向多個基因組等位基因上的一個靶基因中不依賴同源性敲入多種報道基因的方法和系統(tǒng),這表明產(chǎn)生單陽性或雙陽性的細胞群體。因此,本申請公開了向多個等位基因中NHEJ-介導(dǎo)敲入多種顏色熒光報道基因的構(gòu)建體、方法和系統(tǒng)。
II.定義
用于本文時,“報道基因”是指編碼能夠在適當(dāng)?shù)臈l件下產(chǎn)生可檢測的信號的蛋白產(chǎn)物的多核苷酸序列,所述可檢測的信號允許指示報道基因蛋白產(chǎn)物的存在和/或量的檢測。
用于本文時,“同源序列”或與參比基因/序列“同源的序列”描述與參比基因/序列的對應(yīng)片段具有相當(dāng)程度的序列同一性的多核苷酸序列,例如,與所述參比基因/序列的核苷酸序列至少80,85,90,91,92,93,94,95,96,97,98,99%相同或甚至100%相同,從而,當(dāng)處在適當(dāng)條件下時,可以在一對“同源序列”與其參比基因/序列之間發(fā)生同源重組。
術(shù)語“靶序列”或“靶標(biāo)DNA序列”,當(dāng)用于指本發(fā)明的基因組序列或多核苷酸構(gòu)建體(例如,供體質(zhì)粒)的預(yù)先確定的片段時,關(guān)于靶序列與其對應(yīng)的sgRNA之間的百分比序列同一性類似地定義。另一方面,“同源序列”或“靶序列”是確保其目的的適當(dāng)?shù)拈L度。典型地,“同源序列”的尺寸范圍為約100-1000個、200-800個或250-500個核苷酸(例如,約250個,500個或800個核苷酸長);而“靶序列”較短,并且在可以在約10-50個、15-45個或20-40個(例如,約20、25或30個)核苷酸的尺寸范圍內(nèi)變化。在一些實施方案中,靶序列包含適合作為Cas9核酸酶的底物的序列(即,核酸酶靶序列位點)。在一些實施方案中,靶序列包含適合作為Cfp1內(nèi)切核酸酶的底物的序列(即,內(nèi)切核酸酶靶序列位點)。
術(shù)語“異源的”,當(dāng)用于描述在重組多核苷酸或多肽構(gòu)建體中彼此鄰近存在的兩個多核苷酸序列或兩個多肽序列之間的關(guān)系時,表示這兩個序列都不是天然存在的。
用于本文時,術(shù)語“啟動子”是指能夠驅(qū)動DNA序列在細胞中的轉(zhuǎn)錄的多核苷酸序列。由此,用在本發(fā)明的多核苷酸構(gòu)建體中的啟動子包含順式-和反式-作用轉(zhuǎn)錄控制元件和調(diào)節(jié)序列,它們參與調(diào)節(jié)或調(diào)控基因轉(zhuǎn)錄的時機和/或速率。例如,啟動子可以是順式-作用轉(zhuǎn)錄控制元件,包括增強子、阻抑物結(jié)合序列等。這些順式-作用序列典型地與蛋白或其他生物分子相互作用以進行(打開/關(guān)閉、調(diào)節(jié)、調(diào)控等)基因轉(zhuǎn)錄。最經(jīng)常的,核心啟動子序列位于翻譯起始位點的1-2kb之內(nèi),更經(jīng)常的,位于翻譯起始位點的1kbp之內(nèi),并且通常在500bp或200bp或更少之內(nèi)。按常規(guī),啟動子序列通常提供為在其控制的基因的編碼鏈上的序列。在本申請的情形中,啟動子典型地由其天然調(diào)節(jié)表達的基因的名稱所稱呼。用在本發(fā)明的構(gòu)建體中的啟動子由基因的名稱稱呼。對啟動子的名稱的提及,包括野生型、天然的啟動子以及保留誘導(dǎo)表達的能力的啟動子變體。對啟動子的名稱的提及,不限于特定的物種,而是還包括來自其他物種中相對應(yīng)的基因的啟動子。
術(shù)語“可操作性地連接”是指兩個以上多核苷酸(例如,DNA)片段之間的功能性關(guān)系。典型地,其是指轉(zhuǎn)錄調(diào)節(jié)序列與轉(zhuǎn)錄的序列之間的功能性關(guān)系。例如,如果啟動子刺激或調(diào)節(jié)DNA或RNA序列在適當(dāng)?shù)乃拗骷毎蚱渌磉_系統(tǒng)中的轉(zhuǎn)錄,則所述啟動子可操作性地連接到DNA或RNA序列。通常,可操作性地連接到轉(zhuǎn)錄的序列上的啟動子轉(zhuǎn)錄調(diào)節(jié)序列在物理上鄰近轉(zhuǎn)錄的序列,即,它們是順式作用的。然而,一些轉(zhuǎn)錄調(diào)節(jié)序列,諸如增強子,不需要在物理上鄰近或緊密位于它們增強轉(zhuǎn)錄的編碼序列的附近。
用于本文時,“中斷片段”是指中斷報道基因的表達的多核苷酸序列。在一些實施方案中,所述中斷片段長度約為10-2000個、15-1000個、20-500個或25-100個核苷酸,優(yōu)選長度為30個核苷酸。在一些實施方案中,中斷片段包含三個終止密碼子,它們分別在不同的閱讀框中,以完全消除報道基因的表達。
用于本文時,“間隔片段”是指中斷報道基因表達的多核苷酸序列。在一些實施方案中,間隔片段長度約為10-2000個、15-1000個、20-500個或25-100個核苷酸,例如,長度為30個核苷酸或726個核苷酸。在一些實施方案中,間隔片段可以編碼與屬于供體構(gòu)建體的功能性報道基因不同的功能性報道基因。
用于本文時,“看家基因”是在適當(dāng)?shù)募毎抵幸苑€(wěn)定且可檢測的水平連續(xù)表達其編碼的蛋白的任何基因。優(yōu)選地,“看家基因”在多種細胞系中連續(xù)表達。
用于本文時,詞語“約”,當(dāng)用在描述指定的值的近似值的情形中時,限定包括該值±10%的范圍。
用于本文時,“組成型啟動子”是指允許其關(guān)聯(lián)的基因在任意適當(dāng)?shù)乃拗骷毎蛏矬w內(nèi)的連續(xù)轉(zhuǎn)錄的不調(diào)節(jié)的啟動子(unregulated promoter)。
用于本文時,“通用啟動子”是指可以融合在任意靶基因的上游、能夠允許其關(guān)聯(lián)的基因在任意適當(dāng)?shù)乃拗骷毎蛏矬w中的轉(zhuǎn)錄的啟動子。
用于本文時,“雙順反子元件”或“內(nèi)部核糖體進入位點(ires)元件”是指允許兩個編碼序列共表達的遺傳元件或多核苷酸序列片段。在一些方面中,雙順反子元件能夠允許用同一種載體協(xié)調(diào)表達兩種基因。例如,雙順反子元件可以允許使用具有熒光標(biāo)記的第二基因監(jiān)視一個基因的遞送,或者使用相同的載體表達目的蛋白并同時將其生物素化。在一個方面中,雙順反子元件允許報道基因和抗生素抗性標(biāo)記的翻譯。在一個方面中,雙順反子元件允許報道基因和熒光蛋白的翻譯。
術(shù)語“表達盒”或“構(gòu)建體”或“載體”或“供體質(zhì)?!笔侵高@樣的核酸構(gòu)建體,即,當(dāng)引入到宿主細胞中時,其分別導(dǎo)致RNA或多肽的轉(zhuǎn)錄和/或翻譯。表達盒的一個實例是這樣的多核苷酸構(gòu)建體,其包含可操作性連接到啟動子(例如,其天然啟動子)上的編碼本發(fā)明的多肽、蛋白的多核苷酸序列,其中所述表達盒被引入到異源微生物中。在一些實施方案中,表達盒包含編碼本發(fā)明的多肽的多核苷酸序列,其中所述多核苷酸靶向微生物基因組中的位置,從而使所述多核苷酸序列的表達受所述微生物中存在的啟動子的驅(qū)動。
術(shù)語“宿主細胞”或“細胞”用在本發(fā)明的情形中是指微生物,并且包括個體細胞或細胞培養(yǎng)物,它們可以是或已經(jīng)成為本發(fā)明的任意重組載體或分離的多核苷酸的接受體。宿主細胞包括單個宿主細胞的后代,并且,由于天然的、意外的或故意的突變和/或變化,所述后代不必與原始的母代細胞完全相同(在形態(tài)上,或在總DNA成分(total DNA complement)上)。宿主細胞包括已在其中引入(包括通過轉(zhuǎn)化、轉(zhuǎn)染等)本發(fā)明的重組載體或多核苷酸的細胞。
“Cas9”或(CRISPR相關(guān)蛋白9)是一種與細菌中、特別是釀膿鏈球菌中的CRISPR(成簇的規(guī)律間隔性回文重復(fù))適應(yīng)性免疫系統(tǒng)相關(guān)的RNA導(dǎo)向的DNA內(nèi)切核酸酶。釀膿鏈球菌(S.pyogenes)利用Cas9記憶并且后續(xù)審查(interrogate)并切割外源DNA,諸如侵入的噬菌體的DNA。Cas9,與小的導(dǎo)向RNA(sgRNA)復(fù)合,通過解開外源DNA并且檢查該DNA是否包含與sgRNA的20bp間隔臂區(qū)互補的任意序列片段來進行這種審查(interrogation)。如果sgRNA發(fā)現(xiàn)所述DNA中的序列互補性,其通過Cas9切割。
“Cpf1”或“CRISPR/Cpf1”是與CRISPR/Cas9系統(tǒng)相似的DNA編輯技術(shù)。Cpf1是與細菌中的普雷沃菌屬(Prevotella)和弗朗西絲菌屬(Francisella)中的CRISPR適應(yīng)性免疫系統(tǒng)相關(guān)的RNA-引導(dǎo)的DNA內(nèi)切核酸酶。由于Cpf1僅需要一個RNA分子來切割DNA,而Cas9需要兩個RNA分子,所以,與Cas9相比,Cpfl是更小且更簡單的內(nèi)切核酸酶。Cpf1是含有1,300個氨基酸的蛋白的V型CRISPR/Cas系統(tǒng)。
用于本文時,“sgRNA”或“小的導(dǎo)向RNA”是指能夠與Cas9蛋白形成復(fù)合物并且包含與靶DNA序列互補的約20個核苷酸的短RNA分子,從而使得當(dāng)sgRNA識別靶DNA序列中的互補序列時,Cas9-sgRNA復(fù)合物指導(dǎo)靶DNA序列的Cas9切割。因此,sgRNA是特異性針對不可變的構(gòu)架序列的5’的靶標(biāo)DNA的約20個堿基的序列(范圍在約10-50、15-45或20-40個,例如,15、20、25或30個堿基)。
用于本文時,術(shù)語“GAPDH”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指產(chǎn)生甘油醛3-磷酸脫氫酶的看家基因。GAPDH基因通常在大部分人組織和細胞中以高水平穩(wěn)定地且組成型表達。因此,GAPDH通常用作蛋白質(zhì)印跡中的對照以檢測蛋白的表達水平或用于qPCR中的對照以檢測mRNA表達水平。
用于本文時,術(shù)語“AAVS1”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為腺相關(guān)病毒整合位點1的基因組基因座(還稱為PPP1R12C基因座)。其表現(xiàn)出開放的染色質(zhì)結(jié)構(gòu),并且,由于其破壞沒有功能性后果,已經(jīng)提議其作為整合的潛在靶標(biāo)區(qū)域[16]。
用于本文時,“ACTB”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為β-肌動蛋白的基因組基因做。該基因產(chǎn)生參與細胞運動性、結(jié)構(gòu)和完整性的高度保守的蛋白。
用于本文時,術(shù)語“SOX17”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為SOX(SRY-相關(guān)的HMG-盒)家族成員17的基因組基因座。該基因產(chǎn)生參與胚胎發(fā)育的調(diào)節(jié)和細胞命運的確定的轉(zhuǎn)錄因子。
用于本文時,術(shù)語“T”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為T短尾(brachyury)轉(zhuǎn)錄因子的基因組基因座(還稱為TFT或SAVA基因座)。由該基因編碼的蛋白是結(jié)合特定的DNA元件回文T位點(palindromic T-site)的胚胎核轉(zhuǎn)錄因子。
用于本文時,術(shù)語“OCT4”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為POU種類5同源異型框1(POU class 5 homeobox 1,POU5F1)的基因組基因座,其產(chǎn)生作為轉(zhuǎn)錄因子的蛋白,所述蛋白包含POU同源結(jié)構(gòu)域,其在胚胎發(fā)育和干細胞多能性中起關(guān)鍵作用。
用于本文時,術(shù)語“NANOG”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為Nanog同源異型框的基因組基因座,其產(chǎn)生作為參與胚胎干(ES)細胞增殖、更新和多能性的DNA結(jié)合性同源異型框轉(zhuǎn)錄因子。
用于本文時,術(shù)語“PAX6”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為配對框6的基因組基因座,其產(chǎn)生結(jié)合DNA并且作用為轉(zhuǎn)錄調(diào)節(jié)劑的包含同源異型框和配對結(jié)構(gòu)域的蛋白。
用于本文時,術(shù)語“SOX1”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為SRY-相關(guān)的HMG-盒1的基因組基因座,其產(chǎn)生參與胚胎發(fā)育的調(diào)節(jié)和細胞命運的確定的同源異型框轉(zhuǎn)錄因子。
用于本文時,術(shù)語“FOXA2”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中稱為叉頭框蛋白(forkhead box protein)A2或轉(zhuǎn)錄因子3B或肝細胞核因子3-β的基因組基因座,其編碼結(jié)合DNA并且作用為轉(zhuǎn)錄調(diào)節(jié)劑的蛋白。
用于本文時,術(shù)語“LoxP”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指稱為LoxP1的基因組基因座。Cre-Lox重組系統(tǒng)是用于在DNA中特定位點進行缺失、插入、易位和倒位的位點特異性的重組酶方法。其在真核和原核生物兩種系統(tǒng)中實施。Cre-Lox系統(tǒng)由酶,即Cre重組酶組成,其重組一對稱為LoxP序列的短的靶序列。LoxP是噬菌體P1上由34bp組成的位點。該位點在兩組回文的13bp序列之間包含不對稱的8bp序列,該序列除了中間兩個堿基之外是可變的。
用于本文時,術(shù)語“PGK”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指磷酸甘油酸酯激酶1的啟動子,其在大部分人和小鼠細胞中是有恒定活性的。
用于本文時,術(shù)語“puro”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指編碼嘌呤霉素N-乙?;?轉(zhuǎn)移酶的基因,其存在于鏈霉菌屬(Streptomyces)生產(chǎn)菌株中,并且能夠賦予宿主細胞針對培養(yǎng)基中補充的嘌呤霉素抗生素的抗性。
用于本文時,術(shù)語“hygro”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指編碼潮霉素B磷酸轉(zhuǎn)移酶的基因,所述潮霉素B磷酸轉(zhuǎn)移酶存在于鏈霉菌屬(Streptomyces)生產(chǎn)菌株中,并且可以賦予宿主細胞針對培養(yǎng)基中補充的針對生素潮霉素的抗性。
用于本文時,術(shù)語“2a”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指編碼最初在微小RNA病毒(Picornavirus)(F2a)中鑒定的短的自我切割的肽的DNA序列[17]。
用于本文時,術(shù)語“Rosa26”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指用于在小鼠中組成型的、遍在基因表達的基因[18]。
用于本文時,術(shù)語“copGFP”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從橈足動物羽小角水蚤(Pontellina plumata)克隆的綠色熒光蛋白(GFP)。copGFP特征在于在寬泛的溫度下超亮的綠色熒光(最大激發(fā)/發(fā)射=482/502nm)和快速的成熟速率,這導(dǎo)致在冷血動物中的成功的表現(xiàn)。
用于本文時,術(shù)語“eGFP”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指在37℃效率翻番的具有F64L點突變的增強綠色熒光蛋白。因此,eGFP在哺乳動物細胞中導(dǎo)致顯著的GFPs表現(xiàn)。
用于本文時,術(shù)語“ires”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指內(nèi)部核糖體進入位點片段,已知其吸引真核核糖體翻譯起始復(fù)合物,由此不依賴常用的5′-端7mG帽結(jié)構(gòu)的存在而促進翻譯起始。
用于本文時,術(shù)語“H1”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人胚泡的內(nèi)細胞團建立的常用的人胚胎干細胞系。
用于本文時,術(shù)語“E14”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從近交系小鼠品系129/Ola建立的天然狀態(tài)的常用的小鼠胚胎干細胞。
用于本文時,術(shù)語“LO2”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人的肝組織建立的體細胞無限增殖細胞系。
用于本文時,術(shù)語“HK2”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人表皮組織建立的體細胞無限增殖細胞系。
用于本文時,術(shù)語“HEK293T”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指包含SV40大T抗原的人胚腎293細胞(HEK293)的變體。所述抗原允許轉(zhuǎn)染的包含SV40復(fù)制起點的質(zhì)粒的附加型復(fù)制,這導(dǎo)致轉(zhuǎn)染的質(zhì)粒的擴增和需要的基因產(chǎn)物的延長的暫時表達。
用于本文時,術(shù)語“BEL-7402”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人肝細胞瘤組織建立的肝細胞癌細胞系。
用于本文時,術(shù)語“BEL-7404”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人肝細胞瘤組織建立的肝細胞癌細胞系。
用于本文時,術(shù)語“SMMC-7721”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人肝細胞瘤組織建立的肝細胞癌細胞系。
用于本文時,術(shù)語“H1299”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指來源于淋巴結(jié)的人非小細胞肺癌細胞系。
用于本文時,術(shù)語“HCT116”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指從人結(jié)腸癌組織建立的人結(jié)腸癌細胞系。
用于本文時,術(shù)語“人隔離子”是本領(lǐng)域技術(shù)人員理解的術(shù)語,并且意指人基因組中的某種類型的阻斷序列,其防止在不同染色質(zhì)結(jié)構(gòu)域的不同調(diào)節(jié)元件之間的干擾。
III.靶向的基因組操作系統(tǒng)
本發(fā)明的CRISPR/Cas9基因組序列操作系統(tǒng)旨在通用地靶向來源于基本上任意活生物體的基本上任意細胞類型中的基本上任意的基因。這些系統(tǒng)包括基因靶向系統(tǒng),其需要在宿主細胞基因組中的第一插入事件,在所述宿主細胞基因組中,首先將包含非功能性報道基因的整合構(gòu)建體引入到靶基因組基因座中。隨后,發(fā)生第二插入事件,以用完全功能性的報道基因替代所述非功能性報道基因,由此允許報道基因蛋白產(chǎn)物的立即檢測和第二插入事件的完成。兩個插入事件都是基于多核苷酸構(gòu)建體與其插入位點之間的核苷酸序列同源性。
在報道基因整合到預(yù)先確定的基因組基因座中并檢測其表達產(chǎn)物之前,第二基因靶向系統(tǒng)不需要在先的整合事件。在該基因靶向系統(tǒng)中存在兩個變型:第一個變型利用報道基因在所選的整合位點處的基于同源性的整合,而第二個變型利用關(guān)于報道基因整合的非同源末端連接機制。
在下文中詳細描述用于操作這兩個系統(tǒng)的重組多核苷酸構(gòu)建體、細胞、組合物和試劑盒以及這些系統(tǒng)的多種應(yīng)用。
A.細胞
本發(fā)明可以在基本上任意的真核細胞類型中實施,以用于在預(yù)先選擇的基因組基因座處操作基因組序列的目的。例如,本發(fā)明的基因靶向系統(tǒng)可以用于多種人細胞,包括干細胞(例如,胚胎干細胞,多能干細胞,成人干細胞),或體細胞。來源于其他動物物種,特別是來源于其他哺乳動物(包括靈長類動物)的細胞可以類似地用于遺傳操作。
B.涉及兩次插入事件的基因靶向系統(tǒng)
本發(fā)明的一個基因靶向系統(tǒng)涉及兩次插入事件:第一,包含非功能性報道基因的整合構(gòu)建體(典型地在正常功能性報道基因編碼序列的中間放置中斷序列片段而導(dǎo)致)通過同源重組的方式插入到預(yù)先選擇的基因組基因座。第二,包含所述整合構(gòu)建體的宿主細胞以基于CRISPR/Cas9的方法被靶向,從而用供體構(gòu)建體提供的功能性報道基因替代所述非功能性報道基因,這允許所述功能性報道基因表達其蛋白產(chǎn)物,以及由此檢測成功的整合。
用于第一次整合事件的整合構(gòu)建體是重組多核苷酸構(gòu)建體,其包含啟動子,從5′至3′所述啟動子可操作地連接用于報道基因的第一非功能性編碼片段、中斷片段和用于報道基因的第二非功能性編碼片段。由于存在中斷片段,所以非功能性報道蛋白由所述啟動子表達。所述中斷片段可以是任意長度的任意核苷酸序列,典型地長度為約10-200個、20-100個或20-50個核苷酸。在一個實例中,為了確保沒有功能性報道基因蛋白被表達,用于本發(fā)明的中斷片段長度為30個核苷酸,其被改造以包含三個終止密碼子,分別處在不同的閱讀框中,其后接sgRNA(sg-X)靶序列。
報道基因是編碼允許細胞呈現(xiàn)可檢測信號的蛋白的核酸序列。所述能夠產(chǎn)生可檢測的信號的蛋白的實例包括產(chǎn)生熒光信號或磷光信號的蛋白、在測定中可檢測到的蛋白、表現(xiàn)出酶活性的蛋白、和在細胞上或在細胞內(nèi)可檢測的抗原。由所述報道基因編碼的蛋白的實例包括熒光蛋白,諸如綠色熒光蛋白(GFP)、人源化的Renilla綠色熒光蛋白(hrGEP)、增強的綠色熒光蛋白(eGFP)、增強的藍色熒光蛋白(eBFP)、增強的青色熒光蛋白(eCFP)、增強的黃色熒光蛋白(eYFP)和紅色熒光蛋白(RFP或DsRed)。由所述報道基因編碼的蛋白的更多實例包括生物發(fā)光蛋白,諸如螢火蟲熒光素酶和Renilla熒光素酶。由所述報道基因編碼的蛋白的其他實例包括用于轉(zhuǎn)化化學(xué)發(fā)光底物的酶,諸如堿性磷酸酶、過氧化物酶、氯霉素乙?;D(zhuǎn)移酶和β-半乳糖苷酶。在本發(fā)明中,當(dāng)使用通過光信號(諸如熒光信號或磷光信號)檢測的報道基因時,可以在維持細胞的狀態(tài)下觀察到報道基因的表達水平,并且可以容易地選擇用于評價的細胞,同時所述細胞是活的。另外,在這樣的情形中,報道基因可以用于連續(xù)施用測試物質(zhì)的實驗中,并且可以實時追蹤所述報道基因的表達水平隨時間的變化。由此,利用光信號作為標(biāo)記的報道基因可以優(yōu)選地用作本發(fā)明的報道基因。
整合構(gòu)建體可以以多種形式存在。所述構(gòu)建體的一個實施方案是環(huán)形多核苷酸載體,諸如質(zhì)粒,其中所述載體還包含兩個基因組同源序列,其中一個位于啟動子的5′端,另一個位于用于報道基因的第二非功能性編碼片段的3′端。這兩個基因組同源序列設(shè)計成與在宿主或接受體細胞的預(yù)先確定的遺傳基因座的基因組序列的兩個片段同源,從而這兩個基因組同源序列的存在允許在所述整合構(gòu)建體與細胞在所述預(yù)先確定的遺傳基因座的基因組序列之間的同源重組。因此,得到的宿主細胞在其基因組中包含可操作性連接到非功能性報道基因編碼序列(即,從5′至3′,用于報道基因的第一非功能性編碼片段,中斷片段,和用于報道基因的第二非功能性編碼片段)的啟動子。
第二次整合事件依賴第二重組多核苷酸構(gòu)建體,即供體構(gòu)建體。所述供體構(gòu)建體從5′至3′包含第一報道基因同源片段、間隔(interval)片段和第二報道基因同源片段。第一和第二報道基因同源序列分別與用于所述報道基因的第一和第二非功能性編碼片段同源,以致這兩個報道基因同源序列的存在允許在所述整合構(gòu)建體(現(xiàn)在已經(jīng)結(jié)合到宿主細胞基因組中)與所述供體構(gòu)建體之間的同源重組,從而形成功能性報道基因的編碼序列。然后,所述功能性報道基因可以在啟動子下表達,允許檢測第二插入事件的完成。供體構(gòu)建體典型地也是環(huán)形載體,諸如質(zhì)粒。第一和第二報道基因同源片段中的每一種在長度上可以不同,但是其長度典型地為約100-1000個、200-800個,或250-500個核苷酸,例如,長度為約250個、500個或800個核苷酸。間隔片段也可以長度不同,典型地,依據(jù)所用的靶向策略,其可以長約20-1000個、50-750個、100-500個或200-400個核苷酸。在一些實施方案中,其長度可以為約30個或726個核苷酸。在一些情形中,其可以編碼功能性報道基因蛋白。
為了成功地實現(xiàn)第二次整合事件,用上述供體構(gòu)建體、編碼能夠與用于報道基因的第一非功能性編碼片段或中斷片段內(nèi)的約20個核苷酸的片段雜交的sgRNA的DNA分子、和編碼Cas9蛋白(核酸酶)的DNA分子轉(zhuǎn)染攜帶整合構(gòu)建體的宿主細胞。sgRNA/Cas9復(fù)合物將識別并切割在用于報道基因的非功能性編碼片段內(nèi)的靶位點處的DNA;然后,其將促進在所述整合構(gòu)建體(現(xiàn)在結(jié)合到宿主細胞基因組中)與所述供體構(gòu)建體之間的同源重組,從而形成功能性報道基因的編碼序列。本發(fā)明因此還提供包含這些成分的組合物。
這種基因靶向系統(tǒng)不僅可用于人們研究參與CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的機制和過程,其還允許人們篩選作為所述修復(fù)途徑的潛在的調(diào)節(jié)劑的化合物。例如,如果候選化合物的存在導(dǎo)致增加的整合成功率,則所述化合物被鑒定為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的潛在的增強劑,并且其可以進一步檢測并驗證該活性。另一方面,如果候選化合物的存在導(dǎo)致降低的整合成功率,則所述化合物被鑒定為CRISPR-介導(dǎo)的同源性定向修復(fù)途徑的潛在的抑制劑,并且其可以進一步檢測并驗證該活性。考慮到CRISPR/Cas9-介導(dǎo)的基因操作的重要性,可以證明此類檢測方法是有效的用于鑒定目的潛力的化合物的工具。
C.涉及一次整合事件的基因靶向系統(tǒng)
本發(fā)明的另一個基因靶向系統(tǒng)僅需要一次基因組整合事件,并且可以進一步分成第一種類型,或同源性定向修復(fù),和第二種類型,或非同源末端連接類型。在第一類型的此類基因靶向系統(tǒng)中的供體構(gòu)建體包含:(1)報道基因的編碼序列;(2)位于所述報道基因編碼序列的5′端的第一基因組同源片段;和(3)位于所述報道基因編碼序列的3′端的第二基因組同源片段。第一和第二基因組同源片段與預(yù)先確定的基因組序列同源,所述預(yù)先確定的基因組序列優(yōu)選是活躍表達的基因,諸如看家基因。在適當(dāng)?shù)臈l件下,這些基因組同源片段的存在允許在所述供體構(gòu)建體與所述預(yù)先確定的基因組序列之間的同源重組。如上述,所述供體構(gòu)建體通常是環(huán)形載體,諸如質(zhì)粒。
為了實現(xiàn)報道基因的基因組整合及其后續(xù)的表達,使宿主或接受體細胞與下述接觸:供體構(gòu)建體,編碼能夠與在所述預(yù)先確定的基因組序列的編碼序列內(nèi)部或非編碼序列上游或下游內(nèi)部的片段雜交的sgRNA的DNA分子,和編碼Cas9蛋白的DNA分子(核酸酶)。sgRNA/Cas9復(fù)合物將在所述預(yù)先確定的基因組序列的上游或下游非編碼序列內(nèi)部的靶位點處識別并切割DNA;然后,在存在供體構(gòu)建體的條件下,其將通過同源定向的修復(fù)促進報道子整合。成功的整合導(dǎo)致報道基因表達并且可通過適當(dāng)?shù)臋z測方式檢測。
相反,在僅需要一次整合事件的第二種類型的基因靶向系統(tǒng)中的供體構(gòu)建體具有相當(dāng)不同的成分。所述構(gòu)建體包含:(1)報道基因的編碼序列;和(2)在所述報道基因編碼序列的3′端的多聚腺苷酸(polyA)片段,任選地具有一個位于所述報道基因編碼序列的5′端或所述多聚腺苷酸(polyA)片段的3′端的靶序列,或具有位于所述報道基因編碼序列的5′端和所述多聚腺苷酸(polyA)片段的3′端的兩個靶序列。在靶序列位點的核苷酸序列,有時稱為“sg-A靶位點”,對應(yīng)預(yù)先選擇的基因組序列的預(yù)先確定的片段,或需要的整合位點,其典型地位于看家基因的上游或下游非編碼區(qū)內(nèi),而在一些情形中,也可以在基因編碼區(qū)內(nèi)。當(dāng)使用兩個此類靶序列位點時,它們可以具有相同或不同的核苷酸序列。通過仔細選擇此類靶位點的核苷酸序列,例如,通過選擇可能在多種真核物種中的多個基因組基因座中存在的原核來源(例如,細菌或病毒來源)的核苷酸序列作為靶位點序列,人們可以使用本發(fā)明的基因操作系統(tǒng)作為向真核細胞中的任何基因組基因座引入報道子的通用工具。這種供體構(gòu)建體不包含任何基于同源性的元件,原因在于旨在以非同源末端連接方式使用。環(huán)形載體(諸如質(zhì)粒)也是供體構(gòu)建體的優(yōu)選形式。
使用這種類型的基因組操作系統(tǒng),使細胞與下述接觸:供體構(gòu)建體,編碼一種或兩種分別能夠與所述靶序列位點中的一個雜交的sgRNAs(其核苷酸序列可以相同或不同)的一種或兩種DNA分子,和編碼Cas9蛋白的DNA分子(核酸酶)。所述一種或多種sgRNAs包括能夠雜交到供體構(gòu)建體的sg-A靶序列位點的一種和能夠雜交到典型地位于下游非編碼序列內(nèi)(但是,在一些情形中,位于編碼序列或上游非編碼序列內(nèi))的預(yù)先確定的基因組序列的一種。所述sgRNAs將招募Cas9核酸酶在供體構(gòu)建體內(nèi)和在預(yù)先確定的基因組區(qū)域內(nèi)的靶位點處切割DNA;然后,這將促進通過非同源末端連接的報道子整合。成功的整合導(dǎo)致報道基因表達并且可通過適當(dāng)?shù)臋z測方式檢測。
除了使用這些基因靶向系統(tǒng)來研究CRISPR-介導(dǎo)的同源性定向或非同源末端連接修復(fù)途徑涉及的機制和過程之外,這些提供可以類似地允許人們篩選作為此類修復(fù)途徑的潛在的調(diào)節(jié)劑的化合物。例如,如果候選化合物的存在導(dǎo)致增加的整合成功率,則所述化合物被鑒定為CRISPR-介導(dǎo)的同源性定向或非同源性修復(fù)途徑的潛在的增強子,并且可以進一步檢測并驗證這一活性。另一方面,如果候選化合物的存在導(dǎo)致減少的整合成功率,在所述化合物被鑒定為CRISPR-介導(dǎo)的同源性定向或非同源性修復(fù)途徑的潛在的抑制劑,并且可以進一步檢測并驗證這一活性。
D.通過CRISPR/Cas9-偶聯(lián)的NHEJ的有效敲入
按照一個方面,我們檢驗了使用單一切割的NH-供體(GAPDH供體-NHEJ.1)(其與Cas-9、sg-A、sg-2或sg-3共轉(zhuǎn)染插入到LO細胞)的基因組整合效率。為了研究非同源性(NH)-靶向方法是否能夠以高效率產(chǎn)生穩(wěn)定的敲入克隆,用單一切割NH-供體(GAPDH供體-NHEJ.1)/Cas9/sg-A/sg-2和sg-3轉(zhuǎn)染LO細胞并且以低密度增殖。在由未分選的細胞建立的集落中,觀察到純的GFP+克隆(圖11,A)。在從轉(zhuǎn)染了sg-2的細胞中隨機分離的90個克隆中,發(fā)現(xiàn)13個是GFP+(14.44%)。PCR和測序分析證實,這些克隆確實在它們的基因組中攜帶正確的報道子敲入(圖11,C),這表明在沒有任何預(yù)先選擇的情況下成功產(chǎn)生了穩(wěn)定的敲入克隆。
1.不依賴同源性的報道子整合的潛在的分子基礎(chǔ)受常規(guī)DNA連接酶IV-依賴性NHEJ途徑的介導(dǎo)
按照一個方面,我們使用DNA連接酶IV(LIG4)敲除的LO2細胞檢驗了在用單一切割的NH-供體(GAPDH供體-NHEJ.1)/Cas9/sg-A/sg-2轉(zhuǎn)染后的基因組整合的分子基礎(chǔ)。為了揭示這些不依賴同源性的報道子整合潛在的分子基礎(chǔ),通過使用Cas9/sgRNAs缺失大段的LIG4 CDS產(chǎn)生DNA連接酶IV(LIG4)敲除的LO2細胞(圖12,A)。在檢驗的兩個LIG4敲除的克隆(#S16和#T8)中,與野生型LO2細胞相比,在用單一切割的NH-供體(GAPDH供體-NHEJ.1)/Cas9/sg-A/sg-2轉(zhuǎn)染后,觀察到急劇減少的報道子敲入(圖12,B,左圖,頂排)。并且,在這些LIG4無效細胞中NH-靶向的減少可以由攜帶LIG4過表達盒的質(zhì)粒挽救(圖12,B,左圖,底排)。與Maruyama等人[1]和Chu等人[2]最近的研究相一致的,還在這些LIG4無效細胞中觀察到基于HDR的2a-copGFP(GAPDH供體-HDR.1)報道子敲入的顯著增加(圖12,B,右圖),這與NHEJ活性的喪失相關(guān)??傊?,這些數(shù)據(jù)表明,觀察到的不依賴同源性的報道子整合確實主要由常規(guī)的DNA連接酶IV-依賴性的NHEJ途徑介導(dǎo)。
2.NHEJ-介導(dǎo)的敲入可以容納更大的插入物
按照一個方面,提供了使用12kb或34kb NH-供體在與Cas9/sg-A/sg-2共轉(zhuǎn)染時插入大的插入物的方法。為了檢驗NHEJ-介導(dǎo)的敲入是否能夠容納更大的插入物,通過將無啟動子ires-eGFP報道子與5’sg-A靶序列一起分別插入到大的PiggyBac載體(12kb)和腺病毒載體(34kb)中而構(gòu)建了稱為12k和34k NH-供體的質(zhì)粒。當(dāng)與Cas9/sg-A共轉(zhuǎn)染時,這些供體可以在sg-A靶序列處被切割,由此提供在12kb或34kb主鏈中攜帶ires-eGFP的用于基于NHEJ的敲入的線性供體。在與Cas9/sg-A/sg-2共轉(zhuǎn)染后,使用12k NH-供體檢測到7.49%的GFP+細胞,使用34k NH-供體檢測到1.18%(圖12,C,左圖)。與使用單一切割的NH-供體(GAPDH供體-NHEJ.1)/Cas9/sg-A/sg-2(4.6kb)觀察到的20.99%的GFP+細胞一起(圖12,C,右圖),明顯的是,當(dāng)使用較大的供體時,敲入頻率降低。這可能至少部分是由較大的質(zhì)粒的降低的轉(zhuǎn)染效率引起的(圖12,C,左圖)。轉(zhuǎn)染的細胞的PCR分析進一步證實這些大供體在GAPDH基因座的正確敲入(圖12,D)。
E.在相同的條件下使用線性化的供體,NHEJ敲入方法具有比HDR方法更高的功效
按照一個方面,我們使用多種與Cas9/sg-1或sg-2共轉(zhuǎn)染的HDR和NHEJ構(gòu)建體檢驗了NHEJ敲入與HDR敲入相比較的效率。使用不包含sg-2和sg-3靶位點的縮短的5’同源臂,構(gòu)建了GAPDH供體-HDR.3(圖13,A,上圖)。該質(zhì)粒不被Cas9/sg-2或sg-3切割,并且可以僅作為基于HDR的敲入的供體。事實上,共轉(zhuǎn)染Cas9/sg-2與該新供體產(chǎn)生6.46%的GFP+細胞(圖13,C,上排)。這一頻率比使用ires-eGFP(+HAs)供體-1/Cas9/sg-2引入的基于NHEJ的敲入低得多(圖13,B),盡管其與使用Cas9/sg-1與每種類型的(HAs+)供體一起產(chǎn)生的HDR-介導(dǎo)的報道子整合相當(dāng)(圖13,B,圖13,C和圖13,E)。
為了比較相同條件下基于NHEJ和基于HDR的敲入,使用線性化的供體進一步檢驗HDR介導(dǎo)的報道子插入。通過將sg-A靶序列分別插入到ires-eGFP(+HAs)盒的3’或5’,構(gòu)建GAPDH供體HDR.3a和GAPDH供體-HDR.3b(圖13,A)。這些供體由此可以通過Cas9/sg-A在sg-A靶位點切割而提供攜帶同源臂的線性模板。在存在sg-A的條件下使用GAPDH供體-HDR.3a,使用sg-1觀察到7.30%的GFP+細胞,使用sg-2觀察到7.42%(圖13,C,第三排),其實際上高于使用環(huán)形供體(供體-2或供體-2.A和2.B,不使用sg-A)得到的結(jié)果(圖13,C,頂部、第二和第四排)。然而,這些頻率仍然比通過基于NHEJ的報道子敲入產(chǎn)生的頻率低得多(圖12,C,右圖;和圖13,B,使用sg-2和sg-3)。有趣的是,使用GAPDH供體-HDR.3b和Cas9/sg-A,我們使用sg-1觀察到19.75%的GFP+細胞,使用sg-2觀察到27.23%(圖13,C,最下一排)。這表明,線性化的供體-2.B能夠允許基于NHEJ的敲入,并且高比例的GFP+細胞可能表示NHEJ-和HDR-介導(dǎo)的GFP+敲入事件二者的組合結(jié)果。
F.NHEJ-介導(dǎo)的敲入的脫靶效應(yīng)
按照一個方面,提供用于確定NHEJ-介導(dǎo)的敲入的脫靶效應(yīng)的方法。脫靶效應(yīng)通常涉及所有基于CRISPR/Cas9的技術(shù)[30]。由于不依賴同源性和非定向的性質(zhì),NHEJ-介導(dǎo)的敲入方法面臨比HDR方法更高的在脫靶位點引入DNA插入的機會。為了評價脫靶效應(yīng),在完整的人基因組(hg19)中尋找在所用的sgRNA中包含≤2個錯配的潛在的脫靶位點。對于sg-A沒有找到強脫靶位點。對于靶向GAPDH的sg-1、sg-2和sg-3,分別鑒定了15、14和6個潛在的脫靶位點,并且這些脫靶位點中無一位于已知的轉(zhuǎn)錄物的外顯子中(表2)。進一步選擇sg-2的前3個脫靶,并且分別使用引物XJ-77/XJ-78/XJ-79對脫靶整合進行PCR分析。在之前增殖的90個單細胞克隆中,沒有發(fā)現(xiàn)一個在脫靶位點#1攜帶報道子整合,而分別在兩個和三個克隆中發(fā)現(xiàn)在脫靶位點#2和#3的整合。與得到的正確敲入的克隆的數(shù)目(90個中有13個)相比(圖11),這些結(jié)果表明脫靶整合可能在NHEJ-介導(dǎo)的敲入過程中發(fā)生,但是頻率要比準(zhǔn)確的插入低得多。
G.CRISPR/Cas9-偶聯(lián)的NHEJ在活躍和沉默的基因的基因座都引入有效的敲入
按照一個方面,提供建立允許測量活躍和沉默的基因的基因座二者中的基因靶向效率的報道子系統(tǒng)的方法。為了檢驗局部基因組情形中的染色質(zhì)結(jié)構(gòu)是否影響NHEJ-介導(dǎo)的報道子敲入的效率,靶向另一種活躍轉(zhuǎn)錄的基因座ACTB和幾個沉默的基因的基因座,包括SOX17、T、OCT4、NANOG和PAX6。
設(shè)計兩種靶向ACTB 3’-UTR的sgRNAs(sgACTB-i和sgACTB-ii),以檢驗在ACTB基因座的HDR-和NHEJ-介導(dǎo)的敲入。通過將單一切割的NH-供體/Cas9/sg-A與sgACTB-i或sgACTB-ii一起共轉(zhuǎn)染,分別觀察到10.25%和15.27%的GFP+細胞(圖13,D,左圖,頂排)。使用新構(gòu)建的ACTB HDR-供體(其攜帶通過同源臂側(cè)連ACTB基因的基因座的ires-eGFP),使用sgACTB-i觀察到2.38%的基于HDR的敲入,使用sgACTB-ii觀察到8.60%(圖13,D,左圖,最下一排)?;贜HEJ和基于HDR的兩種敲入的頻率都與在GAPDH基因座觀察到的頻率相當(dāng)。
為了通過FACS分析直接檢驗在沉默的基因的基因座的敲入,使用PGK-eGFP報道子(圖13,D,右上圖),其在整合后表達GFP,而不管靶基因座是否被活性轉(zhuǎn)錄。構(gòu)建持續(xù)表達(CE)NH-供體,其在PGK-eGFP盒的5’攜帶sg-A靶序列;同時,產(chǎn)生靶向SOX17和T3’-UTRs的sgRNAs。值得注意的是,由于PGK-eGFP報道子的表達不依賴整合方向,因此,在這些測定中觀察到的GFP+細胞表示任一方向的敲入事件。在用CE NH-供體/Cas9/sg-A和一種基因特異性的sgRNA轉(zhuǎn)染后,在進行FACS分析之前,將LO2細胞維持五代以消除瞬時GFP表達。實際上,對于sgSOX17-i和sgSOX17-ii,分別檢測到26.25%和32.04%的GFP+細胞,使用sgT-i觀察到16.00%的GFP+細胞(圖13,D,右圖,頂排)。相反,在不存在基因特異性的sgRNA時,僅觀察到約2-3%的GFP+細胞;并且在不存在sg-A時,檢測到約1%的GFP+細胞。使用這種CE NH-供體,還在OCT4、NANOG、T和PAX6基因的基因座(它們在LO2細胞中大部分是沉默的)的多個位置檢驗NHEJ-介導(dǎo)的敲入。事實上,觀察到不同的敲入頻率,其不與基因中的靶標(biāo)位置相關(guān),也不與靶標(biāo)基因座的轉(zhuǎn)錄狀態(tài)相關(guān)(圖14,A和圖14,B),這表明實際的靶向效率主要由sgRNA固有的性質(zhì)決定。
此外,使用攜帶通過同源臂分別側(cè)連SOX17或T基因組區(qū)域的PGK-eGFP的供體質(zhì)粒,檢驗在SOX17和T基因組基因座的基于HDR的敲入。類似地,在FACS分析之前,將轉(zhuǎn)染的細胞傳代五次。通過將SOX17HDR-供體與Cas9/sgSOX17-i或sgSOX17-ii一起轉(zhuǎn)染,觀察到1.30%和2.83%的GFP+細胞,其表示在SOX17基因座的HDR-介導(dǎo)的敲入;而使用T HDR-供體和Cas9/sgT-i產(chǎn)生1.59%的GFP+細胞(圖13,D,右圖,最下一排)。這些頻率實際上比在相同的靶位點處基于NHEJ的敲入的頻率低得多(圖13,D,右圖,上兩排)。并且,它們還低于在活躍轉(zhuǎn)錄的ACTB和GAPDH基因座中觀察到的基于HDR的敲入(圖13,B,圖13,C和圖13,D,左圖,最下一排),這與之前表明活躍的轉(zhuǎn)錄增強同源重組的研究一致[31,32]。總之,這些結(jié)果表明,CRISPR/Cas9-偶聯(lián)的NHEJ可以介導(dǎo)活躍的和沉默的基因的基因座的有效的敲入,并且效率高于由基于HDR的方法產(chǎn)生的效率。
H.用于沉默的基因的基因座處的CRISPR/Cas9偶聯(lián)的NHEJ-介導(dǎo)的敲入的另外的系統(tǒng)
按照一個方面,提供了建立允許測量沉默的基因的基因座中的基因靶向效率的報道子系統(tǒng)的方法和系統(tǒng)。為了通過FACS分析直接檢驗在沉默的基因的基因座(Sox1和Foxa2 3’UTR基因座)處的敲入,使用用于敲入選擇的PGK-eGFP-PA盒與用于報道子應(yīng)用的ires-td-Tomato-PA以及兩個用于在熒光檢測后刪除非必需部分的LoxP位點(圖15,A)。構(gòu)建NH-供體(NH-S供體4),其在ires-td-Tomato-PA的5’攜帶sg-A靶序列;同時,產(chǎn)生靶向Sox1和Foxa2 3’-UTR的sgRNAs。在用NH-S供體4/Cas9/sg-A與一種基因特異性的sgRNAs轉(zhuǎn)染后,在進行FACS分析之前,將LO2細胞維持五代,以消除瞬時GFP表達。事實上,對于sgSox1-i和sgSox1-ii分別檢測到2.8%和2.48%的GFP+細胞(圖15,C),對于sgFoxa2-i和Foxa2-ii觀察到1.36和1.56%的GFP+細胞(圖15,C)。相反,在不存在基因特異性的sgRNA時,觀察到少于1%的GFP+細胞。流式檢測表明關(guān)于td-Tomato表達的陽性信號,其表示通過NH-S供體4構(gòu)建體成功的敲入(圖15,B)??傊?,這些結(jié)果表明CRISPR/Cas9-偶聯(lián)的NHEJ能夠介導(dǎo)在沉默的基因的基因座處的有效敲入。
I.兩次定向NHEJ-介導(dǎo)的報道基因敲入
按照一個方面,提供了建立允許兩次定向(雙色)NHEJ-介導(dǎo)的敲入的報道子系統(tǒng)的方法和系統(tǒng)。為了通過FACS分析直接檢驗在基因的基因座(GADPH 3’UTR基因座)的雙向敲入,使用單一切割的NH-供體(GAPDH供體-NHEJ.1)作為骨架;使用酶切位點Mlu1和Msc1刪除ires,然后將TD-PA克隆到Sac2位點,以得到雙重報道子。如圖16,A所示,使用用于敲入選擇的eGFP-PA盒與用于報道子應(yīng)用的td-Tomato-PA。使用靶向GAPDH 5’-UTR的sgGAPDH來介導(dǎo)非定向整合,并且sg-A誘導(dǎo)NH-供體質(zhì)粒的切割。使用這種供體,一次定向整合能夠引起eGFP表達(圖16,A,左側(cè)),另一次定向整合能夠引起TD tomato表達(圖16,A,右側(cè))。流式分析表明,使用兩次定向熒光供體,Cas9/sg-A/sgGAPDH介導(dǎo)的敲入產(chǎn)生GFP+/TD-、GFP-/Td+和GFP+/TD+細胞群體??傊?,這些結(jié)果表明該供體在非定向整合中的功能性作用。
J.由CRISPR/Cpf1介導(dǎo)的單向優(yōu)選的敲入方法
CRISPR/Cpf1(來自普雷沃菌屬和弗朗西絲菌屬1的CRISPR)是包含~1,300個氨基酸的V型CRISPR-Cas系統(tǒng)。與Cas9系統(tǒng)(也稱為II型CRISPR-Cas系統(tǒng))不同,Cpf1-sgRNA復(fù)合物有效的切割靶DNA,接著加工成成熟的crRNAs,而不需要具有短的富含T的原間隔臂(protospacer)-鄰近的基序(PAM)的另外的反式-激活的crRNA(tracrRNA),與此相反,對于Cas9系統(tǒng),需要在靶DNA后富含G的PAM。更重要的是,與由Cas9產(chǎn)生的平端不同,Cpf1引入具有4或5-nt 5’突出端的錯開的DNA雙鏈斷裂[35]。結(jié)果,與Cas9相比,Cpf1具有增強遺傳插入的效率和特異性的潛力。
按照一個方面,提供了用于使用CRISPR/Cpf1系統(tǒng)通過NHEJ介導(dǎo)的單向優(yōu)選的敲入的方法和系統(tǒng)。從Addgene(質(zhì)粒#69988)獲得CRISPR/Cpf1 pY016(pcDNA3.1-hLbCpf1)的質(zhì)粒,并且按照參考文獻[35]設(shè)計sgRNAs并克隆到sgRNA骨架中。制備兩個供體質(zhì)粒,一個供體質(zhì)粒是互補供體(C供體),另一個供體質(zhì)粒是非互補供體(NC供體)(圖17,A)。為了研究使用CRISPR/Cpf1系統(tǒng)的非同源性(NH)-介導(dǎo)的方法是否能夠產(chǎn)生穩(wěn)定的敲入克隆,將細胞轉(zhuǎn)染單一切割的NH-供體(C和NC供體)/Cpf1/sg-A和sg-GADPH。spCas9誘導(dǎo)的NHEJ-介導(dǎo)的敲入(圖17,B,左圖)有效地作為陽性對照(15.68%)(圖17,B,左圖)。與使用非互補供體(NC供體=2.69%)介導(dǎo)的相比,互補供體產(chǎn)生顯著更高的敲入效率(C供體=7.04%)??傊@些結(jié)果表明,使用CRISPR/Cpf1可以實現(xiàn)NHEJ介導(dǎo)的單向優(yōu)選的敲入方法。
K.NHEJ-介導(dǎo)的在多個等位基因中敲入多顏色熒光報道基因
按照一個方面,提供了建立允許使用CRISPR/Cas9誘導(dǎo)的NHEJ-介導(dǎo)的敲入進行多個等位基因敲除策略的報道子系統(tǒng)的方法(圖18)。本質(zhì)上,提供多個供體質(zhì)粒同時用于敲入。所述供體質(zhì)粒分別包含不同的報道基因,并且所述報道基因可以包括,但不限于,不同的熒光顏色或抗藥性。使用包含不同的報道子的每種質(zhì)粒,當(dāng)成功的NHEJ-介導(dǎo)的敲入后,被靶向的細胞將表現(xiàn)出不同的顏色和/或抗藥性。通過包括人隔離子序列,供體插入在靶基因的5’端,并且因此中斷其表達。使用多個供體質(zhì)粒同時插入到多個等位基因,靶基因?qū)⒈煌耆茐牟⑶耶a(chǎn)生敲除的基因型。
按照一個方面,基本上如下所述制備多顏色熒光報道子供體:
(a)NH-供體-in-eGFP:單一切割的NH-供體(GAPDH供體-NHEJ.1)用作骨架;并且使用酶切位點Mlu1和Msc1刪除ires,以得到NH供體eGFP;并且在sg-A靶序列的5’端插入人隔離子序列的串聯(lián)重復(fù)。
(b)NH-供體-in-td-Tomato:使用單一切割的NH-供體(GAPDH供體-NHEJ.1)作為骨架;并且使用酶切位點Mlu1和Msc1刪除ires;之后,使用td-Tomato替代eGFP;并且在sg-A靶序列的5’端插入人隔離子序列的串聯(lián)重復(fù)。
(c)NH-供體-in-puro:使用單一切割的NH-供體(GAPDH供體-NHEJ.1)作為骨架;并且使用酶切位點Mlu1和Msc1刪除ires;之后,使用嘌呤霉素(“puro”)替代eGFP,并且在sg-A靶序列的5’端插入人隔離子序列的串聯(lián)重復(fù)。
(d)NH-供體-in-hygro:使用單一切割的NH-供體(GAPDH供體-NHEJ.1)作為骨架;并且使用酶切位點Mlu1和Msc1刪除ires;之后,使用潮霉素(“hygro”)替代eGFP,并且在sg-A靶序列的5’端插入人隔離子序列的串聯(lián)重復(fù)。
用各自的NH-in-供體、Cas9、sg-A和一種基因特異性的sgRNAs(sgMRE11)轉(zhuǎn)染后,將細胞進行FACS分析。此處,用于在MRE11基因座的靶向結(jié)果(其使用NH-供體-in-eGFP和NH-供體-in-td-Tomato)的流式分析表示單陽性細胞(分別為1.18%和1.01%),這表示至少一種等位基因被修飾。另外,也注意到雙陽性細胞群體,這表示這些細胞在兩個等位基因中攜帶敲入(0.08%)。相反,在不存在基因特異性的sgRNA時,沒有觀察到陽性細胞。
以下是本發(fā)明的一些示例性系統(tǒng):
1.(b)GFP報道子系統(tǒng)
-pSuper_AAVS1(B)cGFP報道子質(zhì)粒
-PiggyBac_(B)cGFP報道子質(zhì)粒
-pSuper_Rosa26(B)cGFP報道子質(zhì)粒
-sgRNA-X
-三個供體質(zhì)粒(B)cGFP供體-HDR.1-3,分別攜帶30-bp插入物和250bp、500bp和800bp的同源臂
-三個供體質(zhì)粒(B)cGFP供體-HDR.A和B,分別攜帶726-bp插入物和250bp和500bp的同源臂
按照一個方面,提供允許利用熒光激活的細胞分選(FACS)分析直接評估HDR-介導(dǎo)的基因靶向效率的方法。產(chǎn)生斷裂的copGFP((B)cGFP)報道子系統(tǒng)。
按照一個方面,設(shè)計報道基因使其包含PGK啟動子驅(qū)動的Puro-2a-斷裂copGFP融合體編碼序列(CDS)(PGK-Puro2a(B)cGFP),并且將其構(gòu)建到pSuper-puro質(zhì)粒中(見圖1,A)。該斷裂的copGFP片段由以77-bp的合成片段間隔的兩個非功能性copGFP片段(copGFP-N和copGFP-C)組成。在該77-bp內(nèi),包含三個處在不同的閱讀框內(nèi)的終止密碼子,以防止通過NHEJ-介導(dǎo)的修復(fù)恢復(fù)copGFP表達,并且包含sgRNA的靶序列(稱為sg-X和sg-Y)用于在基因組內(nèi)引入位點特異的DSB。
按照一個方面,我們從人AAVS1基因組基因座(還稱為PPP1R12C基因座)克隆了兩個基因組DNA片段,并且在PGK-Puro2a(B)cGFP的5’和3’處插入到pSuper-puro質(zhì)粒中,以產(chǎn)生pSuper_AAVS1(B)cGFP報道子質(zhì)粒(見圖1,A)。該質(zhì)??梢杂糜趯?b)GFP報道子插入到任意人細胞系中的AAVS1基因座(見圖1,A),并且由此允許直接分析靶細胞系中的HDR。
按照一個方面,我們將PGK-Puro2a-(B)cGFP報道子片段插入到PiggyBac質(zhì)粒中[19],從而得到PiggyBac_(B)cGFP報道子質(zhì)粒。
按照一個方面,我們從小鼠Rosa26基因組基因座克隆兩個基因組DNA片段,并且在PGK-Puro2a-(B)cGFP片段的5’和3’處插入到pSuper-puro質(zhì)粒中,以產(chǎn)生pSuper_Rosa26(B)cGFP報道子質(zhì)粒(見圖1,B)。該質(zhì)??梢杂糜趯?B)cGFP報道子插入到任意小鼠細胞系中的Rosa26基因座,并且由此允許直接分析靶細胞系中的HDR效率。
按照一個方面,使用之前所述的支架質(zhì)粒[20]構(gòu)建兩個sgRNAs(sg-X和sg-Y),以分別靶向77-bp片段內(nèi)的設(shè)計的靶位點,或靶向copGFP-N內(nèi)的選擇的位點。
按照一個方面,構(gòu)建三個供體質(zhì)粒(稱為(B)cGFP供體-HDR.1-3),其分別包含一對針對Puro2a-(B)cGFP報道基因的不同長度(分別為250bp,500bp或800bp)的同源臂(見圖2,A)。這些供體質(zhì)??梢宰鳛槟0澹糜谝怨δ苄詂opGFP片段替換中斷的(dirupting)77-bp片段,由此通過HDR恢復(fù)copGFP表達。涉及的插入是24-bp的序列,其在構(gòu)建斷裂的copGFP報道子時被刪除。三個攜帶不同的同源臂的供體質(zhì)粒允許量化同源性長度對HDR效率的影響。
按照一個方面,為了檢驗大的插入物是否能夠通過CRISPR/Cas9-誘導(dǎo)的HDR有效地被靶向基因組,我們構(gòu)建了在針對Puro2a-(B)cGFP的同源臂之間攜帶完整的eGFP CDS的供體質(zhì)粒(見圖2,B)。類似地,構(gòu)建兩個攜帶側(cè)連250bp或500bp的同源臂的eGFP插入物的供體質(zhì)粒(分別稱為(B)cGFP供體-HDR.A和B)。
2.HEK293T-AAVS1(B)cGFP報道子細胞系
按照一個方面,我們使用HEK293T細胞產(chǎn)生了穩(wěn)定的細胞系,以測量人的體細胞中HDR-介導(dǎo)的基因靶向的效率。我們選擇將(B)cGFP報道子插入到人基因組中的AAVS1基因座中,所述AAVS1基因座表現(xiàn)出開放的染色質(zhì)結(jié)構(gòu),并且已被提議作為整合的潛在靶區(qū)域,原因在于其被打斷沒有功能性后果。按照一個方面,在本公開內(nèi)容中產(chǎn)生一種HEK293T(B)cGFP報道子細胞系,并且通過基因組PCR證實在AAVS1基因座攜帶需要的PGK-Puro2a-(B)cGFP報道子(稱為HEK293T-AAVS1(B)cGFP報道子細胞系)(見圖3,A)。按照一個方面,在報道子細胞系中由Cas9/sg-X誘導(dǎo)的DSBs可以通過T7E1測定檢測到(見圖3,B)。為了評估CRISPR/Cas9誘導(dǎo)的HDR效率,將質(zhì)粒(B)cGFP供體-HDR.1-3分別與編碼Cas9和sg-X的質(zhì)粒一起轉(zhuǎn)染到HEK293T-AAVS1(B)cGFP報道子細胞中。按照一個方面,在轉(zhuǎn)染后第3,5,7和9天利用FACS分析檢測表示HDR效率的GFP表達(見圖3,C)。我們的結(jié)果表明,在存在(B)cGFP供體-HDR.1-3的條件下,由Cas9/sg-X誘導(dǎo)的AAVS1基因座處的HDR效率分別約為0.11%、1.00%和3.45%,而在沒有轉(zhuǎn)染sg-X質(zhì)粒的對照組中沒有觀察到GFP+孔。使用攜帶800bp的同源臂的(B)cGFP供體-HDR.3得到最有效的靶向,其增加至~3.45%。按照這些數(shù)據(jù),當(dāng)提供更長的同源臂時,可以誘導(dǎo)更高的Cas9誘導(dǎo)的HDR。
按照一個方面,當(dāng)使用D10A突變體Cas9替代野生型Cas9時,在存在(B)cGFP供體-HDR.1-3的條件下,我們分別觀察到~0.11%、0.21%和0.35%的靶向效率(見圖3,C)。按照一個方面,與野生型Cas9相比,當(dāng)使用D10A突變體Cas9時,HDR效率是約十倍低。該數(shù)據(jù)表明使用切口酶Cas9進行基因靶向的限制性。
按照一個方面,為了檢驗更大的插入物是否能夠有效地被靶向至基因組,我們將供體質(zhì)粒(B)cGFP供體-HDR.B與Cas9/sg-Y一起共轉(zhuǎn)染到HEK293T-AAVS1(B)cGFP報道子細胞系中。在轉(zhuǎn)染后9天利用FACS分析檢測的HDR效率約為1.6%(見圖3,D)。類似地,當(dāng)使用D10A突變體Cas9時,觀察到較低的HDR效率(0.2%)。
3.H1-AAVS1(B)cGFP報道子細胞系
按照一個方面,通過共轉(zhuǎn)染PiggyBac_(B)cGFP報道子質(zhì)粒與轉(zhuǎn)座酶,產(chǎn)生一種穩(wěn)定的人胚胎干細胞(ESC)報道子細胞系,用來測量基因組中的HDR基因靶向效率。證實該細胞系攜帶了整合到基因組中的(B)cGFP報道子(見圖4)。為了評估由CRISPR/Cas9誘導(dǎo)的HDR效率,將攜帶800bp同源臂的質(zhì)粒(B)cGFP供體-HDR.3與Cas9和sg-X一起轉(zhuǎn)染到H1-(b)GFP報道子細胞中。按照一個方面,在轉(zhuǎn)染后第5天利用FACS分析檢測表示HDR效率的GFP表達。對照組用供體和Cas9轉(zhuǎn)染,但是不用sg-X轉(zhuǎn)染。檢測在存在(B)cGFP供體-HDR.3的條件下由Cas9/sg-X誘導(dǎo)的HDR效率穩(wěn)定在0.02%,而對照組在10E5個細胞內(nèi)沒有表現(xiàn)出GFP-陽性細胞。該數(shù)據(jù)表明,我們的H1-(B)cGFP報道子細胞系可以與提供的供體質(zhì)粒/Cas9/sg-X一起用于評估HDR-介導(dǎo)的基因靶向。
4.E14-Rosa26(B)cGFP報道子細胞系
按照一個方面,我們產(chǎn)生穩(wěn)定的小鼠ESC(E14)報道子細胞系,用來測量小鼠ESCs中的HDR-介導(dǎo)的基因靶向的效率。我們選擇在小鼠基因組中的Rosa26基因座插入(B)cGFP報道子,所述Rosa26基因座也表現(xiàn)出開放的染色質(zhì)結(jié)構(gòu),并且由于其斷裂沒有功能性后果,已被提議作為潛在的整合靶標(biāo)區(qū)域。按照一個方面,在本公開內(nèi)容中產(chǎn)生一種在Rosa26基因座攜帶需要的PGK-Puro2a-(B)cGFP報道子的E14(B)cGFP報道子細胞系(稱為E14-Rosa26(B)cGFP報道子細胞系)。為了評估由CRISPR/Cas9誘導(dǎo)的HDR效率,將質(zhì)粒(B)cGFP供體-HDR.3與編碼Cas9和sg-X的質(zhì)粒一起轉(zhuǎn)染到E14-Rosa26(B)cGFP報道子細胞中。按照一個方面,在轉(zhuǎn)染后第3,5,7和9天利用FACS分析檢測表示HDR效率的GFP表達。對照組用供體和Cas9轉(zhuǎn)染,但是不用sg-X轉(zhuǎn)染。檢測在存在(B)cGFP供體-HDR.3的條件下由Cas9/sg-X誘導(dǎo)的Rosa26基因座的HDR效率穩(wěn)定在0.08%,其是對照組的~40倍高。按照這些數(shù)據(jù),E14-Rosa26(B)cGFP報道子細胞系提供一種用于分析穩(wěn)定培養(yǎng)的小鼠ESCs中的HR頻率的可靠的且便利的工具。
5.用于GAPDH HDR-報道子系統(tǒng)的多核苷酸構(gòu)建體
-sg-1,2,3和4(靶向GAPDH 3’-UTR的sgRNA)質(zhì)粒
-GAPDH供體-HDR.1質(zhì)粒
按照一個方面,提供一種建立允許直接測量所有人細胞類型(系)中的基因靶向效率的報道子系統(tǒng)的方法。我們選擇靶向人基因組中的GAPDH基因座,其編碼恒定且普遍表達的看家基因。在該基因座插入的無啟動子的GFP報道子可以被主動轉(zhuǎn)錄,然后翻譯成熒光蛋白,所述熒光蛋白可以在活細胞中觀察到,并且可以通過熒光激活的細胞分選(FACS)直接檢驗成功靶向的插入的效率。為了避免破壞GAPDH蛋白功能(這可能在CRISPR/Cas9-介導(dǎo)的基因靶向過程中發(fā)生),我們選擇靶向GAPDH3’-UTR??傊?,我們設(shè)計并構(gòu)建了四種sgRNAs(sg-1-4),它們受之前所用的支架載體中的U6啟動子驅(qū)動[20]。利用T7E1測定,檢驗個體sgRNAs誘導(dǎo)DSB的活性和有效性(見圖5,A,以sg-1-3為例)。
按照一個方面,提供直接定量并比較人ESCs和體細胞中CRISPR/Cas9-誘導(dǎo)的基于HDR的基因靶向的效率的方法。我們構(gòu)建了供體質(zhì)粒(稱為GAPDH供體-HDR.1),以攜帶側(cè)連與人基因組中的GAPDH基因座共有同源性的兩個DNA片段臂的P2a-copGFP CDS(見圖5,B,C)。5’-臂包含在sg-1-4靶位點上游的903bp的序列,3’-臂包含在下游的967bp。將它們從基因組克隆并且插入在克隆到pSuper-puro載體中的無啟動子P2a-copGFP片段的5’和3’側(cè)。為了評估CRISPR/Cas9-誘導(dǎo)的HDR-介導(dǎo)的基因靶向,將野生型(WT)Cas9、來自sg-1-4的sgRNA和GAPDH供體-HDR.1一起共轉(zhuǎn)染。然后,在GAPDH供體-HDR.1模板的存在下,Cas9/sgRNA-誘導(dǎo)的DSBs將刺激通過HDR途徑的DNA修復(fù)。當(dāng)在兩個同源臂都發(fā)生成功的重組時,來自供體的P2a-copGFP片段將被符合GAPDH CDS閱讀框地插入到基因組中,與GAPDH一起轉(zhuǎn)錄,但是翻譯成單獨的GFP蛋白(圖5,B)。轉(zhuǎn)染后,利用FACS分析可以直接檢測表示精確的基因組整合的GFP表達(見圖5,D)。已經(jīng)證實供體載體不正確整合到GAPDH基因座中就不表達GFP。
按照一個方面,應(yīng)用基因組PCR和測序分析來證實2a-cGFP片段已精確插入到基因組中GAPDH CDS的3’端(見圖6,A和圖6,B),這表明靶向的確是通過HDR修復(fù)介導(dǎo)的。按照一個方面,在多種人細胞系中檢驗基于HDR的靶向效率。與來自參考文獻[15]的結(jié)果一致,在人ESCs中觀察到低頻率的基于HDR的靶向。在不存在CRISPR/Cas9的條件下,在所檢驗的105個細胞中,沒能檢測到GFP+細胞;當(dāng)Cas9和sgRNAs與供體質(zhì)粒共轉(zhuǎn)染時,由GFP+細胞表示的靶向的插入以約0.2-0.4%出現(xiàn)(見圖6,C)。另一方面,在體細胞系中檢測到不同但是更高頻率的基于HDR的基因靶向。LO2和HK2細胞分別表現(xiàn)出5.970%和1.608%的靶向效率,而人HEK293T細胞表現(xiàn)出1.655%的靶向效率。在所檢驗的腫瘤細胞系中,BEL-7402、BEL-7404和SMMC-7721分別表現(xiàn)出1.907%、1.492%和4.429%的靶向效率,而H1299表現(xiàn)出1.177%且HCT116表現(xiàn)出2.139%的靶向效率(見圖6,C)。按照一個方面,在所有細胞系中,當(dāng)省略Cas9和sgRNAs時,表示在不存在位點特異性DSBs的條件下發(fā)生的基底HDR-靶向的GFP+細胞以低得多的頻率出現(xiàn)(見圖6,C,對照組)。CRISPR/Cas9誘導(dǎo)的HDR靶向的富集(使用Cas9/sg-1檢驗的)約為4-70倍。按照一個方面,D10A突變體Cas9(切口酶)-誘導(dǎo)的HDR-靶向以比野生型Cas9誘導(dǎo)的1.5-3倍低的頻率發(fā)生(見圖6,C)。依據(jù)這些數(shù)據(jù),我們的報道子系統(tǒng)(包括GAPDH供體-HDR.1和相關(guān)的靶向GAPDH 3’-UTR的sgRNAs)提供了一種通過常用的轉(zhuǎn)染方法分析任意人細胞中的HDR頻率的可靠的且便利的工具。
6.用于GAPDH NHEJ-報道子系統(tǒng)的多核苷酸構(gòu)建體
-sg-1,2,3和4(靶向GAPDH 3’-UTR的sgRNA)質(zhì)粒
-sg-A質(zhì)粒
-NHEJ-供體.1質(zhì)粒
-NHEJ-供體.2質(zhì)粒
按照一個方面,提供直接定量并且比較人ESCs和體細胞中CRISPR-誘導(dǎo)的基于NHEJ的基因靶向的頻率的方法。為了這一目的,我們構(gòu)建了兩種供體質(zhì)粒(稱為GAPDH供體-NHEJ.1和GAPDH供體-NHEJ.2),它們攜帶無啟動子的ires-eGFP,接著是多聚腺苷酸(polyA)信號序列,但是沒有與人基因組中的GAPDH基因座同源的序列。按照一個方面,我們在GAPDH供體-NHEJ.1質(zhì)粒中ires-eGFP的5’處插入了一個合成的sg-A靶位點,或在GAPDH供體-NHEJ.2質(zhì)粒的ires-eGFP兩側(cè)插入兩個sg-A位點。在存在Cas9/sg-A的條件下,這些sg-A靶向位點將允許在供體質(zhì)粒中引入DSB,由此產(chǎn)生用于整合到基因組中的GAPDH 3’-UTR的需要的ires-eGFP報道子片段(見圖7,A)。為了產(chǎn)生不同長度的ires-eGFP報道子片段,由此允許檢驗在靶向整合過程中不同插入物長度的影響的目的,在這兩個供體中使用一個和兩個sg-A靶位點。按照一個方面,為了確保在將報道子插入到GAPDH 3’-UTR中之后的GFP表達,使用ires元件來繞開由NHEJ-引入的插入/缺失引起的移碼??傊?,當(dāng)Cas9/sgRNA在基因組和轉(zhuǎn)染的供體中誘導(dǎo)DSBs時,在不存在同源性供體模板的條件下,其將刺激通過NHEJ途徑的DNA修復(fù)。當(dāng)發(fā)生需要的末端連接時,ires-eGFP片段將被插入到基因組中GAPDH 3’-UTR處,與GAPDH一起轉(zhuǎn)錄,但是翻譯為單獨的eGFP蛋白。在轉(zhuǎn)染后4-5天利用FACS分析檢測表示需要的整合的GFP表達。
按照一個方面,我們使用與Cas9、sg-A和sg-1、2、3一起共轉(zhuǎn)染到LO2細胞中的GAPDH供體-NHEJ.1和GAPDH供體-NHEJ.2來檢驗基因組整合的效率。有趣的是,當(dāng)使用GAPDH供體-NHEJ.1時,檢測到多至20%的GFP+細胞(見圖7,B);并且當(dāng)使用GAPDH供體-NHEJ.2時,效率較低(見圖7,B)。按照一個方面,在不存在sg-1-3或sg-A的條件下(見圖7,B),或當(dāng)使用切口酶Cas9D10A突變體引入單鏈斷裂(SSBs)時(見圖7,B),沒能檢測到明顯的靶向。根據(jù)這些數(shù)據(jù),位點特異性的DSBs是NHEJ-介導(dǎo)的對所選的基因組基因座的基因靶向所需要的。
按照一個方面,通過基因組PCR分析用GAPDH供體-NHEJ.1產(chǎn)生的GFP+細胞。檢測到ires-eGFP片段和連接的載體骨架在基因組中在GAPDH CDS的3’處的插入(見圖7,C,上圖)。然而,當(dāng)使用GAPDH供體-NHEJ.2時,PCR分析僅檢測到ires-eGFP片段插入在基因組中兩個sg-A靶位點之間(見圖7,C,下圖)。這表明雙切割的供體模板確實在兩個靶位點被sg-A/Cas9切割。對用單切割或雙切割的供體產(chǎn)生的GFP+細胞的連接測序分析揭示預(yù)期的通過特異性sgRNAs的切割,和在所述切割位點的基因組與供體模板之間的易錯再連接(圖7,D和7,E),這表明這些靶向確實是通過Cas9/sgRNA-誘導(dǎo)的NHEJ修復(fù)介導(dǎo)的??傊紤]到NHEJ修復(fù)也以CRISPR-誘導(dǎo)的DSB相反的方向發(fā)生但是不導(dǎo)致GFP表達(這通過基因組PCR證實)(見圖8),在LO2細胞中由NHEJ介導(dǎo)的整合可以達到多至~40%。根據(jù)這些數(shù)據(jù),我們的報道子系統(tǒng)已經(jīng)提供了能夠允許直接測量任意人細胞中的NHEJ-介導(dǎo)的基因靶向并且允許直接比較它們的靶向效率的便利工具。
7.用于GAPDH HDR-報道子系統(tǒng)2的多核苷酸構(gòu)建體
-sg-1,2,3和4(靶向GAPDH 3’-UTR的sgRNA)質(zhì)粒
-GAPDH供體-HDR.2質(zhì)粒
按照一個方面,提供澄清NHEJ是否確實以比HDR高的效率介導(dǎo)大片段靶向的方法。構(gòu)建攜帶側(cè)連針對GAPDH基因座的同源臂的ires-eGFP的HDR供體(稱為GAPDH供體-HDR.2)。GAPDH供體-HDR.2中的5’同源臂比用在GAPDH供體-HDR.1中的同源臂長,從而覆蓋終止密碼子和攜帶sg-2-4靶位點的延長序列(見圖9)。當(dāng)GAPDH供體-HDR.2與Cas9和sg-1共轉(zhuǎn)染時,在LO2細胞中檢測到7.114%的HDR介導(dǎo)的效率(見圖9,B)。該效率低于使用sg-1的NHEJ-介導(dǎo)的靶向,但是與使用GAPDH供體-HDR.1檢測的HDR-介導(dǎo)的靶向相似。按照一個方面,當(dāng)GAPDH供體-HDR.2與Cas9/sg-2或sg-3(其靶向基因組和供體質(zhì)粒二者的5’同源臂)共轉(zhuǎn)染時,GFP+細胞分別增加至14.75%和17.36%(見圖9,B),其與使用單切割供體(GAPDH供體-NHEJ.1)的NHEJ-靶向相似?;蚪MPCR證實在基因組與供體質(zhì)粒之間在3’同源臂之外的末端連接,并且測序分析檢測了5’-連接中常見的插入/缺失。這些數(shù)據(jù)表明Cas9/sg-2或3切割基因組和供體DNAs二者,并且誘導(dǎo)NHEJ-介導(dǎo)的報道子整合。按照一個方面,當(dāng)使用Cas9/sg-4靶向3’同源臂時,GFP+細胞減少至10.06%(見圖9,B)。測序分析沒有在5’-連接中檢測到插入/缺失(見圖9,E),這表明完整的5’同源臂介導(dǎo)HDR靶向。在5’和3’同源臂二者上的切割,如Cas9/sg-3與sg-4一起共轉(zhuǎn)染所示的,在兩側(cè)都誘導(dǎo)NHEJ-靶向。
按照一個方面,檢驗在人ESCs和其他體細胞系中的NHEJ-介導(dǎo)的靶向效率并且與HDR-介導(dǎo)的靶向比較。在H1人ESCs中,Cas9/sg-1/sg-A與GAPDH供體-NHEJ.1的共轉(zhuǎn)染產(chǎn)生0.84%的GFP+細胞,并且當(dāng)使用活性更強的sg-2時,GFP+細胞的比例增加至1.69%(見圖9,C)。與存在GAPDH供體-HDR.1的條件下Cas9/sg-2誘導(dǎo)的HDR-靶向相比,使用Cas9/sg-A/sg-2/GAPDH供體-NHEJ.1的NHEJ-靶向的效率大約為五倍高;然而,Cas9/sg-1-誘導(dǎo)的NHEJ與HDR-靶向(使用GAPDH供體-HDR.2)之間的增加大約為十倍。相一致地,當(dāng)使用單一切割供體/Cas9/sg-A/sg-1時,在人的體細胞系中,NHEJ-靶向的效率也高于HDR-靶向,范圍為在HCT116細胞中的2.76%至SMMC-7721細胞中的18.42%(見圖9,D)。根據(jù)這些數(shù)據(jù),GAPDH供體-HDR.2質(zhì)粒允許我們直接比較并證明在所選的細胞系中NHEJ-介導(dǎo)的基因靶向以比HDR-介導(dǎo)的基因靶向以更高的頻率發(fā)生。
8.用于靶向OCT4和ACTB的NHEJ-報道子系統(tǒng)的多核苷酸構(gòu)建體
按照一個方面,提供澄清CRISPR/Cas9-誘導(dǎo)的NHEJ是否能夠以與整合到GAPDH基因座相當(dāng)?shù)母咝式閷?dǎo)報道基因向OCT4和ACTB基因組基因座的整合的方法。為了這一目的,我們構(gòu)建了兩個sgRNAs(sgOCT4或sgACTB),它們分別靶向OCT4和ACTB基因的3’-UTR。OCT4基因編碼多能性相關(guān)的轉(zhuǎn)錄因子OCT4,而ACTB基因編碼看家蛋白β-肌動蛋白。因此,在OCT4和ACTB 3’-UTRs敲入ires-eGFP報道子將導(dǎo)致活性轉(zhuǎn)錄和報道子表達。實際上,NHEJ-供體.1/Cas9/sg-A與sgOCT4或sgACTB共轉(zhuǎn)染到H1人ESCs中分別產(chǎn)生0.55%和0.43%的GFP+細胞(圖10,A和B)。這些與報道子整合到GAPDH基因座的效率相當(dāng)(圖9,D)。PCR和測序分析完全證實單一切割供體在OCT43’-UTR整合到基因組中(圖10,C-E)。總之,這些數(shù)據(jù)表明CRISPR/Cas9-偶聯(lián)的NHEJ修復(fù)可以介導(dǎo)大的報道基因向人ESCs中任意選擇的基因組基因座中的有效敲入。
實施例
通過僅舉例說明的方式而不是限制的方式提供下述實施例。本領(lǐng)域技術(shù)人員容易認識到可以改變或改進以產(chǎn)生基本上相同或相似的結(jié)果的多種非關(guān)鍵性參數(shù)。
實施例I:II型CRISPR系統(tǒng)
通常已知三種種類的CRISPR系統(tǒng),并且稱為I型、II型或III型。按照一個方面,本公開內(nèi)容所述的特別有用的切割dsDNA的酶是單效應(yīng)子酶,即Cas9,與II型相同。結(jié)果,II型系統(tǒng)更可能在備選的情形中(諸如真核細胞中)行使功能。II型效應(yīng)子系統(tǒng)由下述組成:從包含間隔臂的CRISPR基因座轉(zhuǎn)錄的長pre-crRNA,多功能性Cas9蛋白,和對于gRNA加工是重要的tracrRNA。按照一個方面,本公開內(nèi)容的Cas9酶解開DNA雙鏈體并且尋找與crRNA匹配的序列進行切割。當(dāng)在靶DNA中檢測到能夠與crRNA中的序列匹配的約20bp序列時,發(fā)生靶標(biāo)識別。重要的是,僅在3’端也存在正確的PAM的條件下,Cas9才切割DNA。在本公開內(nèi)容中,初始來自釀膿鏈球菌的II型CRISPR系統(tǒng)需要5’-NGG-3’序列,其中N可以是任意核苷酸。生物信息學(xué)分析已經(jīng)產(chǎn)生了多種細菌中可以用來鑒定另外有用的PAMs并且擴展可被CRISPR靶向的序列組的CRISPR基因座的廣泛的數(shù)據(jù)庫[21]。在釀膿鏈球菌II型CRISPR系統(tǒng)中,發(fā)生針對原始間隔臂的5’和3’兩端的DNA雙鏈斷裂(DSB)形成。如果兩個核酸酶結(jié)構(gòu)域中的一個被失活,則Cas9將在體外和在人細胞中作為切口酶起作用。
gRNA-定向的Cas9切割的特異性用作基因組改造真核細胞的機制。gRNA/DNA的雜交不需要100%的匹配,就可以被酶識別和切割。因此,可能發(fā)生脫靶活性。在本公開內(nèi)容中,來自釀膿鏈球菌的II型CRISPR系統(tǒng)在體外耐受在20bp成熟的間隔臂序列中的前6個堿基中的錯配。
實施例II:質(zhì)粒構(gòu)建
按照一個方面,構(gòu)建II型CRISPR系統(tǒng)的載體。Cas9基因序列是來自Addgene(#41815)的人密碼子優(yōu)化的。切口酶hCas9D10A類似地來自Addgene(#41816)。
按照一個方面,構(gòu)建了V型CRISPR系統(tǒng)的載體。從Addgene(質(zhì)粒#69988)獲得CRISPR/Cpf1 pY016(pcDNA3.1-hLbCpf1)的質(zhì)粒,并且按照參考文獻[35]設(shè)計sgRNAs并克隆到sgRNA骨架中。
-sg-1,2,3和4(靶向GAPDH 3’-UTR的sgRNA)質(zhì)粒
-sgOCT4
-sgACTB
-sgSOX17
-sgT
-sgNANOG
-sgPAX6
-sgMRE11
-sg-X
-sg-A
按照一個方面,按照參考文獻[22]設(shè)計sgRNA。為了產(chǎn)生sgRNA,合成一對包含sgRNA靶序列的26-mer寡聚物。將它們退火,然后插入到sgRNA表達載體MLM3636(Addgene#43860)的BsmBI位點。從在GAPDH CDS的3’端的GAPDH外顯子9區(qū)域獲得在PAM基序(5’-NGG-3’)之前的sg-1-4靶序列(20-bp);而sgOCT4、sgSOX17、sgT、sgNANOG、sgPAX6、sgMRE11和sgACTB靶序列分別選自O(shè)CT43’-UTR、SOX173’-UTR、T 3’-UTR、NANOG 3’-UTR、PAX63’-UTR、MRE11 3’-UTR和ACTB 3’-UTR。sg-X和sg-A靶序列分別選自熒光蛋白eGFP和copGFP。利用NCBI核苷酸BLAST預(yù)測導(dǎo)向序列潛在的脫靶效應(yīng)(off-target effect)。所用的sgRNAs的靶序列顯示在表1中。
-pSuper-MSC(修飾的pSuper-puro載體)
按照一個方面,按我們之前的工作(未公開)修飾pSuper-puro載體[23],使其在幾個表達盒的每一側(cè)攜帶兩個多限制性酶切位點簇(包括SalI,MfeI,Mlu1,Bamh1,Nhe1,Hpa1,Afl2,EcoR1 Avr2,Pml1和Xho1)(其在后續(xù)構(gòu)建程序中被去除)。
-pSuper-PGK-puro(無終止密碼子)
-pSuper_AAVS1(B)cGFP報道子質(zhì)粒
按照一個方面,使用引物XJ-1/XJ-2通過PCR擴增包含PGK-puro的DNA片段(無終止密碼子),并且在MfeI和MluI位點亞克隆到之前修飾的基于pSuper的載體(未公開),從而得到pSuper-PGK-puro。攜帶P2a序列的引物XJ-3與引物XJ-4一起使用,用于擴增copGFP N-末端片段,然后將其插入到上述pSuper-PGK-puro質(zhì)粒中,從而得到pSuper-PGK-puro-p2a-cGFP(N)。合成另一對包含sg-X靶序列和重復(fù)的終止密碼子的引物(XJ-5/XJ-6)(共77bp),并且用于擴增copGFP的C-端。然后,將該片段插入到pSuper-PGK-puro-p2a-cGFP(N)質(zhì)粒中,以得到pSuper-PGK-puro-p2a-斷裂的cGFP(cGFP的N-和C-端被重復(fù)的終止密碼子和sg-X靶序列隔開)。該質(zhì)粒在下文以縮略形式稱為pSuper_(B)cGFP。接著,使用引物XJ-7/XJ-8擴增來自AAVS1的5’同源臂并且插入在SalI和MfeI位點,而使用引物XJ-9/XJ-10擴增來自AAVS1的3’同源臂并且插入在pSuper_(B)cGFP質(zhì)粒的HpaI和EcoRI位點。新構(gòu)建的質(zhì)粒為pSuper_AAVS1(B)cGFP報道子。
-pSuper_Rosa26(B)cGFP報道子質(zhì)粒
按照一個方面,使用引物Xj-11/XJ-12擴增來自小鼠Rosa26基因組基因座的5’同源臂并且插入在SalI和MfeI位點,而使用引物Xj-13/XJ-14擴增來自小鼠Rosa26基因組基因座的3’同源臂并且插入在pSuper_(B)cGFP質(zhì)粒的AflII和EcoRI位點。新構(gòu)建的質(zhì)粒是pSuper_Rosa26(B)cGFP報道子。
-PiggyBac_AAVS1(B)cGFP報道子質(zhì)粒
按照一個方面,通過pSuper_(B)cGFP質(zhì)粒的MfeI和EcoRI雙重消化獲得PGK-Puro2a(B)cGFP DNA片段;并且然后將其亞克隆到PiggyBac載體pCyl50(英國的Sanger中心)的EcoRI處。選擇正向的插入(Forwarded insertion)并且命名為PiggyBac_AAVS1(B)cGFP報道子質(zhì)粒。
-攜帶30-bp插入物和分別為250bp、500bp和800bp的同源臂的三個供體質(zhì)粒(B)cGFP供體-HDR.1-3
按照一個方面,我們構(gòu)建了包含完整的copGFP的供體質(zhì)粒,其將修復(fù)上述報道子中的斷裂的cGFP,用于評估HDR-介導(dǎo)的靶向的DNA插入。首先,使用引物XJ-3/XJ-6通過PCR獲得完整和有功能的P2a-copGFP-多聚腺苷酸(polyA)DNA片段,并且以MluI和BamHI位點插入到上述中間質(zhì)粒pSuper-PGK-puro(無終止密碼子)中。然后,使用三對引物(XJ-15/XJ-16,XJ-17/XJ-18和XJ-19/XJ-20)來擴增不同長度的puro-P2a-copGFP片段。然后,將攜帶不同的針對Puro2a(B)cGFP的同源臂(分別為250bp,500bp或800bp)的三個片段通過TA-連接克隆到pGEM-T easy載體中。得到的質(zhì)粒為供體質(zhì)粒(B)cGFP供體-HDR.1-3。
-攜帶726-bp插入物和分別約為250bp、500bp的同源臂的兩個供體質(zhì)粒(B)cGFP供體-HDR.A,B
按照一個方面,我們構(gòu)建了包含功能性eGFP的供體質(zhì)粒,其可以替代上述報道子中的斷裂的cGFP,用于評估HDR-介導(dǎo)的靶向的DNA插入。使用引物XJ-21/XJ-22擴增eGFP DNA片段,然后以BamHI和MluI位點插入到pSuper_(B)cGFP質(zhì)粒中。同時BamHI和MluI消化去除斷裂的cGFP片段。為了提供針對斷裂的cGFP報道子的3’同源序列,使用引物XJ-23/XJ-6通過PCR擴增C-端cGFP片段并且插入回到上述質(zhì)粒中。接著,使用兩對引物(XJ-4/XJ-24和XJ-25/XJ-16)來擴增不同長度的puro-P2a-copGFP片段。然后,將攜帶不同的針對Puro2a(B)cGFP的同源臂(分別為250bp或500bp)的兩個片段通過TA-連接克隆到pGEM-T easy載體中。得到的質(zhì)粒為供體質(zhì)粒(B)cGFP供體-HDR.A和B。
-GAPDH供體-HDR.1質(zhì)粒
-GAPDH供體-HDR.2質(zhì)粒
-GAPDH供體-HDR.3質(zhì)粒
-GAPDH供體-HDR.3a質(zhì)粒
-GAPDH供體-HDR.3b質(zhì)粒
按照一個方面,構(gòu)建五個靶向GAPDH的載體,用于HDR-介導(dǎo)的基因靶向報道子測定:(1)構(gòu)建2a-copGFP供體(GAPDH供體-HDR.1,見圖5)。合成攜帶微小RNA病毒(Picornavirus)“自我切割”P2a序列[17]和克隆位點的引物XJ-3/XJ-26,并且用于通過兩步PCR從PCDH-CMV-MCS-EF1-copGFP(SBI,CD511B-1)擴增攜帶P2a-copGFP接合-CDS的DNA片段。將得到的片段插入到修飾的pSuper-puro載體[23]中的BamHI和XhoI位點。從GAPDH基因組基因座中sg-1-3靶位點的上游(903bp,使用引物XJ-27/XJ-28)和下游(967bp,使用引物XJ-29/XJ-30)擴增兩個同源臂,并且插入到上述質(zhì)粒中2a-copGFP片段5’的MfeI和MluI位點和3’的HpaI和XhoI位點。(2)構(gòu)建ires-eGFP HDR-供體(GAPDH供體-HDR.2,見圖9)。使用引物XJ-31/XJ-32從pLenti6.3-MCS-IRES2-EGFP(Invitogen)擴增攜帶ires-eGFP的DNA片段,并且插入到MluI和HpaI位點,以替代前述pSuper-puro質(zhì)粒中的2a-copGFP。使用另一對引物XJ-33/XJ-34擴增5’同源臂,以涵蓋GAPDH終止密碼子和sg-2、3靶位點,而3’同源臂保留不變。(3)將GAPDH供體-HDR.2中的5’同源臂用使用引物GADPH 5’-臂XJ-33/XJ-57(表3)擴增的縮短的片段替代,以覆蓋GAPDH終止密碼子,但不覆蓋sg-2和sg-3靶位點。3’同源臂保留不變。合成包含sg-A靶序列的兩個互補寡核苷酸,將其退火并插入在同源臂側(cè)連的ires-eGFP盒的3’(XhoI位點)或5’(NotI和BamHI位點),從而分別構(gòu)建GAPDH供體-HDR.3a和GAPDH供體-HDR.3b。
-NHEJ-供體.1質(zhì)粒
-NHEJ-供體.2質(zhì)粒
按照一個方面,構(gòu)建兩個用于包括斷裂的GFP的NHEJ報道子測定的載體:構(gòu)建兩個ires-eGFP NHEJ-供體(GAPDH供體-NHEJ.1和GAPDH供體-NHEJ.2,見圖7)。合成一對攜帶sg-A靶位點(5’-GAGATCGAGTGCCGCATCACCGG-3’)的寡聚體(XJ-35/XJ-36),退火并且插入到攜帶ires-eGFP的pSuper-puro中,從而建立sgRNA靶位點以使供體載體線性化。對于單一切割NHEJ-供體(GAPDH供體-NHEJ.1),將單個sg-A靶位點插入在ires-eGFP 5’的MfeI和MluI位點;然而,對于雙切割NHEJ-供體(GAPDH供體-NHEJ.2),將兩個sg-A靶位點分別插入在ires-eGFP 5’的MfeI和MluI位點和3’的SalI和HpaI。
-12k NH-供體質(zhì)粒
-34k NH-供體質(zhì)粒
將包含sg-A靶序列接著是來自單一切割的NH-供體的ires-eGFP盒的DNA片段亞克隆到大的PiggyBac載體(3)的AfeI位點,以產(chǎn)生PB-ires-eGFP(12,458bp),即,12k NH-供體。還將相同的sg-A-ires-eGFP片段插入到AdTrack載體(4)的HpaI和MfeI位點,然后,將其與AdEasy-1質(zhì)粒共轉(zhuǎn)化到大腸桿菌(E.Coli)BJ5183(4)中,以產(chǎn)生重組的AdEasy-ires-eGFP(34,457bp),即,34k NH-供體。同時,將PGK-GFP片段插入在PiggyBac載體中的AfeI位點,以產(chǎn)生12k(PB)GFP-載體,而將原始的包含CMV-eGFP的AdTrack載體與AdEasy-1質(zhì)粒共轉(zhuǎn)化,以產(chǎn)生重組的34k(AD)GFP-載體。這些大的質(zhì)粒恒定表達GFP,并且用于監(jiān)視轉(zhuǎn)染效率。
-恒定表達的(CE)NH-供體質(zhì)粒
通過PCR從單一切割的NH-供體擴增包含sg-A靶序列、接著是500bp的間隔序列的DNA片段,并且插入到攜帶PGK-eGFP盒的pSuper-puro質(zhì)粒的BamHI和MscI位點。得到的質(zhì)粒稱為CE NH-供體。
-ACTB HDR-供體質(zhì)粒
-SOX17 HDR-供體質(zhì)粒
-T HDR-供體質(zhì)粒
從ACTB基因座擴增一個5’-和一個3’-同源臂,以替代GAPDH供體-HDR.2質(zhì)粒中的GAPDH同源序列,用以產(chǎn)生ACTB HDR-供體。類似地,從SOX17和T基因組基因座中的每個擴增一個5’-和一個3’-同源臂,并且插入在CE NH-供體中PGK-eGFP的5’和3’,以產(chǎn)生SOX17和T HDR-供體。所用的引物列在表3中。XJ-58/XJ-59和XJ-60/XJ-61分別用于ACTB的5′-同源臂和3′-同源臂。XJ-62/XJ-63和XJ-64/XJ-65分別用于SOX17的5′-同源臂和3′-同源臂。XJ-66/XJ-67和XJ-68/XJ-69分別用于T的5′-同源臂和3′-同源臂。
-NH-供體-in-eGFP質(zhì)粒
-NH-供體-in-td-Tomato質(zhì)粒
-NH-供體-in-puro質(zhì)粒
-NH-供體-in-hygro質(zhì)粒
使用本文之前所述的單一切割的NH-供體(GAPDH供體-NHEJ.1)作為所有四種載體的骨架;使用酶切位點Mlu1和Msc1刪除ires,以得到NH-供體-eGFP質(zhì)粒。為了產(chǎn)生NH-供體-td-Tomato質(zhì)粒,使用td-Tomato替代eGFP。為了產(chǎn)生NH-供體-puro質(zhì)粒,使用嘌呤霉素(“puro”)替代eGFP。為了產(chǎn)生NH-供體-hygro質(zhì)粒,使用潮霉素(“hygro”)替代eGFP。使用酶切位點BamH1在sg-A的5’端插入人隔離子序列的串聯(lián)重復(fù),以分別得到NH-供體-in-eGFP、NH-供體-td-in-Tomato、NH-供體-in-puro以及NH--供體-in-hygro。本公開內(nèi)容中的人隔離子序列可見于Liu等人的報告[36]。應(yīng)用兩種類型的人隔離子序列的串聯(lián)重復(fù)(在Liu等人的報告中的A2和A4)。
-雙色熒光質(zhì)粒
使用本文之前所述的單一切割的NH-供體(GAPDH供體-NHEJ.1)作為雙色載體的骨架;使用酶切位點Mlul和Mscl刪除ires。然后,將td-pA克隆到SacII位點,以產(chǎn)生雙報道子。
-Loxp-sgA-ires-eGFP-PA-LoxP-PGK-eGFP-pa供體質(zhì)粒
-Loxp-sgA-ires-eGFP-PA-LoxP-PGK-td Tomato-pa供體質(zhì)粒
-Loxp-sgA-ires-td Tomato-PA-LoxP-PGK-eGFP-pa供體質(zhì)粒
-Loxp-sgA-ires-td Tomato-PA-LoxP-PGK-td Tomato-pa供體質(zhì)粒
按照一個方面,構(gòu)建四種靶向沉默的基因的基因座的載體,以用于NHEJ-介導(dǎo)的基因靶向報道子測定。使用本文之前所述的單一切割的NH-供體(GAPDH供體-NHEJ.1)作為Loxp-sgA-ires-eGFP-PA-LoxP-PGK-eGFP-pa供體的骨架。使用酶切位點HpaI和Xho1插入PGK-GFP-PA盒。然后,將在5’側(cè)的LoxP位點合成為寡核苷酸并插入到SacII位點。另外,使用本文之前所述的單一切割的NH--供體(GAPDH供體-NHEJ.1)作為Loxp-sgA-ires-eGFP-PA-LoxP-PGK-td Tomato-pa供體的骨架。使用酶切酶位點HpaI和Xho1插入PGK-td Tomato-pa盒。然后,將在5’側(cè)的LoxP位點合成為寡核苷酸并插入到SacII位點。對于Loxp-sgA-ires-td Tomato-PA-LoxP-PGK-eGFP-pa供體,使用Loxp-sga-ires-eGFP-PA-LoxP-PGK-eGFP-pa供體作為骨架。使用酶切位點BamH1和Hpa1刪除ires-eGFP-pa并且插入ires-td Tomato-pa盒。最后,對于Loxp-sgA-ires-td Tomato-PA-LoxP-PGK-td Tomato-pa供體,使用Loxp-sga-ires-eGFP-PA-LoxP-PGK-td Tomato-pa供體作為骨架。使用酶切位點BamH1和Hpa1刪除ires-eGFP-pa并且插入PGK-td Tomato-pa盒。
實施例III:細胞培養(yǎng)
將H1人ESCs(WiCell Research Institute)在不含飼養(yǎng)細胞的情況下維持在mTeSR1培養(yǎng)基(Stemcell Technologies)中的基質(zhì)膠(BD Biosciences)上。每天更換培養(yǎng)基,并且每3天將細胞用0.5mM乙二胺四乙酸(EDTA,Life Technologies)傳代培養(yǎng)。使用TrypLE(Life technologies)來解離H1細胞,制備用于FACS分析的單細胞。
人的體細胞系從ATCC(美國典型培養(yǎng)物保藏中心(American Type Culture Collection))獲得。將LO2和HEK293T細胞培養(yǎng)在補充了10%胎牛血清(FBS,Life Technologies)的Dulbecco改良Eagle培養(yǎng)基(Dulbecco′s modified Eagle′s medium(DMEM),Life Technologies)中;將SMMC-7721,BEL-7402,BEL-7404和H1299細胞培養(yǎng)在補充了10%FBS的Roswell Park Memorial Institute 1640(RPMI,Life Technologies)中;將HK2細胞培養(yǎng)在補充了10%FBS的1:1 F-12/DMEM培養(yǎng)基(Life Technologies)中;并且將HCT116細胞培養(yǎng)在補充了10%FBS的McCoy 5A培養(yǎng)基(Life Technologies)中。培養(yǎng)物用標(biāo)準(zhǔn)胰蛋白酶/EDTA每3或4天傳代。
所有細胞都以37℃和5%CO2保持在濕潤化的培養(yǎng)箱中。
實施例IV:產(chǎn)生HEK293T-AAVS1(B)cGFP報道子細胞系
按照一個方面,按照供應(yīng)商的使用說明,使用Lipofectamine 2000(Life Technologies)將pSuper_AAVS1(B)cGFP報道子質(zhì)粒轉(zhuǎn)染到HEK293T細胞中。在轉(zhuǎn)染后第2天,將細胞解離成單個細胞并且以低密度接種。向培養(yǎng)基中以0.8μg/ml加入嘌呤霉素,并且將細胞培養(yǎng)7-10天直到出現(xiàn)單個的嘌呤霉素抗性克隆。挑取單克隆并且擴增。然后,使用針對5’整合連接的引物XJ-37/XJ-38和針對3’整合連接的XJ-39/XJ-40,通過PCR分析基因組DNA。陽性克隆用于通過FACS的HDR測定。鑒定了一個克隆在基因組中的正確靶位點攜帶(B)cGFP報道子,其可以被供體質(zhì)粒(B)cGFP供體-HDR.1-3與(B)cGFP供體-HDR.A-B二者修復(fù)。
實施例V:產(chǎn)生人ESC H1-(B)cGFP報道子細胞系
按照一個方面,按照供應(yīng)商的使用說明,使用Fugene HD(promega)將PiggyBac(B)cGFP報道子質(zhì)粒轉(zhuǎn)染到人ESCs H1細胞系中。在轉(zhuǎn)染后第3天,將細胞解離成單個細胞并且在存在Rock抑制劑的條件下以低密度接種。向培養(yǎng)基中以0.4μg/ml加入嘌呤霉素,并且將細胞培養(yǎng)7-10天直到出現(xiàn)單個嘌呤霉素抗性克隆。挑取單克隆,擴增,然后利用FACS分析通過HDR測定篩選。鑒定了一個克隆在基因組中攜帶(B)cGFP報道子,并且可以通過供體質(zhì)粒(B)cGFP供體-HDR.3修復(fù)。
實施例VI:產(chǎn)生小鼠ESC E14-Rosa26(B)cGFP報道子細胞系
按照一個方面,按照供應(yīng)商的使用說明,使用Lipofectamine 2000(Life Technologies)將pSuper_Rosa26(B)cGFP報道子質(zhì)粒轉(zhuǎn)染到小鼠ESCsE14細胞中。在轉(zhuǎn)染后第2天,將細胞解離成單個細胞并且以低密度接種。向培養(yǎng)基中以0.8μg/ml加入嘌呤霉素,并且將細胞培養(yǎng)7-10天直到出現(xiàn)單個嘌呤霉素抗性克隆。挑取單克隆并且擴增。然后,使用引物XJ-41/XJ-42(僅針對3’整合連接)通過PCR分析基因組DNA。陽性克隆用于通過FACS的HDR測定。鑒定了一個克隆在基因組中的正確靶位點攜帶(B)cGFP報道子,其可以被供體質(zhì)粒(B)cGFP供體-HDR.1-3與(B)cGFP供體-HDR.A和B二者修復(fù)。
實施例VII:人ESCs(H1)的基因靶向
在mTeSR1培養(yǎng)基中培養(yǎng)人ESCs(H1),并且每3天用1mg/ml膠原酶IV或0.5mM EDTA傳代。對于核染,將細胞用TrypLE解離成單個細胞,并且按照供應(yīng)商的使用說明,用Amaxa核染(Lonza)轉(zhuǎn)染。簡言之,對于每次轉(zhuǎn)染,將5x106個細胞與100μl核染試劑(82μl溶液-1+18μl溶液-B)混合,并且在37℃預(yù)先溫育30分鐘。然后,將細胞混懸液與16μg DNA(6μg Cas9質(zhì)粒,4μg gRNA和/或6μg DNA供體質(zhì)粒)混合,并且按照供應(yīng)商的使用說明(Lonza)用程序A-023電穿孔。將電穿孔的H1人ESCs在補充了20%敲除血清替代品、1mM L-谷氨酰胺、1%非必需氨基酸、0.1mM β-巰基乙醇和4ng/ml堿性成纖維細胞生長因子(bFGF)(Life technologies)的1:1 F-12/DMEM培養(yǎng)基中在絲裂霉素C滅活的MEF飼養(yǎng)細胞上培養(yǎng)。通過小鼠胚胎成纖維細胞調(diào)制培養(yǎng)基。向條件培養(yǎng)基中新鮮加入另外8ng/ml bFGF,用于培養(yǎng)剛轉(zhuǎn)染的人ESC。每天更換培養(yǎng)基,持續(xù)4-5天,并且使用TrypLE(Life technologies)解離細胞,以制備用于FACS分析的單個細胞。使用16μg pEGFP-N1質(zhì)粒,估計的轉(zhuǎn)染效率約為53.5%。
實施例VIII:LO2、HEK293T和HCT116細胞的基因靶向
在轉(zhuǎn)染前5-8小時,將LO2、HEK293T和HCT116細胞以5x105個細胞/孔的密度接種到12孔平板中。使用Lipofectamine 2000(Life Technologies)轉(zhuǎn)染細胞。按照供應(yīng)商的使用說明(Life Technologies),每個孔使用1.6μg質(zhì)粒(0.6μg供體DNA質(zhì)粒,0.6μg Cas9質(zhì)粒和0.4μg sgRNA質(zhì)粒)和4ul Lipofectamine 2000(Life Technologies)。當(dāng)使用多于一種sgRNA時,總量保持相同,并且每種sgRNA質(zhì)粒等于0.4μg平均地除以質(zhì)粒的種類數(shù)。將LO2細胞批量傳代一次,并且在通過FACS分析(BD LSRFortessa細胞分析儀)檢驗之前培養(yǎng)四天;然而,由于來自轉(zhuǎn)染的質(zhì)粒的高背景GFP表達,在通過FACS分析基因靶向效率之前,將HEK293T和HCT116細胞維持一周。通過轉(zhuǎn)染1.6μg pEGFP-N1質(zhì)粒,接著在48小時后進行FACS分析,估測每種細胞系的轉(zhuǎn)染效率。
實施例IX:SMMC-7721、BEL-7402、BEL-7404、H1299和HK2細胞的基因靶向
使用FuGENE HD (Promega)將SMMC-7721、BEL-7402、BEL-7404、H1299和HK2細胞轉(zhuǎn)染。在轉(zhuǎn)染前16小時,將細胞以5x105個細胞/孔的密度接種在12孔平板中。按照供應(yīng)商的使用說明(Promega),每個孔中使用0.6μg供體質(zhì)粒、1.6ug DNA(0.6μg Cas9質(zhì)粒,0.4μg sgRNA質(zhì)粒)和4.5ul FuGENE HD (Promega)進行轉(zhuǎn)染。當(dāng)使用多種sgRNAs時,每種sgRNA質(zhì)粒等于0.4μg平均地除以質(zhì)粒的種類數(shù)。在使用FACS(BD LSRFortessa細胞分析儀)檢驗之前,將轉(zhuǎn)染的細胞批量傳代一次或兩次。通過轉(zhuǎn)染1.6μg pEGFP-N1質(zhì)粒,接著在48小時后進行FACS分析,估測每種細胞系的轉(zhuǎn)染效率。
實施例X:基因組DNA提取和基因組整合的PCR檢測
使用基因組DNA提取試劑盒(Tiangen)按照供應(yīng)商的使用說明從培養(yǎng)的細胞提取基因組DNA。按照供應(yīng)商的使用說明,通常使用200ng基因組DNA進行使用Phusion高保真度DNA聚合酶(New England Biolabs)的PCR反應(yīng)。用于檢測HDR或NHEJ-介導(dǎo)的基因組整合的引物顯示在表3中。
實施例XI:T7E1測定
按照一個方面,進行基因組PCR以擴增基因組中的sgRNAs靶標(biāo)區(qū)域(704bp,使用引物XJ-43/XJ-44)。然后,電泳之后使用凝膠提取試劑盒(Tiangen)純化PCR產(chǎn)物。將純化的基因組DNA樣品進行T7內(nèi)切核酸酶I處理。使用熱循環(huán)儀將300ng純化的PCR產(chǎn)物在20μl NE緩沖液2(NEB)中變性并退火。然后將雜交的PCR產(chǎn)物用T7內(nèi)切核酸酶1(NEB,M0302L)在37℃消化60分鐘,并且進行2%瓊脂糖凝膠電泳。使用ImageJ定量T7E1切割效率。所有的PCR引物序列列在表3中。
實施例XII:TA-連接測序
按照一個方面,將由提取的基因組DNA擴增的PCR片段測序。用于同源臂擴增和整合檢測的引物(XJ-45-XJ-54)列在表3中。將基因組PCR片段與dATP和Taq DNA聚合酶(Dream taq,TAKARA)一起溫育,以在末端添加A。然后,使用MEGA快旋(quick-spin)總片段DNA純化試劑盒(iNtRON)純化這些產(chǎn)物,并且按照供應(yīng)商的使用說明連接到pGEM T easy載體(Promega)中。然后,使用標(biāo)準(zhǔn)的M13-正向和M13-反向引物(表3)通過BGI對陽性克隆進行測序。
實施例XIII:熒光-激活的細胞分選分析
將熒光激活的細胞分選(FACS)分析儀(BD LSRFortessa細胞分析儀)設(shè)置單個488nm氬離子激光器(200mW)。將該激光器用于通過細胞熒光蛋白(copGFP或eGFP)的激發(fā)或細胞內(nèi)的顆粒性誘導(dǎo)光散射。通過顯微鏡目鏡收集來自細胞的SSC(側(cè)向散射收集器)光檢測,通過纖維光導(dǎo)傳遞到光電倍增管(PMT′s)陣列,并且按照制造商推薦的默認設(shè)置,將FSC(Forward Scatter Collector,正向散射收集器)構(gòu)建光電二極管。
關(guān)于FACS樣品得到的數(shù)據(jù)包括一些不同的繪圖窗口(plot windows);其包括關(guān)于FSC-A vs.SSC-A、FSC-A vs.FITC-A(GFP)、SSC-A vs.FITC-A(GFP)的點圖,和關(guān)于特定通道的SSC-A、FSC-A與FITC-A(GFP)的柱狀圖(寬×高)(“A”是計算的面積;“FS”是正向散射;“SS”是側(cè)向散射)。在每份樣品的記錄過程中,對關(guān)于FSC-A vs.SSC-A的圖和/或FITC-A(GFP)柱狀圖設(shè)置門控為103-104(對數(shù)級別),以監(jiān)視并觀察GFP表達水平和效率。在關(guān)于FITC-A(GFP)對數(shù)級別的門控內(nèi)記錄的事件提供GFP表達水平的良好指示,并且計數(shù)表示GFP-陽性細胞的數(shù)量。在門控區(qū)域內(nèi)GFP-陽性細胞占總計數(shù)的比例定義為靶向效率。
實施例XIV:產(chǎn)生LIG4過表達構(gòu)建體
通過RT-PCR從由野生型LO2細胞提取的RNA擴增人LIG4 cDNA,并且克隆到pCAG-ires-Hyg載體的BglII和XhoI位點[9]。所用的引物在表3中列為XJ-70和XJ-71。
實施例XV:產(chǎn)生LIG4無效LO2細胞
將野生型LO2細胞用Cas9與組合的sgLIG4-i-iv共轉(zhuǎn)染兩次。將轉(zhuǎn)染的細胞解離成單個細胞,并且以低密度(2000個細胞/10cm培養(yǎng)皿)接種用于集落擴增。然后,將單個克隆分離并通過基因組PCR和蛋白質(zhì)印跡分析。所用的引物在表3中顯示為XJ-72至XJ-76。
實施例XVI:LO2的基因靶向
在轉(zhuǎn)染前5-8小時,將LO2細胞以5x105個細胞/孔的密度接種在12孔平板中。細胞使用Lipofectamine 2000(Life Technologies)進行轉(zhuǎn)染。每個孔中使用1.6μg質(zhì)粒(0.6μg供體DNA質(zhì)粒,0.6μg Cas9質(zhì)粒和0.4μg sgRNA質(zhì)粒),并且按照供應(yīng)商的使用說明(Life Technologies)使用4ul Lipofectamine 2000(Life Technologies)。當(dāng)使用多于一種的sgRNA時,總量保持相同,并且每種sgRNA質(zhì)粒等于0.4μg平均地除以質(zhì)粒的種類數(shù)。在FACS分析(BD LSRFortessa細胞分析儀)之前,將LO2細胞批量傳代一次,并且培養(yǎng)四天;然而,由于來自轉(zhuǎn)染的質(zhì)粒的高背景GFP表達。通過轉(zhuǎn)染1.6μg pEGFP-N1質(zhì)粒,接著在48小時后進行FACS分析,估測每種細胞系中的轉(zhuǎn)染效率。
實施例XVII:LIG4挽救測定
為了進行LIG4挽救測定,在每個孔中組合另外0.6μg LIG4 cDNA過表達質(zhì)粒與0.6μg供體、0.6μg Cas9、0.4μg sgRNA,并且按照供應(yīng)商的使用說明(Life Technologies)組合5.5μl Lipofectamine 2000(Life Technologies)進行轉(zhuǎn)染。在通過FACS分析(BD LSRFortessa細胞分析儀)檢驗之前,將LO2細胞批量傳代一次并培養(yǎng)四天。
實施例XVIII:蛋白質(zhì)印跡
將細胞用胰蛋白酶處理,用PBS清洗,并且在冰上在包含50mM Tris、0.5%NP40、1mM EDTA、1mM DTT、10%甘油、400mM氯化鈉和蛋白酶抑制劑混合物(Roche)的緩沖液中裂解20分鐘,然后在4℃離心15分鐘。通過SDS/PAGE分辨每種樣品的10μg蛋白,然后轉(zhuǎn)移到聚偏氟乙烯膜(Bio-Rad)上。將膜在室溫用在PBST緩沖液中的5%脫脂奶粉封閉1小時,然后用抗-DNA連接酶IV(Abcam)或抗-β-肌動蛋白(Santa Cruz)抗體溫育過夜。將膜用PBST緩沖液洗滌三次,并且用HRP-綴合的山羊抗-小鼠(Life-Technologies)或山羊抗-兔(Santa Cruz)抗體溫育。使用Amersham ECL選擇性蛋白質(zhì)印跡檢測試劑盒(GE Health Care Life Sciences)檢測信號并且曝光到Super RX-N膠片(Fuji)上。
實施例XIX:免疫熒光
如之前所述進行免疫熒光[9]?;旧希瑢⒓毎迷赑BS中的4%的低聚甲醛(Sigma)固定。將細胞膜用1%Triton X-100/PBS滲透化處理,并且用在0.1%吐溫-20/PBS中的8%FBS封閉非特異性的結(jié)合。然后,將樣品用稀釋在封閉液中的一級抗體在4℃溫育過夜,然后用Alexafluor 546-綴合的二級抗體在室溫溫育2-4小時。通過1∶5000的Hoechst染料(Life Technologies)復(fù)染細胞核。所用的一級抗體是OCT4(1∶100,Santa Cruz)、TRA-1-60(1∶100,Santa Cruz)。
本申請中引用的所有專利、專利申請和其他出版物,包括GenBank登記號,通過引用完全地結(jié)合用于所有的目的。
參考文獻
1.Vasquez KM,Marburger K,Intody Z&Wilson JH.Manipulating the mammalian genome by homologous recombination(通過同源重組操作哺乳動物的基因組).Proc Natl Acad Sci USA 98,8403-10(2001).
2.Koller BH,Hagemann LJ,Doetschman T,Hagaman JR,Huang S,Williams PJ,F(xiàn)irst NL,Maeda N&Smithies O.Germ-line transmission of a planned alteration made in a hypoxanthine phosphoribosyltransferase gene by homologous recombination in embryonic stem cells(在整合干細胞中通過同源重組在次黃嘌呤磷酸核糖轉(zhuǎn)移酶基因中進行計劃的改變的種系傳遞).Proc Natl Acad Sci USA 86,8927-31(1989).
3.Capecchi MR.Gene targeting in mice:functional analysis of the mammalian genome for the twenty-first century(小鼠中的基因靶向:二十一世紀(jì)的哺乳動物基因組功能分析).Nat Rev Genet 6,507-12(2005).
4.Thomson JA,Itskovitz-Eldor J,Shapiro SS,Waknitz MA,Swiergiel JJ,Marshall VS&Jones JM.Embryonic stem cell lines derived from human blastocysts(來源于人胚泡的胚胎干細胞系).Science 282,1145-7(1998).
5.Takahashi K,Tanabe K,Ohnuki M,Narita M,Ichisaka T,Tomoda K&Yamanaka S.Induction of pluripotent stem cells from adult human fibroblasts by defined factors(通過限定的因子從成人成纖維細胞誘導(dǎo)多能干細胞).Cell 131,861-72(2007).
6.Sterneckert JL,Reinhardt P&Scholer HR.Investigating human disease using stem cell models(利用干細胞模型研究人類疾病).Nat Rev Genet 15,625-39(2014).
7.Nakayama M.Homologous recombination in human iPS and ES cells for use in gene correction therapy(用于基因修正療法的人iPS和ES細胞中的同源重組).Drug Discov Today 15,198-202(2010).
8.Musunuru K.Genome editing of human pluripotent stem cells to generate human cellular disease models(人多能干細胞的基因組編輯以產(chǎn)生人細胞疾病模型).Dis Model Mech 6,896-904(2013).
9.Jiang W,Bikard D,Cox D,Zhang F&Marraffini LA.RNA-guided editing of bacterial genomes using CRISPR-Cas systems(使用CRISPR-Cas細胞的RNA-導(dǎo)向的細菌基因組編輯).Nat Biotech 31,233-239(2013).
10.Hsu PD,Lander ES&Zhang F.Development and applicatiohs of CRISPR-Cas9 for genome engineering(CRISPR-Cas9用于基因組改造的研發(fā)和應(yīng)用).Cell 157,1262-78(2014).
11.Kearns NA,Genga RM,Enuameh MS,Garber M,Wolfe SA&Maehr R.Cas9 effector-mediated regulation of transcription and differentiation in human pluripotent stem cells(人多能干細胞中Cas9效應(yīng)子-介導(dǎo)的轉(zhuǎn)錄和分化的調(diào)節(jié)).Development 141,219-23(2014).
12.Lieber MR.The mechanism of double-strand DNA break repair by the nonhomologous DNA end-joining pathway(通過非同源DNA末端連接途徑的雙鏈DNA斷裂修復(fù)的機制).Annu Rev Biochem 79,181-211(2010).
13.Wang H,Yahg H,Shivalila CS,Dawlaty MM,Cheng AW,Zhang F&Jaenisch R.One-step generation of mice carrying mutatiohs in multiple genes by CRISPR/Cas-mediated genome engineering(通過CRISPR/Cas-介導(dǎo)的基因組改造一步法產(chǎn)生在多種基因中攜帶突變的小鼠).Cell 153,910-8(2013).
14.Heyer WD,Ehmsen KT&Liu J.Regulation of homologous recombination in eukaryotes(真核生物中同源重組的調(diào)節(jié)).Annu Rev Genet 44,113-39(2010).
15.Merkle FT,Neuhausser WM,Santos D,Valen E,Gagnon JA,Maas K,Sandoe J,Schier AF&Eggan K.Efficient CRISPR-Cas9-Mediated Generation of Knockin Human Pluripotent Stem Cells Lacking Undesired Mutations at the Targeted Locus(有效的CRISPR-Cas9-介導(dǎo)的在靶向的基因座缺少不需要的突變的敲入人多能干細胞的產(chǎn)生).Cell Rep 11,875-83(2015).
16.van Rensburg R,Beyer I,Yao XY,Wang H,Denisenko O,Li ZY,Russell DW,Miller DG,Gregory P,Holmes M,Bomsztyk K&Lieber A.Chromatin structure of two genomic sites for targeted transgene integration in induced pluripotent stem cells and hematopoietic stem cells(在誘導(dǎo)的多能干細胞和造血干細胞中用于靶向的轉(zhuǎn)基因整合的兩個基因組位點的染色質(zhì)結(jié)構(gòu)).Gene Ther 20,201-14(2013).
17.Szymczak AL,Workman CJ,Wang Y,Vignali KM,Dilioglou S,Vanin EF&Vignali DA.Correction of multi-gene deficiency in vivo using a single′self-cleaving′2A peptide-based retroviral vector(使用單個‘自我-切割’的基于2A肽的反轉(zhuǎn)錄病毒載體在體內(nèi)修正多基因缺陷).Nat Biotechnol 22,589-94(2004).
18.Casola S.Mouse modelsfor miRNA expression:the ROSA26 locus (小鼠miRNA表達模型:ROSA26基因座).Methods Mol Biol 667,145-63(2010).
19.Woltjen K,Michael IP,Mohseni P,Desai R,Mileikovsky M,Hamalainen R,Cowling R,Wang W,LiuP,Gertsenstein M,Kaji K,Sung HK&Nagy A.piggyBac transposition reprograms fibroblasts to induced pluripotent stem cells(piggyBac易位將成纖維細胞重新編程為誘導(dǎo)的多能干細胞).Nature 458,766-70(2009).
20.Hwang WY,F(xiàn)u Y,Reyon D,Maeder ML,Tsai SQ,Sander JD,Peterson RT,Yeh JR&Joung JK.Efficient genome editing in zebrafish using a CRISPR-Cas system(在斑馬魚中使用CRISPR-Cas系統(tǒng)的有效基因組編輯).Nat Biotechnol 31,227-9(2013).
21.Jiang W,Bikard D,Cox D,Zhang F&Marraffini LA.RNA-guidedediting of bacterial genomes using CRISPR-Cas systems(利用CRISPR-Cas系統(tǒng)的RNA-導(dǎo)向的細菌基因組編輯).Nat Biotechnol 31,233-9(2013).
22.Hu J,Lei Y,Wong W-K,Liu S,Lee K-C,He X,You W,Zhou R,Guo J-T,Chen X,Peng X,Sun H,Huang H,Zhao H&Feng B.Direct activation of human and mouse Oct4 genes using engineered TALE and Cas9 transcription factors(使用改造的TALE和Cas9轉(zhuǎn)錄因子直接激活人和小鼠Oct4基因).Nucleic Acids Research 42,4375-4390(2014).
23.Feng B,Jiang J,Kraus P,Ng JH,Heng JC,Chan YS,Yaw LP,Zhang W,Loh YH,Han J,Vega VB,Cacheux-Rataboul V,Lim B,Lufkin T&Ng HH.Reprogramming of fibroblasts into induced pluripotent stem cells with orphan nuclear receptor Esrrb(使用孤兒核受體Esrrb將成纖維細胞重新編程為誘導(dǎo)的多能干細胞).Nat Cell Biol 11,197-203(2009).
24.Yu C,Liu Y,Ma T,Liu K,Xu S,Zhang Y,Liu H,La Russa M,Xie M,Ding S&Qi LS.Small molecules enhance CRISPR genome editingin pluripotent stem cells(小分子增強多能干細胞中的CRISPR基因組編輯).Cell Stem Cell 16,142-7(2015).
25.Maruyama T,Dougan SK,Truttmann MC,Bilate AM,Ingram JR&Ploegh HL.Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining(通過抑制非同源末端連接使用CRISPR-Cas9提高精確的基因組編輯的效率).Nat Biotechnol 33,538-42(2015).
26.Zhu Z,Verma N,Gonzalez F,Shi ZD&Huangfu D.A CRISPR/Cas-Mediated Selection-free Knockin Strategy in Human Embryonic Stem Cells(在人胚胎干細胞中CRISPR/Cas-介導(dǎo)的無選擇敲入策略).Stem Cell Reports 4,1103-11(2015).
27.Li J,Zhang BB,Ren YG,Gu SY,Xiang YH&Du JL.Intron targeting-mediated and endogenous gene integrity-maintaining knockin in zebrafish using the CRISPR/Cas9 system(在斑馬魚中使用CRISPR/Cas9系統(tǒng)的內(nèi)含子靶向-介導(dǎo)的和保持內(nèi)源性基因完整性的敲入).Cell Res 25,634-7(2015).
28.Hisano Y,Sakuma T,Nakade S,Ohga R,Ota S,Okamoto H,Yamamoto T&Kawahara A.Precise in-frame integration of exogenous DNA mediated by CRISPR/Cas9 system in zebrafish(在斑馬魚中通過CRISPR/Cas9系統(tǒng)介導(dǎo)的內(nèi)源性DNA的符合閱讀框的整合).Sci Rep 5,8841(2015).
29.MALI PG,Church GM&Yang L.RNA-Guided Human Genome Engineering(RNA-導(dǎo)向的人基因組改造).(Google Patents,2014).
30.Wu F.Crispr/cas systems for genomic modification and gene modulation(用于基因組修飾和基因調(diào)整的Crispr/cas系統(tǒng)).(Google Patents,2014).
31.Zhang F&RAN F.Delivery,engineering and optimization of systems,methods and compositions for sequence manipulation and therapeutic applications(用于序列操作和治療性應(yīng)用的系統(tǒng)、方法和組合物的遞送、改造和優(yōu)化).(Google Patents,2014).
32.Cong L&Zhang F.CRISPR-Cas component systems,methods andcompositions for sequence manipulation(用于序列操作的CRISPR-Cas成分系統(tǒng)、方法和組合物).(Google Patents,2014).
33.Chen F,Davis GD,KANG Q&KNIGHT SW.Crispr-based genome modification and regulation(基于Crispr的基因組修飾和調(diào)節(jié)).(Google Patents,2014).
34.Zhang F.Crispr-cas component systems,methods and compositions for sequence manipulation(用于序列操作的Crispr-cas成分系統(tǒng)、方法和組合物).(Google Patents,2015).
35.Zetsche,B.,等人,Cpfl Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System(Cpf1是2類CRISPR-Cas系統(tǒng)的單RNA-導(dǎo)向的內(nèi)切核酸酶).Cell.163(3):p.759-771.
36.Liu,M.,等人,Genomic discovery of potent chromatin insulators for human gene therapy(用于人基因治療的有效的染色質(zhì)隔離子的基因組發(fā)現(xiàn)).Nat Biotech,2015.33(2):p.198-203.
序列表
<110> 香港中文大學(xué)
<120> 用于靶向基因操作的新方法和系統(tǒng)
<130> 080015-1021507(017420US)
<150> US 62/256,514
<151> 2015-11-17
<150> US 62/288,974
<151> 2016-01-29
<160> 143
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 1
gagagagacc ctcactgctg 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 2
agccccagca agagcacaag 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 3
cttcctcttg tgctcttgct 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 4
gccatgtaga ccccttgaag 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 5
gagatcgagt gccgcatcac 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 6
aagattcatc accgctttga 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 7
ttaaactaca gaacacccac 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 8
tctggcagac tcattgcagc 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 9
tagggtagaa ttgttacagc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 10
aatatgagat gcgttgttac 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 11
gtaacaacgc atctcatatt 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 12
ctgcaggctg gggcggatca 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 13
gaagtgtgta acactgcttc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 14
cactgcatct ttcgggacct 20
<210> 15
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 15
ggagaatgag ctgcagg 17
<210> 16
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 16
gctctttccc gcgctct 17
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 17
caaaaagtca ctgcatcttt 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 18
gccttctcgc cccctccagg 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 19
ggtggtggag gtgatgggcc 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 20
ggtgaatgac atttgtgggt 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 21
gtgcctgccc ttctaggaat 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 22
ggcccacaaa tcacaggcat 20
<210> 23
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 23
gccgaccgac tgaggcc 17
<210> 24
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 24
gctgccgggc gcggagc 17
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 25
gttaattcag tcagtgacta 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 26
gagagagacc ctcactgctg 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 27
gagagagacc ctcactgctg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 28
gagagagacc ctcactgctg 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 29
gagagagacc ctcactgctg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 30
gagagaggcc ctcactgctg 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 31
gagagaggcc ctcactgctg 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 32
gagagagacc ctcaatgctg 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 33
gagagaggcc ctcactgctg 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 34
aagagaggcc ctcactgctg 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 35
gagagaggct ctcactgctg 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 36
tagagagagc ctcactgctg 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 37
gagagcggcc ctcactgctg 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 38
cagagagacc ctcagtgctg 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 39
gagagaggcc ttcactgctg 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 40
gagagaggcc ttcactgctg 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 41
gagagaggcc ctcactcctg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 42
agccccagca agagcacaag 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 43
agccccagca agagcacaag 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 44
agccccagcg agagcacaag 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 45
agccccagta agagcacaag 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 46
agccccagca agagcacaac 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 47
agccccagca agagcacgag 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 48
agccccagca agagcacgag 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 49
agccccagca agagcacgag 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 50
agccccagtg agagcacaag 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 51
agccccagtg agagcacaag 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 52
agccccagtc agagcacaag 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 53
agcccaagca acagcacaag 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 54
agccccagga agagcacagg 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 55
agccccagcg agagcacgag 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 56
agccccagcg agagcaccag 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 57
gttcctcttg tgctcttgct 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 58
cttcctcttg tgctctcgct 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 59
cttcctctcg tgctcttgct 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 60
cttcctctcg tgctcttgct 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 61
tttcctctcg tgctcttgct 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 62
cttcctcttg tgctcttact 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 63
cttcctcttg tgctgttgct 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 64
gccatgtaga ccccttgaag 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 65
tccatgtaga ccccttgaag 20
<210> 66
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 66
agagacaatt gcgcacacat tccacatcca c 31
<210> 67
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 67
agagaacgcg tggcaccggg cttgcg 26
<210> 68
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 68
agagaacgcg tgccactaac ttctccctgt tgaaacaagc aggggatgtc gaagagaatc 60
ccgggccaat ggagagcgac gagagcg 87
<210> 69
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 69
agagaggatc ctcaatcaat cacgatgcgg gtgttggtgt ag 42
<210> 70
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 70
agagaggatc ctgaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 60
tgattgattg atgcacgtga gcttcagcta cc 92
<210> 71
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 71
agagaagatc tccatagagc ccaccgcatc 30
<210> 72
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 72
agagagtcga ccggaactct gccctctaac g 31
<210> 73
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 73
agagacaatt gcccagaacc agagccacat t 31
<210> 74
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 74
agagagttaa ccccccacct cctgttaggc aga 33
<210> 75
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 75
agagagaatt cagagcagag ccaggaaccc 30
<210> 76
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 76
agagagtcga cgtggagccg ttctgtgaga c 31
<210> 77
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 77
agagacaatt gaactcccag aaaggtattg caac 34
<210> 78
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 78
agagacttaa gttctgggca ggcttaaagg c 31
<210> 79
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 79
agagagaatt cagcttggca aaatcacatt tagacc 36
<210> 80
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 80
accgagctgc aagaactctt cc 22
<210> 81
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 81
cctaagcttg gctggacgta aactc 25
<210> 82
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 82
ccgcaacctc cccttctacg ag 22
<210> 83
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 83
ctggcaacta gaaggcacag tcg 23
<210> 84
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 84
agagaacgcg tgccactaac ttctccctgt tgaaacaagc aggggatgtc gaagagaatc 60
ccgggccaat ggtgagcaag ggcgag 86
<210> 85
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 85
agagaggatc cttacttgta cagctcgtcc atgc 34
<210> 86
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 86
agagaggatc ccaccctgaa cggcgtgga 29
<210> 87
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 87
cccgcaacct ccccttctac gag 23
<210> 88
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 88
ctgcaagaac tcttcctcac g 21
<210> 89
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 89
agagaagatc tttagcgaga tccggtggag c 31
<210> 90
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 90
agagacaatt ggacacgctc ccctgacttg c 31
<210> 91
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 91
agagaacgcg tctccttgga ggccatgtgg 30
<210> 92
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 92
agagagttaa cccctgccac actcagtccc c 31
<210> 93
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 93
agagactcga gctggggtta caggcgtgcg 30
<210> 94
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 94
agagagaatt ccaattgacg cgtgctcctc tccctccccc c 41
<210> 95
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 95
agagaagatc tacttacctg ttacttgtac agctcgtcca tgccg 45
<210> 96
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 96
agagaggatc cgacacgctc ccctgacttg c 31
<210> 97
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 97
agagacaatt gttcctcttg tgctcttgct gg 32
<210> 98
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 98
gatccgagat cgagtgccgc atcaccggc 29
<210> 99
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 99
aattgccggt gatgcggcac tcgatctcg 29
<210> 100
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 100
cgtgggcttg tactcggtca tgg 23
<210> 101
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 101
gacctgcatc catctagatc tctcg 25
<210> 102
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 102
gataccccga agagtgagtt tgcc 24
<210> 103
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 103
gttctaattc catcagaagc tggtcg 26
<210> 104
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 104
attgttttgc caagttctaa ttccatc 27
<210> 105
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 105
caagtcaagc aaaattatag gtcctg 26
<210> 106
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 106
gaaggtggtg aagcaggcg 19
<210> 107
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 107
gagcgggaag caaatggtt 19
<210> 108
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 108
ggagtccact ggcgtcttca 20
<210> 109
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 109
gcccaccagc tcgaactcc 19
<210> 110
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 110
gcggctacta cagcttcgtg gtg 23
<210> 111
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 111
gatggagtct catactctgt tgcct 25
<210> 112
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 112
gaaggtggtg aagcaggcg 19
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 113
cctcacattg ccaaaagacg 20
<210> 114
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 114
cgccagggtt ttcccagtca cgac 24
<210> 115
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 115
actcccactg tcctttccta at 22
<210> 116
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 116
gagcgggaag caaatggtt 19
<210> 117
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 117
caggaaacag ctatgac 17
<210> 118
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 118
ttgaggctgc tgggtctc 18
<210> 119
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 119
gctctgaaca ggtaacagct aca 23
<210> 120
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 120
agagacaatt gttactcctt ggaggccatg tgg 33
<210> 121
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 121
agagaggatc cacattaagg agaagctgtg ctacgtc 37
<210> 122
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 122
agagacaatt gacaacaatg tgcaatcaaa gtcctcg 37
<210> 123
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 123
agagagtcga ctctaaggag aatggcccag tcctc 35
<210> 124
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 124
agagagttaa ccagacctca gcccatagct aaccag 36
<210> 125
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 125
agagacaatt gcctttagag gacgggtgtt c 31
<210> 126
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 126
agagaacgcg tcacgtcagg atagttgcag taat 34
<210> 127
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 127
agagagaatt cgtttttgtt gttgctgttg ttg 33
<210> 128
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 128
agagactcga gccatctttt actcacaacc ctg 33
<210> 129
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 129
agagacaatt gggtgctttt cttgctgctg g 31
<210> 130
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 130
agagaacgcg tcatggaagg tggcgacaca g 31
<210> 131
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 131
agagagttaa ctggcagtct caggttaaga agga 34
<210> 132
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 132
agagagaatt cataatgccg ctttgacact cc 32
<210> 133
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 133
agagaggatc catggctgcc tcacaaactt cac 33
<210> 134
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 134
agagactcga ggcaatgagt ctgccagatc agag 34
<210> 135
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 135
cttcaaatta gggttggagc aaaacag 27
<210> 136
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 136
atcgacaggg ttttattgtt acatttgg 28
<210> 137
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 137
tcctttctgt aaacatcttg gcttcaacac 30
<210> 138
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 138
ctcccctcag gacattttac gtttg 25
<210> 139
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 139
acacatagta tcgcatggat caaattccg 29
<210> 140
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 140
tcattttgga cctgacttgc catc 24
<210> 141
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 141
catccctgca tctactggtg ctac 24
<210> 142
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 142
ggaaaaacct gccaaatatg atgacacc 28
<210> 143
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸序列.
<400> 143
tcagcccctt gttgaatacg cttg 24