嗜熱鏈球菌CRISPR-Cas9系統(tǒng)識別的人CCR5基因的靶序列和sgRNA及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于基因工程領(lǐng)域,涉及CRISPR_Cas9系統(tǒng)識別的靶序列和sgRNA及它們 的相關(guān)應(yīng)用。
【背景技術(shù)】
[0002] 獲得性免疫缺陷綜合征(acquired immunodeficiency syndrome,AIDS)又稱艾滋 病,是一種危害性極大的傳染病。自發(fā)現(xiàn)的三十多年來,AIDS已累計導(dǎo)致兩千余萬人死亡, 一直是一個巨大的公眾健康難題,影響著全球3, 530萬人的生活。AIDS是由人類免疫缺陷 病毒(Human Immunodeficiency Virus,HIV)感染引起的,HIV是一種感染人類免疫系統(tǒng)細(xì) 胞的慢病毒,屬反轉(zhuǎn)錄病毒的一種,又稱為艾滋病毒。HIV可分為HIV-I和HIV-2兩種亞型, HIV-I的致病力強,是引起艾滋病的主要病原體。
[0003] ⑶4+T細(xì)胞是HIV-I病毒感染過程的首要靶點,隨后研究又發(fā)現(xiàn)僅有⑶4分子并不 能介導(dǎo)HIV-I病毒的侵入,同時還需要一種或幾種輔助受體(coreceptor)。1996年證實, 趨化因子受體CXCR4和CCR5是HIV-I病毒感染的輔助受體。其中,趨化因子CCR5,作為G 蛋白親聯(lián)受體(G-protein coupled receptor,GPCR)超家族的細(xì)胞膜蛋白,是HIV-I入侵 機體細(xì)胞的主要輔助受體之一。CCR5主要在靜止期記憶性T淋巴細(xì)胞、單核細(xì)胞和未成熟 的樹突狀細(xì)胞的膜上表達(dá),是HIV-I入侵人體時重要的輔助受體,它作為HIV-I入侵機體細(xì) 胞的主要輔助受體之一,在治療艾滋病研究中是一個重要的藥物靶點。
[0004] 目前對艾滋病的治療手段主要是控制HIV-I病毒的感染以及阻礙AIDS的發(fā)展,稱 為高效抗逆轉(zhuǎn)錄病毒治療法(highly active antiretroviral therapy,HAART),包括一系 列抑制病毒各個繁殖階段的化合物。HAART是能很大程度上減少細(xì)胞內(nèi)病毒的繁殖和血漿 病毒血癥的發(fā)生,但對于新的宿主細(xì)胞不被HIV-I感染沒有作用。為了從源頭上預(yù)防健康 的細(xì)胞被HIV-I感染,新的治療方案需要徹底地破壞病毒的入侵途徑,因而以CCR5為靶點 的HIV-I受體拮抗劑越來越受關(guān)注,主要有趨化因子衍生物、非肽類小分子化合物、單克隆 抗體、肽類化合物等。經(jīng)典的CCR5拮抗劑抑制R5嗜性的HIV-I感染細(xì)胞的機制是:它們 與CCR5結(jié)合后,使CCR5構(gòu)象改變,導(dǎo)致CCR5的內(nèi)源化作用(internalization)或者不利 于HIV-I的識別,阻斷HIV-I與細(xì)胞膜蛋白的結(jié)合,導(dǎo)致HIV-I與CCR5在細(xì)胞表面的結(jié)合 減少,從而起到抗感染的作用。但不幸的是長期使用一種抑制劑,最終會使HIV-I產(chǎn)生耐 藥性,隨著耐藥性的不斷出現(xiàn),使得現(xiàn)有的抗HIV-I藥物難以達(dá)到理想的治療效果。同時, CCR5拮抗劑還存在如下缺點,例如,天然趨化因子的半衰期短和存在潛在的誘導(dǎo)炎癥應(yīng)答 作用;非肽類小分子化合物不能下調(diào)受體表達(dá);肽類化合物不穩(wěn)定、易降解;單克隆抗體存 在人體對藥物的不適應(yīng)性、潛在的過敏反應(yīng)等缺點。
[0005] 近年來,隨著革巴向基因編輯技術(shù)的一步步突破,從ZFN(zinc finger nuclease) 到后來的 TALEN(transcription activator-like effector nuclease)以及最新的 CRISPR-Cas9技術(shù),為艾滋病的徹底治愈提供了新的希望。研究表明帶有CCR5編碼基因32 個核苷酸缺失的實驗者接觸HIV但未檢測到HIV感染,表明了 CCR5影響HIV病毒入侵細(xì)胞, 說明CCR5基因是一個可靠、高效和安全的治療HIV的靶點,因此能夠?qū)崿F(xiàn)CCR5在基因組層 面上的敲除也是可靠、高效和安全的治療HIV的方法。2008年,Sangamo成功地利用ZFNs 在CD4+T細(xì)胞上實現(xiàn)CCR5的敲除,然而ZFN靶向敲除CCR5的效率較低,人們期待找到更高 效的CCR5的敲除策略。
[0006] 規(guī)律成族間隔短回文重復(fù)系統(tǒng)(clustered regularly interspaced short palindromic repeat,CRISPR-associated,CRISPR_Cas9)是一種具有核酸內(nèi)切酶活性 的復(fù)合體,是細(xì)菌和古細(xì)菌在進化過程中形成的一種免疫防御體系,用以對抗外來病毒 和外源DNA入侵。CRI SPR-cas9系統(tǒng)通過整合外源DNA片段到CRISPR中,利用CRISPR RNA (CRISPR-derived RNA,crRNA)和反式作用 RNA (trans-activating RNA,tracrRNA)特 異性地識別靶向序列,并對序列靶位點進行切割。在沒有模板的條件下,發(fā)生非同源重組末 端連接(Non-homologous end joining,NHEJ),NHEJ修復(fù)的過程中往往會產(chǎn)生DNA的插入 或缺失(indel),造成移碼突變,導(dǎo)致基因敲除。或者是在有同源模板的情況下,可通過另一 條同源重組(homologous recombination,HR)的修復(fù)途徑進行修復(fù),可實現(xiàn)對革El向基因的 精確編輯,如引入特異突變或定點轉(zhuǎn)基因?,F(xiàn)在已經(jīng)把兩種小RNA (crRNA和tracrRNA)融 合成一條RNA鏈,簡稱sgRNA(single guide RNA),因此,能夠設(shè)計、制備出精確性和特異性 靶向目標(biāo)基因的sgRNA成為CRISPR-Cas9基因敲除的關(guān)鍵。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種CRISPR_Cas9系統(tǒng)識別的靶序列 以及精確特異地靶向人CCR5基因的sgRNA和它們的有關(guān)應(yīng)用。
[0008] 因此,為了實現(xiàn)上述目的,第一方面,本發(fā)明提供了一種CRISPR-Cas9系統(tǒng)識別的 靶序列,所述靶序列如SEQ ID NO: 1-30中任意一個的第n-30位所示且η = 1-12。
[0009] 第二方面,本發(fā)明提供了一種sgRNA,該sgRNA的序列為:5'_識別序列-招募Cas9 蛋白的序列-3',其中,所述識別序列對應(yīng)的DNA序列如SEQ ID N0:l-30中任意一個的第 n-30位所示且η = 1-12。
[0010] 第三方面,本發(fā)明提供了編碼第二方面所述的sgRNA的DNA分子。
[0011] 第四方面,本發(fā)明提供了一種CRISPR_Cas9系統(tǒng),該CRISPR_Cas9系統(tǒng)包括Cas9 蛋白和sgRNA、和/或包括攜帶有Cas9蛋白的編碼序列和sgRNA的編碼序列的載體,所述 Cas9蛋白的編碼序列和sgRNA的編碼序列位于相同或不同的載體上,其中,所述sgRNA為第 二方面所述的sgRNA且所述Cas9蛋白源自嗜熱鏈球菌(Streptococcus thermophilus)。
[0012] 第五方面,本發(fā)明提供了一種編輯CCR5基因的方法,該方法包括:將第四方面所 述的CRISPR-Cas9系統(tǒng)導(dǎo)入表達(dá)CCR5的細(xì)胞中。
[0013] 第六方面,本發(fā)明提供了第四方面所述的CRISPR_Cas9系統(tǒng)在制備用于預(yù)防和/ 或治療HIV感染的藥物中的應(yīng)用。
[0014] 第七方面,本發(fā)明提供了一種預(yù)防和/或治療HIV感染的方法,該方法包括將第四 方面所述的CRISPR-Cas9系統(tǒng)導(dǎo)入表達(dá)CCR5的細(xì)胞中。
[0015] 本發(fā)明可以實現(xiàn)人CCR5基因的編輯,進而改變CCR5的序列,尤其是和HIV表面蛋 白結(jié)合的序列,導(dǎo)致細(xì)胞無法被HIV感染,從而實現(xiàn)預(yù)防和/或治療艾滋病的目的。
[0016] 本發(fā)明的其它特征和優(yōu)點將在隨后的【具體實施方式】部分予以詳細(xì)說明。
【附圖說明】
[0017] 附圖是用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與下面的具 體實施方式一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0018] 圖1為表達(dá)SgRNA的重組質(zhì)粒的結(jié)構(gòu)示意圖;
[0019] 圖2為表達(dá)StCas9的重組質(zhì)粒的結(jié)構(gòu)示意圖;
[0020] 圖3為同時表達(dá)SgRNA和StCas9的重組質(zhì)粒的結(jié)構(gòu)示意圖;
[0021] 圖4為根據(jù)本發(fā)明的一種實施方式對HEK293T細(xì)胞的CCR5基因進行敲除后的測 序結(jié)果。
【具體實施方式】
[0022] 以下對本發(fā)明的【具體實施方式】進行詳細(xì)說明。應(yīng)當(dāng)理解的是,此處所描述的具體 實施方式僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0023] 在本發(fā)明中,在未做相反說明的情況下,使用的術(shù)語"基因敲除"或"基因編輯"是 指對生物的基因組DNA進行刪除、插入或者替換,從而達(dá)到對目的序列修改的目的;本發(fā) 明涉及的sgRNA和CRISPR_Cas9系統(tǒng)均為人工改造而成的(engineering,non-naturally occurring)〇
[0024] 在第一方面中,本發(fā)明提供的CRISPR-Cas9系統(tǒng)識別的靶序列如SEQ ID NO: 1-30 中任意一個的第 n-30 位所示且 n = 1-12(整數(shù),1、2、3、4、5、6、7、8、9、10、11 或 12)。
[0025] 在第二方面中,本發(fā)明提供的sgRNA的序列為:5' -識別序列-招募Cas9蛋白的 序列-3',其特征在于,所述識別序列對應(yīng)的DNA序列如SEQ ID NO: 1-30中任意一個的第 n-30 位所示且 n = 1-12(整數(shù),1、2、3、4、5、6、7、8、9、10、11 或 12)。其中,表示多核苷 酸元件(識別序列和招募Cas9蛋白的序列)以有功能的方式連接,互不干涉表達(dá)或性能, 被連接的多核苷酸序列是連續(xù)的。
[0026] 所述招募Cas9蛋白的序列為能夠招募Cas9蛋白的序列,即結(jié)合Cas9蛋白并使其 活化而能夠切割目標(biāo)基因的序列,通常具有特定的二級結(jié)構(gòu)(如莖環(huán)結(jié)構(gòu))。優(yōu)選地,所述 招募Cas9蛋白的序列如SEQ ID NO :31-34所示。
[0027] 所述Cas9蛋白可以來源于嗜熱鏈球菌(S. thermophilus),如在UniProt中的 Entry Name為CAS9_STRTR的蛋白。Cas9蛋白的氨基酸序列也可參見NCBI的EWM58113. 1、 WP_011681470. 1、sp|G3ECRl. 2|CAS9_STRTR、WP_014727651. 1、WP_024703962. 1、 WP_014608595. UETE40675. UETE40173. I 或 EWM55849. I 等。例如,Cas9 蛋白的氨基酸序 列如SEQ ID NO:42所示。
[0028] 根據(jù)本發(fā)明的一種優(yōu)選實施方式,所述識別序列對應(yīng)的DNA序列如SEQ ID NO: 22 所示且招募Cas9蛋白的序列如SEQ ID NO:33所示。該優(yōu)選的sgRNA能夠更有效地編輯 (敲除)CCR5基因。
[0029] 在第三方面中,本發(fā)明提供了編碼第二方面所述的sgRNA的DNA分子。
[0030] 在第四方面中,本發(fā)明提供的CRISPR_Cas9系統(tǒng)包括Cas9蛋白和sgRNA、和/或 包括攜帶有Cas9蛋白的編碼序列和sgRNA的編碼序列的載體,所述Cas9蛋白的編碼序列 和sgRNA的編碼序列位于相同或不同的載體上,所述sgRNA為第二方面所述的sgRNA且所 述Cas9蛋白源自嗜熱鏈球菌。
[0031] 所述載體為能夠傳遞所攜帶的核酸(編碼序列)的核酸分子。所述載體可以為質(zhì) 粒、λ噬菌體、柯氏質(zhì)粒、YAC載體等。在特定的實施方式中,所述載體為真核表達(dá)載體,如 pcDNA3〇
[0032] 攜帶有sgRNA的編碼序列的載體的結(jié)構(gòu)可以如圖1所示。攜帶有Cas9蛋白的編 碼序列的載體的結(jié)構(gòu)可以如圖2所示。同時攜帶有Cas9蛋白的編碼序列和sgRNA的編碼 序列的載體的結(jié)構(gòu)可以如圖3所示。
[0033] 如上所述,所述Cas9蛋白的編碼序列來源于嗜熱鏈球菌,且可以為經(jīng)密碼子優(yōu)化 后適于在真核細(xì)胞中表達(dá)的序列(如SEQ ID NO:38第3815-8107位所示的序列)。
[0034] 根據(jù)本發(fā)明的優(yōu)選實施方式,所述sgRNA為"識別序列對應(yīng)的DNA序列如SEQ ID NO:22所示且招募Cas9蛋白的序列如SEQ ID NO:33所示"的sgRNA。
[0035] 在第五方面中,本發(fā)明提供的編輯CCR5基因的方法包括:將第四方面所述的 CRISPR-Cas9系統(tǒng)導(dǎo)入表達(dá)C