一種新型線粒體基因組編輯工具的制作方法
【技術領域】
[0001] 本發(fā)明屬于基因組工程領域,具體地說,涉及一種新型線粒體基因組編輯工具。
【背景技術】
[0002] 隨著測序技術的不斷發(fā)展,我們從中獲得了越來越多的遺傳信息。但如此龐大的 信息又該如何應用?研究人員試圖通過對特定靶向基因的破壞或敲除,來研究它們的相 關功能,而實現這一目的的技術稱為基因組編輯技術。此外,該技術還可應用于疾病的治 療和預防。目前,常用的基因組編輯技術主要包括以下三種:鋅指蛋白技術(Zinc Finger Proteins,ZFPs)、轉錄激活因子樣效應因子(Transcription activator-like effectors, TALEs)技術、CRISPR(clustered regularly interspaced short palindromic repeats) 技術。它們的大致原理都是通過對革巴向DNA造成雙鏈斷裂(Double strand breaks,DSBs), 進而引發(fā)細胞內固有的非同源末端連接(non-homologous end joining,NHEJ)或同源重組 (homologous recombination,HR)兩種修復機制對斷裂處進行修復。其中,易出錯的NHEJ 可以在DSBs處引入插入或缺失突變,這種突變不可人為控制。另一種修復機制HR,通過提 供的單鏈或雙鏈寡核苷酸模板對DSBs處進行精確修復,可人為控制。三種技術在作用機制 與具體操作方式上又有所不同:
[0003] 鋅指核酸酶(zinc-finger nuclease, ZFN)與轉錄激活子樣效應因子核酸酶 (tran-scription activator-like effector nulease,TALEN)這兩種人工核酸內切酶,都 是通過DNA識別域與非特異性核酸內切酶FokI融合而成。其中,ZFN的鋅指模塊識別三聯 體堿基,序列識別上靈活性小、設計成本昂貴等問題都限制了它的發(fā)展。隨后出現的TALEN 在結構上較之ZFN更加優(yōu)化,其DNA結合域中的各單元與靶向DNA序列--對應,組裝更 為簡單,特異性也更高,并于2012年被《Science》評為年度十大科技突破之一。2013年, 一種源自細菌適應性免疫系統(tǒng),由RNA介導Cas9蛋白剪切的全新基因組編輯技術CRISPR/ Cas9系統(tǒng)出現,在全球刮起了一陣CRISPR旋風,并被《Science》評為2013年度十大科技突 破之一。較之ZFN、TALEN,CRISPR/Cas9系統(tǒng)在構建上更為簡單,且成本低、作用效率高,極 易廣泛普及。經過近兩年的發(fā)展,現已成功用于細菌、酵母、線蟲以及多種模式動物、模式植 物中,同時區(qū)別于ZFN、TALEN,成功的實現了對RNA的剪切編輯。作為新型的基因組編輯技 術,為靶向突變目的基因,研究靶向基因間的相互作用,以及人類遺傳疾病的最終治療提供 了強大的技術支持。
[0004] 目前來自化膿鏈球菌(Streptococcus pyogenes),經人工改造后的CRISPR/Cas9 系統(tǒng)應用最廣泛。其作用機制如下:首先,gRNA與Cas9蛋白形成的復合物在間隔序列 (spacer)的指導下,與革巴向序列結合。間隔序列一般為20bp,革巴向DNA與之同源的序列稱 為原型間隔區(qū)(protospacer)。緊鄰原型間隔區(qū)的下游,存在一小段序列,即原型間隔序 列相鄰基序(Protospacer adiacent motifs,PAM)。PAM -般為2-5個喊基,且來自不同 物種的CRISPR/Cas系統(tǒng),其PAM不同?;撴溓蚓械腜AM為NGG,N為任意堿基。因此, CRISPR/Cas9系統(tǒng)的特異性由20bp的原型間隔區(qū)和3bp的PAM共同決定。接著,識別靶向 序列后,通過Cas9核酸酶進行剪切。Cas9蛋白存在兩個核酸功能域,即RuvC-like和HNH。 RuvC-like結構域剪切原型間隔區(qū)所在單鏈,B卩非互補鏈(Non-complementary),作用位置 為PAM上游3-8nt處。而HNH結構域剪切另一條單鏈,B卩互補鏈(complementary),作用位 置為PAM上游3nt處。兩個結構域共同作用,在靶向位置處產生DSBs,進而引發(fā)細胞內的固 有修復機制(NHEJ、HR),對DNA損傷部分進行修復,從而引入突變(如圖1所示)。
[0005] 線粒體是存在于大多數真核生物(包括植物、動物、真菌和原生生物)細胞中的細 胞器,有"細胞中的能量工廠"之稱。它主要通過氧化磷酸化以三羧酸循環(huán)腺苷(ATP)的形 式為細胞活動提供能量。同時,還參與諸如鐵硫簇的生物合成、鈣穩(wěn)態(tài)調節(jié)、細胞分化、細胞 信息傳遞和細胞凋亡等過程,并且擁有調控細胞生長和細胞周期的能力。
[0006] 線粒體基因組,又稱線粒體DNA(mtDNA)。長度一般為幾萬至數十萬堿基對,人類 mtDNA為16, 569bps,共編碼2個rRNA、13個mRNA、22個tRNA。基因排列緊湊,除與mtDNA 復制及轉錄有關的一小段區(qū)域外,無內含子序列。mtDNA表現為母系遺傳,突變率高,是細胞 核內DNA的10倍左右。且mtDNA突變是導致人類線粒體遺傳病及衰老性疾病的重要原因。 研究表明,它與衰老及神經退行性病變如阿爾茨海默癥、帕金森氏病等老年化疾病有關,同 時也與腫瘤的形成密切相關。截至目前,已鑒定出超過500多個致病性突變來自mtDNA。而 因缺乏對mtDNA相關序列的精確改造能力,現在對于這類疾病的治療仍無有效手段。
[0007] 本發(fā)明,是繼 Michal Minczuk 等將 ZFN 運用于 mtDNA 編輯(Michal Minczuk et al.,2006)及 Sandra R Bacman 等將 TALEN 首次作用于 mtDNA (Sandra R Bacman et al., 2013)后,基于人工改造的CRISPR/Cas9系統(tǒng)的一種新型線粒體基因組編輯工具。迄今為 止,國內外還未有報道。
【發(fā)明內容】
[0008] 本發(fā)明的目的在于,提供一種高效、精確的線粒體基因組編輯工具。
[0009] 本發(fā)明基于對CRISPR/Cas9系統(tǒng)的改造,進而實現了對線粒體靶向基因的高效、 精確編輯。該系統(tǒng)主要包括兩部分:進入線粒體的向導RNA(mt-guide RNA,mt-gRNA)和定 位于線粒體的Cas9核酸酶(mito Cas9, mtCas9)。
[0010] 所述進入線粒體的向導RNA包括以下兩種:1、由RNA線粒體定位引導序列、靶向目 標序列(Target sequence)和gRNA骨架(gRNA scaffold)序列三部分組成的RNA(如圖2A 所示);2、由RNA線粒體定位引導序列、線粒體編碼的任意一種tRNA序列(Geng Wang et al.,2012)或其它額外間隔序列、靶向目標序列和gRNA骨架序列四部分組成的RNA(如圖 2B、2C 所示)。
[0011] 所述進入線粒體的向導RNA,其RNA線粒體定位引導序列可以為RP(RNase P,RP) 序列(Geng Wang et al. ,2010),也可以是其他能夠跨膜進入線粒體基質內,并能引導gRNA 進入線粒體的序列。
[0012] 所述編碼第一種mt-gRNA的DNA序列,以RP序列作為RNA線粒體定位引導序列為 例,可通過兩條帶有RP序列和靶向目標序列的互補寡核苷酸鏈經退火后,由Bbsl限制性酶 切位點或其它合適的限制性酶切位(如Bsal)連入編碼gRNA骨架的DNA片段中。相應互 補寡核苷酸鏈結構如下:
[0013] CACCGTCTCCCTGAGCTTCAGGGAGNNNNNNNNNNNNNNNNNNNN-3, lllllllllllllllllllllllll llllllllll III CAGAGGGACTCGAAGTCCCTCNNNNNNNNNNNNNNNNNNNNCAAA-5,
[0014] 其中,CACC、CAAA為Bbsl (或者Bsal)酶切后產生的連入載體所需粘性末端;編碼 RP序列的核苷酸序列為:TCTCCCTGAGCTTCAGGGAG ;N為A、C、G、T任意堿基,20個N為一段 靶向目標序列。
[0015] 所述編碼第二種mt-gRNA的DNA序列,編碼以RP序列為例的RNA線粒體定位引導 序列、線粒體編碼的任意一種tRNA (22種)序列、靶向目標序列的DNA片段。通過一對含RP 序列的正向引物和含靶向目標序列的反向引物,經PCR擴增、純化回收后,由Bbsl限制性酶 切位點或其它合適的限制性酶切位點(如Bsal)連入編碼gRNA骨架的DNA片段中。以線 粒體編碼的tRNA-Leul為例:
[0016] 正向序列 F-Leul:
[0017] 5,-CAGAAGACCTCACCATGTCTCCCTGAGCTTCAGGGAGGGAGAAATAAGGCCTACTTCAC-3,
[0018] 反向序列 R-Leul:
[0019] 5, -CAGAAGACCTAAACNNNNNNNNNNNNNNNNNNNNCGTTCGGTAAGCATTAGG-3,
[0020] 其中,橫線部分為Bbsl限制性酶切位點;斜體下劃線部分為編碼RP序列的核苷酸 序列;N為A、C、G、T任意堿基,20個N為一段靶向目標序列。
[0021] 所述靶向目標序列,為mtDNA中的任意一段目標核苷酸序列。其結構如下: 5' -Nx-NGG-3',其中N為A、C、G、T任意堿基,16彡X彡30,且X-般為20。
[0022] 所述 gRNA 骨架,由反式激活 CRISPR RNA (Trans-activating crRNA,tracrRNA)、 CRISPR RNA(crRNA)嵌合結構,優(yōu)化融合為一條單鏈RNA后所得。其中,類似發(fā)夾結構的RNA 部分,用以招募Cas9核酸酶。這個復合體在gRNA的指導下,通過Cas9蛋白兩個核酸功能 域:RuvC-1 ike和HNH,對靶向位置的DNA雙鏈進行剪切,造成DSBs。
[0023] 所述兩種mt-gRNA的轉錄均由U6啟動子啟動,U6啟動子與編碼gRNA骨架DNA片 段的核苷酸序列中間插入兩個Bbsl限制性酶切位點,用以同時連入編碼RNA線粒體定位引 導序列、靶向目標序列的DNA片段或編碼RNA線粒體定位引導序列、線粒體編碼的任意一 種tRNA序列或其他額外間隔序列、靶向目標序列的DNA片段中任意一種結構,其核苷酸序 列如SEQ ID NO. 1所示。其中,U6啟動子的核苷酸序列如SEQ ID NO. 1中第