專利名稱:一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用的制作方法
技術領域:
本發(fā)明涉及基因工程領域,尤其涉及一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。
背景技術:
按照人類的意愿對基因組進行定向靶向修飾一直是許多科學家的夢想。在內(nèi)源的基因組上特異地刪除或加入我們需要的序列,一方面可以構(gòu)建出各種動物模型用于生物學基礎研究和疾病機理研究,另一方面可以生產(chǎn)動物反應器用以廉價生產(chǎn)我們需要的又很難從其他途徑得到的生物組分。其中,利用大動物乳腺生產(chǎn)藥用或保健用蛋白不僅有巨大的經(jīng)濟價值,同時還具有很大程度降低整體醫(yī)療成本等社會價值。大動物乳腺器原理是通過基因組靶向修飾技術把目的蛋白定點敲入到乳腺高效并特異表達的蛋白啟動子后,通過該啟動子在大動物的乳腺中大量并特異的表達高價值的目的蛋白。β乳球蛋白基因是制造乳腺反應器的主要目的基因,其表達量高,并具有很強的時空特異性,只會在成年的雌性動物的乳腺中表達。表達的產(chǎn)物只會分泌到乳腺中,便以收集和提純。但人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統(tǒng)的基因打靶技術依賴于細胞內(nèi)自然發(fā)生的同源染色體隨機交換,其打靶效率非常低,通常只有 10-6-10-8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。近年發(fā)展很快的序列特異的核酸酶可以用于精確的基因組靶向修飾。一般由序列特異的核酸酶由一個DNA識別結(jié)構(gòu)域和一個非特異性核酸內(nèi)切酶結(jié)構(gòu)域構(gòu)成。原理是首先由DNA識別域把核酸酶定位到需要編輯的基因組區(qū)域,然后非特異性核酸內(nèi)切酶切斷雙鏈 DNA從而造成DNA雙鏈斷裂(double-strand break,DSB),引入的DSB激活的DNA自我修復可以引起基因的突變和促進該位點DNA同源重組。鋅指核酸酶(Zinc-finger nucleases, ZFN)是現(xiàn)在研究最清楚也是應用最廣的序列特異的核酸酶。其原理是兩個鋅指蛋白特異識別兩段相隔5-7bp的DNA序列,并把與之融合表達的非特異性DNA切割蛋白R)kl的兩個單聚體定位到了一起,DNA切割蛋白形成雙聚體時可以切斷該位置的雙鏈DNA,從而造成 DSB。ZFN的出現(xiàn)使基因組靶向修飾技術向前邁進了一大步,然而,ZFN技術還存在靶向不確定性、效率低、拖把率高等問題,研究者很難自行設計出特異和高效的靶向基因組目的序列的鋅指核酸酶仍然是制約ZFN廣泛應用的瓶頸。而商業(yè)購買高效特異的鋅指核酸酶又價格昂貴(20萬人民幣/基因),一般研究者或商業(yè)公司根本無法承受這筆費用。2009年兩個研究組發(fā)現(xiàn)植物病原體Xanthomonas中的一種可以調(diào)節(jié)植物基因表達的轉(zhuǎn)錄激活子樣效應因子(transcription activator-like effector,TALE)表現(xiàn)出DNA 結(jié)合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發(fā)出更簡易的新型基因組靶向修飾技術帶來了新希望。TALE與R)kl融合后即形成轉(zhuǎn)錄激活子樣效應因子核酸酶(transcriptionactivator-like effector nucleases,TALEN)。TALEN 的打靶原理與 ZFN 相同,只是識別特異DNA的蛋白不同。TALEs由數(shù)十個特異性識別DNA的串聯(lián)“蛋白模塊”和兩側(cè)的N-末端及C-末端序列組成。每個“蛋白模塊”包含34個氨基酸,第12和13位殘基是靶向識別的關鍵位點,被稱作重復可變的di-residUes(RVDs)位點。然而不同于每個鋅指蛋白識別特異性的三聯(lián)體堿基,TALEs上的每個RVDs僅能識別一個堿基。Sangamo BioSciences公司和哈佛大學的兩個研究小組分別利用TALEs技術進行了基因組靶向修飾相關研究,兩篇研究論文發(fā)表在同一期的《自然生物技術》(Nature Biotechnology)雜志上。Edward Rebar領導的研究小組將帶有不同C-末端TALE的截短片段連接到核酸酶 FokI的催化結(jié)構(gòu)域上。當研究人員將構(gòu)建的TALENs靶向內(nèi)源性的人類NTF3和CCR5基因時,證實TALENs能夠特異性地對這些基因片段進行剪切。哈佛大學研究小組開發(fā)了一種基于分層連接的策略來構(gòu)建包含12個重復模塊的TALEs。他們在保留RVDs的基礎上減少了每個模塊的DNA序列,同時將剩余序列的重復性降到最低。進而通過12重PCR獲得了帶有特異性連接序列的單體,并將其克隆至包含TALE N-末端和C-末端序列的骨架載體中。為了構(gòu)建TALE轉(zhuǎn)錄因子,研究人員又將TALE融合到一個轉(zhuǎn)錄因子的激活域。在接下來的靶向性檢測中,研究人員證實其能特異地使四個檢測內(nèi)源基因中的兩個基因表達上調(diào)。今年7月MIT的Rudolf Jaenisch小組也驗證了 TALEN在人胚胎干細胞和人iPSC 中的打靶效果。其通過在五個位點的TALENs與之前其在相同位置的ZFNs的打靶效果作對比,得出五組TALENs在打靶效率和精確度上都與從Sangamo Biosciences公司購買的ZFNs 相似,進一步驗證了 TALENs是非常好的基因組編輯工具。
發(fā)明內(nèi)容
本發(fā)明提供了一對短肽,利用這對短肽構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子 (TALE)能夠特異性地識別山羊或綿羊β乳球蛋白基因(BLG) eX0n2上的二段相鄰核苷酸; 利用這對轉(zhuǎn)錄激活子樣效應因子構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN), 能夠?qū)ι窖蚧蚓d羊β乳球蛋白基因進行準確、高效地打靶。一對短肽,所述一對短肽分別具有如SEQ ID NO. 1和SEQ ID N0. 2所示的氨基酸序列。本發(fā)明提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對短肽。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID N0. 3和SEQ ID N0. 4所示的堿基序列。其中,所述的多核苷酸由分別識別山羊或綿羊β乳球蛋白基因eXOn2上核苷酸序列SEQ ID NO 16和SEQ ID NO 20中相應堿基的TALENs識別模塊依序連接而成,其中,識別堿基A的TALENs識別模塊為NI-A (如SEQ ID NO 22所示),識別堿基T的TALENs識別模塊為NG-T (如SEQID NO 23所示),識別堿基C的TALENs識別模塊為HD-C (如SEQ IDNO 24所示),識別堿基G的TALENs識別模塊為NK-G (如SEQ ID NO 25所示)。本發(fā)明還提供了一對蛋白質(zhì),所述一對蛋白質(zhì)由上述的一對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。
這對蛋白質(zhì)可以分別特異性地識別山羊或綿羊β乳球蛋白基因(BLG)eXOn2上的二段核苷酸序列,所述二段核苷酸序列分別選自以下二個核苷酸序列(I)SEQ ID N0:16序列或SEQ ID NO 16序列的一個或二個核苷酸經(jīng)過取代所衍生的核苷酸序列;(2) SEQ ID NO 20序列或SEQ ID NO :20序列的一個或二個核苷酸經(jīng)過取代所衍
生的核苷酸序列。優(yōu)選地,所述的這對蛋白質(zhì)分別具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基酸序列。該蛋白質(zhì)為轉(zhuǎn)錄激活子樣效應因子,命名為BLG-TALE-L1和BLG-TALE-R2。本發(fā)明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對蛋白質(zhì)。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID NO. 7和SEQ ID NO. 8所示的堿基序列。本發(fā)明還提供了一對融合蛋白,所述一對融合蛋白由上述的一對蛋白質(zhì)分別與 DNA切割蛋白融合而成。優(yōu)選地,所述的DNA切割蛋白為DNA內(nèi)切酶。優(yōu)選地,所述的一對蛋白質(zhì)分別與DNA切割蛋白的二個亞基融合。更優(yōu)選地,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的FoklDNA內(nèi)切酶。最優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。該融合蛋白為轉(zhuǎn)錄激活子樣效應因子核酸酶,命名為BLG-TALEN-L1和 BLG-TALEN-R2。本發(fā)明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對融合蛋白質(zhì)。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ IDN0. 12所示的堿基序列。本發(fā)明還提供了一種包含上述一對多核苷酸中的任意一條多核苷酸的載體。優(yōu)選地,可以先將能特異性識別SEQ ID N0. 16或SEQ ID N0. 20所示堿基序列的多核苷酸連接到中間載體pCMV-NLS-TALEbaclibone-Fokl (R)-intermediate上,再將該中間載體連接到最終載體 pEFla-NLS-TALE backbone-Fokl (R)-pA (如 SEQ ID NO :48 所示)或最終載體 pEFla-NLS-TALE backbone-R)kl (L)-IRES-PURO-pA (如 SEQ IDNO :49 所示)上, 構(gòu)建獲得包含編碼轉(zhuǎn)錄激活子樣效應因子核酸酶基因的質(zhì)粒載體,能表達轉(zhuǎn)錄激活子樣效應因子核酸酶。本發(fā)明還提供了一種用上述載體轉(zhuǎn)化的宿主細胞。優(yōu)選地,所述宿主細胞為山羊或綿羊細胞;更優(yōu)選地,所述宿主細胞為山羊或綿羊 IPS細胞。本發(fā)明還提供了一種上述一對融合蛋白或上述一對多核苷酸在對山羊或綿羊β 乳球蛋白基因靶向修飾中的應用。優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID Ν0. 9和SEQ ID NO. 10所示的氨基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQID N0. 12所示的堿基序列。本發(fā)明還提供了一種山羊或綿羊β乳球蛋白基因打靶的方法,包括將上述一對融合蛋白或者上述一對多核苷酸或者含有這對多核苷酸的載體轉(zhuǎn)入山羊或綿羊IPS細胞,于30-37°C擴增培養(yǎng)3-7天,得到β乳球蛋白基因被靶向修飾的細胞。優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQID NO. 12所示的堿基序列。優(yōu)選地,所述的山羊或綿羊IPS細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒,便于篩選。優(yōu)選地,所述的擴增培養(yǎng)中至少有1天在30°C下進行,能獲得更好的打靶效果。本發(fā)明針對山羊或綿羊BLG基因的一個位點設計了一對轉(zhuǎn)錄激活子樣效應因子核酸酶(BLG-TALEN-L1和BLG-TALEN-R2),這對TALENs分別由可以識別BLG基因exon2上一段核苷酸的DNA識別結(jié)構(gòu)域與一個R)kl DNA內(nèi)切酶的兩個異源亞基融合得到。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞BLG基因的eXon2位點打靶,并使打靶位點發(fā)生基因突變,包括堿基缺失、堿基插入等,從而實現(xiàn)對山羊或綿羊BLG 基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
圖1為人工設計的轉(zhuǎn)錄激活子樣效應因子核酸酶識別的DNA序列及位點;圖2為18個識別模塊連接策略示意圖;其中,A =PCR為每個識別模塊添加酶切識別序列和連接接頭過程示意圖;B =PCR為每個識別模塊添加酶切識別序列和連接接頭后示意圖;C =PCR擴增6模塊片段與中間載體示意圖;D 最終構(gòu)建的TALEN質(zhì)粒示意圖;圖 3 為中間載體 pCMV-NLS-TALE backbone-Fokl (R) -intermediate 示意圖;圖 4 為最終載體 pEFla-NLS-TALE backbone-Fokl (R) -pA 示意圖;圖 5 為最終載體 pEF la-NLS-TALE backbone-Fokl (L) -IRES-PURO-pA 示意圖;圖 6 為最終的 TALEN 質(zhì)粒 pEFla-NLS-TALE backbone N terninal-BLG-TALEN-Ll-TALE backbone C terminal-Fokl (L) -IRES-PURO-pA 的示意圖;圖7為BLG基因在打靶位點的基因型變化;其中,-表示堿基缺失,+表示堿基插入。
具體實施例方式以下實施例中所使用的技術,包括PCR擴增與檢測、細胞轉(zhuǎn)染等分子生物學技術, 以及細胞培養(yǎng)、檢測技術等,除非特別說明,均為本領域內(nèi)的技術人員已知的常規(guī)技術;所使用的儀器設備、試劑和細胞系等,除非是本說明書特別注明,均為一般本領域的研究和技術人員可以通過公共途徑獲得的。實施例1 TALENs靶序列的設計1、從NCBI上下載山羊和綿羊BLG基因組序列(GenBank編號山羊為Z33881. 1, 綿羊為X12817. 1),選擇eXOn2為打靶目標;2、設計引物并PCR擴增基因組上打靶位點片段,并測序,其中,PCR引物及測序引物見表1 ;表 1
片段名稱引物名稱引物序列BLG exon2Fprimer ( SEQ ID NO: 13 )CCCCACCTTGCTCCCGTTCCRprimer( SEQ ID NO: 14 )CAGACTAACAGGGAATTCAGAATACCT GC測序引物(SEQ ID NO: 15 )GACCCAGAGTCCAGACACCC3、設計TALENs識別序列根據(jù)測序得到的序列,并依照以下原則確定TALENs識別序列(1)第0位堿基為T (識別序列第一位之前的堿基為第0位)(2)最后一位堿基為T(3)識別序列長度在14-19之間(4) 二個識別序列之間的間隔序列(Spacer)長度控制在14_21之間(12或13也可,但效率可能較低)設計得到的靶序列位置如圖1所示,具體序列見表2。表 2
TALE名稱靶序列BLG-TALE-L1(SEQ ID NO 16)gtctcagccctccactBLG-TALE-L2(SEQ ID NO 17)cagccctccactccctBLG-TALE-L3(SEQ ID NO 18)gtctcagccctBLG-TALE-R1(SEQ ID NO 19)gcagctggggtcgtgcttBLG-TALE-R2(SEQ ID NO :20)gcagctggggtcgtgctBLG-TALE-R3(SEQ ID NO :21)ggctgcagctggggt實施例2 TALENs識別模塊之間的連接及重組載體的構(gòu)建1、TALENs 識別模塊(modular)的獲得(1)合成分別識別堿基A、T、C、G的四個識別模塊Ni、NG、HD、NK,序列見表3。表權利要求
1.一對短肽,其特征在于,所述一對短肽分別具有如SEQ ID NO. 1和SEQ ID NO. 2所示的氨基酸序列。
2.一對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權利要求1所述的一對短肽。
3.如權利要求2所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQID NO. 3和SEQ ID NO. 4所示的堿基序列。
4.一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)由權利要求1所述的一對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。
5.如權利要求4所述一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)分別具有如SEQIDNO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.一對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權利要求4或5所述的一對蛋白質(zhì)。
7.如權利要求6所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQID NO. 7和SEQ ID NO. 8所示的堿基序列。
8.一對融合蛋白,其特征在于,所述一對融合蛋白由權利要求4所述的一對蛋白質(zhì)分別與DNA切割蛋白融合而成。
9.如權利要求8所述一對融合蛋白,其特征在于,所述的一對蛋白質(zhì)分別與DNA切割蛋白的二個亞基融合。
10.如權利要求9所述一對融合蛋白,其特征在于,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的i^okl DNA內(nèi)切酶。
11.如權利要求8-10任一權利要求所述一對融合蛋白,其特征在于,所述一對融合蛋白分別具有如SEQ ID N0. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權利要求8-10任一權利要求所述的一對融合蛋白。
13.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權利要求11所述的一對融合蛋白。
14.如權利要求13所述的一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID N0. 12所示的堿基序列。
15.一種包含權利要求2-3、6-7、13或14任一權利要求所述一對多核苷酸中的任意一條多核苷酸的載體。
16.一種用權利要求15所述載體轉(zhuǎn)化的宿主細胞。
17.一種包含權利要求12所述一對多核苷酸中的任意一條多核苷酸的載體。
18.一種用權利要求17所述載體轉(zhuǎn)化的宿主細胞。
19.如權利要求16或18所述宿主細胞,其特征在于,所述宿主細胞為山羊或綿羊IPS細胞。
20.一種如權利要求11所述一對融合蛋白或如權利要求14所述一對多核苷酸在對山羊或綿羊β乳球蛋白基因靶向修飾中的應用。
21.—種山羊或綿羊β乳球蛋白基因打靶的方法,其特征在于,包括將權利要求11所述一對融合蛋白或者權利要求13或14所述一對多核苷酸或者含有權利要求13或14所述一對多核苷酸的載體轉(zhuǎn)入山羊或綿羊IPS細胞,于30-37°C擴增培養(yǎng)3-7天,得到β乳球蛋白基因被靶向修飾的細胞。
22.如權利要求21所述的方法,其特征在于,所述的山羊或綿羊IPS細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒。
23.如權利要求21或22所述的方法,其特征在于,所述的擴增培養(yǎng)中至少有1天在30°C下進行。
全文摘要
本發(fā)明公開了一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。這對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN)由一對DNA識別蛋白分別與Fok1 DNA內(nèi)切酶的兩個異源亞基融合得到,可以特異性地識別山羊或綿羊β乳球蛋白基因(BLG)exon2上的兩個相鄰位點。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞BLG基因的exon2位點打靶,并使打靶位點發(fā)生基因突變,從而實現(xiàn)對山羊或綿羊BLG基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
文檔編號C12N5/10GK102558309SQ20121002976
公開日2012年7月11日 申請日期2012年2月10日 優(yōu)先權日2012年2月10日
發(fā)明者肖磊, 趙金龍 申請人:浙江大學