本發(fā)明屬于生物
技術領域:
:,具體涉及一種cas9核酸酶r919p及用途。
背景技術:
::自從人類基因組計劃(humangenomeproject)和dna元件百科全書(encyclopediaofdnaelements)項目的完成,科學家們分析和鑒定了大量的基因組中的基因和dna調(diào)控元件[1,2]。在基因表達調(diào)控中起重要作用的dna調(diào)控元件包括啟動子、增強子、沉默子和絕緣子等。然而,多數(shù)調(diào)控元件的功能并沒有得到實驗的驗證和闡明[2-8]。探索基因和dna調(diào)控元件的功能,可以通過遺傳學dna片段編輯來進行研究。早期的基因編輯和基因功能修飾是通過基因轉(zhuǎn)座和轉(zhuǎn)基因?qū)崿F(xiàn)的[9-14]。伴隨測序技術的發(fā)展反向遺傳學被應用于對基因組進行特定的突變[15,16]。特別是依賴于同源重組的基因打靶小鼠迅速地被應用到科學研究中[15,17,18]。此外,在小鼠和斑馬魚中dna片段的反轉(zhuǎn)和重復被應用于去研究特定的基因組結(jié)構變化[19-24]。近幾年,源于細菌和古菌的ⅱ型成簇規(guī)律間隔短回文重復系統(tǒng)[clusteredregularlyinterspacedshortpalindromicrepeats(crispr)/crispr-associatednuclease9(cas9),crispr/cas9]是新興基因組編輯技術[25-27],由于它設計簡單和操作方便,迅速地被應用到真核基因組編輯。我們利用crispr/cas9系統(tǒng)在人細胞系和小鼠中實現(xiàn)了dna片段遺傳編輯(刪除、反轉(zhuǎn)和重復)[28]。通過cas9和兩個sgrnas在基因組中進行兩個位點靶向斷裂后在ctip等蛋白參與的修復系統(tǒng)作用下可以實現(xiàn)dna片段的刪除、反轉(zhuǎn)(倒位)、重復、易位和插入(如果提供供體)等[29-32]。通過對dna片段編輯的遺傳操作,能夠用來研究原鈣粘蛋白和珠蛋白的基因表達調(diào)控和三維基因組結(jié)構[28,31-33]。目前可以通過crispr/cas9系統(tǒng)實現(xiàn)dna片段的編輯,但是對于深入研究特定dna區(qū)段的精準功能,有效地實現(xiàn)dna片段的精準遺傳編輯的cas9核酸酶還有待發(fā)現(xiàn)。技術實現(xiàn)要素:為了克服現(xiàn)有技術中所存在的問題,本發(fā)明的目的在于提供一種cas9核酸酶及用途。為了實現(xiàn)上述目的以及其他相關目的,本發(fā)明采用如下技術方案:本發(fā)明的第一方面,提供一種cas9核酸酶(cas9-r919p),具有cas9核酸酶活性,適用于crispr/cas9系統(tǒng),所述cas9核酸酶是將野生型cas9核酸酶第919位精氨酸突變成脯氨酸獲得。優(yōu)選地,與野生型cas9核酸酶相比,所述cas9核酸酶(cas9-r919p)對目的基因組dna片段進行切割時產(chǎn)生的突出斷裂末端與鈍斷裂末端的比例不同。優(yōu)選地,所述野生型cas9核酸酶為spcas9。進一步地,所述野生型cas9核酸酶的氨基酸序列如seqidno.7所示。優(yōu)選地,所述cas9核酸酶(cas9-r919p)含有如seqidno.9所示的氨基酸序列。優(yōu)選地,所述cas9核酸酶(cas9-r919p)的氨基酸序列如seqidno.9所示。本發(fā)明的第二方面,提供一種多核苷酸,其編碼所述cas9核酸酶(cas9-r919p)。本發(fā)明的第三方面,提供一種表達載體,其含有前述多核苷酸。本發(fā)明的第四方面,提供一種宿主細胞,其被前述表達載體所轉(zhuǎn)化。本發(fā)明的第五方面,提供一種制備所述cas9核酸酶(cas9-r919p)的方法,包括步驟:構建含有cas9核酸酶(cas9-r919p)編碼多核苷酸的表達載體,然后將所述表達載體轉(zhuǎn)化至宿主細胞中誘導表達,從表達產(chǎn)物中分離獲得所述的cas9核酸酶(cas9-r919p)。本發(fā)明的第六方面,提供前述cas9核酸酶(cas9-r919p)或其編碼多核苷酸或含有所述編碼多核苷酸的表達載體用于基因組dna片段編輯或用于制備基因組dna片段編輯工具的用途。優(yōu)選地,所述編輯包括單位點編輯和多位點編輯。所述多位點編輯的編輯位點數(shù)為兩個及以上。優(yōu)選地,所述編輯的方式包括突變、刪除、反轉(zhuǎn)或倒位、重復、易位或插入。本發(fā)明的第七方面,提供一種基因組dna片段編輯工具,所述基因組dna片段編輯工具為crispr/cas9系統(tǒng),所述crispr/cas9系統(tǒng)包括前述cas9核酸酶(cas9-r919p)或其編碼多核苷酸或含有所述編碼多核苷酸的表達載體。優(yōu)選地,所述crispr/cas9系統(tǒng)包括前述cas9-r919p和針對目的dna片段的一個或多個sgrna。所述多個是指兩個及以上。本發(fā)明的第八方面,提供一種基因組dna片段編輯方法,采用前述cas9核酸酶(cas9-r919p)以及與之配合的一個或多個sgrna,利用crispr/cas9系統(tǒng)對待編輯的基因組dna片段進行編輯。優(yōu)選地,所述編輯包括單位點編輯和多位點編輯。所述多位點編輯的編輯位點數(shù)為兩個及以上。優(yōu)選地,所述編輯的方式包括突變、刪除、反轉(zhuǎn)或倒位、重復、易位或插入。優(yōu)選地,將含有前述cas9核酸酶(cas9-r919p)編碼多核苷酸的表達載體以及與之配合的一個或多個sgrna一同轉(zhuǎn)入細胞中,對待編輯的基因組dna片段進行編輯。本發(fā)明的第九方面,提供一種基因組dna片段單位點編輯方法,利用crispr/cas9系統(tǒng),采用如權利要求1所述的cas9核酸酶(cas9-r919p)對dna雙鏈進行切割產(chǎn)生突出斷裂末端,通過細胞自身修復系統(tǒng),以補平連接的方式加入與突出斷裂末端互補的堿基。所述基因組dna片段單位點編輯方法可以改變單位點編輯時堿基突變的特征。與現(xiàn)有技術相比,本發(fā)明具有如下有益效果:本發(fā)明的cas9核酸酶(cas9-r919p),適用于crispr/cas9系統(tǒng),所述cas9核酸酶(cas9-r919p)含有如seqidno.9所示的氨基酸序列,所述cas9核酸酶(cas9-r919p)與野生型cas9核酸酶相比,對目的基因組dna片段進行切割時產(chǎn)生的突出斷裂末端及鈍斷裂末端的比例相對于野生型cas9核酸酶不同。采用所述cas9核酸酶(cas9-r919p)對dna雙鏈進行切割可產(chǎn)生突出斷裂末端,通過細胞自身修復系統(tǒng),以補平連接的方式可加入與突出斷裂末端互補的堿基,能夠?qū)崿F(xiàn)對基因組dna片段的特定位置加入特定堿基的精準編輯。附圖說明圖1a:cas9在兩個sgrnas介導下對dna雙鏈進行切割產(chǎn)生四個斷裂末端,這些斷裂末端在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除、反轉(zhuǎn)和重復。圖1b:針對hs51位點的dna片段刪除、反轉(zhuǎn)和重復情況。圖1c:dna片段刪除接頭處存在“g”的加入。圖1d:dna片段重復接頭處存在“t”的加入。圖1e:dna片段下游反轉(zhuǎn)接頭處存在“a”、“g”和“ag”的加入。圖1f:針對這兩個特定序列的sgrnas,cas9切割方式比例特征。圖2a:cas9核酸酶結(jié)構示意圖。圖2b:β-globinre2位點進行dna片段編輯的兩個sgrnas的示意圖。圖2c:通過檢測dna片段重復接頭連接情況統(tǒng)計出各cas9核酸酶在sgrna1的介導下對基因組dna片段進行切割時所產(chǎn)生的各種切割末端的占比。圖2d:針對上游sgrna1,cas9以及cas9突變體對目的dna片段的切割情況。圖2e:通過檢測dna片段刪除接頭連接情況統(tǒng)計出各cas9核酸酶在sgrna2的介導下對基因組dna片段進行切割時所產(chǎn)生的各種切割末端的占比。圖2f:針對下游sgrna2,cas9以及cas9突變體對目的dna片段的切割情況。圖2g:cas9以及cas9突變體在dna片段反轉(zhuǎn)一側(cè)接頭處堿基加入的實際和預測比例。圖3a:在stm位點,針對上游sgrna1,cas9以及cas9突變體對目的dna片段的切割情況。圖3b:在stm位點,針對下游sgrna2,cas9以及cas9突變體對目的dna片段的切割情況。具體實施方式一、cas9核酸酶本發(fā)明的cas9核酸酶(cas9-r919p),具有cas9核酸酶活性,適用于crispr/cas9系統(tǒng),所述cas9核酸酶是將野生型cas9核酸酶第919位精氨酸突變成脯氨酸獲得。所述cas9核酸酶(cas9-r919p)與野生型cas9核酸酶相比,對目的基因組dna片段進行切割時產(chǎn)生的突出斷裂末端與鈍斷裂末端的比例不同。進一步地,所述野生型cas9核酸酶為spcas9。進一步地,所述野生型cas9核酸酶的氨基酸序列如seqidno.7所示。進一步地,所述cas9核酸酶(cas9--r919p)含有如seqidno.9所示的氨基酸序列。本發(fā)明的一些實施方式中,例舉了所述cas9--r919p的氨基酸序列如seqidno.9所示。二、編碼cas9核酸酶的多核苷酸編碼所述cas9核酸酶(cas9--r919p)的多核苷酸,可以是dna形式或rna形式。dna形式包括cdna、基因組dna或人工合成的dna。dna可以是單鏈的或是雙鏈的。編碼所述cas9核酸酶(cas9--r919p)的多核苷酸,可以通過本領域技術人員熟知的任何適當?shù)募夹g制備。所述技術見于本領域的一般描述,如《分子克隆實驗指南》(j.薩姆布魯克等,科學出版社,1995)。包括但不限于重組dna技術、化學合成等方法。本發(fā)明的一些實施方式中,例舉了編碼所述cas9核酸酶(cas9--r919p)的多核苷酸如seqidno.10所示。三、表達載體所述表達載體含有編碼所述cas9核酸酶(cas9-r919p)的多核苷酸。本領域的技術人員熟知的方法能用于構建所述表達載體。這些方法包括重組dna技術、dna合成技術等??蓪⑺鯿as9核酸酶(cas9-r919p)的dna有效連接到載體中的多克隆位點上,以指導mrna合成進而表達蛋白。四、宿主細胞所述宿主細胞被表達所述cas9核酸酶(cas9-r919p)的表達載體所轉(zhuǎn)化。宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有:大腸桿菌,鏈霉菌屬;鼠傷寒沙門菌、李斯特細菌;真菌細胞如酵母;植物細胞;果蠅s2或sf9的昆蟲細胞;cho、cos.293細胞、或bowes黑素瘤細胞的動物細胞等。五、制備cas9核酸酶(cas9-r919p)的方法制備前述cas9核酸酶(cas9-r919p)的方法,包括步驟:構建含有cas9核酸酶(cas9-r919p)編碼多核苷酸序列的表達載體,然后將所述表達載體轉(zhuǎn)化至宿主細胞中誘導表達,從表達產(chǎn)物中分離獲得所述的cas9核酸酶(cas9-r919p)。本領域技術人員可根據(jù)cas9核酸酶(cas9-r919p)的性質(zhì)來選擇合適的表達載體和宿主細胞。六、cas9核酸酶(cas9-r919p)或其編碼多核苷酸或含有所述編碼多核苷酸的表達載體的用途本發(fā)明的cas9核酸酶(cas9-r919p)或其編碼多核苷酸或含有所述編碼多核苷酸的表達載體可用于基因組dna片段編輯或用于制備基因組dna片段編輯工具。進一步地,所述編輯包括單位點編輯和多位點編輯。所述多位點編輯的編輯位點數(shù)為兩個及以上。所述編輯的方式包括突變、刪除、反轉(zhuǎn)或倒位、重復、易位或插入。七、基因組dna片段編輯工具本發(fā)明的基因組dna片段編輯工具可以是crispr/cas9系統(tǒng),所述crispr/cas9系統(tǒng)包括前述cas9核酸酶(cas9-r919p)或其編碼多核苷酸或含有所述編碼多核苷酸的表達載體。進一步地,所述crispr/cas9系統(tǒng)還包括針對目的dna片段的一個或多個sgrna。所述sgrna為針對目的dna片段所設計,在sgrna(single-guiderna)的介導下,cas9-r919p能夠在pam(protospaceradjacentmotif)位點上游對dna雙鏈進行切割,形成dna雙鏈斷裂,通過細胞自身修復系統(tǒng),完成dna片段的精準編輯。針對目的基因的sgrna可以是一個或兩個及以上。當sgrna是一個的時候,可以實現(xiàn)對目的dna片段的單位點編輯,當sgrna是兩個及以上的時候,可以實現(xiàn)對目的dna片段的多位點編輯。八、基因組dna片段編輯方法本發(fā)明的基因組dna片段編輯方法,采用前述cas9核酸酶(cas9-r919p)以及與之配合的一個或多個sgrna,利用crispr/cas9系統(tǒng)對待編輯的基因組dna片段進行編輯。所述編輯包括單位點編輯和多位點編輯。所述多位點編輯的編輯位點數(shù)為兩個及以上。當sgrna是一個的時候,可以實現(xiàn)對目的dna片段的單位點編輯,當sgrna是兩個及以上的時候,可以實現(xiàn)對目的dna片段的多位點編輯。進一步地,可將前述cas9核酸酶(cas9-r919p)編碼多核苷酸的表達載體以及與之配合的一個或多個sgrna一同轉(zhuǎn)入細胞中,對待編輯的基因組dna片段進行編輯。九、基因組dna片段單位點編輯方法利用crispr/cas9系統(tǒng),采用本發(fā)明的cas9核酸酶(cas9-r919p)對dna雙鏈進行切割產(chǎn)生突出斷裂末端,以補平連接的方式加入與突出斷裂末端互補的堿基,可實現(xiàn)對基因組dna片段的單位點編輯。所述基因組dna片段單位點編輯方法可以改變單位點編輯時堿基突變的特征。所述補平連接是指:所述突出斷裂末端會先通過堿基互補配對加入與突出的末端互補的堿基補平為鈍末端之后再連接。如本發(fā)明的一些實施方式中所例舉的,cas9核酸酶r919p在sgrna1的介導下,對基因組dna片段(β-globinre2位點)進行切割時,所產(chǎn)生的突出斷裂末端u4,在細胞修復系統(tǒng)的作用下,所述突出斷裂末端u4會先通過堿基互補配對加入與突出的末端c互補的堿基g補平為鈍末端后再與連接接頭連接。cas9核酸酶r919p在sgrna2的介導下,對基因組dna片段(β-globinre2位點)進行切割時,所產(chǎn)生的突出斷裂末端d4,在細胞修復系統(tǒng)的作用下,所述突出斷裂末端d4會先通過堿基互補配對加入與突出的末端a互補的堿基t補平為鈍末端后再與連接接頭連接。說明:在本發(fā)明中,cas9可作為cas9核酸酶的簡稱使用,意思與cas9核酸酶相同。在本發(fā)明中,cas9-r919p、r919p、r919p突變體之間可替換使用,意思均為名稱為r919p的cas9核酸酶。在進一步描述本發(fā)明具體實施方式之前,應理解,本發(fā)明的保護范圍不局限于下述特定的具體實施方案;還應當理解,本發(fā)明實施例中使用的術語是為了描述特定的具體實施方案,而不是為了限制本發(fā)明的保護范圍。下列實施例中未注明具體條件的試驗方法,通常按照常規(guī)條件,或者按照各制造商所建議的條件。當實施例給出數(shù)值范圍時,應理解,除非本發(fā)明另有說明,每個數(shù)值范圍的兩個端點以及兩個端點之間任何一個數(shù)值均可選用。除非另外定義,本發(fā)明中使用的所有技術和科學術語與本
技術領域:
:技術人員通常理解的意義相同。除實施例中使用的具體方法、設備、材料外,根據(jù)本
技術領域:
:的技術人員對現(xiàn)有技術的掌握及本發(fā)明的記載,還可以使用與本發(fā)明實施例中所述的方法、設備、材料相似或等同的現(xiàn)有技術的任何方法、設備和材料來實現(xiàn)本發(fā)明。除非另外說明,本發(fā)明中所公開的實驗方法、檢測方法、制備方法均采用本
技術領域:
:常規(guī)的分子生物學、生物化學、染色質(zhì)結(jié)構和分析、分析化學、細胞培養(yǎng)、重組dna技術及相關領域的常規(guī)技術。這些技術在現(xiàn)有文獻中已有完善說明,具體可參見sambrook等molecularcloning:alaboratorymanual,secondedition,coldspringharborlaboratorypress,1989andthirdedition,2001;ausubel等,currentprotocolsinmolecularbiology,johnwiley&sons,newyork,1987andperiodicupdates;theseriesmethodsinenzymology,academicpress,sandiego;wolffe,chromatinstructureandfunction,thirdedition,academicpress,sandiego,1998;methodsinenzymology,vol.304,chromatin(p.m.wassarmananda.p.wolffe,eds.),academicpress,sandiego,1999;和methodsinmolecularbiology,vol.119,chromatinprotocols(p.b.becker,ed.)humanapress,totowa,1999等。實施例1研究dna片段編輯接頭的連接情況發(fā)現(xiàn)cas9切割新機制針對hs51位點,構建針對hs51位點的sgrnas質(zhì)粒:(1)購買引物從上海桑尼生物科技有限公司購買分別針對hs51位點和的sgrnas靶向序列的有5’懸掛端“accg”和“aaac”可以互補配對的正反向脫氧寡核苷酸;針對上述hs51位點的sgrnas靶向序列:hs51re1sgrna1:gccacacatccaaggctgac(seqidno.1)hs51re1sgrna2:gagatttggggcgtcaggaag(seqidno.2)(2)獲得互補配對的帶有懸掛端的雙鏈dna1)用ddh2o將脫氧寡核苷酸溶解至100μm,并稀釋至20μm;2)將正反脫氧寡核苷酸加入如下反應體系:反應條件:95℃水浴,5min,然后打開水浴鍋蓋子溫度降至60℃左右,蓋上蓋子冷卻至室溫。(3)酶切pgl3-u6-sgrna-pgk-purovector1)用bsai限制性內(nèi)切酶酶切載體質(zhì)粒,反應體系如下:反應條件:37℃,1.5小時;2)膠回收純化dna酶切片段,按照膠回收試劑盒(axygen)說明純化。(4)連接酶切后的載體與帶有懸掛端的雙鏈dna連接體系如下:反應條件:室溫反應1.5小時;(5)轉(zhuǎn)化連接產(chǎn)物用stbl3感受態(tài)轉(zhuǎn)化連接產(chǎn)物,在含氨芐抗生素(amp,100mg/l)lb平板培養(yǎng)過夜,37℃。(6)挑取單克隆測序1)從氨芐抗生素lb平板上挑取單菌落,lb(amp,100mg/l)液體培養(yǎng)過夜;2)質(zhì)粒提取,按照質(zhì)粒小抽試劑盒(axygen)說明提??;3)提取后的質(zhì)粒送上海桑尼生物科技有限公司測序。(7)測序成功質(zhì)粒進行中抽1)測序成功的質(zhì)粒用stbl3感受態(tài)重新轉(zhuǎn)化,在含amp(100mg/l)的lb平板培養(yǎng)過夜;2)上午挑取單菌落在2mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)8小時,然后轉(zhuǎn)接到200mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)過夜;3)收集細菌,按照質(zhì)粒中抽試劑盒(qiagen)說明提取質(zhì)粒。2.人源化cas9質(zhì)粒制備1)人源化cas9質(zhì)粒從北京大學席建中實驗室獲得;2)用stbl3感受態(tài)重新轉(zhuǎn)化,在lb平板(amp,100mg/l)培養(yǎng)過夜;3)上午挑取單菌落在2mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)8小時,然后轉(zhuǎn)接到200mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)過夜,進行質(zhì)粒中抽。3.用lipofectamine2000進行細胞轉(zhuǎn)染1)hek293t細胞培養(yǎng)在培養(yǎng)瓶中,在37℃,含有5%co2細胞培養(yǎng)箱中培養(yǎng),待其長至培養(yǎng)瓶80~90%。2)將長好的細胞在12孔板中用dmem完全無抗培養(yǎng)基(加入10%胎牛血清,無青鏈霉素雙抗)進行鋪板,過夜培養(yǎng)。3)待12孔板中的細胞長至80~90%時,將制備好的人源化cas9質(zhì)粒(800ng)和針對hs51位點的sgrnas質(zhì)粒(各600ng)通過lipofectamine2000進行細胞轉(zhuǎn)染,每個樣品各兩個重復。4)轉(zhuǎn)染后兩天,收集細胞,用基因組提取試劑盒(genomicdnapurificationkit,promega)提取基因組。4.制備高通量測序文庫在dna片段預期刪除、反轉(zhuǎn)和重復接頭的精準連接位點上游大約30bp處設計引物,然后將引物5’端加上帶有barcode的illumina的測序接頭,下游引物可以設計在遠離拼接位點一些的位置并加上illumina的測序接頭,進行pcr擴增,然后使用羅氏pcr純化試劑盒(productno.:11732676001)進行純化,dna產(chǎn)物溶解在10mmtris-hclbuffer(ph=8.5),等量混合后形成庫,進行高通量測序。高通量引物:hiseq-hhs51-af:atgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctgcaaggagatccgtgtcgtc(seqidno.3)hiseq-hs51-ara:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctaaggatgttgtggaaggcgagcag(seqidno.4)hiseq-hs51-bfa:caagcagaagacggcatacgagatggacgggtgactggagttcagacgtgtgctcttccgatctctttacatgacagcttccggtag(seqidno.5)hiseq-hhs51-br:caagcagaagacggcatacgagatttgactgtgactggagttcagacgtgtgctcttccgatcttttttggctaacaacatagtgcttc(seqidno.6)。5.高通量測序數(shù)據(jù)處理高通量測序完成后,使用linux程序?qū)悠返臏y序結(jié)果從文庫中通過barcode分出來,保存在各自的文件夾,然后進行bwa-mem比對,比對后的序列通過varscan2程序(v2.3.9)分析dna片段的插入和刪除突變,varscan2程序參數(shù)如下:本發(fā)明通過研究dna片段編輯的末端連接情況發(fā)現(xiàn)cas9切割新機制。如圖1a所示,采用兩個sgrnas形成的sgrna組合及cas9核酸酶對基因組dna片段進行編輯時,cas9核酸酶在兩個sgrnas介導下對基因組dna雙鏈進行切割產(chǎn)生四個斷裂末端(dsb),這些斷裂末端(dsb)在細胞修復系統(tǒng)(例如,mrn/ctip)的作用下產(chǎn)生dna片段刪除、反轉(zhuǎn)和重復等dna片段編輯。如圖1b所示,針對基因組dna片段hs51re1(hs51位點),我們采用sgrna1和sgrna2形成的sgrna組合及cas9核酸酶對其進行編輯。而后,我們檢測到了dna片段刪除、反轉(zhuǎn)和重復,再利用高通量測序技術檢測dna片段刪除、反轉(zhuǎn)和重復連接接頭的情況,除了與預期相符的精準連接(joinedprecisely)外,dna片段刪除連接接頭、反轉(zhuǎn)下游連接接頭和重復連接接頭處都存在一定比例的堿基加入(insertion)。如圖1c所示,利用高通量測序技術檢測dna片段刪除連接接頭的情況,與預期相符的精準連接(joinedprecisely)比例占79.23%,刪除接頭處還存在“g”堿基的加入(insertion,與預期的精準連接相比),其比例占11.13%。與預期的精準連接相比,推測dna片段刪除連接接頭處加入的“g”堿基是來源于模版dna(hs51re1,hs51位點)的pam上游3bp附近(具體為pam上游4bp處)的堿基。因此,推測cas9核酸酶對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割;而cas9核酸酶對與sgrna非互補的dna鏈進行切割時,可在pam上游3bp處更遠的4bp處進行切割。根據(jù)dna片段刪除連接接頭處存在“g”堿基的加入(與預期的精準連接相比),推測cas9核酸酶在sgrna2介導下對基因組dna片段進行切割時,有鈍末端切割和突出末端切割,進而產(chǎn)生不同斷裂末端。當cas9核酸酶在sgrna2介導下對基因組dna片段進行了鈍末端切割時,也就是cas9核酸酶對與sgrna互補的dna鏈及非互補的dna鏈進行切割時均是在pam上游3bp處進行切割,產(chǎn)生了鈍斷裂末端“e3”。鈍斷裂末端“e3”在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,不會導致dna片段刪除連接接頭處“g”堿基的加入,而是產(chǎn)生與預期相符的精準連接(joinedprecisely)。當cas9核酸酶在sgrna2介導下對基因組dna片段進行了突出末端切割時,也就是cas9核酸酶對與sgrna互補的dna鏈進行切割時是在pam上游3bp處進行切割,而對與sgrna非互補的dna鏈進行切割時是在pam上游4bp處進行切割,從而產(chǎn)生了5’突出斷裂末端“e4”。5’突出斷裂末端“e4”在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,會導致dna片段刪除連接接頭處“g”堿基的加入。因此,我們認為:在cas9核酸酶的切割下,產(chǎn)生的斷裂末端中,鈍斷裂末端e3的比例=預期相符的精準連接(joinedprecisely)的比例=79.23%。突出斷裂末端e4的比例=“g”堿基的加入比例=11.13%。但是,我們觀察到,除了與預期相符的精準連接(joinedprecisely)以及dna片段刪除連接接頭處存在“g”堿基的加入這兩大類情況以外,還有一類隨機的堿基刪除(smalldeletion)。我們認為這類隨機的堿基刪除(smalldeletion)是各斷裂末端(鈍斷裂末端e3和突出斷裂末端e4)在細胞修復系統(tǒng)的作用下隨機產(chǎn)生的,各斷裂末端以均等的概率來產(chǎn)生堿基刪除(smalldeletion),各斷裂末端在細胞修復系統(tǒng)的作用下所產(chǎn)生的堿基刪除(smalldeletion)的數(shù)量與各斷裂末端的數(shù)量成正比?;陔S機堿基刪除現(xiàn)象的存在,我們認為,經(jīng)過測序獲得的各斷裂末端的實測比例與其真實比例存在差距,需要進行修正還原,即以各種斷裂末端的實測比例之和為基準,計算各斷裂末端的比例,以此作為該斷裂末端的占比。即對cas9核酸酶的切割所產(chǎn)生的各斷裂末端的比例進行標準化計算,鈍斷裂末端e3的比例為87.7%【計算方法為:79.23%÷(79.23%+11.13%)】。突出斷裂末端e4的比例為12.3%【計算方法為:11.13%÷(79.23%+11.13%)】。亦即,cas9核酸酶在sgrna2的介導下對基因組dna片段進行的切割方式中,鈍末端切割的比例為87.7%,突出末端切割的比例為12.3%。如圖1d所示,利用高通量測序技術檢測dna片段重復連接接頭的情況,與預期相符的精準連接(joinedprecisely)的比例占8.96%,連接接頭處存在“t”堿基的加入(insertion,與預期的精準連接相比)的比例占82.92%。與預期的精準連接相比,推測dna片段重復連接接頭處加入的“t”堿基是來源于模版dna(hs51re1,hs51位點)上的pam上游3bp附近(具體為pam上游4bp處)的堿基。因此,推測cas9核酸酶對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割;而cas9核酸酶對與sgrna非互補的dna鏈進行切割時,可在pam上游3bp處更遠的4bp處進行切割。根據(jù)dna片段重復連接接頭處檢測到存在“t”堿基的加入(與預期的精準連接相比),推測cas9核酸酶在sgrna1介導下對基因組dna片段進行切割時,有鈍末端切割和突出末端切割,進而產(chǎn)生不同斷裂末端。當cas9核酸酶在sgrna1介導下對基因組dna片段進行了鈍末端切割時,也就是cas9核酸酶對與sgrna互補的dna鏈及非互補的dna鏈進行切割時均是在pam上游3bp處進行切割,產(chǎn)生了鈍斷裂末端“c3”。鈍斷裂末端“c3”在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段重復時,不會導致dna片段重復連接接頭處“t”堿基的加入,而是產(chǎn)生與預期相符的精準連接(joinedprecisely)。當cas9核酸酶在sgrna1介導下對基因組dna片段進行了突出末端切割時,也就是cas9核酸酶對與sgrna互補的dna鏈進行切割時是在pam上游3bp處進行切割,而對與sgrna非互補的dna鏈進行切割時是在pam上游4bp處進行切割,從而產(chǎn)生了5’突出斷裂末端“c4”。5’突出斷裂末端“c4”在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段重復時,會導致dna片段重復連接接頭處“t”堿基的加入。因此,我們認為:在cas9核酸酶的切割下,產(chǎn)生的斷裂末端中,鈍斷裂末端c3的比例=預期相符的精準連接(joinedprecisely)的比例=8.96%。突出斷裂末端c4的比例=“t”堿基的加入比例=82.92%。但是,我們觀察到,除了與預期相符的精準連接(joinedprecisely)以及dna片段重復連接接頭處存在“t”堿基的加入這兩大類情況以外,還有一類隨機的堿基刪除(smalldeletion)。我們認為這類隨機的堿基刪除(smalldeletion)是各斷裂末端(鈍斷裂末端c3和突出斷裂末端c4)在細胞修復系統(tǒng)的作用下隨機產(chǎn)生的,各斷裂末端以均等的概率來產(chǎn)生堿基刪除(smalldeletion),各斷裂末端在細胞修復系統(tǒng)的作用下所產(chǎn)生的堿基刪除(smalldeletion)的數(shù)量與各斷裂末端的數(shù)量成正比?;陔S機堿基刪除現(xiàn)象的存在,我們認為,經(jīng)過測序獲得的各斷裂末端的實測比例與其真實比例存在差距,需要進行修正還原,即以各種斷裂末端的實測比例之和為基準,計算各斷裂末端的比例,以此作為該斷裂末端的占比。即對cas9核酸酶的切割所產(chǎn)生的各斷裂末端的比例進行標準化計算,鈍斷裂末端c3的比例為9.75%【計算方法為:8.96%÷(8.96%+82.92%)】。突出斷裂末端c4的比例為90.25%【計算方法為:82.92%÷(8.96%+82.92%)】。亦即,cas9核酸酶在sgrna1的介導下對基因組dna片段進行的切割方式中,鈍末端切割的比例為9.75%,突出末端切割的比例為90.25%。如圖1e所示,根據(jù)cas9核酸酶在sgrna1和sgrna2的介導下分別對基因組dna片段進行切割的方式比例,預測產(chǎn)生的斷裂末端的序列,進而推算出dna片段反轉(zhuǎn)下游連接接頭處的堿基加入情況及比例。當cas9核酸酶在sgrna1的介導下對基因組dna片段進行突出末端切割,產(chǎn)生突出斷裂末端“c4”,cas9核酸酶在sgrna2的介導下對基因組dna片段進行鈍末端切割,產(chǎn)生鈍斷裂末端“e3”,則在細胞修復系統(tǒng)的作用下,dna片段反轉(zhuǎn)下游接頭處會出現(xiàn)“a”堿基的加入,且發(fā)生的比例為79.14%【計算方法為:“c4”突出斷裂末端占比(90.25%)x“e3”鈍斷裂末端占比(87.7%)=79.14%】,與實驗檢測到的dna片段反轉(zhuǎn)下游接頭處“a”堿基加入比例71.94%相近。當cas9核酸酶在sgrna1的介導下對基因組dna片段進行鈍末端切割,產(chǎn)生鈍斷裂末端“c3”,cas9核酸酶在sgrna2的介導下對基因組dna片段進行突出末端切割,產(chǎn)生突出斷裂末端“e4”,則在細胞修復系統(tǒng)的作用下,dna片段反轉(zhuǎn)下游接頭處會出現(xiàn)“g”堿基的加入,且發(fā)生的比例為1.19%【計算方法為:“c3”鈍斷裂末端占比(9.75%)x“e4”突出斷裂末端占比(12.3%)=1.19%】,與實驗檢測到的dna片段反轉(zhuǎn)下游接頭處“g”堿基加入比例8.54%相近。當cas9核酸酶在sgrna1的介導下對基因組dna片段進行突出末端切割,產(chǎn)生突出斷裂末端“c4”,cas9核酸酶在sgrna2的介導下對基因組dna片段進行突出末端切割,產(chǎn)生突出斷裂末端“e4”,則在細胞修復系統(tǒng)的作用下,dna片段反轉(zhuǎn)下游接頭處會出現(xiàn)“ag”堿基的加入,且發(fā)生的比例為11%【計算方法為:“c4”突出斷裂末端占比(90.25%)x“e4”突出斷裂末端占比(12.3%)=11%】,與實驗檢測到的dna片段反轉(zhuǎn)下游接頭處“ag”堿基加入比例3.66%相近。當cas9核酸酶在sgrna1的介導下對基因組dna片段進行鈍末端切割,產(chǎn)生鈍斷裂末端“c3”,cas9核酸酶在sgrna2的介導下對基因組dna片段進行鈍末端切割,產(chǎn)生鈍斷裂末端“e3”,則在細胞修復系統(tǒng)的作用下,dna片段反轉(zhuǎn)下游接頭精準連接,且發(fā)生的比例為8.55%【計算方法為:“c3”鈍斷裂末端占比(9.75%)x“e3”鈍斷裂末端占比(87.7%)=8.55%】,與實驗檢測到的dna片段反轉(zhuǎn)下游接頭精準連接比例6.67%相近。綜上所述,圖1e的實驗結(jié)果進一步證實了:cas9核酸酶對與sgrna非互補的dna鏈進行切割時,可在pam上游3bp處到更遠堿基處進行切割。cas9核酸酶在sgrna介導下對基因組dna片段進行切割時,有鈍末端切割和突出末端切割,進而產(chǎn)生不同斷裂末端。這些斷裂末端在細胞修復系統(tǒng)的作用下,產(chǎn)生與預期相符的精準dna片段編輯(特定堿基的精準編輯)或者與預期不符的基因編輯(隨機的堿基刪除)。如圖1f所示,sgrna組合中,sgrna的設計不同(靶序列不同),cas9核酸酶在sgrna的介導下對基因組dna片段進行切割方式比例不同,產(chǎn)生的斷裂末端比例不同。具體地,cas9核酸酶在sgrna1的介導下對基因組dna片段進行切割時,鈍末端切割方式的占比高于突出末端切割方式占比,產(chǎn)生的鈍斷裂末端占比高于5’突出斷裂末端占比。然而cas9核酸酶在sgrna2的介導下對基因組dna片段進行切割時,突出末端切割方式的占比高于鈍末端切割方式占比,產(chǎn)生的5’突出斷裂末端占比也高于鈍斷裂末端占比。由于發(fā)現(xiàn)cas9核酸酶在sgrna介導下對基因組dna片段進行切割的方式有鈍末端切割和突出末端切割,當cas9核酸酶在sgrna介導下對基因組dna片段進行突出末端切割,產(chǎn)生突出斷裂末端時,按照補平連接的方式可加入與突出斷裂末端互補的堿基,從而實現(xiàn)對基因組dna片段特定位置的堿基加入。實施例2突變spcas9獲得切割方式改變的特定cas9實現(xiàn)精準的dna片段編輯1.構建cas9突變體1)使用neb突變試劑盒(q5site-directedmutagenesiskit,#e0554s)構建cas9突變體,首先進行pcr擴增,反應如下:反應條件:2)kld(kinase,ligase&dpni)處理,反應如下:反應條件:室溫10分鐘3)將2)中的反應產(chǎn)物全部用于感受態(tài)細菌stbl3(50μl)的轉(zhuǎn)化,在含氨芐抗生素(amp,100mg/l)lb平板培養(yǎng)過夜,37℃。挑取單克隆,質(zhì)粒提取后送測序。spcas9(cas9wt)的氨基酸序列如seqidno.7所示,具體為:spcas9(cas9wt)的編碼核苷酸序列如seqidno.8所示,具體為:如圖2a所示,cas9核酸酶,含有ruvc和hnh功能域,ruvc功能域負責切割與sgrna非互補的dna鏈,hnh功能域負責切割與sgrna互補的dna鏈。本發(fā)明要求保護的cas9核酸酶突變體命名為cas9-r919p(將spcas9核酸酶第919位精氨酸突變成脯氨酸),cas9-r919p的氨基酸序列seqidno.9所示,具體為:cas9-r919p的編碼核苷酸序列如seqidno.10所示,具體為:此外,以對spcas9進行隨機突變獲得的突變體k775a、r778a、e779a、k918p作為對照,這些對照突變體與本發(fā)明的cas9-r919p的序列均不同。2.cas9核酸酶突變體進行dna片段編輯(1)針對β-globinre2(rrm21位點),構建rrm21位點(β-globinre2)的sgrnas。所述sgrnas靶向序列:β-globinre2sgrna1:acccaatgacctcaggctgt(seqidno.11);β-globinre2sgrna2:tcacttgttagcggcatctg(seqidno.12);從上海桑尼生物科技有限公司購買針對β-globinre2(rrm21位點)的sgrnas靶向序列的有5’懸掛端“accg”和“aaac”可以互補配對的正反向脫氧寡核苷酸。(2)獲得互補配對的帶有懸掛端的雙鏈dna1)用ddh2o將脫氧寡核苷酸溶解至100μm,并稀釋至20μm;2)將正反脫氧寡核苷酸加入如下反應體系:反應條件:95℃水浴,5min,然后打開水浴鍋蓋子溫度降至60℃左右,蓋上蓋子冷卻至室溫。(3)酶切pgl3-u6-sgrna-pgk-purovector1)用bsai限制性內(nèi)切酶酶切載體質(zhì)粒,反應體系如下:反應條件:37℃,1.5小時;2)膠回收純化dna酶切片段,按照膠回收試劑盒(axygen)說明純化。(4)連接酶切后的載體與帶有懸掛端的雙鏈dna連接體系如下:反應條件:室溫反應1.5小時;(5)轉(zhuǎn)化連接產(chǎn)物用stbl3感受態(tài)轉(zhuǎn)化連接產(chǎn)物,在含氨芐抗生素(amp,100mg/l)lb平板培養(yǎng)過夜,37℃。(6)挑取單克隆測序1)從氨芐抗生素lb平板上挑取單菌落,lb(amp,100mg/l)液體培養(yǎng)過夜;2)質(zhì)粒提取,按照質(zhì)粒小抽試劑盒(axygen)說明提??;3)提取后的質(zhì)粒送上海桑尼生物科技有限公司測序。(7)測序成功質(zhì)粒進行中抽1)測序成功的質(zhì)粒用stbl3感受態(tài)重新轉(zhuǎn)化,在含amp(100mg/l)的lb平板培養(yǎng)過夜;2)上午挑取單菌落在2mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)8小時,然后轉(zhuǎn)接到200mllb(amp,100mg/l)液體培養(yǎng)基中培養(yǎng)過夜;3)收集細菌,按照質(zhì)粒中抽試劑盒(qiagen)說明提取質(zhì)粒。(8)用lipofectamine2000進行細胞轉(zhuǎn)染1)hek293t細胞培養(yǎng)在培養(yǎng)瓶中,在37℃,含有5%co2細胞培養(yǎng)箱中培養(yǎng),待其長至培養(yǎng)瓶80~90%,將長好的細胞在12孔板中用dmem完全無抗培養(yǎng)基進行鋪板,過夜培養(yǎng);2)待12孔板中的細胞長至80~90%時,將制備好的cas9和cas9突變體質(zhì)粒(800ng)與針對rrm21位點的sgrnas質(zhì)粒(各600ng)通過lipofectamine2000進行細胞轉(zhuǎn)染,每個樣品各兩個重復。3)轉(zhuǎn)染后兩天,收集細胞,用基因組提取試劑盒(genomicdnapurificationkit,promega)提取基因組。(9)制備高通量測序文庫在dna片段預期刪除、反轉(zhuǎn)和重復接頭的精準連接位點上游大約30bp處設計引物,然后將引物5’端加上帶有barcode的illumina的測序接頭,下游引物可以設計在遠離拼接位點一些的位置并加上illumina的測序接頭,進行pcr擴增,然后使用羅氏pcr純化試劑盒(productno.:11732676001)進行純化,dna產(chǎn)物溶解在10mmtris-hclbuffer(ph=8.5),等量混合后形成庫,進行高通量測序。cas9突變引物:cas9-r919p-f:cttcatcaaaccccagcttgttgagacacg(seqidno.13);cas9-r919p-r:cctgctttatccaactcag(seqidno.14);(10)高通量測序數(shù)據(jù)處理高通量測序完成后,使用linux程序?qū)悠返臏y序結(jié)果從文庫中通過barcode分出來,保存在各自的文件夾,然后進行bwa-mem比對,比對后的序列通過varscan2程序(v2.3.9)分析dna片段的插入和刪除突變,varscan2程序參數(shù)如下:針對β-globinre2位點,利用高通量測序引物進行pcr擴增dna片段刪除、反轉(zhuǎn)和重復,建庫進行高通量測序。高通量引物:hiseq-rrm-1f3:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctatatggcatcctagccttaagaaactag(seqidno.15)hiseq-rrm-1r2:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatcttacgacgcaggagccgtatcatg(seqidno.16)hiseq-rrm-3f2:caagcagaagacggcatacgagataagctagtgactggagttcagacgtgtgctcttccgatctatagcaatgaaatcttgaaggagtg(seqidno.17)hiseq-rrm-3r2:caagcagaagacggcatacgagattcaagtgtgactggagttcagacgtgtgctcttccgatctgcacagccctgctctattacg(seqidno.18)。根據(jù)dna片段刪除和重復的連接接頭堿基加入情況,計算兩個sgrnas的切割方式比例。參照上述實施例1的方法,采用兩個sgrnas形成的sgrna組合及cas9核酸酶對基因組dna片段進行編輯后,可利用高通量測序技術檢測dna片段刪除和重復的連接接頭堿基加入情況,進而計算出cas9核酸酶在各sgrna介導下對基因組dna片段進行切割時,鈍末端切割方式和突出末端切割方式的占比。具體地,野生型spcas9核酸酶(簡稱cas9wt,wt)(圖2a)和r919p在sgrna組合中各sgrna介導下對基因組dna片段β-globinre2位點進行編輯的兩個sgrnas的示意圖如圖2b。如圖2c所示,利用高通量測序技術檢測dna片段重復連接接頭的情況,除了與預期相符的精準連接(joinedprecisely)以外,還存在與預期的精準連接相比,連接接頭處加入了“c”堿基和“gc”堿基的情況。選用不同的cas9核酸酶時,檢測到的與預期相符的精準連接(joinedprecisely)、“+c”堿基、“+gc”堿基的占比不同。以選用r919p這個cas9核酸酶為例,檢測到與預期相符的精準連接(joinedprecisely)的占比為64.73%,“+c”堿基的占比為3.27%,“+gc”堿基的占比為2.11%。鑒于dna片段重復連接接頭處檢測到存在“c”堿基的加入(與預期的精準連接相比),我們推測dna片段重復連接接頭處加入的“c”堿基是來源于模版dna(β-globinre2位點)上的pam(agg)上游4bp處的堿基。并且,進一步推測r919p這個cas9核酸酶在sgrna1的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,而對與sgrna非互補dna鏈進行切割時,則是在pam(agg)上游4bp處進行突出末端切割,從而產(chǎn)生了突出斷裂末端u4。突出斷裂末端u4在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段重復時,導致了dna片段重復連接接頭處“c”堿基的加入。同理,鑒于dna片段重復連接接頭處檢測到存在“gc”堿基的加入(與預期的精準連接相比),我們推測dna片段重復連接接頭處加入的“gc”堿基是來源于模版dna(β-globinre2位點)上的pam(agg)上游4bp處和5bp的堿基。進一步推測r919p這個cas9核酸酶在sgrna1的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,而對與sgrna非互補dna鏈進行切割時,是在pam(agg)上游5bp處進行突出末端切割,從而產(chǎn)生了突出斷裂末端u5。突出斷裂末端u5在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段重復時,導致了dna片段重復連接接頭處“gc”堿基的加入。而當r919p這個cas9核酸酶在sgrna1的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,對與sgrna非互補dna鏈進行切割時,是在pam(agg)上游3bp處進行鈍末端切割,從而產(chǎn)生了鈍斷裂末端u3。鈍斷裂末端u3在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段重復時,不會導致dna片段重復連接接頭處堿基的加入,而是產(chǎn)生與預期相符的精準連接(joinedprecisely)。因此,我們認為:在cas9核酸酶r919p的切割下,產(chǎn)生的斷裂末端中,鈍斷裂末端u3的占比=預期相符的精準連接(joinedprecisely)的比例=64.73%。突出斷裂末端u4的比例=“c”堿基的加入比例=3.27%。突出斷裂末端u5的比例=“gc”堿基的加入比例=2.11%。但是,我們觀察到,除了與預期相符的精準連接(joinedprecisely)、“c”堿基的加入、“gc”堿基的加入這三大類情況以外,還有一類隨機的堿基刪除(smalldeletion)。我們認為這類隨機的堿基刪除(smalldeletion)是各斷裂末端(鈍斷裂末端u3/突出斷裂末端u4/突出斷裂末端u5)在細胞修復系統(tǒng)的作用下隨機產(chǎn)生的,各斷裂末端以均等的概率來產(chǎn)生堿基刪除(smalldeletion),各斷裂末端在細胞修復系統(tǒng)的作用下所產(chǎn)生的堿基刪除(smalldeletion)的數(shù)量與各斷裂末端的數(shù)量成正比?;陔S機堿基刪除現(xiàn)象的存在,我們認為,經(jīng)過測序獲得的各斷裂末端的實測比例與其真實比例存在差距,需要進行修正還原,即以各種斷裂末端的實測比例之和為基準,計算各斷裂末端的比例,以此作為該斷裂末端的占比。即對cas9核酸酶r919p的切割所產(chǎn)生的各斷裂末端的占比進行標準化計算,鈍斷裂末端u3的占比為92.32%【計算方法為:64.73%÷(64.73%+3.27%+2.11%)】。突出斷裂末端u4的比例為4.66%【計算方法為:3.27%÷(64.73%+3.27%+2.11%)】。突出斷裂末端u5的比例為3.01%【計算方法為:2.11%÷(64.73%+3.27%+2.11%)】。亦即,cas9核酸酶r919p在sgrna1的介導下對基因組dna片段進行的切割方式中,u3鈍末端切割的比例為92.32%,u4突出末端切割的比例為4.66%,u5突出末端切割的比例為3.01%。參照上述方法,再計算野生型cas9核酸酶(簡稱cas9wt,wt)在sgrna1的介導下對基因組dna片段進行的切割方式中,u3鈍末端切割的占比x1、u4突出末端切割x2、u5突出末端切割的占比x3。結(jié)果,如圖2d和下表2-1所示:表2-1可見,在sgrna1的介導下,相比于spcas9核酸酶(cas9wt),r919p這個cas9核酸酶突變體對與sgrna1非互補的dna鏈進行切割時,在pam上游5bp處進行切割的比例明顯提高(u5),在pam上游3bp和4bp處進行切割的比例減少(u3、u4)。如圖2e所示,利用高通量測序技術檢測dna片段刪除連接接頭的情況,除了與預期相符的精準連接(joinedprecisely)以外,還存在與預期的精準連接相比,刪除連接接頭處加入了“t”堿基、“at”堿基、“cat”堿基的情況。選用不同的cas9核酸酶時,檢測到的與預期相符的精準連接(joinedprecisely)、“+t”堿基、“+at”堿基、“+cat”堿基的占比不同。以選用r919p這個cas9核酸酶為例,檢測到與預期相符的精準連接(joinedprecisely)的占比為13.56%,“+t”堿基的占比為15.31%,“+at”堿基的占比為12.69%,“+cat”堿基的占比為2.50%。鑒于dna片段刪除連接接頭處檢測到存在“t”堿基的加入(與預期的精準連接相比),我們推測dna片段刪除連接接頭處加入的“t”堿基是來源于模版dna(β-globinre2位點)上的pam(tgg)上游4bp處的堿基。并且,進一步推測r919p這個cas9核酸酶在sgrna2的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,而對與sgrna非互補dna鏈進行切割時,則是在pam(tgg)上游4bp處進行突出末端切割,從而產(chǎn)生了突出斷裂末端d4。突出斷裂末端d4在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,導致了dna片段刪除連接接頭處“t”堿基的加入。同理,鑒于dna片段刪除連接接頭處檢測到存在“at”堿基的加入(與預期的精準連接相比),我們推測dna片段刪除連接接頭處加入的“at”堿基是來源于模版dna(β-globinre2位點)上的pam(tgg)上游4bp和5bp處的堿基。進一步推測r919p這個cas9核酸酶在sgrna2的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,而對與sgrna非互補dna鏈進行切割時,是在pam(tgg)上游5bp處進行突出末端切割,從而產(chǎn)生了突出斷裂末端d5。突出斷裂末端d5在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,導致了dna片段刪除連接接頭處“at”堿基的加入。同理,鑒于dna片段刪除連接接頭處檢測到存在“cat”堿基的加入(與預期的精準連接相比),我們推測dna片段刪除連接接頭處加入的“cat”堿基是來源于模版dna(β-globinre2位點)上的pam(tgg)上游4bp、5bp、6bp處的堿基。進一步推測r919p這個cas9核酸酶在sgrna2的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,而對與sgrna非互補dna鏈進行切割時,是在pam(tgg)上游6bp處進行突出末端切割,從而產(chǎn)生了突出斷裂末端d6。突出斷裂末端d5在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,導致了dna片段刪除連接接頭處“cat”堿基的加入。而當r919p這個cas9核酸酶在sgrna2的介導下對基因組dna片段(β-globinre2位點)進行切割時,對與sgrna互補的dna鏈進行切割時,是在pam上游3bp處進行切割,對與sgrna非互補dna鏈進行切割時,是在pam(tgg)上游3bp處進行鈍末端切割,從而產(chǎn)生了鈍斷裂末端d3。鈍斷裂末端d3在細胞修復系統(tǒng)的作用下產(chǎn)生dna片段刪除時,不會導致dna片段刪除連接接頭處堿基的加入,而是產(chǎn)生與預期相符的精準連接(joinedprecisely)。因此,我們認為:在cas9核酸酶r919p的切割下,產(chǎn)生的斷裂末端中,鈍斷裂末端d3的占比=預期相符的精準連接(joinedprecisely)的占比=13.56%。突出斷裂末端d4的占比=“t”堿基的加入占比=15.31%。突出斷裂末端d5的占比=“at”堿基的加入占比=12.69%。突出斷裂末端d6的占比=“cat”堿基的加入占比=2.50%。但是,我們觀察到,除了與預期相符的精準連接(joinedprecisely)、dna片段刪除連接接頭處加入了“t”堿基、“+at”堿基、“+cat”堿基這四大類情況以外,還有一類隨機的堿基刪除(smalldeletion)。我們認為這類隨機的堿基刪除(smalldeletion)是各斷裂末端(鈍斷裂末端d3/突出斷裂末端d4/突出斷裂末端d5/突出斷裂末端d6)在細胞修復系統(tǒng)的作用下隨機產(chǎn)生的,各斷裂末端以均等的概率來產(chǎn)生堿基刪除(smalldeletion),各斷裂末端在細胞修復系統(tǒng)的作用下所產(chǎn)生的堿基刪除(smalldeletion)的數(shù)量與各斷裂末端的數(shù)量成正比?;陔S機堿基刪除現(xiàn)象的存在,我們認為,經(jīng)過測序獲得的各斷裂末端的實測比例與其真實比例存在差距,需要進行修正還原,即以各種斷裂末端的實測比例之和為基準,計算各斷裂末端的比例,以此作為該斷裂末端的占比。即對cas9核酸酶r919p的切割所產(chǎn)生的各斷裂末端的占比進行標準化計算,鈍斷裂末端d3的占比為30.78%【計算方法為:13.56%÷(13.56%+15.31%+12.69%+2.50%)】。突出斷裂末端d4的比例為34.75%【計算方法為:15.31%÷(13.56%+15.31%+12.69%+2.50%)】。突出斷裂末端d5的比例為28.80%【計算方法為:12.69%÷(13.56%+15.31%+12.69%+2.50%)】。突出斷裂末端d6的比例為5.67%【計算方法為:2.50%÷(13.56%+15.31%+12.69%+2.50%)】。亦即,cas9核酸酶r919p在sgrna2的介導下對基因組dna片段進行的切割方式中,d3鈍末端切割的占比為30.78%,d4突出末端切割的占比為34.75%,d5突出末端切割的占比為28.80%,d6突出末端切割的占比為5.67%。參照上述方法,計算出野生型cas9核酸酶在sgrna2的介導下對基因組dna片段進行的切割方式中,d3鈍末端切割的占比y1、d4突出末端切割的占比y2、d5突出末端切割的占比y3、d6突出末端切割的占比y4。結(jié)果如圖2f和表2-2所示:表2-2可見,在sgrna2的介導下,相比于spcas9核酸酶(cas9wt),r919p突變體對基因組dna片段中與sgrna2非互補的dna鏈進行切割時,在pam上游3bp處進行切割的比例明顯提高(d3),在pam上游4bp處進行切割的比例明顯提高(d4)。參照實施例1的方法,根據(jù)cas9核酸酶在sgrna1和sgrna2的介導下分別對基因組dna片段進行切割的方式比例,預測產(chǎn)生的斷裂末端的序列,進而推算出dna片段反轉(zhuǎn)下游連接接頭處的堿基加入情況及比例。結(jié)果如圖2g所示,推算結(jié)果與實驗檢測到的堿基加入比例相近。更進一步證實了cas9核酸酶在sgrna組合的介導下,可以在pam上游3bp處到更遠堿基處切割非互補dna鏈。此外,還將本發(fā)明的cas9核酸酶突變體cas9-r919p及對照突變體k775a、r778a、e779a、k918p與針對stm位點(β-globinre1)的兩個sgrnas一起轉(zhuǎn)染人胚腎hek293t細胞,轉(zhuǎn)染48小時后收集基因組dna,利用高通量測序引物進行pcr擴增dna片段刪除、反轉(zhuǎn)和重復,建庫進行高通量測序。根據(jù)dna片段刪除和重復的連接接頭堿基加入情況,計算這些突變體在兩個sgrnas的切割方式比例。針對stm位點(β-globinre1)的sgrnas靶向序列:β-globinre1sgrna1:gattgttgttgccttggagtg(seqidno.19);β-globinre1sgrna2:gctggtcccctggtaacctgg(seqidno.20);正反向脫氧寡核苷酸:β-globinre1sgrna1f:accgattgttgttgccttggagtg(seqidno.21);β-globinre1sgrna1r:aaaccactccaaggcaacaacaat(seqidno.22);β-globinre1sgrna2f:accgctggtcccctggtaacctgg(seqidno.23);β-globinre1sgrna2r:aaacccaggttaccaggggaccag(seqidno.24);高通量引物:hiseq-hstm-af1:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatcttgcttagagccaggactaattgc(seqidno.25);hiseq-hstm-ar2:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatcttgggtgtagaaatgagcaaataagt(seqidno.26);hiseq-hstm-2f:caagcagaagacggcatacgagatgatcgtgtgactggagttcagacgtgtgctcttccgatctagattgagttctgtttgtttcatctac(seqidno.27);hiseq-hstm-2r:caagcagaagacggcatacgagatagtcaagtgactggagttcagacgtgtgctcttccgatctcagctctgcctgaaaggagtc(seqidno.28)。如圖3a和3b所示,與野生型spcas9核酸酶(簡稱cas9wt)相比,對照突變體k775a、r778a、e779a和k918p在sgrna1和sgrna2的介導下對基因組dna片段進行切割的方式?jīng)]有明顯的改變;而cas9核酸酶突變體cas9-r919p與野生型spcas9核酸酶(簡稱cas9wt)相比,在sgrna1和sgrna2的介導下對基因組dna片段進行切割的方式發(fā)生了明顯的改變。綜上所述,本發(fā)明的cas9核酸酶(cas9-r919p)與野生型cas9核酸酶相比,對目的基因組dna片段進行切割時產(chǎn)生的突出斷裂末端與鈍斷裂末端的比例不同。采用本發(fā)明的cas9核酸酶(cas9-r919p)可以實現(xiàn)對對目的基因組dna片段特定位置的切割并產(chǎn)生突出斷裂末端,以補平連接的方式可加入與突出斷裂末端互補的堿基,進而可實現(xiàn)特定位置的精準dna片段編輯。本申請的參考文獻如下:1.stamatoyannopoulos,ja.(2012).whatdoesourgenomeencode?genomeres,22:1602-1611.2.theencodeprojectconsortium.(2012).anintegratedencyclopediaofdnaelementsinthehumangenome.nature,489:57-74.3.banerji,j,lolson,andwschaffner.(1983).alymphocyte-specificcellularenhancerislocateddownstreamofthejoiningregioninimmunoglobulinheavychaingenes.cell,33:729-740.4.zhang,t,phaws,andqwu.(2004).multiplevariablefirstexons:amechanismforcell-andtissue-specificgeneregulation.genomeres,14:79-89.5.neph,s,etal.(2012).anexpansivehumanregulatorylexiconencodedintranscriptionfactorfootprints.nature,489:83-90.6.shen,y,etal.(2012).amapofthecis-regulatorysequencesinthemousegenome.nature,488:116-120.7.thurman,re,etal.(2012).theaccessiblechromatinlandscapeofthehumangenome.nature,489:75-82.8.delaat,wanddduboule.(2013).topologyofmammaliandevelopmentalenhancersandtheirregulatorylandscapes.nature,502:499-506.9.mcclintock,b.(1950).theoriginandbehaviorofmutablelociinmaize.procnatlacadsciusa,36:344-355.10.mcclintock,b.(1984).thesignificanceofresponsesofthegenometochallenge.science,226:792-801.11.brinster,rl,etal.(1981).somaticexpressionofherpesthymidinekinaseinmicefollowinginjectionofafusiongeneintoeggs.cell,27:223-231.12.harbers,k,djahner,andrjaenisch.(1981).microinjectionofclonedretroviralgenomesintomousezygotes:integrationandexpressionintheanimal.nature,293:540-542.13.gordon,jw,etal.(1980).genetictransformationofmouseembryosbymicroinjectionofpurifieddna.procnatlacadsciusa,77:7380-7384.14.palmiter,rd,etal.(1982).dramaticgrowthofmicethatdevelopfromeggsmicroinjectedwithmetallothionein-growthhormonefusiongenes.nature,300:611-615.15.capecchi,mr.(2005).genetargetinginmice:functionalanalysisofthemammaliangenomeforthetwenty-firstcentury.natrevgenet,6:507-512.16.carroll,d.(2014).genomeengineeringwithtargetablenucleases.annurevbiochem,83:409-439.17.smithies,o,etal.(1985).insertionofdnasequencesintothehumanchromosomalbeta-globinlocusbyhomologousrecombination.nature,317:230-234.18.thomas,krandmrcapecchi.(1986).introductionofhomologousdnasequencesintomammaliancellsinducesmutationsinthecognategene.nature,324:34-38.19.zheng,b,etal.(2000).engineeringmousechromosomeswithcre-loxp:range,efficiency,andsomaticapplications.molcellbiol,20:648-655.20.wu,s,etal.(2007).towardsimplerandfastergenome-widemutagenesisinmice.natgenet,39:922-930.21.gupta,a,etal.(2013).targetedchromosomaldeletionsandinversionsinzebrafish.genomeres,23:1008-1017.22.xiao,a,etal.(2013).chromosomaldeletionsandinversionsmediatedbytalensandcrispr/casinzebrafish.nucleicacidsres,41:e141.23.kraft,k,etal.(2015).deletions,inversions,duplications:engineeringofstructuralvariantsusingcrispr/casinmice.cellrep,10:833-839.24.wu,s,etal.(2008).aprotocolforconstructinggenetargetingvectors:generatingknockoutmiceforthecadherinfamilyandbeyond.natureprotocol,3:1056-1076.25.jinek,m,etal.(2012).aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science,337:816-821.26.cong,l,etal.(2013).multiplexgenomeengineeringusingcrispr/cassystems.science,339:819-823.27.mali,p,etal.(2013).rna-guidedhumangenomeengineeringviacas9.science,339:823-826.28.li,j,etal.(2015).efficientinversionsandduplicationsofmammalianregulatorydnaelementsandgeneclustersbycrispr/cas9.jmolcellbiol,7:284-298.29.sartori,aa,etal.(2007).humanctippromotesdnaendresection.nature,450:509-514.30.anand,r,etal.(2016).phosphorylatedctipfunctionsasaco-factorofthemre11-rad50-nbs1endonucleaseindnaendresection.molcell,64:940-950.31.li,j,jshou,andqwu.(2015).dnafragmenteditingofgenomesbycrispr/cas9.hereditas,37:992-1002.32.huang,handqwu.(2016).crisprdoublecuttingthroughthelabyrinthinearchitectureof3dgenomes.jgenetgenomics,43:273-288.33.guo,y,etal.(2015).crisprinversionofctcfsitesaltersgenometopologyandenhancer/promoterfunction.cell,162:900-910.以上所述,僅為本發(fā)明的較佳實施例,并非對本發(fā)明任何形式上和實質(zhì)上的限制,應當指出,對于本
技術領域:
:的普通技術人員,在不脫離本發(fā)明方法的前提下,還將可以做出若干改進和補充,這些改進和補充也應視為本發(fā)明的保護范圍。凡熟悉本專業(yè)的技術人員,在不脫離本發(fā)明的精神和范圍的情況下,當可利用以上所揭示的技術內(nèi)容而做出的些許更動、修飾與演變的等同變化,均為本發(fā)明的等效實施例;同時,凡依據(jù)本發(fā)明的實質(zhì)技術對上述實施例所作的任何等同變化的更動、修飾與演變,均仍屬于本發(fā)明的技術方案的范圍內(nèi)。sequencelisting<110>上海交通大學<120>一種cas9核酸酶r919p及其用途<130>171288<160>28<170>patentinversion3.3<210>1<211>20<212>dna<213>artificial<220><223>hs51re1sgrna1<400>1gccacacatccaaggctgac20<210>2<211>21<212>dna<213>artificial<220><223>hs51re1sgrna2<400>2gagatttggggcgtcaggaag21<210>3<211>77<212>dna<213>artificial<220><223>hiseq-hhs51-af<400>3atgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctgca60aggagatccgtgtcgtc77<210>4<211>82<212>dna<213>artificial<220><223>hiseq-hs51-ara<400>4aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctaa60ggatgttgtggaaggcgagcag82<210>5<211>87<212>dna<213>artificial<220><223>hiseq-hs51-bfa<400>5caagcagaagacggcatacgagatggacgggtgactggagttcagacgtgtgctcttccg60atctctttacatgacagcttccggtag87<210>6<211>89<212>dna<213>artificial<220><223>hiseq-hhs51-br<400>6caagcagaagacggcatacgagatttgactgtgactggagttcagacgtgtgctcttccg60atcttttttggctaacaacatagtgcttc89<210>7<211>1401<212>prt<213>artificial<220><223>spcas9<400>7metalaprolyslyslysarglysvalglyilehisglyvalproala151015alametasplyslystyrserileglyleuaspileglythrasnser202530valglytrpalavalilethraspglutyrlysvalproserlyslys354045phelysvalleuglyasnthrasparghisserilelyslysasnleu505560ileglyalaleuleupheaspserglygluthralaglualathrarg65707580leulysargthralaargargargtyrthrargarglysasnargile859095cystyrleuglngluilepheserasnglumetalalysvalaspasp100105110serphephehisargleuglugluserpheleuvalglugluasplys115120125lyshisgluarghisproilepheglyasnilevalaspgluvalala130135140tyrhisglulystyrprothriletyrhisleuarglyslysleuval145150155160aspserthrasplysalaaspleuargleuiletyrleualaleuala165170175hismetilelyspheargglyhispheleuilegluglyaspleuasn180185190proaspasnseraspvalasplysleupheileglnleuvalglnthr195200205tyrasnglnleupheglugluasnproileasnalaserglyvalasp210215220alalysalaileleuseralaargleuserlysserargargleuglu225230235240asnleuilealaglnleuproglyglulyslysasnglyleuphegly245250255asnleuilealaleuserleuglyleuthrproasnphelysserasn260265270pheaspleualagluaspalalysleuglnleuserlysaspthrtyr275280285aspaspaspleuaspasnleuleualaglnileglyaspglntyrala290295300aspleupheleualaalalysasnleuseraspalaileleuleuser305310315320aspileleuargvalasnthrgluilethrlysalaproleuserala325330335sermetilelysargtyraspgluhishisglnaspleuthrleuleu340345350lysalaleuvalargglnglnleuproglulystyrlysgluilephe355360365pheaspglnserlysasnglytyralaglytyrileaspglyglyala370375380serglnglugluphetyrlyspheilelysproileleuglulysmet385390395400aspglythrglugluleuleuvallysleuasnarggluaspleuleu405410415arglysglnargthrpheaspasnglyserileprohisglnilehis420425430leuglygluleuhisalaileleuargargglngluaspphetyrpro435440445pheleulysaspasnargglulysileglulysileleuthrphearg450455460ileprotyrtyrvalglyproleualaargglyasnserargpheala465470475480trpmetthrarglysserglugluthrilethrprotrpasnpheglu485490495gluvalvalasplysglyalaseralaglnserpheilegluargmet500505510thrasnpheasplysasnleuproasnglulysvalleuprolyshis515520525serleuleutyrglutyrphethrvaltyrasngluleuthrlysval530535540lystyrvalthrgluglymetarglysproalapheleuserglyglu545550555560glnlyslysalailevalaspleuleuphelysthrasnarglysval565570575thrvallysglnleulysgluasptyrphelyslysileglucysphe580585590aspservalgluileserglyvalgluaspargpheasnalaserleu595600605glythrtyrhisaspleuleulysileilelysasplysasppheleu610615620aspasnglugluasngluaspileleugluaspilevalleuthrleu625630635640thrleuphegluaspargglumetileglugluargleulysthrtyr645650655alahisleupheaspasplysvalmetlysglnleulysargargarg660665670tyrthrglytrpglyargleuserarglysleuileasnglyilearg675680685asplysglnserglylysthrileleuasppheleulysseraspgly690695700phealaasnargasnphemetglnleuilehisaspaspserleuthr705710715720phelysgluaspileglnlysalaglnvalserglyglnglyaspser725730735leuhisgluhisilealaasnleualaglyserproalailelyslys740745750glyileleuglnthrvallysvalvalaspgluleuvallysvalmet755760765glyarghislysprogluasnilevalileglumetalaarggluasn770775780glnthrthrglnlysglyglnlysasnserarggluargmetlysarg785790795800ileglugluglyilelysgluleuglyserglnileleulysgluhis805810815provalgluasnthrglnleuglnasnglulysleutyrleutyrtyr820825830leuglnasnglyargaspmettyrvalaspglngluleuaspileasn835840845argleuserasptyraspvalasphisilevalproglnserpheleu850855860lysaspaspserileaspasnlysvalleuthrargserasplysasn865870875880argglylysseraspasnvalproserglugluvalvallyslysmet885890895lysasntyrtrpargglnleuleuasnalalysleuilethrglnarg900905910lyspheaspasnleuthrlysalagluargglyglyleusergluleu915920925asplysalaglypheilelysargglnleuvalgluthrargglnile930935940thrlyshisvalalaglnileleuaspserargmetasnthrlystyr945950955960aspgluasnasplysleuilearggluvallysvalilethrleulys965970975serlysleuvalseraspphearglysasppheglnphetyrlysval980985990arggluileasnasntyrhishisalahisaspalatyrleuasnala99510001005valvalglythralaleuilelyslystyrprolysleugluser101010151020gluphevaltyrglyasptyrlysvaltyraspvalarglysmet102510301035ilealalyssergluglngluileglylysalathralalystyr104010451050phephetyrserasnilemetasnphephelysthrgluilethr105510601065leualaasnglygluilearglysargproleuilegluthrasn107010751080glygluthrglygluilevaltrpasplysglyargasppheala108510901095thrvalarglysvalleusermetproglnvalasnilevallys110011051110lysthrgluvalglnthrglyglypheserlysgluserileleu111511201125prolysargasnserasplysleuilealaarglyslysasptrp113011351140aspprolyslystyrglyglypheaspserprothrvalalatyr114511501155servalleuvalvalalalysvalglulysglylysserlyslys116011651170leulysservallysgluleuleuglyilethrilemetgluarg117511801185serserpheglulysasnproileasppheleuglualalysgly119011951200tyrlysgluvallyslysaspleuileilelysleuprolystyr120512101215serleuphegluleugluasnglyarglysargmetleualaser122012251230alaglygluleuglnlysglyasngluleualaleuproserlys123512401245tyrvalasnpheleutyrleualaserhistyrglulysleulys125012551260glyserprogluaspasngluglnlysglnleuphevalglugln126512701275hislyshistyrleuaspgluileilegluglnilesergluphe128012851290serlysargvalileleualaaspalaasnleuasplysvalleu129513001305seralatyrasnlyshisargasplysproilearggluglnala131013151320gluasnileilehisleuphethrleuthrasnleuglyalapro132513301335alaalaphelystyrpheaspthrthrileasparglysargtyr134013451350thrserthrlysgluvalleuaspalathrleuilehisglnser135513601365ilethrglyleutyrgluthrargileaspleuserglnleugly137013751380glyasplysargproalaalathrlyslysalaglyglnalalys138513901395lyslyslys1400<210>8<211>4206<212>dna<213>artificial<220><223>spcas9<400>8atggccccaaagaagaagcggaaggtcggtatccacggtgtcccagcagccatggacaag60aagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtcattacggac120gagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcata180aagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcgg240ctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcag300gagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggag360tcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtg420gacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgta480gacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaa540tttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaa600ctctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgca660tccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaa720aacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgcc780ctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaag840cttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggc900gaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagt960gatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaag1020cgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactg1080cctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacatt1140gacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatg1200gacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgc1260actttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatactc1320aggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatc1380ctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcg1440tggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggat1500aagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcct1560aacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgag1620ctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagag1680cagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacag1740ctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtg1800gaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagac1860aaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcaccctt1920acgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttc1980gacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtca2040agaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttctt2100aagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacc2160tttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcac2220atcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtc2280gtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatg2340gcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagagg2400attgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaac2460acccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtac2520gtggatcaggaactggacatcaatcggctctccgactacgacgtggatcatatcgtgccc2580cagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaat2640agagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattgg2700cggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggct2760gaacgaggtggcctgtctgagttggataaagcaggcttcatcaaaaggcagcttgttgag2820acacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtac2880gatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtc2940tcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccat3000gcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaag3060cttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgca3120aagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatg3180aattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatc3240gaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtc3300cggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccgga3360ggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaa3420aaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgta3480ctggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactg3540ctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgag3600gcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctc3660tttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggt3720aacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaa3780aagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaa3840cactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgcc3900gacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagg3960gagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagcc4020ttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctg4080gacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctct4140cagctcggtggagacaagcgtcctgctgctactaagaaagctggtcaagctaagaaaaag4200aaataa4206<210>9<211>1401<212>prt<213>artificial<220><223>cas9-r919p<400>9metalaprolyslyslysarglysvalglyilehisglyvalproala151015alametasplyslystyrserileglyleuaspileglythrasnser202530valglytrpalavalilethraspglutyrlysvalproserlyslys354045phelysvalleuglyasnthrasparghisserilelyslysasnleu505560ileglyalaleuleupheaspserglygluthralaglualathrarg65707580leulysargthralaargargargtyrthrargarglysasnargile859095cystyrleuglngluilepheserasnglumetalalysvalaspasp100105110serphephehisargleuglugluserpheleuvalglugluasplys115120125lyshisgluarghisproilepheglyasnilevalaspgluvalala130135140tyrhisglulystyrprothriletyrhisleuarglyslysleuval145150155160aspserthrasplysalaaspleuargleuiletyrleualaleuala165170175hismetilelyspheargglyhispheleuilegluglyaspleuasn180185190proaspasnseraspvalasplysleupheileglnleuvalglnthr195200205tyrasnglnleupheglugluasnproileasnalaserglyvalasp210215220alalysalaileleuseralaargleuserlysserargargleuglu225230235240asnleuilealaglnleuproglyglulyslysasnglyleuphegly245250255asnleuilealaleuserleuglyleuthrproasnphelysserasn260265270pheaspleualagluaspalalysleuglnleuserlysaspthrtyr275280285aspaspaspleuaspasnleuleualaglnileglyaspglntyrala290295300aspleupheleualaalalysasnleuseraspalaileleuleuser305310315320aspileleuargvalasnthrgluilethrlysalaproleuserala325330335sermetilelysargtyraspgluhishisglnaspleuthrleuleu340345350lysalaleuvalargglnglnleuproglulystyrlysgluilephe355360365pheaspglnserlysasnglytyralaglytyrileaspglyglyala370375380serglnglugluphetyrlyspheilelysproileleuglulysmet385390395400aspglythrglugluleuleuvallysleuasnarggluaspleuleu405410415arglysglnargthrpheaspasnglyserileprohisglnilehis420425430leuglygluleuhisalaileleuargargglngluaspphetyrpro435440445pheleulysaspasnargglulysileglulysileleuthrphearg450455460ileprotyrtyrvalglyproleualaargglyasnserargpheala465470475480trpmetthrarglysserglugluthrilethrprotrpasnpheglu485490495gluvalvalasplysglyalaseralaglnserpheilegluargmet500505510thrasnpheasplysasnleuproasnglulysvalleuprolyshis515520525serleuleutyrglutyrphethrvaltyrasngluleuthrlysval530535540lystyrvalthrgluglymetarglysproalapheleuserglyglu545550555560glnlyslysalailevalaspleuleuphelysthrasnarglysval565570575thrvallysglnleulysgluasptyrphelyslysileglucysphe580585590aspservalgluileserglyvalgluaspargpheasnalaserleu595600605glythrtyrhisaspleuleulysileilelysasplysasppheleu610615620aspasnglugluasngluaspileleugluaspilevalleuthrleu625630635640thrleuphegluaspargglumetileglugluargleulysthrtyr645650655alahisleupheaspasplysvalmetlysglnleulysargargarg660665670tyrthrglytrpglyargleuserarglysleuileasnglyilearg675680685asplysglnserglylysthrileleuasppheleulysseraspgly690695700phealaasnargasnphemetglnleuilehisaspaspserleuthr705710715720phelysgluaspileglnlysalaglnvalserglyglnglyaspser725730735leuhisgluhisilealaasnleualaglyserproalailelyslys740745750glyileleuglnthrvallysvalvalaspgluleuvallysvalmet755760765glyarghislysprogluasnilevalileglumetalaarggluasn770775780glnthrthrglnlysglyglnlysasnserarggluargmetlysarg785790795800ileglugluglyilelysgluleuglyserglnileleulysgluhis805810815provalgluasnthrglnleuglnasnglulysleutyrleutyrtyr820825830leuglnasnglyargaspmettyrvalaspglngluleuaspileasn835840845argleuserasptyraspvalasphisilevalproglnserpheleu850855860lysaspaspserileaspasnlysvalleuthrargserasplysasn865870875880argglylysseraspasnvalproserglugluvalvallyslysmet885890895lysasntyrtrpargglnleuleuasnalalysleuilethrglnarg900905910lyspheaspasnleuthrlysalagluargglyglyleusergluleu915920925asplysalaglypheilelysproglnleuvalgluthrargglnile930935940thrlyshisvalalaglnileleuaspserargmetasnthrlystyr945950955960aspgluasnasplysleuilearggluvallysvalilethrleulys965970975serlysleuvalseraspphearglysasppheglnphetyrlysval980985990arggluileasnasntyrhishisalahisaspalatyrleuasnala99510001005valvalglythralaleuilelyslystyrprolysleugluser101010151020gluphevaltyrglyasptyrlysvaltyraspvalarglysmet102510301035ilealalyssergluglngluileglylysalathralalystyr104010451050phephetyrserasnilemetasnphephelysthrgluilethr105510601065leualaasnglygluilearglysargproleuilegluthrasn107010751080glygluthrglygluilevaltrpasplysglyargasppheala108510901095thrvalarglysvalleusermetproglnvalasnilevallys110011051110lysthrgluvalglnthrglyglypheserlysgluserileleu111511201125prolysargasnserasplysleuilealaarglyslysasptrp113011351140aspprolyslystyrglyglypheaspserprothrvalalatyr114511501155servalleuvalvalalalysvalglulysglylysserlyslys116011651170leulysservallysgluleuleuglyilethrilemetgluarg117511801185serserpheglulysasnproileasppheleuglualalysgly119011951200tyrlysgluvallyslysaspleuileilelysleuprolystyr120512101215serleuphegluleugluasnglyarglysargmetleualaser122012251230alaglygluleuglnlysglyasngluleualaleuproserlys123512401245tyrvalasnpheleutyrleualaserhistyrglulysleulys125012551260glyserprogluaspasngluglnlysglnleuphevalglugln126512701275hislyshistyrleuaspgluileilegluglnilesergluphe128012851290serlysargvalileleualaaspalaasnleuasplysvalleu129513001305seralatyrasnlyshisargasplysproilearggluglnala131013151320gluasnileilehisleuphethrleuthrasnleuglyalapro132513301335alaalaphelystyrpheaspthrthrileasparglysargtyr134013451350thrserthrlysgluvalleuaspalathrleuilehisglnser135513601365ilethrglyleutyrgluthrargileaspleuserglnleugly137013751380glyasplysargproalaalathrlyslysalaglyglnalalys138513901395lyslyslys1400<210>10<211>4206<212>dna<213>artificial<220><223>cas9-r919p<400>10atggccccaaagaagaagcggaaggtcggtatccacggtgtcccagcagccatggacaag60aagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtcattacggac120gagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcata180aagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcgg240ctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcag300gagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggag360tcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtg420gacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgta480gacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaa540tttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaa600ctctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgca660tccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaa720aacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgcc780ctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaag840cttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggc900gaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagt960gatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaag1020cgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactg1080cctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacatt1140gacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatg1200gacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgc1260actttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatactc1320aggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatc1380ctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcg1440tggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggat1500aagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcct1560aacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgag1620ctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagag1680cagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacag1740ctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtg1800gaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagac1860aaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcaccctt1920acgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttc1980gacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtca2040agaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttctt2100aagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacc2160tttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcac2220atcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtc2280gtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatg2340gcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagagg2400attgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaac2460acccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtac2520gtggatcaggaactggacatcaatcggctctccgactacgacgtggatcatatcgtgccc2580cagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaat2640agagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattgg2700cggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggct2760gaacgaggtggcctgtctgagttggataaagcaggcttcatcaaaccccagcttgttgag2820acacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtac2880gatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtc2940tcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccat3000gcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaag3060cttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgca3120aagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatg3180aattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatc3240gaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtc3300cggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccgga3360ggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaa3420aaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgta3480ctggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactg3540ctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgag3600gcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctc3660tttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggt3720aacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaa3780aagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaa3840cactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgcc3900gacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagg3960gagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagcc4020ttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctg4080gacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctct4140cagctcggtggagacaagcgtcctgctgctactaagaaagctggtcaagctaagaaaaag4200aaataa4206<210>11<211>20<212>dna<213>artificial<220><223>β-globinre2sgrna1<400>11acccaatgacctcaggctgt20<210>12<211>20<212>dna<213>artificial<220><223>β-globinre2sgrna2<400>12tcacttgttagcggcatctg20<210>13<211>30<212>dna<213>artificial<220><223>cas9-r919p-f<400>13cttcatcaaaccccagcttgttgagacacg30<210>14<211>19<212>dna<213>artificial<220><223>cas9-r919p-r<400>14cctgctttatccaactcag19<210>15<211>86<212>dna<213>artificial<220><223>hiseq-rrm-1f3<400>15aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctat60atggcatcctagccttaagaaactag86<210>16<211>81<212>dna<213>artificial<220><223>hiseq-rrm-1r2<400>16aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctta60cgacgcaggagccgtatcatg81<210>17<211>89<212>dna<213>artificial<220><223>hiseq-rrm-3f2<400>17caagcagaagacggcatacgagataagctagtgactggagttcagacgtgtgctcttccg60atctatagcaatgaaatcttgaaggagtg89<210>18<211>85<212>dna<213>artificial<220><223>hiseq-rrm-3r2<400>18caagcagaagacggcatacgagattcaagtgtgactggagttcagacgtgtgctcttccg60atctgcacagccctgctctattacg85<210>19<211>21<212>dna<213>artificial<220><223>β-globinre1sgrna1<400>19gattgttgttgccttggagtg21<210>20<211>21<212>dna<213>artificial<220><223>β-globinre1sgrna2<400>20gctggtcccctggtaacctgg21<210>21<211>24<212>dna<213>artificial<220><223>β-globinre1sgrna1f<400>21accgattgttgttgccttggagtg24<210>22<211>24<212>dna<213>artificial<220><223>β-globinre1sgrna1r<400>22aaaccactccaaggcaacaacaat24<210>23<211>24<212>dna<213>artificial<220><223>β-globinre1sgrna2f<400>23accgctggtcccctggtaacctgg24<210>24<211>24<212>dna<213>artificial<220><223>β-globinre1sgrna2r<400>24aaacccaggttaccaggggaccag24<210>25<211>81<212>dna<213>artificial<220><223>hiseq-hstm-af1<400>25aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatcttg60cttagagccaggactaattgc81<210>26<211>83<212>dna<213>artificial<220><223>hiseq-hstm-ar2<400>26aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatcttg60ggtgtagaaatgagcaaataagt83<210>27<211>91<212>dna<213>artificial<220><223>hiseq-hstm-2f<400>27caagcagaagacggcatacgagatgatcgtgtgactggagttcagacgtgtgctcttccg60atctagattgagttctgtttgtttcatctac91<210>28<211>85<212>dna<213>artificial<220><223>hiseq-hstm-2r<400>28caagcagaagacggcatacgagatagtcaagtgactggagttcagacgtgtgctcttccg60atctcagctctgcctgaaaggagtc85當前第1頁12當前第1頁12