本發(fā)明涉及一種提高同源重組率的方法,特別涉及一種將foki-dcas9蛋白應(yīng)用于基因編輯系統(tǒng)中以實(shí)現(xiàn)提高同源重組效率的方法。
背景技術(shù):
隨著生命科學(xué)研究進(jìn)入基因組時(shí)代,越來(lái)越多物種的基因組完成測(cè)序,解讀與改造基因組的功能就顯得非常緊迫,近幾年,生物學(xué)家們巧妙地利用蛋白質(zhì)結(jié)構(gòu)與功能領(lǐng)域的研究成果,將特異識(shí)別與結(jié)合dna的蛋白質(zhì)結(jié)構(gòu)與和核酸內(nèi)切酶結(jié)構(gòu)域融合,創(chuàng)造出能夠按照人們意愿特異切割dna的序列特異核酸酶(sequence-specificnucleases,ssns),并藉此實(shí)現(xiàn)了對(duì)基因組特定位點(diǎn)的靶向修飾,及基因組編輯(genomeediting)。ssns主要包括3種類型:鋅指核酸酶(zincfingernuclease,zfn)、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcriptionactivator-likeeffectornuclease,talen)和成簇的規(guī)律間隔的短回文重復(fù)序列及其相關(guān)系統(tǒng)(clusteredreg-ularlyinterspacedshortpalindromicrepeats/crispr-associated9,crispr/cas9system)。上述幾類ssns的共同特征是能夠作為核酸內(nèi)切酶切割特定的dna序列,創(chuàng)造dna雙鏈斷裂(double-strandbreaks,dsbs)。
在真核生物中,dsbs的修復(fù)機(jī)制是高度保守的,主要包括兩種途徑:非同源末端鏈接(non-homologousendjoining,nhej)和同源重組(homologousrecombination,hr)。通過(guò)nhej方式,斷裂的染色體會(huì)重新連接,但往往不是精確的,斷裂位置會(huì)產(chǎn)生少量核苷酸的插入或刪除,從而產(chǎn)生基因敲除突變體;通過(guò)hr方式,在引入同源序列的情況下,以同源序列為模板進(jìn)行合成修復(fù),從而產(chǎn)生精確的定點(diǎn)替換或者插入突變體。在這兩種途徑中,nhej方式占絕對(duì)主導(dǎo),可以發(fā)生在幾乎所有類型的細(xì)胞以及不同的細(xì)胞周期中(g1、s和g2期);然而,hr發(fā)生頻率很低,主要發(fā)生在s和g2期。hr根據(jù)其發(fā)生方式不同可以分為兩類:?jiǎn)捂溚嘶?single-strandannealing,ssa)和合成依賴式退火(synthesis-dependentstrandannealing,sdsa)。dsbs產(chǎn)生后,在這兩種途徑下dna斷裂末端都會(huì)發(fā)生5’至3’方向的dna切除,形成3’單鏈末端。ssa途徑類似nhej途徑,dsbs兩端各有一段同源序列,同源序列區(qū)域直接退火形成互補(bǔ)雙鏈,再經(jīng)過(guò)末端加工和連接修復(fù)dsbs,在基因組串聯(lián)重復(fù)區(qū)域,ssa是主要的dsbs修復(fù)方式。sdsa途徑是依賴dna合成的修復(fù)過(guò)程,基因組編輯過(guò)程中同源重組通常是指這種方式。dsb經(jīng)過(guò)5’至3’方向的dna切除產(chǎn)生的一個(gè)3’單鏈末端入侵同源供體dna模板,形成d-loop環(huán)狀結(jié)構(gòu),再利用同源供體dna的互補(bǔ)鏈作為模板進(jìn)行dna合成修復(fù),當(dāng)延伸至可以與dsb另一個(gè)單鏈末端互補(bǔ)配對(duì)的位置時(shí),脫離d-loop結(jié)構(gòu),兩個(gè)單鏈dsb末端退火形成雙鏈,完成修復(fù)過(guò)程。sdsa途徑最終結(jié)果就是完成從同源dna至dsb遺傳信息的轉(zhuǎn)化過(guò)程。sdsa途徑發(fā)生頻率非常低,相同條件下只有ssa方式的10%-20%。由此可見,提高h(yuǎn)r效率是基因組編輯研究最重要也是最迫切的任務(wù)之一。
在crispr/cas9基因編輯系統(tǒng)中,設(shè)計(jì)不同的sgrna以指導(dǎo)cas9內(nèi)切酶完成對(duì)dna的定點(diǎn)切割,通過(guò)同源重組修復(fù)機(jī)制實(shí)現(xiàn)目標(biāo)基因中不同類型的修飾,包括基因的刪除、添加和替換等。因此明確dna修復(fù)機(jī)制特別是hr修復(fù)過(guò)程的研究將有助于人們采用適當(dāng)方法提高基因組編輯中定點(diǎn)插入或替換的效率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種提高同源重組效率的方法,首次提供了foki-dcas9融合蛋白可以提高同源重組效率。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種提高同源重組效率的方法,包括向宿主細(xì)胞中引入foki-dcas9融合蛋白。
進(jìn)一步地,所述foki-dcas9融合蛋白在宿主細(xì)胞中瞬時(shí)表達(dá)或穩(wěn)定表達(dá)。
更進(jìn)一步地,所述宿主細(xì)胞為植物細(xì)胞。
優(yōu)選地,所述植物為玉米、水稻、大豆、擬南芥、棉花、油菜、高粱、小麥、大麥、粟、甘蔗或燕麥。
在上述技術(shù)方案的基礎(chǔ)上,所述foki-dcas9融合蛋白的氨基酸序列具有seqidno:4和seqidno:5所示的氨基酸序列。
優(yōu)選地,所述foki-dcas9融合蛋白的核苷酸序列具有seqidno:1第643-5523位所示的核苷酸序列。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種基因組編輯系統(tǒng),包含foki-dcas9融合蛋白。
進(jìn)一步地,所述foki-dcas9融合蛋白的氨基酸序列具有seqidno:4和seqidno:5所示的氨基酸序列。
更進(jìn)一步地,所述foki-dcas9融合蛋白的核苷酸序列具有seqidno:1第643-5523位所示的核苷酸序列。
可選地,所述基因組編輯系統(tǒng)還包括編碼序列操縱系統(tǒng)的多核苷酸序列。
優(yōu)選地,所述序列操縱系統(tǒng)為crispr/cas系統(tǒng)。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種實(shí)現(xiàn)基因組編輯的方法,包括在生物體中表達(dá)所述基因組編輯系統(tǒng)。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種產(chǎn)生基因組編輯的植物的方法,包括向植物基因組中引入編碼所述基因組編輯系統(tǒng)的核苷酸序列。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種產(chǎn)生基因組編輯植物種子的方法,包括將所述方法產(chǎn)生的基因組編輯的植物自交,從而獲得具有基因組編輯植物種子。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種培育基因組編輯植物的方法,包括:
種植至少一粒所述方法產(chǎn)生的所述基因組編輯植物種子;
使所述種子長(zhǎng)成植株。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種所述基因組編輯系統(tǒng)在提高同源重組效率和/或提高基因組編輯效率中的用途。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種foki-dcas9融合蛋白在提高同源重組效率中的用途。
進(jìn)一步地,所述foki-dcas9融合蛋白的氨基酸序列具有seqidno:4和seqidno:5所示的氨基酸序列。
更進(jìn)一步地,所述foki-dcas9融合蛋白的核苷酸序列具有seqidno:1第643-5523位所示的核苷酸序列。
本發(fā)明所述的foki是包括dna識(shí)別結(jié)構(gòu)域和催化(內(nèi)切核酸酶)結(jié)構(gòu)域的ii型限制性內(nèi)切核酸酶。本文所述的融合蛋白可包括所有foki或僅僅催化內(nèi)切核酸酶結(jié)構(gòu)域,例如,基因庫(kù)登錄號(hào)aaa24927.1的氨基酸388-583或408-583,例如,如li等,nucleicacidsres.39(1):359–372(2011);cathomen和joung,mol.ther.16:1200–1207(2008)中描述的,或如miller等natbiotechnol25:778–785(2007);szczepek等,natbiotechnol25:786–793(2007);或bitinaite等,proc.natl.acad.sci.usa.95:10570–10575(1998)中描述的foki的突變形式。
本發(fā)明中所述的cas9,ⅱ型crispr/cas系統(tǒng)中一種重要的蛋白質(zhì)成分,可以從生物體如鏈球菌屬物種(streptococcussp.),優(yōu)選釀膿鏈球菌(streptococcuspyogenes.)中分離得到。當(dāng)cas9與稱為crisprrna(crrna)和反式激活crrna(tracrrna)的兩個(gè)rna復(fù)合時(shí),形成活性核酸內(nèi)切酶,從而切斷入侵噬菌體或質(zhì)粒中的外源遺傳元件,以保護(hù)宿主細(xì)胞。crrna從宿主基因組中的crispr元件轉(zhuǎn)錄,其中該crispr元件之前自外源入侵物捕獲。研究表明通過(guò)融合crrna和tracrrna的必要部分產(chǎn)生的單鏈嵌合rna可以取代cas9/rna復(fù)合體中的兩個(gè)rna以形成功能性核酸內(nèi)切酶。cas9蛋白質(zhì)的變體可以是cas9的突變體形式,其中催化性天冬氨酸殘基改變?yōu)槿魏纹渌被?。?yōu)選地,所述其它氨基酸可以是丙氨酸。
本發(fā)明中所述foki-dcas9融合蛋白,其中foki序列任選地通過(guò)間插接頭,例如2-30個(gè)氨基酸,例如4-12氨基酸的接頭,例如gly4ser與dcas9(優(yōu)選地與dcas9的氨基末端,而且還任選地與羧基末端)融合。在一些實(shí)施方案中,所述融合蛋白包括dcas9與foki結(jié)構(gòu)域之間的接頭??捎糜谶@些融合蛋白的接頭(或串聯(lián)結(jié)構(gòu)中的融合蛋白之間)可包括不干擾融合蛋白的功能的任何序列。在優(yōu)選實(shí)施方案中,所述接頭是短的,例如2-20個(gè)氨基酸,并且通常是柔性的(即包含具有高度自由的氨基酸諸如甘氨酸、丙氨酸和絲氨酸)。在一些實(shí)施方案中,所述接頭包含一個(gè)或多個(gè)由gggs或ggggs組成的單元,例如,2、3、4或更多個(gè)gggs或ggggs單元的重復(fù),還可使用其它接頭序列。
本發(fā)明所用2a肽(t2a)是一種可“自我剪切的短小肽鏈”,最初在手足口病毒(foot-and-mouthdiseasevirus,fmda)中發(fā)現(xiàn),平均長(zhǎng)度為18-22個(gè)氨基酸,2a肽可在蛋白翻譯時(shí)通過(guò)核糖體跳躍從自身最后2個(gè)氨基酸c末端斷裂(defelipeetal.,2003)。甘氨酸和脯氨酸之間的肽鏈結(jié)合群在2a為電視受損的,能引發(fā)核糖體跳躍而從第2個(gè)密碼子開始翻譯,從而使1個(gè)轉(zhuǎn)錄單元里2個(gè)蛋白獨(dú)立表達(dá)。這中2a介導(dǎo)的剪切廣泛存在與所有的真核動(dòng)物細(xì)胞當(dāng)中。利用2a較高的剪切效率及促使上下游基因平衡表達(dá)的能力,可以改進(jìn)異源多聚蛋白(如細(xì)胞表面受體、細(xì)胞因子、免疫球蛋白等)的表達(dá)效率。
本發(fā)明中所述的向?qū)na或引導(dǎo)rna(guiderna,grna),也稱為小向?qū)na(smallguiderna,sgrna),作用于動(dòng)質(zhì)體(kinetoplastid)體內(nèi)一種稱為rna編輯(rnaediting)的后轉(zhuǎn)錄修飾過(guò)程中,也是一種小型非編碼rna??膳cpre-mrna配對(duì),并在其中插入一些尿嘧啶(u),產(chǎn)生具有作用的mrna。向?qū)na編輯的rna分子,長(zhǎng)度大約是60-80個(gè)核苷酸,是由單獨(dú)的基因轉(zhuǎn)錄的,在grna的5’末端有一段錨定區(qū),以特殊的g-u配對(duì)方式與非編輯的pre-mrna序列互補(bǔ),錨定序列促進(jìn)grna與pre-mrna中的編輯區(qū)互補(bǔ),特意結(jié)合;在grna分子的中間部位有一個(gè)編輯區(qū)負(fù)責(zé)在被編輯的pre-mrna分子中插入u的位置,其與被編輯mrna精確互補(bǔ);在grna分子的3’末端,有一段轉(zhuǎn)錄后加入的由大約15個(gè)非編碼的polyu序列,功能為把grna鏈接到pre-mrna的編輯區(qū)的5’上游富含嘌呤堿基的核苷酸序列上。在編輯時(shí),形成一個(gè)編輯體(editosome),以grna內(nèi)部的序列作為模板進(jìn)行轉(zhuǎn)錄物的校正,同時(shí)產(chǎn)生編輯的mrna。
有三種類型crispr/cas系統(tǒng),其中涉及cas9蛋白質(zhì)和crrna、tracrrna的ⅱ型crispr/cas系統(tǒng)是代表性的。cas9蛋白質(zhì)通過(guò)人工修飾的向?qū)na的導(dǎo)向作用可以打靶dna序列的5’-n20-ngg-3’(n代表任何脫氧核苷酸堿基),n20是與grna的5’序列相同的20個(gè)堿基,ngg是pam區(qū)(原型間隔子鄰近基序,protospacer-adjacentmotif)。cas9剪切的位點(diǎn)就是pam附近的區(qū)域。相對(duì)于鋅指和轉(zhuǎn)錄激活因子樣效應(yīng)物dna結(jié)合蛋白提供了優(yōu)勢(shì)-因?yàn)樵诤塑账峤Y(jié)合crispr-cas蛋白中的位點(diǎn)特異性由rna分子調(diào)控而不是dna結(jié)合蛋白調(diào)控。
本發(fā)明中所述重組,當(dāng)用于例如細(xì)胞、核酸、蛋白質(zhì)或載體時(shí),表示該細(xì)胞、核酸、蛋白質(zhì)或載體已通過(guò)引入異源核酸或蛋白質(zhì)、或改變天然核酸或蛋白質(zhì)而被修飾,或該細(xì)胞源自此修飾的細(xì)胞。
本發(fā)明中向?qū)na可以以編碼該向?qū)na的rna或dna的形式轉(zhuǎn)移到細(xì)胞或生物體中。向?qū)na可以是分離的rna、并入病毒載體的rna的形式、或者在載體中編碼。優(yōu)選地,載體可以是病毒載體、質(zhì)粒載體、或農(nóng)桿菌載體。
編碼向?qū)na的dna可以是包含編碼向?qū)na序列的載體。例如,可以通過(guò)用分離的向?qū)na或包含編碼向?qū)na的序列和啟動(dòng)子的質(zhì)粒dna轉(zhuǎn)染細(xì)胞或生物體,將向?qū)na轉(zhuǎn)染到細(xì)胞或生物體。
本發(fā)明中所述切割或剪切是指核苷酸分子共價(jià)骨架的斷裂。向?qū)na可以制備為特異于任何待切割的靶,通過(guò)向?qū)na的靶特異性部分切割任何靶dna。
本發(fā)明中所述非同源末端連接(non-homologousendjoining,nhej)指完全不需要任何模版的幫助,修復(fù)蛋白可以直接將dna斷裂的末端彼此拉近,再借由dna連接酶的幫助將斷裂的末端重新接合的修復(fù)機(jī)制。
本發(fā)明中所述同源重組(homologousrecombination,hr)是指發(fā)生在非姐妹染色單體之間或同一染色體上含有同源序列的dna分子之間或分子之內(nèi)的重新組合。同源重組需要一系列的蛋白質(zhì)催化,如原核生物細(xì)胞內(nèi)的reca、recbcd、recf、reco、recr等;以及真核生物細(xì)胞內(nèi)的rad51、mre11-rad50等等。同源重組反應(yīng)通常根據(jù)交叉分子或holliday結(jié)構(gòu)的形成和拆分分為三個(gè)階段,即前聯(lián)會(huì)體階段、聯(lián)會(huì)體形成和holliday結(jié)構(gòu)的拆分。同源重組反應(yīng)依賴于dna分子之間的同源性,100%同源性的dna分子之間的重組常見于非姐妹染色體之間的同源重組,稱為homologousrecombination,而小于100%同源性的dna分子之間或分子之內(nèi)的重組,則被稱為hemologusrecombination。后者可被負(fù)責(zé)堿基錯(cuò)配對(duì)的蛋白如原核細(xì)胞內(nèi)的muts或真核生物細(xì)胞內(nèi)的msh2-3等蛋白質(zhì)“編輯”。同源重組可以雙向交換dna分子,也可以單向轉(zhuǎn)移dna分子,后者又被稱為基因轉(zhuǎn)換(geneconversion)。
本發(fā)明中,單鏈退火(ssa)模型是由lin等于1984年提出的。在ssa模型中,重組在dna雙鏈斷裂處開始,在單鏈特異性核酸外切酶的作用下,斷裂點(diǎn)兩側(cè)逐漸形成dna單鏈區(qū)域,這一過(guò)程持續(xù)到兩個(gè)斷點(diǎn)處出現(xiàn)互補(bǔ)dna單鏈。互補(bǔ)dna單鏈退火,非互補(bǔ)末端被切除,單鏈缺口修復(fù)連接,完成dna重組。ssa模型沒(méi)有其它模型所需的雙鏈dna的識(shí)別配對(duì)過(guò)程,不形成holliday結(jié)構(gòu)作為重組的中間過(guò)渡形式。因此,重組產(chǎn)生dna雙鏈交換,并丟失非退火區(qū)域單鏈dna順序。
本發(fā)明中,所述串聯(lián)是指將二個(gè)或二個(gè)以上向?qū)na(sgrna)排成一串,每個(gè)sgrna的首端和前一個(gè)sgrna的尾端由csy4切割識(shí)別序列連接。
本發(fā)明中所述的植物、植物組織或植物細(xì)胞的基因組,是指植物、植物組織或植物細(xì)胞內(nèi)的任何遺傳物質(zhì),且包括細(xì)胞核和質(zhì)體和線粒體基因組。
本發(fā)明中所述的多核苷酸和/或核苷酸形成完整“基因”,在所需宿主細(xì)胞中編碼蛋白質(zhì)或多肽。本領(lǐng)域技術(shù)人員很容易認(rèn)識(shí)到,可以將本發(fā)明的多核苷酸和/或核苷酸置于目的宿主中的調(diào)控序列控制下。
如本申請(qǐng),包括權(quán)利要求中使用的,除非上下文中清楚地另有說(shuō)明,否則單數(shù)和單數(shù)形式的術(shù)語(yǔ),例如“一”、“一個(gè)”和“該”,包括復(fù)數(shù)指代物。因此,例如“植物”、“該植物”或“一個(gè)植物”也指示多個(gè)植物。并且根據(jù)上下文,使用術(shù)語(yǔ)“植物”還可指示該植物在遺傳上相似或相同的后代。類似地,術(shù)語(yǔ)“核酸”可以指核酸分子的許多拷貝。類似地,術(shù)語(yǔ)“探針”可以指代相同或相似的探針?lè)肿印?/p>
數(shù)字范圍包括限定該范圍的數(shù)字,并明確地包括所限定的范圍內(nèi)的每個(gè)整數(shù)和非整數(shù)分?jǐn)?shù)。除非另外指出,否則本文所用的全部技術(shù)和科學(xué)術(shù)語(yǔ)具有與本領(lǐng)域普通技術(shù)人員普遍理解的相同的含義。
本發(fā)明中,術(shù)語(yǔ)“核酸”、“核苷酸”、“核苷酸序列”、“寡核苷酸”和“多核苷酸”可互換使用,它們是指具有任何長(zhǎng)度的核苷酸的聚合形式,根據(jù)上下文含義,可指代dna或rna、或其類似物。其中dna包括但不限于cdna、基因組dna、合成dna(例如人工合成)和含核酸類似物的dna(或rna)。多核苷酸可具有任何三維結(jié)構(gòu),并且可以執(zhí)行已知或未知的任何功能。核酸可為雙鏈或單鏈(既有義鏈或反義單鏈)。多核苷酸的非限制性示例包括基因、基因片段、外顯子、內(nèi)含子、信使rna(mrna)、轉(zhuǎn)移rna、核糖體rna、核酶、cdna、重組多核苷酸、分支多核苷酸、質(zhì)粒、載體、任何序列的分離dna、任何序列的分離rna、核酸探針和引物、以及核酸類似物。
本發(fā)明中“野生型”表示生物、菌株、基因的典型形式或者當(dāng)它在自然界存在時(shí)區(qū)別于突變體或變體形式的特征。
本發(fā)明中“突變體”或“變體”是指發(fā)生突變的個(gè)體,其具有與野生型不同的序列,可能會(huì)導(dǎo)致其中序列的至少部分功能已丟失的序列,例如,在啟動(dòng)子或增強(qiáng)子區(qū)域中序列的變化將至少部分地影響生物體中編碼序列的表達(dá)。術(shù)語(yǔ)“突變”是指可由諸如缺失、添加、取代或重排引起的核酸序列中序列的任何變化。突變還可影響該序列參與的一個(gè)或多個(gè)步驟。例如,dna序列中的變化可導(dǎo)致有活性的、有部分活性的或無(wú)活性的改變的mrna和/或蛋白的合成。
本發(fā)明中“非天然存在的”表明人工的參與。當(dāng)指核酸分子或多肽時(shí),表示該核酸分子或多肽至少基本上從它們?cè)谧匀唤缰谢蛉绨l(fā)現(xiàn)于自然界中的與其結(jié)合的至少另一種組分游離出來(lái)。
本發(fā)明中“表達(dá)”指感興趣的序列轉(zhuǎn)錄產(chǎn)生對(duì)應(yīng)mrna并且該mrna翻譯產(chǎn)生對(duì)應(yīng)產(chǎn)物,即肽、多肽或蛋白。調(diào)節(jié)元件控制或調(diào)整感興趣的序列表達(dá),所述調(diào)節(jié)元件包括5’調(diào)節(jié)元件如啟動(dòng)子。
本發(fā)明中“多肽”、“肽”和“蛋白質(zhì)”可互換地使用,是指具有任何長(zhǎng)度的氨基酸聚合物。該聚合物可以是直鏈或支鏈的,它可以包含修飾的氨基酸,并且它可以被非氨基酸中斷。這些術(shù)語(yǔ)還涵蓋已經(jīng)被修飾的氨基酸聚合物;這些修飾例如二硫鍵形成、糖基化、脂化、乙?;?、磷酸化、或任何其他操作,如與標(biāo)記組分的結(jié)合。術(shù)語(yǔ)“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及d和l旋光異構(gòu)體、以及氨基酸類似物和肽模擬物。
本發(fā)明中術(shù)語(yǔ)“載體”是指能夠在宿主細(xì)胞內(nèi)復(fù)制的dna分子。質(zhì)粒和粘粒是示例性載體。此外,術(shù)語(yǔ)“載體”和“媒介”可互換使用以指將dna片段從一種細(xì)胞轉(zhuǎn)移至另一種細(xì)胞的核酸分子,因此細(xì)胞不必要屬于相同的生物(例如將dna片段從農(nóng)桿菌細(xì)胞轉(zhuǎn)移至植物細(xì)胞)。
本發(fā)明中術(shù)語(yǔ)“表達(dá)載體”是指含有所需要的編碼序列和在特定宿主生物中表達(dá)有效連接的編碼序列所需要的適宜核酸序列的重組dna分子。
本發(fā)明中術(shù)語(yǔ)“重組表達(dá)載體”指來(lái)自任何來(lái)源、能夠整合入基因組或自主復(fù)制的任何因子如質(zhì)粒、粘粒、病毒、bac(細(xì)菌人工染色體)、自主復(fù)制型序列、噬菌體、或者線性或環(huán)狀單鏈或雙鏈dna或rna核苷酸序列,包括其中一種或多種dna序列使用眾所周知的重組dna技術(shù)以功能性可操作方式連接的dna分子。
在本發(fā)明中,“定位結(jié)構(gòu)域”可任選地添加為蛋白部分的部分,定位結(jié)構(gòu)域可將蛋白部分或編程的蛋白部分或組裝的復(fù)合物定位至活細(xì)胞中特定細(xì)胞或亞細(xì)胞定位。定位結(jié)構(gòu)域可通過(guò)將蛋白部分的氨基酸序列融合到摻入包括以下結(jié)構(gòu)域的氨基酸來(lái)構(gòu)建:核定位信號(hào)(nls);線粒體前導(dǎo)序列(mls);葉綠體前導(dǎo)序列;和/或被設(shè)計(jì)以將蛋白運(yùn)輸或引導(dǎo)或定位至含有核酸的細(xì)胞器、細(xì)胞區(qū)室或細(xì)胞的任何細(xì)分部分的任何序列。在一些實(shí)施方案中,生物體是真核生物,且定位結(jié)構(gòu)域包括允許蛋白進(jìn)入細(xì)胞核和基因組dna內(nèi)的核定位結(jié)構(gòu)域(nls)。所述nls的序列可包括帶正電荷序列的任何功能nls。在另一些實(shí)施方案中,定位結(jié)構(gòu)域可包括使蛋白部分或編程的核蛋白進(jìn)入細(xì)胞器的前導(dǎo)序列,使細(xì)胞器dna被修飾成為可能。
本發(fā)明中,真核生物有3類rna聚合酶,負(fù)責(zé)轉(zhuǎn)錄3類不同的啟動(dòng)子。由rna聚合酶i負(fù)責(zé)轉(zhuǎn)錄的rrna基因,啟動(dòng)子(i型)比較單一,由轉(zhuǎn)錄起始位點(diǎn)附近的兩部分序列構(gòu)成:第一部分是核心啟動(dòng)子(corepromoter),由-45—+20位核苷酸組成,單獨(dú)存在時(shí)就足以起始轉(zhuǎn)錄;另一部分由-170—-107位序列組成,稱為上游調(diào)控元件,能有效地增強(qiáng)轉(zhuǎn)錄效率。
由rna聚合酶ⅲ負(fù)責(zé)轉(zhuǎn)錄的是5srrna、trna和某些核內(nèi)小分子rna(snrna),其啟動(dòng)子(ⅲ型)組成較復(fù)雜,又可被分為兩個(gè)亞類:一類屬于結(jié)構(gòu)基因內(nèi)啟動(dòng)子,一類屬于結(jié)構(gòu)基因外啟動(dòng)子。內(nèi)啟動(dòng)子的有效啟動(dòng)依賴于基因內(nèi)部包含的兩個(gè)不連續(xù)的dna片段,這兩個(gè)dna片段包括一些不同的連續(xù)dna序列a、b或c區(qū),兩個(gè)區(qū)之間被隔開。根據(jù)兩個(gè)區(qū)的不同組合,可以分為i類和ii類兩種:i類包括a和c區(qū),目前發(fā)現(xiàn)其僅存在于5srrna的基因中;ii類包括a和b區(qū),存在于trna的基因、7slrna的基因、腺病毒vai與vaii的rna中。a、b或a、c內(nèi)部dna序列是轉(zhuǎn)錄因子tfⅲa和tfⅲc轉(zhuǎn)錄啟動(dòng)結(jié)合部位。在多數(shù)情況下,5’端還會(huì)有其它調(diào)節(jié)或關(guān)鍵元件,這些元件對(duì)rna的高效轉(zhuǎn)錄是必需的。這些序列的存在與否之間影響著轉(zhuǎn)錄效率。這些序列呈現(xiàn)復(fù)雜的多樣性,不過(guò)大多數(shù)啟動(dòng)子5’端-30到-20處存在著tata盒樣序列,與外啟動(dòng)子相似。外啟動(dòng)子缺乏相應(yīng)的內(nèi)部序列,僅在5’端有順式作用元件,在基因的末端有一組由4個(gè)或更多胸腺嘧啶組成的終止信號(hào),如脊椎動(dòng)物u6核小rna和7skrna啟動(dòng)子,這些啟動(dòng)子都高度相似或完全相同,其位置和堿基序列高度保守,其結(jié)構(gòu)與polii啟動(dòng)子也有一定的相似性。它們的5’端順式作用元件包括幾個(gè)控制元件,在其上游約-30處存在一個(gè)tata樣序列,近-60處有一個(gè)snrnapse(snrna近似序列)和一個(gè)或多個(gè)被稱為oct的修飾序列5’-atgcaaat-3’。tata樣序列是poliii對(duì)snrna基因進(jìn)行轉(zhuǎn)錄特異的。tata樣元件和pse元件共同決定了轉(zhuǎn)錄起始位點(diǎn)的選擇和轉(zhuǎn)錄效率。tata樣元件和pse元件之間的距離決定了rna聚合酶轉(zhuǎn)錄的特異性,但似乎tata樣元件更重要,因?yàn)樵趐se缺失的u6rna和7skrna基因轉(zhuǎn)錄中,只有轉(zhuǎn)錄效率的下降。而且,pse元件可能和b盒(boxb)相關(guān),b盒在一定程度上可以替代pse元件。這些序列對(duì)下游基因的轉(zhuǎn)錄具有決定性的作用,而且它們與起始位點(diǎn)相距較遠(yuǎn),往往超過(guò)150bp,而對(duì)poliii內(nèi)啟動(dòng)子來(lái)說(shuō),一般在80bp以內(nèi);與poliii外啟動(dòng)子相比,polii啟動(dòng)子5’端各順式作用元件的作用剛好相反,如果tata樣元件缺失,pse則可以履行tata樣元件功能,決定轉(zhuǎn)錄的起始部位。在pse上游,外啟動(dòng)子還有一個(gè)遠(yuǎn)端控制序列,其結(jié)構(gòu)與polii增強(qiáng)子oct骨架相似,但較其復(fù)雜。而在-223處還有一個(gè)cacc序列與oct骨架相連。這些遠(yuǎn)端控制序列的存在可大大提高u6rna和7skrna的表達(dá)效率。
由rna聚合酶ii負(fù)責(zé)轉(zhuǎn)錄的ii型基因包括所有蛋白質(zhì)編碼基因和部分snrna基因,后者的啟動(dòng)子結(jié)構(gòu)與iii型基因啟動(dòng)子中的第三亞類相似,編碼蛋白質(zhì)的ii型基因啟動(dòng)子在結(jié)構(gòu)上有共同的保守序列。轉(zhuǎn)錄起始位點(diǎn)沒(méi)有廣泛的序列同源性,但第一個(gè)堿基為腺嘌呤,而兩側(cè)是嘧啶堿基。這個(gè)區(qū)域被稱為起始子(initiator,inr),序列可表示為py2capy5。inr元件位于-3—+5。僅由inr元件組成的啟動(dòng)子是具有可被rna聚合酶ii識(shí)別的最簡(jiǎn)單啟動(dòng)子形式。多數(shù)ii型啟動(dòng)子有一個(gè)被稱為tata盒的共有序列,通常處于-30區(qū),相對(duì)于轉(zhuǎn)錄起始位點(diǎn)的位置比較固定。tata盒存在于所有真核生物中,tata盒是一個(gè)保守的七堿基對(duì),也有一些ii型啟動(dòng)子不含有tata盒,這樣的啟動(dòng)子稱為無(wú)tata盒啟動(dòng)子。
本發(fā)明中所述“有效連接”或“可操作地連接”表示核酸序列的聯(lián)結(jié),所述聯(lián)結(jié)使得一條序列可提供對(duì)相連序列來(lái)說(shuō)需要的功能。在本發(fā)明中所述“有效連接”可以為將啟動(dòng)子與感興趣的序列相連,使得該感興趣的序列的轉(zhuǎn)錄受到該啟動(dòng)子控制和調(diào)控。當(dāng)感興趣的序列編碼蛋白并且想要獲得該蛋白的表達(dá)時(shí)“有效連接”表示:?jiǎn)?dòng)子與所述序列相連,相連的方式使得得到的轉(zhuǎn)錄物高效翻譯。如果啟動(dòng)子與編碼序列的連接是轉(zhuǎn)錄物融合并且想要實(shí)現(xiàn)編碼的蛋白的表達(dá)時(shí),制造這樣的連接,使得得到的轉(zhuǎn)錄物中第一翻譯起始密碼子是編碼序列的起始密碼子。備選地,如果啟動(dòng)子與編碼序列的連接是翻譯融合并且想要實(shí)現(xiàn)編碼的蛋白的表達(dá)時(shí),制造這樣的連接,使得5’非翻譯序列中含有的第一翻譯起始密碼子與啟動(dòng)子相連結(jié),并且連接方式使得得到的翻譯產(chǎn)物與編碼想要的蛋白的翻譯開放讀碼框的關(guān)系是符合讀碼框的??梢浴坝行нB接”的核酸序列包括但不限于:提供基因表達(dá)功能的序列(即基因表達(dá)元件,例如啟動(dòng)子、5’非翻譯區(qū)域、內(nèi)含子、蛋白編碼區(qū)域、3’非翻譯區(qū)域、聚腺苷化位點(diǎn)和/或轉(zhuǎn)錄終止子)、提供dna轉(zhuǎn)移和/或整合功能的序列(即t-dna邊界序列、位點(diǎn)特異性重組酶識(shí)別位點(diǎn)、整合酶識(shí)別位點(diǎn))、提供選擇性功能的序列(即抗生素抗性標(biāo)記物、生物合成基因)、提供可計(jì)分標(biāo)記物功能的序列、體外或體內(nèi)協(xié)助序列操作的序列(即多接頭序列、位點(diǎn)特異性重組序列)和提供復(fù)制功能的序列(即細(xì)菌的復(fù)制起點(diǎn)、自主復(fù)制序列、著絲粒序列)。
本發(fā)明中,調(diào)節(jié)元件可操作地連接至crispr系統(tǒng)的一個(gè)或多個(gè)元件,從而驅(qū)動(dòng)該crispr系統(tǒng)的所述一個(gè)或多個(gè)元件的表達(dá)。一般而言,crispr(規(guī)律間隔成簇短回文重復(fù)),也稱為spidr(spacer間隔開的同向重復(fù)),構(gòu)成通常對(duì)于特定細(xì)菌物種而言特異性的dna基因座的家族。該crispr座位包含在大腸桿菌中被識(shí)別的間隔開的短序列重復(fù)(ssr)的一個(gè)不同類、以及相關(guān)基因。類似的間隔開的ssr已經(jīng)鑒定于地中海富鹽菌、化膿鏈球菌、魚腥草屬和結(jié)核分枝桿菌中。這些crispr座位典型地不同于其它ssr的重復(fù)結(jié)構(gòu),這些重復(fù)已被稱為規(guī)律間隔的短重復(fù)(srsr)。一般而言,這些重復(fù)是以簇存在的短元件,其被具有基本上恒定長(zhǎng)度的獨(dú)特間插序列規(guī)律地間隔開。雖然重復(fù)序列在菌株之間是高度保守的,許多間隔開的重復(fù)和這些間隔區(qū)的序列一般在菌株與菌株之間不同,已經(jīng)在40種以上的原核生物中鑒定出crispr座位。
本發(fā)明中,“靶序列”或“靶點(diǎn)序列”或“靶位點(diǎn)序列”或“靶多核苷酸”是待被作用的任何期望的預(yù)定的核酸序列,包括但不限于編碼或非編碼序列、基因、外顯子或內(nèi)含子、調(diào)節(jié)序列、基因間序列、合成序列和細(xì)胞內(nèi)寄生物序列。在一些實(shí)施方案中,靶序列存在于靶細(xì)胞、組織、器官或生物體內(nèi)。
術(shù)語(yǔ)“引物”是一段分離的核酸分子,其通過(guò)核酸雜交,退火結(jié)合到互補(bǔ)的目標(biāo)dna鏈上,在引物和目標(biāo)dna鏈之間形成雜合體,然后在聚合酶(例如dna聚合酶)的作用下,沿目標(biāo)dna鏈延伸。本發(fā)明的引物對(duì)涉及其在目標(biāo)核酸序列擴(kuò)增中的應(yīng)用,例如,通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(pcr)或其他常規(guī)的核酸擴(kuò)增方法。
引物的長(zhǎng)度一般是11個(gè)多核苷酸或更多,優(yōu)選的是18個(gè)多核苷酸或更多,更優(yōu)選的是24個(gè)多核苷酸或更多,最優(yōu)選的是30個(gè)多核苷酸或更多。這種引物在高度嚴(yán)格雜交條件下與目標(biāo)序列特異性地雜交。盡管不同于目標(biāo)dna序列且對(duì)目標(biāo)dna序列保持雜交能力的引物是可以通過(guò)常規(guī)方法設(shè)計(jì)出來(lái)的,但是,優(yōu)選的,本發(fā)明中的引物與目標(biāo)序列的連續(xù)核酸具有完全的dna序列同一性。
本發(fā)明的引物在嚴(yán)格條件下與目標(biāo)dna序列雜交。核酸分子或其片段在一定情況下能夠與其他核酸分子進(jìn)行特異性雜交。如本發(fā)明使用的,如果兩個(gè)核酸分子能形成反平行的雙鏈核酸結(jié)構(gòu),就可以說(shuō)這兩個(gè)核酸分子彼此間能夠進(jìn)行特異性雜交。如果兩個(gè)核酸分子顯示出完全的互補(bǔ)性,則稱其中一個(gè)核酸分子是另一個(gè)核酸分子的“互補(bǔ)物”。如本發(fā)明使用的,當(dāng)一個(gè)核酸分子的每一個(gè)核苷酸都與另一個(gè)核酸分子的對(duì)應(yīng)核苷酸互補(bǔ)時(shí),則稱這兩個(gè)核酸分子顯示出“完全互補(bǔ)性”。如果兩個(gè)核酸分子能夠以足夠的穩(wěn)定性相互雜交從而使它們?cè)谥辽俪R?guī)的“低度嚴(yán)格”條件下退火且彼此結(jié)合,則稱這兩個(gè)核酸分子為“最低程度互補(bǔ)”。類似地,如果兩個(gè)核酸分子能夠以足夠的穩(wěn)定性相互雜交從而使它們?cè)诔R?guī)的“高度嚴(yán)格”條件下退火且彼此結(jié)合,則稱這兩個(gè)核酸分子具有“互補(bǔ)性”。從完全互補(bǔ)性中偏離是可以允許的,只要這種偏離不完全阻止兩個(gè)分子形成雙鏈結(jié)構(gòu)。為了使一個(gè)核酸分子能夠作為引物或探針,僅需保證其在序列上具有充分的互補(bǔ)性,以使得在所采用的特定溶劑和鹽濃度下能形成穩(wěn)定的雙鏈結(jié)構(gòu)。
術(shù)語(yǔ)“特異性結(jié)合(目標(biāo)序列)”是指在嚴(yán)格雜交條件下引物僅與包含目標(biāo)序列的樣品中的目標(biāo)序列發(fā)生雜交。
本發(fā)明中,“試劑盒”可包括本發(fā)明描述的基因組修飾系統(tǒng)與以下的任一種或全部:測(cè)定試劑、緩沖液、探針和/或引物、和無(wú)菌鹽水或另一種藥學(xué)上可接受的乳劑和懸液基底。此外,試劑盒可包括含有用于實(shí)踐本發(fā)明描述的方法的用法說(shuō)明(例如,操作方案)的說(shuō)明性材料。
轉(zhuǎn)化方案以及將核苷酸序列導(dǎo)入植物的方案依定向轉(zhuǎn)化的植物或植物細(xì)胞類型而異,即單子葉植物或雙子葉植物。將核苷酸序列導(dǎo)入植物細(xì)胞并隨后插入植物基因組中的適合方法包括但不限于,農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化、微量發(fā)射轟擊、直接將dna攝入原生質(zhì)體、電穿孔或晶須硅介導(dǎo)的dna導(dǎo)入。已經(jīng)轉(zhuǎn)化的細(xì)胞可按照常規(guī)的方式生長(zhǎng)成植物。這些植物被培育,用相同的轉(zhuǎn)化株或不同的轉(zhuǎn)化株授粉,得到的雜交體表達(dá)所需的被鑒定的表現(xiàn)型特征??膳嘤蚨啻员WC穩(wěn)定地保持和遺傳所需表現(xiàn)型特征的表達(dá),然后收獲可保證得到所需表現(xiàn)型特征表達(dá)的種子。
本發(fā)明提供了一種提高同源重組效率的方法,具有以下優(yōu)點(diǎn):
1、本發(fā)明首次將foki-dcas9融合蛋白應(yīng)用于提高同源重組效率,利用foki二聚體的內(nèi)切酶活性,使得同源重組靶位點(diǎn)被切開的概率提高,以提高同源重組效率。
2、本發(fā)明為基因組編輯技術(shù)實(shí)現(xiàn)高效同源重組編輯提供了一種新的選擇,提高同源重組效率的同時(shí),也減少了轉(zhuǎn)化受體的使用量。
下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說(shuō)明
圖1為本發(fā)明提高同源重組效率方法中重組克隆剪刀載體dbn01-t構(gòu)建流程圖;
圖2為本發(fā)明提高同源重組效率方法中重組表達(dá)載體dbn-get326構(gòu)建流程圖;
圖3為本發(fā)明提高同源重組效率方法中重組表達(dá)載體dbn-get344載體結(jié)構(gòu)示意圖;
圖4為本發(fā)明提高同源重組效率方法中重組表達(dá)載體dbn-get345載體結(jié)構(gòu)示意圖;
圖5為本發(fā)明提高同源重組效率方法中水稻抗性愈傷gus染色標(biāo)準(zhǔn)圖。
具體實(shí)施方式
下面通過(guò)具體實(shí)施例進(jìn)一步說(shuō)明本發(fā)明提高同源重組效率方法的技術(shù)方案。
第一實(shí)施例、剪刀載體構(gòu)建
1.構(gòu)建基礎(chǔ)載體和重組克隆剪刀載體
將pcambia2300(cambia機(jī)構(gòu)可以提供)載體進(jìn)行改造,利用常規(guī)的酶切方法構(gòu)建載體是本領(lǐng)域技術(shù)人員所熟知的,通過(guò)點(diǎn)突變?nèi)サ魀cambia2300載體上的bsai位點(diǎn),同時(shí)將卡那霉素表達(dá)盒去掉,得到pdbn骨架載體。向所述pdbn骨架載體引入pat表達(dá)盒,得到表達(dá)載體dbn-pat用于下述載體構(gòu)建。
將合成的csy4-t2a-foki-dcas9核苷酸序列連入克隆載體pgem-t(promega,madison,usa,cat:a3600)上,操作步驟按promega公司產(chǎn)品pgem-t載體說(shuō)明書進(jìn)行,得到重組克隆剪刀載體dbn01-t,其構(gòu)建流程如圖1所示(其中,amp表示氨芐青霉素抗性基因;f1表示噬菌體f1的復(fù)制起點(diǎn);lacz為lacz起始密碼子;sp6為sp6rna聚合酶啟動(dòng)子;t7為t7rna聚合酶啟動(dòng)子;csy4-t2a-foki-dcas9為csy4-t2a-foki-dcas9核苷酸序列(csy4-t2a-foki-dcas9核苷酸序列如seqidno:1所示;csy4氨基酸序列如seqidno:2所示,t2a多肽序列如seqidno:3所示;foki的氨基酸序列如seqidno:4所示;dcas9氨基酸序列如seqidno:5所示);mcs為多克隆位點(diǎn))。
然后將重組克隆剪刀載體dbn01-t用熱激方法轉(zhuǎn)化大腸桿菌t1感受態(tài)細(xì)胞(transgen,beijing,china,cat:cd501),其熱激條件為:50μl大腸桿菌t1感受態(tài)細(xì)胞、10μl質(zhì)粒dna(重組克隆剪刀載體dbn01-t),42℃水浴90秒;37℃振蕩培養(yǎng)1小時(shí)(100rpm轉(zhuǎn)速下?lián)u床搖動(dòng)),在表面涂有iptg(異丙基硫代-β-d-半乳糖苷)和x-gal(5-溴-4-氯-3-吲哚-β-d-半乳糖苷)的氨芐青霉素(100mg/l)的lb固體培養(yǎng)基(胰蛋白胨10g/l,酵母提取物5g/l,nacl10g/l,瓊脂15g/l,用naoh調(diào)ph至7.5)上生長(zhǎng)過(guò)夜。挑取白色菌落,在lb液體培養(yǎng)基(胰蛋白胨10g/l,酵母提取物5g/l,nacl10g/l,氨芐青霉素100mg/l,用naoh調(diào)ph至7.5)中于溫度37℃條件下培養(yǎng)過(guò)夜。堿法提取其質(zhì)粒:將菌液在12000rpm轉(zhuǎn)速下離心1min,去上清液,沉淀菌體用100μl冰預(yù)冷的溶液i(25mmtris-hcl,10mmedta(乙二胺四乙酸),50mm葡萄糖,ph8.0)懸??;加入200μl新配制的溶液ii(0.2mnaoh,1%sds(十二烷基硫酸鈉)),將管子顛倒4次,混合,置冰上3-5min;加入150μl冰冷的溶液iii(3m醋酸鉀,5m醋酸),立即充分混勻,冰上放置5-10min;于溫度4℃、轉(zhuǎn)速12000rpm條件下離心5min,在上清液中加入2倍體積無(wú)水乙醇,混勻后室溫放置5min;于溫度4℃、轉(zhuǎn)速12000rpm條件下離心5min,棄上清液,沉淀用濃度(v/v)為70%的乙醇洗滌后晾干;加入30μl含rnase(20μg/ml)的te(10mmtris-hcl,1mmedta,ph8.0)溶解沉淀;于溫度37℃下水浴30min,消化rna;于溫度-20℃保存?zhèn)溆谩?/p>
提取的質(zhì)粒經(jīng)snabi和spei酶切鑒定后,對(duì)陽(yáng)性克隆進(jìn)行測(cè)序驗(yàn)證,結(jié)果表明重組克隆剪刀載體dbn01-t中插入的所述foki-dcas9核苷酸序列為序列表中seqidno:1所示的核苷酸序列,即csy4-t2a-foki-dcas9核苷酸序列正確插入。
2.構(gòu)建重組表達(dá)剪刀載體
用限制性內(nèi)切酶snabi和spei分別酶切重組克隆剪刀載體dbn01-t和表達(dá)載體dbn-pat,將切下的csy4-t2a-foki-dcas9核苷酸序列插入表達(dá)載體dbn-pat,利用常規(guī)的酶切方法構(gòu)建載體是本領(lǐng)域技術(shù)人員所熟知的,構(gòu)建成重組表達(dá)載體dbn-get326,其構(gòu)建流程如圖2所示(rb:右邊界;pr35s:花椰菜花葉病毒35s啟動(dòng)子(seqidno:6);csy4-t2a-foki-dcas9:csy4-t2a-foki-dcas9核苷酸序列(csy4-t2a-foki-dcas9核苷酸序列如seqidno:1所示;csy4氨基酸序列如seqidno:2所示;t2a多肽序列如seqidno:3所示;foki的氨基酸序列如seqidno:4所示;dcas9氨基酸序列如seqidno:5所示);t35s:花椰菜花葉病毒35s終止子(seqidno:7);pat:草丁膦乙酰轉(zhuǎn)移酶基因(seqidno:8);lb:左邊界)。
將重組表達(dá)載體dbn-get326用熱激方法轉(zhuǎn)化大腸桿菌t1感受態(tài)細(xì)胞,其熱激條件為:50μl大腸桿菌t1感受態(tài)細(xì)胞、10μl質(zhì)粒dna(重組表達(dá)載體dbn-get326),42℃水浴90秒;37℃振蕩培養(yǎng)1小時(shí)(100rpm轉(zhuǎn)速下?lián)u床搖動(dòng));然后在含50mg/l卡那霉素(kanamycin)的lb固體培養(yǎng)基(胰蛋白胨10g/l,酵母提取物5g/l,nacl10g/l,瓊脂15g/l,用naoh調(diào)ph至7.5)上于溫度37℃條件下培養(yǎng)12小時(shí),挑取白色菌落,在lb液體培養(yǎng)基(胰蛋白胨10g/l,酵母提取物5g/l,nacl10g/l,卡那霉素50mg/l,用naoh調(diào)ph至7.5)中于溫度37℃條件下培養(yǎng)過(guò)夜。堿法提取其質(zhì)粒。將提取的質(zhì)粒用限制性內(nèi)切酶snabi和spei酶切后鑒定,并將陽(yáng)性克隆進(jìn)行測(cè)序鑒定,結(jié)果表明重組表達(dá)載體dbn-get326在snabi和spei位點(diǎn)間的核苷酸序列為序列表中seqidno:1所示核苷酸序列,即csy4-t2a-foki-dcas9核苷酸序列。
第二實(shí)施例、水稻guus驗(yàn)證載體的構(gòu)建
1、guus靶點(diǎn)的選擇
將guus之間的靶序列信息輸入到zifit網(wǎng)站
(http://zifit.partners.org/zifit/choicemenu.aspx)中,選擇一對(duì)可用的靶點(diǎn),即靶點(diǎn)1序列(如seqidno:9所示)和靶點(diǎn)2序列(如seqidno:10所示)。
2、水稻無(wú)靶點(diǎn)載體的構(gòu)建
本實(shí)施例中,無(wú)靶點(diǎn)載體設(shè)計(jì)為prosu6+sgrna+t35s結(jié)構(gòu)。向第一實(shí)施例中所述pdbn骨架載體引入pmi表達(dá)盒、guus表達(dá)盒,利用常規(guī)的酶切方法構(gòu)建載體是本領(lǐng)域技術(shù)人員所熟知的,構(gòu)建成水稻無(wú)靶點(diǎn)載體dbn-get344,其載體結(jié)構(gòu)示意圖如圖3所示(lb:左邊界;prosu6:水稻u6啟動(dòng)子(seqidno:14);csy4-r:csy4切割識(shí)別序列(如seqidno:11所示);sgrna:sgrna序列(如seqidno:15所示);t35s:花椰菜花葉病毒35s終止子(seqidno:7);pr35s:花椰菜花葉病毒35s啟動(dòng)子(seqidno:6);guus:含有靶點(diǎn)1序列和靶點(diǎn)2序列的gus基因(如seqidno:16所示);tnos:胭脂堿合成酶基因的終止子(seqidno:17);prubi:玉米泛素(ubiquitin)基因啟動(dòng)子(seqidno:18);pmi:磷酸甘露糖異構(gòu)酶基因(seqidno:19);rb:右邊界)。
按照第一實(shí)施例2中的方法,將無(wú)靶點(diǎn)載體dbn-get344用熱激方法轉(zhuǎn)化大腸桿菌;堿法提取的質(zhì)粒經(jīng)asci和avrii酶切鑒定后,對(duì)陽(yáng)性克隆進(jìn)行測(cè)序驗(yàn)證,結(jié)果表明無(wú)靶點(diǎn)載體dbn-get344構(gòu)建正確。
3、水稻靶點(diǎn)載體的構(gòu)建
本實(shí)施例中,靶點(diǎn)載體設(shè)計(jì)為prosu6+靶點(diǎn)+sgrna+t35s結(jié)構(gòu)。兩個(gè)靶點(diǎn)+sgrna之間連接有csy4切割識(shí)別序列。通過(guò)限制性內(nèi)切酶bsai將各個(gè)片段無(wú)縫連接在一起。csy4切割識(shí)別序列如seqidno:11所示。本實(shí)施例中使用的2個(gè)靶點(diǎn)為:
靶點(diǎn)1序列,如seqidno:9所示;
靶點(diǎn)2序列,如seqidno:10所示。
引入靶點(diǎn)1和靶點(diǎn)2的引物如下:
正向引物:acatcaggtctccaaacggaggcattggtgcttcttggttttagagctagaaata,如seqidno:12所示;
反向引物:taggatggtctcgaaaacgtcgaggatgcctgggttgcctgcctatacggcagtgaacgcac,如seqidno:13所示;
其中,上述引物5’端的粗體小寫字母為保護(hù)堿基,斜體小寫字母為酶切位點(diǎn)bsai,帶下劃線的小寫字母為酶切位點(diǎn)bsai的粘性末端。
以合成的sgrna+cys4識(shí)別序列為模板(擴(kuò)增體系中<250ng),將靶點(diǎn)1序列和靶點(diǎn)2序列通過(guò)上述正向引物和反向引物帶入模板,用pfu酶(neb)進(jìn)行pcr擴(kuò)增,pcr體系如下:
pcr反應(yīng)條件為:98℃預(yù)變性30s,然后進(jìn)入下列循環(huán):98℃變性10s,56-60℃退火30s,72℃延伸30s/kb,共30-32個(gè)循環(huán),最后72℃延伸5-10min;于4℃保存。
pcr擴(kuò)增后得到含有靶位點(diǎn)序列+sgrna+csy4切割識(shí)別序列的產(chǎn)物,使用過(guò)柱純化試劑盒(購(gòu)自北京全式金生物技術(shù)有限公司)對(duì)上述pcr產(chǎn)物過(guò)柱純化,具體方法參考其產(chǎn)品說(shuō)明書;bsai酶切pcr產(chǎn)物和表達(dá)載體dbn-get344,切膠回收對(duì)應(yīng)酶切產(chǎn)物后,將酶切后的表達(dá)載體dbn-get344產(chǎn)物和pcr產(chǎn)物按照1:10的比例用t4連接酶于溫度16℃下連接30min,利用常規(guī)的酶切方法構(gòu)建載體是本領(lǐng)域技術(shù)人員所熟知的,構(gòu)建成水稻靶點(diǎn)載體dbn-get345,其載體結(jié)構(gòu)示意圖如圖4所示(lb:左邊界;prosu6:水稻u6啟動(dòng)子(seqidno:14);csy4-r:csy4切割識(shí)別序列(如seqidno:11所示);靶點(diǎn)1:靶1序列(seqidno:9);靶點(diǎn)2:靶點(diǎn)2序列(seqidno:10);sgrna:sgrna序列(如seqidno:15所示);t35s:花椰菜花葉病毒35s終止子(seqidno:7);pr35s:花椰菜花葉病毒35s啟動(dòng)子(seqidno:6);guus:含有靶點(diǎn)1序列和靶點(diǎn)2序列的gus基因(如seqidno:16所示);tnos:胭脂堿合成酶基因的終止子(seqidno:17);prubi:玉米泛素(ubiquitin)基因啟動(dòng)子(seqidno:18);pmi:磷酸甘露糖異構(gòu)酶基因(seqidno:19);rb:右邊界)。
按照第一實(shí)施例2中的方法,將靶點(diǎn)載體dbn-get345用熱激方法轉(zhuǎn)化大腸桿菌;堿法提取的質(zhì)粒經(jīng)kpni和asci酶切鑒定后,對(duì)陽(yáng)性克隆進(jìn)行測(cè)序驗(yàn)證,結(jié)果表明靶點(diǎn)載體dbn-get345中2個(gè)靶點(diǎn)(靶點(diǎn)1和靶點(diǎn)2)正確插入。
第三實(shí)施例、剪刀載體和guus驗(yàn)證載體轉(zhuǎn)化農(nóng)桿菌
將己經(jīng)構(gòu)建正確的重組表達(dá)載體dbn-get326、dbn-get344和dbn-get345用液氮法轉(zhuǎn)化到農(nóng)桿菌lba4404中,其轉(zhuǎn)化條件為:100μl農(nóng)桿菌lba4404、3μl質(zhì)粒dna(重組表達(dá)載體);置于液氮中5分鐘,37℃溫水浴5分鐘;將轉(zhuǎn)化后的農(nóng)桿菌lba4404接種于lb試管中于溫度28℃、轉(zhuǎn)速為200rpm條件下培養(yǎng)2小時(shí),涂于含50mg/l的利福平(rifampicin)和50mg/l的卡那霉素的lb固體培養(yǎng)基上直至長(zhǎng)出陽(yáng)性單克隆,挑取單克隆培養(yǎng)并提取其質(zhì)粒,用限制性內(nèi)切酶進(jìn)行酶切驗(yàn)證,結(jié)果表明重組表達(dá)載體dbn-get326、dbn-get344和dbn-get345結(jié)構(gòu)完全正確。
按照以下組合將菌液等體積混合:dbn-get326和dbn-get345菌液(靶點(diǎn)處理)、dbn-get326和dbn-get344菌液(無(wú)靶點(diǎn)處理)、dbn-get344菌液(對(duì)照處理),室溫靜置3h,獲得對(duì)應(yīng)處理的農(nóng)桿菌懸浮液。
第四實(shí)施例、獲得穩(wěn)定轉(zhuǎn)化的水稻愈傷
對(duì)于農(nóng)桿菌介導(dǎo)的水稻轉(zhuǎn)化,簡(jiǎn)要地,把水稻種子(日本晴,中國(guó)農(nóng)業(yè)大學(xué)提供)接種在誘導(dǎo)培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、麥芽糖30g/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、植物凝膠3g/l,ph5.8)上,從水稻成熟胚誘導(dǎo)出愈傷組織(步驟1:愈傷誘導(dǎo)步驟),之后,優(yōu)選愈傷組織,用上述3種處理的農(nóng)桿菌懸浮液接觸愈傷組織,其中農(nóng)桿菌能夠?qū)⒛康臉?gòu)建體傳遞至愈傷組織上的至少一個(gè)細(xì)胞(步驟2:侵染步驟)。在此步驟中,愈傷組織優(yōu)選地浸入農(nóng)桿菌懸浮液(od660=0.3,侵染培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、蔗糖30g/l、葡萄糖10g/l、乙酰丁香酮(as)40mg/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、ph5.4))中以啟動(dòng)接種。愈傷組織與農(nóng)桿菌共培養(yǎng)一段時(shí)期(3天)(步驟3:共培養(yǎng)步驟)。優(yōu)選地,愈傷組織在侵染步驟后在固體培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、蔗糖30g/l、葡萄糖10g/l、乙酰丁香酮(as)40mg/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、植物凝膠3g/l,ph5.8)上培養(yǎng)。在此共培養(yǎng)階段后,有一個(gè)“恢復(fù)”步驟。在“恢復(fù)”步驟中,恢復(fù)培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、蔗糖30g/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、植物凝膠3g/l,ph5.8)中至少存在一種己知抑制農(nóng)桿菌生長(zhǎng)的抗生素(頭孢霉素150-250mg/l),不添加植物轉(zhuǎn)化體的選擇劑(步驟4:恢復(fù)步驟)。優(yōu)選地,愈傷組織在有抗生素但沒(méi)有選擇劑的固體培養(yǎng)基上培養(yǎng),以消除農(nóng)桿菌并為侵染細(xì)胞提供恢復(fù)期。接著,接種的愈傷組織在含選擇劑(甘露糖和/或草銨膦)的培養(yǎng)基上培養(yǎng)并選擇生長(zhǎng)著的轉(zhuǎn)化愈傷組織(步驟5:選擇步驟)。優(yōu)選地,所述靶點(diǎn)處理的愈傷組織和所述無(wú)靶點(diǎn)處理的愈傷組織在有甘露糖和草銨膦的篩選固體培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、蔗糖5g/l、甘露糖12.5g/l、草胺磷4mg/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、植物凝膠3g/l,ph5.8)上培養(yǎng),所述對(duì)照處理的愈傷組織在有甘露糖的篩選固體培養(yǎng)基(n6鹽3.1g/l、n6維他命、干酪素300mg/l、蔗糖5g/l、甘露糖12.5g/l、2,4-二氯苯氧乙酸(2,4-d)2mg/l、植物凝膠3g/l,ph5.8)上培養(yǎng),導(dǎo)致轉(zhuǎn)化的細(xì)胞選擇性生長(zhǎng)。將上述篩選得到的抗性愈傷組織進(jìn)行g(shù)us染色分析。
第五實(shí)施例、水稻愈傷的gus染色測(cè)定
分別取穩(wěn)定轉(zhuǎn)化獲得的靶點(diǎn)處理的抗性愈傷組織、無(wú)靶點(diǎn)處理的抗性愈傷組織和對(duì)照處理的抗性愈傷組織作為樣品,參照jefferson等(jeffersonr.a.,burgesss.m.,hirshd.beta-glucuronidasefromescherichiacoliasagenefusionmarker.proc.natl.acad.sci.,1986,83:8447-8454)的方法,通過(guò)在gus染色液中37℃密封染色1-2天,從組織化學(xué)上檢驗(yàn)gus的表達(dá)方式,即guus突變?yōu)間us酶后會(huì)將x-gluc原位分解產(chǎn)生藍(lán)色沉淀,從而可以說(shuō)明foki-dcas9有助于使guus恢復(fù)gus染色。每個(gè)處理設(shè)3次重復(fù),每個(gè)重復(fù)做10個(gè)抗性愈傷組織,取平均值。具體方法如下:
步驟1、5-溴-4-氯-3-吲哚-β-d-葡糖苷酸(x-gluc)按照40mg/ml的濃度溶解到二甲基亞砜(dmso)中,用錫箔紙密封后置于-80℃冰箱中保存;
步驟2、配制gus染色液:100mmnah2po4、10mmna2edta、0.5mmk4[fe(cn)6]·3h2o、0.5mmk3[fe(cn)6]、體積比為1%的聚乙二醇辛基苯基醚(tritonx-100),用ph計(jì)調(diào)ph至7.0,加水定容至1l;
步驟3、在步驟2配制好的gus染色液中加入步驟1密封保存的x-gluc,使x-gluc終濃度為0.5mg/ml,用于gus染色;
步驟4、分別取靶點(diǎn)處理的抗性愈傷組織、無(wú)靶點(diǎn)處理的抗性愈傷組織和對(duì)照處理的抗性愈傷組織各30個(gè),每3??剐杂鷤M織放入1支2ml離心管中,加入步驟3獲得的gus染色液并沒(méi)過(guò)樣品,于37℃恒溫箱中放置24-48h后,目測(cè)染色情況。
gus染色結(jié)果如表1所示,在上述gus染色驗(yàn)證同源重組效率的實(shí)驗(yàn)中,將gus染色的程度分為四個(gè)等級(jí),即+++、++、+、-,依次表示大部分細(xì)胞深藍(lán)色、僅不到一半細(xì)胞藍(lán)色、少數(shù)細(xì)胞藍(lán)色、無(wú)藍(lán)色),gus染色標(biāo)準(zhǔn)如圖5所示,gus染色實(shí)驗(yàn)結(jié)果如表1所示,約有24%所述靶點(diǎn)處理的抗性愈傷組織發(fā)生了gus回復(fù)突變(染色程度為+的占14.00%),說(shuō)明靶點(diǎn)與foki-dcas9融合蛋白共轉(zhuǎn)化時(shí)可以促進(jìn)同源重組的發(fā)生;僅有3.00%的所述對(duì)照處理的抗性愈傷組織的少數(shù)細(xì)胞被gus染成藍(lán)色(染色程度為+);值得注意的是,在沒(méi)有靶點(diǎn)存在的情況下,約有17.20%所述無(wú)靶點(diǎn)處理的抗性愈傷組織發(fā)生了gus回復(fù)突變(染色程度為+),比所述對(duì)照處理的抗性愈傷組織的同源重組效率提高4.7倍,說(shuō)明當(dāng)不存在切割(無(wú)靶點(diǎn))時(shí),foki-dcas9融合蛋白能單獨(dú)促進(jìn)同源重組的產(chǎn)生,并且通過(guò)過(guò)量表達(dá)能顯著提高同源重組效率。
綜上所述,本發(fā)明了首次提供了foki-dcas9融合蛋白能夠促進(jìn)同源重組的發(fā)生,并且顯著提高細(xì)胞內(nèi)同源重組效率,同時(shí)也大大的減少了對(duì)轉(zhuǎn)化受體的需求,為高效同源重組編輯提供了一種新的選擇。
最后所應(yīng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的精神和范圍。
sequencelisting
<110>北京大北農(nóng)生物技術(shù)有限公司
<120>提高同源重組效率的方法
<130>dbnbc120
<160>19
<170>patentinversion3.3
<210>1
<211>5523
<212>dna
<213>artificialsequence
<220>
<223>csy4-t2a-foki-dcas9核苷酸序列
<400>1
atgggcgaccactacctggacatcaggctgaggccggacccggagttcccgccggcccag60
ctgatgagcgtgctgttcggcaagctgcaccaggcactggtggcccagggcggcgacagg120
atcggcgtgagcttcccggacctggacgagagcaggagcaggctgggcgagaggctgaga180
atccacgccagcgccgacgacctgagggcactgctggccaggccgtggctggagggcctg240
agggaccacctgcaattcggcgagccggccgtggtgccgcacccgaccccgtacaggcag300
gtgagcagggtgcaggccaagagcaacccggagaggctgaggaggaggctgatgaggagg360
cacgacctgagcgaggaggaggccaggaagagaatcccggacaccgtggcaagggccctg420
gacctgccgttcgtgaccctgaggagccagagcaccggccagcacttcaggctgttcatc480
aggcacggcccgctacaggtgaccgccgaggagggcggcttcacctgctacggcctgagc540
aagggcggcttcgtgccgtggttcgagggcaggggcagcctgctgacctgcggcgacgtg600
gaggagaacccgggcccgatgccgaagaagaagaggaaggtgtcctcccagctcgtgaag660
tccgagctcgaggagaagaagtccgagctccgccacaagctcaagtacgtgccgcacgag720
tacatcgagctcatcgagatcgcccgcaactccacccaggaccgcatcctcgagatgaag780
gtgatggagttcttcatgaaggtgtacggctaccgcggcaagcacctcggcggctcccgc840
aagccggacggcgccatctacaccgtgggctccccgatcgactacggcgtgatcgtggac900
accaaggcctactccggcggctacaacctcccgatcggccaggccgacgagatgcagcgc960
tacgtggaggagaaccagacccgcaacaagcacatcaacccgaacgagtggtggaaggtg1020
tacccgtcctccgtgaccgagttcaagttcctcttcgtgtccggccacttcaagggcaac1080
tacaaggcccagctcacccgcctcaaccacatcaccaactgcaacggcgccgtgctctcc1140
gtggaggagctcctcatcggcggcgagatgatcaaggccggcaccctcaccctcgaggag1200
gtgcgccgcaagttcaacaacggcgagatcaacttcggcggcggcggcagcatggactac1260
aaggaccacgacggggattacaaagaccacgacatagactacaaggatgacgatgacaaa1320
atggcaccgaagaaaaaaaggaaggtcggaatccatggcgttccagctgccgataagaaa1380
tattccatcggactcgccattggcacgaatagcgtcggatgggctgttattactgatgag1440
tacaaagttccgtctaagaagttcaaggtgctgggcaacacagaccgccacagcataaag1500
aaaaatctcatcggtgcactccttttcgatagtggggagactgcagaagcgacaagattg1560
aaaaggactgcgagaaggcgctatacacggcgtaagaatagaatctgctaccttcaggag1620
attttctctaacgaaatggctaaggtcgatgacagtttctttcatagacttgaggaatcg1680
ttcttggttgaggaggataagaaacatgagaggcacccgatatttggaaacatcgtggat1740
gaggtcgcatatcatgaaaagtaccccacaatctaccacctgagaaagaaactcgttgat1800
tccaccgacaaagcggatttgagactcatctacctcgctcttgcccatatgataaagttc1860
cgcggacactttctgatcgagggcgacctcaaccctgataatagcgacgtcgataagctc1920
ttcatccagttggttcaaacctacaatcagctctttgaggaaaacccaattaatgctagt1980
ggagtggatgcaaaagcgatactgtcggccagactctccaagagcagaaggttggagaac2040
ctgatcgctcaacttcctggagaaaagaaaaacggtctttttgggaatttgattgccttg2100
tctctgggcctcacaccaaacttcaagtcaaattttgacctcgctgaggatgccaaactt2160
cagttgtctaaggatacctatgatgacgatcttgacaatttgctggcacaaattggcgac2220
cagtacgcggatctgttcctcgcagcgaagaatctgagtgatgctattctcctttcggac2280
atactcagggttaacactgagatcacaaaagcacctttgagtgcgtcgatgattaagcgc2340
tatgatgaacatcaccaagacctcactttgctgaaggcccttgtgcggcagcaattgcca2400
gagaagtacaaagaaatcttctttgaccaatctaagaacggatacgctggctatattgat2460
ggaggagcttctcaggaggaattctataagtttatcaaacctatacttgagaagatggat2520
ggtacagaggaactccttgttaaattgaacagagaagatttgctgcgcaagcaacggacc2580
tttgacaacggatcaattccgcatcagatacacctcggcgagcttcatgccatccttcgc2640
cggcaggaagatttctacccctttttgaaggacaaccgcgagaagatagaaaaaatcctt2700
acgttccggattccttactatgtgggtccattggcaagggggaattcccgctttgcgtgg2760
atgactcggaaaagcgaggaaactatcacaccgtggaacttcgaggaagttgtggacaag2820
ggagcttctgcccaatcattcattgagaggatgactaacttcgataagaacctgccgaac2880
gagaaagttctccccaagcactccctcctttacgagtatttcaccgtgtataacgaactt2940
acgaaggttaaatacgtgactgagggtatgaggaagccagcattcttgagcggggaacaa3000
aagaaagcgattgttgatttgctgtttaaaactaatcgcaaggtgacagtcaagcagctc3060
aaagaggattatttcaagaaaattgaatgtttcgactctgtggagatatcaggagtcgaa3120
gataggtttaacgcttcccttggcacataccatgacctccttaagatcattaaggacaaa3180
gatttcctggataacgaggaaaatgaggacatcctcgaagatattgttcttaccttgacg3240
ctgtttgaggatcgcgaaatgatcgaggaacggcttaagacgtatgctcacttgttcgac3300
gataaggttatgaagcagctcaagcgtagaaggtacactggatggggccgtctgtctaga3360
aagctcatcaacggaatacgtgataaacaaagtggcaagacaattttggattttctgaag3420
tcggacggattcgccaacagaaattttatgcagctgattcatgacgatagtctcaccttc3480
aaagaggacatacagaaggctcaagtgagtggtcaaggggattcgctgcatgaacacatc3540
gcaaacctcgcgggttcaccggccataaagaaaggaatccttcaaactgttaaggtcgtt3600
gatgagttggttaaagtgatgggtaggcacaagcccgaaaacatagtgatcgagatggct3660
cgcgaaaatcagactacacaaaaagggcagaagaactctcgcgagcggatgaaaaggatt3720
gaggaaggaatcaaggaactgggctcacagattctcaaagagcatccagtcgaaaacaca3780
cagctgcaaaatgagaagctctatctttactatctccaaaatggccgggacatgtatgtt3840
gatcaggagcttgacatcaaccgtttgtccgactatgatgtggacgccattgtcccgcaa3900
tctttccttaaggacgattcaatcgataataaggtgttgacccggagcgataaaaaccgt3960
ggaaagtctgacaatgtcccttcagaggaagtggttaagaagatgaagaactactggaga4020
caattgctgaatgcaaaactgatcacacagagaaagttcgacaacctcaccaaagcagag4080
agaggtgggctcagtgaacttgataaagcgggcttcattaagcgtcagctcgttgagact4140
agacagatcacgaagcatgtcgcgcagattttggattcgcggatgaacacgaagtacgac4200
gagaatgataaactgatacgtgaagtcaaggttatcactcttaagtccaaattggtgagc4260
gatttcagaaaggacttccaattctataaggtcagggagatcaacaattatcatcacgct4320
cacgatgcctaccttaatgctgttgtggggaccgcccttattaagaaataccctaaattg4380
gagtctgaattcgtttacggggattataaggtctacgacgttaggaaaatgatagctaag4440
agtgagcaggagatcggtaaagcaactgcgaagtatttcttttactcgaacatcatgaat4500
ttctttaagaccgagataacgctggcaaatggcgaaattagaaagaggcctctcatagag4560
actaacggtgagacaggggaaatcgtctgggataagggtagggactttgcgacagtgcgc4620
aaggtcctctctatgccgcaagttaatattgtgaagaaaaccgaggtgcagacgggaggc4680
ttctccaaggaaagcatacttcccaaacggaactctgataagttgatcgctcgtaagaaa4740
gattgggaccctaagaaatatggtgggttcgattccccaactgttgcttacagcgtgctg4800
gtcgttgccaaggtcgagaagggtaaatccaagaaactcaaaagcgttaaggaactcctt4860
gggattactatcatggagagatcttcattcgaaaagaatcctatcgactttcttgaggcc4920
aaaggatataaggaagttaagaaagatctgataatcaaactcccaaagtactcattgttt4980
gagctggaaaacggcaggaagcgcatgcttgcttccgccggagagttgcagaaagggaac5040
gagttggctctgccttctaagtatgttaacttcctctatcttgcctctcattacgagaag5100
ctcaaaggctcaccagaggacaacgaacagaaacaactttttgtcgagcaacataagcac5160
tatttggatgagattatagaacagatcagtgaattctcgaaaagggttatccttgcagat5220
gcgaatcttgacaaggtgttgtctgcatacaacaaacatagagataagccgatcagggag5280
caagcggaaaatatcattcacctcttcactcttacaaacttgggtgctcccgctgccttc5340
aagtattttgataccacgattgaccggaaacgttacacctcaacgaaggaggtgctggat5400
gccaccctcatccaccaatctattaccggactctacgagactagaatcgatctctcacag5460
ctcggcggggataaaagaccagcagcgacgaaaaaggcaggacaggctaagaagaagaaa5520
tag5523
<210>2
<211>188
<212>prt
<213>pseudomonasaeruginosa
<400>2
metglyasphistyrleuaspileargleuargproaspprogluphe
151015
proproalaglnleumetservalleupheglylysleuhisglnala
202530
leuvalalaglnglyglyaspargileglyvalserpheproaspleu
354045
aspgluserargserargleuglygluargleuargilehisalaser
505560
alaaspaspleuargalaleuleualaargprotrpleugluglyleu
65707580
argasphisleuglnpheglygluproalavalvalprohisprothr
859095
protyrargglnvalserargvalglnalalysserasnprogluarg
100105110
leuargargargleumetargarghisaspleusergluglugluala
115120125
arglysargileproaspthrvalalaargalaleuaspleuprophe
130135140
valthrleuargserglnserthrglyglnhispheargleupheile
145150155160
arghisglyproleuglnvalthralaglugluglyglyphethrcys
165170175
tyrglyleuserlysglyglyphevalprotrpphe
180185
<210>3
<211>18
<212>prt
<213>foot-and-mouthdiseasevirus
<400>3
gluglyargglyserleuleuthrcysglyaspvalglugluasnpro
151015
glypro
<210>4
<211>198
<212>prt
<213>flavobacteriumokeanokoites
<400>4
serserglnleuvallyssergluleugluglulyslyssergluleu
151015
arghislysleulystyrvalprohisglutyrilegluleuileglu
202530
ilealaargasnserthrglnaspargileleuglumetlysvalmet
354045
gluphephemetlysvaltyrglytyrargglylyshisleuglygly
505560
serarglysproaspglyalailetyrthrvalglyserproileasp
65707580
tyrglyvalilevalaspthrlysalatyrserglyglytyrasnleu
859095
proileglyglnalaaspglumetglnargtyrvalglugluasngln
100105110
thrargasnlyshisileasnproasnglutrptrplysvaltyrpro
115120125
serservalthrgluphelyspheleuphevalserglyhisphelys
130135140
glyasntyrlysalaglnleuthrargleuasnhisilethrasncys
145150155160
asnglyalavalleuservalglugluleuleuileglyglyglumet
165170175
ilelysalaglythrleuthrleuglugluvalargarglyspheasn
180185190
asnglygluileasnphe
195
<210>5
<211>1423
<212>prt
<213>artificialsequence
<220>
<223>dcas9氨基酸序列
<400>5
metasptyrlysasphisaspglyasptyrlysasphisaspileasp
151015
tyrlysaspaspaspasplysmetalaprolyslyslysarglysval
202530
glyilehisglyvalproalaalaasplyslystyrserileglyleu
354045
alaileglythrasnservalglytrpalavalilethraspglutyr
505560
lysvalproserlyslysphelysvalleuglyasnthrasparghis
65707580
serilelyslysasnleuileglyalaleuleupheaspserglyglu
859095
thralaglualathrargleulysargthralaargargargtyrthr
100105110
argarglysasnargilecystyrleuglngluilepheserasnglu
115120125
metalalysvalaspaspserphephehisargleuglugluserphe
130135140
leuvalglugluasplyslyshisgluarghisproilepheglyasn
145150155160
ilevalaspgluvalalatyrhisglulystyrprothriletyrhis
165170175
leuarglyslysleuvalaspserthrasplysalaaspleuargleu
180185190
iletyrleualaleualahismetilelyspheargglyhispheleu
195200205
ilegluglyaspleuasnproaspasnseraspvalasplysleuphe
210215220
ileglnleuvalglnthrtyrasnglnleupheglugluasnproile
225230235240
asnalaserglyvalaspalalysalaileleuseralaargleuser
245250255
lysserargargleugluasnleuilealaglnleuproglyglulys
260265270
lysasnglyleupheglyasnleuilealaleuserleuglyleuthr
275280285
proasnphelysserasnpheaspleualagluaspalalysleugln
290295300
leuserlysaspthrtyraspaspaspleuaspasnleuleualagln
305310315320
ileglyaspglntyralaaspleupheleualaalalysasnleuser
325330335
aspalaileleuleuseraspileleuargvalasnthrgluilethr
340345350
lysalaproleuseralasermetilelysargtyraspgluhishis
355360365
glnaspleuthrleuleulysalaleuvalargglnglnleuproglu
370375380
lystyrlysgluilephepheaspglnserlysasnglytyralagly
385390395400
tyrileaspglyglyalaserglnglugluphetyrlyspheilelys
405410415
proileleuglulysmetaspglythrglugluleuleuvallysleu
420425430
asnarggluaspleuleuarglysglnargthrpheaspasnglyser
435440445
ileprohisglnilehisleuglygluleuhisalaileleuargarg
450455460
glngluaspphetyrpropheleulysaspasnargglulysileglu
465470475480
lysileleuthrpheargileprotyrtyrvalglyproleualaarg
485490495
glyasnserargphealatrpmetthrarglysserglugluthrile
500505510
thrprotrpasnpheglugluvalvalasplysglyalaseralagln
515520525
serpheilegluargmetthrasnpheasplysasnleuproasnglu
530535540
lysvalleuprolyshisserleuleutyrglutyrphethrvaltyr
545550555560
asngluleuthrlysvallystyrvalthrgluglymetarglyspro
565570575
alapheleuserglygluglnlyslysalailevalaspleuleuphe
580585590
lysthrasnarglysvalthrvallysglnleulysgluasptyrphe
595600605
lyslysileglucyspheaspservalgluileserglyvalgluasp
610615620
argpheasnalaserleuglythrtyrhisaspleuleulysileile
625630635640
lysasplysasppheleuaspasnglugluasngluaspileleuglu
645650655
aspilevalleuthrleuthrleuphegluaspargglumetileglu
660665670
gluargleulysthrtyralahisleupheaspasplysvalmetlys
675680685
glnleulysargargargtyrthrglytrpglyargleuserarglys
690695700
leuileasnglyileargasplysglnserglylysthrileleuasp
705710715720
pheleulysseraspglyphealaasnargasnphemetglnleuile
725730735
hisaspaspserleuthrphelysgluaspileglnlysalaglnval
740745750
serglyglnglyaspserleuhisgluhisilealaasnleualagly
755760765
serproalailelyslysglyileleuglnthrvallysvalvalasp
770775780
gluleuvallysvalmetglyarghislysprogluasnilevalile
785790795800
glumetalaarggluasnglnthrthrglnlysglyglnlysasnser
805810815
arggluargmetlysargileglugluglyilelysgluleuglyser
820825830
glnileleulysgluhisprovalgluasnthrglnleuglnasnglu
835840845
lysleutyrleutyrtyrleuglnasnglyargaspmettyrvalasp
850855860
glngluleuaspileasnargleuserasptyraspvalaspalaile
865870875880
valproglnserpheleulysaspaspserileaspasnlysvalleu
885890895
thrargserasplysasnargglylysseraspasnvalproserglu
900905910
gluvalvallyslysmetlysasntyrtrpargglnleuleuasnala
915920925
lysleuilethrglnarglyspheaspasnleuthrlysalagluarg
930935940
glyglyleusergluleuasplysalaglypheilelysargglnleu
945950955960
valgluthrargglnilethrlyshisvalalaglnileleuaspser
965970975
argmetasnthrlystyraspgluasnasplysleuilearggluval
980985990
lysvalilethrleulysserlysleuvalseraspphearglysasp
99510001005
pheglnphetyrlysvalarggluileasnasntyrhishisala
101010151020
hisaspalatyrleuasnalavalvalglythralaleuilelys
102510301035
lystyrprolysleuglusergluphevaltyrglyasptyrlys
104010451050
valtyraspvalarglysmetilealalyssergluglngluile
105510601065
glylysalathralalystyrphephetyrserasnilemetasn
107010751080
phephelysthrgluilethrleualaasnglygluilearglys
108510901095
argproleuilegluthrasnglygluthrglygluilevaltrp
110011051110
asplysglyargaspphealathrvalarglysvalleusermet
111511201125
proglnvalasnilevallyslysthrgluvalglnthrglygly
113011351140
pheserlysgluserileleuprolysargasnserasplysleu
114511501155
ilealaarglyslysasptrpaspprolyslystyrglyglyphe
116011651170
aspserprothrvalalatyrservalleuvalvalalalysval
117511801185
glulysglylysserlyslysleulysservallysgluleuleu
119011951200
glyilethrilemetgluargserserpheglulysasnproile
120512101215
asppheleuglualalysglytyrlysgluvallyslysaspleu
122012251230
ileilelysleuprolystyrserleuphegluleugluasngly
123512401245
arglysargmetleualaseralaglygluleuglnlysglyasn
125012551260
gluleualaleuproserlystyrvalasnpheleutyrleuala
126512701275
serhistyrglulysleulysglyserprogluaspasnglugln
128012851290
lysglnleuphevalgluglnhislyshistyrleuaspgluile
129513001305
ilegluglnileserglupheserlysargvalileleualaasp
131013151320
alaasnleuasplysvalleuseralatyrasnlyshisargasp
132513301335
lysproilearggluglnalagluasnileilehisleuphethr
134013451350
leuthrasnleuglyalaproalaalaphelystyrpheaspthr
135513601365
thrileasparglysargtyrthrserthrlysgluvalleuasp
137013751380
alathrleuilehisglnserilethrglyleutyrgluthrarg
138513901395
ileaspleuserglnleuglyglyasplysargproalaalathr
140014051410
lyslysalaglyglnalalyslyslyslys
14151420
<210>6
<211>328
<212>dna
<213>cauliflowermosaicvirus
<400>6
ccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctccta60
caaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtgg120
tcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccac180
gtcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatc240
ccactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggac300
acgctgacaagctgactctagcagatct328
<210>7
<211>195
<212>dna
<213>cauliflowermosaicvirus
<400>7
ctgaaatcaccagtctctctctacaaatctatctctctctataataatgtgtgagtagtt60
cccagataagggaattagggttcttatagggtttcgctcatgtgttgagcatataagaaa120
cccttagtatgtatttgtatttgtaaaatacttctatcaataaaatttctaattcctaaa180
accaaaatccagtgg195
<210>8
<211>552
<212>dna
<213>streptomycesviridochromogenes
<400>8
atgagccctgaaagacggcctgtggagattagaccagcgacggcagcggacatggcggcg60
gtgtgcgacatcgtgaaccattacatcgaaacttcaacggtgaacttccgcacagagccc120
caaacaccacaggagtggatcgacgatctggagagacttcaagacagatacccgtggctt180
gttgcagaggtcgagggcgtggtcgcggggatcgcgtatgccggcccgtggaaggcgagg240
aacgcctacgattggacagtggaatccaccgtgtatgtcagccatcgccaccagaggctg300
ggcctcggcagcactctctacacccatctcctgaagagcatggaggcgcagggcttcaag360
tccgtggtcgcagtgattggcctgcctaacgatccatccgtgagactccatgaggccctc420
ggctacactgcgcgcggcactctgcgcgccgcgggctataagcacggcgggtggcatgac480
gtgggcttctggcagagagactttgaacttcccgctcccccaagacctgtcagacccgtt540
acgcagatctaa552
<210>9
<211>20
<212>dna
<213>oryzasativa
<400>9
ggaggcattggtgcttcttg20
<210>10
<211>20
<212>dna
<213>oryzasativa
<400>10
gcaacccaggcatcctcgac20
<210>11
<211>20
<212>dna
<213>pseudomonasaeruginosa
<400>11
gttcactgccgtataggcag20
<210>12
<211>55
<212>dna
<213>artificialsequence
<220>
<223>正向引物
<400>12
acatcaggtctccaaacggaggcattggtgcttcttggttttagagctagaaata55
<210>13
<211>62
<212>dna
<213>artificialsequence
<220>
<223>反向引物
<400>13
taggatggtctcgaaaacgtcgaggatgcctgggttgcctgcctatacggcagtgaacgc60
ac62
<210>14
<211>245
<212>dna
<213>oryzasativa
<400>14
ggatcatgaaccaacggcctggctgtatttggtggttgtgtagggagatggggagaagaa60
aagcccgattctcttcgctgtgatgggctggatgcatgcgggggagcgggaggcccaagt120
acgtgcacggtgagcggcccacagggcgagtgtgagcgcgagaggcgggaggaacagttt180
agtaccacattgcccagctaactcgaacgcgaccaacttataaacccgcgcgctgtcgct240
tgtgt245
<210>15
<211>76
<212>dna
<213>artificialsequence
<220>
<223>sgrna序列
<400>15
gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60
ggcaccgagtcggtgc76
<210>16
<211>3536
<212>dna
<213>artificialsequence
<220>
<223>含有靶點(diǎn)1序列和靶點(diǎn)2序列的gus基因
<400>16
atggtagatctgagggtaaatttctagtttttctccttcattttcttggttaggaccctt60
ttctctttttatttttttgagctttgatctttctttaaactgatctattttttaattgat120
tggttatggtgtaaatattacatagctttaactgataatctgattactttatttcgtgtg180
tctatgatgatgatgatagttacagaaccgacgaacttctctgtacccgatcaacaccga240
aacccgtggcgtcttcgacctcaatggcgtctggaacttcaagctggactacgggaaagg300
actggaagagaagtggtacgaaagcaagctgaccgacactattagtatggccgtcccaag360
cagttacaatgacattggcgtgaccaaggaaatccgcaaccatatcggatatgtctggta420
cgaacgtgagttcacggtgccggcctatctgaaggatcagcgtatcgtgctccgcttcgg480
ctctgcaactcacaaagcaattgtctatgtcaatggtgagctggtcgtggagcacaaggg540
cggattcctgccattcgaagcggaaatcaacaactcgctgcgtgatggcatgaatcgcgt600
caccgtcgccgtggacaacatcctcgacgatagcaccctcccggtggggctgtacagcga660
gcgccacgaagagggcctcggaaaagtcattcgtaacaagccgaacttcgacttcttcaa720
ctatgcaggcctgcaccgtccggtgaaaatctacacgaccccgtttacgtacgtcgagga780
catctcggttgtgaccgacttcaatggcccaaccgggactgtgacctatacggtggactt840
tcaaggcaaagccgaaaacctgaactgaactgaactgaaggttatgacattccaagcgga900
tggaagatcctgccggtgttagccgcggtgcatctggactcgtccctgtacgaggacccc960
cagcgcttcaatccctggagatggaaggtcagtcgcaataggattatcagtgtctcaagg1020
cgccattcagttccccgtgttccacaagaagcaccaatgcctccgcccatggtctgtccg1080
tgcaacccaggcatcctcgaccggagcatcaggagcaggaaaaggaggaggattgaacaa1140
tctacaggaagaggtctaaaaagctgcctgtgcggtggctggcttcctgcactgcatgca1200
ggtcgatctctgcgacgggcgacggcgcgcgtcgaggcgttggcggcatgcgcggtcatc1260
gctcacgcgtccgcggggatggtggcctgcggtgaccgcggagcttgtaaggataatgag1320
gtactggctggaaggcccaagagcgggcgaggtagaggtgttcgcgaacctgccgggctt1380
ccccgacaacgtgcgctccaacggcaggggccagttctgggtggcgatcgactgctgccg1440
gacgccggcgcaggaggtgttcgccaagaggccgtggctccggaccctatacttcaagtt1500
cccgctgtcgctcaaggtgctcacttggaaggccgccaggaggatgcacacggtgctcgc1560
gctcctcgacggcgaagggcgcgtcgtggaggtgctcgaggaccggggccacgaggtgat1620
gaagctggtgagtgaggtgcgggaggtgggcagcaagctgtggatcggaaccgtggcgca1680
caaccacatcgccaccatcccctaccctttagaggactaattttacccgtggcgtcttcg1740
acctcaatggcgtctggaacttcaagctggactacgggaaaggactggaagagaagtggt1800
acgaaagcaagctgaccgacactattagtatggccgtcccaagcagttacaatgacattg1860
gcgtgaccaaggaaatccgcaaccatatcggatatgtctggtacgaacgtgagttcacgg1920
tgccggcctatctgaaggatcagcgtatcgtgctccgcttcggctctgcaactcacaaag1980
caattgtctatgtcaatggtgagctggtcgtggagcacaagggcggattcctgccattcg2040
aagcggaaatcaacaactcgctgcgtgatggcatgaatcgcgtcaccgtcgccgtggaca2100
acatcctcgacgatagcaccctcccggtggggctgtacagcgagcgccacgaagagggcc2160
tcggaaaagtcattcgtaacaagccgaacttcgacttcttcaactatgcaggcctgcacc2220
gtccggtgaaaatctacacgaccccgtttacgtacgtcgaggacatctcggttgtgaccg2280
acttcaatggcccaaccgggactgtgacctatacggtggactttcaaggcaaagccgaaa2340
ccgtgaaagtgtcggtcgtggatgaggaaggcaaagtggtcgcaagcaccgagggcctga2400
gcggtaacgtggagattccgaatgtcatcctctgggaaccactgaacacgtatctctacc2460
agatcaaagtggaactggtgaacgacggactgaccatcgatgtctatgaagagccgttcg2520
gcgtgcggaccgtggaagtcaacgacggcaagttcctcatcaacaacaaaccgttctact2580
tcaagggctttggcaaacatgaggacactcctatcaacggccgtggctttaacgaagcga2640
gcaatgtgatggatttcaatatcctcaaatggatcggtgccaacagcttccggaccgcac2700
actatccgtactctgaagagttgatgcgtcttgcggatcgcgagggtctggtcgtgatcg2760
acgagactccggcagttggcgtgcacctcaacttcatggccaccacgggactcggcgaag2820
gcagcgagcgcgtcagtacctgggagaagattcggacgtttgagcaccatcaagacgttc2880
tccgtgaactggtgtctcgtgacaagaaccatccaagcgtcgtgatgtggagcatcgcca2940
acgaggcggcgactgaggaagagggcgcgtacgagtacttcaagccgttggtggagctga3000
ccaaggaactcgacccacagaagcgtccggtcacgatcgtgctgtttgtgatggctaccc3060
cggagacggacaaagtcgccgaactgattgacgtcatcgcgctcaatcgctataacggat3120
ggtacttcgatggcggtgatctcgaagcggccaaagtccatctccgccaggaatttcacg3180
cgtggaacaagcgttgcccaggaaagccgatcatgatcactgagtacggcgcagacaccg3240
ttgcgggctttcacgacattgatccagtgatgttcaccgaggaatatcaagtcgagtact3300
accaggcgaaccacgtcgtgttcgatgagtttgagaacttcgtgggtgagcaagcgtgga3360
acttcgcggacttcgcgacctctcagggcgtgatgcgcgtccaaggaaacaagaagggcg3420
tgttcactcgtgaccgcaagccgaagctcgccgcgcacgtctttcgcgagcgctggacca3480
acattccagatttcggctacaagaacgctagccatcaccatcaccatcacgtgtga3536
<210>17
<211>253
<212>dna
<213>agrobacteriumtumefaciens
<400>17
gatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcg60
atgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgc120
atgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatac180
gcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatct240
atgttactagatc253
<210>18
<211>1992
<212>dna
<213>zeamays
<400>18
ctgcagtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtcta60
agttataaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatcta120
tctttatacatatatttaaactttactctacgaataatataatctatagtactacaataa180
tatcagtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattga240
gtattttgacaacaggactctacagttttatctttttagtgtgcatgtgttctccttttt300
ttttgcaaatagcttcacctatataatacttcatccattttattagtacatccatttagg360
gtttagggttaatggtttttatagactaatttttttagtacatctattttattctatttt420
agcctctaaattaagaaaactaaaactctattttagtttttttatttaataatttagata480
taaaatagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaa540
aactaaggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcga600
cgagtctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcaga660
cggcacggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttgg720
acttgctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcac780
ggcaggcggcctcctcctcctctcacggcacggcagctacgggggattcctttcccaccg840
ctccttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctt900
tccccaacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccac960
ccgtcggcacctccgcttcaaggtacgccgctcgtcctccccccccccccctctctacct1020
tctctagatcggcgttccggtccatggttagggcccggtagttctacttctgttcatgtt1080
tgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcgacc1140
tgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctggg1200
atggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgcata1260
gggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggtca1320
tcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgttct1380
agatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgtat1440
gtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatcta1500
ggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgttc1560
gcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagtag1620
aatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtcata1680
catcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtatacatg1740
ttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatgct1800
ctaaccttgagtacctatctattataataaacaagtatgttttataattattttgatctt1860
gatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgccttc1920
atacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttggtg1980
ttacttctgcag1992
<210>19
<211>1176
<212>dna
<213>escherichiacoli
<400>19
atgcaaaaactcattaactcagtgcaaaactatgcctggggcagcaaaacggcgttgact60
gaactttatggtatggaaaatccgtccagccagccgatggccgagctgtggatgggcgca120
catccgaaaagcagttcacgagtgcagaatgccgccggagatatcgtttcactgcgtgat180
gtgattgagagtgataaatcgactctgctcggagaggccgttgccaaacgctttggcgaa240
ctgcctttcctgttcaaagtattatgcgcagcacagccactctccattcaggttcatcca300
aacaaacacaattctgaaatcggttttgccaaagaaaatgccgcaggtatcccgatggat360
gccgccgagcgtaactataaagatcctaaccacaagccggagctggtttttgcgctgacg420
cctttccttgcgatgaacgcgtttcgtgaattttccgagattgtctccctactccagccg480
gtcgcaggtgcacatccggcgattgctcactttttacaacagcctgatgccgaacgttta540
agcgaactgttcgccagcctgttgaatatgcagggtgaagaaaaatcccgcgcgctggcg600
attttaaaatcggccctcgatagccagcagggtgaaccgtggcaaacgattcgtttaatt660
tctgaattttacccggaagacagcggtctgttctccccgctattgctgaatgtggtgaaa720
ttgaaccctggcgaagcgatgttcctgttcgctgaaacaccgcacgcttacctgcaaggc780
gtggcgctggaagtgatggcaaactccgataacgtgctgcgtgcgggtctgacgcctaaa840
tacattgatattccggaactggttgccaatgtgaaattcgaagccaaaccggctaaccag900
ttgttgacccagccggtgaaacaaggtgcagaactggacttcccgattccagtggatgat960
tttgccttctcgctgcatgaccttagtgataaagaaaccaccattagccagcagagtgcc1020
gccattttgttctgcgtcgaaggcgatgcaacgttgtggaaaggttctcagcagttacag1080
cttaaaccgggtgaatcagcgtttattgccgccaacgaatcaccggtgactgtcaaaggc1140
cacggccgtttagcgcgtgtttacaacaagctgtaa1176