相關(guān)申請(qǐng)的交叉參考
本申請(qǐng)要求2014年7月14日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/023,996的優(yōu)先權(quán),其全部?jī)?nèi)容并入本申請(qǐng)作參考。
發(fā)明領(lǐng)域
本發(fā)明涉及基因編輯的非人牲畜動(dòng)物。本發(fā)明的方法提供了在動(dòng)物中修飾的nanos基因,從而雄性動(dòng)物缺少種系細(xì)胞而雌性動(dòng)物是能生育的。然后所得雄性動(dòng)物用于精原干細(xì)胞移植及用于育種計(jì)劃中。
發(fā)明背景
牲畜中的遺傳增益(geneticgain)可以描述為由于選擇性育種的結(jié)果而在群體的世代-世代之間生產(chǎn)特性的改良。利用這個(gè)原理是食用動(dòng)物生產(chǎn)中的一個(gè)重要方面,以增進(jìn)生長(zhǎng)效率、動(dòng)物健康及消費(fèi)者使用的產(chǎn)品質(zhì)量,同時(shí)也降低環(huán)境影響。在牲畜生產(chǎn)中,大多數(shù)遺傳增益是通過(guò)希望的父系的選擇性育種而產(chǎn)生的。因此,擴(kuò)大父系個(gè)體精子的可利用性可以在全球范圍內(nèi)極大地影響食用動(dòng)物生產(chǎn)。人工授精(ai)方法已經(jīng)用于全世界的商業(yè)化牲畜生產(chǎn)以改良生產(chǎn)特性。盡管具有這些優(yōu)勢(shì),但是在牲畜育種工業(yè)中用于ai的精良公豬和公牛的應(yīng)用由于從個(gè)體可以收集的精子的絕對(duì)數(shù)目有限而受到限制。對(duì)于公豬,一周收集1-2次射出的精液,每次射精產(chǎn)生~20ai劑量。每頭母豬在指定的發(fā)情周期期間人工授精2-3次。因此,每周用希望的父系的精子可以育種低于20頭母豬。因此,顯然需要從希望的父系擴(kuò)充配子輸出和可用性及保持種系的新方法。
精子發(fā)生每天產(chǎn)生數(shù)百萬(wàn)精子,這種巨大數(shù)目的基礎(chǔ)是由含有精原干細(xì)胞(ssc)的未分化的精原細(xì)胞群的功能提供的。ssc一種獨(dú)特的性質(zhì)是其在移植后在受體動(dòng)物睪丸建群并且再生精子發(fā)生的能力。已經(jīng)針對(duì)嚙齒動(dòng)物模型開發(fā)了ssc移植方法,并將該方法針對(duì)豬而加以適應(yīng)提供了有效的育種工具以擴(kuò)增和保存父系個(gè)體的種系和遺傳優(yōu)點(diǎn)。應(yīng)用ssc移植方法的關(guān)鍵方面是:1)產(chǎn)生缺少內(nèi)源性種系細(xì)胞、但是具有完整的支持細(xì)胞群(即sertoli細(xì)胞和睪丸間質(zhì)細(xì)胞(leydig))的受體動(dòng)物;2)在體外擴(kuò)增相對(duì)稀少的供體ssc以產(chǎn)生最佳數(shù)目以成功移植進(jìn)一些受體雄性動(dòng)物中;及3)將ssc注射進(jìn)受體睪丸中。
供體ssc建群的效率受到受體睪丸環(huán)境的影響。消除內(nèi)源性生殖細(xì)胞對(duì)于供體ssc可達(dá)到移植在受體睪丸的生精小管中是關(guān)鍵的。此外,精子發(fā)生是由生殖細(xì)胞與睪丸支持細(xì)胞群包括sertoli和睪丸間質(zhì)細(xì)胞之間緊密相互作用而調(diào)節(jié)的。因此,在移植時(shí)體細(xì)胞的健康狀況影響供體ssc建群的成功與否。對(duì)于嚙齒動(dòng)物,用化學(xué)毒性藥物尤其是烷化劑白消安處理成年雄性動(dòng)物及局部睪丸照射均已用于有效地制備ssc移植的受體。雖然這兩種處理均導(dǎo)致內(nèi)源性生殖細(xì)胞耗竭及可以移植供體ssc,但是體細(xì)胞支持細(xì)胞的功能通常受到不利影響,一些內(nèi)源性生殖細(xì)胞總是保持導(dǎo)致再生供體和內(nèi)源性精子發(fā)生的混合物。在小鼠中,最成功的ssc移植包括使用由于在精子發(fā)生的最早階段失活生殖細(xì)胞存活所需的基因而不育的受體。其中存留精原細(xì)胞群的精子發(fā)生的部分消除對(duì)于制備受體是無(wú)效的。在這種情況中,仍必須使用化學(xué)毒性藥物以消除存留的精原細(xì)胞,從而開啟供體ssc移植的小生境(niches)。原始生殖細(xì)胞(pgc)、生殖母細(xì)胞或者ssc的存活被削弱(compromised)的雄性動(dòng)物提供了理想受體。
對(duì)于豬及其它大型家養(yǎng)動(dòng)物,因?yàn)樾枰邉┝克幬镆酝耆臣?xì)胞,因此用化學(xué)毒性藥物處理以制備受體雄性動(dòng)物是不可行的。這些處理通常產(chǎn)生對(duì)于骨髓干細(xì)胞及其它組織特異性干細(xì)胞的不希望的毒性結(jié)果。此外,需要收集糞便和尿液作為生物有害垃圾。局部睪丸照射是一種可能的選項(xiàng),其克服了化學(xué)毒性藥物處理的限制,但是照射劑量需要精確控制且該過(guò)程對(duì)支持細(xì)胞包括睪丸間質(zhì)細(xì)胞造成損害,從而不利地影響來(lái)自供體的精子發(fā)生的產(chǎn)生。理想的受體是由于遺傳缺陷導(dǎo)致缺少內(nèi)源性種系而留下體細(xì)胞支持細(xì)胞群功能是完整的雄性動(dòng)物。
正如所見,在本領(lǐng)域中需要這樣的動(dòng)物,其中雄性動(dòng)物沒有生殖細(xì)胞但是保留功能性體細(xì)胞,因此可以進(jìn)行ssc移植,同時(shí)理想地雌性動(dòng)物是能生育的。
發(fā)明概述
本發(fā)明提供了通過(guò)產(chǎn)生具有調(diào)節(jié)的nanos表達(dá)的受體動(dòng)物進(jìn)行精原干細(xì)胞移植的動(dòng)物和方法。所述動(dòng)物具有失活的或者另外調(diào)節(jié)的nanos基因活性,導(dǎo)致雄性動(dòng)物缺少功能性生殖細(xì)胞而仍保留功能性體細(xì)胞,而雌性動(dòng)物是能生育的。這些動(dòng)物可以使用任何眾多方案如敲除技術(shù)或基因編輯產(chǎn)生。
因此,本發(fā)明的一個(gè)實(shí)施方案是經(jīng)基因編輯的或修飾的牲畜動(dòng)物,其包含具有針對(duì)生殖細(xì)胞功能選擇性失活的nanos基因的基因組。
本發(fā)明再一實(shí)施方案是生產(chǎn)牲畜動(dòng)物的方法,包括將一種物質(zhì)導(dǎo)入牲畜動(dòng)物細(xì)胞或者牲畜動(dòng)物胚胎中,該物質(zhì)特異性結(jié)合細(xì)胞的染色體靶位點(diǎn)并導(dǎo)致雙鏈dna斷裂,或者另外使用基因編輯方法如成簇規(guī)律間隔短回文重復(fù)序列(crispr)/cas系統(tǒng)、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(talen)、鋅指核酸酶(zfn)或者重組融合蛋白失活其中的nanos基因。
本發(fā)明的另一個(gè)實(shí)施方案是產(chǎn)生用于牲畜育種的具有希望的精原干細(xì)胞遺傳成分的雄性動(dòng)物精子供體的方法,所述方法包括:從希望的雄性動(dòng)物供體收集供體ssc,在體外增殖ssc,之后將供體ssc移植至nanos2-/-雄性動(dòng)物,以便產(chǎn)生精子發(fā)生群落及長(zhǎng)時(shí)間保持供體生殖細(xì)胞。
本發(fā)明的再一實(shí)施方案包括產(chǎn)生牲畜動(dòng)物,包括用來(lái)自受體nanaos2-/-雄性的供體精子對(duì)雌性牲畜進(jìn)行天然交配和/或人工授精。
本發(fā)明還描述了一或多個(gè)串聯(lián)的特定nanos基因座與能導(dǎo)致在nanos基因座內(nèi)特定核酸序列裂解和/或整合的多肽的應(yīng)用。串聯(lián)nanos基因座與能導(dǎo)致nanos基因座裂解和/或整合的多肽的應(yīng)用實(shí)例包括選自如下的多肽:鋅指蛋白,大范圍核酸酶,tal結(jié)構(gòu)域,talen,rna指導(dǎo)的crispr/cas重組酶,亮氨酸拉鏈,及本領(lǐng)域已知的其它多肽。特別的實(shí)例包括嵌合(融合)蛋白,其包含位點(diǎn)特異性dna結(jié)合結(jié)構(gòu)域多肽和裂解結(jié)構(gòu)域多肽(例如核酸酶),如包含鋅指多肽和foki核酸酶多肽的zfn蛋白。在一些方面中,本文描述的是包含特異性結(jié)合nanos基因的dna結(jié)合結(jié)構(gòu)域的多肽。在一些實(shí)施方案中,這種多肽也可以包含核酸酶(裂解)結(jié)構(gòu)域或者半結(jié)構(gòu)域(例如zfn、重組酶、轉(zhuǎn)座酶,或者歸巢核酸內(nèi)切酶,包括具有修飾的dna結(jié)合結(jié)構(gòu)域的歸巢核酸內(nèi)切酶、tal結(jié)構(gòu)域、talen、rna指導(dǎo)的crispr/cas),和/或連接酶結(jié)構(gòu)域,由此多肽可誘導(dǎo)靶向雙鏈斷裂,和/或促進(jìn)感興趣的核酸在斷裂位點(diǎn)的重組。在特定的實(shí)施方案中,靶向nanos基因座的dna結(jié)合結(jié)構(gòu)域可以是dna裂解功能性結(jié)構(gòu)域。前述多肽可用于一些實(shí)施方案中以將外源核酸導(dǎo)入宿主生物體(例如動(dòng)物物種)的基因組的一或多個(gè)nanos基因座。在某些實(shí)施方案中,dna結(jié)合結(jié)構(gòu)域包含具有一或多個(gè)鋅指(例如2、3、4、5、6、7、8、9或更多個(gè)鋅指)的鋅指蛋白,其被工程化(非天然發(fā)生的)為結(jié)合nanos基因內(nèi)的任何序列。本文描述的任何鋅指蛋白可以結(jié)合靶基因的編碼序列內(nèi)或者相鄰序列(例如啟動(dòng)子或其它表達(dá)元件)內(nèi)的靶位點(diǎn)。在某些實(shí)施方案中,鋅指蛋白結(jié)合nanos基因中的靶位點(diǎn),例如外顯子1中大約20個(gè)堿基。
通過(guò)如下本發(fā)明的詳細(xì)描述可以明了進(jìn)一步的實(shí)施方案。
附圖描述
圖1是豬基因組的多序列對(duì)比綜合圖,以鑒別在豬nanos2基因內(nèi)潛在的單核苷酸多態(tài)性(以紅點(diǎn)標(biāo)示),其可用于提供信息設(shè)計(jì)基因組編輯試劑。
圖2示出瓊脂糖凝膠上消化的pcr產(chǎn)物的結(jié)果,以鑒別nhej事件?;蚪Mdna從用編碼talen對(duì)a、b或c的質(zhì)粒轉(zhuǎn)染的pk15細(xì)胞制備,隨后用pcr引物osl9和osl10擴(kuò)增。通過(guò)用酶celi消化鑒別錯(cuò)配。
圖3a、3b和3c示出指導(dǎo)rna結(jié)合序列的序列(seqidno:15和seqidno:16)。圖3c示出具有指導(dǎo)序列、人u6啟動(dòng)子、sgrna結(jié)合序列和終止子序列的構(gòu)建體。u6啟動(dòng)子序列(seqidno:18)、靶序列(seqidno:19)、grna支架(seqidno:20)、末端序列(seqidno:21)。
圖4示出作用于pk15細(xì)胞的dna的豬crispr/cas9的瓊脂糖凝膠上的消化的pcr產(chǎn)物。將分別編碼sgrna序列、cag驅(qū)動(dòng)的cas9和cmv驅(qū)動(dòng)的egfp的三個(gè)質(zhì)粒共轉(zhuǎn)染進(jìn)pk15細(xì)胞。使用引物osl9和osl10對(duì)所得基因組dna進(jìn)行pcr。將消化的pcr產(chǎn)物在2%tae瓊脂糖凝膠上解析。這兩個(gè)指導(dǎo)序列導(dǎo)致在靶位點(diǎn)切割及nhej形成(通過(guò)存在celi消化產(chǎn)物示出,紅色箭頭),令人驚奇地發(fā)現(xiàn)與編碼序列相反方向的sgrna序列比其有義對(duì)應(yīng)物實(shí)質(zhì)上更有效。.
圖5a是pspcas9(bb)-2a-gfp(px458)質(zhì)粒圖。圖5b示出px458部分序列(seqidno:22)、hu6序列(seqidno:23)、grna序列(seqidno:24)、末端序列(seqidno:25)的序列注釋。圖5c1-5c3示出完整構(gòu)建體序列(seqidno:43)。
圖6a和6b是轉(zhuǎn)染后基因組dna的pcr產(chǎn)物凝膠,示出通過(guò)存在t7核酸內(nèi)切酶消化產(chǎn)物表示的sgrna在其靶位點(diǎn)能誘導(dǎo)nhej形成的效率中的實(shí)質(zhì)差異(紅色箭頭)。
圖7示出通過(guò)使用不同組合的crispr產(chǎn)生的缺失。照片是基因組dna的凝膠,插入缺失(indel)是用6個(gè)質(zhì)粒組合的引物osl86(seqidno:64)和osl87(seqidno:74)擴(kuò)增。
圖8示出與野生型相比牛插入缺失的序列。
psl32&psl38:wt(seqidno:117),克隆1(seqidno:118);克隆2(seqidno:119);克隆3(seqidno:120);克隆4(seqidno:121);克隆5(seqidno:122)。
psl32&psl39:wt(seqidno:123),克隆1(seqidno:124);克隆2(seqidno:125);克隆3(seqidno:126);克隆4(seqidno:127);克隆5(seqidno:128)。
psl32&psl42wt(seqidno:129),克隆1(seqidno:130);克隆2(seqidno:131);克隆3(seqidno:132);克隆4(seqidno:133);克隆5(seqidno:134).
psl33&psl38wt(seqidno:135),克隆1(seqidno:136);克隆2(seqidno:137);克隆3(seqidno:138);克隆4(seqidno:139);克隆5(seqidno:140)。
psl33&psl39wt(seqidno:141),克隆1(seqidno:142);克隆2(seqidno:143);克隆3(seqidno:144);克隆4(seqidno:145);克隆5(seqidno:146)。
psl33&psl42wt(seqidno:147),克隆1(seqidno:148);克隆2(seqidno:149);克隆3(seqidno:150);克隆4(seqidno:151);克隆5(seqidno:152)。
圖9示出在豬胚胎中nanos2基因座的crispr介導(dǎo)的基因靶向。a)進(jìn)行哺乳動(dòng)物表達(dá)的cmv啟動(dòng)子及在體外轉(zhuǎn)錄cas9:gfp表達(dá)載體的t7啟動(dòng)子的示意圖:ha標(biāo)簽,及nls:核定位表達(dá)的cas9核酸酶蛋白質(zhì)的核定位信號(hào)。t7啟動(dòng)子驅(qū)動(dòng)攜帶指導(dǎo)rna和cas9結(jié)合序列的嵌合單一指導(dǎo)rna(sgrna)表達(dá)盒。b)cas9的示意圖,指定基因組序列的sgrna介導(dǎo)的靶向。c)在證實(shí)從cas9:gfp中表達(dá)第2天的未注射(右側(cè))或者注射(左側(cè))a組表達(dá)盒(cas9:gfp和指導(dǎo)序列)rna的豬1-細(xì)胞胚胎的熒光顯微照片。插圖中示出發(fā)育中胚胎的明視野圖像。d)對(duì)注射的胚胎測(cè)序示出不同程度的插入缺失,其通常是雙等位基因的。野生型序列在上方以突出的序列示出,示出靶指導(dǎo)序列(黃色),及相反方向的pam基序(agg,綠色)。nanos2(seqidno:29);n1-1(seqidno:30);n1-2(seqidno:31);n3-2(seqidno:32);n3-3(seqidno:33);n5-2(seqidno:34);n5-3(seqidno:35);n6-1(seqidno:36);n7-2(seqidno:37);n7-3(seqidno:38);n10-2(seqidno:39);n11-2(seqidno:40);n12-2(seqidno:41);n12-3(seqidno:42)。
圖10a示出對(duì)注射兩個(gè)sgrna的豬胚胎的測(cè)序。如圖所示,注射兩個(gè)sgrna導(dǎo)致nanos2基因座較大節(jié)段缺失,及在nanos2等位基因中插入外來(lái)序列(紅色)。nanos(seqidno:26);nn6-1(seqidno:27);nn7-1和nn7-2(seqidno:28)。圖10b示出來(lái)自胚泡的進(jìn)一步的插入缺失序列:nanos(seqidno:44);n3-1-3(seqidno:45);n3-2-3(seqidno:46);n3-6-2(seqidno:47);n3-7-3(seqidno:48);n3-8-3(seqidno:49);n3-10-2(seqidno:50);n3-12-2(seqidno:51);n3-12-3(seqidno:52)。
圖11示出設(shè)計(jì)單一指導(dǎo)rna對(duì)(切口酶對(duì))靶向相反鏈。這兩個(gè)sgrna在圖中方框中示出,相反鏈以黃色標(biāo)示。這兩個(gè)sgrna的pam基序以綠色標(biāo)示。在靶位點(diǎn)周圍未鑒別修飾。sgrna1(seqidno:53);sgrna2(seqidno:54);nanos(seqidno:55);n2-3(seqidno:56);n3-1(seqidno:57);n4-2(seqidno:58);n5-2(seqidno:59);n6-3(seqidno:60);n7-1(seqidno:61)。
圖12示出具有注釋的設(shè)計(jì)的指導(dǎo)序列和擴(kuò)增引物的牛nanos2序列。完整核苷酸序列(seqidno:62);nanos2cds(seqidno:63);osl86(seqidno:64);psl36或37(seqidno:65);psl34或35(seqidno:66);psl32或33(seqidno:67);psl38或39(seqidno:68);psl39或40(seqidno:69);psl41或42(seqidno:70);psl43或44(seqidno:71);psl45或46(seqidno:72);psl47或48(seqidno:73);osl87(seqidno:74)。
圖13示出產(chǎn)生單-或雙-等位基因敲除nanos2小豬的crispr/cas系統(tǒng)方法。20個(gè)核苷酸指導(dǎo)序列以下劃線標(biāo)示,pam基序以黃色標(biāo)示(注意:指導(dǎo)序列是相反方向)。crispr靶序列在nanos2orf內(nèi)以下劃線標(biāo)示。crispr指導(dǎo)rna序列(seqidno:160);nanos2orf(seqidno:1和2);crispr靶序列(seqidno:161)。
圖14a和14b示出crispr/cas介導(dǎo)的nanos2單-或雙-等位基因敲除小豬的基因型。nanoswt(seqidno:163);nanos豬1-1(seqidno:164);nanos豬1-2(seqidno:165);nanos豬1-3(seqidno:166);nanos豬2-1(seqidno:167);nanos豬2-4(seqidno:168);nanos豬3-1(seqidno:169);nanos豬4-1(seqidno:170);nanos豬4-2(seqidno:171);nanos豬10-1(seqidno:172);nanos豬10-2(seqidno:173);nanos豬11-1(seqidno:174);nanos豬11-4(seqidno:175);nanos豬12-1(seqidno:176);nanos豬12-2(seqidno:177);nanos小豬#1等位基因-1(seqidno:178);nanos小豬#1等位基因-2(seqidno:179);nanos小豬#2等位基因-1(seqidno:180);nanos小豬#2等位基因-2(seqidno:181);nanos小豬#3等位基因-1(seqidno:182);nanos小豬#3等位基因-2(seqidno:183);nanos小豬#4等位基因-1(seqidno:184);nanos小豬#4等位基因-2(seqidno:185);nanos小豬#5等位基因-1(seqidno:186);nanos小豬#5等位基因-2(seqidno:187);nanos小豬#6等位基因-1(seqidno:188);nanos小豬#6等位基因-2(seqidno:189);nanos小豬#7等位基因-1(seqidno:190);nanos小豬#7等位基因-2(seqidno:191);nanos小豬#8等位基因-1(seqidno:192);nanos小豬#8等位基因-2(seqidno:193);nanos小豬#9等位基因-1(seqidno:194);nanos小豬#9等位基因-2(seqidno:195);nanos小豬#10等位基因-1(seqidno:196);nanos小豬#10等位基因-2(seqidno:197);nanos小豬#11等位基因-1(seqidno:198);nanos小豬#11等位基因-2(seqidno:199)。
圖15示出通過(guò)scnt產(chǎn)生的nanos2無(wú)效雄性和雌性小豬的基因型。在圖中,靶向nanos2的20個(gè)核苷酸的指導(dǎo)序列(seqidno:162)以綠色和下劃線標(biāo)示,隨后是3個(gè)核苷酸的pam基序(藍(lán)色標(biāo)示)。在雄性敲除動(dòng)物中,兩個(gè)等位基因在nanos2orf中均具有7個(gè)核苷酸缺失,導(dǎo)致nanos2基因的破壞。在雌性動(dòng)物中,一個(gè)等位基因具有1個(gè)核苷酸缺失及幾個(gè)改變的核苷酸序列,第二個(gè)等位基因具有11個(gè)核苷酸缺失。總之,這些等位基因使得雌性動(dòng)物對(duì)于nanos2是無(wú)效的(null)。
圖16示出3月齡nanos2純合敲除豬的睪丸活檢組織橫切面的代表性圖像。使用光學(xué)顯微鏡生成橫切面活檢組織圖像,示出完整的曲細(xì)精管及存在體細(xì)胞支持細(xì)胞。此外,圖16示出在曲細(xì)精管索內(nèi)不存在多層生殖細(xì)胞。
發(fā)明詳述
根據(jù)所附實(shí)施例對(duì)本發(fā)明進(jìn)行更充分描述。本發(fā)明可以許多不同方式實(shí)施,不應(yīng)解釋為限于本申請(qǐng)陳述的實(shí)施方案;提供這些實(shí)施方案只是為了本發(fā)明滿足可適用的法律要求。
本發(fā)明的一些修改及其它實(shí)施方案將為本發(fā)明所屬領(lǐng)域技術(shù)人員了解,具有本發(fā)明描述和圖表中呈現(xiàn)的教導(dǎo)的益處。結(jié)果,應(yīng)理解本發(fā)明不限于所揭示的特定實(shí)施方案,修改及其它實(shí)施方案包含在所附權(quán)利要求書范圍內(nèi)。盡管本說(shuō)明書中使用了一些特定術(shù)語(yǔ),但是其僅是以一般性和描述性含義使用,無(wú)限制目的。
單位、前綴和符號(hào)以其si公認(rèn)的形式表示。除非特別指出,則核酸以從左至右5’至3’方向書寫;氨基酸序列從左至右氨基至羧基方向書寫。本說(shuō)明書內(nèi)列舉的數(shù)值范圍包含指定范圍的數(shù),也包括指定范圍內(nèi)的每個(gè)整數(shù)。在本文氨基酸可以其通常已知的三字母符號(hào)或者iupac-iub生物化學(xué)命名委員會(huì)推薦的單字母符號(hào)形式表示。同樣,核苷酸可以其通常公認(rèn)的單字母代碼表示。除非另外提供,則如本文所用的軟件、電氣和電子術(shù)語(yǔ)均如thenewieeestandarddictionaryofelectricalandelectronicsterms(5thedition,1993)所定義。下文定義的術(shù)語(yǔ)參考說(shuō)明書總體上更充分地定義。
“擴(kuò)增的”是指使用至少一個(gè)核酸序列作為模板構(gòu)建一個(gè)核酸序列的多個(gè)拷貝或者與該核酸序列互補(bǔ)的多個(gè)拷貝。擴(kuò)增系統(tǒng)包括聚合酶鏈反應(yīng)(pcr)系統(tǒng)、連接酶鏈反應(yīng)(lcr)系統(tǒng)、基于核酸序列擴(kuò)增(nasba,cangene,mississauga,ontario),q-beta復(fù)制酶系統(tǒng)、基于轉(zhuǎn)錄的擴(kuò)增系統(tǒng)(tas),及鏈置換擴(kuò)增(sda)。見例如diagnosticmolecularmicrobiology:principlesandapplications,d.h.persingetal.,ed.,americansocietyformicrobiology,washington,d.c.(1993)所述。擴(kuò)增產(chǎn)物稱作擴(kuò)增子。
術(shù)語(yǔ)“保守修飾的變體”可用于氨基酸序列和核酸序列。關(guān)于特定的核酸序列,“保守修飾的變體”是指編碼相同的或保守修飾的氨基酸序列變體的那些核酸。由于遺傳密碼的簡(jiǎn)并,許多功能相同的核酸編碼任何指定蛋白質(zhì)。例如,密碼子gca、gcc、gcg和gcu均編碼丙氨酸。因此,在其中丙氨酸由密碼子指定的每個(gè)位置,所述密碼子可以改變?yōu)樗鋈魏蜗鄳?yīng)密碼子而不改變編碼的多肽。這種核酸變異是“沉默變異”,代表一種類型的保守修飾變異。在此編碼多肽的每個(gè)核酸序列參考遺傳密碼也描述了核酸的每個(gè)可能的沉默變異。
技術(shù)人員意識(shí)到核酸中的每個(gè)密碼子(除了aug之外,其通常僅是甲硫氨酸的密碼子,及除了ugg之外,其通常僅是色氨酸的密碼子)均可以被修飾以產(chǎn)生功能相同的分子。因此,編碼本發(fā)明多肽的核酸的每個(gè)沉默變異在每個(gè)描述的多肽序列中是隱含的及在本發(fā)明的范圍內(nèi)。
與氨基酸序列一樣,技術(shù)人員意識(shí)到在編碼的序列中改變、添加或缺失一個(gè)氨基酸或小百分比氨基酸的核酸、肽、多肽或蛋白質(zhì)序列的各個(gè)取代、缺失或添加是“保守修飾的變體”,其中所述改變導(dǎo)致氨基酸由化學(xué)相似的氨基酸取代。因此,可以如此改變選自1-15整數(shù)中任何數(shù)目的氨基酸殘基。因此,例如可以產(chǎn)生1、2、3、4、5、7或10個(gè)改變。
保守修飾的變體典型提供了與其從中衍生的未修飾的多肽序列相似的生物學(xué)活性。例如,底物特異性、酶活性或者配體/受體結(jié)合通常是天然蛋白質(zhì)與其天然底物的至少30%、40%、50%、60%、70%、80%或者90%。提供功能相似氨基酸的保守取代表為本領(lǐng)域熟知。
如下六組的每組均含有彼此保守取代的氨基酸:[1]丙氨酸(a),絲氨酸(s),蘇氨酸(t);[2]天冬氨酸(d),谷氨酸(e);[3]天冬酰胺(n),谷氨酰胺(q);[4]精氨酸(r),賴氨酸(k);[5]異亮氨酸(i),亮氨酸(l),甲硫氨酸(m),纈氨酸(v);及[6]苯丙氨酸(f),酪氨酸(y),色氨酸(w)。也見creighton(1984)proteinsw.h.freemanandcompany所述。
關(guān)于指定的核酸所用術(shù)語(yǔ)“編碼”或者“編碼的”是指包含翻譯為指定蛋白質(zhì)的信息。編碼蛋白質(zhì)的核酸可包含在核酸翻譯區(qū)內(nèi)的間插序列(例如內(nèi)含子),或者可以缺少這種間插非翻譯序列(例如在cdna中)。蛋白質(zhì)編碼信息由使用的密碼子指定。典型地,氨基酸序列由核酸使用“通用”遺傳密碼編碼。當(dāng)合成制備或者改變核酸時(shí),可利用表達(dá)核酸的指定宿主的已知密碼子優(yōu)選性。
如本文所用,關(guān)于指定多核苷酸或其編碼蛋白質(zhì)所用術(shù)語(yǔ)“全長(zhǎng)序列”是指具有指定蛋白質(zhì)的天然的(非合成的)、內(nèi)源的、生物學(xué)活性形式的完整氨基酸序列。確定序列是否是全長(zhǎng)序列的方法為本領(lǐng)域熟知,包括這種示例的技術(shù)是northern或western印跡、引物延伸、s1保護(hù)及核糖核酸酶保護(hù)技術(shù)。與已知全長(zhǎng)同源(直系同源和/或旁系同源)序列對(duì)比也可以用于鑒別本發(fā)明的全長(zhǎng)序列。此外,典型地存在于mrna的5’和3’非翻譯區(qū)的共有序列有助于鑒別多核苷酸是否是全長(zhǎng)序列。例如,共有序列annnnaugg有助于確定多核苷酸是否具有完整的5’末端,其中下劃線處密碼子表示n末端甲硫氨酸。在3’末端的共有序列如聚腺苷酸化序列有助于確定多核苷酸是否具有完整的3’末端。
如本文所用,關(guān)于核酸所用術(shù)語(yǔ)“異源”是指源自外源物種的核酸,或者如果源自相同物種則通過(guò)有意人為干預(yù)在組成成分和/或基因組基因座方面從其天然形式加以充分修飾的核酸。例如,與異源結(jié)構(gòu)基因可操縱地連接的啟動(dòng)子來(lái)自與該結(jié)構(gòu)基因從中衍生的物種不同的物種,或者如果來(lái)自相同物種,則其一或二者均從其原始形式進(jìn)行了充分修飾。異源蛋白質(zhì)可以源自外源物種,或者如果源自相同物種則通過(guò)有意人為干預(yù)從其原始形式加以充分修飾。
“宿主細(xì)胞”是指含有載體并支持載體復(fù)制和/或表達(dá)的細(xì)胞。宿主細(xì)胞可以是原核細(xì)胞如大腸桿菌,或者是真核細(xì)胞如酵母、昆蟲、兩棲動(dòng)物或者哺乳動(dòng)物細(xì)胞。
術(shù)語(yǔ)“雜交復(fù)合物”包括通過(guò)彼此選擇性雜交的兩個(gè)單鏈核酸序列形成的雙鏈體核酸結(jié)構(gòu)。
在將核酸插入細(xì)胞中的語(yǔ)境中所用術(shù)語(yǔ)“導(dǎo)入”與“轉(zhuǎn)染”或者“轉(zhuǎn)化”或者“轉(zhuǎn)導(dǎo)”等同,包括將核酸摻入真核細(xì)胞或原核細(xì)胞中,其中所述核酸可以摻入細(xì)胞的基因組中(例如染色體、質(zhì)粒、質(zhì)體或者線粒體dna),轉(zhuǎn)變?yōu)樽灾鲝?fù)制子,或者瞬時(shí)表達(dá)(例如轉(zhuǎn)染的mrna)。
術(shù)語(yǔ)“分離的”是指如核酸或蛋白質(zhì)這樣的材料,其:(1)實(shí)質(zhì)上或者基本上不含在其天然發(fā)生的環(huán)境中發(fā)現(xiàn)的通常伴隨或與其相互作用的成分-分離的材料任選包含在其天然環(huán)境中未與該材料在一起的材料;或者(2)如果材料是在其天然環(huán)境中,則該材料通過(guò)有意人為干預(yù)被合成地改變成分和/或置于細(xì)胞中該材料非天然的位置(例如基因組或者亞細(xì)胞細(xì)胞器)。產(chǎn)生合成材料的改變可以在天然狀態(tài)中對(duì)材料進(jìn)行或者從其天然狀態(tài)中除去。例如,天然發(fā)生的核酸如果通過(guò)在其源自其中的細(xì)胞內(nèi)進(jìn)行人為干預(yù)被改變或者從已經(jīng)被改變的dna中轉(zhuǎn)錄則成為分離的核酸。見例如compoundsandmethodsforsitedirectedmutagenesisineukaryoticcells,kmiec,u.s.patentno.5,565,350;invivohomologoussequencetargetingineukaryoticcells;zarlingetal.,pct/us93/03868。同樣,天然發(fā)生的核酸(例如啟動(dòng)子)如果是通過(guò)非天然發(fā)生的方式導(dǎo)入該核酸非天然的基因組的基因座則成為分離的。如本文定義是“分離的”核酸也稱作“異源”核酸。
如本文所用,關(guān)于特定標(biāo)記所用“定位在由…定義并包括…的染色體區(qū)域內(nèi)”是指由指定標(biāo)記定界并包括其的連續(xù)染色體長(zhǎng)度。
如本文所用,“標(biāo)記”是指染色體上的基因座,其用于鑒別染色體上的獨(dú)特位置。“多態(tài)性標(biāo)記”包括以多種形式(等位基因)呈現(xiàn)的標(biāo)記,由此不同形式的標(biāo)記當(dāng)以同源配對(duì)呈現(xiàn)時(shí)使得該配對(duì)的每個(gè)染色體得以傳遞。基因型可以通過(guò)一或多個(gè)標(biāo)記的使用而定義。
如本文所用,“突變”是指多核苷酸的核苷酸序列例如基因或編碼dna序列(cds)中與野生型序列相比的改變。該術(shù)語(yǔ)包括但不限于取代、插入、移碼、缺失、倒位、易位、復(fù)制、剪接供體位點(diǎn)突變、點(diǎn)突變等。
如本文所用,“核酸”是指單鏈或雙鏈形式的脫氧核糖核苷酸或者核糖核苷酸聚合物,及除非特別限制則涵蓋了保守修飾的變體及已知的具有天然核苷酸的基本性質(zhì)的類似物,其以與天然發(fā)生的核苷酸相似的方式與單鏈核酸雜交(例如肽核酸)。
“核酸文庫(kù)”是指分離的dna或rna分子的集合,其包含且基本上代表指定生物體的基因組的全部轉(zhuǎn)錄部分。示例的核酸文庫(kù)如基因組和cdna文庫(kù)的構(gòu)建在標(biāo)準(zhǔn)分子生物學(xué)參考文獻(xiàn)中教導(dǎo),如bergerandkimmel,guidetomolecularcloningtechniques,methodsinenzymology,vol.152,academicpress,inc.,sandiego,ca(berger);sambrooketal.,molecularcloning-alaboratorymanual,2nded.,vol.1-3(1989);及currentprotocolsinmolecularbiology,f.m.ausubeletal.,eds.,currentprotocols,ajointventurebetweengreenepublishingassociates,inc.andjohnwiley&sons,inc.(1994)。
如本文所用,“可操縱地連接”是指啟動(dòng)子與第二序列之間的功能性連接,其中啟動(dòng)子序列起始并介導(dǎo)相應(yīng)于第二序列的dna序列的轉(zhuǎn)錄。通常,可操縱地連接是指連接的核酸序列是連續(xù)的且在需要的情況中連續(xù)地及在相同讀框中連接兩個(gè)蛋白質(zhì)編碼區(qū)。
如本文所用,“多核苷酸”是指脫氧核糖多核苷酸、核糖多核苷酸或者保守修飾的變體;該術(shù)語(yǔ)還涉及具有天然核糖核苷酸的基本性質(zhì)的其類似物,其在嚴(yán)格雜交條件下與天然發(fā)生的核苷酸雜交基本相同的核苷酸序列和/或使得翻譯為與天然發(fā)生的核苷酸相同的氨基酸。多核苷酸可以是天然或異源結(jié)構(gòu)或調(diào)節(jié)基因的全長(zhǎng)序列或者子序列。除非特別指出,該術(shù)語(yǔ)是指指定的序列以及其互補(bǔ)序列。因此,由于穩(wěn)定性或其它原因而具有修飾的主鏈的dna或rna是本文所用術(shù)語(yǔ)“多核苷酸”。此外,包含非常規(guī)堿基如肌苷或者修飾的堿基如三苯甲基化(tritylated)堿基(只是舉兩個(gè)實(shí)例)的dna或rna是本文所用術(shù)語(yǔ)描述的多核苷酸。應(yīng)意識(shí)到已經(jīng)對(duì)dna和rna進(jìn)行了大量修飾以適合本領(lǐng)域技術(shù)人員已知的眾多有用的目的。
在本文中使用的術(shù)語(yǔ)多核苷酸包含這種經(jīng)化學(xué)、酶或者代謝修飾形式的多核苷酸,以及病毒和細(xì)胞包括例如簡(jiǎn)單和復(fù)雜細(xì)胞特有的化學(xué)形式的dna和rna。
術(shù)語(yǔ)“多肽”、“肽”和“蛋白質(zhì)”在本文可互換使用,是指氨基酸殘基的聚合物。該術(shù)語(yǔ)也可用于保守修飾的變體及其中一或多個(gè)氨基酸殘基是相應(yīng)天然發(fā)生的氨基酸的人工化學(xué)類似物的氨基酸聚合物,以及用于天然發(fā)生的氨基酸聚合物。這種天然發(fā)生的氨基酸的類似物的基本性質(zhì)是當(dāng)摻入蛋白質(zhì)中時(shí),該蛋白質(zhì)與由相同的但是完全由天然發(fā)生的氨基酸組成的蛋白質(zhì)激發(fā)的抗體特異性反應(yīng)。術(shù)語(yǔ)“多肽”、“肽”和“蛋白質(zhì)”也包含修飾,包括但不限于糖基化、脂質(zhì)附著、硫酸化、谷氨酸殘基的γ羧化、羥基化和adp核糖基化。正如熟知的及如上所示,應(yīng)意識(shí)到多肽不總是完全線性的。例如,多肽由于遍在化的結(jié)果而可以是分支的,及其可以是有或無(wú)分支的環(huán)形的,通常是由于翻譯后事件的結(jié)果所致,包括天然加工事件及通過(guò)非天然發(fā)生的人工操作事件所致。環(huán)形、分支的及分支環(huán)形多肽可以通過(guò)非翻譯天然方法合成及通過(guò)完全合成方法合成。此外,本發(fā)明涵蓋了本發(fā)明蛋白質(zhì)的含有甲硫氨酸及無(wú)甲硫氨酸的氨基末端變體的應(yīng)用。
如本文所用,“啟動(dòng)子”是指位于轉(zhuǎn)錄起始上游并參與rna聚合酶及其它蛋白質(zhì)的識(shí)別和結(jié)合以起始轉(zhuǎn)錄的dna區(qū)域。在發(fā)育控制下的啟動(dòng)子的實(shí)例包括在某些組織如睪丸、卵巢或胎盤中優(yōu)先起始轉(zhuǎn)錄的啟動(dòng)子。這種啟動(dòng)子被稱作“組織優(yōu)選的”。僅在某組織中起始轉(zhuǎn)錄的啟動(dòng)子被稱作“組織特異的”?!凹?xì)胞類型”特異性啟動(dòng)子主要驅(qū)動(dòng)在一或多個(gè)器官中某些細(xì)胞類型中表達(dá),例如睪丸或卵巢中的生殖細(xì)胞?!翱烧T導(dǎo)的”或者“可抑制的”啟動(dòng)子是在環(huán)境控制下的啟動(dòng)子。可以影響可誘導(dǎo)啟動(dòng)子轉(zhuǎn)錄的環(huán)境條件例如包括應(yīng)激和溫度。組織特異性、組織優(yōu)選的、細(xì)胞類型特異性及可誘導(dǎo)的啟動(dòng)子組成了“非組成型”啟動(dòng)子類別?!敖M成型”啟動(dòng)子是在大多數(shù)環(huán)境條件下具均活性的啟動(dòng)子。
如本文所用,“重組體”是指已經(jīng)通過(guò)導(dǎo)入異源核酸修飾的細(xì)胞或載體或者該細(xì)胞衍生自如此修飾的細(xì)胞。因此,例如重組細(xì)胞表達(dá)在相同形式天然(非重組)形式細(xì)胞內(nèi)未發(fā)現(xiàn)的基因,或者表達(dá)由于有意人為干預(yù)所致另外非正常表達(dá)、低表達(dá)或者根本不表達(dá)的天然基因。如本文所用,術(shù)語(yǔ)“重組”不包括通過(guò)天然發(fā)生事件(例如自發(fā)突變、天然轉(zhuǎn)化/轉(zhuǎn)導(dǎo)/轉(zhuǎn)位)如未經(jīng)有意人為干預(yù)發(fā)生的那些改變所致細(xì)胞或載體的改變。
如本文所用“重組表達(dá)盒”是使用具有使得特定核酸在宿主細(xì)胞中轉(zhuǎn)錄的一系列指定核酸元件經(jīng)重組或合成產(chǎn)生的核酸構(gòu)建體。重組表達(dá)盒可以摻入質(zhì)粒、染色體、線粒體dna、質(zhì)體dna、病毒或核酸片段中。典型地,表達(dá)載體的重組表達(dá)盒部分例如包括被轉(zhuǎn)錄的核酸及啟動(dòng)子。
術(shù)語(yǔ)“殘基”或者“氨基酸殘基”或者“氨基酸”在本文可互換使用,是指摻入蛋白質(zhì)、多肽或肽(統(tǒng)稱為“蛋白質(zhì)”)中的氨基酸。氨基酸可以是天然發(fā)生的氨基酸,除非特別限制則可涵蓋天然氨基酸的非天然類似物,其可以與天然發(fā)生的氨基酸相似方式發(fā)揮功能。
術(shù)語(yǔ)“選擇性雜交”是指在嚴(yán)格雜交條件下核酸序列與另一核酸序列或其它生物制劑的雜交。當(dāng)使用基于雜交的檢測(cè)系統(tǒng)時(shí),選擇與參考核酸序列互補(bǔ)的核酸探針,然后選擇所述探針與參考序列選擇性雜交或者彼此結(jié)合形成雙鏈分子的合適條件。
術(shù)語(yǔ)“嚴(yán)格條件”或者“嚴(yán)格雜交條件”是指在此條件下探針與其靶序列以比與其它序列更高的可檢測(cè)程度雜交(例如高于背景至少2倍)。嚴(yán)格條件是序列依賴性的,在不同環(huán)境中是不同的。通過(guò)控制雜交的嚴(yán)格性和/或洗滌條件,可以鑒別與探針100%互補(bǔ)的靶序列(同源探查)。
或者,可以調(diào)整嚴(yán)格條件以允許序列中存在一些錯(cuò)配,由此檢測(cè)較低程度的相似性(異源探查)。通常,探針的長(zhǎng)度小于大約1000個(gè)核苷酸,任選長(zhǎng)度小于500個(gè)核苷酸。
典型地,嚴(yán)格條件是其中鹽濃度低于大約1.5mna離子,典型為大約0.01-1.0mna離子濃度(或者其它鹽),ph7.0-8.3,溫度對(duì)于短探針(例如10-50個(gè)核苷酸)為至少大約30℃,對(duì)于長(zhǎng)探針(例如超過(guò)50個(gè)核苷酸)為至少大約60℃。嚴(yán)格條件也可以通過(guò)加入去穩(wěn)定劑如甲酰胺而獲得。特異性典型是雜交后洗滌的作用,關(guān)鍵因素是離子強(qiáng)度和最終洗滌溶液的溫度。對(duì)于dna/dna雜交體,熱熔點(diǎn)(tm)可以從meinkothandwahl,anal.biochem.,138:267-284(1984)的等式估算:tm[℃]=81.5+16.6(logm)+0.41(%gc)-0.61(%form)-500/l;其中m是一價(jià)陽(yáng)離子的摩爾濃度,%gc是dna中鳥苷與胞嘧啶核苷酸的百分比,%form是雜交溶液中甲酰胺的百分比,l是堿基對(duì)中雜交體的長(zhǎng)度。tm是(在指定離子強(qiáng)度和ph)50%的互補(bǔ)靶序列與完美匹配探針雜交的溫度。對(duì)于每1%錯(cuò)配,tm降低大約1℃;因此可以調(diào)整tm、雜交和/或洗滌條件以與具有希望相同性的序列雜交。例如,如果尋求序列>90%相同性,則可以將tm降低10℃。通常,在指定離子強(qiáng)度和ph條件下,針對(duì)特定序列及其互補(bǔ)序列選擇低于tm大約5℃的嚴(yán)格條件。然而,重度嚴(yán)格條件可利用雜交和/或洗滌溫度低于tm溫度1-4℃;中等嚴(yán)格條件可利用雜交和/或洗滌溫度低于tm溫度6-10℃;低嚴(yán)格條件可利用雜交和/或洗滌條件低于tm溫度11-20℃。使用該等式、雜交和洗滌成分及希望的tm,本領(lǐng)域技術(shù)人員將理解描述的雜交和/或洗滌溶液的嚴(yán)格性變化。關(guān)于核酸雜交的深入指南見于tijssen,laboratorytechniquesinbiochemistryandmolecularbiology--hybridizationwithnucleicacidprobes,parti,chapter2"overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays",elsevier,newyork(1993);及currentprotocolsinmolecularbiology,chapter2,ausubel,etal.,eds.,greenepublishingandwiley-interscience,newyork(1995)。
如本文所用,“轉(zhuǎn)基因動(dòng)物、細(xì)胞或組織”包括在其基因組中包含異源多核苷酸的動(dòng)物。通常,所述異源多核苷酸穩(wěn)定整合在基因組內(nèi),由此該多核苷酸被傳遞至后續(xù)世代。所述異源多核苷酸可以單獨(dú)或者作為重組表達(dá)盒的一部分整合進(jìn)基因組中。如本文所用“轉(zhuǎn)基因”包括任何細(xì)胞、細(xì)胞系、組織或者器官,其基因型由于存在異源核酸而被改變,包括最初如此改變的那些轉(zhuǎn)基因動(dòng)物以及通過(guò)從最初轉(zhuǎn)基因動(dòng)物性交或無(wú)性繁殖而產(chǎn)生的那些轉(zhuǎn)基因動(dòng)物。如本文所用,術(shù)語(yǔ)“轉(zhuǎn)基因”不涵蓋通過(guò)常規(guī)育種方法或者通過(guò)天然發(fā)生的事件如隨機(jī)異體受精、非重組病毒感染、非重組細(xì)菌轉(zhuǎn)化、非重組轉(zhuǎn)位或者自發(fā)突變而發(fā)生的基因組的改變(染色體或染色體外)。
如本文所用,“載體”包括用于轉(zhuǎn)染宿主細(xì)胞及在其中可以插入多核苷酸的核酸。載體通常是復(fù)制子。表達(dá)載體允許插入其中的核酸轉(zhuǎn)錄。
如下術(shù)語(yǔ)用于描述本發(fā)明的多核苷酸/多肽與參考多核苷酸/多肽之間的序列關(guān)系:(a)“參考序列”,(b)“對(duì)比窗”,(c)“序列相同性”,及(d)“序列相同性百分比”。
(a)如本文所用,“參考序列”是用作與本發(fā)明的多核苷酸/多肽進(jìn)行序列對(duì)比基礎(chǔ)的指定序列。參考序列可以是特定序列的一部分或者全部;例如是全長(zhǎng)cdna或基因序列的節(jié)段,或者是完整cdna或基因序列。
(b)如本文所用,“對(duì)比窗”包括多核苷酸/多肽序列的一個(gè)連續(xù)和指定節(jié)段,其中可以將多核苷酸/多肽序列與參考序列對(duì)比及其中對(duì)比窗中的多核苷酸/多肽序列部分與參考序列(其不包含添加或缺失)相比可包含添加或缺失(即缺口(gap)),以最佳排列對(duì)比這兩個(gè)序列。通常,對(duì)比窗的長(zhǎng)度是至少20個(gè)連續(xù)核苷酸/氨基酸殘基,任選可以是30、40、50、100個(gè)或更長(zhǎng)。本領(lǐng)域技術(shù)人員理解為了避免由于在多核苷酸/多肽序列中包含缺口導(dǎo)致與參考序列的高相似性,典型地引入缺口罰分并從匹配數(shù)中減去。
排列序列以進(jìn)行對(duì)比的方法為本領(lǐng)域熟知。最佳的序列對(duì)比可以通過(guò)如下方法進(jìn)行:smithandwaterman,adv.appl.math.2:482(1981)的局部同源算法,needlemanandwunsch,j.mol.biol.48:443(1970)的同源排列算法,pearsonandlipman,proc.natl.acad.sci.85:2444(1988)的相似性搜索方法,及這些算法的計(jì)算機(jī)執(zhí)行程序,包括但不限于:intelligenetics,mountainview,california的pc/gene程序中的clustal;gap、bestfit、blast、fasta和tfasta,及在gcgwisconsingeneticssoftwarepackage,version10中的相關(guān)程序(得自accelrysinc.,9685scrantonroad,sandiego,california,usa)。clustal程序由higginsandsharp,gene73:237-244(1988)、higginsandsharp,cabios5:151-153(1989)、corpet,etal.,nucleicacidsresearch16:10881-90(1988)、huang,etal.,computerapplicationsinthebiosciences8:155-65(1992)和pearson,etal.,methodsinmolecularbiology24:307-331(1994)充分描述。
可用于數(shù)據(jù)庫(kù)相似性搜索的blast程序家族包括:blastn,針對(duì)核苷酸數(shù)據(jù)庫(kù)序列的核苷酸查詢序列;blastx,針對(duì)蛋白質(zhì)數(shù)據(jù)庫(kù)序列的核苷酸查詢序列;blastp,針對(duì)蛋白質(zhì)數(shù)據(jù)庫(kù)序列的蛋白質(zhì)查詢序列;tblastn,針對(duì)核苷酸數(shù)據(jù)庫(kù)序列的蛋白質(zhì)查詢序列;及tblastx,針對(duì)核苷酸數(shù)據(jù)庫(kù)序列的核苷酸查詢序列。見currentprotocolsinmolecularbiology,chapter19,ausubel,etal.,eds.,greenepublishingandwiley-interscience,newyork(1995);altschuletal.,j.mol.biol.,215:403-410(1990);和altschuletal.,nucleicacidsres.25:3389-3402(1997)所述。進(jìn)行blast分析的軟件是可公開獲得的,例如通過(guò)nationalcenterforbiotechnologyinformation(ncbi.nlm.nih.gov/)獲得。這個(gè)算法在許多出版物中充分描述。見例如altschulsfetal.,gappedblastandpsi-blast:anewgenerationofproteindatabasesearchprograms,25nucleicacidsres.3389(1997);nationalcenterforbiotechnologyinformation,thencbihandbook[internet],chapter16:theblastsequenceanalysistool(mcentyrej,ostellj,eds.,2002),得自http://www.ncbi.nlm.nih.gov/books/nbk21097/pdf/ch16.pdf。針對(duì)氨基酸序列的blastp程序也已經(jīng)充分描述(見henikoff&henikoff(1989)proc.natl.acad.sci.usa89:10915)。
除了計(jì)算序列相同性百分比之外,blast算法也進(jìn)行兩個(gè)序列之間相似性的統(tǒng)計(jì)學(xué)分析(見例如karlin&altschul,proc.natl.acad.sci.usa90:5873-5877(1993)所述)??梢允褂迷S多低復(fù)雜度過(guò)濾程序以降低這種低復(fù)雜度排列。例如,可以單獨(dú)或者組合使用seg(wootenandfederhen,comput.chem.,17:149-163(1993))和xnu(claverieandstates,comput.chem.,17:191-201(1993))低復(fù)雜度過(guò)濾法。
除非特別指出,本文提供的核苷酸和蛋白質(zhì)相同性/相似性數(shù)值是使用gap(gcgversion10)在默認(rèn)值下計(jì)算的。gap(整體排列對(duì)比程序)也可以用于對(duì)比本發(fā)明的多核苷酸或多肽與參考序列。gap使用needlemanandwunsch算法(j.mol.biol.48:443-453,1970)使匹配數(shù)最大及缺口數(shù)最小以發(fā)現(xiàn)兩個(gè)完整序列的對(duì)比。gap代表最佳對(duì)比家族的一個(gè)成員。這個(gè)家族有許多成員,但是無(wú)其它成員具有更好的品質(zhì)。gap展示了對(duì)比的四個(gè)品質(zhì)因素:質(zhì)量(quality),比率,相同性和相似性。質(zhì)量是最大化測(cè)度以排列序列。比率是質(zhì)量除以較短節(jié)段中的堿基數(shù)。相同性百分比是實(shí)際匹配的符號(hào)的百分比。相似性百分比是相似的符號(hào)的百分比。忽略在缺口對(duì)面的符號(hào)。當(dāng)一對(duì)符號(hào)的評(píng)分矩陣值高于或等于0.50(相似性閾值)時(shí),評(píng)分為相似性。version10的wisconsingeneticssoftwarepackage中使用的評(píng)分矩陣是blosum62(見henikoff&henikoff(1989)proc.natl.acad.sci.usa89:10915)。
通過(guò)clustal對(duì)比方法(higginsandsharp(1989)cabios.5:151-153)使用默認(rèn)參數(shù)(gappenalty=10,gaplengthpenalty=10)可以進(jìn)行多重序列對(duì)比。使用clustal方法的成對(duì)對(duì)比的默認(rèn)參數(shù)包括ktuple1、gappenalty=3、window=5及diagonalssaved=5。
(c)如本文所用,連個(gè)核酸或多肽序列之間的“序列相同性”或“相同性”是指兩個(gè)序列中的殘基當(dāng)在指定對(duì)比窗最大對(duì)應(yīng)對(duì)比時(shí)是相同的。當(dāng)關(guān)于蛋白質(zhì)使用序列相同性百分比時(shí),應(yīng)意識(shí)到不相同的殘基位置通常由于保守氨基酸取代而不同,其中氨基酸殘基由具有相似化學(xué)性質(zhì)(例如電荷或疏水性)的其它氨基酸殘基取代及因此不改變分子的功能性質(zhì)。在序列在保守取代中不同的情況中,序列相同性百分比可以向上調(diào)節(jié)以校正取代的保守性質(zhì)。由于這種保守取代而不同的序列被稱作具有“序列相似性”或“相似性”。產(chǎn)生這種調(diào)節(jié)的方法為本領(lǐng)域熟知。典型地這包括將保守取代評(píng)分為部分而不是完全錯(cuò)配,從而提高序列相同性百分比。因此,例如在相同氨基酸給分為1及非保守取代給分為0的情況中,保守取代給分在0-1之間。保守取代的評(píng)分可以根據(jù)meyersandmiller,computerapplic.biol.sci.,4:11-17(1988)的算法計(jì)算,例如在程序pc/gene(intelligenetics,mountainview,california,usa)中執(zhí)行。
(d)如本文所用,“序列相同性百分比”是指通過(guò)在對(duì)比窗對(duì)比兩個(gè)最佳對(duì)比的序列確定的數(shù)值,其中對(duì)比窗中的多核苷酸序列部分可包含與參考序列(不包含添加或缺失)相比的添加或缺失(即缺口)以對(duì)兩個(gè)序列最佳對(duì)比。計(jì)算百分比是通過(guò)確定在這兩個(gè)序列中出現(xiàn)的相同核酸堿基或氨基酸殘基的位置數(shù)以產(chǎn)生匹配的位置數(shù),將匹配的位置數(shù)除以對(duì)比窗中位置總數(shù)及將結(jié)果乘以100,產(chǎn)生序列相同性百分比。
如本文所用,“基因編輯”、“基因編輯的”、“經(jīng)遺傳編輯的”和“基因編輯效應(yīng)子”是指使用天然發(fā)生的或者人工工程化的核酸酶,也稱作“分子剪刀”。核酸酶在基因組的預(yù)定位置產(chǎn)生特異性雙鏈斷裂(dsb),在一些情況中其利用(harness)細(xì)胞內(nèi)源性機(jī)制以修復(fù)通過(guò)天然同源重組(hr)過(guò)程和/或非同源末端連接(nhej)誘導(dǎo)的斷裂。基因編輯效應(yīng)子包括鋅指核酸酶(zfn)、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(talen)、成簇規(guī)律間隔短回文重復(fù)序列/cas9(crispr/cas9)系統(tǒng),及作為歸巢內(nèi)切核酸酶再工程化的大范圍核酸酶。該術(shù)語(yǔ)還包括使用轉(zhuǎn)基因程序和技術(shù),包括例如在改變相對(duì)較小和/或不導(dǎo)入外源物種dna的情況中。術(shù)語(yǔ)“遺傳操縱”和“遺傳操縱的”包括基因編輯技術(shù),以及和/或除了改變或修飾基因的核苷酸序列或者修飾或改變基因的表達(dá)的其它技術(shù)和方法之外。
如本文所用,“歸巢dna技術(shù)”或者“歸巢技術(shù)”涵蓋了使得特定分子靶向特定dna序列包括鋅指(zf)蛋白、轉(zhuǎn)錄激活因子樣效應(yīng)物(tale)、大范圍核酸酶及crispr/cas9系統(tǒng)的任何機(jī)制。
術(shù)語(yǔ)“牲畜動(dòng)物”包括在畜牧業(yè)傳統(tǒng)養(yǎng)殖的動(dòng)物,如菜牛、乳牛、豬、綿羊、山羊、馬、騾、驢、野牛(buffalo)和駱駝。該術(shù)語(yǔ)還包括肉或蛋用商業(yè)養(yǎng)殖的禽類(即雞、火雞、鴨、鵝、珍珠雞和鴿)。該術(shù)語(yǔ)不包括大鼠、小鼠或者其它嚙齒動(dòng)物。
如本文所用,“胚泡”是指早期發(fā)育階段的胚胎,包含內(nèi)細(xì)胞團(tuán)(從中產(chǎn)生胚體)及液體充填的腔,典型地由單層滋養(yǎng)層細(xì)胞圍繞。"developmentalbiology",sixthedition,ed.byscottf.gilbert,sinauerassociates,inc.,publishers,sunderland,mass.(2000)。
如本文所用,“條件性敲除”或者“條件性突變”是指當(dāng)符合某些條件時(shí)實(shí)現(xiàn)的敲除或突變。這些條件包括但不限于存在某些誘導(dǎo)劑、重組酶、抗生素及一定的溫度和鹽水平。
術(shù)語(yǔ)“早期胚胎”是指胚期在受精卵至胚泡之間的任何胚胎。典型地,8細(xì)胞階段和桑椹胚階段胚胎被稱作早期胚胎。
“胚胎生殖細(xì)胞”或者“eg細(xì)胞”是指原始生殖細(xì)胞衍生細(xì)胞,其具有分化為機(jī)體所有細(xì)胞類型的潛力及可遺傳修飾為胚胎干細(xì)胞,在這個(gè)意義上有時(shí)忽略eg細(xì)胞與es細(xì)胞之間的區(qū)別。"developmentalbiology",sixthedition,ed.byscottf.gilbert,sinauerassociates,inc.,publishers,sunderland,mass.(2000)。
“胚胎干細(xì)胞”或者“es細(xì)胞”是指衍生自早期胚胎內(nèi)細(xì)胞團(tuán)的培養(yǎng)的細(xì)胞,其可接受遺傳修飾及保留其全能性且如果注射進(jìn)宿主胚胎中可以有助于所得嵌合動(dòng)物的所有器官。"developmentalbiology",sixthedition,ed.byscottf.gilbert,sinauerassociates,inc.,publishers,sunderland,mass.(2000)。
如本文所用,“受精”是指在育種期間雄性和雌性配子的結(jié)合導(dǎo)致受精卵的形成,這是胚胎最早發(fā)育階段?!巴庠醇?xì)胞”是指可以遺傳編輯的或者可以衍生自遺傳編輯的細(xì)胞且當(dāng)注射進(jìn)或者與供體胚泡/胚胎聚集時(shí)可以有助于嵌合胚胎的種系的任何細(xì)胞。這包括但不限于胚胎干細(xì)胞(es)、畸胎瘤干細(xì)胞、原始生殖細(xì)胞及胚胎生殖細(xì)胞(eg)。
短語(yǔ)“經(jīng)遺傳編輯的”是指具有希望的遺傳修飾的那些動(dòng)物或胚胎或細(xì)胞,如敲除、敲入、條件化、可誘導(dǎo)、瞬時(shí)或點(diǎn)突變?nèi)魏位蚧蚱湔{(diào)節(jié)機(jī)制或者具有外源或修飾的基因或調(diào)節(jié)序列的轉(zhuǎn)基因,或者經(jīng)歷任何方式的遺傳修飾包括但不限于重組、染色體缺失、添加、易位、重排,或者添加、缺失或修飾核酸、蛋白質(zhì)或者任何其它天然或合成分子或細(xì)胞器,或者胞質(zhì)或核轉(zhuǎn)移,導(dǎo)致可遺傳的改變。
“生殖細(xì)胞發(fā)育”是指早期發(fā)育中的胚胎中的某些細(xì)胞分化為原始生殖細(xì)胞的過(guò)程。
“生殖細(xì)胞遷移”是指原始生殖細(xì)胞在起源于胚外中胚層之后經(jīng)由尿囊(臍帶的前體)返回胚胎中并經(jīng)過(guò)相鄰卵黃囊、后腸和背系膜繼續(xù)遷移最終達(dá)到生殖嵴(發(fā)育中性腺)的過(guò)程。"developmentalbiology",sixthedition,ed.byscottf.gilbert,sinauerassociates,inc.,publishers,sunderland,mass.(2000)。
“種系細(xì)胞(germlinecell)”是指在朝向成熟配子的任何分化階段的任何細(xì)胞,包括成熟配子。
如本文所用,術(shù)語(yǔ)“敲入”是指將內(nèi)源基因用轉(zhuǎn)基因或者具有一些結(jié)構(gòu)修飾但是保留內(nèi)源基因轉(zhuǎn)錄控制的相同內(nèi)源基因置換。
“敲除”是指基因的結(jié)構(gòu)或調(diào)節(jié)機(jī)制的破壞。敲除可以通過(guò)靶向載體、置換載體或hit-and-run載體同源重組或者隨機(jī)插入基因捕獲載體致使完全、部分或者條件性喪失基因功能而產(chǎn)生?!奥炎影l(fā)生”是指在雌性動(dòng)物中從原始生殖細(xì)胞產(chǎn)生成熟卵子的過(guò)程。
“原始生殖細(xì)胞”是指在胚胎發(fā)育早期產(chǎn)生的那些細(xì)胞,其通過(guò)生殖母細(xì)胞中介產(chǎn)生生精細(xì)胞系或者通過(guò)卵原細(xì)胞中介產(chǎn)生雌性生殖細(xì)胞系。
“精子發(fā)生”是指在雄性動(dòng)物中從精原干細(xì)胞產(chǎn)生成熟精子的過(guò)程。
“野生型”是指未經(jīng)遺傳編輯的且通常是從天然發(fā)生的株系中發(fā)生的近交品系和遠(yuǎn)交品系的那些動(dòng)物及從中衍生的胚泡、胚胎或細(xì)胞。
“結(jié)合蛋白”是能結(jié)合另一分子的蛋白質(zhì)。結(jié)合蛋白可結(jié)合例如dna分子(dna結(jié)合蛋白)、rna分子(rna結(jié)合蛋白)和/或蛋白質(zhì)分子(蛋白質(zhì)結(jié)合蛋白)。在蛋白質(zhì)結(jié)合蛋白的情況中,其可以結(jié)合自身(形成同源二聚體、同源三聚體等)和/或其可以結(jié)合一或多種不同的蛋白質(zhì)分子。結(jié)合蛋白可具有一種類型以上的結(jié)合活性。例如,鋅指蛋白具有dna結(jié)合、rna結(jié)合和蛋白質(zhì)結(jié)合活性。
“鋅指dna結(jié)合蛋白”(或者結(jié)合結(jié)構(gòu)域)是一種蛋白質(zhì)或者在較大蛋白質(zhì)內(nèi)的結(jié)構(gòu)域,其以序列特異性方式通過(guò)一或多個(gè)鋅指結(jié)合dna,鋅指是其結(jié)構(gòu)通過(guò)鋅離子配位而穩(wěn)定的結(jié)合結(jié)構(gòu)域內(nèi)的氨基酸序列區(qū)域。術(shù)語(yǔ)鋅指dna結(jié)合蛋白通??s寫為鋅指蛋白或zfp。
“taledna結(jié)合結(jié)構(gòu)域”或者“tale”是包含一或多個(gè)tale重復(fù)結(jié)構(gòu)域/單位的多肽。所述重復(fù)結(jié)構(gòu)域參與tale與其同源靶dna序列的結(jié)合。單一的“重復(fù)單位”(也稱作“重復(fù)”)典型地長(zhǎng)度為33-35個(gè)氨基酸,并與天然發(fā)生的tale蛋白內(nèi)其它tale重復(fù)序列呈現(xiàn)出至少一些序列同源性。
鋅指和tale結(jié)合結(jié)構(gòu)域可以被“工程化”為結(jié)合預(yù)定的核苷酸序列,例如通過(guò)對(duì)天然發(fā)生的鋅指或tale蛋白的識(shí)別螺旋區(qū)域進(jìn)行工程化(改變一或多個(gè)氨基酸)。因此,工程化的dna結(jié)合蛋白(鋅指或tale)是非天然發(fā)生的蛋白質(zhì)。工程化dna結(jié)合蛋白的方法的非限制性實(shí)例是設(shè)計(jì)和選擇。設(shè)計(jì)的dna結(jié)合蛋白是非天然發(fā)生的蛋白質(zhì),其設(shè)計(jì)/組成成分主要得自合理標(biāo)準(zhǔn)。關(guān)于設(shè)計(jì)的合理標(biāo)準(zhǔn)包括應(yīng)用處理存儲(chǔ)現(xiàn)有zfp和/或tale設(shè)計(jì)和結(jié)合數(shù)據(jù)的數(shù)據(jù)庫(kù)信息的替代規(guī)則和計(jì)算機(jī)算法。見例如美國(guó)專利號(hào)6,140,081、6,453,242和6,534,261;也見wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496及美國(guó)專利公開號(hào)20110301073所述。
“選擇的”鋅指蛋白或tale是非天然發(fā)現(xiàn)的蛋白質(zhì),其產(chǎn)生主要得自實(shí)驗(yàn)方法如噬菌體展示、相互作用捕獲或者雜交選擇。見例如美國(guó)專利號(hào)5,789,538、美國(guó)專利號(hào)5,925,523、美國(guó)專利號(hào)6,007,988、美國(guó)專利號(hào)6,013,453、美國(guó)專利號(hào)6,200,759、wo95/19431、wo96/06166、wo98/53057、wo98/54311、wo00/27878、wo01/60970、wo01/88197、wo02/099084和美國(guó)專利公開號(hào)20110301073所述。
“裂解”是指dna分子的共價(jià)主鏈的斷裂。裂解可以通過(guò)多種方法起始,包括但不限于對(duì)磷酸二酯鍵進(jìn)行酶解或者化學(xué)水解。單鏈裂解和雙鏈裂解均可以,雙鏈裂解可以是由于兩個(gè)獨(dú)特的單鏈裂解事件的結(jié)果而發(fā)生。dna裂解可以導(dǎo)致鈍端或交錯(cuò)末端產(chǎn)生。在某些實(shí)施方案中,融合多肽用于靶向雙鏈dna裂解。
“裂解半結(jié)構(gòu)域”是一個(gè)多肽序列,其與第二多肽(相同或不同)結(jié)合形成具有裂解活性(優(yōu)選雙鏈裂解活性)的復(fù)合物。術(shù)語(yǔ)“第一和第二裂解半結(jié)構(gòu)域”、“+和-裂解半結(jié)構(gòu)域”及“右和左裂解半結(jié)構(gòu)域”可互換使用,是指二聚體化的裂解半結(jié)構(gòu)域?qū)Α?/p>
“工程化的裂解半結(jié)構(gòu)域”是已經(jīng)修飾以與另一裂解半結(jié)構(gòu)域(例如另一工程化的裂解半結(jié)構(gòu)域)形成專性(obligate)異源二聚體的裂解半結(jié)構(gòu)域。也見美國(guó)專利公開號(hào)2005/0064474、20070218528、2008/0131962和2011/0201055所述,所述專利以其全部?jī)?nèi)容并入本文作參考。
產(chǎn)生雙鏈dna斷裂的方式(means):如本文所用,術(shù)語(yǔ)“產(chǎn)生雙鏈dna斷裂的方式”旨在觸發(fā)國(guó)會(huì)在35u.s.c.sctn.112第六段授權(quán)的特殊權(quán)利要求條款。特別地,“產(chǎn)生雙鏈dna斷裂的方式”是指能裂解雙鏈dna分子的兩個(gè)鏈的分子結(jié)構(gòu)。這種結(jié)構(gòu)包括許多已知核酸酶蛋白質(zhì)內(nèi)包含的多肽結(jié)構(gòu)域,例如foki核酸酶結(jié)構(gòu)域,選自如下的催化結(jié)構(gòu)域:蛋白質(zhì)mme1,colicin-e7(cea7_ecolx),colicin-e9,apfl,enda,endoi(end1_ec0li),人endog(nucg_human),牛endog(nucg_bovin),r.hinp11,1-bas-1,1-bmo-1,1-hmu1,1-tev-1,1-tev11,1-tev111,1-two1,r.msp1,r.mva1,nuca,nucm,vvn,vvn_cls,葡萄球菌核酸酶(nuc_staau),葡萄球菌核酸酶(nuc_stahy),微球菌核酸酶(nuc_shifl),內(nèi)切核酸酶yncb,內(nèi)切脫氧核糖核酸酶i(enrn_bpt7),metnase,nb.bsrdi,bsrdia,nt.bspd61(r.bspd61大亞基),ss.bspd61(r.bspd61小亞基),r.pie1,mly1,alw1,mva12691,bsr1,bsm1,nb.btsci,nt.btsci,r1.bts1,r2.bts1,bbvci亞基1,bbvci亞基2,bpuloiα亞基,bpuloiβ亞基,bmr1,bfi1,1-cre1,hexo1(ex01jhuman),酵母exo1(ex01_yeast),大腸桿菌exo1,人trex2,小鼠trex1,人trex1,牛trex1,大鼠trex1,人dna2,酵母dna2(dna2yeast)。
修復(fù)雙鏈dna斷裂的方式:如本文所用,術(shù)語(yǔ)“修復(fù)雙鏈dna斷裂的方式”也是旨在觸發(fā)國(guó)會(huì)在35u.s.c.sctn.112第六段授權(quán)的特殊權(quán)利要求條款。特別地,“修復(fù)雙鏈dna斷裂的方式”是指能促進(jìn)/催化雙鏈dna分子末端接合的分子結(jié)構(gòu),例如接合通過(guò)裂解單一雙鏈dna分子產(chǎn)生的末端或者接合通過(guò)裂解單一雙鏈dna分子產(chǎn)生的一個(gè)末端與外源雙鏈dna分子的末端。這種結(jié)構(gòu)包括許多已知連接酶蛋白質(zhì)例如cre重組酶內(nèi)包含的多肽結(jié)構(gòu)域。在一些實(shí)例中,相同的分子結(jié)構(gòu)可作為產(chǎn)生雙鏈dna斷裂的方式也作為修復(fù)雙鏈dna斷裂的方式,其中相同結(jié)構(gòu)促進(jìn)雙鏈dna分子的裂解及修復(fù)(例如hin重組酶)。
基因組中位點(diǎn)特異性雙鏈斷裂的誘導(dǎo)引起宿主細(xì)胞dna修復(fù)途徑,這通過(guò)同源定向修復(fù)(hdr)或者非同源末端結(jié)合(nhej)修復(fù)解決(resolve)了雙鏈斷裂。在供體分子上可具有一或多個(gè)zfn切割位點(diǎn)(一個(gè)單一zfn切割位點(diǎn)使整個(gè)供體分子線性化,2個(gè)相同zfn切割位點(diǎn)釋放較小的供體dna片段或者2個(gè)不同zfn位點(diǎn)從供體中釋放一個(gè)片段及從宿主基因組dna中釋放一個(gè)相應(yīng)片段(dna置換))。
因此,供體多核苷酸可以是dna或rna,是單鏈和/或雙鏈的,且可以線性或環(huán)形方式導(dǎo)入細(xì)胞中。見例如美國(guó)專利公開號(hào)20100047805和20110207221。在本發(fā)明的某些實(shí)施方案中,也可以包括線性外源(供體)核酸、包含這些核酸的組合物以及產(chǎn)生和使用這些線性供體分子的方法。在某些實(shí)施方案中,線性供體分子穩(wěn)定存在于其導(dǎo)入之中的細(xì)胞中。在其它實(shí)施方案中,線性供體分子被修飾以抵抗核酸外切裂解,例如通過(guò)在供體分子的末端上一或多個(gè)堿基對(duì)之間放置一或多個(gè)硫代磷酸磷酸二酯鍵修飾。線性外源核酸也可以包括單鏈特異性dna。
nanos基因編輯
nanos是進(jìn)化保守rna結(jié)合蛋白家族,其在無(wú)脊椎動(dòng)物和脊椎動(dòng)物生殖細(xì)胞中特異性表達(dá)。nanos及其直系同源物的消除導(dǎo)致在果蠅、秀麗線蟲(c.elegans)、斑馬魚、爪蟾(xenopus)和小鼠中喪失生殖細(xì)胞。在人中,生殖細(xì)胞喪失和不育與nanos基因突變相關(guān)。
在脊椎動(dòng)物中,已經(jīng)鑒別三個(gè)nanos基因,其中nanos2和nanos3在pgc中表達(dá)。在小鼠中,nanos3蛋白首先在早期pgc中可檢測(cè),在其遷移至生殖嵴中持續(xù)保留,然后在雄性胚胎期15.5天或者在雌性胚胎e13.5之前終止。相反,nanos2的表達(dá)限于雄性性腺。nanos2mrna首先在生殖細(xì)胞開始與性腺體細(xì)胞相互作用之后大約e13.0在已經(jīng)在雄性胚胎性腺中建群的生殖細(xì)胞中可檢測(cè)。盡管所述表達(dá)在胚胎發(fā)生的后期瞬時(shí)降低,但是在新生兒發(fā)育期間在生殖母細(xì)胞中可再次檢測(cè)到nanos2mrna。
在小鼠中nanos3的消除由于在大約e8.0的凋亡細(xì)胞死亡導(dǎo)致兩個(gè)性別的生殖細(xì)胞完全喪失。重要地,在小鼠中nanos2的失活導(dǎo)致雄性胚胎僅在大約e15.5即喪失生殖細(xì)胞。因此,在雄性小鼠出生時(shí)完全缺少種系,但是睪丸體細(xì)胞支持細(xì)胞群功能完整。nanos2無(wú)效雄性和雌性動(dòng)物也是存活的且生長(zhǎng)為正常成熟狀態(tài)。此外,nanos2無(wú)效雌性動(dòng)物具有正常生育能力。申請(qǐng)人已經(jīng)證實(shí)nanos2在豬胚胎中由pgc特異性表達(dá)。
已知nanos家族基因,編碼其的序列可得自genbank或者其它這種來(lái)源。野豬(susscrofa)nanos1核酸和蛋白質(zhì)序列在xm_001928298中揭示,在本文以seqidno:5和6表示。nanos2在xm_003127232.1中揭示或者在本文以seqidno:1和2表示,nanos3在xm_005661246中揭示或者在本文以seqidno:3和4表示,牛nanos基因分別在nm_001291904及本文seqidno:9和10(nanos2)、xm_005225796及seqidno:11和12(nanos1);xm_001787922seqidno:13和14(nanos1alt)表示。
本發(fā)明提供了經(jīng)遺傳編輯的動(dòng)物或動(dòng)物細(xì)胞,其包含編碼nanos蛋白質(zhì)或與生殖細(xì)胞功能或發(fā)育相關(guān)的其它蛋白的至少一個(gè)編輯的染色體序列。編輯的染色體序列可以是:(1)失活的,(2)修飾的,或者(3)包含整合的序列。失活的染色體序列被改變,由此nanos蛋白質(zhì)關(guān)于生精細(xì)胞發(fā)育的功能被損害、降低或消除。因此,包含失活的染色體序列的經(jīng)遺傳編輯的動(dòng)物可以稱作“敲除”或者“條件敲除”。相似地,包含整合的序列的經(jīng)遺傳編輯的動(dòng)物可以稱作“敲入”或者“條件敲入”。此外,包含修飾的染色體序列的經(jīng)遺傳編輯的動(dòng)物可包含靶向點(diǎn)突變或者其它修飾,由此產(chǎn)生改變的蛋白質(zhì)產(chǎn)物。簡(jiǎn)而言之,所述方法包括在胚胎或細(xì)胞中導(dǎo)入編碼靶向的鋅指核酸酶的至少一個(gè)rna分子及任選至少一個(gè)附屬多核苷酸。所述方法進(jìn)一步包括溫育所述胚胎或細(xì)胞以使得鋅指核酸酶表達(dá),其中通過(guò)鋅指核酸酶導(dǎo)入靶向染色體序列中的雙鏈斷裂通過(guò)易錯(cuò)非同源末端結(jié)合dna修復(fù)方法或者同源定向dna修復(fù)方法修復(fù)。使用靶向鋅指核酸酶技術(shù)編輯編碼與種系發(fā)育相關(guān)的蛋白質(zhì)的染色體序列的方法是快速、精確和高效的。
在本發(fā)明的一些實(shí)施方案中,至少一個(gè)nanos基因座(例如nanos2基因座)用作位點(diǎn)特異性編輯的靶位點(diǎn)。這可以包括在所述基因座中插入外源核酸(例如包含編碼感興趣多肽的核苷酸序列的核酸)或者缺失核酸。在特定實(shí)施方案中,插入和/或缺失修飾基因座。例如,外源核酸的整合和/或部分基因組核酸的缺失可以修飾基因座以產(chǎn)生破壞的(即失活的)nanos基因。
在一些實(shí)施方案中,被編輯的nanos基因座包含選自如下的核苷酸序列:seqidno:27、28、30、31、32、33、34、35、36、37、38、39、40、41、42、45、46、47、48、49、50、51、52、56、57、58、59、60、61、118、119、120、121、122、124、125、126、127、128、130、131、132、133、134、136、137、138、139、140、142、143、144、145、146、148、149、150、151、152、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、201、202、203或204。在一些實(shí)施方案中,被編輯的nanos基因座可包含與選自如下的核苷酸序列基本相同的核苷酸序列:seqidno:27、28、30、31、32、33、34、35、36、37、38、39、40、41、42、45、46、47、48、49、50、51、52、56、57、58、59、60、61、118、119、120、121、122、124、125、126、127、128、130、131、132、133、134、136、137、138、139、140、142、143、144、145、146、148、149、150、151、152、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、201、202、203或204。例如,在一些實(shí)施方案中,nanos基因座是nanos同源物(例如直系同源物或旁系同源物),其包含與選自如下的核苷酸序列至少大約85%相同的核苷酸序列:seqidno:27、28、30、31、32、33、34、35、36、37、38、39、40、41、42、45、46、47、48、49、50、51、52、56、57、58、59、60、61、118、119、120、121、122、124、125、126、127、128、130、131、132、133、134、136、137、138、139、140、142、143、144、145、146、148、149、150、151、152、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、201、202、203或204。nanos同源物可包含與選自如下的核苷酸序列的大約20個(gè)連續(xù)核苷酸是例如但不限于至少80%、至少85%、至少大約90%、至少大約91%、至少大約92%、至少大約93%、至少大約94%、至少大約95%、至少大約96%、至少大約97%、至少大約98%、至少大約99%、至少大約99.5%、99.6%、99.7%、99.8%和/或至少大約99.9%相同的核苷酸序列:seqidno:27、28、30、31、32、33、34、35、36、37、38、39、40、41、42、45、46、47、48、49、50、51、52、56、57、58、59、60、61、118、119、120、121、122、124、125、126、127、128、130、131、132、133、134、136、137、138、139、140、142、143、144、145、146、148、149、150、151、152、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、201、202、203或204。
在nanos基因座的核酸靶向整合
外源核酸在nanos基因座的位點(diǎn)特異性整合可以通過(guò)本領(lǐng)域技術(shù)人員已知的任何技術(shù)實(shí)現(xiàn)。在一些實(shí)施方案中,外源核酸在nanos基因座的整合包括將細(xì)胞(例如分離的細(xì)胞或者在組織或生物體中的細(xì)胞)與包含所述外源核酸的核酸分子接觸。在實(shí)例中,這種核酸分子可包含在外源核酸兩側(cè)的核苷酸序列,其促進(jìn)核酸分子與至少一個(gè)nanos基因座之間的同源重組。在特定的實(shí)例中,在外源核酸兩側(cè)的促進(jìn)同源重組的核苷酸序列可以與nanos基因座的內(nèi)源核苷酸互補(bǔ)。在特定的實(shí)例中,在外源核酸兩側(cè)的促進(jìn)同源重組的核苷酸序列可以與先前整合的外源核苷酸互補(bǔ)。在一些實(shí)施方案中,在一個(gè)nanos基因座可以整合多個(gè)外源核酸,如基因疊加(stacking)。
在一些實(shí)施方案中,核酸在nanos基因座的整合可以通過(guò)宿主細(xì)胞的內(nèi)源細(xì)胞機(jī)制促進(jìn)(例如催化),例如但不限于內(nèi)源dna和內(nèi)源重組酶。在一些實(shí)施方案中,核酸在nanos基因座的整合可以通過(guò)提供給宿主細(xì)胞的一或多種因子(例如多肽)促進(jìn)。例如,通過(guò)將多肽與宿主細(xì)胞接觸或者通過(guò)在宿主細(xì)胞內(nèi)表達(dá)多肽而可以提供核酸酶、重組酶和/或連接酶多肽(單獨(dú)或者作為嵌合多肽的一部分)。因此,在一些實(shí)例中,包含編碼至少一種核酸酶、重組酶和/或連接酶多肽的核苷酸序列的核酸可以與在nanos基因座位點(diǎn)特異性整合的核酸同時(shí)或相繼導(dǎo)入宿主細(xì)胞中,其中至少一種核酸酶、重組酶和/或連接酶多肽在宿主細(xì)胞中從所述核苷酸序列表達(dá)。
dna結(jié)合多肽
在一些實(shí)施方案中,位點(diǎn)特異性整合可以通過(guò)利用能識(shí)別并結(jié)合例如在宿主生物體基因組中特定核苷酸序列的因子而實(shí)現(xiàn)。例如,許多蛋白質(zhì)包含能以位點(diǎn)特異性方式識(shí)別并結(jié)合dna的多肽結(jié)構(gòu)域。由dna結(jié)合多肽識(shí)別的dna序列可以稱作“靶”序列。能以位點(diǎn)特異性方式識(shí)別并結(jié)合dna的多肽結(jié)構(gòu)域通常正確折疊并獨(dú)立地以位點(diǎn)特異性方式發(fā)揮結(jié)合dna功能,甚至當(dāng)在除了該結(jié)構(gòu)域最初從中分離的蛋白質(zhì)之外的多肽中表達(dá)時(shí)也如此。相似地,由dna結(jié)合多肽識(shí)別并結(jié)合的靶序列甚至當(dāng)在較大dna結(jié)構(gòu)(例如染色體)中存在時(shí),特別是當(dāng)靶序列所在位點(diǎn)是已知可接近可溶的細(xì)胞蛋白質(zhì)(例如基因)的位點(diǎn)時(shí),其通常能被這種多肽識(shí)別并結(jié)合。
雖然從天然存在的蛋白質(zhì)中鑒別的dna結(jié)合多肽典型結(jié)合不連續(xù)的核苷酸序列或基序(例如共有識(shí)別序列),但是本領(lǐng)域現(xiàn)有及已知修飾許多這種dna結(jié)合多肽的方法以識(shí)別不同的核苷酸序列或基序。dna結(jié)合多肽包括例如但不限于:鋅指dna結(jié)合結(jié)構(gòu)域,亮氨酸拉鏈,upadna結(jié)合結(jié)構(gòu)域,gal4,tal,lexa,tet阻抑物,lacr,及甾體激素受體。
在一些實(shí)例中,dna結(jié)合多肽是鋅指。單獨(dú)的鋅指基序可以設(shè)計(jì)為靶向并特異性結(jié)合任何范圍的dna位點(diǎn)。典型的cys2his2(以及非典型的cys3his)鋅指多肽通過(guò)在靶dna雙螺旋的大溝中插入α螺旋而結(jié)合dna。鋅指對(duì)dna的識(shí)別是模塊化的,每個(gè)鋅指主要接觸靶中的三個(gè)連續(xù)堿基對(duì),多肽中的幾個(gè)關(guān)鍵殘基介導(dǎo)識(shí)別。通過(guò)在靶向內(nèi)切核酸酶中包含多個(gè)鋅指dna結(jié)合結(jié)構(gòu)域,所述靶向內(nèi)切核酸酶的dna結(jié)合特異性可以進(jìn)一步增加(及因此其賦予的任何基因調(diào)節(jié)作用的特異性也可以增加)。見例如urnovetal.(2005)nature435:646-51。因此,可以工程化并使用一或多種鋅指dna結(jié)合多肽,由此導(dǎo)入宿主細(xì)胞中的靶向內(nèi)切核酸酶與宿主細(xì)胞基因組內(nèi)獨(dú)特的dna序列相互作用。
優(yōu)選地,鋅指蛋白是非天然發(fā)生的,其被工程化為結(jié)合選擇的靶位點(diǎn)。見例如beerlietal.(2002)naturebiotechnol.20:135-141;paboetal.(2001)ann.rev.biochem.70:313-340;isalanetal.(2001)naturebiotechnol.19:656-660;segaletal.(2001)curr.opin.biotechnol.12:632-637;chooetal.(2000)curr.opin.struct.biol.10:411-416;美國(guó)專利號(hào)6,453,242、6,534,261、6,599,692、6,503,717、6,689,558、7,030,215、6,794,136、7,067,317、7,262,054、7,070,934、7,361,635、7,253,273及美國(guó)專利公開號(hào)2005/0064474、2007/0218528、2005/0267061,所有文獻(xiàn)均以其全部?jī)?nèi)容并入本文作參考。
工程化的鋅指結(jié)合結(jié)構(gòu)域與天然發(fā)生的鋅指蛋白相比可具有新的結(jié)合特異性。工程化方法包括但不限于合理設(shè)計(jì)及各種類型的選擇。合理設(shè)計(jì)包括例如使用包含三聯(lián)(或四聯(lián))核苷酸序列和各個(gè)鋅指氨基酸序列的數(shù)據(jù)庫(kù),其中每個(gè)三聯(lián)或四聯(lián)核苷酸序列均與結(jié)合特定三聯(lián)或四聯(lián)序列的一或多個(gè)鋅指氨基酸序列關(guān)聯(lián)。見例如共有的美國(guó)專利號(hào)6,453,242和6,534,261所述,所述專利以其全部?jī)?nèi)容并入本文作參考。
示例的選擇方法包括噬菌體展示和雙雜交系統(tǒng),在美國(guó)專利號(hào)5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568以及wo98/37186、wo98/53057、wo00/27878、wo01/88197和gb2,338,237中揭示。此外,與鋅指結(jié)合結(jié)構(gòu)域的結(jié)合特異性增強(qiáng)已經(jīng)在例如共有專利wo02/077227中描述。
此外,如在這些及其它參考文獻(xiàn)中揭示,鋅指結(jié)構(gòu)域和/或多指鋅指蛋白可以使用任何合適的接頭序列包括例如長(zhǎng)度為5或更多個(gè)氨基酸的接頭連接在一起。也見美國(guó)專利號(hào)6,479,626、6,903,185和7,153,949關(guān)于示例的長(zhǎng)度為6或更多個(gè)氨基酸的接頭序列。本文描述的蛋白質(zhì)可包含在蛋白質(zhì)的各個(gè)鋅指之間任何合適的接頭組合。
靶位點(diǎn)的選擇、zfp及設(shè)計(jì)和構(gòu)建融合蛋白(及編碼其的多核苷酸)的方法為本領(lǐng)域技術(shù)人員已知,在美國(guó)專利號(hào)6,140,0815、789,538、6,453,242、6,534,261、5,925,523、6,007,988、6,013,453、6,200,759、wo95/19431、wo96/06166、wo98/53057、wo98/54311、wo00/27878、wo01/60970wo01/88197、wo02/099084、wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496中詳細(xì)描述。
此外,如在這些及其它參考文獻(xiàn)中所揭示,鋅指結(jié)構(gòu)域和/或多指鋅指蛋白可以使用任何合適的接頭序列包括例如長(zhǎng)度為5或更多個(gè)氨基酸的接頭連接在一起。也見美國(guó)專利號(hào)6,479,626、6,903,185和7,153,949關(guān)于示例的長(zhǎng)度為6或更多個(gè)氨基酸的接頭序列。本文描述的蛋白質(zhì)可包含在蛋白質(zhì)的各個(gè)鋅指之間任何合適的接頭組合。
在一些實(shí)例中,dna結(jié)合多肽是來(lái)自gal4的dna結(jié)合結(jié)構(gòu)域。gal4是在釀酒酵母中的模塊反式激活蛋白,但是其在許多其它生物體中也作為反式激活蛋白。見例如sadowskietal.(1988)nature335:563-4所述。在這種調(diào)節(jié)系統(tǒng)中,編碼半乳糖代謝途徑的酶的基因在釀酒酵母中的表達(dá)由可利用的碳源嚴(yán)格調(diào)節(jié)。johnston(1987)microbiol.rev.51:458-76。這些代謝途徑酶的轉(zhuǎn)錄控制通過(guò)陽(yáng)性調(diào)節(jié)蛋白gal4與gal4特異性結(jié)合的17bp對(duì)稱dna序列(uas)之間的相互作用介導(dǎo)。
天然gal4由881個(gè)氨基酸殘基組成,分子量為99kda。gal4包含功能自主結(jié)構(gòu)域,其組合的活性構(gòu)成gal4在體內(nèi)的活性。maandptashne(1987)cell48:847-53);brentandptashne(1985)cell43(3pt2):729-36。gal4的n末端65個(gè)氨基酸包含gal4dna結(jié)合結(jié)構(gòu)域。keeganetal.(1986)science231:699-704;johnston(1987)nature328:353-5。序列特異性結(jié)合要求存在由dna結(jié)合結(jié)構(gòu)域中存在的6個(gè)cys殘基配位的二價(jià)陽(yáng)離子。配位的含有陽(yáng)離子的結(jié)構(gòu)域通過(guò)與dna螺旋的大溝直接接觸而與在17bpuas每個(gè)末端的保守的ccg三聯(lián)體相互作用并識(shí)別其。marmorsteinetal.(1992)nature356:408-14。蛋白質(zhì)的dna結(jié)合功能位于在啟動(dòng)子附近的c末端轉(zhuǎn)錄激活結(jié)構(gòu)域,由此該激活結(jié)構(gòu)域可以指導(dǎo)轉(zhuǎn)錄。
在某些實(shí)施方案中可以利用的另外的dna結(jié)合多肽包括例如但不限于來(lái)自avrbs3可誘導(dǎo)基因的結(jié)合序列,來(lái)自avrbs3可誘導(dǎo)基因的共有結(jié)合序列或者從中工程化的合成的結(jié)合序列(例如upadna結(jié)合結(jié)構(gòu)域),tal,lexa(見例如brent&ptashne(1985),如前),lacr(見例如labowetal.(1990)mol.cell.biol.10:3343-56;baimetal.(1991)proc.natl.acad.sci.usa88(12):5072-6),甾體激素受體(elllistonetal.(1990)j.biol.chem.265:11517-121),tet阻抑物(美國(guó)專利號(hào)6,271,341)及在存在而不是不存在四環(huán)素(tc)條件下結(jié)合tet操縱基因序列的突變的tet阻抑物,nf-κb的dna結(jié)合結(jié)構(gòu)域,及wangetal.(1994)proc.natl.acad.sci.usa91(17):8180-4描述的調(diào)節(jié)系統(tǒng)的成分,其利用gal4、激素受體與vp16的融合。
在某些實(shí)施方案中,本發(fā)明描述的方法和組合物中使用的一或多種核酸酶的dna結(jié)合結(jié)構(gòu)域包含天然發(fā)生的或者工程化的(非天然發(fā)生的)tal效應(yīng)子dna結(jié)合結(jié)構(gòu)域。見例如以其全部?jī)?nèi)容并入本文作參考的美國(guó)專利公開號(hào)20110301073。
在其它實(shí)施方案中,所述核酸酶包含crispr/cas系統(tǒng)。crispr(成簇規(guī)律間隔短回文重復(fù)序列)基因座,其編碼該系統(tǒng)的rna成分,及cas(crispr相關(guān)的)基因座,其編碼蛋白質(zhì)(jansenetal.,2002.mol.microbiol.43:1565-1575;makarovaetal.,2002.nucleicacidsres.30:482-496;makarovaetal.,2006.biol.direct1:7;haftetal.,2005.ploscomput.biol.1:e60),組成crispr/cas核酸酶系統(tǒng)的基因序列。微生物宿主中的crispr基因座含有cas基因以及能程序化crispr介導(dǎo)的核酸裂解的特異性的非編碼rna元件的組合。
ii型crispr是最充分鑒定的系統(tǒng)之一,在四個(gè)相繼步驟中進(jìn)行靶向dna雙鏈斷裂。首先,從crispr基因座轉(zhuǎn)錄兩個(gè)非編碼rna、pre-crrna陣列和tracrrna。其次,tracrrna與pre-crrna重復(fù)區(qū)雜交并介導(dǎo)pre-crrna處理為含有單獨(dú)間隔區(qū)序列的成熟crrna。第三,成熟crrna:tracrrna復(fù)合物通過(guò)crrna上間隔區(qū)與緊鄰靶向識(shí)別額外需要的前間區(qū)序列鄰近基序(pam)的靶dna上前間區(qū)序列之間的wastson-crick堿基配對(duì)將cas9定向至靶dna。最后,cas9介導(dǎo)靶dna裂解以在前間區(qū)序列內(nèi)產(chǎn)生雙鏈斷裂。crispr/cas系統(tǒng)的活性包括三個(gè)步驟:(i)在稱作“適應(yīng)”的過(guò)程中,將外來(lái)dna序列插入crispr陣列以防止將來(lái)的攻擊,(ii)相關(guān)蛋白質(zhì)的表達(dá),以及陣列的表達(dá)與處理,隨后是(iii)rna介導(dǎo)的外源核酸干擾。因此,在細(xì)菌細(xì)胞中,一些cas蛋白涉及crispr/cas系統(tǒng)的天然功能并在如插入外源dna等功能中起作用。
在某些實(shí)施方案中,cas蛋白可以是天然發(fā)生的cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”是具有與天然序列多肽一樣的定性生物學(xué)性質(zhì)的化合物?!肮δ苄匝苌铩卑ǖ幌抻谔烊恍蛄械钠渭疤烊恍蛄卸嚯募捌淦蔚难苌铮瑮l件是其具有與相應(yīng)天然序列多肽一樣的生物學(xué)活性即可。在本發(fā)明中預(yù)期的生物學(xué)活性是功能性衍生物將dna底物水解為片段的能力。術(shù)語(yǔ)“衍生物”涵蓋了多肽的氨基酸序列變體、共價(jià)修飾以及其融合體。cas多肽或其片段的合適衍生物包括但不限于cas蛋白或其片段的突變體、融合體、共價(jià)修飾。cas蛋白質(zhì)、包括cas蛋白或其片段以及cas蛋白或其片段的衍生物,可以得自細(xì)胞或者化學(xué)合成或者通過(guò)組合這兩種方法而獲得。所述細(xì)胞可以是天然產(chǎn)生cas蛋白的細(xì)胞,或者是天然產(chǎn)生cas蛋白及經(jīng)遺傳工程化以較高表達(dá)水平產(chǎn)生內(nèi)源cas蛋白或者從外源導(dǎo)入的核酸(該核酸編碼與內(nèi)源cas相同或不同的cas)產(chǎn)生cas蛋白的細(xì)胞。在一些情況中,細(xì)胞不天然產(chǎn)生cas蛋白,通常是經(jīng)遺傳工程化以產(chǎn)生cas蛋白。
在特定的實(shí)施方案中,dna結(jié)合多肽特異性識(shí)別并結(jié)合包含在宿主生物體的基因組核酸內(nèi)的靶核苷酸序列。在一些實(shí)例中在宿主基因組中可發(fā)現(xiàn)許多不連續(xù)的靶核苷酸序列實(shí)例。靶核苷酸序列在生物體基因組內(nèi)可以很少見(例如基因組中可以存在少于大約10、大約9、大約8、大約7、大約6、大約5、大約4、大約3、大約2或者大約1個(gè)靶序列拷貝)。例如,靶核苷酸序列可以位于生物體基因組內(nèi)的獨(dú)特位置。靶核苷酸序列可以例如但不限于彼此之間隨機(jī)分散于整個(gè)基因組內(nèi);位于基因組中不同的連鎖群中;位于相同連鎖群中;位于不同染色體上;位于相同染色體上;位于基因組中在相似條件下在生物體中表達(dá)的位點(diǎn)(例如在相同或者基本功能相同的調(diào)節(jié)因子控制下);及在基因組中彼此緊鄰(例如靶序列可以包含于在基因組基因座作為串聯(lián)體整合的核酸內(nèi))。
靶向內(nèi)切核酸酶
在特定的實(shí)施方案中,特異性識(shí)別并結(jié)合靶核苷酸序列的dna結(jié)合多肽可以包含于嵌合多肽內(nèi),以賦予在嵌合多肽之上與靶序列特異性結(jié)合。在實(shí)例中,這種嵌合多肽可包含例如但不限于核酸酶、重組酶和/或連接酶多肽,這些多肽如上文所述。包含dna結(jié)合多肽和核酸酶、重組酶和/或連接酶多肽的嵌合多肽也可以包含其它功能性多肽基序和/或結(jié)構(gòu)域,例如但不限于:位于嵌合蛋白中功能性多肽之間的間隔區(qū)序列,前導(dǎo)肽,將融合蛋白靶向細(xì)胞器(例如細(xì)胞核)的肽,由細(xì)胞酶裂解的多肽,肽標(biāo)簽(例如myc、his等),及不干擾嵌合多肽功能的其它氨基酸序列。
嵌合多肽中的功能性多肽(例如dna結(jié)合多肽及核酸酶多肽)可以是可操縱地連接的。在一些實(shí)施方案中,嵌合多肽的功能性多肽可以通過(guò)其從編碼至少符合讀框地彼此連接的功能性多肽的單一多核苷酸表達(dá)而可操縱地連接,以產(chǎn)生編碼嵌合蛋白的嵌合基因。在另外實(shí)施方案中,嵌合多肽的功能性多肽可以通過(guò)其它方式如通過(guò)單獨(dú)表達(dá)的多肽的交聯(lián)而可操縱地連接。
在一些實(shí)施方案中,特異性識(shí)別并結(jié)合靶核苷酸序列的dna結(jié)合多肽或者指導(dǎo)rna可以包含于天然分離的蛋白質(zhì)(或其突變體)內(nèi),其中天然分離的蛋白質(zhì)或其突變體也包含核酸酶多肽(及也可以包含重組酶和/或連接酶多肽)。示例的這種分離的蛋白質(zhì)包括talen、重組酶(例如cre、hin、tre和flp重組酶)、rna-指導(dǎo)的crispr/cas9,及大范圍核酸酶。
如本文所用,術(shù)語(yǔ)“靶向內(nèi)切核酸酶”是指包含dna結(jié)合多肽或指導(dǎo)rna及核酸酶多肽的天然或工程化的分離的蛋白質(zhì)及其突變體,以及包含dna結(jié)合多肽或指導(dǎo)rna及核酸酶的嵌合多肽。任何包含特異性識(shí)別并結(jié)合包含于nanos基因座內(nèi)的靶核苷酸序列的dna結(jié)合多肽或指導(dǎo)rna的靶向內(nèi)切核酸酶(例如由于靶序列包含于在該基因座的天然序列內(nèi),或者由于靶序列已經(jīng)例如通過(guò)重組導(dǎo)入基因座中)可用于某些實(shí)施方案中。
可用于本發(fā)明特定實(shí)施方案中的一些嵌合多肽例如包括但不限于如下多肽的組合:鋅指dna結(jié)合多肽,foki核酸酶多肽,tale結(jié)構(gòu)域,亮氨酸拉鏈,轉(zhuǎn)錄因子dna結(jié)合基序,及分離自例如但不限于talen、重組酶(例如cre、hin、reca、tre和flp重組酶)、rna-指導(dǎo)的crispr/cas9、大范圍核酸酶的dna識(shí)別和/或裂解結(jié)構(gòu)域;及本領(lǐng)域技術(shù)人員已知的其它多肽。特定的實(shí)例包括包含位點(diǎn)特異性dna結(jié)合多肽和核酸酶多肽的嵌合蛋白。嵌合多肽可以通過(guò)本領(lǐng)域技術(shù)人員已知的方法工程化,以改變包含于嵌合多肽內(nèi)的dna結(jié)合多肽的識(shí)別序列,以將嵌合多肽靶向特定的感興趣的核苷酸序列。
在某些實(shí)施方案中,嵌合多肽包含dna結(jié)合結(jié)構(gòu)域(例如鋅指、tal效應(yīng)子結(jié)構(gòu)域等)和核酸酶(裂解)結(jié)構(gòu)域。裂解結(jié)構(gòu)域與dna結(jié)合結(jié)構(gòu)域可以是異源的,例如鋅指dna結(jié)合結(jié)構(gòu)域與核酸酶裂解結(jié)構(gòu)域,或者talendna結(jié)合結(jié)構(gòu)域與裂解結(jié)構(gòu)域,或者大范圍核酸酶dna結(jié)合結(jié)構(gòu)域與不同核酸酶的裂解結(jié)構(gòu)域。異源裂解結(jié)構(gòu)域可以得自任何內(nèi)切核酸酶或外切核酸酶。從中可以獲得裂解結(jié)構(gòu)域的內(nèi)切核酸酶例如包括但不限于限制性內(nèi)切核酸酶和歸巢內(nèi)切核酸酶。見例如2002-2003catalogue,newenglandbiolabs,beverly,mass.;及belfortetal.(1997)nucleicacidsres.25:3379-3388。已知裂解dna的其它酶(例如51核酸酶,綠豆核酸酶,胰腺dnasei,微球菌核酸酶,酵母ho內(nèi)切核酸酶;也見linnetal.(eds.)nucleases,coldspringharborlaboratorypress,1993)。一或多種這些酶(或者其功能性片段)可用作裂解結(jié)構(gòu)域和裂解半結(jié)構(gòu)域的來(lái)源。
相似地,裂解半結(jié)構(gòu)域可以衍生自任何核酸酶或其部分,如上文所示,對(duì)于裂解活性需要二聚體化。通常,如果融合蛋白包含裂解半結(jié)構(gòu)域,則需要兩個(gè)融合蛋白以便裂解?;蛘撸梢允褂冒瑑蓚€(gè)裂解半結(jié)構(gòu)域的單一蛋白。所述兩個(gè)裂解半結(jié)構(gòu)域可以衍生自相同內(nèi)切核酸酶(或者其功能性片段),或者每個(gè)裂解半結(jié)構(gòu)域可以衍生自不同的內(nèi)切核酸酶(或者其功能性片段)。此外,兩個(gè)融合蛋白的靶位點(diǎn)優(yōu)選是彼此排列的(disposed),由此兩個(gè)融合蛋白與其各自的靶位點(diǎn)的結(jié)合以空間方向彼此放置裂解半結(jié)構(gòu)域,使得所述裂解半結(jié)構(gòu)域例如通過(guò)二聚體化形成功能性裂解結(jié)構(gòu)域。因此,在某些實(shí)施方案中,靶位點(diǎn)的近邊由5-8個(gè)核苷酸或者15-18個(gè)核苷酸分離。然而,任何整數(shù)的核苷酸或核苷酸對(duì)可以插入在兩個(gè)靶位點(diǎn)之間(例如2-50個(gè)核苷酸對(duì)或更多)。通常,裂解位點(diǎn)位于靶位點(diǎn)之間。
限制性內(nèi)切核酸酶(限制酶)存在于許多物種中且能序列特異性結(jié)合dna(在識(shí)別位點(diǎn)),并在結(jié)合位點(diǎn)或附近裂解dna,例如由此一或多個(gè)外源序列(供體/轉(zhuǎn)基因)整合在結(jié)合(靶)位點(diǎn)或附近。某些限制酶(例如typeiis)在遠(yuǎn)離識(shí)別位點(diǎn)的位點(diǎn)裂解dna及具有可分的結(jié)合和裂解結(jié)構(gòu)域。例如,typeiis酶foki在dna的一條鏈上離其識(shí)別位點(diǎn)9個(gè)核苷酸及在另一鏈上離其識(shí)別位點(diǎn)13個(gè)核苷酸催化雙鏈dna裂解。見例如美國(guó)專利號(hào)5,356,802、5,436,150和5,487,994,以及l(fā)ietal.(1992)proc.natl.acad.sci.usa89:4275-4279、lietal.(1993)proc.natl.acad.sci.usa90:2764-2768、kimetal.(1994a)proc.natl.acad.sci.usa91:883-887、kimetal.(1994b)j.biol.chem.269:31,978-31,982。因此,在一個(gè)實(shí)施方案中,融合蛋白包含來(lái)自至少一種typeiis限制酶的裂解結(jié)構(gòu)域(或者裂解半結(jié)構(gòu)域)及一或多個(gè)鋅指結(jié)合結(jié)構(gòu)域,其可以是或者不是工程化的。
其裂解結(jié)構(gòu)域與結(jié)合結(jié)構(gòu)域可分的typeiis限制酶的一個(gè)實(shí)例是foki。這種特殊的酶作為二聚體時(shí)是活性的。bitinaiteetal.(1998)proc.natl.acad.sci.usa95:10,570-10,575。因此,對(duì)于本發(fā)明,用于揭示的融合蛋白中的部分foki酶被認(rèn)為是裂解半結(jié)構(gòu)域。因此,對(duì)于使用鋅指-foki融合蛋白進(jìn)行靶向雙鏈裂解和/或靶向細(xì)胞序列置換,均包含foki裂解半結(jié)構(gòu)域的兩個(gè)融合蛋白可用于重建催化活性裂解結(jié)構(gòu)域?;蛘?,也可以使用含有dna結(jié)合結(jié)構(gòu)域和兩個(gè)foki裂解半結(jié)構(gòu)域的單一多肽分子。
裂解結(jié)構(gòu)域或者裂解半結(jié)構(gòu)域可以是保留裂解活性或者保留多聚體化(例如二聚體化)以形成功能性裂解結(jié)構(gòu)域的能力的蛋白質(zhì)的任何部分。
示例的typeiis限制酶在美國(guó)專利公開號(hào)20070134796中描述,所述專利以其全部?jī)?nèi)容并入本文作參考。另外的限制酶也含有可分的結(jié)合及裂解結(jié)構(gòu)域,這些酶也涵蓋在本發(fā)明中。見例如robertsetal.(2003)nucleicacidsres.31:418-420。
在某些實(shí)施方案中,裂解結(jié)構(gòu)域包含一或多個(gè)工程化的裂解半結(jié)構(gòu)域(也稱作二聚體化結(jié)構(gòu)域突變體),其最小化或者阻止同源二聚體化,例如在美國(guó)專利公開號(hào)20050064474、20060188987和20080131962中描述,所述專利以其全部?jī)?nèi)容并入本文作參考。
或者,可以使用所謂的“斷裂-酶”技術(shù)在體內(nèi)在核酸靶位點(diǎn)裝配核酸酶(見例如美國(guó)專利公開號(hào)20090068164)。這種斷裂酶的成分可以在單獨(dú)的表達(dá)構(gòu)建體上表達(dá),或者可以在其中各個(gè)成分是例如由自身裂解2a肽或ires序列分離的一個(gè)開放讀框中連接。成分可以是單獨(dú)的鋅指結(jié)合結(jié)構(gòu)域或者大范圍核酸酶核酸結(jié)合結(jié)構(gòu)域的結(jié)構(gòu)域。
鋅指核酸酶
在特定的實(shí)施方案中,嵌合多肽是定制的鋅指核酸酶(zfn),其可以設(shè)計(jì)為輸送靶向的位點(diǎn)特異性雙鏈dna斷裂,外源核酸或者供體dna可以整合入該雙鏈dna斷裂中(見共有的美國(guó)專利公開20100257638所述,該專利并入本文作參考)。zfn是含有來(lái)自限制性內(nèi)切核酸酶(例如foki)的非特異性裂解結(jié)構(gòu)域和鋅指dna結(jié)合結(jié)構(gòu)域多肽的嵌合多肽。見例如huangetal.(1996)j.proteinchem.15:481-9、kimetal.(1997a)proc.natl.acad.sci.usa94:3616-20、kimetal.(1996)proc.natl.acad.sci.usa93:1156-60、kimetal.(1994)procnatl.acad.sci.usa91:883-7、kimetal.(1997b)proc.natl.acad.sci.usa94:12875-9、kimetal.(1997c)gene203:43-9、kimetal.(1998)biol.chem.379:489-95、nahonandraveh(1998)nucleicacidsres.26:1233-9、smithetal.(1999)nucleicacidsres.27:674-81。在一些實(shí)施方案中,zfn包含非典型的鋅指dna結(jié)合結(jié)構(gòu)域(見共有的美國(guó)專利公開20080182332所述,該專利并入本文作參考)。foki限制性內(nèi)切核酸酶必須通過(guò)核酸酶結(jié)構(gòu)域二聚體化以裂解dna及導(dǎo)入雙鏈斷裂。因此,含有來(lái)自這種內(nèi)切核酸酶的核酸酶結(jié)構(gòu)域的zfn也需要核酸酶結(jié)構(gòu)域的二聚體化以裂解靶dna。manietal.(2005)biochem.biophys.res.commun.334:1191-7;smithetal.(2000)nucleicacidsres.28:3361-9。zfn的二聚體化可以通過(guò)兩個(gè)相鄰的相反方向的dna結(jié)合位點(diǎn)促進(jìn)。id.
在特定的實(shí)例中,將外源核酸位點(diǎn)特異性整合進(jìn)宿主的至少一個(gè)nanos基因座中的方法包括將zfn導(dǎo)入宿主細(xì)胞,其中zfn識(shí)別并結(jié)合靶核苷酸序列,其中所述靶核苷酸序列包含于宿主的至少一個(gè)nanos基因座內(nèi)。在某些實(shí)例中,靶核苷酸序列不包含于宿主基因組內(nèi)除了至少一個(gè)nanos基因座之外的任何其它位置內(nèi)。例如,zfn的dna結(jié)合多肽可以工程化為識(shí)別并結(jié)合在至少一個(gè)nanos基因座內(nèi)鑒別的靶核苷酸序列(例如通過(guò)對(duì)nanos基因座測(cè)序而鑒別)。將外源核酸位點(diǎn)特異性整合進(jìn)宿主的至少一個(gè)nanos性能(performance)基因座的方法包括將zfn導(dǎo)入宿主細(xì)胞中,也可包括將外源核酸導(dǎo)入細(xì)胞中,其中外源核酸在包含至少一個(gè)nanos基因座的宿主核酸中的重組通過(guò)zfn與靶序列的位點(diǎn)特異性識(shí)別及結(jié)合(及隨后裂解包含nanos基因座的核酸)而促進(jìn)。
整合在nanos基因座的任選的外源核酸
本發(fā)明的實(shí)施方案可包括選自如下的一或多個(gè)核酸:位點(diǎn)特異性整合在至少一個(gè)nanos基因座中的外源核酸,例如但不限于orf;包含編碼靶向內(nèi)切核酸酶的核苷酸序列的核酸;及包含前述至少任一或這兩個(gè)核酸的載體。因此,在一些實(shí)施方案中使用的特定核酸包括編碼多肽的核苷酸序列,結(jié)構(gòu)核苷酸序列,和/或dna結(jié)合多肽識(shí)別和結(jié)合位點(diǎn)。
用于進(jìn)行位點(diǎn)特異性整合的任選的外源核酸分子
如上所示,提供了外源序列(也稱作“供體序列”或“供體”或“轉(zhuǎn)基因”)的插入,例如用于表達(dá)多肽、校正突變基因或者提高野生型基因的表達(dá)。顯然供體序列典型地與其放置于其中的基因組序列不同。供體序列可以含有兩側(cè)是兩個(gè)同源區(qū)的非同源序列,以使得在感興趣的位置有效的hdr。此外,供體序列可包含含有與細(xì)胞染色質(zhì)中感興趣區(qū)域不同源的序列的載體分子。供體分子可含有與細(xì)胞染色質(zhì)同源的一些不連續(xù)的區(qū)域。例如,為了靶向插入在感興趣的區(qū)域中通常不存在的序列,所述序列可以存在于供體核酸分子中,及兩側(cè)是與感興趣區(qū)域中的序列同源的區(qū)域。
所述供體多核苷酸可以是dna或rna、單鏈或雙鏈的,及可以線性或環(huán)形形式導(dǎo)入細(xì)胞。見例如美國(guó)專利公開號(hào)20100047805、20110281361、20110207221和美國(guó)專利申請(qǐng)系列號(hào)13/889,162所述。如果以線性形式導(dǎo)入,供體序列的末端可以通過(guò)本領(lǐng)域技術(shù)人員已知的方法保護(hù)(例如免于外切核酸降解)。例如,將一或多個(gè)二脫氧核苷酸殘基加入線性分子的3’末端和/或在一或兩個(gè)末端連接自身互補(bǔ)的寡核苷酸。見例如changetal.(1987)proc.natl.acad.sci.usa84:4959-4963;nehlsetal.(1996)science272:886-889。保護(hù)外源多核苷酸免于降解的其它方法包括但不限于添加末端氨基基團(tuán)及使用修飾的核苷酸間鍵例如硫代磷酸酯、磷酸酰胺酯及o-甲基核糖或者脫氧核糖殘基。
多核苷酸可以作為具有其它序列如復(fù)制起點(diǎn)、啟動(dòng)子和編碼抗生素抗性基因的載體分子的一部分導(dǎo)入細(xì)胞中。此外,供體多核苷酸可以作為裸核酸、作為與如脂質(zhì)體或泊洛沙姆(poloxamer)等制劑的核酸復(fù)合物導(dǎo)入,或者可以通過(guò)病毒(例如腺病毒、aav、皰疹病毒、逆轉(zhuǎn)錄病毒、慢病毒和整合酶缺陷的慢病毒(idlv))導(dǎo)入。
供體通常是整合的,由此其表達(dá)由在整合位點(diǎn)的內(nèi)源性啟動(dòng)子驅(qū)動(dòng),即驅(qū)動(dòng)供體整合進(jìn)其中的內(nèi)源基因(例如nanos)表達(dá)的啟動(dòng)子。然而,應(yīng)意識(shí)到供體可包含啟動(dòng)子和/或增強(qiáng)子,例如組成型啟動(dòng)子或可誘導(dǎo)啟動(dòng)子或者組織特異性啟動(dòng)子。
而且,盡管不為表達(dá)所需要,外源序列也可以包括轉(zhuǎn)錄或翻譯調(diào)節(jié)序列,例如啟動(dòng)子、增強(qiáng)子、絕緣子、內(nèi)部核糖體進(jìn)入位點(diǎn)、編碼2a肽的序列和/或聚腺苷酸化信號(hào)。
在實(shí)施方案中可以以位點(diǎn)特異性方式整合進(jìn)至少一個(gè)nanos基因座中以修飾nanos基因座的外源核酸包括例如但不限于:包含編碼感興趣的多肽的核苷酸序列的核酸,包含農(nóng)業(yè)學(xué)基因的核酸,包含編碼rnai分子的核苷酸序列的核酸,或者破壞nanos基因的核酸。
在一些實(shí)施方案中,外源核酸整合在nanos基因座以修飾該nanos基因座,其中所述核酸包含編碼感興趣的多肽的核苷酸序列,由此該核苷酸序列在宿主中從nanos基因座表達(dá)。在一些實(shí)例中,感興趣的多肽(例如外來(lái)蛋白質(zhì))從編碼感興趣的多肽的核苷酸序列中以商業(yè)數(shù)量表達(dá)。在這種實(shí)例中,感興趣的多肽可以從宿主細(xì)胞、組織或生物量提取。
包含編碼靶向內(nèi)切核酸酶的核苷酸序列的核酸分子
在一些實(shí)施方案中,編碼靶向內(nèi)切核酸酶的核苷酸序列可以通過(guò)操縱(例如連接)編碼包含于靶向內(nèi)切核酸酶內(nèi)的多肽的天然核苷酸序列而被工程化。例如,可以檢查編碼包含dna結(jié)合多肽的蛋白質(zhì)的基因的核苷酸序列以鑒別相應(yīng)于dna結(jié)合多肽的基因的核苷酸序列,及該核苷酸序列可用作編碼包含dna結(jié)合多肽的靶向內(nèi)切核酸酶的核苷酸序列的元件。或者,靶向內(nèi)切核酸酶的氨基酸序列可用于例如根據(jù)遺傳密碼簡(jiǎn)并而推導(dǎo)編碼靶向內(nèi)切核酸酶的核苷酸序列。
在示例的包含編碼靶向內(nèi)切核酸酶的核苷酸序列的核酸分子中,編碼核酸酶多肽的第一多核苷酸序列的最后的密碼子及編碼dna結(jié)合多肽的第二多核苷酸序列的第一個(gè)密碼子可以間隔任何數(shù)目的核苷酸三聯(lián)體,例如不編碼內(nèi)含子或者“stop”。同樣,編碼編碼dna結(jié)合多肽的第一多核苷酸序列的核苷酸序列的最后的密碼子及編碼核酸酶多肽的第二多核苷酸序列的第一個(gè)密碼子可以間隔任何數(shù)目的核苷酸三聯(lián)體。在這些及進(jìn)一步的實(shí)施方案中,編碼核酸酶多肽的第一多核苷酸序列的最后(即核酸序列中的3’末端)的最后密碼子及編碼dna結(jié)合多肽的第二多核苷酸序列可以與直接連續(xù)相連的或者由不超過(guò)如由合成的核苷酸接頭(例如用于實(shí)現(xiàn)融合的核苷酸接頭)編碼的短肽序列間隔的進(jìn)一步的多核苷酸編碼序列的第一個(gè)密碼子以符合讀框(phase-register)融合。示例的這種進(jìn)一步的多核苷酸序列包括例如但不限于標(biāo)簽、靶向肽及酶裂解位點(diǎn)。同樣,第一和第二多核苷酸序列5’末端(在核酸序列中)的第一個(gè)密碼子可以與直接連續(xù)相連的或者由不超過(guò)短肽序列間隔的進(jìn)一步的多核苷酸編碼序列的最后的密碼子以符合讀框融合。
間隔靶向內(nèi)切核酸酶中編碼功能性多肽(例如dna結(jié)合多肽和核酸酶多肽)的多核苷酸序列的序列可以例如由任何序列組成,由此編碼的氨基酸序列不大可能明顯改變靶向內(nèi)切核酸酶的翻譯。由于已知核酸酶多肽及已知dna結(jié)合多肽的自主性質(zhì),在實(shí)例中插入序列將不干擾這些結(jié)構(gòu)的各自功能。
其它敲除方法
本領(lǐng)域已知的多種其它方法可用于失活基因以產(chǎn)生敲除動(dòng)物和/或在動(dòng)物中導(dǎo)入核酸構(gòu)建體以產(chǎn)生創(chuàng)始(founder)動(dòng)物及產(chǎn)生動(dòng)物品系,其中敲除或核酸構(gòu)建體被整合進(jìn)基因組中。這種技術(shù)包括但不限于:前核顯微注射(美國(guó)專利號(hào)4,873,191),逆轉(zhuǎn)錄病毒介導(dǎo)的基因轉(zhuǎn)移進(jìn)種系(vanderputtenetal.(1985)proc.natl.acad.sci.usa82,6148-1652),基因靶向進(jìn)入胚胎干細(xì)胞(thompsonetal.(1989)cell56,313-321),胚胎電穿孔(lo(1983)mol.cell.biol.3,1803-1814),精子介導(dǎo)的基因轉(zhuǎn)移(lavitranoetal.(2002)proc.natl.acad.sci.usa99,14230-14235;lavitranoetal.(2006)reprod.fert.develop.18,19-23),及體細(xì)胞如卵丘細(xì)胞或乳腺細(xì)胞、成年、胎兒或胚胎干細(xì)胞的體內(nèi)轉(zhuǎn)化,隨后核移植(wilmutetal.(1997)nature385,810-813;和wakayamaetal.(1998)nature394,369-374)。前核顯微注射、精子介導(dǎo)的基因轉(zhuǎn)移和體細(xì)胞核轉(zhuǎn)移是特別有用的技術(shù)。經(jīng)遺傳修飾的動(dòng)物是其中所有細(xì)胞包括其種系細(xì)胞均具有遺傳修飾的動(dòng)物。當(dāng)使用的方法產(chǎn)生在其遺傳修飾中是嵌合的動(dòng)物時(shí),可以使所述動(dòng)物近親交配及可以選擇基因組修飾的后代。例如,如果細(xì)胞在胚泡階段被修飾,則克隆技術(shù)可用于產(chǎn)生嵌合動(dòng)物,或者在修飾單細(xì)胞時(shí)可進(jìn)行基因組修飾。根據(jù)使用的特定方法,被修飾使得其不是性成熟的動(dòng)物可以對(duì)于修飾是純合或雜合的。如果特定基因由于敲除修飾而失活,通常要求純合性。如果特定基因由于rna干擾或顯性陰性(dominantnegative)策略而失活,則雜合性通常是足夠的。
典型地,在胚胎/受精卵顯微注射中,將核酸構(gòu)建體或mrna導(dǎo)入受精卵中;將1或2個(gè)細(xì)胞受精卵用作含有來(lái)自精子頭部的遺傳材料的前核,所述卵在原生質(zhì)中可見。前核階段的受精卵可以在體外或體內(nèi)(即通過(guò)手術(shù)從供體動(dòng)物輸卵管中獲取)獲得。體外受精卵可以如下所述產(chǎn)生。例如,在屠宰場(chǎng)收集豬卵巢,在運(yùn)輸期間保持在22-28℃。洗滌并分離卵巢以抽吸卵泡,可以使用18號(hào)針頭及在真空下將4-8mm的卵泡抽吸置于50ml錐形離心管中。卵泡液和抽吸的卵母細(xì)胞可以通過(guò)具有商業(yè)tl-hepes的預(yù)濾器(minitube,verona,wis.)漂洗。可以選擇周圍環(huán)繞緊密的卵丘團(tuán)的卵母細(xì)胞并置于tcm-199卵母細(xì)胞成熟培養(yǎng)基(minitube,verona,wis.)中在濕潤(rùn)空氣中在38.7℃和5%co2條件下保溫大約22小時(shí),所述培養(yǎng)基補(bǔ)加了0.1mg/ml半胱氨酸、10ng/ml表皮生長(zhǎng)因子、10%豬卵泡液、50μm2-巰基乙醇、0.5mg/mlcamp、10iu/ml每種孕馬血清促性腺激素(pmsg)和人絨毛膜促性腺激素(hcg)。隨后,將卵母細(xì)胞移至不含有camp、pmsg或hcg的新鮮tcm-199成熟培養(yǎng)基中,另外保溫22小時(shí)。通過(guò)在0.1%透明質(zhì)酸酶中渦旋1分鐘可以將成熟卵母細(xì)胞的卵丘細(xì)胞剝離。
對(duì)于豬,成熟卵母細(xì)胞可以在minitube5孔受精培養(yǎng)皿中的500μlminitubeporcproivf培養(yǎng)基系統(tǒng)(minitube,verona,wis.)中受精。在體外受精(ivf)的準(zhǔn)備中,新鮮收集的或冷凍的公豬精液可以洗滌并重懸浮于porcproivf培養(yǎng)基中,數(shù)量為4×105個(gè)精子。精子濃度可以通過(guò)計(jì)算機(jī)輔助精液分析系統(tǒng)(spermvision,minitube,verona,wis.)分析。最終體外授精可以根據(jù)公豬情況在10μl體積終濃度為大約40個(gè)活動(dòng)精子/卵母細(xì)胞進(jìn)行。將所有的受精卵母細(xì)胞在38.7℃在5.0%co2大氣條件下保溫6小時(shí)。在授精后6小時(shí),可以將推定的受精卵在ncsu-23中洗滌兩次,并移至0.5ml相同培養(yǎng)基中。這個(gè)系統(tǒng)在具有10-30%多精授精率的大多數(shù)公豬可以常規(guī)產(chǎn)生20-30%胚泡。
線性化核酸構(gòu)建體或mrna可以注射入前核之一或細(xì)胞質(zhì)中。然后可以將注射的卵移至受體雌性動(dòng)物中(例如受體雌性動(dòng)物的輸卵管中),使其在受體雌性動(dòng)物中發(fā)育以產(chǎn)生轉(zhuǎn)基因動(dòng)物。特別地,體外授精的胚胎可以在15,000g離心5分鐘以沉淀脂質(zhì),使得前核可見。可以使用eppendorffemtojet注射器注射胚胎,及可以培養(yǎng)胚胎直至胚泡形成。可以記錄胚胎分裂和胚泡形成的速度和質(zhì)量。
胚胎可以經(jīng)手術(shù)移至不同步(asynchronous)受體的子宮內(nèi)。典型地,可以使用5.5英寸
在體細(xì)胞核轉(zhuǎn)移中,可以將包括上述核酸構(gòu)建體的轉(zhuǎn)基因細(xì)胞(例如轉(zhuǎn)基因豬細(xì)胞或牛細(xì)胞)如胚胎卵裂球、胎兒成纖維細(xì)胞、成年耳成纖維細(xì)胞或者顆粒細(xì)胞導(dǎo)入無(wú)核卵母細(xì)胞中以建立組合的細(xì)胞。卵母細(xì)胞可以通過(guò)在極體附近的透明帶部分分離術(shù)然后在剝離區(qū)壓緊細(xì)胞質(zhì)而去核。典型地,使用具有尖銳斜面尖端的注射移液管將轉(zhuǎn)基因細(xì)胞注射進(jìn)在減數(shù)分裂2階段停滯的無(wú)核卵母細(xì)胞中。在一些慣例中,在減數(shù)分裂-2階段停滯的卵母細(xì)胞稱作卵。在產(chǎn)生豬或牛胚胎后(例如通過(guò)融合并激活卵母細(xì)胞),在激活后大約20-24小時(shí)將胚胎移至受體雌性動(dòng)物的輸卵管。見例如cibellietal.(1998)science280,1256-1258和美國(guó)專利號(hào)6,548,741。對(duì)于豬,在轉(zhuǎn)移胚胎后大約20-21天可以檢查受體雌性動(dòng)物的妊娠情況。
可以使用標(biāo)準(zhǔn)育種技術(shù)產(chǎn)生對(duì)于來(lái)自初始雜合創(chuàng)始動(dòng)物的外源核酸是純合的動(dòng)物。然而,可以不要求純合性。本發(fā)明描述的轉(zhuǎn)基因豬可以與其它感興趣的豬繁殖。
在一些實(shí)施方案中,感興趣的核酸和可選擇標(biāo)記可以提供在單獨(dú)的轉(zhuǎn)座子上,及以不同量提供給胚胎或細(xì)胞,其中含有可選擇標(biāo)記的轉(zhuǎn)座子的量遠(yuǎn)超過(guò)(超過(guò)5-10倍)含有感興趣的核酸的轉(zhuǎn)座子的量。表達(dá)感興趣的核酸的轉(zhuǎn)基因細(xì)胞或動(dòng)物可以基于可選擇標(biāo)記的存在和表達(dá)而分離。由于轉(zhuǎn)座子將以精確和分開的方式(單獨(dú)的轉(zhuǎn)座事件)整合進(jìn)基因組中,因此感興趣的核酸和可選擇的標(biāo)記不是遺傳連鎖的且可以通過(guò)標(biāo)準(zhǔn)育種方法通過(guò)遺傳隔離而易于分離。因此,可以產(chǎn)生轉(zhuǎn)基因動(dòng)物,考慮到公共安全觀點(diǎn),其在隨后的世代中不強(qiáng)迫保留可選擇標(biāo)記。
一旦轉(zhuǎn)基因動(dòng)物已經(jīng)產(chǎn)生,則使用標(biāo)準(zhǔn)技術(shù)評(píng)估外源核酸的表達(dá)。初始篩選可以通過(guò)southern印跡分析以確定所述構(gòu)建體整合是否已經(jīng)發(fā)生而完成。關(guān)于southern分析的描述見sambrooketal.,1989,molecularcloning,alaboratorymanual,secondedition,coldspringharborpress,plainview;n.y.的章節(jié)9.37-9.52。聚合酶鏈反應(yīng)(pcr)技術(shù)也可用于初始篩選中。pcr是指其中靶核酸被擴(kuò)增的程序或技術(shù)。通常,來(lái)自感興趣的區(qū)域末端或更遠(yuǎn)處的序列信息用于設(shè)計(jì)寡核苷酸引物,其與被擴(kuò)增的模板的相反鏈的序列相同或相似。pcr可用于從dna以及rna包括來(lái)自全部基因組dna或全部細(xì)胞rna的序列中擴(kuò)增特定序列。引物典型長(zhǎng)度為14-40個(gè)核苷酸,但是范圍可以是長(zhǎng)度為10個(gè)核苷酸至幾百個(gè)核苷酸。pcr在例如pcrprimer:alaboratorymanual,ed.dieffenbachanddveksler,coldspringharborlaboratorypress,1995中描述。核酸也可以通過(guò)連接酶鏈反應(yīng)、鏈置換擴(kuò)增、自主序列復(fù)制或者基于核酸序列的擴(kuò)增。見例如lewis(1992)geneticengineeringnews12,1;guatellietal.(1990)proc.natl.acad.sci.usa87:1874;及weiss(1991)science254:1292所述。在胚泡階段,胚胎可以單獨(dú)處理以通過(guò)pcr、southern雜交和splinkerettepcr進(jìn)行分析(見例如dupuyetal.procnatlacadsciusa(2002)99:4495)。
編碼多肽的核酸序列在轉(zhuǎn)基因豬的組織中的表達(dá)可以使用如下技術(shù)評(píng)估,所述技術(shù)包括例如對(duì)得自所述動(dòng)物的組織樣品進(jìn)行northern印跡分析,原位雜交分析,western分析,免疫測(cè)定如酶聯(lián)免疫吸附測(cè)定,及逆轉(zhuǎn)錄酶pcr(rt-pcr)。
干擾rna
已知許多干擾rna(rnai)系統(tǒng)。雙鏈rna(dsrna)誘導(dǎo)同源基因轉(zhuǎn)錄物的序列特異性降解。rna誘導(dǎo)的沉默復(fù)合物(risc)使dsrna代謝為小的21-23個(gè)核苷酸的小干擾rna(sirna)。risc含有雙鏈rnase(dsrnase,例如dicer)和ssrnase(例如argonaut2或ago2)。risc利用反義鏈作為指導(dǎo)以發(fā)現(xiàn)可裂解靶。sirna和微小rna(mirna)均已知。在遺傳編輯的動(dòng)物中失活基因的方法包括誘導(dǎo)針對(duì)靶基因和/或核酸的rna干擾,由此靶基因和/或核酸的表達(dá)被降低。
例如,外源核酸序列可以誘導(dǎo)針對(duì)編碼多肽的核酸的rna干擾。例如,與靶dna同源的雙鏈小干擾rna(sirna)或小發(fā)夾rna(shrna)可用于降低該dna的表達(dá)。sirna構(gòu)建體可如下述參考文獻(xiàn)所述產(chǎn)生,例如fireetal.(1998)nature391:806,romanoandmasino(1992)mol.microbiol.6:3343,cogonietal.(1996)emboj.15:3153,cogoniandmasino(1999)nature399:166,misquittaandpaterson(1999)proc.natl.acad.sci.usa96:1451,及kennerdellandcarthew(1998)cell95:1017。shrna構(gòu)建體可如mcintyreandfanning(2006)bmcbiotechnology6:1所述產(chǎn)生。通常,shrna被轉(zhuǎn)錄為含有互補(bǔ)區(qū)的單鏈rna分子,其可以退火并形成短發(fā)夾。
發(fā)現(xiàn)針對(duì)特定基因的單一的個(gè)體功能性sirna或mirna的可能性很高。特定sirna序列的可預(yù)測(cè)性例如為大約50%,但是可以產(chǎn)生許多具有良好可信度的干擾rna,其中至少一個(gè)將是有效的。
實(shí)施方案包括體外細(xì)胞、體內(nèi)細(xì)胞及經(jīng)遺傳編輯的動(dòng)物如牲畜,其表達(dá)針對(duì)性成熟選擇性的神經(jīng)內(nèi)分泌基因的rnai。一個(gè)實(shí)施方案是針對(duì)gpr54、kiss1和gnrh1中的基因的rnai。rnai可例如選自sirna、shrna、dsrna、risc和mirna。
可誘導(dǎo)系統(tǒng)
可誘導(dǎo)系統(tǒng)用于控制性成熟基因的表達(dá)。本領(lǐng)域已知各種可誘導(dǎo)系統(tǒng),其可以在時(shí)間與空間上控制基因表達(dá)。一些系統(tǒng)已經(jīng)證實(shí)在轉(zhuǎn)基因動(dòng)物體內(nèi)是功能性的。
可誘導(dǎo)系統(tǒng)的一個(gè)實(shí)例是四環(huán)素(tet)-on啟動(dòng)子系統(tǒng),其可用于調(diào)節(jié)核酸的轉(zhuǎn)錄。在這個(gè)系統(tǒng)中,突變的tet阻抑物(tetr)與單純皰疹病毒vp16反式激活蛋白的激活結(jié)構(gòu)域融合,產(chǎn)生四環(huán)素控制的轉(zhuǎn)錄激活物(tta),其由tet或多西環(huán)素(dox)調(diào)節(jié)。在不存在抗生素的條件下,轉(zhuǎn)錄是最低限度的,而在存在tet或dox的條件下,轉(zhuǎn)錄被誘導(dǎo)。另一種可誘導(dǎo)系統(tǒng)包括蛻皮激素或雷帕霉素系統(tǒng)。蛻皮激素是一種昆蟲蛻皮激素,其產(chǎn)生受蛻皮激素受體與超螺旋(ultraspiracle)基因(usp)產(chǎn)物的異源二聚體的控制。通過(guò)用蛻皮激素或者蛻皮激素的類似物如muristeronea處理而誘導(dǎo)表達(dá)。給予動(dòng)物以觸發(fā)可誘導(dǎo)系統(tǒng)的物質(zhì)稱作誘導(dǎo)劑。
四環(huán)素可誘導(dǎo)系統(tǒng)和cre/loxp重組酶系統(tǒng)(組成型或可誘導(dǎo)的)是最常用的可誘導(dǎo)系統(tǒng)。四環(huán)素可誘導(dǎo)系統(tǒng)包括四環(huán)素控制的反式激活蛋白(tta)/反向(rtta)。在體內(nèi)使用這些系統(tǒng)的方法包括產(chǎn)生兩個(gè)品系的遺傳編輯的動(dòng)物。一個(gè)動(dòng)物品系在選擇的啟動(dòng)子控制下表達(dá)激活物(tta、rtta或cre重組酶)。另一組轉(zhuǎn)基因動(dòng)物表達(dá)接受體,其中感興趣基因(或者被修飾的基因)的表達(dá)在tta/rtta反式激活蛋白的靶序列的控制下(或者兩側(cè)是loxp序列)。這兩個(gè)品系的小鼠交配提供了對(duì)基因表達(dá)的控制。
四環(huán)素依賴性調(diào)節(jié)系統(tǒng)(tet系統(tǒng))依賴于兩種成分,即四環(huán)素控制的反式激活蛋白(tta或rtta)及tta/rtta依賴性啟動(dòng)子,所述啟動(dòng)子以四環(huán)素依賴性方式控制下游cdna的表達(dá)。在不存在四環(huán)素或其衍生物(如多西環(huán)素)條件下,tta結(jié)合teto序列,使得tta依賴性啟動(dòng)子轉(zhuǎn)錄激活。然而,在存在多西環(huán)素條件下,tta不能與其靶相互作用及不發(fā)生轉(zhuǎn)錄。使用tta的tet系統(tǒng)稱作tet-off,因?yàn)樗沫h(huán)素或多西環(huán)素使得轉(zhuǎn)錄下調(diào)。給予四環(huán)素或者其衍生物使得可以在體內(nèi)時(shí)間控制轉(zhuǎn)基因表達(dá)。rtta是tta的變體,其在不存在多西環(huán)素條件下是無(wú)功能的,但是需要存在反式激活的配體。這種tet系統(tǒng)因此稱作tet-on。所述tet系統(tǒng)已經(jīng)用于在體內(nèi)編碼例如報(bào)道基因、癌基因或者參與信號(hào)級(jí)聯(lián)的蛋白的一些轉(zhuǎn)基因的可誘導(dǎo)表達(dá)。
cre/lox系統(tǒng)使用cre重組酶,其通過(guò)兩個(gè)遠(yuǎn)離的cre識(shí)別序列即loxp位點(diǎn)之間的交叉而催化位點(diǎn)特異性重組。導(dǎo)入兩個(gè)loxp序列之間的dna序列(稱作foxeddna)通過(guò)cre介導(dǎo)的重組切除。使用空間控制(使用組織或細(xì)胞特異性啟動(dòng)子)或者時(shí)間控制(使用可誘導(dǎo)系統(tǒng))對(duì)轉(zhuǎn)基因動(dòng)物中cre表達(dá)進(jìn)行的控制導(dǎo)致在兩個(gè)loxp位點(diǎn)之間dna切除的控制。一種應(yīng)用是條件性基因失活(條件性敲除)。另一種方法是蛋白質(zhì)過(guò)表達(dá),其中foxed終止密碼子插入在啟動(dòng)子序列與感興趣的dna之間。遺傳編輯的動(dòng)物不表達(dá)轉(zhuǎn)基因直至cre被表達(dá),導(dǎo)致floxed終止密碼子切除。這個(gè)系統(tǒng)已經(jīng)用于組織特異性瘤形成及在b淋巴細(xì)胞中受控的反基因受體表達(dá)??烧T導(dǎo)的cre重組酶也已經(jīng)揭示??烧T導(dǎo)的cre重組酶僅由給予外源配體而激活??烧T導(dǎo)的cre重組酶是含有原始cre重組酶和一個(gè)特異性配體結(jié)合結(jié)構(gòu)域的融合蛋白。cre重組酶的功能活性依賴于能結(jié)合融合蛋白中這個(gè)特異性結(jié)構(gòu)域的外部配體。
實(shí)施方案包括體外細(xì)胞、體內(nèi)細(xì)胞及遺傳編輯的動(dòng)物如包含在可誘導(dǎo)系統(tǒng)控制下的性成熟選擇性神經(jīng)內(nèi)分泌基因的牲畜。對(duì)動(dòng)物的遺傳修飾可以是基因組或嵌合修飾。一個(gè)實(shí)施方案是由gpr54、kiss1和gnrh1組成的一組中的基因,其在可誘導(dǎo)系統(tǒng)的控制下??烧T導(dǎo)系統(tǒng)可以例如選自tet-on、tet-off、cre-lox和hif1alpha。
載體和核酸
為了敲除目的、失活基因、獲得基因表達(dá)或者其它目的,可以將多種核酸導(dǎo)入細(xì)胞中。如本文所用,術(shù)語(yǔ)核酸包括dna、rna及核酸類似物,及雙鏈或單鏈的核酸(即有義或反義單鏈)??梢栽趬A基部分、糖部分或者磷酸酯主鏈修飾核酸類似物,以改良例如核酸的穩(wěn)定性、雜交或者溶解性。在堿基部分的修飾包括脫氧尿苷代替脫氧胸苷,及5-甲基-2'-脫氧胞苷和5-溴-2'-脫氧胞苷代替脫氧胞苷。糖部分的修飾包括在核糖的2’羥基進(jìn)行修飾以形成2'-o-甲基或者2'-o-烯丙基糖??梢孕揎椕撗鹾颂橇姿狨ブ麈溡援a(chǎn)生嗎啉代核酸,其中每個(gè)堿基部分與六個(gè)成員的嗎啉代環(huán)或者肽核酸連接,其中脫氧磷酸酯主鏈由偽肽主鏈置換并保留四種堿基。見summertonandweller(1997)antisensenucleicaciddrugdev.7(3):187;及hyrupetal.(1996)bioorgan.med.chem.4:5所述。此外,脫氧磷酸酯主鏈可以用例如硫代磷酸酯或者二硫代磷酸酯主鏈、磷酸亞酰胺(phosphoroamidite)或者烷基磷酸三酯主鏈置換。
靶核酸序列可以與調(diào)節(jié)區(qū)如啟動(dòng)子可操縱地連接。調(diào)節(jié)區(qū)可以是豬調(diào)節(jié)區(qū)或者可以來(lái)自其它物種。如本文所用,可操縱地連接是指調(diào)節(jié)區(qū)相對(duì)于核酸序列定位,以此方式允許或促進(jìn)靶核酸轉(zhuǎn)錄。
任何類型啟動(dòng)子均可以與靶核酸序列可操縱地連接。示例的啟動(dòng)子包括但不限于組織特異性啟動(dòng)子、組成型啟動(dòng)子、可誘導(dǎo)啟動(dòng)子及應(yīng)答或不應(yīng)答特定刺激的啟動(dòng)子。合適的組織特異性啟動(dòng)子可以導(dǎo)致核酸轉(zhuǎn)錄物在β細(xì)胞中優(yōu)先表達(dá),包括例如人胰島素啟動(dòng)子。其它組織特異性啟動(dòng)子可導(dǎo)致在例如肝細(xì)胞或心臟組織中優(yōu)先表達(dá),分別可包括白蛋白或α肌球蛋白重鏈啟動(dòng)子。在其它實(shí)施方案中,可以使用促進(jìn)核酸分子表達(dá)而無(wú)明顯組織或時(shí)間特異性的啟動(dòng)子(即組成型啟動(dòng)子)。例如,可以使用β肌動(dòng)蛋白啟動(dòng)子如雞β肌動(dòng)蛋白基因啟動(dòng)子、遍在蛋白啟動(dòng)子、minicag啟動(dòng)子、甘油醛-3-磷酸脫氫酶(gapdh)啟動(dòng)子或者3-磷酸甘油酸激酶(pgk)啟動(dòng)子,以及病毒啟動(dòng)子如單純皰疹病毒胸苷激酶(hsv-tk)啟動(dòng)子、sv40啟動(dòng)子或者巨細(xì)胞病毒(cmv)啟動(dòng)子。在一些實(shí)施方案中,雞β肌動(dòng)蛋白基因啟動(dòng)子與cmv增強(qiáng)子的融合體用作啟動(dòng)子。見例如xuetal.(2001)hum.genether.12:563;及kiwakietal.(1996)hum.genether.7:821所述。
可用于核酸構(gòu)建體中的其它調(diào)節(jié)區(qū)包括但不限于聚腺苷酸化序列、翻譯控制序列(例如內(nèi)部核糖體進(jìn)入節(jié)段,ires)、增強(qiáng)子、可誘導(dǎo)元件或者內(nèi)含子。盡管這種調(diào)節(jié)區(qū)可以通過(guò)影響轉(zhuǎn)錄、mrna的穩(wěn)定性、翻譯效力等而增加表達(dá),但是其可以不是必需的。這種調(diào)節(jié)區(qū)根據(jù)需要可以包含在核酸構(gòu)建體中以獲得核酸在細(xì)胞中的最佳表達(dá)。然而,有時(shí)不用這種額外的元件也可以獲得足夠的表達(dá)。
可以使用編碼信號(hào)肽或者可選擇標(biāo)記的核酸構(gòu)建體。可以使用信號(hào)肽,由此編碼的多肽指向于特定細(xì)胞位置(例如細(xì)胞表面)??蛇x擇標(biāo)記的非限制性實(shí)例包括嘌呤霉素、更昔洛韋(ganciclovir)、腺苷脫氨酶(ada)、氨基糖苷磷酸轉(zhuǎn)移酶(neo,g418,aph)、二氫葉酸還原酶(dhfr)、潮霉素-b-磷酸轉(zhuǎn)移酶、胸苷激酶(tk)及黃嘌呤-鳥嘌呤磷酸核糖轉(zhuǎn)移酶(xgprt)。這種標(biāo)記可用于在培養(yǎng)物中選擇穩(wěn)定轉(zhuǎn)化體。其它可選擇標(biāo)記包括熒光多肽,如綠色熒光蛋白或者黃色熒光蛋白。
在一些實(shí)施方案中,編碼可選擇標(biāo)記的序列兩側(cè)可以是重組酶如cre或flp的識(shí)別序列。例如,可選擇標(biāo)記的兩側(cè)可以是loxp識(shí)別位點(diǎn)(由cre重組酶識(shí)別的34-bp識(shí)別位點(diǎn))或者frt識(shí)別位點(diǎn),由此所述可選擇標(biāo)記可以從構(gòu)建體中切除。見orban,etal.,proc.natl.acad.sci.(1992)89:6861關(guān)于cre/lox技術(shù)的回顧及brandanddymecki,dev.cell(2004)6:7所述。含有由可選擇標(biāo)記基因中斷的cre或flp可激活的轉(zhuǎn)基因的轉(zhuǎn)座子也可以用于獲得具有轉(zhuǎn)基因條件表達(dá)的轉(zhuǎn)基因動(dòng)物。例如,驅(qū)動(dòng)標(biāo)記/轉(zhuǎn)基因表達(dá)的啟動(dòng)子可以是遍在的或組織特異性的,其導(dǎo)致所述標(biāo)記在f0動(dòng)物(例如豬)中遍在或組織特異性表達(dá)。轉(zhuǎn)基因的組織特異性激活可以例如通過(guò)將遍在表達(dá)標(biāo)記中斷的轉(zhuǎn)基因的豬與以組織特異性方式表達(dá)cre或flp的豬雜交、或者將以組織特異性方式表達(dá)標(biāo)記中斷的轉(zhuǎn)基因的豬與遍在表達(dá)cre或flp重組酶的豬雜交而實(shí)現(xiàn)。轉(zhuǎn)基因的控制表達(dá)或者標(biāo)記的控制切除使得所述轉(zhuǎn)基因表達(dá)。
在一些實(shí)施方案中,外源核酸編碼多肽。編碼多肽的核酸序列可包含標(biāo)簽序列,其編碼設(shè)計(jì)為促進(jìn)隨后操縱(例如促進(jìn)定位或檢測(cè))編碼的多肽的“標(biāo)簽”。標(biāo)簽序列可以插入編碼多肽的核酸序列中,由此編碼的標(biāo)簽位于多肽的羧基末端或者氨基末端。編碼的標(biāo)簽的非限制性實(shí)例包括谷胱甘肽s-轉(zhuǎn)移酶(gst)和flagtm標(biāo)簽(kodak,newhaven,conn.)。
核酸構(gòu)建體可以使用sssicpg甲基化酶(newenglandbiolabs,ipswich,mass.)甲基化。通常,可以將核酸構(gòu)建體與s-腺苷甲硫氨酸和sssicpg-甲基化酶在緩沖液中37℃在保溫。超甲基化可以通過(guò)將構(gòu)建體與1單位hinp1i內(nèi)切核酸酶在37℃保溫1小時(shí)并通過(guò)瓊脂糖凝膠電泳分析而證實(shí)。
核酸構(gòu)建體可以通過(guò)使用各種技術(shù)導(dǎo)入任何類型的胚胎、胎兒或成年動(dòng)物細(xì)胞中,包括例如生殖細(xì)胞如卵母細(xì)胞或卵、祖細(xì)胞、成年或胚胎干細(xì)胞、原始生殖細(xì)胞、腎細(xì)胞如pk-15細(xì)胞、胰島細(xì)胞、β細(xì)胞、肝細(xì)胞,或者成纖維細(xì)胞如真皮成纖維細(xì)胞。所述技術(shù)的非限制性實(shí)例包括使用轉(zhuǎn)座子系統(tǒng),可感染細(xì)胞的重組病毒,或者脂質(zhì)體或者其它非病毒方法如電穿孔、顯微注射或者磷酸鈣沉淀,這些技術(shù)能將核酸輸送至細(xì)胞。
在轉(zhuǎn)座子系統(tǒng)中,核酸構(gòu)建體的轉(zhuǎn)錄單位即與外源核酸序列可操縱地連接的調(diào)節(jié)區(qū)兩側(cè)是轉(zhuǎn)座子反向重復(fù)序列。已經(jīng)揭示了一些轉(zhuǎn)座子系統(tǒng)包括例如sleepingbeauty(見美國(guó)專利號(hào)6,613,752和美國(guó)專利公開號(hào)2005/0003542)、frogprince(miskeyetal.(2003)nucleicacidsres.31:6873)、tol2(kawakami(2007)genomebiology8(suppl.1):s7;minos(pavlopoulosetal.(2007)genomebiology8(suppl.1):s2)、hsmar1(miskeyetal.(2007))molcellbiol.27:4589)及passport,以將核酸導(dǎo)入細(xì)胞包括小鼠、人和豬細(xì)胞中。sleepingbeauty轉(zhuǎn)座子特別有用。轉(zhuǎn)座酶可以作為蛋白質(zhì)輸送,作為外源核酸在相同核酸構(gòu)建體上編碼,可以導(dǎo)入在單獨(dú)的核酸構(gòu)建體上,或者作為mrna提供(例如在體外轉(zhuǎn)錄和加帽的mrna)。
絕緣子元件也可以包含在核酸構(gòu)建體中以保持外源核酸的表達(dá)及抑制不希望的宿主基因轉(zhuǎn)錄。見例如美國(guó)專利公開號(hào)2004/0203158所述。典型地,絕緣子元件在轉(zhuǎn)錄單位的每一側(cè)及在轉(zhuǎn)座子的反向重復(fù)序列內(nèi)部。絕緣子元件的非限制性實(shí)例包括基質(zhì)附著區(qū)(mar)型絕緣子元件和邊界型絕緣子元件。見例如美國(guó)專利號(hào)6,395,549、5,731,178、6,100,448和5,610,053及美國(guó)專利公開號(hào)2004/0203158所述。
核酸可以摻入載體中。載體是一個(gè)廣義術(shù)語(yǔ),包括設(shè)計(jì)為從運(yùn)載體移至靶dna中的任何特定dna節(jié)段。載體可以稱作表達(dá)載體或者載體系統(tǒng),其是將dna插入基因組或其它靶向dna序列如游離基因、質(zhì)?;蛘呱踔敛《?噬菌體dna節(jié)段中需要的一系列成分。用于在動(dòng)物中輸送基因的載體系統(tǒng)如病毒載體(例如逆轉(zhuǎn)錄病毒、腺伴隨病毒及整合噬菌體病毒)及非病毒載體(例如轉(zhuǎn)座子)具有兩種基本成分:1)包含dna的載體(或者rna,其被逆轉(zhuǎn)錄為cdna),及2)轉(zhuǎn)座酶、重組酶或者其它整合酶,其識(shí)別載體與dna靶序列并將載體插入靶dna序列中。載體通常含有一或多個(gè)表達(dá)盒,其包含一或多個(gè)表達(dá)控制序列,其中表達(dá)控制序列是分別控制并調(diào)節(jié)另一dna序列或mrna轉(zhuǎn)錄和/或翻譯的dna序列。
本領(lǐng)域已知許多不同類型的載體。例如已知質(zhì)粒和病毒載體如逆轉(zhuǎn)錄病毒載體。哺乳動(dòng)物表達(dá)質(zhì)粒典型具有復(fù)制起點(diǎn)、合適的啟動(dòng)子及任選增強(qiáng)子、必需的核糖體結(jié)合位點(diǎn)、聚腺苷酸化位點(diǎn)、剪接供體和受體位點(diǎn)、轉(zhuǎn)錄終止序列,及5’側(cè)翼非轉(zhuǎn)錄序列。示例的載體包括:質(zhì)粒(其也可以是另一類型載體的運(yùn)載體),腺病毒,腺伴隨病毒(aav),慢病毒(例如修飾的hiv-1、siv或fiv)、逆轉(zhuǎn)錄病毒(例如asv、alv或momlv),以及轉(zhuǎn)座子(例如sleepingbeauty、p-元件、tol-2、frogprince、piggybac)。
如本文所用,術(shù)語(yǔ)核酸是指rna和dna,包括例如cdna、基因組dna、合成的(例如化學(xué)合成的)dna,以及天然發(fā)生的及化學(xué)修飾的核酸,例如合成的堿基或者主鏈。核酸分子可以是雙鏈或單鏈的(即有義或反義單鏈)。術(shù)語(yǔ)轉(zhuǎn)基因在本文廣泛使用,是指經(jīng)遺傳編輯的生物體或遺傳工程化的生物體,其遺傳材料已經(jīng)使用遺傳工程技術(shù)加以改變。敲除動(dòng)物因此是轉(zhuǎn)基因動(dòng)物,無(wú)論外源基因或核酸在動(dòng)物或其后代中是否表達(dá)。
創(chuàng)始動(dòng)物、動(dòng)物品系、性狀和繁殖
創(chuàng)始動(dòng)物可以通過(guò)本文描述的克隆及其它方法產(chǎn)生。創(chuàng)始動(dòng)物對(duì)于遺傳修飾可以是純合的,與在受精卵或原始細(xì)胞經(jīng)歷純合修飾的情況中一樣。相似地,產(chǎn)生的創(chuàng)始動(dòng)物也可以是雜合的。在nanos敲除的情況中,創(chuàng)始動(dòng)物優(yōu)選是雜合的。創(chuàng)始動(dòng)物可以經(jīng)遺傳修飾,是指所有細(xì)胞在基因組中均經(jīng)歷修飾。創(chuàng)始動(dòng)物對(duì)于修飾可以是嵌合的,這在當(dāng)多個(gè)載體導(dǎo)入胚胎、典型在胚泡階段的多個(gè)細(xì)胞之一中時(shí)可發(fā)生??梢詸z測(cè)嵌合動(dòng)物的后代以鑒別經(jīng)遺傳修飾的后代。當(dāng)已經(jīng)產(chǎn)生可以有性繁殖或者通過(guò)輔助生殖技術(shù)繁殖的一個(gè)動(dòng)物集合時(shí),建立動(dòng)物品系,雜合或純合后代一致地表達(dá)所述修飾。
在牲畜中,已知許多等位基因與多種性狀連鎖,如生產(chǎn)性狀、品種性狀、可加工性性狀及其它功能性性狀。技術(shù)人員習(xí)慣于監(jiān)測(cè)及量化這些性狀,例如visscheretal.,livestockproductionscience,40(1994)123-137,美國(guó)專利號(hào)7,709,206、us2001/0016315、us2011/0023140和us2005/0153317所述。動(dòng)物品系可包括選自如下的性狀:生產(chǎn)性狀,品種性狀,可加工性性狀,生育力性狀,母性性狀及疾病抗性性狀。進(jìn)一步的性狀包括重組基因產(chǎn)物的表達(dá)。
可以對(duì)具有希望的一或多個(gè)性狀的動(dòng)物進(jìn)行修飾以防止其性成熟。由于動(dòng)物在直至成熟時(shí)是不育的,因此可以調(diào)節(jié)性成熟度作為控制動(dòng)物傳播的手段。因此可以將已經(jīng)繁殖或修飾為具有一或多個(gè)性狀的動(dòng)物提供給接受者,具有降低的接受者繁殖這些動(dòng)物并且盜用性狀價(jià)值的風(fēng)險(xiǎn)。本發(fā)明的實(shí)施方案包括遺傳修飾動(dòng)物基因組,所述修飾包括失活的性成熟基因,其中在野生型動(dòng)物中性成熟基因表達(dá)性成熟選擇性因子。實(shí)施方案包括通過(guò)給予補(bǔ)救由于所述基因表達(dá)喪失所致缺陷的一種化合物處理動(dòng)物以在動(dòng)物中誘導(dǎo)性成熟。
需要給予一種化合物以誘導(dǎo)性成熟的動(dòng)物的繁殖可以在處理設(shè)備(treatmentfacility)有利地實(shí)現(xiàn)。所述處理設(shè)備可以對(duì)良好控制的原種執(zhí)行標(biāo)準(zhǔn)化方案以有效地產(chǎn)生一致的動(dòng)物。動(dòng)物后代可以分配給多個(gè)地區(qū)培育。農(nóng)場(chǎng)和農(nóng)場(chǎng)主(包括牧場(chǎng)和牧場(chǎng)主)可因此定購(gòu)希望數(shù)目的具有指定范圍年齡和/或體重和/或性狀的后代并在希望的時(shí)間和/或地區(qū)將其輸送。接受者如農(nóng)場(chǎng)主然后可以產(chǎn)生動(dòng)物并根據(jù)需要將動(dòng)物輸送給市場(chǎng)。
實(shí)施方案包括輸送(例如輸送至一或多個(gè)地區(qū),多個(gè)農(nóng)場(chǎng))具有性成熟選擇性的失活的神經(jīng)內(nèi)分泌基因的經(jīng)遺傳編輯的牲畜。實(shí)施方案包括輸送年齡為大約1天至大約180天的動(dòng)物。所述動(dòng)物可具有一或多種性狀(例如表達(dá)希望的性狀或高價(jià)值性狀或者新性狀或者重組性狀)。實(shí)施方案進(jìn)一步包括提供所述動(dòng)物和/或繁殖所述動(dòng)物。
本文引用的所有參考文獻(xiàn)包括出版物、專利和專利申請(qǐng)均以該文獻(xiàn)明確的詳細(xì)描述一致的程度并入本文作參考,且以每個(gè)參考文獻(xiàn)單獨(dú)及特別指出并入?yún)⒖嫉南嗤潭燃耙匀績(jī)?nèi)容并入作參考。提供本文論述的參考文獻(xiàn)只是因?yàn)槠湓诒旧暾?qǐng)申請(qǐng)日之前公開。本文沒有任何內(nèi)容解釋為承認(rèn)發(fā)明人沒有資格由于之前的發(fā)明而早于這些公開。提供如下實(shí)施例以舉例說(shuō)明某些特定特征和/或?qū)嵤┓桨?。?shí)施例不應(yīng)理解為將本發(fā)明限制于特定特征或示例的實(shí)施方案。
實(shí)施例1:豬nanos2talen試劑的設(shè)計(jì)、構(gòu)建和檢測(cè)
豬nanos2位于染色體6上,組成編碼138個(gè)氨基酸的蛋白質(zhì)的單一外顯子。在單獨(dú)的豬序列之間進(jìn)行多序列對(duì)比以鑒別潛在的單核苷酸多態(tài)性(在圖1中以紅點(diǎn)表示),在選擇talen結(jié)合位點(diǎn)期間盡可能避免這些。利用在www.zifit.partners.org可免費(fèi)獲得的工具鑒別結(jié)合豬nanos2talen的潛在位點(diǎn)接近基因的5’末端。使用goldengatetalen裝配方案(cermaketal,nar201139(12):e82)構(gòu)建三個(gè)talen對(duì)。將右側(cè)talen裝配克隆進(jìn)目的載體(destinationvector)pcag-t7-talen(sangamo)-foki-kkr-destination,左側(cè)裝配克隆進(jìn)pcag-t7-talen(sangamo)-foki-eld-destination中。使用酶bspei和stui/aatii進(jìn)行診斷性限制消化,通過(guò)dna測(cè)序證實(shí)陽(yáng)性克隆。
豬nanos2talen
aseqidno:75
tgccatgcagctgccaccctttgacatgtggaaggactacttcaacctgagcca18:18:18
a左側(cè):5’tgccatgcagctgccaccseqidno:76
a右側(cè):5’tggctcaggttgaagtagseqidno:77
a左側(cè)
1)ng1-nn2-hd3-hd4-ni5-ng6-nn7-hd8-ni9-nn10--pfus_a
2)hd1-ng2-nn3-hd4-hd5-ni6-hd7--pfus_b7
a右側(cè)
1)ng1-nn2-nn3-hd4-ng5-hd6-ni7-nn8-nn9-ng10--pfus_a
2)ng1-nn2-ni3-ni4-nn5-ng6-ni7--pfus_b7
bseqidno:78
tttgacatgtggaaggactacttcaacctgagccaggtggtgttgggactga18:16:18
b左側(cè):5’tttgacatgtggaaggacseqidno:79
b右側(cè):5’tcagtcccaacaccacctseqidno:80
b左側(cè)
1)ng1-ng2-ng3-nn4-ni5-hd6-ni7-ng8-nn9-ng10--pfus_a
2)nn1-nn2-ni3-ni4-nn5-nn6-ni7--pfus_b7
b右側(cè)
1)ng1-hd2-ni3-nn4-ng5-hd6-hd7-hd8-ni9-ni10--pfus_a
2)hd1-ni2-hd3-hd4-ni5-hd6-hd7--pfus_b7
cseqidno:81
tcaacctgagccaggtggtgttgggactgatccagaatcgtcgacaagggcca18:17:18
c左側(cè):5’tcaacctgagccaggtggseqidno:82
c右側(cè):5’tggcccttgtcgacgattseqidno:83
c左側(cè)
1)ng1-hd2-ni3-ni4-hd5-hd6-ng7-nn8-ni9-nn10—pfus_a
2)hd1-hd2-ni3-nn4-nn5-ng6-nn7—pfus_b7
c右側(cè)
1)ng1-nn2-nn3-hd4-hd5-hd6-ng7-ng8-nn9-ng10—pfus_a
2)hd1-nn2-ni3-hd4-nn5-ni6-ng7—pfus_b7
將豬腎pk15細(xì)胞在補(bǔ)加了10%胎牛血清、100u/ml青霉素和100ug/ml鏈霉素的高濃度葡萄糖dmem(lifetechnologies,#31966)中在濕潤(rùn)溫箱中在37℃及5%co2條件下培養(yǎng)。使用neon電穿孔儀設(shè)定在1400mv進(jìn)行2次脈沖每次20ms,將編碼各一半talen對(duì)a、b或c的1μg無(wú)內(nèi)毒素maxiprep質(zhì)粒dna與編碼cmv-驅(qū)動(dòng)的egfp的1μg質(zhì)粒一起共轉(zhuǎn)染進(jìn)6×105pk15細(xì)胞中。轉(zhuǎn)染的細(xì)胞在沒有抗生素的完全培養(yǎng)基中恢復(fù)。在轉(zhuǎn)染后24小時(shí),將細(xì)胞從37℃移至30℃溫箱中,在此保持48小時(shí)。通過(guò)熒光激活細(xì)胞分選技術(shù)分離gfp+ve細(xì)胞,通過(guò)培養(yǎng)擴(kuò)增,使用qiagendneasy血液和組織試劑盒制備基因組dna。使用accuprime高保真聚合酶及pcr引物osl9和osl10對(duì)基因組dna進(jìn)行pcr。
如廠商(transgenomic)推薦對(duì)pcr產(chǎn)物進(jìn)行細(xì)胞分析。將消化的pcr產(chǎn)物在2%tae瓊脂糖凝膠上解析(圖2)。令人驚奇地,talen對(duì)在其靶位點(diǎn)能誘導(dǎo)nhej事件的效力顯著不同。注意到talen對(duì)a顯示低活性(綠色箭頭,圖2),talen對(duì)b顯示無(wú)可檢測(cè)的活性,talen對(duì)c顯示活性最佳(紅色箭頭,圖2)。
豬nanos2crispr試劑的設(shè)計(jì)、構(gòu)建和檢測(cè)
潛在的小指導(dǎo)rna靶位點(diǎn)最初是基于在豬nanos2基因編碼序列內(nèi)存在前間區(qū)序列鄰近基序(pam)而鑒別的(通過(guò)在所述編碼序列內(nèi)存在有義或反義方向的兩個(gè)連續(xù)鳥嘌呤殘基而確定)。排除跨越一個(gè)潛在snp(在圖1中以紅點(diǎn)表示)的由此鑒別的位點(diǎn)進(jìn)行進(jìn)一步分析。使用blast算法(ncbi.nlm.nih.gov)分析豬基因組的序列匹配,對(duì)剩余的每個(gè)位點(diǎn)分析潛在的脫靶結(jié)合情況。選擇一個(gè)sgrna結(jié)合位點(diǎn),其呈現(xiàn)出對(duì)于豬基因組內(nèi)nanos2基因具有高特異性。這個(gè)20個(gè)堿基對(duì)的序列意外地在每個(gè)方向均具有pam序列。
nanos2結(jié)合位點(diǎn)
5’ccagaatcgtcgacaagggccagagg.3’(seqidno:86)
3’ggtcttagcagctgttcccggtctcc5’(seqidno:87)
下劃線處的序列是有義和反義方向的豬nanos2指導(dǎo)序列的結(jié)合位點(diǎn)(seqidno86和87)。在有義鏈上,pam以序列agg3’至靶位點(diǎn)表示。在反義鏈上,pam以序列tgg3’至靶位點(diǎn)表示。
設(shè)計(jì)鑒別的指導(dǎo)rna結(jié)合序列的正向和反向版本,并定制為gblocks(idt),其具有驅(qū)動(dòng)sgrna結(jié)合序列表達(dá)的人u6啟動(dòng)子,指導(dǎo)rna支架(也稱作cas9結(jié)合結(jié)構(gòu)域)及終止子序列(polyt)(圖3a和3b)。將gblockdna克隆進(jìn)質(zhì)粒中并制備無(wú)內(nèi)毒素的質(zhì)粒dna(qiagen)(圖3c)。使用neon電穿孔儀設(shè)定在1400mv進(jìn)行2次脈沖每次20ms,將分別編碼sgrna序列、cag驅(qū)動(dòng)的cas9及cmv驅(qū)動(dòng)的egfp的三個(gè)質(zhì)粒共轉(zhuǎn)染進(jìn)6×105pk15細(xì)胞中。轉(zhuǎn)染的細(xì)胞在無(wú)抗生素的完全培養(yǎng)基中恢復(fù)。在轉(zhuǎn)染后3天,gfp陽(yáng)性細(xì)胞通過(guò)熒光激活細(xì)胞分選方法分離,通過(guò)培養(yǎng)擴(kuò)增及使用qiagendneasy血液和組織試劑盒制備基因組dna。使用accuprime高保真聚合酶及pcr引物osl9和osl10,對(duì)這個(gè)基因組dna進(jìn)行pcr。如廠商(transgenomic)推薦,對(duì)pcr產(chǎn)物進(jìn)行細(xì)胞分析。消化的pcr產(chǎn)物在2%tae瓊脂糖凝膠上解析(圖4)。雖然這兩個(gè)指導(dǎo)序列均導(dǎo)致在靶位點(diǎn)切割及nhej形成(通過(guò)存在細(xì)胞消化產(chǎn)物而表明,圖4,紅色箭頭),但是令人驚奇地發(fā)現(xiàn)相對(duì)于編碼序列反向的sgrna序列比其有義對(duì)應(yīng)物實(shí)質(zhì)上更有效。
實(shí)施例2:牛nanos2crispr試劑的設(shè)計(jì)、構(gòu)建和檢測(cè)
sgrna的潛在靶位點(diǎn)最初基于在牛nanos2基因編碼序列內(nèi)或者在緊鄰編碼序列兩側(cè)的序列內(nèi)存在pam序列而鑒別。通過(guò)使用blast算法(ncbi.nlm.nih.gov)分析?;蚪M序列匹配情況,分析每個(gè)潛在位點(diǎn)的潛在脫靶結(jié)合情況。選擇9個(gè)潛在的sgrna結(jié)合位點(diǎn)(3個(gè)5’至編碼序列,3個(gè)在編碼序列內(nèi),及3個(gè)3’至終止密碼子),其呈現(xiàn)出對(duì)于牛基因組內(nèi)nanos2基因具有高特異性。
對(duì)于每個(gè)鑒別的sgrna結(jié)合位點(diǎn),設(shè)計(jì)2個(gè)指導(dǎo)序列;一個(gè)是20-聚體的結(jié)合序列,一個(gè)是19-、18-或17-聚體的結(jié)合序列。見表1和圖12。
表1
作為一對(duì)寡核苷酸構(gòu)建指導(dǎo)rna序列,其一旦退火時(shí)可以克隆進(jìn)質(zhì)粒px458的bbsi位點(diǎn)(圖5a、5b和5c)。這產(chǎn)生了具有人u6驅(qū)動(dòng)的sgrna序列及隨后的具有2a可裂解的gfp的cag驅(qū)動(dòng)的cas9的單一質(zhì)粒。質(zhì)粒列表在表2中示出,見圖12。
表2
使用neon電穿孔儀設(shè)定在1800mv單次脈沖20ms,將1微克質(zhì)粒miniprepdna(qiagen)轉(zhuǎn)染進(jìn)6×105牛胚胎成纖維細(xì)胞(bef)中。在轉(zhuǎn)染2天后,使用qiagendneasy血液和組織試劑盒制備基因組dna。使用accuprime高保真聚合酶及pcr引物osl86和osl87對(duì)這個(gè)基因組dna進(jìn)行pcr。
根據(jù)廠商(neb)推薦,對(duì)純化的pcr產(chǎn)物進(jìn)行t7內(nèi)切核酸酶分析。消化的pcr產(chǎn)物在1.4%tae瓊脂糖凝膠上解析(圖6a和6b)。令人驚奇地,在sgrna在其靶位點(diǎn)能誘導(dǎo)nhej形成的效力中發(fā)現(xiàn)顯著不同(通過(guò)存在t7內(nèi)切核酸酶消化產(chǎn)物而表明,圖6a和6b,紅色箭頭)。
根據(jù)t7內(nèi)切核酸酶測(cè)定確定對(duì)于nhej具有最高活性的指導(dǎo)序列成對(duì)組合,由此在細(xì)胞內(nèi)的這兩個(gè)靶位點(diǎn)的裂解具有導(dǎo)致間插序列缺失的潛力。將1微克每種質(zhì)粒psl32+psl38、psl32+psl39、psl32+psl42、psl33+psl38、psl33+psl39或psl33+psl42轉(zhuǎn)染進(jìn)6×105bef細(xì)胞中。如上述進(jìn)行轉(zhuǎn)染、培養(yǎng)及從bef細(xì)胞制備dna。使用accuprime高保真聚合酶及pcr引物osl86和osl87對(duì)基因組dna進(jìn)行pcr,將產(chǎn)物在1.4%tae瓊脂糖凝膠上解析(圖7)。所有六個(gè)質(zhì)粒組合證實(shí),除了全長(zhǎng)pcr產(chǎn)物之外,轉(zhuǎn)染的細(xì)胞群還具有截短的nanos2基因片段,其大小特異于應(yīng)用的sgrna序列組合(紅色箭頭,圖7)。
將這些截短的片段從凝膠中切除,通過(guò)將凝膠切片在spin-xcentrifugetubefilter(costar#8163)中離心從瓊脂糖中分離dna。使用測(cè)序的topota克隆試劑盒(invitrogen#45-0030)將純化的產(chǎn)物克隆進(jìn)pcr4-topo載體中并轉(zhuǎn)化進(jìn)xl-1blue感受態(tài)細(xì)胞(agilenttechnologies#200249)中。將轉(zhuǎn)化的細(xì)菌鋪板于含有100μg/ml氨芐青霉素的lb瓊脂平板上,在37℃培養(yǎng)過(guò)夜。從每個(gè)平板中選擇5個(gè)集落并在含有50μg/ml氨芐青霉素的lb培養(yǎng)基中擴(kuò)增過(guò)夜。使用pureyieldplasmidminiprep系統(tǒng)(promega#a1223)分離質(zhì)粒并使用引物osl86進(jìn)行測(cè)序(edinburghgenomics)。序列對(duì)比表明在每種情況中已發(fā)生靶序列內(nèi)的缺失(圖8)。缺失的片段的末端之間的精確末端連接在每次轉(zhuǎn)染的至少一個(gè)克隆中檢測(cè),而其它克隆表示更多不精確事件,表明對(duì)序列的其它修飾在末端結(jié)合期間發(fā)生。從psl33+psl38組合測(cè)序的克隆均示出相同的精確的末端連接事件。
這種方法表明在靶基因中產(chǎn)生特異性缺失是可能的且合意的,導(dǎo)致編碼的蛋白質(zhì)表達(dá)的喪失或降低或者所得翻譯的蛋白質(zhì)的功能改變,作為誘導(dǎo)nhej及隨之的移碼突變的另一策略。
實(shí)施例3:進(jìn)行遺傳去除的crispr/cas系統(tǒng)
如圖4所示,在細(xì)胞培養(yǎng)物中成功確認(rèn)后,使用t7啟動(dòng)子裝配指導(dǎo)序列并根據(jù)idt技術(shù)合成為g-block。具有t7驅(qū)動(dòng)構(gòu)建體的裝配是體外轉(zhuǎn)錄和產(chǎn)生rna必需的。簡(jiǎn)而言之,使用t7體外轉(zhuǎn)錄試劑盒(ambion)轉(zhuǎn)錄sgrna。同樣,cas9質(zhì)粒得自addgene(質(zhì)粒#42234;名稱:pmj920),使用t7megascript體外轉(zhuǎn)錄試劑盒轉(zhuǎn)錄cas9mrna(圖9a)。
使用eppendorffemtojet注射器以連續(xù)流設(shè)置,將cas9mrna(100ng/μl)和sgrna靶向nanos2(50ng/μl)均注射進(jìn)1-細(xì)胞豬受精卵中。使注射的胚胎進(jìn)展為胚泡階段(圖9c)另加6天,收集dna,在靶位點(diǎn)周圍進(jìn)行pcr擴(kuò)增。靶基因缺失的存在(由于nhej修復(fù)的結(jié)果)通過(guò)pcr擴(kuò)增子測(cè)序評(píng)定。如圖9d所示,證實(shí)成功靶向nanos2基因座。使用基因特異性引物擴(kuò)增nanos2中crispr靶位點(diǎn)周圍的序列,克隆進(jìn)pcr2.1載體(invitrogen),轉(zhuǎn)化進(jìn)dh5α細(xì)胞(neb)中,基于卡那霉素抗性選擇轉(zhuǎn)化體。將菌落培養(yǎng)過(guò)夜,微量制備并通過(guò)sanger測(cè)序法對(duì)質(zhì)粒進(jìn)行測(cè)序。在圖9中,“n”表示nanos2等位基因,第一個(gè)數(shù)字是胚泡號(hào),第二個(gè)帶連字符的數(shù)字表示含有擴(kuò)增的nanos2的細(xì)菌克隆。在圖中,示出克隆的代表序列,標(biāo)示在預(yù)測(cè)的crispr切割位點(diǎn)周圍的缺失“-”。來(lái)自8個(gè)不同胚泡的序列示出nanos2開放讀框的成功缺失和破壞,產(chǎn)生敲除等位基因,如圖9d所示。
也選擇nanos2的第二個(gè)sgrna序列。gaagacaccggagggcgtggtgg(seqidno:7)。將這個(gè)靶序列及較早的靶序列g(shù)aatcgtcgacaagggccagagg(seqidno:8)一起共注射進(jìn)單細(xì)胞胚胎中并培養(yǎng)至胚泡,對(duì)胚泡的dna分析證實(shí)nanos2等位基因的缺失和敲除,見圖10。
使用切口酶對(duì)進(jìn)行基因靶向
cas9核酸酶在dna中導(dǎo)入雙鏈斷裂。相比之下,cas9切口酶僅切割(或切口)dna兩條鏈之一。當(dāng)針對(duì)相反鏈緊密靠近的靶進(jìn)行設(shè)計(jì)時(shí),成對(duì)的切口酶可以導(dǎo)入雙鏈斷裂,及因此可產(chǎn)生高精度缺失。使用成對(duì)的切口酶相對(duì)于核酸酶的優(yōu)勢(shì)是即使cas9切口酶展示出脫靶結(jié)合,兩條鏈中僅一條鏈被切口,這可以被有效修復(fù)而不導(dǎo)致在脫靶位點(diǎn)不希望的修飾。然而,當(dāng)緊密鄰近處組合使用時(shí),切口酶導(dǎo)入靶向的dna裂解。設(shè)計(jì)一對(duì)切口酶以靶向豬nanos2基因。然而,切口酶在導(dǎo)入突變中無(wú)效(圖11)。設(shè)計(jì)一對(duì)單一指導(dǎo)rna以靶向相反鏈。這兩個(gè)sgrna均在圖11方框中示出,相反鏈以黃色高亮標(biāo)示。這兩個(gè)sgrna的pam基序以綠色高亮標(biāo)示。在靶位點(diǎn)周圍鑒別到無(wú)修飾。
nanos2缺陷豬模型的產(chǎn)生
將候選的crisprsgrna和cas9:gfpmrna注射進(jìn)在體外授精的豬胚胎中(圖9c)。簡(jiǎn)而言之,來(lái)自母豬的成熟卵母細(xì)胞購(gòu)自artinc.(madison,wi)并在其商業(yè)成熟培養(yǎng)基#1中連夜運(yùn)輸至實(shí)驗(yàn)室。在置于成熟培養(yǎng)基#1(由art提供)中之后24小時(shí),將50-75個(gè)卵丘細(xì)胞-卵母細(xì)胞復(fù)合物(coc)置于含有0.14%pva、10ng/ml表皮生長(zhǎng)因子、0.57mm半胱氨酸、0.5iu/ml豬fsh和0.5iu/ml綿羊lh的500μl組織培養(yǎng)基199(tcm199)中,在38.5℃和5%co2大氣及100%濕度條件下再培養(yǎng)20小時(shí)。將coc在含有0.01%pva的0.1%透明質(zhì)酸酶的hepes緩沖培養(yǎng)基中渦旋4分鐘以在成熟后除去卵丘細(xì)胞。將30-35個(gè)成熟的剝脫的卵母細(xì)胞組置于100μl修改的tris緩沖培養(yǎng)基(mtbm)中并使用新鮮擴(kuò)增的公豬精液根據(jù)確定的方案授精。簡(jiǎn)而言之,將1-2ml擴(kuò)增的精液與含有1mg/mlbsa的dulbecco’s磷酸鹽緩沖鹽水(dpbs)混合至終體積為10ml,在1000×g、25℃離心4分鐘;將精子在dpbs中洗滌共3次。在最后一次洗滌后,將精子重懸于mtbm培養(yǎng)基中,加入卵母細(xì)胞至終濃度為5×105精子/ml,在38.5℃和5%co2條件下共保溫5小時(shí)。在授精后5小時(shí),為推定的受精卵注射cas9mrna和靶向nanos2的sgrna,及通過(guò)腹中線切口暴露生殖道,將完整的胚胎經(jīng)手術(shù)轉(zhuǎn)移至同步的雌性接受動(dòng)物的輸卵管中。使動(dòng)物從手術(shù)中恢復(fù)并在barc-usda設(shè)施中飼養(yǎng)。
另一選項(xiàng)是使用體內(nèi)授精的1-細(xì)胞胚胎進(jìn)行crispr介導(dǎo)的nanos2靶向及產(chǎn)生編輯的動(dòng)物。使胚胎供體動(dòng)物同步發(fā)情期及通過(guò)首先用喂食14-16天regumate(alterenogest)、隨后在第17天皮下注射pg600(5ml)及在第20天皮下注射1000iu的hcg以進(jìn)行超數(shù)排卵。使動(dòng)物繁育3次,一次在站立發(fā)情(standingestrus)(第20天),另兩次在第21天間隔8小時(shí)授精。動(dòng)物在第22天人道主義處死,通過(guò)沖洗輸卵管收獲胚胎。如上述為胚胎注射crisprmrna并在同一天經(jīng)手術(shù)移至同步的受體動(dòng)物(或代孕動(dòng)物)體內(nèi)。
實(shí)施例4:動(dòng)物的篩選及繁殖
篩選動(dòng)物
如下所述對(duì)在移植了遺傳編輯的胚胎之后活產(chǎn)動(dòng)物確定基因型。取組織樣品(例如毛囊、耳槽(earnotches)、剪尾(tailclips)、血液)并提取dna。使用合適引物擴(kuò)增nanos2基因并測(cè)序。將動(dòng)物經(jīng)鑒定為未編輯的、雜合編輯的或者純合編輯的。
純合nanos2編輯的雌性動(dòng)物的生育力
監(jiān)測(cè)純合的nanos2編輯的雌性動(dòng)物的初情期及排出能育的卵母細(xì)胞的能力。檢測(cè)在體外受精后卵母細(xì)胞產(chǎn)生胚泡的能力。示例的純合nanos2編輯的雌性動(dòng)物將經(jīng)歷半卵巢切除術(shù)(hemiovariectomy),及檢驗(yàn)卵巢的正常卵子發(fā)生功能。雌性動(dòng)物也進(jìn)行繁殖并監(jiān)測(cè)妊娠的確立。最后,純合的nanos2編輯的雌性動(dòng)物生育力通過(guò)存活的健康后代的產(chǎn)生而確定。我們預(yù)期純合nanos2編輯的雌性動(dòng)物具有正常的生育力。
雜合和純合nanos2編輯的雄性動(dòng)物的睪丸結(jié)構(gòu)和功能
在雜合及純合nanos2編輯的雄性動(dòng)物中監(jiān)測(cè)睪丸生長(zhǎng)和直徑。我們預(yù)期雜合雄性動(dòng)物具有正常的睪丸生長(zhǎng)和直徑,而期望純合雄性動(dòng)物示出降低的睪丸生長(zhǎng)及由于缺乏生殖細(xì)胞導(dǎo)致在初情期呈現(xiàn)小睪丸。示例的雜合和純合nanos2編輯的雄性動(dòng)物經(jīng)歷半去勢(shì)并對(duì)睪丸進(jìn)行細(xì)胞學(xué)檢測(cè)。我們預(yù)期雜合雄性動(dòng)物示出具有sertoli細(xì)胞和生殖細(xì)胞居于其中的生精小管的正常睪丸結(jié)構(gòu),而預(yù)期純合雄性動(dòng)物僅具有sertoli細(xì)胞形態(tài)學(xué)且完全不存在生殖細(xì)胞。在收集適當(dāng)精液后(例如假陰道法,手握法,電刺激射精),檢驗(yàn)精液體積和成分。我們預(yù)期雜合雄性動(dòng)物具有正常精液體積和精子數(shù)量,而期望純合雄性動(dòng)物示出完全不存在精細(xì)胞。
將ssc移植進(jìn)純合nanos2編輯的雄性動(dòng)物的睪丸中
從合適的供體如duroc豬中收獲ssc并增殖,將ssc注射進(jìn)不同年齡的純合nanos2編輯的受體雄性動(dòng)物如大白豬(largewhite)×蘭德瑞斯豬(landrace)雜交繁育的豬的睪丸網(wǎng)中。在初情期或者在移植ssc至少3個(gè)月后,收集精液并檢測(cè)精子細(xì)胞的存在情況。如果存在精子細(xì)胞,則確定精子細(xì)胞濃度、形態(tài)學(xué)和運(yùn)動(dòng)性。還要確定存在的精子細(xì)胞是來(lái)自供體ssc而不是來(lái)自受體動(dòng)物,例如示出對(duì)于豬實(shí)例在mc1r基因中存在duroc特異性snp。我們將確定對(duì)于最大精子細(xì)胞產(chǎn)量的接受動(dòng)物豬的最佳的接受年齡,這應(yīng)與接受動(dòng)物睪丸的ssc建群效力相關(guān)。
繁殖產(chǎn)生作為ssc接受動(dòng)物的純合nanos2編輯的雄性動(dòng)物
一定量的純合nanos2編輯的雄性動(dòng)物可以通過(guò)純合nanos2編輯的雌性動(dòng)物與雜合編輯的雄性動(dòng)物繁育而產(chǎn)生。這種交配將產(chǎn)生相等數(shù)量的純合及雜合編輯的雄性動(dòng)物和雌性動(dòng)物。純合編輯的雄性動(dòng)物用作ssc接受動(dòng)物,純合雌性動(dòng)物和雜合雄性動(dòng)物用作替代種畜以產(chǎn)生進(jìn)一步的純合nanos2編輯的雄性動(dòng)物作為ssc接受動(dòng)物及剔除雜合雌性動(dòng)物。
實(shí)施例5:通過(guò)胚胎注射產(chǎn)生nanos2編輯的動(dòng)物
基于由mit的dr.fengzhang(crispr.mit.edu)開發(fā)的免費(fèi)軟件設(shè)計(jì)靶向外顯子-1的豬nanos2的候選嵌合sgrna。在胚胎注射研究中使用的指導(dǎo)rna是:gatcagtcccaacaccacctgg(seqidno:160)。在nanos2orf(seqidno:1和2)內(nèi)的crispr指導(dǎo)rna序列(seqidno:160)和crispr靶序列(seqidno:161)在圖13中示出。
將在cas9:gfpmrna旁邊的候選crisprsgrna使用t7mmessagemachine試劑盒(ambion)在體外轉(zhuǎn)錄,通過(guò)megaclear試劑盒(ambion)凈化并注射進(jìn)體內(nèi)受精的豬1-細(xì)胞胚胎中。將一群8-9個(gè)月齡的12個(gè)動(dòng)物同步發(fā)情期并用于實(shí)驗(yàn)中。繁殖8個(gè)同步的動(dòng)物作為胚胎供體,而剩余4個(gè)動(dòng)物同步但不繁殖以作為代孕動(dòng)物。通過(guò)喂食14天5ml孕酮類似物regumate(或matrix)同步發(fā)情期。在最后一次喂食regumate之后24小時(shí),經(jīng)皮下注射給予動(dòng)物pmsg(1200iu,sigma),及通過(guò)皮下注射給予hcg(1000iu,chorulon,merck)72小時(shí)后誘導(dǎo)排卵。發(fā)情旺期的供體動(dòng)物(n=8)用公豬精液(由picgenetics提供)進(jìn)行人工授精。來(lái)自供體動(dòng)物的體內(nèi)胚胎在ai后24小時(shí)通過(guò)用無(wú)菌pvatl-hepes介質(zhì)逆行沖洗從輸卵管中經(jīng)手術(shù)取出。然后為此在體內(nèi)產(chǎn)生的胚胎注射cas9:gfpmrna和靶向nanos2的sgrna,在pzm3培養(yǎng)基58中培養(yǎng)過(guò)夜。在顯微注射后一天,將30個(gè)胚胎經(jīng)手術(shù)移至每個(gè)代孕動(dòng)物的輸卵管中。
對(duì)于胚胎轉(zhuǎn)移,將供體和代孕豬用氯胺酮/賽拉嗪的混合物(6.6mg/kg和1-2mg/kgim)麻醉,背面置于手術(shù)臺(tái)上。通過(guò)監(jiān)測(cè)心率、體溫、完全的節(jié)奏呼吸、收縮的瞳孔及降低或不存在眼瞼反射進(jìn)行評(píng)估足夠的麻醉深度。通過(guò)腹中線切口暴露麻醉的母豬的生殖道。僅暴露輸卵管和子宮頂部。在供體動(dòng)物中,將胚胎通過(guò)子宮-輸卵管接合處逆行沖洗,并從輸卵管口收集胚胎。對(duì)于將胚胎移至代孕動(dòng)物,將含有胚胎的tom-cat導(dǎo)管經(jīng)由漏斗放置并將胚胎置于輸卵管中。在使用可吸收縫合線(usp#3bodywall,#3fat,#1sub-q)對(duì)切口進(jìn)行三層縫合后,使動(dòng)物復(fù)醒。通過(guò)未恢復(fù)到發(fā)情期(21天)及在移植胚胎后第28天進(jìn)行超聲檢查證實(shí)懷孕。首次胚胎移植獲得4個(gè)代孕動(dòng)物中3個(gè)動(dòng)物確立懷孕,出生18個(gè)經(jīng)遺傳編輯的小豬(圖14)。所有這18個(gè)小豬均示出nanos2單一或雙等位基因修飾,顯示出我們的方法非常高效。
實(shí)施例6:通過(guò)體細(xì)胞核轉(zhuǎn)移(scnt)產(chǎn)生nanos2編輯的動(dòng)物
從自妊娠d35的duroc豬胎兒建立豬胎兒成纖維細(xì)胞(pff)。將候選的雄性和雌性pff細(xì)胞系用cmv啟動(dòng)子驅(qū)動(dòng)的cas9:gfp質(zhì)粒(addgene)及由hu6啟動(dòng)子驅(qū)動(dòng)的靶向nanos2的單一指導(dǎo)rna組成的pcr片段(seqidno:162)進(jìn)行核轉(zhuǎn)染。在核轉(zhuǎn)染后一天,將核轉(zhuǎn)染的細(xì)胞在96孔平板的每個(gè)孔中逐一分選。為細(xì)胞供應(yīng)放射的成纖維細(xì)胞條件化生長(zhǎng)培養(yǎng)基,使得形成集落。在培養(yǎng)1周后,在細(xì)胞內(nèi)開始出現(xiàn)集落。將細(xì)胞克隆增殖、提取dna并使用dna測(cè)序法篩選突變。將對(duì)于nanos2是純合無(wú)效的細(xì)胞通過(guò)體細(xì)胞核轉(zhuǎn)移克隆,產(chǎn)生nanos2無(wú)效雄性和雌性小豬。從這些最初的scnt嘗試中,產(chǎn)生一個(gè)存活的雄性動(dòng)物及三個(gè)雌性小豬,見圖15。
實(shí)施例7:nanos-2編輯的動(dòng)物的睪丸表型
在3個(gè)月齡,將兩個(gè)雙等位基因nanos2純合敲除小豬的睪丸進(jìn)行活檢及形態(tài)學(xué)檢測(cè)。基于使用光學(xué)顯微鏡觀測(cè)活檢組織的橫截面(圖16),曲細(xì)精管索是完整的,且存在體細(xì)胞支持細(xì)胞。盡管一些生殖細(xì)胞仍存在于純合敲除動(dòng)物中,但是數(shù)目與在這個(gè)年齡的野生型動(dòng)物中典型觀測(cè)到的數(shù)目相比顯著減少。實(shí)際上,純合動(dòng)物的一些精索中看起來(lái)缺乏生殖細(xì)胞。純合動(dòng)物中剩余的生殖細(xì)胞的細(xì)胞核看起來(lái)是固縮的(picnotic),指示凋亡。在3個(gè)月齡,野生型豬的曲細(xì)精管索典型含有多層發(fā)育中的生殖細(xì)胞,這表示活性的精子發(fā)生。在nanos2敲除動(dòng)物中無(wú)一精索含有多層生殖細(xì)胞,強(qiáng)力提示缺乏內(nèi)源性種系。總之,這些觀測(cè)結(jié)果提示nanos2喪失功能的表型在動(dòng)物中是保守的,包括在早期發(fā)育階段喪失雄性種系,導(dǎo)致僅存在sertoli細(xì)胞的表型。對(duì)小鼠的研究已經(jīng)表明具有這種表型的雄性動(dòng)物是在移植精原細(xì)胞后再生供體種系的極佳宿主。
實(shí)施例8:用nanos2純合敲除受體移植
在4個(gè)月齡時(shí),兩個(gè)純合敲除小豬接受分離自21天齡duroc供體雄性小豬睪丸的精原細(xì)胞移植。簡(jiǎn)而言之,將供體細(xì)胞懸浮于1ml體積的注射介質(zhì)中,密度為1.4×106細(xì)胞/ml,并將600-900μl體積通過(guò)超聲指導(dǎo)的注射進(jìn)睪丸網(wǎng)輸注進(jìn)輸精管中。為每個(gè)動(dòng)物的一個(gè)睪丸移植所述供體細(xì)胞,對(duì)側(cè)睪丸作為不注射對(duì)照。
實(shí)施例9:nanos基因
nanos1野豬(susscrofa)
seqidno:6
meafpwaprsprrgrvpppmalvpsaryvsaqgpahpqpfsswndylglatlitkavdgeprfgcargedggggggsppssssssccsphagagpgalgpalgppdydedddddsdepgsrgrylggtlelralelcadpseaglleerfaelspfagratavllgwapataataeaapreerapawaaeprlhaafgaagarllkpelqvcvfcrnnkeavalytthilkgpdgrvlcpvlrrytcplcgasgdnahtikycplskvppprsvrdglpgkklr
seqidno:5origin
1cgcagggggcagggccgcggcagcgaggccggggggcggggaggagcggggcccgataaa
61aggcagcgaggcggccccaccccgctgcaggccggcgggcaggctcggcgcgtcctttcc
121gtccggcccgcgccggcggcggggaggcggcgcgcgcggcccgcagcccgcccatggagg
181ctttcccctgggcgccccgctcgccccgccgcggccgcgtccccccgcccatggcgctcg
241tgcccagcgcccgctacgtgagcgcccagggcccggcgcacccgcaacccttcagctcgt
301ggaacgactacctgggactcgccacgctcatcaccaaggcggtggacggcgagccgcgct
361ttggctgcgcccgcggcgaggacggcggcggcggcggcggctccccaccctcctcttcct
421cctcgtcgtgctgctccccccacgcgggggccgggcctggggcgctggggcccgcgctgg
481ggccacccgactacgacgaggacgacgacgacgacagcgacgagccggggtcccggggcc
541gctacctggggggcacgctggagctgcgcgcgctggagctgtgcgcggacccctcggagg
601ccgggctgctggaggagcgcttcgccgagctgagcccgttcgcgggtcgcgccaccgctg
661tgctgctgggctgggcacccgccactgccgccaccgccgaggcggcaccgcgcgaggagc
721gggccccggcgtgggcggccgagccccggctgcacgcagcctttggggcggccggcgccc
781ggctgctcaagcccgagctgcaggtgtgtgtgttttgccggaacaacaaggaggcggtgg
841cgctctacaccacccacatcttgaagggacccgacgggcgagtgctgtgccccgtgctgc
901gccgctacacgtgtcccctgtgcggcgccagcggcgacaacgcgcacaccatcaagtact
961gcccgctctccaaagtgccgccgccgcgcagcgtcagggacggcctgcccggcaagaagc
1021tgcgctgagggcccggactccggtctgctactgccacctgacgccaccagggtcgccgcc
1081tgcccaatgtctagtttggcctgcgcaccatctctctctctcgctgctgaggagcgtgga
1141gctcagctgttggttgaacttgagatgtactgattttttttttttttttttcaaaagaac
1201ccggcggtactgagtcctttcctgtcgaagagcgcttaagactagaagctaaaatcttga
1261tttgtttatctctagtttgtgcacatccagacggtgaaggctgggtgttcgttccactaa
1321ctgaaatgtggcaacttagaagtgtttatttactctatacgtcaacctattttagatgcg
1381catcagtatatgaaattgtctcaatctaatcttggatgtttaattttatgaatggaggca
1441ctttactaggcctagaatatttttttaaaagcctctaaactgaacttaactggcgatttt
1501atggaatgtcagcaaaatgacttttattgtttgaaacaagtaataatatttctgttgtcc
1561ttaatcagttattctaattccaggtgaagcaaccctcacctgcctggtagcatcattaag
1621tgaaggcttagtaaactttccagtgttagtttgggtgggtgttccccccgtggcttgttt
1681ctgtcctagctggaggtgtaaagatgtacaatctgtggcaggtagaatacagctccttat
1741ccttttatgtaccacatcttttattactgaacgagcaactagcgtttcccatctttcaaa
1801gtcgtgccaggttatataatattgtgtatacacttggaaatggtgctgtttaaaagaatt
1861tgtgtatttatacagtaacagtatatgaattcattaatcttgtctt
nanos2野豬
seqidno:2
mqlppfdmwkdyfnlsqvvlgliqnrrqgpeapgtgeprpeppleqdqgpgergasgglatlcnfckhngesrhvysshqlktpegvvvcpilrhyvcplcgatgdqahtlkycplnggqqslyrrsgrnsagrkvkr
seqidno:1(crispr靶位點(diǎn)以下劃線示出)
1atgcagctgccaccctttgacatgtggaaggactacttcaacctgagccaggtggtgttg
61ggactgatccagaatcgtcgacaagggccagaggccccgggcaccggggagccaagacct
121gagcccccactggagcaggaccagggcccgggagagcggggggccagcggggggctggcc
181accctgtgcaacttttgcaaacacaatggggaatctcgccacgtgtactcctcgcaccag
241ctgaagacaccggagggcgtggtggtgtgtcccatcctacgacactatgtgtgtcccctg
301tgcggggccaccggtgaccaggctcacacactcaagtactgcccgctcaacggcggccag
361cagtctctctatcgccgcagtgggcgcaattcagccggccgcaaggtcaagcgctga
nanos3野豬
seqidno:4
mhsfgrcifggaaasppvtirnlpqpappsshplggirreltaqtpglqrekgrgrgkgiegrslgwlgffslsalspgtlcpamgtfnlwtdylglarlvgalrgeeepetrldpqpapvpgpegqrpspesspaperlcsfckhngesraiyqshvlkdeagrvlcpilrdyvcpqcgatrerahtrrfcpltsqgytsvysyttrnsagkklarpdkartqdsghrrggggggastgskgagkssgtspspccpstsa
seqidno:3
1cagcccacccagggaccatgcattcctttggcaggtgcatttttggaggagcagcagcaa
61gcccccctgtgacaataaggaacctcccacagcctgctcctccctcttcacacccccttg
121gaggtataaggagggaactgacagcccagactcctgggctccagagagagaaagggaggg
181gcagggggaaggggatagaaggacgatctttggggtggctgggtttcttctctctctctg
241ccctttcacctggtacactttgcccagccatggggaccttcaacctgtggacagattacc
301tgggtttggcacgcctggtgggggctctgcgtggggaagaggaacctgagacgaggctgg
361acccccagccagcaccagtgccaggaccagagggtcagaggcccagcccggaatcctcac
421cagctcctgaacgcctgtgctctttctgcaaacataatggcgaatcccgggccatctacc
481agtcccacgtgctcaaggatgaagcgggccgagttctgtgccccattcttcgagactacg
541tgtgcccccagtgcggtgccacacgcgagcgtgcccatacccgccgcttctgccctctca
601ccagccagggctacacctctgtctacagctacaccacccgcaactcggccggcaagaagc
661tggcccgcccggacaaggcgaggacacaggactctggacatcggcgaggaggaggaggag
721gaggtgccagcacaggttccaaaggtgccgggaagtcttctggaacttctccgtctccct
781gctgtccctccacttctgcctaagaggctggcgcgagcaggacggagatgctgccttcac
841ctggggatggggacccaggctcagtggaggctgggtttcagggacgacctacccttcgcg
901gatccgcccctgcccccagcctgggagccctgcaagggagccaggcctggaagctcggcc
961aaaagagagccgctcctttctccccatctcccaccccaagaaaggaggtggtcctctggc
1021aaccctgccctccttccccagcgctgggcacccagttagcactcaataaatac
牛nanos2nm_001281904
seqidno:10
mqlppfdmwkdyfnlsqvvlaliqsrgqgletqgtgeprpgphveqdqgqggrgaggglatlcnfckhngesrhvysshqlktpegvvvcpilrhyvcplcgatgdqahtlkycplnggqqslyrrsgrnsagrkvkr
seqidno:9
1tcagctgctcctgtctgcgggcccccagcccacttctctccagccacccaccaccaacac
61tcccccgggtgccatgcagctgccaccctttgacatgtggaaggactacttcaacctgag
121ccaagtggtgctggcactgatccagagtcgggggcaagggttggagacccaagggactgg
181ggagccgagacccgggccccatgtggagcaggatcaggggcagggcggacgcggggctgg
241cgggggcctggccaccctgtgcaacttttgcaaacacaatggagagtctcgccacgtgta
301ctcctcacaccagctgaagaccccggagggcgtggtggtgtgtcccattctgcggcatta
361tgtatgtcccctgtgcggggccaccggggaccaggcccacacactcaagtactgcccact
421caacggaggacagcagtctctctaccgccgcagtgggcgcaactcagccggccgcaaggt
481caagcgctgaagaccgtcaggtacccacccgctgcagccccaaccctccctggttcagcc
541ctcccaag
nanos1牛
xm_005225796
seqidno:12
aaaaataeaapreerapawaaepklhaasgaaaarllkpelqvcvfcrnnkeavalytthilkgpdgrvlcpvlrrytcplcgasgdnahtikycplskvppppaarppprsardglpgkklr
seqidno:11
1gccgccgccgcggccaccgccgaagcagcaccgcgagaggagcgggccccggcgtgggcg
61gccgagcccaagctgcacgccgcctccggggcggccgccgcccggctgctcaagcccgag
121ctgcaggtgtgcgtgttttgccggaacaacaaggaggcggtggcgctctacaccacccac
181atcctgaagggacccgacgggcgggtgctgtgccccgtgctgcgccggtacacgtgtccc
241ctgtgcggtgccagcggcgacaacgcgcacaccatcaagtactgcccgctttccaaagtg
301ccgccgccgcctgcagcccgcccgccgccgcgcagcgcccgggacggcctgcccggcaag
361aagctgcgctaagggcccggaccccggtctgctgctgccacctgatgccactggggtagc
421cgcccgcccactctcgtgtttggtctgcgcaccatctcttcctcgctgccggggagtgtg
481gagctcgtcttggtttttccagaggaagccgacggtaccgagtattttcctaacgaagag
541cagttgagactagacgttaaaattttgattaatgtttctagtttgtgcacatccagatgg
601tgaaggctgggtattccactaactgaaatgtggcaacttagaggcgctgtggtttattta
661tacgtcgacctattttagatgcgcatcagtatgaaattgtctcagtctaatcttggatgt
721ttaattttatgaatggaggcactttactaggtctagaatatttttttaaaagcctctcaa
781ctgaacttaaaactggcgattttatggagtgtcagcaaaatgactattttattgtctgaa
841acaatatttctgttgtccttacccagttgtaattccaggtgaagccctgcgtggtagcat
901cattaagtgaagacttggtatgctttacagtgttagtttgggtgggtgttccctccttgt
961ggcttgtttttgtcctagctggagatgtataaaatgtacaatttgtaggtagcaggtaga
1021atacagctcatgtaccagatctttttattactgaacgagcaactactaccgtttttcccc
1081tttaaaaatagtgccaagttataatcatattgtgtatacacttgaaaatggtgctgttta
1141aaaaaattgtgtatttatacagtaacagtatatgaattcattaaccttgcctttaactct
1201acttggctttttctttatgccccttcctattccagttcttcaaaaatatgtgatacttaa
1261gatcaaacgggtgcaataactcattcactctgaattgctccatttcagggtctctaaata
1321gtggaaatctcattccagctgttgcctctcagactaaatgtaagatggaatcctttgagc
1381tctggaaggttaatgaaacaactggtgttcaggaaggttccactctggactgtgtcagct
1441ttaaaccatcacagaagtcctcaaaccagtataagtaccaattaaaggaactgactgggt
1501gtagggggggtaacacaaggaacacagcctccatctattgtgttcccattctcattagaa
1561gacaacccttctggaatcccaccagttattttcatcggtgagattaaatctaatcttggg
1621caaa
牛nanos1(alt)
xm_001787922
seqidno:14
ryvstqgpahpqpfsswndylglatlitkavdgeprfgcarggdgggdgsppssssssccsphvgagpgalgpalgppdydeddddddsddpgsrsrylggalelralelcadpaeaglleerfaelspfagraaavllgcapaaaaaataeaapreerapawaaepklhaasgaaaarllkpelqvcvfcrnnkeavalytthilkgpdgrvlcpvlrrytcplcgasgdnahtikycplskvppppaarppprsardglpgkklr
seqidno:13
1cgctacgtgagcacccagggcccggcgcacccgcagcccttcagctcgtggaacgactat
61ctgggactcgccacgctcatcaccaaggcggtggacggcgagccgcgcttcggctgcgcc
121cgcggcggggacggcggcggggacggctccccgccttcttcttcctcctcgtcgtgctgc
181tccccccacgtgggggccgggcctggggcgctggggcccgcgctggggccgcccgactac
241gacgaggacgacgacgacgacgacagcgacgatccggggtcccggagccgctacctgggg
301ggcgcgctggagctgcgcgcgctggagctgtgcgcggaccctgccgaggccgggctgctg
361gaggagcgtttcgctgagctgagcccgttcgctggtcgcgccgctgccgtgcttctgggc
421tgcgcacccgccgccgccgccgcggccaccgccgaagcagcaccgcgagaggagcgggcc
481ccggcgtgggcggccgagcccaagctgcacgccgcctccggggcggccgccgcccggctg
541ctcaagcccgagctgcaggtgtgcgtgttttgccggaacaacaaggaggcggtggcgctc
601tacaccacccacatcctgaagggacccgacgggcgggtgctgtgccccgtgctgcgccgg
661tacacgtgtcccctgtgcggtgccagcggcgacaacgcgcacaccatcaagtactgcccg
721ctttccaaagtgccgccgccgcctgcagcccgcccgccgccgcgcagcgcccgggacggc
781ctgcccggcaagaagctgcgctaagggcccggaccccggtctgctgctgccacctgatgc
841cactggggtagccgcccgcccactctcgtgtttggtctgcgcaccatctcttcctcgctg
901ccggggagtgtggagctcgtcttggtttttccagaggaagccgacggtaccgagtatttt
961cctaacgaagagcagttgagactagacgttaaaattttgattaatgtttctagtttgtgc
1021acatccagatggtgaaggctgggtattccactaactgaaatgtggcaacttagaggcgct
1081gtggtttatttatacgtcgacctattttagatgcgcatcagtatgaaattgtctcagtct
1141aatcttggatgtttaattttatgaatggaggcactttactaggtctagaatattttttta
1201aaagcctctcaactgaacttaaaactggcgattttatggagtgtcagcaaaatgactatt
1261ttattgtctgaaacaatatttctgttgtccttacccagttgtaattccaggtgaagccct
1321gcgtggtagcatcattaagtgaagacttggtatgctttacagtgttagtttgggtgggtg
1381ttccctccttgtggcttgtttttgtcctagctggagatgtataaaatgtacaatttgtag
1441gtagcaggtagaatacagctcatgtaccagatctttttattactgaacgagcaactacta
1501ccgtttttcccctttaaaaatagtgccaagttataatcatattgtgtatacacttgaaaa
1561tggtgctgtttaaaaaaattgtgtatttatacagtaacagtatatgaattcattaacctt
1621gcctttaactctacttggctttttctttatgccccttcctattccagttcttcaaaaata
1681tgtgatacttaagatcaaacgggtgcaataactcattcactctgaattgctccatttcag
1741ggtctctaaatagtggaaatctcattccagctgttgcctctcagactaaatgtaagatgg
1801aatcctttgagctctggaaggttaatgaaacaactggtgttcaggaaggttccactctgg
1861actgtgtcagctttaaaccatcacagaagtcctcaaaccagtataagtaccaattaaagg
1921aactgactgggtgtagggggggtaacacaaggaacacagcctccatctattgtgttccca
1981ttctcattagaagacaacccttctggaatcccaccagttattttcatcggtgagattaaa
2041tctaatcttgggcaaa
本文引用的所有參考文獻(xiàn)均以其全部?jī)?nèi)容并入作參考。本文揭示的實(shí)施例為舉例提供,不試圖限制本發(fā)明的范圍。
序列表
序列表
<110>華盛頓州立大學(xué)
馬里蘭大學(xué)
愛丁堡大學(xué)董事會(huì)
<120>消除種系細(xì)胞的nanos敲除
<130>p11030wo01
<150>62/023,996
<151>2014-07-14
<160>204
<170>patentinversion3.5
<210>1
<211>417
<212>dna
<213>susscrofa
<400>1
atgcagctgccaccctttgacatgtggaaggactacttcaacctgagccaggtggtgttg60
ggactgatccagaatcgtcgacaagggccagaggccccgggcaccggggagccaagacct120
gagcccccactggagcaggaccagggcccgggagagcggggggccagcggggggctggcc180
accctgtgcaacttttgcaaacacaatggggaatctcgccacgtgtactcctcgcaccag240
ctgaagacaccggagggcgtggtggtgtgtcccatcctacgacactatgtgtgtcccctg300
tgcggggccaccggtgaccaggctcacacactcaagtactgcccgctcaacggcggccag360
cagtctctctatcgccgcagtgggcgcaattcagccggccgcaaggtcaagcgctga417
<210>2
<211>138
<212>prt
<213>susscrofa
<400>2
metglnleupropropheaspmettrplysasptyrpheasnleuser
151015
glnvalvalleuglyleuileglnasnargargglnglyprogluala
202530
proglythrglygluproargprogluproproleugluglnaspgln
354045
glyproglygluargglyalaserglyglyleualathrleucysasn
505560
phecyslyshisasnglygluserarghisvaltyrserserhisgln
65707580
leulysthrprogluglyvalvalvalcysproileleuarghistyr
859095
valcysproleucysglyalathrglyaspglnalahisthrleulys
100105110
tyrcysproleuasnglyglyglnglnserleutyrargargsergly
115120125
argasnseralaglyarglysvallysarg
130135
<210>3
<211>1073
<212>dna
<213>susscrofa
<400>3
cagcccacccagggaccatgcattcctttggcaggtgcatttttggaggagcagcagcaa60
gcccccctgtgacaataaggaacctcccacagcctgctcctccctcttcacacccccttg120
gaggtataaggagggaactgacagcccagactcctgggctccagagagagaaagggaggg180
gcagggggaaggggatagaaggacgatctttggggtggctgggtttcttctctctctctg240
ccctttcacctggtacactttgcccagccatggggaccttcaacctgtggacagattacc300
tgggtttggcacgcctggtgggggctctgcgtggggaagaggaacctgagacgaggctgg360
acccccagccagcaccagtgccaggaccagagggtcagaggcccagcccggaatcctcac420
cagctcctgaacgcctgtgctctttctgcaaacataatggcgaatcccgggccatctacc480
agtcccacgtgctcaaggatgaagcgggccgagttctgtgccccattcttcgagactacg540
tgtgcccccagtgcggtgccacacgcgagcgtgcccatacccgccgcttctgccctctca600
ccagccagggctacacctctgtctacagctacaccacccgcaactcggccggcaagaagc660
tggcccgcccggacaaggcgaggacacaggactctggacatcggcgaggaggaggaggag720
gaggtgccagcacaggttccaaaggtgccgggaagtcttctggaacttctccgtctccct780
gctgtccctccacttctgcctaagaggctggcgcgagcaggacggagatgctgccttcac840
ctggggatggggacccaggctcagtggaggctgggtttcagggacgacctacccttcgcg900
gatccgcccctgcccccagcctgggagccctgcaagggagccaggcctggaagctcggcc960
aaaagagagccgctcctttctccccatctcccaccccaagaaaggaggtggtcctctggc1020
aaccctgccctccttccccagcgctgggcacccagttagcactcaataaatac1073
<210>4
<211>261
<212>prt
<213>susscrofa
<400>4
methisserpheglyargcysilepheglyglyalaalaalaserpro
151015
provalthrileargasnleuproglnproalaproproserserhis
202530
proleuglyglyileargarggluleuthralaglnthrproglyleu
354045
glnargglulysglyargglyargglylysglyilegluglyargser
505560
leuglytrpleuglyphepheserleuseralaleuserproglythr
65707580
leucysproalametglythrpheasnleutrpthrasptyrleugly
859095
leualaargleuvalglyalaleuargglygluglugluprogluthr
100105110
argleuaspproglnproalaprovalproglyprogluglyglnarg
115120125
proserprogluserserproalaprogluargleucysserphecys
130135140
lyshisasnglygluserargalailetyrglnserhisvalleulys
145150155160
aspglualaglyargvalleucysproileleuargasptyrvalcys
165170175
proglncysglyalathrarggluargalahisthrargargphecys
180185190
proleuthrserglnglytyrthrservaltyrsertyrthrthrarg
195200205
asnseralaglylyslysleualaargproasplysalaargthrgln
210215220
aspserglyhisargargglyglyglyglyglyglyalaserthrgly
225230235240
serlysglyalaglylysserserglythrserproserprocyscys
245250255
proserthrserala
260
<210>5
<211>1906
<212>dna
<213>susscrofa
<400>5
cgcagggggcagggccgcggcagcgaggccggggggcggggaggagcggggcccgataaa60
aggcagcgaggcggccccaccccgctgcaggccggcgggcaggctcggcgcgtcctttcc120
gtccggcccgcgccggcggcggggaggcggcgcgcgcggcccgcagcccgcccatggagg180
ctttcccctgggcgccccgctcgccccgccgcggccgcgtccccccgcccatggcgctcg240
tgcccagcgcccgctacgtgagcgcccagggcccggcgcacccgcaacccttcagctcgt300
ggaacgactacctgggactcgccacgctcatcaccaaggcggtggacggcgagccgcgct360
ttggctgcgcccgcggcgaggacggcggcggcggcggcggctccccaccctcctcttcct420
cctcgtcgtgctgctccccccacgcgggggccgggcctggggcgctggggcccgcgctgg480
ggccacccgactacgacgaggacgacgacgacgacagcgacgagccggggtcccggggcc540
gctacctggggggcacgctggagctgcgcgcgctggagctgtgcgcggacccctcggagg600
ccgggctgctggaggagcgcttcgccgagctgagcccgttcgcgggtcgcgccaccgctg660
tgctgctgggctgggcacccgccactgccgccaccgccgaggcggcaccgcgcgaggagc720
gggccccggcgtgggcggccgagccccggctgcacgcagcctttggggcggccggcgccc780
ggctgctcaagcccgagctgcaggtgtgtgtgttttgccggaacaacaaggaggcggtgg840
cgctctacaccacccacatcttgaagggacccgacgggcgagtgctgtgccccgtgctgc900
gccgctacacgtgtcccctgtgcggcgccagcggcgacaacgcgcacaccatcaagtact960
gcccgctctccaaagtgccgccgccgcgcagcgtcagggacggcctgcccggcaagaagc1020
tgcgctgagggcccggactccggtctgctactgccacctgacgccaccagggtcgccgcc1080
tgcccaatgtctagtttggcctgcgcaccatctctctctctcgctgctgaggagcgtgga1140
gctcagctgttggttgaacttgagatgtactgattttttttttttttttttcaaaagaac1200
ccggcggtactgagtcctttcctgtcgaagagcgcttaagactagaagctaaaatcttga1260
tttgtttatctctagtttgtgcacatccagacggtgaaggctgggtgttcgttccactaa1320
ctgaaatgtggcaacttagaagtgtttatttactctatacgtcaacctattttagatgcg1380
catcagtatatgaaattgtctcaatctaatcttggatgtttaattttatgaatggaggca1440
ctttactaggcctagaatatttttttaaaagcctctaaactgaacttaactggcgatttt1500
atggaatgtcagcaaaatgacttttattgtttgaaacaagtaataatatttctgttgtcc1560
ttaatcagttattctaattccaggtgaagcaaccctcacctgcctggtagcatcattaag1620
tgaaggcttagtaaactttccagtgttagtttgggtgggtgttccccccgtggcttgttt1680
ctgtcctagctggaggtgtaaagatgtacaatctgtggcaggtagaatacagctccttat1740
ccttttatgtaccacatcttttattactgaacgagcaactagcgtttcccatctttcaaa1800
gtcgtgccaggttatataatattgtgtatacacttggaaatggtgctgtttaaaagaatt1860
tgtgtatttatacagtaacagtatatgaattcattaatcttgtctt1906
<210>6
<211>284
<212>prt
<213>susscrofa
<400>6
metglualapheprotrpalaproargserproargargglyargval
151015
proproprometalaleuvalproseralaargtyrvalseralagln
202530
glyproalahisproglnprophesersertrpasnasptyrleugly
354045
leualathrleuilethrlysalavalaspglygluproargphegly
505560
cysalaargglygluaspglyglyglyglyglyglyserproproser
65707580
sersersersersercyscysserprohisalaglyalaglyprogly
859095
alaleuglyproalaleuglyproproasptyraspgluaspaspasp
100105110
aspaspseraspgluproglyserargglyargtyrleuglyglythr
115120125
leugluleuargalaleugluleucysalaaspproserglualagly
130135140
leuleuglugluargphealagluleuserprophealaglyargala
145150155160
thralavalleuleuglytrpalaproalathralaalathralaglu
165170175
alaalaproargglugluargalaproalatrpalaalagluproarg
180185190
leuhisalaalapheglyalaalaglyalaargleuleulysproglu
195200205
leuglnvalcysvalphecysargasnasnlysglualavalalaleu
210215220
tyrthrthrhisileleulysglyproaspglyargvalleucyspro
225230235240
valleuargargtyrthrcysproleucysglyalaserglyaspasn
245250255
alahisthrilelystyrcysproleuserlysvalproproproarg
260265270
servalargaspglyleuproglylyslysleuarg
275280
<210>7
<211>23
<212>dna
<213>susscrofa
<400>7
gaagacaccggagggcgtggtgg23
<210>8
<211>23
<212>dna
<213>susscrofa
<400>8
gaatcgtcgacaagggccagagg23
<210>9
<211>548
<212>dna
<213>bovine
<400>9
tcagctgctcctgtctgcgggcccccagcccacttctctccagccacccaccaccaacac60
tcccccgggtgccatgcagctgccaccctttgacatgtggaaggactacttcaacctgag120
ccaagtggtgctggcactgatccagagtcgggggcaagggttggagacccaagggactgg180
ggagccgagacccgggccccatgtggagcaggatcaggggcagggcggacgcggggctgg240
cgggggcctggccaccctgtgcaacttttgcaaacacaatggagagtctcgccacgtgta300
ctcctcacaccagctgaagaccccggagggcgtggtggtgtgtcccattctgcggcatta360
tgtatgtcccctgtgcggggccaccggggaccaggcccacacactcaagtactgcccact420
caacggaggacagcagtctctctaccgccgcagtgggcgcaactcagccggccgcaaggt480
caagcgctgaagaccgtcaggtacccacccgctgcagccccaaccctccctggttcagcc540
ctcccaag548
<210>10
<211>138
<212>prt
<213>bovine
<400>10
metglnleupropropheaspmettrplysasptyrpheasnleuser
151015
glnvalvalleualaleuileglnserargglyglnglyleugluthr
202530
glnglythrglygluproargproglyprohisvalgluglnaspgln
354045
glyglnglyglyargglyalaglyglyglyleualathrleucysasn
505560
phecyslyshisasnglygluserarghisvaltyrserserhisgln
65707580
leulysthrprogluglyvalvalvalcysproileleuarghistyr
859095
valcysproleucysglyalathrglyaspglnalahisthrleulys
100105110
tyrcysproleuasnglyglyglnglnserleutyrargargsergly
115120125
argasnseralaglyarglysvallysarg
130135
<210>11
<211>1624
<212>dna
<213>bovine
<400>11
gccgccgccgcggccaccgccgaagcagcaccgcgagaggagcgggccccggcgtgggcg60
gccgagcccaagctgcacgccgcctccggggcggccgccgcccggctgctcaagcccgag120
ctgcaggtgtgcgtgttttgccggaacaacaaggaggcggtggcgctctacaccacccac180
atcctgaagggacccgacgggcgggtgctgtgccccgtgctgcgccggtacacgtgtccc240
ctgtgcggtgccagcggcgacaacgcgcacaccatcaagtactgcccgctttccaaagtg300
ccgccgccgcctgcagcccgcccgccgccgcgcagcgcccgggacggcctgcccggcaag360
aagctgcgctaagggcccggaccccggtctgctgctgccacctgatgccactggggtagc420
cgcccgcccactctcgtgtttggtctgcgcaccatctcttcctcgctgccggggagtgtg480
gagctcgtcttggtttttccagaggaagccgacggtaccgagtattttcctaacgaagag540
cagttgagactagacgttaaaattttgattaatgtttctagtttgtgcacatccagatgg600
tgaaggctgggtattccactaactgaaatgtggcaacttagaggcgctgtggtttattta660
tacgtcgacctattttagatgcgcatcagtatgaaattgtctcagtctaatcttggatgt720
ttaattttatgaatggaggcactttactaggtctagaatatttttttaaaagcctctcaa780
ctgaacttaaaactggcgattttatggagtgtcagcaaaatgactattttattgtctgaa840
acaatatttctgttgtccttacccagttgtaattccaggtgaagccctgcgtggtagcat900
cattaagtgaagacttggtatgctttacagtgttagtttgggtgggtgttccctccttgt960
ggcttgtttttgtcctagctggagatgtataaaatgtacaatttgtaggtagcaggtaga1020
atacagctcatgtaccagatctttttattactgaacgagcaactactaccgtttttcccc1080
tttaaaaatagtgccaagttataatcatattgtgtatacacttgaaaatggtgctgttta1140
aaaaaattgtgtatttatacagtaacagtatatgaattcattaaccttgcctttaactct1200
acttggctttttctttatgccccttcctattccagttcttcaaaaatatgtgatacttaa1260
gatcaaacgggtgcaataactcattcactctgaattgctccatttcagggtctctaaata1320
gtggaaatctcattccagctgttgcctctcagactaaatgtaagatggaatcctttgagc1380
tctggaaggttaatgaaacaactggtgttcaggaaggttccactctggactgtgtcagct1440
ttaaaccatcacagaagtcctcaaaccagtataagtaccaattaaaggaactgactgggt1500
gtagggggggtaacacaaggaacacagcctccatctattgtgttcccattctcattagaa1560
gacaacccttctggaatcccaccagttattttcatcggtgagattaaatctaatcttggg1620
caaa1624
<210>12
<211>123
<212>prt
<213>bovine
<400>12
alaalaalaalaalathralaglualaalaproargglugluargala
151015
proalatrpalaalagluprolysleuhisalaalaserglyalaala
202530
alaalaargleuleulysprogluleuglnvalcysvalphecysarg
354045
asnasnlysglualavalalaleutyrthrthrhisileleulysgly
505560
proaspglyargvalleucysprovalleuargargtyrthrcyspro
65707580
leucysglyalaserglyaspasnalahisthrilelystyrcyspro
859095
leuserlysvalproproproproalaalaargproproproargser
100105110
alaargaspglyleuproglylyslysleuarg
115120
<210>13
<211>2056
<212>dna
<213>bovine
<400>13
cgctacgtgagcacccagggcccggcgcacccgcagcccttcagctcgtggaacgactat60
ctgggactcgccacgctcatcaccaaggcggtggacggcgagccgcgcttcggctgcgcc120
cgcggcggggacggcggcggggacggctccccgccttcttcttcctcctcgtcgtgctgc180
tccccccacgtgggggccgggcctggggcgctggggcccgcgctggggccgcccgactac240
gacgaggacgacgacgacgacgacagcgacgatccggggtcccggagccgctacctgggg300
ggcgcgctggagctgcgcgcgctggagctgtgcgcggaccctgccgaggccgggctgctg360
gaggagcgtttcgctgagctgagcccgttcgctggtcgcgccgctgccgtgcttctgggc420
tgcgcacccgccgccgccgccgcggccaccgccgaagcagcaccgcgagaggagcgggcc480
ccggcgtgggcggccgagcccaagctgcacgccgcctccggggcggccgccgcccggctg540
ctcaagcccgagctgcaggtgtgcgtgttttgccggaacaacaaggaggcggtggcgctc600
tacaccacccacatcctgaagggacccgacgggcgggtgctgtgccccgtgctgcgccgg660
tacacgtgtcccctgtgcggtgccagcggcgacaacgcgcacaccatcaagtactgcccg720
ctttccaaagtgccgccgccgcctgcagcccgcccgccgccgcgcagcgcccgggacggc780
ctgcccggcaagaagctgcgctaagggcccggaccccggtctgctgctgccacctgatgc840
cactggggtagccgcccgcccactctcgtgtttggtctgcgcaccatctcttcctcgctg900
ccggggagtgtggagctcgtcttggtttttccagaggaagccgacggtaccgagtatttt960
cctaacgaagagcagttgagactagacgttaaaattttgattaatgtttctagtttgtgc1020
acatccagatggtgaaggctgggtattccactaactgaaatgtggcaacttagaggcgct1080
gtggtttatttatacgtcgacctattttagatgcgcatcagtatgaaattgtctcagtct1140
aatcttggatgtttaattttatgaatggaggcactttactaggtctagaatattttttta1200
aaagcctctcaactgaacttaaaactggcgattttatggagtgtcagcaaaatgactatt1260
ttattgtctgaaacaatatttctgttgtccttacccagttgtaattccaggtgaagccct1320
gcgtggtagcatcattaagtgaagacttggtatgctttacagtgttagtttgggtgggtg1380
ttccctccttgtggcttgtttttgtcctagctggagatgtataaaatgtacaatttgtag1440
gtagcaggtagaatacagctcatgtaccagatctttttattactgaacgagcaactacta1500
ccgtttttcccctttaaaaatagtgccaagttataatcatattgtgtatacacttgaaaa1560
tggtgctgtttaaaaaaattgtgtatttatacagtaacagtatatgaattcattaacctt1620
gcctttaactctacttggctttttctttatgccccttcctattccagttcttcaaaaata1680
tgtgatacttaagatcaaacgggtgcaataactcattcactctgaattgctccatttcag1740
ggtctctaaatagtggaaatctcattccagctgttgcctctcagactaaatgtaagatgg1800
aatcctttgagctctggaaggttaatgaaacaactggtgttcaggaaggttccactctgg1860
actgtgtcagctttaaaccatcacagaagtcctcaaaccagtataagtaccaattaaagg1920
aactgactgggtgtagggggggtaacacaaggaacacagcctccatctattgtgttccca1980
ttctcattagaagacaacccttctggaatcccaccagttattttcatcggtgagattaaa2040
tctaatcttgggcaaa2056
<210>14
<211>267
<212>prt
<213>bovine
<400>14
argtyrvalserthrglnglyproalahisproglnpropheserser
151015
trpasnasptyrleuglyleualathrleuilethrlysalavalasp
202530
glygluproargpheglycysalaargglyglyaspglyglyglyasp
354045
glyserproprosersersersersersercyscysserprohisval
505560
glyalaglyproglyalaleuglyproalaleuglyproproasptyr
65707580
aspgluaspaspaspaspaspaspseraspaspproglyserargser
859095
argtyrleuglyglyalaleugluleuargalaleugluleucysala
100105110
aspproalaglualaglyleuleuglugluargphealagluleuser
115120125
prophealaglyargalaalaalavalleuleuglycysalaproala
130135140
alaalaalaalaalathralaglualaalaproargglugluargala
145150155160
proalatrpalaalagluprolysleuhisalaalaserglyalaala
165170175
alaalaargleuleulysprogluleuglnvalcysvalphecysarg
180185190
asnasnlysglualavalalaleutyrthrthrhisileleulysgly
195200205
proaspglyargvalleucysprovalleuargargtyrthrcyspro
210215220
leucysglyalaserglyaspasnalahisthrilelystyrcyspro
225230235240
leuserlysvalproproproproalaalaargproproproargser
245250255
alaargaspglyleuproglylyslysleuarg
260265
<210>15
<211>482
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>15
agttaactaagctttgtacaaaaaagcaggctttaaaggaaccaattcagtcgactggat60
ccggtaccaaggtcgggcaggaagagggcctatttcccatgattccttcatatttgcata120
tacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat180
tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaat240
tatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttgg300
ctttatatatcttgtggaaaggacgaaacaccgaatcgtcgacaagggccaggttttaga360
gctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccga420
gtcggtgctttttttctagacccagctttcttgtacaaagttggcattactcgagatcca480
ct482
<210>16
<211>482
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>16
agttaactaagctttgtacaaaaaagcaggctttaaaggaaccaattcagtcgactggat60
ccggtaccaaggtcgggcaggaagagggcctatttcccatgattccttcatatttgcata120
tacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat180
tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaat240
tatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttgg300
ctttatatatcttgtggaaaggacgaaacaccgaatcgtcgacaagggccaggttttaga360
gctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccga420
gtcggtgctttttttctagacccagctttcttgtacaaagttggcattactcgagatcca480
ct482
<210>17
<211>482
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>17
agttaactaagctttgtacaaaaaagcaggctttaaaggaaccaattcagtcgactggat60
ccggtaccaaggtcgggcaggaagagggcctatttcccatgattccttcatatttgcata120
tacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat180
tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaat240
tatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttgg300
ctttatatatcttgtggaaaggacgaaacaccgtggcccttgtcgacgattcgttttaga360
gctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccga420
gtcggtgctttttttctagacccagctttcttgtacaaagttggcattactcgagatcca480
ct482
<210>18
<211>318
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>18
tgtacaaaaaagcaggctttaaaggaaccaattcagtcgactggatccggtaccaaggtc60
gggcaggaagagggcctatttcccatgattccttcatatttgcatatacgatacaaggct120
gttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacg180
tgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatg240
gactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttg300
tggaaaggacgaaacacc318
<210>19
<211>20
<212>dna
<213>artificialsequence
<220>
<223>syntheticoligonucleotide
<400>19
gtggcccttgtcgacgattc20
<210>20
<211>76
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>20
gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60
ggcaccgagtcggtgc76
<210>21
<211>10
<212>dna
<213>artificialsequence
<220>
<223>syntheticoligonucleotide
<220>
<221>misc_feature
<222>(8)..(10)
<223>nisa,c,g,ort
<400>21
tttttttnnn10
<210>22
<211>360
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>22
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagag60
ataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga120
aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcat180
atgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaagga240
cgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataag300
gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgttttagagct360
<210>23
<211>240
<212>dna
<213>artificialsequence
<220>
<223>syntheticoligonucleotide
<400>23
tttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattgga60
attaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataa120
tttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttacc180
gtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacacc240
<210>24
<211>76
<212>dna
<213>artificialsequence
<220>
<223>syntheticoligonucleotide
<400>24
gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60
ggcaccgagtcggtgc76
<210>25
<211>10
<212>dna
<213>artificialsequence
<220>
<223>syntheticoligonucleotide
<220>
<221>misc_feature
<222>(7)..(10)
<223>nisa,c,g,ort
<400>25
ttttttnnnn10
<210>26
<211>61
<212>dna
<213>susscrofa
<400>26
cccggtgcccggggcctctggcccttgtcgacgattctggatcagtcccaacaccacctg60
g61
<210>27
<211>61
<212>dna
<213>susscrofa
<400>27
cccggtgcccggggcccttgtcgacgatcagcccttctggatcagtcccaacaccacctg60
g61
<210>28
<211>356
<212>dna
<213>susscrofa
<400>28
tcagcgcttgaccttgcggccggctgaattgcgcccactgcggcgatagagagactgctg60
gccgccgttgagcgggcagtacttgagtgtgtgagcctggtcaccggtggccccgcacag120
gggacacacatagtgtcgtaggatgggacacaccaccacgccctccggtgtcttcagctg180
gtgcgaggagtacacgtggcgagattccccattgtgtttgcaaaagttgcacagggtggc240
cagccccccgctggccccccgctctcccgggccctggtcctgctccagtgggggctcagg300
tcttggctcctcaggttgaagtagtccttccacatgtcaaagggtggcagctgcat356
<210>29
<211>56
<212>dna
<213>susscrofa
<400>29
ttggctccccggtgcccggggcctctggcccttgtcgacgattctggatcagtccc56
<210>30
<211>56
<212>dna
<213>susscrofa
<400>30
ttggctccccggtgcccggggcctctggcccttgtcgacgattctggatcagtccc56
<210>31
<211>49
<212>dna
<213>susscrofa
<400>31
ttggctccccggtgcccggggcctctgtcgacgattctggatcagtccc49
<210>32
<211>49
<212>dna
<213>susscrofa
<400>32
ttggctccccggtgcccggggcctctgtcgacgattctggatcagtccc49
<210>33
<211>55
<212>dna
<213>susscrofa
<400>33
ttggctcccggtgcccggggcctctggcccttgtcgacgattctggatcagtccc55
<210>34
<211>54
<212>dna
<213>susscrofa
<400>34
ttggctccccggtgcccggggcctctgcccttgtccacaattctggatcatccc54
<210>35
<211>49
<212>dna
<213>susscrofa
<400>35
ttggctccccggtgcccggggcctctgtcgacgattctggatcagtccc49
<210>36
<211>49
<212>dna
<213>susscrofa
<400>36
ttggctccccggtgcccggtgcccttgtcgacgattctggatcagtccc49
<210>37
<211>49
<212>dna
<213>susscrofa
<400>37
ttggctccccggtgcccggggcccttgtcgacgattctggatcagtccc49
<210>38
<211>54
<212>dna
<213>susscrofa
<400>38
ttggctccccggtgcccggggcctctgccttgtcgacgattctggatcagtccc54
<210>39
<211>49
<212>dna
<213>susscrofa
<400>39
ttggctccccggtgcccggggcctctgtcgacgattctggatcagtccc49
<210>40
<211>50
<212>dna
<213>susscrofa
<400>40
ttggctccccggtgcccggggccccttgtcgacgattctggatcagtccc50
<210>41
<211>55
<212>dna
<213>susscrofa
<400>41
ttggctccccggtgcccggggcctctgcccttgtcgtcaattctggatcagtccc55
<210>42
<211>49
<212>dna
<213>susscrofa
<400>42
ttggctccccggtgcccggggcctctgtcgacaattctggatcagtccc49
<210>43
<211>9289
<212>dna
<213>artificialsequence
<220>
<223>syntheticpolynucleotide
<400>43
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagag60
ataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga120
aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcat180
atgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaagga240
cgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataag300
gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgttttagagct360
agaaatagcaagttaaaataaggctagtccgtttttagcgcgtgcgccaattctgcagac420
aaatggctctagaggtacccgttacataacttacggtaaatggcccgcctggctgaccgc480
ccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtc540
aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc600
caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagt660
acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta720
ccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccac780
ccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcgggggggg840
ggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcgga900
gaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggc960
ggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgc1020
tgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactg1080
accgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattag1140
ctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattac1200
ctggagcacctgcctgaaatcaatgacgataagatggccccaaagaagaagcggaaggtc1260
ggtatccacggagtcccagcagccgacaagaagtacagcatcggcctggacatcggcacc1320
aactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaag1380
gtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttc1440
gacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacacc1500
agacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtg1560
gacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcac1620
gagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtacccc1680
accatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctg1740
atctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgac1800
ctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaac1860
cagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtct1920
gccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaag1980
aagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaag2040
agcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgac2100
gacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgcc2160
aagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcacc2220
aaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgacc2280
ctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgac2340
cagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctac2400
aagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctg2460
aacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccag2520
atccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctg2580
aaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggc2640
cctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatc2700
accccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgag2760
cggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctg2820
ctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgaggga2880
atgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttc2940
aagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgag3000
tgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcaca3060
taccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgag3120
gacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgag3180
gaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcgg3240
cggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaag3300
cagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttc3360
atgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtg3420
tccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccatt3480
aagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccgg3540
cacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaaggga3600
cagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagc3660
cagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctg3720
tactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctg3780
tccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgac3840
aacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaa3900
gaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacc3960
cagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataag4020
gccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacag4080
atcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtg4140
aaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttac4200
aaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtg4260
ggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactac4320
aaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctacc4380
gccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggcc4440
aacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtg4500
tgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaat4560
atcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaag4620
aggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggc4680
ttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaag4740
tccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagc4800
ttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggac4860
ctgatcatcaagctgcctaagtactccctgttcgagctggaactttttttcaggttggac4920
cggtgccaccatggactataaggaccacgacggagactacaaggatcatgatattgatta4980
caaagacgaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacg5040
aactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagc5100
tgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcact5160
acctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacg5220
ctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagc5280
aggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttca5340
agtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacg5400
ccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagc5460
tgggaggcgacaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaagg5520
aattcggcagtggagagggcagaggaagtctgctaacatgcggtgacgtcgaggagaatc5580
ctggcccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagc5640
tggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgcca5700
cctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggc5760
ccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccaca5820
tgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcacca5880
tcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgaca5940
ccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctgg6000
ggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcaga6060
agaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagc6120
tcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgaca6180
accactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcaca6240
tggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtaca6300
aggaattctaactagagctcgctgatcagcctcgactgtgccttctagttgccagccatc6360
tgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcct6420
ttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggg6480
gggtggggtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctgg6540
ggagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctc6600
gctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctc6660
agtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatgcggtattttctccttac6720
gcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagtacgcgccctgtagc6780
ggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagc6840
gccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggcttt6900
ccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcac6960
ctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatag7020
acggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaa7080
actggaacaacactcaaccctatctcgggctattcttttgatttataagggattttgccg7140
atttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaac7200
aaaatattaacgtttacaattttatggtgcactctcagtacaatctgctctgatgccgca7260
tagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctg7320
ctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagagg7380
ttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctattttta7440
taggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaat7500
gtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatg7560
agacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaa7620
catttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcac7680
ccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttac7740
atcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgtttt7800
ccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgcc7860
gggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactca7920
ccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgcc7980
ataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaag8040
gagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaa8100
ccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatg8160
gcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaa8220
ttaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccg8280
gctggctggtttattgctgataaatctggagccggtgagcgtggaagccgcggtatcatt8340
gcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagt8400
caggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaag8460
cattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcat8520
ttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatccct8580
taacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttct8640
tgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctacca8700
gcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttc8760
agcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttc8820
aagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgct8880
gccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataag8940
gcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacc9000
tacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaaggg9060
agaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggag9120
cttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgactt9180
gagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaac9240
gcggcctttttacggttcctggccttttgctggccttttgctcacatgt9289
<210>44
<211>61
<212>dna
<213>susscrofa
<400>44
ctcaggtcttggctccccggtgcccggggcctctggcccttgtcgacgattctggatcag60
t61
<210>45
<211>60
<212>dna
<213>susscrofa
<400>45
ctcaggtcttggctccccggtgcccggggcctctgcccttgtcgacgattctggatcagt60
<210>46
<211>60
<212>dna
<213>susscrofa
<400>46
ctcaggtcttggctccccggtgcccggtgcccgggcccttgtcgacgattctggatcagt60
<210>47
<211>60
<212>dna
<213>susscrofa
<400>47
ctcaggtcttggctccccggtgcccggtgcccgggcccttgtcgacgattctggatcagt60
<210>48
<211>54
<212>dna
<213>susscrofa
<220>
<221>misc_feature
<222>(6)..(7)
<223>nisa,c,g,ort
<400>48
atcagnncttggctccccggtgcccggggcctctggccacgattctggatcagt54
<210>49
<211>54
<212>dna
<213>susscrofa
<400>49
ctcaggtcttggctccccggtgcccggggcctctgtcgacgattctggatcagt54
<210>50
<211>54
<212>dna
<213>susscrofa
<400>50
ctcaggtcttggctccccggtgcccggggcctctgtcgacgattctggatcagt54
<210>51
<211>59
<212>dna
<213>susscrofa
<400>51
ctcaggtcttggctccccggtgcccggggcctctggcccttgtcgacttctggatcagt59
<210>52
<211>60
<212>dna
<213>susscrofa
<400>52
ctcaggtcttggctccccggtgcccggggcctctgcccttgtcgacgattctggatcagt60
<210>53
<211>24
<212>dna
<213>susscrofa
<400>53
gcaccagctgaagaccaccggagg24
<210>54
<211>23
<212>dna
<213>susscrofa
<400>54
gctggtgcgaggagtacacgtgg23
<210>55
<211>65
<212>dna
<213>susscrofa
<400>55
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgtgt60
cccat65
<210>56
<211>64
<212>dna
<213>susscrofa
<400>56
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgttc60
ccat64
<210>57
<211>65
<212>dna
<213>susscrofa
<400>57
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgtgt60
cccat65
<210>58
<211>64
<212>dna
<213>susscrofa
<400>58
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgttc60
ccat64
<210>59
<211>65
<212>dna
<213>susscrofa
<400>59
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgtgt60
cccat65
<210>60
<211>65
<212>dna
<213>susscrofa
<400>60
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgtgt60
cccat65
<210>61
<211>65
<212>dna
<213>susscrofa
<400>61
gaatctcgccacgtgtactcctcgcaccagctgaagacaccggagggcgtggtggtgtgt60
cccat65
<210>62
<211>1000
<212>dna
<213>bovine
<400>62
gaaggatgggggtgggggcgtttgcagacatgaagttttgttgaaaggacagaaaaactg60
aggcccagggagacgggtctttccagaggtcacagagcaccttgcaggccaagcaagcac120
cagagacaacaggaaagacccccttccacatctccatggggaattaaagtcagaaggaat180
caaaggtgaggagtgggccctttaaatcctaagctccacctttgcttagaagggtctttg240
ggaatataaaagggggtgcagttcctctctgctcctgaaaaccatcagctgctcctgtct300
gcgggcccccagcccacttctctccagccacccaccaccaacactcccccgggtgccatg360
cagctgccaccctttgacatgtggaaggactacttcaacctgagccaagtggtgctggca420
ctgatccagagtcgggggcaagggttggagacccaagggactggggagccgagacccggg480
ccccatgtggagcaggatcaggggcagggcggacgcggggctggcgggggcctggccacc540
ctgtgcaacttttgcaaacacaatggagagtctcgccacgtgtactcctcacaccagctg600
aagaccccggagggcgtggtggtgtgtcccattctgcggcattatgtatgtcccctgtgc660
ggggccaccggggaccaggcccacacactcaagtactgcccactcaacggaggacagcag720
tctctctaccgccgcagtgggcgcaactcagccggccgcaaggtcaagcgctgaagaccg780
tcaggtacccacccgctgcagccccaaccctccctggttcagccctcccaagcccctgga840
ctctccccatctatggactcgtcaggccctttggaatgtctgactctcagtacttgatcc900
ctgctggatcctggaacaacggaggcagtgggaagccaggccaactccgcggccccttag960
aactctcagctctccggactcttgtctgcgagtgtctgtg1000
<210>63
<211>417
<212>dna
<213>bovine
<400>63
atgcagctgccaccctttgacatgtggaaggactacttcaacctgagccaagtggtgctg60
gcactgatccagagtcgggggcaagggttggagacccaagggactggggagccgagaccc120
gggccccatgtggagcaggatcaggggcagggcggacgcggggctggcgggggcctggcc180
accctgtgcaacttttgcaaacacaatggagagtctcgccacgtgtactcctcacaccag240
ctgaagaccccggagggcgtggtggtgtgtcccattctgcggcattatgtatgtcccctg300
tgcggggccaccggggaccaggcccacacactcaagtactgcccactcaacggaggacag360
cagtctctctaccgccgcagtgggcgcaactcagccggccgcaaggtcaagcgctga417
<210>64
<211>20
<212>dna
<213>bovine
<400>64
agacgggtctttccagaggt20
<210>65
<211>20
<212>dna
<213>bovine
<400>65
aagctccacctttgcttaga20
<210>66
<211>21
<212>dna
<213>bovine
<400>66
ctttgcttagaagggtctttt21
<210>67
<211>20
<212>dna
<213>bovine
<400>67
ggtctttgggaatataaaag20
<210>68
<211>19
<212>dna
<213>bovine
<400>68
ggcaagggttggagaccca19
<210>69
<211>20
<212>dna
<213>bovine
<400>69
gccgagacccgggccccatg20
<210>70
<211>20
<212>dna
<213>bovine
<400>70
cccatgtggagcaggatcag20
<210>71
<211>19
<212>dna
<213>bovine
<400>71
tccccatctctggactcgt19
<210>72
<211>20
<212>dna
<213>bovine
<400>72
tctggactcgtccggccctt20
<210>73
<211>20
<212>dna
<213>bovine
<400>73
tctcagtacttgatccctgc20
<210>74
<211>20
<212>dna
<213>bovine
<400>74
acaagagtccggagagctga20
<210>75
<211>54
<212>dna
<213>susscrofa
<400>75
tgccatgcagctgccaccctttgacatgtggaaggactacttcaacctgagcca54
<210>76
<211>18
<212>dna
<213>susscrofa
<400>76
tgccatgcagctgccacc18
<210>77
<211>18
<212>dna
<213>susscrofa
<400>77
tggctcaggttgaagtag18
<210>78
<211>52
<212>dna
<213>susscrofa
<400>78
tttgacatgtggaaggactacttcaacctgagccaggtggtgttgggactga52
<210>79
<211>18
<212>dna
<213>susscrofa
<400>79
tttgacatgtggaaggac18
<210>80
<211>18
<212>dna
<213>susscrofa
<400>80
tcagtcccaacaccacct18
<210>81
<211>53
<212>dna
<213>susscrofa
<400>81
tcaacctgagccaggtggtgttgggactgatccagaatcgtcgacaagggcca53
<210>82
<211>18
<212>dna
<213>susscrofa
<400>82
tcaacctgagccaggtgg18
<210>83
<211>16
<212>dna
<213>susscrofa
<400>83
gcccttgtcgacgatt16
<210>84
<211>19
<212>dna
<213>susscrofa
<400>84
gcgggcagtacttgagtgt19
<210>85
<211>20
<212>dna
<213>susscrofa
<400>85
ccagaaaaccttctgctgct20
<210>86
<211>26
<212>dna
<213>susscrofa
<400>86
ccagaatcgtcgacaagggccagagg26
<210>87
<211>26
<212>dna
<213>susscrofa
<400>87
ggtcttagcagctgttcccggtctcc26
<210>88
<211>24
<212>dna
<213>bovine
<400>88
caccggtctttgggaatataaaag24
<210>89
<211>24
<212>dna
<213>bovine
<400>89
aaaccttttatattcccaaagacc24
<210>90
<211>23
<212>dna
<213>bovine
<400>90
caccgtctttgggaatataaaag23
<210>91
<211>23
<212>dna
<213>bovine
<400>91
aaaccttttatattcccaaagac23
<210>92
<211>25
<212>dna
<213>bovine
<400>92
caccgctttgcttagaagggtcttt25
<210>93
<211>25
<212>dna
<213>bovine
<400>93
aaacaaagacccttctaagcaaagc25
<210>94
<211>23
<212>dna
<213>bovine
<400>94
caccgttgcttagaagggtcttt23
<210>95
<211>22
<212>dna
<213>bovine
<400>95
aacaaagacccttctaagcaac22
<210>96
<211>25
<212>dna
<213>bovine
<400>96
caccgagctccacctttgcttagaa25
<210>97
<211>25
<212>dna
<213>bovine
<400>97
aaacttctaagcaaaggtggagctc25
<210>98
<211>23
<212>dna
<213>bovine
<400>98
caccgctccacctttgcttagaa23
<210>99
<211>23
<212>dna
<213>bovine
<400>99
aaacttctaagcaaaggtggagc23
<210>100
<211>24
<212>dna
<213>bovine
<400>100
caccggcaagggttggagacccaa24
<210>101
<211>24
<212>dna
<213>bovine
<400>101
aaacttgggtctccaacccttgcc24
<210>102
<211>23
<212>dna
<213>bovine
<400>102
caccgcaagggttggagacccaa23
<210>103
<211>23
<212>dna
<213>bovine
<400>103
aaacttgggtctccaacccttgc23
<210>104
<211>24
<212>dna
<213>bovine
<400>104
caccgccgagacccgggccccatg24
<210>105
<211>24
<212>dna
<213>bovine
<400>105
aaaccatggggcccgggtctcggc24
<210>106
<211>21
<212>dna
<213>bovine
<400>106
caccgagacccgggccccatg21
<210>107
<211>21
<212>dna
<213>bovine
<400>107
aaaccatggggcccgggtctc21
<210>108
<211>25
<212>dna
<213>bovine
<400>108
caccgcccatgtggagcaggatcag25
<210>109
<211>25
<212>dna
<213>bovine
<400>109
aaacctgatcctgctccacatgggc25
<210>110
<211>23
<212>dna
<213>bovine
<400>110
caccgcatgtggagcaggatcag23
<210>111
<211>23
<212>dna
<213>bovine
<400>111
aaacctgatcctgctccacatgc23
<210>112
<211>25
<212>dna
<213>bovine
<400>112
caccgtccccatctctggactcgtc25
<210>113
<211>25
<212>dna
<213>bovine
<400>113
aaacgacgagtccagagatggggac25
<210>114
<211>23
<212>dna
<213>bovine
<400>114
caccgcccatctctggactcgtc23
<210>115
<211>23
<212>dna
<213>bovine
<400>115
aaacgacgagtccagagatgggc23
<210>116
<211>25
<212>dna
<213>bovine
<400>116
caccgtctggactcgtccggccctt25
<210>117
<211>201
<212>dna
<213>bovine
<400>117
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcggggg201
<210>118
<211>132
<212>dna
<213>bovine
<400>118
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>119
<211>132
<212>dna
<213>bovine
<400>119
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>120
<211>119
<212>dna
<213>bovine
<400>120
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggactggggagcc60
gagacccggccccatgtggagcaggatcaggggcagggcggacgcggggccggcggggg119
<210>121
<211>119
<212>dna
<213>bovine
<400>121
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggactggggagcc60
gagacccggccccatgtggagcaggatcaggggcagggcggacgcggggccggcggggg119
<210>122
<211>112
<212>dna
<213>bovine
<400>122
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggagccgagaccc60
ggccccatgtggagcaggatcaggggcagggcggacgcggggccggcggggg112
<210>123
<211>201
<212>dna
<213>bovine
<400>123
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcggggg201
<210>124
<211>129
<212>dna
<213>bovine
<400>124
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggggtgcagttcc60
tgagccaagtggtgctggcactgatccagagtcgggggcaagggttggagacccaaggga120
ctggggagc129
<210>125
<211>103
<212>dna
<213>bovine
<400>125
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacatg60
tggagcaggatcaggggcagggcggacgcggggccggcggggg103
<210>126
<211>104
<212>dna
<213>bovine
<400>126
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaacat60
gtggagcaggatcaggggcagggcggacgcggggccggcggggg104
<210>127
<211>106
<212>dna
<213>bovine
<400>127
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggagtgcagttcc60
atgtggagcaggatcaggggcagggcggacgcggggccggcggggg106
<210>128
<211>103
<212>dna
<213>bovine
<400>128
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacatg60
tggagcaggatcaggggcagggcggacgcggggccggcggggg103
<210>129
<211>201
<212>dna
<213>bovine
<400>129
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcggggg201
<210>130
<211>48
<212>dna
<213>bovine
<400>130
tgggccctttaaatcctaagctccacctttgcttagaagggtctaagg48
<210>131
<211>89
<212>dna
<213>bovine
<400>131
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataatcag60
gggcagggcggacgcggggccggcggggg89
<210>132
<211>88
<212>dna
<213>bovine
<400>132
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacagg60
ggcagggcggacgcggggccggcggggg88
<210>133
<211>45
<212>dna
<213>bovine
<400>133
tgggccctttaaatcctaagctccacctttgctggccgggggggg45
<210>134
<211>62
<212>dna
<213>bovine
<400>134
tgggccctttaaatcctaagctccacctttgcttagaagggcggacgcggggccggcggg60
gg62
<210>135
<211>200
<212>dna
<213>bovine
<400>135
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcgggg200
<210>136
<211>132
<212>dna
<213>bovine
<400>136
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>137
<211>132
<212>dna
<213>bovine
<400>137
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>138
<211>132
<212>dna
<213>bovine
<400>138
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>139
<211>132
<212>dna
<213>bovine
<400>139
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>140
<211>132
<212>dna
<213>bovine
<400>140
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacaag60
ggactggggagccgagacccggccccatgtggagcaggatcaggggcagggcggacgcgg120
ggccggcggggg132
<210>141
<211>201
<212>dna
<213>bovine
<400>141
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcggggg201
<210>142
<211>98
<212>dna
<213>bovine
<400>142
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatatgtggag60
caggatcaggggcagggcggacgcggggccggcggggg98
<210>143
<211>103
<212>dna
<213>bovine
<400>143
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacatg60
tggagcaggatcaggggcagggcggacgcggggccggcggggg103
<210>144
<211>89
<212>dna
<213>bovine
<400>144
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatatgatcag60
gggcagggcggacgcggggccggcggggg89
<210>145
<211>89
<212>dna
<213>bovine
<400>145
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggagcaggatcag60
gggcagggcggacgcggggccggcggggg89
<210>146
<211>103
<212>dna
<213>bovine
<400>146
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataacatg60
tggagcaggatcaggggcagggcggacgcggggccggcggggg103
<210>147
<211>201
<212>dna
<213>bovine
<400>147
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataaaagg60
gggtgcagttcctgagccaagtggtgctggcactgatccagagtcgggggcaagggttgg120
agacccaagggactggggagccgagacccggccccatgtggagcaggatcaggggcaggg180
cggacgcggggccggcggggg201
<210>148
<211>68
<212>dna
<213>bovine
<400>148
tgggccctttaaatcctaagctccacctttgcttctcaggggcagggcggacgcggggcc60
ggcggggg68
<210>149
<211>70
<212>dna
<213>bovine
<400>149
tgggccctttaaatcctaagctccacctttgcttagaagggtctttgggcggacgcgggg60
ccggcggggg70
<210>150
<211>88
<212>dna
<213>bovine
<400>150
gggccctttaaatcctaagctccacctttgcttagaagggtctttgggaatataatcagg60
ggcagggcggacgcggggccggcggggg88
<210>151
<211>67
<212>dna
<213>bovine
<400>151
tgggccctttaaatcctaagctccacctttgcttagaagggcagggcggacgcggggccg60
gcggggg67
<210>152
<211>125
<212>dna
<213>bovine
<400>152
tgggccctttaaatcctaagctccacctttgcttagaagtggtgctggcactgatccaga60
gtcgggggcaagggttggagacccaagggactggggagccgagacccggccccatgtgga120
gcagg125
<210>153
<211>25
<212>dna
<213>bovine
<400>153
aaacaagggccggacgagtccagac25
<210>154
<211>21
<212>dna
<213>bovine
<400>154
caccggactcgtccggccctt21
<210>155
<211>21
<212>dna
<213>bovine
<400>155
aaacaagggccggacgagtcc21
<210>156
<211>25
<212>dna
<213>bovine
<400>156
caccgtctcagtacttgatccctgc25
<210>157
<211>25
<212>dna
<213>bovine
<400>157
aaacgcagggatcaagtactgagac25
<210>158
<211>23
<212>dna
<213>bovine
<400>158
caccgtcagtacttgatccctgc23
<210>159
<211>23
<212>dna
<213>bovine
<400>159
aaacgcagggatcaagtactgac23
<210>160
<211>22
<212>dna
<213>susscrofa
<400>160
gatcagtcccaacaccacctgg22
<210>161
<211>22
<212>dna
<213>susscrofa
<400>161
ccaggtggtgttgggactgatc22
<210>162
<211>23
<212>dna
<213>susscrofa
<400>162
gaatcgtcgacaagggccagagg23
<210>163
<211>42
<212>dna
<213>susscrofa
<400>163
ctacttcaacctgagccaggtggtgttgggactgatccagaa42
<210>164
<211>37
<212>dna
<213>susscrofa
<400>164
ctacttcaacctgagccaggttgggactgatccagaa37
<210>165
<211>39
<212>dna
<213>susscrofa
<400>165
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>166
<211>39
<212>dna
<213>susscrofa
<400>166
ctacttcaacctgagccagggactgggactgatccagaa39
<210>167
<211>43
<212>dna
<213>susscrofa
<400>167
ctacttcaacctgagccaggtgggtgttgggactgatccagaa43
<210>168
<211>41
<212>dna
<213>susscrofa
<400>168
ctacttcaacctgagccaggtgtgttgggactgatccagaa41
<210>169
<211>37
<212>dna
<213>susscrofa
<400>169
ctacttcaacctgagccaggttgggaccgatccagaa37
<210>170
<211>39
<212>dna
<213>susscrofa
<400>170
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>171
<211>39
<212>dna
<213>susscrofa
<400>171
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>172
<211>32
<212>dna
<213>susscrofa
<400>172
ctacttcaacctgagccaggactgatccagaa32
<210>173
<211>39
<212>dna
<213>susscrofa
<400>173
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>174
<211>39
<212>dna
<213>susscrofa
<400>174
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>175
<211>37
<212>dna
<213>susscrofa
<400>175
ctacttcaacctgagccaggttgggactgatccagaa37
<210>176
<211>39
<212>dna
<213>susscrofa
<400>176
ctacttcaacctgagtcaggtgttgggactgatccagaa39
<210>177
<211>45
<212>dna
<213>susscrofa
<400>177
ctacttcaacctaagccaggttgaagtgttgggactgatccagaa45
<210>178
<211>39
<212>dna
<213>susscrofa
<400>178
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>179
<211>41
<212>dna
<213>susscrofa
<400>179
ctacttcaacctgagccaggtgtgttgggactgatccagaa41
<210>180
<211>38
<212>dna
<213>susscrofa
<400>180
ctacctcaacctgagccaggggtgggactgatccagaa38
<210>181
<211>41
<212>dna
<213>susscrofa
<400>181
ctacttcaacctgagcctggtgtgttgggactgatccagaa41
<210>182
<211>39
<212>dna
<213>susscrofa
<400>182
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>183
<211>39
<212>dna
<213>susscrofa
<400>183
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>184
<211>38
<212>dna
<213>susscrofa
<400>184
ctacttcaacctgagccaggtctgggactgatccagaa38
<210>185
<211>16
<212>dna
<213>susscrofa
<400>185
tgggactgatccagaa16
<210>186
<211>45
<212>dna
<213>susscrofa
<400>186
ctacttcaacctgagccaggttgaagtgttgggactgatccagaa45
<210>187
<211>45
<212>dna
<213>susscrofa
<400>187
ctacttcaacctgagccaggttgaagtgttgggactgatccagaa45
<210>188
<211>39
<212>dna
<213>susscrofa
<400>188
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>189
<211>39
<212>dna
<213>susscrofa
<400>189
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>190
<211>37
<212>dna
<213>susscrofa
<400>190
ctacttcaacctgagccaggttgggactgatccagaa37
<210>191
<211>37
<212>dna
<213>susscrofa
<400>191
ctacttcaacctgagccaggttgggactgatccagaa37
<210>192
<211>41
<212>dna
<213>susscrofa
<400>192
ctacttcaacctgagccaggtgtgttgggactgatcaataa41
<210>193
<211>38
<212>dna
<213>susscrofa
<400>193
ctacttcaacctgagccagtgttgggactgatccagaa38
<210>194
<211>39
<212>dna
<213>susscrofa
<400>194
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>195
<211>42
<212>dna
<213>susscrofa
<400>195
ctacttcaacctgagccaggcggggttgggactgatccagaa42
<210>196
<211>39
<212>dna
<213>susscrofa
<400>196
ctacttcaacctgagccaggtgttgggactgatccagaa39
<210>197
<211>37
<212>dna
<213>susscrofa
<400>197
ctacttcaacctgagccaggttgggactgatccagaa37
<210>198
<211>41
<212>dna
<213>susscrofa
<400>198
ctacttcaacctgagccaggtgtgttgggactgatccagaa41
<210>199
<211>21
<212>dna
<213>susscrofa
<400>199
ctacttcaacctgagccagaa21
<210>200
<211>51
<212>dna
<213>susscrofa
<400>200
atccagaatcgtcgacaagggccagaggccccgggcaccggggagccaaga51
<210>201
<211>44
<212>dna
<213>susscrofa
<400>201
atccagaatcgtcgacaagggccccgggcaccggggagccaaga44
<210>202
<211>44
<212>dna
<213>susscrofa
<400>202
atccagaatcgtcgacaagggccccgggcaccggggagccaaga44
<210>203
<211>50
<212>dna
<213>susscrofa
<400>203
atccagaatcgtcgacgacgcgagaagccccgggcaccggggagccaaga50
<210>204
<211>40
<212>dna
<213>susscrofa
<400>204
atccagaatcgtcgaggccccgggcaccggggagccaaga40