發(fā)明背景
重組酶可用于重組酶介導(dǎo)的核酸擴增。例如,重組酶可以促進寡核苷酸靶向dna靶標(biāo),允許通過聚合酶復(fù)制dna。仍然需要具有改善性質(zhì)的修飾的重組酶。
序列表
本申請與電子格式的序列表一起提交。該序列表作為一個創(chuàng)建于2014年09月26日,大小為98kb的,命名為ip1264.txt的文件提供。序列表的電子格式中的信息通過引用以其整體并入本文。
發(fā)明概述
本文呈現(xiàn)的是用于改善的重組酶介導(dǎo)的核酸擴增的重組酶。令人驚訝地,本發(fā)明人已經(jīng)鑒定出某些改變的重組酶,其在將核酸接種(seeding)至模式化(patterned)流動池表面中具有實質(zhì)改善的特點。在某些實施方案中,改變的重組酶改善在模式化流動池表面上接種無pcr文庫(pcr-freelibrary)(如具有單鏈銜接頭區(qū)的pcr文庫),從而實現(xiàn)改善的簇擴增。
在某些實施方案中,所述重組酶是重組uvsx,且包含功能上等同于rb49uvsx氨基酸序列中pro256的位置處的氨基酸取代。野生型rb49uvsx氨基酸序列如seqidno:1所示。在某些實施方案中,所述重組uvsx包含氨基酸序列,該氨基酸序列包含與seqidno:1至少60%、70%、80%、90%、95%、99%相同的氨基酸,并包含在功能上等同于rb49uvsx氨基酸序列中pro256的位置處的氨基酸取代突變。在某些實施方案中,取代突變包含突變?yōu)閹щ姾傻臍埢?。在某些實施方案中,取代突變包含突變?yōu)閴A性殘基。在某些實施方案中,取代突變包含與rb49uvsx氨基酸序列中pro256lys同源的突變。
在一些實施方案中,除以上突變外,重組uvsx還可以包含在功能上等同于rb49uvsx氨基酸序列中his63的位置處的取代突變。例如,在某些實施方案中,重組uvsx包含與rb49uvsx氨基酸序列中his63ser同源的取代突變。
在一些實施方案中,除以上任何突變外,重組uvsx還可包含選自下組的突變:在c末端添加一個或多個谷氨酸殘基;在c末端添加一個或多個天冬氨酸殘基;及其組合。
在一些實施方案中,重組uvsx衍生自選自下組的肌病毒科噬菌體:t4、t6、rb69、aeh1、kvp40、不動桿菌噬菌體133、氣單胞菌噬菌體65、噬藍藻體p-ssm2、噬藍藻體pssm4、噬藍藻體s-pm2、rb32、弧菌噬菌體nt-1、rb16、rb43,和rb49。
在一些實施方案中,重組uvsx衍生自選自下組的肌病毒科噬菌體:t2、rb14、氣單胞菌噬菌體25、phi-1、噬菌體31、噬菌體44rr2.8t、噬菌體rb3、和噬菌體lz2。
本文還呈現(xiàn)的是重組uvsx,其包含seqidno:2和22-35中任一項的氨基酸序列。在某些實施方案中,重組uvsx包括氨基酸序列,所述序列包含與seqidno:2和22-35至少60%、70%、80%、90%、95%、99%相同的氨基酸,且其包含在功能上等同于rb49uvsx氨基酸序列中pro256的位置處的氨基酸取代突變。
本文還呈現(xiàn)的是重組uvsx,其包含對包含seqidno:3-5中任一項的氨基酸序列的半保守域的取代突變(asubstitutionmutationtothesemi-conserveddomaincomprisingtheaminoacidsequenceofanyofseqidnos:3-5),其中所述取代突變包含選自下組的突變:在位置7處取代為除phe、pro、asp、glu或asn以外的任何殘基。在某些實施方案中,重組uvsx包含與重組酶(其包含半保守域,該半保守域包含seqidno:3-5中任一個的氨基酸序列)至少60%、70%、80%、90%、95%、99%相同的氨基酸,并且其中重組uvsx包含選自下組的取代突變:在位置7處突變?yōu)槌齪he、pro、asp、glu或asn以外的任何殘基。在某些實施方案中,突變包含突變?yōu)閹щ姾傻臍埢?。在某些實施方案中,突變包含突變?yōu)閴A性殘基。在某些實施方案中,突變包含在位置7處取代為lys。
本文還呈現(xiàn)的是重組uvsx,包含對包含seqidno:6-7中任一項的氨基酸序列的半保守域的取代突變,其中取代突變包含選自下組的突變:在位置12處取代為除phe、pro、asp、glu或asn以外的任何殘基。在某些實施方案中,重組uvsx包含與重組酶(其包含半保守域,該半保守域包含seqidno:6-7中任一個的氨基酸序列)至少60%、70%、80%、90%、95%、99%相同的氨基酸,并且其中重組uvsx包含選自下組的突變:在位置12處取代為除phe、pro、asp、glu或asn以外的任何殘基。在某些實施方案中,突變包含突變?yōu)閹щ姾傻臍埢?。在某些實施方案中,突變包含突變?yōu)閴A性殘基。在某些實施方案中,突變包含在位置12取代為lys。
在一些實施方案中,除以上突變外,重組uvsx還可以包含在功能上等同于rb49uvsx氨基酸序列中his63的位置處的取代突變。例如,在某些實施方案中,重組uvsx包含與在rb49uvsx氨基酸序列中his63ser同源的取代突變。
在一些實施方案中,除了以上任何突變外,重組uvsx還可以包含選自下組的突變:在c末端添加一個或多個谷氨酸殘基;在c末端添加一個或多個天冬氨酸殘基;及其組合。
在一些實施方案中,重組uvsx衍生自選自下組的肌病毒科噬菌體:t4、t6、rb69、aeh1、kvp40、不動桿菌噬菌體133、氣單胞菌噬菌體65、噬藍藻體p-ssm2、噬藍藻體pssm4、噬藍藻體s-pm2、rb32、弧菌噬菌體nt-1、rb16、rb43,和rb49。
在一些實施方案中,重組uvsx衍生自選自下組的肌病毒科噬菌體:t2、rb14、氣單胞菌噬菌體25、phi-1、噬菌體31、噬菌體44rr2.8t、噬菌體rb3、和噬菌體lz2。
還呈現(xiàn)的是編碼如任何以上實施方案所定義的重組uvsx的核酸分子。本文還呈現(xiàn)的是包含上述核酸分子的表達載體。本文還呈現(xiàn)的是包含上述載體的宿主細胞。
還呈現(xiàn)的是擴增靶核酸分子的重組酶聚合酶擴增方法,其包含以下步驟:(a)將任何以上實施方案的重組uvsx與第一和第二核酸引物接觸以形成第一和第二核蛋白引物,其中所述核酸引物包含在其3’端的單鏈區(qū);(b)將所述第一和第二核蛋白引物與所述靶核酸分子接觸,從而在所述第一鏈的第一部分處形成第一雙鏈結(jié)構(gòu)并且在所述第二鏈的第二部分處形成第二雙鏈結(jié)構(gòu),從而所述第一核酸引物和所述第二核酸引物的3’端在相同的雙鏈模板核酸分子上彼此相對定向;(c)用一種或多種聚合酶和dntp延伸所述第一和第二核酸引物的3’端以產(chǎn)生第一和第二雙鏈核酸和核酸的第一和第二置換鏈;和(d)通過重復(fù)(b)和(c)繼續(xù)反應(yīng),直到達到期望的擴增程度。
在該方法的某些實施方案中,靶核酸分子包含雙鏈核酸。在某些實施方案中,靶核酸分子包含單鏈核酸。例如,在一些實施方案中,靶核酸包含單鏈銜接頭區(qū)。在某些實施方案中,所述方法在重組酶加載蛋白(loadingprotein)存在下進行。例如,重組酶加載蛋白可選自下組:t4uvsy、大腸桿菌(e.coli)reco、大腸桿菌recr,及其組合。在某些實施方案中,所述方法在選自下組的單鏈穩(wěn)定劑的存在下進行:gp32、大腸桿菌ssb蛋白、t4gp32蛋白,及其衍生物。在某些實施方案中,所述方法在選自下組的擁擠劑(crowdingagent)的存在下進行:聚乙二醇,聚環(huán)氧乙烷,聚苯乙烯,ficoll,葡聚糖,pvp,和白蛋白,使得所述擁擠劑刺激擴增。
在某些實施方案中,該方法在擴增位點的陣列上進行。在某些實施方案中,每個擴增位點包含多個用于擴增靶核酸的擴增引物。在某些實施方案中,所述擴增位點的陣列包含表面上的特征陣列。例如,所述特征可以是不連續(xù)的并由缺少擴增引物的表面的間隙區(qū)域分開。在某些實施方案中,擴增位點的陣列包含溶液中的珠?;虮砻嫔系闹榱?。在某些實施方案中,擴增位點的陣列包含乳液。在某些實施方案中,等溫發(fā)生所述方法。
還呈現(xiàn)的是用于進行重組酶聚合酶反應(yīng)的試劑盒。在某些實施方案中,試劑盒可以包含如上述任何實施方案中所定義的重組uvsx,以及如下一種或多種:單鏈dna結(jié)合蛋白;dna聚合酶;dntp或dntp和ddntp的混合物;擁擠劑;緩沖液;還原劑;atp或atp類似物;重組酶加載蛋白;第一引物和任選地第二引物。
一個或多個實施方案的細節(jié)在附圖和下面的描述中闡述。其他特征、目的和優(yōu)點將從說明書和附圖,以及權(quán)利要求書中變得顯而易見。
附圖簡述
圖1是示意圖,其示出了來自以下的uvsx氨基酸序列的比對:腸桿菌噬菌體t4(t4)(seqidno:8)、腸桿菌噬菌體t6(t6)(seqidno:9)、不動桿菌噬菌體133(phage133)(seqidno:10)、腸桿菌噬菌體rb69(rb69)(seqidno:11)、氣單胞菌噬菌體aeh1(aeh1)(seqidno:12)、氣單胞菌噬菌體65(ae65)(seqidno:13)、弧菌噬菌體kvp40(kvp40)(seqidno:14)、腸桿菌噬菌體rb43(rb43)(seqidno:15)、原綠球菌(prochlorococcus)噬菌體p-ssm2(pssm2)(seqidno:16),和原綠球菌噬菌體p-ssm4(pssm4)(seqidno:17),如在us2009/0029421的并入材料中闡述。突出顯示了位置上和功能上等同于rb49uvsx氨基酸序列中pro256的殘基,并由三角形符號表示。
圖2是示意圖,其示出了來自腸桿菌噬菌體rb49(rb49)(seqidno:1)和腸桿菌噬菌體t4(t4)(seqidno:8)的uvsx氨基酸序列的比對。突出顯示了位置上和/或功能上等同于rb49uvsx氨基酸序列中pro256的殘基,并由三角形符號表示。
圖3a示出了使用t4uvsx制劑接種到模式化流動池上的無pcr文庫的簇圖像的截圖。
圖3b示出了使用包含rb49p256k重組酶的液體制劑接種到模式化流動池上的無pcr文庫的簇圖像的截圖。
圖4a示出了使用t4uvsx制劑接種到模式化流動池上的單鏈(ssdna)無pcr文庫的簇圖像的截圖。
圖4b示出了使用包含rb49p256k重組酶的液體制劑接種到模式化流動池上的單鏈無pcr文庫的簇圖像的截圖。
發(fā)明詳述
本文呈現(xiàn)的是用于改善的重組酶介導(dǎo)的核酸擴增的重組酶。令人驚訝地,本發(fā)明人已經(jīng)鑒定出某些改變的重組酶,其在將核酸接種至模式化流動池表面上中具有實質(zhì)改善的特點。
如下文更詳細地描述的,令人驚訝地,發(fā)明人發(fā)現(xiàn),對重組酶中一個或多個殘基的一個或多個突變導(dǎo)致在模式化流動池表面上接種dna文庫(如例如具有單鏈銜接頭區(qū)的pcr文庫)中的深刻的改進,給出改善的簇擴增。
在某些實施方案中,取代突變包含突變?yōu)榫哂袔щ姾傻膫?cè)鏈的殘基。例如,在一些實施方案中,帶電荷的氨基酸是帶正電荷的氨基酸殘基。術(shù)語“帶正電荷的氨基酸殘基”指側(cè)鏈pka值大于7的親水性氨基酸,即堿性氨基酸。由于與水合氫離子(hydroniumion)締合,堿性氨基酸通常在生理ph下具有帶正電荷的側(cè)鏈。天然發(fā)生的(遺傳編碼的)堿性氨基酸包括賴氨酸(lys,k)、精氨酸(arg,r)和組氨酸(his,h),而非天然(非遺傳編碼的,或非標(biāo)準(zhǔn))堿性氨基酸包括例如鳥氨酸、2,3,-二氨基丙酸、2,4-二氨基丁酸、2,5,6-三氨基己酸、2-氨基-4-胍酸丁酸,和高精氨酸。術(shù)語“帶負電荷的氨基酸”指天然或非天然氨基酸(不論手性),其除了c末端羧基外包含至少一個額外的帶負電荷的基團,如羧基、磷酸根(phosphate),膦酸根(phosphonate),磺酸根(sulfonate)等。
本文還呈現(xiàn)的是包含對重組uvsx的半保守域的取代突變的重組uvsx。如本文所用,術(shù)語“半保守域”指重組uvsx中在各種物種間完全保守的,或者至少部分保守的部分。已經(jīng)令人驚訝地發(fā)現(xiàn)半保守域中一個或多個殘基的突變影響重組酶活性(特別是在單鏈模板核酸存在下);導(dǎo)致在重組酶介導(dǎo)的擴增反應(yīng)中接種和/或擴增的增強。如下面的實施例部分所述,這些突變的重組酶在模式化細胞池表面上接種無pcr文庫(如具有單鏈銜接頭區(qū)的pcr文庫)中具有改善的性能,導(dǎo)致改善的簇擴增。
在一些實施方案中,半保守域包含具有seqidno:3-7中任一個所示序列的氨基酸。seqidno:3-7對應(yīng)于各種物種中半保守域中的殘基。seqidno:3對應(yīng)于t4uvsx氨基酸序列的殘基251-258,其在本文中如seqidno:8所示。在圖1和圖2中示出了在半保守域中顯示各種物種間的保守的比對。圖1中示出的uvsx序列獲得自genbank數(shù)據(jù)庫登錄號np_049656(t4),yp_004300647(噬菌體133);np_861734(rb69);np_943894.1(aeh1);yp_004300858(ae65);np_899256(kvp40);yp_239013(rb43);yp_214417(p-ssm2);yp_214708(p-ssm4);以及來自us公開號2009/0029421(t6)。圖2是示意圖,其示出了來自腸桿菌噬菌體rb49(rb49)(seqidno:1)和腸桿菌噬菌體t4(t4)(seqidno:8)的uvsx氨基酸序列的比對。突出顯示了位置上和/或功能上等同于rb49uvsx氨基酸序列中pro256的殘基,并由三角形符號表示。圖2中所示的uvsx序列獲得自genbank數(shù)據(jù)庫登錄號np_891595(rb49)和np_049656(t4)。
令人驚訝地,發(fā)現(xiàn)對半保守域中一個或多個殘基的突變增加了重組酶的活性,特別是在單鏈模板核酸存在下,導(dǎo)致重組酶介導(dǎo)的擴增反應(yīng)中的接種和/或擴增的增強。如下面的實施例部分所述,這些突變的重組酶在模式化細胞池表面接種無pcr文庫(如具有單鏈銜接頭區(qū)的pcr文庫)中具有改善的性能,導(dǎo)致改善的簇擴增。例如,在一些本文呈現(xiàn)的重組uvsx的實施方案中,取代突變包含在seqidno:3-5中任一個的位置7處突變?yōu)槌齪he、pro、asp、glu或asn以外的任何殘基取代。在某些實施方案中,重組uvsx包含seqidno:3-5中任一個的位置7處突變?yōu)閘ys。在一些本文呈現(xiàn)的重組uvsx的實施方案中,取代突變包含在seqidno:6-7中任一個的位置12處突變?yōu)槌齪he、pro、asp、glu或asn以外的任何殘基。在某些實施方案中,重組uvsx包含seqidno:6-7中任一個的位置12處突變?yōu)閘ys。
在一些實施方案中,重組酶是uvsx蛋白。任何噬菌體重組酶可以用于本文呈現(xiàn)的實施方案中,包括例如噬菌體重組酶,如衍生自肌病毒科噬菌體的uvsx或uvsx樣重組酶,如例如t4、t6、rb69、aeh1、kvp40、不動桿菌噬菌體133、氣單胞菌噬菌體65、噬藍藻體p-ssm2、噬藍藻體pssm4、噬藍藻體s-pm2、rb32、弧菌噬菌體nt-1、rb16、rb43,和rb49。在某些實施方案中,重組酶是衍生自肌病毒科噬菌體的uvsx或uvsx樣重組酶,如例如t2、rb14、氣單胞菌噬菌體25、phi-1、噬菌體31、噬菌體44rr2.8t、噬菌體rb3、和噬菌體lz2。對于本領(lǐng)域技術(shù)人員來說顯而易見的是,其他重組酶蛋白可以用于本文呈現(xiàn)的實施方案中。如下面更詳細描述的,可以使用許多本領(lǐng)域已知的方法(如例如blast比對)通過與uvsx的同源性來鑒定適合的重組酶蛋白。
“功能等同”意指對照重組酶(在使用完全不同重組酶的研究的情況下)將包含被認為在酶中具有相同的功能作用的其他重組酶的氨基酸位置處發(fā)生的氨基酸取代。作為一個例子,t4uvsx中位置257從苯丙氨酸到賴氨酸(f257k)的突變將與rb49uvsx中位置256從脯氨酸到賴氨酸(p256k)的取代是功能等同的。
通常在兩種或更多種不同重組酶中的功能等同取代突變發(fā)生在重組酶的氨基酸序列中的同源氨基酸位置。因此,本文使用術(shù)語“功能等同”也包含與給定突變“位置上等同”或“同源”的突變,而不考慮突變氨基酸的特定功能是否已知??梢曰谛蛄斜葘?或分子建模(modelling)來鑒定兩個或更多個不同重組酶的氨基酸序列中的位置等同或同源的氨基酸殘基。圖1中列出了鑒定位置等同和/或功能等同殘基的序列比對的實例,所述圖1列出了來自以下的uvsx氨基酸序列的比對:腸桿菌噬菌體t4(t4)(seqidno:8)、腸桿菌噬菌體t6(t6)(seqidno:9)、不動桿菌噬菌體133(噬菌體133)(seqidno:10)、腸桿菌噬菌體rb69(rb69)(seqidno:11)、氣單胞菌噬菌體aeh1(aeh1)(seqidno:12)、氣單胞菌噬菌體65(ae65)(seqidno:13)、弧菌噬菌體kvp40(kvp40)(seqidno:14)、腸桿菌噬菌體rb43(rb43)(seqidno:15)、原綠球菌噬菌體p-ssm2(pssm2)(seqidno:16),和原綠球菌噬菌體p-ssm4(pssm4)(seqidno:17),如也在us2009/0029421的并入材料中闡述。圖1所示的uvsx序列獲自genbank數(shù)據(jù)庫登錄號np_049656(t4),yp_004300647(噬菌體133);np_861734(rb69);np_943894.1(aeh1);yp_004300858(ae65);np_899256(kvp40);yp_239013(rb43);yp_214417(p-ssm2);yp_214708(p-ssm4);以及來自us公開號2009/0029421(t6)。
圖2是示意圖,其示出了來自腸桿菌噬菌體rb49(rb49)(seqidno:1)和腸桿菌噬菌體t4(t4)(seqidno:8)的uvsx氨基酸序列的比對。突出顯示了位置上和/或功能上等同于rb49uvsx氨基酸序列中pro256的殘基,并由三角形符號表示。示于圖2的uvsx序列獲得自genbank數(shù)據(jù)庫登錄號np_891595(rb49)和np_049656(t4)。
位置上等同和/或功能上等同的殘基可以通過將那些序列與參考序列(例如t4和rb49)的序列進行比對來對任何數(shù)量的其他uvsx序列中的一個或多個測定。作為非限制性的示例,來自聚球藻(synechococcus)噬菌體s-pm2、腸桿菌噬菌體rb32、弧菌噬菌體nt-1、腸桿菌噬菌體rb16的uvsx序列如seqidnos:18-21所列,并獲得自genbank數(shù)據(jù)庫登錄號yp_195169.1;yp_802982.1;yp_008125207.1;yp_003858336.1,其可以與參考uvsx序列如t4uvsx(seqidno:8)和rb49uvsx(seqidno:1)比對,并且鑒定了位置上等同和/或功能上等同的殘基。例如,示于下表的殘基被鑒定為與rb49uvsx氨基酸序列中pro256在位置上等同和/或功能上等同。本領(lǐng)域技術(shù)人員將容易理解,其他uvsx蛋白的位置上等同和/或功能上等同的位置可以按照以下類似的方法來確定。
上文描述的重組uvsx蛋白可以包含已知增強重組酶活性、穩(wěn)定性或任何其它所需性質(zhì)的一個或多個方面的其它取代突變。例如,在一些實施方案中,除了上述任何突變之外,重組uvsx還可包含與rb49uvsx氨基酸序列中his63功能上等同的位置的取代突變,如本領(lǐng)域已知并以us2009/0029421的披露為例,其通過引用以其整體并入。例如,在某些實施方案中,重組uvsx包含與rb49uvsx氨基酸序列中his63ser同源的取代突變。
在一些實施方案中,除了以上任何突變之外,與野生型重組酶相比,重組uvsx可包含額外的取代、缺失和/或添加突變??梢栽谖恢玫囊粋€或多個處進行多種取代突變中的任一種,如本領(lǐng)域已知并以2009/0029421的并入材料示例。例如,在一些實施方案中,除以上突變外,重組uvsx還可包含選自下組的突變:在c末端添加一個或多個谷氨酸殘基;在c末端添加一個或多個天冬氨酸殘基;及其組合。
使重組酶突變
在本公開中任選使用各種類型的誘變,例如修飾重組酶以產(chǎn)生變體,如根據(jù)重組酶模型和模型預(yù)測,或使用隨機或半隨機突變方法。通常,任何可用的誘變程序可用于制備重組酶突變體。此類誘變程序任選地包括對突變體核酸和多肽選擇感興趣的一種或多種活性(如,在固體支持物上的增強的接種和/或擴增)??梢允褂玫某绦虬ǖ幌抻冢憾c誘變(site-directedpointmutagenesis)、隨機點誘變、體外或體內(nèi)同源重組(dna改組和組合重疊pcr)、使用含尿嘧啶的模板進行誘變、寡核苷酸指導(dǎo)的誘變(oligonucleotide-directedmutagenesis)、硫代磷酸酯修飾的dna誘變、使用有缺口的雙鏈體dna進行誘變、點錯配修復(fù)、使用修復(fù)缺陷宿主菌株的誘變、限制性選擇和限制性純化、缺失誘變、全基因合成誘變(mutagenesisbytotalgenesynthesis)、簡并pcr、雙鏈斷裂修復(fù),以及技術(shù)人員已知的許多其他方法。用于突變的起始重組酶可以是本文所述的任何一種,包括可用重組酶突變體,如那些在例如us2009/0029421中鑒定的,其通過引用以其整體并入本文。
任選地,誘變可以通過來自天然存在的重組酶分子,或已知改變的或突變的重組酶(如使用如先前參考文獻中所述的現(xiàn)有突變體重組酶)的已知信息,如序列、序列比對、物理特性、晶體結(jié)構(gòu)和/或等引導(dǎo),如上所述。然而,在另一類實施方案中,修飾可以是基本上隨機的(如作為經(jīng)典或"家族"dna改組,例如參見cramerietal.(1998)"dnashufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"nature391:288-291)。
關(guān)于突變形式(formats)的額外信息可參見:sambrook等人,molecularcloning--alaboratorymanual(3rded.),vol.1-3,coldspringharborlaboratory,coldspringharbor,n.y.,2000("sambrook");currentprotocolsinmolecularbiology,f.m.ausubel等人,eds.,currentprotocols,ajointventurebetweengreenepublishingassociates,inc.andjohnwiley&sons,inc.,(通過2011補入)("ausubel"))和pcrprotocolsaguidetomethodsandapplications(innis等人編)academicpressinc.sandiego,calif.(1990)("innis")。以下引用的出版物和參考文獻提供了關(guān)于突變形式的額外細節(jié):arnold,proteinengineeringforunusualenvironments,currentopinioninbiotechnology4:450-455(1993);bass等人,mutanttrprepressorswithnewdna-bindingspecificities,science242:240-245(1988);bordoandargos(1991)suggestionsfor"safe"residuesubstitutionsinsite-directedmutagenesis217:721-729;botstein&shortle,strategiesandapplicationsofinvitromutagenesis,science229:1193-1201(1985);carter等人,improvedoligonucleotidesite-directedmutagenesisusingm13vectors,nucl.acidsres.13:4431-4443(1985);carter,site-directedmutagenesis,biochem.j.237:1-7(1986);carter,improvedoligonucleotide-directedmutagenesisusingm13vectors,methodsinenzymol.154:382-403(1987);dale等人,oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod,methodsmol.biol.57:369-374(1996);eghtedarzadeh&henikoff,useofoligonucleotidestogeneratelargedeletions,nucl.acidsres.14:5115(1986);fritz等人,oligonucleotide-directedconstructionofmutations:agappedduplexdnaprocedurewithoutenzymaticreactionsinvitro,nucl.acidsres.16:6987-6999(1988);grundstrom等人,oligonucleotide-directedmutagenesisbymicroscale`shot-gun`genesynthesis,nucl.acidsres.13:3305-3316(1985);hayes(2002)combiningcomputationalandexperimentalscreeningforrapidoptimizationofproteinpropertiespnas99(25)15926-15931;kunkel,theefficiencyofoligonucleotidedirectedmutagenesis,innucleicacids&molecularbiology(eckstein,f.andlilley,d.m.j.eds.,springerverlag,berlin))(1987);kunkel,rapidandefficientsite-specificmutagenesiswithoutphenotypicselection,proc.natl.acad.sci.usa82:488-492(1985);kunkel等人,rapidandefficientsite-specificmutagenesiswithoutphenotypicselection,methodsinenzymol.154,367-382(1987);kramer等人,thegappedduplexdnaapproachtooligonucleotide-directedmutationconstruction,nucl.acidsres.12:9441-9456(1984);kramer&fritzoligonucleotide-directedconstructionofmutationsviagappedduplexdna,methodsinenzymol.154:350-367(1987);kramer等人,pointmismatchrepair,cell38:879-887(1984);kramer等人,improvedenzymaticinvitroreactionsinthegappedduplexdnaapproachtooligonucleotide-directedconstructionofmutations,nucl.acidsres.16:7207(1988);ling等人,approachestodnamutagenesis:anoverview,analbiochem.254(2):157-178(1997);lorimerandpastannucleicacidsres.23,3067-8(1995);mandecki,oligonucleotide-directeddouble-strandbreakrepairinplasmidsofescherichiacoli:amethodforsite-specificmutagenesis,proc.natl.acad.sci.usa,83:7177-7181(1986);nakamaye&eckstein,inhibitionofrestrictionendonucleasenciicleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis,nucl.acidsres.14:9679-9698(1986);nambiar等人,totalsynthesisandcloningofagenecodingfortheribonucleasesprotein,science223:1299-1301(1984);sakamarandkhorana,totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin),nucl.acidsres.14:6361-6372(1988);sayers等人,y-texonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis,nucl.acidsres.16:791-802(1988);sayers等人,strandspecificcleavageofphosphorothioate-containingdnabyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide,(1988)nucl.acidsres.16:803-814;sieber等人,naturebiotechnology,19:456-460(2001);smith,invitromutagenesis,ann.rev.genet.19:423-462(1985);methodsinenzymol.100:468-500(1983);methodsinenzymol.154:329-350(1987);stemmer,nature370,389-91(1994);taylor等人,theuseofphosphorothioate-modifieddnainrestrictionenzymereactionstopreparenickeddna,nucl.acidsres.13:8749-8764(1985);taylor等人,therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifieddna,nucl.acidsres.13:8765-8787(1985);well等人,importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin,phil.trans.r.soc.lond.a317:415-423(1986);well等人,cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites,gene34:315-323(1985);zoller&smith,oligonucleotide-directedmutagenesisusingm13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanydnafragment,nucleicacidsres.10:6487-6500(1982);zoller&smith,oligonucleotide-directedmutagenesisofdnafragmentsclonedintom13vectors,methodsinenzymol.100:468-500(1983);zoller&smith,oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandeddnatemplate,methodsinenzymol.154:329-350(1987);clackson等人(1991)"makingantibodyfragmentsusingphagedisplaylibraries"nature352:624-628;gibbsetal.(2001)"degenerateoligonucleotidegeneshuffling(dogs):amethodforenhancingthefrequencyofrecombinationwithfamilyshuffling"gene271:13-20;和hiragaandarnold(2003)"generalmethodforsequence-independentsite-directedchimeragenesis:j.mol.biol.330:287-296。許多以上方法的額外細節(jié)可以在methodsinenzymologyvolume154中找到,該文獻也描述了用于各種誘變方法的故障查找問題的有用控制。
制備和分離重組的重組酶
通常,編碼如本文呈現(xiàn)的重組酶的核酸可通過以下方法制備:克隆、重組、體外合成、體外擴增和/或其他可用方法。多種重組方法可用于表達編碼本文呈現(xiàn)的重組酶的表達載體。制備重組核酸、表達和分離表達產(chǎn)物的方法是公知的并描述于現(xiàn)有技術(shù)中。本文描述了多個示例性的突變和突變的組合,以及用于設(shè)計所期望突變的策略。
突變、重組和體外核酸操作方法(包括克隆、表達、pcr等)的其他有用參考文獻包括:bergerandkimmel,guidetomolecularcloningtechniques,methodsinenzymologyvolume152academicpress,inc.,sandiego,calif.(berger);kaufman等人(2003)handbookofmolecularandcellularmethodsinbiologyandmedicinesecondeditionceske(編)crcpress(kaufman);和thenucleicacidprotocolshandbookralphrapley(編)(2000)coldspringharbor,humanapressinc(rapley);chen等人(編)pcrcloningprotocols,secondedition(methodsinmolecularbiology,volume192)humanapress;和在viljoen等人(2005)moleculardiagnosticpcrhandbookspringer,isbn1402034032。
此外,商業(yè)上可獲得用于從細胞純化質(zhì)粒和其他相關(guān)核酸的多種試劑盒(例如參見easyprep.tm.,flexiprep.tm.兩者來自pharmaciabiotech;來自stratagene的strataclean.tm.;和來自qiagen的qiaprep.tm.)??蛇M一步操作任何分離的和/或純化的核酸以產(chǎn)生其他核酸,用于轉(zhuǎn)染細胞、整合入相關(guān)載體以感染生物體用于表達和/或等等。典型的克隆載體含有轉(zhuǎn)錄和翻譯終止子、轉(zhuǎn)錄和翻譯起始序列,以及可用于調(diào)節(jié)特定靶核酸表達的啟動子。載體任選地包含通用表達盒,該表達盒包含至少一個獨立終止子序列、允許盒在真核生物,或原核生物,或兩者中復(fù)制的序列(如穿梭載體),和用于原核和真核系統(tǒng)兩者的選擇標(biāo)記物。載體適用于原核生物,真核生物或兩者的復(fù)制和整合。
其他有用的參考文獻(例如用于分離和培養(yǎng)細胞(例如用于后續(xù)核酸分離))包括freshney(1994)cultureofanimalcells,amanualofbasictechnique,thirdedition,wiley-liss,newyork及其所引用的參考文獻;payneetal.(1992)plantcellandtissuecultureinliquidsystemsjohnwiley&sons,inc.newyork,n.y.;gamborgandphillips(編)(1995)plantcell,tissueandorganculture;fundamentalmethodsspringerlabmanual,springer-verlag(berlinheidelbergnewyork)以及atlasandparks(編)thehandbookofmicrobiologicalmedia(1993)crcpress,bocaraton,fla。
編碼本文公開的重組重組酶的核酸也是本文所呈現(xiàn)的實施方案的特征。特定的氨基酸可以由多個密碼子編碼,并且某些翻譯系統(tǒng)(例如原核或真核細胞)通常表現(xiàn)出密碼子偏好,例如不同的生物體往往偏好編碼相同氨基酸的幾個同義密碼子之一。因此,本文呈現(xiàn)的核酸可任選地“密碼子優(yōu)化”,這意味著合成核酸以包括密碼子,該密碼子為用于表達表達重組酶的特定翻譯系統(tǒng)所偏好。例如,當(dāng)需要在細菌細胞(或甚至是特定的細菌菌株)中表達重組酶時,可以合成核酸以包括在該細菌細胞的基因組中最常見的密碼子,用于有效表達重組酶。當(dāng)希望在真核細胞中表達重組酶時,可以采用類似的策略,例如核酸可以包括真核細胞所偏好的密碼子。
已知多種蛋白分離和檢測方法,并且所述方法可用于分離重組酶(例如從表達本文呈現(xiàn)的重組的重組酶的重組細胞培養(yǎng)物中分離)。多種分離和檢測蛋白的方法在本領(lǐng)域中是公知的,包括,如下中列出的那些方法:r.scopes,proteinpurification,springer-verlag,n.y.(1982);deutscher,methodsinenzymologyvol.182:guidetoproteinpurification,academicpress,inc.n.y.(1990);sandana(1997)bioseparationofproteins,academicpress,inc.;bollag等人(1996)proteinmethods,2.sup.ndeditionwiley-liss,ny;walker(1996)theproteinprotocolshandbookhumanapress,nj,harrisandangal(1990)proteinpurificationapplications:apracticalapproachirlpressatoxford,oxford,england;harrisandangalproteinpurificationmethods:apracticalapproachirlpressatoxford,oxford,england;scopes(1993)proteinpurification:principlesandpractice3.sup.rdeditionspringerverlag,ny;jansonandryden(1998)proteinpurification:principles,highresolutionmethodsandapplications,secondeditionwiley-vch,ny;以及walker(1998)proteinprotocolsoncd-romhumanapress,nj;以及其中所引用的參考文獻。關(guān)于蛋白質(zhì)純化和檢測方法的其他細節(jié)可以在satinderahuja編,handbookofbioseparations,academicpress(2000)中找到。
使用方法
本文呈現(xiàn)的改變的重組酶可用于重組酶介導(dǎo)的擴增程序,如重組酶聚合酶擴增(rpa)技術(shù)。簡單來說,可以通過使靶核酸與重組酶和對靶核酸分子特異性的單鏈核酸引物接觸來引發(fā)rpa。然后,可以通過聚合酶,如在dntp的存在下能夠鏈置換以產(chǎn)生雙鏈靶核酸分子和核酸分子的置換鏈的聚合酶延長雜交的引物。進一步擴增可以通過重組酶介導(dǎo)的引物靶向至核酸分子的置換鏈以及引物的延伸以產(chǎn)生雙鏈核酸分子來實現(xiàn)??赏ㄟ^將上述組分與例如重組酶加載因子(recombinase-loadingfactors)、特異性鏈置換聚合酶以及強健的(robust)能量再生系統(tǒng)的組合調(diào)控rpa程序。可以容易地適用于與本公開的重組uvsx蛋白一起使用的示例性rpa程序、系統(tǒng)和組分記載于例如us專利號8,071,308;7,399,590,7,485,428,7,270,981,8,030,000,7,666,598,7,763,427,8,017,399,8,062,850,和7,435,561,其各自通過引用并入本文。
在一些實施方案中,可以使用動力學(xué)排除擴增(kineticexclusionamplification)(kea)(其也稱為排除擴增(examp))來進行等溫擴增??梢允褂美脛恿W(xué)排除的方法制備本公開的核酸文庫。當(dāng)過程以足夠快的速率發(fā)生以有效地排除另一種事件或過程發(fā)生時,可以發(fā)生動力學(xué)排除。舉例來說,制備核酸陣列,其中將來自溶液的靶核酸隨機接種到陣列的位點,并在擴增過程中產(chǎn)生靶核酸的拷貝,以對每個接種位點填充容量(capacity)。根據(jù)本公開的動力學(xué)排除方法,接種和擴增步驟可以在擴增速率超過接種速率的條件下同時進行。因此,在已經(jīng)由第一靶核酸接種的位點制備拷貝的相對較快的速率將有效地將第二核酸排除在接種擴增位點外。動力學(xué)排除擴增方法可以如us申請公開no.2013/0338042公開內(nèi)容中詳細描述的那樣進行,其通過引用以其整體并入本文。
在一些實施方案中,擴增的靶核酸是完全雙鏈的。在一些實施方案中,擴增的靶核酸包含雙鏈核酸的區(qū)域,并且還包含具有單鏈核酸的區(qū)域。在某些實施方案中,靶核酸包含一個或多個叉狀銜接頭,其在文庫片段的每個末端具有約5,10,15,20,25,30,35,40或超過約40個堿基的單鏈序列的區(qū)域。叉狀銜接頭的設(shè)計和使用更為詳細地描述于美國專利號7,742,463和8,563,748的公開中,其通過引用以其整體并入本文。
動力學(xué)排除可以利用用于制備靶核酸的第一拷貝的相對緩慢的速率對用于制備靶核酸或第一拷貝的后續(xù)拷貝的相對快的速率。在上一段的例子中,動力學(xué)排除由于以下而發(fā)生:靶核酸接種的相對緩慢的速率(例如,相對緩慢的擴散或轉(zhuǎn)運)對發(fā)生擴增以填充具有核酸種子的拷貝的位點的相對快速速率。在另一個示例性的實施方案中,動力學(xué)排除可以由于以下而發(fā)生:已經(jīng)接種位點的靶序列的第一拷貝的形成延遲(例如延遲或緩慢活化)對制備后續(xù)拷貝以填充位點的相對快速速率。在該實例中,單個位點可能已經(jīng)接種了幾種不同的靶核酸(例如,幾個靶核酸可以在擴增前在每個位點存在)。然而,可以隨機激活用于任何給定靶核酸的第一拷貝形成,使得第一拷貝形成的平均速率相較于生成隨后拷貝的速率而言是相對緩慢的。在這種情況下,盡管單個位點可能已經(jīng)接種了幾種不同的靶核酸,動力學(xué)排除將僅允許擴增那些靶核酸之一。更為具體地,一旦第一靶核酸已經(jīng)被激活用于擴增,所述位點將用其拷貝迅速填充容量,從而防止在該位點產(chǎn)生第二靶核酸的拷貝。
擴增試劑可以包括促進擴增子形成,并且在某些情況下增加擴增子形成的速率的其它成分。重組酶(如例如uvsx)可以通過允許重復(fù)入侵/延伸來促進擴增子形成。更為具體地,重組酶可以促進聚合酶對靶核酸的侵入和通過聚合酶使用靶核酸作為擴增子形成的模板延伸引物。該過程可以作為鎖式反應(yīng)重復(fù),其中從每輪入侵/延伸產(chǎn)生的擴增子在隨后的一輪中充當(dāng)模板。由于不需要變性循環(huán)(如經(jīng)由加熱或化學(xué)變性),過程可以比標(biāo)準(zhǔn)pcr更為快速發(fā)生。因此,可以等溫進行重組酶促進的擴增。通常期望在重組酶促進的擴增試劑中包括atp或其他核苷酸(或在一些情況下為其不可水解的類似物)以促進擴增。重組酶和單鏈結(jié)合(ssb)蛋白的混合物特別有用,因為ssb可進一步促進擴增。用于重組酶促進的擴增的示例性的配制劑包括那些市售的配制劑,如twistdx的twistamp試劑盒(cambridge,uk)。重組酶促進擴增試劑的有用組分以及反應(yīng)條件列于us5,223,414和us7,399,590中,每個通過引用并入本文。
序列比對、同一性和同源性
術(shù)語“相同的”或“百分比同一性”,在兩個或更多個核酸或多肽序列的語境中,是指在為了最大對應(yīng)性而比較和比對時,相同的兩個或更多個序列或亞序列或者具有相同的氨基酸殘基或核苷酸的規(guī)定百分比,如使用下文描述的序列比較算法之一(或技術(shù)人員可用的其他算法)或通過視覺檢查測量的。
短語“實質(zhì)上相同”,在兩個核酸或多肽(如編碼重組酶的dna或重組酶的氨基酸序列)的語境中,是指為了最大對應(yīng)性而比較和比對時具有至少60%,約80%、約90-95%、約98%、約99%或更多的核苷酸或氨基酸殘基同一性的兩個或更多個序列或亞序列,如使用序列比較算法或通過視覺檢查測量。通常認為所述“實質(zhì)性相同”序列是“同源的”,而不參考實際的祖先。優(yōu)選地,“實質(zhì)性同一性”存在于長度為至少大約50個殘基的序列的區(qū)域里,更優(yōu)選地在至少大約100個殘基的區(qū)域里,以及最優(yōu)選地,該序列在至少大約150個殘基里或在要比較的序列的全長里實質(zhì)上相同。
當(dāng)?shù)鞍踪|(zhì)和/或蛋白質(zhì)序列天然地或人工地衍生自共同的祖先蛋白質(zhì)或蛋白質(zhì)序列時,它們是“同源的”。類似地,當(dāng)核酸和/或核酸序列天然地或人工地衍生自共同的祖先核酸或核酸序列時,它們是同源的。同源性通常由兩個或更多個核酸或蛋白質(zhì)(或其序列)之間的序列相似度推斷。可用于建立同源性的序列之間相似度的精確百分比隨討論的核酸和蛋白質(zhì)而變化,但常規(guī)地使用超過50,100,150或更多殘基至少25%的序列相似度建立同源性。較高水平的序列相似度(如30%,40%,50%,60%,70%,80%,90%,95%,或99%或更高)也可用于建立同源性。用于確定序列相似度百分比的方法(如使用默認參數(shù)的blastp和blastn)在本文中描述并且是通常可獲得的。
對于序列比對和同源性確定,通常一個序列作用為比較測試序列的參考序列。當(dāng)使用序列比較算法時,測試和參考序列被輸入到計算機中,指定子序列坐標(biāo)(如果必要),并且指定序列算法程序參數(shù)。然后,序列比較算法基于指定的程序參數(shù)來計算測試序列相對于參考序列的百分比序列同一性。
可以進行用于比較的最佳序列比對,例如通過smith&waterman,adv.appl.math.2:482(1981)的局部同源性算法,通過needleman&wunsch,j.mol.biol.48:443(1970)的同源比對算法,通過pearson&lipman,proc.nat'l.acad.sci.usa85:2444(1988)的尋找相似度方法,對這些算法的計算機化實現(xiàn)(在wisconsingenetics軟件包中的gap,bestfit,fasta,和tfasta,geneticscomputergroup,575sciencedr.,madison,wis.),或通過視覺檢查(一般參見currentprotocolsinmolecularbiology,ausubel等人編,currentprotocols,ajointventurebetweengreenepublishingassociates,inc.andjohnwiley&sons,inc.,到2004年補充)。
適合于測定百分比序列同一性和序列相似度的算法的一個實例為blast算法,其描述于altschul等人,j.mol.biol.215:403-410(1990)中。進行blast分析的軟件可通過nationalcenterforbiotechnologyinformation公開獲得。這個算法包括首先通過鑒定詢問序列中的w長度的短詞來鑒定高得分序列對(hsp),所述詢問序列當(dāng)與數(shù)據(jù)庫序列中相同長度的詞比對時匹配或滿足正值閾值得分t。t是指臨近詞得分閾值(altschul等人,如上)。這些最初的臨近詞命中作用為啟動搜索以尋找更長的包含它們的hsp。詞命中然后在兩個方向上沿著每個序列延伸,遠到可增加累積比對得分。對于核苷酸序列,累積得分以m參數(shù)(一對匹配殘基的獎勵得分;總是大于0)和n(不匹配殘基的懲罰得分;總是小于0)來計算。對于氨基酸序列,用得分矩陣來計算累計得分。當(dāng)下述情況時停止每個方向上的詞命中的延伸:累積比對得分從其所達到的最大值下降數(shù)量x;由于一個或多個負得分殘基比對的積累,累積得分到達零或以下;或者,達到任何一個序列的末端。blast算法參數(shù)w,t和x決定了比對的敏感性和速度。blastn程序(對核苷酸序列來說)使用詞長度(w)為11,期望值(e)為10,截留為100,m=5,n=-4,以及對兩條鏈的比較作為默認。對于氨基酸序列,blastp程序使用詞長度(w)為3,期望值(e)為10以及blosum62得分矩陣作為默認(參見henikoff&henikoff(1989)proc.natl.acad.sci.usa89:10915)。
除了計算序列同一性百分比,blast算法也進行兩個序列間相似度的統(tǒng)計學(xué)分析(參見例如,karlin&altschul,proc.nat'l.acad.sci.usa90:5873-5787(1993))。blast算法所提供的相似度的一種測量為最小總概率(smallestsumprobability)(p(n)),其提供了兩個核苷酸或氨基酸序列之間的匹配偶然發(fā)生的概率的指示。例如,當(dāng)測試核酸與參考核酸的比較中的最小總概率小于大約0.1,更優(yōu)選地小于大約0.01,最優(yōu)選地小于大約0.001時,此核酸被認為是與參考序列相似。
編碼改變的重組酶的核酸
本文還呈現(xiàn)的是編碼本文呈現(xiàn)的改變的重組酶的核酸分子。對于任意給定的改變的重組酶(其是已知氨基酸序列以及優(yōu)選地還有編碼重組酶的野生型核苷酸序列的重組酶的突變形式),可以根據(jù)分子生物學(xué)的基本原理獲得編碼突變體的核苷酸序列。例如,鑒于編碼rb49uvsx重組酶的野生型核苷酸序列是已知的,可以使用標(biāo)準(zhǔn)遺傳密碼推斷編碼具有一個或多個氨基酸取代的任何給定的突變型rb49uvsx的核苷酸序列。類似地,可以容易地衍生核苷酸序列,用于其他重組酶的突變體形式,如例如t4、t6、rb69、aeh1、kvp40、不動桿菌噬菌體133、氣單胞菌噬菌體65、噬藍藻體p-ssm2、噬藍藻體pssm4、噬藍藻體s-pm2、rb32、弧菌噬菌體nt-1、rb16、rb43、t2、rb14、氣單胞菌噬菌體25、phi-1、噬菌體31、噬菌體44rr2.8t,噬菌體rb3,和噬菌體lz2等。然后可以使用本領(lǐng)域已知的標(biāo)準(zhǔn)分子生物學(xué)技術(shù)構(gòu)建具有所需核苷酸序列的核酸分子。
根據(jù)本文呈現(xiàn)的實施方式,定義的核酸不僅包括相同的核酸,而且還包括任何次要的堿基變異,包括特別是在由于保守氨基酸取代中的簡并密碼子而導(dǎo)致同義密碼子的情況下的取代(規(guī)定相同氨基酸殘基的不同密碼子)。術(shù)語“核酸序列”也包括與關(guān)于堿基變異給出的任何單鏈序列的互補序列。
有利地,本文所述的核酸也可以被包括在合適的表達載體中以在合適的宿主中表達從其編碼的重組酶蛋白。將克隆的dna摻入合適的表達載體中用于隨后轉(zhuǎn)化所述細胞并隨后選擇轉(zhuǎn)化的細胞是本領(lǐng)域技術(shù)人員熟知的,如提供于sambrook等人(1989),molecularcloning:alaboratorymanual,coldspringharborlaboratory中,其以其整體通過引用并入。
此類表達載體包括下述載體,其具有可操作地連接于調(diào)節(jié)序列的根據(jù)本文呈現(xiàn)的實施方案的核酸,所述調(diào)節(jié)序列能夠?qū)崿F(xiàn)所述dna片段的表達,如啟動子區(qū)域。術(shù)語“可操作地連接”是指并列位置,其中所描述的組件處于允許它們以其預(yù)期方式發(fā)揮作用的關(guān)系中。可以將此類載體轉(zhuǎn)化到合適的宿主細胞中以提供根據(jù)本文呈現(xiàn)的實施方案的蛋白質(zhì)表達。
核酸分子可以編碼成熟蛋白或具有原序列(prosequence)的蛋白,包括編碼在前蛋白上的前導(dǎo)序列的,所述前蛋白然后由宿主細胞切割以形成成熟蛋白。載體可以是(例如)提供有復(fù)制起點,以及任選地用于表達所述核苷酸的啟動子和任選地啟動子的調(diào)節(jié)子的質(zhì)粒、病毒或噬菌體。載體可以含有一個或多個選擇性標(biāo)記物,如例如抗生素抗性基因。
表達所需的調(diào)控元件包括啟動子序列以結(jié)合rna聚合酶并以引導(dǎo)適當(dāng)水平的轉(zhuǎn)錄起始以及還包括用于核糖體結(jié)合的翻譯起始序列。例如,細菌表達載體可以包括啟動子,如lac啟動子和用于翻譯起始,shine-dalgarno序列,以及起始密碼子aug。類似地,真核表達載體可以包括對于rna聚合酶ii的異源或同源啟動子、下游聚腺苷酸化信號、啟動密碼子aug,和用于核糖體分離的終止密碼子。此類載體可以商業(yè)獲得或由本領(lǐng)域公知的方法描述的序列組裝。
可以通過在載體中包含增強子序列來優(yōu)化由高等真核生物的編碼重組酶的dna的轉(zhuǎn)錄。增強子是作用于啟動子以提高轉(zhuǎn)錄水平的dna的順式作用元件。除了可選擇的標(biāo)記物之外,載體通常還包括復(fù)制起點。
實施例
實施例1
本實施例提供了在模式化流動池表面接種無pcr文庫用于改善的簇擴增的方法。在一個實施方案中,本發(fā)明的方法使用接種制劑,其包括包含上述突變的uvsx,例如包含pro256lys的rb49uvsx(如本文中意以seqidno:2所示,本文稱為“rb49p256k”)。令人驚訝地發(fā)現(xiàn),使用其進行的重組酶介導(dǎo)的擴增實質(zhì)性改善了將具有單鏈銜接頭區(qū)的pcr文庫接種到模式化流動池表面上。在另一個實施方案中,本發(fā)明的方法使用接種制劑,其包括相對高濃度的dna聚合酶(例如ebsu聚合酶)與rb49p256k重組酶的組合。
為了評估rb49p256k制劑在將無pcr文庫接種到模式化流動池表面上的功效,使用
圖3a示出了使用含t4uvsx重組酶(如本文中以seqidno:8所示,本文稱為“t4uvsx”)的標(biāo)準(zhǔn)制劑接種到模式化流動池上的無pcr文庫的簇圖像的截圖100。圖3b示出了使用包含rb49p256k重組酶的液體制劑接種到模式化流動池上的無pcr文庫的簇圖像的截圖150。在該實施例中,將t4uvsx制劑或rb49p256k制劑與文庫混合至100pm終濃度,沖到流動池上,并在cbot上于38℃下孵育。在1小時的孵育期后,將溫度降至20℃并且用ht2洗滌緩沖液(illumina)洗滌流動池。用0.1mtris/0.1m抗壞血酸鈉中的
圖4a示出了使用標(biāo)準(zhǔn)t4uvsx制劑接種到模式化流動池上的單鏈(ssdna)無pcr文庫的簇圖像的截圖200。圖4b示出了使用包含rb49p256k重組酶的液體制劑接種到模式化流動池上的單鏈無pcr文庫的簇圖像的截圖250。在該實施例中,使用naoh變性雙鏈無pcr文庫并隨后在50pm的濃度下接種到模式化流動池上。參見圖4a,通過用標(biāo)準(zhǔn)制劑(如t4uvsx)將ssdna,無pcr文庫接種到模式化流動池上所生成的簇濃度是相對稀疏的。參見圖4b,通過使用包含rb49p256k重組酶的制劑將ssdna無pcr文庫接種到模式化流動池上所生成的簇濃度是顯著改善的。
實施例2
使用rb49p256k突變體的改善的擴增
本實施例描述了本文所述的具有和不具有p256k突變的重組酶之間的擴增性能的比較。為了本實施例的目的,“對照”rb49uvsx(如seqidno:1所示)還包含h63s突變。通過進一步突變該對照以在位置256處攜帶lys殘基而產(chǎn)生p256k突變體,如seqidno:2所示。
如上文實施例1所述,在cbot上使用對照或p256k突變體進行模式化流動池上的無pcr文庫的成簇(clustering)。然后,在hiseq裝置(illumina,inc.)上進行測序,并且分析測序結(jié)果以確定通常在以前的測序數(shù)據(jù)中呈現(xiàn)較差的多個區(qū)域的可呼叫性(callability)。
可呼叫性是正確呼叫單核苷酸多態(tài)性(snp)的位點的分?jǐn)?shù)的測量。理想情況下,此值為1(即100%),意味著在特定類型區(qū)域(即高gc等)內(nèi)的100%位點,正確呼叫snp。覆蓋率是具有覆蓋率>n的位點分?jǐn)?shù)的測量,其中n通常是30x(即人類基因組的標(biāo)準(zhǔn)覆蓋率)。fosmid啟動子是一組100個基因啟動子,其在先前的測序數(shù)據(jù)中被鑒定為呈現(xiàn)較差的。將啟動子克隆入fosmid載體中。高gc區(qū)域可以定義為具有至少100bp的區(qū)域,其中g(shù)c含量等于或超過75%(n50(g+c≥0.75)100n50)。大量gc的區(qū)域可以定義為具有至少100bp的gc,其中g(shù)c含量等于或大于85%(n50(g+c≥0.85)100n50)。低gc區(qū)域可以定義為至少100bp的區(qū)域,其中g(shù)c含量等于或小于40%(n50(g+c≥0.40)100n50)。高at區(qū)可以被定義為具有至少100bp的區(qū)域,其中at含量等于或超過75%(n50(a+t≥0.75)100n50),下采樣至約50k區(qū)域??梢詫⒋罅縜t的區(qū)域定義為具有至少100bp的區(qū)域,其中at含量等于或大于85%(n50(a+t≥0.85)100n50),下采樣至約50k區(qū)域。at二核苷酸重復(fù)區(qū)可以被定義為包括長的atat重復(fù)延伸的區(qū)域。
對于對照與p256k突變體的可呼叫性比較表明與對照相比,p256k突變體在fosmid啟動子區(qū)域、高gc、大量gc、低gc、高at、大量at,和at二核苷酸重復(fù)區(qū)的一個或多個中顯示了出乎預(yù)料的且顯著的改善。
實施例3
使用具有與p256k同源的突變的突變體的改善擴增
對于其他重組酶,重復(fù)上文在實施例2中所述的性能比較。在本實施例中,通過修飾野生型重組酶以包含與rb49中的h63s同源的突變來產(chǎn)生“對照”重組酶,如在下表的“對照”欄列出。通過進一步修飾對照以攜帶與rb49中p256k同源的突變來產(chǎn)生“p256k同系物”突變體,如在下表的“p256k同系物”欄列出。
例如,對于t6uvsx,通過修飾野生型t6uvsx(seqidno:9)以攜帶h66s突變來生成對照。進一步修飾p256k同系物以攜帶h66s和f259k突變兩者。
使用對照或p256k突變體,如上文實施例1所述在cbot進行模式化流動池上的無pcr文庫的成簇(clustering)。然后,在hiseq儀(illumina,inc.)上進行測序,并且如實施例2中所述分析測序結(jié)果,以確定通常在先前測序數(shù)據(jù)中較差呈現(xiàn)的多種區(qū)域的可呼叫性。
對于對照與p256k同系物突變體的可呼叫性的比較表明與對照相比,p256k同系物突變體在fosmid啟動子區(qū)域、高gc、大量gc、低gc、高at、大量at,和at二核苷酸重復(fù)區(qū)的一個或多個中顯示出乎預(yù)料的且顯著的改善。
在本申請中,已經(jīng)引用了各種出版物,專利和/或?qū)@暾?。這些出版物的全部內(nèi)容通過引用并入本申請中。
術(shù)語“包括”旨在是開放式的,不僅包括列舉的元件,而且還包括任何另外的元件。
已經(jīng)描述了許多實施方案。然而,應(yīng)當(dāng)理解,可以進行各種修改。因此,其它實施方案在所附權(quán)利要求書的范圍內(nèi)。
序列表
<110>伊盧米納劍橋有限公司
kellinger,matthew
boutell,jonathan
<120>重組酶突變體
<130>ip-1264-prv
<160>35
<170>patentinversion3.5
<210>1
<211>356
<212>prt
<213>腸桿菌噬菌體rb49
<400>1
metservalleuglulysleulyslysasnserthrleulysthrthr
151015
alavalleuserlysserserphepheasnglulysthrasnthrarg
202530
thrlysileprometleuasnilealapheserglyaspleulyslys
354045
glypheglnserglyleuilephephealaglyproserlyshisphe
505560
lysserasnmetglyleuthrcysvalseralatyrmetlysglnasn
65707580
proaspalaalacysleuphepheaspserglupheglyilethrser
859095
alatyrleuglusermetglyvalaspproaspargvalvalhisval
100105110
proilelysasnileglugluleulysphegluilemetasnglnleu
115120125
gluglnilethrarggluasplysvalileilepheileaspserile
130135140
glyasnleualaserlyslysgluvalgluaspalaileasnglulys
145150155160
seralaglnaspmetthrargalalysalaleulysglyleuphearg
165170175
metvalthrprotyrleuthrmetasnaspileprocysilealaile
180185190
asnhisthrtyrgluthrglnglumetpheserlysthrvalmetser
195200205
glyglythrglyalamettyrseralaasngluvalpheileilegly
210215220
argargglnglnlysgluglythrgluilethrglytyrasppheile
225230235240
leuasnalaglulysserargthrvallysglulysserlysphepro
245250255
ileservalthrpheserglyglyileaspprotyrserglyleuleu
260265270
gluleualavalgluleuglytrpvalvallysproserasnglytrp
275280285
tyrserargserileleuasnthrgluthrglyglumetgluthrglu
290295300
gluarglyspheargalalysgluthrasnserilegluphetrplys
305310315320
proleuleuthrasnasplyspheasnglualaileasnasphistyr
325330335
lysleuglyglnvalileseraspglualavalasplysgluileglu
340345350
aspmetleuala
355
<210>2
<211>356
<212>prt
<213>腸桿菌噬菌體rb49
<400>2
metservalleuglulysleulyslysasnserthrleulysthrthr
151015
alavalleuserlysserserphepheasnglulysthrasnthrarg
202530
thrlysileprometleuasnilealapheserglyaspleulyslys
354045
glypheglnserglyleuilephephealaglyproserlysserphe
505560
lysserasnmetglyleuthrcysvalseralatyrmetlysglnasn
65707580
proaspalaalacysleuphepheaspserglupheglyilethrser
859095
alatyrleuglusermetglyvalaspproaspargvalvalhisval
100105110
proilelysasnileglugluleulysphegluilemetasnglnleu
115120125
gluglnilethrarggluasplysvalileilepheileaspserile
130135140
glyasnleualaserlyslysgluvalgluaspalaileasnglulys
145150155160
seralaglnaspmetthrargalalysalaleulysglyleuphearg
165170175
metvalthrprotyrleuthrmetasnaspileprocysilealaile
180185190
asnhisthrtyrgluthrglnglumetpheserlysthrvalmetser
195200205
glyglythrglyalamettyrseralaasngluvalpheileilegly
210215220
argargglnglnlysgluglythrgluilethrglytyrasppheile
225230235240
leuasnalaglulysserargthrvallysglulysserlysphelys
245250255
ileservalthrpheserglyglyileaspprotyrserglyleuleu
260265270
gluleualavalgluleuglytrpvalvallysproserasnglytrp
275280285
tyrserargserileleuasnthrgluthrglyglumetgluthrglu
290295300
gluarglyspheargalalysgluthrasnserilegluphetrplys
305310315320
proleuleuthrasnasplyspheasnglualaileasnasphistyr
325330335
lysleuglyglnvalileseraspglualavalasplysgluileglu
340345350
aspmetleuala
355
<210>3
<211>8
<212>prt
<213>人工序列
<220>
<223>半保守域
<400>3
lysglulysserlysphepheile
15
<210>4
<211>8
<212>prt
<213>人工序列
<220>
<223>半保守域
<400>4
lysglulysserlyspheproile
15
<210>5
<211>8
<212>prt
<213>人工序列
<220>
<223>半保守域
<220>
<221>變體
<222>(5)..(5)
<223>x=任何aa
<220>
<221>變體
<222>(7)..(7)
<223>x=任何aa
<400>5
lysglulysserxaaphexaaile
15
<210>6
<211>13
<212>prt
<213>人工序列
<220>
<223>半保守域
<220>
<221>變體
<222>(4)..(4)
<223>x=任何aa
<220>
<221>變體
<222>(5)..(5)
<223>x=任何aa
<220>
<221>變體
<222>(8)..(8)
<223>x=任何aa
<220>
<221>變體
<222>(9)..(9)
<223>x=任何aa
<220>
<221>變體
<222>(10)..(10)
<223>x=任何aa
<220>
<221>變體
<222>(11)..(11)
<223>x=任何aa
<220>
<221>變體
<222>(12)..(12)
<223>x=任何aa
<220>
<221>變體
<222>(13)..(13)
<223>x=任何aa
<400>6
lysserargxaaxaalysgluxaaxaaxaaxaaxaaxaa
1510
<210>7
<211>13
<212>prt
<213>人工序列
<220>
<223>半保守域
<400>7
lysserargthrvallysglulysserlysphepheile
1510
<210>8
<211>391
<212>prt
<213>腸桿菌噬菌體t4
<400>8
metseraspleulysserargleuilelysalaserthrserlysleu
151015
thralagluleuthralaserlysphepheasnglulysaspvalval
202530
argthrlysileprometmetasnilealaleuserglygluilethr
354045
glyglymetglnserglyleuleuileleualaglyproserlysser
505560
phelysserasnpheglyleuthrmetvalsersertyrmetarggln
65707580
tyrproaspalavalcysleuphetyraspserglupheglyilethr
859095
proalatyrleuargsermetglyvalaspprogluargvalilehis
100105110
thrprovalglnserleugluglnleuargileaspmetvalasngln
115120125
leuaspalailegluargglyglulysvalvalvalpheileaspser
130135140
leuglyasnleualaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysvalvalseraspmetthrargalalysthrmetlysserleuphe
165170175
argilevalthrprotyrpheserthrlysasnileprocysileala
180185190
ileasnhisthrtyrgluthrglnglumetpheserlysthrvalmet
195200205
glyglyglythrglypromettyrseralaaspthrvalpheileile
210215220
glylysargglnilelysaspglyseraspleuglnglytyrglnphe
225230235240
valleuasnvalglulysserargthrvallysglulysserlysphe
245250255
pheileaspvallyspheaspglyglyileaspprotyrserglyleu
260265270
leuaspmetalaleugluleuglyphevalvallysprolysasngly
275280285
trptyralaargglupheleuaspglugluthrglyglumetilearg
290295300
gluglulyssertrpargalalysaspthrasncysthrthrphetrp
305310315320
glyproleuphelyshisglnpropheargaspalailelysargala
325330335
tyrglnleuglyalaileaspserasngluilevalglualagluval
340345350
aspgluleuileasnserlysvalglulysphelysserprogluser
355360365
lysserlysseralaalaaspleugluthraspleugluglnleuser
370375380
aspmetgluglupheasnglu
385390
<210>9
<211>393
<212>prt
<213>腸桿菌噬菌體t6
<400>9
metserilealaaspleulysserargleuilelysalaserthrser
151015
lysmetthralagluleuthrthrserlysphepheasnglulysasp
202530
valileargthrlysileprometleuasnilealaileserglyala
354045
ileaspglyglymetglnserglyleuthrilephealaglyproser
505560
lyshisphelysserasnmetserleuthrmetvalalaalatyrleu
65707580
asnlystyrproaspalavalcysleuphetyraspsergluphegly
859095
ilethrproalatyrleuargsermetglyvalaspprogluargval
100105110
ilehisthrproileglnservalgluglnleulysileaspmetval
115120125
asnglnleuglualailegluargglyglulysvalilevalpheile
130135140
aspserileglyasnmetalaserlyslysgluthrgluaspalaleu
145150155160
asnglulysservalalaaspmetthrargalalysserleulysser
165170175
leupheargilevalthrprotyrpheserilelysasnileprocys
180185190
valalavalasnhisthrilegluthrileglumetpheserlysthr
195200205
valmetthrglyglythrglyvalmettyrseralaaspthrvalphe
210215220
ileileglylysargglnilelysaspglyseraspleuglnglytyr
225230235240
glnphevalleuasnvalglulysserargthrvallysglulysser
245250255
lysphepheileaspvallyspheaspglyglyileaspprotyrser
260265270
glyleuleuaspmetalaleugluleuglyphevalvallysprolys
275280285
asnglytrptyralaargglupheleuaspglugluthrglyglumet
290295300
ilearggluglulyssertrpargalalysaspthrasncysthrthr
305310315320
phetrpglyproleuphelyshisglnpropheargaspalailelys
325330335
argalatyrglnleuglyalaileaspserasngluilevalgluala
340345350
gluvalaspgluleuileasnserlysvalglulysphelysserpro
355360365
gluserlysserlysseralaalaaspleugluthraspleuglugln
370375380
leuseraspmetgluglupheasnglu
385390
<210>10
<211>387
<212>prt
<213>不動桿菌噬菌體133
<400>10
metserserleulysgluargleuilelysalaserthrserlysmet
151015
thralagluleuthrlysserlysphepheasnasplysthrvalval
202530
argthrargileprometleuasnilealaileserglyalaleuasn
354045
glyglymetglnserglyleuthrilephealaglyproserlyshis
505560
phelysserasnmetglyleuthrmetvalalaalatyrmetlysala
65707580
pheproaspalavalcysmetphetyraspserglupheglyilethr
859095
proalatyrleulysalametglyvalaspproaspargvalilehis
100105110
thrprovalglnservalgluglnleulysileaspmetthrasngln
115120125
leuglugluvallysargglyglulysvalilevalpheileaspser
130135140
ileglyasnleualaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysthrthralaaspmetthrargalalysalaleulysserleuphe
165170175
argilevalthrprotyrpheserilelysaspileprocysvalala
180185190
valasnhisthrleuglnthrleuglumetpheserlysgluvalmet
195200205
thrglyglythrglyvalmettyrseralaaspthrvalphepheile
210215220
glylysargglnvallysaspglythrgluleualaglytyrgluphe
225230235240
ileleulysalaglulysserargmetvallysglulysservalphe
245250255
proilethrvallyspheaspglyglyileaspprotyrserglyleu
260265270
leuglumetalathraspleuglyphevalvallysprolysvalgly
275280285
trptyrlysargalametmetvalaspglyvalmetglnhisgluglu
290295300
lyssertrpargalalysaspthraspserileaspphetrpglypro
305310315320
leuphelyshisaspgluphearglysalailegluthrargtyrgln
325330335
leuglyserilegluseraspalagluvalaspalagluvalaspala
340345350
leuileglyserlysthrthralalysileserglyvalasnphegly
355360365
proalagluseralaalaasplysgluglnglnleugluasppheval
370375380
aspgluasp
385
<210>11
<211>390
<212>prt
<213>腸桿菌噬菌體rb69
<400>11
metseraspleulysserargleuilelysalaserthrserlysmet
151015
thralaaspleuthrlysserlysleupheasnasnargaspgluval
202530
prothrargileprometleuasnilealaleuglyglyalaleuasn
354045
alaglyleuglnserglyleuthrilephealaalaproserlyshis
505560
phelysthrleupheglyleuthrmetvalalaalatyrmetlyslys
65707580
tyrlysaspalailecysleuphetyraspserglupheglyalaser
859095
glusertyrpheargsermetglyvalaspleuaspargvalvalhis
100105110
thrproileglnservalgluglnleulysvalaspmetthrasngln
115120125
leuaspalailegluargglyasplysvalileilepheileaspser
130135140
ileglyasnthralaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysvalvalglyaspmetserargalalysalaleulysserleuphe
165170175
argilevalthrprotyrleuthrilelysaspileprocysvalala
180185190
ileasnhisthralametgluileglyglyleutyrprolysgluile
195200205
metglyglyglythrglyileleutyrseralaasnthrvalphephe
210215220
ileserlysargglnvallysgluglythrgluleuthrglytyrasp
225230235240
phethrleulysalaglulysserargthrvallysglulysserthr
245250255
pheproilethrvalasnpheaspglyglyileaspprophesergly
260265270
leuleuglumetalathrgluileglyphevalvallysprolysala
275280285
glytrptyralaargglupheleuaspglugluthrglyglumetile
290295300
arggluglulyssertrpargalalysalathraspcysvalgluphe
305310315320
trpglyproleuphelyshislyspropheargaspalailegluthr
325330335
lystyrlysleuglyalaileserserilelysgluvalaspaspala
340345350
valasnaspleuileasncyslysalathrthrlysvalprovallys
355360365
thrseraspalaproseralaalaaspilegluasnaspleuaspglu
370375380
metgluasppheaspglu
385390
<210>12
<211>411
<212>prt
<213>氣單胞菌噬菌體aeh1
<400>12
metalalysglyilelysthralalysthrglyasnleuglyserleu
151015
metserlysleualaglythrserserasnlysmetserservalleu
202530
alaaspserlysphepheasnasplysaspcysvalargthrargval
354045
proleuleuasnleualametserglygluleuaspglyglyleuthr
505560
proglyleuthrvalleualaglyproserlyshisphelysserasn
65707580
leuserleuvalphevalalaalatyrleuarglystyrproaspala
859095
valcysilephepheaspasnglupheglyserthrproglytyrphe
100105110
gluserglnglyvalaspileserargvalilehiscysprophelys
115120125
asnileglugluleulyspheaspilevallyslysleuglualaile
130135140
gluargglyaspargvalilevalphevalaspserileglyasnala
145150155160
alaserlyslysgluileaspaspalaileaspglulysservalser
165170175
aspmetthrargalalysglnilelysserleuthrargmetmetthr
180185190
protyrleuthrvalasnaspileproalailemetvalalahisthr
195200205
tyraspthrglnglumettyrserlyslysvalvalserglyglythr
210215220
glyilethrtyrserseraspthrvalileileileglyargglngln
225230235240
glulysaspglylysgluleuleuglytyrasnphevalleuasnmet
245250255
glulysserargphevallysgluglnserlysleuproleugluval
260265270
thrpheglnglyglyileasnthrtyrserglymetleuaspileala
275280285
leugluvalglyphevalvallysproserasnglytrppheserarg
290295300
alapheleuaspglugluthrglygluleuvalglugluasparglys
305310315320
trpargargalaaspthrasncysleugluphetrplysprometphe
325330335
alahisglnprophelysthralacysseraspmetphelysleulys
340345350
servalalavallysaspgluvalpheaspgluvalaspgluleuphe
355360365
serglyglualaglumetprovalasnmetglyarglysleuaspthr
370375380
alaaspglnglugluileaspglnleuglugluvalaspvalglugly
385390395400
seraspseraspgluleuphealaasnleuasp
405410
<210>13
<211>368
<212>prt
<213>氣單胞菌噬菌體65
<400>13
metalalyslysalalysvalvalasnserglyaspleuleugluarg
151015
leuasnglythrserserasnlysmetseralametleualagluser
202530
ilephepheasnglulysaspthrileargthrargvalproileile
354045
asnleumetmetserglyargleuaspglyglyilethrproglyleu
505560
thrcysilealaglyproserlyshisphelysserasnleuserleu
65707580
valmetvalseralatyrleuarglystyrprolysalavalcysleu
859095
phepheaspasnglupheglyserthrproasptyrphethrsergln
100105110
glyvalaspileserargvalvalhiscyspropheileaspvalglu
115120125
gluleulyspheaspilevallyslysleugluserilethrarggly
130135140
asplysvalileiletyrileaspserileglyasnvalalaserlys
145150155160
lysgluleuglnaspalalysaspglulysseralaglnaspmetthr
165170175
argalalysglnilelysserleupheargmetvalthrprotyrleu
180185190
thrvalleuaspileprocysilealavalasnhisthrtyrgluthr
195200205
glnglumetpheserlysthrvalmetserglyglythrglypromet
210215220
tyrseralaaspthrvalileileleuglylysglnglnasplysasp
225230235240
glylysgluleuleuglytyrasnphevalmetasnalaglulysser
245250255
argalailelysglulysserlysleuaspleumetvalserpheglu
260265270
glyglyileasnthrtyrserglyleuleulysilealaglngluleu
275280285
glyphevalthrlysproglnasnalaargtyrglnargasnpheleu
290295300
aspleugluproglyglumetvalileprogluaspglulyslystrp
305310315320
thrgluglugluseraspserleugluphetrplysprometpheser
325330335
hislysprophemetaspalavalserasnalatyrlysleulysala
340345350
valgluvalserglngluvalpheaspgluvalaspglnleuphegly
355360365
<210>14
<211>366
<212>prt
<213>弧菌噬菌體kvp40
<400>14
metseraspleumetlysserleulyslysserserthrserglytyr
151015
alaglnvalleusergluserglnphemetpheasplysasphisthr
202530
argthrtyrvalproalaileasnilealapheserglygluvalasp
354045
glyglyleuthrserglyleuthrvalleualaglyproserlyshis
505560
phelysserasnleuglyleuvalglyvalalaalatyrleulyslys
65707580
tyrproaspalavalcysvalpheileaspthrglupheglyilethr
859095
prosertyrleuargserglnglyvalaspproaspargvalleuhis
100105110
ileglncysgluservalgluargmetlyspheglumetalaasngln
115120125
leulysaspleualagluarglysargalalyslysalaglygluglu
130135140
proaspargvalilephepheileaspservalglyasnvalalaser
145150155160
alalysgluileaspaspalaglnasnglulysservalalaaspmet
165170175
serargalalysglnleulysserleupheargileilethrprotyr
180185190
phethrmetleuaspileprocysilealaileasnhisthrtyrgln
195200205
thrglngluiletyrserlysthrvalmetserglyglythrglyile
210215220
mettyrseralaaspthrvalileileleuglylysglnglnglulys
225230235240
aspglylysaspileileglytyrhispheilemetasnileglulys
245250255
serargphevallysglulysmetlysvalproleuthrvalthrtyr
260265270
gluasnglyileasppropheserglyleuleuaspilealaleugln
275280285
thrglyhisvalvallysproserasnglytrptyrglnargalathr
290295300
valaspglugluthrglyglumetilevalgluglulyslystyrarg
305310315320
alalysgluthrglnthrileserphetrplysaspileileasnser
325330335
prothrphelysgluglyvallysargiletyrcysleuglyglnleu
340345350
aspglusergluleupheglygluvalaspserleupheasp
355360365
<210>15
<211>386
<212>prt
<213>腸桿菌噬菌體rb43
<400>15
metserasnlysalaleuleulyslysleuilelysasnserasnser
151015
glnseralaalaileleusergluseraspvalpheasnasnilethr
202530
lysthrargthrargvalproileleuasnleualaleuserglyala
354045
pheaspglyglyleuthrserglyleuthrleuphealaglyproser
505560
lyshisphelysserasnleuglyleuvalthrvalseralatyrleu
65707580
lysalaasngluaspalavalcysleuphetyraspserglulysgly
859095
valthrlyssertyrleulyssermetglyvalaspproaspargval
100105110
valtyrthrargilethrthrvalgluglnleuargasnaspvalval
115120125
serglnleuaspalaleugluargglyasplysvalileilepheval
130135140
aspservalglyasnthralaserlyslysgluleualaaspalaleu
145150155160
seraspasnasplysglnaspmetthrargalalysalaleulysgly
165170175
metpheargmetvalthrprotyrleualaaspleuaspilepromet
180185190
valcysilecyshisthrtyraspthrglnglumettyrserlyslys
195200205
valileserglyglythrglyleumettyrseralaaspthralaile
210215220
ileleuglylysglnglnvallysgluglythrgluvalvalglytyr
225230235240
asppheilemetasnileglulysserargphevallysglulysser
245250255
lyspheproleuhisvalthrtyrgluglyglyilesermettyrser
260265270
glyleuleuaspleualametglumetasnphevalglnthrprothr
275280285
lysglytrpargglyargalapheleuasnthrgluthrglygluleu
290295300
gluleugluglulyslystrpargglusergluthrasnserileglu
305310315320
phetrpargproleuphethrhisglnpropheleuaspalailegln
325330335
asplystyrargileproasplysgluilethraspglyalaalaleu
340345350
gluaspleutyrserthraspgluprogluserasnlysileaspleu
355360365
aspaspaspileproaspaspileglyileaspglnaspgluglupro
370375380
ilemet
385
<210>16
<211>335
<212>prt
<213>原綠球藻噬菌體p-ssm2
<400>16
metasppheleulysgluilevallysgluileglyaspglutyrthr
151015
glnvalalaalaaspileglngluasngluargpheileaspthrgly
202530
sertyrilepheasnglyleuvalserglyserilepheglyglyval
354045
serserserargilethralailealaglygluserserthrglylys
505560
thrtyrpheserleualavalvallysasnpheleuaspasnasnpro
65707580
aspglytyrcysleutyrpheaspthrglualaalavalasnlysgly
859095
leuleugluserargglyileaspmetasnargleuvalvalvalasn
100105110
valvalthrilegluglupheargserlysalaleuargalavalasp
115120125
iletyrleulysthrsergluglugluarglysprocysmetpheval
130135140
leuaspserleuglymetleuserthrglulysgluileargaspala
145150155160
leuaspasplysglnvalargaspmetthrlysserglnleuvallys
165170175
glyalapheargmetleuthrleulysleuglyglnalaasnilepro
180185190
leuilevalthrasnhisthrtyraspvalileglysertyrvalpro
195200205
thrlysglumetglyglyglyserglyleulystyralaalaserthr
210215220
ileiletyrleuserlyslyslysglulysaspglnlysgluvalile
225230235240
glyasnleuilelysalalysthrhislysserargleuserlysglu
245250255
asnlysgluvalglnileargleutyrtyraspgluargglyleuasp
260265270
argtyrtyrglyleuleugluleuglygluileglyglymettrplys
275280285
asnvalalaglyargtyrglumetasnglylyslysiletyralalys
290295300
gluileleulysasnprothrglutyrphethraspaspilemetglu
305310315320
glnleuaspasnilealalysgluhisphesertyrglythrasn
325330335
<210>17
<211>336
<212>prt
<213>原綠球藻噬菌體p-ssm4
<400>17
metasnpheleulysaspilealalysgluileglyasnasptyrala
151015
serleuvalsergluglyvalseralaglyaspthralaglypheile
202530
aspthrglysertyrilepheasnalaleuleuserglyseriletyr
354045
glyglyileproasnasnlysilethralailealaglygluthrser
505560
thrglylysthrphephecysleuglymetvalglnhispheleuglu
65707580
serasnproaspalaglyvaliletyrpheglusergluseralaile
859095
serlysglnmetilegluaspargglyileaspserasnargmetleu
100105110
leuvalprovalthrthrvalglnglupheargleuglnalailelys
115120125
ileleuasplystyrasngluglnthralaglugluarglysproleu
130135140
metphevalleuaspserleuglymetleuserthrserlysgluval
145150155160
gluaspserglualaglylysgluthrargaspmetthrargalagln
165170175
valvallysserilepheargvalleuthrleulysleuglylysala
180185190
asnvalproleuilevalthrasnhisthrtyraspvalvalglyala
195200205
tyrileprothrlysglumetglyglyglyserglyleulystyrala
210215220
alaserthrilevaltyrleuserlyslyslysglulysasnglylys
225230235240
gluvalvalglyasnileilelyscyslysthralalysserargleu
245250255
thrlysgluasnseraspvalgluthrargleutyrtyrasparggly
260265270
leuaspargtyrtyrglyleuleugluleuglyglulyshisglyval
275280285
pheserarglysglyasnargvalvalvalglyaspserservaltyr
290295300
proseralaileleualaaspproasplystyrphethrglugluleu
305310315320
metglulysleuaspglualaalaalalysglupheargtyrglyasn
325330335
<210>18
<211>343
<212>prt
<213>聚球藻噬菌體s-pm2
<400>18
metserpheleuaspservalilelysaspserlysasnglutyrala
151015
alaphealasergluglyvalalaalaglyaspvalgluserpheval
202530
aspthrglysertyrilepheasnalaleuvalserglyserilephe
354045
glyglyileproserasnlysilethralaleualaglyglusergly
505560
thrglylysthrphephecysleuservalvalargasnpheleuasn
65707580
thraspproaspalaglyvaliletyrphegluthrgluseralaile
859095
serlysglnmetilegluserargglyileaspserthrargmetile
100105110
ilepheprovalaspthrilegluasppheargthrglnalavalarg
115120125
ileileasplystyrmetgluglnasnlyssergluarglysproleu
130135140
metphevalleuaspserleuglymetleualathrlyslysgluval
145150155160
gluaspalaserasnasplysglnvalargaspmetthrlysalagln
165170175
ilevallysseralapheargileleuthrleulysmetglylysala
180185190
asnileprometleuvalthrasnhisthrtyraspvalvalglyser
195200205
tyrvalprothrlysglumetglyglyglyserglyleulystyrser
210215220
alaserthrilevaltyrleuglylyslyslysglulysaspglythr
225230235240
aspleuvalglyasnileilelyscysglualalyslysserargleu
245250255
thrarggluglyserlysvalgluthrargleuphepheaspglnarg
260265270
glyleugluargtyrtyrglymetleugluleuglygluargalagly
275280285
leutrplysasnthralaglyargtyrgluileasnglylyslysval
290295300
tyrglylysglnileleualaasnproaspgluphephethrgluglu
305310315320
ileleuglngluleuasplysglnalaglnargglupheleutyrgly
325330335
alaseraspaspglygluasp
340
<210>19
<211>393
<212>prt
<213>腸桿菌噬菌體rb32
<400>19
metserilealaaspleulysserargleuilelysalaserthrser
151015
lysmetthralagluleuthrthrserlysphepheasnglulysasp
202530
valileargthrlysileprometleuasnilealaileserglyala
354045
ileaspglyglymetglnserglyleuthrilephealaglyproser
505560
lyshisphelysserasnmetserleuthrmetvalalaalatyrleu
65707580
asnlystyrproaspalavalcysleuphetyraspsergluphegly
859095
ilethrproalatyrleuargsermetglyvalaspprogluargval
100105110
ilehisthrproileglnservalgluglnleulysileaspmetval
115120125
asnglnleuglualailegluargglyglulysvalilevalpheile
130135140
aspserileglyasnmetalaserlyslysgluthrgluaspalaleu
145150155160
asnglulysservalalaaspmetthrargalalysserleulysser
165170175
leupheargilevalthrprotyrpheserilelysasnileprocys
180185190
valalavalasnhisthrilegluthrileglumetpheserlysthr
195200205
valmetthrglyglythrglyvalmettyrseralaaspthrvalphe
210215220
ileileglylysargglnilelysaspglyseraspleuglnglytyr
225230235240
glnphevalleuasnvalglulysserargthrvallysglulysser
245250255
lysphepheileaspvallyspheaspglyglyileaspprotyrser
260265270
glyleuleuaspmetalaleugluleuglyphevalvallysprolys
275280285
asnglytrptyralaargglupheleuaspglugluthrglyglumet
290295300
ilearggluglulyssertrpargalalysaspthrasncysthrthr
305310315320
phetrpglyproleuphelyshisglnpropheargaspalailelys
325330335
argalatyrglnleuglyalaileaspserasngluilevalgluala
340345350
gluvalaspgluleuileasnserlysvalglulysphelysserpro
355360365
gluserlysserlysseralaalaaspleugluthraspleuglugln
370375380
leuseraspmetgluglupheasnglu
385390
<210>20
<211>366
<212>prt
<213>弧菌噬菌體nt-1
<400>20
metseraspleuleulysserleulyslysserserthrserglytyr
151015
alahisvalleusergluserglnphemetpheglulysasphisthr
202530
argthrtyrvalproalaileasnilealapheserglygluvalasp
354045
glyglyleuthrserglyleuthrvalleualaglyproserlyshis
505560
phelysserasnleuglyleuvalglyvalalaalatyrleulyslys
65707580
tyrproglualailecysvalpheileaspthrglupheglyilethr
859095
prosertyrleulysserglnglyvalaspprogluargvalleuhis
100105110
ileglncysgluservalgluargmetlyspheglumetalaasngln
115120125
leulysaspleualagluarglysargalalyslysalaglygluglu
130135140
proaspargvalvalphepheileaspservalglyasnvalalaser
145150155160
alalysgluileaspaspalaglnasnglulysservalalaaspmet
165170175
serargalalysglnleulysserleupheargileilethrprotyr
180185190
phethrmetleuaspileprocysilealaileasnhisthrtyrgln
195200205
thrglnglumettyrserlysthrvalmetserglyglythrglyile
210215220
mettyrseralaaspthrvalileileleuglylysglnglnglulys
225230235240
aspglylysgluileileglytyrhispheilemetasnileglulys
245250255
serargphevallysglulysmetlysvalproleuthrvalthrtyr
260265270
gluhisglyileaspglnpheserglyleuleuaspilealaleugln
275280285
thrglyhisvalvallysproserasnglytrptyrglnargalaphe
290295300
ileaspglugluthrglygluilegluilegluglulyslystyrarg
305310315320
alalysgluthrglnthrleuserphetrplysgluileileasnser
325330335
prothrphelysthrglyvallysargleutyrcysleuglyglnleu
340345350
aspglusergluleuleuaspgluvalaspserleupheasp
355360365
<210>21
<211>381
<212>prt
<213>腸桿菌噬菌體rb16
<400>21
metserasnlysalaleuleulyslysleuilelysasnserasnser
151015
glnseralaserileleusergluseraspvalpheasnasnilethr
202530
lysthrargthrargvalproileleuasnleuvalleuserglyala
354045
pheaspglyglyleuthrserglyleuthrleuilealaglyproser
505560
lyshisphelysserasnleuglyleuvalalavalalaalatyrleu
65707580
lysalaasngluaspalavalcysleuphetyraspserglulysgly
859095
valthrlyssertyrleulyssermetglyvalaspproaspargval
100105110
valtyrthrargilethrthrvalgluglnleuargasnaspvalval
115120125
serglnleuaspalaleugluargglyasplysvalileilepheval
130135140
aspservalglyasnthralaserlyslysgluleulysaspalaleu
145150155160
gluaspasnasplysglnaspmetthrargalalysalaleulysgly
165170175
metpheargmetvalthrprotyrleualaaspileaspilepromet
180185190
valcysilecyshisthrtyraspthrglnglumettyrserlyslys
195200205
valileserglyglythrglyleumettyrseralaaspthralaile
210215220
ileleuglylysglnglnvallysgluglythrgluvalvalglytyr
225230235240
asppheilemetasnvalglulysserargphevallysglulysser
245250255
lyspheproleuhisvalthrtyrgluglyglyilesermetpheser
260265270
glyleuleuaspleualametglumetasnphevalglnthrprothr
275280285
lysglytrpargglyargalapheleuasnthrgluthrglygluleu
290295300
gluleugluglulyslystrpargglualagluthrasncysileglu
305310315320
phetrplysproleuphelyshisglnpropheileaspalailegln
325330335
asplystyrargileproasplysgluilethraspglyalaalaleu
340345350
gluaspleutyrseraspaspvalvalgluserasnlysvalaspphe
355360365
aspaspaspileproaspaspvalaspleumetgluglu
370375380
<210>22
<211>391
<212>prt
<213>腸桿菌噬菌體t4
<400>22
metseraspleulysserargleuilelysalaserthrserlysleu
151015
thralagluleuthralaserlysphepheasnglulysaspvalval
202530
argthrlysileprometmetasnilealaleuserglygluilethr
354045
glyglymetglnserglyleuleuileleualaglyproserlysser
505560
phelysserasnpheglyleuthrmetvalsersertyrmetarggln
65707580
tyrproaspalavalcysleuphetyraspserglupheglyilethr
859095
proalatyrleuargsermetglyvalaspprogluargvalilehis
100105110
thrprovalglnserleugluglnleuargileaspmetvalasngln
115120125
leuaspalailegluargglyglulysvalvalvalpheileaspser
130135140
leuglyasnleualaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysvalvalseraspmetthrargalalysthrmetlysserleuphe
165170175
argilevalthrprotyrpheserthrlysasnileprocysileala
180185190
ileasnhisthrtyrgluthrglnglumetpheserlysthrvalmet
195200205
glyglyglythrglypromettyrseralaaspthrvalpheileile
210215220
glylysargglnilelysaspglyseraspleuglnglytyrglnphe
225230235240
valleuasnvalglulysserargthrvallysglulysserlysphe
245250255
lysileaspvallyspheaspglyglyileaspprotyrserglyleu
260265270
leuaspmetalaleugluleuglyphevalvallysprolysasngly
275280285
trptyralaargglupheleuaspglugluthrglyglumetilearg
290295300
gluglulyssertrpargalalysaspthrasncysthrthrphetrp
305310315320
glyproleuphelyshisglnpropheargaspalailelysargala
325330335
tyrglnleuglyalaileaspserasngluilevalglualagluval
340345350
aspgluleuileasnserlysvalglulysphelysserprogluser
355360365
lysserlysseralaalaaspleugluthraspleugluglnleuser
370375380
aspmetgluglupheasnglu
385390
<210>23
<211>393
<212>prt
<213>腸桿菌噬菌體t6
<400>23
metserilealaaspleulysserargleuilelysalaserthrser
151015
lysmetthralagluleuthrthrserlysphepheasnglulysasp
202530
valileargthrlysileprometleuasnilealaileserglyala
354045
ileaspglyglymetglnserglyleuthrilephealaglyproser
505560
lyshisphelysserasnmetserleuthrmetvalalaalatyrleu
65707580
asnlystyrproaspalavalcysleuphetyraspsergluphegly
859095
ilethrproalatyrleuargsermetglyvalaspprogluargval
100105110
ilehisthrproileglnservalgluglnleulysileaspmetval
115120125
asnglnleuglualailegluargglyglulysvalilevalpheile
130135140
aspserileglyasnmetalaserlyslysgluthrgluaspalaleu
145150155160
asnglulysservalalaaspmetthrargalalysserleulysser
165170175
leupheargilevalthrprotyrpheserilelysasnileprocys
180185190
valalavalasnhisthrilegluthrileglumetpheserlysthr
195200205
valmetthrglyglythrglyvalmettyrseralaaspthrvalphe
210215220
ileileglylysargglnilelysaspglyseraspleuglnglytyr
225230235240
glnphevalleuasnvalglulysserargthrvallysglulysser
245250255
lysphelysileaspvallyspheaspglyglyileaspprotyrser
260265270
glyleuleuaspmetalaleugluleuglyphevalvallysprolys
275280285
asnglytrptyralaargglupheleuaspglugluthrglyglumet
290295300
ilearggluglulyssertrpargalalysaspthrasncysthrthr
305310315320
phetrpglyproleuphelyshisglnpropheargaspalailelys
325330335
argalatyrglnleuglyalaileaspserasngluilevalgluala
340345350
gluvalaspgluleuileasnserlysvalglulysphelysserpro
355360365
gluserlysserlysseralaalaaspleugluthraspleuglugln
370375380
leuseraspmetgluglupheasnglu
385390
<210>24
<211>387
<212>prt
<213>不動桿菌噬菌體133
<400>24
metserserleulysgluargleuilelysalaserthrserlysmet
151015
thralagluleuthrlysserlysphepheasnasplysthrvalval
202530
argthrargileprometleuasnilealaileserglyalaleuasn
354045
glyglymetglnserglyleuthrilephealaglyproserlyshis
505560
phelysserasnmetglyleuthrmetvalalaalatyrmetlysala
65707580
pheproaspalavalcysmetphetyraspserglupheglyilethr
859095
proalatyrleulysalametglyvalaspproaspargvalilehis
100105110
thrprovalglnservalgluglnleulysileaspmetthrasngln
115120125
leuglugluvallysargglyglulysvalilevalpheileaspser
130135140
ileglyasnleualaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysthrthralaaspmetthrargalalysalaleulysserleuphe
165170175
argilevalthrprotyrpheserilelysaspileprocysvalala
180185190
valasnhisthrleuglnthrleuglumetpheserlysgluvalmet
195200205
thrglyglythrglyvalmettyrseralaaspthrvalphepheile
210215220
glylysargglnvallysaspglythrgluleualaglytyrgluphe
225230235240
ileleulysalaglulysserargmetvallysglulysservalphe
245250255
lysilethrvallyspheaspglyglyileaspprotyrserglyleu
260265270
leuglumetalathraspleuglyphevalvallysprolysvalgly
275280285
trptyrlysargalametmetvalaspglyvalmetglnhisgluglu
290295300
lyssertrpargalalysaspthraspserileaspphetrpglypro
305310315320
leuphelyshisaspgluphearglysalailegluthrargtyrgln
325330335
leuglyserilegluseraspalagluvalaspalagluvalaspala
340345350
leuileglyserlysthrthralalysileserglyvalasnphegly
355360365
proalagluseralaalaasplysgluglnglnleugluasppheval
370375380
aspgluasp
385
<210>25
<211>390
<212>prt
<213>腸桿菌噬菌體rb69
<400>25
metseraspleulysserargleuilelysalaserthrserlysmet
151015
thralaaspleuthrlysserlysleupheasnasnargaspgluval
202530
prothrargileprometleuasnilealaleuglyglyalaleuasn
354045
alaglyleuglnserglyleuthrilephealaalaproserlyshis
505560
phelysthrleupheglyleuthrmetvalalaalatyrmetlyslys
65707580
tyrlysaspalailecysleuphetyraspserglupheglyalaser
859095
glusertyrpheargsermetglyvalaspleuaspargvalvalhis
100105110
thrproileglnservalgluglnleulysvalaspmetthrasngln
115120125
leuaspalailegluargglyasplysvalileilepheileaspser
130135140
ileglyasnthralaserlyslysgluthrgluaspalaleuasnglu
145150155160
lysvalvalglyaspmetserargalalysalaleulysserleuphe
165170175
argilevalthrprotyrleuthrilelysaspileprocysvalala
180185190
ileasnhisthralametgluileglyglyleutyrprolysgluile
195200205
metglyglyglythrglyileleutyrseralaasnthrvalphephe
210215220
ileserlysargglnvallysgluglythrgluleuthrglytyrasp
225230235240
phethrleulysalaglulysserargthrvallysglulysserthr
245250255
phelysilethrvalasnpheaspglyglyileaspprophesergly
260265270
leuleuglumetalathrgluileglyphevalvallysprolysala
275280285
glytrptyralaargglupheleuaspglugluthrglyglumetile
290295300
arggluglulyssertrpargalalysalathraspcysvalgluphe
305310315320
trpglyproleuphelyshislyspropheargaspalailegluthr
325330335
lystyrlysleuglyalaileserserilelysgluvalaspaspala
340345350
valasnaspleuileasncyslysalathrthrlysvalprovallys
355360365
thrseraspalaproseralaalaaspilegluasnaspleuaspglu
370375380
metgluasppheaspglu
385390
<210>26
<211>411
<212>prt
<213>氣單胞菌噬菌體aeh1
<400>26
metalalysglyilelysthralalysthrglyasnleuglyserleu
151015
metserlysleualaglythrserserasnlysmetserservalleu
202530
alaaspserlysphepheasnasplysaspcysvalargthrargval
354045
proleuleuasnleualametserglygluleuaspglyglyleuthr
505560
proglyleuthrvalleualaglyproserlyshisphelysserasn
65707580
leuserleuvalphevalalaalatyrleuarglystyrproaspala
859095
valcysilephepheaspasnglupheglyserthrproglytyrphe
100105110
gluserglnglyvalaspileserargvalilehiscysprophelys
115120125
asnileglugluleulyspheaspilevallyslysleuglualaile
130135140
gluargglyaspargvalilevalphevalaspserileglyasnala
145150155160
alaserlyslysgluileaspaspalaileaspglulysservalser
165170175
aspmetthrargalalysglnilelysserleuthrargmetmetthr
180185190
protyrleuthrvalasnaspileproalailemetvalalahisthr
195200205
tyraspthrglnglumettyrserlyslysvalvalserglyglythr
210215220
glyilethrtyrserseraspthrvalileileileglyargglngln
225230235240
glulysaspglylysgluleuleuglytyrasnphevalleuasnmet
245250255
glulysserargphevallysgluglnserlysleulysleugluval
260265270
thrpheglnglyglyileasnthrtyrserglymetleuaspileala
275280285
leugluvalglyphevalvallysproserasnglytrppheserarg
290295300
alapheleuaspglugluthrglygluleuvalglugluasparglys
305310315320
trpargargalaaspthrasncysleugluphetrplysprometphe
325330335
alahisglnprophelysthralacysseraspmetphelysleulys
340345350
servalalavallysaspgluvalpheaspgluvalaspgluleuphe
355360365
serglyglualaglumetprovalasnmetglyarglysleuaspthr
370375380
alaaspglnglugluileaspglnleuglugluvalaspvalglugly
385390395400
seraspseraspgluleuphealaasnleuasp
405410
<210>27
<211>368
<212>prt
<213>氣單胞菌噬菌體65
<400>27
metalalyslysalalysvalvalasnserglyaspleuleugluarg
151015
leuasnglythrserserasnlysmetseralametleualagluser
202530
ilephepheasnglulysaspthrileargthrargvalproileile
354045
asnleumetmetserglyargleuaspglyglyilethrproglyleu
505560
thrcysilealaglyproserlyshisphelysserasnleuserleu
65707580
valmetvalseralatyrleuarglystyrprolysalavalcysleu
859095
phepheaspasnglupheglyserthrproasptyrphethrsergln
100105110
glyvalaspileserargvalvalhiscyspropheileaspvalglu
115120125
gluleulyspheaspilevallyslysleugluserilethrarggly
130135140
asplysvalileiletyrileaspserileglyasnvalalaserlys
145150155160
lysgluleuglnaspalalysaspglulysseralaglnaspmetthr
165170175
argalalysglnilelysserleupheargmetvalthrprotyrleu
180185190
thrvalleuaspileprocysilealavalasnhisthrtyrgluthr
195200205
glnglumetpheserlysthrvalmetserglyglythrglypromet
210215220
tyrseralaaspthrvalileileleuglylysglnglnasplysasp
225230235240
glylysgluleuleuglytyrasnphevalmetasnalaglulysser
245250255
argalailelysglulysserlysleulysleumetvalserpheglu
260265270
glyglyileasnthrtyrserglyleuleulysilealaglngluleu
275280285
glyphevalthrlysproglnasnalaargtyrglnargasnpheleu
290295300
aspleugluproglyglumetvalileprogluaspglulyslystrp
305310315320
thrgluglugluseraspserleugluphetrplysprometpheser
325330335
hislysprophemetaspalavalserasnalatyrlysleulysala
340345350
valgluvalserglngluvalpheaspgluvalaspglnleuphegly
355360365
<210>28
<211>366
<212>prt
<213>弧菌噬菌體kvp40
<400>28
metseraspleumetlysserleulyslysserserthrserglytyr
151015
alaglnvalleusergluserglnphemetpheasplysasphisthr
202530
argthrtyrvalproalaileasnilealapheserglygluvalasp
354045
glyglyleuthrserglyleuthrvalleualaglyproserlyshis
505560
phelysserasnleuglyleuvalglyvalalaalatyrleulyslys
65707580
tyrproaspalavalcysvalpheileaspthrglupheglyilethr
859095
prosertyrleuargserglnglyvalaspproaspargvalleuhis
100105110
ileglncysgluservalgluargmetlyspheglumetalaasngln
115120125
leulysaspleualagluarglysargalalyslysalaglygluglu
130135140
proaspargvalilephepheileaspservalglyasnvalalaser
145150155160
alalysgluileaspaspalaglnasnglulysservalalaaspmet
165170175
serargalalysglnleulysserleupheargileilethrprotyr
180185190
phethrmetleuaspileprocysilealaileasnhisthrtyrgln
195200205
thrglngluiletyrserlysthrvalmetserglyglythrglyile
210215220
mettyrseralaaspthrvalileileleuglylysglnglnglulys
225230235240
aspglylysaspileileglytyrhispheilemetasnileglulys
245250255
serargphevallysglulysmetlysvallysleuthrvalthrtyr
260265270
gluasnglyileasppropheserglyleuleuaspilealaleugln
275280285
thrglyhisvalvallysproserasnglytrptyrglnargalathr
290295300
valaspglugluthrglyglumetilevalgluglulyslystyrarg
305310315320
alalysgluthrglnthrileserphetrplysaspileileasnser
325330335
prothrphelysgluglyvallysargiletyrcysleuglyglnleu
340345350
aspglusergluleupheglygluvalaspserleupheasp
355360365
<210>29
<211>386
<212>prt
<213>腸桿菌噬菌體rb43
<400>29
metserasnlysalaleuleulyslysleuilelysasnserasnser
151015
glnseralaalaileleusergluseraspvalpheasnasnilethr
202530
lysthrargthrargvalproileleuasnleualaleuserglyala
354045
pheaspglyglyleuthrserglyleuthrleuphealaglyproser
505560
lyshisphelysserasnleuglyleuvalthrvalseralatyrleu
65707580
lysalaasngluaspalavalcysleuphetyraspserglulysgly
859095
valthrlyssertyrleulyssermetglyvalaspproaspargval
100105110
valtyrthrargilethrthrvalgluglnleuargasnaspvalval
115120125
serglnleuaspalaleugluargglyasplysvalileilepheval
130135140
aspservalglyasnthralaserlyslysgluleualaaspalaleu
145150155160
seraspasnasplysglnaspmetthrargalalysalaleulysgly
165170175
metpheargmetvalthrprotyrleualaaspleuaspilepromet
180185190
valcysilecyshisthrtyraspthrglnglumettyrserlyslys
195200205
valileserglyglythrglyleumettyrseralaaspthralaile
210215220
ileleuglylysglnglnvallysgluglythrgluvalvalglytyr
225230235240
asppheilemetasnileglulysserargphevallysglulysser
245250255
lysphelysleuhisvalthrtyrgluglyglyilesermettyrser
260265270
glyleuleuaspleualametglumetasnphevalglnthrprothr
275280285
lysglytrpargglyargalapheleuasnthrgluthrglygluleu
290295300
gluleugluglulyslystrpargglusergluthrasnserileglu
305310315320
phetrpargproleuphethrhisglnpropheleuaspalailegln
325330335
asplystyrargileproasplysgluilethraspglyalaalaleu
340345350
gluaspleutyrserthraspgluprogluserasnlysileaspleu
355360365
aspaspaspileproaspaspileglyileaspglnaspgluglupro
370375380
ilemet
385
<210>30
<211>335
<212>prt
<213>原綠球藻噬菌體p-ssm2
<400>30
metasppheleulysgluilevallysgluileglyaspglutyrthr
151015
glnvalalaalaaspileglngluasngluargpheileaspthrgly
202530
sertyrilepheasnglyleuvalserglyserilepheglyglyval
354045
serserserargilethralailealaglygluserserthrglylys
505560
thrtyrpheserleualavalvallysasnpheleuaspasnasnpro
65707580
aspglytyrcysleutyrpheaspthrglualaalavalasnlysgly
859095
leuleugluserargglyileaspmetasnargleuvalvalvalasn
100105110
valvalthrilegluglupheargserlysalaleuargalavalasp
115120125
iletyrleulysthrsergluglugluarglysprocysmetpheval
130135140
leuaspserleuglymetleuserthrglulysgluileargaspala
145150155160
leuaspasplysglnvalargaspmetthrlysserglnleuvallys
165170175
glyalapheargmetleuthrleulysleuglyglnalaasnilepro
180185190
leuilevalthrasnhisthrtyraspvalileglysertyrvalpro
195200205
thrlysglumetglyglyglyserglyleulystyralaalaserthr
210215220
ileiletyrleuserlyslyslysglulysaspglnlysgluvalile
225230235240
glyasnleuilelysalalysthrhislysserargleuserlysglu
245250255
asnlysgluvallysileargleutyrtyraspgluargglyleuasp
260265270
argtyrtyrglyleuleugluleuglygluileglyglymettrplys
275280285
asnvalalaglyargtyrglumetasnglylyslysiletyralalys
290295300
gluileleulysasnprothrglutyrphethraspaspilemetglu
305310315320
glnleuaspasnilealalysgluhisphesertyrglythrasn
325330335
<210>31
<211>336
<212>prt
<213>原綠球藻噬菌體p-ssm4
<400>31
metasnpheleulysaspilealalysgluileglyasnasptyrala
151015
serleuvalsergluglyvalseralaglyaspthralaglypheile
202530
aspthrglysertyrilepheasnalaleuleuserglyseriletyr
354045
glyglyileproasnasnlysilethralailealaglygluthrser
505560
thrglylysthrphephecysleuglymetvalglnhispheleuglu
65707580
serasnproaspalaglyvaliletyrpheglusergluseralaile
859095
serlysglnmetilegluaspargglyileaspserasnargmetleu
100105110
leuvalprovalthrthrvalglnglupheargleuglnalailelys
115120125
ileleuasplystyrasngluglnthralaglugluarglysproleu
130135140
metphevalleuaspserleuglymetleuserthrserlysgluval
145150155160
gluaspserglualaglylysgluthrargaspmetthrargalagln
165170175
valvallysserilepheargvalleuthrleulysleuglylysala
180185190
asnvalproleuilevalthrasnhisthrtyraspvalvalglyala
195200205
tyrileprothrlysglumetglyglyglyserglyleulystyrala
210215220
alaserthrilevaltyrleuserlyslyslysglulysasnglylys
225230235240
gluvalvalglyasnileilelyscyslysthralalysserargleu
245250255
thrlysgluasnseraspvallysthrargleutyrtyrasparggly
260265270
leuaspargtyrtyrglyleuleugluleuglyglulyshisglyval
275280285
pheserarglysglyasnargvalvalvalglyaspserservaltyr
290295300
proseralaileleualaaspproasplystyrphethrglugluleu
305310315320
metglulysleuaspglualaalaalalysglupheargtyrglyasn
325330335
<210>32
<211>343
<212>prt
<213>聚球藻噬菌體s-pm2
<400>32
metserpheleuaspservalilelysaspserlysasnglutyrala
151015
alaphealasergluglyvalalaalaglyaspvalgluserpheval
202530
aspthrglysertyrilepheasnalaleuvalserglyserilephe
354045
glyglyileproserasnlysilethralaleualaglyglusergly
505560
thrglylysthrphephecysleuservalvalargasnpheleuasn
65707580
thraspproaspalaglyvaliletyrphegluthrgluseralaile
859095
serlysglnmetilegluserargglyileaspserthrargmetile
100105110
ilepheprovalaspthrilegluasppheargthrglnalavalarg
115120125
ileileasplystyrmetgluglnasnlyssergluarglysproleu
130135140
metphevalleuaspserleuglymetleualathrlyslysgluval
145150155160
gluaspalaserasnasplysglnvalargaspmetthrlysalagln
165170175
ilevallysseralapheargileleuthrleulysmetglylysala
180185190
asnileprometleuvalthrasnhisthrtyraspvalvalglyser
195200205
tyrvalprothrlysglumetglyglyglyserglyleulystyrser
210215220
alaserthrilevaltyrleuglylyslyslysglulysaspglythr
225230235240
aspleuvalglyasnileilelyscysglualalyslysserargleu
245250255
thrarggluglyserlysvallysthrargleuphepheaspglnarg
260265270
glyleugluargtyrtyrglymetleugluleuglygluargalagly
275280285
leutrplysasnthralaglyargtyrgluileasnglylyslysval
290295300
tyrglylysglnileleualaasnproaspgluphephethrgluglu
305310315320
ileleuglngluleuasplysglnalaglnargglupheleutyrgly
325330335
alaseraspaspglygluasp
340
<210>33
<211>393
<212>prt
<213>腸桿菌噬菌體rb32
<400>33
metserilealaaspleulysserargleuilelysalaserthrser
151015
lysmetthralagluleuthrthrserlysphepheasnglulysasp
202530
valileargthrlysileprometleuasnilealaileserglyala
354045
ileaspglyglymetglnserglyleuthrilephealaglyproser
505560
lyshisphelysserasnmetserleuthrmetvalalaalatyrleu
65707580
asnlystyrproaspalavalcysleuphetyraspsergluphegly
859095
ilethrproalatyrleuargsermetglyvalaspprogluargval
100105110
ilehisthrproileglnservalgluglnleulysileaspmetval
115120125
asnglnleuglualailegluargglyglulysvalilevalpheile
130135140
aspserileglyasnmetalaserlyslysgluthrgluaspalaleu
145150155160
asnglulysservalalaaspmetthrargalalysserleulysser
165170175
leupheargilevalthrprotyrpheserilelysasnileprocys
180185190
valalavalasnhisthrilegluthrileglumetpheserlysthr
195200205
valmetthrglyglythrglyvalmettyrseralaaspthrvalphe
210215220
ileileglylysargglnilelysaspglyseraspleuglnglytyr
225230235240
glnphevalleuasnvalglulysserargthrvallysglulysser
245250255
lysphelysileaspvallyspheaspglyglyileaspprotyrser
260265270
glyleuleuaspmetalaleugluleuglyphevalvallysprolys
275280285
asnglytrptyralaargglupheleuaspglugluthrglyglumet
290295300
ilearggluglulyssertrpargalalysaspthrasncysthrthr
305310315320
phetrpglyproleuphelyshisglnpropheargaspalailelys
325330335
argalatyrglnleuglyalaileaspserasngluilevalgluala
340345350
gluvalaspgluleuileasnserlysvalglulysphelysserpro
355360365
gluserlysserlysseralaalaaspleugluthraspleuglugln
370375380
leuseraspmetgluglupheasnglu
385390
<210>34
<211>366
<212>prt
<213>弧菌噬菌體nt-1
<400>34
metseraspleuleulysserleulyslysserserthrserglytyr
151015
alahisvalleusergluserglnphemetpheglulysasphisthr
202530
argthrtyrvalproalaileasnilealapheserglygluvalasp
354045
glyglyleuthrserglyleuthrvalleualaglyproserlyshis
505560
phelysserasnleuglyleuvalglyvalalaalatyrleulyslys
65707580
tyrproglualailecysvalpheileaspthrglupheglyilethr
859095
prosertyrleulysserglnglyvalaspprogluargvalleuhis
100105110
ileglncysgluservalgluargmetlyspheglumetalaasngln
115120125
leulysaspleualagluarglysargalalyslysalaglygluglu
130135140
proaspargvalvalphepheileaspservalglyasnvalalaser
145150155160
alalysgluileaspaspalaglnasnglulysservalalaaspmet
165170175
serargalalysglnleulysserleupheargileilethrprotyr
180185190
phethrmetleuaspileprocysilealaileasnhisthrtyrgln
195200205
thrglnglumettyrserlysthrvalmetserglyglythrglyile
210215220
mettyrseralaaspthrvalileileleuglylysglnglnglulys
225230235240
aspglylysgluileileglytyrhispheilemetasnileglulys
245250255
serargphevallysglulysmetlysvallysleuthrvalthrtyr
260265270
gluhisglyileaspglnpheserglyleuleuaspilealaleugln
275280285
thrglyhisvalvallysproserasnglytrptyrglnargalaphe
290295300
ileaspglugluthrglygluilegluilegluglulyslystyrarg
305310315320
alalysgluthrglnthrleuserphetrplysgluileileasnser
325330335
prothrphelysthrglyvallysargleutyrcysleuglyglnleu
340345350
aspglusergluleuleuaspgluvalaspserleupheasp
355360365
<210>35
<211>381
<212>prt
<213>腸桿菌噬菌體rb16
<400>35
metserasnlysalaleuleulyslysleuilelysasnserasnser
151015
glnseralaserileleusergluseraspvalpheasnasnilethr
202530
lysthrargthrargvalproileleuasnleuvalleuserglyala
354045
pheaspglyglyleuthrserglyleuthrleuilealaglyproser
505560
lyshisphelysserasnleuglyleuvalalavalalaalatyrleu
65707580
lysalaasngluaspalavalcysleuphetyraspserglulysgly
859095
valthrlyssertyrleulyssermetglyvalaspproaspargval
100105110
valtyrthrargilethrthrvalgluglnleuargasnaspvalval
115120125
serglnleuaspalaleugluargglyasplysvalileilepheval
130135140
aspservalglyasnthralaserlyslysgluleulysaspalaleu
145150155160
gluaspasnasplysglnaspmetthrargalalysalaleulysgly
165170175
metpheargmetvalthrprotyrleualaaspileaspilepromet
180185190
valcysilecyshisthrtyraspthrglnglumettyrserlyslys
195200205
valileserglyglythrglyleumettyrseralaaspthralaile
210215220
ileleuglylysglnglnvallysgluglythrgluvalvalglytyr
225230235240
asppheilemetasnvalglulysserargphevallysglulysser
245250255
lysphelysleuhisvalthrtyrgluglyglyilesermetpheser
260265270
glyleuleuaspleualametglumetasnphevalglnthrprothr
275280285
lysglytrpargglyargalapheleuasnthrgluthrglygluleu
290295300
gluleugluglulyslystrpargglualagluthrasncysileglu
305310315320
phetrplysproleuphelyshisglnpropheileaspalailegln
325330335
asplystyrargileproasplysgluilethraspglyalaalaleu
340345350
gluaspleutyrseraspaspvalvalgluserasnlysvalaspphe
355360365
aspaspaspileproaspaspvalaspleumetgluglu
370375380