專利名稱:利用片段互補技術重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性的制作方法
技術領域:
本發(fā)明涉及利用片段互補技術重建5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvyl-shikimate-3-phosphate synthase,EPSPS)活性的方法。更具體地,本發(fā)明涉及大腸桿菌EPSPS及其突變后獲得的草甘膦抗性EPSPS的重建,本發(fā)明還涉及惡臭假單胞菌草甘膦抗性EPSPS的重建。
背景技術:
隨著轉基因植物的大規(guī)模種植,轉基因植物的生物安全控制(biologicalconfinement)越來越受到關注。Wruad等.Proc Natl Acad Sci USA2004,101,(40),14533-8觀測到抗草甘膦的CP4EPSPS的編碼基因可以從轉基因植物中傳播到20公里以外的作物中,甚至傳播到雜草中,因此對轉基因植物實行生物安全控制對于防止超級雜草等的產(chǎn)生十分必要。
轉基因植物外源基因擴散的方式主要有以下幾種轉基因植物花粉的傳播,轉基因植物作為野生親緣種花粉的受體形成雜種,轉基因植物的DNA可能造成的基因擴散。目前有了一些控制轉基因植物外源基因擴散的方法,例如,(1)物理隔離,主要是距離隔離以便阻斷外源基因通過花粉的擴散;(2)遺傳控制,包括(a)雄性不育(male sterility);(b)基因組不相容性(Genomeincompatibility),即將特定的外源基因整合到作物的與雜草不相容的基因組上;(c)母系遺傳(maternal inheritance),其將外源基因轉入植物的葉綠體中,使這些基因進行母系遺傳,因此不會通過花粉的傳播而擴散入其它物種,該方法在煙草上已經(jīng)取得了初步的成功(Daniell等,Nat Biotechnol 1998,16,(4),345-8);(d)種子不育(seed sterility);(e)Transgenic mitigation(TM),利用與目的基因緊密連鎖、對于轉基因植物有利或中性、而對于野草生存不利(如防止種子散落和降低種子二次休眠等)的TM基因防止超級雜草(superweed)的產(chǎn)生。
Ye,G.N.等.Plant J2001,25,(3),261-70和Chin,H.G.等Proc Natl AcadSci USA2003,100,(8),4510-5提出了一種新的控制抗草甘膦轉基因的方法,其將EPSPS基因分成兩段,使之分別與表達DnaE內(nèi)含肽(intein)的基因串聯(lián)并共表達,利用內(nèi)含肽的自我拼接功能形成完整的EPSPS,從而使大腸桿菌或煙草獲得對草甘膦的耐受性。但是內(nèi)含肽編碼基因本身作為外源基因被引入轉基因植物也可能會引發(fā)其它的風險,例如成為被擴散的轉基因等。
蛋白酶消化產(chǎn)生或者通過基因表達生成的蛋白質片段可以在體內(nèi)或體外重建成具有完整蛋白功能的復合體,這被稱之為蛋白質片段互補(proteinfragment complementation)或蛋白重建(protein reconstitution)技術(例如,Hakansson,M.等.Curr Protein Pept Sci2002,3,(6),629-42;Braun,M.等.JBacteriol2003,185,(18),5508-18.)。對氨酰tRNA合成酶等蛋白進行的片段互補研究表明,發(fā)生片段互補的蛋白片段分拆位點大多發(fā)生在非保守區(qū)域。蛋白能夠重建意味著該蛋白內(nèi)的非共價作用十分特異,從而使蛋白片段有利于形成的天然的結構(Shiba,K.等.Proc Natl Acad Sci USA1992,89,(5),1880-4;Shiba,K.等.J Biol Chem1992,267,(32),22703-6)。此外,蛋白能夠發(fā)生片段互補表明,即使共價鍵斷開,該蛋白仍能保持比較穩(wěn)定的結構。兩個發(fā)生片段互補的肽鏈之間存在的各種非共價作用(如氫鍵、鹽橋及疏水作用)在保持蛋白結構穩(wěn)定方面起著很大的作用(Nelson,K.E.等,Completegenome sequence and comparative analysis of the metabolically versatilePseudomonas putida KT2440.Environ Microbiol2002,4,(12),799-808)。
我們利用這種蛋白重建技術在體內(nèi)和體外重建了有活性的EPSPS,對草甘膦具有耐受性的EPSPS也可以通過這種方法重建。EPSPS的片段互補可用于轉基因植物從而增加轉基因植物安全性,降低超級雜草形成的可能性。
發(fā)明概述本發(fā)明涉及5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其是選自EPSPS片段對的一種片段,組成所述片段對的兩種片段可以連接成全長EPSPS,并且這兩種片段不借助任何連接結構可以通過互補而重建EPSPS活性。優(yōu)選,所述片段對的分割點位于EPSPS的選自下列的結構中折疊單元之間的連接區(qū)中、α螺旋與β折疊之間的連接區(qū)中、兩個β折疊之間、β折疊中、或α螺旋中,優(yōu)選位于折疊單元之間的連接區(qū)中,例如,在折疊單元1和6,2和6,3和4,4和5,以及3和5之間的連接區(qū)中;更優(yōu)選該分割點是在折疊單元1,2,3,4,或5的內(nèi)部,例如,在折疊單元3的兩個β折疊之間的連接區(qū)中,在折疊單元4的α螺旋中,在折疊單元2的β折疊中,在折疊單元1的α螺旋與β折疊之間,在折疊單元5的α螺旋和β折疊之間的連接區(qū)中,或者在折疊單元5的兩個β折疊之間的連接區(qū)中,或者在折疊單元5的β折疊中。
在本發(fā)明的實施方案中,所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多個氨基酸殘基所得的EPSPS活性變體,優(yōu)選是大腸桿菌野生型EPSPS(其全長氨基酸序列和核苷酸序列是本領域已知的,可以參見序列表)或其草甘膦抗性EPSPS活性變體,或者優(yōu)選是惡臭假單胞菌(Pseudomonas putida)草甘膦抗性EPSPS,例如惡臭假單胞菌CGMCC0739(參見中國專利申請02117991.3)的EPSPS(其全長氨基酸序列和核苷酸序列見SEQ ID NO2)。
更具體地,本發(fā)明的蛋白片段優(yōu)選是選自大腸桿菌EPSPS的以下片段對的一種片段N67/C68,N85/C86,N104/C105,N154/C155,N182/C183,N184/C185,N218/C219,N224/C225,N227/C228,N259/C260,N298/C299,N371/C372,N376/C377,N383/C384(這里所述的N67/C68片段對,表示由N端片段N67和C端片段C68所組成的片段對,其中N67是指EPSPS序列中從N末端到第67位殘基之間的N端片段,C68是指EPSPS序列中從第68位殘基到C末端之間的C端片段。其它片段對表示法依此類推),或優(yōu)選是選自惡臭假單胞菌CGMCC0739的EPSPS的以下片段對的一種片段N208/C209,N214/C215,N219/C220,N222/C223,N224/C225(這里所述的N208/C209片段對表示由N端片段N208和C端片段C209所組成的片段對,其中N208是指EPSPS序列中從N末端到第208位殘基之間的片段,C209是指EPSPS序列中從第209位殘基到C末端之間的片段,其它片段對表示法依此類推)。
本發(fā)明還涉及編碼本發(fā)明所述蛋白片段的核酸分子,攜帶該核酸分子的表達載體,包含所述核酸分子或表達載體的細胞。優(yōu)選所述細胞是植物細胞。本發(fā)明還涉及包含本發(fā)明所述核酸分子或表達載體的轉基因植物或其種子。
本發(fā)明還涉及一種重建EPSPS的方法,該方法包括在無任何連接結構存在的條件下,利用本發(fā)明的蛋白片段或核酸分子或表達載體來重建EPSPS活性。
本發(fā)明還涉及一種拆分EPSPS或EPSPS核酸分子的方法,包括在無任何連接結構存在的條件下,拆分出本發(fā)明的蛋白片段,或核酸分子。該方法中所選擇的拆分點優(yōu)選位于EPSPS的下列結構中折疊單元之間的連接區(qū)中、α螺旋與β折疊之間的連接區(qū)中、兩個β折疊之間、β折疊中、或α螺旋中,優(yōu)選位于折疊單元之間的連接區(qū)中,例如,在折疊單元1和6,2和6,3和4,4和5,以及3和5之間的連接區(qū)中。更優(yōu)選在折疊單元1,2,3,4,或5的內(nèi)部,例如,折疊單元3的兩個β折疊之間的連接區(qū)中,折疊單元4的α螺旋中,折疊單元2的β折疊中,折疊單元1的α螺旋與β折疊之間,折疊單元5的α螺旋和β折疊之間的連接區(qū)中,或者折疊單元5的兩個β折疊之間的連接區(qū)中,或者在折疊單元5的β折疊中。還更優(yōu)選位于選自下列的位置之間大腸桿菌EPSPS的67-68、85-86、104-105、154-155、182-183、184-185、218-219、N224-C225、N227-C228、259-260、298-299、371-372、376-377、或383-384位置之間,或惡臭假單胞菌CGMCC 0739的草甘膦抗性EPSPS的208-209、214-215、219-220、222-223、或224-225位置之間。
本發(fā)明還涉及本發(fā)明所述的EPSPS片段或重建EPSPS活性的方法或拆分EPSPS的方法在控制轉基因植物安全性方面的應用。
發(fā)明內(nèi)容
本發(fā)明人基于EPSPS的結構,在有可能不影響EPSPS酶活性的結構區(qū)域中設計了分拆位點。本發(fā)明人還構建了表達EPSPS拆分片段的表達載體,并證明EPSPS片段在大腸桿菌體內(nèi)可以互補EPSPS活性。因此,本發(fā)明的EPSPS片段以及重建EPSPS的方法可以應用于生物安全控制領域。
EPSPS及其結構5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)是芳香族氨基酸合成-莽草酸合成途徑中的關鍵酶,存在于藻類、高等植物、細菌、真菌及寄生蟲的apicomplexan中,它催化一分子的莽草酸-3-磷酸(S3P)和磷酸烯醇式丙酮酸(PEP)生成5-烯醇式丙酮酸莽草酸-3-磷酸(EPSP)。
如圖2所示,EPSPS由兩個結構域組成,其中一個結構域包括標示為1,2和6的三個對稱的蛋白折疊單元,另一個結構域包括標示為3,4和5的三個對稱的蛋白折疊單元。每個單元由兩個平行的α螺旋和四個β折疊組成。參見Stallings,W.C.等.Proc Natl Acad Sci USA1991,88,(11),5046-50。
已知EPSP合酶在無酶底物時,形成“開放”(open)構象,而與S3P、草甘膦+S3P形成復合物晶體結構時,“開放”構象轉換成“閉合”(close)構象(Schonbrunn,E.等.Proc Nat Acad Sci USA2001,98,(4),1376-80)。Mcdowell等(J Biomol NMR2004,28,(1),11-29,2004)利用rotational-echodouble-resonace NMR技術,結合EPSP合酶與S3P和草甘膦復合體的晶體結構,對其進行調整,得到符合液體NMR結果的三維結構。
通過化學修飾、基因突變、結構分析等各種方法,EPSP合酶中底物的結合位點和催化位點的研究現(xiàn)在已經(jīng)比較深入(Schonbrunn,E.等,出處同上;Mcdowell等,出處同上;Anderson,K.S.等.J Biol Chem 1990,265,(10),5567-72;Huynh,Q.K.等J Biol Chem 1988,263,(24),11636-9;Huynh,Q.K.等JBiol Chem 1988,263,(2),735-9;Padgette,S.R.等JBiol Chem 1988,263,(4),1798-802;Padgette,S.R.等Arch Biochem Biophys1988,266,(1),254-62;Eschenburg,S.等J Biol Chem2003,278,(49),49215-22;Mizyed,S.等Biochemistry 2003,42,(23),6986-95;Shuttleworth,W.A.等Biochemistry 1994,33,(23),7062-8;Shuttleworth,W.A.等Arch Biochem Biophys1996,334,(1),37-42;Shuttleworth,W.A.等Biochemistry1999,38,(1),296-302;Stauffer,M.E.等Biochemistry 2001,40,(13),3951-7;Stauffer,M.E.等FEBS Lett 2001,499,(1-2),182-6;McDowell,L.M.等Biochemistry 2004,43,(21),6606-11)。
此外,Schonbrunn等提出Lys-22,Arg-124,Asp-313,Arg-344,Arg-386和Lys-411參與PEP結合,Arg-27等參與S3P結合,Arg-100,Asp-242和Asp-384在酶結合底物由開放構象轉換成閉合構象時起著重要作用(Proteins2000,40,(2),290-8;Biochemistry2000,39,(9),2164-73;Proc Natl Acad Sci USA2000,97,(12),6345-9)。
拆分位點的選擇本發(fā)明人基于EPSPS的結構,在有可能不影響EPSPS酶活性的結構區(qū)域中設計了分拆位點。
當分拆位點位于蛋白折疊單元之間時,共價鍵的斷裂和甲硫氨酸的插入一般不會影響蛋白質天然結構的形成。分拆的蛋白片段依靠蛋白內(nèi)的非共價作用及兩個肽鏈之間存在各種非共價作用如氫鍵、鹽橋及疏水作用等形成天然的蛋白結構,從而可以重建蛋白功能。分拆位點位于折疊單元之間,互補片段二級結構的形成一般不會被影響,因此更容易發(fā)生片段互補。在實施方案中,大腸桿菌EPSPS有7個分拆位點位于折疊單元之間的連接區(qū)域中,分拆產(chǎn)生的蛋白片段有6對可以互補形成EPSPS活性,而且它們的互補活性都比較好。惡臭假單胞菌有3個分拆位點在折疊單元之間的連接區(qū)域中,所形成的3對片段都可以互補EPSPS活性。
當分拆位點位于α螺旋與/或β折疊之間的連接區(qū)域時,共價鍵的斷裂一般不會影響到α螺旋或β折疊的形成,而甲硫氨酸的插入對天然結構的形成的影響一般也沒有那么明顯,因而此時片段互補容易發(fā)生。在實施方案中,大腸桿菌EPSPS有6個分拆位點位于α螺旋與β折疊之間的連接區(qū)域中,其中有5對片段可以互補EPSPS活性;另有1個分拆位點位于β折疊之間的連接區(qū)域中,相應片段也可以互補EPSPS活性。惡臭假單胞菌有1個分拆位點在β折疊中,所形成的片段可以互補EPSPS活性。
當分拆位點位于α螺旋或β折疊中時,只要α螺旋或β折疊可以忍受共價鍵的斷裂和甲硫氨酸的插入,或者此處的α螺旋或β折疊對蛋白的整體功能并不是十分重要,則EPSPS的片段也可以通過片段互補來重建蛋白活性。在實施方案中,大腸桿菌EPSPS有7個分拆位點位于α螺旋或β折疊中,其中有3對片段可以互補EPSPS活性。惡臭假單胞菌有1個分拆位點在β折疊中,所形成的片段可以互補EPSPS活性。
當EPSPS在兩個結構域中間分拆時,大腸桿菌EPSPS的N端肽鏈N240和C端肽鏈C241可以形成復合體而被共純化出來。但是該復合體酶活性很低,這可能是N240/C241復合體中只有一對疏水作用區(qū)域相互作用,因此蛋白結構不穩(wěn)定。惡臭假單胞菌有在兩個結構域之間測試了3個分拆位點,所形成的片段都基本不能互補EPSPS活性。因此,本發(fā)明人在EPSPS的結構域之間連接區(qū)中進行分拆,所得片段沒有能夠重建出EPSPS活性。
總之,本發(fā)明人在大腸桿菌EPSPS中成功實施了14個拆分點,其中6個在折疊單元之間的連接區(qū)中,3個在α螺旋與β折疊之間的連接區(qū)中,2個在β折疊之間的連接區(qū)中,2個在β折疊中,1個在α螺旋中。通過在這些拆分點進行拆分,大腸桿菌EPSPS的基因被分拆為N片段和C片段。將相互對應的N片段和C片段分別在兩種相容的質粒上表達。如此得到的N片段和C片段單獨都不表現(xiàn)EPSPS活性,但在體內(nèi),相應的N片段和C片段結合可以互補EPSPS活性。
類似地,在另外的實施方案中,本發(fā)明人在惡臭假單胞菌草甘膦抗性EPSPS中成功實施了5個拆分點,其中3個在折疊單元之間的連接區(qū)中,1個在α螺旋與β折疊之間的連接區(qū)中,1個在β折疊中。如此拆分所得到的片段同樣可以互補EPSPS活性。
EPSPS的活性能夠通過片段互補而重建,這意味著該蛋白內(nèi)的非共價作用十分特異,從而使片段有利于形成天然的具有EPSPS功能的結構,而不會形成其它的結構。此外該蛋白能夠發(fā)生片段互補,這表明,斷開一些區(qū)域中的共價鍵時,該蛋白仍舊可以保持結構穩(wěn)定性,兩個肽鏈之間不必通過共價鍵,而僅通過各種非共價作用如氫鍵、鹽橋及疏水作用等緊密結合在一起。在EPSPS的片段互補中,疏水作用可能起著更大的作用。EPSPS的兩個片段之間存在很強的兩對疏水作用區(qū)域,形成兩個“鉤子”將蛋白穩(wěn)定在一起。
本發(fā)明共純化得到了多個由相對應的拆分片段組成的復合體,但是純化出的蛋白量卻有很大的差異,這說明片段互補在體內(nèi)都可以形成,但是復合體形成的難易程度是不同的。有些區(qū)域共價鍵的斷裂對蛋白結構的穩(wěn)定性影響比較大,有些區(qū)域共價鍵的斷裂對蛋白結構的穩(wěn)定性影響比較小。C端肽鏈引入一個甲硫氨酸(起始密碼子所編碼的氨基酸)也有可能影響蛋白結構的穩(wěn)定性,從而導致蛋白片段互補不能發(fā)生。
大腸桿菌EPSPS的復合體N240/C241也可以被大量的共純化出,但是它卻不能互補大腸桿菌aroA基因突變菌株AB2829在限制性培養(yǎng)基上的生長,這是由于復合體N240/C241的EPSPS的活性遠低于野生型全長EPSPS。其活性的丟失可能有以下兩個原因一是N240/C241的分拆位點與Asp242十分接近,Asp242在結合底物引發(fā)結構變構過程中起著非常重要的作用,在C241中引入一個甲硫氨酸可能會影響到Asp242的功能從而使其酶活性喪失;第二個原因可能是N240/C241的分拆位點位于兩個結構域的中間,其形成的復合體中只有一對疏水作用區(qū)域,雖然它們之間的疏水作用足以使兩個蛋白片段形成復合體,但由于缺少另外一對疏水區(qū)域,這個復合體的結構可能與野生蛋白的結構有所不同,從而使酶活性喪失。因此,對分拆位點的選擇應基于結構變化對酶活性的影響來考慮。
EPSP合酶的在植物細胞中的定位Bickel等(Phytochemistry17119-124,1978)發(fā)現(xiàn),植物的芳香族氨基酸在葉綠體內(nèi)進行合成。Mousdale等隨后證明,植物的EPSP合酶定位于葉綠體內(nèi)膜上(Planta,1987,1701~6;Plant Physiol.,1987,83229~231;J Biol Chem1988 Oct 15;263(29)15104-9;Mol Gen Genet 1994 Dec1;245(5)616-22;MolGen Genet 1993 Jun;239(3)416-24)。Della-Cioppa等(Bio/Technology 1987(5)579~584)的實驗表明矮牽牛前體EPSP合酶(precursor EPSPS)分子量為55kDa,前72氨基酸殘基為前導肽,當前體EPSP合酶進入葉綠體后經(jīng)加工剪切運輸肽而成為成熟EPSP合酶(mature enzyme),成熟EPSP合酶分子量為48kDa。前導肽對前體EPSP合酶進入葉綠體起著重要作用,微生物EPSP合酶因無前導肽,故用微生物EPSP合酶基因在轉入植物細胞中時其基因前端需加上植物前導肽序列,否則其表達的EPSP合酶不能進入葉綠體。
應用本發(fā)明的EPSPS片段互補技術可應用于轉基因植物,以防止抗草甘膦基因的擴散帶來的生態(tài)風險。例如,將EPSPS的N端片段在植物核染色體中表達,而將其C端片段在植物的葉綠體中表達。單獨表達的一種EPSPS片段都不具有EPSPS的活性,因此其基因擴散沒有選擇優(yōu)勢。當兩種片段的基因共同表達時,兩個EPSPS片段可以在葉綠體中發(fā)生互補而重建EPSPS活性,從而使植物對草甘膦產(chǎn)生抗性。也可以將編碼兩個EPSPS片段的基因插入葉綠體基因組的不同位置,在這種情況中,兩種基因共同轉移到染色體上的概率大大降低,從而降低轉基因擴散發(fā)生的概率。關于控制植物中細胞過程的方法可參見WO2004/046359和WO2004/046360。
圖1顯示pKU2004的質粒圖譜。
圖2EPSPS的結構示意圖及分拆位點的選擇。圖2A為EPSP合酶的拓撲結構,圖2B為EPSP合酶的一個結構單元。
圖3質粒構建示意圖。A.將EPSPS的C-末端片段亞克隆到pKU2100載體的Tet啟動子之后。B.將EPSPS的N-末端亞克隆到pACYC184載體的Tet啟動子之后。C.將EPSPS編碼基因的N-末端部分亞克隆到衍生于pACYC184的質粒載體的T7啟動子之后。D.將EPSPS的C-末端部分構建到pET28a載體中,并且在C-末端尾部帶有6個His組成的標簽。
圖4EPSPS片段的蛋白免疫印跡分析。將表達所示EPSPS的細胞溶于SDS樣品緩沖液中,經(jīng)SDS-PAGE和免疫印跡來分析等量蛋白(來自~0.8μg濕重的細胞)和純化的蛋白。圖中示出了以下純化蛋白的量N218/C219(來自~150ml濕重的細胞),N227/C228(來自~20μg濕重的細胞),N234/C235(來自~500μg濕重的細胞),N240/C241(來自~40μg濕重的細胞),N245/C246(來自~500μg濕重的細胞)和pACYC184/pBR322(來自~500μg濕重的細胞)。標準分子量的位置示于圖左,單位為千道爾頓(kd)。
圖5.EPSPS的圓二色性光譜分析。系列1為野生EPSPS,系列2為N227/C228復合體。
圖6表達有不同EPSPS的大腸桿菌aroA基因缺陷菌株AB2829,在限制性培養(yǎng)基(即添加了所示濃度的草甘膦的液體M63基本培養(yǎng)基)中的生長情況。
圖7a大腸桿菌EPSPS的SDS-PAGE電泳圖。1N218;2C219;3EcEPSPS;4共復性N218+c219;5N218+c219(單獨復性后一起);6分子量標準。
圖7b大腸桿菌EPSPS的native-PAGE電泳W(wǎng)estern印跡圖。1N218+C219(單獨復性后一起);2空白對照;3共復性N218/C219;4空白對照;5野生型EPSPS。
具體實施例方式
實施例1大腸桿菌EPSPS的重建1材料與方法1.1菌株與質粒用于本實驗的菌株和質粒列在表1中。
表1.用于本研究中的細菌菌株和質粒
Ap,氨卞青霉素;Cm,氯霉素;Km,卡那霉素;R,抗性;,刪除;∷,融合;1.2培養(yǎng)基LB培養(yǎng)基每升所含成分胰蛋白胨10g酵母提取物 5gNaCl10g補足水并用2M的NaOH調至pH7.0~7.5左右,固體培養(yǎng)基加1.5%的瓊脂粉。使用前15磅壓力,121℃高溫滅菌20min后備用。
篩選氨芐青霉素抗性菌株在培養(yǎng)基中加Ap至50μg/ml。
篩選卡那霉素抗性菌株在培養(yǎng)基中加Km至25μg/ml。
篩選氯霉素抗性菌株在培養(yǎng)基中加Cm至25μg/ml。
限制性M63培養(yǎng)基13.6g/L KH2PO4,0.5mg/L FeSO4-7H2O,20mM(NH4)2SO4,0.4%葡萄糖,1mM硫酸鎂,0.5mg/L維生素B1。
1.3試劑限制性內(nèi)切酶,T4DNA連接酶,TaqDNA聚合酶,DNA marker等購于Takara生物公司。考馬斯亮藍G250,烯醇式丙酮酸(sigma),莽草酸-3-磷酸(Amrehin教授贈送);HisTrap HP kit(Amersham Biosciences),羊抗兔IgG(promega);其余化學藥品均為分析純試劑。
1.4遺傳學操作質粒DNA的制備、限制性內(nèi)切酶的消化、連接反應、Tris-硼酸-EDTA緩沖液水平瓊脂糖電泳、聚丙烯酰胺凝膠電泳及western雜交等按照標準方法(Molecular CloningA Laboratory Manual,2nd edition.(Sambrook,F(xiàn)ritschand Maniatis,eds.),Cold Spring Harbor Laboratory Press,1989)進行。
1.5質粒構建a.pKU2008、pKU2009的構建用引物115’-CGGGATCCAGGTCCGAAAAAAAACGCCGAC3’和引物125’-CGGGATCCATGGAATCCCTGACGTTACA3’以pKU2004為模板,對大腸桿菌的aroA基因進行擴增,連入pET28a載體得到pKU2008,該質粒編碼的EPSPS為N端帶有His標簽的融合蛋白。將pKU2008用NcoI酶切,自我連接得到pKU2009,該質粒編碼的蛋白為大腸桿菌野生型EPSPS。
b.pKU2100系列質粒(編碼EPSPS的C端肽鏈)的構建用引物135’-TGAGTGACTGACTTTAAGAAGGAGATATAC3’和引物145-CGGGATCCTCACTGATTTTCAATTTCAACAC3’以pKU2009為模板進行PCR擴增,擴增產(chǎn)物經(jīng)BamHI酶切連入pBR322的EcoR V和BamHI位點,得到質粒pKU2100。以pKU2009為模板,分別以對應引物進行擴增得到編碼大腸桿菌EPSPS的C端的基因,將擴增產(chǎn)物連接入pKU2100的NcoI和BamHI位點,分別得到質粒pKU2102、pKU2125、pKU2126、pKU2130和pKU2262,這些質粒分別編碼大腸桿菌EPSPS的C端肽鏈(表1,圖3)。
c.pACYC184系列質粒(編碼EPSPS的N端肽鏈)的構建以pKU2009為模板,分別以對應引物進行PCR擴增,得到編碼大腸桿菌EPSPS的N端的基因,將擴增產(chǎn)物連接入pACYC184的EcoR V和BamHI位點,分別得到質粒pKU2101、pKU2125、pKU2126、pKU2130和pKU2263,這些質粒分別編碼大腸桿菌EPSPS的N端氨基酸序列(表1,圖3)。
d.pET28a系列表達質粒的構建將上述b步驟中構建的pBR322系列質粒和c步驟中構建的pACYC184系列質粒分別用NcoI和BamHI酶切,回收合適片段連接入pET28a載體中,得到用于表達EPSPS的N端和C端的pET28a系列表達質粒(表1)。
e.pACYC-T7系列表達質粒的構建將用于表達EPSPS的N端的pET28a質粒分別用BglII和SalI酶切,回收所需片段連接入pACYC184載體的BamHI和salI位點得到pACYC-T7系列表達質粒(表1,圖3)。
f.pET28a系列表達質粒(用于表達C端His-taq融合蛋白)的構建以pKU2009為模板,分別以對應引物進行擴增得到編碼大腸桿菌EPSPS相應部分的基因,將擴增產(chǎn)物用XhoI和NcoI酶切后連接入pET28a載體中得到pET28a系列表達質粒,該系列質粒所編碼的EPSPS的C端融合有6個組氨酸以便于利用鎳柱純化蛋白(圖3)。
g.用于菌株突變的質粒pKU2229的構建以大腸桿菌BL21(DE3)的染色體為模板,用引物進行PCR擴增反應,得到其aroA基因上游長約600bp的片段,將其連入pBlueScript(stratagene)的BamHI和HindIII位點得到質粒pKU2223。以質粒pBlueScript為模板,用引物進行PCR擴增反應,得到長約900bp的bla基因,將其連接入pBlueScript(stratagene)的HindIII和EcoRI位點得到質粒pKU2224。以大腸桿菌BL21(DE3)的染色體為模板,用引物進行PCR擴增反應,得到其aroA基因下游長約500bp的片段,將其連入pBlueScript(stratagene)的EcoRI和SalI位點得到質粒pKU2225。酶切回收pKU2225中的片段連接入pKU2223的EcoRI和SalI位點得到質粒pKU2227。酶切回收pKU2224中的片段連接入pKU2227的HindIII和EcoRI位點得到質粒pKU2228。酶切回收pKU2228中的BamHI和SalI間的片段連接入pKO3載體中得到質粒pKU2229。
以上所有構建質粒均測序保證其序列正確。
1.6突變菌株BA-的構建利用pKO3來源質粒pKU2229將BL21(DE3)的aroA基因替換為導致氨芐青霉素抗性的bla基因。具體步驟為將pKU2229轉化入BL21(DE3)中,挑取一個轉化子稀釋后涂布于帶有Ap和Cm抗生素的LB固體平板上,43℃過夜培養(yǎng),由于pKO3的復制子在43℃不能正常起始復制,因此pKU2229只有重組到染色體上,菌株才能在43℃含有Ap和Cm抗生素的平板上生長。挑取一個重組后的菌落,稀釋后涂布到含有5%蔗糖的僅含有Ap抗生素的LB培養(yǎng)基上,過夜培養(yǎng)。由于pKO3帶有Sac B基因,該基因編碼的蛋白質分解蔗糖后對細菌產(chǎn)生毒性,導致帶有Sac B基因的細菌不能在含有5%蔗糖的培養(yǎng)基上生長,因此在含有5%蔗糖及Ap抗生素的LB培養(yǎng)基上生長的菌落,又一次發(fā)生同源重組,使aroA基因和sac B基因丟失。挑取幾個菌落,劃線于Cm平板和M63平板,確定aroA基因確實被刪除,提取其總DNA,進行PCR擴增反應以最終確定bla基因替換掉aroA基因。
1.7體內(nèi)互補實驗將如上述構建的pKU2100質粒和相應的pACYC1184質粒分別轉入或共轉入大腸桿菌aroA基因缺陷的菌株AB2829中,然后將其劃線于M63限制性固體培養(yǎng)培養(yǎng)基上,過夜培養(yǎng)檢測其生長情況。
1.8生長曲線實驗將帶有質粒pKU2004、pKU2006和pKU2007的大腸桿菌aroA基因突變菌株AB2829接種于LB液體培養(yǎng)基中過夜培養(yǎng),取菌液4000rpm離心3分鐘,用0.9%生理鹽水懸浮,再次離心,棄去上清,并用生理鹽水重新懸浮,接入含有0、50和100mM草甘膦的液體培養(yǎng)基中,初始接菌量為OD6000.04,37℃過夜培養(yǎng),并定時測光吸收(OD600)。
1.9蛋白的表達與純化將帶有目的質粒的BA-菌接入含有相應抗生素的LB液體培養(yǎng)基中,在37℃搖床培養(yǎng)至OD6000.75左右,加入終濃度為0.5mM的IPTG,15℃過夜培養(yǎng)。將菌液在4℃、5000rpm離心10分鐘收集菌體,按體積比10∶1重懸至緩沖液A(50mM Tris-HCl(pH 7.8),0.4mM DTT)中,超聲波破碎菌體,4℃、8000rpm離心60分鐘。
將離心后的上清液用HisTrap HP kit(Amersham Biosciences)按照使用說明進行蛋白純化。純化后的蛋白利用Millipore Biomax membrane(10kDa)濃縮于緩沖液A中,4℃保存。
1.10EPSPS多克隆抗體的制備將帶有質粒pKU2008的BL21(DE3)菌株按以上步驟進行表達純化,最后將蛋白濃縮,重懸于PBS緩沖液中。以此蛋白為抗原,對兔子進行免疫反應,經(jīng)過四次反應,一次加強反應后取血清(此過程由中科院遺傳所完成),用ELASA檢測抗體效價后備用。
1.11聚丙烯酰胺凝膠電泳SDS-聚丙烯酰胺凝膠電泳凝膠的上層濃縮膠濃度為5%,下層分離膠濃度一般為16%。Native-聚丙烯酰胺凝膠電泳凝膠的濃度為10%。凝膠、電泳緩沖液的配置及電泳方法參見Sambrook等,出處同上。
1.12圓二色性光譜(CD spectra)的測定遠紫外和近紫外CD光譜的測量在一臺接有恒溫水浴循環(huán)控制儀的Jobin Yvon CD6上進行。每條曲線是4次測量的平均。測量溫度為8℃。進行近紫外圓二色性光譜測定時使用1-cm pathlength cylinder quartz cuvette,而遠紫外圓二色性光譜測定時使用0.1-mm pathlength cylinder quartz cuvette。
1.13EPSPS片段的蛋白免疫印跡實驗轉膜及免疫印跡反應方法參見Sambrook等,出處同上。簡要步驟為蛋白經(jīng)過16%SDS-聚丙烯酰胺凝膠電泳后轉移至硝酸纖維素膜上,將膜與1∶2000稀釋的兔的多克隆抗體雜交,抗體抗原復合物進一步與結合有辣根過氧化物酶的第二抗體-羊抗兔IgG(promega)反應形成復合物。顯色反應采用辣根過氧化物酶分解DAB(華美生物工程公司)的方法,具體操作見說明書。
1.14EPSPS活性測定酶活性的測定(1)取95μl底液(在反應體系中濃度為50mmol/L HEPE Sbuffer(pH7.5),1mmol/L PEP,1mmol/L S3P),于28℃的培養(yǎng)箱中預熱5min。
(2)加5μl酶液,在28℃培養(yǎng)箱中放置1-20min(以酶量活性決定時間長短),加800μl MG/AM/NP混合1min。
(3)加100μl的34%的檸檬酸鈉溶液,混合后半小時于660nm的分光光度計上測定OD值。
1.15體外互補實驗將EPSPS的N端和C端分別在BA-中表達,離心收集菌體后超聲波破碎,電泳檢測目的蛋白是否主要形成包涵體從而聚集在沉淀中。收集沉淀,先用緩沖液B(50mM Tris-HCl(pH7.8),1mM EDTA,0.05%的Titon-100)洗三次,再用1M氯化鈉溶液洗三次,再用緩沖液C(50mM Tris-HCl(pH7.8),1mM EDTA,1M尿素)洗三次,最后用蒸餾水洗三次。將洗滌完畢后的沉淀加入還有8M尿素的緩沖液A中,充分溶解后離心取上清轉入透析袋中。先用還有2M尿素的緩沖液D(50mM Tris-HCl(pH7.8),1mM GSH,0.5mMGSSG)透析過夜,再用緩沖液D透析36小時,最后用PEG12000濃縮。復性產(chǎn)物通過電泳、免疫反應及酶活性檢測加以分析。
2.大腸桿菌EPSPS的片段互補結果2.1體內(nèi)功能互補實驗為了檢測EPSPS能否體內(nèi)表達形成片段互補,分別將編碼EPSPS的N端肽鏈的基因構建在pACYC184載體上,而將編碼EPSPS的C端肽鏈的基因構建在pBR322載體上(具體構建過程見方法)。然后將這些質粒分別轉入大腸桿菌的aroA基因突變菌株AB2829中,通過檢測其是否能在M63限制性培養(yǎng)基上生長,來確定該基因編碼的蛋白片段是否仍具有EPSPS活性。結果,僅帶有編碼N端或C端EPSPS編碼基因的AB2829不能在M63培養(yǎng)基上生長。
由于pACYC184和pBR322質粒分別具有復制子p15A and ColE1,因此這兩個質??梢栽谕粋€細菌中共表達。我們于是將編碼EPSPS的N端肽鏈的pACYC184系列質粒,和在同一個位點分拆的編碼EPSPS的C端肽鏈的pKU2100系列質粒,共轉化入大腸桿菌的aroA基因突變菌株AB2829中,將其劃線于M63限制性培養(yǎng)基平板上37℃培養(yǎng)。16小時后,分別帶有編碼EPSPS的N218/C219(pKU2101/pKU2102)和N227/C228(pKU2125/pKU2138)質粒的AB2829可以在限制性培養(yǎng)基上生長,而帶有其它三對質粒pKU2126/pKU2137(N234/C235)、pKU2162/pKU2163(N240/C241)和pKU2110/pKU2130(N245/C246)的AB2829不能在M63培養(yǎng)基上生長。這說明,EPSPS片段(N218/C219和N227/C228)在體內(nèi)分別表達時,可以互補形成EPSPS活性,其它三對EPSPS的片段在體內(nèi)不能互補EPSPS活性。
2.2EPSPS片段復合體的純化和檢測為了確定是否因為編碼EPSPS片段的基因在體內(nèi)發(fā)生重組而導致合成全長EPSPS并恢復EPSPS活性,將蛋白片段共純化出來,體外檢測酶活性及蛋白片段大小,以確定EPSPS活性恢復確實是因為片段互補的原因。為此,構建了用于表達EPSPS片段的質粒,其中N端構建于pACYC184載體上,而蛋白C端構建于pET28a載體上,都由T7啟動子起始轉錄表達,其中EPSPS的C端肽鏈的C端融合有6個組氨酸(質粒構建見方法見上文)。如果EPSPS的兩個蛋白片段能夠體內(nèi)重建,形成天然EPSPS的結構,那么分拆后的EPSPS的N端肽鏈,將與相應的EPSPS C端肽鏈結合,并且該復合體可以被鎳柱所吸附而共純化出來。為了消除細菌染色體上aroA基因編碼的EPSPS的影響,將大腸桿菌BL21體內(nèi)編碼EPSPS的aroA基因,替換為編碼β-內(nèi)酰胺酶的bla基因,得到aroA基因刪除菌株BA-。將相應的兩個系列的質粒,轉化入BA-菌株中共表達。首先將其劃線于涂有IPTG的M63平板上,過夜培養(yǎng)檢測其體內(nèi)互補情況。結果與前面一致,帶有N218/C219、N227/C228片段編碼基因的BA-,可以在M63限制性培養(yǎng)基上生長;帶有其它三對片段編碼基因的BA-,不能在M63限制性培養(yǎng)基上生長。將EPSPS的N端肽鏈和C端肽鏈在BA-中分別表達或共表達,SDS-PAGE檢測,結果表明它們均能正常表達。用HisTrap HP kit對共表達的蛋白進行純化,純化后的蛋白SDS-聚丙烯酰胺凝膠電泳后,用制備好的EPSPS的抗體進行檢測(具體步驟見方法)。結果如圖4所示,純化后的蛋白中不僅有EPSPS的C端肽鏈,而且也有其對應的N端肽鏈。這些蛋白片段都與預計的片段大小一致,這說明在體內(nèi)表達的EPSPS的片段,可以互補形成復合體從而被共純化出來。從圖中也看出,共表達的蛋白無論是純化前還是純化后都沒有全長的蛋白,這表明體內(nèi)沒有發(fā)生重組,因此沒有形成全長EPSPS基因?;钚栽囼炓诧@示,純化出的蛋白都具有EPSPS活性。以上的結果表明,EPSPS活性可以由在體內(nèi)分別表達的肽鏈發(fā)生片段互補而形成。
EPSPS的N端肽鏈和C端肽鏈雖然在體內(nèi)表達量可能有所差異,如N227的表達量遠大于C228的表達量,但是純化后N端和C端蛋白片段的含量幾乎都是1∶1的關系。從圖中也可以看出,純化出的N234/C235、N245/C246量遠遠少于其它三個共純化的EPSPS,這可能是其不能在體內(nèi)互補EPSPS活性以使AB2829在限制性培養(yǎng)基上生長的原因。雖然N240/C241復合體純化出的量甚至多于N218/C219,但是它卻不能互補AB2829在限制性培養(yǎng)基上的生長,這是因為其EPSPS活性比較低的原因2.3測定酶活性為了對N218/C219、N227/C228這兩個能重建酶活性的復合體進行進一步的研究,將上一步用HisTrap HP kit純化后N218/C219、N227/C228及全長的EPSPS用Sephadex-G75柱進行進一步純化,純化結果表明N218/C219、N227/C228及全長的EPSPS具有同一個洗脫峰,表明其分子量及結構大致相同。隨后測定了這三個蛋白的酶活性及對底物的Km值,結果如表2,從表中可以看出,片段互補后的EPSPS復合體N218/C219及N227/C228的酶的活力分別約為全長EPSPS的70%和64%,而對底物的親和力并沒有太大的改變,這表明重建的EPSPS結構比較穩(wěn)定。
表2.EPSPS及重建后EPSPS的酶學性質
a以上結果為兩次獨立實驗,每次實驗至少有三個平行。
b酶比活力測定PEP和S3P的濃度均為1.0mM。
c測定Km[PEP]時,S3P濃度不變?yōu)?mM,PEP濃度從50到200μM。
d測定Km[S3P]時,PEP濃度不變?yōu)?mM,S3P濃度從50到200μM。
2.4圓二色性光譜(CD spectra)的分析為了確定,片段互補重建所得的EPSPS是否與野生型EPSPS結構一致,對EPSPS及復合體N227/C228進行了圓二色性光譜分析。EPSPS與N227/C228的遠紫外CD光譜基本沒有顯著差異(圖5),這意味著它們的二級結構幾乎是相同的。但近紫外CD光譜之間有所差異(圖5),表明重建的EPSPS與野生型EPSPS結構還是有所差異。
2.5大腸桿菌突變型EPSPS的體內(nèi)互補為了檢測突變后的EPSPS片段是否可以在體內(nèi)進行功能互補,分別構建了質粒pKU2105和pKU2333,它們分別編碼大腸桿菌EPSPS的兩個N端片段N218-G96A和N227-G96A。將它們與相應的編碼C219和C228的質粒分別轉入大腸桿菌aroA基因的突變菌株AB2829(aroA-,來源于耶魯大學))中,在帶有不同濃度草甘膦的M63限制性培養(yǎng)基中檢測其生長情況,結果如圖6。從圖中可以看到,在未加草甘膦的M63培養(yǎng)基中,帶有不同質粒的AB2829均生長良好,沒有明顯的差異。在含有50mM草甘膦的M63培養(yǎng)基中,表達有突變的EPSPS全酶(EPSPS-G96A)或突變的互補片段(N227-G96A/C228和N218-G96A/C219)的菌株生長較好,而表達有野生型EPSPS或野生互補片段的菌株生長被阻遏。表達有EPSPS-G96A或N227-G96A/C228的菌株在含有100mM草甘膦的M63培養(yǎng)基中仍舊生長良好,而表達有N218-G96A/C219的菌株生長稍差,這可能是在體內(nèi)N2227-G96A/C228復合體更容易形成的原因。
2.6體外EPSPS的重建蛋白片段能在體內(nèi)互補形成有活性的復合體,那么在體外同樣有可能互補形成有活性的復合體。為此,分別表達了EPSPS的N端肽鏈N218和C端肽鏈C219。EPSPS片段的大量表達形成包涵體,對包涵體進行初步純化后,將它們一起復性(操作步驟見方法)。復性結束后對其進行電泳分析,結果見圖7。從圖7a中我們可以看出,EPSPS的各個片段出現(xiàn)在預計的位置,并沒有全長的EPSPS。當將其體外共復性之后,native-PAGE結果可以出現(xiàn)與野生EPSPS一致的條帶,將單獨復性后的N218和C219混合在一起時并沒有此帶,這說明體外EPSPS共復性后可以互補形成類似于野生EPSPS的結構?;钚詫嶒炓脖砻?,N218/C219共復性可以互補形成EPSPS活性,而單獨復性后的N218和C219混合在一起并不能互補形成EPSPS活性。
3.EPSPS的片段互補與結構的關系3.1所用的菌株和質粒見下表。
表3.用于本研究中的細菌菌株和質粒
Ap,氨卞青霉素;Cm,氯霉素;R,抗性。
3.2培養(yǎng)基參看本實施例1.2節(jié)。
3.3試劑限制性內(nèi)切酶,T4DNA連接酶,DNA聚合酶,DNAmarker等購于Takara生物公司。其余化學藥品均為分析純試劑。
3.4遺傳學操作質粒DNA的制備、限制性內(nèi)切酶的消化、連接反應、Tris-硼酸-EDTA緩沖液水平瓊脂糖電泳、按照標準方法進行(Maniatis等,1982)。
3.5質粒構建
a.pBR322系列質粒(編碼EPSP合酶C端肽鏈)的構建以pKU2009(大腸桿菌aroA基因)為模板,分別以對應引物(進行擴增得到編碼大腸桿菌EPSP合酶C端的基因,將擴增產(chǎn)物連接入pKU2100的NcoI和BamHI位點,得到編碼EPSP合酶C端肽鏈系列質粒(表3)。
b.pACYC184系列質粒(編碼EPSP合酶N端肽鏈)的構建以pKU2009或pGMO為模板,分別以對應引物進行擴增得到編碼大腸桿菌EPSP合酶N端的基因,將擴增產(chǎn)物連接入pACYC184的EcoR V和BamHI位點,分別得到編碼EPSP合酶N端肽鏈系列質粒(表3)。
以上所有構建質粒均測序保證其序列正確。
3.6體內(nèi)互補實驗將3.5a中構建的pBR322系列質粒和b中構建的pACYC1184系列質粒分別轉入或相對應兩個質粒共轉入大腸桿菌aroA基因缺陷的菌株AB2829中,然后將其劃線于M63限制性固體培養(yǎng)培養(yǎng)基上,過夜培養(yǎng)檢測其生長情況。
3.7結果基于大腸桿菌EPSPS的結構一共設計了21個分拆位點,進行了EPSPS片段互補研究。有三個分拆位點在α螺旋上,其中N31/C32和N245/C246都不能互補大腸桿菌aroA基因突變菌株AB2829在限制性培養(yǎng)基上的生長,而N105/C106互補情況較差;有三個拆分位點在β折疊上,其中N73/C74和N238/C239不能互補EPSP酶活性,而N224/C225可以互補AB2829在限制性培養(yǎng)基上的生長;有5個在β折疊或α螺旋之間的連接區(qū)域上,其中僅有N165/C166不能互補AB2829在M63培養(yǎng)基上的生長,而其它四對EPSPS的片段都可以互補EPSPS活性;分拆位點在兩個折疊單元之間的有6個,其中僅有N234/C235不能互補EPSPS的活性,其它五對片段都能互補AB2829在M63培養(yǎng)基上的生長,而且互補情況較好。
表4大腸桿菌EPSPS片段互補
-,不能生長;+,可以生長。
實施例2惡臭假單胞菌草甘膦抗性EPSPS的片段互補利用惡臭假單胞菌CGMCC0739的草甘膦抗性EPSPS基因進行片段互補實驗。所用的質粒,培養(yǎng)基,菌株,以及實驗步驟都參見實施例1。通過在含有100mM草甘膦的培養(yǎng)基上生長來檢測重建的酶活性。
表5惡臭假單胞菌草甘膦抗性EPSPS的片段互補
所用引物如下N端正向引物ppN5’5’-TGA GTG ACT GAA AGT GAA AGT AAC AAT ACA G-3’N端反向引物見下。
C端反向引物PPC3’(BamHI)5’-CGG GAT CCC TTC TTC GGA CAA TGA CAG AC-3’C端正向引物見下。
N208/C209+ppN2083’(BamHI)5’-CGG GAT CCT CAG GGA GTC TTC AAA CCA AAC C-3’ppC2095’(NcoI)5’-CAT GCC ATG GAG AAT CGA AAC TAT GAA G-3’N214/C215+ppN2143’(BamHI)5’-CGG GAT CCT CAT TCA TAG TTT CGA TTC TCG G-3’ppC2155’(NcoI)5’-CAT GCC ATG GAG TTT TAT TTC AAA GCC GG-3’N219/C220++ppN2193’(BamHI)5’-CGG GAT CCT CAT TTG AAA TAA AAC TCT TCA TAG-3’ppC2205’(NcoI)5’-CAT GCC ATG GCC GGG AAT GTA TAT GAT GAA AC-3’N222/C223+ppN2223’(BamHI)5’-CGG GAT CCT CAA TTC CCG GCT TTG AAA TAA AAC-3’ppC2235’(NcoI)5’-CAT GCC ATG GTA TAT GAT GAA ACG AAA ATG-3’N224/C225++ppN2243’(BamHI)5’-CGG GAT CCT CAA TAT ACA TTC CCG GCT TTG-3’ppC2255’(NcoI)5’-CAT GCC ATG GAT GAA ACG AAA ATG CAA CG-3’N233/C234ppN2333’(BamHI)5’-CGG GAT CCT CAG GTG TAT CGT TGC ATT TTC G-3’ppC2345’(NcoI)5’-CAT GCC ATG GTA GAA GGC GAC TGG AGC G-3’N234/C235ppN2343’(BamHI)5’-CGG GAT CCT CAT ACG GTG TAT CGT TGC ATT TTC-3’ppC2355’(NcoI)5’-CAT GCC ATG GAA GGC GAC TGG AGC GGT GG-3’N236/C237ppN2363’(BamHI)5’-CGG GAT CCT CAG CCT TCT ACG GTG TAT CGT TG-3’ppC2375’(NcoI)5’-CAT GCC ATG GAC TGG AGC GGT GGT GCT TT-3’
序列表<110>北京大學王憶平,孫義成,李燕<120>利用片段互補技術重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性<130>
<141>
<160>79<170>PatentIn version3.1<210>1<211>1501<212>DNA<213>惡臭桿菌P.P4G-1(Pseudomonas putida P.P4G-1)<400>1agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 60ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct 120gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga 180gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt 240ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca 300cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca 360atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag 420cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca 480gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta 540atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc 600cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg 660gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg 720accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat 780accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag 840tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca 900aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg 960aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg 1020
gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa 1080gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa 1140ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt 1200acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt 1260ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga 1320agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg 1380tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc 1440gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt 1500a 1501<210>2<211>1914<212>DNA<213>惡臭桿菌P.P4G-1(Pseudomonas putida P.P4G-1)<220>
<221>CDS<222>(508)..(1800)<223>
<400>2gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa 60tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca 120gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa 180ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc 240ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca 300aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga 360tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa 420ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt 480agaaaaaatc attcaagcat taccaaa gtg aaa gta aca ata cag ccc gga gat 534Met Lys Val Thr Ile Gln Pro Gly Asp1 5ctg act gga att atc cag tca ccc gct tca aaa agt tcg atg cag cga 582Leu Thr Gly Ile Ile Gln Ser Pro Ala Ser Lys Ser Ser Met Gln Arg10 15 20 25gct tgt gct gct gca ctg gtt gca aaa gga ata agt gag atc att aat 630Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Set Glu Ile Ile Asn30 35 40
ccc ggt cat agc aat gat gat aaa gct gcc agg gat att gta agc cgg 678Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg45 50 55ctt ggt gcc agg ctt gaa gat cag cct gat ggt tct ttg cag ata aca 726Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr60 65 70agt gaa ggc gta aaa cct gtc gct cct ttt att gac tgc ggt gaa tct 774Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser75 80 85ggt tta agt atc cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa 822Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu90 95 100 105gag gtg acg atc aaa gga tct gga agc ctt gtt aca aga cca atg gat 870Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp110 115 120ttc ttt gat gaa att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac 918Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn125 130 135cag ggt aaa ttg cct ctc gtt ata cag ggg cca ttg aaa cca gca gac 966Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp140 145 150gtt acg gtt gat ggg tcc tta agc tct cag ttc ctt aca ggt ttg ttg 1014Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu155 160 165ctt gca tat gcg gcc gca gat gca agc gat gtt gcg ata aaa gta acg 1062Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr170 175 180 185aat ctc aaa agc cgt ccg tat atc gat ctt aca ctg gat gtg atg aag 1110Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys190 195 200cgg ttt ggt ttg aag act ccc gag aat cga aac tat gaa gag ttt tat 1158Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr205 210 215ttc aaa gcc ggg aat gta tat gat gaa acg aaa atg caa cga tac acc 1206Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr220 225 230gta gaa ggc gac tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct 1254Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala235 240 245att gcc ggg ccg atc acg gta aga ggt ttg gat ata gct tcg acg cag 1302Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln250 255 260 265gct gat aaa gcg atc gtt cag gct ttg atg agt gcg aac gca ggt att 1350
Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile270 275 280gcg att gat gca aaa gag atc aaa ctt cat cct gct gat ctc aat gca 1398Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala285 290 295ttt gaa ttt gat gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt 1446Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val300 305 310gct ttg gcg tct tat tgc aaa gga gaa aca aag atc aaa ggc gta agc 1494Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser315 320 325agg ctg gcg cat aaa gaa agt gac aga gga ttg acg ctg cag gac gag 1542Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu330 335 340 345ttc ggg aaa atg ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc 1590Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg350 355 360gtg atc gga ggg aaa ggc gta aaa gga gct gaa gtt agt tca agg cac 1638Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His365 370 375gat cat cgc att gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg 1686Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val380 385 390ggt gaa aca acc atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg 1734Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro395 400 405gat ttt tac agc gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac 1782Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn410 415 420 425cat caa ttt aat ttc tca tgaatagctt cggccgcatc ttcagggtgc1830His Gln Phe Asn Phe Ser430atatttttgg cgaatcacat ggtgaatcag taggcatcgt tattgatggt tgtcctgctg 1890gtctgtcatt gtccgaagaa gatc 1914<210>3<211>431<212>PRT<213>惡臭桿菌P.P4G-1(Pseudomonas putida P.P4G-1)<400>3Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Tle Ile Gln Ser1 510 15
Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val20 25 30Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp35 40 45Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp50 55 60Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val65 70 75 80Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe85 90 95Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser100 105 110Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro115 120 125His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val130 135 140Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu145 150 155 160Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp165 170 175Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr180 185 190Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro195 200 205Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr210 215 220Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly225 230 235 240Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val245 250 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln260 265 270Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile275 280 285Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp290 295 300Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys305 310 315 320Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser325 330 335Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu340 345 350Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val355 360 365Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala370 375 380Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His385 390 395 400Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys405 410 415Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser420 425 430<210>4<211>20<212>DNA<213>人工序列<400>4agagtttgat catggctcag 20<210>5<211>22<212>DNA
<213>人工序列<400>5tacggttacc ttgttacgac tt 22<210>6<211>34<212>DNA<213>人工序列<400>6cgggatccta agtaagtgaa agtaacaata cagc 34<210>7<211>29<212>DNA<213>人工序列<400>7cgggatccct tcttcggaca atgacagac 29<210>8<211>33<212>DNA<213>人工序列<400>8cgggatccgt taatgccgaa attttgctta atc 33<210>9<211>30<212>DNA<213>人工序列<400>9cgggatccag gtccgaaaaa aaacgccgac 30<210>10<211>1436<212>DNA<213>大腸桿菌(Escherichia coli)<400>10gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg 60tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact 120attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca 180cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat 240gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt 300
atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc360ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg420accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg480ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc540ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca600ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg660gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt720gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt780acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc840aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc900tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc960tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg1020atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat1080aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc1140ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac1200tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg1260ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat1320tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata1380gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct1436<210>11<211>30<212>DNA<213>人工序列<220>
<223>大腸桿菌(E.coli)aroA上游引物<400>11cgggatccag gtccgaaaaa aaacgccgac 30<210>12<211>28<212>DNA<213>人工序列<220>
<223>大腸桿菌(E.coli)aroA下游引物
<400>12cgggatccat ggaatccctg acgttaca 28<210>13<211>29<212>DNA<213>人工序列<220>
<223>pACYC(大腸桿菌(E.coli)aroA)系列上游引物<400>13tgagtgactg actttaagaa ggagatata 29<210>14<211>28<212>DNA<213>人工序列<220>
<223>pBR322(大腸桿菌(E.coli)aroA)系列下游引物<400>14gccacgatgc gtccggcgta gaggatcc 28<210>15<211>31<212>DNA<213>人工序列<220>
<223>N218(大腸桿菌(E.coli)aroA)下游引物<400>15cgggatcctc actgattttc aatttcaaca c 31<210>16<211>31<212>DNA<213>人工序列<220>
<223>C219(大腸桿菌(E.coli)aroA)下游引物<400>16catgccatgg gtcaacaatt tgtcgtaaaa g 31<210>17<211>32<212>DNA<213>人工序列<220>
<223>N227(大腸桿菌(E.coli)aroA)下游引物<400>17cgggatcctc agccttttac gacaaattgt tg 32
<210>18<211>31<212>DNA<213>人工序列<220>
<223>N234(大腸桿菌(E.coli)aroA)下游引物<400>18cgggatcctc agacaaattg ttgatagtgc t 31<210>19<211>31<212>DNA<213>人工序列<220>
<223>N245(大腸桿菌(E.coli)aroA)下游引物<400>19cgggatcctc acagcaataa agcgcggtta g 31<210>20<211>29<212>DNA<213>人工序列<220>
<223>C228(大腸桿菌(E.coli)aroA)上游引物<400>20catgccatgg ggcagtctta tcagtctcc29<210>21<211>28<212>DNA<213>人工序列<220>
<223>C235(大腸桿菌(E.coli)aroA)上游引物<400>21catgccatgg gtacttattt ggtcgaag 28<210>22<211>32<212>DNA<213>人工序列<220>
<223>N245(大腸桿菌(E.coli)aroA)下游引物<400>22cgggatcctc acgaagatgc atcgccttcg ac32<210>23<211>31<212>DNA
<213>人工序列<220>
<223>N240(大腸桿菌(E.coli)aroA)下游引物<400>23cgggatcctc attcgaccaa ataagtaccc g 31<210>24<211>29<212>DNA<213>人工序列<220>
<223>C241(大腸桿菌(E.coli)aroA)上游引物<400>24catgccatgg gcgatgcatc ttcggcttc 29<210>25<211>31<212>DNA<213>人工序列<220>
<223>pKU2159下游引物<400>25gttactcgag ggctgcctgg ctaatccgcg c 31<210>26<211>23<212>DNA<213>人工序列<220>
<223>pKU2223下游引物<400>26ggaattccat gaactcaact ctc 23<210>27<211>25<212>DNA<213>人工序列<220>
<223>pKU2223上游引物<400>27cgggatcctc aacgataacg gctcc 25<210>28<211>23<212>DNA<213>人工序列<220>
<223>pKU2224上游引物<400>28ggaattcaaa tatgtatccg ctc23<210>29<211>26<212>DNA<213>人工序列<220>
<223>pKU2224下游引物<400>29cccaagcttg gtctgacagt taccaa 26<210>30<211>25<212>DNA<213>人工序列<220>
<223>pKU2225上游引物<400>30cccaagcttg atcccaaatg cacgg 25<210>31<211>27<212>DNA<213>人工序列<220>
<223>pKU2225下游引物<400>31acgaagtcga cgtggcccag ttcatgg27<210>32<211>32<212>DNA<213>人工序列<220>
<223>N67(大腸桿菌(E.coli)aroA)下游引物<400>32cttaggatcc tcatgaaagc gtatagctta cc 32<210>33<211>32<212>DNA<213>人工序列<220>
<223>N73(大腸桿菌(E.coli)aroA)下游引物
<400>33gtcaggatcc tcagcaacgc gtacgatcgg ct 32<210>34<211>32<212>DNA<213>人工序列<220>
<223>N85(大腸桿菌(E.coli)aroA)下游引物<400>34gtcaggatcc tcattctgcg tgtaatggac cg 32<210>35<211>33<212>DNA<213>人工序列<220>
<223>N104(大腸桿菌(E.coli)aroA)下游引物<400>35cttaggatcc tcatgccgcc agcggacgca ttg 33<210>36<211>33<212>DNA<213>人工序列<220>
<223>N154(大腸桿菌(E.coli)aroA)下游引物<400>36cgcaggatcc tcactgtaaa cgcaacggcg gat 33<210>37<211>31<212>DNA<213>人工序列<220>
<223>N165(大腸桿菌(E.coli)aroA)下游引物<400>37cgggatcctc aatcaacgtc aacgttgccg c 31<210>38<211>35<212>DNA<213>人工序列<220>
<223>N182(大腸桿菌(E.coli)aroA)下游引物<400>38ggcaggatcc tcaaagaggc gcagtcatta acagt 35
<210>39<211>32<212>DNA<213>人工序列<220>
<223>N184(大腸桿菌(E.coli)aroA)下游引物<400>39tccaggatcc tcacggcgca agaggcgcag tc 32<210>40<211>32<212>DNA<213>人工序列<220>
<223>N224(大腸桿菌(E.coli)aroA)下游引物<400>40cgggatcctc agacaaattg ttgatagtgc tg 32<210>41<211>31<212>DNA<213>人工序列<220>
<223>N238(大腸桿菌(E.coli)aroA)下游引物<400>41cgggatcctc aagtacccgg agactgataa g 31<210>42<211>31<212>DNA<213>人工序列<220>
<223>N259(大腸桿菌(E.coli)aroA)下游引物<400>42cgggatcctc aagtgccgcc tttgattgct g 31<210>43<211>32<212>DNA<213>人工序列<220>
<223>N298(大腸桿菌(E.coli)aroA)下游引物<400>43cgggatcctc aacgcgtgca ggaaatataa tc 32<210>44<211>31<212>DNA
<213>人工序列<220>
<223>N371(大腸桿菌(E.coli)aroA)下游引物<400>44cgggatcctc acggaggagt gatacgaatg t 31<210>45<211>35<212>DNA<213>人工序列<220>
<223>N376(大腸桿菌(E.coli)aroA)下游引物<400>45ccgtggatcc tcaaaagttc agtttttccg gagga 35<210>46<211>27<212>DNA<213>人工序列<220>
<223>C31(大腸桿菌(E.coli)aroA)上游引物<400>46catgccatgg cggcattagc acacggc27<210>47<211>29<212>DNA<213>人工序列<220>
<223>C68(大腸桿菌(E.coli)aroA)上游引物<400>47tatgccatgg ccgatcgtac gcgttgcga 29<210>48<211>31<212>DNA<213>人工序列<220>
<223>C74(大腸桿菌(E.coli)aroA)上游引物<400>48tgcaccatgg aaattatcgg taacggcggt c 31<210>49<211>31<212>DNA<213>人工序列<220>
<223>C86(大腸桿菌(E.coli)aroA)上游引物<400>49tattccatgg gtgccctgga gttgttcctc g 31<210>50<211>28<212>DNA<213>人工序列<220>
<223>C105(大腸桿菌(E.coli)aroA)上游引物<400>50cggaccatgg ctctttgtct gggtagca 28<210>51<211>31<212>DNA<213>人工序列<220>
<223>C155(大腸桿菌(E.coli)aroA)上游引物<400>51ttatccatgg gcggctttac tggcggcaac g 31<210>52<211>30<212>DNA<213>人工序列<220>
<223>C166(大腸桿菌(E.coli)aroA)上游引物<400>52catgccatgg gctccgtttc cagccaattc30<210>53<211>29<212>DNA<213>人工序列<220>
<223>C183(大腸桿菌(E.coli)aroA)上游引物<400>53tgagccatgg cgccggaaga tacggtgat 29<210>54<211>30<212>DNA<213>人工序列<220>
<223>C185(大腸桿菌(E.coli)aroA)上游引物<400>54
gcgtccatgg aagatacggt gattcgtatt30<210>55<211>29<212>DNA<213>人工序列<220>
<223>C225(大腸桿菌(E.coli)aroA)上游引物<400>55catgccatgg taaaaggcgg gcagtctta 29<210>56<211>26<212>DNA<213>人工序列<220>
<223>C239(大腸桿菌(E.coli)aroA)上游引物<400>56catgccatgg tcgaaggcga tgcatc26<210>57<211>28<212>DNA<213>人工序列<220>
<223>C246(大腸桿菌(E.coli)aroA)上游引物<400>57catgccatgg cttcttactt tctggcag 28<210>58<211>29<212>DNA<213>人工序列<220>
<223>C260(大腸桿菌(E.coli)aroA)上游引物<400>58catgccatgg taaaagtgac cggtattgg 29<210>59<211>29<212>DNA<213>人工序列<220>
<223>C299(大腸桿菌(E.coli)aroA)上游引物<400>59catgccatgg gtgaactgaa cgctattga 29<210>60
<211>31<212>DNA<213>人工序列<220>
<223>引物<400>60tgagtgactg aaagtgaaag taacaataca g 31<210>61<211>29<212>DNA<213>人工序列<220>
<223>引物<400>61cgggatccct tcttcggaca atgacagac 29<210>62<211>31<212>DNA<213>人工序列<220>
<223>引物ppN2083′(BamHI)N208.C209+<400>62cgggatcctc agggagtctt caaaccaaac c 31<210>63<211>28<212>DNA<213>人工序列<220>
<223>引物ppC2095′(NcoI)N208/C209+<400>63catgccatgg agaatcgaaa ctatgaag 28<210>64<211>31<212>DNA<213>人工序列<220>
<223>引物ppN2143′(BamHI)N214/C215+<400>64cgggatcctc attcatagtt tcgattctcg g 31<210>65<211>29<212>DNA<213>人工序列
<220>
<223>引物ppC2155′(NcoI)N214/C215+<400>65catgccatgg agttttattt caaagccgg 29<210>66<211>33<212>DNA<213>人工序列<220>
<223>引物ppN2193′(BamHI)N219/C220++<400>66cgggatcctc atttgaaata aaactcttca tag33<210>67<211>32<212>DNA<213>人工序列<220>
<223>引物ppC2205′(NcoI)N219/C220++<400>67catgccatgg ccgggaatgt atatgatgaa ac 32<210>68<211>33<212>DNA<213>人工序列<220>
<223>引物ppN2223′(BamHI)N222/C223+<400>68cgggatcctc aattcccggc tttgaaataa aac33<210>69<211>30<212>DNA<213>人工序列<220>
<223>引物ppC2235′(NcoI)N222/C223+<400>69catgccatgg tatatgatga aacgaaaatg30<210>70<211>30<212>DNA<213>人工序列<220>
<223>引物ppN2243′(BamHI)N224/C225++
<400>70cgggatcctc aatatacatt cccggctttg 30<210>71<211>29<212>DNA<213>人工序列<220>
<223>引物ppC2255′(NcoI)N224/C225++<400>71catgccatgg atgaaacgaa aatgcaacg 29<210>72<211>31<212>DNA<213>人工序列<220>
<223>引物ppN2333′(BamHI)N233/C234<400>72cgggatcctc aggtgtatcg ttgcattttc g 31<210>73<211>28<212>DNA<213>人工序列<220>
<223>引物ppC2345′(NcoI)N233/C234<400>73catgccatgg tagaaggcga ctggagcg 28<210>74<211>33<212>DNA<213>人工序列<220>
<223>引物ppN2343′(BamHI)N234/C235<400>74cgggatcctc atacggtgta tcgttgcatt ttc 33<210>75<211>29<212>DNA<213>人工序列<220>
<223>引物ppC2355′(NcoI)N234/C235<400>75catgccatgg aaggcgactg gagcggtgg 29
<210>76<211>32<212>DNA<213>人工序列<220>
<223>引物ppN2363′(BamHI)N236/C237<400>76cgggatcctc agccttctac ggtgtatcgt tg 32<210>77<211>29<212>DNA<213>人工序列<220>
<223>引物ppc2375′(NcoI)N236/C237<400>77catgccatgg actggagcgg tggtgcttt 29<210>78<211>1284<212>DNA<213>大腸桿菌(Escherichia coli)<220>
<221>CDS<222>(1)..(1284)<223>
<400>78atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att 48Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile1 5 10 15aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg 96Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala20 25 30gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat 144Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp35 40 45gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat 192Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr50 55 60acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt 240Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly65 70 75 80cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga 288Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat 336Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp100 105 110att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat 384Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His115 120 125ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa 432Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu130 135 140caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc 480Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly145 150 155 160aac gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg 528Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu165 170 175tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa 576Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys180 185 190ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg 624Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met195 200 205aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc 672Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val210 215 220gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa 720Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu225 230 235 240ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa 768Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys245 250 255ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt 816Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly260 265 270gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc 864Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys275 280 285tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att 912Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile290 295 300gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg 960Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr305 310 315 320
gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac 1008Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn325 330 335tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg 1056Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu340 345 350cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc 1104Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile355 360 365act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat 1152Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp370 375 380cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca 1200His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro385 390 395 400gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ecg gat tat 1248Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr405 410 415ttc gag cag ctg gcg cgg att agc cag gca gcc tga 1284Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala420 425<210>79<211>427<212>PRT<213>大腸桿菌(Escherichia coli)<400>79Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile1 5 10 15Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala20 25 30Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp35 40 45Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr50 55 60Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly65 70 75 80Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly85 90 95Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp100 105 110Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His115 120 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu130 135 140Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly145 150 155 160Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu165 170 175Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys180 185 190Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met195 200 205Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val210 215 220Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu225 230 235 240Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys245 250 255Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly260 265 270Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys275 280 285Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile290 295 300Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr305 310 315 320Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn325 330 335Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu340 345 350Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile355 360 365Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp370 375 380His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro385 390 395 400Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr405 410 415Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala420 42權利要求
1.5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其是選自EPSPS的蛋白片段對的一種片段,組成所述片段對的兩種片段可以連接成全長EPSPS,并且這兩種片段不借助任何連接結構可以通過互補而重建EPSPS活性。
2.權利要求1的片段,其中所述片段對的分割點位于EPSPS的選自下列的結構中折疊單元之間的連接區(qū)中、α螺旋與β折疊之間的連接區(qū)中、兩個β折疊之間、β折疊中、或α螺旋中,優(yōu)選位于折疊單元之間的連接區(qū)中。
3.權利要求1或2的片段,其中所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多個氨基酸殘基所得的EPSPS活性變體,優(yōu)選是大腸桿菌野生型EPSPS或其草甘膦抗性EPSPS活性變體,或者優(yōu)選是惡臭假單胞菌草甘膦抗性EPSPS。
4.權利要求1的片段,其是選自大腸桿菌EPSPS的以下片段對的一種片段N67/C68,N85/C86,N104/C105,N154/C155,N182/C183,N184/C185,N218/C219,N224/C225,N227/C228,N259/C260,N298/C299,N371/C372,N376/C377,N383/C384,或是選自惡臭假單胞菌CGMCC 0739 EPSPS的以下片段對的一種片段N208/C209,N214/C215,N219/C220,N222/C223,N224/C225。
5.一種核酸分子,其編碼權利要求1-4之一的蛋白片段。
6.一種表達載體,其攜帶權利要求5所述核酸分子。
7.一種細胞,其包含權利要求5所述核酸分子,或者權利要求6所述表達載體。
8.一種重建EPSPS的方法,包括在無任何連接結構存在的條件下,利用權利要求1-4之一的蛋白片段,或權利要求5的核酸分子,或權利要求6的表達載體來重建EPSPS活性。
9.一種拆分EPSPS或EPSPS核酸分子的方法,包括在無任何連接結構存在的條件下,拆分出權利要求1-4之一所述的蛋白片段,或權利要求5所述的核酸分子。
全文摘要
本發(fā)明涉及5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其選自EPSPS的蛋白片段對,組成所述片段對的兩種片段可以連成全長EPSPS,并且這兩種片段不借助任何連接結構可以通過互補而重建EPSPS活性。本發(fā)明還涉及編碼所述蛋白片段的核酸分子,包含該核酸分子的表達載體和細胞。本發(fā)明還涉及利用本發(fā)明的片段或核酸分子或表達載體重建EPSPS活性的方法,以及拆分出本發(fā)明蛋白片段的方法。
文檔編號C12N15/31GK1789412SQ200410102289
公開日2006年6月21日 申請日期2004年12月16日 優(yōu)先權日2004年12月16日
發(fā)明者王憶平, 孫義成, 李燕 申請人:北京大學