產(chǎn)生能夠表達活性蛋白產(chǎn)物的斷裂、不可傳遞的基因的方法

文檔序號：3573634閱讀：2265來源：國知局

專利名稱：產(chǎn)生能夠表達活性蛋白產(chǎn)物的斷裂、不可傳遞的基因的方法
背景技術：
過去的幾年中，由于轉基因農(nóng)作物的出現(xiàn)使美國的農(nóng)業(yè)發(fā)生了一場革命，這些轉基因作物能抵抗特定的疾病、昆蟲及除草劑，或者其營養(yǎng)價值得到改善。與此同時，人們又更多地擔心這些基因修飾的農(nóng)產(chǎn)品對其消費者產(chǎn)生損害，并且這些轉基因可能被轉移到相關的植物品系中，甚至形成對昆蟲或除草劑抵抗的“超級種子”(Ferber，D.科學Science2861662(1999))或被其他微生物消耗后造成損害(Losey等，自然Nature399214(1999))。但是目前幾乎沒有對擔心“轉基因”食物有害的科學依據(jù)，轉基因被轉移到其它植物并且對生態(tài)產(chǎn)生負面效應的可能性并非完全沒有根據(jù)(Bergelson等，自然Nature39525(1998))。這種轉移可通過密切相關的種屬傳粉，或者通過病毒或質粒載體將基因片段轉入不相關的植物，這些病毒或質粒載體的轉移可通過植物相關真菌、細菌或昆蟲介導。
已經(jīng)討論過預防轉基因傳播的幾種技術，然而這些方法要么象一連串構建物一樣，被設計成對新的雜交植物有負面影響(Gressel，TrendsBiotechnol.，17361-366(1999))，要么不能排除通過水平基因轉移進行傳播的可能性(Bertolla和Simonet，Res.Microbiol.，150375-384(1999))。
在本發(fā)明中，我們介紹一種新型的轉基因方法，能夠高效表達蛋白質而不需要基因復制過程并且極少有機會通過水平基因轉移進行傳播。
發(fā)明概要本發(fā)明公開了一種能夠在靶宿主，如一種植物，內(nèi)高效表達蛋白質的新型轉基因系統(tǒng)，同時又能避免通過花粉將這種轉基因帶入相關的宿主系統(tǒng)和/或環(huán)境。這里描述的方法同樣適用于真核細胞生物(酵母、昆蟲、哺乳動物細胞等)和原核微生物(如大腸桿菌等)內(nèi)任何目的蛋白(如一種毒性蛋白)的表達。
在每一種情況下，目標基因至少被分裂成兩個片段，每一片段都能與intein編碼序列的一部分融合。每一融合基因以無活性蛋白形式表達，并且這些獨立表達的融合蛋白被重新拼裝成一個活性形式。這些基因片段的區(qū)室化使得目標蛋白在所希望的部位重新組合，能防止將功能基因轉移至其他微生物。
需要指出的是，盡管本發(fā)明主要針對農(nóng)業(yè)和植物生物技術的實施例，但該方法應用范圍十分廣闊，可用于任何微生物中任何基因表達，防止基因意外地轉移到其它微生物中去。
附圖詳細說明

圖1A-蛋白剪接機理。蛋白剪接是翻譯后過程，該過程涉及從具有側向N末端和C末端區(qū)域(exteins)連接的蛋白前體切割內(nèi)部蛋白片段，即intein。序列排列顯示在兩個剪接結合點處存在高度保守的殘基intein N末端有一個半胱氨酸或絲氨酸殘基，intein的C末端有His-Asn，extein的C末端處有Cys，Ser或Thr作為第一殘基。這些保守的剪接連接殘基直接參與催化肽鍵斷裂和蛋白剪接反應的連接作用。N末端有半胱氨酸殘基和與之C末端相連的intein剪接的化學機理如圖1所示步驟1-在intein的N末端對cys1的N-S acy1重排，形成一個線性硫酯中間產(chǎn)物；步驟2-在步驟1形成的硫酯上intein C末端形成后，迅速用Cys攻擊進行酯化，形成分支狀的中間產(chǎn)物；步驟3-在intein C末端Asn殘基上通過肽鍵斷裂同時伴有琥珀酰亞胺的形成來切除intein；步驟4-短暫形成的連接物自動進行s-N Acy1重排，從硫酯變成穩(wěn)定的氨基鍵。其他intein的剪接過程除圖1所示的Cys殘基可能被Ser或Thr替代外，都類似于上述4個化學步驟。因此，步驟1到4分別為N-O和O-N酰基的轉換。
圖1B-蛋白剪接的卡通畫圖2-反式剪接。
圖2A-intein片段的N末端和C末端與兩個為融合N-extein和C-extein序列的剪接結合的相互關系。推測這種剪接反應是通過如以前介紹的同樣的順式剪接通路來完成的。
圖2B-可選擇的是，在無剪接時，intein能通過隨后酶活性的產(chǎn)生而促進兩個extein序列的連接。這被稱之謂intein介導的互補作用。
圖3-Ssp DnaE intein基因在集胞藻屬PCC6803中的排列。藍-綠海藻集胞藻屬PCC6803基因組包含斷裂的dnaE基因，該基因在745kb位點有多個片段存在。天然的反式剪接的intein與兩個基因產(chǎn)物片段融合形成一個活性聚合酶。
圖4A-斷裂靶基因。用融合在C末端和N末端區(qū)域的部分intein基因能將靶基因分裂成兩個片段。這些斷裂基因可被置入植物染色體內(nèi)以便下述表達重新進行。
圖4B-轉基因的內(nèi)容。將目的基因，此處是指一種除草劑抗性基因，分裂成兩個片段(靶N和靶C)，并將一種intein(INn和INc)融合到每個片段基因內(nèi)。兩個融合基因單獨放置在基因組的遠端位置上。一個基因可能在葉綠體內(nèi)，而另一個基因可能在核基因組內(nèi)。葉綠體內(nèi)的轉基因在葉綠體內(nèi)發(fā)生轉錄和翻譯，而核內(nèi)的轉基因在細胞核內(nèi)轉錄，在細胞漿內(nèi)翻譯。核基因翻譯完畢后在葉綠體轉運肽的協(xié)助下被轉運進入葉綠體，在葉綠體內(nèi)它可利用intein作為連接或剪接成分與其他基因片段相互聯(lián)系。
圖5一大腸桿菌菌株ER2744內(nèi)乙酰乳酸合酶(ALS)的反式剪接。靶基因被intein片段(INn和INc)分裂，表達成兩種無活性的蛋白質。在宿主細胞內(nèi)蛋白的反式剪接能產(chǎn)生一種活性靶蛋白。
圖6-乙酰乳酸合酶(ALS)基因的排序(SEQ ID NO42，SEQ ID NO43，SEQ IDNO44，SEQ ID NO45，SEQ ID NO46)。大腸桿菌乙酰乳酸合酶II(ALSII)的空白區(qū)域用下劃線表示。箭頭表示大腸桿菌乙酰乳酸合酶的斷裂位點。星狀標志代表玉米ALS的斷裂位點。
圖7-平皿實驗顯示ALS m-14使大腸桿菌ER2744對纈氨酸和除草劑產(chǎn)生抵抗，SM.大腸桿菌ER2744細胞用表達ALSII蛋白(1)、ALSIIm(2)、ALSIIm-14(3)的質粒DNA進行轉化，并置于在含0.3mMIPTG，100ug/ml纈氨酸(a)，或100ug/ml纈氨酸和50ug/ml SM(b)M9培養(yǎng)基的平皿中。平皿實驗在30℃條件下進行50小時。
圖8-通過SSp DnaE intein介導的反式剪接產(chǎn)生重組ALSIIm-14。用表達質粒轉化而來的細胞作為對照(泳道1)，ALSII(泳道2)，ALSIIm(N)-INn(泳道3)，ALSIIm(C)-INc(泳道4)，ALSIIm(N)-INn和ALSIIm(C)-INc(泳道5)，2ul細胞提取物在12％的SDS-聚丙烯酰胺凝膠上電泳，然后轉移到一張S&S硝基纖維素膜上，用抗ALSIIN末端(圖SA)或ALSIIC末端(圖8B)抗體探查。(圖8C)反式剪接的效率是溫度敏感性的，用抗ALSIIm N末端抗血清進行Western雜交。從表達質粒轉化的細胞中制造蛋白提取物，成為含有與以下抗血清反應的非特異蛋白的大腸桿菌提取物對照(泳道1)，ALSII(泳道2)，ALSIIm(N)-INn和ALSIIm(C)-INc(泳道3-6)，這些。細胞培養(yǎng)溫度為泳道1至泳道3為37℃，泳道4為30℃，泳道5為25℃，泳道6為15℃。
圖9-乙酰乳酸合酶(ALSII)活性的測定圖9A-ALSIIm(N)-INn和ALSIIm(C)-INc共同表達能保證細胞在加有纈氨酸和除草劑的培養(yǎng)基中生長。通過ALSII(1)，ALSII(2)，ALSIIm(N)-INn和ALSIIm(C)-INc(3)，ALSIIm(N)-INn(4)，ALSIIm(C)-INc(5)，ALSIIm(N)和ALSIIm(C)(6)的表達質粒轉化的大腸桿菌ER2744在37℃條件下(a)，37℃條件下添加100ug/ml纈氨酸(b)，30℃條件下100ug/ml的纈氨酸(C)，和37℃條件下添加100ug/ml的纈氨酸和50ug/ml的甲基sulfometuron(SM)(d)置于M9培養(yǎng)基中。培養(yǎng)基內(nèi)含有0.3mM IPTG。
圖9B-ALSIIm(N)-INn和ALSIIm(C)-INc共同表達能保證細胞在加有纈氨酸和除草劑的培養(yǎng)基中生長。為融合蛋白(圖下所示)用表達質粒轉化的大腸桿菌ER2744在含有0.3mM IPTG的M9培養(yǎng)基中培養(yǎng)，如指示培養(yǎng)基內(nèi)可有或無100ug/ml的纈氨酸和50ug/ml的甲基sulfometuron(SM)。細胞在30℃條件下培養(yǎng)40小時后以OD600確定細胞生長率。
圖9C-表達ALSIIm(N)-INn和ALSIIm(C)-INc細胞生長率的時間過程研究。用指定蛋白表達質粒轉化的大腸桿菌ER2744，在30℃，含有0.3mM IPTG和100ug/ml纈氨酸的M9培養(yǎng)基中培養(yǎng)。細胞密度用OD600在指定的幾個時間點上測量確定。
圖10-Western斑點雜交檢測反式剪接產(chǎn)物，玉米ALS-14。2ul表達質粒轉化的大腸桿菌ER2744細胞的碎解物，作為對照(泳道1)(請注意抗體與大腸桿菌內(nèi)非特異性蛋白的反應)，cALS(泳道2)，cALS(N)-INn(泳道3)，cALS(C)INc(泳道4)，cALS(N)-INn和cALS(C)-INc(泳道5)，在12％SDS聚丙烯酰胺凝膠上電泳，然后轉移到一張S&S硝基纖維素膜上，用抗cALS N末端(A)或cALS C末端(B)的抗血清進行探測，cALS代表玉米ALS蛋白。
圖11-平皿實驗測定Ssp DnaE intein順式剪接的構建物。編碼5’-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)蛋白并有完整長度的Ssp DnaEintein的質粒pCE182DnaE，pCE215DnaE，pCE235DnaE DnaE，pCE267DnaE分別在氨基酸位點182，215，235和267處插入。并將它們轉化到ER2799大腸桿菌細胞內(nèi)(為在限制性M9培養(yǎng)基中生存，需要EPSPS蛋白)，接種于M9限制性平皿中。37℃孵育過夜后，將每一平皿中的單個克隆挑出并將其種植在一個單獨的限制性M9培養(yǎng)基中。然后主要培養(yǎng)平皿在37℃孵育過夜或RT 2-3天。pCYB3質粒作為對照，因為它不攜帶EPSPS基因，在選擇的平皿中不能生長。PC+F2是一個含有全長野生型EPSPS(具有一個Pro101Ser突變)，在M9選擇性平皿中生長并傳遞鎮(zhèn)草寧抗性的質粒。
圖12-平皿實驗測定在215和235位點的Ssp DnaE intein反式剪接構建物。
每一5’-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)反式剪接構建物的活性通過將匹配的構建物共同轉化到大腸桿菌ER2799細胞中并將其接種于在一個選擇性M9培養(yǎng)平皿的方法進行測定。pCYB3或pKYBI(New England Biolabs，Inc.，Beverly，MA)都無EPSPS基因，可用于測定EPSPS基因每一半活性時提供氨芐青霉素或卡那霉素抗性。
所用質粒分別為pC+E2，含有完整長度的EPSPS突變基因；p215EN2，含有與Ssp DnaE intein N末端剪接區(qū)域融合的EPSPS基因第一個215氨基酸；p235EN2，含有與Ssp DnaE intein N末端剪接區(qū)域融合的EPSPS第一個235氨基酸；pEPS#28，含有與Ssp DnaE intein C末端剪接區(qū)域融合的EPSPS基因的216-427氨基酸；pEPS#29，含有與Ssp DnaE intein C末端剪接區(qū)域融合的EPSPS基因的236-427氨基酸；pEPS#33，含有與Ssp DnaE intein N末端剪接缺陷區(qū)域融合的EPSPS基因第一個235氨基酸；pEPS#37，含有與Ssp DnaE intein C末端剪接缺陷區(qū)域融合的EPSPS基因的236-427氨基酸；pEPS#34，具有EPSPS的第一個235氨基酸，但無intein片段；pEPS#36，具有EPSPS的236-427氨基酸，但無intein片段。這些質粒以不同的組合方式共同轉化到大腸桿菌ER2799細胞中，并接種在LB平皿和M9平皿中，每一平皿中都補充100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG。37℃孵育過夜或RT 2-3天后，將每一LB平皿中的單個克隆挑出并將其接種在M9選擇培養(yǎng)平皿中。M9限制性培養(yǎng)基選擇平皿含有100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG。使用的質粒組合有WT，pC+E2和pKYB；215NC，p215EN2和pEPS#28；215C，pEPS#28和pCYB3；235NC-Dead，pEPS#33和pEPS#37；235NC，p235EN2和pEPS#29，235N，p235EN2和pKYB1，235C，pEPS#29和pCYB3；235N-215C，p235EN2和pEPS#28和235互補體，pEPS#34和pEPS#36。
圖13-235反式剪接構建物的草甘膦抗性液相實驗。質粒構建物如圖12所述。組合方式為WT，pC+E2和pKYB，235NC-Dead，pEPS#33和pEPS#37，235NC，p235EN2和pEPS#29，215N，p235EN2和pKYB1；235C，pEPS#29和pCYB3；235互補體，pEPS#34和pEPS#36。這些質粒被共同轉化到大腸桿菌ER2799細胞中并接種于LB平皿中，加入100ug/ml的氨芐青霉素和50ug/ml的卡那霉素；pCYB3/pKYB共同轉化到大腸桿菌ER2744中并接種于LB平皿中，添加物如前所述。每次轉化前將新鮮的集落接種于含100ug/ml的氨芐青霉素和50ug/ml的卡那霉素的LB培養(yǎng)基中，30℃過夜制備預培養(yǎng)物。等量的預培養(yǎng)物(根據(jù)細胞密度一般為10-11ul)接種于新鮮制備的含有100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mMIPTG，含有或無草甘膦的M9限制性培養(yǎng)基中。在OD值600nm時測定每一構建物的生長。圖13A，在37℃條件下生長。圖13B，在30℃條件下生長。
圖14-順式剪接235構建物在M9液體限制性培養(yǎng)基的生長。完整長度SspDnaE intein插入5’-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)的235位點后構建一個質粒。構建兩個質粒載體(pCE235 DnaE和pEPS#31)，一個質粒載體帶有一個剪接的感受態(tài)Ssp DnaE intein(235cis)，而另一個具有剪接的非感受態(tài)intein(235dead)。這些質粒與pKEB12一起被共同轉化到大腸桿菌ER2799細胞中并接種于LB平皿中，加入100ug/ml的氨芐青霉素和50ug/ml的卡那霉素。每次轉化前將新鮮的集落置于LB培養(yǎng)基中在30℃過夜。等量的預培養(yǎng)物(根據(jù)細胞密度一般為10-11ul)接種在新鮮制備的含有100ug/ml氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG的M9限制性培養(yǎng)基中。細胞密度在不同時間點在OD值600nm測定。
圖15是一個顯示5-烯醇丙酮基-3-磷酸莽草酸合酶(5-enolpyruvyl-3-phosphoshikimate(EPSPS))蛋白中能夠插入一個5氨基酸而仍能保證蛋白活性的位點的圖。
圖16是一個顯示5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)蛋白中能夠插入一個5氨基酸而使蛋白活性消失的位點的圖。
圖17是一個pIH976的基因圖譜。環(huán)狀雙鏈DNA具有一個多克隆位點。標明了限制酶位點。帶有括號的限制位點不是唯一的。Ptac代表tac啟動子。復制的起點是ori。這個質粒具有四環(huán)素藥物抗性標志物(Tetr)。
圖18是一個pAGR3的基因圖譜。環(huán)狀雙鏈DNA(SEQ ID NO76)具有一個多克隆位點。下面顯示限制酶位點。Ptac代表tac啟動子。復制的起點是ori。這個質粒具有氨芐青霉素藥物抗性標志(ampr)。標明了Lac操縱子和核糖體的結合位點。質粒pAGR3是一個帶有下述幾種元件的表達載體；(1)一個合成tac啟動子連接一個對稱的合成Lac操縱子序列；(2)一個Lac核糖體結合位點；(3)一個在NcoI位點內(nèi)部帶有ATG的克隆聚合連接子，NcoI位點在核糖體結合點下游大約7個核苷酸處；(4)LacIq基因的一個拷貝，對tac啟動子起抑制作用；(5)自pBR322起源的復制；(6)氨芐青霉素抗性基因；和(7)tac啟動子核糖體轉錄終止子上游的四倍拷貝。轉錄終止子通過降低上游啟動子的閱讀-通過轉錄過程來減少轉錄的基礎水平。
圖19用Ssp DnaE intein作為剪接元件，在大腸桿菌內(nèi)將兩個不相關的基因產(chǎn)物進行反式剪接。
圖19A，質粒pIHaadE-N代表aadA基因(黑體處)融合到Ssp DnaE intein(INn呈灰色)N末端剪接區(qū)域。質粒pAGRE-CsmGFP代表Ssp DnaE intein的C末端剪接區(qū)域(INc呈灰色)和smGFP(呈黑色)。每一參與者的計算分子量在下方用kDa表示。箭頭表示反式剪接事件產(chǎn)生一個aadA-smGFP(57kDa)融合蛋白。
圖19B，在大腸桿菌細胞內(nèi)用氨芐青霉素和硫酸壯觀霉素選擇pIHaadE-N和AGRE-CsmGFP質粒。大腸桿菌被用右邊所示的質粒轉化，集落數(shù)在上方顯示。
圖19C，通過反式剪接表達和檢測aadA-smGFP雜合體蛋白。用單克隆smGFP特異性抗體通過western斑點分析表達構建物的大腸桿菌細胞提取物(在圖上標明)。生物素化的MW標志物(76，57，46，37，28和20)的相對位置以kDa表示。與aadA-smGFP雜合體和INc-smGFP相對應的蛋白帶也被標明。
圖20，是一個pNCT114/224的基因圖譜。具有一個多克隆位點的環(huán)狀雙鏈DNA能夠定位基因，預先確定部位。指出了限制酶位點。PpsbA和TpsbA分別代表光合成多肽D1基因啟動子和終止子。復制的起點是ori。這個質粒具有氨芐青霉素藥物抗性標志(ampr)。同源重組序列如左邊所示(pNCT114與orf228，pNCT224與16SrDNA-trnaV)和右邊所示(pNCT114與orf1244，pNCT224與rps7/12)。CS代表克隆位點。
圖21植物啟動子PpsbA在大腸桿菌內(nèi)活性和aadA及smGFP的反式剪接。
圖21A質粒p115ag/p225ag代表aadA基因(黑體表示)融合到Ssp DanE inteinN末端區(qū)域(INn灰色表示)和Ssp DanE intein C末端區(qū)域(INn灰色表示)融合到smGFP(用黑色表示)。兩個雜合基因在相反的方向轉錄。兩者的計算分子量在下面用KDa表示。箭頭表示反式剪接發(fā)生后形成一個融合aadA-smGFP(57Kda)蛋白。
圖21B在大腸桿菌細胞內(nèi)用氨芐青霉素和硫酸壯觀霉素選擇p115ag和p225ag質粒。大腸桿菌被右邊所示的質粒轉化，集落數(shù)在上方顯示。質粒后的阿拉伯數(shù)字是獨立的數(shù)字，加號(+)表示質粒在指定抗生素中的生長。
圖21C通過反式剪接表達和檢測雜交aadA-smGFP蛋白。用單克隆抗smGFP特異性抗體通過Western斑點分析表達上圖所示構建物的大腸桿菌細胞提取物。生物素化MW標志物的相關位置在左邊用Kda表示。與aad-smGFP雜合體和Inc-smGFP相關的蛋白帶也被標明。
圖22植物細胞漿內(nèi)順式剪接。5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)和乙酰乳酸合成酶(ALS)基因被插入到雙重載體pBI121中。EPSPS或ALS的氨基和羧基末端片段用黑體表示。Ssp DnaE intein基因用EPSPS/ALS片段在兩邊相連接。Agrobacterium的右邊和左邊表示為LB和RB。CaMV35S啟動子、NOS啟動子(pNOS)和NOS終止子(TNOS)被標明。
圖23核轉移載體pBITPEC或pBITPECsmGFP。這種雙重載體具有驅動核酮糖二磷酸羥化酶3A轉運肽(TP)的CaMV35S啟動子，該啟動子被融合到Ssp DnaEintein C末端剪接區(qū)域(INc)。在INc之后標明為細胞器轉運而被克隆的基因。在pBITPECsmGFP存在時將smGFP基因克隆到多克隆位點。
圖24為PsbA啟動子(PpsbA)序列(SEQ ID NO59)。
圖25為PsbA終止子(TpsbA)(SEQ ID NO60)。
圖26為核酮糖二磷酸羥化酶3轉運肽(SEQ ID NO61)。下方的核苷代表密碼子優(yōu)化后的單位。
圖27葉綠體基因目標載體(pNCT114)(SEQ ID NO62).pNCT114的特征包括(1)載體主要部分pLITMUS28；(2)在BssHII到BsiWI左側邊界插入葉綠體基因組目標片段(orf228-ssb，1210bp)；(3)在AvrII到KpnI右邊界插入葉綠體基因組目標片段(orf1244，1550bp)；和(4)在BsiWI和pstI之間加入PpsbA和TpsbA，而其他配對是在AvrII和NcoI位點。
圖28葉綠體基因目標載體(pNCT224)(SEQ ID NO63)。pNCT114的特征包括((1)載體主要部分pLITMUS28；(2)在BssHII到BsiWI左邊界插入葉綠體基因組目標片段(165SrDNA-trnaV，1680bp)；(3)在AvrII到KpnI右邊界插入葉綠體基因組目標片段(rps7/12，1310bp)；和(4)在BsiWI和pstI之間加入PpsbA和TpsbA，而其他配對是在AvrII和NcoI位點。
發(fā)明的詳述蛋白的剪接是將插入序列從多肽上切割下來，并同時連接側向序列形成一種新的多肽的過程(Chong等，生物化學雜志J Biol Chem.，27122159-22168(1996))，如圖1A和1B所示。闡明蛋白剪接的機制可產(chǎn)生數(shù)種以intein為基礎的應用(Comb等，美國專利第5,496,714；Comb等，美國專利第5,834,247；Camarero和muir，J.Amer.Chem.Soc.，1215597-5598(1999)；Chong等，Gene，192271-281(1997)，Chong等，核酸研究Nucleic Acids Res.，265109-5115(1998)；Chong等，生物化學雜志J.Biol.Chem.，27310567-10577(1998)；Cotton等，美國化學學會雜志J.Am.Chem.Soc.，1211100-1101(1999)；Evans等，生物化學雜志J.Biol.Chem.，27418359-18363(1999)；Evans等，生物化學雜志J.Biol.Chem.，2743923-3926(1999)；Evans等，蛋白質科學Protein Sci.，72256-2264(1998)；Evans等，生物化學雜志J.Biol.Chem.，2759091-9094(2000)；Iwai和Pluckthun，F(xiàn)EBS Lett.459166-172(1999)；Mathys等，基因Gene，2311-13(1999)；Mills等，Proc.Natl.Acad.Sci.USA 953543-3548(1998)；Muir等，Proc.Natl.Acad.Sci.USA 956705-6710(1998)；Otomo等，生物化學Biochemistry3816040-16044(1999)；Otomo等，J.Biolmo.NMR 14105-114(1999)；Scott等，Proc.Natl.Acad.Sci USA 9613638-13643(1999)；Severinov和Muir，生物化學雜志J.Biol.Chem.，27316205-16209(1998)；Shingledecker等，基因Gene，207187-195(1998)；Southworth等，EMBO J.17918-926(1998)；Southworth等，生物技術Biotechnique，27110-120(1999)；Wood等，國家生物技術Natl.Biotechnol.，17889-892(1999)；Wu等，Proc.Natl.Acad.Sci.USA 959226-9231(1998a)；Wu等，Biochim Biophys Acta 1387422-432(1998b)；Xu等，Proc..Natl.Acad.Sci USA96388-393(1999)；Yamazaki等，美國化學協(xié)會雜志J.Am.Chem.Soc.，1205591-5592(1998))。
最近體內(nèi)和體外都有對蛋白反式剪接的描述(Shingledecker等，基因Gene207187(1998)，Southworth等，EMBO J.17918(1998)；Mills等，Proc.Natl.Acad.Sci.USA，953543-3548(1998)；Lew等，生物化學雜志J.Biol.Chem.，27315887-15890(1998)；Wu等，Biochim.Biophys.Acta 357321(1998b)，Yamazaki等，美國化學協(xié)會雜志J.Am.Chem.Soc.1205591(1998)，Evans等，生物化學雜志J.Biol.Chem.2759091(2000)；Otomo等，生物化學Biochemistry3816040-16044(1999)；Otomo等，J.Biomol.NMR 14105-114(1999)；Scott等，Proc.Natl.Acad.Sci. USA 9613638-13643(1999))，提供了將一種蛋白表達成兩個無活性片段，之后這兩個片段連接形成一個功能產(chǎn)物的機會(圖2)。
反式蛋白剪接在集胞藻屬PCC6803中也能自然發(fā)生(Wu，H.等，Proc.Natl.Acad.Sci.959226(1998))，它是將DnaE蛋白的兩個片段連接形成具有功能的DNA多聚酶III所必須的，而DnaE蛋白是由被750Kb染色體DNA分割的兩個基因所編碼(圖3)這些發(fā)現(xiàn)使本項目的發(fā)明者進一步探索是否能通過將感興趣基因分裂為兩個片段并且將intein片段融合到每個目標基因片段中來形成一個功能基因產(chǎn)物。通過反式剪接后表達的兩個蛋白片段、intein介導的互補作用或蛋白互補作用能夠產(chǎn)生一種活性形式的靶蛋白(圖4)。在此處靶基因片段可位于宿主基因組的任何位置，包括廣泛分布在細胞核內(nèi)、葉綠體內(nèi)、線粒體內(nèi)、質粒內(nèi)、細菌人工染色體內(nèi)、酵母人工染色體內(nèi)或上述任何部位的組合。此外，將基因片段安放在不同的細胞器官或質粒內(nèi)，如一半在細胞核內(nèi)而另一半在植物的葉綠體或線粒體內(nèi)，重構具有完整活性的目標蛋白需要兩個部分基因的傳遞，例如，通過受粉向遠屬轉運或通過細菌、真菌或病毒載體進行水平基因轉移的現(xiàn)象都將被從根本上消除。這樣將極大的減少和有可能消除轉基因向其相關的環(huán)境外傳播的危險。
分裂靶基因并用一個蛋白剪接元件重建活性的兩個實施例描述如下。被研究的兩個基因分別是來自大腸桿菌的乙酰乳酸合成酶(ALS)基因的突變體和來自鼠傷寒沙門氏菌的5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)基因，它們分別傳遞磺脲和草甘膦除草劑抗性。兩種酶都參與蛋白構件的生物合成過程。ALS是支鏈氨基酸生物合成時的第一個普通酶(LaRossa和Schloss，生物化學雜志J.Biol.Chem.，2598753-8757(1984)；Chaleff和Ray，科學Science，2231148-1151(1984)；Falco和Dumas，遺傳學Genetics，10921-35(1985))，而EPSPS是合成芳香族氨基酸所必需的(Stalker等，生物化學雜志J.Biol.Chem.2604724-4728(1985))。用化合物抑制這兩種酶可導致微生物的死亡。
常用的磺脲除草劑(SU)，如甲基sulfometuron(SM)(Short和Colburn，Taxicol Ind.Health，15240-275(1999))通過抑制乙酰乳酸合成酶(ALS)(EC 4.1.3.18)阻止細菌、酵母和高等植物的生長。為了制造除草劑抗性的植物，需努力分辨ALS基因突變體，這種基因能使植物在存在SM時也能生長。首先報道的是能夠使細菌、酵母對SM發(fā)生抵抗的突變基因(Hill等，生物化學雜志Biochem.J.，335653-661(1998))。隨后，在工自然產(chǎn)生的抗性作物、玉米、牛旁和煙草中(Lee等，EMBO J.71241-1248(1988)；Bernasconi等，生物化學雜志J.Biol.Chem.，27017381-17385(1995))分離的ALS基因中都證實了類似的點突變。某些對SU耐受的作物如ICI8532IT和先鋒3180IR都已經(jīng)商品化。
在下面的實施例1中，除草劑抗性基因被分裂并且將一個intein片段在結構上融合到每一部分基因中。斷裂的基因被證實在大腸桿菌中具有對除草劑SM的抗性。大腸桿菌被當作模型系統(tǒng)，因為它含有活性的ALSI和乙酰乳酸合成酶III(ALSIII)酶，而不是活性的ALSII酶。ALSI和ALSIII是大腸桿菌內(nèi)ALS基因的兩個同型異構體，它們在合成纈氨酸，異亮氨酸，亮氨酸中起關鍵性作用(DeFelice等，微生物學年報Ann.Microbiol.(Paris)133A251-256(1982))。其活性對纈氨酸的反饋抑制敏感。因此，只要用纈氨酸飽和培養(yǎng)基，ALSI和ALSIII將被抑制，細胞就會停止生長。由于ALSII對纈氨酸的抑制作用具有抵抗性，將重組的ALSII導入大腸桿菌細胞內(nèi)，這些細胞將恢復生長。由于這種特性使得大腸桿菌ER2744菌株成為研究(通過插入連接物或intein的反式剪接元件)基因修飾后的大腸桿菌ALSII基因活性的良好體內(nèi)模型系統(tǒng)。
第二個檢測的除草劑抗性基因來自鼠傷寒沙門氏菌aroA基因，它有一個C301到T的突變(Stalker等，生物化學雜志J.Biol.Chem.2604724(1985))。該基因編碼5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)(EC2.5.1.19)蛋白，具有一個Pro101到Ser的改變，已知具有除草劑草甘膦的抗性(市售商品名為Round-Up)。在這個實施方案中，EPSPS基因的一個N末端片段與Ssp DnaE intein的N末端剪接區(qū)相融合，而EPSPS基因的一個C末端片段與Ssp DnaE intein的C末端剪接區(qū)相融合。為確定EPSPS蛋白中能插入一個intein的位點，進行連接子掃描實驗(Biery等，核酸Nucleic Acids Res.，281067-1077(2000))(GPS-LS，New England Biolabs，Inc.，Beverly，MA)，該實驗在整個蛋白序列中隨機插入5個氨基酸。將intein插入能耐受氨基酸插入的位點。將編碼EPSPS的N末端片段的基因與一條質粒上Ssp DnaEintein的N末端區(qū)域相融合，將EPSPS的C末端部分與在另一質粒上的Ssp DnaEintein的C末端剪接區(qū)相融合，建立了反式剪接構建物。比如，EPSPS蛋白能夠在Gly235對應的位點被斷裂。有人發(fā)現(xiàn)，兩種質粒共同轉化進缺乏功能性EPSPS蛋白的大腸桿菌細胞內(nèi)，細胞在存在或不存在除草劑草甘膦的M9限制性培養(yǎng)基中生長的現(xiàn)象。
觀察斷裂ALS和EPSPS除草劑抵抗基因的活性，是否intein未修飾或催化的殘基發(fā)生改變，并因此消除了反式剪接活性。這說明盡管剪接能產(chǎn)生一種共價結合的蛋白質產(chǎn)物，但并不是在所有情況下都需要進行剪接。此時intein作為主要的親和區(qū)能將兩個蛋白片段按正確的方向組合在一起。在這些實驗中斷裂蛋白的活性絕對需要intein的存在。因為有實驗觀察到當沒有intein融合時，斷裂的ALS和EPSPS基因都無法使大腸桿菌在適當?shù)某輨┥仙L。
在該發(fā)明的一個實施方案中，融合在intein剪接區(qū)的兩個基因片段用選擇性的標志物(如對抗生素抵抗或其他生長抑制劑來證實基因轉移)分別引入核染色體內(nèi)。兩種融合基因的分別轉移能確保被轉移的基因位于植物基因組的不同位置，可能是在不同的染色體上，由此排除了一種病毒或質粒載體在向其他微生物傳遞時同時獲得兩種基因的可能性。如此，利用已知的DNA序列，用同源重組的方法靶向特定的部位就能夠保證兩個基因相距很遠。
在該發(fā)明的另一個實施方案中，兩個融合蛋白中的一個被轉化到細胞核內(nèi)，另一個被轉化到葉綠體體內(nèi)，這樣就可以根本杜絕基因通過任何可能的機制(包括相關種屬的交叉?zhèn)鞣郏?傳遞到相關植物中的可能性，因為只有基因的非活性片段存在在花粉中。位于葉綠體內(nèi)的基因片段是通過母系傳播，而不能通過花粉進行傳播，這同樣也適合于線粒體內(nèi)表達的基因片段。
該技術也可應用于非植物系統(tǒng)。例如，一個被封閉的轉基因可以被分裂并且將intein融合到基因片段中。在細菌中，斷裂基因優(yōu)選采用標準的染色體轉化技術放置在與細菌染色體相距很遠的部位。將基因片段反方向排列可作為進一步的控制措施。該方法的另一描述是將一個目標轉基因分裂成兩部分，并且在將斷裂基因插入真核細胞前與適當?shù)膇ntein區(qū)域結合，主要目的是阻止轉基因的活性向環(huán)境或臨近的細胞傳遞。斷裂基因也可以被安放在原核細胞染色體上相距很遠的部位或單獨的染色體上。此外，這些基因片段也可位于不同的細胞器內(nèi)如細胞核和線粒體內(nèi)。位于線粒體內(nèi)的基因片段是通過母系傳遞的。
本發(fā)明的用途之一是阻止完整轉基因由轉基因植物向環(huán)境中傳播。它能通過將轉基因融合分裂成兩個或更多的片段并且進一步與intein片段融合來完成。部分轉基因融合體分別位于單獨的小室中，例如一部分位于細胞核DNA內(nèi)而第二部分則位于葉綠體DNA內(nèi)。隨著部分基因的表達，蛋白片段向活性部位移動并且在此處重構靶蛋白活性。只有在細胞核內(nèi)的轉基因片段是通過花粉傳播的，因為葉綠體DNA只通過母系傳播方式向下一代傳播。這就明顯減少了完整的轉基因向周圍環(huán)境的傳播。
本發(fā)明的另一優(yōu)勢是僅僅表達非活性融合蛋白種屬的宿主細胞處理起來非常安全，因而減少了靶蛋白與人和環(huán)境接觸的風險，這些靶蛋白可能是一個毒素。此外，將靶基因分裂成兩個獨立部分后也顯著降低了通過DNA載體(質粒、病毒，粘粒等)或其它方式(如細胞融合等)將整個蛋白編碼序列轉移到其他微生物中去的機率。一個設想的例子是表達一個毒性基因如白喉毒素。白喉毒素蛋白是一種對人和動物細胞具有很強毒性的蛋白質，在處理時應十分小心。這種蛋白質已經(jīng)作為殺滅腫瘤細胞的藥物進行過臨床前和I期臨床研究(Kelley，Proc.Natl.Acad.Sci USA 85(11)3980-3984(1988)；Alexander，神經(jīng)元Neuron3(1)133-139(1989)；Maxwell等，癌癥研究Cancer Res.51(16)4299-4304(1991)；Madshus，生物化學雜志J.Biol.Chem.，269(26)17723-17729(1994)；Murphy和vanderSpeck，Semin Cancer Biol.6(5)259-267(1995)；Rozemuller和Rombouts，白血病Leukemia，12(5)710-717(1998)；Veggeberg，Mol.Med.Today 4(3)93(1988)；Kreitman，Current Opin.Immunol.，11(5)570-578(1999)；Vallera等，蛋白質工程Protein Eng.12(9)779-785(1999))。因此，將白喉毒素基因分裂成兩個intein融合DNA片段并且在兩個不同的細菌或酵母菌株中表達是有益處的。這兩種融合蛋白在需要時可以被混合起來組合成毒素。
第三，至少將靶基因的一個片段限制在一個經(jīng)母系遺傳的細胞器內(nèi)(如葉綠體或線粒體)，就可避免相關微生物的功能基因通過交叉受粉進行基因轉移。
本發(fā)明也可用于轉基因動物中表達任何目的基因的手段。轉基因動物模型被廣泛作為科研工具進行生物醫(yī)學研究或制造需要的蛋白質。為研究和商業(yè)目的(如生產(chǎn)疫苗或治療藥物或作為人類疾病模型)(Alexander，神經(jīng)元Neuron3(1)133-139(1989)；Groner等，生理學雜志J.Physiol.84(1)53-77(1990)；Patil等，神經(jīng)元Neuron 4(3)437-447(1990)；Aloe等，生長因子Growth Factors9(2)149-155(1993)；Aguzzi等，大腦病理學Brain Pathol.4(1)3-20(1994)；Groner等，Biomed.Pharmacother.48(5-6)231-240(1994)；Schorderet，Experientia51(2)99-105(1995))，轉基因小鼠和其他轉基因動物如轉基因魚、青蛙、大鼠、牛、豬等已經(jīng)顯示可以表達人類基因(或一種外源基因)。擔心的問題之一是轉基因動物可能獲得一種意外的外源基因并將其傳遞到下一代和繼續(xù)往下傳遞。這將導致基因改變的動物株，由此可產(chǎn)生無法預計的社會和倫理后果。根據(jù)本發(fā)明，這種轉基因能夠被分裂成兩個無活性的融合DNA片段。其中的一個片段整合到動物的基因組內(nèi)，而另一個片段可能由DNA載體(如病毒等)提供，該載體無法融合到基因組內(nèi)。因此，當一個來源于動物和另一個來源于DNA載體的融合蛋白共同表達時，融合蛋白將重新組裝，進行反式剪接并形成一個活性蛋白。這種基因排列能阻止動物獲得一個完整的外源性基因，因而避免了基因污染的發(fā)生。
兩個基因片段的小室限制是對反式剪接的擴展。有問題的蛋白被分裂成片段并將適當?shù)臄嗔鸦蚍謩e放置在同一個或不同的DNA分子上。例如，集胞藻屬PCC6803(含有Ssp DnsE或Ssp DnaE intein剪接區(qū)域)中DnaE蛋白的兩部分基因融合到合適的片段后就被分開(Wu等，Proc.Natl.Acad.Sci USA，959226-9231(1998a)；Wu等，Biochim biophys Acta 1387422-432(1998b))，其中一部分位于細胞核內(nèi)，而第二部分位于某一特定微生物的線粒體內(nèi)。
在執(zhí)行本發(fā)明時，必須遵照下列一種或多種方法(1)在目標轉基因上確定合適的分裂位點；(2)斷裂基因為兩個或更多片段并且將每一片段與一個斷裂intein融合的方法學；(3)成功將斷裂基因產(chǎn)物轉變?yōu)橐粋€功能性酶或蛋白質的方法學；(4)篩選宿主細胞內(nèi)活性基因產(chǎn)物或微生物的方法學；(5)確定在相關的細胞器內(nèi)斷裂基因序列的位置；(6)將靶基因分裂成兩個以上片段的方法；(7)采用蛋白互補作用來代表轉基因傳播；并且(8)引入轉基因。(1)任何轉基因上尋找合適斷裂位點的方法在轉基因上尋找斷裂位點一個優(yōu)選的方法是根據(jù)對目標蛋白或其類似物及同源序列的結構分析來進行。該過程包括研究已知的生物化學和X線、NMR或有關的結構信息，進一步確定優(yōu)選的intein插入位點和或將蛋白分裂成片段的位點。特別是應確定哪一個是持久的活性氨基酸殘基以及它們空間結構和在蛋白質內(nèi)的空間排列。如果可能，最好將靶基因分裂以便催化性氨基酸被分配安裝到每一個片段。這樣每一片段不具有活性的可能性將增加。蛋白分裂片段可以在蛋白的任何位置上，但最初檢測的位點應在位于二級結構之間的畔部或連接部如β-片層和α-折疊。第一個選擇的畔部不應是催化部位的部分，盡管最終的分裂位點可能位于此處。作為第一步，優(yōu)選的分裂部位應是蛋白質內(nèi)兩個折疊區(qū)域之間的畔部或連接處。這將使當?shù)鞍灼畏謩e表達時正確折疊的可能性增加。
如果沒有目標蛋白的生物化學或結構資料，那么來自不同微生物或來自同一微生物的相似蛋白序列的排列方式可能提供一些信息。蛋白的排列可通過傳統(tǒng)的序列比較方法或應用任意一種計算機程序如GCG(Genetics Computer Group，Madison，WI.)進行。所有可能代表重要區(qū)域的相似蛋白的高度保守區(qū)和在高度保守區(qū)內(nèi)分裂蛋白可在以后進行測試。我們不應去確定低度保守區(qū)域，位于高度保守區(qū)之間的優(yōu)選區(qū)域內(nèi)氨基酸的數(shù)目也不相同。低度保守提示出現(xiàn)催化殘基的可能性降低，氨基酸殘基長度的變化提示保守區(qū)域之間的確切空間并不由氨基酸的這種延伸所指示。這些特性將有利于在某一位點插入intein并將靶蛋白分裂。
此外，在目的蛋白質中選擇位點插入intein時，應當檢測具有適合被測intein發(fā)揮剪接活性的氨基酸殘基位點。在研究中在目標蛋白中優(yōu)選與自然生成的intein的extein殘基相似或相同的位點。此外，已知能夠促進高效剪接的殘基可與intein一起插入。此時，隨著剪接反應的繼續(xù)，這些殘基將在剪接產(chǎn)物序列中出現(xiàn)并且能改變靶蛋白的活性。靶蛋白上這些外部殘基的作用通過將外部氨基酸插入靶蛋白進行測定并檢測所需的特性或活性。
另一種優(yōu)選的方法是通過隨機連接子的插入對目標蛋白進行系統(tǒng)掃描來進行。連接子掃描能通過多種方法進行(Gustin等，分子生物學方法MethodsMol.Biol.13085-90(2000)；Hobson等，分子生物學方法Methods Mol.Biol.57279-285(1996)；Biery，核酸研究Nucleic Acids Res.281067-1077(2000))。這種方法可生成帶有側枝的隨機全程插入DNA基因文庫。當翻譯這些文庫后能產(chǎn)生不同位置插入的帶有額外氨基酸殘基的一系列蛋白質。然后在文庫中篩選靶蛋白的所需特性。例如，如果靶蛋白具有除草劑抗性，則篩選文庫確定那一個帶有額外氨基酸殘基的蛋白質能夠在除草劑存在時允許目標微生物的生長。建立蛋白質中能容納額外氨基酸的多個位點目錄。如果有結構或生物化學資料，將該目錄與已知的資料相比較。理想的情況是選擇一個能夠容納額外氨基酸插入并且位于連接子或畔部區(qū)域的分裂位點，進而催化位于不同片段的殘基。如果沒有結構資料，優(yōu)選從位于靠近目標蛋白中段的插入部位基因開始斷裂基因，并從此開始繼續(xù)向外檢測斷裂位點直至重構所需的活性。在兩種方法中，優(yōu)選的插入位點也應具有所用intein的天然intein序列，盡管不需如此。在剪接連接處，融合蛋白可以優(yōu)化氨基酸殘基使得功能產(chǎn)物得以評價。(2)一種裂解基因并將每個基因片斷在結構上融合進一個斷裂的編碼intein的序列中的方法一旦一個要斷裂目的基因的位點被確定(見上)，靶基因就采用普通的基因技術(Sambrook等，分子克隆實驗室手冊，第二版，Cold Spring Harbor Laboratory，NYCold Spring Harbor Laboratory Press(1989))斷裂成兩個或更多的片斷。例如，可以設計具有合適限制性位點的PCR引物，使之一個對應于靶基因的起點，另一個對應于斷裂位點的序列?？梢栽O計另一類PCR引物使之對應于斷裂位點和靶基因的另一端。兩個靶基因片斷然后通過PCR進行擴增(Sambrook等，見上)，并克隆進一個具有與PCR引物相同的單一克隆位點的質粒載體中。一旦克隆進獨立的載體中，intein片斷將與靶基因融合。在一種方法中，編碼靶蛋白N-端部分的DNA的C-末端將與編碼intein N-端部分的DNA的N-末端融合，在另一個融合中，編碼靶蛋白C-端部分的DNA的N-末端將與編碼intein C-端部分的DNA的C-末端融合。
然后，這些基因片斷的融合物轉移到相同或不同的表達載體中，并轉化進入以單或多細胞生物體存在的細菌或真核細胞中，以便篩選所期望的靶蛋白活性。應該注意的是所述的基因片斷將可用限制位點被克隆，該位點在天然的或通過突變添加的intein基因內(nèi)部或外部。而且，為了通過重組轉移基因，可用重組位點替代限制性酶切位點。然后基因或基因片斷將轉移和/或從質粒載體、病毒基因組、或細菌、真核細胞或原始生物體(archeal organism)基因組中表達。一個優(yōu)選的方法是應用天然存在的反式剪接intein，例如來自集胞藻菌屬PCC6803(Wu等，Proc.Natl.Acad.Sci.USA 959226-9231(1998))dnaE基因的intein。但是，任何已知的intein都可以使用(見http∥www.neb.com/neb/frame tech.html上的InBase；Perler等，核酸研究Nucleic Acid Res.，28344-345(2000))。這將涉及斷裂全長intein以產(chǎn)生所期望的親和性或反式剪接的區(qū)域。一種方法是在蛋白剪接區(qū)的B和F單元之間的連接區(qū)斷裂全長intein (Petrokovshi，蛋白質科學Protein Sci.764-71(1998)；Perler等，核酸研究Nucleic Acid Res.251087-1093(1997)；Perler等，核酸研究Nucleic AcidRes.，28344-345(2000))。
(3)從表達的斷裂片斷中產(chǎn)生一個功能蛋白下一步是采用intein作為一個親和區(qū)加速蛋白N-和C-末端部分的互補和重建成為一個功能性的酶。蛋白斷裂位點的確定可如上面(1)中所述，靶基因片斷的克隆和intein區(qū)的添加可如(2)中所述。如此，intein片斷不需要導致兩個蛋白片斷的剪接以重建酶活性。在一個優(yōu)選的實施方案中，intein區(qū)將被變化以消除剪接活性的可能性，并將僅作為蛋白互補的加速器。Intein的剪接活性可通過改變涉及剪接反應的氨基酸殘基來消除(Xu等，EMBO J.155146-5153(1996)；Chong等，生物化學雜志J.Biol.Chem.27122159-22168(1996)；Chong等，Biochem.BiophysRes.Commun.，259136-140(1999)；Chong等，基因Gene，192271-281(1997)；Chong等，核酸研究Nucleic Acids Res.，265109-5115(1998)；Chong等，生物化學雜志J.Biol.Chem.，27310567-10577(1998)；Chong和Xu，生物化學雜志J.Biol.Chem.，27215587-15590(1997)；Evans等，J.Biol.Chem.，27418359-18363(1999)；Evans等，生物化學雜志J.Biol.Chem.，2743923-3926(1999)；Evans等，蛋白質科學Protein Sci.，72256-2264(1998)；Evans等，生物化學雜志J.Biol.Chem.，2759091-9094(2000)；Mathys等，基因Gene，2311-13(1999)；Paulus，化學協(xié)會雜志Chem.Soc.Rev.，27375-386(1998)；Perler等，核酸研究Nucleic Acids Res.，251087-1093(1997)；Pietrokovski等，蛋白質科學Protein Sci.，32340-2350(1994)；Pietrokovski等，蛋白質科學Protein Sci.，764-71(1998)，Scott，Proc.Natl.Acad.Sci.USA，9613638-13648(1999)，Shingledecker等，Arch Biochem.Biophys.375138-144(2000)；Southworth等，生物技術Biotechniques 27110-120(1999)；Telenti等，細菌學雜志J.Bacteriol.，1796378-6382(1997)；Wood等，國家生物技術Nat.Biotechnol.，17889-892(1999)；Wu等，Biochim Biophys Acta 1387422-432(1998b)；Wu等，Proc.Natl.Acad.Sci.USA 959226-9231(1998a))。
在另一個實施方案中，intein親和區(qū)可以保留其正常的催化殘基。此外，intein可以包括一個缺失或變化的形式，與其原始基本序列相比，明顯更小或更大或含有非天然的氨基酸殘基。Intein的缺失形式可通過按順序地在基因水平或蛋白水解減少intein的大小，然后檢測親和活性來建立。親和活性可如下檢測，采用斷裂的除草劑抗性基因，將新的缺失變異體與合適的除草劑抗性基因片斷融合，觀察在所述除草劑上的生長。Intein片斷的突變體可通過傾向差錯PCR、連接子掃描、位點直接誘變、或致突變化合物來形成，intein片斷的活性用上述方法測定。注意除草劑抗性基因可用藥物抗性基因、綠熒光蛋白或其他選擇性標記來代替。Intein片斷的親和性檢測也可通過在一個固體支持物上固定一個片斷，檢測第二個片斷與第一個片斷的結合。
(4)一種在合適的宿主細胞或生物體中篩選產(chǎn)生目的活性蛋白的構件的方法靶基因活性的篩選依靶基因的不同而異，但可在表達和純化后或在粗的細胞溶解產(chǎn)物中通過體外實驗來進行，或在體內(nèi)通過細胞表現(xiàn)型來確定蛋白活性，如存活能力、形態(tài)學、對一種藥物或一種化合物敏感或不敏感、外觀，或與一種特異的分子或化合物結合或不結合的能力。一個優(yōu)選的方法是采用大腸桿菌作為宿主細胞進行檢測，例如一個斷裂基因的重組產(chǎn)物的耐除草劑活性。大腸桿菌必須對所述的除草劑敏感。與intein融合的靶基因片斷存在于一個或幾個質粒中，并用標準的方法轉入大腸桿菌細胞中。
基因融合體結構性表達或通過一個可誘導的啟動子表達。然后在選擇的條件下檢測大腸桿菌的生長情況，即在除草劑存在的情況下，存在或缺乏合適的基因片斷。在基因片斷存在時生長表明靶蛋白活性的重建。大腸桿菌細胞可采用本領域熟知的技術被任何細菌、原始或真核細胞(單或多細胞)以及病毒替代。
此外，兩個靶基因片斷都可存在于生物體基因組中，或一個片斷位于基因組中，另一個在質?；蚰硞€其他載體中。靶蛋白片斷可在一個生物體中一起或分別表達，并加入到另一個細胞類型中以供檢測。融合可在植物細胞或其他多細胞生物體中直接檢測，將轉基因片斷置入宿主生物體核、葉綠體或線粒體基因組中，并測定是否存在所需要的活性。靶基因或蛋白片斷可通過細菌、真菌、病毒、微膠粒、機械的(biolistic)或相似的載體傳遞到被檢測的細胞或生物體中。
(5)斷裂基因的定位本發(fā)明也包括在不同的細胞小室中斷裂靶基因序列的定位，在染色體或不同載體上的不同定位。一個優(yōu)選的方法是將兩個斷裂的基因序列置于核、葉綠體、線粒體、細菌人工染色體、酵母人工染色體、質粒內(nèi)，優(yōu)選地，兩個不共同存在于上述任一載體中。片段的定位可按標準的分子生物學技術來完成。為了從其片段重構基因產(chǎn)物，必須將合適的基因片段與靶/定位的序列融合，使得其蛋白產(chǎn)物被轉運進細胞小室中(如葉綠體)，在此可發(fā)生功能重建。
(6)將靶基因斷裂成兩個或更多片段的方法本發(fā)明也表達了將靶基因分裂成兩個或更多片段，以及通過反式剪接、所有必需片段的intein介導的互補或蛋白互補重建所需活性的方法。例如，不同活性的inteins可被附著于靶蛋白片段，以前述的方式(Otomo等，生物化學Biochemistry，3816040-16044(1999)；Otomo等，分子生物學雜志J.Biomol.NMR，14105-114(1999))使其重新裝配活性蛋白。這樣，除位置的數(shù)目與蛋白分裂的片段數(shù)目相當外，每個片段可位于染色體上的遠隔部位，在單獨的染色體上或在上述的多個位置上。
(7)在防止轉基因傳播中采用蛋白互補作用本方案采用兩個蛋白片段的天然互補活性來重建所需的蛋白特性。編碼蛋白兩部分的兩個基因可能定位在核、葉綠體、線粒體、細菌人工染色體、酵母人工染色體、質?；蚰切┘毎骰蜉d體的任何組合。在表達后，兩個蛋白片段都可靶向到蛋白作用的部位，通過蛋白片段的互補作用產(chǎn)生所需的蛋白特性。蛋白的互補作用以前曾被報道過(Rossi等，Trends Cell Biol.10119-122(2000))，因此使應用intein作為互補區(qū)成為可行的選擇。進行這個實驗的必須步驟與已經(jīng)討論的步驟相似，除了沒有采用intein融合體以外。斷裂靶基因的位點的確定如(1)中所述。轉基因片段的克隆如(2)所述，除了不用intein作為融合參與者以外。斷裂蛋白活性的篩選如(4)所述進行。
(8)通過病毒感染將一個轉基因導入生物體中在另一個實施方案中，兩個轉基因片段，是或不是intein融合體，可能分別包裝在病毒顆粒中。這些病毒共同感染一個生物體，兩個轉基因都表達。所需的蛋白特性在蛋白剪接、intein介導的互補作用、或蛋白互補作用后產(chǎn)生。一個優(yōu)選的方法包括選擇斷裂位點，克隆片段，并檢查轉移的活性，如(1)，(2)和(4)中所述。合適的斷裂轉基因或轉基因intein融合體被包裝進腺病毒中。含有合適轉基因的腺病毒可被導入目標生物體中，經(jīng)過轉染過程引導兩個基因片段使靶蛋白活性得以表達。實施例的簡單描述在實施例I中，我們說明了通過intein斷裂一個除草劑抗性基因的方法。顯示了如何根據(jù)序列同源分析和目的蛋白或其類似物的晶體結構，在編碼乙酰乳酸合酶(ALS)的大腸桿菌除草劑抗性基因中選擇潛在的斷裂位點。編碼ALS蛋白N-端327個氨基酸殘基的DNA片段在結構上與Ssp DnaE intein N-端的123個氨基酸融合，同時，編碼C-端221個氨基酸殘基的DNA片段在結構上與Ssp DnaE intein C-端的36個氨基酸融合。帶有融合基因之一的質粒載體表達為一個無活性的ALS蛋白片段。當兩個融合基因載體被導入同一個宿主細胞并共表達時，兩個無活性的融合蛋白在體內(nèi)進行反式剪接產(chǎn)生一個功能性的酶，使大腸桿菌宿主細胞具有除草劑抗性。這種方法可用于在任何基因內(nèi)選擇合適的位點，以與intein序列融合。
在實施例II中，我們說明了如何根據(jù)玉米ALS基因和其大腸桿菌對應體——ALSII基因的序列同源性，在玉米ALS基因中選擇斷裂位點。編碼玉米ALS基因N-端397個氨基酸殘基的DNA在結構上與編碼Ssp DnaE intein N-端123個氨基酸殘基的DNA序列融合，同時，編碼C-端241個氨基酸殘基的DNA片段在結構上與編碼Ssp DnaE intein C-端36個氨基酸的DNA融合。我們顯示，當兩個融合基因共表達時，兩個融合蛋白進行反式剪接，產(chǎn)生一個成熟蛋白的期望大小的蛋白產(chǎn)物。
在實施例III中，我們說明了一個在轉座子隨機連接子插入的基礎上，在編碼5-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)的突變體S.typhimurium aroA基因中識別潛在的斷裂位點的方法。在所有42個潛在位點中，位于EPSPS 215和235氨基酸位的兩個位點被選來斷裂EPSPS基因。編碼EPSPS蛋白N-端215或235個氨基酸殘基的DNA片段在結構上與Ssp DnaE intein N-端的123個氨基酸融合，同時，編碼EPSPS C-端212或192個氨基酸殘基的DNA片段在結構上與編碼SspDnaE intein C-端36個氨基酸的DNA融合。當在ER2799中僅導入與intein融合或不融合的半個EPSPS基因，以及沒有intein的互補的兩半時，EPSPS表達為一個無功能的蛋白。但當與活性或無活性intein融合的兩半個EPSPS都引入ER2799時，EPSPS表達為一個功能性蛋白并賦予宿主對除草劑草甘磷的抗性，表明SspDnaE intein的N-和C-端部分通過將EPSPS兩部分靠近而加速EPSPS蛋白N-和C-端部分的互補和重組。
在實施例IV中，我們描述了一種方法，其中兩個不相關的基因產(chǎn)物如氨基糖苷-3-乙酰基轉移酶(該酶負責藥物壯觀霉素或鏈霉素的代謝)和AequoreaVictoria可溶性修飾的綠色熒光蛋白，可在大腸桿菌細胞中被反式剪接成一個雜交蛋白。兩個基因位于兩個不同的質粒中，各自從Ssp DnaE intein具有反式剪接元件。質粒有兩個獨立的表達系統(tǒng)。雜交蛋白賦予宿主對硫酸壯觀霉素的抗性。
在實施例V中，我們描述了一種方法，其中兩個不相關基因，如aadA(編碼氨基糖苷-3-乙酰基轉移酶)和smGFP(可溶性修飾的綠色熒光蛋白)，可在葉綠體啟動子(PpsbA)控制的轉錄和翻譯水平下位于一個單一大腸桿菌-植物雙重載體上。兩個基因當表達時，能夠產(chǎn)生一個雜交的氨基糖苷-3-乙酰基轉移酶-可溶性修飾的綠色熒光蛋白。因此這種方法可在采用能被大腸桿菌和植物細胞結構共同識別的啟動子導入植物細胞之前，進行蛋白/蛋白片片段的快速反式剪接篩選。
在實施例VI中，我們描述了一種方法，其中含有5-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)或乙酰乳酸合酶(ALS)兩個片段及Ssp DnaE intein的順式剪接結構能在植物細胞漿中剪接成一個成熟蛋白。這個實驗將加強在細胞漿中順/反式剪接的觀點。這項技術對于需要在細胞漿環(huán)境中進行活性/折疊特異修飾的蛋白質是有用的。一部分具有必須的轉運信號和剪接元件的靶蛋白基因將以前體多肽的形式置于一個細胞器內(nèi)以進行細胞漿轉運。
在實施例VII第一部份中，我們描述了一種方法，其中兩個不相關基因，如aadA(編碼氨基糖苷-3-乙酰基轉移酶)和smGFP(可溶性修飾綠色熒光蛋白)，可位于葉綠體基因組上，并通過蛋白反式剪接產(chǎn)生一個雜交蛋白。此方法的成功將導致蛋白/蛋白片段的區(qū)域化和功能性蛋白的反式剪接。而且，在一個載體中轉化幾個不同的基因以形成多功能蛋白，簡化了新特性的設計。
在實施例VII第二部分中，我們描述了一種方法，其中兩個不相關的基因/基因片段可位于植物細胞的兩個不同小室中，如葉綠體和核，并表達各自的蛋白/多肽。由核編碼的成分具有三部分，含有一個葉綠體轉運肽，該肽將幫助蛋白片段在細胞漿中被合成，并游走到葉綠體中以便進行反式剪接。葉綠體部分將在細胞器的循環(huán)基因組中成為一個完整的部分。得到的植物將不能將新導入的轉基因的新特性傳遞給任何緊密相關的種屬。
本發(fā)明通過下面的實施例進一步進行描述。這些實施例為了幫助理解本發(fā)明，并不能視為其限制條件。
上下引用的文獻在此一并作為參考。實施例I通過蛋白反式剪接在大腸桿菌中產(chǎn)生功能性的除草劑抗性乙酰乳酸合酶在此實施例中，我們說明了一種斷裂基因的方法，該基因編碼大腸桿菌乙酰乳酸合酶II(ALSII；EC 4.1.3.18；乙酰醇酸合酶)，通過與編碼SsP DnaE intein序列的融合(Evans等，生物化學雜志J.Biol.Chem.2759091-9094(2000)；Scott等，pro.Natl.Acad.Sci.USA，9613638-13643(1999))具有了除草劑抗性變異性(Yadav等，Proc.Natl.Acad.Sci.USA，834418-4422(1986)；Hill等，生物化學雜志J.Bio chem，335653-661(1998))。我們能夠經(jīng)過在細菌大腸桿菌ER2744(fhuA2 glnV44e14-rfbD1？relA1？endA1 spoT1？thi-1Δ(mcrC-mrr)114∷IS10 lacZ∷T7gene1)(圖5)中的蛋白反式剪接重建功能活性的ALSII酶。首先，我們顯示如何根據(jù)序列和結構同源性的分析，在乙酰乳酸合酶II基因中選擇潛在的斷裂位點。然后我們顯示了如何設計和進行試驗以分析斷裂的ALS蛋白的蛋白反式剪接活性，和如何分析重組ALS的酶活性。我們說明了從兩個獨立質粒載體產(chǎn)生的ALS融合蛋白的兩個部分，經(jīng)過反式剪接以產(chǎn)生一個成熟蛋白的期望大小的蛋白產(chǎn)物。此外，斷裂ALS基因片段的共表達使大腸桿菌ER2744具有了對除草劑的抗性。這種方法可以應用于使用反式剪接inteins的任何目的蛋白的生產(chǎn)。1.野生型大腸桿菌ALSII克隆及其除草劑抗性突變體第一步是克隆野生型ALSII，產(chǎn)生一個除草劑抗性的ALSII突變體，其攜帶丙胺酸26至纈氨酸的替代(Yadav等，Proc.Natl.Acad.Sci.USA，834418-4422(1986)；Hill等，生物化學雜志Biochem.J.，335653-661(1998))。含有一個酶活性拷貝ALSII的大腸桿菌株MI162是從CGSC，E.coli Genetic Stock Center(耶魯大學，New Haven，CT)獲得的?；蚪MDNA采用QIAamp組織試劑盒(Qiagen，Inc.，Studio City，CA)從大腸桿菌株MI162中提取。采用引物5’-GGACGGGGAACTAACTATG-3’(SEQ IDNO1)，和5’-CCACGATGACGCACCACGCG-3’(SEQ ID NO2)和VentDNA聚合酶(New England Biolabs，Beverly，MA)對大腸桿菌DNA樣品進行DNA聚合酶鏈式反應(PCR)，以克隆全長ALSII。編碼ALSII的序列進一步采用引物5’-GGAGGGGGCATATGAATGGCGCACAGTGGG-3’(SEQ ID NO3)，和5’-GGGGGGTCATGATAATTTCTCCAAC-3’(SEQ ID NO4)擴增，并克隆進pTYB1質粒(New England Biolabs，Beverly，MA)的NdeI和PstI位點中，建立一個載體，pALSII。通過從pALSII中去掉一個3kb的非必需序列得到一個更短的結構，pTYBT-ALSII，即用PmeI和BstZ172限制性消化，然后自身連接。除草劑抗性變異性，丙胺酸26至纈氨酸，通過采用Quickchange Site-Directed Mutagenesis試劑盒(Stratagene，La Jolla，CA)的位點定向誘變引入pTYBT-ALSII中。誘變的引物是5’-CCGGGTGGCGTAATTATGCCGGTTTACG-3’(SEQ ID NO5)和5’-CGTAAACCGGCATAATTACGCCACCCGG-3’(SEQ ID NO6)。通過部分NdeI和PstI消化pTYBT-ALSIIm產(chǎn)生的編碼突變ALSII(ALSIIm)的序列與pTYB1連接產(chǎn)生一個ALSIIm表達載體，pALSIIm。2.斷裂位點的選擇在任何基因內(nèi)識別一個合適斷裂位點的一個優(yōu)選方法是，分析一個蛋白家族的序列同源性并檢查其蛋白結構或其同源物的結構(Ibdah等，Biochemistry，3516282-16291(1996))。序列排列和結構比較發(fā)現(xiàn)細菌、酵母和更高等植物的ALS基因具有高度保守的區(qū)域(圖6，這里僅顯示部分序列排列)。而且，在蛋白中存在高度可變區(qū)，如在大腸桿菌乙酰乳酸合酶的異構體II中(圖6)中，氨基酸殘基Q327和C328周圍的區(qū)域。與其他同源物相比，大腸桿菌ALSII在此區(qū)具有一個10個氨基酸的缺口，來自不同種屬的ALS基因間在側向序列上有較少的同源性(圖6)。而且，同源物，丙酮酸氧化酶的晶體結構分析提示，Q327和C328似乎定位于兩個分子內(nèi)區(qū)的連接子結構中，遠離催化核心(Ibdah等，生物化學Biochemistry，3516282-16291(1996))。因此我們推測，ALSII在此區(qū)通過一個intein的斷裂可能保留必要的彈性，允許進行有效的蛋白反式剪接。另外，一個外源蛋白序列插入至此位點對ALSII的催化區(qū)結構及其酶活性影響較小或沒有影響。因此氨基酸殘基Q327和C328被選作大腸桿菌ALSLI的斷裂位點之一(圖6，由箭頭指示)。3.大腸桿菌檢測系統(tǒng)大腸桿菌乙酰乳酸合酶的異構體II具有Ala26Val突變，稱為ALSIIm，使大腸桿菌株ER2744具有對磺酰脲類除草劑(SU)，如甲基sulfometuron(SM)的抗性。大腸桿菌ER2744株被用作檢測除草劑抗性大腸桿菌ALSII基因活性的體內(nèi)模型系統(tǒng)，通過在Q327和C328間的連接子插入進行基因修飾。大腸桿菌ER2744來源于野生型大腸桿菌K12，后者含有活性ALSI和ALSIII酶，但沒有活性ALSII。ALSI和ALSIII是大腸桿菌中ALS基因的兩個異構體，對纈氨酸、異亮氨酸和亮氨酸的合成很重要(LaRossa和Schloss，生物化學雜志J Biol.Chem.2598753-8757(1984))。它們的活性對纈氨酸反饋抑制敏感。因此，用100μg/ml纈氨酸(Sigma，St.Louis，MO)飽和生長培養(yǎng)基，ALSI和III將被抑制，細胞將停止生長。通過在大腸桿菌細胞中導入一個重組除草劑抗性ALSII(ALSIIm)，因為ALSII對纈氨酸的抑制有抵抗力，可以挽救它們的生長。4.產(chǎn)生一個修飾的除草劑抗性ALS基因Inteins經(jīng)常需要某些氨基酸殘基排在其N-和C-端側面以達到最佳的剪接或反式剪接活性。例如，當5個天然殘基存在于其N-和C-端時，來自集胞藻屬PCC6803的dnaE基因的intein有效地剪接，而去除這些殘基則不同程度的抑制剪接活性(Evans等，生物化學雜志J.Biol.Chem.2759091-9094(2000))。在剪接結合點處包含這些最佳的氨基酸殘基可能是精細的剪接活性所需要的。因而得到的產(chǎn)物可在兩個蛋白序列的連接結合點處含有這些殘基。因此，對于每個intein插入點，必須評價是否這些額外的氨基酸殘基將對產(chǎn)物的活性具有負面作用。
ALSIIm-14通過在Q327和C328A之間將一個合成的DNA連接子(NewEngland Biolabs，Beverly，MA)插入編碼ALSIIm的序列中而構建，該連接子編碼下面14個氨基酸殘基(NH2-LEKFAEYCFNKSTG-COOH(SEQ ID NO7))。ALSIIm-14的除草劑抗性用表達ALSIIm-14蛋白的質粒轉化的大腸桿菌ER2744宿主細胞進行檢測。用表達野生型ALSII和除草劑抗性ALSII(ALSIIm)的質粒轉化的大腸桿菌ER2744細胞被用作對照。
平板檢測被用來檢查ALSIIm-14從纈氨酸(100μg/ml)或纈氨酸加除草劑SM(50μg/ml，Supelco Park，Bellefonte，PA)飽和的M9限制性培養(yǎng)平板(Sambrook等，(1989))中挽救大腸桿菌ER2744的能力。M9培養(yǎng)基含有2μg/ml硫胺素、2mMMgSO4、0.1mM CaCl2、0.2％葡萄糖、50μg/ml卡那霉素、100μg/ml氨芐青霉素和0.3mM IPTG。為了進行平板實驗，100μl 25mg/ml的纈氨酸加或不加50μl 25μg/ml的甲基Sulfometuron(SM)分散于M9選擇平板上。為了檢測細菌的生長，過夜培養(yǎng)物在有或沒有纈氨酸和/或SM的M9平板上劃痕。平板在各種溫度下孵育(如圖7指示)48到72小時，然后照相。在添加纈氨酸的平板上，表達ALSII，ALSIIm或ALSIIm-14的細胞能夠生長(圖7-a)。但是，當纈氨酸和SM都應用時，只有表達除草劑抗性ALSIIm或ALSIIm-14的菌株可以生長(圖7-b)。這些體內(nèi)結果表明，在建議的斷裂位點插入了14個氨基酸殘基的ALSIIm，可以使大腸桿菌ER2744在纈氨酸和SM的存在下生長。因此，ALSIIm-14是有功能活性的，插入14個氨基酸不影響其酶活性。
5.ALSII-Intein融合基因的構建下一步，大腸桿菌ALSIIm基因被分割，并在結構上融合到Ssp DnaE intein編碼區(qū)的N-和C-末端部分。融合基因采用兩個相容的大腸桿菌表達載體——pMEB10和pKEB1來產(chǎn)生，兩者能夠在同一個大腸桿菌宿主細胞內(nèi)共表達兩種intein融合基因，如以前Evans等所描述的(生物化學雜志J.Biol.Chem.2759091-9094(2000))。編碼除草劑抗性ALSII(ALSIIM)基因N-末端片段327個氨基酸的DNA序列在結構上與Ssp DnaE intein N-末端側面7個氨基酸殘基的編碼區(qū)融合，后接intein N-末端的123個氨基酸殘基(INn)(圖5)。編碼ALSIIm C-末端221個氨基酸殘基的DNA序列在結構上與編碼Ssp DnaE intein C-末端36個氨基酸殘基(INc)和intein C-末端側面7個氨基酸殘基的DNA序列融合(圖5)。ALSII N-末端片段用引物5’-GGGGGTCATGAATGGCGCACAGTGGG-3’(SEQ ID NO10)和5’-GCGCGCTCGAGTTGATTTAACGGCTG CTGTAATG-3’(SEQ ID NO11)從pALSIIm中擴增。擴增片段被消化并克隆進pMEB16的NcoI和XhoI位點中，pMEB16含有編碼Ssp DnaE intein N-末端123個氨基酸殘基的序列。得到的載體pEA(N)表達一個由ALSIIm N-末端片段和DnaE N-末端片段(ALSIIm(N)-INn)組成的融合蛋白。ALSII C-末端片段用引物5’-GCGCGACCGGTTGTGACTGGCAGCAACACTGC-3’(SEQ ID NO12)和5’-GGGGGGCTGCAGTCATGATAATTTCTCCAAC-3’(SEQ ID NO13)擴增。片段用AgeI和PstI消化然后克隆進pMEB9的AgeI和PstI位點。得到的質粒pEA(C)表達一個由Ssp DnaE intein C-末端片段和ALSII C-末端片段(ALSIIm(C)-INc)組成的融合蛋白。一個含ALSIIm(C)-Inc融合基因的1kb XbaI-PstI片段從pEA(C)中亞克隆進pKEB1質粒的XbaI和PstI位點中，以形成一個卡那霉素抗性的表達載體pKEC3。
當pEA(N)和pKEC3在大腸桿菌ER2744中共表達時，預測兩種融合蛋白的反式剪接將導致大腸桿菌ALSIIm兩個斷裂部分的連接，在連接結合處有14個氨基酸。
6.蛋白反式剪接活性的評定為確定ALSII-DnaE intein融合蛋白是否能夠在大腸桿菌細胞中反式剪接以產(chǎn)生ALSIIm-14，用ALSII N-或C-末端片段特異性兔抗血清進行Western斑點雜交。
收集兩種分別對抗來源于ALSII N-末端區(qū)和C-末端區(qū)肽的兔抗血清(COVANCE)。這兩種肽是1)來自ALSII N-末端序列(氨基酸殘基Ala4至Tyr23)的NH2-CAQWVVHALRAQGVNTVFGYG-COOH(SEQ ID NO8)和2)來自ALSII C-末端序列(氨基酸殘基Val 530V至Ser548)的NH2-CVWPLVPPGASNSEMLEKLS-COOH(SEQ ID NO9)。一個單獨的細菌菌落接種于加有100μg/ml氨芐青霉素的LB培養(yǎng)基中37℃孵育4小時。然后加入IPTG至終濃度0.3mM進行誘導。細胞在15℃繼續(xù)培養(yǎng)2-16小時。移出20μl細胞培養(yǎng)物，與3×SDS負載緩沖液(New England Biolabs，Beverly，MA)混合，煮沸5分鐘，取2μl加于12％Tris-甘氨酸凝膠(Novex，San Diego，CA)上。隨后蛋白轉移至一個硝酸纖維素膜上，并用5％奶粉室溫封閉1小時(Sambrook，等，分子克隆，(1989))。采用抗血清(1∶20000稀釋)在1％奶粉存在下4℃過夜進行免疫斑點雜交。斑點然后清洗3次，每次15分鐘，并與1∶10000稀釋的辣根過氧化物酶交聯(lián)的抗兔二抗室溫孵育1小時。用化學發(fā)光Western檢測試劑盒(New England Biolabs，Beverly，MA)進行顯色。
在15℃培養(yǎng)的對照細胞中，ALSII的表達(圖8A，8B&8C，2泳道)被所有的抗體特異地別。在載有一個單一ALSII-intein融合載體和另一個賦予氨芐青霉素和卡那霉素抗性的對照載體的細胞中，僅有ALS(N)-INn或ALS(C)-INc蛋白被抗-ALS(N)或抗-ALS(C)血清檢測到(圖8A，3泳道，圖8B，4泳道)。當ALS(N)-INn和ALS(C)-INc共同表達時，如同所期望的剪接產(chǎn)物ALSIIm-14，一個60kD條帶與對抗ALSII N-末端和C-末端的抗體發(fā)生反應(圖8A&8B，5泳道)。如所預測的，ALSIIm-14的這個條帶比天然ALSII具有稍高的分子量。數(shù)據(jù)表明在兩個ALSII-intein融合蛋白間發(fā)生了反式剪接。觀察到一個與抗-ALS(N)反應的非特異蛋白(圖8A和圖8C，1泳道至5泳道)。
Ssp DnaE intein的反式剪接活性以前顯示是溫度敏感的(Evans等，J.Biol.Chem.2759091-9094(2000))。ALSII-Ssp DnaE intein蛋白的反式剪接溫度敏感性通過采用對抗ALSII N-末端片段的抗血清進行western斑點雜交分析來確定(圖8C)。細胞被表達ALSII或ALSIIm(N)-INn和ALSIIm(C)-INc的質粒轉化。ALSII蛋白的表達在37℃誘導3小時。ALSIIm(N)-INn和ALSIIm(C)-INc共同表達的誘導條件為37℃3小時，30℃ 3小時，25℃ 6小時或15℃ 16小時。細胞提取物用SDS樣品緩沖液處理，在95℃到100℃變性5分鐘，然后在12％SDS-PAGE上進行凝膠電泳。用對抗ALSII N-末端片段的抗血清作為探針進行western斑點雜交。圖8C包括下列樣品無ALSII的細胞(1泳道，對照)，ALSII(2泳道)，ALSIIm(N)-INn和ALSIIm(C)-INc(3泳道至6泳道)。細胞培養(yǎng)的溫度為1泳道至3泳道37℃，4泳道30℃，5泳道25℃，6泳道15℃。
在37℃生長的細胞中，ALSIIm-14沒有檢測到(圖8C，3泳道)。但在30℃培養(yǎng)的細胞中，觀察到剪接產(chǎn)物帶有大量N-末端融合蛋白聚集(圖8C，4泳道)。在25℃和15℃培養(yǎng)的細胞中(圖8C，5泳道和6泳道)，僅檢測到剪接產(chǎn)物，表明N-末端融合蛋白完全轉變成剪接產(chǎn)物。在所有表達條件下ALSIIm(C)-INc蛋白均過量產(chǎn)生。數(shù)據(jù)顯示Ssp DnaE intein能夠介導N-和C-末端ALSIIm蛋白片段的反式剪接以形成ALSIIm-14。當實驗在37℃進行時，剪接反應被抑制。當細胞在15-25℃而不是30℃培養(yǎng)時，剪接似乎更為有效。
7.含有斷裂ALS基因的細胞中的除草劑抗性下一步是確定剪接產(chǎn)物作為ALSIIm(ALSIIm(N)-INn和ALSIIm(C)-INc)融合蛋白反式剪接的結果，是否使大腸桿菌ER2744對纈氨酸和SM具有抗性。第一個實驗是檢測ALSIIm(N)-INn和ALSIIm(C)-INc融合蛋白的共同表達對纈氨酸飽和的M9限制培養(yǎng)基中細胞生長的影響。在一個平板實驗中(見第四節(jié))，所有轉化細胞在無纈氨酸的M9培養(yǎng)基中均生長良好(圖9A-a)。但在纈氨酸存在的條件下，僅有ALSII及其除草劑抗性突變體ALSIIm可以使細胞在30℃和37℃下生長(圖9A-b，9A-c)。很明顯，ALSIIm(N)-INn和ALSIIm(C)-INc的共同表達在30℃(圖9A-c)或更低的溫度(數(shù)據(jù)未顯示)下，從纈氨酸平板中挽救了細胞的生長。此外，ALSIIm或ALSIIm(N)-INn和ALSIIm(C)-INc的表達從另外的除草劑抑制中挽救了細胞的生長(圖9A-d)。而且，野生型ALSII的轉化不能從除草劑抑制中使細胞恢復生長(圖9A-d)。單獨表達ALSIIm(N)-INn或ALSIIm(C)-INc的對照細胞在纈氨酸平板中不生長(圖9A-b，9A-c)；沒有與intein融合的天然ALSII N-和C-末端片段的共同表達也不能使細胞生長(圖9A-b，9A-c)。數(shù)據(jù)表明ALSIIm(N)-INn和ALSIIm(C)-INc片段的共同表達對于反式剪接和產(chǎn)生功能性的ALSII是需要的，ALSII可以使細胞在纈氨酸和除草劑抑制下生長。
進行定量液體培養(yǎng)實驗以證明平板實驗獲得的結果。液體實驗按如下進行。將一個單菌落接種于添加了卡那霉素和氨芐青霉素的LB培養(yǎng)基中，37℃ 4小時。用0.3M的IPTG誘導表達，細胞培養(yǎng)物轉換到30℃繼續(xù)培養(yǎng)2小時。然后，200μl相當于OD6008.0的培養(yǎng)物被離心下來，用M9培養(yǎng)基清洗1次，并在200μl M9培養(yǎng)基中重懸。40μl培養(yǎng)物等分入2ml合適的培養(yǎng)基中，在測定OD600前生長24-72小時。纈氨酸的濃度為100μg/ml，SM的濃度為50μg/ml。在30℃時，所有轉化細胞在M9限制培養(yǎng)基中均同樣生長良好(圖9B)。在纈氨酸飽和的M9培養(yǎng)基中，野生型ALS使細胞生長，但當加入SM時，則觀察不到生長。但是，表達ALSIIm或ALSIIm(N)-INn和ALSIIm(C)-INc共同表達使細胞在纈氨酸M9培養(yǎng)基以及含有SM的培養(yǎng)基中生長。在對照實驗中，ALSIIm(N)-INn或ALSIIm(C)-Inc單獨表達，或ALSIIm N-和ALSIIm C-末端共同表達但不與intein融合，均不能使細胞在含有纈氨酸的培養(yǎng)基中生長。這個數(shù)據(jù)與平板實驗的結果是一致的。為了進一步比較反式剪接介導的細胞生長與野生型ALSII介導的細胞生長的生長動力學，進行了一個時程研究(圖9C)。數(shù)據(jù)顯示表達ALSII的細胞具有最快的生長率，其次是表達ALSIIm的細胞。與ALSII野生型表達細胞相比，轉化ALS(N)-INn和ALS(C)-INc的細胞生長速率較慢，但不顯著慢于ALSIIm表達細胞的生長速率。表達斷裂ALSII并不與intein融合的細胞，生長非常緩慢。因此，我們從平板和液體實驗證明Ssp DnaE可以介導ALSII反式剪接，引起體內(nèi)功能性抗除草劑的ALSIIm-14的產(chǎn)生。
總之，數(shù)據(jù)表明從兩個不同位置產(chǎn)生的兩種ALS-intein融合蛋白，以溫度依賴的方式進行反式剪接，形成全長的功能性的ALSIIm蛋白。具有兩種ALSIIm融合基因片段的大腸桿菌宿主細胞顯示為抗除草劑表現(xiàn)型。實施例II大腸桿菌中一個玉米乙酰乳酸合成酶的反式剪接在這個實施例中，我們說明一個在大腸桿菌中通過蛋白反式剪接產(chǎn)生全長玉米乙酰乳酸合成酶的方法。我們說明如何根據(jù)玉米ALS基因及其大腸桿菌對應體ALSII基因的序列同源性，在玉米ALS基因中選擇斷裂位點。我們顯示，當斷裂的玉米ALS-intein融合基因共同表達時，兩種融合蛋白經(jīng)過反式剪接產(chǎn)生成熟玉米ALS蛋白的期望大小的蛋白產(chǎn)物。1.斷裂位點的選擇說明其他除草劑抗性基因，如玉米乙酰乳酸合成酶(cALS)基因的反式剪接是重要的，該基因的除草劑抗性突變形式已被用于對植物進行遺傳修飾(Bernasconi等，J.Biol.Chem.27017381-17385(1995))。在任何基因內(nèi)鑒定合適的斷裂位點的一個優(yōu)選方法是分析來自不同生物體的同源基因的反式剪接活性。我們在實施例I中已經(jīng)描述，大腸桿菌ALSII基因，在Q327和C328之間被斷裂后能夠通過體內(nèi)Ssp DnaEintein的反式剪接活性進行重組。進行了大腸桿菌ALSII和玉米ALS之間的序列排列，以尋找玉米ALS基因中與大腸桿菌ALSII基因斷裂位點相應的區(qū)域。結果提示絲氨酸397和蘇氨酸398與大腸桿菌ALSII的斷裂位點(谷氨酸327和半胱氨酸328)相匹配。將玉米ALS在絲氨酸397和蘇氨酸398之間斷裂，如星號所示(圖6)，可以產(chǎn)生兩個玉米ALS-intein融合蛋白，將能精于剪接。2.玉米ALS基因的克隆進行逆轉錄酶聚合酶鏈式反應(RT-PCR)以克隆玉米ALS cDNA。
用RNAqueous試劑盒(Ambion，Inc.，Texas)從玉米葉中分離總RNA。然后采用反向引物3-3(5’-AT CAGTACACAGTCCTGCCATC-3’(SEQ ID NO14))和Superscript逆轉錄酶(LTI-GIBCOBRL，Rockville，MD)將RNA用來合成第一股cDNA。然后，在被用作PCR反應的模板之前，用RNaseH(LTI-GIBCO BRL，Rockville，MD)處理第一股cDNAs。采用Expand Long Template PCR系統(tǒng)(寶靈曼(Boehringer Mannheim)，德國)進行PCR反應。在此反應中使用的引物是反向引物3-3和cALS 5-4引物(5’GAGACAGCCGCCGCAACCAT-3’(SEQ ID NO15))。
一份PCR產(chǎn)物在瓊脂糖凝膠上進行電泳，觀察到大約2kb的條帶。這個片段被克隆至TOPO 2.1載體(Invitrogen，San Diego，CA，廠商規(guī)程)中制成pCALS1。pCALS1的序列采用M13正向和反向引物證實。3.玉米ALS-intein融合體的構建編碼玉米ALS基因N-末端397個氨基酸殘基的DNA通過PCR進行擴增，采用正向引物5’-GGGCCCATATGGCCACCGCCGCCGCCGCG-3’(SEQ ID NO16)，反向引物5’-GGGCCCTCGAGGCTTCCTTCAAGAAGAGC-3’；(SEQ ID NO17)，和模板pCALS1(Sambrook等，分子克隆，(1989))。1.2kb的PCR產(chǎn)物被克隆進TOPO-鈍性載體(Invitrogen，San Diego，CA廠商規(guī)程)中，產(chǎn)生TOPO-cALS(N)。然后TOPO-cALS(N)用NdeI和XhoI被消化。1.2kb消化的DNA片段從低熔點瓊脂糖凝膠中回收，并在結構上與編碼Ssp DnaE intein N-末端123個氨基酸的DNA序列融合，產(chǎn)生表達cALS-intein融合蛋白N-末端，cALS(N)-IN-n，的載體(MEB10-cALS(N))。編碼玉米ALS基因C-末端241個氨基酸殘基的DNA片段被用正向引物5’-GGGCCACCGGTACATCAAAGAAGAGCTTG-3’(SEQ ID NO18)，反向引物5’-GGGGCTGCATTCAGTACACAGTCCTGCCATC-3’(SEQ ID NO19)，和模板pCALS4進行PCR擴增。0.8kb的PCR產(chǎn)物克隆進TOPO-鈍性載體(見上述操作)中，形成TOPO-cALS(N)。然后將TOPO-cALS(N)用AgeI和PstI消化。700bp的DNA片段從低熔點瓊脂糖凝膠中回收，并在結構上融合到編碼Ssp DnaE inteinC-末端36個氨基酸的DNA上，形成載體MEB9-cALS(C)。MEB9-cALS(C)進一步被XbaI和PstI切割，釋放一個1kb的片斷。這個1kb片段克隆進pKEB1載體中，形成一個cALS-intein C-末端融合蛋白，cALS(C)-INc，的卡那霉素抗性表達載體。同樣的額外7個氨基酸，NH2-LEKFAEY-COOH(SEQ ID NO20)和NH2-CFNKSTG-COOH(SEQ ID NO21)，也分別存在于cALS-intein融合蛋白的N-和C-末端連接處。4.玉米ALS-intein融合蛋白的反式剪接兩個在第三節(jié)描述的ALS-intein融合蛋白片斷，cALS(N)-INn和cALS(C)-INc，在實施例1第6節(jié)所描述的相同條件下，都在大腸桿菌ER2744中共同表達。進行Western斑點雜交以檢測反式剪接產(chǎn)物(方法見實施例1第6節(jié))。在斑點上，對應于野生型cALS大小的69kD片段(圖10A，和圖10B，2泳道)在兩種融合蛋白表達的細胞中均可檢測到，并且被特異性對抗來源于玉米ALS N-和C-末端序列兩種肽的兔抗血清所識別(圖10A和圖10B，5泳道)。也觀察到與玉米ALS N-末端抗血清反應的非特異蛋白(圖10A，1泳道至5泳道)。用來生產(chǎn)抗體的肽是1)對應于從賴氨酸66至丙氨酸85序列，NH2-CKGADILVESLERCGVRDVFA-COOH(SEQ IDNO22)，的ALS-N肽，和2)對應于從異亮氨酸619至酪氨酸638的序列，NH2-CIPSGGAFKDMILDGDGRTVY-COOH(SEQ ID NO23)，的ALS-C肽。全長cALS在表達N-或C-末端融合蛋白的細胞中均未檢測到(圖10A和圖10B，3泳道和4泳道)。這說明同大腸桿菌ALSII一樣，斷裂的玉米ALS當與Ssp DnaE intein融合時，也能夠進行反式剪接以產(chǎn)生全長ALS。
總之，玉米ALS基因被Ssp DnaE intein斷裂，并克隆進兩個單獨的質粒載體中。當兩個融合基因載體被導入同一個宿主細胞并共同表達時，兩個融合蛋白經(jīng)過反式剪接產(chǎn)生一個全長cALS。盡管還需要功能測試來確定植物中斷裂的玉米ALS蛋白的活性，但卻提高了將一個植物除草劑抗性或抗病基因成功分裂成兩個無活性基因片段的可能性。這兩個基因片段可以被限制在兩個單獨的細胞小區(qū)中，如葉綠體和核，或染色體上兩個不同的位置，或兩個不同的DNA載體。這種基因表達的新模式可極大地減少一個完整的活性轉基因傳播至其他種屬的可能性。實施例III本實施例詳細描述了應用intein斷裂aroA基因并重建所需蛋白活性的可行性。實驗包括在不同位點斷開編碼突變體aroA基因的基因，并將編碼Ssp DnaE intein(INn)N-末端剪接區(qū)的基因融合到編碼EPSPS蛋白N-末端片段的基因上。同時，編碼Ssp DnaE intein(INc)C-末端剪接區(qū)的基因融合到編碼EPSPS蛋白C-末端片段的基因上。當融合基因被置于兩個不同的質粒中，并在同一個細菌細胞中共同轉化和共同表達時，顯示那些細菌細胞對除草劑草甘磷具有抗性。
可獲得草甘磷抗性的鼠傷寒沙門氏菌aroA基因的克隆1.質粒pEPS#1的建立具有從C301至T變異的鼠傷寒沙門氏菌aroA基因，以豬霍亂沙門菌亞型choleraesuis細菌(ATCC No.39256)中的裝配型質粒的形式，從American TypeCulture Center獲得。來自裝配型質粒的被修飾的aroA基因采用引物EPSP#1(5’-GGATCCTAAGAAGGAGATATACCCATGGAATCCCTGACGTTACA-3’(SEQ ID NO24))，和EPSP#2(5’-GTCGACGCTCTCCTGCAGTTAGGCAGGCGTACTCATTC-3’(SEQ ID NO25))通過聚合酶鏈式反應擴增。PCR產(chǎn)物被插入質粒LITMUS 28(New England Biolabs，Inc.，Beverly，MA)的StuI位點中。在轉化和質粒制備后，測序發(fā)現(xiàn)了一個意料之外的突變(C103至G)，采用Stratagene’s(La Jolla，CA)快速位點定向誘變試劑盒(Quick Change Site DirectedMutagenesis Kit)和引物EPSP#10(5’-GCTTTGCTCCTGGCGGCTTTACCTTGTGGTAAAACCGC-3’(SEQ ID NO26)EPSP#11(5’-GCGGTTTTACCACAAGGTAAAGCCGCCAGGAGCAAAGC-3’(SEQID NO27))使之復原。對所得集落的DNA進行測序發(fā)現(xiàn)意料外的突變已經(jīng)恢復為所期望的C。這個質粒被命名為pEPS#8，并用作隨后的轉位連接子掃描反應中的受體質粒。2.一個用于檢測aroA基因構建物的大腸桿菌株，ER2799的描述一個大腸桿菌株從耶魯大腸桿菌儲存中心獲得(大腸桿菌株AB2829，CGSC#2829，ID#8215)，該菌株的aroA基因從其染色體上被去除。此菌株被制成hsdR-，并命名為ER2799。由于ER2799缺失合成芳香族氨基酸所必需的aroA基因，因此它不能在M9限制培養(yǎng)基上生長。這個菌株用于檢測各種aroA基因構建物，以觀察新的aroA基因是否能夠挽救細菌并使之在存在或不存在草甘磷的情況下，在限制性培養(yǎng)基上生長。3.通過轉座子為基礎的連接子掃描發(fā)現(xiàn)斷開aroA靶基因的位點進行這個實驗的第一步是確定在5-烯醇丙酮酸基-3-phosphoshikimate合成酶(EPSPS)蛋白中的位點，使得intein可以整體插入。整體是指完整的intein插入到完整的EPSPS蛋白中。但是，不知道EPSPS蛋白本身的哪一部分可接受額外的氨基酸殘基。因此，為了確定EPSPS蛋白何處能夠接受氨基酸插入，一項新的技術，GPS-LS試劑盒(可從New England Biolabs，Inc.，Beverly，MA購得)被用來在整個EPSPS蛋白序列中隨機地插入5個氨基酸殘基。用隨機插入了5個氨基酸的EPSPS基因構建一個表達質粒文庫。該文庫轉化進大腸桿菌株ER2799中，并應用于含有M9限制培養(yǎng)基的平板中。ER2799缺乏aroA基因，將不能在M9限制培養(yǎng)基上生長，除非通過質粒轉化提供了一個活性的EPSPS基因。在用文庫轉化后生長的ER2799大腸桿菌應該含有一個EPSPS蛋白，后者在插入5個氨基酸的情況下保持活性。經(jīng)過測序以確定5個氨基酸的插入部位，在EPSPS蛋白中發(fā)現(xiàn)了42個使ER2799在M9限制培養(yǎng)平板上生長的獨特位點(圖15)。此外，發(fā)現(xiàn)另外19個獨特位點不能接受5個氨基酸的插入(圖16)。4.轉位反應加入6μl 20ng/μl的pEPS#8(靶DNA)，1.5μl 20ng/μl的PmeI供體DNA，3μl蒸餾水，3μl 10×GPS-LS緩沖液和1.5μl Tn*ABC，在37℃混合15分鐘進行反應。加入1μl起始溶液，反應在37℃孵育1小時20分鐘。通過在75℃熱滅活15分鐘終止反應。在反應混合物冷卻至室溫并水透析2小時后，反應混合物通過電穿孔轉化進新鮮制備的ER2685(fhuA2 glnV44 e14-rfbD1？relA1？endA1 spoT1？thi-1Δ(mcrC-mrr)114∷IS10Δ(lacI-lacA)200 F’proA+B+lacIq D1(lacZ)M15 zzfTn10(TetR))細胞中。細胞在37℃孵育1小時，然后接種在含有氨芐青霉素和卡那霉素的LB平板上。細胞繼續(xù)在37℃過夜生長。發(fā)現(xiàn)在轉化后10μl反應混合物獲得超過10,000個菌落(足以包括所有可能的轉座子插入位點，在pEPS#8中有2840個位點，3.3倍)。5.分離含有EPSPS基因加轉座子的DNA片段(3.0kb)用LB培養(yǎng)基回收從轉位反應中得到的所有轉化體，66％的細胞加入20％甘油保存在-70℃。其余細胞在500ml含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB液體培養(yǎng)基中，37℃過夜生長。通過離心收獲細胞，用Qiagen Midi試劑盒(Qiagen，Studio City，CA)純化質粒DNA(共508μg)。通過用PstI、NcoI和AhdI消化DNA(58μg)釋放出3.0kb的aroA基因-轉座子DNA片段，并在乙醇沉淀后用瓊脂糖通過凝膠純化進行分離(回收4μg DNA)。6.將aroA基因-轉座子3.0kb片段克隆進pCYB3載體凝膠純化的3.0kb aroA基因-轉座子DNA片段連接進pCYB3(5.2kb)的NcoI至PstI位點中，在微量透析2小時后通過電穿孔轉化進ER2685。電穿孔的細胞在LB培養(yǎng)基中孵育1小時。250μl上述細胞懸液接種于含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上，另外5.5ml則接種于1升含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB液體培養(yǎng)基中，37℃過夜生長。在aroA基因內(nèi)含有轉座子的質粒DNA文庫用Qiagen(Studio City，CA)Midi試劑盒(750μg)分離。7.篩選具有5個氨基酸連接子的活性文庫EPSPS蛋白105μg的文庫DNA用PmeI消化以從aroA基因中去除轉座子。這樣在轉座子差入位點處遺留了15個堿基(或5個氨基酸殘基)。回收一個7kb片段(在400μl EB的終容積中)，自身連接(在100μl rxn中從400μl 7kb片段中得到86μl)，轉化(100μlrxn中的30μl)進大腸桿菌株ER2799，并接種于LB及M9限制培養(yǎng)平板上，兩個平板中均含有100μg/ml氨芐青霉素和0.3mM IPTG。在37℃孵育過夜后，與LB平板相比，在M9限制平板上大約20％的初始細胞存活。在M9限制培養(yǎng)平板上生長的獨立菌落通過DraI消化和DNA測序進行分析，以確定連接子在aroA基因中插入位點的位置。
在72個有活性的獨立集落中識別了42個不同的插入位點，它們可以接受5個氨基酸殘基插入aroA基因中，不能在M9限制培養(yǎng)基選擇平板上生長的39個無活性集落中識別出19個不同的插入位點(見圖15和圖16)。質粒pCE-5-22、pCE-5-21、pCE-5-35和pCE-5-23是有活性的集落，它們分別在182、215、235和267位置處有5個氨基酸殘基摻入進EPSPS蛋白(aroA基因產(chǎn)物)中。這4個位點被選作進一步研究。
Ssp DnaE順式和反式剪接載體的構建1.用于順式剪接的載體pCE182DnaE、pCE215DnaE、pCE235DnaE和pCE267DnaE的建立這涉及將intein插入靶蛋白內(nèi)的位點，后者被發(fā)現(xiàn)能夠接受5個氨基酸的插入。
4個位點被選擇用于進一步研究(位點182、215、235和267)。全長Ssp DnaEintein被插進這些位點，EPSPS-intein的融合以其能夠使ER2799細胞在M9限制平板上生長而被檢測。所有4個位點被發(fā)現(xiàn)在M9平板上生長，表明EPSPS蛋白能夠接受intein插入這些位點(見圖11和圖14)。
CE182或CE215，除在182或215位點被去除了5個氨基酸連接子以外，是pCE-5-22或pCE-5-21的線性DNA，通過聚合酶鏈式反應從模板pCE-5-22或pCE-5-21產(chǎn)生，采用的引物CE182為5’-GCCCCTAAAGACACAATTATTCGCG-3’(SEQ ID NO28)和5’-CAGCGGCGCCGTCATCAGCAGAGCG-3’(SEQ ID NO29)，或CE215為5’-GCGAACCACCACTACCAACAATTTG-3’(SEQ ID NO30)和5’-TATCTCCACGCCAAAGGTTTTCATT-3’(SEQ ID NO31)。含有兩個天然N-extein殘基和三個天然C-extein殘基的Ssp DnaE intein基因通過PCR采用引物5’-GAATATTGCCTGTCTTTTGGT-3’(SEQ ID NO32)和5’-GTTAAAGCAGTTAGCAGCGAT-3’(SEQ ID NO33)從pMEB8(Evans等，J.Biol.Chem.，2759091(2000))擴增。得到的PCR片段用T4多聚核苷激酶磷酸化，通過QIAquick柱(Qiagen，Inc.，Studio City，CA)純化，并分別連接進CE182或CE215中以產(chǎn)生pCE182DnaE或pCE215DnaE。
含有4個天然N-extein殘基和三個天然C-extein殘基的Ssp DnaE intein基因通過PCR采用引物5’-TGCTGAATATTGCCTGTCTTTTGG-3’(SEQ ID NO34)和5’-CCGTTAAAGCAG TTAGCAGCGATAGC-3’(SEQ ID NO35)從pMEB8擴增。得到的PCR片段通過QIAquick柱(Qiagen，Inc.，Studio City，CA)純化，并分別連接進凝膠純化的、PmeI切割的pCE-5-35或pCE-5-23載體DNA中以產(chǎn)生pCE235DnaE或pCE267DnaE。2.用于反式剪接的載體p215EN2/pEPS#28和p235EN2/pEPS#29的建立用相容的復制來源構建了兩個質粒。合適EPSPS蛋白的N-末端與N-末端SspDnaE剪接區(qū)(INn)的N-末端融合，并插入一個質粒中。剩余的合適EPSPS蛋白C-末端部分與Ssp DnaE intein C-末端剪接區(qū)(INc)的C-末端融合，并插入第二個質粒中。質粒通過電穿孔共同轉染進ER2799內(nèi)。在IPTG誘導性pTac啟動子的控制下表達融合蛋白。轉化的細胞在M9限制性平板、液體M9限制性培養(yǎng)基或添加了草甘磷的液體M9限制性培養(yǎng)基中生長(圖11、12、13和14)。這表明當在同一個細胞中共同表達時，蛋白的兩半可以產(chǎn)生一個活性的EPSPS蛋白。
PMEB4的0.6kb XhoI至PstI片段被采用QIAquick提取試劑盒凝膠純化，并連接進pCYB3(New England Biolabs，Inc.，Beverly，MA)載體的XhoI至PstI位點內(nèi)以產(chǎn)生pCEN1。在Ssp DnaE intein和殼多糖結合區(qū)(CBD)之間的NcoI位點，經(jīng)過pCEN2的PacI和SapI消化而被去除，隨后經(jīng)過T4 DNA聚合酶處理和自身連接，產(chǎn)生質粒pCEN2。在pTac啟動子的控制下，這個載體含有Ssp DnaE intein(INn)N-末端的123個氨基酸殘基，并具有氨芐青霉素抗性。
通過將pCE215DnaE或pCE235DnaE的NcoI至KpnI片段連接進pCEN2的相同位點構建p215EN2或p235EN2。P215EN2或p235EN2具有與INn融合的EPSPS的N-末端(p215EN2為1-215殘基，p235為1-235殘基)。
PCYB3的NcoI至FspI片段被連接進pKEB1的NcoI至DraI位點以產(chǎn)生pKEB12(NEB #1282)。在大腸桿菌株ER2566中轉化的質粒pKEB12樣品在2000年5月23日根據(jù)布達佩斯條約的條款和條件，在美國典型培養(yǎng)物保藏中心保藏，并收到ATCC保藏號PTA-1898。這個載體含有與CBD融合的Ssp DnaE intein(INn)C-末端的36個氨基酸殘基，并具有卡那霉素抗性。
通過將pCE215DnaE和pCE235DnaE的Bg/II至PstI片段連接進pKEB12的相同位點構建pEPS#28或pEPS#29。pEPS#28或pEPS#29具有EPSPS的C-末端(pEPS#28為216-427殘基，pEPS#29為236-427殘基)，取代了pKEB12中的CBD并附著于INc的C-末端。3.EPSPS互補構建物pEPS#34和pEPS#36的建立當缺乏intein區(qū)的EPSPS蛋白片段在ER2799細胞中共表達時，細胞不能在M9限制平板、液體M9限制培養(yǎng)基、或添加了草甘磷的液體M9限制性培養(yǎng)基中生長(圖12和圖13)。這表明EPSPS的活性絕對依賴于intein兩部分的存在。
編碼EPSPS蛋白N-末端1-235殘基(EPS235N)的DNA采用引物5’-GGATCCTAAGAAGGAGATATACCCATGGAATCCCTGACGTTACA-3’(SEQID NO36)和5’-GATATCCTGCAGTTAACCTGGAGAGTGATACTGTTGACC-3’(SEQ ID NO37)從pCE235DnaE通過PCR擴增。得到的PCR產(chǎn)物采用QIAquickPCR試劑盒純化，用NcoI和PstI消化，采用QIAquick提取試劑盒從瓊脂糖凝膠中純化，并連接進質粒pCYB3的NcoI至PstI位點中，以產(chǎn)生pEPS#34。質粒pEPS#36是采用引物5’-GATATCCCATGGGACGCTATCTGGTCGAGGGCGATG-3’(SEQ ID NO38)和5’-GTCGACGCTCTCCTGCAGTTAGGCAGGCGTACTCATTC-3’(SEQ ID NO39)，通過PCR從pC+E2擴增編碼EPSPS C-末端236-427個殘基(EPS235C)的DNA建立的。得到的PCR產(chǎn)物采用QIAquick PCR試劑盒純化，用NcoI和PstI消化，從瓊脂糖凝膠中純化，并連接進質粒pKEB12的NcoI至PstI位點中。為了克隆的NcoI位點，兩個額外的殘基Met-Gly也在EPS235C的N-末端摻入。4.在位點235處含有順式或反式“無活性”Ssp DnaE intein的載體(pEPS#31，peps#33，peps#37)的建立有趣地是，反式剪接并不是活性所必須的，因為如果Ssp DnaE intein最高度保守的催化殘基中的三個改變?yōu)楸彼?，共轉化的ER2799細胞仍然生長。這個事實表明intein可以作為親和區(qū)將兩個EPSPS intein片段帶到一起(圖12和圖13)。
含有4個天然N-extein殘基和3個天然C-extein殘基的Ssp DnaE intein基因采用引物5’-TGCTGAATATGCGCTGTCTTTTGGTACCGAA-3’(SEQ ID NO40)和5’-CCGTTAAACGCCGCAGCAGCGATAGCGCC-3’(SEQ ID NO41)通過PCR從pMEB8擴增。得到的PCR產(chǎn)物被QIAquick柱(Qiagen Inc.，Studio City，CA)純化，并連接進質粒pCE-5-35的PmeI位點中，以產(chǎn)生pEPS#31。這個Ssp DnaE intein在催化殘基內(nèi)含有3個突變，Cys1 Ala/Cys+1 Ala/Asn159 Ala，消除了其剪接活性。5.檢測EPSPS活性的方法EPSPS活性的平板檢測法。功能性EPSPS蛋白的存在可以用大腸桿菌株ER2799在體內(nèi)確定，該菌株缺乏內(nèi)源性活性EPSPS(見上)。ER2799細胞本身不能在M9限制性平板(添加了0.3mM的IPTG)上生長。在后面的描述中，當提及M9限制性平板時，它們也含有0.3mM IPTG。質粒pC+E2，含具有C301至T突變的全長野生型EPSPS基因，當通過轉化導入時，能夠使ER2799在M9限制性平板上生長。
檢測Ssp DnaE順式剪接構建物。質粒pCE182DnaE、pCE215DnaE、pCE235DnaE、pCE267DnaE(每個0.05μg)通過電穿孔轉化進大腸桿菌ER2799細胞中(Sambrook等，分子克隆實驗室手冊，第二版，Cold Spring Harbor Laboratory，NYCold Spring Harbor Laboratory Press(1989))，見圖11。0.8ml LB培養(yǎng)基加至轉化的細胞中，并在37℃振蕩孵育1小時。200μl此溶液接種在添加了0.1mg/ml氨芐青霉素的LB或M9限制平板上(Sambrook等，分子克隆實驗室手冊，第二版，Cold Spring Harbor Laboratory，NYCold Spring Harbor Laboratory Press(1989))。平板在不同的時間長度和不同的溫度下孵育。最常用的是在37℃過夜。
檢測Ssp DnaE反式剪接構建物。每個EPSPS反式構建物活性的檢測，是通過共轉化待測的構建物進入ER2799，并接種于含有0.3mM IPTG的M9限制平板或LB平板，兩者均添加了0.1mg/ml的氨芐青霉素和0.05mg/ml的卡那霉素。在只有一個質粒含有EPSPS基因或一部分EPSPS基因的情況下，補充的抗生素抗性是通過用不含EPSPS基因的pCYB3或pKYB1(新英格蘭生物實驗室New EnglandBiolabs，Beverly，MA)共同轉化大腸桿菌提供的。
采用的質粒是pC+E2、p215EN2、p235EN2、pEPS#28、pEPS#29、pEPS#33、pEPS#37、pEPS#34和pEPS#36。這些質粒采用0.1μg合適的質粒、以各種聯(lián)合方式被共轉化進ER2799大腸桿菌細胞中(Sambrook等，分子克隆實驗室手冊，第二版，Cold Spring Harbor Laboratory，NYCold Spring Harbor LaboratoryPress(1989))，并接種于LB平板及M9限制培養(yǎng)基平板上，兩者均含有100μg/ml氨芐青霉素和50μg/ml卡那霉素。M9限制平板還含有0.3mM IPTG。在37℃孵育過夜或室溫下2-3天后，從每個LB平板中挑出單一集落，并在M9限制培養(yǎng)選擇平板上劃痕。所采用的聯(lián)合是WT，pC+E2和pKYB1(新英格蘭生物實驗室NewEngland Biolabs，Beverly，MA)；215NC，p215EN2和pEPS#28；215C，pEPS#28和pCYB3 235NC-死的，pEPS#33和pEPS#37；235NC，p235EN2和pEPS#29；235N，p235EN2和pKYB1；235C，pEPS#29和pCYB3；235N-215C，p235EN2和pEPS#28；和235互補物，pEPS#34和pEPS#36(見圖12)。
在存在和缺乏草甘磷的條件下，在液體培養(yǎng)中測定ER2799的生長。235反式構建物草甘磷抗性的檢測采用下列質粒組合進行WT，pC+E2和pKYB1；215NC-死的，pEPS#33和pEPS#37；235NC，p235EN2和pEPS#29；235N，p235EN2和pKYB1；235C，pEPS#29和pCYB3和235互補物，pEPS#34和pEPS#36。這些質粒如上所述共轉化進ER2799大腸桿菌細胞中，并接種在含100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。作為對照，pCYB3/pKYB被共轉化進大腸桿菌株ER2744中，并接種在含100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。每次轉化均進行預培養(yǎng)，將新鮮菌落接種于添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB培養(yǎng)基中，30℃過夜。在缺乏或存在不同量草甘磷的條件下，等量的預培養(yǎng)物(10-11μl，根據(jù)細胞密度)被接種進新鮮制備的含有100μg/ml氨芐青霉素、50μg/ml卡那霉素和0.3mM IPTG的M9限制培養(yǎng)基中。每個構建物的生長用600nm處的OD值測定，見圖13。
順式235構建物在M9液體限制培養(yǎng)基中的生長。兩個質粒載體，一個具有能剪接的Ssp DnaE intein(235順式)，另一個具有不能剪接的intein(235無活性)，分別為pCE235DnaE和pEPS#31，被轉化進不同的ER2799大腸桿菌細胞中，并接種在添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。每次轉化均進行預培養(yǎng)，將新鮮菌落接種于添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB培養(yǎng)基中，30℃過夜。等量的預培養(yǎng)物(10-11μl，根據(jù)細胞密度)被接種進新鮮制備的含有100μg/ml氨芐青霉素、50μg/ml卡那霉素和0.3mM IPTG的M9限制培養(yǎng)基中。在不同時間用600nm處的OD值確定細胞的密度(見圖14)。
pEPS#31的NcoI至KpnI片段被連接進質粒pCEN2的相同位點，以產(chǎn)生pEPS#33。質粒pEPS#37通過將pEPS#31的Bg/II至PstI片段克隆進質粒pKEB12中的相同位點而建立。實施例IV兩種不相關基因產(chǎn)物氨基糖苷-3-乙酰基轉移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP)的反式剪接，以在大腸桿菌內(nèi)產(chǎn)生一個功能性雜交蛋白氨基糖苷-3-乙?；D移酶基因與Ssp DnaE intein N-片斷(INn)融合。Ssp DnaEintein的C-末端(INc)與smGFP基因融合。融合蛋白可以從各自的構建物中翻譯成為獨立的多肽。這些融合蛋白的編碼DNA序列被克隆進pIH976(圖17)或pAGR3(圖18)質粒中。兩種質粒(pIHaadE-N(pIH976含有aadA和INc末端)和pAGRE-CsmGFP(pAGR3含有INc和smGFP))被共轉化進大腸桿菌(圖19A)。轉化的大腸桿菌具有壯觀霉素/硫酸鏈霉素抗性(圖19B)。細胞提取物在生長16小時后制備。提取物中的蛋白在SDS tris甘氨酸凝膠上分離，并點樣于PVDF膜上。此膜用抗GFP單克隆抗體探測。反式剪接在兩種質粒都被導入的大腸桿菌提取物中觀察到。作為反式剪接的結果，融合產(chǎn)物具有與計算的兩種蛋白的累計質量相同的分子量(圖19C)。
下面的方案描述了基因盒的產(chǎn)生，pIHaadE-N(與編碼INn的DNA融合的氨基糖苷-3-乙?；D移酶基因)，pAGRE-CsmGFP(編碼INc的DNA與smGFP基因融合)，Western斑點雜交和檢測。
聚合酶鏈式反應被用來將開放的閱讀結構(ORFs)克隆成所期望的質粒。反應在有2單位VentDNA聚合酶的50μl總體積中含有添加了2mM硫酸鎂的VentDNA聚合酶緩沖液、200μM dNTPs、每個引物各1μM和100ng質粒DNA。采用Perkin-Elmer gene amp PCR 2400系統(tǒng)(Emeryville，CA)進行10到20個周期的擴增。下面的引物用于aadA基因的擴增(aadA正向引物GCCTTAATTAACCATGAGGGAAGCGGTGATCGCCG(SEQ ID NO47)，aadA反向引物TGCGGTCGACTTTGCCGACTACCTTGGTGATCTC(SEQ ID NO48)。PCR產(chǎn)物用Qiagen(Valencia，CA)的PCR純化試劑盒(QIAquick PCR pruification)純化。純化的PCR產(chǎn)物用PacI和SalI限制性酶消化，并克隆進pNEB193(New EnglandBiolabs，Inc.，Beverly，MA)質粒中。含有aadA基因的克隆被命名為pNEBaad3。相似的步驟，采用特異引物(smGFP正向引物CCCAAGCTTGGCGCCATGAGTAAAGGAGAAGAACTTTTCAC(SEQ ID NO49)和smGFP反向引物GCGACCGGTTTATTTGTATAGTTCATCCATGCCATG(SEQ ID NO50)用于smGFP基因的擴增，并克隆進pLITMUS28(New England Biolabs，Inc.，Beverly，MA)。含有smGFP基因的克隆被命名為psmGFP7。aadA和smGFP基因的序列都通過DNA測序證實。
來自集胞藻屬PCC6803 dnaE基因的intein被PCR擴增。Intein的氨基末端部分(氨基酸1-123)被稱為INn，羧基末端被稱為INc(氨基酸124-159)。INn和INc片段被分別克隆進pLITMUS28和pNEB193中。擴增INn和INc的引物對如下(INn正向引物AGGGAATTCGTCGACAAATTTGCTGA ATATTGCCTGTCT(SEQ IDNO51)，INn反向引物GGCCTCGAGTTATTTAATTGTCCCAGCGTCAAGTAATG(SEQ ID NO52)，INc正向引物AGCTTTGTTTAAACCATGGTTAAAGTTATCGGTCGTAGATC(SEQ ID NO53)，INc反向引物CAGCGTCGACGGCGCCGTGGGATTTGTTAAAGCAGTTAGCAGC(SEQ IDNO54)。含有INn和INc片段的質粒分別是pLitDnaE-N1和pNEBDnaE-C2。
Intein片段和aadA或smGFP基因產(chǎn)物的融合構建物以下述方法制備來自pNEBaad3的BamHI和SalI片段(800bp)被連接進BamHI-SalI消化的pLitDnaE-N1，以產(chǎn)生pAEN1。以相似的方式，150bp的插入物(用PstI和KasI消化的pNEBIN-c)被連接進PstI和KasI消化的pLitSmGFP5，以產(chǎn)生pGFPEC。質粒pAEN含有在結構上有INn的aadA基因，pGFPEC含有在結構上有INc的smGFP基因。
融合基因被PCR擴增，并克隆進大腸桿菌表達載體中。pAEN和pGFPEC的插入物被克隆進pIH976(NcoI和SacI位點)和pAGR3(EcoRI和SacII位點)載體中。引物如下(aadA-INn的正向引物CATGCCATGGGGGAAGCGGTGATCGCCGAAG(SEQ ID NO55)，aadA-INn的反向引物ACGCGAGCTCTTATTTAATTGTCCCAGCGTCAAGTAATG(SEQ IDNO56)，INc-smGFP的正向引物CGAATTCTATGGTTAAAGTTATCGGTCGTAGATC(SEQ ID NO57)，INc-smGFP的反向引物AGCCCGCGGTTATTTGTATAGTTCATCCATGCCATG(SEQ ID NO58))。在宿主Ptac啟動子的控制下，大腸桿菌表達質粒是pIH976-aadE-N和pAGR-Nc-smGFP。兩種質粒各自或一起被轉化進大腸桿菌ER1992(New England Biolabs，Inc.，Beverly，MA)中，并接種于LB瓊脂-氨芐青霉素平板以及LB瓊脂氨芐青霉素和壯觀霉素平板上。
為了進行western斑點雜交，大腸桿菌細胞提取物與含1mM DTT的SDS上樣染料混合，在95℃煮沸5分鐘，并裝載在10％-20％的Tris-甘氨酸-SDS梯度凝膠上。蛋白在Immobilin-P膜上形成斑點，并用抗GFP單克隆抗體(Roche MolecularBiochemicals，Indianapolis，IN)探測，然后進行GFP和aadA-GFP融合蛋白的化學發(fā)光檢測。實施例V為反式剪接兩種不相關的基因產(chǎn)物，氨基糖苷-3-乙?；D移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP)，了在大腸桿菌中應用植物啟動子以產(chǎn)生一個功能性雜交蛋白上述DNA片段在葉綠體特異啟動子PpsbA(SEQ ID NO59)的下游被克隆。相同基因的終止序列(TpsbA(SEQ ID NO60)置于被克隆基因的下游。兩個基因以相反的方向表達以避免讀穿。植物啟動子在轉化進大腸桿菌時是有功能性的，反式剪接的產(chǎn)物(aadA-smGFP融合蛋白，57kDa)采用抗GFP抗體在Western斑點實驗中被觀察到。因此葉綠體特異啟動子在大腸桿菌中是功能性的，能夠用作基因表達研究。
下面的方案描述了一個大腸桿菌/植物穿梭載體(pNCT114/pNCT224)的產(chǎn)生，它能夠在體內(nèi)進行相似的轉基因再結合。
一個穿梭載體包括可使其在大腸桿菌和植物細胞中都具有功能的元件。質粒pLITMUS28(New England Biolabs，Inc.，Beverly，MA)是pNCT114和pNCT224基因靶向載體的主鏈。載體DNA至少包括(1)兩個與質體基因組同源的DNA序列(也指靶序列/片段)，(2)一個或多個啟動子元件，(3)轉錄終止元件，和(4)一個或多個選擇性/藥物抗性(非致命性的)的標記基因。
啟動子元件(PpsbA)DNA序列用PCR從基因組DNA中擴增，該基因組是按Murray和Thompson(核酸研究Nucleic Acids Res.，164321-4325(1980))所述，采用CTAB方法從7天的老煙苗中提取的。擴增使用的引物如下(PpsbA正向引物AACTGCAGGAATAGATCTACATAC ACCTTGG(SEQ ID NO64)，PpsbA反向引物CCGCTCGAGCTTAATTAAGGTAAAATCTT GGTTTATTTAATC(SEQ ID NO65))。同樣，終止子序列(TpsbA)通過PCR擴增并克隆。用于擴增的引物如下(TpsbA正向引物GCGACCGGTGATCCTGGCCTAGTCTATAGGAGG(SEQ ID NO66)，TpsbA反向引物AGGCCTAGGAGAATACTCAATCATGAATAAATGC(SEQ ID NO67)。具有psbA啟動子和終止子DNA序列的載體使基因可以被克隆進這些引物之間以表達蛋白。靶向DNA序列被擴增并以側向的方式插入啟動子和終止子外(圖20)，因而在預先確定的位置促使轉基因的同源性再結合。pNCT114含有16SrDNA-trnaV和rps7/12靶向序列(SEQ ID NO61)，而pNCT224則含有orf228-ssb作為左側邊界，orf1244作為右側邊界(SEQ ID NO62)。下列引物用于靶向序列的PCR擴增。
pNCT114的引物左邊界正向引物TTGGCGCGCTTGACGATATAGCAATTTTGCTTGG(SEQ ID NO68)左邊界反向引物TTGCGTACGATTTATCTCAGATTAGATGGTCTAG(SEQ ID NO69)右邊界正向引物TTGCCTAGGCGTATTGATAATGCCGTCTTAACCAG(SEQ ID NO70)右邊界反向引物AGGGGTACCGAATTCAAGATTCTAGAGTCTAGAG(SEQ ID NO71)pNCT224的引物左邊界正向引物TTGGCGCGCAATTCACCGCCGTATGGCTGACCGG(SEQ ID NO72)左邊界反向引物TTGCGTACGCCTTTGACTTAGGATTAGTCAGTTC(SEQ ID NO73)右邊界正向引物TTGCCTAGGGTCGAGAAACTCAACGCCACTATTC(SEQ ID NO74)右邊界反向引物AGGGGTACCATCACGATCTTATATATAAGAAGAAC(SEQ ID NO75)pNCT114/224的詳細圖式見圖20A。兩個質粒都含有兩個啟動子和兩個終止子DNA片段。為了定向克隆，摻入了獨特的限制性酶切位點。質粒pNCT114和pNCT224具有獨特的限制性酶切位點(PmeI-AgeI和PacI-XhoI位點)。來自pAEN質粒(aadA基因在結構上具有INn)的插入物通過用PacI-XhoI消化獲得，通過用PmeI-AgeI消化獲得pGFPEC(smGFP在結構上具有INc)的插入物，隨后連接進pNCT114或pNCT224。質粒被命名為p115ag和p225ag(圖21A)。質粒被轉化進大腸桿菌并用氨芐青霉素和壯觀霉素篩選(圖21B)。從過夜的培養(yǎng)物中制備細胞提取物，在10-20％Tris-甘氨酸-SDS梯度凝膠中分離。蛋白點樣在Immobilin-P膜上，并用抗GFP單克隆抗體(Roche Molecular Biochemicals，Indianapolis，IN)探測，然后進行GFP和aadA-GFP融合蛋白的化學發(fā)光檢測。實施例VI從整合進分子DNA的DNA盒中表達的EPSPS和ALS基因產(chǎn)物在植物細胞漿中的順式剪接將DNA導入植物細胞核可用多種不同的方法實現(xiàn)，如，電穿孔、聚乙二醇介導、土壤桿菌介導、微注射和biolistic轉化。依照本發(fā)明，應該確定是否植物細胞漿將以順式或反式介導蛋白質的剪接。這在植物中對于進一步的反式剪接技術是必備條件。如果靶蛋白為獲得活性需要特異的細胞漿修飾，這種技術就有用處了。上述每一項技術都可用于將EPSPS和/或ALS基因盒導入煙草或其他合適的植物組織或細胞中。一般的基因盒包括(1)藥物選擇/退化標記基因，如卡那霉素或其他任何合適的選擇標記物；(2)一個強啟動子元件如35sCMV(花椰菜花葉病毒)；和(3)土壤桿菌的右和左邊界T DNA重復區(qū)。這樣的基因盒可通過biolistic過程或土壤桿菌介導的基因轉移導入植物中(Horsch等，Nature 2271229-1231(1985))。該基因盒以pBI121基因轉移載體(Jefferson等，EMBO J.，63901-3907(1987))為基礎。最終基因盒的設計圖示于圖22中。
在biolistic過程中，待轉化的DNA被包被在精細金微粒的表面，通過一個粒子加速槍(PDS 1000/He gun，Biorad，Richmond，CA)導入植物細胞內(nèi)。對于土壤桿菌介導的基因轉移，待轉化的DNA盒被導入細菌中。載有基因盒的土壤桿菌與一個圓盤或來自煙草或其他合適植物葉子的組織切片接觸。這加速了DNA基因盒向植物細胞核的轉移。在上述的任何方法中，DNA最終整合進植物細胞核中。假設的轉化細胞被用作標記基因(藥物)選擇。在選擇藥物存在的情況下再生的植物是強有力的轉基因侯選物。在植物成熟后，制備細胞提取物，與含1mM DTT的SDS上樣染料混合，在95℃煮沸5分鐘，并裝載于10-20％的Tris-甘氨酸-SDS梯度凝膠上。分離的蛋白點樣在Immobilin-P膜上，并用抗ALS或抗EPSPS抗體探測。然后可進行PCR以確定基因是否以預期的方式被整合而沒有發(fā)生重排。
這種技術對于需要在細胞漿環(huán)境中進行特異修飾以獲得活性/重疊的蛋白是有用的。一部分具有必要的轉運信號和剪接元件的靶蛋白基因將被置于一個細胞器中，以便以前體多肽的方式進行細胞漿轉運。
使這些植物在溫室中生長至其成熟，并收集種子。然后將收集的種子發(fā)芽，F(xiàn)1代植物檢測除草劑抗性?？蛇M行一個小規(guī)模的試驗看是否導入的轉基因的分離模式遵循孟德爾的遺傳模式。整合進核DNA將產(chǎn)生孟德爾遺傳，而整合進葉綠體DNA將產(chǎn)生非孟德爾母系遺傳。實施例VII斷裂基因，如EPSPS/ALS或兩種不相關的基因產(chǎn)物，如氨基糖苷-3-乙?；D移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP)，的反式剪接，以在植物葉綠體中產(chǎn)生一個功能性雜交蛋白這些實驗的目的是調(diào)查是否反式剪接在植物葉綠體中是可行的。就轉錄和翻譯的機制來說，植物葉綠體與細菌是相似的。在實施例IV-VI中，我們使用了從集胞藻屬PCC6803的dnaE基因中獲得的天然intein，集胞藻屬PCC6803是一種藻青菌。藻青菌是光合細菌，與植物的葉綠體相似。因此intein應該有可能在植物葉綠體中剪接或反式剪接。這些計劃的實驗分為兩個部分第一部分，證明兩個不相關基因產(chǎn)物aadA和smGFP在植物葉綠體中的反式剪接，該兩種基因均被整合進葉綠體基因組中；和第二部分，在葉綠體中的反式剪接，其中smGFP基因盒被整合進核基因組中，含有轉運肽(核酮糖-1，5-二磷酸羥化酶3A-INc-smGFP)的翻譯蛋白被運輸進葉綠體中，以使反應進行。葉綠體將含有與INn片段融合的aadA基因。詳細步驟在下面敘述。
證明葉綠體中經(jīng)過轉錄和翻譯，兩種不相關基因產(chǎn)物，氨基糖苷-3-乙酰基轉移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP)，的反式剪接如實施例V，質粒被命名為p115ag和p225ag。這些質粒將采用biolistic裝置輸送到植物細胞器中。煙草或其他任何合適的植物組織將以無菌的方式從溫室生長的植物或組織培養(yǎng)的植物細胞中獲得。植物組織將在植物生長培養(yǎng)基和山梨醇或其他任何合適的滲壓劑中平衡過夜。植物細胞將用上述包被在金微粒上的質粒轟擊。經(jīng)過合適的恢復時間后，細胞將被置于含植物生長素和500μg/ml硫酸壯觀霉素的植物生長培養(yǎng)基中。壯觀霉素抗性的胼胝組織將被獲取，并置于新芽分化培養(yǎng)基中。當新芽大約2厘米長時，將被切下并置入根莖培養(yǎng)基。轉基因植物或植物的一部分將通過手持紫外線燈(正常(非轉基因)植物將在紫外線下發(fā)出紅色熒光，而轉基因植物呈現(xiàn)綠色熒光)進行鑒別。轉基因整合和拷貝的數(shù)目將通過Southern斑點雜交分析和PCR證實。轉基因部分將采用抗GFP抗體檢測aadA和smGFP的反式剪接。這些部分可進一步用來產(chǎn)生純的反式-plastomic系。F1代植物將檢測壯觀霉素抗性。
葉綠體中的反式剪接。SmGFP基因盒整合進核基因組，含有核酮糖-1，5-二磷酸羥化酶3A-INc-smGFP轉運肽的翻譯蛋白，被輸入至葉綠體中以使反應繼續(xù)進行。
這種方法將使任何斷裂蛋白(如EPSPS或ALS)，以與INn或INc融合蛋白的方式，在葉綠體或核中表達。核編碼的成分將與一個葉綠體轉運肽融合，以加速其翻譯后在細胞漿中移行進入葉綠體。aadA和GFP的詳細方法見下?？梢詫θ魏纹渌牡鞍?斷裂基因采用類似的方法。
這種方法將需要一個載有一個藥物選擇標記和目的靶基因的核轉化載體，如pBI121。我們實驗的基因將是一個具有三部分的融合蛋白，含有核酮糖-1，5-二磷酸羥化酶和后接的INc及smGFP(其他蛋白/肽，如EPSPS或ALS的一半可以代替smGFP)。轉運肽是為煙草優(yōu)化的密碼子(圖26)。這個融合基因將在一個強力的植物啟動子，35SCMV的控制下。這個基因盒的圖示見圖23。這個DNA將導入植物的核中。將選擇穩(wěn)定的轉基因系和對F1后代檢測轉基因整合。
上述轉基因植物的葉部分將用作葉綠體DNA轉化。葉綠體基因靶向載體是以含有壯觀霉素抗性基因和驅動轉基因的PpsbA啟動子的p114和p224為基礎的。轉基因可以是蛋白的其他一半(以前被導入核基因組)以及必須的剪接元件。作為一個模型系統(tǒng)，我們將采用aadA-INn融合基因進行葉綠體轉化。Transplastomic系將采用兩種藥物(例如，葉綠體特異的藥物壯觀霉素和核特異的藥物卡那霉素)進行選擇。PCR和Western斑點雜交分析將進一步建立純的植物系。
對于轉基因植物，F(xiàn)1代將檢測(1)轉基因/片段的孟德爾遺傳模式；(2)轉基因的穩(wěn)定性；和(3)可能的通過花粉的轉基因脫落。
ALS/EPSPS轉基因植物將被檢測對磺脲和Roundup的抗性。
應當理解，在此描述的實施例和實施方案僅作為說明的目的，因而對于本領域的技術人員來說，各種修飾或變化很明顯地可以進行，并包含在本申請的精神和范圍以及附加權利要求的范圍內(nèi)。
序列表<110>徐明群T·C·埃文斯S·普拉丹D·G·科姆H·保盧斯L·孫陳立新I·高希新英格蘭生物實驗室公司波士頓生物醫(yī)學研究所<120>產(chǎn)生能夠表達活性蛋白產(chǎn)物的斷裂、不可傳遞的基因的方法<130>NEB-163-PCT<140><141><150>60/135,677<151>1999-05-24<160>134<170>PatentIn Ver.2.0<210>1<211>19<212>DNA<213>大腸桿菌(Escherichia coli)<400>1ggacggggaa ctaactatg 19<210>2<211>20<212>DNA<213>大腸桿菌<400>2ccacgatgac gcaccacgcg 20<210>3<211>30<212>DNA<213>大腸桿菌<400>3ggagggggca tatgaatggc gcacagtggg 30<210>4<211>25<212>DNA<213>大腸桿菌<400>4ggggggtcat gataatttct ccaac25<210>5<211>28<212>DNA<213>大腸桿菌<400>5ccgggtggcg taattatgcc ggtttacg 28<210>6<211>28<212>DNA<213>大腸桿菌<400>6cgtaaaccgg cataattacg ccacccgg 28<210>7<211>14<212>PRT<213>集胞藻屬PCC6803(Synechocystis PCC6803)<400>7Leu Glu Lys Phe Ala Glu Tyr Cys Phe Asn Lys Ser Thr Gly1 5 10<210>8<211>21<212>PRT<213>大腸桿菌<400>8Cys Ala Gln Trp Val Val His Ala Leu Arg Ala Gln Gly Val Asn Thr1 5 10 15Val Phe Gly Tyr Gly20<210>9<211>20<212>PRT<213>大腸桿菌<400>9Cys Val Trp Pro Leu Val Pro Pro Gly Ala Ser Asn Ser Glu Met Leu1 5 10 15Glu Lys Leu Ser20<210>10<211>26<212>DNA<213>大腸桿菌<400>10gggggtcatg aatggcgcac agtggg 26<210>11<211>34<212>DNA<213>大腸桿菌<400>11gcgcgctcga gttgatttaa cggctgctgt aatg34<210>12<211>32<212>DNA<213>大腸桿菌<400>12gcgcgaccgg ttgtgactgg cagcaacact gc 32<210>13<211>31<212>DNA<213>大腸桿菌<400>13ggggggctgc agtcatgata atttctccaa c31<210>14<211>22<212>DNA<213>玉米(MAIZE)<400>14atcagtacac agtcctgcca tc 22<210>15<211>20<212>DNA<213>玉米<400>15gagacagccg ccgcaaccat 20<210>16<211>29<212>DNA<213>玉米<400>16gggcccatat ggccaccgcc gccgccgcg 29<210>17<211>29<212>DNA<213>玉米<400>17gggccctcga ggcttccttc aagaagagc 29<210>18<211>29<212>DNA<213>玉米<400>18gggccaccgg tacatcaaag aagagcttg 29<210>19<211>31<212>DNA<213>玉米<400>19ggggctgcat tcagtacaca gtcctgccat c31<210>20<211>7<212>PRT<213>集胞藻屬PCC6803<400>20Leu Glu Lys Phe Ala Glu Tyr1 5<210>21<211>7<212>PRT<213>集胞藻屬PCC6803<400>21Cys Phe Asn Lys Ser Thr Gly1 5<210>22<211>21<212>PRT<213>玉米<400>22Cys Lys Gly Ala Asp Ile Leu Val Glu Ser Leu Glu Arg Cys Gly Val1 5 10 15Arg Asp Val Phe Ala20<210>23<211>21<212>PRT<213>玉米<400>23Cys Ile Pro Ser Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp1 5 10 15Gly Arg Thr Val Tyr20<210>24<211>44<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>24ggatcctaag aaggagatat acccatggaa tccctgacgt taca 44<210>25<211>38<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>25gtcgacgctc tcctgcagtt aggcaggcgt actcattc38<210>26<211>38<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>26gctttgctcc tggcggcttt accttgtggt aaaaccgc 38<210>27<211>38<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>27gcggttttac cacaaggtaa agccgccagg agcaaagc 38<210>28<211>25<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>28gcccctaaag acacaattat tcgcg 25<210>29<211>25<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>29cagcggcgcc gtcatcagca gagcg 25<210>30<211>25<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>30gcgaaccacc actaccaaca atttg 25<210>31<211>25<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>31tatctccacg ccaaaggttt tcatt 25<210>32<211>21<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>32gaatattgcc tgtcttttgg t 21<210>33<211>21<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>33gttaaagcag ttagcagcga t 21<210>34<211>24<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>34tgctgaatat tgcctgtctt ttgg 24<210>35<211>26<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>35ccgttaaagc agttagcagc gatagc26<210>36<211>44<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>36ggatcctaag aaggagatat acccatggaa tccctgacgt taca 44<210>37<211>39<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>37gatatcctgc agttaacctg gagagtgata ctgttgacc 39<210>38<211>36<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>38gatatcccat gggacgctat ctggtcgagg gcgatg 36<210>39<211>38<212>DNA<213>人工序列<220><223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>39gtcgacgctc tcctgcagtt aggcaggcgt actcattc 38<210>40<211>31<212>DNA<213>人工序列<220><223>人工序列的描述從集胞藻屬PCC6803株合成的<400>40tgctgaatat gcgctgtctt ttggtaccga a 31<210>41<211>29<212>DNA<213>人工序列<220><223>人工序列的描述從集胞藻屬PCC6803株合成的<400>41ccgttaaacg ccgcagcagc gatagcgcc29<210>42<211>178<212>PRT<213>大腸桿菌<400>42Tyr Ala Val Asp Lys Ala Asp Leu Leu Leu Ala Leu Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile20 25 30Val His Val Asp Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro35 40 45His Val Ser Ile Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Met Asn50 55 60Ala Leu Leu Glu Gly Ser Thr Ser Lys Lys Ser Phe Asp Phe Gly Ser65 70 75 80Trp Asn Asp Glu Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr85 90 95Lys Thr Ser Asn Glu Glu Ile Gln Pro Gln Tyr Ala Ile Gln Val Leu100 105 110Asp Glu Leu Thr Lys Gly Glu Ala Ile Ile Gly Thr Gly Val Gly Gln115 120 125His Gln Met Trp Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln130 135 140Trp Leu Ser Ser Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala145 150 155 160Ala Ala Gly Ala Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile165 170 175Asp Gly<210>43<211>179<212>PRT<213>大腸桿菌<400>43Tyr Ala Val Asp Ser Ser Asp Leu Leu Leu Ala Phe Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Glu Ala Phe Ala Ser Arg Ala Lys20 25 30Ile Val His Ile Asp Ile Asp Ser Ala Glu Ile Gly Lys Asn Lys Gln35 40 45Pro His Val Ser Ile Cys Ala Asp Ile Lys Leu Ala Leu Gln Gly Leu
50 55 60Asn Ser Ile Leu Glu Ser Lys Glu Gly Lys Leu Lys Leu Asp Phe Ser65 70 75 80Ala Trp Arg Gln Glu Leu Thr Glu Gln Lys Val Lys His Pro Leu Asn85 90 95Phe Lys Thr Phe Gly Asp Ala Ile Pro Pro Gln Tyr Ala Ile Gln Val100 105 110Leu Asp Glu Leu Thr Asn Gly Asn Ala Ile Ile Ser Thr Gly Val Gly115 120 125Gln His Gln Met Trp Ala Ala Gln Tyr Tyr Lys Tyr Arg Lys Pro Arg130 135 140Gln Trp Leu Thr Ser Gly Gly Leu Gly Ala Met Gly Phe Gly Leu Pro145 150 155 160Ala Ala Ile Gly Ala Ala Val Gly Arg Pro Asp Glu Val Val Val Asp165 170 175Ile Asp Gly<210>44<211>179<212>PRT<213>大腸桿菌<400>44Tyr Ala Val Asp Ser Ser Asp Leu Leu Leu Ala Phe Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Glu Ala Phe Ala Ser Arg Ala Lys20 25 30Ile Val His Ile Asp Ile Asp Ser Ala Glu Ile Gly Lys Asn Lys Gln35 40 45Pro His Val Ser Ile Cys Ala Asp Ile Lys Leu Ala Leu Gln Gly Leu50 55 60Asn Ser Ile Leu Glu Ser Lys Glu Gly Lys Leu Lys Leu Asp Phe Ser65 70 75 80Ala Trp Arg Gln Glu Leu Thr Val Gln Lys Val Lys Tyr Pro Leu Asn85 90 95Phe Lys Thr Phe Gly Asp Ala Ile Pro Pro Gln Tyr Ala Ile Gln Val100 105 110Leu Asp Glu Leu Thr Asn Gly Ser Ala Ile Ile Ser Thr Gly Val Gly115 120 125Gln His Gln Met Trp Ala Ala Gln Tyr Tyr Lys Tyr Arg Lys Pro Arg130 135 140Gln Trp Leu Thr Ser Gly Gly Leu Gly Ala Met Gly Phe Gly Leu Pro145 150 155 160Ala Ala Ile Gly Ala Ala Val Gly Arg Pro Asp Glu Val Val Val Asp165 170 175Ile Asp Gly<210>45<211>180<212>PRT<213>大腸桿菌<400>45Met Thr Met His Asn Ala Asp Val Ile Phe Ala Val Gly Val Arg Phe1 5 10 15Asp Asp Arg Thr Thr Asn Asn Leu Ala Lys Tyr Cys Pro Asn Ala Thr20 25 30Val Leu His Ile Asp Ile Asp Pro Thr Ser Ile Ser Lys Thr Val Thr35 40 45Ala Asp Ile Pro Ile Val Gly Asp Ala Arg Gln Val Leu Glu Gln Met50 55 60Leu Glu Leu Leu Ser Gln Glu Ser Ala His Gln Pro Leu Asp Glu Ile65 70 75 80Arg Asp Trp Trp Gln Gln Ile Glu Gln Trp Arg Ala Arg Gln Cys Leu85 90 95Lys Tyr Asp Thr His Ser Glu Lys Ile Lys Pro Gln Ala Val Ile Glu100 105 110Thr Leu Trp Arg Leu Thr Lys Gly Asp Ala Tyr Val Thr Ser Asp Val115 120 125Gly Gln His Gln Met Phe Ala Ala Leu Tyr Tyr Pro Phe Asp Lys Pro130 135 140Arg Arg Trp Ile Asn Ser Gly Gly Leu Gly Thr Met Gly Phe Gly Leu145 150 155 160Pro Ala Ala Leu Gly Val Lys Met Ala Leu Pro Glu Glu Thr Val Val165 170 175Cys Val Thr Gly180<210>46<211>170<212>PRT<213>大腸桿菌<400> 46Phe Ala Val Gln Glu Cys Asp Leu Leu Ile Ala Val Gly Ala Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Asn Thr Ser Ala Pro His Ala Ser20 25 30Val Ile His Met Asp Ile Asp Pro Ala Glu Met Asn Lys Leu Arg Gln35 40 45Ala His Val Ala Leu Gln Gly Asp Leu Asn Ala Leu Leu Pro Ala Leu50 55 60Gln Gln Pro Leu Asn Gln Cys Asp Trp Gln Gln His Cys Ala Gln Leu65 70 75 80Arg Asp Glu His Ser Trp Arg Tyr Asp His Pro Gly Asp Ala Ile Tyr
85 90 95Ala Pro Leu Leu Leu Lys Gln Leu Ser Asp Arg Lys Pro Ala Asp Cys100 105 110Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala Gln His115 120 125Ile Ala His Thr Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu Gly130 135 140Thr Met Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Val Ala Arg145 150 155 160Pro Asn Asp Thr Val Val Cys Ile Ser Gly165 170<210>47<211>35<212>DNA<213>大腸桿菌<400>47gccttaatta accatgaggg aagcggtgat cgccg35<210>48<211>34<212>DNA<213>大腸桿菌<400>48tgcggtcgac tttgccgact accttggtga tctc 34<210>49<211>41<212>DNA<213>大腸桿菌<400>49cccaagcttg gcgccatgag taaaggagaa gaacttttca c 41<210>50<211>36<212>DNA<213>大腸桿菌<400>50gcgaccggtt tatttgtata gttcatccat gccatg 36<210>51<211>39<212>DNA<213>大腸桿菌<400>51agggaattcg tcgacaaatt tgctgaatat tgcctgtct 39<210>52<211>38<212>DNA<213>大腸桿菌<400>52ggcctcgagt tatttaattg tcccagcgtc aagtaatg 38<210>53<211>41<212>DNA<213>大腸桿菌<400>53agctttgttt aaaccatggt taaagttatc ggtcgtagat c 41<210>54<211>43<212>DNA<213>大腸桿菌<400>54cagcgtcgac ggcgccgtgg gatttgttaa agcagttagc agc 43<210>55<211>31<212>DNA<213>大腸桿菌<400>55catgccatgg gggaagcggt gatcgccgaa g 31<210>56<211>39<212>DNA<213>大腸桿菌<400>56acgcgagctc ttatttaatt gtcccagcgt caagtaatg39<210>57<211>34<212>DNA<213>大腸桿菌<400>57cgaattctat ggttaaagtt atcggtcgta gatc 34<210>58<211>36<212>DNA<213>大腸桿菌<400>58agcccgcggt tatttgtata gttcatccat gccatg 36<210>59<211>154<212>DNA<213>煙草(Nicotiana tabacum)<400>59gaatagatct acatacacct tggttgacac gagtatataa gtcatgttat actgttgaat 60aacaagcctt ccattttcta ttttgatttg tagaaaacta gtgtgcttgg gagtccctga 120tgattaaata aaccaagatt ttaccttaat taag 154<210>60<211>151<212>DNA<213>煙草<400>60gatcctggcc tagtctatag gaggttttga aaagaaagga gcaataatca ttttcttgtt 60ctatcaagag ggtgctattg ctcctttctt tttttctttt tatttattta ctagtatttt 120acttacatag acttttttgt ttacgtattc t151<210>61<211>185<212>DNA<213>煙草<400>61catatggcgt ccatgatctc ctcgtccgcg gtgaccacgg tcagccgcgc gtccacggtg 60cagtcggccg cggtggcccc gttcggcggc ctcaagtcca tgaccggctt cccggtcaag 120aaggtcaaca cggacatcac gtccatcacg agcaacggcg gcagggtgaa gtgcatgcga 180agagc 185<210>62<211>6232<212>DNA<213>未知<220><223>核苷酸1-2492大腸桿菌載體pLITMUS28(New England Biolabs，Inc.)<220><223>核苷酸2493-5993煙草(Nicotiana tabaceum)<220><223>核苷酸5993-6232大腸桿菌載體pLITMUS28(New England Biolabs，Inc.)<400>62gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta atacgactca 2460ctagtgggca gatcttcgaa tgcatcgcgc gcttgacgat atagcaattt tgcttggatt 2520tatcagtcga agcaggagac aatatacctt gatattctcg atcattcttt gattcaaagc 2580atcgttccat ctcaattgaa aaagcaaata acgtttcaag aacaaatcta gttctgcttc 2640cgtgttgctt ttgtattgtt ttttcttttt acccttcttt gtgtctgatt ccgcgtaatc 2700ttttttaaga gcgttttgat gttttgagag aacagggccc agatttcctt tgttttctat 2760atctgatcca cgctcttttt ctccttgact tgcgggttct tttgcttctt gaattcgatt 2820ctttattttt ttatttgatc gtagaaaaaa gttttgtttt tggtttttat tgatgttttt 2880attttgacta acattttcat ttgtattcaa atttaaaaga agtaatttgc ttggtataat 2940ccacggtttt attttatata cattataaag tggtacaaat tctgggaaga accaaaattc 3000cagattcaat atgggacgat ttaatatttt ttcattcatt cccatccaat caaaaaaggc 3060ttttttcgaa tttttttgat tgttttctgg attttgatga atcgtaagat aaaaaaagcc 3120ttttttatca attttatcaa ttatttgata attattaata ccaattttag tatttggatt 3180actgttggta tcgatcttaa cccaggcctc aatatcttct ttttgtctaa gagaaaaatg 3240gataattttc caatcaaaat attttctatc gagatttctt tctatatata gaatattgcc 3300ttttcttaga taattattga tatgaagatt gccgagcata tcaaaaaggt tgtgtttgga 3360cgtgttggaa ttagaagaaa tttcgaggtt cttatttact tgaaagggta atctagaaat 3420aaaagagtca tttttttttt cataattaat cgatttatat gctaaaagat catatctata 3480acatttttga aaattatctt tttggtttgc taatgaatag agctcagaat cattttcttt 3540tttgtaatga attaattggt ctttttcata tgaattccat ttgtttaaat ttcgattttg 3600agccatacaa ccttgattaa ccctatttcg ccatttttgt ggcattaatc tagaccatct 3660aatctgagat aaatcgtacg agaatactca atcatgaata aatgcaagaa aataacctct 3720ccttcttttt ctataatgta aacaaaaaag tctatgtaag taaaatacta gtaaataaat 3780aaaaagaaaa aaagaaagga gcaatagcac cctcttgata gaacaagaaa atgattattg 3840ctcctttctt ttcaaaacct cctatagact aggccaggat cctcgagctt aattaaggta 3900aaatcttggt ttatttaatc atcagggact cccaagcaca ctagttttct acaaatcaaa 3960atagaaaata gaaaatggaa ggctttttat tcaacagtat aacatgactt atatactcgt 4020gtcaaccaag gtgtatgtag atctattcct gcaggatatc tggatccacg aagcttccca 4080tgggaataga tctacataca ccttggttga cacgagtata taagtcatgt tatactgttg 4140aataaaaagc cttccatttt ctattttgat ttgtagaaaa ctagtgtgct tgggagtccc 4200tgatgattaa ataaaccaag attttaccgt ttaaacaccg gtgatcctgg cctagtctat 4260aggaggtttt gaaaagaaag gagcaataat cattttcttg ttctatcaag agggtgctat 4320tgctcctttc tttttttctt tttatttatt tactagtatt ttacttacat agactttttt 4380gtttacatta tagaaaaaga aggagaggtt attttcttgc atttattcat gattgagtat 4440tctcctaggc gtattgataa tgccgtctta accagttttt ccattgattg attctataac 4500tctgaagttt cttatgtttt aattcagaat gaaatattcc tagtgttcga aaatagtcct 4560ttattttagt cttaaggaaa aaagacgttc tgttatattg aagaacagat cttaatttag 4620acaaattaat aacttggggt tgtgataatt tgtaaaatac atatgcttgt gataagtagg 4680ataaatcaaa aaaaatatgt gaatttttct tactaatatt ataaagtgac ttttttatag 4740tcgaaataaa gtgaattttt ttttgattat taattttttc ttgatttatt tcattattgg 4800aaatgtattt atcaatcaat ttgtttgttg attcaagaaa gagttgtgta ttaattctgg 4860gaatattaat gatagataaa aatagatcga tgtataatct ttgaatgaat aattttagaa 4920aataatggaa tttccatatt aatcgagtat ttcttctttt taatatttgg aaaatctttt 4980ttggcgattc gaatttttta atattatttg ttttattagg actaatgtct atttctggag 5040ttactttctt tttctctttt gtaattcttt ctatttgatt tttgattgta cttgttctat 5100cagtcaaatc cttcattttg ctttctatca gtgaagaatt tggccaattt ccagattcaa 5160tttgactaaa tgattcgtta attatctgat tactcattag agaatctttt tcttttttcg 5220tttcattcga ttcatctatt tctttgagtc taaataatac aattggattt acttttgaaa 5280gttctttttt catttttttt ataaatagac tacttttgat aagccatttt ttggtttctt 5340ttgaaattct tcgaaataat tttatttttc ctttgaaaac ttttagagtt ataaaatatt 5400tctttttgaa ttttccaatt tttttttcga gttccttaaa aatgggctca aaaaaagaag 5460ggcgttttcg gggagaacca aagggaagtt cagcttccat tccccaaact gttaaaaaac 5520aaaaatcatc tttttgtttt ttctttttca ttagctctcc acgggaggag tacagtttag 5580atatatgcca aggtttcaga caaaaaggaa ataatatttt gatctgaatg ccatctttca 5640accaattttt tggaaattct gtttctgata attgaacacc attataagta catttaatat 5700gcatttctct attccattcc tgcaaatctt cagaccattc aggaagttgc aagactaaca 5760tacgcccgag atttttggct attatcaatg aaggtaatac aatatatttt cgaagaattg 5820attgagttat taacatgtaa cctcttatta tttgcgcaaa aggaatggta tcccaggctt 5880ctgctatctc tatccgtgct ttttcctttc ttttgttctc cccttttttg tccttttcct 5940ttttctcttc tctttttgtt tgttcttctc tagactctag aatcttgaat tcggtaccct 6000ctagtcaagg ccttaagtga gtcgtattac ggactggccg tcgttttaca acgtcgtgac 6060tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 6120tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 6180ggcgaatggc gcttcgcttg gtaataaagc ccgcttcggc gggctttttt tt 6232<210>63<211>6477<212>DNA<213>未知<220><223>核苷酸1-2482大腸桿菌載體pLITMUS28(NewEngland Biolabs，Inc.)<220><223>核苷酸2493-6242核苷酸<220><223>核苷酸6243-6477大腸桿菌載體pLITMUS28(New England Biolabs，Inc.)<400>63gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta atacgactca 2460ctagtgggca gatcttcgaa tgcatcgcgc gcaattcacc gccgtatggc tgaccggcga 2520ttactagcga ttccggcttc atgcaggcga gttgcagcct gcaatccgaa ctgaggacgg 2580gtttttgggg ttagctcacc ctcgcgggat cgcgaccctt tgtcccggcc attgtagcac 2640gtgtgtcgcc cagggcataa ggggcatgat gacttgacgt catcctcacc ttcctccggc 2700ttatcaccgg cagtctgttc agggttccaa actcaacgat ggcaactaaa cacgagggtt 2760gcgctcgttg cgggacttaa cccaacacct tacggcacga gctgacgaca gccatgcacc 2820acctgtgtcc gcgttcccga aggcacccct ctctttcaag aggattcgcg gcatgtcaag 2880ccctggtaag gttcttcgct ttgcatcgaa ttaaaccaca tgctccaccg cttgtgcggg 2940cccccgtcaa ttcctttgag tttcattctt gcgaacgtac tccccaggcg ggatacttaa 3000cgcgttagct acagcactgc acgggtcgat acgcacagcg cctagtatcc atcgtttacg 3060gctaggacta ctggggtatc taatcccatt cgctccccta gctttcgtct ctcagtgtca 3120gtgtcggccc agcagagtgc tttcgccgtt ggtgttcttt ccgatctcta cgcatttcac 3180cgctccaccg gaaattccct ctgcccctac cgtactccag cttggtagtt tccaccgcct 3240gtccagggtt gagccctggg atttgacggc ggacttaaaa agccacctac agacgcttta 3300cgcccaatca ttccggataa cgcttgcatc ctctgtatta ccgcggctgc tggcacagag 3360ttagccgatg cttattcccc agataccgtc attgcttctt ctccgggaaa agaagttcac 3420gacccgtggg ccttctacct ccacgcggca ttgctccgtc agctttcgcc cattgcggaa 3480aattccccac tgctgcctcc cgtaggagtc tgggccgtgt ctcagtccca gtgtggctga 3540tcatcctctc ggaccagcta ctgatcatcg ccttggtaag ctattgcctc accaactagc 3600taatcagacg cgagcccctc ctcgggcgga ttcctccttt tgctcctcag cctacggggt 3660attagcagcc gtttccagct gttgttcccc tcccaagggc aggttcttac gcgttactca 3720cccgtccgcc actggaaaca ccacttcccg tccgacttgc atgtgttaag catgccgcca 3780gcgttcatcc tgagccagga tcgaactctc catgagattc atagttgcat tacttatagc 3840ttccttgttc gtagacaaag cggattcgga attgtctttc attccaaggc ataacttgta 3900tccatgcgct tcatattcgc ccggagttcg ctcccagaaa tatagccatc cctgccccct 3960cacgtcaatc ccacgagcct cttatccatt ctcattgaac gacggcgggg gagcaaatcc 4020aactagaaaa actcacattg ggcttaggga taatcaggct cgaactgatg acttccacca 4080cgtcaaggtg acactctacc gctgagttat atcccttccc cgccccatcg agaaatagaa 4140ctgactaatc ctaagtcaaa ggcgtacgag aatactcaat catgaataaa tgcaagaaaa 4200taacctctcc ttctttttct ataatgtaaa caaaaaagtc tatgtaagta aaatactagt 4260aaataaataa aaagaaaaaa agaaaggagc aatagcaccc tcttgataga acaagaaaat 4320gattattgct cctttctttt caaaacctcc tatagactag gccaggatcc tcgagcttaa 4380ttaaggtaaa atcttggttt atttaatcat cagggactcc caagcacact agttttctac 4440aaatcaaaat agaaaataga aaatggaagg ctttttattc aacagtataa catgacttat 4500atactcgtgt caaccaaggt gtatgtagat ctattcctgc aggatatctg gatccacgaa 4560gcttcccatg ggaatagatc tacatacacc ttggttgaca cgagtatata agtcatgtta 4620tactgttgaa taaaaagcct tccattttct attttgattt gtagaaaact agtgtgcttg 4680ggagtccctg atgattaaat aaaccaagat tttaccgttt aaacaccggt gatcctggcc 4740tagtctatag gaggttttga aaagaaagga gcaataatca ttttcttgtt ctatcaagag 4800ggtgctattg ctcctttctt tttttctttt tatttattta ctagtatttt acttacatag 4860acttttttgt ttacattata gaaaaagaag gagaggttat tttcttgcat ttattcatga 4920ttgagtattc tcctagggtc gagaaactca acgccactat tcttgaacaa cttggagccg 4980ggccttcttt tcgcactatt acggatatga aaataatggt caaaatcgga ttcaattgtc 5040aactgcccct atcggaaata ggattgacta ccgattccga aggaactgga gttacatctc 5100ttttccattc aagagttctt atgcgtttcc acgccccttt gagaccccga aaaatggaca 5160aattcctttt cttaggaaca catacaagat tcgtcactac aaaaaggata atggtaaccc 5220taccattaac tacttcattt atgaatttca tagtaataga aatacatgtc ctaccgagac 5280agaatttgga acttgctatc ctcttgccta gcaggcaaag atttacctcc gtggaaagga 5340tgattcattc ggatcgacat gagagtccaa ctacattgcc agaatccatg ttgtatattt 5400gaaagaggtt gacctccttg cttctctcat ggtacactcc tcttcccgcc gagccccttt 5460tctcctcggt ccacagagac aaaatgtagg actggtgcca acaattcatc agactcacta 5520agtcgggatc actaactaat actaatctaa tataatagtc taatatatct aatataatag 5580aaaatactaa tataatagaa aagaactgtc ttttctgtat actttccccg gttccgttgc 5640taccgcgggc tttacgcaat cgatcggatt agatagatat cccttcaaca taggtcatcg 5700aaaggatctc ggagacccac caaagtacga aagccaggat ctttcagaaa acggattcct 5760attcaaagag tgcataaccg catggataag ctcacactaa cccgtcaatt tgggatccaa 5820attcgagatt ttccttggga ggtatcggga aggatttgga atggaataat atcgattcat 5880acagaagaaa aggttctcta ttgattcaaa cactgtacct aacctatggg atagggatcg 5940aggaagggga aaaaccgaag atttcacatg gtacttttat caatctgatt tatttcgtac 6000ctttcgttca atgagaaaat gggtcaaatt ctacaggatc aaacctatgg gacttaagga 6060atgatataaa aaaaagagag ggaaaatatt catattaaat aaatatgaag tagaagaacc 6120cagattccaa atgaacaaat tcaaacttga aaaggatctt ccttattctt gaagaatgag 6180gggcaaaggg attgatcaag aaagatcttt tgttcttctt atatataaga tcgtgatggt 6240accctctagt caaggcctta agtgagtcgt attacggact ggccgtcgtt ttacaacgtc 6300gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 6360ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 6420tgaatggcga atggcgcttc gcttggtaat aaagcccgct tcggcgggct ttttttt6477<210>64<211>31<212>DNA<213>煙草<400>64aactgcagga atagatctac atacaccttg g31<210>65<211>42<212>DNA<213>煙草<400>65ccgctcgagc ttaattaagg taaaatcttg gtttatttaa tc 42<210>66<211>33<212>DNA<213>煙草<400>66gcgaccggtg atcctggcct agtctatagg agg 33<210>67<211>34<212>DNA<213>煙草<400>67aggcctagga gaatactcaa tcatgaataa atgc34<210>68<211>34<212>DNA<213>煙草<400>68ttggcgcgct tgacgatata gcaattttgc ttgg34<210>69<211>34<212>DNA<213>煙草<400>69ttgcgtacga tttatctcag attagatggt ctag34<210>70<211>35<212>DNA<213>煙草<400>70ttgcctaggc gtattgataa tgccgtctta accag 35<210>71<211>34<212>DNA<213>煙草<400>71aggggtaccg aattcaagat tctagagtct agag 34<210>72<211>34<212>DNA<213>煙草<400>72ttggcgcgca attcaccgcc gtatggctga ccgg 34<210>73<211>34<212>DNA<213>煙草<400>73ttgcgtacgc ctttgactta ggattagtca gttc 34<210>74<211>34<212>DNA<213>煙草<400>74ttgcctaggg tcgagaaact caacgccact attc 34<210>75<211>35<212>DNA<213>煙草<400>75aggggtacca tcacgatctt atatataaga agaac35<210>76<211>250<212>DNA<213>煙草<400>76gaattgtgag cgctcacaat tctaggatgt taattgcgcc gacatcataa cggttctggc 60aaatattctg aaatgagctg ttgacaatta atcatcggct cgtataatgt gtggaattgt 120gagcggataa caatttcaca caggaaacag accatggtga attctagagc tcgaggatcc 180gcggtacccg ggcatgcatt cgaagcttcc ttaagcggcc gtcgaccgat gcccttgaga 240gccttcaacc250<210>77<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>77Cys Leu Asn Ile Gln1 5<210>78<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>78Val Phe Lys His Ala1 5<210>79<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>79Leu Phe Lys Gln Pro1 5<210>80<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>80Cys Leu Asn Ser Asp1 5<210>81<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>81Cys Leu Asn Ile Ser1 5<210>82<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>82Cys Leu Asn Thr Asp1 5<210>83<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>83Cys Leu Asn Asn Arg1 5<210>84.<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>84Cys Leu Asn Ser Cys1 5<210>85<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>85Cys Leu Asn Ser Asp1 5<210>86<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>86Cys Leu Asn Thr Leu1 5<210>87<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>87Val Phe Lys Gln Pro1 5<210>88<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>88Cys Leu Asn Ser Met1 5<210>89<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>89Cys Leu Asn Asn Tyr1 5<210>90<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>90Cys Leu Asn Met Ala1 5<210>91<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>91Val Phe Lys His Lys1 5<210>92<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>92Cys Leu Asn Thr Lys1 5<210>93<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>93Cys Leu Asn Lys Asp1 5<210>94<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>94Met Phe Lys Gln Ile1 5<210>95<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>95Cys Leu Asn Ile Ile1 5<210>96<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>96Leu Phe Lys His Glu1 5<210>97<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>97Val Phe Lys His Phe1 5<210>98<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>98Cys Leu Asn Ser Val1 5<210>99<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>99Val Phe Lys Gln Ile1 5<210>100<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>100Met Phe Lys Gln Ala1 5<210>101<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>101Leu Phe Lys His His1 5<210>102<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>102Leu Phe Lys His Gln1 5<210>103<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>103Met Phe Lys His Val1 5<210>104<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>104Val Phe Lys Gln Lys1 5<210>105<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>105Leu Phe Lys Gln Gln1 5<210>106<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>106Leu Phe Lys His Ser1 5<210>107<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>107Cys Leu Asn Thr Gly1 5<210>108<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>108Cys Leu Asn Ser Arg1 5<210>109<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>109Val Phe Lys His Leu1 5<210>110<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>110Cys Leu Asn Asn Ile1 5<210>111<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>111Leu Phe Lys His Gln1 5<210>112<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>112Cys Leu Asn Lys His1 5<210>113<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>113Met Phe Lys Gln Tyr1 5<210>114<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>114Cys Leu Asn Lys Gln1 5<210>115<211>5<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>115Cys Leu Asn Met Ser1 5<210>116<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>116Leu Cys Leu Asn Ile Leu Ala1 5<210>117<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>117Asn Cys Leu Asn Ile Asn Ala1 5<210>118<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>118Leu Met Phe Lys His Leu Ser1 5<210>119<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>119Thr Leu Phe Lys His Thr Arg1 5<210>120<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>120Lys Val Phe Lys Gln Lys Glu1 5<210>121<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>121His Leu Val Phe Lys His Leu1 5<210>122<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>122Leu Cys Leu Asn Thr Leu Leu1 5<210>123<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>123Leu Cys Leu Asn Asn Leu Val1 5<210>124<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>124Glu Val Phe Lys His Glu Gly1 5<210>125<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>125Lys Val Phe Lys Gln Lys Gly1 5<210>126<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>126Thr Cys Leu Asn Thr Thr Ile1 5<210>127<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>127Met Cys Leu Asn Asn Met Asn1 5<210>128<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>128Leu Leu Phe Lys Gln Leu Arg1 5<210>129<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>129Arg Cys Leu Asn Asn Arg Leu1 5<210>130<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>130Met Val Phe Lys Gln Met Ala1 5<210>131<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>131Ala Met Phe Lys Gln Ala Thr1 5<210>132<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>132Leu Val Phe Lys His Leu Asp1 5<210>133<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>133Lys Met Phe Lys Gln Lys Thr1 5<210>134<211>7<212>PRT<213>人工序列<220><223>人工序列的描述基于Tn7轉座子的末端<400>134Tyr Cys Leu Asn Asn Tyr Phe1 權利要求
1.在生物體中的預定位置重新組裝靶蛋白的方法，包括a)將編碼該靶蛋白的DNA斷裂成至少兩個片斷；b)分離步驟a)中的DNA片斷，以防止編碼靶蛋白的基因傳遞到其他生物體中；c)在生物體內(nèi)表達步驟b)中的DNA片斷，以產(chǎn)生相應的靶蛋白片斷；和d)從這些蛋白片斷重新構建靶蛋白。
2.防止編碼靶蛋白的基因從含有編碼靶蛋白的所述DNA的生物體中傳遞到其他生物體的方法，包括a)將編碼該靶蛋白的DNA斷裂成至少兩個片斷；和b)分離步驟a)中的DNA片斷，以防止編碼靶蛋白基因的傳遞。
3.如權利要求1或2所述的方法，其中生物體選自植物、動物、真菌、病毒、原核生物和單細胞真核生物。
4.如權利要求1或2所述的方法，其中編碼靶蛋白的DNA被編碼一個或多個intein的DNA或其一部分斷裂。
5.如權利要求4所述的方法，其中編碼靶蛋白的DNA通過形成至少兩個DNA融合片斷而被斷裂，其中所述的DNA融合片斷包括編碼靶蛋白的DNA的一部分和編碼intein的DNA的一部分。
6.如權利要求5所述的方法，其中所述的融合片斷之一是通過連接編碼靶蛋白N-端部分DNA的C-末端與編碼intein N-端部分DNA的N-端形成的，另一個所述融合片斷是通過連接編碼靶蛋白C-端部分DNA的N-末端與編碼intein C-端部分DNA的C-端形成的。
7.如權利要求1或2所述的方法，其中編碼靶蛋白的DNA被編碼一個或多個親和區(qū)的DNA裂解形成兩個或更多的DNA片斷。
8.如權利要求7所述的方法，其中所述的親和區(qū)選自inteins或intein片斷、亮氨酸拉鏈和c-Jun/c-Fos。
9.如權利要求1或2所述的方法，其中編碼靶蛋白的DNA片斷是通過將每一個DNA片斷區(qū)室化在不同的區(qū)室中而分開，這些區(qū)室選自核、有外膜的細胞器、質粒、病毒、裝配型質粒和人工染色體。
10.如權利要求9所述的方法，其中至少一個編碼靶蛋白的DNA片斷與編碼轉運肽的DNA序列融合，從而使DNA片斷的蛋白產(chǎn)物被轉運至單獨的區(qū)室，在該區(qū)室中進行功能性重構。
11.如權利要求10所述的方法，其中編碼靶蛋白一部分的DNA片斷被區(qū)室化在核中，與編碼轉運肽的DNA序列融合以便轉運進葉綠體，編碼靶蛋白另一部分的其他DNA片斷被限制在葉綠體中。
12.如權利要求1或2所述的方法，其中編碼靶蛋白的DNA片斷通過將每個片斷插入到DNA分子的不同部分中分開，其中DNA分子選自核和有外膜細胞器的DNA、質粒DNA、裝配型質粒DNA、病毒DNA和人工染色體DNA。
13.如權利要求12所述的方法，其中至少一個DNA分子是自然遺傳的。
14.如權利要求12所述的方法，其中至少有一個DNA分子留在葉綠體中。
15.如權利要求12所述的方法，其中至少有一個DNA分子留在線粒體中。
16.如權利要求4所述的方法，其中靶蛋白片斷的重構包括intein介導的剪接。
17.如權利要求4所述的方法，其中靶蛋白片斷的重構包括intein介導的蛋白互補。
18.如權利要求1所述的方法，其中靶蛋白片斷的重構包括蛋白質互補。
19.如權利要求18所述的方法，其中蛋白互補在存在親和區(qū)的條件下發(fā)生的。
20.如權利要求18所述的方法，其中蛋白互補在缺乏親和區(qū)的條件下發(fā)生的。
21.如權利要求1或2所述的方法，其中編碼靶蛋白的DNA的斷裂包括a)確定靶蛋白的一個或多個潛在斷裂位點區(qū)；和b)在潛在的斷裂位點區(qū)斷裂編碼靶蛋白的DNA。
22.如權利要求21所述的方法，其中通過靶蛋白非保守區(qū)的基本氨基酸序列分析確定所述的靶蛋白的潛在斷裂位點區(qū)。
23.如權利要求21所述的方法，其中通過在靶蛋白內(nèi)連接子插入的耐受性確定所述的潛在的斷裂位點區(qū)。
24.如權利要求21所述的方法，其中通過分析靶蛋白存在的彈性環(huán)結構確定所述的潛在的斷裂位點區(qū)。
25.如權利要求21所述的方法，其中分析靶蛋白折疊區(qū)之間靶蛋白的氨基酸序列確定所述的潛在的斷裂位點區(qū)。
26.包括EPSPS基因中的一個DNA斷裂位點的分離的DNA片斷。
27.如權利要求26所述的分離的DNA片斷，其中所述的DNA片斷選自編碼1-235氨基酸或其中一部分的DNA，SEQ ID NO24，SEQ ID NO25，SEQ ID NO28，SEQ ID NO29，SEQ ID NO30，SEQ ID NO31，SEQ ID NO36，SEQ ID NO37，SEQ ID NO38和SEQ ID NO39組成的基團。
28.包括在大腸桿菌ALS基因中的一個DNA斷裂位點的分離的DNA片斷。
29.如權利要求28所述的分離的DNA片斷，其中所述的DNA片斷選自SEQ IDNO10，SEQ ID NO11，SEQ ID NO12和SEQ ID NO13。
30.包括玉米ALS基因中的一個DNA斷裂位點的分離的DNA片斷。
31.如權利要求30所述的分離的DNA片斷，其中所述的DNA片斷選自SEQ IDNO17，SEQ ID NO17，SEQ ID NO18和SEQ ID NO19。
32.如權利要求26、28或30所述的分離的DNA，其中所述的DNA片斷與編碼intein或其一部分的DNA融合。
全文摘要
本發(fā)明披露一種能夠在靶宿主,如一種植物內(nèi)高效表達蛋白質的新型轉基因系統(tǒng),又能避免經(jīng)花粉將這種轉基因帶入相關的宿主系統(tǒng)和/或環(huán)境。該方法同樣適用于真核細胞生物(酵母、昆蟲、哺乳動物細胞等)和原核生物(如大腸桿菌等)內(nèi)任何目的蛋白(如一種毒性蛋白)的表達。
文檔編號C07K19/00GK1350582SQ00807542
公開日2002年5月22日申請日期2000年5月23日優(yōu)先權日1999年5月24日
發(fā)明者徐明群, T·C·埃文斯, S·普拉丹, D·G·科姆, H·保盧斯, L·孫, 陳立新, I·高希申請人:新英格蘭生物實驗室公司, 波士頓生物醫(yī)學研究所

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：徐明群;T.C.埃文斯;S.普拉丹;D.G.科姆;H.保盧斯;L.孫;陳立新;I.高希
技術所有人：新英格蘭生物實驗室公司;波士頓生物醫(yī)學研究所
我是此專利的發(fā)明人

上一篇：蛋白質的分配方法
上一篇：Fap活化的抗腫瘤化合物的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、張老師：1.探索新型氧化還原酶結構-功能關系，電催化反應機制 2.酶電催化導向的酶分子改造 3.納米材料、生物功能多肽對酶-電極體系的影響4. 生物電化學傳感和生物電合成體系的設計與應用。
2、鄔老師：1.高分子材料的共混與復合 2.涉及材料功能化及結構與性能的研究；高分子熱穩(wěn)定劑的研發(fā)
3、趙老師：1.電化學離子儲存和分離技術 2.工業(yè)結晶
4、廖老師：1. 晶面可控氧化鋁、碳基載體及催化劑等高性能、新結構催化材料研究 2. 乙烯環(huán)氧化催化劑的研究與開發(fā) 3. 低碳不飽和烯烴的選擇性氧化催化劑及工業(yè)技術開發(fā)
5、李老師：1. 加氫精制 2. 選擇加氫 3. 加氫脫氧 4. 介孔及介微孔分子篩合成及催化應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

產(chǎn)生能夠表達活性蛋白產(chǎn)物的斷裂、不可傳遞的基因的方法