專利名稱:一種多肽隨機文庫及其構(gòu)建方法和從該文庫中篩選細胞穿透多肽的方法
技術(shù)領域:
本發(fā)明涉及生物醫(yī)藥領域,特別涉及多肽文庫、構(gòu)建方法及其應用,具體涉及用于篩選細胞穿透多肽的隨機文庫、構(gòu)建方法及其從該文庫篩選細胞穿透多肽的方法。
背景技術(shù):
細胞膜是細胞與細胞外環(huán)境間的半透性屏障,具有選擇性通透作用從而使細胞保持恒定的內(nèi)環(huán)境。在分子生物學研究、基因治療和制藥工業(yè)中,需要將蛋白、多肽、核苷酸、藥物等大分子導入細胞內(nèi)發(fā)揮作用。由于細胞膜的選擇性通透作用,使上述物質(zhì)很難穿過細胞膜到達細胞內(nèi)作用于相應的藥物作用靶位?,F(xiàn)有的通過細胞膜向細胞內(nèi)轉(zhuǎn)運的技術(shù)有電穿孔、顯微注射、脂質(zhì)體轉(zhuǎn)染和病毒載體等。但上述細胞膜轉(zhuǎn)運技術(shù)存在固有的缺點。電穿孔和顯微注射對操作的要求很高、不能在體內(nèi)應用并且只能對有限的細胞進行操作;脂質(zhì)體轉(zhuǎn)染缺乏特異性且轉(zhuǎn)運效率低;病毒載體具有抗原性可引起機體的免疫反應。
1988年Frankel等發(fā)現(xiàn)HIV-1 Tat蛋白能夠直接穿過細胞膜、細胞核膜錨固于特異的基因調(diào)控區(qū)。隨后研究發(fā)現(xiàn),Tat蛋白中的一段長度為11個氨基酸殘基的堿性氨基酸序列YGRKKRRQRRR負責了整個蛋白的轉(zhuǎn)運。接著又發(fā)現(xiàn)了一些具有這種轉(zhuǎn)運功能的多肽,例如果蠅觸角蛋白(antennapedia protein ofDrosophila)中的一段16個殘基的氨基酸序列RQIKIWFQNRRMKWKK。這些具有穿透細胞膜功能的短肽序列稱為細胞穿透多肽(cell penetrating peptide,CPP),而這一蛋白結(jié)構(gòu)又被稱為蛋白轉(zhuǎn)導結(jié)構(gòu)域(protein transduction domain,PTD)或膜轉(zhuǎn)導結(jié)構(gòu)域(membrane translocation domain,MTD)(J Biol Chem,1995,27014255-14258)。
CPP作為大分子物質(zhì)運載載體的意義是非常巨大的。當一些大分子物質(zhì)與CPP相連時可以隨CPP一起進入細胞,因此CPP是分子生物學研究、基因治療和制藥工業(yè)中的重要工具。多肽、蛋白、反義寡核苷酸、肽核酸(J Biol Chem,2002,277(9)7144-7147)、甚至小的顆粒物質(zhì)都可通過與CPP相連進入細胞。一些蛋白結(jié)合結(jié)構(gòu)域如SH2、SH3(Mol Cell Biol,1999,19(9)6217-6228)、BH3(Cell Death Differ,2001,8(7)725-733)和一些模擬DNA結(jié)合序列的多肽(Cancer Res,1998,58(16)3654-3659),一旦與CPP相融合就可進入細胞漿或細胞核內(nèi),使原有的蛋白—蛋白、蛋白—寡核苷酸之間的相互作用發(fā)生改變,抑制蛋白—蛋白的結(jié)合或蛋白復合物的形成,從而抑制了蛋白的功能。Polo-like激酶-1(Polo-like kinase-1,Plk-1)在細胞的有絲分裂中具有關鍵作用,在快速分化和一些腫瘤細胞中高度表達。若把Plk-1羧基末端的polo-box與穿透素相融合,使其進入人類腫瘤細胞,增加細胞內(nèi)的含量,可明顯減少多種腫瘤細胞的增殖。蛋白可以通過兩種方式與CPP相連一種是化學方法;另一種是利用重組質(zhì)粒在大腸桿菌中以融合蛋白的形式表達。Steven將120kDa的β-半乳糖苷酶與Tat的PTD的融合肽帶到小鼠的幾乎所有組織中,在肝、腎、脾、心肌、肺中都有β-半乳糖苷酶的顯色反應,尤其是在作用8h后,在小鼠的大腦中檢測到β-半乳糖苷酶(β-galactosidase)呈陽性反應。
一些生物體能夠利用CPP抵抗微生物入侵從而保護自身,如buforin,一種蛙的抗菌肽,能夠穿過細菌的細胞壁和細胞膜直接與細菌的DNA或RNA發(fā)生結(jié)合,從而抑制蛋白質(zhì)的合成,導致細菌快速死亡而細菌的細胞膜是完整的。還有一些多肽能夠在細胞膜上“打孔”,使細胞膜的完整性遭到破壞,或者是干擾膜蛋白的功能導致微生物死亡。Nekhotiaeva等發(fā)現(xiàn),兩種CPP-TP10和PVEC(pVEC是源自小鼠血管內(nèi)皮細胞鈣粘素蛋白的一段18個氨基酸殘基序列的多肽,TP10是合成的一段21個氨基酸殘基序列的多肽)(FASEB J.2004Feb;18(2)394-6)。在微摩爾量下就可以抑制白色念珠菌、金黃色葡萄球菌和恥垢分支桿菌的生長。
雖然并沒有對所有CPP的細胞特異性進行過研究,但現(xiàn)有的體外實驗并沒有表明哪一種CPP具有明顯的細胞特異性。例如,對于穿透素(Penetratin)家族成員幾乎可以穿透所有的細胞類型,從成纖維細胞到神經(jīng)元。由于CPP穿膜的基本機制是要和膜脂質(zhì)相結(jié)合,這就提示CPP可能沒有嚴格的細胞特異性。但是不同的細胞類型其膜脂質(zhì)的組成、糖的類型和細胞外基質(zhì)的特異性是不同的,因此,可以影響CPP的附著和攝入,特別是帶凈電荷比較多的CPP。因此,在同一組織中一些細胞就會選擇性地攝入一類CPP。例如,當把穿透素注入神經(jīng)系統(tǒng)中時,穿透素主要聚集在神經(jīng)元處(Eur J Neurosci,2000,12(8)2847-2855)。果蠅觸角蛋白也被神經(jīng)元選擇性地攝取,這需要特定的糖類與神經(jīng)細胞表面的神經(jīng)細胞粘附分子(NCAM,neural cell adhesion molecule)結(jié)合(New Biol,1991,3(11)1121-1134)。
目前CPP的研究存在如下問題首先,CPP的發(fā)現(xiàn)是分散而獨立的。科學家往往在對某種蛋白進行研究時發(fā)現(xiàn)該蛋白具有穿透細胞膜的功能,進而發(fā)現(xiàn)其中某段氨基酸序列介導了該功能,然后確定其為CPP,進行細致的研究。
其次,關于CPP穿膜的機制至今還存在著廣泛的爭議,沒有明確的結(jié)論。研究表明一些富含精氨酸的CPP其穿膜的機制與細胞表面的多糖如硫酸乙酰肝素有關。但是,并不是所有的CPP都富含精氨酸,因此,不同的CPP可能通過不同的通路或機制進入細胞(J Biol Chem,1997,272(25)16010-16017)。即使相同的CPP由于其所帶的“貨物”不同,其進入細胞的機制也不同(Nat Cell Biol,204,(3)189-196)。近來有報道,Tat和(Arg)9的入核是由于細胞固定所造成的假象(Science.1999 Sep3;285(5433)1569-1572),因為標準的內(nèi)化實驗需要對細胞進行固定(cell fixation),即使最溫和的固定方法如多聚甲醛都可導致人為的攝入(artificial uptake)。因此,需要重新對CPP穿膜的機制進行鑒定,而且在實驗的時候要避免一些造成人為攝入的因素。
最后,目前所知的CPP的一個主要特性就是相對缺少細胞特異性。在某些情況下這一點可能是有利的,但是當需要把藥物靶向帶入身體的特定部位或某一特定類型的細胞時,這點就成了一個主要的問題。因此,提高CPP的特異性成了未來研究的主要目標。在原有CPP的基礎上構(gòu)建更加復雜的復合物可以使CPP具有一定的特異性。利用噬菌體展示技術(shù)來篩選細胞特異性的CPP也是一種有前途的方法。
目前為止,尚無人建立系統(tǒng)的方法尋找CPP,并解決上述問題。還沒有文獻報道采用建立隨機文庫的方法對CPP進行大規(guī)模的篩選。也未見對隨機文庫進行篩選得到CPP的方法報道。
發(fā)明內(nèi)容
本發(fā)明目的是提供一種多肽隨機文庫。
本發(fā)明另一目的是提供一種多肽隨機文庫的構(gòu)建方法。
本發(fā)明另一目的是提供一種從多肽隨機文庫中篩選細胞穿透多肽的方法。
本發(fā)明所述多肽隨機文庫是表達文庫。文庫中任何一個克隆經(jīng)過誘導表達、純化后得到的產(chǎn)物為融合蛋白。該融合蛋白組成為用于純化融合蛋白的標簽、示蹤蛋白和隨機多肽。
本發(fā)明所述的用于純化融合蛋白的標簽,是本領域常用的標簽。標簽常用是組氨酸標簽(His-tag)和谷胱甘肽巰基轉(zhuǎn)移酶標簽(GST-tag)。本發(fā)明最好用組氨酸標簽(His-tag)。該標簽的特征是該段序列由六個連續(xù)的組氨酸組成(H6)。
編碼組氨酸標簽(His-tag)基因序列為NOVAGEN公司提供的pET-14b載體所固有,其編碼序列為CATCATCATCATCATCAC。
本發(fā)明所述的示蹤蛋白,是本領域常用的示蹤蛋白。本發(fā)明使用的示蹤蛋白是熒光蛋白。常用的熒光蛋白有增強型的綠色熒光蛋白(EGFP)、增強型的黃色熒光蛋白(EYFP)、增強型的青色熒光蛋白(ECFP)、紅色熒光蛋白(RFP)。本發(fā)明使用增強型的綠色熒光蛋白。該蛋白的特點是在激發(fā)光激發(fā)后,在熒光顯微鏡下可見明亮的綠色熒光。
編碼作為示蹤的EGFP的基因序列由BD Biosciences公司的載體pEGFP-C2得到,其基因序列為SEQ ID NO.1。
本發(fā)明所述的示蹤蛋白連接在用于純化融合蛋白的標簽的氨基末端或羧基末端。本發(fā)明所述示蹤蛋白最好是連接在用于純化融合蛋白的標簽的羧基末端。
本發(fā)明所述的隨機多肽是一段含三十個以下(包括三十)的隨機氨基酸序列。本發(fā)明所述的隨機多肽連接至示蹤蛋白的羧基末端。
本發(fā)明所述多肽隨機文庫是由相應的DNA文庫(用于篩選CPP的DNA文庫)翻譯轉(zhuǎn)化得到。本發(fā)明所述多肽隨機文庫轉(zhuǎn)化方法是本領域常用的轉(zhuǎn)化方法。例如化學轉(zhuǎn)化法和電穿孔轉(zhuǎn)化法,見J.薩姆布魯克等編著的《分子克隆(中文第二版)》。
本發(fā)明所述的DNA文庫由載體和隨機的堿基序列組成,如圖1所示。
本發(fā)明所述的DNA文庫中的載體是由pET-14b載體構(gòu)建得到。本發(fā)明所述的pET-14b載體可以由NOVAGEN公司購買得到。本發(fā)明所述的pET-14b載體如圖2所示,其克隆/表達區(qū)如圖3所示。
本發(fā)明所述的pET-14b載體的改構(gòu)方法如下使用聚合酶鏈反應技術(shù)(PCR技術(shù))擴增目的基因片斷,用亞克隆的方法給pET-14b載體引入表達產(chǎn)物可作為示蹤的基因序列。
改造后的載體如圖4所示。其克隆/表達區(qū)序列為SEQ ID NO.2。
其中編碼作為示蹤的蛋白EGFP的基因序列由BD Biosciences公司的載體pEGFP-C2得到。其中編碼用于純化的His標簽的基因序列為CATCATCATCATCATCAC。
本發(fā)明所述的DNA文庫中的載體含有以下序列編碼用于純化的標簽的基因序列、編碼作為示蹤的蛋白的基因序列以及多克隆酶切位點。
本發(fā)明所述的隨機堿基序列是用設計的兩條分別含有隨機堿基的引物對載體進行PCR擴增,以插入該載體的兩個酶切位點之間(圖5)。PCR技術(shù)是實驗室常用技術(shù),引入隨機堿基只需在引物設計時加入隨機堿基,由商業(yè)公司(如上海博亞生物技術(shù)有限公司)按設計合成引物,見J.薩姆布魯克等編著的《分子克隆(中文第二版)》。
DNA文庫轉(zhuǎn)化至表達宿主菌后,加入甘油分裝凍存,即完成表達文庫的建立。
本發(fā)明篩選細胞穿透多肽隨機文庫的構(gòu)建方法如下首先將原核表達載體進行改造,改造后的載體除帶有編碼六個組氨酸的基因序列、編碼氨芐霉素的基因序列外還帶有編碼綠色熒光蛋白的基因序列。然后用PCR的方法,設計兩條分別含18個隨機堿基的引物,對載體進行擴增,得到隨機DNA文庫。最后將該DNA文庫轉(zhuǎn)化感受態(tài)宿主菌,得到表達隨機文庫。
具體含有以下步驟a.對原核表達載體進行改造,在多克隆位點引入四個多克隆酶切位點。
b.引入三聯(lián)終止密碼子。
c.在載體中引入編碼示蹤蛋白的基因序列。
d.在載體中引入隨機序列。
e.將上述所得的載體進行表達得到篩選細胞穿透多肽隨機文庫。
本發(fā)明從多肽隨機文庫篩選細胞穿透多肽的方法,含有以下步驟首先將本發(fā)明所述的多肽隨機文庫進行誘導表達并純化。然后將純化蛋白加入培養(yǎng)細胞進行培養(yǎng)。最后在熒光顯微鏡下觀察篩選,有綠色熒光在細胞中蓄積的,即可認定其所攜帶的多肽為細胞穿透多肽。
本發(fā)明從多肽隨機文庫篩選細胞穿透多肽的方法的第三步中以已知能將示蹤蛋白帶入細胞的多肽或蛋白作為陽性對照。本發(fā)明所述的已知能將示蹤蛋白帶入細胞的多肽或蛋白包括HIV-1 Tat蛋白中的一段堿性氨基酸序列YGRKKRRQRRR(tat)和果蠅觸角蛋白中的一段16個氨基酸序列RQIKIWFQNRRMKWKK。常用的是Tat,其在細胞內(nèi)定位熒光圖如圖6。
本發(fā)明所述的培養(yǎng)細胞可以是各種真核細胞。最好選用貼壁培養(yǎng)的細胞。
本發(fā)明所述的觀察指標為在熒光顯微鏡下肉眼可見綠色熒光在細胞的任何部位包括細胞膜、細胞漿、細胞核等聚集。觀察時間為加入蛋白后5mins至24h(如5mins、15mins、30mins、60mins、2h、4h、12h、24h)。
本發(fā)明多肽隨機文庫容量達到1×106以上。本發(fā)明以增強型的綠色熒光蛋白為示蹤,篩選方法簡單,可以進行高通量的篩選。本發(fā)明隨機文庫篩選可得到能進入細胞的多肽,具有廣泛的用途。
將篩選出的CPP分別進行細胞膜穿透實驗。
本發(fā)明細胞穿透多肽的細胞穿透實驗方法如下使用常規(guī)液體培養(yǎng)基(如DMEM、RPMI1640)將純化得到的融合蛋白調(diào)整到一定濃度范圍,將原培養(yǎng)基吸去后,加入培養(yǎng)細胞培養(yǎng)皿/瓶,常規(guī)實驗室培養(yǎng)條件下孵育5mins到24h后,棄去上清,用滅菌緩沖液洗滌細胞,以除去培養(yǎng)液中的融合蛋白,加入適量同樣緩沖液,然后于熒光顯微鏡下觀察。
圖1顯示DNA文庫組成。
圖2是pET-14b載體示意圖。
圖3是pET-14b載體克隆/表達區(qū)序列。
圖4是pET-14b載體改造后(pET-14bMCStop/EGFP)示意圖。
圖5是隨機堿基序列插入該載體示意圖。
圖6是Tat融合蛋白在細胞內(nèi)定位熒光圖。
圖7是pET-14bMCS載體雙酶切鑒定圖。
圖8是pET-14bMCS載體測序圖。
圖9是pET-14bMCStop載體測序圖。
圖10是pET-14bMCStop/EGFP載體雙酶切鑒定圖。
圖11是隨機多肽文庫電泳圖。
圖12是隨機文庫構(gòu)建示意圖。
圖13是編號為00104的融合蛋白在細胞內(nèi)定位熒光圖。
圖14是編號為00701的融合蛋白在細胞內(nèi)定位熒光圖。
圖15是編號為01275的融合蛋白在細胞內(nèi)定位熒光圖。
圖16是編號01282的融合蛋白在細胞內(nèi)定位熒光圖。
具體實施例方式
以下是本發(fā)明的實施例,但不以任何形式限制本發(fā)明。
實施例1隨機文庫的構(gòu)建。
第一步pET-14bMCS載體的構(gòu)建。這一步是在pET-14b載體多克隆位點Nde I和Xho I之間加入四個酶切位點Apa I(GGGCCC)、Kpn I(GGTACC)、Sma I(CCCGGG)和Not I(CGGCCG)。使用PCR引入突變的方法完成載體構(gòu)建,其上游引物為5′-GGGCGGCCGCTCGAGGGATCCGGCTGCTAACAAAGCCCG-3′;下游引物為5′-GGGGGTACCGGGCCCCATATGGCTGCCGCGCGGCACCAG-3′。以pET-14b質(zhì)粒為模板,用Pyrobest高保真聚合酶(TaKaRa公司)進行PCR反應,反應條件為95℃ 30s;56℃ 30s;72℃ 5min。對PCR反應液進行瓊脂糖凝膠電泳,切膠回收目的DNA片段。依照TaKaRa MutanBEST Kit的操作指南,將目的片段17μl,10×Blunting Kination Buffer 2μl,Blunting Kination Enzyme Mix 1μl,37℃反應10min,對反應液進行酚/氯仿/異戊醇抽提,乙醇沉淀,無菌純水溶解沉淀。取5μl上述溶液加入等量的連接液solution I,16℃反應1h,全量反應液化學轉(zhuǎn)化DH5α感受態(tài)細菌,氨芐霉素(100μg/ml)平板篩選。挑取陽性克隆,37℃過夜搖菌,提取質(zhì)粒。由于在Nde I和Xho I之間加入了Apa I(GGGCCC)、KpnI(GGTACC)、Sma I(CCCGGG)和Not I(CGGCCG)4個酶切位點,因此,可分別用Kpn I單酶切、Kpn I和載體上另一單酶點Hind III進行雙酶切鑒定(圖7)。初步鑒定正確的質(zhì)粒進行測序,測序正確的質(zhì)粒(其測序結(jié)果如圖8)命名為pET-14bMCS。
原載體的多克隆酶切位點區(qū)域就變?yōu)樾蛄蠸EQ ID NO.3。CATCATCATCATCATCAC是編碼His-tag標簽的堿基序列,CATATG是上游的Nde I酶切位點,GGGCCC是Apa I酶切位點,GGTACC是Kpn I酶切位點,CCCGGG是Sma I酶切位點,CGGCCG是Not I酶切位點,CTCGAG和GGATCC分別是下游的Xho I和BamH I酶切位點。
第二步pET-14bMCStop載體的構(gòu)建。在pET-14bMCS載體BamH I酶切位點后加入三聯(lián)的終止密碼TAGATAACTGA。與第一步所述方法類似,設計上游引物為5′-TAGATAACTGAGGCTGCTAACAAAGCCCGAAAGGA-3′;下游引物為5′-GGATCCCTCGAGCGGCCGCCCGGG-3′,以pET-14bMCS為模板進行PCR反應。最終得到的質(zhì)粒經(jīng)測序鑒定正確,(其測序結(jié)果如圖9)命名為pET-14bMCStop。
于是原載體克隆/表達區(qū)的多克隆酶切位點部位序列變?yōu)樾蛄蠸EQ ID NO.4。CATCATCATCATCATCAC是編碼His-tag標簽的堿基序列,CATATG是上游的Nde I酶切位點,GGGCCC是Apa I酶切位點,GGTACC是Kpn I酶切位點,CCCGGG是Sma I酶切位點,CGGCCG是Not I酶切位點,CTCGAG和GGATCC分別是下游的Xho I和BamH I酶切位點,TAGATAACTGA是三聯(lián)終止密碼子。
第三步pET-14bMCStop/EGFP載體的構(gòu)建。在pET-14bMCStop載體中亞克隆入EGFP。對pET-14b/Tat-EGFP載體(EGFP編碼基因連接于該載體Kpn I和Xho I酶切位點之間。)用Kpn I和Xho I進行雙酶切,得到的EGFP片段亞克隆至相同雙酶切的pET-14bMCStop載體中。挑取的陽性克隆經(jīng)雙酶切初步鑒定(圖10),測序進一步驗證正確后,該載體命名為pET-14bMCStop/EGFP。
加入EGFP后,載體的克隆/表達區(qū)的序列見SEQ ID NO.5。
其中,CATCATCATCATCATCAC是編碼His-tag標簽的堿基序列,CATATG是上游的Nde I酶切位點,GGGCCC是Apa I酶切位點,GGTACC是Kpn I酶切位點,GTGTACAAG之間是編碼EGFP的堿基序列,CTCGAG和GGATCC分別是下游的Xho I和BamH I酶切位點,TAGATAACTGA是三聯(lián)終止密碼子。
第四步隨機多肽文庫的構(gòu)建。在pET-14bMCStop/EGFP載體Xho I和BamH I之間加入36個隨機序列。設計隨機上游引物為5′-(N)18GGATCCTAGATAACTGAGGCTGCTAACAAA-3′;隨機下游引物為5′-(N)18CTCGAGATCTGAGTCCGGCCGGACTT-3′,以pET-14bMCStop/EGFP質(zhì)粒為模板,按照第一步所述方法,進行PCR反應。得到的連接反應液經(jīng)乙醇沉淀后取1μl化學轉(zhuǎn)化至DH5α感受態(tài)細菌中,氨芐霉素平板篩選。挑取14個克隆,搖菌,取菌液做快速PCR(95℃ 30s;50℃ 30s;72℃ 2min),上游引物為CATGGTCCTGCTGGAGTTCGTG;下游引物為T7TP(GCTAGTTATTGCTCAGCGG)。同時以pET-14bMCStop/EGFP(無隨機片段插入)為模板,用相同的引物和條件進行PCR反應,產(chǎn)物用做對照??寺〉腜CR產(chǎn)物與對照一起進行2%瓊脂糖凝膠電泳(如圖11)。
該DNA文庫的克隆/表達區(qū)序列表如下tataccatgg gcagcagcca tcatcatcat catcacagca gcggcctggt gccgcgcggc60agccatatgg ggcccggtac cgtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc120atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc180gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg240cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc300taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc360caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag420ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac480ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg540gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac600ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg660ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag720aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg780gacgagctgt acaagtccgg ccggactcag atctcgag(N)36g gatcctagat aactgaggct gctaacaaag cccgaCATCATCATCATCATCAC是編碼His-tag標簽的堿基序列,CATATG是上游的Nde I酶切位點,GGGCCC是Apa I酶切位點,GGTACC是Kpn I酶切位點,GTG和TACAAG之間是編碼EGFP的堿基序列,CTCGAG是Xho I酶切位點,(N)36代表插入的36個隨機堿基,GGATCC是下游的BamH I酶切位點,TAGATAACTGA是三聯(lián)終止密碼子。
隨機文庫的構(gòu)建過程見圖12。
第五步轉(zhuǎn)化得到篩選細胞穿透多肽用的隨機表達文庫。將得到的隨機DNA文庫取2μl用電穿孔的方法轉(zhuǎn)化到BL21(DE3)感受態(tài)細菌,按《分子克隆(第三版)(英文)》,(J.Sambrook等編著)介紹方法操作,得到106數(shù)量級的隨機表達文庫,加15%甘油分裝,于-80℃凍存。
實施例2隨機文庫的構(gòu)建。
第一步pET-14bMCS載體的構(gòu)建。其構(gòu)建方法如實施例1第一步所述。
第二步pET-14bMCStop載體的構(gòu)建。其構(gòu)建方法如實施例1第一步所述。
第三步pET-14bMCStop/EGFP載體的構(gòu)建。在pET-14bMCStop載體中亞克隆入EGFP。EGFP編碼基因以pEGFP-C2載體為模板,用PCR技術(shù)進行擴增,并在該片斷5’端加入Kpn I位點,在其3’端加入Xho I位點而得到。
第四步隨機多肽文庫的構(gòu)建。其構(gòu)建方法如實施例1第一步所述。
第五步轉(zhuǎn)化得到篩選細胞穿透多肽用的隨機表達文庫。其方法如實施例1第五步所述。
實施例3pET-14b/Tat-EGFP的構(gòu)建。
第一步pET-14b/Tat載體的構(gòu)建。其構(gòu)建方法如實施例1第一步所述。
第二步pET-14b/Tat-EGFP載體的構(gòu)建。在pET-14b/Tat載體中亞克隆入EGFP。EGFP編碼基因以pEGFP-C2載體為模板,用PCR技術(shù)進行擴增,并在該片斷5’端加入Kpn I位點,在其3’端加入Xho I位點而得到。
pET-14b/Tat-EGFP的表達及其表達蛋白His-Tat-EGFP穿透細胞膜的陽性結(jié)果檢測用pET-14b/Tat-EGFP(Tat是已知的研究最廣泛的CPP,能將融合蛋白攜帶進入細胞)質(zhì)粒轉(zhuǎn)化大腸桿菌BL21(DE3),氨芐霉素平板篩選,37℃過夜孵育,次晨挑取單克隆加入1.6ml LB/Amp+(100μg/ml)培養(yǎng)基中,用48孔深孔板于37℃振搖培養(yǎng)至OD600約為0.6,然后向菌液中加入終濃度為1mmol/LIPTG誘導蛋白表達,轉(zhuǎn)移至室溫繼續(xù)振搖5h。振搖結(jié)束后將深孔板中菌液轉(zhuǎn)移至EP管中,6,000rpm、4℃離心6mins。棄上清,細菌沉淀用170μl結(jié)合緩沖液(5nmol/L咪唑,300mmol/L NaCl,160mmol/LNaH2PO4,Ph7.9)重懸,液氮/37℃反復凍融兩次,加入30μl(10mg/ml)溶菌酶(MBCHEM分裝),上下顛倒EP管數(shù)次以混勻。置于37℃水浴1h,1h后取出,以4℃,14,000g高速離心20min,上清轉(zhuǎn)移至另一EP管中,加入0.5μl預先用結(jié)合緩沖液洗兩遍的Ni2+-NTA-agarose-beads(Qiagen公司),混勻后于室溫上下顛倒慢搖1h,使蛋白將beads飽和。1h后,3,000rpm室溫離心3mins,棄上清,沉淀用洗滌緩沖液(20nmol/L咪唑,300mmol/L NaCl,160mmol/L NaH2PO4,pH7.9)洗兩遍以洗去雜蛋白,最后用15μl洗脫緩沖液(20nmol/L咪唑,300mmol/L NaCl,160mmol/L NaH2PO4,pH7.9)洗脫蛋白。將蛋白洗脫液加入%孔培養(yǎng)板Hela細胞中,用含10%胎牛血清(FBS),(美國Hyclone公司)的Dulbecco′s modified Eagle′s medium培養(yǎng)基(DMEM,HYCLONE公司)調(diào)整體積至50μl/孔,37℃細胞孵箱中放置3h后,吸去上清并用磷酸鹽緩沖液(PBS,9.0g/L NaCl,0.15g/L Na2HPO4·12H2O,0.2g/LKH2PO4,pH7.2)洗兩遍,補加PBS 100μl,熒光顯微鏡下觀察結(jié)果。觀察指標為熒光顯微鏡下肉眼可見細胞內(nèi)任何部位包括細胞膜、細胞漿以及細胞核等有綠色熒光聚集,即可認定為陽性結(jié)果。實際觀察到綠色熒光在細胞漿中聚集,呈顆粒狀分布(如圖6)。
隨機文庫的構(gòu)建。構(gòu)建方法如實施例1所述。
細胞穿透多肽的篩選。
取分裝凍存的上述隨機文庫(孵育后約能生長100個左右單克隆)均勻地鋪于氨芐霉素平板,37℃孵育14h。同時用以本實驗室已經(jīng)構(gòu)建好的質(zhì)粒pET-14b/Tat-EGFP轉(zhuǎn)化大腸桿菌BL21(DE3),鋪至氨芐霉素平板篩選,37℃孵育14h,作為本篩選方法的陽性對照。次晨挑取文庫生成的單克隆若干個(如95個),以及一個表達His-Tat-EGFP的克隆,分別加入1.6ml LB/Amp+(100μg/ml)培養(yǎng)基中,用48孔深孔板于37℃振搖培養(yǎng)至OD600約為0.6,分別取出100ml菌液加甘油凍存,以備對陽性克隆序列進行鑒定,然后分別向余下的菌液中加入終濃度為1mmol/L IPTG誘導蛋白表達,轉(zhuǎn)移至室溫繼續(xù)振搖5h。振搖結(jié)束后將深孔板中菌液轉(zhuǎn)移至EP管中,6,000rpm、4℃離心6mins。棄上清,細菌沉淀用170μl結(jié)合緩沖液(5nmol/L咪唑,300mmol/L NaCl,160mmol/L NaH2PO4,pH7.9)重懸,液氮/37℃反復凍融兩次,加入30μl(10mg/ml)溶菌酶(MBCHEM分裝),上下顛倒EP管數(shù)次以混勻。置于37℃水浴1h,1h后取出,以4℃,14,000g高速離心20min,上清轉(zhuǎn)移至另一EP管中,加入0.5μl預先用結(jié)合緩沖液洗兩遍的Ni2+-NTA-agarose-beads(Qiagen公司),混勻后于室溫上下顛倒慢搖1h,使蛋白將beads飽和。如某些克隆誘導表達得到的融合蛋白不能將besds完全飽和,則誘導更多體積的該細菌,重復上述過程。1h后,3,000rpm室溫離心3mins,棄上清,沉淀用洗滌緩沖液(20nmol/L咪唑,300mmol/LNaCl,160mmol/L NaH2PO4,pH7.9)洗兩遍以洗去雜蛋白,最后用15μl洗脫緩沖液(20nmol/L咪唑,300mmol/L NaCl,160mmol/L NaH2PO4,pH7.9)洗脫蛋白。將蛋白洗脫液加入96孔培養(yǎng)板Hela細胞中,用含10%胎牛血清(FBS),(美國Hyclone公司)的Dulbecco′s modified Eagle′s medium培養(yǎng)基(DMEM,美國Hyclone公司)調(diào)整體積至50μl/孔,37℃細胞孵箱中放置3h后,吸去上清并用磷酸鹽緩沖液(PBS,9.0g/L NaCl,0.15g/L Na2HPO4·12H2O,0.2g/L KH2PO4,pH7.2)洗兩遍,補加PBS 100μl,熒光顯微鏡下觀察結(jié)果。觀察指標為熒光顯微鏡下肉眼可見細胞內(nèi)任何部位包括細胞膜、細胞漿以及細胞核等有綠色熒光聚集,即可認定為陽性結(jié)果。
其篩選出的陽性結(jié)果編號為00104。對該克隆進行測序鑒定后得到的插入隨機堿基區(qū)域序列如下SEQ ID NO.6。該序列中TACAAG是編碼EGFP最后兩個氨基酸的密碼子,CTCGAG為Xho I酶切位點,G GAT CC為BamH I酶切位點,隨后是三聯(lián)終止密碼子,T AGG AAA AAA GAG TGT CATGTA CAT GCCCTT TA是插入的隨機堿基序列,該序列以閱讀框翻譯后氨基酸序列為SRKKECHVHAL。
這段多肽形成的融合蛋白在熒光顯微鏡下的表現(xiàn)為表達并純化的融合蛋白在加入細胞培養(yǎng)液以后3h在顯微鏡下觀察,可見細胞中彌散的有綠色熒光,并且主要定位在細胞漿中(如圖13)。
實施例4隨機文庫的構(gòu)建。隨機文庫的構(gòu)建方法如實施例2所述。
篩選方法如實施3所述。
其篩選的陽性結(jié)果編號為00701。對該克隆進行測序鑒定后得到的插入隨機堿基區(qū)域序列如下SEQID NO.7。該序列中TACAAG是編碼EGFP最后兩個氨基酸的密碼子,C TCGAG為Xho I酶切位點,GG ATC C為BamH I酶切位點,隨后是三聯(lián)終止密碼子,G CAC AGG CGA AGG GAC CTG CGT TAGATT CCC CCTC是插入的隨機堿基序列,該序列以閱讀框翻譯后氨基酸序列為RHRRRDLR。這段多肽形成的融合蛋白在熒光顯微鏡下的表現(xiàn)為表達并純化的融合蛋白在加入細胞培養(yǎng)液以后3h在顯微鏡下觀察,可見細胞中彌散的有綠色熒光,并且在胞漿胞核中均勻分布(如圖14)。
實施例5隨機文庫的構(gòu)建。隨機文庫的構(gòu)建方法如實施例1所述。
篩選方法如實施3所述。
其篩選的陽性結(jié)果編號為01275。對該克隆進行測序鑒定后得到的插入隨機堿基區(qū)域序列如下SEQID NO.8。該序列中TACAAG是編碼EGFP最后兩個氨基酸的密碼子,C TCGAAG為Xho I酶切位點突變插入了一個A,G GAT CC為BamH I酶切位點,隨后是三聯(lián)終止密碼子,AAGGTA TGG AGT GCTATA CGC TGC CTT是插入的隨機堿基序列,該序列以閱讀框翻譯后氨基酸序列為KVWSAIRCLGS。這段多肽形成的融合蛋白在熒光顯微鏡下的表現(xiàn)為表達并純化的融合蛋白在加入細胞培養(yǎng)液以后3h在顯微鏡下觀察,可見細胞膜上有綠色熒光顆粒聚集(如圖15)。
實施例6隨機文庫的構(gòu)建。隨機文庫的構(gòu)建方法如實施例1所述。
篩選方法如實施3所述。
其篩選的陽性結(jié)果編號為01282。對該克隆進行測序鑒定后得到的插入隨機堿基區(qū)域序列如下SEQID NO.9。該序列中TACAAG是編碼EGFP最后兩個氨基酸的密碼子,C TCGAG為Xho I酶切位點,GGAT CC為BamH I酶切位點,隨后是三聯(lián)終止密碼子,G CAC GTG AAG GGT TGC ATC TTG GAACAT ATC C是插入的隨機堿基序列,該序列以閱讀框翻譯后氨基酸序列為RHVKGCILEHIRILDN。這段多肽形成的融合蛋白在熒光顯微鏡下的表現(xiàn)為表達并純化的融合蛋白在加入細胞培養(yǎng)液以后3h在顯微鏡下觀察,可見細胞漿中有綠色熒光聚集形成粗顆粒(如圖16),核區(qū)則形成暗區(qū)。
序列表<110>南方醫(yī)科大學<120>一種多肽隨機文庫及其構(gòu)建方法和從該文庫中篩選細胞穿透多肽的方法<160>10<170>PatentIn Version 3.1<210>1<211>797<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>1atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac60ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac120ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc180ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag240cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc300ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg360gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac420aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac480ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc540gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac600tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc660ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtcc720ggccggactc agatctcgag ctcaagcttc gaattctgca gtcgacggta ccgcgggccc780gggatccacc ggatcta 797<210>2<211>853<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>2tataccatgg gcagcagcca tcatcatcat catcacagca gcggcctggt gccgcgcggc60agccatatgg ggcccggtac cgtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc120atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc180gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg240cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc300taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc360
caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 420ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 480ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 540gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 600ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 660ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 720aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 780gacgagctgt acaagtccgg ccggactcag atctcgagga tcctagataa ctgaggctgc 840taacaaagcc cga 853<210>3<211>104<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>3tataccatgg gcagcagcca tcatcatcat catcacagca gcggcctggt gccgcgcggc 60agccatatgg ggcccggtac ccccgggcgg ccgctcgagg atcc 104<210>4<211>124<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>4tataccatgg gcagcagcca tcatcatcat catcacagca gcggcctggt gccgcgcggc 60agccatatgg ggcccggtac ccccgggcgg ccgctcgagg atcctagata actgaggctg 120ctaa 124<210>5<211>853<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>5tataccatgg gcagcagcca tcatcatcat catcacagca gcggcctggt gccgcgcggc 60
agccatatgg ggcccggtac cgtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 120atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 180gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 240cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 300taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 360caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 420ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 480ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 540gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 600ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 660ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 720aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 780gacgagctgt acaagtccgg ccggactcag atctcgagga tcctagataa ctgaggctgc 840taacaaagcc cga 853<210>6<211>95<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>6tacaagtccg gccggactca gatctcgagt aggaaaaaag agtgtcatgt acatgccctt 60taggatccta gataactgag gctgctaaca aagcc 95<210>7<211>97<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>7tacaagtccg gccggactca gatctcgagg cacaggcgaa gggacctgcg ttagattccc 60cctcggatcc tagataactg aggctgctaa caaagcc 97<210>8<211>87<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>8tacaagtccg gccggactca gatctcgaag gtatggagtg ctatacgctg ccttggatcc60tagataactg aggctgctaa caaagcc87<210>9<211>94<212>DNA<213>人工序列<220>
<223>人工序列描述基因片斷<400>9tacaagtccg gccggactca gatctcgagg cacgtgaagg gttgcatctt ggaacatatc60cggatcctag ataactgagg ctgctaacaa agcc9權(quán)利要求
1.一種多肽隨機文庫,其中每個融合蛋白組成為用于純化融合蛋白的標簽、示蹤蛋白和隨機多肽,所述的示蹤蛋白連接在用于純化融合蛋白的標簽的羧基末端,隨機多肽連接至示蹤蛋白的羧基末端。
2.權(quán)利要求1所述的多肽隨機文庫,其特征是用于純化融合蛋白的標簽為組氨酸標簽。
3.權(quán)利要求1所述的多肽隨機文庫,其特征是示蹤蛋白為增強型的綠色熒光蛋白。
4.權(quán)利要求1所述的多肽隨機文庫,其特征是隨機多肽是一段含三十個以下(包括三十)的隨機氨基酸序列。
5.權(quán)利要求1至4其中之一所述的多肽隨機文庫的構(gòu)建方法,含有以下步驟a)對原核表達載體進行改造,在多克隆位點引入四個多克隆酶切位點;b)引入三聯(lián)終止密碼子;c)在載體中引入編碼作為示蹤蛋白的基因序列;d)在載體中引入隨機序列;e)將上述所得的載體進行表達得到多肽隨機文庫。
6.權(quán)利要求5所述的多肽隨機文庫的構(gòu)建方法,其特征是原核表達載體為pET-14b載體。
7.權(quán)利要求5所述的多肽隨機文庫的構(gòu)建方法,其特征是編碼作為示蹤蛋白的基因序列為SEQ IDNO.1。
8.從權(quán)利要求1至4其中之一所述的多肽隨機文庫中篩選細胞穿透多肽的方法含有以下步驟a)將多肽隨機文庫進行誘導表達并純化得到純化蛋白;b)將純化蛋白加入培養(yǎng)細胞進行孵育;c)將步驟b孵育的結(jié)果在熒光顯微鏡下觀察,篩選出其中有綠色熒光在細胞中蓄積的多肽即為細胞穿透多肽。
9.權(quán)利要求8所述的從多肽隨機文庫中篩選細胞穿透多肽的方法,其特征是培養(yǎng)細胞為貼壁培養(yǎng)的細胞。
10.權(quán)利要求8所述的從多肽隨機文庫中篩選細胞穿透多肽的方法,其特征是步驟c中篩選以Tat蛋白作為陽性對照。
全文摘要
本發(fā)明一種多肽隨機文庫,涉及生物醫(yī)藥領域。本發(fā)明多肽隨機文庫中任何一個融合蛋白組成為用于純化融合蛋白的標簽、示蹤蛋白和隨機多肽,其中示蹤蛋白連接在用于純化融合蛋白的標簽的羧基末端,隨機多肽連接至示蹤蛋白的羧基末端。本發(fā)明還提供了多肽隨機文庫的構(gòu)建方法及從該文庫中篩選細胞穿透多肽的方法。本發(fā)明多肽隨機文庫容量達到1×10
文檔編號C12P21/00GK1733806SQ20051003687
公開日2006年2月15日 申請日期2005年9月1日 優(yōu)先權(quán)日2005年9月1日
發(fā)明者姜勇, 劉亞偉, 劉瑜, 劉靖華, 鄧鵬 , 李海玉 申請人:南方醫(yī)科大學