專利名稱:基于冠狀病毒主蛋白酶切割的表達載體及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及基因工程領(lǐng)域,更具體地說,本發(fā)明涉及包含冠狀病毒主蛋白酶特異性切割序列的表達載體及其應(yīng)用。
背景技術(shù):
現(xiàn)代的生物化學、蛋白質(zhì)組學的研究,以及工業(yè)蛋白質(zhì)產(chǎn)品的生產(chǎn)都要求大量、高效地獲取所需的蛋白質(zhì)原料。過去,人們從大自然中提取和分離蛋白質(zhì)。但是,能從自然界中獲取的蛋白質(zhì)量相當有限,分離純化困難,工藝復(fù)雜,且成本高昂,其蛋白質(zhì)產(chǎn)量遠不能滿足人們的需求。進入基因工程時代以后,為了解決這一供需之間的矛盾,人們開發(fā)了各類原核、真核的體外表達系統(tǒng)。
谷胱甘肽S-轉(zhuǎn)移酶(Glutathione S-transferase,GST)基因融合系統(tǒng)就是其中之一(GST Gene Fusion System,Third Edition,Revision 2,Amersham Pharmacia Biotech Inc.)。該系統(tǒng)包括三個主要部分pGEX質(zhì)粒載體,兩個GST純化模塊和GST檢測模塊,并使用一系列帶有特異性識別位點的蛋白酶作為輔助。GST基因融合系統(tǒng)的質(zhì)粒載體具有啟動子、多克隆位點以及用以切割的特異性蛋白酶的識別位點。此特異性識別位點緊鄰pGEX質(zhì)粒上的多克隆位點,并處于其上游。
在大腸桿菌中表達的具有完整酶活性的GST通常是一個26kDa大小的蛋白質(zhì)。包含完整GST氨基酸序列的融合蛋白同樣具有GST酶活性,并依然能形成二聚體。GST融合蛋白可以通過親和層析得以純化,然后使用特異性位點蛋白酶將目標蛋白切割下來。GST融合蛋白的檢測通常采用比色測定和免疫檢測的方式來進行。
目前,常用的從融合蛋白質(zhì)上切割目標蛋白的酶包括前切割蛋白酶(PreScission Protease,即GST蛋白和人類鼻病毒3C蛋白酶(humanrhinovirus 3C protease)的融合酶)、凝血酶(Thrombin)以及Xa因子(Factor Xa)。
現(xiàn)有的GST融合蛋白表達載體,其配套工具酶識別位點通常只編碼6~8個氨基酸,如pGEX-6p-1載體的配套工具酶人類鼻病毒3C蛋白酶識別序列為8個氨基酸,pGEX-4T-1載體的配套工具酶凝血酶的識別序列為6個氨基酸。其中,人類鼻病毒3C蛋白酶還可能會與RNA結(jié)合(Anand,K.,Palm,G.J.,Mesters,J.R.,Siddell,S.G.,Ziebuhr,J.& Hilgenfeld,R.(2002)Embo J.,21,3213-24.),在提純過程中需考慮除去核酸。
SARS是一種對人類具有巨大威脅的烈性傳染病。一種新型的冠狀病毒目前已經(jīng)被確認是嚴重急性呼吸系統(tǒng)綜合征(Severe Acute RespiratorySyndrome,簡稱為SARS)的元兇,并被命名為SARS冠狀病毒(簡稱為SARS-CoV)。SARS冠狀病毒在種屬分類上屬于“Nidovirales”目、“Coronaviridae”科、“Coronavirus”屬。它是冠狀病毒家族中新出現(xiàn)的一個變種,全長29,736bp(Urbani Strain)。
根據(jù)血清學分類,冠狀病毒家族(冠狀病毒屬)共包括四種類型(Group)。I型包括豬傳染性胃腸炎病毒(porcine transmissiblegastroenteritis virus,簡稱為TGEV)、人冠狀病毒(human coronavirus,簡稱為HCoV)毒株229E、貓傳染性腹膜炎病毒(Feline infectiousperitonitis virus,簡稱為FIPV)等;II型包括牛冠狀病毒(Bovinecoronavirus,簡稱為BCoV)、鼠肝炎病毒(Murine hepatitis virus,簡稱為MHV)等;III型目前只包括三種病毒,其中一種被稱為禽傳染性支氣管炎病毒(Avian Infectious Bronchitis Virus,簡稱為AIBV);SARS-CoV則屬于IV型。各類冠狀病毒對人、畜的生命健康有巨大威脅。
冠狀病毒,例如SARS-CoV和AIBV,在轉(zhuǎn)錄復(fù)制過程中會編碼兩條多蛋白片段,稱為pp1a和pp1ab。冠狀病毒的主蛋白酶能對這些片段進行切割,釋放出活性片段,從而使病毒進行自我復(fù)制。在長期的進化過程中,被切割的底物與主蛋白酶進行著相互選擇,使底物序列與冠狀病毒主蛋白酶的結(jié)構(gòu)相互適應(yīng),且底物序列具有相當高的保守性。
發(fā)明內(nèi)容
本發(fā)明部分地基于如下發(fā)現(xiàn),即SARS-CoV以及AIBV主蛋白酶所切割的底物序列特異性很高,而且相當保守。
因此,本發(fā)明一方面提供了一種表達載體,其中包含一段核苷酸序列,所述核苷酸序列編碼SEQ ID NO1所示的氨基酸序列。所述核苷酸序列所編碼的特異性切割位點可用于對親和層析后的融合蛋白質(zhì)的切割,以獲得高純度的目標蛋白;也可用于向目標蛋白中引入特異性切割位點,從而實現(xiàn)對目標蛋白的定點切割。
在本發(fā)明的一些優(yōu)選實施方式中,所述表達載體中還可以包含編碼親和標簽的基因,例如GST基因、His-Tag基因、麥芽糖結(jié)合蛋白(MaltoseBinding Protein)基因和硫氧還蛋白基因(thioredoxin),以便于利用親和層析方便地純化包含目標蛋白的融合蛋白。在本發(fā)明的一種特別優(yōu)選的實施方式中,所述表達載體中包含GST基因。
本發(fā)明另一方面提供了一種制備重組蛋白的方法,該方法包括1)將目標蛋白基因克隆到本發(fā)明所提供的表達載體中,所述表達載體中包含編碼SEQ ID NO1所示的氨基酸序列的核苷酸序列;2)利用步驟1)中所獲得的表達載體轉(zhuǎn)化宿主細胞;3)培養(yǎng)步驟2)中所獲得的宿主細胞;4)通過親和層析,從步驟3)中所獲得的細胞中分離純化出包含目標蛋白的重組融合蛋白;5)利用禽傳染性支氣管炎病毒主蛋白酶或SARS冠狀病毒主蛋白酶對步驟4)中所獲得的重組融合蛋白進行切割,得到目標蛋白。這種方法利用禽傳染性支氣管炎病毒主蛋白酶或SARS冠狀病毒主蛋白酶作為工具酶,一步純化獲得高純度的目標蛋白。
本發(fā)明又一方面提供了一種試劑盒,其中包含本發(fā)明所提供的表達載體以及一種工具酶,所述表達載體中包含編碼SEQ ID NO1所示的氨基酸序列的核苷酸序列,所述工具酶選自由禽傳染性支氣管炎病毒主蛋白酶和SARS冠狀病毒主蛋白酶所構(gòu)成的組。
本發(fā)明再一方面提供了一種向目標蛋白中引入特異性切割位點的方法,該方法包括向包含該目標蛋白編碼基因的表達載體中,引入一段核苷酸序列,所述核苷酸序列編碼SEQ ID NO1所示的氨基酸序列。
利用本發(fā)明所述的載體和方法進行重組蛋白的表達,具有高效、穩(wěn)定的特點。在一個優(yōu)選實施例中,用1升細菌懸浮培養(yǎng)物表達鈣結(jié)合蛋白Calbindin D28k,通過GST親和層析一步純化,并按~0.1mg/ml膠的量加入AIBV主蛋白酶于4℃切割20小時左右可獲得70~80mg CalbindinD28k。作為配套工具酶的禽傳染性支氣管炎病毒主蛋白酶和SARS冠狀病毒主蛋白酶,不僅具有高效酶活,而且未有和RNA結(jié)合的報道,使用方便、簡單。其識別位點包含約11個氨基酸,識別特異性高。
附圖不一定是成比例的,其目的僅僅在于更好地解釋本發(fā)明,以便于讀者理解。將附圖與具體實施方式
結(jié)合在一起考慮,可以更好地理解本發(fā)明。
圖1是pGSTM載體的結(jié)構(gòu)示意圖。該載體通過對現(xiàn)有的GST融合蛋白表達載體pGEX-6p-1進行改造,在GST位點下游引入編碼TSAVLQSGFRK氨基酸序列的DNA序列替換掉原有的酶切位點而得到。除TSAVLQSGFRK的編碼序列外,該載體還具有其它必要的基因元件,包括氨芐青霉素標簽Ampr、啟動子序列l(wèi)ac Iq、GST蛋白編碼區(qū)、復(fù)制起始位點pBR322 ori以及若干限制性內(nèi)切酶的切割位點。
圖2是pGSTM載體的核苷酸序列。
圖3A顯示了經(jīng)過重組表達、親和層析得到的SARS-CoV主蛋白酶的SDS-PAGE結(jié)果。泳道1為分子量標記;2為親和層析后得到的SARS-CoV主蛋白酶。
圖3B顯示了經(jīng)過重組表達,親和層析得到的AIBV主蛋白酶SDS-PAGE結(jié)果。泳道1為AIBV主蛋白酶,泳道2為分子量標記。
圖4顯示了利用基于pGEX-6p-1的pGSTM質(zhì)粒載體重組表達和純化Calbindin D28k蛋白質(zhì)過程中各階段蛋白質(zhì)組分的SDS-PAGE結(jié)果。泳道1為大腸桿菌誘導(dǎo)表達前的總蛋白;2為大腸桿菌誘導(dǎo)表達后的總蛋白;3為破菌以后的上清液;4為破菌以后離心下來的沉淀;5為分子量標記;6為經(jīng)親和層析并加入SARS-CoV主蛋白酶切割后獲得的Calbindin D28k蛋白質(zhì)。
圖5顯示了利用基于pGEX-6p-1的pGSTM質(zhì)粒載體經(jīng)過重組表達、親和層析和AIBV主蛋白酶切割后得到的Calbindin D28k蛋白質(zhì)的SDS-PAGE結(jié)果。泳道1為Calbindin D28k蛋白,泳道2為分子量標記。
具體實施例方式
為了更加詳細地解釋本發(fā)明,下面將結(jié)合附圖給出本發(fā)明的具體實施例。這些具體實施方式
僅僅是出于解釋和說明的目的,不應(yīng)該被理解為是對本發(fā)明范圍的限制。在對這些具體實施方式
進行描述時,沒有對公知的實驗方法、儀器、試劑和材料等進行詳細的描述,以避免喧賓奪主、淡化了本發(fā)明的主要內(nèi)容。
為了表述上的方便,在本文中有時將禽傳染性支氣管炎病毒主蛋白酶和SARS冠狀病毒主蛋白酶合稱為“冠狀病毒主蛋白酶”。
為得到本發(fā)明的表達載體,一種優(yōu)選的實施方式是采用PCR的方法來引入編碼冠狀病毒主蛋白酶的底物序列的核苷酸序列,例如SEQ ID NO2所示的核苷酸序列。本領(lǐng)域技術(shù)人員還可以采用定點突變等本領(lǐng)域已知的其他方法來引入所述核苷酸序列。
適用于本發(fā)明的起始表達載體包括各種原核表達載體以及真核表達載體,可以根據(jù)目標蛋白的特點進行選擇。例如,人酪氨酸酶在大腸桿菌中表達時,會遇到不能糖基化的問題,此時可能需要選擇真核表達載體;對于大部分的細菌蛋白質(zhì),使用原核表達載體通常就能取得較好的效果。
本發(fā)明所提供的新型表達載體,可用于進行目標重組蛋白的表達純化。在本發(fā)明的表達載體中加入親和標簽,可以通過親和層析來純化目標蛋白,使純化過程特別簡單。一種具體的實施方式是,首先將目標蛋白基因通過PCR擴增出來,將擴增產(chǎn)物與經(jīng)過酶切處理的表達載體連接起來,得到能夠表達包含目標蛋白與GST的融合蛋白的載體。然后將這種載體轉(zhuǎn)入大腸桿菌宿主細胞,經(jīng)過篩選后,培養(yǎng)帶有目的基因的大腸桿菌;經(jīng)過細菌富集,破碎后上親和層析柱,經(jīng)過洗脫后,其它雜蛋白流出柱外,包含GST和目標蛋白的融合蛋白留在柱內(nèi),然后用冠狀病毒主蛋白酶進行柱內(nèi)切割,最后得到純化的目標蛋白。
實施例1 基于pGEX-6p-1的pGSTM表達載體的構(gòu)建首先,采用聚合酶鏈式反應(yīng)(PCR)擴增pGEX-6p-1載體(購自Pharmacia公司)654~945位的區(qū)域,引入冠狀病毒主蛋白酶特異性的11個氨基酸切點TSAVLQSGFRK(包含于下游引物中)。其中,以pGEX-6p-1載體為模版,上游引物為5′-TTCGAAGATCGTTTATGTCATAAA-3′,下游引物為5′-GGATCCTTTCCTAAAACCACTCTGCAGAACTGCACTAGTATCC,在Ex Taq DNA聚合酶(購自TaKaRa公司)作用下進行基因片段擴增??偣策M行35次擴增循環(huán),每次循環(huán)包括95℃變性30秒,50℃復(fù)性45秒,72℃延伸60秒。
將回收后的擴增產(chǎn)物,按照標準方法,用T4 DNA連接酶(購自TaKaRa公司)連接到pMD18-T上,然后分別用Bstb I和BamH I在65℃和37℃酶切,最后將目的片段連接到用上述限制性內(nèi)切酶處理的pGEX-6p-1載體中,構(gòu)建得到表達質(zhì)粒pGSTM(4990bp)。其結(jié)構(gòu)如圖1所示,其核苷酸序列如圖2以及SEQ ID NO3所示。
實施例2 SARS-CoV主蛋白酶和AIBV主蛋白酶的表達與純化按照標準方法,將SARS-CoV主蛋白酶或AIBV主蛋白酶基因擴增后連接到質(zhì)粒載體pGEX-4T-1(購自Pharmacia公司),然后轉(zhuǎn)化大腸桿菌菌株BL21(DE3)(購自Novagen公司),之后用單克隆接種,并在含100μg/ml氨芐青霉素(Amp)的大腸桿菌菌液中,保持37℃培養(yǎng)至OD600為0.6左右,加入誘導(dǎo)劑IPTG至終濃度0.2mmol/L,16℃誘導(dǎo)過夜后,5000rmp離心10分鐘收集細胞。用緩沖液(10mmol/Lβ-巰基乙醇,1mmol/L PMSF,1×PBS)將細胞重懸,冰浴超聲破碎細胞,15000rpm離心30分鐘后,用SDS-PAGE檢測重組蛋白的表達,并用谷胱甘肽瓊脂糖4B(Glutathione Sepharose 4B)凝膠進行親和層析(GST Gene FusionSystem,Third Edition,Revision 2,Pharmacia Biotech Inc.),制備得到SARS-CoV主蛋白酶或AIBV主蛋白酶。
按照本實施例重組純化再經(jīng)親和層析得到的SARS-CoV主蛋白酶,其SDS-PAGE結(jié)果如圖3A所示。參照分子量標記1,可以確定泳道2所顯示的SARS-CoV主蛋白酶大小符合預(yù)期值。
按照本實施例重組純化再經(jīng)親和層析得到的AIBV主蛋白酶,其SDS-PAGE結(jié)果如圖3B所示。參照分子量標記2,可以確定泳道1所顯示的AIBV主蛋白酶大小符合預(yù)期值。經(jīng)檢測,1升懸浮培養(yǎng)物最后可獲得純度不低于90~95%,含量~50mg的主蛋白酶。
實施例3 利用基于pGEX-6p-1的pGSTM載體構(gòu)建表達CalbindinD28k基因的載體用上游引物5’-GGATCCATGGCAGAATCCCACCTG-3’和下游引物5′-CCGCTCGAGCTAGTTATCCCCAGCACA-3′,以含Calbindin D28k基因的pGEX-6p-1質(zhì)粒為模板擴增Calbindin D28k的基因。按照標準方法,將擴增產(chǎn)物連接到pMD18-T上后,用BamH I和Xho I酶切,然后再將目的基因片段克隆到已用上述限制性內(nèi)切酶進行了酶切處理的pGSTM載體中,構(gòu)建得到表達質(zhì)粒pGSTM-Calbindin D28k。
實施例4 質(zhì)粒pGSTM-Calbindin D28k的表達純化及利用AIBV主蛋白酶切割得到Calbindin D28k蛋白按照標準方法,采用SDS-PAGE篩選出過量表達GST-Calbindin D28K重組蛋白的克隆,接著利用如下所述的一步純化法來純化得到重組的Calbindin D28k。
首先在含有100mg氨芐青霉素的LB培養(yǎng)基中接種帶有GST-Calbindin D28k重組蛋白的大腸桿菌BL21(DE3)的單菌落,在37℃培養(yǎng),直到OD600達到0.6。然后加入IPTG使其濃度達到1mmol/L,在16℃培養(yǎng)過夜,來誘導(dǎo)蛋白質(zhì)的表達。然后將此培養(yǎng)液離心,收集得到的細胞被懸浮在10mmol/L β-巰基乙醇和0.1mmol/L EDTA的1×PBS中,進行冰浴超聲破碎。得到的菌液再在4℃以15000rpm離心30分鐘。上清液上樣至經(jīng)過1×PBS溶液平衡之后的2mL的GST-谷胱甘肽親和柱(購自Pharmacia),再用30倍柱體積的1×PBS洗脫不具親和性的自由蛋白。最后按0.1mg/mL膠的量加入AIBV主蛋白酶或SARS-CoV主蛋白酶,在4℃酶切20小時后收集目的蛋白,并用SDS-PAGE檢測純度。
用pGSTM載體表達純化重組蛋白Calbindin D28k過程各步驟中蛋白質(zhì)組分的SDS-PAGE結(jié)果如圖4所示。參照分子量標記5,可以發(fā)現(xiàn)泳道2所顯示的大腸桿菌經(jīng)誘導(dǎo)表達后總蛋白較之泳道1所顯示的誘導(dǎo)表達前有約54kD的蛋白質(zhì)大量出現(xiàn)。。
經(jīng)過親和層析和AIBV主蛋白酶切割之后的SDS-PAGE結(jié)果如圖5所示。參照分子量標記2,可以確定泳道1顯示的目標蛋白Calbindin D-28k的大小符合預(yù)期值。經(jīng)檢測,用1升大腸桿菌BL21(DE3)懸浮培養(yǎng)物表達Calbindin D28k,按0.1mg/ml膠的量加入AIBV主蛋白酶,于4℃酶切20小時左右可一步純化獲得70~80mg Calbindin D28k。
上述實施例中所涉及的具體實驗方法可以參考Molecular CloningALABORATORY MANUAL(3rd Edition)(J.Sambrook,P.MacCallum,D.Russell,Cold Spring Harber Laboratory Press,2001)以及黃培堂等(2002)譯的《分子克隆實驗指南》。
本文中所涉及的參考文獻,包括專利文件、學術(shù)論文、出版物等,均以引用的方式將其全部內(nèi)容包括在本文中。
應(yīng)當注意,本發(fā)明中所涉及的各種實驗操作,均為本領(lǐng)域的常規(guī)技術(shù),如果在文中沒有特別說明,則本領(lǐng)域的普通技術(shù)人員可以參照本發(fā)明申請日之前的各種常用工具書、科技文獻或相關(guān)的說明書、手冊等加以實施。
本文中所涉及的各種實驗用品(包括但不限于化學試劑、生物制品、細胞、生物體、儀器等)之中,對于那些特殊的或不易獲得的,文中均已注明了制造商、參考文獻或詳細的制備方法;未經(jīng)特別說明的,均為常規(guī)實驗用品,在本發(fā)明申請日之前,可以通過各種方式(例如購買、自行制備等)很方便地獲得。
應(yīng)當理解,在不偏離本發(fā)明的精神和范圍的情況下,本領(lǐng)域的普通技術(shù)人員可以在形式和細節(jié)上對其做出各種改變和改進,而這些均被認為落入了本發(fā)明的保護范圍。例如,根據(jù)密碼子簡并原則或堿基互補原則所獲得的功能基本相同的核酸分子,以及在對蛋白質(zhì)功能不起主要作用的位點上進行氨基酸替換所得到的功能基本相同的蛋白質(zhì)或多肽,均被認為落入了本發(fā)明的保護范圍。
序列表<110>清華大學<120>基于冠狀病毒主蛋白酶切割的表達載體及其應(yīng)用<160>3<210>1<211>11<212>PRT<213>冠狀病毒(Coronavirus)<400>1Thr Ser Ala Val Leu Gln Ser Gly Phe Arg Lys1 5 10<210>2<211>33<212>DNA<213>冠狀病毒(Coronavirus)<400>2ACTAGTGCAG TTCTGCAGAG TGGTTTTAGG AAA 33<210>3<211>4990<212>DNA<213>人工序列<400>3ACGTTATCGA CTGCACGGTG CACCAATGCT TCTGGCGTCA GGCAGCCATC GGAAGCTGTG60GTATGGCTGT GCAGGTCGTA AATCACTGCA TAATTCGTGT CGCTCAAGGC GCACTCCCGT120TCTGGATAAT GTTTTTTGCG CCGACATCAT AACGGTTCTG GCAAATATTC TGAAATGAGC180TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA240CACAGGAAAC AGTATTCATG TCCCCTATAC TAGGTTATTG GAAAATTAAG GGCCTTGTGC300AACCCACTCG ACTTCTTTTG GAATATCTTG AAGAAAAATA TGAAGAGCAT TTGTATGAGC360
GCGATGAAGG TGATAAATGG CGAAACAAAA AGTTTGAATT GGGTTTGGAG TTTCCCAATC420TTCCTTATTA TATTGATGGT GATGTTAAAT TAACACAGTC TATGGCCATC ATACGTTATA480TAGCTGACAA GCACAACATG TTGGGTGGTT GTCCAAAAGA GCGTGCAGAG ATTTCAATGC540TTGAAGGAGC GGTTTTGGAT ATTAGATACG GTGTTTCGAG AATTGCATAT AGTAAAGACT600TTGAAACTCT CAAAGTTGAT TTTCTTAGCA AGCTACCTGA AATGCTGAAA ATGTTCGAAG660ATCGTTTATG TCATAAAACA TATTTAAATG GTGATCATGT AACCCATCCT GACTTCATGT720TGTATGACGC TCTTGATGTT GTTTTATACA TGGACCCAAT GTGCCTGGAT GCGTTCCCAA780AATTAGTTTG TTTTAAAAAA CGTATTGAAG CTATCCCACA AATTGATAAG TACTTGAAAT840CCAGCAAGTA TATAGCATGG CCTTTGCAGG GCTGGCAAGC CACGTTTGGT GGTGGCGACC900ATCCTCCAAA ATCGGATACT AGTGCAGTTC TGCAGAGTGG TTTTAGGAAA GGATCCCCGG960AATTCCCGGG TCGACTCGAG CGGCCGCATC GTGACTGACT GACGATCTGC CTCGCGCGTT1020TCGGTGATGA CGGTGAAAAC CTCTGACACA TGCAGCTCCC GGAGACGGTC ACAGCTTGTC1080TGTAAGCGGA TGCCGGGAGC AGACAAGCCC GTCAGGGCGC GTCAGCGGGT GTTGGCGGGT1140GTCGGGGCGC AGCCATGACC CAGTCACGTA GCGATAGCGG AGTGTATAAT TCTTGAAGAC1200GAAAGGGCCT CGTGATACGC CTATTTTTAT AGGTTAATGT CATGATAATA ATGGTTTCTT1260AGACGTCAGG TGGCACTTTT CGGGGAAATG TGCGCGGAAC CCCTATTTGT TTATTTTTCT1320AAATACATTC AAATATGTAT CCGCTCATGA GACAATAACC CTGATAAATG CTTCAATAAT1380ATTGAAAAAG GAAGAGTATG AGTATTCAAC ATTTCCGTGT CGCCCTTATT CCCTTTTTTG1440CGGCATTTTG CCTTCCTGTT TTTGCTCACC CAGAAACGCT GGTGAAAGTA AAAGATGCTG1500AAGATCAGTT GGGTGCACGA GTGGGTTACA TCGAACTGGA TCTCAACAGC GGTAAGATCC1560TTGAGAGTTT TCGCCCCGAA GAACGTTTTC CAATGATGAG CACTTTTAAA GTTCTGCTAT1620GTGGCGCGGT ATTATCCCGT GTTGACGCCG GGCAAGAGCA ACTCGGTCGC CGCATACACT1680ATTCTCAGAA TGACTTGGTT GAGTACTCAC CAGTCACAGA AAAGCATCTT ACGGATGGCA1740TGACAGTAAG AGAATTATGC AGTGCTGCCA TAACCATGAG TGATAACACT GCGGCCAACT1800TACTTCTGAC AACGATCGGA GGACCGAAGG AGCTAACCGC TTTTTTGCAC AACATGGGGG1860ATCATGTAAC TCGCCTTGAT CGTTGGGAAC CGGAGCTGAA TGAAGCCATA CCAAACGACG1920AGCGTGACAC CACGATGCCT GCAGCAATGG CAACAACGTT GCGCAAACTA TTAACTGGCG1980AACTACTTAC TCTAGCTTCC CGGCAACAAT TAATAGACTG GATGGAGGCG GATAAAGTTG2040CAGGACCACT TCTGCGCTCG GCCCTTCCGG CTGGCTGGTT TATTGCTGAT AAATCTGGAG2100CCGGTGAGCG TGGGTCTCGC GGTATCATTG CAGCACTGGG GCCAGATGGT AAGCCCTCCC2160GTATCGTAGT TATCTACACG ACGGGGAGTC AGGCAACTAT GGATGAACGA AATAGACAGA2220TCGCTGAGAT AGGTGCCTCA CTGATTAAGC ATTGGTAACT GTCAGACCAA GTTTACTCAT2280ATATACTTTA GATTGATTTA AAACTTCATT TTTAATTTAA AAGGATCTAG GTGAAGATCC2340TTTTTGATAA TCTCATGACC AAAATCCCTT AACGTGAGTT TTCGTTCCAC TGAGCGTCAG2400ACCCCGTAGA AAAGATCAAA GGATCTTCTT GAGATCCTTT TTTTCTGCGC GTAATCTGCT2460GCTTGCAAAC AAAAAAACCA CCGCTACCAG CGGTGGTTTG TTTGCCGGAT CAAGAGCTAC2520CAACTCTTTT TCCGAAGGTA ACTGGCTTCA GCAGAGCGCA GATACCAAAT ACTGTCCTTC2580TAGTGTAGCC GTAGTTAGGC CACCACTTCA AGAACTCTGT AGCACCGCCT ACATACCTCG2640
CTCTGCTAAT CCTGTTACCA GTGGCTGCTG CCAGTGGCGA TAAGTCGTGT CTTACCGGGT2700TGGACTCAAG ACGATAGTTA CCGGATAAGG CGCAGCGGTC GGGCTGAACG GGGGGTTCGT2760GCACACAGCC CAGCTTGGAG CGAACGACCT ACACCGAACT GAGATACCTA CAGCGTGAGC2820TATGAGAAAG CGCCACGCTT CCCGAAGGGA GAAAGGCGGA CAGGTATCCG GTAAGCGGCA2880GGGTCGGAAC AGGAGAGCGC ACGAGGGAGC TTCCAGGGGG AAACGCCTGG TATCTTTATA2940GTCCTGTCGG GTTTCGCCAC CTCTGACTTG AGCGTCGATT TTTGTGATGC TCGTCAGGGG3000GGCGGAGCCT ATGGAAAAAC GCCAGCAACG CGGCCTTTTT ACGGTTCCTG GCCTTTTGCT3060GGCCTTTTGC TCACATGTTC TTTCCTGCGT TATCCCCTGA TTCTGTGGAT AACCGTATTA3120CCGCCTTTGA GTGAGCTGAT ACCGCTCGCC GCAGCCGAAC GACCGAGCGC AGCGAGTCAG3180TGAGCGAGGA AGCGGAAGAG CGCCTGATGC GGTATTTTCT CCTTACGCAT CTGTGCGGTA3240TTTCACACCG CATAAATTCC GACACCATCG AATGGTGCAA AACCTTTCGC GGTATGGCAT3300GATAGCGCCC GGAAGAGAGT CAATTCAGGG TGGTGAATGT GAAACCAGTA ACGTTATACG3360ATGTCGCAGA GTATGCCGGT GTCTCTTATC AGACCGTTTC CCGCGTGGTG AACCAGGCCA3420GCCACGTTTC TGCGAAAACG CGGGAAAAAG TGGAAGCGGC GATGGCGGAG CTGAATTACA3480TTCCCAACCG CGTGGCACAA CAACTGGCGG GCAAACAGTC GTTGCTGATT GGCGTTGCCA3540CCTCCAGTCT GGCCCTGCAC GCGCCGTCGC AAATTGTCGC GGCGATTAAA TCTCGCGCCG3600ATCAACTGGG TGCCAGCGTG GTGGTGTCGA TGGTAGAACG AAGCGGCGTC GAAGCCTGTA3660AAGCGGCGGT GCACAATCTT CTCGCGCAAC GCGTCAGTGG GCTGATCATT AACTATCCGC3720TGGATGACCA GGATGCCATT GCTGTGGAAG CTGCCTGCAC TAATGTTCCG GCGTTATTTC3780TTGATGTCTC TGACCAGACA CCCATCAACA GTATTATTTT CTCCCATGAA GACGGTACGC3840GACTGGGCGT GGAGCATCTG GTCGCATTGG GTCACCAGCA AATCGCGCTG TTAGCGGGCC3900CATTAAGTTC TGTCTCGGCG CGTCTGCGTC TGGCTGGCTG GCATAAATAT CTCACTCGCA3960ATCAAATTCA GCCGATAGCG GAACGGGAAG GCGACTGGAG TGCCATGTCC GGTTTTCAAC4020AAACCATGCA AATGCTGAAT GAGGGCATCG TTCCCACTGC GATGCTGGTT GCCAACGATC4080AGATGGCGCT GGGCGCAATG CGCGCCATTA CCGAGTCCGG GCTGCGCGTT GGTGCGGATA4140TCTCGGTAGT GGGATACGAC GATACCGAAG ACAGCTCATG TTATATCCCG CCGTCAACCA4200CCATCAAACA GGATTTTCGC CTGCTGGGGC AAACCAGCGT GGACCGCTTG CTGCAACTCT4260CTCAGGGCCA GGCGGTGAAG GGCAATCAGC TGTTGCCCGT CTCACTGGTG AAAAGAAAAA4320CCACCCTGGC GCCCAATACG CAAACCGCCT CTCCCCGCGC GTTGGCCGAT TCATTAATGC4380AGCTGGCACG ACAGGTTTCC CGACTGGAAA GCGGGCAGTG AGCGCAACGC AATTAATGTG4440AGTTAGCTCA CTCATTAGGC ACCCCAGGCT TTACACTTTA TGCTTCCGGC TCGTATGTTG4500TGTGGAATTG TGAGCGGATA ACAATTTCAC ACAGGAAACA GCTATGACCA TGATTACGGA4560TTCACTGGCC GTCGTTTTAC AACGTCGTGA CTGGGAAAAC CCTGGCGTTA CCCAACTTAA4620TCGCCTTGCA GCACATCCCC CTTTCGCCAG CTGGCGTAAT AGCGAAGAGG CCCGCACCGA4680TCGCCCTTCC CAACAGTTGC GCAGCCTGAA TGGCGAATGG CGCTTTGCCT GGTTTCCGGC4740ACCAGAAGCG GTGCCGGAAA GCTGGCTGGA GTGCGATCTT CCTGAGGCCG ATACTGTCGT4800CGTCCCCTCA AACTGGCAGA TGCACGGTTA CGATGCGCCC ATCTACACCA ACGTAACCTA4860TCCCATTACG GTCAATCCGC CGTTTGTTCC CACGGAGAAT CCGACGGGTT GTTACTCGCT4920
CACATTTAAT GTTGATGAAA GCTGGCTACA GGAAGGCCAG ACGCGAATTA TTTTTGATGG4980CGTTGGAATT 4990
權(quán)利要求
1.一種表達載體,其中包含一段核苷酸序列,所述核苷酸序列編碼SEQ ID NO1所示的氨基酸序列。
2.如權(quán)利要求1所述的表達載體,其中,所述核苷酸序列如SEQ IDNO2所示。
3.如權(quán)利要求1或2所述的表達載體,其中,所述表達載體中還包含GST基因和多克隆位點,并且所述核苷酸序列位于GST基因和多克隆位點之間。
4.如權(quán)利要求3所述的表達載體,其中,所述表達載體為pGSTM,其核苷酸序列如SEQ ID NO3所示。
5.如權(quán)利要求1或2所述的表達載體,其中,所述載體中還包含編碼親和標簽的基因。
6.如權(quán)利要求5所述的表達載體,其中,所述親和標簽選自由His-Tag、麥芽糖結(jié)合蛋白和硫氧還蛋白所構(gòu)成的組。
7.一種制備重組蛋白的方法,該方法包括1)將編碼目標蛋白的基因克隆到權(quán)利要求3-6之一所述的表達載體中;2)利用步驟1)中所獲得的表達載體轉(zhuǎn)化宿主細胞;3)培養(yǎng)步驟2)中所獲得的宿主細胞;4)通過親和層析,從步驟3)中所獲得的細胞中分離純化出包含目標蛋白的重組融合蛋白;5)利用禽傳染性支氣管炎病毒主蛋白酶或SARS冠狀病毒主蛋白酶對步驟4)中所獲得的重組融合蛋白進行切割,得到目標蛋白。
8.一種試劑盒,其中包含權(quán)利要求1-6之一所述的表達載體以及一種工具酶,所述工具酶選自由禽傳染性支氣管炎病毒主蛋白酶和SARS冠狀病毒主蛋白酶所構(gòu)成的組。
9.一種向目標蛋白中引入特異性切割位點的方法,該方法包括向包含該目標蛋白編碼基因的表達載體中,引入一段核苷酸序列,所述核苷酸序列編碼SEQ ID NO1所示的氨基酸序列。
10.如權(quán)利要求9所述的方法,其中,所述核苷酸序列如SEQ ID NO2所示。
全文摘要
本發(fā)明提供了一種表達載體,其中包含一段核苷酸序列,所述核苷酸序列編碼SARS-CoV以及AIBV主蛋白酶所切割的特異性底物序列。本發(fā)明的表達載體中還可以包含編碼親和標簽的基因,例如GST、His-Tag、麥芽糖結(jié)合蛋白和硫氧還蛋白。本發(fā)明還提供了一種利用所述表達載體制備重組蛋白的方法,可以利用SARS-CoV以及AIBV主蛋白酶作為工具酶,對親和層析后的融合蛋白質(zhì)進行切割,以獲得高純度的目標蛋白。本發(fā)明還提供了一種包含本發(fā)明的表達載體以及一種工具酶的試劑盒。
文檔編號C07K14/00GK1673376SQ200510063088
公開日2005年9月28日 申請日期2005年4月6日 優(yōu)先權(quán)日2004年12月10日
發(fā)明者饒子和, 楊海濤, 金英花, 薛曉宇, 楊楷林 申請人:清華大學