專利名稱:耐高溫外切多磷酸酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫外切多磷酸酶基因及其編碼的多肽和制備方法。
背景技術(shù):
外切多磷酸酶(exopolyphosphatases)的作用是催化如后反應(yīng)N{聚磷酸鹽}+H(2)O=(N-1){聚磷酸鹽}+磷酸鹽。
現(xiàn)在研究揭示了無機物的多磷酸鹽(從細(xì)菌和酵母中了解),屬于正磷酸鹽殘基,是一種高能量線性的聚合體,同時,它也存在于高等的真核細(xì)胞中??墒?,它是哺乳動物的細(xì)胞中新陳代謝的酶的基礎(chǔ),仍然是不為人們所了解的。有證據(jù)表明,第一次提取的是從小牛腸的堿磷酸酶是一種外切多磷酸酶。
外切多磷酸酶能夠分解聚合磷分子,在最適的PH值為堿性范圍內(nèi),2價的陽離子在催化的作用中不是必要的。但是,它能抑制聚合磷的降解。不管是在堿性和自然的PH范圍內(nèi),隨著增加聚合物鏈的長度,這個酶特殊的活性會降低。
無機多磷酸鹽是一個線性的聚合物,在每一個已經(jīng)檢查的生物體內(nèi)都發(fā)現(xiàn)了該酶的存在。聚合磷在基因表達(dá)的調(diào)控中有指示作用(因為這個過程有聚合磷的生成),在大腸桿菌中細(xì)胞的聚合磷的含量減少到幾乎不能被發(fā)現(xiàn)的濃度,其原因是因為有過度的外切多磷酸酶的合成。同時,研究發(fā)現(xiàn)外切多磷酸酶過度合成的細(xì)胞更加對UV或絲裂酶素C敏感。在用絲裂酶素C處理后,發(fā)現(xiàn)聚合磷的積累。
多磷酸鹽已經(jīng)被發(fā)現(xiàn)有抑制ATP的構(gòu)成的作用。其作用是通過腺苷酸核苷的競爭的方式來發(fā)揮的。而且,長鏈的多磷酸鹽的作用比短磷酸鹽的抑制作用強。這就揭示了,該外切多磷酸酶有一個未知的多磷酸鹽的新陳代謝的作用即調(diào)節(jié)細(xì)胞內(nèi)的腺苷酸核苷的濃縮的作用。
綜上所述,外切多磷酸酶有分解聚合磷的功能,因而該酶能用于代謝類藥物研究、針對ATP生成的藥物的研發(fā)、以及作為基因表達(dá)調(diào)控的指示研究和應(yīng)用。
本發(fā)明涉及的騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它是由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個物種,其體內(nèi)所具有的耐高溫外切多磷酸酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫外切多磷酸酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫外切多磷酸酶活性多肽。
本發(fā)明的目的還提供了含有編碼耐高溫外切多磷酸酶的DNA的重組載體、含有前述重組載體的宿主細(xì)胞,以及生產(chǎn)該蛋白的方法。
本發(fā)明的第一方面提供了一種編碼具有耐高溫外切多磷酸酶活性的多肽的核苷酸序列。該核苷酸序列能編碼具有序列表SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與外切多磷酸酶相關(guān)。核苷酸序列具有序列表SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
本發(fā)明的第二方面提供了一種耐高溫外切多磷酸酶活性的多肽。該多肽具有序列表SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
本發(fā)明還提供了生產(chǎn)耐高溫外切多磷酸酶的方法1)分離出編碼耐高溫外切多磷酸酶的基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫外切多磷酸酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫外切多磷酸酶。
本發(fā)明涉及嗜熱厭氧菌的外切多磷酸酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫外切多磷酸酶基因。運用該基因生產(chǎn)耐高溫外切多磷酸酶的轉(zhuǎn)基因微生物或動植物,并回收獲得該基因編碼的酶。另外,本發(fā)明還提供了具有耐高溫外切多磷酸酶活性的多肽的氨基酸序列及功能等同體。同時,本發(fā)明還提供了制備,分離,純化具有耐高溫外切多磷酸酶活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;圖2是測序與數(shù)據(jù)分析流程圖。
具體實施例方式
首先,本發(fā)明提供了分離的,編碼耐高溫外切多磷酸酶活性的多肽的核苷酸分子,該核苷酸分子是通過對騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有序列表SEQ.ID NO.1所示的核苷酸序列。它編碼了具有耐高溫外切多磷酸酶活性的有301個氨基酸的多肽,該多肽的推測分子量為33477道爾頓。本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時,本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及利用重組工程技術(shù)生產(chǎn)外切多磷酸酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫外切多磷酸酶或多肽,其特征在于具有序列表SEQ.ID NO.2所示的氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫外切多磷酸酶基因”指編碼具有耐高溫外切多磷酸酶活性的多肽的核苷酸序列,如序列表SEQ.ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ IDNO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出序列表SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與序列表SEQ ID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與序列表SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進(jìn)行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫外切多磷酸酶”指具有耐高溫外切多磷酸酶活性的序列表SEQ ID NO.2序列的多肽。該術(shù)語還包括序列表SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫外切多磷酸酶相同的功能。這些變異體包括(但不限于)若干個氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個或數(shù)個氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫外切多磷酸酶的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市場上銷售的各種質(zhì)粒、粘粒、噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫外切多磷酸酶時,可以將耐高溫外切多磷酸酶基因序列可操作地連于表達(dá)調(diào)控序列,從而形成耐高溫外切多磷酸酶表達(dá)載體。該表達(dá)載體含有復(fù)制起始點和表達(dá)調(diào)控序列,啟動子,增強子和必要的加工信息位點。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書注明的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員所公知的重組DNA技術(shù)制備,如可參考Sambrook等人的做法(1989),或Ausubel等人的做法(1992)。重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動植物細(xì)胞。
本發(fā)明的耐高溫外切多磷酸酶基因全長序列或其片段通??梢杂肞CR(聚合酶鏈?zhǔn)椒磻?yīng))擴增法,重組法,或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實施例,進(jìn)一步闡述本發(fā)明。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機性,最大程度地避免產(chǎn)生斷裂熱點的問題,采用多種方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機部分酶切。物理剪切時采用不同強度處理樣品,酶切時通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機測序的文庫。同時,為了便于以后重疊群(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫)。該文庫經(jīng)兩個末端的測序在構(gòu)建完成圖(finishing)的過程中可以得到重疊群(contig)之間的關(guān)系,并可以解決較大的洞(gap)對補洞造成的困難。建庫流程見圖1。
實施例2基因組測序在完成騰沖嗜熱厭氧菌基因組的測序時,主要使用了兩種全自動測序儀ABI377和MegaBACE 1000。這兩種測序儀都是利用電泳原理進(jìn)行測序(見圖2),每次可完成96個樣品。ABI377是ABI公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測序儀。
實施例3數(shù)據(jù)分析1)Basecalling和測序質(zhì)量監(jiān)控所謂Basecalling是指從測序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測序儀上得到的是A,T,G,C四種堿基對應(yīng)的不同波長的光的強度變化軌跡(trace),需要用計算機采取一定的算法從中正確識別出不同的軌跡對應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時對這個堿基給出可信度信息,即堿基的測序質(zhì)量。在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時對測序?qū)嶒炛锌赡艹霈F(xiàn)的失誤能及時反饋。
2)序列拼接所謂序列拼接,就是把全基因組霰彈法(又稱鳥槍法)隨機測序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考??紤]到測序中存在載體的影響,需要先對樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(WatermanMS,1990)。這是一種動態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時,堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計算得到。
3)基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對基因組進(jìn)行注釋,包括進(jìn)行開放閱讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI(美國國家生物技術(shù)信息中心)的無冗余蛋白數(shù)據(jù)庫(non-redundant proteindatabase)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個基因的起始點時,將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點,可能的信號肽序列和啟動子序列等。如果在一個開放閱讀框內(nèi)出現(xiàn)多個啟動子時,一般采用第一個啟動子作為基因的起始點。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個小基因的丟失或測序錯誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點突變時,主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個蛋白質(zhì)對應(yīng)于兩個彼此相鄰的編碼序列的情況,則被認(rèn)為是一個無活性基因(假基因seudogenes),因為這說明這兩個編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動子或終止區(qū)域的開放閱讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行比對分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號肽區(qū)域。
4)補洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補洞工作,即完成整個基因組100%的測序,得到一個環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項十分具體而又繁雜的工作。主要方法包括A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對某些樣品進(jìn)行了雙向測序,即同時測序某個插入片段的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對序列在基因組上的關(guān)系一定,它們之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對序列分別位于不同的contig上時,可以確定這兩個contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計實驗提供參考。
B.長插入片段及裝備型載體粘粒(Cosmid)末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片段文庫,只對其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片段庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。
C.PCR和末端延伸(Walking)實驗根據(jù)上述步驟A和B所提供的contig的方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實驗就可以進(jìn)行了。如設(shè)計一對引物進(jìn)行PCR擴增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補洞等。
實施例4外切多磷酸酶的制備和提純根據(jù)實施例中基因注釋得到的外切多磷酸酶基因全長編碼序列(SEQ IDNO.1),設(shè)計出能擴增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點,以便構(gòu)建表達(dá)載體。以實施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-GppA。
挑取單菌落的工程菌DH5α-pGEX-2T-GppA于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE SEQ ID NO.1電泳,檢測純化效果。在33477道爾頓處的蛋白質(zhì)條帶即為外切多磷酸酶。
序列表<110>杭州華大基因研發(fā)中心<120><110>杭州華大基因研發(fā)中心<120>耐高溫外切多磷酸酶基因及其編碼的多肽和制備方法<140><141><160>2<170>PatentIn Version 3.1<210>1<211>906<212>DNA<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<220><221>gene<222>(1)...(906)<223>n=a或g或c或t<400>1atgagagtct ctgcgataga tattggaaca aattctgtca gacaattgat atgcgacgta 60gaagatggca gtttaattag attgcgtaaa gatgtaaaaa taacccgttt aggggaagga 120ttaataaaaa cgggtagact aaaccctggt gctgttcaga gaactgtgga gacgatagag 180gaatttatat caatggcaga gaaggaaggt gtagatgaga tttatgcttt tgctacttct 240gctatgagag aagctaaaaa taaggagcta tttttggata atttttcaaa atttaatata 300gcattagata tactagacgg tgatactgaa agcctatttg gctatatagg tgctgtcaaa 360gggataaaat tggataaagc gttggttatt gatataggag gagggagtac agagttagcc 420tataaaggtt ttgaatttat aaaagaaagt tttggtatag gagcagtgaa acttacagaa 480gaattcgtaa aaagtgaccc tccctcttta gaagaataca acgatatgag gctttacata 540atagatacag tggtaaattc aataggcaag tataatgaaa ttgaaaggct tgttggaatt 600ggagggacta tcacaagttt agcagcagta tcacagcaat tggaaattta ttcggaggaa 660aaagtacacg gatatgttct agagagggag gaaataaaga gaattttaga tagatttatg 720tccgtttctc ttgaggaaag gaaaaaaata gctggtcttc agccagaaag agccgatata 780ataattgctg gaacagctat tttacttact cttttagaaa tatttaataa aaaagaaatt840actgtaagcg aatgggacaa cctagaagga gcagtgttgt ataagtttgg cggtatgaat900atataa 906<210>2<211>301<212>PRT<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<400>2Met Arg Val Ser Ala Ile Asp Ile Gly Thr Asn Ser Val Arg Gln Leu1 5 10 15Ile Cys Asp Val Glu Asp Gly Ser Leu Ile Arg Leu Arg Lys Asp Val20 25 30Lys Ile Thr Arg Leu Gly Glu Gly Leu Ile Lys Thr Gly Arg Leu Asn35 40 45Pro Gly Ala Val Gln Arg Thr Val Glu Thr Ile Glu Glu Phe Ile Ser50 55 60Met Ala Glu Lys Glu Gly Val Asp Glu Ile Tyr Ala Phe Ala Thr Ser65 70 75 80Ala Met Arg Glu Ala Lys Asn Lys Glu Leu Phe Leu Asp Asn Phe Ser85 90 95Lys Phe Asn Ile Ala Leu Asp Ile Leu Asp Gly Asp Thr Glu Ser Leu100 105 110Phe Gly Tyr Ile Gly Ala Val Lys Gly Ile Lys Leu Asp Lys Ala Leu115 120 125Val Ile Asp Ile Gly Gly Gly Ser Thr Glu Leu Ala Tyr Lys Gly Phe130 135 140Glu Phe Ile Lys Glu Ser Phe Gly Ile Gly Ala Val Lys Leu Thr Glu145 150 155 160Glu Phe Val Lys Ser Asp Pro Pro Ser Leu Glu Glu Tyr Asn Asp Met165 170 175Arg Leu Tyr Ile Ile Asp Thr Val Val Asn Ser Ile Gly Lys Tyr Asn180 185 190Glu Ile Glu Arg Leu Val Gly Ile Gly Gly Thr Ile Thr Ser Leu Ala195 200 205Ala Val Ser Gln Gln Leu Glu Ile Tyr Ser Glu Glu Lys Val His Gly210 215 220Tyr Val Leu Glu Arg Glu Glu Ile Lys Arg Ile Leu Asp Arg Phe Met225 230 235 240Ser Val Ser Leu Glu Glu Arg Lys Lys Ile Ala Gly Leu Gln Pro Glu245 250 255Arg Ala Asp Ile Ile Ile Ala Gly Thr Ala Ile Leu Leu Thr Leu Leu260 265 270Glu Ile Phe Asn Lys Lys Glu Ile Thr Val Ser Glu Trp Asp Asn Leu275 280 285Glu Gly Ala Val Leu Tyr Lys Phe Gly Gly Met Asn Ile290 295 300
權(quán)利要求
1.一種分離的DNA分子,其特征在于是編碼具有耐高溫外切多磷酸酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或該多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫外切多磷酸酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
4.一種分離出的多肽,其特征在于它具有耐高溫外切多磷酸酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫外切多磷酸酶的方法,其特征在于該方法包括如下步驟1)分離出編碼耐高溫外切多磷酸酶的基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫外切多磷酸酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫外切多磷酸酶。
全文摘要
本發(fā)明公開了一種耐高溫外切多磷酸酶基因及其編碼的多肽和制備方法。它涉及編碼具有耐高溫外切多磷酸酶活性或其功能等同變異體的分離的DNA及利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫外切多磷酸酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫外切多磷酸酶基因。利用該基因生產(chǎn)耐高溫外切多磷酸酶的轉(zhuǎn)基因微生物或轉(zhuǎn)基因動植物,并回收獲得該基因編碼的酶。另外,本發(fā)明還提供了具有耐高溫外切多磷酸酶活性的多肽的氨基酸序列及功能等同體。同時,提供了制備、分離、純化具有耐高溫外切多磷酸酶活性的多肽的方法。
文檔編號C12N15/52GK1379095SQ0211135
公開日2002年11月13日 申請日期2002年4月12日 優(yōu)先權(quán)日2002年4月12日
發(fā)明者于軍, 王俊, 張小英, 韓華, 王光信 申請人:杭州華大基因研發(fā)中心