專(zhuān)利名稱:耐高溫二氫乳清酸脫氫酶基因序列及編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫二氫乳清酸脫氫酶基因序列及編碼的多肽和制備方法。
背景技術(shù):
二氫乳清酸脫氫酶(Dihydroorotate dehydrogenase)催化在嘧啶的從頭合成中由二氫乳清酸到乳清酸的反應(yīng),是嘧啶合成途徑中的限速酶。合成的乳清酸再與5-磷酸核糖焦磷酸作用生成乳清苷酸,脫羧后就生成尿嘧啶核苷酸。其他的嘧啶核苷酸則是由尿嘧啶核苷酸轉(zhuǎn)變而成。
這個(gè)酶最早是由Lieberman and Kornberg于1953年在厭氧細(xì)菌Zymobacterium oroticum(現(xiàn)在稱為Clostridium oroticum)的提取物中發(fā)現(xiàn)的。二氫乳清酸脫氫酶可分為兩類(lèi),1族和2族。兩族之間的同源性低于20%。1族酶氨基酸的同源性高于30%,具有催化活性的殘基是半胱氨酸,主要分布在細(xì)胞液中;2族氨基酸的同源性超過(guò)40%,具有催化活性的殘基是絲氨酸,主要分布在細(xì)胞膜附近。革蘭氏陽(yáng)性菌的二氫乳清酸脫氫酶屬于1族,真核和革蘭氏陰性菌的酶屬于2族。1族的二氫乳清酸脫氫酶又可以分為兩個(gè)小類(lèi),1A和1B。這個(gè)分類(lèi)標(biāo)準(zhǔn)最初是根據(jù)順序分的,每個(gè)小類(lèi)的順序的同源性在60%以上,后來(lái)發(fā)現(xiàn),兩個(gè)小類(lèi)在四級(jí)結(jié)構(gòu)上也有很大的不同。關(guān)于這個(gè)酶的結(jié)構(gòu)已經(jīng)作了大量的研究。
大腸桿菌的二氫乳清酸脫氫酶屬于2族,是包含兩個(gè)相同亞基的二聚體。每個(gè)亞基包含一個(gè)緊緊與之縛在一起的黃素單核苷酸(FMN),較多用醌和醌染料作為電子受體,蛋白質(zhì)順序與所有的線粒體起源的酶有很高的順序相似性(>40%),但與革蘭氏陽(yáng)性菌及所有細(xì)胞液起源的酶序列相似性較低(<20%)。當(dāng)它縛在膜上時(shí),這個(gè)酶作為電子受體利用氧氣的效率更高些因?yàn)樗c呼吸鏈相互作用。因此有人認(rèn)為這個(gè)酶應(yīng)該稱為二氫乳清酸氧化酶,這個(gè)名稱已經(jīng)有了廣泛的應(yīng)用,而有的科學(xué)家更喜歡二氫乳清酸脫氫這個(gè)名稱,因?yàn)檫@個(gè)酶當(dāng)從細(xì)胞膜釋放出來(lái)后利用氧氣極少。
FINN S.NIELSEN等人研究了Lactococcus lactis的二氫乳清酸脫氫酶。Lactococcus lactis是已知的含有A和B兩種形式二氫乳清酸脫氫酶的唯一的生物。在溶液中,這個(gè)A型酶呈亮黃色。它是一個(gè)34kDa的二聚體,每個(gè)亞基包含一個(gè)黃素單核苷酸。在pH7.5-9.0的條件下,最適合酶發(fā)揮功能。他們從含30%的聚乙烯乙二醇,0.2M的醋酸鈉和0.1M的Tris-HCl的pH8.5的溶液中結(jié)晶了這個(gè)酶,得到的黃色晶體在衍射試驗(yàn)中幾乎不受輻射損害。
人的二氫乳清酸脫氫酶屬于2族,可以通過(guò)醌的類(lèi)似物進(jìn)行抑制。由于癌細(xì)胞的生長(zhǎng)需要合成新的核苷,因此二氫乳清酸脫氫酶可能成為核酸合成途徑中的抑制突破口。如果我們能找到好的抑制劑來(lái)阻斷核苷的合成,癌細(xì)胞就不能生長(zhǎng)。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國(guó)云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長(zhǎng)溫度為75攝氏度,厭氧生長(zhǎng),革蘭氏染色反應(yīng)呈陽(yáng)性。它由中國(guó)科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類(lèi)學(xué)上的分析。菌種保存在中國(guó)微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國(guó)特有的一個(gè)物種,其體內(nèi)所具有的耐高溫二氫乳清酸脫氫酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫二氫乳清酸脫氫酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的具有耐高溫二氫乳清酸脫氫酶活性多肽。
本發(fā)明的另一目的還提供了嗜熱厭氧菌的二氫乳清酸脫氫酶重組載體、含有重組載體的宿主細(xì)胞,以及制備蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫二氫乳清酸脫氫酶活性的多肽的核苷酸序列。所說(shuō)的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與二氫乳清酸脫氫酶相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類(lèi)型包括缺失、無(wú)義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫二氫乳清酸脫氫酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
本發(fā)明提供的制備耐高溫二氫乳清酸脫氫酶的方法包括以下步驟1)分離出編碼耐高溫二氫乳清酸脫氫酶的核苷酸序列SEQ ID NO.1;
2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫二氫乳清酸脫氫酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫二氫乳清酸脫氫酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫二氫乳清酸脫氫酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫二氫乳清酸脫氫酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫二氫乳清酸脫氫酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫二氫乳清酸脫氫酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫二氫乳清酸脫氫酶活性的多肽的方法。
圖1是測(cè)序文庫(kù)構(gòu)建步驟流程圖;圖2是測(cè)序與數(shù)據(jù)分析流程圖。
具體實(shí)施例方式
本發(fā)明提供了分離的,編碼耐高溫二氫乳清酸脫氫酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過(guò)對(duì)騰沖嗜熱厭氧菌全基因組測(cè)序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有301氨基酸的多肽,該多肽推測(cè)分子量為32401道爾頓。
本發(fā)明還提供一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫二氫乳清酸脫氫酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫二氫乳清酸脫氫酶或多肽,它具有SEQ.ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來(lái),還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開(kāi),而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開(kāi)。
在本發(fā)明中,“耐高溫二氫乳清酸脫氫酶基因”指編碼具有耐高溫二氫乳清酸脫氫酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡(jiǎn)并序列。該簡(jiǎn)并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡(jiǎn)并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡(jiǎn)并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡(jiǎn)并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語(yǔ)還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ IDNO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語(yǔ)還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測(cè)量,如用柱層析,PAGE或HPLC法測(cè)量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫二氫乳清酸脫氫酶”指具有耐高溫二氫乳清酸脫氫酶活性的SEQ ID NO.2序列的多肽。該術(shù)語(yǔ)還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫二氫乳清酸脫氫酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語(yǔ)還包括耐高溫二氫乳清酸脫氫酶的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫二氫乳清酸脫氫酶時(shí),可以將耐高溫二氫乳清酸脫氫酶基因序列與表達(dá)調(diào)控序列相連,從而形成耐高溫二氫乳清酸脫氫酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對(duì)抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營(yíng)養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒(méi)有的必需營(yíng)養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說(shuō)明書(shū)注明的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過(guò)程稱為“轉(zhuǎn)化”。通過(guò)培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過(guò)本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語(yǔ)“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。本發(fā)明的耐高溫二氫乳清酸脫氫酶基因全長(zhǎng)序列或其片段通??梢杂镁酆厦告?zhǔn)椒磻?yīng)(PCR)擴(kuò)增法,重組法,或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開(kāi)的有關(guān)核苷酸序列來(lái)設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過(guò)常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測(cè)序文庫(kù)測(cè)序文庫(kù)的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測(cè)序文庫(kù)構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問(wèn)題,采用多種方法、不同條件的建庫(kù)原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過(guò)設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過(guò)電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測(cè)序的文庫(kù)。同時(shí),為了便于以后重疊群(contig)的搭接還構(gòu)建了長(zhǎng)插入片段(10kb左右)的測(cè)序文庫(kù)(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫(kù))。該文庫(kù)經(jīng)兩個(gè)末端的測(cè)序在完成圖(finishing)的過(guò)程中可以得到contig之間的關(guān)系,并可以解決較大的洞(gap)對(duì)補(bǔ)洞造成的困難。建庫(kù)流程如(見(jiàn)圖1)。
實(shí)施例2基因組測(cè)序在完成騰沖嗜熱厭氧菌基因組的測(cè)序時(shí),主要使用了兩種全自動(dòng)測(cè)序儀ABI377和MegaBACE 1000。這兩種測(cè)序儀都是利用電泳原理進(jìn)行測(cè)序(見(jiàn)圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測(cè)序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測(cè)序儀。
實(shí)施例3Basecalling和測(cè)序質(zhì)量監(jiān)控所謂Basecalling是指從測(cè)序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過(guò)程。由于測(cè)序儀上得到的是A,T,G,C四種堿基對(duì)應(yīng)的不同波長(zhǎng)的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對(duì)應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類(lèi)型,同時(shí)對(duì)這個(gè)堿基給出可信度信息,即堿基的測(cè)序質(zhì)量。在大規(guī)模測(cè)序中,測(cè)序質(zhì)量的監(jiān)控是十分重要的,它直接影響對(duì)測(cè)序的決策,包括文庫(kù)的構(gòu)建,覆蓋率的大小。同時(shí)對(duì)測(cè)序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥(niǎo)槍法隨機(jī)測(cè)序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考??紤]到測(cè)序中存在載體的影響,需要先對(duì)樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國(guó)Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(Waterman MS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測(cè)序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測(cè)序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對(duì)基因組進(jìn)行注釋?zhuān)ㄟM(jìn)行開(kāi)讀框架(Open Reading Frame,ORF)的預(yù)測(cè),基因功能的預(yù)測(cè),以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測(cè)基因編碼序列,然后所有預(yù)測(cè)的開(kāi)讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無(wú)冗余蛋白數(shù)據(jù)庫(kù)(non-redundant protein database)比較來(lái)發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號(hào)肽序列和啟動(dòng)子序列等。如果在一個(gè)開(kāi)讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測(cè)不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測(cè)序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫(kù)中的蛋白質(zhì)的相似性來(lái)判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對(duì)應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無(wú)活性基因(假基因pseudogenes),因?yàn)檫@說(shuō)明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開(kāi)讀框,長(zhǎng)度小于150堿基對(duì)并且在已有數(shù)據(jù)庫(kù)中沒(méi)有同源性和其中沒(méi)有明顯的啟動(dòng)子或終止區(qū)域的開(kāi)讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,結(jié)果再用InterPro數(shù)據(jù)庫(kù)(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(kù)(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫(kù)的查詢結(jié)果來(lái)確定蛋白質(zhì)在COGs分類(lèi)中的功能分類(lèi)和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來(lái)確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號(hào)肽區(qū)域。(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測(cè)序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來(lái)。主要方法包括A.利用測(cè)序中的正反向測(cè)序樣品信息在測(cè)序過(guò)程中,我們有意對(duì)某些樣品進(jìn)行了雙向測(cè)序,即同時(shí)測(cè)序某個(gè)插入片段的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對(duì)序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對(duì)序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考。
B.長(zhǎng)插入片段及Cosmid末端測(cè)序基于同樣的原理,我們可以構(gòu)建不同長(zhǎng)度的插入片段文庫(kù),只對(duì)其兩端測(cè)序,然后拼接,分析其具體位置。這些文庫(kù)包括長(zhǎng)度為9-12Kb的長(zhǎng)插入片段庫(kù)和20-40Kb左右的Cosmid文庫(kù)。具體分析方法同上所述。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對(duì)引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來(lái)補(bǔ)洞等。
實(shí)施例6二氫乳清酸脫氫酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的二氫乳清酸脫氫酶全長(zhǎng)編碼序列(SEQ IDNO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測(cè)序文庫(kù)的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-PyrD。
挑取單菌落的工程菌DH5α-pGEX-2T-PyrD于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過(guò)夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測(cè)純化效果。在32401道爾頓處的蛋白質(zhì)條帶即為二氫乳清酸脫氫酶。
序列表1.SEQ ID NO.1(1)序列特征a.長(zhǎng)度906堿基對(duì)b.類(lèi)型DNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線性(2)分子類(lèi)型核苷酸(3)序列描述ttgaacctatcggttgagattggaaagataaagcttaaaaaccctgtgattactgcctcaggaacttttggttttggcagggagtacagtgaatacatcgaccttaataaattaggagcgatagttgtaaaaggacttactgtaaagccaagagaaggcaatcctccgcccaggttgtttgagaccgcttctgggattttaaacagcataggccttcaaaatccgggagtagatgcgtttattgaaagggaacttccttttttgaaaagtttcgatgttccagtgattgtaaatattgctggggaaacggttgaggaatttgtgtatatggcagaaaaacttgatattgaagggatagaagggattgaaattaacgtttcctgccccaacgtgaaaaaaggcggaatggcttttggtgtaaatccagatgatatttttgacattacaagaaaggttagaaaggctaccagtaagactgtcatagtgaagttaaccccaaatgtaacagacataaaagtttgcgcaaaggctgcggaaaaaggaggagcagatgctatatctttgattaacacggtggcagggatggctgtagacatcgataaaaggaggcctgtttttgagaatgtaattggggggctatccgggcctgctataaagcctattgctcttaaaatggtgtacgaagtagtcacagttgtgagcattcctgtgataggcatgggaggaataatgaactacaaagatgctttggaatttttaattgtaggtgcaagagctattgcagtgggaacttgtaattttgtaaatccttactgtactgttgagattattgatggaataaaaaagtacatggaagaaaacgaaattgaagacataaatgaaattattggaagtataaaaatttaa2.SEQ ID NO.2(1)序列特征a.長(zhǎng)度301氨基酸b.類(lèi)型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類(lèi)型蛋白質(zhì)(3)序列描述LNLSVEIGKIKLKNPVITASGTFGFGREYSEYIDLNKLGAIVVKGLTVKPREGNPPPRLFETASGILNSIGLQNPGVDAFIERELPFLKSFDVPVIVNIAGETVEEFVYMAEKLDIEGIEGIEINVSCPNVKKGGMAFGVNPDDIFDITRKVRKATSKTVIVKLTPNVTDIKVCAKAAEKGGADAISLINTVAGMAVDIDKRRPVFENVIGGLSGPAIKPIALKMVYEVVTVVSIPVIGMGGIMNYKDALEFLIVGARAIAVGTCNFVNPYCTVEIIDGIKKYMEENEIEDINEIIGSIKI
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫二氫乳清酸脫氫酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫二氫乳清酸脫氫酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類(lèi)型包括缺失、無(wú)義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫二氫乳清酸脫氫酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫二氫乳清酸脫氫酶的方法,其特征在于該方法包括以下步驟1)分離出編碼耐高溫二氫乳清酸脫氫酶基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫二氫乳清酸脫氫酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫二氫乳清酸脫氫酶。
全文摘要
本發(fā)明公開(kāi)了一種耐高溫二氫乳清酸脫氫酶基因序列及編碼的多肽和制備方法。它涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫二氫乳清酸脫氫酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫二氫乳清酸脫氫酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫二氫乳清酸脫氫酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫二氫乳清酸脫氫酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫二氫乳清酸脫氫酶活性的多肽的方法。
文檔編號(hào)C12N15/63GK1371997SQ01145570
公開(kāi)日2002年10月2日 申請(qǐng)日期2001年12月27日 優(yōu)先權(quán)日2001年12月27日
發(fā)明者于軍, 李蔚, 林霞, 胡松年, 田宇清 申請(qǐng)人:杭州華大基因研發(fā)中心