專利名稱:一種外源基因在大腸桿菌中相對翻譯起始率的判定方法
技術領域:
本發(fā)明涉及基因工程的大腸桿菌系統(tǒng)中提高外源基因表達量的方法。
大腸桿菌作為一種宿主菌用于生產(chǎn)基因工程產(chǎn)品已是一項成熟的技術。采用基因工程手段可將外源基因片段克隆到特定的質(zhì)粒上,導入大腸桿菌,通過發(fā)酵、分離純化得到目的蛋白,滿足人們生產(chǎn)、生活及健康方面的不同需求。但是,目的蛋白在大腸桿菌系統(tǒng)中表達的速率存在著顯著差別,某些基因片段易于表達,而另一些基因在大腸桿菌中表達的產(chǎn)物非常少。用基因工程在大腸桿菌中表達外源基因,其產(chǎn)量的高低主要取決于轉(zhuǎn)錄和翻譯兩步的速率的高低。而翻譯一步速率的高低則主要取決于翻譯起始率的高低。大腸桿菌中蛋白質(zhì)合成的起始過程是核糖體小亞基和甲酰甲硫氨酰tRNA與mRNA的翻譯起始區(qū)(TIR)相互作用的過程(Gold,L.Ann.Rev.Biochem.1988,57,199-233)。多年來,許多實驗室研究和分析了大量大腸桿菌翻譯起始位點的核苷酸序列并確定了TIR中影響翻譯起始率的重要特征。這些特征包括起始密碼、Shine/Dalgarno(SD)序列、SD序列與起始碼之間的距離、-3位堿基的性質(zhì)等,并進行了一些定量分析。另一個影響翻譯起始率的重要因素是mRNA的二級結(jié)構(gòu),雖然許多文章對此已作過許多分析并提出了各種解釋,但至今仍無法對mRNA二級結(jié)構(gòu)的影響作出定量的分析,可以說這是生化與分子生物學的難題之一。近年來,涉及翻譯起始的理論的較突出的工作有兩項第一項是de Smit和van Duin分析了改變MS2噬菌體的外殼蛋白mRNA少數(shù)堿基引起的翻譯速率的差異,從化學平衡出發(fā)推導了翻譯起始復合物自由生成能與翻譯速率的關系(de Smit,M.H.and van Duin,J.Proc.Natl.Acad.Sci.USA 1990,87,7668-7672)。他們的結(jié)論是翻譯起始復合物自由生成能差1.4千卡/克分子將造成翻譯速度上十倍的差別。但是由于翻譯起始復合物的自由生成能無法計算,他們并沒有解決定量計算的問題。他們只能以某一段長度的mRNA的二級結(jié)構(gòu)的能量之間的差別來代替翻譯起始復合物的自由生成能的差別,這樣是無法定量比較mRNA的翻譯速率的。另一個工作是Barrick等通過隨機突變研究了不同TIR結(jié)構(gòu)對β-半乳糖苷酶翻譯的影響(Barrick,D.et al.Nucleic Acids Res.1994,22,1287-1295)。他們計算了mRNA TIR中各位置上堿基出現(xiàn)機率與翻譯速率的關系,這只是一種經(jīng)驗公式。而且他只計算了-11→0位的堿基,而實際上TIR范圍要大得多。因此,至今還沒有一個可以定量判定翻譯起始率的方法,是有待進一步研究的課題。
本發(fā)明目的是提供一種外源基因在大腸桿菌中相對翻譯起始率的判定方法。該法是從核糖體、甲酰甲硫氨酰tRNA與mRNA翻譯起始區(qū)相互作用能量的定量分析,核糖體結(jié)合百分率,mRNA翻譯起始延遲率及mRNA翻譯起始區(qū)有效濃度等多個影響因素綜合考慮提出的mRNA相對翻譯起始率的計算方法。它可以用于對mRNA序列進行翻譯速率的判定,從而判定外源蛋白在大腸桿菌系統(tǒng)中的表達率。
本發(fā)明一種外源基因在大腸桿菌中相對翻譯起始率的判定方法,它是通過對核糖體、甲酰甲硫氨酰tRNA與mRNA翻譯起始區(qū)相互作用能量的定量分析來提出mRNA的相對翻譯起始率的計算方法的。mRNA翻譯起始區(qū)的結(jié)構(gòu),包括SD序列、起始密碼和mRNA翻譯起始區(qū)的二級結(jié)構(gòu)都影響mRNA翻譯起始區(qū)與核糖體、甲酰甲硫氨酰tRNA的相互作用。通過對各種長度的mRNA的5′頭部中拆開翻譯起始區(qū)的二級結(jié)構(gòu)所需要的能量、SD序列與核糖體16S rRNA的3′端相互作用的能量、起始碼與甲酰甲硫氨酰tRNA的反密碼相互作用的能量的定量分析計算了核糖體與mRNA翻譯起始區(qū)結(jié)合的百分率、mRNA翻譯起始的延遲率及mRNA翻譯起始區(qū)有效濃度等影響因素,并綜合考慮這些因素計算mRNA的相對翻譯起始率。在啟動子、編碼基因、宿主菌、培養(yǎng)條件都相同的情況下,翻譯起始率的不同決定了該外源基因在大腸桿菌中的表達率。因此,本發(fā)明可以用于判定一種外源基因在大腸桿菌中的表達率。
本發(fā)明的判定方法綜合考慮了核糖體與mRNA翻譯起始區(qū)結(jié)合的百分率、mRNA翻譯起始延遲率及mRNA翻譯起始區(qū)有效濃度這3個影響mRNA翻譯起始率的因素。下面將對這3個因素的定量分析計算、這3個因素的計算值與翻譯起始率的關系以及由此提出的mRNA相對翻譯起始率的判定方法進行詳細說明。
一、由于mRNA邊轉(zhuǎn)錄邊翻譯,并且一條mRNA上通常有幾個核糖體進行翻譯,mRNA的5′頭部在不斷伸長。當mRNA翻譯起始區(qū)露出來時,核糖體就開始與之結(jié)合,并開始翻譯;而未被結(jié)合的mRNA則隨著轉(zhuǎn)錄的進行或前一個核糖體的翻譯而繼續(xù)伸長,伸長的mRNA的TIR的二級結(jié)構(gòu)會發(fā)生變化,在不同長度的mRNA中拆開TIR二級結(jié)構(gòu)所需要的能量也可能不同。核糖體與不同長度mRNA5′頭部結(jié)合的能量變化和機率也就不同。因此翻譯起始的速率是核糖體、甲酰甲硫氨酰tRNA(fMet-tRNA)與各種長度的mRNA5′頭部作用的總結(jié)果。
核糖體(rRNA)與mRNA翻譯起始區(qū)(TIR)相互作用是翻譯起始的第一步,也是最重要的一步,用它可以代表mRNA的翻譯起始過程。這一相互作用是一個化學平衡rRNA+TIR=TIR-rRNA設mRNA的總濃度為[M],被核糖體結(jié)合的分數(shù)為F,未結(jié)合的分數(shù)為(1-F),rRNA濃度可以看作一個常數(shù)C。平衡常數(shù)K=[TIR-rRNA][rRNA]×[TIR]=[M]FC[M](1-F)=FC(1-F)]]>F=CK÷(1+CK)根據(jù)物理化學原理,TIR-rRNA二元復合物的標準生成自由能△G°=-RT 1nKK=e-△G°/RT,R=1.986卡/度·克分子,T為絕對溫度。
為了能根據(jù)mRNA的核苷酸序列預測其翻譯速率,本發(fā)明根據(jù)大腸桿菌中mRNA的翻譯起始過程,將翻譯起始過程的自由生成能進行分解,并用計算機可計算的能量來代替。首先,在TIR-rRNA二元復合物生成過程中發(fā)生的能量變化有SD序列與16SrRNA3′端結(jié)合時自由能的降低△GSD;拆開mRNA的TIR二級結(jié)構(gòu)所需要的能量△GSN;此后形成TIR-rRNA-fMet-tRNA三元復合物時有fMet-tRNA反密碼與起始碼AUG結(jié)合的自由能降低△GI,以及其他一些較次要的能量變化,如核糖體的530環(huán)與起始碼前3個核苷酸的作用及分子的熱運動能和勢能的變化等,這些統(tǒng)記為△GX?!鱃°可用下式表示△G°=△GSD+△GSN+△GI+△GX根據(jù)核酸堿基配對的熱力學數(shù)據(jù)可以計算核酸之間的堿基配對的能量變化以及核酸分子內(nèi)自身折疊形成二級結(jié)構(gòu)的能量(Kierzek,R.et al.Biochemistry,1986,25,7840-7846;Freier,S.M.et al.Proc.Natl.Acad.Sci.USA,1986,83,9373-9377;Turner,D.H.et al.Annu.Rev.Biophys.Biochem.1988,17,167-192),由這樣計算得到的能量為最穩(wěn)態(tài)能量,記為△E。它與體內(nèi)的真實情況并不相同,用△E為參數(shù)表示△G°需分別乘以系數(shù),其中△ESD和△ESN為這個過程中的主要能量變化,且△ESD對不同重組子是可變的,△ESN在每一重組子的不同長度的5′頭部中是可變的。本發(fā)明把這二個值放在變量中。而對于某一個外源基因而言起始碼相同,△EI不變?!鱁X的值則還無好的計算方法,本發(fā)明把△EI和△EX值放在不變項中,即△G°=a(△ESD+△ESN)+b(△EI+△EX)這樣,核糖體結(jié)合mRNA TIR的分數(shù)可表示為F=BeA(ΔESD+ΔESN)÷[1+BeA(ΔESD+ΔESN)]]]>其中A=-a/RT,B=Ce-b(ΔEI+ΔEx)/RT]]>。根據(jù)本發(fā)明對外源基因在大腸桿菌中翻譯起始率的分析得出A=0.508,B=18.5。
經(jīng)過上述處理,F(xiàn)成了△ESD和△ESN的函數(shù)。△ESN隨mRNA長度(n)的變化而不同,因此,F(xiàn)也是n的函數(shù),記為F(n)。它表示5′頭部長度為n的mRNA被核糖體結(jié)合的趨勢。mRNA的翻譯起始區(qū)剛露出來時,設mRNA的5′頭部長度n為w,核糖體結(jié)合的百分率為Fw,未被結(jié)合的為1-Fw,mRNA長度伸長到任一長度n時,核糖體結(jié)合百分率為Pn=Fn×(1-Fn-1)×···×(1-Fw)。對所有長度的mRNA的累計核糖體結(jié)合百分率P總=∑Pn。
改變mRNA翻譯起始區(qū)的堿基得到的不同重組子,其二級結(jié)構(gòu)不同使得△GSN不同,也可因改變了SD序列使△GSD不同。結(jié)果是各重組子的核糖體結(jié)合百分率不同。核糖體結(jié)合百分率越高,翻譯起始率就越高。
二、不同二級結(jié)構(gòu)的mRNA被核糖體結(jié)合的百分率不同,其結(jié)果是翻譯起始的平均長度不同,即二級結(jié)構(gòu)強的mRNA的翻譯起始過程被延遲了,這種延遲影響了翻譯的速度。不同二級結(jié)構(gòu)的mRNA的翻譯起始被延遲的程度不同,以翻譯起始延遲率D(n)表示。n=w時,Dw=1-Pw,當nRNA伸長至n時,被延遲部分為Dn=1-∑Pn,累計的翻譯起始延遲率D總=∑Dn。該值與蛋白質(zhì)合成的速度成反比,翻譯起始延遲率越高的重組子翻譯起始率就越低。
三、mRNA被核糖體結(jié)合的百分率不同還使-條mRNA上在進行翻譯的核糖體數(shù)目不同,即每一條mRNA被利用的次數(shù)不同,可以看作是mRNA的TIR的有效濃度的差別。把mRNA上的核糖體的平均間距記為u,u等于核糖體復蓋長度45加上n-w與長度為n的mRNA5′頭部的核糖體結(jié)合百分率Pn的乘積之和。即u=∑[(45+n-w)×Pn]。mRNA5′端到終止碼的長度=s,則TIR的有效濃度[TIR]=[M]×s/u。各重組子的有效濃度之比為s/u。
四、綜合考慮上述因素對翻譯起始率的影響,本發(fā)明提出了mRNA相對翻譯起始率的計算公式
。
從式中可以看出P總值越大表明mRNA的TIR與核糖體結(jié)合率就越高,蛋白翻譯起始率也越高;D總值越大表明翻譯起始延遲越多,蛋白翻譯起始率越低;u值越大表明核糖體平均間距越大,即mRNA有效濃度越低,蛋白翻譯起始率越低。這三個參數(shù)的變化歸根到底是由mRNA的TIR的結(jié)構(gòu)決定的,也就是說mRNA的TIR的結(jié)構(gòu)影響了蛋白質(zhì)翻譯的速率。因此,本發(fā)明的上述計算方法可定量地判定mRNA的翻譯速率,也即可以定量地判定外源基因的表達速率。由于這一計算是依據(jù)mRNA的核苷酸序列,因此可以依照此方法設計或改進mRNA的翻譯起始區(qū),以提高外源基因在大腸桿菌中的表達量。
本發(fā)明建立了一種判定外源基因在大腸桿菌中翻譯起始率的方法。本發(fā)明的優(yōu)點在于1)以前的分析往往只考慮核糖體與一種長度的mRNA起始片段的相互作用,而這一長度mRNA的起始片段的確定也是隨意的。然而,在體內(nèi)mRNA的轉(zhuǎn)錄與翻譯是偶聯(lián)的,翻譯又是在一條mRNA上由多個核糖體進行的,因此mRNA的5′頭部在不斷地伸長,與核糖體相作用的mRNA的長度以及它的二級結(jié)構(gòu)是在變化的。只計算某一個長度的一段mRNA的二級結(jié)構(gòu)的能量本身在理論上是一個缺陷。本發(fā)明考慮了核糖體與各種5′長度mRNA作用的總結(jié)果,并提出了翻譯起始延遲率和mRNA TIR有效濃度這二個物理量用來計算翻譯起始的速率。這對于大腸桿菌中的翻譯起始理論是一個新的發(fā)展。2)本發(fā)明將翻譯起始復合物的自由生成能分解為SD與16S rRNA作用的自由能降低、拆開mRNA的TIR二級結(jié)構(gòu)所需能量、甲酰甲硫氨酰tRNA的反密碼與起始碼作用的自由能降低等,并用計算機程序通過核苷酸序列來計算,這使得我們能夠依據(jù)mRNA的核苷酸序列定量地判定翻譯起始的速率。后面的實施例顯示采用本發(fā)明判定計算方法對于5′PCNA-β半乳糖苷酶融合蛋白的計算結(jié)果能與實驗結(jié)果較好符合。
本發(fā)明通過以下實施例作進一步闡述,但并不限止本發(fā)明的范圍。
實施例1,不同表達活性的人5′PCNA-LacZ的TIR的序列測定。通過隨機突變得到了269個可在大腸桿菌中表達不同表達活性的人PCNA5′34氨基酸-β半乳糖苷酶α亞基融合蛋白(5′PCNA-LacZ)的重組子。我們選擇了7個不同表達水平的重組子,其表達量的差別最大達二十倍以上。用Sanger雙脫氧末端終止法測定了這7個重組子5′端的核苷酸序列。結(jié)果如下SD +1A395′GGGA AAGCUU AUUAUA GAGGU AUAUUUU AUG······3′A425′GGGA AAGCUU UUAUAA GAGGU AUUCAUC AUG······3′B505′GGGA AAGCUU AUUAAA GAGGU AGCAAGA AUG······3′C285′GGGA AAGCUU CAAAC GGAGGU UAAGAUG AUG······3′B555′GGGA AAGCUU UGUGG GGAGGU ACUUCUU AUG······3′D135′GGGA AAGCUU CCACUA GAGGU UGCCACC AUG······3′C595′GGGA AAGCUU GGACGC GAGGU UCAGGUU AUG······3′AUG后的PCNA的114個核苷酸序列完全相同,與LacZ接頭連接正確。5′PCNA-LacZ融合基因編碼的全部核苷酸序列如下+15′AUG UUC GAG GCG CGC CUG GUC CAG GGC UCC AUC CUC AAG AAG GUG UUG GAG GCACUC AAG GAC CUC AUC AAC GAG GCC UGC UGG GAU AUU AGC UCC AGC GGU GUA AACCUG CAG/UCG AAU UCA CUG GCC GUC GUU UUA CAA CGU CGU GAC UGG GAA AAC CCU←PCNA/LacZ→GGC GGU ACC CAA CUU AAU CGC CUU GCA GCA CAU CCC CCU UUC GCC AGC UGG CGUAAU AGC GAA GAG GCC CGC ACC GAU CGC CCU UCC CAA CAG UUG CGC AGC CUG AAUGGC GAA UGG CGC CUG AUG CGG UAU UUU CUC CUU ACG CAU CUG UGC GGU AUU UCA+378CAC CGC AUA UGG UGC ACU CUC AGU ACA AUC UGC UCU GAU GCC GCA UAG終止碼實施例2,各重組子的累計核糖體結(jié)合率、累計翻譯延遲率、核糖體平均間距的計算。
根據(jù)實施例1中的7個mRNA TIR的不同核苷酸序列,依據(jù)核酸堿基配對的熱力學數(shù)據(jù)計算△G°,再用△G°計算各自的累計翻譯起始率、累計翻譯延遲率和核糖體平均間距。它們的Pw→∑Pw+4,以及∑Pw+29,D總和u的數(shù)值如下重組子Pw∑Pw+1∑Pw+2∑Pw+3∑Pw+4∑Pw+29D總uA390.80220.9609 0.9923 0.9985 0.99971 0.4443 47.6A420.79400.9576 0.9913 0.9982 0.99961 0.4654 47.6B500.77690.9502 0.9889 0.9975 0.99951 0.5102 47.6C280.60710.8456 0.9393 0.9762 0.99061 1.0406 47.5B550.54510.7931 0.9332 0.9620 0.9784 0.9998 1.2845 47.5D130.21550.3845 0.5172 0.6212 0.7028 0.9017 6.5160 53.7C590.20700.3712 0.5014 0.6046 0.6770 0.9168 6.7029 53.5實施例3對于蛋白質(zhì)翻譯速率的判定及其與實驗測定值的比較。
根據(jù)實施例2中所計算的P總、D總和u的數(shù)值進一步計算蛋白翻譯速率,計算和判別上述7個重組子的翻譯速率為A39>A42>B50>C28>B55>D13>C59。并用常規(guī)的測定水解對硝基酚磷酸的能力來代表融合蛋白的β半乳糖苷酶的活性。具體的以A420比色測定細胞裂解液中水解對硝基酚磷酸的能力,以每毫升菌液,一個A600光密度,每分鐘產(chǎn)生一個A420為一個單位。通過對二組數(shù)據(jù)的比較,表明本發(fā)明所提供的判定方法與實際測定的活性呈一致性。各重組子的計算量與實驗測定的滑性如下重組子計算的相對翻譯起始率 實驗測定的酶活性(單位) r×10000A390.04722960.847.7628A420.04510549.519.1104B500.04116141.349.9566C280.02024423.468.6293B550.01639719.118.5805D130.0025762.89 8.9144C590.0025582.86 8.9447其中r=計算的相對翻譯起始率÷實驗測定的酶活性。計算值與實驗值之比的相對偏差小于7%。后面
圖1所示為實驗測定的β半乳糖苷酶滑性對計算的相對翻譯起始率作的圖,兩者符合得是比較好的。
權利要求
1.一種外源基因在大腸桿菌中相對翻譯起始率的判定方法,它是通過對大腸桿菌mRNA翻譯起始區(qū)二級結(jié)構(gòu)的能量及核糖體、甲酰甲硫氨酰tRNA與mRNA翻譯起始區(qū)相互作用的能量進行定量分析來判定mRNA翻譯起始區(qū)結(jié)構(gòu)對于外源基因蛋白翻譯起始率影響的方法,其特征在于該判定方法是通過對下面影響翻譯起始率的三個主要因素(1)mRNA翻譯起始區(qū)的二級結(jié)構(gòu)能量以及核糖體、甲酰甲硫氨酰tRNA與mRNA翻譯起始區(qū)作用的能量及由這些能量決定的核糖體結(jié)合百分率,(2)mRNA翻譯起始延遲率,(3)mRNA翻譯起始區(qū)有效濃度,進行定量分析計算,并以上述三個計算值與翻譯起始率之間的關系提出mRNA相對翻譯起始率的計算公式為
全文摘要
一種外源基因在大腸桿菌中相對翻譯率的判定方法是通過對影響mRNA翻譯起始速率的因素翻譯起始區(qū)二級結(jié)構(gòu)的能量及核糖體、甲酰甲硫氨酰tRNA與mRNA翻譯起始區(qū)結(jié)合的核糖體結(jié)合百分率,翻譯起始延遲率和翻譯起始區(qū)有效濃度進行定量分析計算,綜合考慮這三者計算值與翻譯起始率的關系,提出相對翻譯起始率的公式和方法。藉此可判定蛋白質(zhì)的翻譯速率,可按此方法設計或改進mRNA翻譯起始區(qū),以提高外源基因在大腸桿菌系統(tǒng)中的表達量。
文檔編號C12N15/67GK1167151SQ9710634
公開日1997年12月10日 申請日期1997年4月2日 優(yōu)先權日1997年4月2日
發(fā)明者陸長德, 陳農(nóng)安, 王易倫 申請人:中國科學院上海生物化學研究所