本發(fā)明涉及分析蛋白質(zhì)折疊或其他動(dòng)力學(xué)過程中空間結(jié)構(gòu)的變化,尤其涉及一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法,屬于蛋白質(zhì)結(jié)構(gòu)與動(dòng)力學(xué)研究領(lǐng)域。
背景技術(shù):
蛋白質(zhì)是最重要的生物大分子之一,它在生物體內(nèi)承擔(dān)著物質(zhì)輸運(yùn)、信號(hào)傳遞和能量供給等生物學(xué)功能。蛋白質(zhì)的生物學(xué)功能是由其自然折疊而成的空間結(jié)構(gòu)決定的。實(shí)驗(yàn)上,采用x射線衍射、多維核磁共振等技術(shù)可以測(cè)定蛋白質(zhì)的結(jié)構(gòu)。理論上,人們發(fā)展了分子動(dòng)力學(xué)技術(shù)研究蛋白質(zhì)折疊和動(dòng)力學(xué)過程。它通過計(jì)算蛋白質(zhì)分子中原子的運(yùn)動(dòng)軌跡、原子間的相互作用等,在原子尺度上闡明蛋白質(zhì)實(shí)現(xiàn)生物學(xué)功能過程中空間結(jié)構(gòu)演化的微觀動(dòng)力學(xué)機(jī)制。然而,蛋白質(zhì)分子的組成與結(jié)構(gòu)非常復(fù)雜,其折疊和動(dòng)力學(xué)過程涉及大量原子的集體運(yùn)動(dòng),發(fā)展一些結(jié)構(gòu)分析方法非常必要。目前已發(fā)展了一些理論方法,以及空間結(jié)構(gòu)可視化分析軟件,如cn3d、vmd、jmol等。這些方法和工具在展示蛋白質(zhì)分子三維空間構(gòu)象、揭示結(jié)構(gòu)特征、分析原子或基團(tuán)間相互作用等方面非常有用。但是,它們是對(duì)某一時(shí)刻或某一幀的空間結(jié)構(gòu)進(jìn)行分析,缺乏展現(xiàn)蛋白質(zhì)分子空間結(jié)構(gòu)含時(shí)演化的能力。
由于組成蛋白質(zhì)的各種氨基酸主要區(qū)別是側(cè)鏈基團(tuán),每個(gè)蛋白質(zhì)所具有的獨(dú)特空間結(jié)構(gòu)和功能與側(cè)鏈緊構(gòu)型密相關(guān)。在蛋白質(zhì)實(shí)現(xiàn)其生物學(xué)功能的過程中,相關(guān)側(cè)鏈構(gòu)型的伴隨變化(如旋轉(zhuǎn)、扭轉(zhuǎn)、彎曲等)是一個(gè)重要的方面。因而,在蛋白質(zhì)折疊或其他動(dòng)力學(xué)過程模擬中,分析蛋白質(zhì)的側(cè)鏈構(gòu)象含時(shí)演化顯得非常重要,目前這方面的研究還很少。蛋白質(zhì)的空間結(jié)構(gòu)演化是主鏈和側(cè)鏈的協(xié)同運(yùn)動(dòng),目前的結(jié)構(gòu)分析工具沒有將主鏈和側(cè)鏈運(yùn)動(dòng)分離,難以觀測(cè)特定側(cè)鏈的構(gòu)象演化,還需要更有效的分析手段和方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是針對(duì)目前還沒有分析蛋白質(zhì)折疊和其他動(dòng)力學(xué)過程中側(cè)鏈結(jié)構(gòu)變化的技術(shù)現(xiàn)狀,提出了一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法。
本發(fā)明所提方法通過計(jì)算蛋白質(zhì)運(yùn)動(dòng)過程中氨基酸殘基側(cè)鏈在每一個(gè)時(shí)刻的相對(duì)扭轉(zhuǎn)角,獲得氨基酸殘基側(cè)鏈扭轉(zhuǎn)為主的重要信息。
為實(shí)現(xiàn)上述目的,一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法,步驟如下:
步驟1:獲取蛋白質(zhì)初始結(jié)構(gòu);
其中,蛋白質(zhì)初始結(jié)構(gòu)可以從蛋白質(zhì)數(shù)據(jù)銀行(pdb,http://www.rcsb.org)獲取,也可以通過蛋白質(zhì)結(jié)構(gòu)建模的方法與工具獲??;
步驟2:采用步驟1的蛋白質(zhì)初始結(jié)構(gòu)進(jìn)行含時(shí)分子動(dòng)力學(xué)模擬,得到蛋白質(zhì)運(yùn)動(dòng)軌跡文件,具體為:
以步驟1的蛋白質(zhì)初始結(jié)構(gòu),利用分子動(dòng)力學(xué)模擬軟件,選擇合適的力場(chǎng),對(duì)蛋白質(zhì)進(jìn)行含時(shí)分子動(dòng)力學(xué)模擬,得到蛋白質(zhì)中各原子的運(yùn)動(dòng)軌跡信息,保存運(yùn)動(dòng)軌跡文件;
其中,力場(chǎng)的一種優(yōu)選方案是全原子力場(chǎng)和聯(lián)合原子力場(chǎng);
其中,模擬積分步長(zhǎng)取δt飛秒,對(duì)整個(gè)系統(tǒng)進(jìn)行t納秒的分子動(dòng)力學(xué)模擬;每隔w個(gè)積分步輸出一次蛋白質(zhì)的結(jié)構(gòu),即每δt×w飛秒記錄一次蛋白質(zhì)結(jié)構(gòu)的信息;運(yùn)動(dòng)軌跡文件共保存k=(t×106)/(δt×w)個(gè)時(shí)刻的結(jié)構(gòu),依次編號(hào)為n=1,2,3,…,k;
其中,δt、w、k值為大于1的正整數(shù);
步驟3:從步驟2的蛋白質(zhì)運(yùn)動(dòng)軌跡文件,提取氨基酸殘基側(cè)鏈,計(jì)算第n時(shí)刻的氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角,具體為:
從步驟2得到的蛋白質(zhì)運(yùn)動(dòng)軌跡文件,獲得第n時(shí)刻蛋白質(zhì)的結(jié)構(gòu),輸出坐標(biāo)數(shù)據(jù)文件;從坐標(biāo)數(shù)據(jù)文件中,提取兩個(gè)待考察氨基酸殘基中主鏈碳原子、側(cè)鏈第一個(gè)碳原子的坐標(biāo);計(jì)算這四個(gè)碳原子形成的二面角,即為兩個(gè)待考察氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角;
其中,第n時(shí)刻對(duì)應(yīng)步驟2中編號(hào)n等于1的時(shí)刻;
其中,主鏈碳原子、側(cè)鏈第一個(gè)碳原子記為cα、cβ,它們從蛋白質(zhì)的氮末端到碳末端根據(jù)氨基酸殘基順序編號(hào);兩個(gè)待考察氨基酸殘基的編號(hào)記為i和j,i和j為1到m的正整數(shù),m是蛋白質(zhì)中氨基酸殘基總數(shù);i表示編號(hào)靠前的氨基酸殘基,j表示編號(hào)靠后的氨基酸殘基,j大于i;j與i的差等于1表示兩個(gè)氨基酸殘基相鄰,j與i的差大于1表示兩個(gè)氨基酸殘基非相鄰;
其中,第i個(gè)氨基酸殘基的主鏈碳原子、側(cè)鏈第一個(gè)碳原子記為ciα、ciβ;它們坐標(biāo)分別記為riα、riβ;第j個(gè)氨基酸殘基的主鏈碳原子、側(cè)鏈第一個(gè)碳原子記為cjα、cjβ;它們坐標(biāo)分別記為rjα、rjβ;
兩個(gè)待考察氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角,具體通過如下步驟計(jì)算:
步驟3.1計(jì)算第i個(gè)氨基酸殘基的ciα原子指向第j個(gè)氨基酸殘基的cjα原子的單位矢量xijα,表述為如下公式(1):
步驟3.2計(jì)算第i個(gè)氨基酸殘基的ciα原子指向側(cè)鏈ciβ原子的單位矢量aiβ,表述為如下公式(2):
步驟3.3計(jì)算步驟3.2的單位矢量aiβ在步驟3.1的單位矢量xijα法平面上的單位投影矢量ai,表述為如下公式(3):
步驟3.4計(jì)算第j個(gè)氨基酸殘基的cjα原子指向側(cè)鏈cjβ原子的單位矢量bjβ,表述為如下公式(4):
步驟3.5計(jì)算步驟3.4的單位矢量bjβ在步驟3.1的單位矢量xijα法平面上的單位投影矢量bj,表述為如下公式(5):
步驟3.6由步驟3.3和步驟3.5的單位投影矢量ai、bj,計(jì)算ciβ-ciα-cjα-cjβ原子形成的二面角φ,即第i和j個(gè)氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角,表述為如下公式(6):
cosφ=ai·bj(6)
步驟4:計(jì)算第一時(shí)刻后所有時(shí)刻的氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角,給出相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化,即:重復(fù)步驟3,并且n對(duì)應(yīng)n=2,3,…,k,具體為:
從步驟2得到的蛋白質(zhì)運(yùn)動(dòng)軌跡文件,獲得第一時(shí)刻后所有時(shí)刻的蛋白質(zhì)結(jié)構(gòu),輸出相應(yīng)的坐標(biāo)數(shù)據(jù)文件;采用與步驟3相同的方法,計(jì)算兩個(gè)待考察氨基酸殘基側(cè)鏈在這些時(shí)刻的相對(duì)扭轉(zhuǎn)角,輸出保存這些時(shí)刻相對(duì)扭轉(zhuǎn)角的值;以時(shí)間為橫軸,相對(duì)扭轉(zhuǎn)角的值為縱軸,畫出從第一時(shí)刻到最終時(shí)刻氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角的變化圖;
其中,兩個(gè)待考察氨基酸殘基與步驟3中的提取過程一致;
其中,第一時(shí)刻后所有時(shí)刻對(duì)應(yīng)步驟2描述中的n=2,3,…,k時(shí)刻;
至此,從步驟1到步驟4,完成了一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法。
有益效果
一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法,與現(xiàn)有技術(shù)及方法相比,具有如下有益效果:
(1)能夠分析蛋白質(zhì)折疊和其他動(dòng)力學(xué)過程中蛋白質(zhì)結(jié)構(gòu)的含時(shí)演化;
(2)能夠?qū)⒌鞍踪|(zhì)含時(shí)動(dòng)力學(xué)過程中主鏈和側(cè)鏈運(yùn)動(dòng)分離,分析特定側(cè)鏈的構(gòu)象演化;
(3)不僅能夠分析非相鄰的氨基酸殘基側(cè)鏈的含時(shí)動(dòng)力學(xué)演化,也可分析所有相鄰的氨基酸殘基側(cè)鏈的含時(shí)動(dòng)力學(xué)演化;
(4)對(duì)研究蛋白質(zhì)折疊過程中二級(jí)結(jié)構(gòu)的形成、蛋白質(zhì)生物學(xué)功能實(shí)現(xiàn)與構(gòu)型變化內(nèi)在聯(lián)系等具有基礎(chǔ)和應(yīng)用價(jià)值;
(5)便于在與蛋白質(zhì)折疊和動(dòng)力學(xué)、蛋白質(zhì)結(jié)構(gòu)和功能相關(guān)的生命科學(xué)及生物醫(yī)藥學(xué)領(lǐng)域廣泛應(yīng)用。
附圖說明
圖1為一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法流程圖;
圖2為原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中l(wèi)eu951與ala955側(cè)鏈相對(duì)扭轉(zhuǎn)角變化計(jì)算的流程示意圖;
圖3為原癌基因c-myc蛋白質(zhì)中l(wèi)eu951與ala955的側(cè)鏈相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化圖;
圖4是原癌基因c-myc蛋白質(zhì)中所有相鄰氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角在n=[300-1300]時(shí)刻的演化圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的方法作進(jìn)一步說明。
實(shí)施例1
本實(shí)施例詳細(xì)闡述了本發(fā)明“一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法”在具體實(shí)施時(shí)針對(duì)原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中l(wèi)eu951與ala955側(cè)鏈相對(duì)扭轉(zhuǎn)角變化計(jì)算的流程。
圖1是一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法的流程圖。從圖中可以看出,本方法包含的過程為:步驟(1):獲取蛋白質(zhì)初始結(jié)構(gòu);步驟(2):采用步驟(1)的蛋白質(zhì)初始結(jié)構(gòu)進(jìn)行含時(shí)分子動(dòng)力學(xué)模擬,保存蛋白質(zhì)運(yùn)動(dòng)軌跡文件;步驟(3):計(jì)算第一個(gè)時(shí)刻的氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角;步驟(4):計(jì)算其他時(shí)刻的氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角,給出相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化;
圖2為本實(shí)施例的流程圖,從圖中可以看出,原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中l(wèi)eu951與ala955側(cè)鏈相對(duì)扭轉(zhuǎn)角變化計(jì)算包含如下步驟:
步驟一、從蛋白質(zhì)數(shù)據(jù)銀行(pdb,http://www.rcsb.org)下載代碼為1nkp的結(jié)構(gòu)數(shù)據(jù)文件,提取原癌基因c-myc蛋白質(zhì)的結(jié)構(gòu),保存為1nkp.pdb;
步驟二、以步驟一的1nkp.pdb為初始結(jié)構(gòu),利用gromacs4.6.3軟件,采用gromos53a6力場(chǎng),對(duì)原癌基因c-myc蛋白質(zhì)進(jìn)行含時(shí)分子動(dòng)力學(xué)模擬,得到蛋白質(zhì)中各原子的運(yùn)動(dòng)軌跡,保存為1nkp_md.trr;
其中,蛋白質(zhì)置于長(zhǎng)方體水盒子中,蛋白質(zhì)到水盒子壁的距離設(shè)為2.0納米;水分子采用spc模型;nacl濃度設(shè)為0.15摩爾/升;模擬中,采用周期性邊界條件;溫度設(shè)為290開,壓強(qiáng)取1個(gè)標(biāo)準(zhǔn)大氣壓,平衡時(shí)采用berendsen方法控溫控壓,分子動(dòng)力學(xué)計(jì)算時(shí)采用vrescale方法控溫、parrinelo-rahman方法控壓;長(zhǎng)程相互作用的截?cái)喟霃饺?.9埃;積分步長(zhǎng)取2飛秒,對(duì)整個(gè)系統(tǒng)進(jìn)行50納秒的分子動(dòng)力學(xué)模擬;
其中,每20皮秒記錄一次蛋白質(zhì)結(jié)構(gòu)的信息,1nkp_md.trr文件中共保存2500個(gè)時(shí)刻的結(jié)構(gòu),依次編號(hào)為n=1,2,3,…,2500,對(duì)應(yīng)著時(shí)間t=20,40,60,…,50000皮秒時(shí)蛋白質(zhì)的結(jié)構(gòu);
步驟三、計(jì)算第1個(gè)時(shí)刻leu951與ala955側(cè)鏈的相對(duì)扭轉(zhuǎn)角,具體為:
從步驟二得到的蛋白質(zhì)中各原子的運(yùn)動(dòng)軌跡1nkp_md.trr文件,獲得n=1時(shí)刻蛋白質(zhì)的結(jié)構(gòu),提取非相鄰的兩個(gè)氨基酸殘基leu951與ala955中主鏈cα、側(cè)鏈cβ原子的坐標(biāo)r951α、r951β、r955α、r955β;按照發(fā)明內(nèi)容步驟(3)中步驟(3).1到步驟(3).5所述,采用公式(1)到公式(6),計(jì)算出n=1時(shí)刻兩個(gè)氨基酸殘基leu951與ala955側(cè)鏈的相對(duì)扭轉(zhuǎn)角,記為
其中,
步驟四、計(jì)算第2到2500時(shí)刻leu951與ala955側(cè)鏈的相對(duì)扭轉(zhuǎn)角,給出相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化,具體為:
從步驟二得到的蛋白質(zhì)中各原子的運(yùn)動(dòng)軌跡1nkp_md.trr文件,獲得n=2,3,…,2500時(shí)刻蛋白質(zhì)的結(jié)構(gòu),提取這些時(shí)刻氨基酸殘基leu951與ala955中主鏈cα、側(cè)鏈cβ原子的坐標(biāo);在每一個(gè)時(shí)刻,采用發(fā)明內(nèi)容步驟(3)中步驟(3).1到步驟(3).5所述的公式(1)到公式(6),計(jì)算出兩個(gè)氨基酸殘基leu951與ala955側(cè)鏈的相對(duì)扭轉(zhuǎn)角,其值按照時(shí)刻編號(hào)順序記為
圖3是原癌基因c-myc蛋白質(zhì)中l(wèi)eu951與ala955的側(cè)鏈相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化圖;圖中橫坐標(biāo)xaxis是時(shí)刻編號(hào)n,縱坐標(biāo)yaxis是leu951與ala955的側(cè)鏈相對(duì)扭轉(zhuǎn)角;圖中實(shí)線是相應(yīng)時(shí)間區(qū)間中相對(duì)扭轉(zhuǎn)角的平均值,虛線是該時(shí)間區(qū)間中相對(duì)扭轉(zhuǎn)角的平均波動(dòng);bend表示彎曲構(gòu)型,turn表示轉(zhuǎn)角構(gòu)型;從圖中相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化可以分析出:n=[1,400]區(qū)間的相對(duì)扭轉(zhuǎn)角平均值約為0.52,n=[400,500]區(qū)間的相對(duì)扭轉(zhuǎn)角平均值約為-0.29,n=[500,700]區(qū)間的相對(duì)扭轉(zhuǎn)角平均值約為0.46,n=[700,800]區(qū)間的相對(duì)扭轉(zhuǎn)角平均值約為0.30和-0.45;這個(gè)結(jié)果反映出,在該動(dòng)力學(xué)過程中,leu951與ala955的側(cè)鏈開始處于較小的相對(duì)扭轉(zhuǎn),到n=[400,500]時(shí)會(huì)出現(xiàn)小的反向相對(duì)扭轉(zhuǎn),n=[500,700]會(huì)變回與[1,400]相近的扭轉(zhuǎn)角,[700,800]時(shí)存在正反扭轉(zhuǎn)之間快速變換;
至此,從步驟一到步驟四,完成了原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中l(wèi)eu951與ala955側(cè)鏈相對(duì)扭轉(zhuǎn)角變化計(jì)算。
實(shí)施例2
本實(shí)施例按照本發(fā)明“一種分析蛋白質(zhì)側(cè)鏈構(gòu)象含時(shí)動(dòng)力學(xué)演化的方法”的步驟和實(shí)例例1所述流程,闡述原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中所有相鄰氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角變化計(jì)算及其結(jié)果。
原癌基因c-myc蛋白質(zhì)的含時(shí)動(dòng)力學(xué)演化過程中所有相鄰氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角變化計(jì)算,步驟a、b與實(shí)施例1步驟一、二相同;在進(jìn)行氨基酸殘基側(cè)鏈相對(duì)扭轉(zhuǎn)角隨時(shí)間的演化計(jì)算時(shí),需依次選取原癌基因c-myc蛋白質(zhì)的氨基酸殘基對(duì),方法是從第1個(gè)氨基酸殘基開始按順序選擇:1與2、2與3、3與4、…、m-1與m,遇到甘氨酸殘基跳過不計(jì),m是蛋白質(zhì)中氨基酸殘基總數(shù);每個(gè)氨基酸殘基對(duì)的側(cè)鏈相對(duì)扭轉(zhuǎn)角計(jì)算與實(shí)施例1步驟三、四相同;最終給出的是,所有時(shí)刻、所有相鄰的氨基酸殘基側(cè)鏈相對(duì)扭轉(zhuǎn)角;
圖4是原癌基因c-myc蛋白質(zhì)中所有相鄰氨基酸殘基側(cè)鏈的相對(duì)扭轉(zhuǎn)角在n=[300-1300]時(shí)刻的演化圖;圖中橫坐標(biāo)xaxis是時(shí)刻編號(hào)n,縱坐標(biāo)yaxis是的氨基酸殘基編號(hào);一種優(yōu)選的辦法是,用相對(duì)扭轉(zhuǎn)角值與顏色的對(duì)應(yīng)表示角度值變化,藍(lán)色到紅色依次對(duì)應(yīng)著-π到+π弧度;圖中顯示出,在n=[560,800]區(qū)間,959-960、960-961、961-962的氨基酸殘基對(duì)的側(cè)鏈相對(duì)扭轉(zhuǎn)角會(huì)明顯增大;在n=[800,900]區(qū)間,955-956氨基酸殘基對(duì)的側(cè)鏈相對(duì)扭轉(zhuǎn)角也會(huì)變大;
以上所述為本發(fā)明的兩個(gè)典型實(shí)施例而已,本發(fā)明不應(yīng)該局限于該實(shí)施例和附圖所公開的內(nèi)容。凡是不脫離本發(fā)明所公開的精神下完成的等效或修改,都落入本發(fā)明保護(hù)的范圍。