專利名稱:蛋白質(zhì)折疊仿真中的模蛇方法
蛋白質(zhì)折疊仿真中的模蛇方法
(一) 技術(shù)領(lǐng)域 本發(fā)明涉及的是一種蛋白質(zhì)的計(jì)算機(jī)折疊方法。
(二)
背景技術(shù):
蛋白質(zhì)折疊的研究始于二十世紀(jì)六十年代初期,美國國家健康所的Anfmsen 教授及其同事在研究中發(fā)現(xiàn)因加入變性劑而失去活性的核糖核酸酶,在除去變性
劑后可以自發(fā)地折疊到天然構(gòu)象從而重新具有生理活性,而且這一過程可以重復(fù) 進(jìn)行。
1968年,Levinthal在一篇論文中指出,蛋白質(zhì)分子所能采取的可能的構(gòu)象 數(shù)目是一個天文數(shù)字,而它的天然構(gòu)象只有一種,這讓一些科學(xué)家相信, 一定存 在著一條特殊的折疊途徑,蛋白質(zhì)沿著這條途徑進(jìn)行折疊,經(jīng)過一系列特定的中 間體而快速折疊到天然構(gòu)象。
從七十年代開始,幾個研究小組相繼在細(xì)胞色素,核糖核酸酶,雞溶菌酶等 蛋白質(zhì)的重折疊實(shí)驗(yàn)中發(fā)現(xiàn)有中間體存在的跡象。
九十年代開始蛋白質(zhì)折疊的理論研究開始多了起來,理論學(xué)家借助于簡化的 模型和計(jì)算機(jī)模擬,可以方便地模擬蛋白質(zhì)折疊和去折疊。
很多研究蛋白質(zhì)折疊模擬過程的方法都來源于模擬自然界生物系統(tǒng)的方法, 例如模擬完全依賴生物體自身的本能、通過無意識的尋優(yōu)行為來優(yōu)化其生存狀 態(tài)以適應(yīng)環(huán)境的一類新型的仿生優(yōu)化算法。仿生方法的蛋白質(zhì)逆折疊算法是從已 知的蛋白質(zhì)空間結(jié)構(gòu)出發(fā),采用仿生方法和手段,來確定該空間結(jié)構(gòu)的氨基酸序 列的方法。
1、遺傳算法
遺傳算法(Genetic Algorithm, GA)是基于Darwin進(jìn)化論和Mendel的遺傳 學(xué)說而發(fā)展起來的算法。由于采用了類似物種進(jìn)化過程中基因的選擇、交叉和變 異等操作手段,使得遺傳算法在本質(zhì)上成為一類非確定性算法,具有全局搜索能
力,特別適用于多峰值函數(shù)的最優(yōu)解問題。2、 蟻群算法
蟻群算法吸收了螞蟻群體行為的典型特征 一是能察覺小范圍區(qū)域內(nèi)狀況, 并判斷出是否有食物或其他同類的信息素軌跡;二是能釋放自己的信息素;三是 所遺留的信息素?cái)?shù)量會隨時間而逐步減少。
3、 粒子群優(yōu)化算法
粒子群優(yōu)化算法(Particle swarm optimization, PSO)源于對鳥群捕食行為的 研究。PSO算法中,每個優(yōu)化問題的潛在解都是搜索空間中的一只鳥,稱之為"粒 子"。所有的粒子都有一個由被優(yōu)化的函數(shù)決定的適應(yīng)值,每個粒子還有一個速 度決定他們飛翔的方向和距離。然后粒子們就追隨當(dāng)前的最優(yōu)粒子在解空間中搜 索。
4、 人工魚群算法
人工魚群算法(artificial fish-swarm algorithm, AFSA)是一種基于模擬魚群行 為的優(yōu)化算法。在基本魚群算法中,主要是利用了魚的覓食、聚群和追尾行為, 從構(gòu)造單條魚的底層行為做起,通過魚群中各個體的局部尋優(yōu),達(dá)到全局最優(yōu)值 在群體中突現(xiàn)出來的目的。該算法具有良好的克服局部極值、取得全局極值的能 力。并且算法中只使用目標(biāo)函數(shù)的函數(shù)值,無需目標(biāo)函數(shù)的梯度值等特殊信息, 對搜索空間具有一定的自適應(yīng)能為。算法對初值無要求,對各參數(shù)的選擇也不很 敏感。
5、 其它算法
以上四種算法中,能量最小的是魚群算法,折疊正確率最高的是粒子群算法, 均方根差最好的是蟻群算法??傊?,遺傳算法各項(xiàng)指標(biāo)均不如蟻群算法、粒子群 算法和魚群算法,這三種算法可以替代遺傳算法。蟻群算法、粒子群算法和魚群 算法各有優(yōu)缺點(diǎn)。中國專利申請?zhí)枮?00710072292.x,名稱為"基于綜合算法的 蛋白質(zhì)折疊過程的計(jì)算機(jī)模擬方法"的專利文件中,綜合以上因素,主要結(jié)合遺 傳算法,模糊聚類算法和粒子群算法對蛋白質(zhì)的三維結(jié)構(gòu)進(jìn)行預(yù)測,并對折疊過 程進(jìn)行模擬。該算法從計(jì)算機(jī)運(yùn)算速度和存儲容量出發(fā),在保留折疊主要原因的 情況下,忽略了折疊過程中的大量具體細(xì)節(jié),從而大大提高了運(yùn)算速度,成為適 用于普通計(jì)算機(jī)的有效方法。但是由于忽略了折疊過程的大量具體細(xì)節(jié),仿真的 折疊過程與實(shí)際過程有較大偏差,許多蛋白質(zhì)的折疊過程無法模擬。我們的發(fā)明針對綜合算法的缺點(diǎn),從理論和實(shí)現(xiàn)上提出了擬蛇方法仿真蛋白質(zhì)折疊過程。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種對于未知空間結(jié)構(gòu)的蛋白質(zhì)進(jìn)行中間體和最終 空間結(jié)構(gòu)預(yù)測,從而減少蛋白質(zhì)空間結(jié)構(gòu)測定過程中所耗費(fèi)的人力、物力,同時 也可以提供折疊分析的蛋白質(zhì)折疊仿真中的模蛇方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的-
(1) 選取一條直線蛋白質(zhì)序列;
(2) 做波浪運(yùn)動,用函數(shù)sin(t)來表示;
(3) 做短暫的直線運(yùn)動,用函數(shù)FX+t來表示;
(4) 做盤繞運(yùn)動,用下面函數(shù)表示,xW = (C'(X)S(0 + e2sin(0),其中, C和。是系數(shù),與蛋白質(zhì)本身的性質(zhì)有關(guān)。
其具體步驟包括
(1) 初始狀態(tài)隨機(jī)產(chǎn)生一條蛋白質(zhì)序列的構(gòu)型,給出氨基酸殘基個數(shù),
設(shè)定肽鏈折疊的最大距離參數(shù)max一distance,更新速度步長s,給肽鏈最小能量 設(shè)初值;
(2) 當(dāng)折疊距離小于折疊的最大距離時,做波浪運(yùn)動,并計(jì)算肽鏈總的最 小能量值;
(3) 當(dāng)折疊距離等于折疊的最大距離時,做直線運(yùn)動,并計(jì)算肽鏈總的最 小能量值;
(4) 當(dāng)折疊距離大于折疊的最大距離時,做盤繞運(yùn)動,并計(jì)算肽鏈總的最 小能量值;
(5) 肽鏈總的最小能量不再變化時,輸出蛋白質(zhì)構(gòu)型,算法結(jié)束。 所述的波浪運(yùn)動方式肽鏈的移動路徑是正弦波,
X=0: 0,1: 10,
所述的直線式移動方式肽鏈的移動路徑為直線式, X=0: 0.1: 10,
y=x,
plot(x, y)。所述的盤繞運(yùn)動方式肽鏈的移動路徑是螺旋曲線, t=0: pi/50: 10*pi;
plot(kl.*cos(t)+ kl.*sin(t), k2.*cos(t)+ k2.*sin(t))。
蛋白質(zhì)折疊的函數(shù)模型是扣型函數(shù)
x(0 = (C, cos《)+ sin(O) _y(0 = (C2 cos(W) + C2 sin(叫)) = (C3 cos(w力+ C3 sin—力) t=t+s
其中s為步長,Co, d, C2, C3, q, ^為系數(shù),它們與具體蛋白質(zhì)的類 型有關(guān),t為更新速度。
蛋白質(zhì)折疊的函數(shù)模型是圓型函數(shù)
jc(Y) = (C, cos(O + C, sin(Z)) + C>
= (C2 cos(叫)+ C2 sin(cy)) z(O = (C3 cos( 2/) - C3 sin(>2/)) t=t+s
其中s為步長,C。, d, C2, C3, W, ^為系數(shù),它們與具體蛋白質(zhì)的類 型有關(guān),t為更新速度。
本發(fā)明在分析蛋白質(zhì)折疊規(guī)律的基礎(chǔ)上,依據(jù)蛇運(yùn)動習(xí)性,對蛇的運(yùn)動機(jī)理 和行為方式進(jìn)行定量描述,設(shè)計(jì)能夠表征蛋白質(zhì)折疊規(guī)律的擬蛇方法。
蛇的運(yùn)動具有運(yùn)動穩(wěn)定性好,適應(yīng)地形環(huán)境能力強(qiáng)等特點(diǎn)。其運(yùn)動具有以下 特點(diǎn)(l)能在凹凸不平的地面上移動,有良好的地形自適應(yīng)性;(2)適合于在沼 澤、沙漠等松軟環(huán)境中行進(jìn);,(3)能通過孔洞等狹小而又彎曲的通路,有較強(qiáng)的 過障礙能力;(4)能經(jīng)常保持力學(xué)的穩(wěn)定狀態(tài)。
蛋白質(zhì)折疊的結(jié)果也是趨于形成低能量的力學(xué)的穩(wěn)定狀態(tài)的物質(zhì)。蛋白質(zhì)的 折疊過程是這樣蛋白在進(jìn)行折疊過程中是經(jīng)歷了一個中間狀態(tài)的,這種狀態(tài)被 科學(xué)家形容為熔球。熔球不像正常折疊后結(jié)構(gòu)緊密的蛋白那樣脆弱,你可以對它
進(jìn)行拉扯,他不會被輕易破壞結(jié)構(gòu)。熔球具有正常蛋白所有的二級結(jié)構(gòu),但是這種二級結(jié)構(gòu)尚未正確折疊形成更高級的結(jié)構(gòu)。當(dāng)?shù)鞍踪|(zhì)折疊成穩(wěn)定構(gòu)型時,其能 量是最低的。另據(jù)蛋白質(zhì)折疊的Framework模型,蛋白質(zhì)折疊的動力學(xué)過程中至 少存在兩個折疊中間體第一個折疊中間體(又稱為早期中間體)含有豐富的二級 結(jié)構(gòu)成分,但其空間結(jié)構(gòu)并不穩(wěn)定,通常在其天然結(jié)構(gòu)附近擺動;第二個折疊中 間體結(jié)構(gòu)已非常緊湊,其空間構(gòu)象己基本固定。但仍缺乏其天然三級結(jié)構(gòu)。也就 是說,蛋白質(zhì)在折疊過程中有三個不同層次的構(gòu)象;二級結(jié)構(gòu)、三級結(jié)構(gòu)和穩(wěn)定 的三級結(jié)構(gòu),而這三個構(gòu)象層次是在蛋白質(zhì)的折疊過程中順序形成的。
蛇的運(yùn)動與蛋白質(zhì)折疊在形狀和運(yùn)動形式上有相似之處,因此研究和制作蛇 形仿生算法來解決蛋白質(zhì)折疊問題將很有吸引力。
本發(fā)明是模擬蛇捕獲獵物的過程來探究蛋白質(zhì)折疊過程的方法。蛋白質(zhì)形成 空間構(gòu)型的折疊過程是首先是一條直線的蛋白質(zhì)序列,然后以波浪移動方式開 始折疊,經(jīng)過短暫的直線運(yùn)動后,最后做盤繞運(yùn)動形成穩(wěn)定的空間的構(gòu)型。
對于未知空間結(jié)構(gòu)的蛋白質(zhì),可以通過本發(fā)明的擬蛇算法對蛋白質(zhì)鏈進(jìn)行中 間體和最終空間結(jié)構(gòu)進(jìn)行預(yù)測,從而減少蛋白質(zhì)空間結(jié)構(gòu)測定過程中所耗費(fèi)的人 力,物力,同時也可以提供折疊分析供理論研究人員參考。
(四)
圖1是本發(fā)明組成框圖2是本發(fā)明設(shè)備組成圖3是系統(tǒng)整體結(jié)構(gòu)圖4是部分實(shí)驗(yàn)結(jié)果。
具體實(shí)施方式
下面結(jié)合附圖舉例對本發(fā)明做更詳細(xì)地描述
本發(fā)明的折疊過程如下(1)初始狀態(tài)是一條直線蛋白質(zhì)序列;(2)開始 折疊時做波浪運(yùn)動,用函數(shù)sin(t)來表示;(3)折疊后期做短暫的直線運(yùn)動, 用函數(shù)X=X+t來表示;(4)完成折疊做盤繞運(yùn)動,用下面函數(shù)表示,
x(0 = (ClCos^) + C2sinW》,其中,c和w是系數(shù),與蛋白質(zhì)本身的性質(zhì)有關(guān)。
在算法運(yùn)行的過程中,控制肽鏈總的能量最小,當(dāng)肽鏈總的最小能量不再變化時, 算法結(jié)束。
本發(fā)明中擬蛇算法的步驟1、 初始狀態(tài)隨機(jī)產(chǎn)生一條蛋白質(zhì)序列的構(gòu)型。給出氨基酸殘基個數(shù),設(shè) 定肽鏈折疊的最大距離參數(shù)max—distance,更新速度步長s,給肽鏈最小能量設(shè) 初值;
2、 當(dāng)折疊距離小于折疊的最大距離時,做波浪運(yùn)動,并計(jì)算肽鏈總的最小 能量值;
3、 當(dāng)折疊距離等于折疊的最大距離時,做直線運(yùn)動,并計(jì)算肽鏈總的最小 能量值;
4、 當(dāng)折疊距離大于折疊的最大距離時,做盤繞運(yùn)動,并計(jì)算肽鏈總的最小 能量值。
5、 肽鏈總的最小能量不再變化時,輸出蛋白質(zhì)構(gòu)型,算法結(jié)束。
因此,擬蛇算法包括這樣這種運(yùn)動模式波浪運(yùn)動,直線運(yùn)動和盤繞運(yùn)動。 也就是,擬蛇算法包括下面三種函數(shù) 1 、 Function wave—motion
%波浪運(yùn)動方式典型的蛇類運(yùn)動方式,當(dāng)與食物(外力)距離遠(yuǎn)時(折疊 開始時),當(dāng)區(qū)域空間大,擁擠濃度低時,蛇的軀體作波浪運(yùn)動,形成若干個波 峰和波谷。從頭部至尾部,波峰和波谷隨時間交替改變。肽鏈的移動路徑是正弦 波%
X=0: 0.1: 10
plot(sin(x) , x)
2、 Function Line—motion
%直線式移動方式當(dāng)與食物(外力)距離近時(折疊中期),或當(dāng)在光滑 表面或長的肽鏈的時候,肽鏈的移動路徑為直線式%
X=0: 0.1: 10 y=x
plot(x, y);
3 、 Function coil—motion
%盤繞運(yùn)動方式當(dāng)捕獲食物后(折疊后期),肽鏈的移動路徑是螺旋曲線
%t=0: pi/50: 10*pi;
plot(kl.*cos(t)+ kl.*sin(t), k2.*cos(t)+ k2.承sin(t));
本發(fā)明的關(guān)鍵程序和關(guān)鍵參數(shù)是依據(jù)蛋白質(zhì)的特點(diǎn)選擇的。下面是6個典型 蛋白質(zhì)序列的關(guān)鍵參數(shù)的選擇。六個典型蛋白質(zhì)分別是序列1RPB, 1UBQ, 1PBI, 1BPI, lKCD禾t] 1EHC,他們對應(yīng)的程序分別為zj_snake6, zj—snake8, zj_snake9, zj—snakell, zj—snake7和zj_snakelO。算法中的盤繞部分,是整個算 法的關(guān)鍵程序部分;捕獲獵物的最大距離max—distance和更新速度的步長s是關(guān) 鍵參數(shù);它們與肽鏈自身的性質(zhì)有關(guān)。蛋白質(zhì)序列不同,關(guān)鍵程序的形式,折疊 最大距離和更新速度的步長的取值是不一樣的。
1、 1RPB, 1UBQ, 1PBI, IBPI的關(guān)鍵程序和參數(shù)
zj一snake 6中蛋白質(zhì)折疊的盤繞程序部分
pop(i, 3)=pop(i, 3)+cos(t)+sin(t); 殘基點(diǎn)X坐標(biāo)的更新
pop(i, 4)=pop(i, 4)+cos(t/2)+sin(t/2); 殘基點(diǎn)Y坐標(biāo)的更新
pop(i, ll)=pop(i, ll)+4*cos(t/3)+4*sin(t/3); 殘基點(diǎn)Z坐標(biāo)的更新
s=1.5 更新速度
t=t+S;
max distance =19 折疊最大距離
zj一snake8中蛋白質(zhì)折疊盤繞程序部分的X, Y, Z坐標(biāo)更新形式與zj—snake 6 的部分相同,
s=2.42 更新速度 t=t+s;
max distance =19 %折疊最大距離
zj—snake9中蛋白質(zhì)折疊盤繞程序部分的X, Y, Z坐標(biāo)更新形式與zj一snake 6 的部分相同,
s=2.44; 更新速度t=t+s
max distance =19
折疊最大距離
zj_snake ll中蛋白質(zhì)折疊盤繞程序部分, pop(i , 3 )== pop(i , 3 )+co s(t)+sin(t); pop(i, 4)=pop(i, 4)+cos(t)+sin(t);
pop(i, ll)=pop(i, ll)+l/2.*cos(t/2)+l/2.
s=0.52; t=t+s
max distance =10
殘基點(diǎn)X坐標(biāo)的更新 殘基點(diǎn)Y坐標(biāo)的更新
:sin(t/2);
殘基點(diǎn)Z坐標(biāo)的更新
折疊最大距離
2、 1KCD和1EHC的關(guān)鍵程序和參數(shù) zj一snake 7蛋白質(zhì)折疊的盤繞程序部分,
pop(i, 3)=pop(i, 3)+2.*cos(t)+2.*sin(t)+t/10; 殘基點(diǎn)X坐標(biāo)的更新 pop(i, 4)=pop(i, 4)+2.*cos(t)+2.*sin(t); 殘基點(diǎn)Y坐標(biāo)的更新 pop(i, ll)=pop(i, ll)+3.*cos(t)-3.*sin(t); s=20; t=t+s
max distance =0.01
殘基點(diǎn)Z坐標(biāo)的更新 更新速度
折疊最大距離
zj一snake IO蛋白質(zhì)折疊的盤繞程序部分, pop(i, 3)=pop(i, 3)+cos(t)+sin(t)+t/10; pop(i, 4)=pop(i, 4)+cos(4.*t)+sin(4.*t);
pop(i, ll)=pop(i, ll)+4.*cos(t)-4.*sin(t);
s=0.4;
t=t+s
殘基點(diǎn)X坐標(biāo)的更新 殘基點(diǎn)Y坐標(biāo)的更新
殘基點(diǎn)Z坐標(biāo)的更新
更新速度max_distance=0.01 折疊最大距離 蛋白質(zhì)折疊的函數(shù)模型
上面六個典型的蛋白質(zhì)空間結(jié)構(gòu)是從60個蛋白質(zhì)空間結(jié)構(gòu)的研究抽出來的 典型結(jié)構(gòu)。實(shí)驗(yàn)證明,這六個空間結(jié)構(gòu)完全可以通過改變參數(shù)從兩種函數(shù)形式導(dǎo) 出。因此提出蛋白質(zhì)折疊過程函數(shù)模型包括圓型和扣型兩種類型。圓型蛋白質(zhì)空 間結(jié)構(gòu)可以通過圓型函數(shù),選擇適當(dāng)?shù)膮?shù)獲得,同樣扣型蛋白質(zhì)空間結(jié)構(gòu)也可 以通過扣型函數(shù),選擇適當(dāng)?shù)膮?shù)獲得??坌秃瘮?shù)是由于由它獲得的蛋白質(zhì)空間 結(jié)構(gòu)似扣的形狀而得名;屬于扣型函數(shù)的蛋白質(zhì)序列是lRPB(zj—snake6), 1UBQ
(zj—snake8), 1PBI (zj一snake9), 1BPI (zj—snakell )。圓型函數(shù)是由于由它獲得 的蛋白質(zhì)空間結(jié)構(gòu)似圓的形狀而得名;屬于圓型函數(shù)的蛋白質(zhì)序列是1KCD
(zj—snake7)和1EHC (zj—snake10)。
扣型和圓形函數(shù)的通用形式如下 扣型函數(shù)
x(O = (d cos②+ C! sin(,)) _y(0 = (C2 cos(cy) + C2 sin(o力) z(/) = (C3 cos( y2f) + C3 sin(w2f)) t=t+s
圓型函數(shù)
jcO) = cos(O + C\ sin(O) + C0f = (C2 cos(6;力+ C2 sin(/y力) z(O = (C3 cos(w2,) — C3 sin(w/)) t=t+s
其中s為步長,C0, d, C2, C3,悶,^為系數(shù),它們與具體蛋白質(zhì)的類 型有關(guān),t為更新速度。
本發(fā)明的設(shè)備包括(O完成單體蛋白質(zhì)鏈序列和單體蛋白質(zhì)空間結(jié)構(gòu)的
專用輸入接口; (2)擬蛇并行運(yùn)算專用芯片SS-1; (3)搭載芯片SS-1的嵌入式系統(tǒng);(4) 一臺圖形工作站(提取影響蛋白質(zhì)折疊過程的各種姿態(tài)和參數(shù)); (5) —套投影設(shè)備(建立蛋白質(zhì)分子折疊過程的交互可視化環(huán)境)。
本發(fā)明中,擬蛇方法是一種新型的思路的算法,從具體的實(shí)施算法到總體的 設(shè)計(jì)理念,都不同于傳統(tǒng)的設(shè)計(jì)和解決方法,但同時它又能與傳統(tǒng)方法相融合。
結(jié)合圖l,本發(fā)明由存儲介質(zhì)、專用輸入接口、嵌入式擬蛇運(yùn)算模塊和交互 式方針可視化模塊組成
結(jié)合圖2,嵌入式擬蛇并行運(yùn)算模塊2是本發(fā)明的核心,它與存儲介質(zhì)通過 系統(tǒng)總線相連接,然后通過并行口與圖形工作站3連接,圖形工作站3與投影儀 4通過數(shù)字端口連接。本發(fā)明首先將外界單體蛋白質(zhì)信息存放在存儲介質(zhì)1上, 然后輸入嵌入式擬蛇并行運(yùn)算模塊2,經(jīng)過處理后,再輸入圖形工作站3,完成 可視化處理后將圖形信息輸出到投影儀4,最后透射到投影幕5上。
結(jié)合圖3,本發(fā)明的輸入是存儲介質(zhì)上的蛋白質(zhì)鏈序列和單體空間模型,經(jīng) 過專用輸入接口進(jìn)行協(xié)議轉(zhuǎn)換后送入嵌入式擬蛇并行算法模塊,嵌入式擬蛇并行 算法模塊由專用輸入接口、 9寸液晶屏、32位單片機(jī)系統(tǒng)和專用芯片SS-1組成, 專用輸入接口主要實(shí)現(xiàn)單體蛋白質(zhì)鏈以及空間結(jié)構(gòu)的輸入、編碼并實(shí)時發(fā)送到嵌 入式系統(tǒng)。專用芯片SS-1主要完成對輸入數(shù)據(jù)的擬蛇算法實(shí)現(xiàn),通過并行運(yùn)算 實(shí)現(xiàn)波浪運(yùn)動一wave—motion,直線運(yùn)動一Line—motion和盤繞運(yùn)動一coil—motion, 可以實(shí)時輸出任何中間過程的蛋白質(zhì)空間參數(shù)和姿態(tài)。32位單片機(jī)系統(tǒng)主要控 制其他周邊設(shè)備協(xié)同SS-1芯片的工作并負(fù)責(zé)與圖形工作站的通信。工作時,此 模塊首先把接口傳來的數(shù)據(jù)送入存儲器,然后控制SS-1芯片讀取存儲器的原始 數(shù)據(jù)并進(jìn)行并行擬蛇運(yùn)算,運(yùn)算的數(shù)據(jù)通過PCI總線送入存儲器,嵌入式CPU 可以控制運(yùn)算的精度和步驟等,并根據(jù)需要將蛋白質(zhì)姿態(tài)數(shù)據(jù)適時送入圖形工作 站。圖形工作站接收來自嵌入式擬蛇并行模塊的數(shù)據(jù),經(jīng)過仿真可視化處理把結(jié) 果通過投影儀投到投影幕上。該圖形工作站具有存儲、回放、分析蛋白質(zhì)折疊過 程的功能,同時可以相應(yīng)工作人員的要求對嵌入式系統(tǒng)發(fā)出各種指令,對折疊過 程進(jìn)行人工干預(yù)。
結(jié)合圖4,輸入的蛋白質(zhì)鏈經(jīng)過擬蛇算法折疊時,生成各種相對穩(wěn)定的中間 體,圖4所示為其中的一幅,多次折疊之后,達(dá)到輸入的單體蛋白質(zhì)空間結(jié)構(gòu), 此過程可以人工控制速度和精度,并可自動分析折疊機(jī)理。
權(quán)利要求
1、一種蛋白質(zhì)折疊仿真中的模蛇方法,其特征是(1)選取一條直線蛋白質(zhì)序列;(2)做波浪運(yùn)動,用函數(shù)sin(t)來表示;(3)做短暫的直線運(yùn)動,用函數(shù)x=x+t來表示;(4)做盤繞運(yùn)動,用下面函數(shù)表示,x(t)=(C1cos(ωt)+C2sin(ωt)),其中,C和ω是系數(shù),與蛋白質(zhì)本身的性質(zhì)有關(guān)。
2、 根據(jù)權(quán)利要求l所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特征是其具體步驟包括(1) 初始狀態(tài)隨機(jī)產(chǎn)生一條蛋白質(zhì)序列的構(gòu)型,給出氨基酸殘基個數(shù),設(shè)定肽鏈折疊的最大距離參數(shù)max—distance,更新速度步長s,給肽鏈最小能量 設(shè)初值;(2) 當(dāng)折疊距離小于折疊的最大距離時,做波浪運(yùn)動,并計(jì)算肽鏈總的最 小能量值;(3) 當(dāng)折疊距離等于折疊的最大距離時,做直線運(yùn)動,并計(jì)算肽鏈總的最 小能量值;(4) 當(dāng)折疊距離大于折疊的最大距離時,做盤繞運(yùn)動,并計(jì)算肽鏈總的最 小能量值;(5) 肽鏈總的最小能量不再變化時,輸出蛋白質(zhì)構(gòu)型,結(jié)束。
3、 根據(jù)權(quán)利要求2所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特征是 所述的波浪運(yùn)動方式肽鏈的移動路徑是正弦波,X=0: 0.1: 10。
4、 根據(jù)權(quán)利要求3所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特征是 所述的直線式移動方式肽鏈的移動路徑為直線式,X=0: 0.1: 10,y=x,plot(x, y)。
5、 根據(jù)權(quán)利要求4所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特征是 所述的盤繞運(yùn)動方式肽鏈的移動路徑是螺旋曲線,t=0: pi/50: 10*pi;plot(k 1. * cos(t)+ k 1. * sin(t) , k2. * cos(t)十k2. * sin(t))。
6、 根據(jù)權(quán)利要求1-5任何一項(xiàng)所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特征是蛋白質(zhì)折疊的函數(shù)模型是扣型函數(shù)x(0 = (d cos(O + sin"))= (C2 cos(叫)+ C2 sin一))= (C3 cos( 2/") + C3 sin( 2/")) t=t+s其中s為步長,C0, d, C2, C3,悶,q為系數(shù),它們與具體蛋白質(zhì)的類 型有關(guān),t為更新速度。
7、 根據(jù)權(quán)利要求l-5任何一項(xiàng)所述的蛋白質(zhì)折疊仿真中的模蛇方法,其特 征是蛋白質(zhì)折疊的函數(shù)模型是圓型函數(shù)x(O = (C, cos(,) + C, sin(O) + C> _y(0 = (C2 cos(叫)+ C2 sin(叫)) = (C3 cos^/1) _ C3 sin( y2f)) t=t+s其中s為步長,Co, d, C2, C3, A, ^為系數(shù),它們與具體蛋白質(zhì)的類 型有關(guān),t為更新速度。
全文摘要
本發(fā)明提供的是一種蛋白質(zhì)折疊仿真中的模蛇方法。(1)初始狀態(tài)是一條直線蛋白質(zhì)序列;(2)開始折疊時做波浪運(yùn)動,用函數(shù)sin(t)來表示;(3)折疊后期做短暫的直線運(yùn)動,用函數(shù)x=x+t來表示;(4)完成折疊做盤繞運(yùn)動,用下面函數(shù)表示,x(t)=(C<sub>1</sub>cos(ωt)+C<sub>2</sub>sin(ωt)),其中,C和ω是系數(shù),與蛋白質(zhì)本身的性質(zhì)有關(guān)。對于未知空間結(jié)構(gòu)的蛋白質(zhì),可以通過本發(fā)明的擬蛇算法對蛋白質(zhì)鏈進(jìn)行中間體和最終空間結(jié)構(gòu)進(jìn)行預(yù)測,從而減少蛋白質(zhì)空間結(jié)構(gòu)測定過程中所耗費(fèi)的人力,物力,同時也可以提供折疊分析供理論研究人員參考。
文檔編號G06F19/00GK101436230SQ20081020978
公開日2009年5月20日 申請日期2008年12月25日 優(yōu)先權(quán)日2008年12月25日
發(fā)明者于思亮, 波 劉, 菁 張, 松 李, 李艷波, 溫乃鋒, 王海玲, 王立偉, 明 趙, 陳懷友 申請人:哈爾濱工程大學(xué)