一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法
【專利摘要】一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,包括以下步驟:從蛋白質(zhì)片段庫(kù)中隨機(jī)選取片段產(chǎn)生種群個(gè)體,根據(jù)評(píng)分函數(shù)對(duì)每個(gè)種群計(jì)算函數(shù)值,并進(jìn)行排序,得到最優(yōu)函數(shù)值,對(duì)種群中的個(gè)體做交叉變異操作,以更新種群,迭代運(yùn)行至設(shè)置的終止條件,本發(fā)明提供了一種有效的構(gòu)象空間優(yōu)化方法。
【專利說(shuō)明】—種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
【背景技術(shù)】
[0002]人類基因組序列圖的成功繪制,意味著人類基因組計(jì)劃的所有預(yù)定目標(biāo)全部實(shí)現(xiàn),也標(biāo)志著人類基因組計(jì)劃的勝利完成和后基因組時(shí)代的來(lái)臨。在后基因組時(shí)代,研究工作的重心從基因測(cè)序轉(zhuǎn)向了基因組功能的識(shí)別:根據(jù)蛋白質(zhì)分子的氨基酸序列預(yù)測(cè)其空間結(jié)構(gòu)。這將使人們更系統(tǒng)的理解生物信息從DNA到具有生物活性蛋白質(zhì)的遺傳信息傳遞過(guò)程,使中心法則得到更為詳盡的闡明,進(jìn)而對(duì)生命過(guò)程中的各種現(xiàn)象有進(jìn)一步的深刻認(rèn)識(shí),最終推動(dòng)生命科學(xué)的向前發(fā)展。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)除了其自身的理論意義外,還具有很重要的實(shí)際應(yīng)用意義。人們希望通過(guò)研究蛋白質(zhì)的空間結(jié)構(gòu)來(lái)了解其內(nèi)在機(jī)理,這樣不僅可以對(duì)疾病進(jìn)行有效的預(yù)測(cè)和控制,還可以按照人們的設(shè)想設(shè)計(jì)出符合特定需求的非天然蛋白質(zhì)。
[0003]蛋白質(zhì)構(gòu)象優(yōu)化問(wèn)題現(xiàn)在面臨最大的挑戰(zhàn)是對(duì)極其復(fù)雜的蛋白質(zhì)能量函數(shù)曲面進(jìn)行搜索。蛋白質(zhì)能量模型考慮了分子體系成鍵作用以及范德華力、靜電、氫鍵、疏水等非成鍵作用,致使其形成的能量曲面極其粗糙,構(gòu)象對(duì)應(yīng)局部極小解數(shù)目隨序列長(zhǎng)度的增加呈指數(shù)增長(zhǎng)。而蛋白質(zhì)構(gòu)象預(yù)測(cè)算法能夠找到蛋白質(zhì)穩(wěn)定結(jié)構(gòu)的機(jī)理是,大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu)構(gòu)成了低能量區(qū)域,所以能否找到蛋白質(zhì)全局最穩(wěn)定結(jié)構(gòu)的關(guān)鍵是算法能夠找到大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu),即增加算法的種群多樣性。因此,針對(duì)更加精確的蛋白質(zhì)力場(chǎng)模型,選取有效的構(gòu)象空間優(yōu)化算法,使新的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法更具有普遍性和高效性成為生物信息學(xué)中蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的焦點(diǎn)問(wèn)題。
[0004]因此,我們需要發(fā)展有效的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
【發(fā)明內(nèi)容】
[0005]針對(duì)上述問(wèn)題,我們提出了一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化算法FDE (fragment-assembly differential evolut1n algorithm)。FDE 在片段組裝的基礎(chǔ)上,采用基于知識(shí)的Rosetta粗粒度能量模型,融入差分進(jìn)化算法(DE),利用DE算法較強(qiáng)的全局搜索能力對(duì)蛋白質(zhì)構(gòu)象空間進(jìn)行搜索。
[0006]本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
[0007]—種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,所述優(yōu)化方法包括以下步驟:
[0008]I)初始化種群:從蛋白質(zhì)片段庫(kù)中隨機(jī)選取片段產(chǎn)生包含popSize個(gè)個(gè)體的種群Pint,并設(shè)置算法參數(shù):種群大小popSize,蛋白質(zhì)序列長(zhǎng)度Length (即優(yōu)化問(wèn)題的維數(shù)),算法的迭代次數(shù)T,算法的交叉因子CR,蛋白質(zhì)片段的長(zhǎng)度L。
[0009]2)根據(jù)評(píng)分函數(shù)f計(jì)算每個(gè)種群的函數(shù)值大小,并進(jìn)行排序,其中Pniax的函數(shù)值最優(yōu)。
[0010]3)在未達(dá)到設(shè)定的終止條件時(shí),進(jìn)行以下操作
[0011]3.1)對(duì)種群Pint中每個(gè)個(gè)體Pi做以下操作:
[0012]3.1.1)設(shè) i = 1,其中 i e {I, 2,3,…,popSize};
[0013]3.1.2)其中POTigin = Pi, Porigin為初始種群,Pi為Pint中的每個(gè)個(gè)體;
[0014]3.1.3)隨機(jī)生成正整數(shù) randl, rand2, rand3 ;其中 randl 幸 rand2,且
[0015]randl, rand2 e {1,2,…,Length},rand3 e {1,2,3,......popSize};
[0016]3.1.4)針對(duì)個(gè)體Pj做變異操作,其中:
[0017]je {min (randl, rand2),..., max (randl, rand2)}
[0018]a:令 Porigin.phi (j) — P
rand3*
phi (j);
[0019]b:令 Porigin.psi (j) — P
rand3*
psi (j);
[0020]c:令 Porigin.0mega (j) — Prand3.0mega (j);
[0021]其中phi, psi, omega分別表示構(gòu)象的三個(gè)二面角Φ, Ψ, ω ;
[0022]3.2)通過(guò)變異操作得到個(gè)體Snrat ;
「 I 。ON 4-R+F.D//) < C R)^甘土
[0023]3.3)根
【權(quán)利要求】
1.一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,其特征在于:所述構(gòu)象空間優(yōu)化方法包括以下步驟: 1)初始化種群:從蛋白質(zhì)片段庫(kù)中隨機(jī)選取片段產(chǎn)生包含POpSize個(gè)個(gè)體的種群Pint,并設(shè)置算法參數(shù):種群大小popSize,蛋白質(zhì)序列長(zhǎng)度Length,算法的迭代次數(shù)T,算法的交叉因子CR,蛋白質(zhì)片段的長(zhǎng)度L ; 2)根據(jù)評(píng)分函數(shù)f計(jì)算每個(gè)種群的函數(shù)值大小,并進(jìn)行排序,其中Pniax的函數(shù)值最優(yōu); 3)在未達(dá)到設(shè)定的終止條件時(shí),進(jìn)行以下操作 3.1)對(duì)種群Pint中每個(gè)個(gè)體Pi做以下操作:
3.1.1)設(shè) i = 1,其中 i e {I, 2, 3, L, popSize}; 3.1.2)其中POTigin = Pi, Porigin為初始種群,Pi為Pint中的每個(gè)個(gè)體; 3.1.3)隨機(jī)生成正整數(shù) randl, rand2, rand3 ;其中 randl 幸 rand2,且randl, rand2 e {I, 2, L, Length},rand3 e {I, 2, 3,......popSize}; 3.1.4)針對(duì)個(gè)體&做變異操作,其中: j e {min (randl, rand2),…,max (randl, rand2)}
a:令 Porigin- Phi (j) — Prand3- Phi (j);
b:令 Porigin- psi (j) — P rand3*
psi (j);
c:令 Porigin.0mega (j) — Prand3.0mega (j) 其中phi, psi, omega分別表示構(gòu)象的三個(gè)二面角Φ, Ψ, ω ; 3.2)通過(guò)變異操作得到個(gè)體Snrat ;
3.4)對(duì)所得到的Pmw執(zhí)行選擇操作,若f (Pmw) >f (Pfflax),則Pm替換Pmax,否則保持種群不變; 4)判斷是算法迭代是否執(zhí)行T次,如若未達(dá)到,則t— t+1,轉(zhuǎn)至3)繼續(xù)循環(huán)執(zhí)行算法,至達(dá)到終止條件。
2.如權(quán)利要求1所述一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,其特征在于:所述步驟 3.1.3 中,隨機(jī)數(shù) randl、rand2、rand3 選取,其中 randl 幸 rand2, rand3 幸 i。
3.如權(quán)利要求1或2所述一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,其特征在于:所述步驟3.1.4中,氨基酸j值大小在randl和rand2之間。
4.如權(quán)利要求3所述一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,其特征在于:所述步驟3.1.4中,變異操作將POTigin的氨基酸j所對(duì)應(yīng)的二面角ph1、ps1、omega替換為Prand3的相同位置所對(duì)應(yīng)的二面角。
5.如權(quán)利要求1或2所述一種基于片段組裝的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,其特征在于:所述步驟3.3中的交叉操作,若隨機(jī)數(shù)rand⑷〈=CR,個(gè)體Smw的片段K替換為個(gè)體POTigin中對(duì)應(yīng)的第k個(gè)片段,否則直接繼承個(gè)體Smw的第k個(gè)片段。
【文檔編號(hào)】G06F19/16GK104200131SQ201410354134
【公開日】2014年12月10日 申請(qǐng)日期:2014年7月23日 優(yōu)先權(quán)日:2014年7月23日
【發(fā)明者】張貴軍, 郝小虎, 周曉根, 秦傳慶, 梅珊 申請(qǐng)人:浙江工業(yè)大學(xué)