亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法與流程

文檔序號:12125405閱讀:617來源:國知局

本發(fā)明涉及生物信息學(xué)、計算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法。



背景技術(shù):

蛋白質(zhì)分子在生物細(xì)胞化學(xué)反應(yīng)過程中起著至關(guān)重要的作用。它們的結(jié)構(gòu)模型和生物活性狀態(tài)對我們理解和治愈多種疾病有重要的意義。蛋白質(zhì)只有折疊成特定的三維結(jié)構(gòu)才能產(chǎn)生其特有的生物學(xué)功能。因此,要了解蛋白質(zhì)的功能,就必須獲得其三維空間結(jié)構(gòu)。

蛋白質(zhì)結(jié)構(gòu)預(yù)測問題自上世紀(jì)50年代以來就一直備受關(guān)注,尤其是從頭預(yù)測構(gòu)象空間優(yōu)化方法,是生物信息學(xué)和計算生物學(xué)領(lǐng)域的熱點(diǎn)研究課題,因?yàn)榈鞍踪|(zhì)的三維空間結(jié)構(gòu)決定了它所承載的生物功能,想要了解其功能進(jìn)而對許多由蛋白質(zhì)結(jié)構(gòu)改變而引起的疾病進(jìn)行有效的控制和預(yù)防,就必須獲得其三維結(jié)構(gòu)。從頭預(yù)測方法直接從蛋白質(zhì)的氨基酸序列出發(fā),根據(jù)Anfinsen原則,以計算機(jī)為工具,運(yùn)用適當(dāng)算法,通過計算得到蛋白質(zhì)的天然構(gòu)象,適用于同源性小于25%的大多數(shù)蛋白質(zhì)。而制約從頭預(yù)測方法預(yù)測精度的瓶頸因素主要有兩個方面:第一,蛋白質(zhì)構(gòu)象空間的高維復(fù)雜性以及能量表面的粗糙性,使其成為一個難解的NP-Hard問題;第二,力場模型的不精確性也使得預(yù)測結(jié)果難以達(dá)到較高的精度。設(shè)計有效的算法增強(qiáng)對構(gòu)象空間的采樣是解決蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測瓶頸問題的有效途徑。但是到目前還沒有一種十分完善的方法來預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),即使獲得了很好的預(yù)測結(jié)果,但也只是針對某些蛋白質(zhì)而言的,目前主要的技術(shù)瓶頸在于兩個方面,第一方面在于采樣方法,現(xiàn)有技術(shù)對構(gòu)象空間采樣能力不強(qiáng),另一方面在于構(gòu)象更新方法,現(xiàn)有技術(shù)對構(gòu)象的更新精度仍然不足。

因此,現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法存在不足,需要改進(jìn)。



技術(shù)實(shí)現(xiàn)要素:

為了克服現(xiàn)有蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的構(gòu)象空間搜索維數(shù)較高、收斂速度較慢、預(yù)測精度較低的不足,本發(fā)明基于差分進(jìn)化算法,提出一種構(gòu)象空間搜索維數(shù)較低、收斂速度較快、預(yù)測精度較高的局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,在差分進(jìn)化算法框架下,采用Rosetta score3粗粒度知識能量模型來降低構(gòu)象空間維數(shù);將構(gòu)象種群劃分為多個模態(tài),以保持種群多樣性,采用片段組裝技術(shù)來提高預(yù)測精度,同時采用蒙特卡洛算法對種群做增強(qiáng);在種群進(jìn)化后期,使用抽象凸估計技術(shù),建立模態(tài)的下界估計模型,構(gòu)建廣義下降方向,對模態(tài)內(nèi)個體做局部增強(qiáng),以得到更為優(yōu)良的局部構(gòu)象;結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力,可以對構(gòu)象空間進(jìn)行更為有效的搜索。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:

一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,包括以下步驟:

1)給定輸入序列信息;

2)設(shè)置系統(tǒng)參數(shù):種群大小popSize,算法的迭代次數(shù)T,交叉因子CR,變異因子MU,片段的長度L,模態(tài)數(shù)量N;

3)種群初始化:由輸入序列產(chǎn)生popSize個種群個體Pinit;

4)模態(tài)建立:將種群平均劃分為N個模態(tài);

5)開始迭代,執(zhí)行種群進(jìn)化過程:

5.1)設(shè)i=1,j=1,其中i∈{1,2,3,…,N},j∈{1,2,3,…,Nmodal};令Ptarget=Pij,其中i,j為序號,Nmodal表示模態(tài)中個體的數(shù)目,Ptarget表示目標(biāo)個體;

5.2)針對個體Ptarget做變異操作:從L=3的片段庫中隨機(jī)選擇片段進(jìn)行片段組裝,得到中間個體Ptrial′;

5.3)隨機(jī)生成正整數(shù)rand1,rand2,rand3,其中rand1∈{1,2,3,...,Nmodal},rand1≠j,rand2∈{1,2,…,Length},rand3∈(0,1),其中Length為序列長度;

5.4)若隨機(jī)數(shù)rand3<=CR,針對Ptrial’做交叉操作:令l=rand1;k=rand2;令即:將Ptrial′的第k個氨基酸所對應(yīng)的二面角替換為Pl相同位置氨基酸對應(yīng)的二面角

5.5)令Ptrial=Ptrial′,得到測試個體Ptrial;

5.6)執(zhí)行更新操作:根據(jù)Rosetta Score3能量函數(shù)計算Ptarget和Ptrial的能量:E(Ptarget),E(Ptrial);若E(Ptarget)>E(Ptrial)令Ptarget=Ptrial,否則保持種群不變;

5.7)得到更新后的種群Pupdate

5.8)針對種群Pupdate中的每一個模態(tài)做模態(tài)增強(qiáng):

5.8.1)選擇模態(tài)中能量最低的兩個個體Pdes1,Pdes2,構(gòu)建當(dāng)前模態(tài)的下界支撐面,得到模態(tài)區(qū)域最小估計值xmin;

5.8.2)根據(jù)構(gòu)建廣義下降方向Ddes,其中為個體Pdes1的二面角表示;

5.8.3)根據(jù)生成增強(qiáng)個體Penhance,其中為個體Pdes2的二面角表示,λ為步長調(diào)整因子;

5.8.4)根據(jù)Rosetta Score3能量函數(shù)計算增強(qiáng)個體的能量:E(Penhance),并與當(dāng)前模態(tài)中能量最高的個體Pmax進(jìn)行比較,若能量下降,則用增強(qiáng)個體替換當(dāng)前能量最高個體;

6)迭代運(yùn)行步驟5)至達(dá)到終止條件。

進(jìn)一步,所述步驟6)中,終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)Tmax。

本發(fā)明的有益效果為:在差分進(jìn)化算法框架下,采用Rosetta score3粗粒度知識能量模型來降低構(gòu)象空間維數(shù);將構(gòu)象種群劃分為多個模態(tài),以保持種群多樣性,采用片段組裝技術(shù)來提高預(yù)測精度,同時采用蒙特卡洛算法對種群做增強(qiáng);在種群進(jìn)化后期,使用抽象凸估計技術(shù),建立模態(tài)的下界估計模型,構(gòu)建廣義下降方向,對模態(tài)內(nèi)個體做局部增強(qiáng),以得到更為優(yōu)良的局部構(gòu)象;結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力,可以對構(gòu)象空間進(jìn)行更為有效的搜索。

附圖說明

圖1是蛋白質(zhì)2L0G預(yù)測結(jié)構(gòu)和實(shí)驗(yàn)室測定結(jié)構(gòu)最接近的構(gòu)象三維示意圖。

具體實(shí)施方式

下面結(jié)合附圖對本發(fā)明作進(jìn)一步描述。

參照圖1,一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,包括以下步驟:

1)給定輸入序列信息;

2)設(shè)置系統(tǒng)參數(shù):種群大小popSize,算法的迭代次數(shù)T,交叉因子CR,變異因子MU,片段的長度L,模態(tài)數(shù)量N;

3)種群初始化:由輸入序列產(chǎn)生popSize個種群個體Pinit

4)模態(tài)建立:將種群平均劃分為N個模態(tài);

5)開始迭代,執(zhí)行種群進(jìn)化過程:

5.1)設(shè)i=1,j=1,其中i∈{1,2,3,…,N},j∈{1,2,3,…,Nmodal};令Ptarget=Pij,其中i,j為序號,Nmodal表示模態(tài)中個體的數(shù)目,Ptarget表示目標(biāo)個體;

5.2)針對個體Ptarget做變異操作:從L=3的片段庫中隨機(jī)選擇片段進(jìn)行片段組裝,得到中間個體Ptrial′;

5.3)隨機(jī)生成正整數(shù)rand1,rand2,rand3,其中rand1∈{1,2,3,...,Nmodal},rand1≠j,rand2∈{1,2,…,Length},rand3∈(0,1),其中Length為序列長度;

5.4)若隨機(jī)數(shù)rand3<=CR,針對Ptrial’做交叉操作:令l=rand1;k=rand2;令即:將Ptrial′的第k個氨基酸所對應(yīng)的二面角替換為Pl相同位置氨基酸對應(yīng)的二面角

5.5)令Ptrial=Ptrial′,得到測試個體Ptrial;

5.6)執(zhí)行更新操作:根據(jù)Rosetta Score3能量函數(shù)計算Ptarget和Ptrial的能量:E(Ptarget),E(Ptrial);若E(Ptarget)>E(Ptrial)令Ptarget=Ptrial,否則保持種群不變;

5.7)得到更新后的種群Pupdate;

5.8)針對種群Pupdate中的每一個模態(tài)做模態(tài)增強(qiáng):

5.8.1)選擇模態(tài)中能量最低的兩個個體Pdes1,Pdes2,構(gòu)建當(dāng)前模態(tài)的下界支撐面,得到模態(tài)區(qū)域最小估計值xmin

5.8.2)根據(jù)構(gòu)建廣義下降方向Ddes,其中為個體Pdes1的二面角表示;

5.8.3)根據(jù)生成增強(qiáng)個體Penhance,其中為個體Pdes2的二面角表示,λ為步長調(diào)整因子;

5.8.4)根據(jù)Rosetta Score3能量函數(shù)計算增強(qiáng)個體的能量:E(Penhance),并與當(dāng)前模態(tài)中能量最高的個體Pmax進(jìn)行比較,若能量下降,則用增強(qiáng)個體替換當(dāng)前能量最高個體;

6)迭代運(yùn)行步驟5)至達(dá)到終止條件.

進(jìn)一步,所述步驟6)中,終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)Tmax

本實(shí)施例以序列長度為32的蛋白質(zhì)2L0G為實(shí)施例,一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,其中包含以下步驟:

1)給定輸入序列信息;

2)設(shè)置系統(tǒng)參數(shù):種群大小popSize,算法的迭代次數(shù)T,交叉因子CR,變異因子MU,片段的長度L,模態(tài)數(shù)量N;

3)種群初始化:由輸入序列產(chǎn)生popSize個種群個體Pinit;

4)模態(tài)建立:將種群平均劃分為N個模態(tài);

5)開始迭代,執(zhí)行種群進(jìn)化過程:

5.1)設(shè)i=1,j=1,其中i∈{1,2,3,…,N},j∈{1,2,3,…,Nmodal};令Ptarget=Pij,其中i,j為序號,Nmodal表示模態(tài)中個體的數(shù)目,Ptarget表示目標(biāo)個體;

5.2)針對個體Ptarget做變異操作:從L=3的片段庫中隨機(jī)選擇片段進(jìn)行片段組裝,得到中間個體Ptrial′;

5.3)隨機(jī)生成正整數(shù)rand1,rand2,rand3,其中rand1∈{1,2,3,...,Nmodal},rand1≠j,rand2∈{1,2,…,Length},rand3∈(0,1),其中Length為序列長度;

5.4)若隨機(jī)數(shù)rand3<=CR,針對Ptrial’做交叉操作:令l=rand1;k=rand2;令即:將Ptrial′的第k個氨基酸所對應(yīng)的二面角替換為Pl相同位置氨基酸對應(yīng)的二面角

5.5)令Ptrial=Ptrial′,得到測試個體Ptrial;

5.6)執(zhí)行更新操作:根據(jù)Rosetta Score3能量函數(shù)計算Ptarget和Ptrial的能量:E(Ptarget),E(Ptrial);若E(Ptarget)>E(Ptrial)令Ptarget=Ptrial,否則保持種群不變;

5.7)得到更新后的種群Pupdate

5.8)針對種群Pupdate中的每一個模態(tài)做模態(tài)增強(qiáng):

5.8.1)選擇模態(tài)中能量最低的兩個個體Pdes1,Pdes2,構(gòu)建當(dāng)前模態(tài)的下界支撐面,得到模態(tài)區(qū)域最小估計值xmin

5.8.2)根據(jù)構(gòu)建廣義下降方向Ddes,其中為個體Pdes1的二面角表示;

5.8.3)根據(jù)生成增強(qiáng)個體Penhance,其中為個體Pdes2的二面角表示,λ為步長調(diào)整因子;

5.8.4)根據(jù)Rosetta Score3能量函數(shù)計算增強(qiáng)個體的能量:E(Penhance),并與當(dāng)前模態(tài)中能量最高的個體Pmax進(jìn)行比較,若能量下降,則用增強(qiáng)個體替換當(dāng)前能量最高個體;

6)迭代運(yùn)行步驟5)至達(dá)到終止條件,終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)Tmax;

以序列長度為32的蛋白質(zhì)2L0G為實(shí)施例,運(yùn)用以上方法得到了該蛋白質(zhì)的近天然態(tài)構(gòu)象,預(yù)測結(jié)構(gòu)和實(shí)驗(yàn)室測定結(jié)構(gòu)最接近的構(gòu)象三維示意圖如圖1所示。

以上闡述的是本發(fā)明給出的一個實(shí)施例表現(xiàn)出來的優(yōu)良效果,顯然本發(fā)明不僅適合上述實(shí)施例,在不偏離本發(fā)明基本精神及不超出本發(fā)明實(shí)質(zhì)內(nèi)容所涉及內(nèi)容的前提下可對其做種種變化加以實(shí)施。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1