[0026] 從獲得的所述匹配信息中提取蛋白質(zhì)鏈上規(guī)則的金屬結(jié)合位點(diǎn)局域結(jié)構(gòu);
[0027] 分解所述金屬結(jié)合位點(diǎn),建立單配體殘基與金屬離子相對空間位置關(guān)系的模板 庫。
[0028] 作為優(yōu)選,在獲得所述蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)的單殘基匹配信息時(shí) 還進(jìn)行去重處理,僅保留兩兩之間序列一致性小于80%的金屬蛋白結(jié)構(gòu)。
[0029] 作為優(yōu)選,在建立所述單配體殘基與金屬離子相對空間位置關(guān)系的模板庫之后還 包括下列步驟:
[0030] 計(jì)算每個(gè)單配體殘基模板的D、G、C值,按殘基和金屬離子Μ類型分類去冗余,建立 非冗余的單配體殘基模板庫;
[0031] 其中,D值二金屬離子Μ與單配體殘基Ce原子的距離;
[003^ G值=M-Ce-CaS原子形成的夾角;
[00削 C值=M-Ce-Ca-C四原子形成的二面角;
[0034] Ce、Ca、C均為同一單配體殘基上原子。
[0035] 作為優(yōu)選,在建立所述單配體殘基與金屬離子相對空間位置關(guān)系的模板庫之后還 包括下列步驟:
[0036] 統(tǒng)計(jì)所述金屬離子可結(jié)合的配體殘基及第一配位層原子類型,W及天然態(tài)的空間 幾何物理量分布;W及
[0037] 依據(jù)單配體殘基類型,對建立的所述單殘基匹配組合模板庫進(jìn)行分類。
[0038] 本發(fā)明還公開了一種基于蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)的單配體殘基模 板庫的預(yù)測方法,包括W下步驟:
[0039] 通過預(yù)先建立的蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)單配體殘基模板庫中的模 板與待預(yù)測蛋白質(zhì)上的同類型殘基進(jìn)行匹配,W此預(yù)測蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位 點(diǎn)的潛在單配體殘基;
[0040] 其中,預(yù)先建立的蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)單配體殘基模板庫是根據(jù) 如上所述蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)單配體殘基模板庫的建立方法建立的。
[0041] 作為優(yōu)選,通過預(yù)先建立的單配體殘基模板庫中模板與待預(yù)測蛋白質(zhì)上的同類型 殘基進(jìn)行匹配的步驟具體包括:
[0042] 步驟1,在預(yù)測第一和第二潛在配體殘基時(shí),將所述預(yù)先建立的單配體殘基模板庫 中每個(gè)與目標(biāo)殘基類型一致的模板逐個(gè)疊合代入待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中,W疊合后的模板 殘基側(cè)鏈構(gòu)象,預(yù)測待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中該潛在配體殘基結(jié)合相同金屬離子時(shí)的構(gòu)象 態(tài),篩選出滿足條件的構(gòu)象態(tài);
[0043] 步驟2,固定步驟1篩選出的第一、第二潛在配體殘基構(gòu)象態(tài),W初步預(yù)測出的金屬 離子與附近殘基的C、Ca、Ce的相對位置D、G、C值為約束條件,篩選第Ξ潛在配體殘基位點(diǎn)及 合適的模板,計(jì)算該模板下的預(yù)測構(gòu)象態(tài),W及基于相同規(guī)則原理,篩選出可能存在的第四 潛在配體殘基位點(diǎn)、合適的模板和可能的構(gòu)象態(tài);其中D值為金屬離子Μ與單配體殘基Ce原 子的距離;G值為M-Ce-CaS原子形成夾角;C值為M-Ce-Ca-C四原子形成的二面角,Ce、Ca、C均 為同一單配體殘基上原子;
[0044] 步驟3,采用整體評估打分排序的策略篩選出最終預(yù)測構(gòu)象態(tài),其中所述打分采用 計(jì)算偏差值,打分函數(shù)基于預(yù)測的構(gòu)象態(tài)與來自天然的單配體模板及金屬結(jié)合位點(diǎn)空間標(biāo) 準(zhǔn)構(gòu)象態(tài)雙重偏差計(jì)算。
[0045] 作為優(yōu)選,步驟1所述篩選出滿足條件的構(gòu)象態(tài)的步驟中,所述條件至少包括:
[0046] ①第一配位層原子空間構(gòu)型符合馨合該類型金屬離子的要求;
[0047] ②排除空間位阻和過近接觸。
[0048] 作為優(yōu)選,步驟3所述整體評估打分排序的策略中,打分函數(shù)的公式為:
[0049]
[0050] 其中,Deviation表示預(yù)測的構(gòu)象態(tài)與來自天然的單配體模板和金屬結(jié)合位點(diǎn)空 間標(biāo)準(zhǔn)構(gòu)象態(tài)之間的偏差;Μη為在模板庫中各配體殘基分別對應(yīng)的金屬離子坐標(biāo),Μ為上述 金屬離子坐標(biāo)Μη的Ξ維空間平均坐標(biāo);m依據(jù)該金屬位點(diǎn)含有的配體殘基數(shù)目決定;Κυ為該 預(yù)測位點(diǎn)中,W金屬離子為中屯、,不同配體殘基的第一配位層原子形成的夾角;Κ值為天然 態(tài)金屬蛋白結(jié)構(gòu)中,W金屬離子為中屯、,不同配體殘基的第一配位層原子形成夾角分布的 理論最佳值或平均值;Ν為Κυ的總數(shù)目;Ρ為權(quán)重系數(shù)常數(shù);位點(diǎn)總得分小于闊值的最終預(yù)測 為陽性結(jié)果。
[0051] 本發(fā)明還公開了一種基于蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點(diǎn)的單配體殘基模 板庫的預(yù)測方法,包括W下步驟:
[0052] a. W兩個(gè)殘基的Ce-Ca-C原子疊合方式,將預(yù)先建立的單配體殘基模板庫中每個(gè)與 目標(biāo)殘基類型一致的模板逐個(gè)疊合代入待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中,W疊合后的模板殘基側(cè)鏈 構(gòu)象,預(yù)測待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中該潛在配體殘基結(jié)合相同金屬離子時(shí)的構(gòu)象態(tài);
[0053] b.如果步驟a中得到的兩個(gè)潛在配體殘基構(gòu)象態(tài)中金屬離子坐標(biāo)足夠接近則視為 結(jié)合同一金屬離子;分析兩兩潛在配體殘基結(jié)合相應(yīng)金屬離子時(shí)的構(gòu)象態(tài)組合在一起是否 也滿足結(jié)合該金屬離子的空間立體構(gòu)象必要條件,W此篩選出一個(gè)可能結(jié)合該金屬離子位 點(diǎn)的第一潛在配體殘基和第二潛在配體殘基W及初步預(yù)測結(jié)合的金屬離子坐標(biāo);
[0054] C.W初步預(yù)測結(jié)合的金屬離子坐標(biāo)與周圍殘基的相對位置關(guān)系,W關(guān)鍵幾何量D、 G、C值作為篩選待預(yù)測蛋白質(zhì)上潛在配體殘基的指標(biāo),確定出少數(shù)可能的模板,其中D值為 金屬離子Μ與單配體殘基Ce原子的距離;G值為M-Ce-CaS原子形成夾角;C值為M-Ce-Ca-C四原 子形成的二面角;再W步驟a中所述的方法預(yù)測出第Ξ潛在配體殘基結(jié)合相同金屬離子時(shí) 的構(gòu)象態(tài),再次篩選Ξ個(gè)潛在配體殘基在各自模板指導(dǎo)下的構(gòu)象態(tài)組合在一起是否也滿足 結(jié)合該金屬離子的空間立體構(gòu)象必要條件;
[0055] d.如步驟C所述,篩選潛在的其它配體殘基;
[0056] e.當(dāng)一個(gè)金屬結(jié)合位點(diǎn)中所有潛在配體殘基逐次篩選完后,采用位點(diǎn)整體評估打 分排序的策略做最終篩選,其中所述的打分通過計(jì)算偏差值實(shí)現(xiàn),打分函數(shù)基于預(yù)測的構(gòu) 象態(tài)與來自天然的單配體模板及金屬結(jié)合位點(diǎn)空間幾何特性雙重偏差得到。
[0057] 本發(fā)明預(yù)測方法作為基本原理可運(yùn)用于不同金屬離子類型的位點(diǎn)預(yù)測,具體還需 結(jié)合該金屬離子結(jié)合位點(diǎn)的特征作為篩選條件。為了進(jìn)一步說明本發(fā)明的技術(shù)方案,下面 W預(yù)測鋒離子結(jié)合位點(diǎn)為例,具體描述該方法原理及流程。但本領(lǐng)域技術(shù)人員應(yīng)該明了的 是,下述實(shí)施例僅是示意性地,本發(fā)明的方法并不限于此。
[005引實(shí)施例1.本發(fā)明預(yù)測方法的建立
[0059] 如圖1-3所示,該方法分為模板庫等數(shù)據(jù)準(zhǔn)備及預(yù)測兩個(gè)階段,主要包括如下步 驟:
[0060] 【數(shù)據(jù)準(zhǔn)備階段】
[0061 ] ?從現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中(例如]11:化://\¥麗.1^313.0巧/口化/1101116/1101116.(1〇 公開數(shù)據(jù)資源)下載含鋒離子的所有PDB數(shù)據(jù)文件。本地化處理提取兩兩之間序列一致性小 于80 %的金屬蛋白結(jié)構(gòu)。
[0062] ?從非冗余蛋白質(zhì)鏈中提取規(guī)則的金屬結(jié)合位點(diǎn)局域結(jié)構(gòu)。規(guī)則的金屬結(jié)合位點(diǎn) 由不同金屬類型結(jié)合位點(diǎn)特性決定,比如對于鋒結(jié)合位點(diǎn)定義為:①由Ξ個(gè)配體殘基+-個(gè) 水分子或者四個(gè)配體殘基組成,②鋒的占有率較高(比如高于0.8)且溫度因子較低(比如低 于40),③與金屬離子結(jié)合的第一配位層原子分布(具體考察兩個(gè)物理量:第一配位層原子 與鋒離子的配位距離及來自不同殘基的第一配位層原子與鋒離子形成的夾角)在85%的天 然態(tài)第一配位層原子分布范圍內(nèi)。W金屬離子