亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法

文檔序號(hào):6464341閱讀:349來(lái)源:國(guó)知局

專利名稱::一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種研究蛋白構(gòu)象病的方法,尤其是一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法。
背景技術(shù)
:蛋白質(zhì)是生物體執(zhí)行生理功能的基本物質(zhì)。生物體內(nèi)絕大多數(shù)生病理過(guò)程都有蛋白質(zhì)的直接參與。其中存在一些蛋白質(zhì),它們會(huì)在病理狀態(tài)下折疊成與正常態(tài)不同的錯(cuò)誤結(jié)構(gòu),從而引起病變,這種疾病被稱為蛋白構(gòu)象病。判斷蛋白質(zhì)分子發(fā)生病態(tài)結(jié)構(gòu)轉(zhuǎn)換的發(fā)病位點(diǎn)是在分子水平上研究、治療這類疾病的一項(xiàng)基本要求。對(duì)該問(wèn)題的研究涉及生命現(xiàn)象的解析,構(gòu)象病發(fā)病機(jī)制的排查,構(gòu)象病臨床療法的制定,轉(zhuǎn)基因生命體設(shè)計(jì)等諸多方向和領(lǐng)域。該問(wèn)題的研究對(duì)于臨床醫(yī)學(xué)尤為重要。例如,如果每個(gè)蛋白結(jié)構(gòu)轉(zhuǎn)換的發(fā)病位點(diǎn)都是已知的,我們就可以對(duì)臨床中觀察到的異常表達(dá)的某些蛋白進(jìn)行人為的藥物干預(yù),阻斷其錯(cuò)折疊途徑,從而維持正常的生理功能、達(dá)到治療目的。蛋白質(zhì)分子是由二十種氨基酸(不同的氨基酸由不同的字母來(lái)表示)首尾相連而成的一維長(zhǎng)鏈。蛋白質(zhì)的三維結(jié)構(gòu)是通過(guò)鏈內(nèi)和鏈外的作用力使該一維長(zhǎng)鏈在三維空間中折疊、塌縮而成。當(dāng)前研究構(gòu)象病蛋白發(fā)病起始點(diǎn)的主要方法是實(shí)驗(yàn)方法。如通過(guò)單殘基突變產(chǎn)生變異體,再觀測(cè)其淀粉樣沉淀的形成情況;觀測(cè)病態(tài)蛋白的結(jié)構(gòu)。目前的實(shí)驗(yàn)方法的研究路線存在兩方面的不足一方面是花費(fèi)高昂,無(wú)論是資金,還是人力、物力、時(shí)間;更為重要的是,該路線必須有一個(gè)研究的前提,就是研究者必須擁有病態(tài)蛋白。但因?yàn)檎嬲袇R總并能分析到分子水平的病例在實(shí)際臨床中少之又少,所以真正能被納入研究的只是滄海一粟,這就使得可供研究的蛋白種類會(huì)非常有限,因而無(wú)法對(duì)生命體的蛋白構(gòu)象病進(jìn)行全面的系統(tǒng)研究。
發(fā)明內(nèi)容針對(duì)蛋白構(gòu)象病,我們經(jīng)過(guò)研究發(fā)現(xiàn),蛋白構(gòu)象病的發(fā)病位點(diǎn)和蛋白質(zhì)分子多肽相空間(把所有自然界中存在的多肽都映射為相應(yīng)的代表點(diǎn),并將這些代表點(diǎn)畫(huà)在一個(gè)二維平面內(nèi),有親緣關(guān)系的代表點(diǎn)以直線相連)的一個(gè)拓樸特征"雙吸引域特性,,密切相關(guān)。蛋白質(zhì)分子的多肽相空間可以;陂分成兩個(gè)基本隔離的區(qū);或,helix-donut區(qū)和strand-arc區(qū),蛋白進(jìn)化的過(guò)程中,多肽段的演化會(huì)主要在某一個(gè)區(qū)域進(jìn)行,其同源肽孚爻跳轉(zhuǎn)到另一區(qū)域的幾率很少,而一旦出現(xiàn)同源肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域,則對(duì)應(yīng)著多肽段三維結(jié)構(gòu)的劇烈變化,并由此會(huì)引起構(gòu)象病。因此,通過(guò)研究同源肽^a的這種跳轉(zhuǎn),可以預(yù)測(cè)出可能引起蛋白構(gòu)象病的發(fā)病位點(diǎn)。基于上述研究發(fā)現(xiàn),本發(fā)明的目的在于提供一種判斷蛋白構(gòu)象病中蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,利用該方法可以預(yù)測(cè)出可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化的關(guān)鍵位點(diǎn),從而為對(duì)蛋白構(gòu)象病的系統(tǒng)研究創(chuàng)造條件。為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,利用多肽相空間的"雙吸引域特性"進(jìn)行預(yù)測(cè),具體包括如下步驟1)將已知的由自然界中有代表性的蛋白質(zhì)所構(gòu)成的非冗余數(shù)據(jù)集作為基礎(chǔ)數(shù)據(jù);2)將基礎(chǔ)數(shù)據(jù)中的每個(gè)蛋白質(zhì)分子視為連續(xù)的多肽鏈,按照m殘基長(zhǎng)將每個(gè)蛋白質(zhì)分子均劃分成n-m+l個(gè)多肽段,由此構(gòu)建一個(gè)多肽^:總集合,其中n為蛋白質(zhì)分子多肽鏈的殘基數(shù);3)構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多肽段子集合;4)將待研究蛋白質(zhì)分子多肽鏈按照m殘基長(zhǎng)劃分成n-m+l個(gè)多肽段,并將劃分的各多肽段按其起始位置定義為j位多肽段,j=2~n-m,計(jì)算每個(gè)多肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率;5)濾除進(jìn)化允許的構(gòu)象變化,察看多肽段中心氨基酸兩側(cè)一定范圍內(nèi)是否既有螺旋態(tài),又有卩折疊態(tài),如果是,則表明生理狀態(tài)下,此段多肽既存在螺旋態(tài)和(3折疊態(tài)的動(dòng)態(tài)消長(zhǎng),排除可能導(dǎo)致蛋白構(gòu)象病的可疑性;6)統(tǒng)計(jì)、分析所研究蛋白質(zhì)分子各個(gè)多肽段的跳轉(zhuǎn)概率,跳轉(zhuǎn)概率最高的多肽段即為可能導(dǎo)致蛋白構(gòu)象病的關(guān)鍵位點(diǎn)。進(jìn)一步,所述步驟l)中的非冗余數(shù)據(jù)集具體為pdbselect25。進(jìn)一步,所述步驟2)中m具體為15。進(jìn)一步,所述步驟3)具體包括如下步驟①將待構(gòu)建同源多肽段子集合的多肽段作為查詢多肽>^在多肽^殳總集合中,查找與查詢多肽段相比同時(shí)滿足以下條件的其它多肽段,并將查找到的多肽段構(gòu)建成查詢多肽^殳的同源多肽段候選集合i)序列相似;ii)結(jié)構(gòu)相似;iii)表面殘基分布相似;iv)具有低等同率;②按同樣條件構(gòu)建多肽段總集合中的每一個(gè)多肽段的同源多肽段候選集合;③如果有兩個(gè)多肽H其中一個(gè)是另一個(gè)的候選同源多肽,則將與二者相應(yīng)的兩個(gè)候選集合進(jìn)行比對(duì),如果兩個(gè)候選集合中存在至少5個(gè)相同多肽段,則這兩個(gè)多肽段被確認(rèn)為互為同源多肽段;④對(duì)總集中的每一多肽段,搜集與其同源的多肽段組成該多肽段的同源多肽段子集合。構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多^!殳子集合,并最終形成一包含所有同源多肽段子集合的子集合數(shù)據(jù)庫(kù)。進(jìn)一步,所述步驟4)具體為將待研究蛋白質(zhì)分子多肽鏈按照15殘基長(zhǎng)劃分成n-14個(gè)多肽段,并將劃分的各多肽段按其起始位置定義為j位多肽段,j=2~n-15,計(jì)算每個(gè)多肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率,具體計(jì)算步驟為①針對(duì)每一個(gè)j位多肽段,按步驟3)①中所列的四個(gè)條件,在多肽段總集合中查找符合該四個(gè)條件的多肽段,將查找到的所有多肽"^殳的同源多肽段子集合合并成一與j位多肽,殳相關(guān)聯(lián)的多肽段組;②分別對(duì)多肽段組中每個(gè)多肽段的類別進(jìn)行定義,將每個(gè)多肽段中心氨基酸兩側(cè)的兩個(gè)7殘基長(zhǎng)子段定義為aiai+1...ai+6,其中i=0或8,a代表多肽段上的殘基,如果子段中至少4個(gè)殘基處于螺旋態(tài),則該子段被定義為//,如果其中至少4個(gè)殘基處于(3折疊態(tài),則該子段被定義為£,否則;故定義為C,由此15殘基長(zhǎng)多肽l殳可^皮定義為9類,即//C,C7Z,£C,C£,£i/,iffi,CC,經(jīng)研究發(fā)現(xiàn),其中helix-donut區(qū)以////+/^+(^/為主,strand-arc區(qū)則以££+£C+C£為主;③根據(jù)多肽段組中各多肽段的類別,分別計(jì)算所研究的第j位多肽段屬于////+i/c+a/和££+£c+c£的扭無(wú)率和^(////+//c+o/)=屬于////+//c+a/的多肽段凄t/總樣本凄t尸,+五C+C£)=屬于+£C+C£的多肽段凄t/總樣本數(shù)同時(shí)按相同步驟計(jì)算第j-1位和第j+1位多肽段分別屬于////+/^+67/和EE+£C+C£的沖既率;④根據(jù)第j位多肽段的類別計(jì)算其跳轉(zhuǎn)概率込,當(dāng)?shù)趈位多肽段位于helix-donut區(qū),即i///+//C+C//區(qū)時(shí),Q=(1-尸廣,(////+//C+(££+£C+C五)(l_尸川(////+//C+C//))當(dāng)?shù)趈位多肽段位于strand-arc區(qū),即+£C+C£區(qū)時(shí),貝'JA=(1-尸廣,+£C+C£))C(朋+7/C+C7/)(l-P川(+£C+C幼如果第j位多肽段不處于helix-donut區(qū)和strand-arc區(qū),則Q=0。本發(fā)明方法通過(guò)引入計(jì)算機(jī)算法,進(jìn)行研究路線的戰(zhàn)略調(diào)整,由單純的側(cè)重實(shí)驗(yàn)的技術(shù)路線轉(zhuǎn)化為先利用算法排查,再進(jìn)行實(shí)驗(yàn)研究的技術(shù)路線,克服了現(xiàn)有技術(shù)中蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)換研究復(fù)雜程度高,人力、財(cái)力消耗巨大,而且耗時(shí)長(zhǎng)、效率低等問(wèn)題,為對(duì)生命體的蛋白構(gòu)象病進(jìn)行全面的系統(tǒng)研究創(chuàng)造了條件。下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明圖1為本發(fā)明實(shí)施例l檢測(cè)正常人Prion蛋白分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的結(jié)果圖。具體實(shí)施方式實(shí)施例1:本發(fā)明提供一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,利用多肽相空間的"雙吸引域特性"進(jìn)行預(yù)測(cè),具體包括如下步驟1.將已知的由自然界中有代表性的蛋白質(zhì)所構(gòu)成的非冗余數(shù)據(jù)集作為基礎(chǔ)數(shù)據(jù)。自然界中,蛋白質(zhì)彼此之間的相似程度是不同的。有些蛋白彼此非常相似,序列比對(duì)好后,殘基相同率很高(比如大于90%),被稱為近同源蛋白。為了扣除這種近同源蛋白的影響,盡量使對(duì)數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析時(shí),各個(gè)樣本權(quán)重相近,人們利用已有技術(shù)對(duì)包含已知結(jié)構(gòu)的全部蛋白的數(shù)據(jù)集進(jìn)行了非冗余化處理;舍棄掉某些同源性過(guò)于相近的蛋白,從而得到一個(gè)代表集。對(duì)代表集中樣本的研究就可以絕大部分的涵蓋整個(gè)蛋白質(zhì)數(shù)據(jù)集的性質(zhì)。我們所采用的就是這樣一個(gè)已有的非冗余數(shù)據(jù)集pdbselect25。該集中所有蛋白兩兩之間進(jìn)行序列比對(duì)后,殘基相同率均小于25%。2.將基礎(chǔ)數(shù)據(jù)中的每個(gè)蛋白質(zhì)分子視為連續(xù)的多肽鏈,按照m殘基長(zhǎng)將每個(gè)蛋白質(zhì)分子均劃分成n-m+l個(gè)多肽段,由此構(gòu)建一個(gè)多肽段總集合,其中n為蛋白質(zhì)分子多肽鏈的殘基數(shù)。以15殘基長(zhǎng)的多肽段為例,一個(gè)包含n個(gè)殘基的蛋白質(zhì)就有n-14個(gè)多肽段。3.構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多肽段子集合。①將待構(gòu)建同源多肽段子集合的多肽段作為查詢多肽l么在多肽段總集合中,查找與查詢多肽段相比同時(shí)滿足以下條件的其它多肽段,并將查找到的多肽段構(gòu)建成查詢多肽段的同源多肽段候選集合;i)序列相似;ii)結(jié)構(gòu)相似;iii)表面殘基分布相似;iv)具有低等同率。查詢結(jié)果是對(duì)每一個(gè)多肽段u,都得到了一組多肽段構(gòu)成的集合{r}u;這些多肽段是u的同源肽段的候選者。②按同樣條件構(gòu)建多肽段總集合中的每一個(gè)多肽段的同源多肽段候選集合。③為減少錯(cuò)誤指定親源關(guān)系的可能性,我們對(duì)以上所得的數(shù)據(jù)關(guān)聯(lián)進(jìn)行了優(yōu)化。對(duì)于兩個(gè)多肽段U,V,如果一個(gè)是另一個(gè)的候選同源多肽,即ue(r)v或vE{r}u,并且與二者相應(yīng)的兩個(gè)同源多肽段候選集合(rK和(r)u中至少有5個(gè)條目是相同的,則u和v被認(rèn)定具有親源關(guān)系,編號(hào)被加入到彼此的"同源多肽段編號(hào)"索引區(qū)中。④對(duì)總集中的每一多肽段,搜集與其同源的多肽段組成該多肽段的同源多肽段子集合。構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多肽段子集合,并最終形成一包含所有同源多肽段子集合的子集合數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)的每個(gè)條目包含兩部分多肽段及其編號(hào)、數(shù)據(jù)集中與該多肽段有同源關(guān)系的其它多肽段的編號(hào)。具體如下表所示多肽段多肽段編號(hào)同源多肽段編號(hào)TLTIDDGNIEIVGTG134,56,78,23643...LTIDDGNIEIVGTGV26875,896,2345,786…TIDDGNIEIVGTGVK7689,3455.,IIIPGATCPGDYANA23924335456,789,244...4.將待研究蛋白質(zhì)分子多肽鏈按照15殘基長(zhǎng)劃分成n-14個(gè)多肽段,并將劃分的各多肽段按其起始位置定義為j位多肽段,j=2~n-15,計(jì)算每個(gè)多肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率,具體計(jì)算步驟為①針對(duì)每一個(gè)j位多肽段,按步驟3①中所列的四個(gè)條件,在多肽段總集合中查找符合該四個(gè)條件的多肽段,將查找到的所有多肽段的同源多肽段子集合合并成一與j位多肽段相關(guān)聯(lián)的多肽段組;②分別對(duì)多肽段組中每個(gè)多肽段的類別進(jìn)行定義,將每個(gè)多肽段中心氨基酸兩側(cè)的兩個(gè)7殘基長(zhǎng)子段定義為aiai+1...ai+6,其中i=0或8,a代表多肽段上的殘基,如果子段中至少4個(gè)殘基處于螺旋態(tài),則該子段被定義為//,如果其中至少4個(gè)殘基處于卩折疊態(tài),則該子段被定義為£,否則被定義為C,由此15殘基長(zhǎng)多肽段可被定義為9類,即ffif,WC,C/f,££,£C,C£,五//,CC,經(jīng)研究發(fā)現(xiàn),其中helix-donut區(qū)以^//+//(^+(^/為主,strand-arc區(qū)則以五E+fC+C五為主;兩區(qū)之間具有親源關(guān)系的多肽段很少。③根據(jù)多肽段組中各多肽段的類別,分別計(jì)算所研究的第j位多肽段屬于++和££+£C+C£的概率S(////+//C+C//)和《(////+//C+C//)=屬于ffi/+//C+C//的多肽段凄t/總樣本凄t《+£C+C£)=屬于+£C+C£的多肽段凄t/總樣本數(shù)同時(shí)按相同步驟計(jì)算第j-l位和第j+l位多肽段分別屬于^//+/^+0/和五五+EC+CE的概率;④根據(jù)第j位多肽段的類別計(jì)算其跳轉(zhuǎn)概率G,根據(jù)已知的多肽段的二級(jí)結(jié)構(gòu)可以確定其屬于哪個(gè)區(qū)域,當(dāng)?shù)趈位多肽段位于hdix-donut區(qū),即////+/^+0/區(qū)時(shí),2;=(1-《—!(服+//C+C7/))尸乂(£五+£C+C£)(l-5+1(朋+7/C+C//))其中1-/U////+//C+C//)為k位多肽段不屬于////+/^+(^//的扭無(wú)率當(dāng)?shù)趈位多肽段位于strand-arc區(qū),即+£C+C£區(qū)時(shí),貝'JQ=(1—尸廣,+£C+C£))尸,+7/C+C//)(l—尸川(+£C+CE))其中1-A+£C+C£)為k位多肽l殳不屬于+£C+C£的扭無(wú)率如果第j位多肽段不處于helix-donut區(qū)和strand-arc區(qū),則Q=0。各位點(diǎn)均做此操作,跳轉(zhuǎn)概率高者為高可疑區(qū)。5.濾除進(jìn)化允許的構(gòu)象變化,察看多肽段中心氨基酸兩側(cè)一定范圍內(nèi)是否既有螺旋態(tài),又有卩折疊態(tài),如果是,則表明生理狀態(tài)下,此段多肽既存在螺旋態(tài)和p折疊態(tài)的動(dòng)態(tài)消長(zhǎng),排除可能導(dǎo)致蛋白構(gòu)象病的可疑性。室溫下蛋白質(zhì)構(gòu)象是時(shí)刻變化著的。對(duì)進(jìn)化才莫型來(lái)i兌,一定范圍內(nèi)的構(gòu)象改變是允許的,蛋白原有的螺旋態(tài)和P折疊態(tài)是可以進(jìn)行伸長(zhǎng)或縮短的。這樣的構(gòu)象改變不會(huì)引起構(gòu)象病,應(yīng)在算法中剔除其影響。6.統(tǒng)計(jì)、分析所研究蛋白質(zhì)分子各個(gè)多肽段的跳轉(zhuǎn)概率,跳轉(zhuǎn)概率最高的多肽段即為可能導(dǎo)致蛋白構(gòu)象病的關(guān)鍵位點(diǎn)。下面以正常人Prion蛋白作為檢測(cè)蛋白舉例說(shuō)明。正常人Prion蛋白序列如下LGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSYERESQAYYQR以中心氨基酸為195的15殘基長(zhǎng)窗口TVTTTTKGENFTETD為例,查尋與其滿足步驟3①中所要求4個(gè)條件的條目。所得結(jié)果如下待查多肽查詢結(jié)果TVTTTTKGENFTETD多肽段多肽段編3同源多肽^殳編號(hào)KSTKPYRGHRFTKEN11382711142,73936,238474.EVYTDERGYFMETFN201196194652,164024,118813...KQMSKEEKLKIKEEN7392834586,26051,11053...■.■對(duì)該多肽進(jìn)行查詢后,所有所得同源多肽段分別屬于HH,HC,CH,EE,CE,EC的樣本數(shù)分別為361,115,97,46,45,23。樣本總數(shù)為828。則尸咖_195(服+//C+Ci7)=(361+115+97)/828=0.692Pce,erl95+£C+C£)=(46+45+23)/828=0.138類似的可求得尸_欣194(i///+//C+C//)=0.835'尸_州94+£C+C£)=0.041+WC+C//)=0.847,尸c加w96(££+£C+C£)=0.036由于TVTTTTKGENFTETD對(duì)應(yīng)的二級(jí)結(jié)構(gòu)為hhhhhhcccccchhh片于helix-donut區(qū),則跳轉(zhuǎn)概率計(jì)算為2一hm=(1—尸咖+HC+C7/))x尸贈(zèng),195+£C+C£)(l-《96+//C+C//))=(1—0.835)x0.138x(1—0.847)=0.00348由于該肽"R不存在螺旋態(tài)和p折疊態(tài)的動(dòng)態(tài)消長(zhǎng),所以跳轉(zhuǎn)概率為0.00348。使用采用上述算法的計(jì)算機(jī)程序?qū)Ω魑稽c(diǎn)均進(jìn)行此計(jì)算,獲得結(jié)果如圖1所示。位點(diǎn)188-202被確定為發(fā)病起始區(qū)(由圖1給出的跳轉(zhuǎn)概率最高處所對(duì)應(yīng)的15長(zhǎng)多肽),起始區(qū)內(nèi)的位點(diǎn)被認(rèn)為是關(guān)鍵位點(diǎn)。有實(shí)驗(yàn)結(jié)果支持這一判斷。參見(jiàn)以下文獻(xiàn)文獻(xiàn)1:Cobb,N.J.,S6nnichsen,RD.,Mchaourab,H.andSureWcz,W.K.Moleculararchitectureofhumanprionproteinamyloid:Aparallel,inregister(3-structure.Proc.Natl.Acad.Sci.USA2007;104:1894618951.文獻(xiàn)2:KuwataK.,NishidaN.,MatsumotoT《14coauthors).Hotspotsinprionproteinforpathogenicconvffsion.Proc.Natl.Acad.Sci.USA2007;104:11921-11926.此外,我們還研究了血紅蛋白,抑絲酶,曱狀腺素運(yùn)載蛋白,02微球蛋白,CystatinC,溶菌酶等蛋白。所得發(fā)病起始位點(diǎn)均見(jiàn)病理報(bào)t這里只列出研究結(jié)果與參考文亂Table1.Predictedhotspotsforproteinsofdfferentconformationaldiseases.Foreachpredictedregion,therearematchedsitesobservedbyexperiment.<table>tableseeoriginaldocumentpage13</column></row><table>ReferencesOuteirino,J.,Casey,R.,White,J.M.,andLehmann,H.(1974)HaemoglobinMadridbeta115(G17)alanine-proline:anunstablevariantassociatedwithhaemolyticanaemia,Acta.Haematol.52:53-60.Ohga,S.,Nomura,A.,etal.(9co-authors).(2003)DominantP墨ThalassemiawithhemoglobinHradeckralove:EnhancedHemolysisintheSpleen.Int.J.Hema.78:329~334.Johnson,D.J,D.,Huntington,J.A.(2004)TheinfluenceofhingeregionresidueGiu-381onantithrombinallosteryandmetastabilityJ,Biol.Chem.279:4913-4921Jacobson,D.R.,McFarlin,D.E.,Kane,I.,andBuxbaum,J,N,(1992)TransthyretinPro55,avariantassociatedwithearly-onset,aggressive,diffUseamyloidosiswithcardiacandneurologicinvolvement.Hum.Genet.89:353-356.Hasegawa,K"Ohhashi,Y.,Yamaguchi,I.,Takahashi,N.,Tsutsumi,S"Goto,Y.,Gejyo,F(xiàn).,andNaiki,H.(2003)Amyloidogenicsyntheticpeptidesof^-microglobulinaroleofthedisulfidebond.Biochem.Biophys.Res.Commun.304:101C106.Hiramatsu,H.,Goto,Y.,Naiki,H.,andKitagawa,T.(2004)CorestructureofamyloidfibrilproposedfromIR-microscopelineardichroism.J.Am.Chem.Soc.126:3008"3009.Hiramatsu,H.,Goto,Y.,Naiki,H.,andKitagawa,T.(2005)StructuralModeloftheAmyloidFibrilFormedbyP2-Micr0gl0bulin#21-31FragmentBasedonVibrationalSpectroscopy.J.Am.Chem.Soc.127:7988-7989.AbrahamsonM.(1996)Molecularbasisforamyloidosisrelatedtohereditarybrainhemorrhage.Scand.J.Clin.Lab.Invest.226:47-56.OlafssonI.,GrubbA.HereditarycystatinCamyloidangiopathy.(2000)AmyloidInt.J.Exp.Clin.Invest.7:70-79.JohnsonR.J.K.,ChristodoulouJ.,etal.(12co-authors).(2005)RationalisingLysozymeAmyloidosis:InsightsfromtheStructureandSolutionDynamicsofT70NLysozyme.J.Mol.Biol.352:823-836.本實(shí)施例中只舉了按15殘基長(zhǎng)來(lái)劃分多肽段,分析可能在hdix-donut區(qū)和strand-arc區(qū)之間進(jìn)行跳轉(zhuǎn)的關(guān)鍵位點(diǎn)。當(dāng)然才艮據(jù)不同的實(shí)際需要,在本發(fā)明提供的方法的指導(dǎo)下,也可按其他的殘基長(zhǎng)來(lái)劃分多肽段,同樣可將蛋白質(zhì)的螺旋態(tài)與折疊態(tài)劃分為其他不同的區(qū),同樣可以利用本發(fā)明提供的方法預(yù)測(cè)出可能引發(fā)蛋白構(gòu)像病的關(guān)鍵位,l所以,基于上述的改動(dòng)均應(yīng)落入本發(fā)明的保護(hù)范圍。權(quán)利要求1.一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,其特征在于利用多肽相空間的“雙吸引域特性”進(jìn)行預(yù)測(cè),具體包括如下步驟1)將已知的由自然界中有代表性的蛋白質(zhì)所構(gòu)成的非冗余數(shù)據(jù)集作為基礎(chǔ)數(shù)據(jù);2)將基礎(chǔ)數(shù)據(jù)中的每個(gè)蛋白質(zhì)分子視為連續(xù)的多肽鏈,按照m殘基長(zhǎng)將每個(gè)蛋白質(zhì)分子均劃分成n-m+1個(gè)多肽段,由此構(gòu)建一個(gè)多肽段總集合,其中n為蛋白質(zhì)分子多肽鏈的殘基數(shù);3)構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多肽段子集合;4)將待研究蛋白質(zhì)分子多肽鏈按照m殘基長(zhǎng)劃分成n-m+1個(gè)多肽段,并將劃分的各多肽段按其起始位置定義為j位多肽段,j=2~n-m,計(jì)算每個(gè)多肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率;5)濾除進(jìn)化允許的構(gòu)象變化,察看多肽段中心氨基酸兩側(cè)一定范圍內(nèi)是否既有螺旋態(tài),又有β折疊態(tài),如果是,則表明生理狀態(tài)下,此段多肽既存在螺旋態(tài)和β折疊態(tài)的動(dòng)態(tài)消長(zhǎng),排除可能導(dǎo)致蛋白構(gòu)象病的可疑性;6)統(tǒng)計(jì)、分析所研究蛋白質(zhì)分子各個(gè)多肽段的跳轉(zhuǎn)概率,跳轉(zhuǎn)概率最高的多肽段即為可能導(dǎo)致蛋白構(gòu)象病的關(guān)鍵位點(diǎn)。2.根據(jù)權(quán)利要求1所述的判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,其特征在于,所述步驟l)中的非冗余數(shù)據(jù)集具體為pdbselect25。3.根據(jù)權(quán)利要求1所述的判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,其特征在于,所述步驟2)中m具體為15。4.根據(jù)權(quán)利要求3所述的判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,其特征在于,所述步驟3)具體包括如下步驟①將待構(gòu)建同源多肽段子集合的多肽段作為查詢多肽>^在多肽段總集合中,查找與查詢多肽段相比同時(shí)滿足以下條件的其它多肽段,并將查找到的多肽段構(gòu)建成查詢多肽段的同源多肽段候選集合i)序列相似;ii)結(jié)構(gòu)相似;iii)表面殘基分布相似;iv)具有低等同率;②按同樣條件構(gòu)建多肽段總集合中的每一個(gè)多肽段的同源多肽段候選集合;③如果有兩個(gè)多肽段,其中一個(gè)是另一個(gè)的候選同源多肽,則將與二者相應(yīng)的兩個(gè)候選集合進(jìn)行比對(duì),如果兩個(gè)候選集合中存在至少5個(gè)相同多肽段,則這兩個(gè)多肽段被確認(rèn)為互為同源多肽,爻;④對(duì)總集中的每一多肽段,搜集與其同源的多肽段組成該多肽段的同源多肽段子集合。構(gòu)建多肽段總集合中每一個(gè)多肽段的同源多肽段子集合,并最終形成一包含所有同源多肽段子集合的子集^t據(jù)庫(kù)。5.根據(jù)權(quán)利要求4所述的判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,其特征在于,所述步驟4)具體為將待研究蛋白質(zhì)分子多肽鏈按照15殘基長(zhǎng)劃分成n-14個(gè)多肽段,并將劃分的各多肽段按其起始位置定義為j位多肽段,j=2~n-15,計(jì)算每個(gè)多肽段從其演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率,具體計(jì)算步驟為①針對(duì)每一個(gè)j位多肽段,按步驟3①中所列的四個(gè)條件,在多肽段總集合中查找符合該四個(gè)條件的多肽段,將查找到的所有多肽段的同源多肽段子集合合并成一與j位多肽段相關(guān)聯(lián)的多肽段組;②分別對(duì)多肽段組中每個(gè)多肽段的類別進(jìn)行定義,將每個(gè)多肽段中心氨基酸兩側(cè)的兩個(gè)7殘基長(zhǎng)子^a定義為aiai+I...ai+6,其中i=0或8,a代表多肽段上的殘基,如果子段中至少4個(gè)殘基處于螺旋態(tài),則該子段被定義為//,如果其中至少4個(gè)殘基處于卩折疊態(tài),則該子段被定義為£,否則被定義為C,由此15殘基長(zhǎng)多肽段可被定義為9類,即//C,C//,£五,£C,C£,£//,CC,經(jīng)研究發(fā)現(xiàn),其中helix-donut區(qū)以////+//C+O/為主,strand-arc區(qū)則以+£C+C£為主;③根據(jù)多肽段組中各多肽段的類別,分別計(jì)算所研究的第j位多肽段屬于++和££+£C+C£的概率S(M/+//C+C//)和P(££+£C+C£):+//c+c//)=屬于////+//c+c//的多肽l殳凄t/總樣本數(shù)《(££+£C+C£)=屬于+£C+C£的多肽段凄t/總樣本數(shù)同時(shí)按相同步驟計(jì)算第j-l位和第j+l位多肽段分別屬于////+/^+(^/和££+£C+C£的扭無(wú)率;④根據(jù)第j位多肽段的類別計(jì)算其跳轉(zhuǎn)概率込,當(dāng)?shù)趈位多肽段位于helix-donut區(qū),即////+i/C+C//區(qū)時(shí),Q=(1-(朋+//C+C//))《+£C+C£)(l-尸川(朋+//C+C//))當(dāng)?shù)趈位多肽段位于strand-arc區(qū),即+£C+C£區(qū)時(shí),貝寸=(1—t+£C+C£))C(/f/7+//C+CZZ)(l—尸川(+£C+C£))如果第j位多肽段不處于helix-donut區(qū)和strand-arc區(qū),則Q=0。全文摘要本發(fā)明公開(kāi)一種判斷可能引起蛋白構(gòu)象病的蛋白質(zhì)分子結(jié)構(gòu)轉(zhuǎn)化關(guān)鍵位點(diǎn)的方法,包括如下步驟將已知的有代表性的蛋白質(zhì)的非冗余數(shù)據(jù)集作為基礎(chǔ)數(shù)據(jù);將基礎(chǔ)數(shù)據(jù)中的每個(gè)蛋白質(zhì)分子按照m殘基長(zhǎng)劃分成多肽段,構(gòu)建多肽段總集合;構(gòu)建多肽段總集合中每個(gè)多肽段的同源多肽段子集合;將待研究蛋白質(zhì)分子按照m殘基長(zhǎng)劃分成多肽段,并按其起始位置定義為j位多肽段,計(jì)算每個(gè)多肽段從演化區(qū)域跳轉(zhuǎn)到另一區(qū)域的跳轉(zhuǎn)概率;濾除進(jìn)化允許的構(gòu)象變化;跳轉(zhuǎn)概率最高的多肽段即為可能導(dǎo)致蛋白構(gòu)象病的關(guān)鍵位點(diǎn)。本發(fā)明采用先利用算法排查,再進(jìn)行實(shí)驗(yàn)研究的技術(shù)路線,克服了現(xiàn)有蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)換研究復(fù)雜程度高,人力、財(cái)力消耗巨大,耗時(shí)長(zhǎng)、效率低等問(wèn)題。文檔編號(hào)G06F19/00GK101598723SQ200810114588公開(kāi)日2009年12月9日申請(qǐng)日期2008年6月6日優(yōu)先權(quán)日2008年6月6日發(fā)明者鑫劉,趙亞溥申請(qǐng)人:中國(guó)科學(xué)院力學(xué)研究所
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1