專利名稱::一種蛋白質(zhì)的β-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)及特征分析方法,特別是一種蛋白質(zhì)的|3-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法。
背景技術(shù):
:蛋白質(zhì)體系由a-螺旋,P-折疊,緊密轉(zhuǎn)角,膨脹結(jié)構(gòu)及無(wú)規(guī)則巻曲結(jié)構(gòu)等構(gòu)成。過(guò)去幾十年,已發(fā)展多種預(yù)測(cè)a-螺旋與P-折疊預(yù)測(cè)方法,相比之下,緊密轉(zhuǎn)角預(yù)測(cè)方法發(fā)展較少,(3-轉(zhuǎn)角是緊密轉(zhuǎn)角的一種,其由4個(gè)連續(xù)殘基構(gòu)成,可定義為Ca(i)與Ca(i+3)之間的距離小于0.7nm,且此4肽片斷不存在于螺旋形構(gòu)象之中。P-轉(zhuǎn)角是蛋白質(zhì)中已被認(rèn)識(shí)的非重復(fù)性結(jié)構(gòu)中最常見(jiàn)的類型,其在蛋白質(zhì)結(jié)構(gòu)與功能中具有重要作用。首先,其對(duì)蛋白質(zhì)的折疊與穩(wěn)定性至關(guān)重要;第二,P-轉(zhuǎn)角通常出現(xiàn)在蛋白質(zhì)的暴露表面,其可能參與分子識(shí)別及受體與底物相互作用過(guò)程。因此,發(fā)展有效的P-轉(zhuǎn)角預(yù)測(cè)方法對(duì)蛋白質(zhì)的折疊識(shí)別研究以及蛋白質(zhì)的整個(gè)3D結(jié)構(gòu)預(yù)測(cè)將很有益?,F(xiàn)已發(fā)展的一些較好的|3-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)方法有Chou-Fasman方法(Biochemistry,1974,13:222)。1-4與2國(guó)3相關(guān)性模型(Zhang,etal.,Biopolymers,1997,41:673),其考慮了1與4,2與3殘基之間的交互效應(yīng)。序列連接模型(Chou,J.Pept.Res.,1997,49:120),該模型首次引入馬爾可夫鏈,考慮了整個(gè)寡肽的序列相關(guān)效應(yīng)。GORBTURN(v3.0)方法(Wilmot,eta1.,19卯,3:479),其應(yīng)用位置頻率與等價(jià)參數(shù),從P-轉(zhuǎn)角預(yù)測(cè)結(jié)果中剔除可能的helix與strand殘基。Shepherd等(ProteinSci.,1999,8:1045)發(fā)展了一種基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法一BTPRED方法,Kaur等(Bioinformatics,2002,18:1508)曾對(duì)各種P-轉(zhuǎn)角預(yù)測(cè)方法的同步評(píng)i"介結(jié)果顯示,BTPRED方法正確率最高,其又進(jìn)一步應(yīng)用多元序列對(duì)比發(fā)展了一種改進(jìn)的神經(jīng)網(wǎng)絡(luò)方法—BTPred2(ProteinSci.,2003,12:627),得馬休斯相關(guān)系數(shù)(MCC)為0.43。更最近,Kim(Bioinfo腿tics,2004,20:40)用k-最近鄰法及Zhang等(Bioinformatics,2005,21:2370)用支持向量才幾都取得4交好的p-轉(zhuǎn)角預(yù)測(cè)結(jié)果??v觀上述算法,其大多是基于位置傾向的經(jīng)驗(yàn)方法,盡管p-轉(zhuǎn)角是非重復(fù)結(jié)構(gòu)中最常見(jiàn)的一種,但目前的二級(jí)結(jié)構(gòu)預(yù)測(cè)方法提供關(guān)于P-轉(zhuǎn)角的有用信息卻較少(Kaur,etal"Bioinformatics,2002,18:1508)。
發(fā)明內(nèi)容有鑒于此,為了解決上述問(wèn)題,本發(fā)明提供了一種蛋白質(zhì)的P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,能夠用于蛋白質(zhì)P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析,并為蛋白質(zhì)的折疊識(shí)別研究以及蛋白質(zhì)的整個(gè)三維結(jié)構(gòu)預(yù)測(cè)提供參考。本發(fā)明的目的是這樣實(shí)現(xiàn)的一種蛋白質(zhì)的P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,包括如下步驟a)基于因子分析方法,構(gòu)建氨基酸廣義信息因子分析標(biāo)度;b)應(yīng)用氨基酸廣義信息因子分析標(biāo)度對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋|3-轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征;c)用線性判別分析建立蛋白質(zhì)的p-轉(zhuǎn)角結(jié)構(gòu)識(shí)別及特征分析模型;d)采取排除非巻曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證p-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。進(jìn)一步,在于步驟a)具體包括如下步驟al)選取天然氨基酸的變量參數(shù),按照相對(duì)負(fù)載大小、變量共同度、可解釋性及對(duì)序列結(jié)構(gòu)貢獻(xiàn)的重要性進(jìn)行變量篩選;a2)用因子分析法處理精選得到的變量,通過(guò)斜交旋轉(zhuǎn),并用主成分法提取疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性和靜電性6個(gè)因子;a3)計(jì)算各因子得分,將得分矢量定義為氨基酸廣義信息因子分析標(biāo)度;進(jìn)一步,步驟b)具體包括用氨基酸廣義信息因子分析標(biāo)度所涉及的疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性和靜電性6個(gè)因子對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋(3-轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征,其中的每個(gè)氨基酸殘基用6個(gè)氨基酸廣義信息因子分析標(biāo)度矢量表征,并將表征結(jié)果作為P-轉(zhuǎn)角結(jié)構(gòu)識(shí)別模型的自變量;進(jìn)一步,步驟c)具體包括如下步驟首先定義兩個(gè)指示變量,分別用"l"表示p-轉(zhuǎn)角結(jié)構(gòu),用"2,,表示非p-轉(zhuǎn)角結(jié)構(gòu),以此指示變量作為p-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)模型的因變量,用線性判別分析建立p-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)模型;進(jìn)一步,步驟d)具體包括如下步驟采取排除非巻曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證P-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。本發(fā)明的一種蛋白質(zhì)的(3-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其中選取的氨基酸廣義信息因子分析標(biāo)度所含信息量大、表征能力強(qiáng)、使用操作方便及物化意義明顯;通過(guò)表征p-轉(zhuǎn)角所在的7-殘基滑動(dòng)序列片斷的結(jié)構(gòu)特征,可全面地表征p-轉(zhuǎn)角結(jié)構(gòu)特征;線性判別分析建模具有簡(jiǎn)便且易解釋等優(yōu)點(diǎn),對(duì)模型分析可以獲得關(guān)于|3-轉(zhuǎn)角的一些重要特征信息。本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo)和特征在某種程度上將在隨后的說(shuō)明書(shū)中進(jìn)行闡述,并且在某種程度上,基于對(duì)下文的考察研究對(duì)本領(lǐng)域技術(shù)人員而言將是顯而易見(jiàn)的,或者可以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過(guò)下面的說(shuō)明書(shū),權(quán)利要求書(shū),以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,其中圖1是本發(fā)明的線性判別分析模型的標(biāo)準(zhǔn)化系數(shù)圖;圖2是本發(fā)明的由4殘基肽形成的P-轉(zhuǎn)角結(jié)構(gòu)示意圖。具體實(shí)施例方式以下將參照附圖,對(duì)采用本發(fā)明的方法用于426個(gè)蛋白樣本中P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析進(jìn)行詳細(xì)的描述,包括以下步驟a)基于因子分析方法,構(gòu)建氨基酸廣義信息因子分析標(biāo)度;從AAindex數(shù)據(jù)庫(kù)(參見(jiàn)KawashimaS.,KanehisaM..NucleicAcidsRes.[J],2000,28:374)中選擇20種天然氨基酸的516個(gè)變量參數(shù)。按照相對(duì)負(fù)載大小、變量共同度、可解釋性及對(duì)序列結(jié)構(gòu)貢獻(xiàn)的重要性等原則對(duì)這516個(gè)變量進(jìn)行篩選,得到335個(gè)變量。這些變量表征氨基酸的如下性質(zhì),a-螺旋與轉(zhuǎn)角傾向性質(zhì),如p-轉(zhuǎn)角構(gòu)象參數(shù)及C末端螺旋的標(biāo)準(zhǔn)化頻率等;P傾向性質(zhì),如N末端P-折疊的標(biāo)準(zhǔn)化頻率等;疏水性,如三氟乙酸中的保留系數(shù)及疏水性指數(shù)等;物理化學(xué)性質(zhì),如表觀偏特定體積及分子大小等;構(gòu)成特征,如電荷轉(zhuǎn)移給予能力參數(shù)及熱能參數(shù)等;其它特性,如側(cè)鏈角e及N末端非螺旋區(qū)域的標(biāo)準(zhǔn)化頻率等。用因子分析法處理精選得到的變量,通過(guò)斜交旋轉(zhuǎn),并用主成分法提取6個(gè)因子,這6個(gè)因子解釋了原始變量83.47%的信息,參見(jiàn)表l。表120種天然氬基酸的335個(gè)性質(zhì)Wt的6個(gè)因子得分因子l:因子2:因子3:因子4:因子5:因子6:<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>20種天然氨基酸用常規(guī)的單個(gè)英文字母表示。對(duì)6個(gè)因子進(jìn)行載荷分析發(fā)現(xiàn),因子1涉及疏水性;因子2反映a-螺旋與轉(zhuǎn)角傾向性質(zhì),其反映相關(guān)的二級(jí)結(jié)構(gòu)特征信息,如p-轉(zhuǎn)角構(gòu)象參數(shù)及c末端螺旋的標(biāo)準(zhǔn)化頻率等;因子3屬于體積性質(zhì)因子,因子4屬于構(gòu)成特征因子,因子5體現(xiàn)局部柔性因子,反映某些相關(guān)的二級(jí)結(jié)構(gòu)性質(zhì),因子6為靜電性因子。從上述6個(gè)因子的載荷分析看出,盡管第5和第6個(gè)因子解釋相對(duì)較少的方差,但因它們具有明確的物理化學(xué)意義,所以其被考慮在內(nèi)。因?yàn)槊總€(gè)因子都具有較明顯的物理化學(xué)意義,因此可認(rèn)為經(jīng)因子分析得到的6個(gè)因子可行。進(jìn)一步計(jì)算各因子得分,見(jiàn)表l,為方便,稱此6個(gè)因子得分矢量為氨基酸廣義信息因子分析標(biāo)度,該表征體系涉及序列的疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性及靜電性等重要性質(zhì),其綜合了335個(gè)原始皿酸性質(zhì)參數(shù)大部分信息,可以嘗試將這6個(gè)因子得分矢量用于肽片段結(jié)構(gòu)表征。b)應(yīng)用氨基酸廣義信息因子分析標(biāo)度對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋p-轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征;以疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性和靜電性6個(gè)因子得分矢量對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋(3-轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征,每個(gè)7-殘基序列片斷用7x6=42個(gè)變量串聯(lián)表征,并將其作為(3-轉(zhuǎn)角結(jié)構(gòu)識(shí)別模型的自變量。c)用線性判別分析建立蛋白質(zhì)的|3-轉(zhuǎn)角結(jié)構(gòu)識(shí)別模型;首先定義兩個(gè)指示變量,分別用"r,表示(3-轉(zhuǎn)角結(jié)構(gòu),用"2,,表示非|3-轉(zhuǎn)角結(jié)構(gòu),以此指示變量作為(3-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè);漠型的因變量,用線性判別分析建立卩-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)模型,采取留l/7法交互檢驗(yàn)驗(yàn)證模型的預(yù)測(cè)能力,即將426條蛋白分為7組,其中6組分別包含61條蛋白,另外1組含60條蛋白,首先將其中l(wèi)組取出,然后用剩下的6組建模,依次循環(huán),共進(jìn)行7次,以此結(jié)果判斷模型的預(yù)測(cè)能力。d)采取排除非巻曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證P-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。首先,因(3-轉(zhuǎn)角位于蛋白質(zhì)鏈的巻曲區(qū)域中,因此,用二級(jí)結(jié)構(gòu)預(yù)測(cè)方法"^PSI-PRED(Jones,J.Mol.Biol.,1999,292:195),識(shí)別處于非巻曲區(qū)域中的殘基,使那些被預(yù)測(cè)為處于非巻曲區(qū)域的殘基都判別為非P-轉(zhuǎn)角結(jié)構(gòu)。第二,在進(jìn)行預(yù)測(cè)時(shí),只是對(duì)每個(gè)殘基進(jìn)行獨(dú)立預(yù)測(cè),沒(méi)有考慮相鄰氨基酸殘基的作用,但因|3-轉(zhuǎn)角由4個(gè)連續(xù)氨基酸殘基構(gòu)成,因此,用Shepherd等(Shepherd,etal.,ProteinSci.,1999,8:1045)提出的"state-flipping"規(guī)則,對(duì)其進(jìn)行過(guò)濾首先使所有被隔離的非(3-轉(zhuǎn)角變?yōu)?3-轉(zhuǎn)角殘基(即t-t—ttt,"t"表示p-轉(zhuǎn)角,"-"表示非P-轉(zhuǎn)角,下同),接著,將被隔離的p-轉(zhuǎn)角或成對(duì)的(3-轉(zhuǎn)角殘基變?yōu)榉勤?轉(zhuǎn)角殘基(即小—一或-tt-———),最后,對(duì)被隔離的3個(gè)連續(xù)p-轉(zhuǎn)角殘基或2個(gè)靠近的非|3_轉(zhuǎn)角殘基都變?yōu)閜-轉(zhuǎn)角殘基(即-1-—tttt-或-tttt),這樣便保證p-轉(zhuǎn)角至少具有4個(gè)殘基長(zhǎng)度。若分別定:^ec為計(jì)算預(yù)測(cè)正確樣本數(shù)目所占總樣本數(shù)目百分比,Sp為預(yù)測(cè)正確的P-轉(zhuǎn)角數(shù)目的百分比,^為預(yù)測(cè)正確的非P-轉(zhuǎn)角數(shù)目的百分比,AfCC為馬休斯相關(guān)系數(shù)等統(tǒng)計(jì)參數(shù),則本發(fā)明方法以及其它預(yù)測(cè)方法所得結(jié)果列于表2中,可看出,經(jīng)留l/7法交互驗(yàn)證,得Jcc,&,Sp及Jl/CC分別為75.6,67.6,78.2及0.42。因?yàn)榍蛐蔚鞍踪|(zhì)中(3-轉(zhuǎn)角與非p-轉(zhuǎn)角的比例不均衡(約為l:3),因此,MCC是評(píng)價(jià)參數(shù)中最為可靠與穩(wěn)健的指標(biāo),經(jīng)比較,本發(fā)明方法所得ACC高于其它所列方法的p-轉(zhuǎn)角預(yù)測(cè)結(jié)果。表2p-轉(zhuǎn)角預(yù)測(cè)結(jié)果比較<table>tableseeoriginaldocumentpage10</column></row><table>a仏bserved-O/(P+W)]xl00其中,/為被正確分類的|3-轉(zhuǎn)角殘基數(shù)目,"為被錯(cuò)誤分類的非|3-轉(zhuǎn)角殘基數(shù)目,g。bserved懲罰欠預(yù)測(cè)(unde卬rediction)。據(jù)線性判別分析模型方程的標(biāo)準(zhǔn)化系數(shù),可分析對(duì)P-轉(zhuǎn)角識(shí)別結(jié)果影響顯著的變量,并可進(jìn)一步分析對(duì)其影響趨勢(shì)及大小,從而可以獲得關(guān)于P-轉(zhuǎn)角的一些重要特征信息。圖l顯示了線性判別分析模型的標(biāo)準(zhǔn)化系數(shù)。首先觀察到系數(shù)大于0.0的變量,最大的是變量20,其對(duì)應(yīng)的是第4殘基的a-螺旋與轉(zhuǎn)角傾向性質(zhì),有兩點(diǎn)引起我們的注意,其一,變量20來(lái)自于第4殘基,而第4殘基恰恰是7-殘基片斷的中心殘基。其二,本發(fā)明方法表征的是該中心殘基的特征及其所處的環(huán)境,從該殘基對(duì)應(yīng)的6個(gè)因子性質(zhì)中,剛好提出了a-螺旋與轉(zhuǎn)角傾向這一性質(zhì)參數(shù),這一點(diǎn)不是巧合,因?yàn)閍-螺旋與轉(zhuǎn)角傾向性質(zhì)反映的就是關(guān)于殘基的轉(zhuǎn)角(tum)特性一個(gè)二級(jí)結(jié)構(gòu)參數(shù)。變量20對(duì)應(yīng)的系數(shù)大于0.0表明,其值越大,越容易出現(xiàn)P-轉(zhuǎn)角。同時(shí),這也從一個(gè)側(cè)面表明選擇7-殘基片斷表征其中心殘基及其所處環(huán)境特征的有效性。其次,變量26、14及32對(duì)應(yīng)的系數(shù)都大于O.O表明,這些變量的增大亦可促進(jìn)p-轉(zhuǎn)角的出現(xiàn)。這些變量對(duì)應(yīng)的分別是第5殘基、第3殘基及第6殘基的a-螺旋與轉(zhuǎn)角傾向性質(zhì)。上述分析表明,對(duì)|3-轉(zhuǎn)角的形成產(chǎn)生正貢獻(xiàn)4交大的變量,都與a-螺旋與轉(zhuǎn)角傾向性質(zhì)相關(guān)。從氨基酸廣義信息因得分(表l)看出,谷氨酸(E)、曱^危氨酸(M)及亮氨酸(L)等氨基酸的a-螺旋與轉(zhuǎn)角傾向參數(shù)較大,也就是說(shuō),在第3、4、5及6位點(diǎn)出現(xiàn)這些氨基酸殘基,可能更易形成P-轉(zhuǎn)角。除了這些變量之外,發(fā)現(xiàn)第3、4、5及6殘基的疏水性大小與P-轉(zhuǎn)角的形成亦呈現(xiàn)較大的正相關(guān)關(guān)系,由表l進(jìn)一步看出,異亮氨酸(I)、纈氨酸(V)、苯丙氨酸(F)及亮氨酸(L)等氨基酸的疏水性參數(shù)較大,這表明,這些殘基在3、4、5及6位點(diǎn)出現(xiàn)頻率越高,可能越易導(dǎo)致(3-轉(zhuǎn)角的出現(xiàn)。分析變量系數(shù)小于0.0的變量發(fā)現(xiàn),其中系數(shù)最小的是變量ll,該變量對(duì)應(yīng)第2殘基的局部柔性,其次是變量29、41、42及5,其分別對(duì)應(yīng)第5殘基的局部柔性,第7殘基的局部柔性與靜電性質(zhì)及第1殘基的局部柔性,也就是說(shuō),這些變量的絕對(duì)值越大,越不利于P-轉(zhuǎn)角的形成。在這些變量中,大多數(shù)屬于相應(yīng)殘基的局部柔性屬性。觀察表1中因子5的各變量在其上的載荷分布發(fā)現(xiàn),對(duì)該因子載荷貢獻(xiàn)最大的是與聯(lián)結(jié)子(Linker)相關(guān)的變量,這一點(diǎn)引起我們的注意,研究表明,P氨基酸是最易出現(xiàn)在Linker區(qū)域的氨基酸,這并不足為奇,因?yàn)镻沒(méi)有氨基氫,不能形成氬鍵,因此其可以從結(jié)構(gòu)上將Linker從結(jié)構(gòu)域中隔離開(kāi)。從表l各因子得分也可以看出,P的因子得分(3.847)高于其它氨基酸因子得分,說(shuō)明7殘基片斷中越易出現(xiàn)P,則越不利于p-轉(zhuǎn)角形成。另外,需要注意的是,在對(duì)P-轉(zhuǎn)角形成不利的因素中,第7殘基的靜電性質(zhì)亦起著較顯著的作用。Zhang等(Biopolymers,1997,41:673)考慮|3-轉(zhuǎn)角的第l殘基與第4殘基、第2與第3殘基的交互效應(yīng)(couplingeffect)建立l-4與2-3相關(guān)模型預(yù)測(cè)p-轉(zhuǎn)角,其觀點(diǎn)是,當(dāng)一個(gè)4殘基肽折疊成為P-轉(zhuǎn)角時(shí),第1殘基與第4殘基、第2與第3殘基之間的作用至關(guān)重要,特別地,可在第l殘基的CO與第4殘基的NH之間形成氬鍵,參見(jiàn)圖2,這從另一方面進(jìn)一步論證了P殘基的出現(xiàn)不利于P-轉(zhuǎn)角的形成的結(jié)論。另外,需要注意的是,在對(duì)(3-轉(zhuǎn)角形成不利的因素中,第7殘基的靜電性質(zhì)亦起著較顯著的作用。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并不用于限制本發(fā)明,顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。權(quán)利要求1.一種蛋白質(zhì)的β-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其特征在于包括如下步驟a)基于因子分析方法,構(gòu)建氨基酸廣義信息因子分析標(biāo)度;b)應(yīng)用氨基酸廣義信息因子分析標(biāo)度對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋?duì)?轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征;c)用線性判別分析建立蛋白質(zhì)的β-轉(zhuǎn)角結(jié)構(gòu)識(shí)別及特征分析模型;d)采取排除非卷曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證β-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。2.根據(jù)權(quán)利要求1的一種蛋白質(zhì)的p-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其特征在于步驟a)具體包括如下步驟al)選取天然氨基酸的變量參數(shù),按照相對(duì)負(fù)載大小、變量共同度、可解釋性及對(duì)序列結(jié)構(gòu)貢獻(xiàn)的重要性進(jìn)行變量篩選;a2)用因子分析法處理精選得到的變量,通過(guò)斜交旋轉(zhuǎn),并用主成分法提取疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性和靜電性6個(gè)因子。a3)計(jì)算各因子得分,將得分矢量定義為氨基酸廣義信息因子分析標(biāo)度。3.根據(jù)權(quán)利要求2的一種蛋白質(zhì)的P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其特征在于步驟b)具體包括用氨基酸廣義信息因子分析標(biāo)度所涉及的疏水性、a-螺旋與轉(zhuǎn)角傾向、體積性質(zhì)、構(gòu)成特征、局部柔性和靜電性6個(gè)因子對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋p-轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征,序列片斷中的每個(gè)氨基酸殘基用6個(gè)氨基酸廣義信息因子分析標(biāo)度矢量表征,并將表征結(jié)果作為P-轉(zhuǎn)角結(jié)構(gòu)識(shí)別模型的自變量。4.根據(jù)權(quán)利要求3的一種蛋白質(zhì)的P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其特征在于步驟c)具體包括如下步驟首先定義兩個(gè)指示變量,分別用"l"表示P-轉(zhuǎn)角結(jié)構(gòu),用"2,,表示非p-轉(zhuǎn)角結(jié)構(gòu),以此指示變量作為P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)模型的因變量,用線性判別分析建立P-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè);漠型。5.根據(jù)權(quán)利要求1至4中任一項(xiàng)的一種蛋白質(zhì)的|3-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,其特征在于步驟d)具體包括如下步驟采取排除非巻曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證P-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。全文摘要本發(fā)明公開(kāi)了一種蛋白質(zhì)的β-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè)及特征分析方法,能夠用于蛋白質(zhì)β-轉(zhuǎn)角結(jié)構(gòu)預(yù)測(cè),并為蛋白質(zhì)的折疊識(shí)別研究以及蛋白質(zhì)的整個(gè)三維結(jié)構(gòu)預(yù)測(cè)提供參考,包括如下步驟a)基于因子分析方法,構(gòu)建氨基酸廣義信息因子分析標(biāo)度;b)應(yīng)用氨基酸廣義信息因子分析標(biāo)度對(duì)蛋白質(zhì)結(jié)構(gòu)中足可解釋?duì)?轉(zhuǎn)角結(jié)構(gòu)特征的7-殘基滑動(dòng)序列片斷進(jìn)行表征;c)用線性判別分析建立蛋白質(zhì)的β-轉(zhuǎn)角結(jié)構(gòu)識(shí)別及特征分析模型;d)采取排除非卷曲區(qū)域中的殘基和狀態(tài)翻轉(zhuǎn)規(guī)則兩步過(guò)濾措施,保證β-轉(zhuǎn)角預(yù)測(cè)結(jié)果的真實(shí)性。文檔編號(hào)G06F19/00GK101308527SQ20081006994公開(kāi)日2008年11月19日申請(qǐng)日期2008年7月8日優(yōu)先權(quán)日2008年7月8日發(fā)明者李志良,力楊,梁桂兆,虎梅申請(qǐng)人:重慶大學(xué)