專利名稱:用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法
技術(shù)領(lǐng)域:
本發(fā)明屬于蛋白質(zhì)組學(xué)技術(shù)領(lǐng)域,具體涉及一個用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法。
背景技術(shù):
定量蛋白質(zhì)組學(xué)方法正在不斷的完善和創(chuàng)新中,近來,一級相同質(zhì)量二級b,y碎片離子對定量的蛋白質(zhì)組學(xué)方法越來越受到關(guān)注和重視,但是目前缺乏有效的、自動化的大規(guī)模數(shù)據(jù)分析方法,僅有的一個相關(guān)分析軟件Isobaric Q,主要是基于MASCOT搜索引擎產(chǎn)生的數(shù)據(jù)結(jié)果,而且不能用于所有的一級相同質(zhì)量,二級b,y碎片離子對定量的蛋白質(zhì)組學(xué)方法。另外,一級相同質(zhì)量二級b,y碎片離子對定量的蛋白質(zhì)組學(xué)方法在提供準(zhǔn)確定量結(jié)果的同時,在定性方面,由于二級b,y碎片離子對共存的現(xiàn)象,可能會降低目標(biāo)肽段的 搜庫分?jǐn)?shù),導(dǎo)致肽段定性信息的丟失,甚至錯誤匹配,進(jìn)而影響后續(xù)定量的準(zhǔn)確性。目前的數(shù)據(jù)庫搜索引擎中,比如SEQUEST和MASCOT,還沒有有效的模塊進(jìn)行該類串級質(zhì)譜圖的尋找、處理和優(yōu)化。不過,在一級相同質(zhì)量二級b,y碎片離子對定量的蛋白質(zhì)組學(xué)方法中,由于目標(biāo)肽段的串級質(zhì)譜圖存在具有固定質(zhì)量差異的b,y碎片離子對,而不會像常規(guī)的串級質(zhì)譜圖,很難區(qū)分目標(biāo)碎片峰、雜質(zhì)峰和噪音峰,因此,該類定量方法可以利用目標(biāo)定量肽段的具有固定質(zhì)量差異的特征進(jìn)行串級譜圖優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一個通用的、自動化的、開放的并適合于所有的一級相同質(zhì)量二級b,y碎片離子對定量的蛋白質(zhì)組學(xué)方法的數(shù)據(jù)分析方法。本發(fā)明提出的一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法,其包括以下步驟
A、目標(biāo)定量肽段的篩選根據(jù)一級相同質(zhì)量二級b,y碎片離子對定量蛋白質(zhì)組學(xué)方法的不同,通過在Matlab界面中,設(shè)置不同的參數(shù)將目標(biāo)定量肽段篩選出來。B、目標(biāo)定量肽段的理論b,y碎片離子計算根據(jù)肽段在質(zhì)譜儀中的碎裂規(guī)則,+2電荷的肽段只計算+1電荷的b,y碎片離子,+3、+4和+5電荷的肽段計算+1和+2電荷的b, y碎片離子。C、目標(biāo)定量肽段的理論b,y碎片離子同實際檢測b,y碎片離子的匹配根據(jù)所用質(zhì)譜儀器的質(zhì)量精確度,可以在Matlab界面中設(shè)定不同的b,y碎片離子質(zhì)量誤差,將質(zhì)譜數(shù)據(jù)產(chǎn)生的肽段.DTA文件同上一步計算的目標(biāo)定量肽段的理論b,y離子進(jìn)行匹配。D、目標(biāo)定量肽段定量比值的計算匹配合格的b,y離子做比值后,得到每對b,y離子對的定量比值,然后利用箱線圖方法去除b,y離子對定量比值的異常值,然后計算b,y離子對的平均值作為所對應(yīng)目標(biāo)定量肽段的定量比值。E、目標(biāo)定量肽段所對應(yīng)蛋白定量比值的計算根據(jù)SEQUEST搜庫結(jié)果,將肽段歸屬到相應(yīng)的蛋白上,并且將多條肽段的定量比值進(jìn)行平均得到所歸屬蛋白的定量比值。本發(fā)明中,所述一級相同質(zhì)量二級b,y碎片離子對定量蛋白質(zhì)組學(xué)方法為體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法。本發(fā)明中,步驟(A)前還包括一步驟,具體如下利用b,y碎片離子對存在固定質(zhì)量差異的特征,將b,y碎片離子對共碎裂譜圖進(jìn)行拆分,得到相同背景離子,輕標(biāo)或重標(biāo)b,y碎片離子的串級譜圖?!白V圖拆分”減少了 b,y碎片離子對共碎裂譜圖對肽段正確定性的影響。本發(fā)明中,步驟E后還包括一步驟考察定量蛋白的顯著性,為確定實際樣品中的上下調(diào)變化蛋白提供參考依據(jù),顯著性通過構(gòu)造z統(tǒng)計量來計算得到,具體如下
首先,每一個蛋白的定量比值除以整個數(shù)據(jù)集蛋白的平均定量比值 得到該蛋白的歸一化定量比值(r),其次,每一個蛋白的顯著性通過構(gòu)造z統(tǒng)計量來計算得到。具體來說,每一個定量蛋白的顯著性可以被定義為
‘廣在這個公式中,如果,、,z =3,如果y ,z=^。(其中!■代
-·一P >*1 -Cr < rc,-ο ·-:
表歸一化的蛋白質(zhì)定量比值,代表所有定量比值的15. 87百分位數(shù),.代表所有定量比值的50百分位數(shù),代表所有定量比值的84. 13百分位數(shù)。分析實際樣品時,為了得到發(fā)生上下調(diào)變化的蛋白,必須通過考察定量蛋白的顯著性以及歸一化比值來進(jìn)行評判,推薦的定量蛋白的顯著性應(yīng)小于等于O. 05。本發(fā)明方法中,步驟A中所述在Matlab界面中,可以設(shè)置不同的參數(shù),包括蛋白酶切所用的酶、是否使用漏切肽段、目標(biāo)肽段N端產(chǎn)生的質(zhì)量增加值、目標(biāo)肽段C端產(chǎn)生的質(zhì)量增加值、肽段固定修飾產(chǎn)生的質(zhì)量增加值、輕重標(biāo)記肽段的質(zhì)量增加絕對值。本發(fā)明方法中,步驟D中所述的取b,y離子對的平均值作為所對應(yīng)目標(biāo)定量肽段的定量比值,選取η對以上b,y離子對的平均值作為所對應(yīng)目標(biāo)定量肽段的定量比值(η彡4,η為正整數(shù)),從而保證肽段定量的準(zhǔn)確度。本發(fā)明提出的用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法,采用Matlab語言進(jìn)行編寫,在Matlab界面下進(jìn)行運行。該數(shù)據(jù)分析方法首次基于SEQUEST搜索引擎得到的蛋白定性結(jié)果,通過提取串級質(zhì)譜中b,y碎片離子對的峰強(qiáng)度信息,做比值后得到肽段和蛋白的定量信息。同時,為了避免串級質(zhì)譜圖中b,y碎片離子對共碎裂譜圖對目標(biāo)肽段正確定性的影響,增加了 “譜圖拆分”的優(yōu)化模塊,顯著降低了 b,y碎片離子對共碎裂譜圖對正確定性的影響,大大提高了定性和定量數(shù)據(jù)的信息量。該發(fā)明為一級相同質(zhì)量二級b,y碎片離子對定量蛋白質(zhì)組學(xué)新方法的進(jìn)一步發(fā)展和應(yīng)用,提供了一個通用的、開放的、快速的、準(zhǔn)確的和高效的定量分析手段。
圖I為篩選體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法中的目標(biāo)定量肽段時,Matlab界面的不同參數(shù)設(shè)置示意圖。
圖2為體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法通過一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法產(chǎn)生的定量信息示意圖。圖3為一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法中優(yōu)化模塊“譜圖拆分”的原理示意圖。圖4為三次I: I混合的體內(nèi)終端氨基酸標(biāo)記的HeLa細(xì)胞提取物的優(yōu)化前和“譜圖拆分”優(yōu)化后的定量肽段和蛋白的數(shù)目、平均值、標(biāo)準(zhǔn)偏差和優(yōu)化后定量肽段和蛋白增加的百分比。圖5為本發(fā)明中用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法的流程示意圖。
具體實施方式
下面的實施例是對本發(fā)明提出的一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法的進(jìn)一步說明。如圖5所示,為本發(fā)明中用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法的流程示意圖。實施例I 一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法(以體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法產(chǎn)生的數(shù)據(jù)為例)
I)目標(biāo)定量肽段的篩選體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法中的目標(biāo)定量肽段為賴氨酸開頭精氨酸結(jié)尾的肽段,因此在Matlab界面中,設(shè)置不同的參數(shù),如圖I所示,將目標(biāo)定量肽段篩選出來。2)目標(biāo)定量肽段的理論b,y碎片離子計算根據(jù)肽段在質(zhì)譜儀中的碎裂規(guī)則,+2電荷的肽段只計算+1電荷的b,y碎片離子,+3,+4和+5電荷的肽段計算+1和+2電荷的b,y碎片離子。3)目標(biāo)定量肽段的理論b,y碎片離子同實際檢測b,y碎片離子的匹配根據(jù)所用質(zhì)譜儀器LTQ-Orbitrap的質(zhì)量精確度,在Matlab界面中,設(shè)定串級質(zhì)譜中b,y碎片離子的質(zhì)量誤差為IDa,如圖I所示,接著將質(zhì)譜數(shù)據(jù)產(chǎn)生的肽段.DTA文件同上一步計算的目標(biāo)定量肽段的理論b,y離子進(jìn)行匹配。4)目標(biāo)定量肽段定量比值的計算匹配合格的b,y離子做比值后,得到每對b,y離子對的定量比值,然后利用箱線圖方法去除b,y離子對定量比值的異常值,再取大于等于6對b,y離子對的平均值作為所對應(yīng)目標(biāo)定量肽段的定量比值,從而保證肽段定量的準(zhǔn)確度。5)目標(biāo)定量肽段所對應(yīng)蛋白定量比值的計算根據(jù)SEQUEST搜庫結(jié)果,將肽段歸屬到相應(yīng)的蛋白上,并且將多條肽段的定量比值進(jìn)行平均得到所歸屬蛋白的定量比值,如圖2中部分定量蛋白的定量信息所示。6)目標(biāo)定量肽段的優(yōu)化利用b,y碎片離子對存在固定質(zhì)量差異的特征,將b,y碎片離子對共碎裂譜圖進(jìn)行拆分,如圖3所示,得到相同背景離子,輕標(biāo)或重標(biāo)b,y碎片離子的串級譜圖,然后再次通過SEQUEST搜索,得到目標(biāo)肽段及其蛋白的定性和定量信息,三次I: I混合的體內(nèi)終端氨基酸標(biāo)記的HeLa細(xì)胞提取物的優(yōu)化前及優(yōu)化后的實驗結(jié)果如圖4所示,結(jié)果表明該優(yōu)化模塊在保證定量準(zhǔn)確度的前提下,大大提高了定性肽段和定性蛋白的數(shù)目,提供了更多的定性和定量信息。7)定量蛋白的顯著性計算首先,每一個蛋白的定量比值除以整個數(shù)據(jù)集蛋白的平均定量比值得到該蛋白的歸一化定量比值(r),如圖2所示,其次,根據(jù)構(gòu)造的z統(tǒng)計量公
式,顯著性可以被定義為士/xe-t:+=dt,在這個公式中,如果,、,z =&,如果一,Z =其中r代表歸一化的蛋白質(zhì)定量比值,代表所有定量比值的15. 87百分位
ο· --II^1
數(shù),re代表所有定量比值的50百分位數(shù),代表所有定量比值的84. 13百分位數(shù),計算出每一個定量蛋白的顯著性,也如圖2所示。
上述實施例僅用以說明而非限制本發(fā)明的技術(shù)方案。任何不脫離本發(fā)明精神和范圍的技術(shù)方案均應(yīng)涵蓋在本發(fā)明的專利申請范圍當(dāng)中。
權(quán)利要求
1.一種用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法,其特征在于具體步驟如下 A、目標(biāo)定量肽段的篩選根據(jù)一級相同質(zhì)量二級b,y碎片離子對定量蛋白質(zhì)組學(xué)方法的不同,通過在Matlab界面中,設(shè)置不同的參數(shù)將目標(biāo)定量肽段篩選出來; B、目標(biāo)定量肽段的理論b,y碎片離子計算根據(jù)肽段在質(zhì)譜儀中的碎裂規(guī)則,+2電荷的肽段只計算+1電荷的b,y碎片離子,+3、+4和+5電荷的肽段計算+1和+2電荷的b,y碎片離子; C、目標(biāo)定量肽段的理論b,y碎片離子同實際檢測b,y碎片離子的匹配根據(jù)所用質(zhì)譜儀器的質(zhì)量精確度,在Matlab界面中設(shè)定不同的b,y碎片離子質(zhì)量誤差,將質(zhì)譜數(shù)據(jù)產(chǎn)生的肽段.DTA文件同上一步計算的目標(biāo)定量肽段的理論b,y離子進(jìn)行匹配; D、目標(biāo)定量肽段定量比值的計算匹配合格的b,y離子做比值后,得到每對b,y離子對的定量比值,然后利用箱線圖方法去除b,y離子對定量比值的異常值,再計算b,y離子對的平均值作為所對應(yīng)目標(biāo)定量肽段的定量比值; E、目標(biāo)定量肽段所對應(yīng)蛋白定量比值的計算根據(jù)SEQUEST搜庫結(jié)果,將肽段歸屬到相應(yīng)的蛋白上,并且將多條肽段的定量比值進(jìn)行平均得到所歸屬蛋白的定量比值。
2.根據(jù)權(quán)利要求I所述的數(shù)據(jù)分析方法,其特征在于步驟(A)前還包括一步驟,具體如下利用b,y碎片離子對存在固定質(zhì)量差異的特征,將b,y碎片離子對共碎裂譜圖進(jìn)行拆 分,得到相同背景離子,輕標(biāo)或重標(biāo)b,y碎片離子的串級譜圖。
3.根據(jù)權(quán)利要求I或2所述的數(shù)據(jù)分析方法,其特征在于步驟(E)后還包括一步驟考察定量蛋白的顯著性,具體如下 每一個蛋白的顯著性通過構(gòu)造z統(tǒng)計量來計算得到,被定義為 在這個公式中,如果 果 ,其中r代表歸一化的蛋白質(zhì)定量比值,每一個蛋白的定量比值除以整個數(shù)據(jù)集蛋白的平均定量比值,代表所有定量比值的15. 87百分位數(shù),代表所有定量比值的50百分位數(shù),q代表所有定量比值的84. 13百分位數(shù)。
4.根據(jù)權(quán)利要求I或2或3所述的數(shù)據(jù)分析方法,其特征在于步驟(A)中所述定量蛋白質(zhì)組學(xué)方法為體內(nèi)終端氨基酸標(biāo)記定量蛋白質(zhì)組學(xué)方法。
5.根據(jù)權(quán)利要求I或2或3所述的數(shù)據(jù)分析方法,其特征在于步驟(A)所述Matlab界面中設(shè)置的參數(shù)包括蛋白酶切所用的酶、是否使用漏切肽段、目標(biāo)肽段N端產(chǎn)生的質(zhì)量增加值、目標(biāo)肽段C端產(chǎn)生的質(zhì)量增加值、肽段固定修飾產(chǎn)生的質(zhì)量增加值、輕重標(biāo)記肽段的質(zhì)量增加絕對值。
6.根據(jù)權(quán)利要求I或2或3所述的數(shù)據(jù)分析方法,其特征在于步驟(D)中計算肽段的定量比值時,用來進(jìn)行定量的b,y離子對的對數(shù)大于等于4對。
全文摘要
本發(fā)明涉及蛋白質(zhì)組學(xué)技術(shù)領(lǐng)域,具體為一種用于一級相同質(zhì)量二級b,y碎片離子對定量方法的數(shù)據(jù)分析方法,該方法采用Matlab語言編寫,在Matlab界面下運行,其基于SEQUEST搜索引擎得到的蛋白定性結(jié)果,通過提取串級質(zhì)譜中b,y碎片離子對的峰強(qiáng)度信息,做比值后得到肽段和蛋白的定量信息。該方法還加入了一個“譜圖拆分”的優(yōu)化模塊,減少了b,y碎片離子對共碎裂譜圖對肽段正確定性的影響。本發(fā)明還構(gòu)造z統(tǒng)計量計算定量蛋白的顯著性,為確定實際樣品中上下調(diào)變化蛋白提供參考依據(jù)。本發(fā)明為一級相同質(zhì)量二級b,y碎片離子對的定量蛋白質(zhì)組學(xué)新方法的發(fā)展和應(yīng)用,提供了一個通用的、開放的、準(zhǔn)確的定量分析手段。
文檔編號G01N27/62GK102809600SQ20121024990
公開日2012年12月5日 申請日期2012年7月19日 優(yōu)先權(quán)日2012年7月19日
發(fā)明者聶愛英, 張磊, 晏國全, 姚鋆, 張揚, 賀福初, 楊芃原, 陸豪杰 申請人:復(fù)旦大學(xué)