一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法

文檔序號：6148086閱讀：436來源：國知局

專利名稱：一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法
技術領域：
本發(fā)明屬于生物技術領域，涉及生物標記和藥物靶標篩選方面。
背景技術：
本發(fā)明是一種適用于蛋白芯片數(shù)據(jù)分析的新算法，可以將實驗鑒定的差異蛋白峰所對應的目標蛋白進行生物信息學預測。適用于基于SELDI(表面增強激光解吸離子)或 MALDI (基質(zhì)輔助激光解吸電離離子)平臺的蛋白芯片實驗系統(tǒng)。飛行時間質(zhì)譜(TOF)蛋白質(zhì)芯片能夠找到對照及實驗樣本之間的差異峰，而這些差異峰都是由相應的蛋白經(jīng)過激發(fā)而產(chǎn)生的(蛋白質(zhì)在吸收能量后脫離芯片表面，由于其中加有一個正電荷，在電場中向陰極飛去，分子量大的飛行時間長，分子量小的飛行時間短，以此標記蛋白質(zhì)的分子量)，蛋白質(zhì)芯片的原理大致如圖1。由于蛋白質(zhì)芯片分析的是混合蛋白，通過單次質(zhì)譜，解析離子峰所對應的蛋白是困難的，故這些差異峰對應的是哪個或者哪些蛋白質(zhì)卻并不知道，需要進一步的利用其他實驗方法得到，如western[l]，串聯(lián)質(zhì)譜[2]等，這樣即耗時又耗費金錢。
因為SELDI —般使用能量比較低的激光，因此產(chǎn)生的主要的是一價離子，所以理論的m/z值即為多肽的分子量與一個質(zhì)子的質(zhì)量。常規(guī)的方法就是將實驗分析得到的感興趣的離子峰的m/z值，與基因的理論的m/z比較，來得到離子峰所對應的基因。由于實驗誤差的存在，以及理論的m/z可能計算不準，如多肽鏈可能脫水或脫氨，因此m/z比較的時候可以允許一定的偏差的，一般Am/Z = 1 20Da(道爾頓，分子量計量單位)是可以接受的。使用該方法對應到的基因，可以使用western直接進行實驗驗證。但是該方法也有自己的缺點。我們感興趣的離子峰的m/z值一般都在l，OOO 10，000Da左右，而在swiss-prot 的人的蛋白數(shù)據(jù)庫中，大約只有2. 78% (348/12,484)的基因m/z小于10， 000。因此這種方法實際上是將基因組內(nèi)97%以上的基因都排除在外。這顯然是不夠合理的。因此我們提出了新的解決方案。在飛行時間質(zhì)譜(TOF)蛋白質(zhì)芯片的實驗過程中，蛋白質(zhì)的斷裂有三種情況一是有些蛋白是完整的，沒有在內(nèi)部發(fā)生斷裂；第二種是有些蛋白的肽鍵只發(fā)生了一次斷裂，并由此產(chǎn)生兩種離子，陽離子和陰離子；第三種情況是有些蛋白發(fā)生了隨機的斷裂，且斷裂的次數(shù)大于一次。我們的專利方法通過綜合分析這3種不同的情況，利用生物信息學方法預測蛋白質(zhì)芯片質(zhì)譜峰所對應的蛋白質(zhì)。

圖1是蛋白質(zhì)芯片的原理圖。圖2是質(zhì)譜生成b-ion(負離子)和y-ion(正離子)兩種離子的示意圖。
圖3是直接搜索法的結果。
圖4是間接搜索法的結果。
圖5是混合搜索法的結果。

發(fā)明內(nèi)容
本發(fā)明根據(jù)相關的文獻和蛋白質(zhì)芯片的原理，找到了一種可以直接利用蛋白質(zhì)芯片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法，可以免除中間實驗的繁煩步驟，直接針對目標蛋白質(zhì)進行鎖定，以便于進一步的實驗驗證。
其實施步驟如下步驟一將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作，每個樣本都可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。步驟二根據(jù)實驗設計的情況，對樣本進行分組，得到不同組份樣本間的差異蛋白峰。步驟三對步驟二得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情況，我們綜合3種方法來對差異蛋白峰進行蛋白預測。方法一該方式假定目標蛋白沒有發(fā)生斷裂，我們直接將差異蛋白峰與蛋白質(zhì)數(shù) 據(jù)庫(如swiss-prot數(shù)據(jù)庫，www. ebi. ac. uk/swiss)中已經(jīng)存在的蛋白質(zhì)進行比較，比較的標準是利用質(zhì)荷比(m/z)這個參數(shù)。方法二假蛋白只斷裂一次，該方法假定蛋白(多肽)只斷裂一次。那么將生成 b-ion(負離子)和y-ion(正離子)兩種離子。b-ion和y-ion產(chǎn)生的示意圖見圖2。
通過將我們感興趣的離子峰的m/z值與蛋白數(shù)據(jù)庫中所有理論的b-ion和y-ion 的m/z相比較，既可找出質(zhì)譜峰對應的蛋白。一般允許誤差取A m/z = 0. 01 0. IDa比較適宜。方法三假設蛋白斷裂的次數(shù)大于一次，最后利用假設檢驗的方法可以給出m/z 與基因的關聯(lián)的顯著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目，使用這種方法是比較恰當?shù)摹?在第二種方法中，假設每個蛋白(多肽)被切割不多于一次。更為寬松的假設則是不限制蛋白(多肽)被切割的次數(shù)。即蛋白(多肽)可以被隨意切碎，產(chǎn)生任意的子肽段。但是這樣的假設會大大的增加理論離子庫的規(guī)模，結果是，每個我們要分析的離子峰m/ z都會找到很多個基因相對應。為了從這些眾多的基因中，篩選出真正的對應來，需要用到基因芯片實驗的數(shù)據(jù)。利用基因芯片篩選到的差異基因，作為分析背景，可以大大的縮小理論離子庫的規(guī)模，提高信噪比。最后利用假設檢驗的方法可以給出m/z與基因的關聯(lián)的顯著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目，使用混合搜索法是比較恰當?shù)摹?
簡單來講，比如我們使用swiss-prot數(shù)據(jù)庫，假設該數(shù)據(jù)庫一共有R條蛋白質(zhì) (多肽)序列。這些序列的長度記為&，rv…，rv對于任何一個質(zhì)量為m的峰，在數(shù)據(jù)庫中
能產(chǎn)生該峰的多肽序列長度應該介于和L2之間，其中A =
186. 07932和57. 02147分別為最大氨基酸殘基(tryptophan)和最小殘基(glycine)的分那么，在數(shù)據(jù)庫中，可以產(chǎn)生質(zhì)量為m的峰的多肽總數(shù)為
附
57.02147
w 在這N (m)個多肽中，質(zhì)量恰好為m的多肽數(shù)目記作E (m)，那么質(zhì)量為m的峰的背景分布頻率為〃(W) = ]^ 實際上由于精確度的原因，我們允許m值有小的誤差S (比如說S = 0. lDa)，那么ms = [m- S ， m+ S ]，則
《)。獲得了質(zhì)量為m的峰的背景分布頻率之后，對于一個基因芯片篩選到的差異基因 P(氨基酸長度為np)，該基因能產(chǎn)生質(zhì)量為ms的多肽總數(shù)為
^k)=|]( -"i)
基因P與質(zhì)量為m的峰之間的匹配是完全隨機的概率為
P—va/ e = l — =1-(1 —6>(附《)盧°""
、0 如果基因P與質(zhì)量為m的峰之間的P-value小于某個閾值，比如說O. Ol，我們就可以認為基因P與質(zhì)量為m的峰之間的匹配不是隨機的，即質(zhì)量為m的峰很有可能來源于基因P。本方法的特征該方法根據(jù)相關的文獻和蛋白質(zhì)芯片的原理，找到了一種可以直接利用蛋白質(zhì)芯片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法，可以免除中間實驗的繁煩步驟，直接針對目標蛋白質(zhì)進行鎖定，以便于進一步的實驗驗證。在創(chuàng)新性方面，我們的方法解決了常規(guī)方法無法預測大分子量蛋白的問題(方法二)。同時提供了一種整合基因芯片與蛋白芯片分析來鑒定蛋白的新方法(方法三)。最后通過整合3種不同的方法，可以大大增加預測的靈敏度和特異度。
下面以一癌癥疾病實例，做進一步的說明
疾病類型一種癌癥 SELDI結果根據(jù)SELDI芯片分析，找到了 10個差異峰。
進一步的分析利用前期的SELDI芯片得到的差異峰，利用上述的算法，對上述的差異峰進行了分析，結果如下方法一直接搜索法的結果(部分結果) 參見圖3。方法二間接搜索法結果參見圖4。
方法三混合搜索法結果
參見圖5。
參考文獻 [1]JT Huang et al. Independent protein-profiling studies show a decreasein apolipoprotein Al levels in schizophrenia CSF， brain andperipheral tissues. Mol Psychiatry. 2007 Oct 16 [2]G Kwapiszewska et al. Identification of proteins inlaser—microdissected smal1 cell numbers by SELDI—T0F and TandemMS. BMC Biotechnol. 2004Dec 3 ;4 :30. [3]YT Li et al. Identification of a plasma proteomic signature todistinguish pediatric osteosarcoma from benign osteochondroma. Proteomics 2006,6,3426-3435 [4] XT Deng et al.Link test-a statistical method for finding prostatecancer biomarkers. Computational Biology and Chemistry 30(2006)425-433
以上是對本發(fā)明的描述而非限定，基于本發(fā)明思想的其它實施方式，均在本發(fā)明的保護范圍之中。
權利要求
一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法，其特征在于該方法包括有如下步驟步驟1將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作，每個樣本都可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。步驟2根據(jù)實驗設計的情況，對樣本進行分組，得到不同組份樣本間的差異蛋白峰。步驟3對步驟2得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情況，我們采用三種方式來對差異蛋白峰進行蛋白預測。
2. 根據(jù)權利要求1所述的一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法，其特征在于在步驟3中對其得到的差異蛋白峰進行采用三種方法進行蛋白質(zhì)預測方法一假定目標蛋白沒有發(fā)生斷裂，我們直接將差異蛋白峰與蛋白質(zhì)數(shù)據(jù)庫(如swiss-prot數(shù)據(jù) 庫，www. ebi.ac.uk/swiss)中已經(jīng)存在的蛋白質(zhì)進行比較，比較的標準是利用質(zhì)荷比(m/ z)這個參數(shù)。方法二假設蛋白只斷裂一次，該方法假定蛋白(多肽)只斷裂一次。那么將生成b-ion(負離子)和y-ion(正離子)兩種離子。通過將我們感興趣的離子峰的m/z 值與蛋白數(shù)據(jù)庫中所有理論的b-ion和y-ion的m/z相比較，既可找出質(zhì)譜峰對應的蛋白。一般允許誤差取Am/z = 0. 01 0. 1Da比較適宜。方法三假設蛋白斷裂的次數(shù)大于一次，最后利用假設檢驗的方法可以給出m/z與基因的關聯(lián)的顯著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目，使用這種方法是比較恰當?shù)摹?br> 全文摘要
本發(fā)明根據(jù)相關的文獻和蛋白質(zhì)芯片的原理，找到了一種可以直接利用蛋白質(zhì)芯片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法，可以免除中間實驗的繁瑣步驟，直接針對目標蛋白質(zhì)進行鎖定，以便于進一步的實驗驗證。本發(fā)明主要包括如下流程步驟1將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作，每個樣本都可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。步驟2根據(jù)實驗設計的情況，對樣本進行分組，得到不同組份樣本間的差異蛋白峰。步驟3對步驟二得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情況，我們綜合3種方法來對差異蛋白峰進行蛋白預測。
文檔編號G01N27/64GK101776681SQ20091004522
公開日2010年7月14日申請日期2009年1月13日優(yōu)先權日2009年1月13日
發(fā)明者吳劍丙, 陳喆申請人:陳喆;吳劍丙

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：陳喆;吳劍丙
技術所有人：陳喆;吳劍丙
我是此專利的發(fā)明人

上一篇：透射電子顯微鏡檢測樣片的制備方法
上一篇：一種乳酸鏈球菌素的hplc檢測方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、邢老師：1.機械設計及理論 2.生物醫(yī)學材料及器械 3.聲發(fā)射檢測技術。
2、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
3、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
4、張老師：1.機械設計的應力分析、強度校核的計算機仿真 2.生物反應器研制 3.生物力學
5、趙老師：檢測與控制技術、機器人技術、機電一體化技術
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法