亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法

文檔序號:6148086閱讀:436來源:國知局
專利名稱:一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法
技術領域
本發(fā)明屬于生物技術領域,涉及生物標記和藥物靶標篩選方面。
背景技術
本發(fā)明是一種適用于蛋白芯片數(shù)據(jù)分析的新算法,可以將實驗鑒定的差異蛋白峰 所對應的目標蛋白進行生物信息學預測。適用于基于SELDI(表面增強激光解吸離子)或 MALDI (基質(zhì)輔助激光解吸電離離子)平臺的蛋白芯片實驗系統(tǒng)。 飛行時間質(zhì)譜(TOF)蛋白質(zhì)芯片能夠找到對照及實驗樣本之間的差異峰,而這些 差異峰都是由相應的蛋白經(jīng)過激發(fā)而產(chǎn)生的(蛋白質(zhì)在吸收能量后脫離芯片表面,由于其 中加有一個正電荷,在電場中向陰極飛去,分子量大的飛行時間長,分子量小的飛行時間 短,以此標記蛋白質(zhì)的分子量),蛋白質(zhì)芯片的原理大致如圖1。 由于蛋白質(zhì)芯片分析的是混合蛋白,通過單次質(zhì)譜,解析離子峰所對應的蛋白是 困難的,故這些差異峰對應的是哪個或者哪些蛋白質(zhì)卻并不知道,需要進一步的利用其他 實驗方法得到,如western[l],串聯(lián)質(zhì)譜[2]等,這樣即耗時又耗費金錢。
因為SELDI —般使用能量比較低的激光,因此產(chǎn)生的主要的是一價離子,所以理 論的m/z值即為多肽的分子量與一個質(zhì)子的質(zhì)量。常規(guī)的方法就是將實驗分析得到的感興 趣的離子峰的m/z值,與基因的理論的m/z比較,來得到離子峰所對應的基因。由于實驗誤 差的存在,以及理論的m/z可能計算不準,如多肽鏈可能脫水或脫氨,因此m/z比較的時候 可以允許一定的偏差的,一般Am/Z = 1 20Da(道爾頓,分子量計量單位)是可以接受的。 使用該方法對應到的基因,可以使用western直接進行實驗驗證。但是該方法也有自己的 缺點。我們感興趣的離子峰的m/z值一般都在l,OOO 10,000Da左右,而在swiss-prot 的人的蛋白數(shù)據(jù)庫中,大約只有2. 78% (348/12,484)的基因m/z小于10, 000。因此這種 方法實際上是將基因組內(nèi)97%以上的基因都排除在外。這顯然是不夠合理的。因此我們提 出了新的解決方案。 在飛行時間質(zhì)譜(TOF)蛋白質(zhì)芯片的實驗過程中,蛋白質(zhì)的斷裂有三種情況一 是有些蛋白是完整的,沒有在內(nèi)部發(fā)生斷裂;第二種是有些蛋白的肽鍵只發(fā)生了一次斷裂, 并由此產(chǎn)生兩種離子,陽離子和陰離子;第三種情況是有些蛋白發(fā)生了隨機的斷裂,且斷裂 的次數(shù)大于一次。 我們的專利方法通過綜合分析這3種不同的情況,利用生物信息學方法預測蛋白 質(zhì)芯片質(zhì)譜峰所對應的蛋白質(zhì)。


圖1是蛋白質(zhì)芯片的原理圖。 圖2是質(zhì)譜生成b-ion(負離子)和y-ion(正離子)兩種離子的示意圖。
圖3是直接搜索法的結果。
圖4是間接搜索法的結果。
圖5是混合搜索法的結果。

發(fā)明內(nèi)容
本發(fā)明根據(jù)相關的文獻和蛋白質(zhì)芯片的原理,找到了一種可以直接利用蛋白質(zhì)芯 片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法,可以免除中間實驗的繁煩步 驟,直接針對目標蛋白質(zhì)進行鎖定,以便于進一步的實驗驗證。
其實施步驟如下 步驟一 將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作,每個樣本都 可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。 步驟二 根據(jù)實驗設計的情況,對樣本進行分組,得到不同組份樣本間的差異蛋白 峰。 步驟三對步驟二得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情 況,我們綜合3種方法來對差異蛋白峰進行蛋白預測。 方法一 該方式假定目標蛋白沒有發(fā)生斷裂,我們直接將差異蛋白峰與蛋白質(zhì)數(shù) 據(jù)庫(如swiss-prot數(shù)據(jù)庫,www. ebi. ac. uk/swiss)中已經(jīng)存在的蛋白質(zhì)進行比較,比較 的標準是利用質(zhì)荷比(m/z)這個參數(shù)。 方法二 假蛋白只斷裂一次,該方法假定蛋白(多肽)只斷裂一次。那么將生成 b-ion(負離子)和y-ion(正離子)兩種離子。b-ion和y-ion產(chǎn)生的示意圖見圖2。
通過將我們感興趣的離子峰的m/z值與蛋白數(shù)據(jù)庫中所有理論的b-ion和y-ion 的m/z相比較,既可找出質(zhì)譜峰對應的蛋白。 一般允許誤差取A m/z = 0. 01 0. IDa比較適宜。 方法三假設蛋白斷裂的次數(shù)大于一次,最后利用假設檢驗的方法可以給出m/z 與基因的關聯(lián)的顯著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目,使用這種方法是比較恰 當?shù)摹?在第二種方法中,假設每個蛋白(多肽)被切割不多于一次。更為寬松的假設則 是不限制蛋白(多肽)被切割的次數(shù)。即蛋白(多肽)可以被隨意切碎,產(chǎn)生任意的子肽 段。但是這樣的假設會大大的增加理論離子庫的規(guī)模,結果是,每個我們要分析的離子峰m/ z都會找到很多個基因相對應。為了從這些眾多的基因中,篩選出真正的對應來,需要用到 基因芯片實驗的數(shù)據(jù)。利用基因芯片篩選到的差異基因,作為分析背景,可以大大的縮小理 論離子庫的規(guī)模,提高信噪比。最后利用假設檢驗的方法可以給出m/z與基因的關聯(lián)的顯 著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目,使用混合搜索法是比較恰當?shù)摹?
簡單來講,比如我們使用swiss-prot數(shù)據(jù)庫,假設該數(shù)據(jù)庫一共有R條蛋白質(zhì) (多肽)序列。這些序列的長度記為&,rv…,rv對于任何一個質(zhì)量為m的峰,在數(shù)據(jù)庫中
能產(chǎn)生該峰的多肽序列長度應該介于和L2之間,其中A =
186. 07932和57. 02147分別為最大氨基酸殘基(tryptophan)和最小殘基(glycine)的分 那么,在數(shù)據(jù)庫中,可以產(chǎn)生質(zhì)量為m的峰的多肽總數(shù)為

57.02147
w 在這N (m)個多肽中,質(zhì)量恰好為m的多肽數(shù)目記作E (m),那么質(zhì)量為m的峰的背 景分布頻率為〃(W) = ]^ 實際上由于精確度的原因,我們允許m值有小的誤差S (比如說S = 0. lDa),那 么ms = [m- S , m+ S ],則
《)。 獲得了質(zhì)量為m的峰的背景分布頻率之后,對于一個基因芯片篩選到的差異基因 P(氨基酸長度為np),該基因能產(chǎn)生質(zhì)量為ms的多肽總數(shù)為
^k)=|]( -"i)
基因P與質(zhì)量為m的峰之間的匹配是完全隨機的概率為
P—va/ e = l — =1-(1 —6>(附《)盧°""
、0 如果基因P與質(zhì)量為m的峰之間的P-value小于某個閾值,比如說O. Ol,我們就可 以認為基因P與質(zhì)量為m的峰之間的匹配不是隨機的,即質(zhì)量為m的峰很有可能來源于基 因P。 本方法的特征 該方法根據(jù)相關的文獻和蛋白質(zhì)芯片的原理,找到了一種可以直接利用蛋白質(zhì)芯 片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法,可以免除中間實驗的繁煩步 驟,直接針對目標蛋白質(zhì)進行鎖定,以便于進一步的實驗驗證。 在創(chuàng)新性方面,我們的方法解決了常規(guī)方法無法預測大分子量蛋白的問題(方法 二)。同時提供了一種整合基因芯片與蛋白芯片分析來鑒定蛋白的新方法(方法三)。最 后通過整合3種不同的方法,可以大大增加預測的靈敏度和特異度。
下面以一癌癥疾病實例,做進一步的說明
疾病類型一種癌癥 SELDI結果根據(jù)SELDI芯片分析,找到了 10個差異峰。
進一步的分析 利用前期的SELDI芯片得到的差異峰,利用上述的算法,對上述的差異峰進行了 分析,結果如下 方法一 直接搜索法的結果(部分結果) 參見圖3。 方法二間接搜索法結果 參見圖4。
方法三混合搜索法結果
參見圖5。
參考文獻 [1]JT Huang et al. Independent protein-profiling studies show a decreasein apolipoprotein Al levels in schizophrenia CSF, brain andperipheral tissues. Mol Psychiatry. 2007 Oct 16 [2]G Kwapiszewska et al. Identification of proteins inlaser—microdissected smal1 cell numbers by SELDI—T0F and TandemMS. BMC Biotechnol. 2004Dec 3 ;4 :30. [3]YT Li et al. Identification of a plasma proteomic signature todistinguish pediatric osteosarcoma from benign osteochondroma. Proteomics 2006,6,3426-3435 [4] XT Deng et al.Link test-a statistical method for finding prostatecancer biomarkers. Computational Biology and Chemistry 30(2006)425-433
以上是對本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實施方式,均在本發(fā)明 的保護范圍之中。
權利要求
一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法,其特征在于該方法包括有如下步驟步驟1將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作,每個樣本都可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。步驟2根據(jù)實驗設計的情況,對樣本進行分組,得到不同組份樣本間的差異蛋白峰。步驟3對步驟2得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情況,我們采用三種方式來對差異蛋白峰進行蛋白預測。
2. 根據(jù)權利要求1所述的一種利用蛋白質(zhì)芯片技術鑒定差異表達蛋白的新方法,其特 征在于在步驟3中對其得到的差異蛋白峰進行采用三種方法進行蛋白質(zhì)預測方法一 假定目標蛋白沒有發(fā)生斷裂,我們直接將差異蛋白峰與蛋白質(zhì)數(shù)據(jù)庫(如swiss-prot數(shù)據(jù) 庫,www. ebi.ac.uk/swiss)中已經(jīng)存在的蛋白質(zhì)進行比較,比較的標準是利用質(zhì)荷比(m/ z)這個參數(shù)。方法二假設蛋白只斷裂一次,該方法假定蛋白(多肽)只斷裂一次。那么 將生成b-ion(負離子)和y-ion(正離子)兩種離子。通過將我們感興趣的離子峰的m/z 值與蛋白數(shù)據(jù)庫中所有理論的b-ion和y-ion的m/z相比較,既可找出質(zhì)譜峰對應的蛋白。 一般允許誤差取Am/z = 0. 01 0. 1Da比較適宜。方法三假設蛋白斷裂的次數(shù)大于一次,最后利用假設檢驗的方法可以給出m/z與基 因的關聯(lián)的顯著性。對于同時可以獲得基因芯片數(shù)據(jù)的項目,使用這種方法是比較恰當?shù)摹?br> 全文摘要
本發(fā)明根據(jù)相關的文獻和蛋白質(zhì)芯片的原理,找到了一種可以直接利用蛋白質(zhì)芯片找到的差異峰來進行目標蛋白質(zhì)篩選的生物信息學方法,可以免除中間實驗的繁瑣步驟,直接針對目標蛋白質(zhì)進行鎖定,以便于進一步的實驗驗證。本發(fā)明主要包括如下流程步驟1將實驗樣本(病人的血清標本)進行蛋白質(zhì)芯片的實驗操作,每個樣本都可以得到一系列蛋白質(zhì)離子峰的數(shù)據(jù)。步驟2根據(jù)實驗設計的情況,對樣本進行分組,得到不同組份樣本間的差異蛋白峰。步驟3對步驟二得到的差異蛋白峰進行蛋白質(zhì)預測。依據(jù)蛋白質(zhì)斷裂的三種情況,我們綜合3種方法來對差異蛋白峰進行蛋白預測。
文檔編號G01N27/64GK101776681SQ20091004522
公開日2010年7月14日 申請日期2009年1月13日 優(yōu)先權日2009年1月13日
發(fā)明者吳劍丙, 陳喆 申請人:陳喆;吳劍丙
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1