用于對n-連接糖肽進行高通量識別和定量的生物信息學(xué)平臺的制作方法
【專利摘要】本發(fā)明涉及通過使用高分辨率質(zhì)譜儀獲得的質(zhì)譜來對糖肽進行識別和定量的更加有效且精確的方法,與一般肽相比,所述糖肽具有相對低的豐度。因此,通過從各種樣品中篩選作為疾病標記物(生物標記物)的糖肽,可將本發(fā)明的方法有效地用于對生物治療藥物進行識別和對癌癥或疾病進行診斷的技術(shù)。
【專利說明】用于對N-連接糖肽進行高通量識別和定量的生物信息學(xué)平臺
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基于質(zhì)譜法對N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺?!颈尘凹夹g(shù)】
[0002]人血是多種蛋白的混合物,其中至少50%是糖蛋白。然而,由于糖蛋白樣品的高度復(fù)雜性和多樣性,以及糖肽具有比起非糖肽而言相對更低的質(zhì)譜強度,通常不能對樣品中的所有糖肽進行表征。從引入高分辨率質(zhì)譜儀起,聚糖和糖蛋白的分析發(fā)展迅速。然而,對糖蛋白進行識別和定量所必需的生物信息學(xué)技術(shù)還未跟上時代。已知許多治療性蛋白以多種形式和非常復(fù)雜的方式糖基化。主要有兩種用于對此類糖蛋白的糖基化進行識別和定量的技術(shù)手段。一種手段是通過使用由酶或化合物誘發(fā)的化學(xué)裂解來對聚糖進行識別和定量,另一手段是對糖肽進行識別和定量。然而,用于對所釋放的聚糖進行分析的方法具有無法得知糖基化位點特異性信息的問題。如果能夠?qū)μ请淖陨磉M行識別和定量,不但可識別腫瘤和檢查腫瘤發(fā)展,而且除糖蛋白自身外,還可獲得關(guān)于糖基化位點、N-連接糖鏈的大小和側(cè)鏈增長數(shù)量的大量信息。
[0003]通常,糖蛋白的糖基化分析方法包括在蛋白水平上對糖蛋白進行濃縮的步驟。但是在本發(fā)明中,使用標準糖蛋白樣品進行并完成本發(fā)明。尤其是,通過用胰蛋白酶水解所述標準糖蛋白樣品而獲得肽和糖肽。隨后,用高分辨率質(zhì)譜儀對這些肽進行分析。將串聯(lián)質(zhì)譜(MS/MS)和質(zhì)譜(MS)的結(jié)果與糖肽數(shù)據(jù)庫進行比較,從而對糖肽進行識別和定量。
[0004]近年來使用MS/MS或MS對糖肽進行篩選的軟件可例舉出:Peptoonist (DavidGoldberg 等,Automated N-Glycopeptide Identification Using a Combinationof Single-and Tandem-MS, Journal of proteome research,2007,6,3995-4005);SimGlycan (http://glycotools.qa-bi0.com/SimGlycan) ;GlycoMiner(01iverOzohanics 等,GlycoMiner:a new software tool to elucidate glycopeptidecomposition, Rapid Communications in Mass Spectrometry,2008,22,3245-3254);GlycoSpectrumScan(Nandan Deshpande 等,GlycoSpectrumScan:Fishing Glycopeptidesfrom MS Spectra of Protease Digests of Human Colostrum slgA,Journal of proteomeresearch,2010,9,1063-1075) ;GlycoPep Grader (Carrie L.Woodin等,GlycoPep Grader:A Web-Based Utility for Assigning the Composition of N-Linked Glycopeptides,Analytical Chemistry, 2012)等。
[0005]由于上述軟件程序被設(shè)計為通過僅使用串聯(lián)質(zhì)譜來識別糖肽,因此,對于糖肽性質(zhì)的準確分析值得懷疑,且定量分析結(jié)果的不一致也是另一問題。不支持各種高分辨率質(zhì)譜儀成為了上述程序的問題。
[0006]為克服上述問題,本發(fā)明人研究并完成了使用質(zhì)譜來對糖肽進行更加有效的識別和定量的新方法,與一般肽相比,所述糖肽具有相對低的豐度。首先,對以高濃度存在于人血清中的 281 種糖蛋白的糖妝(Terry Farrah 等,A High-Confidence Human PlasmaProteome Reference Set with Estimated Concentrations in PeptideAtlas,MolecularCell Proteomics,2011)進行儲存,并對此類糖肽的理論同位素分布進行建模。將獲得的結(jié)果錄入數(shù)據(jù)庫。在本發(fā)明中,還通過使用MS/MS和MS獲得糖肽的同位素分布,將該同位素分布與糖肽數(shù)據(jù)庫進行比較,從而精確地識別糖肽,并通過計算離子色譜圖中的面積來對該糖肽進行定量。
【發(fā)明內(nèi)容】
[0007]技術(shù)問題
[0008]本發(fā)明的目的是提供使用質(zhì)譜結(jié)果對糖肽進行更加有效且精確的識別和定量的生物信息學(xué)平臺,與一般肽相比,所述糖肽具有相對低的豐度。
[0009]技術(shù)方案
[0010]為實現(xiàn)上述目的,本發(fā)明提供了用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,該生物信息學(xué)平臺包括如下步驟:
[0011]通過使用高分辨率質(zhì)譜儀,對用蛋白酶將糖蛋白水解而制備的多肽進行分析來獲得質(zhì)譜(步驟I);
[0012]將在步驟I中獲得的質(zhì)譜轉(zhuǎn)換為MSl (質(zhì)譜I)和串聯(lián)譜(MS/MS)(步驟2);
[0013]計算各串聯(lián)譜的M得分,所述串聯(lián)譜選自于由顯示出如下氧鎗離子峰分子量的轉(zhuǎn)換串聯(lián)譜所組成的組:129.06,138.06,145.05,147.07,163.06,168.07,186.08,204.08、274.09,292.10,350.15,366.14,454.16,528.19 和 657.24(步驟 3);
[0014]使用在步驟3中獲得的M得分選擇糖肽譜(步驟4);
[0015]獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而計算S得分,并通過使用所計算的S得分識別糖肽候選物(步驟5);
[0016]通過使用串聯(lián)譜中的E得分、Y得分和Y'得分,對來自步驟5中識別的糖肽候選物的確切糖肽進行評價(步驟6);
[0017]用在步驟6中評價的糖肽進行定量分析(步驟7);以及
[0018]通過用在步驟6中定量的糖肽進行相關(guān)性分析,對同族N-連接糖肽進行另外的識別和定量(步驟8)。
[0019]有益效果
[0020]如上文所述,本發(fā)明提供了用于對各種樣品中的具有特定糖鏈的糖肽進行定量的更加有效且精確的方法,并由此通過對來自各種樣品的疾病標記物進行篩選,可將該方法有效地用于對癌癥或疾病進行預(yù)測和診斷的技術(shù)。對于希望用高分辨率質(zhì)譜儀對糖蛋白生物相似性治療藥物的糖肽和糖結(jié)構(gòu)進行分析的人來說,該方法也是有用的。
【專利附圖】
【附圖說明】
[0021]圖1是示出用于對來自樣品的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺的流程圖。
[0022]圖2a是示出糖肽和一般肽的M得分分布的圖(根據(jù)生物信息學(xué)平臺的步驟2,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的本發(fā)明實施例的N-連接糖肽進行識別和定量)。[0023]圖2b是示出糖肽和一般肽的靈敏度與特異性之間的相關(guān)性的圖(根據(jù)生物信息學(xué)平臺的步驟2,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的本發(fā)明實施例的N-連接糖肽進行識別和定量)。
[0024]圖3是示出S得分優(yōu)化的靈敏度與特異性之間的相關(guān)性的圖,所述S得分通過用于對以標準糖蛋白進行的本發(fā)明實施例的N-連接糖肽進行識別和定量的生物信息學(xué)平臺的步驟5中與數(shù)據(jù)庫進行比較而獲得。
[0025]圖4a是示出在用標準糖蛋白進行的本發(fā)明實施例中識別的N-連接糖肽中,NLTK_5200的代表性HCD譜的圖。
[0026]圖4b是示出在用標準糖蛋白進行的本發(fā)明實施例中識別的N-連接糖肽中,NLTK_5200的代表性CID譜的圖。
[0027]圖5a是示出在用標準糖蛋白進行的本發(fā)明實施例中識別的N-連接糖肽中,SRNLTK_5200的代表性HCD譜的圖。
[0028]圖5b是示出在用標準糖蛋白進行的本發(fā)明實施例中識別的N-連接糖肽中,SRNLTK_5200的代表性ETD譜的圖。
[0029]圖6a是示出在生物信息學(xué)平臺的步驟7中定量的糖肽相對量的餅圖,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的實施例1的N-連接糖肽進行識別和定量。
[0030]圖6b是示出在生物信息學(xué)平臺的步驟7中定量的糖肽相對量的餅圖,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的實施例2的N-連接糖肽進行識別和定量。
[0031]圖7a是示出通過生物信息學(xué)平臺的步驟8中的糖肽相關(guān)性分析而獲得的相關(guān)性圖,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的實施例1的N-連接糖肽進行識別和定量。糖肽的相對量以節(jié)點中的紅色色度示出,輪廓顏色基于圖譜計數(shù)(spectrum count)。如表I所示,當串聯(lián)質(zhì)譜計數(shù)的數(shù)值為O時,所述顏色顯示出綠色;當串聯(lián)質(zhì)譜計數(shù)的數(shù)值為I時,所述顏色顯示出灰色。同樣地,當該數(shù)值為2以上時,所述顏色顯示出黑色。
[0032]圖7b是示出通過生物信息學(xué)平臺的步驟8中的糖肽相關(guān)性分析而獲得的相關(guān)性圖,所述生物信息學(xué)平臺用于對以標準糖蛋白進行的實施例2的N-連接糖肽進行識別和定量。糖肽的相對量以節(jié)點中的紅色色度示出,輪廓顏色基于圖譜計數(shù)。如表2所示,當串聯(lián)質(zhì)譜計數(shù)的數(shù)值為O時,所述顏色顯示出綠色;當串聯(lián)質(zhì)譜計數(shù)的數(shù)值為I時,所述顏色顯示出灰色。同樣地,當該數(shù)值為2以上時,所述顏色顯示出黑色。
[0033]圖8為示出相對于確定在實施例1的混合樣品中的RNase B (核糖核酸酶B)的濃度,對糖肽進行定量的圖。
[0034]圖9為示出相對于實施例2示出的加入至血漿中的AGP(α 1-酸性糖蛋白)的濃度,對糖肽進行定量的圖。
【具體實施方式】
[0035]為了更加詳細地描述本發(fā)明,對本說明書中所使用的術(shù)語進行如下定義:
[0036]“蛋白酶”是指對含葡萄糖的糖蛋白的氨基酸鍵進行切割以生成肽混合物的酶。
[0037]“串聯(lián)質(zhì)譜法”是用于對來自總質(zhì)譜(MS)的所選離子(高豐度離子或感興趣的離子)的質(zhì)譜進行分析(MS/MS)的方法。
[0038]“同位素”是指具有相同的原子序數(shù)但原子量不同的化學(xué)元素。[0039]“同位素分組”是指對從實驗獲得的峰列表識別出的同位素進行分組。
[0040]“N-糖肽同位素建?!笔侵赣蓴?shù)據(jù)庫建立的糖肽的理論同位素分布。
[0041]“S得分(相似度得分)”是指表示由實驗獲得的同位素峰分布與由數(shù)據(jù)庫理論推測的同位素峰分布之間的相似度的數(shù)值。
[0042]“ δ ”是指表示理論質(zhì)量與經(jīng)實驗證實的實際質(zhì)量之差的絕對值。
[0043]以下將對本發(fā)明進行詳細描述。
[0044]本發(fā)明提供了用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,所述生物信息學(xué)平臺包括如下步驟:
[0045]通過使用高分辨率質(zhì)譜儀,對用蛋白酶將糖蛋白水解而制備的多肽進行分析來獲得質(zhì)譜(步驟I);
[0046]將在步驟I中獲得的質(zhì)譜轉(zhuǎn)換為MSl (質(zhì)譜I)和串聯(lián)譜(MS/MS)(步驟2);
[0047]計算各串聯(lián)譜的M得分,所述串聯(lián)譜選自于由顯示出如下氧鎗離子峰分子量的轉(zhuǎn)換串聯(lián)譜所組成的組:129.06,138.06,145.05,147.07,163.06,168.07,186.08,204.08、274.09,292.10,350.15,366.14,454.16,528.19 和 657.24(步驟 3);
[0048]使用在步驟3中獲得的M得分選擇糖肽譜(步驟4);
[0049]獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而計算S得分,并通過使用所計算的S得分識別糖肽候選物(步驟5);
[0050]通過使用串聯(lián)譜中的E得分、Y得分和Y'得分,對來自步驟5中識別的糖肽候選物的確切糖肽進行評價(步驟6);
[0051]用在步驟6中評價的糖肽進行定量分析(步驟7);以及
[0052]通過用在步驟6中定量的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別和定量(步驟8)。
[0053]本發(fā)明還提供了通過同位素分布的比較,用來對糖肽進行更加精確且有效的識別和定量的生物信息學(xué)平臺。尤其是,本發(fā)明提供了在使用M得分獲得糖肽譜并使用Y得分、E得分或Y'得分再次對糖肽進行確認和評價后,通過使用同位素分布來精確識別糖肽的方法。
[0054]以下將圖1用作參考,逐步地對本發(fā)明的實施例進行更加詳細的描述。
[0055]在本發(fā)明的優(yōu)選實施方式中,通過包括如下步驟的方法對糖肽進行識別和定量,但并不總限于此:
[0056]I)通過用高分辨率質(zhì)譜儀Orbitrap,對用胰蛋白酶將糖蛋白水解而制備的多肽進行分析,獲得所述多肽的質(zhì)譜;
[0057]2)通過使用RawExtractor vl.9,將在步驟I中獲得的質(zhì)譜儀RAW文件轉(zhuǎn)換為msl (TXT)文件格式,并進一步通過使用MM File Convertion Tools ν3.9將該msl文件格式轉(zhuǎn)換為ms2 (MGF)文件格式;
[0058]3)由在步驟2中轉(zhuǎn)換的ms2 (MGF)文件的各HCD (高能碰撞解離)譜計算M得分;
[0059]4)選擇在步驟3中獲得的M得分為至少1.5的糖肽譜;
[0060]5)獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而對S得分為至少98.0的糖肽候選物進行識別;
[0061]6)通過使用在步驟5中識別的糖肽候選物的HCD譜中的V得分和CID(碰撞誘導(dǎo)解離)譜中的Y得分,對糖肽進行精確評價;
[0062]7)對在步驟6中識別的糖肽進行定量分析;以及
[0063]8)通過用在步驟6中識別的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別
和定量。
[0064]在本發(fā)明的另一優(yōu)選實施方式中,優(yōu)選通過包括如下步驟的方法對糖肽進行識別和定量,但并不總限于此:
[0065]I)通過用高分辨率質(zhì)譜儀Orbitrap,對用胰蛋白酶將糖蛋白水解而制備的多肽進行分析,獲得所述多肽的質(zhì)譜;
[0066]2)通過使用RawExtractor vl.9,將在步驟I中獲得的質(zhì)譜儀RAW文件轉(zhuǎn)換為msl (TXT)文件格式,并進一步通過使用MM File Convertion Tools ν3.9將該msl文件格式轉(zhuǎn)換為ms2 (MGF)文件格式;
[0067]3)由在步驟2中轉(zhuǎn)換的ms2 (MGF)文件的各HCD (高能碰撞解離)譜計算M得分;
[0068]4)選擇在步驟3中獲得的M得分為至少1.5的糖肽譜;
[0069]5)獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而對S得分為至少98.0的糖肽候選物進行識別;
[0070]6)通過使用在步驟5中識別的糖肽候選物的HCD譜中的V得分和ETD(電子轉(zhuǎn)移解離)譜中的E得分,對糖肽進行精確評價;
[0071]7)對在步驟6中識別的糖肽進行定量分析;以及
[0072]8)通過用在步驟6中識別的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別
和定量。
[0073]在本發(fā)明的另一優(yōu)選實施方式中,優(yōu)選通過包括如下步驟的方法對糖肽進行識別和定量,但并不總限于此:
[0074]I)通過用高分辨率質(zhì)譜儀Orbitrap,對用胰蛋白酶將糖蛋白水解而制備的多肽進行分析,獲得所述多肽的質(zhì)譜;
[0075]2)通過使用RawExtractor vl.9,將在步驟I中獲得的質(zhì)譜儀RAW文件轉(zhuǎn)換為msl (TXT)文件格式,并進一步通過使用MM File Convertion Tools ν3.9將msl文件格式轉(zhuǎn)換為ms2 (MGF)文件格式;
[0076]3)由在步驟2中轉(zhuǎn)換的ms2 (MGF)文件中的各HCD (高能碰撞解離)譜計算M得分;
[0077]4)選擇在步驟3中獲得的M得分為至少1.5的糖肽譜;
[0078]5)獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而對S得分為至少98.0的糖肽候選物進行識別;
[0079]6)通過使用在步驟5中識別的糖肽候選物的HCD串聯(lián)譜中的Y'得分,對糖肽進行精確評價;
[0080]7)對在步驟6中識別的糖肽進行定量分析;以及
[0081]8)通過用在步驟6中識別的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別
和定量。
[0082]在本發(fā)明的另一優(yōu)選實施方式中,優(yōu)選通過包括如下步驟的方法對糖肽進行識別和定量,但并不總限于此:[0083]I)通過用高分辨率質(zhì)譜儀LTQ-FT,對用胰蛋白酶將糖蛋白水解而制備的多肽進行分析,獲得所述多肽的質(zhì)譜;
[0084]2)通過使用RawExtractor vl.9,將在步驟I中獲得的質(zhì)譜儀RAW文件轉(zhuǎn)換為msl (TXT)文件格式,并進一步通過使用MM File Convertion Tools ν3.9將msl文件格式轉(zhuǎn)換為ms2 (MGF)文件格式;
[0085]3)由在步驟2中轉(zhuǎn)換的ms2 (MGF)文件中的各CID譜計算M得分;
[0086]4)選擇在步驟3中獲得的M得分為至少0.5的糖肽譜;
[0087]5)獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而對S得分為至少98.0的糖肽候選物進行識別;
[0088]6)通過使用在步驟5中識別的糖肽候選物的CID串聯(lián)譜中的Y得分,對糖肽進行精確評價;
[0089]7)對在步驟6中識別的糖肽進行定量分析;以及
[0090]8)通過用在步驟6中識別的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別
和定量。
[0091]在本發(fā)明的另一優(yōu)選實施方式中,優(yōu)選通過包括如下步驟的方法對糖肽進行識別和定量,但并不總限于此:
[0092]I)通過用高分辨率質(zhì)譜儀Triple-Tof,對用胰蛋白酶將糖蛋白水解而制備的多肽進行分析,獲得所述多肽的質(zhì)譜;
[0093]2)通過使用 AB Science MS Data Convert vl.3 和 ProteoWizard ν2.1 (http://proteowizard.sourceforge.net/),將在步驟I中獲得的質(zhì)譜儀WIFF文件轉(zhuǎn)換為msl (TXT)和ms2 (MGF)文件格式;
[0094]3)由在步驟2中轉(zhuǎn)換的ms2 (MGF)文件中的各CID譜計算M得分;
[0095]4)選擇在步驟3中獲得的M得分為至少1.5的糖肽譜;
[0096]5)獲得在步驟4中選擇的糖肽譜的MSl中的同位素分布,將該同位素分布與數(shù)據(jù)庫進行比較,從而對S得分為至少98.0的糖肽候選物進行識別;
[0097]6)通過使用在步驟5中識別的糖肽候選物的CID串聯(lián)譜中的Y得分,對糖肽進行精確評價;
[0098]7)對在步驟6中識別的糖肽進行定量分析;以及
[0099]8)通過用在步驟6中識別的糖肽進行相關(guān)性分析,對同族N-糖肽進行另外的識別
和定量。
[0100]在本發(fā)明中,使用了高分辨率質(zhì)譜儀,從而對更復(fù)雜且具有廣泛多樣性的糖肽進行定性和定量分析,所述糖肽以低于一般肽的濃度存在。為更快且更精確地對由質(zhì)譜獲得的結(jié)果進行分析,將M得分、S得分、E得分、Y得分和y得分用于對糖肽進行識別和定量。[0101 ] 在上述方法中,在對一般肽譜和糖肽譜進行的分析中,使用如步驟3中所示的M得分更加有效。可通過如下的數(shù)學(xué)式I計算所述M得分:
[0102]數(shù)學(xué)式I
[0103]
【權(quán)利要求】
1.一種用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,所述生物信息學(xué)平臺包括如下步驟: 步驟1:通過使用高分辨率質(zhì)譜儀,對用蛋白酶將糖蛋白水解而制備的多肽進行分析來獲得質(zhì)譜; 步驟2:將在步驟I中獲得的所述質(zhì)譜轉(zhuǎn)換為MSl (質(zhì)譜I)和串聯(lián)譜(MS / MS); 步驟3:計算各串聯(lián)譜的M得分,所述串聯(lián)譜選自于由顯示出如下氧釹離子峰分子量的轉(zhuǎn)換串聯(lián)譜所組成的組:129.06,138.06,145.05,147.07,163.06,168.07,186.08,204.08、274.09,292.10,350.15,366.14,454.16,528.19 和 657.24 ; 步驟4:使用在步驟3中獲得的所述M得分選擇糖肽譜; 步驟5:獲得在步驟4中選擇的所述糖肽譜的MSl中的同位素分布,將所述同位素分布與數(shù)據(jù)庫進行比較,從而計算S得分,并通過使用所計算的S得分識別糖肽候選物; 步驟6:通過使用所述串聯(lián)譜中的E得分、Y得分和Y'得分,對來自步驟5中識別的所述糖肽候選物的確切糖肽進行評價; 步驟7:用在步驟6中評價的所述糖肽進行定量分析;以及 步驟8:通過用在步驟6中定量的糖肽進行相關(guān)性分析,對同族N-連接糖肽進行另外的識別和定量。
2.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,所述串聯(lián)譜是CID譜或HCD譜,并通過如下的數(shù)學(xué)式I計算所述M得分: 數(shù)學(xué)式I
3.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,在所述步驟 5中進行所述計算,用MSlS得分對從所述數(shù)據(jù)庫獲得的理論同位素分布與通過實驗獲得的同位素分布之間的相似度進行比較,所述計算通過如下的數(shù)學(xué)式2進行: 數(shù)學(xué)式2
4.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,通過使用糖肽的理論同位素分布,在所述步驟4中,由糖蛋白建立所述數(shù)據(jù)庫。
5.如權(quán)利要求3所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,通過使用歐幾里得距離對同位素質(zhì)量分布的相似度進行測量,并通過使用Pearson相關(guān)性分析對強度分布的相似度進行測量,從而產(chǎn)生所述步驟5中的S得分。
6.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,所述步驟6中的所述串聯(lián)譜為CID譜或HCD譜,并通過如下的數(shù)學(xué)式3計算所述Y得分: 數(shù)學(xué)式3
7.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,所述步驟6中的所述串聯(lián)譜是HCD譜,并通過如下的數(shù)學(xué)式4計算Y'得分: 數(shù)學(xué)式4 V得分=Y得分+y得分。
8.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,所述步驟6中的所述串聯(lián)譜是ETD譜,并通過如下的數(shù)學(xué)式5計算E得分: 數(shù)學(xué)式5
9.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,基于在所述步驟6中使用串聯(lián)譜(MS / MS)精確識別的糖肽另外對同族N-糖肽進行預(yù)測后,不用串聯(lián)譜(MS / MS)、而是在MSl中使用S得分和MS精確度對糖肽進行識別和定量。
10.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,在所述步驟8中的識別和定量后,以代表各比較樣品之間的相似度的圖來示出所有糖肽的相關(guān)性。
11.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,通過使用選自于由下列酶所組成的組中的酶進行所述水解:胰蛋白酶、Arg-C> Asp-N、Glu_C、Lys-C 和胰凝乳蛋白酶。
12.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,所述質(zhì)譜儀為選自于由下列質(zhì)譜儀所組成的組中的一種:LTQ-FT、Orbitrap>Triple-Tof>Q-Tof和 QExactive0
13.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,通過使用所述高分辨率質(zhì)譜儀進行所述識別和定量,所述高分辨率質(zhì)譜儀具有至少10,000的質(zhì)量分辨率和高達50ppm的質(zhì)量精確度。
14.如權(quán)利要求1所述的 用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,通過在MSl譜中使用S得分對用于定量的糖肽進行選擇。
15.如權(quán)利要求1所述的用于對來自糖蛋白的N-連接糖肽進行識別和定量的新型生物信息學(xué)平臺,其中,由MSl譜選擇的用于定量的糖肽的強度以理論上預(yù)期的3個最強峰的強度之和不出。
【文檔編號】C12Q1/34GK103890578SQ201380002424
【公開日】2014年6月25日 申請日期:2013年1月22日 優(yōu)先權(quán)日:2012年9月27日
【發(fā)明者】樸建昱, 劉鍾信, 金珍英, 李周妍, 李賢京, 安賢珠, 金載韓 申請人:韓國基礎(chǔ)科學(xué)支援研究院