數(shù)據(jù)處理裝置以及數(shù)據(jù)處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種分別求出表示由質(zhì)量分析裝置得到的未知化合物的1^質(zhì)譜與大多數(shù)的已知化合物的MSn質(zhì)譜的類似性的分數(shù),基于該分數(shù)識別未知化合物的數(shù)據(jù)處理方法以及采用該數(shù)據(jù)處理方法的數(shù)據(jù)處理裝置。
【背景技術(shù)】
[0002]在采用離子阱型質(zhì)量分析裝置等的質(zhì)量分析中,已知有MS/MS分析(MS2分析)這樣的手法。在一般的MS2分析中,首先從分析對象的未知化合物中選擇具有目標的特定的質(zhì)荷比(m/z)的離子作為前體離子(母離子),通過CID (Collis1n Induced Dissociat1n:碰撞誘導(dǎo)解離)使該選擇的前體離子碎裂,生成碎裂離子。由于碎裂形式依存于化學(xué)結(jié)構(gòu),所以可以通過對由碎裂生成的碎片離子進行質(zhì)量分析,來取得未知化合物的MS2質(zhì)譜(化學(xué)結(jié)構(gòu)的信息)。
[0003]近年來,在識別醫(yī)藥品、農(nóng)藥、蛋白質(zhì)等未知化合物的情況下,未知化合物的分子量變大,化學(xué)結(jié)構(gòu)也變得復(fù)雜。因此,根據(jù)未知化合物的種類的不同,有時存在僅通過一階段的碎裂操作離子碎裂不到充分小的質(zhì)量的情況。在這樣的情況下,進行多次反復(fù)碎裂操作以對所生成的碎片離子進行質(zhì)量分析的MSn分析。
[0004]作為根據(jù)通過這樣的MSn分析得到的MS n質(zhì)譜推定未知化合物的化學(xué)結(jié)構(gòu)的解析處理,進行的是采用數(shù)據(jù)庫的模式匹配(/《夕一 W、y于 >夕' )處理(例如,參照專利文獻1、非專利文獻I)。在數(shù)據(jù)庫中,包含有多個化合物名以及化學(xué)結(jié)構(gòu)(已知化合物)、該已知化合物的MSn質(zhì)譜。而且,在模式匹配處理中,通過對已知化合物的MS n質(zhì)譜和未知化合物的MSn質(zhì)譜進行比較,采用加權(quán)內(nèi)積、峰值的出現(xiàn)概率等分別求出表示未知化合物的MS "質(zhì)譜與多個已知化合物的1<質(zhì)譜的類似性的分數(shù)。其結(jié)果,測定者通過按照分數(shù)從高到低的順序排列已知化合物,來識別未知化合物。
[0005]現(xiàn)有技術(shù)文獻
[0006]專利文獻
[0007]專利文獻1:日本特開2005-201835號公報
[0008]非專利文獻
[0009]非專利文獻1:Stephen E.Stein, and Donald R.Scott^Optimizat1nand Testing of Mas Spectral Library Search Algorithms for CompoundIdentif icat1n,, 1994,American Society for Mass Spectrometry, 859-866.
【發(fā)明內(nèi)容】
[0010]發(fā)明要解決的問題
[0011]然而,即使在對同一化合物進行MSn分析的情況下,所得到的MS I譜有時也會不同。即,在MSn質(zhì)譜中,峰值的離子強度1、峰值的位置(m/z)、峰值的有無等容易發(fā)生變化。因此,采用上述那樣的模式匹配處理的話,存在離子強度I改變大、峰值的位置偏移、應(yīng)該有的峰值沒有出現(xiàn)的情況,分數(shù)降低,其結(jié)果,存在不能正確評價未知化合物的MSn質(zhì)譜與多個已知化合物的1<質(zhì)譜的類似性的情況。
[0012]用于解決問題的手段
[0013]本申請的發(fā)明者為了解決上述課題,對正確評價未知化合物的MSn質(zhì)譜與多個已知化合物的MSn質(zhì)譜的類似性的檢索方法進行了研究。已知采用上述那樣的模式匹配處理的話,沒有考慮MSn質(zhì)譜中的峰值的離子強度1、峰值的位置(m/z)、峰值的有無等容易變化的情況,分數(shù)會降低。因此,找出了在對未知化合物的MSn質(zhì)譜和多個已知化合物的MS nM譜的類似性進行評價之時,對MSn質(zhì)譜中的峰值的離子強度1、峰值的位置(m/z)、峰值的有無等變化的情況加以考慮了的檢索方法。
[0014]S卩,本發(fā)明的數(shù)據(jù)處理裝置包括:預(yù)先存儲有多個已知化合物的MSn質(zhì)譜的數(shù)據(jù)庫存儲區(qū)域、取得未知化合物的1^質(zhì)譜的取得部、以及分別求出表示未知化合物的MS n質(zhì)譜與多個已知化合物的MSn質(zhì)譜的類似性的分數(shù)的分數(shù)計算部,所述數(shù)據(jù)處理裝置包括:強度分數(shù)計算部,其根據(jù)離子強度的大小分別將未知化合物的MSn質(zhì)譜中的各峰值以及已知化合物的MSn質(zhì)譜中的各峰值分類為數(shù)個階段的強度分數(shù);中性丟失計算部,其求出未知化合物的MSn質(zhì)譜中的中性丟失的峰值;以及位置分數(shù)計算部,其基于已知化合物的MS n質(zhì)譜中的包含所述中性丟失的峰值的峰值的質(zhì)荷比與相對應(yīng)的未知化合物的15"質(zhì)譜中的峰值的質(zhì)荷比之差,對于各峰值分別求出表示質(zhì)荷比的誤差的位置分數(shù),所述分數(shù)計算部對于各峰值,將已知化合物的MSn質(zhì)譜中的峰值的強度分數(shù)、未知化合物的MS n質(zhì)譜中的峰值的強度分數(shù)以及位置分數(shù)相乘,計算出關(guān)于所有峰值的乘積的總和作為分數(shù)。
[0015]在此,“未知化合物的MSn質(zhì)譜”是指在對未知化合物進行MS n分析時得到的質(zhì)譜,
“已知化合物的MSn質(zhì)譜”可以是以與未知化合物同樣的條件(離子化法、碎裂方法等)對已知化合物進行MSn分析時得到的質(zhì)譜,也可以是以與未知化合物不同的條件對已知化合物進行MSn分析時得到的質(zhì)譜,也可以是根據(jù)已知化合物的化學(xué)結(jié)構(gòu)計算出來的質(zhì)譜。
[0016]根據(jù)本發(fā)明的數(shù)據(jù)處理裝置,首先,< I >對峰值的離子強度I進行如下處理。峰值的離子強度I容易變化,但大的離子強度I的峰值被認為是容易從對象化合物得到的碎片離子的峰值。因此,對于未知化合物的MSn質(zhì)譜,根據(jù)離子強度I的大小分別將各峰值分類為數(shù)個階段(例如,上位、中位、下位),且對于數(shù)據(jù)庫的已知化合物的MSn質(zhì)譜,也根據(jù)離子強度I的大小分別將各峰值分類為數(shù)個階段(例如,上位、中位、下位)。由此,即使離子強度I不同,也能夠找到類似的峰值。
[0017]又,由于峰值的有無容易變化,所以具有如下情況:即使未知化合物的MSn質(zhì)譜和已知化合物的1<質(zhì)譜的峰值不存在于同一位置(質(zhì)荷比),但存在相互間具有中性丟失的關(guān)系的峰值。因此,中性丟失計算部對于未知化合物的MSn質(zhì)譜,根據(jù)峰值的位置和前體離子的質(zhì)量求出中性丟失的峰值。由此,即使在未知化合物的MSn質(zhì)譜中應(yīng)該有的峰值沒有出現(xiàn),也能夠使峰值相對應(yīng)。另外,關(guān)于添加于]\^"質(zhì)譜中的中性丟失的峰值的離子強度I,例如,設(shè)為與原來的峰值相同的離子強度I。
[0018]接下來,< 2 >對峰值的位置(m/z)進行如下處理。未知化合物的13。質(zhì)譜中的峰值的位置發(fā)生某程度的偏差。因此,以已知化合物的MSn質(zhì)譜中的峰值的位置為基準,在質(zhì)量分析裝置的峰值的位置的精度范圍(例如,質(zhì)量分析裝置的話為-1.0?1.0,TOF的話為-0.005?0.005、串聯(lián)四級桿的話為-0.5?0.5)內(nèi)對應(yīng)位置分數(shù)“1.0”,在該精度范圍外對應(yīng)漸近于位置分數(shù)“0.0”的位置分數(shù),由此即使峰值的位置不同,也能夠找到類似的峰值。
[0019]然后,如上所述,對于被對應(yīng)的各峰值,將已知化合物的MSn質(zhì)譜中的峰值的強度分數(shù)、未知化合物的1<質(zhì)譜中的峰值的強度分數(shù)以及位置分數(shù)相乘,計算出關(guān)于所有峰值的乘積的總和作為分數(shù)。
[0020]發(fā)明的效果
[0021]如上所述,根據(jù)本發(fā)明的數(shù)據(jù)處理裝置,即使未知化合物的MSn質(zhì)譜中的峰值的離子強度1、峰值的位置(m/z)、峰值的有無等發(fā)生變化,也能夠正確地評價未知化合物的MSn質(zhì)譜與多個已知化合物的MSl譜的類似性。
[0022](用于解決其他課題的手段以及效果)
[0023]又,在本發(fā)明的數(shù)據(jù)處理裝置中,可以具有峰值分數(shù)計算部,該峰值分數(shù)計算部基于一致度,求得表示一致度的峰值分數(shù),所述一致度根據(jù)在已知化合物的MSn質(zhì)譜中的峰值的質(zhì)荷比和未知化合物的1<質(zhì)譜中的峰值的質(zhì)荷比中一致的成對數(shù)求出,所述分數(shù)計算部將所述分數(shù)與所述峰值分數(shù)相加。
[0024]根據(jù)本發(fā)明的數(shù)據(jù)處理裝置,< 3 >對于峰值.中性丟失對的一致度進行如下處理。根據(jù)已知化合物的MSn質(zhì)譜中的峰值的質(zhì)荷比和未知化合物的MSn質(zhì)譜中的峰值(也包含中性丟失的峰值)的質(zhì)荷比中一致的成對數(shù),求出表示一致度的峰值分數(shù)(例如,(一致的峰值數(shù)/已知化合物的13。質(zhì)譜中的峰值數(shù))X 100)。
[0025]又,在本發(fā)明的數(shù)據(jù)處理裝置中,所述強度分數(shù)計算部可以根據(jù)離子強度或者該離子強度的log的轉(zhuǎn)換值的大小,分別將未知化合物的13"質(zhì)譜中的各峰值以及已知化合物的1<質(zhì)譜中的各峰值分類為3個階段、或者數(shù)個階段的強度分數(shù)。
[0026]又,在本發(fā)明的數(shù)據(jù)處理裝置中,所述強度分數(shù)計算部可以根據(jù)離子強度的大小、峰值的質(zhì)荷比的大小,分別將未知化合物的MSn質(zhì)譜中的各峰值以及已知化合物的1^質(zhì)譜中的各峰值分類為數(shù)個階段的強度分數(shù)。
[0027]根據(jù)本發(fā)明的數(shù)據(jù)處理裝置,在MSn質(zhì)譜中,峰值的獨特(二二一夕)程度與質(zhì)荷比成正比地變大,但有時會存在質(zhì)荷比大的峰值的離子強度變小的情況,所以通過與質(zhì)荷