本發(fā)明涉及一種分析樣品中所含有的化學(xué)成分的方法,尤其涉及一種基于UPLC-QTOF的植物差異性代謝物快速篩選方法。
背景技術(shù):
目前,在中藥、香精香料等植物提取物質(zhì)量控制領(lǐng)域研究中,獲取可以表征不同產(chǎn)地、批次等樣本組間差異性的方法,并據(jù)此對(duì)產(chǎn)品質(zhì)量進(jìn)行品質(zhì)調(diào)控不僅是工業(yè)企業(yè),也是科研單位非常感興趣的領(lǐng)域。然而,由于植物的提取物品質(zhì)是植物與生長(zhǎng)環(huán)境相互作用所產(chǎn)生的代謝產(chǎn)物的整體作用結(jié)果,外在宏觀品質(zhì)的差異多是由于其中的一些成分組成與其它組的樣本差異所致。在植物分析中如何從更為整體的角度去篩選這些差異性代謝物成為當(dāng)前研究的一個(gè)難點(diǎn)。基于UPLC-QTOF的非靶標(biāo)代謝輪廓分析技術(shù)從整體上對(duì)植物中的化學(xué)成分進(jìn)行表征與中藥等領(lǐng)域的整體作用思路相一致,在近年來(lái)受到更多的關(guān)注。
植物樣本物質(zhì)構(gòu)成復(fù)雜性的特點(diǎn)能夠充分發(fā)揮UPLC-QTOF非靶標(biāo)代謝論廓技術(shù)的優(yōu)勢(shì)。通常,每個(gè)植物樣本的UPLC-QTOF數(shù)據(jù)中含有上千種的化學(xué)成分,如何提取這些成分,并使得樣本間的結(jié)果具有可比性則成為一個(gè)具有挑戰(zhàn)性的難題。目前的方法中,僅有少數(shù)幾個(gè)方法能夠?qū)崿F(xiàn)這一分析過(guò)程,其中最為著名的方法是XCMS。然而,XCMS方法存在色譜提取不完全的問(wèn)題。另外,當(dāng)前的方法中普遍存在假陽(yáng)性問(wèn)題,需要人為干預(yù),增加了額外的工作量并且降低了分析效率。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于UPLC-QTOF的植物差異性代謝物快速篩選方法,可以快速篩選出同一種植物不同產(chǎn)地樣本間的差異性代謝產(chǎn)物
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種基于UPLC-QTOF的植物差異性代謝物快速篩選方法,分析同一物種不同來(lái)源的至少兩個(gè)樣本,包括以下步驟:
時(shí)間漂移校正:每一個(gè)樣本分別得到一個(gè)該樣本所有色譜峰的高精度質(zhì)譜表征,選擇一個(gè)樣本作為參比,利用動(dòng)態(tài)規(guī)劃算法進(jìn)行其它樣本相對(duì)參比的時(shí)間漂移校正,即對(duì)于其它樣本的每一個(gè)色譜峰,都根據(jù)其保留時(shí)間和質(zhì)譜精度與參比相比較進(jìn)行校正,時(shí)間漂移的閾值設(shè)定為2min,質(zhì)譜精度誤差設(shè)定100ppm,使得不同樣本中對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰保留時(shí)間較為接近,接著使用自適應(yīng)網(wǎng)絡(luò)鏈接算法對(duì)不同樣本間對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰進(jìn)行注冊(cè),最終使得不同樣本中屬于同一個(gè)物質(zhì)的色譜峰對(duì)齊;
方差分析建模:接著利用方差分析分析所有樣本中屬于同一個(gè)物質(zhì)的色譜峰,篩選不同樣本之間具有差異性的指標(biāo),利用PLS-DA模型計(jì)算各自在建模過(guò)程中的VIP值,最終選擇VIP大于1,且置信水平小于0.05的變量作為潛在的能夠表征樣本間差異的差異性代謝物。
最優(yōu)的,所述時(shí)間漂移校正步驟中,使用自適應(yīng)網(wǎng)絡(luò)鏈接算法對(duì)不同樣本間對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰進(jìn)行注冊(cè)的具體步驟如下:
尋找侯選峰:選擇一個(gè)當(dāng)前色譜峰,將其他樣本中與選擇的當(dāng)前色譜峰不在同一個(gè)鏈接線上,且距離最近的色譜峰定義為侯選峰;
鏈接兩個(gè)峰:若其他樣本中與侯選峰不在同一個(gè)鏈接線上,且距離最近的色譜峰是當(dāng)前色譜峰,則鏈接兩個(gè)峰,即將當(dāng)前色譜峰和侯選峰可視作不同樣本中對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰;若其他樣本中與侯選峰不在同一個(gè)鏈接線上,且距離最近的色譜峰不是當(dāng)前色譜峰,則不鏈接兩個(gè)峰;鏈接的過(guò)程引入一個(gè)約束,即一個(gè)樣本不能出現(xiàn)兩個(gè)色譜峰對(duì)應(yīng)同一個(gè)物質(zhì),且屬于同一個(gè)物質(zhì)的質(zhì)譜精度誤差為100ppm。
重復(fù)操作:重復(fù)尋找侯選峰至鏈接兩個(gè)峰步驟,直到鏈接線無(wú)法更新時(shí),停止重復(fù)。
最優(yōu)的,還包括以下步驟:
獲得低分辨質(zhì)譜數(shù)據(jù):將UPLC-QTOF中得到的高分辨質(zhì)譜數(shù)據(jù)轉(zhuǎn)化為低分辨質(zhì)譜數(shù)據(jù);即每一個(gè)樣本獲得一個(gè)Time×m/z的色譜信號(hào)矩陣,一個(gè)m/z下收集一個(gè)色譜信號(hào);
一個(gè)m/z下色譜信號(hào)中基線的校正:將一個(gè)m/z色譜信號(hào)中的局部極小值設(shè)定為該m/z色譜信號(hào)的初始背景噪聲的極小值,使用迭代優(yōu)化算法剔除該初始背景噪聲中屬于色譜信號(hào)中色譜峰的部分,得到該色譜信號(hào)真正的背景噪聲的極小值,根據(jù)該色譜信號(hào)真正的背景噪聲的極小值在色譜信號(hào)中的原始位置,利用線性插值估算出基線漂移,扣除基線漂移后,獲得一個(gè)m/z下基線校正后色譜信號(hào);
每個(gè)樣本中所有m/z下色譜信號(hào)基線校正:將每一個(gè)m/z下的色譜信號(hào)都做上述一個(gè)m/z色譜信號(hào)中基線的校正的處理,得到基線校正后的m/z色譜信號(hào);
色譜信號(hào)中有效色譜峰的提?。菏褂貌煌叨雀咚蛊交矸e運(yùn)算進(jìn)行色譜信號(hào)平滑,提取每一次平滑后色譜信號(hào)中所有的局部極大值,且將所有的局部極大值的位置標(biāo)記,通過(guò)脊線尋優(yōu)的方法,分別獲得每個(gè)色譜峰在色譜信號(hào)中的原始位置,接著使用色譜信號(hào)中非色譜峰部分的儀器噪聲波動(dòng),計(jì)算出儀器噪聲水平,剔除色譜信號(hào)與儀器噪聲之比小于3的色譜峰,剩下的色譜峰為能夠準(zhǔn)確定量的有效色譜峰,即完成色譜信號(hào)中有效色譜峰的提?。?/p>
一個(gè)色譜峰的高精度質(zhì)譜表征:根據(jù)一個(gè)有效色譜峰所位于的低分辨色譜信號(hào)的m/z值,查找高分辨率質(zhì)譜信號(hào)中在該m/z±0.5Da范圍內(nèi)的最大的離子,并使用該離子的高精度質(zhì)譜值標(biāo)記該有效色譜峰,從而獲得一個(gè)色譜峰的高精度質(zhì)譜值;
所有色譜峰的高精度質(zhì)譜表征:將每一個(gè)有效色譜峰均使用上述一個(gè)色譜峰的高精度質(zhì)譜表征的方法處理,最終得到所有色譜峰的高精度質(zhì)譜表征。
最優(yōu)的,還包括以下步驟:
離子碎片的聚類:一個(gè)分子質(zhì)量為M的物質(zhì)在正離子模式下會(huì)產(chǎn)生[M+H]+、[M+2H]+、[M+3H]+、[M+H-H2O]+、[M+H-2H2O]+、[M+NH3]+、[M+Na]+、[M-H+Na]+、[M+H+Na]+、[M-H+2Na]+、[M+H+2Na]+或[M+K]+中的至少一個(gè)碎片離子峰,將得到的所有色譜峰的高精度質(zhì)譜表征中時(shí)間窗口為0.05min,質(zhì)譜精度設(shè)置為100ppm中屬于同一物質(zhì)的分子離子峰和碎片離子峰進(jìn)行聚類。
最優(yōu)的,所述獲得低分辨質(zhì)譜數(shù)據(jù)步驟具體中,將UPLC-QTOF中得到的高分辨質(zhì)譜數(shù)據(jù)轉(zhuǎn)化為精度為1Da步長(zhǎng)的低分辨質(zhì)譜數(shù)據(jù)。
最優(yōu)的,所述一個(gè)m/z下色譜信號(hào)中基線的校正步驟中,使用迭代優(yōu)化算法的迭代收斂標(biāo)準(zhǔn)為10-6。
最優(yōu)的,所述色譜信號(hào)中有效色譜峰的提取步驟中,其中使用不同尺度高斯平滑卷積運(yùn)算進(jìn)行色譜信號(hào)平滑,所使用高斯函數(shù)標(biāo)準(zhǔn)偏差范圍是1~13,且步長(zhǎng)0.1。
最優(yōu)的,還包括以下步驟:
UPLC-QTOF分析:
進(jìn)行UPLC-QTOF分析的色譜條件為:色譜柱為Agilent C18柱,色譜柱的長(zhǎng)度為100mm,色譜柱的直徑為4.6mm,色譜柱的粒徑為1.7μm,柱溫為35℃;流動(dòng)相A為0.1%甲酸水溶液,流動(dòng)相B為0.1%甲酸乙腈溶液,色譜分析時(shí),流動(dòng)相梯度為,初始時(shí)流動(dòng)相A占流動(dòng)相總體積的95%,流動(dòng)相B占流動(dòng)相總體積的5%,接下來(lái)的20min內(nèi)流動(dòng)相A占流動(dòng)相總體積的份數(shù)降至5%,流動(dòng)相B占流動(dòng)相總體積的份數(shù)升至95%;
進(jìn)行UPLC-QTOF分析的質(zhì)譜條件為:干燥氣溫度為350℃;干燥氣流速為12L/min;噴霧氣壓力為40psi;保護(hù)氣溫度為350℃;保護(hù)氣流速為10L/min;電離電壓為3500V;質(zhì)譜掃描范圍為50–1500;正離子模式;
UPLC-QTOF分析結(jié)束后得到高分辨質(zhì)譜數(shù)據(jù)。
最優(yōu)的,還包括以下步驟:
樣本的制備過(guò)程:將新鮮收集的樣本放入液氮中速凍,在液氮條件下將樣本研磨粉碎,將粉碎的樣本中加入提取液,渦旋混勻后室溫超聲處理,然后離心,且取上清液轉(zhuǎn)移至色譜瓶中,待UPLC-QTOF分析。
最優(yōu)的,所述樣本的制備過(guò)程步驟中,提取液包括3體積份的乙腈、3體積份的異丙醇和2體積份的水;渦旋1~4分鐘,室溫超聲處理50~80分鐘,離心條件為12000r/min離心5min。
由上述技術(shù)方案可知,本發(fā)明提供的基于UPLC-QTOF的植物差異性代謝物快速篩選方法,該方法利用UPLC-QTOF現(xiàn)代分析技術(shù)獲得植物中物質(zhì)化學(xué)組分信息,隨后利用非靶標(biāo)代謝輪廓分析技術(shù)對(duì)物質(zhì)信息進(jìn)行提取,采用對(duì)色譜峰進(jìn)行提取和源內(nèi)裂解分子碎片聚類后,采用動(dòng)態(tài)規(guī)劃方法進(jìn)行樣本間的時(shí)間漂移校正,隨后根據(jù)自適應(yīng)網(wǎng)絡(luò)鏈接法對(duì)樣本間的物質(zhì)進(jìn)行注冊(cè),最后采用統(tǒng)計(jì)分析篩選出植物樣本間的差異性代謝產(chǎn)物。
附圖說(shuō)明
圖1:本發(fā)明進(jìn)行樣本間時(shí)間漂移校正示例。(A)測(cè)樣的色譜峰‘2’逐一對(duì)齊到不同參比峰的示例。(B)測(cè)樣中每一個(gè)色譜峰對(duì)應(yīng)于每一個(gè)參比峰的色譜相似度。‘2’對(duì)齊到不同參比色譜峰后的所得相似度用不同背景顏色標(biāo)出。箭頭標(biāo)記出動(dòng)態(tài)規(guī)劃算法獲得的路徑(剪頭所指路徑上每一個(gè)點(diǎn)表示匹配到的色譜峰)。(C)時(shí)間漂移校正前和校正后的色譜信號(hào)。虛線表示校正前的色譜。經(jīng)過(guò)校正后,測(cè)樣信號(hào)與參比信號(hào)中,色譜峰出現(xiàn)的位置相同。
圖2:利用自適應(yīng)網(wǎng)絡(luò)鏈接進(jìn)行色譜峰注冊(cè)示例圖。(A)原始色譜信號(hào),存在時(shí)間漂移。(B)經(jīng)過(guò)時(shí)間漂移校正后,色譜峰的位置。(C)-(D)本發(fā)明自適應(yīng)網(wǎng)絡(luò)鏈接結(jié)果示例,其中(C)表示優(yōu)化過(guò)程中的一個(gè)暫時(shí)性鏈接結(jié)果,其中數(shù)個(gè)色譜峰未鏈接到一起,(D)展示了最終獲得的鏈接結(jié)果。圖(E)給出了最終注冊(cè)的13個(gè)色譜峰,對(duì)應(yīng)于圖(D)中的13條鏈接線。
圖3:本發(fā)明同經(jīng)典的XCMS方法進(jìn)行對(duì)比結(jié)果。上圖:利用XCMS解析不同組別的樣本間差異性代謝物進(jìn)行聚類分析,所得結(jié)果。下圖:利用本發(fā)明解析植物樣本后,篩選出來(lái)的差異性代謝物(p<0.05)進(jìn)行聚類分析所得結(jié)果,不同組別之間的樣本能夠獲得較好聚類。樣本有含有字母g13、g14和g15分別表示了三個(gè)不同的組別。
圖4:本發(fā)明給出的色譜峰提取示例以及同經(jīng)典方法的對(duì)比。左側(cè)一列(A)-(D)為本發(fā)明進(jìn)行色譜分提取原理示意圖。右側(cè)一列(E)-(H)是經(jīng)典基于墨西哥帽小波函數(shù)峰提取方法(MassSpecWavelet)示意圖。(A)原始色譜信號(hào)。圖中標(biāo)注了人為判斷出來(lái)的5個(gè)色譜峰。圖(B)不同尺度高斯平滑卷積運(yùn)算進(jìn)行色譜信號(hào)平滑后的色譜信號(hào)。(C)標(biāo)記出不同平滑尺度下的局部極大值位置,以及通過(guò)脊線尋優(yōu)確定22條脊線(每一個(gè)脊線對(duì)應(yīng)一個(gè)潛在的色譜峰)。(D)剔除色譜信號(hào)與儀器噪聲之比小于3的色譜峰后,本發(fā)明最終確定的5個(gè)有效色譜峰。(E)不同尺度墨西哥小帽小波函數(shù)中的系數(shù)。(F)不同尺度小波函數(shù)下的小波脊線。(G)經(jīng)典MassSpecWavelet方法篩選出來(lái)的潛在的色譜峰。(H)MassSpecWavelet最終提取出來(lái)的色譜峰。
具體實(shí)施方式
結(jié)合本發(fā)明的附圖,對(duì)發(fā)明實(shí)施例的技術(shù)方案做進(jìn)一步的詳細(xì)闡述。
樣本為同一植物物種,但不同年份的三個(gè)組別。分別將所有樣本經(jīng)過(guò)如下處理:
基于UPLC-QTOF的植物差異性代謝物快速篩選方法,包括以下步驟:
S1:樣品的制備過(guò)程:將新鮮收集的茶葉樣本放入液氮中速凍,在液氮條件下將樣品研磨粉碎,將20mg粉碎的樣品中加入2ml提取液,提取液包括3體積份的乙腈、3體積份的異丙醇和2體積份的水,渦旋2分鐘后,室溫超聲處理60分鐘,然后12000r/min離心5min,且取1ml上清液轉(zhuǎn)移至色譜瓶中,待UPLC-QTOF分析。
S2:UPLC-QTOF分析:
進(jìn)行UPLC-QTOF分析的色譜條件為:色譜柱為Agilent C18柱,色譜柱的長(zhǎng)度為100mm,色譜柱的直徑為4.6mm,色譜柱的粒徑為1.7μm,柱溫為35℃;流動(dòng)相A為0.1%甲酸水溶液,流動(dòng)相B為0.1%甲酸乙腈溶液,色譜分析時(shí),流動(dòng)相梯度為,初始時(shí)流動(dòng)相A占流動(dòng)相總體積的95%,流動(dòng)相B占流動(dòng)相總體積的5%,接下來(lái)的20min內(nèi)流動(dòng)相A占流動(dòng)相總體積的份數(shù)降至5%,流動(dòng)相B占流動(dòng)相總體積的份數(shù)升至95%;
進(jìn)行UPLC-QTOF分析的質(zhì)譜條件為:干燥氣溫度為350℃;干燥氣流速為12L/min;噴霧氣壓力為40psi;保護(hù)氣溫度為350℃;保護(hù)氣流速為10L/min;電離電壓為3500V;質(zhì)譜掃描范圍為50–1500;正離子模式。
S3:獲得低分辨質(zhì)譜數(shù)據(jù):將原始數(shù)據(jù)轉(zhuǎn)化為mzData格式。進(jìn)入MATLAB環(huán)境進(jìn)行分析。將UPLC-QTOF中得到的高分辨質(zhì)譜數(shù)據(jù)轉(zhuǎn)化為精度為1Da步長(zhǎng)的低分辨質(zhì)譜數(shù)據(jù);即每一個(gè)樣本獲得一個(gè)Time×m/z的色譜信號(hào)矩陣,一個(gè)m/z下收集一個(gè)色譜信號(hào)。
S4:一個(gè)m/z下色譜信號(hào)中基線的校正:將一個(gè)m/z色譜信號(hào)中的局部極小值設(shè)定為該m/z色譜信號(hào)的初始背景噪聲的極小值,使用迭代優(yōu)化算法剔除該初始背景噪聲中屬于色譜信號(hào)中色譜峰的部分,且迭代收斂標(biāo)準(zhǔn)為10-6,得到該色譜信號(hào)真正的背景噪聲的極小值,根據(jù)該色譜信號(hào)真正的背景噪聲的極小值在色譜信號(hào)中的原始位置,利用線性插值估算出基線漂移,扣除基線漂移后,獲得一個(gè)m/z下基線校正后色譜信號(hào)。
S5:每個(gè)樣本中所有m/z下色譜信號(hào)基線校正:將每一個(gè)m/z下的色譜信號(hào)都做上述一個(gè)m/z色譜信號(hào)中基線的校正的處理,得到基線校正后的m/z色譜信號(hào)。
S6:色譜信號(hào)中有效色譜峰的提?。菏褂貌煌叨雀咚蛊交矸e運(yùn)算進(jìn)行色譜信號(hào)平滑,所使用高斯函數(shù)標(biāo)準(zhǔn)偏差范圍是1~13,且步長(zhǎng)0.1,提取每一次平滑后色譜信號(hào)中所有的局部極大值,且將所有的局部極大值的位置標(biāo)記,通過(guò)脊線尋優(yōu)的方法,分別獲得每個(gè)色譜峰在色譜信號(hào)中的原始位置,接著使用色譜信號(hào)中非色譜峰部分的儀器噪聲波動(dòng),計(jì)算出儀器噪聲水平,剔除色譜信號(hào)與儀器噪聲之比小于3的色譜峰,剩下的色譜峰為能夠準(zhǔn)確定量的有效色譜峰,即完成色譜信號(hào)中有效色譜峰的提取。
S7:一個(gè)色譜峰的高精度質(zhì)譜表征:根據(jù)一個(gè)有效色譜峰所位于的低分辨色譜信號(hào)的m/z值,查找高分辨率質(zhì)譜信號(hào)中在該m/z±0.5Da范圍內(nèi)的最大的離子,并使用該離子的高精度質(zhì)譜值標(biāo)記該有效色譜峰,從而獲得一個(gè)色譜峰的高精度質(zhì)譜值。
S8:所有色譜峰的高精度質(zhì)譜表征:將每一個(gè)有效色譜峰均使用上述一個(gè)色譜峰的高精度質(zhì)譜表征的方法處理,最終得到所有色譜峰的高精度質(zhì)譜表征。
S9:離子碎片的聚類:一個(gè)分子質(zhì)量為M的物質(zhì)在正離子模式下會(huì)產(chǎn)生[M+H]+、[M+2H]+、[M+3H]+、[M+H-H2O]+、[M+H-2H2O]+、[M+NH3]+、[M+Na]+、[M-H+Na]+、[M+H+Na]+、[M-H+2Na]+、[M+H+2Na]+或[M+K]+中的至少一個(gè)碎片離子峰,將得到的所有色譜峰的高精度質(zhì)譜表征中時(shí)間窗口為0.05min,質(zhì)譜精度設(shè)置為100ppm中屬于同一物質(zhì)的分子離子峰和碎片離子峰進(jìn)行聚類。
S10:時(shí)間漂移校正:每一個(gè)樣本分別得到一個(gè)該樣本所有色譜峰的高精度質(zhì)譜表征,選擇一個(gè)樣本作為參比,利用動(dòng)態(tài)規(guī)劃算法進(jìn)行其它樣本相對(duì)參比的時(shí)間漂移校正,即對(duì)于其它樣本的每一個(gè)色譜峰,都根據(jù)其保留時(shí)間和質(zhì)譜精度與參比相比較進(jìn)行校正,時(shí)間漂移的閾值設(shè)定為2min,質(zhì)譜精度誤差設(shè)定100ppm,使得不同樣本中對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰保留時(shí)間較為接近。
接著使用自適應(yīng)網(wǎng)絡(luò)鏈接算法對(duì)不同樣本間對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰進(jìn)行注冊(cè),具體步驟為:
S10A:尋找侯選峰:選擇一個(gè)當(dāng)前色譜峰,將其他樣本中與選擇的當(dāng)前色譜峰不在同一個(gè)鏈接線上,且距離最近的色譜峰定義為侯選峰;
S10B:鏈接兩個(gè)峰:若其他樣本中與侯選峰不在同一個(gè)鏈接線上,且距離最近的色譜峰是當(dāng)前色譜峰,則鏈接兩個(gè)峰,即將當(dāng)前色譜峰和侯選峰可視作不同樣本中對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰;若其他樣本中與侯選峰不在同一個(gè)鏈接線上,且距離最近的色譜峰不是當(dāng)前色譜峰,則不鏈接兩個(gè)峰;鏈接的過(guò)程引入一個(gè)約束,即一個(gè)樣本不能出現(xiàn)兩個(gè)色譜峰對(duì)應(yīng)同一個(gè)物質(zhì),且屬于同一個(gè)物質(zhì)的質(zhì)譜精度誤差為100ppm;
S10C:重復(fù)操作:重復(fù)尋找侯選峰至鏈接兩個(gè)峰步驟,直到鏈接線無(wú)法更新時(shí),停止重復(fù)。
最終使得不同樣本中屬于同一個(gè)物質(zhì)的色譜峰對(duì)齊。
S11:方差分析建模:接著利用方差分析分析所有樣本中屬于同一個(gè)物質(zhì)的色譜峰,篩選不同樣本之間具有差異性的指標(biāo),利用PLS-DA模型計(jì)算各自在建模過(guò)程中的VIP值,最終選擇VIP大于1,且置信水平小于0.05的變量作為潛在的能夠表征樣本間差異的差異性代謝物。
時(shí)間漂移校正的步驟如附圖1所示,本發(fā)明進(jìn)行樣本間時(shí)間漂移校正示例。(A)測(cè)樣的色譜峰‘2’逐一對(duì)齊到不同參比峰的示例。(B)測(cè)樣中每一個(gè)色譜峰對(duì)應(yīng)于每一個(gè)參比峰的色譜相似度。‘2’對(duì)齊到不同參比色譜峰后的所得相似度用不同背景顏色標(biāo)出。箭頭標(biāo)記出動(dòng)態(tài)規(guī)劃算法獲得的路徑(剪頭所指路徑上每一個(gè)點(diǎn)表示匹配到的色譜峰)。(C)時(shí)間漂移校正前和校正后的色譜信號(hào)。虛線表示校正前的色譜。經(jīng)過(guò)校正后,測(cè)樣信號(hào)與參比信號(hào)中,不同樣本中屬于同一個(gè)物質(zhì)的色譜峰出現(xiàn)的位置相同。
其中使用自適應(yīng)網(wǎng)絡(luò)鏈接算法對(duì)不同樣本間對(duì)應(yīng)于同一個(gè)物質(zhì)的色譜峰進(jìn)行注冊(cè)的步驟如附圖2所示,利用自適應(yīng)網(wǎng)絡(luò)鏈接進(jìn)行色譜峰注冊(cè)示例圖。(A)原始色譜信號(hào),存在時(shí)間漂移。(B)經(jīng)過(guò)時(shí)間漂移校正后,色譜峰的位置。(C)-(D)本發(fā)明自適應(yīng)網(wǎng)絡(luò)鏈接結(jié)果示例,其中(C)表示優(yōu)化過(guò)程中的一個(gè)暫時(shí)性鏈接結(jié)果,其中數(shù)個(gè)色譜峰未鏈接到一起,(D)展示了最終獲得的鏈接結(jié)果。圖(E)給出了最終注冊(cè)的13個(gè)色譜峰,對(duì)應(yīng)于圖(D)中的13條鏈接線。結(jié)果表明所有的色譜峰能夠得到較好的注冊(cè)。
利用校正后的色譜峰注冊(cè)表。進(jìn)行多元統(tǒng)計(jì)分析,獲得具有差異性的代謝物質(zhì)。如附圖3所示,本發(fā)明同經(jīng)典的XCMS方法進(jìn)行對(duì)比結(jié)果。上圖:利用XCMS解析不同組別的樣本間差異性代謝物進(jìn)行聚類分析,所得結(jié)果。下圖:利用本發(fā)明解析植物樣本后,篩選出來(lái)的差異性代謝物(p<0.05)進(jìn)行聚類分析所得結(jié)果,不同組別之間的樣本能夠獲得較好聚類。樣本有含有字母g13、g14和g15分別表示了三個(gè)不同的組別??梢钥闯鍪褂肵CMS解析不同組別的樣本,沒(méi)有將不同來(lái)源的三組樣本分離開,結(jié)果較為混亂,而本法的方法可以將不同來(lái)源的三組樣本完全分離來(lái),結(jié)果令人十分滿意。
如附圖4所示,本發(fā)明給出的色譜峰提取示例以及同經(jīng)典方法的對(duì)比。左側(cè)一列(A)-(D)為本發(fā)明進(jìn)行色譜分提取原理示意圖。右側(cè)一列(E)-(H)是經(jīng)典基于墨西哥帽小波函數(shù)峰提取方法(MassSpecWavelet)示意圖。(A)原始色譜信號(hào)。圖中標(biāo)注了人為判斷出來(lái)的5個(gè)色譜峰。圖(B)不同尺度高斯平滑卷積運(yùn)算進(jìn)行色譜信號(hào)平滑后的色譜信號(hào)。(C)標(biāo)記出不同平滑尺度下的局部極大值位置,以及通過(guò)脊線尋優(yōu)確定22條脊線(每一個(gè)脊線對(duì)應(yīng)一個(gè)潛在的色譜峰)。(D)剔除色譜信號(hào)與儀器噪聲之比小于3的色譜峰后,本發(fā)明最終確定的5個(gè)有效色譜峰。(E)不同尺度墨西哥小帽小波函數(shù)中的系數(shù)。(F)不同尺度小波函數(shù)下的小波脊線。(G)經(jīng)典MassSpecWavelet方法篩選出來(lái)的潛在的色譜峰。(H)MassSpecWavelet最終提取出來(lái)的色譜峰??梢悦黠@看出,使用分發(fā)明的方法得到的色譜峰更接近實(shí)際情況,而常用的基于墨西哥帽小波函數(shù)峰提取方法得到的色譜峰明顯少于實(shí)際情況,也就是會(huì)有很多有用數(shù)據(jù)被剔除了。
綜上所述,可以看出來(lái)本發(fā)明方法分析得到結(jié)果優(yōu)于現(xiàn)在經(jīng)常用的XCMS方法的分析結(jié)果,可以輕易的將同一植物物種,但來(lái)源的三個(gè)組別區(qū)分開,即可以篩選出組間差異性代謝物,使用效果顯著優(yōu)于現(xiàn)有技術(shù)。