1.一種通用的大規(guī)模代謝組學(xué)數(shù)據(jù)的校正方法,其特征在于:
首先從所有待測樣品中取出相同質(zhì)量,混合后建立質(zhì)控(QC)樣品,計(jì)算相鄰兩個(gè)QC樣本中代謝物響應(yīng)強(qiáng)度的比值,建立模型篩選隨機(jī)誤差,然后利用線性擬合模型對隨機(jī)誤差進(jìn)行校正;最后利用線性回歸模型構(gòu)建虛擬QC方法,實(shí)現(xiàn)大規(guī)模代謝組數(shù)據(jù)集的系統(tǒng)誤差校正。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:利用代謝物在兩個(gè)相鄰QC樣本中響應(yīng)強(qiáng)度的比值,構(gòu)建模型去篩選代謝組數(shù)據(jù)的隨機(jī)誤差,具體步驟如下,
1)QC樣本的制作:分別從所有將進(jìn)行代謝組學(xué)分析的樣本中準(zhǔn)確稱量或移取等量樣本并均勻混合成一個(gè)大的樣本,即QC樣本;
2)代謝組學(xué)數(shù)據(jù)的獲取:每分析5-20個(gè)待測樣本插入一個(gè)QC樣本,QC樣本和待測樣本按照完全相同條件進(jìn)行樣本預(yù)處理和基于色譜-質(zhì)譜方法的代謝組學(xué)分析;
3)相鄰兩個(gè)QC樣品中代謝組數(shù)據(jù)比值的獲?。河?jì)算同一個(gè)代謝物在相鄰兩個(gè)QC樣品中的響應(yīng)強(qiáng)度的比值;
4)構(gòu)建模型篩選隨機(jī)誤差:將相鄰兩個(gè)QC樣品中代謝物的比值從小到大排序后,篩選總比值個(gè)數(shù)的5%作為離散點(diǎn),將這5%的離散點(diǎn)平均分配到排序后比值的兩端,從而篩選出隨機(jī)誤差。
3.按照權(quán)利要求1所述的方法,其特征在于:利用兩個(gè)相鄰QC樣品中的正常比值進(jìn)行線性擬合模型,校正隨機(jī)誤差;具體過程為:
1)兩個(gè)相鄰QC樣品中正常比值的獲?。汉Y選到隨機(jī)誤差后,去除含有隨機(jī)誤差的代謝特征,計(jì)算剩余不含有隨機(jī)誤差的正常代謝特征在相鄰兩個(gè)QC樣品中的比值;
2)線性擬合模型的構(gòu)建:將正常代謝特征在兩個(gè)相鄰QC樣本中的比值,進(jìn)行從小到大排序,并進(jìn)行線性擬合,獲得線性擬合模型的公式,將含有隨機(jī)誤差的代謝特征j帶入線性擬合模型的公式中,獲得校正因子其中AQCnj和AQC'(n-1)j分別代表特征j在QCn中未校正的響應(yīng)值和在QC(n-1)中校正后的響應(yīng)值,n表示第n個(gè)樣本,n為大于等于的正整數(shù);
3)校正隨機(jī)誤差:某一含有隨機(jī)誤差的代謝物j在QCn中響應(yīng)值為AQnj,其校正后的響應(yīng)值A(chǔ)QC'nj可以通過如下公式獲得;
4.根據(jù)權(quán)利要求1按照權(quán)利要求1所述的方法,其特征在于:利用所建立的篩選和校正代謝組學(xué)數(shù)據(jù)隨機(jī)誤差的方法對所有的QC樣本進(jìn)行隨機(jī)誤差的篩選和校正。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于:利用線性回歸模型構(gòu)建虛擬QC方法,實(shí)現(xiàn)大規(guī)模代謝組數(shù)據(jù)集的系統(tǒng)誤差校正;具體過程為:
1)線性回歸模型的構(gòu)建:應(yīng)用每個(gè)代謝特征在相鄰兩個(gè)QC樣品中的響應(yīng)強(qiáng)度值,構(gòu)建代謝特征的線性回歸模型;
2)虛擬QC方法的建立:根據(jù)兩個(gè)相鄰QC樣本間,實(shí)際分析的樣本的個(gè)數(shù),將上述所構(gòu)建的某一代謝特征j的線性回歸模型進(jìn)行均等分,每個(gè)實(shí)際樣品i均獲得一個(gè)虛擬的QC樣品,其響應(yīng)值A(chǔ)QCv_ij的計(jì)算公式如下:
式中,a和b代表線性回歸模型的斜率和節(jié)距,i代表實(shí)際樣品在線性回歸模型中的位置;
3)系統(tǒng)誤差校正:利用上述所得到的實(shí)際樣品i中代謝特征j的虛擬QC的響應(yīng)值A(chǔ)QCv_ij,對其實(shí)測響應(yīng)強(qiáng)度Axij進(jìn)行系統(tǒng)誤差的校正,校正后的響應(yīng)值A(chǔ)x'ij,可以通過如下公式獲得:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于:將進(jìn)行代謝組學(xué)分析的樣本個(gè)數(shù)為5個(gè)以上。