分光測量儀拍攝被檢測體的處理(步驟S310)。步驟S310 的拍攝能夠與步驟2相同地進行,其結果,得到被檢測體的吸光度光譜Xp。為了抑制誤差, 優(yōu)選地,在校準處理中所使用的分光測量儀是與在校準曲線的創(chuàng)建中使用的分光測量儀是 同一機型。為了進一步抑制誤差,更優(yōu)選為同一個機器。此外,與圖5的步驟2-樣,代替用 分光器測量分光反射率光譜和/或吸光度光譜,也可以根據其他測量值估計這些光譜。在 一次拍攝一個被檢測體時得到的被檢測體的吸光度光譜Xp如下面的公式所示地用向量表 不。
[0186] 公式 17
[0187] - C17}
[0188] 在步驟S130的處理中,CPU10作為圖13的被檢測體觀測數據取得部510而發(fā)揮 作用。接著,CPU10從硬盤驅動器30 (圖13的非易失性存儲裝置550)取得校準用數據集 DS2,并存儲于存儲器20中(步驟S320)。在步驟S320的處理中,CPU10作為圖13的校準 用數據取得部520而發(fā)揮作用。
[0189] 在執(zhí)行了步驟S320之后,對由步驟S310得到的被檢測體觀測數據(吸光度光譜 Xp)執(zhí)行預處理(步驟S330)。作為該預處理,優(yōu)選執(zhí)行與在校準曲線的創(chuàng)建時在圖5的步 驟4(更具體而言圖10的步驟S110)中使用的預處理(即第一預處理部450的標準化處理 和第二預處理部460的白化處理)相同的處理。
[0190] 其后,CPU10根據在校準用數據集DS2中包含的獨立成分與由步驟S330得到的預 處理后的光譜(已預處理過的觀測數據)的內積值P (步驟S340)。步驟S340的處理相當 于上述的圖2的(B)、圖2的(C)的處理。此外,該內積值P相當于在校準曲線的創(chuàng)建時由 圖10的步驟S130計算的混合系數。因此,將內積值P也稱為"混合系數"。
[0191] 在步驟S330、S340的處理中,CPU10作為圖13的混合系數計算部530而發(fā)揮作用。
[0192] 接著,CPU10通過從硬盤驅動器30 (圖13的非易失性存儲裝置550)中讀取校準 用數據集DS2中所包含的回歸公式常數u、v,并將該常數u、v和由步驟S340得到的內積值 P代入到上述的公式(16)的右邊,從而求出目標成分的含量C(步驟S350)。此時,可以根 據需要而調整常數u、v。含量C求出為例如被檢測體的每單位體積或每單位質量(例如每 IdL或每100克)的目標成分質量。在步驟S350的處理中,CPU10作為圖13的目標成分量 計算部540而發(fā)揮作用。其后,進入到"返回"而結束該目標成分校準處理。
[0193] 此外,在本實施方式中,雖然將通過步驟S350求出的含量C作為被檢測體的目標 成分的含量,但代替它,也可以用在步驟S330的標準化中使用的標準化系數修正通過步驟 S350求出的含量C,并將該修正后的值作為應該求出的含量。具體而言,可以通過將標準偏 差與含量C相乘,求出含量的絕對值(克)。根據該結構,可以根據目標成分的種類不同,將 含量C設置得精度更高。
[0194] 根據以上的校準方法,能夠根據作為被檢測體的實測值的一個光譜高精度地求出 目標成分的含量。
[0195] E.各種算法及其影響
[0196] 下面,對圖8中示出的第一預處理部450、第二預處理部460以及獨立成分分析處 理部470中所利用的各種算法依次進行說明。
[0197] E - 1.第一預處理(利用了 SNV/PNS的標準化處理):
[0198] 作為第一預處理部450所執(zhí)行的第一預處理,可以利用SNV (標準正態(tài)變量變換) 和PNS(零空間投影法)。
[0199] SNV由下面的公式得出:
[0200] 公式 18
[0201]
[0202] 在此,z為處理后的數據、X為處理對象數據(在本實施方式中吸光度光譜)、xaTC 為處理對象數據X的平均值、σ為處理對象數據X的標準偏差。標準正態(tài)變量變換的結果 得到平均值為〇、標準偏差為1的已被標準化的數據ζ。
[0203] 如果進行PNS,則就能減少處理對象數據中所含有的基線波動。在處理對象數據 (在本實施方式中吸光度光譜)的測量中,由于各種各樣的原因,產生每個測量數據都在數 據的平均值上進行擺動等的稱為基線波動的數據間偏差。因此,優(yōu)選在進行ICA(獨立成分 分析)之前消除該波動的主要原因。PNS可以作為能夠減少處理對象數據的基線波動的預 處理而使用。尤其是對于包括紅外區(qū)域的吸收光光譜或反射光光譜的測量數據,由于這種 基線波動多,因而適用PNS的優(yōu)點大。下面,對通過PNS消除由測量得到的數據(也僅稱作 "測量數據")中所含有的基線波動的原理進行說明。另外,作為代表性的例子,對測量數據 為包括紅外區(qū)域的吸收光光譜或反射光光譜的情況進行說明。但是,對其他種類的測量數 據(例如聲音數據等)也可以同樣地適用PNS。
[0204] -般而言,在理想體系中,測量數據X (處理對象數據X)使用m個(m為2以上的 整數)獨立成分&(1 = 1~m)和各自的混合比例(^而由下面的公式表示。
[0205] 公式 19
[0206]
[0207] 在此,A為由混合比例Cl形成的矩陣(混合矩陣)。
[0208] 在ICA(獨立成分分析)中,也以該模型為前提而執(zhí)行處理。但是,在實際的測量 數據中存在有各種各樣的波動因素(樣品狀態(tài)和測量環(huán)境的變化等)。因此,作為考慮了那 些因素的模型,考慮通過下面的公式來表達測量數據X的模型。
[0209] 公式 20
[0210]
[0211] 在此,b是表示光譜的振幅方向的波動量的參數、a是表示常數基線波動E (也稱 為"平均值波動")的量的參數、lV"bg是表示依賴于波長的g個(g為1以上的整數)的波 動A ( λ )~fg( λ )的量的參數、ε是其他波動成分。另外,常數基線波動E由E = {1,1, 1,…1}τ(右上標的Τ表示倒置)給出,是其數據長度與測量數據X的數據長度Ν(波長區(qū) 域的段數)相等的常數向量。作為表示波長的變量λ,使用1至Ν的Ν個整數。即,該變 量λ相當于測量數據X的數據長度Ν(Ν為2以上的整數)的序數。此時,依賴于波長的波 動 AQ)~fg(x)由 fjx)=出⑴,:^⑵,……,fg(A) = {fg(l),fj2),… fg (N)}τ給出。這些波動成為ICA和校準中的誤差主要原因,因此優(yōu)選事前消除。
[0212] 作為函數f( λ),優(yōu)選使用函數f( λ)的值在λ的值為1至N的范圍內隨λ的增 加而單調地增加的單變量函數。在零空間投影法中,通過使用指數α為整數的λ的取冪 函數λ °以外的其他函數,從而能夠更加地減少測量數據中所含有的波動。
[0213] 作為決定優(yōu)選的函數f( λ)的函數類型及其個數g的方法,可以采用實驗性的試 錯法(卜74 7 >卜''工7 -),或者可以使用現有的參數估計算法(例如EM(期望值最大化 法)算法)。
[0214] 在PNS中,考慮由上述的各個基線波動成分Ε,?^λ)~fg(A)組成的空間,通過 將測量數據X投影到未含有那些波動成分的空間(零空間)中,從而能夠得到減少了基線 波動成分Ε,?\(λ)~fgU)的數據。作為具體的運算,PNS處理后的數據z用下面的公 式計算:
[0215] 公式 21
[0216]
[0217] P = {1,( λ ),f2( λ )…fK( λ )}
[0218] 在此,P+是P的偽逆矩陣。k 1是將公式(20)的構成成分s i投影到不含有波動成 分的零空間后的量。另外,ε*是將公式(20)的波動成分ε投影到零空間后的量。
[0219] 此外,如果在PNS的處理后進行標準化(例如SNV),則就也能夠消除式(20)中的 光譜的振幅方向的波動量b的影響。
[0220] 如果對進行了這種PNS預處理的數據進行ICA,則所得到的獨立成分成為公式 (21)的成分1^的估計值,成為與真正的構成成分\不同的值。但是,由于混合比例(^沒有 從原來的公式(20)中的值變化,因此對使用了混合比例 Cl的校準處理(圖2、圖14)沒有影 響。這樣,如果執(zhí)行PNS作為ICA的預處理,則就不能夠通過ICA得到真正的構成成分 Sl, 因此通常不可能產生將PNS適用于ICA的預處理這樣的想法。相反,在本實施方式中,由于 即使進行PNS作為ICA的預處理也不影響校準處理,因此如果執(zhí)行PNS作為預處理,則就能 更高精度地進行校準。
[0221] 此外,有關 PNS 的細節(jié),例如在 Zeng-Ping Chen, Julian Morris, and Elaine Martin,"Extracting Chemical Information from Spectral Data with Multiplicative Light Scattering Effects by Optical Path-Length Estimation and Correction',, 2006 中已進行說明。
[0222] E - 2.第二預處理(利用了 PCA/FA的白化處理):
[0223] 作為第二預處理部460所執(zhí)行的第二預處理,能利用PCA (主成分分析)和FA (因 子分析)。
[0224] 在一般的ICA方法中,作為預處理,進行處理對象數據的維數壓縮和去相關化。 由于通過該預處理而使應該利用ICA求出的變換矩陣限定為正交變換矩陣,因此能夠削 減ICA的計算量。將這種預處理稱為"白化",在大多數情況下采用PCA。有關采用了 PCA 的白化,例如在 Aapo Hyvarinen, Juha Karhumen, Erkki Oja, ''Independent Comonent Analysis' 2001,John Wiley &Sons, Inc.("獨立成分分析",2005年2月,東京電氣大學出 版部發(fā)行)的第6章中已有詳述。
[0225] 然而,在PCA中,在處理對象數據中含有隨機噪聲的情況下,有時受到該隨機噪聲 的影響而在處理結果上產生誤差。因此,為了減少隨機噪聲的影響,優(yōu)選采用具有對噪聲的 魯棒性的FA(因子分析)來代替PCA進行白化。在以下,說明基于FA的白化的原理。
[0226] 如上所述,一般而言,在ICA中,假設將處理對象數據X表示為構成成分Sl的線性 和的線性混合模型(上述公式(19)),求出混合比 Cl和構成成分Sl。但是,在實際的數據 中,大多都附加有構成成分81以外的隨機噪聲。因此,作為考慮了隨機噪聲的模型,考慮通 過下面的公式來表達測量數據X的模型。
[0227] 公式 22
[0228] X = A · s+ P ...(22)
[0229] 在此,P為隨機噪聲。
[0230] 于是,進行考慮了該噪聲混合模型的白化,其后,能夠進行ICA而得到混合矩陣A 和獨立成分估計。
[0231] 在本實施方式的FA中,假設獨立成分Si和隨機噪聲P分別符合正態(tài)分布N(0, Im),N(0, Σ)。此外,正如普遍所知的,正態(tài)分布N(xl,x2)的第一參數xl表示期望值,第 二參數x2表示標準偏差。此時,由于處理對象數據X成為符合正態(tài)分布的變量的線性和, 因此處理對象數據X也仍然符合正態(tài)分布。在此,如果將處理對象數據X的協方差矩陣設 為V[x],則處理對象數據X所符合的正態(tài)分布能夠表達為N(0, V[x])。此時,能夠按下述的 程序計算有關處理對象數據X的協方差矩陣V[x]的似然函數。
[0232] 首先,如果假設獨立成分81彼此正交,則處理對象數