本發(fā)明涉及模型匹配技術(shù),尤其涉及一種基于大數(shù)據(jù)挖掘技術(shù)的模型匹配方法。
背景技術(shù):
技術(shù)詞解釋:
近紅外光:近紅外光(nir)是介于紫外-可見光(uv-vis)和中紅外(mir)之間的電磁波,其波長范圍為700~2500nm;近紅外光譜能反映含氫基團x—h(如c—h、n—h、o—h等)振動的倍頻和合頻吸收,不同基團(如甲基、亞甲基、苯環(huán)等)或同一基團在不同化學(xué)環(huán)境中的近紅外吸收波長與強度都有明顯差別,因此,近紅外光譜非常適用于含氫有機物質(zhì)的物化參數(shù)測量。
臺間差問題:由于制造工藝(同一批儀器,或不同批的儀器,由于制造工藝的細微差別而導(dǎo)致的臺間差)、環(huán)境(儀器受當(dāng)前環(huán)境影響,如溫度、濕度等,導(dǎo)致對同一樣本獲得不同的結(jié)果)、儀器損耗(由于使用年限及儀器本身的使用損耗,導(dǎo)致不同儀器之間存在臺間差)等問題,使得同一批次的產(chǎn)品,對同個樣本所測量的數(shù)據(jù)存在差異,從而導(dǎo)致一臺儀器建立的分析模型無法直接在其他儀器上使用。
模型傳遞方:將建立了分析模型的儀器做為主機,將需要使用這個分析模型的儀器做為從機,分別使用主從機掃描同種樣品或標(biāo)準(zhǔn)品并建立校正模型,從機可通過校正模型校正檢測光譜后使用主機的分析模型或直接使用主機的分析模型后對預(yù)測結(jié)果進行校正。
基于現(xiàn)代化學(xué)計量學(xué)方法,近紅外光譜既可以用于定量分析,也可以用于定性分析。而對于定量分析與定性分析中的化學(xué)計量學(xué)方法,其主要包括以下幾個方面:1、光譜預(yù)處理和變量選擇;2、建立用于預(yù)測未知樣品性質(zhì)或組成的分析模型;3、模式識別方法和模型界外點檢測方法;4、模型傳遞方法。目前,由于使用該技術(shù)的組織或個人大多僅使用單臺或少量近紅外光譜儀進行分析模型的建立,因此臺間差問題通常會采用現(xiàn)代化學(xué)計量學(xué)中的模型傳遞方法來解決。
目前用于解決臺間差問題的模型傳遞方法,其主要包括有兩種,一是提高校正模型的穩(wěn)健性,二則是增強校正模型的適應(yīng)性。前一種方法主要通過變量的篩選、微分、正交信號校正等預(yù)處理方法,和在不同環(huán)境測量條件下擴充校正模型以及采用穩(wěn)健回歸等方式過濾光譜中的噪聲信息,融合多個局部模型,提高模型抗噪聲的能力,以達到校正模型較高的可靠性,魯棒性的目的。后一種方法則是通過數(shù)學(xué)方法建立從機和主機所測光譜、模型參數(shù)、或預(yù)測結(jié)果之間的函數(shù)關(guān)系,由此實現(xiàn)模型傳遞。由于前一種方式只是一些常見的數(shù)據(jù)與處理的方式,不能達到較高的準(zhǔn)確性,因此通常主要是采用后一種方法,如經(jīng)典的shenk’s算法,來解決臺間差問題的。但是,對于目前常用的模型傳遞方法,其仍存在不少的缺點,例如:1、校正計算量過多,無法實現(xiàn)大量模型的轉(zhuǎn)移;2、需要大量的校正樣品來支撐模型傳遞;3、缺乏動態(tài)變化,一旦儀器校正后,模型已經(jīng)固定了,而儀器則會隨著時間的消耗使得模型不再準(zhǔn)確,需動態(tài)更新;4、用戶參與度低,用戶與商家的關(guān)系僅限于買賣關(guān)系。因此由此可見,當(dāng)儀器量劇增時,模型傳遞的方法很難實現(xiàn),容易產(chǎn)生計算量過多而無法負荷、所需的校正樣品的數(shù)量過多、對每臺待建模的儀器都需要采集大量的光譜數(shù)據(jù)從而導(dǎo)致工作人員工作量大、動態(tài)性差等問題,其基本無法解決大量儀器之間的臺間差問題,這樣則導(dǎo)致近紅外光譜技術(shù)無法大批量推廣使用。
技術(shù)實現(xiàn)要素:
為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種基于大數(shù)據(jù)的模型匹配方法,可打破近紅外光譜儀器數(shù)量的限制,適用于紅外光譜儀器的大量生產(chǎn)模式,從而有助于近紅外光譜技術(shù)的推廣使用。
本發(fā)明所采用的第一技術(shù)方案是:一種基于大數(shù)據(jù)的模型匹配方法,該方法包括:
獲取新設(shè)備的儀器參數(shù);
將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別;
該新設(shè)備從基礎(chǔ)模型庫中獲得與該找出的儀器類別相對應(yīng)的基礎(chǔ)模型后,利用該獲得的基礎(chǔ)模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
作為第一技術(shù)方案的優(yōu)選實施方式,所述基礎(chǔ)模型庫的建立步驟包括:
對所有出廠的同一儀器類型設(shè)備進行隨機抽樣,并對抽出的設(shè)備進行儀器參數(shù)的采集;
對采集得到的儀器參數(shù)進行聚類分析,從而得到多個數(shù)據(jù)簇,其中,一個數(shù)據(jù)簇表示為一個儀器類別,所述數(shù)據(jù)簇的聚類中心表示為儀器類別所對應(yīng)的第一類別特征;
為每個儀器類別建立相對應(yīng)的基礎(chǔ)模型,所有建立得到的基礎(chǔ)模型構(gòu)成基礎(chǔ)模型庫。
作為第一技術(shù)方案的優(yōu)選實施方式,所述為儀器類別建立相對應(yīng)的基礎(chǔ)模型,其具體步驟包括:
選取屬于同一儀器類別下的設(shè)備進行已知物質(zhì)信息樣品的光譜采集,然后通過化學(xué)計量學(xué)中的建模算法,從而根據(jù)采集得到的光譜數(shù)據(jù)來創(chuàng)建與該儀器類別相對應(yīng)的分析模型。
本發(fā)明所采用的第二技術(shù)方案是:一種基于大數(shù)據(jù)的模型匹配方法,該方法包括:
獲取新設(shè)備的儀器參數(shù);
將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別;
根據(jù)找出的儀器類別,判斷個性化模型庫中是否存有與該儀器類別相對應(yīng)的個性化模型,若有,則從個性化模型庫中找出與該儀器類別相對應(yīng)的個性化模型,然后,將獲得的儀器參數(shù)與找出的個性化模型中所存儲的儀器特征進行匹配比較,從而找出與該新設(shè)備最匹配的個性化模型,然后,利用找出的個性化模型進行物質(zhì)信息的結(jié)果預(yù)測處理;反之,則從基礎(chǔ)模型庫中獲得與該找出的儀器類別相對應(yīng)的基礎(chǔ)模型后,利用該獲得的基礎(chǔ)模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
作為第二技術(shù)方案的優(yōu)選實施方式,所述個性化模型中存儲有模型規(guī)則和儀器特征。
本發(fā)明所采用的第三技術(shù)方案是:一種基于大數(shù)據(jù)的模型匹配方法,該方法包括:
獲取新設(shè)備的儀器參數(shù)以及待測光譜;
將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別;
根據(jù)找出的儀器類別,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而獲得最匹配的分析模型;
利用最匹配的分析模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
作為第三技術(shù)方案的優(yōu)選實施方式,所述根據(jù)找出的儀器類別,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而獲得最匹配的分析模型這一步驟,其具體為:
根據(jù)找出的儀器類別,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而得到與找出的最相似的光譜特征相對應(yīng)的分析模型,然后,將獲得的儀器參數(shù)與得到的分析模型所對應(yīng)的儀器特征進行匹配比較,從而找出與該儀器參數(shù)最匹配的儀器特征,從而獲得最匹配的分析模型。
作為第三技術(shù)方案的優(yōu)選實施方式,所述分析模型所對應(yīng)的光譜特征,其提取步驟包括:
對建模集中的光譜數(shù)據(jù)進行分析,從而提取光譜特征,其中,所述建模集為用于建立分析模型的建模數(shù)據(jù)集。
本發(fā)明所采用的第四技術(shù)方案是:一種基于大數(shù)據(jù)的模型匹配方法,該方法包括:
獲取新設(shè)備的儀器參數(shù)、待測光譜以及對標(biāo)準(zhǔn)品的平均光譜;
將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別;
對獲得的對標(biāo)準(zhǔn)品的平均光譜和該儀器類別所對應(yīng)的第二類別特征進行分析,從而求出校正系數(shù);
利用求出的校正系數(shù)對待測光譜進行校正,從而得到校正后的待測光譜;
根據(jù)找出的儀器類別,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別相對應(yīng)的分析模型,然后將校正后的待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與校正后的待測光譜最相似的光譜特征,從而獲得最匹配的分析模型;
利用最匹配的分析模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
作為第四技術(shù)方案的優(yōu)選實施方式,所述儀器類別所對應(yīng)的第二類別特征,其提取步驟包括:
將屬于同一儀器類別下的設(shè)備進行標(biāo)準(zhǔn)品的光譜采集;
對采集到的對標(biāo)準(zhǔn)品的光譜數(shù)據(jù)進行平均光譜的計算,計算得出的平均光譜作為該儀器類別所對應(yīng)的第二類別特征。
本發(fā)明的有益效果是:通過使用本發(fā)明的模型匹配方法,能為新設(shè)備匹配出最優(yōu)的分析模型,而且還無需大量的樣品、無需進行大量光譜數(shù)據(jù)的采集及計算量,因此,本發(fā)明的方法可解決大量儀器之間的臺間差問題,模型可在大批量的設(shè)備之間傳遞,從而可打破近紅外光譜儀器數(shù)量的限制,適用于紅外光譜儀器的大量生產(chǎn)模式,從而有助于近紅外光譜技術(shù)的推廣使用,而且還具有準(zhǔn)確性高、靈活性高、操作便利性高等優(yōu)點。
附圖說明
圖1是基礎(chǔ)模型庫的建立流程示意圖;
圖2是一種基于基礎(chǔ)模型庫的模型匹配流程示意圖;
圖3是個性化模型的建立流程示意圖;
圖4是一種基于基礎(chǔ)模型庫和個性化模型庫的模型匹配流程示意圖;
圖5是一種基于基礎(chǔ)模型庫、個性化模型庫及光譜特征的模型匹配流程示意圖;
圖6是一種基于基礎(chǔ)模型庫、個性化模型庫、光譜特征及儀器特征的模型匹配流程示意圖;
圖7是對儀器類別所對應(yīng)的第二類別特征的提取步驟流程示意圖;
圖8是一種基于基礎(chǔ)模型庫、個性化模型庫、光譜特征及平均光譜的模型匹配流程示意圖。
具體實施方式
本實施例中的設(shè)備指的是近紅外光譜儀。在基礎(chǔ)模型庫中的分析模型稱為基礎(chǔ)模型,在個性化模型庫中的分析模型稱為個性化模型。
實施例1、基礎(chǔ)模型庫的建立
對于所述的基礎(chǔ)模型庫,其建立步驟包括:
s101、對所有出廠的同一儀器類型設(shè)備進行隨機抽樣,并對抽出的設(shè)備進行儀器參數(shù)的采集,其中,所需采集的儀器參數(shù)包括有光源波長、光源發(fā)光功率、光源驅(qū)動電流、白板反射率、檢測暗電流等;
s102、采用kmeans算法對采集得到的儀器參數(shù)進行聚類分析,從而得到多個數(shù)據(jù)簇,其中,一個數(shù)據(jù)簇表示為一個儀器類別,所述數(shù)據(jù)簇的聚類中心表示為儀器類別所對應(yīng)的第一類別特征;
對于所述步驟s102,其具體包括:
s1021、初始化,設(shè)定k個初始聚類中心的坐標(biāo);
s1022、計算各個數(shù)據(jù)點(一個數(shù)據(jù)點對應(yīng)代表一儀器對象,一儀器對象包括該設(shè)備的儀器參數(shù))與各個聚類中心之間的距離,根據(jù)計算得出的距離,將各個數(shù)據(jù)點相對應(yīng)地劃分至與其自身距離最近的聚類中心所屬的數(shù)據(jù)簇中,從而得到多個數(shù)據(jù)簇,即k個數(shù)據(jù)簇;
s1023、判斷當(dāng)前計算得出的數(shù)據(jù)簇是否符合聚類結(jié)束要求,如判斷當(dāng)前計算得出的數(shù)據(jù)簇的聚類中心是否與前一次計算得出的數(shù)據(jù)簇的聚類中心相等或相差小于一定閾值,若是,則結(jié)束,當(dāng)前得到的多個數(shù)據(jù)簇為所需計算得到的多個數(shù)據(jù)簇;反之,則重新計算每個數(shù)據(jù)簇的聚類中心的坐標(biāo),然后返回執(zhí)行上一步驟s1022;
其中,步驟s1023中所述的聚類中心的坐標(biāo),其計算公式如下所示:
上述cij表示為第i個聚類中心第j維的坐標(biāo),
s103、通過上述步驟s101和s102所實現(xiàn)的儀器種群聚類技術(shù),便能計算得出各個數(shù)據(jù)簇的聚類中心,即各個儀器類別的特征,此時,對于每個儀器類別而言,其又分別對應(yīng)包含一系列與儀器類別的第一特征相近似的設(shè)備,即這一系列的設(shè)備均屬于該儀器類別,此時,則可為每個儀器類別建立相對應(yīng)的基礎(chǔ)模型,而所有建立得到的基礎(chǔ)模型構(gòu)成基礎(chǔ)模型庫;
其中,所述為儀器類別建立相對應(yīng)的基礎(chǔ)模型,其具體步驟包括:
選取屬于同一儀器類別下的全部設(shè)備,或部分設(shè)備進行已知物質(zhì)信息樣品的光譜采集,然后通過化學(xué)計量學(xué)中的建模算法,從而根據(jù)采集得到的光譜數(shù)據(jù)來創(chuàng)建與該儀器類別相對應(yīng)的分析模型,所述創(chuàng)建的分析模型即為所需建立的基礎(chǔ)模型。然后,則將儀器類別所對應(yīng)的第一類別特征、分析模型、分析模型所對應(yīng)的儀器特征、建模集等信息均在云端進行存儲。
在本實施例中,對于上述基礎(chǔ)模型庫的建立,其具體流程如圖1所示(樣品以豆粕、玉米為例,指標(biāo)以水分含量、蛋白含量為例):
首先,對設(shè)備1、設(shè)備2、設(shè)備3、……、設(shè)備n進行儀器參數(shù)的采集;然后采用kmeans算法對采集得到的儀器參數(shù)進行聚類分析,從而得到多個不同的儀器類別,以及儀器類別所對應(yīng)的第一類別特征,如類別a的特征a、類別b的特征b、……、類別k的特征k;接著,選取屬于同一儀器類別下的設(shè)備進行已知物質(zhì)信息樣品的光譜采集;跟著,通過化學(xué)計量學(xué)中的建模算法,從而根據(jù)采集得到的光譜數(shù)據(jù)來創(chuàng)建與該儀器類別相對應(yīng)的分析模型,如類別a的特征a,其所對應(yīng)的分析模型包括有針對玉米水分的分析模型、針對玉米蛋白的分析模型以及針對豆粕蛋白的分析模型。
對于上述基礎(chǔ)模型庫的建立步驟,其適用于以下所有實施例中。
實施例2、一種基于基礎(chǔ)模型庫的模型匹配方法
在檢測階段,針對實施例1建立好的基礎(chǔ)模型庫,在新設(shè)備進行模型匹配時,其方法步驟包括有:
s201、獲取新設(shè)備的儀器參數(shù);
s202、將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別,如類別b;
s203、該新設(shè)備從基礎(chǔ)模型庫中獲得與該找出的儀器類別b相對應(yīng)的基礎(chǔ)模型后,利用該獲得的基礎(chǔ)模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
對于上述的模型匹配方法,其具體流程如圖2所示(樣品以豆粕、玉米為例,指標(biāo)以水分含量、蛋白含量為例):
首先,獲取新設(shè)備的儀器參數(shù),然后,將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別b;接著,該新設(shè)備對玉米和豆粕進行檢測時,分別對玉米和豆粕進行光譜采集,跟著,從基礎(chǔ)模型庫中獲得與該儀器類別b所對應(yīng)的分析模型后,利用該獲得的分析模型,對采集到的光譜信息進行物質(zhì)信息的結(jié)果預(yù)測處理。
實施例3、一種基于基礎(chǔ)模型庫和個性化模型庫的模型匹配方法
在用戶使用設(shè)備的過程中,將會不斷進行分析模型的創(chuàng)建與維護,而目前對于這些新建的分析模型,其無法實現(xiàn)共享,因此,為了實現(xiàn)這些新建的分析模型的共享,打破資源孤島的情況,令其它新設(shè)備能獲取到更精準(zhǔn)的分析模型,本發(fā)明結(jié)合互聯(lián)網(wǎng)的概念,將這些新建的分析模型及相關(guān)數(shù)據(jù)上傳至云端,例如,每有用戶創(chuàng)建或更新分析模型后,系統(tǒng)會自動將用戶愿意共享的新的分析模型及相關(guān)數(shù)據(jù)上傳至云端,并將它們存儲在該用戶所使用設(shè)備的對應(yīng)儀器類別中,如,該用戶所使用的設(shè)備屬于儀器類別a,那么則將該設(shè)備所創(chuàng)建的或更新的分析模型及相關(guān)數(shù)據(jù)上傳至云端,并將它們存儲在儀器類別a中。此時,對于這些在用戶使用設(shè)備的過程而創(chuàng)建或更新的分析模型,其作為個性化模型存儲在云端,并且將所有個性化模型構(gòu)建成個性化模型庫。另外,在個性化模型中,其不僅存儲有模型規(guī)則,還存儲有一系列的儀器特征,以及相對應(yīng)地存儲有光譜信息、算法信息等。
在本實施例中,對于上述個性化模型庫的建立,其具體流程如圖3所示(樣品以豆粕、玉米為例,指標(biāo)以水分含量、蛋白含量、纖維含量為例):
設(shè)備1和設(shè)備2將新建的分析模型、儀器特征以及樣品光譜信息一并上傳至云端,并將它們存儲至相對應(yīng)的儀器類別中,作為個性化模型存在,設(shè)備1針對玉米蛋白所新建的分析模型分別為002和004,設(shè)備2針對豆粕纖維所新建的分析模型為003,而在存儲每一個個性化模型時,所相對應(yīng)存儲的信息包括有模型規(guī)則(其中,所述模型規(guī)則包括有初始化系數(shù)、常數(shù)項、乘積系數(shù)、平均光譜、預(yù)處理算法、回歸算法),以及儀器特征(其中,所述儀器特征包括有波長、驅(qū)動電流、光源溫度、環(huán)境溫度、環(huán)境濕度、檢測器溫度、反射率)以及樣品的光譜信息等。
在檢測階段,針對上述建立好的個性化模型以及實施例1建立好的基礎(chǔ)模型庫,在新設(shè)備進行模型匹配時,其方法步驟包括有:
s301、獲取新設(shè)備的儀器參數(shù);
s302、將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別,如類別b;
s303、根據(jù)找出的儀器類別b,判斷個性化模型庫中是否存有與儀器類別b相對應(yīng)的個性化模型,若有,則從個性化模型庫中找出與該儀器類別b相對應(yīng)的個性化模型,然后,將新設(shè)備的儀器參數(shù)與找出的個性化模型中所存儲的儀器特征進行匹配比較,從而找出與該新設(shè)備最匹配的個性化模型,然后,利用找出的個性化模型,調(diào)用該個性化模型的模型規(guī)則,從而進行物質(zhì)信息的結(jié)果預(yù)測處理;反之,則從基礎(chǔ)模型庫中獲得與該找出的儀器類別b相對應(yīng)的基礎(chǔ)模型后,利用該獲得的基礎(chǔ)模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
對于上述的模型匹配方法,其具體流程如圖4所示(樣品以玉米為例,指標(biāo)以蛋白含量為例):
首先,獲取新設(shè)備的儀器參數(shù),然后,將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別b;接著,根據(jù)找出的儀器類別b,判斷個性化模型庫中是否存有與儀器類別b相對應(yīng)的個性化模型,若有,則從個性化模型庫中找出與該儀器類別b相對應(yīng)的個性化模型,然后,新設(shè)備的儀器參數(shù)與找出的個性化模型中所存儲的儀器特征進行匹配比較,從而找出與該新設(shè)備最匹配的個性化模型,在本實施例中,找出的個性化模型為針對玉米蛋白的個性化模型003,接著,利用找出的個性化模型,調(diào)用該個性化模型的模型規(guī)則所對應(yīng)的預(yù)測函數(shù),從而對采集到的樣品的光譜信息,如玉米的光譜信息,進行物質(zhì)信息的結(jié)果預(yù)測處理。
實施例4、一種基于基礎(chǔ)模型庫、個性化模型庫及光譜特征的模型匹配方法
增設(shè)光譜特征來實現(xiàn)模型匹配,這可在基礎(chǔ)模型庫與個性化模型庫中的分析模型數(shù)量增多時,能更好地匹配尋找到最優(yōu)分析模型。
由于需要利用光譜特征來進行模型匹配,因此,對于基礎(chǔ)模型庫和個性化模型庫中的分析模型,在其建立過程中,增設(shè)有光譜特征提取步驟,具體地,所述分析模型所對應(yīng)的光譜特征,其提取步驟包括:對建模集中的光譜數(shù)據(jù)進行分析,從而提取出相應(yīng)的光譜特征,而提取出來的光譜特征,其與建立好的分析模型一一對應(yīng)地存儲在云端。例如,使用設(shè)備1時,建立分析模型o,而此時用于建立這一分析模型o所用到的數(shù)據(jù)構(gòu)成一建模數(shù)據(jù)集,稱為建模集,然后,對這一建模集中的光譜數(shù)據(jù)進行分析,從而提取出相應(yīng)的光譜特征o,接著,則將這一分析模型o及其對應(yīng)的光譜特征o上傳至云端存儲,并存儲至與設(shè)備1所對應(yīng)的儀器類別中。
在檢測階段,針對分析模型所對應(yīng)的光譜特征、實施例3建立好的個性化模型以及實施例1建立好的基礎(chǔ)模型庫,在新設(shè)備進行模型匹配時,其方法步驟包括有:
s401、獲取新設(shè)備的儀器參數(shù)以及待測光譜;
s402、將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別,如類別b;
s403、根據(jù)找出的儀器類別b,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別b相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而獲得最匹配的分析模型,此時,與找出的最相似的光譜特征相對應(yīng)的分析模型為最匹配的分析模型;
s404、利用最匹配的分析模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
另外,對于找出與待測光譜最相似的光譜特征這一步驟,其所采用的修正余弦相似度算法的公式如下所示:
上述u表示為特征集,u表示為u內(nèi)單個特征維度所代表的信息,i表示新設(shè)備檢測時的待測樣品光譜特征集合,即待測光譜,j表示為每個待對比的分析模型所對應(yīng)的光譜特征,即分析模型中的建模光譜集的特征集合,sim(i,j)表示為待測光譜與每個待對比的分析模型所對應(yīng)的光譜特征之間的比對結(jié)果。
對于上述的模型匹配方法,其具體流程如圖5所示(樣品以玉米為例,指標(biāo)以蛋白含量為例):
首先,獲取新設(shè)備的儀器參數(shù)以及待測光譜;然后,將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別b;接著,根據(jù)找出的儀器類別b,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別b相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而獲得最匹配的分析模型;此時,與找出的最相似的光譜特征相對應(yīng)的分析模型為最匹配的分析模型,在本實施例中,找出的最匹配的分析模型為儀器類別b所對應(yīng)的個性化模型007;最后,利用最匹配的分析模型,即個性化模型007,調(diào)用該個性化模型007的模型規(guī)則所對應(yīng)的預(yù)測函數(shù),從而對未知光譜x進行物質(zhì)信息的結(jié)果。
實施例5、一種基于基礎(chǔ)模型庫、個性化模型庫、光譜特征及儀器特征的模型匹配方法
本實施例的模型匹配方法綜合運用了上述的儀器種群聚類技術(shù)、個性化模型技術(shù)以及光譜特征匹配技術(shù),并且還進一步地結(jié)合儀器特征從而實現(xiàn)對未知樣品進行多指標(biāo)預(yù)測。
在檢測階段,針對分析模型所對應(yīng)的光譜特征、儀器特征、實施例3建立好的個性化模型以及實施例1建立好的基礎(chǔ)模型庫,在新設(shè)備進行模型匹配時,其方法步驟包括有:
s501、獲取新設(shè)備的儀器參數(shù)以及待測光譜;
s502、將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別,如類別b;
s503、根據(jù)找出的儀器類別b,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別b相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而得到與找出的最相似的光譜特征相對應(yīng)的分析模型,然后,將新設(shè)備的儀器參數(shù)與得到的分析模型(即與找出的最相似的光譜特征相對應(yīng)的分析模型)所對應(yīng)的儀器特征進行匹配比較,從而找出與新設(shè)備的儀器參數(shù)最匹配的儀器特征,從而獲得最匹配的分析模型,此時,與找出的最匹配的儀器特征相對應(yīng)的分析模型為最匹配的分析模型;
s504、利用最匹配的分析模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
對于上述的模型匹配方法,其具體流程如圖6所示(樣品以玉米為例,指標(biāo)以水分含量、蛋白含量為例):
首先,獲取新設(shè)備(未知設(shè)備)的儀器參數(shù)以及待測光譜(未知光譜);然后,將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別b;接著,根據(jù)找出的儀器類別b,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別b相對應(yīng)的分析模型,然后將待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與待測光譜最相似的光譜特征,從而得到與找出的最相似的光譜特征相對應(yīng)的分析模型,此時這些找出的分析模型為可用模型匹配的分析模型,在本實施例中,找出的可用模型匹配的分析模型為針對玉米蛋白的分析模型005和009、針對玉米水分的分析模型001、005和010;跟著,將新設(shè)備的儀器參數(shù)與這些得到的分析模型所對應(yīng)的儀器特征進行匹配比較,從而找出與新設(shè)備的儀器參數(shù)最匹配的儀器特征,從而獲得最匹配的分析模型,在本實施例中,所找出的最匹配的分析模型分別為針對玉米蛋白的分析模型009和針對玉米水分的分析模型005;最后,利用這兩個分析模型,分別調(diào)用這兩個分析模型的模型規(guī)則所對應(yīng)的預(yù)測函數(shù),從而對未知光譜x進行物質(zhì)信息的結(jié)果。
由上述可見,通過使用本實施例的模型匹配方法,其通過多方面的特征匹配,可進一步地找出待測樣品最為適用的模型,從而大大提高預(yù)測值的準(zhǔn)確度。通過該發(fā)明技術(shù),供應(yīng)商僅需要對出廠的部分儀器建立基礎(chǔ)模型,供應(yīng)商與用戶都可在儀器的使用過程中不斷向云端填充個性化模型,隨著個性化模型的逐漸增多,預(yù)測精度及模型的匹配效果都會被不斷完善,從而實現(xiàn)買賣雙方良性的合作循環(huán)。
實施例6、一種基于基礎(chǔ)模型庫、個性化模型庫、光譜特征及平均光譜的模型匹配方法
在本實施例中,還有機結(jié)合了現(xiàn)代化學(xué)計量學(xué)中模型傳遞技術(shù),從而更進一步地提升預(yù)測結(jié)果的準(zhǔn)確度。利用平均光譜來進行模型匹配,因此,在儀器類別劃分結(jié)束后,即步驟s102之后,增設(shè)有標(biāo)準(zhǔn)品(儀器附件之一)光譜采集這一步驟,從而得出每個儀器類別所對應(yīng)的對標(biāo)準(zhǔn)品的平均光譜,在本實施例中,儀器類別所對應(yīng)的對標(biāo)準(zhǔn)品的平均光譜作為儀器類別所對應(yīng)的第二類別特征。
對于所述儀器類別所對應(yīng)的第二類別特征,其提取步驟s104包括:在步驟s102后,已劃分出了不同的儀器類別,然后將屬于同一儀器類別下的全部設(shè)備,或部分有代表性的設(shè)備進行標(biāo)準(zhǔn)品的光譜采集,接著,對采集到的對標(biāo)準(zhǔn)品的光譜數(shù)據(jù)進行平均光譜的計算,計算得出的平均光譜作為該儀器類別所對應(yīng)的第二類別特征,最后將該儀器類別所對應(yīng)的平均光譜上傳至云端進行相應(yīng)的存儲;例如,在儀器類別劃分結(jié)束后,一共劃分出10種儀器類別,而第一儀器類別(即類別1)中包括有30臺設(shè)備,此時則對這30臺設(shè)備或部分有代表性的設(shè)備,如15臺近紅外光譜儀,進行標(biāo)準(zhǔn)品的光譜采集,即令這30臺或15臺近紅外光譜儀對標(biāo)準(zhǔn)品進行光譜采集,然后,根據(jù)這些采集到的對標(biāo)準(zhǔn)品的光譜數(shù)據(jù)進行平均光譜計算,此時計算得出的平均光譜則作為第一儀器類別(即類別1)所對應(yīng)的第二類別特征。由此可見,上述步驟s104設(shè)置在步驟s102之后。
對于上述的步驟s104,其具體流程如圖7所示:
首先,當(dāng)根據(jù)步驟s101和s102進行聚類分析后,劃分出類別1、類別2……類別n這n個儀器類別,然后將屬于同一儀器類別下的設(shè)備對標(biāo)準(zhǔn)品進行光譜采集,然后對采集到的對標(biāo)準(zhǔn)品的光譜數(shù)據(jù)進行平均光譜的計算,從而得到類別1所對應(yīng)的平均光譜為平均光譜1,而平均光譜1則作為類別1所對應(yīng)的第二類別特征。
在檢測階段,針對儀器類別所對應(yīng)的平均光譜、分析模型所對應(yīng)的光譜特征、實施例3建立好的個性化模型以及實施例1建立好的基礎(chǔ)模型庫,在新設(shè)備進行模型匹配時,其方法步驟包括有:
s601、令新設(shè)備對標(biāo)準(zhǔn)品進行多次掃描(至少3次),從而獲得新設(shè)備的對標(biāo)準(zhǔn)品的平均光譜,即將新設(shè)備對標(biāo)準(zhǔn)品進行多次掃描所得到的多個光譜數(shù)據(jù)進行平均值計算,得到的平均值則為新設(shè)備的對標(biāo)準(zhǔn)品的平均光譜;
s602、獲取新設(shè)備的儀器參數(shù)及待測光譜;
s603、將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別,如類別b;
s604、對新設(shè)備的對標(biāo)準(zhǔn)品的平均光譜以及該儀器類別b所對應(yīng)的第二特征,即該儀器類別b所對應(yīng)的對標(biāo)準(zhǔn)品的平均光譜,進行分析,從而使用現(xiàn)代化學(xué)計量學(xué)中的方法(如shenk’s算法、直接校正算法ds、分段直接校正算法pds)求出校正系數(shù);
s605、利用求出的校正系數(shù)對待測光譜進行校正,從而得到校正后的待測光譜;
s606、根據(jù)找出的類別b,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別b相對應(yīng)的分析模型,然后,將校正后的待測光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與校正后的待測光譜最相似的光譜特征,從而獲得最匹配的分析模型,此時,所述找出的最相似的光譜特征所對應(yīng)的分析模型為最匹配的分析模型;
s607、利用最匹配的分析模型進行物質(zhì)信息的結(jié)果預(yù)測處理;
其中,所述的基礎(chǔ)模型庫是基于儀器種群聚類方式而建成的基礎(chǔ)模型庫。
對于上述的模型匹配方法,其具體流程如圖8所示:
首先,獲取新設(shè)備的對標(biāo)準(zhǔn)品的平均光譜、儀器參數(shù)及待測光譜;然后,將獲取的儀器參數(shù)與每個儀器類別所對應(yīng)的第一類別特征進行比較,從而找出與該新設(shè)備最接近的儀器類別2;接著,將新設(shè)備的對標(biāo)準(zhǔn)品的平均光譜以及儀器類別2所對應(yīng)的平均光譜2進行分析,從而求出校正系數(shù);跟著,利用求出的校正系數(shù)對待測光譜,分別包括對新樣本a所采集的未知光譜a、對新樣本b所采集的未知光譜b以及對新樣本c所采集的未知光譜c,進行校正,從而得到校正后的待測光譜,分別為校正光譜a、校正光譜b、校正光譜c;隨后,根據(jù)找出的類別2,從基礎(chǔ)模型庫和個性化模型中找出與該儀器類別2相對應(yīng)的分析模型,然后,將校正光譜與找出的分析模型所對應(yīng)的光譜特征進行匹配比較,找出與校正光譜最相似的光譜特征,從而獲得最匹配的分析模型,分別為分析模型2a、分析模型2b及分析模型2c;最后,利用最匹配的分析模型,調(diào)用其模型規(guī)則所對應(yīng)的預(yù)測函數(shù)對應(yīng)地對校正光譜進行物質(zhì)信息的結(jié)果預(yù)測處理。
由上述可得,本發(fā)明的模型匹配方法所具有的優(yōu)點包括:
1、本發(fā)明可滿足模型轉(zhuǎn)移過程中較大強度的自動化,實現(xiàn)模型快速,準(zhǔn)確轉(zhuǎn)移
在本發(fā)明的匹配方法中,可根據(jù)儀器本身特點及環(huán)境建立個性化轉(zhuǎn)移模型,滿足模型轉(zhuǎn)移過程中靈活性,突破有限設(shè)備、有限模型的轉(zhuǎn)移,實現(xiàn)大量模型快速、準(zhǔn)確地遷移;
2、模型的動態(tài)更新
在本發(fā)明的匹配方法中,可根據(jù)儀器自身情況,以及結(jié)合用戶反饋信息,建立儀器在其整個生命周期上的動態(tài)模型,使其成為一個不斷改善的生態(tài)模型系統(tǒng),靈活性高,而且還能提高模型匹配的準(zhǔn)確性以及適用性;
3、滿足用戶參與,定制個性化模型的需求
打破企業(yè)與用戶傳統(tǒng)的短暫買賣關(guān)系,以儀器為渠道,整合線上線下平臺,建立起與用戶的長期關(guān)聯(lián),以此為橋梁滿足用戶參與的需求,并通過用戶與儀器交互的數(shù)據(jù)為模型更新,以及定制個性化模型提供依據(jù)。
以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權(quán)利要求所限定的范圍內(nèi)。