本發(fā)明涉及一種血糖濃度預(yù)測(cè)方法,更具體地講,涉及一種基于“m+n”理論的血糖濃度預(yù)測(cè)方法。
背景技術(shù):
血糖是人體一項(xiàng)極為重要的生理指標(biāo),對(duì)維持機(jī)體,尤其是腦、神經(jīng)的正常生理功能有著非常重要的意義。目前血糖濃度測(cè)量方法主要有自動(dòng)生化儀測(cè)量法和快速血糖儀測(cè)量法,都是通過(guò)采血的方式來(lái)檢測(cè)血糖值,會(huì)給患者帶來(lái)創(chuàng)傷,對(duì)患者長(zhǎng)時(shí)間的血糖監(jiān)測(cè)不利,因此無(wú)創(chuàng)血糖檢測(cè)的實(shí)現(xiàn)具有十分重要的現(xiàn)實(shí)意義。
然而由于信號(hào)微弱、測(cè)量條件變化復(fù)雜、人體生理指標(biāo)和血液中非測(cè)量組分等因素對(duì)測(cè)量的影響進(jìn)而導(dǎo)致血糖預(yù)測(cè)精度不高,達(dá)不到臨床使用需求,是目前近紅外無(wú)創(chuàng)光譜血糖測(cè)量突出的難題。因此探究新的測(cè)量方法以克服測(cè)量條件、人體生理背景等對(duì)光譜測(cè)量的影響來(lái)提高預(yù)測(cè)精度,對(duì)全面實(shí)現(xiàn)血糖的無(wú)創(chuàng)測(cè)量具有重要意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的實(shí)施例提供一種血糖濃度預(yù)測(cè)方法,其能夠全面考慮測(cè)量條件、人體生理背景等對(duì)血糖濃度測(cè)量的影響,從而有效提高血糖濃度的預(yù)測(cè)精度。
根據(jù)本發(fā)明的示例性實(shí)施例的一方面,提供了一種血糖濃度預(yù)測(cè)方法,所述方法可以包括:采集多個(gè)樣本測(cè)試者的生理數(shù)據(jù);向所述多個(gè)樣本測(cè)試者的測(cè)量部位發(fā)射預(yù)設(shè)波長(zhǎng)的光;采集穿透測(cè)量部位的光的光譜數(shù)據(jù);直接測(cè)量所述多個(gè)樣本測(cè)試者的血糖濃度真值和非血糖濃度數(shù)據(jù);保存所述多個(gè)樣本測(cè)試者的生理數(shù)據(jù)、光譜數(shù)據(jù)、血糖濃度真值和非血糖濃度數(shù)據(jù);根據(jù)所述多個(gè)樣本測(cè)試者的生理數(shù)據(jù)、光譜數(shù)據(jù)、血糖濃度真值和非血糖濃度數(shù)據(jù),采用多元校正算法建立基于“m+n”理論的血糖濃度預(yù)測(cè)模型,其中,所述多個(gè)樣本測(cè)試者的生理數(shù)據(jù)、光譜數(shù)據(jù)和非血糖濃度數(shù)據(jù)作為基于“m+n”理論的血糖濃度預(yù)測(cè)模型的輸入,血糖濃度真值作為基于“m+n”理論的血糖濃度預(yù)測(cè)模型的輸出;根據(jù)建立的基于“m+n”理論的血糖濃度預(yù)測(cè)模型,從待測(cè)者的穿透測(cè)量部位的光的光譜數(shù)據(jù)、生理數(shù)據(jù)和非血糖濃度數(shù)據(jù)預(yù)測(cè)待測(cè)者的血糖濃度。
生理數(shù)據(jù)可以包括年齡、腰圍身高比例、血壓和體溫中的至少一種。
非血糖濃度數(shù)據(jù)可以包括:甘油三酯的濃度、高密度脂蛋白膽固醇的濃度和血清總膽固醇的濃度。
所述方法還可以包括:采集所述多個(gè)樣本測(cè)試者的與測(cè)量條件相關(guān)的數(shù)據(jù);根據(jù)所述多個(gè)樣本測(cè)試者的與測(cè)量條件相關(guān)的數(shù)據(jù)、生理數(shù)據(jù)、光譜數(shù)據(jù)、血糖濃度真值和非血糖濃度數(shù)據(jù),采用多元校正算法建立基于“m+n”理論的血糖濃度預(yù)測(cè)模型,其中,所述多個(gè)樣本測(cè)試者的與測(cè)量條件相關(guān)的數(shù)據(jù)、生理數(shù)據(jù)、光譜數(shù)據(jù)和非血糖濃度數(shù)據(jù)作為基于“m+n”理論的血糖濃度預(yù)測(cè)模型的輸入,血糖濃度真值作為基于“m+n”理論的血糖濃度預(yù)測(cè)模型的輸出。
與測(cè)量條件相關(guān)的數(shù)據(jù)可以包括與測(cè)量部位、接觸壓力、測(cè)量時(shí)間、檢測(cè)距離、環(huán)境溫濕度和電壓波動(dòng)中的至少一種相關(guān)的數(shù)據(jù)。
所述方法還可以包括:根據(jù)基于“m+n”理論的血糖濃度預(yù)測(cè)模型來(lái)從待測(cè)者的與測(cè)量條件相關(guān)的數(shù)據(jù)、生理數(shù)據(jù)、光譜數(shù)據(jù)和非血糖濃度數(shù)據(jù)預(yù)測(cè)待測(cè)者的血糖濃度。
多元校正算法可以是偏最小二乘法、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、小波變換算法中的一種。
所述方法還可以包括:利用單沿提取法處理所述多個(gè)樣本測(cè)試者的穿透測(cè)量部位的光的光譜數(shù)據(jù);根據(jù)處理后的光譜數(shù)據(jù)、所述多個(gè)樣本測(cè)試者的生理數(shù)據(jù)、血糖濃度真值和非血糖濃度數(shù)據(jù),建立基于“m+n”理論的血糖濃度預(yù)測(cè)模型。
所述方法還可以包括:利用單沿提取法處理待測(cè)者的穿透測(cè)量部位的光的光譜數(shù)據(jù);根據(jù)基于“m+n”理論的血糖濃度預(yù)測(cè)模型,從待測(cè)者的處理后的光譜數(shù)據(jù)、生理數(shù)據(jù)和非血糖濃度數(shù)據(jù)預(yù)測(cè)待測(cè)者的血糖濃度。
通過(guò)使用根據(jù)本發(fā)明的示例性實(shí)施例的血糖濃度預(yù)測(cè)方法,能夠有效提高血糖濃度的預(yù)測(cè)精度,有利于開(kāi)發(fā)出精確的無(wú)創(chuàng)血糖濃度測(cè)量方法。
將在接下來(lái)的描述中部分闡述本發(fā)明總體構(gòu)思另外的方面和/或優(yōu)點(diǎn),還有一部分通過(guò)描述將是清楚的,或者可以經(jīng)過(guò)本發(fā)明總體構(gòu)思的實(shí)施而得知。
附圖說(shuō)明
圖1是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)方法的理論框圖。
圖2是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)系統(tǒng)的框圖。
圖3是根據(jù)本發(fā)明的實(shí)施例的利用單沿提取法處理的動(dòng)態(tài)光譜數(shù)據(jù)的曲線(xiàn)圖。
圖4是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)模型的結(jié)構(gòu)圖。
圖5是根據(jù)本發(fā)明的實(shí)施例的示出基于“m+n”理論的血糖濃度預(yù)測(cè)值、未考慮非測(cè)量組分影響的預(yù)測(cè)值與真實(shí)值之間的比較的圖表。
圖6是根據(jù)本發(fā)明的實(shí)施例的示出基于“m+n”理論的血糖濃度預(yù)測(cè)值與真值的相對(duì)誤差的曲線(xiàn)圖。
具體實(shí)施方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
“m+n”理論從誤差理論的角度分析測(cè)量系統(tǒng)和測(cè)量過(guò)程,將被測(cè)對(duì)象自身的差異和其他干擾因素一同歸于整個(gè)測(cè)量系統(tǒng)中,系統(tǒng)地考慮兩者對(duì)預(yù)測(cè)精度的影響。本發(fā)明研究血糖濃度預(yù)測(cè)中的影響因素,根據(jù)“m+n”理論將影響因素分成“m”因素和“n”因素,并根據(jù)影響因素的特性分別采用不同的方法減小對(duì)應(yīng)的影響因素對(duì)血糖濃度預(yù)測(cè)精度的影響。
“m+n”理論中“m”表示被測(cè)對(duì)象中影響測(cè)量成分的預(yù)測(cè)精度的m種非測(cè)量因素,“n”表示影響測(cè)量成分的預(yù)測(cè)精度的n種外界干擾因素?;凇癿+n”理論提高預(yù)測(cè)精度的關(guān)鍵在于將“m”因素與“n”因素同等對(duì)待,判斷每個(gè)因素是系統(tǒng)誤差還是隨機(jī)誤差,同時(shí)還提出必要的減小誤差的解決方法。
圖1是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)方法的理論框圖。該方法的測(cè)量對(duì)象是人體血液中的血糖,測(cè)量系統(tǒng)是用于獲取人體血液信息的光譜儀。
如圖1所示,首先,對(duì)測(cè)量對(duì)象及其相關(guān)聯(lián)的測(cè)量系統(tǒng)進(jìn)行整體分析,分析對(duì)象包括關(guān)于人體的因素101和關(guān)于測(cè)量系統(tǒng)的因素102,關(guān)于人體的因素101包含了影響血糖濃度預(yù)測(cè)的m種非測(cè)量組分或因素,關(guān)于測(cè)量系統(tǒng)的因素102包含了影響血糖濃度預(yù)測(cè)的n種外界影響因素。
然后,根據(jù)所述分析對(duì)象全面地歸納出“m”因素103和“n”因素104,“m”因素103表示影響血糖濃度預(yù)測(cè)的m種非測(cè)量組分或因素,“n”因素104表示影響血糖濃度預(yù)測(cè)的n種外界影響因素。
下一步,依據(jù)“m”因素103和“n”因素104各自的特性,將“m”因素103和“n”因素104分類(lèi)為系統(tǒng)誤差影響因素105和隨機(jī)誤差影響因素106。系統(tǒng)誤差具有規(guī)律性定值,或者與被測(cè)量的血糖濃度有確定的相關(guān)關(guān)系,或者具有可預(yù)測(cè)性;而隨機(jī)誤差具有變化微小的特性或者無(wú)統(tǒng)計(jì)規(guī)律可言。
如圖1所示,“m”因素103包括系統(tǒng)誤差影響因素e1和隨機(jī)誤差影響因素e2,“n”因素104包括系統(tǒng)誤差影響因素e3和隨機(jī)誤差影響因素e4。系統(tǒng)誤差影響因素e1表示關(guān)于人體的影響血糖濃度預(yù)測(cè)的系統(tǒng)誤差影響因素,包括被測(cè)人體的血液中影響血糖濃度預(yù)測(cè)的除血糖以外的血液成分(例如,甘油三酯、高密度脂蛋白膽固醇、血清總膽固醇等)的非血糖濃度數(shù)據(jù)以及人體相關(guān)的生理數(shù)據(jù)(例如,腰圍身高比例、年齡、血壓、體溫等)。系統(tǒng)誤差影響因素e3表示關(guān)于測(cè)量系統(tǒng)的影響血糖濃度預(yù)測(cè)的系統(tǒng)誤差影響因素,包括與測(cè)量條件相關(guān)的系統(tǒng)誤差影響因素,例如:測(cè)量部位、接觸壓力、測(cè)量時(shí)間、檢測(cè)距離、環(huán)境溫濕度、電壓波動(dòng)等。隨機(jī)誤差影響因素e2關(guān)于人體的影響血糖濃度預(yù)測(cè)的隨機(jī)誤差影響因素,包括人體的肢體運(yùn)動(dòng)等。隨機(jī)誤差影響因素e4關(guān)于測(cè)量系統(tǒng)的影響血糖濃度預(yù)測(cè)的隨機(jī)誤差影響因素,包括測(cè)量?jī)x器中的暗電流等。
在分析了系統(tǒng)誤差影響因素105和隨機(jī)誤差影響因素106之后,可以根據(jù)各個(gè)因素的不同屬性采用不同的處理方法,以減小誤差和提高預(yù)測(cè)精度。根據(jù)系統(tǒng)誤差影響因素105的屬性,可以采用相應(yīng)的系統(tǒng)誤差處理方法109減小系統(tǒng)誤差。系統(tǒng)誤差處理方法109包括:(1)使影響因素固定不變,以在測(cè)量過(guò)程中剔除該影響因素產(chǎn)生的系統(tǒng)誤差;(2)通過(guò)補(bǔ)償方法(如溫度補(bǔ)償)來(lái)提高預(yù)測(cè)精度;(3)通過(guò)樣本分布的選擇來(lái)提高建模預(yù)測(cè)精度。根據(jù)隨機(jī)誤差影響因素106的屬性,可以采用相應(yīng)的隨機(jī)誤差處理方法110減小隨機(jī)誤差。隨機(jī)誤差處理方法110包括:(1)最小化處理;(2)多次測(cè)量求平均值;(3)提高測(cè)量系統(tǒng)的靈敏度;(4)擴(kuò)展影響因素的變化范圍以繼續(xù)探索其影響模式。
在示例性實(shí)施例中,根據(jù)上述各個(gè)因素的誤差特性的差異采用不同的處理方法來(lái)降低各個(gè)因素對(duì)血糖濃度預(yù)測(cè)的不良影響。
基于光電容積脈搏波原理的動(dòng)態(tài)光譜法,能夠利用靜脈血管收縮舒張下對(duì)光吸收度的改變來(lái)直接提取多個(gè)波長(zhǎng)下反映靜脈血液成分的光密度,從理論上降低了個(gè)體差異和測(cè)量條件帶來(lái)的誤差。在示例性實(shí)施例中,通過(guò)光譜儀采集人體靜脈血的光譜數(shù)據(jù),以基于動(dòng)態(tài)光譜原理獲取人體血液信息。同時(shí),考慮到臨床實(shí)際應(yīng)用情況,測(cè)量條件中的測(cè)量部位選定為食指(其它身體部位也是可行的),測(cè)量時(shí)間和檢測(cè)距離均設(shè)定為固定值,例如,每個(gè)測(cè)試者的測(cè)量時(shí)間為20s,檢測(cè)距離為0(食指完全遮蓋住光譜儀的光纖入口)。這樣可以減小測(cè)量部位、測(cè)量時(shí)間和檢測(cè)距離對(duì)血糖濃度預(yù)測(cè)造成的誤差。
在動(dòng)態(tài)光譜原理的基礎(chǔ)上,進(jìn)一步采用單沿提取法處理光譜數(shù)據(jù)以減小接觸壓力等測(cè)量條件造成的誤差。單沿提取法的基本思想是用統(tǒng)計(jì)平均的方法提取各波長(zhǎng)下峰峰值的對(duì)應(yīng)比例關(guān)系,并非直接提取峰峰值。單沿提取法利用了對(duì)數(shù)脈搏波的疊加平均效應(yīng)來(lái)剔除和校正各波長(zhǎng)下脈搏波的波形誤差,同時(shí)也利用了單沿動(dòng)態(tài)光譜的疊加平均效應(yīng)剔除含有粗大誤差的單沿動(dòng)態(tài)光譜,從這兩方面能有效降低誤差對(duì)動(dòng)態(tài)光譜波形的不良影響。因此,在數(shù)據(jù)預(yù)處理階段選取單沿提取法提取動(dòng)態(tài)光譜數(shù)據(jù),以利于減小“n”因素中的接觸壓力造成的系統(tǒng)誤差,從而為后續(xù)的血糖濃度預(yù)測(cè)模型的建模和預(yù)測(cè)奠定基礎(chǔ)。
根據(jù)本發(fā)明的示例性實(shí)施例,在血糖濃度預(yù)測(cè)模型的建模過(guò)程中,將利用基于動(dòng)態(tài)光譜原理的單沿提取法處理的光譜數(shù)據(jù)以及樣本測(cè)試者靜脈血液中的甘油三酯的濃度、高密度脂蛋白膽固醇的濃度、血清總膽固醇的濃度、樣本測(cè)試者的年齡、腰圍身高比例、血壓、體溫、測(cè)量環(huán)境的環(huán)境溫濕度和光譜儀的電壓波動(dòng)等系統(tǒng)誤差影響因素都納入血糖濃度預(yù)測(cè)模型中,從而全面地考慮上述所有因素對(duì)血糖濃度預(yù)測(cè)值的影響。
圖2是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)系統(tǒng)的框圖。在示例性實(shí)施例中,光源201為50w的溴鎢燈,測(cè)量部位202是食指,使用的光譜儀203為avaspec-hs1024x58tec高靈敏度型光纖光譜儀,波長(zhǎng)范圍為200-1160nm。光源201發(fā)出的光聚焦透過(guò)測(cè)量部位202后,由光譜儀203直接進(jìn)行光譜數(shù)據(jù)的采集。根據(jù)在脈搏波的采集過(guò)程中的光強(qiáng)及其它測(cè)量條件的影響,實(shí)施例中選取的波長(zhǎng)范圍是580.43nm-1150.3nm,波長(zhǎng)間隔為0.94nm,約606個(gè)波長(zhǎng)。測(cè)量系統(tǒng)中還包括與光譜儀203連接的處理器206,處理器206能夠與光譜儀203通信,接收并存儲(chǔ)光譜數(shù)據(jù)以及從外部輸入的血液成分信息205。
在一個(gè)示例性實(shí)施例中,選定了239名測(cè)試者進(jìn)行實(shí)驗(yàn)。測(cè)試者平臥放松并將食指指端完全遮擋住光譜儀203的光纖入口,光譜儀203采集特定測(cè)量時(shí)間內(nèi)的光譜數(shù)據(jù),然后將光譜數(shù)據(jù)發(fā)送給與光譜儀203連接的處理器206,以由處理器206進(jìn)行數(shù)據(jù)存儲(chǔ)和處理。在光譜數(shù)據(jù)采集完成后,由工作人員對(duì)測(cè)試者進(jìn)行靜脈抽血獲得測(cè)試者的靜脈血樣204,工作人員可以從靜脈血樣204中提取測(cè)試者的血液成分信息,即,血糖濃度真值以及甘油三酯的濃度、高密度脂蛋白膽固醇的濃度和血清總膽固醇的濃度等其它血液組分信息。工作人員將收集的血液成分信息輸入到處理器206中,還在處理器206中記錄測(cè)試者的年齡、腰圍身高比例、血壓和體溫,同時(shí)記錄測(cè)量過(guò)程中的環(huán)境溫濕度、光譜儀的電壓波動(dòng)情況。在示例性實(shí)施例中,通過(guò)重復(fù)以上步驟采集到239組光譜數(shù)據(jù)樣本。
為了提高基于動(dòng)態(tài)光譜的多波長(zhǎng)血糖濃度預(yù)測(cè)建模方法的穩(wěn)定性和可靠性,需要評(píng)判動(dòng)態(tài)光譜數(shù)據(jù)的質(zhì)量,本申請(qǐng)采用的方法是利用動(dòng)態(tài)光譜數(shù)據(jù)穩(wěn)定波長(zhǎng)數(shù)的多少來(lái)進(jìn)行光譜數(shù)據(jù)的質(zhì)量的評(píng)判。穩(wěn)定波長(zhǎng)數(shù)是各波長(zhǎng)下對(duì)數(shù)脈搏波頻域基波分量頻率持續(xù)一致的波長(zhǎng)個(gè)數(shù)。穩(wěn)定波長(zhǎng)數(shù)越大則表明各波長(zhǎng)下對(duì)數(shù)脈搏波越相似,即動(dòng)態(tài)光譜數(shù)據(jù)質(zhì)量越高。根據(jù)穩(wěn)定波長(zhǎng)數(shù)這一標(biāo)準(zhǔn)在原始的239組光譜數(shù)據(jù)樣本中選取了192組光譜數(shù)據(jù)樣本,以用于血糖濃度預(yù)測(cè)模型的建模和預(yù)測(cè)分析。
處理器206對(duì)選取的192組光譜數(shù)據(jù)樣本進(jìn)行單沿提取。單沿提取法的提取步驟如下:
(1)對(duì)采集到的ppg信號(hào)取對(duì)數(shù),將其中強(qiáng)度較大信號(hào)進(jìn)行疊加平均,作為脈搏波的模板;
(2)找到每個(gè)周期內(nèi)的波峰與波谷值,通過(guò)峰谷值來(lái)確定上升沿和下降沿,將所有波長(zhǎng)的有效上升沿與模板的有效上升沿進(jìn)行最小二乘擬合,以此來(lái)校正對(duì)數(shù)脈搏波的上升沿;
記任意波長(zhǎng)λ下對(duì)數(shù)脈搏波在時(shí)域上的表達(dá)式為等式(1):
yλ(t)=δaλ·x(t)+dcλ(1)
其中,δaλ為靜脈血液的吸光度值;x(t)為對(duì)數(shù)脈搏波的波形函數(shù);dcλ為對(duì)數(shù)脈搏波的直流分量,對(duì)數(shù)脈搏波隨時(shí)間t變化的出射光強(qiáng)為yλ(t)。
由于各波長(zhǎng)對(duì)數(shù)脈搏波的波形具有相似性,即x(t)是不變的,則對(duì)數(shù)脈搏波模板的出射光強(qiáng)值y0(t)可表示為等式(2)
y0(t)=δa0·x(t)+dc0(2)
其中,δa0,dc0分別為對(duì)數(shù)脈搏波模板的平均吸光度和平均直流分量;
將等式(1)和(2)合并,可以得到等式(3):
從式(3)可以看出,對(duì)數(shù)脈搏波模板的出射光強(qiáng)y0(t)為自變量,各波長(zhǎng)對(duì)數(shù)脈搏波的出射光強(qiáng)yλ(t)為因變量,兩者之間是線(xiàn)性關(guān)系;斜率a=δaλ/δa0為經(jīng)過(guò)最小二乘擬合得到的各波長(zhǎng)的擬合斜率,將所有波長(zhǎng)下的擬合斜率作為動(dòng)態(tài)光譜的等效值,構(gòu)成一系列單沿動(dòng)態(tài)光譜。
(3)計(jì)算每一個(gè)波長(zhǎng)下的單沿動(dòng)態(tài)光譜與疊加平均值的歐式距離di(x,y)(i為單沿動(dòng)態(tài)光譜的個(gè)數(shù)),這里采用歐式距離來(lái)判定單沿動(dòng)態(tài)光譜與疊加平均值的相似性,歐式距離是時(shí)間序列相似性研究中最廣泛使用的相似性度量方法,其幾何表達(dá)式如下:
歐式距離d(x,y)越小,說(shuō)明單沿動(dòng)態(tài)光譜與疊加平均值之間的相似度越高。計(jì)算歐式距離di(x,y)的疊加平均值
(4)按照判別粗大誤差的萊以特準(zhǔn)則(3σ準(zhǔn)則),如下所示:
|δi|>3σ(8)
如果某單沿動(dòng)態(tài)光譜滿(mǎn)足萊以特準(zhǔn)則,則可以認(rèn)為該單沿動(dòng)態(tài)光譜含有粗大誤差,應(yīng)予以剔除;否則認(rèn)為該單沿動(dòng)態(tài)光譜中不含有粗大誤差。對(duì)剔除粗大誤差后的單沿動(dòng)態(tài)光譜再進(jìn)行上述操作步驟,直到不再存在含有粗大誤差的單沿動(dòng)態(tài)光譜為止,從而篩選得到最終的有效單沿動(dòng)態(tài)光譜數(shù)據(jù),之后對(duì)有效單沿動(dòng)態(tài)光譜數(shù)據(jù)進(jìn)行疊加平均作為最終的歸一化的單沿動(dòng)態(tài)光譜輸出。如此,通過(guò)單沿提取法處理動(dòng)態(tài)光譜數(shù)據(jù)可以減小“n”因素中的接觸壓力等造成的誤差。
圖3示出了示例性實(shí)施例的利用單沿提取法處理的動(dòng)態(tài)光譜數(shù)據(jù)的曲線(xiàn)圖。除了單沿提取法,還可以采用峰峰值提取法、頻域提取法、快速數(shù)字鎖定放大器提取法、差值提取法等動(dòng)態(tài)光譜提取法來(lái)處理動(dòng)態(tài)光譜數(shù)據(jù)。
下面參照?qǐng)D4描述基于“m+n”理論的血糖濃度預(yù)測(cè)模型的建模過(guò)程。圖4是根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)模型的結(jié)構(gòu)圖。根據(jù)本發(fā)明的實(shí)施例,基于多元校正算法建立血糖濃度預(yù)測(cè)模型。
偏最小二乘法(partialleastsquareregression,pls)是一種數(shù)學(xué)優(yōu)化技術(shù),它提供一種線(xiàn)性回歸建模的方法。偏最小二乘法是基于因子分析的多變量校正方法,其數(shù)學(xué)基礎(chǔ)為多元線(xiàn)性回歸算法(multiplelinearregression,mlr)和主成分回歸算法(principalcomponentregression,pcr)。pls具有將多元回歸問(wèn)題轉(zhuǎn)化為若干一元回歸問(wèn)題的特點(diǎn),適合用于本次實(shí)驗(yàn)中樣本數(shù)較少而變量數(shù)較多的過(guò)程建模。因此,在示例性實(shí)施例中,基于偏最小二乘法建立血糖濃度預(yù)測(cè)模型。
在一般的多元線(xiàn)性回歸分析模型中,設(shè)有p個(gè)自變量x1,x2,…xp,q個(gè)因變量y1,y2,…yq,為了研究自變量與因變量之間的統(tǒng)計(jì)關(guān)系,觀(guān)測(cè)n個(gè)采樣點(diǎn),由此構(gòu)成了自變量與因變量的數(shù)據(jù)矩陣x=[x1,x2,…xp]n*p,y=[y1,y2,…yq]n*q。偏最小二乘法分別在x和y中提取第一成分t1和u1,使得t1為x1,x2,…xp的線(xiàn)性組合,u1為y1,y2,…yq的線(xiàn)性組合,且要滿(mǎn)足以下兩個(gè)條件:
(1)t1和u1要盡可能多的攜帶x與y數(shù)據(jù)矩陣中的變異信息;
(2)成分t1和u1的相關(guān)程度要達(dá)到最大使x的成分t1對(duì)y的成分u1的解釋能力最強(qiáng)。
在pls建模過(guò)程中,選擇合適的主成分?jǐn)?shù)直接關(guān)系到模型的實(shí)際預(yù)測(cè)能力。提取符合以上兩個(gè)條件的成分t1和u1,然后用pls分別實(shí)施x對(duì)t1和y對(duì)u1的回歸。若回歸方程能夠達(dá)到所需精度,可終止算法;否則,將利用x被t1解釋后的殘差和y被u1解釋后的殘差來(lái)進(jìn)行第二成分t2和u2的提取。不斷重復(fù),直到達(dá)到一個(gè)滿(mǎn)意的精度為止。若最終對(duì)自變量x共提取了m個(gè)成分t1,t2,…,tm,pls將通過(guò)實(shí)施yk(k=1,2,…,q)對(duì)t1,t2,…,tm的回歸,最終得到y(tǒng)k關(guān)于x1,x2,…xp的回歸方程。
為了數(shù)學(xué)推導(dǎo)方便,將x、y矩陣分別做標(biāo)準(zhǔn)化處理得到e0=(e01,e02,…,e0p)n*p,f0=(f01,f02,…,f0q)n*q。設(shè)t1=e0ε1和u1=f0θ1,其中ε1和θ1為單位矩陣且滿(mǎn)足
由拉格朗日算法可得出ε1和θ1:
ε1和θ1分別是
式中,e1和f1分別為以上兩個(gè)回歸方程的殘差矩陣,回歸系數(shù)向量p1和q1表示為:
用殘差矩陣e1和f1取代e0和f0求得ε2和θ2,并得到第二個(gè)成分t2和u2,建立回歸方程,有
同樣的,e2和f2為殘差矩陣,回歸系數(shù)向量是:
以此類(lèi)推,設(shè)秩為a,可得到
由于t1,…,ta均可以表示為e0中各向量的線(xiàn)性組合,(3-15)與(3-16)結(jié)合可表示為(3-17),其中
根據(jù)上述理論,基于偏最小二乘法研究血糖濃度預(yù)測(cè)模型的輸出輸入關(guān)系。
根據(jù)本發(fā)明的實(shí)施例,將“m”因素103中的系統(tǒng)誤差影響因素e1和“n”因素104中的系統(tǒng)誤差影響因素e3都作為血糖濃度預(yù)測(cè)模型的輸入變量(即,自變量),將血糖濃度預(yù)測(cè)值作為血糖濃度預(yù)測(cè)模型的輸出變量(即,因變量)。如此,基于偏最小二乘法建立多輸入單輸出的模型。
在本發(fā)明中,建模方法不僅限于在此示出的偏最小二乘法,還可以考慮諸如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、小波變換算法等的多元校正算法來(lái)進(jìn)行血糖濃度預(yù)測(cè)模型的建模。
如圖4所示,在這個(gè)示例性實(shí)施例中,將參照?qǐng)D3獲得的樣本測(cè)試者的甘油三酯的濃度x1、高密度脂蛋白膽固醇的濃度x2、血清總膽固醇的濃度x3、腰圍身高比例x4、年齡x5、血壓x6、體溫x7、環(huán)境溫濕度x8、光譜儀的電壓波動(dòng)x9以及單沿提取法處理后的動(dòng)態(tài)光譜數(shù)據(jù)x10作為血糖濃度預(yù)測(cè)模型的輸入變量(即,p個(gè)自變量,p=10,根據(jù)實(shí)際需求,自變量個(gè)數(shù)不僅限于此),將樣本測(cè)試者的血糖濃度真值(即,血糖濃度預(yù)測(cè)模型的血糖濃度預(yù)測(cè)值)y作為血糖濃度預(yù)測(cè)模型的輸出變量(即單個(gè)因變量,q=1)。其中,樣本測(cè)試者的甘油三酯的濃度x1、高密度脂蛋白膽固醇的濃度x2、血清總膽固醇的濃度x3、腰圍身高比例x4、年齡x5、血壓x6、體溫x7屬于系統(tǒng)誤差影響因素e1,環(huán)境溫濕度x8、光譜儀的電壓波動(dòng)x9屬于系統(tǒng)誤差影響因素e3,單沿提取法處理后的動(dòng)態(tài)光譜數(shù)據(jù)x10是相對(duì)于系統(tǒng)誤差影響因素e3中的測(cè)量部位、接觸壓力等的因變量。
在前面描述的192組樣本中隨機(jī)選取144例樣本進(jìn)行建模,剩下的48例樣本進(jìn)行預(yù)測(cè)和對(duì)比分析?;谒?44例樣本,采用偏最小二乘法研究輸入變量與輸出變量之間的關(guān)系,建立考慮多個(gè)因素綜合作用的血糖濃度預(yù)測(cè)模型,以符合復(fù)雜的應(yīng)用條件,提高血糖濃度的預(yù)測(cè)精度和預(yù)測(cè)范圍。
傳統(tǒng)的血糖濃度預(yù)測(cè)模型僅基于采集的原始動(dòng)態(tài)光譜數(shù)據(jù)來(lái)進(jìn)行預(yù)測(cè),至少?zèng)]有考慮到系統(tǒng)誤差影響因素e1對(duì)血糖濃度預(yù)測(cè)的影響。然而,與已有的血糖濃度預(yù)測(cè)模型相比,根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)模型不僅考慮到了系統(tǒng)誤差影響因素e1還考慮到系統(tǒng)誤差影響因素e3。在實(shí)驗(yàn)研究過(guò)程中,工作人員將基于“m+n”理論的血糖濃度預(yù)測(cè)模型與傳統(tǒng)的血糖濃度預(yù)測(cè)模型的預(yù)測(cè)精度進(jìn)行了對(duì)比分析。
根據(jù)本發(fā)明的實(shí)施例,基于“m+n”理論的血糖濃度預(yù)測(cè)模型的血糖濃度預(yù)測(cè)值和血糖濃度真值的相關(guān)系數(shù)為0.9295,相對(duì)誤差為±0.0888;而傳統(tǒng)的血糖濃度預(yù)測(cè)模型的血糖濃度預(yù)測(cè)值和血糖濃度真值的相關(guān)系數(shù)為0.8285,相對(duì)誤差為±0.1493。上述數(shù)據(jù)表明:就預(yù)測(cè)精度而言,基于“m+n”理論的血糖濃度預(yù)測(cè)方法優(yōu)于傳統(tǒng)預(yù)測(cè)方法。圖5示出了根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)值、傳統(tǒng)的血糖濃度預(yù)測(cè)值與血糖濃度真值之間的比較的圖表。圖6示出了根據(jù)本發(fā)明的實(shí)施例的基于“m+n”理論的血糖濃度預(yù)測(cè)值與真值的相對(duì)誤差的曲線(xiàn)圖。
“m+n”理論從誤差理論的角度闡明了在光譜分析中m種非測(cè)量組分(即“m”因素)和n種外界干擾因素(即“n”因素)對(duì)預(yù)測(cè)精度的影響?;凇癿+n”理論的血糖濃度預(yù)測(cè)方法將被測(cè)對(duì)象和其它影響因素一同歸于整個(gè)預(yù)測(cè)模型中,全面綜合地考慮了m因素和n因素對(duì)血糖濃度預(yù)測(cè)精度的影響。本發(fā)明的實(shí)施例通過(guò)將“m”因素中的系統(tǒng)誤差影響因素e1納入血糖濃度模型,并利用單沿提取法減小“n”因素中的接觸壓力對(duì)血糖濃度預(yù)測(cè)值帶來(lái)的不良影響,使得血糖濃度預(yù)測(cè)精度得以提高。通過(guò)對(duì)比分析,可以發(fā)現(xiàn)基于“m+n”理論的血糖濃度預(yù)測(cè)方法可以達(dá)到較好的預(yù)測(cè)精度。
上述實(shí)施例中的實(shí)施方案可以進(jìn)一步組合或者替換,且實(shí)施例僅僅是對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行描述,并非對(duì)本發(fā)明的構(gòu)思和范圍進(jìn)行限定,在不脫離本發(fā)明設(shè)計(jì)思想的前提下,本領(lǐng)域中專(zhuān)業(yè)技術(shù)人員對(duì)本發(fā)明的技術(shù)方案做出的各種變化和改進(jìn),均屬于本發(fā)明的保護(hù)范圍。