本發(fā)明屬于生物醫(yī)學(xué)與信息學(xué)的交叉領(lǐng)域,具體涉及一種基于集成學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的在線精神疲勞評(píng)估裝置及方法。
背景技術(shù):
由于社會(huì)競(jìng)爭(zhēng)壓力大,精神疲勞逐漸成為了影響人體健康的主要原因之一。精神疲勞會(huì)引起人在生理與心理狀態(tài)上的變化,導(dǎo)致警覺性、持續(xù)性注意力、工作記憶力,判斷力、決策制定等能力的下降。在現(xiàn)代社會(huì)中,特別是諸如實(shí)時(shí)監(jiān)控、交通運(yùn)輸、高危作業(yè)、航空航天等作業(yè)情況下,工作人員如果處于疲勞的狀態(tài),非常容易出現(xiàn)隨意操作和違章行為,從而引發(fā)安全事故。因此,研究客觀、可靠、準(zhǔn)確的精神疲勞檢測(cè)方法對(duì)于防范由精神疲勞引發(fā)的安全事故和維護(hù)人體的健康狀態(tài)是十分必要的,具有極大的經(jīng)濟(jì)和社會(huì)價(jià)值。
腦電信號(hào)能夠客觀的記錄大腦機(jī)能狀態(tài)的連續(xù)變化,是人腦思維活動(dòng)、認(rèn)知和意識(shí)狀態(tài)的一種外在表現(xiàn)。采用各種高效的信號(hào)處理技術(shù)可以挖掘腦電信號(hào)所蘊(yùn)涵的豐富信息,實(shí)現(xiàn)對(duì)疲勞狀態(tài)的判定與評(píng)估。因此基于腦電信號(hào)分析的客觀評(píng)估方法被認(rèn)為是最有前途、最可預(yù)報(bào)和最可靠的途徑。
圍繞基于腦電信號(hào)實(shí)現(xiàn)人的精神疲勞狀態(tài)檢測(cè)的這一思路,研究者們已經(jīng)開展了廣泛的研究。但發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)中存在以下的不足:
對(duì)疲勞狀態(tài)的評(píng)估,傳統(tǒng)上是采用基于監(jiān)督學(xué)習(xí)的分類器來實(shí)現(xiàn),這就需要對(duì)受試者進(jìn)行長(zhǎng)時(shí)間的訓(xùn)練來獲取大量標(biāo)記的腦電樣本,以構(gòu)建可靠的分類器。并且當(dāng)標(biāo)記的訓(xùn)練樣本較少時(shí),所獲得的分類器的泛化能力往往較差。此外,在訓(xùn)練期間構(gòu)建的分類器在工作期間是固化的,不具有自適應(yīng)性。
技術(shù)實(shí)現(xiàn)要素:
鑒于此,本發(fā)明的目的是提供一種自適應(yīng)的精神疲勞評(píng)估裝置及方法。本發(fā)明提出利用選擇性集成技術(shù)為半監(jiān)督評(píng)估模型訓(xùn)練一組速度快、具有差異性的基分類器作為初始分類器,在線并行更新,進(jìn)而集成強(qiáng)分類器,以保障分類器在更新過程中泛化能力的增強(qiáng),同時(shí)取得高的分類精度和快的運(yùn)行速度。
本發(fā)明的目的之一是通過以下技術(shù)方案實(shí)現(xiàn)的,一種自適應(yīng)的精神疲勞評(píng)估方法,包括
1)采集腦電信號(hào)構(gòu)成腦電樣本;
2)對(duì)采集到的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息;
3)利用訓(xùn)練好的初始基分類器對(duì)在線采集到的腦電樣本進(jìn)行預(yù)測(cè),通過多數(shù)投票的策略選擇預(yù)測(cè)結(jié)果,對(duì)樣本進(jìn)行標(biāo)記,給出當(dāng)前的疲勞狀態(tài)評(píng)估結(jié)果。
進(jìn)一步,還包括:
4)計(jì)算步驟3)中標(biāo)記過的樣本的置信度,從標(biāo)記過的樣本中選擇具有高置信度的樣本加入到臨時(shí)訓(xùn)練集中;
5)利用更新的訓(xùn)練集重新訓(xùn)練三個(gè)基分類器,再利用更新后的基分類器對(duì)新采集的未標(biāo)記腦電樣本進(jìn)行預(yù)測(cè)和標(biāo)記。
進(jìn)一步,利用訓(xùn)練好的初始基分類器對(duì)在線采集到的腦電樣本進(jìn)行預(yù)測(cè),其中所述基分類器通過以下方式獲?。?/p>
1)在疲勞或者不疲勞狀態(tài)下采集腦電信號(hào)構(gòu)成腦電樣本,并對(duì)腦電信號(hào)所屬狀態(tài)進(jìn)行標(biāo)記,所屬狀態(tài)包括疲勞狀態(tài)和非疲勞狀態(tài);
2)對(duì)采集到的標(biāo)記了所屬狀態(tài)的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息;
3)對(duì)有標(biāo)記的腦電樣本組成的訓(xùn)練數(shù)據(jù)集進(jìn)行多次樣本抽取,產(chǎn)生不同的子訓(xùn)練集;選擇fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析作為基分類器,利用不同的子訓(xùn)練集分別對(duì)三種基分類器進(jìn)行訓(xùn)練,得到初始基分類器。
進(jìn)一步,置信度高低的判別方法為:利用訓(xùn)練集中的樣本確定類別1和類別2的置信度閾值,計(jì)算過程為:
a)分別按照由fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析所決定的投影方向?qū)τ?xùn)練集中的樣本進(jìn)行投影,再分別計(jì)算投影空間中兩類樣本的均值mji,其中j=1,2,3,分別代表三種投影方向,i=1,2,代表兩種類別;
b)分別在三種投影空間中,計(jì)算當(dāng)前訓(xùn)練集中的各個(gè)樣本與所屬類別的類均值mji之間的歐式距離,然后分別計(jì)算兩種類別的樣本與所屬類別的類均值之間的平均歐式距離dj1和dj2;
c)在各個(gè)投影空間中,計(jì)算類別1和類別2各自的置信度閾值cji=wji●dji,其中,wji表示權(quán)系數(shù);
在由對(duì)未標(biāo)記樣本進(jìn)行預(yù)測(cè)時(shí)取得相同預(yù)測(cè)結(jié)果的兩種分類器所決定的兩個(gè)投影空間中,分別計(jì)算該樣本的投影與投影空間中兩類類均值之間的歐氏距離dji,如果在兩個(gè)投影空間中,均有dji≤cji成立,則該樣本屬于高置信度樣本;反之,如果在其中的任意一個(gè)投影空間中,有dji﹥cji成立,則認(rèn)為該樣本屬于低置信度樣本。
本發(fā)明的目的之二是通過以下技術(shù)方案實(shí)現(xiàn)的,一種自適應(yīng)的精神疲勞評(píng)估裝置,包括第一腦電樣本采集模塊、第一特征信息提取模塊和狀態(tài)評(píng)估模塊;
所述第一腦電樣本采集模塊,采集腦電信號(hào)構(gòu)成腦電樣本;
所述第一特征信息提取模塊,對(duì)采集到的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息;
所述狀態(tài)評(píng)估模塊,利用訓(xùn)練好的初始基分類器對(duì)在線采集到的腦電樣本進(jìn)行預(yù)測(cè),通過多數(shù)投票的策略選擇預(yù)測(cè)結(jié)果,對(duì)樣本進(jìn)行標(biāo)記,給出當(dāng)前的疲勞狀態(tài)評(píng)估結(jié)果。
進(jìn)一步,還包括訓(xùn)練集更新模塊和分類器更新模塊,
所述訓(xùn)練集更新模塊,用于計(jì)算標(biāo)記過的樣本的置信度,從標(biāo)記過的樣本中選擇具有高置信度的樣本加入到訓(xùn)練集中;
所述分類器更新模塊,利用更新的訓(xùn)練集重新訓(xùn)練三個(gè)基分類器,再利用更新后的基分類器對(duì)新采集的未標(biāo)記腦電樣本進(jìn)行預(yù)測(cè)和標(biāo)記。
進(jìn)一步,還包括第二腦電樣本采集模塊、第二特征信息提取模塊和基分類器訓(xùn)練模塊;
所述第二腦電樣本采集模塊,在疲勞或者不疲勞狀態(tài)下采集腦電信號(hào)構(gòu)成腦電樣本,并對(duì)腦電信號(hào)所屬狀態(tài)進(jìn)行標(biāo)記,所屬狀態(tài)包括疲勞狀態(tài)和非疲勞狀態(tài);
所述第二特征信息提取模塊,對(duì)采集到的標(biāo)記了所屬狀態(tài)的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息;
所述基分類器訓(xùn)練模塊,通過對(duì)由有標(biāo)記的腦電樣本組成的訓(xùn)練數(shù)據(jù)集進(jìn)行多次樣本抽取,產(chǎn)生不同的子訓(xùn)練集;選擇fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析作為基分類器,利用不同的子訓(xùn)練集分別對(duì)三種基分類器進(jìn)行訓(xùn)練,得到初始基分類器。
進(jìn)一步,所述訓(xùn)練集更新模塊包括置信度計(jì)算模塊,所述置信度計(jì)算模塊利用訓(xùn)練集中的樣本確定類別1和類別2的置信度閾值,計(jì)算過程為:
a)分別按照由fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析所決定的投影方向?qū)τ?xùn)練集中的樣本進(jìn)行投影,再分別計(jì)算投影空間中兩類樣本的均值mji,其中j=1,2,3,分別代表三種投影方向,i=1,2,代表兩種類別;
b)分別在三種投影空間中,計(jì)算當(dāng)前訓(xùn)練集中的各個(gè)樣本與所屬類別的類均值mji之間的歐式距離,然后分別計(jì)算兩種類別的樣本與所屬類別的類均值之間的平均歐式距離dj1和dj2;
c)在各個(gè)投影空間中,計(jì)算類別1和類別2各自的置信度閾值cji=wji●dji,其中,wji表示權(quán)系數(shù);
在由對(duì)未標(biāo)記樣本進(jìn)行預(yù)測(cè)時(shí)取得相同預(yù)測(cè)結(jié)果的兩種分類器所決定的兩個(gè)投影空間中,分別計(jì)算該樣本的投影與投影空間中兩類類均值之間的歐氏距離dji,如果在兩個(gè)投影空間中,均有dji≤cji成立,則該樣本屬于高置信度樣本;反之,如果在其中的任意一個(gè)投影空間中,有dji﹥cji成立,則認(rèn)為該樣本屬于低置信度樣本。
由于采用了上述技術(shù)方案,本發(fā)明具有如下的優(yōu)點(diǎn):
本發(fā)明提供了一種基于集成和半監(jiān)督學(xué)習(xí)的自適應(yīng)精神疲勞評(píng)估方法,其優(yōu)點(diǎn)主要體現(xiàn)在以下三個(gè)方面:
1)本發(fā)明可利用未標(biāo)記腦電樣本對(duì)分類器進(jìn)行訓(xùn)練,降低了疲勞評(píng)估模型對(duì)有標(biāo)記腦電樣本的需求數(shù)量,從而大大縮短了受試者的訓(xùn)練時(shí)間;
2)本發(fā)明基于集成學(xué)習(xí)的思想來訓(xùn)練基分類器,并將弱分類器集成為強(qiáng)分類器,獲得比單一分類器更高的分類正確率和更好的泛化能力;
3)本發(fā)明可從在線采集的未標(biāo)記腦電樣本中,選擇具有高置信度的樣本來更新訓(xùn)練集,進(jìn)而對(duì)分類器進(jìn)行更新,具有在線自適應(yīng)的特點(diǎn)。
附圖說明
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,其中:
圖1為本發(fā)明所述的精神疲勞評(píng)估方法框圖;
圖2為實(shí)現(xiàn)本發(fā)明所述方法的訓(xùn)練階段的程序流程圖;
圖3為實(shí)現(xiàn)本發(fā)明所述方法的評(píng)估階段的程序流程圖。
具體實(shí)施方式
以下將結(jié)合附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述;應(yīng)當(dāng)理解,優(yōu)選實(shí)施例僅為了說明本發(fā)明,而不是為了限制本發(fā)明的保護(hù)范圍。
本發(fā)明提出了一種自適應(yīng)的在線評(píng)估裝置及方法,利用半監(jiān)督學(xué)習(xí)模式使分類器在僅需要少量標(biāo)記樣本,并充分利用大量未標(biāo)記樣本的同時(shí),又具有在線自適應(yīng)的特點(diǎn)。半監(jiān)督學(xué)習(xí)模式雖然可以利用未標(biāo)記樣本進(jìn)行學(xué)習(xí),但利用未標(biāo)記樣本訓(xùn)練分類器也可能造成泛化能力降低。鑒于此,本發(fā)明提出利用選擇性集成技術(shù)為半監(jiān)督評(píng)估模型訓(xùn)練一組速度快、具有差異性的基分類器作為初始分類器,在線并行更新,進(jìn)而集成強(qiáng)分類器,以保障分類器在更新過程中泛化能力的增強(qiáng),同時(shí)取得高的分類精度和快的運(yùn)行速度。
參見圖1,本發(fā)明所述精神疲勞評(píng)估方法包括了訓(xùn)練和評(píng)估兩個(gè)實(shí)現(xiàn)階段。
在訓(xùn)練階段,首先需要在疲勞或者不疲勞狀態(tài)下,從fp1、fp2、fpz處采集標(biāo)記了所屬狀態(tài)的兩類腦電信號(hào)構(gòu)成腦電樣本,利用標(biāo)記樣本構(gòu)成的訓(xùn)練集來訓(xùn)練基分類器(基本流程如圖2所示),訓(xùn)練過程如下:
1)對(duì)訓(xùn)練集中的腦電樣本進(jìn)行帶通濾波,濾波截止頻率為30hz,提取δ(0-4hz)、θ(4-8hz)、α(8-13hz)和β(13-30hz)這四個(gè)腦電節(jié)律信號(hào)。
2)計(jì)算δ、θ、α和β四個(gè)節(jié)律的能量eδ,eθ,eα,eβ,計(jì)算總能量:
計(jì)算θ、α、β的相對(duì)能量:
pj=ej/etotal,j=δ,θ,α,β
以及能量比值:(eθ+eα)/eβ
以δ、θ、α三個(gè)節(jié)律相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息,從三通道腦電數(shù)據(jù)可得到包含12個(gè)特征值的特征向量。
3)為保證基分類器之間的差異性,對(duì)有標(biāo)記的腦電樣本組成的訓(xùn)練數(shù)據(jù)集進(jìn)行多次樣本抽取,產(chǎn)生三個(gè)不同的子訓(xùn)練集,用于訓(xùn)練初始基分類器,以保證基分類器之間的差異性。采用步驟1)和步驟2)所述方法對(duì)各子訓(xùn)練集中的樣本進(jìn)行濾波和特征提取后,分別用于訓(xùn)練fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析這三種分類器。訓(xùn)練好的三個(gè)基分類器將作為實(shí)際評(píng)估過程中的初始基分類器。
fisher辨別分析找出使類間離散度最大而類內(nèi)離散度最小的投影方向?qū)颖具M(jìn)行投影后分類。基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析通過核函數(shù)所定義的映射關(guān)系,將提取的12個(gè)特征值的特征向量映射到一個(gè)高維特征空間中,然后在高維空間中利用fisher辨別分析進(jìn)行分類。
在評(píng)估階段,利用訓(xùn)練的分類器對(duì)采集的未標(biāo)記腦電樣本進(jìn)行預(yù)測(cè),并選擇其中具有高置信度的樣本用于更新訓(xùn)練集和分類器(基本流程如圖3所示),具體的評(píng)估過程如下所述:
1)對(duì)采集的未標(biāo)記腦電樣本進(jìn)行如訓(xùn)練階段的步驟1)和步驟2)所述的帶通濾波和特征提取。
2)利用訓(xùn)練好的三個(gè)基分類器分別對(duì)在上一步中提取的未標(biāo)記腦電樣本的特征進(jìn)行分類,即對(duì)采集的未標(biāo)記腦電樣本進(jìn)行預(yù)測(cè)。按照多數(shù)投票的策略確定最終的預(yù)測(cè)結(jié)果,并對(duì)該腦電樣本做相應(yīng)的標(biāo)記,給出當(dāng)前的疲勞狀態(tài)評(píng)估結(jié)果。
3)計(jì)算標(biāo)記后的樣本的置信度,選擇高置信度的樣本加入到訓(xùn)練集中。
首先需要利用訓(xùn)練集中的樣本確定類別1和類別2的置信度閾值,計(jì)算過程為:
a)分別按照由fisher辨別分析,基于高斯徑向基核函數(shù)的核fisher辨別分析,和基于線性核函數(shù)的核fisher辨別分析所決定的投影方向?qū)τ?xùn)練集中的樣本進(jìn)行投影,再分別計(jì)算投影空間中兩類樣本的均值mji,其中j=1,2,3,分別代表三種投影方向,i=1,2,代表兩種類別;
b)分別在三種投影空間中,計(jì)算當(dāng)前訓(xùn)練集中的各個(gè)樣本與所屬類別的類均值mji之間的歐式距離,然后分別計(jì)算兩種類別的樣本與所屬類別的類均值之間的平均歐式距離dj1和dj2(j=1,2,3);
c)在各個(gè)投影空間中,計(jì)算類別1和類別2各自的置信度閾值cji=wji●dji,其中,權(quán)系數(shù)wji的值是通過k折-交叉驗(yàn)證的方法來確定的。
在由對(duì)未標(biāo)記樣本進(jìn)行預(yù)測(cè)時(shí)取得相同預(yù)測(cè)結(jié)果的兩種分類器所決定的兩個(gè)投影空間中(如果三種分類器的預(yù)測(cè)結(jié)果均相同,也只選其中兩種分類器決定的兩個(gè)投影空間),分別計(jì)算該樣本的投影與投影空間中兩類類均值之間的歐氏距離dji(j=1,2,3;i=1,2),并與相應(yīng)的兩個(gè)類別的置信度閾值cji進(jìn)行比較。如果在兩個(gè)投影空間中,均有dji≤cji成立,則該樣本屬于高置信度樣本。樣本及其對(duì)應(yīng)預(yù)測(cè)類別將被放入臨時(shí)樣本集g中,用于擴(kuò)大訓(xùn)練集。反之,如果在其中的任意一個(gè)投影空間中,有dji﹥cji成立,則認(rèn)為該樣本屬于低置信度樣本,將不被選用。
4)訓(xùn)練集和基分類器的更新。當(dāng)臨時(shí)樣本集g中的高置信度樣本的數(shù)量達(dá)到設(shè)定的數(shù)量值k時(shí),將臨時(shí)樣本集g中標(biāo)記過的樣本全部加入到訓(xùn)練集中,利用更新后的訓(xùn)練集重新訓(xùn)練三個(gè)基分類器。
利用更新后的基分類器預(yù)測(cè)新采集的未標(biāo)記腦電樣本,重復(fù)如前所述的評(píng)估過程。
根據(jù)上述方法,本發(fā)明還提供一種自適應(yīng)的精神疲勞評(píng)估裝置,包括第一腦電樣本采集模塊、第一特征信息提取模塊、狀態(tài)評(píng)估模塊、訓(xùn)練集更新模塊、分類器更新模塊、第二腦電樣本采集模塊、第二特征信息提取模塊和基分類器訓(xùn)練模塊。
所述第一腦電樣本采集模塊,采集腦電信號(hào)構(gòu)成腦電樣本。
所述第一特征信息提取模塊,對(duì)采集到的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息。
在本實(shí)施例中,濾波截止頻率為30hz,提取δ(0-4hz)、θ(4-8hz)、α(8-13hz)和β(13-30hz)這四個(gè)腦電節(jié)律信號(hào)。
利用δ、θ、α和β四個(gè)節(jié)律的能量eδ,eθ,eα,eβ,計(jì)算總能量:
θ、α、β的相對(duì)能量:
pj=ej/etotal,j=δ,θ,α,β
以及能量比值:(eθ+eα)/eβ。
所述狀態(tài)評(píng)估模塊,利用訓(xùn)練好的初始基分類器對(duì)在線采集到的腦電樣本進(jìn)行預(yù)測(cè),通過多數(shù)投票的策略選擇預(yù)測(cè)結(jié)果,對(duì)樣本進(jìn)行標(biāo)記,給出當(dāng)前的疲勞狀態(tài)評(píng)估結(jié)果。
所述訓(xùn)練集更新模塊,用于計(jì)算標(biāo)記過的樣本的置信度,從標(biāo)記過的樣本中選擇具有高置信度的樣本加入到訓(xùn)練集中。
所述分類器更新模塊,利用更新的訓(xùn)練集重新訓(xùn)練三個(gè)基分類器,再利用更新后的基分類器對(duì)新采集的未標(biāo)記腦電樣本進(jìn)行預(yù)測(cè)和標(biāo)記。
所述第二腦電樣本采集模塊,在疲勞或者不疲勞狀態(tài)下采集腦電信號(hào)構(gòu)成腦電樣本,并對(duì)腦電信號(hào)所屬狀態(tài)進(jìn)行標(biāo)記,所屬狀態(tài)包括疲勞狀態(tài)和非疲勞狀態(tài)。
所述第二特征信息提取模塊,對(duì)采集到的標(biāo)記了所屬狀態(tài)的腦電信號(hào)進(jìn)行低通濾波,提取δ、θ、α和β四個(gè)不同的腦電節(jié)律信號(hào),然后以δ、θ、α三個(gè)節(jié)律信號(hào)的相對(duì)能量和能量比值作為各通道腦電信號(hào)的特征信息。
所述基分類器訓(xùn)練模塊,通過對(duì)由有標(biāo)記的腦電樣本組成的訓(xùn)練數(shù)據(jù)集進(jìn)行多次樣本抽取,產(chǎn)生不同的子訓(xùn)練集;選擇fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析作為基分類器,利用不同的子訓(xùn)練集分別對(duì)三種基分類器進(jìn)行訓(xùn)練,得到初始基分類器。
所述訓(xùn)練集更新模塊包括置信度計(jì)算模塊,所述置信度計(jì)算模塊利用訓(xùn)練集中的樣本確定類別1和類別2的置信度閾值,計(jì)算過程為:
a)分別按照由fisher辨別分析、基于高斯徑向基核函數(shù)的核fisher辨別分析和基于線性核函數(shù)的核fisher辨別分析所決定的投影方向?qū)τ?xùn)練集中的樣本進(jìn)行投影,再分別計(jì)算投影空間中兩類樣本的均值mji,其中j=1,2,3,分別代表三種投影方向,i=1,2,代表兩種類別;
b)分別在三種投影空間中,計(jì)算當(dāng)前訓(xùn)練集中的各個(gè)樣本與所屬類別的類均值mji之間的歐式距離,然后分別計(jì)算兩種類別的樣本與所屬類別的類均值之間的平均歐式距離dj1和dj2;
c)在各個(gè)投影空間中,計(jì)算類別1和類別2各自的置信度閾值cji=wji·dji,其中,wji表示權(quán)系數(shù);
在由對(duì)未標(biāo)記樣本進(jìn)行預(yù)測(cè)時(shí)取得相同預(yù)測(cè)結(jié)果的兩種分類器所決定的兩個(gè)投影空間中,分別計(jì)算該樣本的投影與投影空間中兩類類均值之間的歐氏距離dji,如果在兩個(gè)投影空間中,均有dji≤cji成立,則該樣本屬于高置信度樣本;反之,如果在其中的任意一個(gè)投影空間中,有dji﹥cji成立,則認(rèn)為該樣本屬于低置信度樣本。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并不用于限制本發(fā)明,顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。