本發(fā)明屬于身份識(shí)別領(lǐng)域,具體涉及一種基于遺傳算法降維的腦電身份識(shí)別方法。
背景技術(shù):
:現(xiàn)有的利用腦電信號(hào)作身份識(shí)別的方法仍然較少,基本是在頻域內(nèi)對(duì)腦電數(shù)據(jù)進(jìn)行分析,提取某一波段的腦電信號(hào),利用時(shí)間序列模型(ar、bl)擬合腦電數(shù)據(jù),將擬合后的模型參數(shù)提取作為腦電信號(hào)的特征參數(shù),之后經(jīng)過(guò)pca降維處理或挑選數(shù)個(gè)電極,直接簡(jiǎn)單地使用支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)等單一結(jié)構(gòu)的學(xué)習(xí)機(jī)來(lái)進(jìn)行腦電身份識(shí)別?,F(xiàn)有技術(shù)存在以下的缺點(diǎn):1、對(duì)于ar或bl模型階數(shù)的估計(jì),當(dāng)前普遍使用aic準(zhǔn)則或經(jīng)驗(yàn)估計(jì)。雖然aic準(zhǔn)則在模型定階方面有諸多優(yōu)點(diǎn),但模型研究結(jié)果表明如果對(duì)數(shù)據(jù)進(jìn)行自回歸模型擬合,它可能會(huì)使階數(shù)p估計(jì)過(guò)高,同時(shí),aic準(zhǔn)則得到的階數(shù)不是相容的。2、傳統(tǒng)方法中,由于pca降維和降維后的特征識(shí)別是兩步分開進(jìn)行的,pca沒(méi)有很好地和特征識(shí)別緊密聯(lián)系在一起,導(dǎo)致腦電數(shù)據(jù)在pca降維過(guò)程中可能舍去了真正有益于身份識(shí)別的特征,可能使得腦電數(shù)據(jù)的身份識(shí)別效果降低。3、腦電信號(hào)中噪聲大小不一,雖然對(duì)腦電數(shù)據(jù)濾波后進(jìn)行特征參數(shù)提取能較好地識(shí)別個(gè)體的腦電數(shù)據(jù),但是正確識(shí)別率大多為85%~90%。如專利號(hào)cn201010193832.1中提出的腦電身份識(shí)別方法,其最高識(shí)別率為86.7%。4、當(dāng)前多數(shù)方法在經(jīng)過(guò)降維處理后數(shù)據(jù)的運(yùn)算量仍然很大。挑選數(shù)個(gè)與刺激事件較為相關(guān)的電極的信號(hào)進(jìn)行處理雖然能有效降低運(yùn)算量同時(shí)保持有較好的識(shí)別效果,但是這樣人工挑選出來(lái)的電極信號(hào)不一定能使分類器的訓(xùn)練效果達(dá)到最好,從而其識(shí)別率不一定達(dá)到最優(yōu)。5、現(xiàn)有方法在測(cè)試識(shí)別率時(shí)為閉集驗(yàn)證,現(xiàn)有方法在測(cè)試在閉集驗(yàn)證時(shí)準(zhǔn)確率較高,但是對(duì)于開集驗(yàn)證,要么錯(cuò)誤率過(guò)大,要么就是完全不適用。6、當(dāng)對(duì)識(shí)別率要求較高時(shí),現(xiàn)有技術(shù)對(duì)于腦電信號(hào)的采集要求很高,如2015年論文《基于fawell范式誘發(fā)erp的身份識(shí)別研究》,其最高識(shí)別率可達(dá)98%,但是采集腦電時(shí)受試者需專心注視屏幕上多個(gè)字符,并且在心中默數(shù)目標(biāo)字符閃爍的次數(shù)。為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明的目的是:提供一種具有選擇目的、有效降維的腦電身份識(shí)別方法。該方法在有效降低數(shù)據(jù)維度的同時(shí)又能保留對(duì)腦電識(shí)別有利的信息,使得其保持有更高的識(shí)別率。該方法對(duì)于未曾識(shí)別過(guò)的個(gè)體的腦電數(shù)據(jù)同樣適用,即其在開集驗(yàn)證中仍然保有很高的識(shí)別率。并且其腦電信號(hào)采集對(duì)于受試者的動(dòng)作行為要求較低,受試者只需要靜坐于屏幕前觀察顯示屏即可。同時(shí)利用了bic準(zhǔn)則估計(jì)ar模型的階數(shù),使得階數(shù)p的估計(jì)較低,有效地降低了運(yùn)算量。技術(shù)實(shí)現(xiàn)要素:該發(fā)明方法具體內(nèi)容步驟如下:1腦電數(shù)據(jù)的采集1.1采集的腦電數(shù)據(jù)是受試者在感知顏色時(shí)的腦電信號(hào)。受試者靜坐在電腦屏幕前,觀察電腦所顯示的布滿整個(gè)屏幕的顏色圖片,一次至少采集一個(gè)圖案顯示周期的時(shí)間長(zhǎng)度的數(shù)據(jù)。采集環(huán)境控制光照亮度為適中。其中顏色圖片采用以下方案進(jìn)行提供:紅色t1——過(guò)渡圖片組合t2——綠色t1——過(guò)渡圖片組合t2——藍(lán)色t1——過(guò)渡圖片組合t2;過(guò)渡圖片組合是三原色相等的插圖t2/3、黑色t2/3、白色t2/3,其目的是消除觀察rgb顏色切換時(shí)視野中的顏色殘留。2腦電數(shù)據(jù)的預(yù)處理2.1利用fir濾波器將采集的腦電原始信號(hào)截取出α波段(8~12hz)。2.2對(duì)于采集到的腦電信號(hào),通過(guò)eeglab觀察其波形,將其中信號(hào)波形過(guò)于紊亂的電極剔除,設(shè)剩余電極數(shù)目為k。3利用ar模型提取腦電特征參數(shù)3.1對(duì)每個(gè)試驗(yàn)者的每個(gè)電極通道的腦電數(shù)據(jù),使用最小二乘估計(jì)法得到匹配的ar模型。3.2以匹配的ar模型的參數(shù)作為該段腦電信號(hào)數(shù)據(jù)的特征參數(shù)來(lái)表征這段腦電信號(hào)。說(shuō)明:ar模型的表示如式(1):其中是εt零均值,方差σ2的平穩(wěn)白噪聲過(guò)程。ar模型的階數(shù)p由bic準(zhǔn)則確定。bic準(zhǔn)則函數(shù)定義如式(2):bic(p)=nlnσ2+plnn(2)n是樣本數(shù)據(jù)的長(zhǎng)度,p是最優(yōu)階數(shù)。與aic準(zhǔn)則相比,bic準(zhǔn)則確保了估計(jì)的階具有相容性。設(shè)剩余的每個(gè)電極數(shù)據(jù)的最優(yōu)階數(shù)為pi(1≤i≤k),取估計(jì)的階p=min(pi)。εt和各階系數(shù)ai就是所要提取的腦電特征參數(shù),提取后得到的腦電特征參數(shù)ei是一個(gè)向量數(shù)據(jù),其中1≤i≤k×(p+1)。4建立bp神經(jīng)網(wǎng)絡(luò)的分類器對(duì)提取的腦電特征參數(shù)ei建立bp神經(jīng)網(wǎng)絡(luò)(如下圖1所示),輸入層的節(jié)點(diǎn)數(shù)等于向量ei中元素的個(gè)數(shù),為k×(p+1)個(gè),輸出層節(jié)點(diǎn)1個(gè),輸出為“1”時(shí)代表識(shí)別為“本人”,輸出為“0”時(shí)代表識(shí)別為“他人”。對(duì)于bp分類器的身份識(shí)別,每份數(shù)據(jù)的識(shí)別都是輸出一個(gè)[0,1]的結(jié)果。定義當(dāng)輸出結(jié)果不接近于1或不接近于0時(shí),若輸出結(jié)果大于0.5,認(rèn)為識(shí)別為“1”,若小于等于0.5,認(rèn)為識(shí)別為“0”。5利用遺傳算法(ga)對(duì)腦電參數(shù)進(jìn)行降維5.1利用遺傳算法(ga)對(duì)腦電參數(shù)降維:對(duì)已經(jīng)建立的bp網(wǎng)絡(luò),使用遺傳算法優(yōu)化其輸入節(jié)點(diǎn),即篩選參與訓(xùn)練的腦電特征參數(shù),使得bp神經(jīng)網(wǎng)絡(luò)的分類誤差最小,以提高身份識(shí)別正確率。其流程圖如下圖2所示。5.2ga中產(chǎn)生的初始種群中個(gè)體采用二進(jìn)制編碼,長(zhǎng)度為k×(p+1)位。對(duì)于種群個(gè)體的編碼,其編碼為1的位置對(duì)應(yīng)輸入節(jié)點(diǎn)在訓(xùn)練bp神經(jīng)網(wǎng)絡(luò)時(shí)被保留,編碼為0的位置對(duì)應(yīng)輸入節(jié)點(diǎn)被舍去,不參與bp網(wǎng)絡(luò)的訓(xùn)練。5.3個(gè)體的適應(yīng)度函數(shù)為以該個(gè)體編碼對(duì)應(yīng)的輸入節(jié)點(diǎn)所訓(xùn)練的bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的均方誤差的倒數(shù),即f=1/mse,f是個(gè)體適應(yīng)度,mse是該個(gè)體的編碼對(duì)應(yīng)輸入節(jié)點(diǎn)所訓(xùn)練的bp網(wǎng)絡(luò)的均方誤差。5.4由ga得到的最優(yōu)個(gè)體,其編碼為0的位置對(duì)應(yīng)輸入節(jié)點(diǎn)舍去,編碼為1的位置對(duì)應(yīng)輸入節(jié)點(diǎn)保留。用保留下來(lái)的輸入節(jié)點(diǎn)建立bp神經(jīng)網(wǎng)絡(luò),以此優(yōu)化后的bp神經(jīng)網(wǎng)絡(luò)進(jìn)行腦電身份識(shí)別。6身份識(shí)別情況6.1訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的情況對(duì)于bp網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集的組成,50%是“本人”的腦電數(shù)據(jù),50%是“他人”的腦電數(shù)據(jù);測(cè)試的時(shí)候,測(cè)試數(shù)據(jù)是“本人”腦電數(shù)據(jù)和“他人”腦電數(shù)據(jù)中沒(méi)有參與訓(xùn)練的那部分?jǐn)?shù)據(jù)和開集數(shù)據(jù)組成。6.2分類識(shí)別驗(yàn)證:將“本人”腦電數(shù)據(jù)輸入到優(yōu)化后的bp神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,若識(shí)別輸出值大于0.5,則識(shí)別成功,確定是本人;若輸出值小于等于0.5,則識(shí)別失敗。將“他人”腦電數(shù)據(jù)和開集數(shù)據(jù)輸入到優(yōu)化后的bp神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,若識(shí)別輸出值小于等于0.5,則識(shí)別成功,確定不是本人;若輸出值大于0.5,則識(shí)別失敗。以上步驟的流程圖如圖3所示。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:1、相比于pca降維和降維后的特征識(shí)別是兩步分開進(jìn)行的,pca沒(méi)有很好地和特征識(shí)別緊密聯(lián)系在一起,導(dǎo)致腦電數(shù)據(jù)在pca降維過(guò)程中可能舍去了真正有益于身份識(shí)別的特征,利用遺傳算法(ga)的降維是優(yōu)化篩選bp分類器的輸入層節(jié)點(diǎn),能在有效降低數(shù)據(jù)維度的同時(shí)又保留對(duì)腦電識(shí)別有利的信息,因而識(shí)別率更高;2、此方法對(duì)未曾訓(xùn)練學(xué)習(xí)過(guò)的個(gè)體的腦電數(shù)據(jù)(即開集)仍然適用。實(shí)驗(yàn)結(jié)果顯示,對(duì)于樣本數(shù)據(jù)沒(méi)有參與訓(xùn)練集的受試者,利用ga降維后的bp分類器對(duì)這些受試者的數(shù)據(jù)的識(shí)別正確率顯著提高。這也表明了此種腦電身份識(shí)別方法更具適用性。3、bic準(zhǔn)則的定階能給出相容估計(jì),估計(jì)的階數(shù)p不會(huì)過(guò)高可以有效降低運(yùn)算量。4、腦電信號(hào)的采集對(duì)于受試者的動(dòng)作行為要求較低,受試者只需要靜坐于屏幕前觀察顯示屏即可。附圖說(shuō)明圖1是本發(fā)明中的bp神經(jīng)網(wǎng)絡(luò)分類器原理圖。圖2是本發(fā)明利用遺傳算法ga對(duì)參與bp網(wǎng)絡(luò)訓(xùn)練的腦電參數(shù)進(jìn)行降維的示意圖。圖3是本發(fā)明的種基于遺傳算法降維的腦電身份識(shí)別方法流程圖。圖4是屏幕顏色圖片顯示方案。圖5是過(guò)渡圖片組合的顯示方案示意圖。圖6是對(duì)ei建立的bp神經(jīng)網(wǎng)絡(luò)分類器原理圖。圖7是利用遺傳算法ga對(duì)參與bp網(wǎng)絡(luò)訓(xùn)練的腦電參數(shù)進(jìn)行降維的示意圖。具體實(shí)施方式需要結(jié)合所提供的說(shuō)明書附圖對(duì)本發(fā)明做進(jìn)一步的說(shuō)明。1腦電數(shù)據(jù)的采集a.實(shí)驗(yàn)儀器為brainproduct,brainampmrplus型放大器,采用64導(dǎo)電極帽連續(xù)記錄腦電。b.采集的腦電數(shù)據(jù)是試驗(yàn)者在感知顏色時(shí)的腦電信號(hào):試驗(yàn)者靜坐在電腦屏幕前,觀察電腦所顯示的布滿整個(gè)屏幕的顏色圖片,一次至少采集一個(gè)圖案顯示周期的時(shí)間長(zhǎng)度的數(shù)據(jù),采集環(huán)境控制光照亮度為適中。c.屏幕上顏色圖片的顯示方案是:(1)紅色6s——過(guò)渡圖片組合3s——綠色6s——過(guò)渡圖片組合3s——藍(lán)色6s——過(guò)渡圖片組合3s。一個(gè)周期長(zhǎng)度為27s;(2)其中實(shí)驗(yàn)時(shí)一個(gè)周期中紅色、綠色和藍(lán)色圖片出現(xiàn)的順序是隨機(jī)的;(3)過(guò)渡圖片組合是三原色相等的插圖1s、黑色1s、白色1s,這樣做的目的是消除觀察rgb顏色切換時(shí)視野中的顏色殘留。屏幕顏色的顯示如圖5所示(紅綠藍(lán)的順序是隨機(jī)的):過(guò)渡圖片組合的顯示如圖6(圖片顯示順序是固定的):2腦電信號(hào)預(yù)處理2.1利用fir濾波器將采集的腦電原始信號(hào)截取出α波段(8~12hz)。2.2對(duì)于采集到的腦電信號(hào),通過(guò)eeglab對(duì)波形進(jìn)行分析,將其中信號(hào)波形過(guò)于紊亂的電極剔除,總計(jì)剔除eeg電極o1、o2、fz、veou、heol、heor和m2這7個(gè)通道的數(shù)據(jù)。3利用ar模型提取腦電特征參數(shù)3.1自回歸(ar)模型是常用的時(shí)間序列模型,對(duì)每個(gè)試驗(yàn)者的每個(gè)電極通道的腦電數(shù)據(jù),使用最小二乘估計(jì)法得到匹配的ar模型。3.2以匹配的ar模型的參數(shù)作為該段腦電信號(hào)數(shù)據(jù)的特征參數(shù)來(lái)表征這段腦電信號(hào)。ar模型的表示如下:其中是εt零均值,方差σ2的平穩(wěn)白噪聲過(guò)程。ar模型的階數(shù)由bic準(zhǔn)則確定。bic準(zhǔn)則函數(shù)定義為:bic(p)=nlnσ2+plnnn是樣本數(shù)據(jù)的長(zhǎng)度,p是最優(yōu)階數(shù)。與aic準(zhǔn)則相比,bic準(zhǔn)則確保了估計(jì)的階具有相容性。設(shè)剩余的每個(gè)電極數(shù)據(jù)的最優(yōu)階數(shù)為pi(1≤i≤57),取估計(jì)的階p=min(pi)。εt和各階系數(shù)ai就是所要提取的腦電特征參數(shù),提取后得到的腦電特征參數(shù)ei是一個(gè)向量數(shù)據(jù),其中1≤i≤57×(p+1)。,如下所示:(e1e2…e57×(p+1))實(shí)驗(yàn)驗(yàn)證中,對(duì)于采集到的樣本,由bic準(zhǔn)則得到的階數(shù)p=4,所以每個(gè)份數(shù)據(jù)提取的腦電特征參數(shù)有5個(gè)。至此,對(duì)于某個(gè)采集者的一份樣本數(shù)據(jù),經(jīng)過(guò)提取后的腦電特征參數(shù)ei構(gòu)成一個(gè)長(zhǎng)度為285的向量:(e1e2…e285)4建立bp神經(jīng)網(wǎng)絡(luò)的分類器對(duì)提取的腦電特征參數(shù)ei建立bp神經(jīng)網(wǎng)絡(luò)(如下圖6所示),輸入層的節(jié)點(diǎn)數(shù)等于向量ei中元素的個(gè)數(shù),為285個(gè),輸出層節(jié)點(diǎn)1個(gè),輸出為“1”時(shí)代表識(shí)別為“本人”,輸出為“0”時(shí)代表識(shí)別為“他人”。5利用遺傳算法(ga)對(duì)腦電參數(shù)進(jìn)行降維5.1利用遺傳算法(ga)對(duì)腦電參數(shù)降維:對(duì)上面已經(jīng)建立的bp網(wǎng)絡(luò),使用遺傳算法優(yōu)化其輸入節(jié)點(diǎn),即篩選參與訓(xùn)練的腦電特征參數(shù),使得bp神經(jīng)網(wǎng)絡(luò)的分類誤差最小,以提高身份識(shí)別正確率。其流程圖如下圖7所示。5.2ga中產(chǎn)生的初始種群中個(gè)體采用二進(jìn)制編碼,長(zhǎng)度為285位。對(duì)于種群個(gè)體的編碼,其編碼為1的位置對(duì)應(yīng)輸入節(jié)點(diǎn)在訓(xùn)練bp神經(jīng)網(wǎng)絡(luò)時(shí)被保留,編碼為0的位置對(duì)應(yīng)輸入節(jié)點(diǎn)被舍去,不參與bp網(wǎng)絡(luò)的訓(xùn)練。5.3個(gè)體的適應(yīng)度函數(shù)為以該個(gè)體編碼對(duì)應(yīng)的輸入節(jié)點(diǎn)所訓(xùn)練的bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的均方誤差的倒數(shù),即f=1/mse,f是個(gè)體適應(yīng)度,mse是該個(gè)體的編碼對(duì)應(yīng)輸入節(jié)點(diǎn)所訓(xùn)練的網(wǎng)絡(luò)的均方誤差。5.4由ga得到的最優(yōu)個(gè)體,其編碼為0的位置對(duì)應(yīng)輸入節(jié)點(diǎn)舍去,編碼為1的位置對(duì)應(yīng)輸入節(jié)點(diǎn)保留,以保留下來(lái)的輸入節(jié)點(diǎn)建立bp神經(jīng)網(wǎng)絡(luò),以此優(yōu)化后的bp神經(jīng)網(wǎng)絡(luò)進(jìn)行腦電身份識(shí)別。5.5實(shí)驗(yàn)中,通過(guò)遺傳算法優(yōu)化得到一個(gè)含148個(gè)元素的特征參數(shù)向量。以篩選出來(lái)的148個(gè)輸入節(jié)點(diǎn)建立優(yōu)化的bp神經(jīng)網(wǎng)絡(luò),隱含層節(jié)點(diǎn)取15個(gè),輸出層節(jié)點(diǎn)1個(gè),輸出為“1”時(shí)代表識(shí)別為“本人”,輸出為“0”時(shí)代表識(shí)別為“他人”。其中,當(dāng)輸出結(jié)果大于0.5時(shí),視為輸出“1”,當(dāng)輸出結(jié)果小于或等于0.5時(shí),視為輸出“0”。利用遺傳算法(ga)優(yōu)化bp神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點(diǎn),使得(1)輸入層節(jié)點(diǎn)數(shù)減少,降低了運(yùn)算量;(2)bp網(wǎng)絡(luò)擬合的誤差降低。實(shí)驗(yàn)結(jié)果表示,對(duì)于樣本數(shù)據(jù)沒(méi)有參與訓(xùn)練集的受試者,利用ga降維后的bp分類器對(duì)這些受試者的數(shù)據(jù)的識(shí)別正確率顯著提高。6以優(yōu)化后的bp網(wǎng)絡(luò)進(jìn)行身份識(shí)別a.對(duì)于bp網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集的組成,50%是“本人”的腦電數(shù)據(jù),50%是“他人”的腦電數(shù)據(jù);實(shí)驗(yàn)測(cè)試的時(shí)候,測(cè)試數(shù)據(jù)是“本人”腦電數(shù)據(jù)和“他人”腦電數(shù)據(jù)中沒(méi)有參與訓(xùn)練的那部分和開集數(shù)據(jù)組成。b.每個(gè)樣本有59份數(shù)據(jù)。實(shí)驗(yàn)重復(fù)進(jìn)行多次,樣本每次分配為訓(xùn)練集和測(cè)試集的數(shù)據(jù)是隨機(jī)的。每次實(shí)驗(yàn)中訓(xùn)練集與測(cè)試集情況如下表1和表2:表1.訓(xùn)練集情況數(shù)據(jù)樣本份數(shù)總占比(%)第一號(hào)樣本40份50%第二號(hào)~第五號(hào)樣本各10份50%表2.測(cè)試集情況數(shù)據(jù)情況份數(shù)總占比(%)第一號(hào)樣本19份5.71%第二號(hào)~第五號(hào)樣本各49份58.86%六號(hào)、七號(hào)樣本各59份35.43%實(shí)驗(yàn)驗(yàn)證情況:可以看出經(jīng)過(guò)ga優(yōu)化后,對(duì)“他人”的數(shù)據(jù)識(shí)別率有效地提高了。由驗(yàn)證情況,可以看出經(jīng)過(guò)ga優(yōu)化后的bp神經(jīng)網(wǎng)絡(luò)能有效提高對(duì)于未曾學(xué)習(xí)訓(xùn)練過(guò)的樣本的數(shù)據(jù)的識(shí)別率(由64.69%提高至90.49%),從而提高了總體的識(shí)別率。同樣驗(yàn)證了此種腦電身份識(shí)別方法能有效地識(shí)別未曾學(xué)習(xí)過(guò)的個(gè)體的腦電數(shù)據(jù),適用性更強(qiáng)。當(dāng)前第1頁(yè)12