亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于集成支持向量機的P300拼寫器的訓(xùn)練集擴展方法與流程

文檔序號:11250451閱讀:1030來源:國知局
一種基于集成支持向量機的P300拼寫器的訓(xùn)練集擴展方法與流程

本發(fā)明涉及一種集成支持向量機的訓(xùn)練集擴展方法,具體為一種基于集成支持向量機的p300拼寫器的訓(xùn)練集擴展方法。



背景技術(shù):

腦機接口(braincomputerinterface,bci)是在人腦和計算機或其他電子設(shè)備之間建立不依賴與常規(guī)的大腦信息輸出通路(外周神經(jīng)和肌肉組織)的全新對外信息交流和控制的通信系統(tǒng)。腦機接口是一種新穎的人機接口系統(tǒng),其研究具有重要意義:第一,可以為大腦功能健全但身體其他部分運動功能有障礙的人(如肌萎縮側(cè)索硬化癥患者)提供一種新的與外界交流的方式,隨著腦機接口技術(shù)的發(fā)展,將會促進康復(fù)醫(yī)學(xué)領(lǐng)域向更高的層次發(fā)展。第二,隨著當(dāng)前世界各國老齡化趨勢的加劇,腦機接口技術(shù)將為老年人提供生活上的便利。第三,腦機接口技術(shù)的產(chǎn)生,為在高危環(huán)境下(如外太空等)工作的人們提供了一種新的控制設(shè)備的方式,提高了安全保障。另外,腦機接口技術(shù)的發(fā)展將會推動大腦認知模式以及大腦傳遞信息時腦區(qū)的活躍程度的研究,對進一步研究人類大腦提供了新的方法。

基于p300的拼寫器腦機接口系統(tǒng)是目前應(yīng)用最廣泛的腦機接口系統(tǒng)之一。由于其對硬件的要求比較低,誘發(fā)的范式比較簡單,電位的時域特征明顯,并且被試在使用前無需進行大量的訓(xùn)練等優(yōu)勢獲得了良好的效果,具有廣闊的應(yīng)用前景。由于腦電信號非常微弱,且非常容易受到外界環(huán)境的干擾,通常我們要將靶刺激疊加平均多次才能得到穩(wěn)定的p300電位。經(jīng)實驗驗證,在傳統(tǒng)的p300拼寫器腦機接口系統(tǒng)中,疊加15輪之后,字符識別的正確率僅有75%左右。字符傳輸率和字符識別率過低成為該腦機接口系統(tǒng)廣泛應(yīng)用于日常生活中的障礙。

kaufman等人在2011年發(fā)現(xiàn)人在觀察一個熟悉人臉時在f3、f4電極位置記錄到了一個明顯的特征波形,被稱為n400;金晶等人將這個發(fā)現(xiàn)運用到了基于p300的腦機接口刺激誘發(fā)范式上,將傳統(tǒng)的p300腦機接口系統(tǒng)改為了基于名人熟悉人臉的p300拼寫器腦機接口系統(tǒng),即將字符的高亮變?yōu)榱宿D(zhuǎn)換成熟悉人臉。經(jīng)實驗驗證,該p300拼寫器腦機接口系統(tǒng)的分類識別正確率在某些被試中高達91%,取得了較好的效果。

支持向量機作為腦機接口系統(tǒng)的分類算法已經(jīng)被研究者廣泛使用,它在解決非線性和高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢,并在很大程度上克服了“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等問題。作為一種監(jiān)督式學(xué)習(xí)算法,支持向量機需要大量樣本進行訓(xùn)練才能保證系統(tǒng)的分類效果,這需要使用者在使用前花費很長時間來獲取訓(xùn)練集樣本。然而,長時間的腦電數(shù)據(jù)樣本的獲取將使使用者的情緒和身體狀況等諸多因素發(fā)生變化,降低了腦電數(shù)據(jù)質(zhì)量,影響了數(shù)據(jù)的可靠性,從而導(dǎo)致系統(tǒng)的分類性能下降。因此,通過擴展在較短時間內(nèi)獲得的訓(xùn)練集樣本,滿足支持向量機訓(xùn)練的要求是提高系統(tǒng)分類性能的有效手段之一。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的在于提供一種基于集成支持向量機的p300拼寫器腦機接口系統(tǒng)的訓(xùn)練集擴展方法,是針對集成支持向量機需要使用大量的訓(xùn)練集樣本進行訓(xùn)練以確保分類性能的缺陷,提出了通過疊加平均不同兩組腦電信號的方法擴展訓(xùn)練集的樣本數(shù)量的方法。

本發(fā)明的目的可以通過以下技術(shù)方案實現(xiàn):一種基于集成支持向量機的p300拼寫器腦機接口系統(tǒng)訓(xùn)練集擴展方法,其特征在于具體包括以下步驟:

步驟一:使用基于名人熟悉人臉的p300拼寫器腦機接口系統(tǒng)進行eeg腦電數(shù)據(jù)采集獲取訓(xùn)練集樣本;

步驟二:對訓(xùn)練集樣本進行預(yù)處理,包括眼電偽跡去除、波形分段、基線校正、帶通濾波;

步驟三:通過疊加平均不同兩組eeg腦電數(shù)據(jù)的方法進行訓(xùn)練集樣本數(shù)量的擴展;

1)假設(shè)p300拼寫器腦機接口系統(tǒng)界面由m×n的字符矩陣構(gòu)成(mn行),設(shè)每列或行的一次閃爍為一個trial,所有列和行閃爍一次為一個sequence,即一個sequence包含m+n個trial;對應(yīng)一個目標字符的輸入,進行了qq≥2)輪的sequence,被稱為一個run;

2)假設(shè)分別表示由第i個和第j個sequence的第m列閃爍誘發(fā)產(chǎn)生的兩組eeg腦電數(shù)據(jù),相同電極通道的eeg腦電數(shù)據(jù)進行疊加平均為:

,,

同理,假設(shè)分別表示由第i個和第j個sequence的第n行閃爍誘發(fā)產(chǎn)生的兩組eeg腦電數(shù)據(jù),相同電極通道的eeg腦電數(shù)據(jù)進行疊加平均為:

,,

3)從q個sequence中選取兩組,依次對m個列trial對應(yīng)的n個行trial對應(yīng)的按照步驟2)中的公式進行疊加平均,組成一個新的sequence放入訓(xùn)練集中;

4)繼續(xù)從q個sequence中選取兩組,保證至少一組與之前選取的組合不重復(fù)。依次對m個列trial對應(yīng)的n個行trial對應(yīng)的按照步驟2)中的公式進行疊加平均,組成一個新的sequence放入訓(xùn)練集中。

5)重復(fù)步驟4)直到完成種組合,從而訓(xùn)練集中的sequence數(shù)將從q擴展至,eeg腦電信號數(shù)據(jù)將從(m+nq擴展至(m+n。是指從q個sequence中取出2個sequnece的所有組合的個數(shù)。

步驟四:對疊加平均后的eeg腦電數(shù)據(jù)進行降采樣,將降采樣后所有電極的eeg腦電數(shù)據(jù)按照固定的電極順序進行排列形成特征向量;

步驟五:采用集成支持向量機算法對特征向量進行分類,得到系統(tǒng)正確輸入字符的結(jié)果。

本發(fā)明的積極效果是

1.減小使用者的訓(xùn)練時間,從而保證數(shù)據(jù)的可靠性;

2.經(jīng)過處理的波形特征更明顯,有利于接下來的特征提取及分類識別;

3.增強腦機接口系統(tǒng)的實用性。

附圖說明

圖1基于名人熟悉人臉的p300拼寫器腦機接口系統(tǒng)的數(shù)據(jù)處理流程圖。

圖2基于名人熟悉人臉的p300拼寫器腦機接口系統(tǒng)的提示界面。

圖3系統(tǒng)的電極使用配置圖。

圖4系統(tǒng)界面刺激提示的詳細設(shè)計。

圖5訓(xùn)練集擴展前后的系統(tǒng)識別正確率的對比圖。

具體實施方式

下面結(jié)合附圖及具體實施例對本發(fā)明作進一步的詳細說明。

本發(fā)明針對集成支持向量機需要使用大量的訓(xùn)練集樣本進行訓(xùn)練以確保分類性能的缺陷,提出了通過疊加平均不同兩組腦電信號的方法擴展了訓(xùn)練集的樣本數(shù)量的方法,并對該方法做了詳細的數(shù)據(jù)驗證分析。結(jié)果表明,一種基于集成支持向量機的p300拼寫器的訓(xùn)練集擴展方法提高了分類正確率,其性能優(yōu)于未擴展訓(xùn)練集的p300拼寫器腦機接口系統(tǒng)。本發(fā)明縮短了訓(xùn)練集樣本數(shù)據(jù)的獲取時間,提高了腦電信號數(shù)據(jù)可靠性,增強了腦機接口系統(tǒng)的實用性。

如圖1所示,本發(fā)明的基于集成支持向量機的p300拼寫器的訓(xùn)練集擴展方法,具體包含以下步驟:

步驟1.本實施例使用基于名人熟悉人臉的p300拼寫器腦機接口系統(tǒng)獲取17名被試的腦電數(shù)據(jù)作為樣本集。

如圖2所示,該p300拼寫器腦機接口系統(tǒng)的提示界面由36個字符(a-z,0-9)組成6×6的字符矩陣構(gòu)成(6列6行)。

采用neuroscan公司生產(chǎn)的64通道synamps2腦電系統(tǒng)采集腦電數(shù)據(jù),采樣頻率設(shè)置為256赫茲。記錄了14個電極通道(fz、f3、f4、fc1、fc2、cz、c3、c4、pz、p3、p4、o1、o2和oz)的腦電數(shù)據(jù),參考電極(ref)放置在左側(cè)乳突的位置,接地電極(gnd)放置在右耳乳突的位置。腦電數(shù)據(jù)記錄過程中,采用兩對電極分別記錄被試的水平眼電(veog)和垂直眼電(heog)。系統(tǒng)的電極使用配置如圖3所示。

該p300拼寫器腦機接口系統(tǒng)在運行過程中,字符矩陣以行(列)為單位隨機的閃爍,閃爍的時間間隔為250毫秒,其中變亮的時間為200毫秒,后又轉(zhuǎn)為灰色的時間為50毫秒。變亮的同時,在字符上面覆蓋一張半透明的著名球星大衛(wèi)·貝克漢姆的人臉(由于版權(quán)限制,文中展示出的是一名被試的人臉圖片)。

假設(shè)每列或行的一次閃爍為一個trial,所有列和行閃爍一次為一個sequence,即一個sequence包含12個trial(6列+6行)。為方便數(shù)據(jù)處理,6列依次被標記為1-6,6行依次被標記為7-12。對應(yīng)一個目標字符的輸入,進行了q=15輪的sequence,被稱為一個run。數(shù)據(jù)采集過程中,標記每個trial的閃爍開始時刻。在本實施例中,要求被試輸入6個單詞:“clgdx”、“brain”、“short”、“float”、“break”、“while”。每個單詞均由5個字符組成,故輸入一個單詞共需5個run,稱為一個session。每個session之間允許被試休息2-5分鐘。系統(tǒng)界面刺激提示的詳細設(shè)計如圖4所示。

步驟2.對樣本集中的數(shù)據(jù)進行預(yù)處理,包括去除眼電、波形分段、基線校正、帶通濾波。

采用回歸分析算法進行眼電偽跡去除;以每個trial的閃爍開始時刻為零點,以-100毫秒—500毫秒為時間窗對腦電波形進行分段,記為eegp(p=1,2,…,m+n);對應(yīng)一個目標字符,將獲得(6+6)×15=180個eeg腦電數(shù)據(jù)。整個實施例中,共采集180個eeg腦電數(shù)據(jù)×5字符×6單詞=5400個eeg腦電數(shù)據(jù);以-100毫秒—0毫秒為基準對每個eeg腦電數(shù)據(jù)進行基線校正。然后以0.01-30赫茲進行帶通濾波。

步驟3.通過疊加平均不同兩組eeg腦電數(shù)據(jù)的方法進行樣本集的數(shù)量擴展。

1)假設(shè)分別表示同一個run中由第i個和第j個sequence的第m列閃爍誘發(fā)產(chǎn)生的兩組eeg腦電數(shù)據(jù),相同電極通道的eeg腦電數(shù)據(jù)進行疊加平均為:

,,

同理,假設(shè)分別表示同一個run中由第i個和第j個sequence的第n行閃爍誘發(fā)產(chǎn)生的兩組eeg腦電數(shù)據(jù),相同電極通道的eeg腦電數(shù)據(jù)進行疊加平均為:

,,

2)從15個sequence中選取兩組,依次對6個列trial對應(yīng)的和6個行trial對應(yīng)的按照步驟1)中的公式進行疊加平均,組成一個新的sequence放入樣本集中;

3)繼續(xù)從15個sequence中選取兩組,保證至少一組與之前選取的組合不重復(fù)。依次對6個列trial對應(yīng)的和6個行trial對應(yīng)的按照步驟1)中的公式進行疊加平均,組成一個新的sequence放入樣本集中;

4)重復(fù)步驟3)直到完成種組合,從而樣本集中腦電信號的sequence數(shù)從15擴展至=105,eeg腦電數(shù)據(jù)將從(6+6)×15=180擴展至(6+6)×=1260。

本實施例中,取1個session作為訓(xùn)練集,其他5個session作為測試集。因此,訓(xùn)練集經(jīng)過擴展之后,eeg腦電數(shù)據(jù)將從180×5=900擴展至1260×5=6300。

步驟4.對疊加平均后的eeg腦電數(shù)據(jù)進行降采樣,將降采樣后所有電極的eeg腦電數(shù)據(jù)按照固定的電極順序進行排列形成特征向量。

針對每個電極通道,將每個eeg腦電數(shù)據(jù)的采樣率從256赫茲降至64赫茲,即每隔4個點取一個點作為特征值,因此每個電極通道由采樣點構(gòu)成的特征向量長度由原來的128降到了32。然后將14個通道的特征向量按照f3、fz、f4、fc1、fc2、c3、cz、c4、p3、pz、p4、o1、oz、o2的順序首尾相接,作為這個eeg腦電數(shù)據(jù)的特征向量,長度為32×14=448。

步驟五:采用集成支持向量機算法對特征向量進行分類,得到系統(tǒng)正確輸入字符的結(jié)果。

在構(gòu)建集成支持向量機時,為保證子支持向量機間的差異性,我們使用不同的訓(xùn)練集構(gòu)建不同的子支持向量機,這些不同的子訓(xùn)練集均取自相同的樣本集,本實施例中樣本集即為擴展后的訓(xùn)練集。1個session的腦電數(shù)據(jù)用于訓(xùn)練,經(jīng)過上述擴展方法進行擴展后,共有(6+6)×105×5=6300個eeg腦電數(shù)據(jù)。

采用bagging算法構(gòu)建子訓(xùn)練集。該算法基于bootstrap,即隨機且有放回的從擴展訓(xùn)練集中取出900個eeg腦電數(shù)據(jù)構(gòu)成一組子訓(xùn)練集,這個過程重復(fù)k=7次,最后使用這些子訓(xùn)練集訓(xùn)練出k=7個子支持向量機,并對其進行集成。

5個session的腦電數(shù)據(jù)用于測試。假設(shè)eegim(i=1,2,…,15;m=1,2,…,6)是第i個sequence中第m列的eeg腦電數(shù)據(jù),eegin(i=1,2,…,15;n=1,2,…,6)是第i個sequence中第n行的eeg腦電數(shù)據(jù)。vecim表示第i個sequence中eegim的特征向量,vecin表示第i個sequence中eegin的特征向量。將vecimvecin放入第k(k=1,2,…,7)個子支持向量機中得到分類標簽labimklabink。如果第k個子支持向量機識別出eegim包含p300電位,則labimk=1;如果不包含p300電位,則labimk=-1,labink同理。

每個eeg數(shù)據(jù)將得到k=7個結(jié)果,采用加權(quán)投票算法整合k=7個分類結(jié)果。為每個子支持向量機計算一個權(quán)重系數(shù),精度越高權(quán)重越高,使分類結(jié)果與權(quán)重相乘,得到該eeg數(shù)據(jù)的分數(shù)值。假設(shè)第k個子支持向量機的權(quán)重系數(shù)是wkq(q=1,2,…,15)指用于分類的sequence數(shù)量,則第m列eeg數(shù)據(jù)的分數(shù)值為:

同理,第n行eeg數(shù)據(jù)的分數(shù)值為:

包含目標字符的列和行應(yīng)該是分數(shù)值最高的列和行,所以最有可能的列為:

同樣地,最有可能的行為:

根據(jù)columnqrowq,即可確定目標字符。

為了消除時間相關(guān)性,提升實驗結(jié)果的客觀性,采用6折交叉驗證計算分類正確率。假設(shè)gt(t=1,2,…,6)指該組的訓(xùn)練集是樣本集中第t個session,a(gt)是第t組的分類準確率,那么p(p=17)個被試的平均準確率是

為了驗證擴展訓(xùn)練集對分類的促進作用,分別計算了17名被試訓(xùn)練集擴展前后的系統(tǒng)識別正確率,如圖5所示。

由分類結(jié)果可知,擴展訓(xùn)練集對p300拼寫器腦機接口系統(tǒng)的性能有顯著提升。經(jīng)過訓(xùn)練集擴展后,疊加4個sequence即可達到85.5%的識別正確率,疊加11個sequence可達到100%的識別正確率。而未使用未擴展的訓(xùn)練集,疊加4個sequence才達到65.2%的識別正確率,疊加了全部的15個sequence才達到95.4%的識別正確率。這個結(jié)果證明了使用相同規(guī)模的樣本集時,使用擴展訓(xùn)練集的系統(tǒng)性能比使用未擴展訓(xùn)練集的系統(tǒng)性能更顯著,本發(fā)明對小訓(xùn)練集具有極大的優(yōu)勢。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1