本發(fā)明涉及信號特征提取領域,特別是一種基于隨機選擇正則化共空間模式(randomselect-rcsp)的運動想象腦電信號特征提取方法。
背景技術:
當前在基于腦電信號(electroencephalogram,eeg)的腦機接口(braincomputerinterface,bci)研究主要集中于運動想象腦電信號方面,而bci中信號如何進行特征提取的問題是最為重要的問題之一。運動想象是通過“想”的方式來產(chǎn)生相關信號,對運動想象的研究表明,單側肢體運動或者想象運動會對波(8-13hz)和波(14-30hz)的節(jié)奏活動和功率譜產(chǎn)生抑制/增強的效果,即事件相關去同步/同步(erd/ers)現(xiàn)象。根據(jù)這一現(xiàn)象,迄今為止研究者們已經(jīng)提出了許多特征提取方法,如ar模型(auto-regressive,自回歸)、wavelet變換、希爾伯特黃變換、csp(commonspatialpattern,共同空間模式)等。近些年,csp被證明是一種提取不同類型的運動想象信息的有效方法,該方法的關鍵在于聯(lián)合對角化協(xié)方差矩陣。即通過數(shù)學變換,使得一類的方差最大化,另一類的方差最小化。
csp(commonspatialpattern,共同空間模式)方法的主要問題是對噪聲非常敏感。因此,基于csp的衍生方法層出不窮,如ccsp、sscsp、rcsp、fercsp、fbcsp。其中,最有效方法是正則化共空間模式(regularizedcommonspatialpattern,rcsp)。該方法借助遷移學習的思想,將其他被試的腦電信號引入到csp學習過程中,保證了被試的腦電信號協(xié)方差的估計偏差,使之相較于傳統(tǒng)的csp方法表現(xiàn)更好,在小訓練樣本集中這一點表現(xiàn)的尤為突出,然而,這種算法在小樣本腦電數(shù)據(jù)集中的穩(wěn)定性還有待提高,且隨著訓練樣本的增加,其分類準確率增長緩慢,時間復雜度上升。
技術實現(xiàn)要素:
本發(fā)明旨在解決現(xiàn)有rcsp算法在小樣本運動想象腦電數(shù)據(jù)集中的穩(wěn)定性不高,且隨著訓練樣本的增加,其分類準確率增長緩慢,時間復雜度上升的問題,特別提出了一種基于randomselect-rcsp的運動想象腦電信號特征提取的方法。
基于randomselect-rcsp的特征提取算法通過重復選取樣本構造數(shù)據(jù)包,并利用每個數(shù)據(jù)包分別對樣本提取rcsp特征。通過與包括rcsp在內(nèi)的csp衍生算法進行分析比較,結果表明,baggingrcsp在時間復雜度較低的情況下,能保持較高的識別率和穩(wěn)定性,優(yōu)于rcsp及csp的其他衍生算法。
為了實現(xiàn)上述目的本發(fā)明采用如下技術方案:一種基于randomselect-rcsp的運動想象腦電信號特征提取方法,包括以下步驟:
s1,對被試者腦電信號數(shù)據(jù),利用bagging算法重新構造訓練數(shù)據(jù)樣本;腦電信號數(shù)據(jù)為左手和右手運動想象腦電數(shù)據(jù)。
s2,構造基于被試者訓練數(shù)據(jù)樣本的協(xié)方差矩陣,并計算出平均協(xié)方差;
s3,利用與步驟s1相同的bagging算法,隨機選擇引入其他被試者的腦電信號數(shù)據(jù);
s4,進行協(xié)方差矩陣正則化;
s5,進行正則化后的協(xié)方差矩陣估計計算;
s6,利用步驟s5的協(xié)方差矩陣提取rcsp特征。
所述重新構造訓練數(shù)據(jù)樣本的過程為:從被試者腦電信號數(shù)據(jù)中,隨機抽取若干個數(shù)據(jù)形成一個新的自助數(shù)據(jù)包,重復這一過程,直到產(chǎn)生多個自助數(shù)據(jù)包。并且在后續(xù)的rcsp基本算法中計算被試者的協(xié)方差矩陣時,同樣根據(jù)這個思想方法引入一部分其他人的腦電信號。
其中,bagging算法的思想為:從大小為n的原始數(shù)據(jù)集中,分別獨立隨機選擇抽取n'(n'≤n)個數(shù)據(jù)形成一個新的自助數(shù)據(jù)集,并且將這個過程獨立地重復進行多次,直到產(chǎn)生多個獨立的新自助數(shù)據(jù)集,然后,將每一個數(shù)據(jù)集作為一個數(shù)據(jù)包獨立地用于訓練一個“分量分類器”,最終的分類判別將根據(jù)這些分量器各自的判別結果的投票來決定。
所述協(xié)方差矩陣構造方法為:
對于某一個被試者,令dn×t表示單次腦電信號,其中n代表通道數(shù)量,t代表每個通道的采樣點數(shù),經(jīng)過歸一化后的協(xié)方差矩陣如下:
其中,dt為d的轉置,trace(ddt)為矩陣ddt的跡,d為單次腦電信號,c表示歸一化后的協(xié)方差矩陣。
根據(jù)以上協(xié)方差矩陣可以得到數(shù)據(jù)樣本的平均協(xié)方差為
其中,m是訓練數(shù)據(jù)樣本的數(shù)量,i是運動想象信號的類別,即指左手或右手運動想象兩類,c{i,m}表示歸一化后協(xié)方差矩c中的第i行m列。
在小樣本估計問題中,正則化是一種非常有效的方法。rcsp正是基于這一方法,它通過偏置估計項的方式,使分類結果不依賴于采樣樣本,而是朝著一個“更加合理”的方向。在處理“方差-偏差”窘境問題時,該算法是通過增大偏差而減小方差的方式實現(xiàn)的。這種“方差-偏差”平衡由一個或多個正則化參數(shù)來調(diào)控。為了減少協(xié)方差矩陣估計的偏差,rcsp不僅僅利用了該被試者的腦電信號,還引入了其他個體的腦電數(shù)據(jù)。rcsp計算協(xié)方差矩陣正則化為:
其中,β和γ是兩個正則化參數(shù),0≤β,γ≤1,i是一個n×n的單位矩陣,n表示單位矩陣i的維數(shù),si(β,γ)表示i類的正則化平均空間協(xié)方差矩陣,xi(β)為被試者及其他被試者的腦電樣本的協(xié)方差矩陣,其定義如下:
其中,ci是被試者第i類的m個訓練數(shù)據(jù)組成的協(xié)方差矩陣,c'i是其他被試者第i類的m'個訓練數(shù)據(jù)組成的協(xié)方差矩陣;旨在減少協(xié)方差矩陣估計的方差,它往往會產(chǎn)生更可靠的結果。在一個特定個體的腦電信號分類中,提出的訓練過程使用其他受試者的相關樣本構造了一個正則化項c'i,且這些相關樣本都是通用的。若有n個受試者,每類有m個訓練樣本,則m'=(n-1)m。
所述提取rcsp特征的方法為:
為了得到腦電信號特征,將協(xié)方差矩陣分解得到:
s(β,γ)=sleft(β,γ)+sright(β,γ)=evet
其中,e是與特征值矩陣v對應的特征向量矩陣,sleft(β,γ)和sright(β,γ)分別表示被試者想象左手和想象右手兩類腦電信號樣本正則化平均空間協(xié)方差矩陣。
構造白化矩陣p:p=v1/2et,t表示對矩陣e的轉置。
有p·s(β,γ)·pt=c·i
其中,c為一個常數(shù)(c取值范圍為實數(shù)集);因此,sleft(β,γ)和sright(β,γ)的特征向量相同,并且對于特征向量,二者對應的特征值之和為一個固定常數(shù);
sleft(β,γ)=uvleftut
sright(β,γ)=uvrightut
u表示一個酉矩陣,vleft和vright分別表示sleft(β,γ)和sright(β,γ)的特征向量。
則投影矩陣w=utp。
rcsp選擇w的前后各r列來映射一個訓練樣本s,最后得到用于分類的特征向量y。
所述用于分類的特征向量y為:
z=ws
其中q表示對應的類別、r表示所選擇的w矩陣的列數(shù)、z表示w和s的乘。
綜上所述,由于采用了上述技術方案,本發(fā)明的有益效果是:提高了rcsp處理小樣本下的腦電數(shù)據(jù)集的穩(wěn)定性和平均識別率,并且方差更小,魯棒性更好。
附圖說明
圖1是本發(fā)明的流程示意圖。
具體實施方式
下面詳細介紹本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示具有相同或類似功能。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
本發(fā)明提供了一種基于randomselect-rcsp的運動想象腦電信號特征提取方法,其特征在于,包括以下步驟:
s1,首先對原數(shù)據(jù)樣本進行重構,從大小為n的原始左手和右手運動想象腦電數(shù)據(jù)集中,分別獨立隨機選擇n'(n'≤n)個數(shù)據(jù)形成一個新的數(shù)據(jù)集,并且將這個過程獨立地重復進行多次,產(chǎn)生多個獨立的數(shù)據(jù)包,得到重構的訓練數(shù)據(jù)樣本。
s2,對于某一個被試者,用矩陣dl×t表示單次腦電信號,l代表通道數(shù)量,t代表每個通道的采樣點數(shù)。則經(jīng)過歸一化后的協(xié)方差矩陣計算方式為:
其中,dt為d的轉置,trace(ddt)為矩陣ddt的跡。
然后根據(jù)以上協(xié)方差矩陣可以得到數(shù)據(jù)樣本的平均協(xié)方差為:
其中,m是訓練數(shù)據(jù)的數(shù)量,i指的是運動想象信號的類別,即指左、右手運動想象兩類。
s3,針對s2所計算出的一個被試者的腦電數(shù)據(jù)樣本協(xié)方差,按照步驟s1的方法引入一部分其他被試者的腦電信號數(shù)據(jù),得到被試及其他被試者的腦電樣本的協(xié)方差矩陣xi(β),其定義如下:
其中,ci是受試者第i類的m個訓練數(shù)據(jù)組成的協(xié)方差矩陣,c'i是其他人第i類的m'個訓練數(shù)據(jù)組成的協(xié)方差矩陣。從后續(xù)的每一位受試者腦電數(shù)據(jù)樣本都進行s3方法的處理;若有n個受試者,每類有m個訓練樣本,則m'=(n-1)m。
s4,然后進行協(xié)方差矩陣正則化,通過偏置估計項的方式,使分類結果不依賴于采樣樣本,而是朝著一個“更加合理”的方向。在處理“方差-偏差”窘境問題時,該算法是通過增大偏差而減小方差的方式實現(xiàn)的。這種“方差-偏差”平衡由一個或多個正則化參數(shù)來調(diào)控。使用β和γ這兩個正則化參數(shù)(0≤β,γ≤1),β控制著訓練樣本協(xié)方差矩陣的權重來減少協(xié)方差矩陣估計的偏差,而γ控制著多個單位矩陣的權重;
s5,然后,rcsp計算各類的正則化平均空間協(xié)方差矩陣估計計算如下:
其中,i是一個n×n的單位矩陣。
s6,最后,將協(xié)方差矩陣分解得到:
s(β,γ)=sleft(β,γ)+sright(β,γ)=evet
其中,e是與特征值矩陣v對應的特征向量矩陣。構造白化矩陣:
p=v1/2et
而
p·s(β,γ)·pt=c·i
其中,c為一個常數(shù)。因此,sleft(β,γ)和sright(β,γ)的特征向量相同,并且對于特征向量,二者對應的特征值之和為一個固定常數(shù)。若
sleft(β,γ)=uvleftut
sright(β,γ)=uvrightut
則可得投影矩陣w=utp。
rcsp選擇w的前后各r列來映射一個訓練樣本s:
z=ws
最后得到用于分類的腦電信號rcsp特征向量y:
盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領域的普通技術人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由權利要求及其等同物限定。