一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法
【專利摘要】本發(fā)明公開了一種基于張量局部保持投影(Tensor?Locality?Preserving?Projection,TLPP)的大腦認(rèn)知狀態(tài)的識別方法,包括步驟:1)大腦認(rèn)知狀態(tài)fMRI數(shù)據(jù)的預(yù)處理及分組;2)構(gòu)建近鄰圖G及相應(yīng)的關(guān)聯(lián)矩陣S;3)計(jì)算訓(xùn)練樣本集的特征分解,求出相應(yīng)的特征變換矩陣,計(jì)算訓(xùn)練樣本的低維嵌入;4)分類識別,計(jì)算測試樣本集的低維嵌入,利用基于張量距離的近鄰分類器對其進(jìn)行判別分類。本發(fā)明利用TLPP算法直接對多維張量進(jìn)行降維和特征提取,對采集的腦認(rèn)知fMRI數(shù)據(jù)進(jìn)行特征降維,有效的對大腦認(rèn)知狀態(tài)進(jìn)行識別分類,結(jié)合基于張量距離的近鄰分類器,提高識別分類的準(zhǔn)確性,該方法不僅繼承了傳統(tǒng)方法的優(yōu)點(diǎn),還大大減少了空間和時(shí)間的復(fù)雜度,克服了維數(shù)災(zāi)難,計(jì)算量較小,內(nèi)存消耗小,耗時(shí)較短。
【專利說明】一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于醫(yī)學(xué)圖像處理、生物特征提取和模式識別【技術(shù)領(lǐng)域】,涉及fMRI數(shù)據(jù)的預(yù)處理、近鄰圖的構(gòu)建、轉(zhuǎn)換矩陣的計(jì)算和低維嵌入,具體涉及一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,可用于處理大腦認(rèn)知狀態(tài)的fMRI數(shù)據(jù)并進(jìn)行判別分類。
【背景技術(shù)】
[0002]信息學(xué)、計(jì)算機(jī)科學(xué)、以及神經(jīng)學(xué),三門學(xué)科伴隨著科技的進(jìn)步和科學(xué)的新發(fā)展,逐漸組成一體,形成的神經(jīng)信息學(xué)是一門跨學(xué)科的科研領(lǐng)域。近些年來,對腦圖像的研究和探索,使得這一領(lǐng)域不斷產(chǎn)生大量的數(shù)據(jù),如何合理的利用數(shù)據(jù)挖掘算法來高效處理和分析這些數(shù)據(jù),獲得更深層次的數(shù)據(jù)知識和潛在規(guī)律,進(jìn)一步探究大腦的認(rèn)知工作機(jī)理,已經(jīng)逐漸成為新的科研熱點(diǎn)。
[0003]近年來,fMRI(functional Magnetic Resonance Imaging)已經(jīng)發(fā)展成為腦成像領(lǐng)域中的一項(xiàng)重要核心技術(shù)。fMRI圖像的挖掘主要包括預(yù)處理、特征降維和特征抽取以及腦認(rèn)知狀態(tài)的分類識別?,F(xiàn)有的fMRI數(shù)據(jù)分析方法主要有兩類:模型驅(qū)動(dòng)的參數(shù)方法和數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)方法。參數(shù)方法中的模型假設(shè)需要對腦的結(jié)構(gòu)、功能和處理機(jī)制有比較深刻的認(rèn)識,但這些認(rèn)識本身就是腦功能研究的目標(biāo)。所以,模型驅(qū)動(dòng)的參數(shù)方法只是一種對假設(shè)模型的驗(yàn)證方法,而模型中關(guān)于生理、神經(jīng)、功能等機(jī)理的假設(shè)還有待進(jìn)一步研究、驗(yàn)證和解釋。數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)方法主要是直接選用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等學(xué)科中已有的多元統(tǒng)計(jì)方法對fMRI數(shù)據(jù)進(jìn)行處理,只是非常有限地利用了 fMRI和腦認(rèn)知的領(lǐng)域知識。因此,非參數(shù)方法的處理結(jié)果往往不是很理想,并且合理、準(zhǔn)確地解釋這些結(jié)果也比較困難。鑒于上述情況,腦fMRI研究迫切需要能更有效、更準(zhǔn)確地提取實(shí)驗(yàn)數(shù)據(jù)中與認(rèn)知活動(dòng)相關(guān)的信息的數(shù)據(jù)分析新方法。在模式識別里的張量對象通常都是指高維的張量空間,直接應(yīng)用于這種空間的識別算法往往要受到維度的限制,即所謂的維數(shù)災(zāi)難。為了解決維數(shù)災(zāi)難,出現(xiàn)了很多降維算法。
[0004]數(shù)據(jù)降維方法分為非線性降維方法和線性降維方法,非線性降維方法的典型代表包括等距映射Isomap (Iso-matric map)和拉普拉斯特征映射LE (Laplacian Eigenmaps)等,線性降維方法的典型代表包括PCA主元分析法(Principal component analysis)和多維尺度變換MDS(Mult1-dimensional Scaling)。典型的線性降維方法是基于線性的,由于真實(shí)世界中的數(shù)據(jù)很多是非線性分布的,線性降維方法對這些數(shù)據(jù)的處理效果并不理想,非線性降維方法則能處理非線性的高維數(shù)據(jù),但是典型的非線性方法難以獲得新樣本點(diǎn)低維投影。
[0005]近年來學(xué)者又提出了一系列新的降維方法,如局部線性嵌入算法LLE (LocallyLinear Embedding)、局部保持投影算法LPP、線性局部切空間排列算法LLTSA (LinearLocal tangent space alignment)等。
[0006]局部線性嵌入算法LLE是一種基于流形的局部降維方法,該方法可以找到嵌入在高維空間中潛在的低緯流形結(jié)構(gòu),對非線性數(shù)據(jù)的降維能得到比較理性的結(jié)果,但是由于其算法本身的局限性,該算法很難應(yīng)用到識別領(lǐng)域。
[0007]局部保持投影(Locality Preserving Projections)LPP是一種新的子空間分析方法,它是非線性方法LE的線性近似,既解決PCA等傳統(tǒng)線性方法難以保持原始數(shù)據(jù)非線性流形的缺點(diǎn)又解決了非線性方法難以獲得新樣本點(diǎn)低維投影的缺點(diǎn)。但是該方法與其他方法相同,都是將數(shù)據(jù)進(jìn)行向量化,再進(jìn)行降維,同樣會(huì)造成大量的計(jì)算和內(nèi)存的消耗。
[0008]線性局部切空間排列算法LLTSA (Linear Local tangent space alignment)是經(jīng)典非線性算法LTSA的線性近似,是一種能很好的適應(yīng)與識別問題的非線性降維方法,但是該方法僅僅關(guān)注了數(shù)據(jù)的局部幾何結(jié)構(gòu),而沒有體現(xiàn)數(shù)據(jù)的整體信息。
【發(fā)明內(nèi)容】
[0009]本發(fā)明針對目前生物特征提取和分類判別領(lǐng)域中存在的維數(shù)災(zāi)難等問題,提供了一種直接以張量的形式對數(shù)據(jù)進(jìn)行降維,既保留了數(shù)據(jù)的局部幾何特征,又避免了維數(shù)災(zāi)難的一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法。
[0010]為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案實(shí)現(xiàn):首先構(gòu)建訓(xùn)練樣本的近鄰圖和計(jì)算對應(yīng)的相關(guān)矩陣,通過求解目標(biāo)函數(shù)的廣義特征值問題,計(jì)算出所有的轉(zhuǎn)換矩陣,然后再將訓(xùn)練樣本與測試樣本分別對轉(zhuǎn)換矩陣進(jìn)行相乘(這里指張量乘法),從而嵌入到低維張量空間,最后利用基于張量距離的近鄰分類器完成對大腦認(rèn)知狀態(tài)的識別和分類。
[0011]本發(fā)明的方法包括如下步驟:
[0012]步驟一:大腦認(rèn)知狀態(tài)fMRI數(shù)據(jù)的預(yù)處理及分組。
[0013]a)選用SPM8軟件對fMRI數(shù)據(jù)進(jìn)行預(yù)處理,包括時(shí)間片校正、空間校正、圖像標(biāo)準(zhǔn)化、平滑處理等步驟;
.[0014]b)其次是數(shù)據(jù)的分組,將預(yù)處理后的圖像數(shù)據(jù)按照掃描時(shí)間序列以及大腦認(rèn)知行為實(shí)驗(yàn)類別進(jìn)行重新組合,每個(gè)類別選取一定的樣本點(diǎn)構(gòu)成試驗(yàn)數(shù)據(jù)(訓(xùn)練數(shù)據(jù)),剩下的樣本點(diǎn)作為測試數(shù)據(jù)。
[0015]步驟二:構(gòu)建近鄰圖G及相應(yīng)的關(guān)聯(lián)矩陣S。
[0016]假設(shè)有η個(gè)樣本點(diǎn)A1,…,An,ikf e V 1其中為c Af(/ = I,...?),Ik是張量的k
模式維數(shù)。首先我們構(gòu)建近鄰圖G來表示M的局部幾何結(jié)構(gòu),該近鄰圖的構(gòu)造主要有兩種方式:
[0017]k近鄰方式:即當(dāng)且僅當(dāng)兩點(diǎn)中,一點(diǎn)在另一點(diǎn)的最近的k個(gè)點(diǎn)中,兩點(diǎn)之間有邊相連。
[0018]ε近鄰方式:即當(dāng)且僅當(dāng)兩點(diǎn)之間的距離小于常數(shù)ε,兩點(diǎn)之間有邊相連。
[0019]在ε近鄰方式中,由于常數(shù)ε的取值需要多次試驗(yàn)取得,此外,ε近鄰方式并不適合用于數(shù)據(jù)分布不均勻的情況,因此本發(fā)明采用k近鄰方法構(gòu)造近鄰圖。
[0020]根據(jù)構(gòu)造的近鄰圖G,我們可以得到其相應(yīng)的關(guān)聯(lián)矩陣S=[Si」_]nXn,其中S是基于
熱核方法來定義的,具體表達(dá)式如下:
[0021]
【權(quán)利要求】
1.一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:高維張量空間中相近或相離的兩點(diǎn),嵌入到低維張量空間以后仍然保持相近或相離的關(guān)系以及采用基于張量距離的分類器進(jìn)行判定,包括以下步驟: 1)大腦認(rèn)知狀態(tài)fMRI數(shù)據(jù)的預(yù)處理及分組; 2)構(gòu)建近鄰圖G及相應(yīng)的關(guān)聯(lián)矩陣S; 3)計(jì)算訓(xùn)練樣本集的特征分解,并求出相應(yīng)的特征變換矩陣,最后計(jì)算訓(xùn)練樣本的低維嵌入; 4)分類識別,計(jì)算測試樣本集的低維嵌入,利用基于張量距離的近鄰分類器對其進(jìn)行判別分類。
2.根據(jù)權(quán)利要求1所述的一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:所述步驟I)中,大腦認(rèn)知狀態(tài)fMRI數(shù)據(jù)的預(yù)處理及分組,包括下面幾個(gè)步驟: a)選用SPM8軟件對fMRI數(shù)據(jù)進(jìn)行預(yù)處理:包括時(shí)間片校正、空間校正、配準(zhǔn)圖像、圖像標(biāo)準(zhǔn)化和平滑處理步驟; b)數(shù)據(jù)的分組:將預(yù)處理后的圖像數(shù)據(jù)按照掃描時(shí)間序列以及認(rèn)知行為實(shí)驗(yàn)類別進(jìn)行重新組合,每個(gè)類別選取一定的樣本點(diǎn)構(gòu)成試驗(yàn)數(shù)據(jù),即為訓(xùn)練數(shù)據(jù),剩下的樣本點(diǎn)作為測試數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:所述步驟2)中,構(gòu)建近鄰圖G及相應(yīng)的關(guān)聯(lián)矩陣S,其具體步驟如下: 假設(shè)有η個(gè)樣本點(diǎn)A1,.…,An,M e…外,其中Ai c Mii = I,...n),Ik是張量的k模式維數(shù),采用k近鄰方式構(gòu)建近鄰圖G來表示M的局部幾何結(jié)構(gòu);根據(jù)構(gòu)造的近鄰圖G,得到其相應(yīng)的關(guān)聯(lián)矩陣S=[Si」_]nXn,其中S是基于熱核方法來定義的。
4.根據(jù)權(quán)利要求3所述的一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:所述的k近鄰方式即當(dāng)且僅當(dāng)張量空間兩點(diǎn)中,一點(diǎn)在另一點(diǎn)的最近的k個(gè)點(diǎn)中,兩點(diǎn)之間有邊相連。
5.根據(jù)權(quán)利要求1所述一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:所述步驟3)中,計(jì)算訓(xùn)練樣本集的特征分解,并求出相應(yīng)的特征變換矩陣,最后計(jì)算訓(xùn)練樣本的低維嵌入,其具體步驟如下: 假設(shè)1/,.£/?/;</_(/ = 1,...,幻為相應(yīng)的轉(zhuǎn)換矩陣,根據(jù)近鄰圖6和相關(guān)矩陣3,基于張量的局部保留映射算法的最優(yōu)化問題表示為:
6.根據(jù)權(quán)利要求1所述的一種基于張量局部保持投影的大腦認(rèn)知狀態(tài)的識別方法,其特征在于:所述步驟4)中,分類識別,計(jì)算測試樣本集的低維嵌入,利用基于張量距離的近鄰分類器對其進(jìn)行判別分類,其具體步驟如下: 假設(shè)測試樣本數(shù)為m個(gè),樣本集為(X1, X2,…,Xm),通過步驟3)中所得到的轉(zhuǎn)換矩陣U, e Rlxl (/ = 1..A)計(jì)算測試樣本的嵌入: Xi=XiXlU卜U[ (x, c/ = 1,...,/?) 在得到訓(xùn)練樣本和測試樣本的嵌入的基礎(chǔ)上,利用基于張量距離的近鄰分類器進(jìn)行分類,得到每一個(gè)測試樣本所屬的類別,即預(yù)測出大腦的認(rèn)知 狀態(tài)。
【文檔編號】G06K9/66GK103440512SQ201310424991
【公開日】2013年12月11日 申請日期:2013年9月17日 優(yōu)先權(quán)日:2013年9月17日
【發(fā)明者】董明皓, 袁森, 李軍, 王洪勇, 徐鑫秀, 李文思, 王苓芝, 趙恒 , 秦偉 申請人:西安電子科技大學(xué)