一種基于局部樣條嵌入的核化分類(lèi)器的制造方法
【專(zhuān)利摘要】本發(fā)明涉及一種基于局部樣條嵌入的核化分類(lèi)器。本發(fā)明選擇訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),訓(xùn)練數(shù)據(jù)的基于局部樣條嵌入的非線性降維,根據(jù)已獲得的訓(xùn)練數(shù)據(jù)的最佳非線性嵌入對(duì)測(cè)試數(shù)據(jù)使用核方法推導(dǎo)出其擴(kuò)展形式,即獲得測(cè)試數(shù)據(jù)在低維流形上的非線性嵌入,使用線性的支持向量機(jī)算法對(duì)降維后的測(cè)試數(shù)據(jù)進(jìn)行分類(lèi)。本發(fā)明克服了無(wú)法在非線性分類(lèi)問(wèn)題上達(dá)到很好的分類(lèi)性能的缺陷。本發(fā)明采用局部樣條嵌入的非線性降維算法對(duì)高維有標(biāo)簽數(shù)據(jù)降維,再對(duì)高維有標(biāo)簽數(shù)據(jù)進(jìn)行了特征提取,然后將新的無(wú)標(biāo)簽高維測(cè)試數(shù)據(jù)的嵌入,最后根據(jù)數(shù)據(jù)特點(diǎn)使用SVM算法實(shí)現(xiàn)對(duì)新的測(cè)試數(shù)據(jù)的分類(lèi)。
【專(zhuān)利說(shuō)明】
-種基于局部樣條嵌入的核化分類(lèi)器
技術(shù)領(lǐng)域
[0001] 本發(fā)明應(yīng)用于對(duì)高維數(shù)據(jù)的分類(lèi)分析,特別設(shè)及一種基于局部樣條嵌入的核化分 類(lèi)器。
【背景技術(shù)】
[0002] 局部樣條嵌入算法是一種優(yōu)秀的流形降維算法,但它的目的主要是對(duì)數(shù)據(jù)進(jìn)行降 維,所W,運(yùn)一點(diǎn)就導(dǎo)致了它的降維結(jié)果并不一定利于對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。
[0003] 在本發(fā)明提出之前,與本發(fā)明最相關(guān)的工作是由發(fā)明人提出的一種基于局部樣條 嵌入的線性分類(lèi)方法,該方法將局部樣條嵌入算法與線性判別算法相結(jié)合,尋找能夠最小 化訓(xùn)練數(shù)據(jù)在全局低維坐標(biāo)種的重構(gòu)誤差并且能夠具有最佳局部類(lèi)判別性的最佳線性映 射,并將它應(yīng)用于測(cè)試數(shù)據(jù)上,最后使用KNN算法對(duì)線性映射后的測(cè)試數(shù)據(jù)分類(lèi)。但是,該線 性分類(lèi)算法只能找到最佳的線性映射,其隱含的假設(shè)是數(shù)據(jù)線性可分,事實(shí)上運(yùn)一假設(shè)也 普遍存在于其它基于局部樣條嵌入的分類(lèi)器設(shè)計(jì)中。在現(xiàn)實(shí)世界中,真實(shí)數(shù)據(jù)集絕大部分 都是非線性可分的。雖然基于局部樣條嵌入的線性分類(lèi)方法通過(guò)采用分類(lèi)器的方法,能 夠在一定程度上彌補(bǔ)運(yùn)一缺陷,但是仍然無(wú)法在非線性分類(lèi)問(wèn)題上達(dá)到很好的分類(lèi)性能。 要處理非線性的流形分類(lèi)問(wèn)題,最理想的方法就是設(shè)計(jì)一種非線性的降維分類(lèi)方法。然而, 目前尚未有研究者提出過(guò)基于局部樣條嵌入的非線性分類(lèi)器。因此,如何設(shè)計(jì)一種基于局 部樣條嵌入的非線性分類(lèi)器,使之能夠處理非線性可分的分類(lèi)問(wèn)題,運(yùn)是亟待解決的重要 問(wèn)題。
[0004] 核方法是一種用于解決線性不可分問(wèn)題的方法,通過(guò)將原始數(shù)據(jù)經(jīng)過(guò)隱式的非線 性變換,映射至一個(gè)高維特征空間中去,將在原本線性不可分的問(wèn)題轉(zhuǎn)化為線性可分的問(wèn) 題。本發(fā)明將使用核方法,設(shè)計(jì)一種基于局部樣條嵌入的非線性核化分類(lèi)器
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服上述缺陷,充分發(fā)揮訓(xùn)練數(shù)據(jù)的類(lèi)別信息的作用,設(shè)計(jì)一 種基于局部樣條嵌入的核化分類(lèi)器。
[0006] 本發(fā)明的技術(shù)方案是:
[0007] -種基于局部樣條嵌入的核化分類(lèi)器,其主要技術(shù)特征在于步驟如下:
[0008] (1)選擇訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù);
[0009] (2)訓(xùn)練數(shù)據(jù)的基于局部樣條嵌入的非線性降維,包括:
[0010] (2-1)分別構(gòu)建類(lèi)內(nèi)圖和類(lèi)間圖并選取鄰域;
[00川 (2-2)根據(jù)所選取鄰域的訓(xùn)練數(shù)據(jù)點(diǎn)的類(lèi)內(nèi)圖和類(lèi)間圖分別構(gòu)建測(cè)試點(diǎn)的類(lèi)內(nèi)局 部切空間和類(lèi)間局部切空間;
[0012] (2-3)從類(lèi)內(nèi)局部切空間和類(lèi)間局部切空間出發(fā),借助核方法將訓(xùn)練數(shù)據(jù)在局部 切空間的坐標(biāo)變換為全局低維坐標(biāo),計(jì)算出使得訓(xùn)練數(shù)據(jù)點(diǎn)映射至全局低維坐標(biāo)時(shí)重構(gòu)誤 差最小并且具有最佳局部類(lèi)判別性的目標(biāo)函數(shù),得到訓(xùn)練數(shù)據(jù)的最佳非線性嵌入;
[0013] (3)根據(jù)已獲得的訓(xùn)練數(shù)據(jù)的最佳非線性嵌入對(duì)測(cè)試數(shù)據(jù)使用核方法推導(dǎo)出其擴(kuò) 展形式,即獲得測(cè)試數(shù)據(jù)在低維流形上的非線性嵌入;
[0014] (4)使用線性的支持向量機(jī)算法對(duì)降維后的測(cè)試數(shù)據(jù)進(jìn)行分類(lèi)。
[0015] 所述步驟(1)訓(xùn)練數(shù)據(jù)為高維有標(biāo)簽數(shù)據(jù),測(cè)試數(shù)據(jù)為高維無(wú)標(biāo)簽數(shù)據(jù)。
[0016] 所述步驟(2)構(gòu)建類(lèi)內(nèi)圖和類(lèi)間圖鄰域,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行基于局部樣條嵌入的非 線性降維,通過(guò)定義最優(yōu)化目標(biāo)并結(jié)合核方法,尋找能夠使投影后的樣本達(dá)到最大類(lèi)間離 散度和最小類(lèi)內(nèi)離散度的全局最佳非線性嵌入。
[0017] 所述步驟(3)測(cè)試數(shù)據(jù)的低維嵌入是:根據(jù)已獲得的訓(xùn)練樣本的最佳非線性嵌入, 對(duì)測(cè)試數(shù)據(jù)使用核方法進(jìn)行推導(dǎo),獲得測(cè)試數(shù)據(jù)的擴(kuò)展形式,得到測(cè)試數(shù)據(jù)在訓(xùn)練數(shù)據(jù)的 低維流形上的非線性嵌入。
[0018] 本發(fā)明的優(yōu)點(diǎn)和效果在于采用基于局部樣條嵌入的核化分類(lèi)器對(duì)高維無(wú)標(biāo)簽測(cè) 試數(shù)據(jù)進(jìn)行降維分類(lèi)分析,表現(xiàn)為:
[0019] (1)借鑒了局部樣條嵌入算法、線性判別函數(shù)算法和核方法的思想,并融合了監(jiān)督 信息,在最大化保持了樣本局部特性的同時(shí),提高了信息分類(lèi)的準(zhǔn)確度。
[0020] (2)在鄰域內(nèi)構(gòu)建類(lèi)內(nèi)圖和類(lèi)間圖,對(duì)類(lèi)內(nèi)近鄰和類(lèi)間近鄰進(jìn)行區(qū)分,并通過(guò)最大 化樣條插值函數(shù)的類(lèi)內(nèi)近鄰光滑度,同時(shí)最小化樣條插值函數(shù)的類(lèi)內(nèi)近鄰光滑度,來(lái)實(shí)現(xiàn) 映射類(lèi)內(nèi)緊湊、類(lèi)間離散的效果。
[0021] (3)能夠有效處理非線性流形分類(lèi)問(wèn)題,通過(guò)使用核方法尋找訓(xùn)練數(shù)據(jù)的非線性 嵌入,再使用核方法對(duì)測(cè)試數(shù)據(jù)推導(dǎo)其擴(kuò)展形式,獲得測(cè)試數(shù)據(jù)在低維目標(biāo)流形中的非線 性嵌入,實(shí)現(xiàn)對(duì)高維無(wú)標(biāo)簽非線性數(shù)據(jù)的低維嵌入,有利于對(duì)真實(shí)數(shù)據(jù)的處理。
[0022] 本發(fā)明采用基于局部樣條嵌入的非線性降維算法對(duì)高維有標(biāo)簽數(shù)據(jù)降維,再對(duì)高 維有標(biāo)簽數(shù)據(jù)進(jìn)行了特征提取,然后將新的無(wú)標(biāo)簽高維測(cè)試數(shù)據(jù)的嵌入,最后根據(jù)數(shù)據(jù)特 點(diǎn)使用SVM算法實(shí)現(xiàn)對(duì)新的測(cè)試數(shù)據(jù)的分類(lèi)。
【附圖說(shuō)明】
[0023] 圖1--本發(fā)明流程示意圖。
【具體實(shí)施方式】
[0024] 本發(fā)明的主要技術(shù)思路是:
[0025] 本發(fā)明采用基于局部樣條嵌入的非線性降維算法加上線性SVM(線性的支持向量 機(jī))分類(lèi)算法對(duì)高維有標(biāo)簽的數(shù)據(jù)進(jìn)行降維分類(lèi),融入監(jiān)督信息克服了局部樣條嵌入算法 對(duì)高維信息降維后的結(jié)果不一定利于分類(lèi)處理的缺陷,同時(shí),構(gòu)建類(lèi)內(nèi)圖和類(lèi)間圖對(duì)類(lèi)內(nèi) 近鄰和類(lèi)間近鄰進(jìn)行區(qū)分,對(duì)實(shí)現(xiàn)類(lèi)內(nèi)緊湊和類(lèi)間離散的效果有極大的幫助,尤其是引入 了再生核希爾伯特空間,使用核方法尋找測(cè)試數(shù)據(jù)的最佳非線性嵌入,能夠處理原本無(wú)法 處理非線性數(shù)據(jù)的分類(lèi)問(wèn)題。因?yàn)榻?jīng)過(guò)使用核方法,已經(jīng)使得數(shù)據(jù)變?yōu)榫€性可分,所W最后 使用線性SVM算法對(duì)數(shù)據(jù)進(jìn)行分類(lèi)即可。
[00%] 本發(fā)明的步驟如下:
[0027] 1.選擇訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。訓(xùn)練數(shù)據(jù)為高維有標(biāo)簽的數(shù)據(jù),測(cè)試數(shù)據(jù)為高維無(wú) 標(biāo)簽的數(shù)據(jù)。
[0028] 2.對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行基于局部樣條嵌入非線性降維,運(yùn)個(gè)步驟包括=個(gè)階段:
[0029] (2.1)通過(guò)構(gòu)建類(lèi)內(nèi)圖、類(lèi)間圖來(lái)選取鄰域。定義一個(gè)樣本點(diǎn)X, E吸0并選其k個(gè)近 鄰作為鄰域Wx,),其鄰域Xi可W分為此片,巧日A/;佔(zhàn)觸個(gè)部分,與它具有相同類(lèi)標(biāo)簽的樣 本點(diǎn)為M,,片表示在樣本點(diǎn)Xi的鄰域AAOr,)中具有同類(lèi)標(biāo)簽的第j個(gè)樣本點(diǎn),與它具 有不同類(lèi)標(biāo)簽的樣本點(diǎn)為從批,),的I,,表示在樣本點(diǎn)Xi的鄰域Wx,沖具有不同類(lèi)標(biāo)簽的第j 個(gè)樣本點(diǎn),對(duì)鄰域和運(yùn)兩個(gè)樣本點(diǎn)定義如下:
[0030] (1)
[0031] (2)
[0032] (3)
[0033] (4)
[0034] (2.2)假設(shè)切空間的維度為d(d<<D),分別用化Iw和化Ib表示NiIw(Xi)和NiIb(Xi)的 關(guān)于Xi的類(lèi)內(nèi)局部切空間坐標(biāo)和類(lèi)間局部切空間坐標(biāo):
[0035] 先構(gòu)建類(lèi)內(nèi)圖風(fēng)。的)中每個(gè)類(lèi)內(nèi)點(diǎn)Xilw在低維局部切空間中的坐標(biāo)。令 乂1…=的巧",…..部n,對(duì)Xiiw進(jìn)行奇異值分解:
[0036]
(5)
[0037] 則樣本中的點(diǎn):??。在近局部切空間中的坐標(biāo)為:
[00;3引
化)
[0039] 其中&|,,,二化堪(。1,。2,...,叫),啼|,,,表示類(lèi)內(nèi)點(diǎn)叫~的第^'個(gè)近鄰在局部切空間中 的坐標(biāo),jG [1,ki|w],則有
[0040]
(7)
[0041 ]同理再對(duì)類(lèi)間圖尾知.)構(gòu)建每個(gè)類(lèi)間點(diǎn)X i I b的低維局部切空間坐標(biāo)。令 義I,,=時(shí),.卻,扎對(duì)Xii地行奇異值分解,最后可得類(lèi)間點(diǎn)近鄰坐標(biāo)分別為:
[0042]
(8)
[00創(chuàng) (2.3)假設(shè)每個(gè)類(lèi)內(nèi)點(diǎn)的局部切空間IUIw的每個(gè)維度哨W都存在一個(gè)樣條插值函數(shù)
是ruk的kilw個(gè)數(shù)據(jù)點(diǎn)在全局嵌入流形中的第r 維的坐標(biāo);同理,對(duì)于每個(gè)類(lèi)間點(diǎn)的局部切空間化Ib,同樣存在每個(gè)維度詞6對(duì)應(yīng)的樣條插值 函數(shù)巧6:嗎6 4均。,均,,e化Axi是化Ib的kiib個(gè)數(shù)據(jù)點(diǎn)在全局嵌入流形中的第r維的坐標(biāo)。
[0044] 定義一個(gè)目標(biāo)函數(shù)用來(lái)最小化全局坐標(biāo)重構(gòu)誤差如下:
[0045] (9)
[0046] 其中A為正則化權(quán)重系數(shù),局部類(lèi)內(nèi)近鄰坐標(biāo)的重構(gòu)誤差用Il均W -.郁,,如I",) I信表 示,局部類(lèi)間近鄰坐標(biāo)的重構(gòu)誤差用II;娜-訴Ib(刪.)II2F表示,詞,,在d維上的光滑度懲罰項(xiàng) 為說(shuō)姑1,,,),巧廟d維上的光滑度懲罰項(xiàng)為說(shuō)妃I,,)。
[0047] 9;i"郝而6相互獨(dú)立,所W可W把式(9)分寫(xiě)為兩個(gè)函數(shù)Qw和化的加和形式:
[004引
[0049] (11)
[0050] (12)
[0化1 ]
[00 對(duì) (。)
[0053] Duchon已證明在Sovolev空間中的特定條件下,式(11) (12)的插值函數(shù)是能夠最 小化的,巧。郝都的可W表示為
[0054] (14)
[0055] (15)
[0056] 其中的~、0非、叫~、叫6用來(lái)表示權(quán)重向量系數(shù),口1|~和口非為化|~和叫迪(1維空間中 的多項(xiàng)式基矩陣,
則為ruiw在d維空間中的格林矩陣, 且
[0057]
(16)
[005引同理,屯,Ib巧)二悼!i|b閑,締閑,…,挪佩巧叫廟d維空間中的格林矩陣,且
[0059]
(17)
[0060] 很明顯,運(yùn)里可W用Oilw和Oilb來(lái)衡量IUIw和IUIb的局部類(lèi)內(nèi)離散度、局部類(lèi)間離 散度,其值越大,離散度越大。
[0061 ] Duchon已證明式(14)(15)成立的前提條件是
[0062]
(18)
[0063]其中,巧,郝和Pilb的前k列。所W,將(Il)(I2)(I4)(I5)(IS)式聯(lián)立,可得
[0064] 19)
[0069] 由于插值函數(shù)具有較強(qiáng)的擬合能力,可W假設(shè)挪。郝巧6可W完全恢復(fù)明"郝的6,式 (21)可W進(jìn)一步的簡(jiǎn)寫(xiě)為
[00 化]
[0066] ))
[0067]
[006引 (21)
[0070]
(22)
[0071] Xiang等人已證明在式(19)成立的前提下,Va,:|,,,,〇,:|,,,下式也成立
[007^
似)
[007;3]其中,化I,,, E化叫"'xk和為心^的左上角矩陣,旨[
同理,存在
此時(shí),將的和締擴(kuò)展為締,,E吸"X叫'。和娜,e吸的多維向量,貝IJ 可將式(22)(23)合并寫(xiě)為
[0074]
(24)
[007引其中,F(xiàn)e肢是訓(xùn)練數(shù)據(jù)的全局映射坐標(biāo),Sw是類(lèi)內(nèi)近鄰的0-1選擇矩陣, =
滿足 yi|w = YSi|w。類(lèi)似地,Sb 是類(lèi)內(nèi)近鄰的 0-1 選 擇矩陣,
滿足y i I b = Y S i I b。此外,
妻中,
[0076] 此時(shí),再將式(24)代入至式(9),可得
[0077] (巧)
[007引
[0079]
[0080] 現(xiàn)假設(shè)存在一個(gè)從X到Y(jié)的直接非線性映射,即:
[0081 ] Y = VTf(X) (27) 其中,/(義)=[/柄),/(的),...,/片0] G吸PXn為Xi映射到P維空間的非線性映射函數(shù),P 維空間的維度非常高,遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)的原始維度。
[0082] 在核方法中,一般假設(shè)V本身可W由f(X)中的基線性組合而成,即
[0083] V = f(X)0 (28)其中0 G股"Xd為從f(X)重構(gòu)V的線性權(quán)重系數(shù)矩陣,先將式 (28)代入至式(27)可得:
[0084] Y= 0Tf (X)Tf (X) = 0? (29)在式(29)中,K為定義在再生核希爾伯特空間 的核函數(shù)(或者核矩陣),它滿足
[00 化]K(i,j) = <f(Xi),f(Xj)> (30)
[0086] 關(guān)于核函數(shù),可W由很多不同的選擇,常用的有高斯核
或者多 項(xiàng)式核K(i,j) = (l + <x,y> )d,還有Si卵Oid核K(i,j) = tanh( <x,y>+a)。使用核函數(shù)主 要是因?yàn)槲覀儾槐刂婪蔷€性映射f( ?)的顯式表達(dá)式,而是可W通過(guò)計(jì)算兩兩之間的關(guān) 系。直接減少了計(jì)算復(fù)雜度,避免了將Xi映射至的空間維度P過(guò)高所導(dǎo)致的維度災(zāi)難。
[0087] 此時(shí),將(29)式代入(26)式可得
[008引 min Q = tr(目化0護(hù)目) (31)
[0089] 為了確保0的唯一解,需要在(31)式的基礎(chǔ)上添加約束條件0T0 = 1,然后可W得到 (31)式的最優(yōu)解為
[0090] 0 =[目 1,目 2,...,目 d] (32)
[00川如果V0,. ?: G [1,邱馬足
[0092] KQKT 白 i = 〇i 白 i (33)
[0093] 其中0<〇1《〇2《...《〇d,〇i為1(〇1(''的第1個(gè)最小特征值,01為〇1所對(duì)應(yīng)的特征向 量。
[0094] 3.測(cè)試數(shù)據(jù)擴(kuò)展
[0095] 給定任意的測(cè)試數(shù)據(jù)G吸n,根據(jù)式(28)(29)可知,它在d維空間的最佳映射為:
[0096] yt = yTf (Xt) = (f (Xs)目)Tf (Xt)=目 T(f (Xs)Tf (Xt)) =目TK(Xs'Xt) (34)
[0097] 其中,Xs為訓(xùn)練數(shù)據(jù),由此可知,要得到測(cè)試數(shù)據(jù)在低維判別空間的最佳映射,只 需要計(jì)算訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)之間的核矩陣,再與上一步中獲得的權(quán)重系數(shù)矩陣0相乘即 可。
[0098] 4.使用線性SVM算法分類(lèi).
[0099] 因?yàn)橹笆褂煤朔椒ㄊ沟么诸?lèi)數(shù)據(jù)變?yōu)榫€性可分,所W就可W在嵌入后的目標(biāo) 流形上使用線性SVM算法進(jìn)行分類(lèi)。通常SVM算法考慮的是二分類(lèi)問(wèn)題,它的優(yōu)化目標(biāo)就是 尋找一個(gè)能夠最大化兩類(lèi)數(shù)據(jù)之間幾何間隔的分割超平面:
[0100] f (x) =sgn(g(x)) (35) 根據(jù)返回的值來(lái)確定該點(diǎn)的分類(lèi),其中g(shù)(x)=wx+b即分割超平面。求解最佳的分割超 平面可W歸結(jié)為二次規(guī)劃問(wèn)題 min 引 |?"||2
[0101] w'b (36) s.t.化(W正+ 6) > 1, i = 1,…,m
[0102] 通過(guò)求解與式(36)等價(jià)的拉格朗日對(duì)偶問(wèn)題,可W將式(35)轉(zhuǎn)變?yōu)?br>[0103]
(37)
[0104] 在本發(fā)明中,運(yùn)里使用一對(duì)多法實(shí)現(xiàn)分類(lèi)多類(lèi)問(wèn)題,任選一類(lèi)與其他剩余的所有 類(lèi)進(jìn)行對(duì)比,即構(gòu)建與類(lèi)別數(shù)相同個(gè)數(shù)的兩類(lèi)分類(lèi)器進(jìn)行判別,最后在多個(gè)兩類(lèi)分類(lèi)器中 選擇f (X)值最大的類(lèi)別作為測(cè)試數(shù)據(jù)的類(lèi)別。
【主權(quán)項(xiàng)】
1. 一種基于局部樣條嵌入的核化分類(lèi)器,其特征在于步驟如下: (1) 選擇訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù); (2) 訓(xùn)練數(shù)據(jù)的基于局部樣條嵌入的非線性降維,包括: (2-1)分別構(gòu)建類(lèi)內(nèi)圖和類(lèi)間圖并選取鄰域; (2-2)根據(jù)所選取鄰域的訓(xùn)練數(shù)據(jù)點(diǎn)的類(lèi)內(nèi)圖和類(lèi)間圖分別構(gòu)建測(cè)試點(diǎn)的類(lèi)內(nèi)局部切 空間和類(lèi)間局部切空間; (2-3)從類(lèi)內(nèi)局部切空間和類(lèi)間局部切空間出發(fā),借助核方法將訓(xùn)練數(shù)據(jù)在局部切空 間的坐標(biāo)變換為全局低維坐標(biāo),計(jì)算出使得訓(xùn)練數(shù)據(jù)點(diǎn)映射至全局低維坐標(biāo)時(shí)重構(gòu)誤差最 小并且具有最佳局部類(lèi)判別性的目標(biāo)函數(shù),得到訓(xùn)練數(shù)據(jù)的最佳非線性嵌入; (3) 根據(jù)已獲得的訓(xùn)練數(shù)據(jù)的最佳非線性嵌入對(duì)測(cè)試數(shù)據(jù)使用核方法推導(dǎo)出其擴(kuò)展形 式,即獲得測(cè)試數(shù)據(jù)在低維流形上的非線性嵌入; (4) 使用線性的支持向量機(jī)算法對(duì)降維后的測(cè)試數(shù)據(jù)進(jìn)行分類(lèi)。2. 根據(jù)權(quán)利要求1所述的基于局部樣條嵌入的核化分類(lèi)器,其特征在于步驟(1)訓(xùn)練數(shù) 據(jù)為高維有標(biāo)簽數(shù)據(jù),測(cè)試數(shù)據(jù)為高維無(wú)標(biāo)簽數(shù)據(jù)。3. 根據(jù)權(quán)利要求1所述的基于局部樣條嵌入的核化分類(lèi)器,其特征在于步驟(2)構(gòu)建類(lèi) 內(nèi)圖和類(lèi)間圖鄰域,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行基于局部樣條嵌入的非線性降維,通過(guò)定義最優(yōu)化目 標(biāo)并結(jié)合核方法,尋找能夠使投影后的樣本達(dá)到最大類(lèi)間離散度和最小類(lèi)內(nèi)離散度的全局 最佳非線性嵌入。4. 根據(jù)權(quán)利要求1所述的基于局部樣條嵌入的核化分類(lèi)器,其特征在于步驟(3)測(cè)試數(shù) 據(jù)的低維嵌入是:根據(jù)已獲得的訓(xùn)練樣本的最佳非線性嵌入,對(duì)測(cè)試數(shù)據(jù)使用核方法進(jìn)行 推導(dǎo),獲得測(cè)試數(shù)據(jù)的擴(kuò)展形式,得到測(cè)試數(shù)據(jù)在訓(xùn)練數(shù)據(jù)的低維流形上的非線性嵌入。
【文檔編號(hào)】G06K9/62GK106022361SQ201610316765
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月10日
【發(fā)明人】何萍, 敬田禹, 徐曉華, 林惠惠
【申請(qǐng)人】揚(yáng)州大學(xué)