專利名稱:基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法。該方法 對(duì)圖像數(shù)據(jù)進(jìn)行特征提取表示為特征向量,并尋找有效的降維方法將其投影到低維語(yǔ)義空 間,從而通過(guò)訓(xùn)練分類(lèi)器模型實(shí)現(xiàn)對(duì)圖像數(shù)據(jù)的分類(lèi)。
背景技術(shù):
隨著數(shù)字照相機(jī)普及和互聯(lián)網(wǎng)發(fā)展,圖像數(shù)據(jù)采集、存儲(chǔ)和訪問(wèn)數(shù)量呈爆炸式增 長(zhǎng),如何對(duì)規(guī)模日益龐大的圖像數(shù)據(jù)進(jìn)行高效管理變得日益重要。為了對(duì)圖像進(jìn)行更好管 理,一個(gè)有效手段便是對(duì)圖像數(shù)據(jù)分門(mén)別類(lèi)地進(jìn)行管理。因此,對(duì)圖像數(shù)據(jù)進(jìn)行分類(lèi)已成為 近年來(lái)熱點(diǎn)研究問(wèn)題。在圖像分類(lèi)的研究中,所面臨的最大挑戰(zhàn)是語(yǔ)義鴻溝,即圖像底層特征無(wú)法充分 反映其高層語(yǔ)義。鑒于以數(shù)據(jù)驅(qū)動(dòng)為中心的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析等理論所取得進(jìn)展,為了 克服語(yǔ)義鴻溝,一個(gè)有效手段是在提取圖像底層特征基礎(chǔ)上,應(yīng)用機(jī)器學(xué)習(xí)理論,訓(xùn)練得到 圖像語(yǔ)義的抽象表達(dá),然后基于該表達(dá),再對(duì)圖像進(jìn)行聚類(lèi)與分類(lèi)。在這個(gè)過(guò)程中,有監(jiān)督 學(xué)習(xí)分類(lèi)算法被大量使用。雖然有監(jiān)督算法可有效提高圖像表達(dá)準(zhǔn)確性,但是現(xiàn)有監(jiān)督算 法仍然存在局限性,尤其是獲得精確標(biāo)注信息需要耗費(fèi)大量時(shí)間。隨著圖像數(shù)據(jù)數(shù)量快速 增長(zhǎng),無(wú)標(biāo)注數(shù)據(jù)獲取更加便利,使得僅能單純處理標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)算法局限性更為 明顯。考慮到帶有標(biāo)注信息的數(shù)據(jù)較難獲得,而未標(biāo)注數(shù)據(jù)則相對(duì)容易獲得,半監(jiān)督算法逐 漸吸引了越來(lái)越多研究者注意。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于局部樣條嵌入的正交半監(jiān)督 子空間圖像分類(lèi)方法?;诰植繕訔l嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法包括如下步驟1)對(duì)每個(gè)圖像數(shù)據(jù)集選取η個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集包括有標(biāo)注信息的訓(xùn) 練樣本和未標(biāo)注信息的訓(xùn)練樣本,其余作為測(cè)試集;2)利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣;3)利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布,通過(guò)局 部樣條嵌入方式構(gòu)造拉普拉斯矩陣;4)根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌入正交 半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維,得到低 維特征向量訓(xùn)練樣本;5)采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模型;6)對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò)分類(lèi)器 模型進(jìn)行分類(lèi)。所述的利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣步驟為給
5定屬于c類(lèi)的η個(gè)樣本所組成的訓(xùn)練集合X = Ix1,..,Xl,χ1+1,...,χη},其中χ, € Rdxl,i = 1,...,n,前1個(gè)樣本{x』=1具有類(lèi)別標(biāo)注信息O^L e{l,2,...,c},剩余n-1個(gè)樣本{ };1/+1沒(méi)有
被標(biāo)注,利用包含標(biāo)注信息訓(xùn)練樣本& ν構(gòu)造類(lèi)間散度矩陣民=ILhiMw -μΧμ μ
和類(lèi)內(nèi)散度矩陣&廣-廣,其中,ik表示屬于第k類(lèi)的訓(xùn)練樣本
個(gè)數(shù),w表示第k類(lèi)中第i個(gè)樣本,//=Itx,為 v均值,+ 表示第k類(lèi)中樣
本均值。所述的利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布,通 過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯矩陣步驟為1)假定給定樣本X,. € Rd的k近鄰數(shù)據(jù)的局部低維嵌入坐標(biāo)和全局低維嵌入坐標(biāo) 為G 6IT和力e Rm,1彡i彡n,1彡j彡k,對(duì)于m維中的每一分量,分別構(gòu)造一個(gè)樣條函
數(shù)g(t),使得t = g(tj);對(duì)如下函數(shù)廠晚))2+義彳⑷進(jìn)行最小化,得至1J
樣條函數(shù)g,其中λ >ο是一個(gè)正則化參數(shù),<是樣條函數(shù)g在d維空間里的罰函數(shù),當(dāng)
g⑴ sZ^^W + X^MO時(shí),上式存在唯一解,其中 1 = (d+s-Ι) ! /(d ! (S-I)!),
{巧(0};構(gòu)成了一個(gè)階數(shù)不小于s的多項(xiàng)式空間,2s > d,Φ」α)是一個(gè)格林函數(shù), "^[/^^, . ,^felRiP β = [βι; β2,... , β Jt 是系數(shù)向量;2)通過(guò)解下面的線性方程組獲得系數(shù)向量η和β 其中f =比,…,幻,乂= f P,K是一個(gè)kXk的對(duì)稱矩陣,Kij 3)對(duì)于m維中的每一分量,τ (g)由全局坐標(biāo)f來(lái)表達(dá),將m維中值τ (g)累加起 來(lái),對(duì)于第i個(gè)樣本Xi,得到目標(biāo)值為 其中巧二[人,乂2,...,厶]e Rmxt,將所有n個(gè)訓(xùn)練數(shù)據(jù)的目標(biāo)值加起來(lái),得到總體的目標(biāo)值 令L' = SBST,這樣就得到了基于局部樣條嵌入的拉普拉斯矩陣L'。所述的根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌入 正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維,得 到低維特征向量訓(xùn)練樣本步驟為
1)通過(guò)學(xué)習(xí)得到正交投影矩陣α e Mdxm,m < d,能保證訓(xùn)練樣本在經(jīng)過(guò)a降維后 類(lèi)間離散度盡量大和類(lèi)內(nèi)離散度盡量小,同時(shí)使得原始空間中相鄰樣本在投影后低維子空 間中仍然相鄰,即求解以下最優(yōu)化問(wèn)題 這樣,可通過(guò)求解矩陣的廣義特征根得到優(yōu)化的投影矩陣a ;2)由投影矩陣a實(shí)現(xiàn)對(duì)原始高維特征向量的維度降低,從而獲得圖像數(shù)據(jù)的低維 表達(dá) X' = aTX。所述的采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模型
步驟為分類(lèi)器模型的輸入是經(jīng)過(guò)正交投影矩陣a降維得到的低維特征向量
及相應(yīng)的類(lèi)別標(biāo)識(shí)e {+1,-1},輸出是分類(lèi)器模型的張量超平面參數(shù)>1;£股7^1和
通過(guò)求解最優(yōu)化問(wèn)題
得到和b,其中C是常量,ξ是
松弛因子。所述的對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò) 分類(lèi)器模型進(jìn)行分類(lèi)步驟為訓(xùn)練樣本集合外的測(cè)試樣本數(shù)據(jù)elT^"由正交投影 矩陣a映射為低維子空間中的
然后通過(guò)分類(lèi)器模型進(jìn)行類(lèi)別檢測(cè),即計(jì)算
來(lái)得到測(cè)試數(shù)據(jù)的類(lèi)別標(biāo)識(shí)yt 本發(fā)明有效利用了有標(biāo)注訓(xùn)練樣本和未標(biāo)注訓(xùn)練樣本,通過(guò)局部樣條回歸將局部 低維嵌入坐標(biāo)映射成全局低維嵌入坐標(biāo),保持了圖像數(shù)據(jù)集合的流形空間本征結(jié)構(gòu)。有效 地解決了高維度帶來(lái)的困難,通過(guò)對(duì)降維后的數(shù)據(jù)采用支持向量機(jī)來(lái)訓(xùn)練分類(lèi)器模型并對(duì) 測(cè)試數(shù)據(jù)分類(lèi),取得了比傳統(tǒng)的分類(lèi)方法更準(zhǔn)確的分類(lèi)結(jié)果。
圖1是基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法流程圖;圖2是舉例本發(fā)明的5幅圖像分類(lèi)結(jié)果。
具體實(shí)施例方式基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法包括如下步驟 1)對(duì)每個(gè)圖像數(shù)據(jù)集選取η個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集包括有標(biāo)注信息的訓(xùn) 練樣本和未標(biāo)注信息的訓(xùn)練樣本,其余作為測(cè)試集;2)利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣;3)利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布,通過(guò)局 部樣條嵌入方式構(gòu)造拉普拉斯矩陣;4)根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌入正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維,得到低 維特征向量訓(xùn)練樣本;5)采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模型;6)對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò)分類(lèi)器 模型進(jìn)行分類(lèi)。所述的利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣步驟為給 定屬于c類(lèi)的η個(gè)樣本所組成的訓(xùn)練集合X = Ix1, ..,X1, χ1+1,... , χη},其中;c, e Riftd , i = 1,...,n,前1個(gè)樣本伐}丨=1具有類(lèi)別標(biāo)注信息{只}丨=1 e{1,2,...,c},剩余n-1個(gè)樣本{xX/+1沒(méi)有
被標(biāo)注,利用包含標(biāo)注信息訓(xùn)練樣本&·^構(gòu)造類(lèi)間散度矩陣&Af
Ix///=1k=\
和類(lèi)內(nèi)散度矩陣夂w),其中,表示屬于第k類(lèi)的訓(xùn)練樣本
k=\ /=1
個(gè)數(shù),w表示第k類(lèi)中第i個(gè)樣本,為v均值,表示第k類(lèi)中樣
XiI /=1 lX/)/=l U i=l
本均值。所述的利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布,通 過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯矩陣步驟為1)假定給定樣本X,. e Rrf的k近鄰數(shù)據(jù)的局部低維嵌入坐標(biāo)和全局低維嵌入坐標(biāo) 為G 6 Rm和力e Rm,i彡i彡n,i彡j彡k,對(duì)于m維中的每一分量,分別構(gòu)造一個(gè)樣條函
數(shù)g(t),使得A = g(tj);對(duì)如下函數(shù)= 廠映))2+A彳⑷進(jìn)行最小化,得到
紀(jì)J=I
樣條函數(shù)g,其中λ >0是一個(gè)正則化參數(shù),<是樣條函數(shù)g在d維空間里的罰函數(shù),當(dāng) 沖) = ⑴+ "為⑴時(shí),上式存在唯一解,其中1 = (d+s-l) ! /(d ! (s-1) !),
{巧⑴}^構(gòu)成了一個(gè)階數(shù)不小于S的多項(xiàng)式空間,2s > d,Φ」α)是一個(gè)格林函數(shù), ;;= I^1, "2,.·.,%『eIR* 禾口 β = β2,... , β Jt 是系數(shù)向量;2)通過(guò)解下面的線性方程組獲得系數(shù)向量η和β 其中
K 是一個(gè) kXk 的對(duì)稱矩陣,Kij
=Φ ( Il t.-tj II), P 是一個(gè) IXk 的矩陣,Pij = Pjtj),得到 τ (g) = fTBf3)對(duì)于m維中的每一分量,τ (g)由全局坐標(biāo)f來(lái)表達(dá),將m維中值τ (g)累加起 來(lái),對(duì)于第i個(gè)樣本Xi,得到目標(biāo)值為
其中巧,…,厶]eR-,將所有n個(gè)訓(xùn)練數(shù)據(jù)的目標(biāo)值加起來(lái),得到總體的目標(biāo)值 令L' = SBST,這樣就得到了基于局部樣條嵌入的拉普拉斯矩陣L'。所述的根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌入 正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維,得 到低維特征向量訓(xùn)練樣本步驟為1)通過(guò)學(xué)習(xí)得到正交投影矩陣ω e Rdxm,m < d,能保證訓(xùn)練樣本在經(jīng)過(guò)a降維后 類(lèi)間離散度盡量大和類(lèi)內(nèi)離散度盡量小,同時(shí)使得原始空間中相鄰樣本在投影后低維子空 間中仍然相鄰,即求解以下最優(yōu)化問(wèn)題 s. t. aTa = I這樣,可通過(guò)求解矩陣的廣義特征根得到優(yōu)化的投影矩陣a ;2)由投影矩陣a實(shí)現(xiàn)對(duì)原始高維特征向量的維度降低,從而獲得圖像數(shù)據(jù)的低維 表達(dá) X' = aTX。所述的采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模型 步驟為分類(lèi)器模型的輸入是經(jīng)過(guò)正交投影矩陣a降維得到的低維特征向量X’, Ii= 乂式以 及相應(yīng)的類(lèi)別標(biāo)識(shí)yi e {+1,-1},輸出是分類(lèi)器模型的張量超平面參數(shù)!4;£股 ^和辦曰膠;
坊去Hl2+也
通過(guò)求解最優(yōu)化問(wèn)題,τ , ‘-1
st ^(WrXi
松弛因子。所述的對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò) 分類(lèi)器模型進(jìn)行分類(lèi)步驟為訓(xùn)練樣本集合外的測(cè)試樣本數(shù)據(jù)A由正交投影
矩陣a映射為低維子空間中的I/,然后通過(guò)分類(lèi)器模型進(jìn)行類(lèi)別檢測(cè),即計(jì)算
yt = sign(wT χ Xt')+ b,來(lái)得到測(cè)試數(shù)據(jù)的類(lèi)別標(biāo)識(shí)yt e {+1,-1}。實(shí)施例1.對(duì)每個(gè)圖像數(shù)據(jù)集選取η個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集包括有標(biāo)注信息的訓(xùn) 練樣本和未標(biāo)注信息的訓(xùn)練樣本,其余作為測(cè)試集;2.利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣給定屬于c類(lèi)的η個(gè)樣本所組成的訓(xùn)練集合X = Ix1, . . , X1, x1+1, . . .,xn},其中 χ丨e Mdxl,i = 1,...,n,前1個(gè)樣本具有類(lèi)別標(biāo)注信息{只}。e {l,2,...,c},剩余n_l個(gè) 樣本^KU1沒(méi)有被標(biāo)注。利用包含標(biāo)注信息訓(xùn)練樣本{1,}丨=1構(gòu)造類(lèi)間散度矩陣Sb和類(lèi)內(nèi)散 度矩陣Sw Sb =YjI^-μ){μ^-μ)Τ
k=l
得到和b,其中c是常量,ξ是
Weirxl
9
其中,Ik表示屬于第k類(lèi)的訓(xùn)練樣本個(gè)數(shù)
,表示第k類(lèi)中第i個(gè)樣本…=丨g X,
為,^均值
表示第讓類(lèi)中樣本均值。3.利用整體訓(xùn)練樣本數(shù)據(jù)的特征空間分布,通過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯 矩陣假定給定樣本χ, e Rd的k近鄰數(shù)據(jù)的局部低維嵌入坐標(biāo)和全局低維嵌入坐標(biāo)為 tj e “和力e『,1彡i彡n,1彡j彡k。對(duì)于m維中的每一分量,希望分別構(gòu)造一個(gè)樣條 函數(shù)g (t),使得如下插值條件成立fj = g(tj), j = 1,2, ...Λ (1)為了得到樣條函數(shù)g,最小化如下函數(shù) 其中λ >0是一個(gè)正則化參數(shù),<是樣條函數(shù)g在d維空間里的罰函數(shù)。在一定條件下,存在一個(gè)唯一的樣條函數(shù)使得公式(2)中樣條函數(shù)g(t)最小化 其中l(wèi)=(d+s_l)! /(d ! (s-1)! ),{巧⑴}、構(gòu)成了一個(gè)階數(shù)不小于s的多項(xiàng) 式空間,2s > d。Φ」α)是一個(gè)格林函數(shù)。為了保證解的唯一性,還需要滿足如下邊界條件 k 當(dāng)滿足式(4)時(shí),式(3)中的函數(shù)Φ」(·)是條件正定的。將式(1)和式⑷代入式(3),系數(shù)向量Z7= [T7lJ2,".^feKi, β =
β 2,...,β Jt通過(guò)解下面的線性方程組獲得 其中
e股,κ是一個(gè)kX k的對(duì)稱矩陣,K
=Mlltftj ||),P是一個(gè)IXk的矩陣,Pij = PiU^因?yàn)棣怠?·)是一條件正定函數(shù), 因此上述方程組存在唯一解?;?jiǎn)式(2)得τ (g) oc η τκ η = fTBf(5)其中B是々—1中大小為kXk最左上子矩陣。根據(jù)式(5),對(duì)于m維中的每一分量,式⑵的值τ (g)可以由全局坐標(biāo)f來(lái)表達(dá)。將m維中值τ (g)累加起來(lái),對(duì)于第i個(gè)樣本Xi,得到目標(biāo)值為 其中巧 將所有η個(gè)訓(xùn)練數(shù)據(jù)的目標(biāo)值加起來(lái),得到總體的目標(biāo)值 其中5 = JMg(辟,..” ^JeR*"*, S = ^S2,...SJeRnxnk ,F = Lf1, f2, ... , f J ,
S 是列選擇矩陣,使得Fi = FSi0令L' = SBSt,這樣就得到了基于局部樣條嵌入的拉 普拉斯矩陣L'。4.根據(jù)局部樣條嵌入的正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣實(shí)現(xiàn)對(duì)原始高 維特征向量的維度降低1)通過(guò)學(xué)習(xí)得到正交投影矩陣Rrfxi",m< d,能保證訓(xùn)練樣本在經(jīng)過(guò)a降維后 類(lèi)間離散度盡量大和類(lèi)內(nèi)離散度盡量小,同時(shí)使得原始空間中相鄰樣本在投影后低維子空 間中仍然相鄰。即求解以下最優(yōu)化問(wèn)題 這樣,可通過(guò)求解矩陣的廣義特征根得到優(yōu)化的投影矩陣a 2)由投影矩陣a實(shí)現(xiàn)對(duì)原始高維特征向量的維度降低,從而獲得圖像數(shù)據(jù)的低維 表達(dá) X' = aTX。5.采用支持向量機(jī)對(duì)降維后的訓(xùn)練樣本集合建立分類(lèi)器模型分類(lèi)器模型的輸入是經(jīng)過(guò)正交投影矩陣a降維得到的低維特征向量允,I;= 乂式以 及相應(yīng)的類(lèi)別標(biāo)識(shí)Yi e {+1,-1},輸出是分類(lèi)器模型的張量超平面參數(shù)WeRM1和 6.對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò)分類(lèi)器 模型進(jìn)行分類(lèi)訓(xùn)練樣本集合外的測(cè)試樣本數(shù)據(jù);G Ki^^由正交投影矩陣a映射為低維子空間
中的Z; SlTp^,然后通過(guò)分類(lèi)器模型進(jìn)行類(lèi)別檢測(cè),即計(jì)算
得到測(cè)試數(shù)據(jù)的類(lèi)別標(biāo)識(shí) 圖2給出了本發(fā)明的5幅圖像分類(lèi)結(jié)果。
得到和b,其中c是常量,ξ是
權(quán)利要求
一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法,其特點(diǎn)在于包括如下步驟1)對(duì)每個(gè)圖像數(shù)據(jù)集選取n個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集包括有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本,其余作為測(cè)試集;2)利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣;3)利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布,通過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯矩陣;4)根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌入正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維,得到低維特征向量訓(xùn)練樣本;5)采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模型;6)對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再通過(guò)分類(lèi)器模型進(jìn)行分類(lèi)。
2.根據(jù)權(quán)利要求1所述的一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法, 其特點(diǎn)在于所述的利用有標(biāo)注信息的訓(xùn)練樣本構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣步驟為 給定屬于c類(lèi)的η個(gè)樣本所組成的訓(xùn)練集合 其中\(zhòng) e Erfxl,i = 1,. . .,n,前1個(gè)樣本{1,}丨=1具有類(lèi)別標(biāo)注信息伙}丨=1 e {1,2,...,c},剩余n_l個(gè)樣本{xJL+Γ沒(méi)有被標(biāo)注,利用包含標(biāo)注信息訓(xùn)練樣本& V構(gòu)造類(lèi)間散度矩陣 和類(lèi)內(nèi)散度矩陣& 其中,ik表示屬于第k類(lèi)的訓(xùn)練樣本k=\ /=1個(gè)數(shù),w表示第k類(lèi)中第i個(gè)樣本,為/ ν均值 廣表示第k類(lèi)中樣 XiI /=1 iXi //=1U '=I本均值。
3.根據(jù)權(quán)利要求1所述的一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法, 其特點(diǎn)在于所述的利用有標(biāo)注信息的訓(xùn)練樣本和未標(biāo)注信息的訓(xùn)練樣本的特征空間分布, 通過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯矩陣步驟為1)假定給定樣本Rd的k近鄰數(shù)據(jù)的局部低維嵌入坐標(biāo)和全局低維嵌入坐標(biāo)為 tj ^ ^“和力e Rm,1彡i彡n,1彡j彡k,對(duì)于m維中的每一分量,分別構(gòu)造一個(gè)樣條函數(shù)g(t),使得 ·」=gap ;對(duì)如下函數(shù) 進(jìn)行最小化,得到 樣條函數(shù)g,其中λ >0是一個(gè)正則化參數(shù),是樣條函數(shù)g在d維空間里的罰函數(shù),當(dāng) = Σ屬凡⑴+ ⑴時(shí),上式存在唯一解,其中 {巧⑴丨^構(gòu)成了一個(gè)階數(shù)不小于s的多項(xiàng)式空間 是一個(gè)格林函數(shù), ;/^[^,^,...,^reRiP β = [βι; β2,... , βΥ 是系數(shù)向量;2)通過(guò)解下面的線性方程組獲得系數(shù)向量η和β 是一個(gè) IXk 的矩陣,Pij = Piaj),得到 τ (g) =fTBf3)對(duì)于m維中的每一分量,τ (g)由全局坐標(biāo)f來(lái)表達(dá),將m維中值τ (g)累加起來(lái), 對(duì)于第i個(gè)樣本Xi,得到目標(biāo)值為 將所有η個(gè)訓(xùn)練數(shù)據(jù)的目標(biāo)值加起來(lái),得到總體的目標(biāo)值 E(F)^ei =YHFiBiFj) = tr{FSBST Ft) ,這樣就得到了基于局部樣條嵌入的拉普拉斯矩陣L'。
4.根據(jù)權(quán)利要求1所述的一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法, 其特點(diǎn)在于所述的根據(jù)類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣以及拉普拉斯矩陣構(gòu)成局部樣條嵌 入正交半監(jiān)督子空間模型,通過(guò)尋找轉(zhuǎn)換矩陣來(lái)對(duì)原始高維特征向量訓(xùn)練樣本進(jìn)行降維, 得到低維特征向量訓(xùn)練樣本步驟為1)通過(guò)學(xué)習(xí)得到正交投影矩陣βe Mrfxm,m < d,能保證訓(xùn)練樣本在經(jīng)過(guò)a降維后類(lèi)間 離散度盡量大和類(lèi)內(nèi)離散度盡量小,同時(shí)使得原始空間中相鄰樣本在投影后低維子空間中 仍然相鄰,即求解以下最優(yōu)化問(wèn)題aopt = arg max tr[(aT (Sw + yXLXT )α)~λ aTSba]a<5. . £1 £1 — I這樣,可通過(guò)求解矩陣的廣義特征根得到優(yōu)化的投影矩陣a ;2)由投影矩陣a實(shí)現(xiàn)對(duì)原始高維特征向量的維度降低,從而獲得圖像數(shù)據(jù)的低維表達(dá)X! — & X ο
5.根據(jù)權(quán)利要求1所述的一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法, 其特點(diǎn)在于所述的采用支持向量機(jī)對(duì)降維后的低維特征向量訓(xùn)練樣本集合建立分類(lèi)器模 型步驟為分類(lèi)器模型的輸入是經(jīng)過(guò)正交投影矩陣a降維得到的低維特征向量^arXi 以及相應(yīng)的類(lèi)別標(biāo)識(shí)Yi e {+1,-1},輸出是分類(lèi)器模型的張量超平面參和通過(guò)求解最優(yōu)化問(wèn)題1 2 min -IIwII + C^jξ Kb,ξ 2 ‘St γ^τχ\^υ)>\-ξ beR ;L" ^ ^0量,ξ是松弛因子。
6.根據(jù)權(quán)利要求1所述的一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方 法,其特征在于所述的對(duì)于測(cè)試數(shù)據(jù)集,由訓(xùn)練集合計(jì)算得到的投影矩陣進(jìn)行投影后,再得到和b,其中c是常WGRmx1通過(guò)分類(lèi)器模型進(jìn)行分類(lèi)步驟為訓(xùn)練樣本集合外的測(cè)試樣本數(shù)據(jù)& eITix"由正交投 影矩陣a映射為低維子空間中的X;,然后通過(guò)分類(lèi)器模型進(jìn)行類(lèi)別檢測(cè),即計(jì)算yt =5繪《(>/\不_) +辦,來(lái)得到測(cè)試數(shù)據(jù)的類(lèi)別標(biāo)識(shí)、e {+1,-1}。
全文摘要
本發(fā)明公開(kāi)了一種基于局部樣條嵌入的正交半監(jiān)督子空間圖像分類(lèi)方法。包括如下步驟1)對(duì)圖像數(shù)據(jù)集選取n個(gè)樣本作為訓(xùn)練集,包括有標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù),其余作為測(cè)試集;2)利用有標(biāo)注數(shù)據(jù)構(gòu)造類(lèi)間散度矩陣和類(lèi)內(nèi)散度矩陣;3)利用整體訓(xùn)練數(shù)據(jù)特征空間分布,通過(guò)局部樣條嵌入方式構(gòu)造拉普拉斯矩陣;4)根據(jù)局部樣條嵌入正交半監(jiān)督子空間模型,尋找投影矩陣對(duì)原始高維特征向量進(jìn)行降維;5)采用支持向量機(jī)對(duì)降維后訓(xùn)練樣本建立分類(lèi)器;6)利用投影矩陣對(duì)測(cè)試集進(jìn)行降維,再通過(guò)分類(lèi)器對(duì)降維后的測(cè)試集進(jìn)行分類(lèi)。本發(fā)明充分利用了圖像樣本標(biāo)注和特征空間分布等信息,能挖掘圖像數(shù)據(jù)之間潛在語(yǔ)義關(guān)聯(lián),對(duì)圖像語(yǔ)義進(jìn)行了較好的分析與表達(dá)。
文檔編號(hào)G06K9/62GK101916376SQ20101022013
公開(kāi)日2010年12月15日 申請(qǐng)日期2010年7月6日 優(yōu)先權(quán)日2010年7月6日
發(fā)明者張寅 , 朱科, 邵建 申請(qǐng)人:浙江大學(xué)