一種基于核主成分分析網(wǎng)絡(luò)的圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字圖像領(lǐng)域,具體涉及一種基于核主成分分析網(wǎng)絡(luò)的圖像分類方 法。
【背景技術(shù)】
[0002] 對(duì)圖像進(jìn)行分類之前,通常需要對(duì)圖像矩陣進(jìn)行降維。常用的降維方法主要有兩 種:1、主成分分析法;2、核主成分分析法。前者主要是針對(duì)線性可分的數(shù)據(jù),而后者則可以 處理線性不可分的數(shù)據(jù)。兩者的分類正確率都不是很高。
[0003] 1、主成分分析法
[0004] 主成分分析法是最常用的線性降維方法,其目標(biāo)是通過(guò)線性映射將高維的數(shù)據(jù)映 射到低維的空間中進(jìn)行表達(dá),并期望在所投影的維度上數(shù)據(jù)的方差最大,從而使用較少的 數(shù)據(jù)維度保留住較多的原始數(shù)據(jù)的特點(diǎn)。
[0005] 其具體算法如下:
[0006] 假設(shè)輸入111個(gè)11維的樣本父" =1,2,...,111,其中/6『,2' = 1,2,-?,將每個(gè)樣本 中的n維數(shù)據(jù)排成列向量,則輸入樣本表示為:
[0007] Xj= [x i;1 xi;2 . . . xi;n]T, i = 1, 2, . . . , m (1)
[0008] 首先對(duì)樣本中每個(gè)維度的數(shù)據(jù)中心化:
[0009] 每個(gè)樣本減去平均值X使得樣本的每個(gè)維度均值都為〇,:
【主權(quán)項(xiàng)】
1. 一種基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,包括以下步驟: 步驟1:建立核主成分分析網(wǎng)絡(luò)第一層: 步驟1. 1 :輸入圖像數(shù)據(jù)庫(kù)中的&幅訓(xùn)練圖像,并對(duì)其進(jìn)行預(yù)處理,分別得到N屬訓(xùn)練 圖像中每一幅圖像的局部特征矩陣Ii,i= 1,2,...,N1;其中圖像數(shù)據(jù)庫(kù)包含N幅大小為 mXn已經(jīng)人工分類并作標(biāo)記的圖像,&<N; 步驟1. 2 :求局部特征矩陣I,的協(xié)方差矩陣均值〇 ,選擇任意一個(gè)核函數(shù),將協(xié)方差矩 陣均值亡映射到高維空間的核子空間當(dāng)中,得到核子空間當(dāng)中的協(xié)方差矩陣K,并對(duì)K去均 值得到K,通過(guò)對(duì)K進(jìn)行奇異值分解,得到K的主成分,從而獲得第一層核主成分分析網(wǎng)絡(luò) 的濾波器V(1);分別將I1與V(1)卷積,得到第一層核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像; 步驟2:建立核主成分分析網(wǎng)絡(luò)第二層: 將核主成分分析網(wǎng)絡(luò)的第一層訓(xùn)練輸出圖像替代步驟1. 1的K幅訓(xùn)練圖像,重復(fù)步驟 1. 1至步驟1. 2的過(guò)程,得到第二層核主成分分析網(wǎng)絡(luò)的濾波器V(2)以及第二層核主成分分 析網(wǎng)絡(luò)的訓(xùn)練輸出圖像; 步驟3:建立核主成分分析網(wǎng)絡(luò)的輸出層: 步驟3. 1:將第二層核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像中的每幅圖像二值化,并對(duì)二 值化后的圖像分塊以統(tǒng)計(jì)直方圖,得到隊(duì)幅訓(xùn)練圖像中每幅圖像的主特征向量fTm),i= 1,2, ? ? ?,Nu 步驟3. 2:將每幅圖像的主特征向量串聯(lián)起來(lái),得到所有訓(xùn)練圖像的主特征矩陣 p (train)^ 步驟4:訓(xùn)練分類器: 將Ftoain)以及每幅圖像對(duì)應(yīng)的標(biāo)記輸入到分類器當(dāng)中,訓(xùn)練分類器,獲得能夠?qū)D像 進(jìn)行分類的分類器。
2. 根據(jù)權(quán)利要求1所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟1. 1對(duì)&幅訓(xùn)練圖像的預(yù)處理具體為: 在N幅大小為mXn的圖像數(shù)據(jù)庫(kù)中隨機(jī)選取&幅作為訓(xùn)練圖像數(shù)據(jù)庫(kù);用一個(gè)大小 Sk:Xk2的滑塊遍歷訓(xùn)練圖像數(shù)據(jù)庫(kù)中的每幅訓(xùn)練圖像X,er^,i= 1,2,…,&的每一 個(gè)像素,其中置為實(shí)數(shù)集,匕和k2均為奇數(shù),并且0〈km,0〈kn,每一幅圖像總共有mn 個(gè)像素;對(duì)于每一個(gè)像素將滑塊范圍內(nèi)的hk2個(gè)像素值保存成一個(gè)列向量,得到mn個(gè)長(zhǎng)度 為hk2的列向量,記為:
對(duì)式(1)中的列向量去均值得到:
將去均值后的向量組合,從而得到每幅訓(xùn)練圖像\的局部特征矩陣Ii:
3. 根據(jù)權(quán)利要求2所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟1.2具體包括以下步驟: (a)分別求局部特征矩陣丨=L2,…,&的協(xié)方差矩陣:
⑷ 對(duì)得到的&個(gè)協(xié)方差矩陣進(jìn)行平均,得到:
(b) 選擇線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、指數(shù)核函數(shù)、拉普拉斯核函數(shù)、 雙曲正切核函數(shù)、有理二次核函數(shù)、逆多元二次核函數(shù)、圓核函數(shù)中的任意一個(gè)核函 數(shù)將亡eK%x咕映射到高維空間中的核子空間,得到大小為kAXkA的協(xié)方差矩陣 Ke腹,并對(duì)矩陣k進(jìn)行去均值得到:
其中2郵為一個(gè)的矩陣,每一個(gè)元素都是lAkA); (c) 對(duì)K進(jìn)行奇異值分解,找出K的1^個(gè)主成分,并將K的1^個(gè)主成分作為第一層核 主成分分析網(wǎng)絡(luò)的濾波器V(1):
式(7)中,vf為泛的第j個(gè)主成分,U為第一層核主成分分析網(wǎng)絡(luò)中濾波器的個(gè)數(shù),0 <kxk2; 將局部特征矩陣Ii,i= 1,2,. . .,&分別與vf,.j= 1,2,. . .,1^進(jìn)行卷積,得到第一層 核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像:
4. 根據(jù)權(quán)利要求1所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟2具體包括以下步驟: 將第一層核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像替代步驟1. 1中&幅訓(xùn)練圖像,重復(fù) 步驟1. 1至步驟1. 2過(guò)程,得到核主成分分析網(wǎng)絡(luò)的第二層濾波器:
式(9)中,<2)為第二層核主成分分析網(wǎng)絡(luò)的第h個(gè)濾波器,L2S第二層核主成分分析 網(wǎng)絡(luò)的濾波器個(gè)數(shù),〇 <L2<kik2; 以及得到UL2幅第二層核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像:
5. 根據(jù)權(quán)利要求4所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟3.1具體包括以下步驟: (a) 將第二層核主成分分析網(wǎng)絡(luò)的訓(xùn)練輸出圖像I丨:er-"中的每幅圖像進(jìn)行二值化 操作,得到二值化后的圖像,二值化操作具體為:中的元素如果大于0,則將該 元素置為1 ;如果小于或者等于〇,則將該元素置為〇 ;二值化后的圖像表示為:
將式(11)中的圖像進(jìn)行重新分組,每。幅圖像分為一組,得到NA個(gè)圖像組,每個(gè)圖像 組包括L2幅圖像,對(duì)每個(gè)圖像組中的L2張進(jìn)行加權(quán)求和得到一幅加權(quán)圖像,從而獲得N山: 個(gè)圖像組的加權(quán)圖像
式(12)對(duì)應(yīng)著NA張像素值介于[0,212-1]的圖像; (b) 將弩)?'i= 1,2,…,N1;j= 1,2,…,L沖的每幅加權(quán)圖像分成B塊,0〈B〈mn;分 別統(tǒng)計(jì)各個(gè)塊的直方圖并將這B個(gè)塊的直方圖連接成一個(gè)向量:
由式(13)得到&幅訓(xùn)練圖像中每幅圖像的主特征向量
6. 根據(jù)權(quán)利要求5所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟3. 2具體包括以下步驟: 按照原始輸入的訓(xùn)練圖像的標(biāo)記,K幅訓(xùn)練圖像中每幅圖像的主特征向量串聯(lián)起來(lái), 得到所有訓(xùn)練圖像的主特征矩陣:
7. 根據(jù)權(quán)利要求6所述的基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,其特征在于,所述 步驟4具體包括以下步驟: 將Ftoain)以及每幅訓(xùn)練圖像對(duì)應(yīng)的原始標(biāo)記輸入到分類器中,訓(xùn)練出分類需要的參 數(shù),獲得能夠?qū)D像進(jìn)行分類的分類器。
【專利摘要】本發(fā)明公開(kāi)一種基于核主成分分析網(wǎng)絡(luò)的圖像分類方法,包括以下步驟:(1)輸入并預(yù)處理訓(xùn)練圖像,得到訓(xùn)練圖像的局部特征矩陣,(2)建立一個(gè)兩層的核主成分分析網(wǎng)絡(luò),獲得訓(xùn)練圖像的主特征向量,(3)并用獲得的主特征向量訓(xùn)練分類器;為了驗(yàn)證分類的正確性,建立測(cè)試核主成分分析網(wǎng)絡(luò)對(duì)測(cè)試圖像進(jìn)行測(cè)試。發(fā)明通過(guò)構(gòu)造一個(gè)兩層的核主成分分析網(wǎng)絡(luò),能夠獲得圖像的非線性特征,使得圖像特征的描述更精確,分類也更為準(zhǔn)確,對(duì)于圖像分類問(wèn)題有著更高的正確率。
【IPC分類】G06K9-62
【公開(kāi)號(hào)】CN104573729
【申請(qǐng)?zhí)枴緾N201510037296
【發(fā)明人】吳丹, 伍家松, 姜龍玉, 楊淳沨, 達(dá)臻, 舒華忠
【申請(qǐng)人】東南大學(xué)
【公開(kāi)日】2015年4月29日
【申請(qǐng)日】2015年1月23日