本發(fā)明屬于機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,涉及了一種圖像分類(lèi)方法。
背景技術(shù):
隨著多媒體技術(shù)的發(fā)展,圖像分類(lèi)已成為計(jì)算機(jī)視覺(jué)領(lǐng)域研究的重點(diǎn),圖像分類(lèi)是依據(jù)圖像具有的某種屬性而將其劃分到預(yù)先設(shè)定的不同類(lèi)別中,如何將圖像進(jìn)行有效的表達(dá)是提高圖像分類(lèi)準(zhǔn)確率的關(guān)鍵,特征的選擇與提取問(wèn)題是圖像分類(lèi)目前存在的難點(diǎn)問(wèn)題。隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,人類(lèi)社會(huì)已進(jìn)入大數(shù)據(jù)時(shí)代。sift、hog等這些傳統(tǒng)的特征學(xué)習(xí)雖能提取圖像的某些特征,在圖像分類(lèi)中也取得了較好的效果,但這種人工設(shè)計(jì)特征方法存在一定的缺陷。近年來(lái),深度學(xué)習(xí)模型尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn)在特征提取中取得突破性進(jìn)展,但是cnn需要調(diào)整大量的參數(shù)和耗費(fèi)巨大的計(jì)算成本。目前計(jì)算成本已經(jīng)成為對(duì)象檢測(cè)/圖像分類(lèi)的一個(gè)核心問(wèn)題。
聚合局部特征已被廣泛應(yīng)用于2d圖像的分類(lèi)或檢索任務(wù)中。許多特征聚合算法已被提出,視覺(jué)詞袋模型(bag-of-visual-words,bow)是廣泛使用的模型之一。簡(jiǎn)而言之,該模型從每幅圖像提出一組局部特征,然后將這些局部特征量化為離散的視覺(jué)單詞,最后用一個(gè)緊湊的直方圖表示圖像。雖然bow模型具有較好的性能,但是該模型受限于以下兩點(diǎn):1、沒(méi)有考慮位置因素;2、基于特征的0階統(tǒng)計(jì)。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述背景技術(shù)提出的技術(shù)問(wèn)題,本發(fā)明旨在提供基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法,克服現(xiàn)有圖像分類(lèi)方法存在的缺陷,減少計(jì)算成本,提高分類(lèi)精度。
為了實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案為:
基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法,包括以下步驟:
(1)選定訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,分別構(gòu)建兩個(gè)數(shù)據(jù)集的基于局部圖像塊的特征描述子;
(2)利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子進(jìn)行聚類(lèi),獲取高斯混合模型參數(shù);
(3)生成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像的費(fèi)舍爾向量;
(4)對(duì)訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像構(gòu)建高斯空間金字塔;
(5)計(jì)算數(shù)據(jù)訓(xùn)練集和測(cè)試數(shù)據(jù)集中每幅圖像的高斯空間金字塔中每幅圖像的費(fèi)舍爾向量,從而構(gòu)成數(shù)據(jù)訓(xùn)練集和測(cè)試數(shù)據(jù)集的特征集合;
(6)采用互信息方法對(duì)訓(xùn)練數(shù)據(jù)集、測(cè)試數(shù)據(jù)集的特征集合進(jìn)行特征選擇;
(7)采用選擇后的訓(xùn)練數(shù)據(jù)集的特征值來(lái)訓(xùn)練分類(lèi)器,將測(cè)試數(shù)據(jù)集的特征值輸入訓(xùn)練好的分類(lèi)器中,實(shí)現(xiàn)圖像分類(lèi)。
進(jìn)一步地,步驟(1)的具體步驟如下:
(11)選定訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集;
(12)通過(guò)隨機(jī)采樣的方法分別在訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中的每幅圖像中提取t個(gè)圖像塊;
(13)對(duì)提取的圖像塊進(jìn)行亮度、對(duì)比度歸一化和白化預(yù)處理操作,將其轉(zhuǎn)換為基于像素值的列向量特征描述子,分別構(gòu)成訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子;
(14)對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子進(jìn)行pca降維處理。
進(jìn)一步地,步驟(2)的具體步驟如下:
(21)將k個(gè)高斯單元的高斯混合模型記為
(22)通過(guò)訓(xùn)練數(shù)據(jù)集特征描述子組成的集合c來(lái)估計(jì)高斯混合模型的所有參數(shù)θ={πi,μi,∑i,i=1,...k},構(gòu)造集合c的概率公式:
其中,s為集合c的特征描述子個(gè)數(shù);
(23)采用期望值最大算法,根據(jù)步驟(22)中的概率公式,對(duì)高斯混合模型進(jìn)行參數(shù)估計(jì)。
進(jìn)一步地,步驟(3)的具體步驟如下:
(31)利用高斯混合模型參數(shù),計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每個(gè)特征描述子在第i個(gè)高斯單元上的梯度向量;
(32)計(jì)算第i個(gè)高斯單元的概率密度函數(shù)pi的費(fèi)舍爾信息矩陣;
(33)對(duì)信息矩陣fi進(jìn)行柯列斯基分解,得到柯列斯基分量,將此分量與步驟(31)中得到的梯度向量相乘,得到數(shù)據(jù)集中每幅圖像的費(fèi)舍爾向量f0,從而構(gòu)成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的費(fèi)舍爾向量集。
進(jìn)一步地,步驟(4)的具體步驟如下:
(41)利用高斯卷積函數(shù)生成數(shù)據(jù)集中圖像i的尺度空間:l(q,y,σ)=g(q,y,σ)*i(q,y),其中,g(q,y,σ)是尺度可變的高斯卷積函數(shù),
(42)將步驟(41)得到的第一組金字塔的倒數(shù)第三層圖像進(jìn)行比例因子為2的下采樣操作,得到第二組金子塔的第一層圖像,通過(guò)變換不同的平滑系數(shù)k,得到第二組金字塔的若干層圖像;
(43)反復(fù)執(zhí)行步驟(41)-(42),一共得到o組金字塔,每組金字塔包含s層圖像,共計(jì)o×s幅圖像,這些圖像構(gòu)成圖像i的高斯空間金字塔。
進(jìn)一步地,步驟(5)的具體步驟如下:
(51)計(jì)算圖像i高斯空間金字塔中每幅圖像的費(fèi)舍爾向量fi,i=1,2,…,o×s,將o×s個(gè)費(fèi)舍爾向量以及步驟(33)求得的向量f0進(jìn)行串聯(lián),形成圖像i的特征表示f=[f0,f1,...,fo×s];
(52)將訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像進(jìn)行步驟(51)的操作,得到訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的特征集合。
進(jìn)一步地,步驟(6)的具體步驟如下:
(71)將訓(xùn)練數(shù)據(jù)集的特征集合和測(cè)試數(shù)據(jù)集的特征集合進(jìn)行轉(zhuǎn)置,設(shè)置訓(xùn)練樣本標(biāo)簽為l1,測(cè)試樣本標(biāo)簽為l2,l1和l2分別為訓(xùn)練樣本和測(cè)試樣本中每幅圖像種類(lèi)的一組數(shù)據(jù);
(72)建立訓(xùn)練數(shù)據(jù)集的特征集合中每一維特征與標(biāo)簽l1的互信息值模型:
i(x:i,l1)=h(l1)+h(x:i)-h(x:i,l1)
其中,h(x)為變量x的離散熵值,x:i為訓(xùn)練數(shù)據(jù)集的特征集合中第i維特征,則h(x:i,l1)表示在已知l1的情況下,變量x:i的離散熵值;
(73)使用1-bit量化方法求解離散熵值h(x):
其中,pj表示變量x落入第j個(gè)離散箱的概率值,離散箱如下式所示:
根據(jù)離散熵值和互信息值模型計(jì)算訓(xùn)練數(shù)據(jù)集的特征集合中每一維特征與標(biāo)簽l1的互信息值;
(74)對(duì)互信息值按照由大到小的順序進(jìn)行排序,選取前d個(gè)特征,并記錄前d個(gè)特征索引值index;
(75)根據(jù)步驟(74)得到的索引值index選取出測(cè)試數(shù)據(jù)集的特征集合中的d個(gè)特征。
采用上述技術(shù)方案帶來(lái)的有益效果:
(1)本發(fā)明直接采用局部圖像塊向量構(gòu)建局部特征描述子,有效地減少了計(jì)算成本、降低了計(jì)算復(fù)雜度;
(2)本發(fā)明構(gòu)建基于圖像尺度空間理論的高斯金字塔,尺度空間方法將傳統(tǒng)的單尺度圖像信息處理技術(shù)納入尺度不斷變化的動(dòng)態(tài)分析框架中,更容易獲取圖像的本質(zhì)特征。此外,尺度空間中各尺度圖像的模糊程度逐漸變大,能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過(guò)程;
(3)本發(fā)明使用費(fèi)舍爾向量(fishervector)取代傳統(tǒng)的bow,采用互信息方法對(duì)最終數(shù)據(jù)集的高維特征進(jìn)行特征選擇,從而達(dá)到理想的分類(lèi)結(jié)果。
附圖說(shuō)明
圖1是本發(fā)明的基本流程圖。
具體實(shí)施方式
以下將結(jié)合附圖,對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。
實(shí)施例以stl-10數(shù)據(jù)庫(kù)為例,該數(shù)據(jù)庫(kù)包含10類(lèi)rgb圖像,每幅圖像的大小為96*96。其中用于有監(jiān)督訓(xùn)練的訓(xùn)練樣本數(shù)共為5000,將5000個(gè)訓(xùn)練樣本劃分為十折,每次用于監(jiān)督訓(xùn)練的訓(xùn)練樣本數(shù)為1000,測(cè)試樣本數(shù)為8000。
基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法,如圖1所示,具體步驟如下。
步驟1,構(gòu)建基于局部圖像塊的描述子:
(1a)將待分類(lèi)的圖像數(shù)據(jù)集分為各種類(lèi)對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,其中訓(xùn)練數(shù)據(jù)集的數(shù)目為1000,測(cè)試數(shù)據(jù)集的數(shù)目為8000;
(1b)采取隨機(jī)采樣的方法分別對(duì)訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中的每幅圖像中提取1000個(gè)圖像塊,圖像塊的大小為8*8;
(1c)對(duì)采集的圖像塊進(jìn)行亮度和對(duì)比度歸一化和白化預(yù)處理操作,將其轉(zhuǎn)換為基于像素值的列向量特征描述子,分別構(gòu)成訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子;
(1d)對(duì)步驟(1c)中訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子進(jìn)行pca降維處理,獲取最終訓(xùn)練集和測(cè)試集特征描述子組成的集合,分別記為c、e;
步驟2,利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子進(jìn)行建模:利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集特征描述子集c進(jìn)行聚類(lèi),獲取高斯混合模型參數(shù)θ={πi,μi,∑i,i=1,...256},其中高斯單元的個(gè)數(shù)取為256,πi,μi,∑i分別表示第i個(gè)高斯單元的權(quán)重、均值和協(xié)方差矩陣:
(2a)將256個(gè)高斯單元的高斯混合模型記為
(2b)通過(guò)訓(xùn)練集特征描述子組成的集合c來(lái)估計(jì)高斯混合模型的所有參數(shù)θ={πi,μi,∑i,i=1,...256}。構(gòu)造集合c的概率公式為:
(2c)采用期望值最大算法根據(jù)步驟(2b)中的概率公式對(duì)高斯混合模型進(jìn)行參數(shù)估計(jì);
步驟3,分別生成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像的fishervector:
(3a)設(shè)x={xt,t=1,...,1000}是數(shù)據(jù)集中圖像i的特征描述子集合,pθ是對(duì)x進(jìn)行生成過(guò)程建模的概率密度函數(shù),利用高斯混合模型參數(shù)θ,計(jì)算x中每個(gè)特征描述子在參數(shù)中第i個(gè)高斯單元上的梯度向量;
(3b)計(jì)算概率密度函數(shù)pi的fisher信息矩陣fi;
(3c)對(duì)信息矩陣fi進(jìn)行柯列斯基分解從而得到柯列斯基分量,將此分量與步驟(3a)中得到的梯度向量相乘,由此可得到圖像i的fishervectorf0;
(3d)計(jì)算數(shù)據(jù)集所有圖像的fishervector,從而構(gòu)成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的fishervector集;
步驟4,構(gòu)建高斯空間金字塔:
(4a)利用高斯卷積函數(shù)生成圖像i尺度空間:l(q,y,σ)=g(q,y,σ)*i(q,y)。g(q,y,σ)是尺度可變高斯函數(shù),記為
(4b)將步驟(4a)一組金字塔的倒數(shù)第三層圖像作比例因子為2的下采樣操作,得到第二組金子塔的第一層圖像,通過(guò)變換不同的平滑系數(shù)2σ,2kσ,2k2σ...,得到第二組o2金字塔的若干層圖像;
(4c)反復(fù)執(zhí)行步驟(4a)和(4b),可得到一共o組,每組s層圖像,共計(jì)o*s幅圖像,這些圖像構(gòu)成高斯空間金字塔,優(yōu)選地,o=3,s=4,其中,令
步驟5,計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的最終特征描述:
(5a)計(jì)算圖像i高斯空間金字塔中每幅圖像的fishervectorfj,j=1,...,12。將12個(gè)fishervector與步驟(3c)得到的向量f0進(jìn)行串聯(lián),形成圖像i最終的特征表示f=[f0,f1,...,f12];
(5b)分別計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的每幅圖像最終的特征表示,形成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集最終特征描述集合為trainfeature、testfeature;
步驟6,采用互信息方法對(duì)最終的數(shù)據(jù)集特征進(jìn)行特征選擇,對(duì)于步驟(5b)中數(shù)據(jù)集最終的高維特征向量,使用基于重要性排序的互信息方法來(lái)進(jìn)行特征選擇。
具體實(shí)現(xiàn)步驟如下:
(6a)將步驟(5b)中的最終特征描述集合trainfeature、testfeature進(jìn)行轉(zhuǎn)置,記訓(xùn)練集樣本標(biāo)簽和測(cè)試集樣本標(biāo)簽分別為l1和l2,訓(xùn)練圖像特征集合中每一維特征的重要性即為所需獲取的互信息,計(jì)算表達(dá)式為:
i(x:i,l1)=h(l1)+h(x:i)-h(x:i,l1),其中x:i表示trainfeature的第i維特征,h表示隨機(jī)變量的熵值;
(6b)使用1-bit量化方法取代估計(jì)概率密度函數(shù)。1-bit量化將實(shí)數(shù)x量化至兩個(gè)離散箱(bin),可通過(guò)如下公式進(jìn)行計(jì)算:
離散熵值h(x:i)和h(x:i,l1)可進(jìn)一步通過(guò)公式h(x)=-∑jpjlog2(pj)計(jì)算,pj表示x落入第j個(gè)離散箱的概率值,其中j=1,2;
(6c)計(jì)算trainfeature中每一維特征互信息值i(x:i,l1),然后對(duì)其進(jìn)行排序,選取前d個(gè)特征,優(yōu)選地,d=10000,并記錄前d個(gè)特征索引值index;
(6d)根據(jù)步驟(6b)(6c)計(jì)算testfeature中每一維特征互信息值i(x':i,l2),x':i表示testfeature的第i維特征。根據(jù)步驟(6c)得到的索引值index選取前d個(gè)特征;
步驟7,采用步驟6中經(jīng)過(guò)特征選擇后訓(xùn)練樣本的特征值來(lái)訓(xùn)練svm分類(lèi)器,將測(cè)試樣本的特征值輸入已訓(xùn)練的svm分類(lèi)器中實(shí)現(xiàn)圖像分類(lèi)。
實(shí)施例僅為說(shuō)明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護(hù)范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng),均落入本發(fā)明保護(hù)范圍之內(nèi)。