基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法與流程

文檔序號(hào)：11387304閱讀：235來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域，涉及了一種圖像分類(lèi)方法。

背景技術(shù)：

隨著多媒體技術(shù)的發(fā)展，圖像分類(lèi)已成為計(jì)算機(jī)視覺(jué)領(lǐng)域研究的重點(diǎn)，圖像分類(lèi)是依據(jù)圖像具有的某種屬性而將其劃分到預(yù)先設(shè)定的不同類(lèi)別中，如何將圖像進(jìn)行有效的表達(dá)是提高圖像分類(lèi)準(zhǔn)確率的關(guān)鍵，特征的選擇與提取問(wèn)題是圖像分類(lèi)目前存在的難點(diǎn)問(wèn)題。隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展，人類(lèi)社會(huì)已進(jìn)入大數(shù)據(jù)時(shí)代。sift、hog等這些傳統(tǒng)的特征學(xué)習(xí)雖能提取圖像的某些特征，在圖像分類(lèi)中也取得了較好的效果，但這種人工設(shè)計(jì)特征方法存在一定的缺陷。近年來(lái)，深度學(xué)習(xí)模型尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn)在特征提取中取得突破性進(jìn)展，但是cnn需要調(diào)整大量的參數(shù)和耗費(fèi)巨大的計(jì)算成本。目前計(jì)算成本已經(jīng)成為對(duì)象檢測(cè)/圖像分類(lèi)的一個(gè)核心問(wèn)題。

聚合局部特征已被廣泛應(yīng)用于2d圖像的分類(lèi)或檢索任務(wù)中。許多特征聚合算法已被提出，視覺(jué)詞袋模型(bag-of-visual-words,bow)是廣泛使用的模型之一。簡(jiǎn)而言之，該模型從每幅圖像提出一組局部特征，然后將這些局部特征量化為離散的視覺(jué)單詞，最后用一個(gè)緊湊的直方圖表示圖像。雖然bow模型具有較好的性能，但是該模型受限于以下兩點(diǎn)：1、沒(méi)有考慮位置因素；2、基于特征的0階統(tǒng)計(jì)。

技術(shù)實(shí)現(xiàn)要素：

為了解決上述背景技術(shù)提出的技術(shù)問(wèn)題，本發(fā)明旨在提供基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法，克服現(xiàn)有圖像分類(lèi)方法存在的缺陷，減少計(jì)算成本，提高分類(lèi)精度。

為了實(shí)現(xiàn)上述技術(shù)目的，本發(fā)明的技術(shù)方案為：

基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法，包括以下步驟：

(1)選定訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集，分別構(gòu)建兩個(gè)數(shù)據(jù)集的基于局部圖像塊的特征描述子；

(2)利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子進(jìn)行聚類(lèi)，獲取高斯混合模型參數(shù)；

(3)生成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像的費(fèi)舍爾向量；

(4)對(duì)訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像構(gòu)建高斯空間金字塔；

(5)計(jì)算數(shù)據(jù)訓(xùn)練集和測(cè)試數(shù)據(jù)集中每幅圖像的高斯空間金字塔中每幅圖像的費(fèi)舍爾向量，從而構(gòu)成數(shù)據(jù)訓(xùn)練集和測(cè)試數(shù)據(jù)集的特征集合；

(6)采用互信息方法對(duì)訓(xùn)練數(shù)據(jù)集、測(cè)試數(shù)據(jù)集的特征集合進(jìn)行特征選擇；

(7)采用選擇后的訓(xùn)練數(shù)據(jù)集的特征值來(lái)訓(xùn)練分類(lèi)器，將測(cè)試數(shù)據(jù)集的特征值輸入訓(xùn)練好的分類(lèi)器中，實(shí)現(xiàn)圖像分類(lèi)。

進(jìn)一步地，步驟(1)的具體步驟如下：

(11)選定訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集；

(12)通過(guò)隨機(jī)采樣的方法分別在訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中的每幅圖像中提取t個(gè)圖像塊；

(13)對(duì)提取的圖像塊進(jìn)行亮度、對(duì)比度歸一化和白化預(yù)處理操作，將其轉(zhuǎn)換為基于像素值的列向量特征描述子，分別構(gòu)成訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子；

(14)對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子進(jìn)行pca降維處理。

進(jìn)一步地，步驟(2)的具體步驟如下：

(21)將k個(gè)高斯單元的高斯混合模型記為其中，pi(x)代表第i個(gè)高斯單元，d表示特征描述子x的維數(shù)，πi,μi,∑i分別表示第i個(gè)高斯單元的權(quán)重、均值和協(xié)方差矩陣；

(22)通過(guò)訓(xùn)練數(shù)據(jù)集特征描述子組成的集合c來(lái)估計(jì)高斯混合模型的所有參數(shù)θ＝{πi,μi,∑i,i＝1,...k}，構(gòu)造集合c的概率公式：

其中，s為集合c的特征描述子個(gè)數(shù)；

(23)采用期望值最大算法，根據(jù)步驟(22)中的概率公式，對(duì)高斯混合模型進(jìn)行參數(shù)估計(jì)。

進(jìn)一步地，步驟(3)的具體步驟如下：

(31)利用高斯混合模型參數(shù)，計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每個(gè)特征描述子在第i個(gè)高斯單元上的梯度向量；

(32)計(jì)算第i個(gè)高斯單元的概率密度函數(shù)pi的費(fèi)舍爾信息矩陣；

(33)對(duì)信息矩陣fi進(jìn)行柯列斯基分解，得到柯列斯基分量，將此分量與步驟(31)中得到的梯度向量相乘，得到數(shù)據(jù)集中每幅圖像的費(fèi)舍爾向量f0，從而構(gòu)成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的費(fèi)舍爾向量集。

進(jìn)一步地，步驟(4)的具體步驟如下：

(41)利用高斯卷積函數(shù)生成數(shù)據(jù)集中圖像i的尺度空間：l(q,y,σ)＝g(q,y,σ)*i(q,y)，其中，g(q,y,σ)是尺度可變的高斯卷積函數(shù)，“*”表示卷積運(yùn)算，(q,y)是圖像i上的空間坐標(biāo)，σ是尺度坐標(biāo)，k是平滑系數(shù)；通過(guò)變換不同的平滑系數(shù)k形成多幅圖像，將這多幅圖像構(gòu)成圖像i的第一組金字塔的若干層圖像；

(42)將步驟(41)得到的第一組金字塔的倒數(shù)第三層圖像進(jìn)行比例因子為2的下采樣操作，得到第二組金子塔的第一層圖像，通過(guò)變換不同的平滑系數(shù)k，得到第二組金字塔的若干層圖像；

(43)反復(fù)執(zhí)行步驟(41)-(42)，一共得到o組金字塔，每組金字塔包含s層圖像，共計(jì)o×s幅圖像，這些圖像構(gòu)成圖像i的高斯空間金字塔。

進(jìn)一步地，步驟(5)的具體步驟如下：

(51)計(jì)算圖像i高斯空間金字塔中每幅圖像的費(fèi)舍爾向量fi，i＝1,2,…,o×s，將o×s個(gè)費(fèi)舍爾向量以及步驟(33)求得的向量f0進(jìn)行串聯(lián)，形成圖像i的特征表示f＝[f0,f1,...,fo×s]；

(52)將訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像進(jìn)行步驟(51)的操作，得到訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的特征集合。

進(jìn)一步地，步驟(6)的具體步驟如下：

(71)將訓(xùn)練數(shù)據(jù)集的特征集合和測(cè)試數(shù)據(jù)集的特征集合進(jìn)行轉(zhuǎn)置，設(shè)置訓(xùn)練樣本標(biāo)簽為l1，測(cè)試樣本標(biāo)簽為l2，l1和l2分別為訓(xùn)練樣本和測(cè)試樣本中每幅圖像種類(lèi)的一組數(shù)據(jù)；

(72)建立訓(xùn)練數(shù)據(jù)集的特征集合中每一維特征與標(biāo)簽l1的互信息值模型：

i(x:i,l1)＝h(l1)+h(x:i)-h(x:i,l1)

其中，h(x)為變量x的離散熵值，x:i為訓(xùn)練數(shù)據(jù)集的特征集合中第i維特征，則h(x:i,l1)表示在已知l1的情況下，變量x:i的離散熵值；

(73)使用1-bit量化方法求解離散熵值h(x)：

其中，pj表示變量x落入第j個(gè)離散箱的概率值，離散箱如下式所示：

根據(jù)離散熵值和互信息值模型計(jì)算訓(xùn)練數(shù)據(jù)集的特征集合中每一維特征與標(biāo)簽l1的互信息值；

(74)對(duì)互信息值按照由大到小的順序進(jìn)行排序，選取前d個(gè)特征，并記錄前d個(gè)特征索引值index；

(75)根據(jù)步驟(74)得到的索引值index選取出測(cè)試數(shù)據(jù)集的特征集合中的d個(gè)特征。

采用上述技術(shù)方案帶來(lái)的有益效果：

(1)本發(fā)明直接采用局部圖像塊向量構(gòu)建局部特征描述子，有效地減少了計(jì)算成本、降低了計(jì)算復(fù)雜度；

(2)本發(fā)明構(gòu)建基于圖像尺度空間理論的高斯金字塔，尺度空間方法將傳統(tǒng)的單尺度圖像信息處理技術(shù)納入尺度不斷變化的動(dòng)態(tài)分析框架中，更容易獲取圖像的本質(zhì)特征。此外，尺度空間中各尺度圖像的模糊程度逐漸變大，能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過(guò)程；

(3)本發(fā)明使用費(fèi)舍爾向量(fishervector)取代傳統(tǒng)的bow，采用互信息方法對(duì)最終數(shù)據(jù)集的高維特征進(jìn)行特征選擇，從而達(dá)到理想的分類(lèi)結(jié)果。

附圖說(shuō)明

圖1是本發(fā)明的基本流程圖。

具體實(shí)施方式

以下將結(jié)合附圖，對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。

實(shí)施例以stl-10數(shù)據(jù)庫(kù)為例，該數(shù)據(jù)庫(kù)包含10類(lèi)rgb圖像，每幅圖像的大小為96*96。其中用于有監(jiān)督訓(xùn)練的訓(xùn)練樣本數(shù)共為5000，將5000個(gè)訓(xùn)練樣本劃分為十折，每次用于監(jiān)督訓(xùn)練的訓(xùn)練樣本數(shù)為1000，測(cè)試樣本數(shù)為8000。

基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法，如圖1所示，具體步驟如下。

步驟1，構(gòu)建基于局部圖像塊的描述子：

(1a)將待分類(lèi)的圖像數(shù)據(jù)集分為各種類(lèi)對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集，其中訓(xùn)練數(shù)據(jù)集的數(shù)目為1000，測(cè)試數(shù)據(jù)集的數(shù)目為8000；

(1b)采取隨機(jī)采樣的方法分別對(duì)訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中的每幅圖像中提取1000個(gè)圖像塊，圖像塊的大小為8*8；

(1c)對(duì)采集的圖像塊進(jìn)行亮度和對(duì)比度歸一化和白化預(yù)處理操作，將其轉(zhuǎn)換為基于像素值的列向量特征描述子，分別構(gòu)成訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子；

(1d)對(duì)步驟(1c)中訓(xùn)練數(shù)據(jù)集的特征描述子和測(cè)試數(shù)據(jù)集的特征描述子進(jìn)行pca降維處理，獲取最終訓(xùn)練集和測(cè)試集特征描述子組成的集合，分別記為c、e；

步驟2，利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集的特征描述子進(jìn)行建模：利用高斯混合模型對(duì)訓(xùn)練數(shù)據(jù)集特征描述子集c進(jìn)行聚類(lèi)，獲取高斯混合模型參數(shù)θ＝{πi,μi,∑i,i＝1,...256}，其中高斯單元的個(gè)數(shù)取為256，πi,μi,∑i分別表示第i個(gè)高斯單元的權(quán)重、均值和協(xié)方差矩陣：

(2a)將256個(gè)高斯單元的高斯混合模型記為其中pi(x)代表第i個(gè)高斯單元，d表示特征描述子x的維數(shù)；

(2b)通過(guò)訓(xùn)練集特征描述子組成的集合c來(lái)估計(jì)高斯混合模型的所有參數(shù)θ＝{πi,μi,∑i,i＝1,...256}。構(gòu)造集合c的概率公式為：

其中，s為集合c的特征描述子個(gè)數(shù)，s的值為1000；

(2c)采用期望值最大算法根據(jù)步驟(2b)中的概率公式對(duì)高斯混合模型進(jìn)行參數(shù)估計(jì)；

步驟3，分別生成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集中每幅圖像的fishervector：

(3a)設(shè)x＝{xt,t＝1,...,1000}是數(shù)據(jù)集中圖像i的特征描述子集合，pθ是對(duì)x進(jìn)行生成過(guò)程建模的概率密度函數(shù)，利用高斯混合模型參數(shù)θ，計(jì)算x中每個(gè)特征描述子在參數(shù)中第i個(gè)高斯單元上的梯度向量；

(3b)計(jì)算概率密度函數(shù)pi的fisher信息矩陣fi；

(3c)對(duì)信息矩陣fi進(jìn)行柯列斯基分解從而得到柯列斯基分量，將此分量與步驟(3a)中得到的梯度向量相乘，由此可得到圖像i的fishervectorf0；

(3d)計(jì)算數(shù)據(jù)集所有圖像的fishervector，從而構(gòu)成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的fishervector集；

步驟4，構(gòu)建高斯空間金字塔：

(4a)利用高斯卷積函數(shù)生成圖像i尺度空間：l(q,y,σ)＝g(q,y,σ)*i(q,y)。g(q,y,σ)是尺度可變高斯函數(shù)，記為其中(q,y)是空間坐標(biāo)，σ是尺度坐標(biāo)。通過(guò)變換不同的平滑系數(shù)σ,kσ,k²σ...形成多幅圖像，將這些多幅圖像構(gòu)成第一組o1金字塔的若干層圖像；

(4b)將步驟(4a)一組金字塔的倒數(shù)第三層圖像作比例因子為2的下采樣操作，得到第二組金子塔的第一層圖像，通過(guò)變換不同的平滑系數(shù)2σ,2kσ,2k²σ...，得到第二組o2金字塔的若干層圖像；

(4c)反復(fù)執(zhí)行步驟(4a)和(4b)，可得到一共o組，每組s層圖像，共計(jì)o*s幅圖像，這些圖像構(gòu)成高斯空間金字塔，優(yōu)選地，o＝3,s＝4，其中，令可得σ＝σ02°·k^s，取σ0＝1.6·2^1/s；

步驟5，計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的最終特征描述：

(5a)計(jì)算圖像i高斯空間金字塔中每幅圖像的fishervectorfj,j＝1,...,12。將12個(gè)fishervector與步驟(3c)得到的向量f0進(jìn)行串聯(lián)，形成圖像i最終的特征表示f＝[f0,f1,...,f12]；

(5b)分別計(jì)算訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的每幅圖像最終的特征表示，形成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集最終特征描述集合為trainfeature、testfeature；

步驟6，采用互信息方法對(duì)最終的數(shù)據(jù)集特征進(jìn)行特征選擇，對(duì)于步驟(5b)中數(shù)據(jù)集最終的高維特征向量，使用基于重要性排序的互信息方法來(lái)進(jìn)行特征選擇。

具體實(shí)現(xiàn)步驟如下：

(6a)將步驟(5b)中的最終特征描述集合trainfeature、testfeature進(jìn)行轉(zhuǎn)置，記訓(xùn)練集樣本標(biāo)簽和測(cè)試集樣本標(biāo)簽分別為l1和l2，訓(xùn)練圖像特征集合中每一維特征的重要性即為所需獲取的互信息，計(jì)算表達(dá)式為：

i(x:i,l1)＝h(l1)+h(x:i)-h(x:i,l1)，其中x:i表示trainfeature的第i維特征，h表示隨機(jī)變量的熵值；

(6b)使用1-bit量化方法取代估計(jì)概率密度函數(shù)。1-bit量化將實(shí)數(shù)x量化至兩個(gè)離散箱(bin)，可通過(guò)如下公式進(jìn)行計(jì)算：

離散熵值h(x:i)和h(x:i,l1)可進(jìn)一步通過(guò)公式h(x)＝-∑jpjlog2(pj)計(jì)算，pj表示x落入第j個(gè)離散箱的概率值，其中j＝1,2；

(6c)計(jì)算trainfeature中每一維特征互信息值i(x:i,l1)，然后對(duì)其進(jìn)行排序，選取前d個(gè)特征，優(yōu)選地，d＝10000，并記錄前d個(gè)特征索引值index；

(6d)根據(jù)步驟(6b)(6c)計(jì)算testfeature中每一維特征互信息值i(x':i,l2)，x':i表示testfeature的第i維特征。根據(jù)步驟(6c)得到的索引值index選取前d個(gè)特征；

步驟7，采用步驟6中經(jīng)過(guò)特征選擇后訓(xùn)練樣本的特征值來(lái)訓(xùn)練svm分類(lèi)器，將測(cè)試樣本的特征值輸入已訓(xùn)練的svm分類(lèi)器中實(shí)現(xiàn)圖像分類(lèi)。

實(shí)施例僅為說(shuō)明本發(fā)明的技術(shù)思想，不能以此限定本發(fā)明的保護(hù)范圍，凡是按照本發(fā)明提出的技術(shù)思想，在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng)，均落入本發(fā)明保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳霜霜;劉慧義;曾曉勤;孟志偉;楊雪
技術(shù)所有人：河海大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：一種智能終端箱降溫除濕裝置的制造方法
上一篇：PCB支承框架、PCB組件和電力電子單元的制造方法與工藝

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

向量圖像相關(guān)技術(shù)

圖像特征向量相關(guān)技術(shù)

特征向量圖像配準(zhǔn)相關(guān)技術(shù)

向量式圖像相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于局部圖像塊描述子和費(fèi)舍爾向量的圖像分類(lèi)方法與流程