亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議的制作方法

文檔序號:12671347閱讀:235來源:國知局
一種基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議的制作方法與工藝

本發(fā)明涉及一種自然界圖像的分類算法,尤其涉及一種基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議,適用于圖像信息、圖像分類與檢索技術(shù)領(lǐng)域。



背景技術(shù):

隨著數(shù)字技術(shù)、信息技術(shù)和多媒體技術(shù)的快速發(fā)展,數(shù)字圖像已成為人們?nèi)粘I钪胁豢扇鄙俚囊徊糠?,而且圖像的數(shù)量正以驚人的速度增長,面對越來越多的圖像信息,圖像分類與檢索已成為研究的重點(diǎn)。傳統(tǒng)的基于文本和標(biāo)注的分類與檢索方法存在一些缺點(diǎn):費(fèi)時(shí)、費(fèi)力;數(shù)字圖像的快速增加使得對全部圖像做標(biāo)注幾乎變得不可能;標(biāo)注者主觀影響很大。這使得基于文本和標(biāo)注的圖像分類和檢索的發(fā)展受到限制。隨后有大量研究基于內(nèi)容的圖像分類與檢索(Content Based Image Retrieval-CBIR)展開,該技術(shù)克服了人工標(biāo)注的缺點(diǎn),可以實(shí)現(xiàn)自動(dòng)、智能化的分類、檢索與管理。圖像分類問題目前的難點(diǎn)主要體現(xiàn)在兩方面:(1)特征的選擇和提取問題;(2)分類器的選擇和學(xué)習(xí)問題。

特征選擇和提取是圖像分類的基礎(chǔ)。圖像特征有兩類,一類是底層視覺特征,包括顏色、形狀和紋理特征、SIFT(尺度不變特征轉(zhuǎn)換)特征等;另一類是中層語義特征,主要有語義特征、區(qū)域語義概念特征、BOW特征等。

在分類器方法,當(dāng)前的多數(shù)分類學(xué)習(xí)算法多為淺層結(jié)構(gòu)算法,包括常見的支持向量機(jī)(SVM)、Booting和Logistic Regre-ssion等。SVM應(yīng)用的典型流程是首先提取出圖像局部特征,并形成特征碼,然后將每幅圖像的局部特征所形成特征單詞的直方圖作為特征,最后通過SVM進(jìn)行訓(xùn)練得到模型,其局限性在于有限樣本和計(jì)算單元情況下對復(fù)雜函數(shù)的表示能力有限,針對復(fù)雜分類問題其泛化能力受到一定制約。BP算法是傳統(tǒng)訓(xùn)練多層網(wǎng)絡(luò)的典型算法,而實(shí)際上對于僅包含幾層的網(wǎng)絡(luò),該訓(xùn)練方法就已很不理想。深度學(xué)習(xí)通過組合底層特征形成更加抽象的高層表示(屬性類別或特征),以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。使用高維的圖像描述符和線性分類器相結(jié)合的方法是目前較常用的圖像分類方法。

Lecun Y等(Lecun Y,Bottou L,Bengio Y,et al.Gradlent-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11)∶2278-2324)提出了基于貪心逐層非監(jiān)督學(xué)習(xí)過程的深度置信網(wǎng)絡(luò)(DBN)的概念。DBN由多層受限波爾茲曼機(jī)(Restricted Boltzann Mechines-RBM)組成的深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),解決了傳統(tǒng)BP算法訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的難題。DBN作為一種深度學(xué)習(xí)網(wǎng)絡(luò),其本質(zhì)上把學(xué)習(xí)結(jié)構(gòu)看作一個(gè)網(wǎng)絡(luò),則深度學(xué)習(xí)的核心思路如下:(1)無監(jiān)督學(xué)習(xí)用于每一層網(wǎng)絡(luò)的預(yù)訓(xùn)練;(2)每次用無監(jiān)督學(xué)習(xí)只訓(xùn)練一層,將其訓(xùn)練結(jié)果作為其高一層的輸入;(3)用監(jiān)督學(xué)習(xí)去調(diào)整所有層,也就是堆疊多個(gè)層,上一層的輸出作為下一層的輸入。通過這種方式,即可實(shí)現(xiàn)對輸入信息的分級表達(dá)。深度置信網(wǎng)絡(luò)訓(xùn)練可分成兩階段,第一階段是無監(jiān)督特征學(xué)習(xí);第二階段是有監(jiān)督網(wǎng)絡(luò)參數(shù)微調(diào)和分類。目前深度置信網(wǎng)絡(luò)已成功應(yīng)用于手寫字體識別、語音識別等領(lǐng)域,取得了較好的效果。

隨后,大量學(xué)者進(jìn)行了相關(guān)研究,并對DBN算法進(jìn)行了改進(jìn),如孫勁光等(孫勁光,蔣金葉,孟祥福 一種數(shù)值屬性的深度置信網(wǎng)絡(luò)分類方法[J]計(jì)算機(jī)工程2014 33(18)125-131)提出數(shù)值屬性的DBN,并在UCI的多個(gè)數(shù)據(jù)集上進(jìn)行對比驗(yàn)證,證明其有效性。付燕等(付燕 鮮艷明等 基于多特征和改進(jìn)SVM集成的圖像分[J]計(jì)算機(jī)工程 2011 37(21):196-199)認(rèn)為現(xiàn)有圖像分類方法不能充分利用圖像各單一特征之間的優(yōu)勢互補(bǔ)特性面,導(dǎo)致分類不精確,其采用主成分分析對所提取的特征進(jìn)行變換,使用支持向量機(jī)的集成分類器進(jìn)行分類,通過仿真實(shí)驗(yàn)表明多特征比單一特征具有更好的圖像分類精度和更快的分類速度。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的是克服現(xiàn)有單一特征描述符及淺層結(jié)構(gòu)分類算法分類正確率較低、效率較低的問題,提供一種分類正確率高、效率高的深度置信網(wǎng)絡(luò)圖像分類協(xié)議。

為了解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是提供一種基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議,其特征在于,步驟為:

步驟1:提取樣本圖像中的顏色、紋理和形狀特征,構(gòu)成多特征融合的權(quán)重矩陣;

步驟2:對所述權(quán)重矩陣進(jìn)行歸一化處理;

步驟3:利用歸一化處理后的權(quán)重矩陣作為原始數(shù)據(jù)對深度置信網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試,得出分類結(jié)果。

優(yōu)選地,所述深度置信網(wǎng)絡(luò)是由多個(gè)受限波爾茲曼機(jī)模型RBM連接在一起的結(jié)構(gòu)和一個(gè)BP神經(jīng)網(wǎng)絡(luò)構(gòu)成的深度結(jié)構(gòu);將各層RBM連接,前一層RBM的輸出作為后一層RBM的輸入,最后一層RBM輸出作為BP神經(jīng)網(wǎng)絡(luò)的輸入,構(gòu)成整個(gè)深度置信網(wǎng)絡(luò);所述原始數(shù)據(jù)輸入第一層RBM,BP神經(jīng)網(wǎng)絡(luò)的輸出即為分類結(jié)果。

優(yōu)選地,所述RBM將原始數(shù)據(jù)進(jìn)行逐層的特征提取,從具體到抽象,使得神經(jīng)網(wǎng)絡(luò)得到的輸入成為一個(gè)更加易于分類的特征向量,同時(shí),多層RBM組成的深度結(jié)構(gòu)使得在特征提取過程中的錯(cuò)誤或者冗余信息被逐層弱化,并最終在BP神經(jīng)網(wǎng)絡(luò)的反向調(diào)整過程中使模型達(dá)到整體最優(yōu)。

優(yōu)選地,所述步驟3中,從原始數(shù)據(jù)中,隨機(jī)選擇80%~90%作為訓(xùn)練集,其余作為測試集。

優(yōu)選地,利用所述訓(xùn)練集對深度置信網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到深度置信網(wǎng)絡(luò)的權(quán)重和偏置參數(shù);采用訓(xùn)練過程得到的參數(shù)確定的深度置信網(wǎng)絡(luò)對測試集進(jìn)行測試,并進(jìn)行誤差評估,得出分類結(jié)果。

本發(fā)明提供的協(xié)議基于底層圖像特征和深度置信網(wǎng)絡(luò)DBN,側(cè)重于圖像底層特性,在詳細(xì)而全面的分析圖像底層特性的前提下,提取樣本圖像中的顏色、紋理和形狀特征,構(gòu)成多特征融合的權(quán)重矩陣,并對特征矩陣進(jìn)行歸一化處理,利用構(gòu)建的四層DBN分類器進(jìn)行訓(xùn)練和分類。采用Corel圖庫,通過訓(xùn)練權(quán)重進(jìn)行測試,算法實(shí)際實(shí)施的效果表明,該算法的平均分類正確率遠(yuǎn)高于使用單一特征的分類算法和其他主流分類算法。

相比現(xiàn)有技術(shù),本發(fā)明提供的基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議具有如下有益效果:

1、良好的可擴(kuò)展性。協(xié)議對同一時(shí)刻識別的圖像數(shù)量沒設(shè)上限,理論上,只要恰當(dāng)選取各圖像的綜合特這并進(jìn)行融合,都能識別。因此,協(xié)議的可擴(kuò)展性較好。

2、多特征的融合。多特征融合能夠改善單一特征區(qū)分圖像很容易造成圖像的顯著征丟失從而降低分類精度的問題,同時(shí)有效緩和因單幅圖顯著特征丟失造成分類精度降低的現(xiàn)象,提高了分類的正確率。

3、DBN分類器。深度學(xué)習(xí)通過組合底層特征形成更加抽象的高層表示或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布的特征表示,提高了分類的效率。

附圖說明

圖1為RBM網(wǎng)絡(luò)結(jié)構(gòu)示意圖;

圖2為DBN分類器的結(jié)構(gòu)示意圖;

圖3為基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議流程圖;

圖4為Corel圖;

圖5為實(shí)驗(yàn)中各組的分類正確率示意圖;

圖6為10類圖像的誤分率。

具體實(shí)施方式

下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。此外應(yīng)理解,在閱讀了本發(fā)明講授的內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請所附權(quán)利要求書所限定的范圍。

本發(fā)明提供了一種基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議IBFCP,IBFCP基于多種特征,從而可以提供較高的辨識度,而辨識度越高,分類也就越容易。

1、特征表達(dá)

圖像特征的提取和表達(dá)是圖像分類技術(shù)的基礎(chǔ)。一般來講,基于內(nèi)容圖像檢索的特征以視覺特征為主,主要包括顏色、紋理、形狀特征三類。

1)顏色特征

顏色特征是基于內(nèi)容圖像檢索中最重要、應(yīng)用最廣泛的視覺特征,主要是因?yàn)樗崛『唵危哂行D(zhuǎn)不變性、尺度不變性、平移不變性等優(yōu)點(diǎn),而且對觀測視角的變化也不太敏感。目前,應(yīng)用較多的顏色特征主要有顏色直方圖、顏色矩(一階矩、二階矩及三階矩)、顏色相關(guān)圖、顏色信息熵等。這些特征可以在不同的顏色空間中進(jìn)行提取(如RGB,HSV空間等)。

2)紋理特征

紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征,紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。紋理特征在基于內(nèi)容的圖像分類中得到了廣泛的應(yīng)用,用戶可以通過紋理特征相似性對圖像進(jìn)行分類。

圖像分類中所常用的那些紋理特征,主要有Tamura紋理特征、自回歸紋理模型、方向性特征、小波變換和共生矩陣等形式。

3)形狀特征

物體和區(qū)域的形狀是圖像分類和檢索中的另一重要特征。它不同于顏色或紋理等底層特征,形狀特征的表達(dá)以對圖像中物體或區(qū)域的劃分為基礎(chǔ)。由于當(dāng)前的技術(shù)無法做到準(zhǔn)確而魯棒的自動(dòng)圖像分割,圖像分類中的形狀特征只能同其他特征一起應(yīng)用。另一方面,由于人們對物體形狀的變換旋轉(zhuǎn)和縮放主觀上不太敏感,合適的形狀特征必須滿足對變換、旋轉(zhuǎn)和縮放無關(guān),這對形狀相似度的計(jì)算也帶來了難度。

圖像分類中所用的形狀特征主要有Hu不變矩、邊緣方向直方圖、傅里葉描述符、Z矩、方向梯度直方圖等。

2、深度置信網(wǎng)絡(luò)DBN

深度學(xué)習(xí)通過組合底層特征形成更加抽象的高層表示或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布的特征表示。DBN是在深度架構(gòu)上的推廣,由RBM模型擴(kuò)展而來。DBN是包含多個(gè)隱層(隱層數(shù)大于2)的概率生成模型,并且可以有效地表示、訓(xùn)練非線性數(shù)據(jù)。當(dāng)前層從前一層的隱含單元捕獲高度相關(guān)的關(guān)聯(lián),建立一個(gè)觀察數(shù)據(jù)和標(biāo)簽之間的聯(lián)合分布。DBN的核心思想是自底向上每一層受限波爾茲曼機(jī)對輸入數(shù)據(jù)進(jìn)行提取、抽象,盡可能保留重要信息。

1)受限波爾茲曼機(jī)模型RBM

RBM是一個(gè)無監(jiān)督學(xué)習(xí)的能量模型,它包括顯層(輸入層)和隱層(輸出層)兩層結(jié)構(gòu),對稱連接且無自反饋的隨機(jī)神經(jīng)網(wǎng)絡(luò)模型,層間全連接,層內(nèi)無連接。如果顯示單元分成2類(只有0或1),RBM可用聯(lián)合概率分布來表示。

RBM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,其中,v為顯層,用于表示觀測數(shù)據(jù);h為隱層,可看作一些特征提取器;W為兩層間的連接權(quán)重。RBM的隱層單元和顯層單元可以為任意的指數(shù)族單元(即給定隱層單元/顯層單元,顯層單元/隱層單元的分布可以為任意的指數(shù)族分布),如softmax單元、高斯單元、泊松單元等。

圖1中,RBM網(wǎng)絡(luò)結(jié)構(gòu)有m個(gè)顯層節(jié)點(diǎn)和n個(gè)隱層節(jié)點(diǎn),m、n均為正整數(shù),其中每個(gè)顯層節(jié)點(diǎn)只和n個(gè)隱層節(jié)點(diǎn)相關(guān),和其他顯層節(jié)點(diǎn)是獨(dú)立的,就是這個(gè)顯層節(jié)點(diǎn)的狀態(tài)只受n個(gè)隱層節(jié)點(diǎn)的影響,同樣對于每個(gè)隱層節(jié)點(diǎn)也只受n個(gè)顯層節(jié)點(diǎn)的影響,這個(gè)特點(diǎn)使得RBM的訓(xùn)練變得容易了。

2002年,Hinton提出了對比散度(Constrastive Divergence-CD)算法,之后對其又作了改進(jìn),并于2006年把CD算法引入了RBM模型中,解決了RBM模型中聯(lián)合分布的期望很難獲得精確值的問題,提高了訓(xùn)練的效果和效率。由于其方便、易用、靈活度高,被廣泛應(yīng)用于特征提取、分類、降噪、降維等方面。RBM模型由一個(gè)顯層v和一個(gè)隱層h組成。用交的檢索信息經(jīng)過轉(zhuǎn)換后成為顯層v,顯層與隱層之間通過對稱的權(quán)重層W相聯(lián)系。RBM定義的能量函數(shù)為:

其中,θ={wmn,bm,cn}是RBM的參數(shù),均為實(shí)數(shù);wmn表示顯層單元m與隱層單元之間n的連接權(quán)重;bm表示顯層單元m的偏置;cn表示隱層單元n的偏置。當(dāng)參數(shù)確定時(shí),基于式(1)能量函數(shù),可以得到v,h的聯(lián)合概率分布:

其中,Z(θ)為歸一化因子(也稱配分函數(shù)):

對于觀測數(shù)據(jù)v的概率分布P(v;θ)對應(yīng)P(v,h;θ)的邊緣分布,也稱為似然函數(shù)。對應(yīng)數(shù)據(jù)的邊緣分布(聯(lián)合分布)可定義為:

類似的,有:

2)深度置信網(wǎng)絡(luò)模型

DBN在訓(xùn)練過程中所要學(xué)習(xí)的就是聯(lián)合概率分布,而在機(jī)器學(xué)習(xí)領(lǐng)域中,聯(lián)合概率所表示的意義就是對象的生成模型。2006年Hinton提出了DBN的模型,它是由多個(gè)RBM模型重疊在一起的結(jié)構(gòu)和一個(gè)BP神經(jīng)網(wǎng)絡(luò)構(gòu)成的深度結(jié)構(gòu),其訓(xùn)練過程主要包括兩個(gè)方面:(1)利用RBM結(jié)構(gòu)訓(xùn)練,篩選數(shù)據(jù)特征信息;(2)將各層RBM連接,在最后一層經(jīng)網(wǎng)絡(luò),將RBM輸出作為BP神經(jīng)網(wǎng)絡(luò)的輸入,并利用數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練,構(gòu)成整個(gè)深度結(jié)構(gòu)。DBN將原始輸入進(jìn)行逐層的特征提取,從具體到抽象,使得神經(jīng)網(wǎng)絡(luò)得到的輸入成為一個(gè)更加易于分類的特征向量,同時(shí),多層RBM組成的深度結(jié)構(gòu)使得在特征提取過程中的錯(cuò)誤或者冗余信息被逐層弱化,并最終在BP神經(jīng)網(wǎng)絡(luò)的反向調(diào)整過程中使模型達(dá)到整體最優(yōu)。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,DBN深度結(jié)構(gòu)的優(yōu)勢在于克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在深度結(jié)構(gòu)增加時(shí)訓(xùn)練時(shí)間長、易陷入局部最優(yōu)、大數(shù)據(jù)處理慢的缺點(diǎn)。DBN可以認(rèn)為是帶有已訓(xùn)練初始權(quán)值的神經(jīng)網(wǎng)絡(luò)。已有工作證明了下面的3個(gè)規(guī)則:(1)頂層單元個(gè)數(shù)超過閾值,準(zhǔn)確性在一定水平保持穩(wěn)定;(2)層數(shù)增多,計(jì)算性能趨于下降;(3)RBM訓(xùn)練隨著迭代次數(shù)增長,性能也相應(yīng)提高。

在一個(gè)由m個(gè)RBM組成的深度信任網(wǎng)絡(luò)當(dāng)中,第n(n<m)個(gè)RBM模型在第n-1個(gè)RBM模型訓(xùn)練后開始,P(hn;hn-1,wn)的輸入是來自于第n-1個(gè)RBM模型的輸出P(hn-1;hn-2,wn-1)同時(shí),它的輸出P(hn+1;hn,wn+1)就構(gòu)成了第n+1個(gè)RBM模型的輸入,n為大于1的正整數(shù)。Hinton認(rèn)為,有1個(gè)隱含層的典型的DBN,可視數(shù)據(jù)v和隱含向量h的關(guān)系可以用概率表示成如下形式:

其中,h1,h2,h1,hk均為隱含向量;

3、多特征融合的DBN分類方法

1)融合多特征

對于復(fù)雜圖像,一般來說一個(gè)特征是很難具有足夠辨識度的。顯然,多種特征組合一起可以提供較高的辨識度,辨識度越高,分類也就越容易。

一類圖像的顯著特征有些表現(xiàn)在局部特征點(diǎn)上,有些表現(xiàn)在顏色特征上,還有一些則表現(xiàn)在紋理特征上或是形狀特征上。采用單一的特征對所有圖像進(jìn)行分類很容易造成一類場景圖像的顯著特征丟失從而降低分類精度。不僅如此,同一類場景的不同圖像的顯著特征也存在差異,如果只采用一種特征來對圖像進(jìn)行分類,也很容易丟失單幅圖像的顯著特征,造成分類精度降低。而多特征融合能夠改善這種情況,進(jìn)一步提高分類精度。

針對彩色圖像中復(fù)雜目標(biāo)的特點(diǎn),本申請為每一幅圖像提取顏色、紋理和形狀3種類型的特征,包括9個(gè)顏色矩、6個(gè)tamura特征、20個(gè)灰度共生矩陣、7個(gè)Hu不變矩、16個(gè)邊向直方圖,共48個(gè)特征。然后采用多特征融合的算法,在圖像分類中進(jìn)行特征組合,從而避免單一特征存在的問題,提高分類精度。

2)構(gòu)建DBN分類器

DBN采用的是4個(gè)RBM組成的深層結(jié)構(gòu),其結(jié)構(gòu)為48-90-90-90-10。第1層RBM將輸入視為顯層,共有48個(gè)結(jié)點(diǎn),對應(yīng)圖像的48個(gè)特征,RBM的隱層(輸出層)作為第2層RBM的顯層(共90個(gè)節(jié)點(diǎn));第2層RBM的隱層(輸出層)作為第3層RBM的顯層(共90個(gè)節(jié)點(diǎn));第3層RBM的隱層(輸出層)作為第4層的顯層(共90個(gè)節(jié)點(diǎn));第4層RBM的隱層(輸出層)將是DBN的輸出,它包括10個(gè)單元,即對圖像分成10類。第4層加入sigma函數(shù),作為最終結(jié)果輸出層。

Sigma函數(shù)的公式為:

DBN分類器的結(jié)構(gòu)如圖2所示。

3)IBFCP協(xié)議實(shí)現(xiàn)流程

基于底層融合特征的深度置信網(wǎng)絡(luò)圖像分類協(xié)議采用Corel 1K數(shù)據(jù)庫,隨機(jī)選取其中90%作為訓(xùn)練集,剩余的10%作為測試集。算法流程如圖3所示。

具體步驟如下:

(1)特征表達(dá)與融合:對每一幅圖像提取顏色、紋理和形狀3類特征信息,共48個(gè)特征,形成48維的特征向量,對1000幅圖像形成100048的特征集。

(2)歸一化處理:為了使之后的實(shí)際操作時(shí)更加準(zhǔn)確,保證各數(shù)據(jù)的尺度一致性,必須將特征向量進(jìn)行歸一化處理,歸一化后的所有數(shù)據(jù)都在[0,1]之間,其歸一化公式為:

Xi、Xmin和Xmax分別為特征集中的某個(gè),最小和最大特征向量;

(3)數(shù)據(jù)分類:從特征集中隨機(jī)選擇900個(gè)(90%)作為訓(xùn)練集,其余100個(gè)(10%)的作為測試集。

(4)訓(xùn)練過程:采用4層DBN結(jié)構(gòu)進(jìn)行訓(xùn)練。利用Hinton GE在“Training Products of Experts by Minimizing Contrastive Divergence”(Hinton G,Osindero S,Teh Y.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554)中提出的對比散度的快速學(xué)習(xí)算法進(jìn)行學(xué)習(xí)。

(5)測試過程:采用DBN訓(xùn)練過程得到的權(quán)重和偏置對測試集進(jìn)行測試,

根據(jù)RBM的分布進(jìn)行一次Gibbs采樣后所獲取的樣本與原數(shù)據(jù)的差異進(jìn)行誤差評估,得出分類結(jié)果。

(6)實(shí)驗(yàn)與結(jié)果分析

為了驗(yàn)證以上算法,本實(shí)驗(yàn)的軟件仿真環(huán)境為在Win8.1下安裝的Matlab2013a,電腦硬件配置為Intel(R)Core(TM)2Duo E8400,3.0GHz CPU,4GB內(nèi)存,320GB硬盤。

a.實(shí)驗(yàn)數(shù)據(jù)

Corel圖像庫是常用的圖像分類和圖像檢索的圖庫之一。它有2類,分別為Corel 10K和Corel 1K。圖像均是256x384像素或384x256像素jpg圖像。Corel 10K包括10000張圖像,共有100類圖像,每類圖像有100張。Corel 1K共有10類圖,每類圖100張。

為了同文獻(xiàn)(Hinton G E.Training Products of Experts by Minimizing Contrastive Divergence[J],Neural computation,2002,14(8):1771-1800.和Rao M B,Kavitieval C H.A New Feature Set for Content Based Image Retrieval[J].Information Communication and Embedded Systems,2013,1(1):84-89.)的結(jié)果進(jìn)行比較,本文采用與其相同的圖像庫,即Corel 1K圖庫。這10類分別為花、馬、恐龍、大象、建筑、海灘、公共汽車、人、食物、山。類別分別為1到10,每類圖像100張,共1000張圖像,圖4顯示了這10類圖,每類顯示了一張。

b.數(shù)據(jù)分組

將整個(gè)圖像庫分成兩部分,其中一部分作為訓(xùn)練集,另一部分作為測試集,訓(xùn)練集為樣本總數(shù)的90%;測試集為樣總數(shù)本的10%。分類的過程采用隨機(jī)分類。隨機(jī)分類結(jié)果如表1所示。

表1隨機(jī)分類結(jié)果

c.實(shí)驗(yàn)結(jié)果

每次選其中9組作為訓(xùn)練集,另外一組作為測試集,得到一組結(jié)果。進(jìn)行10次,從而保證每一個(gè)樣本都可以作為測試集進(jìn)行實(shí)驗(yàn)。通過10次實(shí)驗(yàn),得出10組實(shí)驗(yàn)正確率。

圖5顯示了10組實(shí)驗(yàn)中各組的分類正確率。從每組的分類正確率來看,第10組的正確率最后,為92%。第7組的正確率最低為79%,平均正確率為85.1%。

根據(jù)10次實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果,計(jì)算出每一類圖像的錯(cuò)誤分類情況,具體如表2所示。表2中每一行代表一類圖像(共100張)的分類情況,aij(i=1,2,...,10;產(chǎn)1,2,...,10)表明第i類圖像分類時(shí)分成第j類的數(shù)量。第j列的總計(jì)表明1000張圖像中分類成第j類的數(shù)量(每類應(yīng)該為100張)。最后一列表明對應(yīng)此類圖像的分類正確率。從表2可以看出,在,10類圖像中,每一類的分類正確率各不相同,其中恐龍一組分類正確率最高,為100%,全部分類正確。正確率低于80%的有“人”、“海灘”、“建筑”和“大象”4類。

表2實(shí)驗(yàn)分類結(jié)果

圖6顯示了10類圖像的誤分率。誤分率為錯(cuò)誤分成本類的圖像數(shù)量除以分成成本類圖像的總數(shù),例如,每一個(gè)“人”,錯(cuò)誤分成本類的數(shù)量為17幅,分成本類的總數(shù)量為89幅,其誤分率為17/89×100%=19.1%。10類圖像的誤分率如圖6所示。從圖6可以看出,“建筑”、“大象”和“山”3類圖像的誤分率比較高,均超過20%。“汽車”、“恐龍”和“花”的3類的誤分率較低。

d.方法比較

1)單一特征與本發(fā)明算法結(jié)果

表3列舉了常見特征的分類結(jié)果,主要包括灰度直方圖、顏色直方圖、灰度共生矩陣、顏色共生矩陣和本發(fā)明算法的結(jié)果。其中,前5個(gè)方法的分類大小均為16。

表3單一特征與本文算法的分類正確率比較%

從表3可以看出,單一特征的平均分類正確率均不超過70%,而本發(fā)明特征融合算法的結(jié)果達(dá)到85.1%,分類效果較好。

本發(fā)明提出一種新的DBN圖像分類算法,從原始圖像中先提取一般的顏色、紋理和形狀等特征,然后以這些特征作為原始數(shù)據(jù)進(jìn)行深度置信網(wǎng)絡(luò)訓(xùn)練。通過對顏色、紋理和形狀多特征融合,解決單一特征及現(xiàn)有算法分類正率不高的問題,采用4層DBN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以克服單一特征及支持向量機(jī)SVM、Boosting等淺層結(jié)構(gòu)算法分類效果不佳的缺點(diǎn),同時(shí)也避免出現(xiàn)從像素級進(jìn)行直接訓(xùn)練速度較慢的現(xiàn)象。該算法平均分類正確率達(dá)到近86%,高于使用單一特征的分類算法和其他主流分類算法。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1