亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于空間金字塔的卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法的制作方法

文檔序號(hào):11655001閱讀:656來(lái)源:國(guó)知局

本發(fā)明屬于圖像處理與模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于空間金字塔的深度卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法



背景技術(shù):

空間金字塔是首先提取原圖像的全局特征,然后在每個(gè)金字塔水平把圖像劃分為細(xì)網(wǎng)格序列,從每個(gè)金子塔水平的每個(gè)網(wǎng)格中提取特征,并把其連接成一個(gè)大的特征向量。

卷積神經(jīng)網(wǎng)絡(luò)近年來(lái)在圖像處理方面取的了不俗的成就,得到了廣泛的運(yùn)用。隨后,更多的科研工作者對(duì)經(jīng)典網(wǎng)絡(luò)進(jìn)行了修改。為了獲得更佳的圖像識(shí)別結(jié)果,本專利借鑒了空間金子塔的思維,提出了一種新的深度卷積神經(jīng)網(wǎng)絡(luò),獲得了相較于傳統(tǒng)方法更好的識(shí)別效果。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的是提出一種基于空間金字塔方式的深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方式,提高圖像模式識(shí)別的能力。

本發(fā)明所采用的技術(shù)方案是:一種基于空間金字塔的卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法,其特征在于,包括以下步驟:

步驟1:前向傳播,具體實(shí)現(xiàn)包括以下子步驟:

步驟1.1:建立帶m個(gè)卷積層、m-1個(gè)池化層的前半部分卷積神經(jīng)網(wǎng)絡(luò);

步驟1.2:將m個(gè)卷積層分別進(jìn)行池化,得到m類特征,然后分別將其連接成一個(gè)大的特征向量,最后再連接成一個(gè)總的特征向量作為圖像的最終特征;

步驟1.3:對(duì)最終特征向量進(jìn)行一次全連接和softmax分類,獲得卷積神經(jīng)網(wǎng)絡(luò);

步驟1.4:將整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的所有權(quán)值通過(guò)經(jīng)驗(yàn)公式進(jìn)行初始化,然后將訓(xùn)練圖片x輸入初始化后的卷積神經(jīng)網(wǎng)絡(luò),按照前向傳播公式進(jìn)行傳播;

步驟2:反向調(diào)節(jié)。

本發(fā)明的有益效果是:提出了一種新的卷積神經(jīng)網(wǎng)絡(luò)算法結(jié)構(gòu),并提高了識(shí)別效率。

附圖說(shuō)明

圖1:本發(fā)明實(shí)施例的方法原理圖。

具體實(shí)施方式

為了便于本領(lǐng)域普通技術(shù)人員理解和實(shí)施本發(fā)明,下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實(shí)施示例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。

請(qǐng)見(jiàn)圖1,本發(fā)明提供的一種基于空間金字塔的卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法,包括以下步驟:

步驟1:前向傳播,具體實(shí)現(xiàn)包括以下子步驟:

步驟1.1:建立帶3個(gè)卷積層、2個(gè)池化層的前半部分卷積神經(jīng)網(wǎng)絡(luò);

步驟1.2:將3個(gè)卷積層分別進(jìn)行池化,得到3類特征,然后分別將其連接成一個(gè)大的特征向量,最后再連接成一個(gè)總的特征向量作為圖像的最終特征;

輸入圖片后通過(guò)卷積核和隱層偏置獲得第一個(gè)卷積層的特征圖,第一層的卷積特征圖x1由如下公式得到;

其中:表示第1個(gè)卷積層的第j張?zhí)卣鲌D,表示輸入圖片經(jīng)過(guò)預(yù)處理后x0的第i張圖片,n0表示x0圖片的張數(shù);表示第1層的第j個(gè)二維卷積核,表示第1個(gè)隱層第j個(gè)特征圖的偏置;δ表示sigmiod函數(shù),mp表示得到的為特征圖;

j=1.2......n1;n1為第一層的卷積核個(gè)數(shù),也是第1個(gè)卷積特征圖的張數(shù);

將獲得的卷積層特征圖經(jīng)過(guò)2*2的均勻池化進(jìn)行下采樣,得到行列均為原來(lái)一半的特征圖v1;

v1=mean-pooling{x1};

其中,mean-pooling表示均勻池化

則每一個(gè)卷積層的特征圖都能通過(guò)以下公式得到;

每一個(gè)池化層的特征圖都能通過(guò)以下公式得到;

vl=mean-pooling{xl};

共計(jì)得到3個(gè)卷積層的特征圖,即x1,x2,x3,然后借鑒空間金子塔的方式,將3個(gè)卷積層的特征圖進(jìn)行畫網(wǎng)格的方式進(jìn)行特征提取,本實(shí)施例采取的是將第1個(gè)卷積層畫分為4*4的網(wǎng)格,然后每個(gè)網(wǎng)格通過(guò)均勻池化提取一個(gè)特征,最終第1個(gè)卷積層經(jīng)過(guò)特征提取后成為一個(gè)4*4的特征圖p1

將第1個(gè)卷積層畫分為4*4的網(wǎng)格,然后每個(gè)網(wǎng)格通過(guò)均勻池化提取一個(gè)特征,最終第1個(gè)卷積層經(jīng)過(guò)特征提取后成為一個(gè)4*4的特征圖p1;

p1=mean-pooling(v1);

同理根據(jù)以下公式得到3類特征圖p1,p2,p3;

pl=mean-pooling(vl);

其中,池化窗口大小和步長(zhǎng)隨著輸入圖片大小的改變而改變;p1,p2,p3的大小分別為預(yù)設(shè)的4*4,2*2,1*1;然后將按列聚合成大小為16的列向量,p1聚合成16*6=96的列向量,同理可將p2聚合為大小為2*2*16=64的列向量,將p3聚合為大小為1*1*120=120的列向量,最后聚合成一個(gè)總大小為280的列向量p作為輸入圖片的特征。

步驟1.3:對(duì)最終特征向量進(jìn)行一次全連接和softmax分類,獲得卷積神經(jīng)網(wǎng)絡(luò);

步驟1.4:將整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的所有權(quán)值通過(guò)經(jīng)驗(yàn)公式進(jìn)行初始化,然后將訓(xùn)練圖片x輸入初始化后的卷積神經(jīng)網(wǎng)絡(luò),按照前向傳播公式進(jìn)行傳播;

將整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的所有權(quán)值通過(guò)經(jīng)驗(yàn)公式進(jìn)行初始化,是根據(jù)經(jīng)驗(yàn)公式初始化隨機(jī)生成輸入單元與隱層單元之間的權(quán)值wkj和隱層單元的偏置bj,

設(shè)置b初始值均為0;

其中,w表示權(quán)值,l表示卷積網(wǎng)絡(luò)第l層,j表示卷積神經(jīng)網(wǎng)絡(luò)第l卷積層第j個(gè)神經(jīng)元,k表示全連接層第k層,layerinput表示這一層輸入神經(jīng)元個(gè)數(shù),layeroutput表示這一層的輸出神經(jīng)元個(gè)數(shù);kl是第l個(gè)卷積層卷積核的大小,此公式可以令初始化的權(quán)值在-1到1之間。

每一張輸入的圖片表示為x,輸入卷積神經(jīng)網(wǎng)絡(luò)的圖像表示為x0;當(dāng)輸入的圖片為灰度圖片時(shí),x0=x;當(dāng)輸入圖片為彩色圖片時(shí),通過(guò)以下公式灰度化,x0=rgb2gray(x)。

輸入訓(xùn)練圖像x及其標(biāo)簽,利用如下前向傳導(dǎo)公式計(jì)算每層輸出值;hw,b(x)=f(wtx+b)

其中,h(w,b)(x)表示神經(jīng)元輸出值,wt表示權(quán)值的轉(zhuǎn)置,b表示偏置,f表示激活函數(shù)。

步驟2:反向調(diào)節(jié);具體實(shí)現(xiàn)包括以下子步驟:

步驟2.1:通過(guò)如下公式根據(jù)標(biāo)簽值和利用前向傳導(dǎo)公式計(jì)算得到的最后一層輸出值計(jì)算出最后一層偏差;

其中,jl為l層的損失函數(shù),為輸出層神經(jīng)元輸出值,hw,b(x(i))為第i張圖片的輸出值,y(i)表示第i張輸入圖片的標(biāo)簽。

步驟2.2:根據(jù)最后一層偏差計(jì)算各層偏差,從而求得梯度方向,根據(jù)如下公式更新權(quán)值:

本實(shí)施例在反向調(diào)節(jié)過(guò)程中調(diào)節(jié)卷積層x1,x2時(shí),有兩個(gè)方向傳來(lái)的梯度,本算法通過(guò)將兩個(gè)方向的梯度相加來(lái)進(jìn)行調(diào)節(jié)。

本實(shí)施例輸入一定數(shù)量的圖片到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)中,經(jīng)過(guò)前向傳播得到分類結(jié)果,與自帶標(biāo)簽進(jìn)行比較,相同則正確。由此得到網(wǎng)絡(luò)算法的正確率。

應(yīng)當(dāng)理解的是,本說(shuō)明書未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。

應(yīng)當(dāng)理解的是,上述針對(duì)較佳實(shí)施例的描述較為詳細(xì),并不能因此而認(rèn)為是對(duì)本發(fā)明專利保護(hù)范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán)利要求所保護(hù)的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護(hù)范圍之內(nèi),本發(fā)明的請(qǐng)求保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1