基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法,包括:將圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的提取,獲得提取后的特征數(shù)據(jù),其中,所述卷積層的核大小均不大于5×5;將提取后的特征數(shù)據(jù)通過池化層和卷積層進(jìn)行特征數(shù)據(jù)的降維和提取,獲得降維后的特征數(shù)據(jù);其中,池化層采用平均值池化;將圖片降維后的特征數(shù)據(jù)輸入全連接層中,得到圖片數(shù)據(jù)的二維特征值;將二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。本發(fā)明還公開了基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過較小核的卷積層進(jìn)行特征數(shù)據(jù)的提取,使得能夠更好、更快地提取出圖片的局部特征,進(jìn)而提高了圖片鑒別的速度和效率。
【專利說明】
基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及卷積神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是指一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)。
【背景技術(shù)】
[0002]卷積神經(jīng)網(wǎng)絡(luò)(Convolut1nal Neural Network,CNN)是近年發(fā)展起來,并引起廣泛重視的一種高效識別方法。目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類領(lǐng)域,由于該網(wǎng)絡(luò)避免了對圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用。
[0003]—般地,卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)中包括多個(gè)卷積層,每個(gè)卷積層上設(shè)置有多個(gè)神經(jīng)元,每個(gè)神經(jīng)元的輸入與前一個(gè)卷積層的局部接受域(local receptive filed)相連,通過對前一個(gè)卷積層的局部接受域的數(shù)據(jù)進(jìn)行卷積運(yùn)算,以提取該局部接受域的特征,一旦該局部特征被提取后,它與其它特征間的位置關(guān)系也隨之確定下來;然后,通過求局部平均(也稱池化處理)與二次特征提取以進(jìn)行特征映射,得到特征信息,該特征信息輸出到下一個(gè)卷積層繼續(xù)進(jìn)行處理,直到到達(dá)最后一層(輸出層),從而得到最終輸出結(jié)果。特征映射通常采用sigmoid函數(shù)作為卷積神經(jīng)網(wǎng)絡(luò)的激活函數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)中,一個(gè)卷積層上的神經(jīng)元與同一層的其他神經(jīng)元共享權(quán)重,因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)模型中,可將激活函數(shù)(activat1n funct1n)應(yīng)用于每個(gè)作為輸出結(jié)果的數(shù)據(jù)值以確定是否達(dá)到閾值,因此而產(chǎn)生的數(shù)據(jù)值作為下一個(gè)卷積層的輸入。
[0004]通常的,一個(gè)用于識別的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型包括卷積層、池化層、全連接層以及后續(xù)的分類器。通過對已有的樣本數(shù)據(jù)的訓(xùn)練,能夠獲得較好的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型,當(dāng)需要識別新的目標(biāo)時(shí),只需要將目標(biāo)的數(shù)據(jù)輸入計(jì)算模型,就能夠?qū)崿F(xiàn)對新的目標(biāo)的識別。
[0005]但是,現(xiàn)有的利用卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算模型進(jìn)行目標(biāo)鑒別時(shí),通常按照現(xiàn)有較為固定的模型架構(gòu)進(jìn)行計(jì)算,如AlexNet、VGG、GoogLeNet等,這些模型中卷積層、池化層、全連接層及激活函數(shù)等參數(shù)及架構(gòu)都已經(jīng)固定,雖然其具有通用性,但是也使得這些模型在應(yīng)用于特定的場景時(shí),其識別結(jié)果不佳。例如:在針對于視頻或圖片的鑒黃中,鑒別的效果較差。
【發(fā)明內(nèi)容】
[0006]有鑒于此,本發(fā)明的目的在于提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng),能夠大大提高圖片鑒別的速度和準(zhǔn)確性。
[0007]基于上述目的本發(fā)明提供的一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法,包括:
[0008]將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù);
[0009]將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)池化層和至少一個(gè)卷積層進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù);其中,所述池化層采用平均值池化;
[0010]將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值;
[0011]將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。
[0012]可選的,所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層的核大小為3 X3、C2層的核大小為3X3、C3層的核大小為5 X 5、C4層的核大小為5 X 5。
[0013]進(jìn)一步,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為2。
[0014]可選的,所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù)的步驟包括:
[0015]將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O ;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3,步數(shù)均為l,pad值均為I,卷積核的個(gè)數(shù)分別為384、384、256個(gè)。
[0016]可選的,所述至少一個(gè)全連接層為依次連接的全連接層f c9、全連接層f c 1、全連接層f c11、全連接層f c12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0017]可選的,所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。
[0018]可選的,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0019]本發(fā)明還提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng),包括:
[0020]數(shù)據(jù)提取模塊,用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù),并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊;其中,所述至少兩個(gè)卷積層的核大小均不大于5 X 5;
[0021]數(shù)據(jù)降維模塊,用于接收所述數(shù)據(jù)提取模塊發(fā)送的圖片提取后的特征數(shù)據(jù),將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù),將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊;其中,所述池化層采用平均值池化;
[0022]全連接模塊,用于接收所述特征降維模塊發(fā)送的圖片降維后的特征數(shù)據(jù),將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊;
[0023]分類模塊,用于接收所述全連接模塊發(fā)送的圖片數(shù)據(jù)的二維特征值,將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。
[0024]可選的,所述數(shù)據(jù)提取模塊包括:
[0025]四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。
[0026]進(jìn)一步,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為2。
[0027]可選的,所述數(shù)據(jù)降維模塊包括:
[0028]依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層CS和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3,步數(shù)均為l,pad值均為1,卷積核的個(gè)數(shù)分別為384、384、256。
[0029]可選的,所述全連接模塊包括:
[0030]依次連接的全連接層fc9、全連接層fc 1、全連接層f c 11、全連接層f c 12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0031]可選的,所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。
[0032]可選的,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0033]從上面所述可以看出,本發(fā)明實(shí)施例提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)首先通過多個(gè)小窗口(卷積層的核小)的卷積層相連,使得能夠更好、更快地提取出圖片的局部特征,并將這些局部特征快速組合成高級特征,能夠大大提高圖片鑒別的速度和效率。
[0034]此外,本發(fā)明實(shí)施例所述的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過采用平均值池化以及全連接層的處理,使得圖片數(shù)據(jù)最后輸出為2個(gè)特征,進(jìn)而使得分類器進(jìn)行分類鑒別處理時(shí),不僅速度更快,而且準(zhǔn)確性更高。
【附圖說明】
[0035]圖1為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法的實(shí)施例的流程圖;
[0036]圖2為本發(fā)明提供的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型的結(jié)構(gòu)示意圖;
[0037]圖3為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)的實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0038]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
[0039]需要說明的是,本發(fā)明實(shí)施例中所有使用“第一”和“第二”的表述均是為了區(qū)分兩個(gè)相同名稱非相同的實(shí)體或者非相同的參量,可見“第一” “第二”僅為了表述的方便,不應(yīng)理解為對本發(fā)明實(shí)施例的限定,后續(xù)實(shí)施例對此不再一一說明。
[0040]參照圖1所示,為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法的實(shí)施例的流程圖。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法,包括:
[0041]步驟101,將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù),其中,優(yōu)選的,所述至少兩個(gè)卷積層的核大小均不大于5X 5 ;
[0042]其中,所述待鑒別的圖片數(shù)據(jù)既可以為直接的圖片數(shù)據(jù)信息,還可以為視頻中獲取的圖片信息,也即本發(fā)明所述的方法也同樣適用于視頻的鑒別。所述卷積層用于對輸入的圖片數(shù)據(jù)進(jìn)行局部塊特征的提取,獲得更高一級的特征數(shù)據(jù),且每個(gè)卷積層中均會進(jìn)行多次的卷積操作。通常卷積層的核采用nXn的結(jié)構(gòu)(也可以采用mXn),所述卷積層的核越小,則能夠提取出更多的特征,但是相應(yīng)的特征數(shù)據(jù)也更多。
[0043]步驟102,將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù);其中,所述池化層采用平均值池化;
[0044]其中,所述池化層用于將卷積層輸出的特征數(shù)據(jù)進(jìn)行降維處理,也即在保證數(shù)據(jù)有效性的基礎(chǔ)上大大減少數(shù)據(jù)量。這里所述的反復(fù)是指重復(fù)池化或卷積的過程,例如:池化層-卷積層-池化層-卷積層,當(dāng)然,也可以在中間的某一層中多次出現(xiàn)池化層或者卷積層。所述平均值池化是指按照池化的原則,取池化核大小范圍內(nèi)數(shù)據(jù)的平均值作為池化后的輸出數(shù)據(jù)。
[0045]步驟103,將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值;
[0046]不論經(jīng)過多少個(gè)全連接層的處理,最后一個(gè)全連接層都輸出一個(gè)2維的特征數(shù)據(jù),這樣,在進(jìn)行分類鑒別時(shí)能夠更加準(zhǔn)確。
[0047]步驟104,將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。
[0048]由上述實(shí)施例可知,所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法通過多個(gè)小窗口(SP卷積層的核較小)的卷積層依次相連,使得能夠更好、更快地提取出圖片的局部特征,并將這些局部特征快速組合成高級特征,能夠大大提高圖片鑒別的速度和效率。同時(shí),本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過采用平均值池化以及全連接層的處理,使得圖片數(shù)據(jù)最后輸出為2個(gè)特征,進(jìn)而使得分類器進(jìn)行分類鑒別處理時(shí),不僅速度更快,而且準(zhǔn)確性更高。
[0049]作為本發(fā)明一個(gè)較佳的實(shí)施例,所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層核大小為3X3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。這樣,依次連接的卷積層能夠更有效地提取圖片的特征數(shù)據(jù),同時(shí)還減少了神經(jīng)網(wǎng)絡(luò)計(jì)算模型的參數(shù),對于提升鑒別速度,防止過度擬合由較大的作用。
[0050]作為本發(fā)明進(jìn)一步的實(shí)施例,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為
2。其中,所述卷積層的步數(shù)指卷積層的核每次移動的步長,所述pad值是指在輸入數(shù)據(jù)的周圍是否添加一圈數(shù)據(jù)參與運(yùn)算,pad值的大小也即添加數(shù)據(jù)的圈數(shù)。這樣,能夠進(jìn)一步提高卷積層的處理效率和速度,進(jìn)而提高圖片鑒別的效率。
[0051]作為本發(fā)明一個(gè)優(yōu)選的實(shí)施例,所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù)的步驟102包括:將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為256;所述卷積層C6、卷積層C7、卷積層CS的核大小均為3,步數(shù)均為I,pad值均為I,卷積核的個(gè)數(shù)分別為384、384、256個(gè)。
[0052]作為本發(fā)明另一個(gè)優(yōu)選的實(shí)施例,所述至少一個(gè)全連接層為依次連接的全連接層fc9、全連接層fc 1、全連接層fc 11、全連接層fc 12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2 ;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。這里,所述的節(jié)點(diǎn)數(shù)據(jù)也可以理解為特征數(shù)目。所述dropout方式是通過隨機(jī)開啟一定數(shù)目的數(shù)據(jù),而將剩下的數(shù)據(jù)丟棄,這樣能夠有效地防止數(shù)據(jù)的過擬合,進(jìn)而提高鑒別的效率。
[0053]參照圖2所示,為本發(fā)明提供的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型的結(jié)構(gòu)示意圖。所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 1、全連接層fell、全連接層fcl2的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。其中,所有卷積層以及全連接層fc9、全連接層fclO、全連接層fell均通過激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的處理,使得前一層的數(shù)據(jù)能夠向下一層傳遞。所述激活函數(shù)是將上一次的輸出數(shù)據(jù)通過激活函數(shù)中的算法計(jì)算得到新的輸出結(jié)果,將所述新的輸出結(jié)果作為下一層的輸入數(shù)據(jù)。本發(fā)明通過選用分類器SVM(支持向量機(jī)),使得能夠更加適用于二分問題的鑒另O。同時(shí),本發(fā)明所采用的激活函數(shù)LEAKY RELU相比于傳統(tǒng)的激活函數(shù)RELU,在函數(shù)值小于零時(shí),也具有一定的輸出值,也即使得函數(shù)值小于零這一部分的數(shù)據(jù)也可以參與訓(xùn)練過程。這里,當(dāng)函數(shù)值小于O時(shí),輸出值為輸入值乘以一個(gè)系數(shù)a,所述系數(shù)a優(yōu)選采用固定值。
[0054]優(yōu)選的,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。其中,最后一個(gè)全連基層可以不需要激活函數(shù)。這樣,能夠使得數(shù)據(jù)的傳遞更為有效。
[0055]在一些可選的實(shí)施例中,本發(fā)明準(zhǔn)備正負(fù)訓(xùn)練樣本一共100小時(shí)視頻,從視頻中截取110萬張圖片,其中,正樣本訓(xùn)練圖片50萬張,負(fù)樣本訓(xùn)練圖片50萬張。測試樣本10萬張,正負(fù)樣本各5萬張。網(wǎng)絡(luò)中卷積層采用標(biāo)準(zhǔn)偏差為0.0I的高斯分布進(jìn)行初始化。LEAKY RELU函數(shù)的系數(shù)a參數(shù)為0.01。全連接層中參數(shù)采用標(biāo)準(zhǔn)偏差為0.002的高斯分布進(jìn)行初始化。dropout模塊的參數(shù)為0.5。訓(xùn)練過程采用反向傳播算法(BP算法)進(jìn)行參數(shù)的訓(xùn)練及更新。本發(fā)明中一共訓(xùn)練30萬次迭代。
[0056]參照圖3所示,為本發(fā)明提供的一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)包括:
[0057]數(shù)據(jù)提取模塊201,用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù),并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊202;其中,所述至少兩個(gè)卷積層的核大小均不大于5 X 5;
[0058]數(shù)據(jù)降維模塊202,用于接收所述數(shù)據(jù)提取模塊201發(fā)送的圖片提取后的特征數(shù)據(jù),將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù),將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊203;其中,所述池化層采用平均值池化;
[0059]全連接模塊203,用于接收所述特征降維模塊202發(fā)送的圖片降維后的特征數(shù)據(jù),將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊204;
[0060]分類模塊204,用于接收所述全連接模塊203發(fā)送的圖片數(shù)據(jù)的二維特征值,將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。
[0061]由上述實(shí)施例可知,所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)通過所述數(shù)據(jù)提取模塊201完成數(shù)據(jù)的卷積,進(jìn)而數(shù)顯圖片數(shù)據(jù)特征的提取,然后通過所述數(shù)據(jù)降維模塊202實(shí)現(xiàn)特征的降維處理,通過所述全連接模塊203獲得圖片數(shù)據(jù)的二維特征值,最后通過所述分類模塊204實(shí)現(xiàn)圖片數(shù)據(jù)的鑒別。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)通過采用較小核的卷積層實(shí)現(xiàn)特征數(shù)據(jù)的有效提取,不僅提高了圖片鑒別的效率和速度,而且有效的防止了過擬合。
[0062]作為本發(fā)明一個(gè)優(yōu)選的實(shí)施例,所述數(shù)據(jù)提取模塊201包括:四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。
[0063]作為本發(fā)明進(jìn)一步的實(shí)施例,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為2。
[0064]作為本發(fā)明另一個(gè)優(yōu)選的實(shí)施例,所述數(shù)據(jù)降維模塊202包括:依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3,步數(shù)均為I,pad值均為I,卷積核的個(gè)數(shù)分別為384、384、256。
[0065]在一些可選的實(shí)施例中,所述全連接模塊203包括:依次連接的全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0066]在本發(fā)明另一些可選的實(shí)施例中,所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。
[0067]優(yōu)選的,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0068]所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:以上任何實(shí)施例的討論僅為示例性的,并非旨在暗示本公開的范圍(包括權(quán)利要求)被限于這些例子;在本發(fā)明的思路下,以上實(shí)施例或者不同實(shí)施例中的技術(shù)特征之間也可以進(jìn)行組合,步驟可以以任意順序?qū)崿F(xiàn),并存在如上所述的本發(fā)明的不同方面的許多其它變化,為了簡明它們沒有在細(xì)節(jié)中提供。
[0069]另外,為簡化說明和討論,并且為了不會使本發(fā)明難以理解,在所提供的附圖中可以示出或可以不示出與集成電路(IC)芯片和其它部件的公知的電源/接地連接。此外,可以以框圖的形式示出裝置,以便避免使本發(fā)明難以理解,并且這也考慮了以下事實(shí),即關(guān)于這些框圖裝置的實(shí)施方式的細(xì)節(jié)是高度取決于將要實(shí)施本發(fā)明的平臺的(即,這些細(xì)節(jié)應(yīng)當(dāng)完全處于本領(lǐng)域技術(shù)人員的理解范圍內(nèi))。在闡述了具體細(xì)節(jié)(例如,電路)以描述本發(fā)明的示例性實(shí)施例的情況下,對本領(lǐng)域技術(shù)人員來說顯而易見的是,可以在沒有這些具體細(xì)節(jié)的情況下或者這些具體細(xì)節(jié)有變化的情況下實(shí)施本發(fā)明。因此,這些描述應(yīng)被認(rèn)為是說明性的而不是限制性的。
[0070]盡管已經(jīng)結(jié)合了本發(fā)明的具體實(shí)施例對本發(fā)明進(jìn)行了描述,但是根據(jù)前面的描述,這些實(shí)施例的很多替換、修改和變型對本領(lǐng)域普通技術(shù)人員來說將是顯而易見的。例如,其它存儲器架構(gòu)(例如,動態(tài)RAM(DRAM))可以使用所討論的實(shí)施例。
[0071]本發(fā)明的實(shí)施例旨在涵蓋落入所附權(quán)利要求的寬泛范圍之內(nèi)的所有這樣的替換、修改和變型。因此,凡在本發(fā)明的精神和原則之內(nèi),所做的任何省略、修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法,其特征在于,包括: 將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù); 將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)池化層和至少一個(gè)卷積層進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù);其中,所述池化層采用平均值池化; 將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值; 將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層的核大小為3 X 3、C2層的核大小為3 X 3、C3層的核大小為5 X 5、C4層的核大小為5 X 5。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為2。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù)的步驟包括: 將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O ;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為為256;所述卷積層C6、卷積層C7、卷積層CS的核大小均為3,步數(shù)均為l,pad值均為1,卷積核的個(gè)數(shù)分別為384、384、256個(gè)。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述至少一個(gè)全連接層為依次連接的全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2 ;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 1、全連接層fc 11、全連接層fc 12的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。7.根據(jù)權(quán)利要求1-6任意一項(xiàng)所述的方法,其特征在于,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKY RELU進(jìn)行數(shù)據(jù)的激活處理。8.一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng),其特征在于,包括: 數(shù)據(jù)提取模塊,用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取,獲得圖片提取后的特征數(shù)據(jù),并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊;其中,所述至少兩個(gè)卷積層的核大小均不大于5 X 5; 數(shù)據(jù)降維模塊,用于接收所述數(shù)據(jù)提取模塊發(fā)送的圖片提取后的特征數(shù)據(jù),將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取,獲得圖片降維后的特征數(shù)據(jù),將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊;其中,所述池化層采用平均值池化; 全連接模塊,用于接收所述特征降維模塊發(fā)送的圖片降維后的特征數(shù)據(jù),將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中,得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊; 分類模塊,用于接收所述全連接模塊發(fā)送的圖片數(shù)據(jù)的二維特征值,將所述二維特征值通過分類器進(jìn)行分類處理,得到圖片的鑒別結(jié)果。9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述數(shù)據(jù)提取模塊包括: 四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層,且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I,所述C3層和C4層的pad值均為2。11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述數(shù)據(jù)降維模塊包括: 依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層CS和池化層P8;其中,所述池化層P4、池化層P5、池化層P8的核大小均為3,步數(shù)均為2,pad值均為O ;所述卷積層C5的核大小為5,步數(shù)為I,pad值為2,卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層C8的核大小均為3,步數(shù)均為l,pad值均為1,卷積核的個(gè)數(shù)分別為384、384、256個(gè)。12.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述全連接模塊包括: 依次連接的全連接層f c9、全連接層f ClO、全連接層f Cl 1、全連接層f cl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。13.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 10、全連接層fc 11、全連接層fc 12的處理,然后連接到分類器SVM中經(jīng)過分類處理,得到圖片的鑒別結(jié)果。14.根據(jù)權(quán)利要求8-13任意一項(xiàng)所述的系統(tǒng),其特征在于,所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKY RELU進(jìn)行數(shù)據(jù)的激活處理。
【文檔編號】G06K9/62GK105868785SQ201610195777
【公開日】2016年8月17日
【申請日】2016年3月30日
【發(fā)明人】劉陽, 白茂生, 魏偉, 蔡硯剛, 祁海
【申請人】樂視控股(北京)有限公司, 樂視云計(jì)算有限公司