基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)的制作方法

文檔序號：10512755閱讀：218來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法，包括：將圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的提取，獲得提取后的特征數(shù)據(jù)，其中，所述卷積層的核大小均不大于5×5；將提取后的特征數(shù)據(jù)通過池化層和卷積層進(jìn)行特征數(shù)據(jù)的降維和提取，獲得降維后的特征數(shù)據(jù)；其中，池化層采用平均值池化；將圖片降維后的特征數(shù)據(jù)輸入全連接層中，得到圖片數(shù)據(jù)的二維特征值；將二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。本發(fā)明還公開了基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過較小核的卷積層進(jìn)行特征數(shù)據(jù)的提取，使得能夠更好、更快地提取出圖片的局部特征，進(jìn)而提高了圖片鑒別的速度和效率。
【專利說明】
基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及卷積神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域，特別是指一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)。
【背景技術(shù)】
[0002]卷積神經(jīng)網(wǎng)絡(luò)(Convolut1nal Neural Network，CNN)是近年發(fā)展起來，并引起廣泛重視的一種高效識別方法。目前，卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一，特別是在模式分類領(lǐng)域，由于該網(wǎng)絡(luò)避免了對圖像的復(fù)雜前期預(yù)處理，可以直接輸入原始圖像，因而得到了更為廣泛的應(yīng)用。
[0003]—般地，卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)中包括多個(gè)卷積層，每個(gè)卷積層上設(shè)置有多個(gè)神經(jīng)元，每個(gè)神經(jīng)元的輸入與前一個(gè)卷積層的局部接受域(local receptive filed)相連，通過對前一個(gè)卷積層的局部接受域的數(shù)據(jù)進(jìn)行卷積運(yùn)算，以提取該局部接受域的特征，一旦該局部特征被提取后，它與其它特征間的位置關(guān)系也隨之確定下來;然后，通過求局部平均(也稱池化處理)與二次特征提取以進(jìn)行特征映射，得到特征信息，該特征信息輸出到下一個(gè)卷積層繼續(xù)進(jìn)行處理，直到到達(dá)最后一層(輸出層)，從而得到最終輸出結(jié)果。特征映射通常采用sigmoid函數(shù)作為卷積神經(jīng)網(wǎng)絡(luò)的激活函數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)中，一個(gè)卷積層上的神經(jīng)元與同一層的其他神經(jīng)元共享權(quán)重，因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)模型中，可將激活函數(shù)(activat1n funct1n)應(yīng)用于每個(gè)作為輸出結(jié)果的數(shù)據(jù)值以確定是否達(dá)到閾值，因此而產(chǎn)生的數(shù)據(jù)值作為下一個(gè)卷積層的輸入。
[0004]通常的，一個(gè)用于識別的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型包括卷積層、池化層、全連接層以及后續(xù)的分類器。通過對已有的樣本數(shù)據(jù)的訓(xùn)練，能夠獲得較好的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型，當(dāng)需要識別新的目標(biāo)時(shí)，只需要將目標(biāo)的數(shù)據(jù)輸入計(jì)算模型，就能夠?qū)崿F(xiàn)對新的目標(biāo)的識別。
[0005]但是，現(xiàn)有的利用卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算模型進(jìn)行目標(biāo)鑒別時(shí)，通常按照現(xiàn)有較為固定的模型架構(gòu)進(jìn)行計(jì)算，如AlexNet、VGG、GoogLeNet等，這些模型中卷積層、池化層、全連接層及激活函數(shù)等參數(shù)及架構(gòu)都已經(jīng)固定，雖然其具有通用性，但是也使得這些模型在應(yīng)用于特定的場景時(shí)，其識別結(jié)果不佳。例如:在針對于視頻或圖片的鑒黃中，鑒別的效果較差。

【發(fā)明內(nèi)容】

[0006]有鑒于此，本發(fā)明的目的在于提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)，能夠大大提高圖片鑒別的速度和準(zhǔn)確性。
[0007]基于上述目的本發(fā)明提供的一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法，包括:
[0008]將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)；
[0009]將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)池化層和至少一個(gè)卷積層進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù);其中，所述池化層采用平均值池化；
[0010]將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值；
[0011]將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。
[0012]可選的，所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層的核大小為3 X3、C2層的核大小為3X3、C3層的核大小為5 X 5、C4層的核大小為5 X 5。
[0013]進(jìn)一步，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為2。
[0014]可選的，所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)的步驟包括:
[0015]將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O ；所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3，步數(shù)均為l，pad值均為I，卷積核的個(gè)數(shù)分別為384、384、256個(gè)。
[0016]可選的，所述至少一個(gè)全連接層為依次連接的全連接層f c9、全連接層f c 1、全連接層f c11、全連接層f c12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0017]可選的，所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。
[0018]可選的，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0019]本發(fā)明還提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)，包括:
[0020]數(shù)據(jù)提取模塊，用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)，并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊;其中，所述至少兩個(gè)卷積層的核大小均不大于5 X 5;
[0021]數(shù)據(jù)降維模塊，用于接收所述數(shù)據(jù)提取模塊發(fā)送的圖片提取后的特征數(shù)據(jù)，將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)，將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊;其中，所述池化層采用平均值池化；
[0022]全連接模塊，用于接收所述特征降維模塊發(fā)送的圖片降維后的特征數(shù)據(jù)，將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊；
[0023]分類模塊，用于接收所述全連接模塊發(fā)送的圖片數(shù)據(jù)的二維特征值，將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。
[0024]可選的，所述數(shù)據(jù)提取模塊包括:
[0025]四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。
[0026]進(jìn)一步，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為2。
[0027]可選的，所述數(shù)據(jù)降維模塊包括:
[0028]依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層CS和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O;所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3，步數(shù)均為l，pad值均為1，卷積核的個(gè)數(shù)分別為384、384、256。
[0029]可選的，所述全連接模塊包括:
[0030]依次連接的全連接層fc9、全連接層fc 1、全連接層f c 11、全連接層f c 12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0031]可選的，所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。
[0032]可選的，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0033]從上面所述可以看出，本發(fā)明實(shí)施例提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)首先通過多個(gè)小窗口(卷積層的核小)的卷積層相連，使得能夠更好、更快地提取出圖片的局部特征，并將這些局部特征快速組合成高級特征，能夠大大提高圖片鑒別的速度和效率。
[0034]此外，本發(fā)明實(shí)施例所述的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過采用平均值池化以及全連接層的處理，使得圖片數(shù)據(jù)最后輸出為2個(gè)特征，進(jìn)而使得分類器進(jìn)行分類鑒別處理時(shí)，不僅速度更快，而且準(zhǔn)確性更高。
【附圖說明】
[0035]圖1為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法的實(shí)施例的流程圖；
[0036]圖2為本發(fā)明提供的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型的結(jié)構(gòu)示意圖；
[0037]圖3為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)的實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0038]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白，以下結(jié)合具體實(shí)施例，并參照附圖，對本發(fā)明進(jìn)一步詳細(xì)說明。
[0039]需要說明的是，本發(fā)明實(shí)施例中所有使用“第一”和“第二”的表述均是為了區(qū)分兩個(gè)相同名稱非相同的實(shí)體或者非相同的參量，可見“第一” “第二”僅為了表述的方便，不應(yīng)理解為對本發(fā)明實(shí)施例的限定，后續(xù)實(shí)施例對此不再一一說明。
[0040]參照圖1所示，為本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法的實(shí)施例的流程圖。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法，包括:
[0041]步驟101，將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)，其中，優(yōu)選的，所述至少兩個(gè)卷積層的核大小均不大于5X 5 ；
[0042]其中，所述待鑒別的圖片數(shù)據(jù)既可以為直接的圖片數(shù)據(jù)信息，還可以為視頻中獲取的圖片信息，也即本發(fā)明所述的方法也同樣適用于視頻的鑒別。所述卷積層用于對輸入的圖片數(shù)據(jù)進(jìn)行局部塊特征的提取，獲得更高一級的特征數(shù)據(jù)，且每個(gè)卷積層中均會進(jìn)行多次的卷積操作。通常卷積層的核采用nXn的結(jié)構(gòu)(也可以采用mXn)，所述卷積層的核越小，則能夠提取出更多的特征，但是相應(yīng)的特征數(shù)據(jù)也更多。
[0043]步驟102，將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù);其中，所述池化層采用平均值池化；
[0044]其中，所述池化層用于將卷積層輸出的特征數(shù)據(jù)進(jìn)行降維處理，也即在保證數(shù)據(jù)有效性的基礎(chǔ)上大大減少數(shù)據(jù)量。這里所述的反復(fù)是指重復(fù)池化或卷積的過程，例如:池化層-卷積層-池化層-卷積層，當(dāng)然，也可以在中間的某一層中多次出現(xiàn)池化層或者卷積層。所述平均值池化是指按照池化的原則，取池化核大小范圍內(nèi)數(shù)據(jù)的平均值作為池化后的輸出數(shù)據(jù)。
[0045]步驟103，將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值；
[0046]不論經(jīng)過多少個(gè)全連接層的處理，最后一個(gè)全連接層都輸出一個(gè)2維的特征數(shù)據(jù)，這樣，在進(jìn)行分類鑒別時(shí)能夠更加準(zhǔn)確。
[0047]步驟104，將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。
[0048]由上述實(shí)施例可知，所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法通過多個(gè)小窗口(SP卷積層的核較小)的卷積層依次相連，使得能夠更好、更快地提取出圖片的局部特征，并將這些局部特征快速組合成高級特征，能夠大大提高圖片鑒別的速度和效率。同時(shí)，本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)通過采用平均值池化以及全連接層的處理，使得圖片數(shù)據(jù)最后輸出為2個(gè)特征，進(jìn)而使得分類器進(jìn)行分類鑒別處理時(shí)，不僅速度更快，而且準(zhǔn)確性更高。
[0049]作為本發(fā)明一個(gè)較佳的實(shí)施例，所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層核大小為3X3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。這樣，依次連接的卷積層能夠更有效地提取圖片的特征數(shù)據(jù)，同時(shí)還減少了神經(jīng)網(wǎng)絡(luò)計(jì)算模型的參數(shù)，對于提升鑒別速度，防止過度擬合由較大的作用。
[0050]作為本發(fā)明進(jìn)一步的實(shí)施例，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為
2。其中，所述卷積層的步數(shù)指卷積層的核每次移動的步長，所述pad值是指在輸入數(shù)據(jù)的周圍是否添加一圈數(shù)據(jù)參與運(yùn)算，pad值的大小也即添加數(shù)據(jù)的圈數(shù)。這樣，能夠進(jìn)一步提高卷積層的處理效率和速度，進(jìn)而提高圖片鑒別的效率。
[0051]作為本發(fā)明一個(gè)優(yōu)選的實(shí)施例，所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)的步驟102包括:將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O;所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為256;所述卷積層C6、卷積層C7、卷積層CS的核大小均為3，步數(shù)均為I，pad值均為I，卷積核的個(gè)數(shù)分別為384、384、256個(gè)。
[0052]作為本發(fā)明另一個(gè)優(yōu)選的實(shí)施例，所述至少一個(gè)全連接層為依次連接的全連接層fc9、全連接層fc 1、全連接層fc 11、全連接層fc 12;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2 ；且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。這里，所述的節(jié)點(diǎn)數(shù)據(jù)也可以理解為特征數(shù)目。所述dropout方式是通過隨機(jī)開啟一定數(shù)目的數(shù)據(jù)，而將剩下的數(shù)據(jù)丟棄，這樣能夠有效地防止數(shù)據(jù)的過擬合，進(jìn)而提高鑒別的效率。
[0053]參照圖2所示，為本發(fā)明提供的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型的結(jié)構(gòu)示意圖。所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 1、全連接層fell、全連接層fcl2的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。其中，所有卷積層以及全連接層fc9、全連接層fclO、全連接層fell均通過激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的處理，使得前一層的數(shù)據(jù)能夠向下一層傳遞。所述激活函數(shù)是將上一次的輸出數(shù)據(jù)通過激活函數(shù)中的算法計(jì)算得到新的輸出結(jié)果，將所述新的輸出結(jié)果作為下一層的輸入數(shù)據(jù)。本發(fā)明通過選用分類器SVM(支持向量機(jī))，使得能夠更加適用于二分問題的鑒另O。同時(shí)，本發(fā)明所采用的激活函數(shù)LEAKY RELU相比于傳統(tǒng)的激活函數(shù)RELU，在函數(shù)值小于零時(shí)，也具有一定的輸出值，也即使得函數(shù)值小于零這一部分的數(shù)據(jù)也可以參與訓(xùn)練過程。這里，當(dāng)函數(shù)值小于O時(shí)，輸出值為輸入值乘以一個(gè)系數(shù)a，所述系數(shù)a優(yōu)選采用固定值。
[0054]優(yōu)選的，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。其中，最后一個(gè)全連基層可以不需要激活函數(shù)。這樣，能夠使得數(shù)據(jù)的傳遞更為有效。
[0055]在一些可選的實(shí)施例中，本發(fā)明準(zhǔn)備正負(fù)訓(xùn)練樣本一共100小時(shí)視頻，從視頻中截取110萬張圖片，其中，正樣本訓(xùn)練圖片50萬張，負(fù)樣本訓(xùn)練圖片50萬張。測試樣本10萬張，正負(fù)樣本各5萬張。網(wǎng)絡(luò)中卷積層采用標(biāo)準(zhǔn)偏差為0.0I的高斯分布進(jìn)行初始化。LEAKY RELU函數(shù)的系數(shù)a參數(shù)為0.01。全連接層中參數(shù)采用標(biāo)準(zhǔn)偏差為0.002的高斯分布進(jìn)行初始化。dropout模塊的參數(shù)為0.5。訓(xùn)練過程采用反向傳播算法(BP算法)進(jìn)行參數(shù)的訓(xùn)練及更新。本發(fā)明中一共訓(xùn)練30萬次迭代。
[0056]參照圖3所示，為本發(fā)明提供的一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)包括:
[0057]數(shù)據(jù)提取模塊201，用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)，并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊202;其中，所述至少兩個(gè)卷積層的核大小均不大于5 X 5;
[0058]數(shù)據(jù)降維模塊202，用于接收所述數(shù)據(jù)提取模塊201發(fā)送的圖片提取后的特征數(shù)據(jù)，將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)，將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊203;其中，所述池化層采用平均值池化；
[0059]全連接模塊203，用于接收所述特征降維模塊202發(fā)送的圖片降維后的特征數(shù)據(jù)，將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊204;
[0060]分類模塊204，用于接收所述全連接模塊203發(fā)送的圖片數(shù)據(jù)的二維特征值，將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。
[0061]由上述實(shí)施例可知，所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)通過所述數(shù)據(jù)提取模塊201完成數(shù)據(jù)的卷積，進(jìn)而數(shù)顯圖片數(shù)據(jù)特征的提取，然后通過所述數(shù)據(jù)降維模塊202實(shí)現(xiàn)特征的降維處理，通過所述全連接模塊203獲得圖片數(shù)據(jù)的二維特征值，最后通過所述分類模塊204實(shí)現(xiàn)圖片數(shù)據(jù)的鑒別。所述基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)通過采用較小核的卷積層實(shí)現(xiàn)特征數(shù)據(jù)的有效提取，不僅提高了圖片鑒別的效率和速度，而且有效的防止了過擬合。
[0062]作為本發(fā)明一個(gè)優(yōu)選的實(shí)施例，所述數(shù)據(jù)提取模塊201包括:四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。
[0063]作為本發(fā)明進(jìn)一步的實(shí)施例，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為2。
[0064]作為本發(fā)明另一個(gè)優(yōu)選的實(shí)施例，所述數(shù)據(jù)降維模塊202包括:依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O;所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層CS的核大小均為3，步數(shù)均為I，pad值均為I，卷積核的個(gè)數(shù)分別為384、384、256。
[0065]在一些可選的實(shí)施例中，所述全連接模塊203包括:依次連接的全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。
[0066]在本發(fā)明另一些可選的實(shí)施例中，所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。
[0067]優(yōu)選的，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKYRELU進(jìn)行數(shù)據(jù)的激活處理。
[0068]所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:以上任何實(shí)施例的討論僅為示例性的，并非旨在暗示本公開的范圍(包括權(quán)利要求)被限于這些例子;在本發(fā)明的思路下，以上實(shí)施例或者不同實(shí)施例中的技術(shù)特征之間也可以進(jìn)行組合，步驟可以以任意順序?qū)崿F(xiàn)，并存在如上所述的本發(fā)明的不同方面的許多其它變化，為了簡明它們沒有在細(xì)節(jié)中提供。
[0069]另外，為簡化說明和討論，并且為了不會使本發(fā)明難以理解，在所提供的附圖中可以示出或可以不示出與集成電路(IC)芯片和其它部件的公知的電源/接地連接。此外，可以以框圖的形式示出裝置，以便避免使本發(fā)明難以理解，并且這也考慮了以下事實(shí)，即關(guān)于這些框圖裝置的實(shí)施方式的細(xì)節(jié)是高度取決于將要實(shí)施本發(fā)明的平臺的(即，這些細(xì)節(jié)應(yīng)當(dāng)完全處于本領(lǐng)域技術(shù)人員的理解范圍內(nèi))。在闡述了具體細(xì)節(jié)(例如，電路)以描述本發(fā)明的示例性實(shí)施例的情況下，對本領(lǐng)域技術(shù)人員來說顯而易見的是，可以在沒有這些具體細(xì)節(jié)的情況下或者這些具體細(xì)節(jié)有變化的情況下實(shí)施本發(fā)明。因此，這些描述應(yīng)被認(rèn)為是說明性的而不是限制性的。
[0070]盡管已經(jīng)結(jié)合了本發(fā)明的具體實(shí)施例對本發(fā)明進(jìn)行了描述，但是根據(jù)前面的描述，這些實(shí)施例的很多替換、修改和變型對本領(lǐng)域普通技術(shù)人員來說將是顯而易見的。例如，其它存儲器架構(gòu)(例如，動態(tài)RAM(DRAM))可以使用所討論的實(shí)施例。
[0071]本發(fā)明的實(shí)施例旨在涵蓋落入所附權(quán)利要求的寬泛范圍之內(nèi)的所有這樣的替換、修改和變型。因此，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何省略、修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法，其特征在于，包括: 將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)；將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)池化層和至少一個(gè)卷積層進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù);其中，所述池化層采用平均值池化；將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值；將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述至少兩個(gè)串聯(lián)連接的卷積層包含四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層的核大小為3 X 3、C2層的核大小為3 X 3、C3層的核大小為5 X 5、C4層的核大小為5 X 5。3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為2。4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)的步驟包括: 將所述圖片提取后的特征數(shù)據(jù)通過依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O ；所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為為256;所述卷積層C6、卷積層C7、卷積層CS的核大小均為3，步數(shù)均為l，pad值均為1，卷積核的個(gè)數(shù)分別為384、384、256個(gè)。5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述至少一個(gè)全連接層為依次連接的全連接層fc9、全連接層fclO、全連接層fell、全連接層fcl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2 ；且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述待鑒別的圖片數(shù)據(jù)依次經(jīng)過卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 1、全連接層fc 11、全連接層fc 12的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。7.根據(jù)權(quán)利要求1-6任意一項(xiàng)所述的方法，其特征在于，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKY RELU進(jìn)行數(shù)據(jù)的激活處理。8.一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別系統(tǒng)，其特征在于，包括: 數(shù)據(jù)提取模塊，用于將待鑒別的圖片數(shù)據(jù)輸入至少兩個(gè)串聯(lián)連接的卷積層進(jìn)行特征的連續(xù)提取，獲得圖片提取后的特征數(shù)據(jù)，并將圖片提取后的特征數(shù)據(jù)發(fā)送給數(shù)據(jù)降維模塊；其中，所述至少兩個(gè)卷積層的核大小均不大于5 X 5; 數(shù)據(jù)降維模塊，用于接收所述數(shù)據(jù)提取模塊發(fā)送的圖片提取后的特征數(shù)據(jù)，將所述圖片提取后的特征數(shù)據(jù)通過至少一個(gè)的池化層和至少一個(gè)卷積層反復(fù)的進(jìn)行特征數(shù)據(jù)的降維和特征數(shù)據(jù)的提取，獲得圖片降維后的特征數(shù)據(jù)，將獲得的圖片降維后的特征數(shù)據(jù)發(fā)送給全連接模塊;其中，所述池化層采用平均值池化；全連接模塊，用于接收所述特征降維模塊發(fā)送的圖片降維后的特征數(shù)據(jù)，將所述圖片降維后的特征數(shù)據(jù)輸入至少一個(gè)全連接層中，得到圖片數(shù)據(jù)的二維特征值;將獲得的圖片數(shù)據(jù)的二維特征值發(fā)送給分類模塊；分類模塊，用于接收所述全連接模塊發(fā)送的圖片數(shù)據(jù)的二維特征值，將所述二維特征值通過分類器進(jìn)行分類處理，得到圖片的鑒別結(jié)果。9.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述數(shù)據(jù)提取模塊包括: 四個(gè)依次連接的卷積層Cl層、C2層、C3層和C4層，且所述卷積層的核大小分別為:Cl層核大小為3 X 3、C2層核大小為3 X 3、C3層核大小為5 X 5、C4層核大小為5 X 5。10.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述四個(gè)依次連接的卷積層的步數(shù)均為I;四個(gè)卷積層的卷積核的個(gè)數(shù)均為96個(gè);所述Cl層和C2層的pad值均為I，所述C3層和C4層的pad值均為2。11.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述數(shù)據(jù)降維模塊包括: 依次連接的池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層CS和池化層P8;其中，所述池化層P4、池化層P5、池化層P8的核大小均為3，步數(shù)均為2，pad值均為O ；所述卷積層C5的核大小為5，步數(shù)為I，pad值為2，卷積核的個(gè)數(shù)為256個(gè);所述卷積層C6、卷積層C7、卷積層C8的核大小均為3，步數(shù)均為l，pad值均為1，卷積核的個(gè)數(shù)分別為384、384、256個(gè)。12.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述全連接模塊包括: 依次連接的全連接層f c9、全連接層f ClO、全連接層f Cl 1、全連接層f cl2;其中所述全連接層的節(jié)點(diǎn)數(shù)目分別為2048、2048、2048、2;且所有全連接層均采用dropout方式進(jìn)行數(shù)據(jù)處理。13.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述系統(tǒng)包括依次連接的卷積層Cl、卷積層C2、卷積層C3、卷積層C4、池化層P4、卷積層C5、池化層P5、卷積層C6、卷積層C7、卷積層C8、池化層P8、全連接層fc9、全連接層fc 10、全連接層fc 11、全連接層fc 12的處理，然后連接到分類器SVM中經(jīng)過分類處理，得到圖片的鑒別結(jié)果。14.根據(jù)權(quán)利要求8-13任意一項(xiàng)所述的系統(tǒng)，其特征在于，所有所述卷積層和所有所述全連接層均采用激活函數(shù)LEAKY RELU進(jìn)行數(shù)據(jù)的激活處理。
【文檔編號】G06K9/62GK105868785SQ201610195777
【公開日】2016年8月17日
【申請日】2016年3月30日
【發(fā)明人】劉陽, 白茂生, 魏偉, 蔡硯剛, 祁海
【申請人】樂視控股（北京）有限公司, 樂視云計(jì)算有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉陽;白茂生;魏偉;蔡硯剛;祁海;
技術(shù)所有人：樂視控股（北京）有限公司;樂視云計(jì)算有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

卷積神經(jīng)網(wǎng)絡(luò)圖片識別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于卷積神經(jīng)網(wǎng)絡(luò)的圖片鑒別方法及系統(tǒng)的制作方法