一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,包括以下步驟:首先建立樣本集,然后構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)模型,再在不同的初始條件下對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,將多次訓(xùn)練得到的最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型并聯(lián)連接,得到圖像質(zhì)量測(cè)試系統(tǒng),使用得到的圖像質(zhì)量測(cè)試系統(tǒng)對(duì)測(cè)試圖片進(jìn)行測(cè)試。本發(fā)明通過(guò)模擬人類(lèi)大腦學(xué)習(xí)的過(guò)程進(jìn)行特征學(xué)習(xí),克服了現(xiàn)有的圖像質(zhì)量測(cè)試方法中特征選取難的問(wèn)題,并且降低了預(yù)測(cè)結(jié)果的偶然性,集成性比較高,泛化能力強(qiáng),測(cè)試效果好。
【專(zhuān)利說(shuō)明】一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像測(cè)試領(lǐng)域,特別涉及一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法。
【背景技術(shù)】
[0002]隨著電子技術(shù)的發(fā)展和相機(jī)的普及,數(shù)字圖像已經(jīng)成為了很重要的傳達(dá)信息的媒介。人們對(duì)圖像的感官要求越來(lái)越高,這對(duì)圖像的質(zhì)量提出了更高的要求,所以對(duì)圖像的質(zhì)量測(cè)試變得越來(lái)越重要。對(duì)于圖像的質(zhì)量評(píng)價(jià)的標(biāo)準(zhǔn)有很多,概括地說(shuō),主要有以下幾個(gè)方面:(1)結(jié)構(gòu)。結(jié)構(gòu)指的是構(gòu)成一幅圖片的所有元素的組合方式。質(zhì)量好的圖像具有比較強(qiáng)的對(duì)比度,光線(xiàn)亮暗的對(duì)比,形狀的對(duì)比以及顏色的對(duì)比。(2)光線(xiàn)。圖像背景的光線(xiàn)直接影響著觀察者對(duì)圖片的感官感受。光線(xiàn)可以使得一幅質(zhì)量好的圖像的主題部分更具立體感,并使得圖像的主題區(qū)域和背景區(qū)域?qū)Ρ让黠@。(3)顏色。很多人都是通過(guò)圖像的顏色來(lái)感知的。一幅質(zhì)量好的圖像能通過(guò)特定的顏色組合來(lái)提高觀察者的特殊情感。
[0003]圖像質(zhì)量評(píng)價(jià)由發(fā)展起,已經(jīng)相繼提出了很多評(píng)價(jià)的方法。如專(zhuān)利CN101540048中提到一種基于支持向量機(jī)的圖像質(zhì)量評(píng)價(jià)方法。該方法首先對(duì)預(yù)處理后的圖像樣本進(jìn)行特征值的選擇和提取,包括圖像的對(duì)比度、熵、紋理和模糊度四個(gè)特征值,將處理后的樣本集分成訓(xùn)練集和測(cè)試集兩部分;然后利用訓(xùn)練集進(jìn)行支持向量機(jī)的訓(xùn)練,根據(jù)系統(tǒng)需要的級(jí)別確定支持向量機(jī)的個(gè)數(shù),對(duì)每個(gè)支持向量機(jī)進(jìn)行分別訓(xùn)練,訓(xùn)練中,輸入樣本是圖像的特征值,輸出時(shí)圖像質(zhì)量的級(jí)別;訓(xùn)練后得到支持向量機(jī)模型,再利用測(cè)試集對(duì)相關(guān)參數(shù)進(jìn)行調(diào)整優(yōu)化,確定支持向量機(jī)模型最優(yōu)分類(lèi)面的決策函數(shù)的參數(shù);最后應(yīng)用完成訓(xùn)練優(yōu)化的支持向量機(jī)模型對(duì)圖像樣本進(jìn)行質(zhì)量評(píng)級(jí)。
[0004]專(zhuān)利CN102915449A中提出了一種照片分類(lèi)的方法。該方法包括訓(xùn)練過(guò)程和自動(dòng)分類(lèi)過(guò)程。在訓(xùn)練過(guò)程中先采用基于功率譜斜度的方法提取樣本照片主題區(qū)域,然后提取樣本照片的特征,最終利用支持矢量機(jī)分類(lèi)器進(jìn)行照片美學(xué)質(zhì)量的訓(xùn)練,得到分界面模型;自動(dòng)分類(lèi)過(guò)程對(duì)待識(shí)別照片進(jìn)行先采用基于功率譜斜度的方法提取的主題區(qū)域,然后提取的特征,最后使用分界面模型進(jìn)行識(shí)別。
[0005]傳統(tǒng)方法需要通過(guò)提取圖像的一些特征,特征最終決定系統(tǒng)的性能,而好的特征需要很好的先驗(yàn)知識(shí)和設(shè)計(jì)經(jīng)驗(yàn),在實(shí)際系統(tǒng)開(kāi)發(fā)中很難設(shè)計(jì)最優(yōu)的具有區(qū)分度的特征。
【發(fā)明內(nèi)容】
[0006]為了克服現(xiàn)有技術(shù)的上述缺點(diǎn)與不足,本發(fā)明的目的在于提供一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,克服了傳統(tǒng)方法需要很強(qiáng)的先驗(yàn)知識(shí)來(lái)輔助提取有區(qū)分度特征的缺點(diǎn),可以降低偶然性對(duì)質(zhì)量測(cè)試結(jié)果的影響,泛化性強(qiáng),可靠性高。
[0007]本發(fā)明的目的通過(guò)以下技術(shù)方案實(shí)現(xiàn):
[0008]一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,包括以下步驟:
[0009](I)建立訓(xùn)練樣本集:所述訓(xùn)練樣本集中的訓(xùn)練圖片選自圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù);[0010](2)構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)模型:深度卷積神經(jīng)網(wǎng)絡(luò)模型包括依次連接的第一卷積層、第一抽取層、第二卷積層、第二抽取層、第三卷積層、第三抽取層和一個(gè)全連接層;
[0011](3)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型:初始化后,采用隨機(jī)梯度下降法對(duì)步驟(2)構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代,每迭代一次檢測(cè)一次梯度,以尋求網(wǎng)絡(luò)層權(quán)重和偏置的最優(yōu)解,迭代多次后得到本次訓(xùn)練的最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型;
[0012](4)改變初始化條件,重復(fù)步驟(3) η次,得到η個(gè)最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型;1≤ n ≤4 ;
[0013](5)組裝深度卷積神經(jīng)網(wǎng)絡(luò)模型:將步驟(3)和步驟(4)得到的η+1個(gè)最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型并聯(lián)連接,得到圖像質(zhì)量測(cè)試系統(tǒng);
[0014](6)利用步驟(5)得到的圖像質(zhì)量測(cè)試系統(tǒng)對(duì)測(cè)試圖片進(jìn)行質(zhì)量測(cè)試。
[0015]所述第一卷積層為Gabor卷積層,用于實(shí)現(xiàn)輸入圖像信號(hào)與Gabor濾波器的卷積操作;所述Gabor濾波器定義如下:[0016]
【權(quán)利要求】
1.一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,包括以下步驟: (1)建立訓(xùn)練樣本集:所述訓(xùn)練樣本集中的訓(xùn)練圖片選自圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù); (2)構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)模型:深度卷積神經(jīng)網(wǎng)絡(luò)模型包括依次連接的第一卷積層、第一抽取層、第二卷積層、第二抽取層、第三卷積層、第三抽取層和一個(gè)全連接層; (3)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型:初始化后,采用隨機(jī)梯度下降法對(duì)步驟(2)構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代,每迭代一次檢測(cè)一次梯度,以尋求網(wǎng)絡(luò)層權(quán)重和偏置的最優(yōu)解,迭代多次后得到本次訓(xùn)練的最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型; (4)改變初始化條件,重復(fù)步驟(3)η次,得到η個(gè)最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型;I^ n ^ 4 ; (5)組裝深度卷積神經(jīng)網(wǎng)絡(luò)模型:將步驟(3)和步驟(4)得到的η+1個(gè)最優(yōu)深度卷積神經(jīng)網(wǎng)絡(luò)模型并聯(lián)連接,得到圖像質(zhì)量測(cè)試系統(tǒng); (6)利用步驟(5)得到的圖像質(zhì)量測(cè)試系統(tǒng)對(duì)測(cè)試圖片進(jìn)行質(zhì)量測(cè)試。
2.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第一卷積層為Gabor卷積層,用于實(shí)現(xiàn)輸入圖像信號(hào)與Gabor濾波器的卷積操作;所述Gabor濾波器定義如下:..
3.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第一抽取層采用最大值抽取方法對(duì)第一卷積層的輸出進(jìn)行采樣,抽取方式為不重疊抽取。
4.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第二卷積層高斯卷積層,用于實(shí)現(xiàn)第一抽取層的輸出信號(hào)與高斯濾波器的卷積操作;所述高斯濾波器的矩陣如下:
5.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第二抽取層采用L2抽取方法對(duì)第二卷積層的輸出進(jìn)行采樣,抽取單元的大小ζ*ζ取3*3,相鄰抽取單元的間隔s取2。
6.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第三卷積層為Sobel卷積層,用于實(shí)現(xiàn)第二抽取層的輸出信號(hào)與Sobel濾波器的卷積操作。
7.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,所述第三抽取層采用最大值抽取方法對(duì)第三卷積層的輸出進(jìn)行采樣,抽取方式為不重疊抽取。
8.根據(jù)權(quán)利要求1所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,步驟(1)所述樣本集中的圖片為經(jīng)過(guò)預(yù)處理的圖片,所述預(yù)處理為:將所有圖片都?xì)w一化到128*128的大小,并轉(zhuǎn)換為HSV顏色空間。
9.根據(jù)權(quán)利要求8所述的基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量測(cè)試方法,其特征在于,步驟(6)所述測(cè)試圖片為經(jīng)過(guò)預(yù)處理的圖片,所述預(yù)處理為:將所有圖片都?xì)w一化到128*128的大小, 并轉(zhuǎn)換為HSV顏色空間。
【文檔編號(hào)】G06T7/00GK103544705SQ201310511568
【公開(kāi)日】2014年1月29日 申請(qǐng)日期:2013年10月25日 優(yōu)先權(quán)日:2013年10月25日
【發(fā)明者】郭禮華, 李福娣 申請(qǐng)人:華南理工大學(xué)