本發(fā)明涉及圖像處理領(lǐng)域,具體地,涉及一種基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊與噪聲評測方法。
背景技術(shù):
圖像質(zhì)量評估:
圖像在獲取、存儲、處理和傳輸?shù)雀鱾€過程中都非常容易發(fā)生各種不同類型的失真降質(zhì),視頻監(jiān)控系統(tǒng)下的人臉圖片也存在失真問題,主要原因如下:
1受成像器材、環(huán)境噪聲、光照條件等客觀因素的影響,導(dǎo)致從監(jiān)控視頻流中抓取的單中貞圖像質(zhì)量下降,在實際監(jiān)控系統(tǒng)中這些因素我們都是不能避免的。
2基于監(jiān)控系統(tǒng)下的人臉識別與靜態(tài)下的人臉識別相比,人是無意識、非配合的,所以多數(shù)情況下處于運動狀態(tài),由于目標(biāo)運動會導(dǎo)致抓取的圖片產(chǎn)生運動模糊。
3在監(jiān)控系統(tǒng)中人離攝像頭的距離是不斷變化的,一些較遠(yuǎn)的目標(biāo)會對焦失敗而產(chǎn)生失焦模糊。
圖像質(zhì)量客觀評價是通過建立數(shù)學(xué)模型或使用機(jī)器學(xué)習(xí)的方法,來衡量圖像退化和失真程度,根據(jù)評價方法對原始圖像信息的需要程度分為三類:全參考圖像質(zhì)量評價方法,半?yún)⒖紙D像質(zhì)量評價方法和無參考圖像質(zhì)量評價方法。
全參考和半?yún)⒖挤椒ㄐ枰獏⒖紙D像的全部或者部分信息,在很多時候,參考圖像信息很難獲取或者獲得代價太高,而無參考圖像質(zhì)量評價不需要原始圖像的任何信息,所以無參考評價方法更為重要。
目前的無參考模糊圖像質(zhì)量評價算法大致分為三類:直接計算模糊圖像質(zhì)量的評價算法、基于構(gòu)造參考圖像的評價算法、基于機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的評價算法。
常規(guī)的模糊圖像質(zhì)量評價算法:
1在空間域,用sobel檢測算法進(jìn)行邊緣檢測,并通過尋找各個邊緣兩側(cè)最近的局部極值點確定邊緣寬度,最后將邊緣寬度的均值作為圖像的模糊分?jǐn)?shù)。由于受到噪聲的影響,對局部極值點的確定會存在較大的誤差,這種圖像模糊評價方法相對來說準(zhǔn)確度不高。
2在頻域,由于圖像模糊會導(dǎo)局部相干性結(jié)構(gòu)的破壞,因此用局部相干性強(qiáng)度可作為特征量描述圖像中模糊的強(qiáng)弱。
3將頻域和空域相結(jié)合,在頻域利用圖像局部幅度譜的梯度衡量模糊造成的高頻能量衰減,同時在空域利用全變差描述局部對比度對模糊的影響。
基于構(gòu)造參考圖像的評價算法:
基于構(gòu)造參考圖像的模糊評價算法,主要應(yīng)用結(jié)構(gòu)相似度算法對參考圖像和失真圖像進(jìn)行相關(guān)的計算,得出兩者的亮度、對比度等圖像信息,并加以對比分析,得到圖像質(zhì)量評價分?jǐn)?shù)。
基于機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的評價算法:
該類算法首先提取出特征向量,然后對其進(jìn)行訓(xùn)練學(xué)習(xí),得到一個基于機(jī)器學(xué)習(xí)或人工神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量評價模型。
因為不同失真水平的圖像特征和質(zhì)量評分之間的復(fù)雜關(guān)系不能用一個單一的公式來表達(dá),所以對圖像頻域或時域信息分析來評估圖像質(zhì)量只對某一種特定的失真類型效果好,泛化性差,也存在著計算復(fù)雜度較高的問題。當(dāng)前提出的圖像模糊評價方法主要利用圖像的低層次特征,使其評測精度不高。
圖像模糊類型的判定:
在自然場景下拍攝獲取的兩種最常見的模糊圖像:場景的失焦和運動模糊。在圖像處理過程中也會產(chǎn)生模糊如圖像壓縮、高斯低通濾波。不同的模糊類型會造成圖像頻譜中不同高頻成分的丟失,在圖像頻譜中包含了描述圖像特性的(如噪聲、模糊等)的信息,因此,不同類型模糊圖像的頻譜圖有較大差異,運動模糊圖像的頻譜圖呈長條狀,而散焦模糊圖像的頻譜圖呈圓形由中心向四周發(fā)散,可以用它來鑒別一幅圖像的模糊的類型。普通的圖像模糊類型判定方法首先通過離散傅里葉變換得到頻譜圖,然后對頻譜圖進(jìn)行了一系列的預(yù)處理,包括:平滑濾波、圖像增強(qiáng)、數(shù)學(xué)形態(tài)學(xué)處理、二值化等,最后通過提取頻譜圖中的特征來分類。
與本發(fā)明相關(guān)的現(xiàn)有技術(shù)一:
現(xiàn)有技術(shù)技術(shù)一方案
基于卷積神經(jīng)網(wǎng)絡(luò)的圖像計量評估方法中,一篇文章提出一個卷積神經(jīng)網(wǎng)絡(luò)iqf-cnn,結(jié)構(gòu)如圖2所示,能自動學(xué)習(xí)有判別性的圖像質(zhì)量特征,并利用學(xué)習(xí)的特征進(jìn)行圖像質(zhì)量評價。
網(wǎng)絡(luò)訓(xùn)練過程:在歸一化后的圖像上隨機(jī)選取不重疊的大小為32*32的圖像塊;使用有監(jiān)督學(xué)習(xí)方法訓(xùn)練iqf-cnn模型,優(yōu)化模型參數(shù)。
測試過程:先通過無重疊采樣獲得圖像塊先測試圖像,給出每個小圖塊的質(zhì)量評價分?jǐn)?shù),再通過對所有圖像塊分?jǐn)?shù)求平均,即可估計出測試圖像的視覺質(zhì)量分?jǐn)?shù)。
現(xiàn)有技術(shù)技術(shù)一方案缺點:
該方法算法能較準(zhǔn)確地評估五種常用的圖像失真,整體性能優(yōu)于其他經(jīng)典評價方法。由于輸入圖像需要切成32*32的圖像塊,不容易嵌入到人臉識別系統(tǒng)中。該方法使用的是一個單網(wǎng)絡(luò),預(yù)測出輸入圖片作綜合質(zhì)量評測分?jǐn)?shù)。
與本發(fā)明相關(guān)的現(xiàn)有技術(shù)二
現(xiàn)有技術(shù)技術(shù)二方案
基于概率神經(jīng)網(wǎng)絡(luò)的模糊類型鑒別方法。將二維圖像頻譜用“zigzag”法則抽樣為一維輸入矢量,作為網(wǎng)絡(luò)的輸入,由于離焦模糊和高斯模糊的頻譜特性近似,因而采用兩級神經(jīng)網(wǎng)絡(luò)對其分類。第二級神經(jīng)網(wǎng)絡(luò)仍采用概率神經(jīng)網(wǎng)絡(luò),輸出神經(jīng)元數(shù)為2,用于對第一級鑒別為高斯/離焦的圖像做進(jìn)一步精確分類。
現(xiàn)有技術(shù)技術(shù)二方案缺點:
該方法把頻譜圖抽為一維向量,輸入概率神經(jīng)網(wǎng)絡(luò)進(jìn)行模糊分類。概率神經(jīng)網(wǎng)絡(luò)架構(gòu)是按照貝葉斯判別函數(shù)來設(shè)置的,以實現(xiàn)錯誤率最小化。所以網(wǎng)絡(luò)針對概率密度函數(shù)作了三個假設(shè):
1各分類的概率密度函數(shù)形態(tài)相同。
2次共同的概率密度函數(shù)為高斯分布。
3各分類的高斯分布概率密度函數(shù)的變異矩陣為對角矩陣,且各對角元素的值相同,值為σ。
該方法對訓(xùn)練樣本分布和代表性要求非常高,不能解決圖像是否清晰與模糊類型判斷的問題。
技術(shù)實現(xiàn)要素:
由于不同模糊的圖像特征和模糊類型判定的關(guān)系復(fù)雜,而神經(jīng)網(wǎng)絡(luò)所具有的學(xué)習(xí)能力可以使它抽取并逼近輸入與輸出之間的內(nèi)在聯(lián)系,且獨特的深層結(jié)構(gòu)可以學(xué)習(xí)更具判別性、準(zhǔn)確性的特征,因此神經(jīng)網(wǎng)絡(luò)是一種理想的解決方案,基于深度學(xué)習(xí)的圖像質(zhì)量估計算法也不斷涌現(xiàn)。多任務(wù)學(xué)習(xí)基本假設(shè)是多個任務(wù)之間具有相關(guān)性,利用任務(wù)之間的相關(guān)性互相促進(jìn),通過共享表示采用并行訓(xùn)練的方法學(xué)習(xí)多個任務(wù),思想如圖1所示,基本目標(biāo)是提高泛化性能。單獨訓(xùn)練的時候是無法利用這些信息,多任務(wù)學(xué)習(xí)則可以利用任務(wù)相關(guān)性聯(lián)合提高多個屬性分類的精度,相關(guān)文獻(xiàn)實驗表明多任務(wù)可以比單任務(wù)產(chǎn)生20%-30%的提升。
影響圖像質(zhì)量由多個因素,如圖像模糊、噪聲等,可以用多任務(wù)網(wǎng)絡(luò)來學(xué)習(xí)不同的屬性。深度網(wǎng)絡(luò)的層級表示從語義上從底層到高層不斷遞進(jìn),網(wǎng)絡(luò)層數(shù)較淺的卷積層包含較多的細(xì)節(jié)、局部信息,對于層數(shù)較深的卷積層則包含較多的整體信息。表征圖像模糊的邊緣信息是局部特征,噪聲水平需要全局特征,將多個卷積層特征融合成一個子塊空間用作多任務(wù)學(xué)習(xí)的特征,通過中間層特征的利用和多任務(wù)學(xué)習(xí),這兩點相輔相成,往往比單任務(wù)學(xué)習(xí)可以取得更好的效果。
本發(fā)明目的在于提供了一種基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊與噪聲評測方法,解決視頻監(jiān)控下人臉識別系統(tǒng)中檢測出的人臉圖像預(yù)判斷問題,實現(xiàn)了通過網(wǎng)絡(luò)一次性得到圖像的噪聲水平、模糊度估計、模糊類型,簡單且快速,方便集成到基于監(jiān)控視頻下的人臉識別系統(tǒng)中的技術(shù)效果。
視頻監(jiān)控圖像會受成像器材、環(huán)境噪聲、光照條件等客觀因素及目標(biāo)運動的影響而引入各種失真問題。通過實驗表明,低質(zhì)量的圖片會使視頻監(jiān)控下的人臉識別精度下降,則有必要對圖片進(jìn)行預(yù)處理。模糊和噪聲是影響圖像質(zhì)量最重要的兩個因素,所以在人臉識別系統(tǒng)中,有圖像去噪和去模糊等圖像預(yù)處理模塊。在對圖片進(jìn)行預(yù)處理前需要做一個判斷:圖片做什么樣的預(yù)處理。比如圖像存在模糊而且超過一定模糊程度,對圖像進(jìn)行去模糊操作。如果圖像不僅存在模糊還有大量噪音,對圖片先進(jìn)行模糊操作,然后再進(jìn)行去噪操作。因為不同模糊類型去模糊方法不同,需要預(yù)測圖像模糊類型。本發(fā)明是一個基于監(jiān)控視頻下人臉識別系統(tǒng)中的圖像預(yù)判斷模塊,該模塊對人臉圖像做模糊類型判定、模糊度估計、噪聲水平估計,要求簡單,速度快,以便嵌入到人臉識別系統(tǒng)中。
為解決上述技術(shù)問題,本申請?zhí)峁┝艘环N基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊與噪聲評測方法,所述方法包括:
步驟1:收集失真和對應(yīng)高質(zhì)量的圖片(樣本集采集的場景是基于視頻監(jiān)控下的人臉圖片,要求具有不同失真程度。高質(zhì)量的圖片是沒有模糊,噪聲小的圖片),對收集的圖片(進(jìn)行人臉檢測和對齊后再)進(jìn)行標(biāo)定包括:模糊類型標(biāo)定,模糊程度標(biāo)定,噪聲水平標(biāo)定,標(biāo)定后的圖片組成數(shù)據(jù)集;
步驟2:用步驟1生成的樣本訓(xùn)練多任務(wù)卷積神經(jīng)網(wǎng)絡(luò),得到用于圖像模糊與噪聲評測的網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)共有三個任務(wù)任務(wù)輸出,分別對應(yīng)模糊類型判定,模糊度估計,噪聲水平估算。訓(xùn)練過程中,前半部分多個卷積層權(quán)值共享。后半部分有三個任務(wù),每個獨立的網(wǎng)絡(luò)結(jié)構(gòu)擁有獨立的全連接層,采用了多種損失函數(shù)用以訓(xùn)練不同任務(wù)。);融合多個卷積層得到全連接層,全連接層中包括三個特征層:模糊度估計特征層、模糊類型判定特征層、噪聲水平估計特征層;
包括的卷積層有:淺層(如第一個卷積層),最后一個卷積層;融合的方法為:對最后一個卷積層分別進(jìn)行最大和平均的全局池化操作,對得到的融合結(jié)果分別做l2規(guī)范化后,對得到的兩個特征向量級聯(lián)作為圖像表示。對淺層卷積層最同樣的操作得到淺層圖像表示后,對兩個圖像表示做二次級聯(lián)得到最終圖像表示。具體如圖五所示。
采用這種融合方法原因:
1因為簡單的特征就能表征圖像質(zhì)量,減少冗余數(shù)據(jù),防止過擬合。
2使用這樣的微網(wǎng)絡(luò)的結(jié)構(gòu),可以抽象出更加好的局部特征,使得特征圖與類別有一致性。
具體的訓(xùn)練過程為:
1從數(shù)據(jù)集中隨機(jī)抽取m張圖片,輸入到步驟2建立的多任務(wù)卷積網(wǎng)絡(luò),進(jìn)行多任務(wù)同步訓(xùn)練。
2網(wǎng)絡(luò)前向傳播,分別計算模糊類別判定損失,模糊度估計損失,噪聲水平估計損失。
3計算多任務(wù)卷積網(wǎng)絡(luò)總loss。計算梯度,用隨機(jī)梯度下降法更新網(wǎng)絡(luò)。直至總的目標(biāo)函數(shù)趨于穩(wěn)定
步驟3:對一張已經(jīng)檢測和對齊的人臉圖片,輸入到步驟2得到的網(wǎng)絡(luò)模型中,進(jìn)行圖像模糊類型判定、模糊度估計、噪聲水平估計得到:模糊度估計值a,為最終模糊度評測值,得到運動模糊與失焦模糊概率(pi),如果a小于閾值c,則判定結(jié)果為圖像清晰,否則最終模糊類別判定結(jié)果為概率大的類別;得到噪聲水平估計值b,為最終噪聲水平估計值。
本申請中的基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊與噪聲評測方法,用于快速評測圖像的多個失真(圖像模糊和圖像噪聲),解決視頻監(jiān)控下人臉識別系統(tǒng)中檢測出的人臉圖像預(yù)判斷問題。
進(jìn)一步的,模糊類型包括:運動模糊和失焦模糊,模糊程度為一個0至1的主觀評價值包括:不存在運動模糊和失焦模糊的圖片模糊度。
進(jìn)一步的,模糊內(nèi)類判定目標(biāo)函數(shù)為:
網(wǎng)絡(luò)預(yù)測兩個值(網(wǎng)絡(luò):用于圖像模糊與噪聲評測的多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)有三個子任務(wù)(模糊類型判定,模糊度估計,噪聲水平估計),網(wǎng)絡(luò)預(yù)測兩個值:網(wǎng)絡(luò)計算出的兩個概率值(子任務(wù)的第二個全連接層的輸出),表示圖片為運動模糊的概率或為失焦模糊的概率。目的:模糊類別判定;),模糊類型包括:運動模糊和失焦模糊,設(shè)定若圖片模糊度大于閾值α,則存在模糊(l=1),若圖片模糊度小于α,則圖片不存在模糊(l=0);使用softmax作為loss函數(shù):
lossd=l(-(1-g)log(1-p1)-glog(p2))
lossd=l(-(1-g)log(1-p1)-glog(p2))
其中,loss1為模糊內(nèi)類判定的損失值,l為圖像標(biāo)定的模糊類別;若圖片為只存運動模糊g=0,否則g=1,p1,p2是網(wǎng)絡(luò)計算出的兩個概率值,p1表示圖片為運動模糊的概率,p2表示圖片為失焦模糊的概率。
進(jìn)一步的,模糊度估計目標(biāo)函數(shù)為:
網(wǎng)絡(luò)(子任務(wù)網(wǎng)絡(luò)(噪聲水平估計)的輸出)預(yù)測模糊度,根據(jù)學(xué)習(xí)模糊度判斷圖像是否需要進(jìn)行去模糊操作,使用歐氏距離的loss函數(shù)去學(xué)習(xí)圖像模糊度為:
其中,loss2為模糊度估計的損失值,d'為預(yù)測的模糊度,d為圖像模糊度的主觀評價值。
進(jìn)一步的,噪聲水平估計目標(biāo)函數(shù)為:
網(wǎng)絡(luò)(子任務(wù)網(wǎng)絡(luò)(噪聲水平估計)的輸出)預(yù)測噪聲水平,使用歐氏距離的loss函數(shù)去學(xué)習(xí)圖像的噪聲水平,計算式如下:
其中,(loss3為噪聲水平估計的loss值),n為預(yù)測的噪聲水平,n為圖像噪聲水平的主觀評價值;
多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的總loss函數(shù)為三個loss函數(shù)的加權(quán)之和,計算方式如下:
λt為預(yù)設(shè)的三個任務(wù)的權(quán)重系數(shù),losst對應(yīng)多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的模糊類別判定損失,模糊度估計損失,噪聲水平估計損失。
本申請?zhí)峁┑囊粋€或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
根據(jù)上述方案描述,本發(fā)明技術(shù)方案在圖像質(zhì)量評估上不是單單做一個綜合分?jǐn)?shù)的測評或者圖像失真類型的分類,而是測評了影響圖像質(zhì)量最主要的兩個因素:模糊和噪聲,為圖像預(yù)處理做了一個預(yù)判斷。該方法也不像普通方法一樣分析頻域或時域信息或者提取邊緣特征在學(xué)習(xí)一個分類模型,計算復(fù)雜而且只利用了圖像淺層特征泛化性差。使用多任務(wù)神經(jīng)網(wǎng)絡(luò)同時學(xué)習(xí)圖片的多個屬性,不需要提取頻譜圖,而是讓網(wǎng)絡(luò)自出學(xué)習(xí)局部和全局特征信息,增加算法本身的泛化性能。通過網(wǎng)絡(luò)一次性得到圖像的噪聲水平、模糊度估計、模糊類型,簡單且快速,方便集成到基于監(jiān)控視頻下的人臉識別系統(tǒng)中。
附圖說明
此處所說明的附圖用來提供對本發(fā)明實施例的進(jìn)一步理解,構(gòu)成本申請的一部分,并不構(gòu)成對本發(fā)明實施例的限定;
圖1是本申請中多任務(wù)學(xué)習(xí)結(jié)構(gòu)示意圖;
圖2是本申請中iqf-cnn網(wǎng)絡(luò)結(jié)構(gòu)示意圖;
圖3是本申請中概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖;
圖4是本申請中多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊和噪聲評測框架示意圖;
圖5是本申請中多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)卷積層融合示意圖。
具體實施方式
本發(fā)明提供了一種基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊與噪聲評測方法,解決視頻監(jiān)控下人臉識別系統(tǒng)中檢測出的人臉圖像預(yù)判斷問題,實現(xiàn)了通過網(wǎng)絡(luò)一次性得到圖像的噪聲水平、模糊度估計、模糊類型,簡單且快速,方便集成到基于監(jiān)控視頻下的人臉識別系統(tǒng)中的技術(shù)效果。
為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是,在相互不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。
在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述范圍內(nèi)的其他方式來實施,因此,本發(fā)明的保護(hù)范圍并不受下面公開的具體實施例的限制。
基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的圖像模糊和噪聲評測方法框架
網(wǎng)絡(luò)多任務(wù)學(xué)習(xí)的總體框架設(shè)計如圖4所示:
框架執(zhí)行流程描述如下:
數(shù)據(jù)集
收集失真和對應(yīng)高質(zhì)量的圖片,對圖片進(jìn)行人工客觀標(biāo)定:模糊類型(運動模糊/失焦模糊),模糊程度(不存在運動模糊和失焦模糊的圖片模糊度為0),噪聲水平。
訓(xùn)練
首先融合多個卷積層得到一個總的全連接層(fc-full),這里有三個特征層:模糊度估計特征(fc-blur)、模糊類型判定特征(fc-class)、噪聲水平估計特征(fc-noise)。
1.模糊類型判定:
網(wǎng)絡(luò)預(yù)測兩個值。模糊類型有兩種,運動模糊和失焦模糊,這里設(shè)定如果圖片模糊度大于閾值α,則認(rèn)為存在模糊(l=1),如果圖片模糊度小于α,則認(rèn)為圖片不存在模糊(l=0)。使用softmax作為loss函數(shù):
lossd=l(-(1-g)log(1-p1)-glog(p2))
a2=compet(w2a1)
其中如果圖片為只存運動模糊g=0,否則g=1,(p1,p2)是網(wǎng)絡(luò)計算出的兩個概率值,p1表示圖片為運動模糊的概率,p2表示圖片為失焦模糊的概率。
2.模糊度估計:
網(wǎng)絡(luò)預(yù)測模糊度。學(xué)習(xí)模糊度是為了判斷一個圖像是不是有模糊,根據(jù)這一度量決定圖像需不需要做去模糊操作。使用歐氏距離的loss函數(shù)去學(xué)習(xí)圖像模糊度如下所示:
其中d'為預(yù)測的模糊度,d為圖像模糊度的主觀評價值。
3.噪聲水平估計:
網(wǎng)絡(luò)預(yù)測噪聲水平。使用歐氏距離的loss函數(shù)去學(xué)習(xí)圖像的噪聲水平,計算式如下:
其中n'為預(yù)測的噪聲水平,n為圖像噪聲水平的主觀評價值。
總的loss值為三個loss函數(shù)的加權(quán)之和,計算式如下:
測試
給定一張測試圖片,同時得到三個結(jié)果。對模糊度進(jìn)行分析:如果圖片模糊度分?jǐn)?shù)小于閾值β,則圖片認(rèn)定無模糊。如果圖片模糊度分?jǐn)?shù)大于閾值β,再判斷模糊類型。
上述本申請實施例中的技術(shù)方案,至少具有如下的技術(shù)效果或優(yōu)點:
根據(jù)上述方案描述,本發(fā)明技術(shù)方案在圖像質(zhì)量評估上不是單單做一個綜合分?jǐn)?shù)的測評或者圖像失真類型的分類,而是測評了影響圖像質(zhì)量最主要的兩個因素:模糊和噪聲,為圖像預(yù)處理做了一個預(yù)判斷。該技術(shù)也不像普通方法一樣分析頻域或時域信息或者提取邊緣特征在學(xué)習(xí)一個分類模型,計算復(fù)雜而且只利用了圖像淺層特征泛化性差。使用多任務(wù)神經(jīng)網(wǎng)絡(luò)同時學(xué)習(xí)圖片的多個屬性,不需要提取頻譜圖,而是讓網(wǎng)絡(luò)自出學(xué)習(xí)局部和全局特征信息,增加算法本身的泛化性能。通過網(wǎng)絡(luò)一次性得到圖像的噪聲水平、模糊度估計、模糊類型,簡單且快速,方便集成到基于監(jiān)控視頻下的人臉識別系統(tǒng)中。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。