本發(fā)明涉及圖像質(zhì)量評價
技術(shù)領(lǐng)域:
,尤其是涉及一種基于遺傳算法和極端學(xué)習(xí)機的的立體圖像質(zhì)量客觀評價方法的改進優(yōu)化。
背景技術(shù):
:隨著多媒體技術(shù)的快速發(fā)展,立體成像技術(shù)已成為該領(lǐng)域的關(guān)鍵技術(shù)之一。立體圖像的獲取、處理、存儲、傳輸與顯示等過程,不可避免地會引入一些失真,如何有效評估立體圖像的質(zhì)量已成為國內(nèi)外學(xué)者的研究熱點之一。立體圖像質(zhì)量評價方法分為主觀評價和客觀評價兩種。前者是由觀察者依照主觀感受評價測試圖像的質(zhì)量,該方法的評價結(jié)果更為真實地反映了立體圖像質(zhì)量,然而費時費力,在實際應(yīng)用中受到嚴重的限制。相比之下,后者更具有實時性和可操作性等優(yōu)點。因此,建立一套可以準確反映人眼主觀感受的立體圖像質(zhì)量客觀評價機制具有深遠意義[1]?,F(xiàn)階段,國內(nèi)外對立體圖像質(zhì)量客觀評價進行了廣泛的研究。文獻[2]結(jié)合空間感知信息與絕對差值信息,提出了一種基于結(jié)構(gòu)相似度(structuralsimilarity,ssim)的立體圖像質(zhì)量客觀評價方法;文獻[3]考慮了人類觀看立體圖像的雙目融合特性,基于傳統(tǒng)平面圖像質(zhì)量評價方法,提出了改進的立體圖像質(zhì)量評價方法;文獻[4]利用視差空間圖建立了一種立體圖像質(zhì)量客觀評價模型;文獻[5]提出了一種基于稀疏表示的立體圖像質(zhì)量客觀評價方法;文獻[6]通過模擬人眼視覺系統(tǒng)中初級視皮層的簡單和復(fù)雜細胞行為,構(gòu)造了一個信號處理模型對立體圖像質(zhì)量進行客觀評價;文獻[7]根據(jù)單目閉塞與雙目競爭特性,提出了一種感知調(diào)整特征相似度評價方法;文獻[8]提出了一種基于雙目質(zhì)量感知模型的無參考立體圖像質(zhì)量客觀評價方法;文獻[9]提出了一種基于三維結(jié)構(gòu)張量的立體圖像質(zhì)量評價方法。以上具有代表性的文獻均是基于人眼視覺特性建立的立體圖像質(zhì)量評價模型。然而,迄今為止,由于人類對人眼視覺系統(tǒng)的認知水平還很有限,現(xiàn)有的人類視覺特性未必能夠全面反映人的視覺感受。因此,一些文獻提出采用神經(jīng)網(wǎng)絡(luò)方法來建立立體圖像質(zhì)量評價模型。文獻[10]提出了一種基于遺傳神經(jīng)網(wǎng)絡(luò)的立體圖像客觀質(zhì)量評價模型;文獻[11]通過獨立成分分析(independentcomponentanalysis,ica)對立體圖像進行預(yù)處理,結(jié)合基于二叉樹的支持向量機方法,建立一種立體圖像質(zhì)量評價模型。文獻[12]考慮到傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在學(xué)習(xí)速度緩慢、泛化能力差、極易陷入局部極小值等缺點,在使用主成分分析(principalcomponentanalysis,pca)進行預(yù)處理的基礎(chǔ)上,引入了極端學(xué)習(xí)機(extremelearningmachine,elm)[13-15]對立體圖像質(zhì)量進行客觀評價。然而,由于elm網(wǎng)絡(luò)的輸入權(quán)值和隱藏層節(jié)點的偏移量是隨機給定的,對于具有相同隱藏層神經(jīng)元個數(shù)的elm網(wǎng)絡(luò),輸入權(quán)值矩陣和偏移量的取值不同,網(wǎng)絡(luò)的性能有很大差異,進而影響立體圖像質(zhì)量評價的準確性。參考文獻:[1]魯業(yè)頻、陳兆龍、李素平,圖像質(zhì)量評價的研究現(xiàn)狀與發(fā)展[j],電視技術(shù),2014,38(19):23-27;[2]demirandacardosojv,danilomirandaregisc,dealencarms.ontheperformanceofdisparity-basedweightingtechniqueappliedto3dimagequalityassessment[a].broadbandmultimediasystemsandbroadcasting(bmsb)[c].ieeeinternationalsymposiumon.ieee,2014:1-4,[3]yu-hsunlin,ja-lingwu.qualityassessmentofstereoscopic3dimagecompressionbybinocularintegrationbehaviors[j].ieeetransactionsonimageprocessing,2014,23(4):1527–1542,[4]jangqiu-ping,shaofeng,jianggang-yi,etal.anobjectivestereoscopicimagequalityassessmentmethodbasedondisparityspaceimage[j].journalofoptoelectronics·laser,2013,24(12):2409-2415,[5]姜求平、邵楓、蔣剛毅等,基于視差空間圖的立體圖像質(zhì)量客觀評價方法[j],光電子,激光,2013,24(012):2409-2415;[6]like-meng,shaofeng,jianggang-yi,etal.anobjectivequalityassessmentofstereoscopicimagebasedonsparserepresentation[j].journalofoptoelectronics·laser,2014,25(11):2227~2233,[7]李柯蒙、邵楓、蔣剛毅等,基于稀疏表示的立體圖像客觀質(zhì)量評價方法[j],光電子,激光,2014,25(11):2227~2233;[8]pereragcv,desilvav,kondozam,etal.animprovedmodelofbinocularenergycalculationforfull-referencestereoscopicimagequalityassessment[a].acoustics,speechandsignalprocessing(icassp)[c].2014ieeeinternationalconferenceon.ieee,2014:594-598,[9]wujiezhou,gangyijiang,fengshao.pmfs:aperceptualmodulatedfeaturesimilaritymetricforstereoscopicimagequalityassessment[j].2014ieeesignalprocessingletters,21(8):1003-1006,[10]sohnk,ryus.no-referencequalityassessmentforstereoscopicimagesbasedonbinocularqualityperception[j].2014ieeetransactiononcircuitsandsystemsforvideotechnology,24(4):591-602,[11]duanfen-fang,shaofeng,jianggang-yi,etal.anobjectivequalityassessmentmetricforstereoscopicimagesbasedonthree-dimensionalstructuretensor[j].journalofoptoelectronics.laser,2014,25(001):192-198,[12]段芬芳、邵楓、蔣剛毅等,基于三維結(jié)構(gòu)張量的立體圖像質(zhì)量客觀評價方法[j].光電子,激光,2014,25(001):192-198;[13]wuxian-guang,lisu-mei,chengjin-cui,etal.objectivequalityevaluationmethodofstereoimagebasedongeneticalgorithmandneuralnetwork[j].informationtechnology,2013,(5):148-153,[14]吳限光、李素梅、程金翠等,基于遺傳神經(jīng)網(wǎng)絡(luò)的立體圖像的客觀評價[j],信息技術(shù),2013,(5):148-153;[15]chengjandlis.objectivequalityassessmentofstereoimagesbasedonicaandbt-svm[a].computerscience&education(iccse),20127thinternationalconferenceon.ieee[c].2012,154-159,[16]wangguang-hua,lisu-mei,zhudan,etal.applicationofextremelearningmachineinobjectivestereoscopicimagequalityassessment[j].journalofoptoelectronics·laser,2014,25(9):1837-1842,[17]王光華、李素梅、朱丹等;極端學(xué)習(xí)機在立體圖像質(zhì)量客觀評價中的應(yīng)用[j],光電子,激光,2014,25(9):1837-1842;[18]huanggb,zhuqy,andsiewck.extremelearningmachine:anewlearningschemeoffeedforwardneuralnetworks[a].neuralnetworks,2004.proceedings.2004ieeeinternationaljointconferenceon.ieee[c].2004,985-990,[19]huanggb,wangdh,andlany.extremelearningmachines:asurvey[j].internationaljournalofmachinelearningandcybernetics,2011,2(2):107-122.[20]huanggb,zhuqy,andsiewck.extremelearningmachine:theoryandapplications[j].neurocomputing,2006,70(1):489-501.[21]caid,hex,hanj,etal.orthogonallaplacianfacesforfacerecognition[j].imageprocessing,ieeetransactionson,2006,15(11):3608-3614.技術(shù)實現(xiàn)要素:為了克服上述現(xiàn)有技術(shù)存在的問題,本發(fā)明提出了一種基于ga-elm的立體圖像質(zhì)量客觀評價方法,利用正交局部保留投影(orthogonallocalitypreservingprojection,olpp)提取立體圖像特征并降維,而后采用ga-elm網(wǎng)絡(luò)進行質(zhì)量等級判定。本發(fā)明提出了一種基于ga-elm的立體圖像質(zhì)量客觀評價方法,該方法包括以下步驟:步驟(1)、選取訓(xùn)練樣本和測試樣本;步驟(2)、利用olpp算法對于訓(xùn)練樣本和測試樣本進行特征提取和降維,即在olpp算法中,給定高維特征空間中的樣本集x=[x1,x2,…,xn],xn代表樣本集中的各立體圖像,n代表高維訓(xùn)練樣本個數(shù),olpp算法具體包括以下步驟:對原始圖像數(shù)據(jù)采用pca降維,通過去除與零特征值對應(yīng)的成分,將圖像投影到pca子空間中。wpca表示pca的變換矩陣;構(gòu)建鄰接圖g,若xi是xj的p個最近鄰之一,則鄰接圖g有邊xixj。對于每一個樣本xi,有p條邊;若鄰接圖g有邊xixj,則邊xixj的權(quán)重sij的若鄰接圖g有邊xixj,則邊xixj的權(quán)重sij為exp(-||xi-xj||2/t),否則,sij為0;定義對角矩陣d,其對角元素并定義拉普拉斯矩陣l=d-s。令{a1,a2,…,ak}表示正交基向量,且定義中間變量a(k-1),b(k-1)如下式:a(k-1)=[a1,a2,…,ak-1]b(k-1)=[a(k-1)]t(xdxt)-1a(k-1)將式以上公式代入如下迭代過程,計算求得正交基向量{a1,a2,…,ak};計算與(xdxt)-1xlxt的最小特征值相關(guān)聯(lián)的特征向量a1;計算與p(k)={i-(xdxt)-1a(k-1)[b(k-1)]-1[a(k-1)]t}(xdxt)-1xlxt的最小特征值相關(guān)聯(lián)的特征向量ak;將樣本集x空間依據(jù)投影矩陣w投影到一個低維特征空間的樣本集y=[y1,y2,…,yn],y=wtx,將訓(xùn)練樣本和測試樣本投影到olpp子空間中,y是立體圖像x經(jīng)過olpp降維處理后的信息;投影矩陣w=wpcawolpp,wolpp=[w1,w2,…,wd];步驟(3)、采用ga優(yōu)化的極端學(xué)習(xí)機elm對訓(xùn)練樣本進行分類處理,即:讀入訓(xùn)練樣本,并將樣本隨機分成訓(xùn)練集和測試集兩部分;進行種群初始化,設(shè)置種群個體數(shù)為n,種群中的個體包含了elm網(wǎng)絡(luò)結(jié)構(gòu)的所有權(quán)重與閾值;優(yōu)化產(chǎn)生輸入隱藏層權(quán)值αi以及閾值bi,i=1,…,l;其中,l為隱藏層節(jié)點個數(shù),αi,bi∈[-1,1];選擇訓(xùn)練集的數(shù)據(jù)誤差絕對值之和作為個體適應(yīng)度函數(shù),如下式所示。其中m代表神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點數(shù),代表訓(xùn)練集的預(yù)測結(jié)果,t={t1,t2,…,tm}是訓(xùn)練集的真實值,abs表示求加權(quán),k為加權(quán)系數(shù);將遺傳算法的優(yōu)化結(jié)果返回elm網(wǎng)絡(luò),用優(yōu)化后的αi和bi計算產(chǎn)生輸出層權(quán)值矩陣β;選擇一個無限可微的函數(shù)作為隱藏層神經(jīng)元的激勵函數(shù)g(x),計算隱藏層輸出矩陣h;通過最小二乘法計算輸出層權(quán)值矩陣β,輸入樣本的期望輸出值矩陣t,完成模型建立;β=htt其中,與現(xiàn)有技術(shù)相比,本發(fā)明采用優(yōu)化后的elm網(wǎng)絡(luò)能夠具有更好的分類識別效果,提高測試樣本正確分類識別率;本方法還比較了ga-elm算法和elm、svm算法的性能,從中可知,本發(fā)明在立體圖像質(zhì)量客觀評價方面整體性能優(yōu)于elm、svm,具有實際可行性。附圖說明圖1為立體圖像質(zhì)量客觀評價框圖;圖2為ga優(yōu)化elm網(wǎng)絡(luò)算法流程圖。具體實施方式遺傳算法是一種基于自然界遺傳機制和生物進化理論的并行隨機搜索優(yōu)化方法。該方法通過不斷迭代得到具有最優(yōu)適應(yīng)性的結(jié)果。因此,將ga與elm網(wǎng)絡(luò)相結(jié)合,構(gòu)成ga-elm網(wǎng)絡(luò),使用ga優(yōu)化elm網(wǎng)絡(luò)結(jié)構(gòu)的初始權(quán)重與隱藏層節(jié)點偏移量,從而找到能夠使elm取得最優(yōu)效果的權(quán)重和隱藏層節(jié)點偏移量,以消除輸入權(quán)值和隱藏層節(jié)點偏移量的隨機性對elm網(wǎng)絡(luò)預(yù)測性能的影響,提高預(yù)測精度。下面將結(jié)合附圖對本發(fā)明具體實施方式作進一步地詳細描述。具體步驟如下:步驟一、選取訓(xùn)練樣本和測試樣本根據(jù)itu-rbt.500和itu-rbt.1438標準通過主觀測試獲取評價數(shù)據(jù)樣本,經(jīng)過反復(fù)試驗選取訓(xùn)練樣本和測試樣本。其中主觀測試實驗所選取的立體圖像均來自寬帶無線通信與立體成像研究所圖像數(shù)據(jù)庫,共選取380幅立體圖像樣本,每一樣本圖像分辨率為2560×1024,其中6幅為源立體圖像,對源圖像經(jīng)過不同程度高斯加噪、壓縮、模糊失真及疊加失真處理得到覆蓋五個質(zhì)量等級的降質(zhì)圖像共380幅。380幅立體圖像樣本中選取154幅圖像作為訓(xùn)練樣本,226幅圖像作為測試樣本。步驟二、利用olpp算法對于訓(xùn)練樣本和測試樣本進行特征提取和降維在olpp算法中,給定高維特征空間中的樣本集x=[x1,x2,…,xn],xn代表樣本集中的各立體圖像,n代表高維訓(xùn)練樣本個數(shù);通過構(gòu)造拉普拉斯特征映射的線性近似,找到將樣本空間投影到一個低維特征空間y=[y1,y2,…,yn]的投影矩陣。olpp算法的步驟如下:olpp算法的步驟如下:1)pca投影。為解決可能出現(xiàn)的小樣本問題,通常先對原始圖像數(shù)據(jù)采用pca降維,通過去除與零特征值對應(yīng)的成分,將圖像投影到pca子空間中。wpca表示pca的變換矩陣。2)構(gòu)建鄰接圖g。計算樣本xi和xj之間的歐氏距離,i,j表示為1~n訓(xùn)練樣本個數(shù)中的任意兩個樣本編號,若xi是xj的p個最近鄰之一,則鄰接圖g有邊xixj。對于每一個樣本xi,有p條邊。3)對鄰接圖g的邊xixj選擇權(quán)重。若鄰接圖g有邊xixj,則邊xixj的權(quán)重sij為exp(-||xi-xj||2/t),否則,sij為0,如式(1)所示。exp(-||xi-xj||2/t)構(gòu)成權(quán)重矩陣s。其中,xj是xi的k近鄰點,ε定義了一個鄰域半徑,它是一個大于0,足夠小的常量,從而保證xj距離xi足夠?。籺為事先給定的控制參數(shù),是一個大于0的常量。4)計算正交基函數(shù)。定義對角矩陣d,其對角元素并定義拉普拉斯矩陣l=d-s。令{a1,a2,…,ak}表示正交基向量,且定義中間變量a(k-1),b(k-1)如式(2)、(3):a(k-1)=[a1,a2,…,ak-1](2)b(k-1)=[a(k-1)]t(xdxt)-1a(k-1)(3)將式(2)、(3)代入如下迭代過程,可計算求得正交基向量{a1,a2,…,ak}:①計算a1,a1是與(xdxt)-1xlxt的最小特征值相關(guān)聯(lián)的特征向量。②計算ak,ak是與p(k)={i-(xdxt)-1a(k-1)[b(k-1)]-1[a(k-1)]t}(xdxt)-1xlxt的最小特征值相關(guān)聯(lián)的特征向量。5)計算投影矩陣。假設(shè)wolpp=[w1,w2,…,wd],則投影矩陣w=wpcawolpp,投影過程表示如式(4)所示:x→y=wtx(4)其中,y是立體圖像x經(jīng)過olpp降維處理后的信息。得到投影矩陣后,將訓(xùn)練樣本和測試樣本投影到olpp子空間中。步驟三、采用遺傳算法對極端學(xué)習(xí)機進行優(yōu)化,并比較不同算法在立體圖像客觀評價中的性能。elm算法具體包括以下步驟:對于n個任意的不同樣本(xi,ti),其中xi=[xi1,xi2,…,xin]t為輸入樣本,ti=[ti1,ti2,…,tim]t為期望輸出值,可將含有l(wèi)個隱藏層節(jié)點和激勵函數(shù)為g(x)的單隱層前饋神經(jīng)網(wǎng)絡(luò)的輸出表示為:其中ai=[ai1,ai2,…,ain]t為第i個隱藏層神經(jīng)元和輸入神經(jīng)元之間的權(quán)值向量,βi=[βi1,βi2,…,βim]t為第i個隱藏層神經(jīng)元和輸出神經(jīng)元之間的權(quán)值向量,bi是第i個隱藏層神經(jīng)元的閾值,ai·xj表示ai和xj的內(nèi)積。式(5)表示成矩陣形式為:hβ=t(6)其中elm的步驟如下:讀入訓(xùn)練樣本,并將樣本隨機分成訓(xùn)練集和測試集兩部分。種群初始化。種群個體數(shù)n,一般設(shè)置為30~50個,種群中的個體包含了elm網(wǎng)絡(luò)結(jié)構(gòu)的所有權(quán)重與閾值。其編碼方法主要有二進制法、實數(shù)法等,本文采用實數(shù)編碼,將一個實數(shù)序列作為每個個體的取值。隨機設(shè)置輸入隱藏層權(quán)值αi以及閾值bi,i=1,…,l;其中,l為隱藏層節(jié)點個數(shù),αi,bi∈[-1,1];選擇一個無限可微的函數(shù)作為隱藏層神經(jīng)元的激活函數(shù),計算隱藏層輸出矩陣h;通過最小二乘法計算輸出層權(quán)值矩陣β,完成模型建立。β=htt(9)其中,t=[t1,t2,…,tn]t。改進的ga-elm算法:鑒于elm網(wǎng)絡(luò)的輸入權(quán)值和隱藏層節(jié)點的偏移量是隨機給定的,對于具有相同隱藏層神經(jīng)元個數(shù)的elm網(wǎng)絡(luò),輸入權(quán)值矩陣和偏移量的取值不同,網(wǎng)絡(luò)的性能有很大差異,也會影響立體圖像質(zhì)量客觀評價的準確性。因此,可通過優(yōu)化權(quán)值與偏移量的取值,來提高elm網(wǎng)絡(luò)的識別能力。本文使用遺傳算法優(yōu)化elm網(wǎng)絡(luò)的初始權(quán)值和閾值,使優(yōu)化后的極端學(xué)習(xí)機網(wǎng)絡(luò)能夠具有更好的分類識別效果。ga-elm的訓(xùn)練步驟如下:讀入訓(xùn)練樣本,并將樣本隨機分成訓(xùn)練集和測試集兩部分。種群初始化。種群個體數(shù)n,一般設(shè)置為30~50個,種群中的個體包含了elm網(wǎng)絡(luò)結(jié)構(gòu)的所有權(quán)重與閾值。其編碼方法主要有二進制法、實數(shù)法等,本文采用實數(shù)編碼,將一個實數(shù)序列作為每個個體的取值。優(yōu)化產(chǎn)生αi和bi的取值。對種群中的每個個體,利用elm算法,結(jié)合不同隱藏層激活函數(shù),計算出輸出權(quán)值矩陣。本文選擇訓(xùn)練集的數(shù)據(jù)誤差絕對值之和作為個體適應(yīng)度函數(shù),如式(10)所示。其中m代表神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點數(shù),代表訓(xùn)練集的預(yù)測結(jié)果,t={t1,t2,…,tm}是訓(xùn)練集的真實值,abs表示求加權(quán),k為加權(quán)系數(shù)。將遺傳算法的優(yōu)化結(jié)果返回elm網(wǎng)絡(luò),用優(yōu)化后的αi和bi計算產(chǎn)生輸出層權(quán)值矩陣β,完成模型建立。表1、ga-elm和elm在不同激勵函數(shù)下的最優(yōu)情況表2、不同評價算法的性能指標不同識別方法olpp-ga-elmolpp-elmpca-elmolpp-svm識別率(%)96.0992.5592.2791.80特征維數(shù)18181618最佳實施方式舉例說明如下:本設(shè)計所用立體圖像取自天津大學(xué)寬帶無線通信與立體成像研究所立體圖像數(shù)據(jù)庫。本數(shù)據(jù)庫里的立體圖像均按照國際電信聯(lián)盟(itu)對立體圖像質(zhì)量的主觀評價建議的兩個標準:bt-500和bt.1438-2000,將所有的立體圖像質(zhì)量分為5個等級:極好、好、一般、差、非常差。本設(shè)計共選取380幅立體圖像樣本,每一樣本圖像分辨率為2560×1024。中未壓縮、未加噪的原始圖像共6幅,分別為標準立體素材“boy”、“tree”、“family”、“flower”、“girl”、“river”,如圖1所示。其余為覆蓋5個質(zhì)量評價等級的降質(zhì)圖像,通過對6幅原始圖像做不同程度的壓縮或加噪處理產(chǎn)生。對所有失真圖像做主觀評價,記錄平均意見值(meanopinionscore,mos)。在406幅立體圖像樣本中,我們選取154幅圖像作為訓(xùn)練樣本,226幅圖像作為測試樣本。下面結(jié)合技術(shù)方案詳細說明本方法:一、通過主觀測試獲取評價數(shù)據(jù)樣本,選取訓(xùn)練樣本和測試樣本。被試包括專業(yè)被試與非專業(yè)被試,均具有正常的視差立體感,共20名被試,分別為在校研究生與本科生,男性11名,女性9名,從事立體信息處理研究的被試共16人,從事其他方向研究的被試共4人。為了便于直觀理解本設(shè)計,提供了立體圖像質(zhì)量客觀評價框圖,如圖1所示。二、對于選取好的訓(xùn)練樣本和測試樣本進行特征提取和降維。在訓(xùn)練樣本中選取50幅具有代表性的圖像作為訓(xùn)練子集,對訓(xùn)練集圖像數(shù)據(jù)采用pca算法降維后,利用olpp算法對其進行降維,得到投影矩陣。將訓(xùn)練樣本和測試樣本通過投影矩陣投影到olpp子空間中,提取立體圖像的有效信息,減少計算量對實驗的影響。三、確定網(wǎng)絡(luò)參數(shù),對測試樣本進行質(zhì)量評價,并比較不同算法在立體圖像客觀評價中的性能。將訓(xùn)練樣本的投影系數(shù)及標簽輸入到elm、svm網(wǎng)絡(luò)中,確定網(wǎng)絡(luò)參數(shù),ga-elm算法采用遺傳算法對elm網(wǎng)絡(luò)的輸入權(quán)值和隱藏層節(jié)點的偏移量進行優(yōu)化,使優(yōu)化后的elm網(wǎng)絡(luò)有更好的識別效果。elm網(wǎng)絡(luò)的參數(shù)確定過程比較簡單,只需確定激勵函數(shù)與隱藏層節(jié)點個數(shù)。本方法選取不同的激勵函數(shù),包括sigmoid函數(shù)、sine函數(shù)、hardlim函數(shù)、三角基(tribas)函數(shù)與徑向基(radbas)函數(shù)。同時,將每個激勵函數(shù)的隱藏層節(jié)點數(shù)初始化為10,并以10為周期增加隱層節(jié)點數(shù),每種組合進行50次隨機試驗,統(tǒng)計所獲得的平均識別率,分析在不同激勵函數(shù)和隱層節(jié)點個數(shù)組合下,elm對立體圖像質(zhì)量客觀評價精度的影響。采用ga優(yōu)化elm算法流程如圖2所示。極端學(xué)習(xí)機是在單隱層神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展而來的,鑒于elm網(wǎng)絡(luò)的輸入權(quán)值和隱藏層節(jié)點的偏移量是隨機給定的,對于具有相同隱藏層神經(jīng)元個數(shù)的elm網(wǎng)絡(luò),輸入權(quán)值矩陣和偏移量的取值不同,網(wǎng)絡(luò)的性能有很大差異,也會影響立體圖像質(zhì)量客觀評價的準確性。因此,可通過優(yōu)化權(quán)值與偏移量的取值,來提高elm網(wǎng)絡(luò)的識別能力。采用遺傳算法來優(yōu)化極端學(xué)習(xí)機網(wǎng)絡(luò)主要分為:極端學(xué)習(xí)機網(wǎng)絡(luò)的確定、遺傳算法優(yōu)化和極端學(xué)習(xí)機預(yù)測輸出結(jié)果3個部分。其中,根據(jù)極端學(xué)習(xí)機網(wǎng)絡(luò)的結(jié)構(gòu)可以確定ga種群個體的初始數(shù)量,種群中的各個個體均包括其權(quán)重和閾值,依據(jù)適應(yīng)度函數(shù)計算每個個體的適應(yīng)度值,進而進行選擇、交叉和變異操作尋找出最優(yōu)個體。本方法中遺傳算法的迭代次數(shù)為100,種群規(guī)模為30,交叉概率為0.3,變異概率為0.1。對于svm,核函數(shù)選擇徑向基(radbas)函數(shù),其中懲罰參數(shù)c和核參數(shù)γ通過5-折交叉驗證的方法選取最優(yōu)的訓(xùn)練參數(shù),本文選取c=120,γ=0.20。ga-elm、elm和svm作為系統(tǒng)的分類器,其分類能力將直接影響系統(tǒng)的性能,因此對ga-elm、elm和svm網(wǎng)絡(luò)的訓(xùn)練是實驗中的關(guān)鍵步驟。在實驗過程中,所有實驗數(shù)據(jù)的輸入均歸一化到[-1,1]范圍內(nèi)。表1給出了不同激活函數(shù)下elm和ga-elm對所有測試樣本的識別率。由表1可知,激勵函數(shù)方面,除hardlim激勵函數(shù)外,其他四種激勵函數(shù)的算法識別率相近。其中,使用sigmoid函數(shù)作為激活函數(shù)時,elm與ga-elm的算法識別率最高。神經(jīng)網(wǎng)絡(luò)方面,ga-elm的算法識別率達到95.85%,明顯優(yōu)于elm的算法識別率。同時,ga-elm所需的隱藏層節(jié)點個數(shù)少于elm所需的隱藏層節(jié)點個數(shù)。表2列出了基于olpp的ga-elm(sigmoid)、elm(sigmoid)和svm分類識別系統(tǒng)(簡稱為olpp-ga-elm、olpp-elm和olpp-svm)與文獻[13]提出的分類識別系統(tǒng)(簡稱為pca-elm)在所有測試樣本上的識別率。從表2中可以看出,使用olpp-ga-elm對立體圖像質(zhì)量進行客觀評價的結(jié)果,與立體圖像實際主觀評價分數(shù)基本相符。olpp-ga-elm方法的測試樣本正確分類識別率達到96.09%,而olpp-elm算法由于初始權(quán)值和隱藏層節(jié)點偏移量的隨機性,使評價準確率受到影響,測試樣本正確分類識別率僅為92.55%。因此,olpp-ga-elm在立體圖像質(zhì)量客觀評價方面的性能明顯優(yōu)于olpp-elm、olpp-svm和pca-elm。綜上所述,本方法所提出的基于olpp的ga-elm算法模型在立體圖像質(zhì)量評價方面有著很大的實際可行性。實驗結(jié)果表明,使用不同激勵函數(shù)的條件下,ga-elm的圖像質(zhì)量等級正確分類率和所需的隱藏層節(jié)點個數(shù)均優(yōu)于elm。以sigmoid為激勵函數(shù),olpp-ga-elm的正確等級分類率達到96.09%。當前第1頁12