基于區(qū)間Type-2模糊支持向量機(jī)的場景圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一般的圖像數(shù)據(jù)處理或產(chǎn)生方法技術(shù)領(lǐng)域,尤其涉及一種基于區(qū)間 Type-2模糊支持向量機(jī)的場景圖像分類方法。
【背景技術(shù)】
[0002] 隨著數(shù)字技術(shù)的發(fā)展和數(shù)字設(shè)備的應(yīng)用,各種圖像數(shù)據(jù)庫中的圖像數(shù)量呈現(xiàn)爆炸 式增長,迫切需要通過計(jì)算機(jī)提取人們能夠理解的圖像語義信息,從而方便用戶對各種數(shù) 字圖像進(jìn)行自動的管理、組織和分析。如何對這些圖像進(jìn)行有效的管理與快速的檢索是一 個巨大的挑戰(zhàn)。場景圖像的分類正是解決這個問題的關(guān)鍵技術(shù)。場景圖像分類,即依據(jù)場 景圖像中所包含的特征來完成對圖像場景類別(如辦公室,走廊,街道,城市,高層建筑等) 的自動識別,是圖像理解領(lǐng)域的一個重要分支,已成為多媒體信息管理、計(jì)算機(jī)視覺等領(lǐng)域 的熱點(diǎn)問題,受到研究者的廣泛關(guān)注。
[0003] 眾所周知,場景圖像分類已成為計(jì)算機(jī)視覺領(lǐng)域的一個重要研究課題,它是圖像 處理、計(jì)算機(jī)視覺、模式識別和機(jī)器學(xué)習(xí)等多個研究領(lǐng)域的一個交匯點(diǎn),具有廣闊的應(yīng)用空 間。例如:機(jī)器視覺任務(wù),網(wǎng)絡(luò)圖像檢索,視頻分祈與檢索,遙感圖像分類,醫(yī)學(xué)圖像數(shù)據(jù)挖 掘,圖像編輯,圖像檢測,網(wǎng)絡(luò)圖像過濾等。迄今為止,研究者已提出了許多場景圖像分類方 法,這些方法大多數(shù)把圖像分類理解成模式識別過程,包括訓(xùn)練和測試兩部分。訓(xùn)練部分提 取圖像特征并訓(xùn)練分類器或分類模型,測試部分用訓(xùn)練好的分類器或分類模型對未知類別 圖像進(jìn)行分類。本發(fā)明的側(cè)重點(diǎn)在于設(shè)計(jì)有效的分類器。
[0004] 支持向量機(jī)(SupportVectorMachine,SVM)是由Vapnik等人根據(jù)小樣本情況下 的統(tǒng)計(jì)規(guī)律及學(xué)習(xí)方法提出的一種機(jī)器學(xué)習(xí)算法,有著完備的理論框架基礎(chǔ)。SVM求解的是 凸二次規(guī)劃問題,它根據(jù)最小化經(jīng)驗(yàn)風(fēng)險泛函標(biāo)準(zhǔn)選擇支持向量子集,同時考慮給定樣本 的逼近精度和逼近函數(shù)的復(fù)雜性,從而實(shí)現(xiàn)模型的結(jié)構(gòu)風(fēng)險優(yōu)化控制目標(biāo)。SVM很好地解決 了小樣本、非線性、高維數(shù)等問題,較傳統(tǒng)機(jī)器學(xué)習(xí)算法具有更好的泛化推廣能力和學(xué)習(xí)性 能,已經(jīng)廣泛應(yīng)用于模式識別、圖像處理、場景圖像分類等領(lǐng)域。
[0005] 然而,場景圖像中普遍存在的不確定信息(如噪聲變化、拍攝角度變化、光照條件 變化等),標(biāo)準(zhǔn)支持向量機(jī)模型無法對其進(jìn)行有效表示和處理,因而難以獲取精準(zhǔn)的分類結(jié) 果??紤]系統(tǒng)不確定因素,如何根據(jù)模糊理論,引入專家經(jīng)驗(yàn)知識,如何構(gòu)造應(yīng)用靈活的模 糊核函數(shù),如何設(shè)計(jì)系統(tǒng)化的模糊支持向量機(jī)(FuzzySupportVectorMachine,F(xiàn)SVM)模 型等問題,現(xiàn)有的模糊支持向量機(jī)方法在這方面的討論仍較少。通過設(shè)計(jì)合適的FSVM模 型,進(jìn)一步將專家經(jīng)驗(yàn)邏輯與支持向量方法有機(jī)融合起來,有效處理系統(tǒng)的不確定信息,提 高支持向量機(jī)算法對實(shí)際問題的適用性,這是支持向量機(jī)面向工程技術(shù)領(lǐng)域亟待解決的重 要問題。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的技術(shù)問題是提供一種基于區(qū)間Type-2模糊支持向量機(jī)的場景 圖像分類方法,所述分類方法能有效提高支持向量機(jī)模型的分類精度,場景圖像分類效果 好。
[0007] 為解決上述技術(shù)問題,本發(fā)明所采取的技術(shù)方案是:一種基于區(qū)間Type-2模糊支 持向量機(jī)的場景圖像分類方法,其特征在于所述方法包括如下步驟:
[0008] 1)采集場景圖像并進(jìn)行預(yù)處理;
[0009] 2)對預(yù)處理后的圖像進(jìn)行圖像劃分,形成多個子圖;
[0010] 3)在每個子圖中分別提取圖像分類特征;
[0011] 4)計(jì)算每個特征子圖的均值和方差,構(gòu)建場景圖像分類特征向量Xrap;
[0012] 5)設(shè)計(jì)基于模糊核的主成分分析方法FuzzyPrincipalComponentsAnalysis, 簡稱FPCA,用于場景圖像分類特征向量的降維,得到其主成分特征向量Xradu。;
[0013] 6)設(shè)計(jì)全新的區(qū)間Type-2模糊支持向量機(jī)模型,即IntervalType_2Fuzzy SupportVectorMachine模型,簡稱IT2FSVM模型,并對其進(jìn)行優(yōu)化,得到訓(xùn)練好的 IT2FSVM分類模型并應(yīng)用于場景圖像分類。
[0014] 進(jìn)一步的技術(shù)方案在于:步驟2)中將圖像劃分為4X4個子圖。
[0015] 進(jìn)一步的技術(shù)方案在于:步驟3)中提取場景圖像分類特征包括灰度特征、邊緣特 征和方向特征。
[0016] 進(jìn)一步的技術(shù)方案在于:灰度特征的計(jì)算表達(dá)式為:
[0017]
[0018]其中,#為Center-surround操作,c和s分別為場景圖像濾波輸出的細(xì)尺度和粗 尺度,□ (c)為對應(yīng)尺度為c的圖像灰度特征,這里取c= 2, 3, 4,s=c+3或s=c+4,由 此得到與2-5, 2-6, 3-6, 3-7, 4-7和4-8六個尺度對應(yīng)的六個灰度特征圖。
[0019] 進(jìn)一步的技術(shù)方案在于:邊緣特征先采用Canny算子對場景圖像在不同尺度上進(jìn) 行邊緣特征的提取操作,再利用灰度特征的方法得到場景圖像的邊緣特征,其計(jì)算表達(dá)式 如下:
[0020]
[0021] 其中,為Center-surround操作,c和s分別為場景圖像濾波輸出的細(xì)尺度和粗 尺度,Ejc)為對應(yīng)尺度為c的圖像邊緣特征,這里取c= 2, 3, 4,s=c+3或s=c+4,由此 得到與2-5, 2-6, 3-6, 3-7, 4-7和4-8六個尺度對應(yīng)的六個灰度特征圖。
[0022] 進(jìn)一步的技術(shù)方案在于:方向特征圖通過圖像與Gabor濾波器的卷積運(yùn)算得到, 其計(jì)算表達(dá)式如下:
[0023]
[0024] 其中,Gv0 (X,z)為Gabor濾波器,為場景圖像在位置(X,z)處的灰度特征, v和θ={0°,45°,90°,135° }則分別表示濾波算子的尺度和方向,這里可取兩組不 同的算子,在濾波器四個不同方向上就可得到八個方向特征圖。
[0025] 進(jìn)一步的技術(shù)方案在于:步驟4)計(jì)算每個灰度特征圖的均值和方差,其計(jì)算表達(dá) 式如下:
[0026]
[0027]
[0028] 其中,WH表示場景圖像的尺寸,邊緣特征圖和方向特征圖的計(jì)算方法與灰度特征 圖類似,只需要將相關(guān)函數(shù)更換為邊緣特征和方向特征的表達(dá)式即可,將計(jì)算得到的結(jié)果 按順序排列成高維的特征向量,構(gòu)建場景圖像分類特征向量Xrap。
[0029] 進(jìn)一步的技術(shù)方案在于:步驟5)中特征降維包括模糊核函數(shù)的設(shè)計(jì)、特征統(tǒng)計(jì)優(yōu) 化和主成分特征選擇;假定樣本訓(xùn)練集為,其中N為場景樣本圖像的數(shù)目,用于PCA 特征降維的模糊核函數(shù),其表達(dá)式如下:
[0030]
[0031]其中,K(k)為模糊核1的第k個元素,Κ隸屬于傳統(tǒng)核函數(shù)集K(k),ΚΝ為核函數(shù)集的 數(shù)目,//(夂(0?))為對應(yīng)于核函數(shù)κ的模糊隸屬度,且有0ΙΜΙΚΧ;1))<1,通過 標(biāo)準(zhǔn)核PCA方法的特征統(tǒng)計(jì)優(yōu)化和主成分特征選擇環(huán)節(jié),可得到場景圖像降維后的特征向 mx!VjUc= (χ<Λ]1.···.^?,\<n<d〇
[0032] 進(jìn)一步的技術(shù)方案在于:步驟6)采用Type-2模糊集來描述支持向量機(jī)模型的不 確定性,其表達(dá)式如下:
[0033]
[0034] 其中,每個支持向量機(jī)模型具有一個主級模糊隸屬度區(qū)間匕.,考 慮支持向量機(jī)模型的不確定性,并降低其計(jì)算復(fù)雜度,這里采用區(qū)間Type-2模糊集來描述 支持向量機(jī)模型的模糊隸屬度,將標(biāo)準(zhǔn)支持向量機(jī)擴(kuò)展為區(qū)間Type-2模糊支持向量機(jī),其 定義如下:
[0035]
[0036] 其中,支持向量機(jī)模型的主級模糊隸屬度區(qū)間同樣取決于模糊隸屬度上界和下 界,次級模糊隸屬度則取值為1,對于上述Type-2模糊支持向量機(jī)難以直接求解,因此,對 其進(jìn)行降維,將問題轉(zhuǎn)化為對Type-2模糊支持向量機(jī)模型上界和下界優(yōu)化的目標(biāo)函數(shù)進(jìn) 行求解:
[0037]
[00381
[0039
[004C
[0041
[0042] 其中6、義f、丄,馬、色,分別為模型上界和下界對應(yīng)的權(quán)向量,正則化參 數(shù),允許誤差,和模型常量,為求解目標(biāo)函數(shù),定義其對偶形式如下:
[0043]
[0044]
[0045]
[0046]
[0047] Γ=1
[0048] 其中巧,模型上