一種用于增強圖像標(biāo)記效果的多尺度級聯(lián)層次模型方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機視覺方法領(lǐng)域,設(shè)及一種用于增強圖像標(biāo)記效果的多尺度級聯(lián) 層次模型方法
【背景技術(shù)】
[0002] 圖像標(biāo)記的任務(wù)是將圖像中每個像素標(biāo)記到它所屬的標(biāo)記類別(1油eling each pixel in an image with its semantic categoiT),它是場景理解的重要步驟和基礎(chǔ),在 計算機視覺領(lǐng)域有著重要的作用。在過去的研究中,很多有效的標(biāo)記方法被提出來,例如模 版匹配、關(guān)聯(lián)法、特征包方法、形狀模型、標(biāo)記遷移方法等。該些方法考慮使用固定尺度的輸 入圖像W及對輸入圖像上固定尺度的對象類別,并且從一些固定尺寸的訓(xùn)練數(shù)據(jù)中為每種 標(biāo)記類別訓(xùn)練出具有識別能力的模型。在解析層次上,該些系統(tǒng)利用像素點、窗口、邊緣或 者其他的圖像表征形成的學(xué)習(xí)或者匹配的模型,為固定尺度的圖像或者對象進行標(biāo)記。
[0003] 一定的尺度可W精確的反映出需要被表示的物體,現(xiàn)實世界中的物體總是通過不 同尺度的觀察而得到不同變化。尺度空間理論屬于計算機視覺中圖像多分辨率分析。從圖 像表現(xiàn)力的角度來說,例如在金字塔尺度模型、高斯尺度模型該些經(jīng)典的尺度模型中,不同 尺度的對象有著不同的表現(xiàn)力,某種尺度下無法發(fā)現(xiàn)的特性在另一種尺度下可能很容易被 發(fā)現(xiàn)。
[0004] 現(xiàn)有技術(shù)中利用固定尺度進行圖像標(biāo)記,得到的標(biāo)記結(jié)果準確率不高。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對現(xiàn)有技術(shù)中對圖像標(biāo)記結(jié)果準確率不高的問題,提出一種用于增強圖 像標(biāo)記效果的多尺度級聯(lián)層次模型方法,利用圖像不同的尺度具有不同的表現(xiàn)力的特性W 及模型運行的收斂迭代算法來增強單層圖像標(biāo)記效果,計算結(jié)構(gòu)簡單,收斂性較好。
[0006] 一種用于增強圖像標(biāo)記效果的多尺度級聯(lián)層次模型方法,包括W下步驟:
[0007] 步驟1;對待標(biāo)記圖像建立尺度空間乂,并初始化初始尺寸圖像Xi的標(biāo)記質(zhì)量矩 陣ei;
[000引 乂 = 義2,...,義,),公1=0
[0009] 其中,X康示尺度空間中第i層圖像,i G (l,2,...,t),t表示尺度空間中圖像 總層數(shù),/ P為待標(biāo)記圖像的分辨率,C表示圖像標(biāo)記類別的數(shù)目; C
[0010] 步驟2;利用所選的圖像標(biāo)記方法Q狂,L| 0)對尺度空間中第1層圖像進行標(biāo) 記,W得到標(biāo)記質(zhì)量矩陣,更新e1;
[0011] 其中,X表示待標(biāo)記圖像,L表示標(biāo)記類型空間,L= 111, I2,…,1J ; 0表示所選的 圖像標(biāo)記方法的標(biāo)記參數(shù);
[0012] 步驟3;使用圖像標(biāo)記方法Q狂,L| 0)依次對尺度空間中其余層圖像進行標(biāo) 記,得到尺度空間中每層圖像的標(biāo)記結(jié)果Y,Y=巧,K^,...,K)和標(biāo)記質(zhì)量矩陣空間f, £=(公I,公:,.…6',);
[0013] 其中,Yi和e i分別表示尺度空間中第i層圖像的標(biāo)記結(jié)果矩陣和標(biāo)記質(zhì)量矩陣, iG(1,2,. . .,t);
[0014] 每層圖像所使用的標(biāo)記參數(shù)0i受第1層圖像的標(biāo)記質(zhì)量矩陣e1影響,按W下公 式確定:
[00巧]日J= W(e1,j),j G (2,3,...,t)
[0016] 其中,W(?,j)依據(jù)所選圖像標(biāo)記方法確定;
[0017]其他層的標(biāo)記方法使用的標(biāo)記分類闊值TW原圖像的標(biāo)記質(zhì)量矩陣e1做參考, 參考形式為T= At。,其中t。為初始闊值,A為緊縮參數(shù),并且A OC e1;
[0018] 步驟4;將第2層圖像到第t層圖像的標(biāo)記結(jié)果矩陣放大到初始尺寸圖像大小,得 到還原標(biāo)記結(jié)果矩陣Y/和還原標(biāo)記質(zhì)量矩陣e/,jG(2, 3,. . .,t);
[0019] 步驟5 ;將第1層圖像中每個像素點的標(biāo)記質(zhì)量跟其他層的還原標(biāo)記質(zhì)量進行比 較,選出最優(yōu)的標(biāo)記結(jié)果更新到初始尺寸圖像的標(biāo)記結(jié)果矩陣中,得到新的第1層圖像的 標(biāo)記質(zhì)量矩陣e/,并將e/賦值給El;
[0020]步驟6;判斷第1層圖像的標(biāo)記質(zhì)量矩陣e1是否發(fā)生變化,若發(fā)生變化,則返回步 驟3We1修改每層的標(biāo)記參數(shù),繼續(xù)對圖像進行標(biāo)記,直至第1層圖像的標(biāo)記質(zhì)量矩陣不 再發(fā)生變化時,輸出標(biāo)記結(jié)果,完成對圖像的標(biāo)記。
[0021] 所述圖像建立尺度空間的方法包括高斯金字塔、拉普拉斯金字塔或簡單抽樣。
[0022] 所述步驟4中還原標(biāo)記結(jié)果矩陣Y/和還原標(biāo)記質(zhì)量矩陣£/采用上采樣方法 獲得:
[0023] 標(biāo)記結(jié)果矩陣上采樣過程為:
[0024] Y/ = r (Yj,j-1),j G (2, 3, . . .,t)
[0025] 標(biāo)記質(zhì)量矩陣上采樣過程為:
[0026] e/ = H(£j',j-1),j G (2,3,...,t)
[0027] 其中,r (Yj.,j-1)將標(biāo)記結(jié)果矩陣進行j-1次上采樣得到和初始尺寸圖像相同尺 寸的標(biāo)記結(jié)果矩陣;
[002引 H(eJ,j-1)將標(biāo)記質(zhì)量矩陣進行j-1次上采樣得到和初始尺寸圖像相同尺寸的 標(biāo)記質(zhì)量矩陣。
[0029] 所述步驟5中將其它層中最優(yōu)的標(biāo)記結(jié)果更新到初始尺寸圖像的標(biāo)記結(jié)果時,首 先對標(biāo)記質(zhì)量矩陣進行歸一化處理,然后從歸一化處理后的所有標(biāo)記質(zhì)量矩陣RE中選取 每個像素點最優(yōu)的標(biāo)記結(jié)果;
[0030] 歸一化處理公式如下:
[0031]RE=巧-min巧))/(max巧)-min巧))
[003引其中,E= (e。£2',...,e/ )。
[0033] 所述圖像標(biāo)記方法包括K順標(biāo)記算法或SVM分類算法;
[0034] 所述圖像標(biāo)記方法中的標(biāo)記參數(shù)指K順標(biāo)記算法中的聚類闊值或SVM分類算法中 的分類距離。
[00對有益效果
[0036] 本發(fā)明提供了一種用于增強圖像標(biāo)記效果的多尺度級聯(lián)層次模型方法,該模型的 自下而上是一種標(biāo)記調(diào)解過程,從上至下是一種標(biāo)記結(jié)果反饋過程。在對第一層圖像進行 標(biāo)記之后,得到的能量矩陣e1和其他層所在的層次影響該層標(biāo)記過程中所需要用到的參 數(shù),進而得到除第一層外的其他層的標(biāo)記Y和能量矩陣寺。在反饋過程中,第一層圖像中每 個像素點的能量值會跟其他層對應(yīng)點的能量進行比較,取由較小能量值表征的標(biāo)記作為像 素的標(biāo)記類別,進而優(yōu)化第一層的標(biāo)記結(jié)果。如果只進行一次影響一反饋過程,在通常情況 下還不能達到尺度空間條件下標(biāo)記的最優(yōu)解,因此,本發(fā)明利用迭代的過程達到或者接近 尺度空間條件下標(biāo)記的最優(yōu)解。
[0037] 該方法利用了不同語義范疇的事物在同一張圖片中不同尺度的表現(xiàn)力不同,去增 強現(xiàn)有的標(biāo)記算法,有良好的收斂性,具有一定的普適性,能有效地提高標(biāo)記準確率。
【附圖說明】
[003引圖1為本發(fā)明所述的用于增強圖像標(biāo)記效果的多尺度級聯(lián)層次模型方法的流程 圖;
[0039]圖2為多尺度級聯(lián)層次模型示意圖;
[0040] 圖3為金字塔方法構(gòu)建的圖像尺度空間示意圖,其中,(a)為原圖,化)為第2層, (C)為第3層,(d)為第4層,(e)第5層;
[004U圖4為尺度空間各層的標(biāo)記結(jié)果類別示意圖,其中,(a)為第1層,(b)為第2層, (C)為第3層,(d)為第4層,(e)第5層;
[0042] 圖5為標(biāo)記結(jié)果的矩陣質(zhì)量可視化示意圖,其中,(a)為第1層,化)為第2層,(C) 為第3層,(d)為第4層,(e)第5層;
[0043] 圖6為多尺度模型下腳W方法進行標(biāo)記的最終結(jié)果,其中,(a)為標(biāo)記結(jié)果類別示 意圖,化)為標(biāo)記結(jié)果的質(zhì)量矩陣可視化示意圖。
【具體實施方式】
[0044] 下面將結(jié)合附圖和實施例對本發(fā)明作進一步的說明。
[0045] 一種用于增強圖像標(biāo)記效果的多尺度級聯(lián)層次模型方法,包括W下步驟:
[0046] 步驟1 ;對待標(biāo)記圖像建立尺度空間X,并初始化初始尺寸圖像Xi的標(biāo)記質(zhì)量矩 陣e1;
[0047] X = (Xi,X2,...,jg,及1=0
[0048] 其中,Xi表示尺度空間中第i層圖像,iG(l,2,...,t),t表示尺度空間中圖像 總層數(shù),P為待標(biāo)記圖像的分辨率,C表示圖像標(biāo)記類別的數(shù)目; C
[0049] 所述圖像建立尺度空間的方法包括高斯金字塔、拉普拉斯金字塔或簡單抽樣;
[0050] 如圖3中(a)所示的分辨率為1280*960的圖像,它的標(biāo)記空間大小為7,即7個類 別的標(biāo)記,根據(jù)上述兩個數(shù)據(jù)設(shè)置t= 5,即5層的尺度空間,利用圖像金字塔方法建立尺度 空間:
[005U 義=(義1,義 2,...,義,1 打),
[0化2] 0為縮放過程中采用的高斯卷積核,將原始尺寸圖像的標(biāo)記質(zhì)量矩陣設(shè)定為 最差情況,即e1= 0,此時每個點的標(biāo)記質(zhì)量都為0,既最小的極限值。
[0化3] 從第一層到第五層,依次如圖3中的(a)-(e)所示,其中,為了方便觀察,(b)-(e) 均還原到了原圖的尺寸;
[0化4] 步驟2;利用所選的圖像標(biāo)記方法Q狂,L| 0)對尺度空間中第1層圖像進行標(biāo) 記,W得到標(biāo)記質(zhì)量矩陣,更新e1;
[0055] 其中,X表示待標(biāo)記圖像,L表示標(biāo)記類型空間,L= 111,I