本發(fā)明涉及數(shù)字圖像處理領(lǐng)域,更具體地,涉及一種基于偏微分方程學(xué)習(xí)的本征圖像分解方法。
背景技術(shù):
現(xiàn)實(shí)世界中的物體在人眼中所呈現(xiàn)的圖像依賴于場景的本征屬性,如場景的光照、物體表面的形狀、物體表面的材質(zhì)等。本征圖像分解是計(jì)算機(jī)視覺中的一個(gè)基礎(chǔ)問題,給定一幅輸入圖像,需要分解出對(duì)應(yīng)的反射成分和陰影成分。隨著數(shù)字圖像處理技術(shù)的發(fā)展,對(duì)圖像進(jìn)行分解得到其本征成分,在計(jì)算機(jī)視覺和圖像處理領(lǐng)域中起著越來越重要的作用。對(duì)同一場景下具有不同光照條件的圖像進(jìn)行本征分解得到該圖像的反射成分和陰影成分是比較困難的。
目前,在本征圖像分解任務(wù)上,傳統(tǒng)的方法一般是根據(jù)各種先驗(yàn)知識(shí)設(shè)計(jì)相應(yīng)的約束優(yōu)化方程,通過對(duì)目標(biāo)方程的優(yōu)化來求解獲取反射成分與陰影成分。常用的先驗(yàn)假設(shè)有同一場景下具有不同光照的圖像、輸入圖像的表面平滑、圖像表面顏色均衡、圖像的光照比較自然等。除此之外,目前的一些研究算法依賴于多個(gè)輸入圖像、用戶輸入或者深度線索的額外信息。主要針對(duì)同一場景下的不同光照條件的輸入圖像,以此來恢復(fù)輸入圖像的反射成分和陰影成分。以上方法存在一些不足之處,現(xiàn)有的方法一般都基于先驗(yàn)假設(shè),通常不具備普遍性。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種基于偏微分方程學(xué)習(xí)的本征圖像分解方法,該方法可實(shí)現(xiàn)不同光照條件的圖像進(jìn)行本征分解得到該圖像的反射成分和陰影成分。
為了達(dá)到上述技術(shù)效果,本發(fā)明的技術(shù)方案如下:
一種基于偏微分方程學(xué)習(xí)的本征圖像分解方法,包括以下步驟:
s1:輸入訓(xùn)練數(shù)據(jù)對(duì);
s2:初始化控制函數(shù),由于目標(biāo)函數(shù)是非凸的,最小化過程的收斂朝向取決于初始化的局部最小值,當(dāng)初始化過程不收斂的時(shí)候轉(zhuǎn)向步驟s3,執(zhí)行循環(huán);否則轉(zhuǎn)向步驟s8;
s3:求解具有pde約束的最優(yōu)控制方程;
s4:求解伴隨函數(shù)取特定值時(shí)的伴隨方程;
s5:利用下式計(jì)算j=0,1,...,16時(shí)的平移旋轉(zhuǎn)不變量的導(dǎo)數(shù):
其中,j是平移旋轉(zhuǎn)不變量,j是平移旋轉(zhuǎn)不變量的個(gè)數(shù),aj,bj是控制函數(shù),λj和uj是正的加權(quán)參數(shù),
s6:使用共軛梯度法來決定搜索方向;
s7:沿著搜索方向執(zhí)行黃金分割搜索,并不斷更新系統(tǒng)函數(shù),進(jìn)行下一個(gè)循環(huán),直到j(luò)=16,進(jìn)行訓(xùn)練;
s8:終止循環(huán),輸出系統(tǒng)函數(shù);
s9:準(zhǔn)備應(yīng)用數(shù)據(jù),數(shù)據(jù)圖片特點(diǎn)是背景黑色,目標(biāo)物單一且突出;
s10:利用得到的系統(tǒng)函數(shù),對(duì)所給數(shù)據(jù)進(jìn)行本征分解應(yīng)用,得到圖像的反射成分和陰影成分。
進(jìn)一步地,所述步驟s2中通過求解(1)式對(duì)控制函數(shù)aj(t),t=0,δt,···,1-δt進(jìn)行初始化,此時(shí)固定bj(t),j=0,1,···,16,
f·a(t)=d(1)
其中,aj(t)和bj(t)是控制函數(shù),a(t)={aj(t)}和b(t)={bj(t)}是定義在q上的函數(shù)集合,分別用來控制u和v的演變,fu和fv分別是u和v的初始函數(shù)。
進(jìn)一步地,所述步驟s3中通過引入(2)式的伴隨方程,計(jì)算第j個(gè)平移旋轉(zhuǎn)不變量的加托導(dǎo)數(shù),因此局部最優(yōu)值
其中,t是pde系統(tǒng)完成視覺信息處理并輸出結(jié)果的時(shí)間,q為ω×(0,t),γ為
進(jìn)一步地,所述步驟s4中求解伴隨函數(shù)特定值時(shí)的伴隨方程:
對(duì)于
其中,om是期望的輸出圖像,p,q屬于{(0,0),(0,1),(0,2),(1,1),(2,0)}的局部變化的索引集。
進(jìn)一步地,利用公式(4)計(jì)算j=0,1,...,16時(shí)的平移旋轉(zhuǎn)不變量的導(dǎo)數(shù);通過公式(4)來計(jì)算j=0,1,...,16時(shí)控制函數(shù)的平移旋轉(zhuǎn)不變量的導(dǎo)數(shù)
其中,伴隨函數(shù)
進(jìn)一步地,所述步驟s7中沿著搜索方向執(zhí)行黃金分割搜索,并不斷更新系統(tǒng)函數(shù),進(jìn)行下一個(gè)循環(huán);
沿著搜索方向執(zhí)行黃金分割搜索,更新控制函數(shù)aj(t)和bj(t),j=0,1,...,16,繼續(xù)下一個(gè)循環(huán),直到j(luò)=16,進(jìn)行訓(xùn)練。
進(jìn)一步地,所述步驟s8中,終止循環(huán),輸出系統(tǒng)函數(shù)
與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:
本發(fā)明在處理圖像本征成分估計(jì)上不依賴于確定的先驗(yàn)約束,且采用數(shù)據(jù)驅(qū)動(dòng)的方式構(gòu)建偏微分方程;利用共軛梯度法來決定搜索方向,相對(duì)于最速下降法和牛頓法,該方法將共軛性與最速下降法相結(jié)合;利用已知點(diǎn)處的梯度構(gòu)造一組共軛方向,并沿著這組方向進(jìn)行搜索,求出目標(biāo)函數(shù)的極小點(diǎn),來確定最佳的搜索方向;該方法可有效實(shí)現(xiàn)不同光照條件的圖像進(jìn)行本征分解得到該圖像的反射成分和陰影成分。
附圖說明
圖1為本發(fā)明的方法流程圖。
具體實(shí)施方式
附圖僅用于示例性說明,不能理解為對(duì)本專利的限制;
為了更好說明本實(shí)施例,附圖某些部件會(huì)有省略、放大或縮小,并不代表實(shí)際產(chǎn)品的尺寸;
對(duì)于本領(lǐng)域技術(shù)人員來說,附圖中某些公知結(jié)構(gòu)及其說明可能省略是可以理解的。
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的說明。
實(shí)施例1
如圖1所示,一種基于偏微分方程學(xué)習(xí)的本征圖像分解方法,包含以下步驟:
1)、訓(xùn)練階段:
步驟1:輸入訓(xùn)練數(shù)據(jù)對(duì);
輸入的訓(xùn)練數(shù)據(jù)對(duì)是mit-intrinsicimages庫中的圖像,訓(xùn)練輸入數(shù)據(jù)包含20類圖片,每類包含10張同一場景不同光照的圖片,共220張圖片,訓(xùn)練輸出數(shù)據(jù)是對(duì)應(yīng)輸入圖片所采集的陰影成分。
步驟2:初始化控制函數(shù),由于目標(biāo)函數(shù)是非凸的,最小化過程的收斂朝向取決于初始化的局部最小值,當(dāng)初始化過程不收斂的時(shí)候轉(zhuǎn)向步驟3,執(zhí)行循環(huán);否則轉(zhuǎn)向步驟8;
通過求解(1)式對(duì)控制函數(shù)aj(t),t=0,δt,···,1-δt進(jìn)行初始化,此時(shí)固定bj(t),j=0,1,···,16,
f·a(t)=d(1)
其中,u是輸出圖像,v是指示函數(shù),引入指示函數(shù)的目的是搜索圖像中的大規(guī)模信息,以便于正確地指導(dǎo)u的演變。由于目標(biāo)函數(shù)是非凸的,最小化過程的收斂朝向取決于初始化的局部最小值,當(dāng)控制函數(shù)不收斂時(shí),轉(zhuǎn)向步驟3,執(zhí)行循環(huán),否則轉(zhuǎn)向步驟8。
步驟3:求解具有pde約束的最優(yōu)控制方程;
通過引入(2)式的伴隨方程,計(jì)算第j個(gè)平移旋轉(zhuǎn)不變量的加托導(dǎo)數(shù),因此局部最優(yōu)值
其中ω是輸入圖像所占據(jù)的矩形區(qū)域,t是pde系統(tǒng)完成視覺信息處理并輸出結(jié)果的時(shí)間,和分別是u和v的初始函數(shù)。對(duì)于計(jì)算問題和涉及數(shù)學(xué)上的演繹,本發(fā)明將在其周圍填充幾個(gè)像素寬度的零值。由于可以改變時(shí)間單位,把t=1,和固定為定義在q上的一組函數(shù),分別用來控制u和v的演變。
步驟4:求解伴隨函數(shù)取特定值時(shí)的伴隨方程;
對(duì)于
步驟5:利用公式(4)計(jì)算j=0,1,···,16時(shí)的平移旋轉(zhuǎn)不變量的導(dǎo)數(shù);
通過公式(4)來計(jì)算j=0,1,···,16時(shí)控制函數(shù)的平移旋轉(zhuǎn)不變量的導(dǎo)數(shù)
其中,λj和uj是正加權(quán)參數(shù),伴隨函數(shù)
步驟6:使用共軛梯度法來決定搜索方向;
使用共軛梯度法來決定搜索方向,其中共軛梯度法是將共軛性與最速下降法相結(jié)合。利用已知點(diǎn)處的梯度構(gòu)造一組共軛方向,并沿著這組方向進(jìn)行搜索,求出目標(biāo)函數(shù)的極小點(diǎn),來確定最佳的搜索方向。
步驟7:沿著搜索方向執(zhí)行黃金分割搜索,并不斷更新系統(tǒng)函數(shù),進(jìn)行下一個(gè)循環(huán);
沿著搜索方向執(zhí)行黃金分割搜索,更新系統(tǒng)函數(shù)aj(t)和bj(t),j=0,1,...,16,繼續(xù)下一個(gè)循環(huán),直到j(luò)=16,進(jìn)行訓(xùn)練;
步驟8:終止循環(huán),輸出系統(tǒng)函數(shù)。
2)、應(yīng)用階段:
步驟9:準(zhǔn)備應(yīng)用數(shù)據(jù),數(shù)據(jù)圖片特點(diǎn)是背景黑色,目標(biāo)物單一且突出;
步驟10:對(duì)所給數(shù)據(jù)進(jìn)行本征分解應(yīng)用,得到圖像的反射成分和陰影成分。
相同或相似的標(biāo)號(hào)對(duì)應(yīng)相同或相似的部件;
附圖中描述位置關(guān)系的用于僅用于示例性說明,不能理解為對(duì)本專利的限制;
顯然,本發(fā)明的上述實(shí)施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對(duì)本發(fā)明的實(shí)施方式的限定。對(duì)于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動(dòng)。這里無需也無法對(duì)所有的實(shí)施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。