亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種復(fù)雜圖像中顯著輪廓提取方法

文檔序號(hào):6471504閱讀:306來源:國(guó)知局
專利名稱:一種復(fù)雜圖像中顯著輪廓提取方法
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,具體涉及一種復(fù)雜圖像中顯著輪廓提取方法。
背景技術(shù)
圖像中顯著輪廓的提取是計(jì)算機(jī)視覺中一個(gè)基礎(chǔ)性的核心問題。對(duì)于一幅圖像,顯
著輪廓通常為圖像中物體的幾何形狀,或用于區(qū)分物體之間的邊界,例如,圖l(c)是對(duì) 圖l (a)中顯著輪廓進(jìn)行人工標(biāo)注的結(jié)果。人們往往通過對(duì)這些顯著輪廓的感知就可以識(shí) 別出圖像中有那些物體,而不需要太多關(guān)于物體顏色和紋理的信息。顯著輪廓除了可以 用于感知和識(shí)別,在計(jì)算機(jī)視覺中,還可以用于圖像的壓縮、匹配、目標(biāo)跟蹤等。
通常,顯著輪廓提取的過程由兩個(gè)步驟組成第一步是輪廓組成單元的定義與檢測(cè)
方法,常用的算法是把單個(gè)像素看成輪廓的組成單元,檢測(cè)的方法,就是通過對(duì)單個(gè)像
素局部鄰域內(nèi)的像素值進(jìn)行濾波,而得到該像素屬于輪廓的程度,如,梯度計(jì)算,Gabor 濾波等方法。近幾年來,隨著機(jī)器學(xué)習(xí)理論在計(jì)算機(jī)視覺中的廣泛應(yīng)用,基于有監(jiān)督的 機(jī)器學(xué)習(xí)方法被用在了輪廓檢測(cè)上,例如,David R. Martin采用了基于邏輯回歸的機(jī) 器學(xué)習(xí)方法,圖卓文采用了基于adaboost的機(jī)器學(xué)習(xí)方法,二者均給出了圖像中每個(gè)像 素屬于輪廓的概率值。以上檢測(cè)方法均為基于像素的輪廓提取方法。第二步是從第一步 輸出的結(jié)果中,提取出具有感知顯著性的輪廓。 一幅圖像中,如果沒有噪聲,目標(biāo)物體 為人造的,且物體表明沒有復(fù)雜的紋理,物體所在的背景也是均勻的,那么,我們根本 不需要第二步的工作,僅用第一步中常用算法的輸出結(jié)果就可以得到感知顯著的輪廓, 例如,使用最為經(jīng)典的Canny邊緣檢測(cè)算法。然而,人們?nèi)粘=佑|的圖像,大部分來自 自然場(chǎng)景下的,存在圖像的噪聲,物體表面的不規(guī)則紋理,復(fù)雜的背景等。目前,計(jì)算 機(jī)視覺中,像上述第一步中基于像素的輪廓檢測(cè)方法均存在兩個(gè)問題,即,對(duì)像素的"漏 判與誤判",有的像素應(yīng)該被認(rèn)為是顯著輪廓上的,卻被認(rèn)為不是;而有的像素不應(yīng)當(dāng) 是顯著輪廓上,卻被認(rèn)為是,例如,圖l(b)就是采用Canny邊緣檢測(cè)算法得到的一種結(jié) 果,上述的"漏判與誤判"情況導(dǎo)致了所檢測(cè)到的邊緣存在"噪聲"。當(dāng)然,這種"漏判與誤判"之間的判斷標(biāo)準(zhǔn),應(yīng)該由人眼做最終的判斷。如果把人眼所感知到的顯著輪 廓認(rèn)為是最終的理想結(jié)果,例如圖1(C)就是人眼所判斷的一種結(jié)果,那么上述第一步中 輸出的結(jié)果與這個(gè)理想結(jié)果的差距,就是上述第二步中要努力減小的。
目前,針對(duì)上述第二步要完成的目標(biāo),主要是要把第一步結(jié)果中的輪廓,有選擇性 的聚集成顯著輪廓。聚集的依據(jù),通常采用格式塔心理學(xué)中提供的感知要素。在目前的 一些方法中,通常不直接對(duì)像素直接聚集,而是聚集一些非像素的"高級(jí)"單元, 一般, 這種"高級(jí)"單元為小的直線段,這樣就可以方便的計(jì)算線段之間的方向、距離等,可 以更為方便的利用格式塔心理學(xué)中的感知要素,如,臨近性,共線性等。通常先對(duì)第一 步的結(jié)果做一些預(yù)處理,比如,去掉一些"誤判"的像素,這些像素可以通過其所在輪 廓的長(zhǎng)度而選取,通常在第一步的結(jié)果中,長(zhǎng)度小于某個(gè)閾值的輪廓,可以被看成是"誤 判"的,這些像素被去掉。另一方面,補(bǔ)上一些"漏判"的像素,最簡(jiǎn)單的方法是將每 個(gè)輪廓端點(diǎn)與其最近k鄰域端點(diǎn)用直線段連接起來。在完成上述與處理之后,接下來就 是利用格式塔心理學(xué)提供的感知聚集要素,定義一種聚集標(biāo)準(zhǔn),然后設(shè)計(jì)算法(目前算 法多采用動(dòng)態(tài)規(guī)劃或全局搜索),從上述小的線段集中搜索出滿足聚集標(biāo)準(zhǔn)的一個(gè)子集 來,這個(gè)子集構(gòu)成了算法最終的結(jié)果,即顯著性結(jié)構(gòu),它仍然是對(duì)理想結(jié)果的一種逼近, 但與單純的邊緣檢測(cè)算法相比,它減少了很多"噪聲"邊緣,保持了顯著輪廓的大部分 結(jié)構(gòu),為后續(xù)的計(jì)算機(jī)視覺應(yīng)用提供了較好的輸入。
類似上述的這些方法,雖然取得了一些較為滿意的結(jié)果,但仍然存在不足,算法不 穩(wěn)定是一個(gè)主要的缺陷,對(duì)于相對(duì)簡(jiǎn)單的圖像來說,算法結(jié)果比較滿意,但遇到復(fù)雜的 圖像后,結(jié)果往往偏差較大,其原因在于,上述第二步的搜索算法依賴與上述第一步中 邊緣檢測(cè)的結(jié)果,如果第一步的結(jié)果不理想,輸入第二步之后,即使第二步的算法是最 佳的,也很難得到理想的結(jié)果,正如Stahl和Wang在文獻(xiàn)(J. S. Stahl, and S. Wang. "Edge Grouping. Combining Boundary and Region Information" , IEEE Trans. Image Process., 16(10) :377 - 384 , oct. 2007.)中提到的。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種復(fù)雜圖像中顯著輪廓提取方法,該方法對(duì)于復(fù)雜圖像的 顯著輪廓提取,能夠獲得良好的視覺效果。本發(fā)明提供的一種復(fù)雜圖像中顯著輪廓提取方法,其步驟為-
(1) 對(duì)于輸入圖像/0,y),首先按照式(i )獲得隨機(jī)生成線段中心點(diǎn)坐標(biāo)Pi = (x,y) 的采樣概率g(Pi), i表示圖像中象素的序號(hào)
g(Pi) = l7/"y)/^y7/0,y) ( i )
其中P/(x,y)為圖像的梯度值,其計(jì)算公式為式(ii)-味y) = 2V[/(x + l,y) 二 /0,y)]2 + [/0,y +1) — /(Xy)]2 (ii)
(2) 按照下述過程建立線段集合『數(shù)學(xué)模型,對(duì)圖像中顯著輪廓的逼近
(2.1) 集合『的初始值設(shè)為空集,『={};
(2.2) 根據(jù)步驟(1)得到的采樣概率q(Pi),采樣得到線段So的中心點(diǎn)坐標(biāo) Po = ,然后在預(yù)設(shè)的數(shù)值區(qū)間[Zn^,i饑M]上進(jìn)行均勻采樣,采出該線段的 長(zhǎng)度值^ ,接下來在方向區(qū)間[O,tt]上進(jìn)行均勻采樣,采出該線段的方向值& ,將
該線段& = ( Po , f(j , 加入集合『,'
(2.3) 生成一個(gè)位于0到1之間的隨機(jī)數(shù)rand,記錄迭代次數(shù)N=N+1, N的初始 值為0 ;如果rand小于等于^,進(jìn)入步驟(2.4),如果mnd大于c^且小于等于qd+c^, 轉(zhuǎn)入步驟(2.6),如果rand大于&+&,,轉(zhuǎn)入步驟(2.8); ^為隨機(jī)刪除一個(gè)線段的轉(zhuǎn) 移形式的概率,( b為隨機(jī)生成一個(gè)線段的這種轉(zhuǎn)移形式的概率;
(2.4)使用步驟(2.2)中的方法隨機(jī)生成一個(gè)新的線段& = (A A ,將其 暫時(shí)加入集合『,此時(shí),定義新集合『為, W = W U {^},戶(,)為轉(zhuǎn)移概率,其 定義如下
w') ^g(Pi)gCq(喻) (iv) 公式(iii )中qd為隨機(jī)刪除 一 個(gè)線段這種轉(zhuǎn)移形式的概率, card(MO為當(dāng)前狀態(tài)下線段的個(gè)數(shù);q(Pi)為隨機(jī)生成線段中心點(diǎn)坐標(biāo)的采樣概率,其 分布由圖像的梯度確定;q(WPi)為隨機(jī)生成線段長(zhǎng)度的采樣概率,其分布為均勻分布; q(AIPi)為隨機(jī)生成線段方向的采樣概率,其分布為均勻分布;
(2.5) 按照公式(v)計(jì)算線段Si的接收概率ai(vv,w');在求得線段^的接收概率 之后,再生成一個(gè)O到l之間的隨機(jī)數(shù)r,如果大于r,則線段A將
被最終添加到集合『,否則將被丟掉;然后轉(zhuǎn)入步驟(3);
(2.6) 在當(dāng)前線段集合『中,隨機(jī)選中一個(gè)線段&= (p。Z。&),將其暫時(shí)從集合『中刪除;此時(shí),按照定義新集合『為礦,從當(dāng)前線段集合W中隨機(jī)刪除一個(gè)線
段,此時(shí)^' = ^\&,戶(,)仍采用公式(iii)和(iV)計(jì)算;
(2.7) 按照公式(v)計(jì)算線段A的刪除概率a2(vv,u/),在求得線段^的刪除概 率a2(vv,w')之后,再生成一個(gè)O到1之間的隨機(jī)數(shù)r,如果a2(w,w')大于r,則線 段A將被最終從集合『中刪除,否則將不被刪除;然后轉(zhuǎn)入步驟(3);
(2.8) 在當(dāng)前線段集合『中,隨機(jī)選中一個(gè)線段&= (p。^,A),生成一個(gè)O到 1之間的隨機(jī)數(shù)a, 如果a< 1/3,則^ = 如果1/3 < a < 2/3,則^ = ^ 一 ; 如果a>2/3,則^保持不變;用同樣的方法調(diào)整&的大??;線段中心點(diǎn)坐標(biāo)Pi保持 不變;這樣^將成為一個(gè)新的線段V ,同樣定義新集合『為^ , ir = (W\Si)U
{ },其中A' = (A , ^ ± , & ± A0),在這種轉(zhuǎn)移形式下,Z3( W', W)等于P( W, W');
(2.9) 按照公式(v)計(jì)算線段^的調(diào)整接收概率a3(w,w');在求得線段A的調(diào) 整接收概率a3(vv,w')之后,再生成一個(gè)O到l之間的隨機(jī)數(shù)r,如果a3(w,w')大于r, 則線段&將被最終調(diào)整為Si',否則將保持不變;
a (w,w') = rnin(l,/ (w,w')) ( v )
其中i (w,w')為Green比值,其定義為
/ (W,W')-"1~:"^Li~(VI) P( w, w')/(w)7-
其中iX,)為轉(zhuǎn)移概率,/6)為線段集合的數(shù)學(xué)模型,:r為模擬退火算法中的當(dāng)前溫度;
(3)重復(fù)步驟(2.3),每迭代一次,N的數(shù)值加l;當(dāng)溫度T趨于O時(shí),算法收斂,
此時(shí)的線段集合r為該模型的最優(yōu)解,得到圖像的顯著輪廓。
本發(fā)明針對(duì)現(xiàn)有復(fù)雜圖像中輪廓提取方法的不足,提出了一種對(duì)顯著輪廓逼近的數(shù) 學(xué)模型,該模型將同時(shí)完成顯出輪廓組成單元的檢測(cè)與感知聚集。本發(fā)明直接對(duì)"高級(jí)" 的輪廓組成單元,線段,進(jìn)行描述,避免了目前邊緣檢測(cè)算法中"噪聲"邊緣的缺陷, 將輪廓組成單元的檢測(cè)與感知聚集統(tǒng)一在一個(gè)框架下,同時(shí)完成二者的實(shí)現(xiàn)。本發(fā)明方 法還避免了感知聚集過程對(duì)輪廓組成單元檢測(cè)算法的依賴,其輸出的結(jié)果是對(duì)理想輪廓 的一種逼近。逼近的結(jié)果具有良好的抗干擾性,對(duì)于復(fù)雜圖像的顯著輪廓提取,能獲得 良好的視覺效果。


圖l示出了自然圖像,用Carmy邊緣檢測(cè)得到的輪廓,和人工標(biāo)注的理想輪廓;
圖2示出了本方法的算法實(shí)現(xiàn)流程圖3示出了一個(gè)理想輪廓和一個(gè)線段集合對(duì)它的逼近;
圖4 (a)示出了本發(fā)明中線段的吸引區(qū)域;圖4 (b)示出了三個(gè)線段的連接情況; 圖4 (c)示出了本發(fā)明中線段的排斥區(qū)域。
圖5 (a)示出了的一幅合成圖像,圖5 (b) Carmy邊緣檢測(cè)算法的結(jié)果,圖5 (c) 本發(fā)明得到的結(jié)果。
圖6 (a) (b)示出了的一幅合成圖像,圖6 (c) (d) Canny邊緣檢測(cè)算法的結(jié)果, 圖6 (e) (f)本發(fā)明得到的結(jié)果。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。 如圖2所示,本發(fā)明方法包括以下步驟-
(1) 對(duì)于輸入圖像/(;c,y),首先獲得隨機(jī)生成線段中心點(diǎn)坐標(biāo)pi = (x,y)的采樣概 率g(Pi), i表示圖像中象素的序號(hào)
<formula>formula see original document page 8</formula>(1) 其中P/0,y)為圖像的梯度值計(jì)算公式為
<formula>formula see original document page 8</formula>
(2) 建立線段集合『數(shù)學(xué)模型,滿足該模型的最優(yōu)解,即為對(duì)圖像中顯著輪廓的 逼近。本發(fā)明運(yùn)用了可逆瑕&轉(zhuǎn)馬爾科夫鏈蒙特卡洛(Reversible Jump Markov chain Monte Carlo (RJMCMC))和模擬退火算法對(duì)最優(yōu)線段集進(jìn)行求解。其具體步驟如下
(2.1) 集合『的初始值設(shè)為空集,
(2.2) 根據(jù)公式(l)中的概率分布q(Pi),進(jìn)行隨機(jī)采樣,采樣出一個(gè)小線段&的 中心點(diǎn)坐標(biāo)Po = O0,y0)。然后在數(shù)值區(qū)間UmiJl,Zmax]上進(jìn)行均勻采樣,采出該小 線段的長(zhǎng)度值/o 。接下來在方向區(qū)間[O,ir]上進(jìn)行均勻采樣,采出該小線段的方向值 00 ,將該線段(po,k ,&)加入集合,。
數(shù)值區(qū)間[^n^,^似]依據(jù)經(jīng)驗(yàn)選取,Q^的取值范圍通常為7—9, ^M的取值范 圍通常為15 — 17。線段長(zhǎng)度如果過小,則計(jì)算量增大,同時(shí)可能會(huì)在結(jié)果中出現(xiàn)噪聲;線段長(zhǎng)度過長(zhǎng),則會(huì)影響最終圖像中輪廓的逼近,逼近結(jié)果不夠連續(xù)平滑。
(2.3)生成一個(gè)位于0到1之間的隨機(jī)數(shù)rand。記錄迭代次數(shù)N-N+1, N的初始 值為O 。
(2.3.1) 如果rand小于1/3,使用步驟(2。2)中的方法隨機(jī)生成一個(gè)新的線段
A = (PiA,將其暫時(shí)加入集合『。此時(shí),定義新集合『為W ,然后計(jì)算線段
A的接收概率,接收概率計(jì)算公式為
a(vv, w') = min(l, / (w, (2)
其中i (w,w')為Green比值,其定義為
/ (w, vv') = ~^-^~(3)
其中/>(,)為轉(zhuǎn)移概率,/6>為線段集合的數(shù)學(xué)模型(將在下面的文字中詳細(xì)說明),r
為模擬退火算法中的當(dāng)前溫度。T隨迭代次數(shù)N的增加而減小,當(dāng)N小于2000時(shí),T = T0, N大于2000以后,T的計(jì)算公式為
T =-- (4)
1og(l+kx2000) 、'
其中k=floor(N/2000), S卩,小于N除以2000所得商的最大整數(shù)。
在求得線段Si的接收概率之后,再生成一個(gè)O到1之間的隨機(jī)數(shù)r,如
果a(vv,w')大于r,則線段^將被最終添加到集合『,否則將被丟掉。
(2.3.2) 如果rand大于1/3且小于2/3,則在當(dāng)前線段集合『中,隨機(jī)選中一個(gè)線 段A = (Pi,G ,將其暫時(shí)從集合,中刪除。此時(shí),定義新集合『為^ ,然后 計(jì)算線段&的刪除概率a(w,w'),計(jì)算公式仍采用公式(2)。在求得線段^的刪除概 率a(vv,w')之后,再生成一個(gè)O到l之間的隨機(jī)數(shù)r,如果a(vv,w')大于r,則線段^將 被最終從集合『中刪除,否則將不被刪除。
(2.3.3) 如果rand大于2/3,則在當(dāng)前線段集合『中,隨機(jī)選中一個(gè)線段 A = (Pi A , A),生成一個(gè)0到1之間的隨機(jī)數(shù)a,如果a< 1/3,貝仏=^ + 如 果1/3<&<2/3,則^ = ^一";如果&>2/3,貝1』^保持不變。用同樣的方法調(diào)整^的 大小。只有線段中心點(diǎn)坐標(biāo)巧不調(diào)整。這樣Sf將成為一個(gè)新的線段Si',同樣定義新 集合,為^ ,然后計(jì)算線段A的調(diào)整接收概率a(w,w'),計(jì)算公式仍采用公式(2)。 在求得線段Si的調(diào)整接收概率a(w,w')之后,再生成一個(gè)O到1之間的隨機(jī)數(shù)r,如 果大于r,則線段Sf將被最終調(diào)整為A',否則將保持不變。(2. 4)重復(fù)步驟(2. 3),每迭代一次,N的數(shù)值加1。當(dāng)溫度T趨于0時(shí),算法收斂, 此時(shí)的線段集合^即為所求結(jié)果。
下面對(duì)公式(3)中的/>(,)和/(9的具體說明
①在步驟(2.3.1)中,隨機(jī)生成一個(gè)新的線段,并添加到W中,此時(shí)W'-Wufe), P(,)為轉(zhuǎn)移概率,其定義如下
w') = ^(Pi)幽l油(物i) (6) 公式(5)、 (6), card(MO為當(dāng)前狀態(tài)下線段的個(gè)數(shù),^為隨機(jī)刪除一個(gè)線段這種 轉(zhuǎn)移形式的概率,公式中&為隨機(jī)生成一個(gè)線段的這種轉(zhuǎn)移形式的概率,( (Pi)為隨機(jī)生 成線段中心點(diǎn)坐標(biāo)的采樣概率,其分布由圖像的梯度確定;g(Wpi)為隨機(jī)生成線段長(zhǎng)度 的采樣概率,其分布為均勻分布;g(&lpi)為隨機(jī)生成線段方向的采樣概率,其分布為 均勻分布。由步驟(2.3)開始的隨機(jī)數(shù)rand可知,^和^均為1/3 。
在步驟(2.3.2)中,從當(dāng)前線段集合W中隨機(jī)刪除一個(gè)線段,此時(shí)IT = ^\&,其 實(shí)與步驟(2.3. l)是一個(gè)逆過程,P(,)仍采用公式(5)和(6)計(jì)算,只是其中的vv與 w'不同0
在步驟(2.3.3)中,在當(dāng)前線段集W中隨機(jī)選取一個(gè)線段,然后,重新隨機(jī)的調(diào)整 其長(zhǎng)度和方向,此時(shí)W'-(M^^)U(V),其中V-(Pf,^土AZ,A土A。,在這種轉(zhuǎn) 移形式下,w)等于P(iv, w')。
在說明線段集合的數(shù)學(xué)模型/()之前,首先說明線段的三種類型,如圖(3)所示,每 個(gè)小線段都有兩個(gè)端點(diǎn),假設(shè)為點(diǎn) 〃和點(diǎn)K如果一個(gè)小線段的一個(gè)端點(diǎn)與另外一個(gè)小 線段的一個(gè)端點(diǎn)之間的距離小于"則認(rèn)為這兩個(gè)小線段為相連的。據(jù)此,小線段可分 為3中類型,如果一個(gè)小線段的兩個(gè)端點(diǎn)均為相連的,則稱該線段為雙連線段;如果只 有一個(gè)端點(diǎn)是相連的,則稱其為單連線段;如果兩個(gè)端點(diǎn)均不相連,則稱其為自由線段。 (i)小線段集合的數(shù)學(xué)模型為
f(W) oc |3nexp(-E(W)) = pnexp - (E"W) + ED(W)) (7)
該模型采用了概率形式的表達(dá),f(w)是沒有歸一化的概率密度公式, 卩表示波松過程的密度,即用來控制小線段的個(gè)數(shù),n表示當(dāng)前狀態(tài)下小線段的個(gè)數(shù),&(/\0表示線段之間的關(guān)聯(lián)能量,它描述了當(dāng)前狀態(tài)下小線段空間分布之間的關(guān)系。
Ed(W)表示踐段的數(shù)據(jù)能量,它描述了小線段對(duì)實(shí)際圖像中理想輪廓的擬合程度。通過 上述建模,給出一幅圖像,對(duì)其顯著輪廓的逼近,就是求出公式(7)中使得f(W)為最
大的一個(gè)集合W。其數(shù)學(xué)表示就是
W* = arg min限(W) + ED(W) - nlog(B} (8) 本發(fā)明中,將把上式的-nlogP合并到E,(W)中。
(ii) 用來描述線段空間分布幾何關(guān)系的&(MO定義為
&(MO = w0n + w!r^ + w2ns + "a!]句,s戶4(Si,S/) +叫l(wèi)]〈^s戶/r(Si,s;) (9) 式中av就是公式(3)中的一fo^8, oh, 0)2,叫,^代表各項(xiàng)能量懲罰參數(shù),除了 Wa為負(fù)數(shù)之外,其余均為正數(shù)。w表示當(dāng)前集合中線段總數(shù),n,表示當(dāng)前集合中自由線
段個(gè)數(shù), 表示當(dāng)前集合中單連線段個(gè)數(shù)。<&》 >表示當(dāng)前集合中兩個(gè)相連的線段對(duì),
/aO i^)表示兩相連線段之間的吸引能量,;h,^)表示兩相連線段之間的排斥能量。
(iii) 相連線段之間的吸引與排斥能量計(jì)算為
<formula>formula see original document page 11</formula>(10)
<formula>formula see original document page 11</formula>(11)
以算上兩式均采用了一個(gè)圓形區(qū)域的定義G,即圓心為o半徑為r的圓?!筤表示
對(duì)面積的計(jì)算。圖像中輪廓的分布是隨機(jī)的,導(dǎo)致了小線段的分布也是隨機(jī)的,在這種 情況下,我們希望相鄰的線段首尾相連起來,通過線段的吸引區(qū)域,就可以量化相連線
段之間臨近的程度,如圖4(a)中的虛線圓形區(qū)域,其半徑為線段長(zhǎng)度的1/4,圓心為線 段的端點(diǎn),在公式(10)中有明確定義。然而,兩線段之間應(yīng)該滿足共線連續(xù)性,艮卩, 線段之間的方向不應(yīng)有太大差別。如圖4 (b),三個(gè)線段的相連,且共享一個(gè)端點(diǎn),通
過公式(10)的計(jì)算,線段對(duì)〈Si,S2〉與〈S!,S3〉具有相同的吸引能量,而從經(jīng)驗(yàn)得知,^與S3之間的連接應(yīng)更為合理,與格式塔心理學(xué)更為吻合。基于這樣的考慮,公式Ul)
考慮了兩個(gè)線段之間的排斥因素,如圖4 (c),虛線圓為三個(gè)線段的排斥區(qū)域,其半徑 為對(duì)應(yīng)線段的1/2,圓心為線段的中點(diǎn)(即公式(11)中的PJ。 (iv)用于描述線段集數(shù)據(jù)能量的ED(MO定義為
^)(WXsXA) (12)
式中Wd為能量懲罰參數(shù),取正數(shù)。是對(duì)單個(gè)線段對(duì)輪廓的擬合程度)UOi)的 重新量化,)WOi)的定義,依賴于具體圖像的類型,比如,彩色,二值,灰度圖像等,具 體定義在下面的具體實(shí)例中給出,但無論如何定義jU(Si),本發(fā)明,對(duì)M'(Sf)的定義均為
<formula>formula see original document page 12</formula>
本發(fā)明中實(shí)現(xiàn)了合成二值圖像和灰度圖像的輪廓提取,對(duì)于合成二值圖像,如圖5 (a)所示,其像素值為0或255,對(duì)于這類圖像jU(Sf)的數(shù)值為線段上所有對(duì)應(yīng)像素的
像素值均值,此種情況下,本發(fā)明中^ = 190, t2 = 225。
對(duì)于真實(shí)的灰度圖像,如圖6 (a) (b),對(duì)于這類圖像,在計(jì)算ju(Si)之前,對(duì)每個(gè) 線段,先定義兩個(gè)矩形,這兩個(gè)矩形的大小為fxAvv , Z為線段的當(dāng)前長(zhǎng)度,Aw = 4, 這兩個(gè)矩形以線段為它們的一個(gè)共享邊,且它們與線段同向,二者分別沿著線段的方向, 處在線段的左邊與右邊,此種情況下,= |mR — mzJ/ 7 + of/nL , mR, r^為 右邊與左邊矩形中像素值的均值,^, of為對(duì)應(yīng)的標(biāo)準(zhǔn)差,nR, r^為右邊與左邊矩形 中像素的個(gè)數(shù),這里二者是相等的,此種情況下,本發(fā)明中^ = 9, t2 = 10。
實(shí)例
(1) 初始化公式(9) (12)中的系統(tǒng)參數(shù)
wo = 20, a = 220, <u2 = 40,o>a = 一10000,av = 10000, o>d = 10
T0 = 25
此外,線段的寬度為l個(gè)像素,長(zhǎng)度范圍為^^ = 9,^^ = 17 線段隨機(jī)調(diào)整的長(zhǎng)度和方向?yàn)锳f = 2,a0 =兀/12
(2) 對(duì)于輸入圖像/0,y),首先獲得隨機(jī)生成線段中心點(diǎn)坐標(biāo)pi-(x,y)的采樣
概率"Pi)-t7/o,y)/^y,'y)。
其中W(;c,y)為圖像的梯度值計(jì)算公式為
= V[,0c + — /(&y)]2 + [/Or,y + 1) - /0,y)]2。
(3)采用可逆跳轉(zhuǎn)馬爾科夫鏈蒙特卡洛(Reversible Jump Markov chain Monte Carlo (RJMCMC))算法進(jìn)行迭代求解,迭代次數(shù)為3*105次。 圖5與圖6為本發(fā)明算法得到的結(jié)果。
根據(jù)本發(fā)明的典型實(shí)施例,用于實(shí)現(xiàn)本發(fā)明的計(jì)算機(jī)系統(tǒng)可以包括,特別是,中央 處理器(CPU)、存儲(chǔ)器和輸入/輸出(I/O)接口。計(jì)算機(jī)系統(tǒng)通常通過I/0接口與顯示 器和諸如鼠標(biāo)和鍵盤此類的各種輸入設(shè)備相連,配套電路可以包括像高速緩存、電源、 時(shí)鐘電路和通信總線這樣的電路。存儲(chǔ)器可以包括隨機(jī)存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、 磁盤驅(qū)動(dòng)器、磁帶機(jī)等,或它們的組合。計(jì)算機(jī)平臺(tái)還包括操作系統(tǒng)和微指令代碼。此 處所述各種過程和功能可以是通過操作系統(tǒng)執(zhí)行的微指令代碼或應(yīng)用程序(或它們的組 合)的一部分。此外,各種其他外圍設(shè)備可以連接到該計(jì)算機(jī)平臺(tái),如附加數(shù)據(jù)存儲(chǔ)設(shè) 備和打印設(shè)備。
還應(yīng)理解,因?yàn)楦綀D中所述的某些構(gòu)成系統(tǒng)的組件和方法步驟可以軟件形式來實(shí)現(xiàn), 所以系統(tǒng)組件(或過程步驟)之間的實(shí)際連接可能有所不同,具體視本發(fā)明的編程方式 而定?;诖颂幪岢龅谋景l(fā)明原理,相關(guān)領(lǐng)域的普通專業(yè)人員可以設(shè)想本發(fā)明的這些以 及類似實(shí)施方案或配置。
權(quán)利要求
1、一種復(fù)雜圖像中顯著輪廓提取方法,其步驟包括(1)對(duì)于輸入圖像I(x,y),首先按照式(i)獲得隨機(jī)生成線段中心點(diǎn)坐標(biāo)pi=(x,y)的采樣概率q(pi),i表示圖像中象素的序號(hào)其中為圖像的梯度值,其計(jì)算公式為式(ii)(2)按照下述過程建立線段集合W數(shù)學(xué)模型,對(duì)圖像中顯著輪廓的逼近(2. 1)集合W的初始值設(shè)為空集,W={};(2. 2)根據(jù)步驟(1)得到的采樣概率q(pi),采樣得到一個(gè)線段s0的中心點(diǎn)坐標(biāo)p0=(x0,y0),然后在預(yù)設(shè)的數(shù)值區(qū)間[lmin,lmax]上進(jìn)行均勻采樣,采出該線段的長(zhǎng)度值l0,接下來在方向區(qū)間
上進(jìn)行均勻采樣,采出該線段的方向值θ0,將該線段s0=(p0,l0,θ0)加入集合W;(2. 3)生成一個(gè)位于0到1之間的隨機(jī)數(shù)rand,記錄迭代次數(shù)N=N+1,N的初始值為0;如果rand小于等于qb,進(jìn)入步驟(2.4),如果rand大于qb且小于等于qd+qb,轉(zhuǎn)入步驟(2.6),如果rand大于qd+qb,,轉(zhuǎn)入步驟(2.8);qd為隨機(jī)刪除一個(gè)線段的轉(zhuǎn)移形式的概率,qb為隨機(jī)生成一個(gè)線段的這種轉(zhuǎn)移形式的概率;(2. 4)使用步驟(2.2)中的方法隨機(jī)生成一個(gè)新的線段si=(pi,li,θi),將其暫時(shí)加入集合W,此時(shí),定義新集合W為W′,W′=W∪{si},P(,)為轉(zhuǎn)移概率,其定義如下P(w,w′)=qbq(pi)q(li|pi)q(θi|pi) (iv)公式(iii)中qd為隨機(jī)刪除一個(gè)線段這種轉(zhuǎn)移形式的概率,card(W)為當(dāng)前狀態(tài)下線段的個(gè)數(shù);q(pi)為隨機(jī)生成線段中心點(diǎn)坐標(biāo)的采樣概率,其分布由圖像的梯度確定;q(li|pi)為隨機(jī)生成線段長(zhǎng)度的采樣概率,其分布為均勻分布;q(θi|pi)為隨機(jī)生成線段方向的采樣概率,其分布為均勻分布;(2. 5)按照公式(v)計(jì)算線段si的接收概率α1(w,w′);在求得線段si的接收概率α1(w,w′)之后,再生成一個(gè)0到1之間的隨機(jī)數(shù)r,如果α1(w,w′)大于r,則線段si將被最終添加到集合W,否則將被丟掉;然后轉(zhuǎn)入步驟(3);(2. 6)在當(dāng)前線段集合W中,隨機(jī)選中一個(gè)線段si=(pi,li,θi),將其暫時(shí)從集合W中刪除;此時(shí),按照定義新集合W為W′,從當(dāng)前線段集合W中隨機(jī)刪除一個(gè)線段,此時(shí)W′=W\si,P(,)仍采用公式(iii)和(iv)計(jì)算;(2. 7)按照公式(v)計(jì)算線段si的刪除概率α2(w,w′),在求得線段si的刪除概率α2(w,w′)之后,再生成一個(gè)0到1之間的隨機(jī)數(shù)r,如果α2(w,w′)大于r,則線段si將被最終從集合W中刪除,否則將不被刪除;然后轉(zhuǎn)入步驟(3);(2. 8)在當(dāng)前線段集合W中,隨機(jī)選中一個(gè)線段si=(pi,li,θi),生成一個(gè)0到1之間的隨機(jī)數(shù)a,如果a<1/3,則li=li+Δl;如果1/3<a<2/3,則li=li-Δl;如果a>2/3,則li保持不變;用同樣的方法調(diào)整θi的大小;線段中心點(diǎn)坐標(biāo)pi保持不變;這樣si將成為一個(gè)新的線段si′,同樣定義新集合W為W′,W′=(W\si)∪{si′},其中si′=(pi,li±Δl,θi±Δθ),在這種轉(zhuǎn)移形式下,P(w′,w)等于P(w,w′);(2. 9)按照公式(v)計(jì)算線段si的調(diào)整接收概率α3(w,w′);在求得線段si的調(diào)整接收概率α3(w,w′)之后,再生成一個(gè)0到1之間的隨機(jī)數(shù)r,如果α3(w,w′)大于r,則線段si將被最終調(diào)整為si′,否則將保持不變;α(w,w′)=min{1,R(w,w′)}(v)其中R(w,w′)為Green比值,其定義為其中P(,)為轉(zhuǎn)移概率,f()為線段集合的數(shù)學(xué)模型,T為模擬退火算法中的當(dāng)前溫度;(3)重復(fù)步驟(2. 3),每迭代一次,N的數(shù)值加1;當(dāng)溫度T趨于0時(shí),算法收斂,此時(shí)的線段集合W為該模型的最優(yōu)解,得到圖像的顯著輪廓。
全文摘要
本發(fā)明公開了一種復(fù)雜圖像中顯著輪廓提取方法,其步驟為①將理想輪廓抽象成由一個(gè)小線段集合組成,小線段之間首尾相連。理想輪廓由這個(gè)小線段集合逼近;②對(duì)線段集合W建立數(shù)學(xué)模型,滿足該模型的最優(yōu)解,即為對(duì)圖像中顯著輪廓的逼近。③運(yùn)用可逆跳轉(zhuǎn)馬爾科夫鏈蒙特卡洛和模擬退火算法對(duì)最優(yōu)線段集W進(jìn)行求解。本發(fā)明直接對(duì)“高級(jí)”的輪廓組成單元(線段)進(jìn)行描述,避免了目前邊緣檢測(cè)算法中“噪聲”邊緣的缺陷,將輪廓組成單元的檢測(cè)與感知聚集統(tǒng)一在一個(gè)框架下,同時(shí)完成二者的實(shí)現(xiàn)。避免了感知聚集過程對(duì)輪廓組成單元檢測(cè)算法的依賴,輸出結(jié)果是對(duì)理想輪廓的逼近。逼近結(jié)果具有良好的抗干擾性,對(duì)復(fù)雜圖像的顯著輪廓提取,能獲得良好的視覺效果。
文檔編號(hào)G06K9/46GK101436255SQ20081023660
公開日2009年5月20日 申請(qǐng)日期2008年11月28日 優(yōu)先權(quán)日2008年11月28日
發(fā)明者唐奇伶, 張?zhí)煨? 農(nóng) 桑, 王岳環(huán), 峻 高, 高常鑫, 銳 黃 申請(qǐng)人:華中科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1