本發(fā)明涉及計算機視覺技術,尤其是涉及一種針對多結構數據的指導性采樣方法。
背景技術:
視覺是人類感知世界的一種重要手段。研究表明,人類獲取的外界信息中超過80%的信息由視覺獲得的。計算機視覺的主要任務就是希望讓計算機模擬人類視覺功能。魯棒模型擬合是計算機視覺中一項重要的基礎性研究任務,它已經廣泛應用于三維數據分割、識別、圖像配準、運動分割和人臉聚類等領域。采樣到一組干凈最小數據子集對于大多數魯棒模型擬合方法的成功起到至關重要的作用。許多最近提出的模型擬合方法使用隨機采樣來生成模型假設。然而,隨機采樣的缺點是,隨著幾何模型維度的增加或輸入數據內點比例的降低,采樣到干凈最小數據子集的概率會指數地減少。因此,隨機采樣不是一種理想的采樣方法。
為了提高采樣到干凈最小數據子集的效率,一些最近提出的指導性采樣方法(比如[1,2])通過使用從關鍵點匹配分數計算得到的先驗概率來指導采樣過程。這些方法可以為單結構數據快速地采樣到干凈最小數據子集(即使單結構數據包含了超過90%的離群點)。然而,對于多結構數據,這些方法可能無法在合理的時間內獲得一個干凈的解(即,為多結構數據中的每個模型實例至少采樣到一個干凈最小數據子集)。由于這些方法通常會采樣到交叉結構的最小數據子集,尤其是對于高階幾何模型。在這種情況下,交叉結構的最小數據子集中的數據可能具有高的匹配分數,但是它們來自多結構數據中的不同模型實例。
若干種指導性采樣方法(例如,[3,4])被提出用于為兩階段模型擬合方法(比如,[5,6])加速采樣干凈最小數據子集。這些指導性采樣方法的兩階段模型擬合方法先采樣一組數據子集并生成模型假設,然后執(zhí)行模型選擇。然而這兩個步驟被分開執(zhí)行。因此,如果在所采樣的數據子集中沒有獲得一個干凈解,那么這些方法將失敗。同時這些指導性采樣方法從具有高離群點比率的多結構數據中獲取干凈解是耗時的,因為這些指導性采樣方法的模型假設生成過程是耗時的。
參考文獻:
[1]o.chumandj.matas,“matchingwithprosac-progressivesampleconsensus,”proc.ieeeconf.computervisionandpatternrecognition,2005.
[2]a.s.brahmachariands.sarkar,“hop-diffusionmontecarloforepipolargeometryestimationbetweenverywide-baselineimages,”ieeetrans.patternanal.mach.intell.,vol.35,no.3,pp.755–762,2013.
[3]t.-j.chin,j.yu,andd.suter,“acceleratedhypothesisgenerationformultistructuredataviapreferenceanalysis,”ieeetrans.patternanal.mach.intell.,vol.34,no.4,pp.625–638,2012.
[4]h.s.wong,t.-j.chin,j.yu,andd.suter,“modeseekingoverpermutationsforrapidgeometricmodelfitting,”patternrecognit.,vol.46,no.1,pp.257–271,2013.
[5]h.wang,t.-j.chin,andd.suter,“simultaneouslyfittingandsegmentingmultiple-structuredatawithoutliers,”ieeetrans.patternanal.mach.intell.,vol.34,no.6,pp.1177–1192,2012.
[6]t.lai,h.wang,y.yan,t.-j.chin,andw.-l.zhao,“motionsegmentationviaasparsityconstraint,”ieeetransactionsonintelligenttransportationsystems,2016.
技術實現要素:
本發(fā)明的目的在于提供一種針對多結構數據的指導性采樣方法。
本發(fā)明包括以下步驟:
1)準備輸入數據χ={x1,x2,...,xn}及相應的匹配分數ψ={ψ1,ψ2,...,ψn},其中n為輸入數據的個數,n為自然數,xi表示兩幅輸入圖像對之間第i個特征匹配對,指定最大采樣次數m及每組模型假設集中所包含的模型假設個數b,b和m均為自然數,初始化模型假設集θ為空;
2)如果當前總采樣次數c小于m,那么執(zhí)行步驟3)~7);否則,結束采樣且輸出模型假設集θ;
3)如果當前總采樣次數c小于b,那么使用隨機采樣方法采樣一個數據子集s;否則使用提出的指導性采樣方法采樣一個數據子集s;
4)使用采樣到的數據子集s估計一個模型假設θ;
5)對每一個xi∈χ,計算xi與θ的絕對殘差到
6)如果當前總采樣次數c大于等于b且c是b的整數倍,那么更新窗口大小w且排序
7)把模型假設添加到模型假設集中。
所述步驟3)中,所述使用提出的指導性采樣方法采樣一個數據子集s包括以下步驟:
(1)從輸入數據χ中隨機選取一個數據
(2)
其中
(3)由于s1是固定的,為簡單起見,設
首先,通過c2計算
然后,φj的概率計算為:
最后,d的熵計算為:
(4)從輸入數據χ中選擇滿足下面公式的有意義的數據:
χ*={xj|e+logη(φj)<0}(公式5)
(5)用一組數據索引
(6)先從相關系數向量d中選取χ*和
及
然后,χ*的采樣權重ω計算為:
ω(l)=μl*vl(公式8)
最后,使用采樣權重ω從χ*采樣一個最小數據子集s。
所述步驟6)中,所述更新窗口大小w且排序
(1)窗口大小w被設為w=α*c,其中c為當前采樣次數,c為自然數,α為比率因子,被設為0.1;
(2)排序
首先,對于數據xi的殘差向量
接著,更新g為:
其中c=c+b且w=α*c;
然后,只保留
本發(fā)明提出一種針對多結構數據的指導性采樣方法。該方法可以快速為多結構數據采樣獲得干凈最小數據子集。本發(fā)明提出的指導性采樣方法可應用于單應性矩陣估計、基本矩陣估計、兩視圖運動分割和平面分割等。
本發(fā)明首先計算輸入數據與已生成的模型假設之間的殘差;然后通過排列殘差來獲得殘差索引;最后高效地計算用于指導采樣數據子集的相關系數,從而為多結構數據快速采樣到干凈最小數據子集;本發(fā)明提出的指導性采樣方法可應用于單應性矩陣估計、基本矩陣估計、兩視圖運動分割和平面分割等計算機視覺任務。
附圖說明
圖1為本發(fā)明實施例的流程圖。
圖2為本發(fā)明與其它幾種采樣方法在adelaidermf數據集的部分圖像對上進行兩視圖運動分割定性對比(僅顯示其中的一個視圖)的結果圖。(a)顯示真實模型實施例的輸入數據,而(b)~(g)分別顯示由方法1、方法2、方法3、方法4、方法5和本發(fā)明所提出的方法獲得的分割結果。
圖3為本發(fā)明與其它幾種采樣方法在adelaidermf數據集的部分圖像對上進行兩視圖平面分割定性對比(僅顯示其中的一個視圖)的結果圖。(a)顯示真實模型實例的輸入數據,而(b)~(g)分別顯示由方法1、方法2、方法3、方法4、方法5和本發(fā)明所提出的方法獲得的分割結果。
方法1對應為y.kanazawa等人提出的方法(y.kanazawaandh.kawakami,“detectionofplanarregionswithuncalibratedstereousingdistributionsoffeaturepoints.”inproceedingsofbritishmachinevisionconference,2004,pp.247–256.);
方法2對應為o.chum等人提出的方法(o.chum,j.matas,andj.kittler,“l(fā)ocallyoptimizedransac,”indagm-symp,2003,pp.236–243.);
方法3對應為o.chum等人提出的方法(o.chumandj.matas,“matchingwithprosac-progressivesampleconsensus,”inproceedingsofieeeconferenceoncomputervisionandpatternrecognition,2005,pp.220–226.);
方法4對應為t.-j.chin等人提出的方法(t.-j.chin,j.yu,andd.suter,“acceleratedhypothesisgenerationformultistructuredataviapreferenceanalysis,”ieeetrans.patternanal.mach.intell.,vol.34,no.4,pp.625–638,2012.);
方法5對應為r.tennakoon等人提出的方法(r.tennakoon,a.bab-hadiashar,z.cao,r.hoseinnezhad,andd.suter,“robustmodelfittingusinghigherthanminimalsubsetsampling,”ieeetrans.patternanal.mach.intell.,vol.38,no.2,pp.350–362,2016)。
具體實施方式
下面結合附圖和實施例對本發(fā)明的方法作詳細說明,本實施例在以本發(fā)明技術方案為前提下進行實施,給出了實施方式和具體操作過程,但本發(fā)明的保護范圍不限于下述的實施例。
參見圖1,本發(fā)明實施例的實施方式包括以下步驟:
s1.準備輸入數據χ={x1,x2,...,xn}及相應的匹配分數ψ={ψ1,ψ2,...,ψn},其中n為輸入數據的個數,n為自然數。xi表示兩幅輸入圖像對之間第i個特征匹配對。指定最大采樣次數m及每組模型假設集中所包含的模型假設個數b,b和m均為自然數。初始化模型假設集θ為空。
s2.如果當前總采樣次數c小于m,那么執(zhí)行步驟s3至s10;否則,結束采樣且輸出模型假設集θ。
s3.如果當前總采樣次數c小于b,使用步驟s4隨機采樣方法采樣一個數據子集s;否則使用步驟s5提出的指導性采樣方法采樣一個數據子集s。
s4.隨機采樣方法采樣一個數據子集s。
s5.本發(fā)明提出的指導性采樣方法采樣一個數據子集s具體包括:
s5-1.從輸入數據χ中隨機選取一個數據
s5-2.
其中
s5-3.由于s1是固定的,為簡單起見,設
然后,φj的概率計算為:
最后,d的熵計算為:
s5-4.從輸入數據χ中選擇滿足下面公式的有意義的數據:
χ*={xj|e+logη(φj)<0}(公式5)
s5-5.用一組數據索引
s5-6.先從相關系數向量d中選取χ*和
及
然后,χ*的采樣權重ω計算為:
ω(l)=μl*vl(公式8)
最后,使用采樣權重ω從χ*采樣一個最小數據子集s。
s6.使用采樣到的數據子集s估計一個模型假設θ。
s7.對每一個xi∈χ,計算xi與θ的絕對殘差到
s8.如果當前總采樣次數c大于等于b且c是b的整數倍,那么使用步驟s9更新窗口大小w且排序
s9.排序
s9-1.窗口大小w被設為w=α*c,其中c為當前采樣次數,c為自然數,α為比率因子,被設為0.1。
s9-2.排序
其中c=c+b且w=α*c。然后,只保留
s10.把模型假設添加到模型假設集中,即:模型假設集θ=模型假設集θ∪模型假設θ。
s11.輸出模型假設集θ。
采樣結束后,方法5利用其自己模型選擇方法進行模型選擇,而所有其它的采樣方法包括本發(fā)明所提出的采樣方法均使用j-linkage(r.toldoanda.fusiello,“robustmultiplestructuresestimationwithj-linkage,”inproceedingsofeuropeanconferenceoncomputervision,2008,pp.537–547)進行模型選擇。
本發(fā)明所提出的方法應用于兩視圖運動分割和平面分割在adelaidermf數據集上的定性比較如圖2和3所示。
由實驗結果所示,本發(fā)明所提出的采樣方法較其它采樣方法獲得了較準確的分割結果。