專利名稱:基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像識(shí)別方法,尤其是一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,用于室內(nèi)及室外地點(diǎn)圖像的識(shí)別。
背景技術(shù):
目前,隨著智能移動(dòng)機(jī)器人走進(jìn)人們的日常生活,并在軍事、商場、醫(yī)院、家庭等各種領(lǐng)域發(fā)揮重要作用,人們對(duì)智能移動(dòng)機(jī)器人系統(tǒng)的自動(dòng)定位需求越來越迫切。移動(dòng)機(jī)器人只有準(zhǔn)確地知道自身的位置以及所處的工作空間,才能安全有效地進(jìn)行自主運(yùn)動(dòng),為人類服務(wù)。因此,自定位和位置估計(jì)成為自主移動(dòng)機(jī)器人最重要的能力之一。視覺系統(tǒng)能夠?yàn)橐苿?dòng)機(jī)器人提供最豐富的感知信息,同時(shí)也具有最接近人類的環(huán)境感知方式。因此,基于視覺的機(jī)器人自定位問題吸引了大量研究人員的參與,同時(shí)也取得了大量的研究成果?;谝曈X的機(jī)器人自定位根據(jù)使用的視覺特征信息的不同,可分為3種基于地標(biāo)特征的自定位方法、基于圖像外觀特征的自定位方法以及最近出現(xiàn)的基于地點(diǎn)識(shí)別的自定位方法。其中,基于地點(diǎn)或者場景識(shí)別的機(jī)器人視覺自定位方法使用人類能夠直接理解的高層語義信息如“門口”、“走廊”、“廚房”等作為視覺特征,非常適合于機(jī)器人在復(fù)雜環(huán)境中的自定位問題。2005年李桂芝,安成萬,楊國盛等.基于場景識(shí)別的移動(dòng)機(jī)器人定位方法研究[J].機(jī)器人,2005,27 (2) :123-127使用多通道Gabor濾波器提取場景圖像的全局紋理特征,并使用支持向量機(jī)來分類識(shí)別室內(nèi)、走廊、門廳等場景,進(jìn)而實(shí)現(xiàn)機(jī)器人的邏輯定位,2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角點(diǎn)特征檢測子和SIFT特征描述子提取局部特征,并使用支持向量機(jī)作為分類器實(shí)現(xiàn)基于局部特征的地點(diǎn)識(shí)別。然而,機(jī)器人實(shí)際獲得的圖片常會(huì)出現(xiàn)拍攝角度、光照的不同,遮擋甚至背景混亂,以及因?yàn)槿宋锛拔矬w的位置變化而導(dǎo)致的高度動(dòng)態(tài)變化等現(xiàn)象,這些固有的可變性導(dǎo)致地點(diǎn)圖像識(shí)別的過程充滿了不確定。為了更好地解決地點(diǎn)圖像識(shí)別過程中由于拍攝角度、光照的不同,以及人物和物體的高度動(dòng)態(tài)變化所導(dǎo)致的不確定性問題,引入基于概率主題模型的圖像識(shí)別方法,并對(duì)原始概率主題模型進(jìn)行改進(jìn),降低算法復(fù)雜度的同時(shí)有效提聞識(shí)別性能。概率主題模型是一種流行的一種圖模型結(jié)構(gòu),它能夠?qū)?shí)際問題進(jìn)行概率建模, 并對(duì)各種復(fù)雜相關(guān)的因素進(jìn)行刻畫。作為概率論和圖論相結(jié)合的產(chǎn)物,為解決地點(diǎn)圖像識(shí)別中的不確定性、復(fù)雜性提供了直觀而自然的方法。目前,概率主題模型在人工智能、自然語言處理、文本分類等領(lǐng)域已經(jīng)取得了很好的應(yīng)用效果,并逐漸引入到圖像識(shí)別領(lǐng)域中。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于概率主題模型的地點(diǎn)圖像識(shí)別方法,更好地解決地點(diǎn)圖像識(shí)別過程中由于拍攝角度、光照的不同,以及人物和物體的高度動(dòng)態(tài)變化所導(dǎo)致的不確定性問題,并對(duì)原始概率主題模型進(jìn)行改進(jìn),降低算法復(fù)雜度的同時(shí)有效提高識(shí)別性能。為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案是提供一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,通過改進(jìn)的概率主題模型建立圖像的潛在主題分布,然后通過分類器來識(shí)別未知地點(diǎn)圖像,其特征包括以下步驟I)圖像獲取步驟,通過安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試圖2)圖像預(yù)處理步驟,將獲取的圖像進(jìn)行灰度化,并將其尺寸縮小至128X128像素;3)特征提取步驟,采用尺度不變特征提取算法(Scale-Invariant Features(SIFT))對(duì)圖像進(jìn)行局部特征提??;4)特征聚類步驟,將所有特征通過k-means算法進(jìn)行聚類,得到若干聚類中心;5)特征分配步驟,將每幅圖像的特征點(diǎn)在對(duì)應(yīng)的聚類中心上進(jìn)行投票,得出每幅圖像對(duì)應(yīng)于每個(gè)聚類中心的頻數(shù)表示向量;6)潛在主題建模步驟,以步驟5)中得出的圖像的頻數(shù)向量作為輸入特征變量,設(shè)定潛在主題個(gè)數(shù),采用改進(jìn)的概率主題模型對(duì)圖像進(jìn)行建模,學(xué)習(xí)模型,得到圖像的潛在主題分布向量;7)采用分類器識(shí)別未知地點(diǎn)圖像。所述步驟I)中訓(xùn)練圖像和測試圖像由安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到,圖像可包含光照、視角、尺度的變化以及人物和物體的動(dòng)態(tài)變化。所述步驟3)中采用尺度不變特征提取算法(Scale-Invariant Features (SIFT)) 對(duì)圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點(diǎn)檢測以及將關(guān)鍵點(diǎn)表示為128維的特征描述子。所述步驟6)中的概率主題模型為潛在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),對(duì)原始LDA模型進(jìn)行改進(jìn),加入量化函數(shù)得到改進(jìn)模型Quantified LDA 模型(QLDA),對(duì)訓(xùn)練圖像和測試圖像進(jìn)行建模。改進(jìn)模型對(duì)于每幅圖像的模型生成過程如下對(duì)于每幅圖像X,選擇一個(gè)Dirichlet參數(shù)π , Ji服從參數(shù)為α的Dirichlet分布,g卩Ji Dirichlet ( α ),對(duì)于每幅圖像的每個(gè)特征χ」,選擇一個(gè)主題ζ」,服從參數(shù)π的離散分布,即Zj discrete O ),然后選擇一個(gè)特征Xj,服從參數(shù)β的概率分布,即Xj p(Xj| β), β是每幅圖像的不同特征對(duì)應(yīng)不同主題的概率,如果一幅圖像有m個(gè)特征,k個(gè)設(shè)定的主題,則β為mXk的矩陣;對(duì)于圖像的所有特征,統(tǒng)計(jì)并分析數(shù)據(jù)集中每幅圖像的特征分布,根據(jù)不同數(shù)據(jù)集的特征分布情況,建立對(duì)應(yīng)的量化函數(shù)QUP,對(duì)輸入特征進(jìn)行分級(jí)量化處理,使其服從Xj Q(Xj)分布,這樣每幅圖像的密度函數(shù)可表示為P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ;分級(jí)量化的基本思想是統(tǒng)計(jì)平均每幅圖像的特征在各區(qū)間內(nèi)的密集程度,最密集且特征值較小的特征,區(qū)分度最低,作為非顯著特征忽略;比較密集且特征值較大的特征,區(qū)分度較高,保持不變;最稀疏且特征值最大的特征,區(qū)分度最高,作為顯著特征,近似處理為距離其最近的整十?dāng)?shù)(實(shí)驗(yàn)顯示該處理可降低計(jì)算復(fù)雜度,且不會(huì)影響識(shí)別性能);具體的量化標(biāo)準(zhǔn)制定方法如下
統(tǒng)計(jì)輸入特征的最小值Xniin和最大值Xniax ;設(shè)定[a,b]區(qū)間的特征密度函數(shù)D(a,b),表示特征在[a,b]區(qū)間內(nèi)的密集程度, 表達(dá)式如下
權(quán)利要求
1. 一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,其特征在于,通過改進(jìn)的概率主題模型建立圖像的潛在主題分布,然后通過分類器來識(shí)別未知地點(diǎn)圖像,包括以下步驟1.1.圖像獲取步驟,通過安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試
圖1.2.圖像預(yù)處理步驟,將獲取的圖像進(jìn)行灰度化,并將其尺寸縮??;1.3.特征提取步驟,采用尺度不變特征提取算法對(duì)圖像進(jìn)行局部特征提??;I. 4.特征聚類步驟,將所有特征通過k-means算法進(jìn)行聚類,得到若干聚類中心;I. 5.特征分配步驟,將每幅圖像的特征點(diǎn)在對(duì)應(yīng)的聚類中心上進(jìn)行投票,得出每幅圖像對(duì)應(yīng)于每個(gè)聚類中心的頻數(shù)表示向量;I. 6.潛在主題建模步驟,以步驟I. 5中得出的圖像的頻數(shù)向量作為輸入特征變量,設(shè)定潛在主題個(gè)數(shù),采用改進(jìn)的概率主題模型對(duì)圖像進(jìn)行建模,學(xué)習(xí)模型,得到圖像的潛在主題分布向量;I.7.采用分類器識(shí)別未知地點(diǎn)圖像;所述步驟I. 6中學(xué)習(xí)算法采用Variational推斷;估計(jì)模型參數(shù)U % β*),使整個(gè)圖像集的似然函數(shù)P ( X α *, β *)最大;與原始LDA相同,該似然函數(shù)不可求,須采用Variational推斷;利用Jensen不等式獲得一個(gè)可計(jì)算的下界來近似真實(shí)的似然函數(shù)值,然后估計(jì)參數(shù)來最大化這個(gè)下界;用L(y,Φ ;α,β)表示似然函數(shù)的近似下界,則有Iogp (X I α , β ) = L( Y , Φ ; α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α,β )為似然函數(shù),q O , ζ | Y , Φ)為 Variational 分布,ρΟ , ζ |χ, α, β )為后驗(yàn)概率密度函數(shù),KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))為 Variational 分布與后驗(yàn)概率密度函數(shù)的Kullback-Leibler距離;由上,最大化下界L( Y,Φ ; α , β )使其接近似然函數(shù)logp(x| α,β)就可以轉(zhuǎn)變?yōu)楣烙?jì)參數(shù) U*,Φ*)使 KL(qU,z| Υ,Φ)||ρ(π,ζ χ,α, β))最小,即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的計(jì)算公式如下
2.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,其特征在于, 所述步驟I. I中訓(xùn)練圖像和測試圖像由安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到,圖像包含光照、視角、尺度的變化以及人物和物體的動(dòng)態(tài)變化。
3.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,其特征在于, 所述的步驟I. 2的縮小尺寸為128 X 128像素。
4.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,其特征在于, 所述步驟I. 3中采用尺度不變特征提取算法對(duì)圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點(diǎn)檢測以及將關(guān)鍵點(diǎn)表示為128維的特征描述子。
5.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,其特征在于, 所述步驟I. 7中分類器為最近鄰分類方法。
全文摘要
一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法,屬于圖像識(shí)別技術(shù)領(lǐng)域。目的在于更好地解決地點(diǎn)圖像識(shí)別中由于不同角度、光照,以及人物和物體的高度動(dòng)態(tài)變化導(dǎo)致的不確定性問題。包括以下步驟圖像獲取步驟;圖像預(yù)處理步驟;特征提取步驟,采用SIFT算法對(duì)圖像進(jìn)行特征提取;特征聚類步驟,將所有特征聚類,得到若干聚類中心;特征分配步驟,將每幅圖像的特征在聚類中心上投票,得出對(duì)應(yīng)每個(gè)聚類中心的頻數(shù)向量;潛在主題建模步驟,采用改進(jìn)的概率主題模型學(xué)習(xí)圖像的潛在主題分布;采用分類器識(shí)別未知地點(diǎn)圖像。本發(fā)明在LDA模型中加入量化函數(shù),通過改進(jìn)LDA模型學(xué)習(xí)圖像的潛在主題,在保證實(shí)時(shí)性的前提下,可有效提高識(shí)別性能。
文檔編號(hào)G06K9/62GK102609719SQ20121001769
公開日2012年7月25日 申請(qǐng)日期2012年1月19日 優(yōu)先權(quán)日2012年1月19日
發(fā)明者傅金融, 李明愛, 楊婉露, 楊金福, 王鍇, 王陽麗 申請(qǐng)人:北京工業(yè)大學(xué)