基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法

文檔序號(hào)：6363572閱讀：364來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種圖像識(shí)別方法，尤其是一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，用于室內(nèi)及室外地點(diǎn)圖像的識(shí)別。
背景技術(shù)：
目前，隨著智能移動(dòng)機(jī)器人走進(jìn)人們的日常生活，并在軍事、商場、醫(yī)院、家庭等各種領(lǐng)域發(fā)揮重要作用，人們對(duì)智能移動(dòng)機(jī)器人系統(tǒng)的自動(dòng)定位需求越來越迫切。移動(dòng)機(jī)器人只有準(zhǔn)確地知道自身的位置以及所處的工作空間，才能安全有效地進(jìn)行自主運(yùn)動(dòng)，為人類服務(wù)。因此，自定位和位置估計(jì)成為自主移動(dòng)機(jī)器人最重要的能力之一。視覺系統(tǒng)能夠?yàn)橐苿?dòng)機(jī)器人提供最豐富的感知信息，同時(shí)也具有最接近人類的環(huán)境感知方式。因此，基于視覺的機(jī)器人自定位問題吸引了大量研究人員的參與，同時(shí)也取得了大量的研究成果?；谝曈X的機(jī)器人自定位根據(jù)使用的視覺特征信息的不同，可分為3種基于地標(biāo)特征的自定位方法、基于圖像外觀特征的自定位方法以及最近出現(xiàn)的基于地點(diǎn)識(shí)別的自定位方法。其中，基于地點(diǎn)或者場景識(shí)別的機(jī)器人視覺自定位方法使用人類能夠直接理解的高層語義信息如“門口”、“走廊”、“廚房”等作為視覺特征，非常適合于機(jī)器人在復(fù)雜環(huán)境中的自定位問題。2005年李桂芝，安成萬，楊國盛等.基于場景識(shí)別的移動(dòng)機(jī)器人定位方法研究[J].機(jī)器人，2005，27 (2) :123-127使用多通道Gabor濾波器提取場景圖像的全局紋理特征，并使用支持向量機(jī)來分類識(shí)別室內(nèi)、走廊、門廳等場景，進(jìn)而實(shí)現(xiàn)機(jī)器人的邏輯定位，2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角點(diǎn)特征檢測子和SIFT特征描述子提取局部特征，并使用支持向量機(jī)作為分類器實(shí)現(xiàn)基于局部特征的地點(diǎn)識(shí)別。然而，機(jī)器人實(shí)際獲得的圖片常會(huì)出現(xiàn)拍攝角度、光照的不同，遮擋甚至背景混亂，以及因?yàn)槿宋锛拔矬w的位置變化而導(dǎo)致的高度動(dòng)態(tài)變化等現(xiàn)象，這些固有的可變性導(dǎo)致地點(diǎn)圖像識(shí)別的過程充滿了不確定。為了更好地解決地點(diǎn)圖像識(shí)別過程中由于拍攝角度、光照的不同，以及人物和物體的高度動(dòng)態(tài)變化所導(dǎo)致的不確定性問題，引入基于概率主題模型的圖像識(shí)別方法，并對(duì)原始概率主題模型進(jìn)行改進(jìn)，降低算法復(fù)雜度的同時(shí)有效提聞識(shí)別性能。概率主題模型是一種流行的一種圖模型結(jié)構(gòu)，它能夠?qū)?shí)際問題進(jìn)行概率建模，并對(duì)各種復(fù)雜相關(guān)的因素進(jìn)行刻畫。作為概率論和圖論相結(jié)合的產(chǎn)物，為解決地點(diǎn)圖像識(shí)別中的不確定性、復(fù)雜性提供了直觀而自然的方法。目前，概率主題模型在人工智能、自然語言處理、文本分類等領(lǐng)域已經(jīng)取得了很好的應(yīng)用效果，并逐漸引入到圖像識(shí)別領(lǐng)域中。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于概率主題模型的地點(diǎn)圖像識(shí)別方法，更好地解決地點(diǎn)圖像識(shí)別過程中由于拍攝角度、光照的不同，以及人物和物體的高度動(dòng)態(tài)變化所導(dǎo)致的不確定性問題，并對(duì)原始概率主題模型進(jìn)行改進(jìn)，降低算法復(fù)雜度的同時(shí)有效提高識(shí)別性能。為了達(dá)到上述目的，本發(fā)明所采用的技術(shù)方案是提供一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，通過改進(jìn)的概率主題模型建立圖像的潛在主題分布，然后通過分類器來識(shí)別未知地點(diǎn)圖像，其特征包括以下步驟I)圖像獲取步驟，通過安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試圖2)圖像預(yù)處理步驟，將獲取的圖像進(jìn)行灰度化，并將其尺寸縮小至128X128像素；3)特征提取步驟，采用尺度不變特征提取算法(Scale-Invariant Features(SIFT))對(duì)圖像進(jìn)行局部特征提??；4)特征聚類步驟，將所有特征通過k-means算法進(jìn)行聚類，得到若干聚類中心；5)特征分配步驟，將每幅圖像的特征點(diǎn)在對(duì)應(yīng)的聚類中心上進(jìn)行投票，得出每幅圖像對(duì)應(yīng)于每個(gè)聚類中心的頻數(shù)表示向量；6)潛在主題建模步驟，以步驟5)中得出的圖像的頻數(shù)向量作為輸入特征變量，設(shè)定潛在主題個(gè)數(shù)，采用改進(jìn)的概率主題模型對(duì)圖像進(jìn)行建模，學(xué)習(xí)模型，得到圖像的潛在主題分布向量；7)采用分類器識(shí)別未知地點(diǎn)圖像。所述步驟I)中訓(xùn)練圖像和測試圖像由安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到，圖像可包含光照、視角、尺度的變化以及人物和物體的動(dòng)態(tài)變化。所述步驟3)中采用尺度不變特征提取算法(Scale-Invariant Features (SIFT)) 對(duì)圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點(diǎn)檢測以及將關(guān)鍵點(diǎn)表示為128維的特征描述子。所述步驟6)中的概率主題模型為潛在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),對(duì)原始LDA模型進(jìn)行改進(jìn),加入量化函數(shù)得到改進(jìn)模型Quantified LDA 模型(QLDA)，對(duì)訓(xùn)練圖像和測試圖像進(jìn)行建模。改進(jìn)模型對(duì)于每幅圖像的模型生成過程如下對(duì)于每幅圖像X，選擇一個(gè)Dirichlet參數(shù)π , Ji服從參數(shù)為α的Dirichlet分布，g卩Ji Dirichlet ( α )，對(duì)于每幅圖像的每個(gè)特征χ」，選擇一個(gè)主題ζ」,服從參數(shù)π的離散分布，即Zj discrete O )，然后選擇一個(gè)特征Xj，服從參數(shù)β的概率分布，即Xj p(Xj| β), β是每幅圖像的不同特征對(duì)應(yīng)不同主題的概率，如果一幅圖像有m個(gè)特征，k個(gè)設(shè)定的主題，則β為mXk的矩陣；對(duì)于圖像的所有特征，統(tǒng)計(jì)并分析數(shù)據(jù)集中每幅圖像的特征分布，根據(jù)不同數(shù)據(jù)集的特征分布情況，建立對(duì)應(yīng)的量化函數(shù)QUP，對(duì)輸入特征進(jìn)行分級(jí)量化處理，使其服從Xj Q(Xj)分布，這樣每幅圖像的密度函數(shù)可表示為P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ；分級(jí)量化的基本思想是統(tǒng)計(jì)平均每幅圖像的特征在各區(qū)間內(nèi)的密集程度，最密集且特征值較小的特征，區(qū)分度最低，作為非顯著特征忽略；比較密集且特征值較大的特征，區(qū)分度較高，保持不變；最稀疏且特征值最大的特征，區(qū)分度最高，作為顯著特征，近似處理為距離其最近的整十?dāng)?shù)(實(shí)驗(yàn)顯示該處理可降低計(jì)算復(fù)雜度，且不會(huì)影響識(shí)別性能)；具體的量化標(biāo)準(zhǔn)制定方法如下
統(tǒng)計(jì)輸入特征的最小值Xniin和最大值Xniax ;設(shè)定[a，b]區(qū)間的特征密度函數(shù)D(a，b)，表示特征在[a，b]區(qū)間內(nèi)的密集程度，表達(dá)式如下
權(quán)利要求
1. 一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，其特征在于，通過改進(jìn)的概率主題模型建立圖像的潛在主題分布，然后通過分類器來識(shí)別未知地點(diǎn)圖像，包括以下步驟1.1.圖像獲取步驟，通過安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試

圖1.2.圖像預(yù)處理步驟，將獲取的圖像進(jìn)行灰度化，并將其尺寸縮??；1.3.特征提取步驟，采用尺度不變特征提取算法對(duì)圖像進(jìn)行局部特征提??；I. 4.特征聚類步驟，將所有特征通過k-means算法進(jìn)行聚類，得到若干聚類中心；I. 5.特征分配步驟，將每幅圖像的特征點(diǎn)在對(duì)應(yīng)的聚類中心上進(jìn)行投票，得出每幅圖像對(duì)應(yīng)于每個(gè)聚類中心的頻數(shù)表示向量；I. 6.潛在主題建模步驟，以步驟I. 5中得出的圖像的頻數(shù)向量作為輸入特征變量，設(shè)定潛在主題個(gè)數(shù)，采用改進(jìn)的概率主題模型對(duì)圖像進(jìn)行建模，學(xué)習(xí)模型，得到圖像的潛在主題分布向量；I.7.采用分類器識(shí)別未知地點(diǎn)圖像；所述步驟I. 6中學(xué)習(xí)算法采用Variational推斷；估計(jì)模型參數(shù)U % β*)，使整個(gè)圖像集的似然函數(shù)P ( X α *, β *)最大；與原始LDA相同，該似然函數(shù)不可求，須采用Variational推斷；利用Jensen不等式獲得一個(gè)可計(jì)算的下界來近似真實(shí)的似然函數(shù)值，然后估計(jì)參數(shù)來最大化這個(gè)下界；用L(y，Φ ;α，β)表示似然函數(shù)的近似下界，則有Iogp (X I α , β ) = L( Y , Φ ； α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α，β )為似然函數(shù)，q O , ζ | Y , Φ)為 Variational 分布，ρΟ , ζ |χ, α， β )為后驗(yàn)概率密度函數(shù)，KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))為 Variational 分布與后驗(yàn)概率密度函數(shù)的Kullback-Leibler距離；由上,最大化下界L( Y，Φ ； α , β )使其接近似然函數(shù)logp(x| α，β)就可以轉(zhuǎn)變?yōu)楣烙?jì)參數(shù) U*，Φ*)使 KL(qU，z| Υ，Φ)||ρ(π,ζ χ，α, β))最小，即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的計(jì)算公式如下
2.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，其特征在于，所述步驟I. I中訓(xùn)練圖像和測試圖像由安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到，圖像包含光照、視角、尺度的變化以及人物和物體的動(dòng)態(tài)變化。
3.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，其特征在于，所述的步驟I. 2的縮小尺寸為128 X 128像素。
4.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，其特征在于，所述步驟I. 3中采用尺度不變特征提取算法對(duì)圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點(diǎn)檢測以及將關(guān)鍵點(diǎn)表示為128維的特征描述子。
5.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，其特征在于，所述步驟I. 7中分類器為最近鄰分類方法。
全文摘要
一種基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法，屬于圖像識(shí)別技術(shù)領(lǐng)域。目的在于更好地解決地點(diǎn)圖像識(shí)別中由于不同角度、光照，以及人物和物體的高度動(dòng)態(tài)變化導(dǎo)致的不確定性問題。包括以下步驟圖像獲取步驟；圖像預(yù)處理步驟；特征提取步驟，采用SIFT算法對(duì)圖像進(jìn)行特征提取；特征聚類步驟，將所有特征聚類，得到若干聚類中心；特征分配步驟，將每幅圖像的特征在聚類中心上投票，得出對(duì)應(yīng)每個(gè)聚類中心的頻數(shù)向量；潛在主題建模步驟，采用改進(jìn)的概率主題模型學(xué)習(xí)圖像的潛在主題分布；采用分類器識(shí)別未知地點(diǎn)圖像。本發(fā)明在LDA模型中加入量化函數(shù)，通過改進(jìn)LDA模型學(xué)習(xí)圖像的潛在主題，在保證實(shí)時(shí)性的前提下，可有效提高識(shí)別性能。
文檔編號(hào)G06K9/62GK102609719SQ20121001769
公開日2012年7月25日申請(qǐng)日期2012年1月19日優(yōu)先權(quán)日2012年1月19日
發(fā)明者傅金融, 李明愛, 楊婉露, 楊金福, 王鍇, 王陽麗申請(qǐng)人:北京工業(yè)大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊金福;王陽麗;王鍇;李明愛;楊婉露;傅金融
技術(shù)所有人：北京工業(yè)大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像識(shí)別模型相關(guān)技術(shù)

概率圖模型相關(guān)技術(shù)

概率模型相關(guān)技術(shù)

線性概率模型相關(guān)技術(shù)

違約概率模型相關(guān)技術(shù)

概率分布模型相關(guān)技術(shù)

概率主題模型相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于改進(jìn)概率主題模型的地點(diǎn)圖像識(shí)別方法