基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法
【專利摘要】本發(fā)明公開了一種基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法。主要解決現(xiàn)有的分類方法中不包含場(chǎng)景空間信息的缺點(diǎn)。其實(shí)現(xiàn)步驟是:(1)輸入圖像;(2)提取圖像塊特征;(3)初始化非參數(shù)空間判決隱狄利克雷模型參數(shù);(4)建立非參數(shù)空間判決隱狄利克雷模型;(5)圖像場(chǎng)景分類。本發(fā)明利用了含有空間信息的圖像塊,可以更為豐富的描述圖像場(chǎng)景,提高了圖像場(chǎng)景分類的準(zhǔn)確率。
【專利說明】基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于圖像處理【技術(shù)領(lǐng)域】,更進(jìn)一步涉及模式識(shí)別【技術(shù)領(lǐng)域】中的一種基于非參數(shù)空間判決隱狄利克雷(Nonparametric Spatial Discriminative Latent DirichletAlloCation,NS-DiSCLDA)模型的場(chǎng)景分類方法。本發(fā)明可用于對(duì)自然圖像的場(chǎng)景分類,提高場(chǎng)景分類準(zhǔn)確率。
【背景技術(shù)】
[0002]場(chǎng)景分類是圖像理解的基本任務(wù)之一,它在場(chǎng)景識(shí)別中有非常重要的作用。傳統(tǒng)的場(chǎng)景分類通常基于三種方法:其一,基于圖譜分析的圖像集合的場(chǎng)景分類方法;其二,基于監(jiān)督流形學(xué)習(xí)的場(chǎng)景分類方法;其三,基于目標(biāo)及其空間關(guān)系特性的場(chǎng)景分類方法。
[0003]清華大學(xué)申請(qǐng)的專利“基于譜圖分析的圖像集合的場(chǎng)景分類方法及裝置”(申請(qǐng)?zhí)?201110221407.3申請(qǐng)日=2011-08-03申請(qǐng)公布號(hào):CN102542285A)中公開了一種場(chǎng)景分類方法。該方法通過交互時(shí)間確定隸屬度,主要解決現(xiàn)有方法中非線性數(shù)據(jù)丟失的問題,進(jìn)而提高分類準(zhǔn)確率。該方法實(shí)施方式是:首先提取圖像集合的SIFT特征集合,并得到K個(gè)聚類和K個(gè)碼字,根據(jù)任意圖像的SIFT特征和碼字建立有權(quán)圖譜,確定有權(quán)圖譜與任意節(jié)點(diǎn)的歐氏距離最近的K’個(gè)節(jié)點(diǎn),得到節(jié)點(diǎn)集合對(duì)應(yīng)的權(quán)重矩陣,然后根據(jù)權(quán)重矩陣得到拉普拉斯算子矩陣,對(duì)拉普拉斯算子矩陣進(jìn)行運(yùn)算得到任意圖像的每一個(gè)SIFT特征與K個(gè)碼字之間的交互時(shí)間,根據(jù)交互時(shí)間確定隸屬度,最后根據(jù)隸屬度確定碼字分配結(jié)果,根據(jù)分配結(jié)果對(duì)場(chǎng)景進(jìn)行分類。但是,該專利申請(qǐng)的方法存在的不足之處是:單純利用分類器對(duì)圖像場(chǎng)景進(jìn)行分類,缺失了場(chǎng)景中語義信息,進(jìn)而降低了場(chǎng)景分類的準(zhǔn)確率。
[0004]清華大學(xué)申請(qǐng)的專利“基于監(jiān)督流形學(xué)習(xí)的場(chǎng)景分類方法及裝置”(申請(qǐng)?zhí)?201110202756.0申請(qǐng)日:2011-07-19申請(qǐng)公布號(hào):CN102254194A)中公開了一種場(chǎng)景分類方法。該方法利用流形學(xué)習(xí)對(duì)圖像場(chǎng)景進(jìn)行了分類,主要解決現(xiàn)有方法沒有考慮高維特征點(diǎn)的流形特征的問題。該方法實(shí)施方式是:首先提取圖像特征并獲取特征的聚類中心組成的碼本,然后獲取每個(gè)流形結(jié)構(gòu)上的各個(gè)特征到碼字上的度量,計(jì)算測(cè)試圖像的特征到碼字的隸屬度并得到直方圖向量,最后利用支持向量機(jī)對(duì)直方圖向量進(jìn)行學(xué)習(xí),得到圖像的場(chǎng)景類別。但是,該專利申請(qǐng)的方法存在的不足之處是:該方法采用了流形學(xué)習(xí)技術(shù),然而流形學(xué)習(xí)技術(shù)的分類能力較弱,從而導(dǎo)致了場(chǎng)景分類的準(zhǔn)確率降低,另外該方法的計(jì)算復(fù)雜度太高,導(dǎo)致場(chǎng)景分類速度降低。
[0005]中國(guó)科學(xué)院電子學(xué)研究所申請(qǐng)的專利“一種基于目標(biāo)及其空間關(guān)系特性的圖像場(chǎng)景分類方法”(申請(qǐng)?zhí)?201110214985.4申請(qǐng)日=2011-07-29申請(qǐng)公布號(hào):CN102902976A)中公開了一種場(chǎng)景分類方法。該方法通過融合主題之間的空間關(guān)系特性提高場(chǎng)景分類準(zhǔn)確率。該方法實(shí)施方式是:首先定義一種空間關(guān)系直方圖,表征目標(biāo)之間的空間關(guān)系,然后采用融合主題之間空間關(guān)系特性的概率隱含語義分析模型,建立圖像模型,最后用支持向量機(jī)分類場(chǎng)景圖像。但是,該專利申請(qǐng)的方法存在的不足之處是:由于該方法采用了 PLSA主題模型建模的方法,然而PLSA主題模型缺失先驗(yàn)信息,導(dǎo)致細(xì)節(jié)信息丟失進(jìn)而降低了場(chǎng)景分類的準(zhǔn)確率。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的不足,提出基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分析方法,更為全面地描述圖像,提高場(chǎng)景分類準(zhǔn)確率。
[0007]實(shí)現(xiàn)本發(fā)明的技術(shù)思路是,將圖像均勻分割為許多8X8的圖像塊,提取圖像塊的SIFT特征,獲取圖像塊的空間坐標(biāo),利用圖像塊的特征和空間坐標(biāo)建立非參數(shù)空間判決隱狄利克雷模型,使得模型中包含圖像塊的空間信息,達(dá)到更為全面地描述圖像,提高場(chǎng)景分類準(zhǔn)確率的目的。
[0008]為實(shí)現(xiàn)上述目的,本發(fā)明包括如下主要步驟:
[0009](I)輸入圖像:輸入人工標(biāo)注場(chǎng)景類別的訓(xùn)練圖像。
[0010](2)提取圖像塊特征。
[0011 ] 將訓(xùn)練圖像分成多個(gè)8 X 8的圖像塊,對(duì)每個(gè)圖像塊提取SIFT特征,記錄每個(gè)圖像塊的空間坐標(biāo)。
[0012](3)初始化模型參數(shù):對(duì)非參數(shù)空間判決隱狄利克雷模型進(jìn)行手工初始化,獲得場(chǎng)景元素空間分布參數(shù)。
[0013](4)建立非參數(shù)空間判決隱狄利克雷模型。
[0014]估計(jì)模型中每個(gè)主題的單詞分布的參數(shù),對(duì)圖像塊的特征和空間坐標(biāo)進(jìn)行統(tǒng)計(jì)建模,建立非參數(shù)空間判決隱狄利克雷模型。
[0015](5)圖像場(chǎng)景分類。
[0016]根據(jù)非參數(shù)空間判決隱狄利克雷模型,預(yù)測(cè)測(cè)試圖像的類別標(biāo)記,完成圖像場(chǎng)景的分類。
[0017]本發(fā)明與現(xiàn)有方法相比具有如下優(yōu)點(diǎn):
[0018]第一,本發(fā)明在提取圖像塊特征時(shí)記錄圖像塊的空間坐標(biāo),克服了現(xiàn)有技術(shù)中不包含空間信息的缺點(diǎn),使得本發(fā)明的圖像信息更加完整,提高了圖像場(chǎng)景分類準(zhǔn)確率。
[0019]第二,本發(fā)明對(duì)圖像塊的特征和空間坐標(biāo)進(jìn)行統(tǒng)計(jì)建模,使圖像塊的特征通過空間坐標(biāo)相互聯(lián)系,克服了現(xiàn)有技術(shù)圖像表示方法中圖像塊的信息不相關(guān)的缺點(diǎn),使得本發(fā)明的圖像表示方法保持了圖像信息的全面性。
[0020]第三,本發(fā)明所建立的非參數(shù)空間判決隱狄利克雷模型利用了主題的單詞分布進(jìn)行建模,使建模更加容易,克服了現(xiàn)有技術(shù)中圖像建模能力差的缺點(diǎn),使得本發(fā)明表現(xiàn)出了更好的建模能力。
【專利附圖】
【附圖說明】
[0021]圖1為本發(fā)明的流程圖;
[0022]圖2為本發(fā)明的非參數(shù)空間判決隱狄利克雷模型圖。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
[0024]參照附圖1,對(duì)本發(fā)明實(shí)現(xiàn)的步驟如下:[0025]步驟I,輸入圖像。
[0026]輸入人工標(biāo)注場(chǎng)景類別的訓(xùn)練圖像。本發(fā)明的人工標(biāo)注是指對(duì)所有訓(xùn)練圖像分別標(biāo)注自然圖像類別標(biāo)記。
[0027]步驟2,提取圖像塊特征。
[0028]將訓(xùn)練圖像分成多個(gè)8X8的圖像塊,對(duì)每個(gè)圖像塊提取SIFT特征,記錄每個(gè)圖像塊的空間坐標(biāo)。
[0029]SIFT特征提取的步驟如下:
[0030]第一步,將擬提取SIFT特征的圖像塊組成圖像塊集合。
[0031]第二步,為尺度值σ選取0.5、0.8、1.1、1.4、1.7五個(gè)尺度值,將五個(gè)尺度值分別帶入下式,得到不同尺度的五個(gè)高斯函數(shù)。
[0032]
【權(quán)利要求】
1.一種基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,包括以下步驟:(1)輸入圖像:輸入人工標(biāo)注場(chǎng)景類別的訓(xùn)練圖像;(2)提取圖像塊特征:將訓(xùn)練圖像分成多個(gè)8 X 8的圖像塊,對(duì)每個(gè)圖像塊提取SIFT特征,記錄每個(gè)圖像塊的空間坐標(biāo);(3)初始化模型參數(shù):對(duì)非參數(shù)空間判決隱狄利克雷模型進(jìn)行手工初始化,獲得場(chǎng)景元素空間分布參數(shù);(4)建立非參數(shù)空間判決隱狄利克雷模型:估計(jì)模型中每個(gè)主題的單詞分布的參數(shù),對(duì)圖像塊的特征和空間坐標(biāo)進(jìn)行統(tǒng)計(jì)建模,建立非參數(shù)空間判決隱狄利克雷模型;(5)圖像場(chǎng)景分類:根據(jù)非參數(shù)空間判決隱狄利克雷模型,預(yù)測(cè)測(cè)試圖像的類別標(biāo)記,完成圖像場(chǎng)景的分類。
2.根據(jù)權(quán)利要求1所述的基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,步驟(I)所述的標(biāo)注場(chǎng)景類別是指對(duì)所有訓(xùn)練圖像分別標(biāo)注自然圖像類別標(biāo)記。
3.根據(jù)權(quán)利要求1所述的基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,步驟(2)所述提取SIFT特征的步驟如下:第一步,將擬提取SIFT特征的圖像塊組成圖像塊集合;第二步,為尺度值σ選取0.5、0.8、1.1、1.4、1.7五個(gè)尺度值,將五個(gè)尺度值分別帶入下式,得到不同尺度的五個(gè)高斯函數(shù);
4.根據(jù)權(quán)利要求1所述的基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,步驟(3)所述的模型初始化的步驟如下:第一步,查找訓(xùn)練圖像中是否存在場(chǎng)景元素空間布局信息,如果存在,轉(zhuǎn)到第二步,否則,轉(zhuǎn)到第三步;第二步,將訓(xùn)練圖像的場(chǎng)景元素空間布局信息作為場(chǎng)景元素空間分布參數(shù);第三步,將訓(xùn)練圖像均勻分成多個(gè)8X8的圖像塊,由統(tǒng)計(jì)圖像塊的方法得到場(chǎng)景元素空間分布參數(shù)。
5.根據(jù)權(quán)利要求1所述的基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,步驟(4)所述的建立非參數(shù)空間判決隱狄利克雷模型的步驟如下:第一步,根據(jù)場(chǎng)景元素空間的分布參數(shù),估計(jì)圖像主題的概率分布;第二步,對(duì)圖像主題的概率分布隨機(jī)采樣,得到圖像塊主題的采樣樣本;第三步,根據(jù)圖像塊主題的采樣樣本,估計(jì)圖像塊主題的單詞分布參數(shù);第四步,根據(jù)圖像塊主題的單詞分布參數(shù),建立非參數(shù)空間判決隱狄利克雷模型。
6.根據(jù)權(quán)利要求1所述的基于非參數(shù)空間判決隱狄利克雷模型的場(chǎng)景分類方法,其特征在于,步驟(5)中所述的預(yù)測(cè)測(cè)試圖像類別標(biāo)記的步驟如下:第一步,將測(cè)試圖像帶入非參數(shù)空間判決隱狄利克雷模型,得到測(cè)試圖像類別概率分布;第二步,將測(cè)試圖像類別概率分布中概率最大的類別作為測(cè)試圖像的類別標(biāo)記。
【文檔編號(hào)】G06K9/62GK103440501SQ201310392891
【公開日】2013年12月11日 申請(qǐng)日期:2013年9月1日 優(yōu)先權(quán)日:2013年9月1日
【發(fā)明者】牛振興, 王斌, 高新波, 宗汝, 鄭昱, 李潔 申請(qǐng)人:西安電子科技大學(xué)