一種基于背景知識(shí)的層次語義模型圖像檢索方法
【專利摘要】本發(fā)明公開了信息檢索技術(shù)領(lǐng)域中的一種基于背景知識(shí)的層次語義模型圖像檢索方法。其步驟主要包括:利用FCA方法將通用領(lǐng)域的背景知識(shí)構(gòu)建為概念格模型;提取圖像包含顏色信息的SIFT特征來構(gòu)造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯;利用Bayesian決策理論實(shí)現(xiàn)視覺詞匯到語義主題信息的映射,構(gòu)造層次語義模型;完成基于內(nèi)容的語義圖像檢索算法,輸出檢索關(guān)鍵詞;分析作為檢索屬性的搜索關(guān)鍵詞與原有形式背景屬性集的關(guān)系;利用概念格結(jié)構(gòu)完成基于檢索屬性集的語義檢索。本發(fā)明通過基于背景知識(shí)的層次語義模型圖像檢索方法,能夠確保檢索結(jié)果滿足用戶的檢索要求。
【專利說明】
一種基于背景知識(shí)的層次語義模型圖像檢索方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于信息檢索技術(shù)領(lǐng)域,涉及一種圖像檢索的方法,具體涉及一種基于背景知識(shí)的層次語義模型圖像檢索方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)的信息量越來越大,如何從海量數(shù)據(jù)中檢索到用戶真正需要的信息成為信息檢索的關(guān)鍵任務(wù)。應(yīng)用廣泛的信息檢索是目前信息科學(xué)的一個(gè)研究熱點(diǎn),各種方法技術(shù)不斷涌現(xiàn)。信息檢索的研究方法大體上可以分為基于語法的檢索和基于內(nèi)容的檢索兩個(gè)方面;而現(xiàn)有圖像檢索技術(shù)中,由于其使用圖像紋理、顏色和形狀等低層特征作為索引來對圖像進(jìn)行檢索,而圖像低層特征表達(dá)出的信息與用戶對這些特征圖像理解的含義存在不一致性,即語義鴻溝,所以檢索效果往往不能滿足用戶的需求。
[0003]如果檢索過程中能夠考慮圖像所包含的圖像高層語義信息,加入用戶對圖像內(nèi)容的理解,則會(huì)是一種更貼近用戶理解的圖像檢索。然而,目前語義檢索中語義映射關(guān)系大多是通過人工標(biāo)注建立,對于待檢索圖像中的語義信息難以獲得較好的映射,從而影響檢索效果的提升。
[0004]本發(fā)明結(jié)合上述【背景技術(shù)】中提到的問題以及信息檢索領(lǐng)域的信息發(fā)展趨勢和需求,提出一種基于背景知識(shí)的層次語義模型圖像檢索方法。本方法綜合了語法相似度和語義相似度兩方面因素,且利用詞匯樹將圖像特征與人工標(biāo)注的語義特征進(jìn)行關(guān)聯(lián),以實(shí)現(xiàn)檢索過程中的自動(dòng)語義映射;實(shí)現(xiàn)高層語義映射的自動(dòng)修正,以獲得更好的檢索效果,得到滿足用戶的更為準(zhǔn)確的檢索結(jié)果,減少用戶的檢索負(fù)擔(dān)。
【發(fā)明內(nèi)容】
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明提出的技術(shù)方案是一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,包括以下步驟:
[0006]利用FCA方法將通用領(lǐng)域的背景知識(shí)構(gòu)建為概念格模型;
[0007]提取圖像包含顏色信息的SIFT特征來構(gòu)造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯;
[0008]利用Bayesian決策理論實(shí)現(xiàn)視覺詞匯到語義主題信息的映射,構(gòu)造層次語義模型;
[0009]完成基于內(nèi)容的語義圖像檢索算法,輸出檢索關(guān)鍵詞;
[0010]分析搜索關(guān)鍵詞與原有形式背景屬性集的關(guān)系;
[0011]利用概念格結(jié)構(gòu)完成基于檢索屬性集的語義檢索。
[0012]進(jìn)一步地,其特征包括:采用二維表表示通用領(lǐng)域知識(shí)的形式背景,利用FCA方法構(gòu)建形式背景的概念格結(jié)構(gòu)模型,得到形式背景屬性集和形式背景對象集。
[0013]進(jìn)一步地,其特征包括:構(gòu)建詞匯樹的方法包括:
[0014]設(shè)定聚類個(gè)數(shù)K,樹的深度P,對特征集合進(jìn)行分層聚類,第一層獲得K個(gè)聚類,作為詞匯樹的K個(gè)子節(jié)點(diǎn),計(jì)算出每個(gè)子節(jié)點(diǎn)的中心向量;對每個(gè)子節(jié)點(diǎn)分別進(jìn)行聚類,每一子節(jié)點(diǎn)生成K個(gè)下一層的子節(jié)點(diǎn),并計(jì)算出每個(gè)子節(jié)點(diǎn)的中心向量;不斷重復(fù)直到樹的深度達(dá)到預(yù)設(shè)值P,獲得SIFT詞匯樹;其中,K取5-10的整數(shù),P取3-6的整數(shù)。
[0015]進(jìn)一步地,其特征包括:通過計(jì)算每個(gè)圖片與詞匯樹的每個(gè)葉節(jié)度的相關(guān)度,完成圖片與詞匯樹的關(guān)聯(lián)。
[0016]進(jìn)一步地,其特征包括:設(shè)定圖像庫的語義主題信息集,先采用人工標(biāo)注的方法將圖像庫中的圖片分類至語義主題信息集中的各語義主題信息;再利用Bayesian統(tǒng)計(jì)決策理論實(shí)現(xiàn)視覺詞匯層到語義信息層的映射。
[0017]進(jìn)一步地,其特征包括:將搜索關(guān)鍵詞作為檢索屬性,分析其與原有形式背景屬性集的關(guān)系,如果所有檢索屬性屬于形式背景屬性集,則直接基于概念格模型進(jìn)行語義檢索;否則,則對領(lǐng)域知識(shí)的形式背景進(jìn)行動(dòng)態(tài)重構(gòu);進(jìn)一步通過相似度計(jì)算從屬性集中找出與每一個(gè)檢索屬性最為相似的對應(yīng)替換屬性,更新檢索屬性集。
[0018]本發(fā)明綜合了語法相似度和語義相似度兩方面因素,且利用詞匯樹將圖像特征與人工標(biāo)注的語義特征進(jìn)行關(guān)聯(lián),以實(shí)現(xiàn)檢索過程中的自動(dòng)語義映射;實(shí)現(xiàn)高層語義映射的自動(dòng)修正,以獲得更好的檢索效果,得到滿足用戶的更為準(zhǔn)確的檢索結(jié)果,減少用戶的檢索負(fù)擔(dān)。
【主權(quán)項(xiàng)】
1.一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,包括以下步驟: 利用FCA方法將通用領(lǐng)域的背景知識(shí)構(gòu)建為概念格模型; 提取圖像包含顏色信息的SIFT特征來構(gòu)造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯; 利用Bayesian決策理論實(shí)現(xiàn)視覺詞匯到語義主題信息的映射,構(gòu)造層次語義模型; 完成基于內(nèi)容的語義圖像檢索算法,輸出檢索關(guān)鍵詞; 分析搜索關(guān)鍵詞與原有形式背景屬性集的關(guān)系; 利用概念格結(jié)構(gòu)完成基于檢索屬性集的語義檢索。2.根據(jù)權(quán)利要求1所述的一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,采用二維表表示通用領(lǐng)域知識(shí)的形式背景,利用FCA方法構(gòu)建形式背景的概念格結(jié)構(gòu)模型,得到形式背景屬性集和形式背景對象集。3.根據(jù)權(quán)利要求1所述的一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,其構(gòu)建詞匯樹的方法包括: 設(shè)定聚類個(gè)數(shù)K,樹的深度P,對特征集合進(jìn)行分層聚類,第一層獲得K個(gè)聚類,作為詞匯樹的K個(gè)子節(jié)點(diǎn),計(jì)算出每個(gè)子節(jié)點(diǎn)的中心向量;對每個(gè)子節(jié)點(diǎn)分別進(jìn)行聚類,每一子節(jié)點(diǎn)生成K個(gè)下一層的子節(jié)點(diǎn),并計(jì)算出每個(gè)子節(jié)點(diǎn)的中心向量;不斷重復(fù)直到樹的深度達(dá)到預(yù)設(shè)值P,獲得SIFT詞匯樹;其中,K取5-10的整數(shù),P取3-6的整數(shù)。4.根據(jù)權(quán)利要求1所述的一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,通過計(jì)算每個(gè)圖片與詞匯樹的每個(gè)葉節(jié)度的相關(guān)度,完成圖片與詞匯樹的關(guān)聯(lián)。5.根據(jù)權(quán)利要求1所述的一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,設(shè)定圖像庫的語義主題信息集,先采用人工標(biāo)注的方法將圖像庫中的圖片分類至語義主題信息集中的各語義主題信息;再利用Bayesian統(tǒng)計(jì)決策理論實(shí)現(xiàn)視覺詞匯層到語義信息層的映射。6.根據(jù)權(quán)利要求1所述的一種基于背景知識(shí)的層次語義模型圖像檢索方法,其特征在于,將搜索關(guān)鍵詞作為檢索屬性,分析其與原有形式背景屬性集的關(guān)系,如果所有檢索屬性屬于形式背景屬性集,則直接基于概念格模型進(jìn)行語義檢索;否則,則對領(lǐng)域知識(shí)的形式背景進(jìn)行動(dòng)態(tài)重構(gòu);進(jìn)一步通過相似度計(jì)算從屬性集中找出與每一個(gè)檢索屬性最為相似的對應(yīng)替換屬性,更新檢索屬性集。
【文檔編號】G06F17/30GK106021251SQ201510588932
【公開日】2016年10月12日
【申請日】2015年9月16日
【發(fā)明人】張樹坤
【申請人】展視網(wǎng)(北京)科技有限公司