專利名稱:一種基于快速智能禁忌搜索的圖像檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像檢索方法,尤其是涉及一種基于快速智能禁忌搜索的圖像檢索方法。
背景技術(shù):
基于內(nèi)容的圖像檢索是近幾年來計(jì)算機(jī)圖形圖像以及人工智能領(lǐng)域研究的熱點(diǎn)。 由于圖像具有形象、直觀、內(nèi)容豐富等特點(diǎn),接近人們的認(rèn)知方式,進(jìn)而成為不可或缺的多媒體內(nèi)容。如果沒有對(duì)圖像等多媒體數(shù)據(jù)有效存儲(chǔ)、檢索的方法,大量信息將淹沒在數(shù)據(jù)的海洋之中,而無法被人們識(shí)別和利用。因此,如何建立高效的圖像檢索機(jī)制成為迫切需要解決的問題。與日趨成熟的基于文字的圖像檢索方式相比,基于內(nèi)容的檢索方式更加符合人類對(duì)于圖像的認(rèn)知形式,并且能夠更加充分的利用到圖像本身所涵蓋的信息。雖然近些年來基于內(nèi)容的圖像檢索取得了一些成績(jī),但是距離滿足人們的使用需求還有較大的差距。 對(duì)基于內(nèi)容的檢索而言,最大的困難在于對(duì)圖像所包含的信息做出快速的,準(zhǔn)確的數(shù)字化描述以及進(jìn)行圖像所涉及的語義的識(shí)別。當(dāng)前,基于流形的圖像描述方式受到了廣泛的關(guān)注。其主要思想是將圖像的特征信息轉(zhuǎn)化為抽象的流形模型,進(jìn)而嵌入到特定維度的流形空間之中,尋找一種從抽象流行空間到特征空間的映射。例如將圖像的檢索問題轉(zhuǎn)化為在抽象流形空間的分類問題的做法。因?yàn)閳D像語義空間的維度很難被確定,語義表述的精確度也很難被界定,所以,從低層次的特征空間向高層次的語義空間做映射仍然是流形學(xué)習(xí)方法的難點(diǎn)。目前的檢索機(jī)制在做基于內(nèi)容的圖像匹配的過程中,查全率和查準(zhǔn)率相對(duì)比較偏低,用戶通過內(nèi)容檢索很難得到滿意的反饋效果。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種基于快速智能禁忌搜索的圖像檢索方法。本發(fā)明的目的可以通過以下技術(shù)方案來實(shí)現(xiàn)一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于,該方法包括以下步驟1)在圖像數(shù)據(jù)庫中定義幾何流形熵;2)通過快速智能禁忌搜索算法來獲得最優(yōu)回路0。pt ;3)將需要的檢索圖像Q插入最優(yōu)回路序列0。pt中,根據(jù)檢索圖片在最優(yōu)回路序列中插入的位置,重新計(jì)算插入后新回路序列的熵值,插入后的熵值較s。pt的變化為As,當(dāng) AS為最小時(shí),檢索圖像的插入點(diǎn)為其在最優(yōu)回路序列0。pt中的最終插入位置;4)根據(jù)歐幾里德距離排序檢索圖像Q在最優(yōu)回路序列0。pt中的鄰近圖像;5)將相似圖像反饋給用戶。所述的步驟1)定義幾何流形熵如下采用“數(shù)據(jù)的空間位置”和“流形的局部離散曲率”兩方面來描述一個(gè)流形,即幾何流形熵;具體來說,在m維的空間中,給定一組數(shù)據(jù)X= IxiIxi e Rm,i = 1,2, ... η},首先定義一個(gè)長(zhǎng)度為η并且沒有自交叉的回路,對(duì)于X的每一種這樣的回路根據(jù)連接點(diǎn)的下標(biāo)可以記錄為0 = (0l, O2, . . . on, O1),這時(shí)定義X關(guān)于回路序列O的幾何流形熵為S(X, 0) = P(X, 0)+G(X, 0)(1)如果嵌入流形的維度為一維,那么幾何流形熵的空間位置組成部分表示為
權(quán)利要求
1.一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于,該方法包括以下步驟1)在圖像數(shù)據(jù)庫中定義幾何流形熵;2)通過快速智能禁忌搜索算法來獲得最優(yōu)回路0。pt;3)將需要的檢索圖像Q插入最優(yōu)回路序列0。pt中,根據(jù)檢索圖片在最優(yōu)回路序列中插入的位置,重新計(jì)算插入后新回路序列的熵值,插入后的熵值較S-的變化為AS,當(dāng)AS為最小時(shí),檢索圖像的插入點(diǎn)為其在最優(yōu)回路序列0。pt中的最終插入位置;4)根據(jù)歐幾里德距離排序檢索圖像Q在最優(yōu)回路序列0。pt中的鄰近圖像;5)將相似圖像反饋給用戶。
2.根據(jù)權(quán)利要求1所述的一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于, 所述的步驟1)定義幾何流形熵如下采用“數(shù)據(jù)的空間位置”和“流形的局部離散曲率”兩方面來描述一個(gè)流形,即幾何流形熵;具體來說,在m維的空間中,給定一組數(shù)據(jù)X= IxiIxi e Γ,i = 1,2, ... η},首先定義一個(gè)長(zhǎng)度為η并且沒有自交叉的回路,對(duì)于X的每一種這樣的回路根據(jù)連接點(diǎn)的下標(biāo)可以記錄為0 = (0l, O2, . . . on, O1),這時(shí)定義X關(guān)于回路序列O的幾何流形熵為S(X, 0) = P(X, 0)+G(X, 0)(1)如果嵌入流形的維度為一維,那么幾何流形熵的空間位置組成部分表示為
3.根據(jù)權(quán)利要求1所述的一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于, 所述的步驟2、通過快速智能禁忌搜索算法來獲得最優(yōu)回路Oopt步驟如下(1)初始化禁忌時(shí)間、變異時(shí)間和禁忌列表H,設(shè)置當(dāng)前回路序列和熵值為Ocm= O, Scur =S(X, 0),設(shè)定最優(yōu)序列和熵值為0。pt = Ocur, Sopt = Scur ;(2)根據(jù)Ocm構(gòu)建鄰接回路集,并且根據(jù)禁忌列表H確定候選集合CSS(Ocot),從 CSS(Ocur)中確定子集L ;(3)將子集L傳輸?shù)綀D形處理器中,并行計(jì)算每條回路的熵值,找出擁有最小熵值Smin對(duì)應(yīng)的序列Omin,傳輸Smin和Omin到中央處理器;(4)如果S· > Smin,更新 0· = Omin,Scur = Smin,否則,不更新;(5)更新禁忌列表H,如果熵值收斂進(jìn)入下一步;否則返回步驟O),進(jìn)行下一次迭代;(6)如果S。pt> Scm,那么更新0。pt = Ocur, Sopt = Scot,否則不更新;(7)如果變異時(shí)間為零,進(jìn)入下一步;否則對(duì)序列Ocot執(zhí)行隨機(jī)變換并重新計(jì)算熵值 Scur= (X,0。J,然后變異時(shí)間遞減并返回步驟O);(7)返回最優(yōu)回路序列0。pt和熵值S。pt。
4.根據(jù)權(quán)利要求3所述的一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于, 所述的鄰接回路集定義如下如果一條回路可以由另一條回路直接變換而來,那么稱此回路為原回路的鄰接回路,所有的鄰接回路組成的集合為鄰接回路集。
5.根據(jù)權(quán)利要求3所述的一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于, 所述的禁忌列表H為記錄錄所有已經(jīng)實(shí)施過的變換,該變換包括定義為三方面(1)交換原回路中任意兩個(gè)數(shù)據(jù)點(diǎn)的位置;(2)將原回路中的一個(gè)數(shù)據(jù)點(diǎn)插入到其他任意位置;(3)反轉(zhuǎn)原回路中的任意一個(gè)序列片段。
6.根據(jù)權(quán)利要求3所述的一種基于快速智能禁忌搜索的圖像檢索方法,其特征在于, 所述的禁忌時(shí)間為每一個(gè)變換在列表中被禁忌的時(shí)間。
全文摘要
本發(fā)明涉及一種基于快速智能禁忌搜索的圖像檢索方法,該方法包括以下步驟1)在圖像數(shù)據(jù)庫中定義幾何流形熵;2)通過快速智能禁忌搜索算法來獲得最優(yōu)回路Oopt;3)將需要的檢索圖像Q插入最優(yōu)回路序列Oopt中,根據(jù)檢索圖片在最優(yōu)回路序列中插入的位置,重新計(jì)算插入后新回路序列的熵值,插入后的熵值較Sopt的變化為ΔS,當(dāng)ΔS為最小時(shí),檢索圖像的插入點(diǎn)為其在最優(yōu)回路序列Oopt中的最終插入位置;4)根據(jù)歐幾里德距離排序檢索圖像Q在最優(yōu)回路序列Oopt中的鄰近圖像;5)將相似圖像反饋給用戶。與現(xiàn)有技術(shù)相比,本發(fā)明具有可以有效地解決大規(guī)模的優(yōu)化組合問題,并且采用圖形處理器強(qiáng)大的并行計(jì)算技術(shù)使得效率得到了極大提升等優(yōu)點(diǎn)。
文檔編號(hào)G06F17/30GK102193937SQ201010122720
公開日2011年9月21日 申請(qǐng)日期2010年3月12日 優(yōu)先權(quán)日2010年3月12日
發(fā)明者張超, 李宏宇, 賈金原 申請(qǐng)人:同濟(jì)大學(xué)