亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于改進(jìn)bow算法的相似圖片搜索方法

文檔序號(hào):10489050閱讀:457來源:國(guó)知局
一種基于改進(jìn)bow算法的相似圖片搜索方法
【專利摘要】本發(fā)明涉及一種基于改進(jìn)BOW算法的相似圖片搜索方法,大規(guī)模圖片庫(kù)中相似圖片的快速和準(zhǔn)確的搜索一直是互聯(lián)網(wǎng)圖像處理領(lǐng)域一個(gè)非常重要的研究方向,本發(fā)明給定一張圖片,在線實(shí)時(shí)在海量圖片集中搜索與其相似或含有相同主要物體或區(qū)域的圖片?,F(xiàn)有的方法一方面實(shí)時(shí)性比較低,另一方面準(zhǔn)確率也很難得到保證。在圖片庫(kù)中圖片存在旋轉(zhuǎn)、尺度拉伸等變化的情況下很難實(shí)現(xiàn)。本發(fā)明可以在圖片存在旋轉(zhuǎn)、尺度變化的情況下實(shí)現(xiàn)相似圖片的檢索,并且可以保證檢索的實(shí)時(shí)性和準(zhǔn)確率,這也為本發(fā)明的實(shí)踐應(yīng)用提供了理論基礎(chǔ)。
【專利說明】
一種基于改進(jìn)BOW算法的相似圖片搜索方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)字圖像處理和檢索算法技術(shù)領(lǐng)域,具體涉及一種基于改進(jìn)BOW算法 的相似圖片搜索方法,
【背景技術(shù)】
[0002] 大規(guī)模圖片集中相似圖片的檢索是現(xiàn)今計(jì)算機(jī)視覺領(lǐng)域一個(gè)非常重要的研究方 向。其主要需要解決的問題是給定一張圖片,在圖片集中在線搜索與其外觀相似或含有相 同主要物體或區(qū)域的圖片。該研究方向在現(xiàn)實(shí)中已經(jīng)有了一些相關(guān)的應(yīng)用,比如,百度推出 的以圖識(shí)圖和淘寶根據(jù)圖片搜索商品的應(yīng)用。該問題的難點(diǎn)在于:實(shí)時(shí)性和準(zhǔn)確率的要求 比較高;快速判別圖像相似性的算法。
[0003] 近年來大規(guī)模圖片庫(kù)中相似圖片的搜索研究已經(jīng)取得了一定的成果,其中最經(jīng)典 的就是J.Philbin等人提出的Bag of Visual Words算法(BOW)(參考文獻(xiàn)[l]J.philbin, 0·Chum,M·I sard,J·Si vie,and A .Zisserman.Object retrieval with large vocabularies and fast spatial matching. In (^?1?,2007.809,810,812,814),該算法首 先對(duì)圖片集中的每一張圖片提取一定數(shù)量的SIFT點(diǎn),對(duì)所有圖片中的SIFT進(jìn)行k-means聚 類,根據(jù)得到的聚類中心,將每張圖片中的SIFT點(diǎn)量化到最近鄰的聚類中心處,這樣,每張 圖片就可以使用一個(gè)高維向量表示。而兩張圖片的相似性度量標(biāo)準(zhǔn)就是表示這兩張圖片的 向量的相似性。該算法是目前使用最為廣泛的相似圖片檢索算法,經(jīng)過近幾年的使用證明 了該方法的實(shí)用性,并且在實(shí)際系統(tǒng)中已經(jīng)有所應(yīng)用。此后,根據(jù)BOW算法的思想,一些研究 對(duì)BOV算法進(jìn)行了改進(jìn):Divid Nister和Henrik Arewenius等人(參考文獻(xiàn)[2]David Nister and Henrik Stewenius. Scalable Recognition with a Vocabulary Tree. In CVPR,2006)在SIFT點(diǎn)聚類算法部分提出了 一種分層的聚類算法(HKM)來取代原有的k-means聚類算法,該改進(jìn)的主要目的在于提高聚類的速度,但該方法會(huì)在一定程度上降低聚 類的精度,如果將聚類算法在線下進(jìn)行,則應(yīng)該以準(zhǔn)確率作為最重要指標(biāo);Zhong Wu(參考 文南犬[3]Zhong Wu,Qifa Ke1Jian Sun,Heung-Yeung Shum.A multi-Sample,Multi-Tree Approach to Bag-〇f-ffords Image Representation for Image Retrieval. In ICCV, 2009)等人提出了一種采用多棵聚類樹進(jìn)行SIFT點(diǎn)的聚類表示,并將每個(gè)SIFT點(diǎn)量化到多 棵樹的相應(yīng)聚類中心的方法,但該算法在量化時(shí)存在過分依賴于閾值的問題,導(dǎo)致實(shí)際結(jié) 果在閾值不同時(shí)差距很大。Christoph H.Lampert等人(參考文獻(xiàn)[4] Christoph H.Lampert,Matthew B.Blaschko,and Thomas Hofmann.Beyond Sliding Windows:Object Localization by Efficient Subwindow Search. In CVPR 2008)在考慮圖片中相似物體 的檢測(cè)時(shí)引入了滑動(dòng)窗口的方法,該方法可以在一定程度上提高檢測(cè)的準(zhǔn)確率,但由于該 方法在每幅圖片中需要提取大量窗口導(dǎo)致時(shí)間復(fù)雜度比高,在給定一張圖片檢索與其相似 的圖片時(shí)很難達(dá)到實(shí)時(shí);另外一些研究主要考慮到提到的SIFT點(diǎn)的空間信息:Xiaoyu Wang 和Ming Yang(參考文南犬[5]Xiaoyu Wang,Ming Yang,Timothee Cour,Shenghuo Zhu,Kai Yu,and Tony X.Han. Contextual Weighting for Vocabulary Tree based Image Retrieval. In ICCV,2011)等人指出在兩幅圖片中的SIFT點(diǎn)匹配時(shí)考慮該點(diǎn)周圍一定半徑 內(nèi)點(diǎn)的尺度和角度信息;Svetlana Lazebnik等人(參考文獻(xiàn)[6] Svetlana Lazebnik, Cordelia Schmid,Jean Ponce.Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories · In CVPR,2006)提出了一種經(jīng)典的空間金 字塔算法(SPM),該算法考慮到圖片中SIFT的位置排布,將圖片分割成不同尺度的圖像塊, 對(duì)每一層中的每一圖像塊分別進(jìn)行匹配,但該算法的效果主要體現(xiàn)在場(chǎng)景分類上,對(duì)相同 物體和區(qū)域的檢索能力有限;另外一種考慮空間信息的算法是BOW算法(參考文獻(xiàn)[7] Yimeng Zhang,Zhaoyin Jia,Tsuhan Chen. Image Retrieval with Geometry-Preserving Visual Phrases. In CVPR,2011):該算法認(rèn)為只有量化后SIFT點(diǎn)所屬類別相同并且位置關(guān) 系相同的點(diǎn)才屬于匹配上點(diǎn)的點(diǎn)。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明要解決技術(shù)問題為:克服現(xiàn)有技術(shù)的不足,提供一種基于改進(jìn)BOW算法的相 似圖片搜索方法,在經(jīng)典的BOW算法的基礎(chǔ)之上通過考慮匹配SIFT點(diǎn)之間的較強(qiáng)的位置關(guān) 系去除不滿足幾何關(guān)系的匹配點(diǎn),并通過定義一個(gè)新的計(jì)算公式對(duì)相似度進(jìn)行衡量,并提 高了該算法的準(zhǔn)確率。該方法具有旋轉(zhuǎn)和尺度不變性,因此對(duì)于圖片中物體的形變更加魯 邦,可以在一定程度上提高檢索的準(zhǔn)確率。
[0005] 本發(fā)明解決上述技術(shù)問題采用的技術(shù)方案為:一種基于改進(jìn)BOW算法的相似圖片 搜索方法,在經(jīng)典bag of words算法的基礎(chǔ)上考慮匹配點(diǎn)之間的幾何關(guān)系,去除不滿足幾 何關(guān)系的匹配點(diǎn),并在相似度量函數(shù)中體現(xiàn)出來,從而提高了檢索的準(zhǔn)確率,具體實(shí)現(xiàn)步驟 如下:
[0006] 步驟(1)、對(duì)大規(guī)模圖片庫(kù)中的每張圖片進(jìn)行SIFT特征點(diǎn)的提取,并記錄各自的位 置坐標(biāo)。
[0007] 步驟(2)、對(duì)步驟(1)得到的SIFT點(diǎn)進(jìn)行k-means聚類,得到一定數(shù)量的聚類中心, 即字典。
[0008] 步驟(3 )、將圖片庫(kù)中每張圖片中提取到的SIFT點(diǎn)量化到步驟(2)中的聚類中心, 以字典中的單詞(即聚類中心)為索引,記錄包含該單詞的圖片和該SIFT點(diǎn)的位置坐標(biāo),即 生成一個(gè)Inverted file。
[0009] 步驟(4)、對(duì)于待檢索圖片提取該圖片中的SIFT點(diǎn),并且根據(jù)步驟(2)中的聚類中 心進(jìn)行量化。
[0010] 步驟(5)、對(duì)待檢索圖片和圖片庫(kù)中的圖片計(jì)算屬于同一類別的SIFT點(diǎn)(即量化到 同一個(gè)聚類中心的SIFT點(diǎn))的數(shù)量。
[0011] 步驟(6)、判斷是否滿足幾何關(guān)系,并在度量函數(shù)中加上相應(yīng)的得分,否則不計(jì)分。
[0012] 步驟(7)、對(duì)最后的得分進(jìn)行排序,得分越高表示待檢索圖片和圖片庫(kù)的該張圖片 越相似,并返回結(jié)果。
[0013] 本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:
[0014] (1)、在建立的索引表中添加了每個(gè)點(diǎn)的位置信息,可以將匹配點(diǎn)之間的位置關(guān)系 進(jìn)行比較,利用倒排索引表可以極大地提高檢索速度避免重復(fù)的計(jì)算工作。
[0015] (2)、考慮了待檢索圖片和圖片庫(kù)中的圖片之間匹配上的特征點(diǎn)之間的位置關(guān)系, 只有滿足相似的幾何關(guān)系的特征點(diǎn)才判斷為真正的匹配點(diǎn),從而去除了一些由于量化所造 成的誤匹配點(diǎn),提高了算法的魯棒性,從而可以獲得更高的準(zhǔn)確率。
[0016] (3)、相似度量函數(shù)綜合考慮了字典中單詞的頻率和特征代表性,并進(jìn)行了歸一化 的處理,從而能夠解決各張圖片中提取到的特征點(diǎn)數(shù)量不一致的問題,使結(jié)果更具有代表 性,也更加準(zhǔn)確。
【附圖說明】
[0017] 圖1為本發(fā)明方法實(shí)現(xiàn)流程圖;
[0018]圖2表示相似圖片中對(duì)應(yīng)特征點(diǎn)可以匹配上的三角形,其中圖2(a)為待檢索圖片、 (b)為圖片庫(kù)中原圖片。
【具體實(shí)施方式】
[0019] 下面結(jié)合附圖以及【具體實(shí)施方式】進(jìn)一步說明本發(fā)明。
[0020] 如圖1所示,本發(fā)明一種基于改進(jìn)BOW算法的相似圖片搜索方法的具體步驟如下:
[0021] 1.提取SIFT特征
[0022] 利用SIFT算法,從圖片庫(kù)中的每張圖片中提取一定數(shù)量的SIFT點(diǎn),SIFT算法是一 種提取局部特征的算法,在尺度空間尋找極值點(diǎn),提取位置,尺度,旋轉(zhuǎn)不變量,并在尋找到 的極值點(diǎn)計(jì)算4x4范圍內(nèi),每塊區(qū)域內(nèi)8個(gè)方向的灰度梯度直方圖,合并后可以得到128維向 量,這樣每個(gè)特征點(diǎn)就可以使用128維向量進(jìn)行表示。這樣的特征點(diǎn)具有高度的區(qū)分性,所 以可以代表不同圖片中的不同信息,這樣每張圖片可以使用一定數(shù)量的128SIFT點(diǎn)向量進(jìn) 行表示。
[0023] 2.生成字典
[0024]將圖片集中所有圖片中提取到的SIFT點(diǎn)進(jìn)行整合,并進(jìn)行k-means聚類,生成一定 數(shù)量的聚類中心,將這些128維向量作為字典。
[0025] k-means算法主要分為兩個(gè)步驟:
[0026] 步驟(1)隨機(jī)選取k個(gè)聚類質(zhì)心點(diǎn)(cluster centroids)為μι,y2,"ykERn。
[0027] 步驟(2)對(duì)于每一個(gè)樣例i,使用如下公式計(jì)算其應(yīng)該屬于的類:
[0028]
[0029]
[0030]
[0031] 當(dāng)所有樣例所屬類別不發(fā)生改變之后停止,否則重復(fù)步驟(2)。
[0032] 但該算法的缺點(diǎn)是在數(shù)據(jù)量大,并且數(shù)據(jù)的維數(shù)比較高時(shí)收斂的速度比較慢,計(jì) 算復(fù)雜度比較高,因此在圖搜索這種大數(shù)據(jù)量且屬于高維數(shù)據(jù)的聚類時(shí)并不適用,兩種改 進(jìn)的算法如下:
[0033] I)HKM(Hierarchical k-means)算法:該算法對(duì)k-means算法進(jìn)行了改進(jìn),將聚類 過程分層化,即第一層只取少量的聚類中心,將大量數(shù)據(jù)聚類到少量的中心點(diǎn),然后在每一 類別的數(shù)據(jù)中繼續(xù)進(jìn)行聚類操作,這種分層的聚類算法極大的提高了聚類速度,但其存在 嚴(yán)重的缺點(diǎn):即如果在低層次聚類時(shí)被分到錯(cuò)誤的類別,在后續(xù)的高層次聚類中無(wú)法進(jìn)行 修正。因此會(huì)在一定程度上影響聚類的準(zhǔn)確性,也會(huì)導(dǎo)致后續(xù)量化的偏差。
[0034] 2)AKM(Approximate k-means)算法:在典型的k-means算法中,主要的計(jì)算時(shí)間花 費(fèi)在計(jì)算點(diǎn)和最近鄰的聚類中心的距離上,AKM算法就是使用近似最近鄰查找取代原有的 精確查找,并且在每次迭代之前在聚類中心處建立含有8棵k-d tree的隨機(jī)森林來提高計(jì) 算的速度。實(shí)驗(yàn)證明AKM算法以犧牲少量計(jì)算精度的代價(jià)極大的提高了計(jì)算的速度,將計(jì)算 復(fù)雜度由O(NK)降為〇(N*log(K)),其中N為需要聚類的點(diǎn)的數(shù)目,K為聚類中心的數(shù)目。 [0035] 3.圖片的量化
[0036] 通過上一步生成的字典就可以將SIFT點(diǎn)量化到聚類中心。量化的過程實(shí)際上是最 近鄰匹配的過程,仍然使用近似最近鄰匹配的思想,這樣可以提高計(jì)算的速度并且可以和 上一步的聚類達(dá)成一致。至此,每幅圖片可以使用一個(gè)維數(shù)為該幅圖片提取到的SIFT點(diǎn)的 數(shù)目的高維向量表示。
[0037] 4. Inverted File的建立
[0038] 倒排索引文件是一種面向單詞的索引機(jī)制,每個(gè)文件都可以用一系列關(guān)鍵字來表 示。一個(gè)倒排索引主要由詞匯表(也叫索引項(xiàng))和事件表(也叫文件鏈表)這兩部分組成。詞 匯表是用來存放分詞詞典的,通常稱存放詞匯表的文件為索引文件;事件表是用來存放這 個(gè)文件中對(duì)應(yīng)詞匯表中詞匯出現(xiàn)的位置和次數(shù)的,通常稱存放出現(xiàn)位置的文件為位置文 件。
[0039]下面舉例說明建立Inverted file的方法,例如經(jīng)過處理后得到三個(gè)文本中的關(guān) 鍵字:
[0040]文章I: [i][am][student][i][come][chengdu]
[0041 ]文章2: [my] [father] [is] [teacher] [i] [am] [student]
[0042] 文章3: [chengdu] [is] [my] [hometown] [my] [father] [hometown] [is] [wuhan]
[0043] 上面的對(duì)應(yīng)關(guān)系是順排的,8卩"文章號(hào)4關(guān)鍵字",倒排處理為"關(guān)鍵字4文章號(hào)"。 文章1、2、3經(jīng)過倒排后變成如表1所示:
[0044] 表1倒排文件索引方式
[0046] 這樣存儲(chǔ)的方式有利于后期的檢索時(shí)速度的提升。
[0047] 5 .TF、IDF 的確定
[0048] TF_IDF(term frequency-inverse document frequency)是一種用于資訊檢索與 資訊探勘的常用加權(quán)技術(shù)。TF-IDF的主要思想是:如果一個(gè)單詞在某一文本中出現(xiàn)的頻率 較高,但在其他的文本中出現(xiàn)的頻率很低,可以將該單詞作為區(qū)分本文的重要單詞,即賦予 它更高的權(quán)重。另一方面,如果單詞在某一文本中出現(xiàn)的頻率很高,但在其他文本中出現(xiàn)的 頻率仍然很高,則該單詞的區(qū)分度不高。TF詞頻(Term Frequency),表示單詞在文本中出現(xiàn) 的頻率,IDF逆向文件頻率(Inverse Document Frequency)表示出現(xiàn)某單詞的文本占全部 文本的比例。經(jīng)過上面的分析可知,某單詞的TF越高,IDF越低,則其用于區(qū)分文本的區(qū)分度 越高。某單詞i在文本i中的TF表示為TF i, i,則有:
[0049]
[0050]
[0051]
[0052] 其中IDl:語(yǔ)料庫(kù)中的文件總數(shù)
[0053] 最后計(jì)算TF,IDF的乘積,即:
[0054] TFIDFi,j = TFi,jXIDFi
[0055] 在計(jì)算相似度時(shí),需要考慮能夠匹配上的點(diǎn)的TF-IDF,以提高度量函數(shù)的準(zhǔn)確性 和合理性。因此在Inverted file的存儲(chǔ)時(shí)需要考慮某一單詞出現(xiàn)的文本序號(hào),以及在該文 本中出現(xiàn)的次數(shù),對(duì)于步驟4中的例子,Inverted File應(yīng)該表示為:
[0056] 表2增加TF-IDF信息的倒排文件索引方式

[0059] 因此,TF等于[]中的數(shù)字,IDF等于該單詞出現(xiàn)的文章數(shù)和總文章數(shù)的比值。對(duì)于 圖片庫(kù)來說,還需要在具體的每一項(xiàng)中添加位置信息。
[0060] 表3圖片庫(kù)中的Inverted FiIe的格式
[0062] 6.相似度的度量
[0063] 1)、對(duì)圖片庫(kù)中的每張圖片的score置為0;
[0064] 2)、對(duì)于待檢索圖片中的包含的每一個(gè)單詞j,查找Inverted file中包含該單詞 的圖片,對(duì)于列表中的每張圖片存儲(chǔ)類別相同的點(diǎn)的坐標(biāo),即為每張圖片存儲(chǔ)一張記錄匹 配點(diǎn)位置坐標(biāo)信息的表。
[0065] 3)、對(duì)于圖片i,取3的組合,計(jì)算原圖中三點(diǎn)構(gòu)成三角形和圖片i中構(gòu)成三角形是 否相似,如果在一定的閾值范圍內(nèi)可以認(rèn)定為相似,如圖2所示,我們使用下面的公式增加 該張圖片的徨令.
[0066]
[0067] 10?^」1、10?。2、10?^分別表示這三個(gè)點(diǎn)的10?。當(dāng)遍歷了待檢索圖片中的所有 SIFT點(diǎn)后,每張圖片的S cor e就被確定下來了。
[0068] 4)、由于每張圖片中提取到的SIFT點(diǎn)的數(shù)量不同,需要進(jìn)行歸一化,SP :
[0069]
[0070]其中I |q| I表示待檢索圖片中的特征向量的L2范數(shù),I IcUl I表示圖片庫(kù)中第i張圖 片的特征向量的1^范數(shù)。
[0071] 5)、最后根據(jù)得分的高低進(jìn)行排列,得分越高說明該圖片與待檢索的圖片越相似。
[0072] 提供以上實(shí)施例僅僅是為了描述本發(fā)明的目的,而并非要限制本發(fā)明的范圍。本 發(fā)明的范圍由所附權(quán)利要求限定。不脫離本發(fā)明的精神和原理而做出的各種等同替換和修 改,均應(yīng)涵蓋在本發(fā)明的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于改進(jìn)BOW算法的相似圖片捜索方法,其特征在于:該方法包括如下步驟: 步驟(1)、對(duì)大規(guī)模圖片庫(kù)中的每張圖片進(jìn)行SIFT特征點(diǎn)的提取,并記錄各自的位置坐 標(biāo); 步驟(2)、對(duì)步驟(1)得到的SIFT點(diǎn)進(jìn)行k-means聚類,得到一定數(shù)量的聚類中屯、,即字 典,聚類中屯、的數(shù)量由圖片集和提取到的SIFT點(diǎn)的數(shù)量確定,使用改進(jìn)的k-means算法AKM 算法,W犧牲少量計(jì)算精度的代價(jià)極大的提高了計(jì)算的速度; 步驟(3)、將圖片庫(kù)中每張圖片中提取到的SIFT點(diǎn)量化到步驟(2)中的聚類中屯、,運(yùn)里 為了提高速度,使用近似最近鄰的聚類算法,在保證精度的情況下極大地提高量化的速度, 運(yùn)樣每張圖片可W使用一個(gè)由量化結(jié)果組成的高維向量表示,W字典中的單詞即聚類中屯、 為索引,記錄包含該單詞的圖片和該SIFT點(diǎn)的位置坐標(biāo),即生成一個(gè)Inveded File; 步驟(4)、對(duì)于待檢索圖片提取該章圖片中的SIFT點(diǎn),并且根據(jù)步驟(2)中的聚類中屯、 進(jìn)行量化,運(yùn)樣待檢索圖片也使用一個(gè)高維的向量進(jìn)行表示; 步驟(5)、對(duì)待檢索圖片和圖片庫(kù)中的圖片計(jì)算屬于同一類別的SIFT點(diǎn)即量化到同一 個(gè)聚類中屯、的SIFT點(diǎn)的數(shù)量; 步驟(6)、對(duì)于屬于同一類別的SIFT點(diǎn)取任意的Ξ點(diǎn)進(jìn)行組合,并計(jì)算運(yùn)兩張圖片中的 Ξ點(diǎn)組成的Ξ角形的相似性,對(duì)于滿足一定闊值的運(yùn)Ξ個(gè)SIFT點(diǎn),在度量函數(shù)中加上相應(yīng) 的得分,否則不計(jì)分; 步驟(7)、對(duì)最后的得分進(jìn)行排序,得分越高表示待檢索圖片和圖片庫(kù)的該張圖片越相 似,并返回結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于改進(jìn)BOW算法的相似圖片檢索方法,其特征在于:所述步 驟(6)中改進(jìn)算法中對(duì)兩張圖片的相似性的判別規(guī)則如下: 首先記錄下兩張圖片A和B中屬于同一類別的SIFT點(diǎn)的坐標(biāo),假設(shè)有N點(diǎn),在N個(gè)點(diǎn)任意 取Ξ個(gè)點(diǎn)組成一個(gè)Ξ角形,計(jì)算A中的Ξ角形和B中的Ξ角形的相似性,并且保證A、B中相同 類別的點(diǎn)作為Ξ角形的頂角時(shí)角度的一致性,只有在滿足W上條件的基礎(chǔ)上,才判定Ξ角 形的Ξ個(gè)頂點(diǎn)屬于有效匹配,否則屬于無(wú)效的匹配,不記入最終的相似度度量函數(shù)。3. 根據(jù)權(quán)利要求1所述的基于改進(jìn)BOW算法的相似圖片檢索方法,其特征在于:所述步 驟(6)中具體步驟如下: 步驟1)、對(duì)圖片庫(kù)中的每張圖片的score置為0; 步驟2)、對(duì)于待檢索圖片中的包含的每一個(gè)單詞j,查找Inveded file中包含該單詞 的圖片,對(duì)于列表中的每張圖片存儲(chǔ)類別相同的點(diǎn)的坐標(biāo),即為每張圖片存儲(chǔ)一張記錄匹 配點(diǎn)位置坐標(biāo)信息的表; 步驟3)、對(duì)于圖片i,取3的組合,計(jì)算原圖中Ξ點(diǎn)構(gòu)成Ξ角形和圖片i中構(gòu)成Ξ角形是 否相似,如果在一定的闊值范圍內(nèi)可W認(rèn)定為相似,使用下面的公式增加該張圖片的得分: 化' (/)+ = /々巧。+議巧。+ /公巧口 IDFi,ji、IDFi,j2、IDFij3分別表示運(yùn)Ξ個(gè)點(diǎn)的IDF,當(dāng)遍歷了待檢索圖片中的所有SIFT點(diǎn) 后,每張圖片的score就被確定下來了; 步驟4)、由于每張圖片中提取到的SIFT點(diǎn)的數(shù)量不同,需要進(jìn)行歸一化,即:其中Μ q||表示待檢索圖片中的特征向量的L2范數(shù),Μ dill表示圖片庫(kù)中第i張圖片的 特征向量的L2范數(shù); 步驟5)、最后根據(jù)得分的高低進(jìn)行排列,得分越高說明該圖片與待檢索的圖片越相似。
【文檔編號(hào)】G06K9/62GK105843925SQ201610180016
【公開日】2016年8月10日
【申請(qǐng)日】2016年3月23日
【發(fā)明人】凌強(qiáng), 趙敏達(dá), 李峰
【申請(qǐng)人】中國(guó)科學(xué)技術(shù)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1