一種圖像搜索引擎的生成方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及圖像搜索,更具體地,涉及一種圖像搜索引擎的生成方法及系統(tǒng)。
【背景技術(shù)】
[0002]基于局部特征的圖像搜索引擎可以基于給定的一張圖像,在海量圖像集合中找到與其相似的圖像,是目前主流的基于內(nèi)容的圖像搜索引擎。
[0003]圖像搜索引擎和文本搜索引擎的框架是大體類似的,但其中最重要的一個(gè)區(qū)別就是由“視覺(jué)詞”代替“文本詞”。在基于局部特征的圖像搜索引擎中,需要將圖像轉(zhuǎn)化為“視覺(jué)詞”列表,然后再按視覺(jué)詞對(duì)圖像建立倒排索引(inverted index)。
[0004]近年來(lái),基于局部特征的圖像搜索引擎開(kāi)始逐漸走入商業(yè)應(yīng)用,有通用領(lǐng)域和一些細(xì)分領(lǐng)域,其中一個(gè)重要細(xì)分領(lǐng)域就是針對(duì)電子商務(wù)網(wǎng)站的商品圖像搜索。
[0005]商品圖像和一般的圖像不同,他分為商品區(qū)域和非商品區(qū)域。比如圖1A和圖1B中的兩幅圖像中存在相同的文字型徽標(biāo)(logo),圖2A和圖2B中的兩幅圖像中存在相同的“偽造背景”,圖3A和圖3B中的兩幅圖像中存在相同的圖案型logo。在使用通用的圖像搜索引擎進(jìn)行商品圖像搜索時(shí),可能會(huì)因?yàn)榉巧唐穮^(qū)域的相似,導(dǎo)致錯(cuò)誤的召回。
[0006]通過(guò)識(shí)別圖像中的文字區(qū)域,排除這些區(qū)域在圖像匹配中的作用,能解決一部分由于文字型logo導(dǎo)致的問(wèn)題,但是對(duì)“偽造背景”和圖案型logo的去除效果不好。
[0007]通過(guò)識(shí)別圖像中的商品主體,在圖像匹配的過(guò)程中,僅使用主體上的圖像信息,也有一定效果。但是這個(gè)方案無(wú)法解決主體被logo部分遮擋的問(wèn)題,同時(shí)現(xiàn)有的商品主體區(qū)域識(shí)別都無(wú)法達(dá)到一個(gè)足夠準(zhǔn)確率的效果。
[0008]對(duì)于其他提供者提供的圖像,如果圖像的非主體區(qū)域相同或相似,現(xiàn)有方法也不能夠有效地去除這些非主體區(qū)域?qū)λ阉鞯挠绊憽?br>
【發(fā)明內(nèi)容】
[0009]本申請(qǐng)要解決的技術(shù)問(wèn)題是提供一種圖像搜索引擎的生成方法及系統(tǒng),可以有效避免圖像的非主體區(qū)域?qū)λ阉鞯挠绊憽?br>[0010]為了解決上述問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N圖像搜索引擎的生成方法,包括:
[0011]基于視覺(jué)詞庫(kù),確定待索引圖像各自的視覺(jué)詞集合;
[0012]根據(jù)所述待索引圖像的提供者信息,對(duì)每一提供者,將該提供者提供的所有待索引圖像作為一組,在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,然后對(duì)該組待索引圖像各自的視覺(jué)詞集合分別進(jìn)行修正,從中去除該提供者關(guān)聯(lián)的停用視覺(jué)詞;
[0013]生成圖像搜索引擎時(shí),將所述待索引圖像修正后的視覺(jué)詞集合加入到所述圖像搜索引擎的倒排索引中。
[0014]較佳地,
[0015]所述在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,包括:
[0016]確定該組待索引圖像各自的視覺(jué)詞集合Hk中的每一視覺(jué)詞,其中,k=0,I,…,K,K為該組待索引圖像的圖像數(shù)目;
[0017]對(duì)Hk中的每一視覺(jué)詞,統(tǒng)計(jì)包含該視覺(jué)詞的Hk的個(gè)數(shù),如果該個(gè)數(shù)大于等于設(shè)定的次數(shù)閾值,則將該視覺(jué)詞確定為該提供者關(guān)聯(lián)的停用視覺(jué)詞。
[0018]較佳地,
[0019]所述在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,包括:
[0020]確定該組待索引圖像各自的視覺(jué)詞集合Hk中的每一視覺(jué)詞,其中,k=0, I,…,K,K為該組待索引圖像的圖像數(shù)目;
[0021]對(duì)Hk中的每一視覺(jué)詞,統(tǒng)計(jì)包含該視覺(jué)詞的Hk的個(gè)數(shù)并計(jì)算該個(gè)數(shù)與K的比值,如果該比值大于等于設(shè)定的比例閾值,則將該視覺(jué)詞確定為該提供者關(guān)聯(lián)的停用視覺(jué)詞。
[0022]較佳地,
[0023]所述在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞之前,還包括:
[0024]確定該組待索引圖像的圖像數(shù)目,判斷該圖像數(shù)目是否大于等于統(tǒng)計(jì)所需的最小數(shù)目,如果是,進(jìn)行所述視覺(jué)詞的統(tǒng)計(jì)和判斷,如果否,不再進(jìn)行所述視覺(jué)詞的統(tǒng)計(jì)和判斷。
[0025]較佳地,
[0026]所述待索引圖像為待索引商品圖像,所述提供者為提供所述待索引商品圖像的店鋪。
[0027]相應(yīng)地,本申請(qǐng)還提供了一種圖像搜索引擎的生成系統(tǒng),包括:
[0028]視覺(jué)詞生成模塊,用于基于視覺(jué)詞庫(kù),確定待索引圖像各自的視覺(jué)詞集合;
[0029]視覺(jué)詞修正模塊,用于根據(jù)所述待索引圖像的提供者信息,對(duì)每一提供者,將該提供者提供的所有待索引圖像作為一組,在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,然后對(duì)該組待索引圖像各自的視覺(jué)詞集合分別進(jìn)行修正,從中去除該提供者關(guān)聯(lián)的停用視覺(jué)詞;
[0030]搜索引擎生成模塊,用于在生成圖像搜索引擎時(shí),將所述待索引圖像修正后的視覺(jué)詞集合加入到所述圖像搜索引擎的倒排索引中。
[0031]較佳地,
[0032]所述視覺(jué)詞修正模塊在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,包括:
[0033]確定該組待索引圖像各自的視覺(jué)詞集合Hk中的每一視覺(jué)詞,其中,k=0, I,…,K,K為該組待索引圖像的圖像數(shù)目;
[0034]對(duì)Hk中的每一視覺(jué)詞,統(tǒng)計(jì)包含該視覺(jué)詞的Hk的個(gè)數(shù),如果該個(gè)數(shù)大于等于設(shè)定的次數(shù)閾值,則將該視覺(jué)詞確定為該提供者關(guān)聯(lián)的停用視覺(jué)詞。
[0035]較佳地,
[0036]所述視覺(jué)詞修正模塊在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞,包括:
[0037]確定該組待索引圖像各自的視覺(jué)詞集合Hk中的每一視覺(jué)詞,其中,k=0, I,…,K,K為該組待索引圖像的圖像數(shù)目;
[0038]對(duì)Hk中的每一視覺(jué)詞,統(tǒng)計(jì)包含該視覺(jué)詞的Hk的個(gè)數(shù)并計(jì)算該個(gè)數(shù)與K的比值,如果該比值大于等于設(shè)定的比例閾值,則將該視覺(jué)詞確定為該提供者關(guān)聯(lián)的停用視覺(jué)詞。
[0039]較佳地,
[0040]所述視覺(jué)詞修正模塊在該組待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,確定該提供者關(guān)聯(lián)的停用視覺(jué)詞之前,還包括:
[0041]確定該組待索引圖像的圖像數(shù)目,判斷該圖像數(shù)目是否大于等于統(tǒng)計(jì)所需的最小數(shù)目,如果是,進(jìn)行所述視覺(jué)詞的統(tǒng)計(jì)和判斷,如果否,不再進(jìn)行所述視覺(jué)詞的統(tǒng)計(jì)和判斷。
[0042]較佳地,
[0043]所述視覺(jué)詞生成模塊確定待索引圖像各自的視覺(jué)詞集合,其中,所述待索引圖像為待索引商品圖像;
[0044]所述視覺(jué)詞修正模塊使用的提供者信息為提供所述待索引商品圖像的店鋪。
[0045]本申請(qǐng)的上述方案針對(duì)同一提供者提供的圖像的非主體區(qū)域往往相同和相似的特點(diǎn),在提供者提供的所有待索引圖像的范圍內(nèi)進(jìn)行視覺(jué)詞的統(tǒng)計(jì)和判斷,得到提供者關(guān)聯(lián)的停用視覺(jué)詞,因而可以有效避免圖像非主體區(qū)域?qū)λ阉鞯挠绊?。上述方案可用于商品圖像搜索,確定店鋪關(guān)聯(lián)的停用視覺(jué)詞,具有很好的效果。
【附圖說(shuō)明】
[0046]圖1A和圖1B示出的是存在相同的文字型logo的兩幅圖像;
[0047]圖2A和圖2B示出的是存在相同的“偽造背景”的兩幅圖像;
[0048]圖3A和圖3B示出的是存在相同的圖案型logo的兩幅圖像;
[0049]圖4示出的是本申請(qǐng)實(shí)