圖像搜索方法及裝置制造方法
【專利摘要】本發(fā)明提出一種圖像搜索方法,包括如下步驟:提取一個(gè)或多個(gè)圖像的特征信息,并根據(jù)所述特征信息為所述圖像建立索引;獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)所述關(guān)鍵詞的搜索優(yōu)先級(jí),根據(jù)所述搜索優(yōu)先級(jí)從所述一個(gè)或多個(gè)圖像的索引中搜索與所述關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集;將所述圖像結(jié)果集按照所述搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶,并在所述圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索。本發(fā)明還提出一種圖像搜索裝置。本發(fā)明可以提高圖像搜索的精確度,并且用戶的體驗(yàn)度較高。
【專利說(shuō)明】圖像搜索方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像搜索領(lǐng)域,特別涉及一種圖像搜索方法及裝置。
【背景技術(shù)】
[0002]目前,在圖像搜索領(lǐng)域中,首先,主要采用圖像識(shí)別方法來(lái)提取搜索可利用的特征,然后與樣本庫(kù)進(jìn)行一一比對(duì),再輸出相匹配的結(jié)果。
[0003]但是,這種圖像搜索方式存在以下缺點(diǎn):在提取特征的過(guò)程中,需要考慮圖像中是否包括可作為線索的文字,并且通常需要借助于人工干預(yù)來(lái)提取圖像信息,例如,圖像分類、圖像屬性信息、圖像內(nèi)容特征等。這種方式在無(wú)形之中增加了工作量,并且不利于高精度搜索,搜索精度較低,并且?guī)Ыo用戶的體驗(yàn)度也不高。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決上述技術(shù)問(wèn)題之一或至少提供一種有用的商業(yè)選擇。為此,本發(fā)明的一個(gè)目的在于提出一種搜索結(jié)果更加精確且用戶體驗(yàn)度更好的圖像搜索方法。本發(fā)明的另一個(gè)目的在于提出一種圖像搜索裝置。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明第一方面的實(shí)施例提供一種圖像搜索方法,包括如下步驟:
[0006]提取一個(gè)或多個(gè)圖像的特征信息,并根據(jù)所述特征信息為所述圖像建立索引;
[0007]獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)所述關(guān)鍵詞的搜索優(yōu)先級(jí),根據(jù)所述搜索優(yōu)先級(jí)從所述一個(gè)或多個(gè)圖像的索引中搜索與所述關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集;以及
[0008]將所述圖像結(jié)果集按照所述搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶,并在所述圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索。
[0009]根據(jù)本發(fā)明實(shí)施例的圖像搜索方法,考慮到圖像搜索領(lǐng)域的特點(diǎn),采用統(tǒng)一化特征提取與搜索,并對(duì)搜索到的圖像采用階梯狀呈現(xiàn)的方式供用戶參考,有利于針對(duì)不同需求的用戶,并且這種逐級(jí)遞進(jìn)的搜索方式可以提高圖像搜索的精確度,也可以給用戶帶來(lái)更好的體驗(yàn)。
[0010]在本發(fā)明的一個(gè)實(shí)施例中,所述搜索優(yōu)先級(jí)通過(guò)所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
[0011]此外,本發(fā)明的圖像搜索方法還包括如下步驟:計(jì)算所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度;如果所述匹配度大于或等于第二預(yù)設(shè)閾值,則將當(dāng)前圖像結(jié)果集呈現(xiàn)給所述用戶。
[0012]其中,所述特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。
[0013]在本發(fā)明的另一個(gè)實(shí)施例中,所述索引以表格形式記錄所述一個(gè)或多個(gè)圖像的特征信息。[0014]本發(fā)明第二方面的實(shí)施例提供一種圖像搜索裝置,包括:特征提取模塊,用于提取圖像庫(kù)中的一個(gè)或多個(gè)圖像的特征信息;索引模塊,用于根據(jù)所述特征信息為所述圖像建立索引;獲取模塊,用于獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)所述關(guān)鍵詞的搜索優(yōu)先級(jí);搜索模塊,用于根據(jù)所述搜索優(yōu)先級(jí)從所述一個(gè)或多個(gè)圖像的索引中搜索與所述關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集,并在所述圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索;顯示模塊,用于將所述圖像結(jié)果集按照所述搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶。
[0015]根據(jù)本發(fā)明實(shí)施例的圖像搜索裝置,考慮到圖像搜索領(lǐng)域的特點(diǎn),采用統(tǒng)一化特征提取與搜索,并對(duì)搜索到的圖像采用階梯狀呈現(xiàn)的方式供用戶參考,有利于針對(duì)不同需求的用戶,并且這種逐級(jí)遞進(jìn)的搜索方式可以提高圖像搜索的精確度,也可以給用戶帶來(lái)更好的體驗(yàn)。
[0016]在本發(fā)明的一個(gè)實(shí)施例中,所述搜索優(yōu)先級(jí)通過(guò)所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
[0017]此外,本發(fā)明實(shí)施例的圖像搜索裝置,還包括:匹配度計(jì)算模塊,用于計(jì)算所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度,并將所述匹配度與第二預(yù)設(shè)閾值進(jìn)行比較,其中,所述顯示模塊還用于在所述匹配度大于或等于第二預(yù)設(shè)閾值,則將當(dāng)前圖像結(jié)果集呈現(xiàn)給所述用戶。
[0018]其中,所述特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。
[0019]在本發(fā)明的又一個(gè)實(shí)施例中,所述索引以表格形式記錄所述一個(gè)或多個(gè)圖像的特征信息。
[0020]本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【專利附圖】
【附圖說(shuō)明】
[0021]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0022]圖1為根據(jù)本發(fā)明實(shí)施例的圖像搜索方法的流程圖;以及
[0023]圖2為根據(jù)本發(fā)明實(shí)施例的圖像搜索裝置的示意圖。
【具體實(shí)施方式】
[0024]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0025]此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上,除非另有明確具體的限定。
[0026]在本發(fā)明中,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”、“固定”等術(shù)語(yǔ)應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。
[0027]下面參考圖1描述根據(jù)本發(fā)明實(shí)施例的圖像搜索方法。
[0028]如圖1所示,本發(fā)明實(shí)施例的圖像搜索方法,包括如下步驟:
[0029]步驟S101,提取一個(gè)或多個(gè)圖像的特征信息,并根據(jù)特征信息為圖像建立索引。
[0030]具體地,在圖像庫(kù)中可以包括一個(gè)或多個(gè)圖像,其中每個(gè)圖像均具有特征信息。在本發(fā)明的一個(gè)示例中,特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。然后,在圖像庫(kù)中進(jìn)行索引。其中,索引可以以表格形式記錄一個(gè)或多個(gè)圖像的特征信息。
[0031]具體地,首先,提取各個(gè)圖像的特征信息。其中,文字信息,例如為文字?jǐn)?shù)量、文字內(nèi)容、文字大小等。視覺(jué)信息,例如為顏色、紋理、形狀等。圖像拍攝的信息,例如為拍攝地點(diǎn)、拍攝時(shí)間等。圖像的描述信息,例如為圖像名稱、屬性等。
[0032]在建立各個(gè)圖像的索引后,形成包括以上述各個(gè)特征信息為項(xiàng)目的表格。
[0033]步驟S102,獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)關(guān)鍵詞的搜索優(yōu)先級(jí),根據(jù)設(shè)置的搜索優(yōu)先級(jí)逐級(jí)從一個(gè)或多個(gè)圖像的索引中搜索與關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集。
[0034]在圖像搜索時(shí),提供要搜索的關(guān)鍵詞,即搜索的內(nèi)容信息,該內(nèi)容信息可以包括圖像庫(kù)表格中的各個(gè)特征信息中的一個(gè)或多個(gè),例如:兩只、貓咪、秋天等。關(guān)鍵詞也可以包括圖像本身。如果是圖像本身,則需要從圖像本身提取各個(gè)特征信息。
[0035]搜索優(yōu)先級(jí)是指用戶設(shè)置的多個(gè)關(guān)鍵詞在搜索過(guò)程的優(yōu)先級(jí),搜索的順序。例如,用戶可以設(shè)置搜索優(yōu)先級(jí)由高到低依次為:貓咪、秋天、兩只,則優(yōu)先搜索特征信息為貓咪的圖像,其次為特征信息為秋天的圖像,最后為特征信息為兩只的圖像。
[0036]然后,將優(yōu)先級(jí)中的每個(gè)階段搜索到的圖像加入至圖像結(jié)果集。
[0037]步驟S103,將圖像結(jié)果集按照搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶,并在圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索。
[0038]在圖像搜索過(guò)程中,依據(jù)各個(gè)特征信息以階梯狀向用戶呈現(xiàn)各個(gè)特征信息的圖像結(jié)果,從而供用戶篩選。具體地,在第一階梯中,選取與第一特征信息最鄰近的信息內(nèi)容,由此進(jìn)行表格篩選。其中,第一特征信息可以由用戶預(yù)先設(shè)置,也可以自動(dòng)根據(jù)用戶輸入的關(guān)鍵詞自動(dòng)提取得到。
[0039]判斷此時(shí)經(jīng)過(guò)篩選之后的結(jié)果集是否小于第一預(yù)設(shè)閾值,如果否,則進(jìn)入下一階梯篩選過(guò)程。直到在經(jīng)歷了若干階梯步驟之后,搜索得到的結(jié)果集滿足小于第一預(yù)設(shè)閾值,即用戶想要得到的數(shù)量集合之后,才向用戶呈現(xiàn)。
[0040]優(yōu)選地,搜索優(yōu)先級(jí)可以通過(guò)關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
[0041]在得到的圖像結(jié)果集中,如果用戶不滿足于當(dāng)前的結(jié)果,可適當(dāng)調(diào)制其中的一個(gè)或多個(gè)關(guān)鍵詞的搜索內(nèi)容,由此適當(dāng)調(diào)制要搜索的內(nèi)容。
[0042]例如,用戶設(shè)置關(guān)鍵詞的搜索優(yōu)先級(jí)依次為:2012年、倫敦、奧運(yùn)會(huì)等等,則首先對(duì)“2012年”對(duì)應(yīng)的圖像進(jìn)行一次篩選,獲得第一圖像結(jié)果集,并呈現(xiàn)給用戶。同時(shí)經(jīng)過(guò)與第一預(yù)設(shè)閾值進(jìn)行比較,判斷第一圖像結(jié)果集中圖像數(shù)量是否小于第一預(yù)設(shè)閾值,如果否則在上述第一圖像結(jié)果集中繼續(xù)搜索“倫敦”對(duì)應(yīng)的圖像,獲得第二圖像結(jié)果集,并呈現(xiàn)給用戶。同時(shí)將第二圖像結(jié)果集經(jīng)過(guò)與第一預(yù)設(shè)閾值進(jìn)行比較,判斷該第二圖像結(jié)果集中圖像數(shù)量是否小于第一預(yù)設(shè)閾值,如果否則上述第二圖像結(jié)果集中繼續(xù)搜索“奧運(yùn)會(huì)”對(duì)應(yīng)的圖像,得到第三圖像集,以此類推,,從而縮小搜索結(jié)果的范圍,直至獲得的圖像結(jié)果集小于第一預(yù)設(shè)閾值。
[0043]通過(guò)上述逐級(jí)推進(jìn)的方式,在每個(gè)階段獲得的圖像結(jié)果集均呈現(xiàn)給用戶,而并非直接武斷地按序呈現(xiàn)結(jié)果,從而避免了一下提供過(guò)多的搜索結(jié)果供用戶選擇,導(dǎo)致提供的搜索結(jié)果中包含的信息可能與要搜索的內(nèi)容相差甚遠(yuǎn),進(jìn)而可以提高搜索的精確度,并且這種逐層呈現(xiàn)的方式,給用戶帶來(lái)的體驗(yàn)也更好。
[0044]此外,本發(fā)明的圖像搜索方法不僅考慮到各個(gè)特征信息的重要性,而且還考慮到階梯篩選的過(guò)程,有利于用戶獲得更加貼切的圖像結(jié)果。
[0045]用戶在搜索之前,為了獲得更加適當(dāng)?shù)慕Y(jié)果,優(yōu)選地,在將關(guān)鍵詞列為搜索依據(jù)之前,可以利用主觀判斷系統(tǒng)進(jìn)行屬性提取,然后得到與用戶進(jìn)行的提取之間的差距,由此得到系統(tǒng)判斷的傾向。這樣更可以傾向更加有利于用戶在各個(gè)階梯篩選過(guò)程中進(jìn)行主觀的判斷。
[0046]因?yàn)橛行傩允窍鄬?duì)有決定性的,例如,拍攝地點(diǎn)和拍攝時(shí)間。只要用戶已經(jīng)確定,則可以直接很直觀的判斷。當(dāng)然,還有一些屬性是相對(duì)柔性的,難以直接判斷的,例如,不規(guī)則的形狀,如果用戶文字來(lái)表述,可能相對(duì)模糊,這時(shí)候用戶需要借助于更多的關(guān)鍵詞作為搜索內(nèi)容。
[0047]在本發(fā)明的一個(gè)實(shí)施例中,在步驟SlOl的索引建立期間,優(yōu)選地,可以進(jìn)行人工干預(yù),由此提高信息庫(kù)的正確率。
[0048]此外,在用戶搜索過(guò)程中,可以向用戶預(yù)演各個(gè)屬性的提取過(guò)程,由此提高用戶對(duì)于系統(tǒng)提取屬性的認(rèn)識(shí)度,更加有利于用戶在搜索過(guò)程中得到滿意的結(jié)果。
[0049]在本發(fā)明的一個(gè)實(shí)施例中,還包括如下步驟:計(jì)算關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度;如果匹配度大于或等于第二預(yù)設(shè)閾值,則將當(dāng)前圖像結(jié)果集呈現(xiàn)給用戶。其中,匹配度的計(jì)算是在每個(gè)搜索階段和圖像結(jié)果集數(shù)量的判斷同時(shí)進(jìn)行的。由此,不必對(duì)于每個(gè)屬性進(jìn)行搜索,也不必一定在結(jié)果小于第一預(yù)設(shè)閾值時(shí)向用戶呈現(xiàn),如果在圖像結(jié)果中得到匹配度達(dá)到第二預(yù)設(shè)閾值以上時(shí),也可以在階梯搜索過(guò)程期間逐漸向用戶提供搜索到的結(jié)果集以供用戶參考。
[0050]根據(jù)用戶需求不同,對(duì)于圖像結(jié)果的要求也不同,因此,用戶可選擇性使用其中的特征信息。例如,用戶不關(guān)心具體時(shí)間、僅關(guān)心具體地點(diǎn)等?;蛘?,用戶不希望查找完全相同的區(qū)域的信息,僅希望查找具有類似功能的信息。所以,利用本發(fā)明實(shí)施例提供的圖像搜索方法可以更加有利于滿足不同需求的用戶的要求,避免了武斷地判斷用戶的需求。
[0051]根據(jù)本發(fā)明實(shí)施例的圖像搜索方法,考慮到圖像搜索領(lǐng)域的特點(diǎn),采用統(tǒng)一化特征提取與搜索,并對(duì)搜索到的圖像采用階梯狀呈現(xiàn)的方式供用戶參考,有利于針對(duì)不同需求的用戶,并且這種的搜索方式可以提高圖像搜索的精確度,也可以給用戶帶來(lái)更好的體驗(yàn)。
[0052]下面參考圖2描述根據(jù)本發(fā)明實(shí)施例的圖像搜索裝置200。[0053]如圖2所述,本發(fā)明實(shí)施例的圖像搜索裝置200,包括特征提取模塊210、索引模塊220、獲取模塊230、搜索模塊240和顯示模塊250。
[0054]具體地,特征提取模塊210用于提取圖像塊中的一個(gè)或多個(gè)圖像的特征信息。
[0055]具體地,在圖像庫(kù)中可以包括一個(gè)或多個(gè)圖像,其中每個(gè)圖像均具有特征信息。在本發(fā)明的一個(gè)示例中,特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。具體地,特征提取模塊210提取各個(gè)圖像的特征信息。其中,文字信息,例如為文字?jǐn)?shù)量、文字內(nèi)容、文字大小等。視覺(jué)信息,例如為顏色、紋理、形狀等。圖像拍攝的信息,例如為拍攝地點(diǎn)、拍攝時(shí)間等。圖像的描述信息,例如為圖像名稱、屬性等。
[0056]在本發(fā)明的一個(gè)實(shí)施例中,特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。
[0057]索引模塊220用于根據(jù)特征信息為圖像建立索引。其中,索引以表格形式記錄一個(gè)或多個(gè)圖像的特征信息。
[0058]然后,索引模塊220在圖像庫(kù)中進(jìn)行索引。其中,索引可以以表格形式記錄一個(gè)或多個(gè)圖像的特征信息。索引模塊220在建立各個(gè)圖像的索引后,形成包括以上述各個(gè)特征信息為項(xiàng)目的表格。
[0059]獲取模塊230用于獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)關(guān)鍵詞的搜索優(yōu)先級(jí)。搜索模塊240用于根據(jù)搜索優(yōu)先級(jí)從一個(gè)或多個(gè)圖像的索引中搜索與關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集,并在搜索到的圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索。顯示模塊250用于將圖像結(jié)果集按照搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶。
[0060]在圖像搜索時(shí),獲取模塊230獲取用戶設(shè)置搜索的關(guān)鍵詞,即搜索的內(nèi)容信息,該內(nèi)容信息可以包括圖像庫(kù)表格中的各個(gè)特征信息中的一個(gè)或多個(gè),例如:兩只、貓咪、秋天等。關(guān)鍵詞也可以包括圖像本身。如果是圖像本身,則需要從圖像本身提取各個(gè)特征信息。
[0061]搜索優(yōu)先級(jí)是指用戶設(shè)置的多個(gè)關(guān)鍵詞在搜索過(guò)程的優(yōu)先級(jí),搜索的順序。例如,用戶可以設(shè)置搜索優(yōu)先級(jí)由高到低依次為:貓咪、秋天、兩只,則優(yōu)先搜索特征信息為貓咪的圖像,其次為特征信息為秋天的圖像,最后為特征信息為兩只的圖像。
[0062]然后,搜索模塊240將優(yōu)先級(jí)中的每個(gè)階段搜索到的圖像加入至圖像結(jié)果集。
[0063]在圖像搜索過(guò)程中,顯示模塊250依據(jù)各個(gè)特征信息以階梯狀向用戶呈現(xiàn)各個(gè)特征信息的圖像結(jié)果,從而供用戶篩選。具體地,在第一階梯中,搜索模塊240選取與第一特征信息最鄰近的信息內(nèi)容,由此進(jìn)行表格篩選。其中,第一特征信息可以由用戶預(yù)先設(shè)置,也可以自動(dòng)根據(jù)用戶輸入的關(guān)鍵詞自動(dòng)提取得到。
[0064]搜索模塊240判斷此時(shí)經(jīng)過(guò)篩選之后的結(jié)果集是否小于第一預(yù)設(shè)閾值,如果否,則進(jìn)入下一階梯篩選過(guò)程。直到在經(jīng)歷了若干階梯步驟之后,搜索得到的結(jié)果集滿足小于第一預(yù)設(shè)閾值,即用戶想要得到的數(shù)量集合之后,才向用戶呈現(xiàn)。
[0065]優(yōu)選地,搜索優(yōu)先級(jí)可以通過(guò)關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
[0066]在得到的圖像結(jié)果集中,如果用戶不滿足于當(dāng)前的結(jié)果,可適當(dāng)調(diào)制其中的一個(gè)或多個(gè)關(guān)鍵詞的搜索內(nèi)容,由此適當(dāng)調(diào)制要搜索的內(nèi)容。
[0067]通過(guò)上述逐級(jí)推進(jìn)的方式,顯示模塊250將在每個(gè)階段獲得的圖像結(jié)果集均呈現(xiàn)給用戶,而并非直接武斷地按序呈現(xiàn)結(jié)果,從而避免了一下提供過(guò)多的搜索結(jié)果供用戶選擇,導(dǎo)致提供的搜索結(jié)果中包含的信息可能與要搜索的內(nèi)容相差甚遠(yuǎn),進(jìn)而可以提高搜索的精確度,并且這種逐層呈現(xiàn)的方式,給用戶帶來(lái)的體驗(yàn)也更好。
[0068]此外,本發(fā)明的圖像搜索裝置不僅考慮到各個(gè)特征信息的重要性,而且還考慮到階梯篩選的過(guò)程,有利于用戶獲得更加貼切的圖像結(jié)果。
[0069]用戶在搜索之前,為了獲得更加適當(dāng)?shù)慕Y(jié)果,優(yōu)選地,在將關(guān)鍵詞列為搜索依據(jù)之前,可以利用主觀判斷系統(tǒng)進(jìn)行屬性提取,然后得到與用戶進(jìn)行的提取之間的差距,由此得到系統(tǒng)判斷的傾向。這樣更可以傾向更加有利于用戶在各個(gè)階梯篩選過(guò)程中進(jìn)行主觀的判斷。
[0070]因?yàn)橛行傩允窍鄬?duì)有決定性的,例如,拍攝地點(diǎn)和拍攝時(shí)間。只要用戶已經(jīng)確定,則可以直接很直觀的判斷。當(dāng)然,還有一些屬性是相對(duì)柔性的,難以直接判斷的,例如,不規(guī)則的形狀,如果用戶文字來(lái)表述,可能相對(duì)模糊,這時(shí)候用戶需要借助于更多的關(guān)鍵詞作為搜索內(nèi)容。
[0071]在本發(fā)明的一個(gè)實(shí)施例中,在索引模塊220索引建立期間,優(yōu)選地,可以進(jìn)行人工干預(yù),由此提高信息庫(kù)的正確率。
[0072]此外,在用戶搜索過(guò)程中,可以向用戶預(yù)演各個(gè)屬性的提取過(guò)程,由此提高用戶對(duì)于系統(tǒng)提取屬性的認(rèn)識(shí)度,更加有利于用戶在搜索過(guò)程中得到滿意的結(jié)果。
[0073]在本發(fā)明的一個(gè)實(shí)施例中,本發(fā)明實(shí)施例的圖像搜索裝置200還包括匹配度計(jì)算模塊,用于計(jì)算關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度,并將匹配度與第二預(yù)設(shè)閾值進(jìn)行比較。當(dāng)匹配度計(jì)算模塊計(jì)算到的匹配度大于或等于第二預(yù)設(shè)閾值時(shí),顯示模塊250將當(dāng)前圖像結(jié)果集呈現(xiàn)給用戶。
[0074]其中,匹配度的計(jì)算是在每個(gè)搜索階段和圖像結(jié)果集數(shù)量的判斷同時(shí)進(jìn)行的。由此,不必對(duì)于每個(gè)屬性進(jìn)行搜索,也不必一定在結(jié)果小于第一預(yù)設(shè)閾值時(shí)向用戶呈現(xiàn),如果在圖像結(jié)果中得到匹配度達(dá)到第二預(yù)設(shè)閾值以上時(shí),也可以在階梯搜索過(guò)程期間逐漸向用戶提供搜索到的結(jié)果集以供用戶參考。
[0075]根據(jù)用戶需求不同,對(duì)于圖像結(jié)果的要求也不同,因此,用戶可選擇性使用其中的特征信息。例如,用戶不關(guān)心具體時(shí)間、僅關(guān)心具體地點(diǎn)等?;蛘?,用戶不希望查找完全相同的區(qū)域的信息,僅希望查找具有類似功能的信息。所以,利用本發(fā)明實(shí)施例提供的圖像搜索裝置可以更加有利于滿足不同需求的用戶的要求,避免了武斷地判斷用戶的需求。
[0076]根據(jù)本發(fā)明實(shí)施例的圖像搜索裝置,考慮到圖像搜索領(lǐng)域的特點(diǎn),采用統(tǒng)一化特征提取與搜索,并對(duì)搜索到的圖像采用階梯狀呈現(xiàn)的方式供用戶參考,有利于針對(duì)不同需求的用戶,并且這種逐級(jí)遞進(jìn)的搜索方式可以提高圖像搜索的精確度,也可以給用戶帶來(lái)更好的體驗(yàn)。
[0077]流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0078]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書(shū)而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPROM或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(⑶ROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
[0079]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
[0080]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
[0081 ] 此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
[0082]上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0083]在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
[0084]盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的原理和宗旨的情況下在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種圖像搜索方法,其特征在于,包括如下步驟: 提取一個(gè)或多個(gè)圖像的特征信息,并根據(jù)所述特征信息為所述圖像建立索引; 獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)所述關(guān)鍵詞的搜索優(yōu)先級(jí),根據(jù)所述搜索優(yōu)先級(jí)從所述一個(gè)或多個(gè)圖像的索引中搜索與所述關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集;以及 將所述圖像結(jié)果集按照所述搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶,并在所述圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索。
2.如權(quán)利要求1所述的圖像搜索方法,其特征在于,所述搜索優(yōu)先級(jí)通過(guò)所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
3.如權(quán)利要求1所述的圖像搜索方法,其特征在于,還包括如下步驟: 計(jì)算所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度; 如果所述匹配度大于或等于第二預(yù)設(shè)閾值,則將當(dāng)前圖像結(jié)果集呈現(xiàn)給所述用戶。
4.如權(quán)利要求1所述的圖像搜索方法,其特征在于,所述特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。
5.如權(quán)利要求1-4任一項(xiàng)所述的圖像搜索方法,其特征在于,所述索引以表格形式記錄所述一個(gè)或多個(gè)圖像的特征信息。
6.一種圖像搜索裝置,其特征在于,包括: 特征提取模塊,用于提取圖像庫(kù)`中的一個(gè)或多個(gè)圖像的特征信息; 索引模塊,用于根據(jù)所述特征信息為所述圖像建立索引; 獲取模塊,用于獲取用戶設(shè)置的多個(gè)關(guān)鍵詞及多個(gè)所述關(guān)鍵詞的搜索優(yōu)先級(jí); 搜索模塊,用于根據(jù)所述搜索優(yōu)先級(jí)從所述一個(gè)或多個(gè)圖像的索引中搜索與所述關(guān)鍵詞對(duì)應(yīng)的特征信息的圖像,并將對(duì)應(yīng)的圖像加入至圖像結(jié)果集,并在所述圖像結(jié)果集的數(shù)量小于第一預(yù)設(shè)閾值時(shí),停止搜索;以及 顯示模塊,用于將所述圖像結(jié)果集按照所述搜索優(yōu)先級(jí)逐次呈現(xiàn)給用戶。
7.如權(quán)利要求6所述的圖像搜索裝置,其特征在于,所述搜索優(yōu)先級(jí)通過(guò)所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度進(jìn)行調(diào)整。
8.如權(quán)利要求6所述的圖像搜索裝置,其特征在于,還包括: 匹配度計(jì)算模塊,用于計(jì)算所述關(guān)鍵詞和對(duì)應(yīng)的圖像結(jié)果集的匹配度,并將所述匹配度與第二預(yù)設(shè)閾值進(jìn)行比較, 其中,所述顯示模塊還用于在所述匹配度大于或等于第二預(yù)設(shè)閾值,則將當(dāng)前圖像結(jié)果集呈現(xiàn)給所述用戶。
9.如權(quán)利要求6所述的圖像搜索裝置,其特征在于,所述特征信息包括文字信息、視覺(jué)信息、拍攝信息和描述信息中的一種或多種的組合。
10.如權(quán)利要求6-9任一項(xiàng)所述的圖像搜索裝置,其特征在于,所述索引以表格形式記錄所述一個(gè)或多個(gè)圖像的特征信息。
【文檔編號(hào)】G06F17/30GK103838724SQ201210473675
【公開(kāi)日】2014年6月4日 申請(qǐng)日期:2012年11月20日 優(yōu)先權(quán)日:2012年11月20日
【發(fā)明者】劉娟 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司