一種搜索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及識(shí)別與搜索技術(shù)領(lǐng)域,特別是一種搜索方法及裝置。
【背景技術(shù)】
[0002]隨著無線網(wǎng)絡(luò)的蓬勃發(fā)展和移動(dòng)設(shè)備的功能不斷增強(qiáng),用戶利用移動(dòng)設(shè)備上網(wǎng)查詢圖片信息越來越頻繁?,F(xiàn)有的查詢方法需要用戶自己去不斷地積累數(shù)據(jù)庫的關(guān)聯(lián)搜索,即用戶來對(duì)數(shù)據(jù)庫中的圖片進(jìn)行關(guān)聯(lián)標(biāo)注。在后續(xù)搜索圖片時(shí),用戶提供關(guān)鍵字作為查詢基礎(chǔ)。之后系統(tǒng)從數(shù)據(jù)庫中確定出標(biāo)注與關(guān)鍵字匹配的圖片。
[0003]由此可見,上述方法存在以下缺點(diǎn):
[0004]I)只通過關(guān)鍵字與標(biāo)注匹配不能很好地搜索到用戶期望的圖片;
[0005]2)需要用戶來海量積累關(guān)聯(lián)搜索,這使得用戶側(cè)的操作極為繁瑣;
[0006]3)搜索受到用戶積累關(guān)聯(lián)度的制約,因此非常有限,所能形成的數(shù)據(jù)庫規(guī)模較小。
【發(fā)明內(nèi)容】
[0007]本發(fā)明要解決的技術(shù)問題是提供一種搜索方法及裝置,能夠提高圖片搜索的準(zhǔn)確率、成功率,并減少用戶側(cè)的操作。
[0008]為解決上述技術(shù)問題,本發(fā)明的實(shí)施例提供一種搜索方法,用于搜索一數(shù)據(jù)庫,所述數(shù)據(jù)庫中保存有多個(gè)圖像,且記錄有每一個(gè)圖像各自對(duì)應(yīng)的URL鏈接,所述搜索方法包括:
[0009]獲取一待搜索圖像的圖像特征;
[0010]根據(jù)所述待搜索圖像的圖像特征在所述數(shù)據(jù)庫中進(jìn)行圖像搜索,得到由目標(biāo)圖像組成的圖像搜索結(jié)果集;
[0011]獲取每個(gè)所述目標(biāo)圖像各自對(duì)應(yīng)的URL鏈接中包括的文字信息;
[0012]根據(jù)關(guān)鍵字對(duì)所述文字信息進(jìn)行搜索,得到包括的文字信息與所述關(guān)鍵字匹配的目標(biāo)URL鏈接;
[0013]輸出所述圖像搜索結(jié)果集中與所述目標(biāo)URL鏈接對(duì)應(yīng)的目標(biāo)圖像。
[0014]其中,搜索方法還包括:
[0015]獲取用戶發(fā)送的語音后,進(jìn)行語音識(shí)別,得到與所述語音對(duì)應(yīng)的字符串;
[0016]對(duì)所述字符串進(jìn)行語義解析,得到至少一個(gè)所述關(guān)鍵字。
[0017]優(yōu)選地,所述數(shù)據(jù)庫中保存的多個(gè)圖像為從互聯(lián)網(wǎng)中抓取的圖像。
[0018]其中,所述數(shù)據(jù)庫中預(yù)先記錄了所述多個(gè)圖像的圖像特征,所述根據(jù)所述圖像特征在所述數(shù)據(jù)庫中進(jìn)行圖像搜索的步驟中,根據(jù)所述多個(gè)圖像的圖像特征進(jìn)行圖像搜索。
[0019]其中,所述待搜索的圖像特征由用戶端從用戶拍攝的圖像中提取得到,所述獲取一待搜索的圖像特征具體包括:
[0020]從用戶端接收所述待搜索的圖像特征。
[0021]其中,輸出所述圖像搜索結(jié)果集中與所述目標(biāo)URL鏈接對(duì)應(yīng)的目標(biāo)圖像的步驟中,還輸出所述目標(biāo)URL鏈接。
[0022]此外,本發(fā)明的實(shí)施例還提供一種搜索裝置,用于搜索一數(shù)據(jù)庫,所述數(shù)據(jù)庫中保存有多個(gè)圖像,且記錄有每一個(gè)圖像各自對(duì)應(yīng)的URL鏈接,所述搜索裝置包括:
[0023]第一獲取模塊,用于獲取一待搜索圖像的圖像特征;
[0024]第一搜索模塊,用于根據(jù)所述待搜索圖像的圖像特征在所述數(shù)據(jù)庫中進(jìn)行圖像搜索,得到由目標(biāo)圖像組成的圖像搜索結(jié)果集;
[0025]第二獲取模塊,用于獲取每個(gè)所述目標(biāo)圖像各自對(duì)應(yīng)的URL鏈接中包括的文字信息;
[0026]第二搜索模塊,用于根據(jù)關(guān)鍵字對(duì)所述文字信息進(jìn)行搜索,得到包括的文字信息與所述關(guān)鍵字匹配的目標(biāo)URL鏈接;
[0027]輸出模塊,用于輸出所述圖像搜索結(jié)果集中與所述目標(biāo)URL鏈接對(duì)應(yīng)的目標(biāo)圖像。
[0028]其中,所述搜索裝置還包括:
[0029]識(shí)別模塊,用于獲取用戶發(fā)送的語音后,進(jìn)行語音識(shí)別,得到與所述語音對(duì)應(yīng)的字符串;
[0030]解析模塊,用于對(duì)所述字符串進(jìn)行語義解析,得到至少一個(gè)所述關(guān)鍵字。
[0031]優(yōu)選地,所述數(shù)據(jù)庫中保存的多個(gè)圖像為從互聯(lián)網(wǎng)中抓取的圖像。
[0032]其中,所述數(shù)據(jù)庫中預(yù)先記錄了所述多個(gè)圖像的圖像特征,所述第一搜索模塊根據(jù)所述圖像特征在所述數(shù)據(jù)庫中進(jìn)行圖像搜索時(shí),根據(jù)所述多個(gè)圖像的圖像特征進(jìn)行圖像搜索。
[0033]其中,所述待搜索的圖像特征由用戶端從用戶拍攝的圖像中提取得到,所述第一獲取模塊具體用于:
[0034]從用戶端接收所述待搜索的圖像特征。
[0035]其中,輸出模塊同時(shí)還輸出所述目標(biāo)URL鏈接。
[0036]本發(fā)明的上述技術(shù)方案的有益效果如下:
[0037]本方案首先利用待搜索圖像的圖像特征,在數(shù)據(jù)庫中進(jìn)行第一次搜索得到目標(biāo)圖像集合,之后通過關(guān)鍵字與目標(biāo)圖片集合對(duì)應(yīng)網(wǎng)頁中的文字信息進(jìn)行匹配,完成第二次搜索。在關(guān)鍵字的匹配過程中,不需要用戶再對(duì)數(shù)據(jù)庫中的圖像進(jìn)行關(guān)聯(lián)標(biāo)注,因此數(shù)據(jù)庫中的圖像來源不再到受約束,進(jìn)而能夠以更多的圖像來源執(zhí)行圖像搜索,因此準(zhǔn)確率、成功率更高。
【附圖說明】
[0038]圖1為本發(fā)明的搜索方法的步驟示意圖;
[0039]圖2為本發(fā)明的搜索方法的一種具體應(yīng)用的步驟示意圖;
[0040]圖3表示發(fā)明實(shí)施例的搜索裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0041]為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。
[0042]如圖1所示,本發(fā)明的實(shí)施例提供一種搜索方法,用于搜索一數(shù)據(jù)庫,所述數(shù)據(jù)庫中保存有多個(gè)圖像,且記錄有每一個(gè)圖像各自對(duì)應(yīng)的URL鏈接,所述搜索方法包括:
[0043]步驟11,獲取一待搜索圖像的圖像特征;在步驟11中,圖像特征可以是圖像的文字描述,如某一汽車圖像的文字描述可以是“汽車、品牌”等;也可是類似像素、紋理、對(duì)比度等計(jì)算機(jī)圖像語目的取值。
[0044]步驟12,根據(jù)所述待搜索圖像的圖像特征在所述數(shù)據(jù)庫中進(jìn)行圖像搜索,得到由目標(biāo)圖像組成的圖像搜索結(jié)果集;
[0045]步驟13,獲取每個(gè)所述目標(biāo)圖像各自對(duì)應(yīng)的URL鏈接中包括的文字信息;
[0046]步驟14,根據(jù)關(guān)鍵字對(duì)所述文字信息進(jìn)行搜索,得到包括的文字信息與所述關(guān)鍵字匹配的目標(biāo)URL鏈接;
[0047]步驟15,輸出所述圖像搜索結(jié)果集中與所述目標(biāo)URL鏈接對(duì)應(yīng)的目標(biāo)圖像。
[0048]在上述步驟11至步驟15的描述中可以知道,本方法首選通過待搜索圖像的圖像特征進(jìn)行數(shù)據(jù)庫的第一次搜索,得到一個(gè)大致范圍內(nèi)的目標(biāo)圖像集合,之后根據(jù)關(guān)鍵字對(duì)目標(biāo)圖像集合進(jìn)行第二次搜索,最終得到能夠符合用戶期望的目標(biāo)圖像。由此可見,本方案的搜索目的性更強(qiáng),有效提高了搜索的準(zhǔn)確率。
[0049]在上述步驟14中,關(guān)鍵字可通過用戶通輸入的語音得到。在獲取用戶發(fā)送的語音后,本發(fā)明的搜索方法還進(jìn)一步進(jìn)行語音識(shí)別,得到與所述語音對(duì)應(yīng)的字符串;之后對(duì)所述字符串進(jìn)行語義解析,得到至少一個(gè)所述關(guān)鍵字。
[0050]需要給予說明的是,語音識(shí)別為目前成熟的技術(shù),例如市面上常見SIRI語音助手就是一種利用語音識(shí)別技術(shù)的終端應(yīng)用。此外,關(guān)鍵字還可以從用戶輸入的文字中獲取得至IJ,由于屬于本領(lǐng)域常用技術(shù)手段,因此本文不再進(jìn)行贅述。
[0051]此外,在步驟14的關(guān)鍵字匹配過程中,不再需要用戶對(duì)數(shù)據(jù)庫中的圖像進(jìn)行關(guān)聯(lián)標(biāo)注,因此數(shù)據(jù)庫中的圖像來源不再到受約束。所以作為一個(gè)優(yōu)選方案,所述數(shù)據(jù)庫中保存的多個(gè)圖像為從互聯(lián)網(wǎng)中抓取的圖像,即數(shù)據(jù)庫不需要積累過程,即可直接獲得海量的圖像數(shù)據(jù)。
[0052]此外,所述數(shù)據(jù)庫中預(yù)先記錄了所述多個(gè)圖像的圖像特征,在步驟12中,還根據(jù)所述多個(gè)圖像的圖像特征進(jìn)行圖像搜索,即根據(jù)待搜索圖像的圖像特征與數(shù)據(jù)庫中圖像的圖像特征進(jìn)行匹配對(duì)比,確定出目標(biāo)圖像。例如,通過圖像特征中的紋理、色彩、像素等信息進(jìn)行匹配,或者根據(jù)圖像的標(biāo)記特征等都可準(zhǔn)確找到與待搜索圖像相似的目標(biāo)圖像。
[0053]當(dāng)然,為了方便用戶,本發(fā)明實(shí)施例中,輸出所述圖像搜索結(jié)果集中與所述目標(biāo)URL鏈接對(duì)應(yīng)的目標(biāo)圖像的步驟中,還輸出所述目標(biāo)URL鏈接。
[0054]下面結(jié)合實(shí)際應(yīng)用對(duì)本發(fā)明的搜索方法進(jìn)行詳細(xì)介紹:
[0055]<實(shí)際應(yīng)用一 >
[0056]在實(shí)際應(yīng)用一中,可通過網(wǎng)絡(luò)爬蟲工具對(duì)互聯(lián)網(wǎng)上指定范圍的圖像資源進(jìn)行抓取,提取其圖像特征,同時(shí)記錄圖像所在網(wǎng)頁的URL鏈接,將圖像本身、圖像特征和URL鏈接作為搜索的數(shù)據(jù)庫,該數(shù)據(jù)庫建立在服務(wù)端。
[0057]結(jié)合圖2說明如下。
[0058]假設(shè)用戶看到了一個(gè)米老鼠的玩偶,想要購買印有該玩偶圖案的T恤,可以用手機(jī)先將玩偶拍攝下來,之后將玩偶的圖片輸入至客戶端程序,并通過麥克風(fēng)進(jìn)行語音錄入。示例性地,錄入的語音可以是“哪里能購買T恤”。
[0059]之后,客戶端提取用戶輸入的玩偶圖片的圖像特征以及語音的音頻特征,并將該圖像特征以及音頻特征上傳至服務(wù)端。服務(wù)端根據(jù)上傳的圖像特征進(jìn)行第一次搜索,得到與該玩偶相關(guān)圖像組成的圖像搜索結(jié)果集。在第一次搜索中,通過玩偶圖片的圖像特征可以確定出與米老鼠相關(guān)的圖像,即圖像搜索結(jié)果集可能包括米老鼠有關(guān)的電影、書包、動(dòng)畫等相關(guān)圖像,還不能達(dá)到用戶期望的搜索結(jié)果。
[0060]為此,服務(wù)端還需要對(duì)用戶上傳的語音進(jìn)行語音識(shí)別,提取對(duì)應(yīng)的字符串,如“哪里”、“能”、“購買”、“T恤”。之后服務(wù)端對(duì)上述字符串進(jìn)行語義解析,得到關(guān)鍵字“購買”和“T恤”。在關(guān)鍵字提取完成后,服務(wù)器獲取圖像搜索結(jié)果集中每個(gè)圖像的URL鏈接中網(wǎng)頁的文字信息,通過與“購買”、“T恤”進(jìn)行文字匹配,從而完成第二次搜索。第二次搜索可以看成是高精確度的篩選過程,最終得到出售米老鼠T恤的相關(guān)圖片。
[0061]最后,服務(wù)器將最終得到的圖片的相關(guān)信息返回至用戶端側(cè),例如:
[0062]直接將最終得到的圖片和/或URL鏈接發(fā)送至客戶端,用戶可查看該圖片,或者根據(jù)URL鏈接自行瀏覽米老鼠T恤的出售信息;或者
[0063]將最終確定的圖片以及出售米老鼠T恤的相關(guān)文字發(fā)回至客戶端,客戶端經(jīng)簡(jiǎn)單的信息處理后,直接向用戶呈現(xiàn)出圖片以及相關(guān)的文字介紹。
[0064]在實(shí)際應(yīng)用一中,通過兩次搜索,能夠準(zhǔn)確找到符合用戶期望的圖像信息。此外,利用圖像拍攝的方法即可獲取待搜索圖像的圖像特征,因此具有很高的實(shí)用性和便捷性。
[0065]〈實(shí)際應(yīng)用二〉
[0066]在實(shí)際應(yīng)用二中,可通過網(wǎng)絡(luò)爬蟲工具對(duì)互聯(lián)網(wǎng)上指定范圍的圖像資源進(jìn)行抓取,提取其圖像特征,同時(shí)