專利名稱:基于云服務(wù)的視覺搜索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖片搜索技術(shù)領(lǐng)域,特別涉及一種基于云服務(wù)的視覺搜索方法和系統(tǒng)。
背景技術(shù):
視覺搜索是指針對一張輸入的特定圖片,以人類視覺的角度,對該圖片中的元素進行處理、識別和理解,從中提取出各種不同類型的圖片元素基本信息以及詳細信息?,F(xiàn)有的基于互聯(lián)網(wǎng)的圖片搜索服務(wù),主要是某些搜索引擎中針對相似圖片的圖片搜索服務(wù),這類服務(wù)主要側(cè)重于查找與輸入的某張圖片相似的其他圖片,例如與人臉圖像相片的其他人臉圖像、識別出圖像中的物體等等,這些服務(wù)都是屬于特定領(lǐng)域的識別服務(wù),只能提供形式 上的相似圖片或者是提供圖片中所包含的某個特定領(lǐng)域的信息,并不能識別出圖片的詳細基本信息,因而也無法基于識別出的圖片的詳細基本信息進行進一步的應(yīng)用。
發(fā)明內(nèi)容
基于此,針對上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明的其中一個目的在于提供一種基于云服務(wù)的視覺搜索方法,另一目的在于提供一種基于云服務(wù)的視覺搜索系統(tǒng),其可以識別得到圖片的綜合特征信息,以便于能夠根據(jù)圖片的綜合特征信息進行進一步的綜合應(yīng)用。為達到上述目的,本發(fā)明采用以下技術(shù)方案一種基于云服務(wù)的視覺搜索方法,包括步驟接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括圖像數(shù)據(jù);根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù);各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定各分類類型信息對應(yīng)圖像數(shù)據(jù)的名稱,得到分類視覺搜索結(jié)果,所述分類視覺搜索結(jié)果包括所述分類類型信息以及對應(yīng)的名稱;將各對應(yīng)的分類視覺搜索服務(wù)的分類視覺搜索結(jié)果匯總后向客戶端發(fā)送。一種基于云服務(wù)的視覺搜索服務(wù)系統(tǒng),包括服務(wù)端,所述服務(wù)端包括有云服務(wù)接入裝置,用于接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括圖像數(shù)據(jù),并根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)中對應(yīng)的分類視覺搜索服務(wù);分類視覺服務(wù)系統(tǒng),用于采用各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定各分類類型信息對應(yīng)圖像數(shù)據(jù)的名稱,得到分類視覺搜索結(jié)果,所述分類視覺搜索結(jié)果包括所述分類類型信息以及對應(yīng)的名稱;視覺搜索結(jié)果匯總裝置,用于將各對應(yīng)的分類視覺搜索結(jié)果匯總后向客戶端發(fā)送。
根據(jù)本發(fā)明方案,其基于接收到的客戶端發(fā)送的圖像識別云服務(wù)請求,根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),然后各對應(yīng)的分類視覺搜索服務(wù)檢測并識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱,然后將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端發(fā)送,其基于各不同類別的分類視覺搜索服務(wù)對圖像數(shù)據(jù)中的分類類型信息進行檢測和識另IJ,從而可以識別得到圖片的綜合特征信息,在識別得到的綜合特征信息的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,提高了用戶的使用體驗。
圖I是本發(fā)明的基于云服務(wù)的視覺搜索方法實施例一的流程示意圖;圖2是圖I所示的方法的總體流程的一個具體示例;
圖3是本發(fā)明的基于云服務(wù)的視覺搜索方法實施例二的流程示意圖;圖4是本發(fā)明的基于云服務(wù)的視覺搜索系統(tǒng)實施例一的結(jié)構(gòu)示意圖;圖5是本發(fā)明的基于云服務(wù)的視覺搜索系統(tǒng)實施例二的結(jié)構(gòu)示意圖;圖6是本發(fā)明的基于云服務(wù)的視覺搜索系統(tǒng)實施例三的結(jié)構(gòu)示意圖。
具體實施例方式以下結(jié)合其中的較佳實施方式對本發(fā)明方案進行詳細說明。在下述詳細說明中,是先針對本發(fā)明的基于云服務(wù)的視覺搜索方法的各實施例進行說明,再針對本發(fā)明的基于云服務(wù)的視覺搜索系統(tǒng)的各實施例進行說明。以下先結(jié)合其中的較佳實施例對本發(fā)明的基于云服務(wù)的視覺搜索方法進行詳細說明。實施例一圖I中示出了本發(fā)明的基于云服務(wù)的視覺搜索方法實施例一的流程示意圖,在本實施例一的方案中,是以各分類視覺搜索服務(wù)來檢測判定圖像數(shù)據(jù)中是否包含有對應(yīng)的特定分類類型信息來進行說明。如圖I所示,本實施例中的方法包括步驟步驟SlOl :接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括有需要進行圖像識別的圖像數(shù)據(jù),進入步驟S102 ;步驟S102 :根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),進入步驟S103 ;步驟S103 :各對應(yīng)的分類視覺搜索服務(wù)檢測出圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息,在有對應(yīng)的分類類型信息時,識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,并確定該分類類型信息對應(yīng)的名稱,進入步驟S104 ;步驟S104 :將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端發(fā)送,其中,這里的分類視覺搜索結(jié)果包括上述監(jiān)測確定的分類類型信息以及確定的對應(yīng)的名稱。根據(jù)如上所述的本實施例中的方案,其基于接收到的客戶端發(fā)送的圖像識別云服務(wù)請求,根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),然后各對應(yīng)的分類視覺搜索服務(wù)檢測并識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱,然后將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端發(fā)送,其基于各不同類別的分類視覺搜索服務(wù)對圖像數(shù)據(jù)中的分類類型信息進行檢測和識別,從而可以識別得到圖片的綜合特征信息,在識別得到的綜合特征信息的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,提高了用戶的使用體驗。其中,上述分類視覺搜索服務(wù)可以包括有各種不同的特定領(lǐng)域的分類視覺搜索服務(wù),根據(jù)具體需要的不同,可以做不同的設(shè)定,例如可以包括但不限于下述類別的分類視覺搜索服務(wù)物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)等等。具體實 現(xiàn)時,可以采用這些類別的分類視覺搜索服務(wù)中的任意一項或者任意組合。對應(yīng)的,上述分類類型信息與相應(yīng)的分類視覺搜索服務(wù)相對應(yīng),上述分類類型信息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等類型,具體實現(xiàn)時,與上述所采用的不同類別的分類視覺搜索服務(wù)相對應(yīng),分類類型信息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等等這些分類信息中的任意一項或者任意組合?;诖?,本發(fā)明方案在實施時,可以具有很高的可擴展性,能夠添加任意類型的分類視覺搜索服務(wù),且各類型的分類視覺搜索服務(wù)可以采用現(xiàn)有技術(shù)已有的方式進行。另外,發(fā)送圖像識別服務(wù)請求的客戶端,可以是任何類型的客戶端,包括但不限于移動終端、PC客戶端、WEB客戶端、平板電腦、筆記本電腦、車載電子系統(tǒng)、掌上電腦等等。此外,本發(fā)明方案在實施時,可以由用戶指定需要對發(fā)送的圖像數(shù)據(jù)進行哪些類型的分類視覺搜索服務(wù),例如只進行人臉視覺搜索服務(wù)、景物視覺搜索服務(wù)等等,因此,對上述設(shè)定分類轉(zhuǎn)發(fā)規(guī)則,可以做如下設(shè)定檢測圖像識別云服務(wù)請求中是否包含有分類類型信息;若有包含有分類類型信息,則說明用戶需要進行指定類型的分類視覺搜索服務(wù),則將上述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給該些分類類型對應(yīng)的各分類視覺搜索服務(wù);若沒有包含有分類類型信息,則說明用戶未限定進行哪些類型的分類視覺搜索服務(wù),或者說是需要進行所有類型的分類視覺搜索服務(wù),則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給所有的各分類視覺搜索服務(wù)。在其中一個具體實現(xiàn)方式中,在接收到客戶端發(fā)送的圖像識別云服務(wù)請求之后,還可以對該圖像識別云服務(wù)請求進行預(yù)處理操作,以對圖像識別云服務(wù)請求的安全性進行驗證?;诖?,如圖I所示,在上述步驟SlOl與步驟S102之間,還可以包括步驟步驟S1012 :對圖像識別云服務(wù)請求進行預(yù)處理操作。其中,這里的預(yù)處理操作,主要包括對圖像識別云服務(wù)請求的安全性的驗證,例如判斷該圖像識別云服務(wù)請求是否為合法請求,以避免非法請求的接入。安全性驗證的具體實現(xiàn)方式,可以采用現(xiàn)有技術(shù)中已有的方式進行,在此不予多加贅述?;谏鲜霰景l(fā)明實施例的一個實現(xiàn)方式中,在將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)之后,各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息時,具體可以通過下述方式進行各對應(yīng)的分類視覺搜索服務(wù)先檢測確定圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息
若包含有,檢測出該分類類型信息在圖像數(shù)據(jù)中的位置信息,這里的位置信息,可以是該分類類型信息相對于圖像數(shù)據(jù)對應(yīng)圖片的位置坐標范圍,然后,各對應(yīng)的分類視覺搜索服務(wù)依據(jù)檢測出的該位置信息,識別出該位置信息對應(yīng)的圖像數(shù)據(jù)所代表的分類類型信息;若沒有,則當前的分類視覺搜索服務(wù)結(jié)束視覺搜索服務(wù)過程?;谏鲜霰景l(fā)明的實施例,在識別得到的綜合特征信息的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,以提高用戶的使用體驗,即在上述步驟S103與步驟S104之間,還可以步驟 步驟S1034 :各對應(yīng)的分類視覺搜索服務(wù)根據(jù)所識別出的分類類型信息及對應(yīng)的名稱檢索相關(guān)的詳細信息。此時,上述向客戶端發(fā)送的視覺搜索結(jié)果中,包含有此時所檢索的詳細信息。以下結(jié)合其中一個具體示例進行詳細說明,在該具體示例中,以客戶端發(fā)送的圖像識別云服務(wù)請求中未指定對圖像數(shù)據(jù)進行何種分類視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明方案進行限定。圖2中示出了該具體示例的總體流程的示意圖。在圖2所示中,出于篇幅限制的考慮,僅示出了物體視覺搜索服務(wù)與文字視覺搜索服務(wù),其他類型的視覺搜索以XX視覺搜索指代,其他類型的視覺搜索可以根據(jù)實際需要進行不同類型的設(shè)置。如圖2所示的具體示例,具體的過程可以是如下所述??蛻舳送ㄟ^網(wǎng)絡(luò)(例如Internet)向服務(wù)器端發(fā)送圖像識別云服務(wù)請求,其中,該圖像識別云服務(wù)請求中包括有待進行視覺搜索的圖片的圖像數(shù)據(jù)。服務(wù)器端接收到該圖像識別云服務(wù)請求后,對該圖像識別云服務(wù)請求進行預(yù)處理操作,對該圖像識別云服務(wù)請求的安全性進行驗證,判斷該圖像識別云服務(wù)請求是否為合法的請求,若安全性驗證通過,則進入下一步操作,否則,結(jié)束對圖像識別云服務(wù)請求的處理,或者也可以是向客戶端返回錯誤或者是非法請求的反饋信息。安全性驗證通過后,服務(wù)器端分析判斷該圖像識別云服務(wù)請求中是否包含有分類類型信息,即判斷用戶是否指定了要進行特定類型的分類視覺搜索服務(wù)若有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給該些分類類型信息對應(yīng)的分類視覺搜索服務(wù);若沒有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給所有的分類視覺搜索服務(wù)。在本發(fā)明的該具體示例中,是以圖像識別云服務(wù)請求中未指定特定類型的分類視覺搜索服務(wù)為例進行說明。也就是說,在該具體示例中,是將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給了所有的分類視覺搜索服務(wù)。由于具體設(shè)定的不同,服務(wù)器端所包含的分類視覺搜索服務(wù)可能會有所不同且不能窮舉,因此,在下述說明中,以所有的分類視覺搜索服務(wù)包括了人臉視覺搜索服務(wù)、物理視覺搜索服務(wù)、文字視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明構(gòu)成限定。人臉視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有人臉圖像,若沒有人臉圖像,則結(jié)束人臉視覺搜索服務(wù),若有人臉圖像,確定人臉圖像在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,該位置信息通??梢园ㄈ四槇D像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息,識別出具體的人臉圖像,并給出該人臉圖像對應(yīng)的名稱后,在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的其他人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等)。最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。物體視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有物體,若沒有物體,則結(jié)束物體視覺搜索服務(wù),若有物體,確定物體在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,該位置信息通??梢园ㄈ四槇D像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體類別及其他相關(guān)信息,然后在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息。文字視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有文字內(nèi)容,若沒有文字內(nèi)容,則結(jié)束文字視覺搜索服務(wù),若有文字內(nèi)容,確定文字內(nèi)容在圖像數(shù)據(jù)對應(yīng)的位置信息,該位置信息通??梢园ㄈ四槇D像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息識別出具體的文字內(nèi)容,并在相應(yīng)的數(shù)據(jù)庫中搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。在得到人臉視覺搜索服務(wù)、物體視覺搜索服務(wù)、文字視覺搜索服務(wù)的分類視覺搜索結(jié)果后,將這些分類視覺搜索結(jié)果匯總后返回給客戶端??蛻舳私邮蘸?,針對所接收的分類視覺搜索結(jié)果,根據(jù)實際需要,可以有各種不同的實施方式,從而在返回的分類視覺搜索結(jié)果的基礎(chǔ)上提供很多種后續(xù)交互操作,從個人可以在此基礎(chǔ)上形成各種不同的產(chǎn)品形態(tài)例如根據(jù)返回的分類視覺搜索結(jié)果,利用不同的利用返回數(shù)據(jù)的類型字段,分類圖片中識別出的各種信息;利用返回數(shù)據(jù)中的位置信息,在圖片中框出識別出的每個元素所處的位置,提供更為直觀的結(jié)果;將名稱、詳細信息以文本列表的形式列出,方便用戶快捷的了解圖片中各種元素,也可以在圖片的每個元素框中列出這些文本信息。另外,針對每種分類類型信息對應(yīng)的分類視覺搜索結(jié)果,根據(jù)每種分類類型信息獨有的特點,也可以提供不同的附加交互方式,例如對于文字對應(yīng)的文字視覺搜索結(jié)果,可以判斷是否為外文,譬如英語、法語、日語等,若是外文,則可以提供附加的翻譯功能,另外,如果該文字是一個網(wǎng)址鏈接,則當點擊該文字相應(yīng)的位置時可以訪問該網(wǎng)址鏈接對應(yīng)的地址,直接用瀏覽器打開該鏈接;對于條碼對應(yīng)的條碼視覺搜索結(jié)果,可進一步檢測該條碼的類別,如果該條碼是一維碼,則可以設(shè)定在點擊該一維碼的識別結(jié)果時直接鏈接到購物網(wǎng)站上對應(yīng)于該條碼對應(yīng)商品的鏈接,方便用戶直接購買該商品;如果該條碼是二維碼,則可以根據(jù)識別出的文本的類型提供類似文字視覺搜索的交互操作;對于物體對應(yīng)的物體視覺搜索結(jié)果,可以根據(jù)物體的類型進行判斷,如果該物體是知名商標,則可以提供該知名商標的基本介紹,點擊圖片中該知名商標的相應(yīng)位置之后可以鏈接到該知名商標對應(yīng)的公司的官網(wǎng);如果是景點,則可以進一步給出該景點的介紹信息及票價信息,點擊圖片中該景點的相應(yīng)位置之后可以直接查看旅游攻略;如果是圖書或CD,則可以給出該圖書或者CD的作者及內(nèi)容介紹,點擊圖片中該圖書或者CD的對應(yīng)位置之后可以直接購買該圖書或CD ;對于人臉對應(yīng)的人臉視覺搜索結(jié)果,如果是明星人臉,則可以給出該明星的生平及作品介紹,通過點擊圖片中該明星的人臉對應(yīng)的位置,可鏈接到該明星的相關(guān)主頁,例如主頁地址、博客地址、微博地址等;如果是好友的人臉,則可以點擊圖片中該好友人臉對應(yīng)的位置之后即可查看設(shè)備上該好友的其他照片;如果是普通人臉,則可以給出該人的性別、 年齡等識別信息,甚至還可以增加美丑度等娛樂打分功能;根據(jù)實際需要,還可以設(shè)置其他多種各種不同類型的擴展方式,具體在此不予贅述。其中,上述人臉視覺搜索服務(wù)檢測人臉圖像、對人臉圖像進行識別的過程,可以采用現(xiàn)有技術(shù)中已有的方式進行。以其中一個具體示例為例,人臉視覺搜索服務(wù)可包括下述過程人臉檢測、關(guān)鍵點定位、圖像歸一化、特征抽取以及人臉特征模版比對。其中人臉檢測、關(guān)鍵點定位、圖像歸一化、特征抽取這四個過程可統(tǒng)稱為人臉特征模版提取。以下針對各步驟分別進行簡要說明。人臉檢測是指在采集的圖像或者視頻中,檢測是否有人臉,在檢測有人臉的情況下,標定出人臉的具體位置,得到候選人臉區(qū)域。具體可以采用Haar特征+adaboost算法的方法,實現(xiàn)圖像中-30 30度的小姿態(tài)下人臉位置的準確定位。關(guān)鍵點定位是指在獲取的圖像(視頻)候選人臉區(qū)域上,標定出人臉的眼睛、嘴巴等關(guān)鍵點位置。具體可以采用圖像投影獲得候選眼睛與嘴巴區(qū)域,并分別在眼睛區(qū)域利用Haar特征+adaboost算法獲得準確眼睛中心坐標、在嘴巴區(qū)域利用gabor特征和adaboost算法獲得準確嘴角坐標。圖像歸一化的目的是得到對齊的有效區(qū)域的人臉模版,并消除光照等外界因素的干擾,分為位姿歸一化和光照歸一化。位姿歸一化是根據(jù)獲得的眼睛與嘴巴位置,經(jīng)過裁剪、縮放、姿態(tài)矯正等歸一化操作變形原始圖像到標準人臉模版,確保眼睛與嘴巴處于標準位置。光照歸一化對圖像進行去光照處理。特征抽取是在大小與光照歸一化圖像上進行特征的抽取,包括Gabor局部特征、以及LBP和HOG的全局分塊特征。以三類特征的LDA (Linear Discriminant Analysis,線性鑒別分析)降維和依次串聯(lián)作為圖像的特征表達。人臉特征模版比對是判斷候選的兩組特征模版之間的相似度。在人臉驗證中,以兩組特征模板的相似度超過設(shè)定閾值為驗證通過,即判定兩組特征模板是相似的;在人臉識別中,以最大相似度超過一個給定閾值為識別通過,且最大相似度對應(yīng)的人臉I(yè)D為識別結(jié)果。上述具體示例的說明僅僅針對采用現(xiàn)有技術(shù)中的其中一種方式對人臉視覺搜索服務(wù)的實現(xiàn)進行說明,根據(jù)實際需要,也可以采用現(xiàn)有技術(shù)中其他任何可能的方式來實現(xiàn)人臉視覺搜索服務(wù),在此不予贅述。相應(yīng)的,上述物體視覺搜索服務(wù)檢測物體、對物體圖像進行識別的過程,可以采用現(xiàn)有技術(shù)中已有的方式進行。在其中一個具體示例中,物體視覺搜索服務(wù)可包括圖像特征提取、特征匹配、幾何驗證三個階段。以下針對各階段分別進行簡要說明。在進行特征提取時,可首先在圖像上提取SIFT特征(Scale-invariant featuretransform,尺度不變特征變換)。SIFT特征能夠?qū)D像的旋轉(zhuǎn)、尺度縮放、光照變化等因素保持不變性,對視角變化、仿射變換、噪聲等因素也能保持較好的穩(wěn)定性。具體可通過下述步驟實現(xiàn)對SIFT特征的提取首先進行尺度空間的極值檢測。為了有效提取穩(wěn)定的關(guān)鍵點,利用不同尺度的高斯差分函數(shù)DOG (Difference Of Gaussian)對原始圖像進行卷積。 D(x, y, σ ) = (G(x, y, k σ )-G(x, y, o))*I(x,y) = L(x, y, k σ )-L(x, y, σ )為此需建立高斯圖像金字塔,圖像金字塔共P組,每組有S層,第一組的各層圖像由原始圖像與不同尺度(相鄰層間尺度相差一個比例因子k)的高斯核卷積得到,而下一組的圖像由上一組的圖像降采樣得到。DOG金字塔由相鄰的高斯圖像金字塔相減得到。為了尋找尺度空間的極值點,DOG金字塔中每一個采樣點都要和它同尺度的8個相鄰點以及上下相鄰尺度對應(yīng)的9*2個點共26個點比較,如果該采樣點的值小于或大于它的26個相鄰點,那么該點即為一個局部極值點(稱之為關(guān)鍵點)。其次,進行關(guān)鍵點的精確定位。具體可以通過擬合三維二次函數(shù)來精確確定關(guān)鍵點的位置和尺度,同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣相應(yīng)點,以增強特征匹配的穩(wěn)定性,提高抗噪聲能力。關(guān)鍵點的準確定位包括有關(guān)鍵點的主方向的確定以及關(guān)鍵點描述子的生成。在確定關(guān)鍵點的主方向時,是在以關(guān)鍵點為中心的鄰域窗口內(nèi)采樣,并用直方圖統(tǒng)計鄰域像素的梯度方向。梯度直方圖的范圍是O 360度,其中,每10度一個柱,共36個柱。直方圖的主峰值(最大峰值)代表了關(guān)鍵點處鄰域梯度的主方向,即作為關(guān)鍵點的主方向。在梯度方向直方圖中,當存在另一個相當于主峰值80 %能量的峰值時,則將這個方向認為是該關(guān)鍵點的輔方向。生成關(guān)鍵點描述子時,首先將坐標軸零點方向旋轉(zhuǎn)到關(guān)鍵點的主方向,以取得旋轉(zhuǎn)不變性。然后,以關(guān)鍵點為中心取16*16的窗口,在每個4*4的小塊上計算8個方向的梯度方向直方圖,統(tǒng)計每個梯度方向的累加值,即可形成一個種子點。每個關(guān)鍵點可使用4*4共16個種子點來描述,這樣對于一個關(guān)鍵點就可以產(chǎn)生128個數(shù)據(jù),即最終形成128維的sift特征向量。此時sift特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何變形因素的影響,最后對特征向量進行長度歸一化,進一步去除光照變化的影響。在進行特征匹配時,對訓(xùn)練集圖片提取的特征集合采用分層k均值(Hierarchical k-means)聚類方法,可以生成一顆深度為L、分叉數(shù)為k的層次詞匯樹,其中每個葉子節(jié)點成為一個視覺詞匯(visual word),葉子節(jié)點數(shù)也即詞匯數(shù)目為kL,典型取值為k = 8或10, L = 6或7。在對圖片提取特征后,計算關(guān)鍵點的特征向量與層次詞匯樹的哪一個葉子節(jié)點距離最近(只需進行kL次點積計算),即可將特征向量量化為一個詞匯。這樣,一張圖片就可以用一個文檔向量來表示,文檔向量的每一維對應(yīng)一個視覺詞匯,其值則表示這個視覺詞匯對這個文檔的重要程度,通常采用的是TF-IDF(term frequency-inverse documentfrequency,詞頻-逆文檔頻率)權(quán)值。查詢圖片與數(shù)據(jù)庫中物體圖片之間的相似程度,即可用兩個文檔向量在向量空間中的距離(LI距離、L2距離、余弦相似度等等)來衡量。為了在海量的物體圖片數(shù)據(jù)庫上能夠進行快速的匹配查詢,對數(shù)據(jù)庫中的所有物體圖像建立倒排索引(Inverted Index),即以詞匯號為索引,記錄每個詞匯對應(yīng)哪些數(shù)據(jù)庫圖片號,以及詞匯在這些數(shù)據(jù)庫圖片中出現(xiàn)的次數(shù),匹配過程即變成為對那些含有查詢圖片詞匯的數(shù)據(jù)庫圖片投票加分的過程。選取與查詢圖片匹配最相似的前s個候選物體圖片,作為特征匹配階段的結(jié)果返回。然后進入幾何驗證過程。在進行幾何驗證時,是對特征匹配階段中排序在前的s個候選物體圖片,利用特征點的幾何位置信息與查詢圖片做進一步的精確匹配。采用最近鄰算法計算查詢圖片與數(shù)據(jù)庫圖片之間的點對匹配關(guān)系,用RASANC算法(Random SampleConsensus,隨機抽樣一致)從匹配點對中濾除不符合仿射變換約束的錯配點(外點)對, 留下符合仿射變換約束的匹配點(內(nèi)點)對,同時估計出從查詢圖片到數(shù)據(jù)庫圖片的仿射變換矩陣,按內(nèi)點對數(shù)從多到少的順序?qū)個候選物體圖片重新排序,若首選匹配物體的內(nèi)點對超過一定的閾值Th (可取Th = 10左右),則確認該匹配成功,否則給出拒識結(jié)果。在此過程中,利用RANSAC算法得到的仿射變換矩陣,以及內(nèi)點對的坐標,可計算出物體在查詢圖片中的位置。上述具體示例的說明僅僅針對采用現(xiàn)有技術(shù)中的其中一種方式對物體視覺搜索服務(wù)的實現(xiàn)進行說明,根據(jù)實際需要,也可以采用現(xiàn)有技術(shù)中其他任何可能的方式來實現(xiàn)物體視覺搜索服務(wù),在此不予贅述。相應(yīng)的,上述文字視覺搜索服務(wù)檢測文字內(nèi)容、對文字內(nèi)容進行識別的過程,可以采用現(xiàn)有技術(shù)中已有的方式進行。在其中一個具體示例中,文字視覺搜索服務(wù)可包括下述文字檢測、版面分析、區(qū)域二值化、區(qū)域行切分、字符切分、字符識別等階段,其中文字檢測,是指用連通域分析,從圖像中獲取文字塊的位置;版面分析,是指將輸入的文檔劃分為一個個同一屬性特征的區(qū)域,通常包括圖形、圖像、表格和文本等,針對文本,還需要判斷文本方向;區(qū)域二值化,是指對版面分析得到的區(qū)域進行處理,在具體實現(xiàn)時,還可以考慮水平文本類型,進行圖像的二值化;區(qū)域行切分,是指通過連通體檢測與分類,對部分連通體進行水平投影,將文本區(qū)域分割為子區(qū)域,檢測多行子區(qū)域,利用連通體歸并方法實現(xiàn)多行子區(qū)域的文字行切分,最后切割行間粘連的連通體,并根據(jù)距離信息把小連通體歸入所屬文字行;字符切分時,針對不同語言的文字特點,切分方法有所不同,例如對于歐洲文字和阿拉伯文字,通常采用基線的計算,來尋找切點,而中、日、韓印刷文字沒有基線的概念;字符識別,是指通過對字符圖像的特征提取,經(jīng)過多模版歐式距離分類器完成字符類別的分類,從而識別出字符的文本結(jié)果。上述具體示例的說明僅僅針對采用現(xiàn)有技術(shù)中的其中一種方式對文字視覺搜索服務(wù)的實現(xiàn)進行了說明,根據(jù)實際需要,也可以采用現(xiàn)有技術(shù)中其他任何可能的方式來實現(xiàn)文字視覺搜索服務(wù),在此不予贅述。
上述說明中,僅僅針對物體視覺搜索服務(wù)、人臉視覺搜索服務(wù)、文字視覺搜索服務(wù)的其中一種實現(xiàn)方式進行了詳細說明。針對條碼視覺搜索服務(wù)、Logo視覺搜索服務(wù)、景物視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)等其他類型的視覺搜索服務(wù),均可以采用現(xiàn)有技術(shù)中已有的方式進行,在此不予贅述。在本發(fā)明方案的其中一種實現(xiàn)方式中,客戶端可選用可進行定位的客戶端,在客戶端向服務(wù)器端發(fā)送圖像識別服務(wù)請求時,可同時將該客戶端所在位置的定位信息(例如經(jīng)緯度信息等)向服務(wù)器端發(fā)送,在服務(wù)器端向客戶端返回分類視覺搜索結(jié)果時,可以同時基于該定位信息給出相關(guān)其他信息。以景物視覺搜索服務(wù)為例,在識別出景物、確定該景物所在位置后,可以基于客戶端所在位置的定位信息,給出到達該景物的路徑信息。實施例二圖3中示出了本發(fā)明的基于云服務(wù)的視覺搜索方法實施例二的流程示意圖,在本實施例的方案中,與上述實施例一中方案的不同之處主要在于,其是以先判定包含圖像數(shù) 據(jù)中包含哪些分類類型信息,再將該圖像數(shù)據(jù)轉(zhuǎn)發(fā)給相應(yīng)的分類視覺搜索服務(wù)為例進行說明。如圖3所示,本實施例中的方法包括步驟步驟S301 :接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括有需要進行圖像識別的圖像數(shù)據(jù),進入步驟S302 ;步驟S302 :檢測出圖像識別云服務(wù)請求中的圖像數(shù)據(jù)中包含的各分類類型信息、以及各分類類型信息在圖像數(shù)據(jù)中的位置信息,進入步驟S303 ;步驟S303 :根據(jù)識別出的各分類類型信息、設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)及對應(yīng)的位置信息轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),進入步驟S304,在進行轉(zhuǎn)發(fā)時,可同時將檢測出的相應(yīng)分類類型信息對應(yīng)的位置信息發(fā)送給相應(yīng)的分類視覺搜素服務(wù);步驟S304 :各對應(yīng)的分類視覺搜索服務(wù)識別出相應(yīng)位置信息對應(yīng)的圖像數(shù)據(jù)所代表的分類類型信息,并確定該分類類型信息所對應(yīng)的名稱,進入步驟S305 ;步驟S305 :將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端發(fā)送,其中,這里的分類視覺搜索結(jié)果包括上述監(jiān)測確定的分類類型信息以及確定的對應(yīng)的名稱。依據(jù)本實施例中的方案,是先檢測圖像數(shù)據(jù)中包含哪些類別的分類類型信息,然后再將這些圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),避免了其他的分類視覺搜索服務(wù)的不必要的處理過程。其中,本實施例中的方案在具體實施時,也可以由用戶指定需要對發(fā)送的圖像數(shù)據(jù)進行哪些類型的分類視覺搜索服務(wù),例如只進行人臉視覺搜索服務(wù)、景物視覺搜索服務(wù)等等,此時,可以不進行上述針對圖像數(shù)據(jù)包含哪些分類類型信息的檢測過程,直接將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給指定的各分類視覺搜索服務(wù)即可。據(jù)此,在對圖像識別云服務(wù)請求進行預(yù)處理后,可執(zhí)行下述過程檢測圖像識別云服務(wù)請求中是否包含有分類類型信息;若有包含有分類類型信息,則說明用戶需要進行指定類型的分類視覺搜索服務(wù),則將上述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給該些分類類型對應(yīng)的各分類視覺搜索服務(wù);
若沒有包含有分類類型信息,則說明用戶未限定進行哪些類型的分類視覺搜索服務(wù),或者說是可能需要進行所有類型的分類視覺搜索服務(wù),則進入上述步驟S302中的檢測過程?;谏鲜霰景l(fā)明的一個實現(xiàn)方式中,在通過步驟S302檢測了圖像數(shù)據(jù)中包含了哪些類型的分類類型信息的情況下,在將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)之后,各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息時,可以不必再檢測圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息,具體可以通過下述方式進行各對應(yīng)的分類視覺搜索服務(wù)依據(jù)檢測出的該位置信息,識別出該位置信息對應(yīng)的圖像數(shù)據(jù)所代表的分類類型信息。當然,若是用戶指定了對發(fā)送的圖像數(shù)據(jù)需要進行的分類視覺搜索服務(wù)、且沒有進行圖像數(shù)據(jù)中包含哪些分類類型信息的檢測過程,則各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息時,需要檢測圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息,具體可以通過下述方式進行各對應(yīng)的分類視覺搜索服務(wù)檢測確定圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息若包含有,檢測出該分類類型信息在圖像數(shù)據(jù)中的位置信息,然后,各對應(yīng)的分類視覺搜索服務(wù)依據(jù)檢測出的該位置信息,識別出該位置信息對應(yīng)的圖像數(shù)據(jù)所代表的分類類型信息;若沒有,則當前的分類視覺搜索服務(wù)結(jié)束視覺搜索服務(wù)過程。在其中一個具體實現(xiàn)方式中,在接收到客戶端發(fā)送的圖像識別云服務(wù)請求之后,還可以對該圖像識別云服務(wù)請求進行預(yù)處理操作,以對請求的安全性進行驗證。因此,如圖3所示,在上述步驟S301與步驟S302之間,還可以包括步驟步驟S3012 :對圖像識別云服務(wù)請求進行預(yù)處理操作。其中,這里的預(yù)處理操作,主要包括對圖像識別云服務(wù)請求的安全性的驗證,例如判斷該圖像識別云服務(wù)請求是否為合法請求,以避免非法請求的接入。安全性驗證的具體實現(xiàn)方式,可以采用現(xiàn)有技術(shù)中已有的方式進行,在此不予多加贅述。基于上述本發(fā)明的實施例,在識別得到的綜合特征信息的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,以提高用戶的使用體驗,即在上述步驟S304與步驟S305之間,還可以步驟步驟S3045 :各對應(yīng)的分類視覺搜索服務(wù)根據(jù)所識別出的分類類型信息檢索與該分類類型信息相關(guān)的詳細信息。此時,上述向客戶端發(fā)送的視覺搜索結(jié)果中,包含有此時所檢索的該詳細信息。以下結(jié)合其中一個具體示例進行詳細說明,在該具體示例中,以客戶端發(fā)送的圖像識別云服務(wù)請求中未指定對圖像數(shù)據(jù)進行何種分類視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明方案進行限定。在該具體示例中,具體的過程可以是如下所述??蛻舳送ㄟ^網(wǎng)絡(luò)(例如Internet)向服務(wù)器端發(fā)送圖像識別云服務(wù)請求,其中,該圖像識別云服務(wù)請求中包括有待進行視覺搜索的圖片的圖像數(shù)據(jù)。服務(wù)器端接收到該圖像識別云服務(wù)請求后,對該圖像識別云服務(wù)請求進行預(yù)處理操作,對該圖像識別云服務(wù)請求的安全性進行驗證,判斷該圖像識別云服務(wù)請求是否為合法的請求,若安全性驗證通過,則進入下一步操作,否則,結(jié)束對圖像識別云服務(wù)請求的處理,或者也可以是向客戶端返回是錯誤或者非法請求的反饋信息。安全性驗證通過后,服務(wù)器端分析判斷該圖像識別云服務(wù)請求中是否包含有分類類型信息,即判斷用戶是否指定了要進行特定類型的分類視覺搜索服務(wù)若有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給該些分類類型信息對應(yīng)的分類視覺搜索服務(wù);若沒有指定的分類視覺搜索服務(wù),則檢測圖像數(shù)據(jù)中包含有哪些分類類型信息,并檢測出各分類類型信息在圖像數(shù)據(jù)對應(yīng)于圖片中的位置信息,然后將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)以及相應(yīng)的位置信息分別轉(zhuǎn)發(fā)給相應(yīng)的分類視覺搜索服務(wù)。在本發(fā)明的該具體示例中,以圖像識別云服務(wù)請求中未指定特定類型的分類視覺搜索服務(wù),且圖像數(shù)據(jù)中包含的分類類型信息包括人臉、物體及文字為例進行說明。也就是 說,在該具體示例中,是將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給了人臉視覺搜索服務(wù)、物理視覺搜索服務(wù)、文字視覺搜索服務(wù)為例進行說明。人臉視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的人臉在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的人臉圖像,并給出該人臉圖像對應(yīng)的名稱后,在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等)。最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。物體視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的物體在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體類別及其他相關(guān)信息,然后在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息。文字視覺搜索服務(wù)在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的文字在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的文字內(nèi)容,并搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該文字視覺搜索結(jié)果包括有類型為文字的類型信息、文字在圖片中的位置信息、該文字的名稱以及上述搜索到的其他相關(guān)信息。在得到人臉視覺搜索服務(wù)、物體視覺搜索服務(wù)、文字視覺搜索服務(wù)的分類視覺搜索結(jié)果后,將這些分類視覺搜索結(jié)果匯總后返回給客戶端,客戶端接收后,可將這些分類視覺搜索結(jié)果結(jié)合圖片進行顯示,例如,以人臉為例,基于人臉在圖片中的位置信息,在對應(yīng)于圖片的該范圍內(nèi)顯示類型信息、人臉的名稱以其他相關(guān)信息等等,從而用戶可以在客戶端上查看到與該圖片的相關(guān)的詳細信息,若返回的分類視覺搜索結(jié)果中有鏈接信息,用戶可以通過點擊該鏈接地址訪問具體的網(wǎng)頁。得到分類視覺搜索結(jié)果后的具體的擴展方式,根據(jù)實際需要可以設(shè)定很多種,具體在此不予贅述。
本實施例二中的其他技術(shù)特征與上述實施例一中的相同,在此不予贅述。根據(jù)上述本發(fā)明的基于云服務(wù)的視覺搜索服務(wù)方法,本發(fā)明還提供一種基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)。以下就本發(fā)明的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)的各實施例進行詳細說明。實施例一圖4中示出了本發(fā)明的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)實施例一的結(jié)構(gòu)示意圖,在本實施例的方案中,是以各特定類型的視覺搜索服務(wù)裝置來檢測圖像數(shù)據(jù)中是否包含有相應(yīng)的特定類別信息為例進行說明。如圖4所示,本實施例中的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)包括有服務(wù)器端402,服務(wù)器端402包括有云服務(wù)接入裝置4021,用于接收客戶端401發(fā)送的圖像識別云服務(wù)請求,該圖像 識別云服務(wù)請求中包括有需要進行圖像識別的圖像數(shù)據(jù),并根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)4022中對應(yīng)的分類視覺搜索服務(wù);與云服務(wù)接入裝置4021連接的分類視覺服務(wù)系統(tǒng)4022,用于接收云服務(wù)接入裝置4021發(fā)送的圖像數(shù)據(jù),采用各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱;以及與分類視覺服務(wù)系統(tǒng)4022相連接的視覺搜索結(jié)果匯總裝置4023,用于將各分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端401發(fā)送,其中,這里的視覺搜索結(jié)果包括有上述確定的分類類型信息以及對應(yīng)的名稱。根據(jù)本實施例中的方案,服務(wù)器端402中的云服務(wù)接入裝置4021基于接收到的客戶端401發(fā)送的圖像識別云服務(wù)請求,根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)4022中對應(yīng)的分類視覺搜索服務(wù),然后各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱,然后將各分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端401發(fā)送,其基于各不同類別的分類視覺搜索服務(wù)對圖像數(shù)據(jù)中的分類類型信息進行識別,從而可以識別得到圖片的綜合特征信息,在識別得到的綜合特征的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,提高了用戶的使用體驗。其中,上述分類視覺搜索服務(wù)可以包括有各種不同的特定領(lǐng)域的分類視覺搜索服務(wù),根據(jù)具體需要的不同,可以做不同的設(shè)定,例如可以包括但不限于下述類別的分類視覺搜索服務(wù)物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)等等。具體實現(xiàn)時,可以采用這些類別的分類視覺搜索服務(wù)中的任意一項或者任意組合。對應(yīng)的,上述分類類型信息與相應(yīng)的分類視覺搜索服務(wù)相對應(yīng),上述分類類型信 息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等類型,具體實現(xiàn)時,與上述所采用的不同類別的分類視覺搜索服務(wù)相對應(yīng),分類類型信息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等等這些分類信息中的任意一項或者任意組合?;诖耍景l(fā)明方案在實施時,可以具有很高的可擴展性,能夠添加任意類型的分 類視覺搜索服務(wù),且各類型的分類視覺搜索服務(wù)可以采用現(xiàn)有技術(shù)已有的方式進行。
據(jù)此,在本實施例的方案中,上述分類視覺服務(wù)4022系統(tǒng)具體可以包括但不限定于圖4中所示的物體視覺搜索服務(wù)裝置、人臉視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置、條碼視覺搜索服務(wù)裝置等特定類型的視覺搜索服務(wù)裝置,例如,還可以包括有景物視覺搜索服務(wù)裝置、Logo視覺搜索服務(wù)裝置、圖書視覺搜索服務(wù)裝置、CD視覺搜索服務(wù)裝置等等。其中,該物體視覺搜索服務(wù)裝置,用于檢測確定圖像數(shù)據(jù)中是否包含有物體,若沒有物體,則結(jié)束物體視覺搜索服務(wù),若有物體,確定物體在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,然后依據(jù)該位置信息識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體名稱及其他相關(guān)信息。該人臉視覺搜索服務(wù)裝置,用于檢測確定圖像數(shù)據(jù)中是否包含有人臉圖像,若沒有人臉圖像,則結(jié)束人臉視覺搜索服務(wù),若有人臉圖像,確定人臉圖像在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,然后依據(jù)該位置信息識別出具體的人臉圖像,確定該人臉圖像對應(yīng)的名稱?!ぴ撐淖忠曈X搜索服務(wù)裝置,用于檢測確定圖像數(shù)據(jù)中是否包含有文字內(nèi)容,若沒有文字內(nèi)容,則結(jié)束文字視覺搜索服務(wù),若有文字內(nèi)容,確定文字內(nèi)容在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,然后依據(jù)該位置信息識別出具體的文字內(nèi)容。基于上述本發(fā)明的實施例,在識別得到了分類類型信息并確定了其對應(yīng)的名稱的基礎(chǔ)上,可以進一步檢索與其相關(guān)的詳細信息,以進行進一步的綜合應(yīng)用,提高用戶的使用體驗,也就是說,各分類類型對應(yīng)的視覺搜索服務(wù)裝置在識別出分類類型信息、確定了對應(yīng)的名稱之后,還可以進一步檢索相關(guān)的詳細信息。據(jù)此上述物體視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等,最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息;上述人臉視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的其他人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等),最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息;上述文字視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等,最后可得到具體的文字視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。其中,依據(jù)本發(fā)明方案,用戶可以指定需要對發(fā)送的圖像數(shù)據(jù)進行哪些分類類型的分類視覺搜索服務(wù),例如只進行人臉視覺搜索服務(wù)、景物視覺搜索服務(wù)等等,因此,上述的設(shè)定分類轉(zhuǎn)發(fā)規(guī)則,可以做如下設(shè)定若上述圖像識別云服務(wù)請求中包含有分類類型信息,即用戶指定了要進行特定類型的分類視覺搜索服務(wù),則將上述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給指定的各分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置。例如以圖4中的系統(tǒng)為例,若圖像識別云服務(wù)請求中指定了物體與人臉的分類視覺搜索服務(wù),則云服務(wù)接入裝置只將該圖像數(shù)據(jù)轉(zhuǎn)發(fā)給物體視覺搜索服務(wù)裝置與人臉視覺搜索服務(wù)裝置,而無需轉(zhuǎn)發(fā)給文字視覺搜索服務(wù)裝置、條碼視覺搜索服務(wù)裝置等其他類別的視覺搜索服務(wù)裝置;若上述圖像識別云服務(wù)請求中未包含有分類類型信息,則將上述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給所有的各分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置。在其中一個具體實現(xiàn)方式中,在接收到客戶端401發(fā)送的圖像識別云服務(wù)請求之后,云服務(wù)接入裝置4021可以對該圖像識別云服務(wù)請求進行預(yù)處理操作,以對圖像識別云服務(wù)請求的安全性進行驗證。即,上述云服務(wù)接入裝置4021,還用于對圖像識別云服務(wù)請求進行預(yù)處理操作。其中,這里的預(yù)處理操作,主要包括對圖像識別云服務(wù)請求的安全性的驗證,例如判斷該圖像識別云服務(wù)請求是否為合法請求,以避免非法請求的接入。安全性驗證的具體 實現(xiàn)方式,可以采用現(xiàn)有技術(shù)中已有的方式進行,在此不予多加贅述。以下結(jié)合其中一個具體示例進行詳細說明,在該具體示例中,以客戶端發(fā)送的圖像識別云服務(wù)請求中為包含分類類型信息,即未指定對圖像數(shù)據(jù)進行何種分類視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明方案進行限定。在該具體示例中,具體的過程可以是如下所述??蛻舳?01通過網(wǎng)絡(luò)(例如Internet)向服務(wù)器端402發(fā)送圖像識別云服務(wù)請求,其中,該圖像識別云服務(wù)請求中包括有待進行視覺搜索的圖片的圖像數(shù)據(jù)。服務(wù)器端402的云服務(wù)接入裝置4021接收到該圖像識別云服務(wù)請求后,對該圖像識別云服務(wù)請求進行預(yù)處理操作,對該圖像識別云服務(wù)請求的安全性進行驗證,判斷該圖像識別云服務(wù)請求是否為合法的請求,若安全性驗證通過,則進入下一步操作,否則,結(jié)束對圖像識別云服務(wù)請求的處理,或者也可以是向客戶端返回錯誤或者是非法請求的反饋信肩、O安全性驗證通過后,云服務(wù)接入裝置4021分析判斷該圖像識別云服務(wù)請求中是否包含有分類類型信息,即判斷用戶是否指定了要進行特定類型的分類視覺搜索服務(wù)若有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給該些分類類型信息對應(yīng)的分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置;若沒有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給所有的分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置。在本發(fā)明的該具體示例中,是以圖像識別云服務(wù)請求中未指定特定類型的分類視覺搜索服務(wù)為例進行說明。也就是說,在該具體示例中,是將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給了所有的分類視覺搜索服務(wù)。由于具體設(shè)定的不同,服務(wù)器端402所包含的分類視覺搜索服務(wù)可能會有所不同且不能窮舉,因此,在下述說明中,以所有的分類視覺搜索服務(wù)包括了人臉視覺搜索服務(wù)、物理視覺搜索服務(wù)、文字視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明構(gòu)成限定。人臉視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有人臉圖像,若沒有人臉圖像,則結(jié)束人臉視覺搜索服務(wù),若有人臉圖像,確定人臉圖像在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,該位置信息通??梢园ㄈ四槇D像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息,識別出具體的人臉圖像,并給出該人臉圖像對應(yīng)的名稱后,在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的其他人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等)。最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。物體視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有物體,若沒有物體,則結(jié)束物體視覺搜索服務(wù),若有物體,確定物體在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,該位置信息通常可以包括人臉圖像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體類別及其他相關(guān)信息,然后在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到 的其他相關(guān)信息。文字視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,先檢測確定圖像數(shù)據(jù)中是否包含有文字內(nèi)容,若沒有文字內(nèi)容,則結(jié)束文字視覺搜索服務(wù),若有文字內(nèi)容,確定文字內(nèi)容在圖像數(shù)據(jù)對應(yīng)的圖片中的位置信息,該位置信息通??梢园ㄈ四槇D像區(qū)域在圖片中的位置坐標范圍,然后依據(jù)該位置信息識別出具體的文字內(nèi)容,并在相應(yīng)的數(shù)據(jù)庫中搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。在得到人臉視覺搜索服務(wù)、物體視覺搜索服務(wù)、文字視覺搜索服務(wù)的分類視覺搜索結(jié)果后,視覺搜索結(jié)果匯總裝置4023將這些分類視覺搜索結(jié)果匯總后返回給客戶端401??蛻舳?01接收后,可將這些分類視覺搜索結(jié)果結(jié)合圖片進行顯示,例如,以人臉為例,基于人臉在圖片中的位置信息,在對應(yīng)于圖片的該范圍內(nèi)顯示類型信息、人臉的名稱以其他相關(guān)信息等等,從而用戶可以在客戶端上查看到與該圖片的相關(guān)的詳細信息,若返回的分類視覺搜索結(jié)果中有鏈接信息,用戶可以通過點擊該鏈接地址訪問具體的網(wǎng)頁。得到分類視覺搜索結(jié)果后的具體的擴展方式,根據(jù)實際需要可以設(shè)定很多種,具體在此不予贅述。在另外一種實現(xiàn)方式中,本實施例中的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng),還可以包括有上述所提及的客戶端401,該客戶端401,可以是任何類型的客戶端,包括但不限于移動終端、PC客戶端、WEB客戶端、平板電腦、筆記本電腦、車載電子系統(tǒng)、掌上電腦等等,具體在此不予贅述。其中,客戶端與服務(wù)器端之間的交互過程,包括客戶端向服務(wù)器端發(fā)送圖像識別服務(wù)請求、服務(wù)器端向客戶端發(fā)送分類視覺搜索結(jié)果,可以根據(jù)需要采用任何一種通信協(xié)議來進行,包括但不限于HTTP協(xié)議、TCP協(xié)議等等。另外,在本發(fā)明方案的其中一種實現(xiàn)方式中,客戶端可選用可進行定位的客戶端,在客戶端向服務(wù)器端發(fā)送圖像識別服務(wù)請求時,可同時將該客戶端所在位置的定位信息(例如經(jīng)緯度信息等)向服務(wù)器端發(fā)送,在服務(wù)器端向客戶端返回分類視覺搜索結(jié)果時,可以同時基于該定位信息給出相關(guān)其他信息。以景物視覺搜索服務(wù)為例,在識別出景物、確定該景物所在位置后,可以基于客戶端所在位置的定位信息,給出到達該景物的路徑信息。在本實施例的方案中,各特定類別的分類視覺搜索服務(wù)裝置對應(yīng)的分類視覺搜索服務(wù)的具體實現(xiàn)方式,可以上述本發(fā)明方法中的相同,在此不予多加贅述。實施例二圖5中示出了本發(fā)明的基于云服務(wù)的視覺搜索系統(tǒng)實施例二的結(jié)構(gòu)示意圖。在本實施例中,與上述實施例一中的方案的不同之處主要在于,在服務(wù)器端502,由統(tǒng)一的圖像 識別服務(wù)裝置5022對圖像數(shù)據(jù)中包含有哪些分類類型信息進行檢測確定。如圖5所示,本實施例中的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)包括有服務(wù)器端502,服務(wù)器端502包括有云服務(wù)接入裝置501,用于接收客戶端501發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括有需要進行圖像識別的圖像數(shù)據(jù);與云服務(wù)接入裝置5021連接的圖像識別服務(wù)裝置5022,用于檢測出圖像識別云服務(wù)請求中的圖像數(shù)據(jù)中包含的各分類類型信息、各分類類型信息在圖像數(shù)據(jù)中的位置信息,并根據(jù)識別出的各分類類型信息、設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)及對應(yīng)的位置信息轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)中對應(yīng)的分類視覺搜索服務(wù);與圖像識別服務(wù)裝置5022連接的分類視覺服務(wù)系統(tǒng)5023,用于接收圖像識別服務(wù)裝置5022發(fā)送的圖像數(shù)據(jù),采用各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱;以及與分類視覺服務(wù)系統(tǒng)5023相連接的視覺搜索結(jié)果匯總裝置5024,用于將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端501發(fā)送,其中,這里的視覺搜索結(jié)果包括有上述確定的分類類型信息、以及對應(yīng)的名稱。依據(jù)本實施例中的方案,是先檢測圖像數(shù)據(jù)中包含哪些類別的分類類型信息,然后再將這些圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù),避免了其他的分類視覺搜索服務(wù)進行不必要的處理。其中,上述分類視覺搜索服務(wù)可以包括有各種不同的特定領(lǐng)域的分類視覺搜索服務(wù),根據(jù)具體需要的不同,可以做不同的設(shè)定,例如可以包括但不限于下述類別的分類視覺搜索服務(wù)物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)等等。具體實現(xiàn)時,可以采用這些類別的分類視覺搜索服務(wù)中的任意一項或者任意組合。對應(yīng)的,上述分類類型信息與相應(yīng)的分類視覺搜索服務(wù)相對應(yīng),上述分類類型信息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等類型,具體實現(xiàn)時,與上述所采用的不同類別的分類視覺搜索服務(wù)相對應(yīng),分類類型信息可以包括物體、文字、人臉、條碼、景物、Logo、圖書、CD等等這些分類信息中的任意一項或者任意組合。據(jù)此,如圖5所示,在本實施例的方案中,上述分類視覺服務(wù)系統(tǒng)5023具體可以包括但不限定于圖5中所示的物體視覺搜索服務(wù)裝置、人臉視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置、條碼視覺搜索服務(wù)裝置等特定類型的視覺搜索服務(wù)裝置,例如,還可以包括有景物視覺搜索服務(wù)裝置、Logo視覺搜索服務(wù)裝置、圖書視覺搜索服務(wù)裝置、CD視覺搜索服
務(wù)裝置等等。其中,該物體視覺搜索服務(wù)裝置,用于依據(jù)圖像識別服務(wù)裝置5022轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息識別出具體的物體圖像,并依據(jù)該物體圖片匹配出該物體的具體類別及其他相關(guān)信息,給出該物體的名稱,得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱。該人臉視覺搜索服務(wù)裝置,用于依據(jù)圖像識別服務(wù)裝置5022轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息,識別出具體的人臉圖像 ,給出該人臉圖像對應(yīng)的名稱,最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱。該文字視覺搜索服務(wù)裝置,用于依據(jù)圖像識別服務(wù)裝置5022轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息識別出具體的文字內(nèi)容,最后可得到具體的文字視覺搜索結(jié)果,該文字視覺搜索結(jié)果包括有類型為文字的類型信息、文字在圖片中的位置信息、該文字的名稱?;谏鲜霰景l(fā)明的實施例,在識別得到了特定類別信息的基礎(chǔ)上,可以進一步檢索與該特定類別信息相關(guān)的詳細信息,以進行進一步的綜合應(yīng)用,提高用戶的使用體驗,也就是說,各特定類別的視覺搜索服務(wù)裝置在識別分類類型信息后,還進一步檢索與該分類類型信息相關(guān)的詳細信息。據(jù)此上述物體視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等,此時,上述該物體視覺搜索結(jié)果,還包括該搜索到的其他相關(guān)信息;上述人臉視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等),此時,上述人臉視覺搜索結(jié)果,還包括該搜索到的其他相關(guān)信息;上述文字視覺搜索服務(wù)裝置,還用于搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等,此時,上述文字視覺搜索結(jié)果,還包括該搜索到的其他相關(guān)信息。其中,本實施例中的方案在具體實施時,用戶也可以指定需要對發(fā)送的圖像數(shù)據(jù)進行哪些類型的分類視覺搜索服務(wù),例如只進行人臉視覺搜索服務(wù)、景物視覺搜索服務(wù)等等,此時,圖像識別服務(wù)裝置5022可以不進行上述針對圖像數(shù)據(jù)包含哪些分類類型信息的檢測過程,直接將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給指定的各分類視覺搜索服務(wù)即可,在此不予贅述?;谏鲜霰景l(fā)明的一個實現(xiàn)方式中,以通過圖像識別服務(wù)裝置5022檢測了圖像數(shù)據(jù)中包含了哪些類別的分類類型信息為例,在將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)之后,各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息時,可以不必再檢測圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息,具體可以通過下述方式進行各對應(yīng)的分類視覺搜索服務(wù)依據(jù)檢測出的該位置信息,識別出該位置信息對應(yīng)的圖像數(shù)據(jù)所代表的分類類型信息,確定對應(yīng)的名稱。當然,若是用戶指定了對發(fā)送的圖像數(shù)據(jù)需要進行的分類視覺搜索服務(wù)、且圖像識別服務(wù)裝置5022沒有進行圖像數(shù)據(jù)中包含哪些分類類型信息的檢測過程,則各對應(yīng)的分類視覺搜索服務(wù)需要檢測圖像數(shù)據(jù)中是否包含有對應(yīng)的分類類型信息。在其中一個具體實現(xiàn)方式中,在接收到客戶端501發(fā)送的圖像識別云服務(wù)請求之后,云服務(wù)接入裝置5021可以對該圖像識別云服務(wù)請求進行預(yù)處理操作,以對請求的安全性進行驗證。即,上述云服務(wù)接入裝置5021,還用于對圖像識別云服務(wù)請求進行預(yù)處理操作。其中,這里的預(yù)處理操作,主要包括對圖像識別云服務(wù)請求的安全性的驗證,例如判斷該圖像識別云服務(wù)請求是否為合法請求,以避免非法請求的接入。安全性驗證的具體 實現(xiàn)方式,可以采用現(xiàn)有技術(shù)中已有的方式進行,在此不予多加贅述。以下結(jié)合本實施例實施時的其中一個具體示例進行詳細說明,在該具體示例中,以客戶端發(fā)送的圖像識別云服務(wù)請求中未指定對圖像數(shù)據(jù)進行何種分類視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明方案進行限定。在該具體示例中,具體的過程可以是如下所述??蛻舳?01通過網(wǎng)絡(luò)(例如Internet)向服務(wù)器端502發(fā)送圖像識別云服務(wù)請求,其中,該圖像識別云服務(wù)請求中包括有待進行視覺搜索的圖片的圖像數(shù)據(jù)。服務(wù)器端502的云服務(wù)接入裝置5021接收到該圖像識別云服務(wù)請求后,對該圖像識別云服務(wù)請求進行預(yù)處理操作,對該圖像識別云服務(wù)請求的安全性進行驗證,判斷該圖像識別云服務(wù)請求是否為合法的請求,若安全性驗證通過,則進入下一步操作,否則,結(jié)束對圖像識別云服務(wù)請求的處理,或者也可以是向客戶端返回是錯誤或者非法請求的反饋信肩、O安全性驗證通過后,圖像識別服務(wù)裝置5022分析判斷該圖像識別云服務(wù)請求中是否包含有分類類型信息,即判斷用戶是否指定了要進行特定類型的分類視覺搜索服務(wù)若有指定的分類視覺搜索服務(wù),則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給該些分類類型信息對應(yīng)的分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置;若沒有指定的分類視覺搜索服務(wù),則檢測圖像數(shù)據(jù)中包含有哪些分類類型信息,并檢測出各分類類型信息在圖像數(shù)據(jù)對應(yīng)于圖片中的位置信息,然后將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)以及相應(yīng)的位置分別轉(zhuǎn)發(fā)給相應(yīng)的分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置。在本發(fā)明的該具體示例中,以圖像識別云服務(wù)請求中未指定特定類型的分類視覺搜索服務(wù),且圖像數(shù)據(jù)中包含的分類類型信息包括人臉、物體及文字為例進行說明。也就是說,在該具體示例中,是將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)分別轉(zhuǎn)發(fā)給了人臉視覺搜索服務(wù)裝置、物體視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置為例進行說明。人臉視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的人臉在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的人臉圖像,并給出該人臉圖像對應(yīng)的名稱后,在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的人臉圖像、該人臉圖像中人物名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等)。最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。
物體視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的物體在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體類別及其他相關(guān)信息,然后在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息。文字視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的文字在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的文字內(nèi)容,并搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該文字視覺搜索結(jié)果包括有類型為文字的類型信息、文字在圖片中的位置信息、該文字的名稱以及上述搜索到的其他相關(guān)信息。在得到人臉視覺搜索服務(wù)裝置、物體視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置 的分類視覺搜索結(jié)果后,視覺搜索結(jié)果匯總裝置5024將這些分類視覺搜索結(jié)果匯總后返回給客戶端501。客戶端501接收后,可將這些分類視覺搜索結(jié)果結(jié)合圖片進行顯示,例如,以人臉為例,基于人臉在圖片中的位置信息,在對應(yīng)于圖片的該范圍內(nèi)顯示類型信息、人臉的名稱以其他相關(guān)信息等等,從而用戶可以在客戶端上查看到與該圖片的相關(guān)的詳細信息,若返回的分類視覺搜索結(jié)果中有鏈接信息,用戶可以通過點擊該鏈接地址訪問具體的網(wǎng)頁。得到分類視覺搜索結(jié)果后的具體的擴展方式,根據(jù)實際需要可以設(shè)定很多種,具體在此不予贅述。在另外一種實現(xiàn)方式中,本實施例中的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng),還可以包括有上述所提及的客戶端501,該客戶端501,可以是任何類型的客戶端,包括但不限于移動終端、PC客戶端、WEB客戶端、平板電腦、筆記本電腦、車載電子系統(tǒng)、掌上電腦等等,具體在此不予贅述。本實施例二中的其他技術(shù)特征與上述實施例一中的相同,在此不予贅述。實施例三圖6中示出了本發(fā)明的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)實施例三的結(jié)構(gòu)示意圖,在本實施例三的方案中,與上述實施例二的不同之處主要在于,本實施例中是在客戶端設(shè)置圖像識別服務(wù)裝置對圖像數(shù)據(jù)中包含有哪些分類類型信息進行檢測確定。如圖6所示,本實施例中的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng)包括有客戶端601以及服務(wù)器端602,其中客戶端601包括有圖像識別服務(wù)裝置6011,用于檢測出圖像數(shù)據(jù)中包含的各分類類型信息、各分類類型信息在圖像數(shù)據(jù)中的位置信息,并依據(jù)檢測出的分類類型信息以及對應(yīng)的位置信息向服務(wù)端發(fā)送圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括有需要進行圖像識別的圖像數(shù)據(jù)、以及上述檢測出的分類類型信息以及對應(yīng)的位置信息;服務(wù)器端602包括有云服務(wù)接入裝置6021,用于接收客戶端601發(fā)送的圖像識別云服務(wù)請求,并依據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像識別云服務(wù)請求中的圖像數(shù)據(jù)及對應(yīng)的位置信息轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)6022中對應(yīng)的分類視覺搜索服務(wù);
與云服務(wù)接入裝置6021連接的分類視覺服務(wù)系統(tǒng)6022,用于接收云服務(wù)接入裝置6021發(fā)送的圖像數(shù)據(jù)及對應(yīng)的位置信息,采用各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定該分類類型信息對應(yīng)的名稱;以及與分類視覺服務(wù)系統(tǒng)6022相連接的視覺搜索結(jié)果匯總裝置6023,用于將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端601發(fā)送,其中,這里的視覺搜索結(jié)果包括有上述確定的各分類類型信息以及對應(yīng)的名稱。依據(jù)本實施例中的方案,是由客戶端601先檢測圖像數(shù)據(jù)中包含哪些類型的分類類型信息,然后再向服務(wù)器端602發(fā)送圖像識別云服務(wù)請求,由服務(wù)器端602對圖像數(shù)據(jù)中的具體分類類型信息識別,避免了其他的分類視覺搜索服務(wù)進行不必要的處理。其中,上述分類視覺搜索服務(wù)可以包括有各種不同的特定領(lǐng)域的分類視覺搜索服
務(wù),根據(jù)具體需要的不同,可以做不同的設(shè)定,例如可以包括但不限于下述類別的分類視覺搜索服務(wù)物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)等等。具體實現(xiàn)時,可以采用這些類別的分類視覺搜索服務(wù)中的任意一項或者任意組合。據(jù)此,在本實施例的方案中,上述分類視覺服務(wù)系統(tǒng)6022具體可以包括但不限定于圖6中所示的物體視覺搜索服務(wù)裝置、人臉視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置、條碼視覺搜索服務(wù)裝置等特定類型的視覺搜索服務(wù)裝置,例如,還可以包括有景物視覺搜索服務(wù)裝置、Logo視覺搜索服務(wù)裝置、圖書視覺搜索服務(wù)裝置、CD視覺搜索服務(wù)裝置等等。其中,該物體視覺搜索服務(wù)裝置,用于依據(jù)云服務(wù)接入裝置6021轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體名稱及其他相關(guān)信息。該人臉視覺搜索服務(wù)裝置,用于依據(jù)云服務(wù)接入裝置6021轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息識別出具體的人臉圖像,給出該人臉圖像對應(yīng)的名稱。該文字視覺搜索服務(wù)裝置,用于依據(jù)云服務(wù)接入裝置6021轉(zhuǎn)發(fā)的圖像數(shù)據(jù)以及對應(yīng)的位置信息識別出具體的文字內(nèi)容?;谏鲜霰景l(fā)明的實施例,在識別得到了分類類型信息并確定了其對應(yīng)的名稱的基礎(chǔ)上的基礎(chǔ)上,可以進一步檢索與其相關(guān)的詳細信息,以進行進一步的綜合應(yīng)用,提高用戶的使用體驗,也就是說,各分類類型對應(yīng)的視覺搜索服務(wù)裝置在識別出分類類型信息、確定了對應(yīng)的名稱之后,還可以進一步檢索相關(guān)的詳細信息。據(jù)此上述物體視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息;上述人臉視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的其他人臉圖像、該人臉圖像中人物的名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等),最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息;上述文字視覺搜索服務(wù)裝置,還用于在相應(yīng)的數(shù)據(jù)庫中搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如 果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。其中,本實施例中的方案在具體實施時,用戶也可以指定需要對發(fā)送的圖像數(shù)據(jù)進行哪些分類類型的分類視覺搜索服務(wù),例如只進行人臉視覺搜索服務(wù)、景物視覺搜索服務(wù)等等,此時,圖像識別服務(wù)裝置6021可以不進行上述針對圖像數(shù)據(jù)包含哪些分類類型信息的檢測過程,直接向服務(wù)器端602發(fā)送包含了指定類別的圖像識別云服務(wù)請求即可,在此不予贅述。以下結(jié)合本實施例實施時的其中一個具體示例進行詳細說明,在該具體示例中,以客戶端601發(fā)送的圖像識別云服務(wù)請求中未指定對圖像數(shù)據(jù)進行何種分類視覺搜索服務(wù)為例進行說明,這種說明并不用以對本發(fā)明方案進行限定。在該具體示例中,具體的過程可以是如下所述。客戶端601在接收到用戶通過鼠標點擊、手指觸摸等方式發(fā)出的圖像識別指令時,圖像識別服務(wù)裝置6011檢測用戶是否選擇指定了特定的分類視覺搜索服務(wù)若有指定的分類視覺搜索服務(wù),將包含了指定分類類型信息的圖像識別云服務(wù)請求向服務(wù)器端發(fā)送;若沒有指定分類視覺搜索服務(wù),則檢測圖像數(shù)據(jù)中包含有哪些分類類型信息,并檢測出各分類類型信息在圖像數(shù)據(jù)對應(yīng)于圖片中的位置信息,然后將包含了檢測出的分類類型信息、相應(yīng)的位置信息以及圖片的圖像數(shù)據(jù)的圖像識別云服務(wù)請求向服務(wù)器端發(fā)送。在該具體示例的下述說明中,以圖像識別云服務(wù)請求中未指定特定的分類視覺搜索服務(wù),且圖像數(shù)據(jù)中包含的分類類型信息包括人臉、物體及文字為例進行說明。服務(wù)器端602的云服務(wù)接入裝置6021接收到該包含了檢測出的分類類型信息、相應(yīng)的位置信息以及圖像數(shù)據(jù)的圖像識別云服務(wù)請求后,對該圖像識別云服務(wù)請求進行預(yù)處理操作,對該圖像識別云服務(wù)請求的安全性進行驗證,判斷該圖像識別云服務(wù)請求是否為合法的請求,若安全性驗證通過,則進入下一步操作,否則,結(jié)束對圖像識別云服務(wù)請求的處理,或者也可以是向客戶端601返回錯誤或者非法請求的反饋信息。安全性驗證通過后,云服務(wù)接入裝置6021將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)以及相應(yīng)的位置信息分別轉(zhuǎn)發(fā)給相應(yīng)的分類視覺搜索服務(wù)對應(yīng)的分類視覺搜索服務(wù)裝置。以圖像識別服務(wù)裝置6011檢測出的類別信息包括有人臉、物體、文字為例,則將該圖像識別服務(wù)請求中的圖像數(shù)據(jù)及相應(yīng)的位置信息分別轉(zhuǎn)發(fā)給人臉視覺搜索服務(wù)裝置、物體視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置。人臉視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的人臉在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的人臉圖像,并給出該人臉圖像對應(yīng)的名稱后,在相應(yīng)的數(shù)據(jù)庫中搜索與識別出的人臉圖像相應(yīng)的詳細信息,例如,與該人臉圖像相似的人臉圖像、該人臉圖像中人物名稱等等,基于搜索出的人物名稱,還可以進一步搜索出該人物的人物簡介以及其他相關(guān)信息,例如若為明星人物,可進一步獲得與該明星人物相關(guān)的鏈接地址(例如主頁地址、博客地址、微博地址等)。最后可得到具體的人臉視覺搜索結(jié)果,該人臉視覺搜索結(jié)果包括有類型為人臉的類型信息、人臉在圖片中的位置信息、該人臉的名稱以及上述搜索到的其他相關(guān)信息。物體視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的物體在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的物體圖像,并依據(jù)該物體圖像匹配出該物體的具體類別及其他相關(guān)信息,然后在相應(yīng)的數(shù)據(jù)庫中搜索與識別出與該物體相對應(yīng)的其他詳細信息,例如該物體的生產(chǎn)年份等等。最后可得到具體的物體視覺搜索結(jié)果,該物體視覺搜索結(jié)果包括有類型為物體的類型信息、物體在圖片中的位置信息、該物體的名稱以及上述搜索到的其他相關(guān)信息。文字視覺搜索服務(wù)裝置在接收到轉(zhuǎn)發(fā)的圖像數(shù)據(jù)后,依據(jù)檢測出的文字在圖像數(shù)據(jù)對應(yīng)圖片中的位置信息,識別出具體的文字內(nèi)容,并搜索確定與該文字內(nèi)容相關(guān)的其他相關(guān)信息,例如如果文字內(nèi)容為網(wǎng)址信息,則給出具體的鏈接地址等等。最后可得到具體的文字視覺搜索結(jié)果,該文字視覺搜索結(jié)果包括有類型為文字的類型信息、文字在圖片中的位置信息、該文字的名稱以及上述搜索到的其他相關(guān)信息。
在得到人臉視覺搜索服務(wù)裝置、物體視覺搜索服務(wù)裝置、文字視覺搜索服務(wù)裝置的分類視覺搜索結(jié)果后,視覺搜索結(jié)果匯總裝置6023將這些分類視覺搜索結(jié)果匯總后返回給客戶端601,客戶端601接收后,可將這些分類視覺搜索結(jié)果結(jié)合圖片進行顯示,例如,以人臉為例,基于人臉在圖片中的位置信息,在對應(yīng)于圖片的該范圍內(nèi)顯示類型信息、人臉的名稱以其他相關(guān)信息等等,從而用戶可以在客戶端上查看到與該圖片的相關(guān)的詳細信息,若返回的分類視覺搜索結(jié)果中有鏈接信息,用戶可以通過點擊該鏈接地址訪問具體的網(wǎng)頁。得到分類視覺搜索結(jié)果后的具體的擴展方式,根據(jù)實際需要可以設(shè)定很多種,具體在此不予贅述。本實施例中的客戶端601,可以是任何類型的客戶端,包括但不限于移動終端、PC客戶端、WEB客戶端、平板電腦、筆記本電腦、車載電子系統(tǒng)、掌上電腦等等,具體在此不予贅述。本實施例三中的其他技術(shù)特征與上述實施例一中的相同,在此不予贅述。以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準。
權(quán)利要求
1.一種基于云服務(wù)的視覺搜索方法,其特征在于,包括步驟 接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括圖像數(shù)據(jù); 根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù); 各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定各分類類型信息對應(yīng)圖像數(shù)據(jù)的名稱,得到分類視覺搜索結(jié)果,所述分類視覺搜索結(jié)果包括所述分類類型信息以及對應(yīng)的名稱; 將各對應(yīng)的分類視覺搜索服務(wù)的分類視覺搜索結(jié)果匯總后向客戶端發(fā)送。
2.根據(jù)權(quán)利要求I所述的基于云服務(wù)的視覺搜索方法,其特征在于 在將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)之后、各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息之前,還包括步驟各對應(yīng)的分類視覺搜索服務(wù)檢測圖像數(shù)據(jù)中是否包括對應(yīng)的分類類型信息,若是,檢測出該分類類型信息在圖像數(shù)據(jù)中的位置信息,依據(jù)該位置信息進行識別,確定對應(yīng)的名稱; 或者 根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)具體包括檢測圖像數(shù)據(jù)中包括的分類類型信息,并將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給所檢測出的分類類型信息對應(yīng)的分類視覺搜索服務(wù)。
3.根據(jù)權(quán)利要求I所述的基于云服務(wù)的視覺搜索方法,其特征在于,在將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)之前,還包括步驟 識別出圖像識別云服務(wù)請求中的包含的各分類類型信息、以及各分類類型信息在圖像數(shù)據(jù)中的位置信息; 根據(jù)所識別的各分類類型信息以及設(shè)定分類轉(zhuǎn)發(fā)規(guī)則,將所述圖像數(shù)據(jù)、以及對應(yīng)的位置信息轉(zhuǎn)發(fā)給所識別的分類類型信息對應(yīng)的分類視覺搜索服務(wù)。
4.根據(jù)權(quán)利要求3所述的基于云服務(wù)的視覺搜索方法,其特征在于,所述設(shè)定分類轉(zhuǎn)發(fā)規(guī)則包括 若所述圖像識別云服務(wù)請求中包含分類類型信息,將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給該分類類型信息對應(yīng)的各分類視覺搜索服務(wù); 若所述圖像識別云服務(wù)請求中未包含分類類型信息,將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給所有的各分類視覺搜索服務(wù)。
5.根據(jù)權(quán)利要求I至4任意一項所述的基于云服務(wù)的視覺搜索方法,其特征在于 在接收到圖像識別云服務(wù)請求之后,還包括步驟對所述圖像識別云服務(wù)請求進行預(yù)處理操作,所述預(yù)處理操作包括安全性驗證操作; 和/或 在確定對應(yīng)的名稱之后、將各對應(yīng)的分類視覺搜索服務(wù)的視覺搜索結(jié)果匯總后向客戶端發(fā)送之前,還包括步驟各對應(yīng)的分類視覺搜索服務(wù)根據(jù)所識別出的分類類型信息及名稱檢索設(shè)定類型的相關(guān)詳細信息;所述視覺搜索結(jié)果還包括檢索的所述詳細信息; 和/或 所述分類視覺搜索服務(wù)包括物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)中的任意一項或者任意組合,所述分類類型信息包括物體、文字、人臉、條碼、景物、Logo、圖書、⑶中的任意一項或者任意組合。
6.一種基于云服務(wù)的視覺搜索服務(wù)系統(tǒng),其特征在于,包括服務(wù)端,所述服務(wù)端包括有 云服務(wù)接入裝置,用于接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括圖像數(shù)據(jù),并根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給分類視覺服務(wù)系統(tǒng)中對應(yīng)的分類視覺搜索服務(wù); 分類視覺服務(wù)系統(tǒng),用于采用各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定各分類類型信息對應(yīng)圖像數(shù)據(jù)的名稱,得到分類視覺搜索結(jié)果,所述分類視覺搜索結(jié)果包括所述分類類型信息以及對應(yīng)的名稱; 視覺搜索結(jié)果匯總裝置,用于將各對應(yīng)的分類視覺搜索結(jié)果匯總后向客戶端發(fā)送。
7.根據(jù)權(quán)利要求6所述的基于云服務(wù)的視覺搜索系統(tǒng),其特征在于,還包括連接于云服務(wù)接入裝置與分類視覺服務(wù)系統(tǒng)之間的圖像識別服務(wù)裝置,用于識別出圖像識別云服務(wù)請求中的圖像數(shù)據(jù)中包含的各分類類型信息、以及各分類類型信息在圖像數(shù)據(jù)中的位置信息,并根據(jù)所識別的各分類類型信息以及設(shè)定分類轉(zhuǎn)發(fā)規(guī)則,將所述圖像數(shù)據(jù)、以及所識別出的分類類型信息對應(yīng)的位置信息轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù)。
8.根據(jù)權(quán)利要求7所述的基于云服務(wù)的視覺搜索系統(tǒng),其特征在于,所述設(shè)定分類轉(zhuǎn)發(fā)規(guī)則包括 若所述圖像識別云服務(wù)請求中包含分類類型信息,將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給該分類類型信息對應(yīng)的各分類視覺搜索服務(wù); 若所述圖像識別云服務(wù)請求中未包含分類類型信息,將所述圖像數(shù)據(jù)轉(zhuǎn)發(fā)給所有的各分類視覺搜索服務(wù)。
9.根據(jù)權(quán)利要求6所述的基于云服務(wù)的視覺搜索系統(tǒng),其特征在于 所述分類視覺服務(wù)系統(tǒng),還用于采用各對應(yīng)的分類視覺搜索服務(wù)確定圖像數(shù)據(jù)中是否包含對應(yīng)的分類類型信息,若是,檢測出該分類類型信息在圖像數(shù)據(jù)中的位置信息,并依據(jù)該位置信息進行識別,確定對應(yīng)的名稱; 或者 還包括設(shè)置在所述客戶端的圖像識別服務(wù)裝置,用于檢測圖像中包含的各分類類型信息、以及各分類類型信息在圖像數(shù)據(jù)中的位置信息,并根據(jù)所檢測的各分類類型信息向服務(wù)器端發(fā)送圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括所識別的分類類型信息、對應(yīng)的位置信息以及圖像的圖像數(shù)據(jù)。
10.根據(jù)權(quán)利要求6至9任意一項所述的基于云服務(wù)的視覺搜索服務(wù)系統(tǒng),其特征在于 所述云服務(wù)接入裝置,還用于對所述圖像識別云服務(wù)請求進行預(yù)處理操作; 和/或 所述分類視覺服務(wù)系統(tǒng),還用于采用各對應(yīng)的分類視覺搜索服務(wù)根據(jù)所識別出的分類類型信息檢索及名稱檢索設(shè)定類型的相關(guān)詳細信息;所述視覺搜索結(jié)果包括檢索的所述詳細信息; 和/或 所述分類視覺搜索服務(wù)包括物體視覺搜索服務(wù)、文字視覺搜索服務(wù)、人臉視覺搜索服務(wù)、 條碼視覺搜索服務(wù)、景物視覺搜索服務(wù)、Logo視覺搜索服務(wù)、圖書視覺搜索服務(wù)、CD視覺搜索服務(wù)中的任意一項或者任意組合,所述分類類型信息包括物體、文字、人臉、條碼、景物、Logo、圖書、⑶中的任意一項或者任意組合; 和/或 還包括所述客戶端。
全文摘要
一種基于云服務(wù)的視覺搜索方法及系統(tǒng),該方法包括接收客戶端發(fā)送的圖像識別云服務(wù)請求,該圖像識別云服務(wù)請求中包括圖像數(shù)據(jù);根據(jù)設(shè)定分類轉(zhuǎn)發(fā)規(guī)則將圖像數(shù)據(jù)轉(zhuǎn)發(fā)給對應(yīng)的分類視覺搜索服務(wù);各對應(yīng)的分類視覺搜索服務(wù)識別出圖像數(shù)據(jù)中對應(yīng)的分類類型信息,確定各分類類型信息對應(yīng)圖像數(shù)據(jù)的名稱,得到分類視覺搜索結(jié)果;將各對應(yīng)的分類視覺搜索服務(wù)的分類視覺搜索結(jié)果匯總后向客戶端發(fā)送。根據(jù)本發(fā)明方案,其基于各不同類別的分類視覺搜索服務(wù)對圖像數(shù)據(jù)中的分類類型信息進行檢測和識別,從而可以識別得到圖片的綜合特征信息,在識別得到的綜合特征信息的基礎(chǔ)上,可以進行進一步的綜合應(yīng)用,提高了用戶的使用體驗。
文檔編號G06F17/30GK102682091SQ20121012385
公開日2012年9月19日 申請日期2012年4月25日 優(yōu)先權(quán)日2012年4月25日
發(fā)明者侯杰, 劉海龍, 周曉波, 熊鵬飛, 陳波, 饒豐 申請人:騰訊科技(深圳)有限公司