本發(fā)明涉及圖像搜索技術(shù)領(lǐng)域,尤其涉及一種圖像處理及搜索方法、裝置和系統(tǒng)。
背景技術(shù):
隨著移動互聯(lián)網(wǎng)的發(fā)展,即時通信類應(yīng)用所能發(fā)送的消息內(nèi)容從最初的文本逐漸擴展至語音、圖像、視頻等富媒體形式。在即時消息類應(yīng)用中,包含圖像的消息(以下稱之為圖像消息)所占的比重也越來越大。
實際應(yīng)用中,用戶存在針對消息內(nèi)容的搜索需求。但是,目前對于即時消息的搜索僅適應(yīng)用于文本消息、語音消息等的搜索,如果用戶希望搜索收發(fā)的圖像消息,用戶只能逐條翻查歷史消息記錄,人工判斷已收發(fā)的每張圖像是否為自己所需要,操作繁瑣,由此可見,如何實現(xiàn)針對圖像消息的自動搜索成為現(xiàn)有技術(shù)中亟待解決的技術(shù)問題之一。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種圖像處理及搜索方法、裝置和系統(tǒng),用以實現(xiàn)針對圖像的自動搜索。
本發(fā)明實施例提供一種服務(wù)器側(cè)實施的圖像處理方法,包括:
識別第一終端上傳的第一圖像文件,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到第二圖像文件;
向所述第一終端返回所述第二圖像文件。
本發(fā)明實施例提供一種終端側(cè)實施的圖像處理方法,包括:
向服務(wù)器上傳第一圖像文件;
接收所述服務(wù)器返回的第二圖像文件,所述第二圖像文件為所述服務(wù)器識別所述第一圖像文件后,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到的。
本發(fā)明實施例提供一種基于上述終端側(cè)實施的圖像處理方法的圖像搜索方法,包括:
接收圖像搜索請求,所述圖像搜索請求中攜帶有搜索關(guān)鍵字信息;
在各圖像文件的文字標簽信息中,查找與所述搜索關(guān)鍵字信息匹配的文字標簽信息;
針對所述圖像搜索請求返回文字標簽信息與所述搜索關(guān)鍵字信息匹配的圖像文件。
本發(fā)明實施例提供一種服務(wù)器側(cè)實施的圖像處理裝置,包括:
識別單元,用于識別第一終端上傳的第一圖像文件,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到第二圖像文件;
返回單元,用于向所述第一終端返回所述第二圖像文件。
本發(fā)明實施例提供一種終端側(cè)實施的圖像處理裝置,包括:
上傳單元,用于向服務(wù)器上傳第一圖像文件;
第一接收單元,用于接收所述服務(wù)器返回的第二圖像文件,所述第二圖像文件為所述服務(wù)器識別所述第一圖像文件后,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到的。
本發(fā)明實施例提供一種圖像搜索裝置,包括:
第二接收單元,用于接收圖像搜索請求,所述圖像搜索請求中攜帶有搜索關(guān)鍵字信息;
查找單元,用于在各圖像文件的文字標簽信息中,查找與所述搜索關(guān)鍵字信息匹配的文字標簽信息;
返回單元,用于針對所述圖像搜索請求返回文字標簽信息與所述搜索關(guān)鍵字信息匹配的圖像文件。
本發(fā)明實施例提供一種圖像處理系統(tǒng),包括終端和服務(wù)器,其中,所述服務(wù)器中設(shè)置有上述服務(wù)器側(cè)實施的圖像處理裝置,所述終端中設(shè)備有上述的終端側(cè)實施的圖像處理裝置和/或上述的圖像搜索裝置。
本發(fā)明實施例提供的圖像處理及搜索方法、裝置和系統(tǒng),由服務(wù)器對終端上傳的圖像文件進行識別,并將利用文字標簽信息標注識別結(jié)果后得到的圖像文件反饋給終端,這種,在進行圖像搜索時,可以通過搜索關(guān)鍵字與圖像文件中的文字標簽信息進行匹配,并返回匹配的圖像文件,由此,基于標注的文字標簽信息實現(xiàn)了圖像的自動搜索。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1為本發(fā)明實施例中,服務(wù)器實施圖像處理方法的實施流程示意圖;
圖2為本發(fā)明實施例中,終端實施圖像處理方法的實施流程示意圖;
圖3為本發(fā)明實施例中,圖像搜索方法的實施流程示意圖;
圖4a為本發(fā)明實施例中,用戶A向用戶B傳輸圖像文件的場景示意圖;
圖4b為本發(fā)明實施例中,圖像處理及搜索方法應(yīng)用于即時消息中時的實施例示意圖;
圖5為本發(fā)明實施例中,第一種圖像處理裝置的結(jié)構(gòu)示意圖;
圖6為本發(fā)明實施例中,第二種圖像處理裝置的結(jié)構(gòu)示意圖;
圖7為本發(fā)明實施例中,圖像搜索裝置的結(jié)果示意圖;
圖8為本發(fā)明實施例中,圖像處理系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式
為了實現(xiàn)圖像的自動搜索,本發(fā)明實施例中提供了一種圖像處理及搜索方法、裝置和系統(tǒng)。
以下結(jié)合說明書附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明,并且在不沖突的情況下,本發(fā)明中的實施例及實施例中的特征可以相互組合。
如圖1所示,為服務(wù)器側(cè)實施圖像處理方法的實施流程示意圖,可以包括以下步驟:
S11、識別第一終端上傳的第一圖像文件,在第一圖像文件上利用文字標簽信息標注識別結(jié)果得到第二圖像文件。
其中第一圖像文件可以為服務(wù)器按照以下任一方式獲得的:
方式一、
用戶可以將已拍攝的圖像文件利用第一終端上傳給服務(wù)器進行圖像識別,例如,用戶在拍攝完成圖像文件后,即利用第一終端上傳給服務(wù)器進行圖像識別。
方式二、
用戶將第一終端本地存儲的圖像文件上傳給服務(wù)器進行識別。
方式三、
用戶在與好友利用即時通信客戶端聊天時,通過服務(wù)器向好友傳輸?shù)膱D像文件。
服務(wù)器在獲得了第一圖像文件后,利用圖像識別技術(shù)對第一圖像文件進行圖像內(nèi)容識別,例如識別圖像中包含的物品、場景、人物等等。根據(jù)識別結(jié)果生成對應(yīng)的文字標簽信息,利用生成的文字標簽信息標注圖像中對應(yīng)的識別結(jié)果。
S12、向第一終端返回第二圖像文件。
較佳的,第二圖像文件中的文字標簽信息為可編輯的標簽信息。即允許用戶對第二圖像文件中的文字標簽信息進行修改。
基于此,服務(wù)器側(cè)實施的圖像處理方法還可以包括以下步驟:接收第一終端上傳的第三圖像文件,其中,第三圖像文件為修改第二圖像文件中的文字標簽信息后得到的;修正存儲的識別庫中、對應(yīng)識別結(jié)果的文字標簽信息為第三圖像文件中攜帶的文字標簽信息。
具體實施時,第一終端接收到第二圖像文件后,可以在本地顯示第二圖像文件,用戶根據(jù)第二圖像文件中標注的文字標簽信息確認識別結(jié)果是否準確,如果不準確,可以對文字標簽信息進行修改得到第三圖像文件,并通過第一終端將第三圖像文件上傳至服務(wù)器,服務(wù)器比對第三圖像文件與第二圖像文件后,修改對應(yīng)識別結(jié)果的文字標簽信息。例如,服務(wù)器識別出第一圖像文件中的玫瑰花,并在第一圖像文件中的玫瑰花對應(yīng)位置上標注文字標簽信息“玫瑰花”后得到第二圖像文件,將第二圖像文件發(fā)送給第一終端后,用戶將標注的文字標簽信息“玫瑰花”修改為“綠色玫瑰花”得到第三圖像文件,用戶通過第一終端將第三圖像文件發(fā)送給服務(wù)器,服務(wù)器比對第二圖像文件和第三圖像文件,根據(jù)比對結(jié)果,修正其存儲的識別庫中,對應(yīng)識別結(jié)果的文字標簽信息為“綠色玫瑰花”。
通過上述步驟,可以不斷修正服務(wù)器存儲的識別庫,提升服務(wù)器端圖像識別的準確率。
需要說明的是,具體實施時,如果服務(wù)器獲得第一圖像文件的方式為上述方式三時,服務(wù)器還需要向該用戶的好友轉(zhuǎn)發(fā)第二圖像文件或者第三圖像文件,具體的,服務(wù)器可以通過第二終端向該用戶的好友轉(zhuǎn)發(fā)第二圖像文件或者第三圖像文件。第一終端和第二終端在接收到第二圖像文件或者第三圖像文件后,顯示第二圖像文件或者第三圖像文件,并在本地存儲接收到的第二圖像文件或者第三圖像文件。
具體實施時,也可以在終端本地進行圖像識別并利用文字標簽信息對識別 結(jié)果進行標注并存儲即可。
相應(yīng)的,本發(fā)明實施例還提供了一種終端側(cè)實施的圖像處理方法,如圖2所示,可以包括以下步驟:
S21、向服務(wù)器上傳第一圖像文件。
同樣,終端可以通過以下任一方式向服務(wù)器上傳第一圖像文件:
方式一、
用戶可以將已拍攝的圖像文件利用第一終端上傳給服務(wù)器進行圖像識別,例如,用戶在拍攝完成圖像文件后,即利用第一終端上傳給服務(wù)器進行圖像識別。
方式二、
用戶將第一終端本地存儲的圖像文件上傳給服務(wù)器進行識別。
方式三、
用戶在與好友利用即時通信客戶端聊天時,通過服務(wù)器向好友傳輸?shù)膱D像文件。
S22、接收該服務(wù)器返回的第二圖像文件。
其中,第二圖像文件為服務(wù)器對終端上傳的第一圖像文件進行圖像內(nèi)容識別后,在第一圖像文件上利用文字標簽信息標注識別結(jié)果得到的。
具體的,服務(wù)器在獲得了第一圖像文件后,利用圖像識別技術(shù)對第一圖像文件進行圖像內(nèi)容識別,例如識別圖像中包含的物品、場景、人物等等。根據(jù)識別結(jié)果生成對應(yīng)的文字標簽信息,利用生成的文字標簽信息標注圖像中對應(yīng)的識別結(jié)果得到第二圖像文件。
較佳的,服務(wù)器標注的文字標簽信息為可編輯的標簽信息。終端在接收到第二圖像文件后,向用戶顯示第二圖像文件,如果用戶認為第二圖像文件中的文字標簽信息不準確,可以進行修改得到第三圖像文件,終端將第三圖像文件上傳給服務(wù)器,以供服務(wù)器修正其存儲的識別庫,提高圖像內(nèi)容識別的準確率。
基于此,終端側(cè)實施的圖像處理方法,還可以包括以下步驟:向服務(wù)器上 傳修改第二圖像文件中的文字標簽信息得到的第三圖像文件。
終端在本地存儲第二圖像文件和第三圖像文件。
基于終端本地存儲的第二圖像文件或者第三圖像文件,如果用戶有搜索需求時,可以采用搜索關(guān)鍵字搜索進行搜索。以下以結(jié)合用戶利用終端進行圖像搜索的實施流程對本發(fā)明實施例提供的圖像搜索方法進行說明。
如圖3所示,為本發(fā)明實施例提供的圖像搜索方法的實施流程示意圖,可以包括以下步驟:
S31、接收圖像搜索請求。
其中,在圖像搜索請求中攜帶有搜索關(guān)鍵字信息。具體實施時,用戶在進行圖像搜索時,在終端顯示的搜索框中輸入搜索關(guān)鍵字。
S32、在各圖像文件的文字標簽信息中,查找與搜索關(guān)鍵字信息匹配的文字標簽信息。
具體實施時,在接收到圖像搜索請求后,根據(jù)其中攜帶的搜索關(guān)鍵字在本地存儲的文字標簽信息中搜索與搜索關(guān)鍵字匹配的文字標簽信息。具體的匹配方式與現(xiàn)有的針對文字搜索的匹配過程相同,這里不再贅述。
S33、針對接收到的圖像搜索請求返回文字標簽信息與該搜索關(guān)鍵字信息匹配的圖像文件。
具體的,返回匹配到的文字標簽信息所在的圖像文件。
為了更好的理解本發(fā)明,以下以用戶A使用終端A在與用戶B利用即時通信軟件聊天過程中,用戶A向用戶B發(fā)送圖像文件為例對本發(fā)明實施例的具體實施過程進行說明,其中用戶B使用終端B與用戶A進行通信。如圖4a所示,為用戶A向用戶B傳輸圖像文件的場景示意圖,如圖4b所示,可以包括以下步驟:
S41、用戶A使用終端A通過服務(wù)器向終端B發(fā)送第一圖像文件。
S42、服務(wù)器接收到用戶A向用戶發(fā)送的第一圖像文件。
S43、服務(wù)器對第一圖像文件進行圖像內(nèi)容識別。
例如,服務(wù)器對第一圖像文件進行圖像內(nèi)容識別后,識別出其中的物品、場景等內(nèi)容。
S44、服務(wù)器根據(jù)識別結(jié)果生成文字標簽信息并在第一圖像文件上標注得到第二圖像文件。
S45、服務(wù)器將第二圖像文件分別發(fā)送給終端A和終端B。
S46、終端A和終端B分別存儲接收到的第二圖像文件。
S47、用戶A向終端A提交圖像搜索請求,其中攜帶有搜索關(guān)鍵字。
具體的,用戶A在需要進行圖像搜索時,其可以向終端A提交搜索請求,并在終端A顯示的搜索框中輸入搜索關(guān)鍵字。
S48、終端A根據(jù)搜索關(guān)鍵字在存儲的圖像文件中查找文字標簽信息與搜索關(guān)鍵字匹配的圖像文件。
S49、終端A返回搜索到的圖像文件。
具體實施時,用戶B在需要進行圖像搜索時,其可以向終端B提交搜索請求,并在終端B顯示的搜索框中輸入搜索關(guān)鍵字,終端B根據(jù)搜索關(guān)鍵字在存儲的圖像文件中查找文字標簽信息與搜索關(guān)鍵字匹配的圖像文件,并返回搜索到的圖像文件。
具體實施時,終端還可以將用戶輸入的搜索關(guān)鍵字發(fā)送給服務(wù)器,協(xié)助服務(wù)器更新識別庫和識別算法,提升服務(wù)器端圖像內(nèi)容識別的準確性。
需要說明的是,終端B可以接收多個終端,例如終端A1,A2,……An發(fā)送的第一圖像文件,該第一圖像文件由服務(wù)器標注文字標簽信息后得的第二圖像文件轉(zhuǎn)發(fā)給終端B,終端B在本地存儲接收到的標注了文字標簽信息的圖像文件。
本發(fā)明實施例提供的圖像處理及搜索方法中,服務(wù)器在獲得了終端上傳的第一圖像文件后,對獲得的圖像文件進行圖像內(nèi)容識別,根據(jù)識別結(jié)果生成對應(yīng)的文字標簽信息,并在圖像中利用生成的文字標簽信息標注對應(yīng)的識別結(jié)果得到第二圖像文件,將第二圖像文件發(fā)送給終端后,如果用戶修改其中的文字 標簽信息,則由終端將用戶修改文字標簽信息后得到的第三圖像文件發(fā)送給服務(wù)器,服務(wù)器根據(jù)第三圖像文件,修正存儲的識別庫中對應(yīng)的文字標簽信息。
基于同一發(fā)明構(gòu)思,本發(fā)明實施例中還分別提供了圖像處理及搜索裝置和圖像處理系統(tǒng),由于上述裝置及系統(tǒng)解決問題的原理與上述方法相似,因此上述裝置及系統(tǒng)的實施可以參見方法的實施,重復(fù)之處不再贅述。
如圖5所示,為本發(fā)明實施例提供的第一種圖像處理裝置的結(jié)構(gòu)示意圖,可以包括:
識別單元51,用于識別第一終端上傳的第一圖像文件,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到第二圖像文件。
較佳的,該文字標簽信息為可編輯的標簽信息。
返回單元52,用于向所述第一終端返回所述第二圖像文件。
本發(fā)明實施例提供的第一種圖像處理裝置,還可以包括:
接收單元,用于接收所述第一終端上傳的第三圖像文件,所述第三圖像文件為修改所述第二圖像文件中的文字標簽信息后得到的;
修正單元,用于修正存儲的識別庫中、所述識別結(jié)果對應(yīng)的文字標簽信息為所述第三圖像文件中攜帶的文字標簽信息。
其中,第一圖像文件為第一終端向第二終端發(fā)送的;以及本發(fā)明實施例提供的第一種圖像處理裝置,還可以包括:
發(fā)送單元,用于向第二終端發(fā)送第二圖像文件。
為了描述的方便,以上各部分按照功能劃分為各模塊(或單元)分別描述。當(dāng)然,在實施本發(fā)明時可以把各模塊(或單元)的功能在同一個或多個軟件或硬件中實現(xiàn)。上述第一種圖像處理裝置可以設(shè)置于服務(wù)器中,該服務(wù)器可以為即時消息服務(wù)器,也可以為專門的用戶圖像處理的圖像處理服務(wù)器。當(dāng)然,上述第一種圖像處理裝置也可以設(shè)置于終端中,由終端進行圖像內(nèi)容識別及標注識別結(jié)果的操作。
如圖6所示,為本發(fā)明實施例提供的第二種圖像處理裝置的結(jié)構(gòu)示意圖, 可以包括:
上傳單元61,用于向服務(wù)器上傳第一圖像文件;
第一接收單元62,用于接收所述服務(wù)器返回的第二圖像文件,所述第二圖像文件為所述服務(wù)器識別所述第一圖像文件后,在所述第一圖像文件上利用文字標簽信息標注識別結(jié)果得到的。
較佳的,文字標簽信息為可編輯的標簽信息;以及
上傳單元61,還可以用于向所述服務(wù)器上傳修改所述第二圖像文件中的文字標簽信息得到的第三圖像文件。
為了描述的方便,以上各部分按照功能劃分為各模塊(或單元)分別描述。當(dāng)然,在實施本發(fā)明時可以把各模塊(或單元)的功能在同一個或多個軟件或硬件中實現(xiàn)。上述第二種圖像處理裝置可以設(shè)置于終端中。
如圖7所示,為本發(fā)明實施例提供的基于上述第二圖像處理裝置的圖像搜索裝置的結(jié)構(gòu)示意圖,可以包括:
第二接收單元71,用于接收圖像搜索請求,所述圖像搜索請求中攜帶有搜索關(guān)鍵字信息;
查找單元72,用于在各圖像文件的文字標簽信息中,查找與所述搜索關(guān)鍵字信息匹配的文字標簽信息;
返回單元73,用于針對所述圖像搜索請求返回文字標簽信息與所述搜索關(guān)鍵字信息匹配的圖像文件。
為了描述的方便,以上各部分按照功能劃分為各模塊(或單元)分別描述。當(dāng)然,在實施本發(fā)明時可以把各模塊(或單元)的功能在同一個或多個軟件或硬件中實現(xiàn)。上述圖像搜索裝置可以設(shè)置于終端中。
如圖8所示,為本發(fā)明實施例提供的圖像處理系統(tǒng)的結(jié)果示意圖,可以包括終端81和服務(wù)器82,其中,終端81中設(shè)置有上述第二種圖像處理裝置和/或上述的圖像搜索裝置,服務(wù)器82中設(shè)置有上述第一種圖像處理裝置。
本發(fā)明實施例提供的圖像處理及搜索方法、裝置和系統(tǒng),由服務(wù)器對終端 上傳的圖像文件進行識別,并將利用文字標簽信息標注識別結(jié)果后得到的圖像文件反饋給終端,這種,在進行圖像搜索時,可以通過搜索關(guān)鍵字與圖像文件中的文字標簽信息進行匹配,并返回匹配的圖像文件,由此,基于標注的文字標簽信息實現(xiàn)了圖像的自動搜索。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要 求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。