本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及圖片處理技術(shù)領(lǐng)域,尤其涉及用于處理圖片的方法和裝置。
背景技術(shù):
現(xiàn)有的圖片搜索平臺(tái),經(jīng)常通過建立與圖片相關(guān)的索引,來極大地提高圖片搜索效率。
然而,現(xiàn)有的圖片搜索平臺(tái)向用戶呈現(xiàn)的搜索結(jié)果通常與用戶提交的搜索用文本或搜索用圖片缺乏相關(guān)性,其原因通常是因?yàn)樗⒑痛鎯?chǔ)的索引準(zhǔn)確度較低。
技術(shù)實(shí)現(xiàn)要素:
第一方面,本申請(qǐng)?zhí)峁┝艘环N用于處理圖片的方法,該方法包括:獲取圖片和與上述圖片相關(guān)的文本信息;對(duì)上述圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)上述文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)上述第一關(guān)鍵詞集合和上述第二關(guān)鍵詞集合生成用于對(duì)上述圖片進(jìn)行指示的文本索引;從上述第一關(guān)鍵詞集合中選取用于表征上述圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)上述圖片進(jìn)行指示的視覺索引;對(duì)上述文本索引和上述視覺索引進(jìn)行存儲(chǔ)。
在一些實(shí)施例中,上述方法還包括:響應(yīng)于接收到用戶終端發(fā)送的搜索用圖片,則對(duì)上述搜索用圖片進(jìn)行分析以提取視覺特征,將上述搜索用圖片的視覺特征與上述視覺索引進(jìn)行匹配,將匹配出的視覺索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述方法還包括:響應(yīng)于接收到用戶終端發(fā)送的搜索用文本,則對(duì)上述搜索用文本進(jìn)行分析以生成第三關(guān)鍵詞集合,將上述第三關(guān)鍵詞集合與上述文本索引進(jìn)行匹配,將匹配出的文本索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述將上述搜索用圖片的視覺特征與上述視覺索引進(jìn)行匹配,包括:計(jì)算上述搜索用圖片的視覺特征與上述視覺索引中的每一個(gè)視覺索引的匹配度;將上述視覺索引中與上述搜索用圖片的視覺特征的匹配度不低于第一閾值的視覺索引所指示的圖片作為與上述搜索用圖片相同的圖片,將與上述搜索用圖片的視覺特征的匹配度低于上述第一閾值并且不低于第二閾值的視覺索引所指示的圖片作為與上述搜索用圖片相似的圖片。
在一些實(shí)施例中,上述將匹配出的視覺索引所指示的圖片作為搜索結(jié)果進(jìn)行展示,包括:將與上述搜索用圖片相同的圖片和/或相似的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述視覺特征包括以下至少一項(xiàng):顏色、紋理、形狀。
第二方面,本申請(qǐng)?zhí)峁┝艘环N用于處理圖片的裝置,上述裝置包括:獲取單元,配置用于獲取圖片和與上述圖片相關(guān)的文本信息;文本索引生成單元,配置用于對(duì)上述圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)上述文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)上述第一關(guān)鍵詞集合和上述第二關(guān)鍵詞集合生成用于對(duì)上述圖片進(jìn)行指示的文本索引;視覺索引生成單元,配置用于從上述第一關(guān)鍵詞集合中選取用于表征上述圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)上述圖片進(jìn)行指示的視覺索引;存儲(chǔ)單元,配置用于對(duì)上述文本索引和上述視覺索引進(jìn)行存儲(chǔ)。
在一些實(shí)施例中,上述裝置還包括:第一處理單元,配置用于響應(yīng)于接收到用戶終端發(fā)送的搜索用圖片,則對(duì)上述搜索用圖片進(jìn)行分析以提取視覺特征,將上述搜索用圖片的視覺特征與上述視覺索引進(jìn)行匹配,將匹配出的視覺索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述裝置還包括:第二處理單元,配置用于響應(yīng)于接收到用戶終端發(fā)送的搜索用文本,則對(duì)上述搜索用文本進(jìn)行分析以生成第三關(guān)鍵詞集合,將上述第三關(guān)鍵詞集合與上述文本索引進(jìn)行匹配,將匹配出的文本索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述第一處理單元包括:計(jì)算子單元,配置用于計(jì)算上述搜索用圖片的視覺特征與上述視覺索引中的每一個(gè)視覺索引的匹配度;處理子單元,配置用于將上述視覺索引中與上述搜索用圖片的視覺特征的匹配度不低于第一閾值的視覺索引所指示的圖片作為與上述搜索用圖片相同的圖片,將與上述搜索用圖片的視覺特征的匹配度低于上述第一閾值并且不低于第二閾值的視覺索引所指示的圖片作為與上述搜索用圖片相似的圖片。
在一些實(shí)施例中,上述第一處理單元包括:展示子單元,配置用于將與上述搜索用圖片相同的圖片和/或相似的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述視覺特征包括以下至少一項(xiàng):顏色、紋理、形狀。
本申請(qǐng)?zhí)峁┑挠糜谔幚韴D片的方法和裝置,通過對(duì)所獲取的圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,通過對(duì)所獲取的與圖片相關(guān)的文字信息進(jìn)行分析以得到第二關(guān)鍵詞集合,之后根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合以生成用于對(duì)圖片進(jìn)行指示的文本索引,接著從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征的關(guān)鍵詞以生成用于對(duì)圖片進(jìn)行指示的視覺索引,最后對(duì)文本索引和視覺索引進(jìn)行存儲(chǔ),從而有效利用了第一關(guān)鍵詞集合和第二關(guān)鍵詞集合,實(shí)現(xiàn)了高準(zhǔn)確度的索引建立及存儲(chǔ)。
附圖說明
通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
圖1是本申請(qǐng)可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
圖2是根據(jù)本申請(qǐng)的用于處理圖片的方法的一個(gè)實(shí)施例的流程圖;
圖3是根據(jù)本申請(qǐng)的用于處理圖片的方法的又一個(gè)實(shí)施例的流程圖;
圖4是根據(jù)本申請(qǐng)的用于處理圖片的方法的再一個(gè)實(shí)施例的流程圖;
圖5是根據(jù)本申請(qǐng)的用于處理圖片的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖6是適于用來實(shí)現(xiàn)本申請(qǐng)實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請(qǐng)。
圖1示出了可以應(yīng)用本申請(qǐng)的用于處理圖片的方法或用于處理圖片的裝置的實(shí)施例的示例性系統(tǒng)架構(gòu)100。
如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104、106,服務(wù)器105和數(shù)據(jù)庫107。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)106用以在服務(wù)器105和數(shù)據(jù)庫107之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104、106可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如圖片傳輸應(yīng)用、圖片搜索工具、網(wǎng)頁瀏覽器應(yīng)用、即時(shí)通信工具等。
終端設(shè)備101、102、103可以是具有顯示屏的各種電子設(shè)備,包括但不限于智能手機(jī)、平板電腦、膝上型便攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等等。
數(shù)據(jù)庫107可以是存儲(chǔ)有至少一張圖片的圖片數(shù)據(jù)庫。
服務(wù)器105可以是提供各種服務(wù)的服務(wù)器。例如服務(wù)器105可以從終端設(shè)備101、102、103和/或數(shù)據(jù)庫107獲取圖片和與圖片相關(guān)的文本信息;可以對(duì)所獲取的圖片和文本信息進(jìn)行分析等處理,以生成用于對(duì)圖片進(jìn)行指示的文本索引和視覺索引;還可以對(duì)所生成的文本索引和視覺索引進(jìn)行存儲(chǔ)。
需要說明的是,本申請(qǐng)實(shí)施例所提供的用于處理圖片的方法一般由服務(wù)器105執(zhí)行,相應(yīng)地,用于處理圖片的裝置一般設(shè)置于服務(wù)器105中。
應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)、服務(wù)器和數(shù)據(jù)庫的數(shù)目僅僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)、服務(wù)器和數(shù)據(jù)庫。在服務(wù)器105從本地獲取圖片和與圖片相關(guān)的文本信息的情況下,終端設(shè)備101、102、103和數(shù)據(jù)庫107可以不要。
繼續(xù)參見圖2,圖2示出了根據(jù)本申請(qǐng)的用于處理圖片的方法的一個(gè)實(shí)施例的流程200。該用于處理圖片的方法,包括以下步驟:
步驟201,獲取圖片和與圖片相關(guān)的文本信息。
在本實(shí)施例中,用于處理圖片的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器105)可以通過有線連接方式或者無線連接方式獲取圖片和與圖片相關(guān)的文本信息。這里,上述圖片可以是用于處理圖片的方法所支持的任意格式的圖片,例如PNG、JPEG、GIF等格式的圖片。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以從與其通信連接的數(shù)據(jù)庫(例如圖1所示的數(shù)據(jù)庫107)和/或用戶終端(例如圖1所示的終端設(shè)備101、102、103)獲取上述圖片和上述文本信息;上述電子設(shè)備還可以本地獲取上述圖片和上述文本信息。這里,上述電子設(shè)備可以將所獲取的上述圖片和上述文本信息存儲(chǔ)至內(nèi)存或硬盤中。
步驟202,對(duì)圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合生成用于對(duì)圖片進(jìn)行指示的文本索引。
在本實(shí)施例中,上述電子設(shè)備可以采用圖像識(shí)別技術(shù)對(duì)圖片進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于提取出的關(guān)鍵詞生成第一關(guān)鍵詞集合。作為示例,一張顯示有夜景的圖片,包含星星和彎月,背景色為黑色;上述電子設(shè)備通過圖像識(shí)別技術(shù)對(duì)該圖片進(jìn)行分析,可以得到關(guān)鍵詞“星星”、“月亮”、“鐮刀”、“黑色”、“黃色”、“彎”、“五個(gè)尖”、“晚上”、“香蕉”,上述電子設(shè)備可以將上述關(guān)鍵詞“星星”、“月亮”、“鐮刀”、“黑色”、“黃色”、“彎的”、“五個(gè)尖”、“晚上”和“香蕉”作為第一關(guān)鍵詞集合中的關(guān)鍵詞。
在本實(shí)施例中,上述電子設(shè)備可以利用各種分析手段對(duì)上述文本信息進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于所提取出的關(guān)鍵詞生成第二關(guān)鍵集合。
在本實(shí)施例中,上述電子設(shè)備可以根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合生成用于對(duì)圖片進(jìn)行指示的文本索引。作為示例,上述電子設(shè)備可以通過合并第一關(guān)鍵詞集合和第二關(guān)鍵詞集合,以生成上述文本索引。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以通過合并第一關(guān)鍵詞集合和第二關(guān)鍵詞集合并去除重復(fù)的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的文本索引。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,在第一關(guān)鍵詞集合和第二關(guān)鍵詞集合中的各關(guān)鍵詞未設(shè)置有權(quán)重的情況下,上述電子設(shè)備可以將第一關(guān)鍵詞集合和第二關(guān)鍵詞集合進(jìn)行合并以得到關(guān)鍵詞組,之后上述電子設(shè)備可以去除上述關(guān)鍵詞組中的重復(fù)的關(guān)鍵詞,而后上述電子設(shè)備可以基于上述關(guān)鍵詞組中的每一個(gè)關(guān)鍵詞與上述圖片的相關(guān)性,為上述關(guān)鍵詞組中的每一個(gè)關(guān)鍵詞設(shè)置權(quán)重,然后上述電子設(shè)備可以基于述關(guān)鍵詞組中權(quán)重不低于預(yù)置值的關(guān)鍵詞以生成上述文本索引。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,對(duì)上述文本信息的分析方式可以是統(tǒng)計(jì)分析方式。例如,可以對(duì)上述文本信息中存在的各個(gè)詞語的出現(xiàn)頻率進(jìn)行統(tǒng)計(jì)和排序,之后,再選取出現(xiàn)頻率排序靠前的一個(gè)或多個(gè)詞語作為關(guān)鍵詞。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,對(duì)上述文本信息的分析方式還可以是語義分析方式。作為示例,可以上述文本信息進(jìn)行全切分方法等處理,把文本信息的內(nèi)容分割成詞;再對(duì)所得到的詞進(jìn)行重要性計(jì)算(例如采用詞頻-逆向文件頻率方法(Term Frequency-Inverse Document Frequency,TF-IDF)),基于重要性計(jì)算的結(jié)果來得到關(guān)鍵詞。
利用全切分方法,可以首先切分出與語言詞庫匹配的所有可能的詞,再運(yùn)用統(tǒng)計(jì)語言模型確定最優(yōu)的切分結(jié)果。以文本“夜空中的星星和月亮”為例,可以首先進(jìn)行語言詞庫匹配,找到匹配的所有詞——夜,夜空,空中,星星,月亮;這些詞以詞網(wǎng)格(word lattices)形式表示,接著基于詞網(wǎng)格做路徑搜索,再基于統(tǒng)計(jì)語言模型(例如N-Gram模型,)找到最優(yōu)路徑。如果結(jié)果顯示“夜空星星月亮”的語言模型得分最高,則“夜空星星月亮”即為“夜空中的星星和月亮”的最優(yōu)切分。在這里上述N-Gram模型是常用的一種語言模型,對(duì)中文而言,可以稱之為漢語語言模型(Chinese Language Model,CLM)。該N-Gram模型基于這樣一種假設(shè),第N個(gè)詞的出現(xiàn)只與前面N-1個(gè)詞相關(guān),而與其它任何詞都不相關(guān),整句的概率就是各個(gè)詞出現(xiàn)概率的乘積,而這些概率可以通過直接從語料中統(tǒng)計(jì)N個(gè)詞同時(shí)出現(xiàn)的次數(shù)得到。
利用全切分方法將內(nèi)容分割成詞之后,可以采用詞頻-逆向文件頻率方法對(duì)這些詞進(jìn)行重要性計(jì)算,再基于重要性來選取詞作為關(guān)鍵詞或者對(duì)這些詞進(jìn)行重要性評(píng)分。詞頻-逆向文件頻率方法的主要思想是,如果某個(gè)詞或短語在一篇文章中出現(xiàn)的頻率(Term Frequency,TF)高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類。而逆向文件頻率(Inverse Document Frequency,IDF)主要是指,如果包含某個(gè)詞或短語的文檔越少,則IDF越大,則說明該詞或短語具有很好的類別區(qū)分能力。由此,使用詞頻-逆向文件頻率方法,可以計(jì)算某個(gè)詞或短語在某篇文章里面的重要性。
需要說明的是,上述語義分析方式的各種方法是目前廣泛研究和應(yīng)用的公知技術(shù),在此不再贅述。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以為通過圖像分析技術(shù)分析出的與上述圖片相關(guān)的關(guān)鍵詞,以及采用各種分析手段分析出的與上述文本信息相關(guān)的關(guān)鍵詞設(shè)置權(quán)重,可以基于權(quán)重不低于閾值的關(guān)鍵詞生成第一關(guān)鍵詞集合和第二關(guān)鍵詞集合。其中,權(quán)重的大小和關(guān)鍵詞與圖片內(nèi)容的相關(guān)性有關(guān),相關(guān)性越高權(quán)重值就越高,相關(guān)性越低權(quán)重值就越低。作為示例,上述電子設(shè)備通過圖像識(shí)別技術(shù)對(duì)上述顯示有夜景的圖片進(jìn)行分析,得到關(guān)鍵詞為“星星”、“月亮”、“鐮刀”、“黑色”、“黃色”、“彎”、“五個(gè)尖”、“晚上”、“香蕉”;其中,“星星”和“月亮”的權(quán)重可以為0.5,“黑色”和“黃色”的權(quán)重可以為0.4,“彎”的權(quán)重可以為0.3,“晚上”和“鐮刀”的權(quán)重可以為0.2,“五個(gè)尖”的權(quán)重可以為0.1,“香蕉”的權(quán)重可以為0;如果閾值為0.2,則上述電子設(shè)備可以基于關(guān)鍵詞“星星”、“月亮”、“黑色”、“黃色”、“彎”、“晚上”和“鐮刀”生成第一關(guān)鍵詞集合。
步驟203,從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
在本實(shí)施例中,上述電子設(shè)備可以從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征(例如黃色、黑色、彎等)的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述視覺特征可以包括以下至少一項(xiàng):顏色、紋理、形狀。
步驟204,對(duì)文本索引和視覺索引進(jìn)行存儲(chǔ)。
在本實(shí)施例中,上述電子設(shè)備可以將文本索引和視覺索引存儲(chǔ)至上述電子設(shè)備的內(nèi)存或硬盤中,還可以存儲(chǔ)至與上述電子設(shè)備通信連接的數(shù)據(jù)庫中。
本申請(qǐng)的上述實(shí)施例提供的方法通過對(duì)所獲取的圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,通過對(duì)所獲取的與圖片相關(guān)的文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,之后根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合以生成用于對(duì)圖片進(jìn)行指示的文本索引,接著從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征的關(guān)鍵詞以生成用于對(duì)圖片進(jìn)行指示的視覺索引,最后對(duì)文本索引和視覺索引進(jìn)行存儲(chǔ),從而有效利用了第一關(guān)鍵詞集合和第二關(guān)鍵詞集合,實(shí)現(xiàn)了高準(zhǔn)確度的索引建立及存儲(chǔ)。
進(jìn)一步參考圖3,其示出了用于處理圖片的方法的又一個(gè)實(shí)施例的流程300,該用于處理圖片的方法的流程300,包括以下步驟:
步驟301,獲取圖片和與圖片相關(guān)的文本信息。
在本實(shí)施例中,用于處理圖片的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器105)可以通過有線連接方式或者無線連接方式獲取圖片和與圖片相關(guān)的文本信息。這里,上述圖片可以是用于處理圖片的方法所支持的任意格式的圖片,例如PNG、JPEG、GIF等格式的圖片。
步驟302,對(duì)圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合生成用于對(duì)圖片進(jìn)行指示的文本索引。
在本實(shí)施例中,上述電子設(shè)備可以采用圖像識(shí)別技術(shù)對(duì)圖片進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于提取出的關(guān)鍵詞生成第一關(guān)鍵詞集合。而且上述電子設(shè)備可以利用各種分析手段對(duì)上述文本信息進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于所提取出的關(guān)鍵詞生成第二關(guān)鍵集合。并且上述電子設(shè)備可以通過合并第一關(guān)鍵詞集合和第二關(guān)鍵詞集合,以生成用于對(duì)圖片進(jìn)行指示的文本索引。
步驟303,從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
在本實(shí)施例中,上述電子設(shè)備可以從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征(例如黃色、黑色、彎等)的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
步驟304,對(duì)文本索引和視覺索引進(jìn)行存儲(chǔ)。
在本實(shí)施例中,上述電子設(shè)備可以將文本索引和視覺索引存儲(chǔ)至上述電子設(shè)備的內(nèi)存或硬盤中,還可以存儲(chǔ)至與上述電子設(shè)備通信連接的數(shù)據(jù)庫中。
步驟305,響應(yīng)于接收到用戶終端發(fā)送的搜索用圖片,則對(duì)搜索用圖片進(jìn)行分析以提取視覺特征。
在本實(shí)施例中,響應(yīng)于上述電子設(shè)備接收到用戶終端發(fā)送的搜索用圖片,則上述電子設(shè)備可以通過視覺搜索技術(shù)對(duì)搜索用圖片進(jìn)行分析,從而提取出至少一個(gè)視覺特征(例如顏色、紋理、形狀等視覺特征)。
需要說明的是,上述視覺搜索技術(shù)通常是基于圖片內(nèi)容分析的視覺搜索技術(shù)。上述視覺搜索技術(shù)可以正確理解圖片內(nèi)容,以及實(shí)現(xiàn)以圖搜圖,可以有效地提高圖片搜索效率和搜索質(zhì)量,有利于輔助推薦更符合用戶需求的搜索結(jié)果,以及提高用戶滿意度。
步驟306,將搜索用圖片的視覺特征與視覺索引進(jìn)行匹配。
在本實(shí)施例中,上述電子設(shè)備可以通過計(jì)算搜索用圖片的視覺特征與上述視覺索引中的每一個(gè)視覺索引的匹配度,以將搜索用圖片的視覺特征與視覺索引進(jìn)行匹配。作為示例,上述電子設(shè)備可以將搜索用圖片的視覺特征轉(zhuǎn)換為搜索用關(guān)鍵詞集合,可以通過計(jì)算搜索用關(guān)鍵詞集合與上述視覺索引中的每一個(gè)視覺索引的匹配度,以得到搜索用圖片的視覺特征與上述視覺索引中的每一個(gè)視覺索引的匹配度。例如,如果搜索用關(guān)鍵詞集合包含10個(gè)關(guān)鍵詞,上述視覺索引中的某一個(gè)視覺索引包含搜索用關(guān)鍵詞集合中的9個(gè)關(guān)鍵詞,則可以確定搜索用圖片的視覺特征與上述包含搜索用關(guān)鍵詞集合中的9個(gè)關(guān)鍵詞的視覺索引的匹配度為9與10的比值,即匹配度為90%。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以將上述視覺索引中與搜索用圖片的視覺特征的匹配度不低于第一閾值(例如95%)的視覺索引所指示的圖片作為與搜索用圖片相同的圖片,可以將與搜索用圖片的視覺特征的匹配度低于上述第一閾值并且不低于第二閾值(例如70%)的視覺索引所指示的圖片作為與搜索用圖片相似的圖片。需要說明的是,上述第一閾值和第二閾值可以是人為設(shè)置的,可以根據(jù)實(shí)現(xiàn)需要進(jìn)行修改。
步驟307,將匹配出的視覺索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在本實(shí)施例中,上述電子設(shè)備可以將匹配出的與搜索用圖片的視覺特征的匹配度不為零的視覺索引所指示的圖片按照匹配度由高到低的順序進(jìn)行排序,然后將排序后的圖片向用戶終端進(jìn)行展示。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以將匹配出的與搜索用圖片相同的圖片作為搜索結(jié)果向用戶終端進(jìn)行展示。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以將匹配出的與搜索用圖片相同以及相似的圖片按照匹配度由高到低的順序進(jìn)行排序,然后將排序后的與搜索用圖片相同以及相似的圖片向用戶終端進(jìn)行展示。
從圖3中可以看出,與圖2對(duì)應(yīng)的實(shí)施例相比,本實(shí)施例中的用于處理圖片的方法的流程300突出了步驟305、步驟306和步驟307。由此,本實(shí)施例描述的方案可以實(shí)現(xiàn)高準(zhǔn)確度的索引建立及存儲(chǔ);可以實(shí)現(xiàn)以圖搜圖、優(yōu)化圖片搜索過程,并且還可以提高圖片搜索效率。
進(jìn)一步參考圖4,其示出了用于處理圖片的方法的再一個(gè)實(shí)施例的流程400。該用于處理圖片的流程400,包括以下步驟:
步驟401,獲取圖片和與圖片相關(guān)的文本信息。
在本實(shí)施例中,用于處理圖片的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器105)可以通過有線連接方式或者無線連接方式獲取圖片和與圖片相關(guān)的文本信息。這里,上述圖片可以是用于處理圖片的方法所支持的任意格式的圖片,例如PNG、JPEG、GIF等格式的圖片。
步驟402,對(duì)圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)第一關(guān)鍵詞集合和第二關(guān)鍵詞集合生成用于對(duì)圖片進(jìn)行指示的文本索引。
在本實(shí)施例中,上述電子設(shè)備可以采用圖像識(shí)別技術(shù)對(duì)圖片進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于提取出的關(guān)鍵詞生成第一關(guān)鍵詞集合。而且上述電子設(shè)備可以利用各種分析手段對(duì)上述文本信息進(jìn)行分析,從而提取出一個(gè)或多個(gè)關(guān)鍵詞,然后基于所提取出的關(guān)鍵詞生成第二關(guān)鍵集合。并且上述電子設(shè)備可以通過合并第一關(guān)鍵詞集合和第二關(guān)鍵詞集合,以生成用于對(duì)圖片進(jìn)行指示的文本索引。
步驟403,從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
在本實(shí)施例中,上述電子設(shè)備可以從第一關(guān)鍵詞集合中選取用于表征圖片的視覺特征(例如黃色、黑色、彎等)的關(guān)鍵詞,以生成用于對(duì)圖片進(jìn)行指示的視覺索引。
步驟404,對(duì)文本索引和視覺索引進(jìn)行存儲(chǔ)。
在本實(shí)施例中,上述電子設(shè)備可以將文本索引和視覺索引存儲(chǔ)至上述電子設(shè)備的內(nèi)存或硬盤中,還可以存儲(chǔ)至與上述電子設(shè)備通信連接的數(shù)據(jù)庫中。
步驟405,響應(yīng)于接收到用戶終端發(fā)送的搜索用文本,則對(duì)搜索用文本進(jìn)行分析以生成第三關(guān)鍵詞集合。
在本實(shí)施例中,上述電子設(shè)備可以采用與對(duì)上述文本信息進(jìn)行分析的分析方法相同的分析方法來對(duì)搜索用文本進(jìn)行分析,以生成第三關(guān)鍵詞集合。
步驟406,將第三關(guān)鍵詞集合與文本索引進(jìn)行匹配。
在本實(shí)施例中,上述電子設(shè)備可以將第三關(guān)鍵詞集合與上述文本索引中的每一個(gè)文本索引進(jìn)行匹配。作為示例,上述電子設(shè)備可以將上述文本索引中包含第三關(guān)鍵詞集合中的至少一個(gè)關(guān)鍵詞的文本索引作為與第三關(guān)鍵詞集合匹配的文本索引。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以計(jì)算第三關(guān)鍵詞集合與上述文本索引中的每一個(gè)文本索引的匹配度,上述電子設(shè)備可以將與第三關(guān)鍵詞集合的匹配度不低于第三閾值(例如70%)的文本索引作為與第三關(guān)鍵詞集合匹配的文本索引。作為示例,第三關(guān)鍵詞集合包含關(guān)鍵詞“星星”、“月亮”、“黑色”和“黃色”,上述文本索引中的一個(gè)文本索引包含“星星”和“月亮”,則上述包含“星星”和“月亮”的文本索引與第三關(guān)鍵詞集合的匹配度可以為2與4的比值,即50%。這里,上述第三閾值可以是人為設(shè)置的,可以根據(jù)實(shí)現(xiàn)需要進(jìn)行修改。
步驟407,將匹配出的文本索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在本實(shí)施例中,上述電子設(shè)備可以將上述文本索引中包含第三關(guān)鍵詞集合中的至少一個(gè)關(guān)鍵詞的文本索引所指示的圖片作為搜索結(jié)果向用戶終端進(jìn)行展示。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以將上述文本索引中與第三關(guān)鍵詞集合的匹配度不低于第三閾值的文本索引所指示的圖片按照匹配度由高到底的順序進(jìn)行排序,然后將排序后的圖片向用戶終端進(jìn)行展示。
從圖4中可以看出,與圖2對(duì)應(yīng)的實(shí)施例相比,本實(shí)施例中的用于處理圖片的方法的流程400突出了步驟405、步驟406和步驟407。由此,本實(shí)施例描述的方案可以實(shí)現(xiàn)高準(zhǔn)確度的索引建立及存儲(chǔ);通過將第三關(guān)鍵詞集合與上述文本索引中的每一個(gè)文本索引進(jìn)行匹配,可以優(yōu)化圖片搜索過程,提高搜索結(jié)果與搜索用文本的相關(guān)性,以及提高圖片搜索效率。
進(jìn)一步參考圖5,作為對(duì)上述各圖所示方法的實(shí)現(xiàn),本申請(qǐng)?zhí)峁┝艘环N用于處理圖片的裝置的一個(gè)實(shí)施例,該裝置實(shí)施例與圖2所示的方法實(shí)施例相對(duì)應(yīng),該裝置具體可以應(yīng)用于各種電子設(shè)備中。
如圖5所示,本實(shí)施例的用于處理圖片的裝置500可以包括:獲取單元501、文本索引生成單元502、視覺索引生成單元503和存儲(chǔ)單元504。其中,獲取單元501,配置用于獲取圖片和與上述圖片相關(guān)的文本信息;文本索引生成單元502,配置用于對(duì)上述圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)上述文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)上述第一關(guān)鍵詞集合和上述第二關(guān)鍵詞集合生成用于對(duì)上述圖片進(jìn)行指示的文本索引;視覺索引生成單元503,配置用于從上述第一關(guān)鍵詞集合中選取用于表征上述圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)上述圖片進(jìn)行指示的視覺索引;存儲(chǔ)單元504,配置用于對(duì)上述文本索引和上述視覺索引進(jìn)行存儲(chǔ)。
用于處理圖片的裝置500中:獲取單元501、文本索引生成單元502、視覺索引生成單元503和存儲(chǔ)單元504可參看圖2對(duì)應(yīng)實(shí)施例中的步驟201、步驟202、步驟203和步驟204的實(shí)現(xiàn)方式的相關(guān)描述,在此不再贅述。
在一些實(shí)施例中,上述裝置500還可以包括:第一處理單元(圖中未示出),配置用于響應(yīng)于接收到用戶終端發(fā)送的搜索用圖片,則對(duì)上述搜索用圖片進(jìn)行分析以提取視覺特征,將上述搜索用圖片的視覺特征與上述視覺索引進(jìn)行匹配,將匹配出的視覺索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述裝置500還可以包括:第二處理單元(圖中未示出),配置用于響應(yīng)于接收到用戶終端發(fā)送的搜索用文本,則對(duì)上述搜索用文本進(jìn)行分析以生成第三關(guān)鍵詞集合,將上述第三關(guān)鍵詞集合與上述文本索引進(jìn)行匹配,將匹配出的文本索引所指示的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述第一處理單元可以包括:計(jì)算子單元(圖中未示出),配置用于計(jì)算上述搜索用圖片的視覺特征與上述視覺索引中的每一個(gè)視覺索引的匹配度;處理子單元(圖中未示出),配置用于將上述視覺索引中與上述搜索用圖片的視覺特征的匹配度不低于第一閾值的視覺索引所指示的圖片作為與上述搜索用圖片相同的圖片,將與上述搜索用圖片的視覺特征的匹配度低于上述第一閾值并且不低于第二閾值的視覺索引所指示的圖片作為與上述搜索用圖片相似的圖片。
在一些實(shí)施例中,上述第一處理單元可以包括:展示子單元(圖中未示出),配置用于將上述與上述搜索用圖片相同的圖片和/或相似的圖片作為搜索結(jié)果進(jìn)行展示。
在一些實(shí)施例中,上述視覺特征可以包括以下至少一項(xiàng):顏色、紋理、形狀。
下面參考圖6,其示出了適于用來實(shí)現(xiàn)本申請(qǐng)實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)600的結(jié)構(gòu)示意圖。
如圖6所示,計(jì)算機(jī)系統(tǒng)600包括中央處理單元(CPU)601,其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(ROM)602中的程序或者從存儲(chǔ)部分608加載到隨機(jī)訪問存儲(chǔ)器(RAM)603中的程序而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。在RAM 603中,還存儲(chǔ)有系統(tǒng)600操作所需的各種程序和數(shù)據(jù)。CPU 601、ROM 602以及RAM 603通過總線604彼此相連。輸入/輸出(I/O)接口605也連接至總線604。
以下部件連接至I/O接口605:包括鍵盤、鼠標(biāo)等的輸入部分606;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分607;包括硬盤等的存儲(chǔ)部分608;以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分609。通信部分609經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器610也根據(jù)需要連接至I/O接口605??刹鹦督橘|(zhì)611,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等,根據(jù)需要安裝在驅(qū)動(dòng)器610上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分608。
特別地,根據(jù)本公開的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本公開的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括有形地包含在機(jī)器可讀介質(zhì)上的計(jì)算機(jī)程序,上述計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過通信部分609從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)611被安裝。在該計(jì)算機(jī)程序被中央處理單元(CPU)601執(zhí)行時(shí),執(zhí)行本申請(qǐng)的方法中限定的上述功能。
附圖中的流程圖和框圖,圖示了按照本申請(qǐng)各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
描述于本申請(qǐng)實(shí)施例中所涉及到的單元可以通過軟件的方式實(shí)現(xiàn),也可以通過硬件的方式來實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括獲取單元、文本索引生成單元、視覺索引生成單元和存儲(chǔ)單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對(duì)該單元本身的限定,例如,獲取單元還可以被描述為“獲取圖片和與圖片相關(guān)的文本信息的單元”。
作為另一方面,本申請(qǐng)還提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),該非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是上述實(shí)施例中上述裝置中所包含的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。上述非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序,當(dāng)上述一個(gè)或者多個(gè)程序被一個(gè)設(shè)備執(zhí)行時(shí),使得上述設(shè)備:獲取圖片和與圖片相關(guān)的文本信息;對(duì)上述圖片進(jìn)行分析以得到第一關(guān)鍵詞集合,對(duì)上述文本信息進(jìn)行分析以得到第二關(guān)鍵詞集合,根據(jù)上述第一關(guān)鍵詞集合和上述第二關(guān)鍵詞集合生成用于對(duì)上述圖片進(jìn)行指示的文本索引;從上述第一關(guān)鍵詞集合中選取用于表征上述圖片的視覺特征的關(guān)鍵詞,以生成用于對(duì)上述圖片進(jìn)行指示的視覺索引;對(duì)上述文本索引和上述視覺索引進(jìn)行存儲(chǔ)。
以上描述僅為本申請(qǐng)的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請(qǐng)中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離上述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請(qǐng)中公開的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。