一種圖片聚類的方法及裝置【技術領域】本發(fā)明涉及圖片處理技術,特別涉及一種圖片聚類的方法及裝置?!?br/>
背景技術:】對海量圖片進行聚類,根據(jù)聚類結果對同一類的圖片進行相應處理,是圖片搜索引擎向用戶返回準確的檢索結果的前提。例如,對海量圖片進行聚類處理,根據(jù)聚類結果,將同一類中的重復圖片去除,可以實現(xiàn)對海量圖片的去重工作,這樣用戶在海量圖片數(shù)據(jù)庫中進行圖片檢索時,針對相同關鍵詞可以得到盡可能豐富的結果。在現(xiàn)有技術中,對海量圖片進行聚類,通常采用的方法是抽取圖片的全局特征,然后通過比較不同圖片的全局特征的相似度將相似圖片聚為一類。在現(xiàn)有技術的方法對海量圖片進行聚類時,準確度和召回率都不夠高?!?br/>
技術實現(xiàn)要素:】本發(fā)明所要解決的技術問題是提供一種圖片聚類的方法及裝置,以解決現(xiàn)有技術對海量圖片進行聚類時,準確度和召回率較低的缺陷。本發(fā)明為解決技術問題而采用的技術方案是提供一種圖片聚類方法,包括:A.提取多張輸入圖片的全局特征和局部特征;B.根據(jù)所述全局特征對所述輸入圖片進行初次聚類,以得到初步聚類結果,其中所述初步聚類結果包括一個以上的圖片組;C.根據(jù)所述局部特征分別對每個圖片組內(nèi)的圖片進行二次聚類,以將每個圖片組內(nèi)的圖片分為一個以上的集合,得到所述輸入圖片的二次聚類結果。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟A中提取所述輸入圖片的多個全局特征;所述步驟B中根據(jù)每個全局特征分別對所述輸入圖片進行初次聚類,以得到與每個全局特征對應的初次聚類結果,其中每個初次聚類結果包含一個以上的圖片組;所述步驟C中針對與每個全局特征對應的初次聚類結果,根據(jù)所述局部特征分別對該初次聚類結果中的每個圖片組內(nèi)的圖片進行二次聚類,以將每個圖片組內(nèi)的圖片分為一個以上的集合,得到所述輸入圖片與每個全局特征對應的二次聚類結果;所述方法進一步包括:將各二次聚類結果進行合并,得到所述輸入圖片的最終聚類結果。根據(jù)本發(fā)明之一優(yōu)選實施例,將各二次聚類結果進行合并的步驟具體包括:將各二次聚類結果包含的集合中,兩兩之間存在交集的多個集合合并為一個集合。根據(jù)本發(fā)明之一優(yōu)選實施例,所述多個全局特征中包含第一全局特征,其中所述第一全局特征融合了顏色特征描述子、紋理特征描述子、形狀特征描述子或空間關系特征描述子中的至少兩個。根據(jù)本發(fā)明之一優(yōu)選實施例,所述多個全局特征中包含第二全局特征,其中所述第二全局特征為Gist特征。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟B中采用K-means方法對所述輸入圖片進行初次聚類。根據(jù)本發(fā)明之一優(yōu)選實施例,所述全局特征為:顏色、紋理或形狀特征;所述局部特征為SIFT特征。根據(jù)本發(fā)明之一優(yōu)選實施例,根據(jù)所述局部特征分別對每個圖片組內(nèi)的圖片進行二次聚類的步驟具體包括:針對每個圖片組,建立所述局部特征中各特征分量與圖片組中的各圖片之間的倒排索引;利用所述倒排索引,將擁有共同特征分量數(shù)超過預設值的圖片歸為一類,得到每個圖片組內(nèi)的一個以上的集合。根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法進一步包括:將所述二次聚類結果中的包含圖片數(shù)量大于設定值的集合中的圖片作為熱門圖片,所述熱門圖片用于在搜索引擎系統(tǒng)中作為優(yōu)先返回的檢索結果。本發(fā)明還提供了一種圖片聚類的裝置,包括:特征提取單元,用于提取多張輸入圖片的全局特征和局部特征;分組單元,用于根據(jù)所述全局特征對所述輸入圖片進行初次聚類,以得到初步聚類結果,其中所述初步聚類結果包括一個以上的圖片組;確定單元,用于根據(jù)所述局部特征對每個圖片組內(nèi)的圖片進行二次聚類,以將每個組內(nèi)的圖片分為一個以上的集合,得到所述輸入圖片的二次聚類結果。根據(jù)本發(fā)明之一優(yōu)選實施例,所述特征提取單元提取所述輸入圖片的多個全局特征;所述分組單元根據(jù)每個全局特征分別對所述輸入圖片進行初次聚類,以得到與每個全局特征對應的初次聚類結果,其中每個初次聚類結果包含一個以上的圖片組;所述確定單元針對與每個初次聚類結果,根據(jù)所述局部特征分別對該初次聚類結果中的每個圖片組內(nèi)的圖片進行二次聚類,以將每個圖片組內(nèi)的圖片分為一個以上的集合,得到所述輸入圖片與每個全局特征對應的二次聚類結果;所述裝置進一步包括:合并單元,用于將各二次聚類結果進行合并,得到所述輸入圖片的最終聚類結果。根據(jù)本發(fā)明之一優(yōu)選實施例,所述合并單元將各二次聚類結果進行合并的方式具體包括:將各二次聚類結果包含的集合中,兩兩之間存在交集的多個集合合并為一個集合。根據(jù)本發(fā)明之一優(yōu)選實施例,所述多個全局特征中包含第一全局特征,其中所述第一全局特征融合了顏色特征描述子、紋理特征描述子、形狀特征描述子或空間關系特征描述子中的至少兩個。根據(jù)本發(fā)明之一優(yōu)選實施例,所述多個全局特征中包含第二全局特征,其中所述第二全局特征為Gist特征。根據(jù)本發(fā)明之一優(yōu)選實施例,所述分組單元采用K-means方法對所述輸入圖片進行初次聚類。根據(jù)本發(fā)明之一優(yōu)選實施例,所述全局特征為:顏色、紋理或形狀特征;所述局部特征為SIFT特征。根據(jù)本發(fā)明之一優(yōu)選實施例,所述確定單元具體包括:索引單元,用于針對每個圖片組,建立所述局部特征中各特征分量與圖片組中的各圖片之間的倒排索引;歸類單元,用于利用所述倒排索引,將擁有共同特征分量數(shù)超過預設值的圖片歸為一類,得到每個圖片組內(nèi)的一個以上的集合。根據(jù)本發(fā)明之一優(yōu)選實施例,所述裝置進一步包括:選取單元,用于將所述二次聚類結果中的包含圖片數(shù)量大于設定值的集合中的圖片作為熱門圖片,所述熱門圖片用于在搜索引擎系統(tǒng)中作為優(yōu)先返回的檢索結果。由以上技術方案可以看出,通過采用全局特征對海量圖片初次聚類以對輸入圖片進行分組,再通過局部特征對每組內(nèi)的圖片進行二次聚類,可以有效提高對海量圖片聚類時的準確度和召回率?!靖綀D說明】圖1是本發(fā)明中圖片聚類的方法的實施例的流程示意圖;圖2是本發(fā)明中圖片聚類效果示意圖;圖3是本發(fā)明中為圖片及其特征分量建立的普通索引的示意圖;圖4是本發(fā)明中為圖片及其特征分量建立的倒排索引的示意圖;圖5是本發(fā)明中圖片聚類裝置的實施例一的結構示意框圖;圖6是本發(fā)明中圖片聚類裝置的實施例二的結構示意框圖?!揪唧w實施方式】為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖和具體實施例對本發(fā)明進行詳細描述。請參考圖1和圖2,圖1為本發(fā)明中圖片聚類的方法的實施例的流程示意圖,圖2為本發(fā)明中圖片聚類效果示意圖。如圖1所示,該實施例包括:步驟S101:提取多張輸入圖片的全局特征和局部特征。步驟S102:根據(jù)上述全局特征對上述輸入圖片進行初次聚類,以得到與上述全局特征對應的初步聚類結果,其中初步聚類結果包括一個以上的圖片組。步驟S103:根據(jù)上述局部特征分別對每個圖片組內(nèi)的圖片進行二次聚類,以將每個組內(nèi)的圖片分為一個以上的集合,得到輸入圖片的二次聚類結果。作為一個實施例,步驟S101中,為每張輸入圖片提取一個全局特征和一個局部特征。全局特征可以是圖片的顏色、紋理、形狀等特征,具體地,如MPEG-7的各種顏色或紋理描述符、LBP(LocalBinaryPatterns)特征、距特征、小波特征等。局部特征可以是SIFT(ScaleInvariantFeatureTransform,尺度不變特征轉換)特征、SURF(SpeededUpRobustFeatures)特征、color-SIFT特征、PCA-SIFT特征等。提取圖片的顏色特征,可以采用顏色直方圖、顏色集、顏色距、顏色聚合向量等方法;提取圖片的紋理特征,可以采用灰度共生矩陣、自回歸紋理模型、小波變換等方法;提取圖片的形狀特征,可以采用邊界特征法、傅里葉形狀描述符法等。由于上述各種特征提取方法都屬于現(xiàn)有技術,在此不再贅述。SIFT特征是采用SIFT算法提取的一種局部特征,對旋轉、尺度縮放、亮度變化具有不變性。由于SIFT特征的提取算法屬于現(xiàn)有技術,本說明書在此不再做進一步的介紹。步驟S102中可以采用K-means聚類法對輸入圖片進行聚類,聚類采用的特征就是步驟S101中提取的全局特征。K-means聚類法以空間中k個點為中心進行聚類,對最靠近他們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。具體地,對輸入圖片進行初次聚類包括:從輸入圖片中選取一定數(shù)量的圖片作為樣本圖片,利用樣本圖片確定K個聚類中心,其中K為自然數(shù);將輸入圖片中除樣本外的剩余圖片分為K份,其中每份圖片對應一個聚類中心,利用分布式計算平臺,將每份圖片中的每張圖片分別與對應的聚類中心進行相似度比較,并將當前比較的圖片歸到最相似的聚類中心所在類。上述過程中,確定K個聚類中心,以及將每張圖片分別與對應的聚類中心進行比較過程中,依據(jù)的都是圖片的全局特征。應該理解,本發(fā)明中用于聚類的輸入圖片,數(shù)量很可能是巨大的,在上述實施方式中,對所有輸入圖片進行初次聚類采用了分布式計算的方式進行,這樣能夠使得對海量圖片的聚類處理所需時間保持在可接受的范圍之內(nèi)。輸入圖片在經(jīng)過初次聚類后,被分為了若干個圖片組。每個組內(nèi)的圖片具有一定的相似性,但不一定是相同內(nèi)容的圖片,例如一個組內(nèi)的圖片都是圓形的物體,但是里面有的是富士蘋果,有的是蛇果,并不完全一致。接下來,步驟S103中,將根據(jù)圖片的局部特征對該圖片組內(nèi)的圖片進行二次聚類。具體地,對圖片組內(nèi)的圖片進行二次聚類的步驟包括:針對每個圖片組,建立局部特征中各特征分量與圖片組中的各圖片之間的倒排索引;利用該倒排索引,將擁有共同特征分量數(shù)超過預設值的圖片歸為一類,得到每個圖片組內(nèi)的一個以上的集合。在步驟S101中提取的局部特征為SIFT特征,該特征以特征向量的形式表示,為了后續(xù)處理的方便,優(yōu)選地,本發(fā)明還在步驟S103之前對SIFT特征向量進行了量化處理。對SIFT特征進行量化處理,就是將SIFT特征的各特征分量變?yōu)?10101序列,即將SIFT特征中以實數(shù)表示的特征分量轉化為二進制序列表示的特征分量。請參考圖3和圖4,其中圖3是本發(fā)明中為圖片及其特征分量建立的普通索引的示意圖,圖4是本發(fā)明中為圖片及其特征分量建立的倒排索引的示意圖。其中圖3所示的普通索引可以通過圖片的ID確定該圖片的各特征分量,而圖4所示的倒排索引則可以通過已知的特征分量,確定與該特征分量對應的各圖片ID。本發(fā)明中,為圖片及其局部特征的特征分量,建立如圖3所示的倒排索引,在得到該倒排索引之后,查找該倒排索引,就可以確定擁有相同特征分量的圖片,例如查詢特征分量1,對應找到的圖片有圖片A、B、C,則圖片A、B、C就是擁有相同特征分量的圖片。當幾張圖片擁有相同特征分量的數(shù)目大于一個設定的閾值時,這幾張圖片就可以聚為一個集合,從而把初次聚類結果中的每個組內(nèi)的圖片進行了劃分,得到了輸入圖片的二次聚類結果。這時輸入圖片的二次聚類結果與初次聚類結果相比,擁有更小粒度的集合。由于采用了局部特征進行二次聚類,在二次聚類結果的每個集合中,可以得到相同內(nèi)容而版本可能不同的圖片,例如一個集合中的圖片表達的都是相同一只蘋果,各個圖片上加印了一些不同文字等。在另一個實施例中,步驟S101中提取輸入圖片的多個全局特征和一個局部特征。步驟S102中根據(jù)每個全局特征分別對輸入圖片進行初次聚類,以得到與每個全局特征對應的初次聚類結果,其中每個初次聚類結果包含多個圖片組。步驟S103中針對與每個全局特征對應的初次聚類結果,根據(jù)步驟S101中提取的局部特征分別對初次聚類結果中的每個圖片組內(nèi)的圖片進行二次聚類,以將每個圖片組內(nèi)的圖片分為多個集合,得到輸入圖片與每個全局特征對應的二次聚類結果。此外,在本實施例中,在步驟S103后還包括步驟S104:將各個二次聚類結果合并,得到輸入圖片的最終聚類結果。其中所述多個全局特征中包括第一全局特征,該第一全局特征融合了顏色特征描述子、紋理特征描述子、形狀特征描述子或空間關系特征描述子中的至少兩個。上述各個特征描述子,即對應特征的特征向量,用于描述對應特征。前文已經(jīng)介紹了顏色特征、紋理特征及形狀特征的提取方式,在此不再重復。通常空間關系特征的提取方式有兩種:一種是對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征;一種是簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特征,由于都屬于現(xiàn)有技術,在此不再展開描述。以優(yōu)選的實施方式為例,第一全局特征融合了上述四個特征描述子,具體地,在得到上述四個特征描述子后,將這四個特征描述子融合為第一全局特征的步驟包括:將上述四個特征描述子組合為一個特征向量;對該特征向量進行降維處理;對降維之后的特征向量進行量化處理,得到第一全局特征。其中降維處理是為了保留原特征向量中特征分量值高的特征分量,這些特征分量包含了第一全局特征的主要信息。由于降維處理和量化處理的算法均可采用現(xiàn)有技術進行,在此不再做過多的描述。步驟S101中提取的多個全局特征,除了上述方式得到的第一全局特征,還包括第二全局特征,所述第二全局特征可以是Gist(概要)特征。Gist特征是描述圖片概要信息的一種全局特征,其具體的算法可以參考http://ilab.usc.edu/siagian/Research/Gist/Gist.html中的介紹,在此不做重復說明。在本實施例中,通過采用兩種不同的全局特征分別進行初次聚類,然后利用局部特征在兩個初次聚類結果內(nèi)分別進行二次聚類,得到兩個二次聚類結果,通過將這兩個二次聚類結果合并,可以有效地擴大召回,本領域技術人員應該能夠理解,在其他的實施例中,采用多種全局特征分別進行初次聚類也是可行的。在上述的實施例中,將多個聚類結果進行合并的方式具體包括:將各個二次聚類結果包含的集合中,兩兩之間存在交集的多個集合合并為一個集合。以兩個聚類結果為例進行說明,如果聚類結果A包含集合A1、A2、A3,聚類結果B包含集合B1、B2、B3,其中集合A1中包含圖片4、5、6,集合B2中包含圖片4、5、7,則集合A1和B2存在交集圖片4和5,將集合A1和B2合并后得到的集合C1包含圖片4、5、6、7,假設集合A2、A3與B1、B3之間沒有交集,則將聚類結果A和聚類結果B合并后的最終聚類結果包含的集合為C1、A2、A3、B1、B3。在另一個實施例中,在對輸入圖片進行聚類之后,還可以對聚類結果中相同集合的圖片賦予統(tǒng)一標識,以方便搜索引擎接收到用戶的搜索關鍵字后,根據(jù)統(tǒng)一標識向用戶返回該標識對應集合中的圖片。在另一個實施例中,在對輸入圖片進行聚類后,還可以將聚類結果中包含圖片數(shù)量大于設定值的集合中的圖片作為熱門圖片,這些熱門圖片可用于在搜索引擎系統(tǒng)中作為優(yōu)先返回的檢索結果。請參考圖5,圖5是本發(fā)明中圖片聚類裝置的實施例一的結構示意框圖。如圖5所示,該實施例包括特征提取單元201、分組單元202及確定單元203。其中特征提取單元201,用于提取多張輸入圖片的全局特征和局部特征。分組單元202,用于根據(jù)所述全局特征對輸入圖片進行初次聚類,以得到與所述全局特征對應的初步聚類結果,其中初步聚類結果包括一個以上的圖片組。確定單元203,用于根據(jù)所述局部特征對每個圖片組內(nèi)的圖片進行二次聚類,以將每個組內(nèi)的圖片分為一個以上的集合,得到輸入圖片的二次聚類結果。其中,特征提取單元201提取的全局特征,可以是圖片的顏色紋理、形狀等特征,如MPEG-7的各種顏色或紋理描述符、LBP特征、距特征、小波特征等。局部特征可以是SIFT特征、SURF特征、color-SIFT特征、PCA-SIFT特征等。分組單元202可以采用K-means聚類法對輸入圖片進行聚類,聚類采用的特征就是特征提取單元201提取的全局特征。具體地,分組單元202可以包括聚類中心確定單元(圖中未示出)和比較單元(圖中未示出)。其中聚類中心確定單元用于從輸入圖片中選取一定數(shù)量的圖片作為樣本圖片,利用樣本圖片確定K個聚類中心,其中K為自然數(shù)。比較單元用于將輸入圖片中除樣本外的剩余圖片分為K份,其中每份圖片對應一個聚類中心,利用分布式計算平臺,將每份圖片中的每張圖片分別與對應的聚類中心進行相似度比較,并將當前比較的圖片歸到最相似的聚類中心所在類。具體地,確定單元203包括索引單元(圖中未示出)和歸類單元(圖中未示出),其中索引單元用于針對分組單元203得到的每個圖片組,建立局部特征中各特征分量與圖片組中的各圖片之間的倒排索引。歸類單元用于利用上述倒排索引,將擁有共同特征分量數(shù)超過預設值的圖片歸為一類,得到每個圖片組內(nèi)的一個以上的集合。請參考圖6,圖6為本發(fā)明中圖片聚類裝置的實施例二的結構示意框圖。如圖6所示,該裝置包括:特征提取單元3011、第一分組單元3021、第二分組單元3022、第一確定單元3031、第二確定單元3032及合并單元3041。其中特征提取單元3011,用于提取輸入圖片的第一全局特征、第二全局特征及局部特征。第一分組單元3021,用于根據(jù)第一全局特征對輸入圖片進行初次聚類,得到與第一全局特征對應的初次聚類結果。第二分組單元3022,用于根據(jù)第二全局特征對輸入圖片進行初次聚類,得到與第二全局特征對應的初次聚類結果。其中第一分組單元3021和第二分組單元3022得到的聚類結果中均包含有一個以上的圖片組。第一確定單元3031,用于針對第一分組單元3021得到的初次聚類結果,根據(jù)特征提取單元3011提取的局部特征對該初次聚類結果中的每個圖片組內(nèi)的圖片進行二次聚類,得到輸入圖片與第一全局特征對應的二次聚類結果。第二確定單元3032,用于針對第二分組單元3022得到的初次聚類結果,根據(jù)特征提取單元3011提取的局部特征對該初次聚類結果中的每個圖片組內(nèi)的圖片進行二次聚類,得到輸入圖片與第二全局特征對應的二次聚類結果。合并單元3041,用于將與第一全局特征對應的二次聚類結果和與第二全局特征對應的二次聚類結果合并,得到輸入圖片的最終聚類結果。其中合并的具體方式包括:將兩個聚類結果各自包含的集合中存在交集的兩個集合合并為一個集合?;谙嗨频姆椒?,如果在其他實施例中存在兩個以上的二次聚類結果,則合并的具體方式包括:將各聚類結果包含的集合中,兩兩之間存在交集的多個集合合并為一個集合。在本實施例中,特征提取單元3011中提取的第一全局特征包括顏色特征描述子、紋理特征描述子、形狀特征描述子或空間關系特征描述子中的至少兩個。第二全局特征為Gist特征。局部特征為SIFT特征。在本發(fā)明的另一個實施例中,本發(fā)明的裝置還可以包括標識單元(圖中未示出)或選取單元(圖中未示出)。其中標識單元用于為聚類結果中的相同集合的圖片賦予統(tǒng)一標識。選取單元用于將聚類結果中包含圖片數(shù)量大于設定值的集合中的圖片作為熱門圖片,其中熱門圖片用于在搜索引擎系統(tǒng)中作為優(yōu)先返回的檢索結果??梢岳斫?,這里的聚類結果對實施例一而言指的是輸入圖片的二次聚類結果,對實施例二而言是輸入圖片的最終聚類結果。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明保護的范圍之內(nèi)。