圖片特征提取方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明實施例涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖片特征提取方法及裝置。
【背景技術(shù)】
[0002] 隨著多媒體技術(shù)的發(fā)展和因特網(wǎng)的普及,人們獲得各種多媒體信息越來越容易, 其中圖片是數(shù)量最多的一種,如何對圖片進行分類以便有效地、快速地從大規(guī)模圖片數(shù)據(jù) 庫中檢索出所需要的圖片已成為人們?nèi)找骊P(guān)注的問題。而對圖片進行分類必然會對圖片進 行特征提取。
[0003] 現(xiàn)有技術(shù)中,基于圖片的分類技術(shù)通常構(gòu)建一個分層的特征提取框架,即空間金 字塔匹配/模型(Spatial Pyramid Matching/Model,簡稱SPM)方法。SPM方法通常采用 一種定義好的低層特征,例如尺度不變特征變換(Scale-invariant feature transform, 簡稱SIFT)特征。這種低層特征用來統(tǒng)計圖片中小型區(qū)域中的邊緣方向信息。因此SPM方 法在低層框架中輸出大量(基于區(qū)域)方向統(tǒng)計信息。之后,SPM方法在中層結(jié)構(gòu)中,基于 這些低層方向信息構(gòu)架中層特征。所謂中層特征,就是在不涉及圖片的高級含義信息的情 況下(例如圖片的物體信息或人臉圖片的ID)從圖片生成的信息。之后,該層次模型采用 支持向量機(Support Vector Machine,簡稱SVM)分類器在這種中層特征上進行圖片分類。 一般地,中層特征能夠很好地表達圖片的主要信息,并能夠產(chǎn)生很好的分類性能。
[0004] 現(xiàn)有的提取圖片特征的方法,由于低層特征是預先定義的邊緣方向統(tǒng)計信息,即 SIFT特征,所以該低層特征缺乏靈活性,不能針對每個圖片自適應(yīng)的提取特征且提取耗時 太長。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例提供一種圖片特征提取方法及裝置,以解決現(xiàn)有技術(shù)中不能針對每 個圖片自適應(yīng)的提取特征且提取耗時太長的問題。
[0006] 第一方面,本發(fā)明實施例提供一種圖片特征提取方法,包括:
[0007] 使用聚類算法從待分類的圖片數(shù)據(jù)集中獲取多個聚類中心作為低層特征提取器; 使用所述多個低層特征提取器對所述圖片數(shù)據(jù)集中的每張圖片做卷積操作,針對所述每張 圖片分別生成與所述多個低層特征提取器相同數(shù)量的卷積圖片;
[0008] 對所述多個卷積圖片分別進行閾值化操作獲取多個稀疏圖片;
[0009] 對所述多個稀疏圖片進行低層特征整合獲取多個整合后的圖片;
[0010] 對所述多個整合后的圖片進行中層特征提取操作獲取中層特征。
[0011] 結(jié)合第一方面,在第一方面的第一種實現(xiàn)方式中,所述使用聚類算法從待分類的 圖片數(shù)據(jù)集中獲取多個聚類中心作為低層特征提取器之前,包括:
[0012] 對圖片數(shù)據(jù)集中的圖片進行歸一化和去耦合的預處理操作得到所述待分類的圖 片數(shù)據(jù)集。
[0013] 結(jié)合第一方面、或第一方面的第一種實現(xiàn)方式,在第一方面的第二種實現(xiàn)方式中, 所述對多個卷積圖片分別進行閾值化操作獲取多個稀疏圖片之后,包括:
[0014] 對所述多個稀疏圖片分別進行標準化操作,所述標準化操作,包括:將所述多個稀 疏圖片中的各個圖片相同位置的像素值組成一個向量,對所述向量做歸一化后分別將所述 向量的各個分量放回到所述各個圖片的對應(yīng)位置得到多個標準化后的稀疏圖片;
[0015] 對應(yīng),所述對所述多個稀疏圖片進行低層特征整合獲取多個整合后的圖片,包 括:
[0016] 對所述多個標準化后的稀疏圖片進行低層特征整合獲取多個整合后的圖片。
[0017] 結(jié)合第一方面、或第一方面的第一、第二種實現(xiàn)方式,在第一方面的第三種實現(xiàn)方 式中,所述閾值化操作,包括:
[0018] 對所述多個卷積圖片中的每個卷積圖片的每一個像素值進行判定,如果所述像素 值大于預設(shè)的閾值,保留所述像素值,否則將所述像素值設(shè)置為〇 ;將所述每個卷積圖片的 所述閾值化操作后的像素值對應(yīng)生成一個稀疏圖片,得到多個稀疏圖片。
[0019] 結(jié)合第一方面、或第一方面的第一~第三任一種實現(xiàn)方式,在第一方面的第四種 實現(xiàn)方式中,所述對所述多個稀疏圖片進行低層特征整合獲取多個整合后的圖片,包括:
[0020] 將所述多個稀疏圖片中的每個稀疏圖片劃分成多個mXm的區(qū)域,分別將多個所 述區(qū)域的像素值組成m 2維的向量,將多個所述向量的相同位置的像素值組成多個整合后的 圖片,所述m為大于等于2的整數(shù),所述整合后的圖片的數(shù)量為所述稀疏圖片的數(shù)量的m 2 倍。
[0021] 結(jié)合第一方面、或第一方面的第一~第四任一種實現(xiàn)方式,在第一方面的第五種 實現(xiàn)方式中,所述對所述整合后的圖片進行中層特征提取操作獲取中層特征,包括:
[0022] 通過預先訓練好的字典對所述整合后的圖片進行稀疏編碼,所述字典包括所述稀 疏編碼的基向量;
[0023] 對稀疏編碼后的所述圖片按照預設(shè)的區(qū)域大小劃分區(qū)域,對所述區(qū)域運用最大池 化方法獲取描述所述圖片的向量,所述最大池化方法指對同一區(qū)域不同位置的特征進行聚 合統(tǒng)計;運用隨機降維方法對所述描述所述圖片的向量進行降維獲取到所述中層特征。
[0024] 第二方面,本發(fā)明實施例提供一種圖片特征提取裝置,包括:
[0025] 低層特征提取模塊,用于使用聚類算法從待分類的圖片數(shù)據(jù)集中獲取多個聚類中 心作為低層特征提取器;卷積操作模塊,用于使用所述多個低層特征提取器對所述圖片數(shù) 據(jù)集中的每張圖片做卷積操作,針對所述每張圖片分別生成與所述多個低層特征提取器相 同數(shù)量的多個卷積圖片;
[0026] 稀疏操作模塊,用于對所述多個卷積圖片分別進行閾值化操作獲取多個稀疏圖 片;
[0027] 低層特征整合模塊,用于對所述多個稀疏圖片進行低層特征整合獲取多個整合后 的圖片;
[0028] 中層特征提取模塊,用于對所述多個整合后的圖片進行中層特征提取操作獲取中 層特征。
[0029] 結(jié)合第二方面,在第二方面的第一種實現(xiàn)方式中,還包括:
[0030] 預處理模塊,用于對圖片數(shù)據(jù)集中的圖片進行歸一化和去耦合的預處理操作得到 所述待分類的圖片數(shù)據(jù)集。
[0031] 結(jié)合第二方面、或第一方面的第一種實現(xiàn)方式,在第二方面的第二種實現(xiàn)方式中, 所述稀疏操作模塊,具體用于:
[0032] 對所述多個稀疏圖片分別進行標準化操作,所述標準化操作,包括:將所述多個稀 疏圖片中的各個圖片相同位置的像素值組成一個向量,對所述向量做歸一化后分別將所述 向量的各個分量放回到所述各個圖片的對應(yīng)位置得到多個標準化后的稀疏圖片;
[0033] 對應(yīng),所述低層特征整合模塊,具體用于:對所述多個標準化后的稀疏圖片進行低 層特征整合獲取多個整合后的圖片。
[0034] 結(jié)合第二方面、或第一方面的第一、第二種實現(xiàn)方式,在第二方面的第三種實現(xiàn)方 式中,所述閾值化操作,包括:
[0035] 對所述多個卷積圖片中的每個卷積圖片的每一個像素值進行判定,如果所述像素 值大于預設(shè)的閾值,保留所述像素值,否則將所述像素值設(shè)置為〇 ;將所述每個卷積圖片的 所述閾值化操作后的像素值對應(yīng)生成一個稀疏圖片,得到多個稀疏圖片。
[0036] 結(jié)合第二方面、或第一方面的第一~第三任一種實現(xiàn)方式,在第二方面的第四種 實現(xiàn)方式中,所述低層特征整合模塊,具體用于:
[0037] 將所述多個稀疏圖片中的每個稀疏圖片劃分成多個mXm的區(qū)域,分別將多個所 述區(qū)域的像素值組成m 2維的向量,將多個所述向量的相同位置的像素值組成多個整合后的 圖片,所述m為大于等于2的整數(shù),所述整合后的圖片的數(shù)量為所述稀疏圖片的數(shù)量的m 2 倍。
[0038] 結(jié)合第二方面、或第一方面的第一~第四任一種實現(xiàn)方式,在第二方面的第五種 實現(xiàn)方式中,所述中層特征提取模塊,具體用于:
[0039] 通過預先訓練好的字典對所述整合后的圖片進行稀疏編碼,所述字典包括所述稀 疏編碼的基向量;
[0040] 對稀疏編碼后的所述圖片按照預