一種商標圖像識別方法
【技術(shù)領域】
[0001] 本發(fā)明屬于視覺目標檢測與識別技術(shù)領域,具體涉及一種商標圖像識別方法。
【背景技術(shù)】
[0002] 近年來,隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和普及,尤其是社交網(wǎng)站的不斷推廣和應用, 網(wǎng)絡上的圖像呈快速增長趨勢,這使得網(wǎng)絡媒體成為最具潛力的廣告及商業(yè)平臺。品牌跟 蹤是近些年出現(xiàn)的一種服務,通過分析品牌在媒體上曝光的頻繁程度以及用戶的評價來評 估品牌的成長。傳統(tǒng)的分析方法有兩種,一種是依靠人工進行分析和統(tǒng)計,由于網(wǎng)絡媒體數(shù) 量巨大,這種方式需要耗費大量的人力和時間;第二種方式是通過網(wǎng)站的關鍵詞搜索功能 檢索相關的圖像,然而關鍵詞并不一定與內(nèi)容密切相關:一方面搜索結(jié)果中含有大量噪聲, 盡管含有關鍵詞,但經(jīng)常與品牌并不相關,另一方面大量含有商標的圖像無法檢索到。因此 設計一種對圖像內(nèi)容進行分析,自動識別其中所含商標的方法,具有重要的商業(yè)應用價值。
[0003] 近年來,研究人員提出了一些基于"詞袋模型"的商標識別方法:首先從圖像中提 取SIFT或SURF特征,然后對這些特征進行聚類,形成視覺詞,然后將原始特征進行量化得到 這些視覺詞,這樣每張圖像就可以表示成視覺詞的集合。跟直接使用原始的特征相比,量化 后的特征維度大大降低,可以用于大規(guī)模的商標識別任務。但是,基于"詞袋模型"的方法存 在兩點不足:一是量化過程在降低原始特征維度的同時,也在一定程度上降低了原始特征 的表示能力,導致兩個原本不同的特征在量化后可能會被認為是相同的,稱為"誤匹配"。為 了盡可能地減少這些誤匹配,研究者們提出了一系列方法。代表作包括S.Romberg等人2013 年在文獻"Bundle min-hashing for logo recognition"中提出的同時考慮相鄰的多個關 鍵點的方法,以及C.Wan等人2013年在文獻"Tree-based shape descriptor for scalable logo detection"中提出的將空間位置滿足一定條件的四個關鍵點組合成一種樹形結(jié)構(gòu)的 方法。這些方法能在一定程度上緩解誤匹配的問題,但是它們對圖像的仿射變換以及關鍵 點缺失的魯棒性還有不足。
[0004] 基于"詞袋模型"的方法的第二個不足之處在于圖像中存在大量與商標不相關的 關鍵點,這些關鍵點不僅會干擾商標的正確識別,同時也會嚴重影響識別速度。為了去除這 些不相關的關鍵點,比較直接的做法是僅考慮出現(xiàn)在商標區(qū)域中的那些關鍵點,但是,對于 不同類型的商標,檢測出來的關鍵點數(shù)量差異很大,如果太少會影響識別效果,如果太多會 降低識別速度;另外,那些出現(xiàn)在商標區(qū)域內(nèi)的關鍵點有很多是與背景相關的,它們與商標 本身并沒有什么相關性。所以,只考慮出現(xiàn)在商標區(qū)域內(nèi)的關鍵點的方法并不能很好地去 除那些商標無關的關鍵點。
[0005] 綜上所述,現(xiàn)有的商標識別技術(shù)存在兩個不足之處:一是沒有一種對圖像仿射變 換和關鍵點缺失具有較好魯棒性的誤匹配消除方法;二是沒有在識別過程中能有效過濾那 些與商標不相關關鍵點的方法。
【發(fā)明內(nèi)容】
[0006] 針對現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種新的商標圖像識別方法,該技術(shù)采用首 先使用基于互信息的特征選擇方法來過濾掉大量與商標不相關的特征點,然后使用一種新 的拓撲約束方法來消除誤匹配,通過二者的結(jié)合,能夠達到識別速度快、識別率高的效果。
[0007] 本發(fā)明的一種商標圖像識別方法,包括如下步驟:
[0008] 首先采用基于互信息的特征選擇方法來過濾掉大量與商標不相關的特征點,包含 以下步驟:
[0009] (1)對于待識別的每種商標,準備一定數(shù)量(不少于5張)的訓練樣本,保證商標在 每張樣本中至少出現(xiàn)一次;
[0010] (2)對每張訓練樣本提取局部特征,如SIFT(Scale_Invariant Feature Transform)、SURF(Speeded Up Robust Features)特征,并對特征進行聚類和量化,將每張 訓練樣本表示成視覺詞集合;
[0011] (3)對于每種商標,將包含該商標的樣本作為正樣本,不包含該商標的樣本作為負 樣本,計算正樣本所包含的所有視覺詞的互信息,基于互信息對這些視覺詞進行排序,選取 互信息值最大的前η(默認100)個作為識別這種商標的特征。
[0012] 進一步,基于選取出來的特征對測試圖片進行商標識別,包含以下步驟:
[0013] (4)對每張測試圖像提取相同的局部特征,然后利用步驟(2)得到的聚類中心對這 些特征進行量化,將測試圖像表示成視覺詞的集合;
[0014] (5)關鍵點匹配:首先利用步驟(3)中選取出來的前η個視覺詞特征對測試圖像的 關鍵點進行過濾,僅保留那些包含在這η個視覺詞集合中的關鍵點。對測試圖像與待識別商 標的每張正樣本進行匹配,得到初始匹配點對,并記錄匹配關鍵點對的位置信息。
[0015] 進一步,利用特征點的拓撲關系來消除誤匹配的方法,具體步驟如下:
[0016] (6)對于步驟(5)中得到的每對匹配點,找到它們在各自圖像中距離最近的k(默認 10)個關鍵點,對這k個關鍵點各添加一個關于中心點(匹配點)的對稱點,然后對著2k個關 鍵點按順時針方向進行排序,分別得到兩個2k長度,并且首尾相連的序列;
[0017] (7)對步驟(6)中得到的兩個序列求最長公共子序列(LCS),再求出最長公共子序 列占所有2k個關鍵點的比例,作為匹配點對之間的匹配度,如果匹配度小于閾值α(默認 0.6),則認為是誤匹配,將它們從匹配點對中剔除;本發(fā)明中的消除誤匹配的方法也可以單 獨使用,用于去除錯誤匹配的關鍵點對;
[0018] (8)統(tǒng)計保留下來的匹配點對中不同視覺詞的數(shù)目作為測試圖像與樣本之間的相 似度;
[0019] (9)計算測試圖像與待識別商標的所有正樣本之間的最大相似度,作為判斷測試 圖像是否包含該商標的置信度,如果置信度大于閾值β,則認為測試圖像包含這種商標。
[0020] 本發(fā)明的有益效果在于:能夠快速準確地從圖像中自動識別出是否包含某種商 標,在普通PC機上識別一類商標的速度約為20ms/張,識別精度可以達到90%以上,達到了 實際應用水平。本發(fā)明之所以具有上述效果,其原因在于:本發(fā)明采用特征選擇來過濾掉大 量與目標商標不相關的特征點,降低了它們對識別結(jié)果的干擾,同時降低了后續(xù)步驟的時 間復雜度;在此基礎上,利用一種對圖像仿射變換和關鍵點缺失都具有較好魯棒性的拓撲 約束來消除錯誤匹配,能夠進一步提高識別精度。
【附圖說明】
[0021] 圖1是本發(fā)明的技術(shù)流程圖。
[0022] 圖2是采用具體圖像的技術(shù)流程圖。
[0023]圖3是特征選擇效果圖。
[0024]圖4是添加對稱點示意圖。
[0025]圖5是拓撲約束示意圖。
[0026]圖6是消除誤匹配效果圖。
【具體實施方式】
[0027]下面結(jié)合附圖和具體實例對本發(fā)明作進一步詳細的描述。
[0028]本發(fā)明是一種商標圖像識別方法,其技術(shù)流程如圖1和圖2所示,具體包含以下步 驟:
[0029] (1)準備正樣本,提取視覺特征
[0030] 對待識別的每種商標準備一定數(shù)量的訓練樣本,并對這些訓練樣本提取一種局部 特征,如SIFT特征或者SURF特征,然后對提取出來的特征進行聚類和量化,得到關鍵點的視 覺詞表示,如公式一所示:
[0031] 公式一 :k={P(k),S(k),I(k)}
[0032] 其中,k表示第k個關鍵點,P(k)表示位置,S(k)表示尺度,I(k)表示最近的聚類中 心。
[0033] (2)基于互信息的特征選擇
[0034]對于每種商標,將所有訓練樣本中包含該商標的樣本作為正樣本,不包含該商標 的樣本作為負樣本,計算正樣本中所有視覺詞的互信息,計算方法如公式二所示:
[0036]其中,c表示正樣本所屬類別,t表示正樣本中的某個視覺詞;表示包含或不包含 (i = l表示包含,i = 〇表示不包含)視覺詞t并且屬于或不屬于(j = l表示屬于,j = 0表示不 屬于)正樣本的圖片數(shù)量。舉例來說,N1Q表示包含視覺詞t但不屬于類別c的圖片數(shù)量,以此 類推。Ni. =Ni〇+Nii,N. j = N〇j+Nij,Ν=Νοο+Νοι+Νιο+Νιι〇
[0037]接著我們按照I(t,c)從大到小對所有視覺詞進行排序,選取前n(默認100,也可以 是其它值)個視覺詞作為后續(xù)識別這種商標的特征。因為互信息是衡量特征與類別相關性 的重要指標,互信息值越大,表示特征與類別的相關性越大,在分類(識別)過程中對結(jié)果的 影響也越大,所以利用特征選擇,能夠過濾掉大量與目標商標不相關的視覺詞(對應的關鍵 點也隨之被過濾掉),一方面能夠降低它們對識別結(jié)果的干擾,另一方面能夠極大地縮短后 續(xù)匹配和校驗的時間,進而提高整體的識別速度。特征選擇的效果如圖3所示,圖中共有四 對圖像,每對圖像中左圖為特征選擇前的圖像,右圖為特征選擇后的圖像。
[0038] (3)關鍵點匹配
[0039]對于測試圖片,在識別它是否包含某種商標的時候,需要計算它與這種商標的所 有正樣本之間的相似度,然后基于最大相似度來判斷它是否包含這種商標,如果大于閾值 β,則認為測試圖像包含這種商標。計算測試圖片與正樣本之間相似度的流程如下:
[0040] 同(1),首先對測試圖片提取相同的局部特征,然后利用(1)中得到的聚類中心對 特征進行量化,將測試圖片表示成視覺詞集合。然后利用(2)中得到的η個特征對測試圖片 進行關鍵點過濾,僅保留那些在這η個視覺詞范圍內(nèi)的關鍵點,這樣測試圖片與正樣本中剩 下的關鍵點數(shù)目跟η在同一個數(shù)量級。<