商標檢索方法
【專利摘要】本發(fā)明提供的商標檢索方法包括以下步驟:對樣本商標進行文字和圖像的分割以分割成文字和圖像部分;對樣本商標的整體、該樣本商標的圖像部分以及該樣本商標的文字部分分別進行特征提?。桓鶕?jù)提取的特征,針對樣本商標的整體、樣本商標的圖像部分以及樣本商標的文字部分分別建立整體特征數(shù)據(jù)庫、圖像特征數(shù)據(jù)庫以及文字特征數(shù)據(jù)庫;按照與樣本商標相同的步驟,對待測商標進行文字和圖像的分割以及特征提??;根據(jù)待測商標的圖像部分和文字部分的特征,分別在圖像特征數(shù)據(jù)庫和文字特征數(shù)據(jù)庫中進行相似度檢索;在待測商標的圖像部分和文字部分的相似度均不滿足相似度閾值的情況下,根據(jù)待測商標整體的特征,在整體特征數(shù)據(jù)庫中進行相似度檢索。
【專利說明】商標檢索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及多媒體信息檢索技術(shù),具體地,涉及一種商標檢索方法。
【背景技術(shù)】
[0002] 商標是公司、產(chǎn)品或服務(wù)的標志,與企業(yè)的商品質(zhì)量、服務(wù)質(zhì)量、經(jīng)營管理融為一 體,在工商業(yè)社會中起著非常重要的作用,是公司及其產(chǎn)品的一個重要屬性,具有唯一性。 為使商標得到合法的保護,必須向商標局正式注冊。隨著我國經(jīng)濟的發(fā)展和全球化進程的 加快,商標數(shù)量逐年遞增。防止重復注冊或相似商標注冊是商標管理的核心問題。為了保護 注冊商標的合法權(quán)益,打擊仿冒盜用注冊商標的違法行為,需要對待注冊的商標進行檢索, 與已注冊的商標進行比較,確定二者不相同或者不相近似,才具有注冊資格。
[0003] 商標的識別檢索是多媒體信息檢索領(lǐng)域的熱點問題,人們研宄和實現(xiàn)了多種不同 的形狀匹配算法,但對于多組合商標、尤其是文字和圖形組合商標來說,并沒有對商標中重 要的文字信息和圖像信息進行專門識別的方法,導致對于多組合商標的識別結(jié)果誤差較 大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是針對現(xiàn)有的商標識別檢索技術(shù)對于多組合商標的識別率較低的 問題,提供一種針對多組合商標的快速有效、識別率高的商標檢索方法。
[0005] 根據(jù)本發(fā)明的技術(shù)方案,提供一種商標檢索方法,該方法包括以下步驟:獲取所有 樣本商標;對樣本商標進行文字和圖像的分割,以分割成文字部分和圖像部分;對樣本商 標的整體、該樣本商標的圖像部分、以及該樣本商標的文字部分分別進行特征提??;根據(jù)提 取的特征,針對樣本商標的整體、樣本商標的圖像部分、以及樣本商標的文字部分分別建 立整體特征數(shù)據(jù)庫、圖像特征數(shù)據(jù)庫、以及文字特征數(shù)據(jù)庫;獲取待測商標;按照與樣本商 標相同的步驟,對待測商標進行文字和圖像的分割以及特征提取;根據(jù)待測商標的圖像部 分和文字部分的特征,分別在圖像特征數(shù)據(jù)庫和文字特征數(shù)據(jù)庫中進行相似度檢索,獲得 相似度檢索結(jié)果;在待測商標的圖像部分和文字部分的相似度均不滿足相似度閾值的情況 下,根據(jù)待測商標整體的特征,在整體特征數(shù)據(jù)庫中進行相似度檢索。
[0006] 根據(jù)本發(fā)明的技術(shù)方案,將樣本商標分割成文字部分和圖像部分,并對分割前和 分割后的樣本商標分別進行特征提取,對于待測商標同樣進行文字和圖像分割以及特征提 取,并分別針對待測商標的文字部分和圖像部分進行相似度檢索。更進一步地,如果針對待 測商標的文字部分和圖像部分均沒有檢索到相同或近似結(jié)果,再以商標整體進行相似度檢 索。
[0007] 本發(fā)明的商標檢索方法對多組合商標的整體內(nèi)容進行了分類處理,圖形特征和文 字特征的提取更加詳盡,對多組合商標的文字部分和圖像部分均進行了專門的識別和檢 索,快速有效且識別率更高,克服了現(xiàn)有技術(shù)存在的對多組合商標的識別結(jié)果誤差較大的 問題,在未獲得滿意的識別結(jié)果的情況下,本發(fā)明的商標檢索方法還按照文字和圖形結(jié)合 的商標整體進行了相似度檢索,能夠更好地保證相似度檢索的準確性。
[0008] 本發(fā)明的其他特征和優(yōu)點將在隨后的【具體實施方式】部分予以詳細說明。
【專利附圖】
【附圖說明】
[0009] 附圖是用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與下面的具 體實施方式一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0010] 圖1是本發(fā)明提供的商標檢索方法的流程示意圖。
【具體實施方式】
[0011] 以下結(jié)合附圖對本發(fā)明的【具體實施方式】進行詳細說明。應(yīng)當理解的是,此處所描 述的【具體實施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0012] 本發(fā)明提供了一種商標檢索方法,如圖1所示,該方法包括以下步驟:獲取所有樣 本商標;對樣本商標進行文字和圖像的分割,以分割成文字部分和圖像部分;對樣本商標 的整體、該樣本商標的圖像部分、以及該樣本商標的文字部分分別進行特征提??;根據(jù)提取 的特征,針對樣本商標的整體、樣本商標的圖像部分、以及樣本商標的文字部分分別建立整 體特征數(shù)據(jù)庫、圖像特征數(shù)據(jù)庫、以及文字特征數(shù)據(jù)庫;獲取待測商標;按照與樣本商標相 同的步驟,對待測商標進行文字和圖像的分割以及特征提??;根據(jù)待測商標的圖像部分和 文字部分的特征,分別在圖像特征數(shù)據(jù)庫和文字特征數(shù)據(jù)庫中進行相似度檢索,獲得相似 度檢索結(jié)果;在待測商標的圖像部分和文字部分的相似度均不滿足相似度閾值的情況下, 根據(jù)待測商標整體的特征,在整體特征數(shù)據(jù)庫中進行相似度檢索。
[0013] 根據(jù)本發(fā)明的技術(shù)方案,此處"所有的樣本商標"指的是已注冊的、并定期更新或 實時更新的所有商標。對多組合樣本商標進行的文字和圖像的分割可以根據(jù)實際情況的需 要采用基于連通域投影法、基于連通域面積法、以及基于結(jié)構(gòu)的子圖抽取法中的一者來實 現(xiàn),本發(fā)明不對其進行限定。
[0014] 基于連通域投影法:對于文字圖像組合商標來說,雖然商標中的文字部分可能由 漢字、拼音和英文組成且字體、大小、形狀不規(guī)則,但是文字通常以行的形式出現(xiàn),同一行中 的文字個數(shù)多于一個且文字的高度相差不大,而商標中的圖形部分通常單獨位于一行且與 文本行間存在間隔。這是文字圖像組合商標中最常見的情況?;谶B通域投影的文字消除 方法是將連通域分解所得到的子圖像沿水平方向投影,然后按照投影的結(jié)果分層為文本層 和圖形層,確定圖形所在的層且保留該層。
[0015] 基于連通域面積法:圖形是商標的關(guān)鍵部分,在大部分文字圖像組合商標中,圖形 在面積上占主導地位。商標中的文字無論出現(xiàn)在圖形的內(nèi)部或者外部,與圖形相比所占的 面積都較小,定義一個面積閾值可以達到去掉噪聲面積較小的文字的目的,而對面積較大 的子圖形來說,在消除文字噪聲前需要做一些判斷,防止誤消除一些有用的子圖形?;谶B 通域面積法主要利用圖形的外圍特征和筆劃穿刺特征把文字和圖形區(qū)分開來,因為文字通 常是由很多筆劃組成的不封閉圖形,而圖形的外輪廓比較平滑,通過該方法可以消除圖形 內(nèi)部的文字,也可以消除和圖形的投影相重疊的文字。
[0016] 基于結(jié)構(gòu)的子圖抽取法:在部分文字圖像組合商標中,與文字部分相比,圖形部分 并不占據(jù)明顯的優(yōu)勢,且圖形部分通常和文字部分完全重疊。通常在商標圖案的寬高差別 較大時,會出現(xiàn)圖形在面積上不占優(yōu)勢的情況,另外,與其它的圖像相比,這些圖像的結(jié)構(gòu) 比較規(guī)則,即具有確定的結(jié)構(gòu)?;诮Y(jié)構(gòu)的子圖抽取法對圖像的處理過程如下:對于橫向商 標圖像,首先計算圖像的寬高比并判斷是否大于給定的閾值,對寬高比較大的圖像(大于 閾值),確定該圖像的結(jié)構(gòu),如果滿足事先給定的結(jié)構(gòu),則保留相應(yīng)的圖像部分。對于縱向商 標圖像,可將商標圖像逆時針旋轉(zhuǎn)90度,然后按照橫向商標圖像的方法處理。
[0017] 根據(jù)本發(fā)明的技術(shù)方案,在完成樣本商標的文字和圖像分割之后,對樣本商標的 整體、該樣本商標的圖像部分、以及該樣本商標的文字部分分別進行特征提取。
[0018] 對于樣本商標的整體的特征提取,根據(jù)實際情況的需要,對樣本商標的整體的特 征提取可以包括全局特征提取或局部特征提取,或包括全局特征和局部特征提取兩者,本 發(fā)明不對此進行限定。
[0019] 其中,所述全局特征可以包括顏色特征和邊緣形狀特征。顏色特征用于描述圖像 或圖像區(qū)域所對應(yīng)的景物的表面性質(zhì)。常用的顏色特征提取方法包括顏色直方圖、顏色集、 顏色矩、顏色聚合向量、顏色相關(guān)圖等等,其原理及計算過程為本領(lǐng)域技術(shù)人員所公知。
[0020] 所謂邊緣,是指其周圍像素灰度急劇變化的那些象素的集合,邊緣存在于目標、背 景和區(qū)域之間,是圖像最基本的特征。所述邊緣形狀特征信息的提取可采用以下邊緣檢測 算法中的任一者實現(xiàn):Sobel算子邊緣檢測、Roberts算子邊緣檢測、Prewitt算子邊緣檢 測、Laplacian算子邊緣檢測、以及Canny算子邊緣檢測。
[0021] USobel算子邊緣檢測
[0022] Sobel算子主要用于邊緣檢測,在技術(shù)上是以離散型的差分算子,用以運算圖像亮 度函數(shù)的梯度的近似值,Sobel算子是典型的基于一階導數(shù)的邊緣檢測算子,由于該算子中 引入了類似局部平均的運算,因此對噪聲具有平滑作用,能很好的消除噪聲的影響。
[0023] Sobel算子包含兩組3x3的矩陣,分別為橫向及縱向模板,將之與圖像作平面卷 積,即可分別得出橫向及縱向的亮度差分近似值。實際使用中,常用以下兩個模板來檢測圖 像邊緣。
[0024] 檢測水平邊沿橫向模板:
【權(quán)利要求】
1. 一種商標檢索方法,其特征在于,該方法包括w下步驟: 獲取所有樣本商標; 對樣本商標進行文字和圖像的分割,W分割成文字部分和圖像部分; 對樣本商標的整體、該樣本商標的圖像部分、W及該樣本商標的文字部分分別進行特 征提?。? 根據(jù)提取的特征,針對樣本商標的整體、樣本商標的圖像部分、W及樣本商標的文字部 分分別建立整體特征數(shù)據(jù)庫、圖像特征數(shù)據(jù)庫、W及文字特征數(shù)據(jù)庫; 獲取待測商標; 按照與樣本商標相同的步驟,對待測商標進行文字和圖像的分割W及特征提取; 根據(jù)待測商標的圖像部分和文字部分的特征,分別在圖像特征數(shù)據(jù)庫和文字特征數(shù)據(jù) 庫中進行相似度檢索,獲得相似度檢索結(jié)果; 在待測商標的圖像部分和文字部分的相似度均不滿足相似度闊值的情況下,根據(jù)待測 商標整體的特征,在整體特征數(shù)據(jù)庫中進行相似度檢索。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述文字和圖像的分割采用基于連通域 投影法、基于連通域面積法、W及基于結(jié)構(gòu)的子圖抽取法中的一種來實現(xiàn)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對樣本商標的整體和待測商標整體的特 征提取包括全局特征提取和/或局部特征提取。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述全局特征包括顏色特征和邊緣形狀 特征。
5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述局部特征包括尺度不變特征轉(zhuǎn)換特 征或加速魯椿性特征。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對樣本商標和待測商標的圖像部分的特 征提取包括全局特征提取和/或局部特征提取。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述全局特征包括顏色特征和邊緣形狀 特征。
8. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述局部特征包括尺度不變特征轉(zhuǎn)換特 征或加速魯椿性特征。
9. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對樣本商標和待測商標的文字部分的特 征提取包括結(jié)構(gòu)特征提取或像素分布特征提取。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述像素分布特征提取為逐像素特征提 取、骨架特征提取或微結(jié)構(gòu)特征提取。
【文檔編號】G06F17/30GK104462380SQ201410752381
【公開日】2015年3月25日 申請日期:2014年12月11日 優(yōu)先權(quán)日:2014年12月11日
【發(fā)明者】孔軍民 申請人:北京中細軟移動互聯(lián)科技有限公司