本發(fā)明涉及商標信息檢索領(lǐng)域,具體涉及一種商標分卡處理的方法、裝置、系統(tǒng)及商標存儲器。
背景技術(shù):
商標查詢對于商標注冊、管理及保護具有重要的意義,其作用體現(xiàn)在:能及時發(fā)現(xiàn)商標注冊申請的障礙,弄清商標能否安全使用,發(fā)現(xiàn)他人搶注的商標,了解商標的法律狀態(tài)、查清相關(guān)商標權(quán)利范圍的詳細信息等。商標分卡是商標檢索的基礎(chǔ)工作。
現(xiàn)有技術(shù)的商標分卡處理方法主要是針對商標的文字內(nèi)容和圖形進行商標分卡,包括:對商標含有的文字按整體和文字類別進行分卡,文字類別又細分為漢語文字、字母組合、數(shù)字、拼音,圖形則按維也納協(xié)定建立的《商標圖形要素國際分類》標準對圖形進行商標圖形要素編碼劃分。例如圖2所示的商標圖樣,一般會建立如下分卡:針對商標的漢語文字內(nèi)容建立漢語文字分卡:“格力”,針對商標的字母組合文字內(nèi)容建立英文文字分卡:“gree”,針對商標的圖形建立商標圖形要素編碼:“26.1.10”。
傳統(tǒng)的商標分卡技術(shù)方案僅能解決商標檢索的基本數(shù)據(jù)問題,但無法解決由多項分卡檢索請求而檢索出的樣本商標集與輸入商標的相似程度評價問題,這種商標分卡存在以下缺陷和弊端:
1、根據(jù)商標審查實務(wù)的經(jīng)驗總結(jié),商標近似判斷的重點在于判斷兩商標在形、義、音方面是否存在共同特征,而傳統(tǒng)的商標分卡處理方法針對商標的文字內(nèi)容和圖形的分卡結(jié)果,無法全面反映商標的形狀特征、含義特征和讀音特征;
2、傳統(tǒng)的商標分卡方法難以支持樣本商標與輸入商標在形、義、音多特征方面進行商標近似度的綜合評價,易在商標檢索中產(chǎn)生近似商標的漏檢。
技術(shù)實現(xiàn)要素:
鑒于此,本發(fā)明的目的在于提供一種商標分卡處理的方法。旨在克服傳統(tǒng)商標分卡處理方法的缺陷,獲取全面反映商標的形狀特征、讀音特征和含義特征的商標分卡信息,有利實現(xiàn)對檢索出的樣本商標與輸入商標在多特征方面進行商標近似度的綜合評價。
為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
一種商標分卡處理方法,包括以下步驟:
步驟s110:對待分卡商標中的構(gòu)成要素漢語文字、圖形、字母、數(shù)字或符號進行識別,獲取構(gòu)成要素的內(nèi)容;
步驟s120:提取待分卡商標各構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元;
步驟s130:根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一組合規(guī)則所生成的分詞作為商標分卡信息。
所述商標分卡處理方法,步驟s110所述的構(gòu)成要素的內(nèi)容中:漢語文字構(gòu)成要素的內(nèi)容為商標中含有的漢語文字及其組合,圖形構(gòu)成要素的內(nèi)容為商標圖樣圖片及圖片的像素信息,字母構(gòu)成要素的內(nèi)容為商標中含有的字母及其組合,數(shù)字或符號構(gòu)成要素的內(nèi)容為商標中含有的漢語數(shù)字、阿拉伯數(shù)字、其他語種數(shù)字或符號及其組合。
所述商標分卡處理方法,步驟s120所述待分卡商標各構(gòu)成要素的形狀特征最小單元包括:
構(gòu)成要素為漢語文字的形狀特征最小單元,選如下之一:每一漢語文字,每一漢語文字的每一筆劃;
構(gòu)成要素為圖形的形狀特征最小單元,選如下之一:商標圖形要素編碼,預(yù)設(shè)定長的商標圖像輪廓線上像素點集;
構(gòu)成要素為字母的形狀特征最小單元,選如下之一:每一語種的單詞,每一個字母;
構(gòu)成要素為漢語數(shù)字的形狀特征最小單元,選如下之一:漢語數(shù)字的組合,每一單個的漢語數(shù)字;
構(gòu)成要素為阿拉伯數(shù)字的形狀特征最小單元,選如下之一:阿拉伯數(shù)字的組合,每一單個的阿拉伯數(shù)字;
構(gòu)成要素為其他語種數(shù)字的形狀特征最小單元,選如下之一:其他語種數(shù)字的組合,每一單個的其他語種數(shù)字;
構(gòu)成要素為符號的形狀特征最小單元:為每一單個的符號。
所述商標分卡處理方法,步驟s120所述各構(gòu)成要素的含義特征最小單元包括:
構(gòu)成要素為漢語文字的含義特征最小單元:商標的整體漢語文字組合由漢語詞典所記載的詞語組合構(gòu)成時,每個詞語為含義特征最小單元,否則,商標的整體漢語文字組合為含義特征最小單元;
構(gòu)成要素為圖形的含義特征最小單元:商標圖形要素編碼所對應(yīng)的每一事物的名稱;
構(gòu)成要素為字母的含義特征最小單元:商標的整體字母組合由英文詞典所記載的單詞組合構(gòu)成,或其他語種詞典所記載的單詞組合構(gòu)成時,每個單詞為含義特征最小單元,否則,商標的整體字母組合為含義特征最小單元;
構(gòu)成要素為漢語數(shù)字的含義特征最小單元,選如下之一:商標中被分隔的每一組漢語數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,商標中每一單個漢語數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,其中,所述預(yù)設(shè)基準語種數(shù)字為任何語種數(shù)字;
構(gòu)成要素為阿拉伯數(shù)字的含義特征最小單元,選如下之一:商標中被分隔的每一組阿拉伯數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,商標中每一單個阿拉伯數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,其中,所述預(yù)設(shè)基準語種數(shù)字為任何語種數(shù)字;
構(gòu)成要素為其他語種數(shù)字的含義特征最小單元,選如下之一:商標中被分隔的每一組其他語種數(shù)字所述對應(yīng)的預(yù)設(shè)基準語種數(shù)字,商標中每一單個的其它語種數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,所述預(yù)設(shè)基準語種數(shù)字為任何語種數(shù)字;
構(gòu)成要素為符號的含義特征最小單元:商標中每一符號所對應(yīng)的符號名稱。
所述商標分卡處理方法,步驟s120所述各構(gòu)成要素的讀音特征最小單元包括:
構(gòu)成要素為漢語文字的讀音特征最小單元,為每一漢語文字的拼音;
構(gòu)成要素為圖形的讀音特征最小單元,為商標圖形要素編碼所對應(yīng)的每一事物的名稱的拼音;
構(gòu)成要素為字母的讀音特征最小單元,選如下之一:每一字母組合的讀音、每一個字母的讀音;
構(gòu)成要素為數(shù)字或符號的讀音特征最小單元,選如下之一:商標中被分隔的每一組數(shù)字的讀音,每一單個數(shù)字的讀音,商標中被分隔的每一組符號的讀音,每一單個符號的讀音。
所述商標分卡處理的方法,其中,步驟s130所述預(yù)設(shè)的最小單元多種組合規(guī)則,包括形狀特征最小單元多種組合規(guī)則,含義特征小單元多種組合規(guī)則,讀音特征最小單元多種組合規(guī)則,其中,
所述形狀特征最小單元多種組合規(guī)則包括:
a、構(gòu)成要素為漢語文字的形狀特征最小單元多種組合規(guī)則,包括分卡標準a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一種,其中,
a1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
a2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
a3表示按順序排列的商標中的漢語文字切分為一個分詞,
a4表示按逆序排列的商標中的漢語文字切分為一個分詞,
a5表示按順序排列的商標中含有漢語數(shù)字切分為一個分詞,
a6表示按逆序排列的商標中含有漢語數(shù)字切分為一個分詞,
a7表示商標中每個相對獨立的部分分別切分為一個分詞,
a8表示商標文字中完整包含現(xiàn)有漢語文字商標,將該部分切分為一個分詞,
a9表示商標中含有的繁體、異體字轉(zhuǎn)換為簡體字后切分為一個分詞,
a10表示商標中每個文字替換為形近字后切分為一個分詞,
a11表示商標中每相鄰漢語文字分別切分為一個分詞,
a12表示商標中首尾漢字組合切分為一個分詞,
a13表示商標中每個漢語文字切分為一個分詞;
b、構(gòu)成要素為字母、數(shù)字、符號的形狀特征最小單元多種組合規(guī)則,包括分卡標準b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一種,其中,
b1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
b2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
b3表示按順序排列的商標中的字母組合切分為一個分詞,
b4表示按逆序排列的商標中的字母組合切分為一個分詞,
b5表示按順序排列的商標中含有的非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞,
b6表示按逆序排列的商標中含有的非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞,
b7表示按順序排列的商標中含有的符號組合切分為一個分詞,
b8表示按逆序排列的商標中含有的符號組合切分為一個分詞,
b9表示商標中每個相對獨立部分分別切分為一個分詞,
b10表示商標中每字母被形近字母替換后切分為一個分詞,
b11表示商標中每相鄰字母組合分別切分為一個分詞,
b12表示商標中字母按照不同定序排列后分別切分為一個分詞,
b13表示商標中首尾字母組合切分為一個分詞,
b14表示商標中每個字母或數(shù)字或符號分別切分為一個分詞;
c、構(gòu)成要素為圖形的形狀特征最小單元多種組合規(guī)則,包括分卡標準c1、c2、c3、c4中的至少一種,其中,
c1表示商標圖形要素編碼集合整體切分為一個分詞,
c2表示每一商標圖形要素編碼切分為一個分詞,
c3表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集整體分別切分為一個分詞,
c4表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集預(yù)設(shè)定長分別切分為一個分詞,所述商標圖像特征字符串集預(yù)設(shè)定長是指預(yù)先設(shè)置的商標圖像輪廓線上連續(xù)相連的像素點的長度,連續(xù)相連的像素點以特征字符串集、或數(shù)字集表示,取值范圍為商標圖像特征字符串集、或數(shù)字集總長度的0.1%-50%;
所述讀音特征最小單元多種組合規(guī)則包括:
d、構(gòu)成要素為漢語文字的讀音特征最小單元多種組合規(guī)則,包括分卡標準d1、d2、d3中的至少一種,其中,
d1表示商標中每個漢語文字的拼音音節(jié)切分為一個分詞,
d2表示商標中整體漢語文字對應(yīng)的拼音切分為一個分詞,
d3表示商標中每個中文文字被替換為形近字后的拼音音節(jié)切分為一個分詞;
e、構(gòu)成要素為字母、數(shù)字、符號的讀音特征最小單元多種組合規(guī)則包括分卡標準e1、e2、e3、e4中的至少一種,其中,
e1表示商標中每個英文單詞的讀音音節(jié)切分為一個分詞,
e2表示商標中字母組合被其音近字母組合替換后得到的整體字母組合分別切分為一個分詞,
e3表示商標中每個數(shù)字的讀音音節(jié)切分為一個分詞,
e4表示商標中每個符號的讀音音節(jié)切分為一個分詞;
f、構(gòu)成要素為圖形的讀音特征最小單元多種組合規(guī)則包括分卡標準f1,其中,f1表示商標的圖形要素編碼所對應(yīng)的每一事物的名稱的拼音切分為一個分詞;
所述含義特征最小單元多種組合規(guī)則包括:
g、構(gòu)成要素為漢語文字的含義特征最小單元多種組合規(guī)則包括分卡標準g1、g2、g3、g4中的至少一種,其中,
g1表示商標中完整包含商標服務(wù)器中現(xiàn)有漢語文字商標、且商標整體無含義,將含有現(xiàn)有漢語文字商標的部分切分為一個分詞,
g2表示商標中與漢語詞典所收錄的詞匯或商標服務(wù)器中現(xiàn)有漢語文字商標的漢字組合全部匹配的,將匹配部分分別切分為一個分詞,
g3表示商標中含有的漢語詞匯替換為近義詞后分別切分為一個分詞,
g4表示商標整體無含義的,整體漢語文字切分為一個分詞;
h、構(gòu)成要素為字母、數(shù)字、符號組合的含義特征最小單元多種組合規(guī)則包括分卡標準h1、h2、h3、h4、h5、h6、h7、h8中的至少一種,其中,
h1表示商標的整體字母組合由英文詞典或其他語種詞典所記載的單詞組合構(gòu)成,整體單詞組合切分為一個分詞,
h2表示商標中含有英語詞典或其他語種詞典所收錄的單詞,每個單詞切分為一個分詞,
h3表示商標中含有英語詞典或其他語種詞典所收錄的單詞,將每個單詞的近義詞切分為一個分詞,
h4表示商標的整體字母組合與英文詞典或其他語種詞典所記載的單詞不匹配的,整體字母組合切分為一個分詞,
h5表示商標中被分隔的每一組數(shù)字切分為一個分詞,
h6表示商標的整體數(shù)字組合切分為一個分詞,
h7表示商標的整體符號組合切分為一個分詞,
h8表示商標的每一符號切分為一個分詞,
h9表示商標完整包含商標服務(wù)器現(xiàn)有字母組合商標、且商標整體無含義,將含有現(xiàn)有字母組合商標的部分切分為一個分詞;
i、構(gòu)成要素為圖形的含義特征最小單元多種組合規(guī)則包括分卡標準i1、i2中的至少一種,其中,
i1表示商標圖形要素編碼所對應(yīng)的每一事物的名稱切分為一個分詞,
i2表示商標圖像特征字符串集對應(yīng)有商標圖形要素編碼,商標圖形要素編碼所對應(yīng)每個事物名稱切分為一個分詞;
y、構(gòu)成要素為例外調(diào)整文字的最小單元多種組合規(guī)則包括分卡標準y1、y2中的至少一種,其中,
y1表示商標中含有例外調(diào)整文字,將例外調(diào)整文字整體切分為一個分詞;
y2表示商標中含有例外調(diào)整文字,將例外調(diào)整文字每個文字分別切分為一個分詞。
本發(fā)明的另一目的是提供一種商標分卡處理的裝置,包括:
構(gòu)成要素的內(nèi)容獲取模塊,用于對待分卡商標是否由漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素進行識別,獲取構(gòu)成要素的內(nèi)容;
形狀特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的形狀特征最小單元;
讀音特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的讀音特征最小單元;
含義特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的含義特征最小單元;
商標分卡信息獲取模塊,用于根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一規(guī)則所生成的各種文字、圖形的分詞作為一個商標分卡的信息。
本發(fā)明的另一目的是提供一種商標分卡處理的系統(tǒng),包括商標存儲器和服務(wù)器,所述商標存儲器和服務(wù)器經(jīng)配置執(zhí)行以下操作:對待分卡商標是否由漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素進行識別,獲取構(gòu)成要素的內(nèi)容;提取并儲存待分卡商標各構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元;根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一規(guī)則所生成的分詞作為一個商標分卡的信息。
本發(fā)明的另一目的是提供一種商標存儲器,包括:
基礎(chǔ)字詞典存儲單元,用于存儲漢語文字、漢語詞語、英語單詞、圖形要素編碼及其對應(yīng)的事物名稱、形近字、音近字、近義詞;
商標構(gòu)成要素內(nèi)容存儲單元,用于存儲獲取待分卡商標的漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素;
形狀特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的形狀特征最小單元和根據(jù)預(yù)設(shè)的形狀特征最小單元多種組合規(guī)則獲取的商標分卡信息;
讀音特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的讀音特征最小單元和根據(jù)預(yù)設(shè)的讀音最小單元多種組合規(guī)則獲取的商標分卡信息;
含義特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的含義特征最小單元和根據(jù)預(yù)設(shè)的含義最小單元多種組合規(guī)則獲取的商標分卡信息;
商標分卡處理的程序存儲單元,用于存儲商標分卡處理的相關(guān)程序。
有益效果:本發(fā)明提取商標含有的漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元,并根據(jù)預(yù)設(shè)的最小單元組合規(guī)則獲取每一規(guī)則所產(chǎn)生的分詞,作為商標分卡信息,從而建立商標在形音義方面的基礎(chǔ)數(shù)據(jù),為解決商標檢索的近似度評價提供有效的數(shù)據(jù)支持,保障商標近似判斷時考慮了兩商標在形、義、音方面是否存在共同特征,避免商標的漏檢,有利實現(xiàn)對檢索出的樣本商標與輸入商標在形、義、音多特征方面進行商標近似度的綜合評價的目的。
附圖說明
圖1是本發(fā)明實施例中的商標分卡處理方法的流程示意圖。
圖2是本發(fā)明實施例的示例性商標原圖。
圖3是圖2n所示商標采用10×10坐標系標準獲取商標圖像輪廓線上像素點的圖像特征字符串集圖。
圖4是圖2n所示圖形商標采用20×20坐標系標準獲取商標圖像輪廓線上像素點的圖像特征字符串集圖。
圖5是本發(fā)明實施例中的商標分卡處理裝置的結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚、明確,以下結(jié)合附圖并和具體實施例對本發(fā)明進一步詳細說明。
如圖1所示,一種商標分卡處理的方法,包括以下步驟:
步驟s110:對待分卡商標中的構(gòu)成要素漢語文字、圖形、字母、數(shù)字或符號進行識別,獲取構(gòu)成要素的內(nèi)容;
步驟s120:提取待分卡商標各構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元;
步驟s130:根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一組合規(guī)則所生成的分詞作為商標分卡信息。
以下基于具體實施例對上述各步驟進行具體說明:
第一,步驟s110:對輸入商標是否由漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素進行識別,獲取構(gòu)成要素的內(nèi)容。
所示商標構(gòu)成要素的內(nèi)容中,漢語文字構(gòu)成要素的內(nèi)容為商標中含有的漢語文字及其組合,圖形構(gòu)成要素的內(nèi)容為商標圖樣圖片及圖片的像素信息,字母構(gòu)成要素的內(nèi)容為商標中含有的字母及其組合,數(shù)字或符號構(gòu)成要素的內(nèi)容為商標中含有的漢語數(shù)字、阿拉伯數(shù)字、其他語種數(shù)字或符號。
圖2a至圖2p所示為隨機給出的示例性商標原圖,這些商標圖像可能包括商標構(gòu)成要素的內(nèi)容有:漢語文字、字母、數(shù)字、符號、圖形等,均可作為本發(fā)明實施例的處理對象,即輸入商標或樣本商標。
輸入商標的構(gòu)成要素的內(nèi)容一般通過在商標檢索的檢索入口錄入而獲取,也可通過圖像識別或ocr文字識別獲取,樣本商標的構(gòu)成要素的內(nèi)容一般從現(xiàn)有的商標數(shù)據(jù)庫中的各種商標文字數(shù)據(jù)記錄和商標圖形要素編碼數(shù)據(jù)記錄中獲取。
以圖2a為例,獲取該商標構(gòu)成要素的內(nèi)容包括:漢語文字構(gòu)成要素的內(nèi)容“格力”,字母構(gòu)成要素的內(nèi)容“gree”,圖形構(gòu)成要素的內(nèi)容“商標圖形要素編碼:26.1.10”。
第二,步驟s120:提取輸入商標各構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元。
在本發(fā)明的實施例中,商標分卡的目是為商標近似度評價提供數(shù)據(jù)支持,這些數(shù)據(jù)由各種特征的最小單元及其組合構(gòu)成,各種特征最小單元包括:
(1)形狀特征最小單元
構(gòu)成要素為漢語文字的形狀特征最小單元,選如下之一:每一漢語文字,每一漢語文字的每一筆劃。以圖2a為例,其構(gòu)成要素為漢語文字的形狀特征最小單元為商標中含有的每一漢語文字,即:“格”和“力”。
構(gòu)成要素為圖形的形狀特征最小單元,選如下之一:商標圖形要素編碼,預(yù)設(shè)定長的商標圖像輪廓線上像素點集。以圖2a為例,構(gòu)成要素為圖形的形狀特征最小單元為商標圖形要素編碼,即:“26.1.10”。
構(gòu)成要素為字母的形狀特征最小單元,選如下之一:每一語種的單詞,每一個字母。以圖2a為例,構(gòu)成要素為字母的形狀特征最小單元選“每一語種的單詞”時為“gree”,選“每一個字母”時為:“g”、“r”、“e”、“e”。
構(gòu)成要素為漢語數(shù)字的形狀特征最小單元,選如下之一:漢語數(shù)字的組合,每一單個的漢語數(shù)字,以圖2b為例,漢語數(shù)字的形狀特征最小單元為“壹貳叁”或“壹”、“貳”、“叁”。
構(gòu)成要素為阿拉伯數(shù)字的形狀特征最小單元,選如下之一:阿拉伯數(shù)字的組合,每一單個的阿拉伯數(shù)字。以“555”商標為例,阿拉伯數(shù)字的形狀特征最小單元為“555”或“5”、“5”、“5”。
構(gòu)成要素為其他語種數(shù)字的形狀特征最小單元,選如下之一:其他語種數(shù)字的組合,每一單個的其他語種數(shù)字。
構(gòu)成要素為符號的形狀特征最小單元,為每一單個的符號。以圖2p為例,構(gòu)成要素為符號的形狀特征最小單元是單個的符號,即“@”為構(gòu)成要素為符號的形狀特征最小單元。
(2)含義特征最小單元
構(gòu)成要素為漢語文字的含義特征最小單元:商標的整體漢語文字組合由漢語詞典所記載的詞語組合構(gòu)成時,每個詞語為含義特征最小單元,否則,商標的整體漢語文字組合為含義特征最小單元。以圖2d為例,商標整體漢語文字組合“四通歐譜”不是由漢語詞典所記載的詞語組合構(gòu)成的,其含義特征最小單元為商標的整體漢語文字組合,即“四通歐譜”。
構(gòu)成要素為圖形的含義特征最小單元:商標圖形要素編碼所對應(yīng)的每一事物的名稱。以圖2n為例,經(jīng)檢索查詢獲得的該商標圖形要素編碼是:5.7.13,該圖形要素編碼所對應(yīng)事物的名稱是“蘋果”或“柿子”,其含義特征最小單元即為“蘋果”或“柿子”。
構(gòu)成要素為字母的含義特征最小單元:商標的整體字母組合由英文詞典所記載的單詞組合構(gòu)成,或其他語種詞典所記載的單詞組合構(gòu)成時,每個單詞為含義特征最小單元,否則,商標的整體字母組合為含義特征最小單元。
構(gòu)成要素為漢語數(shù)字的含義特征最小單元,選如下之一:商標中被分隔(被標點符號、分隔符等分開)的每一組漢語數(shù)字對應(yīng)的預(yù)設(shè)基準語種數(shù)字,商標中每一單個漢語數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,其中,所述預(yù)設(shè)基準語種數(shù)字可以為預(yù)設(shè)的任何語種的數(shù)字。以圖2b為示例,預(yù)設(shè)基準語種數(shù)字為阿拉伯數(shù)字時,構(gòu)成要素為漢語數(shù)字的含義特征最小單元為“123”或“1”、“2”、“3”。
構(gòu)成要素為阿拉伯數(shù)字的含義特征最小單元,選如下之一:商標中被分隔的每一組阿拉伯數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字,商標中每一單個阿拉伯數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字。
構(gòu)成要素為其他語種數(shù)字的含義特征最小單元,選如下之一:商標中被分隔的每一組其他語種數(shù)字,商標中每一單個其他語種數(shù)字所對應(yīng)的預(yù)設(shè)基準語種數(shù)字。
構(gòu)成要素為符號的含義特征最小單元:商標中每一符號所對應(yīng)的符號名稱。
(3)讀音特征的最小單元
構(gòu)成要素為漢語文字的讀音特征最小單元,為每一漢語文字的拼音。
構(gòu)成要素為圖形的讀音特征最小單元,為商標圖形要素編碼所對應(yīng)的每一事物的名稱的拼音。
構(gòu)成要素為字母的讀音特征最小單元,選如下之一:每一字母組合的讀音、每一個字母的讀音。
構(gòu)成要素為數(shù)字或符號的讀音特征最小單元,選如下之一:商標中被分隔的每一組數(shù)字的讀音,每一單個數(shù)字的讀音,商標中被分隔的每一組符號的讀音,每一單個符號的讀音。
第三,步驟s130:根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一組合規(guī)則所生成的分詞作為商標分卡信息。
按照商標構(gòu)成要素的形狀、含義、讀音特征的最小單元及其多種組合規(guī)則生成的各種文字、圖形的切分信息,可以通過各種最小單元及其及組合獲得分詞,將這些分詞作為商標在形音義方面的商標分卡基礎(chǔ)數(shù)據(jù),為解決商標檢索的近似度評價提供有效的數(shù)據(jù)支持。
按照商標構(gòu)成要素的各特征最小單元的多種組合規(guī)則而生成的各種文字、圖形的切分信息的商標分卡標準,或簡稱“商標分詞規(guī)則”、或“商標分卡規(guī)則”詳細說明如下:
(1)形狀特征最小單元多種組合規(guī)則包括:
a、構(gòu)成要素為漢語文字的形狀特征最小單元多種組合規(guī)則,包括分卡標準a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一種,其中,
a1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
a2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
a3表示按順序排列的商標中的漢語文字切分為一個分詞,
a4表示按逆序排列的商標中的漢語文字切分為一個分詞,
a5表示按順序排列的商標中含有漢語數(shù)字切分為一個分詞,
a6表示按逆序排列的商標中含有漢語數(shù)字切分為一個分詞,
a7表示商標中每個相對獨立的部分分別切分為一個分詞,
a8表示商標文字中完整包含現(xiàn)有漢語文字商標,將該部分切分為一個分詞,
a9表示商標中含有的繁體、異體字轉(zhuǎn)換為簡體字后切分為一個分詞,
a10表示商標中每個文字替換為形近字后切分為一個分詞,
a11表示商標中每相鄰漢語文字分別切分為一個分詞,
a12表示商標中首尾漢字組合切分為一個分詞,
a13表示商標中每個漢語文字切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
a1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞。即商標含有的全部文字及圖形要素編碼,不管是漢語漢字或其他語種的文字、字母組合、數(shù)字組合、符號或其他要素之間的組合,也不管其是否能構(gòu)成一個有常用含義的詞匯,均將商標整體所有語種文字及圖形要素編碼的組合按順序排列視為一個分詞。以圖2a為示例,按照本商標分詞規(guī)則切分為:“格力gree+26.1.10”分詞,以圖2c為示例,按照本商標分詞規(guī)則切分為:“美秀·詩美m(xù)eixiushimei”分詞。
a2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞。即商標含有的全部文字,不管是漢語漢字或其他語種的文字、字母組合、數(shù)字組合、符號或其他要素之間的組合,也不管其是否能構(gòu)成一個有常用含義的詞匯,均將商標整體所有語種文字及圖形要素編碼的組合逆序排列視為一個分詞。以圖2a為示例,按照本商標分詞規(guī)則切分為:“26.1.10+eerg力格”分詞,以圖2c為示例,按照本商標分詞規(guī)則切分為:“iemihsuixiem美詩·秀美”分詞。注意:文字的最小單元為單個文字,多文字可換序;字母、數(shù)字、符號的最小單元為單個字母、數(shù)字、符號,多個字母、數(shù)字、符號組合可換序;圖形要素編碼“26.1.10”整體為圖形形狀特征最小單元,不可將其數(shù)字再換序,但多個圖形要素編碼之間可換序(下同)。
a3表示按順序排列的商標中的漢語文字切分為一個分詞。即商標含有的漢語漢字將其整體順序排列視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“美秀詩美”分詞。
a4表示按逆序排列的商標中的漢語文字切分為一個分詞。即商標含有的漢語漢字將其整體逆序排列視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“美詩秀美”分詞。
a5表示按順序排列的商標中含有漢語數(shù)字切分為一個分詞。即商標含有的漢語數(shù)字將其漢語數(shù)字整體順序排列視為一個分詞或?qū)⑵錆h語數(shù)字的每一數(shù)字分別視為一個分詞。以圖2b為示例,按照本商標分詞規(guī)則切分為:“壹貳叁”或“壹”、“貳”、“叁”分詞分詞。
a6表示按逆序排列的商標中含有漢語數(shù)字切分為一個分詞。即商標含有的漢語數(shù)字將其漢語數(shù)字整體逆序排列視為一個分詞或?qū)⑵錆h語數(shù)字的每一數(shù)字分別視為一個分詞。以圖2b為示例,按照本商標分詞規(guī)則切分為:“叁貳壹”或“叁”、“貳”、“壹”分詞。
a7表示商標中每個相對獨立的部分分別切分為一個分詞。即商標含有的相對獨立部分將其相對獨立部分分別視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“美秀”、“詩美”、“meixiushimei”分詞。注意:相對獨立部分的區(qū)分規(guī)則包括:不同語種為不同的相對獨立部分,用符號或空格分隔開的同一語種文字組合為相對獨立部分,不同的顏色的同一語種文字組合為相對獨立部分。
a8表示商標文字中完整包含現(xiàn)有漢語文字商標,將該部分切分為一個分詞。即商標含有在先的他人漢語文字商標,將該在先的他人商標的該部分視為一個分詞。以圖2d為示例,假設(shè)在先的他人商標有:“四通”、“歐普”,按照本商標分詞規(guī)則切分為:“四通”、“歐普”分詞。
a9表示商標中含有的繁體、異體字轉(zhuǎn)換為簡體字后切分為一個分詞。即商標含有繁體、異體字,將該繁體、異體字轉(zhuǎn)換為簡體字后視為一個分詞。以圖2e、圖2f為示例,按照本商標分詞規(guī)則分別將商標中的“匯”、“滙”字切分為:“匯”分詞。
a10表示商標中每個文字替換為形近字后切分為一個分詞。即商標中文字具有形近字時,利用其形近字替換原有文字后視為一個分詞。實際應(yīng)用,可通過關(guān)聯(lián)形近字字典,查詢商標中文字是否具有形近字,以圖2h為示例,按照本商標分詞規(guī)則分別切分為:“格刀”、“格刃”、“烙力”、“洛力”、“絡(luò)力”、“恪刀”、“恪力”、“輅力”等分詞。
a11表示商標中每相鄰漢語文字分別切分為一個分詞。即當商標漢字字數(shù)在三個及以上時,將商標中相鄰的每兩個漢字視為一個分詞。以圖2d為示例,按照本商標分詞規(guī)則分別切分為:“四通”、“通歐”、“歐普”分詞。
a12表示商標中首尾漢字組合切分為一個分詞。即當商標漢字字數(shù)在三個及以上時,將商標中首尾漢字視為一個分詞。以圖2d為示例,按照本商標分詞規(guī)則分別切分為:“四普”分詞。
a13表示商標中每個漢語文字切分為一個分詞。即將商標中每一個漢字視為一個分詞。以圖2d為示例,按照本商標分詞規(guī)則分別切分為:“四”、“通”、“歐”、“普”分詞。
b、構(gòu)成要素為字母、數(shù)字、符號的形狀特征最小單元多種組合規(guī)則,包括分卡標準b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一種,其中,
b1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
b2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞,
b3表示按順序排列的商標中的字母組合切分為一個分詞,
b4表示按逆序排列的商標中的字母組合切分為一個分詞,
b5表示按順序排列的商標中含有的非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞,
b6表示按逆序排列的商標中含有的非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞,
b7表示按順序排列的商標中含有的符號組合切分為一個分詞,
b8表示按逆序排列的商標中含有的符號組合切分為一個分詞,
b9表示商標中每個相對獨立部分分別切分為一個分詞,
b10表示商標中每字母被形近字母替換后切分為一個分詞,
b11表示商標中每相鄰字母組合分別切分為一個分詞,
b12表示商標中字母按照不同定序排列后分別切分為一個分詞,
b13表示商標中首尾字母組合切分為一個分詞,
b14表示商標中每個字母或數(shù)字或符號分別切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
b1表示按順序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞。即商標含有的全部文字及圖形要素編碼,不管是漢語漢字或其他語種的文字、字母組合、數(shù)字組合、符號或其他要素之間的組合,也不管其是否能構(gòu)成一個有常用含義的詞匯,均將商標整體所有語種文字及圖形要素編碼的組合按順序排列視為一個分詞。以圖2a為示例,按照本商標分詞規(guī)則切分為:“格力gree+26.1.10”分詞,以圖2c為示例,按照本商標分詞規(guī)則切分為:“美秀·詩美m(xù)eixiushimei”分詞。
b2表示按逆序排列的商標整體所有語種文字及圖形要素編碼的組合切分為一個分詞。即商標含有的全部文字,不管是漢語漢字或其他語種的文字、字母組合、數(shù)字組合、符號或其他要素之間的組合,也不管其是否能構(gòu)成一個有常用含義的詞匯,均將商標整體所有語種文字及圖形要素編碼的組合逆序排列視為一個分詞。以圖2a為示例,按照本商標分詞規(guī)則切分為:“26.1.10+eerg力格”分詞,以圖2c為示例,按照本商標分詞規(guī)則切分為:“iemihsuixiem美詩·秀美”分詞。
b3表示按順序排列的商標中的字母組合切分為一個分詞。即商標含有的字母組合文字將其整體字母順序排列視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“meixiushimei”分詞。
b4表示按逆序排列的商標中的字母組合切分為一個分詞。即商標含有的字母組合文字將其整體字母逆序排列視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“iemihsuixiem”分詞。
b5表示按順序排列的商標中含有非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞。即商標含有的非漢語數(shù)字,將該語種的數(shù)字整體順序排列視為一個分詞或?qū)⒃撜Z種數(shù)字的每一數(shù)字分別視為一個分詞。以圖2i為示例,按照本商標分詞規(guī)則切分為:“onetwothree”或“one”、“two”、“three”分詞。
b6表示按逆序排列的商標中含有非漢語數(shù)字或每一單個的非漢語數(shù)字分別切分為一個分詞。即商標含有的非漢語數(shù)字將該語種數(shù)字整體逆序排列視為一個分詞或?qū)⒃撜Z種數(shù)字的每一數(shù)字分別視為一個分詞。以圖2i為示例,按照本商標分詞規(guī)則切分為:“threetwoone”或“three”、“two”、“one”分詞。
b7表示按順序排列的商標中含有符號組合切分為一個分詞。即商標含有的符號組合文字將其符號組合文字整體順序排列分別視為一個分詞。以圖2p為示例,按照本商標分詞規(guī)則切分為:“@”分詞。
b8表示按逆序排列的商標中含有符號組合切分為一個分詞。即商標含有的符號組合文字將其符號組合文字整體逆序排列分別視為一個分詞。以圖2p為示例,按照本商標分詞規(guī)則切分為:“@”分詞。
b9表示商標中每個相對獨立部分分別切分為一個分詞。即商標含有的相對獨立部分將其相對獨立部分分別視為一個分詞。以圖2c為示例,按照本商標分詞規(guī)則切分為:“美秀”、“詩美”、“meixiushimei”分詞。注意:相對獨立部分的區(qū)分規(guī)則包括:不同語種為不同的相對獨立部分,用符號或空格分隔開的同一語種文字組合為相對獨立部分,不同的顏色的同一語種文字組合為相對獨立部分。
b10表示商標中每字母被形近字母替換后切分為一個分詞。即商標中字母具有形近字母,將該字母用其各形近字母替換后分別視為一個分詞。實際應(yīng)用中,通過關(guān)聯(lián)行進字母字典,查詢商標中每個字母是否具有行進字母,以圖2l為示例,按照本商標分詞規(guī)則分別切分為:“dc”、“dg”、“do”、“oc”、“oo”、“og”分詞。
b11表示商標中每相鄰字母組合分別切分為一個分詞。即當商標字母字數(shù)在四個及以上時,將商標整段字母、數(shù)字、符號的每n個相鄰的字母或數(shù)字或符號按原序和定序再加首字母算視為一個分詞。其中n的取值范圍在大于2小于總字母數(shù)的50%的范圍,當最后1個余數(shù)少于預(yù)設(shè)的n值字母數(shù)的1半時,與前一分詞合并為一分詞,等于或大于1半時,獨立為1個分詞。以圖2k為示例,n的取值為2時,按照本商標分詞規(guī)則分別切分為:“ca”、“cat”、“cta”、“can”、“cna”分詞。
b12表示商標字母按照不同定序排列后分別切分為一個分詞。所述定序排列包括:商標整體字母組合按原序整體排列,去除重復(fù)字母后按26個字母的固定順序排列、除重復(fù)字母后按26個字母的固定順序排列并在前添加首字母。以圖2k為示例,按原序整體排列后切分為:“catana”分詞;去除重復(fù)字母后按26個字母的固定順序排列后切分為:“acnt”分詞;去除重復(fù)字母后按26個字母的固定順序排列再在前添加首字母后切分為:“cacnt”分詞。
b13表示商標中首尾字母組合切分為一個分詞。即當商標含有字母、數(shù)字、符號及組合詞匯時,將商標中首尾字母組合視為一個分詞。以圖2k為示例,按照本商標分詞規(guī)則分別切分為:“ca”分詞。
b14表示商標中每個英文字母或數(shù)字或符號切分為一個分詞。即當商標含有字母、數(shù)字、符號及組合詞匯時,將商標中每一個字母或數(shù)字或符號視為一個分詞。以圖2k為示例,按照本商標分詞規(guī)則分別切分為:“c”、“a”、“t”、“n”分詞。
c、構(gòu)成要素為圖形的形狀特征最小單元多種組合規(guī)則,包括分卡標準c1、c2、c3、c4中的至少一種,其中,
c1表示商標圖形要素編碼集合整體切分為一個分詞,
c2表示每一商標圖形要素編碼切分為一個分詞,
c3表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集整體分別切分為一個分詞,
c4表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集預(yù)設(shè)定長分別切分為一個分詞,所述商標圖像特征字符串集預(yù)設(shè)定長是指預(yù)先設(shè)置的商標圖像輪廓線上連續(xù)相連的像素點的長度,連續(xù)相連的像素點以特征字符串集、或數(shù)字集表示,取值范圍為商標圖像特征字符串集、或數(shù)字集總長度的0.1%-50%。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
c1表示商標圖形要素編碼集合整體切分為一個分詞。即:目前在商標行業(yè)內(nèi)一般采用維也納分類標準的商標圖形要素編碼表示商標圖形的特征。將商標所有圖形要素編碼整體視為一個分詞。以圖2m為示例,經(jīng)檢索查詢獲得的商標圖形要素編碼是:26.1.12a、26.2.5、29.1.12,按照本商標分詞規(guī)則切分為:“26.1.12a,26.2.5,29.1.12”分詞。
c2表示每一商標圖形要素編碼切分為一個分詞。即:將商標每一個圖形要素編碼視為一個分詞。以圖2m為示例,經(jīng)檢索查詢獲得的商標圖形要素編碼是:26.1.12a、26.2.5、29.1.12,按照本商標分詞規(guī)則分別切分為:“26.1.12a”、“26.2.5”、“29.1.12”分詞。
c3表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集整體分別切分為一個分詞。即將商標采用每一種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集的整體視為一個分詞。以圖2n為示例,采用圖像特征識別方法一(基于10×10的坐標系標準提取圖像輪廓線上像素點數(shù)字集的方法)所提取的商標圖像特征字符串集如圖3所示,其中,定序(字符自小至大)商標圖像特征字符串集的值如下:
6,7,15,16,17,25,26,27,
22,23,24,25,26,27,28,29,31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89,92,93,94,95,96,97,98,99。
順序(沿輪廓線順時針方向逐個相鄰點的順序)商標圖像特征字符串集的值如下:
6,7,17,27,26,25,15,16,
22,23,24,25,26,27,28,29,39,49,48,58,68,69,79,80,79,89,99,98,97,96,95,94,93,92,82,81,71,61,51,41,31,32。
按照本分詞規(guī)則分別切分為如下2個分詞:
“6,7,15,16,17,25,26,27;22,23,24,25,26,27,28,29,31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89,92,93,94,95,96,97,98,99”;
“6,7,17,27,26,25,15,16;22,23,24,25,26,27,28,29,39,49,48,58,68,69,79,80,79,89,99,98,97,96,95,94,93,92,82,81,71,61,51,41,31,32”。
再以圖2n為示例,采用圖像特征識別方法二(基于20×20的坐標系標準提取圖像輪廓線上像素點數(shù)字集的方法)所提取的圖像特征字符串集如圖4所示,其中,定序(自小至大)商標圖像特征字符串集的值如下:
12,13,14,31,32,34,50,51,53,54,70,73,90,91,92,93,110,111;
85,86,87,88,93,94,95,96,103,104,105,108,109,110,111,112,113,116,117,122,123,137,138,141,142,156,157,161,176,181,196,201,216,221,236,241,256,257,261,277,278,281,282,298,302,318,322,323,337,338,343,357,363,364,369,370,375,376,384,385,386,387,388,390,391,392,393,394,395。
順序(沿輪廓線順時針方向逐個相鄰點的順序)商標圖像特征字符串集的值如下:
12,13,14,34,54,53,73,93,92,91,111,110,90,70,50,51,31,32;
85,86,87,88,108,109,110,111,112,113,93,94,95,116,117,137,138,157,156,176,196,216,236,256,257,277,278,298,318,338,337,357,376,375,395,394,393,392,391,390,370,369,388,387,386,385,384,364,363,344,343,323,322,302,282,281,261,241,221,201,181,161,141,142,122,123,103,104,105。
按照本分詞規(guī)則分別切分為如下2個分詞:
“12,13,14,31,32,34,50,51,53,54,70,73,90,91,92,93,110,111;85,86,87,88,93,94,95,96,103,104,105,108,109,110,111,112,113,116,117,122,123,137,138,141,142,156,157,161,176,181,196,201,216,221,236,241,256,257,261,277,278,281,282,298,302,318,322,323,337,338,343,357,363,364,369,370,375,376,384,385,386,387,388,390,391,392,393,394,395”;
“12,13,14,34,54,53,73,93,92,91,111,110,90,70,50,51,31,32;85,86,87,88,108,109,110,111,112,113,93,94,95,116,117,137,138,157,156,176,196,216,236,256,257,277,278,298,318,338,337,357,376,375,395,394,393,392,391,390,370,369,388,387,386,385,384,364,363,344,343,323,322,302,282,281,261,241,221,201,181,161,141,142,122,123,103,104,105”。
c4表示每種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集預(yù)設(shè)定長分別切分為一個分詞。即將商標采用每一種圖像特征識別方法所產(chǎn)生的商標圖像特征字符串集(或商標圖像特征信息)的每一預(yù)設(shè)定長視為一個分詞。
所述商標圖像特征字符串集(或商標圖像特征信息)預(yù)設(shè)定長是按預(yù)設(shè)規(guī)則設(shè)置的一定長度范圍的連續(xù)的局部商標圖像特征字符串集,表現(xiàn)為連續(xù)的局部數(shù)字或字符集,取值范圍在圖像特征字符串集數(shù)字集或字符集總長度的0.1%至50%。本實施例中,所述圖像特征字符串集按如下具體規(guī)則切分為n個圖像特征字符串集預(yù)設(shè)定長:
1)按獲取圖像特征字符串集的不同坐標系標準分別預(yù)設(shè)的切分長度,預(yù)設(shè)的切分長度的取值范圍在10至100字符之間;
2)當圖像特征字符串集的總數(shù)小于等于預(yù)設(shè)的切分長度時,不切分,整體視為一個圖像特征字符串集預(yù)設(shè)定長;
3)圖像特征字符串集總數(shù)大于預(yù)設(shè)的切分長度時,以預(yù)設(shè)的切分長度為標準將圖像特征字符串集切分為若干個分組,每一分組視為一個圖像特征字符串集預(yù)設(shè)定長;
4)具體連通域特征的圖像特征字符串集的部分視為一個圖像特征字符串集預(yù)設(shè)定長,比如圖2n中的字符串集“6,7,15,16,17,25,26,27”和“22,23,24,25,26,27,28,29,31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89,92,93,94,95,96,97,98,99”分別為一個具體連通區(qū)域特征的圖像特征字符串集,并及其分別視為一個圖像特征字符串集預(yù)設(shè)定長。
5)以上切分的最后一組不足預(yù)設(shè)切分長度的50%的,與上組合并為一個圖像特征字符串集預(yù)設(shè)定長,等于或超過50%的,將剩余的字符分為一組,視為一個圖像特征字符串集預(yù)設(shè)定長。
再以圖2n為示例,假如預(yù)設(shè)定長的值取5組數(shù)字,采用圖像特征識別方法一(基于10×10的坐標系標準提取圖像輪廓線上像素點數(shù)字集的方法)提取定序(自小至大)圖像輪廓線上像素點數(shù)字集的方法所提取的商標圖像特征字符串集如圖3所示,按照本分詞規(guī)則分別切分為如下11個分詞:
“6,7,15,16,17,25,26,27”、“22,23,24,25,26,27,28,29,31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89,92,93,94,95,96,97,98,99”、
“6,7,15,16,17”、“25,26,27”、“22,23,24,25,26”、“27,28,29,31,32”、“39,41,48,49,51”、“58,61,68,69,71”、“79,80,81,82,89”、“92,93,94,95,96”、“97,98,99”;
再以圖2n為示例,假如預(yù)設(shè)的切分長度為5組數(shù)字,采用圖像特征識別方法一(基于10×10的坐標系標準提取圖像輪廓線上像素點數(shù)字集的方法)提取順序(沿輪廓線順時針方向逐個相鄰點的順序)圖像輪廓線上像素點數(shù)字集的方法所提取的商標圖像特征字符串集如圖4所示,按照本分詞規(guī)則分別切分為如下11個分詞:
“6,7,17,27,26,25,15,16”、“22,23,24,25,26,27,28,29,39,49,48,58,68,69,79,80,79,89,99,98,97,96,95,94,93,92,82,81,71,61,51,41,31,32”、
“6,7,17,27,26”、“25,15,16”、“22,23,24,25,26”、“27,28,29,39,49”、“48,58,68,69,79”、“80,79,89,99,98”、“97,96,95,94,93”、“92,82,81,71,61”、“51,41,31,32”。
(2)讀音特征最小單元多種組合規(guī)則包括:
d、構(gòu)成要素為漢語文字的讀音特征最小單元多種組合規(guī)則,包括分卡標準d1、d2、d3中的至少一種,其中,
d1表示商標中每個漢語文字的拼音音節(jié)切分為一個分詞,
d2表示商標中整體漢語文字對應(yīng)的拼音切分為一個分詞,
d3表示商標中每個中文文字被替換為形近字后的拼音音節(jié)切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
d1表示商標中每個漢語文字的拼音音節(jié)切分為一個分詞。即將商標每個漢字的拼音音節(jié)視為一個分詞。以圖2h為示例,“格”和“力”的拼音音節(jié)分別為“ge”和“l(fā)i”,按照本商標分詞規(guī)則分別切分為:“ge”、“l(fā)i”分詞。
d2表示商標中整體漢語文字對應(yīng)的拼音切分為一個分詞。即將商標整體漢字的拼音音節(jié)視為一個分詞。以圖2h為示例,“格”和“力”的拼音音節(jié)分別為“ge”和“l(fā)i”,按照本商標分詞規(guī)則分別切分為:“geli”分詞。
d3表示商標中每個中文文字被替換為形近字后的拼音音節(jié)切分為一個分詞。以圖2h為示例,“格”文字被替換為“挌”形近字,“力”文字被替換為“刀”形近字,“挌刀”的拼音音節(jié)分別為“ge”和“dao”,按照本商標分詞規(guī)則分別切分為:“gedao”分詞。
e、構(gòu)成要素為字母、數(shù)字、符號的讀音特征最小單元多種組合規(guī)則包括分卡標準e1、e2、e3、e4中的至少一種,其中,
e1表示商標中每個英文單詞的讀音音節(jié)切分為一個分詞,
e2表示商標中字母組合被其音近字母組合替換后得到的整體字母組合分別切分為一個分詞,
e3表示商標中每個數(shù)字的讀音音節(jié)切分為一個分詞,
e4表示商標中每個符號的讀音音節(jié)切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
e1表示商標中每個英文單詞的讀音音節(jié)切分為一個分詞。即將商標每個英文單詞的讀音音節(jié)視為一個分詞。以圖2i為示例,“one”、“two”、“three”單詞的讀音音節(jié)分別為“[w?n]”、“[tu]”、“[θri]”,按照本商標分詞規(guī)則分別切分為:“[w?n]”、“[tu:]”、“[θri:]”分詞。
e2表示商標中的字母組合被其音近字母組合替換后得到的整體字母組合分別切分為一個分詞。即商標中含有音近字母組合時,用其音近字母組合替換后得到的整體字母組合視為一個分詞。實際應(yīng)用,通過關(guān)聯(lián)相關(guān)字典或數(shù)據(jù)庫,查詢商標中字母是否具有音近字母組合,以圖2k為示例,其中“ca”與“ka”讀音相同或相近,按照本商標分詞規(guī)則切分為:“catana”、“katana”分詞。
e3表示商標中每個數(shù)字的讀音音節(jié)切分為一個分詞。即將商標每個數(shù)字的讀音音節(jié)視為一個分詞。以圖2i為示例,“one”、“two”、“three”為英文數(shù)字單詞的讀音音節(jié)分別為“[w?n]”、“[tu]”、“[θri]”,按照本商標分詞規(guī)則分別切分為:“[w?n]”、“[tu:]”、“[θri:]”分詞。
e4表示商標中每個符號的讀音音節(jié)切分為一個分詞。即商標含有符號,將該符號的讀音視為一個分詞。以圖2d為示例,其中“@”為符號,其讀音為“at”或“[?t]”,按照本商標分詞規(guī)則切分為:“at”或“[?t]”分詞。
f、構(gòu)成要素為圖形的讀音特征最小單元多種組合規(guī)則包括分卡標準f1,其中,f1表示商標的圖形要素編碼所對應(yīng)的每一事物的名稱的拼音切分為一個分詞。以圖2n為示例,經(jīng)檢索查詢獲得的商標圖形要素編碼是:5.7.13,該圖形要素編碼所對應(yīng)的每一事物的名稱是“蘋果”或“柿子”,其拼音分別為:“pingguo”或“shizi”,按照本商標分詞規(guī)則切分為:“pingguo”或“shizi”分詞。
(3)含義特征最小單元多種組合規(guī)則包括:
g、構(gòu)成要素為漢語文字的含義特征最小單元多種組合規(guī)則包括分卡標準g1、g2、g3、g4中的至少一種,其中,
g1表示商標中完整包含商標服務(wù)器中現(xiàn)有漢語文字商標、且商標整體無含義,將含有現(xiàn)有漢語文字商標的部分切分為一個分詞,
g2表示商標中與漢語詞典所收錄的詞匯或商標服務(wù)器中現(xiàn)有漢語文字商標的漢字組合全部匹配的,將匹配部分分別切分為一個分詞,
g3表示商標中含有的漢語詞匯替換為近義詞后分別切分為一個分詞,
g4表示商標整體無含義的,整體漢語文字切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
g1表示商標中完整包含商標服務(wù)器現(xiàn)有漢語文字商標、且整體無含義(整體文字不能與漢語詞典所收錄的詞匯相匹配),將含有現(xiàn)有漢語文字商標的部分切分為一個分詞。即該在先的他人漢字商標已形成其特有的含義,可視其為一個特有的名詞,將該名詞視為一個分詞。以圖2d為示例,“四通歐普”整體無含義,假設(shè)在先的他人漢字商標有:“歐普”,按照本商標分詞規(guī)則切分為:“歐普”分詞。
g2表示商標中與漢語詞典所收錄的詞匯部分或商標服務(wù)器中現(xiàn)有漢字文字商標的漢字組合全部匹配的,將匹配部分分別切分為一個分詞。以圖2g為示例,按照本商標分詞規(guī)則分別切分為:“電腦”分詞。
g3表示商標中含有的漢語詞匯替換為近義詞后分別切分為一個分詞。即商標含有漢語詞匯,將該漢語詞匯的近義詞視為一個分詞。以圖2g為示例,“電腦”與“計算機”等為近義詞,按照本商標分詞規(guī)則分別切分為:“計算機”分詞。
g4表示商標整體無含義的,整體漢語文字切分為一個分詞。即商標整體漢語文字無含義(即無法與漢語詞典或商標服務(wù)器中的現(xiàn)有漢語文字商標相匹配),將商標整體漢語文字視為一個分詞。以圖2d為示例,“四通歐普”整體漢語無含義,按照本商標分詞規(guī)則分別切分為:“四通歐普”分詞。
h、構(gòu)成要素為字母、數(shù)字、符號組合的含義特征最小單元多種組合規(guī)則包括分卡標準h1、h2、h3、h4、h5、h6、h7、h8、h9中的至少一種,其中,
h1表示商標的整體字母組合由英文詞典或其他語種詞典所記載的單詞組合構(gòu)成,整體單詞組合切分為一個分詞,
h2表示商標中含有英語詞典或其他語種詞典所收錄的單詞,每個單詞切分為一個分詞,
h3表示商標中含有英語詞典或其他語種詞典所收錄的單詞,將每個單詞的近義詞切分為一個分詞,
h4表示商標的整體字母組合與英文詞典或其他語種詞典所記載的單詞不匹配的,整體字母組合切分為一個分詞,
h5表示商標中被分隔的每一組數(shù)字切分為一個分詞,
h6表示商標的整體數(shù)字組合切分為一個分詞,
h7表示商標的整體符號組合切分為一個分詞,
h8表示商標的每一符號切分為一個分詞,
h9表示商標完整包含商標服務(wù)器現(xiàn)有字母組合商標、且商標整體無含義,(整體字母組合不能與英語詞典所收錄的單詞相匹配)將含有現(xiàn)有字母組合商標的部分切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
h1表示商標的整體字母組合由英文詞典或其他語種詞典所記載的單詞組合構(gòu)成,整體單詞組合切分為一個分詞。以圖2a為示例,商標中的整體字母組合為英文單詞“gree”,按照本商標分詞規(guī)則切分為“gree”分詞。
h2表示商標中含有英語詞典或其他語種詞典所收錄的單詞,每個單詞切分為一個分詞。以圖2i為示例,商標中含有英文單詞“one”、“two”、“three”,按照本商標分詞規(guī)則切分為“one”、“two”、“three”分詞。
h3:表示商標中含有英語詞典或其他語種詞典所收錄的單詞,將每個單詞的近義詞切分為一個分詞。即商標含有英語近義詞,將該英語近義詞視為一個分詞。以圖2j為示例,“ability”與“capacity”、“capability”、“genius”、“talent”、“competence”、“faculty”、“gift”、“aptitude”等均具有表示人的“能力,才能”之意,按照本商標分詞規(guī)則切分為:“ability”、“capacity”、“capability”、“genius”、“talent”、“competence”、“faculty”、“gift”、“aptitude”等分詞。
h4表示商標的整體字母組合與英文詞典或其他語種詞典所記載的單詞不匹配的,整體字母組合切分為一個分詞。以圖2k為示例,按照本商標分詞規(guī)則切分為“catana”。
i、構(gòu)成要素為圖形的含義特征最小單元多種組合規(guī)則包括分卡標準i1、i2中的至少一種,其中,
i1表示商標圖形要素編碼所對應(yīng)的每一事物的名稱切分為一個分詞,
i2表示商標圖像特征字符串集對應(yīng)有商標圖形要素編碼,商標圖形要素編碼所對應(yīng)每個事物名稱切分為一個分詞。
如下結(jié)合圖2中各種商標圖樣說明本商標分詞規(guī)則的處理方法:
i1表示商標圖形要素編碼所對應(yīng)每個事物名稱分別切分為一個分詞。本實施例中,首先,通過建立事物名稱詞典文件,記錄商標圖形要素編碼與該商標圖形要素編碼所描述事物名稱的對應(yīng)關(guān)系,以輸入商標的圖形要素編碼為檢索條件找出在事物名稱詞典文件中匹配的事物名稱,該事物名稱視為商標商標圖形要素編碼所對應(yīng)的事物名稱,將每個事物名稱視為一個分詞。以圖2n為示例,經(jīng)檢索查詢獲得的商標圖形要素編碼是:5.7.13,該商標圖形要素編碼所對應(yīng)的事物是“蘋果”或“柿子”,按照本分詞規(guī)則分別切分為:“蘋果”、“柿子”分詞。
i2表示商標圖像特征字符串集所對應(yīng)有商標圖形要素編碼,商標圖形要素編碼所對應(yīng)每個事物名稱切分為一個分詞。本實施例通過如下方法獲?。?/p>
第一,以輸入商標的商標圖像特征字符串集作為檢索關(guān)鍵詞獲取檢索匹配率最高的一個結(jié)果商標之后,將該結(jié)果商標運用現(xiàn)有技術(shù)已標記的商標圖形要素編碼視為輸入商標的圖形要素編碼;第二,通過建立事物詞典文件,記錄商標圖形要素編碼與該商標圖形要素編碼所描述事物名稱的對應(yīng)關(guān)系;第三,以輸入商標的圖形要素編碼為檢索條件找出其在事物詞典文件中匹配的事物名稱,該事物名稱視為商標圖像特征字符串集所對應(yīng)的事物名稱,該事物名稱視為一個分詞。以圖2n為示例,經(jīng)商標圖像特征字符串集(或商標圖像特征信息)檢索查詢獲得的商標圖形要素編碼是:“5.7.13”,對應(yīng)的“事物名稱”是“蘋果”和“柿子”,該商標圖像特征字符串集按照本分詞規(guī)則分別切分為:“蘋果”、“柿子”分詞。
y、構(gòu)成要素為例外調(diào)整文字的最小單元多種組合規(guī)則包括分卡標準y1、y2中的至少一種,其中,
y1表示商標中含有例外調(diào)整文字,將例外調(diào)整文字整體切分為一個分詞;
y2表示商標中含有例外調(diào)整文字,將例外調(diào)整文字每個文字分別切分為一個分詞。
所述例外調(diào)整文字包括如下預(yù)設(shè)的一種以上:縣級以上行政區(qū)域地名,公眾知曉的外國地名,通用商品名稱,表示商品的質(zhì)量、主要原料、功能、用途、重量、數(shù)量及其他特點的詞語,商品服務(wù)通用名稱,顯著性弱的文字。
以圖2o為示例,商標文字“格力電器”中“電器”是通用商品名稱,按照y1分卡標準切分為:“電器”分詞,按照y2分卡標準切分為:“電”、“器”分詞。
根據(jù)前述預(yù)設(shè)的最小單元多種組合規(guī)則,可以獲取每一規(guī)則所生成的各種文字、圖形、字母、數(shù)字等構(gòu)成要素形、音、義的切分信息,作為一個商標分卡信息。比如,分卡標準a1所得分詞為商標中所有形狀最小單元按順序組合而成。實際應(yīng)用中,上述形近字、近義詞、音近字、音近字母組合、文字讀音、字母讀音、數(shù)字符合讀音、圖形要素編碼所對應(yīng)的事物名稱等,均是通過關(guān)聯(lián)現(xiàn)有的或預(yù)設(shè)的相關(guān)字詞典或數(shù)據(jù)庫獲得。
本發(fā)明所述的商標分卡處理方法,可以有效克服傳統(tǒng)的商標分卡的缺陷和弊端,即:無法全面反映商標的形狀特征、含義特征和讀音特征,難以支持樣本商標與輸入商標在形、義、音多特征方面進行商標近似度的綜合評價,易在商標檢索中產(chǎn)生近似商標的漏檢。采用本發(fā)明所述的商標分卡處理方法,能獲取全面反映商標的形狀特征、讀音特征和含義特征的商標分卡信息,有利實現(xiàn)對檢索出的樣本商標與輸入商標在多特征方面進行商標近似度的綜合評價,大幅提高商標近似度的數(shù)量化評價水平,加速商標審查工作的進步。
在本發(fā)明的實施例中,還涉及一種商標分卡處理的裝置,圖5是本發(fā)明實施例中提供的商標分卡處理裝置的結(jié)構(gòu)示意圖,包括:
構(gòu)成要素的內(nèi)容獲取模塊,用于對待分卡商標是否由漢語文字、漢語數(shù)字、圖形、字母、數(shù)字或符號構(gòu)成要素進行識別,獲取構(gòu)成要素的內(nèi)容;
形狀特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的形狀特征最小單元;
讀音特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的讀音特征最小單元;
含義特征最小單元提取模塊,用于提取待分卡商標各構(gòu)成要素的含義特征最小單元;
商標分卡信息獲取模塊,用于根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一規(guī)則所生成的各種文字、圖形的分詞作為一個商標分卡的信息。
在本發(fā)明的實施例中,還涉及一種商標分卡處理的系統(tǒng),包括商標存儲器和服務(wù)器,所述商標存儲器和服務(wù)器經(jīng)配置執(zhí)行以下操作:對待分卡商標是否由漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素進行識別,獲取構(gòu)成要素的內(nèi)容;提取并儲存待分卡商標各構(gòu)成要素的形狀特征最小單元、讀音特征最小單元和含義特征最小單元;根據(jù)預(yù)設(shè)的最小單元多種組合規(guī)則,獲取每一規(guī)則所生成的分詞作為一個商標分卡的信息。
在本發(fā)明的實施例中,還涉及一種商標存儲器,包括:
基礎(chǔ)字詞典存儲單元,用于存儲漢語文字、漢語詞語、英語單詞、圖形要素編碼及其對應(yīng)的事物名稱、形近字、近義詞;
商標構(gòu)成要素內(nèi)容存儲單元,用于存儲獲取待分卡商標的漢語文字、圖形、字母、數(shù)字或符號構(gòu)成要素;
形狀特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的形狀特征最小單元和根據(jù)預(yù)設(shè)的形狀特征最小單元多種組合規(guī)則獲取的商標分卡信息;
讀音特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的讀音特征最小單元和根據(jù)預(yù)設(shè)的讀音最小單元多種組合規(guī)則獲取的商標分卡信息;
含義特征分詞集合存儲單元,用于存儲所提取待分卡商標各構(gòu)成要素的含義特征最小單元和根據(jù)預(yù)設(shè)的含義最小單元多種組合規(guī)則獲取的商標分卡信息;
商標分卡處理的程序存儲單元,用于存儲商標分卡處理的相關(guān)程序。
以上,結(jié)合具體的實施例對本發(fā)明的技術(shù)方案進行了詳細介紹,所描述的具體實施例用于幫助理解本發(fā)明的思想,但并不能因此而理解為對本發(fā)明保護范圍的限制。應(yīng)當指出,本領(lǐng)域技術(shù)人員在本發(fā)明實施例的基礎(chǔ)上做出的變形、推導(dǎo)、變換,也都應(yīng)屬于本發(fā)明保護范圍之內(nèi)。