自動(dòng)獲取商品圖像中商標(biāo)和檢索商標(biāo)的方法及其裝置的制造方法
【專利摘要】本發(fā)明涉及檢索技術(shù),公開(kāi)了一種自動(dòng)獲取商品圖像中商標(biāo)和檢索商標(biāo)的方法及裝置。自動(dòng)獲取商標(biāo)的方法包括步驟:對(duì)商品圖像進(jìn)行局部特征提取得到多個(gè)特征點(diǎn);對(duì)每個(gè)商品圖像執(zhí)行步驟:在其余每幅商品圖像特征點(diǎn)中各選取候選特征點(diǎn),根據(jù)與當(dāng)前特征點(diǎn)的距離排序以及各候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否與商品圖像屬于同一商標(biāo)樣本類目,計(jì)算當(dāng)前特征點(diǎn)的權(quán)重;權(quán)重大于預(yù)定閾值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為商標(biāo)樣本區(qū)域。本發(fā)明能自動(dòng)獲取大量商品圖像中的商標(biāo)樣本區(qū)域得到商標(biāo)樣本圖像,不需人工標(biāo)注。檢索商標(biāo)則根據(jù)特征空間中與待檢索商品圖像的特征點(diǎn)距離最接近的特征點(diǎn)的權(quán)重,對(duì)待檢索商品圖像所屬的商標(biāo)樣本類目進(jìn)行投票,提升了檢索的精確度。
【專利說(shuō)明】
自動(dòng)獲取商品圖像中商標(biāo)和檢索商標(biāo)的方法及其裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及檢索領(lǐng)域,特別設(shè)及自動(dòng)獲取商品圖像中商標(biāo)和檢索商標(biāo)的方法及其 裝置。
【背景技術(shù)】
[0002] 商標(biāo)檢索和識(shí)別系統(tǒng)有非常廣泛的應(yīng)用,包括商標(biāo)的知識(shí)產(chǎn)權(quán)保護(hù)、品牌商標(biāo)曝 光度的分析W及基于商標(biāo)圖像的商品捜索等等。
[0003] 現(xiàn)有技術(shù)中商標(biāo)識(shí)別的一般流程:商標(biāo)樣本圖像的收集,特征索引的建立W及輸 入圖像的檢索。下面詳細(xì)描述一下該系統(tǒng),其大體包括W下幾個(gè)步驟:
[0004] 1)商標(biāo)樣本圖像的收集:主要是通過(guò)人工方式從商品圖像中提取出商標(biāo)所在區(qū) 域,從而獲得的。假設(shè)訓(xùn)練集合包括商標(biāo)樣本圖像的數(shù)量為S,所屬商標(biāo)類別的數(shù)量為T ;對(duì) 于訓(xùn)練集中的一系列商標(biāo)樣本圖像Ixi,i = 1,2,…,S},其對(duì)應(yīng)的商標(biāo)類別分別為bi,i = 1,2,…,S}。商標(biāo)樣本圖像的特點(diǎn)是,商標(biāo)區(qū)域占據(jù)主體,不包含或者較少包含圖片中商品 的其它區(qū)域。 陽(yáng)0化]2)樣本圖像的局部特征提?。阂话悴捎肧IFT特征提取算法。運(yùn)里定義第i幅圖 像提取的第j個(gè)特征點(diǎn)表示為?巧,i =1,去、'·,巧i = 1,之…,巧},運(yùn)里使用Ni表示第i幅圖像 提取的特征點(diǎn)的數(shù)量。
[0006] 扣索引構(gòu)建:在S張樣本圖像提取得到的特征組成的特征空間中,采用樹(shù)狀數(shù)據(jù) 結(jié)構(gòu)(比如kd-tree等)方式建立索引,W方便后續(xù)更快速的檢索索引中與輸入特征最相 似(歐氏距離最近)的特征點(diǎn)。
[0007] 4)檢索:對(duì)輸入圖像(商品圖像)提取SIFT特征;針對(duì)提取得到的每一個(gè)SIFT 特征點(diǎn),尋找特征空間中與其距離最接近的K個(gè)特征點(diǎn),并將運(yùn)K個(gè)特征點(diǎn)對(duì)應(yīng)的商標(biāo)樣本 類目投票加一。
[0008] 5)結(jié)果輸出:按照上述步驟對(duì)輸入的待檢索圖像的所有特征點(diǎn)都進(jìn)行完一次投 票后,統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的最終得分結(jié)果,并輸出得分最高的商標(biāo)樣本類目,作為輸入 圖像的匹配結(jié)果。
[0009] 上述技術(shù)方案的缺點(diǎn)在于:
[0010] 1.商標(biāo)樣本圖像的數(shù)量,直接決定了最終系統(tǒng)的性能。而運(yùn)部分圖像的收集需要 消耗大量的人工標(biāo)注;并且隨著訓(xùn)練集中包含的品牌(W及新的商標(biāo)樣本圖像)的不斷增 加,維護(hù)成本也相應(yīng)提高。
[0011] 2.傳統(tǒng)方案中,特征空間的每一個(gè)特征點(diǎn)對(duì)該類目的投票的貢獻(xiàn)是相同的,運(yùn)一 點(diǎn)在實(shí)際應(yīng)用當(dāng)中是不成立的。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的目的在于提供一種自動(dòng)獲取商品圖像中商標(biāo)和檢索商標(biāo)的方法及其裝 置,能夠自動(dòng)獲取商品圖像中的商標(biāo)樣本區(qū)域,不需要消耗大量的人工標(biāo)注;根據(jù)商標(biāo)樣本 區(qū)域內(nèi)的不同特征點(diǎn)的權(quán)重,能夠提升檢索的精確度。
[0013] 為解決上述技術(shù)問(wèn)題,本發(fā)明的實(shí)施方式公開(kāi)了一種自動(dòng)獲取商品圖像中商標(biāo)的 方法,包括W下步驟:
[0014] 對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的多個(gè)特征點(diǎn);
[0015] 對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下步驟:
[0016] 獲取商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品圖像的特 征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)各個(gè)候選特征點(diǎn)與當(dāng)前 特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與商品圖像屬于同一商 標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別商品圖像中商標(biāo)的權(quán)重;
[0017] 當(dāng)商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取商品圖像中權(quán)重大于預(yù)定闊 值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為商品圖像中的商標(biāo)樣本圖像。
[0018] 本發(fā)明的實(shí)施方式還公開(kāi)了一種檢索商品圖像中商標(biāo)的方法,訓(xùn)練集中所有商品 圖像的權(quán)重大于預(yù)定闊值的商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,該方法包括W下步 驟:
[0019] 對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征點(diǎn);
[0020] 依次將提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在特征空間中尋找與當(dāng)前特 征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將K個(gè)特征點(diǎn)的權(quán)重分別加到K個(gè)特征點(diǎn)各自對(duì)應(yīng)的 商品圖像所屬的商標(biāo)樣本類目的投票得分中;
[0021] 統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本類目的商標(biāo)作為待檢 索商品圖像的檢索結(jié)果。
[0022] 本發(fā)明的實(shí)施方式還公開(kāi)了一種自動(dòng)獲取商品圖像中商標(biāo)的裝置,包括W下模 塊:
[0023] 特征提取模塊,用于對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的 多個(gè)特征點(diǎn);
[0024] 特征點(diǎn)權(quán)重計(jì)算模塊,用于對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下操作:
[0025] 獲取商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品圖像的特 征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)各個(gè)候選特征點(diǎn)與當(dāng)前 特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與商品圖像屬于同一商 標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別商品圖像中商標(biāo)的權(quán)重;
[00%] 商標(biāo)區(qū)域選取模塊,用于當(dāng)商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取商 品圖像中權(quán)重大于預(yù)定闊值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為商品圖像中的商標(biāo)樣本圖像。
[0027] 本發(fā)明的實(shí)施方式還公開(kāi)了一種檢索商品圖像中商標(biāo)的裝置,訓(xùn)練集中所有商品 圖像的權(quán)重大于預(yù)定闊值的商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,該裝置包括W下模 塊:
[0028] 特征提取模塊,用于對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征 占 . '?、、,
[0029] 權(quán)重投票累加模塊,依次將提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在特征 空間中尋找與當(dāng)前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將K個(gè)特征點(diǎn)的權(quán)重分別累加到 κ個(gè)特征點(diǎn)各自對(duì)應(yīng)的商品圖像所屬的商標(biāo)樣本類目的投票得分中;
[0030] 商標(biāo)檢索模塊,用于統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本 類目的商標(biāo)作為待檢索商品圖像的檢索結(jié)果。
[0031] 本發(fā)明實(shí)施方式與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于:
[0032] 能夠自動(dòng)獲取大量商品圖像中的商標(biāo)樣本區(qū)域,得到商標(biāo)樣本圖像,不需要消耗 大量的人工標(biāo)注,并且隨著商標(biāo)數(shù)量及商品圖像的增加,維護(hù)成本維持不變。
[0033] 根據(jù)特征空間中與待檢索商品圖像的特征點(diǎn)距離最接近的特征點(diǎn)的權(quán)重,對(duì)待檢 索商品圖像所屬的商標(biāo)樣本類目進(jìn)行投票,提升了檢索的精確度。
[0034] 進(jìn)一步地,如果商品圖像的特征點(diǎn)更傾向于與訓(xùn)練集中正樣本所對(duì)應(yīng)的候選特征 點(diǎn)匹配,則增加其權(quán)重,反之則降低,提升了系統(tǒng)的準(zhǔn)確率和召回率。
[0035] 進(jìn)一步地,提取特征時(shí)采用提取特征時(shí)采用局部特征可W適用于圖像混疊和有遮 擋的情況。
[0036] 進(jìn)一步地,對(duì)特征空間建立索引,能夠更快速地檢索索引中與輸入特征最相似的 特征點(diǎn)。
【附圖說(shuō)明】
[0037] 圖1是商品圖像與商標(biāo)樣本圖像的關(guān)系示意圖;
[0038] 圖2是商標(biāo)樣本類目包含多張商標(biāo)樣本圖像的示意圖;
[0039] 圖3是本發(fā)明第一實(shí)施方式中一種自動(dòng)獲取商品圖像中商標(biāo)的方法的流程示意 圖;
[0040] 圖4是本發(fā)明第Ξ實(shí)施方式中一種檢索商品圖像中商標(biāo)的方法的流程示意圖;
[0041] 圖5是本發(fā)明第四實(shí)施方式中一種自動(dòng)獲取商品圖像中商標(biāo)的裝置的結(jié)構(gòu)示意 圖;
[0042] 圖6是本發(fā)明第六實(shí)施方式中一種檢索商品圖像中商標(biāo)的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0043] 在W下的敘述中,為了使讀者更好地理解本申請(qǐng)而提出了許多技術(shù)細(xì)節(jié)。但是,本 領(lǐng)域的普通技術(shù)人員可W理解,即使沒(méi)有運(yùn)些技術(shù)細(xì)節(jié)和基于W下各實(shí)施方式的種種變化 和修改,也可W實(shí)現(xiàn)本申請(qǐng)各權(quán)利要求所要求保護(hù)的技術(shù)方案。 W44] 術(shù)語(yǔ)解釋:
[0045] 商標(biāo)樣本圖像:在本發(fā)明中特指不包含或很少包含背景,僅包含商標(biāo)的圖像,一般 從商品圖像中通過(guò)人工標(biāo)注的方式來(lái)獲取。如下圖1所示為商品圖像與商標(biāo)樣本圖像的關(guān) 系示意圖,其中全圖為商品圖像,矩形框選中部分為商標(biāo)樣本圖像。
[0046] 商標(biāo)樣本類目:是指樣本圖像或者商品圖像按照樣本類目的方式來(lái)組織。比如 "Starbucks"就是一個(gè)商標(biāo)樣本類目,它可能會(huì)包含不同環(huán)境下的多張商標(biāo)樣本圖像,如圖 2所示為商標(biāo)樣本類目包含多張商標(biāo)樣本圖像的示意圖。
[0047] 商標(biāo)識(shí)別(系統(tǒng)):輸入一張待檢索的圖像(可能包含或者不包含商標(biāo)),要求系 統(tǒng)能夠識(shí)別并返回該圖像是否包含商標(biāo)樣本類目中的品牌,具體的品牌信息W及所在的區(qū) 域。
[0048] 商標(biāo)識(shí)別的一般流程:常見(jiàn)的流程一般包括樣本圖像的收集、特征索引的建立W 及輸入圖像(或者待檢索圖像)的檢索Ξ個(gè)步驟。
[0049] 局部特征:全局特征是用來(lái)描述整張圖像的宏觀特征,比如顏色直方圖。全局特征 的缺點(diǎn)在于不適合用于圖像混疊和有遮擋的情況。局部特征一般包含圖像中的部分空間范 圍,一個(gè)好的局部特征需要具備W下性質(zhì):可重復(fù)性,獨(dú)特性,局部性,數(shù)量性,準(zhǔn)確性,高效 性,其中又W可重復(fù)性為最重要。局部特征匹配:本質(zhì)上可W歸結(jié)為通過(guò)距離函數(shù)在高維 向量之間進(jìn)行相似性檢索的問(wèn)題。大致有兩類解決方法,第一種是通過(guò)窮舉法(線性掃描 法),即將數(shù)據(jù)集中的點(diǎn)與查詢點(diǎn)逐一進(jìn)行距離比較;第二種是建立索引進(jìn)行快速匹配,比 如常用的kd樹(shù)W及改進(jìn)的kd樹(shù)查詢方式度BF,Best-Bin-First)等。
[0050] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明的實(shí)施 方式作進(jìn)一步地詳細(xì)描述。
[0051] 本發(fā)明第一實(shí)施方式設(shè)及一種自動(dòng)獲取商品圖像中商標(biāo)的方法,圖3是該自動(dòng)獲 取商品圖像中商標(biāo)的方法的流程示意圖。
[0052] 具體地說(shuō),如圖3所示,該自動(dòng)獲取商品圖像中商標(biāo)的方法包括W下步驟:
[0053] 步驟101,對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的多個(gè)特征 點(diǎn)。
[0054] 對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下步驟:
[0055] 步驟102,獲取商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品 圖像的特征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)各個(gè)候選特征 點(diǎn)與當(dāng)前特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與商品圖像屬 于同一商標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別商品圖像中商標(biāo)的權(quán)重。
[0056] 可W理解,選取候選特征點(diǎn)時(shí)可W通過(guò)距離來(lái)決定,比如歐式距離,余弦協(xié)方差距 離。此外,不一定根據(jù)距離選取候選特征點(diǎn),其它表示特征點(diǎn)相似度的方法也可W。
[0057] 步驟103,當(dāng)商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取商品圖像中權(quán)重大 于預(yù)定闊值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為商品圖像中的商標(biāo)樣本圖像。
[0058] 本實(shí)施方式能夠自動(dòng)獲取大量商品圖像中的商標(biāo)樣本區(qū)域,得到商標(biāo)樣本圖像, 不需要消耗大量的人工標(biāo)注,并且隨著商標(biāo)數(shù)量及商品圖像的增加,維護(hù)成本維持不變。
[0059] 本發(fā)明第二實(shí)施方式設(shè)及一種自動(dòng)獲取商品圖像中商標(biāo)的方法,第二實(shí)施方式在 第一實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:如果商品圖像的特征點(diǎn)更傾向于 與訓(xùn)練集中正樣本所對(duì)應(yīng)的候選特征點(diǎn)匹配,則增加其權(quán)重,反之則降低,提升了系統(tǒng)的準(zhǔn) 確率和召回率;提取特征時(shí)采用局部特征可W適用于圖像混疊和有遮擋的情況。具體地 說(shuō):
[0060] 在上述步驟102中根據(jù)各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離排序W及各個(gè)候選 特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與商品圖像屬于同一商標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特 征點(diǎn)用于有效識(shí)別商品圖像中商標(biāo)的權(quán)重"的步驟包括子步驟:
[0061] 步驟1021,按照各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離大小,對(duì)各個(gè)候選特征點(diǎn)進(jìn) 行升序排列;
[0062] 步驟1022,依次判斷升序排列中各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣 本;
[0063] 步驟1023,根據(jù)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判斷結(jié)果,W及候 選特征點(diǎn)在升序排列中的位置,計(jì)算該特征點(diǎn)的權(quán)重,其中,所對(duì)應(yīng)的商品圖像為正樣本的 候選特征點(diǎn)在升序排列中越靠前,則對(duì)當(dāng)前特征點(diǎn)的權(quán)重貢獻(xiàn)值越大。
[0064] 其中,各個(gè)候選特征點(diǎn)按照與當(dāng)前特征點(diǎn)的距離大小進(jìn)行升序排列后,排序越靠 前即與當(dāng)前特征點(diǎn)的距離越小。 陽(yáng)0化]優(yōu)選地,在上述步驟1023中,包括子步驟:
[0066] 如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為正樣本,則將該候選特征點(diǎn)的權(quán)重貢獻(xiàn)值增 加至當(dāng)前特征點(diǎn)的權(quán)重中;
[0067] 如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為負(fù)樣本,則不增加當(dāng)前特征點(diǎn)的權(quán)重,但減 少排在該候選特征點(diǎn)其后的候選特征點(diǎn)的權(quán)重貢獻(xiàn)值。
[0068] 其中負(fù)樣本是指候選特征點(diǎn)所對(duì)應(yīng)的商品圖像與商品圖像不屬于同一商標(biāo)樣本 類目的商品圖像。 W例如果商品圖像的特征點(diǎn)更傾向于與訓(xùn)練集中正樣本所對(duì)應(yīng)的候選特征點(diǎn)匹配,貝U 增加其權(quán)重,反之則降低,提升了系統(tǒng)的準(zhǔn)確率和召回率。
[0070] 此外,可W理解,在本發(fā)明的其它實(shí)施方式中,也可W采取其它計(jì)算當(dāng)前特征點(diǎn)權(quán) 重的方法,而不局限于此。例如,如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為正樣本,則將該候選 特征點(diǎn)的權(quán)重貢獻(xiàn)值增加至當(dāng)前特征點(diǎn)的權(quán)重中;如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為負(fù) 樣本,則相應(yīng)減少當(dāng)前特征點(diǎn)的權(quán)重,負(fù)樣本所對(duì)應(yīng)的候選特征點(diǎn)不影響排在該候選特征 點(diǎn)其后的候選特征點(diǎn)的權(quán)重貢獻(xiàn)值。
[0071] 優(yōu)選地,在上述步驟1023中,具體包括子步驟: 陽(yáng)0巧初始化Qk= 0, P k= 0 ;其中,k表示訓(xùn)練集中第k幅商品圖像; 陽(yáng)〇7引對(duì)于各個(gè)候選特征點(diǎn)的升序排列{爲(wèi),* = 1,2,.'',《-1},其中,瑞.表示第1^幅商品 圖像中,與商品圖像i的第j個(gè)特征點(diǎn)距離最小的候選特征點(diǎn),S-1表示訓(xùn)練集中除商品圖 像i之外其余商品圖像的個(gè)數(shù),如果候選特征點(diǎn)Z,所對(duì)應(yīng)的商品圖像為正樣本,則使用W 下公式來(lái)更新Pk和Q k:
[0074] Pk= Pk 1+1 陽(yáng)0巧]
[0076] 如果為負(fù)樣本,則使用W下公式來(lái)更新Pk和Q k: 陽(yáng)077] Qk=Qki
[007引 Pk=Pki
[0079] 對(duì)當(dāng)前特征點(diǎn)巧的權(quán)重使用W下公式進(jìn)行歸一化:
[0080]
[0081] 其中,-]表示各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像中為正樣本的數(shù)量。
[0082] 優(yōu)選地,在步驟101中,局部特征為尺度不變特征變換特征。提取特征時(shí)采用局部 特征可W適用于圖像混疊和有遮擋的情況。 |;0〇83] 此夕b可W理解,尺度不變特征變換特征(即Scale-invariant feature transform,簡(jiǎn)稱SIFT特征)通常包括1維的X坐標(biāo),1維的Υ坐標(biāo),1維的尺度信息,1維的 主方向信息W及128維的特征描述子信息。在本發(fā)明的其它實(shí)施方式中,也可W通過(guò)其它 方式提取局部特征,例如提取SURF特征。
[0084] 作為本實(shí)施方式的優(yōu)選例,從商品圖像中獲取商標(biāo)樣本圖像的流程主要包括:
[00財(cái) 1.訓(xùn)練集準(zhǔn)備。與傳統(tǒng)方案相比,本優(yōu)選例所需要的訓(xùn)練集中所包含的樣本圖片, 并非像傳統(tǒng)方案要求是從商品圖片中標(biāo)注并提取的商標(biāo)區(qū)域,而可W是包含商標(biāo)的商品圖 片本身;商標(biāo)區(qū)域是通過(guò)后續(xù)算法自動(dòng)計(jì)算得到的,無(wú)須人工干預(yù);而商品圖片亦可W通 過(guò)技術(shù)手段自動(dòng)獲得或簡(jiǎn)單通過(guò)人工收集,比如利用文本捜索引擎(百度、淘寶)、通過(guò)品 牌商標(biāo)的關(guān)鍵詞批量獲取,作為本優(yōu)選例的訓(xùn)練集。假設(shè)訓(xùn)練集總共包括S張樣本圖像,分 別歸屬于T個(gè)商標(biāo)類別:即對(duì)于一系列商標(biāo)樣本圖像{Xi,i = 1,2,…,S},其對(duì)應(yīng)的商標(biāo)樣 本類目分別為{yi,i = 1,2,…,S}。
[0086] 2.局部特征提取。一般采用經(jīng)典的SIFT算法。第i幅圖像提取的第j個(gè)特征點(diǎn) 表示為{^/,/ = 1,筆",,&/ = 1.2,",,1\',^1,運(yùn)里使用1^康示第1幅圖像提取的特征點(diǎn)的數(shù)量。
[0087] 3.權(quán)重計(jì)算。對(duì)于每一幅商標(biāo)樣本圖片中的每一個(gè)特征點(diǎn),分別尋找該特征點(diǎn)與 其它S-1幅圖像的各個(gè)特征點(diǎn)中,歐氏距離最小的特征點(diǎn);具體步驟描述如下:
[00蝴 1)假設(shè)早為第i幅圖像中第j個(gè)特征點(diǎn),計(jì)算其與另外S-1幅圖像各個(gè)特征點(diǎn)的 歐式距離。
[0089] 2)選取上述計(jì)算得到的結(jié)果中,各圖(共S-1幅圖像,不包括第i幅圖像本身)與 輸入特征點(diǎn)距離最小的特征點(diǎn),作為候選點(diǎn),記為端,表示第k幅圖像中,與第i幅圖像中 第j個(gè)特征點(diǎn)歐氏距離最小的特征點(diǎn),用 來(lái)表示兩者之間的距離。
[0090] 扣按照4的大小對(duì)鴻巧行升序排列,形成新的序列:商標(biāo)樣本圖片{Xk,k = 1,2,…,S-1}與對(duì)應(yīng)的商標(biāo)樣本類目柄,k = 1,2,…,S-1}。 陽(yáng)091] 4)當(dāng) k = 0 時(shí),初始化 Qk= 0, Pk= 0。 陽(yáng)〇9引W對(duì)于步驟3輸出的序列ky、'=i,2,一,-y-i}中的每一個(gè)特征點(diǎn),如果滿足: 陽(yáng) 09 引 yi=yk
[0094] 即第k個(gè)特征點(diǎn)所屬的圖片,與輸入圖片屬于同一商標(biāo)樣本類目,則使用W下公 式來(lái)更新Pk和Q k: 陽(yáng)0 巧]Pk=Pki+l
[0096]
[0097] 如果不滿足,則使用W下公式來(lái)更新: 陽(yáng) 09 引 Qk=Qki
[0099] Pk=Pki
[0100] 上述公式的原理是:匹配序列中的負(fù)樣本的特征點(diǎn)對(duì)分值沒(méi)有貢獻(xiàn),但會(huì)降低排 名在它后方的正樣本的特征點(diǎn)的權(quán)重(因?yàn)榉帜竗增加了)。 陽(yáng)101] 6)當(dāng)序列瑞中所有的特征點(diǎn)都計(jì)算完一遍之后,使用w下公式獲得最終的義/的 權(quán)重: 陽(yáng) 102]
陽(yáng)10引上式中表示總共S張樣本圖像中,與類別相同的圖像(正樣本,但不包含 輸入圖片本身)的數(shù)量。該式隱含的含義是,如果正樣本排名越靠前,則最終的得分越高; 整個(gè)得分的區(qū)間在0~1之間;如果序列Z,中正樣本均出現(xiàn)在負(fù)樣本之前,則得分為1。
[0104] 7)上式中輸出的結(jié)果成WV/'可W作為第i幅圖像的第j個(gè)特征的權(quán)重;該特 征在所有正樣本中匹配的數(shù)量越多,在所有負(fù)樣本中匹配的數(shù)量越少,則其重要性和權(quán) 重就越大;運(yùn)些權(quán)重高的特征點(diǎn)一般對(duì)應(yīng)了商品圖像中的商標(biāo)樣本區(qū)域。通過(guò)設(shè)定一 個(gè)合理的闊值Θ,可W提取所有滿足W下條件的特征點(diǎn)作為商標(biāo)識(shí)別的有效特征點(diǎn): {扣〇您/ 空食,Z' = 1,名…成./ =: 1,2,;...,}。
[0105] 本發(fā)明第Ξ實(shí)施方式設(shè)及一種檢索商品圖像中商標(biāo)的方法,圖4是該檢索商品圖 像中商標(biāo)的方法的流程示意圖。 陽(yáng)106] 具體地說(shuō),訓(xùn)練集中所有商品圖像的權(quán)重大于預(yù)定闊值的商標(biāo)樣本區(qū)域內(nèi)的特征 點(diǎn)構(gòu)成特征空間,如圖4所示,該檢索商品圖像中商標(biāo)的方法包括W下步驟: 陽(yáng)107] 步驟401,對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征點(diǎn)。
[0108] 步驟402,依次將提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在特征空間中尋找 與當(dāng)前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將K個(gè)特征點(diǎn)的權(quán)重分別加到K個(gè)特征點(diǎn)各 自對(duì)應(yīng)的商品圖像所屬的商標(biāo)樣本類目的投票得分中。
[0109] 步驟403,統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本類目的商標(biāo) 作為待檢索商品圖像的檢索結(jié)果。
[0110] 此外,可W理解,通常情況下,商品圖像中商標(biāo)區(qū)域占據(jù)的部分比較少,如果不預(yù) 先提取商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,而直接統(tǒng)計(jì)特征點(diǎn)的投票得分的話,可能 非商標(biāo)區(qū)域特征點(diǎn)所累加的得分會(huì)覆蓋商標(biāo)區(qū)域的特征點(diǎn)得分,從而不能正確檢索商品圖 像的商標(biāo)樣本類目。 陽(yáng)111] 而訓(xùn)練集中所有商品樣本圖像的權(quán)重大于預(yù)定闊值的特征點(diǎn)通常對(duì)應(yīng)了商品樣 本圖像的商標(biāo)區(qū)域,因此,本實(shí)施方式中將商標(biāo)區(qū)域的特征點(diǎn)作為特征空間,能夠解決上述 非商標(biāo)區(qū)域特征點(diǎn)所累加的得分會(huì)覆蓋商標(biāo)區(qū)域的特征點(diǎn)得分的情況。
[0112] 優(yōu)選地,在"依次將提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在特征空間中尋 找與當(dāng)前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn)"的步驟中,包括W下子步驟:
[0113] 采用樹(shù)狀數(shù)據(jù)結(jié)構(gòu)對(duì)特征空間建立索引。
[0114] 通過(guò)檢索索引尋找與待檢索商品圖像的當(dāng)前特征點(diǎn)距離最接近的K各特征點(diǎn)。
[0115] 對(duì)特征空間建立索引,能夠更快速地檢索索引中與輸入特征最相似的特征點(diǎn)。 此外,可W理解,樹(shù)狀結(jié)構(gòu)建立索引可W采用比如kd樹(shù)W及改進(jìn)的kd樹(shù)查詢方式度BF, Best-Bin-First)等D
[0116] 本實(shí)施方式根據(jù)特征空間中與待檢索商品圖像的特征點(diǎn)距離最接近的特征點(diǎn)的 權(quán)重,對(duì)待檢索商品圖像所屬的商標(biāo)樣本類目進(jìn)行投票,提升了檢索的精確度。
[0117] 作為本實(shí)施方式的優(yōu)選例,檢索商品圖像中商標(biāo)的流程主要包括:
[0118] 1.檢索:對(duì)輸入圖像(商品圖像)提取SIFT特征;針對(duì)提取得到的每一個(gè)SIFT 特征點(diǎn),尋找特征空間中與其最接近(歐氏距離最?。┑腒個(gè)特征點(diǎn),并將運(yùn)K個(gè)特征點(diǎn)對(duì) 應(yīng)的商標(biāo)類目投票增加相應(yīng)的權(quán)重。
[0119] 2.結(jié)果輸出:按照上述步驟對(duì)輸入的待檢索圖像的所有特征點(diǎn)都進(jìn)行完一次投 票后,統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的最終得分結(jié)果,并輸出得分最高的商標(biāo)樣本類目,作為輸入 圖像的匹配結(jié)果。
[0120] 本發(fā)明的各方法實(shí)施方式均可軟件、硬件、固件等方式實(shí)現(xiàn)。不管本發(fā)明是 W軟件、硬件、還是固件方式實(shí)現(xiàn),指令代碼都可W存儲(chǔ)在任何類型的計(jì)算機(jī)可訪問(wèn)的存儲(chǔ) 器中(例如永久的或者可修改的,易失性的或者非易失性的,固態(tài)的或者非固態(tài)的,固定的 或者可更換的介質(zhì)等等)。同樣,存儲(chǔ)器可W例如是可編程陣列邏輯(Programmable Array Logic,簡(jiǎn)稱叩A(chǔ)L")、隨機(jī)存取存儲(chǔ)器(Random Access Memo巧,簡(jiǎn)稱"RAM")、可編程只讀存 儲(chǔ)器(Programm 油 le Read Only Memoir,簡(jiǎn)稱"PROM")、只讀存儲(chǔ)器巧 ead-〇nly Memoir, 簡(jiǎn)稱"ROM")、電可擦除可編程只讀存儲(chǔ)器巧lectrically liras油le Programm油le ROM,簡(jiǎn) 稱"EEPROM")、磁盤、光盤、數(shù)字通用光盤值igital Versatile Disc,簡(jiǎn)稱"DVD")等等。 陽(yáng)121] 本發(fā)明第四實(shí)施方式設(shè)及一種自動(dòng)獲取商品圖像中商標(biāo)的裝置,圖5是該自動(dòng)獲 取商品圖像中商標(biāo)的裝置的結(jié)構(gòu)示意圖。
[0122] 具體地說(shuō),如圖5所示該自動(dòng)獲取商品圖像中商標(biāo)的裝置包括W下模塊:
[0123] 特征提取模塊,用于對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的 多個(gè)特征點(diǎn);
[0124] 特征點(diǎn)權(quán)重計(jì)算模塊,用于對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下操作:
[0125] 獲取商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品圖像的特 征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)各個(gè)候選特征點(diǎn)與當(dāng)前 特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與商品圖像屬于同一商 標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別商品圖像中商標(biāo)的權(quán)重.
[01%] 商標(biāo)區(qū)域選取模塊,用于當(dāng)商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取商 品圖像中權(quán)重大于預(yù)定闊值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為商品圖像中的商標(biāo)樣本圖像。
[0127] 本實(shí)施方式能夠自動(dòng)獲取大量商品圖像中的商標(biāo)樣本區(qū)域,得到商標(biāo)樣本圖像, 不需要消耗大量的人工標(biāo)注,并且隨著商標(biāo)數(shù)量及商品圖像的增加,維護(hù)成本維持不變。
[0128] 第一實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第一實(shí)施 方式互相配合實(shí)施。第一實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了 減少重復(fù),運(yùn)里不再寶述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第一實(shí)施 方式中。
[0129] 本發(fā)明第五實(shí)施方式設(shè)及一種自動(dòng)獲取商品圖像中商標(biāo)的裝置,第五實(shí)施方式在 第四實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:如果商品圖像的特征點(diǎn)更傾向于 與訓(xùn)練集中正樣本所對(duì)應(yīng)的候選特征點(diǎn)匹配,則增加其權(quán)重,反之則降低,提升了系統(tǒng)的準(zhǔn) 確率和召回率;提取特征時(shí)采用局部特征可W適用于圖像混疊和有遮擋的情況。具體地 說(shuō):
[0130] 在上述特征點(diǎn)權(quán)重計(jì)算模塊中,包括子模塊: 陽(yáng)131] 候選特征點(diǎn)排序子模塊,用于按照各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離大小,對(duì) 各個(gè)候選特征點(diǎn)進(jìn)行升序排列;
[0132] 正樣本判斷子模塊,用于依次判斷升序排列中各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像 是否為正樣本;
[0133] 權(quán)重計(jì)算核屯、子模塊,用于根據(jù)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判 斷結(jié)果,W及候選特征點(diǎn)在升序排列中的位置,計(jì)算該特征點(diǎn)的權(quán)重,其中,所對(duì)應(yīng)的商品 圖像為正樣本的候選特征點(diǎn)在升序排列中越靠前,則對(duì)當(dāng)前特征點(diǎn)的權(quán)重貢獻(xiàn)值越大。
[0134] 優(yōu)選地,在權(quán)重計(jì)算核屯、子模塊中,包括子模塊:
[0135] 正樣本處理子模塊,用于如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為正樣本,則將該候 選特征點(diǎn)的權(quán)重貢獻(xiàn)值增加至當(dāng)前特征點(diǎn)的權(quán)重中;
[0136] 負(fù)樣本處理子模塊,用于如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為負(fù)樣本,則不增加 當(dāng)前特征點(diǎn)的權(quán)重,但減少排在該候選特征點(diǎn)其后的候選特征點(diǎn)的權(quán)重貢獻(xiàn)值。
[0137] 優(yōu)選地,在特征點(diǎn)權(quán)重計(jì)算模塊中,還包括子模塊:
[013引初始化子模塊,用于初始化Qk= 0, P k= 0 ;其中,k表示訓(xùn)練集中第k幅商品圖像; [0139] 權(quán)重累加子模塊,用于對(duì)于各個(gè)候選特征點(diǎn)的升序排列{,,來(lái)=1,2,一,《-中,其 中,表示第k幅商品圖像中,與商品圖像i的第j個(gè)特征點(diǎn)距離最小的候選特征點(diǎn),S-1 表示訓(xùn)練集中除商品圖像i之外其余商品圖像的個(gè)數(shù),如果候選特征點(diǎn)馬;,所對(duì)應(yīng)的商品圖 像為正樣本,則使用W下公式來(lái)更新Pk和Q k:
陽(yáng)14引如果為負(fù)樣本,則使用W下公式來(lái)更新Pk和Q k: 陽(yáng)1創(chuàng) Qk=Qki
[0144] Pk=Pki
[0145] 權(quán)重歸一化子模塊,用于對(duì)當(dāng)前特征點(diǎn)X/的權(quán)重使用W下公式進(jìn)行歸一化: 陽(yáng) 146]
陽(yáng)147] 其中,S -1表示各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像中為正樣本的數(shù)量。
[0148] 優(yōu)選地,在特征提取模塊中,局部特征為尺度不變特征變換特征。
[0149] 第二實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第二實(shí)施 方式互相配合實(shí)施。第二實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了 減少重復(fù),運(yùn)里不再寶述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第二實(shí)施 方式中。
[0150] 本發(fā)明第六實(shí)施方式設(shè)及一種檢索商品圖像中商標(biāo)的裝置,圖6是該檢索商品圖 像中商標(biāo)的裝置的結(jié)構(gòu)示意圖。 陽(yáng)151] 具體地說(shuō),該檢索商品圖像中商標(biāo)的裝置訓(xùn)練集中所有商品圖像的權(quán)重大于預(yù)定 闊值的商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,如圖6所示,該裝置包括W下模塊:
[0152] 特征提取模塊,用于對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征 占 . '?、、,
[0153] 權(quán)重投票累加模塊,依次將提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在特征 空間中尋找與當(dāng)前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將K個(gè)特征點(diǎn)的權(quán)重分別累加到 K個(gè)特征點(diǎn)各自對(duì)應(yīng)的商品圖像所屬的商標(biāo)樣本類目的投票得分中;
[0154] 商標(biāo)檢索模塊,用于統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本 類目的商標(biāo)作為待檢索商品圖像的檢索結(jié)果。
[01巧]優(yōu)選地,在權(quán)重投票累加模塊中,還包括W下子模塊: 陽(yáng)156] 索引建立子模塊,用于采用樹(shù)狀數(shù)據(jù)結(jié)構(gòu)對(duì)特征空間建立索引。 陽(yáng)157] 索引檢索子模塊,用于通過(guò)檢索索引尋找與待檢索商品圖像的特征點(diǎn)距離最接近 的K各特征點(diǎn)。
[0158] 對(duì)特征空間建立索引,能夠更快速地檢索索引中與輸入特征最相似的特征點(diǎn)。 此外,可W理解,樹(shù)狀結(jié)構(gòu)建立索引可W采用比如kd樹(shù)W及改進(jìn)的kd樹(shù)查詢方式度BF, Best-Bin-First)等。
[0159] 本實(shí)施方式根據(jù)特征空間中與待檢索商品圖像的特征點(diǎn)距離最接近的特征點(diǎn)的 權(quán)重,對(duì)待檢索商品圖像所屬的商標(biāo)樣本類目進(jìn)行投票,提升了檢索的精確度。
[0160] 第Ξ實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第Ξ實(shí)施 方式互相配合實(shí)施。第Ξ實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了 減少重復(fù),運(yùn)里不再寶述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第Ξ實(shí)施 方式中。 陽(yáng)161] 本發(fā)明提出了一種新的方案,通過(guò)自動(dòng)學(xué)習(xí)和發(fā)現(xiàn)圖片中的商標(biāo)區(qū)域的特征點(diǎn), 從而解決了商品樣本圖像的收集和標(biāo)注需要消耗大量人工的問(wèn)題;同時(shí),賦予各個(gè)特征點(diǎn) 不同的權(quán)重(取決于該特征的獨(dú)特性和魯棒性),該特征如果更傾向于被訓(xùn)練集中的正樣 本(與待檢索圖片屬于相同的類目)的特征匹配上,則增加其權(quán)重,反之則降低,最終提升 了系統(tǒng)在檢索過(guò)程中的準(zhǔn)確率和召回率。
[0162] 需要說(shuō)明的是,本發(fā)明各設(shè)備實(shí)施方式中提到的各模塊都是邏輯模塊,在物理上, 一個(gè)邏輯模塊可W是一個(gè)物理模塊,也可W是一個(gè)物理模塊的一部分,還可多個(gè)物理 模塊的組合實(shí)現(xiàn),運(yùn)些邏輯模塊本身的物理實(shí)現(xiàn)方式并不是最重要的,運(yùn)些邏輯模塊所實(shí) 現(xiàn)的功能的組合才是解決本發(fā)明所提出的技術(shù)問(wèn)題的關(guān)鍵。此外,為了突出本發(fā)明的創(chuàng)新 部分,本發(fā)明上述各設(shè)備實(shí)施方式并沒(méi)有將與解決本發(fā)明所提出的技術(shù)問(wèn)題關(guān)系不太密切 的模塊引入,運(yùn)并不表明上述設(shè)備實(shí)施方式并不存在其它的模塊。
[0163] 需要說(shuō)明的是,在本專利的權(quán)利要求和說(shuō)明書中,諸如第一和第二等之類的關(guān)系 術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示 運(yùn)些實(shí)體或操作之間存在任何運(yùn)種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)"包括"、"包含"或者其 任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者 設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為運(yùn)種過(guò)程、 方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句"包括一個(gè)"限定的 要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0164] 雖然通過(guò)參照本發(fā)明的某些優(yōu)選實(shí)施方式,已經(jīng)對(duì)本發(fā)明進(jìn)行了圖示和描述,但 本領(lǐng)域的普通技術(shù)人員應(yīng)該明白,可W在形式上和細(xì)節(jié)上對(duì)其作各種改變,而不偏離本發(fā) 明的精神和范圍。
【主權(quán)項(xiàng)】
1. 一種自動(dòng)獲取商品圖像中商標(biāo)的方法,其特征在于,包括W下步驟: 對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的多個(gè)特征點(diǎn); 對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下步驟: 獲取所述商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品圖像的 特征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)所述各個(gè)候選特征點(diǎn) 與當(dāng)前特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與所述商品圖像 屬于同一商標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別所述商品圖像中商標(biāo)的權(quán) 重; 當(dāng)所述商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取所述商品圖像中權(quán)重大于預(yù) 定闊值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為所述商品圖像中的商標(biāo)樣本區(qū)域。2. 根據(jù)權(quán)利要求1所述的自動(dòng)獲取商品圖像中商標(biāo)的方法,其特征在于,在所述"根據(jù) 所述各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是 否為與所述商品圖像屬于同一商標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別所述 商品圖像中商標(biāo)的權(quán)重"的步驟中,包括子步驟: 按照各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離大小,對(duì)所述各個(gè)候選特征點(diǎn)進(jìn)行升序排 列; 依次判斷所述升序排列中各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本; 根據(jù)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判斷結(jié)果,W及候選特征點(diǎn)在所述 升序排列中的位置,計(jì)算該特征點(diǎn)的權(quán)重,其中,所對(duì)應(yīng)的商品圖像為正樣本的候選特征點(diǎn) 在所述升序排列中越靠前,則對(duì)所述當(dāng)前特征點(diǎn)的權(quán)重貢獻(xiàn)值越大。3. 根據(jù)權(quán)利要求2所述的自動(dòng)獲取商品圖像中商標(biāo)的方法,其特征在于,在所述"根據(jù) 候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判斷結(jié)果,W及候選特征點(diǎn)在所述升序排列 中的位置,計(jì)算該特征點(diǎn)的權(quán)重"的步驟中,包括子步驟: 如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為正樣本,則將該候選特征點(diǎn)的權(quán)重貢獻(xiàn)值增加至 所述當(dāng)前特征點(diǎn)的權(quán)重中; 如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為負(fù)樣本,則不增加所述當(dāng)前特征點(diǎn)的權(quán)重,但減 少排在該候選特征點(diǎn)其后的候選特征點(diǎn)的權(quán)重貢獻(xiàn)值。4. 根據(jù)權(quán)利要求2所述的自動(dòng)獲取商品圖像中商標(biāo)的方法,其特征在于,在所述"根據(jù) 候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判斷結(jié)果,W及候選特征點(diǎn)在所述升序排列 中的位置,計(jì)算該特征點(diǎn)的權(quán)重"的步驟中,包括子步驟: 初始化Qk二0,Pk二O ;其中,k表不訓(xùn)練集中第k幅商品圖像,Z,',/表不第k幅商品圖 像中,與所述商品圖像i的第j個(gè)特征點(diǎn)距離最小的候選特征點(diǎn); 對(duì)于所述各個(gè)候選特征點(diǎn)的升序排列a' = K2,…,tS'-l},其中,S-I表示訓(xùn)練集中 除商品圖像i之外其余商品圖像的個(gè)數(shù),如果候選特征點(diǎn)馬,所對(duì)應(yīng)的商品圖像為正樣本, 則使用W下公式來(lái)更新Pk和Q k: Pk= Pk 1+1如果為負(fù)樣本,則使用W下公式來(lái)更新Pk和Q k:對(duì)所述當(dāng)前特征點(diǎn)巧的權(quán)重使用W下公式進(jìn)行歸一化:其中,S -I表示各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像中為正樣本的數(shù)量。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的自動(dòng)獲取商品圖像中商標(biāo)的方法,其特征在于, 在所述"對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的多個(gè)特征點(diǎn)"的步驟 中,所述局部特征為尺度不變特征變換特征。6. -種檢索商品圖像中商標(biāo)的方法,其特征在于,訓(xùn)練集中所有商品圖像的權(quán)重大于 預(yù)定闊值的商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,該方法包括W下步驟: 對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征點(diǎn); 依次將所述提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在所述特征空間中尋找與當(dāng) 前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將所述K個(gè)特征點(diǎn)的權(quán)重分別加到K個(gè)特征點(diǎn)各 自對(duì)應(yīng)的商品圖像所屬的商標(biāo)樣本類目的投票得分中; 統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本類目的商標(biāo)作為所述待檢 索商品圖像的檢索結(jié)果。7. 根據(jù)權(quán)利要求6所述的檢索商品圖像中商標(biāo)的方法,其特征在于,在所述"依次將所 述提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在所述特征空間中尋找與當(dāng)前特征點(diǎn)的距 離最接近的K個(gè)特征點(diǎn)"的步驟中,包括W下子步驟: 采用樹(shù)狀數(shù)據(jù)結(jié)構(gòu)對(duì)所述特征空間建立索引; 通過(guò)檢索所述索引尋找與所述待檢索商品圖像的當(dāng)前特征點(diǎn)距離最接近的K各特征 點(diǎn)。8. -種自動(dòng)獲取商品圖像中商標(biāo)的裝置,其特征在于,包括W下模塊: 特征提取模塊,用于對(duì)訓(xùn)練集中的商品圖像進(jìn)行局部特征提取,得到商品圖像的多個(gè) 特征點(diǎn); 特征點(diǎn)權(quán)重計(jì)算模塊,用于對(duì)每個(gè)商品圖像重復(fù)執(zhí)行如下操作: 獲取所述商品圖像的一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),在訓(xùn)練集中其余每幅商品圖像的 特征點(diǎn)中各選取一個(gè)與當(dāng)前特征點(diǎn)距離最小的作為候選特征點(diǎn),根據(jù)所述各個(gè)候選特征點(diǎn) 與當(dāng)前特征點(diǎn)的距離排序W及各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為與所述商品圖像 屬于同一商標(biāo)樣本類目的正樣本,計(jì)算當(dāng)前特征點(diǎn)用于有效識(shí)別所述商品圖像中商標(biāo)的權(quán) 重; 商標(biāo)區(qū)域選取模塊,用于當(dāng)所述商品圖像的所有特征點(diǎn)的權(quán)重都計(jì)算完畢后,選取所 述商品圖像中權(quán)重大于預(yù)定闊值的特征點(diǎn)所對(duì)應(yīng)的區(qū)域作為所述商品圖像中的商標(biāo)樣本 區(qū)域。9. 根據(jù)權(quán)利要求8所述的自動(dòng)獲取商品圖像中商標(biāo)的裝置,其特征在于,在所述特征 點(diǎn)權(quán)重計(jì)算模塊中,包括子模塊: 候選特征點(diǎn)排序子模塊,用于按照各個(gè)候選特征點(diǎn)與當(dāng)前特征點(diǎn)的距離大小,對(duì)所述 各個(gè)候選特征點(diǎn)進(jìn)行升序排列; 正樣本判斷子模塊,用于依次判斷所述升序排列中各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像 是否為正樣本; 權(quán)重計(jì)算核屯、子模塊,用于根據(jù)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像是否為正樣本的判斷結(jié) 果,W及候選特征點(diǎn)在所述升序排列中的位置,計(jì)算該特征點(diǎn)的權(quán)重,其中,所對(duì)應(yīng)的商品 圖像為正樣本的候選特征點(diǎn)在所述升序排列中越靠前,則對(duì)所述當(dāng)前特征點(diǎn)的權(quán)重貢獻(xiàn)值 越大。10. 根據(jù)權(quán)利要求9所述的自動(dòng)獲取商品圖像中商標(biāo)的裝置,其特征在于,在所述權(quán)重 計(jì)算核屯、子模塊中,包括子模塊: 正樣本處理子模塊,用于如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為正樣本,則將該候選特 征點(diǎn)的權(quán)重貢獻(xiàn)值增加至所述當(dāng)前特征點(diǎn)的權(quán)重中; 負(fù)樣本處理子模塊,用于如果候選特征點(diǎn)所對(duì)應(yīng)的商品圖像為負(fù)樣本,則不增加所述 當(dāng)前特征點(diǎn)的權(quán)重,但減少排在該候選特征點(diǎn)其后的候選特征點(diǎn)的權(quán)重貢獻(xiàn)值。11. 根據(jù)權(quán)利要求9所述的自動(dòng)獲取商品圖像中商標(biāo)的裝置,其特征在于,在所述特征 點(diǎn)權(quán)重計(jì)算模塊中,還包括子模塊: 初始化子模塊,用于初始化Qk= 〇,Pk= 0 ;其中,k表示訓(xùn)練集中第k幅商品圖像,Z占 表示第k幅商品圖像中,與所述商品圖像i的第j個(gè)特征點(diǎn)距離最小的候選特征點(diǎn); 對(duì)于所述各個(gè)候選特征點(diǎn)的升序排列(為,a = 1.2,…,S-Op其中,S-I表示訓(xùn)練集中 除商品圖像i之外其余商品圖像的個(gè)數(shù),如果候選特征點(diǎn)《,所對(duì)應(yīng)的商品圖像為正樣本, 則使用W下公式來(lái)更新Pk和Q k: Pk= Pk 1+1如果為負(fù)樣本,則使用W下公式來(lái)更新Pk和Q k: Qk 二 Q k 1 Pk=Pki 對(duì)所述當(dāng)前特征點(diǎn)不"的權(quán)重使用W下公式進(jìn)行歸一化:其中,Sw-I隸示各個(gè)候選特征點(diǎn)所對(duì)應(yīng)的商品圖像中為正樣本的數(shù)量。12. 根據(jù)權(quán)利要求8至11中任一項(xiàng)所述的自動(dòng)獲取商品圖像中商標(biāo)的裝置,其特征在 于,在所述特征提取模塊中,所述局部特征為尺度不變特征變換特征。13. -種檢索商品圖像中商標(biāo)的裝置,其特征在于,訓(xùn)練集中所有商品圖像的權(quán)重大于 預(yù)定闊值的商標(biāo)樣本區(qū)域內(nèi)的特征點(diǎn)構(gòu)成特征空間,該裝置包括W下模塊: 特征提取模塊,用于對(duì)輸入的待檢索商品圖像進(jìn)行局部特征提取得到多個(gè)特征點(diǎn); 權(quán)重投票累加模塊,用于依次將所述提取得到的每一個(gè)特征點(diǎn)作為當(dāng)前特征點(diǎn),并在 所述特征空間中尋找與當(dāng)前特征點(diǎn)的距離最接近的K個(gè)特征點(diǎn),并將所述K個(gè)特征點(diǎn)的權(quán) 重分別加到K個(gè)特征點(diǎn)各自對(duì)應(yīng)的商品圖像所屬的商標(biāo)樣本類目的投票得分中; 商標(biāo)檢索模塊,用于統(tǒng)計(jì)各個(gè)商標(biāo)樣本類目的投票得分,將得分最高的商標(biāo)樣本類目 的商標(biāo)作為所述待檢索商品圖像的檢索結(jié)果。14.根據(jù)權(quán)利要求13所述的檢索商品圖像中商標(biāo)的裝置,其特征在于,在所述權(quán)重投 票累加模塊中,還包括W下子模塊: 索引建立子模塊,用于采用樹(shù)狀數(shù)據(jù)結(jié)構(gòu)對(duì)所述特征空間建立索引; 索引檢索子模塊,用于通過(guò)檢索所述索引尋找與所述待檢索商品圖像的特征點(diǎn)距離最 接近的K各特征點(diǎn)。
【文檔編號(hào)】G06F17/30GK105989043SQ201510059267
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年2月4日
【發(fā)明人】薛暉
【申請(qǐng)人】阿里巴巴集團(tuán)控股有限公司