一種同款業(yè)務(wù)對象聚合、搜索的方法和系統(tǒng)的制作方法
【專利摘要】本申請實施例提供了一種同款業(yè)務(wù)對象聚合的方法,所述的方法包括,獲取業(yè)務(wù)對象的圖像;根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組;基于所述多個分組計算所述圖像的相似度;按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象。本申請實施例適用于大規(guī)模業(yè)務(wù)對象數(shù)據(jù)的處理,聚合效率高。
【專利說明】一種同款業(yè)務(wù)對象聚合、搜索的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本申請實施例涉及數(shù)據(jù)搜索的【技術(shù)領(lǐng)域】,特別是涉及一種同款業(yè)務(wù)對象聚合的方 法、一種同款業(yè)務(wù)對象聚合的系統(tǒng)、一種搜索方法和一種搜索系統(tǒng)。
【背景技術(shù)】
[0002] 近年來,隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)上的信息量急劇增加,其中包含了大量的圖像 信息。隨著各種圖像處理工具的普及,圖像的縮放、裁剪、添加水印等處理都給圖像造成形 式上的變化,但圖像內(nèi)容實質(zhì)上卻基本相同。過量的重疊圖像信息使得人們在信息檢索的 時候要進(jìn)行繁瑣的人工過濾,耗費時間和精力。
[0003] 例如,在垂直搜索環(huán)境中,用戶通過網(wǎng)站進(jìn)行某一業(yè)務(wù)對象(比如商品)搜索時,同 款業(yè)務(wù)對象,即屬性(例如,業(yè)務(wù)對象的圖像、業(yè)務(wù)對象的名稱、或業(yè)務(wù)對象的描述等)完全 或幾乎相同的業(yè)務(wù)對象,在單次搜索結(jié)果中,有很大幾率會被展示多次。同款業(yè)務(wù)對象的重 復(fù)展示降低了網(wǎng)站主提供信息的效率和用戶獲取信息的效率。
[0004] 目前,同款業(yè)務(wù)對象的聚合可以利用業(yè)務(wù)對象的類型、參數(shù)或名稱等方式來進(jìn)行。 但是當(dāng)業(yè)務(wù)對象的類型、參數(shù)及名稱等信息缺失或這些信息不足以進(jìn)行不同款業(yè)務(wù)對象的 類型的區(qū)分時,往往需要靠人工來甄別、聚合。特別的,由于在網(wǎng)絡(luò)環(huán)境中發(fā)布的商品的類 型和數(shù)量都在高速增長中,人工挑選同款商品的方式在時間和人力成本上越來越高,以至 于無法承受。
[0005] 因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是:在信息搜索引擎 中,如何在互聯(lián)網(wǎng)發(fā)布的海量商品信息中,將內(nèi)容相同或相似的產(chǎn)品聚合為同一款業(yè)務(wù)對 象的類型,以提高信息搜索的效率。
[0006] 申請內(nèi)容
[0007] 本申請實施例所要解決的技術(shù)問題是提供一種同款業(yè)務(wù)對象聚合及一種搜索方 法,能夠基于業(yè)務(wù)對象的圖像內(nèi)容生成數(shù)字簽名,并能進(jìn)行快速驗證,用以實現(xiàn)海量商品中 同款業(yè)務(wù)對象的聚合,在保證聚合效果的同時,提高聚合速度,將此應(yīng)用于搜索領(lǐng)域,提高 信息搜索的效率。
[0008] 相應(yīng)的,本申請實施例還提供了一種同款業(yè)務(wù)對象聚合的系統(tǒng)及一種搜索系統(tǒng), 用以保證上述方法的實現(xiàn)及應(yīng)用。
[0009] 為了解決上述問題,本申請公開了一種同款業(yè)務(wù)對象聚合的方法,包括:
[0010] 獲取業(yè)務(wù)對象的圖像;
[0011] 根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0012] 采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;
[0013] 依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組;
[0014] 基于所述多個分組計算所述圖像的相似度;
[0015] 按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;
[0016] 將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象。
[0017] 較佳地,所述根據(jù)圖像的視覺特征生成所述圖像的數(shù)字簽名的步驟包括:
[0018] 分別提取所述圖像的視覺特征;所述視覺特征包括顏色特征,和/或,梯度特征, 和/或,局部特征;
[0019] 將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
[0020] 較佳地,所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色 在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述分別提取圖像的 視覺特征的步驟包括:
[0021] 獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0022] 遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色值歸屬的顏色維 度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值距離最近的顏色 維度;
[0023] 統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多個像素點個數(shù)最 多的顏色維度作為當(dāng)前圖像的主顏色;
[0024] 獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0025] 和 / 或,
[0026] 當(dāng)所述視覺特征包括梯度特征時,所述分別提取圖像的視覺特征的步驟包括:
[0027] 將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑;
[0028] 依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖;
[0029] 采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的梯度特征;
[0030] 和 / 或,
[0031] 當(dāng)所述視覺特征包括局部特征時,所述分別提取圖像的視覺特征的步驟包括:
[0032] 提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點;
[0033] 計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門限值的特征點拼 接成所述圖像的局部特征。
[0034] 較佳地,所述依據(jù)平滑后的灰度圖像計算所述圖像的梯度方向直方圖的子步驟進(jìn) 一步包括:
[0035] 針對平滑后的灰度圖像,計算每一像素點的梯度方向和梯度幅值;
[0036] 對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯度方向為橫軸的直方圖;
[0037] 將所述當(dāng)前圖像的梯度方向平均分成R個方向角度,生成R個方向角度分別對應(yīng) 的R個直方圖組距;其中,所述R為正整數(shù);
[0038] 遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方向找出最接近的兩個方 向角度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系數(shù);
[0039] 將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最接近的兩個方向角度 對應(yīng)的直方圖組距中;
[0040] 進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
[0041] 較佳地,所述依據(jù)數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組的步驟包括:
[0042] 提取所述圖像的數(shù)字簽名中的顏色特征;
[0043] 從所述顏色特征中提取分組主顏色;其中,所述分組主顏色包括最多像素點個數(shù) 對應(yīng)的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng)的主顏色的像素點數(shù)量 占所述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限值時,所選取的對應(yīng)像 素點個數(shù)次多的主顏色;
[0044] 按照所述分組主顏色將所述圖像劃分為多個分組,同一分組中圖像的分組主顏色 相同。
[0045] 較佳地,所述基于多個分組計算所述圖像的相似度的步驟包括:
[0046] 確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng)前圖像所在的分組,所 述相鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一個或多個;
[0047] 針對每張圖像,計算其顏色特征與其對應(yīng)的主分組及相鄰分組中其它圖像的顏色 特征的相似度;
[0048] 在所述主分組及相鄰分組中去除所述顏色特征的相似度小于第三預(yù)設(shè)門限值的 圖像;
[0049] 針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組及相鄰分組中剩余圖像的梯度 特征的相似度;
[0050] 在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征的相似度小于第四預(yù)設(shè)門 限值的圖像;
[0051] 針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像 的局部特征的相似度;
[0052] 將所述當(dāng)前圖像與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像的局部特征的 相似度作為所述圖像的相似度。
[0053] 較佳地,所述按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合的 步驟包括:
[0054] 若所述圖像的相似度高于第五預(yù)設(shè)門限值,則將所述圖像放入同一圖像集合。
[0055] 較佳地,所述的方法還包括:
[0056] 將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
[0057] 較佳地,所述將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理 的步驟包括:
[0058] 建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié)點設(shè)置為當(dāng)前業(yè)務(wù)對象的 圖像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像;
[0059] 遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng)的圖像樹合并到當(dāng)前圖像 樹中,消除被合并的圖像樹;
[0060] 遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
[0061] 本申請實施例公開了一種搜索方法,包括:
[0062] 接收用戶的搜索請求;
[0063] 依據(jù)所述請求,獲取搜索結(jié)果;及
[0064] 將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象;
[0065] 其中,所述分類標(biāo)識的生成方法包括:
[0066] 獲取業(yè)務(wù)對象的圖像;
[0067] 根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0068] 采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;依據(jù)所述數(shù)字簽名將圖像簽 名庫中的圖像劃分為多個分組;
[0069] 基于所述多個分組計算圖像的相似度;
[0070] 按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;
[0071] 將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一分類標(biāo)識。
[0072] 較佳地,所述根據(jù)圖像的視覺特征生成所述圖像的數(shù)字簽名的步驟包括:
[0073] 分別提取所述圖像的視覺特征;所述視覺特征包括顏色特征,和/或,梯度特征, 和/或,局部特征;
[0074] 將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
[0075] 較佳地,所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色 在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述分別提取圖像的 視覺特征的步驟包括:
[0076] 獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0077] 遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色值歸屬的顏色維 度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值距離最近的顏色 維度;
[0078] 統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多個像素點個數(shù)最 多的顏色維度作為當(dāng)前圖像的主顏色;
[0079] 獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0080] 和 / 或,
[0081] 當(dāng)所述視覺特征包括梯度特征時,所述分別提取圖像的視覺特征的步驟包括:
[0082] 將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑;
[0083] 依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖;
[0084] 采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的梯度特征;
[0085]和 / 或,
[0086] 當(dāng)所述視覺特征包括局部特征時,所述分別提取圖像的視覺特征的步驟包括:
[0087] 提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點;
[0088] 計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門限值的特征點拼 接成所述圖像的局部特征。
[0089] 較佳地,所述分類標(biāo)識的生成方法還包括:
[0090] 將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
[0091] 本申請實施例公開了一種同款業(yè)務(wù)對象聚合的系統(tǒng),包括:
[0092] 圖像獲取模塊,用于獲取業(yè)務(wù)對象的圖像;
[0093] 數(shù)字簽名生成模塊,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0094] 圖像簽名庫建立模塊,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;
[0095] 分組劃分模塊,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組;
[0096] 相似度計算模塊,用于基于所述多個分組計算所述圖像的相似度;
[0097] 圖像集合形成模塊,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個 圖像集合;
[0098] 同款業(yè)務(wù)對象合并模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為 同款業(yè)務(wù)對象。
[0099] 較佳地,所述數(shù)字簽名生成模塊包括:
[0100] 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;所述視覺特征包括顏 色特征,和/或,梯度特征,和/或,局部特征;
[0101] 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字 簽名。
[0102] 較佳地,所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色 在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述視覺特征提取子 模塊包括:
[0103] 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0104] 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各 像素點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像 素點的顏色值距離最近的顏色維度;
[0105] 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇 一個或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0106] 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0107] 和 / 或,
[0108] 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括:
[0109] 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行 平滑;
[0110] 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯 度方向直方圖;
[0111] 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為 當(dāng)前圖像的梯度特征;
[0112] 和 / 或,
[0113] 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括:
[0114] 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征 占.
[0115] 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于 預(yù)設(shè)第一門限值的特征點拼接成所述圖像的局部特征。
[0116] 較佳地,所述梯度方向直方圖計算子模塊進(jìn)一步包括:
[0117] 梯度方向和梯度幅值計算子模塊,用于針對平滑后的灰度圖像,計算每一像素點 的梯度方向和梯度幅值;
[0118] 第一直方圖生成子模塊,用于對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯 度方向為橫軸的直方圖;
[0119] 第二直方圖生成子模塊,用于將所述當(dāng)前圖像的梯度方向平均分成R個方向角 度,生成R個方向角度分別對應(yīng)的R個直方圖組距;其中,所述R為正整數(shù);
[0120] 權(quán)重分配子模塊,用于遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方 向找出最接近的兩個方向角度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系 數(shù);
[0121] 權(quán)重累加子模塊,用于將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最 接近的兩個方向角度對應(yīng)的直方圖組距中;
[0122] 梯度方向直方圖生成子模塊,用于進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
[0123] 較佳地,所述分組劃分模塊包括:
[0124] 顏色特征提取子模塊,用于提取所述圖像的數(shù)字簽名中的顏色特征;
[0125] 主顏色選取子模塊,用于從所述顏色特征中提取分組主顏色;其中,所述分組主顏 色包括最多像素點個數(shù)對應(yīng)的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng) 的主顏色的像素點數(shù)量占所述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限 值時,所選取的對應(yīng)像素點個數(shù)次多的主顏色;
[0126] 圖像分組子模塊,用于按照所述分組主顏色將所述圖像劃分為多個分組,同一分 組中圖像的分組主顏色相同。
[0127] 較佳地,所述相似度計算模塊包括:
[0128] 分組確定子模塊,用于確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng) 前圖像所在的分組,所述相鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一 個或多個;
[0129] 第一相似度計算子模塊,用于針對每張圖像,計算其顏色特征與其對應(yīng)的主分組 及相鄰分組中其它圖像的顏色特征的相似度;
[0130] 第一圖像去除子模塊,用于在所述主分組及相鄰分組中去除所述顏色特征的相似 度小于第三預(yù)設(shè)門限值的圖像;
[0131] 第二相似度計算子模塊,用于針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組 及相鄰分組中剩余圖像的梯度特征的相似度;
[0132] 第二圖像去除子模塊,用于在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征 的相似度小于第四預(yù)設(shè)門限值的圖像;
[0133] 第三相似度計算子模塊,用于針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組 及相鄰分組中最后剩余的圖像的局部特征的相似度;
[0134] 相似度確定子模塊,用于將所述當(dāng)前圖像與其對應(yīng)的主分組及相鄰分組中最后剩 余的圖像的局部特征的相似度作為所述圖像的相似度。
[0135] 較佳地,所述圖像集合形成模塊包括:
[0136] 圖像放入子模塊,用于當(dāng)所述圖像的相似度高于第五預(yù)設(shè)門限值時,將所述圖像 放入同一圖像集合。
[0137] 較佳地,所述的系統(tǒng)還包括:
[0138] 去重模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處 理。
[0139] 較佳地,所述去重模塊包括:
[0140] 圖像樹建立子模塊,用于建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié) 點設(shè)置為當(dāng)前業(yè)務(wù)對象的圖像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像;
[0141] 圖像樹合并子模塊,用于遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng) 的圖像樹合并到當(dāng)前圖像樹中,消除被合并的圖像樹;
[0142] 圖像樹遍歷子模塊,用于遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
[0143] 本申請實施例公開了一種搜索系統(tǒng),包括:
[0144] 請求接收模塊,用于接收用戶的搜索請求;
[0145] 搜索結(jié)果獲取模塊,用于依據(jù)所述請求,獲取搜索結(jié)果;及
[0146] 搜索結(jié)果合并模塊,用于將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象合并 為同款業(yè)務(wù)對象;
[0147] 其中,所述分類標(biāo)識通過如下子模塊生成:
[0148] 圖像獲取子模塊,用于獲取業(yè)務(wù)對象的圖像;
[0149] 數(shù)字簽名生成子模塊,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0150] 圖像簽名庫建立子模塊,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名 庫;
[0151] 分組劃分子模塊,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分 組;
[0152] 相似度計算子模塊,用于基于所述多個分組計算所述圖像的相似度;
[0153] 圖像集合形成子模塊,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多 個圖像集合;
[0154] 同款業(yè)務(wù)對象合并子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并 為同款業(yè)務(wù)對象;
[0155] 分類標(biāo)識分配子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一 分類標(biāo)識。
[0156] 較佳地,所述數(shù)字簽名生成子模塊包括:
[0157] 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;所述視覺特征包括顏 色特征,和/或,梯度特征,和/或,局部特征;
[0158] 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字 簽名。
[0159] 較佳地,所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色 在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述視覺特征提取子 模塊包括:
[0160] 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0161] 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各 像素點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像 素點的顏色值距離最近的顏色維度;
[0162] 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇 一個或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0163] 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0164] 和 / 或,
[0165] 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括:
[0166] 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行 平滑;
[0167] 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯 度方向直方圖;
[0168] 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為 當(dāng)前圖像的梯度特征;
[0169] 和 / 或,
[0170] 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括:
[0171] 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征 占.
[0172] 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于 預(yù)設(shè)第一門限值的特征點拼接成所述圖像的局部特征。
[0173] 較佳地,所述搜索結(jié)果合并模塊還包括:
[0174] 去重子模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重 處理。
[0175] 與【背景技術(shù)】相比,本申請實施例包括以下優(yōu)點:
[0176] 本申請實施例提出了基于業(yè)務(wù)對象的圖像內(nèi)容生成對應(yīng)數(shù)字簽名的方案,該方案 通過提取圖像中的一些顯著的視覺特征,形成一定復(fù)雜度的信息組合,完成對圖像內(nèi)容的 抽象描述,生成具有代表性的作為該圖像的鑒別標(biāo)識;同時,根據(jù)所提取的視覺特征,制定 相對應(yīng)的驗證規(guī)則來判別不同簽名間的重復(fù)度,識別正確率高,根據(jù)簽名的匹配程度,將內(nèi) 容相同或相似的圖像聚合在一起,并進(jìn)一步將同款業(yè)務(wù)對象聚合在一起,自動聚合,可行性 商。
[0177] 本申請實施例還提出了一種層次聚合方法。首先,根據(jù)圖像視覺特征對待聚合的 圖像進(jìn)行分組,進(jìn)行圖像匹配時,對一張圖像而言,只會將當(dāng)前分組中和相鄰分組中的圖 像進(jìn)行比較,極大的降低了圖像匹配的次數(shù);其次,進(jìn)行圖像匹配時,設(shè)計合理的層級處理 結(jié)構(gòu),按計算復(fù)雜性的大小,先易后難,即先考察相對簡單的顏色,然后是復(fù)雜程度中等的 梯度特征,最后是較復(fù)雜的局部特征,逐層過濾相關(guān)度低的候選圖像,最終精準(zhǔn)定位內(nèi)容相 同或相似的圖像,聚合生成同款業(yè)務(wù)對象的圖像集合。本申請實施例運算量小,適用于大規(guī) 模業(yè)務(wù)對象數(shù)據(jù)的處理,聚合效率高。
[0178] 對所有同款業(yè)務(wù)對象的圖像集合再次進(jìn)行聚合,根據(jù)同款業(yè)務(wù)對象的圖像集合之 間的相關(guān)性生成最終的同款業(yè)務(wù)對象的圖像聚合結(jié)果,去除重復(fù)的業(yè)務(wù)對象的圖像,減少 數(shù)據(jù)冗余。
【專利附圖】
【附圖說明】
[0179] 圖1示出了本申請的一種同款業(yè)務(wù)對象聚合的方法實施例1的步驟流程圖;
[0180] 圖2示出了本申請的一種同款業(yè)務(wù)對象聚合的方法實施例2的步驟流程圖;
[0181] 圖3示出了本申請的一種搜索方法實施例的步驟流程圖;
[0182] 圖4示出了本申請的一種同款業(yè)務(wù)對象聚合的系統(tǒng)實施例的結(jié)構(gòu)框圖;
[0183] 圖5示出了本申請的一種搜索系統(tǒng)實施例的結(jié)構(gòu)框圖。
【具體實施方式】
[0184] 為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本申請作進(jìn)一步詳細(xì)的說明。
[0185] 本申請實施例的核心構(gòu)思之一在于,提出一種反映圖像內(nèi)容的數(shù)字簽名及對應(yīng)的 驗證規(guī)則,以便在進(jìn)行搜索的時候,可以基于這個數(shù)字簽名進(jìn)行同款業(yè)務(wù)對象的快速準(zhǔn)確 的聚合。
[0186] 參照圖1,示出了本申請的一種同款業(yè)務(wù)對象聚合的方法實施例1的步驟流程圖, 具體可以包括如下步驟:
[0187] 步驟101,獲取業(yè)務(wù)對象的圖像;
[0188] 需要說明的是,本申請實施例中的業(yè)務(wù)對象可以包括不同業(yè)務(wù)領(lǐng)域的具體事物。
[0189] 為使本領(lǐng)域技術(shù)人員更好地理解本申請實施例,在本說明書中,將商品作為業(yè)務(wù) 對象的一種示例進(jìn)行說明。
[0190] 具體實現(xiàn)中,本申請實施例中的商品可以是由一個或多個網(wǎng)站主所展示的一款或 多款商品,所述商品的信息中可以包括一個或多個商品屬性,例如商品圖像、商品名稱、商 品價格、商品描述、商品的型號、或商品的參數(shù)等。所謂同款商品,可以是由同一或不同網(wǎng)站 主所展示的商品屬性完全或幾乎相同的商品。
[0191] 步驟102,根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0192] 在本申請的一個優(yōu)選實施例中,所述步驟102具體可以包括如下子步驟:
[0193] 子步驟S11,分別提取所述圖像的視覺特征;所述視覺特征可以包括顏色特征,和 /或,梯度特征,和/或,局部特征;
[0194] 子步驟S12,將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
[0195] 可以理解,所謂視覺特征,可以是具有直觀意義的圖像的形狀與顏色等特征,則對 應(yīng)生成的數(shù)字簽名可以表征圖像的內(nèi)容。
[0196] 在本申請實施例的一個優(yōu)選示例中,所述顏色特征包括針對每張圖像的一個或多 個主顏色,以及,所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特 征時,所述子步驟S11具體可以包括如下子步驟:
[0197] 子步驟S11-11,獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0198] 例如,在紅綠藍(lán)RGB顏色空間中,一個像素點具有紅R、綠G、藍(lán)B三個顏色通道,每 種顏色的存儲格式都是8位二位制數(shù),即每個顏色通道就有2~8=256種亮度,一個像素點就 有256*256*256種顏色維度。由于維度太多,實際應(yīng)用中難以統(tǒng)計分析,實用性低,因此需 要減少顏色維度。原本默認(rèn)顏色通道的亮度步進(jìn)為1,假設(shè)現(xiàn)在選擇亮度步進(jìn)為16,每個顏 色通道就有16種亮度,一個像素也就有16*16*16種顏色維度。
[0199] 子步驟S11-12,遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色 值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值 距離最近的顏色維度;
[0200] 需要說明的是,所述的距離,可以包括但不限于歐氏距離。假如一個圖像像素點的 顏色值為(130,234,111),那么其與均勻量化后顏色維度的歐式距離d=sqrt((130_R) ~2+( 234-6Γ2+(111-Β)~2),通過計算可以得到與其最近的顏色維度。
[0201] 子步驟S11-13,統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多 個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0202] 在本實施例的一個優(yōu)選示例中,選取6個像素點個數(shù)最多的顏色維度作為當(dāng)前圖 像的主顏色。
[0203] 子步驟S11-14,獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù)。
[0204] 在具體實現(xiàn)中,根據(jù)所述主顏色及其對應(yīng)的像素點個數(shù)生成顏色特征的方法并不 唯一,本申請實施例對此不加以限制。
[0205] 所述顏色特征可以描述當(dāng)前圖像的顏色分布。由于顏色特征主要是起到一個粗篩 的作用,所以務(wù)求在業(yè)務(wù)對象圖像的處理過程中盡可能快捷,只需表征圖像內(nèi)容的大致信 息即可。
[0206] 在本申請的一個優(yōu)選實施例中,當(dāng)所述視覺特征包括梯度特征時,所述子步驟S11 具體還可以包括如下子步驟:
[0207] 子步驟S11-21,將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑;
[0208] 在具體實現(xiàn)中,可以去除圖像的噪聲影響;所述進(jìn)行平滑,可以包括但不限于使用 高斯平滑進(jìn)行平滑處理。
[0209] 子步驟S11-22,依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖;
[0210] 在本實施例的一個優(yōu)選示例中,所述子步驟S11-22進(jìn)一步可以包括如下子步驟:
[0211] 子步驟C1,針對平滑后的灰度圖像,計算每一像素點的梯度方向和梯度幅值;
[0212] 在具體實現(xiàn)中,可以包括但不限于使用一階差分計算每一像素點的梯度方向和梯 度幅值。
[0213] 子步驟C2,對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯度方向為橫軸的直 方圖;
[0214] 在具體實現(xiàn)中,梯度方向可以取0°到180°,也可以取0°到360°。
[0215] 子步驟C3,遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方向找出最接 近的兩個方向角度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系數(shù);
[0216] 子步驟C4,遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方向找出最接 近的兩個方向角度對應(yīng)的直方圖bin,并根據(jù)接近程度從高到低分配權(quán)重系數(shù);
[0217] 在具體實現(xiàn)中,所述兩個權(quán)重系數(shù)的和可以為1。
[0218] 子步驟C5,將將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最接近的兩 個方向角度對應(yīng)的直方圖組距中;
[0219] 在具體實現(xiàn)中,子步驟C4和C5是為了模糊不同直方圖bin之間的邊界效應(yīng)。
[0220] 子步驟C6,進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
[0221] 在具體實現(xiàn)中,對當(dāng)前圖像中所有像素點進(jìn)行C4和C5操作后,執(zhí)行子步驟C6。
[0222] 子步驟S11-23,采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的 梯度特征;
[0223] 在具體實現(xiàn)中,所述生成梯度特征的方法并不唯一,本申請實施例對此不加以限 制。
[0224] 在本申請的一個優(yōu)選實施例中,當(dāng)所述視覺特征包括局部特征時,所述子步驟S11 具體還可以包括如下子步驟:
[0225] 子步驟S11-31,提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點;
[0226] 在具體實現(xiàn)中,可以采用尺度不變特征轉(zhuǎn)換SIFT作為局部描述子來描述圖像的 局部特征。需要說明的是,對于本領(lǐng)域技術(shù)人員而言,利用SIFT方法計算得到圖像中具有 旋轉(zhuǎn)不變性和尺度不變性的特征點(即關(guān)鍵點),屬于公知技術(shù),本申請實施例在此不作詳 細(xì)說明。SIFT特征點的數(shù)量可由本領(lǐng)域技術(shù)人員根據(jù)實際情況進(jìn)行設(shè)定,本申請實施例對 此不加以限制。
[0227] 在本實施例的一個優(yōu)選示例中,可以以每個關(guān)鍵點為中心,選取四周的64個像素 點,每相鄰的4個像素為一像素組,共得到16個像素組,每個像素組再與關(guān)鍵點比較得到8 個坐標(biāo)值,共得到128個坐標(biāo)值,為該關(guān)鍵點的SIFT特征。SIFT特征從理論上來說是一種 相似不變量,對縮放、位移、旋轉(zhuǎn)都不敏感,使得SIFT特征對圖像的諸多變化具有了較強的 適應(yīng)性。
[0228] 特征提取可以分為檢測和描述兩個階段,以SIFT為例,SIFT特征點即特征檢測的 結(jié)果,而上述128個坐標(biāo)值的特征即為其對應(yīng)SIFT特征點的描述。
[0229] 子步驟S11-32,計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門 限值的特征點拼接成所述圖像的局部特征。
[0230] 在本實施例的一個優(yōu)選示例中,可以包括但不限于采取剪枝方法對SIFT特征點 進(jìn)行選擇。
[0231] 在本實施例的另一個優(yōu)選示例中,所述第一預(yù)設(shè)門限值為100。
[0232] 局部特征抗干擾能力強,可以用于精準(zhǔn)匹配。
[0233] 在具體實現(xiàn)中,所述根據(jù)特征點拼接生成局部特征的方法并不唯一,本申請實施 例對此不加以限制。
[0234] 當(dāng)然,上述提取圖像視覺特征的方法只是作為示例,在實施本申請實施例時,可以 根據(jù)實際情況設(shè)置其他提取圖像視覺特征的方法,本申請實施例對此不加以限制。另外,除 了上述提取圖像視覺特征的方法外,本領(lǐng)域技術(shù)人員還可以實際需要采用其它提取圖像視 覺特征的方法,本申請實施例對此也不加以限制。
[0235] 采用圖像視覺特征生成對應(yīng)的數(shù)字簽名的方式可由本領(lǐng)域技術(shù)人員根據(jù)實際情 況進(jìn)行設(shè)定,可以是一個字符串,將顏色特征、梯度特征和局部特征中的一個或多個合并在 一起,一張圖像對應(yīng)一個字符串,也可以用二進(jìn)制文件的方式存儲數(shù)字簽名,本申請實施例 對此不加以限制。
[0236] 步驟103,采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;
[0237] 在具體實現(xiàn)中,本申請實施例可以定時或不定時獲取新的商品信息,基于商品對 應(yīng)的圖像生成對應(yīng)的數(shù)字簽名,添加到所述圖像簽名庫中,本申請實施例對此不加以限制。
[0238] 步驟104,依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組;
[0239] 需要說明的是,進(jìn)行分組的圖像可以是圖像簽名庫里的全部圖像,也可以是圖像 簽名庫里的部分圖像,本申請實施例對此不加以限制。
[0240] 在本申請的一個優(yōu)選實施例中,所述步驟104具體可以包括如下子步驟:
[0241] 子步驟S21,提取所述圖像的數(shù)字簽名中的顏色特征;
[0242] 需要說明的是,解析圖像的數(shù)字簽名的方法可以是與生成業(yè)務(wù)對象圖像的數(shù)字簽 名的方法相對應(yīng)的。
[0243] 子步驟S22,從所述顏色特征中提取分組主顏色;其中,所述分組主顏色包括最多 像素點個數(shù)對應(yīng)的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng)的主顏色的 像素點數(shù)量占所述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限值時,所選 取的對應(yīng)像素點個數(shù)次多的主顏色;
[0244] 需要說明的是,次多可以是僅次于最多。
[0245] 在本實施例的一個優(yōu)選示例中,所述第二預(yù)設(shè)門限值為0. 6?0. 8中的任一值。
[0246] 子步驟S23,按照所述分組主顏色將所述圖像劃分為多個分組,同一分組中圖像的 分組主顏色相同。
[0247] 對圖像進(jìn)行分組,是對圖像聚合的一個初步篩選,可以大大減少圖像聚合過程中 的數(shù)據(jù)處理量。
[0248] 步驟105,基于所述多個分組計算所述圖像的相似度;
[0249] 在本申請的一個優(yōu)選實施例中,所述步驟105具體可以包括如下子步驟:
[0250] 子步驟S31,確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng)前圖像所在 的分組,所述相鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一個或多個;
[0251] 可以理解,分組之間可以存在著排序的關(guān)系,分組越靠近,分組主顏色的相似度可 以越高,而相鄰分組間的分組主顏色相似度可以是最高的。
[0252] 子步驟S32,針對每張圖像,計算其顏色特征與其對應(yīng)的主分組及相鄰分組中其它 圖像的顏色特征的相似度;
[0253] 可以理解,計算其中一張圖像與其他圖像的相似度,可以是計算所述圖像與其所 在分組的其他圖像的相似度、及所述圖像與其他分組的圖像的相似度。
[0254] 在本實施例的一個優(yōu)選示例中,選擇一個相鄰分組進(jìn)行圖像相似度的計算。
[0255] 子步驟S33,在所述主分組及相鄰分組中去除所述顏色特征的相似度小于第三預(yù) 設(shè)門限值的圖像;
[0256] 去除可以代表所述的圖像之間不存在相似度。
[0257] 在本實施例的一個優(yōu)選示例中,所述第三預(yù)設(shè)門限值為0. 875。
[0258] 子步驟S34,針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組及相鄰分組中剩余 圖像的梯度特征的相似度;
[0259] 子步驟S35,在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征的相似度小于 第四預(yù)設(shè)門限值的圖像;
[0260] 在本實施例的一個優(yōu)選示例中,所述第四預(yù)設(shè)門限值為0. 925。
[0261] 子步驟S36,針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組及相鄰分組中最后 剩余的圖像的局部特征的相似度;
[0262] 子步驟S37,將所述當(dāng)前圖像與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像的 局部特征的相似度作為所述圖像的相似度。
[0263] 步驟106,按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;
[0264] 在本申請的一個優(yōu)選實施例中,所述步驟106具體可以包括如下子步驟:
[0265] 子步驟S41,若所述圖像的相似度高于第五預(yù)設(shè)門限值,則將所述圖像放入同一圖 像集合。
[0266] 在本實施例的一個優(yōu)選不例中,所述第五預(yù)設(shè)門限值為〇. 95。
[0267] 聚合后的結(jié)果,可以是每一張圖像都會得到一個對應(yīng)的圖像集合。所述圖像集合 里面的圖像與當(dāng)前圖像在內(nèi)容上實質(zhì)相同。
[0268] 步驟107,將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象。
[0269] 本申請實施例中,可以將同一圖像集合的圖像對應(yīng)的商品合并為同款商品。
[0270] 參照圖2,示出了本申請的一種同款業(yè)務(wù)對象聚合的方法實施例2的步驟流程圖, 具體可以包括如下步驟:
[0271] 步驟201,獲取業(yè)務(wù)對象的圖像;
[0272] 步驟202,根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0273] 步驟203,采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;
[0274] 步驟204,依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組;
[0275] 步驟205,基于所述多個分組計算所述圖像的相似度;
[0276] 步驟206,按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;
[0277] 步驟207,將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理;
[0278] 步驟208,將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象。
[0279] 本申請實施例中,所述商品經(jīng)過聚合后,對于每張商品圖像,都可以得到一個與所 述圖像對應(yīng)的圖像集合,所述集合里的圖像在內(nèi)容實質(zhì)上一樣。但是在聚合結(jié)果中,不可避 免會出現(xiàn)同一商品的圖像出現(xiàn)在多個圖像集合中,為了減少數(shù)據(jù)冗余,需要對所有圖像集 合進(jìn)行去除重復(fù)商品圖像的處理。
[0280] 在本申請的一個優(yōu)選實施例中,所述步驟207具體可以包括如下子步驟:
[0281] 子步驟S51,建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié)點設(shè)置為當(dāng)前 業(yè)務(wù)對象的圖像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像;
[0282] 子步驟S52,遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng)的圖像樹合并 到當(dāng)前圖像樹中,消除被合并的圖像樹;
[0283] 子步驟S53,遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
[0284] 例如,商品圖像M0的圖像集合包括圖像M1、M2和M3,分別建立M0、M1、M2、M3對應(yīng) 的圖像樹!'0、1'1、了2、了3,其中1'0、1'1、了2、了3的根節(jié)點分別為勵、]?1、]\12、]\0,1'0的葉子節(jié)點 分別為Ml、M2和M3。遍歷T0的葉子節(jié)點,Ml、M2和M3對應(yīng)的圖像樹ΤΙ、T2和T3合并到 T0,即ΤΙ、T2、T3根節(jié)點以下的所有葉子節(jié)點連接到T0,結(jié)構(gòu)保持不變,ΤΙ、T2、T3被刪除。
[0285] 本申請實施例中,對所有的圖像樹進(jìn)行上述操作,直到所有圖像樹都處理完畢。完 成去除重復(fù)業(yè)務(wù)對象圖像處理后剩下的每一棵圖像樹,對應(yīng)一個最終的同款商品的圖像集 合,即內(nèi)容實質(zhì)上相同的圖像的集合只剩下一個,對應(yīng)的同款商品的集合也只剩下一個。
[0286] 參見圖3,示出了本申請的一種搜索方法實施例的步驟流程圖,具體可以包括如下 步驟:
[0287] 步驟301,接收用戶的搜索請求;
[0288] 步驟302,依據(jù)所述請求,獲取搜索結(jié)果;及
[0289] 步驟303,將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象合并為同款業(yè)務(wù)對 象;
[0290] 其中,所述分類標(biāo)識的生成方法具體可以包括如下子步驟:
[0291] 子步驟S61,獲取業(yè)務(wù)對象的圖像;
[0292] 子步驟S62,根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0293] 子步驟S63,采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;依據(jù)所述數(shù)字 簽名將圖像簽名庫中的圖像劃分為多個分組;
[0294] 子步驟S64,基于所述多個分組計算圖像的相似度;
[0295] 子步驟S65,按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合;
[0296] 子步驟S66,將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一分類標(biāo)識。
[0297] 在本申請的一個優(yōu)選實施例中,所述子步驟S62進(jìn)一步可以包括如下子步驟:
[0298] 子步驟S62-1,分別提取所述圖像的視覺特征;所述視覺特征包括顏色特征,和/ 或,梯度特征,和/或,局部特征;
[0299] 子步驟S62-2,將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
[0300] 在本申請實施例的一個優(yōu)選示例中,所述顏色特征包括針對每張圖像的一個或多 個主顏色,以及,所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特 征時,所述子步驟S62-1具體可以包括如下子步驟:
[0301] 子步驟D1,獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0302] 子步驟D2,遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色值歸 屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值距離 最近的顏色維度;
[0303] 子步驟D3,統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多個像 素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0304] 子步驟D4,獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0305] 在本申請實施例的一個優(yōu)選示例中,當(dāng)所述視覺特征包括梯度特征時,所述子步 驟S62-1具體還可以包括如下子步驟:
[0306] 子步驟E1,將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑;
[0307] 子步驟E2,依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖;
[0308] 子步驟E3,采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的梯度 特征;
[0309] 在本申請實施例的一個優(yōu)選示例中,當(dāng)所述視覺特征包括局部特征時,所述子步 驟S62-1具體還可以包括如下子步驟:
[0310] 子步驟F1,提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點;
[0311] 子步驟F2,計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門限值 的特征點拼接成所述圖像的局部特征。
[0312] 在本申請的一個優(yōu)選實施例中,所述分類標(biāo)識的生成方法具體還可以包括如下子 步驟:
[0313] 子步驟G1,將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
[0314] 在具體實現(xiàn)中,根據(jù)用戶搜索商品請求,進(jìn)行搜索,會得到一個傳統(tǒng)的商品搜索結(jié) 果,即同款商品可能會被展現(xiàn)多次。本申請實施例可以基于此結(jié)果對所述商品圖像進(jìn)行聚 合,將商品搜索結(jié)果中同款商品合并為一個搜索結(jié)果展示給用戶。無論是相同的網(wǎng)站主,還 是不同的網(wǎng)站主提供的商品,只要是同款商品,都會被聚合在一起,在搜索結(jié)果里做一次展 現(xiàn),如果用戶需要了解有哪些網(wǎng)站主提供這件商品的,則可以選擇所述商品再去聚合結(jié)果 內(nèi)部查詢。
[0315] 可以理解,不同的商品圖像集合可以有不同的分類標(biāo)識,商品圖像集合里的所有 商品圖像的分類標(biāo)識可以是統(tǒng)一的。在為商品圖像集合里的商品圖像配置統(tǒng)一的分類標(biāo)識 后,再次接收用戶的搜索商品請求進(jìn)行搜索,并得到傳統(tǒng)的搜索結(jié)果后,可以通過辨識商品 圖像的分類標(biāo)識,能快速將標(biāo)識相同的商品圖像聚合為同款商品集合,而不用再根據(jù)其數(shù) 字簽名進(jìn)行聚合,節(jié)省了系統(tǒng)資源和縮小了聚合時間。
[0316] 此外,本申請實施例還可以依據(jù)預(yù)設(shè)的時間規(guī)則對新添加的商品進(jìn)行聚合,將其 歸入相應(yīng)的同款商品集合,并配置相應(yīng)的標(biāo)識。
[0317] 其中,所述時間規(guī)則可由本領(lǐng)域技術(shù)人員根據(jù)實際情況進(jìn)行設(shè)定,可以是不定時 對新添加的業(yè)務(wù)對象進(jìn)行聚合,例如在夜晚等繁忙時段每2小時對新添加的業(yè)務(wù)對象進(jìn)行 聚合、而在凌晨等空閑時段每6小時對新添加的業(yè)務(wù)對象進(jìn)行聚合,也可以是周期性的對 新添加的業(yè)務(wù)對象進(jìn)行聚合等等,本申請實施例對此不加以限制。
[0318] 對于本申請實施例而言,由于獲取分類標(biāo)識的方法實施例與同款業(yè)務(wù)對象聚合的 方法實施例基本相似,本申請實施例在此不再詳述,相關(guān)之處參見同款業(yè)務(wù)對象聚合的方 法實施例的部分說明即可。
[0319] 可以理解,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合, 但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請實施例并不受所描述的動作順序的限制,因為依據(jù) 本申請實施例,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請 實施例所必須的。
[0320] 參照圖4,示出了本申請實施例的一種同款同款業(yè)務(wù)聚合的系統(tǒng)實施例的結(jié)構(gòu)框 圖,具體可以包括以下模塊:
[0321] 圖像獲取模塊401,用于獲取業(yè)務(wù)對象的圖像;
[0322] 數(shù)字簽名生成模塊402,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽 名;
[0323] 圖像簽名庫建立模塊403,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名 庫;
[0324] 分組劃分模塊404,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分 組;
[0325] 相似度計算模塊405,用于基于所述多個分組計算所述圖像的相似度;
[0326] 圖像集合形成模塊406,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多 個圖像集合;
[0327] 同款業(yè)務(wù)對象合并模塊407,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合 并為同款業(yè)務(wù)對象。
[0328] 在本申請的一個優(yōu)選實施例中,所述數(shù)字簽名生成模塊包括:所述視覺特征包括 顏色特征,和/或,梯度特征,和/或,局部特征;
[0329] 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;
[0330] 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字 簽名。
[0331] 在本申請的一個優(yōu)選實施例中,所述顏色特征包括針對每張圖像的一個或多個主 顏色,以及,所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征 時,所述視覺特征提取子模塊包括:
[0332] 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0333] 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各 像素點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像 素點的顏色值距離最近的顏色維度;
[0334] 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇 一個或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0335] 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0336] 和 / 或,
[0337] 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括:
[0338] 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行 平滑;
[0339] 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯 度方向直方圖;
[0340] 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為 當(dāng)前圖像的梯度特征;
[0341] 和 / 或,
[0342] 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括:
[0343] 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征 占.
[0344] 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于 預(yù)設(shè)第一門限值的特征點拼接成所述圖像的局部特征。
[0345] 在本申請的一個優(yōu)選實施例中,所述梯度方向直方圖計算子模塊進(jìn)一步包括:
[0346] 梯度方向和梯度幅值計算子模塊,用于針對平滑后的灰度圖像,計算每一像素點 的梯度方向和梯度幅值;
[0347] 第一直方圖生成子模塊,用于對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯 度方向為橫軸的直方圖;
[0348] 第二直方圖生成子模塊,用于將所述當(dāng)前圖像的梯度方向平均分成R個方向角 度,生成R個方向角度分別對應(yīng)的R個直方圖組距;其中,所述R為正整數(shù);
[0349] 權(quán)重分配子模塊,用于遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方 向找出最接近的兩個方向角度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系 數(shù);
[0350] 權(quán)重累加子模塊,用于將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最 接近的兩個方向角度對應(yīng)的直方圖組距中;
[0351] 梯度方向直方圖生成子模塊,用于進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
[0352] 在本申請的一個優(yōu)選實施例中,所述分組劃分模塊包括:
[0353] 顏色特征提取子模塊,用于提取所述圖像的數(shù)字簽名中的顏色特征;
[0354] 主顏色選取子模塊,用于從所述顏色特征中提取分組主顏色;其中,所述分組主顏 色包括最多像素點個數(shù)對應(yīng)的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng) 的主顏色的像素點數(shù)量占所述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限 值時,所選取的對應(yīng)像素點個數(shù)次多的主顏色;
[0355] 圖像分組子模塊,用于按照所述分組主顏色將所述圖像劃分為多個分組,同一分 組中圖像的分組主顏色相同。
[0356] 在本申請的一個優(yōu)選實施例中,所述相似度計算模塊包括:
[0357] 分組確定子模塊,用于確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng) 前圖像所在的分組,所述相鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一 個或多個;
[0358] 第一相似度計算子模塊,用于針對每張圖像,計算其顏色特征與其對應(yīng)的主分組 及相鄰分組中其它圖像的顏色特征的相似度;
[0359] 第一圖像去除子模塊,用于在所述主分組及相鄰分組中去除所述顏色特征的相似 度小于第三預(yù)設(shè)門限值的圖像;
[0360] 第二相似度計算子模塊,用于針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組 及相鄰分組中剩余圖像的梯度特征的相似度;
[0361] 第二圖像去除子模塊,用于在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征 的相似度小于第四預(yù)設(shè)門限值的圖像;
[0362] 第三相似度計算子模塊,用于針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組 及相鄰分組中最后剩余的圖像的局部特征的相似度;相似度確定子模塊,用于將所述當(dāng)前 圖像與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像的局部特征的相似度作為所述圖像 的相似度。
[0363] 在本申請的一個優(yōu)選實施例中,所述圖像集合形成模塊包括:
[0364] 圖像放入子模塊,用于當(dāng)所述圖像的相似度高于第五預(yù)設(shè)門限值時,將所述圖像 放入同一圖像集合。
[0365] 在本申請的一個優(yōu)選實施例中,所述的系統(tǒng)還包括:
[0366] 去重模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處 理。
[0367] 在本申請的一個優(yōu)選實施例中,所述去重模塊包括:
[0368] 圖像樹建立子模塊,用于建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié) 點設(shè)置為當(dāng)前業(yè)務(wù)對象的圖像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像;
[0369] 圖像樹合并子模塊,用于遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng) 的圖像樹合并到當(dāng)前圖像樹中,消除被合并的圖像樹;
[0370] 圖像樹遍歷子模塊,用于遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
[0371] 可以理解,對于同款業(yè)務(wù)對象聚合的系統(tǒng)實施例而言,由于其與同款同款業(yè)務(wù)聚 合的方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見同款同款業(yè)務(wù)聚合的方法 實施例的部分說明即可。
[0372] 參見圖5,示出了本申請的一種搜索系統(tǒng)實施例的結(jié)構(gòu)框圖,具體可以包括如下模 塊:
[0373] 請求接收模塊501,用于接收用戶的搜索請求;
[0374] 搜索結(jié)果獲取模塊502,用于依據(jù)所述請求,獲取搜索結(jié)果;及
[0375] 搜索結(jié)果合并模塊503,用于將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象 合并為同款業(yè)務(wù)對象;
[0376] 其中,所述分類標(biāo)識通過如下子模塊生成:
[0377] 圖像獲取子模塊,用于獲取業(yè)務(wù)對象的圖像;
[0378] 數(shù)字簽名生成子模塊,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名;
[0379] 圖像簽名庫建立子模塊,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名 庫;
[0380] 分組劃分子模塊,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分 組;
[0381] 相似度計算子模塊,用于基于所述多個分組計算所述圖像的相似度;
[0382] 圖像集合形成子模塊,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多 個圖像集合;
[0383] 同款業(yè)務(wù)對象合并子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并 為同款業(yè)務(wù)對象;
[0384] 分類標(biāo)識分配子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一 分類標(biāo)識。
[0385] 在本申請的一個優(yōu)選實施例中,所述數(shù)字簽名生成子模塊包括:
[0386] 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;所述視覺特征包括顏 色特征,和/或,梯度特征,和/或,局部特征;
[0387] 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字 簽名。
[0388] 在本申請的一個優(yōu)選實施例中,所述顏色特征包括針對每張圖像的一個或多個主 顏色,以及,所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征 時,所述視覺特征提取子模塊包括:
[0389] 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度;
[0390] 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各 像素點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像 素點的顏色值距離最近的顏色維度;
[0391] 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇 一個或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色;
[0392] 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù);
[0393] 和 / 或,
[0394] 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括:
[0395] 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行 平滑;
[0396] 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯 度方向直方圖;
[0397] 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為 當(dāng)前圖像的梯度特征;
[0398] 和 / 或,
[0399] 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括:
[0400] 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征 占 .
[0401] 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于 預(yù)設(shè)第一門限值的特征點拼接成所述圖像的局部特征。
[0402] 在本申請的一個優(yōu)選實施例中,所述搜索結(jié)果合并模塊還包括:
[0403] 去重子模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重 處理。
[0404] 可以理解,對于搜索系統(tǒng)實施例而言,由于其與搜索方法實施例基本相似,所以描 述的比較簡單,相關(guān)之處參見搜索方法實施例的部分說明即可。
[0405] 本說明書中的各個實施例均采用遞進(jìn)的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0406] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請實施例的實施例可提供為方法、系統(tǒng)、或計算 機程序產(chǎn)品。因此,本申請實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和 硬件方面的實施例的形式。而且,本申請實施例可采用在一個或多個其中包含有計算機可 用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上 實施的計算機程序產(chǎn)品的形式。
[0407] 在一個典型的配置中,所述計算機設(shè)備包括一個或多個處理器(CPU)、輸入/輸出 接口、網(wǎng)絡(luò)接口和內(nèi)存。內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲 器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是 計算機可讀介質(zhì)的示例。計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體 可以由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模 塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機存取 存儲器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲 器(ROM)、電可擦除可編程只讀存儲器(EEPR0M)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只 讀存儲器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲 或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設(shè)備訪問的信息。按 照本文中的界定,計算機可讀介質(zhì)不包括非持續(xù)性的電腦可讀媒體(transitory media), 如調(diào)制的數(shù)據(jù)信號和載波。
[0408] 本申請實施例是參照根據(jù)本申請實施例的方法、終端設(shè)備(系統(tǒng))、和計算機程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框 圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商?供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理 終端設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處 理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多 個方框中指定的功能的裝置。
[0409] 這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備 以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方 框或多個方框中指定的功能。
[0410] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在 計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程 和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0411] 盡管已描述了本申請實施例的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為 包括優(yōu)選實施例以及落入本申請實施例范圍的所有變更和修改。
[0412] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作 之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體 意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅 包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物 品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句"包括一個......"限定 的要素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要 素。
[0413] 以上對本申請所提供的一種同款業(yè)務(wù)對象聚合的方法、一種同款業(yè)務(wù)對象聚合的 系統(tǒng)、一種搜索方法和一種搜索系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的 原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心 思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在【具體實施方式】及應(yīng)用范圍 上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。
【權(quán)利要求】
1. 一種同款業(yè)務(wù)對象聚合的方法,其特征在于,包括: 獲取業(yè)務(wù)對象的圖像; 根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名; 采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫; 依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組; 基于所述多個分組計算所述圖像的相似度; 按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合; 將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)圖像的視覺特征生成所述圖像 的數(shù)字簽名的步驟包括: 分別提取所述圖像的視覺特征;所述視覺特征包括顏色特征,和/或,梯度特征,和/ 或,局部特征; 將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色在當(dāng)前圖像 中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述分別提取圖像的視覺特征的 步驟包括: 獲得在預(yù)設(shè)顏色空間中量化的顏色維度; 遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色值歸屬的顏色維度; 其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值距離最近的顏色維 度; 統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多個像素點個數(shù)最多的 顏色維度作為當(dāng)前圖像的主顏色; 獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù); 和/或, 當(dāng)所述視覺特征包括梯度特征時,所述分別提取圖像的視覺特征的步驟包括: 將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑; 依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖; 采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的梯度特征; 和/或, 當(dāng)所述視覺特征包括局部特征時,所述分別提取圖像的視覺特征的步驟包括: 提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點; 計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門限值的特征點拼接成 所述圖像的局部特征。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述依據(jù)平滑后的灰度圖像計算所述圖 像的梯度方向直方圖的子步驟進(jìn)一步包括: 針對平滑后的灰度圖像,計算每一像素點的梯度方向和梯度幅值; 對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯度方向為橫軸的直方圖; 將所述當(dāng)前圖像的梯度方向平均分成R個方向角度,生成R個方向角度分別對應(yīng)的R 個直方圖組距;其中,所述R為正整數(shù); 遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方向找出最接近的兩個方向角 度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系數(shù); 將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最接近的兩個方向角度對應(yīng) 的直方圖組距中; 進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述依據(jù)數(shù)字簽名將圖像簽名庫中的 圖像劃分為多個分組的步驟包括: 提取所述圖像的數(shù)字簽名中的顏色特征; 從所述顏色特征中提取分組主顏色;其中,所述分組主顏色包括最多像素點個數(shù)對應(yīng) 的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng)的主顏色的像素點數(shù)量占所 述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限值時,所選取的對應(yīng)像素點 個數(shù)次多的主顏色; 按照所述分組主顏色將所述圖像劃分為多個分組,同一分組中圖像的分組主顏色相 同。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于多個分組計算所述圖像的相似 度的步驟包括: 確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng)前圖像所在的分組,所述相 鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一個或多個; 針對每張圖像,計算其顏色特征與其對應(yīng)的主分組及相鄰分組中其它圖像的顏色特征 的相似度; 在所述主分組及相鄰分組中去除所述顏色特征的相似度小于第三預(yù)設(shè)門限值的圖 像; 針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組及相鄰分組中剩余圖像的梯度特征 的相似度; 在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征的相似度小于第四預(yù)設(shè)門限值 的圖像; 針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像的局 部特征的相似度; 將所述當(dāng)前圖像與其對應(yīng)的主分組及相鄰分組中最后剩余的圖像的局部特征的相似 度作為所述圖像的相似度。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述按照所述相似度對所述圖像進(jìn)行聚 類,形成一個或多個圖像集合的步驟包括: 若所述圖像的相似度高于第五預(yù)設(shè)門限值,則將所述圖像放入同一圖像集合。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的方法還包括: 將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述將同時出現(xiàn)在多個圖像集合中的同 一業(yè)務(wù)對象的圖像進(jìn)行去重處理的步驟包括: 建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié)點設(shè)置為當(dāng)前業(yè)務(wù)對象的圖 像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像; 遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng)的圖像樹合并到當(dāng)前圖像樹 中,消除被合并的圖像樹; 遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
10. -種搜索方法,其特征在于,包括: 接收用戶的搜索請求; 依據(jù)所述請求,獲取搜索結(jié)果;及 將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象合并為同款業(yè)務(wù)對象; 其中,所述分類標(biāo)識的生成方法包括: 獲取業(yè)務(wù)對象的圖像; 根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名; 采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫;依據(jù)所述數(shù)字簽名將圖像簽名庫 中的圖像劃分為多個分組; 基于所述多個分組計算圖像的相似度; 按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像集合; 將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一分類標(biāo)識。
11. 根據(jù)權(quán)利要求10所述的方法,其特征在于,所述根據(jù)圖像的視覺特征生成所述圖 像的數(shù)字簽名的步驟包括: 分別提取所述圖像的視覺特征;所述視覺特征包括顏色特征,和/或,梯度特征,和/ 或,局部特征; 將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
12. 根據(jù)權(quán)利要求11所述的方法,其特征在于, 所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色在當(dāng)前圖像 中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述分別提取圖像的視覺特征的 步驟包括: 獲得在預(yù)設(shè)顏色空間中量化的顏色維度; 遍歷所述圖像中各像素點的顏色值,查找與所述各像素點的顏色值歸屬的顏色維度; 其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點的顏色值距離最近的顏色維 度; 統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個或多個像素點個數(shù)最多的 顏色維度作為當(dāng)前圖像的主顏色; 獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù); 和/或, 當(dāng)所述視覺特征包括梯度特征時,所述分別提取圖像的視覺特征的步驟包括: 將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平滑; 依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方向直方圖; 采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前圖像的梯度特征; 和/或, 當(dāng)所述視覺特征包括局部特征時,所述分別提取圖像的視覺特征的步驟包括: 提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點; 計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè)第一門限值的特征點拼接成 所述圖像的局部特征。
13. 根據(jù)權(quán)利要求10所述的方法,其特征在于,所述分類標(biāo)識的生成方法還包括: 將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
14. 一種同款業(yè)務(wù)對象聚合的系統(tǒng),其特征在于,包括: 圖像獲取模塊,用于獲取業(yè)務(wù)對象的圖像; 數(shù)字簽名生成模塊,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名; 圖像簽名庫建立模塊,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫; 分組劃分模塊,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組; 相似度計算模塊,用于基于所述多個分組計算所述圖像的相似度; 圖像集合形成模塊,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖像 集合; 同款業(yè)務(wù)對象合并模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同款 業(yè)務(wù)對象。
15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述數(shù)字簽名生成模塊包括: 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;所述視覺特征包括顏色特 征,和/或,梯度特征,和/或,局部特征; 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
16. 根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于, 所述顏色特征包括針對每張圖像的一個或多個主顏色,以及,所述主顏色在當(dāng)前圖像 中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括顏色特征時,所述視覺特征提取子模塊包括: 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度; 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各像素 點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點 的顏色值距離最近的顏色維度; 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個 或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色; 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù); 和/或, 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括: 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平 滑; 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方 向直方圖; 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前 圖像的梯度特征; 和/或, 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括: 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點; 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè) 第一門限值的特征點拼接成所述圖像的局部特征。
17. 根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述梯度方向直方圖計算子模塊進(jìn)一 步包括: 梯度方向和梯度幅值計算子模塊,用于針對平滑后的灰度圖像,計算每一像素點的梯 度方向和梯度幅值; 第一直方圖生成子模塊,用于對當(dāng)前圖像做梯度方向統(tǒng)計,生成當(dāng)前圖像的以梯度方 向為橫軸的直方圖; 第二直方圖生成子模塊,用于將所述當(dāng)前圖像的梯度方向平均分成R個方向角度,生 成R個方向角度分別對應(yīng)的R個直方圖組距;其中,所述R為正整數(shù); 權(quán)重分配子模塊,用于遍歷圖像中的所有像素點,分別根據(jù)每個像素點的梯度方向找 出最接近的兩個方向角度對應(yīng)的直方圖組距,并根據(jù)接近程度從高到低分配權(quán)重系數(shù); 權(quán)重累加子模塊,用于將所述像素點的梯度幅值乘以權(quán)重系數(shù)分別累加至所述最接近 的兩個方向角度對應(yīng)的直方圖組距中; 梯度方向直方圖生成子模塊,用于進(jìn)行歸一化,生成當(dāng)前圖像的梯度方向直方圖。
18. 根據(jù)權(quán)利要求16或17所述的系統(tǒng),其特征在于,所述分組劃分模塊包括: 顏色特征提取子模塊,用于提取所述圖像的數(shù)字簽名中的顏色特征; 主顏色選取子模塊,用于從所述顏色特征中提取分組主顏色;其中,所述分組主顏色 包括最多像素點個數(shù)對應(yīng)的主顏色;和/或,通過計算所述圖像中最多像素點個數(shù)對應(yīng)的 主顏色的像素點數(shù)量占所述圖像所有像素點數(shù)量的比例,在所述比例大于第二預(yù)設(shè)門限值 時,所選取的對應(yīng)像素點個數(shù)次多的主顏色; 圖像分組子模塊,用于按照所述分組主顏色將所述圖像劃分為多個分組,同一分組中 圖像的分組主顏色相同。
19. 根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述相似度計算模塊包括: 分組確定子模塊,用于確定每張圖像對應(yīng)的主分組及相鄰分組,所述主分組為當(dāng)前圖 像所在的分組,所述相鄰分組為與所述主分組相似度最高的分組;所述相鄰分組為一個或 多個; 第一相似度計算子模塊,用于針對每張圖像,計算其顏色特征與其對應(yīng)的主分組及相 鄰分組中其它圖像的顏色特征的相似度; 第一圖像去除子模塊,用于在所述主分組及相鄰分組中去除所述顏色特征的相似度小 于第三預(yù)設(shè)門限值的圖像; 第二相似度計算子模塊,用于針對當(dāng)前圖像,計算其梯度特征與其對應(yīng)的主分組及相 鄰分組中剩余圖像的梯度特征的相似度; 第二圖像去除子模塊,用于在所述主分組及相鄰分組中進(jìn)一步去除所述梯度特征的相 似度小于第四預(yù)設(shè)門限值的圖像; 第三相似度計算子模塊,用于針對當(dāng)前圖像,計算其局部特征與其對應(yīng)的主分組及相 鄰分組中最后剩余的圖像的局部特征的相似度; 相似度確定子模塊,用于將所述當(dāng)前圖像與其對應(yīng)的主分組及相鄰分組中最后剩余的 圖像的局部特征的相似度作為所述圖像的相似度。
20. 根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于,所述圖像集合形成模塊包括: 圖像放入子模塊,用于當(dāng)所述圖像的相似度高于第五預(yù)設(shè)門限值時,將所述圖像放入 同一圖像集合。
21. 根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述的系統(tǒng)還包括: 去重模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處理。
22. 根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述去重模塊包括: 圖像樹建立子模塊,用于建立與每個圖像集合對應(yīng)的圖像樹,所述圖像樹的根節(jié)點設(shè) 置為當(dāng)前業(yè)務(wù)對象的圖像,所述圖像樹的葉子節(jié)點設(shè)置為所述圖像集合的所有圖像; 圖像樹合并子模塊,用于遍歷所述圖像樹的所有葉子節(jié)點,將所有葉子節(jié)點對應(yīng)的圖 像樹合并到當(dāng)前圖像樹中,消除被合并的圖像樹; 圖像樹遍歷子模塊,用于遍歷所有圖像樹,去除所有重復(fù)的業(yè)務(wù)對象的圖像。
23. -種搜索系統(tǒng),其特征在于,包括: 請求接收模塊,用于接收用戶的搜索請求; 搜索結(jié)果獲取模塊,用于依據(jù)所述請求,獲取搜索結(jié)果;及 搜索結(jié)果合并模塊,用于將所述搜索結(jié)果中具有相同的分類標(biāo)識的業(yè)務(wù)對象合并為同 款業(yè)務(wù)對象; 其中,所述分類標(biāo)識通過如下子模塊生成: 圖像獲取子模塊,用于獲取業(yè)務(wù)對象的圖像; 數(shù)字簽名生成子模塊,用于根據(jù)所述圖像的視覺特征生成所述圖像的數(shù)字簽名; 圖像簽名庫建立子模塊,用于采用所述圖像及其對應(yīng)的數(shù)字簽名建立圖像簽名庫; 分組劃分子模塊,用于依據(jù)所述數(shù)字簽名將圖像簽名庫中的圖像劃分為多個分組; 相似度計算子模塊,用于基于所述多個分組計算所述圖像的相似度; 圖像集合形成子模塊,用于按照所述相似度對所述圖像進(jìn)行聚類,形成一個或多個圖 像集合; 同款業(yè)務(wù)對象合并子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象合并為同 款業(yè)務(wù)對象; 分類標(biāo)識分配子模塊,用于將屬于同一圖像集合的圖像對應(yīng)的業(yè)務(wù)對象分配同一分類 標(biāo)識。
24. 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,所述數(shù)字簽名生成子模塊包括: 視覺特征提取子模塊,用于分別提取所述圖像的視覺特征;所述視覺特征包括顏色特 征,和/或,梯度特征,和/或,局部特征; 數(shù)字簽名組合子模塊,用于將所述視覺特征進(jìn)行歸一化,組合為對應(yīng)圖像的數(shù)字簽名。
25. 根據(jù)權(quán)利要求24所述的系統(tǒng),其特征在于,所述顏色特征包括針對每張圖像的一 個或多個主顏色,以及,所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù),當(dāng)所述視覺特征包括 顏色特征時,所述視覺特征提取子模塊包括: 顏色維度獲得子模塊,用于獲得在預(yù)設(shè)顏色空間中量化的顏色維度; 像素點歸屬查找子模塊,用于遍歷所述圖像中各像素點的顏色值,查找與所述各像素 點的顏色值歸屬的顏色維度;其中,所述各像素點的顏色值歸屬的顏色維度為與各像素點 的顏色值距離最近的顏色維度; 主顏色生成子模塊,用于統(tǒng)計各顏色維度在所述圖像中對應(yīng)的像素點個數(shù),選擇一個 或多個像素點個數(shù)最多的顏色維度作為當(dāng)前圖像的主顏色; 像素點個數(shù)獲取子模塊,用于獲得所述主顏色在當(dāng)前圖像中對應(yīng)的像素點個數(shù); 和/或, 當(dāng)所述視覺特征包括梯度特征時,所述視覺特征提取子模塊包括: 灰度圖像轉(zhuǎn)換子模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,并對所述灰度圖像進(jìn)行平 滑; 梯度方向直方圖計算子模塊,用于依據(jù)所述平滑后的灰度圖像計算所述圖像的梯度方 向直方圖; 梯度特征生成子模塊,用于采用所述梯度方向直方圖及其對應(yīng)的像素點個數(shù)作為當(dāng)前 圖像的梯度特征; 和/或, 當(dāng)所述視覺特征包括局部特征時,所述視覺特征提取子模塊包括: 特征點提取子模塊,用于提取所述圖像中具有旋轉(zhuǎn)不變性和尺度不變性的特征點; 局部特征生成子模塊,用于計算所述特征點的對比度變量,選取對比度變量大于預(yù)設(shè) 第一門限值的特征點拼接成所述圖像的局部特征。
26.根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,所述搜索結(jié)果合并模塊還包括: 去重子模塊,用于將同時出現(xiàn)在多個圖像集合中的同一業(yè)務(wù)對象的圖像進(jìn)行去重處 理。
【文檔編號】G06K9/62GK104142946SQ201310167405
【公開日】2014年11月12日 申請日期:2013年5月8日 優(yōu)先權(quán)日:2013年5月8日
【發(fā)明者】鄧宇, 歐海峰 申請人:阿里巴巴集團(tuán)控股有限公司