亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種多媒體對象的相似檢索方法及裝置的制造方法

文檔序號:10725184閱讀:444來源:國知局
一種多媒體對象的相似檢索方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種多媒體對象的相似檢索方法及裝置,通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維特征向量,對d維特征向量進(jìn)行降維處理,提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將待檢索多媒體對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q,根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū)及不需查詢的數(shù)據(jù)點(diǎn),在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值及查詢點(diǎn)與對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維特征向量。本發(fā)明減少無效的I/O查詢,并以三角剪枝的方式降低計(jì)算開銷,進(jìn)而提高查詢效率。
【專利說明】
一種多媒體對象的相似檢索方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及相似性檢索領(lǐng)域,尤其涉及一種多媒體對象的相似檢索方法及裝置。
【背景技術(shù)】
[0002] 現(xiàn)如今許多數(shù)據(jù)處理應(yīng)用需要處理結(jié)構(gòu)更為松散甚至無結(jié)構(gòu)的數(shù)據(jù)。很多實(shí)際應(yīng) 用更是需要處理基于樣本的檢索,例如基于內(nèi)容的圖像檢索等。而這些應(yīng)用都可以歸結(jié)到 相似性檢索的范疇,尤其在多媒體應(yīng)用中,基于多媒體數(shù)據(jù)的內(nèi)容進(jìn)行相似搜索的技術(shù),也 變得越來越重要。
[0003] 為了提升多媒體相似性檢索的處理效率,通常針對多媒體對象的高維特征建立高 維索引。多年來,研究者們已經(jīng)設(shè)計(jì)和開發(fā)了很多高維索引技術(shù)用于組織視頻、圖像、音頻 等多媒體數(shù)據(jù)的特征向量,以提升檢索性能。由于"維度災(zāi)難"的存在,當(dāng)數(shù)據(jù)量很大,維度 很高時(shí),提升多媒體檢索任務(wù)的性能仍然是一項(xiàng)艱巨的工作,現(xiàn)有技術(shù)中的高維索引技術(shù), 當(dāng)數(shù)據(jù)規(guī)模較大,維度較高時(shí),I/O開銷及計(jì)算開銷均會變大,降低了索引查詢的性能。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明提供一種多媒體對象的相似檢索方法及裝置,解決現(xiàn)有技術(shù)中高維索引技 術(shù)當(dāng)數(shù)據(jù)規(guī)模較大,維度較高時(shí),I/O開銷及計(jì)算開銷均會變大,降低了索引查詢的性能的 技術(shù)問題。
[0005] 本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0006] -種多媒體對象的相似檢索方法,包括:
[0007] 通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維特征向量;
[0008] 將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDi stance算法,將d維特征向量 映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向量,以獲得查詢 數(shù)據(jù)庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn);
[0009] 提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將待檢索多媒體 對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q;
[0010] 根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū)及不需查 詢的數(shù)據(jù)點(diǎn);
[0011] 在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維 鍵值,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維特征向量。
[0012] 前述的多媒體對象的相似檢索方法,所述特征提取包括SIFT特征提取、HARRIS特 征提取和SUSAN特征提取。
[0013] 前述的多媒體對象的相似檢索方法,所述將d維特征向量劃分為Μ個(gè)區(qū)域,通過 iDi stance算法,將d維特征向量映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值 及所述d維特征向量,以獲得查詢數(shù)據(jù)庫,包括:
[0014] 將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)P0、P1、…、Pm-l;
[0015] 為每個(gè)分區(qū)選定參照點(diǎn)Q0、Ql、'"、Qm-l;
[0016 ]根據(jù)d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p到參照點(diǎn)Q i的距離,將d維特征向量映射為一維 鍵值,其中,一維鍵值7 = 1\〇+虹8以?,01),0彡1彡!11-1,(3為彈性系數(shù),(^8以?,01)為(1維特 征向量對應(yīng)的數(shù)據(jù)點(diǎn)P到參照點(diǎn)Q i的距離;
[0017] 采用映射后的一維鍵值y建立B+_tree的索引結(jié)構(gòu),以存儲所述一維鍵值y及所述d 維特征向量。
[0018] 前述的多媒體對象的相似檢索方法,所述根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修 剪掉不需查詢的Part i t ion分區(qū)及不需查詢的數(shù)據(jù)點(diǎn)的步驟,包括:
[0019 ]將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體;
[0020] 判斷每個(gè)Par t ition是否與所述超立方體相交;
[0021 ] 當(dāng)所述Partition與所述超立方體不相交時(shí),修剪掉不需查詢的所述Partition, 并擴(kuò)大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束;
[0022]當(dāng)KNN檢索結(jié)束后,對未修剪的Partition中的數(shù)據(jù)點(diǎn)p增加數(shù)據(jù)點(diǎn)到數(shù)據(jù)空間中 心的距離虹81:(。,〇61^61'),判斷所述查詢點(diǎn)9到數(shù)據(jù)空間中心的距離(1丨81:(9,〇61^61')及查 詢半徑r,是否滿足dist(p,center Xr+dist(q,center ),當(dāng)不滿足時(shí),修剪掉數(shù)據(jù)點(diǎn)P。 [0023]前述的多媒體對象的相似檢索方法,在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述 查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待 檢索多媒體對象的d維特征向量的步驟,包括:
[0024]當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+_Tree樹的葉子節(jié)點(diǎn)兩邊進(jìn)行遍歷,查詢待 檢索多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p,其中,所述第一種情況為當(dāng)前Partition包 含查詢點(diǎn)q;
[0025]當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Part it ion的半徑,向B+-Tree樹的葉子節(jié)點(diǎn)內(nèi) 部進(jìn)行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外,且所述查詢點(diǎn)q與查詢 半徑r所形成的超球與Partition相交。
[0026] -種多媒體對象的相似檢索裝置,包括:
[0027] 特征向量提取模塊,用于通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維 特征向量;
[0028] 降維模塊,用于將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDistance算法, 將d維特征向量映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向 量,以獲得查詢數(shù)據(jù)庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn);
[0029]映射模塊,用于提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將 待檢索多媒體對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q;
[0030]剪枝模塊,用于根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition 分區(qū)及不需查詢的數(shù)據(jù)點(diǎn);
[0031 ]查詢模塊,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn), 根據(jù)所述一維鍵值,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維 特征向量。
[0032]前述的多媒體對象的相似檢索裝置,所述降維模塊包括:
[0033]分區(qū)單元,用于將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)Ρ0、Ρ1、···、Ρπι-1;
[0034]映射單元,用于為每個(gè)分區(qū)選定參照點(diǎn)QO、Q1、…、Qm-1,根據(jù)d維特征向量對應(yīng)的 數(shù)據(jù)點(diǎn)P到參照點(diǎn)Qi的距離,將d維特征向量映射為一維鍵值,其中,一維鍵值y = i X c+dist (p,Qi),0彡i彡m-1,c為彈性系數(shù),dist(p,Qi)為d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p到參照點(diǎn)Qi的 距離;
[0035]索引單元,用于采用映射后的一維鍵值y建立B+-tree的索引結(jié)構(gòu),以存儲所述一 維鍵值y及所述d維特征向量。
[0036] 前述的多媒體對象的相似檢索裝置,所述剪枝模塊包括:
[0037] 變換單元,用于將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體;
[0038]判斷單元,用于判斷每個(gè)Partition是否與所述超立方體相交;
[0039]第一修剪單元,用于當(dāng)所述Partition與所述超立方體不相交時(shí),修剪掉不需查詢 的所述Part i t ion,并擴(kuò)大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束;
[0040] 第二修剪單元,用于當(dāng)KNN檢索結(jié)束后,對未修剪的Partition中的數(shù)據(jù)點(diǎn)p增加數(shù) 據(jù)點(diǎn)到數(shù)據(jù)空間中心的距離d i s t (p,c e n t e r),判斷所述查詢點(diǎn)q到數(shù)據(jù)空間中心的距離 dist(q,center)及查詢半徑r,是否滿足dist(p,centerXr+dist(q,center),當(dāng)不滿足 時(shí),修剪掉數(shù)據(jù)點(diǎn)P。
[0041] 前述的多媒體對象的相似檢索裝置,所述查詢模塊包括:
[0042] 查詢執(zhí)行單元,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù) 據(jù)點(diǎn),根據(jù)所述一維鍵值及查詢點(diǎn)q與當(dāng)前par t i t i on的情況,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn) 進(jìn)行查詢,其中,查詢點(diǎn)q與當(dāng)前partition的情況包括第一種情況和第二種情況;
[0043]第一遍歷單元,用于當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+_Tree樹的葉子節(jié)點(diǎn)兩 邊進(jìn)行遍歷,查詢待檢索多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p,其中,所述第一種情況 為當(dāng)前Partition包含查詢點(diǎn)q;
[0044] 第二遍歷單元,用于當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Partition的半徑,向B+-Tree樹的葉子節(jié)點(diǎn)內(nèi)部進(jìn)行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外,且 所述查詢點(diǎn)q與查詢半徑r所形成的超球與Partition相交。
[0045] 本發(fā)明的技術(shù)效果為:
[0046] 通過優(yōu)化1/0開銷的分區(qū)剪枝PP算法,剪掉無效的分區(qū),減少無效的1/0查詢,提高 查詢效率;通過優(yōu)化計(jì)算開銷的基于三角不等式的剪枝LP算法,篩除一部分?jǐn)?shù)據(jù)點(diǎn),以三角 剪枝的方式降低計(jì)算開銷,進(jìn)而提高查詢效率。
【附圖說明】
[0047] 圖1為本發(fā)明實(shí)施例提供的一種多媒體對象的相似檢索方法的流程圖;
[0048]圖2為本發(fā)明實(shí)施例提供的kNN檢索遍歷策略三種情況的示意圖;
[0049] 圖3為本發(fā)明實(shí)施例中基于PP算法的剪枝示意圖;
[0050] 圖4為本發(fā)明實(shí)施例提供的一種多媒體對象的相似檢索裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0051] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0052]如圖1所示,為本發(fā)明實(shí)施例中的一種多媒體對象的相似檢索方法,包括:
[0053]步驟101、通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維特征向量;
[0054]其中,特征提取是相似性檢索的基礎(chǔ)之一。其通過特定的算法,提取重要的特征, 并結(jié)合特征提取函數(shù)F,將其映射到d維空間,目的在于將多媒體對象轉(zhuǎn)化為特征向量,所述 特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。
[0055] 步驟102、對d維特征向量進(jìn)行降維處理;
[0056] 其中,將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDistance算法,將d維特征 向量映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向量,以獲得 查詢數(shù)據(jù)庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn);
[0057] 其中,步驟102還可以包括:
[0058] 步驟102-1、將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)Ρ0、Ρ1、···、Ρπι-1;
[0059] 步驟102-2、為每個(gè)分區(qū)選定參照點(diǎn)Q0、Ql、'"、Qm-l;
[0060 ] 步驟10 2 - 3、根據(jù)d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p到參照點(diǎn)Q i的距離,將d維特征向量 映射為一維鍵值,其中,一維鍵值7 = 1\〇+虹8以?,〇1),0<1$111-1,(3為彈性系數(shù),(^8以?, Q i)為d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p到參照點(diǎn)Q i的距離;
[0061]其中,c不小于▲,d = dist(p,Qi)。
[0062]步驟102-4、采用映射后的一維鍵值y建立B+_tree的索引結(jié)構(gòu),以存儲所述一維鍵 值y及所述d維特征向量。
[0063] 步驟103、提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將待檢 索多媒體對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q;
[0064] 其中,步驟103的具體映射方式與步驟102相同。
[0065] 步驟104、根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū) 及不需查詢的數(shù)據(jù)點(diǎn);
[0066] 其中,步驟104還可以包括:
[0067] 步驟104-1、將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體;
[0068] 步驟104-2、判斷每個(gè)Par t i t i on是否與所述超立方體相交;
[0069] 步驟104-3、當(dāng)所述Partition與所述超立方體不相交時(shí),修剪掉不需查詢的所述 Partition,并擴(kuò)大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束;
[0070] 其中,基于iDistance的kNN檢索與傳統(tǒng)的kNN檢索策略一致,首先選定初始查詢半 徑進(jìn)行查詢,再逐漸擴(kuò)大半徑,直到k個(gè)查詢對象都被找到,其查詢停止的標(biāo)記為:k個(gè)對象 內(nèi)最遠(yuǎn)對象離查詢點(diǎn)的距離不大于查詢半徑。因每個(gè)區(qū)域內(nèi)點(diǎn)的鍵值在每個(gè)頁上是順序存 儲的,對于查詢點(diǎn)q,映射到B+_Tree后,根據(jù)查詢范圍與查詢約束,向葉子結(jié)點(diǎn)的兩邊遍歷。 這種技術(shù)的優(yōu)勢是,當(dāng)查詢半徑逐漸增大時(shí),同個(gè)區(qū)域內(nèi)可以通過這種方式遞歸查詢。對于 每個(gè)區(qū)域如何選擇kNN檢索遍歷策略,包括如下情況:
[0071] 三種情況:
[0072] 第一種情況(Situationl):當(dāng)前區(qū)域包含查詢點(diǎn)q,雙向遍歷(Outward and Inward);
[0073] 第二種情況(Situation〗):查詢點(diǎn)q在當(dāng)前區(qū)域外,但是所形成的超球與區(qū)域相 交,向內(nèi)遍歷(Inward);
[0074]第三種情況(Situation3):查詢點(diǎn)q在當(dāng)前區(qū)域外,其所形成的超球與區(qū)域不相 交,該區(qū)域不需遍歷。
[0075]如圖2為kNN檢索遍歷策略三種情況的示意圖,其中,給定三個(gè)分區(qū)劃分P1、P2、P3, 對于查詢點(diǎn)q,Pl需要雙向遍歷、P2需要內(nèi)向遍歷,P3不需要遍歷。
[0076]如圖3所示,查詢點(diǎn)q與查詢半徑r所形成的圓擴(kuò)展成正方形,不難看出正方形與P2 不存在交叉,即滿足PP算法中的剪枝情況,不必對原本需要查詢的page進(jìn)行查詢,減少了一 部分I/O的開銷。
[0077] 步驟104-4、當(dāng)KNN檢索結(jié)束后,對未修剪的Partition中的數(shù)據(jù)點(diǎn)p增加數(shù)據(jù)點(diǎn)到 數(shù)據(jù)空間中心的距離dist(p,center),判斷所述查詢點(diǎn)q到數(shù)據(jù)空間中心的距離dist(q, center)及查詢半徑r,是否滿足dist(p,centerXr+dist(q,center),當(dāng)不滿足時(shí),修剪掉 數(shù)據(jù)點(diǎn)P。
[0078] 其中,為每個(gè)葉子節(jié)點(diǎn)增加了一個(gè)屬性,該屬性記錄該點(diǎn)到數(shù)據(jù)空間中心的距離。 剪枝算法通過該點(diǎn)到與中心點(diǎn)的距離、該點(diǎn)到參考點(diǎn)的距離、查詢半徑作為參數(shù),以三角剪 枝的達(dá)到降低計(jì)算開銷的目的,進(jìn)而提高查詢效率
[0079] 為數(shù)據(jù)空間內(nèi)的全部數(shù)據(jù)點(diǎn)增加一個(gè)屬性字段(包括查詢點(diǎn)q),記錄該點(diǎn)到DS中 心center的距離。例如采用歐氏距離作為度量標(biāo)準(zhǔn),p為DS內(nèi)某個(gè)與查詢區(qū)域相交的page中 的的數(shù)據(jù)點(diǎn),則存在以下三角不等式規(guī)則,可作為剪枝依據(jù):
[0080] dist(p,q)_dist(q,centerXdist(p,centerXdist(p,q)+dist(q,center); [0081 ]當(dāng)規(guī)定查詢點(diǎn)q的查詢半徑r時(shí),對于q查詢半徑內(nèi)的所有候選點(diǎn)p,必須滿足:dist (p,center) <r+dist(q,center),否則,page內(nèi)的點(diǎn)將被篩除,以減少I/O開銷。
[0082]步驟105、在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù) 所述一維鍵值及查詢點(diǎn)與對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象 的d維特征向量。
[0083] 其中,步驟105還可以包括:
[0084] 步驟105-1、在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根 據(jù)所述一維鍵值及查詢點(diǎn)q與當(dāng)前part it ion的情況,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查 詢,其中,查詢點(diǎn)q與當(dāng)前partition的情況包括第一種情況和第二種情況;
[0085] 步驟105-2、當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+_Tree樹的葉子節(jié)點(diǎn)兩邊進(jìn)行遍 歷,查詢待檢索多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p,其中,所述第一種情況為當(dāng)前 Part it ion包含查詢點(diǎn)q;
[0086] 步驟105-3、當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Partition的半徑,向B+-Tree樹的 葉子節(jié)點(diǎn)內(nèi)部進(jìn)行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外,且所述查詢 點(diǎn)q與查詢半徑r所形成的超球與Partition相交。
[0087]本發(fā)明實(shí)施例提出的一種多媒體對象的相似檢索方法,通過同時(shí)優(yōu)化1/0開銷和 計(jì)算的高維索引技術(shù)AP-iDi stance (Advanced pruning iDi stance)開銷。在判斷是否遍歷 當(dāng)前part it ion之前,先判斷該查詢范圍所擴(kuò)展而成的超立方體是否與當(dāng)前part it ion相 交,以減少無效的1/0查詢,提高查詢效率;并在遍歷每個(gè)page中數(shù)據(jù)點(diǎn)之前,通過三角剪枝 的方法篩除一部分?jǐn)?shù)據(jù)點(diǎn)。該方案為每個(gè)葉子結(jié)點(diǎn)增加了一個(gè)屬性,該屬性記錄該點(diǎn)到數(shù) 據(jù)空間中心的距離。剪枝算法通過該點(diǎn)到與中心點(diǎn)的距離、該點(diǎn)到參考點(diǎn)的距離、查詢半徑 作為參數(shù),以三角剪枝的達(dá)到降低計(jì)算開銷的目的,進(jìn)而提高查詢效率。
[0088] 本發(fā)明實(shí)施例還提供一種多媒體對象的相似檢索裝置,如圖4,包括:
[0089] 特征向量提取模塊410,用于通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的 d維特征向量;
[0090] 降維模塊420,用于將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDistance算 法,將d維特征向量映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特 征向量,以獲得查詢數(shù)據(jù)庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn);
[0091 ]映射模塊430,用于提取待檢索多媒體對象的d維特征向量,并通過iDistance算 法,將待檢索多媒體對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q;
[0092]剪枝模塊440,用于根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的 Partition分區(qū)及不需查詢的數(shù)據(jù)點(diǎn);
[0093]查詢模塊450,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù) 點(diǎn),根據(jù)所述一維鍵值,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的 d維特征向量。
[0094]其中,所述降維模塊420包括:
[0095]分區(qū)單元421,用于將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)Ρ0、Ρ1、···、Ρπι-1;
[0096]映射單元422,用于為每個(gè)分區(qū)選定參照點(diǎn)〇0、〇1、'"、〇111-1,根據(jù)(1維特征向量對應(yīng) 的數(shù)據(jù)點(diǎn)Ρ到參照點(diǎn)Qi的距離,將d維特征向量映射為一維鍵值,其中,一維鍵值y = iXc+ dist(p,Qi),(Xi彡m-1,c為彈性系數(shù),(1181:(口,(>);〇為(1維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)口到參照點(diǎn) Qi的距離;
[0097]索引單元423,用于采用映射后的一維鍵值y建立B+-tree的索引結(jié)構(gòu),以存儲所述 一維鍵值y及所述d維特征向量。
[0098]所述剪枝模塊440包括:
[0099]變換單元441,用于將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體; [0?00]判斷單元442,用于判斷每個(gè)Partition是否與所述超立方體相交;
[0101] 第一修剪單元443,用于當(dāng)所述Partition與所述超立方體不相交時(shí),修剪掉不需 查詢的所述Partition,并擴(kuò)大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束;
[0102] 第二修剪單元444,用于當(dāng)KNN檢索結(jié)束后,對未修剪的Partition中的數(shù)據(jù)點(diǎn)ρ增 加數(shù)據(jù)點(diǎn)到數(shù)據(jù)空間中心的距離dist(p,center ),判斷所述查詢點(diǎn)q到數(shù)據(jù)空間中心的距 離dist(q,center)及查詢半徑r,是否滿足dist(p,centerXr+dist(q,center),當(dāng)不滿足 時(shí),修剪掉數(shù)據(jù)點(diǎn)Ρ。
[0103] 所述查詢模塊450包括:
[0104] 查詢執(zhí)行單元451,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的 數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值及查詢點(diǎn)q與當(dāng)前parti t ion的情況,對所述查詢空間內(nèi)的數(shù)據(jù) 點(diǎn)進(jìn)行查詢,其中,查詢點(diǎn)q與當(dāng)前partition的情況包括第一種情況和第二種情況;
[0105] 第一遍歷單元452,用于當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+_Tree樹的葉子節(jié)點(diǎn) 兩邊進(jìn)行遍歷,查詢待檢索多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)ρ,其中,所述第一種情 況為當(dāng)前Partition包含查詢點(diǎn)q;
[0106] 第二遍歷單元453,用于當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Partition的半徑,向B +-Tree樹的葉子節(jié)點(diǎn)內(nèi)部進(jìn)行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外, 且所述查詢點(diǎn)q與查詢半徑r所形成的超球與Partition相交。
[0107]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助 軟件加必需的硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以全部通過硬件來實(shí)施,但很多情況下前 者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻(xiàn)的全部或 者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如 R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù) 器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0108]以上對本發(fā)明進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方 式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對 于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會有改變 之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項(xiàng)】
1. 一種多媒體對象的相似檢索方法,其特征在于,包括: 通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維特征向量; 將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDi stance算法,將d維特征向量映射 為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向量,以獲得查詢數(shù)據(jù) 庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn); 提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將待檢索多媒體對象 的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q; 根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū)及不需查詢的 數(shù)據(jù)點(diǎn); 在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值, 對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維特征向量。2. 根據(jù)權(quán)利要求1所述的多媒體對象的相似檢索方法,其特征在于,所述特征提取包括 SIFT特征提取、HARRIS特征提取和SUSAN特征提取。3. 根據(jù)權(quán)利要求2所述的多媒體對象的相似檢索方法,其特征在于,所述將d維特征向 量劃分為Μ個(gè)區(qū)域,通過iDistance算法,將d維特征向量映射為一維鍵值,并通過一維索引 結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向量,以獲得查詢數(shù)據(jù)庫,包括: 將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)P0、P1、…、Pm-1; 為每個(gè)分區(qū)選定參照點(diǎn)Q 〇、Q1、…、Qm-1; 根據(jù)d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p到參照點(diǎn)Qi的距離,將d維特征向量映射為一維鍵值, 其中,一維鍵值y=i Xc+dist(p,Qi),c為彈性系數(shù),dist(p,Qi)為d維特征向量 對應(yīng)的數(shù)據(jù)點(diǎn)P到參照點(diǎn)Q i的距離; 采用映射后的一維鍵值y建立B+_tree的索引結(jié)構(gòu),以存儲所述一維鍵值y及所述d維特 征向量。4. 根據(jù)權(quán)利要求3所述的多媒體對象的相似檢索方法,其特征在于,所述根據(jù)查詢點(diǎn)q、 查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū)及不需查詢的數(shù)據(jù)點(diǎn)的步驟,包 括: 將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體; 判斷每個(gè)Partition是否與所述超立方體相交; 當(dāng)所述Part it ion與所述超立方體不相交時(shí),修剪掉不需查詢的所述Part it ion,并擴(kuò) 大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束; 當(dāng)KNN檢索結(jié)束后,對未修剪的Partition中的數(shù)據(jù)點(diǎn)p增加數(shù)據(jù)點(diǎn)到數(shù)據(jù)空間中心的 距離(1丨81:化,〇61^61'),判斷所述查詢點(diǎn)9到數(shù)據(jù)空間中心的距離(1丨81:(9,〇61^61')及查詢半 徑r,是否滿足dist(p,center Xr+dist(q,center ),當(dāng)不滿足時(shí),修剪掉數(shù)據(jù)點(diǎn)P。5. 根據(jù)權(quán)利要求4所述的多媒體對象的相似檢索方法,其特征在于,在經(jīng)過修剪后的數(shù) 據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值,對所述查詢空間內(nèi)的數(shù) 據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維特征向量的步驟,包括: 在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù)所述一維鍵值 及查詢點(diǎn)q與當(dāng)前part i tion的情況,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,其中,查詢點(diǎn)q 與當(dāng)前partition的情況包括第一種情況和第二種情況; 當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+-Tree樹的葉子節(jié)點(diǎn)兩邊進(jìn)行遍歷,查詢待檢索 多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p,其中,所述第一種情況為當(dāng)前Partition包含查 詢點(diǎn)q; 當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Part it ion的半徑,向B+-Tree樹的葉子節(jié)點(diǎn)內(nèi)部進(jìn) 行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外,且所述查詢點(diǎn)q與查詢半徑r 所形成的超球與Partition相交。6. -種多媒體對象的相似檢索裝置,其特征在于,包括: 特征向量提取模塊,用于通過對多媒體對象進(jìn)行特征提取,獲取多媒體對象的d維特征 向量; 降維模塊,用于將d維特征向量的數(shù)據(jù)空間劃分為Μ個(gè)區(qū)域,通過iDistance算法,將d維 特征向量映射為一維鍵值,并通過一維索引結(jié)構(gòu)存儲所述一維鍵值及所述d維特征向量,以 獲得查詢數(shù)據(jù)庫,其中,所述數(shù)據(jù)空間中包括d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn); 映射模塊,用于提取待檢索多媒體對象的d維特征向量,并通過iDistance算法,將待檢 索多媒體對象的d維特征向量映射為一維鍵值及數(shù)據(jù)空間中的查詢點(diǎn)q; 剪枝模塊,用于根據(jù)查詢點(diǎn)q、查詢空間及距離度量,修剪掉不需查詢的Partition分區(qū) 及不需查詢的數(shù)據(jù)點(diǎn); 查詢模塊,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn),根據(jù) 所述一維鍵值,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查詢,以查詢待檢索多媒體對象的d維特征 向量。7. 根據(jù)權(quán)利要求6所述的多媒體對象的相似檢索裝置,其特征在于,所述降維模塊包 括: 分區(qū)單元,用于將多個(gè)d維特征向量的數(shù)據(jù)空間劃分為m個(gè)分區(qū)Ρ0、Ρ1、···、Ρπι-1; 映射單元,用于為每個(gè)分區(qū)選定參照點(diǎn)Q〇、Q1、…、Qm-1,根據(jù)d維特征向量對應(yīng)的數(shù)據(jù) 點(diǎn)P到參照點(diǎn)Qi的距離,將d維特征向量映射為一維鍵值,其中,一維鍵值y = i X c+dist(p, 01),0<^111-1,(3為彈性系數(shù),(^8以?池)為(1維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)?到參照點(diǎn)如的距 離; 索引單元,用于采用映射后的一維鍵值y建立B+-tree的索引結(jié)構(gòu),以存儲所述一維鍵 值y及所述d維特征向量。8. 根據(jù)權(quán)利要求7所述的多媒體對象的相似檢索裝置,其特征在于,所述剪枝模塊包 括: 變換單元,用于將所述查詢點(diǎn)q與查詢半徑r所形成的超球擴(kuò)展成超立方體; 判斷單元,用于判斷每個(gè)Partition是否與所述超立方體相交; 第一修剪單元,用于當(dāng)所述Partition與所述超立方體不相交時(shí),修剪掉不需查詢的所 述Partition,并擴(kuò)大查詢半徑r,重新進(jìn)行修剪判斷,直至KNN檢索結(jié)束; 第二修剪單元,用于當(dāng)KNN檢索結(jié)束后,對未修剪的Par t i t i on中的數(shù)據(jù)點(diǎn)p增加數(shù)據(jù)點(diǎn) 到數(shù)據(jù)空間中心的距離dist(p,center),判斷所述查詢點(diǎn)q到數(shù)據(jù)空間中心的距離dist(q, center)及查詢半徑r,是否滿足dist(p,centerXr+dist(q,center),當(dāng)不滿足時(shí),修剪掉 數(shù)據(jù)點(diǎn)P。9. 根據(jù)權(quán)利要求8所述的多媒體對象的相似檢索裝置,其特征在于,所述查詢模塊包 括: 查詢執(zhí)行單元,用于在經(jīng)過修剪后的數(shù)據(jù)點(diǎn)中,確定包含于所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn), 根據(jù)所述一維鍵值及查詢點(diǎn)q與當(dāng)前partition的情況,對所述查詢空間內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行查 詢,其中,查詢點(diǎn)q與當(dāng)前partition的情況包括第一種情況和第二種情況; 第一遍歷單元,用于當(dāng)?shù)谝环N情況時(shí),根據(jù)查詢范圍,向B+_Tree樹的葉子節(jié)點(diǎn)兩邊進(jìn) 行遍歷,查詢待檢索多媒體對象的d維特征向量對應(yīng)的數(shù)據(jù)點(diǎn)p,其中,所述第一種情況為當(dāng) 前Part it ion包含查詢點(diǎn)q; 第二遍歷單元,用于當(dāng)?shù)诙N情況時(shí),根據(jù)查詢范圍及Partition的半徑,向B+-Tree樹 的葉子節(jié)點(diǎn)內(nèi)部進(jìn)行遍歷,其中,所述第二種情況為查詢點(diǎn)q在當(dāng)前Partition外,且所述查 詢點(diǎn)q與查詢半徑r所形成的超球與Partition相交。
【文檔編號】G06F17/30GK106096065SQ201610613829
【公開日】2016年11月9日
【申請日】2016年7月29日 公開號201610613829.8, CN 106096065 A, CN 106096065A, CN 201610613829, CN-A-106096065, CN106096065 A, CN106096065A, CN201610613829, CN201610613829.8
【發(fā)明人】李暉, 陳梅
【申請人】貴州大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1