獲取緊湊全局特征描述子的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算技術(shù),尤其涉及一種獲取緊湊全局特征描述子的方法。
【背景技術(shù)】
[0002] 在圖像檢索領(lǐng)域,業(yè)內(nèi)人士通過將圖像的局部特征描述子聚合成全局特征描述 子,進(jìn)而實(shí)現(xiàn)圖像的檢索。當(dāng)前,F(xiàn)isherVector(簡稱FV向量)為一種全局特征描述子, 且FisherVector在圖像檢索和分類中都獲得了比較好的性能。
[0003] 在圖像檢索過程中,為了降低全局特征描述子的存儲復(fù)雜度,以及傳輸過程中的 帶寬延遲,需要采用碼表將全局特征描述子壓縮?,F(xiàn)有技術(shù)中對全局特征描述子壓縮的方 法包括:使用乘積量化將全局特征描述子分成多個(gè)不重疊的子向量,根據(jù)碼表將每個(gè)子向 量量化成一個(gè)標(biāo)識符。
[0004] 然而,上述壓縮方法需要預(yù)先訓(xùn)練好的碼表,碼表會占用較大的存儲空間,使內(nèi)存 有限的移動設(shè)備難以承受。
[0005] 另一方面,為將全局特征描述子壓縮到較小的長度,量化的質(zhì)量會受到影響,使全 局特征描述子的表達(dá)能力降低,從而影響檢索的性能。
【發(fā)明內(nèi)容】
[0006] 為解決現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種獲取緊湊全局特征描述子的方法,用 于將現(xiàn)有技術(shù)中全局特征描述子壓縮到較小的長度,且提高了緊湊全局特征描述子的表達(dá) 能力。
[0007] 本發(fā)明提供一種獲取緊湊全局特征描述子的方法,包括:
[0008] 獲取待處理圖像的可伸縮全局特征描述子;
[0009] 根據(jù)所述可伸縮全局特征描述子中每一維度上的數(shù)值,對所述可伸縮全局特征描 述子進(jìn)行二值化處理,得到包括比特的二值化后的可伸縮全局特征描述子;
[0010] 根據(jù)預(yù)設(shè)的比特選擇表,從包括比特的二值化后的可伸縮全局特征描述子中選擇 若干個(gè)比特,將選擇的若干個(gè)比特依次連接得到緊湊全局特征描述子。
[0011] 可選地,所述根據(jù)所述可伸縮全局特征描述子中每一維度上的數(shù)值,所述可伸縮 全局特征描述子進(jìn)行二值化處理,得到包括比特的二值化后的可伸縮全局特征描述子,包 括:
[0012] 若所述可伸縮全局特征描述子中一維度上的數(shù)值為正數(shù),則該維度對應(yīng)的比特的 值為1;
[0013] 若所述可伸縮全局特征描述子中一維度上的數(shù)值為負(fù)數(shù)或0,則該維度對應(yīng)的比 特的值為0。
[0014] 可選地,所述獲取待處理圖像的可伸縮全局特征描述子,包括:
[0015] 獲取待處理圖像的局部特征描述子,并對所述局部特征描述子進(jìn)行降維;
[0016] 根據(jù)高斯混合模型,對降維后的局部特征描述子進(jìn)行聚合,獲取所述圖像的一個(gè) 全局特征描述子;
[0017] 根據(jù)預(yù)設(shè)規(guī)則,對所述全局特征描述子進(jìn)行處理,獲取所述待處理圖像的可伸縮 全局特征描述子;
[0018] 其中,所述可伸縮全局特征描述子的字節(jié)大小根據(jù)所述預(yù)設(shè)規(guī)則中參數(shù)值的變化 而變化。
[0019] 可選地,根據(jù)預(yù)設(shè)規(guī)則,對所述全局特征描述子進(jìn)行處理,獲取所述待處理圖像的 可伸縮全局特征描述子,包括:
[0020] 根據(jù)高斯混合模型中每個(gè)高斯密度函數(shù)對應(yīng)的第一累積梯度向量的所有維度數(shù) 值的標(biāo)準(zhǔn)差,對所有高斯密度函數(shù)按照所述標(biāo)準(zhǔn)差由大到小的順序排序,選取排序中排在 前面的若干個(gè)高斯密度函數(shù),并將選取的高斯密度函數(shù)對應(yīng)的第一累積梯度向量和/或第 二累積梯度向量依次首尾相連得到可伸縮全局特征描述子;
[0021] 其中,所述高斯混合模型通過M個(gè)獨(dú)立的高斯密度函數(shù)線性疊加得到的,所述M等 于 512 ;
[0022] 所述第一累積梯度向量是所述待處理圖像的對數(shù)似然函數(shù)對所述高斯密度函數(shù) 對應(yīng)的均值求一階偏導(dǎo)得到的;
[0023] 所述第二累積梯度向量是所述待處理圖像的對數(shù)似然函數(shù)對所述高斯密度函數(shù) 對應(yīng)的方差求一階偏導(dǎo)得到的。
[0024] 可選地,所述可伸縮全局特征描述子包括:選取的高斯密度函數(shù)對應(yīng)的第一累積 梯度向量和/或第二累積梯度向量;
[0025] 所述根據(jù)所述可伸縮全局特征描述子中每一維度上的數(shù)值,對所述可伸縮全局特 征描述子進(jìn)行二值化處理,得到包括比特的二值化后的可伸縮全局特征描述子,包括:
[0026] 對所述選取的高斯密度函數(shù)對應(yīng)的第一累積梯度向量和/或第二累積梯度向量 進(jìn)行二值化,得到包括比特的二值化后的第一累積梯度向量和/或第二累積梯度向量;
[0027] 將包括比特的二值化后的所述第一累積梯度向量和/或第二累積梯度向量首尾 依次相連得到包括比特的二值化后的可伸縮全局特征描述子。
[0028] 可選地,對所述選取的高斯密度函數(shù)對應(yīng)的第一累積梯度向量和/或第二累積梯 度向量進(jìn)行二值化,包括:
[0029] 若所述第一累積梯度向量的一維度的數(shù)值為正數(shù),則該維度對應(yīng)的比特的值為 1 ;
[0030] 若所述第一累積梯度向量的一維度的數(shù)值為負(fù)數(shù)或0,則該維度對應(yīng)的比特的值 為〇 ;
[0031] 若所述第二累積梯度向量的一維度的數(shù)值為正數(shù),則該維度對應(yīng)的比特的值為 1;
[0032] 若所述第二累積梯度向量的一維度的數(shù)值為負(fù)數(shù)或0,則該維度對應(yīng)的比特的值 為〇。
[0033] 可選地,所述根據(jù)預(yù)設(shè)的比特選擇表,從包括比特的二值化后的可伸縮全局特征 描述子中選擇若干個(gè)比特,將選擇的若干個(gè)比特依次相連得到緊湊全局特征描述子,包 括:
[0034] 根據(jù)預(yù)設(shè)的比特選擇表,從包括比特的二值化后的所述第一累積梯度向量中選擇 部分比特,將選擇的部分比特依次相連得到緊湊全局特征描述子。
[0035] 其中,包括比特的二值化后的第一累積梯度向量為32維,包括比特的二值化后的 第二累積梯度向量為32維。
[0036] 可選地,所述預(yù)設(shè)的比特選擇表的獲取方式包括:
[0037] 訓(xùn)練預(yù)設(shè)的圖像數(shù)據(jù)集,得到每一高斯密度函數(shù)對應(yīng)的第一累積梯度向量,對所 有的第一累積梯度向量進(jìn)行二值化處理,得到每一高斯密度函數(shù)對應(yīng)的,包括比特的二值 化后的第一累積梯度向量;
[0038] 采用統(tǒng)計(jì)方式計(jì)算每一高斯密度函數(shù)對應(yīng)的包括比特的二值化后的第一累積梯 度向量中每一比特的重要性,選擇重要性大的若干比特,根據(jù)選擇的若干比特對應(yīng)的比特 位設(shè)置比特選擇表對應(yīng)位的值;
[0039] 每一高斯密度函數(shù)對應(yīng)一個(gè)比特選擇表;
[0040] 將所有高斯密度函數(shù)對應(yīng)的比特選擇表轉(zhuǎn)換為對應(yīng)的整數(shù)。
[0041] 可選地,所述根據(jù)預(yù)設(shè)的比特選擇表,從包括比特的二值化后的所述第一累積梯 度向量中選擇部分比特,將選擇的部分比特依次連接得到緊湊全局特征描述子,包括: [0042] 若所述整數(shù)的二進(jìn)制表達(dá)的第j位為1,則選擇所述高斯密度函數(shù)的第j個(gè)比特; 若所述整數(shù)對應(yīng)的二進(jìn)制表達(dá)的第j位為〇,則不選擇所述高斯密度函數(shù)的第j個(gè)比特;其 中,j為1至32之間的自然數(shù);
[0043] 所述高斯密度函數(shù)的第j個(gè)比特為,所述高斯密度函數(shù)對應(yīng)的包括比特的二值化 后的第一累積梯度向量中的第j個(gè)比特。
[0044] 可選地,所述待處理圖像的視覺特征描述子由緊湊全局特征描述子、緊湊局部特 征描述子和每一緊湊局部特征描述子對應(yīng)待處理圖像的位置信息構(gòu)成;
[0045] 若所述待處理圖像的視覺特征描述子長度范圍在462字節(jié)和562字節(jié)之間,則所 述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、包括 比特的二值化后的第一累積梯度向量依次首尾相連得到;并根據(jù)比特選擇表,分別從所有 選取的高斯密度函數(shù)對應(yīng)的、包括比特的二值化后的第一累積梯度向量中選擇24個(gè)比特, 構(gòu)成緊湊全局特征描述子;
[0046] 若所述待處理圖像的視覺特征描述子長度范圍在924字節(jié)和1124字節(jié)之間,則所 述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、包括 比特的二值化后的第一累積梯度向量依次首尾相連得到,所述二值化后的可伸縮全局特征 描述子構(gòu)成緊湊全局特征描述子;
[0047] 若所述待處理圖像的視覺特征描述子長度范圍在1848字節(jié)和2248字節(jié)之間,則 所述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、包 括比特的二值化后的第一累積梯度向量依次首尾相連得到,所述二值化后的可伸縮全局特 征描述子構(gòu)成緊湊全局特征描述子;
[0048] 若所述待處理圖像的視覺特征描述子長度范圍在3696字節(jié)和4496字節(jié)之間,則 所述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、包 括比特的二值化后的第一累積梯度向量和包括比特的二值化后的第二累積梯度向量依次 首尾相連得到,所述二值化后的可伸縮全局特征描述子構(gòu)成緊湊全局特征描述子;
[0049] 若所述待處理圖像的視覺特征描述子長度范圍在7392字節(jié)和8992字節(jié)之間,則 所述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、包 括比特的二值化后的第一累積梯度向量和包括比特的二值化后的第二累積梯度向量依次 首尾相連得到,所述二值化后的可伸縮全局特征描述子構(gòu)成緊湊全局特征描述子;
[0050] 若所述待處理圖像的視覺特征描述子長度范圍在14784字節(jié)和17984字節(jié)之間, 則所述包括比特的二值化后的可伸縮全局特征描述子由所有選取的高斯密度函數(shù)對應(yīng)的、 包括比特的二值化后的第一累積梯度向量和包括比特的二值化后的第二累積梯度向量依 次首尾相連得到,所述二值化后的可伸縮全局特征描述子構(gòu)成緊湊全局特征描述子。
[0051] 由上述技術(shù)方案可知,本發(fā)明的獲取緊湊全局特征描述子的方法,通過對可伸縮 全局特征描述子中每一維度上的數(shù)值進(jìn)行二值化,得到包括比特的二值化后的可伸縮全局 特征描述子。根據(jù)預(yù)設(shè)的比特選擇表,從包括比特的二值化后的可伸縮全局特征描述子中 選取若干個(gè)比特,進(jìn)而選擇的若干個(gè)比如組成緊湊全局特征描述子,進(jìn)而將可伸縮全局特 征描述子壓縮成長度很小的緊湊全局特征描述子,提高了緊湊全局特征描述子的表達(dá)能 力;進(jìn)一步地,上述壓縮過程不依賴于任何額外的碼表和數(shù)據(jù),進(jìn)而可大大降低現(xiàn)有技術(shù)壓 縮過程中的時(shí)間復(fù)雜度和內(nèi)存占用量。
【附圖說明】
[0052] 圖1為本發(fā)明一實(shí)施例提供的獲取緊湊全局特征描述子的方法的流程示意圖;
[0053] 圖2為本發(fā)明一實(shí)施例提供的梯度方向直方圖向量的示意圖。
【具體實(shí)施方式】
[0054] 圖1示出了本發(fā)明一實(shí)施例提供的獲取緊湊全局特征描述子的方法的流程示意 圖,如