亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于半監(jiān)督哈希的圖像檢索方法與流程

文檔序號(hào):12603793閱讀:630來(lái)源:國(guó)知局
基于半監(jiān)督哈希的圖像檢索方法與流程
本發(fā)明屬于圖像處理領(lǐng)域,更進(jìn)一步涉及圖像的檢索方法,可有效的對(duì)圖像進(jìn)行編碼,提高圖像的檢索精度。

背景技術(shù):
隨著計(jì)算機(jī)技術(shù)、數(shù)字多媒體技術(shù)及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們對(duì)信息檢索的需求也日益擴(kuò)大。圖像作為信息的載體,含有豐富的內(nèi)容,給人們的生產(chǎn)和生活帶來(lái)了極大的便利。如何迅速有效的搜索到所需要的圖像,成為當(dāng)前的研究熱點(diǎn)之一。為了在大數(shù)據(jù)中快速有效地檢索到用戶所需要的圖像,人們對(duì)原始圖像進(jìn)行編碼,用一定長(zhǎng)度的哈希碼來(lái)表示圖像。由于計(jì)算機(jī)中數(shù)據(jù)的存儲(chǔ)及處理均是哈希碼,因此使用哈希碼能夠大大加快信息檢索速度。天格科技(杭州)有限公司提出的專利申請(qǐng)“一種基于局部敏感哈希的相似人臉快速檢索方法”(申請(qǐng)?zhí)枺?01310087561.5,公開號(hào):CN103207898A)公開了一種基于局部敏感哈希的人臉圖像檢索方法。該方法通過(guò)人臉區(qū)域檢測(cè)、眼睛和嘴巴特征檢測(cè)和特征提取、膚色檢測(cè)、人臉膚色分布特征提取等步驟將圖像表示為人臉特征向量,然后利用局部敏感哈希方法對(duì)人臉特征向量構(gòu)建索引,從而提高查詢時(shí)的速度。該方法存在的不足是:局部敏感哈希方法是一種數(shù)據(jù)無(wú)關(guān)的哈希方法,隨機(jī)性很強(qiáng),并且為了保證較好的檢索精度,需要的編碼位數(shù)很長(zhǎng),因此在實(shí)際應(yīng)用中有很大的限制。浙江大學(xué)提出的專利申請(qǐng)“基于稀疏降維的譜哈希索引方法”(申請(qǐng)?zhí)枺?01010196539.0,公開號(hào):CN101894130A)公開了一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法。該方法首先提取圖像底層特征,進(jìn)一步通過(guò)聚類得到視覺單詞,然后利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐式空間到漢明空間的映射函數(shù),得到低維空間漢明向量。該方法用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性。但是,該專利申請(qǐng)?zhí)岢龅姆椒ù嬖诘牟蛔阒幨牵涸摲椒ㄈ詻]有避免譜哈希模型中強(qiáng)制訓(xùn)練數(shù)據(jù)服從均勻分布的前提假設(shè),使其應(yīng)用價(jià)值受到限制。YunchaoGong和SvetlanaLazebnik在文章“IterativeQuantization:AProcrusteanApproachtoLearningBinaryCodes”(IEEEConferenceonComputerVisionandPatternRecognition,2011,pp.817-824)中提出一種迭代量化方法,該方法首先對(duì)圖像提取底層特征,然后使用主成分分析方法對(duì)底層特征降維,得到低維特征,然后對(duì)低維特征旋轉(zhuǎn)并量化得到圖像的編碼。該方法存在的不足是:該方法的前提假設(shè)是底層特征服從高斯分布,但實(shí)際數(shù)據(jù)可能并不服從高斯分布,并且該方法沒有使用數(shù)據(jù)的類標(biāo),從而使得檢索精度降低。

技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于針對(duì)上述已有技術(shù)的不足,提出一種基于半監(jiān)督哈希的圖像檢索方法,以節(jié)省哈希編碼的存儲(chǔ)空間,降低檢索的時(shí)間復(fù)雜度,有效提高圖像檢索的查準(zhǔn)率與查全率。實(shí)現(xiàn)本發(fā)明的技術(shù)方案是:對(duì)原始圖像提取底層特征,通過(guò)類標(biāo)傳遞對(duì)底層特征標(biāo)記,使用支持向量機(jī)對(duì)標(biāo)記后的底層特征分類,根據(jù)分類結(jié)果對(duì)圖像編碼,達(dá)到充分利用少量類標(biāo)數(shù)據(jù),得到更為緊湊的哈希碼。其實(shí)現(xiàn)步驟包括如下:(1)從圖像數(shù)據(jù)庫(kù)中提取10000張?jiān)紙D像,對(duì)每一張?jiān)紙D像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù);(2)對(duì)每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù);(3)將所有圖像的歸一化數(shù)據(jù)隨機(jī)分成三部分:已標(biāo)記的訓(xùn)練數(shù)據(jù)L、未標(biāo)記的訓(xùn)練數(shù)據(jù)U、測(cè)試數(shù)據(jù)T,并對(duì)已標(biāo)記的訓(xùn)練數(shù)據(jù)L標(biāo)記類標(biāo)HL,將已標(biāo)記的訓(xùn)練數(shù)據(jù)L和未標(biāo)記的訓(xùn)練數(shù)據(jù)U組合得到訓(xùn)練數(shù)據(jù)矩陣X;(4)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標(biāo)記的訓(xùn)練數(shù)據(jù)的類標(biāo)HL,使用類標(biāo)傳遞方法求得未標(biāo)記訓(xùn)練數(shù)據(jù)U的類標(biāo)HU,將已標(biāo)記的訓(xùn)練數(shù)據(jù)的類標(biāo)HL和未標(biāo)記訓(xùn)練數(shù)據(jù)的類標(biāo)HU組合得到訓(xùn)練數(shù)據(jù)矩陣的類標(biāo)H;(5)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X及訓(xùn)練數(shù)據(jù)矩陣的類標(biāo)H產(chǎn)生更新的訓(xùn)練數(shù)據(jù)的編碼B′;(6)使用訓(xùn)練數(shù)據(jù)矩陣X和更新的訓(xùn)練數(shù)據(jù)的編碼B′對(duì)K個(gè)支持向量機(jī)分類器進(jìn)行訓(xùn)練,其中K表示編碼位數(shù);(7)使用訓(xùn)練得到的K個(gè)支持向量機(jī)分類器對(duì)訓(xùn)練數(shù)據(jù)X和測(cè)試數(shù)據(jù)T進(jìn)行分類,根據(jù)分類結(jié)果得到訓(xùn)練數(shù)據(jù)X的哈希碼CX和測(cè)試數(shù)據(jù)T的哈希碼CT;(8)從測(cè)試數(shù)據(jù)的哈希碼CT中取一個(gè)測(cè)試數(shù)據(jù)的哈希碼t,計(jì)算該哈希碼t與訓(xùn)練數(shù)據(jù)的哈希碼CT之間的漢明距離,得到漢明距離向量;(9)對(duì)漢明距離向量中的數(shù)值按從小到大的順序進(jìn)行排序,按順序輸出對(duì)應(yīng)的原始圖像,得到檢索結(jié)果。本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn):第一,本發(fā)明由于引入了基于類標(biāo)傳遞的半監(jiān)督方法,克服了現(xiàn)有技術(shù)中對(duì)于類標(biāo)數(shù)量不足而引起的精度下降的缺點(diǎn),使得檢索精度更高。第二,本發(fā)明由于使用支持向量機(jī)分類器產(chǎn)生哈希碼,得到了更為緊湊的哈希碼,因此可以減少內(nèi)存空間的占用。第三,本發(fā)明由于使用漢明距離度量圖像間的相似度,可通過(guò)計(jì)算機(jī)很快的計(jì)算出漢明距離,因此加快了檢索速度。附圖說(shuō)明圖1為本發(fā)明的實(shí)現(xiàn)流程圖;圖2為本發(fā)明與現(xiàn)有哈希方法在手寫數(shù)字?jǐn)?shù)據(jù)庫(kù)下的仿真實(shí)驗(yàn)結(jié)果圖;圖3為本發(fā)明與現(xiàn)有哈希方法在PIE人臉數(shù)據(jù)庫(kù)下的仿真實(shí)驗(yàn)結(jié)果圖。具體實(shí)施方案下面結(jié)合附圖,對(duì)本發(fā)明實(shí)現(xiàn)的步驟和效果作進(jìn)一步的詳細(xì)描述。參照?qǐng)D1,本發(fā)明的實(shí)現(xiàn)步驟如下:步驟1,獲取原始圖像。從給定的圖像數(shù)據(jù)庫(kù)中提取10000張?jiān)紙D像,如果圖像數(shù)據(jù)庫(kù)中的圖像不足10000張,則取圖像數(shù)據(jù)庫(kù)中的所有圖像。步驟2,對(duì)每一張?jiān)紙D像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù)。(2a)對(duì)每一張?jiān)紙D像3個(gè)顏色通道的像素值取均值,得到該原始圖像數(shù)據(jù)的灰度圖像;(2b)利用Gabor濾波器對(duì)灰度圖像進(jìn)行4個(gè)尺度、8個(gè)方向的濾波,得到灰度圖像的32個(gè)特征圖;(2c)將每個(gè)特征圖分成大小為4×4的子網(wǎng)格,分別對(duì)每個(gè)子網(wǎng)格中的所有像素取均值,將該均值排列在一個(gè)向量中,得到這張圖像的特征數(shù)據(jù)。步驟3,對(duì)每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù)。(3a)對(duì)所有圖像的特征數(shù)據(jù)求均值,用每一張圖像特征數(shù)據(jù)減去該均值,得到特征數(shù)據(jù)的中心化數(shù)據(jù);(3b)對(duì)中心化數(shù)據(jù)中的每一個(gè)向量除以該向量的模,得到特征數(shù)據(jù)的歸一化數(shù)據(jù)。步驟4,對(duì)所有圖像的歸一化數(shù)據(jù)隨機(jī)劃分。(4a)將所有圖像的歸一化數(shù)據(jù)隨機(jī)分成三部分:第一部分是已標(biāo)記的訓(xùn)練數(shù)據(jù)L,第二部分是未標(biāo)記的訓(xùn)練數(shù)據(jù)U,第三部分是測(cè)試數(shù)據(jù)T;(4b)將已標(biāo)記的訓(xùn)練數(shù)據(jù)L的類標(biāo)標(biāo)記為HL;(4c)將已標(biāo)記的訓(xùn)練數(shù)據(jù)L和未標(biāo)記的訓(xùn)練數(shù)據(jù)U進(jìn)行組合,得到訓(xùn)練數(shù)據(jù)矩陣X。步驟5,根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標(biāo)記的訓(xùn)練數(shù)據(jù)的類標(biāo)HL,使用類標(biāo)傳遞方法求得所有訓(xùn)練數(shù)據(jù)的類標(biāo)H。(5a)建立初始標(biāo)記矩陣Y,Y的行數(shù)與訓(xùn)練數(shù)據(jù)矩陣X的行數(shù)相同,Y的列數(shù)與已標(biāo)記的訓(xùn)練數(shù)據(jù)的類標(biāo)HL中的最大值相同,Y中的每一個(gè)元素均初始化為零;(5b)對(duì)于訓(xùn)練數(shù)據(jù)矩陣X的第i行為已標(biāo)記、且其類標(biāo)為c的訓(xùn)練數(shù)據(jù),將初始標(biāo)記矩陣Y的第i行第c列的數(shù)賦值為1,從而得到更新的初始標(biāo)記矩陣Y;(5c)求訓(xùn)練數(shù)據(jù)矩陣X的每?jī)尚兄g的歐氏距離d,根據(jù)相似度公式求得這兩行之間的相似度w,其中σ=0.9,將訓(xùn)練數(shù)據(jù)矩陣X中的每?jī)尚兄g的相似度組合成相似度矩陣W;(5d)對(duì)相似度矩陣W的每一行求和,將求和結(jié)果作為矩陣的對(duì)角值,得到相似度矩陣的度矩陣D;(5e)根據(jù)相似度矩陣W和度矩陣D得到歸一化的相似度矩陣S:S=D-1/2WD-1/2(5f)根據(jù)相似度矩陣S和初始標(biāo)記矩陣Y得到類標(biāo)矩陣F:F=I-αS-1Y其中I是單位矩陣,α是調(diào)節(jié)參數(shù),取值為0.9,·-1表示對(duì)矩陣求逆;(5g)求類標(biāo)矩陣F的每一行的最大值所在位置,將最大值所在位置作為這一行所對(duì)應(yīng)的數(shù)據(jù)的類標(biāo),從而得到所有訓(xùn)練數(shù)據(jù)的類標(biāo)H。步驟6,根據(jù)訓(xùn)練數(shù)據(jù)矩陣X產(chǎn)生投影后的數(shù)據(jù)矩陣M和投影后的數(shù)據(jù)矩陣M的中值向量DM。(6a)隨機(jī)產(chǎn)生K個(gè)投影向量,組成投影矩陣P,其中K表示哈希碼的位數(shù);(6b)將訓(xùn)練數(shù)據(jù)矩陣X與投影矩陣P相乘,得到投影后的數(shù)據(jù)矩陣M;(6c)將投影后的數(shù)據(jù)矩陣M的每一列按從小到大排序,取排序結(jié)果的中間值,得到這一列的中值,將每一列的中值組合在一起,得到投影后的數(shù)據(jù)矩陣的中值向量DM。步驟7,根據(jù)投影后的數(shù)據(jù)矩陣M、訓(xùn)練數(shù)據(jù)的類標(biāo)H和投影后的數(shù)據(jù)矩陣M的中值向量DM產(chǎn)生更新的訓(xùn)練數(shù)據(jù)的編碼B′。(7a)將訓(xùn)練數(shù)據(jù)的編碼B初始化為全零矩陣,B的行數(shù)與訓(xùn)練數(shù)據(jù)矩陣X的行數(shù)相同,B的列數(shù)為編碼位數(shù)K;(7b)根據(jù)訓(xùn)練數(shù)據(jù)的類標(biāo)H,從投影后的數(shù)據(jù)矩陣M中取出第c類數(shù)據(jù),組成單類標(biāo)數(shù)據(jù)矩陣Mc;(7c)從單類標(biāo)數(shù)據(jù)矩陣Mc中取出第j列,組成向量vj;(7d)將向量vj中的每一個(gè)數(shù)與中值向量DM的第j個(gè)數(shù)DMj進(jìn)行比較,統(tǒng)計(jì)向量vj中數(shù)值大于DMj的個(gè)數(shù)mj和向量vj中數(shù)值小于DMj的個(gè)數(shù)nj;(7e)將上述mj與nj進(jìn)行比較,如果mj大于nj,將訓(xùn)練數(shù)據(jù)的編碼B的第j列的屬于第c類的行的數(shù)賦值為1,反之,將訓(xùn)練數(shù)據(jù)的編碼B的第j列的對(duì)應(yīng)的數(shù)賦值為0,從而得到更新的訓(xùn)練數(shù)據(jù)編碼B′。步驟8,使用訓(xùn)練數(shù)據(jù)矩陣X和更新的訓(xùn)練數(shù)據(jù)的編碼B′對(duì)K個(gè)支持向量機(jī)分類器進(jìn)行訓(xùn)練,得到K個(gè)訓(xùn)練好的支持向量機(jī)分類器,其中K表示哈希碼的位數(shù)。步驟9,使用K個(gè)訓(xùn)練好的支持向量機(jī)分類器對(duì)訓(xùn)練數(shù)據(jù)X進(jìn)行分類,將分類結(jié)果作為訓(xùn)練數(shù)據(jù)X的哈希碼CX,使用K個(gè)訓(xùn)練好的支持向量機(jī)分類器對(duì)測(cè)試數(shù)據(jù)T進(jìn)行分類,將分類結(jié)果作為測(cè)試數(shù)據(jù)T的哈希碼CT。步驟10,從測(cè)試數(shù)據(jù)T的哈希碼CT中取一個(gè)測(cè)試數(shù)據(jù)的哈希碼t,計(jì)算該哈希碼t與每一個(gè)訓(xùn)練數(shù)據(jù)X的哈希碼CX之間的漢明距離,組成漢明距離向量R。步驟11,輸出檢索結(jié)果。(11a)計(jì)算漢明距離向量R的最小值Rmin以及最小值Rmin所在的位置Pmin;(11b)將原始圖像數(shù)據(jù)庫(kù)中位置在Pmin的圖像輸出;(11c)將最小值Rmin從漢明距離向量R中刪除;(11d)重復(fù)(11a)到(11c),直到漢明距離向量R中不含有任何數(shù)據(jù),完成圖像檢索。本發(fā)明的效果結(jié)合以下仿真實(shí)驗(yàn)進(jìn)一步說(shuō)明:1.仿真條件本發(fā)明是在中央處理器為Intel(R)Corei5-34703.20GHZ、內(nèi)存8G、WINDOWS7操作系統(tǒng)上,運(yùn)用MATLAB軟件進(jìn)行的實(shí)驗(yàn)仿真。2.仿真內(nèi)容仿真1:在手寫數(shù)字?jǐn)?shù)據(jù)庫(kù)下分別采用本發(fā)明方法和現(xiàn)有哈希方法進(jìn)行圖像檢索仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖2所示。其中,圖2(a)為哈希編碼長(zhǎng)度取48位的查全率-查準(zhǔn)率曲線圖,橫軸表示查全率,縱軸表示查準(zhǔn)率。圖2(b)為哈希編碼長(zhǎng)度取64位的查全率-查準(zhǔn)率曲線圖,橫軸表示查全率,縱軸表示查準(zhǔn)率。圖2(c)為平均準(zhǔn)確率曲線圖,橫軸表示哈希編碼長(zhǎng)度,縱軸表示平均準(zhǔn)確率。仿真2:在PIE人臉數(shù)據(jù)庫(kù)下分別采用本發(fā)明方法和現(xiàn)有哈希方法進(jìn)行圖像檢索仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖3所示。其中,圖3(a)為哈希編碼長(zhǎng)度取48位的查全率-查準(zhǔn)率曲線圖,橫軸表示查全率,縱軸表示查準(zhǔn)率。圖3(b)為哈希編碼長(zhǎng)度取64位的查全率-查準(zhǔn)率曲線圖,橫軸表示查全率,縱軸表示查準(zhǔn)率。圖3(c)為平均準(zhǔn)確率曲線圖,橫軸表示哈希編碼長(zhǎng)度,縱軸表示平均準(zhǔn)確率。由圖2和圖3的仿真結(jié)果可見,采用本發(fā)明進(jìn)行圖像檢索的查全率-查準(zhǔn)率性能及平均準(zhǔn)確率性能都優(yōu)于現(xiàn)有的哈希方法。因此,與現(xiàn)有技術(shù)相比,本發(fā)明利用類標(biāo)傳遞和支持向量機(jī)的方法,能有效獲取原始圖像數(shù)據(jù)的哈希碼,從而提高了圖像檢索的性能。
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1