基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法與流程

文檔序號：11774766閱讀：524來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法與流程

本發(fā)明屬于計算機視覺和模式識別領(lǐng)域，涉及圖像與文本的互檢索，具體涉及一種基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法，可用于移動終端設(shè)備以及物聯(lián)網(wǎng)的圖像與文本互搜索服務(wù)。

背景技術(shù)：

近年來，隨著社會經(jīng)濟的迅速發(fā)展和科學(xué)技術(shù)的不斷進步，多媒體數(shù)據(jù)已經(jīng)成為互聯(lián)網(wǎng)上的主要信息載體。這些數(shù)據(jù)呈現(xiàn)爆炸式增長，現(xiàn)階段，大數(shù)據(jù)改變著人們的工作和生活，同時也對學(xué)術(shù)界的科學(xué)研究產(chǎn)生了很大的影響。如何利用這些大數(shù)據(jù)，如何對其進行高效率的存儲和管理，便成為我們最為關(guān)注的問題?；诠５淖罱徦阉魇墙鉀Q大規(guī)模多媒體數(shù)據(jù)存儲和管理有效的技術(shù)手段。現(xiàn)有的哈希方法研究方向大致劃分為三類：單模態(tài)哈希方法、多視圖哈希方法和跨模態(tài)哈希方法?；诠Ｋ惴ǖ膯我荒B(tài)數(shù)據(jù)檢索方法在圖像檢索領(lǐng)域已經(jīng)得到了較為充分地研究。而多視圖哈希方法在特定情況下可以轉(zhuǎn)換成單模態(tài)或者跨模態(tài)哈希問題，所以，對多視圖哈希方法的研究比較少。為了促進大規(guī)模相似性搜索的發(fā)展，近年來一些跨模態(tài)哈希檢索方法被提出?？缒B(tài)哈希方法可以分為無監(jiān)督方法和有監(jiān)督方法，無監(jiān)督方法主要通過挖掘和保持多模態(tài)數(shù)據(jù)的潛在相關(guān)性來獲得哈希編碼，而有監(jiān)督跨模態(tài)哈希方法旨在利用訓(xùn)練數(shù)據(jù)類標信息的語義相似性，來提高哈希檢索的檢索精度?，F(xiàn)實生活中，多媒體數(shù)據(jù)量大、維度較高并且不同模態(tài)之間具有語義關(guān)聯(lián)性，所以如何得到高檢索精度的監(jiān)督哈希算法，實現(xiàn)跨模態(tài)數(shù)據(jù)之間的檢索，是我們現(xiàn)階段急需解決的問題?，F(xiàn)階段，研究人員已經(jīng)提出部分監(jiān)督跨模態(tài)哈希檢索方法。

例如bronsteinm，bronsteina和michelf等人在2010年的computervisionandpatternrecognition會議，發(fā)表了名為“datafusionthroughcross-modalitymetriclearningusingsimilaritysensitivehashing”的文章，提出了一種監(jiān)督的跨模態(tài)相似性敏感哈希方法。這一方法通過產(chǎn)生一些正負樣本對，然后將每一位哈希編碼的學(xué)習過程表示為一個二元分類問題，最后利用boosting的方式進行求解。但這一方法只保持了模態(tài)間的相似性，沒有考慮模態(tài)內(nèi)的相似性，檢索精度有待提高。

綜上，現(xiàn)階段存在的監(jiān)督跨模態(tài)哈希檢索方法利用數(shù)據(jù)類標信息不全面，對數(shù)據(jù)的描述不準確，從而影響跨模態(tài)檢索精度。

技術(shù)實現(xiàn)要素：

本發(fā)明的目的在于針對上述已有技術(shù)的不足，提出了一種基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法，用于解決現(xiàn)有監(jiān)督跨模態(tài)哈希檢索方法中存在的檢索精度低的技術(shù)問題。

為實現(xiàn)上述目的，本發(fā)明采取的技術(shù)方案包括有如下步驟：

(1)獲取原始訓(xùn)練數(shù)據(jù)，并對原始訓(xùn)練數(shù)據(jù)進行歸一化，得到歸一化訓(xùn)練數(shù)據(jù)x^(t)，其中，t表示歸一化訓(xùn)練數(shù)據(jù)的類型，且t∈{1,2}，x⁽¹⁾表示歸一化圖像訓(xùn)練數(shù)據(jù)，x⁽²⁾表示歸一化文本訓(xùn)練數(shù)據(jù)；

(2)獲取原始測試數(shù)據(jù)，并對原始測試數(shù)據(jù)進行歸一化，得到歸一化測試數(shù)據(jù)y^(t)，其中，t表示歸一化測試數(shù)據(jù)的類型，且t∈{1,2}，y⁽¹⁾表示歸一化圖像測試數(shù)據(jù)，y⁽²⁾表示歸一化文本測試數(shù)據(jù)；

(3)對歸一化訓(xùn)練數(shù)據(jù)x^(t)進行分類：根據(jù)歸一化訓(xùn)練數(shù)據(jù)x^(t)所對應(yīng)的類標信息l，將歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾均分為c類；

(4)獲取歸一化訓(xùn)練數(shù)據(jù)x^(t)的三個訓(xùn)練數(shù)據(jù)參數(shù)：

(4a)獲取歸一化訓(xùn)練數(shù)據(jù)x^(t)的三個后驗分布：采用非參數(shù)貝葉斯模型，對歸一化訓(xùn)練數(shù)據(jù)x^(t)中的每一個訓(xùn)練數(shù)據(jù)點進行描述，得到歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)整體均值服從的后驗分布、訓(xùn)練數(shù)據(jù)所屬類別均值服從的后驗分布以及訓(xùn)練數(shù)據(jù)協(xié)方差矩陣的逆服從的后驗分布，其中,i表示第i個訓(xùn)練數(shù)據(jù)點，且i＝1,2,…,n，n表示數(shù)據(jù)點的個數(shù)，c表示分類類別，且c＝1,2,…,c；

(4b)獲取歸一化訓(xùn)練數(shù)據(jù)x^(t)的三個訓(xùn)練數(shù)據(jù)參數(shù)：將每一個訓(xùn)練數(shù)據(jù)點分別代入三個后驗分布，計算歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)整體均值訓(xùn)練數(shù)據(jù)所屬類別均值以及訓(xùn)練數(shù)據(jù)協(xié)方差矩陣的逆

(5)獲取歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾同屬于每一類的概率p(x⁽¹⁾,x⁽²⁾|k)：

(5a)獲取歸一化訓(xùn)練數(shù)據(jù)x^(t)每一個訓(xùn)練數(shù)據(jù)點屬于第c類的概率假設(shè)歸一化訓(xùn)練數(shù)據(jù)x^(t)的所有訓(xùn)練數(shù)據(jù)服從高斯分布，即

分別計算每一個訓(xùn)練數(shù)據(jù)屬于第c類的概率

(5b)獲取圖像訓(xùn)練數(shù)據(jù)點和對應(yīng)的文本訓(xùn)練數(shù)據(jù)點同屬于第c類的概率將與相乘，得到圖像訓(xùn)練數(shù)據(jù)點和對應(yīng)的文本訓(xùn)練數(shù)據(jù)點同屬于第c類的概率其中，k表示分類類別集合，且k∈{1,2,…,c}，表示歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)協(xié)方差矩陣；

(6)獲取訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)：將概率p(x⁽¹⁾,x⁽²⁾|k)代入貝葉斯公式，計算訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)；

(7)獲取歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹)和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr：

(7a)隨機生成一個矩陣m＝[mch]c×r，其中，mch表示矩陣m中的一個元素，且mch∈(0,1)；

(7b)將訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)和矩陣m＝[mch]c×r相乘，得到歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的后驗概率p(btr|x⁽¹⁾,x⁽²⁾)；

(7c)對歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的后驗概率p(btr|x⁽¹⁾,x⁽²⁾)中的每一個元素進行伯努利采樣，得到歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr；

(8)獲取歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼

(8a)獲取歸一化測試數(shù)據(jù)y^(t)屬于每一類的概率p(y^(t)|k)：假設(shè)歸一化測試數(shù)據(jù)y^(t)的所有測試數(shù)據(jù)服從高斯分布，即分別計算每一個測試數(shù)據(jù)點屬于第c類的概率

(8b)獲取歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))：將概率p(y^(t)|k)代入貝葉斯公式，計算得到歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))；

(8c)將歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))和矩陣m＝[mch]c×r相乘，得到歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率

(8d)對歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率中的每一個元素進行伯努利采樣，得到歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼其中，j表示第j個測試數(shù)據(jù)點，且j＝1,2,…,nte，nte表示測試數(shù)據(jù)點的個數(shù)；

(9)計算歸一化測試數(shù)據(jù)y^(t)的哈希編碼與歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的漢明距離矩陣dh；

(10)獲取歸一化測試數(shù)據(jù)y^(t)的檢索結(jié)果：分別獲取漢明距離矩陣dh中每一行最小的前a個漢明距離值，并將得到的每一行的a個漢明距離值所對應(yīng)的訓(xùn)練數(shù)據(jù)作為歸一化測試數(shù)據(jù)y^(t)的檢索結(jié)果，完成基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索。

本發(fā)明與現(xiàn)有技術(shù)相比，具有以下優(yōu)點：

本發(fā)明利用數(shù)據(jù)類標信息對訓(xùn)練數(shù)據(jù)進行分類，按照數(shù)據(jù)實際分布情況，將訓(xùn)練數(shù)據(jù)分為整體均值、所屬類別均值以及誤差三部分，使用狄利克雷過程作為實際數(shù)據(jù)所屬類別均值的先驗分布，使用非參數(shù)貝葉斯模型對數(shù)據(jù)分布進行有效地描述，明顯提高了跨模態(tài)哈希檢索的精度。

附圖說明

圖1為本發(fā)明的實現(xiàn)流程圖；

圖2為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在wiki數(shù)據(jù)庫下的采樣前300個檢索結(jié)果精度隨著編碼長度變化的曲線對比圖,其中，圖2(a)為采樣前300個檢索結(jié)果的圖像查詢文本的精度隨著編碼長度變化曲線圖，圖2(b)為采樣前300個檢索結(jié)果的文本查詢圖像的精度隨著編碼長度變化曲線圖；

圖3為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在wiki數(shù)據(jù)庫下的精度-召回率實驗結(jié)果曲線對比圖，其中，圖3(a)為編碼長度取32位的圖像查詢文本精度-召回率曲線圖，圖3(b)為編碼長度取32位的文本查詢圖像精度-召回率曲線圖；

圖4為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在labelme數(shù)據(jù)庫下的采樣前300個檢索結(jié)果精度隨著編碼長度變化的曲線對比圖,其中，圖4(a)為采樣前300個檢索結(jié)果的圖像查詢文本的精度隨著編碼長度變化曲線圖，圖4(b)為采樣前300個檢索結(jié)果的文本查詢圖像的精度隨著編碼長度變化曲線圖；

圖5為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在labelme數(shù)據(jù)庫下的精度-召回率實驗結(jié)果曲線對比圖，其中，圖5(a)為編碼長度取32位的圖像查詢文本精度-召回率曲線圖，圖5(b)為編碼長度取32位的文本查詢圖像精度-召回率曲線圖。

具體實施方式

下面結(jié)合附圖和具體實施例，對本發(fā)明作進一步詳細描述。

參照圖1，基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法，包括如下步驟：

步驟1)獲取原始訓(xùn)練數(shù)據(jù)，并對原始訓(xùn)練數(shù)據(jù)進行歸一化，得到歸一化訓(xùn)練數(shù)據(jù)x^(t)，其中，t表示歸一化訓(xùn)練數(shù)據(jù)的類型，且t∈{1,2}，x⁽¹⁾表示歸一化圖像訓(xùn)練數(shù)據(jù)，x⁽²⁾表示歸一化文本訓(xùn)練數(shù)據(jù)；

步驟2)獲取原始測試數(shù)據(jù)，并對原始測試數(shù)據(jù)進行歸一化，得到歸一化測試數(shù)據(jù)y^(t)，其中，t表示歸一化測試數(shù)據(jù)的類型，且t∈{1,2}，y⁽¹⁾表示歸一化圖像測試數(shù)據(jù)，y⁽²⁾表示歸一化文本測試數(shù)據(jù)；

步驟3)對歸一化訓(xùn)練數(shù)據(jù)x^(t)進行分類：根據(jù)歸一化訓(xùn)練數(shù)據(jù)x^(t)所對應(yīng)的類標信息l，將歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾均分為c類；

步驟4)獲取歸一化訓(xùn)練數(shù)據(jù)x^(t)的三個訓(xùn)練數(shù)據(jù)參數(shù)：

(i)歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)整體均值服從的后驗分布的表達式為：

(ii)歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)所屬類別均值服從的后驗分布的表達式為：

(iii)歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)協(xié)方差矩陣的逆服從的后驗分布的表達式為：

其中,i表示第i個訓(xùn)練數(shù)據(jù)點，且i＝1,2,…,n，n表示數(shù)據(jù)點的個數(shù)，c表示分類類別，且c＝1,2,…,c，表示含有c個主成分的高斯混合模型，表示第c個高斯的權(quán)重，nc表示歸一化訓(xùn)練數(shù)據(jù)第c類所含的訓(xùn)練數(shù)據(jù)點個數(shù)，歸一化訓(xùn)練數(shù)據(jù)所屬類別均值服從的后驗分布是通過假設(shè)歸一化訓(xùn)練數(shù)據(jù)所屬類別均值先驗分布服從狄利克雷過程推導(dǎo)得到的，即

δ·表示δ函數(shù)，νi表示第i個訓(xùn)練數(shù)據(jù)點的所屬類別均值，id表示d維單位矩陣，d為每一個訓(xùn)練數(shù)據(jù)點x^(t)的維數(shù)，α0表示調(diào)節(jié)參數(shù)，g0表示狄利克雷過程的基礎(chǔ)分布，訓(xùn)練數(shù)據(jù)協(xié)方差矩陣的逆服從的后驗分布是通過假設(shè)歸一化訓(xùn)練數(shù)據(jù)x^(t)的訓(xùn)練數(shù)據(jù)協(xié)方差矩陣的逆先驗分布服從威沙特分布推導(dǎo)得到的，即m表示自由度，vd表示p×p的尺度矩陣；

步驟5)獲取歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾同屬于每一類的概率p(x⁽¹⁾,x⁽²⁾|k)：

分別計算每一個訓(xùn)練數(shù)據(jù)屬于第c類的概率

步驟6)獲取訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)：將概率p(x⁽¹⁾,x⁽²⁾|k)代入貝葉斯公式，計算訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)，計算訓(xùn)練數(shù)據(jù)后驗概率p(k|x⁽¹⁾,x⁽²⁾)的表達式為：

其中，p(x⁽¹⁾,x⁽²⁾|c)表示歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾同屬于第c類的概率，p(k)表示類別的邊緣分布，p(k)中有c個元素，此處假設(shè)p(k)中每一個元素均服從均勻分布，即

步驟7)獲取歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr：

(7a)隨機生成一個矩陣m＝[mch]c×r，其中，mch表示矩陣m中的一個元素，且mch∈(0,1)；

(7c)對歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的后驗概率p(btr|x⁽¹⁾,x⁽²⁾)中的每一個元素pbtr進行伯努利采樣，得到歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr，伯努利采樣的過程如下：

(7c1)隨機產(chǎn)生一個和歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的后驗概率p(btr|x⁽¹⁾,x⁽²⁾)同大小的隨機數(shù)矩陣ttr；

(7c2)比較歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的后驗概率p(btr|x⁽¹⁾,x⁽²⁾)中的每一個元素和隨機數(shù)矩陣ttr中對應(yīng)位置元素的大小，得到哈希編碼btr對應(yīng)位置元素btr，其中，ttr為隨機數(shù)矩陣ttr中與對應(yīng)元素的表示，且ttr∈(0,1)，

步驟8)獲取歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼

(8b)獲取歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))：將概率p(y^(t)|k)代入貝葉斯公式，計算得到歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))，計算歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))的表達式為：

其中，p(y^(t)|c)表示歸一化測試數(shù)據(jù)y^(t)屬于第c類的概率；

(8c)將歸一化測試數(shù)據(jù)后驗概率p(k|y^(t))和矩陣m＝[mch]c×r相乘，得到歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率

(8d)對歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率中的每一個元素進行伯努利采樣，得到歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼伯努利采樣過程為：

(8d1)隨機產(chǎn)生一個和歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率同大小的測試數(shù)據(jù)隨機數(shù)矩陣tte；

(8d2)比較歸一化測試數(shù)據(jù)y^(t)的r位哈希編碼的后驗概率和測試數(shù)據(jù)隨機數(shù)矩陣tte中對應(yīng)位置元素的大小，得到測試數(shù)據(jù)哈希編碼中對應(yīng)位置元素其中，j表示第j個測試數(shù)據(jù)點，且j＝1,2,…,nte，nte表示測試數(shù)據(jù)點的個數(shù)，tte為隨機數(shù)矩陣tte中與對應(yīng)元素的表示，且tte∈(0,1)，

步驟9)計算歸一化測試數(shù)據(jù)y(t)的哈希編碼與歸一化圖像訓(xùn)練數(shù)據(jù)x⁽¹⁾和歸一化文本訓(xùn)練數(shù)據(jù)x⁽²⁾統(tǒng)一的r位哈希編碼btr的漢明距離矩陣dh；

步驟10)獲取歸一化測試數(shù)據(jù)y^(t)的檢索結(jié)果：分別獲取漢明距離矩陣dh中每一行最小的前a個漢明距離值，并將得到的每一行a個漢明距離值所對應(yīng)的訓(xùn)練數(shù)據(jù)作為歸一化測試數(shù)據(jù)y^(t)的檢索結(jié)果，完成基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索。

以下結(jié)合仿真實驗，對本發(fā)明的技術(shù)效果作進一步說明。

1.仿真條件：

本發(fā)明的仿真是在中央處理器為intel(r)core(tm)i3-21003.10ghz、內(nèi)存16g、windows7操作系統(tǒng)上，運用matlab軟件進行的實驗仿真，每種仿真均重復(fù)獨立運行10次，取其平均值作為最終結(jié)果。

實驗中的參數(shù)設(shè)置為：對于wiki數(shù)據(jù)庫和labelme數(shù)據(jù)庫，設(shè)置調(diào)節(jié)參數(shù)α0＝1，基礎(chǔ)分布g0為標準正態(tài)分布。設(shè)置wiki數(shù)據(jù)庫尺度矩陣vd＝0.001i，設(shè)置labelme數(shù)據(jù)庫尺度矩陣vd＝0.1i。

2.仿真內(nèi)容及結(jié)果分析

本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法進行了對比，作為對比的哈希方法分別是協(xié)同矩陣分解哈希(collectivematrixfactorizationhashing,cmfh)方法、跨媒體哈希(inter-mediahashing，imh)方法以及跨視角哈希(cross-viewhashing,cvh)方法。

仿真實驗中，設(shè)置編碼長度分別為16位、32位、64位以及128位，對wiki數(shù)據(jù)庫和labelme數(shù)據(jù)庫來評估檢索精度。圖2和圖3為wiki數(shù)據(jù)庫的仿真結(jié)果圖；圖4和圖5為labelme數(shù)據(jù)庫的仿真結(jié)果圖。

仿真1：在wiki數(shù)據(jù)庫下分別采用本發(fā)明方法和現(xiàn)有三種跨模態(tài)哈希檢索方法進行性能對比，實驗結(jié)果圖如圖2和圖3所示。其中，

圖2(a)為隨著編碼長度的變化采樣前300圖像查詢文本精度曲線圖，橫軸表示哈希編碼長度，縱軸表示采樣前300圖像查詢文本結(jié)果的精度。圖中可見，本發(fā)明的圖像查詢文本的精度完全高于其它三個對比方法，表現(xiàn)出了良好的圖像對文本的檢索性能。

圖2(b)為隨著編碼長度的變化采樣前300文本查詢圖像精度曲線圖，橫軸表示哈希編碼長度，縱軸表示采樣前300文本查詢圖像結(jié)果的精度。圖中可見，本發(fā)明的文本查詢圖像的精度完全高于其它三個對比方法，表現(xiàn)出了良好的文本對圖像的檢索性能。

圖3(a)為編碼長度取32位的圖像查詢文本精度-召回率曲線圖，橫軸表示召回率，縱軸表示精度。圖中可見，本發(fā)明結(jié)果曲線與坐標軸所圍的面積和cmfh方法持平，表示在編碼長度取32位時，兩者的圖像檢索文本性能相差不多。

圖3(b)為編碼長度取32位的文本查詢圖像精度-召回率曲線圖，橫軸表示召回率，縱軸表示精度。圖中可見，本發(fā)明結(jié)果曲線與坐標軸所圍的面積比其它三種對比方法都大，表示在編碼長度取32位時，本發(fā)明的文本檢索圖像性能良好。

仿真2：在labelme數(shù)據(jù)庫下分別采用本發(fā)明方法和現(xiàn)有三種跨模態(tài)檢索方法進行檢索結(jié)果對比，實驗結(jié)果圖如圖4和圖5所示。其中，

圖4(a)為隨著編碼長度的變化采樣前300圖像查詢文本精度曲線圖，橫軸表示哈希編碼長度，縱軸表示采樣前300圖像查詢文本結(jié)果的精度。圖中可見，本發(fā)明的圖像查詢文本的精度完全高于其它三個對比方法，表現(xiàn)出了良好的圖像對文本的檢索性能。

圖4(b)為隨著編碼長度的變化采樣前300文本查詢圖像精度曲線圖，橫軸表示哈希編碼長度，縱軸表示采樣前300文本查詢圖像結(jié)果的精度。圖中可見，本發(fā)明的文本查詢圖像的精度完全高于其它三個對比方法，表現(xiàn)出了良好的文本對圖像的檢索性能。

圖5(a)為編碼長度取32位的圖像查詢文本精度-召回率曲線圖，橫軸表示召回率，縱軸表示精度。圖中可見，本發(fā)明結(jié)果曲線與坐標軸所圍的面積比其它三種對比方法都大，表示在編碼長度取32位時，本發(fā)明的圖像檢索文本性能良好。

圖5(b)為編碼長度取32位的文本查詢圖像精度-召回率曲線圖，橫軸表示召回率，縱軸表示精度。圖中可見，本發(fā)明結(jié)果曲線與坐標軸所圍的面積比其它三種對比方法稍大，表示在編碼長度取32位時，本發(fā)明的文本檢索圖像性能比其它三種對比方法稍好。

由圖2、圖3、圖4和圖5的仿真結(jié)果可見，采用本發(fā)明進行跨模態(tài)檢索的精度高于采用現(xiàn)有方法進行跨模態(tài)檢索的精度。所以，與現(xiàn)有的技術(shù)相比，本發(fā)明能夠有效利用非參數(shù)貝葉斯模型描述數(shù)據(jù)實際分布，提高跨模態(tài)檢索的精度。

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王秀美;王鑫鑫;高新波;張?zhí)煺?李潔;田春娜;鄧成
技術(shù)所有人：西安電子科技大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

貝葉斯網(wǎng)絡(luò)模型相關(guān)技術(shù)

貝葉斯預(yù)測模型相關(guān)技術(shù)

貝葉斯模型相關(guān)技術(shù)

樸素貝葉斯模型相關(guān)技術(shù)

分層貝葉斯模型相關(guān)技術(shù)

貝葉斯概率模型相關(guān)技術(shù)

貝葉斯模型平均相關(guān)技術(shù)

貝葉斯預(yù)測模型實例相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于非參數(shù)貝葉斯模型的監(jiān)督跨模態(tài)哈希檢索方法與流程