亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種高效的圖像檢索性能預(yù)測方法

文檔序號:6635683閱讀:440來源:國知局
一種高效的圖像檢索性能預(yù)測方法
【專利摘要】本發(fā)明公開了一種高效的圖像檢索性能預(yù)測方法,該方法包括:基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片;基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺相似度來確定每一張圖片的投票數(shù),進(jìn)而估計所述檢索結(jié)果中每一張圖片與輸入的查詢請求之間的相關(guān)性概率;綜合檢索結(jié)果中所有圖片與輸入的查詢請求之間的相關(guān)性概率來計算本次圖像檢索的平均準(zhǔn)確率,實現(xiàn)高效的圖像檢索性能預(yù)測。本發(fā)明公開的方法復(fù)雜度較低,便于實現(xiàn),不易受噪聲影響且能較為準(zhǔn)確的對圖像檢索性能進(jìn)行預(yù)測。
【專利說明】-種高效的圖像檢索性能預(yù)測方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像檢索【技術(shù)領(lǐng)域】,尤其涉及一種高效的圖像檢索性能預(yù)測方法。

【背景技術(shù)】
[0002] 圖像檢索技術(shù)是在給定查詢文本或者圖像的前提下,依據(jù)內(nèi)容信息或者指定查詢 標(biāo)準(zhǔn),從圖像數(shù)據(jù)庫中搜索與用戶查詢相關(guān)的圖片,并按照圖片與查詢間的相關(guān)程度從高 到低對圖片進(jìn)行排序并將排序結(jié)果返回給用戶。圖像檢索技術(shù)的研究已經(jīng)取得了巨大的 進(jìn)展,許多檢索模型被相繼提出并在實踐中不斷得到校驗、改進(jìn)和驗證,但是大多數(shù)檢索系 統(tǒng)還存在嚴(yán)重的魯棒性問題,例如,對于某些查詢,檢索結(jié)果質(zhì)量高,而對于其它查詢,檢索 結(jié)果含有很多查詢無關(guān)的圖像。針對不同查詢其檢索結(jié)果間往往存在較大的差異;更有甚 者,即使那些平均檢索性能很好的檢索系統(tǒng),但對某些查詢,它們的檢索結(jié)果也不能令人滿 意。因此,我們希望檢索系統(tǒng)能夠自動識別那些檢索結(jié)果比較差的查詢,并對它們做相應(yīng)的 處理。
[0003] 查詢性能預(yù)測是信息檢索領(lǐng)域研究的前沿問題。該技術(shù)嘗試在沒有相關(guān)信息(即 不知道檢索結(jié)果與查詢的相關(guān)程度)的情況下,評估檢索系統(tǒng)對某一查詢其返回結(jié)果的好 壞程度。查詢性能預(yù)測能夠同時對用戶和檢索系統(tǒng)產(chǎn)生有益的影響。從用戶的角度講,該 技術(shù)可W提供有價值的反饋信息,比如,當(dāng)檢索系統(tǒng)預(yù)測出某用戶的查詢結(jié)果比較差的時 候,可W將該信息反饋給用戶,然后用戶可W重構(gòu)他的查詢,甚至進(jìn)一步與檢索系統(tǒng)互動W 獲得更好地檢索結(jié)果;對檢索系統(tǒng)來說,在理想情況下,如果一個檢索系統(tǒng)能夠預(yù)測某一查 詢的性能,那么它就可W自動地調(diào)整其參數(shù)或者算法來適應(yīng)不同的查詢,從而獲得更好的 檢索性能。
[0004] 相對于長期為提高檢索系統(tǒng)性能在檢索模型上的探索,圖像檢索查詢性能預(yù)測的 研究還處于初級階段。最初關(guān)于圖像檢索查詢性能預(yù)測的研究是基于文本信息的,主要通 過研究檢索返回圖片周圍的文本信息(上下文文本,圖片U化等)與輸入查詢文本之間的 相互關(guān)系,例如文本的具體性、一般性、歧義性和形象性等。該些研究主要存在兩點不足:1) 忽略圖像的視覺內(nèi)容僅依賴于文本信息,然而文本不足W描述豐富的視覺信息W及文本信 息往往包含很多"噪聲";2)沒有估計真實的圖像檢索結(jié)果質(zhì)量,而只是簡單將查詢分為容 易和困難兩類。
[0005] 目前大部分研究是針對檢索返回圖片視覺內(nèi)容的查詢性能預(yù)測。該研究的主要 思想是首先將圖片表示成由視覺單詞組成的"文檔",然后借用文本分析的方法統(tǒng)計一些特 性,比如計算由返回圖片構(gòu)成的語言模型和由整個圖片集構(gòu)成的語言模型之間的概率分布 差異性;估計返回圖片之間的空間一致性;研究針對檢索返回列表排名靠前的圖片視覺一 致性;W及研究返回圖片的視覺相似性分布等等。該些研究先提出合理的假設(shè),然后充分利 用圖片的視覺信息,來估計檢索結(jié)果的查詢性能,推動了圖像檢索查詢性能預(yù)測技術(shù)的發(fā) 展。但是該些方法只是給出了一個查詢性能高低的指示值,并沒有估計出檢索結(jié)果質(zhì)量的 真值。
[0006] 目前的研究方法中,除了上述方法外,還有從直接估計真實檢索性能方面研究的 方法。該方法的大致思想是,首先估計每個返回圖片與給定查詢的相關(guān)性概率,然后利用得 到的相關(guān)性概率來估計平均準(zhǔn)確率,其關(guān)鍵點就是如何準(zhǔn)確得估計相關(guān)性概率。由于該方 法是一種直接估計檢索結(jié)果質(zhì)量真值的方法,所W如果無法準(zhǔn)確估計出相關(guān)性概率,那么 勢必會影響最終結(jié)果的準(zhǔn)確性。


【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的是提供一種高效的圖像檢索性能預(yù)測方法,該方法復(fù)雜度較低,便 于實現(xiàn),不易受噪聲影響且能較為準(zhǔn)確的對圖像檢索性能進(jìn)行預(yù)測。
[0008] 本發(fā)明的目的是通過W下技術(shù)方案實現(xiàn)的:
[0009] 一種高效的圖像檢索性能預(yù)測方法,該方法包括:
[0010] 基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片;
[0011] 基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺相 似度來確定每一張圖片的投票數(shù),進(jìn)而估計所述檢索結(jié)果中每一張圖片與輸入的查詢請求 之間的相關(guān)性概率;
[0012] 綜合檢索結(jié)果中所有圖片與輸入的查詢請求之間的相關(guān)性概率來計算本次圖像 檢索的平均準(zhǔn)確率,實現(xiàn)高效的圖像檢索性能預(yù)測。
[0013] 進(jìn)一步的,所述基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片包括:
[0014] 利用圖像檢索重排序方法對檢索結(jié)果進(jìn)行重新排序,再基于偽相關(guān)反饋技術(shù)從重 新排序的檢索結(jié)果中自適應(yīng)的選擇樣例圖片;所述樣例圖片包括正樣例圖片集合與負(fù)樣例 圖片集合,或者僅包括正樣例圖片集合;所述正樣例圖片集合為重新排序的檢索結(jié)果中排 名為前K的圖片,所述負(fù)樣例圖片集合為重新排序的檢索結(jié)果中排名為后K的圖片;其中, K的數(shù)值通過一致性得分CoS的方法來確定,表示為:
[0015]

【權(quán)利要求】
1. 一種高效的圖像檢索性能預(yù)測方法,其特征在于,該方法包括: 基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片; 基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺相似度 來確定每一張圖片的投票數(shù),進(jìn)而估計所述檢索結(jié)果中每一張圖片與輸入的查詢請求之間 的相關(guān)性概率; 綜合檢索結(jié)果中所有圖片與輸入的查詢請求之間的相關(guān)性概率來計算本次圖像檢索 的平均準(zhǔn)確率,實現(xiàn)高效的圖像檢索性能預(yù)測。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中 自適應(yīng)的選擇樣例圖片包括: 利用圖像檢索重排序方法對檢索結(jié)果進(jìn)行重新排序,再基于偽相關(guān)反饋技術(shù)從重新排 序的檢索結(jié)果中自適應(yīng)的選擇樣例圖片;所述樣例圖片包括正樣例圖片集合與負(fù)樣例圖片 集合,或者僅包括正樣例圖片集合;所述正樣例圖片集合為重新排序的檢索結(jié)果中排名為 前K的圖片,所述負(fù)樣例圖片集合為重新排序的檢索結(jié)果中排名為后K的圖片;其中,K的 數(shù)值通過一致性得分CoS的方法來確定,表示為:
其中,礦表示K的最優(yōu)值,L和M分別表示K值的最小值和最大值;CoS (K)為所選擇的 正樣例圖片中滿足一致性的圖片對所占的百分比,表示為:
上式中,S(I^P)表示圖片Ii和P之間的視覺相似度,U為預(yù)設(shè)的閾值。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,計算檢索結(jié)果中每一張圖片與所述樣 例圖片的視覺相似度的步驟包括: 采用視覺詞袋模型和向量空間模型將所有圖片表示成一組向量,包括:采用密集采 樣尺度不變特征轉(zhuǎn)換技術(shù)Dense SIFT提取每一圖片的SIFT特征;然后,使用聚類算法 K-means將得到的所有SIFT特征聚成包含S個視覺單詞visual word的碼本;按照最近鄰 準(zhǔn)則將所有SIFT特征量化到對應(yīng)的visual word上;再使用TF-IDF權(quán)重機(jī)制來衡量每個 visual word在每張圖片中的重要性;最后,用向量空間模型來表示每張圖片; 圖片Ii的向量表達(dá)式為f =[#¥,...,<],Xi中每維向量勺計算如下: X11 , I-1,2, ...,S ; 其中,tf\表示視覺單詞W1在圖片Ii中出現(xiàn)的頻率,Idf1表示逆文檔頻率,用于衡量視 覺單詞W1在整個圖片集中的重要性; 采用余弦函數(shù)cosine來計算檢索結(jié)果中圖片Ii和樣例圖片Dk的視覺相似度s (Ii, Dk), 表示為:
4. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述基于投票決策機(jī)制,并根據(jù)所述 檢索結(jié)果中每一張圖片與所述樣例圖片的相似度來確定每一張圖片的投票數(shù)包括: 將檢索結(jié)果中每一張圖片分別與樣例圖片中的正樣例圖片集合P中的每一樣例圖片 以及負(fù)樣例圖片集合N中每一樣例圖片進(jìn)行視覺相似度計算,若計算結(jié)果大于閾值,則該 圖片獲得一張相應(yīng)的初始投票,表示為:
其中,與VO^分別表示圖片Ii與正樣例圖片集合p中第k個圖片以及負(fù)樣例圖 片集合N中第k個圖片進(jìn)行視覺相似度計算后獲得的初始正負(fù)票數(shù),M表示檢索結(jié)果中的 圖片數(shù)量,U為預(yù)設(shè)的閾值; 再根據(jù)每一圖片獲得的初始投票總數(shù)確認(rèn)其最終投票數(shù),表示為:
其中,與分別表示圖片Ii最終的正投票數(shù)與負(fù)投票數(shù)。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述估計所述檢索結(jié)果中每一張圖片與 輸入的查詢請求之間的相關(guān)性概率包括: 若所述樣例圖片包括正樣例圖片集合與負(fù)樣例圖片集合,則圖片Ii與輸入的查詢請求 之間的相關(guān)性概率Pi計算公式為:
若所述樣例圖片僅包括正樣例圖片集合,則將所述正樣例圖片集合中每一正樣例圖片 做為一個分類器,再利用回歸算法來整合每個分類器的分類結(jié)果,獲得圖片Ii與輸入的查 詢請求之間的相關(guān)性概率Pi :
其中,fkdO表示第k個分類器對圖片Ii的分類結(jié)果,當(dāng)圖片獲得一張正投票時,L(Ii)=1,否貝U,4(1) = 〇。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述綜合檢索結(jié)果中所有圖片與輸入的 查詢請求之間的相關(guān)性概率來計算本次圖像檢索的平均準(zhǔn)確率包括: 對于樣例圖片包括正樣例圖片集合與負(fù)樣例圖片集合的情況,計算本次圖像檢索的平 均準(zhǔn)確率的公式為:
其中,T表示對檢索結(jié)果進(jìn)行重新排序后排名前T的所有圖片,rel(i)為一個二值函 數(shù),表示當(dāng)排名第i的圖片與輸入的查詢請求相關(guān),則rel (i) = 1,否則,rel (i) = 0, i屬 于[1,T],j屬于[1,i] ;ZT為一個歸一化系數(shù); 對于樣例圖片僅包括正樣例圖片集合的情況,計算本次圖像檢索的平均準(zhǔn)確率的公式 為:
其中,E表示數(shù)學(xué)期望。
【文檔編號】G06F17/30GK104331513SQ201410685896
【公開日】2015年2月4日 申請日期:2014年11月24日 優(yōu)先權(quán)日:2014年11月24日
【發(fā)明者】賈強(qiáng)槐, 田新梅 申請人:中國科學(xué)技術(shù)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1