專利名稱:圖像搜索引擎中的排名方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像搜索引擎中的排名方法。
背景技術(shù):
伴隨著互聯(lián)網(wǎng)絡(luò)的快速發(fā)展,它已經(jīng)成為最大的圖像資源庫。近年來,搜索引擎因其能夠在幾乎無限的資源中為廣大用戶找到所需的信息而越來越受到重視,圖像搜索引擎也應(yīng)運(yùn)而生。目前已經(jīng)出現(xiàn)了一批比較知名的圖像搜索引擎,如Google,Ask等,憑借其較高的搜索準(zhǔn)確率而成為當(dāng)前搜索引擎的主流。然而,當(dāng)前搜索引擎仍然存在著查準(zhǔn)率太低的問題,搜索結(jié)果充斥著太多的無用信息,要想在如此龐大的圖像庫中找到用戶需要的信息仍然充滿挑戰(zhàn)。
大多數(shù)的圖像搜索引擎從互聯(lián)網(wǎng)中搜集圖像,然后提取圖像所在網(wǎng)頁的一些文本信息為圖像建立索引,更簡單的,僅僅提取圖像所在網(wǎng)頁的標(biāo)題為圖像建立索引。用戶向搜索引擎提交查詢時(shí),僅僅考慮查詢與預(yù)提取的信息的相似度并返回結(jié)果。
目前,傳統(tǒng)的文本搜索引擎已經(jīng)比較成熟。如以Google為代表的第三代搜索引擎采用基于鏈接分析的技術(shù)來評(píng)價(jià)網(wǎng)頁的重要程度,具有較好的效果。而在圖像搜索領(lǐng)域,目前的排名方法往往采用較簡單的方式,搜索的查準(zhǔn)率還不太理想。因此,有必要設(shè)計(jì)一種圖像搜索引擎的排名算法,它既充分借鑒已有的文本搜索引擎較成熟的技術(shù),同時(shí)也考慮圖像固有的一些特點(diǎn),使得圖像搜索的結(jié)果具有較高的查準(zhǔn)率,更好地滿足用戶查詢的需求。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種圖像搜索引擎中的排名方法,根據(jù)用戶的查詢請(qǐng)求,快速準(zhǔn)確地定位到用戶需要的圖像。
本發(fā)明解決其技術(shù)問題采用的技術(shù)方案如下一種圖像搜索引擎中的排名方法,主要包括以下步驟1)圖像搜索引擎根據(jù)每張圖像所在網(wǎng)頁的信息及該圖像的特點(diǎn)預(yù)先計(jì)算好每張圖像的重要程度,即靜態(tài)排名;2)圖像搜索引擎根據(jù)實(shí)時(shí)的用戶查詢請(qǐng)求,計(jì)算查詢與圖像所在網(wǎng)頁的相似度,即動(dòng)態(tài)排名;3)整合靜、動(dòng)態(tài)排名,將圖像按相似度由高到低返回給用戶。
1.步驟(1)計(jì)算靜態(tài)排名,考慮圖像所在網(wǎng)頁的重要程度,考慮包括鏈接分析、網(wǎng)頁圖像所在網(wǎng)站類型、圖像點(diǎn)擊率等所有能決定網(wǎng)頁的重要程度的信息。
2.步驟(2)計(jì)算動(dòng)態(tài)排名前,預(yù)先從網(wǎng)頁中的關(guān)鍵標(biāo)簽及圖像的上下文中提取文本,并采用命名實(shí)體識(shí)別技術(shù)和依存句法技術(shù)提取網(wǎng)頁中能代表圖像意義的關(guān)鍵詞。
3.步驟(2)計(jì)算動(dòng)態(tài)排名,計(jì)算查詢關(guān)鍵詞與預(yù)取的代表圖像意義的關(guān)鍵詞的相似度,獲得動(dòng)態(tài)排名。
4.步驟(3)采用推理網(wǎng)絡(luò)模型整合靜態(tài)和動(dòng)態(tài)排名,獲得最終的圖像排名,將圖像按相似度由高到低返回給用戶。
本發(fā)明與背景技術(shù)相比,具有的有益的效果是該方法包含靜態(tài)排名和動(dòng)態(tài)排名部分。其中靜態(tài)排名主要考慮圖像所在網(wǎng)頁的一些信息,如基于鏈接分析的網(wǎng)頁的重要程度,基于圖像點(diǎn)擊率及網(wǎng)頁所在網(wǎng)站的類型等等信息來確定一張圖像的重要程度。動(dòng)態(tài)排名動(dòng)態(tài)計(jì)算用戶查詢與圖像的相似度。最后采用推理網(wǎng)絡(luò)模型有效地整合靜、動(dòng)態(tài)排名,將圖像按相似度由高到低返回給用戶。該方法較現(xiàn)有的方法具有更佳的性能和查準(zhǔn)率。
首先,該方法較現(xiàn)有方法考慮了更多的因素來確定圖像的重要程度,具有更高的查準(zhǔn)率。另外,該方法的靜態(tài)排名部分可以預(yù)先計(jì)算好,具有更佳的性能。同時(shí),采用推理網(wǎng)絡(luò)模型,可以有效整合靜、動(dòng)態(tài)排名,將滿足用戶需求的圖像返回給用戶。
附圖為根據(jù)本發(fā)明優(yōu)選實(shí)施例的推理網(wǎng)絡(luò)模型的示意圖。
具體實(shí)施例方式
本發(fā)明實(shí)施的關(guān)鍵有三點(diǎn)靜態(tài)排名的計(jì)算、動(dòng)態(tài)排名的計(jì)算和靜、動(dòng)態(tài)排名的整合,所述的圖像搜索引擎中的排名方法包括以下步驟(1)圖像搜索引擎根據(jù)每張圖像所在網(wǎng)頁的信息及該圖像的特點(diǎn)預(yù)先計(jì)算好每張圖像的重要程度,即靜態(tài)排名;(2)圖像搜索引擎根據(jù)實(shí)時(shí)的用戶查詢請(qǐng)求,計(jì)算查詢與圖像所在網(wǎng)頁的相似度,即動(dòng)態(tài)排名;(3)整合靜、動(dòng)態(tài)排名,將圖像按相似度由高到低返回給用戶。
在上述步驟(1)計(jì)算靜態(tài)排名部分,考慮圖像所在網(wǎng)頁的重要程度,優(yōu)選地,考慮包括鏈接分析、網(wǎng)頁圖像所在網(wǎng)站類型、圖像點(diǎn)擊率等能決定網(wǎng)頁的重要程度的信息。采用下面的公式計(jì)算靜態(tài)排名P(Ij)=kpr×PR(dj)+ktype×TYPE(dj)+khit×WH(Ij) (1)其中P(Ij)代表圖像Ij的靜態(tài)排名,PR(dj)表示圖像Ij所在網(wǎng)頁dj的基于鏈接分析的重要程度值,TYPE(dj)代表圖像Ij所在網(wǎng)站的類型,WH(Ij)代表圖像Ij的點(diǎn)擊率。kpr、ktype、khit分別代表鏈接分析、網(wǎng)頁圖像所在網(wǎng)站類型、圖像點(diǎn)擊率三項(xiàng)的權(quán)重,且kpr+ktype+khit=1(2)目前較成熟的鏈接分析方法由Google提出的PageRank算法和IBM提出的HITS算法,優(yōu)選地,可以采用類PageRank算法計(jì)算基于鏈接分析的網(wǎng)頁的重要程度PR(dj)。這里考慮網(wǎng)站的類型,將網(wǎng)站的類型分為若干類,對(duì)于專業(yè)提供的圖像的網(wǎng)站認(rèn)為其提供的圖片的質(zhì)量較高,即獲得較高的TYPE(dj)值。
圖像Ij的點(diǎn)擊率WH(Ij)的計(jì)算考慮該圖像在搜索返回結(jié)果中的第幾頁被點(diǎn)擊,因?yàn)樵皆谒阉鹘Y(jié)果的后面的幾頁被用戶點(diǎn)擊可能性較低,這類點(diǎn)擊將獲得較高的排名。另外,考慮到新的圖像剛被索引時(shí),沒有被用戶點(diǎn)擊的機(jī)會(huì),這類圖像將獲得一個(gè)缺省的WH(Ij)值。
在上述步驟(2)計(jì)算動(dòng)態(tài)排名前,搜索引擎預(yù)先從網(wǎng)頁中的關(guān)鍵標(biāo)簽及圖像的上下文中提取文本。關(guān)鍵標(biāo)簽包括如超級(jí)鏈接標(biāo)簽A、網(wǎng)頁標(biāo)題標(biāo)簽TITLE、代表圖像的IMG標(biāo)簽及其ALT屬性、網(wǎng)頁的元信息標(biāo)簽META以及網(wǎng)頁中圖像的上下文的一些文本。獲得這些文本后,采用依存句法分析技術(shù)提取這些文本的主干部分,獲得主干后,再采用命名實(shí)體識(shí)別技術(shù)提取文本中的命名實(shí)體,以提高描述圖像關(guān)鍵詞的準(zhǔn)確率。
采用推理網(wǎng)絡(luò)模型來整合靜態(tài)排名和動(dòng)態(tài)排名,如附圖所示為一個(gè)推理網(wǎng)絡(luò)模型。其中最頂層I1,...,Ij...,In代表圖像搜索引擎搜集的所有圖像,中間層的k1,k2,...,ki,...,kt代表圖像搜索引擎包含的所有關(guān)鍵詞,q代表用戶的查詢。采用如下公式獲得最終的排名P(q,Ij)=Σ∀KP(q|K)×P(K|Ij)×P(Ij)...(3)]]>其中P(q,Ij)代表查詢q和圖像Ij的相似度,P(Ij)代表圖像Ij的靜態(tài)排名有公式(1)獲得。公式(3)是附圖1的展開,P(Ij)是推理網(wǎng)絡(luò)模型的先驗(yàn)概率,P(K|Ij)表示給定圖像Ij出現(xiàn)關(guān)鍵詞的條件概率,P(q|K)表示給定關(guān)鍵詞出現(xiàn)查詢q的條件概率。K是關(guān)鍵詞的t維向量,即K=(k1,k2,...,kt),其中k1,k2,...,kt是與關(guān)鍵詞k1,k2,...,ki,...,kt對(duì)應(yīng)的隨機(jī)變量。
具體計(jì)算時(shí),將公式(3)展開,如下 查詢q是t維向量K的一個(gè)實(shí)例,qi對(duì)應(yīng)t維向量K的第i個(gè)隨機(jī)變量。idfi代表關(guān)鍵詞ki的逆文檔頻率(inverse document frequency)。fi,j代表關(guān)鍵詞ki在圖像Ij所在網(wǎng)頁中提取關(guān)鍵詞組中的詞頻。
計(jì)算出查詢q同圖像的相似度后,按照相似度由高到低返回給用戶。
上述具體實(shí)施方式
用來解釋說明本發(fā)明,而不是對(duì)本發(fā)明進(jìn)行限制,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對(duì)本發(fā)明作出的任何修改和改變,都落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種圖像搜索引擎中的排名方法,其特征在于1)圖像搜索引擎根據(jù)每張圖像所在網(wǎng)頁的信息及該圖像的特點(diǎn)預(yù)先計(jì)算好每張圖像的重要程度,即靜態(tài)排名;2)圖像搜索引擎根據(jù)實(shí)時(shí)的用戶查詢請(qǐng)求,計(jì)算查詢與圖像所在網(wǎng)頁的相似度,即動(dòng)態(tài)排名;3)整合靜、動(dòng)態(tài)排名,將圖像按相似度由高到低返回給用戶。
2.根據(jù)權(quán)利要求1所述的一種圖像搜索引擎中的排名方法,其特征在于步驟(1)計(jì)算靜態(tài)排名,考慮圖像所在網(wǎng)頁的重要程度,考慮包括鏈接分析、網(wǎng)頁圖像所在網(wǎng)站類型、圖像點(diǎn)擊率能決定網(wǎng)頁的重要程度的信息。
3.根據(jù)權(quán)利要求1所述的一種圖像搜索引擎中的排名方法,其特征在于步驟(2)計(jì)算動(dòng)態(tài)排名前,預(yù)先從網(wǎng)頁中的關(guān)鍵標(biāo)簽及圖像的上下文中提取文本,并采用命名實(shí)體識(shí)別技術(shù)和依存句法技術(shù)提取網(wǎng)頁中能代表圖像意義的關(guān)鍵詞。
4.根據(jù)權(quán)利要求1所述的一種圖像搜索引擎中的排名方法,其特征在于步驟(2)計(jì)算動(dòng)態(tài)排名時(shí),計(jì)算查詢關(guān)鍵詞與預(yù)取的代表圖像意義的關(guān)鍵詞的相似度,獲得動(dòng)態(tài)排名。
5.根據(jù)權(quán)利要求1所述的一種圖像搜索引擎中的排名方法,其特征在于步驟(3)采用推理網(wǎng)絡(luò)模型整合靜態(tài)和動(dòng)態(tài)排名,獲得最終的圖像排名,將圖像按相似度由高到低返回給用戶。
全文摘要
本發(fā)明公開了一種圖像搜索引擎中的排名方法。本發(fā)明的方法包含靜態(tài)排名和動(dòng)態(tài)排名部分。其中靜態(tài)排名主要考慮圖像所在網(wǎng)頁的一些信息,如基于鏈接分析的網(wǎng)頁的重要程度,基于圖像點(diǎn)擊率及網(wǎng)頁所在網(wǎng)站的類型等等信息來確定一張圖像的重要程度。動(dòng)態(tài)排名動(dòng)態(tài)計(jì)算用戶查詢與圖像的相似度。整合靜、動(dòng)態(tài)排名,將圖像按相似度由高到低返回給用戶。該方法較現(xiàn)有的方法具有更佳的性能和查準(zhǔn)率。
文檔編號(hào)G06F17/30GK1924855SQ200610053449
公開日2007年3月7日 申請(qǐng)日期2006年9月18日 優(yōu)先權(quán)日2006年9月18日
發(fā)明者卜佳俊, 陳純, 劉康苗, 陳偉, 周純, 張利軍 申請(qǐng)人:浙江大學(xué)