本發(fā)明涉及互聯(lián)網(wǎng)領域,尤其涉及一種資源搜索方法及裝置。
背景技術:
泛關鍵詞可以包括各種類型的搜索量很大,模板很不準的詞語。泛關鍵詞通常可以代表一個行業(yè)或者一個事物,例如金融,服裝、兒歌、相聲等?,F(xiàn)有技術中,對泛關鍵詞的搜索查詢通常采用直接命中的方式,即根據(jù)時效性、熱度等因子,對名稱中包括泛關鍵詞的搜索結果進行排序后展現(xiàn)給用戶,無法獲取泛關鍵詞的深層含義。
例如,用戶搜索相聲,首先獲取視頻名稱中包括“相聲”的視頻,并根據(jù)時效性、熱度等因子對上述視頻進行排序后,選取排序靠前的視頻返回給用戶。但是,用戶搜索相聲,大部分的情況下可能是在搜索郭德綱或者岳云鵬的相聲,在春節(jié)的時候可能是在搜索春晚的相聲。如果這部分視頻里面沒有包括“相聲”這個詞,則無法命中本來屬于相聲的結果。
技術實現(xiàn)要素:
技術問題
有鑒于此,本發(fā)明要解決的技術問題是,提供一種資源搜索方法,以提高泛關鍵詞的匹配度,滿足用戶對泛關鍵詞搜索的深層需求。
解決方案
為了解決上述技術問題,根據(jù)本發(fā)明的一實施例,提供了一種資源搜索方法,包括:
接收用戶針對目標關鍵詞發(fā)起的搜索請求;
獲取所述目標關鍵詞對應的各相關關鍵詞;
根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源。
對于上述方法,在一種可能的實現(xiàn)方式中,獲取所述目標關鍵詞對應的各相關關鍵詞,包括:
獲取已經(jīng)建立的與所述目標關鍵詞相關的同義詞樹;
根據(jù)所述目標關鍵詞在所述同義詞樹中的節(jié)點位置,獲取所述目標關鍵詞對應的相關關鍵詞;
其中,所述同義詞樹包括作為根節(jié)點的泛關鍵詞和作為子節(jié)點的與泛關鍵詞相關的關鍵詞。
對于上述方法,在一種可能的實現(xiàn)方式中,在獲取已經(jīng)建立的與所述目標關鍵詞相關的同義詞樹之前,還包括:
以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹。
對于上述方法,在一種可能的實現(xiàn)方式中,以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹,包括:
獲取與所述泛關鍵詞相關的各第一關鍵詞;
根據(jù)所述泛關鍵詞與各所述第一關鍵詞的相關性,對各所述第一關鍵詞進行排序,并根據(jù)排序結果從各所述第一關鍵詞中選取用于建立所述同義詞樹的各第二關鍵詞;
以所述泛關鍵詞作為根節(jié)點,以各所述第二關鍵詞作為子節(jié)點,建立包括多個層級的所述同義詞樹;
其中,處于所述同義詞樹的同一層級的節(jié)點的詞義不具有相關性。
對于上述方法,在一種可能的實現(xiàn)方式中,根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源,包括:
分別從已有的資源索引庫中獲取所述目標關鍵詞和各所述相關關鍵詞對應的各第一資源;
根據(jù)第一評分模型,對各所述第一資源進行評分,并根據(jù)各所述第一資源的第一評分,從各所述第一資源中選取各第二資源。
對于上述方法,在一種可能的實現(xiàn)方式中,還包括:
對各所述第二資源進行標識提?。?/p>
根據(jù)第二評分模型,對具有不同標識的各所述第二資源進行評分,并根據(jù)各所述第二資源的第一評分和第二評分,從各所述第二資源中選取各第三資源。
為了解決上述技術問題,根據(jù)本發(fā)明的另一實施例,提供了一種資源搜索裝置,包括:
搜索請求接收模塊,用于接收用戶針對目標關鍵詞發(fā)起的搜索請求;
關鍵詞獲取模塊,與所述搜索請求接收模塊連接,用于獲取與所述目標關鍵詞對應的各相關關鍵詞;
資源獲取模塊,與所述關鍵詞獲取模塊連接,用于根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源。
對于上述裝置,在一種可能的實現(xiàn)方式中,所述關鍵詞獲取模塊包括:
同義詞樹獲取單元,用于獲取已經(jīng)建立的與所述目標關鍵詞相關的同義詞樹;
相關關鍵詞獲取單元,與所述同義詞樹獲取單元連接,用于根據(jù)所述目標關鍵詞在所述同義詞樹中的節(jié)點位置,獲取所述目標關鍵詞對應的相關關鍵詞;
其中,所述同義詞樹包括作為根節(jié)點的泛關鍵詞和作為子節(jié)點的與泛關鍵詞相關的關鍵詞。
對于上述裝置,在一種可能的實現(xiàn)方式中,還包括:
同義詞樹建立模塊,用于以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹。
對于上述裝置,在一種可能的實現(xiàn)方式中,所述同義詞樹建立模塊包括:
第一獲取單元,用于獲取與所述泛關鍵詞相關的各第一關鍵詞;
第一選取單元,與所述第一獲取單元連接,用于根據(jù)所述泛關鍵詞與各所述第一關鍵詞的相關性,對各所述第一關鍵詞進行排序,并根據(jù)排序結果從各所述第一關鍵詞中選取用于建立所述同義詞樹的各第二關鍵詞;
同義詞樹建立單元,與所述第一選取單元連接,用于以所述泛關鍵詞作為根節(jié)點,以各所述第二關鍵詞作為子節(jié)點,建立包括多個層級的所述同義詞樹;
其中,處于所述同義詞樹的同一層級的節(jié)點的詞義不具有相關性。
對于上述裝置,在一種可能的實現(xiàn)方式中,所述資源獲取模塊包括:
第二獲取單元,用于分別從已有的資源索引庫中獲取所述目標關鍵詞和各所述相關關鍵詞對應的各第一資源;
第二選取單元,與所述第二獲取單元連接,用于根據(jù)第一評分模型,對各所述第一資源進行評分,并根據(jù)各所述第一資源的第一評分,從各所述第一資源中選取各第二資源。
對于上述裝置,在一種可能的實現(xiàn)方式中,所述資源獲取模塊還包括:
第三選取單元,與所述第二選取單元連接,具體用于對各所述第二資源進行標識提??;根據(jù)第二評分模型,對具有不同標識的各所述第二資源進行評分,并根據(jù)各所述第二資源的第一評分和第二評分,從各所述第二資源中選取各第三資源。
有益效果
本發(fā)明實施例的資源搜索方法,通過獲取目標關鍵詞對應的各相關關鍵詞,并根據(jù)目標關鍵詞和各相關關鍵詞,分別從資源索引庫中獲取對應的資源,可以提高泛關鍵詞的匹配度,滿足用戶對泛關鍵詞搜索的深層需求。
進一步地,本發(fā)明實施例的資源搜索方法,以泛關鍵詞作為根節(jié)點,以與泛關鍵詞相關的關鍵詞作為子節(jié)點,建立同義詞樹。通過目標關鍵詞在同義詞樹中的節(jié)點位置,可以直接獲取目標關鍵詞對應的相關關鍵詞,提高檢索速度。
根據(jù)下面參考附圖對示例性實施例的詳細說明,本發(fā)明的其它特征及方面將變得清楚。
附圖說明
包括在說明書中并且構成說明書的一部分的附圖與說明書一起示出了本發(fā)明的示例性實施例、特征和方面,并且用于解釋本發(fā)明的原理。
圖1示出根據(jù)本發(fā)明一實施例的資源搜索方法的流程圖;
圖2示出根據(jù)本發(fā)明一實施例的資源搜索方法的另一流程圖;
圖3示出根據(jù)本發(fā)明一實施例的資源搜索方法的另一流程圖;
圖4示出根據(jù)本發(fā)明一實施例的資源搜索方法的另一流程圖;
圖5示出根據(jù)本發(fā)明另一實施例的資源搜索裝置的結構框圖;
圖6示出根據(jù)本發(fā)明另一實施例的資源搜索裝置的另一結構框圖;
圖7示出根據(jù)本發(fā)明另一實施例的資源搜索裝置的另一結構框圖;
圖8示出根據(jù)本發(fā)明另一實施例的資源搜索設備的結構框圖。
具體實施方式
以下將參考附圖詳細說明本發(fā)明的各種示例性實施例、特征和方面。附圖中相同的附圖標記表示功能相同或相似的元件。盡管在附圖中示出了實施例的各種方面,但是除非特別指出,不必按比例繪制附圖。
在這里專用的詞“示例性”意為“用作例子、實施例或說明性”。這里作為“示例性”所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。
另外,為了更好的說明本發(fā)明,在下文的具體實施方式中給出了眾多的具體細節(jié)。本領域技術人員應當理解,沒有某些具體細節(jié),本發(fā)明同樣可以實施。在一些實例中,對于本領域技術人員熟知的方法、手段、元件和電路未作詳細描述,以便于凸顯本發(fā)明的主旨。
實施例1
圖1示出根據(jù)本發(fā)明一實施例的資源搜索方法的流程圖。如圖1所示,所述資源搜索方法,主要包括:
步驟101、接收用戶針對目標關鍵詞發(fā)起的搜索請求;
步驟102、獲取所述目標關鍵詞對應的各相關關鍵詞;
步驟103、根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源。
目標關鍵詞可以是用戶在搜索欄中輸入的用于檢索相關資源的關鍵詞,相關關鍵詞可以包括各種類型的與目標關鍵詞相關的關鍵詞,本發(fā)明實施例不限定目標關鍵詞和相關關鍵詞的具體類型。根據(jù)目標關鍵詞和其對應的各相關關鍵詞,可以分別從資源索引庫中獲取其對應的資源,并將所獲取的資源通過例如列表、表格等形式呈現(xiàn)給用戶。其中,資源可以包括各種類型的多媒體資源,例如文本、聲音、視頻和圖像等,對此不作限定。
進一步地,相關關鍵詞可以是在進行細分詞或粗分詞后包括目標關鍵詞的關鍵詞,也可以是與目標關鍵詞表面詞義上沒有聯(lián)系,但是深層含義具有相關性的關鍵詞,對此不作限定。例如,搜索目標關鍵詞“相聲”,可以得到“相聲”的相關關鍵詞“春晚相聲”、“郭德綱”等。其中,“春晚相聲”進行細分詞后(例如分為春晚、相聲)包括“相聲”,“郭德綱”與“相聲”表面詞義上沒有聯(lián)系,但是深層含義具有相關性。
本發(fā)明實施例的資源搜索方法可以適用于單一多媒體資源的搜索,例如,在視頻網(wǎng)站中搜索與目標關鍵詞相關的視頻;也可以適用于混合多媒體資源的搜索,例如,在搜索網(wǎng)站中搜索與目標關鍵詞相關的各種多媒體資源。舉例而言,可以在視頻網(wǎng)站例如優(yōu)酷網(wǎng)站上搜索目標關鍵詞“相聲”,從而獲取與相聲相關的視頻,例如春晚相聲視頻、郭德綱相聲視頻等;也可以在搜索網(wǎng)站中搜索目標關鍵詞“相聲”,從而獲取與相聲相關的多媒體資源,例如相聲視頻、相聲音頻、相聲臺詞文本等。
在一種可能的實現(xiàn)方式中,如圖2所示,所述資源搜索方法,還可以包括:
步驟100、以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹。
本發(fā)明實施例的泛關鍵詞可以包括各種類型的搜索量很大,模板很不準的詞語。泛關鍵詞通常可以代表一個行業(yè)或者一個事物,例如金融、服裝、兒歌、相聲等,對此不作限定。
進一步地,可以通過例如索引、Word2vec模型等方式獲取與泛關鍵詞相關的關鍵詞。其中,索引方式可以包括從關鍵詞索引庫中獲取已經(jīng)存儲的與泛關鍵詞相關的關鍵詞。Word2vec模型方式可以通過對歷史數(shù)據(jù)的訓練,把對文本內容的處理簡化為K維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相似度。
本發(fā)明實施例的同義詞樹可以是一種能夠表述泛關鍵詞和與其相關的各關鍵詞之間的關系的樹狀圖。其中,樹狀圖可以是一種由n(n>=1)個有限節(jié)點組成的一個具有層次關系的集合。每個節(jié)點可以具有子節(jié)點,沒有父節(jié)點的節(jié)點稱為根節(jié)點,每一個非根節(jié)點有且只有一個父節(jié)點,除了根節(jié)點外,每個子節(jié)點可以分為多個不相交的子樹。例如,以泛關鍵詞“兒歌”作為根節(jié)點,以與泛關鍵詞“兒歌”相關的各關鍵詞“貝瓦兒歌”、“起跑線”、“兒歌串燒”作為子節(jié)點,建立同義詞樹。
需要說明的是,本領域技術人員應當能夠理解,現(xiàn)有技術中有各種方式可以表述泛關鍵詞和與其相關的各關鍵詞之間的關系,樹狀圖可能只是其中的一種方式,還可以通過例如鏈表、指針等數(shù)據(jù)結構實現(xiàn),對此不作限定。
在一種可能的實現(xiàn)方式中,以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹(步驟100),具體可以包括:
步驟10、獲取與所述泛關鍵詞相關的各第一關鍵詞;
步驟20、根據(jù)所述泛關鍵詞與各所述第一關鍵詞的相關性,對各所述第一關鍵詞進行排序,并根據(jù)排序結果從各所述第一關鍵詞中選取用于建立所述同義詞樹的各第二關鍵詞;
步驟30、以所述泛關鍵詞作為根節(jié)點,以各所述第二關鍵詞作為子節(jié)點,建立包括多個層級的所述同義詞樹。
本發(fā)明實施例的獲取各第一關鍵詞可以包括獲取初始關鍵詞集合的過程,獲取各第二關鍵詞可以包括從各第一關鍵詞中選取用于建立同義詞樹的最終關鍵詞集合的過程,對此不作限定。
其中,初始關鍵詞集合可以包括例如通過索引、Word2vec模型等方式直接獲取的、且沒有經(jīng)過篩選的與泛關鍵詞相關的各第一關鍵詞。具體地,初始關鍵詞集合中可能包括例如較大數(shù)量級的第一關鍵詞,還可能包括已經(jīng)停用或小概率使用的冷門詞,也可能包括具有相同含義的同義詞。
進一步地,可以通過對初始關鍵詞集合中包括的各第一關鍵詞進行篩選,獲取用于建立同義詞樹的最終關鍵詞集合。最終關鍵詞集合可以包括對各第一關鍵詞例如采用粗粒度切詞、排除停用詞、按數(shù)量排序等方式,從各第一關鍵詞中選取用于建立同義詞樹的各第二關鍵詞。例如,可以從各第一關鍵詞中選取相關性排序為前五的各第二關鍵詞用于建立同義詞樹。
舉例而言,對于泛關鍵詞“兒歌”,例如通過索引、Word2vec模型等方式,可以獲取各第一關鍵詞例如“經(jīng)典兒歌”、“貝瓦兒歌”、“貝瓦兒歌小白兔”、“兒歌串燒”、“兒歌串燒100首連續(xù)”、“起跑線”、“拔蘿卜兒歌視頻”等用戶的初始關鍵詞集合。進一步地,例如采用粗粒度切詞、排除停用詞、按數(shù)量排序等方式,可以從各第一關鍵詞中選取各第二關鍵詞例如“貝瓦兒歌”、“起跑線”、“兒歌串燒”。其中,“兒歌串燒100首連續(xù)”可以作為“兒歌串燒”的同義詞。
需要說明的是,本發(fā)明實施例不限定子節(jié)點層級的數(shù)目。例如,對于同一個或不同的泛關鍵詞,同義詞樹可以包括根節(jié)點和一個層級子節(jié)點,也可以包括根節(jié)點和多個層級子節(jié)點。其中,處于同義詞樹的同一層級的節(jié)點的詞義可以不具有相關性。在實際應用過程中,可以根據(jù)例如泛關鍵詞的詞義大小、檢索精確度需求等多方面原因,建立滿足不同需求的同義詞樹。
在一種可能的實現(xiàn)方式中,如圖2所示,獲取所述目標關鍵詞對應的各相關關鍵詞(步驟102),具體可以包括:
步驟201、獲取已經(jīng)建立的與所述目標關鍵詞相關的同義詞樹;
步驟202、根據(jù)所述目標關鍵詞在所述同義詞樹中的節(jié)點位置,獲取所述目標關鍵詞對應的相關關鍵詞。
本發(fā)明實施例的同義詞樹包括作為根節(jié)點的泛關鍵詞和作為子節(jié)點的與泛關鍵詞相關的關鍵詞。需要說明的是,本發(fā)明實施例不限定同義詞樹的建立時間,可以預先選定部分具有較高搜索概率的泛關鍵詞建立同義詞樹,也可以實時響應用戶針對目標關鍵詞發(fā)起的搜索請求(query)而建立同義詞樹。
例如,可以預先選定部分具有較高搜索概率的泛關鍵詞,并通過線下計算,建立與各泛關鍵詞相關的同義詞樹,并將建立的同義詞樹用于響應線上用戶針對目標關鍵詞發(fā)起的搜索請求。采用線下建立的方式,可以及時響應用戶的搜索請求,減少用戶等待的時間,提高用戶體驗,并且可以通過存儲已經(jīng)建立的同義詞樹實現(xiàn)重復獲取調用的過程。
再例如,也可以設置一個同義詞樹建立模型,在線上用戶針對目標關鍵詞發(fā)起搜索請求的情況下,利用同義詞樹建立模型建立與目標關鍵詞相關的同義詞樹。采用線上建立的方式,可以保證每次建立同義詞樹時都獲取具有較高匹配度的關鍵詞,從而保證同義詞樹的匹配度和時效性。
本發(fā)明實施例的節(jié)點位置可以包括節(jié)點類型、節(jié)點層級等信息,對此不作限定。例如,目標關鍵詞可以是泛關鍵詞,此時,目標關鍵詞處于根節(jié)點的位置,其對應的相關關鍵詞可以包括同義詞樹中各層級子節(jié)點位置的關鍵詞。再例如,目標關鍵詞可以是非泛關鍵詞,例如,可以是處于第一層級的子節(jié)點,其對應的相關關鍵詞可以包括同義詞樹中子樹下第二層級開始各層級子節(jié)點位置的關鍵詞。
在一種可能的實現(xiàn)方式中,如圖3所示,根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源(步驟103),具體可以包括:
步驟301、分別從已有的資源索引庫中獲取所述目標關鍵詞和各所述相關關鍵詞對應的各第一資源;
步驟302、根據(jù)第一評分模型,對各所述第一資源進行評分,并根據(jù)各所述第一資源的第一評分,從各所述第一資源中選取各第二資源。
本發(fā)明實施例的資源索引庫可以包括用于存儲各種類型的多媒體資源的數(shù)據(jù)庫,例如視頻庫、音樂庫、文檔庫等,對此不作限定。通過檢索資源索引庫,可以直接獲取目標關鍵詞和各相關關鍵詞對應的且沒有經(jīng)過篩選的各第一資源。例如,通過目標關鍵詞“相聲”和相關關鍵詞“春晚相聲”、“郭德綱”,可以從視頻庫中獲取春晚相聲、郭德綱相聲等各第一視頻資源。
本發(fā)明實施例的第一評分模型可以是基礎評分模型。在基礎評分的過程中,評分可以由例如多媒體資源對應的資源特征(例如時間、熱度、點擊、轉化率、命中率、人名,團體名等)和各資源特征對應的特征值決定?;A評分與資源的歷史數(shù)據(jù)相關,評分過程較少受到人為因素的干擾。
進一步地,可以根據(jù)各第一資源的第一評分,對各第一資源進行排序,并根據(jù)相關的排序結果從各第一資源中選取各第二資源。本實施例不限定選取各第二資源的具體方式。例如,選取方式可以是評分超過一定數(shù)值,也可以是排名滿足一定要求。
需要說明的是,本領域技術人員應當能夠理解,現(xiàn)有技術中有各種方式可以對各第一資源進行評分和排序,對此不作限定。此外,本發(fā)明實施例的對各第一資源進行評分和排序可以在全部第一資源中進行,也可以在每個關鍵詞對應的第一資源中進行,對此不作限定。
在一種可能的實現(xiàn)方式中,如圖4所示,根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源(步驟103),還可以包括:
步驟303、對各所述第二資源進行標識提??;
步驟304、根據(jù)第二評分模型,對具有不同標識的各所述第二資源進行評分,并根據(jù)各所述第二資源的第一評分和第二評分,從各所述第二資源中選取各第三資源。
本發(fā)明實施例的第二評分模型可以是名稱評分模型。在名稱評分的過程中,評分可以由例如多媒體資源對應的標識(例如資源名稱、資源編碼、資源發(fā)行商等)決定。名稱評分與資源的標識相關,評分過程較多受到人為因素的干擾。例如,對于在推廣中的關鍵詞,可以給予更高的評分。
進一步地,可以根據(jù)各第二資源的第一評分和第二評分(例如求第一評分和第二評分之和),對各第二資源進行排序,并根據(jù)相關的排序結果從各第二資源中選取各第三資源。本實施例不限定選取各第三資源的具體方式,例如,選取方式可以是評分超過一定數(shù)值,也可以是排名滿足一定要求。
需要說明的是,本發(fā)明實施例的資源搜索方法,可以包括例如同義詞樹的生成(步驟10至步驟30)、資源的獲取與第一次評分排序(步驟301至步驟302)、資源的第二次評分排序(步驟303至步驟304)以及響應用戶請求等步驟。其中,同義詞樹的生成、資源的獲取與第一次評分排序、資源的第二次評分排序可以在線下計算完成,也可以在線上計算完成,對此不作限定。響應用戶請求可以在線上完成,例如,用戶搜索請求(query)命中子節(jié)點或者子節(jié)點對應的同義詞,區(qū)分用戶搜索請求的類別,并參考線下計算的預排序結果,產(chǎn)生最終排序,并呈現(xiàn)給用戶。
本發(fā)明實施例的資源搜索方法,通過獲取目標關鍵詞對應的各相關關鍵詞,并根據(jù)目標關鍵詞和各相關關鍵詞,分別從資源索引庫中獲取對應的資源,可以提高泛關鍵詞的匹配度,滿足用戶對泛關鍵詞搜索的深層需求。
進一步地,本發(fā)明實施例的資源搜索方法,以泛關鍵詞作為根節(jié)點,以與泛關鍵詞相關的關鍵詞作為子節(jié)點,建立同義詞樹。通過目標關鍵詞在同義詞樹中的節(jié)點位置,可以直接獲取目標關鍵詞對應的相關關鍵詞,提高檢索速度。
實施例2
圖5示出根據(jù)本發(fā)明另一實施例的資源搜索裝置的結構框圖。如圖5所示,所述資源搜索裝置,主要包括:搜索請求接收模塊11,用于接收用戶針對目標關鍵詞發(fā)起的搜索請求。關鍵詞獲取模塊13,與所述搜索請求接收模塊11連接,用于獲取與所述目標關鍵詞對應的各相關關鍵詞。資源獲取模塊15,與所述關鍵詞獲取模塊13連接,用于根據(jù)所述目標關鍵詞和各所述相關關鍵詞,分別從資源索引庫中獲取對應的資源。具體原理和示例可以參見實施例1以及圖1的相關描述。
在一種可能的實現(xiàn)方式中,如圖6所示,所述資源搜索裝置,還可以包括:同義詞樹建立模塊20,用于以所述泛關鍵詞作為根節(jié)點,以與所述泛關鍵詞相關的各所述關鍵詞作為子節(jié)點,建立所述同義詞樹。具體原理和示例可以參見實施例1以及圖2的相關描述。
在一種可能的實現(xiàn)方式中,如圖6所示,所述同義詞樹建立模塊20可以包括:第一獲取單元201,用于獲取與所述泛關鍵詞相關的各第一關鍵詞。第一選取單元203,與所述第一獲取單元201連接,用于根據(jù)所述泛關鍵詞與各所述第一關鍵詞的相關性,對各所述第一關鍵詞進行排序,并根據(jù)排序結果從各所述第一關鍵詞中選取用于建立所述同義詞樹的各第二關鍵詞。同義詞樹建立單元205,與所述第一選取單元203連接,用于以所述泛關鍵詞作為根節(jié)點,以各所述第二關鍵詞作為子節(jié)點,建立包括多個層級的所述同義詞樹。其中,處于所述同義詞樹的同一層級的節(jié)點的詞義不具有相關性。具體原理和示例可以參見實施例1的相關描述。
在一種可能的實現(xiàn)方式中,如圖6所示,所述關鍵詞獲取模塊13可以包括:同義詞樹獲取單元131,用于獲取已經(jīng)建立的與所述目標關鍵詞相關的同義詞樹。相關關鍵詞獲取單元133,與所述同義詞樹獲取單元131連接,用于根據(jù)所述目標關鍵詞在所述同義詞樹中的節(jié)點位置,獲取所述目標關鍵詞對應的相關關鍵詞。其中,所述同義詞樹包括作為根節(jié)點的泛關鍵詞和作為子節(jié)點的與泛關鍵詞相關的關鍵詞。具體原理和示例可以參見實施例1以及圖2的相關描述。
在一種可能的實現(xiàn)方式中,如圖7所示,所述資源獲取模塊15可以包括:第二獲取單元151,用于分別從已有的資源索引庫中獲取所述目標關鍵詞和各所述相關關鍵詞對應的各第一資源。第二選取單元153,與所述第二獲取單元151連接,用于根據(jù)第一評分模型,對各所述第一資源進行評分,并根據(jù)各所述第一資源的第一評分,從各所述第一資源中選取各第二資源。具體原理和示例可以參見實施例1以及圖3的相關描述。
在一種可能的實現(xiàn)方式中,如圖7所示,所述資源獲取模塊15還可以包括:第三選取單元155,與所述第二選取單元153連接,具體用于對各所述第二資源進行標識提?。桓鶕?jù)第二評分模型,對具有不同標識的各所述第二資源進行評分,并根據(jù)各所述第二資源的第一評分和第二評分,從各所述第二資源中選取各第三資源。具體原理和示例可以參見實施例1以及圖4的相關描述。
本發(fā)明實施例的資源搜索裝置,通過獲取目標關鍵詞對應的各相關關鍵詞,并根據(jù)目標關鍵詞和各相關關鍵詞,分別從資源索引庫中獲取對應的資源,可以提高泛關鍵詞的匹配度,滿足用戶對泛關鍵詞搜索的深層需求。
進一步地,本發(fā)明實施例的資源搜索裝置,以泛關鍵詞作為根節(jié)點,以與泛關鍵詞相關的關鍵詞作為子節(jié)點,建立同義詞樹。通過目標關鍵詞在同義詞樹中的節(jié)點位置,可以直接獲取目標關鍵詞對應的相關關鍵詞,提高檢索速度。
實施例3
圖8示出了本發(fā)明的另一個實施例的一種資源搜索設備的結構框圖。所述資源搜索設備1100可以是具備計算能力的主機服務器、個人計算機PC、或者可攜帶的便攜式計算機或終端等。本發(fā)明具體實施例并不對計算節(jié)點的具體實現(xiàn)做限定。
所述資源搜索設備1100包括處理器(processor)1110、通信接口(Communications Interface)1120、存儲器(memory)1130和總線1140。其中,處理器1110、通信接口1120、以及存儲器1130通過總線1140完成相互間的通信。
通信接口1120用于與網(wǎng)絡設備通信,其中網(wǎng)絡設備包括例如虛擬機管理中心、共享存儲等。
處理器1110用于執(zhí)行程序。處理器1110可能是一個中央處理器CPU,或者是專用集成電路ASIC(Application Specific Integrated Circuit),或者是被配置成實施本發(fā)明實施例的一個或多個集成電路。
存儲器1130用于存放文件。存儲器1130可能包括高速RAM存儲器,也可能還包括非易失性存儲器(non-volatile memory),例如至少一個磁盤存儲器。存儲器1130也可以是存儲器陣列。存儲器1130還可能被分塊,并且所述塊可按一定的規(guī)則組合成虛擬卷。
在一種可能的實施方式中,上述程序可為包括計算機操作指令的程序代碼。該程序具體可用于:實現(xiàn)實施例1中的各步驟。
本領域普通技術人員可以意識到,本文所描述的實施例中的各示例性單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結合來實現(xiàn)。這些功能究竟以硬件還是軟件形式來實現(xiàn),取決于技術方案的特定應用和設計約束條件。專業(yè)技術人員可以針對特定的應用選擇不同的方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。
如果以計算機軟件的形式來實現(xiàn)所述功能并作為獨立的產(chǎn)品銷售或使用時,則在一定程度上可認為本發(fā)明的技術方案的全部或部分(例如對現(xiàn)有技術做出貢獻的部分)是以計算機軟件產(chǎn)品的形式體現(xiàn)的。該計算機軟件產(chǎn)品通常存儲在計算機可讀取的非易失性存儲介質中,包括若干指令用以使得計算機設備(可以是個人計算機、服務器、或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各實施例方法的全部或部分步驟。而前述的存儲介質包括U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。