專利名稱:擴展用戶搜索結(jié)果的方法及服務器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,更具體地說,涉及一種擴展用戶搜索結(jié)果的方法 及服務器。
背景技術(shù):
互聯(lián)網(wǎng)是目前內(nèi)容最豐富的信息源和效率最高的信息傳輸通道,互聯(lián)網(wǎng)搜索引擎 的誕生,使得人們可以用簡便快速的方式查找到自己所需要的信息。當前的商業(yè)互聯(lián)網(wǎng)搜 索引擎,憑借其先進的分布式計算架構(gòu),達到了非常完整的信息覆蓋面,并且也有較好的刷 新速度,可以獲取較新的信息內(nèi)容。
互聯(lián)網(wǎng)搜索引擎的工作流程主要分為三部分,一、使用爬蟲程序獲取互聯(lián)網(wǎng)上的 網(wǎng)頁信息,二、對這些信息建立索引,三、對用戶所請求的查詢借助已經(jīng)建立的索引進行搜 索,并提供結(jié)果文檔。
一般來講,用戶所請求的查詢,包含一個或者多個關(guān)鍵詞。當互聯(lián)網(wǎng)搜索引擎所 提供的結(jié)果文檔中包含一個或者多個用戶所輸入的關(guān)鍵詞的時候,這個結(jié)果被認為是搜索 命中的,符合用戶的搜索期望。比如,用戶輸入關(guān)鍵詞360,那么得到的結(jié)果文檔中會包含 360 ;如果輸入關(guān)鍵詞QQ,則得到的結(jié)果文檔中會包含QQ。也就是說,在現(xiàn)有技術(shù)中,互聯(lián)網(wǎng) 搜索引擎所提供的結(jié)果文檔只是包含用戶輸入的關(guān)鍵詞的一些文檔。而實際上,有些未包 含用戶輸入的關(guān)鍵詞、但包含與所述關(guān)鍵詞有關(guān)聯(lián)關(guān)系的其他關(guān)鍵詞的文檔也是用戶所需 要的,比如,在用戶搜索與360相關(guān)的信息時,希望能同時得到與360有一定關(guān)聯(lián)關(guān)系的相 關(guān)信息。目前,現(xiàn)有的互聯(lián)網(wǎng)搜索引擎還無法滿足用戶的這種需求。發(fā)明內(nèi)容
本發(fā)明實施例針對現(xiàn)有技術(shù)中存在的上述問題,提供一種擴展用戶搜索結(jié)果的方 法及服務器,能夠智能化地為用戶提供更豐富的搜索結(jié)果。
為此,本發(fā)明實施例提供如下技術(shù)方案
一種擴展用戶搜索結(jié)果的方法,包括
獲取用戶在搜索界面輸入的搜索關(guān)鍵詞;
獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞;
分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的組合查詢索 引數(shù)據(jù)庫,得到搜索結(jié)果;
對所述搜索結(jié)果進行去重和排序;
將排序后的搜索結(jié)果發(fā)送給客戶端,以使客戶端將收到的搜索結(jié)果展現(xiàn)給所述用 戶。
優(yōu)選地,所述獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞包括
根據(jù)所述搜索關(guān)鍵詞查找關(guān)聯(lián)規(guī)則數(shù)據(jù)庫;
如果所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中有包含所述搜索關(guān)鍵詞的關(guān)聯(lián)規(guī)則,則從所述關(guān)聯(lián)規(guī)則中獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
優(yōu)選地,所述方法還包括
設(shè)置包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī)則;和/或根據(jù)所 述用戶輸入的多個搜索關(guān)鍵詞,生成包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān) 聯(lián)規(guī)則;
將所述關(guān)聯(lián)規(guī)則保存到所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中。
優(yōu)選地,所述方法還包括
統(tǒng)計所有用戶的搜索行為和/或搜索結(jié)果;
根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的關(guān)鍵詞與對應的關(guān)聯(lián)詞間關(guān)聯(lián)關(guān)系的強 弱;
根據(jù)確定結(jié)果對所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則進行維護。
優(yōu)選地,所述根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的關(guān)鍵詞與對應的關(guān)聯(lián)詞間關(guān)聯(lián) 關(guān)系的強弱包括
根據(jù)統(tǒng)計結(jié)果計算所述關(guān)聯(lián)規(guī)則的支持度和/或置信度;
如果所述支持度大于設(shè)定的支持度閾值和/或所述置信度大于設(shè)定的置信度閾 值,則確定所述關(guān)聯(lián)規(guī)則為強關(guān)聯(lián);否則為弱關(guān)聯(lián)。
一種服務器,包括
關(guān)鍵詞獲取單元,用于獲取用戶在搜索界面輸入的搜索關(guān)鍵詞;
關(guān)聯(lián)詞獲取單元,用于獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞;
查詢單元,用于分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞 的組合查詢索引數(shù)據(jù)庫,得到搜索結(jié)果;
整理單元,用于對所述搜索結(jié)果進行去重和排序;
發(fā)送單元,用于將排序后的搜索結(jié)果發(fā)送給客戶端,以使客戶端將收到的搜索結(jié) 果展現(xiàn)給所述用戶。
優(yōu)選地,所述關(guān)聯(lián)詞獲取單元,具體用于根據(jù)所述搜索關(guān)鍵詞查找關(guān)聯(lián)規(guī)則數(shù)據(jù) 庫,如果所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中有包含所述搜索關(guān)鍵詞的關(guān)聯(lián)規(guī)則,則從所述關(guān)聯(lián)規(guī)則中 獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
優(yōu)選地,所述服務器還包括規(guī)則設(shè)置單元和/或規(guī)則生成單元,以及保存單元;
所述規(guī)則設(shè)置單元,用于設(shè)置包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的 關(guān)聯(lián)規(guī)則;
所述規(guī)則生成單元,用于根據(jù)所述用戶輸入的多個搜索關(guān)鍵詞,生成包含關(guān)鍵詞、 以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī)則;
所述保存單元,用于將所述關(guān)聯(lián)規(guī)則保存到所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中。
優(yōu)選地,所述服務器還包括
統(tǒng)計單元,用于統(tǒng)計所有用戶的搜索行為和/或搜索結(jié)果;
關(guān)聯(lián)度確定單元,用于根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的關(guān)鍵詞與對應的關(guān)聯(lián) 詞間關(guān)聯(lián)關(guān)系的強弱;
規(guī)則維護單元,用于根據(jù)確定結(jié)果對所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則進行維 護。
優(yōu)選地,所述關(guān)聯(lián)度確定單元包括
計算子單元,用于根據(jù)統(tǒng)計結(jié)果計算所述關(guān)聯(lián)規(guī)則的支持度和/或置信度;
分析子單元,用于在所述支持度大于設(shè)定的支持度閾值和/或所述置信度大于設(shè) 定的置信度閾值時,確定所述關(guān)聯(lián)規(guī)則為強關(guān)聯(lián);否則為弱關(guān)聯(lián)。
本發(fā)明實施例擴展用戶搜索結(jié)果的方法及服務器,針對用戶輸入的搜索關(guān)鍵詞, 挖掘了與所述搜索關(guān)鍵詞具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)詞,并分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以 及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的組合查詢索引數(shù)據(jù)庫,得到相應的搜索結(jié)果,從而擴展了搜 索結(jié)果,將與用戶輸入的搜索關(guān)鍵詞具有關(guān)聯(lián)關(guān)系的文檔也一并提供給用戶,為用戶提供 了更豐富的搜索結(jié)果。
圖1是本發(fā)明實施例擴展用戶搜索結(jié)果的方法的流程圖2是本發(fā)明實施例服務器的一種結(jié)構(gòu)示意圖3是本發(fā)明實施例服務器的另一種結(jié)構(gòu)示意圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例的方案,下面結(jié)合附圖和實施 方式對本發(fā)明實施例作進一步的詳細說明。
本發(fā)明實施例擴展用戶搜索結(jié)果的方法及服務器,針對用戶輸入的搜索關(guān)鍵詞, 挖掘了與所述搜索關(guān)鍵詞具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)詞,也就是說,智能化地對用戶的搜索行為 和期望進行了預測,并分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的 組合查詢索引數(shù)據(jù)庫,得到相應的搜索結(jié)果,從而擴展了搜索結(jié)果,將與用戶輸入的搜索關(guān) 鍵詞具有關(guān)聯(lián)關(guān)系的文檔也一并提供給用戶,為用戶提供了更豐富的搜索結(jié)果。
如圖1所示,是本發(fā)明實施例擴展用戶搜索結(jié)果的方法的流程圖,包括以下基本 步驟
步驟101,獲取用戶在搜索界面輸入的搜索關(guān)鍵詞。
所述搜索關(guān)鍵詞可以是任意的中文、英文,可以是單獨的詞、也可以是詞組,而且, 用戶輸入的關(guān)鍵詞可以是一個或多個。
另外,用戶的輸入也可以是包含一個或多個關(guān)鍵的詞組,比如用戶輸入了 “360和 QQ的大戰(zhàn)”,則可以從中提取出“360”、“QQ”以及“大戰(zhàn)”這幾個關(guān)鍵詞。具體提取方式可以 按照現(xiàn)有技術(shù)中的提取方式來處理,對此本發(fā)明實施例不做限定。
對于上述情況,服務器會分別搜索與各關(guān)鍵詞相匹配的文檔,得到相應的搜索結(jié)果。
步驟102,獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
在本發(fā)明實施例中,可以預先建立各種關(guān)聯(lián)規(guī)則,所述關(guān)聯(lián)規(guī)則中包含關(guān)鍵詞及 與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞,為了便于對這些關(guān)聯(lián)規(guī)則進行維護,還可以將建立的各種 關(guān)聯(lián)規(guī)則保存到一個關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中,以便在需要時對所述關(guān)聯(lián)規(guī)則進行更新、增加或 刪除等。
比如,一些具有很強時效性的信息,隨著時間的推移,這些信息不再成為熱點,人們對這些信息的關(guān)注度也會下降,相應地,與這些信息相關(guān)的關(guān)聯(lián)規(guī)則也需要更新或刪除, 以避免為用戶提供一些不需要的搜索結(jié)果。
相應地,服務器在接收到客戶端發(fā)送的所述搜索關(guān)鍵詞后,就可以根據(jù)所述搜索 關(guān)鍵詞查找所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫,如果所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中有包含所述搜索關(guān)鍵詞的關(guān) 聯(lián)規(guī)則,則從所述關(guān)聯(lián)規(guī)則中獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
需要說明的是,所述關(guān)聯(lián)規(guī)則的建立可以有多種方式,比如
(1)通過設(shè)置方式建立包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī) 則,也就是說,通過人工編輯的方式建立所述關(guān)聯(lián)規(guī)則。
(2)前面提到,用戶輸入的關(guān)鍵詞可以是多個,對于有多個關(guān)鍵詞的情況,這些關(guān) 鍵詞之間就可以是具有關(guān)聯(lián)關(guān)系的,因此,還可以由服務器根據(jù)所述用戶輸入的多個搜索 關(guān)鍵詞,自動生成包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī)則。需要說明的 是,所述服務器可以是搜索引擎服務器,其所針對的用戶也是指所有使用該搜索引擎的用戶。
當然,也可以同時采用上述兩種方式建立相應的關(guān)聯(lián)規(guī)則,而且,還可以有其他方 式并存的情況,本發(fā)明實施例對此不做限定。
比如,在所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中,有表1所示的關(guān)聯(lián)規(guī)則
表 1
權(quán)利要求
1.一種擴展用戶搜索結(jié)果的方法,其特征在于,包括 獲取用戶在搜索界面輸入的搜索關(guān)鍵詞;獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞;分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的組合查詢索引數(shù) 據(jù)庫,得到搜索結(jié)果;對所述搜索結(jié)果進行去重和排序;將排序后的搜索結(jié)果發(fā)送給客戶端,以使客戶端將收到的搜索結(jié)果展現(xiàn)給所述用戶。
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián) 詞包括根據(jù)所述搜索關(guān)鍵詞查找關(guān)聯(lián)規(guī)則數(shù)據(jù)庫;如果所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中有包含所述搜索關(guān)鍵詞的關(guān)聯(lián)規(guī)則,則從所述關(guān)聯(lián)規(guī)則中 獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
3.如權(quán)利要求2所述的方法,其特征在于,所述方法還包括設(shè)置包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī)則;和/或根據(jù)所述用 戶輸入的多個搜索關(guān)鍵詞,生成包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī) 則;將所述關(guān)聯(lián)規(guī)則保存到所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中。
4.如權(quán)利要求3所述的方法,其特征在于,所述方法還包括 統(tǒng)計所有用戶的搜索行為和/或搜索結(jié)果;根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的關(guān)鍵詞與對應的關(guān)聯(lián)詞間關(guān)聯(lián)關(guān)系的強弱; 根據(jù)確定結(jié)果對所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則進行維護。
5.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的 關(guān)鍵詞與對應的關(guān)聯(lián)詞間關(guān)聯(lián)關(guān)系的強弱包括根據(jù)統(tǒng)計結(jié)果計算所述關(guān)聯(lián)規(guī)則的支持度和/或置信度;如果所述支持度大于設(shè)定的支持度閾值和/或所述置信度大于設(shè)定的置信度閾值,則 確定所述關(guān)聯(lián)規(guī)則為強關(guān)聯(lián);否則為弱關(guān)聯(lián)。
6.一種服務器,其特征在于,包括關(guān)鍵詞獲取單元,用于獲取用戶在搜索界面輸入的搜索關(guān)鍵詞; 關(guān)聯(lián)詞獲取單元,用于獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞; 查詢單元,用于分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的組 合查詢索引數(shù)據(jù)庫,得到搜索結(jié)果;整理單元,用于對所述搜索結(jié)果進行去重和排序;發(fā)送單元,用于將排序后的搜索結(jié)果發(fā)送給客戶端,以使客戶端將收到的搜索結(jié)果展 現(xiàn)給所述用戶。
7.如權(quán)利要求6所述的服務器,其特征在于,所述關(guān)聯(lián)詞獲取單元,具體用于根據(jù)所述搜索關(guān)鍵詞查找關(guān)聯(lián)規(guī)則數(shù)據(jù)庫,如果所述 關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中有包含所述搜索關(guān)鍵詞的關(guān)聯(lián)規(guī)則,則從所述關(guān)聯(lián)規(guī)則中獲取與所述搜 索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
8.如權(quán)利要求7所述的服務器,其特征在于,所述服務器還包括規(guī)則設(shè)置單元和/或規(guī)則生成單元,以及保存單元;所述規(guī)則設(shè)置單元,用于設(shè)置包含關(guān)鍵詞、以及與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián) 規(guī)則;所述規(guī)則生成單元,用于根據(jù)所述用戶輸入的多個搜索關(guān)鍵詞,生成包含關(guān)鍵詞、以及 與所述關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞的關(guān)聯(lián)規(guī)則;所述保存單元,用于將所述關(guān)聯(lián)規(guī)則保存到所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中。
9.如權(quán)利要求8所述的服務器,其特征在于,所述服務器還包括 統(tǒng)計單元,用于統(tǒng)計所有用戶的搜索行為和/或搜索結(jié)果;關(guān)聯(lián)度確定單元,用于根據(jù)統(tǒng)計結(jié)果確定所述關(guān)聯(lián)規(guī)則中的關(guān)鍵詞與對應的關(guān)聯(lián)詞間 關(guān)聯(lián)關(guān)系的強弱;規(guī)則維護單元,用于根據(jù)確定結(jié)果對所述關(guān)聯(lián)規(guī)則數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則進行維護。
10.如權(quán)利要求9所述的服務器,其特征在于,所述關(guān)聯(lián)度確定單元包括 計算子單元,用于根據(jù)統(tǒng)計結(jié)果計算所述關(guān)聯(lián)規(guī)則的支持度和/或置信度;分析子單元,用于在所述支持度大于設(shè)定的支持度閾值和/或所述置信度大于設(shè)定的 置信度閾值時,確定所述關(guān)聯(lián)規(guī)則為強關(guān)聯(lián);否則為弱關(guān)聯(lián)。
全文摘要
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,公開了一種擴展用戶搜索結(jié)果的方法及設(shè)備,所述方法包括獲取用戶在搜索界面輸入的搜索關(guān)鍵詞;獲取與所述搜索關(guān)鍵詞相關(guān)聯(lián)的關(guān)聯(lián)詞;分別根據(jù)所述搜索關(guān)鍵詞、關(guān)聯(lián)詞、以及所述搜索關(guān)鍵詞與關(guān)聯(lián)詞的組合查詢索引數(shù)據(jù)庫,得到搜索結(jié)果;對所述搜索結(jié)果進行去重和排序;將排序后的搜索結(jié)果發(fā)送給客戶端,以使客戶端將收到的搜索結(jié)果展現(xiàn)給所述用戶。本發(fā)明提供的技術(shù)方案能夠智能化地為用戶提供更豐富的搜索結(jié)果。
文檔編號G06F17/30GK102033955SQ20101060595
公開日2011年4月27日 申請日期2010年12月24日 優(yōu)先權(quán)日2010年12月24日
發(fā)明者常華 申請人:常華