專利名稱:一種網(wǎng)絡資源搜索方法及搜索系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及互聯(lián)網(wǎng)技術,尤其涉及一種網(wǎng)絡資源搜索方法及搜索系統(tǒng)。
背景技術:
隨著互聯(lián)網(wǎng)技術的發(fā)展,為了滿足互聯(lián)網(wǎng)用戶對不同領域信息的獲取需 求,近年來網(wǎng)絡搜索技術成為非常熱門的互聯(lián)網(wǎng)技術之一,當前主要的網(wǎng)絡搜 索技術包括網(wǎng)頁搜索和專項搜索兩類。其中,網(wǎng)頁搜索是指根據(jù)用戶的搜索請 求對所有網(wǎng)絡資源都進行與用戶意圖搜索的詞條相關的搜索,而專項搜索(又 叫垂直搜索)是指針對某個具體領域的定位搜索,例如音樂搜索、圖片搜索、 論壇搜索等。
由于網(wǎng)頁搜索的范圍遠大于每個專項搜索的范圍,因此在目前絕大部分搜 索引擎中,默認搜索類別是網(wǎng)頁搜索,此外,許多用戶在搜索時也喜歡直接在 搜索引擎的網(wǎng)頁搜索項中提交搜索請求。但是,很多時候用戶所需搜索的內容 可能是某個專項搜索領域的內容,因此,如果使用網(wǎng)頁搜索,即使能找到用戶 所求結果,但是該搜索結果常常會被進行網(wǎng)頁搜索后搜索引擎返回的大量網(wǎng)頁
信息所淹沒,用戶無法在短時間內獲取正確的搜索結果。例如用戶想要搜索 一首詞條為A的歌曲,用戶打開搜索引擎后,往往直接在搜索引擎默認的網(wǎng)頁 搜索項中進行搜索,最后搜索引擎返回了大量攜帶了詞條A的網(wǎng)頁及正確的音 樂網(wǎng)站地址,顯然,相對于直接在音樂這類專項搜索項中搜索詞條為A的歌曲, 上述搜索結果要雜亂得多。另外,如果用戶在錯誤的專項搜索項中輸入了詞條, 則得到的搜索結果對用戶來說有很多是沒有任何意義的。
因此,現(xiàn)有的網(wǎng)絡資源搜索方法不能高效地搜索到用戶需要的正確搜索結果。
發(fā)明內容
本發(fā)明實施例提供一種網(wǎng)絡資源搜索方法及搜索系統(tǒng),能根據(jù)用戶輸入的 索引詞條進行分析判斷,確定出搜索類別,以便更為快速準確地返回搜索結果。
本發(fā)明實施例提供的網(wǎng)絡資源搜索方法,包括
獲取用戶輸入的當前搜索詞條和用戶當前訪問的搜索類別;
匹配建立的第一對應關系,確定出與所述當前搜索詞條對應的搜索類別;
根據(jù)確定出的所述搜索類別進行網(wǎng)絡資源搜索,或提示用戶轉入到確定出
的所述搜索類別進行資源搜索。
本發(fā)明實施例還提供一種網(wǎng)絡資源搜索系統(tǒng),包括用戶接口模塊、網(wǎng)絡
搜索模塊、用戶搜索行為日志數(shù)據(jù)庫、日志分析模塊、用戶個性搜索結果存儲
模塊;
所述用戶接口模塊用于接收客戶端發(fā)起的搜索請求,并發(fā)送給網(wǎng)絡搜索模
塊;
所述用戶搜索行為日志數(shù)據(jù)庫,用于與所述用戶接口模塊交互,動態(tài)更新 并存儲用戶歷史搜索記錄,所述用戶歷史搜索記錄至少包括用戶使用的搜索詞
條以及用戶訪問的搜索類別;
所述日志分析模塊,用于統(tǒng)計所述用戶搜索行為日志數(shù)據(jù)庫中與每個搜索 詞條對應的各搜索類別的訪問次數(shù);將所述訪問次數(shù)最多的搜索類別作為該搜 索詞條的最佳搜索類別;根據(jù)所述用戶搜索行為日志數(shù)據(jù)庫中各搜索詞條及其 對應最佳搜索類別建立第 一對應關系;
所述用戶個性搜索結果存儲模塊,用于存儲所述日志分析模塊建立的所述 第一對應關系;
所述網(wǎng)絡搜索模塊,用于接收到搜索請求后,匹配所述用戶個性搜索結果 存儲模塊中存儲的第一對應關系,根據(jù)匹配結果進行資源搜索,并將搜索結果 通過所述用戶接口模塊發(fā)送給客戶端。 由于本發(fā)明實施例中對用戶的歷史搜索記錄進行了分析和統(tǒng)計,建立了不 同的詞條和各搜索類別之間的對應關系,因此,當用戶在搜索引擎的任意搜索 類別中輸入意圖搜索的當前詞條時,能根據(jù)用戶輸入的搜索詞條匹配建立的對 應關系,主動為用戶找到當前詞條對應的最佳搜索類別,并在所述最佳搜索類 別中進行網(wǎng)絡搜索,或者提示用戶到最佳搜索類別中進行網(wǎng)絡搜索,這樣,相 對于現(xiàn)有技術,可以更為快速地向用戶返回更加準確的搜索結果,節(jié)約了用戶 的搜索時間,提高網(wǎng)絡資源搜索的效率。
圖1為本發(fā)明實施例提供的第一對應關系的建立流程圖2為本發(fā)明實施例提供的網(wǎng)絡資源搜索方法的實現(xiàn)流程圖3為本發(fā)明實施例提供的第二對應關系的建立流程圖4為本發(fā)明實施例提供的根據(jù)第二對應關系進行網(wǎng)絡資源搜索的流程
圖5為本發(fā)明實施例提供的網(wǎng)絡資源搜索系統(tǒng)結構示意圖。
具體實施例方式
本發(fā)明實施例提供一種網(wǎng)絡資源搜索方法,包括根據(jù)用戶歷史搜索記錄, 建立不同搜索詞條和預設的各搜索類別的第一對應關系;當接收到客戶端發(fā)起 的搜索請求時,獲取用戶輸入的當前搜索詞條;匹配所述第一對應關系,確定 出與所述當前搜索詞條對應的搜索類別;根據(jù)通過所述第 一對應關系確定出的 搜索類別,進行網(wǎng)絡搜索操作,或提示用戶轉入到確定出的所述搜索類別進行 資源搜索。
其中,所述用戶搜索記錄至少包括用戶使用的搜索詞條以及用戶所訪問的 搜索類別。為了存儲用戶歷史搜索記錄,需要在網(wǎng)絡側建立用戶搜索行為日志 數(shù)據(jù)庫。此外,為保證用戶歷史行為日志數(shù)據(jù)庫中的用戶歷史搜索記錄隨時更
新,在用戶的每次網(wǎng)絡搜索結束后,確定用戶歷史行為日志庫中是否已存儲有 關于本次搜索中的當前搜索詞條的對應搜索記錄,如果用戶搜索行為日志數(shù)據(jù) 庫中已存儲有當前搜索詞條的對應記錄,則對用戶本次搜索所訪問的搜索類別
的訪問次數(shù)加1;否則在用戶搜索行為日志數(shù)據(jù)庫中新增加一條當前搜索詞條 的對應i己錄。
圖1為本發(fā)明實施例中第一對應關系的建立流程圖,包括 S101:統(tǒng)計歷史搜索記錄中與每個搜索詞條對應的各搜索類別的用戶訪問 次數(shù);
S102:將歷史搜索記錄中用戶訪問次數(shù)最多的搜索類別作為該搜索詞條的 最佳搜索類別;
S103:根據(jù)歷史搜索記錄中的各搜索詞條及其對應的最佳搜索類別建立不 同搜索詞條和其對應的最佳搜索類別的第 一對應關系。
如圖2所示,為本發(fā)明實施例中網(wǎng)絡資源搜索方法的實現(xiàn)流程圖。包括以 下步驟
S201:根據(jù)歷史搜索記錄建立不同搜索詞條和各搜索類別的第一對應關系。
S202:獲取用戶在客戶端發(fā)起的搜索請求,該搜索請求中包括用戶輸入的 當前搜索詞條。
S203:匹配建立的第一對應關系,確定當前搜索詞條是否有對應的最佳搜 索類別,若是,則繼續(xù)執(zhí)行S204,否則,執(zhí)行S210。
S204:判斷用戶當前訪問的搜索類別是否與最佳搜索類別一致,若是則執(zhí) 行S205,否則執(zhí)行S206。
S205:在用戶當前訪問的搜索類別中進行資源搜索。
S206:在確定出的最佳搜索類別中進行資源搜索,或者,提示用戶轉入到 確定出的最佳搜索類別中進行資源搜索。
S210:在用戶當前訪問的搜索類別進行資源搜索,或在默認的搜索類別中
進行資源搜索。
上述步驟S201中,搜索詞條與其對應的最佳搜索類別是一種精確的對應 關系,即嚴格按照搜索詞條來對應搜索類別。實際應用中,還可以通過對搜索 詞條進行分詞處理,根據(jù)分詞處理后的各復合詞的組合來建立與搜索類別的對 應關系,具體步驟如圖3所示,包括
S301:將用戶歷史搜索記錄中的每個搜索詞條拆分為多個獨立復合詞的組 合。例如,某搜索詞條為"A歌曲名的MP3下載",則可將該搜索詞條拆分為 "A歌曲名"+"MP3"+"下載"。
S302:根據(jù)設定的匹配規(guī)則對各獨立復合詞進行歸類組合,建立不同的獨 立復合詞的組合與各搜索類別的第二對應關系。例如,可以設定如下匹配規(guī)貝'J:
不同獨立復合詞的組合對應搜索類別
歌曲名類別復合詞+ "下載"音樂搜索
人名類別復合詞+ "圖片"圖片搜索
地名類別復合詞+ "圖片"圖片搜索
對于每個具有對應關系的獨立復合的組合和搜索類別,將該搜索類別稱為 其對應的獨立復合詞的組合的最佳搜索類別。例如,可將"音樂搜索"作為"任 一歌曲名復合詞+下載"的最佳搜索類別。
因此,根據(jù)上述第二對應關系,在圖2所示流程中,如果步驟S203中確 定當前搜索詞條沒有對應的最佳搜索類別時,則執(zhí)行如圖4所示流程,即用圖 4所示流程代替圖2中的步驟S210,具體包括如下步驟 S401:將當前搜索詞條拆分為多個獨立復合詞的組合。 S402:匹配第二對應關系,確定當前搜索詞條拆分后的各獨立復合詞的組 合是否有對應的搜索類別,若是,則繼續(xù)執(zhí)行S403,否則執(zhí)行S410。 S403:判斷用戶當前訪問搜索類別是否與匹配第二對應關系確定出的搜索 類別一致,若是則執(zhí)行S404,否則執(zhí)行S405。
S404:在用戶當前訪問的搜索類別中進行資源搜索。
S405:在確定出的搜索類別中進行資源搜索,或者,提示用戶轉入到確定 出的搜索類別進行資源搜索。
S410:在用戶當前訪問的搜索類別進行資源搜索,或在默認的搜索類別中 進行資源搜索。
圖4所示流程是采用第二對應關系對當前搜索詞條的進一步匹配,即當前
搜索詞條采用第 一對應關系沒有匹配出對應的最佳搜索類別時,還可以進一步 采用第二對應關系進行匹配。
相應于本發(fā)明實施例提出的一種網(wǎng)絡資源搜索方法,本發(fā)明實施例還提供 一種網(wǎng)絡資源搜索系統(tǒng),包括用戶接口模塊50、用戶搜索行為日志數(shù)據(jù)庫 51、日志分析模塊52、用戶個性搜索結果存儲模塊53和網(wǎng)絡搜索模塊54。其 中
用戶接口模塊50,用于接收客戶端發(fā)起的搜索請求,并轉發(fā)給網(wǎng)絡搜索模 塊54。
用戶搜索行為日志數(shù)據(jù)庫51,用于與用戶接口模塊50交互,動態(tài)更新并 存儲用戶歷史搜索記錄,所述用戶歷史搜索記錄至少包括用戶使用的搜索詞條 以及用戶訪問的搜索類別。
日志分析模塊52,用于統(tǒng)計用戶搜索行為日志數(shù)據(jù)庫51中與每個搜索詞 條對應的各搜索類別的訪問次數(shù);將所述訪問次數(shù)最多的搜索類別作為該搜索 詞條的最佳搜索類別;根據(jù)用戶搜索行為日志數(shù)據(jù)庫51中各搜索詞條及其對 應的最佳搜索類別建立第 一對應關系。
用戶個性搜索結果存儲模塊53,用于存儲日志分析模塊52建立的第一對 應關系。
網(wǎng)絡搜索模塊54,用于接收到用戶接口模塊50轉發(fā)的搜索請求后,根據(jù) 搜索請求中的當前搜索詞條,匹配用戶個性搜索結果存儲模塊53中存儲的第 一對應關系,根據(jù)匹配結果進行資源搜索,并將搜索結果通過用戶接口模塊50 發(fā)送給客戶端。
一種較佳的網(wǎng)絡資源搜索系統(tǒng)還包括復合詞拆分^t塊55。如圖5所示。
所述復合詞拆分模塊55,用于將用戶搜索行為日志數(shù)據(jù)庫51中的搜索詞 條拆分為多個獨立復合詞的組合;根據(jù)設定的匹配規(guī)則對各獨立復合詞進行歸 類組合,建立不同的獨立復合詞的組合與各搜索類別的第二對應關系,并將第 二對應關系發(fā)送給用戶個性搜索結果存儲模塊53存儲。
網(wǎng)絡搜索模塊54進一步根據(jù)搜索請求中的當前搜索詞條匹配用戶個性搜 索結果存儲模塊53中存儲的第二對應關系。
由上可見,當用戶在任意搜索類別中輸入當前搜索詞條時,本發(fā)明實施例 提供的網(wǎng)絡資源搜索方法或搜索系統(tǒng)能根據(jù)存儲的第 一對應關系和/或第二對 應關系,為用戶匹配到當前搜索詞條對應的搜索類別,或者提示用戶到確定出 的搜索類別中進行搜索,這樣,能夠快速且更為準確地返回搜索結果給用戶, 節(jié)約用戶的搜索時間,提高網(wǎng)絡資源搜索的效率。
顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā) 明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及 其等同技術的范圍之內,則本發(fā)明也意圖包含這些改動和變型在內。
權利要求
1、一種網(wǎng)絡資源搜索方法,其特征在于,包括獲取用戶輸入的當前搜索詞條和用戶當前訪問的搜索類別;匹配建立的第一對應關系,確定出與所述當前搜索詞條對應的搜索類別;根據(jù)確定出的所述搜索類別進行網(wǎng)絡資源搜索,或提示用戶轉入到確定出的所述搜索類別進行資源搜索。
2、 如權利要求1所述的網(wǎng)絡資源搜索方法,其特征在于,所述建立的第 一對應關系,包括根據(jù)用戶歷史搜索記錄建立的不同搜索詞條和預設的各搜索類別的第一 對應關系。
3、 如權利要求2所述的網(wǎng)絡資源搜索方法,其特征在于,在網(wǎng)絡側建立 用戶搜索行為日志數(shù)據(jù)庫,存儲所述用戶歷史搜索記錄;所述用戶歷史搜索記錄中至少包含用戶使用的搜索詞條以及用戶訪問的 搜索類別。
4、 如權利要求3所述的網(wǎng)絡資源搜索方法,其特征在于,所述根據(jù)用戶 歷史搜索記錄,建立不同搜索詞條和預設的各搜索類別的第一對應關系,具體 包括統(tǒng)計所述用戶搜索行為日志數(shù)據(jù)庫中,與每個搜索詞條對應的各搜索類別 的i方問次數(shù);將所述訪問次數(shù)最多的搜索類別作為該搜索詞條的最佳搜索類別; 根據(jù)所述用戶搜索行為日志數(shù)據(jù)庫中各搜索詞條及其對應的最佳搜索類 別建立所述第一對應關系。
5、 如權利要求4所述的網(wǎng)絡資源搜索方法,其特征在于,當用戶本次搜 索結束后,若所述用戶搜索行為日志數(shù)據(jù)庫中沒有存儲當前搜索詞條的對應記 錄,則在用戶搜索行為日志數(shù)據(jù)庫中新增加一條當前搜索詞條的對應記錄;若所述用戶搜索行為日志數(shù)據(jù)庫中已存儲有當前搜索詞條的對應記錄,則 對用戶本次搜索類別的訪問次數(shù)加1。
6、 如權利要求1所述的網(wǎng)絡資源搜索方法,其特征在于,當匹配所述第 一對應關系沒有確定出對應的搜索類別時,在用戶當前訪問的搜索類別進行資 源搜索,或在默認的搜索類別中進行資源搜索。
7、 如權利要求1所述的網(wǎng)絡資源搜索方法,其特征在于,還包括 將所述用戶歷史搜索記錄中的每個搜索詞條拆分為多個獨立復合詞的組合;根據(jù)設定的匹配規(guī)則對各獨立復合詞進行歸類組合,建立不同的獨立復合 詞的組合與各搜索類別的第二對應關系;當接收到客戶端發(fā)起的搜索請求,匹配所述第 一對應關系沒有確定出對應 的搜索類別時,還執(zhí)行下列步驟將用戶輸入的當前搜索詞條拆分為多個獨立復合詞的組合;匹配所述第二對應關系,確定出與當前搜索詞條拆分后的獨立復合詞的組 合相對應的搜索類別;根據(jù)通過所述第二對應關系確定出的搜索類別,進行網(wǎng)絡資源搜索,或提 示用戶轉入到確定出的所述搜索類別進行資源搜索。
8、 如權利要求7所述的網(wǎng)絡資源搜索方法,其特征在于,當匹配所述第 二對應關系還沒有確定出對應的搜索類別時,在用戶當前訪問的搜索類別進行 資源搜索,或在默認的搜索類別中進行資源搜索。
9、 如權利要求1-8任一所述的網(wǎng)絡資源搜索方法,其特征在于,當確定 出當前搜索詞條的搜索類別后,還包括判斷用戶當前訪問的搜索類別與確定出的所述搜索類別是否一致; 若一致,則直接在當前類別進行資源搜索;若不一致,則轉入到確定出的所述搜索類別,或提示用戶轉入到確定出的 所述搜索類別進行資源搜索。
10、 一種網(wǎng)絡資源搜索系統(tǒng),其特征在于,包括用戶接口模塊、網(wǎng)絡搜 索模塊、用戶搜索行為日志數(shù)據(jù)庫、日志分析模塊、用戶個性搜索結果存儲模塊;所述用戶接口模塊,用于接收客戶端發(fā)起的搜索請求,并轉發(fā)給所述網(wǎng)絡 搜索模塊;所述用戶搜索行為日志數(shù)據(jù)庫,用于與所述用戶接口模塊交互,動態(tài)更新 并存儲用戶歷史搜索記錄,所述用戶歷史搜索記錄至少包括用戶使用的搜索詞 條以及用戶訪問的搜索類別;所述日志分析才莫塊,用于統(tǒng)計所述用戶搜索行為日志數(shù)據(jù)庫中與每個搜索 詞條對應的各搜索類別的訪問次數(shù);將所述訪問次數(shù)最多的搜索類別作為該搜 索詞條的最佳搜索類別;根據(jù)所述用戶搜索行為日志數(shù)據(jù)庫中各搜索詞條及其 對應最佳搜索類別建立第 一對應關系;所述用戶個性搜索結果存儲模塊,用于存儲所述日志分析模塊建立的所述 第一對應關系;所述網(wǎng)絡搜索模塊,用于接收到所述用戶接口模塊轉發(fā)的搜索請求后,匹 配所述用戶個性搜索結果存儲模塊中存儲的第一對應關系,根據(jù)匹配結果在對 應的搜索類別中進行資源搜索,并將搜索結果通過所述用戶接口模塊發(fā)送給客 戶端。
11、如權利要求10所述的網(wǎng)絡資源搜索系統(tǒng),其特征在于,還包括復 合詞拆分模塊,用于將所述用戶搜索行為日志數(shù)據(jù)庫中的搜索詞條拆分為多個 獨立復合詞的組合;根據(jù)設定的匹配規(guī)則對各獨立復合詞進行歸類組合,建立不同的獨立復合 詞的組合與各搜索類別的第二對應關系,并發(fā)送給所述用戶個性搜索結果存儲 模塊存儲;所述網(wǎng)絡搜索模塊還匹配所述用戶個性搜索結果存儲模塊中存儲的所述 第二對應關系。
全文摘要
本發(fā)明公開了一種網(wǎng)絡資源搜索方法及網(wǎng)絡資源搜索系統(tǒng),能提高網(wǎng)絡資源搜索的效率。本發(fā)明實施例提供的方法包括根據(jù)用戶歷史搜索記錄,建立不同搜索詞條和預設的各搜索類別的第一對應關系;當接收到客戶端發(fā)起的搜索請求時,執(zhí)行下列步驟獲取用戶輸入的當前搜索詞條和用戶當前訪問的搜索類別;匹配所述第一對應關系,確定出與所述當前搜索詞條對應的搜索類別;根據(jù)通過所述第一對應關系確定出的搜索類別,進行網(wǎng)絡搜索操作,或提示用戶轉入到確定出的所述搜索類別進行資源搜索。采用本發(fā)明能根據(jù)用戶輸入的索引詞條進行分析判斷,確定出搜索類別,更為快速準確地返回搜索結果,增加用戶體驗。
文檔編號H04L12/54GK101179472SQ20071010590
公開日2008年5月14日 申請日期2007年5月31日 優(yōu)先權日2007年5月31日
發(fā)明者劉云峰, 劉致遠 申請人:騰訊科技(深圳)有限公司