亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

站內(nèi)搜索數(shù)據(jù)的搜集處理方法和系統(tǒng)的制作方法

文檔序號:6485562閱讀:144來源:國知局
站內(nèi)搜索數(shù)據(jù)的搜集處理方法和系統(tǒng)的制作方法
【專利摘要】一種站內(nèi)搜索數(shù)據(jù)的搜集處理方法,包括以下步驟:站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求;提取所述站內(nèi)搜索請求中的搜索數(shù)據(jù);對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息。上述方法中網(wǎng)站不需要花費(fèi)自身系統(tǒng)資源對搜索數(shù)據(jù)進(jìn)行統(tǒng)計計算,且多個網(wǎng)站可以共用站外搜索服務(wù)器中完成搜索數(shù)據(jù)的統(tǒng)計計算,不需要各個網(wǎng)站都各自開發(fā)一套系統(tǒng)處理搜索數(shù)據(jù),因此降低了網(wǎng)站自身的系統(tǒng)資源的消耗。此外,還提供一種站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)。
【專利說明】站內(nèi)搜索數(shù)據(jù)的搜集處理方法和系統(tǒng)
【【技術(shù)領(lǐng)域】】
[0001 ] 本發(fā)明涉及數(shù)據(jù)搜索【技術(shù)領(lǐng)域】,特別的涉及一種站內(nèi)搜索數(shù)據(jù)的搜集處理方法和系統(tǒng)。
【【背景技術(shù)】】
[0002]因特網(wǎng)如今已經(jīng)發(fā)展成為了全球化的信息平臺,人們可在利用常用的網(wǎng)絡(luò)搜索引擎在整個因特網(wǎng)上搜索任何信息和資源。
[0003]大多數(shù)網(wǎng)站也提供一種搜索范圍限制在自身網(wǎng)站內(nèi)部的搜索服務(wù),即站內(nèi)搜索,幫助用戶更快的在本網(wǎng)站內(nèi)找到目標(biāo)內(nèi)容。另外,網(wǎng)站內(nèi)部的搜索記錄是統(tǒng)計分析用戶需求、衡量網(wǎng)站設(shè)計是否友 善合理的重要依據(jù),而統(tǒng)計分析得到的結(jié)果是優(yōu)化網(wǎng)站的重要參考指標(biāo)。
[0004]但是,對于中小網(wǎng)站來說,開發(fā)適合于自身網(wǎng)站內(nèi)部搜索且可對搜索記錄進(jìn)行統(tǒng)計分析的搜索引擎,其技術(shù)難度高、開發(fā)費(fèi)用大、維護(hù)成本高。而且,搜索服務(wù)以及統(tǒng)計分析服務(wù)都需要消耗網(wǎng)站內(nèi)部大量的系統(tǒng)資源、帶寬資源。

【發(fā)明內(nèi)容】

[0005]基于此,有必要提供一種能降低網(wǎng)站自身資源消耗的站內(nèi)搜索數(shù)據(jù)的搜集處理方法。
[0006]一種站內(nèi)搜索數(shù)據(jù)的搜集處理方法,包括以下步驟:
[0007]站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求;
[0008]提取所述站內(nèi)搜索請求中的搜索數(shù)據(jù);
[0009]對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息。
[0010]在其中一個實(shí)施例中,所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索詞。
[0011]在其中一個實(shí)施例中,所述對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息的步驟包括:
[0012]將所述搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
[0013]在其中一個實(shí)施例中,所述對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息的步驟包括:
[0014]按照網(wǎng)站標(biāo)識實(shí)時匯總聚合所述搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。
[0015]在其中一個實(shí)施例中,通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將所述站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器。
[0016]在其中一個實(shí)施例中,所述方法還包括:[0017]所述站外搜索服務(wù)器根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
[0018]在其中一個實(shí)施例中,所述站外搜索服務(wù)器中存儲了與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源;
[0019]所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍;
[0020]所述站外搜索服務(wù)器根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索的步驟為:
[0021]所述站外搜索服務(wù)器根據(jù)所述內(nèi)容搜索范圍在所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與所述用戶輸入的搜索詞匹配的信息。
[0022]在其中一個實(shí)施例中,所述搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
[0023]在其中一個實(shí)施例中,在所述統(tǒng)計服務(wù)器對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計的步驟之前,還包括:
[0024]通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄所述網(wǎng)站的總用戶數(shù)量,將所述總用戶數(shù)量發(fā)送至所述站外搜索服務(wù)器,所述站外搜索服務(wù)器接收所述總用戶數(shù)量。
[0025]在其中一個實(shí)施例中,通過數(shù)據(jù)采集腳本提取所述搜索請求中的搜索數(shù)據(jù)。
[0026]基于此,有必要提供一種能降低網(wǎng)站自身資源消耗的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)。
[0027]—種站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),包括站內(nèi)搜索服務(wù)器和統(tǒng)計服務(wù)器,其中:
[0028]所述站外搜索服務(wù)器,包括:
[0029]通信模塊,用于獲取至少一個網(wǎng)站的站內(nèi)搜索請求;
[0030]搜索數(shù)據(jù)提取模塊,用于提取所述站內(nèi)搜索請求中的搜索數(shù)據(jù);
[0031]搜索數(shù)據(jù)上報模塊,用于將所述搜索數(shù)據(jù)上報至所述統(tǒng)計服務(wù)器;
[0032]所述統(tǒng)計服務(wù)器,包括:
[0033]數(shù)據(jù)接入模塊,用于接收所述搜索數(shù)據(jù);
[0034]數(shù)據(jù)處理模塊,用于對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息。
[0035]在其中一個實(shí)施例中,所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索。
[0036]在其中一個實(shí)施例中,所述數(shù)據(jù)處理模塊用于將所述搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
[0037]在其中一個實(shí)施例中,所述數(shù)據(jù)處理模塊包括實(shí)時計算模塊,用于按照網(wǎng)站標(biāo)識實(shí)時匯總聚合所述搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。
[0038]在其中一個實(shí)施例中,所述系統(tǒng)還包括用于通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將所述站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器的搜索信息獲取模塊。
[0039]在其中一個實(shí)施例中,所述站外搜索服務(wù)器還包括搜索模塊,用于根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
[0040]在其中一個實(shí)施例中,所述站外搜索服務(wù)器還包括存儲模塊,用于存儲與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源;
[0041]所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍;
[0042]所述搜索模塊用于根據(jù)所述內(nèi)容搜索范圍在所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與所述用戶輸入的搜索詞匹配的信息。
[0043]在其中一個實(shí)施例中,所述搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
[0044]在其中一個實(shí)施例中,所述系統(tǒng)還包括總用戶數(shù)量獲取模塊,用于通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄所述網(wǎng)站的總用戶數(shù)量,將所述總用戶數(shù)量發(fā)送至所述站外搜索服務(wù)器;
[0045]所述數(shù)據(jù)接入模塊還用于接收所述總用戶數(shù)量。
[0046]在其中一個實(shí)施例中,所述搜索數(shù)據(jù)提取模塊通過數(shù)據(jù)采集腳本提取所述搜索請求中的搜索數(shù)據(jù)。
[0047]上述站內(nèi)搜索數(shù)據(jù)的搜索處理方法和系統(tǒng),站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求,提取站內(nèi)搜索請求中的搜索數(shù)據(jù),對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息。上述方法和系統(tǒng)中,網(wǎng)站不需要花費(fèi)系統(tǒng)資源對搜索數(shù)據(jù)進(jìn)行統(tǒng)計計算以得到相關(guān)的搜索指標(biāo)信息。此外,多個網(wǎng)站可以共用站外搜索服務(wù)器完成搜索數(shù)據(jù)的統(tǒng)計計算,不需要各個網(wǎng)站都各自開發(fā)一套統(tǒng)計計算搜索數(shù)據(jù)的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),因此降低了網(wǎng)站自身的系統(tǒng)資源的消耗。
[0048]另外,上述方法和系統(tǒng),通過站外搜索服務(wù)器根據(jù)搜索數(shù)據(jù)在發(fā)送該搜索數(shù)據(jù)的網(wǎng)站對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,向網(wǎng)站返回搜索結(jié)果。多個網(wǎng)站可以共用站外搜索服務(wù)器完成網(wǎng)站內(nèi)部的數(shù)據(jù)搜索,不需要各個網(wǎng)站都各自開發(fā)一套搜索系統(tǒng)來完成站內(nèi)數(shù)據(jù)搜索,因而上述方式幾乎不需要消耗網(wǎng)站自身的系統(tǒng)資源。
【【專利附圖】

【附圖說明】】
[0049]圖1為一個實(shí)施例中的站內(nèi)搜索數(shù)據(jù)的搜集處理方法的流程示意圖;
[0050]圖2為一個實(shí)施例中的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)的結(jié)構(gòu)示意圖;
[0051]圖3為另一實(shí)施例中的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)的結(jié)構(gòu)示意圖;
[0052]圖4為又一實(shí)施例中的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)的結(jié)構(gòu)示意圖;
[0053]圖5為一個實(shí)施例中的站外搜索服務(wù)器的結(jié)構(gòu)不意圖。
【【具體實(shí)施方式】】
[0054]如圖1所示,在一個實(shí)施例中,一種站內(nèi)搜索數(shù)據(jù)的搜集處理方法,包括以下步驟:
[0055]步驟S102,站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求。
[0056]在一個實(shí)施例中,可通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器。[0057]具體的,可預(yù)先在網(wǎng)站給用戶提供搜索服務(wù)的頁面內(nèi)嵌站內(nèi)搜索接口,通過該站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將獲取到的站內(nèi)搜索請求進(jìn)行編碼,將編碼后的信息按照預(yù)設(shè)格式拼接到HTTP請求中,并將HTTP請求發(fā)送到站外搜索服務(wù)器。
[0058]站外搜索服務(wù)器為獨(dú)立于網(wǎng)站自身的用于執(zhí)行數(shù)據(jù)搜索功能的服務(wù)器。站外搜索服務(wù)器可為多個網(wǎng)站提供數(shù)據(jù)搜索服務(wù)。
[0059]步驟S104,提取站內(nèi)搜索請求中的搜索數(shù)據(jù)。
[0060]在一個實(shí)施例中,站外搜索服務(wù)器可從接收的HTTP請求(拼接了站內(nèi)搜索請求)中提取出搜索數(shù)據(jù)。
[0061 ] 在一個實(shí)施例中,可通過數(shù)據(jù)采集腳本提取搜索請求中的搜索數(shù)據(jù)。
[0062]具體的,可預(yù)先在站外搜索服務(wù)器的執(zhí)行搜索任務(wù)的網(wǎng)頁中嵌入數(shù)據(jù)采集腳本。通過數(shù)據(jù)采集腳本提取搜索數(shù)據(jù)。
[0063]在站外搜索服務(wù)器執(zhí)行搜索任務(wù)的頁面中內(nèi)嵌數(shù)據(jù)采集腳本,通過數(shù)據(jù)采集腳本執(zhí)行提取搜索數(shù)據(jù)的任務(wù),實(shí)現(xiàn)方式簡單,開發(fā)維護(hù)成本低。
[0064]在一個實(shí)施例中,搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索詞。其中,網(wǎng)站標(biāo)識可為網(wǎng)站URL。
[0065]步驟S106,對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息。
[0066]在一個實(shí)施例中,可將搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
[0067]在一個實(shí)施例中,搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
[0068]具體的,搜索詞的搜索量為某時間段內(nèi)每種搜索詞被搜索的次數(shù),可衡量搜索詞的熱度,次數(shù)越大熱度越高。搜索用戶量為某時間段內(nèi)使用站內(nèi)搜索服務(wù)的用戶數(shù)量。平均搜索次數(shù)為某時間段內(nèi)每個用戶平均搜索的次數(shù),可衡量搜索結(jié)果的質(zhì)量,數(shù)值越大一般質(zhì)量越差。搜索用戶率為某時間段內(nèi)使用站內(nèi)搜索服務(wù)的用戶數(shù)量與登錄網(wǎng)站的總用戶數(shù)量的比值。
[0069]在一個實(shí)施例中,在步驟S106中對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息之前,上述站內(nèi)搜索數(shù)據(jù)的搜集處理方法還包括步驟:通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄所述網(wǎng)站的總用戶數(shù)量,將總用戶數(shù)量發(fā)送至站外搜索服務(wù)器,站外搜索服務(wù)器接收總用戶數(shù)量。
[0070]具體的,在一個實(shí)施例中,站外搜索服務(wù)器可根據(jù)搜索數(shù)據(jù)中包含的用戶標(biāo)識統(tǒng)計使用站內(nèi)搜索服務(wù)的用戶數(shù)量,即搜索用戶量。站外搜索服務(wù)器可累加某時段內(nèi)獲取的用戶輸入的搜索詞的總數(shù)量,得到該時段內(nèi)的站內(nèi)搜索次數(shù),并計算站內(nèi)搜索次數(shù)與用戶數(shù)量采集腳本發(fā)送的該時段內(nèi)的登錄網(wǎng)站的總用戶數(shù)量的比值,得到平均搜索次數(shù)。
[0071 ] 在一個實(shí)施例中,站外搜索服務(wù)器可通過分布式計算平臺處理搜索數(shù)據(jù)。采用分布式計算平臺可處理海量的搜索數(shù)據(jù),提高搜索數(shù)據(jù)的處理速度。
[0072]在一個實(shí)施例中,上述步驟S106中對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息的具體過程包括:按照網(wǎng)站標(biāo)識實(shí)時匯總聚合接收的搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。[0073]在一個實(shí)施例中,可按照網(wǎng)站標(biāo)識匯總聚合接收的搜索數(shù)據(jù),并根據(jù)匯總聚合得到的網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)統(tǒng)計計算得到網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。進(jìn)一步的,可將網(wǎng)站標(biāo)識以及網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行對應(yīng)存儲。
[0074]在另一個實(shí)施例中,上述步驟S106中對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息的具體過程包括:將搜索數(shù)據(jù)寫入離線日志文件,按照網(wǎng)站匯總聚合離線日志文件記錄的預(yù)設(shè)時段內(nèi)接收的搜索數(shù)據(jù),并根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的預(yù)設(shè)時段的搜索指標(biāo)信息并存儲。
[0075]具體的,可每間隔預(yù)設(shè)時長按照網(wǎng)站標(biāo)識匯總聚合離線日志文件中記錄的搜索數(shù)據(jù)。例如,可每天進(jìn)行一次搜索數(shù)據(jù)的統(tǒng)計計算,處理前一天接收的搜索數(shù)據(jù)。
[0076]在一個實(shí)施例中,還可將搜索指標(biāo)信息按照預(yù)設(shè)的方法進(jìn)行處理,形成列表、曲線圖、柱形圖、餅圖等較直觀形象的搜索指標(biāo)信息的統(tǒng)計結(jié)果,進(jìn)一步的,可展示統(tǒng)計結(jié)果。在一個實(shí)施例中,還可將統(tǒng)計結(jié)果發(fā)送給搜索指標(biāo)信息所屬的網(wǎng)站或者第三方服務(wù),供相關(guān)用戶分析網(wǎng)站的設(shè)計。
[0077]在一個實(shí)施例中,上述站內(nèi)搜索數(shù)據(jù)的搜集處理方法還包括步驟:站外搜索服務(wù)器根據(jù)搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
[0078]在一個實(shí)施例中,搜索數(shù)據(jù)包括:網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍等信息。其中,網(wǎng)站標(biāo)識可為網(wǎng)站URL,內(nèi)容搜索范圍包括全文搜索、主題搜索、標(biāo)題搜索等。
[0079]具體的,站外搜索服務(wù)器中存儲了與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源。在一個實(shí)施例中,站外搜索服務(wù)器定期爬取網(wǎng)站的網(wǎng)頁資源,進(jìn)一步的保存網(wǎng)站標(biāo)識與網(wǎng)站的網(wǎng)頁資源的對應(yīng)關(guān)系。
[0080]在一個實(shí)施例中,站外搜索服務(wù)器根據(jù)搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索的具體過程為:站外搜索服務(wù)器據(jù)內(nèi)容搜索范圍在網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與用戶輸入的搜索詞匹配的信息。
[0081]具體的,可根據(jù)網(wǎng)站標(biāo)識以及網(wǎng)站標(biāo)識與網(wǎng)頁資源的對應(yīng)關(guān)系,查找與搜索請求中包含的網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源。進(jìn)一步的,根據(jù)搜索請求中包含的內(nèi)容搜索范圍,在網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中查找與用戶輸入的搜索詞匹配的信息,并獲取該信息所在的網(wǎng)頁的鏈接地址。例如,若內(nèi)容搜索范圍為全文搜索,則在所有網(wǎng)頁內(nèi)容中搜索對應(yīng)的信息,若內(nèi)容搜索范圍為主題搜索,則在網(wǎng)頁中包含的文章、評論、圖片等所屬的主題信息中查找與搜索詞匹配的信息,等等。
[0082]進(jìn)一步的,站外搜索服務(wù)器可向網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站返回搜索結(jié)果,搜索結(jié)果中包含與用戶輸入的搜索信息匹配的信息所在的網(wǎng)頁的鏈接。
[0083]在一個實(shí)施例中,上述搜索數(shù)據(jù)還包括:搜索結(jié)果的排序字段和排序方式。站外搜索服務(wù)器可根據(jù)搜索結(jié)果的排序字段和排序方式,將搜索結(jié)果中的網(wǎng)頁的鏈接進(jìn)行排序,向網(wǎng)站返回排序后的搜索結(jié)果。
[0084]如圖2所示,在一個實(shí)施例中,一種站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),包括站外搜索服務(wù)器200和統(tǒng)計服務(wù)器300,站外搜索服務(wù)器200包括通信模塊210、搜索數(shù)據(jù)提取模塊220和搜索數(shù)據(jù)上報模塊230 ;統(tǒng)計服務(wù)器300包括數(shù)據(jù)接入模塊310和數(shù)據(jù)處理模塊320,其中:[0085]站外搜索服務(wù)器200為獨(dú)立于網(wǎng)站自身的用于執(zhí)行數(shù)據(jù)搜索功能的服務(wù)器。站外搜索服務(wù)器200可為多個網(wǎng)站提供數(shù)據(jù)搜索服務(wù)。
[0086]通信模塊210用于獲取至少一個網(wǎng)站的站內(nèi)搜索請求。
[0087]如圖3所示,在一個實(shí)施例中,上述站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)還包括用于通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將所述站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器的搜索信息獲取模塊110。
[0088]在一個實(shí)施例中,可預(yù)先在網(wǎng)站給用戶提供搜索服務(wù)的頁面內(nèi)嵌站內(nèi)搜索接口,搜索信息獲取模塊110可通過該站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將獲取到的站內(nèi)搜索請求進(jìn)行編碼,將編碼后的信息按照預(yù)設(shè)格式拼接到HTTP請求中,并將HTTP請求發(fā)送到站外搜索服務(wù)器200。
[0089]應(yīng)當(dāng)說明的是,站外搜索服務(wù)器200可為多個網(wǎng)站提供搜索數(shù)據(jù)統(tǒng)計服務(wù),因此站外搜索服務(wù)器200可與多個網(wǎng)站進(jìn)行交互,圖3所示的實(shí)施例僅為說明站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)的原理的一個最簡實(shí)施例。
[0090]搜索數(shù)據(jù)提取模塊220用于提取站內(nèi)搜索請求中的搜索數(shù)據(jù)。
[0091]在一個實(shí)施例中,搜索數(shù)據(jù)提取模塊220可從接收的HTTP請求(拼接了站內(nèi)搜索請求)中提取出搜索數(shù)據(jù)。
[0092]在一個實(shí)施例中,搜索數(shù)據(jù)提取模塊220可通過數(shù)據(jù)采集腳本提取搜索請求中的搜索數(shù)據(jù)。
[0093]具體的,可預(yù)先在站外搜索服務(wù)器200的執(zhí)行搜索任務(wù)的網(wǎng)頁中嵌入數(shù)據(jù)采集腳本。通過數(shù)據(jù)采集腳本提取搜索數(shù)據(jù)。
[0094]在站外搜索服務(wù)器200執(zhí)行搜索任務(wù)的頁面中內(nèi)嵌數(shù)據(jù)采集腳本,通過數(shù)據(jù)采集腳本執(zhí)行提取搜索數(shù)據(jù)的任務(wù),實(shí)現(xiàn)方式簡單,開發(fā)維護(hù)成本低。
[0095]在一個實(shí)施例中,搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索詞。其中,網(wǎng)站標(biāo)識可為網(wǎng)站URL。
[0096]搜索數(shù)據(jù)上報模塊230用于將搜索數(shù)據(jù)上報至統(tǒng)計服務(wù)器300。
[0097]數(shù)據(jù)接入模塊310用于接收搜索數(shù)據(jù)。
[0098]數(shù)據(jù)處理模塊320用于對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息。
[0099]在一個實(shí)施例中,數(shù)據(jù)處理模塊320可將搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
[0100]在一個實(shí)施例中,搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
[0101]具體的,搜索詞的搜索量為某時間段內(nèi)每種搜索詞被搜索的次數(shù),可衡量搜索詞的熱度,次數(shù)越大熱度越高。搜索用戶量為某時間段內(nèi)使用站內(nèi)搜索服務(wù)的用戶數(shù)量。平均搜索次數(shù)為某時間段內(nèi)每個用戶平均搜索的次數(shù),可衡量搜索結(jié)果的質(zhì)量,數(shù)值越大一般質(zhì)量越差。搜索用戶率為某時間段內(nèi)使用站內(nèi)搜索服務(wù)的用戶數(shù)量與登錄網(wǎng)站的總用戶數(shù)量的比值。
[0102]如圖4所示,在一個實(shí)施例中,上述站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng)還包括總用戶數(shù)量獲取模塊120,用于通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄網(wǎng)站的總用戶數(shù)量,并將總用戶數(shù)量發(fā)送到統(tǒng)計服務(wù)器300。
[0103]本實(shí)施例中,數(shù)據(jù)接入模塊310還用于接收總用戶數(shù)量獲取模塊120發(fā)送的總用
戶數(shù)量。
[0104]具體的,在一個實(shí)施例中,數(shù)據(jù)處理模塊320可根據(jù)搜索數(shù)據(jù)中包含的用戶標(biāo)識統(tǒng)計使用站內(nèi)搜索服務(wù)的用戶數(shù)量,即搜索用戶量。數(shù)據(jù)處理模塊320可累加某時段內(nèi)獲取的用戶輸入的搜索詞的總數(shù)量,得到該時段內(nèi)的站內(nèi)搜索次數(shù),并計算站內(nèi)搜索次數(shù)與總用戶數(shù)量獲取模塊120發(fā)送的該時段內(nèi)的登錄網(wǎng)站的總用戶數(shù)量的比值,得到平均搜索次數(shù)。
[0105]在一個實(shí)施例中,數(shù)據(jù)處理模塊320可通過分布式計算平臺處理搜索數(shù)據(jù)。采用分布式計算平臺可處理海量的搜索數(shù)據(jù),提高搜索數(shù)據(jù)的處理速度。
[0106]在一個實(shí)施例中,數(shù)據(jù)處理模塊320包括實(shí)時計算模塊(圖中未示出),用于按照網(wǎng)站標(biāo)識實(shí)時匯總聚合接收的搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。
[0107]在一個實(shí)施例中,實(shí)時計算模塊可按照網(wǎng)站標(biāo)識匯總聚合接收的搜索數(shù)據(jù),并根據(jù)匯總聚合得到的網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)統(tǒng)計計算得到網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。進(jìn)一步的,可將網(wǎng)站標(biāo)識以及網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行對應(yīng)存儲。
[0108]在另一個實(shí)施例中,數(shù)據(jù)處理模塊320包括離線計算模塊(圖中未示出),用于將搜索數(shù)據(jù)寫入離線日志文件,按照網(wǎng)站匯總聚合離線日志文件記錄的預(yù)設(shè)時段內(nèi)接收的搜索數(shù)據(jù),并根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的預(yù)設(shè)時段的搜索指標(biāo)信息并存儲。
[0109]具體的,離線計算模塊可每間隔預(yù)設(shè)時長按照網(wǎng)站標(biāo)識匯總聚合離線日志文件中記錄的搜索數(shù)據(jù)。例如,可每天進(jìn)行一次搜索數(shù)據(jù)的統(tǒng)計計算,處理前一天接收的搜索數(shù)據(jù)。
[0110]在一個實(shí)施例中,數(shù)據(jù)處理模塊320還可將搜索指標(biāo)信息按照預(yù)設(shè)的方法進(jìn)行處理,形成列表、曲線圖、柱形圖、餅圖等較直觀形象的搜索指標(biāo)信息的統(tǒng)計結(jié)果,進(jìn)一步的,可展示統(tǒng)計結(jié)果。在一個實(shí)施例中,還可將統(tǒng)計結(jié)果發(fā)送給搜索指標(biāo)信息所屬的網(wǎng)站或者第三方服務(wù),供相關(guān)用戶分析網(wǎng)站的設(shè)計。
[0111]如圖5所示,在一個實(shí)施例中,站外搜索服務(wù)器200還包括搜索模塊240,用于根據(jù)搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
[0112]在一個實(shí)施例中,搜索數(shù)據(jù)包括:網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍等信息。其中,網(wǎng)站標(biāo)識可為網(wǎng)站URL,內(nèi)容搜索范圍包括全文搜索、主題搜索、標(biāo)題搜索等。
[0113]在一個實(shí)施例中,站外搜索服務(wù)器200還包括存儲模塊(圖中未不出),用于存儲與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源。在一個實(shí)施例中,搜索模塊240可定期爬取網(wǎng)站的網(wǎng)頁資源,存儲模塊可保存網(wǎng)站標(biāo)識與網(wǎng)站的網(wǎng)頁資源的對應(yīng)關(guān)系。
[0114]在一個實(shí)施例中,搜索模塊240用于根據(jù)內(nèi)容搜索范圍在網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與用戶輸入的搜索詞匹配的信息。
[0115]具體的,搜索模塊240可根據(jù)網(wǎng)站標(biāo)識以及網(wǎng)站標(biāo)識與網(wǎng)頁資源的對應(yīng)關(guān)系,查找與搜索請求中包含的網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源。進(jìn)一步的,可根據(jù)搜索請求中包含的內(nèi)容搜索范圍,在網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中查找與用戶輸入的搜索詞匹配的信息,并獲取該信息所在的網(wǎng)頁的鏈接地址。例如,若內(nèi)容搜索范圍為全文搜索,則在所有網(wǎng)頁內(nèi)容中搜索對應(yīng)的信息,若內(nèi)容搜索范圍為主題搜索,則在網(wǎng)頁中包含的文章、評論、圖片等所屬的主題信息中查找與搜索詞匹配的信息,等等。
[0116]進(jìn)一步的,搜索模塊240可向網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站返回搜索結(jié)果,搜索結(jié)果中包含與用戶輸入的搜索信息匹配的信息所在的網(wǎng)頁的鏈接。
[0117]在一個實(shí)施例中,上述搜索數(shù)據(jù)還包括:搜索結(jié)果的排序字段和排序方式。搜索模塊240可根據(jù)搜索結(jié)果的排序字段和排序方式,將搜索結(jié)果中的網(wǎng)頁的鏈接進(jìn)行排序,向網(wǎng)站返回排序后的搜索結(jié)果。
[0118]上述站內(nèi)搜索數(shù)據(jù)的搜索處理方法和系統(tǒng),站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求,提取站內(nèi)搜索請求中的搜索數(shù)據(jù),對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到網(wǎng)站的搜索指標(biāo)信息。上述方法和系統(tǒng)中,網(wǎng)站不需要花費(fèi)系統(tǒng)資源對搜索數(shù)據(jù)進(jìn)行統(tǒng)計計算以得到相關(guān)的搜索指標(biāo)信息。此外,多個網(wǎng)站可以共用站外搜索服務(wù)器完成搜索數(shù)據(jù)的統(tǒng)計計算,不需要各個網(wǎng)站都各自開發(fā)一套統(tǒng)計計算搜索數(shù)據(jù)的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),因此降低了網(wǎng)站自身的系統(tǒng)資源的消耗。
[0119]另外,上述方法和系統(tǒng),通過站外搜索服務(wù)器根據(jù)搜索數(shù)據(jù)在發(fā)送該搜索數(shù)據(jù)的網(wǎng)站對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,向網(wǎng)站返回搜索結(jié)果。多個網(wǎng)站可以共用站外搜索服務(wù)器完成網(wǎng)站內(nèi)部的數(shù)據(jù)搜索,不需要各個網(wǎng)站都各自開發(fā)一套搜索系統(tǒng)來完成站內(nèi)數(shù)據(jù)搜索,因而上述方式幾乎不需要消耗網(wǎng)站自身的系統(tǒng)資源。
[0120]以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【權(quán)利要求】
1.一種站內(nèi)搜索數(shù)據(jù)的搜集處理方法,包括以下步驟: 站外搜索服務(wù)器獲取至少一個網(wǎng)站的站內(nèi)搜索請求; 提取所述站內(nèi)搜索請求中的搜索數(shù)據(jù); 對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息。
2.根據(jù)權(quán)利要求1所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索詞。
3.根據(jù)權(quán)利要求2所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息的步驟包括: 將所述搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
4.根據(jù)權(quán)利要求2所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息的步驟包括: 按照網(wǎng)站標(biāo)識實(shí)時匯總 聚合所述搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。
5.根據(jù)權(quán)利要求1所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將所述站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器。
6.根據(jù)權(quán)利要求2所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述方法還包括: 所述站外搜索服務(wù)器根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
7.根據(jù)權(quán)利要求6所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述站外搜索服務(wù)器中存儲了與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源; 所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍; 所述站外搜索服務(wù)器根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索的步驟為: 所述站外搜索服務(wù)器根據(jù)所述內(nèi)容搜索范圍在所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與所述用戶輸入的搜索詞匹配的信息。
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
9.根據(jù)權(quán)利要求8所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,在所述對搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計的步驟之前,還包括: 通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄所述網(wǎng)站的總用戶數(shù)量,將所述總用戶數(shù)量發(fā)送至所述站外搜索服務(wù)器,所述站外搜索服務(wù)器接收所述總用戶數(shù)量。
10.根據(jù)權(quán)利要求1所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,通過數(shù)據(jù)采集腳本提取所述搜索請求中的搜索數(shù)據(jù)。
11.一種站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,包括站內(nèi)搜索服務(wù)器和統(tǒng)計服務(wù)器,其中:所述站外搜索服務(wù)器,包括: 通信模塊,用于獲取至少一個網(wǎng)站的站內(nèi)搜索請求; 搜索數(shù)據(jù)提取模塊,用于提取所述站內(nèi)搜索請求中的搜索數(shù)據(jù); 搜索數(shù)據(jù)上報模塊,用于將所述搜索數(shù)據(jù)上報至所述統(tǒng)計服務(wù)器; 所述統(tǒng)計服務(wù)器,包括: 數(shù)據(jù)接入模塊,用于接收所述搜索數(shù)據(jù); 數(shù)據(jù)處理模塊,用于對所述搜索數(shù)據(jù)按照網(wǎng)站進(jìn)行分類統(tǒng)計,得到所述網(wǎng)站的搜索指標(biāo)信息。
12.根據(jù)權(quán)利要求11所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識以及以下至少一項(xiàng):用戶標(biāo)識、用戶輸入的搜索。
13.根據(jù)權(quán)利要求12所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述數(shù)據(jù)處理模塊用于將所述搜索數(shù)據(jù)按照網(wǎng)站標(biāo)識進(jìn)行分類,統(tǒng)計與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù),得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息。
14.根據(jù)權(quán)利要求12所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述數(shù)據(jù)處理模塊包括實(shí)時計算模塊,用于按照網(wǎng)站標(biāo)識實(shí)時匯總聚合所述搜索數(shù)據(jù),根據(jù)與網(wǎng)站標(biāo)識對應(yīng)的搜索數(shù)據(jù)實(shí)時統(tǒng)計計算得到與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息,并將得到的與網(wǎng)站標(biāo)識對應(yīng)的搜索指標(biāo)信息進(jìn)行實(shí)時存儲。
15.根據(jù)權(quán)利要求11所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述系統(tǒng)還包括用于通過預(yù)先嵌入在網(wǎng)站中的站內(nèi)搜索接口獲取站內(nèi)搜索請求,并將所述站內(nèi)搜索請求發(fā)送到站外搜索服務(wù)器的搜索信息獲取模塊。
16.根據(jù)權(quán)利要求12所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述站外搜索服務(wù)器還包括搜索模塊,用于根據(jù)所述搜索數(shù)據(jù)在與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中進(jìn)行搜索,并將搜索結(jié)果返回給與網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)站。
17.根據(jù)權(quán)利要求16所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述站外搜索服務(wù)器還包括存儲模塊,用于存儲與所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源; 所述搜索數(shù)據(jù)包括網(wǎng)站標(biāo)識、用戶輸入的搜索詞、內(nèi)容搜索范圍; 所述搜索模塊用于根據(jù)所述內(nèi)容搜索范圍在所述網(wǎng)站標(biāo)識對應(yīng)的網(wǎng)頁資源中搜索與所述用戶輸入的搜索詞匹配的信息。
18.根據(jù)權(quán)利要求11至17任一項(xiàng)所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述搜索指標(biāo)信息包括搜索詞、搜索詞的搜索量、搜索用戶量、搜索用戶率、用戶平均搜索次數(shù)中的一種以上。
19.根據(jù)權(quán)利要求18所述的站內(nèi)搜索數(shù)據(jù)的搜集處理系統(tǒng),其特征在于,所述系統(tǒng)還包括總用戶數(shù)量獲取模塊,用于通過預(yù)先嵌入在網(wǎng)站中的用戶數(shù)量采集腳本獲取預(yù)設(shè)時段內(nèi)登錄所述網(wǎng)站的總用戶數(shù)量,將所述總用戶數(shù)量發(fā)送至所述站外搜索服務(wù)器; 所述數(shù)據(jù)接入模塊還用于接收所述總用戶數(shù)量。
20.根據(jù)權(quán)利要求11所述的站內(nèi)搜索數(shù)據(jù)的搜集處理方法,其特征在于,所述搜索數(shù)據(jù)提取模塊通過數(shù)據(jù)采集腳本提取所述搜索請求中的搜索數(shù)據(jù)。
【文檔編號】G06F17/30GK103455483SQ201210168193
【公開日】2013年12月18日 申請日期:2012年5月28日 優(yōu)先權(quán)日:2012年5月28日
【發(fā)明者】楊璧寧, 張強(qiáng), 劉文學(xué), 楚大鵬, 盧靚妮, 趙銳, 劉奕慧 申請人:深圳市騰訊計算機(jī)系統(tǒng)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1