本發(fā)明涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種關鍵詞推送的方法及裝置。
背景技術:
隨著互聯(lián)網(wǎng)技術的發(fā)展,網(wǎng)絡提供給人們的信息量越來越大。各種網(wǎng)站中包含的信息量也是來越大,為了提高獲取信息的效率,通常網(wǎng)站會推出一些輔助的手段,比如在用戶通過搜索功能獲取信息時推出一些熱點的關鍵詞供用戶選擇,一定程度上提高了獲取信息的效率。
但是通常推送的熱點的關鍵詞是由網(wǎng)站的開發(fā)人員根據(jù)經(jīng)驗選取的,然后將這些關鍵詞推送到網(wǎng)站中為用戶搜索提供方便,但是這種被動的推送方式并沒有考慮到用戶的區(qū)域化需求,比如在一些政府網(wǎng)站中,許多的搜索信息具有地域特征,不同的地域的用戶所關注的信息是不同的,而上述方法推送的關鍵詞往往是沒有區(qū)別的,因此影響了獲取信息效率的提高。
技術實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種關鍵詞推送的方法及裝置。
為解決上述技術問題,一方面,本發(fā)明提供了一種關鍵詞推送的方法,該方法包括:
獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞;
統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù),所述地理范圍為使用所述歷史關鍵詞進行搜索的客戶端所屬的地理范圍;
根據(jù)所述累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序;
在所述客戶端訪問所述網(wǎng)站時,根據(jù)所述客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給所述客戶端。
另一方面,本發(fā)明還提供了一種關鍵詞推送的裝置,該裝置包括:
獲取單元,用于獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞;
統(tǒng)計單元,用于統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù),所述地理范圍為使用所述歷史關鍵詞進行搜索的客戶端所屬的地理范圍;
排序單元,用于根據(jù)所述累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序;
推送單元,用于在所述客戶端訪問所述網(wǎng)站時,根據(jù)所述客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給所述客戶端。
借由上述技術方案,本發(fā)明提供的關鍵詞推送的方法及裝置,能夠通過獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞,然后對獲取到的歷史關鍵詞進行統(tǒng)計,得到不同的地理范圍內(nèi)的歷史關鍵詞的累計搜索次數(shù),然后根據(jù)得到的累計搜索次數(shù)對不同的地理范圍內(nèi)的歷史關鍵詞進行排序。當客戶端訪問該網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。與現(xiàn)有技術相比,本發(fā)明能夠根據(jù)客戶端所屬的不同的地理范圍,將預設時段內(nèi)客戶端在網(wǎng)站中進行獲取信息時通過搜索功能使用的歷史關鍵詞分別進行統(tǒng)計并排序,實現(xiàn)當客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端,進而使客戶端可以根據(jù)推送的具有時間及地域個性化的關鍵詞進行搜索,提高了客戶端在網(wǎng)站中獲取信息的效率。
上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了本發(fā)明實施例提供的一種關鍵詞推送的方法流程圖;
圖2示出了本發(fā)明實施例提供的另一種關鍵詞推送的方法流程圖;
圖3示出了本發(fā)明實施例提供的一種關鍵詞推送的裝置的組成框圖;
圖4示出了本發(fā)明實施例提供的另一種關鍵詞推送的裝置的組成框圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
為解決現(xiàn)有在網(wǎng)站中獲取信息效率低的問題,本發(fā)明實施例提供了一種關鍵詞推送的方法,如圖1所示,該方法包括:
101、獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞。
獲取在預設時段內(nèi)訪問網(wǎng)站的所有客戶端在使用搜索功能進行信息搜索時使用的歷史關鍵詞。所述預設時段可以是在獲取歷史關鍵詞的當前時間的前一周、前十天或者前一個月等。具體的預設時段的選取可以根據(jù)網(wǎng)站更新信息的周期或者特殊情況的需求選擇合適的預設時段。
102、統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù)。
對由步驟101獲取到的預設時段內(nèi)的歷史關鍵詞進行分類統(tǒng)計,具體的是按照不同的地理范圍將歷史關鍵詞進行分類,并將得到的不同地理范圍內(nèi)的歷史關鍵詞進行搜索次數(shù)的統(tǒng)計,得到每個歷史關鍵詞在預設時段內(nèi)對應的累計搜索次數(shù),一個歷史關鍵詞對應一個累計搜索次數(shù)。其中地理范圍為使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍。
103、根據(jù)累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序。
在對不同地理范圍內(nèi)的歷史關鍵詞進行累計搜索次數(shù)的統(tǒng)計之后,還需要根據(jù)累計搜索次數(shù)的多少分別對不同地理范圍內(nèi)的歷史關鍵詞進行排序,對于累計搜索次數(shù)相同的歷史關鍵詞隨機進行排序,排序中不存在相同排序序號,最終得到一個地理范圍內(nèi)對應一個歷史關鍵詞的排序。
需要說明的是對歷史關鍵詞進行排序的排序規(guī)則可以是由多到少或者由少到多。
104、在客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。
當某一客戶端進行網(wǎng)站的訪問時,首先確定該客戶端所屬的地理范圍,然后將根據(jù)對應地理范圍為客戶端個性化推送關鍵詞。具體的個性化推送過程為:確定訪問網(wǎng)站的客戶端所屬的地理范圍;查找所屬地理范圍對應的由步驟104得到的歷史關鍵詞的排序;從排序中累計搜索次數(shù)最多的歷史關鍵詞開始提取預設數(shù)量的關鍵詞;將預設數(shù)量的關鍵詞推送給該客戶端。其中預設數(shù)量的值可以根據(jù)實際的網(wǎng)站的需求進行具體的設定。
另外,將所述關鍵詞推送給客戶端指的是將預設數(shù)量的關鍵詞推送到網(wǎng)站中,具體的推送形式可以為:在客戶端打開網(wǎng)站時將關鍵詞推送到網(wǎng)站的搜索功能框的下方或者網(wǎng)站中其他的位置;或者當客戶端打開網(wǎng)站并且使用搜索功能進行搜索時,即當搜索功能框處于輸入狀態(tài)時,在搜索功能框下方的一個動態(tài)顯示的窗口中顯示關鍵詞,其中動態(tài)顯示是指當用戶在確定搜索的關鍵詞之后該窗口消失。此外,對推送的關鍵詞在網(wǎng)站中的顯示的位置順序沒有特別的規(guī)定,在網(wǎng)站設計時可以自由設定。
本實施例提供的關鍵詞推送的方法,能夠通過獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞,然后對獲取到的歷史關鍵詞進行統(tǒng)計,得到不同的地理范圍內(nèi)的歷史關鍵詞的累計搜索次數(shù),然后根據(jù)得到的累計搜索次數(shù)對不同的地理范圍內(nèi)的歷史關鍵詞進行排序。當客戶端訪問該網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。與現(xiàn)有技術相比,本實施例能夠根據(jù)客戶端所屬的不同的地理范圍,將預設時段內(nèi)客戶端在網(wǎng)站中進行獲取信息時通過搜索功能使用的歷史關鍵詞分別進行統(tǒng)計并排序,實現(xiàn)當客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端,進而使客戶端可以根據(jù)推送的具有時間及地域 個性化的關鍵詞進行搜索,提高了客戶端在網(wǎng)站中獲取信息的效率。
進一步的,作為對圖1所示實施例的細化及擴展,本發(fā)明還提供了另一實施例。如圖2所示,該實施例中關鍵詞推送的方法包括:
201、從網(wǎng)站的log日志中提取歷史關鍵詞對應的時間信息。
客戶端在訪問網(wǎng)站時,對應網(wǎng)站的服務器通常會產(chǎn)生多種類型的log日志文件,這些log日志文件中記錄了關于客戶端訪問網(wǎng)站以及與網(wǎng)站服務器交互的信息。因此從這些log日志文件中可以獲取客戶端在網(wǎng)站中使用歷史關鍵詞進行搜索的時間信息。所以在獲取歷史關鍵詞之前首先要獲取到網(wǎng)站的log日志文件,然后從log日志文件中提取歷史關鍵詞的時間信息,本實施中提取的時間信息為客戶端使用歷史關鍵詞進行搜索的起始時間。需要說明的是從網(wǎng)站的log日志中提取歷史關鍵詞對應的時間信息,就是從網(wǎng)站的log日志文件中提取歷史關鍵詞對應的時間信息。
202、根據(jù)時間信息獲取預設時段內(nèi)的歷史關鍵詞。
根據(jù)由步驟201提取到的時間信息即起始時間來獲取預設時段內(nèi)客戶端在網(wǎng)站中進行搜索使用的所有歷史關鍵詞,歷史關鍵詞也是從網(wǎng)站log日志中提取得到的。具體的是將初始時間在預設時段內(nèi)的對應的所有的歷史關鍵詞提取出來。
203、從網(wǎng)站的log日志中提取使用歷史關鍵詞進行搜索的客戶端的網(wǎng)間協(xié)議(internetprotocol,簡稱ip)地址。
在網(wǎng)站的log日志中不僅記錄有關于客戶端訪問網(wǎng)站以及與網(wǎng)站服務器交互的信息,而且還記錄有每個客戶端的行為對應的客戶端的ip地址。因此,從網(wǎng)站的log日志中也可以提取到使用歷史關鍵詞進行搜索的客戶端的ip地址。
204、根據(jù)ip地址記錄使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍。
根據(jù)由步驟203中提取得到的ip地址來記錄使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍。具體的是通過對ip地址的預定字段的識別,確定使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍并記錄下來。其中,預定字段中的不同數(shù)值對應不同的地區(qū)或國家。
需要說明的是,ip地址是根據(jù)不同類型的網(wǎng)絡定義的,通常使用的網(wǎng)絡包含a、b、c三種網(wǎng)絡。對于三種不同的網(wǎng)絡對應ip地址中,預定字段的定義也是不同的。若為a類網(wǎng)絡,則預定字段是指ip地址中的第一段號碼;若為b類網(wǎng)絡,則預定字段是指ip地址中的第一段和第二段號碼;若為c類網(wǎng)絡,則預定字段是指ip地址中的第一段、第二段以及第三段號碼。對ip地址的預定字段的識別是指,將得到的客戶端的ip地址與ip地址庫中的ip地址的對應的預定字段進行比對,根據(jù)比對的結果就可以確定使用歷史關鍵詞進行搜索客戶端所屬的地理范圍。
另外還需要說明的是,本實施例中的可以提供的ip地址庫中包括國內(nèi)所有的省、市、縣(區(qū))以及其他國家ip地址,對于其他國家的ip地址只能識別是哪個國家的,不能細化到各省市。
205、統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù)。
該步驟中統(tǒng)計歷史關鍵詞的累計搜索次數(shù)的實現(xiàn)方式與圖1步驟102的實現(xiàn)方式相同,此處不再贅述。但是需要另外說明的,其中的地理范圍是根據(jù)步驟204中ip地址確定的地理范圍。在將地理范圍進行分為不同的地理范圍時,可以將不同的地理范圍定義為不同的縣(區(qū)),也可以定義為不同的市等。具體的可以根據(jù)網(wǎng)站提供的信息表現(xiàn)出的區(qū)域差異性來設定。若網(wǎng)站提供的信息主要著重于不同的市,并不具體到每個市所對包括的縣(區(qū))的信息,則將不同的地理范圍設定為不同的市;若網(wǎng)站提供的信息主要著重于一個市中不同的縣(區(qū)),則將不同的地理范圍設定為不同的縣(區(qū))。
206、根據(jù)累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序。
該步驟的實現(xiàn)方式與圖1步驟103的實現(xiàn)方式相同,此處不再贅述。
207、在客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。
該步驟的實現(xiàn)方式與圖1步驟104的實現(xiàn)方式相同,此處不再贅述。
進一步的,作為對上述圖1和圖2所示方法的實現(xiàn),本發(fā)明實施例另 一實施例還提供了一種關鍵詞推送的裝置,用于對上述圖1和圖2所示的方法進行實現(xiàn)。該裝置實施例與前述方法實施例對應,為便于閱讀,本裝置實施例不再對前述方法實施例中的細節(jié)內(nèi)容進行逐一贅述,但應當明確,本實施例中的裝置能夠對應實現(xiàn)前述方法實施例中的全部內(nèi)容。如圖3所示,該裝置包括:獲取單元31、統(tǒng)計單元32、排序單元33及推送單元34。
獲取單元31,用于獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞;
統(tǒng)計單元32,用于統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù),地理范圍為使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍;
排序單元33,用于根據(jù)累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序;
推送單元34,用于在客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。
進一步的,如圖4所示,裝置進一步包括:
第一提取單元35,用于在獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞之前,從網(wǎng)站的log日志中提取歷史關鍵詞對應的時間信息,時間信息為客戶端使用歷史關鍵詞進行搜索的起始時間。
進一步的,獲取單元31用于:
根據(jù)時間信息獲取預設時段內(nèi)的歷史關鍵詞。
進一步的,如圖4所示,裝置進一步包括:
第二提取單元36,用于在統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù)之前,從網(wǎng)站的log日志中提取使用歷史關鍵詞進行搜索的客戶端的網(wǎng)間協(xié)議ip地址;
記錄單元37,用于根據(jù)ip地址記錄使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍。
進一步的,記錄單元37用于:
通過對ip地址的預定字段的識別,確定使用歷史關鍵詞進行搜索的客戶端所屬的地理范圍,其中,預定字段中的不同數(shù)值對應不同的地區(qū)或國家。
本實施例提供的關鍵詞推送的裝置,能夠通過獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞,然后對獲取到的歷史關鍵詞進行統(tǒng)計,得到不同的地理范圍內(nèi)的歷史關鍵詞的累計搜索次數(shù),然后根據(jù)得到的累計搜索次數(shù)對不同的地理范圍內(nèi)的歷史關鍵詞進行排序。當客戶端訪問該網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端。與現(xiàn)有技術相比,本實施例能夠根據(jù)客戶端所屬的不同的地理范圍,將預設時段內(nèi)客戶端在網(wǎng)站中進行獲取信息時通過搜索功能使用的歷史關鍵詞分別進行統(tǒng)計并排序,實現(xiàn)當客戶端訪問網(wǎng)站時,根據(jù)客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給客戶端,進而使客戶端可以根據(jù)推送的具有時間及地域個性化的關鍵詞進行搜索,提高了客戶端在網(wǎng)站中獲取信息的效率。
所述關鍵詞推送的裝置包括處理器和存儲器,上述獲取單元31、統(tǒng)計單元32、排序單元33及推送單元34等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元來實現(xiàn)相應的功能。
本申請還提供了一種計算機程序產(chǎn)品,當在數(shù)據(jù)處理設備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取網(wǎng)站在預設時段內(nèi)產(chǎn)生的歷史關鍵詞;統(tǒng)計對應不同地理范圍的歷史關鍵詞的累計搜索次數(shù),所述地理范圍為使用所述歷史關鍵詞進行搜索的客戶端所屬的地理范圍;根據(jù)所述累計搜索次數(shù),對對應不同地理范圍的歷史關鍵詞分別進行排序;在所述客戶端訪問所述網(wǎng)站時,根據(jù)所述客戶端所屬的地理范圍對應的歷史關鍵詞的排序,從累計搜索次數(shù)最多的歷史關鍵詞開始順序提取預設數(shù)量的關鍵詞推送給所述客戶端。
本領域內(nèi)的技術人員應明白,本申請的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產(chǎn)品的形式。
本申請是參照根據(jù)本申請實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
在一個典型的配置中,計算設備包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡接口和內(nèi)存。
存儲器可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram)。存儲器是計算機可讀介質的示例。
計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結構、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機存取存儲器(sram)、動態(tài)隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學存儲、磁 盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設備或任何其他非傳輸介質,可用于存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號和載波。
以上僅為本申請的實施例而已,并不用于限制本申請。對于本領域技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進等,均應包含在本申請的權利要求范圍之內(nèi)。