數(shù)據(jù)的動態(tài)獲取方法、裝置及系統(tǒng)的制作方法
【專利摘要】本申請公開了一種數(shù)據(jù)的動態(tài)獲取方法、裝置及系統(tǒng)。其中,該方法包括:接收搜索請求串,并從搜索請求串中讀取搜索詞;根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù);將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化;根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示。通過本申請,能夠實現(xiàn)實時的動態(tài)化推廣產品數(shù)據(jù)信息。
【專利說明】數(shù)據(jù)的動態(tài)獲取方法、裝置及系統(tǒng)
【技術領域】
[0001]本申請涉及計算機領域,具體而言,涉及一種數(shù)據(jù)的動態(tài)獲取方法、裝置及系統(tǒng)?!颈尘凹夹g】
[0002]現(xiàn)有技術中用于展現(xiàn)相關產品的推廣平臺的實施過程中,首先需要用戶在競價管理服務器的系統(tǒng)中對搜索詞進行競價處理,當網(wǎng)站前端搜索某個詞的時候,就會展示出該搜索詞的產品信息,即為搜索詞與其對應的多個產品信息分別設置一個固定的靜態(tài)閾值,從而使得在網(wǎng)站上對用戶在后臺完成的競價詞推廣的獲取和展示是靜態(tài)的。
[0003]具體實施過程中,賣家用戶首先在競價管理服務器的系統(tǒng)上選擇關鍵詞和該關鍵詞相應的推廣產品,然后調用算法模塊計算相關性得到一個關鍵詞與產品信息之間的相關性閾值分數(shù),這個分數(shù)會存入數(shù)據(jù)庫。引擎服務器會從數(shù)據(jù)庫中下載這些閾值分數(shù)并建立索引庫。當用戶在網(wǎng)站前端的客戶端通過搜索詞發(fā)生搜索行為后,從索引庫中獲取與該搜索詞相對應的產品信息的所有閾值分數(shù),并將各個閾值分數(shù)與預先設定的靜態(tài)閾值進行比較,將閾值分數(shù)大于靜態(tài)閾值分數(shù)的產品信息過濾出來進行顯示,這種在搜索引擎上實現(xiàn)的過濾方法雖然實現(xiàn)了一定的過濾方式,但過于簡單和靜態(tài)化,它對所有的查詢詞都是統(tǒng)一標準對待,顯然當關鍵詞與產品信息之間的相關性閾值分數(shù)發(fā)生動態(tài)變化的情況下,不能夠滿足使搜索結果更加靈活、準確的問題。
[0004]由此可知,現(xiàn)有客戶端上實現(xiàn)的搜索詞下的推廣數(shù)據(jù)信息的方法過于簡單和單一化,導致很多搜索詞下展現(xiàn)的推廣數(shù)據(jù)信息的質量(和詞的相關性)比較差,展現(xiàn)的推廣產品和搜索詞的相關性有可能會比自然搜索的結果差很多。
[0005]目前針對相關技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活、不準確的問題,目前尚未提出有效的解決方案。
【發(fā)明內容】
[0006]針對相關技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活、不準確的問題,目前尚未提出有效的解決方案,為此,本申請的主要目的在于提供一種數(shù)據(jù)的動態(tài)獲取方法、裝置及系統(tǒng),以解決上述問題。
[0007]為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,提供了一種數(shù)據(jù)的動態(tài)獲取方法,該方法包括:接收搜索請求串,并從搜索請求串中讀取搜索詞;根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù);將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化;根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。[0008]進一步地,在根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù)之前,方法還包括:從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子;根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù);將各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至閾值詞典;其中,文本特征因子是搜索詞與數(shù)據(jù)信息所匹配的特征權重值,數(shù)據(jù)分析特征因子是搜索詞所對應的分析參數(shù)特征權重值。
[0009]進一步地,根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)的步驟包括:采用線性回歸模型Sc0retl = FO (f I, f2,...,fi)進行擬合計算,以獲取搜索詞的第一閾值分數(shù)Sc0retl,其中,fi是搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù);采用線性回歸模型Score1 =Fl(f' 1;...,f’k)進行擬合計算,以獲取搜索詞的第二閾值分數(shù)Score1,其中,f’ k是搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù);根據(jù)線性回歸模型Score = F(Scoretl, Score1) Xp1Xp2進行擬合計算,以獲取搜索詞的動態(tài)閾值分數(shù),其中,P1是第一閾值分數(shù)的占空比,P2是第二閾值分數(shù)的占空比。
[0010]進一步地,在將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行查詢之前,方法還包括:從競價管理服務器或日志詞典中獲取關鍵詞及與關鍵詞綁定的每個數(shù)據(jù)信息的文本特征因子;根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù);將各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至閾值數(shù)據(jù)庫;根據(jù)閾值數(shù)據(jù)庫中每個關鍵詞及其對應的所有閾值分數(shù)創(chuàng)建索引表;其中,根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)的步驟包括:采用線性回歸模型Score’ =F’(fl,f2,..., fj)進行擬合計算,以獲取關鍵詞的閾值分數(shù),其中,fj是關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
[0011]進一步地,在接收搜索請求串,并從搜索請求串中讀取搜索詞之前,方法還包括:接收實時消息以監(jiān)測日志詞典的一致性,在監(jiān)測到特征因子發(fā)生變化的情況下,更新日志詞典。
[0012]為了實現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種數(shù)據(jù)的動態(tài)獲取裝置,該裝置包括:接收模塊,用于接收搜索請求串,并從搜索請求串中讀取搜索詞;查詢模塊,與接收模塊連接,用于根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù);過濾模塊,與查詢模塊連接,用于將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化;處理模塊,與過濾模塊連接,用于根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
[0013]為了實現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種數(shù)據(jù)的動態(tài)獲取系統(tǒng),該系統(tǒng)包括:客戶端,用于發(fā)送搜索請求串;搜索引擎服務器,與客戶端建立通信,用于接收搜索請求串,并從搜索請求串中讀取搜索詞,在根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù)之后,將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化,并根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
[0014]進一步地,系統(tǒng)還包括:競價管理服務器,用于提供文本特征因子;日志服務器,用于保存日志詞典,以提供數(shù)據(jù)分析特征因子和/或文本特征因子;第一閾值計算服務器,用于從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子,在根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)之后,將各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至閾值搜索數(shù)據(jù)表,以返回給網(wǎng)站的前端頁面進行動態(tài)顯示;其中,文本特征因子是搜索詞與數(shù)據(jù)信息所匹配的特征權重值,數(shù)據(jù)分析特征因子是搜索詞所對應的分析參數(shù)特征權重值。
[0015]進一步地,第二閾值計算服務器包括:第一計算裝置,用于采用線性回歸模型Score0 = FO (f I, f2,..., fi)進行擬合計算,以獲取搜索詞的第一閾值分數(shù)Scoretl,其中,fi是搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù);第二計算裝置,用于采用線性回歸模型Score1 = FKfi 1; f\)進行擬合計算,以獲取搜索詞的第二閾值分數(shù)Score1,其中,f’k是搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù);處理裝置,用于根據(jù)線性回歸模型Score = F(score0, Score1) Xp1Xp2進行擬合計算,以獲取搜索詞的動態(tài)閾值分數(shù),其中,P1是第一閾值分數(shù)的占空比,P2是第二閾值分數(shù)的占空比。
[0016]進一步地,系統(tǒng)還包括:第二閾值計算服務器,用于從競價管理服務器或日志詞典中獲取關鍵詞及與關鍵詞綁定的每個產品的數(shù)據(jù)信息的文本特征因子,在根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)之后,將各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至閾值數(shù)據(jù)庫。
[0017]進一步地,第二閾值計算服務器包括:第三計算裝置,用于采用線性回歸模型Score' =F’ (fl, f2,...,fj)進行擬合計算,以獲取關鍵詞的閾值分數(shù),其中,fj是關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
[0018]進一步地,系統(tǒng)還包括:監(jiān)測裝置,用于接收實時消息以監(jiān)測日志詞典的一致性,在監(jiān)測到特征因子發(fā)生變化的情況下,更新日志詞典。
[0019]通過本申請,采用接收搜索請求串,并從搜索請求串中讀取搜索詞;根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù);將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化;根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子,上述方案將搜索詞在閾值詞典中得到的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,由于閾值詞典中存儲的動態(tài)閾值分數(shù)會根據(jù)特征因子的實時更新而動態(tài)變化,因此獲取到的當前搜索詞所對應的數(shù)據(jù)信息的數(shù)據(jù),會由于比對的動態(tài)閾值分數(shù)的變化而動態(tài)更新,因此最后顯示在網(wǎng)站前端頁面上的結果也是會更新的,從而解決了相關現(xiàn)有技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活的問題,進而實現(xiàn)了實時的動態(tài)化推廣產品數(shù)據(jù)信息的效果。
【專利附圖】
【附圖說明】
[0020]此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
[0021]圖1是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取系統(tǒng)的結構示意圖;
[0022]圖2是根據(jù)圖1所示的數(shù)據(jù)的動態(tài)獲取系統(tǒng)的詳細結構示意圖;
[0023]圖3是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取方法的流程圖;
[0024]圖4是根據(jù)圖3所示實施例中的搜索引擎服務器的業(yè)務流程圖;
[0025]圖5是根據(jù)圖3所示實施例中的競價管理服務器獲取競價閾值的業(yè)務流程圖;
[0026]圖6是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取裝置的結構示意圖。
【具體實施方式】
[0027]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
[0028]圖1是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取系統(tǒng)的結構示意圖;圖2是根據(jù)圖1所示的數(shù)據(jù)的動態(tài)獲取系統(tǒng)的詳細結構示意圖。
[0029]如圖1所示,該數(shù)據(jù)的動態(tài)獲取系統(tǒng)可以包括:客戶端10和搜索引擎服務器30。
[0030]其中,客戶端10,用于發(fā)送搜索請求串;搜索引擎服務器30,與客戶端10建立通信,用于接收搜索請求串,并從搜索請求串中讀取搜索詞,在根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù)之后,將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當索引數(shù)據(jù)表中的關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化,并根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。由于上述實施例中的文本特征因子和數(shù)據(jù)分析特征因子會實時變更,因此,根據(jù)特征因子變化的動態(tài)閾值分數(shù)也是實時變化的。上述實施例中的關鍵詞為索引數(shù)據(jù)表中的索引詞,關鍵詞與索弓I信息對應。
[0031]上述方案將搜索詞在閾值詞典中得到的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,由于閾值詞典中存儲的動態(tài)閾值分數(shù)會根據(jù)特征因子的實時更新而動態(tài)變化,因此獲取到的當前搜索詞所對應的數(shù)據(jù)信息的數(shù)據(jù),會由于比對的動態(tài)閾值分數(shù)的變化而動態(tài)更新,因此最后顯示在網(wǎng)站前端頁面上的結果也是會更新的,從而解決了相關現(xiàn)有技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活的問題,進而本申請可以實現(xiàn)實時的動態(tài)化推廣產品數(shù)據(jù)信息的效果。[0032]具體的,本申請上述實施例中的索引數(shù)據(jù)表中的數(shù)據(jù)是數(shù)據(jù)信息的結構化數(shù)據(jù),該索引數(shù)據(jù)表中的數(shù)據(jù)信息可以包括如下一個或多個參數(shù):產品標題、產品屬性、產品公司信息、產品對應競價詞、產品對應價格、產品和競價詞的相關系分值等信息,具體格式與搜索引擎的結構相似的,具體結構可以采用倒排、正排索引的結構形式。
[0033]優(yōu)選地,本申請上述實施例中的特征因子中包括的文本特征因子和數(shù)據(jù)分析特征因子,其中,文本特征因子可以包括搜索詞與產品本身的文本信息的匹配參數(shù),數(shù)據(jù)分析特征因子可以包括搜索詞的點擊率、所對應的各個產品的擊率、搜索詞本身熱度、用戶推廣產品地域信息以及搜索詞綁定的產品數(shù)(用戶數(shù))等因素(比如買家和網(wǎng)站推廣數(shù)據(jù)的信息挖掘、網(wǎng)站產品的歷史CTR信息、賣家的競爭程度狀況、推廣產品和詞的相關性和自然搜索結果的對比情況等)。例如搜索詞的點擊率和地域信息等是會根據(jù)實際情況動態(tài)變化,由此可以看出數(shù)據(jù)分析特征因子是動態(tài)變化的,從而動態(tài)閾值分數(shù)是根據(jù)動態(tài)變化的數(shù)據(jù)分析特征因子實時變更。
[0034]具體的,上述方案中動態(tài)閾值分數(shù)可以從后臺提供的處理服務器中的閾值服務來計算得到,即后臺的閾值服務通過調用搜索詞在日志詞典中已經(jīng)記錄的特征因子來進行閾值計算得到動態(tài)閾值分數(shù),并將所有搜索詞及其對應的動態(tài)閾值分數(shù)保存到閾值詞典中,作為搜索引擎在接收到客戶端發(fā)出的搜索請求之后,進行過濾處理的過濾條件,從而進一步獲取當前搜索詞所對應的產品數(shù)據(jù)信息,由于日志詞典中記錄的特征因子包括了會根據(jù)歷史情況實時發(fā)生變化的數(shù)據(jù)分析特征因子,因此,計算得到的動態(tài)閾值分數(shù)也會實時變更,從而使得過濾條件會根據(jù)特征因子的變化而發(fā)生調整,解決了相關現(xiàn)有技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活的問題,進而實現(xiàn)了動態(tài)化推廣產品數(shù)據(jù)信息,提高了推廣數(shù)據(jù)信息結果的效果。而且由于數(shù)據(jù)分析特征因子中包括點擊率等體現(xiàn)搜索詞質量的因子,因此,本申請也進一步提高了搜索結果的準確性。
[0035]優(yōu)選地,本申請上述實施例中的客戶端10可以實現(xiàn)把搜索請求串發(fā)送給搜索引擎服務器30,該搜索請求串由多個條件組裝,搜索引擎服務器30的系統(tǒng)能夠解析該請求串,并調用后臺閾值詞典中已經(jīng)計算好的動態(tài)閾值分數(shù),將得到的動態(tài)閾值分數(shù)作為過濾條件對索引表中的關鍵詞進行過濾,從而返回搜索結果的數(shù)據(jù),最后搜索結果會在客戶端10上的SearchWeb進行展示。
[0036]本申請上述實施例中的系統(tǒng)還可以包括:競價管理服務器50,用于提供文本特征因子;日志服務器70,用于保存日志詞典,以提供數(shù)據(jù)分析特征因子和/或文本特征因子;第一閾值計算服務器90,用于從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子,在根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)之后,將各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至閾值搜索數(shù)據(jù)表;其中,文本特征因子是搜索詞與數(shù)據(jù)信息所匹配的特征權重值,數(shù)據(jù)分析特征因子是搜索詞所對應的分析參數(shù)特征權重值。
[0037]具體的,如圖2所示,上述實施例中的第一閾值計算服務器90可以從競價管理服務器50拉取搜索詞及搜索詞所對應的數(shù)據(jù)信息(包括文本特征因子),并從日志服務器70的日志詞典中獲取網(wǎng)站完成搜索請求后的日志信息,該日志信息可以由數(shù)據(jù)分析數(shù)據(jù)庫DW得到的數(shù)據(jù)分析特征因子和/或文本特征因子構成。第一閾值計算服務器90在獲取到搜索詞以及所有的文本特征因子和數(shù)據(jù)分析特征因子之后,可以計算得到每個搜索詞的動態(tài)閾值分數(shù),例如,可以計算每個搜索詞query和用戶推廣產品的相關性閾值,同時會計算該搜索詞和網(wǎng)站自然搜索結果前20名產品的相關性閾值,計算過程中除了考慮上述搜索詞和產品的文本相關性閾值,計算得到動態(tài)閾值分數(shù),還會考慮通過對歷史產品的點擊率ctr、詞本身熱度、推廣產品區(qū)域信息以及詞綁定的產品數(shù)(用戶數(shù))等商業(yè)因素計算得到第二閾值分數(shù),并基于第一閾值分數(shù)和第二閾值分數(shù)得到該搜索詞最終所對應的動態(tài)閾值分數(shù),并將所有搜索詞及其閾值分數(shù)保存至閾值詞典中。上述實施例中,賣家用戶通過競價管理服務器50為閾值處理系統(tǒng)提供用于計算搜索詞和數(shù)據(jù)信息的相關性閾值分數(shù)的文本特征因子。
[0038]具體的實施過程可以如下描述:當前端客戶端網(wǎng)站上買家通過輸入一個搜索詞來在線請求賣家數(shù)據(jù)信息,例如此時用戶搜索了 MP3這個詞,網(wǎng)站的搜索網(wǎng)址searchweb就會產生一個攜帶了該搜索詞MP3的請求串來訪問搜索引擎服務器30的搜索引擎系統(tǒng),引擎拿到這個請求串后會調用算法的接口函數(shù),得到一個動態(tài)閾值分數(shù)和動態(tài)的廣告位置數(shù)n,然后用該分數(shù)重寫出過濾條件,比如:
[0039]product?q=MP3&f ilter=bidword.mlrScore:9399999^2147483647&n=4,其中,product?q表征數(shù)據(jù)信息(例如產品信息),MP3表征搜索詞,filter表征過濾條件,bidword.mlrScore表征動態(tài)閾值分數(shù),η表征廣告位置數(shù);其中,引擎內部可以從數(shù)據(jù)庫DB中讀取網(wǎng)站所有的產品和關鍵詞之間綁定之后的相關性分數(shù)mlrScore,并且對mlrScore建立了特定的索引,搜索引擎可以解析這樣的請求串而返回相應的滿足過濾條件的數(shù)據(jù)信肩、O
[0040]優(yōu)選地,上述實施例中的第一閾值計算服務器90可以包括:第一計算裝置,用于采用線性回歸模型Sc0retl = R)(fl,f2, fi)進行擬合計算,以獲取搜索詞的第一閾值分數(shù)Sc0retl,其中,fi是搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù);第二計算裝置,用于采用線性回歸模型Score1 =Fl (f' 1;...,f’k)進行擬合計算,以獲取搜索詞的第二閾值分數(shù)Score1,其中,f’k是搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù);處理裝置,用于根據(jù)線性回歸模型Score =F(Scoretl, Score1) Xp1 XP2進行擬合計算,以獲取搜索詞的動態(tài)閾值分數(shù),其中,P1是第一閾值分數(shù)的占空比,P2是第二閾值分數(shù)的占空比。
[0041]具體的,搜索詞和產品對應的文本相關性計算考慮因子可以包括:fl是搜索詞與產品描述中相同單詞的主題title長度的比率;f2是搜索詞占包含搜索詞的主題title的比率;f3是搜索詞占包含搜索詞的關鍵字keywords的比率;f4用于搜索詞與產品描述中主題title的序列匹配比率;f5是搜索詞與產品描述中關鍵字keywords序列的匹配比率;其中,f4和f5不僅考慮搜索詞query和數(shù)據(jù)信息的字符匹配,還考慮字符序列的匹配,若字符串完全匹配并且字符序列完全一致得滿分,否則得O分。對于這些特征的擬合即特征值權重的確定,采用線性回歸模型。相關性得分Scoretl = FO (f I,..,f5),fl, f2,…,f 5表示這五個特征,F(xiàn)O表示線性回歸模型訓練的模型函數(shù),上面特征進行擬合后得出的分值scoreO即為相關性得分。 [0042]而考慮搜索詞的歷史狀態(tài)所對應的閾值得分:Sc0rei = Fl(f'...,f’k),關鍵詞的歷史狀態(tài)類似于相關性得分的訓練及預測。該函數(shù)Score = F (Scoretl, Score1) Xp1Xp2是將文本特征因子所對應的文本相關性得分,以及數(shù)據(jù)分析特征因子所對應的慮關鍵詞的歷史狀態(tài)閾值得分擬合在一起,該分值為最終詞和產品的得分閾值,它反映了產品的文本匹配得分和商業(yè)規(guī)則的得分,F(xiàn)同樣是指線性回歸模型。
[0043]本申請上述實施例中的系統(tǒng)還可以包括:第二閾值計算服務器,用于從競價管理服務器或日志詞典中獲取關鍵詞及與關鍵詞綁定的每個數(shù)據(jù)信息的文本特征因子,在根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)之后,將各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至所述閾值數(shù)據(jù)庫。該實施例中的第二閾值計算服務器所實現(xiàn)的功能可以合并入競價管理服務器中完成,即在競價管理服務器中執(zhí)行根據(jù)文本特征因子進行閾值計算而獲取每個關鍵詞的閾值。
[0044]在上述實施例中,后臺會預先設置關鍵詞和數(shù)據(jù)信息之間的綁定關系(例如可以為同一個關鍵詞建立針對不同產品的綁定關系),并將每個綁定關系中關鍵詞與數(shù)據(jù)信息的所有文本特征因子發(fā)送給競價管理服務器進行閾值計算,獲取關鍵詞與其相關聯(lián)的每個產品之間的閾值分數(shù),并將獲取到的所有閾值分數(shù)保存到閾值數(shù)據(jù)庫。在搜索引擎服務器30發(fā)生搜索動作之前,會基于閾值數(shù)據(jù)庫中的閾值分數(shù)創(chuàng)建索引表,當搜索前段的客戶端10向搜索引擎服務器30發(fā)送搜索詞時,可以調用閾值詞典中的已經(jīng)計算得到的搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件,來過濾索引表中閾值分數(shù)大于等于動態(tài)閾值分數(shù)的搜索詞對應所有索引信息,即只有超過動態(tài)閾值分數(shù)的閾值分數(shù)所對應的數(shù)據(jù)信息就是符合該搜索詞過濾規(guī)則的數(shù)據(jù)。
[0045]本申請上述實施例中,如圖2中的第二閾值計算服務器還可以包括:第三計算裝置,采用線性回歸模型Score’ =F’ (fl, f2,..., fj)進行擬合計算,以獲取關鍵詞的閾值分數(shù),其中,fj是關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
[0046]由上述分析可知,本申請中的搜索引擎服務器30在接收到搜索詞之后會調用用于計算閾值的動態(tài)庫接口程序,而且從閾值詞典中獲取該搜索詞對應的所有動態(tài)閾值分數(shù),從而返回一個對應該搜索詞query的動態(tài)閾值分數(shù),該動態(tài)閾值分數(shù)目前支持不同pid(用于標識網(wǎng)站頁面的不同區(qū)域)的自適應。搜索引擎服務器30在調取通過計算得到搜索詞query的動態(tài)閾值分數(shù)之后,在請求串拼接該過濾條件,然后再用該拼接后的請求串與已經(jīng)創(chuàng)建好的索引表中的閾值分數(shù)進行比對,從而得到小于該動態(tài)閾值分數(shù)的閾值分數(shù)所對應的推廣數(shù)據(jù)信息就沒有機會被展示,而滿足閾值過濾的產品最多可以展示的位置數(shù)不能大于算法模塊動態(tài)計算出來的位置數(shù)上限,保證對網(wǎng)站自然搜索的影響風險。
[0047]下面可以以賣電子產品的用戶為例說明獲取動態(tài)閾值分數(shù)的業(yè)務流程。首先,賣家用戶在競價管理服務器50上選中關鍵詞MP3進行競價,然后給該關鍵詞MP3設置了 500個產品作為賣家需要進行推廣的數(shù)據(jù)信息,從而針對同一個關鍵詞MP3綁定500條不同的數(shù)據(jù)信息,顯然這500個數(shù)據(jù)信息和MP3這個關鍵詞的相關性情況各有差異,競價管理服務器50會將該關鍵詞MP3及其500個綁定關系(關鍵詞和數(shù)據(jù)信息)以請求(例如httpserver中的url請求串)的方式發(fā)送給閾值計算服務器90來訪問閾值服務,計算得到每個綁定關系的閾值分數(shù),該閾值分數(shù)可以用于確定關鍵詞MP3和每個數(shù)據(jù)信息之間的相關性的大小,同時閾值處理服務器也可以通過讀取日志服務器70中的日志信息進行閾值計算,從而得到關鍵詞MP3的所有文本相關性的閾值分數(shù),最后可以將所有的閾值分數(shù)返回給競價管理服務器50,并由競價管理服務器50發(fā)送至閾值數(shù)據(jù)庫DB進行保存,這些閾值的分數(shù)可以供搜索引擎服務下載使用,從而減少在線系統(tǒng)中很多無用數(shù)據(jù)帶來的壓力。[0048]上述實施例中的系統(tǒng)還可以包括:監(jiān)測裝置,用于接收實時消息以監(jiān)測日志詞典的一致性,在監(jiān)測到特征因子發(fā)生變化的情況下。更新日志詞典。
[0049]具體的,本申請上述實施例中的監(jiān)測裝置主要通過實時發(fā)送notify消息(例如,在競價管理服務器50中,賣家用戶對數(shù)據(jù)信息進行了修改或者新增了產品,系統(tǒng)都會捕獲到相應行為轉化生成一條消息,然后該消息會把相應的變更字段信息或者新增的整條數(shù)據(jù)信息發(fā)給搜索引擎服務器30進行索引的更新),從而實時根據(jù)網(wǎng)站推廣活動信息、用戶的實時瀏覽行為和點擊信息、推廣產品的點擊率ctr等信息,對閾值索引數(shù)據(jù)表進行更新,從而使得每個搜索詞query的展現(xiàn)閾值實時調整,不需要人工干預和做全量計算。而對于新出現(xiàn)的關鍵詞query (流量日志中沒有的),系統(tǒng)會給一個默認值。
[0050]由上可知,系統(tǒng)提供給搜索引擎服務器30和競價管理服務器50的日志詞典中的詞典索引數(shù)據(jù)需要保持一致,具體的,本申請上述實施例可以采用在數(shù)據(jù)發(fā)送成功之后,對文件大小、文件md5值、磁盤容量等數(shù)據(jù)進行的驗證,若發(fā)現(xiàn)有不一致和異常情況(磁盤容量不夠了,只傳輸了一部分數(shù)據(jù)過去)進行報警,人工進行處理。例如有一個統(tǒng)一管理的任務用于同步詞典數(shù)據(jù),該任務每天會定時對詞典數(shù)據(jù)進行多方的分發(fā),并且對分發(fā)的詞典進行md5值的驗證,確認傳輸過去的詞典已經(jīng)是新的并且是一致的情況下才進行后續(xù)的處理,發(fā)現(xiàn)不一致就進行報警,進行人工干預和修復問題。而且要隨著網(wǎng)站數(shù)據(jù)的變化做到同步的增量更新,不然會導致用戶在后臺系統(tǒng)得到的詞綁定情況和引擎展示返回不一致問題,比如在推廣平臺得到的用戶在該詞下的產品是優(yōu)質的,認為可以曝光的,可是在引擎誤被過濾了,永遠都沒有曝光機會,出現(xiàn)類似的不一致。由此可知,實現(xiàn)日志字典中的數(shù)據(jù)一致性其實就是做好一些驗證工作,也就是讓流程停下來,否則會導致日志字典中的數(shù)據(jù)不一致而導致用戶的投訴。
[0051]具體的,本申請上述實施例中的用戶在競價管理服務器50上設置需要推廣的廣告產品與關鍵詞之間的文本特征因子之后,可以根據(jù)關鍵詞query請求閾值服務,得到相應的相關性閾值信息,從而可以根據(jù)這個閾值分析進行判斷該關鍵詞和數(shù)據(jù)信息的綁定關系和優(yōu)良狀況。在賣家用戶發(fā)現(xiàn)其綁定的產品沒有高效的曝光機會時會主動從競價管理服務器50上來優(yōu)化其產品信息和推廣方案,賣家用戶也可以根據(jù)不同關鍵詞的推廣競爭激烈情況來決定推廣策略,從而提高整個網(wǎng)站推廣產品的質量,利于P4P業(yè)務的長期良性競爭發(fā)展。
[0052]圖3是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取方法的流程圖,如圖3所示該方法包括如下步驟:
[0053]步驟S102,圖1中的搜索引擎服務器30可以接收搜索請求串,并從搜索請求串中讀取搜索詞。
[0054]步驟S104,該搜索引擎服務器30根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù)。該步驟中可以通過調用動態(tài)閾值接口函數(shù)來完成。
[0055]步驟S106,搜索引擎服務器30會將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子實時變化。上述實施例中的關鍵詞為索引數(shù)據(jù)表中的索引詞,關鍵詞與索引信息對應。[0056]步驟S108,圖1所示的搜索引擎服務器30根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行動態(tài)顯示。其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:實時變更的文本特征因子和數(shù)據(jù)分析特征因子。
[0057]上述方案將搜索詞在閾值詞典中的得到動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,由于閾值詞典中存儲的動態(tài)閾值分數(shù)會根據(jù)特征因子的實時更新而動態(tài)變化,因此獲取到的當前搜索詞所對應的數(shù)據(jù)信息的數(shù)據(jù),會由于比對的動態(tài)閾值分數(shù)的變化而動態(tài)更新,因此最后顯示在網(wǎng)站前端頁面上的結果也是會更新的,從而解決了相關現(xiàn)有技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活的問題,進而實現(xiàn)了實時的動態(tài)化推廣產品數(shù)據(jù)信息的效果。
[0058]本申請上述實施例中的特征因子中包括的文本特征因子和數(shù)據(jù)分析特征因子,其中,文本特征因子可以包括搜索詞與產品本身的文本信息的匹配參數(shù),數(shù)據(jù)分析特征因子可以包括搜索詞的點擊率、所對應的各個產品的擊率、搜索詞本身熱度、用戶推廣產品地域信息以及搜索詞綁定的產品數(shù)(用戶數(shù))等因素(比如買家和網(wǎng)站推廣數(shù)據(jù)的信息挖掘、網(wǎng)站產品的歷史CTR信息、賣家的競爭程度狀況、推廣產品和詞的相關性和自然搜索結果的對比情況等)。例如搜索詞的點擊率和地域信息等是會根據(jù)實際情況動態(tài)變化,由此可以看出數(shù)據(jù)分析特征因子是動態(tài)變化的,從而動態(tài)閾值分數(shù)是根據(jù)動態(tài)變化的數(shù)據(jù)分析特征因子實時變更。
[0059]優(yōu)選地,本申請上述實施例中的客戶端10可以實現(xiàn)把搜索請求串發(fā)送給搜索引擎服務器30,該搜索請求串由多個條件組裝,搜索引擎服務器30的系統(tǒng)能夠解析該請求串,并調用后臺閾值詞典中已經(jīng)計算好的動態(tài)閾值分數(shù),將得到的動態(tài)閾值分數(shù)作為過濾條件對索引表中的關鍵詞進行過濾,從而返回搜索結果的數(shù)據(jù),最后搜索結果會在客戶端10上的搜索頁面SearchWeb進行展示。
[0060]具體的,如圖4所示,上述過程中,搜索引擎服務器30接收受到客戶端10的搜索頁面SearchWeb的請求串后以及日志信息,會對請求串進行重寫,然后可以調用動態(tài)閾值接口的處理類::init,會在后臺的算法模塊中實現(xiàn)通過閾值計算服務器對每個請求串的搜索詞以及日志詞典中該搜索詞所對應的特征因子進行閾值計算而得到該搜索詞的一個動態(tài)閾值分數(shù),其中動態(tài)閾值分數(shù)表征關鍵詞和數(shù)據(jù)信息之間的動態(tài)綜合相關性情況,然后把該動態(tài)閾值分數(shù)加入到一個過濾條件中,并且對返回的結果個數(shù)進行重寫,最后用重寫后的請求串請求搜索引擎服務器30內核的查詢模塊完成查詢工作,并返回相應的搜索結果給客戶端10的搜索頁面SearchWeb用于展示。
[0061]本申請上述實施例中,在根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù)之前,方法還可以包括如下步驟:從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子;根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù);將各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至閾值詞典;其中,文本特征因子是搜索詞與數(shù)據(jù)信息所匹配的特征權重值,數(shù)據(jù)分析特征因子是搜索詞所對應的分析參數(shù)特征權重值。
[0062]具體的,第一閾值計算服務器90可以從競價管理服務器50拉取搜索詞及搜索詞所對應的數(shù)據(jù)信息,并從日志服務器70的日志詞典中獲取網(wǎng)站完成搜索請求后的日志信息,該日志信息由數(shù)據(jù)分析數(shù)據(jù)庫DW得到的數(shù)據(jù)分析特征因子和文本特征因子構成,閾值計算服務器90在獲取到搜索詞以及所有的文本特征因子和數(shù)據(jù)分析特征因子之后,可以計算得到每個搜索詞的動態(tài)閾值分數(shù),例如,可以計算每個搜索詞query和用戶推廣產品的相關性閾值,同時會計算該搜索詞和網(wǎng)站自然搜索結果前20名產品的相關性閾值,計算過程中除了考慮上述搜索詞和產品的文本相關性閾值,計算得到動態(tài)閾值分數(shù),還會考慮通過對歷史產品的ctr、點擊率、詞本身熱度、推廣產品區(qū)域信息以及詞綁定的產品數(shù)(用戶數(shù))等商業(yè)因素計算得到第二閾值分數(shù),并基于第一閾值分數(shù)和第二閾值分數(shù)得到該搜索詞最終所對應的動態(tài)閾值分數(shù),并將所有搜索詞及其動態(tài)閾值分數(shù)保存至閾值詞典中。上述實施例中,賣家用戶通過競價管理服務器50為閾值處理系統(tǒng)提供用于計算搜索詞和數(shù)據(jù)信息的相關性閾值分數(shù)的文本特征因子。
[0063]本申請上述實施例中,根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)的步驟包括:采用線性回歸模型Scoretl = FO (f 1,f2,,fi)進行擬合計算,以獲取搜索詞的第一閾值分數(shù)Sc0retl,其中,fi是搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù);采用線性回歸模型Score1 = FKfi 1;...,f’k)進行擬合計算,以獲取搜索詞的第二閾值分數(shù)Score1,其中,f’k是搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù);根據(jù)線性回歸模型Score =F(Scoretl, Score1) Xp1 XP2進行擬合計算,以獲取搜索詞的動態(tài)閾值分數(shù),其中,P1是第一閾值分數(shù)的占空比,P2是第二閾值分數(shù)的占空比。
[0064]具體的,當搜索詞和產品對應的的文本相關性計算考慮因素可以包括:fl是搜索詞與產品描述中相同單詞的主題title長度的比率;f2是搜索詞占包含搜索詞的主題title的比率;f3是搜索詞占包含搜索詞的關鍵字keywords的比率;f4用于搜索詞與產品描述中主題title的序列匹配比率;f5是搜索詞與產品描述中關鍵字keywords序列的匹配比率;其中,f4和f5不僅考慮搜索詞query和數(shù)據(jù)信息的字符匹配,還考慮字符序列的匹配,若字符串完全匹配并且字符序列完全一致得滿分,否則的O分。對于這些特征的擬合即特征值權重的確定,采用線性回歸模型。相關性得分Sc0retl = FO (f I,.., f5),fl, f2, -,f5表示這五個特征,F(xiàn)O表示線性回歸模型訓練的模型函數(shù),上面特征進行擬合后得出的分值scoreO即為相關性得分。
[0065]而考慮搜索詞的歷史狀態(tài)所對應的閾值得分=Score1 = FKfi 1;...,f’ k),搜索詞的歷史狀態(tài)所對應的閾值類似于相關性得分的訓練及預測。
[0066]該函數(shù)Score = F(score。, Score1) Xp1Xp2是將文本特征因子所對應的文本相關性得分,以及數(shù)據(jù)分析特征因子所對應的慮關鍵詞的歷史狀態(tài)閾值得分擬合在一起,該分值為最終詞和產品的得分閾值,它反映了產品的文本匹配得分和商業(yè)規(guī)則的得分,F(xiàn)同樣是指線性回歸模型。
[0067]由上分析可知,如圖5所示的詳細業(yè)務流程圖。賣家用戶設置推廣信息,該推廣信息包括需要推廣的關鍵詞和數(shù)據(jù)信息之間的關系列表,即設置關鍵詞與產品本身的文本信息的匹配參數(shù),在競價管理服務器50獲取到上述推廣信息之后,將會將它們發(fā)送給第一閾值計算服務器90,第一閾值計算服務器90在從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子之后,會根據(jù)文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,從而獲取到每個搜索詞的動態(tài)閾值分數(shù),然后,將各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至閾值詞典中;其中,文本特征因子是搜索詞與數(shù)據(jù)信息所匹配的特征權重值,數(shù)據(jù)分析特征因子是搜索詞所對應的分析參數(shù)特征權重值。接著根據(jù)閾值分數(shù)在競價管理服務器中查詢獲取到預先設置的綁定結果,該綁定結果為每個搜索詞與產品信息之間的相關性分數(shù),最后競價管理服務器會拼裝索引詞對應的產品信息。
[0068]本申請上述實施例中,在將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行查詢之前,方法還可以包括:從后臺客戶端的競價管理服務器或日志詞典中獲取關鍵詞及與關鍵詞綁定的每個產品的數(shù)據(jù)信息的文本特征因子;根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù);將各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至閾值數(shù)據(jù)庫;根據(jù)閾值數(shù)據(jù)庫中每個關鍵詞及其對應的所有閾值分數(shù)創(chuàng)建索引表;其中,根據(jù)文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)的步驟包括:采用線性回歸模型Score’ =F’ (fl,f2, , fj)進行擬合計算,以獲取關鍵詞的閾值分數(shù),其中,fj是關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
[0069]本申請上述實施例中,在接收搜索請求串,并從搜索請求串中讀取搜索詞之前,方法還可以包括:接收實時消息以監(jiān)測日志詞典的一致性,在監(jiān)測到特征因子發(fā)生變化的情況下。更新日志詞典。
[0070]需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0071]圖6是根據(jù)本申請實施例的數(shù)據(jù)的動態(tài)獲取裝置的結構示意圖。如圖6所示,該裝置可以包括:接收模塊101,用于接收搜索請求串,并從搜索請求串中讀取搜索詞;查詢模塊103。與接收模塊連接,用于根據(jù)搜索詞在閾值詞典中進行查詢,以獲取搜索詞所對應的動態(tài)閾值分數(shù);過濾模塊105,與查詢模塊連接,用于將搜索詞作為查詢條件,搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與搜索詞相同且關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,動態(tài)閾值分數(shù)根據(jù)特征因子變化;處理模塊107,與過濾模塊連接,用于根據(jù)索引信息獲取搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示;其中,閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
[0072]上述方案將搜索詞在閾值詞典中的得到動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,由于閾值詞典中存儲的動態(tài)閾值分數(shù)會根據(jù)特征因子的實時更新而動態(tài)變化,因此獲取到的當前搜索詞所對應的產品信息的數(shù)據(jù),會由于比對的動態(tài)閾值分數(shù)的變化而動態(tài)更新,因此最后顯示在網(wǎng)站前端頁面上的結果也是會更新的,從而解決了相關現(xiàn)有技術在搜索引擎上實現(xiàn)的產品數(shù)據(jù)推廣的方法單一,使得搜索結果不靈活的問題,進而實現(xiàn)了實時的動態(tài)化推廣產品數(shù)據(jù)信息的效果。
[0073]從以上的描述中,可以看出,本申請實現(xiàn)了如下技術效果:本申請實施例提供的動態(tài)化推廣產品將會降低用戶競價管理服務器50的平臺和搜索引擎服務器30間的耦合,用戶通過用戶競價管理服務器50的平臺進行競價推廣行為的時候就可以知道推廣產品的質量和展現(xiàn)情況,可以針對不同的搜索詞給出動態(tài)和多樣化的推廣產品信息,并且可以根據(jù)網(wǎng)站流量、推廣信息的實時變化而動態(tài)變化,這種方案有利于用戶主動去優(yōu)化和競價,從而促進業(yè)務競價的良性發(fā)展。
[0074]顯然,本領域的技術人員應該明白,上述的本申請的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本申請不限制于任何特定的硬件和軟件結合。
[0075]以上所述僅為本申請的優(yōu)選實施例而已,并不用于限制本申請,對于本領域的技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本申請的保護范圍之內。
【權利要求】
1.一種數(shù)據(jù)的動態(tài)獲取方法,其特征在于,包括: 接收搜索請求串,并從所述搜索請求串中讀取搜索詞; 根據(jù)所述搜索詞在閾值詞典中進行查詢,以獲取所述搜索詞所對應的動態(tài)閾值分數(shù); 將所述搜索詞作為查詢條件,所述搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與所述搜索詞相同且所述關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,所述動態(tài)閾值分數(shù)根據(jù)特征因子變化; 根據(jù)所述索引信息獲取所述搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示; 其中,所述閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),所述索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),所述特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
2.根據(jù)權利要求1所述的方法,其特征在于,在根據(jù)所述搜索詞在閾值詞典中進行查詢,以獲取所述搜索詞所對應的動態(tài)閾值分數(shù)之前,所述方法還包括: 從日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子; 根據(jù)所述文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù); 將所述各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至所述閾值詞典; 其中,所述文本特征因子是所述搜索詞與數(shù)據(jù)信息所匹配的特征權重值,所述數(shù)據(jù)分析特征因子是所述搜索詞所對應的`分析參數(shù)特征權重值。
3.根據(jù)權利要求2所述的方法,其特征在于,根據(jù)所述文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)的步驟包括: 采用線性回歸模型Sc0retl=FO (f I,f2,...,fi)進行擬合計算,以獲取所述搜索詞的第一閾值分數(shù)Sc0retl,其中,fi是所述搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù); 采用線性回歸模型Sc0rei=Fl (f' 1; f\)進行擬合計算,以獲取所述搜索詞的第二閾值分數(shù)Score1,其中,f' k是所述搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù); 根據(jù)線性回歸模型Score=F(score。, Score1) Xp1Xp2進行擬合計算,以獲取所述搜索詞的動態(tài)閾值分數(shù),其中,P1是所述第一閾值分數(shù)的占空比,P2是所述第二閾值分數(shù)的占空比。
4.根據(jù)權利要求1所述的方法,其特征在于,在將所述搜索詞作為查詢條件,所述搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行查詢之前,所述方法還包括: 從競價管理服務器或日志詞典中獲取關鍵詞及與所述關鍵詞綁定的每個數(shù)據(jù)信息的文本特征因子; 根據(jù)所述文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù); 將所述各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至所述閾值數(shù)據(jù)庫;根據(jù)所述閾值數(shù)據(jù)庫中每個關鍵詞及其對應的所有閾值分數(shù)創(chuàng)建所述索引表; 其中,根據(jù)所述文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)的步驟包括:采用線性回歸模型Score’ =F’(fl,f2,..., fj)進行擬合計算,以獲取所述關鍵詞的閾值分數(shù),其中,fj是所述關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
5.根據(jù)權利要求1至4中任意一項所述的方法,其特征在于,在接收搜索請求串,并從所述搜索請求串中讀取搜索詞之前,所述方法還包括: 接收實時消息以監(jiān)測所述日志詞典的一致性,在監(jiān)測到所述特征因子發(fā)生變化的情況下,更新所述日志詞典。
6.一種數(shù)據(jù)的動態(tài)獲取系統(tǒng),其特征在于,包括: 客戶端,用于發(fā)送搜索請求串; 搜索引擎服務器,與所述客戶端建立通信,用于接收搜索請求串,并從所述搜索請求串中讀取搜索詞,在根據(jù)所述搜索詞在閾值詞典中進行查詢,以獲取所述搜索詞所對應的動態(tài)閾值分數(shù)之后,將所述搜索詞作為查詢條件,所述搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與所述搜索詞相同且所述關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,所述動態(tài)閾值分數(shù)根據(jù)特征因子變化,并根據(jù)所述索引信息獲取所述搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進 行顯示; 其中,所述閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),所述索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),所述特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
7.根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 競價管理服務器,用于提供文本特征因子;日志服務器,用于保存日志詞典,以提供數(shù)據(jù)分析特征因子和/或所述文本特征因子;第一閾值計算服務器,用于從所述日志詞典中獲取各個搜索詞的文本特征因子和數(shù)據(jù)分析特征因子,在根據(jù)所述文本特征因子和數(shù)據(jù)分析特征因子進行閾值計算,以獲取每個搜索詞的動態(tài)閾值分數(shù)之后,將所述各個搜索詞及每個搜索詞的動態(tài)閾值分數(shù)以數(shù)據(jù)字典的格式保存至所述閾值搜索數(shù)據(jù)表,以返回給網(wǎng)站的前端頁面進行動態(tài)顯示; 其中,所述文本特征因子是所述搜索詞與數(shù)據(jù)信息所匹配的特征權重值,所述數(shù)據(jù)分析特征因子是所述搜索詞所對應的分析參數(shù)特征權重值。
8.根據(jù)權利要求7所述的系統(tǒng),其特征在于,所述第二閾值計算服務器包括: 第一計算裝置,用于采用線性回歸模型Sc0retl=FO (f 1,f2,...,fi)進行擬合計算,以獲取所述搜索詞的第一閾值分數(shù)Sc0retl,其中,fi是所述搜索詞所對應的文本特征因子,i是小于等于N的整數(shù),N為自然數(shù); 第二計算裝置,用于采用線性回歸模型Sc0rei=Fl (f'f\)進行擬合計算,以獲取所述搜索詞的第二閾值分數(shù)Score1,其中,f' k是所述搜索詞所對應的數(shù)據(jù)分析特征因子,k是小于等M的整數(shù),M為自然數(shù); 處理裝置,用于根據(jù)線性回歸模型Score=F(score。, Score1) Xp1Xp2進行擬合計算,以獲取所述搜索詞的動態(tài)閾值分數(shù),其中,P1是所述第一閾值分數(shù)的占空比,P2是所述第二閾值分數(shù)的占空比。
9.根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第二閾值計算服務器,用于從競價管理服務器或日志詞典中獲取關鍵詞及與所述關鍵詞綁定的每個產品的數(shù)據(jù)信息的文本特征因子,在根據(jù)所述文本特征因子進行閾值計算,以獲取每個關鍵詞所對應的一個或多個閾值分數(shù)之后,將所述各個關鍵詞及每個關鍵詞所對應的閾值分數(shù)保存至所述閾值數(shù)據(jù)庫。
10.根據(jù)權利要求9所述的系統(tǒng),其特征在于,所述第二閾值計算服務器包括: 第三計算裝置,用于采用線性回歸模型Score’ =F’ (fl, f2,..., fj)進行擬合計算,以獲取所述關鍵詞的閾值分數(shù),其中,fj是所述關鍵詞所對應的文本特征因子,j是小于等于J的整數(shù),J為自然數(shù)。
11.根據(jù)權利要求6至10中任意一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:監(jiān)測裝置,用于接收實時消息以監(jiān)測所述日志詞典的一致性,在監(jiān)測到所述特征因子發(fā)生變化的情況下,更新所述日志詞典。
12.—種數(shù)據(jù)的動態(tài)獲取裝置,其特征在于,包括: 接收模塊,用于接收搜索請求串,并從所述搜索請求串中讀取搜索詞; 查詢模塊,與所述接收模塊連接,用于根據(jù)所述搜索詞在閾值詞典中進行查詢,以獲取所述搜索詞所對應的動態(tài)閾值分數(shù);` 過濾模塊,與所述查詢模塊連接,用于將所述搜索詞作為查詢條件,所述搜索詞所對應的動態(tài)閾值分數(shù)作為過濾條件在索引數(shù)據(jù)表中進行過濾,以獲取當關鍵詞與所述搜索詞相同且所述關鍵詞的閾值分數(shù)大于等于該搜索詞的動態(tài)閾值分數(shù)時,所對應的一個或多個索引信息,其中,所述動態(tài)閾值分數(shù)根據(jù)特征因子變化; 處理模塊,與所述過濾模塊連接,用于根據(jù)所述索引信息獲取所述搜索詞所對應的數(shù)據(jù)信息,并返回給網(wǎng)站的前端頁面進行顯示; 其中,所述閾值詞典包括:搜索詞及每個搜索詞所對應的動態(tài)閾值分數(shù),所述索引數(shù)據(jù)表包括:關鍵詞以及關鍵詞與每個數(shù)據(jù)信息之間的閾值分數(shù),所述特征因子包括:文本特征因子和數(shù)據(jù)分析特征因子。
【文檔編號】G06F17/30GK103678365SQ201210339669
【公開日】2014年3月26日 申請日期:2012年9月13日 優(yōu)先權日:2012年9月13日
【發(fā)明者】張林鋒, 黃鵬, 王錫普, 鄭文彬 申請人:阿里巴巴集團控股有限公司