專利名稱:網站訪客價值評估系統(tǒng)及方法
技術領域:
本申請涉及網絡技術,特別涉及一種網站訪客價值評估系統(tǒng)及方法。
背景技術:
目前,很多企業(yè)都通過網站來進行信息展示和產品營銷,隨著網絡技術的發(fā)展,網 站和訪客之間也可以實現(xiàn)更多的互動。例如,網站主可以通過網絡管理系統(tǒng)看到訪客的一 些信息,根據這些信息來判斷訪客的價值,然后進一步對具有一定價值的訪客做一些業(yè)務 行為,例如與其聯(lián)系,向其提供更詳細的信息等??梢韵胂?,對于具有大量訪客的網站而言,如果以人工方式來判斷每個訪客的價 值,工作量大且效率難以保證。為了實現(xiàn)對網站訪客價值的自動判斷,現(xiàn)有技術中,是通過 把各類“訪客信息”中的單個或多個組合設置為條件,一旦滿足條件,就認為該訪客具有一 定價值并通知網站主。這些條件可以包括來訪次數超過幾次、訪問頁面超過幾個、是否訪 問過某些特定頁面、訪客是否來自某些特定的省市等。但是通過對現(xiàn)有技術的研究,申請人發(fā)現(xiàn)上述條件組合的方法存在著許多缺陷, 主要包括以下幾點1、現(xiàn)有技術中,為了可以盡可能準確地評估訪客的價值,評估規(guī)則就會極為復雜, 往往需要由許多個數據條件組合而成。因此系統(tǒng)在計算過程中就需要針對訪客信息中的各 條數據進行反復的計算,計算量會非常大,且計算時間過長。2、現(xiàn)有的訪客價值評估方法無法給出人性化的評估結論,只能輸出“是”或者“否” 兩種結果。對于條件組合的判斷方法來說,有些訪客價值可能是潛在的,即這種訪客的價值 數據并沒有被納入判斷條件中,因而現(xiàn)有技術很難準確地、全面地對訪客價值進行判斷。綜上所述,現(xiàn)有的自動判斷訪客價值的方法,其計算量大、計算時間長,容易出現(xiàn) 漏判錯判的情況,并且其判斷結果往往缺乏準確性和全面性。
發(fā)明內容
本申請的目的提供一種網站訪客價值評估系統(tǒng),以解決現(xiàn)有的網站訪客價值判斷 方法容易出現(xiàn)漏判錯判的問題。本申請的另一目的是提供一種網站訪客價值評估方法,以解決現(xiàn)有的網站訪客價 值判斷方法容易出現(xiàn)漏判錯判的問題。本申請?zhí)岢鲆环N網站訪客價值評估系統(tǒng),包括監(jiān)控單元、數據組劃分單元、存儲單 元、模型訓練單元、計算單元以及數據輸出單元。監(jiān)控單元用于采集網站的訪客信息。數據 組劃分單元與所述監(jiān)控單元相連,用于將采集的歷史訪客數據按照價值等級劃分多個數據 組,并形成一個標準集。存儲單元與所述數據組劃分單元相連,用于存放所述標準集。模型 訓練單元與所述存儲單元相連,用于根據所述標準集,構建新訪客對各個數據組隸屬度的 計算模型。計算單元分別與所述存儲單元及模型訓練單元相連,用于通過所述計算模型計 算出新訪客對各個數據組的隸屬度,以評估該新訪客的價值。數據輸出單元與所述計算單
5元相連,用于輸出表示新訪客價值的數據。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),所述模型訓練單元又包括 賦值子單元,其與所述存儲單元相連,用于為標準集中所有的訪客數據賦予權重值。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),所述計算模型的計算公式 為A=E Wi^Xi [_b(i) = min{bk(i)}k = 1,2, ... η其中,A為新訪客與歷史訪客之間的“距離”,Wi為訪客數據的權重值成為該條數 據與標準集中訪客的對應數據的對比參數,相同為0,不同為1 ;S(i)為新訪客對其中一數 據組的隸屬度;a(i)為新訪客與該數據組中歷史訪客“距離”的平均值;bk(i)為新訪客與 標準集中其它數據組中歷史訪客“距離”的平均值。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),數據輸出單元輸出的數據 形式為[S1/ (S^S2+. · · +Sn+1),S2/ (S^S2+. · · +Sn+1),· · · Sn+1/ (S^S2+. · · +sn+1)]其中,SpS2.....Sn+1表示新訪客與各個數據組的隸屬關系,且Sn+1 = (S(i)+l)/2,
n+1是標準集中數據組的數量。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),所述監(jiān)控單元又包括數據 采集子單元及量化子單元。數據采集子單元用于采集一段時間內的訪客數據,所述的訪客 數據包括屬性數據和業(yè)務行為數據。量化子單元與所述數據采集子單元相連,用于將所采 集的網站訪客數據量化為布爾型,并形成所述標準集。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),所述標準集中包括“有價 值訪客”和“無價值訪客”兩個數據組。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),所述標準集中包括“有價 值訪客”、“無價值訪客”和“惡意訪客”三個數據組。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),其還包括潛在訪客管理單 元,其與所述計算單元相連,用于儲存有價值的新訪客數據,并對有價值的新訪客數據進行 標記。依照本申請較佳實施例所述的網站訪客價值評估系統(tǒng),其還包括訪客追蹤單元, 其與所述計算單元相連,用于建立有價值的新訪客與網站主之間的實時通信通道。本申請另提出一種網站訪客價值評估方法,包括步驟(1)建立標準集,所述標準 集中包括網站歷史記錄中一定量的訪客數據按照價值等級劃分而成的多個數據組。(2)構 建新訪客對各個數據組隸屬度的計算模型。(3)根據計算出的隸屬度,評估新訪客的價值。 (4)輸出新訪客的價值數據。依照本申請較佳實施例所述的網站訪客價值評估方法,構建所述計算模型具體包 括步驟(1)為所有數據組中的歷史訪客數據賦予權重值。(2)構建新訪客與歷史訪客的 “距離”計算公式Α =Σ Wi*Xi(3)構建新訪客對各個數據組隸屬度的計算公式 s(d%)}
b(i) = min{bk(i)} k = 1,2, ... η其中,A為新訪客與歷史訪客之間的“距離”,Wi為訪客數據的權重值成為該條數 據與標準集中訪客的對應數據的對比參數,相同為0,不同為1 ;S(i)為新訪客對其中一數 據組的隸屬度;a(i)為新訪客與該數據組中歷史訪客“距離”的平均值;bk(i)為新訪客與 標準集中其它數據組中歷史訪客“距離”的平均值。依照本申請較佳實施例所述的網站訪客價值評估方法,輸出新訪客的價值數據時 具體為輸出數組 [S1/ (S^S2+. · · +Sn+1),S2/ (S^S2+. · · +Sn+1),· · · Sn+1/ (S^S2+. · · +sn+1)]其中,S”S2.....Sn+1表示新訪客與各個數據組的隸屬關系,且Sn+1 = (S⑴+1)/2,
n+1是標準集中數據組的數量。依照本申請較佳實施例所述的網站訪客價值評估方法,建立所述標準集具體包括 以下步驟(1)對網站進行監(jiān)控,并采集一段時間內的訪客數據,所述的訪客數據包括屬性 數據和業(yè)務行為數據。(2)將所采集的網站訪客數據量化為布爾型。(3)根據業(yè)務行為數 據將所采集的訪客數據劃分為多個數據組,并形成所述標準集。依照本申請較佳實施例所述的網站訪客價值評估方法,建立所述標準集時具體 為將歷史訪客數據按照有價值訪客、無價值訪客的規(guī)則劃分為兩個數據組。依照本申請較佳實施例所述的網站訪客價值評估方法,建立所述標準集時具體 為將歷史訪客數據按照按照有價值訪客、無價值訪客、惡意訪客的規(guī)則劃分為三個數據組。依照本申請較佳實施例所述的網站訪客價值評估方法,在對新訪客的價值進行評 估之后還進一步包括步驟將有價值的新訪客數據進行標記并儲存。依照本申請較佳實施例所述的網站訪客價值評估方法,在對新訪客的價值進行評 估之后還進一步包括步驟建立有價值的新訪客與網站主之間的實時通信通道。與現(xiàn)有技術相比,本申請具有以下優(yōu)點1、本申請通過計算訪客隸屬度的方式來判別訪客價值,計算公式單一,無須對訪 客數據進行反復的計算,使系統(tǒng)的計算量小,計算速度快。2、本申請利用了模糊數學的思想來估算訪客價值,可以將容易被忽略的一些隱含 信息包含在算法之中,并可以輸出概率性的結論,使訪客價值的計算結果更加準確和全面。當然,實施本申請的任一產品并不一定需要同時達到以上所述的所有優(yōu)點。
圖1為本申請網站訪客價值評估方法的一種實施例流程圖;圖2為本申請網站訪客價值評估方法在建立標準集時的一種實施例流程圖;圖3為本申請構建計算模型的一種實施例流程圖;圖4為本申請訪客隸屬度計算方式的一種實施例示意圖;圖5為本申請網站訪客價值評估系統(tǒng)的一種實施例結構圖;圖6為本申請監(jiān)控單元的一種實施例結構圖;圖7為本申請模型訓練單元的一種實施例結構圖;圖8為網站訪客價值評估系統(tǒng)的另一種實施例結構圖9為本申請網站訪客價值評估系統(tǒng)的網絡拓撲圖。
具體實施例方式本申請利用了模糊數學的思想,根據網站主對歷史訪客數據的價值判斷,并以模 糊數學中隸屬度來作為評估新訪客是否有價值的標準,從而可以對新訪客的價值進行人性 化的評估,也使網站主可以有效地展開后續(xù)的業(yè)務行為。以下結合附圖,具體說明本申請。請參見圖1,其為本申請一種網站訪客價值評估方法的實施例流程圖,其包括以下 步驟S101,建立標準集,所述標準集中包括網站歷史記錄中一定量的訪客數據按照價 值等級劃分而成的多個數據組。S103,構建新訪客對各個數據組隸屬度的計算模型。S105,根據計算出的隸屬度,評估新訪客的價值。S107,輸出新訪客的價值數據。對于步驟S101,在建立所述的標準集時可以通過三個過程來實現(xiàn),如圖2所示,其 包括S201,對網站進行監(jiān)控,并采集一段時間內的訪客數據,所述的訪客數據包括屬性 數據和業(yè)務行為數據。網站主可以在后臺服務器中搭建一個監(jiān)控系統(tǒng),并且通過監(jiān)控系統(tǒng)采集一段時間 內網站上的訪客數據。而本申請的訪客價值評估方法所需要的訪客數據包括有屬性數據和 業(yè)務行為數據。這里所說的屬性數據是指訪客的基本信息和訪問網站的行為信息,如訪問 時刻、訪客地域(通過IP判斷)、訪問頁面數、網站停留時間、重復來訪次數等數據。業(yè)務行 為數據是指網站主對訪客是否有價值的判斷信息,即表示該歷史訪客是否有價值的數據。S203,將所采集的網站訪客數據量化為布爾型。為了可以建立一個簡單計算模型,需要將所采集到的歷史訪客的屬性數據和業(yè)務 行為數據進行量化處理。本實施例中是將對訪客價值判斷有用的數據量化為布爾型。具體 來說,就是將不同類型的數據進行統(tǒng)一規(guī)劃,以便于后續(xù)的模型計算。請參見表1,其給出了 部分數據的量化準則
數據類別數據形式量化規(guī)則地域編碼精確到省,編碼為1、2、 3訪問頁面編碼將網站頁面進行編號,不 同頁面對應不同的編碼。頁面數數值劃分為區(qū)間,比如1、 2 3、4 5、5頁面以上。
權利要求
1.一種網站訪客價值評估系統(tǒng),其特征在于,包括 一監(jiān)控單元,用于采集網站的訪客信息;一數據組劃分單元,與所述監(jiān)控單元相連,用于將采集的歷史訪客數據按照價值等級 劃分多個數據組,并形成一標準集;一存儲單元,與所述數據組劃分單元相連,用于存放所述標準集; 一模型訓練單元,與所述存儲單元相連,用于根據所述標準集,構建新訪客對各個數據 組隸屬度的計算模型;一計算單元,分別與所述存儲單元及模型訓練單元相連,用于通過所述計算模型計算 出新訪客對各個數據組的隸屬度,以評估該新訪客的價值;一數據輸出單元,與所述計算單元相連,用于輸出表示新訪客價值的數據。
2.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,所述模型訓練單元又包括一賦值子單元,與所述存儲單元相連,用于為標準集中所有的訪客數據賦予權重值。
3.如權利要求2所述的網站訪客價值評估系統(tǒng),其特征在于,所述計算模型的計算公 式為A=E Wi^Xicm- b(i)-a(i) K J~ max{a(i),b(i)}b (i) = min {bk (i)} k = 1, 2, . . . η其中,A為新訪客與歷史訪客之間的“距離”,Wi為訪客數據的權重值成為該條數據與 標準集中訪客的對應數據的對比參數,相同為0,不同為1 ;S(i)為新訪客對其中一數據組 的隸屬度;a(i)為新訪客與該數據組中歷史訪客“距離”的平均值;bk(i)為新訪客與標準 集中其它數據組中歷史訪客“距離”的平均值。
4.如權利要求3所述的網站訪客價值評估系統(tǒng),其特征在于,該數據輸出單元輸出的 數據形式為[S1/ (S^S2+. · · +Sn+1),S2/ (S^S2+. · · +Sn+1),· · · Sn+1/ (S^S2+. · · +sn+1)]其中,S1A2.....Slri表示新訪客對與個數據組的隸屬關系,且Sn+1 = (S(i)+l)/2,n+l是標準集中數據組的數量。
5.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,所述監(jiān)控單元又包括 一數據采集子單元,用于采集一段時間內的訪客數據,所述的訪客數據包括屬性數據和業(yè)務行為數據;一量化子單元,與所述數據采集子單元相連,用于將所采集的網站訪客數據量化為布 爾型,并形成所述標準集。
6.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,所述標準集中包括“有價 值訪客”和“無價值訪客”兩個數據組。
7.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,所述標準集中包括“有價 值訪客”、“無價值訪客”和“惡意訪客”三個數據組。
8.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,其還包括一潛在訪客管 理單元,其與所述計算單元相連,用于儲存有價值的新訪客數據,并對有價值的新訪客數據進行標記。
9.如權利要求1所述的網站訪客價值評估系統(tǒng),其特征在于,其還包括一訪客追蹤單 元,其與所述計算單元相連,用于建立有價值的新訪客與網站主之間的實時通信通道。
10.一種網站訪客價值評估方法,其特征在于,包括步驟建立一標準集,所述標準集中包括網站歷史記錄中一定量的訪客數據按照價值等級劃 分而成的多個數據組;構建新訪容對各個數據組隸屬度的計算模型; 根據計算出的隸屬度,評估新訪客的價值; 輸出新訪客的價值數據。
11.如權利要求10所述的網站訪客價值評估方法,其特征在于,構建所述計算模型具 體包括步驟為所有數據組中的歷史訪客數據賦予權重值; 構建新訪客與歷史訪客的“距離”計算公式Α =Σ Wi^Xi 構建新訪客對各個數據組隸屬度的計算公式ern_ b(i)-a(i) K max{a(i),b(i)}b (i) = min {bk (i)} k = 1, 2, . . . η其中,A為新訪客與歷史訪客之間的“距離”,Wi為訪客數據的權重值成為該條數據與 標準集中訪客的對應數據的對比參數,相同為0,不同為1 ;S(i)為新訪客對其中一數據組 的隸屬度;a(i)為新訪客與該數據組中歷史訪客“距離”的平均值;bk(i)為新訪客與標準 集中其它數據組中歷史訪客“距離”的平均值。
12.如權利要求11所述的網站訪客價值評估方法,其特征在于,輸出新訪客的價值數 據時具體為輸出數組[S1/ (S^S2+. · · +Sn+1),S2/ (S^S2+. · · +Sn+1),· · · Sn+1/ (S^S2+. · · +sn+1)]其中,S1A2.....Slri表示新訪客與各個數據組的隸屬關系,且Sn+1 = (S(i)+l)/2,n+l是標準集中數據組的數量。
13.如權利要求10所述的網站訪客價值評估方法,其特征在于,建立所述標準集具體 包括以下步驟對網站進行監(jiān)控,并采集一段時間內的訪客數據,所述的訪客數據包括屬性數據和業(yè) 務行為數據;將所采集的網站訪客數據量化為布爾型;根據業(yè)務行為數據將所采集的訪客數據劃分為多個數據組,并形成所述標準集。
14.如權利要求10所述的網站訪客價值評估方法,其特征在于,建立所述標準集時具 體為將歷史訪客數據按照有價值訪客、無價值訪客的規(guī)則劃分為兩個數據組。
15.如權利要求10所述的網站訪客價值評估方法,其特征在于,建立所述標準集時具 體為將歷史訪客數據按照按照有價值訪客、無價值訪客、惡意訪客的規(guī)則劃分為三個數據 組。
16.如權利要求10所述的網站訪客價值評估方法,其特征在于,在對新訪客的價值進 行評估之后還進一步包括步驟將有價值的新訪客數據進行標記并儲存。
17.如權利要求10所述的網站訪客價值評估方法,其特征在于,在對新訪客的價值進 行評估之后還進一步包括步驟建立有價值的新訪客與網站主之間的實時通信通道。
全文摘要
本發(fā)明提出一種網站訪客價值評估系統(tǒng)及方法,其方法包括步驟(1)建立標準集,所述標準集中包括網站歷史記錄中一定量的訪客數據按照價值等級劃分而成的多個數據組。(2)構建新訪客對各個數據組隸屬度的計算模型。(3)根據計算出的隸屬度,評估新訪客的價值。(4)輸出新訪客的價值數據。本發(fā)明可以對網站訪客價值人性化地評估,節(jié)約了網站主親自評估訪客價值所需的大量時間。
文檔編號G06F17/30GK102096692SQ20091025917
公開日2011年6月15日 申請日期2009年12月11日 優(yōu)先權日2009年12月11日
發(fā)明者呂開利, 張征, 蘇杰 申請人:阿里巴巴集團控股有限公司