專利名稱:動態(tài)熱點跟蹤的方法
技術領域:
本發(fā)明涉及一種動態(tài)熱點跟蹤的方法,是一種電數(shù)字數(shù)據(jù)處理的方法,是 一種用于電數(shù)字數(shù)據(jù)信息網(wǎng)絡的方法,是一種為網(wǎng)站運營者提供改進網(wǎng)站的方 法。
背景技術:
網(wǎng)絡已經(jīng)成為人們生活中必不可少的東西,是現(xiàn)代人獲取信息的重要途徑 之一。其重要性將要超過最重要的媒體一一電視對人們的影響。網(wǎng)絡引起了廣 告商的極大興趣。如何有力的使用網(wǎng)絡這一重要的傳播媒介,進行廣告宣傳, 如何幫助網(wǎng)絡運營者了解用戶心里,藉以改善網(wǎng)站的布局和質(zhì)量,增加點擊率, 最終吸引廣告商,使網(wǎng)站運營者獲利?目前,已有一些網(wǎng)站嘗試對網(wǎng)頁瀏覽者 (用戶)的點擊習慣進行記錄和分析,從中獲取該用戶的一些喜好,提供個性 化網(wǎng)頁和相應的廣告。這種方法雖然可以取得一些效果,但遠遠不夠。因為用 戶對感興趣的東西有時并不點擊,僅僅統(tǒng)計點擊率,往往不能準確的判斷瀏覽 者的喜好。
發(fā)明內(nèi)容
本發(fā)明要解決的技術問題是提出 一種動態(tài)熱點跟蹤的方法,所述的方法根 據(jù)用戶鼠標軌跡識別該用戶的興趣,判斷該用戶的屬性,例如性別、來源等, 跟蹤單個用戶或者群體用戶對網(wǎng)站的所有訪問路徑,提取點擊頻度形成熱點分 布特征,實時繪制以用戶網(wǎng)站截圖為背景的多維度抽象點擊區(qū)域,并跟隨用戶 的訪問軌跡進行動態(tài)展現(xiàn)。本發(fā)明解決上述技術問題所釆取的技術方案是 一種動態(tài)熱點跟蹤的方法,
所述的方法使用互聯(lián)網(wǎng)、提供網(wǎng)頁服務的網(wǎng)站、瀏覽網(wǎng)頁的用戶終端、分析系
統(tǒng),其特征在于所述方法的運行步驟如下
用戶在用戶終端《連沖矣網(wǎng)站的網(wǎng)頁;
網(wǎng)站向用戶傳送網(wǎng)頁時傳送數(shù)據(jù)收集器;
數(shù)據(jù)收集器向分析系統(tǒng)傳輸首次訪問數(shù)據(jù),建立新用戶檔案;
分析系統(tǒng)接收數(shù)據(jù)并建立所述用戶的用戶模型;
獲取用戶正在訪問的網(wǎng)頁頁面截用戶瀏覽網(wǎng)頁,對頁面上的多個鏈接或圖片進行點擊;
所述的數(shù)據(jù)收集器傳輸點擊數(shù)據(jù),包括鼠標點擊位置、點擊順序、訪問 內(nèi)容、頁面停留時間;
分析系統(tǒng)接收數(shù)據(jù),根據(jù)用戶點的擊位置、點擊順序、訪問內(nèi)容、頁面停 留時間分析所述用戶的來源和興趣類型;
根據(jù)來源、興趣類型分析用戶特征,包括性別、年齡范圍、愛好、習慣;
重復多次數(shù)據(jù)收集和分析,生成網(wǎng)站熱點開啟用戶動態(tài)跟蹤;
用戶在用戶終端繼續(xù)訪問其他網(wǎng)站;
數(shù)據(jù)收集器繼續(xù)傳輸用戶數(shù)據(jù);
分析系統(tǒng)繼續(xù)分析用戶特征;
根據(jù)分析的結(jié)果動態(tài)更新網(wǎng)站熱點圖的熱區(qū)變化。
本發(fā)明產(chǎn)生的有益效果是本發(fā)明通過在用戶網(wǎng)站上放置一個數(shù)據(jù)收集器, 可以收集用戶在網(wǎng)站上鼠標行為,例如點擊、移動、徘徊等。同時收集用戶訪問的來源網(wǎng)站、當前訪問的網(wǎng)頁內(nèi)容、用戶在該網(wǎng)頁上的停留時間即瀏覽路 徑等,之后結(jié)合鼠標在網(wǎng)站上點擊的坐標,進行抽象整合,形成基于鼠標軌跡 和點擊,以及用戶屬性的熱區(qū)圖。并且根據(jù)時間的推移,進行熱區(qū)圖的更新。 當有新用戶訪問時,可直接在該熱區(qū)圖上動態(tài)呈現(xiàn)出來。
下面結(jié)合附圖和實施例對本發(fā)明作進一步說明。
圖1是本發(fā)明實施例一所述方法所使用的系統(tǒng)及信息流向示意圖2是本發(fā)明實施例一所述方法的運行框圖3是本發(fā)明實施例一所述方法形成的網(wǎng)站熱點圖。
具體實施方式
實施例一
本實施例是一種動態(tài)熱點跟蹤的方法,本實施例使用互聯(lián)網(wǎng)、提供網(wǎng)頁服 務的網(wǎng)站、瀏覽網(wǎng)頁的用戶終端、分析系統(tǒng),整個系統(tǒng)如圖1所示。本實施例 所述的互聯(lián)網(wǎng)包括局域網(wǎng)和廣域網(wǎng)。網(wǎng)站指的是提供各種網(wǎng)頁服務的服務商, 按本實施例所述方法提供的對象主要是提供各種信息服務的網(wǎng)頁服務商。用戶 終端是指最終的網(wǎng)頁用戶,而不是指小型局域網(wǎng)的節(jié)點。分析系統(tǒng)安裝在專門 提供分析服務的服務商的服務器中,該服務商為網(wǎng)頁服務商廣告商提供用戶群 體的分析信息,以便網(wǎng)頁提供商和廣告商改善網(wǎng)頁布局和質(zhì)量。
本實施例的基本思路是當用戶瀏覽一個網(wǎng)站時,根據(jù)用戶鼠標軌跡識別 用戶興趣、判斷訪問者的基本屬性(如性別、來源等),跟蹤單個用戶或者群體 用戶對網(wǎng)站的所有訪問路徑,提取點擊頻度形成熱點分布特征,實時繪制以用 戶網(wǎng)站截圖為背景的多維度抽象點擊區(qū)域,并且跟隨用戶的訪問軌跡進行動態(tài) 的展現(xiàn)。具體做法是通過在用戶的網(wǎng)站上放置一個Javascript腳本作為數(shù)據(jù)收集器,JavaScript腳本為一種專門用于在網(wǎng)頁上執(zhí)行程序的輕量級程序代碼, 用戶訪問網(wǎng)站后,該腳本程序?qū)⑾螺d到用戶的電腦上,進行解釋執(zhí)行,執(zhí)行結(jié) 果可以直接作用于網(wǎng)頁上。通過使用一種基于Javascript和XML的異步網(wǎng)頁交 互技術-AJAX,可以在用戶打開網(wǎng)頁后,瀏覽器后臺自動將用戶的相關數(shù)據(jù)通 過HTTP GET方式傳輸?shù)街付ǖ姆掌鳎挥绊懹脩舻恼>W(wǎng)頁操作。 本實施例是通過如下運行步驟而實現(xiàn)的,流程框圖見圖2:
1) 用戶在用戶終端鏈接網(wǎng)站的網(wǎng)頁。這一步驟就是用戶登錄網(wǎng)頁,類似于 啟動一個程序。
2) 網(wǎng)站向用戶傳送網(wǎng)頁時傳送數(shù)據(jù)收集器。用戶登錄任何一個網(wǎng)頁,為使 用戶可以順利的瀏覽該網(wǎng)頁,服務商通常都要將一些應用軟件安裝在用戶的終 端上。本步驟所述的數(shù)據(jù)收集器就是這樣一個小軟件,數(shù)據(jù)收集器是一個 Javascript腳本,在頁面后臺運行,不會在頁面上形成任何附加的痕跡。 Javascript腳本可以認為是一個傳感器,收集用戶鼠標的運動軌跡,并將鼠標 運動的軌跡轉(zhuǎn)換為數(shù)據(jù)發(fā)送給分析系統(tǒng)。
3) 數(shù)據(jù)收集器向分析系統(tǒng)傳輸首次訪問數(shù)據(jù),建立新用戶檔案。對每個特 定的用戶,都要建立檔案以便進行分析。
4) 分析系統(tǒng)接收數(shù)據(jù)并建立所述用戶的用戶模型。分析系統(tǒng)在建立用戶檔 案后利用數(shù)據(jù)收集器初次傳來的數(shù)據(jù)建立用戶模型,這些用戶模型包括用戶的 初始訪問時間、給該用戶分配的唯一標識、該用戶瀏覽網(wǎng)站使用的用戶名、用 戶訪問該網(wǎng)站的頻度、用戶的瀏覽習慣、用戶的來源、用戶感興趣的內(nèi)容等, 這只是包含非常初級的用戶原始數(shù)據(jù),用以對該用戶進行跟蹤。
5) 獲取用戶正在訪問的網(wǎng)頁頁面截圖。建立用戶才莫型后,分析系統(tǒng)將用戶正在訪問的網(wǎng)頁全幅截圖,即將所訪問的網(wǎng)頁的界面制作為圖片格式的圖像數(shù) 據(jù)儲存起來,以便后續(xù)分析使用。
6) 用戶瀏覽網(wǎng)頁,對頁面上的多個鏈接或圖片進行點擊。本步驟實際是用 戶對網(wǎng)頁進行瀏覽、閱讀,看到感興趣的內(nèi)容就點擊,以便進一步了解該條標 題信息的具體情況。
7) 所述的數(shù)據(jù)收集器傳輸點擊數(shù)據(jù),包括鼠標點擊位置、點擊順序、訪 問內(nèi)容、頁面停留時間。本步驟是鼠標數(shù)據(jù)收集器所收集的鼠標運動軌跡的重 要數(shù)據(jù)。這些數(shù)據(jù)包括的內(nèi)容是
*用戶在該頁面上鼠標點擊的坐標(以屏幕左上角為原點);
*用戶訪問的來源網(wǎng)站;
*用戶當前訪問的網(wǎng)頁;
*用戶訪問的內(nèi)容;
*用戶在給頁面上的停留時間。
8) 分析系統(tǒng)接收數(shù)據(jù),根據(jù)用戶的點擊位置、點擊順序、訪問內(nèi)容、頁面 停留時間分析所述用戶的來源和興趣類型。分析系統(tǒng)根據(jù)數(shù)據(jù)收集器發(fā)來的數(shù) 據(jù)對用戶的來源和興趣類型進行分析。所謂來源就是用戶是從那個網(wǎng)站的鏈接 過來的,還是初始登錄,以此分析用戶使用的是什么初始默認網(wǎng)頁,并以此分 析用戶的類型。用戶的類型通常是
首次訪問新用戶;
老用戶(本周訪問過的用戶);
忠誠用戶(連續(xù)3周每周至少訪問過5次的用戶);
9) 根據(jù)來源、興趣類型分析用戶特征,包括性別、年齡范圍、愛好、習慣。
10) 根據(jù)數(shù)據(jù)收集和分析,生成網(wǎng)站熱點圖。本實施例將收集和分析的結(jié) 果用網(wǎng)站熱點圖的方式表達出來。收集和分析的結(jié)果還可以用其他方式表達, 例如用表格、直方圖、頻譜圖等等形式,或者直接用文字敘述。本實施例采取 的方式是網(wǎng)站熱點圖的方式,這種方式最為直觀,可以一目了然的表達用戶的 興趣所在。網(wǎng)頁熱點圖可以使用主頁以及網(wǎng)站的任意頁面,對主頁全幅圖后在
該網(wǎng)頁上標出熱點的位置,如圖3所示,圖3中畫面上不規(guī)則的片狀就是熱點。
具體的做法就是系統(tǒng)接到數(shù)據(jù)收集器收集的數(shù)據(jù)后,根據(jù)特有的算法,結(jié)合鼠 標在網(wǎng)站上以屏幕左上角為原點的坐標,進行相鄰區(qū)域整合,形成基于鼠標點 擊和用戶屬性。這種方法類似于衛(wèi)星云圖的可視化網(wǎng)頁熱點圖,熱點圖是把每 個點擊的坐標對應成網(wǎng)頁屏幕上的一個像素點,根據(jù)一定的規(guī)則繪制的圖片。
11) 開啟用戶動態(tài)跟蹤。
這里的跟蹤指的是首先對該用戶進行唯一的標識,并依賴cookie (cookie
含有該用戶的唯一標識碼,該唯一標識碼由Javascript腳本動態(tài)生成,并且分 配給用戶。
以后用戶再次訪問該網(wǎng)站的時^f矣,Javascript扭p本會首先辨識用戶cookie 存在的唯一標識碼,將其傳遞給服務后臺,服務后臺程序因此可以根據(jù)此唯一 標識碼與其系統(tǒng)已經(jīng)收集過的用戶列表進行匹配,并在存儲該用戶所有信息的 時候,都會同時存入該唯一標識碼,用戶以后對該用戶進行獨立的分析。
用戶在主頁點擊鏈接進入網(wǎng)站的其他網(wǎng)頁后還會進入更深入的網(wǎng)頁,所以 還需要進一步跟蹤用戶的瀏覽行程。12) 用戶在用戶終端繼續(xù)訪問其他網(wǎng)站。這是用戶離開已經(jīng)訪問的網(wǎng)站, 通過鏈接對其他網(wǎng)站的訪問,因此也要繼續(xù)跟蹤。
13) 數(shù)據(jù)收集器繼續(xù)傳輸用戶數(shù)據(jù)。隨著用戶繼續(xù)訪問其他網(wǎng)站的網(wǎng)頁。
14) 分析系統(tǒng)繼續(xù)分析用戶特征。
15) 根據(jù)分析的結(jié)果動態(tài)更新網(wǎng)站熱點圖的熱區(qū)變化。根據(jù)時間的推移, 進行熱區(qū)圖的變化,當有全新的訪客,即一個從沒有訪問過該網(wǎng)站的新用戶訪 問網(wǎng)站該頁面時,系統(tǒng)將自動收集數(shù)據(jù)進行處理,直接在該熱區(qū)圖上迭代運算, 從而動態(tài)呈現(xiàn)出來最新的熱區(qū)圖,以實現(xiàn)動態(tài)跟蹤。
通過這個動態(tài)變化的網(wǎng)站熱點圖,網(wǎng)站運營者可以通過掌握用戶點擊的習 慣,很容易找尋自己有價值的廣告位,以贏取更大的利益,同時發(fā)現(xiàn)現(xiàn)有網(wǎng)站 版式中不合理的地方,以進行針對性的改進。對于電子商務的運營者,可以通 過設計更合理的商品布局,簡化用戶操作的流程以提高訂單的成功率和客戶的 滿意度。
實施例二
本實施例是實施例一的改進,本實施例是網(wǎng)站熱點圖的細化。本實施例所 述的生成網(wǎng)站熱點圖包括以下子步驟
1)用色階模式初始化一組顏色點陣,初始化索引調(diào)色盤。
色階模式與RGB (人眼能識別的彩色圖像)不同,色階是指去除各種顏色 之間的差異,純粹的亮度信息。
索引調(diào)色盤與RGB相對,每種顏色并不存儲顏色本身的信息,而是將RGB 映射到某一個序號(索引)上。使用這樣的方法使圖像合并時,非透明區(qū)域不 會相互覆蓋而是融合。2) 對點擊數(shù)據(jù)進行預處理,包括有效性驗證、合并相近數(shù)據(jù)以及建立數(shù)
據(jù)索引。
有效性驗證使用一些規(guī)則驗證點擊數(shù)據(jù)是否可以用于處理。這些規(guī)則包 括是否超出頁面的邊界,瀏覽器類型是否符合要求等等。
合并相近數(shù)據(jù)將坐標距離小于一定閥值的點的數(shù)據(jù)合并成一個數(shù)據(jù),達 到加速處理以及增強視覺說明力的效果。
數(shù)據(jù)索引對數(shù)據(jù)進行一定的排序、分類處理,使處理時能夠在最短的時 間內(nèi)得到需要的數(shù)據(jù)。
3) 掃描所述網(wǎng)頁面上所有的點擊數(shù)據(jù),獲得該頁面不同區(qū)域的平均點擊數(shù)。
4) 根據(jù)公式H (x, y) =Sum (x-n, y-n, x+n, y+n) /n4十算該頁面各熱點的絕對平 均熱度,根據(jù)公式h(x,y)=H(l..n, 1…m)/Max(H(l…n), (l...m))計算該熱點的 相對平均熱度。
公式中的字母 x, y坐標值(像素); n區(qū)域尺寸(像素); H(x, y)某點的熱度值;
Sum(l,t,r,b)耳又得以l,t左上角坐標,以r, b為右下角坐標舉行范圍內(nèi)點
擊數(shù)的和;
n2:區(qū)i或的面積。
5) 根據(jù)每個點的相對平均熱度使用公式
C (x, y) =RGB {h (x, y) x 255, h (x, y) x 255, h (x, y) x 255} 計算出該點對應的索引色值,得到熱點數(shù)據(jù)索引圖。6) 使用調(diào)色盤將索引圖從索引模式轉(zhuǎn)換到RGB模式。
因為索引圖只是為了能夠?qū)ο嗷ブ丿B的點進行合并,而不會相互覆蓋而使
用的圖像模式,其圖像不是人類直接可讀的,所以必須轉(zhuǎn)變?yōu)槿祟惪勺x的RGB 圖片(普通彩色圖片)。
7) 對RGB圖像進行銳化處理,生成原始熱點圖。銳化處理是圖像處理的標 準形式,可以使圖片中的各個圖像元素的邊緣更加清晰。
8) 將生成的原始熱點圖合并到頁面截圖上,從而獲得最終的網(wǎng)站熱點圖。 獲得的網(wǎng)站熱點圖可以作為網(wǎng)頁提供商或廣告商的客戶分析的依據(jù)。
權利要求
1. 一種動態(tài)熱點跟蹤的方法,所述的方法使用互聯(lián)網(wǎng)、提供網(wǎng)頁服務的網(wǎng)站、瀏覽網(wǎng)頁的用戶終端、分析系統(tǒng),其特征在于,所述方法的運行步驟如下用戶在用戶終端鏈接網(wǎng)站的網(wǎng)頁;網(wǎng)站向用戶傳送網(wǎng)頁時傳送數(shù)據(jù)收集器;數(shù)據(jù)收集器向分析系統(tǒng)傳輸首次訪問數(shù)據(jù),建立新用戶檔案;分析系統(tǒng)接收數(shù)據(jù)并建立所述用戶的用戶模型;獲取用戶正在訪問的網(wǎng)頁頁面截圖;用戶瀏覽網(wǎng)頁,對頁面上的多個鏈接或圖片進行點擊;所述的數(shù)據(jù)收集器傳輸點擊數(shù)據(jù),包括鼠標點擊位置、點擊順序、訪問內(nèi)容、頁面停留時間;分析系統(tǒng)接收數(shù)據(jù),根據(jù)用戶的點擊位置、點擊順序、訪問內(nèi)容、頁面停留時間分析所述用戶的來源和興趣類型;根據(jù)來源、興趣類型分析用戶特征,包括性別、年齡范圍、愛好、習慣;重復多次數(shù)據(jù)收集和分析,生成網(wǎng)站熱點圖;開啟用戶動態(tài)跟蹤;用戶在用戶終端繼續(xù)訪問其他網(wǎng)站;數(shù)據(jù)收集器繼續(xù)傳輸用戶數(shù)據(jù);分析系統(tǒng)繼續(xù)分析用戶特征;根據(jù)分析的結(jié)果動態(tài)更新網(wǎng)站熱點圖的熱區(qū)變化。
2. 根據(jù)權利要求1所述的一種動態(tài)熱點跟蹤的方法,其特征在于,所述的 生成網(wǎng)站熱點圖過程包括以下子步驟1)用色階模式初始化一組顏色點陣,初始化索引調(diào)色盤;2) 對點擊數(shù)據(jù)進行預處理,包括有效性驗證、合并相近數(shù)據(jù)以及建立數(shù) 據(jù)索引;3) 掃描所述網(wǎng)頁面上所有的點擊數(shù)據(jù),獲得該頁面不同區(qū)域的平均點擊數(shù);4) 根據(jù)/>式H (x, y) =Sum (x-n, y-n, x+n, y+n) /n2計算該頁面各熱點的絕對平 均熱度,根據(jù)公式h(x, y)=H(l. .n, l...m)/Max (H (l...n) , (l...m))計算該熱點的相 對平均熱度;5) 根據(jù)每個點的相對平均熱度使用公式C(x, y)=RGB{h(x, y) x 255, h(x, y)x 255, h(x,y)x 255) 計算出該點對應的索引色值,得到熱點數(shù)據(jù)索引圖;6) 使用調(diào)色盤將索引圖從索引模式轉(zhuǎn)換到RGB模式;7) 對RGB圖像進行銳化處理,生成原始熱點圖;8) 將生成的原始熱點圖合并到頁面截圖上,從而獲得最終的網(wǎng)站熱點圖。
全文摘要
本發(fā)明涉及一種動態(tài)熱點跟蹤的方法,是一種電數(shù)字數(shù)據(jù)處理的方法。所述的方法的運行步驟包括用戶鏈接網(wǎng)站的網(wǎng)頁;傳送數(shù)據(jù)收集器;傳輸首次訪問數(shù)據(jù),建立新用戶檔案;建立用戶模型;獲取頁面截圖;用戶瀏覽網(wǎng)頁;傳輸點擊數(shù)據(jù);接收數(shù)據(jù),分析用戶的來源和興趣類型;分析用戶特征;生成網(wǎng)站熱點圖;開啟用戶動態(tài)跟蹤;用戶繼續(xù)訪問其他網(wǎng)站;繼續(xù)傳輸用戶數(shù)據(jù);繼續(xù)分析用戶特征;更新網(wǎng)站熱點圖的熱區(qū)變化。本發(fā)明通過在用戶網(wǎng)站上放置一個數(shù)據(jù)收集器,收集用戶在網(wǎng)站上鼠標行為。同時收集用戶訪問的來源網(wǎng)站、當前訪問的網(wǎng)頁內(nèi)容、用戶在該網(wǎng)頁上的停留時間即瀏覽路徑等,進行抽象整合,形成基于鼠標軌跡和點擊,以及用戶屬性的熱區(qū)圖。
文檔編號G06F17/30GK101446979SQ200810246709
公開日2009年6月3日 申請日期2008年12月26日 優(yōu)先權日2008年12月26日
發(fā)明者丹耀·克雷頓, 昆 趙, 趙武陽 申請人:北京科爾威視網(wǎng)絡科技有限公司