本發(fā)明涉及計算機技術領域,特別涉及一種基于大數(shù)據(jù)的分類用戶方法及裝置。
背景技術:
隨著互聯(lián)網(wǎng)技術的發(fā)展,越來越多的用戶通過各個網(wǎng)站獲取自己需要的數(shù)據(jù)資源,使得網(wǎng)站逐漸成為網(wǎng)絡與用戶之間溝通的橋梁。
目前,各個網(wǎng)站預先設定用戶模型,當用戶在網(wǎng)站中獲取資源時,網(wǎng)站將預設的用戶模型提供給用戶。且網(wǎng)站為各類用戶提供的模型均同為預定的用戶模型,用戶模型并未針對用戶種類的不同而變化。
可見,現(xiàn)有的方式,并未對針對不同的用戶提供不同的用戶模型,因此,用戶體驗較差。
技術實現(xiàn)要素:
本發(fā)明提供了一種基于大數(shù)據(jù)的分類用戶方法及裝置,可以提高用戶體驗。
第一方面,本發(fā)明提供了一種基于大數(shù)據(jù)的分類用戶方法,該方法包括:
獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù);
通過預先設定的數(shù)據(jù)處理規(guī)則對各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫;
獲取外部輸入的維度;
根據(jù)所述維度以及所述信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將所述維度與所述信息庫中的各個所述待分類用戶進行關聯(lián);
利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類。
優(yōu)選地,
所述獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù),包括:
獲取所述至少兩個待分類用戶的訪問權限;
根據(jù)所述訪問權限,獲取所述至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。
優(yōu)選地,
所述通過預先設定的數(shù)據(jù)處理規(guī)則對各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫,包括:
確定所述用戶網(wǎng)絡行為數(shù)據(jù)對應的至少一個處理參數(shù),以及確定至少一個條件參數(shù);其中,所述處理參數(shù)包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài)中的任意一種或多種;所述數(shù)據(jù)長度對應的條件參數(shù)為長度閾值、所述合法狀態(tài)對應的條件參數(shù)為非法字符串、所述格式狀態(tài)對應的條件參數(shù)為預設格式、所述重復狀態(tài)對應的條件參數(shù)為標題字符串;
針對于每一個所述用戶網(wǎng)絡行為數(shù)據(jù)均執(zhí)行:在所述用戶網(wǎng)絡行為數(shù)據(jù)中抽取每一個所述處理參數(shù)對應的目標數(shù)據(jù);針對于每一個所述處理參數(shù)均執(zhí)行:比較當前所述處理參數(shù)對應的所述目標數(shù)據(jù)和所述條件參數(shù),根據(jù)比較結果,得到處理后的所述用戶網(wǎng)絡行為數(shù)據(jù);
利用處理后的各個所述用戶網(wǎng)絡行為數(shù)據(jù),形成所述信息庫。
優(yōu)選地,
所述利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類,包括:
確定所述維度對應的至少一個層級;
確定與所述維度關聯(lián)的每一個所述待分類用戶對應的層級;
將每一個所述待分類用戶分類到自身對應的層級。
優(yōu)選地,
在所述利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類之后,進一步包括:
預先確定每一個所述層級對應的用戶模型;
針對每一個所述層級均執(zhí)行:確定當前所述層級對應的各個所述待分類用戶,將當前所述層級對應的用戶模型提供給確定的各個所述待分類用戶。
優(yōu)選地,
所述用戶網(wǎng)絡行為數(shù)據(jù),包括:鼠標點擊次數(shù)、鼠標點擊時間、鼠標停留位置、鼠標經(jīng)過位置、鼠標停留時間、訪問內(nèi)容、鍵盤錄入內(nèi)容中的至少一種或多種。
第二方面,本發(fā)明提供了一種基于大數(shù)據(jù)的分類用戶裝置,該裝置包括:
數(shù)據(jù)獲取單元,用于獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù);
形成單元,用于通過預先設定的數(shù)據(jù)處理規(guī)則對所述數(shù)據(jù)獲取單元獲取的各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫;
維度獲取單元,用于獲取外部輸入的維度;
關聯(lián)單元,用于根據(jù)所述維度獲取單元獲取的所述維度以及所述信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將所述維度與所述信息庫中的各個所述待分類用戶進行關聯(lián);
分類單元,用于利用所述關聯(lián)單元關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類。
優(yōu)選地,
所述數(shù)據(jù)獲取單元,包括:權限獲取子單元和數(shù)據(jù)獲取子單元;
所述權限獲取子單元,用于獲取所述至少兩個待分類用戶的訪問權限;
所述數(shù)據(jù)獲取子單元,用于根據(jù)所述權限獲取子單元獲取的所述訪問權限,獲取所述至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。
優(yōu)選地,
所述形成單元,包括:確定子單元和形成子單元;
所述確定子單元,用于確定所述用戶網(wǎng)絡行為數(shù)據(jù)對應的至少一個處理參數(shù),以及確定至少一個條件參數(shù);其中,所述處理參數(shù)包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài)中的任意一種或多種;所述數(shù)據(jù)長度對應的條件參數(shù)為長度閾值、所述合法狀態(tài)對應的條件參數(shù)為非法字符串、所述格式狀態(tài)對應的條件參數(shù)為預設格式、所述重復狀態(tài)對應的條件參數(shù)為標題字符串;
所述形成子單元,用于針對于每一個所述用戶網(wǎng)絡行為數(shù)據(jù)均執(zhí)行:在所述用戶網(wǎng)絡行為數(shù)據(jù)中抽取每一個所述處理參數(shù)對應的目標數(shù)據(jù);針對于每一個所述處理參數(shù)均執(zhí)行:比較當前所述處理參數(shù)對應的所述目標數(shù)據(jù)和所述條件參數(shù),根據(jù)比較結果,得到處理后的所述用戶網(wǎng)絡行為數(shù)據(jù);利用處理后的各個所述用戶網(wǎng)絡行為數(shù)據(jù),形成所述信息庫。
優(yōu)選地,
所述分類單元,包括:層級確定子單元和分類子單元;
所述層級確定子單元,用于確定所述維度對應的至少一個層級;
所述分類子單元,用于確定與所述維度關聯(lián)的每一個所述待分類用戶對應的層級;將每一個所述待分類用戶分類到自身對應的層級。
優(yōu)選地,
進一步包括:模型提供單元;
所述模型提供單元,用于提供確定每一個所述層級制定對應的用戶模型;針對每一個所述層級均執(zhí)行:確定當前所述層級對應的各個所述待分類用戶,將當前所述層級對應的用戶模型提供給確定的各個所述待分類用戶。
本發(fā)明實施例提供了一種基于大數(shù)據(jù)的分類用戶方法及裝置,獲取兩個或兩個以上的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù),然后通過預設的數(shù)據(jù)處理規(guī)則對獲取的各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫。根據(jù)獲取的維度以及形成的信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。再利用關聯(lián)后的維度和各個待分類用戶,對各個待分類用戶進行分類。通過上述可知,本方案中可以根據(jù)獲取的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)以及維度,對各個待分類用戶進行分類,以可以根據(jù)不同類用戶提供不同的用戶模型。因此,本方案提供的方案可以提高用戶體驗。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一個實施例提供的一種基于大數(shù)據(jù)的分類用戶方法的流程圖;
圖2是本發(fā)明另一個實施例提供的一種基于大數(shù)據(jù)的分類用戶方法的流程圖;
圖3是本發(fā)明一個實施例提供的一種基于大數(shù)據(jù)的分類用戶裝置所在設備的一種硬件結構圖;
圖4是本發(fā)明一個實施例提供的一種基于大數(shù)據(jù)的分類用戶裝置的結構示意圖;
圖5是本發(fā)明一個實施例提供的一種包括權限獲取子單元和數(shù)據(jù)獲取子單元的基于大數(shù)據(jù)的分類用戶裝置的結構示意圖;
圖6是本發(fā)明一個實施例提供的一種包括確定子單元和形成子單元的基于大數(shù)據(jù)的分類用戶裝置的結構示意圖;
圖7是本發(fā)明一個實施例提供的一種包括層級確定子單元和分類子單元的基于大數(shù)據(jù)的分類用戶裝置的結構示意圖;
圖8是本發(fā)明一個實施例提供的一種包括模型提供單元的基于大數(shù)據(jù)的分類用戶裝置的結構示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
如圖1所示,本發(fā)明實施例提供了一種基于大數(shù)據(jù)的分類用戶方法,該方法可以包括以下步驟:
步驟101:獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù);
步驟102:通過預先設定的數(shù)據(jù)處理規(guī)則對各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫;
步驟103:獲取外部輸入的維度;
步驟104:根據(jù)所述維度以及所述信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將所述維度與所述信息庫中的各個所述待分類用戶進行關聯(lián);
步驟105:利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類。
根據(jù)圖1所示的實施例,獲取兩個或兩個以上的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù),然后通過預設的數(shù)據(jù)處理規(guī)則對獲取的各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫。根據(jù)獲取的維度以及形成的信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。再利用關聯(lián)后的維度和各個待分類用戶,對各個待分類用戶進行分類。通過上述可知,本方案中可以根據(jù)獲取的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)以及維度,對各個待分類用戶進行分類,以可以根據(jù)不同類用戶提供不同的用戶模型。因此,本方案提供的實施例可以提高用戶體驗。
在本發(fā)明一個實施例中,在上述圖1所示流程圖中所涉及的用戶網(wǎng)絡行為數(shù)據(jù),包括:鼠標點擊次數(shù)、鼠標點擊時間、鼠標停留位置、鼠標經(jīng)過位置、鼠標停留時間、訪問內(nèi)容、鍵盤錄入內(nèi)容中的至少一種或多種。
在本實施例中,用戶網(wǎng)絡行為數(shù)據(jù)包括的具體內(nèi)容可以根據(jù)業(yè)務要求確定。鼠標點擊次數(shù)、鼠標點擊時間、鼠標停留位置、鼠標經(jīng)過位置、鼠標停留時間、訪問內(nèi)容、鍵盤錄入內(nèi)容只是優(yōu)選的內(nèi)容,還可以根據(jù)業(yè)務要求選擇其他的內(nèi)容。
在本實施例中,鼠標點擊次數(shù)為用戶在使用網(wǎng)站時,在網(wǎng)站中總計的點擊次數(shù)。鼠標點擊時間為用戶在使用網(wǎng)站時,在網(wǎng)站中使用鼠標點擊的總計時間。鼠標停留位置為用戶在使用網(wǎng)站中的最后停留位置。鼠標經(jīng)過位置為用戶在使用網(wǎng)站時在網(wǎng)站中經(jīng)過的各個位置。鼠標停留時間為用戶在使用網(wǎng)站時在網(wǎng)站各個位置對應的停留時間。訪問內(nèi)容為用戶在使用網(wǎng)站時訪問的內(nèi)容。鍵盤錄入內(nèi)容為用戶在使用網(wǎng)站時,在網(wǎng)站中使用鍵盤錄入的內(nèi)容。
根據(jù)上述實施例,可以根據(jù)業(yè)務要求確定用戶網(wǎng)絡行為數(shù)據(jù)選擇鼠標點擊次數(shù)、鼠標點擊時間、鼠標停留位置、鼠標經(jīng)過位置、鼠標停留時間、訪問內(nèi)容、鍵盤錄入內(nèi)容中的至少一種或多種。因此業(yè)務適用性較強。
在本發(fā)明一個實施例中,上述圖1所示流程圖中步驟101獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù),可以包括:
獲取所述至少兩個待分類用戶的訪問權限;
根據(jù)所述訪問權限,獲取所述至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,在獲取各個待分類用戶對應的用戶網(wǎng)絡行為數(shù)據(jù)之間前,需要獲取各個待分類用戶的訪問權限,以根據(jù)訪問權限來獲取用戶網(wǎng)絡行為數(shù)據(jù)。如果沒有獲取待分類用戶的訪問權限時,是無法獲取待分類用戶對應的用戶網(wǎng)絡行為數(shù)據(jù)的,即使獲取了也是屬于非法獲取。
在本實施例中,獲取各個待分類用戶對應的用戶網(wǎng)絡行為數(shù)據(jù)的方法可以根據(jù)業(yè)務要求確定。比如可以采用javascript獲取。
在本實施例中,比如獲取了待分類用戶a的訪問權限。則在獲取待分類用戶a對應的用戶網(wǎng)絡行為數(shù)據(jù)時,可以根據(jù)獲取的訪問權限進行用戶網(wǎng)絡行為數(shù)據(jù)的獲取。
根據(jù)上述實施例,在獲取各個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)時,首先要獲取各個待分類用戶的訪問權限,然后根據(jù)訪問權限,獲取各個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。由于用戶網(wǎng)絡行為數(shù)據(jù)獲取是在獲得訪問權限的條件進行的,因此用戶網(wǎng)絡行為數(shù)據(jù)獲取的合法性較高。
在本發(fā)明一個實施例中,上述圖1所示流程圖中步驟102通過預先設定的數(shù)據(jù)處理規(guī)則對各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫,可以包括:
確定所述用戶網(wǎng)絡行為數(shù)據(jù)對應的至少一個處理參數(shù),以及確定至少一個條件參數(shù);其中,所述處理參數(shù)包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài)中的任意一種或多種;所述數(shù)據(jù)長度對應的條件參數(shù)為長度閾值、所述合法狀態(tài)對應的條件參數(shù)為非法字符串、所述格式狀態(tài)對應的條件參數(shù)為預設格式、所述重復狀態(tài)對應的條件參數(shù)為標題字符串;
針對于每一個所述用戶網(wǎng)絡行為數(shù)據(jù)均執(zhí)行:在所述用戶網(wǎng)絡行為數(shù)據(jù)中抽取每一個所述處理參數(shù)對應的目標數(shù)據(jù);針對于每一個所述處理參數(shù)均執(zhí)行:比較當前所述處理參數(shù)對應的所述目標數(shù)據(jù)和所述條件參數(shù),根據(jù)比較結果,得到處理后的所述用戶網(wǎng)絡行為數(shù)據(jù);
利用處理后的各個所述用戶網(wǎng)絡行為數(shù)據(jù),形成所述信息庫。
在本實施例中,處理參數(shù)和條件參數(shù)的具體型式均可以根據(jù)業(yè)務要求確定。需要注意的是,在確定時處理參數(shù)要與條件參數(shù)一一對應。處理參數(shù)可以包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài)中的任意一種或多種只是優(yōu)選的方式,還可以根據(jù)業(yè)務要求進行相應的增加和修改。
在本實施例中,對各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理采用的程序可以根據(jù)業(yè)務要求確定,比如可以通過java進行。
在本實施例中,當處理參數(shù)包括數(shù)據(jù)長度時,確定的條件參數(shù)為長度閾值,比較當前處理參數(shù)對應的目標數(shù)據(jù)和條件參數(shù),根據(jù)比較結果,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù),包括:比較數(shù)據(jù)長度對應的長度閾值與目標數(shù)據(jù),當目標數(shù)據(jù)大于長度閾值時,按照長度閾值拆分用戶網(wǎng)絡行為數(shù)據(jù),待拆分完成后得到處理后的用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,當處理參數(shù)包括合法情況時,確定的條件參數(shù)為非法字符串,比較當前處理參數(shù)對應的目標數(shù)據(jù)和條件參數(shù),根據(jù)比較結果,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù),包括:比較合法情況對應的非法字符串與目標數(shù)據(jù),當目標數(shù)據(jù)中所述非法字符串時,將包括非法字符串的目標數(shù)據(jù)過濾掉,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,當處理參數(shù)包括格式狀態(tài)時,確定的條件參數(shù)為預設格式,比較當前處理參數(shù)對應的目標數(shù)據(jù)和條件參數(shù),根據(jù)比較結果,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù),包括:比較格式狀態(tài)對應的預設格式與目標數(shù)據(jù),當目標數(shù)據(jù)與預設格式不一致時,將目標數(shù)據(jù)過濾掉,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,當處理參數(shù)包括重復狀態(tài)時,確定的條件參數(shù)為標題字符串,比較當前處理參數(shù)對應的目標數(shù)據(jù)和條件參數(shù),根據(jù)比較結果,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù),包括:比較重復狀態(tài)對應的標題字符串與目標數(shù)據(jù),當目標數(shù)據(jù)與標題字符串一致時,將目標數(shù)據(jù)過濾掉,得到處理后的用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,當對各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理之后,利用處理之后的各個用戶網(wǎng)絡行為數(shù)據(jù)形成信息庫。形成信息庫的方法可以根據(jù)業(yè)務要求確定,比如可以通過oracle形成數(shù)據(jù)庫。
根據(jù)上述實施例,利用各個處理參數(shù)和各個條件參數(shù)對各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,以去除各個用戶網(wǎng)絡行為數(shù)據(jù)中的無效數(shù)據(jù)。然后利用處理后的各個用戶網(wǎng)絡行為數(shù)據(jù)形成信息庫。由于信息庫中的各個用戶網(wǎng)絡行為數(shù)據(jù)均為處理后的數(shù)據(jù),因此,信息庫中的各個數(shù)據(jù)較為準確。
在本發(fā)明一個實施例中,上述圖1所示流程圖中步驟105利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類,可以包括:
確定所述維度對應的至少一個層級;
確定與所述維度關聯(lián)的每一個所述待分類用戶對應的層級;
將每一個所述待分類用戶分類到自身對應的層級。
在本實施例中,維度的種類可以根據(jù)業(yè)務要求確定。比如維度可以是年齡、地域、職業(yè)等。另外,維度對應層級的數(shù)量和范圍均可以根據(jù)業(yè)務要求確定。比如當維度為年齡時,可以確定年齡對應3個層級,分別為層級一:1歲到20歲、層級二:21歲到50歲、層級三:51歲到100歲。又如當維度為地域時,可以確定地域對應3個層級,分別為層級一:一線城市、層級二:二線城市、層級三:三線城市。
在本實施例中,比如確定維度年齡對應的層級分別為層級一:1歲到20歲、層級二:21歲到50歲、層級三:51歲到100歲。確定與年齡關聯(lián)的待分類用戶a對應的層級為層級一、待分類用戶b對應的層級為層級二、待分類用戶c對應的層級為層級三。則將待分類用戶a分類到層級一、待分類用戶b分類到層級二、待分類用戶c分類到層級三。
根據(jù)上述實施例,通過確定維度對應的各個層級,然后確定各個待分類用戶分別對應的層級,將各個待分類用戶分類到其自身對應的層級中。由于用戶的分類根據(jù)各個待分類用戶自身對應的層級確定,因此待分類用戶分類較為準確。
在本發(fā)明一個實施例中,在上述圖1所示流程圖步驟105利用關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類之后,可以進一步包括:
預先確定每一個所述層級對應的用戶模型;
針對每一個所述層級均執(zhí)行:確定當前所述層級對應的各個所述待分類用戶,將當前所述層級對應的用戶模型提供給確定的各個所述待分類用戶。
在本實施例中,每一個層級對應的用戶模型均可以根據(jù)業(yè)務要求確定。比如當維度為年齡時,對應的層級分別為層級一:1歲到20歲、層級二:21歲到50歲、層級三:51歲到100歲??梢灾贫▽蛹壱粚挠脩裟P头?歲到20歲用戶的需求,比如網(wǎng)站顏色為鮮艷的顏色;制定層級二對應的用戶模型符合21歲到50歲用戶的需求,比如網(wǎng)站顏色為可以減少視覺疲勞的豆綠色;制定層級三對應的用戶模型符合51歲到100歲用戶的需求,比如網(wǎng)站字體為大號字體。
在本實施例中,比如確定層級一對應的用戶為待分類用戶a、待分類用戶b以及待分類用戶c。則將層級一對應的用戶模型1提供給待分類用戶a、待分類用戶b以及待分類用戶c,以使待分類用戶a、待分類用戶b以及待分類用戶c在用戶模型1下使用網(wǎng)站。
根據(jù)上述實施例,預先確定各個層級對應的用戶模型,然后確定各個層級分別對應的各個待分類用戶,并將每一個層級對應的用戶模型提供給該層級對應的各個待分類用戶。由于每一個待分類用戶使用其所在層級對應的用戶模型,因此用戶體驗較佳。
下面以對網(wǎng)站a的用戶進行分類為例。展開說明基于大數(shù)據(jù)的分類用戶方法,如圖2所示,該基于大數(shù)據(jù)的分類用戶方法可以包括如下步驟:
步驟201:獲取至少兩個待分類用戶的訪問權限。
在本步驟中,獲取待分類用戶a和待分類用戶b的訪問權限。
步驟202:根據(jù)訪問權限,獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。
在本步驟中,根據(jù)步驟201中獲取的訪問權限,獲取待分類用戶a訪問網(wǎng)站a對應的用戶網(wǎng)絡行為數(shù)據(jù)1以及獲取待分類用戶b訪問網(wǎng)站b對應的用戶網(wǎng)絡行為數(shù)據(jù)2。
步驟203:確定用戶網(wǎng)絡行為數(shù)據(jù)對應的至少一個處理參數(shù),以及確定至少一個條件參數(shù)。
在本實施例中,確定處理參數(shù)包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài);數(shù)據(jù)長度對應的條件參數(shù)為長度閾值、合法狀態(tài)對應的條件參數(shù)為非法字符串、格式狀態(tài)對應的條件參數(shù)為預設格式、重復狀態(tài)對應的條件參數(shù)為標題字符串。
步驟204:依次在各個用戶網(wǎng)絡行為數(shù)據(jù)中,選擇一個用戶網(wǎng)絡行為數(shù)據(jù)作為當前用戶網(wǎng)絡行為數(shù)據(jù)。
步驟205:在當前用戶網(wǎng)絡行為數(shù)據(jù)中抽取每一個處理參數(shù)對應的目標數(shù)據(jù)。
在本步驟中,以待分類用戶a對應的用戶網(wǎng)絡行為數(shù)據(jù)為當前用戶網(wǎng)絡行為數(shù)據(jù)為例進行說明。比如抽取數(shù)據(jù)長度為30mb。
步驟206:針對于每一個處理參數(shù)均執(zhí)行:比較當前處理參數(shù)對應的目標數(shù)據(jù)和條件參數(shù),根據(jù)比較結果,得到處理后的當前用戶網(wǎng)絡行為數(shù)據(jù)。
在本實施例中,以待分類用戶a對應的用戶網(wǎng)絡行為數(shù)據(jù)為當前用戶網(wǎng)絡行為數(shù)據(jù)為例進行說明。比如比較數(shù)據(jù)長度對應的長度閾值15mb與目標數(shù)據(jù)30mb,可見當目標數(shù)據(jù)30mb大于長度閾值15mb,按照長度閾值15mb拆分用戶網(wǎng)絡行為數(shù)據(jù)1,待拆分完成后得到處理后的用戶網(wǎng)絡行為數(shù)據(jù)1。
步驟207:判斷當前用戶網(wǎng)絡行為數(shù)據(jù)是否為最后一個網(wǎng)絡行為數(shù)據(jù),如果是,執(zhí)行步驟208,否則,執(zhí)行步驟204。
步驟208:利用處理后的各個用戶網(wǎng)絡行為數(shù)據(jù),形成信息庫。
步驟209:獲取外部輸入的維度。
在本實施例中,比如獲取的維度為年齡。
步驟210:根據(jù)維度以及信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。
在本步驟中,將信息庫中各個待分類用戶中關于年齡的數(shù)據(jù)與年齡維度進行關聯(lián)。
步驟211:確定維度對應的至少一個層級。
在本步驟中,確定年齡對應3個層級,分別為層級一:1歲到20歲、層級二:21歲到50歲、層級三:51歲到100歲。
步驟212:確定與維度關聯(lián)的每一個待分類用戶對應的層級。
在本步驟中,確定待分類用戶a為層級一、待分類用戶b為層級二。
步驟213:將每一個待分類用戶分類到自身對應的層級。
在本步驟中,將待分類用戶a分類到層級一以及將待分類用戶b分類到層級二。
步驟214:確定每一個層級制定對應的用戶模型。
在本步驟中,確定層級一對應的用戶模型為用戶模型1、確定層級二對應的用戶模型為用戶模型2。
步驟215:依次在各個層級中,選擇一個層級作為當前層級。
步驟216:確定當前層級對應的各個待分類用戶,將當前層級對應的用戶模型提供給確定的各個待分類用戶。
在本步驟中,當當前層級為層級一時,確定對應的待分類用戶為待分類用戶a,則將用戶模型1提供給待分類用戶a。
在本步驟中,當當前層級為層級二時,確定對應的待分類用戶為待分類用戶b,則將用戶模型2提供給待分類用戶b。
步驟217:判斷當前層級是否為最后一個層級,如果是,結束當前流程,否則,執(zhí)行步驟215。
如圖3、圖4所示,本發(fā)明實施例提供了一種基于大數(shù)據(jù)的分類用戶裝置。裝置實施例可以通過軟件實現(xiàn),也可以通過硬件或者軟硬件結合的方式實現(xiàn)。從硬件層面而言,如圖3所示,為本發(fā)明實施例提供的基于大數(shù)據(jù)的分類用戶裝置所在設備的一種硬件結構圖,除了圖3所示的處理器、內(nèi)存、網(wǎng)絡接口、以及非易失性存儲器之外,實施例中裝置所在的設備通常還可以包括其他硬件,如負責處理報文的轉發(fā)芯片等等。以軟件實現(xiàn)為例,如圖4所示,作為一個邏輯意義上的裝置,是通過其所在設備的cpu將非易失性存儲器中對應的計算機程序指令讀取到內(nèi)存中運行形成的。本實施例提供的基于大數(shù)據(jù)的分類用戶裝置,包括:
數(shù)據(jù)獲取單元401,用于獲取至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù);
形成單元402,用于通過預先設定的數(shù)據(jù)處理規(guī)則對所述數(shù)據(jù)獲取單元401獲取的各個所述用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫;
維度獲取單元403,用于獲取外部輸入的維度;
關聯(lián)單元404,用于根據(jù)所述維度獲取單元403獲取的所述維度以及所述信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將所述維度與所述信息庫中的各個所述待分類用戶進行關聯(lián);
分類單元405,用于利用所述關聯(lián)單元404關聯(lián)后的所述維度和各個所述待分類用戶,對各個所述待分類用戶進行分類。
根據(jù)如圖4所示的實施例,利用形成單元通過預先設定的數(shù)據(jù)處理規(guī)則對數(shù)據(jù)獲取單元獲取的各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫。然后利用關聯(lián)單元根據(jù)維度獲取單元獲取的維度以及信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。然后分類單元再利用關聯(lián)單元關聯(lián)后的維度和各個待分類用戶,對各個待分類用戶進行分類。通過上述可知,本方案中可以根據(jù)獲取的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)以及維度,對各個待分類用戶進行分類,以可以根據(jù)不同類用戶提供不同的用戶模型。因此,本方案提供的實施例可以提高用戶體驗。
在本發(fā)明一個實施例中,如圖5所示,所述數(shù)據(jù)獲取單元401可以包括:權限獲取子單元501和數(shù)據(jù)獲取子單元502;
所述權限獲取子單元501,用于獲取所述至少兩個待分類用戶的訪問權限;
所述數(shù)據(jù)獲取子單元502,用于根據(jù)所述權限獲取子單元501獲取的所述訪問權限,獲取所述至少兩個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。
在本發(fā)明一個實施例中,如圖6所示,所述形成單元402可以包括:確定子單元601和形成子單元602;
所述確定子單元601,用于確定所述用戶網(wǎng)絡行為數(shù)據(jù)對應的至少一個處理參數(shù),以及確定至少一個條件參數(shù);其中,所述處理參數(shù)包括:數(shù)據(jù)長度、合法狀態(tài)、格式狀態(tài)、重復狀態(tài)中的任意一種或多種;所述數(shù)據(jù)長度對應的條件參數(shù)為長度閾值、所述合法狀態(tài)對應的條件參數(shù)為非法字符串、所述格式狀態(tài)對應的條件參數(shù)為預設格式、所述重復狀態(tài)對應的條件參數(shù)為標題字符串;
所述形成子單元602,用于針對于每一個所述用戶網(wǎng)絡行為數(shù)據(jù)均執(zhí)行:在所述用戶網(wǎng)絡行為數(shù)據(jù)中抽取每一個所述處理參數(shù)對應的目標數(shù)據(jù);針對于每一個所述處理參數(shù)均執(zhí)行:比較當前所述處理參數(shù)對應的所述目標數(shù)據(jù)和所述條件參數(shù),根據(jù)比較結果,得到處理后的所述用戶網(wǎng)絡行為數(shù)據(jù);利用處理后的各個所述用戶網(wǎng)絡行為數(shù)據(jù),形成所述信息庫。
在本發(fā)明一個實施例中,如圖7所示,所述分類單元405可以包括:層級確定子單元701和分類子單元702;
所述層級確定子單元701,用于確定所述維度對應的至少一個層級;
所述分類子單元702,用于確定與所述維度關聯(lián)的每一個所述待分類用戶對應的層級;將每一個所述待分類用戶分類到自身對應的層級。
在本發(fā)明一個實施例中,如圖8所示,基于大數(shù)據(jù)的分類用戶裝置可以進一步包括:模型提供單元801;
所述模型提供單元801,用于預先確定每一個所述層級對應的用戶模型;針對每一個所述層級均執(zhí)行:確定當前所述層級對應的各個所述待分類用戶,將當前所述層級對應的用戶模型提供給確定的各個所述待分類用戶。
上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與本發(fā)明方法實施例基于同一構思,具體內(nèi)容可參見本發(fā)明方法實施例中的敘述,此處不再贅述。
綜上所述,本發(fā)明各個實施例至少可以實現(xiàn)如下有益效果:
1、在本發(fā)明實施例中,獲取兩個或兩個以上的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù),然后通過預設的數(shù)據(jù)處理規(guī)則對獲取的各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫。根據(jù)獲取的維度以及形成的信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。再利用關聯(lián)后的維度和各個待分類用戶,對各個待分類用戶進行分類。通過上述可知,本方案中可以根據(jù)獲取的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)以及維度,對各個待分類用戶進行分類,以可以根據(jù)不同類用戶提供不同的用戶模型。因此,本方案提供的實施例可以提高用戶體驗。
2、在本發(fā)明實施例中,可以根據(jù)業(yè)務要求確定用戶網(wǎng)絡行為數(shù)據(jù)選擇鼠標點擊次數(shù)、鼠標點擊時間、鼠標停留位置、鼠標經(jīng)過位置、鼠標停留時間、訪問內(nèi)容、鍵盤錄入內(nèi)容中的至少一種或多種。因此業(yè)務適用性較強。
3、在本發(fā)明實施例中,在獲取各個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)時,首先要獲取各個待分類用戶的訪問權限,然后根據(jù)訪問權限,獲取各個待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)。由于用戶網(wǎng)絡行為數(shù)據(jù)獲取是在獲得訪問權限的條件進行的,因此用戶網(wǎng)絡行為數(shù)據(jù)獲取的合法性較高。
4、在本發(fā)明實施例中,利用各個處理參數(shù)和各個條件參數(shù)對各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,以去除各個用戶網(wǎng)絡行為數(shù)據(jù)中的無效數(shù)據(jù)。然后利用處理后的各個用戶網(wǎng)絡行為數(shù)據(jù)形成信息庫。由于信息庫中的各個用戶網(wǎng)絡行為數(shù)據(jù)均為處理后的數(shù)據(jù),因此,信息庫中的各個數(shù)據(jù)較為準確。
5、在本發(fā)明實施例中,通過確定維度對應的各個層級,然后確定各個待分類用戶分別對應的層級,將各個待分類用戶分類到其自身對應的層級中。由于用戶的分類根據(jù)各個待分類用戶自身對應的層級確定,因此待分類用戶分類較為準確。
6、在本發(fā)明實施例中,預先確定各個層級對應的用戶模型,然后確定各個層級分別對應的各個待分類用戶,并將每一個層級對應的用戶模型提供給該層級對應的各個待分類用戶。由于每一個待分類用戶使用其所在層級對應的用戶模型,因此用戶體驗較佳。
7、在本發(fā)明實施例中,利用形成單元通過預先設定的數(shù)據(jù)處理規(guī)則對數(shù)據(jù)獲取單元獲取的各個用戶網(wǎng)絡行為數(shù)據(jù)進行處理,形成信息庫。然后
利用關聯(lián)單元根據(jù)維度獲取單元獲取的維度以及信息庫中各個用戶網(wǎng)絡行為數(shù)據(jù),將維度與信息庫中的各個待分類用戶進行關聯(lián)。然后分類單元再利用關聯(lián)單元關聯(lián)后的維度和各個待分類用戶,對各個待分類用戶進行分類。通過上述可知,本方案中可以根據(jù)獲取的待分類用戶分別對應的用戶網(wǎng)絡行為數(shù)據(jù)以及維度,對各個待分類用戶進行分類,以可以根據(jù)不同類用戶提供不同的用戶模型。因此,本方案提供的實施例可以提高用戶體驗。
需要說明的是,在本文中,諸如第一和第二之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個······”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同因素。
本領域普通技術人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲在計算機可讀取的存儲介質中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質包括:rom、ram、磁碟或者光盤等各種可以存儲程序代碼的介質中。
最后需要說明的是:以上所述僅為本發(fā)明的較佳實施例,僅用于說明本發(fā)明的技術方案,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。