本發(fā)明涉及移動(dòng)上網(wǎng)數(shù)據(jù)分析領(lǐng)域,具體而言,涉及一種移動(dòng)上網(wǎng)用戶分類方法及裝置。
背景技術(shù):
移動(dòng)上網(wǎng)數(shù)據(jù)是體現(xiàn)用戶屬性的重要數(shù)據(jù),其中包含用戶的終端、消費(fèi)能力、位置信息、上網(wǎng)業(yè)務(wù)偏好等營(yíng)銷關(guān)鍵信息,通過運(yùn)營(yíng)商自有業(yè)務(wù)與用戶屬性進(jìn)行匹配,篩選出目標(biāo)營(yíng)銷用戶,可以幫助運(yùn)營(yíng)商進(jìn)行業(yè)務(wù)、產(chǎn)品進(jìn)行精確匹配,精選運(yùn)營(yíng)渠道,實(shí)現(xiàn)運(yùn)營(yíng)商端到端業(yè)務(wù)內(nèi)容的精細(xì)化運(yùn)營(yíng)。
傳統(tǒng)的用戶分類方法中,對(duì)用戶數(shù)據(jù)的采集手段復(fù)雜,采集數(shù)據(jù)不全面,不能獲得用戶準(zhǔn)確的上網(wǎng)數(shù)據(jù),無法做到對(duì)用戶屬性的準(zhǔn)確定位。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)中的上述不足,本發(fā)明所要解決的技術(shù)問題是提供一種移動(dòng)上網(wǎng)用戶分類方法及裝置。
就方法而言,本發(fā)明提供了一種移動(dòng)上網(wǎng)用戶分類方法,應(yīng)用于與多個(gè)用戶終端數(shù)據(jù)及移動(dòng)上網(wǎng)服務(wù)的運(yùn)營(yíng)服務(wù)器連接的數(shù)據(jù)分析設(shè)備,所述方法包括:
從所述用戶終端獲取用戶的上網(wǎng)原始信令數(shù)據(jù)。
解析所述上網(wǎng)原始信令數(shù)據(jù),獲得用戶的上網(wǎng)行為,所述上網(wǎng)行為包括上網(wǎng)所用的終端、上網(wǎng)位置、上網(wǎng)所用應(yīng)用軟件、網(wǎng)頁操作行為類型、瀏覽內(nèi)容類型、聯(lián)網(wǎng)網(wǎng)絡(luò)類型或上網(wǎng)用戶身份。
根據(jù)用戶所述上網(wǎng)行為中打開的網(wǎng)站的歸屬領(lǐng)域、上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域、用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,得到該上網(wǎng)行為的分類標(biāo)簽。
通過網(wǎng)絡(luò)爬蟲爬取用戶在所述上網(wǎng)行為中打開網(wǎng)頁的內(nèi)容,獲取并保存所述網(wǎng)頁的內(nèi)容中與所述分類標(biāo)簽相關(guān)的數(shù)據(jù)信息。
統(tǒng)計(jì)指定時(shí)間段內(nèi)所述上網(wǎng)行為的分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,獲得上網(wǎng)行為統(tǒng)計(jì)結(jié)果,根據(jù)所述上網(wǎng)行為統(tǒng)計(jì)結(jié)果及用戶的個(gè)人信息,為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽,其中所述個(gè)人信息包括用戶的上網(wǎng)位置信息、用戶上網(wǎng)所用終端的設(shè)備信息及用戶注冊(cè)的身份信息。
進(jìn)一步地,在上述方法中,所述解析所述上網(wǎng)原始信令數(shù)據(jù),獲得用戶的執(zhí)行的上網(wǎng)行為的步驟包括:
采用深度包檢測(cè)技術(shù)對(duì)所述上網(wǎng)原始信令數(shù)據(jù)的進(jìn)行解析,獲得移動(dòng)終端用戶上網(wǎng)訪問的URL地址。
對(duì)所述URL地址進(jìn)行分類及深度分析,從所述URL地址獲得關(guān)鍵字段。
根據(jù)所述關(guān)鍵字段的內(nèi)容在預(yù)設(shè)的網(wǎng)頁內(nèi)容規(guī)則庫(kù)中匹配相應(yīng)的用戶操作或網(wǎng)頁內(nèi)容,對(duì)所述網(wǎng)頁內(nèi)容規(guī)則庫(kù)中包括所述用戶操作或網(wǎng)頁內(nèi)容與所述關(guān)鍵字段的對(duì)應(yīng)關(guān)系。
根據(jù)所述用戶操作或網(wǎng)頁內(nèi)容,結(jié)合所述上網(wǎng)原始信令數(shù)據(jù)中的用戶信息,獲得用戶的上網(wǎng)行為。
進(jìn)一步地,在上述方法中,根據(jù)用戶所述上網(wǎng)行為中打開的網(wǎng)站的歸屬領(lǐng)域、上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域、用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,得到該上網(wǎng)行為的分類標(biāo)簽的步驟包括:
根據(jù)所述上網(wǎng)行為中用戶打開的網(wǎng)站的歸屬領(lǐng)域或上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域,為該上網(wǎng)行為指定第一分類標(biāo)簽。
根據(jù)所述上網(wǎng)行為中用戶打開的網(wǎng)站子頁或應(yīng)用程序子頁,為該上網(wǎng)行為指定所述第一分類標(biāo)簽下的第二分類標(biāo)簽。
根據(jù)所述上網(wǎng)行為中用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,為該上網(wǎng)行為指定所述第二分類標(biāo)簽下的第三分類標(biāo)簽。
進(jìn)一步地,在上述方法中,所述用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為包括:
用戶輸入的文本和/或圖片信息。
用戶對(duì)網(wǎng)頁內(nèi)容的收藏或關(guān)注操作。
用戶對(duì)網(wǎng)頁文本或圖片或聲音或視頻的瀏覽操作。
用戶對(duì)網(wǎng)頁連接或網(wǎng)頁控件的操作。
進(jìn)一步地,在上述方法中,所述方法還包括:
根據(jù)所述用戶屬性標(biāo)簽為用戶推送相應(yīng)的服務(wù)或咨詢內(nèi)容。
就裝置而言,本發(fā)明提供一種移動(dòng)上網(wǎng)用戶分類裝置,所述裝置包括:
上網(wǎng)原始信令數(shù)據(jù)獲取模塊,用于從所述用戶終端獲取用戶的上網(wǎng)原始信令數(shù)據(jù)。
上網(wǎng)行為解析模塊,用于解析所述上網(wǎng)原始信令數(shù)據(jù),獲得用戶的上網(wǎng)行為,所述上網(wǎng)行為包括上網(wǎng)所用的終端、上網(wǎng)位置、上網(wǎng)所用應(yīng)用軟件、網(wǎng)頁操作行為類型、瀏覽內(nèi)容類型、聯(lián)網(wǎng)網(wǎng)絡(luò)類型或上網(wǎng)用戶身份。
分類標(biāo)簽指定模塊,用于根據(jù)用戶所述上網(wǎng)行為中打開的網(wǎng)站的歸屬領(lǐng)域、上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域、用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,得到該上網(wǎng)行為的分類標(biāo)簽。
具體瀏覽信息獲取模塊,用于通過網(wǎng)絡(luò)爬蟲爬取用戶所述上網(wǎng)行為中鏈接網(wǎng)頁中的具體數(shù)據(jù)信息,獲取并保存所述具體數(shù)據(jù)信息中與所述類標(biāo)簽相關(guān)的具體瀏覽信息。
用戶標(biāo)簽指定模塊,用于統(tǒng)計(jì)指定時(shí)間類用戶上網(wǎng)行為中的所述分類標(biāo)簽、具體瀏覽信息及用戶個(gè)人數(shù)據(jù),根據(jù)統(tǒng)計(jì)結(jié)果為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽。
進(jìn)一步地,在上述裝置中,所述上網(wǎng)行為解析模塊包括:
深度包檢測(cè)子模塊,用于采用深度包檢測(cè)技術(shù)對(duì)所述上網(wǎng)原始信令數(shù)據(jù)的進(jìn)行解析,獲得移動(dòng)終端用戶上網(wǎng)訪問的URL地址。
URL地址深度分析子模塊,用于對(duì)所述URL地址進(jìn)行分類及深度分析,從所述URL地址獲得關(guān)鍵字段。
網(wǎng)頁匹配子模塊,用于根據(jù)所述關(guān)鍵字段的內(nèi)容在預(yù)設(shè)的網(wǎng)頁內(nèi)容規(guī)則庫(kù)中匹配相應(yīng)的用戶操作或網(wǎng)頁內(nèi)容,對(duì)所述網(wǎng)頁內(nèi)容規(guī)則庫(kù)中包括所述用戶操作或網(wǎng)頁內(nèi)容與所述關(guān)鍵字段的對(duì)應(yīng)關(guān)系。
內(nèi)容分析子模塊,用于根據(jù)所述用戶操作或網(wǎng)頁內(nèi)容,結(jié)合所述上網(wǎng)原始信令數(shù)據(jù)中的用戶信息,獲得用戶的上網(wǎng)行為。
進(jìn)一步地,在上述裝置中,所述分類標(biāo)簽指定模塊包括:
第一分類標(biāo)簽指定子模塊,用于根據(jù)所述上網(wǎng)行為中用戶鏈接的網(wǎng)站或使用的應(yīng)用程序的歸屬領(lǐng)域,為該上網(wǎng)行為指定第一分類標(biāo)簽。
第二分類標(biāo)簽指定子模塊,用于根據(jù)所述上網(wǎng)行為中用戶鏈接的網(wǎng)站子頁或應(yīng)用程序子頁,為該上網(wǎng)行為指定所述第一分類標(biāo)簽下的第二分類標(biāo)簽。
第三分類標(biāo)簽指定子模塊,用于根據(jù)所述上網(wǎng)行為中用戶在網(wǎng)站或應(yīng)用程序中執(zhí)行的操作動(dòng)作,為該上網(wǎng)行為指定所述第二分類標(biāo)簽下的第三分類標(biāo)簽。
進(jìn)一步地,在上述裝置中,所述第三分類標(biāo)簽指定模塊中用戶在網(wǎng)站或應(yīng)用程序中執(zhí)行的操作動(dòng)作包括:
用戶輸入的文本和/或圖片信息。
用戶對(duì)網(wǎng)頁內(nèi)容的收藏或關(guān)注操作。
用戶對(duì)網(wǎng)頁文本或圖片或聲音或視頻的瀏覽操作。
用戶對(duì)網(wǎng)頁連接或網(wǎng)頁控件的操作。
進(jìn)一步地,在上述裝置中,所述裝置還包括:
推送模塊,用于根據(jù)所述用戶屬性標(biāo)簽為用戶推送相應(yīng)的服務(wù)或咨詢內(nèi)容。
相對(duì)于現(xiàn)有技術(shù)而言,本發(fā)明具有以下有益效果:
本發(fā)明提供的一種移動(dòng)上網(wǎng)用戶分類方法及裝置,通過對(duì)用戶所述上網(wǎng)原始信令數(shù)據(jù)的解析獲得用戶的所述上網(wǎng)行為,并根據(jù)用戶的所述上網(wǎng)行為獲得上網(wǎng)行為的分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,統(tǒng)計(jì)用戶所述分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,并結(jié)合用戶個(gè)人信息為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽。如此,對(duì)用戶上網(wǎng)數(shù)據(jù)的進(jìn)行全面地分析統(tǒng)計(jì),使得獲得的用戶屬性標(biāo)簽更加準(zhǔn)確客觀。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對(duì)范圍的限定,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1為本發(fā)明實(shí)施例提供的數(shù)據(jù)分析設(shè)備交互示意圖;
圖2為本發(fā)明實(shí)施例提供的數(shù)據(jù)分析設(shè)備結(jié)構(gòu)框圖;
圖3為本發(fā)明實(shí)施例提供的移動(dòng)上網(wǎng)用戶分類方法流程示意圖;
圖4為本發(fā)明步驟S120子步驟流程示意圖;
圖5為本發(fā)明步驟S130子步驟流程示意圖;
圖6為本發(fā)明實(shí)施例提供的移動(dòng)上網(wǎng)用戶分類裝置的一種結(jié)構(gòu)框圖;
圖7為本發(fā)明實(shí)施例提供的移動(dòng)上網(wǎng)用戶分類裝置的另一種結(jié)構(gòu)框圖。
圖標(biāo):100-數(shù)據(jù)分析設(shè)備;110-上網(wǎng)用戶分類裝置;111-上網(wǎng)原始信令數(shù)據(jù)獲取模塊;112-上網(wǎng)行為解析模塊;113-分類標(biāo)簽指定模塊;114-具體瀏覽信息獲取模塊;115-用戶標(biāo)簽指定模塊;116-推送模塊;120-存儲(chǔ)器;130-處理器;200-用戶終端;300-運(yùn)營(yíng)商服務(wù)器;400-網(wǎng)絡(luò);1121-深度包檢測(cè)子模塊;1122-URL地址深度分析子模塊;1123-網(wǎng)頁匹配子模塊;1124-內(nèi)容分析子模塊;1131-第一分類標(biāo)簽指定子模塊;1132-第二分類標(biāo)簽指定子模塊;1133-第三分類標(biāo)簽指定子模塊。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。
因此,以下對(duì)在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。
在本發(fā)明的描述中,需要說明的是術(shù)語“第一”、“第二”、“第三”等僅用于區(qū)分描述,而不能理解為指示或暗示相對(duì)重要性。
本實(shí)施例提供的一種移動(dòng)大數(shù)據(jù)解析方法及裝置應(yīng)用于對(duì)移動(dòng)終端用戶的上網(wǎng)行為進(jìn)行大數(shù)據(jù)分析的數(shù)據(jù)分析設(shè)備100上。請(qǐng)參照?qǐng)D1,圖1為所述數(shù)據(jù)分析設(shè)備100通過網(wǎng)絡(luò)400與用戶終端200及運(yùn)營(yíng)商服務(wù)器300的交互示意圖。
請(qǐng)參照?qǐng)D2,圖1所示的數(shù)據(jù)分析設(shè)備100的結(jié)構(gòu)框圖。所述數(shù)據(jù)分析設(shè)備100包括移動(dòng)上網(wǎng)用戶分類裝置110、存儲(chǔ)器120、處理器130。
所述存儲(chǔ)器120、處理器130及各元件相互之間直接或間接地電性連接,以實(shí)現(xiàn)數(shù)據(jù)的傳輸或交互。例如,這些元件相互之間可通過一條或多條通訊總線或信號(hào)線實(shí)現(xiàn)電性連接。所述移動(dòng)上網(wǎng)用戶分類裝置110包括至少一個(gè)可以軟件或固件(firmware)的形式存儲(chǔ)于所述存儲(chǔ)器120中或固化在所述數(shù)據(jù)分析設(shè)備100的操作系統(tǒng)(operating system,OS)中的軟件功能模塊。所述處理器130用于執(zhí)行所述存儲(chǔ)器120中存儲(chǔ)的可執(zhí)行模塊,例如所述移動(dòng)上網(wǎng)用戶分類裝置110所包括的軟件功能模塊及計(jì)算機(jī)程序等。
其中,所述存儲(chǔ)器120可以是,但不限于,隨機(jī)存取存儲(chǔ)器(Random Access Memory,RAM),只讀存儲(chǔ)器(Read Only Memory,ROM),可編程只讀存儲(chǔ)器(Programmable Read-Only Memory,PROM),可擦除只讀存儲(chǔ)器(Erasable Programmable Read-Only Memory,EPROM),電可擦除只讀存儲(chǔ)器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存儲(chǔ)器120用于存儲(chǔ)程序,所述處理器130在接收到執(zhí)行指令后,執(zhí)行所述程序。
請(qǐng)參考圖3,圖3位本實(shí)施例提供的應(yīng)用于圖2所述數(shù)據(jù)分析設(shè)備100的一種移動(dòng)上網(wǎng)用戶分類方法,所述方法包括以下步驟。
步驟S110,獲取用戶的上網(wǎng)原始信令數(shù)據(jù)。
具體地,在本實(shí)施例中,所述上網(wǎng)原始信令數(shù)據(jù)包括用戶使用的移動(dòng)上網(wǎng)終端與移動(dòng)上網(wǎng)服務(wù)運(yùn)營(yíng)商通信服務(wù)器之間交互的原始數(shù)據(jù)。
步驟S120,解析所述上網(wǎng)原始信令數(shù)據(jù),獲得用戶的上網(wǎng)行為,所述上網(wǎng)行為包括上網(wǎng)所用的終端、上網(wǎng)位置、上網(wǎng)所用應(yīng)用軟件、網(wǎng)頁操作行為類型、瀏覽內(nèi)容類型、聯(lián)網(wǎng)網(wǎng)絡(luò)類型或上網(wǎng)用戶身份。
具體地,請(qǐng)參照?qǐng)D4,在本實(shí)施例中,步驟S120可以包括以下子步驟。
子步驟S121,采用深度包檢測(cè)技術(shù)對(duì)所述上網(wǎng)原始信令數(shù)據(jù)的進(jìn)行解析,獲得移動(dòng)終端用戶上網(wǎng)訪問的URL地址。
具體地,在本實(shí)施例中,通過深度包檢測(cè)(Deep Packet Inspection,DPI)技術(shù)對(duì)所述上網(wǎng)原始信令數(shù)據(jù)的進(jìn)行解析。深度包檢測(cè)技術(shù)是在傳統(tǒng)的IP數(shù)據(jù)包檢測(cè)技術(shù),即在OSI第二層至第四層之間包含的數(shù)據(jù)包元素的檢測(cè)分析的基礎(chǔ)上,增加了對(duì)應(yīng)用層數(shù)據(jù)的協(xié)議識(shí)別、數(shù)據(jù)包內(nèi)容檢測(cè)及深度解碼。
子步驟S122,對(duì)所述URL地址進(jìn)行分類及深度分析,從所述URL地址獲得關(guān)鍵字段。
URL地址中包含多個(gè)字段,其中一些字段包含該URL地址對(duì)應(yīng)網(wǎng)頁中的內(nèi)容。如,用戶在網(wǎng)頁中執(zhí)行搜索動(dòng)作時(shí),鏈接的URL地址中包含含義為“搜索”的搜索命令關(guān)鍵字段,及用戶搜索內(nèi)容的關(guān)鍵字段。所述數(shù)據(jù)分析設(shè)備100對(duì)用戶鏈接的URL地址進(jìn)行分類及深度分析,提取URL地址中的關(guān)鍵字段,及各關(guān)鍵字段的關(guān)聯(lián)關(guān)系。
子步驟S123,根據(jù)所述關(guān)鍵字段的內(nèi)容在預(yù)設(shè)的網(wǎng)頁內(nèi)容規(guī)則庫(kù)中匹配相應(yīng)的用戶操作或網(wǎng)頁內(nèi)容,對(duì)所述網(wǎng)頁內(nèi)容規(guī)則庫(kù)中包括所述用戶操作或網(wǎng)頁內(nèi)容與所述關(guān)鍵字段的對(duì)應(yīng)關(guān)系。
子步驟S124,根據(jù)所述用戶操作或網(wǎng)頁內(nèi)容,結(jié)合所述上網(wǎng)原始信令數(shù)據(jù)中的用戶信息,獲得用戶的上網(wǎng)行為。
步驟S130,根據(jù)用戶所述上網(wǎng)行為中打開的網(wǎng)站的歸屬領(lǐng)域、上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域、用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,得到該上網(wǎng)行為的分類標(biāo)簽。
具體地,請(qǐng)參照?qǐng)D5,在本實(shí)施列中,步驟S130可以包括以下子步驟。
子步驟S131,根據(jù)所述上網(wǎng)行為中用戶打開的網(wǎng)站的歸屬領(lǐng)域或上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域,為該上網(wǎng)行為指定第一分類標(biāo)簽。
在本實(shí)施列中,所述數(shù)據(jù)分析設(shè)備100通過解析用戶打開網(wǎng)站的網(wǎng)址及上網(wǎng)所用的應(yīng)用程序,根據(jù)所述網(wǎng)站及應(yīng)用程序的歸屬領(lǐng)域判斷用戶的關(guān)注領(lǐng)域,所述第一分類標(biāo)簽包括,但不僅限于,新聞實(shí)事、金融保險(xiǎn)、汽車地產(chǎn)、旅游出行、生活服務(wù)、網(wǎng)絡(luò)400游戲、即時(shí)通信、在線教育、手機(jī)閱讀、音樂視頻、體育娛樂、科技軍事、電子商務(wù)、電子支付等。
子步驟S132,根據(jù)所述上網(wǎng)行為中用戶打開的網(wǎng)站子頁或應(yīng)用程序子頁,為該上網(wǎng)行為指定所述第一分類標(biāo)簽下的第二分類標(biāo)簽。
在本實(shí)施列中,所述分析設(shè)備通過解析用戶打開的網(wǎng)站子頁的類型或打開的應(yīng)用程序子頁的類型,進(jìn)一步判斷細(xì)化用戶關(guān)注的領(lǐng)域,將該上網(wǎng)行為指定所述第一分類標(biāo)簽下的第二分類標(biāo)簽。如,用戶打開音樂類網(wǎng)站,則為該上網(wǎng)行為指定第一分類標(biāo)簽為“音樂視頻”,用戶打開網(wǎng)站中;流行樂子頁或子欄目,則所述數(shù)據(jù)分析設(shè)備100將該上網(wǎng)動(dòng)作指定為所述第一分類標(biāo)簽“音樂視頻”標(biāo)簽下的第二分類標(biāo)簽“流行樂”。
子步驟S133,根據(jù)所述上網(wǎng)行為中用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,為該上網(wǎng)行為指定所述第二分類標(biāo)簽下的第三分類標(biāo)簽。
在本實(shí)施例中,所述數(shù)據(jù)分析設(shè)備100識(shí)別用戶所述上網(wǎng)行為中執(zhí)行的操作,進(jìn)一步判斷細(xì)化用戶的關(guān)注領(lǐng)域,該上網(wǎng)行為指定所述第二分類標(biāo)簽下的第三分類標(biāo)簽。其中,所述用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為包括:用戶輸入的文本和/或圖片信息;用戶對(duì)網(wǎng)頁內(nèi)容的收藏或關(guān)注操作;用戶對(duì)網(wǎng)頁文本或圖片或聲音或視頻的瀏覽操作;用戶對(duì)網(wǎng)頁連接或網(wǎng)頁控件的操作。如,在子步驟S132的基礎(chǔ)上,用戶在流行樂網(wǎng)頁下搜索或收聽或收藏了XXX歌手的歌曲或?qū)]?,則所述數(shù)據(jù)分析設(shè)備100將該上網(wǎng)行為執(zhí)行未第二分類標(biāo)簽“流行樂”的第三分類標(biāo)簽“XXX歌手”。
步驟S140,通過網(wǎng)絡(luò)爬蟲爬取用戶在所述上網(wǎng)行為中打開網(wǎng)頁的內(nèi)容,獲取并保存所述網(wǎng)頁的內(nèi)容中與所述分類標(biāo)簽相關(guān)的數(shù)據(jù)信息。
在本實(shí)施例中,所述數(shù)據(jù)分析設(shè)備100獲得用戶連接的URL地址,通過網(wǎng)絡(luò)400爬蟲對(duì)所述URL地址對(duì)應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行爬取,獲取網(wǎng)頁內(nèi)容中與所述分類標(biāo)簽相關(guān)的數(shù)據(jù)信息。如,用戶上網(wǎng)在“房產(chǎn)汽車”網(wǎng)頁中,打開了“汽車”子網(wǎng)頁,并進(jìn)行了搜索操作,搜索“YYY品牌汽車的價(jià)格”,所述數(shù)據(jù)分析設(shè)備100獲得用戶搜索結(jié)果中與“YYY品牌汽車的價(jià)格”對(duì)應(yīng)數(shù)據(jù)位“ZZZ萬元”。則所述數(shù)據(jù)分析設(shè)備100將“ZZZZ萬元”作為與所述第一分類標(biāo)簽“房產(chǎn)汽車”、所述第二分類標(biāo)簽“汽車”、所述第三分類標(biāo)簽“YYY品牌汽車的價(jià)格”對(duì)應(yīng)的相關(guān)的數(shù)據(jù)信息并保存。
步驟S150,統(tǒng)計(jì)指定時(shí)間段內(nèi)所述上網(wǎng)行為的分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,獲得上網(wǎng)行為統(tǒng)計(jì)結(jié)果,根據(jù)所述上網(wǎng)行為統(tǒng)計(jì)結(jié)果及用戶的個(gè)人信息,為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽,其中所述個(gè)人信息包括用戶的上網(wǎng)位置信息、用戶上網(wǎng)所用終端的設(shè)備信息及用戶注冊(cè)的身份信息。
在本實(shí)施例中,統(tǒng)計(jì)一定時(shí)間段內(nèi)所述上網(wǎng)行為的分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,獲得上網(wǎng)行為統(tǒng)計(jì)結(jié)果,并從移動(dòng)數(shù)據(jù)服務(wù)運(yùn)營(yíng)商處獲得用戶的個(gè)人信息。根據(jù)所述上網(wǎng)行為統(tǒng)計(jì)結(jié)果及用戶個(gè)人信息判斷用戶屬于哪個(gè)群體。如,統(tǒng)計(jì)用戶在1個(gè)月內(nèi)有多次分類標(biāo)簽為“房產(chǎn)汽車”、“汽車”及“YYY品牌汽車的價(jià)格”的上網(wǎng)行為,且統(tǒng)計(jì)到與該分類標(biāo)簽對(duì)應(yīng)的數(shù)據(jù)信息為“100萬元”,則所述數(shù)據(jù)分析設(shè)備100將該用戶的用戶屬性標(biāo)簽指定為“高端汽車消費(fèi)用戶”。
值得說明的是,上述分類標(biāo)簽的名稱或類型僅為解釋本實(shí)施例實(shí)施方案的舉例的一種實(shí)施方式,并不構(gòu)成對(duì)分類標(biāo)簽名稱或類型的限定,在本實(shí)施例其他實(shí)施方式中,也可以采用其他不同的分類標(biāo)簽名稱或類型。
進(jìn)一步地,在本實(shí)施例中,實(shí)施方法還可以包括以下步驟。
根據(jù)所述用戶屬性標(biāo)簽為用戶推送相應(yīng)的服務(wù)或資訊內(nèi)容。
在本實(shí)施例中,所述數(shù)據(jù)分析設(shè)備100還可根據(jù)所述用戶屬性標(biāo)簽為用戶推送響應(yīng)的內(nèi)容,如,用戶分類標(biāo)簽為“體育愛好者”則為用戶推送體育類的新聞。
請(qǐng)參照?qǐng)D6,實(shí)施例還提供一種移動(dòng)上網(wǎng)用戶分類裝置110,所述裝置包括:
上網(wǎng)原始信令數(shù)據(jù)獲取模塊111,用于從所述用戶終端200獲取用戶的上網(wǎng)原始信令數(shù)據(jù);
上網(wǎng)行為解析模塊112,用于解析所述上網(wǎng)原始信令數(shù)據(jù),獲得用戶的上網(wǎng)行為,所述上網(wǎng)行為包括上網(wǎng)所用的終端、上網(wǎng)位置、上網(wǎng)所用應(yīng)用軟件、網(wǎng)頁操作行為類型、瀏覽內(nèi)容類型、聯(lián)網(wǎng)網(wǎng)絡(luò)400類型或上網(wǎng)用戶身份;
分類標(biāo)簽指定模塊113,用于根據(jù)用戶所述上網(wǎng)行為中打開的網(wǎng)站的歸屬領(lǐng)域、上網(wǎng)所用應(yīng)用程序的歸屬領(lǐng)域、用戶對(duì)網(wǎng)頁的操作行為或?qū)λ鰬?yīng)用程序的操作行為,得到該上網(wǎng)行為的分類標(biāo)簽;
具體瀏覽信息獲取模塊114,用于通過網(wǎng)絡(luò)400爬蟲爬取用戶所述上網(wǎng)行為中鏈接網(wǎng)頁中的具體數(shù)據(jù)信息,獲取并保存所述具體數(shù)據(jù)信息中與所述類標(biāo)簽相關(guān)的具體瀏覽信息;
用戶標(biāo)簽指定模塊115,用于統(tǒng)計(jì)指定時(shí)間類用戶上網(wǎng)行為中的所述分類標(biāo)簽、具體瀏覽信息及用戶個(gè)人數(shù)據(jù),根據(jù)統(tǒng)計(jì)結(jié)果為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽。
進(jìn)一步地,請(qǐng)參照?qǐng)D7,所述上網(wǎng)行為解析模塊112包括:
深度包檢測(cè)子模塊1121,用于采用深度包檢測(cè)技術(shù)對(duì)所述上網(wǎng)原始信令數(shù)據(jù)的進(jìn)行解析,獲得移動(dòng)終端用戶上網(wǎng)訪問的URL地址;
URL地址深度分析子模塊1122,用于對(duì)所述URL地址進(jìn)行分類及深度分析,從所述URL地址獲得關(guān)鍵字段;
網(wǎng)頁匹配子模塊1123,用于根據(jù)所述關(guān)鍵字段的內(nèi)容在預(yù)設(shè)的網(wǎng)頁內(nèi)容規(guī)則庫(kù)中匹配相應(yīng)的用戶操作或網(wǎng)頁內(nèi)容,對(duì)所述網(wǎng)頁內(nèi)容規(guī)則庫(kù)中包括所述用戶操作或網(wǎng)頁內(nèi)容與所述關(guān)鍵字段的對(duì)應(yīng)關(guān)系;
內(nèi)容分析子模塊1124,用于根據(jù)所述用戶操作或網(wǎng)頁內(nèi)容,結(jié)合所述上網(wǎng)原始信令數(shù)據(jù)中的用戶信息,獲得用戶的上網(wǎng)行為。
進(jìn)一步地,請(qǐng)?jiān)俅螀⒄請(qǐng)D7,所述分類標(biāo)簽指定模塊113包括:
第一分類標(biāo)簽指定子模塊1131,用于根據(jù)所述上網(wǎng)行為中用戶鏈接的網(wǎng)站或使用的應(yīng)用程序的歸屬領(lǐng)域,為該上網(wǎng)行為指定第一分類標(biāo)簽;
第二分類標(biāo)簽指定子模塊1132,用于根據(jù)所述上網(wǎng)行為中用戶鏈接的網(wǎng)站子頁或應(yīng)用程序子頁,為該上網(wǎng)行為指定所述第一分類標(biāo)簽下的第二分類標(biāo)簽;
第三分類標(biāo)簽指定子模塊1133,用于根據(jù)所述上網(wǎng)行為中用戶在網(wǎng)站或應(yīng)用程序中執(zhí)行的操作動(dòng)作,為該上網(wǎng)行為指定所述第二分類標(biāo)簽下的第三分類標(biāo)簽。
進(jìn)一步地,所述第三分類標(biāo)簽指定模塊113中用戶在網(wǎng)站或應(yīng)用程序中執(zhí)行的操作動(dòng)作包括:
用戶輸入的文本和/或圖片信息;
用戶對(duì)網(wǎng)頁內(nèi)容的收藏或關(guān)注操作;
用戶對(duì)網(wǎng)頁文本或圖片或聲音或視頻的瀏覽操作;
用戶對(duì)網(wǎng)頁連接或網(wǎng)頁控件的操作。
進(jìn)一步地,請(qǐng)?jiān)俅螀⒄請(qǐng)D7,所述裝置還包括:
推送模塊116,用于根據(jù)所述用戶屬性標(biāo)簽為用戶推送相應(yīng)的服務(wù)或咨詢內(nèi)容。
綜上所述,本發(fā)明提供的一種移動(dòng)上網(wǎng)用戶分類方法及裝置,通過對(duì)用戶所述上網(wǎng)原始信令數(shù)據(jù)的解析獲得用戶的所述上網(wǎng)行為,并根據(jù)用戶的所述上網(wǎng)行為獲得上網(wǎng)行為的分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,統(tǒng)計(jì)用戶所述分類標(biāo)簽及與該分類標(biāo)簽相關(guān)的數(shù)據(jù)信息,并結(jié)合用戶個(gè)人信息為該用戶指定對(duì)應(yīng)的用戶屬性標(biāo)簽。如此,對(duì)用戶上網(wǎng)數(shù)據(jù)的進(jìn)行全面地分析統(tǒng)計(jì),使得獲得的用戶屬性標(biāo)簽更加準(zhǔn)確客觀。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。