專利名稱:一種用戶行為分析的方法及裝置的制作方法
技術(shù)領域:
本發(fā)明涉及移動通信網(wǎng)絡中的傳輸與IP領域,特別涉及一種用戶行為分析的方法及裝置。
背景技術(shù):
信息推送系統(tǒng)也稱為互聯(lián)網(wǎng)信息發(fā)布系統(tǒng),主要是為寬帶網(wǎng)絡運營商提供信息自動、智能的發(fā)布的工具,憑借寬帶運營商的寬帶網(wǎng)絡技術(shù)優(yōu)勢和龐大的客戶資源,能夠探測到互聯(lián)網(wǎng)用戶的登錄和瀏覽活動,然后主動地將特定的廣告內(nèi)容推送到用戶的電腦瀏覽頁面。然而,目前的信息推送方法都存在一定的問題,不能針對用戶的身份進行用戶行為分析,因此進行信息推送時,針對性較差。由此可見現(xiàn)有技術(shù)中存在如下的問題:不能針對用戶的身份進行用戶行為分析。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)中存在的,不能針對用戶的身份進行用戶行為分析的問題,提供一種用戶行為分析的方法及裝置,該方法包括:日志分析服務器獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系;日志分析服務器獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系;日志分析服務器根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系;日志分析服務器基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。進一步,還包括:日志分析服務器基于預設的第一 IP地址段,通過第一 IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址屬于第一 IP地址段。進一步,還包括:日志分析服務器判斷用戶所請求域名對應的IP地址是否屬于預設的第二IP地址段,并根據(jù)判斷結(jié)果進行用戶行為分析。進一步,還包括:日志分析服務器從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析。進一步,還包括:日志分析服務器從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。進一步,還包括:
日志分析服務器從認證報文中提取計費起始時間信息和計費結(jié)束時間信息,從域名解析報文中提取解析請求開始時間信息,若解析請求開始時間位于計費起始時間和計費結(jié)束時間之間,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。進一步,還包括:日志分析服務器從域名解析報文中提取解析結(jié)果標識信息,若解析結(jié)果表示解析成功,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。本發(fā)明實施例還提供一種用戶行為分析的裝置,包括:第一提取模塊,用于獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系;第二提取模塊,用于獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系;建立模塊,用于根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系;分析模塊,用于基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。進一步,分析模塊,還用于基于預設的第一 IP地址段,通過第一 IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址屬于第一 IP地址段。進一步,分析模塊,還用于判斷用戶所請求域名對應的IP地址是否屬于預設的第二 IP地址段,并根據(jù)判斷結(jié)果進行用戶行為分析。進一步,分析模塊,還用于從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析。進一步,分析模塊,還用于從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。進一步,建立模塊,還用于從認證報文中提取計費起始時間信息和計費結(jié)束時間信息,從域名解析報文中提取解析請求開始時間信息,若解析請求開始時間位于計費起始時間和計費結(jié)束時間之間,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。進一步,建立模塊,還用于從域名解析報文中提取解析結(jié)果標識信息,若解析結(jié)果表示解析成功,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。由于通過獲取用戶與,Radius認證系統(tǒng)和DNS域名解析系統(tǒng)交互的報文,建立用戶名信息和請求域名集的對應關系,進而可以針對用戶的身份進行用戶行為分析。
圖1表示本發(fā)明提供的方法流程圖;圖2表示本發(fā)明提供的裝置結(jié)構(gòu)圖。
具體實施例方式下面結(jié)合說明書附圖對本發(fā)明優(yōu)選實施例進行說明,本發(fā)明實施例提供一種用戶行為分析的方法及裝置,以解決現(xiàn)有技術(shù)中存在的,不能針對用戶的身份進行用戶行為分析的問題。
本實施例中,日志分析服務器獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系,日志分析服務器獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系,日志分析服務器根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系,日志分析服務器基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。本發(fā)明中基于DNS日志挖掘的用戶行為分析方法系統(tǒng)中涉及的網(wǎng)絡實體具體說明如下:DNS節(jié)點,DNS節(jié)點為互聯(lián)網(wǎng)用戶提供域名和IP的相互轉(zhuǎn)換的關系,負責該區(qū)域內(nèi)有線寬帶/WLAN用戶的域名解析。DNS接入交換機,該交換機將DNS節(jié)點IP路由發(fā)布到互聯(lián)網(wǎng),負責用戶域名解析請求、DNS服務器反饋結(jié)果的數(shù)據(jù)報文的轉(zhuǎn)發(fā),使得DNS節(jié)點互聯(lián)網(wǎng)可達。在該交換機上配置端口鏡像,將DNS業(yè)務流鏡像到日志服務器的接入端口。DNS日志服務器,DNS日志服務器的網(wǎng)卡處于混雜模式,被動接收網(wǎng)卡上的數(shù)據(jù),并對所有53端口的交互報文進行DPI分析,提取成特定格式的域名解析記錄,該格式包括“時間戳、請求源IP、請求域名、請求類型、解析結(jié)果標志、解析結(jié)果”等字段。Radius認證服務器,Radius認證服務器負責該區(qū)域有線寬帶/WLAN用戶的接入鑒權(quán),對符合條件的用戶給予認證,同時拒絕非法用戶的接入請求。該服務器記錄了本區(qū)域所有采用PPPOE撥號、PORTAL認證用戶的接入/離開網(wǎng)絡相關信息。Radius接入交換機,該交換機將Radius認證服務器IP路由發(fā)布到互聯(lián)網(wǎng),負責Radius認證服務器與用戶及其他服務器間交互信息的轉(zhuǎn)發(fā),使得Radius認證服務器互聯(lián)網(wǎng)可達。在該交換機上配置端口鏡像,將認證業(yè)務流鏡像到日志服務器的接入端口。Radius認證日志服務器,Radius認證日志服務器的網(wǎng)卡處于混雜模式,被動接收網(wǎng)卡上的數(shù)據(jù),并對所有認證的交互報文進行DPI分析,提取成特定格式的認證記錄,該格式包括“時間戳、請求源IP、用戶名、請求類型、認證結(jié)果標志”等字段。日志分析服務器,日志分析服務器負責DNS日志、Radius解析日志入庫,負責通過時間戳和IP地址,關聯(lián)用戶信息與域名請求信息。對域名和用戶進行統(tǒng)計分析:基于單用戶名,匯總統(tǒng)計域名請求情況;基于某用戶地址段,匯總統(tǒng)計域名請求情況。日志數(shù)據(jù)庫,保存日志記錄?;谏鲜龅木W(wǎng)絡實體,本發(fā)明實施例提供的方法流程圖如下圖1所示,包括如下步驟:步驟1,用戶向Radius認證服務器提交認證報文。步驟2,Radius認證服務器根據(jù)用戶提交的“用戶名”及“密碼”在系統(tǒng)中檢索,根據(jù)匹配結(jié)果,返回認證結(jié)果。步驟3,用戶和Radius認證服務器交互的認證報文被鏡像到Radius日志服務器,日志服務器捕獲報文后,解析形成認證日志。認證記錄包含時間戳、請求源IP、用戶名、認證請求類型、認證結(jié)果標志等字段。其中,該時間戳表示認證過程中執(zhí)行各步驟的時間點,例如發(fā)起認證請求的時間點、計費開始的時間點計費結(jié)束的時間點。請求源IP表示網(wǎng)絡側(cè)為用戶分配的IP地址,該請求類型表示認證報文的報文種類,如認證請求報文、計費開始報文、計費結(jié)束部位,認證結(jié)果標志表示認證是否通過,如I表示認證通過,O表示認證沒有通過。步驟4,日志分析服務器通過FTP等方式采集Radius日志服務器上的認證日志。步驟5,日志分析服務器對認證日志進行整理,按照規(guī)劃的數(shù)據(jù)表,對認證日志進行入庫操作。本步驟中日志分析服務器會獲取認證日志(從用戶和Radius服務器之間交互的認證報文)從中得到請求源IP地址和用戶名信息,并將兩者建立關聯(lián),提取出提取請求源IP地址和用戶名信息的對應關系,如請求源IP地址202.94.255.3和用戶名張三相對應,同時還要提取請求類型為“計費開始”、“計費結(jié)束”所對應的時間戳。步驟6,通過認證的用戶,發(fā)起域名解析請求。步驟7,DNS節(jié)點對解析請求進行遞歸,并將結(jié)果返回給用戶。結(jié)果可能是解析成功或解析失敗,其中解析失敗的原因可能是超時失敗或無法解析造成的失敗。步驟8,用戶和DNS節(jié)點的交互報文被鏡像到DNS日志服務器接入的端口,DNS日志服務器捕獲到報文后,形成域名請求解析記錄。域名請求解析記錄包括時間戳、請求源IP、請求域名、請求類型、解析結(jié)果標志、解析結(jié)果等字段,其中,該時間戳表示解析過程中執(zhí)行各步驟的時間點,例如解析請求開始時間,請求源IP表示網(wǎng)絡側(cè)為用戶分配的IP地址,請求域名表示用戶所請求解析的域名,例如WWW.sina.com,該請求類型表示域名請求解析記錄的記錄類別,如用來指定域名對應的IP地址的A(Address)記錄,CNAME記錄、反向域名解析(PTR)、NS記錄等。解析結(jié)果標志表示域名請求解析的結(jié)果,例如,0表示解析成功,I表示SERVFAIL錯誤,2表示NXD0MAIN錯誤。解析結(jié)果表示解析后得到的IP地址或者域名。步驟9,日志分析服務器通過FTP等方式采集DNS日志服務器上的請求解析日志。步驟10,日志分析服務器對DNS請求解析日志進行整理,按照規(guī)劃的數(shù)據(jù)表,對日志進行入庫操作。 本步驟中日志分析服務器會從請求解析日志中,獲取請求解析日志從中得到請求源IP地址和請求域名集(通過A記錄),并將兩者建立關聯(lián),提取請求源IP地址和請求域名集的對應關系,如請求源IP地址202.94.255.3和請求域名集A相對應,該用戶訪問的域名集A= {域名a,域名b,域名c}。同時還要提取解析請求開始的時間戳。步驟11,根據(jù)特定條件,對數(shù)據(jù)庫中的記錄進行統(tǒng)計分析,得到用戶行為的分析結(jié)果。通過Radius認證報文中的時間戳、用戶名及IP信息、及解析日志中的時間戳、IP及域名信息,可以提取基于單用戶名的喜好行為集。具體而言,日志分析服務器根據(jù)步驟5中得到的請求源IP地址和用戶名信息的對應關系,以及步驟10中得到的請求源IP地址和請求域名的對應關系,若解析請求開始的時間戳,在計費開始時間戳和計費結(jié)束時間戳之間。同時提取的解析結(jié)果標志為0,則建立用戶名信息和請求域名集的對應關系。解析請求開始的時間戳,在計費開始時間戳和計費結(jié)束時間戳之間,可以確保Radius認證報文中的IP信息和解析日志中的IP信息,是對應同一用戶的IP,解析結(jié)果標志為0表示域名信息有效,避免錯誤的統(tǒng)計。這樣基于用戶名信息和請求域名集的對應關系,就可以進行用戶行為分析。用戶域名解析日志入庫后,形成以下分析點,基于用戶分群分析和基于區(qū)域劃分分析?;谟脩舴秩悍治鍪侵赴碐PRS、省內(nèi)WLAN、家庭寬帶、校園網(wǎng)、政企專線類別進行用戶分類,基于每種用戶群的IP地址段,通過對DNS日志的提取,分析用戶群的聚類行為,提取基于用戶群的熱門站點?;趨^(qū)域劃分分析是指通過地市級別IP地址段,對某區(qū)域用戶行為進行分析,提取該區(qū)域用戶的喜好。無論每種用戶群的IP地址段還是地市級別IP地址段,從技術(shù)實現(xiàn)上看都可看成預設一段IP地址段B,日志分析服務器基于該IP地址段B,通過該IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址都屬于IP地址段B。用戶域名解析日志入庫后,還可以形成以下分析點,基于資源分布分析,基于區(qū)域及資源分布分析。基于資源分布分析指通過對域名解析結(jié)果所屬運營商屬性,對于某個運營商可以分析用戶訪問該運營商網(wǎng)內(nèi)、網(wǎng)外站點數(shù)量占比,按訪問量提取網(wǎng)外資源站點清單?;趨^(qū)域及資源分布分析指對域名解析結(jié)果所屬地區(qū)運營商屬性,分析用戶訪問本地外網(wǎng)運營商資源的熱門站點。不同的運營商會屬性指,不同運營商進行域名解析的服務器會屬于不同的IP地址段。從技術(shù)實現(xiàn)上看,例如甲運營商進行域名解析的服務器會屬于IP地址段C,日志分析服務器需判斷用戶所請求域名對應的IP地址是否屬于預設的IP地址段C,并根據(jù)判斷結(jié)果進行用戶行為分析。還可以基于資源站點全景分布圖分析,基于域名一致性規(guī)則,對資源站點模糊分析,提取具有相同一級域名或者二級域名的清單,從而了解該資源站點的域名全景分布,聯(lián)合點擊量,給出急需引入的域名清單。實現(xiàn)時,日志分析服務器從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析,類似的從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。本發(fā)明實施例還提供一種用戶行為分析的裝置,如圖2所示,包括:第一提取模塊201,用于獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系;第二提取模塊202,用于獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系;建立模塊203,用于根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系;分析模塊204,用于基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。進一步,分析模塊204,還用于基于預設的第一 IP地址段,通過第一 IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址屬于第一 IP地址段。進一步,分析模塊204,還用于判斷用戶所請求域名對應的IP地址是否屬于預設的第二 IP地址段,并根據(jù)判斷結(jié)果進行用戶行為分析。
進一步,分析模塊204,還用于從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析。進一步,分析模塊204,還用于從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。進一步,建立模塊203,還用于從認證報文中提取計費起始時間信息和計費結(jié)束時間信息,從域名解析報文中提取解析請求開始時間信息,若解析請求開始時間位于計費起始時間和計費結(jié)束時間之間,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。進一步,建立模塊203,還用于從域名解析報文中提取解析結(jié)果標識信息,若解析結(jié)果表示解析成功,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。最后應說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案而非對其進行限制,盡管參照較佳實施例對本發(fā)明進行了詳細的說明,本領域的普通技術(shù)人員應當理解:其依然可以對本發(fā)明的技術(shù)方案進行修改或者等同替換,而這些修改或者等同替換亦不能使修改后的技術(shù)方案脫離本發(fā)明技術(shù)方案的精神和范圍。
權(quán)利要求
1.一種用戶行為分析的方法,其特征在于,包括: 日志分析服務器獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系; 日志分析服務器獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系; 日志分析服務器根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系; 日志分析服務器基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 日志分析服務器基于預設的第一 IP地址段,通過第一 IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址屬于第一 IP地址段。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 日志分析服務器判斷用戶所請求域名對應的IP地址是否屬于預設的第二 IP地址段,并根據(jù)判斷結(jié)果進行用戶行為分析。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 日志分析服務器從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括: 日志分析服務器從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 日志分析服務器從認證報文中提取計費起始時間信息和計費結(jié)束時間信息,從域名解析報文中提取解析請求開始時間信息,若解析請求開始時間位于計費起始時間和計費結(jié)束時間之間,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 日志分析服務器從域名解析報文中提取解析結(jié)果標識信息,若解析結(jié)果表示解析成功,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。
8.一種用戶行為分析的裝置,其特征在于,包括: 第一提取模塊,用于獲取用戶和遠程撥號接入服務認證協(xié)議Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系; 第二提取模塊,用于獲取用戶和域名系統(tǒng)DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系; 建立模塊,用于根據(jù)請求源IP地址和用戶名信息的對應關系以及請求源IP地址和請求域名的對應關系,建立用戶名信息和請求域名集的對應關系; 分析模塊,用于基于用戶名信息和請求域名集的對應關系,進行用戶行為分析。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,分析模塊,還用于基于預設的第一IP地址段,通過第一 IP地址段內(nèi)的源IP地址和請求域名集的對應關系,對指定用戶群的用戶行為進行分析,指定用戶群的用戶的源IP地址屬于第一 IP地址段。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,分析模塊,還用于判斷用戶所請求域名對應的IP地址是否屬于預設的第二 IP地址段,并根據(jù)判斷結(jié)果進行用戶行為分析。
11.根據(jù)權(quán)利要求8所述的裝置,其特征在于,分析模塊,還用于從請求域名集中提取具有相同一級域名的域名,得到一級域名子集,并基于一級域名子集進行用戶行為分析。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,分析模塊,還用于從一級域名子集中提取具有相同子域名的域名,得到子域名子集,并基于子域名子集進行用戶行為分析。
13.根據(jù)權(quán)利要求8所述的裝置,其特征在于,建立模塊,還用于從認證報文中提取計費起始時間信息和計費結(jié)束時間信息,從域名解析報文中提取解析請求開始時間信息,若解析請求開始時間位于計費起始時間和計費結(jié)束時間之間,則執(zhí)行,建立用戶名信息和請求域名集的對應關系步驟。
14.根據(jù)權(quán)利要求8所述的裝置,其特征在于,建立模塊,還用于從域名解析報文中提取解析結(jié)果標識信息,若解析結(jié)果表示解析成功,則執(zhí)行,建立用戶名信息和請求域名集的對應關系 步驟。
全文摘要
本發(fā)明提供一種用戶行為分析的方法及裝置,以解決現(xiàn)有技術(shù)中存在的不能針對用戶的身份進行用戶行為分析的問題,該方法包括日志分析服務器獲取用戶和Radius服務器之間交互的認證報文,并提取請求源IP地址和用戶名信息的對應關系,獲取用戶和DNS節(jié)點之間交互的域名解析報文,并提取請求源IP地址和請求域名集的對應關系,建立用戶名信息和請求域名集的對應關系,基于用戶名信息和請求域名集的對應關系,進行用戶行為分析,由于通過獲取用戶與,Radius認證系統(tǒng)和DNS域名解析系統(tǒng)交互的報文,建立用戶名信息和請求域名集的對應關系,進而可以針對用戶的身份進行用戶行為分析。
文檔編號H04L29/06GK103188104SQ20111046009
公開日2013年7月3日 申請日期2011年12月31日 優(yōu)先權(quán)日2011年12月31日
發(fā)明者趙煒, 劉快, 于杭, 袁明亮, 胡軼, 程路, 王易風 申請人:中國移動通信集團浙江有限公司