專利名稱:基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)用戶特征分析領(lǐng)域,特別涉及一種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法。
背景技術(shù):
隨著因特網(wǎng)的日益壯大,網(wǎng)絡(luò)用戶也越來(lái)越多。通常情況下用戶在點(diǎn)擊網(wǎng)頁(yè)或在搜索引擎下搜索某個(gè)關(guān)鍵字的時(shí)候,會(huì)產(chǎn)生相關(guān)的網(wǎng)絡(luò)報(bào)文。用戶行為關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,在用戶行為分析中,可以把用戶的一種使用習(xí)慣和另外的使用習(xí)慣進(jìn)行關(guān)聯(lián)分析,也可以把用戶的消費(fèi)習(xí)慣和使用網(wǎng)絡(luò)習(xí)慣進(jìn)行關(guān)聯(lián)分析。一般而言,一些大型網(wǎng)站會(huì)根據(jù)訪問(wèn)自己網(wǎng)站的用戶行為進(jìn)行關(guān)聯(lián)分析。比如說(shuō) 新浪、騰訊等大型門戶網(wǎng)站,用戶訪問(wèn)了這些網(wǎng)站之后可能會(huì)看到網(wǎng)頁(yè)上某個(gè)比較感興趣的話題然后打開(kāi)此鏈接,這樣的用戶訪問(wèn)行為都會(huì)被該網(wǎng)站的服務(wù)器捕捉到,從而可以對(duì)用戶的上網(wǎng)行為進(jìn)行關(guān)聯(lián)分析。但是現(xiàn)實(shí)情況下,上網(wǎng)用戶不會(huì)只訪問(wèn)一個(gè)門戶網(wǎng)站,他還可能會(huì)訪問(wèn)很多非門戶網(wǎng)站或者在搜索引擎下搜索某些關(guān)鍵字,這些信息是無(wú)法只通過(guò)一兩個(gè)網(wǎng)站得到的信息。當(dāng)網(wǎng)絡(luò)用戶訪問(wèn)某個(gè)大型門戶網(wǎng)站時(shí),該網(wǎng)站的服務(wù)器會(huì)記錄該用戶的信息,用戶點(diǎn)擊某個(gè)感興趣的網(wǎng)頁(yè)鏈接后,這些訪問(wèn)的信息同樣被該服務(wù)器獲得。通過(guò)對(duì)該網(wǎng)站的訪問(wèn)信息的關(guān)聯(lián)分析可以獲得用戶在這個(gè)網(wǎng)站上的上網(wǎng)習(xí)慣,知道不同用戶的上網(wǎng)習(xí)慣后可以針對(duì)不同的用戶投放其感興趣的廣告或網(wǎng)頁(yè)信息。同樣當(dāng)用戶訪問(wèn)某個(gè)大型搜索引擎比如百度、谷歌時(shí),此網(wǎng)站的服務(wù)器會(huì)記錄用戶的搜索信息和點(diǎn)擊信息,通過(guò)對(duì)這些信息的關(guān)聯(lián)分析也可以獲得用戶在該網(wǎng)站上的上網(wǎng)習(xí)慣?,F(xiàn)有技術(shù)存在的缺點(diǎn)由于網(wǎng)絡(luò)用戶訪問(wèn)網(wǎng)站信息只能通過(guò)單個(gè)或某幾個(gè)網(wǎng)站獲得,所得的用戶上網(wǎng)習(xí)慣只局限于幾個(gè)點(diǎn)的網(wǎng)站,不能得到該用戶全方位的上網(wǎng)用戶習(xí)慣,從而對(duì)用戶的上網(wǎng)習(xí)慣的認(rèn)知會(huì)存在偏差。在對(duì)用戶行為的分析過(guò)程中,發(fā)明人發(fā)現(xiàn)以下問(wèn)題I)傳統(tǒng)的用戶行為關(guān)聯(lián)分析主要基于單個(gè)網(wǎng)站服務(wù)器的網(wǎng)絡(luò)報(bào)文信息,而不同用戶會(huì)訪問(wèn)不同的網(wǎng)站,傳統(tǒng)的用戶行為關(guān)聯(lián)分析法不能對(duì)全部的用戶進(jìn)行分析,是造成用戶行為關(guān)聯(lián)分析不準(zhǔn)的原因之一。2)其次因?yàn)閱蝹€(gè)用戶的很多行為是通過(guò)訪問(wèn)多個(gè)不同網(wǎng)站的服務(wù)器實(shí)現(xiàn)的,傳統(tǒng)的用戶行為關(guān)聯(lián)分析法不能對(duì)單個(gè)用戶訪問(wèn)多個(gè)服務(wù)器的信息進(jìn)行分析,這是造成分析不準(zhǔn)的原因之二。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)不足,本發(fā)明的目的是提供一種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,該方法能使當(dāng)用戶訪問(wèn)一個(gè)網(wǎng)站的時(shí)候,推薦其感興趣的其他同類網(wǎng)站;當(dāng)用戶搜索一個(gè)關(guān)鍵字時(shí),給他推薦更為準(zhǔn)確的相關(guān)網(wǎng)站;當(dāng)用戶訪問(wèn)某個(gè)網(wǎng)站時(shí),推薦系統(tǒng)給他推薦可能感興趣的廣告,從而可以提高廣告投放的精準(zhǔn)性。本發(fā)明技術(shù)方案一種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,通過(guò)如下方法步驟來(lái)實(shí)現(xiàn)(I)在現(xiàn)有網(wǎng)絡(luò)上部署多個(gè)網(wǎng)關(guān),從網(wǎng)絡(luò)報(bào)文中提取用戶行為信息;(2)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵;(3)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些廣告或者網(wǎng)站。
所述用戶行為信息可分為如下三種訪問(wèn)網(wǎng)站、搜索引擎查詢關(guān)鍵字和點(diǎn)擊廣告行為,所述訪問(wèn)網(wǎng)站信息為用戶在某個(gè)時(shí)刻訪問(wèn)某個(gè)網(wǎng)站所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、訪問(wèn)的網(wǎng)站、訪問(wèn)時(shí)間,所述搜索引擎查詢關(guān)鍵字信息為用戶在某個(gè)時(shí)刻搜索某個(gè)關(guān)鍵字所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、搜索的關(guān)鍵詞、搜索時(shí)間;所述點(diǎn)擊廣告行為信息為用戶在某個(gè)時(shí)刻點(diǎn)擊某個(gè)廣告所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、點(diǎn)擊的廣告、點(diǎn)擊時(shí)間。所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的人群更傾向于搜索哪些關(guān)鍵詞中所述用戶行為信息的數(shù)據(jù)來(lái)源為訪問(wèn)網(wǎng)站信息和搜索引擎查詢關(guān)鍵字信息。所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵詞通過(guò)五個(gè)MapReduce程序?qū)崿F(xiàn)(I)Jobl :從訪問(wèn)網(wǎng)站的日志信息(用戶、訪問(wèn)的網(wǎng)站、訪問(wèn)時(shí)間)得到這個(gè)用戶訪問(wèn)了哪些網(wǎng)站、何時(shí)訪問(wèn)網(wǎng)站的列表信息用戶、訪問(wèn)的網(wǎng)站列表、訪問(wèn)時(shí)間列表;從搜索關(guān)鍵詞信息用戶、搜索的關(guān)鍵詞、搜索時(shí)間;得到這個(gè)用戶搜索了哪些關(guān)鍵詞以及何時(shí)搜索該關(guān)鍵詞的列表信息用戶、搜索的關(guān)鍵詞列表、搜索時(shí)間列表;(2)Job2 :由于從Jobl得到每個(gè)用戶的一系列上網(wǎng)行為信息,這些信息包括用戶訪問(wèn)的所有網(wǎng)站和搜索的所有關(guān)鍵詞以及這些行為發(fā)生的時(shí)間,因此根據(jù)每一個(gè)用戶的用戶號(hào)進(jìn)行關(guān)聯(lián)得到網(wǎng)站和關(guān)鍵詞的對(duì)應(yīng)信息訪問(wèn)的網(wǎng)站、搜索的關(guān)鍵詞;其中這些對(duì)應(yīng)關(guān)系加上了時(shí)間窗口(如IHour)的限制,因?yàn)橐粋€(gè)用戶在瀏覽網(wǎng)頁(yè)時(shí)有時(shí)會(huì)刷新網(wǎng)頁(yè),在這里我們只計(jì)算一次,即一個(gè)時(shí)間段內(nèi)用戶訪問(wèn)了多次某個(gè)網(wǎng)站和搜索了某個(gè)關(guān)鍵詞時(shí)只算一次。(3)Job3 :統(tǒng)計(jì)訪問(wèn)網(wǎng)站和關(guān)鍵詞的頻次,得到的數(shù)據(jù)如下訪問(wèn)的網(wǎng)站,搜索的關(guān)鍵詞,兩者出現(xiàn)的頻次;(4) Job4:得到了網(wǎng)站和相應(yīng)的關(guān)鍵詞信息后,就可以統(tǒng)計(jì)兩者之間的相關(guān)性了,Job4可以得到如下的數(shù)據(jù)信息訪問(wèn)的網(wǎng)站,搜索的關(guān)鍵詞,關(guān)鍵詞出現(xiàn)的頻次n,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m,兩者的比例r(m/n) ;r反映了這個(gè)關(guān)鍵詞在多大程度上與目標(biāo)網(wǎng)站的相關(guān)聯(lián),即訪問(wèn)某個(gè)網(wǎng)站的人更傾向搜索某些關(guān)鍵詞的程度;(5) Job5:根據(jù)上述步驟得到的信息中一個(gè)網(wǎng)站可能會(huì)在多行出現(xiàn),為了得出的結(jié)果更于方便查看,在Job5里面合并這些網(wǎng)站,并且統(tǒng)計(jì)出該網(wǎng)站出現(xiàn)的頻次訪問(wèn)的網(wǎng)站,該網(wǎng)站出現(xiàn)的頻次,搜索的關(guān)鍵詞1,關(guān)鍵詞出現(xiàn)的頻次nl,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次ml,兩者的比例rl(ml/nl),搜索的關(guān)鍵詞2,關(guān)鍵詞出現(xiàn)的頻次n2,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m2,兩者的比例r2(m2/n2)以此類推。本發(fā)明顯著優(yōu)點(diǎn)在于傳統(tǒng)方法從單個(gè)網(wǎng)站出發(fā),只能獲取本網(wǎng)站的用戶訪問(wèn)網(wǎng)站、搜索關(guān)鍵字和點(diǎn)擊廣告的信息。本方案與裝置引入網(wǎng)關(guān)設(shè)備,可以獲取跨網(wǎng)所有用戶的通信網(wǎng)絡(luò)報(bào)文,從而可以得到用戶在全網(wǎng)的的上網(wǎng)行為,進(jìn)而可以對(duì)用戶的上網(wǎng)行為進(jìn)行準(zhǔn)確關(guān)聯(lián),提高了關(guān)聯(lián)分析方法的準(zhǔn)確性。
圖I為本發(fā)明所述基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法中關(guān)鍵字分析方法示意圖。
具體實(shí)施方式
·現(xiàn)結(jié)合說(shuō)明書(shū)附圖I介紹本發(fā)明所述的基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法
具體實(shí)施例方式一種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,通過(guò)如下方法步驟來(lái)實(shí)現(xiàn)(I)在現(xiàn)有網(wǎng)絡(luò)上部署多個(gè)網(wǎng)關(guān),從網(wǎng)絡(luò)報(bào)文中提取用戶行為信息;(2)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵;(3)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些廣告或者網(wǎng)站。所述用戶行為信息可分為如下三種訪問(wèn)網(wǎng)站、搜索引擎查詢關(guān)鍵字和點(diǎn)擊廣告行為,所述訪問(wèn)網(wǎng)站信息為用戶在某個(gè)時(shí)刻訪問(wèn)某個(gè)網(wǎng)站所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、訪問(wèn)的網(wǎng)站、訪問(wèn)時(shí)間,所述搜索引擎查詢關(guān)鍵字信息為用戶在某個(gè)時(shí)刻搜索某個(gè)關(guān)鍵字所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、搜索的關(guān)鍵詞、搜索時(shí)間;所述點(diǎn)擊廣告行為信息為用戶在某個(gè)時(shí)刻點(diǎn)擊某個(gè)廣告所產(chǎn)生的信息,對(duì)應(yīng)產(chǎn)生一條日志信息用戶、點(diǎn)擊的廣告、點(diǎn)擊時(shí)間。所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的人群更傾向于搜索哪些關(guān)鍵詞中所述用戶行為信息的數(shù)據(jù)來(lái)源為訪問(wèn)網(wǎng)站信息和搜索引擎查詢關(guān)鍵字信息。所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵詞通過(guò)五個(gè)MapReduce程序?qū)崿F(xiàn)(I)Jobl :從訪問(wèn)網(wǎng)站的日志信息(用戶、訪問(wèn)的網(wǎng)站、訪問(wèn)時(shí)間)得到這個(gè)用戶訪問(wèn)了哪些網(wǎng)站、何時(shí)訪問(wèn)網(wǎng)站的列表信息用戶、訪問(wèn)的網(wǎng)站列表、訪問(wèn)時(shí)間列表;從搜索關(guān)鍵詞信息用戶、搜索的關(guān)鍵詞、搜索時(shí)間;得到這個(gè)用戶搜索了哪些關(guān)鍵詞以及何時(shí)搜索該關(guān)鍵詞的列表信息用戶、搜索的關(guān)鍵詞列表、搜索時(shí)間列表;(2)Job2 :由于從Jobl得到每個(gè)用戶的一系列上網(wǎng)行為信息,這些信息包括用戶訪問(wèn)的所有網(wǎng)站和搜索的所有關(guān)鍵詞以及這些行為發(fā)生的時(shí)間,因此根據(jù)每一個(gè)用戶的用戶號(hào)進(jìn)行關(guān)聯(lián)得到網(wǎng)站和關(guān)鍵詞的對(duì)應(yīng)信息訪問(wèn)的網(wǎng)站、搜索的關(guān)鍵詞;其中這些對(duì)應(yīng)關(guān)系加上了時(shí)間窗口(如IHour)的限制,因?yàn)橐粋€(gè)用戶在瀏覽網(wǎng)頁(yè)時(shí)有時(shí)會(huì)刷新網(wǎng)頁(yè),在這里我們只計(jì)算一次,即一個(gè)時(shí)間段內(nèi)用戶訪問(wèn)了多次某個(gè)網(wǎng)站和搜索了某個(gè)關(guān)鍵詞時(shí)只
算一次。(3)Job3 :統(tǒng)計(jì)訪問(wèn)網(wǎng)站和關(guān)鍵詞的頻次,得到的數(shù)據(jù)如下訪問(wèn)的網(wǎng)站,搜索的關(guān)鍵詞,兩者出現(xiàn)的頻次;(4) Job4:得到了網(wǎng)站和相應(yīng)的關(guān)鍵詞信息后,就可以統(tǒng)計(jì)兩者之間的相關(guān)性了,Job4可以得到如下的數(shù)據(jù)信息訪問(wèn)的網(wǎng)站,搜索的關(guān)鍵詞,關(guān)鍵詞出現(xiàn)的頻次n,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m,兩者的比例r(m/n) ;r反映了這個(gè)關(guān)鍵詞在多大程度上與目標(biāo)網(wǎng)站的相關(guān)聯(lián),即訪問(wèn)某個(gè)網(wǎng)站的人更傾向搜索某些關(guān)鍵詞的程度;(5) Job5:根據(jù)上述步驟得到的信息中一個(gè)網(wǎng)站可能會(huì)在多行出現(xiàn),為了得出的結(jié)果更于方便查看,在Job5里面合并這些網(wǎng)站,并且統(tǒng)計(jì)出該網(wǎng)站出現(xiàn)的頻次訪問(wèn)的網(wǎng)站,該網(wǎng)站出現(xiàn)的頻次,搜索的關(guān)鍵詞1,關(guān)鍵詞出現(xiàn)的頻次nl,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次ml,兩者的比例rl(ml/nl),搜索的關(guān)鍵詞2,關(guān)鍵詞出現(xiàn)的頻次n2,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的 頻次m2,兩者的比例r2(m2/n2)以此類推。本發(fā)明不限于上述實(shí)施方式,對(duì)于本領(lǐng)域普通技術(shù)人員而言,對(duì)上述實(shí)施方式所做出的任何顯而易見(jiàn)的改進(jìn)或變更,都不會(huì)超出本發(fā)明的構(gòu)思和所附權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.ー種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,其特征在于通過(guò)如下方法步驟來(lái)實(shí)現(xiàn) (1)在現(xiàn)有網(wǎng)絡(luò)上部署多個(gè)網(wǎng)關(guān),從網(wǎng)絡(luò)報(bào)文中提取用戶行為信息; (2)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵詞; (3)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些廣告或者網(wǎng)站。
2.根據(jù)權(quán)利要求I所述的ー種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,其特征在于所述用戶行為信息可分為如下三種訪問(wèn)網(wǎng)站、搜索引擎查詢關(guān)鍵字和點(diǎn)擊廣告行為,所述訪問(wèn)網(wǎng)站信息為用戶在某個(gè)時(shí)刻訪問(wèn)某個(gè)網(wǎng)站所產(chǎn)生的信息;所述搜索引擎查詢關(guān)鍵字信息為用戶在某個(gè)時(shí)刻捜索某個(gè)關(guān)鍵字所產(chǎn)生的信息;所述點(diǎn)擊廣告行為信息為用戶在某個(gè)時(shí)刻點(diǎn)擊某個(gè)廣告所產(chǎn)生的信息。
3.根據(jù)權(quán)利要求I所述的ー種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,其特征在于所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵詞中,所述用戶行為信息的數(shù)據(jù)來(lái)源為訪問(wèn)網(wǎng)站信息和搜索引擎查詢關(guān)鍵字信息。
4.根據(jù)權(quán)利要求I或3所述的ー種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,其特征在于所述通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的的人群更傾向于搜索哪些關(guān)鍵詞通過(guò)如下步驟實(shí)現(xiàn) (1)Jobl:從訪問(wèn)網(wǎng)站的日志信息用戶得到這個(gè)用戶訪問(wèn)了哪些網(wǎng)站、何時(shí)訪問(wèn)網(wǎng)站的列表信息;從搜索關(guān)鍵詞信息得到這個(gè)用戶搜索了哪些關(guān)鍵詞以及何時(shí)搜索該關(guān)鍵詞的列表信息; (2)Job2:由于從Jobl我們得到每個(gè)用戶的一系列上網(wǎng)行為信息,這些信息包括用戶訪問(wèn)的所有網(wǎng)站和捜索的所有關(guān)鍵詞以及這些行為發(fā)生的時(shí)間,因此根據(jù)每ー個(gè)用戶的用戶號(hào)進(jìn)行關(guān)聯(lián)得到網(wǎng)站和關(guān)鍵詞的對(duì)應(yīng)信息訪問(wèn)的網(wǎng)站、捜索的關(guān)鍵詞;其中這些對(duì)應(yīng)關(guān)系加上了時(shí)間窗ロ的限制。
(3)Job3:統(tǒng)計(jì)訪問(wèn)網(wǎng)站和關(guān)鍵詞的頻次,得到的數(shù)據(jù)如下訪問(wèn)的網(wǎng)站、捜索的關(guān)鍵詞,兩者出現(xiàn)的頻次; (4)Job4:得到了網(wǎng)站和相應(yīng)的關(guān)鍵詞信息后,就可以統(tǒng)計(jì)兩者之間的相關(guān)性了,Job4可以得到如下的數(shù)據(jù)信息訪問(wèn)的網(wǎng)站、捜索的關(guān)鍵詞,關(guān)鍵詞出現(xiàn)的頻次n,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m,兩者的比例r(m/n) ;r反映了這個(gè)關(guān)鍵詞在多大程度上與目標(biāo)網(wǎng)站的相關(guān)聯(lián),即訪問(wèn)某個(gè)網(wǎng)站的人更傾向捜索某些關(guān)鍵詞的程度; (5)Job5:根據(jù)上述步驟得到的信息中一個(gè)網(wǎng)站可能會(huì)在多行出現(xiàn),為了得出的結(jié)果更于方便查看,在Job5里面合并這些網(wǎng)站,并且統(tǒng)計(jì)出該網(wǎng)站出現(xiàn)的頻次訪問(wèn)的網(wǎng)站,該網(wǎng)站出現(xiàn)的頻次,捜索的關(guān)鍵詞1,關(guān)鍵詞出現(xiàn)的頻次nl,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次ml,兩者的比例rl (ml/nl),捜索的關(guān)鍵詞2,關(guān)鍵詞出現(xiàn)的頻次n2,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m2,兩者的比例r2(m2/n2)以此類推。
全文摘要
本發(fā)明涉及一種基于跨網(wǎng)通信網(wǎng)絡(luò)報(bào)文的用戶行為關(guān)聯(lián)分析方法,其特征在于通過(guò)如下方法步驟來(lái)實(shí)現(xiàn)(1)在現(xiàn)有網(wǎng)絡(luò)上部署多個(gè)網(wǎng)關(guān),從網(wǎng)絡(luò)報(bào)文中提取用戶行為信息;(2)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的人群更傾向于搜索哪些關(guān)鍵詞;(3)通過(guò)用戶行為信息綜合分析得到訪問(wèn)某個(gè)網(wǎng)站的人群更傾向于搜索哪些廣告或者網(wǎng)站,該方法能使當(dāng)用戶訪問(wèn)一個(gè)網(wǎng)站的時(shí)候,推薦其感興趣的其他同類網(wǎng)站;當(dāng)用戶搜索一個(gè)關(guān)鍵字時(shí),給他推薦更為準(zhǔn)確的相關(guān)網(wǎng)站;當(dāng)用戶訪問(wèn)某個(gè)網(wǎng)站時(shí),推薦系統(tǒng)給他推薦可能感興趣的廣告,從而可以提高廣告投放的精準(zhǔn)性。
文檔編號(hào)G06F17/30GK102831124SQ20111016210
公開(kāi)日2012年12月19日 申請(qǐng)日期2011年6月16日 優(yōu)先權(quán)日2011年6月16日
發(fā)明者劉書(shū)良, 羅峰, 黃蘇支, 李娜, 王琪, 張玉波, 閻飛飛, 劉生, 肖燕京 申請(qǐng)人:北京億贊普網(wǎng)絡(luò)技術(shù)有限公司