本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及動(dòng)態(tài)實(shí)時(shí)輸出任意規(guī)格圖片的處理及存儲(chǔ)方法。
背景技術(shù):
移動(dòng)互聯(lián)網(wǎng)時(shí)代正在改變我們每一個(gè)人的生活,在快速變化這個(gè)特點(diǎn)之下,移動(dòng)互聯(lián)網(wǎng)所有的數(shù)據(jù)都是隨時(shí)變化的。特別在個(gè)性化的時(shí)代,針對每一位用戶的需求進(jìn)行個(gè)性化區(qū)分和定位,使每個(gè)人打開電腦或手機(jī),看到的信息內(nèi)容是不一樣的,這樣更加有利于內(nèi)容供應(yīng)商將自己的內(nèi)容進(jìn)行精準(zhǔn)的分發(fā),更加有利于有效幫助企業(yè)主實(shí)現(xiàn)品牌的內(nèi)容發(fā)酵和內(nèi)容的精確傳播。
特別的,在網(wǎng)絡(luò)廣告發(fā)展到今天,已經(jīng)對廣告投放提出了更高的要求:廣告主根據(jù)自己的營銷目標(biāo)要求廣告投放鎖定目標(biāo)受眾,進(jìn)行一對一傳播,提供多終端投放、按照效果計(jì)費(fèi),這就是精準(zhǔn)廣告投放的概念。精準(zhǔn)廣告的發(fā)展速度非常快,有這樣幾個(gè)發(fā)展的階段,第一個(gè)階段是地域定向投放,第二個(gè)階段是根據(jù)客戶的興趣愛好。一個(gè)人去看一篇文章的時(shí)候隨意性是有的,但也是有一定興趣點(diǎn)的,我們通過文章所講的內(nèi)容,把廣告主和他們的目標(biāo)客戶群做一個(gè)匹配聯(lián)系在一起。精準(zhǔn)廣告就是根據(jù)用戶的各種屬性,包括上網(wǎng)瀏覽網(wǎng)頁、社區(qū)互動(dòng)等種種網(wǎng)絡(luò)行為,通過計(jì)算機(jī)相關(guān)技術(shù)來預(yù)測用戶可能的消費(fèi)相關(guān)意向,并根據(jù)這些意向來定向投放廣告的技術(shù)。
目前,行業(yè)內(nèi)普遍采用用戶注冊信息、用戶瀏覽路徑與協(xié)同過濾推薦技術(shù)結(jié)合,將用戶注冊信息與瀏覽路徑作為主要的判斷依據(jù),建立新的用戶預(yù)測模型,通過模型對用戶進(jìn)行預(yù)測推薦。但是,大部分的公司研發(fā)的精準(zhǔn)廣告投放系統(tǒng)或側(cè)重于廣告投放的某個(gè)環(huán)節(jié)(如廣告效果監(jiān)控環(huán)節(jié)),或側(cè)重于某個(gè)領(lǐng)域的精準(zhǔn)廣告投放(如搜索引擎廣告),并沒有形成一個(gè)系統(tǒng)的通用的平臺。
沒有社區(qū)概念的網(wǎng)站很難記錄用戶的瀏覽等互動(dòng)行為并對用戶的行為做出精準(zhǔn)的分析,而作為一個(gè)社區(qū)網(wǎng)站,有不同的頻道和社區(qū)來滿足用戶的訪問或互動(dòng)需求,每天用戶在社區(qū)中不斷訪問、討論、發(fā)帖、回帖、評分等互動(dòng),形成了用戶特有的用戶行為信息,社區(qū)網(wǎng)站可以根據(jù)用戶的這些互動(dòng)行為,可以歸納出用戶的分類,給用戶畫像,繼而可以給用戶推薦想要的內(nèi)容。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種動(dòng)基于社區(qū)用戶行為的內(nèi)容推薦方法及系統(tǒng),可以對社區(qū)中的用戶行為信息進(jìn)行采集、過濾、分析、以及被推薦內(nèi)容的分類存儲(chǔ),并將所述分類存儲(chǔ)后的被推薦內(nèi)容等資源進(jìn)行精準(zhǔn)推薦,提升用戶體驗(yàn)。為此,本發(fā)明提供以下技術(shù)方案:
一種基于社區(qū)用戶行為的內(nèi)容推薦方法,其特征在于,包括以下步驟:步驟1:客戶端接收社區(qū)用戶輸入的請求,所述客戶端將社區(qū)用戶的行為信息設(shè)置在客戶端的cookie中;
步驟2:客戶端將所述客戶端cookie中的所述行為信息發(fā)送至服務(wù)器;
步驟3:所述對服務(wù)器中的所述社區(qū)用戶行為信息進(jìn)行收集與分析;再對于收集到的所述行為信息進(jìn)行預(yù)處理,對不完整的或者不符合規(guī)范的所述行為信息,進(jìn)行清理、歸一化、轉(zhuǎn)換、集成、規(guī)約操作形成規(guī)范的社區(qū)用戶行為信息;
步驟4:所述服務(wù)器中的規(guī)范的所述行為信息上傳并采用hadoop存儲(chǔ);
步驟5:對規(guī)范的所述行為信息進(jìn)行分類;建立不同的社區(qū)用戶模型,所述社區(qū)用戶模型通過社區(qū)用戶人口屬性、行為興趣、地理位置、互動(dòng)行為和購買行為等對社區(qū)用戶進(jìn)行分類;再通過社區(qū)用戶模型生成一個(gè)社區(qū)用戶畫像;
步驟6:根據(jù)所述社區(qū)用戶畫像和被推薦內(nèi)容的標(biāo)簽,采用數(shù)據(jù)推薦計(jì)算公式進(jìn)行匹配計(jì)算排序,得到針對社區(qū)用戶的被推薦內(nèi)容,所述被推薦內(nèi)容及其標(biāo)簽是預(yù)先存儲(chǔ)在服務(wù)器上的帖子內(nèi)容、商家廣告內(nèi)容、活動(dòng)內(nèi)容等內(nèi)容信息。
所述分類包括以下特征:
社區(qū)用戶人口屬性包括:性別、人生階段,人生階段包括:單身、戀愛、親子、教育等;
社區(qū)用戶行為興趣,包括:情感、婚慶、親子、教育、汽車、美食、旅游、時(shí)尚、投資、房產(chǎn)、數(shù)碼、求職、健康等;
社區(qū)用戶地理位置,包括:國家、省份、城市、區(qū)域;
社區(qū)用戶互動(dòng)行為,包括:發(fā)帖、回帖、評分、收藏、咨詢等;
社區(qū)用戶購買行為,包括:下單、支付等。
在采用上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可采用以下進(jìn)一步的技術(shù)方案:
步驟6中,所述被推薦內(nèi)容的標(biāo)簽具體為采用Lucene分詞技術(shù)對所述被推薦內(nèi)容進(jìn)行分詞,對分詞后的各個(gè)詞語進(jìn)行詞頻統(tǒng)計(jì),將詞頻大于設(shè)定閾值的詞語確定為所述內(nèi)容的標(biāo)簽,對所述被推薦內(nèi)容進(jìn)行標(biāo)注。
步驟6中,所述數(shù)據(jù)推薦計(jì)算公式為:所述推薦內(nèi)容的熱度值+(當(dāng)前時(shí)間-被推薦內(nèi)容的發(fā)布時(shí)間)/固定時(shí)間。
根據(jù)所述計(jì)算公式計(jì)算排序權(quán)重值,得到所述被推薦內(nèi)容的對應(yīng)排序權(quán)重值,然后再根據(jù)排序權(quán)重值對被推薦內(nèi)容的進(jìn)行篩選排序,輸出符合社區(qū)用戶的行為特征的被推薦內(nèi)容。
所述系統(tǒng)包括數(shù)據(jù)收集模塊、數(shù)據(jù)過濾模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)推薦模塊;
所述數(shù)據(jù)收集模塊,通過javascript技術(shù)將社區(qū)用戶的行為信息存儲(chǔ)在cookie中,所述數(shù)據(jù)模塊還用于當(dāng)社區(qū)用戶訪問站內(nèi)地址后,將cookie中的行為信息發(fā)送至服務(wù)器,實(shí)現(xiàn)社區(qū)用戶行為信息的采集;
所述數(shù)據(jù)過濾模塊用于完成對所述行為信息的掃描過濾,去除不符規(guī)范的社區(qū)用戶行為信息,并完成對所述行為信息的整理;
所述數(shù)據(jù)存儲(chǔ)模塊用于對過濾后的社區(qū)用戶行為信息進(jìn)行存儲(chǔ),采用hadoop技術(shù)進(jìn)行存儲(chǔ)。
所述數(shù)據(jù)推薦模塊用于針對社區(qū)用戶進(jìn)行被推薦內(nèi)容的匹配、刷選、排序并推薦。
由于采用本發(fā)明的技術(shù)方案,本發(fā)明的有益效果為:本發(fā)明在移動(dòng)客戶端首頁和電腦首頁能進(jìn)行個(gè)性化推薦,“千人千面”,根據(jù)社區(qū)用戶興趣愛好,統(tǒng)一對帖子、圈子、板塊、活動(dòng)、廣告、商品、服務(wù)進(jìn)行個(gè)性化推薦,實(shí)現(xiàn)千人千面的精準(zhǔn)服務(wù);
本發(fā)明通過精準(zhǔn)推薦,被推薦內(nèi)容比傳統(tǒng)的基于固定位置的點(diǎn)擊率提高2到8倍。同時(shí)本技術(shù)實(shí)現(xiàn)了被推薦內(nèi)容隨社區(qū)用戶持續(xù)曝光,曝光數(shù)比傳統(tǒng)位置曝光提高一倍;
本發(fā)明實(shí)現(xiàn)了個(gè)性化關(guān)聯(lián)推薦,通過關(guān)聯(lián)推薦打通帖子、商家、商品、板塊之間的訪問路徑,形成社區(qū)獨(dú)特的生態(tài)系統(tǒng);
本發(fā)明可以實(shí)現(xiàn)精準(zhǔn)廣告投放,提升廣告轉(zhuǎn)化率,提升營業(yè)收入,實(shí)現(xiàn)商業(yè)增值,服務(wù)推送,通過客戶端、短信、微信等渠道,主動(dòng)給社區(qū)用戶推送精準(zhǔn)信息,用于活動(dòng)召集、線下集客、商品促銷、服務(wù)提供。
附圖說明
圖1為本發(fā)明提供的方法流程圖。
圖2為本發(fā)明提供的系統(tǒng)模塊圖。
具體實(shí)施方式
如圖1所示,一種基于社區(qū)用戶行為的內(nèi)容推薦方法,包括以下步驟:步驟1:客戶端接收社區(qū)用戶輸入的請求,所述客戶端將社區(qū)用戶的行為信息設(shè)置在客戶端的cookie中;
步驟2:客戶端將所述客戶端cookie中的所述行為信息發(fā)送至服務(wù)器;
步驟3:所述對服務(wù)器中的所述社區(qū)用戶行為信息進(jìn)行收集與分析;再對于收集到的所述行為信息進(jìn)行預(yù)處理,對不完整的或者不符合規(guī)范的所述行為信息,進(jìn)行清理、歸一化、轉(zhuǎn)換、集成、規(guī)約操作形成規(guī)范的社區(qū)用戶行為信息;
步驟4:所述服務(wù)器中的規(guī)范的所述行為信息上傳并采用hadoop存儲(chǔ);
步驟5:對規(guī)范的所述行為信息進(jìn)行分類;建立不同的社區(qū)用戶模型,所述社區(qū)用戶模型通過社區(qū)用戶人口屬性、行為興趣、地理位置、互動(dòng)行為和購買行為等對社區(qū)用戶進(jìn)行分類;再通過社區(qū)用戶模型生成一個(gè)社區(qū)用戶畫像;
步驟6:根據(jù)所述社區(qū)用戶畫像和被推薦內(nèi)容的標(biāo)簽,采用數(shù)據(jù)推薦計(jì)算公式進(jìn)行匹配計(jì)算排序,得到針對社區(qū)用戶的被推薦內(nèi)容,所述被推薦內(nèi)容及其標(biāo)簽是預(yù)先存儲(chǔ)在服務(wù)器上的帖子內(nèi)容、商家廣告內(nèi)容、活動(dòng)內(nèi)容等內(nèi)容信息。
所述被推薦內(nèi)容的標(biāo)簽具體為采用Lucene分詞技術(shù)對所述被推薦內(nèi)容進(jìn)行分詞,對分詞后的各個(gè)詞語進(jìn)行詞頻統(tǒng)計(jì),將詞頻大于設(shè)定閾值的詞語確定為所述內(nèi)容的標(biāo)簽,對所述被推薦內(nèi)容進(jìn)行標(biāo)注。
所述數(shù)據(jù)推薦計(jì)算公式為:所述推薦內(nèi)容的熱度值+(當(dāng)前時(shí)間-被推薦內(nèi)容的發(fā)布時(shí)間)/固定時(shí)間。
所述分類包括以下特征:
社區(qū)用戶人口屬性包括:性別、人生階段,人生階段包括:單身、戀愛、親子、教育等;
社區(qū)用戶行為興趣,包括:情感、婚慶、親子、教育、汽車、美食、旅游、時(shí)尚、投資、房產(chǎn)、數(shù)碼、求職、健康等;
社區(qū)用戶地理位置,包括:國家、省份、城市、區(qū)域;
社區(qū)用戶互動(dòng)行為,包括:發(fā)帖、回帖、評分、收藏、咨詢等;
社區(qū)用戶購買行為,包括:下單、支付等。
根據(jù)所述計(jì)算公式計(jì)算排序權(quán)重值,得到所述被推薦內(nèi)容的對應(yīng)排序權(quán)重值,然后再根據(jù)排序權(quán)重值對被推薦內(nèi)容的進(jìn)行篩選排序,輸出符合社區(qū)用戶的行為特征的被推薦內(nèi)容。
根據(jù)所述計(jì)算公式計(jì)算排序權(quán)重值,如圖表所示:
表1
得到所述內(nèi)容的對應(yīng)排序權(quán)重值,然后再根據(jù)排序權(quán)重值進(jìn)行被推薦內(nèi)容的篩選排序,輸出符合社區(qū)用戶的行為特征的被推薦內(nèi)容。
如圖2所示,基于社區(qū)用戶行為的內(nèi)容推薦方的系統(tǒng),所述系統(tǒng)包括數(shù)據(jù)收集模塊、數(shù)據(jù)過濾模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)推薦模塊;
所述數(shù)據(jù)收集模塊包括服務(wù)器端和客戶端,所述服務(wù)器端用于行存儲(chǔ),所述客戶端用于生成社區(qū)用戶的行為信息,通過javascript將社區(qū)用戶行為信息設(shè)置在cookie中,當(dāng)社區(qū)用戶訪問站內(nèi)地址后,將cookie中的值發(fā)送至服務(wù)器,實(shí)現(xiàn)社區(qū)用戶行為信息的采集;
所述數(shù)據(jù)過濾模塊包括服務(wù)器,用于完成對社區(qū)用戶行為信息的掃描過濾,去除不符規(guī)范的社區(qū)用戶行為信息,并完成對社區(qū)用戶行為信息的整理;
所述數(shù)據(jù)存儲(chǔ)模塊包括服務(wù)器,用于對過濾后的社區(qū)用戶行為信息進(jìn)行存儲(chǔ),
所述數(shù)據(jù)推薦模塊用于針對社區(qū)用戶的進(jìn)行內(nèi)容的推薦。
具體實(shí)施例如下:按行業(yè)地域投放的比較:
按關(guān)鍵詞投放比較:
本發(fā)明通過精準(zhǔn)推薦,被推薦內(nèi)容比傳統(tǒng)的基于固定位置的點(diǎn)擊率提高2到8倍。經(jīng)過我們對網(wǎng)站的數(shù)據(jù)在使用本發(fā)明前后的點(diǎn)擊率進(jìn)行對比,可以看出數(shù)據(jù)有顯著提高
如上所述,本領(lǐng)域的普通技術(shù)人員閱讀本發(fā)明文件后,根據(jù)本發(fā)明的技術(shù)方案和技術(shù)構(gòu)思無需創(chuàng)造性腦力勞動(dòng)而作出其他各種相應(yīng)的變換方案,均屬于本發(fā)明所保護(hù)的范圍。