本發(fā)明涉及移動網(wǎng)絡(luò)技術(shù),特別是涉及一種基于移動用戶位置和用戶行為的商圈信息推送方法的技術(shù)。
背景技術(shù):
移動互聯(lián)網(wǎng)的高速發(fā)展,除了帶來龐大的移動用戶上網(wǎng)行為數(shù)據(jù),同時也帶來了無限的商機可能,更多的商戶希望借助移動互聯(lián)網(wǎng)完成自己的商業(yè)廣告推送業(yè)務(wù),從而獲取更多的商機,然而如何在面對龐大移動用戶群的前提下進行精確商戶廣告推送業(yè)務(wù),成為了目前技術(shù)的一大難題,如何確保將用戶感興趣的商戶廣告信息及時、準確地推送到最大可能性的潛在消費用戶的終端上,成為了當(dāng)下各行業(yè)中研究的重點內(nèi)容
現(xiàn)有的商圈信息推送方法都沒有針對性,普遍采用區(qū)域廣播方式進行商戶廣告信息內(nèi)容推送,相對成本較大,收效卻甚微,導(dǎo)致移動用戶收到大量的垃圾信息,一方面給移動用戶造成了干擾,易引起用戶投訴,造成用戶體驗下降,另一方面也有損商圈形象。
技術(shù)實現(xiàn)要素:
針對上述現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種能夠針對用戶實時/準實時位置和用戶行為偏好推送商圈信息,實現(xiàn)針對性的有效推送,從而避免推送過多垃圾信息的基于移動用戶位置和用戶行為的商圈信息推送方法。
為了解決上述技術(shù)問題,本發(fā)明所提供的一種基于移動用戶位置和用戶行為的商圈信息推送方法,其特征在于,具體步驟如下:
1)設(shè)定各個商圈的商圈地理有效范圍,并獲取移動網(wǎng)絡(luò)的用戶數(shù)據(jù),并對所獲取的用戶數(shù)據(jù)實施數(shù)據(jù)清洗,清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)中包含有移動網(wǎng)絡(luò)用戶的實時數(shù)據(jù)及上網(wǎng)行為歷史數(shù)據(jù);
2)對清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)進行用戶位置坐標(biāo)定位,根據(jù)移動網(wǎng)絡(luò)用戶所接收到的移動網(wǎng)絡(luò)基站信號發(fā)射場強,及移動網(wǎng)絡(luò)用戶所接收到的移動網(wǎng)絡(luò)基站信號的單向時延或往返時延,利用三角定位結(jié)合無線電波空間路徑損耗計算方法,得到移動網(wǎng)絡(luò)用戶的當(dāng)前位置信息;
3)將移動網(wǎng)絡(luò)用戶的當(dāng)前位置信息與各個商圈的商圈地理有效范圍進行關(guān)聯(lián)匹配,找出移動網(wǎng)絡(luò)用戶當(dāng)前位置所在的商圈;
4)根據(jù)清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)中的上網(wǎng)行為歷史數(shù)據(jù),構(gòu)建移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好畫像模型;
5)根據(jù)移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好畫像模型,對移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好進行分級,得到移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量;
6)將移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與所在商圈內(nèi)的商戶信息進行相似度匹配分析,計算移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的各個商戶的特征向量的余弦相似度,并通過移動網(wǎng)絡(luò)將相似度最高的各個商戶的商戶信息推送給移動網(wǎng)絡(luò)用戶。
進一步的,預(yù)先設(shè)定商圈內(nèi)的熱門商戶,如果移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的各個商戶的特征向量的余弦相似度完全不匹配,則通過移動網(wǎng)絡(luò)將移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的熱門商戶的商戶信息推送給移動網(wǎng)絡(luò)用戶。
本發(fā)明提供的基于移動用戶位置和用戶行為的商圈信息推送方法,基于移動網(wǎng)絡(luò)基站信號實現(xiàn)移動用戶的定位,并根據(jù)移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好有目標(biāo)性的對移動用戶推送商圈用戶信息,實現(xiàn)針對性的有效推送,從而能避免推送過多垃圾信息。
附圖說明
圖1是本發(fā)明實施例的基于移動用戶位置和用戶行為的商圈信息推送方法的流程圖;
圖2是本發(fā)明實施例的基于移動用戶位置和用戶行為的商圈信息推送方法的具體實施方式流程圖。
具體實施方式
以下結(jié)合附圖說明對本發(fā)明的實施例作進一步詳細描述,但本實施例并不用于限制本發(fā)明,凡是采用本發(fā)明的相似結(jié)構(gòu)及其相似變化,均應(yīng)列入本發(fā)明的保護范圍,本發(fā)明中的頓號均表示和的關(guān)系。
如圖1所示,本發(fā)明實施例所提供的一種基于移動用戶位置和用戶行為的商圈信息推送方法,具體步驟如下:
1)設(shè)定各個商圈的商圈地理有效范圍,并獲取移動網(wǎng)絡(luò)的用戶數(shù)據(jù),并對所獲取的用戶數(shù)據(jù)實施數(shù)據(jù)清洗,清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)中包含有移動網(wǎng)絡(luò)用戶的實時數(shù)據(jù)及上網(wǎng)行為歷史數(shù)據(jù)(上網(wǎng)行為是指訪問互聯(lián)網(wǎng)的行為);
移動網(wǎng)絡(luò)的用戶數(shù)據(jù)一般通過運營商網(wǎng)絡(luò)實時采集,用戶歷史上網(wǎng)行為數(shù)據(jù)也可從現(xiàn)有數(shù)據(jù)庫中抽??;
對移動網(wǎng)絡(luò)用戶數(shù)據(jù)實施數(shù)據(jù)清洗的方式是對用戶數(shù)據(jù)中的非法數(shù)據(jù)及冗余字段進行過濾,并對用戶數(shù)據(jù)中的超常值(異常值/空值)進行檢測并處理,實現(xiàn)數(shù)據(jù)清洗;
2)對清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)進行用戶位置坐標(biāo)定位,根據(jù)移動網(wǎng)絡(luò)用戶所接收到的移動網(wǎng)絡(luò)基站信號發(fā)射場強,及移動網(wǎng)絡(luò)用戶所接收到的移動網(wǎng)絡(luò)基站信號的單向時延或往返時延,利用三角定位結(jié)合無線電波空間路徑損耗計算方法,得到移動網(wǎng)絡(luò)用戶的當(dāng)前位置信息(即移動網(wǎng)絡(luò)用戶所在位置的具體經(jīng)緯度信息);
定位算法包括室內(nèi)基站單點定位算法、室外基站單點定位算法、室外基站兩點交叉定位算法、室外基站三點交叉定位算法、室外基站多點復(fù)雜交叉定位算法;
3)將移動網(wǎng)絡(luò)用戶的當(dāng)前位置信息與各個商圈的商圈地理有效范圍進行關(guān)聯(lián)匹配,找出移動網(wǎng)絡(luò)用戶當(dāng)前位置所在的商圈;
4)根據(jù)清洗后的移動網(wǎng)絡(luò)用戶數(shù)據(jù)中的上網(wǎng)行為歷史數(shù)據(jù),構(gòu)建移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好畫像模型;
構(gòu)建上網(wǎng)行為偏好畫像的方法為現(xiàn)有技術(shù),該方法根據(jù)移動網(wǎng)絡(luò)用戶的上網(wǎng)行為歷史數(shù)據(jù),創(chuàng)建移動網(wǎng)絡(luò)用戶的上網(wǎng)行為畫像規(guī)則,并對結(jié)果數(shù)據(jù)進行最大最小值歸一化處理,得到消除量綱影響的移動網(wǎng)絡(luò)用戶上網(wǎng)行為偏好刻畫數(shù)據(jù),再進行盒圖(boxplot)分析,并動態(tài)設(shè)定打分閾值,獲得移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好矩陣,完成移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好畫像模型;
5)根據(jù)移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好畫像模型,對移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好進行分級,得到移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量;
6)將移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與所在商圈內(nèi)的商戶信息進行相似度匹配分析,計算移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的各個商戶的特征向量的余弦相似度(商戶的特征向量為預(yù)先設(shè)定),并通過移動網(wǎng)絡(luò)將相似度最高的各個商戶的商戶信息推送給移動網(wǎng)絡(luò)用戶;
預(yù)先設(shè)定商圈內(nèi)的熱門商戶,如果移動網(wǎng)絡(luò)用戶的上網(wǎng)行為偏好向量與移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的各個商戶的特征向量的余弦相似度完全不匹配,則通過移動網(wǎng)絡(luò)將移動網(wǎng)絡(luò)用戶所在商圈內(nèi)的熱門商戶的商戶信息推送給移動網(wǎng)絡(luò)用戶。
如圖2所示,本發(fā)明實施例的具體實施方式如下:
步驟1:明確數(shù)據(jù)規(guī)格,數(shù)據(jù)各字段說明及數(shù)據(jù)量大小評估,利用kafka技術(shù)完成移動網(wǎng)絡(luò)用戶數(shù)據(jù)的實時采集和大數(shù)據(jù)平臺入庫工作,移動用戶歷史上網(wǎng)行為數(shù)據(jù)也可采用sqoop技術(shù)導(dǎo)入到大數(shù)據(jù)平臺的hdfs系統(tǒng)中;
步驟2:將實時采集或?qū)氲奈谋疚募?shù)據(jù)/壓縮文件/采集文件數(shù)據(jù)put到大數(shù)據(jù)分布式存儲系統(tǒng)(hdfs)上,并使用sql根據(jù)數(shù)據(jù)字段說明,建立相應(yīng)hive表;對數(shù)據(jù)中非法數(shù)據(jù)及冗余字段進行過濾;對數(shù)據(jù)中超常值(異常值/空值)進行檢測并處理;
步驟3:對清洗后的當(dāng)前用戶數(shù)據(jù)進行實時/準實時用戶位置坐標(biāo)定位,定位算法采用scala語言利用spark的高效分布式計算系統(tǒng)實現(xiàn),算法原理基于移動用戶接收上報的運營商基站信號發(fā)射場強及時延,利用無線電波空間路徑損耗結(jié)合三角定位技術(shù),并擴展為:室內(nèi)基站單點定位算法、室外基站單點定位算法/兩點交叉定位算法/三點交叉定位算法/多點復(fù)雜交叉定位算法,定位移動用戶所在位置的具體經(jīng)緯度信息;
步驟4:將步驟3結(jié)果中的移動用戶的實時/準實時位置信息結(jié)合商圈地理有效范圍信息,實現(xiàn)對落在具體商圈有效范圍內(nèi)移動用戶的關(guān)聯(lián)匹配;
步驟5:基于移動用戶的移動互聯(lián)網(wǎng)歷史行為數(shù)據(jù),完成用戶偏好畫像,根據(jù)用戶歷史訪問的appid和host,創(chuàng)建用戶行為畫像規(guī)則,對結(jié)果數(shù)據(jù)進行最大最小值歸一化處理,得到消除量綱影響的用戶上網(wǎng)行為偏好刻畫數(shù)據(jù),再進行boxplot分析,動態(tài)設(shè)定打分閾值,獲得每個用戶上網(wǎng)行為偏好矩陣,完成用戶畫像模型;
步驟6:基于自定義rule規(guī)則,完成用戶上網(wǎng)行為打分(偏好標(biāo)簽打分)及誤差校正,輸出用戶畫像模型結(jié)果數(shù)據(jù);
步驟7:將步驟4結(jié)果中的移動用戶當(dāng)前位置歸屬的商圈內(nèi)的商戶信息與用戶的畫像模型結(jié)果數(shù)據(jù)進行相似度匹配分析,計算商圈內(nèi)的用戶偏好向量與每個商戶的特征向量的余弦相似度,并將結(jié)果中匹配度最高的推薦商戶信息發(fā)送到消息隊列中;對于用戶畫像模型與該商圈內(nèi)商戶信息無法匹配的,則根據(jù)熱門商戶統(tǒng)計結(jié)果,將熱門商戶信息發(fā)送到消息隊列中。
步驟8:消息隊列中的商戶推送信息通過運營商的短信網(wǎng)關(guān)及時發(fā)送給用戶,完成整個商戶信息推送過程。