軟件開發(fā)、移動(dòng)網(wǎng)絡(luò)、大數(shù)據(jù)、推薦算法、數(shù)據(jù)挖掘、用戶畫像、行為分析、標(biāo)簽庫。
背景技術(shù):
:用戶畫像(userprofile)又稱用戶角色(persona),是真實(shí)用戶的虛擬代表,根據(jù)用戶的目標(biāo)、行為和觀點(diǎn)的差異的調(diào)研去了解用戶,將他們區(qū)分為不同的類型,然后每種類型中抽取出典型特征,賦予名字、照片、一些人口統(tǒng)計(jì)學(xué)要素、場景等描述,就形成了一個(gè)人物原型,即用戶角色。作為一種勾畫目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具,用戶畫像在實(shí)際操作的過程中往往會(huì)以最為淺顯和貼近生活的話語將用戶的屬性、行為、習(xí)慣與期待聯(lián)結(jié)起來,并根據(jù)這些信息而抽象出的一個(gè)標(biāo)簽化的用戶模型,即給用戶貼“標(biāo)簽”。受互聯(lián)網(wǎng)迅速發(fā)展影響,通過用戶上網(wǎng)行為分析得到的用戶畫像在精準(zhǔn)營銷、用戶統(tǒng)計(jì)、數(shù)據(jù)挖掘、產(chǎn)品設(shè)計(jì)、業(yè)務(wù)經(jīng)營等方面得到了應(yīng)用,例如應(yīng)用在目前流行的程序化廣告交易上,能讓企業(yè)營銷更加精準(zhǔn)、有效提高業(yè)務(wù)轉(zhuǎn)化率。通常,用戶行為分析主要通過對用戶行為監(jiān)測獲得的數(shù)據(jù)進(jìn)行分析,可以讓企業(yè)更加詳細(xì)、清楚地了解用戶的行為習(xí)慣,從而找出網(wǎng)站、推廣渠道等企業(yè)營銷環(huán)境存在的問題。通信運(yùn)營商網(wǎng)絡(luò)中大量的交互數(shù)據(jù)記錄了詳細(xì)的用戶行為特征信息,特別是移動(dòng)通信網(wǎng)絡(luò)中,結(jié)合o域和b域數(shù)據(jù),可以靈活地從用戶基本屬性(用戶號碼、實(shí)名認(rèn)證信息等)、業(yè)務(wù)使用、活躍位置、終端使用、熱點(diǎn)搜索、用戶感知等多維度構(gòu)建用戶全視圖畫像,有效建立多維度用戶標(biāo)簽庫并定期及時(shí)更新。目前,全球各通信運(yùn)營商或互聯(lián)網(wǎng)公司都非常重視各維度用戶標(biāo)簽庫的建設(shè),并不斷利用大數(shù)據(jù)和數(shù)據(jù)挖掘等技術(shù)提升數(shù)據(jù)采集、存儲、運(yùn)算、分析建模和決策的效率和質(zhì)量,但目前用戶標(biāo)簽庫的應(yīng)用個(gè)人用戶應(yīng)用上主要專注于精準(zhǔn)營銷方面,在其他方面發(fā)揮較少。為提升移動(dòng)網(wǎng)絡(luò)運(yùn)營商用戶標(biāo)簽庫的數(shù)據(jù)價(jià)值和應(yīng)范圍,本發(fā)明提出一種基于位置用戶畫像進(jìn)行智能匹配社交目標(biāo)的方法和系統(tǒng),能實(shí)時(shí)為終端用戶提供一種基于位置區(qū)域以及社交目標(biāo)用戶特征匹配的智能推薦服務(wù),也可為交友網(wǎng)站提供實(shí)時(shí)的用戶特征匹配信息。由于本系統(tǒng)使用的用戶標(biāo)簽庫信息是通過實(shí)際網(wǎng)絡(luò)中大量用戶行為數(shù)據(jù)統(tǒng)計(jì)運(yùn)算而得,因此對用戶特征分析具備一定的客觀性,對比交友網(wǎng)站中用戶自己上傳的特征信息更具備可信度;此外,本系統(tǒng)在匹配用戶特征過程中隱藏了用戶具體地址、姓名、電話號碼等敏感信息,具備用戶隱私保護(hù)安全設(shè)置。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提出一種基于位置和用戶畫像進(jìn)行智能匹配社交目標(biāo)的方法和系統(tǒng)。利用該系統(tǒng),終端用戶可通過相關(guān)的手機(jī)應(yīng)用軟件(app)登錄并搜索一定位置區(qū)域范圍內(nèi)與自己特征匹配度(匹配指數(shù))高或互補(bǔ)性(互補(bǔ)指數(shù))高的社交目標(biāo);同時(shí),在用戶允許并保障用戶信息安全的前提下,系統(tǒng)可以主動(dòng)向用戶本人或社交應(yīng)用(網(wǎng)站可能有些局限)推薦用戶標(biāo)簽特征匹配度高或互補(bǔ)性高的社交目標(biāo)。系統(tǒng)主要構(gòu)成有:自主服務(wù)交互界面、開放接口、用戶畫像智能匹配模塊、推薦策略配置庫、分類評分定義信息庫、特征檢索分析模塊、用戶畫像數(shù)據(jù)平臺。系統(tǒng)主要模塊的組成參看說明書附圖之圖1,具體工作原理描述如下:1.自助服務(wù)交互界面(手機(jī)終端服務(wù)軟件app或web頁面等)(1)服務(wù)賬號注冊:為愿意開通服務(wù)的用戶提供注冊登錄頁面,以接受系統(tǒng)提供智能匹配社交目標(biāo)的服務(wù)。(2)范圍圈選:用戶可在地圖上圈選一定的地理范圍并選擇交友目標(biāo)的駐留特征(如:常駐、來訪、所有等等)。(3)特征選擇:提供用戶畫像的多種特征(或標(biāo)簽)給用戶進(jìn)行篩選過濾,也可直接交給系統(tǒng)幫忙選擇,尋找與自己特征匹配度高或互補(bǔ)性高的topn社交目標(biāo)。用戶可對7大特征(文化、經(jīng)濟(jì)、顏值、健康、征信、性格、愛好)進(jìn)行選擇并由交給特征檢索分析模塊對相關(guān)特征的上網(wǎng)業(yè)務(wù)內(nèi)容和業(yè)務(wù)量統(tǒng)計(jì)計(jì)算兩個(gè)用戶各自特征的“強(qiáng)度指數(shù)”。7大特征的表示方法和評估方法如下表格:特征名稱表示方法評估方法文化高、中等偏高、中等、一般,低,或標(biāo)尺評分等通過區(qū)分職業(yè)、專業(yè)類別,閱讀內(nèi)容、關(guān)注內(nèi)容、app使用時(shí)長等數(shù)據(jù)進(jìn)行綜合判斷經(jīng)濟(jì)優(yōu)、良、中、一般,或標(biāo)尺評分等通過通信費(fèi)用套餐、品牌關(guān)注、居住地、消費(fèi)場所、出行特點(diǎn)、終端型號等數(shù)據(jù)進(jìn)行綜合判斷顏值優(yōu)、良、中、一般,或標(biāo)尺評分等通過對用戶上傳照片進(jìn)行圖像識別,以及上傳的身高體重等數(shù)據(jù)進(jìn)行綜合判斷健康優(yōu)、良、中、一般,或標(biāo)尺評分等通過接入第三方應(yīng)用的用戶行走數(shù)據(jù)、騎行app數(shù)據(jù)、旅行app數(shù)據(jù)等進(jìn)行綜合判斷征信征信分值通過用戶套餐、欠費(fèi)記錄、實(shí)名登記、在網(wǎng)時(shí)長等情況進(jìn)行評估。性格開朗、平和、節(jié)假日活躍、節(jié)假日宅家app使用活躍度、出行活躍度,動(dòng)態(tài)運(yùn)行軌跡等數(shù)據(jù)進(jìn)行綜合判斷愛好例如主要業(yè)務(wù)標(biāo)簽排列:視頻、旅游、購物、美食、運(yùn)動(dòng)、游戲、音樂、閱讀、新聞、棋牌、理財(cái),并顯示標(biāo)尺評分通過計(jì)算用戶一段時(shí)間各類業(yè)務(wù)的使用時(shí)長(或業(yè)務(wù)量)與設(shè)定的門限值對比進(jìn)行打分,或者與全網(wǎng)用戶的平均水平對比進(jìn)行打分(4)主動(dòng)推薦:在用戶允許并保障用戶信息安全的前提下(如可由用戶選擇在被推薦時(shí)是否隱藏手機(jī)號、姓名等敏感信息),系統(tǒng)提供向用戶終端應(yīng)用(或接入的第三方應(yīng)用)推薦匹配的社交目標(biāo)信息,如匹配評估結(jié)果(7大特征“匹配指數(shù)”、愛好“強(qiáng)度指數(shù)”)、賬號名(或昵稱)、頭像等。(5)即時(shí)通信:系統(tǒng)提供給用戶與推薦的社交目標(biāo)進(jìn)行對話、留言、發(fā)送媒體文件、為頭像點(diǎn)贊等功能。(6)推薦評分:系統(tǒng)為用戶提供對推薦的社交目標(biāo)是否有效的結(jié)果反饋功能。2.開放接口(api,sdk等)(1)推薦服務(wù):系統(tǒng)開放推薦服務(wù)接口,第三方應(yīng)用可以通過該接口進(jìn)行調(diào)用,傳入當(dāng)前用戶位置,用戶號碼及圈選范圍等參數(shù),即可得到與該用戶匹配的社交目標(biāo)推薦列表。(2)應(yīng)用數(shù)據(jù)接入服務(wù):系統(tǒng)開放數(shù)據(jù)接入服務(wù)接口,第三方應(yīng)用可以通過該接口上傳應(yīng)用數(shù)據(jù),在智能匹配社交目標(biāo)時(shí)會(huì)使用第三方應(yīng)用數(shù)據(jù)進(jìn)行綜合分析匹配。3.特征檢索分析模塊該模塊主要提供通過用戶標(biāo)識(如:用戶手機(jī)號碼),調(diào)用用戶畫像數(shù)據(jù)平臺接口獲取到該用戶的用戶畫像及特征數(shù)據(jù),加載分類評分定義信息庫的分類規(guī)則與評分標(biāo)準(zhǔn),并結(jié)合業(yè)務(wù)內(nèi)容和業(yè)務(wù)量統(tǒng)計(jì)數(shù)據(jù)對特征的強(qiáng)度指數(shù)進(jìn)行計(jì)算。4.用戶畫像智能匹配模塊該模塊通過特征檢索分析模塊獲取當(dāng)前用戶的畫像特征及強(qiáng)度指數(shù)數(shù)據(jù),以及圈選范圍內(nèi)的其他目標(biāo)用戶的畫像特征及強(qiáng)度指數(shù)數(shù)據(jù),并結(jié)合兩者的數(shù)據(jù)進(jìn)行分析,其中涉及對畫像的匹配指數(shù)、互補(bǔ)指數(shù)進(jìn)行計(jì)算和關(guān)聯(lián)分析匹配,并結(jié)合用戶反饋的推薦評分結(jié)果進(jìn)行綜合分析,匹配的結(jié)果根據(jù)特定的規(guī)則(規(guī)則通過推薦策略配置庫獲?。┻M(jìn)行排序過濾,將匹配結(jié)果返回給交互界面,將合適的目標(biāo)對象推薦給用戶。5.推薦策略配置庫該配置庫主要用來定義和存儲推薦策略規(guī)則,包括:用戶選擇匹配范圍配置(如用戶可選擇的匹配范圍閾值)、推薦策略(相似性或互補(bǔ)性)、排序規(guī)則、過濾規(guī)則、topn設(shè)置等,并為用戶畫像智能匹配模塊推薦策略規(guī)則進(jìn)行綜合分析。6.分類評分定義信息庫該信息庫主要存儲特征的分類信息與評分標(biāo)準(zhǔn)。如文化:在定義文化的評分規(guī)則(高、中、低)時(shí),需要對閱讀量和內(nèi)容進(jìn)行評估和分類,如經(jīng)常訪問文學(xué)作品,經(jīng)濟(jì)周刊,論文等,列為評判高文化優(yōu)先考慮因素;如愛好:在定義旅游愛好者的評分規(guī)則(熱愛、有興趣、有關(guān)注等)時(shí),需要對其訪問內(nèi)容進(jìn)行分類,如經(jīng)常訪問旅游網(wǎng)站,出行訂票,訪問旅游雜志周刊等信息列為旅游熱愛程度優(yōu)化考慮因素。。該信息庫存儲了定義7大特征強(qiáng)度指數(shù)的評估方法。如“文化”特征通過計(jì)算訪問文學(xué)類、經(jīng)濟(jì)類、新聞?lì)?、科技類等網(wǎng)站或欄目的頻率占比。評分標(biāo)準(zhǔn)如下:訪問文學(xué)類網(wǎng)站的頻率占比80%及以上為5分,60%-80%為4分,40%-60%為3分,20%-40%為2分,0-20%為1分;訪問經(jīng)濟(jì)類網(wǎng)站的頻率占比80%及以上為5分,60%-80%為4分,40%-60%為3分,20%-40%為2分,0-20%為1分。等等如上述這些評分定義,綜合這些規(guī)則的評分為“文化”這個(gè)屬性的表示方法分類為高、中等偏高、中、一般、低。特征檢索分析模塊通過加載該信息庫數(shù)據(jù)進(jìn)行特征的強(qiáng)度指數(shù)計(jì)算。7.用戶畫像數(shù)據(jù)平臺用戶畫像及特征數(shù)據(jù)主要來源于:信息資源庫(性別、年齡段等),用戶行為及軌跡信息庫(使用套餐、訪問行為、經(jīng)緯度,用戶運(yùn)行軌跡,常駐位置等),業(yè)務(wù)量統(tǒng)計(jì)信息庫(arpu、流量分布、訪問時(shí)長,訪問頻率等),移動(dòng)網(wǎng)絡(luò)信令平臺(主被叫信令詳單、位置更新詳單、切換詳單、s1-u/gb/iups/等接口上網(wǎng)詳單等),第三方應(yīng)用數(shù)據(jù)庫(騎行數(shù)據(jù)、訂單數(shù)據(jù)、行走數(shù)據(jù)等)。附圖說明圖1是特征智能匹配系統(tǒng)主要模塊組成示意圖。圖2是特征智能匹配系統(tǒng)的業(yè)務(wù)應(yīng)用過程示意圖。具體實(shí)施方式下面通過實(shí)例詳細(xì)說明具體實(shí)施方式。這里以本發(fā)明的系統(tǒng)應(yīng)用于社交目標(biāo)推薦場景的業(yè)務(wù)處理流程進(jìn)行說明,所選用的實(shí)例僅用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。特征智能匹配系統(tǒng)推薦社交目標(biāo)的業(yè)務(wù)處理流程參看說明書附圖之圖2,具體過程說明如下:step1:用戶提交匹配請求,內(nèi)容包含用戶手機(jī)號碼,用戶實(shí)時(shí)位置信息,圈選的地理范圍信息(如:5km等),以及用戶所關(guān)注的社交目標(biāo)特征(如:音樂愛好、旅游愛好等)。step2:特征檢索分析模塊接受到用戶提交的匹配條件,會(huì)分為如下兩個(gè)步驟進(jìn)行檢索:a.根據(jù)當(dāng)前用戶手機(jī)號碼,通過用戶畫像數(shù)據(jù)平臺獲取該用戶所符合的畫像特征以及每個(gè)特征的業(yè)務(wù)量統(tǒng)計(jì)情況。b.根據(jù)當(dāng)前用戶的實(shí)時(shí)位置信息、圈選的地理范圍,通過用戶畫像數(shù)據(jù)平臺獲取該范圍內(nèi)其他用戶的信息和畫像特征,以及每個(gè)用戶的7大特征業(yè)務(wù)量統(tǒng)計(jì)情況。特征檢索分析模塊通過加載業(yè)務(wù)量統(tǒng)計(jì)數(shù)據(jù),以及加載分類評分定義信息庫的規(guī)則數(shù)據(jù),對畫像7大特征屬性的“強(qiáng)度指數(shù)”進(jìn)行計(jì)算,如從上網(wǎng)業(yè)務(wù)類別的統(tǒng)計(jì)可分析出用戶的愛好特征中主要特征標(biāo)簽有:游戲、棋牌、運(yùn)動(dòng)、旅游、購物、美食、音樂、視頻、攝影、閱讀、新聞、理財(cái)?shù)鹊?;音樂愛好者的?biāo)簽“強(qiáng)度指數(shù)”可根據(jù)同一時(shí)段內(nèi),該用戶訪問音樂網(wǎng)站的流量占該用戶總流量的占比(或時(shí)長占比、點(diǎn)擊率占比)進(jìn)行評估;也可以根據(jù)該用戶與全量用戶訪問音樂網(wǎng)站平均流量(或平均時(shí)長、平均點(diǎn)擊率)的差別進(jìn)行評估。用戶畫像數(shù)據(jù)平臺的特征數(shù)據(jù)來源于移動(dòng)網(wǎng)絡(luò)信令平臺、信息資源庫、第三方應(yīng)用數(shù)據(jù)庫。其中:1)移動(dòng)網(wǎng)絡(luò)信令平臺用于采集移動(dòng)網(wǎng)絡(luò)中各設(shè)備間的交互數(shù)據(jù)包(xdr)并進(jìn)行包解析(dpi),其中xdr包括了電路域(cs域)和數(shù)據(jù)域(ps域)控制面和用戶面信令詳單(如:主被叫信令詳單、位置更新詳單、切換詳單、s1-u/gb/iups/等接口上網(wǎng)詳單),解析后的重要數(shù)據(jù)存放于信令平臺中的數(shù)據(jù)庫中,其中重要的數(shù)據(jù)包括了每個(gè)用戶行為上網(wǎng)六要素,如:時(shí)間、地點(diǎn)、終端標(biāo)識號imei、手機(jī)號、內(nèi)容、結(jié)果;2)信息資源庫主要用于存放小區(qū)數(shù)據(jù)庫、終端信息庫、用戶信息庫和業(yè)務(wù)識別庫。小區(qū)數(shù)據(jù)庫:包括小區(qū)id、名稱、網(wǎng)絡(luò)類型、覆蓋類型、經(jīng)緯度、覆蓋場景、行政區(qū)、地市等信息;3)第三方應(yīng)用數(shù)據(jù)庫主要用于存儲第三方應(yīng)用數(shù)據(jù),如騎行數(shù)據(jù)、訂單數(shù)據(jù)、行走數(shù)據(jù),旅游app數(shù)據(jù)等信息。step3:用戶畫像智能匹配模塊加載推薦策略庫的策略規(guī)則信息,得到使用相似性的特征屬性與互補(bǔ)性的特征屬性(性格、愛好),以及topn的配置信息。用戶畫像智能匹配模塊通過加載step1與step2的檢索與分析結(jié)果進(jìn)行匹配。該模塊的匹配算法會(huì)根據(jù)特征的強(qiáng)度指數(shù)進(jìn)行匹配計(jì)算,得到匹配指數(shù)結(jié)果(即兩者的相似程度)。如果采用互補(bǔ)性策略進(jìn)行匹配,則需要將具有互補(bǔ)性的特征進(jìn)行等值轉(zhuǎn)換(如:“活潑”,強(qiáng)度指數(shù)5等值于“內(nèi)斂”,強(qiáng)度指數(shù)5)。兩個(gè)對象相似度采用向量空間余弦相似度的方式進(jìn)行計(jì)算,計(jì)算用戶之間的相似程度,相似度度量的值越小,說明用戶間相似度越小,相似度的值越大說明用戶差異越大。用戶對各種事物的喜愛程度轉(zhuǎn)換為用戶的特征,然后用戶之間的特征向量計(jì)算余弦相似度。余弦相似度用向量空間中兩個(gè)向量夾角的余弦值作為衡量兩個(gè)用戶差異的大小。余弦值越接近1,就表明夾角越接近0度,也就是兩個(gè)向量越相似,這就叫"余弦相似性"。而計(jì)算用戶余弦相似度的公式為:假設(shè)用戶a對體育的強(qiáng)度指數(shù)(即愛好程度)為2,對音樂的強(qiáng)度指數(shù)為3,即a的特征向量為(2,3),即x1=2,y1=3。而用戶b對體育的強(qiáng)度指數(shù)為5,對音樂的強(qiáng)度指數(shù)是1,則b的特征向量為(5,1),即x1=5,y1=1,然后代入上面公式便可以計(jì)算用戶a和b的cos(θ)值,也就是匹配指數(shù)(即相似度)。通過計(jì)算后得到當(dāng)前用戶與范圍內(nèi)(如:5km)的其他用戶的所有匹配指數(shù)(相似度),然后對結(jié)果進(jìn)行排序得到匹配指數(shù)最高topn,并將結(jié)果返回給用戶或社交應(yīng)用。當(dāng)前第1頁12