一種基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)的制作方法
【專利摘要】為解決現(xiàn)有技術(shù)電信用戶興趣度分析方法存在的不能夠精準(zhǔn)分析電信用戶對(duì)各種電信業(yè)務(wù)或服務(wù)的興趣度,易引起電信用戶的反感或投訴等問題,本發(fā)明提出一種基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng),通過獲取全業(yè)務(wù)環(huán)境下的電信業(yè)務(wù)信息、電信用戶上網(wǎng)行為、用戶業(yè)務(wù)使用信息;運(yùn)用相關(guān)分析法對(duì)用戶標(biāo)簽庫(kù)和電信業(yè)務(wù)信息進(jìn)行分析并形成用戶寬表,針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表數(shù)據(jù)庫(kù)中用戶寬表值及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù);形成“用戶?業(yè)務(wù)”二維興趣度矩陣和“時(shí)間?用戶?業(yè)務(wù)”的三維興趣度矩陣,實(shí)現(xiàn)了電信用戶興趣度的量化分析和精準(zhǔn)分析,為電信業(yè)務(wù)的精準(zhǔn)營(yíng)銷奠定了基礎(chǔ)。
【專利說(shuō)明】
一種基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及電信用戶興趣度分析方法技術(shù)領(lǐng)域,具體涉及到一種基于標(biāo)簽庫(kù)的電 信用戶興趣度分析方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,電信運(yùn)營(yíng)商在傳統(tǒng)的語(yǔ)音和信息方面的收入呈明顯 的下降趨勢(shì),同時(shí),運(yùn)營(yíng)商的業(yè)務(wù)增長(zhǎng)空間由于流量?jī)r(jià)值不斷向0ΤΤ服務(wù)商轉(zhuǎn)移而受到擠 壓,運(yùn)營(yíng)商日益呈現(xiàn)出管道化、邊緣化、低值化的發(fā)展趨勢(shì),因此,實(shí)現(xiàn)對(duì)自身電信業(yè)務(wù)的精 準(zhǔn)營(yíng)銷能夠幫助運(yùn)營(yíng)商攫取更大的價(jià)值。
[0003] 然而,要想實(shí)現(xiàn)對(duì)自身電信業(yè)務(wù)的精準(zhǔn)營(yíng)銷,其前提條件是對(duì)電信用戶對(duì)各種電 信業(yè)務(wù)或服務(wù)的興趣度的精準(zhǔn)分析,并以此分析為基礎(chǔ)向電信用戶進(jìn)行營(yíng)銷,以更精確的 手段進(jìn)行用戶需求挖掘與業(yè)務(wù)營(yíng)銷推廣?,F(xiàn)有技術(shù)電信用戶興趣度分析方法通常采用基于 電信用戶的基本資料、地理位置、通信行為等數(shù)據(jù)的分析和挖掘,從中發(fā)現(xiàn)業(yè)務(wù)運(yùn)營(yíng)規(guī)律, 進(jìn)而開展電信業(yè)務(wù)推薦。但隨著移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,以及用戶使用終端的多樣化,加之 互聯(lián)網(wǎng)上豐富多彩的內(nèi)容和非常復(fù)雜繁瑣的電信用戶行為,使得現(xiàn)有技術(shù)電信用戶興趣度 分析方法不能精準(zhǔn)分析電信用戶對(duì)各種電信業(yè)務(wù)或服務(wù)的興趣度,盲目的營(yíng)銷不僅會(huì)引起 電信用戶的反感,而且極其容易引發(fā)電信用戶的投訴。顯然,現(xiàn)有技術(shù)電信用戶興趣度分析 方法存在著不能夠精準(zhǔn)分析電信用戶對(duì)各種電信業(yè)務(wù)或服務(wù)的興趣度,易引起電信用戶的 反感或投訴等問題。
【發(fā)明內(nèi)容】
[0004] 為解決現(xiàn)有技術(shù)電信用戶興趣度分析方法存在的不能夠精準(zhǔn)分析電信用戶對(duì)各 種電信業(yè)務(wù)或服務(wù)的興趣度,易引起電信用戶的反感或投訴等問題,本發(fā)明提出一種基于 標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)。
[0005] 本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,包括以下步驟:
[0006] S1、獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為信息、信令數(shù)據(jù)、BOSS數(shù)據(jù)、 經(jīng)分?jǐn)?shù)據(jù)和頂EI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化處理包括檢查數(shù)據(jù)一致性, 剔除不一致的數(shù)據(jù)、無(wú)效值和缺失值;
[0007] S2、對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分類,生成用戶寬表并存儲(chǔ)到 用戶寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為屬性,分為地理位置、電信業(yè) 務(wù)關(guān)系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用戶業(yè)務(wù)關(guān)系、渠道信息、渠 道與位置、搜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十二個(gè)類別;
[0008] S3、針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表數(shù)據(jù)庫(kù)中用戶寬表值 及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù);
[0009] S4、根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生成用戶與電信 業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶與某電信業(yè)務(wù) 之間的興趣度;
[0010] S5、在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生成"時(shí)間-用戶-業(yè)務(wù)"的三維 興趣度矩陣。
[0011] 進(jìn)一步的,步驟S1中所述電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、套餐信息和移動(dòng)增 值業(yè)務(wù)信息;所述用戶身份信息包含性別、年齡、教育背景、職業(yè)、所屬行業(yè)和薪資狀況信 息;所述用戶上網(wǎng)行為信息包含用戶上網(wǎng)軌跡、用戶搜索關(guān)鍵字信息和用戶內(nèi)容偏好信息; 所述BOSS信息包含用戶資料、業(yè)務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信息;所述頂EI信息 即用戶終端信息;其中,所述用戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信息、爬蟲技術(shù)和 DPI識(shí)別獲取。
[0012] 進(jìn)一步的,步驟S2中的用戶寬表,包括:
[0013]所述地理位置包含居住地、工作地和行政區(qū)域信息;
[0014] 所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、 增值業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息;
[0015] 所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息;
[0016] 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息;
[0017] 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星 級(jí)信息;
[0018] 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息;
[0019] 所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top 信息;
[0020] 所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息;
[0021] 所述搜索行為主要集中在終端信息,包含是否搜索過各大主流手機(jī)廠商終端信 息;
[0022] 所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信 息;
[0023] 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途 費(fèi)用和套餐外流量溢出值信息;
[0024] 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生 命周期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息
[0025] 其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和 游戲。
[0026] 進(jìn)一步的,步驟S3中針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,包括,針對(duì)步驟S2中 生成的用戶寬表字段進(jìn)行用戶標(biāo)簽定義,使得每個(gè)寬表字段都能劃分為若干個(gè)標(biāo)簽表示, 并且,保證標(biāo)簽定義的合理性和完整性。
[0027] 進(jìn)一步的,步驟S4中根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析 生成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用 戶與某電信業(yè)務(wù)之間的興趣度,包括,
[0028] 所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè)標(biāo)簽的若干個(gè)值按照從低到高的 順序進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都用不同的電信業(yè)務(wù)表示,針對(duì)不 同的電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的 關(guān)聯(lián)程度確定;
[0029] 設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為m(i = l,2, ···!〇,每個(gè)標(biāo)簽相對(duì)于電 信業(yè)務(wù)j的權(quán)重值為Aij(i = 1,2,···!!),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),則某用戶與電信業(yè)務(wù)j的興趣度的計(jì)算公式為:
[0030]
[0031] 對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用 戶-業(yè)務(wù)"二維興趣度矩陣。
[0032] 本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),包括,數(shù)據(jù)和信息采集模塊、數(shù)據(jù) 和信息處理模塊、用戶標(biāo)簽庫(kù)模塊和相關(guān)分析模塊;
[0033] 所述數(shù)據(jù)和信息采集模塊用于獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為 信息、信令數(shù)據(jù)、BOSS數(shù)據(jù)、經(jīng)分?jǐn)?shù)據(jù)和頂EI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化 處理包括檢查數(shù)據(jù)一致性,剔除不一致的數(shù)據(jù)、無(wú)效值和缺失值;
[0034] 所述數(shù)據(jù)和信息處理模塊用于對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分 類,生成用戶寬表并存儲(chǔ)到用戶寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為 屬性,分為地理位置、電信業(yè)務(wù)關(guān)系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用 戶業(yè)務(wù)關(guān)系、渠道信息、渠道與位置、搜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十 二個(gè)類別;
[0035] 所述用戶標(biāo)簽庫(kù)模塊用于針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表 數(shù)據(jù)庫(kù)中用戶寬表值及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù);
[0036] 所述相關(guān)分析模塊用于根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分 析生成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某 用戶與某電信業(yè)務(wù)之間的興趣度;并且,在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生 成"時(shí)間-用戶-業(yè)務(wù)"的三維興趣度矩陣。
[0037] 進(jìn)一步的,所述數(shù)據(jù)和信息采集模塊采集的電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、 套餐信息和移動(dòng)增值業(yè)務(wù)信息;所述用戶身份信息包含性別、年齡、教育背景、職業(yè)、所屬行 業(yè)和薪資狀況信息;所述用戶上網(wǎng)行為信息包含用戶上網(wǎng)軌跡、用戶搜索關(guān)鍵字信息和用 戶內(nèi)容偏好信息;所述BOSS信息包含用戶資料、業(yè)務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信 息;所述頂EI信息即用戶終端信息;其中,所述用戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信 息、爬蟲技術(shù)和DPI識(shí)別獲取。
[0038]進(jìn)一步的,所述用戶寬表分類,包括,
[0039]所述地理位置包含居住地、工作地和行政區(qū)域信息;
[0040] 所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、 增值業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息;
[0041] 所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息;
[0042] 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息;
[0043] 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星 級(jí)信息;
[0044] 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息;
[0045] 所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top 信息;
[0046] 所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息;
[0047] 所述搜索行為主要集中在終端信息,包含是否搜索過各大主流手機(jī)廠商終端信 息;
[0048]所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信 息;
[0049] 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途 費(fèi)用和套餐外流量溢出值信息;
[0050] 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生 命周期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息
[0051 ]其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和 游戲。
[0052]進(jìn)一步的,所述相關(guān)分析模塊根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法 進(jìn)行分析生成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素 均為某用戶與某電信業(yè)務(wù)之間的興趣度,包括,
[0053]所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè)標(biāo)簽的若干個(gè)值按照從低到高的 順序進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都用不同的電信業(yè)務(wù)表示,針對(duì)不 同的電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的 關(guān)聯(lián)程度確定;
[0054] 設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為m(i = l,2, ···!〇,每個(gè)標(biāo)簽相對(duì)于電 信業(yè)務(wù)j的權(quán)重值為Aij(i = 1,2,···!!),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),則某用戶與電信業(yè)務(wù)j的興趣度的計(jì)算公式為:
[0055]
[0056]對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用 戶-業(yè)務(wù)"二維興趣度矩陣。
[0057]本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)的有益技術(shù)效果是獲取了 全業(yè)務(wù)環(huán)境下的電信業(yè)務(wù)信息、電信用戶上網(wǎng)行為、用戶業(yè)務(wù)使用信息;運(yùn)用相關(guān)分析法對(duì) 用戶標(biāo)簽庫(kù)和電信業(yè)務(wù)信息進(jìn)行分析,形成"用戶-業(yè)務(wù)"二維興趣度矩陣和"時(shí)間-用戶-業(yè) 務(wù)"的三維興趣度矩陣,實(shí)現(xiàn)了電信用戶興趣度的量化分析和精準(zhǔn)分析,為電信業(yè)務(wù)的精準(zhǔn) 營(yíng)銷奠定了基礎(chǔ)。
【附圖說(shuō)明】
[0058]附圖1為本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法的步驟示意圖;
[0059]附圖2是本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng)的結(jié)構(gòu)示意圖。
[0060]下面結(jié)合附圖對(duì)本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)作進(jìn)一步 的說(shuō)明。
【具體實(shí)施方式】
[0061] 顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,應(yīng)當(dāng)理解,此處所描 述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0062] 附圖1為本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法的步驟示意圖,由圖可知, 本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,包括以下步驟:
[0063] S1、獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為信息、信令數(shù)據(jù)、BOSS數(shù)據(jù)、 經(jīng)分?jǐn)?shù)據(jù)和頂EI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化處理包括檢查數(shù)據(jù)一致性, 剔除不一致的數(shù)據(jù)、無(wú)效值和缺失值;
[0064] S2、對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分類,生成用戶寬表并存儲(chǔ)到 用戶寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為屬性,分為地理位置、電信 業(yè)務(wù)關(guān)系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用戶業(yè)務(wù)關(guān)系、渠道信息、渠 道與位置、搜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十二個(gè)類別;
[0065] S3、針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表數(shù)據(jù)庫(kù)中用戶寬表值 及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù);
[0066] S4、根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生成用戶與電信 業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶與某電信業(yè)務(wù) 之間的興趣度;
[0067] S5、在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生成"時(shí)間-用戶-業(yè)務(wù)"的三維 興趣度矩陣。
[0068]作為基本信息分類,步驟S1中所述電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、套餐信息 和移動(dòng)增值業(yè)務(wù)信息;所述用戶身份信息包含性別、年齡、教育背景、職業(yè)、所屬行業(yè)和薪資 狀況信息;所述用戶上網(wǎng)行為信息包含用戶上網(wǎng)軌跡、用戶搜索關(guān)鍵字信息和用戶內(nèi)容偏 好信息;所述BOSS信息包含用戶資料、業(yè)務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信息;所述 頂EI信息即用戶終端信息;其中,所述用戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信息、爬蟲 技術(shù)和DPI識(shí)別獲取。
[0069]作為信息統(tǒng)計(jì)或分析的基礎(chǔ),步驟S2中的用戶寬表,包括:
[0070]所述地理位置包含居住地、工作地和行政區(qū)域信息;
[0071]所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、 增值業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息;
[0072]所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息;
[0073] 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息;
[0074] 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星 級(jí)信息;
[0075] 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息;
[0076]所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top 信息;
[0077]所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息;
[0078]所述搜索行為主要集中在終端信息,包含是否搜索過各大主流手機(jī)廠商終端信 息;
[0079] 所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信 息;
[0080] 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途 費(fèi)用和套餐外流量溢出值信息;
[0081] 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生 命周期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息
[0082] 其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和 游戲。
[0083] 標(biāo)簽化處理是本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法的重要步驟之一,步 驟S3中針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,包括,針對(duì)步驟S2中生成的用戶寬表字段 進(jìn)行用戶標(biāo)簽定義,使得每個(gè)寬表字段都能劃分為若干個(gè)標(biāo)簽表示,并且,保證標(biāo)簽定義的 合理性和完整性。
[0084] 采用相關(guān)分析法獲得各個(gè)電信用戶對(duì)各種電信業(yè)務(wù)的興趣度并以矩陣的方式,以 便于進(jìn)一步的分析或應(yīng)用。步驟S4中根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn) 行分析生成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均 為某用戶與某電信業(yè)務(wù)之間的興趣度,包括,
[0085] 所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè)標(biāo)簽的若干個(gè)值按照從低到高的 順序進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都用不同的電信業(yè)務(wù)表示,針對(duì)不 同的電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的 關(guān)聯(lián)程度確定;
[0086] 設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為m(i = l,2, ···!〇,每個(gè)標(biāo)簽相對(duì)于電 信業(yè)務(wù)j的權(quán)重值為Aij(i = 1,2,···!!),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),則某用戶與電信業(yè)務(wù)j的興趣度的計(jì)算公式為:
[0087]
[0088] 對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用 戶-業(yè)務(wù)"二維興趣度矩陣。
[0089] 附圖2是本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng)的結(jié)構(gòu)示意圖,由圖可知, 本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),包括,數(shù)據(jù)和信息采集模塊、數(shù)據(jù)和信息處 理模塊、用戶標(biāo)簽庫(kù)模塊和相關(guān)分析模塊;
[0090] 所述數(shù)據(jù)和信息采集模塊用于獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為 信息、信令數(shù)據(jù)、BOSS數(shù)據(jù)、經(jīng)分?jǐn)?shù)據(jù)和頂EI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化 處理包括檢查數(shù)據(jù)一致性,剔除不一致的數(shù)據(jù)、無(wú)效值和缺失值;
[0091] 所述電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、套餐信息和移動(dòng)增值業(yè)務(wù)信息;
[0092] 所述用戶身份信息包含性別、年齡、教育背景、職業(yè)、所屬行業(yè)和薪資狀況信息;
[0093] 所述用戶上網(wǎng)行為信息包含用戶上網(wǎng)軌跡、用戶搜索關(guān)鍵字信息和用戶內(nèi)容偏好 信息;
[0094]所述BOSS信息包含用戶資料、業(yè)務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信息;
[0095]所述ΠΕΙ信息即用戶終端信息;
[0096]其中,所述用戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信息、爬蟲技術(shù)和DPI識(shí)別獲 取。
[0097]所述數(shù)據(jù)和信息處理模塊用于對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分 類,生成用戶寬表并存儲(chǔ)到用戶寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為 屬性,分為地理位置、電信業(yè)務(wù)關(guān)系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用 戶業(yè)務(wù)關(guān)系、渠道信息、渠道與位置、搜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十 二個(gè)類別;
[0098]所述地理位置包含居住地、工作地和行政區(qū)域信息;
[0099]所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、 增值業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息;
[0100]所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息;
[0101] 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息;
[0102] 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星 級(jí)信息;
[0103] 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息;
[0104] 所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top 信息;
[0105] 所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息;
[0106] 所述搜索行為主要集中在終端信息,包含是否搜索過各大主流手機(jī)廠商終端信 息;
[0107] 所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信 息;
[0108] 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途 費(fèi)用和套餐外流量溢出值信息;
[0109] 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生 命周期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息
[011 0]其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和 游戲。 所述用戶標(biāo)簽庫(kù)模塊用于針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表 數(shù)據(jù)庫(kù)中用戶寬表值及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù);
[0112]所述相關(guān)分析模塊用于根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分 析生成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某 用戶與某電信業(yè)務(wù)之間的興趣度;包括,所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè) 標(biāo)簽的若干個(gè)值按照從低到高的順序進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都 用不同的電信業(yè)務(wù)表示,針對(duì)不同的電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根 據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的關(guān)聯(lián)程度確定;
[0113]設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為m(i = l,2, ···!〇,每個(gè)標(biāo)簽相對(duì)于電 信業(yè)務(wù)j的權(quán)重值為Aij(i = 1,2,···!!),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),則某用戶與電信業(yè)務(wù)j的興趣度的計(jì)算公式為:
[0114]
[0115] 對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用 戶-業(yè)務(wù)"二維興趣度矩陣。
[0116] 在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生成"時(shí)間-用戶-業(yè)務(wù)"的三維興 趣度矩陣。
[0117] 顯然,本發(fā)明基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法及系統(tǒng)的有益技術(shù)效果是獲 取了全業(yè)務(wù)環(huán)境下的電信業(yè)務(wù)信息、電信用戶上網(wǎng)行為、用戶業(yè)務(wù)使用信息;運(yùn)用相關(guān)分析 法對(duì)用戶標(biāo)簽庫(kù)和電信業(yè)務(wù)信息進(jìn)行分析,形成"用戶-業(yè)務(wù)"二維興趣度矩陣和"時(shí)間-用 戶-業(yè)務(wù)"的三維興趣度矩陣,實(shí)現(xiàn)了電信用戶興趣度的量化分析和精準(zhǔn)分析,為電信業(yè)務(wù) 的精準(zhǔn)營(yíng)銷奠定了基礎(chǔ)。
【主權(quán)項(xiàng)】
1. 一種基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,其特征在于,該方法包括W下步驟: 51、 獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為信息、信令數(shù)據(jù)、BOSS數(shù)據(jù)、經(jīng)分 數(shù)據(jù)和IMEI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化處理包括檢查數(shù)據(jù)一致性,剔除 不一致的數(shù)據(jù)、無(wú)效值和缺失值; 52、 對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分類,生成用戶寬表并存儲(chǔ)到用戶 寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為屬性,分為地理位置、電信業(yè)務(wù)關(guān) 系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用戶業(yè)務(wù)關(guān)系、渠道信息、渠道與位 置、捜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十二個(gè)類別; 53、 針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表數(shù)據(jù)庫(kù)中用戶寬表值及與 之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù); 54、 根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生成用戶與電信業(yè)務(wù) 之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶與某電信業(yè)務(wù)之間 的興趣度; 55、 在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生成"時(shí)間-用戶-業(yè)務(wù)"的Ξ維興趣 度矩陣。2. 根據(jù)權(quán)利要求1所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,其特征在于,步驟S1中 所述電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、套餐信息和移動(dòng)增值業(yè)務(wù)信息;所述用戶身份信 息包含性別、年齡、教育背景、職業(yè)、所屬行業(yè)和薪資狀況信息;所述用戶上網(wǎng)行為信息包含 用戶上網(wǎng)軌跡、用戶捜索關(guān)鍵字信息和用戶內(nèi)容偏好信息;所述BOSS信息包含用戶資料、業(yè) 務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信息;所述IMEI信息即用戶終端信息;其中,所述用 戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信息、爬蟲技術(shù)和DPI識(shí)別獲取。3. 根據(jù)權(quán)利要求1所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,其特征在于,步驟S2中 的用戶寬表,包括: 所述地理位置包含居住地、工作地和行政區(qū)域信息; 所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、增值 業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息; 所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息; 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息; 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星級(jí)信 息; 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息; 所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top信息; 所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息; 所述捜索行為主要集中在終端信息,包含是否捜索過各大主流手機(jī)廠商終端信息; 所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信息; 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途費(fèi)用 和套餐外流量溢出值信息; 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生命周 期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息 其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和游 戲。4. 根據(jù)權(quán)利要求1所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,其特征在于,步驟S3中 針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,包括,針對(duì)步驟S2中生成的用戶寬表字段進(jìn)行用 戶標(biāo)簽定義,使得每個(gè)寬表字段都能劃分為若干個(gè)標(biāo)簽表示,并且,保證標(biāo)簽定義的合理性 和完整性。5. 根據(jù)權(quán)利要求1所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析方法,其特征在于,步驟S4中 根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生成用戶與電信業(yè)務(wù)之間的 "用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶與某電信業(yè)務(wù)之間的興趣 度,包括, 所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè)標(biāo)簽的若干個(gè)值按照從低到高的順序 進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都用不同的電信業(yè)務(wù)表示,針對(duì)不同的 電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的關(guān)聯(lián) 程度確定; 設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為Bi(i = l,2, ···!!),每個(gè)標(biāo)簽相對(duì)于電信業(yè) 務(wù)j的權(quán)重值為Aij(i = l,2,…n),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = l,2,…n;Ci = l,2,… Bl),則某用戶與電信業(yè)務(wù)j的興趣度w北勺計(jì)算公式為:對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用戶-業(yè) 務(wù)"二維興趣度矩陣。6. -種基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),其特征在于,該系統(tǒng)包括,數(shù)據(jù)和信息 采集模塊、數(shù)據(jù)和信息處理模塊、用戶標(biāo)簽庫(kù)模塊和相關(guān)分析模塊; 所述數(shù)據(jù)和信息采集模塊用于獲取電信業(yè)務(wù)信息、用戶身份信息、用戶上網(wǎng)行為信息、 信令數(shù)據(jù)、BOSS數(shù)據(jù)、經(jīng)分?jǐn)?shù)據(jù)和IMEI信息,并對(duì)獲取的數(shù)據(jù)進(jìn)行凈化處理;所述凈化處理 包括檢查數(shù)據(jù)一致性,剔除不一致的數(shù)據(jù)、無(wú)效值和缺失值; 所述數(shù)據(jù)和信息處理模塊用于對(duì)采集數(shù)據(jù)進(jìn)行解析、整合,對(duì)獲取的信息進(jìn)行分類,生 成用戶寬表并存儲(chǔ)到用戶寬表數(shù)據(jù)庫(kù);所述用戶寬表包括用戶基本屬性和上網(wǎng)行為屬性, 分為地理位置、電信業(yè)務(wù)關(guān)系、互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品、基礎(chǔ)信息、用戶身份特征、用戶業(yè) 務(wù)關(guān)系、渠道信息、渠道與位置、捜索行為、消費(fèi)行為信息、用量類屬性和終端信息共十二個(gè) 類別; 所述用戶標(biāo)簽庫(kù)模塊用于針對(duì)每個(gè)用戶寬表的字段進(jìn)行標(biāo)簽定義,并將用戶寬表數(shù)據(jù) 庫(kù)中用戶寬表值及與之對(duì)應(yīng)的標(biāo)簽值進(jìn)行匹配,生成用戶標(biāo)簽庫(kù); 所述相關(guān)分析模塊用于根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生 成用戶與電信業(yè)務(wù)之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶 與某電信業(yè)務(wù)之間的興趣度;并且,在設(shè)定時(shí)間間隔內(nèi)運(yùn)用相關(guān)分析法進(jìn)行分析可生成"時(shí) 間-用戶-業(yè)務(wù)"的Ξ維興趣度矩陣。7. 根據(jù)權(quán)利要求6所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),其特征在于,所述數(shù)據(jù) 和信息采集模塊采集的電信業(yè)務(wù)信息包含運(yùn)營(yíng)商終端信息、套餐信息和移動(dòng)增值業(yè)務(wù)信 息;所述用戶身份信息包含性別、年齡、教育背景、職業(yè)、所屬行業(yè)和薪資狀況信息;所述用 戶上網(wǎng)行為信息包含用戶上網(wǎng)軌跡、用戶捜索關(guān)鍵字信息和用戶內(nèi)容偏好信息;所述BOSS 信息包含用戶資料、業(yè)務(wù)管理信息、用戶訂購(gòu)業(yè)務(wù)信息和資費(fèi)信息;所述IMEI信息即用戶終 端信息;其中,所述用戶上網(wǎng)行為信息主要依靠用戶上網(wǎng)日志信息、爬蟲技術(shù)和DPI識(shí)別獲 取。8. 根據(jù)權(quán)利要求6所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),其特征在于,所述用戶 寬表分類,包括, 所述地理位置包含居住地、工作地和行政區(qū)域信息; 所述電信業(yè)務(wù)關(guān)系包含套餐信息、漫游通話費(fèi)、短信費(fèi)、彩信費(fèi)、當(dāng)月2/3/4G流量、增值 業(yè)務(wù)流量和通話時(shí)長(zhǎng)信息; 所述互聯(lián)網(wǎng)行為-互聯(lián)網(wǎng)產(chǎn)品信息包含用戶是否為運(yùn)營(yíng)商自有業(yè)務(wù)用戶信息; 所述基礎(chǔ)信息包含IMSI、性別、年齡、歸屬區(qū)域和集團(tuán)用戶標(biāo)識(shí)信息; 所述用戶身份特征包含入網(wǎng)時(shí)長(zhǎng)、市場(chǎng)類型、所在集團(tuán)單位行業(yè)分類和VIP用戶星級(jí)信 息; 所述用戶業(yè)務(wù)關(guān)系包含繳費(fèi)模式、欠費(fèi)催收模式和信用等級(jí)信息; 所述渠道信息包含10086人工/自動(dòng)業(yè)務(wù)次數(shù)、網(wǎng)廳業(yè)務(wù)次數(shù)和用戶渠道偏好Top信息; 所述渠道與位置包含是否跨區(qū)域流動(dòng)和實(shí)時(shí)漫游出訪狀態(tài)信息; 所述捜索行為主要集中在終端信息,包含是否捜索過各大主流手機(jī)廠商終端信息; 所述消費(fèi)行為信息包含是否辦理話費(fèi)捆綁優(yōu)惠/終端捆綁優(yōu)惠/實(shí)物捆綁優(yōu)惠信息; 所述用量類屬性包含2/3/4G套餐使用率、夜間使用流量、流量敏感程度、漫游長(zhǎng)途費(fèi)用 和套餐外流量溢出值信息; 所述終端信息包含終端網(wǎng)絡(luò)類型、當(dāng)前手機(jī)網(wǎng)絡(luò)制式、累計(jì)關(guān)機(jī)次數(shù)、平均換機(jī)生命周 期、換機(jī)時(shí)長(zhǎng)和曾使用的手機(jī)個(gè)數(shù)信息 其中,所述運(yùn)營(yíng)商自有業(yè)務(wù)包括來(lái)電提醒、咪咕音樂、移動(dòng)MM、和視頻、和閱讀及和游 戲。9. 根據(jù)權(quán)利要求6所述基于標(biāo)簽庫(kù)的電信用戶興趣度分析系統(tǒng),其特征在于所述相關(guān) 分析模塊根據(jù)用戶標(biāo)簽庫(kù)及電信業(yè)務(wù)信息,運(yùn)用相關(guān)分析法進(jìn)行分析生成用戶與電信業(yè)務(wù) 之間的"用戶-業(yè)務(wù)"二維興趣度矩陣,其矩陣中的任一元素均為某用戶與某電信業(yè)務(wù)之間 的興趣度,包括, 所述相關(guān)分析矩陣的每一行都用標(biāo)簽表示,每個(gè)標(biāo)簽的若干個(gè)值按照從低到高的順序 進(jìn)行等距歸一化表示;所述相關(guān)分析矩陣的每一列都用不同的電信業(yè)務(wù)表示,針對(duì)不同的 電信業(yè)務(wù),每一行對(duì)應(yīng)的標(biāo)簽權(quán)重也不同,標(biāo)簽權(quán)重根據(jù)不同標(biāo)簽與電信業(yè)務(wù)之間的關(guān)聯(lián) 程度確定; 設(shè)某用戶有η個(gè)標(biāo)簽,每個(gè)標(biāo)簽的分級(jí)數(shù)目為Bi(i = l,2, ···!!),每個(gè)標(biāo)簽相對(duì)于電信業(yè) 務(wù)j的權(quán)重值為Aij(i = l,2,…n),每個(gè)用戶的標(biāo)簽分值為Ci/Bi(i = l,2,…n;Ci = l,2,… Bl),則某用戶與電信業(yè)務(wù)j的興趣度w北勺計(jì)算公式為:對(duì)用戶標(biāo)簽庫(kù)中電信用戶逐個(gè)進(jìn)行相關(guān)矩陣分析,即可得到所有電信用戶的"用戶-業(yè) 務(wù)"二維興趣度矩陣。
【文檔編號(hào)】G06Q30/02GK105975479SQ201610248727
【公開日】2016年9月28日
【申請(qǐng)日】2016年4月20日
【發(fā)明人】程亮, 張治中
【申請(qǐng)人】重慶重郵匯測(cè)通信技術(shù)有限公司