信息推送系統(tǒng)和信息推送方法
【專利摘要】本發(fā)明提出了一種信息推送系統(tǒng)和一種信息推送方法,包括:數(shù)據(jù)采集單元,用于采集用戶的通信記錄數(shù)據(jù);關(guān)系數(shù)據(jù)生成單元,用于根據(jù)通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);過濾單元,用于對基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);分類單元,用于提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)對所有子用戶群進行分類;推送單元,用于將指定類別的信息推送至對應(yīng)于指定類別的子用戶群。本發(fā)明能夠根據(jù)用戶的通信記錄數(shù)據(jù)分析用戶之間的關(guān)系,形成用戶群,并根據(jù)關(guān)系邊的特征生成多個子用戶群,對每個子用戶群進行聚類分析,提取子用戶群的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)對子用戶群進行分類,以方便信息的推送。
【專利說明】信息推送系統(tǒng)和信息推送方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機【技術(shù)領(lǐng)域】,具體而言,涉及一種信息推送系統(tǒng)和一種信息推送方法。
【背景技術(shù)】
[0002]大多數(shù)的信息(例如軟件信息、產(chǎn)品信息)推送都是以固定的模式進行推送,例如統(tǒng)計用戶的使用數(shù)量,將用戶使用最多的信息推送給用戶,并沒有考慮用戶的使用習(xí)慣或用戶與周邊環(huán)境之間的關(guān)系,推送給用戶的信息就并不是用戶需要的,造成信息推送的資源浪費,也使得用戶只能按照推送的信息進行盲目使用。
【發(fā)明內(nèi)容】
[0003]本發(fā)明正是基于上述問題,提出了一種信息推送方案,能夠采集用戶的通信記錄數(shù)據(jù),分析用戶的通信記錄數(shù)據(jù),根據(jù)用戶的通信記錄數(shù)據(jù)形成用戶群,提取特征數(shù)據(jù),將用戶群進行分類,使信息能夠進行有目的性的推送。
[0004]有鑒于此,根據(jù)本發(fā)明的一個方面,提出了一種服務(wù)器,包括:一種信息推送系統(tǒng),其特征在于,包括:數(shù)據(jù)采集單元,用于采集用戶的通信記錄數(shù)據(jù);關(guān)系數(shù)據(jù)生成單元,連接至所述數(shù)據(jù)采集單元,用于根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);過濾單元,連接至所述關(guān)系數(shù)據(jù)生成單元,用于對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);分類單元,連接至所述過濾單元,用于提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行分類;推送單元,連接至所述分類單元,用于將指定類別的信息推送至對應(yīng)于所述指定類別的子用戶群。
[0005]采集用戶的通信記錄數(shù)據(jù),該通信記錄數(shù)據(jù)包括但不限于用戶的呼叫記錄、短信記錄、彩信記錄。根據(jù)通信記錄數(shù)據(jù)可以形成基于通信關(guān)系網(wǎng)絡(luò)的用戶群,由于數(shù)據(jù)較多,因此刪除關(guān)系較弱的關(guān)系數(shù)據(jù),將用戶群進行分離,形成子用戶群。為了使信息能夠有目的的進行推送,還需要對子用戶群進行分類,將信息推送給與其類別相同的子用戶群。這樣就避免了相關(guān)技術(shù)中按照固定模式進行信息推送所導(dǎo)致的盲目推送,使推送的信息不符合用戶的使用習(xí)慣的問題,本發(fā)明能夠?qū)⒑线m的信息推送給真正需要的用戶,提高推送效率和準確率。
[0006]在上述技術(shù)方案中,優(yōu)選的,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄;所述關(guān)系數(shù)據(jù)生成單元包括:關(guān)系邊確定單元,根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊;權(quán)重值計算單元,根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值;關(guān)系類型確定單元,將所述權(quán)重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型;用戶狀態(tài)確定單元,根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值;目標關(guān)系數(shù)據(jù)生成單元,根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
[0007]為了便于后續(xù)的用戶群分析,需對采集的通信記錄數(shù)據(jù)進行分析,通信記錄中包括聯(lián)系者與被聯(lián)系者,分析用戶之間的關(guān)系,兩個用戶節(jié)點之間的邊為關(guān)系邊,該關(guān)系邊是通信關(guān)系網(wǎng)絡(luò)的邊,因此基于通信記錄數(shù)據(jù)能夠形成基于大用戶群的關(guān)系數(shù)據(jù),根據(jù)用戶之間的通信頻率以及通信內(nèi)容,還可以確定每一關(guān)系邊的關(guān)系類型,形成具有多種關(guān)系類型的用戶群,以及用戶群中每一個用戶的通信情況。
[0008]在上述技術(shù)方案中,優(yōu)選的,所述過濾單元包括:介數(shù)值計算單元,計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值;子用戶群形成單元,在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群;群中心節(jié)點確定單元,將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點,以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量,匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
[0009]介數(shù)值代表了每一用戶與其他用戶之間的親密度,如果用戶A經(jīng)過多個用戶之后才能聯(lián)系上用戶B,那么用戶A與用戶B之間的介數(shù)值較高,說明親密度較低,用戶A與用戶B之間的關(guān)系較弱,因此可以刪除用戶群中關(guān)系較弱的關(guān)系邊。因此用戶群就被分裂成多個子用戶群,對于每個子用戶群,確定該子用戶群的中心節(jié)點,中心節(jié)點即最活躍的用戶。可以根據(jù)用戶的使用情況來確定最活躍的用戶。以該中心節(jié)點為基準,進行聚類分析,形成基于子用戶群的關(guān)系數(shù)據(jù)。
[0010]在上述技術(shù)方案中,優(yōu)選的,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和;所述分類單元根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。在形成多個子用戶群之后,還需對這多個子用戶群進行分類,以便信息能夠進行有目的的推送。在分類時,需提取每個子用戶群的特征數(shù)據(jù),根據(jù)子用戶群的特征數(shù)據(jù)來對子用戶群進行歸類,這樣就可以進行信息推送給與其屬于同一類別的一個或多個子用戶群。
[0011]在上述任一技術(shù)方案中,優(yōu)選的,還可以包括:多因素正交化處理單元,用于接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
[0012]將信息推送給用戶群之后,還能夠接收用戶群的反饋使用數(shù)據(jù),根據(jù)多因素正交化方式對使用數(shù)據(jù)進行處理,得到正交矩陣,符合實際應(yīng)用場景。
[0013]根據(jù)本發(fā)明的又一方面,還提供了一種信息推送方法,包括:采集用戶的通信記錄數(shù)據(jù);根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行分類;將指定類別的信息推送至對應(yīng)于所述指定類別的子用戶群。
[0014]采集用戶的通信記錄數(shù)據(jù),該通信記錄數(shù)據(jù)包括但不限于用戶的呼叫記錄、短信記錄、彩信記錄。根據(jù)通信記錄數(shù)據(jù)可以形成基于通信關(guān)系網(wǎng)絡(luò)的用戶群,由于數(shù)據(jù)較多,因此刪除關(guān)系較弱的關(guān)系數(shù)據(jù),將用戶群進行分離,形成子用戶群。為了使信息能夠有目的的進行推送,還需要對子用戶群進行分類,將信息推送給與其類別相同的子用戶群。這樣就避免了相關(guān)技術(shù)中按照固定模式進行信息推送所導(dǎo)致的盲目推送,使推送的信息不符合用戶的使用習(xí)慣的問題,本發(fā)明能夠?qū)⒑线m的信息推送給真正需要的用戶,提高推送效率和準確率。
[0015]在上述技術(shù)方案中,優(yōu)選的,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄;所述根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù)的步驟包括:根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊;根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值;將所述權(quán)重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型;根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值;根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
[0016]為了便于后續(xù)的用戶群分析,需對采集的通信記錄數(shù)據(jù)進行分析,通信記錄中包括聯(lián)系者與被聯(lián)系者,分析用戶之間的關(guān)系,兩個用戶節(jié)點之間的邊為關(guān)系邊,該關(guān)系邊是通信關(guān)系網(wǎng)絡(luò)的邊,因此基于通信記錄數(shù)據(jù)能夠形成基于大用戶群的關(guān)系數(shù)據(jù),根據(jù)用戶之間的通信頻率以及通信內(nèi)容,還可以確定每一關(guān)系邊的關(guān)系類型,形成具有多種關(guān)系類型的用戶群,以及用戶群中每一個用戶的通信情況。
[0017]在上述任一技術(shù)方案中,優(yōu)選的,所述對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾的步驟包括:計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值;在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群;將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點;以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量;匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
[0018]介數(shù)值代表了每一用戶與其他用戶之間的親密度,如果用戶A經(jīng)過多個用戶之后才能聯(lián)系上用戶B,那么用戶A與用戶B之間的介數(shù)值較高,說明親密度較低,用戶A與用戶B之間的關(guān)系較弱,因此可以刪除用戶群中關(guān)系較弱的關(guān)系邊。因此用戶群就被分裂成多個子用戶群,對于每個子用戶群,確定該子用戶群的中心節(jié)點,中心節(jié)點即最活躍的用戶??梢愿鶕?jù)用戶的使用情況來確定最活躍的用戶。以該中心節(jié)點為基準,進行聚類分析,形成基于子用戶群的關(guān)系數(shù)據(jù)。
[0019]在上述技術(shù)方案中,優(yōu)選的,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和;根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。
[0020]在上述任一技術(shù)方案中,優(yōu)選的,還可以包括:接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
[0021]在形成多個子用戶群之后,還需對這多個子用戶群進行分類,以便信息能夠進行有目的的推送。在分類時,需提取每個子用戶群的特征數(shù)據(jù),根據(jù)子用戶群的特征數(shù)據(jù)來對子用戶群進行歸類,這樣就可以進行信息推送給與其屬于同一類別的一個或多個子用戶群。將信息推送給用戶群之后,還能夠接收用戶群的反饋使用數(shù)據(jù),根據(jù)多因素正交化方式對使用數(shù)據(jù)進行處理,得到正交矩陣,符合實際應(yīng)用場景?!緦@綀D】
【附圖說明】
[0022]圖1示出了根據(jù)本發(fā)明的實施例的信息推送系統(tǒng)的框圖;
[0023]圖2示出了根據(jù)本發(fā)明的實施例的信息推送方法的流程圖;
[0024]圖3示出了根據(jù)本發(fā)明的實施例的所采集的數(shù)據(jù)類型示意圖;
[0025]圖4示出了根據(jù)本發(fā)明的實施例的數(shù)據(jù)采集的流程圖;
[0026]圖5示出了根據(jù)本發(fā)明的實施例的關(guān)系數(shù)據(jù)構(gòu)建的流程圖;
[0027]圖6示出了根據(jù)本發(fā)明的實施例的關(guān)系數(shù)據(jù)過濾的流程圖;
[0028]圖7示出了根據(jù)本發(fā)明的實施例的用戶群劃分和信息推送的流程圖。
【具體實施方式】
[0029]為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和【具體實施方式】對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。
[0030]在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來實施,因此,本發(fā)明的保護范圍并不受下面公開的具體實施例的限制。
[0031]圖1示出了根據(jù)本發(fā)明的實施例的信息推送系統(tǒng)的框圖。
[0032]如圖1所示,根據(jù)本發(fā)明的實施例的信息推送系統(tǒng)100可以包括:數(shù)據(jù)采集單元102,用于采集用戶的通信記錄數(shù)據(jù);關(guān)系數(shù)據(jù)生成單元104,連接至所述數(shù)據(jù)采集單元102,用于根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);過濾單元106,連接至所述關(guān)系數(shù)據(jù)生成單元104,用于對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);分類單元108,連接至所述過濾單元106,用于提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行分類;推送單元110,連接至所述分類單元108,用于將指定類別的信息推送至對應(yīng)于所述指定類別的子用戶群。
[0033]采集用戶的通信記錄數(shù)據(jù),該通信記錄數(shù)據(jù)包括但不限于用戶的呼叫記錄、短信記錄、彩信記錄。根據(jù)通信記錄數(shù)據(jù)可以形成基于通信關(guān)系網(wǎng)絡(luò)的用戶群,由于數(shù)據(jù)較多,因此刪除關(guān)系較弱的關(guān)系數(shù)據(jù),將用戶群進行分離,形成子用戶群。為了使信息能夠有目的的進行推送,還需要對子用戶群進行分類,將信息推送給與其類別相同的子用戶群。這樣就避免了相關(guān)技術(shù)中按照固定模式進行信息推送所導(dǎo)致的盲目推送,使推送的信息不符合用戶的使用習(xí)慣的問題,本發(fā)明能夠?qū)⒑线m的信息推送給真正需要的用戶,提高推送效率和準確率。
[0034]在上述技術(shù)方案中,優(yōu)選的,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄;所述關(guān)系數(shù)據(jù)生成單元104包括:關(guān)系邊確定單元1042,根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊;權(quán)重值計算單元1044,根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值;關(guān)系類型確定單元1046,將所述權(quán)重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型;用戶狀態(tài)確定單元1048,根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值;目標關(guān)系數(shù)據(jù)生成單元,根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
[0035]為了便于后續(xù)的用戶群分析,需對采集的通信記錄數(shù)據(jù)進行分析,通信記錄中包括聯(lián)系者與被聯(lián)系者,分析用戶之間的關(guān)系,兩個用戶節(jié)點之間的邊為關(guān)系邊,該關(guān)系邊是通信關(guān)系網(wǎng)絡(luò)的邊,因此基于通信記錄數(shù)據(jù)能夠形成基于大用戶群的關(guān)系數(shù)據(jù),根據(jù)用戶之間的通信頻率以及通信內(nèi)容,還可以確定每一關(guān)系邊的關(guān)系類型,形成具有多種關(guān)系類型的用戶群,以及用戶群中每一個用戶的通信情況。
[0036]在上述技術(shù)方案中,優(yōu)選的,所述過濾單元106包括:介數(shù)值計算單元1062,計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值;子用戶群形成單元1064,在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群;群中心節(jié)點確定單元1066,將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點,以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量,匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
[0037]介數(shù)值代表了每一用戶與其他用戶之間的親密度,如果用戶A經(jīng)過多個用戶之后才能聯(lián)系上用戶B,那么用戶A與用戶B之間的介數(shù)值較高,說明親密度較低,用戶A與用戶B之間的關(guān)系較弱,因此可以刪除用戶群中關(guān)系較弱的關(guān)系邊。因此用戶群就被分裂成多個子用戶群,對于每個子用戶群,確定該子用戶群的中心節(jié)點,中心節(jié)點即最活躍的用戶??梢愿鶕?jù)用戶的使用情況來確定最活躍的用戶。以該中心節(jié)點為基準,進行聚類分析,形成基于子用戶群的關(guān)系數(shù)據(jù)。
[0038]在上述技術(shù)方案中,優(yōu)選的,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和;所述分類單元108根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。
[0039]在形成多個子用戶群之后,還需對這多個子用戶群進行分類,以便信息能夠進行有目的的推送。在分類時,需提取每個子用戶群的特征數(shù)據(jù),根據(jù)子用戶群的特征數(shù)據(jù)來對子用戶群進行歸類,這樣就可以進行信息推送給與其屬于同一類別的一個或多個子用戶群。
[0040]在上述任一技術(shù)方案中,優(yōu)選的,還可以包括:多因素正交化處理單元112,用于接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
[0041]將信息推送給用戶群之后,還能夠接收用戶群的反饋使用數(shù)據(jù),根據(jù)多因素正交化方式對使用數(shù)據(jù)進行處理,得到正交矩陣,符合實際應(yīng)用場景。
[0042]圖2示出了根據(jù)本發(fā)明的實施例的信息推送方法的流程圖。
[0043]如圖2所示,根據(jù)本發(fā)明的實施例的信息推送方法可以包括以下步驟:步驟202,采集用戶的通信記錄數(shù)據(jù),根據(jù)通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);步驟204,對基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);步驟206,提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)對所有子用戶群進行分類;步驟208,將指定類別的信息推送至對應(yīng)于指定類別的子用戶群。
[0044]采集用戶的通信記錄數(shù)據(jù),該通信記錄數(shù)據(jù)包括但不限于用戶的呼叫記錄、短信記錄、彩信記錄。根據(jù)通信記錄數(shù)據(jù)可以形成基于通信關(guān)系網(wǎng)絡(luò)的用戶群,由于數(shù)據(jù)較多,因此刪除關(guān)系較弱的關(guān)系數(shù)據(jù),將用戶群進行分離,形成子用戶群。為了使信息能夠有目的的進行推送,還需要對子用戶群進行分類,將信息推送給與其類別相同的子用戶群。
[0045]這樣就避免了相關(guān)技術(shù)中按照固定模式進行信息推送所導(dǎo)致的盲目推送,使推送的信息不符合用戶的使用習(xí)慣的問題,本發(fā)明能夠?qū)⒑线m的信息推送給真正需要的用戶,提高推送效率和準確率。
[0046]在上述技術(shù)方案中,優(yōu)選的,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄。
[0047]所述根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù)的步驟包括:根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊;根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值;將所述權(quán)重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型;根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值;根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
[0048]為了便于后續(xù)的用戶群分析,需對采集的通信記錄數(shù)據(jù)進行分析,通信記錄中包括聯(lián)系者與被聯(lián)系者,分析用戶之間的關(guān)系,兩個用戶節(jié)點之間的邊為關(guān)系邊,該關(guān)系邊是通信關(guān)系網(wǎng)絡(luò)的邊,因此基于通信記錄數(shù)據(jù)能夠形成基于大用戶群的關(guān)系數(shù)據(jù),根據(jù)用戶之間的通信頻率以及通信內(nèi)容,還可以確定每一關(guān)系邊的關(guān)系類型,形成具有多種關(guān)系類型的用戶群,以及用戶群中每一個用戶的通信情況。
[0049]在上述任一技術(shù)方案中,優(yōu)選的,所述對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾的步驟包括:計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值;在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群;將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點;以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量;匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
[0050]介數(shù)值代表了每一用戶與其他用戶之間的親密度,如果用戶A經(jīng)過多個用戶之后才能聯(lián)系上用戶B,那么用戶A與用戶B之間的介數(shù)值較高,說明親密度較低,用戶A與用戶B之間的關(guān)系較弱,因此可以刪除用戶群中關(guān)系較弱的關(guān)系邊。因此用戶群就被分裂成多個子用戶群,對于每個子用戶群,確定該子用戶群的中心節(jié)點,中心節(jié)點即最活躍的用戶。可以根據(jù)用戶的使用情況來確定最活躍的用戶。以該中心節(jié)點為基準,進行聚類分析,形成基于子用戶群的關(guān)系數(shù)據(jù)。
[0051]在上述技術(shù)方案中,優(yōu)選的,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和;根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。
[0052]在上述任一技術(shù)方案中,優(yōu)選的,還可以包括:接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
[0053]在形成多個子用戶群之后,還需對這多個子用戶群進行分類,以便信息能夠進行有目的的推送。在分類時,需提取每個子用戶群的特征數(shù)據(jù),根據(jù)子用戶群的特征數(shù)據(jù)來對子用戶群進行歸類,這樣就可以進行信息推送給與其屬于同一類別的一個或多個子用戶群。將信息推送給用戶群之后,還能夠接收用戶群的反饋使用數(shù)據(jù),根據(jù)多因素正交化方式對使用數(shù)據(jù)進行處理,得到正交矩陣,符合實際應(yīng)用場景。
[0054]如圖3所示,為本實施例中所采集的數(shù)據(jù)類型,獲取電信核心網(wǎng)絡(luò)域的呼叫記錄信息、短信記錄、彩信記錄、話費繳納記錄等?;谟脩艉艚杏涗浿械耐ㄔ挶唤蟹?、主叫方、通話時長等數(shù)據(jù)建立用戶的關(guān)系網(wǎng)絡(luò),并以呼叫次數(shù)的均值為關(guān)系的權(quán)重的構(gòu)成因素之一;根據(jù)短信記錄中的收件人、發(fā)件人等數(shù)據(jù)作為計算用戶關(guān)系網(wǎng)絡(luò)的邊的權(quán)重因素之二 ;根據(jù)彩信記錄中的收件人、發(fā)件人、信息內(nèi)容大小等數(shù)據(jù)作為計算用戶關(guān)系網(wǎng)絡(luò)的邊的權(quán)重因素之三;根據(jù)邊的權(quán)重計算結(jié)果設(shè)定邊的關(guān)系類型,主要包括親情關(guān)系、友情關(guān)系等;根據(jù)話費繳納記錄計算個人用戶的活躍度和貢獻度。
[0055]根據(jù)上面采集的數(shù)據(jù)將用戶關(guān)系數(shù)據(jù)構(gòu)造成圖的表示方式,將所有的用戶關(guān)系連接在一起,構(gòu)造完整的圖型數(shù)據(jù)結(jié)構(gòu)。進一步地,將如上所述中用戶關(guān)系網(wǎng)絡(luò)數(shù)據(jù)以邊的權(quán)重計算每個用戶的度中心性和緊密度中心性,根據(jù)權(quán)重值去除數(shù)值較小的邊。根據(jù)上述數(shù)據(jù),將歐式距離差值較小、且結(jié)點度中心性值差值較小的節(jié)點提取到一起。進一步地,將如上所述的用戶關(guān)系數(shù)據(jù)組成向量,包括用戶移動手機號碼、活躍度、貢獻度、度中心性值、緊密度中心性值、邊集合、權(quán)重集合等數(shù)據(jù),并利用neighbourhood (相鄰)方式對部分數(shù)據(jù)進行聚類分析。根據(jù)聚合后的結(jié)果對用戶群體進行拆分,形成子用戶群。
[0056]對子用戶群進行歐式距離計算和活躍度、貢獻度、邊權(quán)重之和計算等,得出子用戶群的特征數(shù)據(jù)。根據(jù)子用戶群的特征數(shù)據(jù)進行K均值聚類分析,對這些關(guān)系群體進行分類。將信息推送給相應(yīng)的子用戶群,并將反饋結(jié)果進行統(tǒng)計歸納,利用多因素正交化原理計算得到正交矩陣,同理得出產(chǎn)品的各個剖面的信息。
[0057]下面結(jié)合圖4至圖7針對圖2中的各步驟進行詳細說明。
[0058]圖4示出了根據(jù)本發(fā)明的實施例的數(shù)據(jù)采集的流程圖。
[0059]如圖4所示,步驟402,以呼叫次數(shù)的均值為關(guān)系權(quán)重,基于用戶呼叫記錄中的通話被叫方、主叫方、通話時長等數(shù)據(jù)建立用戶的通話關(guān)系網(wǎng)絡(luò)。
[0060]步驟404,以短信通信條數(shù)的均值為關(guān)系權(quán)重,基于短信記錄中的收件人、發(fā)件人等數(shù)據(jù)作為計算用戶短信通信關(guān)系網(wǎng)絡(luò)的邊。
[0061]步驟406,以彩信通信條數(shù)的均值為關(guān)系權(quán)重,基于彩信記錄中的收件人、發(fā)件人、內(nèi)容大小等數(shù)據(jù)作為計算用戶彩信通信關(guān)系網(wǎng)絡(luò)的邊。
[0062]圖5示出了根據(jù)本發(fā)明的實施例的關(guān)系數(shù)據(jù)構(gòu)建的流程圖。
[0063]如圖5所示,根據(jù)采集模塊獲取的數(shù)據(jù)的邊的權(quán)重構(gòu)建關(guān)系數(shù)據(jù)具體包括:
[0064]步驟502,計算呼叫用戶、短信用戶、彩信用戶在全網(wǎng)用戶的所占比重值,并設(shè)定各種關(guān)系邊的乘數(shù)因子。
[0065]步驟504,根據(jù)用戶間呼叫頻數(shù)、短信聯(lián)系頻數(shù)、彩信聯(lián)系頻數(shù)與如上述的乘數(shù)因子做乘積,將該計算結(jié)果作為兩個用戶結(jié)點之間的邊的權(quán)重。
[0066]步驟506,根據(jù)親情關(guān)系、友情關(guān)系權(quán)重標準值來標識出用戶間的關(guān)系類型,并對用戶的所有關(guān)系細分為保持關(guān)系、單向關(guān)系、相互關(guān)系等。
[0067]步驟508,以話費繳納記錄中的繳費金額、繳費時間之商計算單位時間內(nèi)用戶貢獻度,并對計算時間段內(nèi),統(tǒng)一求和作為該用戶的貢獻值。
[0068]步驟510,以繳費時間的頻率作為用戶活躍值。[0069]步驟512,根據(jù)上述數(shù)據(jù)在內(nèi)存中構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),并以緩存和數(shù)據(jù)庫兩種方式存儲。
[0070]圖6示出了根據(jù)本發(fā)明的實施例的關(guān)系數(shù)據(jù)過濾的流程圖。
[0071]如圖6所示,根據(jù)構(gòu)建后的數(shù)據(jù)進行弱聯(lián)系過濾,對異常結(jié)點進行刪除的步驟具體包括:
[0072]步驟602,計算各個邊的介數(shù)值,并根據(jù)Girvan-Newman理論,刪除高介數(shù)值的邊。
[0073]步驟604,根據(jù)邊分裂后的群體數(shù)據(jù),分別計算各個群體中緊密度中心性值最高的結(jié)點,以此結(jié)點為群體中心點,以此結(jié)點將其他結(jié)點和其之間的邊權(quán)重值構(gòu)成該群體中心點的關(guān)系向量,再匯總所有向量數(shù)據(jù)生成該系統(tǒng)的關(guān)系群體中心點記錄集。
[0074]步驟606,根據(jù)neighbourhood方式對該數(shù)據(jù)進行聚類分析。
[0075]圖7示出了根據(jù)本發(fā)明的實施例的用戶群劃分和信息推送的流程圖
[0076]如圖7所示,根據(jù)如上所述整理分類后的數(shù)據(jù),進一步地對這些群體進行特征描述,再對關(guān)系群體向量進行聚類,得到該系統(tǒng)內(nèi)的關(guān)系群體分類的步驟具體包括:
[0077]步驟702,根據(jù)如上所述分類數(shù)據(jù)進行逐條統(tǒng)計,記錄所有節(jié)點。
[0078]步驟704,計算如上數(shù)據(jù)中每個群體的特征數(shù)據(jù),包括歐式距離、貢獻度之和、活躍度之和以及邊權(quán)重之和等。
[0079]步驟706,將如上數(shù)據(jù)中的每個值按照K均值方式進行聚類分析,得到關(guān)系群體分類數(shù)據(jù)。
[0080]步驟706,根據(jù)實際場景選擇各個群體中的中心節(jié)點用戶或其他特征用戶,將信息(軟件信息、產(chǎn)品信息等)推送給對應(yīng)的子用戶群,采集自用戶群反饋的使用數(shù)據(jù),通過多因素正交化方法對該使用數(shù)據(jù)進行計算,得到正交矩陣,所得到的計算結(jié)果接近真實場景。
[0081]以上結(jié)合附圖詳細說明了根據(jù)本發(fā)明的技術(shù)方案,本發(fā)明能夠根據(jù)用戶的通信記錄數(shù)據(jù)分析用戶之間的關(guān)系,形成用戶群,并根據(jù)關(guān)系邊的特征生成多個子用戶群,對每個子用戶群進行聚類分析,提取子用戶群的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)對子用戶群進行分類,使信息能夠有目的的進行推送,提高了推送效率和推送準確率,也減少了資源的浪費。
[0082]以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種信息推送系統(tǒng),其特征在于,包括: 數(shù)據(jù)采集單元,用于采集用戶的通信記錄數(shù)據(jù); 關(guān)系數(shù)據(jù)生成單元,連接至所述數(shù)據(jù)采集單元,用于根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù); 過濾單元,連接至所述關(guān)系數(shù)據(jù)生成單元,用于對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù); 分類單元,連接至所述過濾單元,用于提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行分類; 推送單元,連接至所述分類單元,用于將指定類別的信息推送至對應(yīng)于所述指定類別的子用戶群。
2.根據(jù)權(quán)利要求1所述的信息推送系統(tǒng),其特征在于,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄; 所述關(guān)系數(shù)據(jù)生成單元包括: 關(guān)系邊確定單元,根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊; 權(quán)重值計算單元,根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值; 關(guān)系類型確定單元,將所述權(quán) 重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型; 用戶狀態(tài)確定單元,根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值; 目標關(guān)系數(shù)據(jù)生成單元,根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的信息推送系統(tǒng),其特征在于,所述過濾單元包括: 介數(shù)值計算單元,計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值; 子用戶群形成單元,在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群; 群中心節(jié)點確定單元,將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點,以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量,匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的信息推送系統(tǒng),其特征在于,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和; 所述分類單元根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。
5.根據(jù)權(quán)利要求1至4中任一項所述的信息推送系統(tǒng),其特征在于,還包括: 多因素正交化處理單元,用于接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
6.一種信息推送方法,其特征在于,包括: 采集用戶的通信記錄數(shù)據(jù); 根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù);對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾處理,生成基于子用戶群的目標關(guān)系數(shù)據(jù);提取每一子用戶群的目標關(guān)系數(shù)據(jù)的特征數(shù)據(jù),根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行分類; 將指定類別的信息推送至對應(yīng)于所述指定類別的子用戶群。
7.根據(jù)權(quán)利要求6所述的信息推送方法,其特征在于,所述通信記錄數(shù)據(jù)包括:呼叫記錄、短信記錄、彩信記錄和/或話費繳納記錄; 所述根據(jù)所述通信記錄數(shù)據(jù)生成基于用戶群的關(guān)系數(shù)據(jù)的步驟包括: 根據(jù)每一用戶的呼叫記錄內(nèi)容、短信記錄內(nèi)容和/或彩信記錄內(nèi)容確定通信關(guān)系網(wǎng)絡(luò)中的每一關(guān)系邊,并設(shè)置每一關(guān)系邊的乘數(shù)因子,所述關(guān)系邊是兩個用戶節(jié)點之間的邊;根據(jù)所述關(guān)系邊的呼叫頻數(shù)、短信頻數(shù)和/或彩信頻數(shù)和所述乘數(shù)因子,計算出所述關(guān)系邊的權(quán)重值; 將所述權(quán)重值與標準權(quán)重值進行匹配,確定每一關(guān)系邊的關(guān)系類型; 根據(jù)用戶的話費繳納記錄確定每一用戶的活躍值、貢獻值; 根據(jù)每一關(guān)系邊的權(quán)重值和關(guān)系類型構(gòu)建多叉樹數(shù)據(jù)結(jié)構(gòu),以生成所述基于用戶群的關(guān)系數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的信息推送方法,其特征在于,所述對所述基于用戶群的關(guān)系數(shù)據(jù)進行過濾的步驟包括: 計算所述多叉樹數(shù)據(jù)結(jié)構(gòu)中的每一關(guān)系邊的介數(shù)值; 在所述多叉樹數(shù)據(jù)結(jié)構(gòu)中刪除`對應(yīng)于介數(shù)值大于預(yù)設(shè)值的關(guān)系邊,形成多個子用戶群; 將每一子用戶群中活躍值最高的用戶節(jié)點作為所述子用戶群的群中心節(jié)點; 以所述群中心節(jié)點為基準,獲取與所述群中心節(jié)點相關(guān)聯(lián)的邊關(guān)系向量; 匯總所有邊關(guān)系向量得到所述基于子用戶群的目標關(guān)系數(shù)據(jù)。
9.根據(jù)權(quán)利要求8所述的信息推送方法,其特征在于,每一子用戶群的所述特征數(shù)據(jù)包括歐式距離、子用戶群中各用戶的貢獻度之和、活躍值之和和關(guān)系邊的權(quán)重值之和; 根據(jù)所述特征數(shù)據(jù)對所有子用戶群進行聚類計算,得到多類子用戶群。
10.根據(jù)權(quán)利要求6至9中任一項所述的信息推送方法,其特征在于,還包括: 接收所述指定類別的子用戶群反饋的使用數(shù)據(jù),采用多因素正交化方式對所述使用數(shù)據(jù)進行處理,得到所述指定類別的信息的使用狀態(tài)。
【文檔編號】G06F17/30GK103605791SQ201310646421
【公開日】2014年2月26日 申請日期:2013年12月4日 優(yōu)先權(quán)日:2013年12月4日
【發(fā)明者】宋志朋, 董方 申請人:深圳中興網(wǎng)信科技有限公司