專(zhuān)利名稱(chēng):一種用戶(hù)信息篩選方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明實(shí)施例涉及通信技術(shù)領(lǐng)域,特別涉及一種用戶(hù)信息篩選方法和設(shè)備。
背景技術(shù):
為了更好的進(jìn)行客戶(hù)服務(wù),電信企業(yè)通常需要對(duì)客戶(hù)的用戶(hù)信息進(jìn)行數(shù)據(jù)挖掘, 將數(shù)據(jù)挖掘后的用戶(hù)信息推送給客戶(hù)服務(wù)及營(yíng)銷(xiāo)等前臺(tái)部門(mén),這些部門(mén)使用這些用戶(hù)信息 向客戶(hù)提供對(duì)應(yīng)的服務(wù)。通常電信企業(yè)會(huì)根據(jù)客戶(hù)的某種屬性信息對(duì)其進(jìn)行評(píng)分,輸出評(píng)分較高的用戶(hù)信 息給服務(wù)部門(mén),對(duì)于此類(lèi)用戶(hù),可以作為重點(diǎn)客戶(hù)進(jìn)行業(yè)務(wù)維護(hù)和服務(wù)拓展?,F(xiàn)有的方法一般從用戶(hù)對(duì)企業(yè)的貢獻(xiàn)出發(fā)來(lái)推送客戶(hù)信息,例如按照用戶(hù)過(guò)去一 年給企業(yè)平均收入貢獻(xiàn)作為評(píng)分標(biāo)準(zhǔn),并將用戶(hù)分為鉆石卡、金卡、銀卡、普通客戶(hù)等,并將 這些信息傳遞給前臺(tái)服務(wù)器。另外一種方法是使用一個(gè)用戶(hù)通話的不同對(duì)端用戶(hù)數(shù)(稱(chēng)為交往圈個(gè)數(shù))作為用 戶(hù)的信息輸出。另一方面,在移動(dòng)通信領(lǐng)域,為了更好地為客戶(hù)提供產(chǎn)品和服務(wù),需要從用戶(hù)中提 取特定用戶(hù)群的信息。在移動(dòng)通信網(wǎng)絡(luò)中,用戶(hù)之間的互相通話關(guān)系,形成了一個(gè)巨大的通話網(wǎng)絡(luò)圖。從 這個(gè)通話網(wǎng)絡(luò)圖中,提取特定用戶(hù)群的信息如家庭社區(qū)、朋友社區(qū)精度更高,更準(zhǔn)確的反映 用戶(hù)群體的性質(zhì)。所謂特定用戶(hù)群,即屬于由于某些社會(huì)關(guān)系而形成的用戶(hù)群體,表現(xiàn)為整個(gè)通話 網(wǎng)絡(luò)中的一個(gè)子網(wǎng)絡(luò)。識(shí)別特定用戶(hù)群體對(duì)更好地為用戶(hù)提供服務(wù)具有非常重要的作用。目前的特定用戶(hù)群識(shí)別方法主要依賴(lài)于用戶(hù)登記信息,如登記為某些地址的用 戶(hù);或登記為某些為群體性產(chǎn)品用戶(hù)的用戶(hù);或者使用某個(gè)用戶(hù)屬性進(jìn)行篩選,如ARPU大 于若干的用戶(hù)。在實(shí)現(xiàn)本發(fā)明實(shí)施例的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題現(xiàn)有的用戶(hù)中心度的計(jì)算方式只能通過(guò)片面的量化概念進(jìn)行中心度計(jì)算,但這樣 的計(jì)算往往只能說(shuō)明用戶(hù)使用產(chǎn)品的量或用戶(hù)接觸面來(lái)進(jìn)行判斷,這樣的信息具有出現(xiàn)誤 判的可能,例如在實(shí)際通話網(wǎng)絡(luò)中,具有最高交往圈個(gè)數(shù)的是許多中介機(jī)構(gòu)、保險(xiǎn)從業(yè)者、 企業(yè)推銷(xiāo)人員等。這些人的特點(diǎn)是雖然接觸面廣,但往往不是企業(yè)的重點(diǎn)客戶(hù)。另一方面,現(xiàn)有的群體識(shí)別方式或者依賴(lài)于用戶(hù)登記信息,或者孤立的使用用戶(hù) 的某些屬性,而沒(méi)有考慮到用戶(hù)之間的聯(lián)系,因此提取的用戶(hù)群信息具有較多的不準(zhǔn)確之 處,而且用戶(hù)登記信息本身的不準(zhǔn)確性也為群體識(shí)別構(gòu)成了不利影響。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種用戶(hù)信息篩選方法和設(shè)備,實(shí)現(xiàn)按照一定規(guī)則對(duì)用戶(hù)的篩 選,確定用戶(hù)的中心性和歸屬群體。
為達(dá)到上述目的,本發(fā)明實(shí)施例一方面提供了一種用戶(hù)信息篩選方法,具體包括 以下步驟用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話 聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩選當(dāng)前 系統(tǒng)中的用戶(hù)信息。優(yōu)選的,所述篩選規(guī)則具體包括所述用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用 戶(hù);或,所述用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體 用戶(hù)。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中 的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的用 戶(hù)通話信息,至少包括當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中 的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì) 當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息,具體為所述用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的 用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng) 和通話次數(shù)信息。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中 的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息, 按照篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息的過(guò)程,具體為所述用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信息,建 立當(dāng)前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖;所述用戶(hù)信息篩選設(shè)備設(shè)置分析計(jì)算的權(quán)重函數(shù);所述用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的權(quán)重函數(shù),進(jìn)行當(dāng)前系統(tǒng)中各用戶(hù)的中心度計(jì) 算,并根據(jù)計(jì)算結(jié)果進(jìn)行用戶(hù)中心度的排序;所述用戶(hù)信息篩選設(shè)備將計(jì)算得到的用戶(hù)中心度排序信息與已知的當(dāng)前系統(tǒng)中 的用戶(hù)中心度排序信息進(jìn)行匹配;如果匹配結(jié)果一致,則保存當(dāng)前的權(quán)重函數(shù),并根據(jù)所述權(quán)重函數(shù)計(jì)算并輸出相 應(yīng)的用戶(hù)中心度計(jì)算結(jié)果;如果匹配結(jié)果不一致,則重新設(shè)置權(quán)重函數(shù),重新計(jì)算用戶(hù)中心 度排序信息,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)中心度排序信息進(jìn)行匹配,直至匹配結(jié)果一致。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系 統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的 用戶(hù)通話信息,至少包括
當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息;各次通話發(fā)生時(shí)的時(shí)間信息;各次通話中主叫用戶(hù)所使用的基站信息。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前 系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息, 統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息,具體 為所述用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的 用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似度 參數(shù)信息。優(yōu)選的,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系 統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信 息,按照篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息的過(guò)程,具體為所述用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信息,建 立當(dāng)前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖;所述用戶(hù)信息篩選設(shè)備設(shè)置群體相似度計(jì)算函數(shù);所述用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的群體相似度計(jì)算函數(shù),按照各用戶(hù)組中的用戶(hù) 之間的群體相似度參數(shù)信息,計(jì)算各用戶(hù)之間的群體相似度;所述用戶(hù)信息篩選設(shè)備將計(jì)算得到的各用戶(hù)之間的群體相似度與已知的當(dāng)前系 統(tǒng)中的用戶(hù)所歸屬的群體信息進(jìn)行匹配;如果匹配結(jié)果一致,則保存當(dāng)前的群體相似度計(jì)算函數(shù),根據(jù)所述群體相似度計(jì) 算函數(shù)計(jì)算相應(yīng)的各用戶(hù)之間的群體相似度,并將所述各用戶(hù)之間的群體相似度的計(jì)算結(jié) 果確定為子圖發(fā)現(xiàn)的權(quán)重信息;如果匹配結(jié)果不一致,則重新設(shè)置群體相似度計(jì)算函數(shù),重 新計(jì)算各用戶(hù)之間的群體相似度,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息進(jìn)行匹 配,直至匹配結(jié)果一致;所述用戶(hù)信息篩選設(shè)備根據(jù)所述子圖發(fā)現(xiàn)的權(quán)重信息,在當(dāng)前系統(tǒng)的無(wú)方向通話 網(wǎng)絡(luò)圖中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子圖信息輸出當(dāng)前系統(tǒng)中的用戶(hù) 所歸屬的群體信息。優(yōu)選的,所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建 立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息的過(guò)程中,還包括噪音數(shù)據(jù)的 過(guò)濾處理。另一方面,本發(fā)明實(shí)施例還提供了一種用戶(hù)信息篩選設(shè)備,具體包括設(shè)置模塊,用于設(shè)置當(dāng)前的篩選規(guī)則,以及與所述篩選規(guī)則相對(duì)應(yīng)的用戶(hù)通話信 息獲取類(lèi)型;獲取模塊,與所述設(shè)置模塊相連接,用于根據(jù)所述設(shè)置模塊所設(shè)置的用戶(hù)通話信 息獲取類(lèi)型,向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;統(tǒng)計(jì)模塊,與所述獲取模塊相連接,用于根據(jù)所述獲取模塊獲取到的用戶(hù)通話信 息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息;
篩選模塊,與所述設(shè)置模塊和所述統(tǒng)計(jì)模塊相連接,用于根據(jù)所述統(tǒng)計(jì)模塊統(tǒng)計(jì) 得到的用戶(hù)組通話信息,按照所述設(shè)置模塊所設(shè)置的篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信 肩、ο優(yōu)選的,所述設(shè)置模塊所設(shè)置的篩選規(guī)則,具體包括根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù);或,根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)。優(yōu)選的,所述統(tǒng)計(jì)模塊,用于根據(jù)所述獲取模塊獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前 系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息,具體包括當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息 中篩選中心用戶(hù)時(shí),所述統(tǒng)計(jì)模塊將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的 用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng) 和通話次數(shù)信息;當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù) 信息篩選群體用戶(hù)時(shí),所述統(tǒng)計(jì)模塊將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成 的用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似
度參數(shù)信息。優(yōu)選的,所述的設(shè)備還包括過(guò)濾模塊,與所述統(tǒng)計(jì)模塊相連接,用于在所述統(tǒng)計(jì)模塊根據(jù)獲取到的用戶(hù)通話 信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息的過(guò) 程中,對(duì)用戶(hù)通話信息中所包含的噪音數(shù)據(jù)進(jìn)行過(guò)濾處理。優(yōu)選的,所述的設(shè)備還包括權(quán)重設(shè)置模塊,與所述統(tǒng)計(jì)模塊相連接,用于根據(jù)所述統(tǒng)計(jì)模塊所統(tǒng)計(jì)得到的通 話信息,設(shè)置相應(yīng)的權(quán)重函數(shù);匹配模塊,與所述權(quán)重設(shè)置模塊和所述篩選模塊相連接,用于根據(jù)所述權(quán)重設(shè)置 模塊所設(shè)置的當(dāng)前的權(quán)重函數(shù),計(jì)算相應(yīng)的用戶(hù)統(tǒng)計(jì)信息,并將所述用戶(hù)統(tǒng)計(jì)信息與已知 的當(dāng)前系統(tǒng)中的用戶(hù)信息進(jìn)行匹配,如果匹配一致,則將所述權(quán)重函數(shù)發(fā)送給所述篩選模 塊進(jìn)行用戶(hù)信息的篩選,如果匹配不一致,則通知所述權(quán)重設(shè)置模塊重新設(shè)置權(quán)重函數(shù)。優(yōu)選的,所述篩選模塊,用于根據(jù)所述統(tǒng)計(jì)模塊統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照 所述設(shè)置模塊所設(shè)置的篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息,具體為當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息 中篩選中心用戶(hù)時(shí),所述篩選模塊根據(jù)所述匹配模塊所確定的權(quán)重函數(shù)計(jì)算并輸出相應(yīng)的 用戶(hù)中心度計(jì)算結(jié)果;當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù) 信息篩選群體用戶(hù)時(shí),所述篩選模塊根據(jù)所述權(quán)重函數(shù)確定子圖發(fā)現(xiàn)的權(quán)重信息,在所述 統(tǒng)計(jì)模塊統(tǒng)計(jì)得到的用戶(hù)組通話信息中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子 圖信息輸出當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)通過(guò)應(yīng)用本發(fā)明實(shí)施例所提出的技術(shù)方案,采用基于通話關(guān)系中的用戶(hù)組通話信 息進(jìn)行統(tǒng)計(jì)和篩選,并通過(guò)權(quán)重函數(shù)的設(shè)置和調(diào)整進(jìn)行一致性驗(yàn)證,能夠更準(zhǔn)確的對(duì)客戶(hù)對(duì)電信企業(yè)的重要性進(jìn)行排序,提高特定用戶(hù)群信息提取的效率與精度。
圖1為本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選方法的流程示意圖;圖2為本發(fā)明實(shí)施例提出的在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選中心用戶(hù)的流程示意 圖;圖3為本發(fā)明實(shí)施例提出的在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)的流程示意 圖;圖4為本發(fā)明實(shí)施例提出的設(shè)備的功能結(jié)構(gòu)示意圖;圖5為本發(fā)明實(shí)施例提出的數(shù)據(jù)管理模塊的工作流程示意圖;圖6為本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選方法的輸出流程示意圖;圖7為本發(fā)明實(shí)施例提出的一種具體應(yīng)用場(chǎng)景中的用戶(hù)信息篩選方法的流程示 意圖;圖8為本發(fā)明實(shí)施例提出的設(shè)備的功能結(jié)構(gòu)示意圖;圖9為本發(fā)明實(shí)施例提出的數(shù)據(jù)管理模塊的工作流程示意圖;圖10為本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選方法的輸出流程示意圖;圖11為本發(fā)明實(shí)施例提出的一種具體應(yīng)用場(chǎng)景中的用戶(hù)信息篩選方法的流程示 意圖;圖12為本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選方法, 采用基于通話關(guān)系中的用戶(hù)組通話信息進(jìn)行統(tǒng)計(jì),根據(jù)具體的篩選策略對(duì)用戶(hù)進(jìn)行篩選。如圖1所示,為本發(fā)明實(shí)施例提出的一種用戶(hù)信息篩選方法的流程示意圖,具體 包括以下步驟步驟S101、用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息。在具體的應(yīng)用場(chǎng)景中,篩選規(guī)則具體包括以下兩種情況情況一、用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心 用戶(hù)。在此種情況下,用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信 息,至少包括當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息。情況二、用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群 體用戶(hù)。在此種情況下,用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信 息,至少包括當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息;
各次通話發(fā)生時(shí)的時(shí)間信息;各次通話中主叫用戶(hù)所使用的基站信息。需要指出的是,上述的中心用戶(hù)和群體用戶(hù)的選擇篩選是最常用的用戶(hù)篩選策 略,因此,在本發(fā)明技術(shù)方案中進(jìn)行具體描述,其他基于本發(fā)明技術(shù)方案而產(chǎn)生的用戶(hù)篩選 策略也同樣應(yīng)該屬于本發(fā)明的保護(hù)范圍。步驟S102、用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立 過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息。根據(jù)步驟SlOl中所確定的篩選策略的差異,步驟S102中的處理流程也會(huì)存在相 應(yīng)的變化,具體說(shuō)明如下當(dāng)篩選規(guī)則為用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩 選中心用戶(hù)時(shí),用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的 用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng) 和通話次數(shù)信息。當(dāng)篩選規(guī)則為用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息 篩選群體用戶(hù)時(shí),用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成 的用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似 度參數(shù)信息。需要進(jìn)一步指出的是,在具體的應(yīng)用場(chǎng)景中,用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用 戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信 息的過(guò)程中,還包括噪音數(shù)據(jù)的過(guò)濾處理,從而,可以提高統(tǒng)計(jì)信息的準(zhǔn)確性。步驟S103、用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩 選當(dāng)前系統(tǒng)中的用戶(hù)信息。根據(jù)步驟SlOl中所確定的篩選策略的差異,步驟S102中的處理流程也會(huì)存在相 應(yīng)的變化,具體說(shuō)明如下情況一、當(dāng)篩選規(guī)則為用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信 息中篩選中心用戶(hù)時(shí),本步驟的處理過(guò)程如圖2所示,具體包括以下步驟步驟S201、用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信 息,建立當(dāng)前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖。步驟S202、用戶(hù)信息篩選設(shè)備設(shè)置分析計(jì)算的權(quán)重函數(shù)。步驟S203、用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的權(quán)重函數(shù),進(jìn)行當(dāng)前系統(tǒng)中各用戶(hù)的中 心度計(jì)算,并根據(jù)計(jì)算結(jié)果進(jìn)行用戶(hù)中心度的排序。步驟S204、用戶(hù)信息篩選設(shè)備將計(jì)算得到的用戶(hù)中心度排序信息與已知的當(dāng)前系 統(tǒng)中的用戶(hù)中心度排序信息進(jìn)行匹配。如果匹配結(jié)果一致,則執(zhí)行步驟S205 ;如果匹配結(jié)果不一致,則重新執(zhí)行步驟S202,用戶(hù)信息篩選設(shè)備重新設(shè)置權(quán)重函 數(shù),重新計(jì)算用戶(hù)中心度排序信息,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)中心度排序信息進(jìn)行匹 配,直至匹配結(jié)果一致。步驟S205、用戶(hù)信息篩選設(shè)備保存當(dāng)前的權(quán)重函數(shù),并根據(jù)權(quán)重函數(shù)計(jì)算并輸出 相應(yīng)的用戶(hù)中心度計(jì)算結(jié)果。
情況二、當(dāng)篩選規(guī)則為用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用 戶(hù)信息篩選群體用戶(hù)時(shí),本步驟的處理過(guò)程如圖3所示,具體包括以下步驟步驟S301、用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信 息,建立當(dāng)前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖。步驟S302、用戶(hù)信息篩選設(shè)備設(shè)置群體相似度計(jì)算函數(shù)。步驟S303、用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的群體相似度計(jì)算函數(shù),按照各用戶(hù)組中 的用戶(hù)之間的群體相似度參數(shù)信息,計(jì)算各用戶(hù)之間的群體相似度。步驟S304、用戶(hù)信息篩選設(shè)備將計(jì)算得到的各用戶(hù)之間的群體相似度與已知的當(dāng) 前系統(tǒng)中的用戶(hù)所歸屬的群體信息進(jìn)行匹配。如果匹配結(jié)果一致,則執(zhí)行步驟S305 ;如果匹配結(jié)果不一致,則返回執(zhí)行步驟S302,重新設(shè)置群體相似度計(jì)算函數(shù),重 新計(jì)算各用戶(hù)之間的群體相似度,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息進(jìn)行匹
配,直至匹配結(jié)果一致。步驟S305、用戶(hù)信息篩選設(shè)備保存當(dāng)前的群體相似度計(jì)算函數(shù),根據(jù)群體相似度 計(jì)算函數(shù)計(jì)算相應(yīng)的各用戶(hù)之間的群體相似度,并將各用戶(hù)之間的群體相似度的計(jì)算結(jié)果 確定為子圖發(fā)現(xiàn)的權(quán)重信息。步驟S306、用戶(hù)信息篩選設(shè)備根據(jù)子圖發(fā)現(xiàn)的權(quán)重信息,在當(dāng)前系統(tǒng)的無(wú)方向通 話網(wǎng)絡(luò)圖中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子圖信息輸出當(dāng)前系統(tǒng)中的用 戶(hù)所歸屬的群體信息。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)通過(guò)應(yīng)用本發(fā)明實(shí)施例所提出的技術(shù)方案,采用基于通話關(guān)系中的用戶(hù)組通話信 息進(jìn)行統(tǒng)計(jì)和篩選,并通過(guò)權(quán)重函數(shù)的設(shè)置和調(diào)整進(jìn)行一致性驗(yàn)證,能夠更準(zhǔn)確的對(duì)客戶(hù) 對(duì)電信企業(yè)的重要性進(jìn)行排序,提高特定用戶(hù)群信息提取的效率與精度。下面,進(jìn)一步結(jié)合具體的示例,對(duì)本發(fā)明實(shí)施例的技術(shù)方案進(jìn)行說(shuō)明。按照現(xiàn)有的系統(tǒng)設(shè)置,計(jì)費(fèi)設(shè)備在通信網(wǎng)絡(luò)中的用戶(hù)每一次使用電話的時(shí)候,會(huì) 記錄用戶(hù)使用電話的對(duì)端號(hào)碼、撥打時(shí)長(zhǎng)、是主叫還是被叫、撥打時(shí)間、對(duì)端類(lèi)型等信息,本 發(fā)明的技術(shù)思路就是依賴(lài)于上述的統(tǒng)計(jì)信息,并對(duì)上述的信息進(jìn)行分析和進(jìn)一步統(tǒng)計(jì)計(jì)算 而得到的。為了實(shí)現(xiàn)本發(fā)明實(shí)施例還提供了,本發(fā)明實(shí)施例進(jìn)一步提出了一種用戶(hù)信息的篩 選設(shè)備,其結(jié)構(gòu)示意圖如圖4所示。本設(shè)備由前臺(tái)服務(wù)器與后臺(tái)服務(wù)器組成。其中,前臺(tái)服務(wù)器負(fù)責(zé)用戶(hù)界面與輸出信息的導(dǎo)出;后臺(tái)服務(wù)器負(fù)責(zé)數(shù)據(jù)處理與 信息挖掘。設(shè)備由四個(gè)模塊組成數(shù)據(jù)管理模塊41、挖掘分析模塊42、輸出接口模塊43、系統(tǒng) 管理模塊44組成。其中,數(shù)據(jù)管理模塊41、挖掘分析模塊42、系統(tǒng)管理模塊44運(yùn)行于后臺(tái) 服務(wù)器上,輸出接口模塊43運(yùn)行于前臺(tái)服務(wù)器上。在具體的運(yùn)行過(guò)程中,本設(shè)備首先導(dǎo)入計(jì)費(fèi)設(shè)備中已知的目標(biāo)用戶(hù)使用電話的歷 史數(shù)據(jù)及其順序信息,對(duì)數(shù)據(jù)進(jìn)行整理、匯總、歸納,形成每對(duì)用戶(hù)(即之前所提及的用戶(hù) 組)之間的通話為一個(gè)記錄的表結(jié)構(gòu),再在此基礎(chǔ)上構(gòu)建通話網(wǎng)絡(luò)圖結(jié)構(gòu),在該通話網(wǎng)絡(luò)
11圖結(jié)構(gòu)中,用戶(hù)之間的連接不具有方向性,即只表示通話聯(lián)系,而忽略主被叫關(guān)系。下面,分別根據(jù)中心用戶(hù)和群體用戶(hù)的篩選過(guò)程進(jìn)行說(shuō)明。當(dāng)進(jìn)行中心度用戶(hù)篩選時(shí),就是根據(jù)上述通話網(wǎng)絡(luò)圖結(jié)構(gòu)進(jìn)行中心度分析,為了 提高響應(yīng)結(jié)果的準(zhǔn)確性,將其分析結(jié)果與已知目標(biāo)用戶(hù)及其順序信息進(jìn)行對(duì)比,并對(duì)權(quán)重 進(jìn)行調(diào)整,直至結(jié)果與已知信息匹配度超過(guò)設(shè)定的閾值,完成權(quán)重調(diào)整。后續(xù),對(duì)所有用戶(hù)應(yīng)用上述模型,即可獲得所有用戶(hù)的相對(duì)關(guān)系得分。并按該得分 分為若干類(lèi)別,如“VIP”、“高級(jí)用戶(hù)”、“中級(jí)用戶(hù)”、“普通用戶(hù)”等,最終將其推送到客戶(hù)服 務(wù)設(shè)備。在此過(guò)程中,數(shù)據(jù)管理模塊41負(fù)責(zé)對(duì)數(shù)據(jù)的處理,包含數(shù)據(jù)導(dǎo)入與存儲(chǔ)、數(shù)據(jù)篩 選、數(shù)據(jù)整理等功能。數(shù)據(jù)導(dǎo)入從通信網(wǎng)絡(luò)的計(jì)費(fèi)設(shè)備中獲取用戶(hù)間的通話相關(guān)信息,包括對(duì)端、通話 時(shí)長(zhǎng)、通話次數(shù)、通話時(shí)間等。數(shù)據(jù)篩選是對(duì)導(dǎo)入的數(shù)據(jù)進(jìn)行選擇,去掉用戶(hù)撥打其它非本地用戶(hù)或本網(wǎng)內(nèi)電話 的記錄,以及數(shù)據(jù)中存在的可能噪音紀(jì)錄,比如通話時(shí)長(zhǎng)過(guò)短或過(guò)長(zhǎng)的紀(jì)錄等。數(shù)據(jù)整理首先對(duì)篩選后的數(shù)據(jù)進(jìn)行合并,對(duì)相同的主叫、被叫對(duì)合并在一起,并對(duì) 通話時(shí)長(zhǎng)、通話次數(shù)等求和,例如如果通話對(duì)記錄(a,b)和(b,a)同時(shí)存在(a,b表示兩 個(gè)不同的號(hào)碼),且其通話時(shí)長(zhǎng)都不過(guò)短或過(guò)長(zhǎng),則生成一條記錄,通話時(shí)長(zhǎng)即次數(shù)是兩條 記錄的和。需要指出的是,在最后的輸出結(jié)果中,每一條表達(dá)了兩個(gè)號(hào)碼之間的關(guān)系,而不再 是主叫關(guān)系,如圖5所示,為數(shù)據(jù)管理模塊41的工作流程示意圖,其中的“->”表示主叫關(guān)系。挖掘分析模塊42負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行挖掘分析,包括構(gòu)建網(wǎng)絡(luò)、權(quán)重調(diào)整、中心度分 析等功能。構(gòu)建網(wǎng)絡(luò)利用數(shù)據(jù)管理模塊的輸出,構(gòu)建一個(gè)無(wú)方向通話網(wǎng)絡(luò)圖。網(wǎng)絡(luò)圖是為了 方便進(jìn)行網(wǎng)絡(luò)分析,而采用的適合于網(wǎng)絡(luò)分析的數(shù)據(jù)結(jié)構(gòu)。在構(gòu)建網(wǎng)絡(luò)時(shí),權(quán)重設(shè)置是重要的一環(huán)。若權(quán)重設(shè)置不合理,則輸出結(jié)果可能與實(shí) 際相差較遠(yuǎn)。在本實(shí)施例中,挖掘分析模塊42采用平均通話時(shí)長(zhǎng)的自然對(duì)數(shù)的函數(shù)作為權(quán)重 函數(shù),再使用中心度分析算法求解。算法輸出的結(jié)果與已知輸入做匹配,匹配程度較低則重 新進(jìn)行權(quán)重調(diào)整,即調(diào)整權(quán)重函數(shù),直至能準(zhǔn)確的輸出(或高于特定的閥值)結(jié)果。一旦設(shè)備能準(zhǔn)確的輸出,則在下一步應(yīng)用中,不再需要權(quán)重調(diào)整步驟,即可對(duì)全體 用戶(hù)準(zhǔn)確輸出,具體實(shí)現(xiàn)流程如圖6所示。挖掘分析模塊42中使用了中心度分析方法,中心度分析方法是在給定加權(quán)網(wǎng)絡(luò) 圖中,計(jì)算每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的關(guān)系評(píng)分的方法。該方法利用網(wǎng)絡(luò)中節(jié)點(diǎn)的相互聯(lián)系,首先對(duì)每個(gè)節(jié)點(diǎn)設(shè)置隨機(jī)評(píng)分,然后根據(jù)其 連接關(guān)系和其間的連接權(quán)重進(jìn)行反復(fù)迭代獲得每個(gè)節(jié)點(diǎn)對(duì)其它節(jié)點(diǎn)的相對(duì)評(píng)分,評(píng)分越大 的節(jié)點(diǎn)在網(wǎng)絡(luò)中的影響力越大。系統(tǒng)管理模塊44具有數(shù)據(jù)定義、數(shù)據(jù)管理、模型管理以及權(quán)重管理等功能。數(shù)據(jù)定義對(duì)輸入數(shù)據(jù)的類(lèi)型、名稱(chēng)等進(jìn)行定義。
數(shù)據(jù)管理對(duì)輸入數(shù)據(jù)的噪音數(shù)據(jù)、外部號(hào)碼等進(jìn)行設(shè)置與管理。模型管理可以對(duì)訓(xùn)練后的模型進(jìn)行保存、讀取、命名等操作,還可以定義和管理結(jié) 果的分類(lèi)方法。權(quán)重管理則可以對(duì)權(quán)重函數(shù)的定義進(jìn)行微調(diào)。輸出接口模塊43可進(jìn)行進(jìn)一步分類(lèi)、可視化、查詢(xún)、各類(lèi)統(tǒng)計(jì)、導(dǎo)出到文件等操 作,方便最終用戶(hù)及連接到客戶(hù)服務(wù)設(shè)備使用。分類(lèi)功能是對(duì)輸出的信息進(jìn)一步劃分為若干易操作的類(lèi)別;可視化功能可以展現(xiàn) 整個(gè)網(wǎng)絡(luò),直觀的觀察網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的信息;統(tǒng)計(jì)功能對(duì)用戶(hù)信息進(jìn)行統(tǒng)計(jì)匯總、導(dǎo)出到 文件可以傳遞到其它設(shè)備使用?;谏鲜龅南到y(tǒng)設(shè)置,本發(fā)明實(shí)施例所提出的技術(shù)方案的具體實(shí)現(xiàn)步驟如圖7所 示步驟S701、從計(jì)費(fèi)設(shè)備中獲取一段時(shí)間內(nèi)(如三個(gè)月)客戶(hù)之間通話的相關(guān)信息。這里所提到的信息包括本方號(hào)碼、對(duì)方號(hào)碼、通話時(shí)長(zhǎng)、通話時(shí)間等信息。為了實(shí)現(xiàn)不同的篩選精度要求,上述的信息種類(lèi)也可以進(jìn)行調(diào)整,但是其中的號(hào) 嗎信息和通話時(shí)長(zhǎng)信息是不能缺少的。在此基礎(chǔ)上所做出的信息類(lèi)型的調(diào)整并不會(huì)影響本 發(fā)明的保護(hù)范圍。步驟S702、對(duì)該段時(shí)間內(nèi)信息進(jìn)行過(guò)濾,取除噪音信息及不需要的通話記錄。步驟S703、對(duì)過(guò)濾后的通話信息進(jìn)行匯總,生成與每對(duì)用戶(hù)相對(duì)應(yīng)的的列表形式。在該列表中,每對(duì)用戶(hù)作為一個(gè)用戶(hù)組,只擁有一條記錄,在該記錄中包含了該對(duì) 用戶(hù)中任意一方作為主叫所發(fā)起的通話過(guò)程的時(shí)間記錄。步驟S704、將列表形式進(jìn)行圖形化,生成相對(duì)應(yīng)的網(wǎng)絡(luò)圖的數(shù)據(jù)結(jié)構(gòu)。在這里構(gòu)建的網(wǎng)絡(luò)圖是一個(gè)無(wú)方向通話網(wǎng)絡(luò)圖。網(wǎng)絡(luò)圖是為了方便進(jìn)行網(wǎng)絡(luò)分 析,而采用的適合于網(wǎng)絡(luò)分析的數(shù)據(jù)結(jié)構(gòu)。步驟S705、對(duì)該網(wǎng)絡(luò)圖設(shè)置權(quán)重函數(shù)。具體的函數(shù)設(shè)定規(guī)則可以根據(jù)需要進(jìn)行調(diào)整,設(shè)定依據(jù)可以包括通話時(shí)長(zhǎng)、通話 時(shí)間以及其它參數(shù)信息,具體參數(shù)類(lèi)型的變化并不會(huì)影響本發(fā)明的保護(hù)范圍。步驟S706、按照當(dāng)前的權(quán)重函數(shù)對(duì)網(wǎng)絡(luò)圖進(jìn)行中心度分析,并將分析結(jié)果與已知 信息進(jìn)行匹配。如果匹配程度達(dá)到預(yù)設(shè)的匹配閾值,則執(zhí)行步驟S707 ;如果匹配程度沒(méi)有達(dá)到預(yù)設(shè)的匹配閾值,則執(zhí)行步驟S705,進(jìn)行重新設(shè)定。步驟S707、按照確定的權(quán)重函數(shù)輸出中心度篩選結(jié)果。在具體的應(yīng)用場(chǎng)景中,根據(jù)具體的篩選結(jié)果數(shù)據(jù),還可以進(jìn)一步將用戶(hù)劃分為若 干個(gè)類(lèi)別,如“VIP”、“高級(jí)用戶(hù)”、“中級(jí)用戶(hù)”、“普通用戶(hù)”等,以方便業(yè)務(wù)識(shí)別操作。本方法及設(shè)備具有廣泛的應(yīng)用意義,例如,對(duì)于電信運(yùn)營(yíng)商來(lái)說(shuō),集團(tuán)客戶(hù)的維護(hù) 是一個(gè)很重要的問(wèn)題。由于一名客戶(hù)經(jīng)理需要維護(hù)很多個(gè)集團(tuán)客戶(hù),而其由于缺乏集團(tuán)客 戶(hù)中的用戶(hù)信息,不知道該集團(tuán)中核心用戶(hù)的信息,因此很難切入。使用本方法與設(shè)備,客 戶(hù)經(jīng)理只需要輸入該集團(tuán)客戶(hù)成員的通話信息,即可了解本集團(tuán)的核心用戶(hù)信息,從而方 便的進(jìn)行客戶(hù)維護(hù)。另外,運(yùn)營(yíng)商的客戶(hù)服務(wù)人員可以采用本設(shè)備輸出的用戶(hù)信息,對(duì)不同的用戶(hù)類(lèi)別采用不同的客戶(hù)服務(wù)策略,如對(duì)“VIP”用戶(hù)推送管理及理財(cái)產(chǎn)品信息,能更精確的定位客 戶(hù)需求。當(dāng)進(jìn)行群體用戶(hù)篩選時(shí),主要的信息是依據(jù)計(jì)費(fèi)設(shè)備在通信網(wǎng)絡(luò)中的所記錄的用 戶(hù)每一次使用電話的時(shí)候,會(huì)記錄用戶(hù)使用電話的對(duì)端號(hào)碼、撥打時(shí)長(zhǎng)、是主叫還是被叫、 撥打時(shí)間、對(duì)端類(lèi)型以及撥打方的使用的基站等信息。因而從兩個(gè)用戶(hù)之間的通話中,可以提取出若干刻畫(huà)兩個(gè)用戶(hù)間通話緊密程度及 通話地點(diǎn)的特征。通過(guò)已知用戶(hù)群體中兩個(gè)用戶(hù)之間通話特征的分析和任意兩個(gè)用戶(hù)之間的通話 特征的對(duì)比分析,使用回歸或其它擬合模型,可以得出任意兩個(gè)通話用戶(hù)之間的群體相似 度的計(jì)算公式。以用戶(hù)之間的群體相似度作為權(quán)重,構(gòu)建通話網(wǎng)絡(luò)圖,在通話網(wǎng)絡(luò)圖上運(yùn)行 子圖發(fā)現(xiàn)算法,可獲取特定用戶(hù)群的信息。然后,對(duì)獲取的用戶(hù)群進(jìn)一步按照其特征進(jìn)行細(xì) 分,以便進(jìn)一步信息推送。為了實(shí)現(xiàn)上述思路,需要對(duì)本發(fā)明實(shí)施例所提出的設(shè)備進(jìn)行模塊調(diào)整,其結(jié)構(gòu)示 意圖如圖8所示。本設(shè)備在物理上由前臺(tái)服務(wù)器與后臺(tái)服務(wù)器組成。其中,前臺(tái)服務(wù)器負(fù)責(zé)用戶(hù)界面與輸出信息的導(dǎo)出;后臺(tái)服務(wù)器負(fù)責(zé)數(shù)據(jù)處理與 信息挖掘。設(shè)備由四個(gè)功能部分組成數(shù)據(jù)處理模塊81、特定用戶(hù)群信息提取模塊82、輸出 接口模塊83、系統(tǒng)管理模塊84。其中,數(shù)據(jù)管理模塊81、特定用戶(hù)群信息提取模塊82、系統(tǒng) 管理模塊84運(yùn)行于運(yùn)行于后臺(tái)服務(wù)器,輸出接口模塊83運(yùn)行于前臺(tái)服務(wù)器。數(shù)據(jù)處理模塊81包含數(shù)據(jù)導(dǎo)入、數(shù)據(jù)篩選、數(shù)據(jù)聚合等功能。數(shù)據(jù)導(dǎo)入從通信網(wǎng)絡(luò)的計(jì)費(fèi)系統(tǒng)中獲取用戶(hù)間的通話相關(guān)信息,包括對(duì)端、通話 時(shí)長(zhǎng)、通話次數(shù)、通話時(shí)間、通話基站代碼等。數(shù)據(jù)篩選對(duì)導(dǎo)入的數(shù)據(jù)進(jìn)行選擇,去掉用戶(hù)撥打其它非本地用戶(hù)或本網(wǎng)內(nèi)電話的 記錄,以及數(shù)據(jù)中存在的可能噪音紀(jì)錄,比如通話時(shí)長(zhǎng)過(guò)短或過(guò)長(zhǎng)的紀(jì)錄等。數(shù)據(jù)聚合對(duì)篩選后的數(shù)據(jù)進(jìn)行合并并聚合為一些描述兩者之間通話關(guān)系的新的變量。首先將相同的號(hào)碼對(duì)(如號(hào)A->號(hào)B的所有記錄)進(jìn)行合并,在合并的同時(shí)求取 一些統(tǒng)計(jì)變量的值,如通話時(shí)長(zhǎng)、通話次數(shù)、忙時(shí)通話時(shí)長(zhǎng)、閑時(shí)通話時(shí)長(zhǎng)、周末通話時(shí)長(zhǎng)、 號(hào)A忙時(shí)使用的基站排序列表、號(hào)A閑時(shí)使用的基站排序列表、號(hào)A周末使用的基站排序列表等。然后,將通話雙方相同的記錄予以合并(即A- > B和B- > A合并為A-B),相同的 變量相加,同時(shí)計(jì)算一些新的統(tǒng)計(jì)變量,比如總時(shí)長(zhǎng)占比(A,B之間的通話時(shí)長(zhǎng)占A和B各自總的通話時(shí)長(zhǎng)之和的比例)A時(shí)長(zhǎng)占比(A,B之間的通話時(shí)長(zhǎng)占A的總通話時(shí)長(zhǎng)之和的比例)B時(shí)長(zhǎng)占比(A,B之間的通話時(shí)長(zhǎng)占B的總通話時(shí)長(zhǎng)之和的比例)忙時(shí)基站相關(guān)(A的基站列表和B的基站列表的忙時(shí)的重合程度)閑時(shí)基站相關(guān)(A的基站列表和B的基站列表的閑時(shí)的重合程度)周末基站相關(guān)(A的基站列表和B的基站列表的周末的重合程度)
14
其中忙時(shí)、閑時(shí)也可以進(jìn)一步細(xì)分為每個(gè)小時(shí)的數(shù)據(jù)。數(shù)據(jù)處理模塊81的處理流 程如圖9所示。特定用戶(hù)群信息提取模塊82包括網(wǎng)絡(luò)構(gòu)建、群體相似度、子圖發(fā)現(xiàn)等功能,其實(shí) 現(xiàn)流程圖如圖10所示。構(gòu)建網(wǎng)絡(luò)利用數(shù)據(jù)管理模塊的輸出的號(hào)碼對(duì),即可構(gòu)建一個(gè)無(wú)方向通話網(wǎng)絡(luò)圖。 網(wǎng)絡(luò)圖是為了方便進(jìn)行網(wǎng)絡(luò)分析,而采用的適合于網(wǎng)絡(luò)分析的數(shù)據(jù)結(jié)構(gòu)。在構(gòu)建網(wǎng)絡(luò)時(shí),權(quán) 重設(shè)置是重要的一環(huán)。若權(quán)重設(shè)置不合理,則輸出結(jié)果可能與實(shí)際相差較遠(yuǎn)。在本發(fā)明實(shí)施例所提出的方法中,使用群體相似度作為該網(wǎng)絡(luò)圖的權(quán)重。群體相 似度是利用輸入數(shù)據(jù)之中的變量信息,以及已知部分用戶(hù)信息,采用數(shù)據(jù)挖掘方法獲得。在設(shè)置權(quán)重后,在網(wǎng)絡(luò)圖上使用子圖發(fā)現(xiàn)算法,即可獲得特定用戶(hù)群體的信息。群體相似度的計(jì)算是使用輸入變量為兩個(gè)用戶(hù)屬于同一個(gè)用戶(hù)群的可能性進(jìn)行 評(píng)分。在設(shè)備初次使用的時(shí)候,需要使用已知的部分用戶(hù)相似性信息進(jìn)行學(xué)習(xí),直到群體相 似度的輸出與已知信息高度匹配位置。在以后的使用過(guò)程中,則不需要該學(xué)習(xí)過(guò)程。子圖發(fā)現(xiàn)算法是網(wǎng)絡(luò)分析方法中的一種根據(jù)網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)的拓?fù)浣Y(jié)構(gòu)與連接 權(quán)重,找出圖中的各個(gè)子圖。這些子圖具有子圖內(nèi)部節(jié)點(diǎn)之間的聯(lián)系要密切于這些節(jié)點(diǎn)與外部節(jié)點(diǎn)之間的聯(lián) 系。子圖發(fā)現(xiàn)算法根據(jù)子圖的這一特征,從空子圖開(kāi)始,通過(guò)迭代的方法,不斷的加入聯(lián)系 緊密的節(jié)點(diǎn),從而形成子圖。在通話網(wǎng)絡(luò)中,子圖很好的表征了聯(lián)系密切的小群體。系統(tǒng)管理模塊84具有數(shù)據(jù)定義、算法管理、模型管理、相似度管理等功能。數(shù)據(jù)定義對(duì)輸入數(shù)據(jù)的類(lèi)型、名稱(chēng)等進(jìn)行定義。算法管理對(duì)算法的參數(shù)如迭代次數(shù)、進(jìn)行管理,模型管理可以對(duì)訓(xùn)練后的模型進(jìn) 行保存、讀取、命名等操作,還可以定義和管理結(jié)果的分類(lèi)方法。相似度管理則對(duì)群體相似度的閥值、相似度的計(jì)算方法等進(jìn)行定義與管理。輸出接口模塊83可進(jìn)行進(jìn)一步分類(lèi)、可視化、查詢(xún)、各類(lèi)統(tǒng)計(jì)、導(dǎo)出到文件等操 作,方便最終用戶(hù)及連接到客戶(hù)服務(wù)設(shè)備使用。分類(lèi)功能是對(duì)輸出的信息按照用戶(hù)群的特征(如群內(nèi)通話與對(duì)外通話的比例/群 人數(shù)等)進(jìn)一步劃分為若干易操作的類(lèi)別(如短信傳情、夜間密談等等);可視化功能可以 展現(xiàn)整個(gè)網(wǎng)絡(luò),直觀的觀察網(wǎng)絡(luò)中每個(gè)用戶(hù)群的信息;統(tǒng)計(jì)功能對(duì)用戶(hù)信息進(jìn)行統(tǒng)計(jì)匯總、 導(dǎo)出到文件可以傳遞到其它設(shè)備使用。本方法的具體步驟如圖11所示步驟S1101、從計(jì)費(fèi)設(shè)備中獲取一段時(shí)間內(nèi)(如三個(gè)月)客戶(hù)之間通話的相關(guān)信
肩、ο這里所提到的信息包括本方號(hào)碼、對(duì)方號(hào)碼、通話時(shí)長(zhǎng)、通話時(shí)間、通話基站代碼
^fn 息。為了實(shí)現(xiàn)不同的篩選精度要求,上述的信息種類(lèi)也可以進(jìn)行調(diào)整,但是其中的號(hào) 嗎信息和通話時(shí)長(zhǎng)信息是不能缺少的。在此基礎(chǔ)上所做出的信息類(lèi)型的調(diào)整并不會(huì)影響本 發(fā)明的保護(hù)范圍。步驟S1102、對(duì)該段時(shí)間內(nèi)信息進(jìn)行過(guò)濾,取除噪音信息及不需要的通話記錄。步驟S1103、對(duì)過(guò)濾后的該段時(shí)間內(nèi)信息進(jìn)行匯總、信息聚集并生成新的變量。
15
該變量即作為群體相似度的計(jì)算參數(shù)依據(jù)。步驟S1104、根據(jù)上述變量計(jì)算兩個(gè)號(hào)碼之間的群體相似度,并將計(jì)算結(jié)果與已知 群體信息進(jìn)行匹配。如果匹配程度達(dá)到預(yù)設(shè)的匹配閾值,則執(zhí)行步驟S1105 ;如果匹配程度沒(méi)有達(dá)到預(yù)設(shè)的匹配閾值,則執(zhí)行步驟S1103,進(jìn)行變量的重新設(shè) 定,并對(duì)計(jì)算方法進(jìn)行調(diào)整;步驟S1105、使用上述的號(hào)碼統(tǒng)計(jì)信息建一張網(wǎng)絡(luò)圖。在這里構(gòu)建的網(wǎng)絡(luò)圖是一個(gè)無(wú)方向通話網(wǎng)絡(luò)圖。網(wǎng)絡(luò)圖是為了方便進(jìn)行網(wǎng)絡(luò)分 析,而采用的適合于網(wǎng)絡(luò)分析的數(shù)據(jù)結(jié)構(gòu)。步驟S1106、在該網(wǎng)絡(luò)圖上使用子圖發(fā)現(xiàn)算法,確定子圖,并獲得用戶(hù)群社區(qū)。步驟S1107、對(duì)獲得的用戶(hù)群社區(qū)按照其用戶(hù)群內(nèi)外的通話特征劃分成若干特征 明顯的類(lèi)別。本方法和設(shè)備在實(shí)際應(yīng)用中具有廣泛的用途。例如,為了推出與家庭客戶(hù)對(duì)應(yīng)的 產(chǎn)品,產(chǎn)品設(shè)計(jì)人員需要知道家庭用戶(hù)的使用特點(diǎn),因?yàn)橹挥杏邢薜募彝ビ脩?hù)資料,這些數(shù) 據(jù)很難獲取。使用本設(shè)備,設(shè)計(jì)人員只需輸入用戶(hù)的通話歷史數(shù)據(jù)和少量已知的家庭用戶(hù) 資料,即可了解家庭用戶(hù)的不同類(lèi)別,從而針對(duì)性的設(shè)計(jì)產(chǎn)品;如對(duì)“短信傳情”類(lèi)家庭,可 設(shè)計(jì)特定的家庭內(nèi)短信減免套餐,以滿足客戶(hù)需求。為了實(shí)現(xiàn)本發(fā)明實(shí)施例的技術(shù)方案,本發(fā)明實(shí)施例還提出了一種用戶(hù)信息篩選設(shè) 備,其結(jié)構(gòu)示意圖如圖12所示,具體包括設(shè)置模塊121,用于設(shè)置當(dāng)前的篩選規(guī)則,以及與篩選規(guī)則相對(duì)應(yīng)的用戶(hù)通話信息 獲取類(lèi)型。在具體的應(yīng)用場(chǎng)景中,本模塊所設(shè)置的篩選規(guī)則,具體包括根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù);或,根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)。獲取模塊122,與設(shè)置模塊121相連接,用于根據(jù)設(shè)置模塊121所設(shè)置的用戶(hù)通話 信息獲取類(lèi)型,向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;統(tǒng)計(jì)模塊123,與獲取模塊122相連接,用于根據(jù)獲取模塊122獲取到的用戶(hù)通話 信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息。當(dāng)設(shè)置模塊121所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息 中篩選中心用戶(hù)時(shí),統(tǒng)計(jì)模塊123將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的 用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng) 和通話次數(shù)信息;當(dāng)設(shè)置模塊121所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù) 信息篩選群體用戶(hù)時(shí),統(tǒng)計(jì)模塊123將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成 的用戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似
度參數(shù)信息。篩選模塊124,與設(shè)置模塊121和統(tǒng)計(jì)模塊123相連接,用于根據(jù)統(tǒng)計(jì)模塊123統(tǒng) 計(jì)得到的用戶(hù)組通話信息,按照設(shè)置模塊121所設(shè)置的篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信 肩、ο
當(dāng)設(shè)置模塊121所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息 中篩選中心用戶(hù)時(shí),篩選模塊1 根據(jù)匹配模塊所確定的權(quán)重函數(shù)計(jì)算并輸出相應(yīng)的用戶(hù) 中心度計(jì)算結(jié)果;當(dāng)設(shè)置模塊121所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù) 信息篩選群體用戶(hù)時(shí),篩選模塊1 根據(jù)權(quán)重函數(shù)確定子圖發(fā)現(xiàn)的權(quán)重信息,在統(tǒng)計(jì)模塊 123統(tǒng)計(jì)得到的用戶(hù)組通話信息中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子圖信 息輸出當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息。在具體的應(yīng)用場(chǎng)景中,上述設(shè)備還包括過(guò)濾模塊125,與統(tǒng)計(jì)模塊123相連接,用于在統(tǒng)計(jì)模塊123根據(jù)獲取到的用戶(hù)通 話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息的 過(guò)程中,對(duì)用戶(hù)通話信息中所包含的噪音數(shù)據(jù)進(jìn)行過(guò)濾處理。權(quán)重設(shè)置模塊126,與統(tǒng)計(jì)模塊123相連接,用于根據(jù)統(tǒng)計(jì)模塊123所統(tǒng)計(jì)得到的 通話信息,設(shè)置相應(yīng)的權(quán)重函數(shù);匹配模塊127,與權(quán)重設(shè)置模塊1 和篩選模塊IM相連接,用于根據(jù)權(quán)重設(shè)置模 塊1 所設(shè)置的當(dāng)前的權(quán)重函數(shù),計(jì)算相應(yīng)的用戶(hù)統(tǒng)計(jì)信息,并將用戶(hù)統(tǒng)計(jì)信息與已知的 當(dāng)前系統(tǒng)中的用戶(hù)信息進(jìn)行匹配,如果匹配一致,則將權(quán)重函數(shù)發(fā)送給篩選模塊IM進(jìn)行 用戶(hù)信息的篩選,如果匹配不一致,則通知權(quán)重設(shè)置模塊126重新設(shè)置權(quán)重函數(shù)。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)通過(guò)應(yīng)用本發(fā)明實(shí)施例所提出的技術(shù)方案,采用基于通話關(guān)系中的用戶(hù)組通話信 息進(jìn)行統(tǒng)計(jì)和篩選,并通過(guò)權(quán)重函數(shù)的設(shè)置和調(diào)整進(jìn)行一致性驗(yàn)證,能夠更準(zhǔn)確的對(duì)客戶(hù) 對(duì)電信企業(yè)的重要性進(jìn)行排序,提高特定用戶(hù)群信息提取的效率與精度。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明實(shí)施例 可以通過(guò)硬件實(shí)現(xiàn),也可以借助軟件加必要的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)。基于這樣的理 解,本發(fā)明實(shí)施例的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一 個(gè)非易失性存儲(chǔ)介質(zhì)(可以是⑶-ROM,U盤(pán),移動(dòng)硬盤(pán)等)中,包括若干指令用以使得一臺(tái) 計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明實(shí)施例各個(gè)實(shí)施場(chǎng) 景所述的方法。本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施場(chǎng)景的示意圖,附圖中的模塊或 流程并不一定是實(shí)施本發(fā)明實(shí)施例所必須的。本領(lǐng)域技術(shù)人員可以理解實(shí)施場(chǎng)景中的裝置中的模塊可以按照實(shí)施場(chǎng)景描述進(jìn) 行分布于實(shí)施場(chǎng)景的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施場(chǎng)景的一個(gè)或多個(gè)裝 置中。上述實(shí)施場(chǎng)景的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施場(chǎng)景的優(yōu)劣。以上公開(kāi)的僅為本發(fā)明實(shí)施例的幾個(gè)具體實(shí)施場(chǎng)景,但是,本發(fā)明實(shí)施例并非局 限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明實(shí)施例的保護(hù)范圍。
1權(quán)利要求
1.一種用戶(hù)信息篩選方法,其特征在于,具體包括以下步驟用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系 的任意兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩選當(dāng)前系統(tǒng) 中的用戶(hù)信息。
2.如權(quán)利要求1所述的方法,其特征在于,所述篩選規(guī)則具體包括所述用戶(hù)信息篩選設(shè)備根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù);或,所述用戶(hù)信息篩選設(shè)備根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)。
3.如權(quán)利要求2所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備向計(jì) 費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息,至少包括當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息。
4.如權(quán)利要求3所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù) 獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù)組 所對(duì)應(yīng)的通話信息,具體為所述用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù) 組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通 話次數(shù)信息。
5.如權(quán)利要求4所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根據(jù) 統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息的過(guò)程,具體為所述用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信息,建立當(dāng) 前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖;所述用戶(hù)信息篩選設(shè)備設(shè)置分析計(jì)算的權(quán)重函數(shù);所述用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的權(quán)重函數(shù),進(jìn)行當(dāng)前系統(tǒng)中各用戶(hù)的中心度計(jì)算, 并根據(jù)計(jì)算結(jié)果進(jìn)行用戶(hù)中心度的排序;所述用戶(hù)信息篩選設(shè)備將計(jì)算得到的用戶(hù)中心度排序信息與已知的當(dāng)前系統(tǒng)中的用 戶(hù)中心度排序信息進(jìn)行匹配;如果匹配結(jié)果一致,則保存當(dāng)前的權(quán)重函數(shù),并根據(jù)所述權(quán)重函數(shù)計(jì)算并輸出相應(yīng)的 用戶(hù)中心度計(jì)算結(jié)果;如果匹配結(jié)果不一致,則重新設(shè)置權(quán)重函數(shù),重新計(jì)算用戶(hù)中心度排 序信息,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)中心度排序信息進(jìn)行匹配,直至匹配結(jié)果一致。
6.如權(quán)利要求2所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備向 計(jì)費(fèi)設(shè)備獲取的統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息,至少包括當(dāng)前系統(tǒng)中所有發(fā)生過(guò)通話的用戶(hù)在通話中的對(duì)端用戶(hù)信息;各次通話的通話時(shí)長(zhǎng)信息;各次通話發(fā)生時(shí)的時(shí)間信息;各次通話中主叫用戶(hù)所使用的基站信息。
7.如權(quán)利要求6所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備根 據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù) 組所對(duì)應(yīng)的通話信息,具體為所述用戶(hù)信息篩選設(shè)備將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù) 組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似度參數(shù) fn息ο
8.如權(quán)利要求7所述的方法,其特征在于,當(dāng)所述篩選規(guī)則為所述用戶(hù)信息篩選設(shè)備 根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)時(shí),所述用戶(hù)信息篩選設(shè)備 根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息的過(guò)程,具體 為所述用戶(hù)信息篩選設(shè)備根據(jù)各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通話次數(shù)信息,建立當(dāng) 前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò)圖;所述用戶(hù)信息篩選設(shè)備設(shè)置群體相似度計(jì)算函數(shù);所述用戶(hù)信息篩選設(shè)備根據(jù)當(dāng)前的群體相似度計(jì)算函數(shù),按照各用戶(hù)組中的用戶(hù)之間 的群體相似度參數(shù)信息,計(jì)算各用戶(hù)之間的群體相似度;所述用戶(hù)信息篩選設(shè)備將計(jì)算得到的各用戶(hù)之間的群體相似度與已知的當(dāng)前系統(tǒng)中 的用戶(hù)所歸屬的群體信息進(jìn)行匹配;如果匹配結(jié)果一致,則保存當(dāng)前的群體相似度計(jì)算函數(shù),根據(jù)所述群體相似度計(jì)算函 數(shù)計(jì)算相應(yīng)的各用戶(hù)之間的群體相似度,并將所述各用戶(hù)之間的群體相似度的計(jì)算結(jié)果確 定為子圖發(fā)現(xiàn)的權(quán)重信息;如果匹配結(jié)果不一致,則重新設(shè)置群體相似度計(jì)算函數(shù),重新計(jì) 算各用戶(hù)之間的群體相似度,并與已知的當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息進(jìn)行匹配, 直至匹配結(jié)果一致;所述用戶(hù)信息篩選設(shè)備根據(jù)所述子圖發(fā)現(xiàn)的權(quán)重信息,在當(dāng)前系統(tǒng)的無(wú)方向通話網(wǎng)絡(luò) 圖中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子圖信息輸出當(dāng)前系統(tǒng)中的用戶(hù)所歸 屬的群體信息。
9.如權(quán)利要求4或7所述的方法,其特征在于,所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用 戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信 息的過(guò)程中,還包括噪音數(shù)據(jù)的過(guò)濾處理。
10.一種用戶(hù)信息篩選設(shè)備,其特征在于,具體包括設(shè)置模塊,用于設(shè)置當(dāng)前的篩選規(guī)則,以及與所述篩選規(guī)則相對(duì)應(yīng)的用戶(hù)通話信息獲 取類(lèi)型;獲取模塊,與所述設(shè)置模塊相連接,用于根據(jù)所述設(shè)置模塊所設(shè)置的用戶(hù)通話信息獲 取類(lèi)型,向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;統(tǒng)計(jì)模塊,與所述獲取模塊相連接,用于根據(jù)所述獲取模塊獲取到的用戶(hù)通話信息,統(tǒng) 計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息;篩選模塊,與所述設(shè)置模塊和所述統(tǒng)計(jì)模塊相連接,用于根據(jù)所述統(tǒng)計(jì)模塊統(tǒng)計(jì)得到 的用戶(hù)組通話信息,按照所述設(shè)置模塊所設(shè)置的篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息。
11.如權(quán)利要求10所述的設(shè)備,其特征在于,所述設(shè)置模塊所設(shè)置的篩選規(guī)則,具體包括根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩選中心用戶(hù);或,根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息篩選群體用戶(hù)。
12.如權(quán)利要求11所述的設(shè)備,其特征在于,所述統(tǒng)計(jì)模塊,用于根據(jù)所述獲取模塊獲 取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng) 的通話信息,具體包括當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩 選中心用戶(hù)時(shí),所述統(tǒng)計(jì)模塊將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用戶(hù) 組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行合并計(jì)算,計(jì)算各用戶(hù)組所對(duì)應(yīng)的總的通話時(shí)長(zhǎng)和通 話次數(shù)信息;當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息 篩選群體用戶(hù)時(shí),所述統(tǒng)計(jì)模塊將當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的任意兩個(gè)用戶(hù)所組成的用 戶(hù)組所對(duì)應(yīng)的所有通話的通話記錄進(jìn)行統(tǒng)計(jì),確定各用戶(hù)組中的用戶(hù)之間的群體相似度參數(shù)信息。
13.如權(quán)利要求12所述的設(shè)備,其特征在于,還包括過(guò)濾模塊,與所述統(tǒng)計(jì)模塊相連接,用于在所述統(tǒng)計(jì)模塊根據(jù)獲取到的用戶(hù)通話信息, 統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息的過(guò)程中, 對(duì)用戶(hù)通話信息中所包含的噪音數(shù)據(jù)進(jìn)行過(guò)濾處理。
14.如權(quán)利要求12所述的設(shè)備,其特征在于,還包括權(quán)重設(shè)置模塊,與所述統(tǒng)計(jì)模塊相連接,用于根據(jù)所述統(tǒng)計(jì)模塊所統(tǒng)計(jì)得到的通話信 息,設(shè)置相應(yīng)的權(quán)重函數(shù);匹配模塊,與所述權(quán)重設(shè)置模塊和所述篩選模塊相連接,用于根據(jù)所述權(quán)重設(shè)置模塊 所設(shè)置的當(dāng)前的權(quán)重函數(shù),計(jì)算相應(yīng)的用戶(hù)統(tǒng)計(jì)信息,并將所述用戶(hù)統(tǒng)計(jì)信息與已知的當(dāng) 前系統(tǒng)中的用戶(hù)信息進(jìn)行匹配,如果匹配一致,則將所述權(quán)重函數(shù)發(fā)送給所述篩選模塊進(jìn) 行用戶(hù)信息的篩選,如果匹配不一致,則通知所述權(quán)重設(shè)置模塊重新設(shè)置權(quán)重函數(shù)。
15.如權(quán)利要求14所述的設(shè)備,其特征在于,所述篩選模塊,用于根據(jù)所述統(tǒng)計(jì)模塊統(tǒng) 計(jì)得到的用戶(hù)組通話信息,按照所述設(shè)置模塊所設(shè)置的篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信 息,具體為當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)中心度參數(shù)在當(dāng)前系統(tǒng)中的用戶(hù)信息中篩 選中心用戶(hù)時(shí),所述篩選模塊根據(jù)所述匹配模塊所確定的權(quán)重函數(shù)計(jì)算并輸出相應(yīng)的用戶(hù) 中心度計(jì)算結(jié)果;當(dāng)所述設(shè)置模塊所設(shè)置的篩選規(guī)則為根據(jù)用戶(hù)群體相似度在當(dāng)前系統(tǒng)中的用戶(hù)信息 篩選群體用戶(hù)時(shí),所述篩選模塊根據(jù)所述權(quán)重函數(shù)確定子圖發(fā)現(xiàn)的權(quán)重信息,在所述統(tǒng)計(jì) 模塊統(tǒng)計(jì)得到的用戶(hù)組通話信息中確定代表不同的通話群體關(guān)系的子圖,并根據(jù)各子圖信 息輸出當(dāng)前系統(tǒng)中的用戶(hù)所歸屬的群體信息。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種用戶(hù)信息篩選方法和設(shè)備,所述方法包括用戶(hù)信息篩選設(shè)備向計(jì)費(fèi)設(shè)備獲取統(tǒng)計(jì)周期內(nèi)的用戶(hù)通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)獲取到的用戶(hù)通話信息,統(tǒng)計(jì)當(dāng)前系統(tǒng)中建立過(guò)通話聯(lián)系的兩個(gè)用戶(hù)所組成的用戶(hù)組所對(duì)應(yīng)的通話信息;所述用戶(hù)信息篩選設(shè)備根據(jù)統(tǒng)計(jì)得到的用戶(hù)組通話信息,按照篩選規(guī)則篩選當(dāng)前系統(tǒng)中的用戶(hù)信息。通過(guò)應(yīng)用本發(fā)明實(shí)施例所提出的技術(shù)方案,采用基于通話關(guān)系中的用戶(hù)組通話信息進(jìn)行統(tǒng)計(jì)和篩選,并通過(guò)權(quán)重函數(shù)的設(shè)置和調(diào)整進(jìn)行一致性驗(yàn)證,能夠更準(zhǔn)確的對(duì)客戶(hù)對(duì)電信企業(yè)的重要性進(jìn)行排序,提高特定用戶(hù)群信息提取的效率與精度。
文檔編號(hào)H04W4/26GK102083010SQ20091023858
公開(kāi)日2011年6月1日 申請(qǐng)日期2009年11月26日 優(yōu)先權(quán)日2009年11月26日
發(fā)明者周剛, 胡可云, 陶振武 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)公司