專利名稱:一種用戶業(yè)務(wù)特征的生成方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,特別是指一種用戶業(yè)務(wù)特征的生成方法及裝置。
背景技術(shù):
眾所周知,用戶在實際生活中的很多習(xí)慣、特征都是與時間有關(guān)的,通常是根據(jù)一定的周期進行反復(fù)。在用戶的通信過程中,這樣的行為規(guī)律也隨處可見,例如,用戶每個月的通話量在正常情況下通常是比較穩(wěn)定的,用戶在網(wǎng)絡(luò)上的業(yè)務(wù)表現(xiàn)也很可能是有規(guī)可循的。
目前,基于用戶通信行為的分析系統(tǒng)在互聯(lián)網(wǎng)的一些業(yè)務(wù)上已有所應(yīng)用,并獲得良好的效益,如搜索業(yè)務(wù)、電子商務(wù)、網(wǎng)絡(luò)營銷等業(yè)務(wù)。典型的互聯(lián)網(wǎng)用戶行為分析主要是通過用戶資料調(diào)查、軟件跟蹤等方式完成的。雖然電信領(lǐng)域運營商或服務(wù)提供商(SP)已使用了專門進行業(yè)務(wù)分析和客戶管理的系統(tǒng),如客戶關(guān)系管理系統(tǒng)、SP的客戶管理系統(tǒng),但是現(xiàn)有技術(shù)對用戶通信行為分析都是針對群體用戶進行的,難以針對用戶個體進行個別分析,尤其是難以對用戶個體的行為習(xí)慣、業(yè)務(wù)特征進行量化記錄。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的一個目的在于提供一種用戶業(yè)務(wù)特征的生成方法,本發(fā)明的另一目的在于提供一種用戶業(yè)務(wù)特征的生成裝置,根據(jù)用戶的業(yè)務(wù)特征來分析用戶使用業(yè)務(wù)的行為,并可進一步對用戶未來使用業(yè)務(wù)的情況做出預(yù)測。
為了達到上述目的,本發(fā)明提供了一種用戶業(yè)務(wù)特征的生成方法,該包含以下步驟A、對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù);B、將業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正后,根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正操作,然后對生成的業(yè)務(wù)特征進行存儲。
所述A之前進一步包括在一個以上設(shè)定周期的時間長度內(nèi)的每個設(shè)定周期,采集對應(yīng)于業(yè)務(wù)屬性的用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)所述業(yè)務(wù)記錄數(shù)據(jù)生成用戶的初始業(yè)務(wù)特征。
所述根據(jù)業(yè)務(wù)記錄數(shù)據(jù)生成用戶的初始業(yè)務(wù)特征,為將業(yè)務(wù)記錄數(shù)據(jù)經(jīng)過曲線擬合分析得到具有分布曲線的業(yè)務(wù)特征。
步驟A中所述對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,與根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),之間進一步包括對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證,如果有效,則根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù)。
所述對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證,為確定業(yè)務(wù)記錄數(shù)據(jù)的單位是否正確;或為確定業(yè)務(wù)記錄數(shù)據(jù)的含義是否準確;或為確定業(yè)務(wù)記錄數(shù)據(jù)是否來自于需要進行分析的用戶。
一個設(shè)置周期的開始或結(jié)束執(zhí)行所述步驟A;或觸發(fā)事件發(fā)生時,執(zhí)行所述步驟A。
所述觸發(fā)事件為收到控制命令;或為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相符。
步驟A中所述業(yè)務(wù)記錄數(shù)據(jù)是體現(xiàn)用戶業(yè)務(wù)使用情況的數(shù)據(jù),為歷史話單,或費用記錄,或當前業(yè)務(wù)使用記錄,或用戶業(yè)務(wù)使用過程中生成的數(shù)據(jù),或以上任意的組合。
步驟B中所述根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正,為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)的偏差未在允許誤差范圍內(nèi)。
所述根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正,為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)的偏差未在允許誤差范圍內(nèi),且滿足第二設(shè)定條件。
所述第二設(shè)定條件為偏差未在允許誤差范圍內(nèi)的累計次數(shù)達到設(shè)定次數(shù);或為偏差未在允許誤差范圍內(nèi)的連續(xù)次數(shù)達到設(shè)定次數(shù);或為偏差在允許誤差范圍的正數(shù)倍之外。
所述偏差未在允許誤差范圍內(nèi),與滿足第二設(shè)定條件,之間進一步包括對業(yè)務(wù)屬性數(shù)據(jù)進行存儲。
步驟B中所述根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正操作,為根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行校正操作。
所述校正操作為函數(shù)逼近或數(shù)值逼近。
所述業(yè)務(wù)屬性數(shù)據(jù)為固定周期內(nèi)各時間點的業(yè)務(wù)屬性數(shù)據(jù);或為固定周期內(nèi)相同時間點的業(yè)務(wù)屬性數(shù)據(jù)。
所述一個或一個以上的用戶的業(yè)務(wù)特征的集合組成用于描述用戶業(yè)務(wù)使用情況的業(yè)務(wù)指紋。
該方法進一步包括重復(fù)執(zhí)行步驟A和步驟B,分別生成各業(yè)務(wù)特征,生成的各業(yè)務(wù)特征的集合組成業(yè)務(wù)指紋。
所述業(yè)務(wù)特征通過具有分布曲線的函數(shù)、或集合、或矩陣來表示。
本發(fā)明還提供了一種用戶業(yè)務(wù)特征的生成裝置,該裝置包括預(yù)處理單元,用于接收用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),并向比較單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);比較單元,用于將接收的來自預(yù)處理單元的業(yè)務(wù)屬性數(shù)據(jù)與來自數(shù)據(jù)存儲單元的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對業(yè)務(wù)特征進行校正后,向分析單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);分析單元,用于根據(jù)來自比較單元的業(yè)務(wù)屬性數(shù)據(jù),對接收的原有業(yè)務(wù)特征進行校正操作,然后向數(shù)據(jù)存儲單元發(fā)送生成的新的業(yè)務(wù)特征;數(shù)據(jù)存儲單元,用于存儲業(yè)務(wù)特征。
該裝置進一步包括業(yè)務(wù)節(jié)點,用于向預(yù)處理單元提供用戶的業(yè)務(wù)記錄數(shù)據(jù)。
所述業(yè)務(wù)節(jié)點與預(yù)處理單元通過數(shù)據(jù)采集接口相連。
所述業(yè)務(wù)節(jié)點為服務(wù)提供服務(wù)器,或為業(yè)務(wù)網(wǎng)關(guān),或為電信業(yè)務(wù)運營支撐系統(tǒng)服務(wù)器,或為客戶關(guān)系管理系統(tǒng)服務(wù)器。
所述分析單元進一步用于根據(jù)在一個以上設(shè)定周期的時間長度內(nèi)的每個設(shè)定周期采集的對應(yīng)于業(yè)務(wù)屬性的用戶的業(yè)務(wù)記錄數(shù)據(jù),生成用戶的初始業(yè)務(wù)特征,并向數(shù)據(jù)存儲單元發(fā)送業(yè)務(wù)記錄數(shù)據(jù)和該初始業(yè)務(wù)特征;所述數(shù)據(jù)存儲單元進一步用于存儲業(yè)務(wù)記錄數(shù)據(jù)。
所述分析單元接收的原有業(yè)務(wù)特征來自比較單元,或來自數(shù)據(jù)存儲單元。
所述預(yù)處理單元進一步用于對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證。
所述預(yù)處理單元進一步用于根據(jù)業(yè)務(wù)屬性數(shù)據(jù)生成表達式,并向比較單元發(fā)送該表達式。
所述比較單元進一步用于根據(jù)收到的來自預(yù)處理單元的表達式提取業(yè)務(wù)屬性數(shù)據(jù)。
所述比較策略配置于比較單元,或存儲于數(shù)據(jù)存儲單元,由數(shù)據(jù)存儲單元向比較單元提供。
業(yè)務(wù)屬性數(shù)據(jù)與業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相符,且不需要對業(yè)務(wù)特征進行校正時,所述比較單元進一步用于向數(shù)據(jù)存儲單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);所述數(shù)據(jù)存儲單元進一步用于對收到的業(yè)務(wù)屬性數(shù)據(jù)進行存儲。
本發(fā)明中,對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),將業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征、即業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正后,根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正操作,生成新的業(yè)務(wù)特征。根據(jù)本發(fā)明提出的方案,對于用戶而言,通過對用戶業(yè)務(wù)特征的分析,方便服務(wù)提供商對用戶提供更體貼的服務(wù),從而提升用戶體驗,增強用戶對業(yè)務(wù)的滿意度,通過對用戶的業(yè)務(wù)使用異常情況進行分析,在必要時對用戶的行為做出干預(yù)或其他處理,最大限度地維護了用戶的利益;對于服務(wù)提供商而言,通過分析用戶個體的業(yè)務(wù)特征或業(yè)務(wù)指紋,利用用戶的業(yè)務(wù)特征或業(yè)務(wù)指紋預(yù)測用戶的業(yè)務(wù)使用行為,區(qū)分出有共同業(yè)務(wù)表現(xiàn)特征的業(yè)務(wù)群體,對用戶群體進行更細致的劃分,能夠進一步對同類用戶群提供更具有針對性的服務(wù),提升業(yè)務(wù)價值,通過用戶的業(yè)務(wù)特征或業(yè)務(wù)指紋預(yù)測用戶的業(yè)務(wù)使用行為后,能夠進一步挖掘用戶的業(yè)務(wù)使用需求,提供更強的個性化服務(wù),并可更好的開展有針對性的營銷活動,對用戶的消費進行引導(dǎo)。
圖1A示出了寬帶業(yè)務(wù)中上網(wǎng)時間的業(yè)務(wù)屬性函數(shù)曲線示意圖;圖1B示出了寬帶業(yè)務(wù)中時間長度的業(yè)務(wù)屬性函數(shù)曲線示意圖;圖1C示出了寬帶業(yè)務(wù)中費用的業(yè)務(wù)屬性函數(shù)曲線示意圖;圖2示出了業(yè)務(wù)特征分析裝置結(jié)構(gòu)示意圖;圖3示出了業(yè)務(wù)特征分析流程圖;圖4示出了業(yè)務(wù)屬性函數(shù)校正分析示意圖。
具體實施例方式
在對本發(fā)明的技術(shù)方案進行描述之前,首先介紹一下本發(fā)明中提出的業(yè)務(wù)指紋的含義。用戶在實際生活中總會表現(xiàn)出一定的特征,如興趣愛好、行為習(xí)慣等,這些特征在用戶使用通信業(yè)務(wù)的過程中也會相應(yīng)地表現(xiàn)出來,例如,某用戶習(xí)慣于晚上七點后回家上網(wǎng),或某用戶經(jīng)常瀏覽與影視相關(guān)的網(wǎng)頁。通過對用戶一段時間內(nèi)的歷史數(shù)據(jù)的分析,能夠抽象出一條曲線,該曲線可形象地成為用戶使用某一業(yè)務(wù)的一個業(yè)務(wù)特征,這些業(yè)務(wù)特征的組合就成為用戶在該業(yè)務(wù)上的業(yè)務(wù)指紋。所述通信業(yè)務(wù)包括語音業(yè)務(wù)和數(shù)據(jù)業(yè)務(wù)。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明作進一步的詳細描述。
一個業(yè)務(wù)通常包含很多業(yè)務(wù)屬性,以寬帶業(yè)務(wù)為例,其業(yè)務(wù)屬性可包括上網(wǎng)時間、時間長度、流量、費用等。業(yè)務(wù)屬性是對用戶業(yè)務(wù)使用情況的一個方面的描述,例如,使用業(yè)務(wù)的時間、使用業(yè)務(wù)的次數(shù)等??赏ㄟ^多個業(yè)務(wù)屬性來描述用戶使用某一業(yè)務(wù)的整體情況,如每天使用業(yè)務(wù)的時間、每次使用業(yè)務(wù)的時間長度、每次使用業(yè)務(wù)時的具體流量等,這些業(yè)務(wù)屬性的集合就是對相應(yīng)業(yè)務(wù)一個用戶使用業(yè)務(wù)的行為實例的量化。對用戶業(yè)務(wù)使用情況的分析最終會落實到對業(yè)務(wù)屬性的分析,一個業(yè)務(wù)屬性與用戶使用業(yè)務(wù)的一個業(yè)務(wù)特征相對應(yīng)。如果對業(yè)務(wù)特征進行量化,則業(yè)務(wù)特征具體可表現(xiàn)為在業(yè)務(wù)屬性的基礎(chǔ)上抽象出來的函數(shù)特征,即業(yè)務(wù)屬性函數(shù),例如,對某一業(yè)務(wù)屬性在一段時間內(nèi)所有的表現(xiàn)數(shù)據(jù)進行分析后得到的有規(guī)律或無規(guī)律的曲線。業(yè)務(wù)特征的表現(xiàn)是與時間周期相關(guān)的,例如,以一周為周期長度,通過業(yè)務(wù)特征、即業(yè)務(wù)屬性函數(shù)來體現(xiàn)預(yù)計的用戶在每周的業(yè)務(wù)使用情況。因此,對用戶在某個業(yè)務(wù)上的行為的分析,實際上是對用戶在該業(yè)務(wù)一個或多個業(yè)務(wù)屬性上的行為表現(xiàn)進行分析,將用戶在這些業(yè)務(wù)屬性上的所有特征表現(xiàn)抽象出來,就形成了用戶在這個業(yè)務(wù)的業(yè)務(wù)指紋,也就是說,用戶在一個業(yè)務(wù)上的所有業(yè)務(wù)特征的集合形成了用戶在這個業(yè)務(wù)上的業(yè)務(wù)指紋。如果只有一個業(yè)務(wù)特征、即通過一個業(yè)務(wù)屬性得到的相應(yīng)業(yè)務(wù)屬性函數(shù),則該業(yè)務(wù)特征或業(yè)務(wù)屬性函數(shù)即為用戶的業(yè)務(wù)指紋。
用戶的業(yè)務(wù)特征是用戶使用業(yè)務(wù)過程中表現(xiàn)出的一些習(xí)慣、行為等表現(xiàn)的抽象形式,業(yè)務(wù)特征一定是有時間周期的,如按周、月、年或者次數(shù)進行統(tǒng)計。對于能夠在坐標系用分布曲線描述的業(yè)務(wù)屬性,每個業(yè)務(wù)屬性可能都對應(yīng)于一個業(yè)務(wù)特征,業(yè)務(wù)特征的表現(xiàn)形式可為函數(shù)曲線;對于難以用數(shù)字表達的業(yè)務(wù)屬性,如內(nèi)容、訪問網(wǎng)站等,業(yè)務(wù)特征的表現(xiàn)形式可為集合;對于能夠用行表示業(yè)務(wù)屬性、列表示屬性內(nèi)容的情況,業(yè)務(wù)特征的表現(xiàn)形式可為矩陣,等等。
與傳統(tǒng)數(shù)值等表示方式相比,業(yè)務(wù)屬性函數(shù)及其分布曲線能夠形象描述出用戶的業(yè)務(wù)歷史使用情況,如變化趨勢、周期、關(guān)鍵點等,并能夠?qū)τ脩粑磥硎褂脴I(yè)務(wù)的行為做出預(yù)測,業(yè)務(wù)屬性函數(shù)的最理想狀態(tài)是周期性函數(shù),能夠?qū)潭ㄖ芷趦?nèi)任何一個時間的業(yè)務(wù)使用行為做出預(yù)測;如果業(yè)務(wù)屬性函數(shù)不是周期性函數(shù),至少也能夠根據(jù)最近一段曲線的變化趨勢,對用戶未來一段時間的業(yè)務(wù)使用行為做出預(yù)測。由于現(xiàn)實生活中人們的生活習(xí)慣受到很多時間周期的影響,如朝九晚五、一周雙休、按月結(jié)算、一年四季等,人們的通信方式也或多或少地受到這些時間周期的影響,天然具有一定的時間分布規(guī)律,因此,可根據(jù)一段時間的統(tǒng)計分析發(fā)現(xiàn)用戶在某些業(yè)務(wù)及其業(yè)務(wù)屬性上的規(guī)律。
結(jié)合具體通信業(yè)務(wù),絕大部分的業(yè)務(wù)屬性的分布都是離散的,如次數(shù)、點數(shù)等,如每天打了幾個電話,發(fā)了多少短信,或上了幾個小時的網(wǎng),對應(yīng)于這些業(yè)務(wù)屬性的業(yè)務(wù)記錄數(shù)據(jù)基本是離散的點,但是這些離散的點的集合,如收集一周、一個月,就可能會出現(xiàn)一定的分布規(guī)律。電信的例子是上網(wǎng),用戶平時可能由于上班時間限制,在家里上網(wǎng)的時間可能較為固定,如在下班回到家后的19:00左右,也可能會晚一些,但是總在一個時間區(qū)間內(nèi),如19:00至21:00,上網(wǎng)的時間長度也是較為固定的,由于第二天的工作,通常在2個小時左右,費用可能就是按照時長計算,也可能會涉及其他額外費用、如下載費,或者按流量收費、如無線上網(wǎng)。
通常一個業(yè)務(wù)包含很多業(yè)務(wù)屬性,在對用戶使用業(yè)務(wù)的情況進行統(tǒng)計分析時,不可能也沒有必要對該業(yè)務(wù)的所有業(yè)務(wù)屬性都進行分析,因此,實際分析過程中可根據(jù)實際情況和需要選擇業(yè)務(wù)屬性的一個子集,并在一段時間內(nèi)的固定周期內(nèi)對用戶在選定的業(yè)務(wù)屬性上的業(yè)務(wù)使用行為表現(xiàn)進行分析,該子集可通過集合的形式來描述。如果將一個業(yè)務(wù)看作一個集合,則該集合中的元素就是業(yè)務(wù)屬性,該集合的每個實例就是用戶使用業(yè)務(wù)時的業(yè)務(wù)記錄。例如,為某寬帶業(yè)務(wù)選擇的業(yè)務(wù)屬性包括上網(wǎng)時間、時間長度和費用,分別用x1、x2和x3表示,這樣,用戶寬帶業(yè)務(wù)的業(yè)務(wù)屬性可通過集合S→=(x→1,x→2,x→3)T]]>來表示,其中, 和 分別對應(yīng)用戶每次的上網(wǎng)時間、時間長度和費用,各單位可根據(jù)精確度要求而定,如 的單位可為小時分鐘、 的單位可為分鐘, 的單位可為元; 的一個實例可表示為S→1=19:00302.0,]]>其描述的是用戶某次上網(wǎng)的記錄,如描述用戶在星期一的上網(wǎng)記錄,即用戶當天第一次上網(wǎng)的時間為19:00,本次上網(wǎng)的時間長度為30分鐘,本次上網(wǎng)的費用為2.0元,其中,19:00為業(yè)務(wù)屬性第一次上網(wǎng)的時間的業(yè)務(wù)屬性數(shù)據(jù),30分鐘為業(yè)務(wù)屬性本次上網(wǎng)的時間長度的業(yè)務(wù)屬性數(shù)據(jù),2.0元為業(yè)務(wù)屬性本次上網(wǎng)的費用的業(yè)務(wù)屬性數(shù)據(jù),S→1=19:00302.0]]>為業(yè)務(wù)屬性數(shù)據(jù)的表達式。
用戶的業(yè)務(wù)屬性數(shù)據(jù)的表達式可根據(jù)實現(xiàn)的不同需求而不同,最終目的都是從業(yè)務(wù)節(jié)點中提取用戶的業(yè)務(wù)記錄數(shù)據(jù),并按照業(yè)務(wù)屬性進行分類,即采集對應(yīng)于業(yè)務(wù)屬性的用戶的業(yè)務(wù)記錄數(shù)據(jù),以方便對用戶的業(yè)務(wù)使用情況進行深入分析。
在初始階段,需要在一段時間內(nèi)的每個固定周期定量采樣用戶在某個業(yè)務(wù)屬性的記錄數(shù)據(jù),經(jīng)過曲線擬合分析得到初始的分步曲線,該初始分布曲線基本能夠描述出用戶在某個業(yè)務(wù)屬性上的業(yè)務(wù)特征表現(xiàn)情況,該初始分布曲線可較為平穩(wěn),可為起伏比較大的曲線,可為有規(guī)律的曲線,也可為無規(guī)律的曲線,但是無論何種表現(xiàn)形式的曲線都能夠通過函數(shù)逼近或數(shù)值逼近等數(shù)學(xué)方法通過一個函數(shù)形式來表示,該函數(shù)就是用戶的一個業(yè)務(wù)特征、即一個業(yè)務(wù)屬性函數(shù)。所述函數(shù)逼近或數(shù)值逼近等數(shù)學(xué)方法,具體可為均差與牛頓插值多項式、三角函數(shù)等。例如,某業(yè)務(wù)屬性函數(shù)表示為fi=fi(xi,T,δ),其中,xi為某個業(yè)務(wù)的業(yè)務(wù)屬性,T為統(tǒng)計時間周期,δ為允許誤差或精度。
由于本發(fā)明是為了通過對用戶一段時間內(nèi)業(yè)務(wù)使用情況的統(tǒng)計,來得到能夠?qū)τ脩粑磥順I(yè)務(wù)使用情況的預(yù)測,因此,周期性是對業(yè)務(wù)特征、即業(yè)務(wù)屬性函數(shù)進行分析和對用戶業(yè)務(wù)使用情況進行預(yù)測的基礎(chǔ),所有的分析都應(yīng)該是基于固定周期的,得到的業(yè)務(wù)屬性函數(shù)的理想形式應(yīng)該是周期性函數(shù)。這樣,這里所說的一段時間內(nèi)的每個固定周期是一段時間的周期重復(fù),例如,將一個月作為采樣的一段時間,將每天作為固定周期,或以每周作為固定周期。
通過用戶在多個業(yè)務(wù)屬性的采樣分析,同樣可得到不同的業(yè)務(wù)屬性函數(shù),每個業(yè)務(wù)屬性函數(shù)與用戶在該業(yè)務(wù)的一個業(yè)務(wù)特征表現(xiàn)相對應(yīng),這些業(yè)務(wù)屬性函數(shù)的組合就能夠體現(xiàn)用戶在該業(yè)務(wù)上的業(yè)務(wù)特征表現(xiàn)的集合,也就是所謂的用戶業(yè)務(wù)指紋。例如,用戶業(yè)務(wù)指紋可通過函數(shù)的形式表示為F=(f1,f2,…,fn)T,其中,n為針對某業(yè)務(wù)進行分析的業(yè)務(wù)屬性的數(shù)量;fi為針對某個具體業(yè)務(wù)屬性的某個用戶的業(yè)務(wù)屬性函數(shù);F為n個業(yè)務(wù)屬性函數(shù)的組合,即用戶業(yè)務(wù)指紋的具體表現(xiàn)形式。
通過曲線函數(shù)表示的用戶業(yè)務(wù)特征、即業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋比傳統(tǒng)的數(shù)值表現(xiàn)方式具有更強的優(yōu)勢,可通過曲線直觀地看到用戶的業(yè)務(wù)使用情況,并能夠根據(jù)曲線對用戶的未來業(yè)務(wù)使用趨勢做出預(yù)測,從而為用戶制定服務(wù)策略提供了有力指導(dǎo),而且也便于存儲和運算。
以寬帶業(yè)務(wù)為例,經(jīng)過一段時間的固定周期統(tǒng)計,如對用戶兩個月時間內(nèi)的每個星期的寬度業(yè)務(wù)使用情況進行統(tǒng)計,可發(fā)現(xiàn)用戶使用寬帶業(yè)務(wù)的三個業(yè)務(wù)屬性函數(shù)基本符合一定規(guī)律,每周的星期一至星期五基本在當天19:00左右第一次上網(wǎng),每次上網(wǎng)的時間大致在一個小時左右,所產(chǎn)生的費用基本在2.0元上下,每周的星期六和星期日基本在當天8:00左右第一次上網(wǎng),每次上網(wǎng)的時間大致在五個小時左右,所產(chǎn)生的費用基本在10.0元以上。經(jīng)過數(shù)值擬合和函數(shù)逼真,可得到如圖1所示的曲線分布,并得出用戶在一個星期內(nèi)每天第一次上網(wǎng)時間的業(yè)務(wù)屬性函數(shù)f1(x1,day,δ1=5)=19:00,day=1,2,···,5;9:00,day=6,7,]]>其中,x1表示用戶每天第一次上網(wǎng)時間的業(yè)務(wù)屬性,單位為小時分鐘;day表示一周中的星期幾;δ1表示上網(wǎng)時間所允許的誤差為5分鐘。本例中為了更形象地進行說明,可能在某些描述上沒有嚴格遵循數(shù)學(xué)方式來表達,如f1(t)作為y軸時的單位為小時分鐘,實際應(yīng)用中可能需要經(jīng)過映射等其他處理才能實現(xiàn);相應(yīng)地,可通過同樣的方法得到用戶在一個星期內(nèi)每天上網(wǎng)的時間長度的業(yè)務(wù)屬性函數(shù)f2(x2,day,δ2=10)=1,day=1,2,···,5;5,day=6,7,]]>其中,x2表示用戶每天上網(wǎng)的時間長度的業(yè)務(wù)屬性,單位為小時,day表示一周中的星期幾,δ2表示上網(wǎng)的時間長度所允許的誤差為10分鐘;用戶在一個星期內(nèi)每天上網(wǎng)的費用的業(yè)務(wù)屬性函數(shù)f3(x3,day,δ3=1)=2,day=1,2,···,5;2×day,day=6,7,]]>其中,x3表示用戶每天上網(wǎng)的費用的業(yè)務(wù)屬性,單位為元,day表示一周中的星期幾,δ3表示上網(wǎng)的費用所允許的誤差為1元。
類似地,通過上述步驟針對某個業(yè)務(wù)的每個業(yè)務(wù)屬性進行單獨分析后,能夠得到一組與時間相關(guān)的業(yè)務(wù)屬性函數(shù),這些業(yè)務(wù)屬性函數(shù)的集合就是用戶在相應(yīng)業(yè)務(wù)上的業(yè)務(wù)指紋原型。仍以上述寬帶業(yè)務(wù)為例,得到每個業(yè)務(wù)屬性函數(shù)后,用戶在寬度業(yè)務(wù)上的業(yè)務(wù)指紋可通過F=(f1,f2,f3)T來表示。如果選定的對業(yè)務(wù)指紋進行分析的業(yè)務(wù)屬性只有一個,則針對于相應(yīng)用戶的業(yè)務(wù)屬性函數(shù)即為該用戶的業(yè)務(wù)指紋。
通過以上分析可見,針對某個業(yè)務(wù)的不同業(yè)務(wù)屬性從用戶的該業(yè)務(wù)使用記錄中提取出相應(yīng)的業(yè)務(wù)屬性函數(shù),該業(yè)務(wù)屬性函數(shù)基本能夠表現(xiàn)出用戶使用業(yè)務(wù)過程中的某個特征,能夠準確表達用戶過去的業(yè)務(wù)使用情況,并可進一步成為對用戶未來的業(yè)務(wù)使用情況做出預(yù)測的基礎(chǔ)。最后,得到一系列業(yè)務(wù)屬性函數(shù)的集合,這個集合能夠簡單而形象地描述出用戶使用該業(yè)務(wù)的習(xí)慣,這就是用戶業(yè)務(wù)指紋的量化過程。
下面對本發(fā)明的具體實現(xiàn)進行描述。
圖2示出了業(yè)務(wù)特征生成裝置結(jié)構(gòu)示意圖,如圖2所示,業(yè)務(wù)特征生成裝置20包括預(yù)處理單元201、比較單元202、分析單元203和數(shù)據(jù)存儲單元204。
其中,預(yù)處理單元201用于接收來自業(yè)務(wù)節(jié)點10的用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)配置的業(yè)務(wù)屬性對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行分類,生成用戶的業(yè)務(wù)屬性數(shù)據(jù),可進一步將用戶的業(yè)務(wù)屬性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一表達式,如矩陣、集合等,然后向比較單元202發(fā)送業(yè)務(wù)屬性數(shù)據(jù)和/或業(yè)務(wù)屬性數(shù)據(jù)的表達式。用戶的業(yè)務(wù)記錄數(shù)據(jù)可存儲于用戶業(yè)務(wù)記錄存儲單元101中,該用戶業(yè)務(wù)記錄存儲單元101可位于業(yè)務(wù)節(jié)點10中。另外,預(yù)處理單元201可進一步用于對業(yè)務(wù)記錄數(shù)據(jù)的有效性的驗證,以避免對錯誤數(shù)據(jù)的處理,例如,確定業(yè)務(wù)記錄數(shù)據(jù)的單位是否正確,如業(yè)務(wù)記錄數(shù)據(jù)的單位應(yīng)為分鐘,如果采集到的業(yè)務(wù)記錄數(shù)據(jù)的單位為小時,則確定該業(yè)務(wù)記錄數(shù)據(jù)無效;確定業(yè)務(wù)記錄數(shù)據(jù)的含義是否準確,如采集到的業(yè)務(wù)記錄數(shù)據(jù)應(yīng)為一天內(nèi)的時間,如果采集到的數(shù)據(jù)為30,則確定該業(yè)務(wù)記錄數(shù)據(jù)無效;確定業(yè)務(wù)記錄數(shù)據(jù)是否來自于需要進行分析的用戶,如采集用戶標識為123的用戶的業(yè)務(wù)記錄數(shù)據(jù),如果業(yè)務(wù)記錄數(shù)據(jù)來自于非123的用戶標識的業(yè)務(wù)記錄數(shù)據(jù),則確定該業(yè)務(wù)記錄數(shù)據(jù)無效,等等。
所述業(yè)務(wù)節(jié)點10是能夠提供用戶業(yè)務(wù)記錄數(shù)據(jù)的所有功能實體,可為SP側(cè)收集用戶業(yè)務(wù)記錄數(shù)據(jù)的功能實體,如應(yīng)用服務(wù)器(AS);也可為其他能夠提供用戶業(yè)務(wù)記錄數(shù)據(jù)的功能實體,例如,業(yè)務(wù)網(wǎng)關(guān),電信業(yè)務(wù)運營支撐系統(tǒng)(BOSS)、客戶關(guān)系管理系統(tǒng)的用戶數(shù)據(jù)服務(wù)器等功能節(jié)點。
比較單元202用于接收來自預(yù)處理單元201的業(yè)務(wù)屬性數(shù)據(jù),將業(yè)務(wù)屬性數(shù)據(jù)與來自數(shù)據(jù)存儲單元204的業(yè)務(wù)屬性函數(shù)、即業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對原有業(yè)務(wù)屬性函數(shù)、即業(yè)務(wù)特征進行校正后,向分析單元203發(fā)送業(yè)務(wù)屬性數(shù)據(jù)。所述比較策略可配置于比較單元202中,也可存儲于數(shù)據(jù)存儲單元204中,由比較單元202與數(shù)據(jù)存儲單元204進行交互來獲取,比較策略可根據(jù)不同用戶來設(shè)置,可根據(jù)不同業(yè)務(wù)來設(shè)置,可根據(jù)一個業(yè)務(wù)中的不同業(yè)務(wù)屬性來設(shè)置,針對同一業(yè)務(wù)中的同一業(yè)務(wù)屬性,也可根據(jù)使用業(yè)務(wù)的不同用戶來設(shè)置,或針對同一業(yè)務(wù)中的各業(yè)務(wù)屬性,根據(jù)使用業(yè)務(wù)的不同用戶來設(shè)置。
由于預(yù)處理單元201可進一步用于將用戶的業(yè)務(wù)屬性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一表達式,預(yù)處理單元201向比較單元202發(fā)送的可能是業(yè)務(wù)屬性數(shù)據(jù)的表達式,此時,比較單元202進一步用于從收到的業(yè)務(wù)屬性數(shù)據(jù)表達式中提取相應(yīng)業(yè)務(wù)屬性數(shù)據(jù)。
分析單元203用于根據(jù)來自比較單元202的業(yè)務(wù)屬性數(shù)據(jù),對接收的原有業(yè)務(wù)屬性函數(shù)、即業(yè)務(wù)特征進行校正操作,為用戶生成新的業(yè)務(wù)屬性函數(shù)、即新的業(yè)務(wù)特征,然后向數(shù)據(jù)存儲單元204發(fā)送新的業(yè)務(wù)屬性函數(shù),由數(shù)據(jù)存儲單元204進行存儲。分析單元203實現(xiàn)了對用戶原有的業(yè)務(wù)屬性函數(shù)的不斷修正,使得新的業(yè)務(wù)屬性函數(shù)能夠體現(xiàn)用戶最近使用業(yè)務(wù)的情況,對用戶未來的業(yè)務(wù)使用情況的預(yù)測起到指導(dǎo)作用。所述分析單元203接收的原有業(yè)務(wù)屬性函數(shù)可來自比較單元202,即比較單元202確定需要對業(yè)務(wù)屬性函數(shù)進行校正,向分析單元203發(fā)送業(yè)務(wù)屬性數(shù)據(jù)時,進一步向分析單元203發(fā)送來自數(shù)據(jù)存儲單元204的業(yè)務(wù)屬性函數(shù);也可來自數(shù)據(jù)存儲單元204,即分析單元203收到比較單元發(fā)送的業(yè)務(wù)屬性數(shù)據(jù)后,通過與數(shù)據(jù)存儲單元204的交互獲取業(yè)務(wù)屬性函數(shù)。
對于未生成過業(yè)務(wù)屬性函數(shù)的用戶,分析單元203可進一步用于生成用戶的初始業(yè)務(wù)屬性函數(shù),然后向數(shù)據(jù)存儲單元204發(fā)送初始業(yè)務(wù)屬性函數(shù),由數(shù)據(jù)存儲單元204進行存儲。分析單元203可針對某一業(yè)務(wù)的各業(yè)務(wù)屬性分別生成相應(yīng)的初始業(yè)務(wù)屬性函數(shù),這些初始業(yè)務(wù)屬性函數(shù)的組合就形成了用戶業(yè)務(wù)指紋。未生成過業(yè)務(wù)屬性函數(shù)可指未生成過用戶業(yè)務(wù)指紋,由于未針對用戶生成業(yè)務(wù)指紋,必然未針對相應(yīng)用戶生成任何業(yè)務(wù)屬性函數(shù);也可指需要針對某一業(yè)務(wù)的業(yè)務(wù)指紋新增的業(yè)務(wù)屬性函數(shù),如原來某一業(yè)務(wù)的業(yè)務(wù)屬性有三個,現(xiàn)在需要再針對該業(yè)務(wù)增加一個新的業(yè)務(wù)屬性,此時,從未針對用戶生成對應(yīng)于該新增的業(yè)務(wù)屬性的業(yè)務(wù)屬性函數(shù)。
可通過用戶標識來識別是否已針對相應(yīng)用戶生成業(yè)務(wù)屬性函數(shù),例如,如果已針對用戶生成了業(yè)務(wù)屬性函數(shù),則存儲相應(yīng)用戶的用戶標識,這樣,對于未存儲的用戶標識、即新的用戶標識,表明未針對相應(yīng)用戶生成過業(yè)務(wù)屬性函數(shù)。例如,分析單元203得到用戶的業(yè)務(wù)屬性數(shù)據(jù)后,可判斷自身是否存儲有相應(yīng)用戶標識,如果存儲了,則表明已針對該用戶生成了業(yè)務(wù)屬性函數(shù),分析單元203對接收的原有業(yè)務(wù)屬性函數(shù)進行校正操作;如果未存儲,則表明還未針對該用戶生成業(yè)務(wù)屬性函數(shù),分析單元203向數(shù)據(jù)存儲單元204發(fā)送用戶的業(yè)務(wù)屬性數(shù)據(jù),由數(shù)據(jù)存儲單元204進行存儲,在符合初始業(yè)務(wù)屬性函數(shù)生成條件時,如數(shù)據(jù)的采集時間長度已達到設(shè)定的采集時間長度,提取數(shù)據(jù)存儲單元204中存儲的業(yè)務(wù)屬性數(shù)據(jù),為用戶生成初始業(yè)務(wù)屬性函數(shù)。又如,分析單元203得到用戶的業(yè)務(wù)記錄數(shù)據(jù)后,向數(shù)據(jù)存儲單元204查詢是否存儲有相應(yīng)用戶標識,如果數(shù)據(jù)存儲單元204查找到相應(yīng)用戶標識,則可向分析單元203返回成功響應(yīng),表明已針對該用戶生成了業(yè)務(wù)屬性函數(shù),分析單元203對接收的原有業(yè)務(wù)屬性函數(shù)進行校正操作;如果數(shù)據(jù)存儲單元204未查找到相應(yīng)用戶標識,則可向分析單元203返回失敗響應(yīng),表明還未針對該用戶生成業(yè)務(wù)屬性函數(shù),分析單元203為該用戶生成初始業(yè)務(wù)屬性函數(shù)。未針對該用戶生成業(yè)務(wù)屬性函數(shù)時,由于比較單元202收到來自預(yù)處理單元201的業(yè)務(wù)屬性數(shù)據(jù)或其表達式后,無法從數(shù)據(jù)存儲單元204中獲取業(yè)務(wù)屬性函數(shù),因此,比較單元202可確定異常發(fā)生,將分析單元203發(fā)送用戶的業(yè)務(wù)屬性數(shù)據(jù)。所述用戶標識為用戶使用相應(yīng)業(yè)務(wù)時、區(qū)分于其他用戶的標識。具體分析單元203為用戶生成初始業(yè)務(wù)屬性函數(shù)的過程,可參照前面初始階段生成初始業(yè)務(wù)屬性函數(shù)的描述,在此不再贅述。
數(shù)據(jù)存儲單元204用于存儲用戶的一個或多個業(yè)務(wù)屬性函數(shù),如果數(shù)據(jù)存儲單元204需要向比較單元202提供比較策略,則數(shù)據(jù)存儲單元204進一步用于存儲比較策略。用戶使用的一個業(yè)務(wù)的各業(yè)務(wù)屬性函數(shù)的集合就組成了用戶在該業(yè)務(wù)的業(yè)務(wù)指紋。數(shù)據(jù)存儲單元204中存儲的業(yè)務(wù)屬性函數(shù)可能是用戶的初始業(yè)務(wù)屬性函數(shù)、即業(yè)務(wù)屬性函數(shù)原型,該用戶的初始業(yè)務(wù)屬性函數(shù)可來自于預(yù)處理單元201,也可為配置在數(shù)據(jù)存儲單元204中的,也可能是經(jīng)過校正操作后的業(yè)務(wù)屬性函數(shù),該業(yè)務(wù)屬性函數(shù)可來自于分析單元203。業(yè)務(wù)屬性函數(shù)能夠體現(xiàn)用戶最近的業(yè)務(wù)使用情況的一個特征,這樣,由各業(yè)務(wù)屬性函數(shù)的集合組成的業(yè)務(wù)指紋就能夠體現(xiàn)用戶最近使用業(yè)務(wù)綜合情況。
分析單元203用于生成用戶的初始業(yè)務(wù)屬性函數(shù)時,分析單元203進一步用于將一段時間內(nèi)的每個固定周期內(nèi)采集到的用戶業(yè)務(wù)記錄數(shù)據(jù)發(fā)送給數(shù)據(jù)存儲單元204,并在符合初始業(yè)務(wù)屬性函數(shù)生成條件時,如數(shù)據(jù)的采集時間長度已達到設(shè)定的采集時間長度后,提取數(shù)據(jù)存儲單元204中存儲的用戶業(yè)務(wù)記錄數(shù)據(jù),為用戶生成初始業(yè)務(wù)屬性函數(shù);數(shù)據(jù)存儲單元204進一步用于對來自預(yù)處理單元201的用戶業(yè)務(wù)記錄數(shù)據(jù)進行存儲。
根據(jù)比較策略,并不是每次發(fā)現(xiàn)業(yè)務(wù)屬性數(shù)據(jù)不符合原有業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù),都需要馬上對原有業(yè)務(wù)屬性函數(shù)進行校正,而是可能只是將不符合原有業(yè)務(wù)屬性函數(shù)的業(yè)務(wù)屬性數(shù)據(jù)或其表達式暫時存儲起來,當不符合的異常累計到設(shè)定次數(shù)時才開始對原有業(yè)務(wù)屬性函數(shù)進行校正。由此可見,當業(yè)務(wù)屬性數(shù)據(jù)不符合業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)、且根據(jù)比較策略又不需要對原有業(yè)務(wù)屬性函數(shù)進行校正時,比較單元202向數(shù)據(jù)存儲單元204發(fā)送業(yè)務(wù)屬性數(shù)據(jù)或其表達式,由數(shù)據(jù)存儲單元204進行存儲。
對業(yè)務(wù)屬性函數(shù)、即業(yè)務(wù)特征或業(yè)務(wù)指紋進行分析的重點在于對用戶個體的某個業(yè)務(wù)的使用情況進行分析,并通過一系列函數(shù)曲線來表示用戶使用業(yè)務(wù)的變化趨勢,從中得到一些與具體業(yè)務(wù)屬性相關(guān)的規(guī)律性特征并進行量化。這些函數(shù)曲線能夠根據(jù)用戶的業(yè)務(wù)使用情況通過自適應(yīng)等方式不斷進行調(diào)整,從而準確地反映用戶使用業(yè)務(wù)過程中的一個或一些特征表現(xiàn),對用戶未來的業(yè)務(wù)使用情況的預(yù)測起到指導(dǎo)作用。
圖3示出了業(yè)務(wù)特征分析流程圖,如圖3所示,對業(yè)務(wù)特征進行分析的實現(xiàn)過程包括以下步驟
步驟301對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行預(yù)處理,該預(yù)處理過程可包括采集用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)配置的業(yè)務(wù)屬性對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行分類,生成用戶的業(yè)務(wù)屬性數(shù)據(jù)。
用戶的業(yè)務(wù)記錄數(shù)據(jù)是從業(yè)務(wù)節(jié)點中提取到的體現(xiàn)用戶業(yè)務(wù)使用情況的原始數(shù)據(jù),如歷史話單、費用記錄、當前業(yè)務(wù)使用記錄(時間、費用等基本信息)、用戶業(yè)務(wù)使用過程中產(chǎn)生的數(shù)據(jù)(主要是用戶業(yè)務(wù)相關(guān)內(nèi)容信息,如短信內(nèi)容、網(wǎng)絡(luò)查詢的內(nèi)容等)。
用戶的業(yè)務(wù)記錄數(shù)據(jù)經(jīng)過預(yù)處理,如識別、提取、過濾和量化等,最后得到的業(yè)務(wù)屬性數(shù)據(jù)能夠正確反映用戶原始的業(yè)務(wù)記錄數(shù)據(jù),并能夠直接對其進行比較分析。
步驟302根據(jù)用戶的業(yè)務(wù)屬性數(shù)據(jù),生成統(tǒng)一的業(yè)務(wù)屬性數(shù)據(jù)的表達式,如矩陣、集合等,生成業(yè)務(wù)屬性數(shù)據(jù)的表達式,步驟302可省略。
例如,用戶使用寬帶業(yè)務(wù)的記錄信息可量化為以下形式 該形式即為業(yè)務(wù)屬性數(shù)據(jù)的表達式,其描述的是用戶當天上網(wǎng)的業(yè)務(wù)屬性數(shù)據(jù),當天第一次上網(wǎng)時間為19:00,時間長度為10分鐘,上網(wǎng)費用2.0元,當天第二次上網(wǎng)時間為20:00,時間長度為30分鐘,費用6.0元。
所述步驟301~步驟302可由圖2所示的業(yè)務(wù)特征生成裝置20來處理,具體可主要由業(yè)務(wù)特征生成裝置20中的預(yù)處理單元201來處理。
步驟301~步驟302之前已預(yù)先選定了對業(yè)務(wù)指紋進行分析的業(yè)務(wù)屬性,即需要對用戶在業(yè)務(wù)使用過程中的行為表現(xiàn)進行分析的業(yè)務(wù)屬性,所述配置的業(yè)務(wù)屬性即為選定的業(yè)務(wù)屬性。采集了用戶的業(yè)務(wù)記錄數(shù)據(jù)之后,可進一步對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證,以避免對錯誤數(shù)據(jù)的處理。
步驟301~步驟302是數(shù)據(jù)采樣的過程,采集用戶的業(yè)務(wù)記錄數(shù)據(jù),并根據(jù)業(yè)務(wù)屬性轉(zhuǎn)換為業(yè)務(wù)屬性數(shù)據(jù)??芍芷谛詧?zhí)行步驟301~步驟302,如每個月的第二個星期,對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),進一步可生成業(yè)務(wù)屬性數(shù)據(jù)的表達式。也可根據(jù)觸發(fā)事件執(zhí)行步驟301~步驟302,如收到控制命令時,對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行預(yù)處理;又如,通過后續(xù)步驟確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相符時,也可觸發(fā)執(zhí)行步驟301~步驟302,通過對一段時間業(yè)務(wù)屬性數(shù)據(jù)的采集來對業(yè)務(wù)屬性函數(shù)進行修正。
步驟303~步驟304將業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略判斷是否需要對原有業(yè)務(wù)屬性函數(shù)進行校正,如果是,則執(zhí)行步驟305;否則,結(jié)束當前流程。所述步驟303~步驟304可由圖2所示的業(yè)務(wù)特征生成裝置20來處理,具體可主要由業(yè)務(wù)特征生成裝置20中的比較單元202來處理。
如果步驟302中預(yù)處理單元201將用戶的業(yè)務(wù)屬性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一表達式,則步驟303中比較單元202收到該表達式后,將提取相應(yīng)業(yè)務(wù)屬性數(shù)據(jù)。
如果已針對用戶在某個業(yè)務(wù)上的業(yè)務(wù)屬性生成了業(yè)務(wù)屬性函數(shù),即已存儲了用戶的業(yè)務(wù)屬性函數(shù),則將最新采樣到的業(yè)務(wù)屬性數(shù)據(jù)與這些已有的業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較分析,如果新采樣到的業(yè)務(wù)屬性數(shù)據(jù)與業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)的差值在允許的誤差范圍內(nèi),則不需要對原有業(yè)務(wù)屬性函數(shù)進行校正操作,否則,就需要對原有業(yè)務(wù)屬性函數(shù)進行校正操作。單次業(yè)務(wù)屬性數(shù)據(jù)與原有業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相吻合,由于業(yè)務(wù)屬性函數(shù)能夠準確表達用戶過去的業(yè)務(wù)使用情況,并可進一步成為對用戶未來的業(yè)務(wù)使用情況做出預(yù)測的基礎(chǔ),因此,數(shù)據(jù)不相吻合可視為業(yè)務(wù)屬性函數(shù)預(yù)測的失敗,但是單次的數(shù)據(jù)不符可能還不足以確定出是否需要對原有業(yè)務(wù)屬性函數(shù)進行調(diào)整,這樣就需要綜合考慮業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)與實際采樣到的業(yè)務(wù)屬性數(shù)據(jù)的相差幅度和預(yù)測失敗次數(shù),因此,需要一個比較策略來對是否需要對原有業(yè)務(wù)屬性函數(shù)進行校正分析進行判斷。
仍以寬帶業(yè)務(wù)為例,只考慮對上網(wǎng)時間的業(yè)務(wù)屬性進行分析,對該業(yè)務(wù)屬性的比較策略是給定一個允許誤差范圍,將新采樣到的業(yè)務(wù)屬性數(shù)據(jù)與原有業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行差值比較,如果差值在允許誤差范圍內(nèi),則不需要對原有業(yè)務(wù)屬性函數(shù)進行校正操作,也無需對此次采集到的業(yè)務(wù)屬性數(shù)據(jù)進行存儲,如用戶上網(wǎng)時間的統(tǒng)計誤差為10分鐘,上網(wǎng)時間的判斷原則是最新上網(wǎng)時間是否在預(yù)測時間的前后10分鐘范圍內(nèi);如果差值在允許誤差范圍之外,但是偏差不大,如小于允許誤差范圍的兩倍,此時,也不需要立即對原有業(yè)務(wù)屬性函數(shù)進行校正操作,但可開始對這樣的情況進行監(jiān)控,并在滿足設(shè)定條件時,如累計業(yè)務(wù)屬性函數(shù)預(yù)測失敗的次數(shù),對每次異常情況的業(yè)務(wù)屬性數(shù)據(jù)進行統(tǒng)計和存儲,以便在業(yè)務(wù)屬性函數(shù)預(yù)測失敗的次數(shù)累計到設(shè)定值、如三次或連續(xù)兩次時,對業(yè)務(wù)屬性函數(shù)進行校正操作,又如在后續(xù)發(fā)生偏差大于允許誤差范圍的兩倍時,對業(yè)務(wù)屬性函數(shù)進行校正操作;如果差值在允許誤差范圍之外,并且偏差很大,如大于允許誤差范圍的兩倍或三點五倍,此時,可立即結(jié)合業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)屬性函數(shù)進行校正操作,也可仍然對異常的次數(shù)進行統(tǒng)計,當業(yè)務(wù)屬性函數(shù)預(yù)測失敗的次數(shù)累計到設(shè)定值時,對業(yè)務(wù)屬性函數(shù)進行校正操作。
另外,可對一周、一個月或一年等固定采集周期的用戶業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)由這些業(yè)務(wù)記錄數(shù)據(jù)生成的業(yè)務(wù)屬性數(shù)據(jù)與業(yè)務(wù)屬性函數(shù)進行比較,此處所說的業(yè)務(wù)屬性數(shù)據(jù)是體現(xiàn)采集周期內(nèi)用戶使用業(yè)務(wù)情況的業(yè)務(wù)屬性數(shù)據(jù),也可為函數(shù)或曲線的形式。例如,對表示上網(wǎng)時間的業(yè)務(wù)屬性x1進行,其允許的誤差為δ,經(jīng)過一段時間內(nèi)每個固定周期的統(tǒng)計,發(fā)現(xiàn)用戶上網(wǎng)基本集中在兩個時間段(8:00,19:00)內(nèi),這樣,可設(shè)定這樣一個業(yè)務(wù)屬性函數(shù)Φ1(x1,day,δ=10)=x1,(day=1,2,3,4,5;|x1-19:00|>δ)19:00,(day=1,2,3,4,5;|x1-19:00|≤δ)8:00,(day=6,7;|x1-8:00|>2δ)x1,(day=6,7;|x1-8:00|≤2δ),]]>每周的星期一至星期五,如果用戶每次上網(wǎng)時間在19:00前后10分鐘,即18:50至19:10,則可將此次上網(wǎng)的時間記錄為19:00,如果誤差太大,如大于10分鐘,則取用戶的實際上網(wǎng)時間;每周的周末,用戶每次上網(wǎng)時間如果在早上8:00前后20分鐘,則將此次上網(wǎng)的時間記錄為8:00,否則,取用戶的實際上網(wǎng)時間。在用戶的實際上網(wǎng)時間與業(yè)務(wù)屬性函數(shù)中所描述的相應(yīng)時間基本吻合時,即在允許誤差范圍時,這個用戶的實際上網(wǎng)時間也可忽略不計,因為,其數(shù)值對業(yè)務(wù)屬性函數(shù)基本沒有什么影響。累計一段時間,如果用戶在某天的上網(wǎng)時間超過一定規(guī)律,如用戶在周末的上網(wǎng)時間在8:00的概率超過80%,則用一個函數(shù)表達,如f1(x1,day,δ1=5)=19:00,day=1,2,···,5;9:00,day=6,7.]]>步驟305根據(jù)業(yè)務(wù)屬性數(shù)據(jù),對原有業(yè)務(wù)屬性函數(shù)進行校正操作,生成新的業(yè)務(wù)屬性函數(shù)、即新的用戶業(yè)務(wù)特征,實現(xiàn)了對原有業(yè)務(wù)屬性函數(shù)的不斷修正,使得新的業(yè)務(wù)屬性函數(shù)能夠體現(xiàn)用戶最近使用業(yè)務(wù)的情況,對用戶未來的業(yè)務(wù)使用情況的預(yù)測起到指導(dǎo)作用。該步驟可由圖2所示的業(yè)務(wù)特征生成裝置20來處理,具體可主要由業(yè)務(wù)特征生成裝置20中的分析單元203來處理。
對原有業(yè)務(wù)屬性函數(shù)進行校正操作可為對業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行校正。例如,用戶在某個星期二15:00開始上網(wǎng),用戶本次上網(wǎng)的業(yè)務(wù)記錄數(shù)據(jù)被采集,將該上網(wǎng)時間與業(yè)務(wù)屬性函數(shù)中星期二的上網(wǎng)時間相比較發(fā)現(xiàn),在業(yè)務(wù)屬性函數(shù)中描述的用戶在每星期二的上網(wǎng)時間應(yīng)為19:00,出現(xiàn)了業(yè)務(wù)屬性函數(shù)預(yù)測失敗的異常情況,此時,可記錄本次采集到的數(shù)據(jù),在后續(xù)的幾個星期二再對用戶的上網(wǎng)時間進行采集,在滿足比較策略時、如異常達到三次,根據(jù)采集到的用戶在星期二的上網(wǎng)時間,對業(yè)務(wù)屬性函數(shù)中用戶在星期二的上網(wǎng)時間進行校正;或記錄本次采集到的數(shù)據(jù),可是對后續(xù)幾個星期的用戶上網(wǎng)時間進行采集,確定一周中的其他時間是否符合業(yè)務(wù)屬性函數(shù)的預(yù)測,在滿足比較策略時,根據(jù)采集到的用戶在各周的上網(wǎng)時間,對業(yè)務(wù)屬性函數(shù)中用戶的上網(wǎng)時間進行校正,如果用戶只在星期二的上網(wǎng)時間與業(yè)務(wù)屬性函數(shù)中用戶在星期二的上網(wǎng)時間有較大偏差,也可只對用戶在星期二的上網(wǎng)時間進行校正。因此,業(yè)務(wù)屬性數(shù)據(jù)可為固定周期內(nèi)各時間點的業(yè)務(wù)屬性數(shù)據(jù),也可為固定周期內(nèi)相同時間點的業(yè)務(wù)屬性數(shù)據(jù)。
初次分析后得到的業(yè)務(wù)屬性函數(shù)的集合就是用戶在該業(yè)務(wù)上的業(yè)務(wù)指紋的原型,需要通過不斷的采樣分析對其進行校正,才能夠更準確地描述出用戶在該業(yè)務(wù)上的特征表現(xiàn)。以用戶的單個業(yè)務(wù)屬性函數(shù)為例,與在固定周期內(nèi)新采樣的屬性數(shù)據(jù)比較后發(fā)現(xiàn)兩者的吻合度已不能滿足要求,根據(jù)比較策略需要進行自適應(yīng)分析。如圖4所示,具體自適應(yīng)分析、即校正分析操作過程如下首先,將業(yè)務(wù)屬性數(shù)據(jù)或其表達式與原有業(yè)務(wù)屬性函數(shù)的分布曲線上對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的點進行曲線擬合,從而獲得新的業(yè)務(wù)屬性函數(shù)的分布曲線;其次,通過函數(shù)逼真方式用一個新的函數(shù)來描述新的曲線分布,該新的函數(shù)即為新的業(yè)務(wù)屬性函數(shù)。分布曲線到函數(shù)表示的過程與初步階段生成初始業(yè)務(wù)屬性函數(shù)的處理相同,即通過離散逼近等數(shù)學(xué)手段,得到新的業(yè)務(wù)屬性函數(shù)。所述業(yè)務(wù)屬性數(shù)據(jù)可為進行如一周、一個月或一年等固定采集周期的用戶業(yè)務(wù)記錄數(shù)據(jù)的采集、并根據(jù)配置的業(yè)務(wù)屬性對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行分類、生成的業(yè)務(wù)屬性數(shù)據(jù),該業(yè)務(wù)屬性數(shù)據(jù)可為體現(xiàn)采集周期內(nèi)用戶使用業(yè)務(wù)情況的業(yè)務(wù)屬性數(shù)據(jù),也可為函數(shù)或曲線的形式;也可為已滿足比較策略需要對原有業(yè)務(wù)屬性函數(shù)進行校正,將與業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不符合的業(yè)務(wù)屬性數(shù)據(jù)。
步驟306對新的業(yè)務(wù)屬性函數(shù)進行存儲。該步驟可由圖2所示的業(yè)務(wù)特征生成裝置20來處理,具體可主要由業(yè)務(wù)特征生成裝置20中的存儲單元204來處理。
根據(jù)以上描述可見,步驟303~步驟304中所述的存儲的業(yè)務(wù)屬性函數(shù)可為用戶的初始業(yè)務(wù)屬性函數(shù),也可為經(jīng)過校正分析操作后存儲的業(yè)務(wù)屬性函數(shù)。
當選定的對業(yè)務(wù)指紋進行分析的業(yè)務(wù)屬性有多個時,對每一個需要進行校正分析操作的業(yè)務(wù)屬性函數(shù)重復(fù)上述步驟303~步驟306,可以獲得一組新的業(yè)務(wù)屬性函數(shù),每個業(yè)務(wù)屬性函數(shù)都能夠反映出用戶在最近一段時間內(nèi)的業(yè)務(wù)使用習(xí)慣,這些業(yè)務(wù)屬性函數(shù)的集合就組成了用戶新的業(yè)務(wù)指紋。用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋實際是不斷修正、自適應(yīng)的,通過對用戶原有的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋的不斷校正和更新,來得到能夠準確描述在過去的最近一段時間內(nèi)用戶業(yè)務(wù)使用行為特征的最新的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋。
針對于某一具體業(yè)務(wù),參與對用戶業(yè)務(wù)使用情況進行分析的業(yè)務(wù)屬性的數(shù)量可根據(jù)實際需要而進行增加或去除,例如,最初選取三個業(yè)務(wù)屬性對用戶的業(yè)務(wù)使用情況進行分析,經(jīng)過一段時間的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋校正分析后,發(fā)現(xiàn)其中一個業(yè)務(wù)屬性函數(shù)的變化很小,則可將相應(yīng)業(yè)務(wù)屬性去除;又如,經(jīng)過一段時間的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋校正分析后,發(fā)現(xiàn)為了更準確地體現(xiàn)用戶對業(yè)務(wù)的使用情況,還需要增加一個業(yè)務(wù)屬性,則對該業(yè)務(wù)屬性的相關(guān)數(shù)據(jù)進行采集分析,生成相應(yīng)的業(yè)務(wù)屬性函數(shù)。
用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋的實時分析對于整個用戶業(yè)務(wù)使用行為的分析是十分必要的。例如,對于用戶在業(yè)務(wù)使用過程中的“異常”,如分布曲線上的跳變,必須引起警惕,典型的實例可為用戶在某個業(yè)務(wù)的單次消費額大幅度增加、通話時間非常長,這樣的情況不排除用戶的業(yè)務(wù)被盜用或用戶對業(yè)務(wù)的需求存在轉(zhuǎn)折傾向。為此,對于某些業(yè)務(wù)屬性必須進行實時分析或觸發(fā)分析的機制。
用戶的業(yè)務(wù)屬性函數(shù)的實時分析過程可如以下描述步驟1用戶對相應(yīng)業(yè)務(wù)開始使用或用戶單次業(yè)務(wù)使用結(jié)束時,采集用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)配置的業(yè)務(wù)屬性對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行分類,生成用戶的業(yè)務(wù)屬性數(shù)據(jù),并可進一步將用戶的業(yè)務(wù)屬性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一表達式。例如,用戶一上網(wǎng),立即記錄用戶的上網(wǎng)時間并進行記錄和量化,然后量化后的上網(wǎng)時間進入下一步處理。
步驟2將單次用戶的業(yè)務(wù)屬性數(shù)據(jù)與原有業(yè)務(wù)屬性函數(shù)計算值進行比較分析,根據(jù)比較策略確定是否對業(yè)務(wù)屬性函數(shù)進行校正,如果確定當前業(yè)務(wù)屬性數(shù)據(jù)與業(yè)務(wù)屬性函數(shù)的計算值相符,則不進行下一步處理,結(jié)束當前流程;否則,按照預(yù)先設(shè)定的原則進行處理,如累計異常次數(shù)或立即觸發(fā)。仍以寬帶業(yè)務(wù)為例,用戶每次上網(wǎng)都會對上網(wǎng)時間的業(yè)務(wù)屬性進行分析,如果用戶上網(wǎng)時間符合其上網(wǎng)時間屬性函數(shù)f1,則不進行下一步處理;否則,按照預(yù)先設(shè)定的原則進行處理。
步驟3當用戶在某個業(yè)務(wù)屬性上的表現(xiàn)異常發(fā)生時或異常次數(shù)累計至設(shè)定值時,必須結(jié)合用戶的業(yè)務(wù)屬性數(shù)據(jù)對業(yè)務(wù)屬性函數(shù)進行重新分析,得到并存儲新的業(yè)務(wù)屬性函數(shù)。如果一次異常就觸發(fā)業(yè)務(wù)屬性函數(shù)的校正分析,則此處所說的業(yè)務(wù)屬性數(shù)據(jù)可為通過本次業(yè)務(wù)記錄數(shù)據(jù)轉(zhuǎn)換得到的業(yè)務(wù)屬性數(shù)據(jù);如果累計多次后觸發(fā)業(yè)務(wù)屬性函數(shù)的校正分析,則此處所說的業(yè)務(wù)屬性數(shù)據(jù)可為由各次存儲的業(yè)務(wù)屬性數(shù)據(jù)綜合分析后生成的,所述綜合分析過程可為一些數(shù)學(xué)處理過程,如數(shù)值擬合、函數(shù)逼真等。
步驟4根據(jù)用戶的業(yè)務(wù)屬性的“異?!北憩F(xiàn)以及分析結(jié)果,進行進一步處理,如進行實時監(jiān)控、善意提醒用戶或觸發(fā)其他事件。例如,在個人用戶的寬帶業(yè)務(wù)使用過程中,發(fā)現(xiàn)其單位時間內(nèi)的費用在費用屬性函數(shù)中發(fā)生很大跳變,有可能是賬戶被盜用或發(fā)生其他意外,此時可及時向用戶發(fā)出提醒。該步驟為可選步驟。
根據(jù)本發(fā)明提出的方法和裝置實現(xiàn)了對用戶個體數(shù)據(jù)的實時、深度分析,尤其是解決了對用戶個體的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋的量化、分析和提取,其優(yōu)點如下1、實時地對用戶個體使用某具體業(yè)務(wù)的行為進行分析,并對用戶的行為給出預(yù)測、即業(yè)務(wù)屬性函數(shù),根據(jù)預(yù)測結(jié)果和實際值、即業(yè)務(wù)屬性數(shù)據(jù)的差別來對用戶進行有差異化的處理,對用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋進行分析的最理想的結(jié)果是能夠發(fā)現(xiàn)用戶在某個業(yè)務(wù)屬性的周期規(guī)律,這樣可以對用戶的下一個周期進行預(yù)測,退一步,即使用戶的某個業(yè)務(wù)屬性沒有周期性規(guī)律,也能夠根據(jù)業(yè)務(wù)屬性函數(shù)的分布曲線的趨勢預(yù)測用戶未來一段時間的業(yè)務(wù)使用行為;
2、可以根據(jù)用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋來對用戶進行歸類,從而進行有針對性的營銷,例如,如果以某個業(yè)務(wù)屬性函數(shù)的分布曲線為搜索條件,根據(jù)設(shè)定的比較策略、如平均值接近,可以區(qū)分出有共同業(yè)務(wù)表現(xiàn)特征的業(yè)務(wù)群體,然后可針對這些群體展開相應(yīng)業(yè)務(wù),使業(yè)務(wù)具有更強的針對性和適用性,實現(xiàn)業(yè)務(wù)的個性化;3、甚至能夠通過某個特定的用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋,從業(yè)務(wù)群體中識別出用戶個體本身。
本發(fā)明提供的業(yè)務(wù)特征生成裝置可應(yīng)用在語音業(yè)務(wù)、數(shù)據(jù)增值業(yè)務(wù)、寬帶業(yè)務(wù)等業(yè)務(wù)的用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋分析中,由于每種業(yè)務(wù)的特點決定了其分析過程的某些細節(jié)可能不同,如某些業(yè)務(wù)是在時間上連續(xù)的,某些業(yè)務(wù)在時間上是離散的,但是分析步驟和所需要的功能單元是類似的。
用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋可進一步與運營商現(xiàn)有的用戶個人資料和其他記錄相配合,能夠全面地反映出用戶業(yè)務(wù)使用情況的真實表現(xiàn),從而衍生出更多的應(yīng)用。例如,通過分析不同性別的用戶的業(yè)務(wù)屬性函數(shù)或業(yè)務(wù)指紋,就能夠確定由性別因素而產(chǎn)生的不同業(yè)務(wù)需求、行為差異,根據(jù)這種差異提供有針對性的服務(wù),無疑能給業(yè)務(wù)帶來更好的效益,并能夠大大提高用戶對業(yè)務(wù)的滿意程度。
以上所述的業(yè)務(wù)屬性函數(shù)為業(yè)務(wù)特征的表現(xiàn)方式;以上所述用戶既可以指單個用戶,即一個具體的用戶個人,也可能是企業(yè)用戶,還可以是使用同一賬號的群體用戶,因此以上描述的用戶個體可指用戶個人,也可以指一個用戶群體。
總之,以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。
權(quán)利要求
1.一種用戶業(yè)務(wù)特征的生成方法,其特征在于,該方法包含以下步驟A、對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù);B、將業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正后,根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正操作,然后對生成的業(yè)務(wù)特征進行存儲。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述A之前進一步包括在一個以上設(shè)定周期的時間長度內(nèi)的每個設(shè)定周期,采集對應(yīng)于業(yè)務(wù)屬性的用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)所述業(yè)務(wù)記錄數(shù)據(jù)生成用戶的初始業(yè)務(wù)特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)業(yè)務(wù)記錄數(shù)據(jù)生成用戶的初始業(yè)務(wù)特征,為將業(yè)務(wù)記錄數(shù)據(jù)經(jīng)過曲線擬合分析得到具有分布曲線的業(yè)務(wù)特征。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟A中所述對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,與根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),之間進一步包括對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證,如果有效,則根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證,為確定業(yè)務(wù)記錄數(shù)據(jù)的單位是否正確;或為確定業(yè)務(wù)記錄數(shù)據(jù)的含義是否準確;或為確定業(yè)務(wù)記錄數(shù)據(jù)是否來自于需要進行分析的用戶。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,一個設(shè)置周期的開始或結(jié)束執(zhí)行所述步驟A;或觸發(fā)事件發(fā)生時,執(zhí)行所述步驟A。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述觸發(fā)事件為收到控制命令;或為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相符。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟A中所述業(yè)務(wù)記錄數(shù)據(jù)是體現(xiàn)用戶業(yè)務(wù)使用情況的數(shù)據(jù),為歷史話單,或費用記錄,或當前業(yè)務(wù)使用記錄,或用戶業(yè)務(wù)使用過程中生成的數(shù)據(jù),或以上任意的組合。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟B中所述根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正,為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)的偏差未在允許誤差范圍內(nèi)。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正,為確定業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)的偏差未在允許誤差范圍內(nèi),且滿足第二設(shè)定條件。
11.根據(jù)權(quán)利10所述的方法,其特征在于,所述第二設(shè)定條件為偏差未在允許誤差范圍內(nèi)的累計次數(shù)達到設(shè)定次數(shù);或為偏差未在允許誤差范圍內(nèi)的連續(xù)次數(shù)達到設(shè)定次數(shù);或為偏差在允許誤差范圍的正數(shù)倍之外。
12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述偏差未在允許誤差范圍內(nèi),與滿足第二設(shè)定條件,之間進一步包括對業(yè)務(wù)屬性數(shù)據(jù)進行存儲。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟B中所述根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正操作,為根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行校正操作。
14.根據(jù)權(quán)利要求1或13所述的方法,其特征在于,所述校正操作為函數(shù)逼近或數(shù)值逼近。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述業(yè)務(wù)屬性數(shù)據(jù)為固定周期內(nèi)各時間點的業(yè)務(wù)屬性數(shù)據(jù);或為固定周期內(nèi)相同時間點的業(yè)務(wù)屬性數(shù)據(jù)。
16.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述一個或一個以上的用戶的業(yè)務(wù)特征的集合組成用于描述用戶業(yè)務(wù)使用情況的業(yè)務(wù)指紋。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于,該方法進一步包括重復(fù)執(zhí)行步驟A和步驟B,分別生成各業(yè)務(wù)特征,生成的各業(yè)務(wù)特征的集合組成業(yè)務(wù)指紋。
18.根據(jù)權(quán)利要求1、2或16所述的方法,其特征在于,所述業(yè)務(wù)特征通過具有分布曲線的函數(shù)、或集合、或矩陣來表示。
19.一種用戶業(yè)務(wù)特征的生成裝置,其特征在于,該裝置包括預(yù)處理單元,用于接收用戶的業(yè)務(wù)記錄數(shù)據(jù),根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),并向比較單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);比較單元,用于將接收的來自預(yù)處理單元的業(yè)務(wù)屬性數(shù)據(jù)與來自數(shù)據(jù)存儲單元的業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對業(yè)務(wù)特征進行校正后,向分析單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);分析單元,用于根據(jù)來自比較單元的業(yè)務(wù)屬性數(shù)據(jù),對接收的原有業(yè)務(wù)特征進行校正操作,然后向數(shù)據(jù)存儲單元發(fā)送生成的新的業(yè)務(wù)特征;數(shù)據(jù)存儲單元,用于存儲業(yè)務(wù)特征。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,該裝置進一步包括業(yè)務(wù)節(jié)點,用于向預(yù)處理單元提供用戶的業(yè)務(wù)記錄數(shù)據(jù)。
21.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述業(yè)務(wù)節(jié)點與預(yù)處理單元通過數(shù)據(jù)采集接口相連。
22.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述業(yè)務(wù)節(jié)點為服務(wù)提供服務(wù)器,或為業(yè)務(wù)網(wǎng)關(guān),或為電信業(yè)務(wù)運營支撐系統(tǒng)服務(wù)器,或為客戶關(guān)系管理系統(tǒng)服務(wù)器。
23.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述分析單元進一步用于根據(jù)在一個以上設(shè)定周期的時間長度內(nèi)的每個設(shè)定周期采集的對應(yīng)于業(yè)務(wù)屬性的用戶的業(yè)務(wù)記錄數(shù)據(jù),生成用戶的初始業(yè)務(wù)特征,并向數(shù)據(jù)存儲單元發(fā)送業(yè)務(wù)記錄數(shù)據(jù)和該初始業(yè)務(wù)特征;所述數(shù)據(jù)存儲單元進一步用于存儲業(yè)務(wù)記錄數(shù)據(jù)。
24.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述分析單元接收的原有業(yè)務(wù)特征來自比較單元,或來自數(shù)據(jù)存儲單元。
25.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述預(yù)處理單元進一步用于對業(yè)務(wù)記錄數(shù)據(jù)的有效性進行驗證。
26.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述預(yù)處理單元進一步用于根據(jù)業(yè)務(wù)屬性數(shù)據(jù)生成表達式,并向比較單元發(fā)送該表達式。
27.根據(jù)權(quán)利要求26所述裝置,其特征在于,所述比較單元進一步用于根據(jù)收到的來自預(yù)處理單元的表達式提取業(yè)務(wù)屬性數(shù)據(jù)。
28.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述比較策略配置于比較單元,或存儲于數(shù)據(jù)存儲單元,由數(shù)據(jù)存儲單元向比較單元提供。
29.根據(jù)權(quán)利要求19所述的裝置,其特征在于,業(yè)務(wù)屬性數(shù)據(jù)與業(yè)務(wù)特征中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)不相符,且不需要對業(yè)務(wù)特征進行校正時,所述比較單元進一步用于向數(shù)據(jù)存儲單元發(fā)送業(yè)務(wù)屬性數(shù)據(jù);所述數(shù)據(jù)存儲單元進一步用于對收到的業(yè)務(wù)屬性數(shù)據(jù)進行存儲。
全文摘要
本發(fā)明公開了一種用戶業(yè)務(wù)特征的生成方法及裝置,對用戶的業(yè)務(wù)記錄數(shù)據(jù)進行采集,根據(jù)配置的業(yè)務(wù)屬性將業(yè)務(wù)記錄數(shù)據(jù)劃分成業(yè)務(wù)屬性數(shù)據(jù),將業(yè)務(wù)屬性數(shù)據(jù)與存儲的業(yè)務(wù)特征、即業(yè)務(wù)屬性函數(shù)中對應(yīng)于業(yè)務(wù)屬性數(shù)據(jù)含義的數(shù)據(jù)進行比較,根據(jù)比較策略確定需要對原有業(yè)務(wù)特征進行校正后,根據(jù)業(yè)務(wù)屬性數(shù)據(jù)對原有業(yè)務(wù)特征進行校正,生成新的業(yè)務(wù)特征,通過對用戶業(yè)務(wù)特征的分析,方便服務(wù)提供商對用戶提供服務(wù),從而提升用戶體驗,增強用戶對業(yè)務(wù)的滿意度;通過分析用戶個體的業(yè)務(wù)特征或業(yè)務(wù)指紋,利用用戶的業(yè)務(wù)特征或業(yè)務(wù)指紋預(yù)測用戶的業(yè)務(wù)使用行為,區(qū)分出有共同業(yè)務(wù)表現(xiàn)特征的業(yè)務(wù)群體,能夠?qū)ν愑脩羧禾峁└哂嗅槍π缘姆?wù),提升業(yè)務(wù)價值。
文檔編號G06Q50/00GK1870025SQ20051011312
公開日2006年11月29日 申請日期2005年10月14日 優(yōu)先權(quán)日2005年10月14日
發(fā)明者閔國兵, 莫彩文, 張慶杰, 邵剛 申請人:華為技術(shù)有限公司