本發(fā)明涉及一種在無線通信網(wǎng)絡(luò)中對用戶投訴進行預(yù)測的方法和裝置,能夠按照數(shù)據(jù)匯聚網(wǎng)格,利用歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)對投訴預(yù)測模型進行訓(xùn)練,從而利用該投訴預(yù)測模型來獲取投訴預(yù)測結(jié)果。
背景技術(shù):
在無線通信網(wǎng)絡(luò)的運營過程中,往往會出現(xiàn)設(shè)備故障。此時,處于某一位置的手機用戶無法與基站進行通信、或者與基站通信不暢通,并具體體現(xiàn)為用戶手機無信號,電話無法撥通,掉話等現(xiàn)象。通常,無線通信網(wǎng)絡(luò)的運營商為手機用戶提供了投訴服務(wù)。
通過來自手機用戶的投訴,網(wǎng)絡(luò)運營商能夠發(fā)現(xiàn)網(wǎng)絡(luò)中出現(xiàn)的問題,并加以解決。當前,網(wǎng)絡(luò)運營商通常通過投訴電話接收用戶的投訴,并將用戶的投訴錄入到系統(tǒng)中以備后臺網(wǎng)維網(wǎng)優(yōu)人員進一步處理。
網(wǎng)絡(luò)中有時會出現(xiàn)持續(xù)的或較嚴重的故障問題,導(dǎo)致在短時間段內(nèi)發(fā)生大量投訴即突發(fā)投訴。突發(fā)投訴對用戶體驗而言是非常有害的。但是,以當前的投訴接收和處理方式無法針對這類突發(fā)投訴進行有效處理。因此,需要對諸如突發(fā)投訴的發(fā)生進行預(yù)測的新機制,從而根據(jù)預(yù)測結(jié)果提早發(fā)現(xiàn)和處理可能導(dǎo)致突發(fā)投訴的網(wǎng)絡(luò)側(cè)問題,防止突發(fā)投訴的發(fā)生,從而改善用戶的體驗。
中國專利公開cn103188705a公開了一種用戶投訴“查詢”系統(tǒng)。系統(tǒng)首先基于歷史的投訴信息與信令失敗信息等,建立業(yè)務(wù)失敗信息庫。然后對于實時運行中的每一個投訴,系統(tǒng)將基于該信息庫查詢用戶遇到網(wǎng)絡(luò)問題期間的失敗信令信息;然后根據(jù)這些投訴信息和失敗信令的組合去與一些閾值比對來產(chǎn)生警告?;谶@些告警信息,可以提高重大批量投訴處理及時率,減少客服和網(wǎng)絡(luò)維護人員的人工判斷環(huán)節(jié),減少了信息失真及流轉(zhuǎn)的時間。但其本質(zhì)上仍然是遵循“事后檢測”的處理模式,并不能達到“預(yù)先處理”的效果。
中國專利公開cn103428741a使用了基站的業(yè)務(wù)量遵循特定的概率分布的假定,并且使用閾值來找到“不良基站”和“惡劣感知用戶”,并且計算“影響系數(shù)”來指示接下來的操作步驟防止突發(fā)投訴的發(fā)生。該方法的判斷規(guī)則較為簡單,因此精確度成為較大問題。
在無線通信網(wǎng)絡(luò)中存在收集的大量的實時信息,例如網(wǎng)絡(luò)異常事件信息、網(wǎng)絡(luò)性能信息,這些信息與用戶投訴的發(fā)生有著較為緊密的關(guān)系。但是,現(xiàn)有技術(shù)中并未對性能數(shù)據(jù)、告警數(shù)據(jù)與投訴的發(fā)生之間的關(guān)聯(lián)進行研究,因此難以有效地對突發(fā)投訴等的發(fā)生進行預(yù)測。
技術(shù)實現(xiàn)要素:
為了克服現(xiàn)有技術(shù)的上述缺陷提出了本發(fā)明。因此,本發(fā)明的目的之一是提供一種在無線通信網(wǎng)絡(luò)中對用戶投訴進行預(yù)測的方法和裝置,能夠按照數(shù)據(jù)匯聚網(wǎng)格,利用歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)對投訴預(yù)測模型進行訓(xùn)練,從而利用該投訴預(yù)測模型來獲取投訴預(yù)測結(jié)果。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明,提出了一種在無線通信網(wǎng)絡(luò)中對用戶投訴進行預(yù)測的方法,包括:從歷 史數(shù)據(jù)庫中提取針對無線通信網(wǎng)絡(luò)的各網(wǎng)元的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù);基于所設(shè)置的預(yù)警時間長度、輸入時間窗大小和預(yù)測時間窗大小,以數(shù)據(jù)匯聚網(wǎng)格為單位,對數(shù)據(jù)匯聚網(wǎng)格中的各網(wǎng)元的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)進行組合并關(guān)聯(lián);將組合并關(guān)聯(lián)后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的數(shù)據(jù)樣本集作為訓(xùn)練數(shù)據(jù)集,來訓(xùn)練并生成投訴預(yù)測模型;以及將待預(yù)測時間窗內(nèi)的實時性能數(shù)據(jù)和實時告警數(shù)據(jù)的數(shù)據(jù)樣本集輸入到所述投訴預(yù)測模型,產(chǎn)生投訴預(yù)測結(jié)果。
優(yōu)選地,所述將組合并關(guān)聯(lián)后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的數(shù)據(jù)樣本集作為訓(xùn)練數(shù)據(jù)集的步驟還包括:在所述數(shù)據(jù)樣本集對突發(fā)投訴數(shù)據(jù)進行標識。
優(yōu)選地,所述將組合并關(guān)聯(lián)后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的數(shù)據(jù)樣本集作為訓(xùn)練數(shù)據(jù)集的步驟還包括:從所述訓(xùn)練數(shù)據(jù)集清洗無效數(shù)據(jù)樣本。
優(yōu)選地,所述數(shù)據(jù)匯聚網(wǎng)格是由物理位置接近的多個網(wǎng)元構(gòu)成的。
優(yōu)選地,所述數(shù)據(jù)匯聚網(wǎng)格中所包括的網(wǎng)元是可更新的。
優(yōu)選地,所述歷史性能數(shù)據(jù)具有不同的性能種類,且所述歷史告警數(shù)據(jù)具有不同的告警種類。
另外,根據(jù)本發(fā)明,還提出了一種在無線通信網(wǎng)絡(luò)中對用戶投訴進行預(yù)測的裝置,包括:從歷史數(shù)據(jù)庫中提取針對無線通信網(wǎng)絡(luò)的各網(wǎng)元的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的數(shù)據(jù)導(dǎo)入模塊;基于所設(shè)置的預(yù)警時間長度、輸入時間窗大小和預(yù)測時間窗大小,以數(shù)據(jù)匯聚網(wǎng)格為單位,對數(shù)據(jù)匯聚網(wǎng)格中的各網(wǎng)元的 歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)進行組合并關(guān)聯(lián)的數(shù)據(jù)匯聚模塊;將組合并關(guān)聯(lián)后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的數(shù)據(jù)樣本集作為訓(xùn)練數(shù)據(jù)集,來訓(xùn)練并生成投訴預(yù)測模型的訓(xùn)練模塊;以及將待預(yù)測時間窗內(nèi)的實時性能數(shù)據(jù)和實時告警數(shù)據(jù)的數(shù)據(jù)樣本集輸入到所述投訴預(yù)測模型,產(chǎn)生投訴預(yù)測結(jié)果的突發(fā)預(yù)測模塊。
優(yōu)選地,所述數(shù)據(jù)匯聚模塊在所述數(shù)據(jù)樣本集對突發(fā)投訴數(shù)據(jù)進行標識。
優(yōu)選地,所述裝置還包括:
從所述訓(xùn)練數(shù)據(jù)集清洗無效數(shù)據(jù)樣本的數(shù)據(jù)清洗模塊。
根據(jù)本發(fā)明,能夠按照數(shù)據(jù)匯聚網(wǎng)格,利用歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)對投訴預(yù)測模型進行訓(xùn)練,從而利用該投訴預(yù)測模型來獲取投訴預(yù)測結(jié)果。
附圖說明
圖1是示出了根據(jù)本發(fā)明的生成投訴預(yù)測模型的方法的流程圖。
圖2是示出了根據(jù)本發(fā)明的根據(jù)獲取的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù),在線地對數(shù)據(jù)匯聚進行更新的過程的流程圖。
圖3是根據(jù)本發(fā)明的在觸發(fā)投訴預(yù)測時利用投訴預(yù)測模型來生成投訴預(yù)測結(jié)果的過程的流程圖。
圖4是示出了將基站(網(wǎng)元)劃分到相應(yīng)的數(shù)據(jù)匯聚網(wǎng)格的過程的流程圖。
圖5示出了用于將發(fā)生用戶投訴的位置處的基站與所屬的數(shù)據(jù)匯聚網(wǎng)格進行映射的示例表格。
圖6是示出了按照數(shù)據(jù)匯聚網(wǎng)格,基于時間窗對告警 數(shù)據(jù)、性能數(shù)據(jù)進行組合后的數(shù)據(jù)樣本集的示例。
圖7是示出了告警消息的格式的示意圖。
圖8是示出了性能消息的格式的示意圖。
圖9是示出了網(wǎng)絡(luò)控制中心所收到的用戶投訴消息的格式的示意圖。
圖10是示出了各數(shù)據(jù)匯聚網(wǎng)格在不同時間窗內(nèi)的投訴數(shù)的示例樣本圖。
圖11是根據(jù)本發(fā)明的投訴預(yù)測系統(tǒng)的示意結(jié)構(gòu)圖。
具體實施方式
下面將參考附圖描述本發(fā)明的優(yōu)選實施例。在附圖中,相同的元件將由相同的參考符號或數(shù)字表示。此外,在本發(fā)明的下列描述中,將省略對已知功能和配置的具體描述,以避免使本發(fā)明的主題不清楚。
圖1是示出了根據(jù)本發(fā)明的生成投訴預(yù)測模型的方法的流程圖。
如圖1所示,在步驟101,從歷史數(shù)據(jù)庫中提取無線通信網(wǎng)絡(luò)的各網(wǎng)元的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)。無線通信網(wǎng)絡(luò)的網(wǎng)元包括基站、無線交換中心(msc)等。所謂性能數(shù)據(jù)包括是表征通信網(wǎng)絡(luò)中的不同網(wǎng)元處的運行性能的數(shù)據(jù),例如網(wǎng)元處的話務(wù)量,資源占用率等。所謂告警數(shù)據(jù)是指在網(wǎng)元處發(fā)生諸如故障時而產(chǎn)生的向網(wǎng)絡(luò)控制中心進行報告的告警消息等。所謂投訴數(shù)據(jù)是從網(wǎng)管設(shè)備處提取已有的針對無線通信故障的投訴消息等。
根據(jù)本發(fā)明,將通信網(wǎng)絡(luò)的各網(wǎng)元劃分到不同的數(shù)據(jù)匯聚網(wǎng)格,用于以該數(shù)據(jù)匯聚網(wǎng)格為單位將數(shù)據(jù)匯聚網(wǎng)格內(nèi)的所有網(wǎng)元的各類型數(shù)據(jù)匯聚在一起。作為示例,可以根據(jù)網(wǎng)元的物理位置關(guān)系來劃分數(shù)據(jù)匯聚網(wǎng)格,例如,可以將物理位置接近的多個網(wǎng)元劃分到同一數(shù)據(jù)匯 聚網(wǎng)格。具體的劃分方式并不局限于此。
對于數(shù)據(jù)匯聚網(wǎng)格的劃分應(yīng)該是可變的,例如在某些地點布設(shè)了新的網(wǎng)元等。因此,將數(shù)據(jù)匯聚網(wǎng)格內(nèi)的所有網(wǎng)元的數(shù)據(jù)進行匯聚之前,需要確定是否發(fā)生了數(shù)據(jù)匯聚網(wǎng)格的劃分的變更(步驟103)。如果確定發(fā)生了數(shù)據(jù)匯聚網(wǎng)格的劃分的變更(步驟103的是),則在步驟121中從相應(yīng)的數(shù)據(jù)庫提取基站資源數(shù)據(jù),例如基站名稱和基站地理位置等。然后,在步驟123,根據(jù)提取的基站資源數(shù)據(jù),更新數(shù)據(jù)匯聚網(wǎng)格的劃分。
如果數(shù)據(jù)匯聚網(wǎng)格的劃分無需更新,則在步驟105,按照數(shù)據(jù)匯聚網(wǎng)格對提取各網(wǎng)元的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)匯聚在一起。
在步驟107,設(shè)置預(yù)警時間長度,輸入時間窗大小和預(yù)測時間窗大小等參數(shù)。所述預(yù)警時間長度為預(yù)測時間窗的起始點與輸入時間窗的結(jié)束點之間的差值,即預(yù)測作出后多長時間,所預(yù)測的內(nèi)容就會出現(xiàn)。所述輸入時間窗是指為了進行預(yù)測,需要收集預(yù)測發(fā)生時點往前多長的時間范圍內(nèi),網(wǎng)絡(luò)產(chǎn)生的各類型數(shù)據(jù)。所述預(yù)測時間窗是用來指示在未來多長的時間范圍內(nèi),是否會發(fā)生突發(fā)投訴。
在步驟109,基于所設(shè)置的預(yù)警時間長度,輸入時間窗大小和預(yù)測時間窗大小等參數(shù),按照數(shù)據(jù)匯聚網(wǎng)格,對歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)進行組合并關(guān)聯(lián),由此可生成如圖6所示那樣的映射表格的數(shù)據(jù)樣本集。
在步驟111,從組合后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的映射表格中對突發(fā)投訴數(shù)據(jù)進行標識,以便為后續(xù)的機器學(xué)習(xí)過程提供學(xué)習(xí)目標(預(yù)測突發(fā)投訴)的依據(jù),從而形成訓(xùn)練數(shù)據(jù)集。
對突發(fā)投訴數(shù)據(jù)進行標識可以通過比較時間窗內(nèi)投 訴總數(shù)目和閾值大小的方式來實現(xiàn)。例如,將投訴數(shù)據(jù)針對各時間窗組合后生成如圖10所示的映射表格的數(shù)據(jù)樣本集,即統(tǒng)計處每個時間窗內(nèi)的投訴總數(shù)目通過將圖10所示的映射表格的最后一列的數(shù)值與閾值進行比較來判斷其是否是突發(fā)投訴數(shù)據(jù)。然后,將表示投訴數(shù)據(jù)是否為突發(fā)投訴數(shù)據(jù)的標記按照時間窗和網(wǎng)格匹配的方式,與歷史性能數(shù)據(jù)和歷史告警數(shù)據(jù)的數(shù)據(jù)樣本集聯(lián)合構(gòu)成訓(xùn)練數(shù)據(jù)集。
對突發(fā)投訴數(shù)據(jù)進行標識也可以通過時域濾波的方式來實現(xiàn),例如,將投訴數(shù)據(jù)的時間序列通過某濾波器濾波后的結(jié)果進行與預(yù)先設(shè)定的閾值進行比較。在時間窗長于濾波器長度的前提下,某個時間窗內(nèi)只要出現(xiàn)一次高于閾值的濾波結(jié)果,則其對應(yīng)的投訴數(shù)據(jù)即被判定為突發(fā)投訴數(shù)據(jù)。然后,將表示投訴數(shù)據(jù)是否為突發(fā)投訴數(shù)據(jù)的標記按照時間窗和網(wǎng)格匹配的方式,與歷史性能數(shù)據(jù)和歷史告警數(shù)據(jù)的數(shù)據(jù)樣本集聯(lián)合構(gòu)成訓(xùn)練數(shù)據(jù)集。
然后,在步驟113,對由歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)構(gòu)成的訓(xùn)練數(shù)據(jù)集,清洗無效數(shù)據(jù)樣本。無效數(shù)據(jù)樣本是表示樣本中某個或者某些特征取值無效或缺失的情況。例如在圖6中,若網(wǎng)格1的“性能種類p取值_1小時”數(shù)值為null,即此數(shù)值未能取到,則此數(shù)值無效,導(dǎo)致此樣本同樣無效,應(yīng)該被清洗。或者當歷史數(shù)據(jù)集中包含的時間范圍不能提供某個樣本所需的全部特征值時,例如某個樣本需要12月31日23點的性能和告警數(shù)據(jù),但歷史數(shù)據(jù)中只包含1月1日至今的所有性能和告警數(shù)據(jù),則該樣本會出現(xiàn)特征數(shù)值的缺失,導(dǎo)致被判定為無效。由于模型本身需要提供輸入時間窗大小,因此,當一個時間點的數(shù)據(jù)被判定為缺失或無效時,每個輸入時間窗內(nèi)包含該時間點的樣本都會被判定 為無效而直接刪除,即完成數(shù)據(jù)清洗功能。
在步驟115,利用清洗無效數(shù)據(jù)樣本后的歷史性能數(shù)據(jù)、歷史告警數(shù)據(jù)和歷史投訴數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集對投訴預(yù)測模型進行訓(xùn)練并生成。
在步驟117,對生成的投訴預(yù)測模型進行保存。
在步驟119,保存步驟107中設(shè)置的預(yù)警時間長度,輸入時間窗大小和預(yù)測時間窗大小等參數(shù)。
圖2是示出了根據(jù)本發(fā)明的根據(jù)獲取的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù),在線地對數(shù)據(jù)匯聚進行更新的過程的流程圖。
如圖2所示,在步驟201中,從數(shù)據(jù)收集模塊獲取無線通信網(wǎng)絡(luò)的各網(wǎng)元的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù)。
在步驟203,將獲取的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù),按照數(shù)據(jù)匯聚網(wǎng)格來進行匯聚。
在步驟205,基于所設(shè)置的預(yù)警時間長度,輸入時間窗大小和預(yù)測時間窗大小等參數(shù),更新系統(tǒng)針對各數(shù)據(jù)匯聚網(wǎng)格的數(shù)據(jù)樣本。
最后,在步驟207,根據(jù)被更新的數(shù)據(jù)樣本來更新歷史數(shù)據(jù)庫。
圖3是根據(jù)本發(fā)明的在觸發(fā)投訴預(yù)測時利用投訴預(yù)測模型來生成投訴預(yù)測結(jié)果的過程的流程圖。
在步驟301,投訴預(yù)測被觸發(fā),在設(shè)定為周期性預(yù)測時,投訴預(yù)測可以被上一個預(yù)測周期結(jié)束觸發(fā);在設(shè)定為事件觸發(fā)式預(yù)測時,投訴預(yù)測可以被一類特定事件觸發(fā),例如新接收到一組投訴數(shù)據(jù)或性能數(shù)據(jù)等。
在步驟303,從圖6所示的實時數(shù)據(jù)更新表格中獲取在預(yù)測時間段內(nèi)的各數(shù)據(jù)匯聚網(wǎng)格的性能數(shù)據(jù)和告警數(shù)據(jù)的數(shù)據(jù)樣本集。
在步驟305,對性能數(shù)據(jù)和告警數(shù)據(jù)的數(shù)據(jù)樣本集,清洗無效數(shù)據(jù)樣本。無效數(shù)據(jù)樣本是表示實時樣本中某個或者某些特征取值無效或缺失的情況。例如在圖6中,若網(wǎng)格1的“性能種類p取值_1小時”數(shù)值為null,即此數(shù)值未能取到,則此數(shù)值無效,導(dǎo)致此樣本同樣無效,應(yīng)該被刪除。
在步驟307,將清洗后的性能數(shù)據(jù)和告警數(shù)據(jù)的數(shù)據(jù)樣本集輸入投訴預(yù)測模型,從而產(chǎn)生投訴預(yù)測結(jié)果。
在步驟309,將所產(chǎn)生的預(yù)測結(jié)果從輸出通信模塊進行輸出。
在步驟311,利用所得到的投訴預(yù)測結(jié)果對歷史數(shù)據(jù)庫進行更新。
在步驟313,將所得到的投訴預(yù)測結(jié)果輸入到統(tǒng)計模塊,可以得到投訴預(yù)測結(jié)果的統(tǒng)計數(shù)據(jù)。
圖4是示出了利用窮舉法將基站(網(wǎng)元)劃分到相應(yīng)的數(shù)據(jù)匯聚網(wǎng)格的過程的流程圖。
在步驟401,設(shè)置數(shù)據(jù)匯聚網(wǎng)格的大小k,即每個網(wǎng)格中包含k個位置上彼此最近的基站。
在步驟403中,從基站集{1,2,3…nbs}中選擇一個基站i。
在步驟405和步驟407中,初始化網(wǎng)格搜索的角度a和距離d。
在步驟409中,根據(jù)現(xiàn)有的角度a和距離d值,找到點(bs0+dcos(a),bs1+dsin(a)),其中bs0和bs1分別為基站i的緯度與經(jīng)度換算成的坐標值。然后以該點為基礎(chǔ),找到距離其最近的k個基站,并將它們形成的網(wǎng)格標記為n。然后進入步驟411。
在步驟411中,判斷該網(wǎng)格中是否包含基站i自身。如果包含,說明沿著此方向繼續(xù)增加搜索距離,仍有可 能獲得包含i在內(nèi)的其他網(wǎng)格,進入步驟413;如果不包含,則該方向上不會再產(chǎn)生包含i在內(nèi)的其他網(wǎng)格,進入步驟423。
在步驟413中,當網(wǎng)格中包含基站i自身的前提下,對網(wǎng)格n中的每個基站,查詢圖5中其所屬的網(wǎng)格的列表。若不包含n,則將n添加進去。
在步驟415中,在現(xiàn)有距離d參數(shù)基礎(chǔ)上增加dstep,重復(fù)步驟409。
在步驟423中,更新搜索的方向,在現(xiàn)有的角度a參數(shù)基礎(chǔ)上增加astep。
在步驟421中,判斷更新后的方向是否大于360度。如果是,表明方向搜索過程已結(jié)束,應(yīng)更換新的基站,對于其它點進行搜索,進入步驟419。否則,重復(fù)步驟409。
在步驟419中,選擇當前基站的下一個基站i+1,并進入步驟417。
在步驟417中,判斷是否所有基站都已經(jīng)遍歷完畢。如果是,則結(jié)束整個流程。如果不是,則重復(fù)步驟405。
圖5示出了用于將發(fā)生用戶投訴的位置處的基站與所屬的數(shù)據(jù)匯聚網(wǎng)格進行映射的示例表格。
如圖5所示,表格的左側(cè)的三欄分別示出了發(fā)生用戶投訴的位置處的基站id、基站名、基站物理位置(經(jīng)緯度)。圖5的表格的最右側(cè)的一欄示出了該基站所屬的數(shù)據(jù)匯聚網(wǎng)格的id。如圖5所示,同一基站可以屬于多個不同數(shù)據(jù)匯聚網(wǎng)格。例如,基站id為1的基站可以同時屬于數(shù)據(jù)匯聚網(wǎng)格1和數(shù)據(jù)匯聚網(wǎng)格3。
圖6是示出了按照數(shù)據(jù)匯聚網(wǎng)格,基于時間窗對告警數(shù)據(jù)、性能數(shù)據(jù)進行組合后的數(shù)據(jù)樣本集的示例。
當進行匯聚的數(shù)據(jù)為性能數(shù)據(jù)和告警數(shù)據(jù)時,例如,可以根據(jù)性能數(shù)據(jù)或告警數(shù)據(jù)中包含的字段“基站名稱”,將該性能數(shù)據(jù)或告警數(shù)據(jù)映射至具有該基站名稱的基站所對應(yīng)的數(shù)據(jù)匯聚網(wǎng)格,進一步,結(jié)合圖5所示的發(fā)生投訴的基站和數(shù)據(jù)匯聚網(wǎng)格的映射關(guān)系,可以生成圖6所示那樣的按照數(shù)據(jù)匯聚網(wǎng)格,基于時間窗對告警數(shù)據(jù)、性能數(shù)據(jù)和投訴數(shù)據(jù)進行組合后的數(shù)據(jù)樣本集。
在圖6的表格中,作為示例,告警數(shù)據(jù)為各個不同告警種類的告警消息的數(shù)量,性能數(shù)據(jù)為各個不同性能種類的性能取值,而投訴數(shù)據(jù)為時間窗內(nèi)的投訴數(shù)量。
在本發(fā)明中,作為示例,對數(shù)據(jù)匯聚網(wǎng)格中包含的k個基站的某一告警種類的所有告警消息的數(shù)量進行累加,來形成針對數(shù)據(jù)匯聚網(wǎng)格的該告警種類的告警消息數(shù)。對數(shù)據(jù)匯聚網(wǎng)格中包含的k個基站的某個性能種類的性能取值作平均(若k個基站的性能取值中存在部分缺失,即對于該性能種類,本應(yīng)該受到對應(yīng)于k歌基站的k個性能數(shù)值,但實際收到的數(shù)值數(shù)量少于k個,則不更新對應(yīng)字段),來形成針對該數(shù)據(jù)匯聚網(wǎng)格的該性能種類的性能取值。
對于投訴數(shù)據(jù),由于目前缺少可以將投訴立刻關(guān)聯(lián)至所投訴問題發(fā)生時用戶所屬基站的方法,因此可以根據(jù)投訴所發(fā)生的詳細地點描述,如“某某街某門牌號附近”等,通過gis系統(tǒng)(地理信息系統(tǒng))將該地點轉(zhuǎn)化為相應(yīng)基站的經(jīng)緯度,然后基于上述圖5所示的表格,映射到該基站所屬的數(shù)據(jù)匯聚網(wǎng)格。進一步,根據(jù)圖5所涉及的投訴相關(guān)數(shù)據(jù),可以形成如圖6所示的數(shù)據(jù)匯聚網(wǎng)格的投訴數(shù)量。
圖6中所述的“t小時”指的是(預(yù)測目標時間窗起始時點-預(yù)警時間長度-t)至(預(yù)測目標時間窗起始時點-預(yù)警時間長度-t+1)的時間窗范圍內(nèi),各類告警消 息的數(shù)量或各類性能取值。這里,預(yù)警時間長度為模型訓(xùn)練時選定的參數(shù)。歷史投訴數(shù)量是(預(yù)測目標時間窗起始時點-預(yù)警時間長度-w)到(預(yù)測目標時間窗起始時點-預(yù)警時間長度)的時間窗內(nèi)所統(tǒng)計的該數(shù)據(jù)匯聚網(wǎng)格發(fā)生的投訴總數(shù)。這里,w為輸入時間窗大小,同樣為模型訓(xùn)練時選定的參數(shù)。
在圖6的表格中,存在初始化后未賦值的字段,以null表示。例如在12:00時不可能獲得13:00采集的性能數(shù)據(jù),所以以null來表示。
圖7是示出了告警消息的格式的示意圖。
如圖7所示,告警消息包括:發(fā)生告警的基站名稱、告警發(fā)生時間和告警類型。現(xiàn)代網(wǎng)絡(luò)系統(tǒng)中各網(wǎng)元通常都具有日志記錄功能,將運行過程中出現(xiàn)的異常狀況及時間戳記錄下來,并發(fā)送至網(wǎng)絡(luò)管理系統(tǒng),即網(wǎng)管系統(tǒng)中常見的告警信息。常見告警類型例如基站cpri告警,基站閃斷告警等,均為網(wǎng)絡(luò)管理系統(tǒng)中規(guī)定的標準類型
圖8是示出了性能消息的格式的示意圖。
如圖8所示,性能消息包括:發(fā)出該性能消息的基站的基站名稱、性能統(tǒng)計時間、以及針對不同性能種類的取值。無線網(wǎng)絡(luò)中對于空口部分的運行狀況通過周期性日志的方式進行記錄,即每擱一段時間將周期內(nèi)采集到的無線網(wǎng)絡(luò)的各種運行的參數(shù)指標及采集時間記錄下來,發(fā)送至網(wǎng)絡(luò)管理系統(tǒng)。常見的2g網(wǎng)絡(luò)性能指標的種類包括,tch語音信道話務(wù)量,edge數(shù)據(jù)等效話務(wù)量,語音信道擁塞率等,均為網(wǎng)絡(luò)管理系統(tǒng)中規(guī)定的標準的指標類型。
圖9是示出了網(wǎng)絡(luò)控制中心所收到的用戶投訴消息的格式的示意圖。
如圖9所示,用戶投訴消息包括:用戶進行投訴的時間、用戶進行投訴的地點、以及用戶投訴的投訴種類。 常見的投訴種類例如手機有信號但無法使用,城市居民社區(qū)室內(nèi)網(wǎng)絡(luò)覆蓋等,均為投訴處理系統(tǒng)中規(guī)定的投訴類型。
圖10是示出了各數(shù)據(jù)匯聚網(wǎng)格在不同時間窗內(nèi)的投訴數(shù)的示例樣本圖。
如圖10所示,可以按照數(shù)據(jù)匯聚網(wǎng)格,統(tǒng)計出不同的時間窗內(nèi)的投訴總數(shù),并且以表格形式進行表示。
圖11是根據(jù)本發(fā)明的投訴預(yù)測系統(tǒng)的示意結(jié)構(gòu)圖。
如圖11所示,根據(jù)本發(fā)明的投訴預(yù)測系統(tǒng)10包括:輸出通信模塊1101、歷史數(shù)據(jù)庫1103、數(shù)據(jù)收集模塊1105、控制器1107、突發(fā)預(yù)測模塊1109、訓(xùn)練模塊1111、統(tǒng)計模塊1113、數(shù)據(jù)匯聚模塊1115、數(shù)據(jù)清洗模塊1117、以及數(shù)據(jù)導(dǎo)入模塊1119。
數(shù)據(jù)收集模塊1105收集無線通信網(wǎng)絡(luò)的各網(wǎng)元的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù)。
數(shù)據(jù)導(dǎo)入模塊1119將數(shù)據(jù)收集模塊1105所收集到的無線通信網(wǎng)絡(luò)的各網(wǎng)元的實時性能數(shù)據(jù)、實時告警數(shù)據(jù)和實時投訴數(shù)據(jù)導(dǎo)入到歷史數(shù)據(jù)庫1203。
數(shù)據(jù)匯聚模塊1115以該數(shù)據(jù)匯聚網(wǎng)格為單位,將數(shù)據(jù)匯聚網(wǎng)格內(nèi)的各網(wǎng)元的性能數(shù)據(jù)、告警數(shù)據(jù)和投訴數(shù)據(jù)匯聚在一起。
數(shù)據(jù)清洗模塊1117用于將歷史數(shù)據(jù)中或?qū)崟r數(shù)據(jù)組成的樣本中的無效樣本清除。
訓(xùn)練模塊1111利用將性能數(shù)據(jù)、告警數(shù)據(jù)和投訴數(shù)據(jù)匯聚在一起構(gòu)成的訓(xùn)練數(shù)據(jù)集對投訴預(yù)測模型進行訓(xùn)練。
突發(fā)預(yù)測模塊1109在投訴預(yù)測時利用投訴預(yù)測模型來獲得投訴預(yù)測結(jié)果。
統(tǒng)計模塊1113對投訴預(yù)測結(jié)果進行統(tǒng)計,生成投訴預(yù)測結(jié)果的統(tǒng)計值。
輸出通信模塊1101將投訴預(yù)測結(jié)果或者投訴預(yù)測結(jié)果的統(tǒng)計值輸出到外部。
控制器1107用于對系統(tǒng)的上述各模塊的操作進行控制。
以上列舉了若干具體實施例來詳細闡明本發(fā)明,這些個例僅用于說明本發(fā)明的原理及其實施方法,而非對本發(fā)明的限制,在不脫離本發(fā)明的精神和范圍的情況下,本領(lǐng)域的技術(shù)人員還可以做出各種變形和改進。因此,本發(fā)明不應(yīng)由上述實施例來限定,而應(yīng)由所附權(quán)利要求及其等價物來限定。