本發(fā)明要求享有于2014年5月15日提交的申請?zhí)枮?4/278,854、發(fā)明名稱為“檢測異常的系統(tǒng)與方法”的美國非臨時專利申請的優(yōu)先權,其全部內(nèi)容通過引用結(jié)合于此。
本發(fā)明涉及用于無線通信的系統(tǒng)與方法,并且尤其涉及一種檢測異常的系統(tǒng)與方法。
背景技術:
在無線接入網(wǎng)的網(wǎng)絡元件中,比如蜂窩系統(tǒng)的基站(或NodeBs或eNodeBs或小區(qū))或無線網(wǎng)絡控制器(RNCs),常常發(fā)生異常。異常示例包括小區(qū)中斷(例如,休眠小區(qū)),其可以由通常具有較差(低或高)值的關鍵性能指標(KPI)來表示。異常也可以以變量集合之間觀察到的異?;蚱茡p關系或相關性的形式發(fā)生。期望異常可以被迅速檢測到,同時減少錯誤警報。
異常是有根源的,比如故障用戶設備(UE)或網(wǎng)絡元件、干擾、流量較大導致的資源擁塞,具體地,瓶頸(bottleneck)可以是下行鏈路帶寬、上行鏈路接收總帶寬功率、下行鏈路帶寬(代碼或資源塊)、上行鏈路帶寬(資源塊)、回程帶寬、信道單元(CE)、控制信道資源等。需要確定異常的根源。
技術實現(xiàn)要素:
檢測異常的方法的實施例包括:接收數(shù)據(jù)點并根據(jù)所述數(shù)據(jù)點和中心值確定度量值。所述方法還包括:確定所述度量值是否低于下限閾值、在下限閾值和上限閾值之間或高于上限閾值;以及當所述度量值低于下限閾值時,確定所述數(shù)據(jù)點不為異常。此外,所述方法包括:當所述度量值高于上限閾值時,確定所述數(shù)據(jù)點為異常;以及當所述度量值在下限閾值和上限閾值之間時,確定所述數(shù)據(jù)點可能為異常。
根源分析方法的實施例包括遍歷軟決策樹,其中,所述軟決策樹包括多個決策節(jié)點和多個根源節(jié)點。所述遍歷軟決策樹包括:確定所述多個決策節(jié)點指示事件為異常的第一多個概率;以及根據(jù)所述第一多個概率確定所述多個根源的第二多個概率。
檢測異常的計算機的實施例包括:處理器;和計算機可讀存儲介質(zhì),其存儲由所述處理器執(zhí)行的編程。所述編程包括用以接收數(shù)據(jù)點并根據(jù)所述數(shù)據(jù)點和中心值確定度量值的指示。所述編程還包括用以執(zhí)行以下操作的指示:確定所述度量值是否小于下限閾值、在下限閾值和上限閾值之間或大于上限閾值;以及當所述度量值小于下限閾值時,確定所述數(shù)據(jù)點不為異常。此外,所述編程包括用以執(zhí)行以下操作的指示:當所述度量值大于上限閾值時,確定所述數(shù)據(jù)點為異常;以及當所述度量值在下限閾值和上限閾值之間時,確定所述數(shù)據(jù)點可能為異常。
檢測異常的系統(tǒng)的實施例包括:接收裝置,用于接收數(shù)據(jù)點;和確定裝置,用于:根據(jù)所述數(shù)據(jù)點和中心值確定度量值;確定所述度量值是否低于下限閾值、在下限閾值和上限閾值之間或高于上限閾值;當所述度量值低于下限閾值時,確定所述數(shù)據(jù)點不為異常;當所述度量值高于上限閾值時,確定所述數(shù)據(jù)點為異常;以及當所述度量值在下限閾值和上限閾值之間時,確定所述數(shù)據(jù)點可能為異常。
為了可以更好地理解以下本發(fā)明的詳細描述,前述內(nèi)容已相當廣泛地概述了本發(fā)明實施例的特征。以下將對本發(fā)明實施例的附加特征和優(yōu)點進行描述,其形成本發(fā)明權利要求的主題。本領域技術人員應理解,可以輕而易舉地將所公開的概念和具體實施例用作修改或設計其它結(jié)構(gòu)或過程以便執(zhí)行本發(fā)明相同目的的基礎。本領域技術人員還應理解,這種等效構(gòu)造并不脫離如所附權利要求中闡述的本發(fā)明的精神和范圍。
附圖說明
為了更全面的理解本發(fā)明及其優(yōu)點,現(xiàn)結(jié)合說明書附圖參見以下描述,其中:
圖1示出了用于傳送數(shù)據(jù)的無線網(wǎng)絡的實施例;
圖2示出了檢測異常的方法一實施例的流程圖;
圖3A-B示出了示例性概率密度函數(shù);
圖4示出了具有示例性數(shù)據(jù)點的概率密度函數(shù);
圖5示出了檢測異常的方法的另一實施例的流程圖;
圖6A-B示出了示例性概率密度函數(shù);
圖7示出了示例性數(shù)據(jù);
圖8示出了具有內(nèi)帶、中間帶和外帶的示例性直方圖;
圖9示出了內(nèi)帶、中間帶和外帶的實施例;
圖10示出了隨時間變化的示例性數(shù)據(jù)樣本的圖表;
圖11示出了檢測異常的方法的又一實施例的流程圖;
圖12示出了硬決策樹的示例;
圖13示出了軟決策樹的示例;
圖14示出了示例性概率函數(shù);
圖15示出了根源分析方法的一實施例的流程圖;以及
圖16示出了通用計算機系統(tǒng)的一實施例的框圖。
除非另有說明,不同附圖中的相應數(shù)字和符號通常指代相應的部件。對附圖進行繪制以清楚說明各實施例的相關方面,并且不一定按比例進行繪制。
具體實施方式
從一開始就應當理解,盡管下文中提供了一個或多個實施例的示意性實現(xiàn)方式,但是所公開的系統(tǒng)和/或方法可以采用許多技術來實現(xiàn),這些技術可以為目前已知或存在的技術。本發(fā)明并不應限于以下示出的示意性實現(xiàn)方式、附圖以及技術,包括本文中示意并描述的示例設計和實現(xiàn)方式,而是可以在所附權利要求的范圍及其等同物的全部范圍內(nèi)進行修改。
一方法實施例檢測異常及異常的根源。異常的根源的示例包括故障用戶設備(UE)或網(wǎng)絡元件、干擾、較大流量導致的資源擁塞。具體地,瓶頸可以是下行鏈路功率、接收到的上行鏈路總寬帶功率、下行鏈路帶寬(代碼或資源塊)、上行鏈路帶寬(資源塊)、回程帶寬、信道單元(CE)、控制信道資源等。需要檢測并確定異常的根源。
一些檢測異常的方法選擇變量或距離度量的閾值,從而產(chǎn)生基于訓練數(shù)據(jù)結(jié)構(gòu)的決策邊界,以便確定離群值代表異常。然而,閾值的選擇通常以誤報警為交換,使得異常和檢測時間遭到遺漏。一方法實施例采用兩個閾值水平來檢測異常。當數(shù)據(jù)點低于下限閾值時,則確定沒有指示異常。當數(shù)據(jù)點高于較高閾值時,則確定指示異常。當數(shù)據(jù)點在閾值之間時,采用歷史數(shù)據(jù)來確定數(shù)據(jù)點是否指示異常。
在一方法實施例中確定檢測到的異常的根源。可以使用硬決策樹。所述決策樹可以由專家創(chuàng)建或從數(shù)據(jù)得知。然而,硬決策樹可能導致根源診斷不明或誤診。通過經(jīng)由邏輯函數(shù)將度量映射成概率,一方法實施例對異常的一個或多個可能的根源采用軟決策樹。然后,將概率相乘,造成獨立屬性的樸素貝葉斯假設(naive Bayes assumption)。因此,確定出最可能的根源或前幾個可能的根源以及每個原因的概率或置信度量。
圖1示出了用于無線通信的無線網(wǎng)絡100。網(wǎng)絡100包括無線網(wǎng)絡控制器(RNCs)108,其彼此通信。RNCs 108與通信控制器102耦合。多個用戶設備(UEs)104與通信控制器102耦合。通信控制器102可以是任何能夠通過,特別是,與UEs 104建立上行鏈路和/或下行鏈路連接來提供無線接入的的組件,比如基站、增強型基站(eNBs)、接入點、微微蜂窩基站(picocells)、毫微微蜂窩基站(femtocells)以及其它無線功能設備。UEs 104可以是任何能夠與通信控制器102建立無線連接的組件,比如移動電話、智能電話、平板電腦、傳感器等。在一些實施例中,網(wǎng)絡100可以包括各種其它無線設備,比如繼電器、毫微微蜂窩基站等。實施例可以在諸如網(wǎng)絡100等網(wǎng)絡上檢測異常。此外,網(wǎng)絡可以確定檢測到的異常的根源。
圖2示出了檢測異常的方法的流程圖110。訓練數(shù)據(jù)存儲在塊112中。所述訓練數(shù)據(jù)為歷史數(shù)據(jù)。在塊114中,對各個特點進行建模。例如,檢測每個特征的關鍵性能指標(KPI)。
概率密度函數(shù)可用來確定數(shù)據(jù)點是否有可能為異常。靠近中心的數(shù)據(jù)點有可能不指示異常,而在尾部的數(shù)據(jù)點有可能指示異常。中心可以是均值、中位數(shù)或指示預期值中心的另一個值。圖3A-B分別示出了概率密度函數(shù)120和130。概率密度函數(shù)120具有窄峰和低方差,而概率密度函數(shù)130具有更寬的峰和較大的方差。概率密度函數(shù)的均值由下式給出:
方差由下式給出:
在塊116中,檢測算法采用建模數(shù)據(jù)基于新觀察118檢測異常。圖4示出了概率密度函數(shù)142,其中數(shù)據(jù)點144在概率密度函數(shù)142的正常范圍內(nèi),而數(shù)據(jù)點146在概率密度函數(shù)142的尾部,其可能為異常。確定新觀察不為異常的概率由下式給出:
異常驗證數(shù)據(jù)點確定數(shù)據(jù)是正常的概率。如果下式成立,則預計新的輸入xi為異常:
P(xi)<ε,
其中ε為,例如,從歷史數(shù)據(jù)中獲得的閾值。
圖5示出了用于檢測具有多個變量的異常的方法的流程圖160。采用塊162中的訓練數(shù)據(jù)在塊164中同時建模多個KPI行為。圖6A-B示出了二維概率密度函數(shù)的圖表170和180。變量x1和x2為獨立變量。獲得KPIs之間的關系。均值由下式給出:
另外,方差由下式給出:
塊166中的檢測算法采用建模數(shù)據(jù)檢測來自塊168中新觀察的異常。圖7示出了現(xiàn)有數(shù)據(jù)點192和新數(shù)據(jù)點xA、xB、xC和xD的圖表。這些新數(shù)據(jù)點位于訓練數(shù)據(jù)的外圍,并有可能為異常,尤其是x1。在該示例中,一個變量是中央處理器(CPU)負載,而另一個變量是內(nèi)存使用量。計算馬氏距離和概率。確定新觀察不為異常的概率由下式給出:
使用了協(xié)方差矩陣和角度形狀。異常驗證數(shù)據(jù)集用于確定閾值ε。當下式條件成立時,預計新輸入xi為異常:
p(xi)<ε。
一實施例使用概率密度函數(shù)的內(nèi)帶、中間帶和外帶來檢測異常。圖8示出了一維概率密度的圖表200,其中概率密度直方圖202具有內(nèi)帶206、中間帶208和外帶210。曲線204示出了可以用于檢測異常的單個閾值的示例。確定高于所述閾值的頻率所對應的數(shù)據(jù)點不為異常,確定低于所述閾值的值為異常。確定內(nèi)帶中的數(shù)據(jù)點不為異常,而確定外帶中的數(shù)據(jù)點為異常。確定中間帶中的數(shù)據(jù)點可以是或可以不為異常。內(nèi)帶和中間帶之間存在下限閾值,中間帶和外帶之間存在上限閾值。
圖9示出了針對二元二維度量空間高斯示例的具有內(nèi)帶226、中間帶或環(huán)狀帶224和外帶222的圖表220??梢圆捎萌S或n維示例。因為在一維情況下,內(nèi)帶和中間帶之間存在下限閾值,中間帶和外帶之間存在上限閾值。內(nèi)閾值和外閾值為等距離橢圓輪廓構(gòu)成的點。馬氏距離(Mahalanobis distance)可以用作多維情況下的度量。當數(shù)據(jù)被構(gòu)造為混合高斯聚類時,可以使用現(xiàn)有的加權平均馬氏距離。獲得每個聚類模式的參數(shù)。
從歷史或訓練數(shù)據(jù)中導出KPI集的下限閾值和上限閾值。高度波動的KPIs,例如,諸如分組交換(PS)吞吐量等高方差或重尾KPIs在下限閾值和上限閾值之間具有更寬的距離。對于更穩(wěn)定的KPIs,下限閾值和上限閾值更接近,比如安全模式命令故障。在一示例中,用戶選擇靈敏度。當用戶增加靈敏度時,在損害更多錯誤判斷的情況下會檢測到更多的異常。隨著靈敏度變高,環(huán)狀區(qū)域縮小。用戶也可以選擇不可侵犯的KPI期望。不考慮從正常偏差的程度,當KPI超過這個絕對閾值時,發(fā)出警報。因此,用戶選擇上限閾值。
當度量值,比如度量向量的馬氏距離越過上限閾值至外帶時,發(fā)出警報。當度量值經(jīng)過下限閾值內(nèi)至內(nèi)帶時,不發(fā)出警報,并且如果警報之前處于打開狀態(tài)則進行關閉。另外,復位延遲窗口定時器。當所觀察到的度量值進入下限閾值和上限閾值之間的中間帶或環(huán)狀區(qū)域時,設置延遲窗口定時器。如果所觀察到的度量值在延遲窗口計時器到期時仍然位于中間帶,發(fā)出警報。在一示例中,延遲窗口為固定值??蛇x地,延遲窗口取決于所觀察到的度量值的趨勢。如果該值繼續(xù)惡化,則較早發(fā)出警報。
圖10示出了隨時間變化的度量值232的圖表230。最初,度量值232在內(nèi)帶中,并且異常概率很低。度量值232進入環(huán)狀區(qū)域,設置延遲窗口定時器234。度量值沒有達到上限閾值。但是,因為度量值在延遲窗口計時器到期時仍處于環(huán)狀帶中,不發(fā)出警報。如果度量值在延遲窗口定時器到期之前返回到內(nèi)帶,不發(fā)出警報,并且復位延遲窗口定時器。如果度量值從內(nèi)帶再次進入環(huán)狀帶,重新設置延遲窗口計時器。對于兩個或多個變量來說操作類似。
為了減少誤報警和異常檢測遺漏,可以在下限閾值和上限閾值之間采用產(chǎn)生更大中間帶的更廣范圍。觀察更有可能留在這些邊界之間,作為安全防護??梢曰谘舆t窗口上的一致性和趨勢觸發(fā)警報。這需要更多的時間,但產(chǎn)生較少的誤報警。警報可以,例如,在小區(qū)級比RNC級更明顯。在RNC級,小區(qū)集群更穩(wěn)定。
圖11示出了檢測異常的方法的流程圖240。首先,在步驟242中,確定上限閾值和下限閾值?;跉v史或訓練數(shù)據(jù)完成此。正常區(qū)域內(nèi)的值低于下限閾值,正常區(qū)域之外的值在上限閾值之外,中間值在下限閾值和上限閾值之間。在一示例中,用戶難以設置上限閾值。設置下限閾值和上限閾值之間的范圍以用檢測時間折衷靈敏度和誤報警比率。以犧牲檢測時間為代價,下限閾值和上限閾值之間較大的距離增加了靈敏度并降低了誤報警比率。也可以在步驟242中設置延遲窗口的尺寸。在一示例中,在接收數(shù)據(jù)之前,首先對這些值進行設置。在另一示例中,這些值基于性能周期性進行更新。
接下來,在步驟244中,接收數(shù)據(jù)點。所述數(shù)據(jù)點可以是蜂窩系統(tǒng)或另一系統(tǒng)中的值。
然后,在步驟246中,系統(tǒng)判斷數(shù)據(jù)點是否在內(nèi)帶、中間帶或外帶中。當數(shù)據(jù)點處于外帶時,系統(tǒng)執(zhí)行步驟246并且發(fā)出警報。警報可能觸發(fā)根源分析。系統(tǒng)也可以返回到步驟244以接收下一數(shù)據(jù)點。
當數(shù)據(jù)點處于內(nèi)帶時,則系統(tǒng)執(zhí)行步驟250。不發(fā)出警報,并且如果先前發(fā)出過警報,則進行復位。此外,如果先前設置了延遲窗口計時器,則進行復位。系統(tǒng)此時執(zhí)行步驟244以接收下一數(shù)據(jù)點。
當數(shù)據(jù)點處于中間帶時,系統(tǒng)執(zhí)行步驟254。在步驟254中,系統(tǒng)判斷是否先前已設置了延遲窗口計時器。當先前沒有設置延遲窗口計時器時,系統(tǒng)恰巧進入中間帶,并執(zhí)行步驟256。
在步驟256中,系統(tǒng)設置延遲窗口定時器。然后,其執(zhí)行步驟244以接收下一數(shù)據(jù)點。
當先前已設置了延遲窗口計時器時,則系統(tǒng)執(zhí)行步驟258,其中系統(tǒng)確定延遲窗口計時器是否已到期。當延遲窗口計時器尚未到期時,系統(tǒng)執(zhí)行步驟244以接收下一數(shù)據(jù)點。當延遲窗口定時器已經(jīng)到期,系統(tǒng)執(zhí)行步驟246以發(fā)出警報。系統(tǒng)在決定設置警報時也可以考慮其它因素,如趨勢。當數(shù)據(jù)點趨向于更接近上限閾值時,可以更早發(fā)出警報。
在檢測到異常后,需要確定異常的根源。圖12示出了用于確定異常的根源的決策樹290。根源的一些示例在于,UE處于覆蓋盲區(qū)中,UE存在大面積阻塞覆蓋,或者UE操作系統(tǒng)或蜂窩網(wǎng)絡中存在軟件錯誤。決策樹從工程經(jīng)驗中產(chǎn)生或從標記的歷史數(shù)據(jù)中挖掘出,并在檢測到新的異常原因時可能進行修改。決策樹290為硬決策樹,其中在每個節(jié)點上選擇路徑。此外,決策樹290為層級式,由特殊的度量集和/或網(wǎng)絡節(jié)點向下深入到較低層級。決策樹290有三個決策層:第一RNC級400,根級;第二RNC級402;和小區(qū)級404。原因級406包含葉子。事件Eij的樹節(jié)點通過對習得的非線性函數(shù),如馬氏距離,進行計算作用于一組測試度量值Sij。樹節(jié)點將函數(shù)的輸出與閾值進行比較來確定肯定或否定硬決策。
首先,在節(jié)點292中,系統(tǒng)判斷是否發(fā)生異常事件E1。確定通用度量值集合S1,并與閾值進行比較。例如,當度量值大于閾值時,發(fā)生異常事件E1,并且系統(tǒng)進行到節(jié)點296,而當度量值小于或等于閾值τ1時,不發(fā)生異常事件E1,并且系統(tǒng)進行到節(jié)點294。
在節(jié)點296中,系統(tǒng)判斷是否發(fā)生異常事件E22。確定特定度量值S22。然后,將特定度量值S22與閾值τ22進行比較。當度量值小于閾值時,不發(fā)生異常事件E22,并且系統(tǒng)進行到節(jié)點302,其中系統(tǒng)確定異常為未知問題。這種情況可能發(fā)生在,例如,這種異常第一次發(fā)生時。當度量值大于閾值時,發(fā)生異常事件E22,并且系統(tǒng)進行到節(jié)點304。
在節(jié)點304中,系統(tǒng)判斷是否發(fā)生異常事件E33。確定度量值S33,并與閾值τ33進行比較。當度量值小于閾值時,未發(fā)生異常事件E33,系統(tǒng)在節(jié)點314中查找其它異常事件以確定根源。另一方面,當度量值大于閾值時,則確定已經(jīng)發(fā)生異常事件E33。此時,在節(jié)點316中,確定根源為RNC和小區(qū)問題類型Z。
在節(jié)點294中,系統(tǒng)判斷是否發(fā)生異常事件E21。確定度量值S21,并與閾值τ21進行比較。當度量值S21小于閾值時,則確定不發(fā)生異常事件E21,并且系統(tǒng)進行到節(jié)點298。另一方面,當度量值S21大于或等于閾值時,系統(tǒng)進行到節(jié)點300,確定的確發(fā)生了異常事件E21。
在節(jié)點298中,系統(tǒng)判斷是否發(fā)生異常事件E31。確定度量值S31,并與閾值τ31進行比較。當度量值S31小于閾值時,則確定不發(fā)生異常事件E31,并且異常在節(jié)點306中不是X型問題。當度量值S31大于或等于閾值時,則在節(jié)點308中確定問題是純小區(qū)X型問題。
在節(jié)點300中,系統(tǒng)判斷是否發(fā)生異常事件E32。確定度量值S32,并與閾值τ32進行比較。當度量值S32小于閾值時,則確定不發(fā)生異常事件E32,并且在節(jié)點310中,確定為根源查找其它異常事件。當度量值S32大于或等于閾值時,則在節(jié)點312中確定問題是RNC和小區(qū)Y型問題。
決策樹290為二進制樹,但也可以采用非二進制樹。例如,可以對兩個具有四個互斥葉子的事件A和B進行聯(lián)合分析:A和B、A和非B、非A和B、非A和非B。如果A和B由不同組件引起,則各個概率相乘。同樣地,三個潛在事件可能存在八個葉子,等等。
圖13示出了軟決策樹320,其用于確定異常的原因。使用軟決策樹,可以確定特定問題引起異常的概率??梢源_定一個或多個可能的根源。給定節(jié)點為肯定的概率,即Pij,是針對異常事件Eij輸出概率的習得函數(shù)值閾值差上運作的邏輯函數(shù)。概率由均值距離進行確定。概率由下式給出:
其中,f(xij)為習得函數(shù),例如馬氏距離,其自變量x為測試向量,并且τii為閾值。圖14示出了圖表360,示例性邏輯函數(shù)。否定的概率為1-Pij。這是由于事件及其組件在樹的節(jié)點上的相互排斥性,這意味著葉子或根源集合是互斥的。
假設節(jié)點ij和kl分別對應于事件Eij和Ekl,如果決策樹上存在邊緣加權值,則節(jié)點之間的邊緣加權值由(ij,kl)表示。通過變換將概率轉(zhuǎn)換為距離,使得當(ij,kl)存在于肯定分支上時,邊緣加權值由下式給出:
Dij,kl=ln(Pij)
當(ij,kl)存在于否定分支上時,通過下式給出:
Dij,kl=ln(1-Pij)
否則邊緣加權值∞??隙ㄟ吘壍腜ij增加并且否定邊緣的(1-Pij)增加時,Dij,kl減小。為了最終能在節(jié)點中找到根源,從根級到葉子對Dij,kl沿路徑進行相加。從根節(jié)點到葉節(jié)點中其中一個的最短距離路徑最有可能是根源。可以考慮幾個可能的根源及其可能性。例如,可以考慮距離低于閾值的所有根源。可選地,考慮最小邊緣距離中的兩個、三個或更多個。最有可能的路徑或事件集合為從根級到葉子的最小路徑(arg min)的自變量,即:
Σ(ij,kl)∈pathDij,kl。
在樸素貝葉斯假設中,沿候選路徑邊緣的相加距離導致沿路徑的獨立事件Eij的概率相乘。
軟決策樹320具有:根級,第一RNC級346;兩個中間級,第二RNC級348和小區(qū)級350;以及根源級,葉子352。首先,在節(jié)點322中,系統(tǒng)確定異常事件E11發(fā)生的概率P11。該概率由下式給出:
其中,f(x11)為用于測量異常事件E11的習得函數(shù),τ11為事件E11的閾值。不發(fā)生異常事件E11的概率由(1-P11)給出。
然后,確定第二RNC級348的概率。在節(jié)點324中確定發(fā)生異常事件E21的概率P21。該概率由下式給出:
其中,f(x21)為用于測量異常事件E21的習得函數(shù),τ21為事件E21的閾值。不發(fā)生異常事件E21的概率由(1-P21)給出。同樣地,在節(jié)點326中,發(fā)生異常事件E22的概率P22由下式進行確定:
其中,f(x22)為用于測量異常事件E22的習得函數(shù),τ22為事件E22的閾值。不發(fā)生異常事件E22的概率由(1-P22)給出。
同樣地,確定小區(qū)級異常的概率。在節(jié)點328中確定發(fā)生異常事件E31的概率P31。該概率由下式給出:
其中,f(x31)為用于測量異常事件E31的習得函數(shù),τ31為事件E31的閾值。不發(fā)生異常事件E31的概率由(1-P31)給出。此外,在節(jié)點330中,發(fā)生異常事件E32的概率P32由下式進行確定:
其中,f(x32)為用于測量異常事件E32的習得函數(shù),τ32為事件E32的閾值。不發(fā)生異常事件E32的概率由(1-P32)給出。另外,在節(jié)點334中,發(fā)生異常事件E33的概率P33由下式進行確定:
其中,f(x33)為用于測量異常事件E33的習得函數(shù),τ33為事件E33的閾值。不發(fā)生異常事件E33的概率由(1-P33)給出。
當計算出概率時,確定葉子的邊緣加權距離。例如,節(jié)點336的邊緣加權距離,即,不是X型問題,由下式給出:
-ln(1-P11)-ln(1-P21)-ln(1-P31)。
另外,節(jié)點338的邊緣加權距離,即,純小區(qū)X型問題,由下式給出:
-ln(1-P11)-ln(1-P21)-ln(P31)。
同樣,節(jié)點340的邊緣加權距離,即,為根源查找其它異常事件,由下式給出:
-ln(1-P11)-ln(P21)-ln(1-P32)。
另外,節(jié)點342的邊緣加權距離,即,RNC和小區(qū)Y型問題,由下式給出:
-ln(1-P11)-ln(P21)-ln(P32)。
節(jié)點332的邊緣加權距離,即,未知問題,由下式給出:
-ln(P11)-ln(1-P22)。
此外,節(jié)點344的邊緣加權距離,即,為根源查找其它異常事件,由下式給出:
-ln(P11)-ln(P22)-ln(1-P33)。
節(jié)點344的邊緣加權距離,即,RNC和小區(qū)Z型問題,由下式給出:
-ln(P11)-ln(P22)-ln(P33)
當采用條件概率時,沿路徑的相關事件可以通過加強相關事件并抑制反相關事件來說明路徑發(fā)現(xiàn)。這無異于聯(lián)合分析。當邊緣增強,并且概率接近于1時,其互補邊緣減弱,概率接近于零。路徑邊緣概率相乘導致邊緣較弱的路徑迅速消失。仍然有可能存在雜散的路徑結(jié)果,其中具有噪聲信號。為了防止這種情況,可以提前刪除對檢測異常無用的葉子??梢员A羯贁?shù)最短路徑或者所有足夠短的路徑以便進行報告和分析。樹上的不明確原型中有可能存在幾個根源。
圖15示出了異常根源的確定方法的流程圖370。首先,在步驟372中,創(chuàng)建軟決策樹。在一示例中,基于工程經(jīng)驗和先前的異常創(chuàng)建軟決策。觀察到異常的新根源時,可以對軟決策樹進行修改。這可以自動完成或基于用戶輸入完成。
接著,在步驟374中,檢測異常。例如,可以使用下限閾值和上限閾值來檢測異常。當度量值高于上限閾值時,檢測到異常。此外,當度量值在下限閾值和上限閾值之間保持延遲時間長度時,檢測到異常。
然后,在步驟376中,確定異常發(fā)生的概率。首先,確定根級異常發(fā)生的概率。異常Eij發(fā)生的概率由下式給出:
接下來,在步驟378中,系統(tǒng)執(zhí)行下一級。檢查下一級上的節(jié)點。
在步驟380中,系統(tǒng)判斷第一節(jié)點是否為葉子。當?shù)谝还?jié)點不是葉子時,系統(tǒng)執(zhí)行步驟382,當?shù)谝还?jié)點不是葉子時,系統(tǒng)執(zhí)行步驟386。此外,當?shù)谝还?jié)點不是葉子時,系統(tǒng)執(zhí)行步驟376以確定第一節(jié)點的概率。
在步驟386中,系統(tǒng)判斷第二節(jié)點是否是葉子。當?shù)诙?jié)點是葉子時,系統(tǒng)執(zhí)行步驟376以確定第二節(jié)點的概率。當?shù)诙?jié)點是葉子時,在步驟384中確定根源的邊緣距離。
在步驟382中,系統(tǒng)判斷第二節(jié)點是否是葉子。當?shù)诙?jié)點不是葉子時,系統(tǒng)執(zhí)行步驟376以確定第二節(jié)點的概率。當?shù)诙种侨~子時,系統(tǒng)在步驟384中確定葉的邊緣距離。在步驟384中計算根源的邊緣距離。表示根源的節(jié)點的邊緣距離通過對沿該條路徑的概率對數(shù)進行求和來給出。計算所有路徑的邊緣距離??梢赃x擇具有最短邊緣距離的根源或多個根源用于進一步檢查。
圖16示出了可用于實現(xiàn)本文中所公開的設備與方法的處理系統(tǒng)270的框圖。具體設備可以利用所有示出的組件或僅僅這些組件的子集,設備到設備間的集成度可以有所不同。此外,設備可包括組件的多個實例,例如,多個處理單元、處理器、存儲器、發(fā)送器、接收器等。處理系統(tǒng)可以包括配備有一個或多個諸如麥克風、鼠標、觸摸屏、小鍵盤、鍵盤等輸入設備的處理單元。此外,處理系統(tǒng)270可配備有一個或多個輸出設備,比如揚聲器、打印機、顯示器等。處理單元可以包括中央處理器(CPU)274、存儲器276、大容量存儲設備278、視頻適配器280以及與總線連接的I/O接口288。
總線可以是任何類型的多個總線結(jié)構(gòu)中的一個或多個,包括存儲器總線或存儲器控制器、外圍總線、視頻總線等。CPU 274可以包括任何類型的電子數(shù)據(jù)處理器。存儲器276可以包括任何類型的系統(tǒng)存儲器,比如靜態(tài)隨機存取存儲器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、同步DRAM(SDRAM)、只讀存儲器(ROM)及其組合,等等。在一實施例中,存儲器可以包括啟動時使用的ROM以及執(zhí)行程序時所使用的存儲程序和數(shù)據(jù)的DRAM。
大容量存儲設備278可以包括用于存儲數(shù)據(jù)、程序以及其它信息并用于使數(shù)據(jù)、程序以及其它信息通過總線能夠訪問的任何類型的存儲設備。大容量存儲設備278可以包括,例如,一個或多個固態(tài)驅(qū)動器、硬盤驅(qū)動器、磁盤驅(qū)動器、光盤驅(qū)動器等。
視頻適配器280和I/O接口288提供用以將外部輸入和輸出設備與處理單元耦合的接口。如圖所示,輸入和輸出設備的示例包括與視頻適配器耦合的顯示器以及與I/O接口耦合的鼠標/鍵盤/打印機??梢詫⑵渌O備與處理單元耦合,并且可以使用更多或更少的接口卡。例如,可以使用串行接口卡(未示出)來為打印機提供串行接口。
處理單元還包括一個或多個網(wǎng)絡接口284,其可以包括諸如以太網(wǎng)電纜等有線鏈路和/或用以訪問節(jié)點或不同網(wǎng)絡的無線鏈路。網(wǎng)絡接口284允許處理單元通過網(wǎng)絡與遠程單元進行通信。例如,網(wǎng)絡接口可以通過一個或多個發(fā)送器/發(fā)射天線和一個或多個接收器/接收天線提供無線通信。在實施例中,處理單元與局域網(wǎng)或廣域網(wǎng)耦合以便處理數(shù)據(jù)并與諸如其它處理單元、互聯(lián)網(wǎng)、遠程存儲設備等遠程設備通信。
雖然本發(fā)明中已提供了幾個實施例,但是應當理解,所公開的系統(tǒng)和方法在不脫離本發(fā)明精神或范圍的前提下可以以許多其它特定形式進行體現(xiàn)。本發(fā)明實施例應被認為是說明性而不是限制性的,其意圖并不限于本文中所給出的細節(jié)。例如,可以將各元件或組件組合或集成在另一系統(tǒng)中,或者可以忽略或不實施某些特定特征。
此外,在不脫離本發(fā)明范圍的前提下,可以將各實施例中描述并示意為分離或單獨的技術、系統(tǒng)、子系統(tǒng)和方法與其它系統(tǒng)、模塊、技術或方法進行組合或結(jié)合。所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、設備或中間組件的間接耦合或通信連接,可以是電性、機械或其它的形式。在不脫離本文中所公開的精神和范圍的前提下,本領域技術人員可以確定并對其它實施例進行改變、替換和修改。