專利名稱:使基于主動探測的ip網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對其調(diào)節(jié)的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及IP網(wǎng)絡(luò)的領(lǐng)域,更具體來說涉及用于使基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對其調(diào)節(jié)的方法和設(shè)備。
背景技術(shù):
在基于分組的網(wǎng)絡(luò)中,通常期望測試網(wǎng)絡(luò)上兩個特定節(jié)點之間的通信。這一般可以從兩個節(jié)點的前一個請求另一個節(jié)點執(zhí)行“環(huán)回”從第一節(jié)點發(fā)送的測試分組的功能來實施。在從另一個節(jié)點回收到測試分組時,第一節(jié)點由此可以探知不僅與另一個節(jié)點通信是可能的,而且還探知分組在它們之間的往返時間。
如美國專利號5,477,531中所公開的,還可探知傳輸路徑的更復(fù)雜的特征。在該專利中,從一個節(jié)點向另一個節(jié)點傳送預(yù)定序列的測試分組,并觀察整體上網(wǎng)絡(luò)對該序列的影響。例如,通過改變要傳輸?shù)姆纸M序列中的分組大小,可以推算諸如帶寬、傳播延遲、排隊延遲和網(wǎng)絡(luò)內(nèi)部最大分組大小。此外,還可以確定網(wǎng)絡(luò)的緩沖和重新定序特征。
相似地,美國專利申請?zhí)?0020080726提供一種方法,用于通過選擇性地通過通信網(wǎng)絡(luò)發(fā)送多個網(wǎng)絡(luò)評估信號或探測性測試分組來評估該通信網(wǎng)絡(luò)。基于對這些探測性測試分組的網(wǎng)絡(luò)響應(yīng),確定網(wǎng)絡(luò)評估參數(shù)。例如,確定響應(yīng)時間和吞吐量特征,包括網(wǎng)絡(luò)的流傳輸利用。
此外,還存在使測試分組能夠以精確的方式被放置到網(wǎng)絡(luò)上的系統(tǒng),例如美國專利申請?zhí)?0030117959中公開的。在該專利申請中,描述一種測試分組序列發(fā)生器(sequencer),其中該序列發(fā)生器可以將測試分組發(fā)送到計算機網(wǎng)絡(luò)上,其中在操作系統(tǒng)下運行軟件的計算機使分組發(fā)送得以實施。軟件使用I/O完成端口來發(fā)送分組和分組突發(fā),可以發(fā)送它們以便遍歷網(wǎng)絡(luò)中可端接于測試分組序列發(fā)生器的路徑。在該方案中,測試分組序列發(fā)生器還可以接收返回分組和分組突發(fā)并對它們設(shè)置時間戳。
為了診斷網(wǎng)絡(luò)問題,美國專利申請?zhí)?0030103461提供一種系統(tǒng),用于根據(jù)構(gòu)成測試簽名的收集的測試數(shù)據(jù)來定義簽名,然后將該測試簽名與對應(yīng)于多種網(wǎng)絡(luò)狀況的現(xiàn)有預(yù)定簽名比較。該系統(tǒng)由此可以識別與測試簽名匹配的一個或多個預(yù)定簽名,并可以識別測試簽名與之最匹配的預(yù)定簽名,從而提供一種方式來建立如測試簽名所表示而存在的一個或多個網(wǎng)絡(luò)狀況。
上文所描述的系統(tǒng)依賴于在密度上可調(diào)節(jié)(scale)的一般采樣,并通常要求多個不同樣本的相關(guān)。這些系統(tǒng)允許在網(wǎng)絡(luò)路徑上采樣并診斷網(wǎng)絡(luò)問題,但是一般來說一旦執(zhí)行診斷,就需要人員干預(yù)來校正問題或者如果必要的話,施加其他類型測試來更精確地識別問題。因此此形式的過程是反應(yīng)型過程,因為在外部干預(yù)之前不會啟用任何后續(xù)過程。因此,一旦識別出問題,需要高度熟練的人員來處理故障并解決問題,這可能成本昂貴且耗時。
M.Brodie、I.Rish和S.Ma的“智能探測具有成本效率的計算機網(wǎng)絡(luò)中的故障診斷方法”(Intelligent probingA cost-effectiveapproach to fault diagnosis in computer networks)和類似的M.Brodie、I.Rish、S.Ma、G.Grabarnik和N.Odintsova、I.B.M.T.J.Watson Research的“主動探測”(Active Probing),它們定義了一種形式的事件相關(guān),其中使用動態(tài)貝葉斯網(wǎng)絡(luò)方法和用于根據(jù)多個噪聲布爾輸入或“探測信號”魯棒地確定哪些事件指示故障的方法。該方法定義一個最優(yōu)途徑,使得使用最小數(shù)量的探測信號來限制網(wǎng)絡(luò)上的負載并支持可調(diào)節(jié)性。該方法假定布爾/二進制采樣,如當檢查連接性(這對于多種類型的設(shè)備是常見)和采樣時。該方法中還定義主動探測采樣和分析的層次結(jié)構(gòu)的概念,此概念依賴于一定范圍的熟知服務(wù)端口上諸如ICMP回聲和ping響應(yīng)的機制,例如SMTP、HTTP、FTP、DNS和LDAP。此外,該方法建議一種問題確定的過程,它是在諸如探測信號和響應(yīng)相關(guān)的相關(guān)性矩陣的基礎(chǔ)上發(fā)展的,其目的在于嘗試將過程優(yōu)化到最小集合的探測信號。該層次結(jié)構(gòu)是依據(jù)多個層來定義的,包括網(wǎng)絡(luò)層、硬件層、系統(tǒng)層、應(yīng)用層和組件/模塊層。但是在任何解決方案中,該方法都限于它發(fā)送的探測信號的數(shù)量,且不支持診斷中增加的細節(jié),而只增加潛在問題檢測和查找的精確度。
因此,明顯需要一種系統(tǒng),該系統(tǒng)能夠充分識別問題,調(diào)整測試參數(shù)來解析網(wǎng)絡(luò)問題的特性和位置,并校正這些問題,同時使所需人員干預(yù)的程度降低以及更少的高度熟練人員來執(zhí)行期望的任務(wù)。
提供這些背景技術(shù)信息是為了使申請人認為的公知信息與本發(fā)明可能相關(guān)。并不一定要認同,也不應(yīng)該視為任何先前的信息構(gòu)成對抗本發(fā)明的現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種用于使基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對其調(diào)節(jié)的方法和設(shè)備。根據(jù)本發(fā)明的一個方面,提供一種方法,用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述方法包括如下步驟接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);執(zhí)行預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在第一節(jié)點和第二節(jié)點之間傳送一個或多個分組并收集與一個或多個IP分組的傳輸特征有關(guān)的信息;基于一個或多個分組的傳輸特征確定一個或多個關(guān)鍵指標;利用與預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有預(yù)定分辨率級別或備選分辨率級別;以及執(zhí)行后續(xù)網(wǎng)絡(luò)測試。
根據(jù)本發(fā)明的另一個方面,提供一種設(shè)備,用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述設(shè)備包括輸入,用于接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);采樣機構(gòu),用于執(zhí)行預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在第一節(jié)點和第二節(jié)點之間傳送一個或多個IP分組并收集與一個或多個IP分組的傳輸特征有關(guān)的信息;以及分析系統(tǒng),用于基于一個或多個IP分組的傳輸特征確定一個或多個關(guān)鍵指標,所述分析系統(tǒng)還用于利用與預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有預(yù)定分辨率級別或備選分辨率級別。
根據(jù)本發(fā)明的另一個方面,提供一種包括計算機可讀媒體的計算機程序產(chǎn)品,所述計算機可讀媒體承載包括指令的計算機可讀信號的集合,當所述指令由計算機處理器執(zhí)行時,使所述計算機處理器執(zhí)行一種方法,所述方法用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述方法包括如下步驟接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);執(zhí)行預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在第一節(jié)點和第二節(jié)點之間傳送一個或多個IP分組并收集與一個或多個IP分組的傳輸特征有關(guān)的信息;基于一個或多個IP分組的傳輸特征確定一個或多個關(guān)鍵指標;利用與預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有預(yù)定分辨率級別或備選分辨率級別;以及執(zhí)行后續(xù)網(wǎng)絡(luò)測試。
圖1是根據(jù)本發(fā)明一個實施例的分辨率級別及其互連性的層次結(jié)構(gòu)的示意圖。
圖2圖示根據(jù)本發(fā)明一個實施例的采樣平均時間的圖表。
圖3圖示根據(jù)本發(fā)明一個實施例的可鏈接響應(yīng)的流程圖。
圖4圖示根據(jù)本發(fā)明一個實施例的觸發(fā)/操作框架的結(jié)構(gòu)和流程的流程圖。
圖5圖示根據(jù)本發(fā)明一個實施例的操作示例的流程圖。
具體實施例方式
定義術(shù)語“第3層”用于定義通信模型的網(wǎng)絡(luò)層,它提供允許在IP網(wǎng)絡(luò)上傳輸信息的路由選擇信息、尋址和其他相關(guān)的服務(wù)。例如,在稱為開放式系統(tǒng)互連(OSI)的共同引用的多層通信模型中,第3層涉及例如獲知網(wǎng)絡(luò)中相鄰節(jié)點的地址、選擇路由、服務(wù)質(zhì)量和識別并轉(zhuǎn)發(fā)從本地主域到傳輸層(第4層)的輸入消息,其中傳輸層確保消息的可靠到達,并提供可選的誤碼校驗機制和數(shù)據(jù)流控制。雖然可以注意到第3層可以是針對特定協(xié)議的,但是假定第3層的定義還可以用于定義任何備選分組通信模型中類似的操作層。
術(shù)語“第3層設(shè)備”用于定義在分組通信模型的第3層(它可以稱為網(wǎng)絡(luò)層)上運行的設(shè)備。第3層設(shè)備可以包括例如路由器或本領(lǐng)域技術(shù)人員容易理解的其他網(wǎng)絡(luò)層適合的設(shè)備。
術(shù)語“分組”用于定義正在IP網(wǎng)絡(luò)上傳輸?shù)男畔⑵7纸M的大小根據(jù)許多標準可能有非常大的差異,這些標準包括例如網(wǎng)絡(luò)容量和大小可行性。分組是在因特網(wǎng)或任何其他分組交換網(wǎng)絡(luò)上在出發(fā)點與目的地之間路由的數(shù)據(jù)的單位。例如,當要在分組交換網(wǎng)絡(luò)上傳送文件或其他類型的信息時,可以將該文件拆分成其大小對于在網(wǎng)絡(luò)內(nèi)路由有效率的“塊”或分組。
術(shù)語“分辨率級別”和“分辨率”可以互換使用,用來定義就采樣和分析能力而言的特定級別的操作的細節(jié)。分辨率提高可以是指細節(jié)和分析結(jié)果的精確度上的提高,這通常要求采樣的數(shù)量和復(fù)雜度上的相關(guān)提高。分辨率可以用于定義不同的測試級別之間的變化,并且可以定義特定測試級別內(nèi)的采樣的變化。例如,分辨率的變化可以定義為更改測試級別內(nèi)的采樣過程,例如更改測試分組協(xié)議或可以定義為更改測試級別,例如從普通監(jiān)控狀態(tài)更改到提升監(jiān)控狀態(tài)。
術(shù)語“觸發(fā)”用于定義初始化操作的動作,其中觸發(fā)可以由操作人員、機器、程序或本領(lǐng)域技術(shù)人員容易理解的任何其他類型的觸發(fā)類型機制來提供。觸發(fā)可以是啟動、停止或更改類型觸發(fā)或容易認識到的任何其他類型的觸發(fā)。
術(shù)語“分組序列”用于定義分組的數(shù)據(jù)報、分組突發(fā)或分組流。例如,數(shù)據(jù)報是以大分組間時間間隔傳送的單個分組。分組突發(fā)是以小分組間間隔傳送的固定數(shù)量的分組的集合,其中它們以大分組突發(fā)間間隔傳送。流是分組突發(fā)之間以固定間隔傳送的固定大小和數(shù)量的分組突發(fā)的序列。分組序列還可以是指以預(yù)定安排傳送的任何其他特定分組集。
除非另行定義,本文所用的所有技術(shù)和科學術(shù)語具有與本發(fā)明所屬領(lǐng)域的技術(shù)人員共同理解的相同的含義。
本發(fā)明提供一種用于自適應(yīng)地細化IP網(wǎng)絡(luò)性能監(jiān)控和診斷框架內(nèi)的采樣過程的方法和設(shè)備。自適應(yīng)地調(diào)整采樣過程的分辨率的這種能力可以實現(xiàn)相關(guān)IP網(wǎng)絡(luò)分析中的可變精確度和細節(jié)??梢詫⒉蓸舆^程的分辨率定義為例如就采樣期間分組傳輸速率而言的網(wǎng)絡(luò)上的負載、其統(tǒng)計方差、采樣過程的復(fù)雜度和采樣過程的類型。每個采樣和分析過程確定稱為關(guān)鍵指標的一個或多個網(wǎng)絡(luò)參數(shù)。后續(xù)采樣和操作的決策基于這些關(guān)鍵指標的確定來作出。同樣地,可以按可在活動級別的范疇內(nèi)檢查和檢測的條件來定義多種評估活動級別??梢允褂梅答?前饋過程來增強后續(xù)采樣過程的分辨率,例如如果必要的話,移至具有更復(fù)雜采樣過程的更詳細的活動級別。此外,本發(fā)明可以支持例如自動校正的活動,其中采樣過程及其診斷評估期間識別的給定IP網(wǎng)絡(luò)路徑中的問題隨后通過在該路徑中進行更改來予以解決。本發(fā)明可以使監(jiān)控、診斷和校正過程自動化并增強監(jiān)控、診斷和校正過程,由此,減少人員干預(yù),直到必需人員干預(yù)為止。此外,本發(fā)明內(nèi)固有的自動功能可以使采樣過程為可調(diào)節(jié)的,并相應(yīng)地響應(yīng)IP網(wǎng)絡(luò)條件的變化。
采樣過程包括發(fā)送和接收IP分組,而且可以為了從正在被評估的IP網(wǎng)絡(luò)請求特定響應(yīng)來使用采樣過程,又可以將它用來從其中請求另一個響應(yīng)。對以此方式彼此具有可配置關(guān)系的采樣傳輸?shù)捻憫?yīng)稱為可鏈接響應(yīng)??涉溄禹憫?yīng)的可鏈接周期和結(jié)合于本發(fā)明的決策制定能力可以一起定義觸發(fā)/操作框架。該框架可以提供分辨率級別之間的分支,并且提供用于外部觸發(fā)和終端或非響應(yīng)操作(例如要發(fā)出的通知)的接口。每個觸發(fā)的操作的結(jié)果作為對框架內(nèi)后續(xù)操作的觸發(fā)。
圖1中以示意形式示出本發(fā)明,其中每個活動級別包括用于建立一個或多個關(guān)鍵指標的至少一個預(yù)定采樣分辨率。關(guān)鍵指標用于通過相關(guān)聯(lián)的可鏈接響應(yīng)來判斷是否必需移至連接框架內(nèi)的備選活動級別,或是否要采用相同活動級別內(nèi)的備選采樣過程。如圖所示,所有活動級別被互連,由此允許它們之間的移動,而無需沿著活動級別階梯進行系統(tǒng)地移動?;顒蛹墑e的層次結(jié)構(gòu)可以包括任何數(shù)量的級別,而且可以基于最低和最高活動級別之間定義的活動級別之間的期望粒度來確定該層次結(jié)構(gòu)。例如,活動級別之間較粗略的分辨率可能導(dǎo)致最低與最高活動級別之間不同的活動級別的數(shù)量減少,而且反之亦然。
在本發(fā)明的一個實施例中,提供一種均衡方法以允許唯一的主動探測機制的調(diào)節(jié),例如從提供有關(guān)性能和問題的粗略分辨率的低級別監(jiān)控能力到確定測量和最少診斷的中級別測試,再到提供較精確的測量和詳細診斷的密集測試,再到生成多個測量和診斷的綜合性能分析,以及如果需要的話可以指定校正操作。
在本發(fā)明的一個實施例中,隨著分辨率級別的提高,與IP網(wǎng)絡(luò)路徑相關(guān)所收集的信息的細節(jié)級別連同收集的信息的可靠性也一起提高,由此允許對路徑執(zhí)行更復(fù)雜的診斷。例如,分辨率級別可以針對所評估的IP網(wǎng)絡(luò)的路徑的所檢測到的問題達到一定的細節(jié)和可靠性級別,使得可確定所檢測到的問題的校正方法,由此允許校正所檢測到的問題或緩解所檢測到的問題對IP網(wǎng)絡(luò)的影響。
網(wǎng)絡(luò)路徑本發(fā)明范疇中的網(wǎng)絡(luò)路徑可以定義為如服務(wù)器或工作站的第3層主機之間的路徑,以及它們之間路由IP分組時涉及到的所有第3層設(shè)備之間的路徑,其中每個第3層主機和第3層設(shè)備定義為節(jié)點。網(wǎng)絡(luò)路徑的此定義可以與本領(lǐng)域技術(shù)人員容易理解的跟蹤路由實用工具可以生成的第3層視圖一致。網(wǎng)絡(luò)路徑上第3層上不可見的其他元素的影響,例如媒體(網(wǎng)絡(luò)業(yè)務(wù))、第2層設(shè)備(例如交換機)和其他網(wǎng)絡(luò)設(shè)備(如業(yè)務(wù)整形器、限制器、濾波器和防火墻)的影響,假定為被歸類到采樣過程期間收集到的第3層設(shè)備的明顯響應(yīng)。
例如,為生成配合本發(fā)明使用的數(shù)據(jù)而執(zhí)行采樣過程,第一網(wǎng)絡(luò)主機可以假定沿IP網(wǎng)絡(luò)路徑存在典型網(wǎng)絡(luò)機制,其中由于第一網(wǎng)絡(luò)主機發(fā)送的一個或多個分組可以從第二網(wǎng)絡(luò)主機或其他第3層設(shè)備生成確認。發(fā)送的分組與收到的確認分組之間的相關(guān)可以提供一種通過確定IP網(wǎng)絡(luò)特征來定義網(wǎng)絡(luò)路徑的方式,這些IP網(wǎng)絡(luò)特征包括例如單向比特率、單向傳播延遲、單向延遲變化和單向可用比特率。
例如,連接到網(wǎng)絡(luò)的是一個或多個機制,用于沿路徑發(fā)送排序的分組集,并在它們遍歷該路徑之后接收分組序列或?qū)Υ说捻憫?yīng)。在一個實施例中,分組序列始發(fā)于分組序列發(fā)生器,沿路徑遍歷到反射點,然后傳播回分組序列發(fā)生器,而在本實施例中,分組序列發(fā)生器可以設(shè)在第一網(wǎng)絡(luò)主機上。在備選實施例中,分組序列發(fā)生器設(shè)在用于收集傳輸測試數(shù)據(jù)的第一網(wǎng)絡(luò)主機,而另一個分組序列發(fā)生器可以設(shè)在用于收集與分組序列的接收或?qū)ψ畛鮽魉偷男蛄蟹纸M響應(yīng)的接收相關(guān)的信息的另一個節(jié)點。分組序列發(fā)生器可以記錄有關(guān)發(fā)送分組的時間和/或接收返回分組的時間的信息。分組序列發(fā)生器還可以收集與例如所傳送的分組的類型和接收的分組的類型相關(guān)的信息。采樣會話期間收集的所有信息均視為測試數(shù)據(jù)。
此外,耦合到網(wǎng)絡(luò)的是分析系統(tǒng),除了在必要時添加或修改采樣過程外,它還用于接收測試數(shù)據(jù)和對其執(zhí)行期望的分析。分析系統(tǒng)可以包括編程的計算機,或能以硬件形式或本領(lǐng)域技術(shù)人員容易理解的其他形式的計算系統(tǒng)來配置。分析系統(tǒng)可以與分組序列發(fā)生器駐留在共同設(shè)備中或設(shè)在與之共同的位置中,或者可以與之在物理上分離。
在本發(fā)明的一些實施例中,將正被評估的IP網(wǎng)絡(luò)路徑定義為跨在第一節(jié)點與第二節(jié)點之間的路徑。例如,在采樣過程期間,將一個或多個分組序列從第一節(jié)點傳送,并尋址到第二節(jié)點,同時收集與一個或多個分組序列傳輸相關(guān)的信息并收集所產(chǎn)生的網(wǎng)絡(luò)響應(yīng),以便評估第一節(jié)點與第二節(jié)點之間的IP網(wǎng)絡(luò)路徑。該信息可以包含與分組的傳輸和對此應(yīng)答的接收相關(guān)的定時。本領(lǐng)域技術(shù)人員容易理解到,通過例如評估第一與第三節(jié)點之間或第一與第四節(jié)點之間可能涵蓋第一與第二節(jié)點之間的IP網(wǎng)絡(luò)路徑部分的路徑,還可以補充第一節(jié)點與第二節(jié)點之間的路徑的評估過程。
例如,假定的網(wǎng)絡(luò)機制能夠執(zhí)行包括但不限于如下的功能響應(yīng)傳送的因特網(wǎng)控制消息協(xié)議(ICMP)回聲分組而生成ICMP回顯應(yīng)答分組;響應(yīng)傳送的ICMP時間戳分組生成ICMP時間戳應(yīng)答分組;響應(yīng)傳送到未指定的端口的用戶數(shù)據(jù)報協(xié)議(UDP)分組而生成ICMP端口不可達分組;響應(yīng)傳送到未指定的端口的傳輸控制協(xié)議(TCP)分組而生成TCP復(fù)位分組;以及響應(yīng)傳送到指定的標準UDP回聲服務(wù)端口7的UDP分組而生成UDP“回聲”分組。此外,假定網(wǎng)絡(luò)機制響應(yīng)傳送到任何指定的端口的UDP分組,在該指定的端口中已安裝公知服務(wù)來利用預(yù)先安排的確認來響應(yīng)和/或記錄UDP分組的到達以供后來分析;響應(yīng)傳送到任何指定的端口的TCP分組,以使例如遠程代理、軟件或硬件的未知服務(wù)根據(jù)標準的TCP握手約定生成確認(ACK)或同步(SYN)響應(yīng);響應(yīng)傳送到任何指定的端口的TCP分組,在該指定的端口中已安裝例如遠程代理、軟件或硬件的公知服務(wù),以便利用預(yù)先安排的確認來響應(yīng)和/或記錄TCP分組的到達以供后來分析;響應(yīng)發(fā)往特定目的地主機的任何協(xié)議的分組,其中該分組的生存時間(TTL)已遞減到0,由此中間的第3層設(shè)備生成ICMP TTL屆滿消息;響應(yīng)發(fā)往特定目的地主機的任何第3/4層協(xié)議的分組,其中該分組的大小超過中間第3層設(shè)備的最大傳輸單位(MTU)并且具有禁止分割(DF)位設(shè)置,使得它生成“需要ICMP分割但已設(shè)置DF消息”;以及響應(yīng)任何采樣會話分組從期望的節(jié)點生成響應(yīng)分組,包括誤碼指示和協(xié)議相關(guān)的響應(yīng)。
采樣過程和采樣分辨率采樣是指沿著特定網(wǎng)絡(luò)路徑發(fā)送分組序列并觀察例如定時的結(jié)果以及如誤差的相關(guān)響應(yīng)的過程。重復(fù)的采樣有助于由第一節(jié)點和第二節(jié)點之間的特定網(wǎng)絡(luò)路徑引起的這些觀察結(jié)果的統(tǒng)計分布。這些觀察結(jié)果的統(tǒng)計分布表示例如與分組序列相關(guān)聯(lián)的變量(如它們的協(xié)議、數(shù)量和大小)、與第一節(jié)點與第二節(jié)點之間的網(wǎng)絡(luò)路徑的條件(例如瞬態(tài)行為)相關(guān)聯(lián)的變量和/或與采樣時間相關(guān)聯(lián)的變量(例如進行采樣的時間段)。此外,可以針對要執(zhí)行的目標分析驗證統(tǒng)計分析,例如要推導(dǎo)出什么信息或情報。
可以依據(jù)諸如傳送的分組數(shù)量、每個分組的大小、每個分組的協(xié)議和每個分組在傳送的分組序列中的相對位置之類的變量來表征采樣傳輸或分組序列。此外,可以通過分組的IP頭內(nèi)的特定設(shè)置來表征傳輸,例如第一節(jié)點、第二節(jié)點和生存時間(TTL)和IP頭中可用的各種標志、例如服務(wù)類型(TOS)。典型的采樣序列包括例如特定大小和協(xié)議的單個分組或數(shù)據(jù)報、具有統(tǒng)一或變化大小和協(xié)議的分組序列、以及它們以變化或固定的順序、數(shù)量或時間間隔的組合。
可以依據(jù)采樣級別的層次結(jié)構(gòu)來定義采樣分辨率,其中每個級別表示例如某個采樣負載、復(fù)雜度和統(tǒng)計價值。采樣的負載可以由IP網(wǎng)絡(luò)路徑上的分組傳輸速率來表示,其中特定的傳輸速率會影響分辨率的級別。例如,特定采樣過程的結(jié)果的統(tǒng)計方差也會影響所需采樣分辨率的級別。相似地,IP網(wǎng)絡(luò)的復(fù)雜度會影響傳輸?shù)牟蓸臃直媛省km然這些關(guān)系的每一個可能是相互聯(lián)系的,但是這些關(guān)系的每一個可以提供用于據(jù)此結(jié)果在相關(guān)采樣分辨率上評估IP網(wǎng)絡(luò)路徑的基礎(chǔ)。例如,可以將網(wǎng)絡(luò)上的負載減少到最低來達到某個目標。
對采樣過程的結(jié)果執(zhí)行多種分析,以確定依據(jù)特定參數(shù)的多個網(wǎng)絡(luò)響應(yīng)??梢砸罁?jù)已確認和反向丟失的必需分組的統(tǒng)計分布來定義每種分析。本發(fā)明在分辨率上是多層次的,即存在采樣和分析過程的層次結(jié)構(gòu),其中通過層次結(jié)構(gòu)的多個級別移動來調(diào)整分辨率。除了分析的特定級別外,層次結(jié)構(gòu)的每個級別還具有依據(jù)例如與之相關(guān)聯(lián)的負載和復(fù)雜度的采樣的特定級別。例如,在本發(fā)明的一個實施例中,存在層次結(jié)構(gòu)的七個級別,即非活動、普通監(jiān)控、提升監(jiān)控、現(xiàn)場測試、基本測試、充分測試和套裝測試。
在一個實施例中,在第一級別不活動中,系統(tǒng)可能處于不發(fā)生采樣的狀態(tài)。第二級別普通監(jiān)控中可能發(fā)生的采樣的示例是重復(fù)傳送大分組序列的單個樣本,隨后是X秒的等待期。在第三級別提升監(jiān)控中,可以傳送大分組序列的N個樣本的集合,每次隨后是Y秒的等待期,其中Y小于X。在層次結(jié)構(gòu)的下一級別現(xiàn)場測試中,傳送多種類型的重復(fù)樣本的多個小集合,無需任何等待期。在基本測試中,可以傳送多種大小和配置序列的各種組合樣本的集合,這構(gòu)成例如30次迭代的直接測試。在充分測試中,可以將迭代次數(shù)增加到例如100。最后在套裝測試中,可以在采樣期間傳送多種大小和配置序列的多種組合樣本的多個不同集合,這構(gòu)成例如100次迭代的多種充分測試。因此,在每個分辨率級別上,均可以影響不同類型的采樣。
關(guān)鍵指標將指標定義為可測量的值,例如物理系統(tǒng)中的溫度或依據(jù)可以應(yīng)用于決策制定過程的變量的關(guān)系例如X≠Y。根據(jù)本發(fā)明,通常可以將種類廣泛的指標識別為采樣過程的結(jié)果,其中一些可以視為普通指標,一些可以對于特定類型的決策或分析是唯一的。IP網(wǎng)絡(luò)上分組傳輸?shù)牡湫椭笜说氖纠ㄐ蛄兄凶詈笠粋€分組的傳輸與確認之間的間隔的最小值、最大值、平均值和標準差,序列中的平均丟失分組、整個序列的平均丟失、以及針對時間或由于添加后續(xù)樣本上面這些指標的任何一個的變化率。因為這些參數(shù)可以由任何采樣分布引起,所以這些指標可以專用于用于生成分布的這些參數(shù)。
關(guān)鍵指標是專門識別的指標,它們唯一地確定或定義采樣的分布的高級別狀態(tài)或非固有屬性。例如,整個分組序列的平均丟失的變化率(穩(wěn)定性)可以作為符合條件用于分析任何固有模式的丟失的關(guān)鍵指標。關(guān)鍵指標提供層次結(jié)構(gòu)的每個級別內(nèi)的決策制定的基礎(chǔ)??梢詫φ仗囟ㄩ撝颠x擇一個或多個關(guān)鍵指標,以定義層次結(jié)構(gòu)內(nèi)層次狀態(tài)的變化。
層次結(jié)構(gòu)的每個級別可以具有它自己的關(guān)鍵指標,但是均基于相同的根指標。根指標表示根據(jù)采樣傳輸確定的特征類型。例如,在本發(fā)明的一個實施例中,根指標與依據(jù)網(wǎng)絡(luò)特征的網(wǎng)絡(luò)路徑的高級別歸納有關(guān),例如始終為常量的那些非瞬態(tài)特征,例如端到端等待時間;隨時間變化的那些瞬態(tài)特征,例如可用帶寬;以及屬于IP網(wǎng)絡(luò)的操作參數(shù)外的那些功能失常特征,例如因媒體錯誤導(dǎo)致的丟失。
在一個實施例中,單個關(guān)鍵指標(稱為根指標)與上面的網(wǎng)絡(luò)特征的每一個相關(guān)聯(lián),使得例如如果分組定時的特定分布滿足與這些特征的其中一個或多個相關(guān)的一個或多個特定約束,則可以確定該根指標。例如,瞬態(tài)特征的根指標,即隨時間變化的那些指標可以是例如采樣事件期間作為序列傳送的分組的其中一個或多個的平均分組定時。具體來說,作為多個采樣事件測量的要傳送和接收的特定分組或分組序列的平均時間可以是根指標。圖2圖示多個采樣事件的對應(yīng)于樣本數(shù)量繪制的平均時間。在多個采樣事件上,局部平均時間11是某組時間上相鄰事件上的平均時間,它可以顯著地高于(例如高兩倍)增加之前的總平均時間12。還可以觀察到總平均時間12在緩慢變化,與來自最近采樣事件的作用相匹配。平均時間上的這種變化可以揭示該IP網(wǎng)絡(luò)路徑的瞬態(tài)特征最近已經(jīng)徹底改變,其中該確定能導(dǎo)致多種網(wǎng)絡(luò)特征的重新計算,例如重新采樣和重新評估IP網(wǎng)絡(luò)路徑的可用帶寬。
可以是非瞬態(tài)特征的根指標的關(guān)鍵指標的示例、即一般不隨時間變化的那些關(guān)鍵指標是最小記錄值、或利用附加參數(shù)化的情況下序列的最后一個分組的傳輸與確認之間的間隔的最小記錄值的變化率。這種參數(shù)化可以是采樣期間使用的一致的分組大小和/或協(xié)議,同時假定序列中的所有分組是相等且最大路徑MTU大小的,而且給定序列中的所有分組被確認??梢允欠撬矐B(tài)特征的根指標的關(guān)鍵指標的另一個示例是平均記錄值、或利用附加參數(shù)化的情況下最后一個分組的傳輸與確認之間的間隔的平均記錄值的變化率,例如假定序列中的所有分組是相等且最大路徑MTU大小的,而且給定序列中的所有分組被確認。
可以是功能失常特征的根指標的關(guān)鍵指標的示例是平均分組丟失、或利用附加參數(shù)化的情況下整個采樣序列的平均分組丟失率,在該附加參數(shù)化中例如存在采樣期間使用的一致的分組大小和/或協(xié)議,同時假定該序列中的所有分組都是相等大小的。
在一個實施例中,具體考慮是變化率的關(guān)鍵指標,當確定此類型的關(guān)鍵指標在某個閾值內(nèi)時,可以假定為該關(guān)鍵指標確定的值是漸近的,并因此可以將相關(guān)聯(lián)的分布視為就由它推導(dǎo)的任何測量而言是靜態(tài)的。
在一個實施例中,可以將關(guān)鍵指標定義為高級別分析的結(jié)果,例如與如美國專利申請?zhí)?0030103461(通過引用結(jié)合于本文)中公開的模式匹配相關(guān)聯(lián)的那些。該申請?zhí)峁┮环N系統(tǒng),用于根據(jù)收集的測試數(shù)據(jù)創(chuàng)建簽名來構(gòu)成測試簽名,然后將該測試簽名與對應(yīng)于多種網(wǎng)絡(luò)條件的現(xiàn)有樣本簽名比較。例如,網(wǎng)絡(luò)條件可以是例如全/半雙工失配、半/全雙工失配、媒體錯誤、擁塞、MTU沖突、黑洞、灰洞或白洞(black,grey or white hole)、間斷的連接性、沖突域違規(guī)、速率限制隊列、防火墻限制、路由器回路或本領(lǐng)域技術(shù)人員容易理解的任何其他網(wǎng)絡(luò)條件。該系統(tǒng)由此可以識別與測試簽名匹配的一個或多個示例簽名,并可以識別測試簽名最匹配的示例簽名,從而提供一種方式來建立如測試簽名所表示且存在的一個或多個網(wǎng)絡(luò)狀況。例如,可以依據(jù)匹配度來定義嚴重性級別,以及還可以依據(jù)與特定模式相關(guān)聯(lián)的加權(quán)來定義嚴重性級別。如果推導(dǎo)的嚴重性超過特定閾值,則可以生成后續(xù)操作。
在其中存在層次結(jié)構(gòu)的七個級別的實施例中,關(guān)鍵指標可以不與不活動級別相關(guān)聯(lián)??梢耘c普通監(jiān)控和提升監(jiān)控級別相關(guān)聯(lián)的關(guān)鍵指標的示例可以包括分組的局部平均丟失相對于分組的總平均丟失的變化率、分組序列的最后一個分組的局部最小遍歷時間相對于總最小遍歷時間的變化率以及分組序列的最后一個分組的局部平均遍歷時間相對于總平均遍歷時間的變化率。對于基本測試級別來說,關(guān)鍵指標的示例可以包括平均分組丟失、帶寬、等待時間、網(wǎng)絡(luò)利用率、抖動和測試嚴重性的低分辨率診斷測量。相似地,這些關(guān)鍵指標可以與充分測試級別和套裝測試級別相關(guān)聯(lián),但是在充分測試的情況中,可以為正被評估的網(wǎng)絡(luò)路徑內(nèi)的各個跳來評估每個指標,而且每個指標可以專用于特定診斷,而在套裝測試中,基于所獲得的多種類型的診斷來評估這些指標。應(yīng)該注意可以使用分析的現(xiàn)場測試級別來針對閾值評估所有關(guān)鍵指標,這些閾值已經(jīng)在現(xiàn)場測試開始時確定。因此,隨著測試級別的提高,現(xiàn)場測試期間可能有更多的關(guān)鍵指標要評估。
可鏈接響應(yīng)與本發(fā)明相關(guān)聯(lián)的可鏈接響應(yīng)是具有彼此間可配置關(guān)系的可檢測響應(yīng)的非平凡集,使得可以將從IP網(wǎng)絡(luò)請求特定響應(yīng)或?qū)ζ洳蓸拥慕Y(jié)果用作請求另一個可能響應(yīng)(包括再次請求相同的響應(yīng))的基礎(chǔ)??膳渲藐P(guān)系的這種形式可以基于應(yīng)用于請求過程的配置的一個或多個方面以及與之相關(guān)聯(lián)的關(guān)鍵指標的測量。例如,如圖3所示,兩個基本類型的操作/響應(yīng)可以是“檢查連接性”和“等待”?!皺z查連接性”的二進制結(jié)果是“已連接”或“未連接”,“等待X秒”的結(jié)果是“已等待X秒”。基于這些結(jié)果的可鏈接響應(yīng)的簡單合成可以表示為“如果已連接,則等待X秒”、“如果未連接,則等待Y秒”以及“如果等待已完成,則檢查是否已連接”。通過增加指示當前狀態(tài)的方式,這將提供一種基于循環(huán)期間上次是否檢測到連接性來加快或減慢的連接性檢查的自動循環(huán)。
在一個實施例中,對特定問題的響應(yīng)可以由其他響應(yīng)組成。例如,說明響應(yīng)合成的特定層次結(jié)構(gòu)的響應(yīng)類型可以在IP網(wǎng)絡(luò)性能系統(tǒng)內(nèi)實施,并可以包括表1所示的那些。表1指示響應(yīng)類型、它們相關(guān)聯(lián)的粒度、其示例和為該活動級別發(fā)送的分組的典型數(shù)量。具體考慮發(fā)送的分組數(shù)量,該特征可以范圍涉及任何一個測試級別,其中該特征可以對應(yīng)于特定活動級別內(nèi)的分辨率級別的變化或在該活動級別執(zhí)行的采樣的類型。
表1一般來說,響應(yīng)的每個級別表示例如就IP網(wǎng)絡(luò)上執(zhí)行的采樣會話而言提高了復(fù)雜度、時間和采樣負載。響應(yīng)的每個級別可與相同級別上的另一個響應(yīng)鏈接。但是,可以構(gòu)造有效地允許級別之間的鏈接的基本響應(yīng)。例如,“Ping”命令等效于發(fā)送ICMP回聲數(shù)據(jù)報;“Ping”任務(wù)包括一個“Ping”命令;“Ping”階段包括一個“Ping”任務(wù);“Ping”測試包括一個“Ping”階段,以及“Ping”套裝包括一個“Ping”測試。在該示例中,響應(yīng)的最高級別是Ping套裝,它與執(zhí)行作為Ping命令的響應(yīng)的最低級別的結(jié)果完全相同。對該測試的輸入,例如目的地主機的預(yù)定IP地址,通過層次結(jié)構(gòu)向下傳遞到命令級別,發(fā)出的命令的響應(yīng)通過層次結(jié)構(gòu)向上產(chǎn)生測試輸出。該示例顯示由某個級別產(chǎn)生的觸發(fā)如何可隨后啟動其他級別的活動。
在具有層次結(jié)構(gòu)或狀態(tài)的七個級別的實施例中,不活動級別可以是正常終止狀態(tài)或終點活動,這可以具有另一個狀態(tài)或外部提供的“停止”觸發(fā)的可鏈接響應(yīng)?;蛘卟换顒蛹墑e可以是例如不生成響應(yīng)的結(jié)果。普通監(jiān)控級別可以具有連續(xù)活動的不確定狀態(tài),其中該響應(yīng)可以由另一個狀態(tài)或外部提供的“開始”觸發(fā)啟動。普通監(jiān)控級別可以是來自另一個狀態(tài)的中斷或退出,或可以導(dǎo)致另一個狀態(tài)的觸發(fā),例如觸發(fā)提升監(jiān)控、基本測試或不活動。普通監(jiān)控級別的啟動通常需要目的地主機的IP地址,因此定義了觀察下的路徑,其中諸如要傳送的分組序列的大小、順序、時間間隔的其他參數(shù)可以是可選的。提升監(jiān)控、現(xiàn)場測試、基本測試和充分測試級別可以具有通常有限的狀態(tài)或固定活動,相似地該響應(yīng)可以由另一個狀態(tài)或外部提供的“開始”觸發(fā)啟動,并且可以生成導(dǎo)致從另一個狀態(tài)退出的響應(yīng),或可以觸發(fā)例如多種其他層次性的狀態(tài)以及非響應(yīng)的活動。相似地,活動的這些級別需要目的地主機的IP地址,其中與采樣相關(guān)的其他參數(shù)是可選的。在套裝測試中,該響應(yīng)可以由另一個狀態(tài)或外部提供的“開始”觸發(fā)啟動,其中該響應(yīng)可以觸發(fā)包括非響應(yīng)活動的另一個狀態(tài),并且需要IP地址,但是還可以生成一系列的其他響應(yīng),其中這些其他響應(yīng)的每一個可以導(dǎo)致從該活動狀態(tài)退出。
觸發(fā)/操作框架根據(jù)本發(fā)明的觸發(fā)/操作生成框架支持可鏈接響應(yīng)的鏈接循環(huán)和決策制定能力以定義活動狀態(tài)之間的分支。此外,觸發(fā)/操作框架可以提供用于外部觸發(fā)的接口,例如某個活動狀態(tài)和終止或非響應(yīng)操作(例如生成通知或告警)的人工啟動。每個觸發(fā)的操作的結(jié)果作為對一個或多個后續(xù)操作的觸發(fā),包括例如當前操作的預(yù)定義等待期和/或重復(fù)執(zhí)行。觸發(fā)和操作是在特定框架內(nèi)定義的,它們還可以包括在框架外生成或執(zhí)行的未定義的觸發(fā)和操作。外部觸發(fā)的一個簡單示例是用戶啟動框架內(nèi)的過程的動作。一旦啟動,該過程可以不需要任何其他外部觸發(fā)即可繼續(xù),雖然觸發(fā)終止該過程可以是適合的。
觸發(fā)/操作框架可以支持觸發(fā)和操作的連接和它們之間關(guān)系的配置。這些關(guān)系可以包括一個或多個觸發(fā)、每個具有各自的條件,導(dǎo)致一個或多個操作,每個具有各自的參數(shù)。該關(guān)系可以表示導(dǎo)致IP網(wǎng)絡(luò)內(nèi)特定條件的自動發(fā)現(xiàn)和識別的過程的專家知識,特別是因為它們可能隨時間出現(xiàn),無需對它們的特性或它們完全出現(xiàn)的任何現(xiàn)有認識。觸發(fā)/操作框架可以支持與IP網(wǎng)絡(luò)的監(jiān)控、分析和診斷相關(guān)聯(lián)的采樣、數(shù)據(jù)集、觸發(fā)類型、分析和響應(yīng)定義。在本發(fā)明的一個實施例中,框架可以支持定義的活動狀態(tài)和它們的過程、決策制定過程和它們的控制、時鐘設(shè)定和事件處理、故障恢復(fù)和誤碼生成以及至外部系統(tǒng)的I/O、例如通知、外部觸發(fā)和數(shù)據(jù)的導(dǎo)入/導(dǎo)出。
在本發(fā)明的一個實施例中,圖4中所示的流程圖表示觸發(fā)/操作框架的結(jié)構(gòu)和流程。在該實施例中,存在層次結(jié)構(gòu)的七個級別,即非活動31、普通監(jiān)控32、提升監(jiān)控33、現(xiàn)場測試34、基本測試35、充分測試36和套裝測試37。假定系統(tǒng)最初處于不活動31的狀態(tài),過程可以是外部觸發(fā)的310、例如由用戶觸發(fā),以啟動正常監(jiān)控32狀態(tài)。在該狀態(tài)中,可以例如每分鐘執(zhí)行一次采樣,可以監(jiān)控320關(guān)鍵指標(例如樣本丟失)。當該關(guān)鍵指標超過特定閾值,例如10%,則可以激活提升監(jiān)控33,其中例如每分鐘執(zhí)行10次采樣。再監(jiān)控關(guān)鍵指標(例如平均丟失)330,并在該關(guān)鍵指標超過特定閾值、例如3%時,將測試級別提高到現(xiàn)場測試34。在該活動級別上,評估所有識別的關(guān)鍵指標,并且如果這些關(guān)鍵指標的任何一個超過它們各自指定的閾值370,則將測試級別提升到基本測試35。在該活動級別,可以使用多個樣本類型,并運行特定數(shù)目迭代(例如30次迭代)的直接測試。如果正被測試的問題340的總嚴重性提高到預(yù)定的級別,則將測試級別提升到充分測試36。在該活動級別,運行相同測試更大數(shù)目的迭代、例如100次迭代,并可以判斷監(jiān)控的診斷結(jié)果的確信級別350。如果該測試的確信級別高于某個閾值、例如75%,則將測試進一步提升到套裝測試37,并生成該診斷的告警360。該告警可以是系統(tǒng)發(fā)送給用戶的外部告警,或例如可以是發(fā)送到與該系統(tǒng)相關(guān)聯(lián)的校正模塊的內(nèi)部告警。在套裝測試37期間,確定許多關(guān)鍵指標,并在現(xiàn)場測試級別34評估這些關(guān)鍵指標,其中將這些關(guān)鍵指標與它們各自的閾值比較。當這些關(guān)鍵指標與它們各自閾值的比較結(jié)果是超出閾值時,可以沿測試級別再一次提升測試級別,同時將先前收集的信息用于該測試過程的提升期間的各個分析?;蛘?,如果所有閾值均未被超過,則測試過程降級。如圖4所示,IP網(wǎng)絡(luò)的所選路徑的評估在多種分辨率級別的任何一個下都一直被評估,直到例如啟動停止觸發(fā)為止。
本發(fā)明包括含不活動的級別和一個或多個活動級別的層次結(jié)構(gòu),其中每個活動級別包括采樣(這構(gòu)成收集多種可配置的請求響應(yīng))、評估專用于這些采樣類型的關(guān)鍵指標、需要每種類型的關(guān)鍵指標和可連接響應(yīng)的其中一個或多個,關(guān)鍵指標和可連接響應(yīng)構(gòu)成利用特定采樣分布推導(dǎo)的必要輸入的分析的集合,而該特定采樣分布生成可用作其他響應(yīng)的輸入的特定輸出。該系統(tǒng)還包括觸發(fā)/操作框架,它支持可鏈接響應(yīng)與多種活動級別之間的連接性,以便可以實現(xiàn)特定結(jié)果,例如對IP網(wǎng)絡(luò)的自動化、持續(xù)和可調(diào)節(jié)的監(jiān)控、診斷和校正。
變化將認識到雖然在本文中基于說明目的描述了本發(fā)明的特定實施例,但是在不背離本發(fā)明精神和范圍的前提下可以進行多種修改。具體來說,提供一種用于控制根據(jù)本發(fā)明方法的計算機操作和/或構(gòu)造其根據(jù)本發(fā)明系統(tǒng)的組件的計算機程序產(chǎn)品或程序組件或用于存儲機器可讀信號的程序存儲器或存儲設(shè)備、例如固態(tài)或液態(tài)傳輸媒體、磁或光導(dǎo)線、磁帶或磁盤等。
而且,該方法的每個步驟可以在例如個人計算機、服務(wù)器等的任何通用計算機上且根據(jù)由任何編程語言(例如C++、Java、Pl/1等)生成的一個或多個程序元素、模塊或?qū)ο蠡蚱湟徊糠謥韴?zhí)行。此外,每個步驟或?qū)崿F(xiàn)每個所述步驟的文件或?qū)ο蟮冗€可以由專用硬件或為此目的設(shè)計的電路模塊來執(zhí)行。
示例圖5圖示根據(jù)本發(fā)明一個實施例的操作的方案。假定系統(tǒng)最初處于不活動41的狀態(tài),用戶、管理系統(tǒng)或其他過程觸發(fā)410該系統(tǒng)以在普通監(jiān)控42的活動級別上監(jiān)控源IP地址與目標IP地址定義的位置之間的路徑。系統(tǒng)假定所有活動級別的缺省值,并以最低采樣分辨率(例如N個分組序列組成一個樣本)開始對源與目標之間的路徑執(zhí)行普通監(jiān)控,然后執(zhí)行分析,然后等待60秒,此過程可以無限重復(fù)。系統(tǒng)初始化(例如沒有樣本被傳送或接收420)驗證系統(tǒng)以將活動級別提升到提升監(jiān)控43,然后檢查網(wǎng)絡(luò)路徑的狀態(tài)(例如源主機與目標主機之間的連接性)以供將來參考。在該活動級別上,采樣可以包括傳送包含N個分組序列的1個樣本,然后等待6秒,重復(fù)10次,然后分析。然后在提升監(jiān)控43周期結(jié)尾分析判斷特定關(guān)鍵指標低于閾值430,然后使活動級別降低到普通監(jiān)控44。普通監(jiān)控然后繼續(xù)X個樣本,其中關(guān)鍵指標保持低于特定閾值。在第X個采樣會話時,對接收到的信息的分析指示關(guān)鍵指標閾值已被超過440,然后系統(tǒng)將活動級別提升回提升監(jiān)控45。在提升監(jiān)控45的結(jié)論中,分析指示關(guān)鍵閾值被超過450,然后將活動級別提升到基本測試46而不提升到現(xiàn)場測試,因為與特定關(guān)鍵指標相關(guān)聯(lián)的閾值已明確地被超過。基本測試以最小迭代運行端到端測試??梢詧?zhí)行該測試而不評估定義的端到端路徑上的任何中間路徑段。該分析判斷關(guān)鍵指標超過關(guān)鍵閾值460,并將系統(tǒng)提升到充分測試47。充分測試的分析確定已經(jīng)利用確信系數(shù)或超過關(guān)鍵閾值470的關(guān)鍵指標生成診斷,系統(tǒng)發(fā)出通知471并執(zhí)行告警過程以通知負責監(jiān)控過程的用戶/外部代理。根據(jù)診斷472的特性,系統(tǒng)可以提升到套裝測試49以執(zhí)行多個適合類型的測試,或者系統(tǒng)可以將活動級別降低回普通監(jiān)控49,并且繼續(xù)對網(wǎng)絡(luò)路徑采樣。雖然IP網(wǎng)絡(luò)路徑上一直有可檢測類型的功能失效,但是只要可檢測類型的功能失效出現(xiàn),則根據(jù)本發(fā)明的系統(tǒng)可以就可以重復(fù)此循環(huán)。
因此,雖然描述了本發(fā)明實施例,顯然同樣能以多種方式進行改變。此類變化不視為背離本發(fā)明的精神和范圍,對于本領(lǐng)域?qū)I(yè)人員顯而易見的所有此類修改均應(yīng)包含在所附權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1.一種方法,用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述方法包括如下步驟a)接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);b)執(zhí)行所述預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在所述第一節(jié)點和所述第二節(jié)點之間傳送一個或多個分組并收集與所述一個或多個分組的傳輸特征有關(guān)的信息;c)基于所述一個或多個分組的傳輸特征確定一個或多個關(guān)鍵指標;d)利用與所述預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估所述一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有所述預(yù)定分辨率級別或備選分辨率級別;以及e)執(zhí)行所述后續(xù)網(wǎng)絡(luò)測試。
2.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)定分辨率級別是從多個分辨率級別中選擇的。
3.如權(quán)利要求2所述的方法,其特征在于,所述多個分辨率級別的每一個是從包括如下項的集合中選擇的普通監(jiān)控、提升監(jiān)控、現(xiàn)場測試、基本測試、充分測試和套裝測試。
4.如權(quán)利要求1所述的方法,其特征在于,所述一個或多個分組配置為生成來自所述IP網(wǎng)絡(luò)的一個或多個預(yù)定響應(yīng)。
5.如權(quán)利要求4所述的方法,其特征在于,所述一個或多個預(yù)定響應(yīng)的每一個是從包括如下項的集合中選擇的ICMP回顯應(yīng)答分組、ICMP時間戳應(yīng)答分組、ICMP端口不可達分組、ICMP TTL屆滿消息、“需要ICMP分割但已設(shè)置DF”消息、TCP復(fù)位分組、UDP回聲分組、ACK響應(yīng)和SYN響應(yīng)。
6.如權(quán)利要求1所述的方法,其特征在于,使用ICMP、UDP或TCP生成所述一個或多個分組。
7.如權(quán)利要求6所述的方法,其特征在于,所述一個或多個分組是ICMP回聲分組。
8.如權(quán)利要求1所述的方法,其特征在于,遠程代理、軟件或硬件生成對所述一個或多個分組的響應(yīng)。
9.如權(quán)利要求1所述的方法,其特征在于,根據(jù)期望的分辨率將所述預(yù)定網(wǎng)絡(luò)測試參數(shù)化,用于生成所述期望的分辨率上的一個或多個IP網(wǎng)絡(luò)特征。
10.如權(quán)利要求1所述的方法,其特征在于,根據(jù)期望的分辨率將所述預(yù)定網(wǎng)絡(luò)測試參數(shù)化,用于生成高于所述期望的分辨率的分辨率上的一個或多個IP網(wǎng)絡(luò)特征。
11.如權(quán)利要求9所述的方法,其特征在于,所述一個或多個網(wǎng)絡(luò)特征的每一個是從包含如下項的集合中選擇的單向比特率、單向傳播延遲、單向延遲變化、單向可用比特率和分組丟失。
12.如權(quán)利要求11所述的方法,其特征在于,在統(tǒng)計上評估所述一個或多個網(wǎng)絡(luò)特征的每一個,由此評估其最大值、最小值、平均值和標準差。
13.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括命令,所述命令包括傳送一個或多個分組并接收對所述一個或多個分組的一個或多個IP網(wǎng)絡(luò)響應(yīng)。
14.如權(quán)利要求13所述的方法,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括任務(wù),所述任務(wù)包括一個或多個命令。
15.如權(quán)利要求14所述的方法,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括階段,所述階段包括一個或多個任務(wù)。
16.如權(quán)利要求15所述的方法,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括測試,所述測試包括一個或多個階段。
17.如權(quán)利要求16所述的方法,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括套裝,所述套裝包括一個或多個測試。
18.如權(quán)利要求13所述的方法,其特征在于,所述命令包括傳送單個分組,所述單個分組由從包含如下項的集合中選擇的一個或多個變量表征大小、協(xié)議、TTL和TOS。
19.如權(quán)利要求13所述的方法,其特征在于,所述命令包括傳送分組突發(fā)。
20.如權(quán)利要求19所述的方法,其特征在于,所述分組突發(fā)包括從包含如下項的集合中選擇的一個或多個變量表征的分組大小、協(xié)議、TTL和TOS。
21.如權(quán)利要求13所述的方法,其特征在于,所述命令包括傳送分組流。
22.如權(quán)利要求13所述的方法,其特征在于,所述預(yù)定測試跨指定的時間段,由此允許隨時間評估一個或多個IP網(wǎng)絡(luò)特征。
23.如權(quán)利要求22所述的方法,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括評估一個或多個IP網(wǎng)絡(luò)特征的不連續(xù)變化。
24.如權(quán)利要求22所述的方法,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括對照閾值評估所述一個或多個IP網(wǎng)絡(luò)特征的變化率。
25.如權(quán)利要求24所述的方法,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括評估所述一個或多個IP網(wǎng)絡(luò)特征的變化率。
26.如權(quán)利要求15所述的方法,其特征在于,所述預(yù)定測試允許評估測試簽名。
27.如權(quán)利要求17所述的方法,其特征在于,所述預(yù)定測試允許評估時間簽名。
28.如權(quán)利要求1所述的方法,其特征在于,確定后續(xù)網(wǎng)絡(luò)測試包括如下步驟執(zhí)行所述一個或多個關(guān)鍵指標的一個或多個閾值比較,并基于將潛在后續(xù)網(wǎng)絡(luò)測試與潛在閾值比較結(jié)果關(guān)聯(lián)的決策來確定后續(xù)網(wǎng)絡(luò)測試。
29.如權(quán)利要求1所述的方法,其特征在于,重復(fù)所述方法,直到接收到停止觸發(fā)為止。
30.一種設(shè)備,用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述設(shè)備包括a)輸入,用于接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);b)采樣機構(gòu),用于執(zhí)行所述預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在所述第一節(jié)點和所述第二節(jié)點之間傳送一個或多個IP分組并收集與所述一個或多個IP分組的傳輸特征有關(guān)的信息;以及c)分析系統(tǒng),用于基于所述一個或多個IP分組的傳輸特征確定一個或多個關(guān)鍵指標,所述分析系統(tǒng)還用于利用與所述預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估所述一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有所述預(yù)定分辨率級別或備選分辨率級別。
31.如權(quán)利要求30所述的設(shè)備,其特征在于,所述采樣系統(tǒng)配置所述一個或多個分組以生成來自所述IP網(wǎng)絡(luò)的一個或多個預(yù)定響應(yīng)。
32.如權(quán)利要求31所述的設(shè)備,其特征在于,所述一個或多個預(yù)定響應(yīng)的每一個是從包含如下項的集合中選擇的ICMP回顯應(yīng)答分組、ICMP時間戳應(yīng)答分組、ICMP端口不可達分組、ICMP TTL屆滿消息、“需要ICMP分割但已設(shè)置DF”消息、TCP復(fù)位分組、UDP回聲分組、ACK響應(yīng)和SYN響應(yīng)。
33.如權(quán)利要求30所述的設(shè)備,其特征在于,所述采樣系統(tǒng)使用ICMP、UDP或TCP生成所述一個或多個分組。
34.如權(quán)利要求33所述的設(shè)備,其特征在于,所述采樣系統(tǒng)以ICMP回聲分組形式生成所述一個或多個分組。
35.如權(quán)利要求30所述的設(shè)備,其特征在于,遠程代理、軟件或硬件生成對所述一個或多個分組的響應(yīng)。
36.如權(quán)利要求30所述的設(shè)備,其特征在于,根據(jù)期望的分辨率將所述預(yù)定網(wǎng)絡(luò)測試參數(shù)化,用于生成所述期望的分辨率上的一個或多個IP網(wǎng)絡(luò)特征。
37.如權(quán)利要求30所述的設(shè)備,其特征在于,根據(jù)期望的分辨率將所述預(yù)定網(wǎng)絡(luò)測試參數(shù)化,用于生成高于所述期望的分辨率的分辨率上的一個或多個IP網(wǎng)絡(luò)特征。
38.如權(quán)利要求36所述的設(shè)備,其特征在于,所述一個或多個網(wǎng)絡(luò)特征的每一個是從包含如下項的集合中選擇的單向比特率、單向傳播延遲、單向延遲變化、單向可用比特率和分組丟失。
39.如權(quán)利要求38所述的設(shè)備,其特征在于,在統(tǒng)計上評估所述一個或多個網(wǎng)絡(luò)特征的每一個,由此評估其最大值、最小值、平均值和標準差。
40.如權(quán)利要求30所述的設(shè)備,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括命令,所述命令包括傳送一個或多個分組并接收對所述一個或多個分組的一個或多個IP網(wǎng)絡(luò)響應(yīng)。
41.如權(quán)利要求40所述的設(shè)備,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括任務(wù),所述任務(wù)包括一個或多個命令。
42.如權(quán)利要求41所述的設(shè)備,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括階段,所述階段包括一個或多個任務(wù)。
43.如權(quán)利要求42所述的設(shè)備,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括測試,所述測試包括一個或多個階段。
44.如權(quán)利要求43所述的設(shè)備,其特征在于,所述預(yù)定網(wǎng)絡(luò)測試包括套裝,所述套裝包括一個或多個測試。
45.如權(quán)利要求40所述的設(shè)備,其特征在于,所述命令包括傳送單個分組,所述單個分組由從包含如下項的集合中選擇的一個或多個變量表征大小、協(xié)議、TTL和TOS。
46.如權(quán)利要求40所述的設(shè)備,其特征在于,所述命令包括傳送分組突發(fā)。
47.如權(quán)利要求46所述的設(shè)備,其特征在于,所述分組突發(fā)包括從包含如下項的集合中選擇的一個或多個變量表征的分組大小、協(xié)議、TTL和TOS。
48.如權(quán)利要求40所述的設(shè)備,其特征在于,所述命令包括傳送分組流。
49.如權(quán)利要求40所述的設(shè)備,其特征在于,所述預(yù)定測試跨指定的時間段,由此允許隨時間評估一個或多個IP網(wǎng)絡(luò)特征。
50.如權(quán)利要求49所述的設(shè)備,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括評估一個或多個IP網(wǎng)絡(luò)特征的不連續(xù)變化。
51.如權(quán)利要求49所述的設(shè)備,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括對照閾值評估所述一個或多個IP網(wǎng)絡(luò)特征的變化率。
52.如權(quán)利要求51所述的設(shè)備,其特征在于,隨時間評估一個或多個IP網(wǎng)絡(luò)特征包括評估所述一個或多個IP網(wǎng)絡(luò)特征的變化率。
53.如權(quán)利要求42所述的設(shè)備,其特征在于,所述預(yù)定測試允許評估測試簽名。
54.如權(quán)利要求44所述的設(shè)備,其特征在于,所述預(yù)定測試允許評估時間簽名。
55.一種包括計算機可讀媒體的計算機程序產(chǎn)品,所述計算機可讀媒體承載包括指令的計算機可讀信號集,當所述指令由計算機處理器執(zhí)行時,使所述計算機處理器執(zhí)行一種方法,所述方法用于使第一節(jié)點和第二節(jié)點之間的網(wǎng)絡(luò)路徑的基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷自動化并對所述基于主動探測的IP網(wǎng)絡(luò)性能監(jiān)控和診斷進行調(diào)節(jié),所述方法包括如下步驟a)接收啟動具有預(yù)定分辨率級別的預(yù)定網(wǎng)絡(luò)測試的觸發(fā);b)執(zhí)行所述預(yù)定網(wǎng)絡(luò)測試,所述預(yù)定網(wǎng)絡(luò)測試包括在所述第一節(jié)點和所述第二節(jié)點之間傳送一個或多個IP分組并收集與所述一個或多個IP分組的傳輸特征有關(guān)的信息;c)基于所述一個或多個IP分組的傳輸特征確定一個或多個關(guān)鍵指標;d)利用與所述預(yù)定分辨率級別相關(guān)聯(lián)的預(yù)定標準集評估所述一個或多個關(guān)鍵指標,并據(jù)此確定后續(xù)網(wǎng)絡(luò)測試,所述后續(xù)網(wǎng)絡(luò)測試具有預(yù)定分辨率級別或備選分辨率級別;以及e)執(zhí)行所述后續(xù)網(wǎng)絡(luò)測試。
全文摘要
本發(fā)明提供用于自適應(yīng)地細化IP網(wǎng)絡(luò)性能監(jiān)控和診斷框架內(nèi)的采樣的方法和設(shè)備。能夠自適應(yīng)地調(diào)整采樣的分辨率可以允許相關(guān)IP網(wǎng)絡(luò)分析中實現(xiàn)可變精確度和細節(jié)。采樣分辨率可以定義為例如依據(jù)分組傳輸速率的網(wǎng)絡(luò)上的負載、它的統(tǒng)計方差和采樣過程的復(fù)雜度。每個采樣和分析過程確定稱為關(guān)鍵指標的一個或多個網(wǎng)絡(luò)參數(shù)。基于這些關(guān)鍵指標的確定來作出后續(xù)采樣和操作的決策。同樣地,由可在活動級別范疇內(nèi)檢查和檢測到的條件定義多種評估活動級別??梢允褂梅答?前饋過程來增強后續(xù)采樣的分辨率。
文檔編號H04L12/26GK101036343SQ200580019206
公開日2007年9月12日 申請日期2005年4月15日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者L·M·約爾根森, R·C·諾里斯 申請人:阿派倫特網(wǎng)絡(luò)股份有限公司