專利名稱:用于確定故障對網(wǎng)絡(luò)服務的影響的方法和裝置的制作方法
技術(shù)領(lǐng)域:
這里所公開并要求保護的本發(fā)明通常涉及一種用于監(jiān)視網(wǎng)絡(luò)來檢測故障、以便確定該故障對該網(wǎng)絡(luò)上運行的預先指定的服務的影響的方法和裝置。本發(fā)明尤其涉及一種上述類型的、用于在網(wǎng)絡(luò)中自動發(fā)現(xiàn)耦合到特定操作者設(shè)備的設(shè)備或節(jié)點以及發(fā)現(xiàn)被配置為在所發(fā)現(xiàn)的節(jié)點上運行的服務的方法。更特別的是,本發(fā)明涉及一種上述類型的、用于向網(wǎng)絡(luò)操作者警告網(wǎng)絡(luò)停歇或故障對所發(fā)現(xiàn)服務的影響的方法。
背景技術(shù):
被設(shè)置為結(jié)合諸如因特網(wǎng)之類的網(wǎng)絡(luò)操作的商業(yè)系統(tǒng)在典型情況下要求用于運行特定的服務器程序或服務的服務器。此外,商業(yè)系統(tǒng)使用除了運行特定服務之外還運行一個或多個服務的服務器,是非常普遍的。例如,諸如目錄訂購系統(tǒng)之類的商業(yè)系統(tǒng)可以要求運行諸如數(shù)據(jù)處理系統(tǒng)以及web應用服務之類的服務的服務器。此外,附加服務可能繼而依賴于與其它服務的網(wǎng)絡(luò)通信,以便整體上實現(xiàn)所述商業(yè)系統(tǒng)。據(jù)此,可以看出,可能要求在不同網(wǎng)絡(luò)節(jié)點上操作的多個服務以便實現(xiàn)商業(yè)系統(tǒng)。
上述類型的商業(yè)系統(tǒng)的操作者通常十分熟悉用于訪問因特網(wǎng)或其它網(wǎng)絡(luò)的特定服務器。然而,操作者可能不知道被要求操作如上所述的商業(yè)系統(tǒng)的所有其它網(wǎng)絡(luò)設(shè)備或分別在其上運行的服務。因此,網(wǎng)絡(luò)故障或停歇對這些服務的影響也可能會不為操作者所知。據(jù)此,希望向商業(yè)系統(tǒng)的操作者提供對于網(wǎng)絡(luò)停歇的影響、以及由此使什么服務變得不可用的可見性。此信息可能會幫助操作者糾正由網(wǎng)絡(luò)停歇所引起的服務問題。例如,如果操作者正在操作的兩個服務器機器都停止響應,并且所述操作者被告知一個機器具有DB2服務而另一個機器上沒有運行的服務,那么操作者可以優(yōu)先把運行所述DB2服務的服務器固定為第一。(DB2是國際商業(yè)機器公司的注冊商標。)在現(xiàn)有技術(shù)中,商業(yè)系統(tǒng)管理器可用來向操作者表明商業(yè)影響。一個這種系統(tǒng)是TivoliBusiness Systems Manager(商業(yè)系統(tǒng)管理器),Tivoli是國際商業(yè)機器公司(IBM)的專有商標并且在美國注冊了。這些系統(tǒng)根據(jù)網(wǎng)絡(luò)停歇提供了更高的服務影響級別。然而,此現(xiàn)有技術(shù)的系統(tǒng)要求操作者手動地定義為商業(yè)系統(tǒng)所要求的網(wǎng)絡(luò)組件之間的關(guān)系。
發(fā)明內(nèi)容
據(jù)此,提供了一種用于向指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)設(shè)備上運行的一個或多個服務的影響的通知的方法,所述方法包括步驟發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定的設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備;發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何一個所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;連續(xù)地監(jiān)視各個所發(fā)現(xiàn)的設(shè)備的狀態(tài),以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);并且產(chǎn)生用于表明所檢測的故障對所述發(fā)現(xiàn)的服務的影響的警告。
優(yōu)選為提供了一種全自動化的解決方案,借此向操作者自動通知網(wǎng)絡(luò)故障對目前看起來似乎是可用的必要服務的影響。
依照本發(fā)明的優(yōu)選實施例,根據(jù)使網(wǎng)絡(luò)停歇與被自動發(fā)現(xiàn)在節(jié)點(終端系統(tǒng))上運行的服務相關(guān),來向網(wǎng)絡(luò)操作者報告所述節(jié)點和網(wǎng)絡(luò)故障或停歇的服務影響。這優(yōu)選為使操作者能夠根據(jù)停歇對各個服務的可比較性影響來優(yōu)先糾正由網(wǎng)絡(luò)停歇事件所引起的服務問題。本發(fā)明的一個有用實施例旨在提供一種用于向指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對與所指定的設(shè)備相關(guān)聯(lián)地運行的一個或多個服務的影響的通知的方法。所述方法包括步驟發(fā)現(xiàn)網(wǎng)絡(luò)中分別被連接到所指定的設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備,繼而發(fā)現(xiàn)在用來同樣支持任務執(zhí)行的每個所發(fā)現(xiàn)的設(shè)備上運行的每個服務。所述方法進一步包括以預先指定的間隔來監(jiān)視各個所發(fā)現(xiàn)的設(shè)備的狀態(tài),以便檢測在網(wǎng)絡(luò)中故障的出現(xiàn)。當檢測到故障時,產(chǎn)生用于表明所檢測到的故障對各個所發(fā)現(xiàn)的服務的影響的警告。
所發(fā)現(xiàn)的設(shè)備和所述指定的設(shè)備優(yōu)選為分別被包括在至少具有服務器、工作站、路由器及它們之間的連接的組中。
優(yōu)選的是,在持續(xù)更新的數(shù)據(jù)庫中維護分別用于標識所述發(fā)現(xiàn)的設(shè)備和所述發(fā)現(xiàn)的服務中的每一個的信息。
在優(yōu)選實施例中,把每個所述發(fā)現(xiàn)的設(shè)備與所述網(wǎng)絡(luò)的節(jié)點相關(guān)聯(lián),并且把每個所述發(fā)現(xiàn)的設(shè)備與在其相關(guān)聯(lián)的節(jié)點上的一個或多個IP地址相關(guān)聯(lián)。優(yōu)選的是,所述數(shù)據(jù)庫包含用于標識在每個所述IP地址上的每個所述節(jié)點上運行的每個服務的信息。
在優(yōu)選實施例中,使用在所述指定的設(shè)備的操作系統(tǒng)中所包含的IP地址來發(fā)現(xiàn)各自的設(shè)備。
在優(yōu)選實施例中,為了發(fā)現(xiàn)每個服務,建立到所述網(wǎng)絡(luò)的所選擇端口的TCP端口連接,其中TCP端口連接使用所述發(fā)現(xiàn)的設(shè)備中特定的一個設(shè)備的IP地址。優(yōu)選的是,然后試圖連接到所述端口以便確定是否有任何服務正在所述特定的所發(fā)現(xiàn)設(shè)備上運行。
在優(yōu)選實施例中,對于在相關(guān)聯(lián)的網(wǎng)絡(luò)管理系統(tǒng)上配置的每個服務來嘗試TCP端口連接。
在一個實施例中,在所述網(wǎng)絡(luò)中檢測故障,并且為了產(chǎn)生警告,搜索數(shù)據(jù)庫,以便標識在所述網(wǎng)絡(luò)中在其上運行有任何所述發(fā)現(xiàn)的服務的每個設(shè)備。然后,產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述標識的設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到了所述檢測到的網(wǎng)絡(luò)故障的影響。
在一個實施例中,在所述網(wǎng)絡(luò)的給定設(shè)備中檢測到故障,并且為了產(chǎn)生警告,搜索數(shù)據(jù)庫,以便確定在所述給定設(shè)備上是否正在運行任何所述發(fā)現(xiàn)的服務。然后,產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述給定設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到了在所述給定設(shè)備上所檢測到的所述故障的影響。
在優(yōu)選實施例中,所述警告被發(fā)送給所述指定的設(shè)備的所述操作者。
依照另一方面,提供了一種在計算機可讀介質(zhì)中的計算機程序產(chǎn)品,用于向所指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)上運行的一個或多個服務的影響的通知,所述計算機程序產(chǎn)品包括第一指令,用于發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備;第二指令,用于發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;第三指令,用于連續(xù)地監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài)以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);和第四指令,用于產(chǎn)生用來表明所檢測的故障對所述發(fā)現(xiàn)的服務的影響的警告。
依照另一方面,提供了一種用于向所指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)上運行的一個或多個服務的影響的通知的裝置,所述裝置包括網(wǎng)絡(luò)監(jiān)視器,被布置來發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備,所述網(wǎng)絡(luò)監(jiān)視器被進一步布置來連續(xù)地監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài)以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);服務監(jiān)視器,用于發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;和警告裝置,用于產(chǎn)生用來表明所檢測到的故障對所述發(fā)現(xiàn)的服務的影響的警告。
現(xiàn)在將僅以舉例的形式參考以下附圖來描述本發(fā)明的優(yōu)選實施例圖1是用于示出可以用來與本發(fā)明實施例一起使用的網(wǎng)絡(luò)和相關(guān)聯(lián)組件的示意圖。
圖2是示出本發(fā)明實施例的框圖。
圖3是用于圖示使用圖2的實施例的流程圖。
圖4是示出用于圖2的實施例的簡化控制的框圖。
具體實施例方式
參照圖1,示出了包括因特網(wǎng)或其所選擇部件或部分的網(wǎng)絡(luò)100,其具有可以用來與本發(fā)明的實施例一起使用的組件。更特別的是,圖1示出了連接到LAN103的服務器102,其還具有到路由器104的連接。服務器102經(jīng)由LAN103和路由器104連接到一般的因特網(wǎng)連接106。因特網(wǎng)連接106沒有詳細地示出,但是如本領(lǐng)域技術(shù)人員所公知的那樣,它包括路由器及其它組件的配置,用于將全球范圍上的諸如服務器、工作站等的設(shè)備互連。因此,服務器102可連接到路由器108,并且可進一步連接到局域網(wǎng)(LAN)110的各個設(shè)備或節(jié)點(未示出)。服務器102還可經(jīng)由路由器108連接到LAN112,LAN112具有與之耦合的服務器114和諸如工作站118之類的設(shè)備。經(jīng)由路由器108和122,服務器102可連接到包括服務器的節(jié)點120,并且可連接到LAN124的各個設(shè)備或節(jié)點(未示出)。
圖1進一步示出了可經(jīng)由路由器104和130連接到LAN126和128的各個節(jié)點(未示出)的服務器102。工作站132和134被示為連接到LAN103的設(shè)備,并且可被操作者用來控制并指導服務器102的操作。
為了圖示本發(fā)明的實施例,假定操作者操作服務器102來建立用于執(zhí)行指定任務的商業(yè)系統(tǒng),所述任務諸如為目錄訂購等。進一步假定在服務器102上為此目的而運行的服務必須依賴于其它服務以便實現(xiàn)整個商業(yè)系統(tǒng)。因此,服務器102的操作系統(tǒng)建立與服務器120的連接。服務器120被配置為運行服務136和138,所述服務136和138均被要求來實現(xiàn)所述商業(yè)系統(tǒng)。此外,還在服務器102和LAN112中的服務器114之間建立連接,所述服務器114被配置為運行另一所要求的服務140。
參照圖2,示出了包括本發(fā)明實施例的網(wǎng)絡(luò)管理系統(tǒng)200,其中系統(tǒng)200包括網(wǎng)絡(luò)管理工具202和事件服務器204。網(wǎng)絡(luò)管理工具繼而包括網(wǎng)絡(luò)監(jiān)視器206和服務監(jiān)視器208。提供了網(wǎng)絡(luò)管理工具202以便獲取關(guān)于網(wǎng)絡(luò)100中變?yōu)檫B接到服務器102的設(shè)備的信息,以便實現(xiàn)如上所述的商業(yè)系統(tǒng)。工具202還獲取關(guān)于與所連接的設(shè)備相關(guān)聯(lián)的服務的信息。
網(wǎng)絡(luò)監(jiān)視器206適合于在服務器IP地址上經(jīng)由網(wǎng)絡(luò)100向服務器102發(fā)送ICMP(因特網(wǎng)控制消息協(xié)議)網(wǎng)絡(luò)。ICMP響應或其缺乏使得監(jiān)視器206能夠確定機器在IP地址上是否有效。經(jīng)由SNMP(Simple Network Management Protocol,簡單網(wǎng)絡(luò)管理協(xié)議)協(xié)議請求來獲取關(guān)于設(shè)備的進一步信息。因此,網(wǎng)絡(luò)監(jiān)視器206能夠確定或發(fā)現(xiàn)各個連接的設(shè)備,其中包括服務器120和114以及任何其它服務器、路由器和工作站。然后,在駐留于網(wǎng)絡(luò)管理工具202中的數(shù)據(jù)庫210中列出這些發(fā)現(xiàn)的設(shè)備或節(jié)點中的每一個。
在連接到服務器102的各個設(shè)備已經(jīng)被發(fā)現(xiàn)并在數(shù)據(jù)庫210中列出之后,網(wǎng)絡(luò)監(jiān)視器206繼續(xù)每隔一段時間評定或監(jiān)視每個所發(fā)現(xiàn)的設(shè)備的可用性狀態(tài),所述間隔可由操作者來配置。從而,網(wǎng)絡(luò)監(jiān)視器206能夠確定節(jié)點(即,服務器或工作站)或者包括任何所發(fā)現(xiàn)的節(jié)點的整個網(wǎng)絡(luò)何時由于一些故障而變得不可用。
應當理解,這里所用的術(shù)語“網(wǎng)絡(luò)”可以指的是諸如網(wǎng)絡(luò)100之類的大型全球網(wǎng)路,以及其某些部分和連接到其的、包括所發(fā)現(xiàn)的設(shè)備的較小網(wǎng)絡(luò)。
進一步參照圖2,示出了被提供來發(fā)現(xiàn)任何預先配置的一個或多個服務的服務監(jiān)視器208,所述服務在網(wǎng)絡(luò)100中的各個發(fā)現(xiàn)的設(shè)備上運行。這些服務可以包括諸如HTTP服務器之類的應用或被稱為DB2的IBM的產(chǎn)品。
如本領(lǐng)域技術(shù)人員所知的那樣,依照TCP/IP協(xié)議使用端口來指定在網(wǎng)絡(luò)計算機等上運行的特定服務器程序或服務。因此,為了發(fā)現(xiàn)在所發(fā)現(xiàn)的設(shè)備中特定的一個設(shè)備上運行的服務,服務監(jiān)視器208在所述特定設(shè)備的IP地址上連接到網(wǎng)絡(luò)100。然后,監(jiān)視器208試圖連接到特定的端口號,以便確定與特定端口號相關(guān)聯(lián)的服務是否正在特定的所發(fā)現(xiàn)設(shè)備上運行。如果在特定的端口號上在特定的設(shè)備上發(fā)現(xiàn)服務,那么此信息被存儲或列出在數(shù)據(jù)庫210中。此后,所列出服務的狀態(tài)由服務監(jiān)視器208連續(xù)地監(jiān)視,以便確定它是否維持在特定的設(shè)備上。
在試圖連接到特定的端口號上之后,服務監(jiān)視器210被操作來試圖在特定設(shè)備的相同IP地址上連接到其它端口號,以便發(fā)現(xiàn)在這種設(shè)備上運行的任何其它服務。以類似的方式,服務監(jiān)視器208被操作來發(fā)現(xiàn)被配置為在其它所發(fā)現(xiàn)設(shè)備中的每一個上運行的服務。在此處理過程結(jié)束時,數(shù)據(jù)庫210將會包含網(wǎng)絡(luò)100中的所有節(jié)點或設(shè)備的完整列表,所述節(jié)點或設(shè)備連接到支持商業(yè)系統(tǒng)的服務器102,如以上所述的那樣。數(shù)據(jù)庫210還包含被發(fā)現(xiàn)正在各個所發(fā)現(xiàn)的設(shè)備上運行的所有服務的列表,所述設(shè)備同樣支持所述商業(yè)系統(tǒng)。此外,通過操作網(wǎng)絡(luò)監(jiān)視器206和服務監(jiān)視器208以連續(xù)地監(jiān)視各個節(jié)點和服務的狀態(tài),來以非常頻繁的間隔在數(shù)據(jù)庫210中連續(xù)地更新所發(fā)現(xiàn)的節(jié)點和服務的列表。
在本發(fā)明的其它實施例中,還可以使用應用編程接口(API)來發(fā)現(xiàn)在連接到服務器102的設(shè)備上運行的服務。
當網(wǎng)絡(luò)管理工具202在上述連續(xù)的狀態(tài)監(jiān)視過程期間發(fā)現(xiàn)網(wǎng)絡(luò)故障或停歇時,網(wǎng)絡(luò)管理系統(tǒng)200還將確定任何網(wǎng)絡(luò)節(jié)點上的服務是否受到影響。在節(jié)點(例如,終端站或工作站)上出現(xiàn)故障的情況下,網(wǎng)絡(luò)管理系統(tǒng)200搜索數(shù)據(jù)庫210,以便查看是否已知任何服務正在所關(guān)注的節(jié)點上運行。如果是的話,那么這些服務將會受到在此節(jié)點上的網(wǎng)絡(luò)故障的影響。據(jù)此,操作網(wǎng)絡(luò)管理系統(tǒng)200的網(wǎng)絡(luò)管理工具202,以便產(chǎn)生用于闡明節(jié)點故障事件對這些服務的影響的警告。然后,此警告被發(fā)送給服務器102的操作者的管理控制臺(未示出)。
在停歇或故障影響整個網(wǎng)絡(luò)的情況下,搜索數(shù)據(jù)庫210以便確定在特定網(wǎng)絡(luò)內(nèi)是否有任何在其上運行有服務的節(jié)點。如果存在的話,那么這些節(jié)點將會受到網(wǎng)絡(luò)故障的影響,以致在這些節(jié)點上的服務也將會受到影響。在這種情況下,網(wǎng)絡(luò)管理系統(tǒng)202產(chǎn)生用于闡明網(wǎng)絡(luò)故障事件對這些服務的影響的警告。同樣地,此警告被發(fā)送給服務器102的操作者的管理控制臺。
通過向服務器102的操作者提供如上所述的警告,所述操作者能夠設(shè)置優(yōu)先級以糾正由故障所導致的服務問題。
參照圖3,示出了通常描繪了網(wǎng)絡(luò)管理系統(tǒng)200的操作的流程圖。功能塊302-306分別闡明了以下的順序步驟發(fā)現(xiàn)連接到操作者的服務器102的節(jié)點,發(fā)現(xiàn)正在所發(fā)現(xiàn)的節(jié)點上運行的服務,并且在數(shù)據(jù)庫中列出所發(fā)現(xiàn)的節(jié)點和服務。功能塊308表明連續(xù)地監(jiān)視所列出的節(jié)點和所列出的服務的狀態(tài)。監(jiān)視所列出的服務,使得當一個服務不再在所列出的節(jié)點上運行時可以從數(shù)據(jù)庫中移除該服務。連續(xù)地監(jiān)視節(jié)點,以便檢測在任何節(jié)點中或在分別連接到其的任何網(wǎng)絡(luò)中出現(xiàn)的任何故障。
進一步參照圖3,示出了用于檢測所列出的節(jié)點中的網(wǎng)絡(luò)故障的判定塊310。當檢測到這種故障時,必須確定任何所列出的服務是否正在該節(jié)點上運行,如判定塊312所表明的那樣。如果任何這種服務正在運行,那么用于表明服務受節(jié)點故障影響的警告被發(fā)送到服務器102的操作者。判定塊316和318以及功能320分別表明當檢測到影響所列出的節(jié)點和服務的網(wǎng)絡(luò)故障時進行類似的步驟。
參照圖4,示出了用于網(wǎng)絡(luò)管理系統(tǒng)200的控制212的簡化配置??刂?12包括處理器或處理單元402、數(shù)據(jù)存儲設(shè)備404和計算機可讀介質(zhì)406。組件402-406借助于總線408互連。處理單元402例如可以包括各種各樣的處理器和ASIC設(shè)備。計算機可讀介質(zhì)406例如可以包括可記錄介質(zhì)或媒介,諸如硬盤驅(qū)動器、軟盤、RAM、CD-ROM或DVD-ROM,但是它決不局限于此。介質(zhì)406被布置為包括處理器指令,所述處理器指令被配置為由處理器402讀取,并且由此使所述處理器操作如上所述的工具管理系統(tǒng)200及其各個組件。
已經(jīng)為了圖示和描述的目的而給出了對本發(fā)明的描述,并且該描述并不是窮舉性的,也不打算將本發(fā)明局限為所公開的形式。許多修改和變化對于本領(lǐng)域普通技術(shù)人員來說是顯而易見的。選擇并描述了所述實施例,以便更好地解釋本發(fā)明的原理及實際應用,并且使本領(lǐng)域技術(shù)人員能夠理解本發(fā)明的具有適于所預期的特定用途的各種修改的各個實施例。
權(quán)利要求
1.一種用于向指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)設(shè)備上運行的一個或多個服務的影響的通知的方法,所述方法包括步驟發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備;發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;連續(xù)地監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài)以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);并且產(chǎn)生用于表明所檢測到的故障對所述發(fā)現(xiàn)的服務的影響的警告。
2.如權(quán)利要求1所述的方法,其中所述發(fā)現(xiàn)的設(shè)備和所述指定的設(shè)備分別被包括在至少具有服務器、工作站、路由器及它們之間的連接的組中。
3.如權(quán)利要求1或2所述的方法,其中在連續(xù)更新的數(shù)據(jù)庫中維護分別用于標識所述發(fā)現(xiàn)的設(shè)備和所述發(fā)現(xiàn)的服務中的每一個的信息。
4.如權(quán)利要求3所述的方法,其中,把每個所述發(fā)現(xiàn)的設(shè)備與所述網(wǎng)絡(luò)的節(jié)點相關(guān)聯(lián),并且把每個所述發(fā)現(xiàn)的設(shè)備與在其相關(guān)聯(lián)的節(jié)點上的一個或多個IP地址相關(guān)聯(lián),并且其中所述數(shù)據(jù)庫包含用于標識在每個所述IP地址上的每個所述節(jié)點上運行的每個服務的信息。
5.如權(quán)利要求4所述的方法,其中使用在所述指定設(shè)備的操作系統(tǒng)中所包含的IP地址來發(fā)現(xiàn)各個設(shè)備。
6.如權(quán)利要求5所述的方法,其中,所述發(fā)現(xiàn)每個服務的步驟包括建立到所述網(wǎng)絡(luò)的選定端口的TCP端口連接,其中所述TCP端口連接使用所述發(fā)現(xiàn)的設(shè)備中特定的一個設(shè)備的IP地址;并且試圖連接到所述端口,以便確定是否有任何服務正在所述特定的所發(fā)現(xiàn)設(shè)備上運行。
7.如權(quán)利要求6所述的方法,其中對于在相關(guān)聯(lián)的網(wǎng)絡(luò)管理系統(tǒng)上配置的每個服務來嘗試TCP端口連接。
8.如權(quán)利要求3至7中任一項所述的方法,其中,在所述網(wǎng)絡(luò)中檢測到所述故障,并且所述警告產(chǎn)生步驟包括搜索所述數(shù)據(jù)庫,以便標識在所述網(wǎng)絡(luò)中的其上運行有任何所述發(fā)現(xiàn)的服務的每個設(shè)備;并且產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述標識的設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到了所述檢測到的網(wǎng)絡(luò)故障的影響。
9.如權(quán)利要求3至7中任一項所述的方法,其中,在所述網(wǎng)絡(luò)的給定設(shè)備中檢測到所述故障,并且所述警告產(chǎn)生步驟包括搜索所述數(shù)據(jù)庫,以便確定是否有任何所述發(fā)現(xiàn)的服務正在所述給定設(shè)備上運行;并且產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述給定設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到了在所述給定設(shè)備上所檢測到的所述故障的影響。
10.如先前權(quán)利要求中任何一項所述的方法,其中所述警告被發(fā)送到所述指定設(shè)備的所述操作者。
11.一種在計算機可讀介質(zhì)中的計算機程序產(chǎn)品,用于向指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)上運行的一個或多個服務的影響的通知,所述計算機程序產(chǎn)品包括第一指令,用于發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備;第二指令,用于發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;第三指令,用于連續(xù)地監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài)以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);和第四指令,用于產(chǎn)生用來表明所檢測到的故障對所述發(fā)現(xiàn)的服務的影響的警告。
12.如權(quán)利要求11所述的計算機程序產(chǎn)品,其中所述發(fā)現(xiàn)的設(shè)備和所述指定的設(shè)備分別被包括在至少具有服務器、工作站、路由器及它們之間的連接的組中。
13.如權(quán)利要求11或12所述的計算機程序產(chǎn)品,其中在連續(xù)更新的數(shù)據(jù)庫中維護分別用于標識所述發(fā)現(xiàn)的設(shè)備和所述發(fā)現(xiàn)的服務中的每一個的信息。
14.如權(quán)利要求13所述的方法,其中,把每個所述發(fā)現(xiàn)的設(shè)備與所述網(wǎng)絡(luò)的節(jié)點相關(guān)聯(lián),并且把每個所述發(fā)現(xiàn)的設(shè)備與在其相關(guān)聯(lián)的節(jié)點上的一個或多個IP地址相關(guān)聯(lián),并且其中所述數(shù)據(jù)庫包含用于標識在每個所述IP地址上的每個所述節(jié)點上運行的每個服務的信息。
15.如權(quán)利要求14所述的計算機程序產(chǎn)品,其中使用在所述指定設(shè)備的操作系統(tǒng)中所包含的IP地址來發(fā)現(xiàn)各個設(shè)備。
16.如權(quán)利要求15所述的計算機程序產(chǎn)品,其中,所述用于發(fā)現(xiàn)每個服務的第二指令包括第五指令,用于建立到所述網(wǎng)絡(luò)的選定端口的TCP端口連接,其中所述TCP端口連接使用所述發(fā)現(xiàn)的設(shè)備中特定的一個設(shè)備的IP地址;和第六指令,用于試圖連接到所述端口以便確定是否有任何服務正在所述特定的所發(fā)現(xiàn)設(shè)備上運行。
17.如權(quán)利要求16所述的計算機程序產(chǎn)品,其中對于在相關(guān)聯(lián)的網(wǎng)絡(luò)管理系統(tǒng)上配置的每個服務來嘗試TCP端口連接。
18.如權(quán)利要求13至17中任一項所述的計算機程序產(chǎn)品,其中,在所述網(wǎng)絡(luò)中檢測到所述故障,并且所述第四指令用于搜索所述數(shù)據(jù)庫,以便標識在所述網(wǎng)絡(luò)中的其上運行有任何所述發(fā)現(xiàn)的服務的每個設(shè)備;并且產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述標識的設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到了所述檢測到的網(wǎng)絡(luò)故障的影響。
19.如權(quán)利要求13至17中任一項所述的計算機程序產(chǎn)品,其中,在所述網(wǎng)絡(luò)的給定設(shè)備中檢測到所述故障,并且所述第四指令用于搜索所述數(shù)據(jù)庫,以便確定是否有任何所述發(fā)現(xiàn)的服務正在所述給定設(shè)備上運行;并且產(chǎn)生警告來提供通知,用于表明被發(fā)現(xiàn)正在所述給定設(shè)備上運行的任何所述發(fā)現(xiàn)的服務已經(jīng)受到在所述給定設(shè)備上所檢測到的所述故障的影響。
20.如權(quán)利要求11至19中任一項所述的計算機程序產(chǎn)品,其中所述警告被發(fā)送到所述指定設(shè)備的所述操作者。
21.一種用于向指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對在所述網(wǎng)絡(luò)上運行的一個或多個服務的影響的通知的裝置,所述裝置包括網(wǎng)絡(luò)監(jiān)視器,被布置為發(fā)現(xiàn)在所述網(wǎng)絡(luò)中所包括的、分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備,所述網(wǎng)絡(luò)監(jiān)視器進一步被布置為連續(xù)地監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài)以便檢測在所述網(wǎng)絡(luò)中故障的出現(xiàn);服務監(jiān)視器,用于發(fā)現(xiàn)被配置為在支持執(zhí)行所述預期任務的任何所述發(fā)現(xiàn)的設(shè)備上運行的每個服務;和警告裝置,用于產(chǎn)生用來表明所檢測到的故障對所述發(fā)現(xiàn)的服務的影響的警告。
22.如權(quán)利要求21所述的裝置,其中所述發(fā)現(xiàn)的設(shè)備和所述指定的設(shè)備分別被包括在至少具有服務器、工作站、路由器及它們之間的連接的組中。
23.如權(quán)利要求21或22所述的裝置,其中所述裝置包括數(shù)據(jù)庫,用于存儲分別用于標識所述發(fā)現(xiàn)的設(shè)備和所述發(fā)現(xiàn)的服務中的每一個的信息,所述數(shù)據(jù)庫中的所述信息被連續(xù)地更新。
24.如權(quán)利要求23所述的裝置,其中,把每個所述發(fā)現(xiàn)的設(shè)備與所述網(wǎng)絡(luò)的節(jié)點相關(guān)聯(lián),并且把每個所述發(fā)現(xiàn)的設(shè)備與在其相關(guān)聯(lián)的節(jié)點上的一個或多個IP地址相關(guān)聯(lián),并且其中所述數(shù)據(jù)庫包含用于標識在每個所述IP地址上的每個所述節(jié)點上運行的每個服務的信息。
25.如權(quán)利要求24所述的裝置,其中使用在所述指定設(shè)備的操作系統(tǒng)中所包含的IP地址來發(fā)現(xiàn)各個設(shè)備。
26.如權(quán)利要求25所述的裝置,其中,所述用于發(fā)現(xiàn)每個服務的服務監(jiān)視器包括用于建立到所述網(wǎng)絡(luò)的選定端口的TCP端口連接的裝置,其中所述TCP端口連接使用所述發(fā)現(xiàn)的設(shè)備中特定的一個設(shè)備的IP地址;和用于試圖連接到所述端口以便確定是否有任何服務正在所述特定的所發(fā)現(xiàn)設(shè)備上運行的裝置。
27.如權(quán)利要求26所述的裝置,其中對于在相關(guān)聯(lián)的網(wǎng)絡(luò)管理系統(tǒng)上配置的每個服務來嘗試TCP端口連接。
28.如權(quán)利要求23至27中任一項所述的裝置,其中,所檢測到的故障出現(xiàn)在所述網(wǎng)絡(luò)中,所述裝置包括用于搜索所述數(shù)據(jù)庫以便標識在所述網(wǎng)絡(luò)中的其上運行有任何所述發(fā)現(xiàn)的服務的每個設(shè)備的裝置,并且其中所述警告裝置可操作來產(chǎn)生警告以提供通知,用于表明被發(fā)現(xiàn)正在所述標識的設(shè)備上運行的每個所發(fā)現(xiàn)的服務已經(jīng)受到了所述檢測到的網(wǎng)絡(luò)故障的影響。
29.如權(quán)利要求23至27中任一項所述的裝置,其中,所檢測到的故障出現(xiàn)在所述網(wǎng)絡(luò)的給定設(shè)備中,所述裝置包括用于搜索所述數(shù)據(jù)庫以便確定是否有任何所述發(fā)現(xiàn)的服務正在所述給定設(shè)備上運行的裝置,并且其中所述警告裝置可操作來產(chǎn)生警告以提供通知,用于表明被發(fā)現(xiàn)正在所述給定設(shè)備上運行的每個所發(fā)現(xiàn)的服務已經(jīng)受到了在所述給定設(shè)備上所檢測到的所述故障的影響。
30.如權(quán)利要求21至29中任一項所述的裝置,其中所述警告被發(fā)送到所述指定設(shè)備的所述操作者。
31.一種包括程序代碼裝置的計算機程序,當所述程序在計算機上運行時,所述程序代碼裝置適于執(zhí)行如權(quán)利要求1至10中任一項所述的方法。
全文摘要
提供了一種用于報告由節(jié)點和網(wǎng)絡(luò)故障或停歇所引起的對網(wǎng)絡(luò)中的服務的影響的方法和裝置。作為一種方法,向所指定的網(wǎng)絡(luò)設(shè)備的操作者提供關(guān)于網(wǎng)絡(luò)故障對與所指定的設(shè)備相關(guān)聯(lián)地運行的一個或多個服務的影響的通知。所述方法包括步驟發(fā)現(xiàn)在所述網(wǎng)絡(luò)中的分別被連接到所述指定設(shè)備以便幫助執(zhí)行預期任務的一個或多個設(shè)備,繼而發(fā)現(xiàn)被配置為在同樣支持任務執(zhí)行的每個所發(fā)現(xiàn)的設(shè)備上運行的每個服務。所述方法進一步包括以預先指定的間隔來監(jiān)視各個發(fā)現(xiàn)的設(shè)備的狀態(tài),以便檢測在網(wǎng)絡(luò)中故障的出現(xiàn)。當檢測到故障時,產(chǎn)生用于表明所檢測到的故障對各個所發(fā)現(xiàn)的服務的影響的警告。
文檔編號H04L12/26GK101032123SQ200580033012
公開日2007年9月5日 申請日期2005年9月28日 優(yōu)先權(quán)日2004年9月30日
發(fā)明者卡羅斯·C.·阿勞約, 詹姆斯·H.·卡雷, 約漢·丁格, 保羅·塔西羅 申請人:國際商業(yè)機器公司