亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

故障通知方法

文檔序號:6632753閱讀:270來源:國知局
專利名稱:故障通知方法
技術領域
本發(fā)明涉及大規(guī)模計算機系統(tǒng)中的通信故障,尤其涉及劃成分區(qū)的大規(guī)模計算機系統(tǒng)中通報故障的技術。
背景技術
近來,大規(guī)模計算機系統(tǒng)包含多個單元,并且構成這些系統(tǒng)的多個單元被配置成通過分隔成每個計算機或劃成分區(qū)的計算機(分區(qū)是作為系統(tǒng)一部分的單元,但能獨立地運行),來靈活地響應負載狀態(tài)。
例如,圖1所示的系統(tǒng)配置是一個可行的例子。
圖1的系統(tǒng)由多個單元A101,102,103,104(101-104)和用于控制每個A101-104單元的B2單元組成。通過象A3分區(qū)和B4分區(qū)所表示的分區(qū)方式,各個單元A被分區(qū)分開。單元A101-104和單元B2的配置是通過總線(總線A5,總線B6,總線C7和總線D8互連),從而交換必要的信息。
通過配置在單元B2中的、從單元A101-104經(jīng)信號線SIG-A9連接的故障檢測電路10,單元B2能識別出每個單元A101-104的狀態(tài)。此外,單元B2包括選擇電路11和合并電路12,并發(fā)送請求信息(將要被執(zhí)行的處理),該請求信息不能通過總線A5在單元A101-104內(nèi)部解決。并且選擇電路11選擇從各個單元A101-104發(fā)送的其中一條請求信息,并通過總線B6向每個單元A101-104廣播選擇的請求信息。
接著,基于該信息,合并電路12在預定的定時通過總線C7接收從單元A101-104發(fā)送到單元B2的信息,產(chǎn)生每個單元A101-104的發(fā)送信息,并通過總線D8發(fā)送產(chǎn)生的信息。
單元A101-104的內(nèi)部的結構如圖2和圖3所示。圖2所示的結構包含多個CPU13,一個北橋14(其將CPU與單元B2互連)和連接到北橋14的內(nèi)存15。
圖3所示的配置包含IO16,外圍設備的接口電路例如局域網(wǎng)卡和一個用于將IO和單元B2互連的I/O主橋17。
在具有如上所述的配置的系統(tǒng)中,當在一個單元出現(xiàn)故障時,需要將故障通知給構成分區(qū)的所有單元并立即停止操作。作為用于向其他單元通知故障的方法,曾經(jīng)提出一種通過專用信號線互連所有單元的通知方法。而且,作為另一種故障通知方法,曾經(jīng)提出通過包(packet)等通知故障的方法。
根據(jù)專利文獻1,提出在由多個設備構成的信息處理器設備中,當一設備產(chǎn)生停止信號時,該信號被傳送到其他設備。當其他設備接收到停止信號時,執(zhí)行關于預定程序的操作。
根據(jù)專利文獻2,提出同時停止處理器(不管處理器在執(zhí)行什么處理,使用具有最高優(yōu)先級的不可屏蔽中斷停止所有的處理器)有助于故障分析。
根據(jù)專利文件獻3,當處理器中出現(xiàn)故障時,錯誤信息來標記該狀態(tài)。在該處理器中的微處理器從該狀態(tài)讀取錯誤信息,基于該信息通過產(chǎn)生代碼來編碼,保持該狀態(tài)并存儲它。錯誤信息及其被保持和編碼的狀態(tài)被寫入,然后通過中斷信號通知其他處理器。當通過機器檢查中斷(halt)來停止微處理器時,根據(jù)該中斷來執(zhí)行編碼,保持該狀態(tài),并通過中斷信號將其發(fā)送給其它處理器。通過讀取通知方處理器的狀態(tài)保持性(status retention),接收到通知的處理器獲得發(fā)送過通知的處理器的故障情況。
根據(jù)專利文獻4,提出每個節(jié)點的故障信息從相同分區(qū)的一個或多個故障節(jié)點獲取,根據(jù)該信息執(zhí)行故障處理,并且可疑部分的詳細說明(specification)和故障處理被精確及時地執(zhí)行。
然而,在大規(guī)模計算機系統(tǒng)中,通過專用信號線將所有單元之間互連的通知方法導致了成本的增加,因為需要每個單元存儲所有其它單元的分區(qū)信息并且隨之在試圖通過配置多個分區(qū)來提高系統(tǒng)的可用性時增加了連接信號線。
而且,利用包通知故障的方法,如果故障通知包從故障單元到相同分區(qū)的所有其它單元一個接一個地執(zhí)行故障通知,就不能確保分區(qū)的立即和同時停止。例如,在包發(fā)送電路的故障或諸如單元電源故障的嚴重故障的情況,該故障單元不能發(fā)送故障通知包,因此構成該分區(qū)的其它單元不能立即停止。
專利文獻1,2和3沒有任何與大規(guī)模計算機系統(tǒng)相關的故障通知的描述,也沒有考慮系統(tǒng)引入分區(qū)的系統(tǒng)的故障通知控制。特別地,專利文獻件3描述了構成系統(tǒng)的單元中處理器之間通知故障的方法;然而沒有考慮到為每個單元配置分區(qū)的情況。
根據(jù)專利文獻4,為了對在一個分區(qū)的一部分中發(fā)生故障的該分區(qū)執(zhí)行所有的停止處理,通過服務處理器和管理工具,執(zhí)行來自個別單元的故障通知和停止處理。故障出現(xiàn)之后,需要花費一些時間去停止,因此在該時間段受到故障單元的影響將出現(xiàn)錯誤的操作和數(shù)據(jù)破壞等。而且,沒有考慮嚴重故障的情況也存在問題。
專利文獻1日本特許公開No.55-121566專利文獻2日本特許公開No.02-165367專利文獻3日本特許公開No.03-084640專利文獻4日本特許公開No.2004-62535(US2004/0153888)發(fā)明內(nèi)容本發(fā)明的目的是提供一種通信方法,用于在沒有服務處理器(例如軟件處理)的情況下,在某部分出現(xiàn)故障時通過啟動立即停止處理(例如,硬件停止硬停止)來立即停止處理。
根據(jù)本發(fā)明,在計算機的故障通知方法中,包括被分區(qū)分隔的多個單元A和與多個單元A互連的單元B,其中該單元B向多個單元A廣播相同的信息(該信息是根據(jù)從多個單元A傳送到單元B的信息產(chǎn)生的),當故障出現(xiàn)在一個單元A中時,將所述信息作為故障信息向該單元B進行通知,且單元B接收該故障信息,根據(jù)該故障信息產(chǎn)生相同的故障信息并向正常情況下的多個單元A通知相同的故障信息,然后在多個單元A接收到相同的故障信息后,如果它來自屬于相同分區(qū)的一個單元A,屬于相同分區(qū)的多個單元A的操作被立即停止,并且如果它來自屬于上述相同分區(qū)之外的分區(qū)的一個單元A,多個單元A的操作繼續(xù)。
而且根據(jù)本發(fā)明,在計算機的故障通知方法中,包括被分區(qū)分隔的多個單元A和與多個單元A互連的單元B,其中該單元B向多個單元A廣播相同的信息(該信息是根據(jù)從多個單元A傳送到單元B的信息產(chǎn)生的),當在信息不能從一個單元A通知到單元B的嚴重故障中時,采用除該傳送以外的其它方式將嚴重故障通知作為嚴重故障信息向該單元B進行通知,并且該單元B接收該嚴重故障信息,根據(jù)該嚴重故障信息產(chǎn)生相同的嚴重故障信息并將相同的嚴重故障信息傳送到在正常情況下的多個單元A,然后在多個單元A接收到相同的嚴重故障信息之后,如果它來自屬于相同分區(qū)的一個單元A,屬于相同分區(qū)的多個單元A的操作被立即停止,并且如果它來自屬于所述相同分區(qū)之外的分區(qū)的一個單元A,多個單元A的操作繼續(xù)。
另外,根據(jù)本發(fā)明,計算機(其包含多個被分區(qū)分隔的單元A和與多個單元A互連的單元B,且其中該單元B向多個單元A廣播相同的信息,該信息是根據(jù)從多個單元A傳送到單元B的信息產(chǎn)生的)包括通知電路,其當故障出現(xiàn)在一個單元A中時將作為該信息的故障信息向該單元B進行通知;合并電路,用于接收故障信息,根據(jù)該故障信息產(chǎn)生相同的故障信息,并通知給在正常情況下的多個單元A;以及控制電路,其用于在多個單元A接收到相同的故障信息后,如果它來自于屬于相同分區(qū)的一個單元A,立即停止包含在相同分區(qū)的多個單元A的操作,并且如果它來自于屬于所述相同分區(qū)之外的分區(qū)的一個單元A,繼續(xù)該操作。
理想地,該合并電路具有這樣的配置,其用于根據(jù)該故障信息字段的內(nèi)容產(chǎn)生相同故障信息字段,并使除了該故障信息和該相同故障信息之外的字段無效。
進而,根據(jù)本發(fā)明,計算機(其包括多個被分區(qū)分隔的單元A和與多個單元A互連的單元B,其中該單元B向多個單元A廣播相同的信息,該信息是根據(jù)從多個單元A傳送到單元B的信息產(chǎn)生的)包括故障檢測電路,其具有互連線用于確認多個單元A和單元B之間的單元A的狀態(tài),當一個單元A不能向單元B通知故障時,該故障檢測電路用于通過互連線接收嚴重故障通知并將嚴重故障作為嚴重故障信息進行通知;合并電路,用于接收該嚴重故障信息,根據(jù)該嚴重故障信息產(chǎn)生相同的嚴重故障信息,并用于向正常情況下的多個單元A通知該相同的嚴重故障信息;以及這樣的電路,用于在多個單元A接收到相同的嚴重故障信息后,如果它來自于屬于相同分區(qū)的一個單元A,立即停止包含在相同分區(qū)的多個單元A的操作,并且如果它來自于屬于所述相同分區(qū)之外的分區(qū)的一個單元A,繼續(xù)該操作。
優(yōu)選地,該合并電路具有這樣的配置,用于根據(jù)該嚴重故障信息字段的內(nèi)容產(chǎn)生相同的嚴重故障信息字段,并使除了該故障信息和該相同故障信息之外的字段無效。
通過上面的配置,當故障發(fā)生時能夠執(zhí)行相同分區(qū)中的單元的立即硬停止。當嚴重故障發(fā)生時,也能夠執(zhí)行相同分區(qū)中的單元的立即硬停止。
本發(fā)明使由故障引起的錯誤操作和數(shù)據(jù)破壞最小化,提高了該系統(tǒng)的可靠性并在不用增加確保高可靠計算機系統(tǒng)的信號線的低成本情況下實現(xiàn)了立即停止處理。


圖1描述了計算機配置的一個例子;圖2示出單元A(CPU單元)配置的一個例子;圖3示出單元A(I/O單元)配置的一個例子;圖4描述了實施例1的故障通知方法的配置;圖5是實施例1的故障通知方法操作的流程圖;圖6描述了實施例2的故障通知方法的配置;圖7是實施例2的故障通知方法操作的流程圖;圖8是示出總線C數(shù)據(jù)結構的示意圖;以及圖9是示出總線D數(shù)據(jù)結構的示意圖。
具體實施例方式
在下面的描述中,參照附圖對本發(fā)明的實施例的細節(jié)進行闡述。
(實施例1)圖4中的系統(tǒng)包含多個單元A和用于控制每個單元A的單元B2。
在分區(qū)A3的組中或分區(qū)B4的組中分隔單元A;然而單元A103可以是分區(qū)A3的一部分或者分區(qū)B4的一部分。
結合附圖提供本發(fā)明的優(yōu)選實施例的說明。圖4是描述本發(fā)明實施例的計算機(大規(guī)模計算機系統(tǒng))的圖。
通常,被每個分區(qū)分隔的每個單元A通過總線A5(例如本地請求總線)與單元B2交互,并將在單元A中不能解決的請求發(fā)送到單元B2(圖4所示的(1)′信息發(fā)送)。
并且,通過總線B6(例如,全局存儲地址總線),由選擇電路11接收到的請求被廣播到其他單元A(圖4中的(2)向分區(qū)的請求發(fā)送)。
然而,當在單元C101(A)中檢測到故障時,故障單元C101利用總線C7在預定的定時向單元B2發(fā)送故障通知(這是圖4中的(3)′故障通知或(3)正常通知。在無故障發(fā)生時則是正常通知)。
單元B2確定通過總線C7接收到的信息(包)中的故障信息,并通過總線D8向每個單元C101和單元A102-104發(fā)送同樣的信息(圖4中是向分區(qū)(4)的通知)。
與故障單元A構成相同分區(qū)A3的單元A根據(jù)在總線D8中接收到的故障信息停止操作。分區(qū)B4中的單元A,雖然接收到故障信息(比如錯誤通知),還是繼續(xù)該操作,忽略該故障信息(圖4中(5-1)、(5-2)、(5-3)、(5-4)的操作)。
下一步,參照圖5中的流程圖,解釋在分區(qū)A3的單元C101(相當于單元A)中檢測到故障的情形實例。
步驟S21執(zhí)行系統(tǒng)的正常操作并發(fā)布請求(信息發(fā)送(1)′)。
在步驟S22中,選擇電路11接收從每個單元A發(fā)送的請求,并向每個分區(qū)(2)中的單元A廣播所選請求。S21和S22是(3)實現(xiàn)正常操作的狀態(tài)。
如果圖4中的單元C101發(fā)生故障,那么,在步驟S23中,在分區(qū)A3中的單元C101中出現(xiàn)的故障被檢測到(圖4中的(1)故障檢測)。然后,啟動向單元B2通知故障檢測的準備。
在步驟S24中,分區(qū)A3和B4到B2的所有單元A向單元B2通知信息(3)、(3)′、(3)″。在本實例中,來自故障單元C101的故障通知被加入到用于通知的信息(包)中。來自沒有故障的單元A102、103的正常信息通知被執(zhí)行。此時,由總線C7執(zhí)行通知,并且上述故障通知例如在對包建立一中斷狀態(tài)字段(以后描述)并加入嚴重故障信息之后被傳送。
在步驟S25中,合并電路12接收通過總線C7傳送的信息(包)(3)、(3)′、(3)″,并通過總線D8通知故障發(fā)生。在本實例中,故障出現(xiàn)在單元C101中。因此,為了使在分區(qū)A3中包含的每個單元A識別故障,產(chǎn)生相同的故障信息,并且總線D8向每個單元A通知合并電路12的結果。但是,此時包含在分區(qū)A3中的單元A104沒有反應。
在步驟S26中,當分區(qū)A3中的每個單元A通過相同的故障信息識別故障時,操作被停止。分區(qū)B4忽略分區(qū)A3中的故障而繼續(xù)執(zhí)行操作。
在本實例中,通過總線D8向分區(qū)A3和B4通知由合并電路12產(chǎn)生的相同故障通知信息。分區(qū)A3中的接收到相同故障信息的每個單元A通過合并電路產(chǎn)生的相同故障信息識別該故障,并停止操作(5-1)、(5-2)。在另一分區(qū)B4的單元A1忽略故障通知并繼續(xù)該操作(5-3)、(5-4)。
根據(jù)上面的配置,不向管理處理器通知中斷,不執(zhí)行日志恢復和重啟處理,并且,當故障發(fā)生時,不需要來自管理處理器的指令;因此,能夠執(zhí)行產(chǎn)生故障的相同分區(qū)中的單元的立即硬停止。
(實施例2)圖4中的系統(tǒng)包括多個單元A和用于控制每個單元A的單元B2。在分區(qū)A3的組中或分區(qū)B4的組中分隔單元A;然而單元A103可以是分區(qū)A3的一部分或分區(qū)B4的一部分。
在圖6中,說明一種嚴重故障通知的方法。當在單元D102(A)中檢測到故障,并且該故障很嚴重以至于總線C7不能被使用時,故障單元D102使用SIG-A9并向單元B2通知該故障單元D102被邏輯上分隔。這里,SIG-A9是使單元B2識別出單元D102的狀態(tài)的信號線(互連線)。
接著,單元B2通過SIG-A9識別出現(xiàn)在單元D102中的嚴重故障。該單元B2在故障單元D102需要利用總線C7傳送故障信息的定時,傳遞并識別嚴重故障信息給合并電路12而不是故障單元D102。
根據(jù)被通知的嚴重故障信息,產(chǎn)生相同嚴重故障信息,并且單元B2利用總線D8向每個單元A發(fā)送相同嚴重故障信息。根據(jù)總線D8(5-1),(5-2)收到的嚴重故障信息,與故障檢測單元D102構成相同分區(qū)的單元A停止操作。在不同分區(qū)的單元A忽略總線D8接收到的嚴重故障信息并繼續(xù)操作(5-3),(5-4)。
接著,參照圖7所示的流程圖給出出現(xiàn)嚴重故障的情況說明。
步驟S41實現(xiàn)正常系統(tǒng)的操作并發(fā)布請求(用于信息發(fā)送(1)′)。
在步驟S42中,選擇電路11接收從每個單元A發(fā)送的請求,并向每個分區(qū)(2)的單元A廣播所選擇的請求。S41和S42處于執(zhí)行正常操作的狀態(tài)。
當出現(xiàn)嚴重故障,如圖6所示,在步驟S43中,分區(qū)A3的單元D102開始準備檢測和通知該嚴重故障。
步驟S44通過SIG-A9從單元D102向單元B2執(zhí)行嚴重故障通知。SIG-A9通過檢查單元A是否被分隔來確認單元A是否邏輯存在。
在步驟S45中,通過包含在單元B2中的故障檢測電路10,確認分區(qū)A3的單元D102陷入嚴重的故障(2)″。這里,故障檢測電路10被一個接一個連接到每個單元A,并當出現(xiàn)嚴重故障時,準備向合并電路12發(fā)出嚴重故障通知。
步驟46向單元B2通知來自分區(qū)A3和B4中所有的單元A的信息(3)、(3)′、(3)″。在本實例中,嚴重故障通知被加到信息中,并通過SIG-A9和故障檢測電路10向單元D102的合并電路12通知在哪發(fā)生了嚴重故障。來自沒有發(fā)生故障的單元A1的正常信息被通知。這時,通過總線C7進行通知。上述嚴重故障通知例如在對包建立中斷狀態(tài)字段(以后描述)并加入嚴重故障信息之后被發(fā)送。
在步驟S47中,合并電路12接收通過總線C7(3)、(3)′、(3)″發(fā)送的信息并通過總線D8通知故障出現(xiàn)。在該實例中,嚴重故障出現(xiàn)在單元D102中。因此同樣的嚴重故障信息(其用于使包含在分區(qū)A3中的每個單元A識別該嚴重故障)在該合并電路12中產(chǎn)生,并且總線D8通知每個單元A合并電路12的產(chǎn)生結果。
在步驟48中,當分區(qū)A3中的單元A識別出發(fā)生了嚴重故障的時候,分區(qū)A3中的單元A立即停止。其他分區(qū)忽略分區(qū)A3中產(chǎn)生的故障并繼續(xù)操作。
在該實例中,向分區(qū)A3和B4通知合并電路12產(chǎn)生的相同嚴重故障通知信息。接收到相同嚴重故障信息的分區(qū)A3中的每個單元A1識別該故障并停止操作(5-1),(5-2)。在另一分區(qū)B4中的單元A忽略故障通知并繼續(xù)操作(5-3),(5-4)。
即使當發(fā)生嚴重的故障時,上述配置也允許與發(fā)生故障的故障單元相同的分區(qū)中的單元的立即硬停止。
下面,說明上述總線C7和總線D8上傳輸?shù)男畔?包)。圖8示出總線C的數(shù)據(jù)結構的例子。
通過總線C7發(fā)送的信息包括這些字段,例如V有效。T目標命中,ABTST中斷狀態(tài),CST緩存狀態(tài),STBNUM存儲緩存號。
這里,V有效是表明該包是有效或無效的標志。T目標命中表明雙內(nèi)嵌內(nèi)存模塊(dimm)命中是否存在。ABTST中斷狀態(tài)通知重試通知或錯誤通知。CST緩存狀態(tài)表明緩存的狀態(tài)。STBNUM存儲表明雙內(nèi)嵌內(nèi)存模塊被寫入哪里的緩存號。
圖9示出通過總線D發(fā)送的信息的數(shù)據(jù)字段結構的例子??偩€D例如包括V,T,CST(如總線C7的情況一樣),并且從Board_IdBoard_Id和INVCNT無效計數(shù)等配置。
Board_Idboard_Id表明單元A的板(board)號。INVCNT無效計數(shù)表明共享命中的號碼。
當傳送故障通知時,一個值被添加到ABTST。因此,當發(fā)生故障時,總線C7的其他字段和總線D8的其他字段變得沒有意義。
例如,在總線C 7的情形,ABSTST=111的CHKSTP(故障)在故障發(fā)生時被通知。這時,其他字段無效。正常情況下ABTST=000。
在總線C8的情形,ABSTST=111的CHKSTP在故障發(fā)生時被廣播,并且檢查是否是自己的分區(qū)。該檢查在接收單元A側被執(zhí)行(例如,檢查可在預定的定時執(zhí)行)。
當SIG-A9通知嚴重故障時,也設置ABTST=111。
接著,通過總線C7將來自每個單元A的信息傳送到合并電路12??偩€D8的信息從傳送的信息中產(chǎn)生。然而錯誤傳輸?shù)腁BTST=111具有最高優(yōu)先級,因此,雖然從別的總線C7通知正常信息,總線D8的ABTST也被設置成111并被廣播。并向所有單元A進行錯誤通知。
由于許多故障檢測被持續(xù)檢查,難以精確確定何時檢測到故障;然而,當發(fā)布請求(1)’之后的(3)、(3)′、(3)″的結果通知時,故障通知被產(chǎn)生并且被插入。因此,只要故障在(3)、(3)′、(3)″前被檢測到,就可以插入故障通知。
本發(fā)明不僅局限于明上面描述的實施例,不脫離本發(fā)明的范圍,可進行各種改進和改型。
權利要求
1.一種計算機的故障通知方法,包括由分區(qū)分隔的多個單元A和與單元A互聯(lián)的單元B,其中單元B向多個單元A廣播基于從多個單元A傳送到單元B的信息所產(chǎn)生的相同信息,其中當在一個單元A中發(fā)生故障時,將所述信息作為故障信息向單元B進行通知,單元B接收該故障信息,根據(jù)該故障信息產(chǎn)生相同故障信息并向正常情況下的多個單元A通知該相同故障信息,以及在多個單元A接收到該相同故障信息之后,如果該相同故障信息來自于屬于相同分區(qū)的一個單元A,則屬于相同分區(qū)的多個單元A的操作被立即停止,而如果該相同故障信息來自于屬于所述相同分區(qū)之外的分區(qū)的一個單元A,則多個單元A的操作繼續(xù)。
2.如權利要求1所述的計算機的故障通知方法,其中,在所述信息不能從所述的一個單元A通知到單元B的嚴重故障情況下由單元A采用除該傳送以外的其它方式將嚴重故障通知作為嚴重故障信息向單元B進行通知,單元B接收該嚴重故障信息,根據(jù)該嚴重故障信息產(chǎn)生相同嚴重故障信息并向正常情況下的多個單元A通知該相同嚴重故障信息;以及在多個單元A接收到該相同嚴重故障信息之后,如果該相同故障信息來自于屬于相同分區(qū)的一個單元A,則屬于相同分區(qū)的多個單元A的操作被立即停止,并且如果該相同故障信息來自于屬于所述相同分區(qū)之外的分區(qū)的一個單元A,則多個單元A的操作繼續(xù)。
3.一種計算機,包括由分區(qū)隔離的多個單元A和與單元A互聯(lián)的單元B,其中單元B向多個單元A廣播基于從多個單元A傳送到單元B的信息產(chǎn)生的相同信息,其中該計算機包括通知電路,當一個單元A發(fā)生故障時用于向單元B通知作為所述信息的故障信息;合并電路,其用于接收該故障信息,根據(jù)該故障信息產(chǎn)生相同故障信息,并通知在正常情況下的多個單元A;以及控制電路,其用于在多個單元A接收到相同故障信息后,如果該相同故障信息來自于屬于相同分區(qū)的一個單元A,則立刻停止包含在相同分區(qū)的多個單元A的操作,并且如果該相同故障信息來自于屬于所述相同分區(qū)之外的分區(qū)的一個單元A,則繼續(xù)該操作。
4.如權利要求3所述的計算機,其中該合并電路根據(jù)該故障信息字段的內(nèi)容產(chǎn)生該相同故障信息的字段,并使除了該故障信息和該相同故障信息以外的字段無效。
5.一種計算機,包括由分區(qū)分隔的多個單元A和與單元A互聯(lián)的單元B,其中單元B向多個單元A廣播基于從多個單元A傳送到單元B的信息產(chǎn)生的相同信息,其中該計算機包括故障檢測電路,其具有用于確認多個單元A和單元B之間的多個單元A的狀態(tài)的互連線,當不能從一個單元A向單元B通知故障時,該故障檢測電路用于通過該互連線接收嚴重故障通知并將該嚴重故障作為嚴重故障信息進行通知;合并電路,其用于接收該嚴重故障信息,根據(jù)該嚴重故障信息產(chǎn)生相同嚴重故障信息,并向正常情況下的多個單元A通知該相同嚴重信息;以及電路,其用于在多個單元A接收到該相同嚴重故障信息后,如果該相同嚴重故障信息來自于屬于相同分區(qū)的一個單元A,則立刻停止包含在相同分區(qū)的多個單元A的操作,并且如果該相同嚴重故障信息來自于所述相同分區(qū)之外的分區(qū)的一個單元A,則繼續(xù)該操作。
6.如權利要求5所述的計算機,其中該合并電路根據(jù)該嚴重故障信息字段的內(nèi)容產(chǎn)生該相同嚴重故障信息的字段,并使除了該故障信息和該相同故障信息以外的字段無效。
全文摘要
本發(fā)明提供一種故障通知方法,具體提供一種用于檢測故障和執(zhí)行立即停止處理的通信方法。它是一種計算機的故障通知方法,該計算機包含被分區(qū)分隔的多個單元A和與多個單元A互連的單元B,其中單元B向多個單元A廣播基于從多個單元A傳送到單元B的信息產(chǎn)生的相同信息,其中當一個單元A中發(fā)生故障時,向該單元B通知故障信息,該單元B接收該故障信息,根據(jù)該故障信息產(chǎn)生相同故障信息并向正常情況下的多個單元A通知該相同故障信息,并且多個單元A接收該相同故障信息,如果它來自屬于相同分區(qū)的一個單元A,則屬于相同分區(qū)的多個單元A的操作被立即停止,否則多個單元A的操作繼續(xù)。
文檔編號G06F15/16GK1834926SQ20051008707
公開日2006年9月20日 申請日期2005年7月26日 優(yōu)先權日2005年3月18日
發(fā)明者川原茂, 木下孝行, 絲澤慎太郎, 細江廣治, 佐藤作太郎 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1