判定服務(wù)節(jié)點狀態(tài)的方法
【專利摘要】本發(fā)明提供一種判定服務(wù)節(jié)點狀態(tài)的方法,適用于數(shù)據(jù)平行運算架構(gòu)中。所述方法包含下列步驟:第一服務(wù)節(jié)點通過第一數(shù)據(jù)通信接口連接第二服務(wù)節(jié)點;利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第一連接信息;當?shù)谝贿B接信息代表第一服務(wù)節(jié)點與第二服務(wù)節(jié)點之間無法連接時,第一服務(wù)節(jié)點通過第二數(shù)據(jù)通信接口連接第二服務(wù)節(jié)點;以及利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第二連接信息,進而判定第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序,以避免耗費大量等待時間。
【專利說明】判定服務(wù)節(jié)點狀態(tài)的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明關(guān)于一種判定服務(wù)節(jié)點狀態(tài)的方法,特別是應(yīng)用在一種數(shù)據(jù)平行運算架構(gòu)中。
【背景技術(shù)】
[0002]目前,巨量數(shù)據(jù)平行運算架構(gòu)如Hadoop是實現(xiàn)大數(shù)據(jù)(bigdata)的平行及分散運算中最常見的平臺,處于以多個服務(wù)節(jié)點如伺服器所構(gòu)成的群組環(huán)境中,當進行數(shù)據(jù)(如應(yīng)用程序)的平行及分散運算時,多個服務(wù)節(jié)點間必須要互相等待,互相判定每個服務(wù)節(jié)點是否逾時而未反應(yīng),故需要有判定服務(wù)節(jié)點之間連線是否逾時或某個服務(wù)節(jié)點故障(當機)的方法。
[0003]參考圖1,一種現(xiàn)有數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖,數(shù)據(jù)平行運算架構(gòu)100包括第一服務(wù)節(jié)點10與第二服務(wù)節(jié)點20之間通過網(wǎng)絡(luò)通信接口 15如TCP/IP通信接口進行連接,第一服務(wù)節(jié)點10與第二服務(wù)節(jié)點20可以是伺服器。一般而言,每兩個服務(wù)節(jié)點之間會協(xié)定重新連接次數(shù)(如2次)與每兩次重新連接之間的預(yù)設(shè)等待時間。當達到重新連接次數(shù)的上限而仍然沒有得到回應(yīng)時,第一服務(wù)節(jié)點10才會得到逾時(Timeout)信號。然而,因為每一個服務(wù)節(jié)點如第二服務(wù)節(jié)點20的處理器可能因為忙碌而無法回應(yīng),以致預(yù)設(shè)等待時間都會設(shè)定為數(shù)分鐘,但在Hadoop此類大量運算的節(jié)點群組架構(gòu)中,只要其中任一服務(wù)節(jié)點故障(當機),就需等待到達重新連接次數(shù)的上限以及每兩次重新連接之間的預(yù)設(shè)等待時間,才能夠判定服務(wù)節(jié)點故障(當機),故而需要耗費大量的等待時間。
[0004]參考圖2,另一現(xiàn)有數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖,其與圖1所示的架構(gòu)圖區(qū)別在于:圖2中數(shù)據(jù)平行運算架構(gòu)200的第一服務(wù)節(jié)點10與第二服務(wù)節(jié)點20之間額外設(shè)置交換器30,例如常見的ARISTA網(wǎng)絡(luò)交換器,這使每一服務(wù)節(jié)點10,20之間不直接互連,而是各別先連接交換器30。當某一服務(wù)節(jié)點10或20故障(當機)時,交換器30會送出合乎TCP/IP通信接口規(guī)范的重置信號告知欲連到故障(當機)的服務(wù)節(jié)點的其他服務(wù)節(jié)點,讓其他服務(wù)節(jié)點不需要等待便可知道故障(當機)的服務(wù)節(jié)點的狀態(tài),進而連接別的服務(wù)節(jié)點,但其缺點在于需要額外設(shè)置交換器30,會增加建置成本。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種判定服務(wù)節(jié)點狀態(tài)的方法,適用在數(shù)據(jù)平行運算架構(gòu)(如Hadoop)中,能避免現(xiàn)有技術(shù)單純使用TCP/IP通信接口確認各服務(wù)節(jié)點是否故障以致耗費過長等待時間(包括重新連接的次數(shù)與每兩次重新連接之間的預(yù)設(shè)等待時間)的問題;同時,本發(fā)明無需在數(shù)據(jù)平行運算架構(gòu)中額外設(shè)置交換器,故能降低建置交換器的硬件成本。
[0006]為了達成上述目的,本發(fā)明提供一種判定服務(wù)節(jié)點狀態(tài)的方法,適用于一種數(shù)據(jù)平行運算架構(gòu)中,架構(gòu)包含第一服務(wù)節(jié)點與第二服務(wù)節(jié)點,第一服務(wù)節(jié)點包含第一處理器與第一基板管理控制器,以及第二服務(wù)節(jié)點包含第二處理器與第二基板管理控制器。
[0007]本發(fā)明提供的一種判定服務(wù)節(jié)點狀態(tài)的方法包括下列步驟:首先,第一服務(wù)節(jié)點通過第一數(shù)據(jù)通信接口連接第二服務(wù)節(jié)點。接著,利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第一連接信息。接著,當?shù)谝贿B接信息代表第一服務(wù)節(jié)點與第二服務(wù)節(jié)點之間無法連接時,第一服務(wù)節(jié)點通過第二數(shù)據(jù)通信接口連接第二服務(wù)節(jié)點。接著,利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第二連接信息,進而判定第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序,避免耗費大量等待時間。
[0008]在一優(yōu)選實施例中,數(shù)據(jù)平行運算架構(gòu)為Hadoop。
[0009]在一優(yōu)選實施例中,第一數(shù)據(jù)通信接口為TCP/IP通信接口。
[0010]在一優(yōu)選實施例中,在利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第一連接信息的步驟中進一步包括:第一服務(wù)節(jié)點判定第一連接信息是否為逾時信息,逾時信息用于顯示第一服務(wù)節(jié)點與第二服務(wù)節(jié)點之間的一次性連接已超過預(yù)設(shè)的等待時間。
[0011 ] 在一優(yōu)選實施例中,第二數(shù)據(jù)通信接口為符合智能平臺管理接口規(guī)范的數(shù)據(jù)通信接口。以及第一服務(wù)節(jié)點通過第二數(shù)據(jù)通信接口連接第二服務(wù)節(jié)點的步驟進一步包括:第一服務(wù)節(jié)點的第一基板管理控制器通過第二數(shù)據(jù)通信接口至第二服務(wù)節(jié)點的第二基板管理控制器進而判定第二服務(wù)節(jié)點的第二處理器是否處于運行狀態(tài)。
[0012]在一優(yōu)選實施例中,利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第二連接信息的步驟進一步包括:利用第一服務(wù)節(jié)點的第一基板管理控制器判定從第二服務(wù)節(jié)點的第二基板管理控制器通過第二數(shù)據(jù)通信接口反饋的符合智能平臺管理接口規(guī)范的第二連接信肩、O
[0013]在一優(yōu)選實施例中,利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第二連接信息,進而判定第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序的步驟進一步包括:當?shù)谝环?wù)節(jié)點判定出第二連接信息代表第一服務(wù)節(jié)點與第二服務(wù)節(jié)點之間無法連接及/或第二服務(wù)節(jié)點并非處于運行狀態(tài)時,則判定第二服務(wù)節(jié)點處于已故障的狀態(tài)。
[0014]在上述優(yōu)選實施例中,狀態(tài)對應(yīng)程序包括:使第一服務(wù)節(jié)點中止連接第二服務(wù)節(jié)點。
[0015]在上述優(yōu)選實施例中,狀態(tài)對應(yīng)程序包括:使第一服務(wù)節(jié)點連接數(shù)據(jù)平行運算架構(gòu)中的第三服務(wù)節(jié)點。
[0016]在一優(yōu)選實施例中,利用第一服務(wù)節(jié)點判定從第二服務(wù)節(jié)點反饋的第二連接信息進而判定第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序的步驟進一步包括:當?shù)谝环?wù)節(jié)點判定出第二連接信息代表第二服務(wù)節(jié)點的第二處理器處于高度運算狀態(tài)時,則判定第二服務(wù)節(jié)點處于忙碌狀態(tài)且狀態(tài)對應(yīng)程序包括:使第一服務(wù)節(jié)點進入預(yù)設(shè)的等待程序以等待重新連接第二服務(wù)節(jié)點。
[0017]本發(fā)明的優(yōu)點在于:相較于現(xiàn)有技術(shù),由于本發(fā)明進一步通過智能平臺管理接口連接各服務(wù)節(jié)點的基板管理控制器,能避免單純使用TCP/IP通信接口確認各服務(wù)節(jié)點是否故障所需耗費的等待時間(包括重新連接的次數(shù)與每兩次重新連接之間的預(yù)設(shè)等待時間),特別是在進行大數(shù)據(jù)的運算時,能夠節(jié)省大量的等待時間;同時,本發(fā)明無需在數(shù)據(jù)平行運算架構(gòu)中額外設(shè)置交換器,故能降低建置交換器的硬件成本。
【專利附圖】
【附圖說明】
[0018]圖1,一種現(xiàn)有數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖;
[0019]圖2,另一種現(xiàn)有數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖;
[0020]圖3,本發(fā)明一實施例所述的數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖;
[0021]圖4,本發(fā)明一實施例所述的判定服務(wù)節(jié)點狀態(tài)的方法流程圖。
[0022]【符號說明】
[0023]10,310:第一服務(wù)節(jié)點;15:網(wǎng)絡(luò)通信接口;
[0024]20、320:第二服務(wù)節(jié)點;30:交換器;
[0025]100、200、300:數(shù)據(jù)平行運算架構(gòu);
[0026]311:第一處理器;312:第一基板管理控制器;
[0027]321:第二處理器;322:第二基板管理控制器;
[0028]330:第一數(shù)據(jù)通信接口; 340:第二數(shù)據(jù)通信接口;
[0029]350:第三服務(wù)節(jié)點;
[0030]351:第三處理器;352:第三基板管理控制器;
[0031]S01-S10:步驟。
【具體實施方式】
[0032]以下各實施例的說明是結(jié)合附圖,用以說明本發(fā)明可用以實施的特定實施例。本發(fā)明所提到的方向用語,例如「上」、「下」、「前」、「后」、「左」、「右」、「內(nèi)」、「外」、「側(cè)面」等,僅是參考附圖的方向。因此,使用的方向用語是用以說明及理解本發(fā)明,而非用以限制本發(fā)明。
[0033]參考圖3,本發(fā)明一實施例所述的數(shù)據(jù)平行運算架構(gòu)的架構(gòu)圖。在本實施例中,數(shù)據(jù)平行運算架構(gòu)300包含第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320,第一服務(wù)節(jié)點310包含第一處理器311與第一基板管理控制器312,以及第二服務(wù)節(jié)點320包含第二處理器321與第二基板管理控制器322。本實施例所述的數(shù)據(jù)平行運算架構(gòu)300中,第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320之間的初始連接先采用第一數(shù)據(jù)通信接口 330的方式進行數(shù)據(jù)的傳送/接收,第一數(shù)據(jù)通信接口 330為TCP/IP通信接口或其他現(xiàn)有網(wǎng)絡(luò)通信接口 ;在本實施例中,通過TCP/IP通信接口,每兩個服務(wù)節(jié)點310,320之間僅協(xié)定一次性連接且一次性連接包括預(yù)設(shè)等待時間(如以3分鐘的預(yù)設(shè)等待時間計算,I次x3分鐘=3分鐘的總等待時間)以供判定一次性連接是否逾時,而不同于現(xiàn)有數(shù)據(jù)平行運算架構(gòu)的每兩個服務(wù)節(jié)點之間的連接要達到重新連接次數(shù)的上限(如2次)以及每兩次重新連接之間的預(yù)設(shè)等待時間(如以3分鐘的預(yù)設(shè)等待時間計算,2次x3分鐘=6分鐘的總等待時間)的狀況下,沒有得到回應(yīng)服務(wù)節(jié)點才會得到逾時(Timeout)信號。
[0034]接著,利用第二服務(wù)節(jié)點320通過第一數(shù)據(jù)通信接口 330反饋的符合TCP/IP接口規(guī)范的第一連接信息來判定第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320是否能夠順利連接,其中進一步包括:第一服務(wù)節(jié)點310判定第一連接信息是否為逾時信息,逾時信息用于顯示第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320之間的一次性連接已超過預(yù)設(shè)等待時間(如3分鐘的預(yù)設(shè)等待時間)。
[0035]參考圖3,當?shù)谝环?wù)節(jié)點310從第一連接信息判定出第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320無法順利連接(如逾時)時,不同于現(xiàn)有技術(shù)是持續(xù)通過TCP/IP通信接口重新連接第二服務(wù)節(jié)點320才能最終判定第二服務(wù)節(jié)點320是故障(當機)或是忙碌,本發(fā)明是接著利用第一服務(wù)節(jié)點310通過第二數(shù)據(jù)通信接口 340連接第二服務(wù)節(jié)點320,再由第一服務(wù)節(jié)點310判定從第二服務(wù)節(jié)點320通過第二數(shù)據(jù)通信接口 340反饋的第二連接信息,使第一服務(wù)節(jié)點310判定第二服務(wù)節(jié)點320所處的狀態(tài)為何,如是已故障(當機)狀態(tài)或忙碌狀態(tài),再根據(jù)上述狀態(tài)的判定結(jié)果執(zhí)行狀態(tài)對應(yīng)程序;在本實施例中,第二數(shù)據(jù)通信接口 340為符合智能平臺管理接口(IPMI)規(guī)范的數(shù)據(jù)通信接口,當?shù)谝环?wù)節(jié)點310通過第二數(shù)據(jù)通信接口 340連接第二服務(wù)節(jié)點320時,通過第一服務(wù)節(jié)點310的第一基板管理控制器311通過第二數(shù)據(jù)通信接口 340連接第二服務(wù)節(jié)點320的第二基板管理控制器321以判定第二服務(wù)節(jié)點320的第二處理器322是否處于運行狀態(tài),進而使第二服務(wù)節(jié)點320的第二基板管理控制器321通過第二數(shù)據(jù)通信接口 340反饋符合智能平臺管理接口(IPMI)規(guī)范的第二連接信息,使第一服務(wù)節(jié)點310的第一基板管理控制器311從第二連接信息中判定第二服務(wù)節(jié)點320的第二處理器322所處的狀態(tài)為何(如已故障(當機)狀態(tài)或忙碌狀態(tài))。
[0036]在本實施例中,當?shù)谝环?wù)節(jié)點310判定出從第二服務(wù)節(jié)點320反饋的第二連接信息代表第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320之間無法連接及/或第二服務(wù)節(jié)點320并非處于運行時,則判定第二服務(wù)節(jié)點320的第二處理器322處于已故障的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序,狀態(tài)對應(yīng)程序包括:使第一服務(wù)節(jié)點310中止連接第二服務(wù)節(jié)點320,以及/或者使第一服務(wù)節(jié)點310連接數(shù)據(jù)平行運算架構(gòu)300中的第三服務(wù)節(jié)點350。因為第一服務(wù)節(jié)點310連接到第三服務(wù)節(jié)點350的過程中,與第一服務(wù)節(jié)點310連接到第三服務(wù)節(jié)點350的過程相同,且第三服務(wù)節(jié)點350同樣也包含第三處理器351與第三基板管理控制器352,因此以下不再贅述。
[0037]在另一實施例中,利用第一服務(wù)節(jié)點310判定從第二服務(wù)節(jié)點320反饋的第二連接信息進而判定第二服務(wù)節(jié)點320的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序進一步包括:當?shù)谝环?wù)節(jié)點310判定出從第二服務(wù)節(jié)點320反饋的第二連接信息代表第二服務(wù)節(jié)點320的第二處理器處321于高度運算狀態(tài)時,則判定第二服務(wù)節(jié)點320處于忙碌狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序,且狀態(tài)對應(yīng)程序包括:使第一服務(wù)節(jié)點310進入預(yù)設(shè)的等待程序以等待重新連接第二服務(wù)節(jié)點320。
[0038]參考圖4,本發(fā)明一實施例所述的判定服務(wù)節(jié)點狀態(tài)的方法流程圖,應(yīng)用于如圖3所示的數(shù)據(jù)平行運算架構(gòu)300及其組成元件。以下對本實施例所述的方法所包括的步驟進行說明。
[0039]首先,執(zhí)行步驟S01,使第一服務(wù)節(jié)點310通過第一數(shù)據(jù)通信接口 330連接第二服務(wù)節(jié)點320。
[0040]接著,執(zhí)行步驟S02,第一服務(wù)節(jié)點310通過第一數(shù)據(jù)通信接口 330接收從第二服務(wù)節(jié)點320反饋的第一連接信息。
[0041]接著,執(zhí)行步驟S03,利用第一服務(wù)節(jié)點310判定第一數(shù)據(jù)通信接口 330連接是否逾時以判定第一連接信息是否為逾時信息(判定第一連接信息是否為逾時信息的方法如前述)。若否,執(zhí)行步驟S10,進行第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320之間的數(shù)據(jù)傳輸。
[0042]若判定第一連接信息是逾時信息,即當?shù)谝贿B接信息代表第一服務(wù)節(jié)點與第二服務(wù)節(jié)點之間無法連接時,則執(zhí)行步驟S04,第一服務(wù)節(jié)點310通過第二數(shù)據(jù)通信接口 340連接第二服務(wù)節(jié)點320。第二數(shù)據(jù)通信接口 340為符合智能平臺管理接口(IPMI)規(guī)范的數(shù)據(jù)通信接口。在這個步驟中,第一服務(wù)節(jié)點310的第一基板管理控制器312通過第二數(shù)據(jù)通信接口 340連接第二服務(wù)節(jié)點320的第二基板管理控制器322進而判定第二服務(wù)節(jié)點320的第二處理器321是否處于運行狀態(tài)。
[0043]接著,執(zhí)行步驟S05,第一服務(wù)節(jié)點310接收從第二服務(wù)節(jié)點320反饋的第二連接信息,進而判定第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行狀態(tài)對應(yīng)程序。利用第一服務(wù)節(jié)點310的第一基板管理控制器312判定從第二服務(wù)節(jié)點320的第二基板管理控制器322通過第二數(shù)據(jù)通信接口 340反饋的符合智能平臺管理接口(IPMI)規(guī)范的第二連接信息。
[0044]接著,執(zhí)行步驟S06,根據(jù)第二連接信息判定第二服務(wù)節(jié)點320是否處于運行狀態(tài)。若是,即當?shù)谝环?wù)節(jié)點310判定出第二連接信息代表第二服務(wù)節(jié)點320的第二處理器321處于高度運算狀態(tài)時,則執(zhí)行步驟S07,判定第二服務(wù)節(jié)點320處于忙碌狀態(tài)并執(zhí)行狀態(tài)對應(yīng)程序,使第一服務(wù)節(jié)點310進入預(yù)設(shè)的等待程序以等待重新連接第二服務(wù)節(jié)點320。
[0045]若不是,即當?shù)谝环?wù)節(jié)點310判定出第二連接信息代表第一服務(wù)節(jié)點310與第二服務(wù)節(jié)點320之間無法連接及/或第二服務(wù)節(jié)點320并非處于運行狀態(tài)時,則執(zhí)行步驟S08,判定第二服務(wù)節(jié)點320處于已故障的狀態(tài)并執(zhí)行狀態(tài)對應(yīng)程序,使第一服務(wù)節(jié)點310中止連接第二服務(wù)節(jié)點320。接著,執(zhí)行步驟S09,使第一服務(wù)節(jié)點310連接第三服務(wù)節(jié)點350。
[0046]綜上所述,通過本發(fā)明所述的判定服務(wù)節(jié)點狀態(tài)的方法及數(shù)據(jù)平行運算架構(gòu)(如Hadoop),能避免現(xiàn)有技術(shù)單純使用TCP/IP接口確認各服務(wù)節(jié)點是否故障以致耗費過長等待時間(包括重新連接的次數(shù)與每兩次重新連接之間的預(yù)設(shè)等待時間)的問題;同時,本發(fā)明無需在數(shù)據(jù)平行運算架構(gòu)中額外設(shè)置交換器,故能降低建置交換器的硬件成本。
[0047]以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。
【權(quán)利要求】
1.一種判定服務(wù)節(jié)點狀態(tài)的方法,應(yīng)用于數(shù)據(jù)平行運算架構(gòu),包含一第一服務(wù)節(jié)點與一第二服務(wù)節(jié)點,所述第一服務(wù)節(jié)點包含一第一處理器與一第一基板管理控制器,以及所述第二服務(wù)節(jié)點包含一第二處理器與一第二基板管理控制器,所述方法包含: 所述第一服務(wù)節(jié)點通過一第一數(shù)據(jù)通信接口連接所述第二服務(wù)節(jié)點; 利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的一第一連接信息; 當所述第一連接信息代表所述第一服務(wù)節(jié)點與所述第二服務(wù)節(jié)點之間無法連接時,所述第一服務(wù)節(jié)點通過一第二數(shù)據(jù)通信接口連接所述第二服務(wù)節(jié)點;以及 利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的一第二連接信息,進而判定所述第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行一狀態(tài)對應(yīng)程序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)平行運算架構(gòu)為Hadoop。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一數(shù)據(jù)通信接口為TCP/IP通信接□。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的所述第一連接信息的步驟中進一步包括,利用所述第一服務(wù)節(jié)點判定所述第一連接信息是否為一逾時信息,所述逾時信息用于顯示所述第一服務(wù)節(jié)點與所述第二服務(wù)節(jié)點之間的一次性連接已超過一預(yù)設(shè)的等待時間。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二數(shù)據(jù)通信接口為一符合智能平臺管理接口規(guī)范的數(shù)據(jù)通信接口,以及所述第一服務(wù)節(jié)點通過所述第二數(shù)據(jù)通信接口連接所述第二服務(wù)節(jié)點的步驟進一步包括:所述第一服務(wù)節(jié)點的第一基板管理控制器通過所述第二數(shù)據(jù)通信接口連接所述第二服務(wù)節(jié)點的第二基板管理控制器進而判定所述第二服務(wù)節(jié)點的所述第二處理器是否處于運行狀態(tài)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的所述第二連接信息的步驟進一步包括:利用所述第一服務(wù)節(jié)點的所述第一基板管理控制器判定從所述第二服務(wù)節(jié)點的第二基板管理控制器通過所述第二數(shù)據(jù)通信接口反饋的一符合智能平臺管理接口規(guī)范的所述第二連接信息。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的所述第二連接信息,進而判定所述第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行所述狀態(tài)對應(yīng)程序的步驟進一步包括:當所述第一服務(wù)節(jié)點判定出所述第二連接信息代表所述第一服務(wù)節(jié)點與所述第二服務(wù)節(jié)點之間無法連接及/或所述第二服務(wù)節(jié)點并非處于運行狀態(tài)時,則判定所述第二服務(wù)節(jié)點處于已故障的狀態(tài)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述狀態(tài)對應(yīng)程序包括:使所述第一服務(wù)節(jié)點中止連接所述第二服務(wù)節(jié)點。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述狀態(tài)對應(yīng)程序包括:使所述第一服務(wù)節(jié)點連接所述數(shù)據(jù)平行運算架構(gòu)中的一第三服務(wù)節(jié)點。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用所述第一服務(wù)節(jié)點判定從所述第二服務(wù)節(jié)點反饋的所述第二連接信息,進而判定所述第二服務(wù)節(jié)點的狀態(tài)以執(zhí)行一狀態(tài)對應(yīng)程序的步驟進一步包括:當所述第一服務(wù)節(jié)點判定出所述第二連接信息代表所述第二服務(wù)節(jié)點的第二處理器處于高度運算狀態(tài)時,則判定所述第二服務(wù)節(jié)點處于一忙碌狀態(tài)且所述狀態(tài)對應(yīng)程序包括:使所述第一服務(wù)節(jié)點進入一預(yù)設(shè)的等待程序以等待重新連接所述第二服務(wù)節(jié)點。
【文檔編號】H04L12/24GK104378237SQ201410680627
【公開日】2015年2月25日 申請日期:2014年11月24日 優(yōu)先權(quán)日:2014年11月24日
【發(fā)明者】孫佑良 申請人:英業(yè)達科技有限公司, 英業(yè)達股份有限公司