服務器系統(tǒng)與節(jié)點替換方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種服務器系統(tǒng)(例如機柜式的數(shù)據(jù)中心)與節(jié)點替換方法,特別是一種可快速進行節(jié)點替換程序的服務器系統(tǒng)與節(jié)點替換方法。
【背景技術(shù)】
[0002]隨著科技的發(fā)展,通過互聯(lián)網(wǎng)能夠使得世界各地的電腦進行連結(jié)。一臺電腦通過網(wǎng)絡連線便能夠與另一臺電腦進行數(shù)據(jù)的交換、存取等動作。在客戶端與服務器系統(tǒng)架構(gòu)上,客戶端與服務器便是通過網(wǎng)絡來進行溝通。
[0003]一般來說,服務器系統(tǒng)可配置有多個節(jié)點,且每一個節(jié)點同時運行多個虛擬機器(virtual machine,VM),藉以提供給每一使用者獨立的運作環(huán)境。并且,每個節(jié)點可視為各自獨立的計算機,亦即各節(jié)點具有存儲器、儲存空間、運算能力與網(wǎng)絡連結(jié)功能。因此,各節(jié)點可以運行獨自的操作系統(tǒng),且各節(jié)點之間也可以通過網(wǎng)絡設備進行溝通與數(shù)據(jù)傳輸。
[0004]在服務器系統(tǒng)架構(gòu)完畢后,必須對其內(nèi)的節(jié)點完成部署,亦即安裝各節(jié)點所需的操作系統(tǒng)、軟件包數(shù)據(jù)與固件包數(shù)據(jù),以使服務器系統(tǒng)運作并提供服務給使用者使用。然而,當服務器系統(tǒng)中的任意一組節(jié)點的硬件產(chǎn)生損壞時,將會導致對應于此硬件的節(jié)點無法正常運作,此時檢測人員由于無法精確得知是哪一節(jié)點中的特定硬件發(fā)生損壞,而僅能依序?qū)⒐?jié)點拔離與插入服務器系統(tǒng)來進行檢測,造成檢測時間上的浪費。
【發(fā)明內(nèi)容】
[0005]本發(fā)明所要解決的技術(shù)問題是提供一種服務器系統(tǒng)與節(jié)點替換方法,其可自動地依據(jù)節(jié)點的識別碼與節(jié)點中的硬件的硬件配置信息來判斷特定節(jié)點或此節(jié)點中的特定硬件是否需要被替換,以讓檢測人員可快速方便地對節(jié)點進行替換。
[0006]為了實現(xiàn)上述目的,本發(fā)明提供了一種節(jié)點替換方法,此節(jié)點替換方法適用于服務器系統(tǒng)。此節(jié)點替換方法的步驟流程如下所述。檢測節(jié)點是否插入服務器系統(tǒng),并于檢測到節(jié)點插入服務器系統(tǒng)時產(chǎn)生第一提示信號,其中此第一提示信號用以指示節(jié)點不能拔離服務器系統(tǒng)。檢測節(jié)點的第一識別碼與節(jié)點中的硬件的第一硬件配置信息。依據(jù)第一識別碼與第一硬件配置信息以及節(jié)點插入服務器系統(tǒng)之前的第二識別碼與第二硬件配置信息,判斷節(jié)點或節(jié)點中的硬件是否已被替換。若判斷出節(jié)點與節(jié)點中的硬件皆未被替換,則關(guān)閉節(jié)點的電源,以執(zhí)行節(jié)點替換程序。若判斷出節(jié)點或節(jié)點中的硬件被替換,則對節(jié)點安裝操作系統(tǒng)、軟件包數(shù)據(jù)與固件包數(shù)據(jù)至少其中之一。
[0007]在一實施例中,于對節(jié)點安裝操作系統(tǒng)、軟件包數(shù)據(jù)與固件包數(shù)據(jù)至少其中之一的步驟之后,還包括以下所述的步驟流程。持續(xù)檢測節(jié)點中的硬件的狀況,以判斷硬件是否發(fā)生錯誤。若判斷出硬件產(chǎn)生不可修復的錯誤,則關(guān)閉此節(jié)點的電源,以執(zhí)行節(jié)點替換程序。若判斷出硬件產(chǎn)生可修復的錯誤次數(shù)達到預設的門檻值,則對此節(jié)點進行正常關(guān)機程序,并據(jù)以執(zhí)行節(jié)點替換程序。
[0008]在一實施例中,節(jié)點替換程序包括以下所述的步驟流程。將節(jié)點設定為初始模式。產(chǎn)生第二提示信號,其中此第二提示信號用以指示節(jié)點能拔離服務器系統(tǒng)。檢測節(jié)點是否拔離服務器系統(tǒng)。檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)。若檢測到節(jié)點或另一節(jié)點插入服務器系統(tǒng),則產(chǎn)生第一提示信號,并且接續(xù)檢測節(jié)點的第一識別碼與節(jié)點中的硬件的第一硬件配置信息之后的步驟。
[0009]承接上述的實施例,于檢測節(jié)點是否拔離服務器系統(tǒng)的步驟中,還包括以下所述的步驟流程。設定第一預設時間并開始計時。判斷節(jié)點是否已拔離服務器系統(tǒng)。若判斷出節(jié)點尚未拔離服務器系統(tǒng),則重置第一預設時間并重新計時。若判斷出節(jié)點拔離服務器系統(tǒng)且已經(jīng)過第一預設時間,則執(zhí)行檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)之后的步驟。
[0010]承接上述的實施例,于檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)的步驟中,還包括以下所述的步驟流程。設定第一預設時間與第二預設時間并開始計時,其中第二預設時間接續(xù)于第一預設時間后。判斷節(jié)點是否插入服務器系統(tǒng)。若判斷出節(jié)點尚未插入服務器系統(tǒng),則重置第一預設時間并重新計時。若判斷出節(jié)點插入服務器系統(tǒng)且已經(jīng)過第一預設時間,則接著判斷節(jié)點于第二預設時間中是否仍持續(xù)插入服務器系統(tǒng)。若判斷出節(jié)點于第二預設時間中拔離服務器系統(tǒng),則接續(xù)將節(jié)點設定為初始模式之后的步驟。若判斷出節(jié)點于經(jīng)過第二預設時間后仍未拔離服務器系統(tǒng),則產(chǎn)生第一提示信號,并且接續(xù)檢測節(jié)點的第一識別碼與節(jié)點中的硬件的第一硬件配置信息之后的步驟。
[0011]為了更好地實現(xiàn)上述目的,本發(fā)明還提供了一種服務器系統(tǒng),此服務器系統(tǒng)包括節(jié)點、檢測模塊、提示模塊以及處理模塊。節(jié)點具有硬件。檢測模塊通訊連接節(jié)點,此檢測模塊用以檢測節(jié)點是否插入或拔離服務器系統(tǒng),以及用以檢測節(jié)點的第一識別碼與硬件的第一硬件配置信息。提示模塊通訊連接檢測模塊,此提示模塊用以于檢測模塊檢測到節(jié)點插入服務器系統(tǒng)時產(chǎn)生第一指示信號。其中,此第一指示信號用以指示節(jié)點不能拔離服務器系統(tǒng)。處理模塊通訊連接于檢測模塊與節(jié)點之間,此處理模塊用以依據(jù)第一識別碼與第一硬件配置信息以及節(jié)點插入服務器系統(tǒng)之前的第二識別碼與第二硬件配置信息來判斷節(jié)點或硬件是否已被替換。其中,若處理模塊判斷出節(jié)點與硬件皆未被替換,則關(guān)閉節(jié)點的電源,以執(zhí)行節(jié)點替換程序,若處理模塊判斷出節(jié)點或硬件被替換,則對節(jié)點安裝操作系統(tǒng)、軟件包數(shù)據(jù)與固件包數(shù)據(jù)至少其中之一。
[0012]在一實施例中,于處理模塊對節(jié)點安裝操作系統(tǒng)、軟件包數(shù)據(jù)與固件包數(shù)據(jù)至少其中之一之后,處理模塊還持續(xù)判斷硬件是否發(fā)生錯誤。若處理模塊判斷出硬件產(chǎn)生不可修復的錯誤,則關(guān)閉節(jié)點的電源,以執(zhí)行節(jié)點替換程序。若處理模塊判斷出硬件產(chǎn)生可修復的錯誤次數(shù)達到預設的門檻值,則對節(jié)點進行正常關(guān)機程序,并據(jù)以執(zhí)行節(jié)點替換程序。
[0013]在一實施例中,于服務器系統(tǒng)執(zhí)行節(jié)點替換程序時,處理模塊將節(jié)點設定為初始模式。接著,提示模塊產(chǎn)生第二提示信號,此第二提示信號用以指示節(jié)點能拔離服務器系統(tǒng)。另外,檢測模塊檢測節(jié)點是否拔離服務器系統(tǒng),并于檢測到節(jié)點拔離服務器系統(tǒng)后接續(xù)檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)。若檢測模塊檢測到節(jié)點或另一節(jié)點插入服務器系統(tǒng),則提示模塊產(chǎn)生第一提示信號,并且檢測模塊接續(xù)檢測節(jié)點的第一識別碼與硬件的第一硬件配置信息之后的處理程序。
[0014]承接上述的實施例,服務器系統(tǒng)還包括計時模塊,此計時模塊通訊連接檢測模塊。于檢測模塊檢測節(jié)點是否拔離服務器系統(tǒng)時,計時模塊會設定第一預設時間并開始計時。若檢測模塊檢測出節(jié)點于第一預設時間內(nèi)仍未拔離服務器系統(tǒng),則計時模塊將重置第一預設時間并重新計時。若檢測模塊檢測出節(jié)點拔離服務器系統(tǒng)且已經(jīng)過第一預設時間,則接續(xù)檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)之后的處理程序。
[0015]承接上述的實施例,服務器系統(tǒng)還包括計時模塊,此計時模塊通訊連接檢測模塊。于檢測模塊檢測節(jié)點或另一節(jié)點是否插入服務器系統(tǒng)時,計時模塊會設定第一預設時間與第二預設時間并開始計時,其中第二預設時間接續(xù)于第一預設時間后。若檢測模塊檢測出節(jié)點于第一預設時間內(nèi)尚未插入服務器系統(tǒng),則計時模塊重置第一預設時間并重新計時。若檢測模塊檢測出節(jié)點插入服務器系統(tǒng)且已經(jīng)過第一預設時間,則接續(xù)檢測節(jié)點于第二預設時間中是否仍持續(xù)插入服務器系統(tǒng)。若檢測模塊檢測出節(jié)點于第二預設時間中拔離服務器系統(tǒng),則接續(xù)處理模塊將節(jié)點設定為初始模式的處理程序。若檢測模塊檢測出節(jié)點于經(jīng)過第二預設時間后仍未拔離服務器系統(tǒng),則提示模塊產(chǎn)生第一提示信號,并且檢測模塊接續(xù)檢測節(jié)點的第一識別碼與硬件的第一硬件配置信息之后的處理程序。