專利名稱:一種高級(jí)電信計(jì)算架構(gòu)控制面的保活、自愈方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種高級(jí)電信計(jì)算架構(gòu)控制面的保活、自 愈方法和裝置。
背景技術(shù):
ATCA (Advanced Telecom Computing Architecture,高級(jí)電信計(jì)算架構(gòu))標(biāo)準(zhǔn)主要目標(biāo)在于為電信級(jí)電信應(yīng)用提供標(biāo)準(zhǔn)化的平臺(tái)體系結(jié)構(gòu),并滿足電信應(yīng)用的許多重要特 性,如可靠性,可維護(hù)性等方面要求。ATCA架構(gòu)為高度可擴(kuò)展的、模塊化的無線和有 線通信、核心及網(wǎng)絡(luò)數(shù)據(jù)中心解決方案提供了基礎(chǔ),該解決方案能夠由基于構(gòu)建模塊的 商用組件快速集成。這些模塊化解決方案可加快新服務(wù)的上市速度,從而更迅速地滿足 客戶需求和提高創(chuàng)收能力。
ATCA架構(gòu)中的機(jī)框管理系統(tǒng)Mhelf Management System)用于監(jiān)測(cè)、控制ATCA 單板和其它的機(jī)框功能模塊,以確保其能正常工作。機(jī)框管理系統(tǒng)中的機(jī)框管理模塊 CMM (Chassis Management Modular)用于監(jiān)測(cè)、控制機(jī)框中的單板和其它功能模塊,報(bào)告 系統(tǒng)異常并進(jìn)行基本的恢復(fù)操作,它是ATCA機(jī)框中管理系統(tǒng)的核心。一個(gè)機(jī)框有一對(duì) CMM,機(jī)框中的每塊 ATCA 單板上的 IPMC (Intelligent Platform Management Controller, 智能平臺(tái)管理控制器)通過IPMB (Intelligent Platform Management Bus,智能平臺(tái)管理控 制總線)與CMM相連,CMM通過它控制和管理每個(gè)單板上的一個(gè)或多個(gè)FRU(Field Replaceable Units,現(xiàn)場(chǎng)更換單元),使其能夠在 IPMI (Intelligent Platform Management Interface,智能平臺(tái)管理接口)架構(gòu)的管理之下工作。
控制面的檢測(cè)和自愈是電信設(shè)備必備的功能,便于系統(tǒng)主動(dòng)發(fā)現(xiàn)故障和進(jìn)行恢 復(fù)。目前非ATCA架構(gòu)的系統(tǒng)采用的是用每個(gè)框的交換板作為故障的檢測(cè)者和發(fā)現(xiàn)者, 因?yàn)榻粨Q板滿足以下幾個(gè)條件(1)在每個(gè)機(jī)框中是必須存在的單板;( 交換板可以獲 取到框內(nèi)單板的配置信息;(3)交換板上有信號(hào)線知道本框各單板的在位情況,也有信 號(hào)線可以直接對(duì)其復(fù)位。具體的檢測(cè)流程是交換板通過發(fā)送心跳檢測(cè)與本框各單板之 間,如果連續(xù)11分鐘(可配置)無通訊,則認(rèn)為故障,然后通過交換板對(duì)該單板進(jìn)行復(fù) 位。
目前在基于ATCA的平臺(tái)架構(gòu)沿用了上述檢測(cè)思路,在ATCA架構(gòu)中只有CMM 具備通過硬件線路復(fù)位同框單板的能力,因此故障的處理者只能是CMM,但是CMM為 獨(dú)立單板,無法獲取框內(nèi)單板的配置信息,因此不適合作為故障的發(fā)現(xiàn)者;同理,各框 交換板也可能是獨(dú)立單板,也不適合,最終采用了各單板的歸屬管理單板作為檢測(cè)者, 由于管理單板具有歸屬于它的各單板的配置信息,可以在管理單板和被管理單板之前發(fā) 送心跳檢測(cè),如果發(fā)現(xiàn)故障則給該被管理單板同框的機(jī)框管理板發(fā)送指令,要求其復(fù)位 該被管理單板。
然而,現(xiàn)有技術(shù)存在以下問題
(1)由于是由管理單板檢測(cè)歸屬于它的單板,該單板有可能與歸屬的管理單板不在一個(gè)機(jī)框內(nèi),這樣就會(huì)導(dǎo)致即使檢測(cè)鏈路故障,也無法精確定位故障位置,有可能是 框間鏈路故障,也可能是管理板框內(nèi)故障或者被管理單板框內(nèi)故障;
(2)無法定位出哪個(gè)方向的鏈路出現(xiàn)問題,這個(gè)問題在之前非ATCA架構(gòu)的方案 也存在。發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提供一種高級(jí)電信計(jì)算架構(gòu)控制面的?;?、自愈方 法和裝置。
具體的,本發(fā)明一種高級(jí)電信計(jì)算架構(gòu)控制面的?;?、自愈方法,包括
步驟1、機(jī)框管理模塊獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換 板,定時(shí)向所述交換板發(fā)送控制面心跳保活智能平臺(tái)管理接口 IPMI命令;
步驟2、所述交換板接收到所述控制面心跳?;領(lǐng)PMI命令后,通過所述普通單 板向所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答;
步驟3、所述機(jī)框管理模塊判斷在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)是否接收到所述普通單板發(fā)送的控 制面心跳保活I(lǐng)PMI命令應(yīng)答,若未接收到,判定由所述交換板至普通單板的鏈路故障, 對(duì)故障單板進(jìn)行復(fù)位。
其中,所述普通單板或交換板的軟件上電成功狀態(tài)的設(shè)置方式為
所述普通單板或交換板的智能平臺(tái)管理控制器IPMC在本板的主機(jī)HOSTCPU處 于現(xiàn)場(chǎng)可更換單元進(jìn)入激活狀態(tài)時(shí),給本板的HOST CPU加電;
所述HOST CPU上電并運(yùn)行后,向所述IPMC上報(bào)上電成功消息;
所述IPMC設(shè)置所述HOST CPU為軟件上電成功狀態(tài)。
其中,所述HOST CPU向所述IPMC上報(bào)上電成功消息后還進(jìn)行以下操作所 述HOST CPU設(shè)置所述IPMC為啟動(dòng)?;顧z測(cè)狀態(tài)。
進(jìn)一步的,所述步驟2具體包括
所述交換板的IPMC接收到所述控制面心跳保活I(lǐng)PMI命令后,向所述交換板的 HOST CPU發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;
所述交換板的HOST CPU接收到所述控制面?;顧z測(cè)請(qǐng)求命令后,向所述普通 單板的HOST CPU發(fā)送控制面保活私有消息;
所述普通單板的HOST CPU接收到所述控制面保活私有消息后,向所述普通單 板的IPMC發(fā)送控制面保活檢測(cè)請(qǐng)求命令;
所述普通單板的IPMC向所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
其中,所述控制面心跳?;領(lǐng)PMI命令和控制面心跳?;領(lǐng)PMI命令應(yīng)答的發(fā)送通 過ATCA規(guī)范中預(yù)留的IPMI NetFn實(shí)現(xiàn)。
本發(fā)明還提供一種高級(jí)電信計(jì)算架構(gòu)控制面的?;睢⒆杂椒?,包括
步驟11、機(jī)框管理模塊獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交 換板,定時(shí)向所述普通單板發(fā)送控制面心跳?;領(lǐng)PMI命令;
步驟12、所述普通單板接收到所述控制面心跳?;領(lǐng)PMI命令后,通過所述交換 板向所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答;
步驟13、所述機(jī)框管理模塊判斷在預(yù)設(shè)的時(shí)長(zhǎng)內(nèi)是否接收到所述交換板發(fā)送的 控制面心跳?;領(lǐng)PMI命令應(yīng)答,若未接收到,判定由普通單板至交換板的鏈路故障,對(duì) 故障單板進(jìn)行復(fù)位。
其中,所述步驟12具體包括
所述普通單板的IPMC接收到所述控制面心跳?;領(lǐng)PMI命令后,向所述普通單 板的HOST CPU發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;
所述普通單板的HOST CPU接收到所述控制面?;顧z測(cè)請(qǐng)求命令后,向所述交 換板的HOST CPU發(fā)送控制面?;钏接邢?;
所述交換板的HOST CPU接收到所述控制面?;钏接邢⒑螅蛩鼋粨Q板的 IPMC發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;
所述交換板的IPMC向所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
本發(fā)明還提供一種機(jī)框管理模塊,包括
單板獲取單元,用于獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換 板;
IPMI命令下發(fā)單元,用于在所述單板獲取單元獲取到普通單板和交換板后,定 時(shí)向所述交換板和/或普通單板發(fā)送控制面心跳?;領(lǐng)PMI命令;
故障檢測(cè)單元,用于判斷在預(yù)設(shè)的時(shí)長(zhǎng)內(nèi)是否接收到所述普通單板或交換板發(fā) 送的控制面心跳?;領(lǐng)PMI命令應(yīng)答,若未接收到,判定由所述交換板至普通單板,或者 由所述普通單板至交換板的鏈路故障,對(duì)故障單板進(jìn)行復(fù)位。
本發(fā)明還提供一種交換板,包括
第一IPMI命令接收單元,用于接收機(jī)框管理模塊發(fā)送的控制面心跳?;領(lǐng)PMI命 令;
第一控制面保活私有消息發(fā)送單元,用于在所述第一 IPMI命令接收單元接收到 控制面心跳?;領(lǐng)PMI命令后,向普通單板發(fā)送控制面?;钏接邢?;
第一控制面保活私有消息接收單元,用于接收普通單板發(fā)送的控制面?;钏接?消息;
第一 IPMI命令應(yīng)答發(fā)送單元,用于在所述第一控制面?;钏接邢⒔邮諉卧?收到控制面?;钏接邢⒑螅驒C(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
本發(fā)明還提供一種單板,包括
第二IPMI命令接收單元,用于接收機(jī)框管理模塊發(fā)送的控制面心跳保活I(lǐng)PMI命 令;
第二控制面?;钏接邢l(fā)送單元,用于在所述第二 IPMI命令接收單元接收到 控制面心跳?;領(lǐng)PMI命令后,向交換板發(fā)送控制面?;钏接邢ⅲ?br>
第二控制面?;钏接邢⒔邮諉卧?,用于接收交換板發(fā)送的控制面?;钏接邢?息;
第二 IPMI命令應(yīng)答發(fā)送單元,用于在所述第二控制面?;钏接邢⒔邮諉卧?收到控制面?;钏接邢⒑?,向機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
本發(fā)明提供的方法,充分利用了 ATCA架構(gòu)中專門設(shè)置的負(fù)責(zé)硬件監(jiān)控和管理的機(jī)框管理模塊的作用,完善了控制面檢測(cè)和自愈的機(jī)制,提高了定位的精確性,進(jìn)而 增強(qiáng)了系統(tǒng)的魯棒性。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或 現(xiàn)有技術(shù)描述中所需要使用的附圖進(jìn)行簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅 僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提 下,還可以根據(jù)這些附圖獲得其他的附圖。
圖IA為本發(fā)明提供的一種高級(jí)電信計(jì)算架構(gòu)控制面的?;?、自愈方法的流稱 圖IB為本發(fā)明提供的一種高級(jí)電信計(jì)算架構(gòu)控制面的?;?、自愈方法的又一流 稱圖2為本發(fā)明實(shí)施例中單板的IPMC和單板的HOST CPU間交互得到M8狀態(tài)的 流稱圖3為本發(fā)明實(shí)施例中單板的HOST CPU的FRU狀態(tài)轉(zhuǎn)換圖4為本發(fā)明實(shí)施例中控制面檢測(cè)示意圖5為本發(fā)明實(shí)施例中檢測(cè)方向?yàn)閺钠胀▎伟宓浇粨Q板的檢測(cè)流程圖6為本發(fā)明實(shí)施例中檢測(cè)方向?yàn)閺慕粨Q板到普通單板的檢測(cè)流程圖7為本發(fā)明提供的機(jī)框管理模塊的結(jié)構(gòu)圖8為本發(fā)明提供的交換板的結(jié)構(gòu)圖9為本發(fā)明提供的單板的結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、 完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施 例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得 的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
基于現(xiàn)有技術(shù)中存在的管理單板檢測(cè)鏈路故障時(shí),無法精確定位故障位置,且 無法定位出哪個(gè)方向的鏈路出現(xiàn)故障的缺陷,本發(fā)明提供一種高級(jí)電信計(jì)算架構(gòu)控制面 的保活、自愈方法和裝置。所述方法提高了對(duì)ATCA架構(gòu)系統(tǒng)控制面檢測(cè)的準(zhǔn)確率。
具體的,本發(fā)明提供的高級(jí)電信計(jì)算架構(gòu)控制面的?;?、自愈方法,如圖IA所 示,包括以下步驟
步驟S101A、CMM獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換 板,定時(shí)向交換板發(fā)送控制面心跳?;領(lǐng)PMI命令。
其中,普通單板或交換板的軟件上電成功狀態(tài)的設(shè)置方式為
(1)普通單板或交換板的智能平臺(tái)管理控制器IPMC在本板的主機(jī)HOST CPU處 于現(xiàn)場(chǎng)可更換單元進(jìn)入激活狀態(tài)時(shí),給本板的HOST CPU加電;
(2) HOST CPU上電并運(yùn)行后,向IPMC上報(bào)上電成功消息;
(3) IPMC設(shè)置HOST CPU為軟件上電成功狀態(tài)。
其中,HOST CPU向IPMC上報(bào)上電成功消息后還進(jìn)行以下操作HOST CPU設(shè)置IPMC為啟動(dòng)?;顧z測(cè)狀態(tài)。
步驟S102A、交換板接收到控制面心跳?;領(lǐng)PMI命令后,通過普通單板向 CMM發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
步驟S103A、CMM判斷在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)是否接收到普通單板發(fā)送的控制面心跳保 活I(lǐng)PMI命令應(yīng)答,若未接收到,判定由交換板至普通單板的鏈路故障,對(duì)故障單板進(jìn)行 復(fù)位。
本發(fā)明還提供一種高級(jí)電信計(jì)算架構(gòu)控制面的?;睢⒆杂椒?,如圖IB所示, 包括以下步驟
步驟S101B、CMM獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換 板,定時(shí)向普通單板發(fā)送控制面心跳保活I(lǐng)PMI命令。
步驟S102B、普通單板接收到控制面心跳保活I(lǐng)PMI命令后,通過交換板向 CMM發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
步驟S103B、CMM判斷在預(yù)設(shè)的時(shí)長(zhǎng)內(nèi)是否接收到交換板發(fā)送的控制面心跳保 活I(lǐng)PMI命令應(yīng)答,若未接收到,判定由普通單板至交換板的鏈路故障,對(duì)故障單板進(jìn)行 復(fù)位。
本發(fā)明提供的方法,充分利用了 ATCA架構(gòu)中專門設(shè)置的負(fù)責(zé)硬件監(jiān)控和管理 的機(jī)框管理模塊的作用,完善了控制面檢測(cè)和自愈的機(jī)制,提高了定位的精確性,進(jìn)而 增強(qiáng)了系統(tǒng)的魯棒性。
下面通過一較佳實(shí)施例來詳細(xì)闡述本發(fā)明提供的高級(jí)電信計(jì)算架構(gòu)控制面的保 活、自愈方法的具體實(shí)現(xiàn)過程。
本發(fā)明實(shí)施例的核心思想是,故障的檢測(cè)點(diǎn)和故障處理的執(zhí)行者都由CMM來 承擔(dān),如背景中所描述的,在ATCA架構(gòu)中故障的處理者只能是CMM,之前之所以考 慮CMM不適合作為故障的檢測(cè)者,主要的原因是CMM作為獨(dú)立單板無法獲取到配置信 息。為了解決這個(gè)問題,本發(fā)明充分利用IPMB總線,這是框內(nèi)CMM與各單板的一路 可靠管理鏈路,該鏈路物理上是兩條互為備份冗余鏈路。目前在IPMB總線上傳遞了單 板的各種硬件狀態(tài),由于對(duì)于沒有配置的單板應(yīng)該是無法上電成功,因此本發(fā)明增加一 種“單板軟件上電成功”的狀態(tài),這樣就可以解決獲取配置的問題。
下面詳細(xì)闡述“單板軟件上電成功”狀態(tài)的獲取方式。
具體的,ATCAIPMI規(guī)范定義的CMM管理的FRU狀態(tài),特指單板硬件狀態(tài)有 8種,MO M7,其中各種狀態(tài)表示的含義以及狀態(tài)轉(zhuǎn)換條件說明如表一所示
權(quán)利要求
1.一種高級(jí)電信計(jì)算架構(gòu)ATCA控制面的?;?、自愈方法,其特征在于,包括 步驟1、機(jī)框管理模塊獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換板,定時(shí)向所述交換板發(fā)送控制面心跳?;钪悄芷脚_(tái)管理接口 IPMI命令;步驟2、所述交換板接收到所述控制面心跳?;領(lǐng)PMI命令后,通過所述普通單板向 所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答;步驟3、所述機(jī)框管理模塊判斷在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)是否接收到所述普通單板發(fā)送的控制面 心跳?;領(lǐng)PMI命令應(yīng)答,若未接收到,判定由所述交換板至普通單板的鏈路故障,對(duì)故 障單板進(jìn)行復(fù)位。
2.如權(quán)利要求1所述的方法,其特征在于,所述普通單板或交換板的軟件上電成功狀 態(tài)的設(shè)置方式為所述普通單板或交換板的智能平臺(tái)管理控制器IPMC在本板的主機(jī)HOSTCPU處于現(xiàn) 場(chǎng)可更換單元進(jìn)入激活狀態(tài)時(shí),給本板的HOST CPU加電;所述HOST CPU上電并運(yùn)行后,向所述IPMC上報(bào)上電成功消息; 所述IPMC設(shè)置所述HOST CPU為軟件上電成功狀態(tài)。
3.如權(quán)利要求2所述的方法,其特征在于,所述HOSTCPU向所述IPMC上報(bào)上電成 功消息后還進(jìn)行以下操作所述HOST CPU設(shè)置所述IPMC為啟動(dòng)?;顧z測(cè)狀態(tài)。
4.如權(quán)利要求1所述的方法,其特征在于,所述步驟2具體包括所述交換板的IPMC接收到所述控制面心跳保活I(lǐng)PMI命令后,向所述交換板的 HOST CPU發(fā)送控制面保活檢測(cè)請(qǐng)求命令;所述交換板的HOST CPU接收到所述控制面保活檢測(cè)請(qǐng)求命令后,向所述普通單板 的HOST CPU發(fā)送控制面?;钏接邢ⅲ凰銎胀▎伟宓腍OST CPU接收到所述控制面?;钏接邢⒑螅蛩銎胀▎伟宓?IPMC發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;所述普通單板的IPMC向所述機(jī)框管理模塊發(fā)送控制面心跳保活I(lǐng)PMI命令應(yīng)答。
5.如權(quán)利要求4所述的方法,其特征在于,所述控制面心跳?;領(lǐng)PMI命令和控制面 心跳保活I(lǐng)PMI命令應(yīng)答的發(fā)送通過ATCA規(guī)范中預(yù)留的IPMI NetFn實(shí)現(xiàn)。
6.—種高級(jí)電信計(jì)算架構(gòu)控制面的?;睢⒆杂椒?,其特征在于,包括步驟11、機(jī)框管理模塊獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換 板,定時(shí)向所述普通單板發(fā)送控制面心跳保活I(lǐng)PMI命令;步驟12、所述普通單板接收到所述控制面心跳?;領(lǐng)PMI命令后,通過所述交換板向 所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答;步驟13、所述機(jī)框管理模塊判斷在預(yù)設(shè)的時(shí)長(zhǎng)內(nèi)是否接收到所述交換板發(fā)送的控制 面心跳?;領(lǐng)PMI命令應(yīng)答,若未接收到,判定由普通單板至交換板的鏈路故障,對(duì)故障 單板進(jìn)行復(fù)位。
7.如權(quán)利要求6所述的方法,其特征在于,所述步驟12具體包括所述普通單板的IPMC接收到所述控制面心跳?;領(lǐng)PMI命令后,向所述普通單板的 HOST CPU發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;所述普通單板的HOST CPU接收到所述控制面?;顧z測(cè)請(qǐng)求命令后,向所述交換板 的HOST CPU發(fā)送控制面?;钏接邢?;所述交換板的HOST CPU接收到所述控制面?;钏接邢⒑螅蛩鼋粨Q板的IPMC 發(fā)送控制面?;顧z測(cè)請(qǐng)求命令;所述交換板的IPMC向所述機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
8.—種機(jī)框管理模塊,其特征在于,包括單板獲取單元,用于獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換板; IPMI命令下發(fā)單元,用于在所述單板獲取單元獲取到普通單板和交換板后,定時(shí)向 所述交換板和/或普通單板發(fā)送控制面心跳?;領(lǐng)PMI命令;故障檢測(cè)單元,用于判斷在預(yù)設(shè)的時(shí)長(zhǎng)內(nèi)是否接收到所述普通單板或交換板發(fā)送的 控制面心跳?;領(lǐng)PMI命令應(yīng)答,若未接收到,判定由所述交換板至普通單板,或者由所 述普通單板至交換板的鏈路故障,對(duì)故障單板進(jìn)行復(fù)位。
9.一種交換板,其特征在于,包括第一 IPMI命令接收單元,用于接收機(jī)框管理模塊發(fā)送的控制面心跳?;領(lǐng)PMI命令;第一控制面?;钏接邢l(fā)送單元,用于在所述第一 IPMI命令接收單元接收到控制 面心跳保活I(lǐng)PMI命令后,向普通單板發(fā)送控制面保活私有消息;第一控制面保活私有消息接收單元,用于接收普通單板發(fā)送的控制面?;钏接邢ⅲ坏谝?IPMI命令應(yīng)答發(fā)送單元,用于在所述第一控制面保活私有消息接收單元接收到 控制面?;钏接邢⒑?,向機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
10.—種單板,其特征在于,包括第二 IPMI命令接收單元,用于接收機(jī)框管理模塊發(fā)送的控制面心跳保活I(lǐng)PMI命令;第二控制面保活私有消息發(fā)送單元,用于在所述第二 IPMI命令接收單元接收到控制 面心跳保活I(lǐng)PMI命令后,向交換板發(fā)送控制面?;钏接邢?;第二控制面保活私有消息接收單元,用于接收交換板發(fā)送的控制面保活私有消息; 第二 IPMI命令應(yīng)答發(fā)送單元,用于在所述第二控制面?;钏接邢⒔邮諉卧邮盏?控制面?;钏接邢⒑?,向機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答。
全文摘要
本發(fā)明公開了一種高級(jí)電信計(jì)算架構(gòu)控制面的?;睢⒆杂椒ê脱b置,該方法包括機(jī)框管理模塊獲取所在機(jī)框內(nèi)處于軟件上電成功狀態(tài)的普通單板和交換板,定時(shí)向交換板和/或普通單板發(fā)起控制面心跳保活I(lǐng)PMI命令;交換板通過普通單板向機(jī)框管理模塊發(fā)送控制面心跳?;領(lǐng)PMI命令應(yīng)答,或者普通單板通過交換板向機(jī)框管理模塊發(fā)送控制面心跳保活I(lǐng)PMI命令應(yīng)答;機(jī)框管理模塊在連續(xù)指定的時(shí)間內(nèi)未接收到控制面心跳?;領(lǐng)PMI命令應(yīng)答時(shí),判定由交換板至普通單板或者由普通單板至交換板的鏈路故障,并對(duì)故障單板進(jìn)行復(fù)位。本發(fā)明提供的方法,提高了檢測(cè)定位的精確性和系統(tǒng)的魯棒性。
文檔編號(hào)H04Q3/00GK102026042SQ20091017671
公開日2011年4月20日 申請(qǐng)日期2009年9月18日 優(yōu)先權(quán)日2009年9月18日
發(fā)明者周自春, 梁璐, 趙凱 申請(qǐng)人:中興通訊股份有限公司