專利名稱:小型電信和計算通用硬件平臺架構系統(tǒng)及可靠性管理方法
技術領域:
本發(fā)明涉及通信技術領域,特別是指一種小型電信和計算通用硬件平臺架
構(Micro Telecommunications Computing Architecture, MicroTCA)系統(tǒng)及可 靠性管理方法。
背景技術:
MicroTCA是PCI工業(yè)計算機廠家協(xié)會(PCI Industrial Computer Manufacturers Group, PICMG)組織制定的小型電信和計算通用硬件平臺架構, MicroTCA利用先進夾層卡(Advanced Mezzanine Card, AMC )來構筑系統(tǒng), 支持熱插拔的AMC可以直接插到MicroTCA的背板。MicroTCA主要定位中 低端、對成本比較壽丈感、要求小物理尺寸的電信或計算應用。主要的應用包括 無線基站、路由器、媒體網(wǎng)關等。MicroTCA基本規(guī)范名稱是MicroTCA.O,定 義了 MicroTCA的機框結構、管理、電源、散熱、互連等內(nèi)容。
AMC是PICMG組織定義的可以支持熱插拔的通用夾層卡,具體類型包括 數(shù)字信號處理(DSP) AMC、中央處理器(CPU) AMC、網(wǎng)絡處理器(NP) AMC、接口 AMC、存儲AMC等類型。AMC模塊可以直接插到MicroTCA的 背板上來應用,構成MicroTCA系統(tǒng)。AMC規(guī)范包括AMC.X系列標準規(guī)范, 定義了AMC的結構、管理、電源、散熱、互連及交換網(wǎng)建議等內(nèi)容。
智能平臺管理接口 (Intelligent Platform Management Interface,, IPMI)是 為提高服務器的可用性指標而推出的智能化平臺管理接口標準,最初目的是為 服務器提供設備管理、傳感器/事件管理、用戶管理、風扇框/電源框管理、遠
管理規(guī)范。智能平臺管理總線(Intelligent Platform Management Bus, IPMB )是基于 IPMI規(guī)范的管理總線的統(tǒng)稱。在MicroTCA中IPMB總線又分為兩種,IPMB-0 和本地智能平臺管理總線I (Local Intelligent Platform Management Bus, IPMB-L )。其中IPMB-0連接MicroTCA系統(tǒng)中的MicroTCA承載管理控制器 (MicroTCA承載板Manager Controller, MCMC )和增強模塊管理控制器 (Enhanced Management Controller, EMMC ),實現(xiàn)MicroTCA的交換控制才莫塊 (MicroTCA承載板Hub, MCH)對電源模塊和風扇單元的管理。而IPMB-L 連接MicroTCA系統(tǒng)中的MCMC和模塊管理控制器(Management Controller, MMC),實現(xiàn)MCH對各AMC模塊的管理。
根據(jù)MicroTCA的規(guī)范, 一個基本的MicroTCA系統(tǒng)支持的AMC數(shù)量最 大為12,支持的MCH數(shù)量最大為2,所支持的兩個MCH可以互為冗余備份 關系。
圖1為MicroTCA.O規(guī)范承載板FRU信息設備連接示意圖。參見圖1所示, 每塊MCMC通過獨立的I2C訪問一個承載板FRU信息設備,利用承載板FRU 信息設備的FRU數(shù)據(jù)配置系統(tǒng)設備。所述系統(tǒng)設備可以包括MCH、 AMC、電 源單元以及風扇單元??紤]到MCH的通用性,承載板FRU信息設備作為獨立 的物理實體,可以由固定于MicroTCA背板的非易失性存儲器實現(xiàn)。圖1中示 出,MCMC1通過其專用通道I2(31訪問其對應的承載板FRU信息設備1,同
基于AMC規(guī)范設計的任何AMC單板,其FRU存儲信息描述AMC槽位 每個端口能力,同時承載板FRU信息設備存儲的信息中描述背板每個端口能 力,MCMC的FRU存儲信息中描述MCH槽位每個端口能力。通過比較這些 資源信息中各端口能力,承載板管理器決定AMC或MCH星型端口是否使能。
力信息,保證只有兼容的端口才能使能打開。承載板FRU信息設備存儲的FRU 數(shù)據(jù)包括MicroTCA承載板屬性,如背板聯(lián)接,AMC上下電順序,其存儲信息反映MicroTCA承載板管理AMC單板能力。承載板FRU信息設備在MCMC 外部,通過專用總線與MCMC連接。MicroTCA機框考慮到每個與MCMC與 承載板FRU信息設備通過I2C總線連接。 一旦承載板FRU信息設備被MCMC 發(fā)現(xiàn),首先檢查器件有效性。在冗余MCMC系統(tǒng)中,兩塊MCMC之間會實時 傳達承載板FRU信息設備狀態(tài)。MCMC之間協(xié)商兩個承載板FRU信息設備 的主備關系。
圖2為MicroTCA.O規(guī)范MCH訪問承載板FRU信息設備故障示意圖。 如圖2所示,當MCMC1與承載板FRU信息設備1間專用I2C總線發(fā)生故障 時,MCH1無法對承載板FRU信息設備1進行管理。此時,系統(tǒng)會面臨兩個 問題
一,系統(tǒng)倒換頻繁風險。如果MicroTCA系統(tǒng)需要正常工作,MCH2必須 啟動主備倒換動作,激活MCH2,由MCH2來接替MCH1的工作,MCH2通 過專用I2C總線訪問承載板FRU信息設備2接替管理工作,控制AMC單板正 常上下電及進行E-Keying管理,該倒換觸發(fā)增加了主備倒換頻率和風險。
二,系統(tǒng)存在長期帶故障運行風險。當MCm對應的承載板FRU信息設 備l器件數(shù)據(jù)異常但可訪問時,MCH1無法及時用MCH2對應的承載板FRU信 息設備2有效數(shù)據(jù)及時同步MCH1對應的故障承載板FRU信息設備l內(nèi)容, 承載板FRU信息設備1故障不能及時得到修復,系統(tǒng)存在帶故障運行風險。 同樣,當故障發(fā)生在承載板FRU信息設備2與MCMC2間時,同樣存在上述 問題。
綜上所述,在MicroTCA規(guī)范中,MCH與承載板FRU信息設備只通過一 個專用的fC接口連接,因此,可以導致MicroTCA規(guī)范定義的承載板FRU管 理總線架構存在承載板FRU信息設備信息同步不一致及主備倒換負擔過重問 題。信息同步故障將導致MCH對AMC管理失去控制,系統(tǒng)無法對AMC進 行正常的配置和管理。同時MCH的倒換依賴其對應的承載板FRU信息設備好 壞,降低了系統(tǒng)的可靠性。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例的主要目的是提供一種小型電信和計算通用硬件 平臺架構系統(tǒng)及可靠性管理方法,以保證由于發(fā)生信息同步故障時,實現(xiàn)對系 統(tǒng)設備進行正常的配置和管理。
本發(fā)明實施例提供的一種MicroTCA系統(tǒng)的可靠性管理的方法,其中,所 述MicroTCA系統(tǒng)至少包括MCMC、主承載板FRU信息設備以及備承載板FRU 信息設備,該方法包4舌
當確定主承載板FRU信息設備不在位或發(fā)生故障時,所述MCMC利用所 述備承載板FRU信息設備的FRU數(shù)據(jù)進行配置處理。
本發(fā)明提供的一種MicroTCA系統(tǒng),包括MCMC、主承載板FRU信息 設備以及備承載板FRU信息設備,所述MCMC與主承載板FRU信息設備以 及備承載板FRU信息設備分別相連,
所述主承載板FRU信息設備,用于在正常運行時,向所述MCMC提供 FRU數(shù)據(jù);
所述備承載板FRU信息設備,用于所述主承載板FRU信息設備不在位或 發(fā)生故障時,向所述MCMC提供FRU數(shù)據(jù);
所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進行配置處理。
本發(fā)明提供的一種MicroTCA承載管理控制器,包括
數(shù)據(jù)獲取單元,用于在主承載板FRU信息設備運行正常時,從所述主承 載板FRU信息設備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設備不在位或 發(fā)生故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù);
配置單元,用于利用獲取的FRU數(shù)據(jù)進行配置處理。
在本發(fā)明實施例中,當MCH對應承載板FRU信息設備發(fā)生故障時,MCH 不需要啟動復雜的主備倒換流程,而只需要通過訪問備用承載板FRU信息設 備獲取正確的FRU數(shù)據(jù),進而可以實現(xiàn)對系統(tǒng)設備進行正常的配置和管理。
圖1為現(xiàn)有技術中MicroTCA.O規(guī)范承載板FRU信息設備連接示意圖; 圖2為針對圖1所示的MicroTCA.O規(guī)范MCH訪問承載板FRU信息設 備故障示意圖3為本發(fā)明實施例的MicroTCA.O系統(tǒng)結構示意圖4為本發(fā)明實施例的MCMC的結構示意圖5為本發(fā)明實施例實現(xiàn)可靠性的方法流程示意圖。
具體實施例方式
在本發(fā)明實施例中,在MicroTCA系統(tǒng)中,當確定主承載板FRU信息設 備不在位或發(fā)生故障時,利用所述備承載板FRU信息設備的FRU數(shù)據(jù)配置系 統(tǒng)設備。所述系統(tǒng)設備可以包括MCH、 AMC、電源單元以及風扇單元。
這里,確定主承載板FRU信息設備是否發(fā)生故障可以這樣實現(xiàn)在主承 載板FRU信息設備在位時,但無法讀取主承載板FRU信息設備的FRU數(shù)據(jù), 或,對所述主承載板FRU信息設備所保存的信息一t驗不成功時,確定主承載 板FRU信息設備發(fā)生故障。
進一步地,為了使系統(tǒng)更可靠的進行配置,在利用所述備承載板FRU信 息設備的數(shù)據(jù)更新所述主承載板FRU信息設備所保存的FRU數(shù)據(jù)之前,可以 進一步判斷備用FRU存儲設備是否在位,在所述備用FRU存儲設備在位,且 讀數(shù)據(jù)成功并對讀取的數(shù)據(jù)校驗成功時,獲得所述備承載板FRU信息設備所 保存的FRU數(shù)據(jù)。此后,再利用所述備承載板FRU信息設備的數(shù)據(jù)更新所述 主承載板FRU信息設備所保存的FRU數(shù)據(jù)。
當確定主承載板FRU信息設備運行正常時,可以直接利用所述主承栽板 FRU信息設備的FRU數(shù)據(jù)配置系統(tǒng)設備。
當然,當主承載板FRU信息設備不在位或發(fā)生故障時,且所述備承載板 FRU信息設備不在位或發(fā)生故障時,可以提示用戶系統(tǒng)發(fā)生故障。為了實現(xiàn)數(shù)據(jù)同步,當確定主承載板FRU信息設備不在位或發(fā)生故障時, 可以利用所述備承載板FRU信息設備的FRU數(shù)據(jù)更新所述主承載板FRU信 息設備所保存的FRU數(shù)據(jù)。
參見圖3所示,本發(fā)明實施例的系統(tǒng)包括MCMC、主承載板FRU信息 設備以及備承載板FRU信息設備,如承載板FRU信息設備1為主承載板FRU 信息設備,承載板FRU信息設備2為備承載板FRU信息設備,所述MCMC與 主承載板FRU信息設備以及備承載板FRU信息設備分別相連。
所述主承載板FRU信息設備,用于存儲FRU數(shù)據(jù),并在正常運行時,向 所述MCMC提供FRU數(shù)據(jù);所述備承載板FRU信息設備,用于存儲FRU數(shù) 據(jù),在所述主承載板FRU信息設備不在位或發(fā)生故障時,向所述MCMC提供 FRU數(shù)據(jù);
所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進行配置處理。 在圖3中,12(31是MCMC1到承載板FRU信息設備1專用I2C通道,I2C4 是MCMC2到承載板FRU信息設備2專用I2C通道。在現(xiàn)有方案基礎上,增 加MCMC1到承載板FRU信息設備2的I2C通道I2C2,如圖3虛線所示I2C2, 作為MCMC1訪問承載板FRU信息設備2的訪問通道。增加MCMC2到承載 板FRU信息設備1的I2C通道I2C3,如圖3虛線所示I2C3,作為MCMC2訪 問承載板FRU信息設備1的訪問通道。MCMC1通過專用通道fCl訪問其對 應的承載板FRU設備承載板FRU信息設備1,通過專用通道fC2訪問其對 應的承載板FRU設備承載板FRU信息設備2;同樣,MCMC2通過專用通道 I2C3訪問其對應的承載板FRU設備承載板FRU信息設備1,通過專用通道 I2C4訪問其對應的承載板FRU設備承載板FRU信息設備2。考慮單板上電隨 機性,這里假定圖3中左側MCMC為主用單板,其專用fC通道fCl對應的 承載板FRU信息設備1為主用FRU存儲設備,圖3中右側MCMC為備用單 板,其專用I2C通道I2C4對應的承載板FRU信息設備2為備用FRU存儲設 備。圖3中示出的MCMC與承載板FRU信息設備通過I2C總線相連,也可以 通過IPMB-L管理總線、CAN、串口以及其它總線實現(xiàn)。
參見圖4所示,所述MCMC可以包括數(shù)據(jù)獲耳又單元42以及配置單元 43。數(shù)據(jù)獲取單元42,用于在主承載板FRU信息設備運行正常時,從所述主 承載板FRU信息設備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設備不在位 或發(fā)生故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù);配置單元43, 用于利用獲取的FRU數(shù)據(jù)進行配置處理。
所述MCMC可以包括第一檢測單元41,用于4企測所述主承載板FRU 信息設備運行是否正常。
所述MCMC還可以包括第二檢測單元44,用于在所述主承載板FRU 信息設備不在位或發(fā)生故障時,檢測所述備承載板FRU信息設備是否在位或 發(fā)生故障,在所述備承載板FRU信息設備在位或沒有發(fā)生故障時,指示所述 數(shù)據(jù)獲取單元42從所述備承載板FRU信息設備獲取FRU數(shù)據(jù)。因此,數(shù)據(jù) 獲取單元42在所述備承載板FRU信息設備是否在位或發(fā)生故障時,從所述備 承載板FRU信息設備獲取FRU數(shù)據(jù)。
所述MCMC還可以包括同步更新單元45,用于當主承載板FRU信息設 備不在位或發(fā)生故障時,利用所述備承載板FRU信息設備的FRU數(shù)據(jù)更新所 述主承載板FRU信息設備所保存的FRU數(shù)據(jù)。
所述MCMC還可以包括告警單元,用于在所述備承載板FRU信息設備 不在位或發(fā)生故障時,提示用戶系統(tǒng)發(fā)生故障。
在本發(fā)明實施例中,根據(jù)主備承載板FRU信息設備的不同狀態(tài),MCMC 可以分別采取不同的措施
當主用FRU存儲設備在位,MCMCl通過主用FRU專用通道I2(31讀主用 FRU數(shù)據(jù)成功,數(shù)據(jù)校驗正確時MCMCl接受主用FRU存儲設備的存儲數(shù) 據(jù),利用該配置文件配置MicroTCA系統(tǒng),對系統(tǒng)內(nèi)AMC單板進行端口配置, 實現(xiàn)上下電管理等功能。當主用FRU存儲設備在位,MCMC1通過主用FRU專用通道^C1讀主用 FRU存儲設備數(shù)據(jù)失敗,備用FRU存儲設備在位時MCMC1通過備用FRU 存儲設備專用通道I2C2從備用FRU存儲設備讀數(shù)據(jù),并對存儲信息進行校驗。 如果校驗成功,則采用備用FRU存儲設備數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則 MCMC板給出嚴重告警指示,啟動自檢失敗,輸出錯誤信息"承載板FRU數(shù) 據(jù)無效"。
當主用FRU存儲設備在位,MCMCl通過主用FRU專用通道fCl讀數(shù)據(jù) 成功,但是校驗數(shù)據(jù)不通過,備用FRU存儲設備在位時,MCMCl通過產(chǎn)C2 從備用FRU存儲設備讀數(shù)據(jù),并進行校驗。如果成功,MCMCl接受備用FRU 存儲設備的存儲數(shù)據(jù),利用該配置文件配置MicroTCA系統(tǒng),對系統(tǒng)內(nèi)AMC 單板進行端口配置,實現(xiàn)上下電管理等功能。并使用備用數(shù)據(jù)通過主用FRU 專用通道^C1覆蓋主用FRU數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則MCMC板給 出嚴重告警指示,啟動自檢失敗,輸出錯誤信息"承載板FRU數(shù)據(jù)無效"。
當主用FRU存儲設備在位,MCMCl通過主用FRU專用通道I2(31讀數(shù)據(jù) 不成功,備用FRU存儲設備在位時,MCMCl通過^C2從備用FRU存儲設備 讀數(shù)據(jù),并進行校驗。如果成功,MCMCl接受備用FRU存儲設備的存儲數(shù)據(jù), 利用該配置文件配置MicroTCA系統(tǒng),對系統(tǒng)內(nèi)AMC單板進行端口配置,實 現(xiàn)上下電管理等功能。如果備用數(shù)據(jù)獲取失敗,則MCMC板給出嚴重告警指 示,啟動自檢失敗,輸出錯誤信息"承載板FRU數(shù)據(jù)無效"。
當主用FRU存儲設備不在位,備用FRU存儲設備在位時,MCMCl通過 產(chǎn)C2從備用FRU存儲設備讀數(shù)據(jù),并進行校驗。如果成功,采用備用FRU存 儲設備數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則MCMC板給出嚴重告警指示,啟動 自檢失敗,輸出錯誤信息"承載板FRU數(shù)據(jù)無效"。
當主備用FRU存儲設備都不在位時,MCMC板給出嚴重告警指示,啟動 自檢失敗,輸出錯誤信息"承載板FRU數(shù)據(jù)無效"。
如圖5所示,本發(fā)明實施例實現(xiàn)可靠性管理的具體過程如下步驟501:判斷主用承載板FRU信息設備是否在位,如果在位,則執(zhí)行步 驟502,否則,執(zhí)行步驟504。
步驟502: MCMC1通過主用FRU專用通道I2C 1讀主承載板FRU信息 設備的FRU數(shù)據(jù),如果讀取成功,則執(zhí)行步驟503,否則,執(zhí)行步驟504。
步驟503: MCMC1對讀取的FRU數(shù)據(jù)進行校驗,如果校驗正確,MCMC1 接受該FRU數(shù)據(jù),執(zhí)行步驟509,否則,執(zhí)行步驟504。
步驟504:判斷備承載板FRU信息設備是否在位,如果在位,則執(zhí)行步驟 505,否則,執(zhí)行步驟508。
步驟505: MCMC1通過備用FRU專用通道I2C讀備承載板FRU信息設 備的FRU數(shù)據(jù),如果讀取成功,則執(zhí)行步驟506,否則,執(zhí)行步驟508。
步驟506: MCMC1對讀取的備承載板FRU信息設備的FRU數(shù)據(jù)進行校 驗,如果校驗正確,MCMC1接受備承載板FRU信息設備的FRU數(shù)據(jù),執(zhí)行 步驟509,否則,執(zhí)行步驟508。
步驟507:判斷讀備承載板FRU信息設備的FRU數(shù)據(jù)是否成功,如果成 功,則MCMC1接受備承載板FRU信息設備的FRU數(shù)據(jù),執(zhí)行步驟509,如 果不成功,則MCMC1接受主承載板FRU信息設備的FRU數(shù)據(jù),且利用備承 載板FRU信息設備同步主承載板FRU信息設備的FRU數(shù)據(jù),執(zhí)行步驟509。
這里,承載板FRU信息設備數(shù)據(jù)同步通過IPMB—L, CAN,串口及其他 總線實現(xiàn)。
步驟508:確定備承載板FRU信息設備不在位或發(fā)生故障,返回步驟501。 步驟509: MCMC按照備承載板FRU信息設備的FRU數(shù)據(jù)配置系統(tǒng)設備。 同樣,當MCMC1和MCMC2發(fā)生主備倒換或者MCMC2主用時,從 MCMC2開始啟動,MCMC1為備用,按照圖5示意流程,進行倒換控制。承 載板FRU信息設備的冗余配置保證了主備FRU存儲設備數(shù)據(jù)的同步一致性。 同時在主用承載板FRU信息設備發(fā)生故障時,MCH不需要啟動復雜的主備倒 換流程,增加系統(tǒng)倒換負擔,而只需要增加到對板的專用^C通道訪問對板承載板FRU信息設備,降低了系統(tǒng)倒換負擔及倒換引起的風險,提高MicroTCA 系統(tǒng)可靠性。
當MCMC校驗承載板FRU信息設備存儲的FRU數(shù)據(jù)通過后,MCMC首 先分析承載板FRU信息設備中的承載板FRU記錄。從其中的復合記錄(Multi Record )中提取出"承載板激活與電源管理記錄(Activation and Power Management Record)",根據(jù)其中的"FRU激活與電源控制描述記錄(FRU Activation and Power Descriptor ),,的配置參數(shù),決定是否激活該岸義載板FRU信 息設備。如果配置參數(shù)為允許激活,則MCMC通過IPMB命令發(fā)送Set FRU Activation ( Activate FRU)命令激活承載板FRU信息設備,該承載板FRU信 息設備進入激活狀態(tài)。然后,MCMC比較MCH、 AMC單板中的FRU資源信 息中各端口能力,決定AMC或MCH星型端口是否使能。承載板管理器與AMC 上的MMC模塊或者MCH上的MCMC模塊傳遞各自對應端口能力信息。保 證只有兼容的端口才能使能打開。
綜上所示,本發(fā)明實施例具有如下優(yōu)點
(1) 提供MCH通過串行總線對本板及對板MCH對應的承載板FRU信 息設備可靠管理方案,提高系統(tǒng)可靠性。
(2) 提供承載板FRU信息設備冗余備份同步的過程和方法,保證承載板 FRU信息設備信息同步。
(3) 當MCH對應承載板FRU信息設備發(fā)生故障時,MCH不需要啟動 復雜的主備倒換流程,而只需要通過訪問備用承載板FRU信息設備獲取正確 的系統(tǒng)啟動信息。
顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā) 明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及 其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權利要求
1、一種小型電信和計算通用硬件平臺架構MicroTCA系統(tǒng)的可靠性管理的方法,所述MicroTCA系統(tǒng)至少包括MicroTCA承載管理控制器MCMC、主承載板FRU信息設備以及備承載板FRU信息設備,其特征在于,該方法包括當確定主承載板FRU信息設備不在位或發(fā)生故障時,所述承載管理控制器MCMC利用所述備承載板FRU信息設備的FRU數(shù)據(jù)進行配置處理。
2、 根據(jù)權利要求1所述的方法,其特征在于,確定主承載板FRU信息設 備是否發(fā)生故障包括在主承載板FRU信息設備在位,但無法讀取主承載板FRU信息設備的 FRU數(shù)據(jù),或,對所述主承載板FRU信息設備所保存的信息校驗不成功時, 確定主承載板FRU信息設備發(fā)生故障。
3、 根據(jù)權利要求1所述的方法,其特征在于,當確定主承載板FRU信息 設備不在位或發(fā)生故障時,該方法進一步包括利用所述備承載板FRU信息 設備的FRU數(shù)據(jù)更新所述主承載板FRU信息設備所保存的FRU數(shù)據(jù)。
4、 根據(jù)權利要求3所述的方法,其特征在于,在利用所述備承載板FRU 信息設備的數(shù)據(jù)更新所述主承載板FRU信息設備所保存的FRU數(shù)據(jù)之前,該 方法進一步包括判斷備承載板FRU信息設備是否在位,在所述備承載板FRU信息設備在 位,且讀數(shù)據(jù)成功并對讀取的數(shù)據(jù)校驗成功時,獲得所述備承載板FRU信息 設備所保存的FRU數(shù)據(jù)。
5、 根據(jù)權利要求4所述的方法,其特征在于,當主承載板FRU信息設備 不在位或發(fā)生故障時,且所述備承載板FRU信息設備不在位或發(fā)生故障時, 提示用戶系統(tǒng)發(fā)生故障。
6、 根據(jù)權利要求1所述的方法,其特征在于,當確定主承載板FRU信息 設備運行正常時,利用所述主承載板FRU信息設備的FRU數(shù)據(jù)進行配置處理。
7、 一種MicroTCA系統(tǒng),包括MCMC、主承載板FRU信息設備以及備承載板FRU信息設備,其特征在于,所述MCMC與主承載板FRU信息設備 以及備承載板FRU信息設備分別相連,所述主承載板FRU信息設備,用于在正常運行時,向所述MCMC提供 FRU數(shù)據(jù);所述備承載板FRU信息設備,用于在所述主承載板FRU信息設備不在位 或發(fā)生故障時,向所述MCMC提供FRU數(shù)據(jù);所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進行配置處理。
8、 根據(jù)權利要求7所述的系統(tǒng),其特征在于,所述MCMC包括 數(shù)據(jù)獲取單元,用于在主承載板FRU信息設備運行正常時,從所述主承載板FRU信息設備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設備不在位或 發(fā)生故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù); 配置單元,用于利用獲取的FRU數(shù)據(jù)進行配置處理。
9、 根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述MCMC還包括 第一檢測單元,用于檢測所述主承載板FRU信息設備運行是否正常。
10、 根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述MCMC還包括第二檢測單元,用于在所述主承載板FRU信息設備不在位或發(fā)生故障時, 檢測所述備承載板FRU信息設備是否在位或發(fā)生故障;所試教椐獲取單l用千在所述備承栽板FRU信息設備在位或沒有發(fā)生 故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù)。
11、 根據(jù)權利要求IO所述的系統(tǒng),其特征在于,所述MCMC還包括 告警單元,用于在所述備承載板FRU信息設備不在位或發(fā)生故障時,提示用戶系統(tǒng)發(fā)生故障。
12、 根據(jù)權利要求7所述的系統(tǒng),其特征在于,所述MCMC與備承載板 FRU信息設備通過^C總線、IPMB-L管理總線、CAN或串口相連。
13、 根據(jù)權利要求7所述的系統(tǒng),其特征在于,所述MCMC還包括 同步更新單元,用于當主承載板FRU信息設備不在位或發(fā)生故障時,利用所述備承載板FRU信息設備的FRU數(shù)據(jù)更新所述主承載板FRU信息設備 所保存的FRU數(shù)據(jù)。
14、 一種MicroTCA承載管理控制器,其特征在于,包括 數(shù)據(jù)獲取單元,用于在主承載板FRU信息設備運行正常時,從所述主承載板FRU信息設備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設備不在位或 發(fā)生故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù); 配置單元,用于利用獲取的FRU數(shù)據(jù)進行配置處理。
15、 根據(jù)權利要求14所述的控制器,其特征在于,所述控制器還包括 第一檢測單元,用于檢測所述主承載板FRU信息設備運行是否正常。
16、 根據(jù)權利要求14所述的控制器,其特征在于,所述控制器還包括 第二檢測單元,用于在所述主承載板FRU信息設備不在位或發(fā)生故障時,檢測所述備承載板FRU信息設備是否在位或發(fā)生故障;所述數(shù)據(jù)獲取單元,用于在所述備承載板FRU信息設備在位或沒有發(fā)生 故障時,從所述備承載板FRU信息設備獲取FRU數(shù)據(jù)。
17、 根據(jù)權利要求14所述的控制器,其特征在于,所述控制器還包括 同步更新單元,用于當主承載板FRU信息設備不在位或發(fā)生故障時,利用所述備承載板FRU信息設備的FRU數(shù)據(jù)更新所述主承載板FRU信息設備 所保存的FRU數(shù)據(jù)。
全文摘要
本發(fā)明公開了一種小型電信和計算通用硬件平臺架構(MicroTCA)系統(tǒng)的可靠性管理的方法,所述MicroTCA系統(tǒng)至少包括MicroTCA承載管理控制器(MCMC)、主承載板FRU信息設備以及備承載板FRU信息設備,該方法包括當確定主承載板FRU信息設備不在位或發(fā)生故障時,利用所述備承載板FRU信息設備的FRU數(shù)據(jù)進行配置處理。同時,本發(fā)明還公開了一種MicroTCA系統(tǒng)以及MicroTCA承載管理控制器。本發(fā)明實施例中,當承載板FRU信息設備發(fā)生故障時,不需要啟動復雜的主備倒換流程,而只需要通過訪問備用承載板FRU信息設備獲取正確的FRU數(shù)據(jù),進而可以實現(xiàn)對系統(tǒng)設備進行正常配置和管理。
文檔編號H04Q3/00GK101415127SQ20071016319
公開日2009年4月22日 申請日期2007年10月16日 優(yōu)先權日2007年10月16日
發(fā)明者夏強志, 方慶銀 申請人:華為技術有限公司