本發(fā)明屬于服務(wù)器時鐘管理領(lǐng)域,具體涉及一種服務(wù)器時鐘故障自動檢測修復系統(tǒng)及方法。
背景技術(shù):
系統(tǒng)時鐘是服務(wù)器系統(tǒng)中非常重要的組成部分,在服務(wù)器中多用來為CPU(中央處理器)、PCH、PCIE槽、BMC(管理控制器)等設(shè)備提供時鐘。系統(tǒng)時鐘需要滿足一定的頻率要求,當系統(tǒng)時鐘頻率超出允許范圍時,服務(wù)器會發(fā)生計時不準、可靠性降低、甚至是宕機等問題。
目前的服務(wù)器系統(tǒng)設(shè)計中,很少對系統(tǒng)時鐘質(zhì)量進行監(jiān)控。有的設(shè)計雖然采用的冗余的時鐘,但是又不支持時鐘故障的識別和自動切換,需要手動切換時鐘源。當系統(tǒng)因時鐘問題而出現(xiàn)故障時,既不能保證系統(tǒng)自動恢復正常工作,又不能快速定位系統(tǒng)問題所在,而需要工程師現(xiàn)場調(diào)試分析。這不利于服務(wù)器的穩(wěn)定性和易維護性。
此為現(xiàn)有技術(shù)不足之處。因此,針對現(xiàn)有技術(shù)中的上述缺陷,提供設(shè)計一種服務(wù)器時鐘故障自動檢測修復系統(tǒng)及方法,是非常有必要的。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于,針對上述服務(wù)器系統(tǒng)時鐘故障不能識別和自動切換的缺陷,提供一種服務(wù)器時鐘故障自動檢測修復系統(tǒng)及方法,以解決上述技術(shù)問題。
為實現(xiàn)上述目的,本發(fā)明給出以下技術(shù)方案:
一種服務(wù)器時鐘故障自動檢測修復系統(tǒng),包括第一時鐘源,與第一時鐘源連接的時鐘分路單元,與時鐘分路單元連接的若干終端、時鐘檢測單元,與時鐘檢測單元連接的參考時鐘源、管理控制器;
第一時鐘源,用于提供時鐘信號;
時鐘分路單元,用于將第一時鐘源提供的時鐘信號分路;
若干終端,使用第一時鐘源分路后的系統(tǒng)時鐘;
時鐘檢測單元,用于檢測第一時鐘源分路后的時鐘信號,并發(fā)送時鐘質(zhì)量檢測結(jié)果;
參考時鐘源,用于給時鐘檢測單元提供計時時間;
管理控制器,用于接收時鐘檢測單元的時鐘質(zhì)量檢測結(jié)果,并在管理界面報告時鐘故障信號。
進一步地,第一時鐘源和時鐘分路單元之間還包括時鐘選通單元,時鐘選通單元還連接至少一個冗余時鐘源;
冗余時鐘源用于提供備用時鐘信號給時鐘選通單元;時鐘選通單元用于接收管理控制器的時鐘選通信號,并切換時鐘信號提供給時鐘分路單元。
進一步地,所述參考時鐘源為晶振,晶振為32.768kHZ的晶振。
進一步地,所述終端包括中央處理器CPU,南橋芯片PCH,PCIE槽,管理控制器。
進一步地,時鐘檢測單元采用復雜可編程邏輯器件CPLD、現(xiàn)場可編程門陣列FPGA或者數(shù)字電路;時鐘分路單元采用時鐘緩沖器或者南橋芯片PCH。
進一步地,第一時鐘源設(shè)置在主板上或者獨立的板卡上,冗余時鐘源設(shè)置在獨立的板卡上;第一時鐘源和冗余時鐘源可以設(shè)在同一個獨立的板卡上,也可以設(shè)在不同的獨立板卡上。
本發(fā)明還提供如下技術(shù)方案:
一種服務(wù)器時鐘故障自動檢測修復方法,包括如下步驟:
步驟1. 通過第一時鐘源提供時鐘信號;
步驟2. 通過時鐘分路單元分路時鐘信號;
步驟3. 通過時鐘檢測單元檢測時鐘信號;
步驟4. 通過時鐘檢測單元發(fā)送時鐘質(zhì)量檢測結(jié)果給管理控制器;
步驟5. 若時鐘信號正常,回到步驟3;
若時鐘信號不正常,管理控制器報告時鐘故障信號。
進一步地,步驟5之后包括如下步驟:
步驟6. 通過管理控制器向時鐘選通單元發(fā)送時鐘選通信號;
步驟7. 通過時鐘選通單元切換時鐘信號,回到步驟2。
進一步地,步驟3中檢測時鐘信號的步驟如下:
步驟31.系統(tǒng)時鐘頻率記為F;設(shè)置參考時鐘源的計時時間為T;
步驟32.在計時時間T內(nèi),對系統(tǒng)時鐘進行計數(shù),數(shù)目記為n;
步驟33.比較理論計數(shù)值T*F與實際計數(shù)值n之間的關(guān)系;
步驟34.設(shè)定允許的誤差范圍為δ;
若|T*F-n|/(T*F)大于δ,則判定為系統(tǒng)時鐘信號異常;
若|T*F-n|/(T*F)小于等于δ,則判定為系統(tǒng)時鐘信號正常。
進一步地,所述步驟34中設(shè)定允許的誤差范圍根據(jù)允許的時鐘頻率偏差和允許的參考時鐘源計時偏差設(shè)定。
本發(fā)明的有益效果在于:本發(fā)明對服務(wù)器系統(tǒng)時鐘增加了監(jiān)控和自動切換機制,當時鐘存在故障時,管理控制器在管理界面報告該故障,并控制時鐘選通單元切換時鐘源,保證系統(tǒng)正常工作。
此外,本發(fā)明設(shè)計原理可靠,結(jié)構(gòu)簡單,具有非常廣泛的應(yīng)用前景。
由此可見,本發(fā)明與現(xiàn)有技術(shù)相比,具有突出的實質(zhì)性特點和顯著的進步,其實施的有益效果也是顯而易見的。
附圖說明
圖1為本發(fā)明系統(tǒng)的連接示意圖;
圖2為本發(fā)明的方法流程圖;
其中,1.管理控制器;2.時鐘選通單元;3.第一時鐘源;4.冗余時鐘源;5.時鐘分路單元;6.時鐘檢測單元;7.終端;8.參考時鐘源。
具體實施方式:
為使得本發(fā)明的目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明具體實施例中的附圖,對本發(fā)明中的技術(shù)方案進行清楚、完整地描述。
如圖1所示,一種服務(wù)器時鐘故障自動檢測修復系統(tǒng),包括第一時鐘源3,與第一時鐘源3連接的時鐘分路單元5,與時鐘分路單元5連接的若干終端7、時鐘檢測單元6,與時鐘檢測單元6連接的參考時鐘源8、管理控制器1;
第一時鐘源3,用于提供時鐘信號;
時鐘分路單元5,用于將第一時鐘源3提供的時鐘信號分路;
若干終端7,使用第一時鐘源3分路后的系統(tǒng)時鐘;
時鐘檢測單元6,用于檢測第一時鐘源3分路后的時鐘信號,并發(fā)送時鐘質(zhì)量檢測結(jié)果;
參考時鐘源8,用于給時鐘檢測單元6提供計時時間;
管理控制器1,用于接收時鐘檢測單元6的時鐘質(zhì)量檢測結(jié)果,并在管理界面報告時鐘故障信號。
第一時鐘源3和時鐘分路單元5之間還包括時鐘選通單元2,時鐘選通單元2還連接至少一個冗余時鐘源4;
冗余時鐘源4用于提供備用時鐘信號給時鐘選通單元2;時鐘選通單元2用于接收管理控制器1的時鐘選通信號,并切換時鐘信號提供給時鐘分路單元5。
所述參考時鐘源8為晶振,晶振為32.768kHZ的晶振。
所述終端7包括中央處理器CPU,南橋芯片PCH,PCIE槽,管理控制器。
時鐘檢測單元6采用復雜可編程邏輯器件CPLD、現(xiàn)場可編程門陣列FPGA或者數(shù)字電路;時鐘分路單元5采用時鐘緩沖器或者南橋芯片PCH。
第一時鐘源3設(shè)置在主板上或者獨立的板卡上,冗余時鐘源4設(shè)置在獨立的板卡上;第一時鐘源3和冗余時鐘源4可以設(shè)在同一個獨立的板卡上,也可以設(shè)在不同的獨立板卡上。
如圖2所示,一種服務(wù)器時鐘故障自動檢測修復方法,包括如下步驟:
步驟1. 通過第一時鐘源提供時鐘信號;
步驟2. 通過時鐘分路單元分路時鐘信號;
步驟3. 通過時鐘檢測單元檢測時鐘信號;
步驟4. 通過時鐘檢測單元發(fā)送時鐘質(zhì)量檢測結(jié)果給管理控制器;
步驟5. 若時鐘信號正常,回到步驟3;
若時鐘信號不正常,管理控制器報告時鐘故障信號。
步驟5之后包括如下步驟:
步驟6. 通過管理控制器向時鐘選通單元發(fā)送時鐘選通信號;
步驟7. 通過時鐘選通單元切換時鐘信號,回到步驟2。
步驟3中檢測時鐘信號的步驟如下:
步驟31.系統(tǒng)時鐘頻率記為F;設(shè)置參考時鐘源的計時時間為T;
步驟32.在計時時間T內(nèi),對系統(tǒng)時鐘進行計數(shù),數(shù)目記為n;
步驟33.比較理論計數(shù)值T*F與實際計數(shù)值n之間的關(guān)系;
步驟34.設(shè)定允許的誤差范圍為δ;
若|T*F-n|/(T*F)大于δ,則判定為系統(tǒng)時鐘信號異常;
若|T*F-n|/(T*F)小于等于δ,則判定為系統(tǒng)時鐘信號正常。
所述步驟34中設(shè)定允許的誤差范圍根據(jù)允許的時鐘頻率偏差和允許的參考時鐘源計時偏差設(shè)定。
本發(fā)明的實施例是說明性的,而非限定性的,上述實施例只是幫助理解本發(fā)明,因此本發(fā)明不限于具體實施方式中所述的實施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進等得出的其他的具體實施方式,同樣屬于本發(fā)明保護的范圍。