專利名稱:一種基于Intel Brickland-EX平臺(tái)的同頻鎖步模式的自動(dòng)切換方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體地說是一種基于Intel Brickland-EX平臺(tái)同頻鎖步模式的自動(dòng)切換方法。
背景技術(shù):
Intel Brickland-EX平臺(tái)處理器的訪存方式共有兩種
其一稱作Performance模式,也叫Independent模式,在這種模式下,處理器下游每個(gè)內(nèi)存通道都是獨(dú)立的,處理器在讀寫操作時(shí)在每個(gè)內(nèi)存通道均以完整cache line傳輸,可以充分保證訪存的高性能;
其二稱作Lockstep模式,也稱為同頻鎖步模式,在這種模式下,處理器下游的內(nèi)存通道兩兩進(jìn)行同頻鎖步,處理器在讀寫操作時(shí)在同頻鎖步的兩個(gè)內(nèi)存通道以一半cache line傳輸數(shù)據(jù),兩個(gè)同頻鎖步的內(nèi)存通道組合起來才是一個(gè)完整的cache line,這樣做的好處是減少內(nèi)存通道的負(fù)載,使ECC糾錯(cuò)更加游刃有余,大幅提聞系統(tǒng)訪存的可罪性,但可以看出在Lockstep模式下,處理器訪存性能降低了一半。綜上,在Brickland-EX平臺(tái)下兩種處理器訪存方式各有利弊,那么在實(shí)際應(yīng)用過程中,如何選擇便成為一個(gè)難以決定的問題。本文闡述的就是基于Intel Brickland-EX平臺(tái)的同頻鎖步模式自動(dòng)切換方法
在服務(wù)器領(lǐng)域,尤其是基于Intel Brickland-EX平臺(tái)下的高端服務(wù)器領(lǐng)域中,由于處理器數(shù)量多,內(nèi)存容量大,加之整個(gè)架構(gòu)和連接非常復(fù)雜,給系統(tǒng)的穩(wěn)定性帶來極大的挑戰(zhàn);在實(shí)際應(yīng)用方面,系統(tǒng)不穩(wěn)定的大多數(shù)可能來自于訪存錯(cuò)誤,訪存發(fā)生問題,就會(huì)可以直接導(dǎo)致系統(tǒng)藍(lán)屏或死機(jī)。服務(wù)器生廠商或芯片生產(chǎn)商往往提供一些提高穩(wěn)定性的功能,它們以損失性能為代價(jià),提高了系統(tǒng)可靠性。本文前部分介紹的同頻鎖步模式就是這樣一種功能。但性能是很多客戶不愿意舍去的,尤其在高性能運(yùn)算應(yīng)用中,性能是重中之重,客戶不惜花費(fèi)重金購買多核高主頻處理器,構(gòu)建大容量?jī)?nèi)存系統(tǒng),目的就是追求良好的性能。因此,如何在性能及可靠性之間斡旋,成為一個(gè)值得討論的話題;盡可能保證系統(tǒng)性能,在必要的時(shí)候再選擇犧牲性能換取穩(wěn)定性才是正確的理念。本文講述的同頻鎖步模式自動(dòng)切換方法遵循這樣的理念,具有極強(qiáng)的實(shí)用性和極高的商業(yè)價(jià)值。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于Intel Brickland-EX平臺(tái)的同頻鎖步模式自動(dòng)切換方法。本發(fā)明的目的是按以下方式實(shí)現(xiàn)的,自動(dòng)切換步驟如下
O為了保證系統(tǒng)訪存性能,BIOS將系統(tǒng)默認(rèn)的訪存模式設(shè)置為Performance模式,并開啟CPU ECC糾錯(cuò)功能,在Brickland-EX平臺(tái)表現(xiàn)為SDDC或DDDC功能;2)如果訪存時(shí)發(fā)生2bit以下的錯(cuò)誤,通過ECC功能可以將錯(cuò)誤糾正,2bit以上錯(cuò)誤則需要啟用DDDC功能糾正,同時(shí)BIOS需要將記錄這一次錯(cuò)誤并通過PCH的LPC總線傳送給BMC ;
3)BMC設(shè)置閥值計(jì)數(shù)器,當(dāng)接收BIOS傳送的錯(cuò)誤數(shù)量達(dá)到10次以上時(shí),閥值計(jì)數(shù)器溢出,BMC將溢出的I寫入EEPROM保存;于此同時(shí)BMC設(shè)置內(nèi)存位置編碼寄存器記錄報(bào)錯(cuò)內(nèi)存的位置,一并寫入EEPROM中保存;
4)系統(tǒng)在下一次重啟或重新開機(jī)時(shí),BMC首先從EEPROM中獲取報(bào)錯(cuò)內(nèi)存的位置,并確認(rèn)此位置內(nèi)存是否被更換,如果發(fā)現(xiàn)已經(jīng)替換為新的內(nèi)存,BIOS將啟用默認(rèn)的 Performance訪存模式,BMC清空內(nèi)存位置編碼寄存器和閥值寄存器;如果發(fā)現(xiàn)報(bào)錯(cuò)的內(nèi)存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPI0,告知BIOS需將訪存切換為同頻鎖步模式;
5)通過監(jiān)控管理單元收集內(nèi)存報(bào)錯(cuò)信息,并設(shè)置閥值,錯(cuò)誤超過這個(gè)閥值則在系統(tǒng)重啟過程中,BIOS將CPU的訪存模式自動(dòng)設(shè)置為同頻鎖步模式以保證系統(tǒng)訪存穩(wěn)定性,這樣就降低了總線負(fù)荷,降低至1/2 cache line,并提高了 ECC的糾錯(cuò)能力;
6)維修過故障內(nèi)存后,或長(zhǎng)時(shí)間沒有發(fā)生內(nèi)存錯(cuò)誤時(shí),監(jiān)控管理單元再通過BIOS將訪存方式再次變更Performance模式。本發(fā)明的有益效果是將系統(tǒng)默認(rèn)的工作模式設(shè)置為Performance模式,通過監(jiān)控管理單元收集內(nèi)存報(bào)錯(cuò)信息,并設(shè)置閥值,錯(cuò)誤超過這個(gè)閥值則在系統(tǒng)重啟過程中,BIOS將CPU的訪存模式自動(dòng)設(shè)置為同頻鎖步模式以保證系統(tǒng)訪存穩(wěn)定性,這樣就降低了總線負(fù)荷,降低至1/2 cache line,并提高了 ECC的糾錯(cuò)能力,保證系統(tǒng)訪存性能。
圖I是Performance模式體系架構(gòu) 圖2是同頻鎖步模式體系架構(gòu) 圖3是切換訪存模式的體系架構(gòu) 圖4是自動(dòng)切換流程圖。
具體實(shí)施例方式
參照說明書附圖對(duì)本發(fā)明的方法作以下詳細(xì)地說明。本發(fā)明提出了一種基于Intel Brickland-EX平臺(tái)的Lockstep自動(dòng)切換方法,利用監(jiān)控管理單元收集內(nèi)存報(bào)錯(cuò)信息,并通過BIOS切換處理器訪存方式;可以盡可能保證服務(wù)器系統(tǒng)的性能,在必要的時(shí)候選擇犧牲性能換取系統(tǒng)穩(wěn)定性。Intel Brickland-EX訪存體系架構(gòu)如圖I所示同頻鎖步切換訪存模式的體系架構(gòu)如圖2所示
系統(tǒng)自動(dòng)切換步驟如下如圖3、圖4所示;
O為了保證系統(tǒng)訪存性能,BIOS將系統(tǒng)默認(rèn)的訪存模式設(shè)置為Performance模式,并開啟CPU ECC糾錯(cuò)功能,在Brickland-EX平臺(tái)表現(xiàn)為SDDC或DDDC功能;
2)如果訪存時(shí)發(fā)生2bit以下的錯(cuò)誤,通過ECC功能可以將錯(cuò)誤糾正,2bit錯(cuò)誤需要啟用DDDC功能糾正,同時(shí)BIOS需要將記錄這一次錯(cuò)誤并通過PCH的LPC總線傳送給BMC ;3)BMC設(shè)置閥值計(jì)數(shù)器,當(dāng)接收BIOS傳送的錯(cuò)誤數(shù)量達(dá)到10次以上時(shí),閥值計(jì)數(shù)器溢出,BMC將溢出的I寫入EEPROM保存;于此同時(shí)BMC設(shè)置內(nèi)存位置編碼寄存器記錄報(bào)錯(cuò)內(nèi)存的位置,一并寫入EEPROM中保存;
4)系統(tǒng)在下一次重啟或重新開機(jī)時(shí),BMC首先從EEPROM中獲取報(bào)錯(cuò)內(nèi)存的位置,并確認(rèn)此位置內(nèi)存是否被更換,如果發(fā)現(xiàn)已經(jīng)替換為新的內(nèi)存,BIOS將啟用默認(rèn)的Performance訪存模式,BMC清空內(nèi)存位置編碼寄存器和閥值寄存器;如果發(fā)現(xiàn)報(bào)錯(cuò)的內(nèi)存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPI0,告知BIOS需將訪存切換為L(zhǎng)ockst印模式;
5)系統(tǒng)開機(jī)后,BIOS將CPU的訪存模式自動(dòng)設(shè)置為L(zhǎng)ockstep;這樣就降低了總線負(fù)荷,降低至1/2 cache line,并提高了 ECC的糾錯(cuò)能力;
6)維修過故障內(nèi)存后,或長(zhǎng)時(shí)間沒有發(fā)生內(nèi)存錯(cuò)誤時(shí),監(jiān)控管理單元再通過BIOS將訪 存方式再次變更Performance模式。除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種基于Intel Brickland-EX平臺(tái)的同頻鎖步模式自動(dòng)切換方法,其特征在于自動(dòng)切換步驟如下 .1)為了保證系統(tǒng)訪存性能,BIOS將系統(tǒng)默認(rèn)的訪存模式設(shè)置為Performance模式,并開啟CPU ECC糾錯(cuò)功能,在Brickland-EX平臺(tái)表現(xiàn)為SDDC或DDDC功能; .2)如果訪存時(shí)發(fā)生2bit以下的錯(cuò)誤,通過ECC功能可以將錯(cuò)誤糾正,2bit以上錯(cuò)誤則需要啟用DDDC功能糾正,同時(shí)BIOS需要將記錄這一次錯(cuò)誤并通過PCH的LPC總線傳送給BMC ; .3)BMC設(shè)置閥值計(jì)數(shù)器,當(dāng)接收BIOS傳送的錯(cuò)誤數(shù)量達(dá)到10次以上時(shí),閥值計(jì)數(shù)器溢出,BMC將溢出的I寫入EEPROM保存;于此同時(shí)BMC設(shè)置內(nèi)存位置編碼寄存器記錄報(bào)錯(cuò)內(nèi)存的位置,一并寫入EEPROM中保存; .4)系統(tǒng)在下一次重啟或重新開機(jī)時(shí),BMC首先從EEPROM中獲取報(bào)錯(cuò)內(nèi)存的位置,并確認(rèn)此位置內(nèi)存是否被更換,如果發(fā)現(xiàn)已經(jīng)替換為新的內(nèi)存,BIOS將啟用默認(rèn)的 Performance訪存模式,BMC清空內(nèi)存位置編碼寄存器和閥值寄存器;如果發(fā)現(xiàn)報(bào)錯(cuò)的內(nèi)存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPI0,告知BIOS需將訪存切換為同頻鎖步模式; .5)通過監(jiān)控管理單元收集內(nèi)存報(bào)錯(cuò)信息,并設(shè)置閥值,錯(cuò)誤超過這個(gè)閥值則在系統(tǒng)重啟過程中,BIOS將CPU的訪存模式自動(dòng)設(shè)置為同頻鎖步模式以保證系統(tǒng)訪存穩(wěn)定性,這樣就降低了總線負(fù)荷,降低至1/2 cache line,并提高了 ECC的糾錯(cuò)能力; .6)維修過故障內(nèi)存后,或長(zhǎng)時(shí)間沒有發(fā)生內(nèi)存錯(cuò)誤時(shí),監(jiān)控管理單元通過BIOS將訪存方式再次變更為Performance模式。
全文摘要
本發(fā)明提供一種基于Intel Brickland-EX平臺(tái)的同頻鎖步模式的自動(dòng)切換方法,將系統(tǒng)默認(rèn)的工作模式設(shè)置為Performance模式,通過監(jiān)控管理單元收集內(nèi)存報(bào)錯(cuò)信息,并設(shè)置閥值,錯(cuò)誤超過這個(gè)閥值則在系統(tǒng)重啟過程中,BIOS將CPU的訪存模式自動(dòng)設(shè)置為同頻鎖步模式以保證系統(tǒng)訪存穩(wěn)定性,這樣就降低了總線負(fù)荷,降低至1/2cacheline,并提高了ECC的糾錯(cuò)能力,保證系統(tǒng)訪存性能。
文檔編號(hào)G06F11/08GK102968354SQ20121045314
公開日2013年3月13日 申請(qǐng)日期2012年11月13日 優(yōu)先權(quán)日2012年11月13日
發(fā)明者李博樂, 林楷智 申請(qǐng)人:浪潮電子信息產(chǎn)業(yè)股份有限公司