專利名稱:用于向多處理器系統(tǒng)中的處理器供電的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及具有多微處理器的計(jì)算系統(tǒng)。尤其是,本發(fā)明涉及用于向多微處理器系統(tǒng)中的處理器供電的方法和裝置背景技術(shù)我們的社會(huì)在我們的許多日常活動(dòng)中很大程度地依賴于計(jì)算機(jī)系統(tǒng)。采用處理器的計(jì)算機(jī)系統(tǒng)對(duì)我們的住宅、我們的營(yíng)業(yè)場(chǎng)所、我們的生產(chǎn)設(shè)施、我們的汽車、甚至外太空宇宙飛船及地球同步人造衛(wèi)星中的設(shè)備進(jìn)行控制。在諸如臺(tái)式計(jì)算機(jī)和膝上計(jì)算機(jī)這樣的設(shè)備、大型計(jì)算系統(tǒng)、以及諸如移動(dòng)電話和手持計(jì)算機(jī)這樣的便攜式設(shè)備中能夠發(fā)現(xiàn)計(jì)算機(jī)和處理器。
除了現(xiàn)有的這些應(yīng)用之外,人們不斷地發(fā)現(xiàn)計(jì)算機(jī)系統(tǒng)的新應(yīng)用。許多應(yīng)用需要改善的處理器性能,并且使現(xiàn)代的計(jì)算機(jī)系統(tǒng)承受重負(fù)。計(jì)算機(jī)設(shè)計(jì)者正不斷設(shè)法提高的改善的處理器性能的示例包括處理器速度增加,并且數(shù)據(jù)吞吐率更快。需要改善的處理器性能的應(yīng)用示例是視頻和語(yǔ)音識(shí)別、氣候或天氣建模、液體湍流建模、人類基因組映射、儲(chǔ)油器建模、以及海洋環(huán)流建模。由于大量的數(shù)學(xué)計(jì)算,所以所有這些應(yīng)用都需要令人無(wú)法想象的數(shù)量的計(jì)算能力。
為了滿足這些應(yīng)用的需要,計(jì)算機(jī)系統(tǒng)設(shè)計(jì)者對(duì)處理器、主要是微處理器的體系結(jié)構(gòu)做出了極大的改變。例如,十九世紀(jì)八十年代以及九十年代早期的計(jì)算機(jī)系統(tǒng)通常具有用于按照線性或順序方式來(lái)對(duì)數(shù)據(jù)進(jìn)行處理的單個(gè)中央處理單元。令人遺憾地,由于微處理器的物理限制而使這種順序的體系結(jié)構(gòu)僅提供了有限量的計(jì)算能力。因此,當(dāng)今的計(jì)算機(jī)通常采用在諸如并行體系結(jié)構(gòu)這樣的各種處理器體系結(jié)構(gòu)中多個(gè)同時(shí)運(yùn)行(crunch)的多個(gè)處理器。
如所描述的那樣,當(dāng)今的許多計(jì)算系統(tǒng)包括多個(gè)處理器。隨著計(jì)算機(jī)中的處理器數(shù)目的增大,創(chuàng)建這些多處理器系統(tǒng)的設(shè)計(jì)者還傾向于采用各種技術(shù)和設(shè)計(jì)方法來(lái)對(duì)這些計(jì)算機(jī)系統(tǒng)的另外的計(jì)算性能進(jìn)行調(diào)整(tweak)。這種技術(shù)和設(shè)計(jì)方法包括流水線技術(shù)(pipelining)、矢量處理、以及利用超標(biāo)量體系結(jié)構(gòu)。采用這些技術(shù)和設(shè)計(jì)方法的計(jì)算機(jī)系統(tǒng)通常遵循摩爾定律,該摩爾定律陳述了芯片上的晶體管和電阻器的數(shù)目每十八個(gè)月加一倍。在當(dāng)今,發(fā)現(xiàn)包含有百萬(wàn)乃至上億個(gè)晶體管的高級(jí)計(jì)算機(jī)系統(tǒng)芯片,是很平常的。
令人遺憾地,采用數(shù)目不斷增多的晶體管和其他集成電路元件的計(jì)算機(jī)系統(tǒng)和計(jì)算機(jī)芯片傾向于比具有較少元件的系統(tǒng)和設(shè)備更加頻繁地出故障。為了防止這些不斷增加的故障率,計(jì)算機(jī)廠商采用用于提高這些系統(tǒng)的正常運(yùn)行時(shí)間和可靠性的各種設(shè)計(jì)技術(shù)。例如,當(dāng)前在具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)中所使用的、用于提高正常運(yùn)行時(shí)間的一種技術(shù)涉及使具有內(nèi)部故障的處理器停用。在檢測(cè)到處理器具有內(nèi)部故障時(shí),將該處理器保持在復(fù)位狀態(tài)。使出故障的處理器保持在復(fù)位狀態(tài),可以有效地使出故障的處理器的輸出呈三態(tài),從而允許附連于公共總線的其他處理器繼續(xù)操作。
然而,在試圖利用這種技術(shù)允許具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)進(jìn)行操作的過(guò)程中,存在嚴(yán)重的問(wèn)題??赡苡捎谔幚砥鞅旧碇畠?nèi)的問(wèn)題而使處理器出現(xiàn)故障,或者可能由于用于向處理器供電的電壓調(diào)節(jié)器出現(xiàn)問(wèn)題而使處理器出現(xiàn)故障。當(dāng)問(wèn)題在處理器內(nèi)部時(shí),如上所討論的用于使處理器保持在復(fù)位狀態(tài)的技術(shù)可使處理器停用,并且可使多處理器系統(tǒng)繼續(xù)操作。然而,如果由于用于向處理器供電的電壓調(diào)節(jié)器出現(xiàn)問(wèn)題而使處理器出現(xiàn)故障,那么簡(jiǎn)單地試圖使處理器保持在復(fù)位狀態(tài)無(wú)法在沒(méi)有該處理器的情況下使系統(tǒng)繼續(xù)操作。
當(dāng)問(wèn)題與用于向處理器供電的電壓調(diào)節(jié)器相關(guān)時(shí),使處理器保持在復(fù)位狀態(tài)的技術(shù)可能不起作用,因?yàn)樘幚砥餍枰娔芤员阏_地使處理器的輸入和輸出呈三態(tài)。由于其他處理器與相同的數(shù)據(jù)總線、控制總線、以及地址總線相連,因此出故障的處理器的輸入和輸出必須是三態(tài)的。在沒(méi)有正常地呈三態(tài)的情況下,出故障的處理器的輸入和輸出將會(huì)使總線中的信號(hào)線保持在壞態(tài),這防止了其他處理器正常地起作用。
許多多處理器系統(tǒng)的體系結(jié)構(gòu)要求在正常操作期間每個(gè)處理器的核心電壓與其他處理器的核心電壓無(wú)關(guān)。因此,如果電壓供應(yīng)或電壓調(diào)節(jié)器出故障而使得處理器出問(wèn)題,那么由于缺乏電壓而使該處理器不能正常地呈三態(tài)。最經(jīng)常地,核心電壓面(voltage plane)與其他電壓面分離,并且沒(méi)有別的核心電壓源可用。最終結(jié)果是,具有多個(gè)處理器的計(jì)算機(jī)中的單個(gè)電壓調(diào)節(jié)器的故障將會(huì)阻止計(jì)算機(jī)進(jìn)行操作。因此,需要這樣的方法和裝置,該方法和裝置在電壓調(diào)節(jié)器之一出故障時(shí)允許多處理器計(jì)算機(jī)進(jìn)行操作。
發(fā)明內(nèi)容
通過(guò)用于在諸如電壓調(diào)節(jié)器這樣的電壓源損壞時(shí)向處理器提供電壓的方法和裝置,可大部分地解決上面所提出的問(wèn)題。一個(gè)實(shí)施例包括一種用于向具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)中的處理器供電的方法。該方法總體上包括對(duì)下述參數(shù)進(jìn)行監(jiān)控,所述參數(shù)與耦合到處理器上的第一電壓電勢(shì)有關(guān)。當(dāng)所監(jiān)控的參數(shù)或狀態(tài)表明第一電壓損壞或出故障時(shí),那么該方法包括使該電壓與處理器分離;使處理器停用或復(fù)位;以及使第二電壓電勢(shì)耦合到處理器。該方法還可以允許計(jì)算機(jī)系統(tǒng)在停用該處理器的情況下繼續(xù)操作。在各種實(shí)施例中,通過(guò)利用諸如開關(guān)、晶體管、以及繼電器觸點(diǎn)這樣的設(shè)備可實(shí)現(xiàn)第一電壓電勢(shì)的分離、處理器的停用、以及第二電壓電勢(shì)的耦合。
另一實(shí)施例包括一種用于向具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)中的處理器提供電壓的裝置。該裝置可以包括錯(cuò)誤檢測(cè)電路,用于對(duì)與第一電壓調(diào)節(jié)器有關(guān)的錯(cuò)誤進(jìn)行檢測(cè);停用電路,用于響應(yīng)于該錯(cuò)誤而使第一電壓調(diào)節(jié)器停用;處理器分離電路;以及電壓切換電路,用于從第二電壓調(diào)節(jié)器向處理器提供電壓。該裝置的所有元件可存在于一個(gè)被稱為服務(wù)處理器的單個(gè)設(shè)備之中。該裝置可利用晶體管、開關(guān)、以及繼電器觸點(diǎn)來(lái)分離電壓調(diào)節(jié)器,分離處理器,并且將處理器切換到第二電壓調(diào)節(jié)器。
又一個(gè)實(shí)施例包括一種多處理器計(jì)算機(jī)系統(tǒng),該多處理器計(jì)算機(jī)系統(tǒng)包括兩個(gè)或多個(gè)處理器;兩個(gè)或多個(gè)電壓調(diào)節(jié)設(shè)備,用于將電壓提供給處理器;電壓錯(cuò)誤檢測(cè)模塊,用于感測(cè)電壓調(diào)節(jié)模塊的問(wèn)題;電壓分離模塊,用于分離有問(wèn)題的電壓調(diào)節(jié)模塊;以及電壓切換模塊,用于使剩余電壓調(diào)節(jié)模塊中的至少一個(gè)耦合到受到有問(wèn)題的電壓調(diào)節(jié)模塊影響的任何處理器。在其他實(shí)施例中,該計(jì)算機(jī)系統(tǒng)還包括處理器停用模塊,該處理器停用模塊用于使受到有問(wèn)題的電壓調(diào)節(jié)模塊影響的一個(gè)或多個(gè)處理器停用。
在閱讀以下詳細(xì)說(shuō)明并且參考附圖時(shí),可顯而易見地得知本發(fā)明的其他目的以及優(yōu)點(diǎn),在附圖中相同的附圖標(biāo)記表示相似的元件圖1示出了具有兩個(gè)處理器、兩個(gè)電壓調(diào)節(jié)器模塊、以及用于在兩個(gè)調(diào)節(jié)器模塊之間進(jìn)行切換的裝置的多處理器計(jì)算機(jī)系統(tǒng);圖2示出了用于對(duì)送至兩個(gè)處理器的核心電壓進(jìn)行控制的裝置;圖3示出了具有用于對(duì)來(lái)自雙處理器計(jì)算機(jī)系統(tǒng)中的兩個(gè)電壓調(diào)節(jié)器模塊的電壓進(jìn)行控制的服務(wù)處理器的系統(tǒng)圖;圖4示出了具有四個(gè)處理器和兩個(gè)電壓調(diào)節(jié)器模塊、以及用于對(duì)送至處理器的電壓進(jìn)行控制的服務(wù)處理器的多處理器計(jì)算機(jī)系統(tǒng);圖5示出了服務(wù)處理器怎樣控制將來(lái)自四個(gè)電壓調(diào)節(jié)器的電壓送至四個(gè)處理器;圖6示出了具有八個(gè)微處理器、八個(gè)電壓調(diào)節(jié)器模塊、以及兩個(gè)用于在微處理器當(dāng)中切換電壓的服務(wù)處理器的計(jì)算機(jī)系統(tǒng);以及圖7A-7B示出了在處理器電壓調(diào)節(jié)器之一遭遇錯(cuò)誤時(shí)操作多處理器計(jì)算機(jī)的方法。
具體實(shí)施例方式
下面是對(duì)附圖中所描述的本發(fā)明的示例性實(shí)施例的詳細(xì)說(shuō)明。對(duì)示例性實(shí)施例進(jìn)行如此詳述以便清楚地描述本發(fā)明。然而,所提供的大量細(xì)節(jié)不是對(duì)實(shí)施例的可以預(yù)見的變化進(jìn)行限制;而是相反地,意圖覆蓋屬于所附權(quán)利要求書所定義的本發(fā)明的精神和范圍之內(nèi)的所有修改、等效、以及替換。下面的詳細(xì)說(shuō)明用于使本領(lǐng)域的普通技術(shù)人員可顯而易見地實(shí)踐這種該實(shí)施例。
一般而言,公開了用于向多處理器計(jì)算機(jī)系統(tǒng)中的處理器供電的方法、裝置、以及系統(tǒng)。對(duì)用于在檢測(cè)到電壓錯(cuò)誤之后在處理器之間切換電源的新技術(shù)進(jìn)行討論。實(shí)施例包括這樣一種方法,該方法用于對(duì)具有由多個(gè)電壓源供電的多個(gè)處理器的計(jì)算機(jī)系統(tǒng)進(jìn)行監(jiān)控,并且一旦檢測(cè)到電壓錯(cuò)誤就在處理器當(dāng)中切換電源。在這些實(shí)施例中,裝置軟件和/或硬件可檢測(cè)到送至一個(gè)或多個(gè)處理器的電壓在可接受的范圍之外,并且通過(guò)切換來(lái)自替換電源的電壓并分離受影響的處理器(一個(gè)或多個(gè))來(lái)做出反應(yīng)。
在一些實(shí)施例中,利用兩個(gè)獨(dú)立的電壓調(diào)節(jié)器在兩個(gè)處理器之間切換電壓。在其他實(shí)施例中,事實(shí)上可以在任意數(shù)目的、諸如三個(gè)、四個(gè)、八個(gè)、或者更多的處理器之間切換電壓。類似地,送至處理器的電壓可以來(lái)自于多個(gè)不同電源。在許多實(shí)施例中,可以利用諸如場(chǎng)效應(yīng)晶體管這樣的半導(dǎo)體器件對(duì)電壓進(jìn)行切換。在其他實(shí)施例中,可以利用繼電器或其他開關(guān)設(shè)備來(lái)對(duì)送至處理器的電壓進(jìn)行切換。
用于感測(cè)并響應(yīng)不同電壓?jiǎn)栴}的方法在不同實(shí)施例中是不同的。在一些實(shí)施例中,電壓控制單元可以簡(jiǎn)單地對(duì)電壓調(diào)節(jié)器的電壓損失進(jìn)行檢測(cè)。在其他實(shí)施例中,電壓控制單元可以對(duì)諸如電壓下降到低于閾值這樣的更細(xì)微的電壓錯(cuò)誤狀態(tài)進(jìn)行監(jiān)控。甚至在又一個(gè)實(shí)施例中,服務(wù)處理器可以通過(guò)對(duì)來(lái)自電壓調(diào)節(jié)器的、或者來(lái)自由調(diào)節(jié)器供電的處理器的單個(gè)狀態(tài)位進(jìn)行監(jiān)控,來(lái)監(jiān)控電壓錯(cuò)誤。就響應(yīng)于各種錯(cuò)誤而言,一些實(shí)施例中的電壓控制單元可以通過(guò)從未受影響的電壓源向受到電壓錯(cuò)誤影響的處理器供電,并且使該處理器保持在復(fù)位狀態(tài),來(lái)進(jìn)行響應(yīng)。在其他實(shí)施例中,電壓控制單元可以進(jìn)行不同的響應(yīng),例如使送至處理器的輸入狀態(tài)保持為高,這可告知處理器使其輸入和輸出浮動(dòng)。
雖然下面詳細(xì)討論的部分對(duì)包括有用于向具有多個(gè)微處理器的計(jì)算機(jī)系統(tǒng)中的微處理器供電的新技術(shù)的許多實(shí)施例進(jìn)行了描述,但是本領(lǐng)域普通技術(shù)人員應(yīng)該明白的是,可以利用基于處理器的各種計(jì)算機(jī)系統(tǒng)中的許多不同類型的處理器、諸如在多板計(jì)算機(jī)中甚至在大型系統(tǒng)中實(shí)現(xiàn)的處理器來(lái)實(shí)施以下的發(fā)明。雖然將實(shí)施例描述為具有與諸如數(shù)據(jù)總線或存儲(chǔ)器存取總線這樣的單條總線相耦合的處理器,但是各種實(shí)施例中可同時(shí)與多條總線相耦合。此外,實(shí)施例討論了利用晶體管和繼電器在處理器當(dāng)中切換電壓,但是對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)應(yīng)該明白的是,這里所公開的技術(shù)可以利用開關(guān)設(shè)備的幾乎無(wú)盡的變化。用于實(shí)施本發(fā)明的所有配置和方法對(duì)于根據(jù)相似約束條件所采用的、用以執(zhí)行基本上等效的功能的替換實(shí)施例而言是可互換的。
現(xiàn)在轉(zhuǎn)到圖1,圖1描述了具有兩個(gè)處理器、兩個(gè)電壓調(diào)節(jié)器模塊、以及用于在兩個(gè)調(diào)節(jié)器模塊之間進(jìn)行切換的裝置的多處理器計(jì)算機(jī)系統(tǒng)100。更準(zhǔn)確地說(shuō),圖1所示的計(jì)算機(jī)系統(tǒng)100具有通過(guò)單個(gè)總線段128并行地耦合到總線控制器154的第一微處理器118和第二微處理器120。在各種實(shí)施例中,總線段128可以使處理器118和120耦合到具有可變寬度的總線。例如,在一些系統(tǒng)中,總線段128可以包括8位總線段。在其他實(shí)施例中,總線段128可以包括16位、32位、或者甚至更大位數(shù)的總線。
圖形加速端口(AGP)總線158、外圍部件互連(PCI)總線150、以及隨機(jī)存取存儲(chǔ)器(RAM)組(bank)124與總線控制器154相耦合。雖然在該實(shí)施例中微處理器118和微處理器120共用RAM組124并且包括共用的存儲(chǔ)器計(jì)算機(jī)系統(tǒng),但是其他實(shí)施例可以具有按照其他方式設(shè)置的微處理器。例如,作為對(duì)共用一個(gè)存儲(chǔ)器組的微處理器118和微處理器120的替代,如分布式存儲(chǔ)器計(jì)算機(jī)系統(tǒng)中的情況那樣,其他實(shí)施例可以使微處理器118和120具有單獨(dú)且專用的存儲(chǔ)器組。
微處理器118和120可以協(xié)力地工作,利用AGP總線158和AGP視頻卡160通過(guò)陰極射線管監(jiān)控器向計(jì)算機(jī)系統(tǒng)100的用戶顯示信息。在其他實(shí)施例中,顯示設(shè)備可以是液晶顯示屏或薄膜晶體管平板監(jiān)控器。另外,各種實(shí)施例可利用諸如傳統(tǒng)的工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)卡這樣的、與AGP視頻卡160不同的另一類型的顯示適配器來(lái)向用戶顯示信息。甚至在另一實(shí)施例中,微處理器118和120可以被嵌入到根本沒(méi)有顯示器的計(jì)算設(shè)備中。
計(jì)算機(jī)系統(tǒng)100具有存儲(chǔ)在基本輸入輸出系統(tǒng)(BIOS)模塊190中的BIOS程序。用于在將電能提供給計(jì)算機(jī)系統(tǒng)100之后使微處理器118和120對(duì)系統(tǒng)硬件執(zhí)行許多預(yù)定測(cè)試的上電自檢(POST)代碼或程序包含在BIOS模塊190之內(nèi)。例如,POST程序可對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行測(cè)試,并且對(duì)諸如鍵盤和鼠標(biāo)這樣的I/O設(shè)備的各種端口以及USB端口進(jìn)行檢查。
如圖1中所描述的,計(jì)算機(jī)系統(tǒng)100可以具有與高速緩沖存儲(chǔ)器116相耦合的微處理器118。類似地,計(jì)算機(jī)系統(tǒng)100可以具有與高速緩沖存儲(chǔ)器122相耦合的微處理器120。在各種實(shí)施例中,這種高速緩沖存儲(chǔ)器設(shè)備可幫助提高各個(gè)處理器的性能。然而,在一些實(shí)施例中,與微處理器118和120相類似的一個(gè)或多個(gè)處理器可以具有與單個(gè)微處理器相耦合的多個(gè)高速緩沖存儲(chǔ)器設(shè)備,具有與多個(gè)微處理器相耦合的高速緩沖存儲(chǔ)器設(shè)備,并且甚至具有一個(gè)或多個(gè)不具有高速緩沖存儲(chǔ)器設(shè)備的微處理器。
此外,如圖1中所描述的,計(jì)算機(jī)系統(tǒng)100可以具有用于將電能提供給微處理器118的電壓調(diào)節(jié)模塊(VRM)108,以及用于通過(guò)開關(guān)模塊114將電能提供給微處理器120的不同的VRM 112。在正常操作期間,開關(guān)模塊114可以使電壓與VRM 108和VRM 112相分離,以便使VRM將電壓提供給微處理器118,而VRM 112將電壓提供給微處理器120。如果VRM 108或者VRM 112出故障了,那么電壓調(diào)節(jié)器控制單元102可對(duì)分別來(lái)自狀態(tài)輸入線104和106的故障進(jìn)行檢測(cè),并且通過(guò)輸出開關(guān)控制線110來(lái)激活開關(guān)模塊114。激活開關(guān)模塊114可以將來(lái)自無(wú)故障的VRM的電壓耦合到通常由正出故障的VRM供給能源的處理器。按照這種方式耦合備用電壓可以使受到影響的處理器處于旁路模式,以便使它停止正常操作并且允許與總線控制器154相耦合的其他處理器和設(shè)備正常地操作。
例如,假定計(jì)算機(jī)系統(tǒng)100按照微處理器118從VRM 108接收電壓的正常模式進(jìn)行操作。類似地,微處理器120接收來(lái)自VRM 112的電壓。VRM控制單元102可通過(guò)分別對(duì)兩條狀態(tài)輸入線104和106進(jìn)行監(jiān)控,來(lái)檢測(cè)VRM 108和VRM 112正常地操作。如果感測(cè)到VRM 108和VRM 112正常地操作,則VRM控制單元102可以使開關(guān)模塊114斷開VRM 108和VRM 112的輸出,以便使每個(gè)VRM輸出與其他輸出相分離。在這樣正常操作模式中,開關(guān)模塊114使來(lái)自VRM 108的電壓僅耦合到微處理器118,并且使來(lái)自VRM 112的電壓僅耦合到微處理器120。然而,假定VRM 108出故障了并且停止在其輸出端提供任何電壓。由于缺少由VRM 108所提供的操作電壓,因此微處理器118可能會(huì)停止操作。令人遺憾地,由于總是沒(méi)有操作電壓施加到微處理器118上,因此總線段128中的輸出信號(hào)線可能保持為低態(tài),這通過(guò)總線控制器154阻止了微處理器120的正確操作。為了改善該問(wèn)題,可以將微處理器118處于旁路模式,并且向其提供充足的電壓??梢詮闹T如VRM 112這樣的仍進(jìn)行正常操作的另一VRM模塊提供這種電壓。
VRM控制單元102可以通過(guò)感測(cè)存在于狀態(tài)輸入線104上的電壓的不存在,來(lái)檢測(cè)到VRM 108已經(jīng)出了故障。因此,VRM 102可以激活開關(guān)控制線110,并且通過(guò)開關(guān)模塊114使VRM 112的輸出與微處理器118相耦合。由于此刻從VRM 112將充足的電壓提供給微處理器118,因此此刻使微處理器118復(fù)位并且保持在旁路狀態(tài),以便使微處理器120可以與總線控制器154進(jìn)行正常的交互。顯而易見地,可能會(huì)出現(xiàn)相反的情況。也就是說(shuō),VRM 112可能出了故障,這會(huì)影響微處理器120。此后,VRM控制單元102激活開關(guān)模塊114,使來(lái)自VRM 108的電壓耦合到微處理器120,以便使其被旁路并且允許微處理器118繼續(xù)進(jìn)行操作。
為了更好地說(shuō)明怎樣將電壓和電能提供給多處理器系統(tǒng)中的處理器,現(xiàn)在繼續(xù)對(duì)各種實(shí)施例怎樣檢測(cè)電壓錯(cuò)誤、分離電壓錯(cuò)誤、并且使該系統(tǒng)中的處理器停用進(jìn)行更加詳細(xì)的討論。圖2描述了用于對(duì)核心電壓230和核心電壓260這兩個(gè)核心電壓進(jìn)行控制的裝置200。在一些實(shí)施例中,裝置200可以完全在半導(dǎo)體襯底中實(shí)現(xiàn),并且可包括單個(gè)集成電路。在其他實(shí)施例中,裝置200的一個(gè)或多個(gè)部件可以作為分立的電子設(shè)備而存在,所述分立的電子設(shè)備通過(guò)諸如一個(gè)或多個(gè)印刷電路板上的電跡線這樣的導(dǎo)線或者其他導(dǎo)電材料耦合在一起。
如圖2所示,核心電壓230可以將操作電壓和電流提供給微處理器240。類似地,核心電壓260可將操作電壓和電流提供給微處理器270。在正常操作期間,VRM 220可產(chǎn)生或提供核心電壓230,而VRM250可提供核心電壓260。微處理器240和270可以是諸如共用存儲(chǔ)器體系結(jié)構(gòu)這樣的各種不同計(jì)算機(jī)體系結(jié)構(gòu)中所配置的多處理器計(jì)算機(jī)系統(tǒng)中的兩個(gè)處理器。另外,微處理器240和270可利用諸如流水線、分時(shí)、多線程、交織、以及重疊這樣的用于處理數(shù)據(jù)的各種技術(shù)。
電壓和微處理器控制單元210可以對(duì)與微處理器240、微處理器270、以及由VRM 220和VRM 250所提供的電壓有關(guān)的許多參數(shù)進(jìn)行監(jiān)控。例如,控制單元210可對(duì)由VRM 220和VRM 250所提供的電壓進(jìn)行監(jiān)控,以確保這兩個(gè)電壓在適當(dāng)?shù)碾妷悍秶畠?nèi)。在一些實(shí)施例中,控制單元210可對(duì)這種電壓進(jìn)行監(jiān)控,以確保它們不會(huì)低于某些最小操作閾值。在其他實(shí)施例中,控制單元210可以簡(jiǎn)單地對(duì)由VRM 220和VRM 250之內(nèi)的內(nèi)部診斷電路所產(chǎn)生的狀態(tài)位進(jìn)行監(jiān)控。換句話說(shuō),每個(gè)VRM可以具有自己的診斷電路,以對(duì)諸如電壓電平、電壓下降(sag)、電壓下降持續(xù)時(shí)間、電壓噪音、波動(dòng)、以及電壓質(zhì)量的其他這種量度這樣的電壓參數(shù)進(jìn)行監(jiān)控。取決于實(shí)施例,可以在VRM或控制單元210中執(zhí)行對(duì)這種電壓參數(shù)的監(jiān)控。
在檢測(cè)到與VRM 220或VRM 250有關(guān)的電壓錯(cuò)誤時(shí),控制單元210可以取決于實(shí)施例而按照各種不同的方式進(jìn)行響應(yīng)。在一些實(shí)施例中,控制單元210可首先使受到出故障的或有錯(cuò)誤的VRM影響的處理器停用,使出故障的VRM停用,使來(lái)自正工作著的VRM的電壓耦合到微處理器240和微處理器270,并且使通常與出故障的VRM相耦合的處理器保持在透明狀態(tài)。按照這種方式使處理器保持在透明狀態(tài),可允許計(jì)算機(jī)系統(tǒng)的一個(gè)或多個(gè)剩余處理器繼續(xù)操作。在一些實(shí)施例中,每個(gè)單獨(dú)的VRM模塊可以具有充足的電流產(chǎn)生能力以提供給微處理器240和微處理器260,從而允許簡(jiǎn)單地通過(guò)控制單元210使受影響的微處理器復(fù)位并且還允許其繼續(xù)進(jìn)行操作。
在其他實(shí)施例中,控制單元210可以按照不同方式來(lái)檢測(cè)電壓誤差并對(duì)其做出響應(yīng)。例如,控制單元210可以對(duì)來(lái)自微處理器和270的狀態(tài)位進(jìn)行監(jiān)控,以便使任一位的損失與提供給處理器的錯(cuò)誤電壓相對(duì)應(yīng)。換句話說(shuō),微處理器可以執(zhí)行電壓監(jiān)控。在任何一個(gè)狀態(tài)位損失時(shí),控制單元210可以通過(guò)使出故障的VRM停用、使另一VRM耦合到受影響的處理器、并且保持受影響的處理器處于復(fù)位狀態(tài),而進(jìn)行響應(yīng),這可有效地使其輸入和輸出線呈三態(tài),以便使與相同輸入和輸出線相連的其他任何系統(tǒng)處理器或設(shè)備可以繼續(xù)起作用。甚至在又一個(gè)實(shí)施例中,控制單元210可直接對(duì)核心電壓230和260進(jìn)行監(jiān)控,以對(duì)控制單元210中的電壓錯(cuò)誤進(jìn)行檢測(cè)。
為了提供關(guān)于怎樣將電能重新分配給多處理器計(jì)算機(jī)系統(tǒng)中的處理器的更清楚的示例,轉(zhuǎn)到圖3。圖3示出了具有服務(wù)處理器315的計(jì)算機(jī)系統(tǒng)300,所述服務(wù)處理器315用于對(duì)來(lái)自兩個(gè)電壓調(diào)節(jié)器模塊VRM 350和VRM 365的電壓進(jìn)行控制以便將電能提供給兩個(gè)微處理器375和380。微處理器375可以具有專用的RAM 385,并且微處理器380可以具有專用的RAM 390。微處理器375和380與單條系統(tǒng)總線395相耦合,從而形成分布式存儲(chǔ)器多處理器計(jì)算機(jī)系統(tǒng)300。
在正常操作期間,VRM 350可以為微處理器375提供經(jīng)調(diào)節(jié)和濾波的核心電壓355。類似地,VRM 365可為微處理器380提供核心電壓370。通過(guò)銅平面為微處理器375和380分配核心電壓355和核心電壓370。由于VRM 350和VRM 365正常地起作用,因此微處理器375和380可分別利用核心電壓355和370,以協(xié)力地進(jìn)行操作,將數(shù)據(jù)傳送到RAM 385和390和從RAM 385和390中傳送數(shù)據(jù)。另外,每個(gè)微處理器可通過(guò)系統(tǒng)總線395將數(shù)據(jù)傳送到計(jì)算機(jī)系統(tǒng)300中的其他設(shè)備和從其他設(shè)備中傳送數(shù)據(jù)。此外,在正常操作期間,服務(wù)處理器315分別通過(guò)獨(dú)立的狀態(tài)線325和335對(duì)VRM 350和VRM365的狀態(tài)進(jìn)行監(jiān)控。
在電壓調(diào)節(jié)器模塊之一損壞并且遭受到錯(cuò)誤的情況下,服務(wù)處理器315可以對(duì)來(lái)自狀態(tài)線325或狀態(tài)線335的錯(cuò)誤進(jìn)行檢測(cè),并且通過(guò)使受影響的微處理器復(fù)位、使損壞的電壓調(diào)節(jié)器停用、并且通過(guò)激活輸出連接線345和閉合開關(guān)360使核心電壓355和370耦合,來(lái)進(jìn)行響應(yīng)。用另一種方式來(lái)說(shuō),只要電壓調(diào)節(jié)器具有錯(cuò)誤,服務(wù)處理器315就可以檢測(cè)到,并且通過(guò)使該調(diào)節(jié)器停用并從正工作著的調(diào)節(jié)器中提供電壓給受影響的處理器,來(lái)進(jìn)行響應(yīng),以便使該處理器被旁路,以使計(jì)算機(jī)系統(tǒng)300可繼續(xù)操作。在VRM 350或VRM 365損耗時(shí),通過(guò)從諸如輔助電壓305這樣的輔助電壓源向處理器供電,服務(wù)處理器315可繼續(xù)進(jìn)行操作。
例如,假定計(jì)算機(jī)系統(tǒng)300通過(guò)VRM 350和VRM 365分別向微處理器375和微處理器380提供電能而正常地進(jìn)行操作。服務(wù)處理器315可以使輸出連接線345無(wú)效,以打開開關(guān)360。如果VRM 365遭受內(nèi)部故障,那么狀態(tài)線335可以轉(zhuǎn)換為邏輯0。服務(wù)處理器315可以對(duì)狀態(tài)線335的這個(gè)轉(zhuǎn)換進(jìn)行檢測(cè),并且通過(guò)將控制輸出340從邏輯1轉(zhuǎn)換為邏輯0而使VRM 365停用來(lái)進(jìn)行響應(yīng),最終結(jié)果是使VRM 365停用。服務(wù)處理器315還可以通過(guò)使控制輸出320從邏輯0轉(zhuǎn)換為邏輯1而將微處理器380設(shè)置為復(fù)位狀態(tài)。另外,服務(wù)處理器315可以通過(guò)激活輸出連接線345并閉合開關(guān)360,將來(lái)自VRM 350的電能傳送到微處理器380。閉合開關(guān)360可使VRM 350將來(lái)自核心電壓355的恰好足夠的電能提供給核心電壓370,以便微處理器380可以使其輸入-輸出線正常地呈三態(tài)。按照這種方式通過(guò)使服務(wù)處理器315將控制輸出320保持為邏輯1而使微處理器380的輸入-輸出線呈三態(tài),可使微處理器380與系統(tǒng)總線395相分離,從而允許微處理器375繼續(xù)操作并且與耦合到系統(tǒng)總線395的其他設(shè)備進(jìn)行通信。
與使VRM 365停用和從VRM 350對(duì)微處理器380供電相類似地,服務(wù)處理器315可以利用控制輸出330、控制輸出310、以及輸出連接線345使VRM 350停用和從使VRM 365對(duì)微處理器375供電。另外,服務(wù)處理器315可以通過(guò)取決于VRM 350、VRM 365、微處理器375、以及微處理器380的配置而使控制輸出從低轉(zhuǎn)換為高或者從高轉(zhuǎn)換為低,而在不同的實(shí)施例中實(shí)現(xiàn)這些功能。換句話說(shuō),取決于電壓調(diào)節(jié)器、微處理器、以及開關(guān)設(shè)備的配置,可以通過(guò)使這些線從高變?yōu)榈突驈牡蜕秊楦邅?lái)激活控制輸出。
在各種實(shí)施例中,在使電壓調(diào)節(jié)器旁路并且使微處理器停用的過(guò)程中由服務(wù)處理器315所執(zhí)行的確切序列可能會(huì)改變,但是可以實(shí)現(xiàn)相同的任務(wù)。例如,在一些實(shí)施例中,服務(wù)處理器可首先使損壞的VRM停用,設(shè)置微處理器,此后使電壓面耦合在一起。然而,在其他實(shí)施例中,服務(wù)處理器可首先將微處理器設(shè)置為復(fù)位狀態(tài),此后使損壞的VRM停用,并且最后使電壓開關(guān)閉合。對(duì)各種輸出控制線進(jìn)行控制的確切順序不是關(guān)鍵性的,這取決于計(jì)算機(jī)系統(tǒng)300的部件。
現(xiàn)在轉(zhuǎn)到圖4,其示出了一個(gè)多處理器計(jì)算機(jī)系統(tǒng)400。如圖4所示,計(jì)算機(jī)系統(tǒng)400可以具有從不同數(shù)目的電壓調(diào)節(jié)器供電的不同數(shù)目的處理器。更具體地說(shuō),計(jì)算機(jī)系統(tǒng)400可以具有兩個(gè)通過(guò)第一VRM 430供電的微處理器,即微處理器435和微處理器440。類似地,第二VRM 455可以對(duì)微處理器485和微處理器490供電。應(yīng)該注意的是,圖4中的計(jì)算機(jī)系統(tǒng)400與圖1中的計(jì)算機(jī)系統(tǒng)100、圖3中的計(jì)算機(jī)系統(tǒng)300、以及圖2中的裝置200不同。雖然先前的系統(tǒng)和裝置僅具有兩個(gè)微處理器以及兩個(gè)電壓調(diào)節(jié)器模塊,但是計(jì)算機(jī)系統(tǒng)400采用了用于對(duì)四個(gè)微處理器、即微處理器435、440、485、以及490供電的兩個(gè)VRM 430和455。如所描述的,不同實(shí)施例可以包括可變數(shù)目的電壓調(diào)節(jié)器和微處理器,這取決于應(yīng)用的需要、處理器的功率需要、以及調(diào)節(jié)器的功率額定值等。
在計(jì)算機(jī)系統(tǒng)400中,VRM 430可在正常操作期間向微處理器435和微處理器供電。同樣地,VRM 455可向微處理器485和490提供正常的操作電能。服務(wù)處理器410可以通過(guò)狀態(tài)線420對(duì)VRM 430的狀態(tài)進(jìn)行監(jiān)控,并且通過(guò)狀態(tài)線465對(duì)VRM 455的狀態(tài)進(jìn)行監(jiān)控。為了說(shuō)明起見,如果在VRM 455中出現(xiàn)了電壓錯(cuò)誤,那么服務(wù)處理器410可以通過(guò)狀態(tài)線465來(lái)檢測(cè)錯(cuò)誤,并且通過(guò)分別觸發(fā)控制輸出470和480來(lái)停用微處理器485和微處理器490,而進(jìn)行響應(yīng)。此后,服務(wù)處理器410可以通過(guò)改變控制輸出460的狀態(tài)而使VRM 455停用,并且通過(guò)接通繼電器445而將電能耦合到微處理器485和490。接通繼電器445可以閉合繼電器觸點(diǎn)450,這使得來(lái)自VRM 430的電壓和電能耦合到微處理器485和490。
在替換實(shí)施例中,服務(wù)處理器410不必使與電壓調(diào)節(jié)器相關(guān)的所有微處理器均停用或旁路。例如,假定VRM 430出現(xiàn)故障。服務(wù)處理器410可以通過(guò)激活控制輸出425而停用VRM 430,并且接通繼電器445以閉合繼電器觸點(diǎn)450,來(lái)進(jìn)行響應(yīng)。此外,進(jìn)一步假定VRM455具有足夠大的額定功率足以將電能提供給三個(gè)微處理器而不是四個(gè)處理器。服務(wù)處理器410不必使微處理器435和微處理器440均停用。作為替代,服務(wù)處理器410可使在計(jì)算機(jī)系統(tǒng)400中進(jìn)行操作的處理器的數(shù)目達(dá)到最大,并且僅利用控制輸出405來(lái)停用微處理器440或者利用控制輸出415來(lái)停用微處理器435。
為了研究更靈活的且更詳細(xì)的配置,我們現(xiàn)在回到圖5,圖5示出了服務(wù)處理器怎樣對(duì)從若干電壓調(diào)節(jié)器送至若干處理器的電壓進(jìn)行控制的替換技術(shù)。計(jì)算機(jī)系統(tǒng)500具有通常分別由四個(gè)電壓調(diào)節(jié)器模塊550、556、560、以及564供電的四個(gè)處理器,即處理器586、588、590、以及592。在正常操作期間,服務(wù)處理器502可以分別激活控制輸出508、514、528、以及532以使開關(guān)566、570、572、以及574閉合,從而使來(lái)自VRM的電壓耦合到各個(gè)處理器。服務(wù)處理器502可以分別通過(guò)VRM狀態(tài)線504、518、524、以及536對(duì)VRM550、556、560、以及564進(jìn)行監(jiān)控。
當(dāng)一個(gè)或多個(gè)VRM出故障時(shí),圖5所示的計(jì)算機(jī)系統(tǒng)500的配置可提供更加靈活的切換。例如,假定VRM 550和VRM 560出現(xiàn)故障了。服務(wù)處理器502可以通過(guò)狀態(tài)線504和524對(duì)這些故障進(jìn)行檢測(cè),并且通過(guò)激活控制輸出線506和526以使VRM停用,并且改變控制輸出508和528以打開開關(guān)566和572、從而使VRM的輸出與微處理器586、微處理器590、以及在所有VRM的輸出端上的互連導(dǎo)線相分離,來(lái)進(jìn)行響應(yīng)。服務(wù)處理器502可以通過(guò)激活控制輸出510而停用處理器586,并且通過(guò)激活控制輸出530而停用處理器590,來(lái)繼續(xù)進(jìn)行操作。此后,服務(wù)處理器502可以通過(guò)激活控制輸出552并閉合開關(guān)568,而將來(lái)自VRM 556的電能傳送到微處理器586。類似地,服務(wù)處理器502可以通過(guò)激活控制輸出562并閉合開關(guān)584,而將來(lái)自VRM 564的電能傳送到微處理器590。作為選擇,服務(wù)處理器502可以通過(guò)激活控制輸出520并閉合開關(guān)580,而將來(lái)自VRM 556的電能傳送到微處理器590,并且通過(guò)激活控制輸出512并閉合開關(guān)578,而將來(lái)自VRM 564的電能傳送到微處理器586。
在替換實(shí)施例中,圖5中的計(jì)算機(jī)系統(tǒng)500所采用的開關(guān)網(wǎng)絡(luò)甚至可以對(duì)若干其他實(shí)施例提供更多的靈活性和冗余度,這取決于計(jì)算機(jī)系統(tǒng)500可能已遭受的任何上述故障。例如,假定微處理器588先前已經(jīng)遭受了內(nèi)部故障。服務(wù)處理器502可能已檢測(cè)到該故障,并且通過(guò)激活控制輸出558而使處理器588停用。然而,服務(wù)處理器502還可能從狀態(tài)線518檢測(cè)到VRM 556仍具有很好的電壓狀態(tài)。因此,控制輸出514可能仍是有效的,并且開關(guān)570仍是閉合的。然而,假定計(jì)算機(jī)系統(tǒng)500遭受到VRM 564的故障,該故障可以由服務(wù)處理器502通過(guò)狀態(tài)輸入536檢測(cè)到。服務(wù)處理器502可以通過(guò)激活控制輸出540而使微處理器592停用,通過(guò)激活控制輸出534而使VRM564停用,并且通過(guò)激活控制輸出532以打開開關(guān)574而使VRM 564分離。
此后,服務(wù)處理器502可以通過(guò)激活控制輸出512并且閉合開關(guān)578而簡(jiǎn)單地將來(lái)自VRM 550的電能傳送到微處理器592,或者通過(guò)激活控制輸出562并閉合開關(guān)584而從VRM 560提供電能,來(lái)繼續(xù)進(jìn)行操作。然而,可將服務(wù)處理器502配置成識(shí)別到微處理器588已經(jīng)被停用,這意味著VRM 556可以用來(lái)向替換的微處理器供電,因?yàn)閷?duì)于被停用的微處理器588而言耗用功率是充分低的。如果是這樣的話,則服務(wù)處理器502可以激活控制輸出522以閉合開關(guān)582,從而使來(lái)自VRM 556的電能耦合到微處理器592。此后,服務(wù)處理器502可以通過(guò)使來(lái)自控制輸出540的停用命令無(wú)效,而使微處理器592返回到使用狀態(tài)。
值得強(qiáng)調(diào)的是這樣的事實(shí),即,每個(gè)VRM的輸出可以被耦合到其他VRM的每個(gè)其他輸出。VRM 550可以通過(guò)激活控制輸出552并閉合開關(guān)568而耦合到微處理器588,通過(guò)激活控制輸出554并閉合開關(guān)576而耦合到微處理器590,通過(guò)激活控制輸出512并閉合開關(guān)578而耦合到微處理器592。類似地,可以通過(guò)分別單獨(dú)地激活控制輸出552、554、512、520、522、以及562以閉合開關(guān)568、576、578、580、582、以及584,而使VRM 556、VRM 560和VRM 564耦合到每個(gè)微處理器。
圖6示出了具有八個(gè)微處理器并且采用兩個(gè)用于在微處理器當(dāng)中切換電壓的服務(wù)處理器的大型計(jì)算機(jī)系統(tǒng)600。值得注意的是,計(jì)算機(jī)系統(tǒng)600因?yàn)槔秒p服務(wù)處理器而與先前所討論的實(shí)施例不同,先前的實(shí)施例具有單個(gè)服務(wù)處理器或電壓控制單元。這種不同的實(shí)現(xiàn)方式可幫助說(shuō)明不同實(shí)施例可具有可變數(shù)目的服務(wù)處理器,其被配置成具有可變數(shù)目的電壓調(diào)節(jié)模塊以及可變數(shù)目的微處理器。
更具體地說(shuō),計(jì)算機(jī)系統(tǒng)600具有用于對(duì)具有相應(yīng)核心電壓670、672、678、以及680的四個(gè)VRM 610、612、614、以及616進(jìn)行監(jiān)控的第一服務(wù)處理器602。服務(wù)處理器602還對(duì)通過(guò)開關(guān)晶體管630、632、634、636、638、640、以及642而提供給四個(gè)微處理器668、674、676、以及682的電壓進(jìn)行控制。按照類似鏡像的方式,第二服務(wù)處理器604對(duì)具有相應(yīng)核心電壓686、688、694、以及696的四個(gè)VRM618、620、622、以及624進(jìn)行監(jiān)控。服務(wù)處理器604還可對(duì)通過(guò)開關(guān)晶體管644、645、646、648、650、652、以及654而提供給四個(gè)微處理器684、690、692、以及698的電壓進(jìn)行控制。
實(shí)現(xiàn)具有兩個(gè)服務(wù)處理器而不是一個(gè)服務(wù)處理器的計(jì)算機(jī)系統(tǒng)600可以具有諸如服務(wù)處理器設(shè)計(jì)更簡(jiǎn)單這樣的許多合乎需要的益處。作為選擇,按照這種方式拆分處理器和電壓調(diào)節(jié)器由于硬件要求而可能是必需的。例如,計(jì)算機(jī)系統(tǒng)600可以包括服務(wù)器網(wǎng)絡(luò)中的計(jì)算機(jī)系統(tǒng)。由于空間和熱負(fù)荷的要求,必須對(duì)服務(wù)器系統(tǒng)中的各種服務(wù)器處理器當(dāng)中的多個(gè)處理器進(jìn)行劃分。也就是說(shuō),服務(wù)處理器602和所有相關(guān)聯(lián)的VRM以及微處理器可以位于一個(gè)印刷電路板上并可插入到安裝在機(jī)架上的(rack-mounted)計(jì)算機(jī)系統(tǒng)硬件中。由應(yīng)用或硬件外殼尺寸所確定的最大容許電路尺寸可能要求服務(wù)處理器604和所有相關(guān)聯(lián)的VRM以及微處理器位于單獨(dú)的印刷電路板上。
與先前所討論的例子相類似地,服務(wù)處理器602和604對(duì)與其相耦合的各種VRM、晶體管、以及微處理器進(jìn)行監(jiān)控和控制。例如,在正常操作期間,服務(wù)處理器604可以使來(lái)自VRM 618、620、622、以及624的輸出電壓耦合到相應(yīng)的核心電壓686、688、694、以及696。服務(wù)處理器604可以通過(guò)使P型場(chǎng)效應(yīng)管(P-fet)644、646、650、以及654的柵極偏置到地電勢(shì)以使其導(dǎo)通,同時(shí)使P型場(chǎng)效應(yīng)晶體管645、648、以及652的柵極耦合到諸如Vdd這樣的正電壓電源以使其斷開,而使電壓相耦合,并且使用于將不同VRM的輸出相連的交叉耦合線相分離。
與先前所討論的技術(shù)相類似地,在感測(cè)到VRM之一出現(xiàn)故障時(shí),服務(wù)處理器604可以對(duì)一個(gè)或多個(gè)晶體管的狀態(tài)進(jìn)行切換,以便使來(lái)自替換的正起作用的VRM的電壓耦合到受出故障的VRM影響的處理器,從而使受影響的處理器可以被保持在復(fù)位狀態(tài)、旁路、或者返回到使用狀態(tài)。例如,假定VRM 622出現(xiàn)故障,這會(huì)影響核心電壓694和微處理器692的電壓面。服務(wù)處理器604可以通過(guò)使P型場(chǎng)效應(yīng)晶體管650的柵極偏置到Vdd以便使VRM 622的電壓輸出與微處理器及其他VRM輸出相分離,來(lái)做出響應(yīng)。此后,服務(wù)處理器604可以將來(lái)自其他VRM之一的輸出耦合到核心電壓694和微處理器692。一種可能的耦合方案可以涉及通過(guò)使P型場(chǎng)效應(yīng)晶體管648的柵極偏置到地電勢(shì),而使VRM 620的輸出與核心電壓694和微處理器692相耦合。從所陳述的內(nèi)容中可顯而易見地得知,通過(guò)對(duì)P型場(chǎng)效應(yīng)晶體管652進(jìn)行切換,還可使VRM 624的電壓輸出與核心電壓694和微處理器692相耦合。
服務(wù)處理器602可以按照與關(guān)于服務(wù)處理器604所描述的方式類似的方式進(jìn)行操作。此外,在其他實(shí)施例中,服務(wù)處理器可以利用不同于P型場(chǎng)效應(yīng)晶體管的設(shè)備使VRM的電壓輸出相耦合。例如,一些實(shí)施例可僅利用N型場(chǎng)效應(yīng)晶體管、或者利用P型場(chǎng)效應(yīng)晶體管和N型場(chǎng)效應(yīng)晶體管的組合。此外,在又一些實(shí)施例中,其他電路設(shè)備可與場(chǎng)效應(yīng)晶體管、開關(guān)、或者觸點(diǎn)一起進(jìn)行工作。例如,在圖6中所描述的計(jì)算機(jī)系統(tǒng)600的開關(guān)P型場(chǎng)效應(yīng)晶體管可以具有與晶體管相耦合的電容和電阻元件,以便提供諸如去抖動(dòng)(de-bouncing)、平滑器開關(guān)、以及降低反向電感沖擊(inductive kick-back)這樣的益處。此外,雖然在對(duì)先前實(shí)施例的討論中未具體提及,但是在各種實(shí)施例部件中添加諸如開關(guān)網(wǎng)絡(luò)這樣的其他電路設(shè)備同樣是可適用的。
另外,各種實(shí)施例中的服務(wù)處理器和電壓控制單元可以是相對(duì)簡(jiǎn)單的,諸如相對(duì)較小且簡(jiǎn)單的邏輯門布置方案。然而,在其他實(shí)施例中,服務(wù)處理器和電壓控制單元可以包括相對(duì)復(fù)雜的處理器,所述處理器具有內(nèi)部時(shí)鐘發(fā)生器、存儲(chǔ)器、處理編碼指令、以及用于執(zhí)行停用和電壓切換這樣的處理器動(dòng)作的軟件程序。
現(xiàn)在轉(zhuǎn)到圖7A和7B,圖7A和7B示出了在處理器電壓調(diào)節(jié)器遭受錯(cuò)誤時(shí)對(duì)多處理器計(jì)算機(jī)進(jìn)行操作的方法。圖7A通過(guò)對(duì)具有多個(gè)處理器的系統(tǒng)進(jìn)行操作而開始(方框705)。不同的實(shí)施例可以具有被設(shè)置成諸如共用存儲(chǔ)器計(jì)算機(jī)體系結(jié)構(gòu)、分布式存儲(chǔ)器體系結(jié)構(gòu)、以及這兩者的組合或演變這樣的不同計(jì)算機(jī)體系結(jié)構(gòu)的多個(gè)處理器。處理器可以都與單條總線耦合在一起,或者處理器的集群可以通過(guò)更小的且單獨(dú)的處理器組總線而耦合在一起。
圖7A的方法可以通過(guò)對(duì)多處理器計(jì)算器系統(tǒng)監(jiān)控電壓錯(cuò)誤狀態(tài)來(lái)繼續(xù)(方框710)。所監(jiān)控的錯(cuò)誤狀態(tài)可以隨不同實(shí)施例而改變。例如,在一些實(shí)施例中,錯(cuò)誤狀態(tài)可以是不存在微處理器所需的一個(gè)或多個(gè)VRM。在其他實(shí)施例中,錯(cuò)誤狀態(tài)可以是缺乏很好的核心電壓。只要未檢測(cè)到錯(cuò)誤狀態(tài),則該方法所需的動(dòng)作可以僅僅包括簡(jiǎn)單地繼續(xù)對(duì)錯(cuò)誤狀態(tài)進(jìn)行監(jiān)控(方框715和710)。然而,一旦檢測(cè)到錯(cuò)誤狀態(tài),根據(jù)圖7A中的方法的系統(tǒng)就可以通過(guò)分離電壓錯(cuò)誤狀態(tài)或使其無(wú)效而繼續(xù)(方框715和720)。例如,根據(jù)7A的方法而起作用的計(jì)算機(jī)系統(tǒng)可以分離或防止將電壓供應(yīng)給有故障的電壓調(diào)節(jié)器的輸入端?;蛘?,一個(gè)實(shí)施例中可通過(guò)打開耦合在調(diào)節(jié)器輸出與調(diào)節(jié)器負(fù)載之間的開關(guān)而分離壞的電壓調(diào)節(jié)器。
根據(jù)圖7A的實(shí)施例可以使受到電壓錯(cuò)誤狀態(tài)影響的處理器復(fù)位(方框725),并且激活開關(guān)以將來(lái)自替換源的電壓提供給受影響的處理器(方框730)。在有些實(shí)施例中,替換源可以是該系統(tǒng)中的另一電壓調(diào)節(jié)器。然而,在其他實(shí)施例中,替換電壓源可以是未經(jīng)濾波的且未經(jīng)調(diào)節(jié)的電壓源。
一旦受影響的處理器被復(fù)位(方框725),則使該處理器保持在復(fù)位狀態(tài)(單元735),這可使來(lái)自地址總線的、與受影響的處理器相關(guān)聯(lián)的輸入和輸出呈三態(tài)(方框735),從而允許計(jì)算機(jī)系統(tǒng)中的其他處理器進(jìn)行操作而不受該被停用或旁路的處理器的影響(方框750)。在各種實(shí)施例中,可以使受影響的處理器與系統(tǒng)中的其他總線相分離。例如,可以使該處理器與數(shù)據(jù)總線、或者控制總線、或者所有三種總線的組合相分離。
根據(jù)例如圖5所示的計(jì)算機(jī)系統(tǒng)500,本發(fā)明的另一實(shí)施例被實(shí)現(xiàn)為在諸如用于服務(wù)處理器的處理器、核心電壓處理器、或者甚至由各種電壓源供電的系統(tǒng)處理器這樣的電路部件設(shè)備中使用的程序產(chǎn)品。該程序產(chǎn)品中的程序定義了實(shí)施例的功能(包括在這里所描述的方法),并且可以被包含在各種數(shù)據(jù)和/或信號(hào)承載介質(zhì)上。說(shuō)明性的數(shù)據(jù)和/或信號(hào)承載介質(zhì)包括但不局限于(i)永久地存儲(chǔ)在不可寫的存儲(chǔ)介質(zhì)(例如,計(jì)算機(jī)系統(tǒng)內(nèi)的只讀存儲(chǔ)器設(shè)備)上的信息;以及(ii)存儲(chǔ)在可寫的存儲(chǔ)介質(zhì)(例如,磁性介質(zhì))上的可改變的信息。當(dāng)這種數(shù)據(jù)和/或信號(hào)承載介質(zhì)載有可實(shí)現(xiàn)本發(fā)明中的功能的微處理器可讀的指令時(shí),這種數(shù)據(jù)和/或信號(hào)承載介質(zhì)表示了本發(fā)明的實(shí)施例。
通常,執(zhí)行用于實(shí)現(xiàn)本發(fā)明的實(shí)施例的例程可以是操作系統(tǒng)或特定部件、程序、模塊、對(duì)象、或者包括在電路板設(shè)備的存儲(chǔ)器之內(nèi)的指令序列的一部分。本發(fā)明的微處理器程序可以由可由微處理器翻譯成機(jī)器可讀格式并且由此成為可執(zhí)行指令的大量指令組成。此外,該程序可以由駐留于本地程序中的變量和數(shù)據(jù)結(jié)構(gòu)組成,或者該程序可以在存儲(chǔ)器或其他存儲(chǔ)設(shè)備中獲得。此外,在下文中所描述的各種程序可根據(jù)在本發(fā)明的特定實(shí)施例中實(shí)現(xiàn)它們所用于的應(yīng)用而確定。然而,應(yīng)該明白的是,僅僅是為了方便起見,而使用了上述任何特定程序?qū)iT用語(yǔ),并且因此本發(fā)明不應(yīng)當(dāng)局限于僅僅在由這些專門用語(yǔ)所確定的和/或意指的任何特定應(yīng)用中使用。
計(jì)算與多處理器計(jì)算機(jī)系統(tǒng)設(shè)計(jì)領(lǐng)域的普通技術(shù)人員很容易明白的是,用于將電能提供給多處理器計(jì)算機(jī)系統(tǒng)中的處理器的各種實(shí)施例給予了多處理器計(jì)算系統(tǒng)領(lǐng)域的靈活性和時(shí)機(jī)。這些示例僅僅是少數(shù)幾種可能的、在多處理器計(jì)算機(jī)系統(tǒng)設(shè)計(jì)領(lǐng)域中應(yīng)用用于將電能提供給多處理器系統(tǒng)中的處理器的方法或者基本上用于實(shí)現(xiàn)該方法的裝置和介質(zhì)的情況。
本領(lǐng)域普通技術(shù)人員可顯而易見的得知的是,本公開的益處在于,本發(fā)明考慮到了當(dāng)部件出現(xiàn)故障時(shí)用于將電能提供給多處理器計(jì)算機(jī)系統(tǒng)中的處理器并且使其旁路的方法、裝置、以及介質(zhì)。應(yīng)當(dāng)理解,在詳細(xì)說(shuō)明和附圖中所示出和描述的本發(fā)明的形式僅僅是示例性的。下述權(quán)利要求應(yīng)當(dāng)被寬泛地解釋為包含了所公開的示例性實(shí)施例的所有變化。
雖然已經(jīng)針對(duì)一些實(shí)施例詳細(xì)地描述了本發(fā)明以及其某些優(yōu)點(diǎn),但是應(yīng)該清楚的是,在不脫離隨后權(quán)利要求所定義的本發(fā)明的精神和范圍的情況下可以做出各種變化、替換、以及改變。此外,實(shí)施例可以實(shí)現(xiàn)多個(gè)目的,而不是屬于所附權(quán)利要求的范圍之內(nèi)的每個(gè)實(shí)施例都可實(shí)現(xiàn)每個(gè)目的。此外,本申請(qǐng)的范圍并不局限于說(shuō)明書中所描述的處理、機(jī)器、制品、物質(zhì)組成、裝置、方法、以及步驟的特定實(shí)施例。本領(lǐng)域普通技術(shù)人員從本發(fā)明的公開中可以很容易地得知,根據(jù)本發(fā)明,可以使用目前現(xiàn)有的或者以后開發(fā)的、用于執(zhí)行與這里所描述的相應(yīng)實(shí)施例基本相同的功能或者實(shí)現(xiàn)與實(shí)施例基本相同的結(jié)果的處理、機(jī)器、制品、物質(zhì)組成、裝置、方法、或者步驟。因此,所附權(quán)利要求包括在其范圍之內(nèi)的這種處理、機(jī)器、制品、物質(zhì)組成、裝置、方法、或者步驟。
權(quán)利要求
1.一種用于向具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)中的處理器供電的方法,該方法包括確定與第一電壓電勢(shì)有關(guān)的參數(shù),其中第一電壓電勢(shì)耦合到所述處理器上;根據(jù)該參數(shù),使第一電壓電勢(shì)與所述處理器分離;使所述處理器停用;以及將第二電壓電勢(shì)耦合到所述處理器。
2.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括在停用所述處理器的情況下操作所述計(jì)算機(jī)系統(tǒng)。
3.根據(jù)權(quán)利要求1的方法,其中,確定參數(shù)的步驟包括檢測(cè)第一電壓電勢(shì)是否低于可接受的值。
4.根據(jù)權(quán)利要求1的方法,其中,確定參數(shù)的步驟包括對(duì)來(lái)自所述處理器的狀態(tài)信號(hào)進(jìn)行感測(cè)。
5.根據(jù)權(quán)利要求1的方法,其中,確定參數(shù)的步驟包括對(duì)來(lái)自電壓調(diào)節(jié)器模塊的狀態(tài)信號(hào)進(jìn)行感測(cè)。
6.根據(jù)權(quán)利要求1的方法,其中,分離步驟包括使用于產(chǎn)生第一電壓電勢(shì)的電壓調(diào)節(jié)器模塊停用。
7.根據(jù)權(quán)利要求1的方法,其中,分離步驟包括斷開用于將第一電壓電勢(shì)耦合到所述處理器的晶體管。
8.根據(jù)權(quán)利要求1的方法,其中,停用步驟包括將停用信號(hào)傳送到處理器,以便使所述處理器使其至少一個(gè)輸出呈三態(tài)。
9.根據(jù)權(quán)利要求1的方法,其中,停用步驟包括將復(fù)位信號(hào)傳送到所述處理器,以便使所述處理器進(jìn)入復(fù)位狀態(tài)并使其至少一個(gè)輸出呈三態(tài)。
10.根據(jù)權(quán)利要求1的方法,其中,耦合步驟包括閉合繼電器觸點(diǎn),以便將第二電壓電勢(shì)耦合到所述處理器。
11.根據(jù)權(quán)利要求1的方法,其中,耦合步驟包括激活用于將第二電壓電勢(shì)耦合到所述處理器的晶體管。
12.一種用于向具有多個(gè)處理器的計(jì)算機(jī)系統(tǒng)中的處理器提供電壓的裝置,該裝置包括錯(cuò)誤檢測(cè)電路,用于對(duì)與用于向所述處理器提供電壓的第一電壓調(diào)節(jié)器模塊有關(guān)的錯(cuò)誤狀態(tài)進(jìn)行檢測(cè);停用電路,用于在錯(cuò)誤檢測(cè)電路檢測(cè)到錯(cuò)誤時(shí),使第一電壓調(diào)節(jié)器模塊停用;處理器分離電路,用于在錯(cuò)誤檢測(cè)電路檢測(cè)到錯(cuò)誤時(shí),使處理器處于分離狀態(tài),其中,在處于分離狀態(tài)下時(shí)使所述處理器的輸入和輸出中的一個(gè)或多個(gè)與計(jì)算機(jī)系統(tǒng)中的總線相分離;以及電壓切換電路,用于在錯(cuò)誤檢測(cè)電路檢測(cè)到錯(cuò)誤時(shí),將來(lái)自第二電壓調(diào)節(jié)器模塊的電壓提供給所述處理器。
13.根據(jù)權(quán)利要求12的裝置,其中,錯(cuò)誤檢測(cè)電路、停用電路、處理器分離電路、以及電壓切換電路構(gòu)成一個(gè)服務(wù)處理器。
14.根據(jù)權(quán)利要求13的裝置,進(jìn)一步包括與停用電路相耦合的停用輸出,該停用輸出用于停用第一電壓調(diào)節(jié)器模塊。
15.根據(jù)權(quán)利要求13的裝置,進(jìn)一步包括與電壓切換電路相耦合的電壓切換輸出,該電壓切換輸出用于激活將第二電壓調(diào)節(jié)器模塊耦合到所述處理器的晶體管。
16.根據(jù)權(quán)利要求12的裝置,其中,錯(cuò)誤檢測(cè)電路適用于檢測(cè)來(lái)自于第一電壓調(diào)節(jié)器模塊的電壓的不存在。
17.根據(jù)權(quán)利要求12的裝置,其中,停用電路包括用于使第一電壓調(diào)節(jié)器與所述處理器電分離的晶體管。
18.根據(jù)權(quán)利要求12的裝置,其中,處理器分離電路適用于使所述處理器處于復(fù)位狀態(tài)。
19.根據(jù)權(quán)利要求12的裝置,其中,電壓切換電路包括用于將第二電壓調(diào)節(jié)器耦合到所述處理器的晶體管。
20.一種多處理器計(jì)算機(jī)系統(tǒng),包括兩個(gè)或多個(gè)處理器;兩個(gè)或多個(gè)電壓調(diào)節(jié)模塊,用于將電壓提供給所述兩個(gè)或多個(gè)處理器;電壓錯(cuò)誤檢測(cè)模塊,用于感測(cè)所述兩個(gè)或多個(gè)電壓調(diào)節(jié)模塊中的至少一個(gè)的問(wèn)題;電壓分離模塊,用于基于電壓錯(cuò)誤檢測(cè)模塊檢測(cè)到問(wèn)題,而使至少一個(gè)電壓調(diào)節(jié)模塊與受到該問(wèn)題影響的兩個(gè)或多個(gè)處理器中的至少一個(gè)相分離;以及電壓切換模塊,用于將未受到該問(wèn)題影響的兩個(gè)或多個(gè)電壓調(diào)節(jié)模塊中的至少一個(gè)耦合到受到該問(wèn)題影響的兩個(gè)或多個(gè)處理器中的至少一個(gè)。
21.根據(jù)權(quán)利要求20的系統(tǒng),進(jìn)一步包括處理器停用模塊,該處理器停用模塊用于響應(yīng)于電壓錯(cuò)誤檢測(cè)模塊感測(cè)到問(wèn)題,而使受到該問(wèn)題影響的兩個(gè)或多個(gè)處理器中的至少一個(gè)停用。
22.根據(jù)權(quán)利要求21的系統(tǒng),其中,處理器停用模塊響應(yīng)于電壓錯(cuò)誤檢測(cè)模塊感測(cè)到問(wèn)題,而使受到該問(wèn)題影響的處理器與計(jì)算機(jī)系統(tǒng)中的總線相分離。
23.根據(jù)權(quán)利要求20的系統(tǒng),其中,計(jì)算機(jī)系統(tǒng)包括服務(wù)器。
全文摘要
公開了用于向多處理器系統(tǒng)中的處理器供電的方法和裝置。實(shí)施例包括一種用于對(duì)下述參數(shù)進(jìn)行監(jiān)控的方法,所述參數(shù)與耦合到處理器上的第一電壓電勢(shì)有關(guān)。當(dāng)所監(jiān)控的參數(shù)或狀態(tài)表明第一電壓損壞或出故障時(shí),該方法通常包括使該電壓與處理器分離;使處理器停用或復(fù)位以及將第二電壓電勢(shì)耦合到處理器。該方法還可以允許計(jì)算機(jī)系統(tǒng)在停用所述處理器的情況下繼續(xù)操作。其他實(shí)施例包括錯(cuò)誤檢測(cè)電路,用于對(duì)與第一電壓調(diào)節(jié)器有關(guān)的錯(cuò)誤進(jìn)行檢測(cè);停用電路,用于響應(yīng)于該錯(cuò)誤而停用第一電壓調(diào)節(jié)器;處理器分離電路;以及電壓切換電路,用于將來(lái)自第二電壓調(diào)節(jié)器的電壓提供給所述處理器。
文檔編號(hào)G06F1/26GK1987736SQ20061013731
公開日2007年6月27日 申請(qǐng)日期2006年10月17日 優(yōu)先權(quán)日2005年12月22日
發(fā)明者瓦倫·D.·拜利, 斯里尼瓦斯·奇馬拉帕迪 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司