專利名稱:具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分配架構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種關(guān)于計(jì)算機(jī)系統(tǒng)中的時(shí)序分配架構(gòu),特別是在具對(duì)稱式多處 理器性能的刀鋒式叢集系統(tǒng)之備用的時(shí)序分配架構(gòu)。
背景技術(shù):
就目前而言,對(duì)稱式多處理器系統(tǒng)(SMP system)與刀鋒式叢集系統(tǒng)(blade clustering system)的實(shí)質(zhì)差異仍然是很難被打破的。這兩個(gè)系統(tǒng)都是針對(duì)某 些目的與在某種配置下運(yùn)作而設(shè)計(jì)。要將兩個(gè)型式的系統(tǒng)結(jié)合為一,時(shí)序分配 將是主要的問(wèn)題之一。一般而言,可靠而高階的對(duì)稱式多處理器系統(tǒng)具有一備用的時(shí)序分配系統(tǒng), 而典型的刀鋒式系統(tǒng)在每一刀鋒上具有專用的區(qū)域時(shí)序產(chǎn)生及分配系統(tǒng)。圖1為常規(guī)技術(shù)中具有時(shí)序分配之高階對(duì)稱式多處理器系統(tǒng)的例子。具有 若干個(gè)計(jì)算模塊120、 130、 140…的系統(tǒng)包含第一中央時(shí)序器111及第二中央時(shí) 序器112為兩個(gè)相同的時(shí)序來(lái)源,其交換時(shí)序邊緣校正信息(clock edge alignment information)以維持同一的時(shí)序邊緣校正。兩個(gè)或多個(gè)的計(jì)算模塊 (compute module) 120、 130、 140…以系統(tǒng)總線(system bus)彼此連接,而 致能一個(gè)或多個(gè)對(duì)稱式多處理器領(lǐng)域,計(jì)算模塊120、 130、 140的每一個(gè)接收 由第一中央時(shí)序器111與第二中央時(shí)序器112產(chǎn)生并分配之時(shí)序訊號(hào)的兩個(gè)復(fù) 制訊號(hào)。多任務(wù)器121/131/141用于切換此二個(gè)中央時(shí)序,如果第一中央時(shí)序 或第二中央時(shí)序其中之一失靈,則必須使用另一個(gè)。因此一個(gè)典型的對(duì)稱式多 處理器系統(tǒng)通常需要同步(synchronized)或時(shí)序邊緣校正以使得整個(gè)系統(tǒng)運(yùn) 作。此外,區(qū)域時(shí)序器122/132/142可能只是用于測(cè)試。因?yàn)閰^(qū)域時(shí)序器 122/132/142并沒(méi)有經(jīng)過(guò)同步或時(shí)序邊緣校正,在正常運(yùn)作下,區(qū)域時(shí)序器 122/132/142 —般是失能(disabled)或暫停(suspended)。因此,區(qū)域時(shí)序器 不論在基板的空間上或是運(yùn)作中的對(duì)稱式多處理器系統(tǒng)的性能上都是一種浪 費(fèi)。圖2為常規(guī)技術(shù)中刀鋒式叢集系統(tǒng)150的典型實(shí)施例,由于每一個(gè)刀鋒151、 152、 153…皆是一運(yùn)作不同操作系統(tǒng)的獨(dú)立計(jì)算機(jī),因此不需要經(jīng)過(guò)同步或時(shí) 序邊緣校正,倘若任一刀鋒151、 152、 153…的區(qū)域時(shí)序器失靈,其它刀鋒仍將 持續(xù)運(yùn)作。只要一個(gè)叢集管理系統(tǒng)(clustering management system)可以處 理任務(wù)的安排/派遣,刀鋒系統(tǒng)仍可利用于新的任務(wù)。因此,常規(guī)技術(shù)之大多數(shù) 刀鋒系統(tǒng)并不具有備用時(shí)序器(redundant clock(s))。但另一方面,也意味著 常規(guī)的刀鋒系統(tǒng)在刀鋒中并不具備對(duì)稱式多處理器的性能,因?yàn)槠淙鄙偻交?br>
時(shí)序邊緣校正。為實(shí)現(xiàn)彈性的系統(tǒng)配置,使刀鋒系統(tǒng)具有對(duì)稱式多處理器的性能,首先必 需將時(shí)序產(chǎn)生與分配的架構(gòu)重新安排。發(fā)明內(nèi)容因此,本發(fā)明提供備用時(shí)序分配架構(gòu)使刀鋒式叢集系統(tǒng)具有對(duì)稱式多處理 器的性能。本發(fā)明使用一中央時(shí)序器與若干備用區(qū)域時(shí)序器,而提供刀鋒式叢 集系統(tǒng)大型的對(duì)稱式多處理器性能。在本發(fā)明的實(shí)施例,具有對(duì)稱式多處理器性能之刀鋒式叢集系統(tǒng)包含若干 刀鋒模塊及一時(shí)序分配架構(gòu)。每一個(gè)刀鋒模塊包含若干區(qū)域時(shí)序用戶。時(shí)序分配架構(gòu)包含一時(shí)序多任務(wù)器(clock multiplexer)、設(shè)置于每一刀鋒模塊上之 可運(yùn)作的區(qū)域時(shí)序器、以及一中央時(shí)序器。中央時(shí)序器用以產(chǎn)生中央時(shí)序訊號(hào), 時(shí)序多任務(wù)器接收中央時(shí)序訊號(hào)及由區(qū)域時(shí)序器所產(chǎn)生的區(qū)域時(shí)序訊號(hào),中央 時(shí)序訊號(hào)被時(shí)序多任務(wù)器選擇并發(fā)送至每一刀鋒模塊的區(qū)域時(shí)序用戶;其中如 果中央時(shí)序器失靈,位于刀鋒模塊上之時(shí)序多任務(wù)器切換中央時(shí)序訊號(hào),改為 發(fā)送區(qū)域時(shí)序訊號(hào)至區(qū)域時(shí)序用戶。
圖1為常規(guī)技術(shù)中高階對(duì)稱式多處理器系統(tǒng)的時(shí)序分配實(shí)施例。 圖2為常規(guī)技術(shù)中刀鋒式叢集系統(tǒng)的典型設(shè)備。 圖3為依本發(fā)明實(shí)施例之具有備用時(shí)序架構(gòu)的刀鋒式計(jì)算系統(tǒng)。 圖4為圖3所示之刀鋒式叢集系統(tǒng)設(shè)定于單一刀鋒運(yùn)作模式。 圖5為圖3所示之刀鋒式叢集系統(tǒng)設(shè)定于多刀鋒運(yùn)作模式。
具體實(shí)施方式
本發(fā)明提供一備用的時(shí)序架構(gòu),使得刀鋒式叢集系統(tǒng)設(shè)備具有高階對(duì)稱式 多處理器的特征,而使其具有彈性的系統(tǒng)架構(gòu)。請(qǐng)參閱圖3, 一刀鋒式叢集系統(tǒng)主要包含一中央時(shí)序器10及若干刀鋒模塊 20、 30、 40、 50。刀鋒式叢集系統(tǒng)基本包含必要的硬設(shè)備及一叢集管理系統(tǒng)(圖 中未示)以管理刀鋒模塊20、 30、 40、 50的運(yùn)作。(為提供較清楚的說(shuō)明,刀 鋒式叢集系統(tǒng)所包含的其它系統(tǒng)構(gòu)件在圖式中被省略。)該叢集管理系統(tǒng)是一軟 件程序,在刀鋒模塊20、 30、 40、 50與使用者間作為管理/運(yùn)作接口。在本發(fā) 明中,叢集管理系統(tǒng)支持叢集計(jì)算(cluster computing),包含具有/不具有主 節(jié)點(diǎn)(head node)之非対禾爾式叢集(asymmetric clustering)及對(duì)稱式叢集 (symmetric clustering)。每一刀鋒模塊20/30/40/50可當(dāng)成一部獨(dú)立計(jì)算機(jī),通常在一主機(jī)板卜.實(shí)
現(xiàn)。刀鋒模塊20/30/40/50與不同的電子元件例如處理器、系統(tǒng)內(nèi)存、橋式芯片、輸入/輸出控制器、網(wǎng)絡(luò)接口控制器、擴(kuò)充卡的輸入/輸出連接器(皆未顯示)、 一時(shí)序多任務(wù)器(MUX) 21/31/41/51及區(qū)域時(shí)序器22/32/42/52,被具 體實(shí)現(xiàn)在印刷電路板。這些元件經(jīng)由特定的總線連接彼此以執(zhí)行數(shù)據(jù)處理的任 務(wù)。每一刀鋒模塊20/30/40/50具有一專用的操作系統(tǒng)以執(zhí)行直接的監(jiān)控并管 理設(shè)置其上的硬件元件,管理各種計(jì)算機(jī)資源并提供應(yīng)用軟件一個(gè)操作的環(huán)境。 在本發(fā)明中,每一個(gè)刀鋒模塊專用的操作系統(tǒng)具有執(zhí)行對(duì)稱式多處理器配置的 性能。刀鋒模塊20、 30、 40、 50的處理器(圖中未示)是裝設(shè)于專用處理器插槽 (圖中未示)的單一芯片處理器,每一個(gè)均設(shè)置有一個(gè)或多個(gè)計(jì)算核心 (computing core)。依照本發(fā)明,在刀鋒式叢集系統(tǒng)中的所有處理器可支持各 種的對(duì)稱式多處理器的配置,例如1、 2、 4或8個(gè)處理芯片等。亦即,在刀鋒 式叢集系統(tǒng)中口J能現(xiàn)存有不只一個(gè)對(duì)稱式多處理器區(qū)域。設(shè)置于電路板外或設(shè)置于刀鋒模塊20、 30、 40、 50之一的中央時(shí)序器10, 產(chǎn)生并分配一同步的中央時(shí)序訊號(hào)予每一刀鋒模塊20、 30、 40、 50。在某些特 定的例子,該中央時(shí)序訊號(hào)可由刀鋒模塊20、 30、 40、 50之一的區(qū)域時(shí)序訊號(hào) 器所提供。屮央時(shí)序器10是由叢集管理系統(tǒng)所控制,以執(zhí)行叢集任務(wù)。設(shè)置于每一刀鋒模塊20/30/40/50上之區(qū)域時(shí)序器22/32/42/52為一獨(dú)立 的時(shí)序來(lái)源,當(dāng)?shù)朵h式叢集系統(tǒng)正在運(yùn)作時(shí),區(qū)域時(shí)序器22/32/42/52產(chǎn)生并 分配一可運(yùn)作的區(qū)域時(shí)序訊號(hào)。區(qū)域時(shí)序器22/32/42/52亦可用于單獨(dú)運(yùn)作, 例如測(cè)試、除錯(cuò)、問(wèn)題修復(fù),倘若區(qū)域時(shí)序器22/32/42/52可維持相同的時(shí) 序邊緣校正,刀鋒式叢集系統(tǒng)便可以單一刀鋒運(yùn)作(single blade operation) 支持完整的時(shí)序故障恢復(fù)能力的特征(參照?qǐng)D4)。時(shí)序多任務(wù)器21/31/41/51電氣連接中央時(shí)序器10及在每一刀鋒模塊 20/30/40/50之區(qū)域時(shí)序器22/32/42/52與區(qū)域時(shí)序用戶。中央時(shí)序訊號(hào)及區(qū)域 時(shí)序訊號(hào)被發(fā)送至?xí)r序多任務(wù)器21/31/41/51。時(shí)序多任務(wù)器21/31/41/51監(jiān)測(cè)時(shí)序訊號(hào)的狀態(tài),可由中央時(shí)序訊號(hào)與區(qū) 域時(shí)序訊號(hào)中選擇一健全的時(shí)序訊號(hào)。時(shí)序多任務(wù)器21/31/41/51可預(yù)設(shè)為選 擇中央時(shí)序訊號(hào),如果所選擇的屮央時(shí)序訊號(hào)有問(wèn)題,而其它的時(shí)序訊號(hào)是健 全的,時(shí)序多任務(wù)器21/31/41/51將由故障的訊號(hào)來(lái)源切換至健全的訊號(hào)。時(shí) 序多任務(wù)器21/31/41/51的實(shí)際例子是選擇鎖相回路(PLL),此為叢集管理系 統(tǒng)所控制。刀鋒式叢集系統(tǒng)的叢集管理系統(tǒng)監(jiān)測(cè)時(shí)序的狀態(tài)、控制時(shí)序分配的 路徑,并采取必要的行動(dòng)以恢復(fù)該刀鋒式叢集系統(tǒng)。請(qǐng)參照?qǐng)D4,在單一刀鋒運(yùn)作的模式(single-blade operation mode)中, 只有一個(gè)刀鋒模塊20/30/40/50與每一個(gè)操作系統(tǒng)02/03/04/05領(lǐng)域所涵蓋。 在此一模式下,時(shí)序的產(chǎn)生與分配完全是備用的。
如同一叢集系統(tǒng),刀鋒式叢集系統(tǒng)可預(yù)設(shè)為使用中央時(shí)序訊號(hào)。 一旦中央時(shí)序器10失靈或有問(wèn)題,時(shí)序多任務(wù)器21/31/41/51切換而刀鋒式叢集系統(tǒng)之 該刀鋒模塊20/30/40/50可以使用其區(qū)域時(shí)序器22/32/42/52所產(chǎn)生之區(qū)域時(shí) 序訊號(hào),因此仍得以保持刀鋒模塊20/30/40/50的運(yùn)作。如果區(qū)域時(shí)序器 22/32/42/52可以保持區(qū)域時(shí)序訊號(hào)與中央時(shí)序訊號(hào)在中央時(shí)訊號(hào)失靈前的時(shí) 序邊緣校正,整個(gè)刀鋒式叢集系統(tǒng)可以保持同步的叢集運(yùn)作。相對(duì)的,若無(wú)同 步化區(qū)域時(shí)序訊號(hào),每一刀鋒模塊20/30/40/50將仍可運(yùn)作,只要叢集管理系 統(tǒng)持續(xù)處理任務(wù)的安排/派遣,刀鋒式叢集系統(tǒng)仍可用于新的任務(wù)。請(qǐng)參照?qǐng)D5,在多刀鋒運(yùn)作模式(multiple-blade operation mode)中, 二刀鋒模塊(20、 30) / (40、 50)的處理器由兩個(gè)系統(tǒng)總線連接以形成二個(gè)或 多個(gè)對(duì)稱式多處理器/操作系統(tǒng)領(lǐng)域06、 07。 一網(wǎng)絡(luò)連結(jié)(network connection) 連接該對(duì)稱式多處理器/操作系統(tǒng)領(lǐng)域06、 07以叢集化,此配置在同一對(duì)稱式 多處理器/操作系統(tǒng)領(lǐng)域06、 07的范圍內(nèi)需要同步時(shí)序。在實(shí)施例中, 一旦該 中央時(shí)序器10失靈,由于區(qū)域時(shí)序器(22、 32) / (42、 52)無(wú)法提供位于同 -對(duì)稱式多處理器/操作系統(tǒng)領(lǐng)域中的處理器同步時(shí)序訊號(hào),正在進(jìn)行中的任務(wù) 將不會(huì)回復(fù)。在本發(fā)明中系統(tǒng)總線可由任何連接二個(gè)或多個(gè)處理器間的電路而 實(shí)現(xiàn)以允許對(duì)稱式多處理,例如此些總線兼容于HyperTransport協(xié)議。網(wǎng)絡(luò) 連結(jié)包含實(shí)際的高速接口連接于刀鋒模塊的網(wǎng)絡(luò)接口控制器之間,例如無(wú)限 寬帶連結(jié)(infinite Band connection)或千兆字節(jié)以太網(wǎng)絡(luò)連結(jié)(Gigabyte Ethernet connectiorO。-個(gè)解決方式是利用同步模塊(圖中未示)以同步化在同-對(duì)稱式多處 理器/操作系統(tǒng)領(lǐng)域06/07之區(qū)域時(shí)序器(22、 32) / (42、 52)。另一個(gè)解決方式是重新啟動(dòng)刀鋒式叢集系統(tǒng)為單一刀鋒運(yùn)作模式。叢集管 理系統(tǒng)將再利用其電源(recycle the power),改變對(duì)稱式多處理器配置及時(shí) 序來(lái)源,并以單一刀鋒運(yùn)作模式重新啟動(dòng)系統(tǒng)。于是刀鋒叢集系統(tǒng)不需經(jīng)任何 修理或替換將仍可被利用。在常規(guī)技術(shù)中,替換或修理硬件配置甚為費(fèi)時(shí)。利 用時(shí)序分配架構(gòu),本發(fā)明提供刀鋒式叢集系統(tǒng)維持運(yùn)作 -段持續(xù)性期間的機(jī)會(huì)。中央時(shí)序器可預(yù)設(shè)為完全備用模式(full-redundant mode)。如果基于某 種原因刀鋒式叢集系統(tǒng)無(wú)法在單一刀鋒運(yùn)作模式下運(yùn)作,則叢集管理系統(tǒng)將需 要再利用其電源,改變?cè)摃r(shí)序來(lái)源并再重新啟動(dòng)系統(tǒng),如同單一刀鋒運(yùn)作模式。針對(duì)需要外部時(shí)序來(lái)源當(dāng)作中央時(shí)序的那些刀鋒,在測(cè)試那些刀鋒將仰賴 一額外的時(shí)序來(lái)源。本發(fā)明提供單獨(dú)計(jì)算機(jī)測(cè)試、除錯(cuò)及問(wèn)題修復(fù)之彈性化, 刀鋒可因此運(yùn)作如同獨(dú)立計(jì)算機(jī)。必要的硬設(shè)備及/或軟件/韌體配置將可能需要被用來(lái)改變對(duì)稱式多處理器 的配置。本發(fā)明之備用的時(shí)序分配架構(gòu)是為了彈性化系統(tǒng)配置的基本條件之一 。雖然本發(fā)明的技術(shù)內(nèi)容已經(jīng)以較佳實(shí)施例揭露如上,然其并非用以限定本 發(fā)明,任何熟習(xí)此技藝者,在不脫離本發(fā)明之精神所做些許之更動(dòng)與潤(rùn)飾,皆應(yīng)涵蓋于本發(fā)明之范疇內(nèi)。
權(quán)利要求
1.一種具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分配架構(gòu),該刀鋒式叢集系統(tǒng)含有若干刀鋒模塊,該時(shí)序分配架構(gòu)包含中央時(shí)序器,產(chǎn)生一中央時(shí)序訊號(hào);及一時(shí)序多任務(wù)器與一可運(yùn)作的區(qū)域時(shí)序器,安裝于各該刀鋒模塊,該時(shí)序多任務(wù)器接收該中央時(shí)序訊號(hào)與該區(qū)域時(shí)序器所產(chǎn)生之一區(qū)域時(shí)序訊號(hào),該時(shí)序多任務(wù)器選擇該中央時(shí)序訊號(hào)并發(fā)送至各該刀鋒模塊的若干區(qū)域時(shí)序用戶;其中,如果該中央時(shí)序器失靈,位于各該刀鋒模塊上之該時(shí)序多任務(wù)器切換該中央時(shí)序訊號(hào),改為發(fā)送該區(qū)域時(shí)序訊號(hào)至該些區(qū)域時(shí)序用戶。
2. 如權(quán)利要求1所述之具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分 配架構(gòu),其特征是,該中央時(shí)序訊號(hào)由該些刀鋒模塊其中一個(gè)的該區(qū)域時(shí)序器 所提供。
3. 如權(quán)利要求1所述之具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分 配架構(gòu),其特征是,該時(shí)序分配架構(gòu)更包含一同步模塊,用以同步化在至少一 個(gè)對(duì)稱式多處理器范圍中,二個(gè)或更多該些刀鋒模塊的該區(qū)域時(shí)序訊號(hào)。
4. 如權(quán)利要求3所述之具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分 配架構(gòu),其特征是,在同一對(duì)稱式多處理器范圍中,不同之該些刀鋒模塊上之 若干處理器間通過(guò)一系統(tǒng)總線連接。
5. 如權(quán)利要求1所述之具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng)之時(shí)序分 配架構(gòu),其特征是,該刀鋒式叢集系統(tǒng)更包含一網(wǎng)絡(luò)連結(jié)(network connection) 在該些刀鋒模塊間。
6. —種具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng),包含若干刀鋒模塊,分別包含若干區(qū)域時(shí)序用戶;及 一時(shí)序分配架構(gòu),包含一中央時(shí)序器,產(chǎn)生一中央時(shí)序訊號(hào);及一時(shí)序多任務(wù)器與-可運(yùn)作的區(qū)域時(shí)序器,安裝于各該刀鋒模塊, 該時(shí)序多任務(wù)器接收該中央時(shí)序訊號(hào)與該區(qū)域時(shí)序器所產(chǎn)生之一區(qū)域 時(shí)序訊號(hào),該時(shí)序多任務(wù)器選擇該中央時(shí)序訊號(hào)并發(fā)送至各該刀鋒模 塊的該些區(qū)域時(shí)序用戶;其中,如果該中央時(shí)序器失靈,位于該刀鋒模塊上之該時(shí)序多任務(wù)器 轉(zhuǎn)換該中央時(shí)序訊號(hào),改為發(fā)送該區(qū)域時(shí)序訊號(hào)至該些區(qū)域時(shí)序用戶。
7. 如權(quán)利要求6所述具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng),其特征是, 該中央時(shí)序訊號(hào)由該些刀鋒模塊其中一個(gè)的該區(qū)域時(shí)序器所提供。
8. 如權(quán)利要求6所述具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng),其特征是, 該時(shí)序分配架構(gòu)更包含一同步模塊,用以同步化在至少一個(gè)對(duì)稱式多處理器范 圍中,二個(gè)或更多該些刀鋒模塊的該區(qū)域時(shí)序訊號(hào)。
9. 如權(quán)利要求8所述具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng),其特征是, 在同一對(duì)稱式多處理器中,不同之該些刀鋒模塊上之若干處理器間通過(guò)一系統(tǒng) 總線連接。
10. 如權(quán)利要求6所述具對(duì)稱式多處理器性能的刀鋒式叢集系統(tǒng),其特征是, 更包含一網(wǎng)絡(luò)連結(jié)在該刀鋒模塊間。
全文摘要
本發(fā)明揭示了一種備用的時(shí)序分配架構(gòu),使刀鋒式叢集系統(tǒng)具有對(duì)稱式多處理器性能并可彈性化系統(tǒng)配置;本架構(gòu)主要由一個(gè)中央時(shí)序器提供中央時(shí)序訊號(hào),并由配置于系統(tǒng)中每一刀鋒模塊上可運(yùn)作的區(qū)域時(shí)序器提供區(qū)域時(shí)序訊號(hào);時(shí)序多任務(wù)器選擇中央時(shí)序訊號(hào)并發(fā)送至位于每一刀鋒模塊之若干區(qū)域時(shí)序用戶;如果中央時(shí)序器失靈,時(shí)序多任務(wù)器切換改為發(fā)送區(qū)域時(shí)序訊號(hào)。
文檔編號(hào)G06F1/10GK101126942SQ20071009629
公開日2008年2月20日 申請(qǐng)日期2007年4月10日 優(yōu)先權(quán)日2006年8月15日
發(fā)明者平井智則, 鐘志明 申請(qǐng)人:泰安電腦科技(上海)有限公司;泰安電腦科技股份有限公司