一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu)的制作方法
【專利摘要】本發(fā)明提供一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu),涉及高密度刀片式服務(wù)器領(lǐng)域,本發(fā)明在一套體系架構(gòu)中實(shí)現(xiàn)輕量計(jì)算和重量計(jì)算資源的緊耦合式互聯(lián),實(shí)現(xiàn)混合式計(jì)算。同時(shí)也可通過高速互聯(lián)平面對異構(gòu)重量級加速處理資源進(jìn)行按需劃分和配置。整個架構(gòu)由計(jì)算處理單元、系統(tǒng)中背板、網(wǎng)絡(luò)交換單元、高速I/O單元、供電單元、散熱單元和集中管理單元組成;該體系架構(gòu)可以充分根據(jù)業(yè)務(wù)負(fù)載和業(yè)務(wù)類型,對異構(gòu)加速處理資源進(jìn)行劃分和配置,從而達(dá)到系統(tǒng)資源的最優(yōu)化配置。
【專利說明】一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu)
[0001]【技術(shù)領(lǐng)域】
本發(fā)明涉及高密度刀片式服務(wù)器領(lǐng)域,具體地說是一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu)。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)數(shù)據(jù)量的爆炸式增長,對設(shè)備的處理能力也提出了很大的需求,以往傳統(tǒng)X86架構(gòu)處理器在處理器核心數(shù)量及對并行計(jì)算架構(gòu)的支持方面都不如異構(gòu)加速處理器,并且通常的X86架構(gòu)服務(wù)器在密度和擴(kuò)展靈活性方面都存在一定的局限和不足。而隨著GPU這種異構(gòu)加速處理及應(yīng)用的廣泛,以及刀片這種具備高密度、高模塊化及高集成度形態(tài)成品越來越受到數(shù)據(jù)中心等客戶的青睞,因此給具備高可擴(kuò)展性和高浮點(diǎn)運(yùn)算能力的高密度刀片式服務(wù)器產(chǎn)品帶來的廣泛的市場需求。
【發(fā)明內(nèi)容】
[0003]本發(fā)明公開一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu),通過緊耦合式高速互聯(lián)將不同計(jì)算資源有效的融合,同時(shí)也可實(shí)現(xiàn)計(jì)算密度的提升和計(jì)算資源靈活的擴(kuò)展。
[0004]該體系架構(gòu)的創(chuàng)新在于通過高速的互聯(lián)平面,在一套體系架構(gòu)中實(shí)現(xiàn)輕量計(jì)算和重量計(jì)算資源的緊耦合式互聯(lián),實(shí)現(xiàn)混合式計(jì)算。同時(shí)也可通過高速互聯(lián)平面對異構(gòu)重量級加速處理資源進(jìn)行按需劃分和配置。整個架構(gòu)由計(jì)算處理單元、系統(tǒng)中背板、網(wǎng)絡(luò)交換單元、高速I/O單元、供電單元、散熱單元和集中管理單元組成,
計(jì)算處理單元是整個系統(tǒng)的處理核心,負(fù)責(zé)數(shù)據(jù)的運(yùn)算與處理。計(jì)算處理單元內(nèi)部由輕量處理單元、高速通訊單元、高速互連單元和重載處理單元組成。每個計(jì)算處理單元由2個輕量處里單元和4個重載處理單元組成,輕量處理單元采用通用的X86架構(gòu)處理器設(shè)計(jì),重載處理單元采用具備高浮點(diǎn)運(yùn)算處理能力的GPU組成,重載處理單元通過高速互連單元與輕量處理單元之間進(jìn)行數(shù)據(jù)的交互,高速互連單元支持四通道高速并發(fā)通訊。計(jì)算單元處理的數(shù)據(jù)通過高速通訊單元將數(shù)據(jù)與外部進(jìn)行交互,高速通訊單元的數(shù)據(jù)傳輸帶寬可以達(dá)到 100Gb/s ο
[0005]系統(tǒng)中背板主要承載計(jì)算處理單元與網(wǎng)絡(luò)交換單元、高速I/O單元、供電散熱單元、供電單元與集中管理單元之間的通訊。計(jì)算處理單元與網(wǎng)絡(luò)交換單元之間通過IOGb/s以太網(wǎng)鏈路進(jìn)行互連,計(jì)算處理任務(wù)通過網(wǎng)絡(luò)交換模塊被分配到計(jì)算處理單元,多個計(jì)算處理單元通過高速I/O單元實(shí)現(xiàn)多計(jì)算單元間數(shù)據(jù)的高速交互和并行計(jì)算。
[0006]供電單元基于冗余的設(shè)計(jì)架構(gòu),為整個系統(tǒng)提供9000W?15000W的供電保障,并支持N+1和N+N的冗余模式,同時(shí)支持交流供電和直流供電兩種模式。
[0007]散熱單元主要為整個系統(tǒng)提供散熱保證,散熱單元分成兩個獨(dú)立散熱區(qū)域,區(qū)域I主要滿足所有計(jì)算處理單元的散熱,區(qū)域2主要滿足網(wǎng)絡(luò)交換單元、高速I/O單元和集中管理單元的散熱,分區(qū)獨(dú)立散熱的設(shè)計(jì)有助于降低系統(tǒng)的單點(diǎn)散熱故障風(fēng)險(xiǎn),提高系統(tǒng)的冗余性。[0008]集中管理單元是整個系統(tǒng)的管理中樞,通過I2C和以太網(wǎng)的管理鏈路與其余所有模塊連接,負(fù)責(zé)監(jiān)控所有模塊的運(yùn)行狀態(tài),包括功耗狀態(tài)、散熱情況及信息配置,同時(shí)還提供給遠(yuǎn)程管理功能。
[0009]本發(fā)明的有益效果是:
該體系架構(gòu)通過緊耦合式高速互聯(lián)將不同計(jì)算資源有效的融合,在支持通用X86處理器的基礎(chǔ)上,還可以支持具備高浮點(diǎn)計(jì)算能力的異構(gòu)加速處理器,并支持輕量級和重量級兩種模式的混合式計(jì)算。同時(shí)整個架構(gòu)具備靈活的擴(kuò)展性,該體系架構(gòu)可以充分根據(jù)業(yè)務(wù)負(fù)載和業(yè)務(wù)類型,對異構(gòu)加速處理資源進(jìn)行劃分和配置,從而達(dá)到系統(tǒng)資源的最優(yōu)化配置。
[0010]通過高速的互聯(lián)平面,在一套體系架構(gòu)中實(shí)現(xiàn)輕量計(jì)算和重量計(jì)算資源的緊耦合式互聯(lián),實(shí)現(xiàn)混合式計(jì)算。同時(shí)也可通過高速互聯(lián)平面對異構(gòu)重量級加速處理資源進(jìn)行按需劃分和配置。突破通用X86計(jì)算設(shè)備計(jì)算和擴(kuò)展的限制,滿足互聯(lián)網(wǎng)及數(shù)據(jù)中心等對數(shù)據(jù)大量處理應(yīng)用的迫切需求,具備良好的市場應(yīng)用及推廣前景。
【專利附圖】
【附圖說明】
[0011]圖1為本發(fā)明的系統(tǒng)架構(gòu)圖;
圖2為輕量計(jì)算處理模塊示意圖;
圖3為重載計(jì)算處理模塊示意圖。
【具體實(shí)施方式】
[0012]具備可擴(kuò)展性和高浮點(diǎn)計(jì)算能力的異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu),該體系架構(gòu)的創(chuàng)新在于通過高速的互聯(lián)平面,在一套體系架構(gòu)中實(shí)現(xiàn)輕量計(jì)算和重量計(jì)算資源的緊耦合式互聯(lián),實(shí)現(xiàn)混合式計(jì)算。同時(shí)也可通過高速互聯(lián)平面對異構(gòu)重量級加速處理資源進(jìn)行按需劃分和配置。整個架構(gòu)由計(jì)算處理單元、系統(tǒng)中背板、網(wǎng)絡(luò)交換單元、高速I/o單元、供電單元、散熱單元和集中管理單元組成,如圖1所示,其中:
計(jì)算處理單元是整個系統(tǒng)的處理核心,負(fù)責(zé)數(shù)據(jù)的運(yùn)算與處理。計(jì)算處理單元內(nèi)部由輕量處理單元、高速通訊單元、高速互連單元和重載處理單元組成。每個計(jì)算處理單元由2個輕量處里單元和4個重載處理單元組成,輕量處理單元采用通用的X86架構(gòu)處理器設(shè)計(jì),重載處理單元采用具備高浮點(diǎn)運(yùn)算處理能力的GPU組成,重載處理單元通過高速互連單元與輕量處理單元之間進(jìn)行數(shù)據(jù)的交互,高速互連單元支持四通道高速并發(fā)通訊。計(jì)算單元處理的數(shù)據(jù)通過高速通訊單元將數(shù)據(jù)與外部進(jìn)行交互,高速通訊單元的數(shù)據(jù)傳輸帶寬可以達(dá)到 100Gb/s。
[0013]系統(tǒng)中背板主要承載計(jì)算處理單元與網(wǎng)絡(luò)交換單元、高速I/O單元、供電散熱單元、供電單元與集中管理單元之間的通訊。計(jì)算處理單元與網(wǎng)絡(luò)交換單元之間通過IOGb/s以太網(wǎng)鏈路進(jìn)行互連,計(jì)算處理任務(wù)通過網(wǎng)絡(luò)交換模塊被分配到計(jì)算處理單元,多個計(jì)算處理單元通過高速I/O單元實(shí)現(xiàn)多計(jì)算單元間數(shù)據(jù)的高速交互和并行計(jì)算。
[0014]供電單元基于冗余的設(shè)計(jì)架構(gòu),為整個系統(tǒng)提供9000W?15000W的供電保障,并支持N+1和N+N的冗余模式,同時(shí)支持交流供電和直流供電兩種模式。
[0015]散熱單元主要為整個系統(tǒng)提供散熱保證,散熱單元分成兩個獨(dú)立散熱區(qū)域,區(qū)域I主要滿足所有計(jì)算處理單元的散熱,區(qū)域2主要滿足網(wǎng)絡(luò)交換單元、高速I/O單元和集中管理單元的散熱,分區(qū)獨(dú)立散熱的設(shè)計(jì)有助于降低系統(tǒng)的單點(diǎn)散熱故障風(fēng)險(xiǎn),提高系統(tǒng)的冗余性。
[0016]集中管理單元是整個系統(tǒng)的管理中樞,通過I2C和以太網(wǎng)的管理鏈路與其余所有模塊連接,負(fù)責(zé)監(jiān)控所有模塊的運(yùn)行狀態(tài),包括功耗狀態(tài)、散熱情況及信息配置,同時(shí)還提供給遠(yuǎn)程管理功能。
[0017]圖2是輕量計(jì)算處理模塊的原理圖,兩個輕量處理單元之間通過兩條9.2GT/s的OPI總線進(jìn)行互連,實(shí)現(xiàn)兩個輕量處理之間的數(shù)據(jù)通訊。每個輕量處理單元通過2條PCIe3.0 xl6的高速擴(kuò)展鏈路連接高速互連單元,通過高速互連單元與重載計(jì)算處理模塊上的重載計(jì)算單元進(jìn)行數(shù)據(jù)通訊。同時(shí)每個輕量處理單元還通過I條PCIe3.0 x8的高速擴(kuò)展鏈路用于連接高速通訊單元,將運(yùn)算的數(shù)據(jù)通過100Gb/S的高速傳輸通道傳遞到系統(tǒng)的高速I/o單元上。輕量處理單元I通過DMI鏈路連接控制單元,控制單元主要負(fù)責(zé)模塊中存儲、網(wǎng)絡(luò)、低速基礎(chǔ)I/O和管理間的數(shù)據(jù)控制,其中:控制單元通過PCIe3.0 x4的鏈路連接網(wǎng)絡(luò)單元,網(wǎng)絡(luò)單元支持2條lOGb/s的數(shù)據(jù)鏈路,用于連接系統(tǒng)中的網(wǎng)絡(luò)交換單元,可以將通過網(wǎng)絡(luò)交換單元傳輸?shù)挠?jì)算任務(wù)傳遞到處理單元中進(jìn)行處理,同時(shí)可以將處理單元處理完的數(shù)據(jù)再通過網(wǎng)絡(luò)單元進(jìn)行反饋??刂茊卧ㄟ^I2C總線與管理單元進(jìn)行連接,管理單元主要負(fù)責(zé)對整個輕量計(jì)算處理模塊進(jìn)行管理,管理模塊通過2條lGb/s的鏈路與集中管理模塊連接,向集中管理模塊反饋處理模塊工作狀態(tài)的監(jiān)控,以及接收和處理系統(tǒng)集中管理模塊傳遞過來的數(shù)據(jù),同時(shí)將處理模塊上的VGA信號也傳輸給集中管理模塊,在集中管理模塊上可實(shí)現(xiàn)對所有計(jì)算模塊的視頻監(jiān)控。
[0018]圖3是重載計(jì)算處理模塊的的原理圖,整個處理模塊主要由四個重載計(jì)算單元組成,每個重載計(jì)算單元都連接I個高速互連單元,兩者之間基于PCIe3.0 xl6的高速擴(kuò)展鏈路進(jìn)行通訊,而高速互連單元與輕量計(jì)算處理模塊上的高速互連單元之間通過正交高速連接器實(shí)現(xiàn)互聯(lián),這樣可以將通過將網(wǎng)絡(luò)模塊傳來計(jì)算任務(wù)經(jīng)過高速互連單元分配給重載計(jì)算單元,同時(shí)通過高速互連單元將重載計(jì)算單元處理完成的數(shù)據(jù)傳遞給輕量計(jì)算處理模塊上的網(wǎng)絡(luò)模塊,隨后通過網(wǎng)絡(luò)模塊將運(yùn)算完成的數(shù)據(jù)進(jìn)一步通過系統(tǒng)中網(wǎng)絡(luò)交換單元反饋給用戶。
【權(quán)利要求】
1.一種異構(gòu)加速刀片式計(jì)算機(jī)系統(tǒng)架構(gòu),其特征在于通過高速的互聯(lián)平面,在一套體系架構(gòu)中實(shí)現(xiàn)輕量計(jì)算和重量計(jì)算資源的緊耦合式互聯(lián),實(shí)現(xiàn)混合式計(jì)算;同時(shí)也可通過高速互聯(lián)平面對異構(gòu)重量級加速處理資源進(jìn)行按需劃分和配置;整個架構(gòu)由計(jì)算處理單元、系統(tǒng)中背板、網(wǎng)絡(luò)交換單元、高速I/o單元、供電單元、散熱單元和集中管理單元組成, 計(jì)算處理單元是整個系統(tǒng)的處理核心,負(fù)責(zé)數(shù)據(jù)的運(yùn)算與處理; 系統(tǒng)中背板主要承載計(jì)算處理單元與網(wǎng)絡(luò)交換單元、高速I/o單元、供電散熱單元、供電單元與集中管理單元之間的通訊; 散熱單元主要為整個系統(tǒng)提供散熱保證; 集中管理單元是整個系統(tǒng)的管理中樞,通過I2C和以太網(wǎng)的管理鏈路與其余所有模塊連接,負(fù)責(zé)監(jiān)控所有模塊的運(yùn)行狀態(tài),包括功耗狀態(tài)、散熱情況及信息配置,同時(shí)還提供給遠(yuǎn)程管理功能。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于計(jì)算處理單元內(nèi)部由輕量處理單元、高速通訊單元、高速互連單元和重載處理單元組成;每個計(jì)算處理單元由2個輕量處里單元和4個重載處理單元組成,輕量處理單元采用通用的X86架構(gòu)處理器設(shè)計(jì),重載處理單元采用具備高浮點(diǎn)運(yùn)算處理能力的GPU組成,重載處理單元通過高速互連單元與輕量處理單元之間進(jìn)行數(shù)據(jù)的交互,高速互連單元支持四通道高速并發(fā)通訊,計(jì)算單元處理的數(shù)據(jù)通過高速通訊單元將數(shù)據(jù)與外部進(jìn)行交互,高速通訊單元的數(shù)據(jù)傳輸帶寬可以達(dá)到lOOGb/s。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于計(jì)算處理單元與網(wǎng)絡(luò)交換單元之間通過10Gb/s以太網(wǎng)鏈路進(jìn)行互連,計(jì)算處理任務(wù)通過網(wǎng)絡(luò)交換模塊被分配到計(jì)算處理單元,多個計(jì)算處理單元通過高速I/O單元實(shí)現(xiàn)多計(jì)算單元間數(shù)據(jù)的高速交互和并行計(jì)算。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于散熱單元分成兩個獨(dú)立散熱區(qū)域,區(qū)域I主要滿足所有計(jì)算處理單元的散熱,區(qū)域2主要滿足網(wǎng)絡(luò)交換單元、高速I/O單元和集中管理單元的散熱。
【文檔編號】G06F1/18GK103970214SQ201410210526
【公開日】2014年8月6日 申請日期:2014年5月19日 優(yōu)先權(quán)日:2014年5月19日
【發(fā)明者】王磊 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司