專利名稱:一種低成本超級(jí)運(yùn)算系統(tǒng)及其實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及低成本建立的具有高速處理性能的 計(jì)算機(jī)系統(tǒng)。
背景技術(shù):
高性能計(jì)算(High Performance Computing — HPC)解決了世界上最為復(fù) 雜和艱巨的計(jì)算難題,并且能夠輕松處理。如地球物理、天文計(jì)算、工程仿真、 氣象建模、模擬撞車試驗(yàn)、人體基因繪圖以及核爆炸模擬等多種與人類生命相 關(guān)的重要領(lǐng)域都要用到HPC。突飛猛進(jìn)的性能、急劇下降的成本以及勢(shì)如潮涌 的霈求等眾多因素,要求HPC迅速走出科學(xué)研究實(shí)驗(yàn)室,步入主流商業(yè)領(lǐng)域。
另一方面,基于X86架構(gòu)技術(shù)的HPC設(shè)備已經(jīng)實(shí)現(xiàn)了優(yōu)異的性能、可擴(kuò)充 性、靈活性和升級(jí)能力-而成本只是基于RISC的專有HPC集群和超級(jí)計(jì)算機(jī)的 幾分之一。此外,Linux在IT業(yè)里已經(jīng)有著非常重要的影響,除了其具有免費(fèi)、 高效、可靠等優(yōu)勢(shì)外,對(duì)于計(jì)算機(jī)科學(xué)家和那些需要進(jìn)行大量運(yùn)算的科學(xué)家來 說,它還是一個(gè)非常強(qiáng)大的工具。因?yàn)?,可以使用基于Beowulf集群理論,使 用普通的PC在Linux環(huán)境下基于PXE技術(shù)做成一種低成本超級(jí)運(yùn)算系統(tǒng)來解決 所面臨的問題,并且這種系統(tǒng)所具有的價(jià)格優(yōu)勢(shì)是傳統(tǒng)的并行計(jì)算機(jī)所無法比 擬的。具有廣闊的應(yīng)用前景。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有科研及企業(yè)海量數(shù)據(jù)計(jì)算的需求,提供一種高集 成度、低成本與高處理性能為一體的高性能計(jì)算機(jī)系統(tǒng)。本發(fā)明的另一 目的在于提供一種該計(jì)算機(jī)系統(tǒng)的實(shí)現(xiàn)方法。 為了實(shí)現(xiàn)發(fā)明目的一,采用的技術(shù)方案如下
一種低成本超級(jí)運(yùn)算系統(tǒng),包括一個(gè)頭節(jié)點(diǎn)和多個(gè)子節(jié)點(diǎn),頭節(jié)點(diǎn)與子節(jié) 點(diǎn)通過橋接設(shè)備連接,頭節(jié)點(diǎn)設(shè)置有處理器和硬盤,子節(jié)點(diǎn)設(shè)置有處理器,頭 節(jié)點(diǎn)和子節(jié)點(diǎn)均還設(shè)置有雙網(wǎng)卡,通過該雙網(wǎng)卡與橋接設(shè)備相連。
上述技術(shù)方案屮,所述頭節(jié)點(diǎn)采用普通PC,所述子節(jié)點(diǎn)為無盤子節(jié)點(diǎn)。
所述頭節(jié)點(diǎn)安裝有服務(wù)器版LINUX系統(tǒng),而子節(jié)點(diǎn)則安裝有桌面版 LINUX系統(tǒng),并實(shí)現(xiàn)PXE啟動(dòng)。
進(jìn)一步的,本發(fā)明包括3個(gè)無盤子節(jié)點(diǎn),頭節(jié)點(diǎn)及每個(gè)無盤子節(jié)點(diǎn)均設(shè)置 有兩個(gè)千兆網(wǎng)卡,所述橋接設(shè)備采用千兆交換機(jī),頭節(jié)點(diǎn)和三個(gè)無盤子節(jié)點(diǎn)通 過千兆交換機(jī)組成系統(tǒng)。
為了實(shí)現(xiàn)發(fā)明目的二,采用的技術(shù)方案如下
一種低成本超級(jí)運(yùn)算系統(tǒng)的實(shí)現(xiàn)方法,包括系統(tǒng)安裝和無盤節(jié)點(diǎn)安裝; 所述系統(tǒng)安裝采用Ubiintu對(duì)頭節(jié)點(diǎn)的硬盤進(jìn)行分區(qū),分為root分區(qū)、home
分區(qū)、交換分區(qū)和無盤節(jié)點(diǎn)root分區(qū);
所述無盤節(jié)點(diǎn)安裝采用Ubuntu服務(wù)器版CD替換Ubuntu桌面版CD,然后
啟動(dòng)頭節(jié)點(diǎn),在頭節(jié)點(diǎn)的無盤節(jié)點(diǎn)root分區(qū)進(jìn)行安裝,對(duì)應(yīng)每個(gè)無盤子節(jié)點(diǎn)重
復(fù)安裝過程,或者是安裝其中一個(gè)無盤子節(jié)點(diǎn),并將該安裝內(nèi)容復(fù)制到其它無
盤節(jié)點(diǎn)root分區(qū)上。
上述技術(shù)方案中,還包括遠(yuǎn)程啟動(dòng)過程,具體包括先在頭節(jié)點(diǎn)安裝NFS、 DHCP和TFTP服務(wù),然后在頭節(jié)點(diǎn)配置PXE,最后再進(jìn)行無盤子節(jié)點(diǎn)的配置操作。
本發(fā)明具有以下優(yōu)點(diǎn)
1、成本低廉,采用市面上常用的電子設(shè)備即可實(shí)現(xiàn),同時(shí)便于維護(hù);
2、 操作系統(tǒng)采用Linux,可以通過網(wǎng)絡(luò)下載,方便進(jìn)行并行運(yùn)算;
3、 具有髙運(yùn)算能力,4個(gè)節(jié)點(diǎn)系統(tǒng)其總運(yùn)算能力為20 GFlops,即每秒進(jìn) 行200億次雙精度浮點(diǎn)運(yùn)算。還可以根據(jù)實(shí)際需要進(jìn)行擴(kuò)展,提髙運(yùn)算能力, 實(shí)現(xiàn)性能的幾何增長;
4、 結(jié)構(gòu)簡單,體積小巧,節(jié)約能源,傳統(tǒng)的超級(jí)計(jì)算系統(tǒng)大多體積龐大, 能源消耗巨大,本系統(tǒng)可以采用普通PC電源供電,能耗和占用空間極小。
圖1是本發(fā)明的組成結(jié)構(gòu)示意框圖; 圖2是本發(fā)明的具體實(shí)施方式
示意框圖; 圖3是本發(fā)明的產(chǎn)品設(shè)計(jì)圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)木發(fā)明做進(jìn)一歩的說明。
本發(fā)明是由普通PC配件和網(wǎng)絡(luò)產(chǎn)品組成,利用PC配件組裝無盤系統(tǒng)(本 系統(tǒng)可以擴(kuò)展,在此以一個(gè)頭節(jié)點(diǎn)和三個(gè)子節(jié)點(diǎn)為例),包括頭節(jié)點(diǎn)NodeO、無 盤子節(jié)點(diǎn)Nodel、無盤子節(jié)點(diǎn)Node2以及無盤子節(jié)點(diǎn)Node3通過千兆交換機(jī)G 連接而組成,如附圖1、圖2所示。其中頭節(jié)點(diǎn)Node0的組裝如同普通PC組裝 方式,其硬盤共250G的存儲(chǔ)容量,主板板載了一個(gè)千兆網(wǎng)卡,利用其PCI-E 插槽添加了一塊千兆網(wǎng)卡,同時(shí)該節(jié)點(diǎn)外接顯示器。子節(jié)點(diǎn)(包括Nodel、Node2、 Node3)的組裝不需要硬盤和光驅(qū),但是同樣在PCI-E插槽增加一塊千兆網(wǎng)卡。 諸節(jié)點(diǎn)之間通過千兆交換機(jī)G連接。由于每塊主板具有雙網(wǎng)卡,可以把頭節(jié)點(diǎn) 板載網(wǎng)卡的IP地址設(shè)置為192.168.2.1,而PCI-E網(wǎng)卡IP地址設(shè)置為 192.168. 3.1.其他子節(jié)點(diǎn)IP地址可以根據(jù)對(duì)應(yīng)頭節(jié)點(diǎn)網(wǎng)卡設(shè)置。操作系統(tǒng)方 面,頭節(jié)點(diǎn)安裝服務(wù)器版Linux系統(tǒng),而子節(jié)點(diǎn)可以安裝桌面版即可。同時(shí)需
要安裝NFS、 DHCP和TFTP服務(wù),最后通過替換Linux內(nèi)核代碼,實(shí)現(xiàn)PXE啟動(dòng)。 之后既可以啟動(dòng)這臺(tái)小型髙性能設(shè)備。
系統(tǒng)安裝過程如附圖3所示,其中H表示硬盤Hard Driver, D為DVD光 驅(qū)(DVD Driver), P為電源(Power), G為千兆交換機(jī),B為寶麗板,M為電腦 主板(Mother Board)。
首先是將主板M固定在寶麗板B上,并將PC配件按照要求分別組建節(jié)點(diǎn) Node0、 Nodel、 Node2、 Node3。然后首先對(duì)頭節(jié)點(diǎn)Node0進(jìn)行系統(tǒng)安裝。
采用Ubuntu7.10for 64-bit pc系統(tǒng),可以通過www. ubuntu. com免費(fèi)下 載。對(duì)硬盤H進(jìn)行磁盤分區(qū)
(1) 50 GB作為root ( / )分區(qū);
(2) 150 GB留給/home ;
(3) 1GB交換分區(qū);
(4) 開辟3個(gè)分區(qū),每個(gè)分區(qū)共10Gb,作為無盤節(jié)點(diǎn)的root分區(qū)。 頭節(jié)點(diǎn)安裝有兩個(gè)網(wǎng)卡.其中兩個(gè)使用的方法是并連接到千兆交換機(jī)上
(一個(gè)是板載千兆網(wǎng)卡, 一個(gè)是插在pci-e的千兆網(wǎng)卡),即ethO和ethl是 千兆網(wǎng)卡。
eth0的ip設(shè)置為192.168. 2.1 子網(wǎng)掩碼255. 255. 255.0, ethl是192.168. 3.1, 子網(wǎng)掩碼255. 255. 255.0。
安裝無盤節(jié)點(diǎn),用Ubuntu桌面版CD替換Ubuntu服務(wù)器版CD,然后重新 啟動(dòng)頭節(jié)點(diǎn)NodeO,使用在前面分區(qū)中的無盤節(jié)點(diǎn)的root分區(qū)進(jìn)行安裝。重復(fù) 此3次,一次安裝其中一個(gè)節(jié)點(diǎn),或者把這次需要安裝的內(nèi)容復(fù)制到其他兩個(gè)
無盤節(jié)點(diǎn)的根分區(qū)。以便迅速完成操作系統(tǒng)安裝,無盤節(jié)點(diǎn)開機(jī)之后,還可以 遠(yuǎn)程啟動(dòng)配置。
遠(yuǎn)程啟動(dòng),安裝NFS、 DHCP和TFTP服務(wù),可以參考操作系統(tǒng)相關(guān)說明手 冊(cè),在此不再詳述。最后是PXE技術(shù),可以從http:〃syslinux.zytor.com / pxe.php下載pxelinux,所需要的僅僅是pxelinux. 0這個(gè)文件。此外,應(yīng)當(dāng)用 當(dāng)前的內(nèi)核版本取代KERNEL一VERSION:初始化虛擬磁盤,并把初始化后的 ramdisk和內(nèi)核圖片放到/tftpboot目錄。再通過更改根目錄使其中的無盤節(jié) 點(diǎn)根目錄成為系統(tǒng)的根目錄。
Sudo chroot/nodes/nfs/node1/bin/bash
編輯文件/etc/initramfs-tools/initramfs. conf,設(shè)置B00T二nfs,最后
運(yùn)行命令
sudo update-initramfs-u
這樣就生成了一個(gè)新的虛擬磁盤,程序?qū)?huì)輸出新創(chuàng)建的虛擬磁盤的文件 名,然后就是配置pxe。
創(chuàng)建目錄/ tftpboot / pxelinux-cfg mkdir / tftpboot / pxelinux. cfg
PXE配置文件放在這個(gè)目錄下,當(dāng)其中某一個(gè)節(jié)點(diǎn)啟動(dòng)時(shí),通過在目錄下 尋找類似01-xx-xx-xx-xx-xx-xx格式的文件名找到相對(duì)用的配置文件,所以如 果xx是MAC的地址,那么這個(gè)文件就包含了其系統(tǒng)啟動(dòng)所需的信息。
default linux
label linux
kernel vmlinuz-KERNEL_VERSI0N
append initrd=initrd. img-KERNEL_VERSI0N\\
nfs root=192.168. 2- l:/nodes/nfs/nodel然后就是簡單的無盤節(jié)點(diǎn)的配置工作,完成之后,系統(tǒng)就可以正常工作了。
權(quán)利要求
1、一種低成本超級(jí)運(yùn)算系統(tǒng),其特征在于包括一個(gè)頭節(jié)點(diǎn)和多個(gè)子節(jié)點(diǎn),頭節(jié)點(diǎn)與子節(jié)點(diǎn)通過橋接設(shè)備連接,頭節(jié)點(diǎn)設(shè)置有處理器和硬盤,子節(jié)點(diǎn)設(shè)置有處理器,頭節(jié)點(diǎn)和子節(jié)點(diǎn)均還設(shè)置有雙網(wǎng)卡,通過該雙網(wǎng)卡與橋接設(shè)備相連。
2、 根據(jù)權(quán)利要求1所述的低成本超級(jí)運(yùn)算系統(tǒng),其特征在于所述頭節(jié)點(diǎn) 采用普通PC,所述子節(jié)點(diǎn)為無盤子節(jié)點(diǎn)。
3、 根據(jù)權(quán)利要求1或2所述的低成本超級(jí)運(yùn)算系統(tǒng),其特征在于所述頭 節(jié)點(diǎn)安裝有服務(wù)器版LINUX系統(tǒng),而子節(jié)點(diǎn)則安裝有桌面版LINUX系統(tǒng),并 實(shí)現(xiàn)PXE啟動(dòng)。
4、 根據(jù)權(quán)利要求3所述的低成本超級(jí)運(yùn)算系統(tǒng),其特征在于包括3個(gè)無 盤子節(jié)點(diǎn),頭節(jié)點(diǎn)及每個(gè)無盤子節(jié)點(diǎn)均設(shè)置有兩個(gè)千兆網(wǎng)卡,所述橋接設(shè)備釆 用千兆交換機(jī),頭節(jié)點(diǎn)和三個(gè)無盤子節(jié)點(diǎn)通過千兆交換機(jī)組成系統(tǒng)。
5、 一種低成本超級(jí)運(yùn)算系統(tǒng)的實(shí)現(xiàn)方法,其特征在于包括系統(tǒng)安裝和無 盤節(jié)點(diǎn)安裝;所述系統(tǒng)安裝采用Ubimtu對(duì)頭節(jié)點(diǎn)的硬盤進(jìn)行分區(qū),分為root分區(qū)、home 分區(qū)、交換分區(qū)和無盤節(jié)點(diǎn)ioot分區(qū);所述無盤節(jié)點(diǎn)安裝采用Ubuntu服務(wù)器版CD替換Ubuntu桌面版CD,然后 啟動(dòng)頭節(jié)點(diǎn),在頭節(jié)點(diǎn)的無盤節(jié)點(diǎn)root分區(qū)進(jìn)行安裝,對(duì)應(yīng)每個(gè)無盤子節(jié)點(diǎn)重 復(fù)安裝過程,或者是安裝其中一個(gè)無盤子節(jié)點(diǎn),并將該安裝內(nèi)容復(fù)制到其它無 盤節(jié)點(diǎn)root分區(qū)上。
6、 根據(jù)權(quán)利要求5所述的低成本超級(jí)運(yùn)算系統(tǒng)的實(shí)現(xiàn)方法,其特征在于 還包括遠(yuǎn)程啟動(dòng)過程,具體包括先在頭節(jié)點(diǎn)安裝NFS、 DHCP和TFTP服務(wù),然后 在頭節(jié)點(diǎn)配置PXE,最后再進(jìn)行無盤子節(jié)點(diǎn)的配置操作。
全文摘要
本發(fā)明提供了一種低成本超級(jí)運(yùn)算系統(tǒng)及其實(shí)現(xiàn)方法,系統(tǒng)包括一個(gè)頭節(jié)點(diǎn)和多個(gè)子節(jié)點(diǎn),頭節(jié)點(diǎn)與子節(jié)點(diǎn)通過橋接設(shè)備連接,頭節(jié)點(diǎn)設(shè)置有處理器和硬盤,子節(jié)點(diǎn)設(shè)置有處理器,頭節(jié)點(diǎn)和子節(jié)點(diǎn)均還設(shè)置有雙網(wǎng)卡,通過該雙網(wǎng)卡與橋接設(shè)備相連;方法包括系統(tǒng)安裝和無盤節(jié)點(diǎn)安裝、網(wǎng)絡(luò)配置、系統(tǒng)內(nèi)核更新、PXE設(shè)置等;本發(fā)明針對(duì)現(xiàn)有科研及企業(yè)海量數(shù)據(jù)計(jì)算的需求,提供一種高集成度、低成本與高處理性能為一體的高性能計(jì)算機(jī)系統(tǒng)。
文檔編號(hào)H04L12/28GK101340335SQ20081002768
公開日2009年1月7日 申請(qǐng)日期2008年4月25日 優(yōu)先權(quán)日2008年4月25日
發(fā)明者周翠英, 孫志強(qiáng) 申請(qǐng)人:中山大學(xué)