專利名稱::一種測試Intel多核CPU加速比的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及服務(wù)器應(yīng)用測試領(lǐng)域,具體涉及一種測試Intel多核CPU加速比的方法。2
背景技術(shù):
:加速比定義為串行算法在單CPU上的運行時間與并行算法在多CPU上的運行時間之比。加速比可以告訴我們CPU的運算性能是否與CPU核心數(shù)目的增長同步。站在服務(wù)器產(chǎn)品在研發(fā)角度上看,需要對服務(wù)器性能進行評估,譬如使用2顆雙核的CPU運算能力強還是使用一顆4核的CPU,為確保開發(fā)出性價比更高的產(chǎn)品,其中CPU加速比就是一個很重要的評價指標(biāo);PWscf(Plane-WaveSelf~ConsistentField)是意大利國際理論物理研究中心主持開發(fā)的一個基于平面波的第一性原理計算軟件包,目前PWscf是QuantumESPRESSO(ESPRESSO:Open-SourcePackageforResearchinElectronStructure,SimulationandOptimization)的一部分,主要集成了pwscf.cpmd和fpmd這三個模塊,可以進行總能相關(guān)計算和分子動力學(xué)模擬,其次是基于多線程編寫的,屬于CPU密集型軟件,計算量比較大,可以讓CPU—致處于飽和狀態(tài);最后是用戶可以根據(jù)測試的需求靈活設(shè)置計算量,從而達到控制測試時間的目的,具有更大的靈活性。站在應(yīng)用角度上講,單線程應(yīng)用已經(jīng)造成了多核CPU資源的嚴(yán)重浪費,而開發(fā)多線程應(yīng)用,充分發(fā)揮多核CPU協(xié)調(diào)運作的優(yōu)勢,CPU用戶最關(guān)心的一個指標(biāo)也是CPU加速比。該方法IE基于上述軟件,提出了一個高效的測試CPU加速比的方法。3
發(fā)明內(nèi)容對Intel多核CPU的加速比進行評估測試,必須保證在同一個測試基準(zhǔn)下進行,而且每次進行測試前都要進行機器的充啟,這樣可以避免緩存對測試結(jié)果的影響。該測試方案的具體實施包括并行環(huán)境的配置、intel編譯器的安裝,intelMKL庫的安裝,intelmpi并行軟件的安裝,pwscf軟件的安裝運行測試這五大部分組成.4圖1為一種測試Intel多核CPU加速比的方法的加速比折線圖5具體實施例方式本發(fā)明的一種測試Intel多核CPU加速比的方法具體實施詳細(xì)介紹如下1)、并行環(huán)境的配置1.1)、配置rsh,開啟用戶對所有節(jié)點的rsh權(quán)限,具體如下a)、編輯/etc/hosts,加入所有(包括本機的)節(jié)點的ip地址和對應(yīng)的計算機名;b)、編輯/root/.rhosts和/etc/hosts.equiv,加入所有節(jié)點的計算機名;c)、開啟rsh服務(wù)setup—systemservices-*Wrsh[*]rlogin[*]rexec;d)、編輯/etc/securetty,力口入rsh,rexec,rlogin;e)、重起月艮務(wù)servicexinetdrestart;上述步驟要重復(fù)在各節(jié)點配置。1.2)、配置SSh,實現(xiàn)所有節(jié)點之間的無密碼互訪,具體配置步驟如下a)、在每個節(jié)點上以root登錄,然后運行ssh-keygen-tdsab)、在每個節(jié)點上將生成的/root/.ssh/id—dsa和/root/.ssh/id—dsa.pub都導(dǎo)入到同一個文件authorized—keys2中;c)、將生成的包含所有節(jié)點信息的authorized—keys2文件拷貝到其他所有節(jié)點上;d)、測試ssh配置是否成功;1.3)、進行NFS的配置,開啟nfs和portm即服務(wù),建立共享文件目錄,具體配置如下a)、在管理端建立文件/etc/e叩orts,并且設(shè)置共享目錄屬性;b)、在管理端激活nfs和portmap服務(wù);c)、在被管理端建立需要掛載的目錄,并進行本地掛載;1.4)、進行NIS配置,建立域名解析服務(wù),具體實施如下a)、在管理端開啟月艮務(wù)yppasswd和ypserv;b)、在管理端配置NIS域名;c)、在被管理端開啟服務(wù)ypbind;d)、在被管理端修改/etc/passwd在末尾加入+;到此并行環(huán)境配置完成,如果是在單機下進行intelCPU的多核測試,可以直接跳過并行環(huán)境配置這一步。2)、Intel編譯器我們選用intel編譯器主要是一方面是由于PWSCF軟件才后期安裝時,需要進行調(diào)用Intel編譯器進行編譯,另一個方面也是由于可以使用Intel編譯器對Intel的CPU進行不同程度的優(yōu)化,以獲取更高的性能。a)、Intel〔++編譯器的安裝解壓intel0++編譯器壓縮包,運行./install,sh文件,按照默認(rèn)方式進行安裝,默認(rèn)安裝路徑是/opt/intel/cc/.b)、IntelFortran編譯器的安裝解壓intelFortran編譯器壓縮包,運行./install,sh,按照默認(rèn)方式進行安裝,默認(rèn)安裝路徑是/opt/intel/fc/.3)IntelMKL數(shù)學(xué)核心庫安裝PWSCF軟件中含有大量的數(shù)學(xué)運算,IntelMKL庫針對數(shù)學(xué)運算迸行了大量的優(yōu)化,這樣可以保證PWSCF軟件高效運行。具體安裝步驟如下解壓IntelMKL庫壓縮包,運行./install,sh按照默認(rèn)的安裝方式進行安裝,默認(rèn)的安裝路徑是/opt/intel/mkl.注意要保證集群上的所有節(jié)點的安裝目錄都相同,這樣才保證應(yīng)用軟件運行時出現(xiàn)不必要的錯誤。4)、IntelMPI軟件在安裝IntelMPI軟件時,首先要創(chuàng)建machines.LINUX文件,在該文件中加入所有節(jié)點,這樣在安裝時可以避免每個節(jié)點進行安裝。在MPI安裝完成后,需要進行MPI的測試,啟動MPD,配置rapd.host文件,確保MPI運行成功。5)基準(zhǔn)測試軟件pwscf安裝PWscf軟件時,可以根據(jù)測試系統(tǒng)的CPU信息,設(shè)置IntelC++和Fortran編譯器的優(yōu)化參數(shù),進行優(yōu)化編譯。編譯成功后,進行安裝,安裝成功后會出現(xiàn)一個PW.x(電子和離子優(yōu)化)的執(zhí)行檔,我們通過運行PW.x來計算不同的元素來測試CPU的加速比。具體的安裝步驟如下a)、運行下列命令./configureARCH=ia32MPIF90=mpiifortLIBDIRS="/叩t/intel/mk1/9.1.023/lib/32/usr/lib/math"注意不同的版本可能命令參數(shù)不太一樣;b)、設(shè)置環(huán)境intel編譯器,mkl庫,即i環(huán)境變量;c)、編譯使用命令makeall;d)、編譯成功進行測試;6)測試在測試時,利用MPI的工作原理來控制參與運算的CPU核數(shù),從而得到不同的核數(shù)計算相同的元素所需要的CPU時間,進而計算出CPU的加速比。加速比定義為串行算法在單CPU上的運行時間與并行算法在多CPU上的運行時間之比,加速比可以告訴我們性能是否與核心數(shù)目的增長同步。測試時,先要啟動mpdboot,如果是集群時需要把所有節(jié)點全部啟動,mpdboot啟動成功后,再運行mpiexe進行測試。8例如a)啟動單個節(jié)點Mpdboot-n1其中n表示啟動的節(jié)點數(shù)b)、運行1個核心mpiexec-n1bin/pw.x<mgal2o4-cf.scf.in其中n表示參與運算的核數(shù)pw.x為可執(zhí)行檔,mgal2o4-cf.scf.in包含有相應(yīng)的配置信息和待計算的元素。c)、運行2個核心mpiexec_n2bin/pw.x<mgal2o4-cf.scf.ind)、運行4個核心mpiexec-n4bin/pw.x<mgal2o4_cf.scf.in測試完成,進行數(shù)據(jù)的收集。7)測試數(shù)據(jù)的收集數(shù)據(jù)的收集分為兩類a)、系統(tǒng)性能數(shù)據(jù)系統(tǒng)性能數(shù)據(jù)主要收集CPU和內(nèi)存的信息,使用TOP或者VMSTAT命令。b)、CPU運行數(shù)據(jù)CPU運行數(shù)據(jù)主要是收集cputime和walltime這兩項數(shù)據(jù)。8)測試數(shù)據(jù)的整理測試數(shù)據(jù)的整理主要是將數(shù)據(jù)進行標(biāo)準(zhǔn)化,以便于用戶分析。我們主要是借助于excel進行分析。由于測試的次數(shù)比較多,收集的數(shù)據(jù)量比較大,容易造成混淆,可以采用便于記憶的命名規(guī)范進行,譬如以參與運算的核數(shù)進行命名等。根據(jù)系統(tǒng)性能數(shù)據(jù)的分析,我們可以判定CPU在當(dāng)前基準(zhǔn)下是否運行處于飽和狀態(tài)。根據(jù)cputime和walltime數(shù)據(jù)我們計算CPU的加速比。整理后的測試數(shù)據(jù)應(yīng)該包括如下內(nèi)容硬件信息(CPU,內(nèi)存,硬盤),軟件信息(應(yīng)用軟件,操作系統(tǒng)),負(fù)載量,編譯信息,CPUTime,加速比等。下面給IntelXeon7120為例介紹一下成果數(shù)據(jù)的展現(xiàn)形式a)、圖標(biāo)形式系統(tǒng)概要信息<table>tableseeoriginaldocumentpage10</column></row><table>CPUtime的加速比speed—up為單核CPUtime/多核CPUtime的結(jié)果;CPUwalltime的加速比Indealizedspeed—up為單核Walltime/多核Wa11time的結(jié)果。權(quán)利要求1、一種測試Intel多核CPU性能加速比的方法,其特征在于基于多核CPU同時進行多任務(wù)處理和多任務(wù)計算方面的優(yōu)勢,通過選用多線程、CPU高密集型應(yīng)用軟件,使CPU的多核一直處于飽和的運行狀態(tài),真實測試CPU各個核運算性能能力,獲得一組準(zhǔn)確可靠的加速比數(shù)據(jù)。2、根據(jù)權(quán)利要求1所述的方法,其特征在于該測試方案的具體實施包括并行環(huán)境的配置、intel編譯器的安裝,intelMKL庫的安裝,intelmpi并行軟件的安裝,pwscf軟件的安裝運行測試這五大部分組成,下面就每一部分的具體步驟如下1)、并行環(huán)境的配置1.1)、配置rsh,開啟用戶對所有節(jié)點的rsh權(quán)限,具體如下a)、編輯/etc/hosts,加入所有(包括本機的)節(jié)點的ip地址和對應(yīng)的計算機名;b)、編輯/root/.rhosts和/etc/hosts.equiv,加入所有節(jié)點的計算機名;c)、開啟rsh月艮務(wù)setup—systemservices—[氺]rsh[氺]rlogin[氺]rexec;d)、編輯/etc/securetty,力口入rsh,rexec,rlogin;e)、重起月艮務(wù)servicexinetdrestart;上述步驟要重復(fù)在各節(jié)點配置;1.2)、配置ssh,實現(xiàn)所有節(jié)點之間的無密碼互訪,具體配置步驟如下a)、在每個節(jié)點上以root登錄,然后運行ssh-keygen-tdsab)、在每個節(jié)點上將生成的/root/.ssh/id—dsa和/root/.ssh/id—dsa.pub都導(dǎo)入到同一^f"文件authorized—keys2中;c)、將生成的包含所有節(jié)點信息的authorized—keys2文件拷貝到其他所有節(jié)點上;d)、測試ssh配置是否成功;1.3)、進行NFS的配置,開啟nfs和portmap服務(wù),建立共享文件目錄,具體配置如下a)、在管理端建立文件/etc/exports,并且設(shè)置共享目錄屬性;b)、在管理端激活nfs和portmap服務(wù);c)、在被管理端建立需要掛載的目錄,并進行本地掛載;1.4)、進行NIS配置,建立域名解析服務(wù),具體實施如下a)、在管理端開啟月艮務(wù)yppasswd和ypserv;b)、在管理端配置NIS域名;c)、在被管理端開啟服務(wù)ypbind-,d)、在被管理端修改/etc/passwd在末尾加入+;到此并行環(huán)境配置完成,如果是在單機下進行intelCPU的多核測試,可以直接跳過并行環(huán)境配置這一步;2)、Intel編譯器我們選用intel編譯器主要是一方面是由于PWSCF軟件才后期安裝時,需要進行調(diào)用Intel編譯器進行編譯,另一個方面也是由于可以使用Intel編譯器對Intel的CPU進行不同程度的優(yōu)化,以獲取更高的性能;a)、Intel0++編譯器的安裝解壓intel0++編譯器壓縮包,運行./install,sh文件,按照默認(rèn)方式進行安裝,默認(rèn)安裝路徑是/opt/intel/cc/.b)、IntelFortran編譯器的安裝解壓intelFortran編譯器壓縮包,運行./install,sh,按照默認(rèn)方式進行安裝,默認(rèn)安裝路徑是/opt/intel/fc/.3)IntelMKL數(shù)學(xué)核心庫安裝PWSCF軟件中含有大量的數(shù)學(xué)運算,IntelMKL庫針對數(shù)學(xué)運算進行了大量的優(yōu)化,這樣可以保證PWSCF軟件高效運行;具體安裝步驟如下解壓IntelMKL庫壓縮包,運行./install,sh按照默認(rèn)的安裝方式進行安裝,默認(rèn)的安裝路徑是/opt/intel/mk1.注意要保證集群上的所有節(jié)點的安裝目錄都相同,這樣才保證應(yīng)用軟件運行時出現(xiàn)不必要的錯誤;4)、IntelMPI軟件在安裝IntelMPI軟件時,首先要創(chuàng)建machines.LINUX文件,在該文件中加入所有節(jié)點,這樣在安裝時可以避免每個節(jié)點進行安裝。在MPI安裝完成后,需要進行MPI的測試,啟動MPD,配置mpd,host文件,確保MPI運行成功;5)基準(zhǔn)測試軟件pwscf安裝PWscf軟件時,可以根據(jù)測試系統(tǒng)的CPU信息,設(shè)置IntelC++和Fortran編譯器的優(yōu)化參數(shù),進行優(yōu)化編譯。編譯成功后,進行安裝,安裝成功后會出現(xiàn)一個PW.x(電子和離子優(yōu)化)的執(zhí)行檔,我們通過運行PW.x來計算不同的元素來測試CPU的加速比。具體的安裝步驟如下a)、運行下列命令./configureARCH=ia32MPIF90,iifortLIBDIRS="/opt/intel/mkl/9.L023/lib/32/usr/lib/math"注意不同的版本可能命令參數(shù)不太一樣;b)、設(shè)置環(huán)境intel編譯器,rakl庫,mpi環(huán)境變量;c)、編譯使用命令makeall;d)、編譯成功進行測試6)測試在測試時,利用MPI的工作原理來控制參與運算的CPU核數(shù),從而得到不同的核數(shù)計算相同的元素所需要的CPU時間,進而計算出CPU的加速比。加速比定義為串行算法在單CPU上的運行時間與并行算法在多CPU上的運行時間之比,加速比可以告訴我們性能是否與核心數(shù)目的增長同步;測試時,先要啟動mpdboot,如果是集群時需要把所有節(jié)點全部啟動,mpdboot啟動成功后,再運行mpiexe進4亍湖!l試;例如a)啟動單個節(jié)點Mpdboot-n1其中n表示啟動的節(jié)點數(shù)b)、運行l(wèi)個核心mpiexec-n1bin/pw.x<mgal2o4-cf.scf.in其中n表示參與運算的核數(shù)pw.x為可執(zhí)行檔,mgal2o4-cf.scf.in包含有相應(yīng)的配置信息和待計算的元素;c)、運行2個核心mpiexec-n2bin/pw.x〈mgal2o4-cf.scf,ind)、運行4個核心mpiexec-n4bin/pw.x〈mgal2o4-cf.scf.in測試完成,進行數(shù)據(jù)的收集;7)測試數(shù)據(jù)的收集數(shù)據(jù)的收集分為兩類a)、系統(tǒng)性能數(shù)據(jù)系統(tǒng)性能數(shù)據(jù)主要收集CPU和內(nèi)存的信息,使用TOP或者VMSTAT命令;b)、CPU運行數(shù)據(jù)CPU運行數(shù)據(jù)主要是收集cputime和walltime這兩項數(shù)據(jù);8)測試數(shù)據(jù)的整理測試數(shù)據(jù)的整理主要是將數(shù)據(jù)進行標(biāo)準(zhǔn)化,以便于用戶分析。我們主要是借助于excel進行分析。由于測試的次數(shù)比較多,收集的數(shù)據(jù)量比較大,容易造成混淆,可以采用便于記憶的命名規(guī)范進行,譬如以參與運算的核數(shù)進行命名等。根據(jù)系統(tǒng)性能數(shù)據(jù)的分析,我們可以判定CPU在當(dāng)前基準(zhǔn)下是否運行處于飽和狀態(tài)。根據(jù)cputime和walltime數(shù)據(jù)我們計算CPU的加速比。整理后的測試數(shù)據(jù)應(yīng)該包括如下內(nèi)容硬件信息(CPU,內(nèi)存,硬盤),軟件信息(應(yīng)用軟件,操作系統(tǒng)),負(fù)載量,編譯信息,CPUTime,加速比等。全文摘要一種測試Intel多核CPU加速比的方法,即是測試單CPU上的運行時間與并行算法在多CPU上的運行時間之比,用戶可以根據(jù)測試的需求靈活設(shè)置計算量,從而達到控制測試時間的目的,具有更大的靈活性。單線程應(yīng)用已經(jīng)造成了多核CPU資源的嚴(yán)重浪費,而開發(fā)多線程應(yīng)用,充分發(fā)揮多核CPU協(xié)調(diào)運作的優(yōu)勢,CPU用戶最關(guān)心的一個指標(biāo)也是CPU加速比。該方法正基于軟件,提出了一個高效的測試CPU加速比的方法。文檔編號G06F11/36GK101520748SQ200910013920公開日2009年9月2日申請日期2009年1月12日優(yōu)先權(quán)日2009年1月12日發(fā)明者王友升申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司