亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法

文檔序號(hào):8282142閱讀:760來(lái)源:國(guó)知局
一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)高性能計(jì)算作業(yè)調(diào)度技術(shù),具體地說(shuō)是一種實(shí)用性強(qiáng)、實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法。
【背景技術(shù)】
[0002]系統(tǒng)噪聲,也叫操作系統(tǒng)噪聲,它反映了操作系統(tǒng)非用戶(hù)程序cpu利用率的波動(dòng),該數(shù)值持續(xù)保持較小區(qū)間,則系統(tǒng)性能較好,運(yùn)行平穩(wěn);反之,系統(tǒng)性能較差,運(yùn)行不穩(wěn)定。當(dāng)前高性能計(jì)算領(lǐng)域發(fā)展越來(lái)越快,由國(guó)防科大研制的天河二號(hào)超級(jí)計(jì)算機(jī)系統(tǒng),以峰值計(jì)算速度每秒5.49億億次、持續(xù)計(jì)算速度每秒3.39億億次雙精度浮點(diǎn)運(yùn)算的優(yōu)異性能位居榜首,成為全球最快超級(jí)計(jì)算機(jī);同時(shí),應(yīng)用的并行規(guī)模也越來(lái)越大,一個(gè)大規(guī)模作業(yè)經(jīng)常會(huì)并行運(yùn)行在成百上千個(gè)計(jì)算節(jié)點(diǎn)上。
[0003]在大型高性能集群系統(tǒng)中,系統(tǒng)噪聲對(duì)大規(guī)模作業(yè)性能影響很大,即使是少量節(jié)點(diǎn)的系統(tǒng)噪聲,也會(huì)對(duì)應(yīng)用性能產(chǎn)生很大影響。研宄發(fā)現(xiàn),系統(tǒng)噪聲節(jié)點(diǎn)所處的位置不同,所產(chǎn)生的性能影響差別很大。簡(jiǎn)單來(lái)說(shuō),進(jìn)程等級(jí)號(hào)(rank值)越靠近根進(jìn)程(rankO),則進(jìn)程所在節(jié)點(diǎn)的系統(tǒng)噪聲對(duì)應(yīng)用影響越?。环粗?,進(jìn)程等級(jí)號(hào)越大,則進(jìn)程所在節(jié)點(diǎn)系統(tǒng)噪聲對(duì)應(yīng)用影響越大。
[0004]基于該現(xiàn)有技術(shù)及問(wèn)題,本發(fā)明提供一種降低系統(tǒng)噪聲對(duì)大規(guī)模并行作業(yè)性能影響的節(jié)點(diǎn)分配方法,該方法通過(guò)監(jiān)測(cè)集群所有節(jié)點(diǎn)的系統(tǒng)噪聲分布,在作業(yè)調(diào)度中,根據(jù)監(jiān)控到的節(jié)點(diǎn)系統(tǒng)噪聲大小,將待分配的計(jì)算節(jié)點(diǎn)重新排列,使其系統(tǒng)噪聲從大到小,而應(yīng)用在該組節(jié)點(diǎn)上運(yùn)行時(shí),等級(jí)號(hào)將從小到大分布,在這樣的排列順序下,同樣一組節(jié)點(diǎn)的系統(tǒng)噪聲,將對(duì)應(yīng)用性能影響最小,從而達(dá)到優(yōu)化應(yīng)用性能的效果。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的技術(shù)任務(wù)是針對(duì)以上不足之處,提供一種實(shí)用性強(qiáng)、實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法。
[0006]一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法,其具體實(shí)現(xiàn)過(guò)程為:
首先監(jiān)控采集集群中所有節(jié)點(diǎn)的系統(tǒng)噪聲大小;
對(duì)并行作業(yè)運(yùn)行的所有計(jì)算節(jié)點(diǎn)系統(tǒng)噪聲進(jìn)行比較,將比較結(jié)果按系統(tǒng)噪聲由大到小順序排列;
將排列后的噪聲結(jié)果寫(xiě)入nodelist文件中;
并行作業(yè)的mpi程序根據(jù)系統(tǒng)噪聲排序后得到的nodelist文件啟動(dòng)并行程序,根據(jù)該nodelist文件啟動(dòng)的并行程序,進(jìn)程等級(jí)號(hào)自動(dòng)按照由小到大的順序運(yùn)行。
[0007]所述的監(jiān)控采集集群所有節(jié)點(diǎn)系統(tǒng)噪聲使用的是一個(gè)分布式的集群系統(tǒng)噪聲監(jiān)控程序,該程序?qū)粗付l率自動(dòng)采集集群中每個(gè)節(jié)點(diǎn)的系統(tǒng)噪聲,將其保存在數(shù)據(jù)庫(kù)中;在系統(tǒng)的數(shù)據(jù)庫(kù)文件中,保存系統(tǒng)CPU各個(gè)組成成分的占用時(shí)間累積,該占用時(shí)間積累包括系統(tǒng)使用sys、用戶(hù)應(yīng)用使用usr、1等待1、負(fù)nice值進(jìn)程使用n1、空閑idle ;對(duì)sys、1.nice三個(gè)系統(tǒng)成分使用率的統(tǒng)計(jì),得到采集頻段中系統(tǒng)噪聲的平均波動(dòng)大小:
os_noise = (sysl+1l+nil-(sysO+10+n1))/(total1-totalO);
以上算法中,sysl、1l、nil為當(dāng)前系統(tǒng)、1等待、負(fù)nice進(jìn)程的當(dāng)前時(shí)間累積;sysO、10、n1為上一次系統(tǒng)、1等待、負(fù)nice進(jìn)程的時(shí)間累積;則(sysl+1l+nil-(sysO+10+n1))為最近頻率周期內(nèi)系統(tǒng)、1等待、負(fù)nice進(jìn)程三項(xiàng)的時(shí)間累積統(tǒng)計(jì);而(totall-totalO)為最近頻率周期內(nèi)的cpu總時(shí)間統(tǒng)計(jì);他們的比值即最近頻率周期的系統(tǒng)噪聲平均統(tǒng)計(jì)。
[0008]所述系統(tǒng)噪聲比較排序的具體過(guò)程為:將并行作業(yè)運(yùn)行所在節(jié)點(diǎn)從所有節(jié)點(diǎn)中選擇出來(lái),然后比較采集到的各個(gè)計(jì)算節(jié)點(diǎn)的系統(tǒng)噪聲大小,將比較結(jié)果按從大到小順序保存在節(jié)點(diǎn)列表文件nodelist中。
[0009]所述的并行作業(yè)根據(jù)nodelist文件啟動(dòng)并行程序模塊、mpi并行程序,將根據(jù)排序產(chǎn)生的nodelist文件,啟動(dòng)并行程序;等級(jí)號(hào)最小的進(jìn)程運(yùn)行在系統(tǒng)噪聲最大的節(jié)點(diǎn)上,依次排列,等級(jí)號(hào)最大的進(jìn)程將運(yùn)行系統(tǒng)噪聲最小的節(jié)點(diǎn)上。
[0010]本發(fā)明的一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法,具有以下優(yōu)點(diǎn):
該發(fā)明的一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法通過(guò)監(jiān)控集群中計(jì)算節(jié)點(diǎn)的系統(tǒng)噪聲分布,優(yōu)化大規(guī)模并行作業(yè)的計(jì)算節(jié)點(diǎn)分配策略,使計(jì)算節(jié)點(diǎn)系統(tǒng)噪聲對(duì)并行作業(yè)的性能影響降至最低;可應(yīng)用在Cluster Engine軟件底層作業(yè)調(diào)度節(jié)點(diǎn)分配策略模塊,起到優(yōu)化大規(guī)模并行作業(yè)性能的效果,實(shí)用性強(qiáng),易于推廣。
【附圖說(shuō)明】
[0011]附圖1為實(shí)施例中系統(tǒng)噪聲比較排序示意圖。
[0012]附圖2為實(shí)施例中hostlist文件中節(jié)點(diǎn)順序與mpi程序產(chǎn)生等級(jí)號(hào)rank值的關(guān)系示意圖。
【具體實(shí)施方式】
[0013]下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
[0014]在大規(guī)模并行作業(yè)中,系統(tǒng)噪聲節(jié)點(diǎn)所處的位置不同,所產(chǎn)生的性能影響差別很大。簡(jiǎn)單來(lái)說(shuō),進(jìn)程等級(jí)號(hào)(rank值)越靠近根進(jìn)程(rankO),則進(jìn)程所在節(jié)點(diǎn)的系統(tǒng)噪聲對(duì)應(yīng)用影響越??;反之,進(jìn)程等級(jí)號(hào)越大,則進(jìn)程所在節(jié)點(diǎn)系統(tǒng)噪聲對(duì)應(yīng)用影響越大。本發(fā)明提出一種實(shí)現(xiàn)應(yīng)用性能優(yōu)化的節(jié)點(diǎn)分配方法,該方法通過(guò)監(jiān)測(cè)集群所有節(jié)點(diǎn)的系統(tǒng)噪聲分布,在作業(yè)調(diào)度中,根據(jù)監(jiān)控到的節(jié)點(diǎn)系統(tǒng)噪聲大小,將待分配的計(jì)算節(jié)點(diǎn)重新排列,使其系統(tǒng)噪聲從大到小,而應(yīng)用在該組節(jié)點(diǎn)上運(yùn)行時(shí),等級(jí)號(hào)將從小到大分布。在這樣的排列順序下,同樣一組節(jié)點(diǎn)的系統(tǒng)噪聲,將對(duì)應(yīng)用性能影響最小,從而達(dá)到優(yōu)化應(yīng)用性能的效果。
[0015]其具體實(shí)現(xiàn)過(guò)程為:
首先監(jiān)控采集集群中所有節(jié)點(diǎn)的系統(tǒng)噪聲大??;
對(duì)并行作業(yè)運(yùn)行的所有計(jì)算節(jié)點(diǎn)系統(tǒng)噪聲進(jìn)行比較,將比較結(jié)果按系統(tǒng)噪聲由大到小順序排列;
將排列后的噪聲結(jié)果寫(xiě)入nodelist文件中; 并行作業(yè)的mpi程序根據(jù)系統(tǒng)噪聲排序后得到的nodelist文件啟動(dòng)并行程序,根據(jù)該nodelist文件啟動(dòng)的并行程序,進(jìn)程等級(jí)號(hào)自動(dòng)按照由小到大的順序運(yùn)行,這樣,node I i st文件中所有節(jié)點(diǎn)的系統(tǒng)噪聲對(duì)整個(gè)并行作業(yè)的性能影響將會(huì)最小。
[0016]所述的監(jiān)控采集集群所有節(jié)點(diǎn)系統(tǒng)噪聲使用的是一個(gè)分布式的集群系統(tǒng)噪聲監(jiān)控程序,該程序?qū)粗付l率自動(dòng)采集集群中每個(gè)節(jié)點(diǎn)的系統(tǒng)噪聲,該指定頻率一般為默認(rèn)3秒鐘,將其保存在數(shù)據(jù)庫(kù)中。
[0017]在系統(tǒng)的/proc/stat文件中,保存了系
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1