亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法與流程

文檔序號(hào):12664245閱讀:395來源:國(guó)知局
本發(fā)明涉及多處理器
技術(shù)領(lǐng)域
,具體涉及片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法。
背景技術(shù)
:隨著計(jì)算機(jī)技術(shù)的發(fā)展,CMP(片上多處理器)憑借其強(qiáng)大的并行處理能力,逐漸成為主流,而CMP的并行處理能力,也隨著集成核心數(shù)量的增加而逐漸提高。然而,核心數(shù)量的增加也帶來了問題:假如同時(shí)激活CMP的所有核心,可能會(huì)使CMP系統(tǒng)的整體功耗超過TDP(散熱設(shè)計(jì)功耗),此時(shí)系統(tǒng)的發(fā)熱量,已經(jīng)超出散熱系統(tǒng)可以承載的范圍,若不進(jìn)行冷卻,溫度會(huì)進(jìn)一步升高,對(duì)CMP造成損害。為了提高CMP內(nèi)部程序的響應(yīng)速度,有研究者提出了短時(shí)sprinting(多線程同時(shí)運(yùn)行)方案和sprint-and-rest(這是一種周期性的sprinting模式,假如sprinting階段,系統(tǒng)以超過TDP的狀態(tài)運(yùn)行,那么在溫度到達(dá)系統(tǒng)能夠容忍的上限后,便轉(zhuǎn)為冷卻狀態(tài),待冷卻一定時(shí)間后,又重復(fù)之前的sprinting過程)方案,短時(shí)sprinting這種模式根據(jù)sprinting頻率的不同,運(yùn)算性能會(huì)優(yōu)于或者劣于單核/單線程模式。針對(duì)sprint-and-rest,采用4核1.6G的sprinting模式與4核3.2G的sprinting模式進(jìn)行分析,發(fā)現(xiàn)1.6G的表現(xiàn)優(yōu)于單線程,而3.2G的表現(xiàn)弱于單線程。所以,對(duì)于sprint-and-rest模式,并不是sprinting頻率越高越好,較低的頻率配合較長(zhǎng)的時(shí)間反而可以有更優(yōu)秀的性能。技術(shù)實(shí)現(xiàn)要素:針對(duì)現(xiàn)有技術(shù)中的上述不足,本發(fā)明提供的片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法通過獲取的最佳運(yùn)行頻率能夠使片上多處理器擁有持續(xù)強(qiáng)大的并行處理能力。為了達(dá)到上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為:提供一種片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法,其包括以下步驟:獲取片上多處理器系統(tǒng)散熱設(shè)計(jì)功耗所在的動(dòng)態(tài)電壓頻率縮放等級(jí);當(dāng)散熱設(shè)計(jì)功耗大于其所在動(dòng)態(tài)電壓頻率縮放等級(jí)的最小功率時(shí),獲取片上多處理器系統(tǒng)當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值;計(jì)算當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值與散熱設(shè)計(jì)功耗之間的差異;當(dāng)差異大于預(yù)設(shè)精度時(shí),采用當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值與預(yù)設(shè)步長(zhǎng)的累計(jì)值更新當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值;當(dāng)差異小于等于預(yù)設(shè)精度時(shí),輸出當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值作為片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的頻率。本發(fā)明的有益效果為:采用本方案的方法能夠在預(yù)設(shè)精度下,準(zhǔn)確獲取CMP的所有核心長(zhǎng)時(shí)間擁有強(qiáng)大的并行處理能力的最佳頻率,CMP的所有核心在最佳頻率下運(yùn)行時(shí),其溫度不會(huì)超過所設(shè)定的上限溫度,整個(gè)系統(tǒng)可以持續(xù)不斷地運(yùn)行,具有最佳的每秒執(zhí)行指令數(shù)。附圖說明圖1為片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法一個(gè)實(shí)施例的流程圖。具體實(shí)施方式下面對(duì)本發(fā)明的具體實(shí)施方式進(jìn)行描述,以便于本
技術(shù)領(lǐng)域
的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于具體實(shí)施方式的范圍,對(duì)本
技術(shù)領(lǐng)域
的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。圖1示出了片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的優(yōu)化方法一個(gè)實(shí)施例的流程圖。如圖1所示,該優(yōu)化方法100包括步驟101至步驟105。在步驟101中,獲取片上多處理器系統(tǒng)散熱設(shè)計(jì)功耗所在的動(dòng)態(tài)電壓頻率縮放等級(jí);在獲取之前,首先需要輸入預(yù)先設(shè)定的動(dòng)態(tài)電壓頻率縮放等級(jí),并將搜索的初始等級(jí)設(shè)為1。在本發(fā)明的一個(gè)實(shí)施例中,獲取片上多處理器系統(tǒng)散熱設(shè)計(jì)功耗所在的動(dòng)態(tài)電壓頻率縮放等級(jí)進(jìn)一步包括:獲取預(yù)先設(shè)定的所有動(dòng)態(tài)電壓頻率縮放等級(jí);判斷當(dāng)前動(dòng)態(tài)電壓頻率縮放等級(jí)的功率是否大于等于散熱設(shè)計(jì)功耗:若是,則片上多處理器系統(tǒng)的散熱設(shè)計(jì)功耗位于當(dāng)前動(dòng)態(tài)電壓頻率縮放等級(jí)(DVFS等級(jí));否則,判斷當(dāng)前動(dòng)態(tài)電壓頻率縮放等級(jí)的下一個(gè)動(dòng)態(tài)電壓頻率縮放等級(jí)與散熱設(shè)計(jì)功耗的大小關(guān)系。實(shí)施時(shí),本方案優(yōu)選當(dāng)前動(dòng)態(tài)電壓頻率縮放等級(jí)的功率為當(dāng)前動(dòng)態(tài)電壓頻率縮放等級(jí)的平均功率。在步驟102中,當(dāng)散熱設(shè)計(jì)功耗大于其所在動(dòng)態(tài)電壓頻率縮放等級(jí)的最小功率時(shí),獲取片上多處理器系統(tǒng)當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值。其中當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值的初始值可以設(shè)置為散熱設(shè)計(jì)功耗所在的動(dòng)態(tài)電壓頻率縮放等級(jí)內(nèi)的最小功率,也可以設(shè)置為在該等級(jí)下的最小功率加一固定頻率步長(zhǎng)。當(dāng)散熱設(shè)計(jì)功耗大于其所在動(dòng)態(tài)電壓頻率縮放等級(jí)的最小功率時(shí),則表明片上多處理器系統(tǒng)在動(dòng)態(tài)電壓頻率縮放等級(jí)內(nèi)最大功率與最小功率區(qū)間內(nèi)能夠找到使片上多處理器擁有持續(xù)強(qiáng)大的并行處理能力的最佳功率。在步驟103中,計(jì)算當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值與散熱設(shè)計(jì)功耗之間的差異。在步驟104中,當(dāng)差異大于預(yù)設(shè)精度時(shí),采用當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值與預(yù)設(shè)步長(zhǎng)的累計(jì)值更新當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值。在本發(fā)明的一個(gè)實(shí)施例中,更新當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值時(shí),還包括:記錄當(dāng)前嘗試多線程同時(shí)運(yùn)行時(shí)的差異和上一次嘗試多線程同時(shí)運(yùn)行時(shí)的差異;當(dāng)當(dāng)前嘗試多線程同時(shí)運(yùn)行時(shí)的差異與上一次嘗試多線程同時(shí)運(yùn)行時(shí)的差異的正負(fù)符號(hào)互異(其中一個(gè)為正數(shù),另一個(gè)為負(fù)數(shù))時(shí),則表明不能尋找到使片上多處理器擁有持續(xù)強(qiáng)大的并行處理能力的最佳功率。為了規(guī)避這種情況,本方案將當(dāng)前步長(zhǎng)按預(yù)設(shè)的比例縮小,以減小搜索范圍,提高搜索精度,從而逼近要尋找的最佳功率。其中,預(yù)設(shè)步長(zhǎng)的初始值為一個(gè)大于零的常數(shù)。實(shí)施時(shí),本方案優(yōu)選當(dāng)散熱設(shè)計(jì)功耗小于等于其所在動(dòng)態(tài)電壓頻率縮放等級(jí)的最小功率時(shí),輸出散熱設(shè)計(jì)功耗所在動(dòng)態(tài)電壓頻率縮放等級(jí)的上一個(gè)動(dòng)態(tài)電壓頻率縮放等級(jí)的最高頻率作為片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的頻率。在步驟105中,當(dāng)差異小于等于預(yù)設(shè)精度時(shí),輸出當(dāng)前嘗試多線程同時(shí)運(yùn)行的頻率值作為片上多處理器系統(tǒng)多線程同時(shí)運(yùn)行的頻率。實(shí)施例下面使用sniper,hotspot以及mcpat作為聯(lián)合仿真平臺(tái),在多種電壓/頻率下進(jìn)行實(shí)驗(yàn):實(shí)驗(yàn)設(shè)置的上限溫度為80攝氏度,下限溫度為50攝氏度,TDP值約為42W。CMP在sprinting模式下的溫度到達(dá)上限后,便切換為rest模式,待溫度冷卻至下限溫度后,再次切換為sprinting模式。在如表1所示的實(shí)驗(yàn)條件進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)統(tǒng)計(jì)數(shù)據(jù)見表2,其中,Inf表示當(dāng)前電壓/頻率下,CMP可以持續(xù)運(yùn)行。表2前五行是本方案預(yù)先設(shè)定的DVFS等級(jí)下運(yùn)行得到的統(tǒng)計(jì)數(shù)據(jù),最后一行是在尋找到的最佳的頻率或電壓情況下,運(yùn)行的統(tǒng)計(jì)數(shù)據(jù)。表1實(shí)驗(yàn)條件參數(shù)配置核心數(shù)量64一級(jí)指令緩存(私有)64KB一級(jí)數(shù)據(jù)緩存(私有)64KB二級(jí)緩存(私有)64KB末級(jí)緩存(共享)16MB互聯(lián)方式NoC工藝22nm表2實(shí)驗(yàn)統(tǒng)計(jì)數(shù)據(jù)可以看出,在最佳頻率下,CMP可以持續(xù)運(yùn)行,且此時(shí)每秒執(zhí)行指令數(shù)優(yōu)于其余DVFS等級(jí)下的每秒執(zhí)行指令數(shù)。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1