專利名稱:面向可重構(gòu)陣列的多參數(shù)融合性能建模方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)處理器技術(shù)領(lǐng)域,具體涉及一種面向可重構(gòu)陣列的多參數(shù)融合性能建模方法。
背景技術(shù):
可重構(gòu)計算陣列Processing Element Array (PEA)是可重構(gòu)處理器的重要組成部分,很多計算密集型運(yùn)算都被映射到PEA上進(jìn)行加速。為了更好的挖掘可重構(gòu)計算陣列的計算潛能,我們需要要去優(yōu)化算法在陣列上面的映射。雖然通過算法仿真可以得到時鐘精確的陣列執(zhí)行結(jié)果,但是由于算法映射的方法千差萬別以及龐大復(fù)雜的算法任務(wù),使得仿真過程需要大量的時間以至于我們的開發(fā)周期不能容忍。另外,可重構(gòu)處理器擁有自己獨(dú)特的硬件結(jié)構(gòu)和運(yùn)行機(jī)制,傳統(tǒng)的性能評估模型不能直接應(yīng)用。例如:陣列計算時間,陣列重構(gòu)時間,陣列通信時間等參數(shù)都是影響陣列執(zhí)行性能的重要參數(shù)。因此,為可重構(gòu)計算陣列建立一個多參數(shù)融合的性能解析模型,并以此為度量去指導(dǎo)我們的算法映射將具有重要的意義。 百分之九十的執(zhí)行時間花費(fèi)百分之十的程序代碼上,循環(huán)是典型的計算密集型運(yùn)算。因此,前人有很多映射工作都集中在循環(huán)映射上??芍貥?gòu)計算陣列上的循環(huán)的映射主要分為以下幾個主要的子問題:a)算子調(diào)度,即把一個算子放在哪一個時間控制步上面去執(zhí)行。b)布局,即把一個算子放在陣列中的哪一個處理單元Processing Element (PE)上面去執(zhí)行。c)布線,即怎么樣去連接不同PE之間的數(shù)據(jù)通道。很多前人的工作都把循環(huán)啟動間隔Initial Interval (II)作為算法映射的度量,通過獨(dú)立地或者聯(lián)合地解決這三個子問題來尋求最小的II,從而獲得最優(yōu)的映射方式。這種尋求最小II的模調(diào)度方法是起源于多核處理器上面的軟件流水方法。它通過重疊不同循環(huán)實(shí)例之間的算子,形成循環(huán)內(nèi)核,從而獲得并行性,縮短程序執(zhí)行時間。然而可重構(gòu)處理器不同于傳統(tǒng)的通用多核處理器,影響其程序執(zhí)行性能的參數(shù)不只是算子執(zhí)行的并行性,還有包括陣列的不同運(yùn)行實(shí)例之間的通信代價,以及改變陣列功能的重構(gòu)代價。因此傳統(tǒng)的以II為尺度的循環(huán)映射方法在可重構(gòu)計算陣列上面不再精確和完備?,F(xiàn)有技術(shù)中缺乏一種專門面向可重構(gòu)計算陣列的精確的,統(tǒng)一的性能評估模型。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決上述技術(shù)問題之一或至少提供一種有用的商業(yè)選擇。為此,本發(fā)明的目的在于提出一種完備精確的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法。根據(jù)本發(fā)明實(shí)施例的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,將一個任務(wù)分解成一系列連續(xù)的陣列操作P=[1,P],則任務(wù)總體執(zhí)行時間等于多次陣列操作的重構(gòu)周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即:
權(quán)利要求
1.一種面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,將一個任務(wù)分解成一系列連續(xù)的陣列操作P=[l,P],則任務(wù)總體執(zhí)行時間等于多次陣列操作的重構(gòu)周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即:
2.如權(quán)利要求1所述的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,定義0-1變量Xp,當(dāng)陣列操作需要重構(gòu)時xp=l,當(dāng)陣列操作不需要重構(gòu)時xp=0,假設(shè)所有需要重構(gòu)的陣列操作中重構(gòu)周期相等,記為常數(shù)CFC,則所有的陣列操作中的重構(gòu)周期就可表示為:CFCp=Xp CFC,以及整個任務(wù)的重構(gòu)周期數(shù)表示為:
3.如權(quán)利要求1所述的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,所有的陣列操作中的通信周期數(shù)等于每一次陣列操作的載入載出數(shù)據(jù)量之和除以局部數(shù)據(jù)存儲器的帶寬,即
4.如權(quán)利要求1所述的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,在CrossBar互聯(lián)形式的陣列中,所有陣列的計算周期為固定的,則整個任務(wù)的陣列計算周期為
5.如權(quán)利要求1所述的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,在Mesh互連形式的陣列中,陣列的計算時間是互聯(lián)形式和數(shù)據(jù)依賴長度的函數(shù),則整個任務(wù)的陣列計算周期數(shù)可以表示為:
6.如權(quán)利要求1所述的面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,其特征在于,對于L (Μ,N, fflb, Llb)的二維嵌套循環(huán),M和N分別代表這個循環(huán)的外層循環(huán)和內(nèi)層循環(huán)的邊界,Wlb,Llb分別代表這個嵌套的循環(huán)體DFG圖寬和長,則上述二維嵌套循環(huán)的基于多面體模型的循環(huán)變換的多參數(shù)融合可重構(gòu)計算陣列的性能模型為:
全文摘要
本發(fā)明公開了一種面向可重構(gòu)陣列的多參數(shù)融合性能建模方法,該建模方法將一個任務(wù)分解成一系列連續(xù)的陣列操作p=[1,P],則任務(wù)總體執(zhí)行時間等于多次陣列操作的重構(gòu)周期數(shù),數(shù)據(jù)載入周期數(shù),陣列計算周期數(shù)以及數(shù)據(jù)存儲周期數(shù)的總和再乘以陣列工作頻率,即其中,TET表示任務(wù)的總體執(zhí)行時間,f表示陣列工作的頻率,其中CFC表示重構(gòu)周期,LDC表示數(shù)據(jù)載入周期,CPC表示陣列計算周期,STC表示數(shù)據(jù)存儲周期。本發(fā)明能夠精確地、完善地把可重構(gòu)處理器的總體執(zhí)行時間解析的表達(dá)出來,以此總體執(zhí)行時間的性能模型,為用戶的算法映射提供了評估和指導(dǎo)意義。
文檔編號G06F15/80GK103218347SQ20131015676
公開日2013年7月24日 申請日期2013年4月28日 優(yōu)先權(quán)日2013年4月28日
發(fā)明者尹首一, 劉大江, 劉雷波, 魏少軍 申請人:清華大學(xué)