亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于人工神經(jīng)網(wǎng)絡(luò)的亂序處理器Cache訪(fǎng)存性能評(píng)估方法_2

文檔序號(hào):9887886閱讀:來(lái)源:國(guó)知局
1,則判定為一致性缺失。
[0022] 優(yōu)選的:BP人工神經(jīng)網(wǎng)絡(luò)采用Levenberg Marquard訓(xùn)練方法。
[0023] 優(yōu)選的:BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)目存在經(jīng)驗(yàn)公式如下:
[0024]
[0025] 其中h為隱含層節(jié)點(diǎn)數(shù)目,m為輸入層節(jié)點(diǎn)數(shù)目,η為輸出層節(jié)點(diǎn)數(shù)目,a為1-10之間 的調(diào)節(jié)常數(shù)。
[0026]優(yōu)選的:所述BP神經(jīng)網(wǎng)絡(luò)采用雙隱含層,第一隱含層采用8個(gè)神經(jīng)單元,第二隱含 層采用4個(gè)神經(jīng)元。
[0027]有益效果:本發(fā)明提供的一種基于人工神經(jīng)網(wǎng)絡(luò)的亂序處理器Cache訪(fǎng)存性能評(píng) 估方法,相比現(xiàn)有技術(shù),具有以下有益效果:
[0028]本發(fā)明提出的基于人工神經(jīng)網(wǎng)絡(luò)的亂序處理器Cache訪(fǎng)存性能評(píng)估方法,可以避 免精確獲取亂序處理器Cache訪(fǎng)存缺失次數(shù)時(shí)所需的全仿真過(guò)程。利用人工神經(jīng)網(wǎng)絡(luò)代替 全仿真,加速了預(yù)測(cè)Cache訪(fǎng)存行為的速度。
【附圖說(shuō)明】
[0029]圖1為訪(fǎng)存堆棧距離計(jì)算框圖;
[0030]圖2為神經(jīng)網(wǎng)絡(luò)訓(xùn)練輸入與目標(biāo)輸出;
[0031]圖3為神經(jīng)網(wǎng)絡(luò)層級(jí)圖。
【具體實(shí)施方式】
[0032]下面結(jié)合附圖和具體實(shí)施例,進(jìn)一步闡明本發(fā)明,應(yīng)理解這些實(shí)例僅用于說(shuō)明本 發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對(duì)本發(fā)明的各種 等價(jià)形式的修改均落于本申請(qǐng)所附權(quán)利要求所限定的范圍。
[0033] 一種基于人工神經(jīng)網(wǎng)絡(luò)的亂序處理器Cache訪(fǎng)存性能評(píng)估方法,包括以下步驟: [0034]步驟1,仿真獲取目標(biāo)程序執(zhí)行時(shí)間前30 %的訪(fǎng)存亂序執(zhí)行流;依據(jù)Gem5指令取指 序號(hào)對(duì)亂序執(zhí)行流進(jìn)行重排序,獲取訪(fǎng)存順序執(zhí)行流;設(shè)計(jì)堆棧距離算法分別對(duì)順序執(zhí)行 流與亂序執(zhí)行流提取堆棧距離分布,并對(duì)堆棧距離分布作數(shù)據(jù)歸一化。
[0035]步驟2,根據(jù)步驟1得到的亂序訪(fǎng)存堆棧距離分布在Gem5中加入Cache訪(fǎng)問(wèn)缺失事 件的判定邏輯,統(tǒng)計(jì)各項(xiàng)缺失事件次數(shù)。
[0036] 步驟3,選取BP人工神經(jīng)網(wǎng)絡(luò),依照經(jīng)驗(yàn)公式調(diào)試獲取合適的訓(xùn)練方法、網(wǎng)絡(luò)層級(jí) 數(shù)目以及各層級(jí)內(nèi)的神經(jīng)元個(gè)數(shù);通過(guò)選定的BP人工神經(jīng)網(wǎng)絡(luò)對(duì)步驟1得到的歸一化后的 順序訪(fǎng)存堆棧距離分布與步驟2判斷得到的不同的訪(fǎng)問(wèn)缺失事件間的映射關(guān)系進(jìn)行擬合。 [0037]步驟4,利用Qemu運(yùn)行目標(biāo)程序得到目標(biāo)程序順序執(zhí)行流,將目標(biāo)程序順序執(zhí)行流 導(dǎo)入步驟1設(shè)計(jì)的堆棧距離算法提取目標(biāo)程序的堆棧距離分布。
[0038]步驟5,將第4步獲取的目標(biāo)程序堆棧距離分布?xì)w一化后導(dǎo)入步驟3選取的BP人工 神經(jīng)網(wǎng)絡(luò),同時(shí)根據(jù)堆棧距離分布與不同的訪(fǎng)問(wèn)缺失事件間的映射關(guān)系預(yù)測(cè)目標(biāo)程序在亂 序處理器中的Cache訪(fǎng)問(wèn)缺失次數(shù)。
[0039] 1、堆棧距離算法的設(shè)計(jì)
[0040]堆棧距離指,針對(duì)同一 Cacheline的兩次連續(xù)訪(fǎng)存請(qǐng)求間的訪(fǎng)存地址個(gè)數(shù)。本發(fā)明 將紅黑樹(shù)與哈希表組合,設(shè)計(jì)算法計(jì)算堆棧距離。本發(fā)明采用的訪(fǎng)存Trace包含2個(gè)模塊,一 是當(dāng)前訪(fǎng)存請(qǐng)求地址,二是當(dāng)前訪(fǎng)存請(qǐng)求序號(hào)SN。算法中包含兩個(gè)哈希表,一是采用地址中 Tag與Set位域作為索引,獲取內(nèi)容無(wú)效化標(biāo)志以及前次同地址訪(fǎng)存的序號(hào)。二是通過(guò)地址 Set位域索引,獲取指向紅黑樹(shù)的指針。利用Set位域索引是為了統(tǒng)計(jì)每個(gè)Cache Set內(nèi)的訪(fǎng) 存堆棧距離。紅黑樹(shù)中存儲(chǔ)訪(fǎng)存序號(hào)SN,并按照升序排列。通過(guò)在第一個(gè)哈希表中索引到的 SN號(hào),在紅黑樹(shù)中找到存儲(chǔ)位置,計(jì)算該位置與紅黑樹(shù)尾端的距離即為當(dāng)前訪(fǎng)存請(qǐng)求在 Cache Set內(nèi)的堆棧距離。完成堆棧距離計(jì)算后,將當(dāng)前訪(fǎng)存序號(hào)更新到在哈希表和紅黑樹(shù) 中索引的SN處。當(dāng)檢測(cè)到寫(xiě)操作時(shí),依據(jù)寫(xiě)地址找到第一個(gè)哈希表中對(duì)應(yīng)的內(nèi)容失效位置 1〇
[0041 ] 2、Gem5訪(fǎng)存缺失事件分類(lèi)計(jì)數(shù)
[0042]訪(fǎng)存缺失計(jì)數(shù)可通過(guò)在gem5中嵌入訪(fǎng)存堆棧距離計(jì)算來(lái)判定。
[0043]訪(fǎng)存缺失計(jì)數(shù)可通過(guò)在gem5中嵌入訪(fǎng)存堆棧距離計(jì)算來(lái)判定。
[0044] 冷缺失:若在第一哈希表中找不到當(dāng)前訪(fǎng)存請(qǐng)求地址,則判定為冷缺失。
[0045] 競(jìng)爭(zhēng)缺失:若在第一哈希表中找到當(dāng)前訪(fǎng)存請(qǐng)求地址且堆棧距離大于等于Cache 組關(guān)聯(lián)數(shù)目,則判定為競(jìng)爭(zhēng)缺失。
[0046] -致性缺失:若在第一哈希表中找到當(dāng)前訪(fǎng)存請(qǐng)求地址且堆棧距離小于Cache組 關(guān)聯(lián)數(shù),同時(shí)內(nèi)容無(wú)效化標(biāo)志為1,則判定為一致性缺失。
[0047] 3、數(shù)據(jù)歸一化與BP神經(jīng)網(wǎng)絡(luò)
[0048]在進(jìn)行神經(jīng)網(wǎng)絡(luò)擬合前,需要將堆棧距離分布進(jìn)行數(shù)據(jù)歸一化處理。目的是為了 消除數(shù)量級(jí)差異導(dǎo)致的模型訓(xùn)練無(wú)法迅速收斂。同時(shí),堆棧距離可能出現(xiàn)過(guò)大的情況,導(dǎo)致 模型輸入維度過(guò)大。所以本發(fā)明將堆棧距離超過(guò)1〇〇的所有分布合成一維。需要注意的是, 100維選取只是依照經(jīng)驗(yàn),具體維度上限選擇可視實(shí)際情況而定。
[0049] BP網(wǎng)絡(luò)是單向傳播的多層前向網(wǎng)絡(luò),由輸入層、輸出層和隱含層組成,每層有若干 個(gè)神經(jīng)元(也稱(chēng)節(jié)點(diǎn))。同層神經(jīng)元間無(wú)耦合,節(jié)點(diǎn)的激活函數(shù)必須可微、非減。網(wǎng)絡(luò)結(jié)構(gòu)關(guān) 系著網(wǎng)絡(luò)的函數(shù)映射能力,也決定著網(wǎng)絡(luò)解決問(wèn)題的能力。而網(wǎng)絡(luò)的輸入層和輸出層是與 外界聯(lián)系的接口,這兩層的節(jié)點(diǎn)數(shù)一般由應(yīng)用對(duì)象的實(shí)際問(wèn)題決定,不能任意選取,因此整 個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中只有隱含層層數(shù)及其節(jié)點(diǎn)數(shù)目有待確定。
[0050] 關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),即如何選取隱含層層數(shù)及其節(jié)點(diǎn)數(shù),目前還沒(méi)有確定的理論 和方法。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)規(guī)律:當(dāng)隱含層節(jié)點(diǎn)數(shù)取輸入層節(jié)點(diǎn)數(shù)和輸出層節(jié)點(diǎn)數(shù)之間的值時(shí), 尤其當(dāng)靠近輸入節(jié)點(diǎn)數(shù)時(shí),網(wǎng)絡(luò)收斂速度較快。隱含層節(jié)點(diǎn)數(shù)太少時(shí),學(xué)習(xí)過(guò)程不收斂;但 隱含層節(jié)點(diǎn)數(shù)太多時(shí),網(wǎng)絡(luò)映射能力增強(qiáng),局部最小點(diǎn)越少,越容易收斂到全局最小點(diǎn),卻 致使學(xué)習(xí)時(shí)間長(zhǎng),且網(wǎng)絡(luò)容易訓(xùn)練過(guò)渡,此時(shí)導(dǎo)致網(wǎng)絡(luò)不僅記住了學(xué)習(xí)樣本一般特征而且 記住了個(gè)別特征(如隨機(jī)噪聲)導(dǎo)致網(wǎng)絡(luò)容錯(cuò)性降低。隱含層節(jié)點(diǎn)數(shù)目存在經(jīng)驗(yàn)公式如下:
[0051]
[0052] 其中h為隱含層節(jié)點(diǎn)數(shù)目,m為輸入層節(jié)點(diǎn)數(shù)目,η為輸出層節(jié)點(diǎn)數(shù)目,a為1-10之間 的調(diào)節(jié)常數(shù)。根據(jù)以上規(guī)律,本發(fā)明采用雙隱含層,第一隱含層采用8個(gè)神經(jīng)單元,第二隱含 層采用4個(gè)神經(jīng)元。訓(xùn)練方法采用Levenberg Marquard。
[0053] 4、Qemu中堆棧距離提取與LRU-Cache訪(fǎng)存行為預(yù)測(cè)
[0054]在Qemu中嵌入步驟1的堆棧距離算法,獲取堆棧距離分布。將分布?xì)w一化后注入神 經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)亂序處理器中的LRU-Cache訪(fǎng)存行為。
[0055] 本實(shí)施例采用哈希表記錄訪(fǎng)問(wèn)過(guò)的訪(fǎng)存地址與對(duì)應(yīng)的內(nèi)容無(wú)效化標(biāo)志。若產(chǎn)生訪(fǎng) 問(wèn)缺失時(shí),哈希表中無(wú)該地址的訪(fǎng)問(wèn)記錄,表示該訪(fǎng)存請(qǐng)求產(chǎn)生一次冷缺失(Cold miss)。 若哈希表中存有該地址記錄且無(wú)內(nèi)容無(wú)效化標(biāo)志,表示該訪(fǎng)存請(qǐng)求產(chǎn)生一次競(jìng)爭(zhēng)缺失 (Conflict miss)。若哈希表中存有該地址記錄,內(nèi)容無(wú)效化標(biāo)志為1,并且堆棧距離小于當(dāng) 前Cache組關(guān)聯(lián)數(shù),表示該訪(fǎng)存請(qǐng)求產(chǎn)生一次一致性缺失(Coherence miss)。此處的堆棧距 離計(jì)算需要考慮非阻塞發(fā)射訪(fǎng)存請(qǐng)求的影響,訪(fǎng)存序列內(nèi)容的更新需要在Cache命中或者 Cache訪(fǎng)問(wèn)缺失且Cachel ine重填的時(shí)刻進(jìn)行。
[0056] 本實(shí)施例在Gem5中獲取訪(fǎng)存亂序執(zhí)行序列,并借
當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1