亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

瓦解的多嵌套循環(huán)的向量化的制作方法_2

文檔序號:8516036閱讀:來源:國知局
入操作 數(shù)向量一起),并且將該掩碼向量呈現(xiàn)給掩碼邏輯104、105層中的至少一層。
[0035] 在執(zhí)行向量程序代碼的過程中,每一向量指令無需要求完整的數(shù)據(jù)字。例如,針對 一些指令的輸入向量可能僅是8個元素,針對其他指令的輸入向量可以是16個元素,針對 其他指令的輸入向量可以是32個元素等等。因此,掩碼層104/105用于識別應用于特定指 令的完整向量數(shù)據(jù)字的元素集合,以便實現(xiàn)指令之間的不同向量大小。典型地,針對每一向 量指令,在掩碼寄存器空間106中保持的特定掩碼模式被指令調用出,被從掩碼寄存器空 間獲取,并且被提供到掩碼層104/105中的一個或二者,以"實現(xiàn)"針對特定向量操作的正 確的元素集合。
[0036] 向量機能夠被設計為處理"多維"數(shù)據(jù)結構,其中,向量的每一元素與數(shù)據(jù)結構的 唯一維度相對應。例如,如果向量機要被編程為關注三維結構(例如,"立方體"),則可以創(chuàng) 建具有與立方體的寬度相對應的第一元素、與立方體的長度相對應的第二元素以及與立方 體的高度相對應的第三元素的向量。
[0037] 本領域的普通技術人員將理解,在計算系統(tǒng)中計算多維結構可以導致具有兩個或 更多個維度的結構,包括多于三個的維度。然而,為了簡單起見,本申請將大部分提供示例。
[0038] 表1是能夠使用本文描述的指令瓦解的示例嵌套循環(huán)。要注意的是,可以由用戶 或者諸如靜態(tài)編譯器或諸如立即(JIT)編譯器的運行時間編譯器的編譯器來執(zhí)行循環(huán)瓦 解。大體上,表1示出了嵌套循環(huán),其中以根據(jù)各個循環(huán)計數(shù)器值的偏移為基礎,基于對嵌 套循環(huán)的循環(huán)計數(shù)器αρ以及對從第二多維陣列B獲得的數(shù)據(jù)元素執(zhí)行的計算來對第一 多維陣列A進行更新。
[0039] 轟1
【主權項】
1. 一種處理器,包括: 執(zhí)行模塊,其包括向量單元和標量單元,其中,所述向量單元用于執(zhí)行由多個循環(huán)形成 的被瓦解的循環(huán)以獲得偏移向量,其中,所述向量單元用于針對多次迭代的每一個,計算在 多維數(shù)據(jù)結構中的標量偏移,將所述標量偏移存儲在第一向量寄存器的數(shù)據(jù)元素中,并更 新多維循環(huán)計數(shù)器向量的至少一個循環(huán)計數(shù)器值,并且之后用于使用來自所述偏移向量的 基礎值和索引從所述多維數(shù)據(jù)結構中裝載多個數(shù)據(jù)元素,對所裝載的多個數(shù)據(jù)元素執(zhí)行至 少一個計算以獲得多個結果,并使用來自所述偏移向量的所述基礎值和所述索引將所述多 個結果存儲到所述多維數(shù)據(jù)結構中。
2. 根據(jù)權利要求1所述的處理器,其中,計算所述標量偏移包括獲得索引的絕對值。
3. 根據(jù)權利要求2所述的處理器,其中,使用從開始值向量獲得的開始值和所述多維 循環(huán)計數(shù)器向量的循環(huán)計數(shù)器值來確定所述索引的絕對值。
4. 根據(jù)權利要求3所述的處理器,其中,所述向量單元用于執(zhí)行多維循環(huán)計數(shù)器更新 指令以更新所述多維循環(huán)計數(shù)器向量。
5. 根據(jù)權利要求4所述的處理器,其中,所述多維循環(huán)計數(shù)器更新指令與用于標識所 述多維循環(huán)計數(shù)器向量的第一操作數(shù)、用于標識遞增因子向量的第二操作數(shù)以及用于標識 在針對所述多維循環(huán)計數(shù)器向量的所述循環(huán)計數(shù)器值中的每一個的開始值與結束值之間 的差向量的第三操作數(shù)相關聯(lián)。
6. 根據(jù)權利要求1所述的處理器,其中,所述多個循環(huán)是通過用戶或編譯器被瓦解成 所述被瓦解的循環(huán)的。
7. 根據(jù)權利要求6所述的處理器,其中,所述被瓦解的循環(huán)之后被向量化,以減小與所 述多個循環(huán)的每一個的行程計數(shù)的乘積相對應的行程計數(shù)值。
8. 根據(jù)權利要求1所述的處理器,其中,所述向量單元用于將與多維循環(huán)計數(shù)器更新 指令相關聯(lián)的第一操作數(shù)的至少一個循環(huán)計數(shù)器值更新第一數(shù)量,所述第一數(shù)量依照與所 述多維循環(huán)計數(shù)器更新指令相關聯(lián)的第二操作數(shù)的值。
9. 根據(jù)權利要求8所述的處理器,其中,所述多維循環(huán)計數(shù)器更新指令包括組合的遞 增和遞減指令,以使所述第一操作數(shù)的至少一個循環(huán)計數(shù)器值被遞增并且使所述第一操作 數(shù)的至少一個其它的循環(huán)計數(shù)器值被遞減。
10. -種方法,包括: 在處理器的向量單元中執(zhí)行由多個循環(huán)形成的被瓦解的循環(huán),以獲得偏移向量,所述 執(zhí)行包括針對多次迭代的每一個,計算在多維數(shù)據(jù)結構中的標量偏移,將所述標量偏移存 儲在第一向量寄存器的數(shù)據(jù)元素中,并更新多維循環(huán)計數(shù)器向量的至少一個循環(huán)計數(shù)器 值; 使用來自所述偏移向量的基礎值和索引從所述多維數(shù)據(jù)結構中裝載多個數(shù)據(jù)元素; 對所裝載的多個數(shù)據(jù)元素執(zhí)行至少一個計算以獲得多個結果;以及 使用來自所述偏移向量的所述基礎值和所述索引將所述多個結果存儲到所述多維數(shù) 據(jù)結構中。
11. 根據(jù)權利要求10所述的方法,還包括執(zhí)行多維循環(huán)計數(shù)器更新指令以更新所述多 維循環(huán)計數(shù)器向量。
12. 根據(jù)權利要求11所述的方法,其中,所述多維循環(huán)計數(shù)器更新指令與用于標識所 述多維循環(huán)計數(shù)器向量的第一操作數(shù)、用于標識遞增因子向量的第二操作數(shù)以及用于標識 在針對所述多維循環(huán)計數(shù)器向量的所述循環(huán)計數(shù)器值中的每一個的開始值與結束值之間 的差向量的第三操作數(shù)相關聯(lián)。
13. -種系統(tǒng),包括: 處理器,其包括多個核心,所述多個核心中的至少一個包括: 執(zhí)行模塊,其包括向量單元和標量單元,其中,所述向量單元用于執(zhí)行由多個循環(huán)形成 的被瓦解的循環(huán)以獲得偏移向量,其中,所述向量單元用于針對多次迭代的每一個,計算在 多維數(shù)據(jù)結構中的標量偏移,將所述標量偏移存儲在第一向量寄存器的數(shù)據(jù)元素中,更新 多維循環(huán)計數(shù)器向量的至少一個循環(huán)計數(shù)器值,并基于標志值確定是否完成了所述被瓦解 的循環(huán);以及 動態(tài)隨機存取存儲器(DRAM),其耦合到所述處理器。
13. 根據(jù)權利要求12所述的系統(tǒng),其中,所述執(zhí)行模塊還用于使用來自所述偏移向量 的基礎值和索引從所述多維數(shù)據(jù)結構中裝載多個數(shù)據(jù)元素,對所裝載的多個數(shù)據(jù)元素執(zhí)行 至少一個計算以獲得多個結果,并使用來自所述偏移向量的所述基礎值和所述索引將所述 多個結果存儲到所述多維數(shù)據(jù)結構中。
14. 根據(jù)權利要求12所述的系統(tǒng),其中,所述向量單元用于執(zhí)行多維循環(huán)計數(shù)器遞增 指令以更新所述多維循環(huán)計數(shù)器向量,所述多維循環(huán)計數(shù)器遞增指令還用于更新所述標志 值。
15. 根據(jù)權利要求13所述的處理器,其中,所述執(zhí)行模塊用于響應于通過執(zhí)行所述多 維循環(huán)計數(shù)器遞增指令而更新的所述標志值的第一狀態(tài)來完成所述多次迭代的執(zhí)行,而不 是完成全部的所述多次迭代的執(zhí)行。
16. 根據(jù)權利要求15所述的處理器,其中,所述執(zhí)行模塊還用于在向量掩碼下執(zhí)行至 少一個向量計算。
17. 根據(jù)權利要求16所述的處理器,其中,如果所述多次迭代的第一迭代由所述執(zhí)行 模塊執(zhí)行,則所述向量掩碼的第一元素具有第一值,并且如果所述多次迭代的第二迭代沒 有由所述執(zhí)行模塊執(zhí)行,則所述向量掩碼的第二元素具有第二值。
18. 根據(jù)權利要求14所述的處理器,其中,所述執(zhí)行模塊用于響應于通過執(zhí)行所述多 維循環(huán)計數(shù)器遞增指令而更新的所述標志值的第一狀態(tài)來完成所述被瓦解的循環(huán)的執(zhí)行。
【專利摘要】在實施例中,一種向量化被瓦解的多嵌套循環(huán)的方法包括:在處理器的向量單元中執(zhí)行被瓦解的循環(huán)以獲得偏移向量,包括針對多次迭代中的每一個,將標量偏移計算到多維數(shù)據(jù)結構中,將所述標量偏移存儲在第一向量寄存器的數(shù)據(jù)元素中,并更新多維循環(huán)計數(shù)器向量的循環(huán)計數(shù)器值。繼而,使用來自所述偏移向量的基礎值和索引從所述多維數(shù)據(jù)結構裝載多個數(shù)據(jù)元素,對所裝置的多個數(shù)據(jù)元素執(zhí)行至少一個計算以獲得多個結果,并使用來自所述偏移向量的所述基礎值和所述索引將所述多個結果存儲到所述多維數(shù)據(jù)結構中。描述和請求保護了其他實施例。
【IPC分類】G06F9-45
【公開號】CN104838357
【申請?zhí)枴緾N201380061936
【發(fā)明人】M·普洛特尼科夫, A·納賴金, E·烏爾德艾哈邁德瓦勒
【申請人】英特爾公司
【公開日】2015年8月12日
【申請日】2013年6月29日
【公告號】DE112013005188T5, US20140188961, WO2014105208A1
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1