專利名稱:用于多地址矢量載入的矢量收集緩沖器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)通信領(lǐng)域,且更具體而言,涉及用于多地址矢量載入的矢量收集緩沖器。
背景技術(shù):
通過在專用矢量寄存器中存儲(chǔ)若干個(gè)數(shù)據(jù)項(xiàng)(字節(jié)、字、雙字,……),矢量處理指令并行地對(duì)這些數(shù)據(jù)項(xiàng)進(jìn)行操作。該方案的一個(gè)缺點(diǎn)是對(duì)存儲(chǔ)器的載入和存儲(chǔ)來自于單個(gè)連續(xù)地址。于是,為了處理來自若干個(gè)源(例如矩陣的列)的數(shù)據(jù),需要一系列載入、掩碼和置換指令。未來的處理器可以使用已知為“分散/收集”的技術(shù),其中,一個(gè)指令從若干個(gè)存儲(chǔ)器地址讀入到單個(gè)矢量寄存器。該概念不是新的,且已經(jīng)被若干個(gè)消息傳遞庫(例如MPI)提出并以軟件實(shí)現(xiàn)。用硬件來實(shí)現(xiàn)該概念在編程級(jí)別上看來是直截了當(dāng)?shù)?,但在?shí)現(xiàn)級(jí)別上帶來很多問題:1.高速緩存分 層結(jié)構(gòu)必須能夠并行處理若干個(gè)請(qǐng)求。這需要慢速、大型和昂貴的多端口 設(shè)置(mult1-porting)。I1.高速緩存不命中的概率隨著“收集”的項(xiàng)目數(shù)而增加。這會(huì)導(dǎo)致流水線的停止(stall)和清空(flush)。II1.這些存取中的每個(gè)必須在LSU (載入/存儲(chǔ)單元)的各種機(jī)制中被處理和跟蹤。該單元會(huì)被僅僅單個(gè)請(qǐng)求阻塞(clog)。IV.矢量指令通常被應(yīng)用到在緊密循環(huán)(tight loop)中處理的大量數(shù)據(jù)。如果編譯器使用了循環(huán)展開(loop unrolling),上述所有問題會(huì)更嚴(yán)重。因此,本領(lǐng)域需要解決上述問題。
發(fā)明內(nèi)容
于是根據(jù)本發(fā)明提供了一種用于在處理器中使用的矢量收集緩沖器(VGB),其包括:多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段;有效地址計(jì)算電路,其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址;以及至少一個(gè)讀端口,其可操作以讀取跨多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。根據(jù)本發(fā)明還提供了一種用于在處理器中使用的矢量收集緩沖器(VGB),其包括:一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包含多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段;至少一個(gè)寫端口,用于從存儲(chǔ)器分層結(jié)構(gòu)向一個(gè)或多個(gè)LU傳輸數(shù)據(jù);有效地址計(jì)算電路,其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址;以及至少一個(gè)讀端口,其可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。
根據(jù)本發(fā)明還提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法,該方法包括:提供一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包括多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段;提供至少一個(gè)讀端口,該讀端口可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中;根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址;將LU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較;以及如果所有比較都匹配,則聲明命中信號(hào)并根據(jù)所計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù)。根據(jù)本發(fā)明還提供了一種用于在處理器中使用的矢量收集緩沖器(VGB),其包括:一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包含多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段、數(shù)據(jù)字段和預(yù)取字段;至少一個(gè)寫端口,用于從存儲(chǔ)器分層結(jié)構(gòu)向一個(gè)或多個(gè)LU傳輸數(shù)據(jù);預(yù)取電路,其可操作以針對(duì)一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作;有效地址計(jì)算電路,其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址;標(biāo)簽比較電路,其可操作以將LU中的所有標(biāo)簽條目與計(jì)算的相應(yīng)有效地址進(jìn)行比較,且如果所有比較都匹配,則聲明命中信號(hào)并根據(jù)計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù);以及至少一個(gè)讀端口,如果所有 比較都匹配,其可操作以根據(jù)所計(jì)算的有效地址來讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。根據(jù)本發(fā)明還提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法,該方法包括:提供一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包括多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段、數(shù)據(jù)字段和預(yù)取字段;提供至少一個(gè)寫端口,用于將數(shù)據(jù)從存儲(chǔ)器分層結(jié)構(gòu)傳輸?shù)揭粋€(gè)或多個(gè)LU ;提供至少一個(gè)讀端口,其可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中;提供預(yù)取電路,其可操作地針對(duì)一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作;根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址^fLU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較;以及如果所有比較都匹配,則聲明命中信號(hào)并根據(jù)所計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù)。從另一方面來看,本發(fā)明提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其可被處理電路讀取并存儲(chǔ)指令,所述指令被處理電路執(zhí)行以便執(zhí)行用于執(zhí)行本發(fā)明的步驟的方法。從另一方面來看,本發(fā)明還提供了一種包含軟件代碼部分的計(jì)算機(jī)程序,其被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上且可被載入到數(shù)字計(jì)算機(jī)的內(nèi)部存儲(chǔ),當(dāng)所述程序在計(jì)算機(jī)上運(yùn)行時(shí),用于執(zhí)行本發(fā)明的步驟。
現(xiàn)在將參考如下列附圖所示的優(yōu)選實(shí)施例、僅通過示例的方式來描述本發(fā)明。圖1是示出根據(jù)現(xiàn)有技術(shù)的示例性矢量寄存器讀操作的框圖,并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn);圖2是示出根據(jù)現(xiàn)有技術(shù)的從非連續(xù)存儲(chǔ)器地址讀取的例子的框圖,并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn);
圖3是示出根據(jù)現(xiàn)有技術(shù)的從多個(gè)存儲(chǔ)器地址讀取的例子的框圖,并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn);圖4是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第一示例性實(shí)施例的框圖;圖5是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第二示例性實(shí)施例的框圖;圖6是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第三示例性實(shí)施例的框圖;圖7是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的尋址邏輯部分的框圖;圖8是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的標(biāo)簽比較邏輯部分的框圖;圖9是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含用于每個(gè)緩沖器一個(gè)端口的數(shù)據(jù)提取示例的框圖;圖10是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含每個(gè)緩沖器中的移位的數(shù)據(jù)提取示例的框圖;并且圖11是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含第一項(xiàng)目的對(duì)齊的數(shù)據(jù)提取示例的框圖。
具體實(shí)施例方式今天的很多微處理器具有矢量執(zhí)行單元,其對(duì)矢量寄存器執(zhí)行并行操作。通過在專用矢量寄存器中存儲(chǔ)若干個(gè)數(shù)據(jù)項(xiàng)(字節(jié)、字、雙字等),矢量處理指令對(duì)這些數(shù)據(jù)項(xiàng)進(jìn)行并行操作。一次可以對(duì)多個(gè)元素(例如4、8、16等)執(zhí)行操作。在本文檔中,所有例子使用這些指令,并假設(shè)矢量大小為16字節(jié)、每個(gè)矢量4次操作(即元素大小為4字節(jié))且高速緩存線大小為128字節(jié)??梢岳斫?,本發(fā)明適用于其他矢量大小、每個(gè)矢量的操作次數(shù)以及任意其他高速緩存線大小。此外,下面展示的例子中使用的指令是IBM開發(fā)的Power指令集架構(gòu)(ISA)??梢岳斫?,本發(fā)明也適用于具有類似指令的其他處理器。圖1示出了示例性矢量寄存器讀操作的框圖。在該例子中,矢量寄存器讀取連續(xù)的存儲(chǔ)器。例如,依據(jù)指令lvx, vl, rl, r2,來自rl+r2的存儲(chǔ)器內(nèi)容被讀到vl中。特別地,根據(jù)從基地址rl和偏移量r2形成的地址,來自LI數(shù)據(jù)高速緩存10的16字節(jié)12 (即4個(gè)4字節(jié)的字)被讀到矢量寄存器vl中。類似地,依據(jù)指令I(lǐng)vx,v2,rl,r3,根據(jù)從基地址rl和偏移量r3形成的地址,來自LI數(shù)據(jù)高速緩存10的16字節(jié)14被讀到矢量寄存器v2中。根據(jù)指令vadduwm v3, vl, v2,矢量vl和v2被相加并被存儲(chǔ)在結(jié)果寄存器v2中。注意到在該整篇文檔中,矢量寄存器前綴為“V”,而通用寄存器前綴為“r”。矢量寄存器包含從存儲(chǔ)器載入的數(shù)據(jù),且通用寄存器被用于計(jì)算所從載入的地址。為了從非連續(xù)的地址(例如矩陣的列)讀取,使用下列機(jī)制。首先,每個(gè)字被讀到單獨(dú)的矢量寄存器中。然后兩個(gè)矢量寄存器中的每個(gè)被置換且結(jié)果也被置換。圖2示出的框圖說明了從非連續(xù)存儲(chǔ)器地址讀取的例子。為了從LI數(shù)據(jù)高速緩存16中的任一列18 (或19)(每列為4字節(jié)寬)載入數(shù)據(jù),需要4個(gè)載入指令來將4字節(jié)的字載入到vl、v2、v3、v4中的 每個(gè)中。指令vperm v5, vl, v2, vlO的功能是基于vlO中的掩碼(未示出)來置換矢量寄存器vl和v2。類似地,使用vperm v6,v3,v4,vlO來置換v3和v4中的數(shù)據(jù)。最后,使用vperm v7,v3,v4,vll (vll的掩碼未示出)來置換矢量寄存器v5和v6中的數(shù)據(jù)。最終結(jié)果被存儲(chǔ)在v7中。注意到4個(gè)4字節(jié)的字中的每個(gè)被讀取。為了讀取16字節(jié)的列,其中列寬度為一字節(jié),必須執(zhí)行16個(gè)這樣的載入。在一個(gè)實(shí)施例中,被稱為“分散/收集”操作的操作可被用于從多個(gè)地址采集(或收集)數(shù)據(jù),并將它載入到單個(gè)矢量寄存器中。或者,將數(shù)據(jù)從一個(gè)矢量寄存器存儲(chǔ)到若干個(gè)存儲(chǔ)器位置(即分散)。在任一情形下,這些地址可以通過地址矢量或通過一個(gè)地址和固定步幅偏移量來指定。圖3示出的框圖說明了從多個(gè)存儲(chǔ)器地址讀取的例子。(目前在Power ISA中不存在的)載入多矢量索引指令(Imvx)被用于載入從多個(gè)存儲(chǔ)器位置讀取的數(shù)據(jù)矢量。在該例子中,使用Imvx指令來讀取LI數(shù)據(jù)高速緩存20的列22和24。指令lmvx, vl, v3, r2可操作以將來自v3 (基地址)+r2 (偏移量)中的列22的多個(gè)存儲(chǔ)器位置讀入到矢量寄存器vl。類似地,指令lmvx, v2, v3, r3可操作以將來自v3 (基地址)+r3 (偏移量)中的列24的多個(gè)存儲(chǔ)器地址讀取到矢量寄存器v2中。
但是,圖3示出的方案有幾個(gè)不足:(I)數(shù)據(jù)高速緩存必須被繁重地經(jīng)端口傳輸(ported)以并行處理若干個(gè)請(qǐng)求,這帶來了較長的延時(shí)、較大的高速緩存大小和較高的功耗;(2)或者,可以以串行方式來執(zhí)行存儲(chǔ)器載入,但延時(shí)會(huì)增加;(3)高速緩存不命中的概率會(huì)隨著“收集”的數(shù)據(jù)項(xiàng)的數(shù)量而增加,這會(huì)引起流水線的停止和清空;(4)推測(cè)高速緩存命中并在檢測(cè)到不命中時(shí)回滾(roll-back)將會(huì)非常昂貴;(5)載入/存儲(chǔ)單元(LSU)必須在每個(gè)周期中跟蹤多次存取,這增加了延遲、隊(duì)列條目和復(fù)雜度、以及LSU被單個(gè)請(qǐng)求阻塞的可能性;以及(6)考慮到矢量指令通常被應(yīng)用到在緊密循環(huán)中處理的大量數(shù)據(jù),當(dāng)編譯器展開循環(huán)時(shí),緊密循環(huán)中的存儲(chǔ)器流量的數(shù)量可能會(huì)壓垮系統(tǒng)。作為例子,考慮下列矩陣乘法AxB=C,其中,所有元素都是NxN矩陣。簡(jiǎn)單(naive)
的實(shí)現(xiàn)如下:
權(quán)利要求
1.一種用于在處理器中使用的矢量收集緩沖器(VGB),包括: 多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段; 有效地址計(jì)算電路,其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址;以及 至少一個(gè)讀端口,其可操作以讀取跨所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。
2.如權(quán)利要求1所述 的裝置,還包括每條所述緩沖區(qū)條目線中的預(yù)取字段。
3.如權(quán)利要求1和2中任一個(gè)所述的裝置,其中,所述緩沖區(qū)條目線的數(shù)量是在處理器指令中收集的數(shù)據(jù)項(xiàng)的數(shù)量的倍數(shù)。
4.如以上權(quán)利要求中任一個(gè)所述的裝置,還包括預(yù)取邏輯電路,其可操作以檢測(cè)連續(xù)載入的步幅,并發(fā)起將數(shù)據(jù)讀取到所述緩沖區(qū)條目線的預(yù)取操作。
5.如以上權(quán)利要求中的任一個(gè)所述的裝置,還包括: 一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包含多條緩沖區(qū)條目線;以及 至少一個(gè)寫端口,其用于從存儲(chǔ)器分層結(jié)構(gòu)向所述一個(gè)或多個(gè)LU傳輸數(shù)據(jù); 并且 其中,所述至少一個(gè)讀端口還可操作以讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)。
6.如權(quán)利要求5所述的裝置,其中,所述有效地址計(jì)算電路可操作以執(zhí)行映射功能來確定要存取的LU。
7.如權(quán)利要求5或6中任一個(gè)所述的裝置,還包括: 預(yù)取電路,其可操作以針對(duì)所述一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作; 有效地址計(jì)算電路,其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址;以及 標(biāo)簽比較電路,其可操作以將LU中的所有標(biāo)簽條目與所計(jì)算的相應(yīng)有效地址進(jìn)行比較,并且如果所有比較都匹配,則聲明命中信號(hào)并根據(jù)所述計(jì)算的有效地址經(jīng)所述讀端口從所述LU提取數(shù)據(jù);并且 其中,如果所有所述比較都匹配,則所述至少一個(gè)讀端口還可操作以根據(jù)所述計(jì)算的有效地址讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并在輸出矢量寄存器中存儲(chǔ)所述數(shù)據(jù)項(xiàng)。
8.如權(quán)利要求7所述的裝置,其中,所述有效地址計(jì)算電路可操作以執(zhí)行映射功能以確定要存取的LU。
9.一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法,所述方法包括: 提供一個(gè)或多個(gè)邏輯單元(LU),每個(gè)邏輯單元包括多條緩沖區(qū)條目線,每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段; 提供至少一個(gè)讀端口,該讀端口可操作以讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng),并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中; 根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址;將LU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較;以及 如果所有比較都匹配,則聲明命中信號(hào)并根據(jù)所述計(jì)算的有效地址經(jīng)所述讀端口從所述LU提取數(shù)據(jù)。
10.如權(quán)利要求9所述的方法,其中,所述計(jì)算步驟包括執(zhí)行映射功能以確定要被存取的LU。
11.如權(quán)利要求9或10所述的方法,還包括提供單獨(dú)的讀端口,用于從所述LU讀取每個(gè)數(shù)據(jù)項(xiàng)。
12.如權(quán)利要求9到11中任一個(gè)所述的方法,還包括為所述緩沖區(qū)條目線提供移位寄存器,并將每條線移位合適的量直到所有數(shù)據(jù)項(xiàng)都被對(duì)齊,由此使得能夠同時(shí)從所述LU提取所有數(shù)據(jù)項(xiàng)。
13.如權(quán)利要求9到12中任一個(gè)所述的方法,還包括針對(duì)所有數(shù)據(jù)項(xiàng)應(yīng)用統(tǒng)一的偏移量,由此使得能夠同時(shí)從所述LU提取所有數(shù)據(jù)項(xiàng)。
14.如權(quán)利要求9到13中任一個(gè)所述的方法,其中,如果不是所有所述比較匹配,將數(shù)據(jù)從存儲(chǔ)器分層結(jié)構(gòu)載入到所述VGB中。
15.如權(quán)利要求9到14中任一個(gè)所述的方法,其中,每條緩沖區(qū)條目線還包括預(yù)取字段,該方法還包括: 提供至少一個(gè)寫端口,用于從存儲(chǔ)器分層結(jié)構(gòu)向所述至少一個(gè)或多個(gè)LU傳輸數(shù)據(jù);以及 提供預(yù)取電路,其可操作以針對(duì)所述一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作。
16.如權(quán)利要求9到15中任一個(gè)所述的方法,其中,所述有效地址計(jì)算電路可操作以執(zhí)行映射功能,來確定要被存取的LU。
17.一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其可被處理電路讀取并存儲(chǔ)指令,所述指令被處理電路執(zhí)行以執(zhí)行如權(quán)利要求9到16中任一個(gè)所述的方法。
18.—種包含軟件代碼部分的計(jì)算機(jī)程序,其被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上且可被載入到數(shù)字計(jì)算機(jī)的內(nèi)部存儲(chǔ),當(dāng)所述程序在計(jì)算機(jī)上運(yùn)行時(shí),用于執(zhí)行如權(quán)利要求9到16中任一個(gè)所述的方法。
全文摘要
一種專用矢量收集緩沖器(VGB),其在一個(gè)或多個(gè)邏輯單元(LU)中存儲(chǔ)從存儲(chǔ)器分層結(jié)構(gòu)讀取的多條高速緩存線,并在矢量寄存器上執(zhí)行并行操作,每個(gè)邏輯單元具有多個(gè)緩沖區(qū)條目。VGB發(fā)起預(yù)取事件,該事件使其保持充滿以響應(yīng)于“收集”指令所創(chuàng)建的需求。VGB包括用于從存儲(chǔ)器分層結(jié)構(gòu)接收數(shù)據(jù)的一個(gè)或多個(gè)寫端口,以及能夠從LU的列讀取將被載入到矢量寄存器中的數(shù)據(jù)的讀端口。通過下列方式從VGB提取數(shù)據(jù)(1)針對(duì)每個(gè)讀取的項(xiàng)目使用單獨(dú)的端口,(2)將每個(gè)VGB條目實(shí)現(xiàn)為移位寄存器,并移位合適的量直到所有條目都被對(duì)齊,或者(3)針對(duì)所有項(xiàng)目實(shí)施統(tǒng)一的偏移量。
文檔編號(hào)G06F12/08GK103238133SQ201180058370
公開日2013年8月7日 申請(qǐng)日期2011年12月1日 優(yōu)先權(quán)日2010年12月8日
發(fā)明者D·希特隆, D·努茲曼 申請(qǐng)人:國際商業(yè)機(jī)器公司