用于多地址矢量載入的矢量收集緩沖器的制作方法

文檔序號(hào)：6362446閱讀：152來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：用于多地址矢量載入的矢量收集緩沖器的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及數(shù)據(jù)通信領(lǐng)域，且更具體而言，涉及用于多地址矢量載入的矢量收集緩沖器。
背景技術(shù)：
通過在專用矢量寄存器中存儲(chǔ)若干個(gè)數(shù)據(jù)項(xiàng)(字節(jié)、字、雙字，……)，矢量處理指令并行地對(duì)這些數(shù)據(jù)項(xiàng)進(jìn)行操作。該方案的一個(gè)缺點(diǎn)是對(duì)存儲(chǔ)器的載入和存儲(chǔ)來自于單個(gè)連續(xù)地址。于是，為了處理來自若干個(gè)源(例如矩陣的列)的數(shù)據(jù)，需要一系列載入、掩碼和置換指令。未來的處理器可以使用已知為“分散/收集”的技術(shù)，其中，一個(gè)指令從若干個(gè)存儲(chǔ)器地址讀入到單個(gè)矢量寄存器。該概念不是新的，且已經(jīng)被若干個(gè)消息傳遞庫(例如MPI)提出并以軟件實(shí)現(xiàn)。用硬件來實(shí)現(xiàn)該概念在編程級(jí)別上看來是直截了當(dāng)?shù)?，但在?shí)現(xiàn)級(jí)別上帶來很多問題:1.高速緩存分層結(jié)構(gòu)必須能夠并行處理若干個(gè)請(qǐng)求。這需要慢速、大型和昂貴的多端口設(shè)置(mult1-porting)。I1.高速緩存不命中的概率隨著“收集”的項(xiàng)目數(shù)而增加。這會(huì)導(dǎo)致流水線的停止(stall)和清空(flush)。II1.這些存取中的每個(gè)必須在LSU (載入/存儲(chǔ)單元)的各種機(jī)制中被處理和跟蹤。該單元會(huì)被僅僅單個(gè)請(qǐng)求阻塞(clog)。IV.矢量指令通常被應(yīng)用到在緊密循環(huán)(tight loop)中處理的大量數(shù)據(jù)。如果編譯器使用了循環(huán)展開(loop unrolling),上述所有問題會(huì)更嚴(yán)重。因此，本領(lǐng)域需要解決上述問題。

發(fā)明內(nèi)容
于是根據(jù)本發(fā)明提供了一種用于在處理器中使用的矢量收集緩沖器(VGB)，其包括:多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段；有效地址計(jì)算電路，其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址；以及至少一個(gè)讀端口，其可操作以讀取跨多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。根據(jù)本發(fā)明還提供了一種用于在處理器中使用的矢量收集緩沖器(VGB)，其包括:一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包含多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段；至少一個(gè)寫端口，用于從存儲(chǔ)器分層結(jié)構(gòu)向一個(gè)或多個(gè)LU傳輸數(shù)據(jù)；有效地址計(jì)算電路，其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址；以及至少一個(gè)讀端口，其可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。
根據(jù)本發(fā)明還提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法，該方法包括:提供一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包括多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段；提供至少一個(gè)讀端口，該讀端口可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中；根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址；將LU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較；以及如果所有比較都匹配，則聲明命中信號(hào)并根據(jù)所計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù)。根據(jù)本發(fā)明還提供了一種用于在處理器中使用的矢量收集緩沖器(VGB)，其包括:一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包含多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段、數(shù)據(jù)字段和預(yù)取字段；至少一個(gè)寫端口，用于從存儲(chǔ)器分層結(jié)構(gòu)向一個(gè)或多個(gè)LU傳輸數(shù)據(jù)；預(yù)取電路，其可操作以針對(duì)一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作；有效地址計(jì)算電路，其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址；標(biāo)簽比較電路，其可操作以將LU中的所有標(biāo)簽條目與計(jì)算的相應(yīng)有效地址進(jìn)行比較，且如果所有比較都匹配，則聲明命中信號(hào)并根據(jù)計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù)；以及至少一個(gè)讀端口，如果所有比較都匹配，其可操作以根據(jù)所計(jì)算的有效地址來讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。根據(jù)本發(fā)明還提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法，該方法包括:提供一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包括多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段、數(shù)據(jù)字段和預(yù)取字段；提供至少一個(gè)寫端口，用于將數(shù)據(jù)從存儲(chǔ)器分層結(jié)構(gòu)傳輸?shù)揭粋€(gè)或多個(gè)LU ;提供至少一個(gè)讀端口，其可操作以讀取跨每個(gè)LU中的多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中；提供預(yù)取電路，其可操作地針對(duì)一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作；根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址^fLU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較；以及如果所有比較都匹配，則聲明命中信號(hào)并根據(jù)所計(jì)算的有效地址經(jīng)讀端口從LU提取數(shù)據(jù)。從另一方面來看，本發(fā)明提供了一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的計(jì)算機(jī)程序產(chǎn)品，該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其可被處理電路讀取并存儲(chǔ)指令，所述指令被處理電路執(zhí)行以便執(zhí)行用于執(zhí)行本發(fā)明的步驟的方法。從另一方面來看，本發(fā)明還提供了一種包含軟件代碼部分的計(jì)算機(jī)程序，其被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上且可被載入到數(shù)字計(jì)算機(jī)的內(nèi)部存儲(chǔ)，當(dāng)所述程序在計(jì)算機(jī)上運(yùn)行時(shí)，用于執(zhí)行本發(fā)明的步驟。

現(xiàn)在將參考如下列附圖所示的優(yōu)選實(shí)施例、僅通過示例的方式來描述本發(fā)明。圖1是示出根據(jù)現(xiàn)有技術(shù)的示例性矢量寄存器讀操作的框圖，并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn)；圖2是示出根據(jù)現(xiàn)有技術(shù)的從非連續(xù)存儲(chǔ)器地址讀取的例子的框圖，并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn)；
圖3是示出根據(jù)現(xiàn)有技術(shù)的從多個(gè)存儲(chǔ)器地址讀取的例子的框圖，并且本發(fā)明的優(yōu)選實(shí)施例可在其中實(shí)現(xiàn)；圖4是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第一示例性實(shí)施例的框圖；圖5是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第二示例性實(shí)施例的框圖；圖6是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的第三示例性實(shí)施例的框圖；圖7是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的尋址邏輯部分的框圖；圖8是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的矢量收集緩沖器的標(biāo)簽比較邏輯部分的框圖；圖9是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含用于每個(gè)緩沖器一個(gè)端口的數(shù)據(jù)提取示例的框圖；圖10是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含每個(gè)緩沖器中的移位的數(shù)據(jù)提取示例的框圖；并且圖11是示出根據(jù)本發(fā)明的優(yōu)選實(shí)施例的包含第一項(xiàng)目的對(duì)齊的數(shù)據(jù)提取示例的框圖。
具體實(shí)施例方式今天的很多微處理器具有矢量執(zhí)行單元，其對(duì)矢量寄存器執(zhí)行并行操作。通過在專用矢量寄存器中存儲(chǔ)若干個(gè)數(shù)據(jù)項(xiàng)(字節(jié)、字、雙字等)，矢量處理指令對(duì)這些數(shù)據(jù)項(xiàng)進(jìn)行并行操作。一次可以對(duì)多個(gè)元素(例如4、8、16等)執(zhí)行操作。在本文檔中，所有例子使用這些指令，并假設(shè)矢量大小為16字節(jié)、每個(gè)矢量4次操作(即元素大小為4字節(jié))且高速緩存線大小為128字節(jié)?？梢岳斫?，本發(fā)明適用于其他矢量大小、每個(gè)矢量的操作次數(shù)以及任意其他高速緩存線大小。此外，下面展示的例子中使用的指令是IBM開發(fā)的Power指令集架構(gòu)(ISA)?？梢岳斫?，本發(fā)明也適用于具有類似指令的其他處理器。圖1示出了示例性矢量寄存器讀操作的框圖。在該例子中，矢量寄存器讀取連續(xù)的存儲(chǔ)器。例如，依據(jù)指令lvx, vl, rl, r2,來自rl+r2的存儲(chǔ)器內(nèi)容被讀到vl中。特別地，根據(jù)從基地址rl和偏移量r2形成的地址，來自LI數(shù)據(jù)高速緩存10的16字節(jié)12 (即4個(gè)4字節(jié)的字)被讀到矢量寄存器vl中。類似地，依據(jù)指令I(lǐng)vx，v2，rl，r3，根據(jù)從基地址rl和偏移量r3形成的地址，來自LI數(shù)據(jù)高速緩存10的16字節(jié)14被讀到矢量寄存器v2中。根據(jù)指令vadduwm v3, vl, v2,矢量vl和v2被相加并被存儲(chǔ)在結(jié)果寄存器v2中。注意到在該整篇文檔中，矢量寄存器前綴為“V”，而通用寄存器前綴為“r”。矢量寄存器包含從存儲(chǔ)器載入的數(shù)據(jù)，且通用寄存器被用于計(jì)算所從載入的地址。為了從非連續(xù)的地址(例如矩陣的列)讀取，使用下列機(jī)制。首先，每個(gè)字被讀到單獨(dú)的矢量寄存器中。然后兩個(gè)矢量寄存器中的每個(gè)被置換且結(jié)果也被置換。圖2示出的框圖說明了從非連續(xù)存儲(chǔ)器地址讀取的例子。為了從LI數(shù)據(jù)高速緩存16中的任一列18 (或19)(每列為4字節(jié)寬)載入數(shù)據(jù)，需要4個(gè)載入指令來將4字節(jié)的字載入到vl、v2、v3、v4中的每個(gè)中。指令vperm v5, vl, v2, vlO的功能是基于vlO中的掩碼(未示出)來置換矢量寄存器vl和v2。類似地，使用vperm v6，v3，v4，vlO來置換v3和v4中的數(shù)據(jù)。最后,使用vperm v7，v3，v4，vll (vll的掩碼未示出)來置換矢量寄存器v5和v6中的數(shù)據(jù)。最終結(jié)果被存儲(chǔ)在v7中。注意到4個(gè)4字節(jié)的字中的每個(gè)被讀取。為了讀取16字節(jié)的列，其中列寬度為一字節(jié)，必須執(zhí)行16個(gè)這樣的載入。在一個(gè)實(shí)施例中，被稱為“分散/收集”操作的操作可被用于從多個(gè)地址采集(或收集)數(shù)據(jù)，并將它載入到單個(gè)矢量寄存器中。或者，將數(shù)據(jù)從一個(gè)矢量寄存器存儲(chǔ)到若干個(gè)存儲(chǔ)器位置(即分散)。在任一情形下，這些地址可以通過地址矢量或通過一個(gè)地址和固定步幅偏移量來指定。圖3示出的框圖說明了從多個(gè)存儲(chǔ)器地址讀取的例子。(目前在Power ISA中不存在的)載入多矢量索引指令(Imvx)被用于載入從多個(gè)存儲(chǔ)器位置讀取的數(shù)據(jù)矢量。在該例子中，使用Imvx指令來讀取LI數(shù)據(jù)高速緩存20的列22和24。指令lmvx, vl, v3, r2可操作以將來自v3 (基地址)+r2 (偏移量)中的列22的多個(gè)存儲(chǔ)器位置讀入到矢量寄存器vl。類似地，指令lmvx, v2, v3, r3可操作以將來自v3 (基地址)+r3 (偏移量)中的列24的多個(gè)存儲(chǔ)器地址讀取到矢量寄存器v2中。

但是，圖3示出的方案有幾個(gè)不足:(I)數(shù)據(jù)高速緩存必須被繁重地經(jīng)端口傳輸(ported)以并行處理若干個(gè)請(qǐng)求,這帶來了較長的延時(shí)、較大的高速緩存大小和較高的功耗；(2)或者，可以以串行方式來執(zhí)行存儲(chǔ)器載入，但延時(shí)會(huì)增加；(3)高速緩存不命中的概率會(huì)隨著“收集”的數(shù)據(jù)項(xiàng)的數(shù)量而增加，這會(huì)引起流水線的停止和清空；(4)推測(cè)高速緩存命中并在檢測(cè)到不命中時(shí)回滾(roll-back)將會(huì)非常昂貴；(5)載入/存儲(chǔ)單元(LSU)必須在每個(gè)周期中跟蹤多次存取，這增加了延遲、隊(duì)列條目和復(fù)雜度、以及LSU被單個(gè)請(qǐng)求阻塞的可能性；以及(6)考慮到矢量指令通常被應(yīng)用到在緊密循環(huán)中處理的大量數(shù)據(jù)，當(dāng)編譯器展開循環(huán)時(shí)，緊密循環(huán)中的存儲(chǔ)器流量的數(shù)量可能會(huì)壓垮系統(tǒng)。作為例子，考慮下列矩陣乘法AxB=C,其中，所有元素都是NxN矩陣。簡(jiǎn)單(naive)
的實(shí)現(xiàn)如下:
權(quán)利要求
1.一種用于在處理器中使用的矢量收集緩沖器(VGB)，包括: 多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段；有效地址計(jì)算電路，其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址；以及至少一個(gè)讀端口，其可操作以讀取跨所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中。
2.如權(quán)利要求1所述的裝置，還包括每條所述緩沖區(qū)條目線中的預(yù)取字段。
3.如權(quán)利要求1和2中任一個(gè)所述的裝置，其中，所述緩沖區(qū)條目線的數(shù)量是在處理器指令中收集的數(shù)據(jù)項(xiàng)的數(shù)量的倍數(shù)。
4.如以上權(quán)利要求中任一個(gè)所述的裝置，還包括預(yù)取邏輯電路，其可操作以檢測(cè)連續(xù)載入的步幅，并發(fā)起將數(shù)據(jù)讀取到所述緩沖區(qū)條目線的預(yù)取操作。
5.如以上權(quán)利要求中的任一個(gè)所述的裝置，還包括: 一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包含多條緩沖區(qū)條目線；以及至少一個(gè)寫端口，其用于從存儲(chǔ)器分層結(jié)構(gòu)向所述一個(gè)或多個(gè)LU傳輸數(shù)據(jù)；并且其中，所述至少一個(gè)讀端口還可操作以讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)。
6.如權(quán)利要求5所述的裝置，其中，所述有效地址計(jì)算電路可操作以執(zhí)行映射功能來確定要存取的LU。
7.如權(quán)利要求5或6中任一個(gè)所述的裝置,還包括: 預(yù)取電路，其可操作以針對(duì)所述一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作；有效地址計(jì)算電路，其可操作以根據(jù)輸入基地址和偏移量來生成一個(gè)或多個(gè)有效地址；以及標(biāo)簽比較電路，其可操作以將LU中的所有標(biāo)簽條目與所計(jì)算的相應(yīng)有效地址進(jìn)行比較，并且如果所有比較都匹配，則聲明命中信號(hào)并根據(jù)所述計(jì)算的有效地址經(jīng)所述讀端口從所述LU提取數(shù)據(jù)；并且其中，如果所有所述比較都匹配，則所述至少一個(gè)讀端口還可操作以根據(jù)所述計(jì)算的有效地址讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并在輸出矢量寄存器中存儲(chǔ)所述數(shù)據(jù)項(xiàng)。
8.如權(quán)利要求7所述的裝置，其中，所述有效地址計(jì)算電路可操作以執(zhí)行映射功能以確定要存取的LU。
9.一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的方法，所述方法包括: 提供一個(gè)或多個(gè)邏輯單元(LU)，每個(gè)邏輯單元包括多條緩沖區(qū)條目線，每條緩沖區(qū)條目線包含標(biāo)簽字段和數(shù)據(jù)字段；提供至少一個(gè)讀端口，該讀端口可操作以讀取跨每個(gè)LU中的所述多條緩沖區(qū)條目線的列的數(shù)據(jù)項(xiàng)，并將所述數(shù)據(jù)項(xiàng)存儲(chǔ)在輸出矢量寄存器中；根據(jù)輸入基地址和偏移量來計(jì)算一個(gè)或多個(gè)有效地址；將LU中的所有標(biāo)簽條目與所計(jì)算的有效地址進(jìn)行比較；以及如果所有比較都匹配，則聲明命中信號(hào)并根據(jù)所述計(jì)算的有效地址經(jīng)所述讀端口從所述LU提取數(shù)據(jù)。
10.如權(quán)利要求9所述的方法，其中，所述計(jì)算步驟包括執(zhí)行映射功能以確定要被存取的LU。
11.如權(quán)利要求9或10所述的方法，還包括提供單獨(dú)的讀端口，用于從所述LU讀取每個(gè)數(shù)據(jù)項(xiàng)。
12.如權(quán)利要求9到11中任一個(gè)所述的方法，還包括為所述緩沖區(qū)條目線提供移位寄存器，并將每條線移位合適的量直到所有數(shù)據(jù)項(xiàng)都被對(duì)齊，由此使得能夠同時(shí)從所述LU提取所有數(shù)據(jù)項(xiàng)。
13.如權(quán)利要求9到12中任一個(gè)所述的方法，還包括針對(duì)所有數(shù)據(jù)項(xiàng)應(yīng)用統(tǒng)一的偏移量，由此使得能夠同時(shí)從所述LU提取所有數(shù)據(jù)項(xiàng)。
14.如權(quán)利要求9到13中任一個(gè)所述的方法，其中，如果不是所有所述比較匹配，將數(shù)據(jù)從存儲(chǔ)器分層結(jié)構(gòu)載入到所述VGB中。
15.如權(quán)利要求9到14中任一個(gè)所述的方法，其中，每條緩沖區(qū)條目線還包括預(yù)取字段，該方法還包括: 提供至少一個(gè)寫端口，用于從存儲(chǔ)器分層結(jié)構(gòu)向所述至少一個(gè)或多個(gè)LU傳輸數(shù)據(jù)；以及提供預(yù)取電路，其可操作以針對(duì)所述一個(gè)或多個(gè)LU中的每條緩沖區(qū)條目線來發(fā)起預(yù)取操作。
16.如權(quán)利要求9到15中任一個(gè)所述的方法，其中，所述有效地址計(jì)算電路可操作以執(zhí)行映射功能，來確定要被存取的LU。
17.一種從用于在處理器中使用的矢量收集緩沖器(VGB)提取數(shù)據(jù)的計(jì)算機(jī)程序產(chǎn)品，該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其可被處理電路讀取并存儲(chǔ)指令，所述指令被處理電路執(zhí)行以執(zhí)行如權(quán)利要求9到16中任一個(gè)所述的方法。
18.—種包含軟件代碼部分的計(jì)算機(jī)程序，其被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上且可被載入到數(shù)字計(jì)算機(jī)的內(nèi)部存儲(chǔ)，當(dāng)所述程序在計(jì)算機(jī)上運(yùn)行時(shí)，用于執(zhí)行如權(quán)利要求9到16中任一個(gè)所述的方法。
全文摘要
一種專用矢量收集緩沖器(VGB)，其在一個(gè)或多個(gè)邏輯單元(LU)中存儲(chǔ)從存儲(chǔ)器分層結(jié)構(gòu)讀取的多條高速緩存線，并在矢量寄存器上執(zhí)行并行操作，每個(gè)邏輯單元具有多個(gè)緩沖區(qū)條目。VGB發(fā)起預(yù)取事件，該事件使其保持充滿以響應(yīng)于“收集”指令所創(chuàng)建的需求。VGB包括用于從存儲(chǔ)器分層結(jié)構(gòu)接收數(shù)據(jù)的一個(gè)或多個(gè)寫端口，以及能夠從LU的列讀取將被載入到矢量寄存器中的數(shù)據(jù)的讀端口。通過下列方式從VGB提取數(shù)據(jù)(1)針對(duì)每個(gè)讀取的項(xiàng)目使用單獨(dú)的端口，(2)將每個(gè)VGB條目實(shí)現(xiàn)為移位寄存器，并移位合適的量直到所有條目都被對(duì)齊，或者(3)針對(duì)所有項(xiàng)目實(shí)施統(tǒng)一的偏移量。
文檔編號(hào)G06F12/08GK103238133SQ201180058370
公開日2013年8月7日申請(qǐng)日期2011年12月1日優(yōu)先權(quán)日2010年12月8日
發(fā)明者D·希特隆, D·努茲曼申請(qǐng)人:國際商業(yè)機(jī)器公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：D·希特隆;D·努茲曼
技術(shù)所有人：國際商業(yè)機(jī)器公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于多地址矢量載入的矢量收集緩沖器的制作方法