亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于執(zhí)行向量最大值最小值運算的裝置和方法與流程

文檔序號:12863471閱讀:158來源:國知局
一種用于執(zhí)行向量最大值最小值運算的裝置和方法與流程

本發(fā)明涉及一種向量最大值最小值運算裝置及方法,用于根據(jù)向量最大值最小值運算指令執(zhí)行向量最大值最小值運算,求取向量中的最大值元素和最小值元素。



背景技術(shù):

在計算機領(lǐng)域應(yīng)用中,與向量運算相關(guān)的應(yīng)用十分普遍。以目前的熱門應(yīng)用領(lǐng)域人工智能中的主流算法機器學習算法為例,幾乎所有已有的經(jīng)典算法中需要求取向量最大值最小值運算。對于求輸入向量的最大值,max_out←max(vector_in[i][v_size]),其中的vector_in[i]是輸入向量的起始地址,v_size是輸入向量的長度,max_out是保存最大值的寄存器。指令每一個域只可以是寄存器。對于求輸入向量的最小值,max_out←min(vector_in[i][v_size])其中的vector_in[i]是輸入向量的起始地址,v_size是輸入向量的長度,min_out是保存最大值的寄存器。指令每一個域只可以是寄存器。

在現(xiàn)有技術(shù)中,一種進行向量最大值最小值運算的已知方案是使用通用處理器,該方法通過通用寄存器堆和通用功能部件來執(zhí)行通用指令,從而執(zhí)行向量最大值最小值運算。然而,該方法的缺點之一是單個通用處理器多用于標量計算,在進行向量最大值最小值運算時運算性能較低。而使用多個通用處理器并行執(zhí)行時,通用處理器之間的相互通訊又有可能成為性能瓶頸。在另一種現(xiàn)有技術(shù)中,使用圖形處理器(gpu)來進行向量計算,其中,通過使用通用寄存器堆和通用流處理單元執(zhí)行通用simd指令來進行向量最大值最小值運算。然而,上述方案中,gpu片上緩存太小,在進行大規(guī)模向量最大值最小值運算時需要不斷進行片外數(shù)據(jù)搬運,片外帶寬成為了主要性能瓶頸。在另一種現(xiàn)有技術(shù)中,使用專門定制的向量最大值最小值運算裝置來進行向量計算,其中,使用定制的寄存器堆和定制 的處理單元進行向量最大值最小值運算。然而,目前已有的專用向量最大值最小值運算裝置受限于寄存器堆,不能夠靈活地支持不同長度的向量最大值最小值運算。



技術(shù)實現(xiàn)要素:

(一)要解決的技術(shù)問題

本發(fā)明的目的在于,提供一種向量最大值最小值運算裝置及方法,解決現(xiàn)有技術(shù)中存在的受限于片間通訊、片上緩存不夠、支持的向量長度不夠靈活等問題。

(二)技術(shù)方案

本發(fā)明提供一種向量最大值最小值運算裝置,用于根據(jù)向量最大值最小值運算指令求取向量中最大值元素和最小值元素,包括:

存儲單元,用于存儲向量;

寄存器單元,用于存儲向量地址,其中,向量地址為向量在存儲單元中存儲的地址;

向量最大值最小值運算單元,用于獲取向量最大值最小值運算指令,根據(jù)向量最大值最小值運算指令在寄存器單元中獲取向量地址,然后,根據(jù)該向量地址在存儲單元中獲取相應(yīng)的向量,接著,根據(jù)獲取的向量進行求向量最大值最小值運算,得到向量中最大值元素和最小值元素。

本發(fā)明還提供一種向量最大值最小值運算方法,用于根據(jù)向量最大值最小值運算指令求取向量中最大值元素和最小值元素,方法包括:

s1,存儲向量;

s2,存儲向量地址;

s3,獲取向量最大值最小值運算指令,根據(jù)向量最大值最小值運算指令獲取向量地址,然后,根據(jù)該向量地址獲取存儲的向量,接著,根據(jù)獲取的向量進行向量最大值最小值運算,得到向量最大值最小值運算結(jié)果。

(三)有益效果

本發(fā)明提供的向量最大值最小值運算裝置及方法,將參與計算的向量數(shù)據(jù)暫存在高速暫存存儲器(scratchpadmemory)上。在僅發(fā)送同一條指令的情況下,向量最大值最小值運算單元中可以更加靈活有效地支持不同 寬度的數(shù)據(jù),并可以解決數(shù)據(jù)存儲中的相關(guān)性問題,從而提升了包含大量向量計算任務(wù)的執(zhí)行性能,本發(fā)明采用的指令具有精簡的格式,使得指令集使用方便、支持的向量長度靈活。

本發(fā)明可以應(yīng)用于以下(包括但不限于)場景中:數(shù)據(jù)處理、機器人、電腦、打印機、掃描儀、電話、平板電腦、智能終端、手機、行車記錄儀、導航儀、傳感器、攝像頭、云端服務(wù)器、相機、攝像機、投影儀、手表、耳機、移動存儲、可穿戴設(shè)備等各類電子產(chǎn)品;飛機、輪船、車輛等各類交通工具;電視、空調(diào)、微波爐、冰箱、電飯煲、加濕器、洗衣機、電燈、燃氣灶、油煙機等各類家用電器;以及包括核磁共振儀、b超、心電圖儀等各類醫(yī)療設(shè)備。

附圖說明

圖1是本發(fā)明提供的向量最大值最小值運算裝置的結(jié)構(gòu)示意圖。

圖2是本發(fā)明提供的指令集的格式示意圖。

圖3是本發(fā)明實施例提供的向量最大值最小值運算裝置的結(jié)構(gòu)示意圖。

圖4是本發(fā)明實施例提供的向量最大值最小值運算裝置執(zhí)行向量邏輯指令的流程圖。

具體實施方式

本發(fā)明提供一種向量最大值最小值運算裝置及配套指令集,包括存儲單元、寄存器單元和向量最大值最小值運算單元,存儲單元中存儲有向量,寄存器單元中存儲有向量存儲的地址向量最大值最小值運算單元根據(jù)向量最大值最小值運算指令在寄存器單元中獲取向量地址,然后,根據(jù)該向量地址在存儲單元中獲取相應(yīng)的向量,接著,根據(jù)獲取的向量進行向量最大值最小值運算,得到向量最大值最小值運算結(jié)果。本發(fā)明將參與計算的向量數(shù)據(jù)暫存在高速暫存存儲器上,使得向量最大值最小值運算過程中可以更加靈活有效地支持不同寬度的數(shù)據(jù),提升包含大量向量計算任務(wù)的執(zhí)行性能。

圖1是本發(fā)明提供的向量最大值最小值運算裝置的結(jié)構(gòu)示意圖,如圖 1所示,向量最大值最小值運算裝置包括:

存儲單元,用于存儲向量,在一種實施方式中,該存儲單元可以是高速暫存存儲器,能夠支持不同大小的向量數(shù)據(jù);本發(fā)明將必要的計算數(shù)據(jù)暫存在高速暫存存儲器(scratchpadmemory)上,使本運算裝置在進行向量最大值最小值運算過程中可以更加靈活有效地支持不同寬度的數(shù)據(jù)。存儲單元可以通過各種不同存儲器件(sram、edram、dram、憶阻器、3d-dram或非易失存儲等)實現(xiàn)。

寄存器單元,用于存儲向量地址,其中,向量地址為向量在存儲單元中存儲的地址;在一種實施方式中,寄存器單元可以是標量寄存器堆,提供運算過程中所需的多個標量寄存器,標量寄存器不只存放向量地址,還存放有標量數(shù)據(jù)。當涉及到向量與標量的運算時,向量最大值最小值運算單元不僅要從寄存器單元中獲取向量地址,還要從寄存器單元中獲取相應(yīng)的標量。

向量最大值最小值運算單元,用于獲取向量最大值最小值運算指令,根據(jù)向量最大值最小值運算指令在所述寄存器單元中獲取向量地址,然后,根據(jù)該向量地址在存儲單元中獲取相應(yīng)的向量,接著,根據(jù)獲取的向量進行向量最大值最小值運算,得到向量中的最大值元素和最小值元素,并將向量最大值最小值運算結(jié)果存儲于存儲單元中。

需要說明的是,在向量中求取最大值元素和最小值元素可以通過冒泡排序等算法實現(xiàn),這些均為現(xiàn)有的公知算法,再此就不再贅述。

根據(jù)本發(fā)明的一種實施方式,向量最大值最小值運算裝置還包括:指令緩存單元,用于存儲待執(zhí)行的向量最大值最小值運算指令。指令在執(zhí)行過程中,同時也被緩存在指令緩存單元中,當一條指令執(zhí)行完之后,如果該指令同時也是指令緩存單元中未被提交指令中最早的一條指令,該指令將被提交,一旦提交,該條指令進行的操作對裝置狀態(tài)的改變將無法撤銷。在一種實施方式中,指令緩存單元可以是重排序緩存。

根據(jù)本發(fā)明的一種實施方式,向量最大值最小值運算裝置還包括:指令處理單元,用于從指令緩存單元獲取向量最大值最小值運算指令,并對該向量最大值最小值運算指令進行處理后,提供給所述向量最大值最小值運算單元。其中,指令處理單元包括:

取指模塊,用于從指令緩存單元中獲取向量最大值最小值運算指令;

譯碼模塊,用于對獲取的向量最大值最小值運算指令進行譯碼;

指令隊列,用于對譯碼后的向量最大值最小值運算指令進行順序存儲,考慮到不同指令在包含的寄存器上有可能存在依賴關(guān)系,用于緩存譯碼后的指令,當依賴關(guān)系被滿足之后發(fā)射指令。

根據(jù)本發(fā)明的一種實施方式,向量最大值最小值運算裝置還包括:依賴關(guān)系處理單元,用于在向量最大值最小值運算單元獲取向量最大值最小值運算指令前,判斷該向量最大值最小值運算指令與前一向量最大值最小值運算指令是否訪問相同的向量,若是,將該向量最大值最小值運算指令存儲在一存儲隊列中,待前一向量最大值最小值運算指令執(zhí)行完畢后,將存儲隊列中的該向量最大值最小值運算指令提供給向量最大值最小值運算單元;否則,直接將該向量最大值最小值運算指令提供給向量最大值最小值運算單元。具體地,向量最大值最小值運算指令訪問高速暫存存儲器時,前后指令可能會訪問同一塊存儲空間,為了保證指令執(zhí)行結(jié)果的正確性,當前指令如果被檢測到與之前的指令的數(shù)據(jù)存在依賴關(guān)系,該指令必須在存儲隊列內(nèi)等待至依賴關(guān)系被消除。

根據(jù)本發(fā)明的一種實施方式,向量最大值最小值運算裝置還包括:輸入輸出單元,用于將向量存儲于存儲單元,或者,從存儲單元中獲取最大值元素和最小值元素。其中,輸入輸出單元可以是直接存儲單元,負責從內(nèi)存中讀取數(shù)據(jù)或?qū)懭霐?shù)據(jù)。

本發(fā)明還提供一種向量最大值最小值運算方法,用于根據(jù)向量最大值最小值運算指令求取向量中最大值元素和最小值元素,方法包括:

s1,存儲向量;

s2,存儲向量地址;

s3,獲取向量最大值最小值運算指令,根據(jù)向量最大值最小值運算指令獲取向量地址,然后,根據(jù)該向量地址獲取存儲的向量,接著,根據(jù)獲取的向量進行向量最大值最小值運算,得到向量中最大值元素和最小值元素。

根據(jù)本發(fā)明的一種實施方式,在步驟s3之前還包括:

存儲向量最大值最小值運算指令;

獲取存儲的向量最大值最小值運算指令;

對獲取的向量最大值最小值運算指令進行譯碼;

對譯碼后的向量最大值最小值運算指令進行順序存儲。

根據(jù)本發(fā)明的一種實施方式,在步驟s3之前還包括:

判斷該向量最大值最小值運算指令與前一向量最大值最小值運算指令是否訪問相同的向量,若是,將該向量最大值最小值運算指令存儲在一存儲隊列中,待前一向量最大值最小值運算指令執(zhí)行完畢后,再執(zhí)行步驟s3;否則,直接執(zhí)行步驟s3。

根據(jù)本發(fā)明的一種實施方式,方法還包括,存儲求得的最大值元素和最小值元素。

根據(jù)本發(fā)明的一種實施方式,步驟s1包括,將向量存儲至一高速暫存存儲器中。

根據(jù)本發(fā)明的一種實施方式,向量最大值最小值運算指令包括一操作碼和至少一操作域,其中,所述操作碼用于指示該向量運算指令的功能,操作域用于指示該向量運算指令的數(shù)據(jù)信息。

根據(jù)本發(fā)明的一種實施方式,用于本發(fā)明裝置的指令集采用load/store結(jié)構(gòu),向量最大值最小值運算單元不會對內(nèi)存中的數(shù)據(jù)進行操作。本指令集采用精簡指令集架構(gòu),指令集只提供最基本的向量最大值最小值運算操作,復(fù)雜的向量最大值最小值運算都由這些簡單指令通過組合進行模擬,使得可以在高時鐘頻率下單周期執(zhí)行指令。另外,本指令集同時采用定長指令,使得本發(fā)明提出的向量最大值最小值運算裝置在上一條指令的譯碼階段對下一條指令進行取指。

在本裝置執(zhí)行向量最大最小值運算的過程中,裝置取出指令進行譯碼,然后送至指令隊列存儲,根據(jù)譯碼結(jié)果,獲取指令中的各個參數(shù),這些參數(shù)可以是直接寫在指令的操作域中,也可以是根據(jù)指令操作域中的寄存器號從指定的寄存器中讀取。這種使用寄存器存儲參數(shù)的好處是無需改變指令本身,只要用指令改變寄存器中的值,就可以實現(xiàn)大部分的循環(huán),因此大大節(jié)省了在解決某些實際問題時所需要的指令條數(shù)。在全部操作數(shù)之后,依賴關(guān)系處理單元會判斷指令實際需要使用的數(shù)據(jù)與之前指令中是否存在依賴關(guān)系,這決定了這條指令是否可以被立即發(fā)送至運算單元中執(zhí) 行。一旦發(fā)現(xiàn)與之前的數(shù)據(jù)之間存在依賴關(guān)系,則該條指令必須等到它依賴的指令執(zhí)行完畢之后才可以送至運算單元執(zhí)行。在定制的運算單元中,該條指令將快速執(zhí)行完畢,并將結(jié)果,即生成的向量最大值最小值運算結(jié)果寫回至指令提供的地址,該條指令執(zhí)行完畢。

圖2是本發(fā)明提供的指令集的格式示意圖,如圖2所示,向量最大值最小值運算指令包括1個操作碼和至少一個操作域,其中,操作碼用于指示該向量最大值最小值運算指令的功能,向量最大值最小值運算單元通過識別該操作碼可進行向量最大值最小值運算,操作域用于指示該向量最大值最小值運算指令的數(shù)據(jù)信息,其中,數(shù)據(jù)信息可以是立即數(shù)或寄存器號,例如,要獲取一個向量時,根據(jù)寄存器號可以在相應(yīng)的寄存器中獲取向量起始地址和向量長度,再根據(jù)向量起始地址和向量長度在存儲單元中獲取相應(yīng)地址存放的向量。

指令集包含有不同功能的向量最大值最小值運算指令:

向量最大值指令(vmax)。根據(jù)該指令,裝置從高速暫存存儲器的指定地址取出指定大小的向量數(shù)據(jù),從中選出最大的元素作為結(jié)果,并將結(jié)果寫回至標量寄存器堆的指定地址;

向量最小值指令(vmin)。根據(jù)該指令,裝置從高速暫存存儲器的指定地址取出指定大小的向量數(shù)據(jù),從中選出最小的元素作為結(jié)果,并將結(jié)果寫回至標量寄存器堆的指定地址;

向量檢索指令(vr)。根據(jù)該指令,裝置從高速暫存存儲器的指定地址取出指定大小的向量數(shù)據(jù),在向量計算單元中根據(jù)指定位置取出向量中的相應(yīng)元素作為輸出,并將結(jié)果寫回至標量寄存器堆的指定地址;

向量加載指令(vload)。根據(jù)該指令,裝置從指定外部源地址載入指定大小的向量數(shù)據(jù)至高速暫存存儲器的指定地址;

向量存儲指令(vs)。根據(jù)該指令,裝置將高速暫存存儲器的指定地址的指定大小的向量數(shù)據(jù)存至外部目的地址處;

向量搬運指令(vmove)。根據(jù)該指令,裝置將高速暫存存儲器的指定地址的指定大小的向量數(shù)據(jù)存至高速暫存存儲器的另一指定地址處。

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。

圖3是本發(fā)明實施例提供的向量最大值最小值運算裝置的結(jié)構(gòu)示意圖,如圖3所示,裝置包括取指模塊、譯碼模塊、指令隊列、標量寄存器堆、依賴關(guān)系處理單元、存儲隊列、重排序緩存、向量最大值最小值運算單元、高速暫存器、io直接內(nèi)存存取模塊;

取指模塊,該模塊負責從指令序列中取出下一條將要執(zhí)行的向量最大最小值指令,并將該指令傳給譯碼模塊;

譯碼模塊,該模塊負責對向量最大最小值指令進行譯碼,并將譯碼后求向量最大值最小值運算的指令傳給指令隊列;

指令隊列,考慮到不同指令在包含的標量寄存器上有可能存在依賴關(guān)系,用于緩存譯碼后的指令,當依賴關(guān)系被滿足之后發(fā)射指令;

標量寄存器堆,提供裝置在運算過程中所需的標量寄存器;

依賴關(guān)系處理單元,該模塊處理處理指令與前一條指令可能存在的存儲依賴關(guān)系。向量最大值最小值運算指令會訪問高速暫存存儲器,前后指令可能會訪問同一塊存儲空間。為了保證指令執(zhí)行結(jié)果的正確性,當前指令如果被檢測到與之前的指令的數(shù)據(jù)存在依賴關(guān)系,該指令必須在存儲隊列內(nèi)等待至依賴關(guān)系被消除。

存儲隊列,該模塊是一個有序隊列,與之前指令在數(shù)據(jù)上有依賴關(guān)系的指令被存儲在該隊列內(nèi)直至存儲關(guān)系被消除;

重排序緩存,指令在執(zhí)行過程中,同時也被緩存在給模塊中,當一條指令執(zhí)行完之后,如果該指令同時也是重排序緩存中未被提交向量最大最小值指令中最早的一條指令,該指令將被提交。一旦提交,該條指令進行的操作對裝置狀態(tài)的改變將無法撤銷;

向量最大值最小值運算單元,該模塊負責裝置的所有向量最大值最小值運算,向量最大值最小值運算指令被送往該運算單元執(zhí)行;

高速暫存器,該模塊是向量數(shù)據(jù)專用的暫存存儲裝置,能夠支持不同大小的向量數(shù)據(jù);

io直接內(nèi)存存取模塊,該模塊用于直接訪問高速暫存存儲器,負責從高速暫存存儲器中讀取數(shù)據(jù)或?qū)懭霐?shù)據(jù)。

圖4是本發(fā)明實施例提供的向量最大值最小值運算裝置執(zhí)行任一向量最大值最小值運算指令的流程圖,如圖4所示,執(zhí)行向量最大值最小值運 算任一指令的過程包括:

s1,取指模塊取出向量最大值最小值運算指令,并將該指令送往譯碼模塊。

s2,譯碼模塊對指令譯碼,并將向量最大值最小值運算指令送往指令隊列。

s3,在指令隊列中,根據(jù)向量最大值最小值運算指令從標量寄存器堆中獲取指令中四個操作域所對應(yīng)的標量寄存器里的數(shù)據(jù),包括向量vin0的起始地址、向量vin0的長度、向量vin1的起始地址、向量vin1的長度。

s4,在取得需要的標量數(shù)據(jù)后,該指令被送往依賴關(guān)系處理單元。依賴關(guān)系處理單元分析該指令與前面的尚未執(zhí)行結(jié)束的指令在數(shù)據(jù)上是否存在依賴關(guān)系。該條指令需要在存儲隊列中等待至其與前面的未執(zhí)行結(jié)束的指令在數(shù)據(jù)上不再存在依賴關(guān)系為止。

s5:依賴關(guān)系不存在后,該條向量最大值最小值運算指令被送往向量最大值最小值運算單元。向量最大值最小值運算單元根據(jù)所需數(shù)據(jù)的地址和長度從數(shù)據(jù)暫存器中取出需要的向量,然后在向量最大值最小值運算單元中完成運算。

s6,運算完成后,將結(jié)果寫回至高速暫存存儲器的指定地址,同時提交重排序緩存中的該向量最大值最小值運算指令。

以上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進行了進一步詳細說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1