亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于整數(shù)深度學習原語的動態(tài)精度管理的制作方法

文檔序號:40403293發(fā)布日期:2024-12-20 12:27閱讀:5來源:國知局
用于整數(shù)深度學習原語的動態(tài)精度管理的制作方法

實施例通常涉及數(shù)據(jù)處理,并且更特別地涉及經(jīng)由通用圖形處理單元進行數(shù)據(jù)處理。


背景技術(shù):

1、當前的并行圖形數(shù)據(jù)處理包括被開發(fā)來對圖像數(shù)據(jù)執(zhí)行特定的操作(例如,線性內(nèi)插、曲面細分、光柵化、紋理映射、深度測試等)的系統(tǒng)和方法。在傳統(tǒng)上,圖形處理器使用固定功能計算單元來處理圖形數(shù)據(jù);然而,最近,圖形處理器的部分變得可編程,使這樣的處理器能夠支持用于處理頂點和片段數(shù)據(jù)的各種各樣的操作。

2、為了進一步增加性能,圖形處理器一般實現(xiàn)處理技術(shù),例如流水線,其試圖貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數(shù)據(jù)。具有單指令多線程(simt)架構(gòu)的并行圖形處理器被設計為使得在圖形流水線中的并行處理的量最大化。在simt架構(gòu)中,幾組并行線程試圖盡可能經(jīng)常地一起同步地執(zhí)行程序指令以增加處理效率??稍趕hane?cook的“cuda?programming”(第3章,37-51頁(2013))和/或nicholas?wilt的cuda?handbook“acomprehensive?guide?to?gpu?programming”(章節(jié)2.6.2到3.1.2)(2013年6月)中找到simt架構(gòu)的軟件和硬件的一般概述。


技術(shù)實現(xiàn)思路



技術(shù)特征:

1.一種用于執(zhí)行與神經(jīng)網(wǎng)絡相關(guān)聯(lián)的計算的圖形處理單元,所述圖形處理單元包括:

2.如權(quán)利要求1所述的圖形處理單元,所述計算單元的動態(tài)精度定點邏輯包括整數(shù)計算單元,所述整數(shù)計算單元包括乘法器、加法器、累加器、移位器、以及寄存器。

3.如權(quán)利要求2所述的圖形處理單元,其中,所述寄存器用于存儲與所述一組動態(tài)定點張量相關(guān)聯(lián)的共享指數(shù)。

4.如權(quán)利要求1所述的圖形處理單元,所述計算單元還用于:

5.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對所述輸出張量,調(diào)節(jié)右移位計數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。

6.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)高于所述閾值而使右移位計數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。

7.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)低于所述閾值而使右移位計數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。

8.如權(quán)利要求4所述的圖形處理單元,所述計算單元還用于:

9.一種方法,包括:

10.如權(quán)利要求9所述的方法,其中,對所述一組動態(tài)定點張量執(zhí)行所述計算操作包括:

11.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:調(diào)節(jié)針對所述輸出張量的右移位計數(shù)器和共享指數(shù)。

12.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)高于所述閾值而使右移位計數(shù)器增加并且使共享指數(shù)遞增。

13.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)低于所述閾值而使右移位計數(shù)器減少并且使共享指數(shù)遞減。

14.如權(quán)利要求10所述的方法,還包括:

15.一種數(shù)據(jù)處理系統(tǒng),包括:

16.如權(quán)利要求15所述的數(shù)據(jù)處理系統(tǒng),所述計算單元還用于:

17.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對所述輸出張量,調(diào)節(jié)右移位計數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。

18.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)高于所述閾值而使右移位計數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。

19.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應于確定所述前導零計數(shù)低于所述閾值而使右移位計數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。

20.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),所述計算單元還用于:


技術(shù)總結(jié)
一個實施例提供圖形處理單元以執(zhí)行與神經(jīng)網(wǎng)絡相關(guān)聯(lián)的計算,圖形處理單元包括:計算單元,其包括具有動態(tài)精度定點邏輯的硬件邏輯單元;解碼單元,其對指令解碼以用于由計算單元執(zhí)行,指令使計算單元對一組動態(tài)定點張量執(zhí)行矩陣算術(shù)運算;以及動態(tài)精度管理器,其動態(tài)地調(diào)節(jié)在矩陣算術(shù)運算期間由計算單元執(zhí)行的計算操作的精度,動態(tài)精度管理器調(diào)節(jié),其調(diào)節(jié)計算操作的精度以防止算術(shù)溢出。

技術(shù)研發(fā)人員:N·梅勒姆普迪,D·穆迪格雷,D·達斯,S·斯瑞哈蘭
受保護的技術(shù)使用者:英特爾公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1