一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

文檔序號(hào)：40389775發(fā)布日期：2024-12-20 12:12閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

本申請實(shí)施例涉及人工智能，尤其涉及一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。

背景技術(shù)：

1、人工智能模型通常指被訓(xùn)練用來進(jìn)行推理預(yù)測的神經(jīng)網(wǎng)絡(luò)模型，例如圖像推理模型、語音推理模型等。人工智能模型的計(jì)算可以由計(jì)算圖(computation?graph)中的算子(operator)來實(shí)現(xiàn)。算子指的是對人工智能模型中各層的張量所做的各種計(jì)算，例如人工智能模型的卷積層對人工智能模型的輸入數(shù)據(jù)所做的卷積計(jì)算即為卷積算子。

2、相關(guān)技術(shù)下，在卷積算子的執(zhí)行過程中，會(huì)先將特征圖(activation)和權(quán)重(weight)從顯存加載到片上高速緩存，然后按照預(yù)設(shè)的固定緩存使用策略對特征圖和權(quán)重進(jìn)行卷積計(jì)算。

3、在實(shí)際應(yīng)用中，輸入特征圖的形狀是多樣性的，而預(yù)設(shè)的固定緩存使用策略僅適用于幾種形狀的輸入特征圖，難以在多樣性的輸入特征圖的卷積計(jì)算中取得好的效果，從而導(dǎo)致緩存資源沒有得到充分利用，同時(shí)影響卷積計(jì)算的效率。

技術(shù)實(shí)現(xiàn)思路

1、本申請實(shí)施例提供了一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品，用于提高緩存資源的利用率，同時(shí)提高卷積計(jì)算的效率。

2、一方面，本申請實(shí)施例提供了一種緩存使用優(yōu)化方法，包括：

3、基于輸入張量的形狀和計(jì)算單元的數(shù)量，將所述輸入張量切分成多個(gè)子張量；針對所述多個(gè)子張量，分別執(zhí)行以下操作：

4、基于一個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略，并基于所述多個(gè)緩存使用策略，分別計(jì)算所述一個(gè)子張量對應(yīng)的預(yù)計(jì)處理性能；

5、基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略中獲得所述一個(gè)子張量對應(yīng)的目標(biāo)緩存策略。

6、一方面，本申請實(shí)施例提供了一種緩存使用優(yōu)化裝置，包括：

7、切分模塊，用于基于輸入張量的形狀和計(jì)算單元的數(shù)量，將所述輸入張量切分成多個(gè)子張量；

8、策略選擇模塊，用于針對所述多個(gè)子張量，分別執(zhí)行以下操作：

9、基于一個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略，并基于所述多個(gè)緩存使用策略，分別計(jì)算所述一個(gè)子張量對應(yīng)的預(yù)計(jì)處理性能；

10、基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略中獲得所述一個(gè)子張量對應(yīng)的目標(biāo)緩存策略。

11、可選地，所述切分模塊具體用于：

12、基于輸入張量的形狀、計(jì)算單元的數(shù)量以及所述輸入張量的多個(gè)維度的切分優(yōu)先級(jí)，將所述輸入張量切分成多個(gè)子張量。

13、可選地，所述策略選擇模塊具體用于：

14、基于所述一個(gè)子張量的形狀和用于計(jì)算所述一個(gè)子張量的計(jì)算單元的緩存配置信息，獲取相應(yīng)的多個(gè)緩存使用策略。

15、可選地，所述策略選擇模塊還用于：

16、基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略中獲得所述一個(gè)子張量對應(yīng)的目標(biāo)緩存策略之后，按照所述目標(biāo)緩存策略，對所述一個(gè)子張量執(zhí)行卷積計(jì)算，獲得計(jì)算結(jié)果。

17、可選地，所述策略選擇模塊還用于：

18、基于一個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略之后，針對所述多個(gè)緩存使用策略，分別執(zhí)行以下操作：

19、獲取一個(gè)緩存使用策略對應(yīng)的至少一個(gè)流水配置策略，并將所述一個(gè)緩存使用策略分別與所述至少一個(gè)流水配置策略進(jìn)行組合，獲得相應(yīng)的至少一個(gè)候選策略組；

20、所述策略選擇模塊具體用于：

21、針對所述多個(gè)緩存使用策略，分別執(zhí)行以下操作：基于一個(gè)緩存使用策略對應(yīng)的至少一個(gè)候選策略組，分別計(jì)算所述一個(gè)子張量對應(yīng)的預(yù)計(jì)處理性能。

22、可選地，所述策略選擇模塊具體用于：

23、基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略對應(yīng)的候選策略組中，獲得所述一個(gè)子張量對應(yīng)的目標(biāo)策略組，所述目標(biāo)策略組包括所述目標(biāo)緩存策略和相應(yīng)的流水配置策略。

24、可選地，所述策略選擇模塊還用于：

25、基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略對應(yīng)的候選策略組中，獲得所述一個(gè)子張量對應(yīng)的目標(biāo)策略組之后，按照所述目標(biāo)策略組，對所述一個(gè)子張量執(zhí)行卷積計(jì)算，獲得計(jì)算結(jié)果。

26、一方面，本申請實(shí)施例提供了一種計(jì)算機(jī)設(shè)備，包括存儲(chǔ)器、人工智能芯片及存儲(chǔ)在存儲(chǔ)器上并可在人工智能芯片上運(yùn)行的計(jì)算機(jī)程序，所述人工智能芯片執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述緩存使用優(yōu)化方法的步驟。

27、一方面，本申請實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其存儲(chǔ)有可由計(jì)算機(jī)設(shè)備執(zhí)行的計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)設(shè)備上運(yùn)行時(shí)，使得所述計(jì)算機(jī)設(shè)備執(zhí)行上述緩存使用優(yōu)化方法的步驟。

28、一方面，本申請實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品，所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序包括程序指令，當(dāng)所述程序指令被計(jì)算機(jī)設(shè)備執(zhí)行時(shí)，使所述計(jì)算機(jī)設(shè)備執(zhí)行上述緩存使用優(yōu)化方法的步驟。

29、本申請實(shí)施例中，按照輸入張量的形狀和計(jì)算單元的數(shù)量，將輸入張量切分成多個(gè)子張量。按照每個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略，并基于每個(gè)緩存使用策略，計(jì)算該子張量對應(yīng)的預(yù)計(jì)處理性能，這樣便可基于獲得的多個(gè)預(yù)計(jì)處理性能，從多個(gè)緩存使用策略中獲得該子張量對應(yīng)的目標(biāo)緩存策略。那么，對于不同形狀的輸入張量來說，都可以選取最佳的緩存使用策略進(jìn)行卷積計(jì)算，這樣不僅可以充分利用緩存資源，同時(shí)可以提高卷積計(jì)算的效率，并且該方法可以泛化到任意場景，從而優(yōu)化了卷積算子在各類場景的計(jì)算性能。

技術(shù)特征：

1.一種緩存使用優(yōu)化方法，其特征在于，包括：

2.如權(quán)利要求1所述的方法，其特征在于，所述基于輸入張量的形狀和計(jì)算單元的數(shù)量，將所述輸入張量切分成多個(gè)子張量，包括：

3.如權(quán)利要求1所述的方法，其特征在于，所述基于一個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略，包括：

4.如權(quán)利要求1所述的方法，其特征在于，所述基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略中獲得所述一個(gè)子張量對應(yīng)的目標(biāo)緩存策略之后，還包括：

5.如權(quán)利要求1至4任一所述的方法，其特征在于，所述基于一個(gè)子張量的形狀，獲取相應(yīng)的多個(gè)緩存使用策略之后，還包括：

6.如權(quán)利要求5所述的方法，其特征在于，所述基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略中獲得所述一個(gè)子張量對應(yīng)的目標(biāo)緩存策略，包括：

7.如權(quán)利要求6所述的方法，其特征在于，所述基于獲得的多個(gè)預(yù)計(jì)處理性能，從所述多個(gè)緩存使用策略對應(yīng)的候選策略組中，獲得所述一個(gè)子張量對應(yīng)的目標(biāo)策略組之后，還包括：

8.一種計(jì)算機(jī)設(shè)備，包括存儲(chǔ)器、人工智能芯片及存儲(chǔ)在存儲(chǔ)器上并可在人工智能芯片上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述人工智能芯片執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1～7任一項(xiàng)所述方法的步驟。

9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，其存儲(chǔ)有可由計(jì)算機(jī)設(shè)備執(zhí)行的計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)設(shè)備上運(yùn)行時(shí)，使得所述計(jì)算機(jī)設(shè)備執(zhí)行如權(quán)利要求1～7任一項(xiàng)所述方法的步驟。

10.一種計(jì)算機(jī)程序產(chǎn)品，其特征在于，所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序包括程序指令，當(dāng)所述程序指令被計(jì)算機(jī)設(shè)備執(zhí)行時(shí)，使所述計(jì)算機(jī)設(shè)備執(zhí)行如權(quán)利要求1-7任一項(xiàng)所述方法的步驟。

技術(shù)總結(jié)
本申請實(shí)施例提供了一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品，涉及人工智能技術(shù)領(lǐng)域，該方法包括：按照輸入張量的形狀和計(jì)算單元的數(shù)量，將輸入張量切分成多個(gè)子張量。針對每個(gè)子張量，基于子張量的形狀選取多個(gè)候選策略組，每個(gè)候選策略組包括：緩存使用策略和流水配置策略。計(jì)算采用每個(gè)候選策略組對子張量進(jìn)行卷積計(jì)算時(shí)對應(yīng)的預(yù)計(jì)處理性能，基于獲得的多個(gè)預(yù)計(jì)處理性能從多個(gè)候選策略組中選取最佳的目標(biāo)策略組。這樣對于不同形狀的輸入張量來說，都可以選取最佳的緩存使用策略和流水配置策略進(jìn)行卷積計(jì)算，不僅提高了卷積計(jì)算的效率，也充分利用了緩存資源，該方法還可以泛化到各類場景，從而優(yōu)化卷積算子在各類場景的計(jì)算性能。

技術(shù)研發(fā)人員：請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名
受保護(hù)的技術(shù)使用者：上海壁仞科技股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名,請求不公布姓名
技術(shù)所有人：上海壁仞科技股份有限公司
我是此專利的發(fā)明人

上一篇：散熱器安裝裝置及散熱器總成的制作方法
上一篇：一種飼料廠飼料卸料裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

一種緩存使用優(yōu)化方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程