一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法

文檔序號：40405790發(fā)布日期：2024-12-20 12:29閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法，屬于邊緣計(jì)算。

背景技術(shù)：

1、卷積神經(jīng)網(wǎng)絡(luò)（convolutional?neural?networks，簡稱cnn）模型是一種普遍應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域的深度學(xué)習(xí)模型，已經(jīng)在圖像識別、目標(biāo)檢測、圖像生成和許多其他領(lǐng)域取得了顯著的進(jìn)展，成為計(jì)算機(jī)視覺和深度學(xué)習(xí)研究的重要組成部分。

2、傳統(tǒng)的cnn模型的執(zhí)行通常分為訓(xùn)練與推理兩個(gè)階段，訓(xùn)練階段是cnn模型學(xué)習(xí)從輸入數(shù)據(jù)中提取特征并做出準(zhǔn)確預(yù)測或分類的過程，通過大量已標(biāo)注的數(shù)據(jù)學(xué)習(xí)識別模式和特征，讓模型能夠從輸入數(shù)據(jù)中準(zhǔn)確地提取重要特征，并根據(jù)這些特征做出正確的預(yù)測或分類。而推理階段，由于cnn模型所需要計(jì)算量的龐大，傳統(tǒng)的架構(gòu)是以云為中心的范式，從而使得計(jì)算資源受限的邊緣設(shè)備能夠使用此類服務(wù)。大量的數(shù)據(jù)在邊緣設(shè)備中產(chǎn)生，通過網(wǎng)絡(luò)傳輸給性能強(qiáng)大的云服務(wù)器，在云服務(wù)器上進(jìn)行模型的推理，然后把推理的結(jié)果再回傳給邊緣設(shè)備，但是這種方法高度依賴于網(wǎng)絡(luò)環(huán)境且存在顯著的時(shí)延。例如，在自動(dòng)駕駛領(lǐng)域，目前先進(jìn)的自動(dòng)駕駛技術(shù)所使用的傳感器每秒鐘可以產(chǎn)生幾百到幾千兆比特的數(shù)據(jù)，然而廣泛使用的5g網(wǎng)絡(luò)的平均上行速率僅幾十mbps。在以云為中心的架構(gòu)下，不可避免地存在著網(wǎng)絡(luò)帶寬的負(fù)載問題，并且模型推理時(shí)延過長對于如自動(dòng)駕駛、智能醫(yī)療設(shè)備等需要實(shí)時(shí)獲得響應(yīng)的應(yīng)用來說影響顯著。

3、近年來，邊云設(shè)備之間的協(xié)同推理方法被廣泛研究，例如，可以通過模型分割技術(shù)，將cnn模型根據(jù)邊緣設(shè)備和云設(shè)備的計(jì)算能力以及網(wǎng)絡(luò)帶寬分割為兩部分，然后部署在異構(gòu)的兩層設(shè)備上。對于常見的cnn模型，各層所需的計(jì)算量以及輸出數(shù)據(jù)的大小存在著顯著差異。模型的中間層的計(jì)算量要求較高，且相鄰層之間的計(jì)算量存在顯著差異，而后面層的輸出數(shù)據(jù)大小遠(yuǎn)小于前面層的輸出數(shù)據(jù)的大小?，F(xiàn)有技術(shù)采用模型分割方法并沒有考慮到算法實(shí)際應(yīng)用到計(jì)算資源受限的邊緣設(shè)備上，做出分割決策所需要的龐大計(jì)算量，使得當(dāng)模型層數(shù)較多結(jié)構(gòu)復(fù)雜時(shí)獲得分割決策的決策時(shí)間過長，限制了需要實(shí)時(shí)響應(yīng)服務(wù)的應(yīng)用。

4、另一種被廣泛研究的協(xié)同推理方法是模型壓縮，旨在通過模型壓縮技術(shù)減少模型的復(fù)雜性，并將壓縮后的完整模型部署在資源受限的端或邊緣設(shè)備上。目前廣泛使用的模型壓縮技術(shù)有：剪枝、量化、早期退出、知識蒸餾、低秩分解和稀疏表示等，然而現(xiàn)有技術(shù)中的模型壓縮關(guān)注于對整個(gè)模型的壓縮，會(huì)導(dǎo)致在資源有限的邊緣設(shè)備上帶來不可忽略的推理精度缺失，特別是對于結(jié)構(gòu)緊湊的cnn模型。此外，整個(gè)模型的壓縮推理加速可能需要專門設(shè)計(jì)的硬件支持，一般的邊緣設(shè)備難以滿足。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足，提供一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法，提高協(xié)同推理決策，優(yōu)化傳輸時(shí)延。

2、為達(dá)到上述目的，本發(fā)明所采用的技術(shù)方案是：

3、第一方面，本發(fā)明提供一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法，基于由邊緣設(shè)備與云服務(wù)器構(gòu)成的邊-云協(xié)同推理系統(tǒng)，卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法包括：

4、獲取給定的訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)模型的模型結(jié)構(gòu)與數(shù)據(jù)流動(dòng)方向，將卷積神經(jīng)網(wǎng)絡(luò)模型轉(zhuǎn)換為有向無環(huán)圖，并基于邊緣設(shè)備與云服務(wù)器協(xié)同推理時(shí)的時(shí)延模型，構(gòu)建邊-云協(xié)同推理系統(tǒng)的目標(biāo)函數(shù)與約束條件；

5、基于邊-云協(xié)同推理系統(tǒng)的目標(biāo)函數(shù)與約束條件，及最小割理論進(jìn)行分割決策時(shí)所需的相關(guān)數(shù)據(jù)，在邊-云協(xié)同推理系統(tǒng)執(zhí)行給定的卷積神經(jīng)網(wǎng)絡(luò)模型，獲得卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)；

6、基于卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)，對有向無環(huán)圖合并節(jié)點(diǎn)，獲得規(guī)模優(yōu)化后的有向無環(huán)圖；對卷積神經(jīng)網(wǎng)絡(luò)模型各層輸出數(shù)據(jù)進(jìn)行預(yù)量化，減少層間傳輸時(shí)延，在規(guī)模優(yōu)化后的有向無環(huán)圖基礎(chǔ)上，根據(jù)各層在異構(gòu)設(shè)備上的執(zhí)行時(shí)延以及預(yù)量化后的各層輸出數(shù)據(jù)的傳輸時(shí)延，構(gòu)建預(yù)量化后的時(shí)延圖；

7、基于最高標(biāo)號預(yù)推送算法，計(jì)算時(shí)延圖中源點(diǎn)到匯點(diǎn)的最小割，并對最小割集中的割點(diǎn)進(jìn)行實(shí)際模型壓縮，獲得給定卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上協(xié)同推理決策。

8、結(jié)合第一方面，進(jìn)一步的，所述有向無環(huán)圖表示為：

9、，

10、式中， g表示根據(jù)給定的卷積神經(jīng)網(wǎng)絡(luò)模型的模型結(jié)構(gòu)與數(shù)據(jù)流動(dòng)方向構(gòu)建的有向無環(huán)圖，，表示卷積神經(jīng)網(wǎng)絡(luò)模型的層，表示模型的各層；表示有數(shù)據(jù)依賴的層之間關(guān)系的集合，即有向無環(huán)圖中的邊，中的一個(gè)元素，表示層與層之間存在數(shù)據(jù)依賴，數(shù)據(jù)由層流向?qū)樱?

11、所述時(shí)延模型表示為：

12、，

13、式中，表示卷積神經(jīng)網(wǎng)絡(luò)模型在邊緣設(shè)備與云服務(wù)器上協(xié)同推理的總時(shí)延， t e表示卷積神經(jīng)網(wǎng)絡(luò)模型中部署在邊緣設(shè)備上的模型層的推理時(shí)延之和， t c表示需要傳輸數(shù)據(jù)層的傳輸數(shù)據(jù)總和的傳輸時(shí)延， t t表示卷積神經(jīng)網(wǎng)絡(luò)模型中部署在云服務(wù)器上的模型層的推理時(shí)延之和。

14、進(jìn)一步的，卷積神經(jīng)網(wǎng)絡(luò)模型中部署在邊緣設(shè)備上的模型層的推理時(shí)延之和表示為：

15、，

16、需要傳輸數(shù)據(jù)層的傳輸數(shù)據(jù)總和的傳輸時(shí)延表示為：

17、，

18、卷積神經(jīng)網(wǎng)絡(luò)模型中部署在云服務(wù)器上的模型層的推理時(shí)延之和表示為：

19、，

20、式中，表示卷積神經(jīng)網(wǎng)絡(luò)模型第層在邊緣設(shè)備上的推理時(shí)間， v i表示卷積神經(jīng)網(wǎng)絡(luò)模型中的模型層，表示卷積神經(jīng)網(wǎng)絡(luò)模型中需要部署在邊緣設(shè)備上的模型層；表示卷積神經(jīng)網(wǎng)絡(luò)模型第層在云服務(wù)器上的推理時(shí)間，表示卷積神經(jīng)網(wǎng)絡(luò)模型中需要部署在云服務(wù)器上的模型層；表示中需要傳輸數(shù)據(jù)到云服務(wù)器的層的集合，表示需要傳輸數(shù)據(jù)層的輸出數(shù)據(jù)大小，表示邊緣設(shè)備與云服務(wù)器之間的數(shù)據(jù)傳輸速率。

21、進(jìn)一步的，所述目標(biāo)函數(shù)為：

22、，

23、式中，表示卷積神經(jīng)網(wǎng)絡(luò)模型中需要部署在邊緣設(shè)備上的模型層，表示卷積神經(jīng)網(wǎng)絡(luò)模型中需要部署在云服務(wù)器上的模型層， argmin?t total表示能夠使得最小的，表示卷積神經(jīng)網(wǎng)絡(luò)模型在邊緣設(shè)備與云服務(wù)器上協(xié)同推理的總時(shí)延；

24、約束條件為：

25、，

26、，

27、式中， v表示卷積神經(jīng)網(wǎng)絡(luò)模型的所有層，對于給定卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理決策，需要在邊緣設(shè)備上進(jìn)行推理的模型層與需要在云設(shè)備上進(jìn)行推理的模型層的并集；表示需要部署在邊緣設(shè)備上的層與需要部署在云服務(wù)器上的層不能有重復(fù)的層。

28、進(jìn)一步的，獲得卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)，包括：

29、步驟s1：在卷積神經(jīng)網(wǎng)絡(luò)模型的各層上注冊鉤子，獲取鉤子在各層激活時(shí)執(zhí)行該層所需的時(shí)間與各層的輸出數(shù)據(jù)大小；

30、步驟s2：在邊緣設(shè)備和云服務(wù)器上，卷積神經(jīng)網(wǎng)絡(luò)模型多次執(zhí)行步驟s1，獲得卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的平均執(zhí)行該層所需的時(shí)間為執(zhí)行時(shí)延，以及各層的輸出數(shù)據(jù)。

31、進(jìn)一步的，構(gòu)建預(yù)量化后的時(shí)延圖，包括：

32、基于卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)，對有向無環(huán)圖合并連續(xù)的輸入數(shù)據(jù)大小相同的層，獲得規(guī)模優(yōu)化后的有向無環(huán)圖；

33、基于動(dòng)態(tài)量化技術(shù)對卷積神經(jīng)網(wǎng)絡(luò)模型各層輸出數(shù)據(jù)進(jìn)行預(yù)量化，統(tǒng)計(jì)卷積神經(jīng)網(wǎng)絡(luò)模型各層預(yù)量化至int8位后輸出數(shù)據(jù)的大?。?/p>

34、基于卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)、規(guī)模優(yōu)化后有向無環(huán)圖以及各層預(yù)量化至int8位后輸出數(shù)據(jù)的大小，構(gòu)建預(yù)量化后的時(shí)延圖。

35、進(jìn)一步的，基于卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)、規(guī)模優(yōu)化后有向無環(huán)圖以及各層預(yù)量化至int8位后輸出數(shù)據(jù)的大小，構(gòu)建預(yù)量化后的時(shí)延圖，包括：

36、對規(guī)模優(yōu)化后的有向無環(huán)圖，添加特殊節(jié)點(diǎn)“”，“”和“”，分別代表時(shí)延圖的入口、出口點(diǎn)以及原始數(shù)據(jù)約束；

37、根據(jù)添加了特殊節(jié)點(diǎn)的有向無環(huán)圖中，遍歷所有除“”和“”之外的節(jié)點(diǎn)，設(shè)置或更新從“”到每個(gè)節(jié)點(diǎn)以及從每個(gè)節(jié)點(diǎn)到“”的邊的容量屬性，獲得設(shè)置了各層執(zhí)行時(shí)延的有向無環(huán)圖；

38、對于設(shè)置了各層執(zhí)行時(shí)延的有向無環(huán)圖中所有未設(shè)置capacity屬性的邊，根據(jù)上游節(jié)點(diǎn)的預(yù)量化后輸出數(shù)據(jù)和提供的帶寬計(jì)算傳輸時(shí)延；將傳輸時(shí)延分配為邊的容量，獲得設(shè)置了各層執(zhí)行時(shí)延與預(yù)量化后傳輸時(shí)延的有向無環(huán)圖；

39、在設(shè)置了各層執(zhí)行時(shí)延與預(yù)量化后傳輸時(shí)延的有向無環(huán)圖的基礎(chǔ)上，對具有多個(gè)后繼的特殊節(jié)點(diǎn)，去除當(dāng)前特殊節(jié)點(diǎn)連向后繼節(jié)點(diǎn)的邊，添加中間節(jié)點(diǎn)，連接當(dāng)前節(jié)點(diǎn)與中間節(jié)點(diǎn)，并把容量設(shè)置為當(dāng)前節(jié)點(diǎn)在網(wǎng)絡(luò)帶寬下的傳輸時(shí)延并預(yù)量化至int8水平；連接中間節(jié)點(diǎn)和當(dāng)前節(jié)點(diǎn)的后繼節(jié)點(diǎn)，設(shè)置邊的容量值為無窮大，獲得對特殊節(jié)點(diǎn)處理后的有向無環(huán)圖；

40、在對特殊節(jié)點(diǎn)處理后的有向無環(huán)圖基礎(chǔ)上，連接“”到“ o”、“ o”到“”和“ o”到計(jì)算的第一層的邊，獲得最終的時(shí)延圖。

41、進(jìn)一步的，所述特殊節(jié)點(diǎn)“”，“”和“”節(jié)點(diǎn)的時(shí)延和輸出大小設(shè)置為0；邊的容量屬性被設(shè)置為存儲在每個(gè)節(jié)點(diǎn)的層信息中的云端或邊緣時(shí)延值，“ e”到“ o”的無限容量表示進(jìn)入沒有約束，“ o”到“ c”的零容量表示沒有時(shí)延，以及“ o”到第一層的容量為r，模擬目標(biāo)約束。

42、進(jìn)一步的，獲得給定卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上協(xié)同推理決策，包括：

43、基于最高標(biāo)號預(yù)推送算法，計(jì)算時(shí)延圖中源點(diǎn)到匯點(diǎn)的最大流，獲得包含最大流信息的殘余網(wǎng)絡(luò)；

44、基于殘余網(wǎng)絡(luò)，從源點(diǎn)出發(fā)遍歷所有可達(dá)的節(jié)點(diǎn)，識別出源點(diǎn)側(cè)的節(jié)點(diǎn)集合；

45、基于源點(diǎn)側(cè)的節(jié)點(diǎn)集合，獲得匯點(diǎn)側(cè)的節(jié)點(diǎn)集合；

46、根據(jù)殘余網(wǎng)絡(luò)中從到的所有邊，累加時(shí)延值，獲得當(dāng)前任務(wù)分配所能達(dá)到的最小總時(shí)延；

47、對于中需要傳輸數(shù)據(jù)到云服務(wù)器的模型層進(jìn)行動(dòng)態(tài)量化，完成給定卷積神經(jīng)網(wǎng)絡(luò)模型在邊-云協(xié)同推理系統(tǒng)的全部流程。

48、第二方面，本發(fā)明提供一種計(jì)算機(jī)可讀存儲介質(zhì)，其上存儲有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)，實(shí)現(xiàn)上述任一所述的一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法。

49、與現(xiàn)有技術(shù)相比，本發(fā)明所達(dá)到的有益效果：

50、本發(fā)明基于卷積神經(jīng)網(wǎng)絡(luò)模型在異構(gòu)設(shè)備上各層的執(zhí)行時(shí)延以及各層輸出數(shù)據(jù)，對有向無環(huán)圖合并節(jié)點(diǎn)，獲得規(guī)模優(yōu)化后的有向無環(huán)圖；在不改變模型結(jié)構(gòu)的前提下，優(yōu)化了由cnn模型轉(zhuǎn)化而來的原始模型圖的規(guī)模，顯著優(yōu)化了使用最小割對于基于該圖基礎(chǔ)上構(gòu)建的預(yù)量化后的時(shí)延圖獲得決策所需要的決策時(shí)間；

51、本發(fā)明對卷積神經(jīng)網(wǎng)絡(luò)模型各層輸出數(shù)據(jù)進(jìn)行預(yù)量化，減少層間傳輸時(shí)延，在規(guī)模優(yōu)化后的有向無環(huán)圖基礎(chǔ)上，根據(jù)各層在異構(gòu)設(shè)備上的執(zhí)行時(shí)延以及預(yù)量化后的各層輸出數(shù)據(jù)的傳輸時(shí)延，構(gòu)建時(shí)延圖；本發(fā)明通過引入模型量化技術(shù)，能夠充分利用異構(gòu)系統(tǒng)資源，使得決策算法不易傾向于單端執(zhí)行策略，且在維持模型精度的前提下，減少cnn模型分割后協(xié)同推理時(shí)的傳輸成本。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：程勇,李茂文
技術(shù)所有人：南京信息工程大學(xué)
我是此專利的發(fā)明人

上一篇：一種柔性電路板貼合用基材涂膠裝置的制作方法
上一篇：自鎖緊扶手鎖的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種邊云環(huán)境下卷積神經(jīng)網(wǎng)絡(luò)模型的協(xié)同推理方法