基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法

文檔序號：9433180閱讀：2353來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)，特別是涉及一種基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法。
【背景技術(shù)】
[0002] 近幾年來，深度卷積神經(jīng)網(wǎng)絡(luò)在計算機(jī)視覺、語音處理、機(jī)器學(xué)習(xí)等眾多領(lǐng)域取得了巨大的突破，顯著地提高了機(jī)器算法在圖像分類、目標(biāo)檢測和語音識別等多個任務(wù)中的性能，并且在互聯(lián)網(wǎng)、視頻監(jiān)控等行業(yè)中得到了廣泛應(yīng)用。
[0003] 深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程，是基于大規(guī)模的含有人工標(biāo)注信息的數(shù)據(jù)集，對網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí)與調(diào)整。一般而言，大容量、高復(fù)雜度的深度卷積網(wǎng)絡(luò)可以更全面地對數(shù) 據(jù)進(jìn)行學(xué)習(xí)，從而取得更好的性能指標(biāo)。但是，隨著網(wǎng)絡(luò)層數(shù)與參數(shù)數(shù)量的增加，運(yùn)算和存儲代價都會大幅增長，因此目前來說，卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與測試大多只能在高性能的計算集群上進(jìn)行。
[0004] 另一方面，移動互聯(lián)網(wǎng)技術(shù)在近年取得了長足進(jìn)步，在實(shí)際生活中的應(yīng)用也越來越廣泛。在移動互聯(lián)網(wǎng)的應(yīng)用場景下，用戶所使用的設(shè)備，例如手機(jī)或者平板電腦，其運(yùn)算與存儲能力都十分有限。雖然深度卷積神經(jīng)網(wǎng)絡(luò)可以在計算集群上進(jìn)行訓(xùn)練，但是在移動平臺應(yīng)用場景下，網(wǎng)絡(luò)模型的測試過程仍需要在移動設(shè)備上進(jìn)行，這就提出了兩個挑戰(zhàn)：如何降低卷積神經(jīng)網(wǎng)絡(luò)的測試用時，以及如何壓縮網(wǎng)絡(luò)模型的存儲開銷。
[0005] 針對卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮問題，已有一些有效的算法被提出。這些算法是將網(wǎng)絡(luò)中的某一層分解為復(fù)雜度較低的若干層的組合，以達(dá)到降低運(yùn)算或者存儲代價的目的。然而，這些算法并沒有同時考慮卷積神經(jīng)網(wǎng)絡(luò)的加速和壓縮，并且只在網(wǎng)絡(luò)的少數(shù)幾層上進(jìn)行了測試，對于整個網(wǎng)絡(luò)模型的加速或壓縮效果還有待研究。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法，可以實(shí)現(xiàn)深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮。
[0007] 根據(jù)本發(fā)明的一方面，提供一種基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法，包括：對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值；根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖。
[0008] 本發(fā)明實(shí)施例提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法，通過對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行量化得到多個子碼本和多個子碼本分別對應(yīng)的索引值，根據(jù)多個子碼本和多個子碼本分別對應(yīng)的索引值獲取深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖，從而可以實(shí)現(xiàn)深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮。
【附圖說明】
[0009] 圖1為本發(fā)明實(shí)施例提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法流程圖；
[0010] 圖2為本發(fā)明實(shí)施例提供的深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類過程示意圖；
[0011] 圖3為本發(fā)明實(shí)施例提供的全連接層的參數(shù)量化過程示意圖；
[0012] 圖4為本發(fā)明實(shí)施例提供的全連接層的高效運(yùn)行過程示意圖。
【具體實(shí)施方式】
[0013] 下面結(jié)合附圖對本發(fā)明實(shí)施例提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法進(jìn)行詳細(xì)描述。
[0014] 圖1為本發(fā)明實(shí)施例提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法流程圖。
[0015] 參照圖1，在步驟S101，對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值。
[0016] 在步驟S102,根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖。
[0017] 這里，深度卷積神經(jīng)網(wǎng)絡(luò)包括多個卷積層或多個全連接層，將多個卷積層的參數(shù) 或多個全連接層的參數(shù)進(jìn)行量化，并根據(jù)量化后的多個卷積層或多個全連接層獲取各自對應(yīng)的輸出的特征圖，具體可參照圖2。
[0018] 進(jìn)一步地，所述深度卷積神經(jīng)網(wǎng)絡(luò)為多個卷積層，所述對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值包括，重復(fù)執(zhí)行以下處理，直至多個卷積層都被遍歷：
[0019] 將所述卷積層的參數(shù)分割成M組，每組包括多個第一參數(shù)子向量，其中，M為正整數(shù)；
[0020] 對所述每組的多個第一參數(shù)子向量分別進(jìn)行K均值聚類得到所述每組對應(yīng)的第一子碼本，所述第一子碼本包括多個第一碼字；
[0021] 分別計算所述多個第一參數(shù)子向量與所述多個第一碼字的歐氏距離；
[0022] 獲取所述歐氏距離最小的第一參數(shù)子向量和第一碼字，并記錄所述歐氏距離最小的第一碼字的索引值。
[0023] 這里，卷積層的參數(shù)可以是，但不限于，具體為WkXHkXC sXCt的四階數(shù)組，其中Wk是卷積核的寬度，Hk是卷積核的高度，C s是輸入的第一特征圖的通道數(shù)，C ,是輸出的第一特征圖的通道數(shù)。將Cs所在維度均勻地分為M組，每組的維度為[Cs/M](若維度不足，則在最后一組中補(bǔ)零），這樣就可以將卷積層的參數(shù)分為M組，每組包含Wk X Hk X Ct個第一參數(shù)子向量。
[0024] 對每組的Wk X Hk X Ct個第一參數(shù)子向量分別進(jìn)行K均值聚類得到每組對應(yīng)的第一子碼本，其中，K為正整數(shù)，K為第一子碼本中的第一碼字的數(shù)量。
[0025] 進(jìn)一步地，所述深度卷積神經(jīng)網(wǎng)絡(luò)為多個全連接層，所述對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值包括，重復(fù)執(zhí)行以下處理，直至多個全連接層都被遍歷：
[0026] 將所述全連接層的參數(shù)分割成M組，每組包括多個第二參數(shù)子向量；
[0027] 對所述多個第二參數(shù)子向量分別進(jìn)行K均值聚類得到所述每組對應(yīng)的第二子碼本，所述第二子碼本包括多個第二碼字；
[0028] 分別計算所述多個第二參數(shù)子向量與所述多個第二碼字的歐氏距離；
[0029] 獲取所述歐氏距離最小的第二參數(shù)子向量和第二碼字，并記錄所述歐氏距離最小的第二碼字的索引值。
[0030] 這里，全連接層參數(shù)可以是，但不限于，具體為CtXCs的矩陣，其中C s是輸入層的節(jié)點(diǎn)數(shù)，Ct是輸出層的節(jié)點(diǎn)數(shù)。將Cs所在維度均勻地分為M組，每段的維度為[Cs/M](若維度不足，則在最后一段中補(bǔ)零），這樣就可以將全連接層的參數(shù)分為M組，每組包含Ct個第二參數(shù)子向量。
[0031] 在劃分完的M組第二參數(shù)子向量中，分別進(jìn)行K均值聚類獲取每組對應(yīng)的第二子碼本，其中，K為正整數(shù)，K為第二子碼本中的第二碼字的數(shù)量。
[0032] 進(jìn)一步地，所述深度卷積神經(jīng)網(wǎng)絡(luò)為所述多個卷積層，所述根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖包括，重復(fù)執(zhí)行以下處理，直至所述多個卷積層都被遍歷：
[0033] 輸入第一特征圖；
[0034] 將所述第一特征圖分割為M組，所述每組包括多個第一特征子向量；
[0035] 將所述多個第一特征子向量分別與所述每組對應(yīng)的第一子碼本中的多個第一碼字進(jìn)行內(nèi)積運(yùn)算得到多個第一運(yùn)算結(jié)果，并將所述多個第一運(yùn)算結(jié)果存儲在第一查找表中；
[0036] 將所述多個第一運(yùn)算結(jié)果進(jìn)行求和得到輸出的第一特征圖。
[0037] 這里，輸入第一特征圖，第一特征圖可以是，但不限于，具體SWsXHsXC s的三階數(shù) 組，其中，Ws是輸入特征圖的寬度，H s是輸入特征圖的高度。將C s所在維度均勻地分為M組，每組的維度為[Cs/M](若維度不足，則在最后一段中補(bǔ)零），這樣就可以將卷積層中的第一特征圖分為M組，每組包含Ws X Hs個第一特征子向量。
[0038] 對于卷積層，輸出的第一特征圖中的

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：程健;吳家祥;冷聰;盧漢清;
技術(shù)所有人：中國科學(xué)院自動化研究所;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)模型相關(guān)技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)代碼相關(guān)技術(shù)

dcnn深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

深度卷積多層神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

基于深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法