基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法_2

文檔序號：9433180閱讀：來源：國知局

某一節(jié)點的響應(yīng)值，是輸入第一特征圖中對應(yīng)空間區(qū)域內(nèi)的各個位置上所有節(jié)點的響應(yīng)值構(gòu)成的向量，與對應(yīng)的卷積核中各個位置上所有連接權(quán)重構(gòu)成的向量的內(nèi)積之和，由公式（1)可知：
[0040] 其中，G是輸出的第一特征圖，G (ct，wt，ht)為其中第Ct個第一特征圖上空間位置為 (wt, ht)的節(jié)點，W為卷積核，胃e,，wk, hk為該卷積核中的第C/h卷積核，對應(yīng)輸出的第一特征圖G中的第Ct個第一特征圖中空間位置為（wk，hk)的參數(shù)向量，F(xiàn)是輸入的第一特征圖，F(xiàn)、、，hs表示其中的空間位置為（ws，hs)的特征向量。
[0041] 這些內(nèi)積可以拆分為多個子向量的內(nèi)積之和，即將多個第一特征子向量分別與每組對應(yīng)的第一子碼本中的多個第一碼字進行內(nèi)積運算得到多個第一運算結(jié)果，將所述多個第一運算結(jié)果進行求和得到輸出的第一特征圖，具體由公式（2)可知：并將多個第一運算結(jié)果存儲在第一查找表中，第一查找表的大小SWsXHsXMXK。 CN 105184362 A 說明書 4/5 頁
[_]其中，礦;1:%為第一參數(shù)子向量，^，Ai中的第m個子向量，為第一特征子向量P1w 中的第m個子向量；Cw為第m個第一子碼本，第一參數(shù)子向量l^im) ^的量化索引值，;)為對第一參數(shù)子向量PF(m) 1進行量化時句為美 ^ V WtA rr CnWk 所用的第一碼字。
[0044] 進一步地，所述深度卷積神經(jīng)網(wǎng)絡(luò)為所述多個全連接層，所述根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖包括，重復執(zhí)行以下處理，直至多個全連接層都被遍歷：
[0045] 輸入第二特征圖；
[0046] 將所述第二特征圖分割為M組，所述每組包括第二特征子向量；
[0047] 將所述第二特征子向量與所述每組對應(yīng)的第二子碼本中的多個第二碼字進行內(nèi) 積運算得到多個第二運算結(jié)果，并將所述多個第二運算結(jié)果存儲在第二查找表中；
[0048] 將所述多個第二運算結(jié)果進行求和得到輸出的第二特征圖。
[0049] 這里，輸入第二特征圖，第二特征圖可以是，但不限于，具體SCsXl的列向量。將 Cs所在維度均勻地分為M組，每段的維度為[C S/M](若維度不足，則在最后一段中補零），這樣就可以將全連接層中的第二特征圖分為M組，每組包含1個第二特征子向量。
[0050] 在劃分完的M組特征子向量中，分別計算每個特征子向量與對應(yīng)子碼本中所有碼字的內(nèi)積，保存在一個查找表中。對于全連接層，該查找表的大小為MX K。
[0051 ] 對于全連接層，第二特征圖中的某一節(jié)點的響應(yīng)值是第二特征圖中所有節(jié)點的響應(yīng)值構(gòu)成的向量，與對應(yīng)的連接權(quán)向量的內(nèi)積，具體由公式（3)可知：
[0053] 其中，G為輸出的第二特征圖，G(Ct)為第(^個節(jié)點，W為連接權(quán)矩陣，胃^為該矩陣中的第(^行（對應(yīng)輸出特征圖中的第c t個節(jié)點），即第二參數(shù)子向量，F(xiàn)為第二特征圖，即特征向量。
[0054] 這個內(nèi)積可以拆分為多個子向量的內(nèi)積之和，即將所述第二特征子向量與所述每組對應(yīng)的第二子碼本中的多個第二碼字進行內(nèi)積運算得到多個第二運算結(jié)果，并將所述多個第二運算結(jié)果存儲在第二查找表中；將所述多個第二運算結(jié)果進行求和得到輸出的第二特征圖，具體由公式⑷可知：
[0056] 其中，為第二參數(shù)子向量中的第m個第二參數(shù)子向量，F(xiàn)w為第二特 ? m 征子向量F中的第m個第二特征子向量，Cm為第m個第二子碼本為第二參數(shù)子向量 ^的量化索引值，em(m)為對第二參數(shù)子向量進行量化時所用的第二碼字。
[0057] 對于卷積層和全連接層，近似后的計算過程都可按照參數(shù)子向量的量化索引值，直接從查找表中獲得對應(yīng)的內(nèi)積值，而不需要重復計算內(nèi)積，因此可以顯著地降低運算開銷，提尚運彳丁速度。
[0058] 以上所述，僅為本發(fā)明的【具體實施方式】，但本發(fā)明的保護范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此，本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。
【主權(quán)項】
1. 一種基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法，其特征在于，所述方法包括：對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值；根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng) 絡(luò)的輸出的特征圖。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述深度卷積神經(jīng)網(wǎng)絡(luò)為多個卷積層，所述對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值包括，重復執(zhí)行以下處理，直至所述多個卷積層都被遍歷：將所述卷積層的參數(shù)分割成M組，每組包括多個第一參數(shù)子向量，其中，M為正整數(shù)；對所述每組的多個第一參數(shù)子向量分別進行K均值聚類得到所述每組對應(yīng)的第一子碼本，所述第一子碼本包括多個第一碼字；分別計算所述多個第一參數(shù)子向量與所述多個第一碼字的歐氏距離；獲取所述歐氏距離最小的第一參數(shù)子向量和第一碼字，并記錄所述歐氏距離最小的第一碼字的索引值。3. 根據(jù)權(quán)利要求2所述的方法，其特征在于，所述深度卷積神經(jīng)網(wǎng)絡(luò)為多個全連接層，所述對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進行量化得到多個子碼本和所述多個子碼本分別對應(yīng)的索引值包括，重復執(zhí)行以下處理，直至所述多個全連接層都被遍歷：將所述全連接層的參數(shù)分割成M組，每組包括多個第二參數(shù)子向量；對所述多個第二參數(shù)子向量分別進行K均值聚類得到所述每組對應(yīng)的第二子碼本，所述第二子碼本包括多個第二碼字；分別計算所述多個第二參數(shù)子向量與所述多個第二碼字的歐氏距離；獲取所述歐氏距離最小的第二參數(shù)子向量和第二碼字，并記錄所述歐氏距離最小的第二碼字的索引值。4. 根據(jù)權(quán)利要求3所述的方法，其特征在于，所述深度卷積神經(jīng)網(wǎng)絡(luò)為所述多個卷積層，所述根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng) 網(wǎng)絡(luò)的輸出的特征圖包括，重復執(zhí)行以下處理，直至所述多個卷積層都被遍歷：輸入第一特征圖；將所述第一特征圖分割為M組，所述每組包括多個第一特征子向量；將所述多個第一特征子向量分別與所述每組對應(yīng)的第一子碼本中的多個第一碼字進行內(nèi)積運算得到多個第一運算結(jié)果，并將所述多個第一運算結(jié)果存儲在第一查找表中；將所述多個第一運算結(jié)果進行求和得到輸出的第一特征圖。5. 根據(jù)權(quán)利要求4所述的方法，其特征在于，所述深度卷積神經(jīng)網(wǎng)絡(luò)為所述多個全連接層，所述根據(jù)所述多個子碼本和所述多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖包括，重復執(zhí)行以下處理，直至所述多個全連接層都被遍歷：輸入第二特征圖；將所述第二特征圖分割為M組，所述每組包括第二特征子向量；將所述第二特征子向量與所述每組對應(yīng)的第二子碼本中的多個第二碼字進行內(nèi)積運算得到多個第二運算結(jié)果，并將所述多個第二運算結(jié)果存儲在第二查找表中；將所述多個第二運算結(jié)果進行求和得到輸出的第二特征圖。
【專利摘要】本發(fā)明提供的基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法，包括：對深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進行量化得到多個子碼本和多個子碼本分別對應(yīng)的索引值；根據(jù)多個子碼本和多個子碼本分別對應(yīng)的索引值獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)的輸出的特征圖。本發(fā)明可以實現(xiàn)深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮。
【IPC分類】G06N3/02
【公開號】CN105184362
【申請?zhí)枴緾N201510518900
【發(fā)明人】程健, 吳家祥, 冷聰, 盧漢清
【申請人】中國科學院自動化研究所
【公開日】2015年12月23日
【申請日】2015年8月21日

完整全部詳細技術(shù)資料下載

當前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)模型相關(guān)技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)代碼相關(guān)技術(shù)

dcnn深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

深度卷積多層神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

基于深度卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于參數(shù)量化的深度卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法_2