本發(fā)明涉及圖像處理領域,特別是涉及一種多標簽圖像分類方法、裝置、可讀存儲介質及電子設備。
背景技術:
1、在計算機視覺領域中,圖像分類技術一直是研究的熱點。傳統(tǒng)的圖像分類任務關注于識別圖像中的單一類別。這種分類方式假設每張圖像有且只有一個類別,并將其歸類于一個互斥的類別標簽中。
2、然而,現(xiàn)實世界中的圖像往往包含多個類別的物體,這些物體可能屬于不同的類別,構成了多標簽圖像分類問題的復雜性。在多標簽圖像分類任務中,模型需要預測圖像中所有存在的物體類別,輸出的結果是一個非互斥的類別屬性集合。
3、由于現(xiàn)實圖像中物體的多樣性和復雜性,僅依賴全局特征提取往往難以捕捉到所有的物體。同時,在圖像中還有更加難以捕捉的小目標區(qū)域。所以這種僅提取全局特征的方法在進行圖像分類時,容易出現(xiàn)模型漏檢問題。
技術實現(xiàn)思路
1、鑒于上述狀況,為了提高對小目標的精確識別,本發(fā)明提出了一種多標簽圖像分類方法、裝置、可讀存儲介質及電子設備。
2、本發(fā)明提供了一種多標簽圖像分類方法,包括,
3、將預處理后的圖像數據輸入至預訓練的卷積神經網絡模型中,并提取特征圖;
4、將提取的所述特征圖進行卷積操作,以得到類別激活圖;
5、確定所述類別激活圖中目標物的邊界框,并根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像;
6、采用雙線性插值法調整所述局部區(qū)域圖像為預設尺寸;
7、從提取出的所述局部區(qū)域圖像中篩選出小于閾值尺寸的局部區(qū)域圖像,并采用雙三次插值法將篩選出的圖像調整為預設尺寸;
8、將尺寸調整后的所述局部區(qū)域圖像輸入到所述卷積神經網絡模型中再次提取特征圖,并根據再次提取的特征圖進行圖像分類預測。
9、進一步的,上述多標簽圖像分類方法,其中,所述確定所述類別激活圖中目標物的邊界框的步驟包括:
10、對所述類別激活圖中每個類別區(qū)域的得分向量進行標準化;
11、通過比較標準化后的得分向量與設定閾值的大小,確定目標物的邊界框。
12、進一步的,上述多標簽圖像分類方法,其中,所述類別激活圖中每個類別區(qū)域的得分向量包括水平得分向量和豎直得分向量,水平得分向量為:
13、;
14、豎直得分向量為:
15、,
16、其中f為類別激活圖,i為類別激活圖中的第i個類別區(qū)域,x為類別激活圖中橫向坐標,y為類別激活圖中縱向坐標,h1和h2分別為類別激活圖的橫向和縱向長度。
17、進一步的,上述多標簽圖像分類方法,其中,所述根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像的步驟之后還包括:
18、確定各個所述局部區(qū)域圖像的中心位置坐標,并計算各個所述局部區(qū)域圖像的中心位置之間的歐式距離;
19、根據所有局部區(qū)域圖像的中心位置之間的歐式距離,建立目標物之間的空間關系;
20、所述根據再次提取的特征圖進行圖像分類預測的步驟包括:
21、將再次提取的特征圖與目標物之間的空間關系進行融合,根據融合結果確定圖像分類的預測結果。
22、本發(fā)明還公開了一種多標簽圖像分類裝置,包括:
23、特征提取模塊,用于將預處理后的圖像數據輸入至預訓練的卷積神經網絡模型中,并提取特征圖;
24、卷積模塊,用于將提取的所述特征圖進行卷積操作,以得到類別激活圖;
25、局部區(qū)域圖像提取模塊,用于確定所述類別激活圖中目標物的邊界框,并根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像;
26、第一圖像調整模塊,采用雙線性插值法調整所述局部區(qū)域圖像為預設尺寸;
27、第二圖像調整模塊,用于從提取出的所述局部區(qū)域圖像中篩選出小于閾值尺寸的局部區(qū)域圖像,并采用雙三次插值法將篩選出的圖像調整為預設尺寸;
28、圖像分類模塊,用于將尺寸調整后的所述局部區(qū)域圖像輸入到所述卷積神經網絡模型中再次提取特征圖,并根據再次提取的特征圖進行圖像分類預測。
29、進一步的,上述多標簽圖像分類裝置,其中,所述確定所述類別激活圖中目標物的邊界框的步驟包括:
30、對所述類別激活圖中每個類別區(qū)域的得分向量進行標準化;
31、通過比較標準化后的得分向量與設定閾值的大小,確定目標物的邊界框。
32、進一步的,上述多標簽圖像分類裝置,還包括:
33、計算模塊,用于確定各個所述局部區(qū)域圖像的中心位置坐標,并計算各個所述局部區(qū)域圖像的中心位置之間的歐式距離;
34、空間關系建立模塊,用于根據所有局部區(qū)域圖像的中心位置之間的歐式距離,建立目標物之間的空間關系;
35、所述根據再次提取的特征圖進行圖像分類預測的步驟包括:
36、將再次提取的特征圖與目標物之間的空間關系進行融合,根據融合結果確定圖像分類的預測結果。
37、本發(fā)明還公開了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)上述任一項所述的多標簽圖像分類方法。
38、本發(fā)明還公開了一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述任一項所述的多標簽圖像分類方法。
39、本發(fā)明通過雙線性和雙三次插值方法對小目標區(qū)域進行上采樣,獲得更豐富的特征信息,能夠更加準確地識別圖像中的小目標物體。
1.一種多標簽圖像分類方法,其特征在于,包括,
2.如權利要求1所述的多標簽圖像分類方法,其特征在于,所述確定所述類別激活圖中目標物的邊界框的步驟包括:
3.如權利要求2所述的多標簽圖像分類方法,其特征在于,所述類別激活圖中每個類別區(qū)域的得分向量包括水平得分向量和豎直得分向量,水平得分向量為:
4.如權利要求1所述的多標簽圖像分類方法,其特征在于,所述根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像的步驟之后還包括:
5.一種多標簽圖像分類裝置,其特征在于,包括:
6.如權利要求5所述的多標簽圖像分類裝置,其特征在于,所述確定所述類別激活圖中目標物的邊界框的步驟包括:
7.如權利要求5所述的多標簽圖像分類裝置,其特征在于,還包括:
8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權利要求1至4中任一項所述的多標簽圖像分類方法。
9.一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至4中任一項所述的多標簽圖像分類方法。