多標簽圖像分類方法、裝置、可讀存儲介質及電子設備

文檔序號：40392173發(fā)布日期：2024-12-20 12:15閱讀：7來源：國知局

導航： X技術> 最新專利>計算;推算;計數設備的制造及其應用技術

本發(fā)明涉及圖像處理領域，特別是涉及一種多標簽圖像分類方法、裝置、可讀存儲介質及電子設備。

背景技術：

1、在計算機視覺領域中，圖像分類技術一直是研究的熱點。傳統(tǒng)的圖像分類任務關注于識別圖像中的單一類別。這種分類方式假設每張圖像有且只有一個類別，并將其歸類于一個互斥的類別標簽中。

2、然而，現(xiàn)實世界中的圖像往往包含多個類別的物體，這些物體可能屬于不同的類別，構成了多標簽圖像分類問題的復雜性。在多標簽圖像分類任務中，模型需要預測圖像中所有存在的物體類別，輸出的結果是一個非互斥的類別屬性集合。

3、由于現(xiàn)實圖像中物體的多樣性和復雜性，僅依賴全局特征提取往往難以捕捉到所有的物體。同時，在圖像中還有更加難以捕捉的小目標區(qū)域。所以這種僅提取全局特征的方法在進行圖像分類時，容易出現(xiàn)模型漏檢問題。

技術實現(xiàn)思路

1、鑒于上述狀況，為了提高對小目標的精確識別，本發(fā)明提出了一種多標簽圖像分類方法、裝置、可讀存儲介質及電子設備。

2、本發(fā)明提供了一種多標簽圖像分類方法，包括，

3、將預處理后的圖像數據輸入至預訓練的卷積神經網絡模型中，并提取特征圖；

4、將提取的所述特征圖進行卷積操作，以得到類別激活圖；

5、確定所述類別激活圖中目標物的邊界框，并根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像；

6、采用雙線性插值法調整所述局部區(qū)域圖像為預設尺寸；

7、從提取出的所述局部區(qū)域圖像中篩選出小于閾值尺寸的局部區(qū)域圖像，并采用雙三次插值法將篩選出的圖像調整為預設尺寸；

8、將尺寸調整后的所述局部區(qū)域圖像輸入到所述卷積神經網絡模型中再次提取特征圖，并根據再次提取的特征圖進行圖像分類預測。

9、進一步的，上述多標簽圖像分類方法，其中，所述確定所述類別激活圖中目標物的邊界框的步驟包括：

10、對所述類別激活圖中每個類別區(qū)域的得分向量進行標準化；

11、通過比較標準化后的得分向量與設定閾值的大小，確定目標物的邊界框。

12、進一步的，上述多標簽圖像分類方法，其中，所述類別激活圖中每個類別區(qū)域的得分向量包括水平得分向量和豎直得分向量，水平得分向量為：

13、；

14、豎直得分向量為：

15、，

16、其中f為類別激活圖，i為類別激活圖中的第i個類別區(qū)域，x為類別激活圖中橫向坐標，y為類別激活圖中縱向坐標，h1和h2分別為類別激活圖的橫向和縱向長度。

17、進一步的，上述多標簽圖像分類方法，其中，所述根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像的步驟之后還包括：

18、確定各個所述局部區(qū)域圖像的中心位置坐標，并計算各個所述局部區(qū)域圖像的中心位置之間的歐式距離；

19、根據所有局部區(qū)域圖像的中心位置之間的歐式距離，建立目標物之間的空間關系；

20、所述根據再次提取的特征圖進行圖像分類預測的步驟包括：

21、將再次提取的特征圖與目標物之間的空間關系進行融合，根據融合結果確定圖像分類的預測結果。

22、本發(fā)明還公開了一種多標簽圖像分類裝置，包括：

23、特征提取模塊，用于將預處理后的圖像數據輸入至預訓練的卷積神經網絡模型中，并提取特征圖；

24、卷積模塊，用于將提取的所述特征圖進行卷積操作，以得到類別激活圖；

25、局部區(qū)域圖像提取模塊，用于確定所述類別激活圖中目標物的邊界框，并根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像；

26、第一圖像調整模塊，采用雙線性插值法調整所述局部區(qū)域圖像為預設尺寸；

27、第二圖像調整模塊，用于從提取出的所述局部區(qū)域圖像中篩選出小于閾值尺寸的局部區(qū)域圖像，并采用雙三次插值法將篩選出的圖像調整為預設尺寸；

28、圖像分類模塊，用于將尺寸調整后的所述局部區(qū)域圖像輸入到所述卷積神經網絡模型中再次提取特征圖，并根據再次提取的特征圖進行圖像分類預測。

29、進一步的，上述多標簽圖像分類裝置，其中，所述確定所述類別激活圖中目標物的邊界框的步驟包括：

30、對所述類別激活圖中每個類別區(qū)域的得分向量進行標準化；

31、通過比較標準化后的得分向量與設定閾值的大小，確定目標物的邊界框。

32、進一步的，上述多標簽圖像分類裝置，還包括：

33、計算模塊，用于確定各個所述局部區(qū)域圖像的中心位置坐標，并計算各個所述局部區(qū)域圖像的中心位置之間的歐式距離；

34、空間關系建立模塊，用于根據所有局部區(qū)域圖像的中心位置之間的歐式距離，建立目標物之間的空間關系；

35、所述根據再次提取的特征圖進行圖像分類預測的步驟包括：

36、將再次提取的特征圖與目標物之間的空間關系進行融合，根據融合結果確定圖像分類的預測結果。

37、本發(fā)明還公開了一種計算機可讀存儲介質，其上存儲有計算機程序，該程序被處理器執(zhí)行時實現(xiàn)上述任一項所述的多標簽圖像分類方法。

38、本發(fā)明還公開了一種電子設備，包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序，所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述任一項所述的多標簽圖像分類方法。

39、本發(fā)明通過雙線性和雙三次插值方法對小目標區(qū)域進行上采樣，獲得更豐富的特征信息，能夠更加準確地識別圖像中的小目標物體。

技術特征：

1.一種多標簽圖像分類方法，其特征在于，包括，

2.如權利要求1所述的多標簽圖像分類方法，其特征在于，所述確定所述類別激活圖中目標物的邊界框的步驟包括：

3.如權利要求2所述的多標簽圖像分類方法，其特征在于，所述類別激活圖中每個類別區(qū)域的得分向量包括水平得分向量和豎直得分向量，水平得分向量為：

4.如權利要求1所述的多標簽圖像分類方法，其特征在于，所述根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像的步驟之后還包括：

5.一種多標簽圖像分類裝置，其特征在于，包括：

6.如權利要求5所述的多標簽圖像分類裝置，其特征在于，所述確定所述類別激活圖中目標物的邊界框的步驟包括：

7.如權利要求5所述的多標簽圖像分類裝置，其特征在于，還包括：

8.一種計算機可讀存儲介質，其上存儲有計算機程序，其特征在于，該程序被處理器執(zhí)行時實現(xiàn)如權利要求1至4中任一項所述的多標簽圖像分類方法。

9.一種電子設備，包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序，其特征在于，所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至4中任一項所述的多標簽圖像分類方法。

技術總結
一種多標簽圖像分類方法、裝置、可讀存儲介質及電子設備，該方法包括，將預處理后的圖像數據輸入至預訓練的卷積神經網絡模型中，并提取特征圖；將提取的特征圖進行卷積操作，以得到類別激活圖；確定所述類別激活圖中目標物的邊界框，并根據所述邊界框的坐標從所述特征圖中提取出局部區(qū)域圖像；采用雙線性插值法調整所述局部區(qū)域圖像為預設尺寸；篩選出小于閾值尺寸的局部區(qū)域圖像，并采用雙三次插值法將篩選出的圖像調整為預設尺寸；將尺寸調整后的所述局部區(qū)域圖像輸入到所述卷積神經網絡模型中再次提取特征圖，并根據再次提取的特征圖進行圖像分類預測。本發(fā)明可以獲得更豐富的特征信息，使得模型能夠更加準確地識別圖像中的小目標物體。

技術研發(fā)人員：錢文彬,李自強,蔡星星,曾志將,吳小波
受保護的技術使用者：江西農業(yè)大學
技術研發(fā)日：
技術公布日：2024/12/19

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：錢文彬,李自強,蔡星星,曾志將,吳小波
技術所有人：江西農業(yè)大學
我是此專利的發(fā)明人

上一篇：一種隧道交通預警裝置的制作方法
上一篇：一種甲基丙烯酸羥乙酯生產用殘液中間儲罐的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯(lián)網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多標簽圖像分類方法、裝置、可讀存儲介質及電子設備

多標簽圖像分類方法、裝置、可讀存儲介質及電子設備