本發(fā)明屬于人工智能,尤其涉及一種帶有像素激活的無步幅三重卷積小目標檢測方法。
背景技術:
1、隨著人工智能技術的不斷發(fā)展,深度學習和機器視覺等技術在無人駕駛、智慧醫(yī)療以及人臉識別等領域得到了更廣泛的應用。目標檢測作為計算機視覺領域的核心研究之一,利用相關算法對目標進行分類和定位。隨著深度學習的進一步研究,基于卷積神經網絡的目標檢測算法也取得了長足的進步,尤其是針對大中型目標的檢測算法,基本能夠滿足各種場景下的需求。相比之下,小目標檢測作為其中一個分支,其主要任務是精準地識別32×32像素以下的小目標在視覺圖像中的位置。然而,由于小目標的像素占比小、語義信息少、易受復雜場景干擾以及易于遭遇遮擋等問題,使得小目標檢測一直以來都是目標檢測領域的一大挑戰(zhàn)。
2、小目標由于其特性容易受到遮擋、缺失和低分辨率等問題的影響,從而影響小目標檢測的性能。此外,小目標數據集中的圖像質量參差不齊,大多數存在著強光直射、正常光但有遮擋、光線過暗、背景復雜等問題,這些情況進一步加重了小目標檢測的不準確性。
3、小目標檢測作為目標檢測的一個分支,由于小物體經常出現在各種應用領域,例如行人檢測、人臉識別、交通標志檢測、交通燈檢測、船舶檢測等,近年來受到了越來越多的關注。小目標檢測在實際應用場景中有著關鍵作用,在交通監(jiān)控領域,小目標檢測可用于識別交通信號燈、車牌等。在自動駕駛領域,小目標檢測可用于識別微小的障礙物,避免交通事故的發(fā)生。在醫(yī)學影像分析領域,小目標檢測可用于識別微小的腫瘤細胞等。在自動工業(yè)領域,小目標檢測可以檢查定位材料表面上的小缺陷。在刑偵圖像中,小目標檢測可以檢查異常的小包裹、小行人、車里面的小掛件、衣服上的小標志、室內的一些小擺設等破案的關鍵線索。在目標分割、跟蹤、識別等交叉領域也起到十分關鍵的作用。但小目標所占原圖像素少,且攜帶的有用信息少,在復雜的現實世界中應用有限,因此對小目標檢測展開研究將有助于推動目標檢測領域的發(fā)展,擴寬目標檢測在現實世界的應用場景。
4、當前的目標檢測算法大多面向大、中目標,這些方法在通用數據集上基本滿足各種場景下的需求,但因小目標本身所含信息量少,體積小且分布不均,容易受到大目標遮擋的影響,現有算法對小目標的檢測仍有很大的進步空間。相對常規(guī)目標,小目標分辨率較低,容易造成目標模糊、細節(jié)特征不明顯?,F有的基于深卷積神經網絡的目標檢測算法需要對整幅圖像進行多層卷積和池化運算,才能提取圖像的深層語義特征。對于較大的目標,檢測模型可以得到更好的檢測結果。然而,由于現有模型經過多次卷積運算后的特征不能完全代表小目標的本質特征并且模型針對低分辨率特征的小目標難以檢出,進而導致了檢測模型難以精準定位和識別小目標。對于小目標檢測而言,減少可用信息的丟失是提高小目標檢測性能的一個重要方法,同時深層特征圖的低分辨率也是我們需要解決的關鍵問題。
技術實現思路
1、為了解決上述技術問題,本發(fā)明揭示了一種帶有像素激活的無步幅三重卷積小目標檢測方法,所述方法包括如下步驟:
2、s100:將原始圖像輸入到無步幅三重卷積小目標檢測網絡中進行檢測;
3、s200:將檢測結果輸出;
4、其中,所述無步幅三重卷積小目標檢測網絡包括特征提取網絡,特征增強網絡和檢測頭部,在所述特征提取網絡的dark3-5特征層引入了無步幅三重卷積sftconv。
5、該發(fā)明具有如下優(yōu)點:
6、提出了一種帶有像素激活的無步幅三重卷積小目標檢測算法,旨在解決由于卷積和下采樣造成的小目標信息丟失,且小目標分辨率低和所占像素少的問題,從而減少檢測圖片中漏檢誤檢情況的發(fā)生,提高復雜背景下小目標的特征表達能力。首先,該方法在特征提取網絡dark3-5層添加了無步幅三重卷積sftconv,引導模型保留更多可靠細節(jié)信息以改善卷積過程中圖像信息的顯著損失。同時,在dark5特征層后添加了高低頻混合注意力hilo-hat,捕獲低頻局部和高頻全局信息,重構高分辨率特征圖。引入的高低頻混合注意力考慮到了不同底層頻率的特征,根據特征圖中不同的頻率關系進行建模,更有針對性的捕獲全局和局部特征信息,同時節(jié)省大量的計算成本和冗余。此外,在檢測頭部的分類分支和回歸分支間添加了輔助分支cal?branch,使模型能夠利用特征圖中更多細粒度信息更好的擬合邊界框,進一步提高小目標檢測性能。
1.一種帶有像素激活的無步幅三重卷積小目標檢測方法,所述方法包括如下步驟:
2.如權利要求1所述的方法,其中,優(yōu)選的,在所述特征提取網絡的dark5特征層后添加了高低頻混合注意力hilo-hat。
3.如權利要求1所述的方法,其中,所述檢測頭部包括分類分支和回歸分支,在所述檢測頭部的分類分支和回歸分支間添加了一條分類輔助定位分支cal?branch。
4.如權利要求1所述的方法,其中,所述無步幅三重卷積sftconv包括空間到深度的特征圖和三分支的跨維度交互。
5.如權利要求2所述的方法,其中,所述高低頻混合注意力hilo-hat包括高頻特征提取、低頻特征提取和圖像重建。
6.如權利要求5所述的方法,其中,所述圖像重建采用像素重排方法重建出高分辨率特征圖。
7.如權利要求3所述的方法,其中,所述分類輔助定位分支cal?branch的具體流程包括:
8.如權利要求1所述的方法,所述無步幅三重卷積sftconv位于特征提取網絡的卷積歸一化激活模塊cbs前。