本公開涉及圖像處理領(lǐng)域,具體地,涉及一種圖像識別的方法和裝置。
背景技術(shù):
隨著經(jīng)濟的發(fā)展,往返于貿(mào)易港口、火車站、航空站等海關(guān)監(jiān)管區(qū)域的旅客、商品越來越多,而在旅客行李中隱藏的危險物品和走私物品不僅嚴重威脅著旅客的生命財產(chǎn)安全,更危害了國家安全和利益。
目前國內(nèi)的安檢系統(tǒng)主要依靠安檢工作人員通過人眼進行識別,其中,旅客的行李或者包裹在通過傳送帶或安檢門時,透過X射線掃描出的圖像會出現(xiàn)在與設(shè)備連接的顯示屏幕上,安檢人員通過觀察屏幕上的圖像、色塊等對其中的危險物品或者走私物品進行識別。
但是,由于現(xiàn)有方法是由人工操作的,因此,在對危險物品或者走私物品進行識別難免存在漏檢或者錯檢的問題,從而無法準確的識別危險物品或者走私物品。
技術(shù)實現(xiàn)要素:
本公開的目的是提供一種圖像識別的方法和裝置,能夠準確識別待識別物品的圖像。
為了實現(xiàn)上述目的,本公開提供一種圖像識別的方法,包括:獲取待識別物品的物品圖像;沿所述物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)所述物品圖像得到的多個旋轉(zhuǎn)圖像;通過預設(shè)分類模型從所述多個旋轉(zhuǎn)圖像中,確定出第一圖像標記以及所述第一圖像標記對應的置信度,其中,所述第一圖像標記用于標示所述多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;所述置信度表示所述第一圖像標記標示出的待識別物品屬于所述目標類別的可信度;根據(jù)所述置信度和所述第一圖像標記在所述物品圖像中確定目標圖像標記,其中,所述目標圖像標記用于標記所述物品圖像中確定屬于所述目標類別的待識別物品的圖像。
可選地,所述根據(jù)所述置信度和所述第一圖像標記在所述物品圖像中標記出目標物品圖像包括:獲取所述第一圖像標記所在旋轉(zhuǎn)圖像對應的旋轉(zhuǎn)方向;確定與所述旋轉(zhuǎn)方向相反的反轉(zhuǎn)方向;沿所述第一圖像標記所在旋轉(zhuǎn)圖像的圖像中心由所述反轉(zhuǎn)方向按照所述旋轉(zhuǎn)角度旋轉(zhuǎn)所述第一圖像標記,并將旋轉(zhuǎn)后的第一圖像標記疊加到所述物品圖像上;根據(jù)旋轉(zhuǎn)后的第一圖像標記和所述置信度在所述物品圖像中標記出目標物品圖像。
可選地,所述第一圖像標記包括圖像標記框,所述根據(jù)旋轉(zhuǎn)后的第一圖像標記和所述置信度在所述物品圖像中標記出目標物品圖像包括:確定所述圖像標記框中是否包括存在交集的圖像標記框;在所述圖像標記框中包括存在交集的圖像標記框時,從存在交集的圖像標記框中確定置信度最大的第一標記框;根據(jù)所述第一標記框與第二標記框的交集確定匹配值;所述第二標記框為存在交集的圖像標記框中除所述第一標記框之外的其他標記框;在所述匹配值大于或者等于預設(shè)匹配值時,確定所述第一標記框為所述目標標記框且所述第二標記框不是所述目標標記框;在所述匹配值小于所述預設(shè)匹配值時,確定所述第一標記框和所述第二標記框都為所述目標標記框。
可選地,所述根據(jù)所述第二標記框與所述第一標記框的交集確定匹配值包括:獲取所述第二標記框與所述第一標記框的交集的第一面積;獲取所述第二標記框與所述第一標記框的并集的第二面積;根據(jù)所述第一面積和所述第二面積通過以下公式確定所述匹配值;
其中,P為所述匹配值,S1為所述第一面積,S2為所述第二面積。
可選地,所述根據(jù)所述置信度和所述第一圖像標記在所述物品圖像中標記出目標物品圖像包括:從所述第一圖像標記中確定第二圖像標記;所述第二圖像標記為所述第一圖像標記中置信度大于或者等于預設(shè)閾值的圖像標記;根據(jù)所述置信度和所述第二圖像標記在所述物品圖像中標記出目標物品圖像。
本公開提供一種圖像識別的裝置,包括:獲取模塊,用于獲取待識別物品的物品圖像;旋轉(zhuǎn)模塊,用于沿所述物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)所述物品圖像得到的多個旋轉(zhuǎn)圖像;處理模塊,用于通過預設(shè)分類模型從所述多個旋轉(zhuǎn)圖像中,確定出第一圖像標記以及所述第一圖像標記對應的置信度,其中,所述第一圖像標記用于標示所述多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;所述置信度表示所述第一圖像標記標示出的待識別物品屬于所述目標類別的可信度;確定模塊,用于根據(jù)所述置信度和所述第一圖像標記在所述物品圖像中確定目標圖像標記,其中,所述目標圖像標記用于標記所述物品圖像中確定屬于所述目標類別的待識別物品的圖像。
可選地,所述確定模塊包括:反轉(zhuǎn)子模塊,用于獲取所述第一圖像標記所在旋轉(zhuǎn)圖像對應的旋轉(zhuǎn)方向,并確定與所述旋轉(zhuǎn)方向相反的反轉(zhuǎn)方向,沿所述第一圖像標記所在旋轉(zhuǎn)圖像的圖像中心由所述反轉(zhuǎn)方向按照所述旋轉(zhuǎn)角度旋轉(zhuǎn)所述第一圖像標記,并將旋轉(zhuǎn)后的第一圖像標記疊加到所述物品圖像上;確定子模塊,用于根據(jù)旋轉(zhuǎn)后的第一圖像標記和所述置信度在所述物品圖像中標記出目標物品圖像。
可選地,所述第一圖像標記包括圖像標記框,所述確定子模塊,用于確定所述圖像標記框中是否包括存在交集的圖像標記框;在所述圖像標記框中包括存在交集的圖像標記框時,從存在交集的圖像標記框中確定置信度最大的第一標記框;根據(jù)所述第一標記框與第二標記框的交集確定匹配值;所述第二標記框為存在交集的圖像標記框中除所述第一標記框之外的其他標記框;在所述匹配值大于或者等于預設(shè)匹配值時,確定所述第一標記框為所述目標標記框且所述第二標記框不是所述目標標記框;在所述匹配值小于所述預設(shè)匹配值時,確定所述第一標記框和所述第二標記框都為所述目標標記框。
可選地,所述確定子模塊,用于獲取所述第二標記框與所述第一標記框的交集的第一面積,獲取所述第二標記框與所述第一標記框的并集的第二面積,并根據(jù)所述第一面積和所述第二面積通過以下公式確定所述匹配值;
其中,P為所述匹配值,S1為所述第一面積,S2為所述第二面積。
可選地,所述確定模塊,用于從所述第一圖像標記中確定第二圖像標記;所述第二圖像標記為所述第一圖像標記中置信度大于或者等于預設(shè)閾值的圖像標記,并根據(jù)所述置信度和所述第二圖像標記在所述物品圖像中標記出目標物品圖像。
通過上述技術(shù)方案,獲取待識別物品的物品圖像;沿該物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)該物品圖像得到的多個旋轉(zhuǎn)圖像;通過預設(shè)分類模型從該多個旋轉(zhuǎn)圖像中,確定出第一圖像標記以及該第一圖像標記對應的置信度,其中,該第一圖像標記用于標示該多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;該置信度表示該第一圖像標記標示出的待識別物品屬于該目標類別的可信度;根據(jù)該置信度和該第一圖像標記在該物品圖像中確定目標圖像標記,其中,該目標圖像標記用于標記該物品圖像中確定屬于該目標類別的待識別物品的圖像。這樣,通過對獲取的圖像進行旋轉(zhuǎn),得到不同旋轉(zhuǎn)角度下的多個旋轉(zhuǎn)圖像,并根據(jù)得到的多個旋轉(zhuǎn)圖像對待識別物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別出目標類別的物品。
本公開的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。
附圖說明
附圖是用來提供對本公開的進一步理解,并且構(gòu)成說明書的一部分,與下面的具體實施方式一起用于解釋本公開,但并不構(gòu)成對本公開的限制。在附圖中:
圖1是本公開實施例提供一種圖像識別的方法的流程示意圖;
圖2是本公開實施例提供另一種圖像識別的方法的流程示意圖;
圖3是本公開實施例提供一種旋轉(zhuǎn)圖像的示意圖;
圖4是本公開實施例提供一種旋轉(zhuǎn)圖像上的圖像標記框的示意圖;
圖5是本公開實施例提供一種最小矩形框的示意圖;
圖6是本公開實施例提供一種圖像識別的裝置的結(jié)構(gòu)示意圖;
圖7是本公開實施例提供另一種圖像識別的裝置的結(jié)構(gòu)示意圖。
具體實施方式
以下結(jié)合附圖對本公開的具體實施方式進行詳細說明。應當理解的是,此處所描述的具體實施方式僅用于說明和解釋本公開,并不用于限制本公開。
本公開實施例可以應用于安檢場景,在該場景下,旅客的行李或者包裹在進行安檢時,安檢設(shè)備通過X射線獲取到該行李或者包裹的圖像,從而通過獲取的圖像識別危險物品和走私物品;本公開通過對獲取的圖像進行旋轉(zhuǎn),得到不同旋轉(zhuǎn)角度下的多個旋轉(zhuǎn)圖像,并根據(jù)得到的多個旋轉(zhuǎn)圖像對旅客行李或者包裹中的物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別危險物品和走私物品。
下面,結(jié)合具體實施例對本公開進行詳細說明。
圖1為本公開實施例提供的一種圖像識別的方法,如圖1所示,該方法包括:
S101、獲取待識別物品的物品圖像。
其中,該待識別物品可以是旅客行李中的物品,這些物品可以是日常生活中的日用品,如洗漱用品、衣服、鞋等物品,也可以是一些危險物品或者違禁物品,如刀具和槍等物品。
S102、沿該物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)該物品圖像得到的多個旋轉(zhuǎn)圖像。
其中,該圖像中心可以是該物品圖像的中心點。
在本步驟中,可以沿該物品圖像的圖像中心點將該物品圖像按照預設(shè)旋轉(zhuǎn)步長進行多次旋轉(zhuǎn),得到該多個旋轉(zhuǎn)圖像。
S103、通過預設(shè)分類模型從該多個旋轉(zhuǎn)圖像中,確定出第一圖像標記以及該第一圖像標記對應的置信度。
其中,該第一圖像標記用于標示該多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;該置信度表示該第一圖像標記標示出的待識別物品屬于該目標類別的可信度。
這里,該目標類別可以是屬于危險物品或者違禁物品的物品,如刀具或者槍等物品。
在本實施例中,圖像標記可以是圖像標記框,如矩形框或者圓形框等,以便框出標記的圖像,該圖像標記還可以以反色的形式進行標記,即將標記的圖像的顏色設(shè)置為與旋轉(zhuǎn)圖像的背景色不同的顏色,以便通過顏色區(qū)分標記的圖像和該旋轉(zhuǎn)圖像中的其他圖像,當然,上述圖像標記只是舉例說明,不作限定。
S104、根據(jù)該置信度和該第一圖像標記在該物品圖像中確定目標圖像標記。
其中,該目標圖像標記用于標記該物品圖像中確定屬于該目標類別的待識別物品的圖像。
這樣,通過對獲取的圖像進行旋轉(zhuǎn),得到不同旋轉(zhuǎn)角度下的多個旋轉(zhuǎn)圖像,并根據(jù)得到的多個旋轉(zhuǎn)圖像對待識別物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別出目標類別的物品。
圖2為本公開實施例提供一種圖像識別的方法,如圖2所示,本實施例中的圖像標記是以圖像標記框為例進行說明的,該圖像標記框可以是一個矩形框,從而框出被標記物品的圖像,方便安檢人員查看,這里的矩形框只是舉例說明,本公開對此不作限定,還可以是其他形狀的框,如圓形框等;該方法包括:
S201、獲取待識別物品的物品圖像。
在本步驟中,旅客行李或者包裹在通過傳送帶或者安檢門時,可以通過X射線采集到該物品圖像。
S202、沿該物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)該物品圖像得到的多個旋轉(zhuǎn)圖像。
其中,該圖像中心可以是該物品圖像的中心點。
在本步驟中,可以沿該物品圖像的圖像中心點將該物品圖像按照預設(shè)旋轉(zhuǎn)步長進行多次旋轉(zhuǎn),得到該多個旋轉(zhuǎn)圖像。
需要說明的是,為了確保得到的旋轉(zhuǎn)圖像能夠在更大范圍的角度下呈現(xiàn)不同角度的待識別物品的姿態(tài),在本實施例中,該旋轉(zhuǎn)的次數(shù)可以通過計算360度與該預設(shè)旋轉(zhuǎn)步長的比值得到,這樣,得到的多個旋轉(zhuǎn)圖像剛好是該物品圖像旋轉(zhuǎn)一周后的圖像,從而使得得到的旋轉(zhuǎn)圖像中的待識別物品的姿態(tài)可以對應360度的不同的方向,進而增加后續(xù)對目標類別的待識別物品的識別的準確性。
這里,按照上述旋轉(zhuǎn)的次數(shù)得到的多個旋轉(zhuǎn)圖像可以不包括初始獲取的物品圖像,而在按照360度與該預設(shè)旋轉(zhuǎn)步長的比值計算出的次數(shù)進行旋轉(zhuǎn)時,最后一次旋轉(zhuǎn)的旋轉(zhuǎn)圖像與初始獲取的物品圖像相同,因此,該旋轉(zhuǎn)的次數(shù)還可以通過在計算360度與該預設(shè)旋轉(zhuǎn)步長的比值后減去1得到,且得到的多個旋轉(zhuǎn)圖像包括初始獲取的物品圖像,但是,采用這種旋轉(zhuǎn)次數(shù)的計算方式能夠減少一次旋轉(zhuǎn)次數(shù),從而減輕數(shù)據(jù)處理的負擔。
另外,由于得到不同角度下的旋轉(zhuǎn)圖像越多,則在旋轉(zhuǎn)圖像中的待識別物品的圖像呈現(xiàn)的角度越多,對于后續(xù)對目標類別的待識別物品的識別越準確,因此,理論上,該預設(shè)旋轉(zhuǎn)步長可以設(shè)置的越小,則旋轉(zhuǎn)多次后得到的旋轉(zhuǎn)圖像的數(shù)量越多,但是,考慮到獲取的旋轉(zhuǎn)圖像越多,計算量越大,數(shù)據(jù)處理的負擔越重,從而降低了對目標類別的待識別物品的識別效率,因此,在本實施例中,該預設(shè)旋轉(zhuǎn)步長可以設(shè)置為60度,則對應的旋轉(zhuǎn)次數(shù)可以5次(即計算360度與60度的比值后減1),從而得到6個旋轉(zhuǎn)圖像(其中得到的旋轉(zhuǎn)圖像包括初始的物品圖像)。
示例地,如圖3所示,原始的物品圖像為a,將該原始的物品圖像沿物品圖像的中心向逆時針方向進行旋轉(zhuǎn),每次旋轉(zhuǎn)60度(相當于預設(shè)旋轉(zhuǎn)步長為60度),這樣,將圖像a逆時針旋轉(zhuǎn)60度得到圖像b,再將圖像b逆時針旋轉(zhuǎn)60度得到圖像c,再將圖像c逆時針旋轉(zhuǎn)60度得到圖像d,再將圖像d逆時針旋轉(zhuǎn)60度得到圖像e,再將圖像e逆時針旋轉(zhuǎn)60度得到圖像f,這樣,旋轉(zhuǎn)5次后,即可得到圖像b、圖像c、圖像d、圖像e以及圖像f,則該多個旋轉(zhuǎn)圖像即為圖像a、圖像b、圖像c、圖像d、圖像e以及圖像f。
當然,上述預設(shè)旋轉(zhuǎn)步長的設(shè)置只是舉例說明,本公開對此不作限定,具體的設(shè)置可以綜合考慮對目標類別的待識別物品識別的準確率以及數(shù)據(jù)處理的負擔進行設(shè)置,例如,該預設(shè)旋轉(zhuǎn)步長還可以設(shè)置為30度等。
S203、將多個旋轉(zhuǎn)圖像作為預設(shè)分類模型的輸入,得到第一圖像標記框以及該第一圖像標記框?qū)闹眯哦取?/p>
其中,該第一圖像標記框用于標記該多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;該置信度表示該第一圖像標記框標記出的待識別物品屬于該目標類別的可信度。
在本步驟中,通過該預設(shè)分類模型即可將屬于目標類別的待識別物品識別出來,并通過第一圖像標記框標記該待識別物品的物品圖像。
該預設(shè)模型可以通過選用已訓練好的深度卷積神經(jīng)網(wǎng)絡模型進行初始化,然后利用已經(jīng)搜集好的X射線圖像樣本進行訓練,生成該預設(shè)分類模型,在本實施例中,該深度卷積神經(jīng)網(wǎng)絡模型可以選用VGG(Visual Geometry Group視覺幾何組)網(wǎng)絡模型。上述模型訓練的具體過程與現(xiàn)有的神經(jīng)網(wǎng)絡模型的訓練過程相同,不再贅述。
示例地,上述每個旋轉(zhuǎn)圖像通過該預設(shè)模型得到的圖像標記框如圖4中的加粗的黑框所示,由圖4可以看出,在不同的旋轉(zhuǎn)角度下,識別出的屬于目標類別的圖像并不完全相同(有的有兩個黑框,有的只有一個黑框),因此,如果只采用一張圖像就確定屬于目標類別的待識別物品,很容易造成漏檢或者錯檢的問題,因此,本公開根據(jù)多個旋轉(zhuǎn)圖像并通過后續(xù)步驟對待識別物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別出目標類別的物品。
S204、獲取該第一圖像標記框所在旋轉(zhuǎn)圖像對應的旋轉(zhuǎn)方向,確定與該旋轉(zhuǎn)方向相反的反轉(zhuǎn)方向,并沿該第一圖像標記框所在旋轉(zhuǎn)圖像的圖像中心由該反轉(zhuǎn)方向按照該旋轉(zhuǎn)角度旋轉(zhuǎn)該第一圖像標記框,并將旋轉(zhuǎn)后的第一圖像標記框疊加到該物品圖像上。
本步驟相當于根據(jù)第一圖像標記框所在旋轉(zhuǎn)圖像的旋轉(zhuǎn)方向和旋轉(zhuǎn)角度,將該第一圖像標記框進行逆旋轉(zhuǎn),以便將全部第一圖像標記框疊加到初始獲取的物品圖像上。
例如,若旋轉(zhuǎn)圖像是沿圖像中心向逆時針方向旋轉(zhuǎn)60度得到的,則在本步驟中,可以將該第一圖像標記框沿該第一圖像標記框所在旋轉(zhuǎn)圖像的圖像中心向順時針方向旋轉(zhuǎn)60度。
需要說明的是,由于旋轉(zhuǎn)后的第一圖像標記框可能相對于水平方向是傾斜的,這樣,后續(xù)安檢人員可能無法直觀的觀察到該圖像標記框標記的待識別物品,因此,為了解決上述問題,在本公開另一實施例中,可以在得到旋轉(zhuǎn)后的第一圖像標記框后,根據(jù)該第一圖像標記框四個角對應的坐標得到該第一圖像標記框外接的最小矩形框,并將該最小矩形框作為該第一圖像標記框,如圖4所示,A為第一圖像標記框,由圖5可以看出,該第一圖像標記框相對水平方向是傾斜的,則得到的外接的最小矩形框即為B,這樣,能夠?qū)A斜的第一圖像標記框調(diào)整為端正的標記框,以方便后續(xù)安檢人員更直觀的查看該第一圖像標記框標示的物品。
S205、確定該第一圖像標記框中是否包括存在交集的圖像標記框。
在本步驟中,可以通過確定第一圖像標記框中任一標記框上的點的坐標是否落在另一標記框的圖像范圍內(nèi)來確定圖像標記框之間是否存在交集,若落在圖像范圍內(nèi),則確定兩個圖像標記框之間存在交集,若未落在圖像范圍內(nèi),則確定兩個標記框之間不存在交集。
在確定第一圖像標記框中包括存在交集的圖像標記框時,執(zhí)行步驟S206至步驟S208;
這里,在兩個圖像標記框存在交集時,相當于存在兩種可能的情況,一種情況是這兩個圖像標記框?qū)拇R別物品是同一物品,另一種情況是這兩個圖像標記框?qū)拇R別物品是不同物品,但兩個物品離得非常近,因此,通過步驟S206至步驟S208進行進一步處理,以確定第一圖像標記框中包括存在交集的圖像標記框?qū)拇R別物品是否是同一物品。
在確定圖像標記框中不包括存在交集的圖像標記框時,執(zhí)行步驟S210和步驟S211。
這里,即可確定每個圖像標記框標記的物品圖像對應的待識別物品都是不同的物品。
S206、從存在交集的圖像標記框中確定置信度最大的第一標記框。
在本步驟中,在得到存在交集的圖像標記框以及對應的置信度后,可以按照從大到小的順序?qū)υ撝眯哦冗M行排序,從而在存在交集的圖像標記框中確定置信度最大的第一標記框。
S207、根據(jù)該第一標記框與第二標記框的交集確定匹配值。
其中,該第二標記框為存在交集的圖像標記框中除第一標記框外的其他標記框。
在一種可能的實現(xiàn)方式中,可以通過以下步驟確定該匹配值:
S1、獲取該第一標記框與該第二標記框的交集的第一面積。
其中,由于第一標記框和第二標記框的四個角的坐標已知,因此,可以通過第一標記框和第二標記框的四個角的坐標得到交集部分的頂點的坐標,從而根據(jù)得到的坐標得到該第一標記框與該第二標記框的交集的第一面積。
S2、獲取該第二標記框與該第一標記框的并集的第二面積。
其中,該第二面積可以分別根據(jù)第一標記框和第二標記框的四個角的坐標得到第一標記框標記的圖像范圍的面積以及第二標記框標記的圖像范圍的面積,并將得到的兩個面積相加,由于相加后相當于將第二標記框與該第一標記框的交集的面積加了兩次,因此還需要減去交集部分的面積,即可得到該第二面積。
S3、根據(jù)該第一面積和該第二面積通過以下公式確定該匹配值;
其中,P為該匹配值,S1為該第一面積,S2為該第二面積。
S208、確定該匹配值是否大于或者等于預設(shè)匹配值。
在確定該匹配值大于或者等于預設(shè)匹配值時,執(zhí)行步驟S209和步驟S211;
這里,可以認為該第一標記框標記的物品圖像對應的待識別物品和該第二標記框標記的物品圖像對應的待識別物品是同一物品。
在確定該匹配值小于該預設(shè)匹配值時,執(zhí)行步驟S210和步驟S211。
這里,可以認為該第一標記框標記的物品圖像對應的待識別物品和該第二標記框標記的物品圖像對應的待識別物品是不同物品,只是兩個物品的位置離得非常近。
S209、確定該第一標記框為目標標記框且該第二標記框不是該目標標記框。
其中,該目標標記框用于標記該物品圖像中確定屬于目標類別的待識別物品的圖像。
該目標類別可以是屬于危險物品或者違禁物品的物品,如刀具或者槍等物品。
S210、確定該第一標記框和該第二標記框都為該目標標記框。
S211、在確定該目標標記框?qū)闹眯哦却笥诨蛘叩扔陬A設(shè)閾值時,輸出包含該目標標記框的物品圖像。
其中,該物品圖像可以輸出至安檢人員所使用的終端(如電腦等)上,并通過終端顯示給安檢人員,安檢人員通過該終端即可根據(jù)輸出的物品圖像確定目標標記框標記的物品的類別(如刀具或者槍等)和置信度。
需要說明的是,本步驟S211是在確定了目標標記框之后,確定該目標標記框?qū)闹眯哦却笥诨蛘叩扔陬A設(shè)閾值,但是考慮到數(shù)據(jù)處理的負擔,在本公開另一實施例中,在得到第一圖像標記框以及該第一圖像標記框?qū)闹眯哦?即步驟S203)后,即可從第一圖像標記框中確定第二圖像標記框,該第二圖像標記框為該第一圖像標記框中置信度大于或者等于預設(shè)閾值的標記框,則在后續(xù)步驟中對第一圖像標記框的相關(guān)處理都可以替換為對該第二圖像標記框的處理,此時,在本步驟中,則無需確定目標標記框?qū)闹眯哦仁欠翊笥诨蛘叩扔陬A設(shè)閾值,直接輸出包含該目標標記框的物品圖像即可,這樣,相當于在對圖像標記框進行處理之前,先將置信度相對較低的圖像標記框去除,從而能夠在后續(xù)步驟對圖像標記框的處理過程中,減少運算量,降低數(shù)據(jù)處理的負擔。
在輸出包含該目標標記框的物品圖像時,為了進一步提醒安檢人員關(guān)注輸出的物品圖像,還可以發(fā)出提示信息,以提示安檢人員通過終端查看物品圖像。
采用上述方法,通過對獲取的圖像進行旋轉(zhuǎn),得到不同旋轉(zhuǎn)角度下的多個旋轉(zhuǎn)圖像,并根據(jù)得到的多個旋轉(zhuǎn)圖像對待識別物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別出目標類別的物品。
圖6為本公開實施例提供的一種圖像識別的裝置,如圖6所示,該裝置包括:
獲取模塊601,用于獲取待識別物品的物品圖像;
旋轉(zhuǎn)模塊602,用于沿該物品圖像的圖像中心按照多個旋轉(zhuǎn)角度旋轉(zhuǎn)該物品圖像得到的多個旋轉(zhuǎn)圖像;
處理模塊603,用于通過預設(shè)分類模型從該多個旋轉(zhuǎn)圖像中,確定出第一圖像標記以及該第一圖像標記對應的置信度,其中,該第一圖像標記用于標示該多個旋轉(zhuǎn)圖像中屬于目標類別的待識別物品的圖像;該置信度表示該第一圖像標記標示出的待識別物品屬于該目標類別的可信度;
確定模塊604,用于根據(jù)該置信度和該第一圖像標記在該物品圖像中確定目標圖像標記,其中,該目標圖像標記用于標記該物品圖像中確定屬于該目標類別的待識別物品的圖像。
可選地,如圖7所示,該確定模塊604包括:
反轉(zhuǎn)子模塊6041,用于獲取該第一圖像標記所在旋轉(zhuǎn)圖像對應的旋轉(zhuǎn)方向,并確定與該旋轉(zhuǎn)方向相反的反轉(zhuǎn)方向,沿該第一圖像標記所在旋轉(zhuǎn)圖像的圖像中心由該反轉(zhuǎn)方向按照該旋轉(zhuǎn)角度旋轉(zhuǎn)該第一圖像標記,并將旋轉(zhuǎn)后的第一圖像標記疊加到該物品圖像上;
確定子模塊6042,用于根據(jù)旋轉(zhuǎn)后的第一圖像標記和該置信度在該物品圖像中標記出目標物品圖像。
可選地,該第一圖像標記包括圖像標記框,該確定子模塊6042,用于確定該圖像標記框中是否包括存在交集的圖像標記框;在該圖像標記框中包括存在交集的圖像標記框時,從存在交集的圖像標記框中確定置信度最大的第一標記框;根據(jù)該第一標記框與第二標記框的交集確定匹配值;該第二標記框為存在交集的圖像標記框中除該第一標記框之外的其他標記框;在該匹配值大于或者等于預設(shè)匹配值時,確定該第一標記框為該目標標記框且該第二標記框不是該目標標記框;在該匹配值小于該預設(shè)匹配值時,確定該第一標記框和該第二標記框都為該目標標記框。
可選地,該確定子模塊6042,用于獲取該第二標記框與該第一標記框的交集的第一面積,獲取該第二標記框與該第一標記框的并集的第二面積,并根據(jù)該第一面積和該第二面積通過以下公式確定該匹配值;
其中,P為該匹配值,S1為該第一面積,S2為該第二面積。
可選地,該確定模塊604,用于從該第一圖像標記中確定第二圖像標記;該第二圖像標記為該第一圖像標記中置信度大于或者等于預設(shè)閾值的圖像標記,并根據(jù)該置信度和該第二圖像標記在該物品圖像中標記出目標物品圖像。
需要說明的是,所屬本領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的裝置的具體工作過程和描述,可以參考前述方法實施例中的對應過程,在此不再贅述。
采用上述裝置,通過對獲取的圖像進行旋轉(zhuǎn),得到不同旋轉(zhuǎn)角度下的多個旋轉(zhuǎn)圖像,并根據(jù)得到的多個旋轉(zhuǎn)圖像對待識別物品進行識別,從而通過不同角度的旋轉(zhuǎn)圖像準確的識別出目標類別的物品。
本發(fā)明實施例還提供一種安檢設(shè)備,該安檢設(shè)備包括上述圖像識別的裝置。
以上結(jié)合附圖詳細描述了本公開的優(yōu)選實施方式,但是,本公開并不限于上述實施方式中的具體細節(jié),在本公開的技術(shù)構(gòu)思范圍內(nèi),可以對本公開的技術(shù)方案進行多種簡單變型,這些簡單變型均屬于本公開的保護范圍。
另外需要說明的是,在上述具體實施方式中所描述的各個具體技術(shù)特征,在不矛盾的情況下,可以通過任何合適的方式進行組合,為了避免不必要的重復,本公開對各種可能的組合方式不再另行說明。
此外,本公開的各種不同的實施方式之間也可以進行任意組合,只要其不違背本公開的思想,其同樣應當視為本公開所公開的內(nèi)容。