本公開(kāi)涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種基于圖像的物體檢測(cè)方法、裝置及服務(wù)器。
背景技術(shù):
物體檢測(cè)指的是對(duì)圖像中的物體進(jìn)行檢測(cè)和識(shí)別,通過(guò)物體檢測(cè)能夠確定圖像拍攝的場(chǎng)景,從而為圖像分類(lèi)提供依據(jù),例如,包含辦公桌的圖像通常被歸類(lèi)為辦公室圖像。
相關(guān)技術(shù)中,通過(guò)SVM(Support Vector Machine,支持向量機(jī))對(duì)圖像中的物體進(jìn)行檢測(cè),從而得到圖像中的各類(lèi)物體出現(xiàn)的概率。由于SVM的權(quán)重向量的個(gè)數(shù)較少,賦予SVM的學(xué)習(xí)能力有限,因而檢測(cè)精度不高,誤檢率和漏檢率較高。
技術(shù)實(shí)現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供了一種基于圖像的物體檢測(cè)方法、裝置及服務(wù)器。
根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種基于圖像的物體檢測(cè)方法,該方法可以包括:
在一實(shí)施例中,對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量;
基于字典學(xué)習(xí)的方法對(duì)所述頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
在一實(shí)施例中,所述對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量,包括:
遍歷所述圖像,確定包含圖像中的物體的多個(gè)窗口;
確定各所述多個(gè)窗口中出現(xiàn)物體的概率;
基于所述概率對(duì)所述多個(gè)窗口進(jìn)行篩除處理,將剩下的窗口確定為目標(biāo)窗口;
識(shí)別所述目標(biāo)窗口中的物體,確定所述物體的類(lèi)別;
確定每類(lèi)物體在所述圖像中出現(xiàn)的次數(shù),得到各類(lèi)物體的頻次向量。
在一實(shí)施例中,所述遍歷所述圖像,包括:
通過(guò)滑動(dòng)窗口的方式遍歷所述圖像。
在一實(shí)施例中,所述對(duì)所述多個(gè)窗口進(jìn)行篩除處理,包括:
確定各所述多個(gè)窗口的概率是否低于設(shè)定概率閾值;
將所述多個(gè)窗口中概率低于所述設(shè)定概率閾值的窗口確定為第一窗口;
去除所述第一窗口。
在一實(shí)施例中,所述對(duì)所述多個(gè)窗口進(jìn)行篩除處理,包括:
對(duì)于所述多個(gè)窗口中具有重合的兩個(gè)窗口,確定所述兩個(gè)窗口的交集面積和并集面積;
計(jì)算所述交集面積和并集面積的比值;
在所述比值大于設(shè)定比值閾值時(shí),去除所述兩個(gè)窗口中概率較低的窗口,保留所述兩個(gè)窗口中概率較高的窗口;
在所述比值不大于所述設(shè)定比值閾值時(shí),保留所述兩個(gè)窗口。
在一實(shí)施例中,所述基于字典學(xué)習(xí)的方法對(duì)所述頻次向量進(jìn)行編碼,包括:
確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,所述字典值為常量;
基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
計(jì)算使得第一值最小的編碼值。
在一實(shí)施例中,所述基于字典學(xué)習(xí)的方法對(duì)所述頻次向量進(jìn)行編碼,包括:
確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值;
基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
設(shè)定元參數(shù);
基于所述元參數(shù)和所述編碼值確定用于表示編碼值的稀疏以及用于調(diào)節(jié)所述編碼誤差的第二值;
計(jì)算使得所述第一值和所述第二值的和最小的編碼值。
在一實(shí)施例中,所述計(jì)算使得所述第一值和所述第二值的和最小的編碼值,包括:
通過(guò)下式計(jì)算使得所述第一值和所述第二值的和最小的編碼值:
其中,為所述第一值,λ||xi||1為所述第二值,yi表示對(duì)第i個(gè)物體進(jìn)行檢測(cè)的檢測(cè)結(jié)果,D表示用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,xi表示與各個(gè)yi對(duì)應(yīng)的編碼值,λ表示元參數(shù)。
在一實(shí)施例中,所述元參數(shù)的取值范圍包括10-3-103。
根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種基于圖像的物體檢測(cè)裝置,包括:
檢測(cè)模塊,被配置為對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量;
編碼模塊,被配置為基于字典學(xué)習(xí)的方法對(duì)所述檢測(cè)模塊得到的所述頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
在一實(shí)施例中,所述檢測(cè)模塊包括:
遍歷子模塊,被配置為遍歷所述圖像,確定包含圖像中的物體的多個(gè)窗口;
第一確定子模塊,被配置為確定各所述多個(gè)窗口中出現(xiàn)物體的概率;
處理子模塊,被配置為基于所述概率對(duì)所述多個(gè)窗口進(jìn)行篩除處理,將剩下的窗口確定為目標(biāo)窗口;
識(shí)別子模塊,被配置為識(shí)別所述目標(biāo)窗口中的物體,確定所述物體的類(lèi)別;
第二確定子模塊,被配置為確定每類(lèi)物體在所述圖像中出現(xiàn)的次數(shù),得到各類(lèi)物體的頻次向量。
在一實(shí)施例中,所述遍歷子模塊包括:
第一遍歷子模塊,被配置為通過(guò)滑動(dòng)窗口的方式遍歷所述圖像。
在一實(shí)施例中,所述處理子模塊包括:
第三確定子模塊,被配置為確定各所述多個(gè)窗口的概率是否低于設(shè)定概率閾值;
第四確定子模塊,被配置為將所述多個(gè)窗口中概率低于所述設(shè)定概率閾值的窗口確定為第一窗口;
第一去除子模塊,被配置為去除所述第一窗口。
在一實(shí)施例中,所述處理子模塊包括:
第五確定子模塊,被配置為對(duì)于所述多個(gè)窗口中具有重合的兩個(gè)窗口,確定所述兩個(gè)窗口的交集面積和并集面積;
第一計(jì)算子模塊,被配置為計(jì)算所述交集面積和并集面積的比值;
第二去除子模塊,被配置為在所述比值大于設(shè)定比值閾值時(shí),去除所述兩個(gè)窗口中概率較低的窗口,保留所述兩個(gè)窗口中概率較高的窗口;
保留子模塊,被配置為在所述比值不大于所述設(shè)定比值閾值時(shí),保留所述兩個(gè)窗口。
在一實(shí)施例中,所述編碼模塊包括:
第六確定子模塊,被配置為確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,所述字典值為常量;
第七確定子模塊,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
第二計(jì)算子模塊,被配置為計(jì)算使得第一值最小的編碼值。
在一實(shí)施例中,所述編碼模塊包括:
第八確定子模塊,被配置為確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值;
第九確定子模塊,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
設(shè)定子模塊,被配置為設(shè)定元參數(shù);
第十確定子模塊,被配置為基于所述元參數(shù)和所述編碼值確定用于表示編碼值的稀疏以及用于調(diào)節(jié)所述編碼誤差的第二值;
第三計(jì)算子模塊,被配置為計(jì)算使得所述第一值和所述第二值的和最小的編碼值。
在一實(shí)施例中,所述第三計(jì)算子模塊通過(guò)下式計(jì)算使得所述第一值和所述第二值的和最小的編碼值:
其中,為所述第一值,λ||xi||1為所述第二值,yi表示對(duì)第i個(gè)物體進(jìn)行檢測(cè)的檢測(cè)結(jié)果,D表示用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,xi表示與各個(gè)yi對(duì)應(yīng)的編碼值,λ表示元參數(shù)。
在一實(shí)施例中,所述元參數(shù)的取值范圍包括10-3-103。
根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種服務(wù)器,包括:處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:
對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量;
基于字典學(xué)習(xí)的方法對(duì)所述頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
本公開(kāi)中與相關(guān)技術(shù)中直接將物體在圖像中出現(xiàn)的頻率作為檢測(cè)結(jié)果所不同的是,服務(wù)器可以通過(guò)字典學(xué)習(xí)的方法,獲取圖像中各個(gè)物體的頻次向量,并利用編碼對(duì)以頻次向量所表示的檢測(cè)結(jié)果進(jìn)行修正,從而降低誤檢率和漏檢率,提高檢測(cè)準(zhǔn)確率和完整性。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。
圖1是本公開(kāi)根據(jù)一示例性實(shí)施例示出的一種基于圖像的物體檢測(cè)方法流程圖。
圖2A是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法流程圖。
圖2B是本公開(kāi)根據(jù)一示例性實(shí)施例示出的一種基于圖像的物體檢測(cè)方法的應(yīng)用場(chǎng)景示意圖。
圖2C是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法的應(yīng)用場(chǎng)景示意圖。
圖2D是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法的應(yīng)用場(chǎng)景示意圖。
圖2E是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法的應(yīng)用場(chǎng)景示意圖。
圖3是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法流程圖。
圖4是本公開(kāi)根據(jù)一示例性實(shí)施例示出的一種基于圖像的物體檢測(cè)裝置框圖。
圖5是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖6是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖7是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖8是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖9是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖10是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖。
圖11是本公開(kāi)根據(jù)一示例性實(shí)施例示出的一種用于基于圖像的物體檢測(cè)裝置的一結(jié)構(gòu)示意圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開(kāi)相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本公開(kāi)的一些方面相一致的裝置和方法的例子。
在本公開(kāi)使用的術(shù)語(yǔ)是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本公開(kāi)。在本公開(kāi)和所附權(quán)利要求書(shū)中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語(yǔ)“和/或”是指并包含一個(gè)或多個(gè)相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。
應(yīng)當(dāng)理解,盡管在本公開(kāi)可能采用術(shù)語(yǔ)第一、第二、第三等來(lái)描述各種信息,但這些信息不應(yīng)限于這些術(shù)語(yǔ)。這些術(shù)語(yǔ)僅用來(lái)將同一類(lèi)型的信息彼此區(qū)分開(kāi)。例如,在不脫離本公開(kāi)范圍的情況下,第一信息也可以被稱(chēng)為第二信息,類(lèi)似地,第二信息也可以被稱(chēng)為第一信息。取決于語(yǔ)境,如在此所使用的詞語(yǔ)“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”。
如圖1所示,圖1是根據(jù)一示例性實(shí)施例示出的一種基于圖像的物體檢測(cè)方法流程圖,該方法可以用于終端中,本公開(kāi)中的終端可以是任何具有上網(wǎng)功能的智能終端,例如,可以具體為手機(jī)、平板電腦、PDA(Personal Digital Assistant,個(gè)人數(shù)字助理)等。其中,終端可以通過(guò)無(wú)線局域網(wǎng)接入路由器,并通過(guò)路由器訪問(wèn)公網(wǎng)上的服務(wù)器。該方法可以包括以下步驟:
在步驟101中、對(duì)圖像中的物體進(jìn)行檢測(cè),得到圖像中包含的各類(lèi)物體的頻次向量。
本申請(qǐng)實(shí)施例中,圖像可以為任意包含物體的圖像,例如,在辦公室圖像中,包含顯示器、鼠標(biāo)、鍵盤(pán)、電腦桌、杯子、椅子、筆筒等多類(lèi)物體,而且有些物體可能具有多個(gè),例如電腦桌上放置有兩個(gè)水杯,三支筆。
其中,物體的頻次向量指的是物體在圖像中出現(xiàn)的次數(shù)。
在步驟102中、基于字典學(xué)習(xí)的方法對(duì)頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
本申請(qǐng)實(shí)施例中,與相關(guān)技術(shù)中直接將物體在圖像中出現(xiàn)的頻率作為檢測(cè)結(jié)果所不同的是,通過(guò)字典學(xué)習(xí)的方法,獲取圖像中各個(gè)物體的頻次向量,并利用編碼對(duì)以頻次向量所表示的檢測(cè)結(jié)果進(jìn)行修正,從而降低誤檢率和漏檢率,提高檢測(cè)準(zhǔn)確率和完整性。
下面以具體實(shí)施例來(lái)說(shuō)明本公開(kāi)實(shí)施例提供的技術(shù)方案。
如圖2A所示,圖2A是根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法流程圖,圖2B-2E是根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法的應(yīng)用場(chǎng)景圖,在圖2B所示的場(chǎng)景中,包括作為終端的智能手機(jī)和通過(guò)網(wǎng)絡(luò)與智能手機(jī)連接的服務(wù)器,該方法可以包括步驟201-208:
在步驟201中、遍歷圖像,確定包含圖像中的物體的多個(gè)窗口。
在一實(shí)施例中,如圖2B所示,服務(wù)器接收終端上傳的圖像,并以設(shè)定的區(qū)域?yàn)閱挝?,通過(guò)滑動(dòng)窗口的方式遍歷該圖像,以進(jìn)行物體檢測(cè),從而保證圖像中的所有物體都能夠被檢測(cè)到,避免漏檢。
在步驟202中、通過(guò)SVM計(jì)算各個(gè)窗口中物體出現(xiàn)的概率。
在一實(shí)施例中,可以以像素為單位遍歷圖像,像素的個(gè)數(shù)可以預(yù)先設(shè)置,例如,在100*100像素的圖像中,以橫向和豎向都是10個(gè)像素為單位對(duì)整個(gè)圖像進(jìn)行分割,得到10個(gè)區(qū)域。對(duì)于每個(gè)區(qū)域,以滑動(dòng)窗口的方式,如圖2C所示,滑動(dòng)窗口從位置11到位置12,確定多個(gè)不同大小的窗口,并通過(guò)SVM的方法,計(jì)算各類(lèi)物體在各個(gè)窗口出現(xiàn)的概率。
在步驟203中、基于所計(jì)算的概率對(duì)多個(gè)窗口進(jìn)行篩除處理,將剩下的窗口確定為目標(biāo)窗口。
在一個(gè)實(shí)施例中,在每個(gè)區(qū)域的多個(gè)窗口中,有的窗口可能與所包含的物體的大小一致,有的窗口可能與所包含的物體的大小不一致,甚至有的窗口中可能不包含物體。因而可以設(shè)置概率閾值,例如將概率大于0.3的窗口確認(rèn)為包含物體,物體大小與窗口大小的一致度較高的窗口,將概率小于0.3的窗口確認(rèn)為不包含物體的窗口。因而可以去除不包含物體的窗口。
在一個(gè)實(shí)施例中,有些窗口的重合度較高,相差較小,為了提高檢測(cè)效率,可以僅保留重合度較高的窗口中的一個(gè)窗口。
在一實(shí)施例中,可以采用非極大抑制算法去除多個(gè)窗口中重合度高的窗口。
對(duì)于面積上有交集的兩個(gè)窗口,計(jì)算其面積交集和面積并集的比,若該比值大于設(shè)定閾值,則認(rèn)為重合度較高,去除兩個(gè)窗口中概率較小的窗口,僅保留兩個(gè)窗口中概率較大的窗口;如果該比值小于設(shè)定閾值,則認(rèn)為重合度較低,兩個(gè)窗口都可以保留。在一實(shí)施例中,該設(shè)定閾值可以為0.7。通過(guò)去重處理,去除重合度較高的窗口,得到目標(biāo)窗口。如圖2D所示的多個(gè)窗口重合度較高,經(jīng)過(guò)非極大抑制算法進(jìn)行去重處理之后,得到的如圖2E所示的圖中僅保留一個(gè)窗口。
在步驟204中,識(shí)別目標(biāo)窗口中的物體,確定物體的類(lèi)別。
在一實(shí)施例中,終端中可以存儲(chǔ)各種物體的圖片及對(duì)應(yīng)的類(lèi)別,為了能夠精確識(shí)別物體,可以存儲(chǔ)每類(lèi)物體的各個(gè)角度的圖片。那么在對(duì)目標(biāo)窗口中的物體進(jìn)行識(shí)別時(shí),可以將窗口中的物體圖像與預(yù)先存儲(chǔ)的圖像進(jìn)行一一比對(duì),從而確定物體的類(lèi)別。
在步驟205中、確定每類(lèi)物體在圖像中出現(xiàn)的次數(shù),得到各類(lèi)物體的頻次向量。
在步驟206中、確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值。
在字典學(xué)習(xí)方法中,使用字典值來(lái)表示至少兩類(lèi)物體在同一圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性,例如,辦公桌和顯示器同時(shí)出現(xiàn)在同一圖像中的關(guān)聯(lián)性。字典值為常量,可以通過(guò)對(duì)大量圖像樣本進(jìn)行訓(xùn)練學(xué)習(xí)獲得。字典學(xué)習(xí)方法用于對(duì)頻次向量進(jìn)行編碼,得到編碼值。
在一個(gè)實(shí)施例中,字典值可以用于表示某類(lèi)物體的出現(xiàn)次數(shù)最多的值。舉例而言,圖像的檢測(cè)結(jié)果為y=[y1,y2,...,y100],將其分為10等份,并對(duì)每一份求取平均值,得到10個(gè)平均值,將該10個(gè)平均值構(gòu)成對(duì)角矩陣,就得到字典值D。
在步驟207中,基于字典值、頻次向量以及編碼的編碼值確定用于表示編碼誤差的第一值。
在一實(shí)施例中,該第一值可以通過(guò)下述式(1)來(lái)表示:
假設(shè)給定圖像集合其中N表示圖像集合中的圖像數(shù)量,假設(shè)通過(guò)物體檢測(cè)器例如SVM對(duì)第i個(gè)圖像Ii的檢測(cè)結(jié)果為yi=[yi1,yi2,...,yiM],其中yi1表示第1類(lèi)物體在第i個(gè)圖像中出現(xiàn)的頻次向量,yi2表示第2類(lèi)物體在第i個(gè)圖像中出現(xiàn)的頻次向量,共有M類(lèi)物體,以此類(lèi)推,那么圖像集合的檢測(cè)結(jié)果可以表示為Y=[y1,...,yN];xi表示與各個(gè)yi對(duì)應(yīng)的編碼值;D表示字典值,用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性。
在步驟208中,確定使得第一值最小的編碼值。
在式(1)中,yi表示通過(guò)SVM對(duì)物體進(jìn)行檢測(cè)的檢測(cè)結(jié)果;Dxi用于對(duì)檢測(cè)結(jié)果進(jìn)行修正和微調(diào),因而yi和Dxi之間的誤差不能太大。因而在一實(shí)施例中,可以通過(guò)計(jì)算第一值的最小值來(lái)計(jì)算編碼值。
至此,本公開(kāi)實(shí)施例提供的上述方法,通過(guò)字典值來(lái)修正基于SVM的物體檢測(cè)結(jié)果的正確性,能夠有效降低誤檢率和錯(cuò)檢率。
如圖3所示,圖3是根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)方法流程圖,該方法在上述步驟201-208的基礎(chǔ)上,在步驟207之后,還可以包括步驟301-303:
在步驟301中,設(shè)定元參數(shù)。
其中,元參數(shù)的設(shè)置范圍可以為10-3~103。
在步驟302中,基于元參數(shù)和編碼值確定用于表示編碼值的稀疏以及用于調(diào)節(jié)編碼誤差的第二值。
在一實(shí)施例中,第二值可以通過(guò)下述式(2)來(lái)表示:
λ||xi||1 (2)
在一實(shí)施例中,第二值用于保證編碼值的稀疏性,并用于調(diào)節(jié)編碼誤差。舉例而言,在λ=0時(shí),xi的值絕大多數(shù)不為0,那么xi并不稀疏,這種情況下的修正效果就并不好,因而需要λ取較為適中的值,以保證xi的稀疏性。
在步驟303中,計(jì)算使得第一值和第二值的和最小的編碼值。
在一實(shí)施例中,計(jì)算使得下式(3)成立的編碼值:
至此,本公開(kāi)實(shí)施例提供的上述方法,采用字典學(xué)習(xí)方法對(duì)物體頻次向量進(jìn)行編碼,利用了物體頻次向量低秩稀疏的特性,使得編碼結(jié)果具有錯(cuò)誤恢復(fù)功能,并基于元參數(shù)調(diào)整編碼值的稀疏性,降低編碼誤差,從而降低了誤檢率和漏檢率,提高物體檢測(cè)的準(zhǔn)確性。
與前述基于圖像的物體檢測(cè)方法實(shí)施例相對(duì)應(yīng),本公開(kāi)還提供了基于圖像的物體檢測(cè)裝置及其所應(yīng)用的服務(wù)器的實(shí)施例。
如圖4所示,圖4是本公開(kāi)根據(jù)一示例性實(shí)施例示出的一種基于圖像的物體檢測(cè)裝置框圖,該裝置可以應(yīng)用在服務(wù)器中,并用于執(zhí)行圖1所示實(shí)施例的方法,所述裝置可以包括:檢測(cè)模塊410和編碼模塊420。
檢測(cè)模塊410,被配置為對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量;
編碼模塊420,被配置為基于字典學(xué)習(xí)的方法對(duì)所述檢測(cè)模塊得到的所述頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
如圖5所示,圖5是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖4所示實(shí)施例的基礎(chǔ)上,檢測(cè)模塊410可以包括:遍歷子模塊411、第一確定子模塊412、處理子模塊413、識(shí)別子模塊414和第二確定子模塊415。
遍歷子模塊411,被配置為遍歷所述圖像,確定包含圖像中的物體的多個(gè)窗口;
第一確定子模塊412,被配置為確定各所述多個(gè)窗口中出現(xiàn)物體的概率;
處理子模塊413,被配置為基于所述概率對(duì)所述多個(gè)窗口進(jìn)行篩除處理,將剩下的窗口確定為目標(biāo)窗口;
識(shí)別子模塊414,被配置為識(shí)別所述目標(biāo)窗口中的物體,確定所述物體的類(lèi)別;
第二確定子模塊415,被配置為確定每類(lèi)物體在所述圖像中出現(xiàn)的次數(shù),得到各類(lèi)物體的頻次向量。
如圖6所示,圖6是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖5所示實(shí)施例的基礎(chǔ)上,遍歷子模塊411可以包括:第一遍歷子模塊416。
第一遍歷子模塊416,被配置為通過(guò)滑動(dòng)窗口的方式遍歷所述圖像。
如圖7所示,圖7是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖5所示實(shí)施例的基礎(chǔ)上,處理子模塊413可以包括:第三確定子模塊417、第四確定子模塊418和第一去除子模塊419。
第三確定子模塊417,被配置為確定各所述多個(gè)窗口的概率是否低于設(shè)定概率閾值;
第四確定子模塊418,被配置為將所述多個(gè)窗口中概率低于所述設(shè)定概率閾值的窗口確定為第一窗口;
第一去除子模塊419,被配置為去除所述第一窗口。
如圖8所示,圖8是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖5所示實(shí)施例的基礎(chǔ)上,處理子模塊413可以包括:第五確定子模塊4110、第一計(jì)算子模塊4111、第二去除子模塊4112和保留子模塊4113。
第五確定子模塊4110,被配置為對(duì)于所述多個(gè)窗口中具有重合的兩個(gè)窗口,確定所述兩個(gè)窗口的交集面積和并集面積;
第一計(jì)算子模塊4111,被配置為計(jì)算所述交集面積和并集面積的比值;
第二去除子模塊4112,被配置為在所述比值大于設(shè)定比值閾值時(shí),去除所述兩個(gè)窗口中概率較低的窗口,保留所述兩個(gè)窗口中概率較高的窗口;
保留子模塊4113,被配置為在所述比值不大于所述設(shè)定比值閾值時(shí),保留所述兩個(gè)窗口。
如圖9所示,圖9是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖5所示實(shí)施例的基礎(chǔ)上,編碼模塊420可以包括:第六確定子模塊421、第七確定子模塊422和第二計(jì)算子模塊423。
第六確定子模塊421,被配置為確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,所述字典值為常量;
第七確定子模塊422,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
第二計(jì)算子模塊423,被配置為計(jì)算使得第一值最小的編碼值。
如圖10所示,圖10是本公開(kāi)根據(jù)一示例性實(shí)施例示出的另一種基于圖像的物體檢測(cè)裝置框圖,該實(shí)施例在前述圖5所示實(shí)施例的基礎(chǔ)上,編碼模塊420可以包括:第八確定子模塊424、第九確定子模塊425、設(shè)定子模塊426、第十確定子模塊427和第三計(jì)算子模塊428。
第八確定子模塊424,被配置為確定用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值;
第九確定子模塊425,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;
設(shè)定子模塊426,被配置為設(shè)定元參數(shù);
第十確定子模塊427,被配置為基于所述元參數(shù)和所述編碼值確定用于表示編碼值的稀疏以及用于調(diào)節(jié)所述編碼誤差的第二值;
第三計(jì)算子模塊428,被配置為計(jì)算使得第一值和第二值的和最小的編碼值。
其中,元參數(shù)的取值范圍包括10-3-103。
其中,第三計(jì)算子模塊428通過(guò)下式計(jì)算使得所述第一值和所述第二值的和最小的編碼值:
其中,為所述第一值,λ||xi||1為所述第二值,yi表示對(duì)第i個(gè)物體進(jìn)行檢測(cè)的檢測(cè)結(jié)果,D表示用于表示至少兩類(lèi)物體在圖像中同時(shí)出現(xiàn)的關(guān)聯(lián)性的字典值,xi表示與各個(gè)yi對(duì)應(yīng)的編碼值,λ表示元參數(shù)。上述圖4至圖10示出的基于圖像的物體檢測(cè)裝置實(shí)施例可以應(yīng)用在服務(wù)器中。
關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。
對(duì)于裝置實(shí)施例而言,由于其基本對(duì)應(yīng)于方法實(shí)施例,所以相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本公開(kāi)方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
如圖11所示,圖11是根據(jù)一示例性實(shí)施例示出的一種用于基于圖像的物體檢測(cè)裝置1100的一結(jié)構(gòu)示意圖。例如,裝置1100可以被提供為一服務(wù)器。參照?qǐng)D11,裝置1100包括處理組件1122,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器1132所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理部件1122的執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器1132中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件1122被配置為執(zhí)行指令,以執(zhí)行上述基于圖像的物體檢測(cè)方法。
其中,處理組件1122中的其中一個(gè)處理器可以被配置為:
對(duì)圖像中的物體進(jìn)行檢測(cè),得到所述圖像中包含的各類(lèi)物體的頻次向量;
基于字典學(xué)習(xí)的方法對(duì)所述頻次向量進(jìn)行編碼,將得到的編碼值作為物體檢測(cè)的結(jié)果。
本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的發(fā)明后,將容易想到本公開(kāi)的其它實(shí)施方案。本公開(kāi)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。
以上所述僅為本公開(kāi)的較佳實(shí)施例而已,并不用以限制本公開(kāi),凡在本公開(kāi)的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本公開(kāi)保護(hù)的范圍之內(nèi)。