對象識別設(shè)備和方法
【專利摘要】本發(fā)明公開了一種對象識別設(shè)備和方法,所述對象識別設(shè)備包括:邊緣方向分布模式計算裝置,被配置為計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為候選對象的多個局部邊緣方向分布模式特征;以及分類器,被配置為基于多個局部邊緣方向分布模式特征對候選對象進行分類。
【專利說明】對象識別設(shè)備和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明總體上涉及圖像處理領(lǐng)域,具體涉及模式識別和人機交互領(lǐng)域,更具體地,本發(fā)明涉及一種用于對象識別的設(shè)備和方法。
【背景技術(shù)】
[0002]在計算機視覺應(yīng)用中,基于數(shù)字圖像或視頻輸入的自動對象識別是一項重要技術(shù)。作為對象識別系統(tǒng)的前端,快速有效的對象識別方法是非常重要的,尤其對于低計算能力的裝置比如移動電話、平板電腦等而言更是如此。對象識別中的難點在于如何提取描述對象的穩(wěn)定特征。
[0003]傳統(tǒng)的方法通常設(shè)計一些簡單的規(guī)則來定義海量的基本特征,然后使用機器學(xué)習(xí)方法比如boosting通過大量訓(xùn)練樣本來選擇出一些最有效的特征構(gòu)成分類器,將目標對象與背景區(qū)分開?,F(xiàn)有的特征包括例如類Haar矩形特征、局部二值模式(LBP)、梯度方向直方圖(HOG)等。
[0004]但是,這些方法都存在一些缺陷。例如,類Haar特征太簡單,為獲得滿意的性能,學(xué)習(xí)得到的分類器通常要包括上千個矩形特征。大量的特征提取使得訓(xùn)練過程和測試過程都十分耗時。另外,采用LBP特征的優(yōu)點在于不受圖像灰度的整體變換的影響,但是,如果灰度反轉(zhuǎn),該特征會改變較大。如圖1所示,當對象(例如,杯子)處于不同亮度的背景,例如如圖1a所示處于暗背景和如圖1b所示處于亮背景中時,同樣位置的LBP特征完全不一樣。相比而言,HOG特征對背景灰度反轉(zhuǎn)較為魯棒,但是該特征向量是由4個局部直方圖級聯(lián)得到的高維向量(例如,36維)。在這種高維的特征空間中訓(xùn)練弱分類器十分耗時,因此只能承受較簡單的弱分類器,例如線性支持向量機(SVM)。
【發(fā)明內(nèi)容】
[0005]在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
[0006]鑒于【背景技術(shù)】部分所述的需求,本發(fā)明關(guān)注于采用局部邊緣方向分布模式特征進行分類以識別對象。由于所采用的特征的候選集小、表示簡單且不受背景灰度反轉(zhuǎn)的影響,因此本發(fā)明可以在降低計算量的同時提供更好的識別性能。
[0007]因此,根據(jù)本發(fā)明的一個方面,提供了一種對象識別設(shè)備,包括:邊緣方向分布模式計算裝置,被配置為計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為所述候選對象的多個局部邊緣方向分布模式特征;以及分類器,被配置為基于所述多個局部邊緣方向分布模式特征對所述候選對象進行分類。
[0008]根據(jù)本發(fā)明的另一個方面,提供了一種對象識別方法,包括:計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為所述候選對象的多個局部邊緣方向分布模式特征;以及使用分類器基于所述多個局部邊緣方向分布模式特征對所述候選對象進行分類。
[0009]依據(jù)本發(fā)明的其它方面,還提供了相應(yīng)的計算機程序代碼、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
[0010]通過以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例的詳細說明,本發(fā)明的這些以及其他優(yōu)點將更加明顯。
【專利附圖】
【附圖說明】
[0011]為了進一步闡述本發(fā)明的以上和其它優(yōu)點和特征,下面結(jié)合附圖對本發(fā)明的【具體實施方式】作進一步詳細的說明。所述附圖連同下面的詳細說明一起包含在本說明書中并且形成本說明書的一部分。具有相同的功能和結(jié)構(gòu)的元件用相同的參考標號表示。應(yīng)當理解,這些附圖僅描述本發(fā)明的典型示例,而不應(yīng)看作是對本發(fā)明的范圍的限定。在附圖中:
[0012]圖1a是示出了對象處于暗背景中的圖;
[0013]圖1b是示出了對象處于亮背景中的圖;
[0014]圖2示出了根據(jù)本發(fā)明的一個實施例的對象識別設(shè)備的結(jié)構(gòu);
[0015]圖3示出了根據(jù)本發(fā)明的一個實施例的對象識別設(shè)備中的邊緣方向分布模式計算裝置的結(jié)構(gòu);
[0016]圖4示出了根據(jù)本發(fā)明的一個實施例的邊緣方向的概率分布計算的實例的圖;
[0017]圖5示出了根據(jù)本發(fā)明的一個實施例對圖4中的直方圖進行二值化的圖;
[0018]圖6示出了根據(jù)本發(fā)明的一個實施例的對象識別方法的流程圖;
[0019]圖7示出了根據(jù)本發(fā)明的一個實施例的對象識別方法中計算每個局部區(qū)域的邊緣方向分布模式的步驟的流程圖;以及
[0020]圖8是其中可以實現(xiàn)根據(jù)本發(fā)明的實施例的方法和/或設(shè)備的通用個人計算機的示例性結(jié)構(gòu)的框圖。
【具體實施方式】
[0021]在下文中將結(jié)合附圖對本發(fā)明的示范性實施例進行描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實際實施例的過程中必須做出很多特定于實施方式的決定,以便實現(xiàn)開發(fā)人員的具體目標,例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費時的,但對得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。
[0022]在此,還需要說明的一點是,為了避免因不必要的細節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的設(shè)備結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細節(jié)。
[0023]下文中的描述按如下順序進行:
[0024]1.對象識別設(shè)備
[0025]1-1.邊緣方向分布模式計算裝置
[0026]i)邊緣提取模塊[0027]i i )概率分布計算模塊
[0028]iii) 二值化模塊
[0029]1-2.分類器
[0030]2.對象識別方法
[0031]3.用以實施本申請的設(shè)備和方法的計算設(shè)備
[0032][1.對象識別設(shè)備]
[0033]首先參照圖2描述根據(jù)本發(fā)明的實施例的對象識別設(shè)備的結(jié)構(gòu)。如圖2所示,對象識別設(shè)備100包括邊緣方向分布模式計算裝置101和分類器102。其中,邊緣方向分布模式計算裝置101被配置為計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為所述候選對象的多個局部邊緣方向分布模式特征。分類器102被配置為基于所述多個局部邊緣方向分布模式特征對所述候選對象進行分類。
[0034]具體地,當向?qū)ο笞R別設(shè)備100中輸入一幅圖像時,對象識別設(shè)備100可以用不同尺寸的滑動窗口掃描圖像,以檢測不同位置、不同大小的對象。相應(yīng)地,每一個滑動窗口中的圖像為候選對象。對于候選對象,邊緣方向分布模式計算裝置101采用具有某一尺寸的特征窗口對候選對象進行掃描。對于特征窗口所限定的每個局部區(qū)域計算其邊緣方向分布模式。其中,特征窗口的尺寸、位置和長寬比可以任意指定或改變,只要該特征窗口在候選對象的范圍內(nèi)即可。
[0035]當對候選對象的掃描完成之后,邊緣 方向分布模式計算裝置101獲得了一組邊緣方向分布模式作為該候選對象的多個局部邊緣方向分布模式特征,并將這些特征傳遞給分類器102。
[0036]分類器102例如是采用大量的正樣本(表示是對象)和負樣本(表示不是對象)預(yù)先訓(xùn)練得到的。因此,該訓(xùn)練好的分類器102基于從邊緣方向分布模式計算裝置101傳遞來的多個局部邊緣方向分布模式特征,對候選對象進行分類,例如,可以判斷候選對象是否是要檢測的對象。
[0037]下面將參照圖3更進一步地詳細描述邊緣方向分布模式計算裝置101的結(jié)構(gòu)。
[0038]<1-1.邊緣方向分布模式計算裝置〉
[0039]如圖3所示,邊緣方向分布模式計算裝置101包括邊緣提取模塊1001、概率分布計算模塊1002和二值化模塊1003。
[0040]i)邊緣提取模塊
[0041]邊緣提取模塊1001用于提取每個局部區(qū)域內(nèi)的邊緣。作為一個示例,邊緣提取模塊1001可以通過計算局部區(qū)域內(nèi)的梯度向量的分布來提取該局部區(qū)域內(nèi)的邊緣。
[0042]具體地,例如可以通過使用索貝爾(Sobel)算子來實現(xiàn)邊緣的提取,如以下公式
(I)所示。
[0043]Gx (x, y) = Sobelx*I (x, y)
[0044]Gy (x, y) = Sobely*I (x, y)
[0045]G(x, v) = ^Gx(x,yf +G}(x,y)2( I)
[0046]
0其他
【權(quán)利要求】
1.一種對象識別設(shè)備,包括: 邊緣方向分布模式計算裝置,被配置為計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為所述候選對象的多個局部邊緣方向分布模式特征;以及 分類器,被配置為基于所述多個局部邊緣方向分布模式特征對所述候選對象進行分類。
2.根據(jù)權(quán)利要求1所述的對象識別設(shè)備,其中,所述邊緣方向分布模式計算裝置包括: 邊緣提取模塊,被配置為提取所述局部區(qū)域內(nèi)的邊緣; 概率分布計算模塊,被配置為計算所述邊緣的方向的概率分布;以及 二值化模塊,被配置為將所述概率分布二值化,以得到所述局部區(qū)域的邊緣方向分布模式。
3.根據(jù)權(quán)利要求2所述的對象識別設(shè)備,其中,所述邊緣提取模塊被配置為通過計算所述局部區(qū)域內(nèi)的梯度向量的分布來提取所述局部區(qū)域內(nèi)的邊緣。
4.根據(jù)權(quán)利要求3所述的對象識別設(shè)備,其中,所述概率分布計算模塊被配置為將邊緣像素中方向相同的梯度向量的模累加作為該方向的概率,以獲得所述邊緣的方向的概率分布。
5.根據(jù)權(quán)利要求3所述的對象識別設(shè)備,其中,所述概率分布計算模塊被配置為將邊緣像素中方向相同的像素的個數(shù)累加作為該方向的概率,以獲得所述邊緣的方向的概率分布。
6.根據(jù)權(quán)利要求4或5所述的對象識別設(shè)備,其中,所述概率分布計算模塊被配置為將邊緣方向的取值范圍劃分為多個區(qū)間,并將每個區(qū)間內(nèi)的所有方向的概率累加作為邊緣方向位于所述區(qū)間的概率,以得到邊緣方向在所述多個區(qū)間之間的概率分布作為所述邊緣的方向的概率分布。
7.根據(jù)權(quán)利要求2至5中的任意一項所述的對象識別設(shè)備,其中,所述二值化模塊被配置為用數(shù)字I和O進行二值化,并將得到的數(shù)字序列作為所述邊緣方向分布模式特征。
8.根據(jù)權(quán)利要求2所述的對象識別設(shè)備,其中,所述二值化模塊被配置為利用概率的均值或中值作為閾值實施所述二值化。
9.根據(jù)權(quán)利要求1至4中的任意一項所述的對象識別設(shè)備,其中,所述分類器被配置為基于從所述多個局部邊緣方向分布模式中在線選取的子集中的局部邊緣方向分布模式特征對所述候選對象進行分類。
10.一種對象識別方法,包括: 計算候選對象的多個局部區(qū)域中每個局部區(qū)域的邊緣方向分布模式,作為所述候選對象的多個局部邊緣方向分布模式特征;以及 使用分類器基于所述多個局部邊緣方向分布模式特征對所述候選對象進行分類。
【文檔編號】G06K9/62GK103514453SQ201210203740
【公開日】2014年1月15日 申請日期:2012年6月15日 優(yōu)先權(quán)日:2012年6月15日
【發(fā)明者】范偉, 皆川明洋, 孫俊, 堀田悅伸, 直井聰 申請人:富士通株式會社