本公開涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種目標(biāo)識別方法及裝置、人臉識別方法及裝置。
背景技術(shù):
方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子,它通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。HOG特征結(jié)合SVM分類器已經(jīng)被廣泛應(yīng)用于圖像識別中,例如,人臉關(guān)鍵點定位方法,其用于檢測出人臉上的關(guān)鍵部件(眼睛、鼻子、嘴巴等)的位置,是人臉識別中的一個不可或缺的步驟,也在一些視頻實時的應(yīng)用中顯示出了很大的威力,例如視頻中的實時美顏。在這種視頻實時處理的任務(wù)中,由于視頻一秒鐘有幾十幀圖片,所以對算法運行速度的要求非常高。
已有技術(shù)中,基于級聯(lián)線性回歸的人臉關(guān)鍵點定位算法包括:首先初始化一個人臉關(guān)鍵點位置P0,然后在初始化位置處提取HOG特征,然后使用線性回歸對該HOG特征進行回歸計算,得到一個坐標(biāo)更新量ΔP0,然后更新人臉關(guān)鍵點的坐標(biāo)位置P1=P0+ΔP0,完成人臉關(guān)鍵點坐標(biāo)的一次迭代。同樣的,下一次迭代也是在人臉關(guān)鍵點的當(dāng)前位置提取HOG特征,計算坐標(biāo)更新量,更新位置。該算法往往需要多次迭代才能收斂,因此也需要多次的計算HOG特征,由于HOG特征的計算過程需要計算每個像素點的梯度方向,所以這里有一些重復(fù)計算,耗時較大,效率較低。
技術(shù)實現(xiàn)要素:
本公開實施例提供目標(biāo)識別方法及裝置、人臉識別方法及裝置。所述技術(shù)方案如下:
根據(jù)本公開實施例的第一方面,提供一種目標(biāo)識別方法,包括:
獲取目標(biāo)圖像;
獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;
其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
其中,根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖,包括:
確定當(dāng)前的梯度方向區(qū)間;
對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
將位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
其中,提取所述目標(biāo)圖像中的HOG特征,包括:
確定當(dāng)前的梯度方向區(qū)間;
確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
其中,所述方法還包括:
迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束成條件為止。
其中,所述目標(biāo)圖像為人臉圖像。
其中,所述方法還包括:
對所述HOG特征進行回歸計算,得到所述人臉圖像中人臉關(guān)鍵點的坐標(biāo)更新量;
根據(jù)所述人臉關(guān)鍵點的坐標(biāo)更新量更新所述人臉關(guān)鍵點的當(dāng)前坐標(biāo);
迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束條件為止。
根據(jù)本公開實施例的第二方面,提供一種目標(biāo)識別裝置,包括:
第一獲取模塊,被配置為獲取目標(biāo)圖像;
第二獲取模塊,被配置為獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
第三獲取模塊,被配置為根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取模塊,被配置為提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
其中,所述第三獲取模塊包括:
第一確定子模塊,被配置為確定當(dāng)前的梯度方向區(qū)間;
第一獲取子模塊,被配置為對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
第二獲取子模塊,被配置為將位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
其中,所述提取模塊包括:
第二確定子模塊,被配置為確定當(dāng)前的梯度方向區(qū)間;
第三確定子模塊,被配置為確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
統(tǒng)計子模塊,被配置為通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
其中,所述目標(biāo)識別裝置還包括:
迭代模塊,被配置為迭代執(zhí)行所述提取模塊,直至滿足迭代結(jié)束成條件為止。
其中,所述目標(biāo)圖像為人臉圖像。
其中,所述裝置還包括:
計算模塊,被配置為對所述HOG特征進行回歸計算,得到人臉關(guān)鍵點的坐標(biāo)更新量;
更新模塊,被配置為根據(jù)所述人臉關(guān)鍵點的坐標(biāo)更新量更新所述人臉關(guān)鍵點的當(dāng)前坐標(biāo);
迭代模塊,被配置為迭代執(zhí)行所述提取模塊,直至滿足迭代結(jié)束條件為止。
根據(jù)本公開實施例的第三方面,提供一種目標(biāo)識別裝置,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為:
獲取目標(biāo)圖像;
獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:
上述技術(shù)方案,在目標(biāo)圖像的識別過程中,首先獲取待檢測的目標(biāo)圖像,計算目標(biāo)圖像中每個像素點的梯度方向,并計算每個梯度方向區(qū)間的積分圖;之后,在提取HOG特征時,利用所述積分圖進行直方圖統(tǒng)計,根據(jù)所提取的HOG特征進行目標(biāo)識別。本公開的技術(shù)方案通過采用積分圖的方式,只需要對每個像素點的梯度方向計算一次,避免了在目標(biāo)圖像的識別過程中迭代提取HOG特征時重復(fù)計算像素的梯度方向的問題,有效的加快了算法的運行速度。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實施例示出的目標(biāo)識別方法的流程圖。
圖2是根據(jù)一示例性實施例示出的目標(biāo)識別方法中步驟103的流程圖。
圖3是根據(jù)一示例性實施例示出的目標(biāo)識別方法中步驟104的流程圖。
圖4是根據(jù)一示例性實施例示出的HOG特征提取中梯度方向積分圖利用示意圖。
圖5是根據(jù)一示例性實施例示出的目標(biāo)識別裝置的框圖。
圖6是根據(jù)一示例性實施例示出的目標(biāo)識別裝置中第三獲取模塊503的框圖。
圖7是根據(jù)一示例性實施例示出的目標(biāo)識別裝置中提取模塊504的框圖。
圖8是根據(jù)一示例性實施例示出的適用于目標(biāo)識別裝置的框圖。
具體實施方式
這里將詳細(xì)地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實施例示出的一種目標(biāo)識別方法的流程圖,如圖1所示,所述目標(biāo)識別方法包括以下步驟101-104,
在步驟101中,獲取目標(biāo)圖像;
在步驟102中,獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
在步驟103中,根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
在步驟104中,提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
本實施例中,在目標(biāo)圖像的識別過程中,首先獲取待檢測的目標(biāo)圖像,計算目標(biāo)圖像中每個像素點的梯度方向,并計算每個梯度方向區(qū)間的積分圖;之后,在提取HOG特征時,利用所述積分圖進行直方圖統(tǒng)計,根據(jù)所提取的HOG特征進行目標(biāo)識別。本公開的技術(shù)方案通過采用積分圖的方式,只需要對每個像素點的梯度方向計算一次,避免了在目標(biāo)圖像的識別過程中迭代提取HOG特征時重復(fù)計算像素的梯度方向的問題,有效的加快了算法的運行速度。
在一實施例中,所述目標(biāo)圖像可以是人臉圖像、其他物體圖像等。所述獲取目標(biāo)圖像包括:獲取包括目標(biāo)圖像的輸入圖像;利用檢測方法檢測出目標(biāo)的區(qū)域,進而得到目標(biāo)圖像;所述目標(biāo)圖像可以為所述目標(biāo)所在的矩形區(qū)域,即檢測到的目標(biāo)的外接矩形。所述目標(biāo)圖像為人臉圖像時,可以采用LBP(Local Binary Patterns,局部二值模式)特征和Adaboost迭代算法從輸入圖像中檢測得到人臉圖像。
在一實施例中,獲取所述目標(biāo)圖像中每個像素點的梯度方向之前,需要對所述目標(biāo)圖像進行預(yù)處理。所述預(yù)處理過程包括將所述目標(biāo)圖像進行灰度轉(zhuǎn)換,即將所述目標(biāo)圖像轉(zhuǎn)化為灰度圖,并調(diào)整所述目標(biāo)圖像至預(yù)定大小。像素點的梯度方向的計算包括計算該像素點在水平方向上的梯度dx和豎直方向上的梯度dy,再通過計算得到該像素點的梯度方向。
通過提取HOG特征,并利用提取到的HOG特征進行目標(biāo)識別是目前較為常見的目標(biāo)識別方法,但是在提取HOG特征時,通常做法都是將梯度方向劃分成多個梯度方向區(qū)間,然后針對每個梯度方向區(qū)間分別統(tǒng)計相應(yīng)的直方圖特征。而本公開的一實施例中,在提取HOG特征前預(yù)先獲取梯度方向積分圖,是為了在提取HOG特征時,直接使用梯度方向積分圖中的每個像素點對應(yīng)梯度方向信息,而無需重新計算,避免重復(fù)計算。因此,在獲取梯度方向積分圖時,也是通過將所梯度方向劃分成多個梯度方向區(qū)間,例如,將360度的空間平均劃分為6個梯度方向區(qū)間,每個梯度方向區(qū)間為60度,再針對每個梯度方向區(qū)間計算梯度方向積分圖。在計算梯度方向積分圖時對梯度方向的劃分與在提取HOG特征時對梯度方向的劃分是一致的,即計算梯度方向積分圖和提取HOG特征時所劃分的梯度方向區(qū)間個數(shù)及每個區(qū)間的度數(shù)相同。在本公開的一實施例中,提取了HOG特征后,可以根據(jù)實際所要識別的目標(biāo)選擇合適的算法對目標(biāo)進行識別。例如,所要識別的目標(biāo)為人臉時,可以根據(jù)HOG特征進行人臉關(guān)鍵點定位,進而識別出圖像中的人臉。
在一實施例中,所述梯度方向積分圖可以表示為與所述目標(biāo)圖像大小相同的二維向量;所述每個梯度方向區(qū)間內(nèi)的梯度方向積分圖中任一點的值為所述目標(biāo)圖像從左上角到該點所構(gòu)成的矩形區(qū)域內(nèi)其梯度方向在所述梯度方向區(qū)間內(nèi)的像素點個數(shù),其中,該點的梯度方向等于所述目標(biāo)圖像上該點對應(yīng)像素點的梯度方向。
在一實施例中,如圖2所示,步驟103中根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖,包括:
在步驟201中,確定當(dāng)前的梯度方向區(qū)間;
在步驟202中,對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
在步驟203中,將位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
在本實施例中,計算每個梯度方向區(qū)間的梯度方向積分圖時,從第一個梯度方向區(qū)間開始,確定當(dāng)前的梯度方向區(qū)間。對于目標(biāo)圖像中的任一像素點,計算出該任一像素點在當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分值,并將其作為所述梯度方向積分圖中相應(yīng)位置處的值。而所述任一像素點在當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分值為所述目標(biāo)圖像上左上角到該任一像素點構(gòu)成的矩形區(qū)域(即以左上角到該任一像素點的連線作為對角線的矩形框)內(nèi)的像素點,其梯度方向?qū)儆谒霎?dāng)前的梯度方向的個數(shù)。在計算完每一梯度方向區(qū)間對應(yīng)的梯度方向積分圖之后,將其保存下來。
在一實施例中,如圖3所示,步驟104中提取所述目標(biāo)圖像中的HOG特征,包括:
在步驟301中,確定當(dāng)前的梯度方向區(qū)間;
在步驟302中,確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
在步驟303中,通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
本實施例中,提取HOG特征時,直方圖統(tǒng)計過程為將目標(biāo)圖像劃分成固定大小的多個直方圖統(tǒng)計區(qū)域,如6*6個像素,然后將該直方圖統(tǒng)計區(qū)域的梯度方向劃分成多個梯度方向區(qū)間,此處的劃分方式及梯度方向區(qū)間的大小與前述步驟中計算梯度方向積分圖時的相同,對所述直方圖統(tǒng)計區(qū)域中的每個像素點用所述梯度方向區(qū)間在直方圖中進行投影,就得到該直方圖統(tǒng)計區(qū)域?qū)?yīng)的直方圖了。例如,將6*6個像素的直方圖統(tǒng)計區(qū)域的梯度方向劃分成6個梯度方向區(qū)間,第一個梯度方向區(qū)間為0-60度,第二方向區(qū)間為60-120之間,依次類推。在投影時,直方圖統(tǒng)計區(qū)域中的某一像素點的梯度方向在60-120度之間,則直方圖中對應(yīng)該像素點的值加一,統(tǒng)計完每個像素點對應(yīng)的直方圖的值,則可以得到該直方圖統(tǒng)計區(qū)域的梯度方向直方圖了。
本實施例中,在確定了當(dāng)前的梯度方向區(qū)間以及直方圖統(tǒng)計區(qū)域后,直接利用之前計算得到的當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖來統(tǒng)計。例如,如圖4所示,對于直方圖統(tǒng)計區(qū)域來說,其在梯度方向積分圖S中對應(yīng)的積分區(qū)域R的四個頂點分別為p1、p2、p3、p4,p4為距離梯度方向積分圖S的左上角原點最遠的一個頂點,p1為距離梯度方向積分圖S的左上角原點最近的一個頂點,所述p2和p3為積分區(qū)域S的其他兩個頂點,p1、p2、p3、p4的值分別為位于目標(biāo)圖像中對應(yīng)像素點與左上角原點所構(gòu)成的區(qū)域且梯度方向在該像素點所在梯度方向區(qū)間的像素點個數(shù),因此,在統(tǒng)計直方圖時,只需要獲取對應(yīng)直方圖統(tǒng)計區(qū)域的積分區(qū)域R內(nèi)的像素點個數(shù)即可。因此可以通過下式計算得到積分區(qū)域R內(nèi)的像素點個數(shù):
CountR=p4+p1-p2-p3
因此,所述CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù)。通過本實施例的上述方式,在提取HOG特征時,直接使用前述步驟已經(jīng)計算得到的梯度方向積分圖進行直方圖統(tǒng)計,而不用在每次提取HOG特征時重新計算。
在一實施例中,所述方法還包括:迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束成條件為止。在目標(biāo)識別方法中,提取HOG特征并根據(jù)所述HOG特征對圖像中的目標(biāo)進行識別時,通常都采用迭代算法進行多次迭代,依次逼近的方式最終獲得目標(biāo)檢測的最終結(jié)果。本公開在多次迭代過程中,提取HOG特征時,始終利用預(yù)先獲取得到的梯度方向積分圖得到目標(biāo)圖像的HOG特征,而避免了重復(fù)計算每個像素點的梯度方向,并統(tǒng)計不同梯度方向區(qū)間中像素點個數(shù)這一問題,因此提高了圖像識別效率。
在一實施例中,所述目標(biāo)圖像為人臉圖像。上述目標(biāo)識別方法適用于人臉識別中,如人臉關(guān)鍵點定位方法等。所述方法還包括:對所述HOG特征進行回歸計算,得到人臉關(guān)鍵點的坐標(biāo)更新量;根據(jù)所述人臉關(guān)鍵點的坐標(biāo)更新量更新所述人臉關(guān)鍵點的當(dāng)前坐標(biāo);迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束條件為止。
在一實施例中,進行人臉關(guān)鍵定位時,首先對輸入的圖像進行檢測,以獲取其中的人臉區(qū)域,進而得到人臉圖像。所述人臉圖像為一矩形區(qū)域。在獲得人臉圖像后,將所述人臉圖像進行灰度處理,即將所述人臉圖像轉(zhuǎn)化為灰度圖,并將其大小調(diào)整為預(yù)先設(shè)定的尺寸大小,所述預(yù)先設(shè)的尺寸大小根據(jù)實際情況進行設(shè)置。之后,計算所述人臉圖像中每個像素點在水平方向和數(shù)字方向上的梯度,進而根據(jù)所述水平方向和豎直方向上的梯度計算得到像素點的梯度方向。在計算得到所述人臉圖像中每個像素點的梯度方向后,對每一梯度方向區(qū)間單獨求積分圖S,例如,將梯度方向劃分成了N個梯度方向區(qū)間,則需要得到N個梯度方向積分圖。在人臉關(guān)鍵點定位時,按照平均位置初始化得到所述人臉圖像中人臉關(guān)鍵點位置,然后在人臉關(guān)鍵點當(dāng)前位置處提取HOG特征,具體提取HOG特征的步驟在前面有詳細(xì)介紹,此處不再贅述。提取得到當(dāng)前位置處的HOG特征后,利用回歸算法對所提取的HOG特征進行回歸計算,進而得到人臉關(guān)鍵點位置的坐標(biāo)更新量,根據(jù)人臉關(guān)鍵點的坐標(biāo)更新量更新人臉關(guān)鍵點的當(dāng)前位置,之后再在更新后的人臉關(guān)鍵點的當(dāng)前位置處提取HOG特征,迭代執(zhí)行,直至滿足迭代結(jié)束條件為止。本實施例中,由于每次迭代都需要提取一次HOG特征,即意味著每次迭代都需要計算每個像素點的梯度方向,而本實施例中,在提取HOG特征時,不需要每次迭代時重復(fù)計算每個像素點的梯度方向,而是直接利用預(yù)先計算好的梯度方向積分圖即可獲取提取HOG特征所需要的直方圖信息,節(jié)省了計算步驟,提高了效率。
下述為本公開裝置實施例,可以用于執(zhí)行本公開方法實施例。
圖5是根據(jù)一示例性實施例示出的一種目標(biāo)是把裝置的框圖,該裝置可以通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為電子設(shè)備的部分或者全部。如圖5所示,該目標(biāo)識別的裝置包括:
第一獲取模塊501,被配置為獲取目標(biāo)圖像;
第二獲取模塊502,被配置為獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
第三獲取模塊503,被配置為根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取模塊504,被配置為提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
本實施例中,在目標(biāo)圖像的識別過程中,首先獲取待檢測的目標(biāo)圖像,計算目標(biāo)圖像中每個像素點的梯度方向,并計算每個梯度方向區(qū)間的積分圖;之后,在提取HOG特征時,利用所述積分圖進行直方圖統(tǒng)計。本公開的技術(shù)方案通過采用積分圖的方式,只需要對每個像素點的梯度方向計算一次,避免了在目標(biāo)圖像的識別過程中迭代提取HOG特征時重復(fù)計算像素的梯度方向的問題,有效的加快了算法的運行速度。
在一實施例中,所述目標(biāo)圖像可以是人臉圖像、其他物體圖像等。所述獲取目標(biāo)圖像包括:獲取包括目標(biāo)圖像的輸入圖像;利用檢測方法檢測出目標(biāo)的區(qū)域,進而得到目標(biāo)圖像;所述目標(biāo)圖像為所述目標(biāo)所在的矩形區(qū)域,即檢測到的目標(biāo)的外接矩形。所述目標(biāo)圖像為人臉圖像時,可以采用LBP(Local Binary Patterns,局部二值模式)特征和Adaboost迭代算法從輸入圖像中檢測得到人臉圖像。
在一實施例中,獲取所述目標(biāo)圖像中每個像素點的梯度方向之前,需要對所述目標(biāo)圖像進行預(yù)處理。所述預(yù)處理過程包括將所述目標(biāo)圖像進行灰度轉(zhuǎn)換,即將所述目標(biāo)圖像轉(zhuǎn)化為灰度圖,并調(diào)整所述目標(biāo)圖像至預(yù)定大小。像素點的梯度方向的計算包括計算該像素點在水平方向上的梯度dx和豎直方向上的梯度dy,再通過計算得到該像素點的梯度方向。
在一實施例中,在提取HOG特征時,通常做法都是將梯度方向劃分成多個梯度方向區(qū)間,然后針對每個梯度方向區(qū)間分別統(tǒng)計相應(yīng)的直方圖特征。而本公開中,在提取HOG特征前預(yù)先獲取梯度方向積分圖,是為了在提取HOG特征時,直接使用梯度方向積分圖中的每個像素點對應(yīng)梯度方向信息,而無需重新計算,避免重復(fù)計算。因此,在獲取梯度方向積分圖時,也是通過將所梯度方向劃分成多個梯度方向區(qū)間,例如,將360度的空間平均劃分為6個梯度方向區(qū)間,每個梯度方向區(qū)間為60度,再針對每個梯度方向區(qū)間計算梯度方向積分圖。在計算梯度方向積分圖時對梯度方向的劃分與在提取HOG特征時對梯度方向的劃分是一致的,即計算梯度方向積分圖和提取HOG特征時所劃分的梯度方向區(qū)間個數(shù)及每個區(qū)間的度數(shù)相同。
在一實施例中,所述梯度方向積分圖可以表示為與所述目標(biāo)圖像大小相同的二維向量;所述每個梯度方向區(qū)間內(nèi)的梯度方向積分圖中任一點的值為所述目標(biāo)圖像從左上角到該點所構(gòu)成的矩形區(qū)域內(nèi)其梯度方向在所述梯度方向區(qū)間內(nèi)的像素點個數(shù),其中,該點的梯度方向等于所述目標(biāo)圖像上該點對應(yīng)像素點的梯度方向。
在一實施例中,如圖6所示,所述第三獲取模塊503,包括:
在第一確定子模塊601中,被配置為確定當(dāng)前的梯度方向區(qū)間;
在第一獲取子模塊602中,被配置為對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
在第二獲取子模塊603中,被配置為將位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
在本實施例中,計算每個梯度方向區(qū)間的梯度方向積分圖時,從第一個梯度方向區(qū)間開始,確定當(dāng)前的梯度方向區(qū)間。對于目標(biāo)圖像中的任一像素點,計算出該任一像素點在當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分值,并將其作為所述梯度方向積分圖中相應(yīng)位置處的值。而所述任一像素點在當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分值為所述目標(biāo)圖像上左上角到該任一像素點構(gòu)成的矩形區(qū)域(即以左上角到該任一像素點的連線作為對角線的矩形框)內(nèi)的像素點,其梯度方向?qū)儆谒霎?dāng)前的梯度方向的個數(shù)。在計算完每一梯度方向區(qū)間對應(yīng)的梯度方向積分圖之后,將其保存下來。
在一實施例中,如圖7所示,所述提取模塊504包括:
在第二確定子模塊701中,被配置為確定當(dāng)前的梯度方向區(qū)間;
在第三確定子模塊702中,被配置為確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
在統(tǒng)計子模塊703中,被配置為通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
本實施例中,提取HOG特征時,直方圖統(tǒng)計過程為將目標(biāo)圖像劃分成固定大小的多個直方圖統(tǒng)計區(qū)域,如6*6個像素,然后將該直方圖統(tǒng)計區(qū)域的梯度方向劃分成多個梯度方向區(qū)間,此處的劃分方式及梯度方向區(qū)間的大小與前述步驟中計算梯度方向積分圖時的相同,對所述直方圖統(tǒng)計區(qū)域中的每個像素點用所述梯度方向區(qū)間在直方圖中進行投影,就得到該直方圖統(tǒng)計區(qū)域?qū)?yīng)的直方圖了。例如,將6*6個像素的直方圖統(tǒng)計區(qū)域的梯度方向劃分成6個梯度方向區(qū)間,第一個梯度方向區(qū)間為0-60度,第二方向區(qū)間為60-120之間,依次類推。在投影時,直方圖統(tǒng)計區(qū)域中的某一像素點的梯度方向在60-120度之間,則直方圖中對應(yīng)該像素點的值加一,統(tǒng)計完每個像素點對應(yīng)的直方圖的值,則可以得到該直方圖統(tǒng)計區(qū)域的梯度方向直方圖了。
本實施例中,在確定了當(dāng)前的梯度方向區(qū)間以及直方圖統(tǒng)計區(qū)域后,直接利用之前計算得到的當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖來統(tǒng)計。例如,如圖4所示,對于直方圖統(tǒng)計區(qū)域來說,其在梯度方向積分圖S中對應(yīng)的積分區(qū)域R的四個頂點分別為p1、p2、p3、p4,p4為距離梯度方向積分圖S的左上角原點最遠的一個頂點,p1為距離梯度方向積分圖S的左上角原點最近的一個頂點,所述p2和p3為積分區(qū)域S的其他兩個頂點,p1、p2、p3、p4的值分別為位于目標(biāo)圖像中對應(yīng)像素點與左上角原點所構(gòu)成的區(qū)域且梯度方向在該像素點所在梯度方向區(qū)間的像素點個數(shù),因此,在統(tǒng)計直方圖時,只需要獲取對應(yīng)直方圖統(tǒng)計區(qū)域的積分區(qū)域R內(nèi)的像素點個數(shù)即可。因此可以通過下式計算得到積分區(qū)域R內(nèi)的像素點個數(shù):
CountR=p4+p1-p2-p3
因此,所述CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù)。通過本實施例的上述方式,在提取HOG特征時,直接使用前述步驟已經(jīng)計算得到的梯度方向積分圖進行直方圖統(tǒng)計,而不用在每次提取HOG特征時重新計算。
在一實施例中,所述裝置還包括:迭代模塊,被配置迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束成條件為止。在目標(biāo)識別方法中,提取HOG特征并根據(jù)所述HOG特征對圖像中的目標(biāo)進行識別時,通常都采用迭代算法進行多次迭代,依次逼近的方式最終獲得目標(biāo)檢測的最終結(jié)果。本公開在多次迭代過程中,提取HOG特征時,始終利用預(yù)先獲取得到的梯度方向積分圖得到目標(biāo)圖像的HOG特征,而避免了重復(fù)計算每個像素點的梯度方向,并統(tǒng)計不同梯度方向區(qū)間中像素點個數(shù)這一問題,因此提高了圖像識別效率。
在一實施例中,所述目標(biāo)圖像為人臉圖像。上述目標(biāo)圖像識別裝置適用于人臉識別中,如人臉關(guān)鍵點定位裝置等。所述人臉識別裝置還包括:計算模塊,被配置為對所述HOG特征進行回歸計算,得到人臉關(guān)鍵點的坐標(biāo)更新量;更新模塊,被配置為根據(jù)所述人臉關(guān)鍵點的坐標(biāo)更新量更新所述人臉關(guān)鍵點的當(dāng)前坐標(biāo);迭代模塊,被配置為迭代執(zhí)行所述提取模塊,直至滿足迭代結(jié)束條件為止。
在一實施例中,進行人臉關(guān)鍵定位時,首先對輸入的圖像進行檢測,以獲取其中的人臉區(qū)域,進而得到人臉圖像。所述人臉圖像為一矩形區(qū)域。在獲得人臉圖像后,將所述人臉圖像進行灰度處理,即將所述人臉圖像轉(zhuǎn)化為灰度圖,并將其大小調(diào)整為預(yù)先設(shè)定的尺寸大小,所述預(yù)先設(shè)的尺寸大小根據(jù)實際情況進行設(shè)置。之后,計算所述人臉圖像中每個像素點在水平方向和數(shù)字方向上的梯度,進而根據(jù)所述水平方向和豎直方向上的梯度計算得到像素點的梯度方向。在計算得到所述人臉圖像中每個像素點的梯度方向后,對每一梯度方向區(qū)間單獨求積分圖S,例如,將梯度方向劃分成了N個梯度方向區(qū)間,則需要得到N個梯度方向積分圖。在人臉關(guān)鍵點定位時,按照平均位置初始化得到所述人臉圖像中人臉關(guān)鍵點位置,然后在人臉關(guān)鍵點當(dāng)前位置處提取HOG特征,具體提取HOG特征的步驟在前面有詳細(xì)介紹,此處不再贅述。提取得到當(dāng)前位置處的HOG特征后,利用回歸算法對所提取的HOG特征進行回歸計算,進而得到人臉關(guān)鍵點位置的坐標(biāo)更新量,根據(jù)人臉關(guān)鍵點的坐標(biāo)更新量更新人臉關(guān)鍵點的當(dāng)前位置,之后再在更新后的人臉關(guān)鍵點的當(dāng)前位置處提取HOG特征,迭代執(zhí)行,直至滿足迭代結(jié)束條件為止。本實施例中,由于每次迭代都需要提取一次HOG特征,即意味著每次迭代都需要計算每個像素點的梯度方向,而本實施例中,在提取HOG特征時,不需要每次迭代時重復(fù)計算每個像素點的梯度方向,而是直接利用預(yù)先計算好的梯度方向積分圖即可獲取提取HOG特征所需要的直方圖信息,節(jié)省了計算步驟,提高了效率。
根據(jù)本公開實施例的第三方面,提供一種目標(biāo)識別裝置,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,處理器被配置為:
獲取目標(biāo)圖像;
獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
上述處理器還可被配置為:
其中,根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖,包括:
確定當(dāng)前的梯度方向區(qū)間;
對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
將位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
其中,提取所述目標(biāo)圖像中的HOG特征,包括:
確定當(dāng)前的梯度方向區(qū)間;
確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
其中,所述方法還包括:
迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束成條件為止。
圖8是根據(jù)一示例性實施例示出的一種用于目標(biāo)識別裝置的框圖,該裝置適用于終端設(shè)備。例如,裝置800可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
裝置800可以包括以下一個或多個組件:處理組件802,存儲器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的接口812,傳感器組件814,以及通信組件816。
處理組件802通??刂蒲b置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件802可以包括一個或多個處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模塊,便于處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。
存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在裝置800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件806為裝置800的各種組件提供電力。電源組件806可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件808包括在所述裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當(dāng)裝置800處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(fēng)(MIC),當(dāng)裝置800處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經(jīng)由通信組件816發(fā)送。在一些實施例中,音頻組件810還包括一個揚聲器,用于輸出音頻信號。
I/O接口812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件814包括一個或多個傳感器,用于為裝置800提供各個方面的狀態(tài)評估。例如,傳感器組件814可以檢測到裝置800的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800一個組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件816被配置為便于裝置800和其他設(shè)備之間有線或無線方式的通信。裝置800可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件816還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,裝置800可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
一種非臨時性計算機可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由裝置800的處理器執(zhí)行時,使得裝置800能夠執(zhí)行上述目標(biāo)識別方法,所述方法包括:
獲取目標(biāo)圖像;
獲取所述目標(biāo)圖像中每個像素點的梯度方向,其中所述梯度方向被劃分為多個梯度方向區(qū)間;
根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖;
提取所述目標(biāo)圖像中的HOG特征,以進行目標(biāo)識別;其中,在提取HOG特征時,利用所述每個梯度方向區(qū)間的梯度方向積分圖進行直方圖統(tǒng)計。
其中,根據(jù)所述目標(biāo)圖像中每個像素點的梯度方向,獲取每個梯度方向區(qū)間的梯度方向積分圖,包括:
確定當(dāng)前的梯度方向區(qū)間;
對于所述當(dāng)前的梯度方向區(qū)間內(nèi)的任一像素點,獲取位于所述任一像素點與原點之間的矩形區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù);
將位于所述任一像素點與原點之間的區(qū)域內(nèi)且梯度方向在所述當(dāng)前的梯度方向區(qū)間的像素點個數(shù)作為所述當(dāng)前的梯度方向區(qū)間的所述梯度方向積分圖在所述任一像素點位置處的值。
其中,提取所述目標(biāo)圖像中的HOG特征,包括:
確定當(dāng)前的梯度方向區(qū)間;
確定當(dāng)前的直方圖統(tǒng)計區(qū)域;
通過下式統(tǒng)計所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù):
CountR=p4+p1-p2-p3
其中,CountR為所述直方圖統(tǒng)計區(qū)域內(nèi)在所述當(dāng)前的梯度方向區(qū)間上的像素點個數(shù);p1、p2、p3、p4為所述當(dāng)前的梯度方向區(qū)間對應(yīng)的梯度方向積分圖中所述直方圖統(tǒng)計區(qū)域?qū)?yīng)的積分區(qū)域的四個頂點,其中,p4為距離所述梯度方向積分圖左上角原點最遠的一個頂點,p1為距離所述梯度方向積分圖左上角原點最近的一個頂點,所述p2和p3為其他兩個頂點。
其中,所述方法還包括:
迭代執(zhí)行提取所述目標(biāo)圖像中的HOG特征的步驟,直至滿足迭代結(jié)束成條件為止。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。