專利名稱:一種確定圖像中的特征點(diǎn)位置的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種確定圖像中的特征點(diǎn)位置的 方法及裝置。
背景技術(shù):
人臉圖像是計算機(jī)視覺系統(tǒng)中人機(jī)交互最便捷的方式之一 。人臉定位就是 在圖像或圖像序列中確定所有人臉的位置,而人臉跟蹤則是持續(xù)跟蹤視頻序列 中的一個或多個人臉的位置。人臉定位與跟蹤技術(shù)不僅是人臉識別、表情識別、 人臉合成等技術(shù)的必要前提,而且其在智能人機(jī)交互、視頻會議、智能監(jiān)控、 視頻檢索等領(lǐng)域有著廣泛的應(yīng)用價值。現(xiàn)有技術(shù)中在人臉定位領(lǐng)域應(yīng)用非常廣泛的活動形狀才莫型(ASM, Active Shape Models )是一種基于主元分析方法(PCA )、目標(biāo)活動形狀特征的參數(shù)模 型。ASM算法基于點(diǎn)分布實現(xiàn),由一個事先訓(xùn)練好的模型獲取目標(biāo)區(qū)域各個 分布點(diǎn)的位置,進(jìn)而確定目標(biāo)區(qū)域各個輪廓的形狀。常用的ASM模型大都基 于人臉面部灰度或邊界特征實現(xiàn),這類方法對光照等干擾非常敏感,而且不同 人臉面部的灰度數(shù)據(jù)差別巨大,導(dǎo)致針對部分人臉訓(xùn)練的模型無法應(yīng)用于更多 的人臉。蓋博(Gabor)特征在人臉識別等領(lǐng)域應(yīng)用非常廣泛,其可為人臉圖像提 供多尺度、多方向的精細(xì)描述,表現(xiàn)出優(yōu)秀的時頻聚集性,具備很強(qiáng)的刻畫細(xì) 節(jié)與局部結(jié)構(gòu)的能力。Gabor特征具有帶通濾波的性質(zhì),既能部分地抵抗慢變 光照的影響,也能濾去一些高頻噪聲。發(fā)明內(nèi)容本發(fā)明實施例提供了 一種確定圖像中的特征點(diǎn)位置的方法及裝置,用以解 決現(xiàn)有技術(shù)中存在的圖像特征點(diǎn)定位精度不高的問題。本發(fā)明實施例提供的 一種確定圖像中的特征點(diǎn)位置的方法包括 預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模型和蓋博Gabor特征模型組成的活動形狀模型ASM;對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置,并根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征;結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn) 的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征進(jìn)行匹配,確定 所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的位置。本發(fā)明實施例提供的 一種確定圖像中的特征點(diǎn)位置的裝置包括訓(xùn)練單元,用于預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模 型和蓋博Gabor特征^t型組成的活動形狀模型ASM;初始位置單元,用于對輸入圖像進(jìn)行才企測,獲取所述輸入圖像的目標(biāo)區(qū)域 內(nèi)的特征點(diǎn)的初始位置;Gabor特征單元,用于根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域 內(nèi)的特征點(diǎn)的Gabor特征;匹配單元,用于結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目標(biāo) 區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征 進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的位置。本發(fā)明實施例,預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模 型和Gabor特征模型組成的活動形狀模型ASM;通過對輸入圖像進(jìn)行檢測, 獲取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置,并根據(jù)該初始位置計算 所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征;結(jié)合所述目標(biāo)區(qū)域的形 狀模型,對所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的 準(zhǔn)確位置,從而提高了輸入圖像特征點(diǎn)定位結(jié)果的精確度。
圖1為本發(fā)明實施例提供的訓(xùn)練模型的特征點(diǎn)標(biāo)定示意圖; 圖2為本發(fā)明實施例提供的一種確定圖像中的特征點(diǎn)位置的方法的流程示 意圖;圖3為本發(fā)明實施例提供的特征點(diǎn)定位結(jié)果示意圖; 圖4為本發(fā)明實施例提供的特征點(diǎn)跟蹤結(jié)果示意圖; 圖5為本發(fā)明實施例提供的一種確定圖像中的特征點(diǎn)位置的裝置的結(jié)構(gòu)示意圖。
具體實施方式
本發(fā)明實施例提供了 一種確定圖像中的特征點(diǎn)位置的方法及裝置,用以實 現(xiàn)對采集圖像中的特征點(diǎn)進(jìn)行準(zhǔn)確地實時定位及跟蹤。本發(fā)明實施例以確定圖像中的人臉特征點(diǎn)位置為例,介紹了如何快速獲取 圖像中的各個姿態(tài)的人臉面部的特征點(diǎn),如嘴角點(diǎn)、眼角點(diǎn)等,并對這些特征 點(diǎn)進(jìn)行持續(xù)、快速地跟蹤。當(dāng)然,根據(jù)本發(fā)明實施例提供的技術(shù)方案,也可以 實現(xiàn)對圖像中的汽車、動物等其他物體的特征點(diǎn)進(jìn)行定位及跟蹤。本發(fā)明實施例將Gabor特征應(yīng)用于人臉特征的抽取,將Gabor特征與ASM 結(jié)合起來,在ASM模型的各個特征點(diǎn)計算Gabor特征,根據(jù)Gabor特征進(jìn)行 各個特征點(diǎn)位置的迭代搜索,最終獲取圖像中的各個特征點(diǎn)的精確位置。本發(fā)明實施例首先需要訓(xùn)練人臉(圖像中的目標(biāo)區(qū)域)的ASM模型,該 模型包括人臉的形狀模型和Gabor特征模型兩部分。事先采集數(shù)千幅多姿態(tài)人臉圖像樣本,手工標(biāo)定這些樣本中的人臉的10 個特征點(diǎn)的位置,如圖1所示,為一副標(biāo)準(zhǔn)人臉圖像的IO個特征點(diǎn)的示意圖。首先訓(xùn)練人臉的形狀模型。將人臉面部的特征點(diǎn)表示為S,每個人臉包含了 10個特征點(diǎn)的jc坐標(biāo)和y坐標(biāo)。將標(biāo)準(zhǔn)人臉圖像作為訓(xùn)練樣本,定位標(biāo)準(zhǔn) 人臉圖像中的IO個特征點(diǎn)的位置,如圖1所示。將所有歸一化后的各個特征點(diǎn)的坐標(biāo)組成一個列向量s,對所有的s進(jìn)行PCA變換,獲取均值特征向量s。、 w個最大的特征值,以及對應(yīng)的"個特征向 量^' = 1,2,...,",這樣,任意輸入圖像的人臉特征點(diǎn)的坐標(biāo)組成的向量可近似表 示為s。與= 1,2,...,"的線'l"生求和 n其中,凡是^的線性加權(quán)系數(shù)。均值特征向量s。、"個最大的特征值,以 及對應(yīng)的《個特征向量^,/ = 1,2,...,"組成了人臉的ASM形狀才莫型。 二維Gabor濾波器的沖激響應(yīng)表示為其中,方差 cr = 2;r , 本發(fā)明實施例中考慮了 5個頻率v:0,…,4, 8個方向 〃 =0,...,7,則有h 、COS^ ;r可以看出,本發(fā)明共計算了 5x8=40個濾波器。對某個特征點(diǎn),以該特征 點(diǎn)為中心,將各個Gabor濾波器的沖激響應(yīng)與輸入圖像進(jìn)行巻積,可獲取對應(yīng) 的Gabor特征,共有40個濾波器,因此在該點(diǎn)獲取40維Gabor特征。本發(fā)明實施例采用Gabor特征來描述各個特征點(diǎn)的局部特征,計算各個特 征點(diǎn)的多維Gabor特征,并將一個輸入圖像的所有特征點(diǎn)的Gabor特征組成一 個一維向量G,每個特征點(diǎn)對應(yīng)的Gabor特征有40維,特征點(diǎn)有十個,則該 向量共有400維。根據(jù)前面計算的仿射變換系數(shù)將輸入圖像中的人臉歸一化到標(biāo)準(zhǔn)的尺寸, 接著再對人臉進(jìn)行灰度的歸一化。根據(jù)歸一化后所有人臉的灰度和特征點(diǎn)的位 置計算各點(diǎn)的Gabor特征,將各個人臉?biāo)刑卣鼽c(diǎn)的Gabor特征組成一維向量G。對所有人臉的一維向量G進(jìn)行PCA變換,獲取均值特征向量Go、 m個最 大的特征值,及對應(yīng)的m個特征向量《,/ = 1,2,...,附,這樣任意人臉的Gabor特 征向量可近似表示為G。與G,/ = 1,2,...,w的線性求和附其中,/1,是G,的線性加權(quán)系數(shù)。均值特征向量Go、 w個最大的特征值以 及對應(yīng)的m個特征向量0,,/ = 1,2,...^組成了人臉的ASM特征模型,該模型基于 Gabor特征實現(xiàn)。本發(fā)明采用訓(xùn)練好的ASM模型對人臉進(jìn)行特征點(diǎn)定位,下面結(jié)合附圖詳 細(xì)介紹本發(fā)明特征點(diǎn)定位的具體實現(xiàn)方式。參見圖2,本發(fā)明實施例提供的一種確定圖像中的特征點(diǎn)位置的方法具體 包括5201、 通過攝像頭采集輸入圖像。5202、 對輸入圖像進(jìn)行多姿態(tài)人臉檢測與跟蹤,通過活動外觀模型(AAM, Active Appearance Models)算法獲取輸入圖像上的人臉特征點(diǎn)的仿射變換系 數(shù)。通過人臉圖像樣本訓(xùn)練,分別獲得人臉正面與半側(cè)面檢測模型,并確定AAM 人臉模型;利用所述人臉正面與半側(cè)面檢測模型,對輸入的視頻圖像進(jìn)行人臉 檢測,確定一幀圖像中是否存在人臉;如果在某幀圖像中檢測到人臉,則在后 續(xù)幀中追蹤并驗證該人臉。應(yīng)用該方法,可以追蹤檢測多姿態(tài)的人臉,且能克 服與人臉膚色相近的非人臉區(qū)域干擾的缺點(diǎn),并能確保多姿態(tài)人臉的持續(xù)跟蹤 和檢測算法的穩(wěn)定性,并獲取人臉的平面旋轉(zhuǎn)角度,輸出人臉的準(zhǔn)確尺寸。5203、 根據(jù)仿射變換系數(shù)確定輸入圖像上的人臉特征點(diǎn)的初始位置,并根 據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征。5204、 結(jié)合預(yù)先設(shè)置的人臉的形狀模型,對所述輸入圖像上的人臉的特征 點(diǎn)的Gabor特征與Gabor特征模型中的Gabor特征進(jìn)行匹配,獲得輸入圖像上的人臉的特征點(diǎn)的準(zhǔn)確位置。5205、 采用平移速度估算(Lucas-Kanade )算法對當(dāng)前輸入圖像(簡稱圖 像A)的人臉特征點(diǎn)進(jìn)行跟蹤,獲得該輸入圖像的下一幀輸入圖像(簡稱圖像 B)的人臉特征點(diǎn)的估算位置。5206、 結(jié)合圖像B的人臉特征點(diǎn)的定位結(jié)果,對圖像B的估算位置進(jìn)行 修正,確保圖像B的人臉特征點(diǎn)的跟蹤結(jié)果不會出錯,從而進(jìn)一步提高確定每 一幀輸入圖像的人臉特征點(diǎn)的位置的準(zhǔn)確性。步驟S202根據(jù)標(biāo)準(zhǔn)圖像的特征點(diǎn)位置,計算輸入圖像的特征點(diǎn)的仿射變 換系數(shù),該仿射變換系數(shù)包含了旋轉(zhuǎn)角度、縮放比例和平移尺寸。步驟S203根據(jù)輸入圖像的人臉特征點(diǎn)的仿射變換系數(shù),對輸入圖像的10 個特征點(diǎn)的初始位置進(jìn)行幾何歸一化,獲取歸一化后的各個特征點(diǎn)的初始位 置。步驟S204中,設(shè)輸入到ASM定位算法的歸一化后的人臉圖像為/ ,這幅 圖通過多姿態(tài)人臉檢測算法得到的人臉中心點(diǎn)位置、人臉尺寸以及人臉的旋轉(zhuǎn) 角度求得。下面需要計算合適的PCA線性加權(quán)系數(shù)^和仿射變換系數(shù)9 = {仏},根據(jù) 這些參數(shù)獲取任一人臉的10個特征點(diǎn)的位置,再根據(jù)這些特征點(diǎn)位置和輸入 圖像/計算各特征點(diǎn)的Gabor特征,并對這些Gabor特征組成的向量與訓(xùn)練模 型的Gabor向量進(jìn)行匹配,兩組向量的均方和的差應(yīng)該盡可能的小,即使下式 最小[G0+|>,G,-G(/,S(p,q))]2 其中,S(p,q)表示由線性加權(quán)系數(shù)和仿射變換系數(shù)獲取的輸入圖像的特征點(diǎn)的位置,G(/,S(p,q》表示輸入圖像的特征點(diǎn)位置對應(yīng)計算的Gabor特征向量。 較佳地,本發(fā)明實施例采用基于Lucas-Kanade算法的迭代搜索方法計算參 數(shù)p和q,進(jìn)而確定特征點(diǎn)位置。每次迭代都更新一次p和q,經(jīng)過有限次迭代后,搜索計算完成,返回的p和q的值即可作為最后的結(jié)果,根據(jù)這兩個參 數(shù)即可獲取各特征點(diǎn)的最終位置。下面兩個表達(dá)式給出了每次迭代計算p和q 時的更新公式△p = H(p)-,。 ,sub(G/[G。 —G(/,S(p,q))]其中,H是Hessian矩陣,則有HO^[VG。lu(G,/p7G。嘗],)丄[VG。^] w—表示[VG。!]向G,組成的子空間的正交空間投影,該向量為"維 列向量,其中第乂項為K,⑨=[VG。 |^]sub(c ": (內(nèi)=VG。, _藝[G,. VG。 f ]G, 3巧 S ^q的計算公式與p類似??梢钥闯?,本發(fā)明實施例在實現(xiàn)過程中采用了 Lucas-Kanade反算算法,在訓(xùn)練時計算VG。、嘗、孕,由此可計算出K々)、Ky(g)、 H(p)和H(q)。大部分的計算量在預(yù)先訓(xùn)練4莫型時已經(jīng)完成了 ,而迭代收斂時僅需要進(jìn)行如下步驟 的計算.-步驟一根據(jù)變換數(shù)據(jù)對圖像進(jìn)行處理,獲取變換后的特征點(diǎn)s(p,q),并計算Gabor特征G"S(P,q》;步驟二計算差值數(shù)據(jù)G?!狦(7,s(P,q)); 步驟三計算Ap和Aq;步驟四..更新P-P + Ap,q-q + Aq,獲取新的S(P,q)。迭代收斂時需要計算的數(shù)據(jù)量非常小,因此,本發(fā)明實施例可實現(xiàn)快速的 特征點(diǎn)定位。較佳地,本發(fā)明實施例在計算VG。時,可直4妄由前面的Gabor特征對x和 y求導(dǎo)kk」Mx kk="exp(-11 〈 2 )[exp(Zk乂x)]/k乂--"exp(- 1 ; 1 2 )[expO'k,)]-5xcr 2cr cr 2cr 2<r ||x||由于Gabor特征的計算是通過對鄰域范圍內(nèi)的點(diǎn)的像素值求巻積得到的, 上式中第二項包含了對x的乘積,這項經(jīng)巻積后 一般會遠(yuǎn)小于第 一項巻積后的結(jié)果,因此,本發(fā)明實施例近似認(rèn)為巻積后Gabor特征的梯度值中第一項比較 大,第二項近似為零,由此可得到各點(diǎn)的Gabor特征的梯度表達(dá)式為▽G = !k;G由這個公式即可計算出所有點(diǎn)的VG。。本發(fā)明實施例通過采用這種方法, 使得確定Gabor特征的梯度的算法更筒單,效率也非常高,盡管是近似結(jié)果, 但對最終的定位結(jié)果沒有影響,可以說是一種非常有效的方法。由于本發(fā)明實施例釆用的多姿態(tài)人臉檢測算法已將輸入圖像的人臉區(qū)分 為正面、左側(cè)、右側(cè)人臉,因此,較佳地,本發(fā)明實施例為左側(cè)、右側(cè)、正面 人臉分別訓(xùn)練ASM模型,根據(jù)輸入圖像的人臉的姿態(tài)信息選用不同的ASM模 型進(jìn)行人臉特征點(diǎn)的定位,進(jìn)一 步提高特征點(diǎn)定位的精度。較佳地,本發(fā)明實施例在特征點(diǎn)定位時考慮了兩級分辨率,先對輸入圖像 的人臉進(jìn)行較大比例的縮放,在低分辨率上定位,再降低縮放的比例,以低分 辨率定位結(jié)果作為初始值,在較高的分辨率上對特征點(diǎn)再次進(jìn)行定位,由此可 保證較高的特征點(diǎn)定位精度,同時還可大幅度提高定位的效率。較佳地,本發(fā)明實施例主要應(yīng)用于視頻序列中人臉特征點(diǎn)的實時定位與跟 蹤。假設(shè)通過本發(fā)明實施例提供的定位與跟蹤算法已經(jīng)獲取前一幀輸入圖像中 的人臉特征點(diǎn)的位置,為了獲取當(dāng)前輸入圖像中的人臉特征點(diǎn)的準(zhǔn)確位置,本 發(fā)明實施例采用基于Lucas-Kanade的平移速度估算算法快速、精確地估算出相 鄰幀輸入圖像中的同 一人臉的平移矢量,確定當(dāng)前輸入圖像上同 一人臉特征點(diǎn) 的準(zhǔn)確位置。由于Lucas-Kanade算法僅在人臉發(fā)生平移時估算準(zhǔn)確的平移矢量,如人臉發(fā)生旋轉(zhuǎn)、縮放等變換,則這個算法的估算的結(jié)果精度不太高,因
此,進(jìn)一步,本發(fā)明實施例還隨時采用ASM定位結(jié)果對跟蹤結(jié)果進(jìn)行修正,
在不降低工作效率的前提下提高點(diǎn)定位的精度。
本發(fā)明實施例針對每幀輸入圖像都對跟蹤結(jié)果進(jìn)行修正,為了提高整個算 法的處理效率,本發(fā)明實施例還可以在每幀輸入圖像都對輸入圖像的人臉進(jìn)行 低分辨率定位,而隔上幾幀進(jìn)行高分辨率定位,由這些定位結(jié)果對跟蹤結(jié)果進(jìn) 行修正。在每次修正時都計算跟蹤結(jié)果和定位結(jié)果的相似度,根據(jù)這個相似度 進(jìn)行加權(quán)比較,返回最終的結(jié)果。由于低分辨率定位結(jié)果要粗略一些,因此修 正時跟蹤結(jié)果權(quán)重要大一些,而高分辨率定位結(jié)果精確一些,修正時定位結(jié)果 權(quán)重要大一些。采用這種方法后平均每幀人臉特征點(diǎn)的定位與跟蹤時間可控制
在10ms以內(nèi),可滿足實時處理的需要,且可降低系統(tǒng)CPU的占用率。
如圖3所示,為采用本發(fā)明實施例提供的方法得到的單幅輸入圖像的人臉
特征點(diǎn)定位結(jié)果示意圖;如圖4所示,為采用本發(fā)明實施例提供的方法得到的
基于視頻的人臉特征點(diǎn)跟蹤結(jié)果示意圖。
下面介紹一下本發(fā)明實施例提供的裝置。
參見圖5,本發(fā)明實施例提供的一種確定圖像中的特征點(diǎn)位置的裝置包括
訓(xùn)練單元50,用于預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀 模型和Gabor特征模型組成的活動形狀模型ASM。
初始位置單元51,用于對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū) 域內(nèi)的特征點(diǎn)的初始位置。
Gabor特征單元52,用于根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū) 域內(nèi)的特征點(diǎn)的Gabor特征。
匹配單元53,用于結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目 標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特 征進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的準(zhǔn)確位置。
較佳地,所述初始位置單元51包括仿射變換系數(shù)單元511,用于對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的 目標(biāo)區(qū)域的仿射變換系數(shù)。
確定單元512,用于通過所述仿射變換系數(shù)確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn) 的初始位置。
較佳地,所述仿射變換系數(shù)單元511,采用活動外觀模型算法,計算所述 輸入圖像的目標(biāo)區(qū)域的仿射變換系數(shù)。
較佳地,本發(fā)明實施例提供的一種確定圖像中的特征點(diǎn)位置的裝置還包
括
跟蹤單元54,用于采用基于Lucas-Kanade的平移速度估算算法對所述輸 入圖像的目標(biāo)區(qū)域的特征點(diǎn)進(jìn)行跟蹤,確定所述輸入圖像的下一幀輸入圖像的 目標(biāo)區(qū)域的特征點(diǎn)的估算位置。
較佳地,本發(fā)明實施例提供的 一種確定圖像中的特征點(diǎn)位置的裝置還包
括
修正單元55,用于根據(jù)對所述輸入圖像的下一幀輸入圖像的目標(biāo)區(qū)域的特 征點(diǎn)進(jìn)行定位的結(jié)果,對所述估算位置進(jìn)行修正。
綜上所述,本發(fā)明實施例實時地對輸入視頻流中的人臉特征點(diǎn)進(jìn)行定位。 對于實時輸入的視頻圖像,本發(fā)明實施例在多姿態(tài)人臉檢測與跟蹤算法的基礎(chǔ) 上,檢測視頻圖像中的人臉,獲取人臉框以及姿態(tài)信息,接著采用AAM算法 計算人臉的平面仿射變換系數(shù),根據(jù)仿射變換系數(shù)獲取當(dāng)前人臉10個特征點(diǎn) 的初始位置,再采用事先訓(xùn)練好的基于Gabor特征的ASM模型進(jìn)行迭代收斂, 獲取較準(zhǔn)確的特征點(diǎn)位置。進(jìn)一步,本發(fā)明實施例還對獲取的特征點(diǎn)位置進(jìn)行 持續(xù)跟蹤,結(jié)合前一幀輸入圖像的特征點(diǎn)的跟蹤結(jié)果和人臉圖像,采用基于 Lucas-Kanade的平移速度估算算法預(yù)測前一幀輸入圖像的各個特征點(diǎn)的平移 速度,獲取當(dāng)前幀輸入圖像的特征點(diǎn)的位置。另外,由于在人臉面部器官劇烈 運(yùn)動時,某些特征點(diǎn)的跟蹤會出錯,本發(fā)明實施例進(jìn)一步采用特征點(diǎn)定位結(jié)果 對跟蹤結(jié)果進(jìn)行修正,確保特征點(diǎn)跟蹤的穩(wěn)定性。本發(fā)明實施例不僅適用于人臉面部特征點(diǎn)定位,還可用于各類圖像中輪廓 特征的獲取,如人臉的外輪廓、手的輪廓等,本發(fā)明具有一定的通用性。
明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1. 一種確定圖像中的特征點(diǎn)位置的方法,其特征在于,該方法包括預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模型和蓋博Gabor特征模型組成的活動形狀模型ASM;對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置,并根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征;結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的位置。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,對輸入圖像進(jìn)行檢測,獲 取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置的步驟包括對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域的仿射變換系數(shù); 通過所述仿射變換系數(shù)確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于,采用活動外觀模型算法, 計算所述輸入圖像的目標(biāo)區(qū)域的仿射變換系數(shù)。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括 采用平移速度估算算法對所述輸入圖像的目標(biāo)區(qū)域的特征點(diǎn)進(jìn)行跟蹤,確定所述輸入圖像的下一幀輸入圖像的目標(biāo)區(qū)域的特征點(diǎn)的估算位置。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,該方法還包括 根據(jù)對所述輸入圖像的下一幀輸入圖像的目標(biāo)區(qū)域的特征點(diǎn)進(jìn)行定位的結(jié)果,對所述估算位置進(jìn)行修正。
6、 一種確定圖像中的特征點(diǎn)位置的裝置,其特征在于,該裝置包括訓(xùn)練單元,用于預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模 型和蓋博Gabor特征模型組成的活動形狀模型ASM;初始位置單元,用于對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置;Gabor特征單元,用于根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域 內(nèi)的特征點(diǎn)的Gabor特征;匹配單元,用于結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目標(biāo) 區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征 進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的位置。
7、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述初始位置單元包括 仿射變換系數(shù)單元,用于對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域的仿射變換系數(shù);確定單元,用于通過所述仿射變換系數(shù)確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初 始位置。
8、 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述仿射變換系數(shù)單元, 釆用活動外觀模型算法,計算所述輸入圖像的目標(biāo)區(qū)域的仿射變換系數(shù)。
9、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,該裝置還包括 跟蹤單元,用于采用平移速度估算算法對所述輸入圖^f象的目標(biāo)區(qū)域的特征點(diǎn)進(jìn)行跟蹤,確定所述輸入圖像的下一幀輸入圖像的目標(biāo)區(qū)域的特征點(diǎn)的估算 位置。
10、 根據(jù)權(quán)利要求9所述的裝置,其特征在于,該裝置還包括 修正單元,用于根據(jù)對所述輸入圖像的下一幀輸入圖像的目標(biāo)區(qū)域的特征點(diǎn)進(jìn)行定位的結(jié)果,對所述估算位置進(jìn)行修正。
全文摘要
本發(fā)明公開了一種確定圖像中的特征點(diǎn)位置的方法及裝置,用以解決現(xiàn)有技術(shù)中存在的特征點(diǎn)定位精度不高的問題。本發(fā)明提供的一種確定圖像中的特征點(diǎn)位置的方法包括預(yù)先基于圖像樣本訓(xùn)練得到由圖像上的目標(biāo)區(qū)域的形狀模型和蓋博Gabor特征模型組成的活動形狀模型ASM;對輸入圖像進(jìn)行檢測,獲取所述輸入圖像的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的初始位置,并根據(jù)所述初始位置計算所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征;結(jié)合所述目標(biāo)區(qū)域的形狀模型,對所述輸入圖像上的目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的Gabor特征與所述Gabor特征模型中的特征點(diǎn)的Gabor特征進(jìn)行匹配,確定所述目標(biāo)區(qū)域內(nèi)的特征點(diǎn)的位置。
文檔編號G06K9/62GK101271520SQ20081010324
公開日2008年9月24日 申請日期2008年4月1日 優(yōu)先權(quán)日2008年4月1日
發(fā)明者浩 王, 謝東海, 英 黃 申請人:北京中星微電子有限公司