專利名稱:一種圖像檢測(cè)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖像檢測(cè)方法及裝置。
背景技術(shù):
人臉特征點(diǎn)位置是人臉識(shí)別和人機(jī)交互等應(yīng)用中最重要的信息之一,對(duì)于 視頻處理技術(shù)而言,如何快速準(zhǔn)確地跟蹤到人臉特征點(diǎn)的位置極為關(guān)鍵。
傳統(tǒng)的人臉部特征點(diǎn)跟蹤方法一般都基于假定幀間跟蹤目標(biāo)具有很強(qiáng)的 相似性,采用最小均方誤差或直方圖等標(biāo)準(zhǔn)來衡量幀間跟蹤目標(biāo)的相似性,找 到最滿足相似性的候選作為跟蹤結(jié)果。
人臉上變化最豐富的器官是嘴巴,對(duì)嘴巴進(jìn)行跟蹤是一個(gè)很困難的問題。
目前嘴巴跟蹤的主要方法是基于活動(dòng)形狀模型(ASM, Active Shape Model) 和活動(dòng)外觀模型(AAM, Active Appearance Model)的實(shí)時(shí)定位跟蹤方法等。
但是,現(xiàn)有的ASM和AAM的算法復(fù)雜,往往需要很大的計(jì)算量,運(yùn)算 起來很慢,并且計(jì)算結(jié)果不夠準(zhǔn)確,無法滿足實(shí)時(shí)處理要求,因此,現(xiàn)有技術(shù) 中的嘴巴檢測(cè)效果并不是很好。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了 一種圖像檢測(cè)方法及裝置,用以降低對(duì)圖像中的嘴巴 進(jìn)行檢測(cè)的復(fù)雜度,并且提高對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的準(zhǔn)確性和速度。 本發(fā)明實(shí)施例提供的一種圖像檢測(cè)方法包括
通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn); 對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重新確定 當(dāng)前幀圖像上的嘴巴特征點(diǎn);利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域 進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
本發(fā)明實(shí)施例提供的 一種圖像檢測(cè)裝置包括
初步確定單元,用于通過對(duì)當(dāng)前幀圖像進(jìn)^f亍嘴巴^f企測(cè),初步確定當(dāng)前幀圖 像上的嘴巴特征點(diǎn);
重新確定單元,用于對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的 局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);
最終確定單元,用于利用預(yù)先設(shè)置的嘴巴才莫型對(duì)所述重新確定的嘴巴特征 點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
本發(fā)明實(shí)施例,通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上 的嘴巴特征點(diǎn);對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜 索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重 新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的 嘴巴特征點(diǎn),從而降低了對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的復(fù)雜度,并且提高了對(duì)圖 像中的嘴巴進(jìn)行檢測(cè)的準(zhǔn)確性和速度。
圖1為本發(fā)明實(shí)施例提供的一種圖像才企測(cè)裝置的結(jié)構(gòu)示意圖; 圖2為本發(fā)明實(shí)施例提供的一種圖像檢測(cè)方法的總體流程示意圖; 圖3為本發(fā)明實(shí)施例提供的一種圖像檢測(cè)方法的具體流程示意圖。
具體實(shí)施例方式
本發(fā)明實(shí)施例提供了 一種圖像檢測(cè)方法及裝置,用以降低對(duì)圖像中的嘴巴 進(jìn)行檢測(cè)的復(fù)雜度,并且提高對(duì)圖像中的嘴巴進(jìn)行;險(xiǎn)測(cè)的準(zhǔn)確性和速度。
本發(fā)明實(shí)施例提供的技術(shù)方案,主要針對(duì)嘴巴的定位與跟蹤,當(dāng)然對(duì)于其 他目標(biāo)物體的定位與跟蹤,同樣也可以采用本發(fā)明實(shí)施例提供的技術(shù)方案。
5本發(fā)明實(shí)施例從整體上分兩步來進(jìn)行嘴巴特征點(diǎn)的跟蹤,第 一步是利用KLT ( Kanade-Lucas-Tomasi)算法來進(jìn)行特征點(diǎn)的跟蹤,第二步利用尺度不變 特征變換(SIFT, Scale Invariant Feature Transform)算法訓(xùn)練嘴巴特征點(diǎn)模型來 進(jìn)行局部精細(xì)搜索,每次跟蹤結(jié)束后都利用ASM模型來對(duì)跟蹤到的所有嘴巴 上的特征點(diǎn)進(jìn)行形狀約束,即通過搜索到的嘴巴特征點(diǎn),確定嘴巴的形狀及位 置。KLT是基于圖像的灰度和梯度信息來對(duì)目標(biāo)物體的特征點(diǎn)進(jìn)行跟蹤的,可 以較準(zhǔn)確的跟蹤灰度變化比較平緩的特征點(diǎn),但是不能跟蹤運(yùn)動(dòng)比較劇烈且灰 度變化明顯的特征點(diǎn)。SIFT特征是一種對(duì)圖像灰度、圖像變形和尺度變換都比 較魯棒的特征,可以用來描述變形比較劇烈的特征點(diǎn),比如嘴巴特征點(diǎn)。ASM 可以從整體上對(duì)跟蹤到的點(diǎn)進(jìn)行形狀約束,使跟蹤后的點(diǎn)在整體形狀上符合嘴 巴的形狀。下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的技術(shù)方案進(jìn)行說明。參見圖1,本發(fā)明實(shí)施例提供的一種圖像檢測(cè)裝置包括初步確定單元ll,用于通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀 圖像上的嘴巴特征點(diǎn)。形狀約束單元12,用于利用預(yù)先設(shè)置的嘴巴模型,對(duì)所述初步確定單元 11初步確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束。重新確定單元13,用于對(duì)所述初步確定單元11初步確定的嘴巴特征點(diǎn)所 在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征 點(diǎn)?;蛘撸瑢?duì)所述形狀約束單元12進(jìn)行形狀約束處理后的嘴巴特征點(diǎn)所在的 位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。也就是說,所述形狀約束單元12是可選的。如果設(shè)置了形狀約束單元12, 則檢測(cè)的效果會(huì)更佳。最終確定單元14,用于利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定單元13 重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。較佳地,所述初步確定單元11包括定位單元21,用于對(duì)采集到的第一幀圖像,進(jìn)行嘴巴特征點(diǎn)定位,初步確 定第一幀圖像上的嘴巴特征點(diǎn);以及,在跟蹤單元23對(duì)當(dāng)前幀圖像進(jìn)行嘴巴 特征點(diǎn)的跟蹤操作失敗時(shí),通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特征點(diǎn)定位,初步確定 當(dāng)前幀圖像上的嘴巴特征點(diǎn)。存儲(chǔ)單元22,用于存儲(chǔ)定位單元21或跟蹤單元23確定的圖像上的嘴巴特 征點(diǎn)所在的位置區(qū)域。跟蹤單元23,用于利用存儲(chǔ)單元22存儲(chǔ)的前一幀圖像上的嘴巴特征點(diǎn)所 在的位置區(qū)域,對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特征點(diǎn)的跟蹤,初步確定當(dāng)前幀圖像上 的嘴巴特征點(diǎn)。較佳地,所述最終確定單元14包括形狀約束單元31,用于利用預(yù)先設(shè)置的嘴巴才莫型對(duì)所述重新確定單元13 重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束。驗(yàn)證單元32,用于利用預(yù)先訓(xùn)練的嘴巴特征點(diǎn),對(duì)經(jīng)過所述形狀約束后的 位置區(qū)域內(nèi)的嘴巴特征點(diǎn)進(jìn)行驗(yàn)證,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。下面進(jìn)ff詳細(xì)i兌明。定位單元21:特征點(diǎn)定位的方法有很多,比較常用的方法包括基于ASM的人臉器官定 位方法、基于AAM的人臉器官定位方法以及基于特征點(diǎn)統(tǒng)計(jì)的方法。ASM方法是利用統(tǒng)計(jì)的方法來得到人臉器官模型的變形規(guī)律,即對(duì)人臉 器官輪廓的樣本進(jìn)行主元分析(PCA, principal component analysis)變換,用 PCA變換得到的主分量來描述人臉輪廓的變形。PCA變換可以從大量的樣本 中提取出最能夠反映樣本變化的主分量,這些主分量分別控制了人臉器官上不 同部分的變化情況。在用ASM進(jìn)行定位時(shí),首先需要定位出人臉器官的初始位置,然后從初始位置出發(fā),根據(jù)邊緣特征來搜索器官輪廓點(diǎn),每次搜索結(jié)束后,用ASM模 型對(duì)搜索后的模型進(jìn)行形狀約束。基于ASM進(jìn)行嘴巴定位時(shí),可以事先收集大量的嘴巴形狀模型,然后訓(xùn) 練出嘴巴ASM模型。這種方法的優(yōu)點(diǎn)是可以根據(jù)ASM模型來對(duì)搜索的結(jié)果 進(jìn)行約束,因此在整體上控制了最終的形狀。AAM與ASM類似,它是對(duì)人臉的灰度進(jìn)行PCA變換,因此在搜索時(shí), 利用人臉灰度信息來進(jìn)行搜索。另外一類定位方法基于特征統(tǒng)計(jì),即對(duì)特定位置的特征進(jìn)行統(tǒng)計(jì),在搜索 時(shí)分別對(duì)每個(gè)特征進(jìn)行搜索。由于對(duì)每個(gè)特征都進(jìn)^f亍了訓(xùn)練,因此該類方法對(duì) 單點(diǎn)定位比較準(zhǔn)確。跟蹤單元23:跟蹤單元23采用KLT跟蹤算法對(duì)嘴巴特征點(diǎn)進(jìn)行跟蹤。KLT算法將跟蹤 問題轉(zhuǎn)換為一個(gè)最優(yōu)化的問題。假設(shè)當(dāng)前幀圖像為G,前一幀圖像為F,特征 點(diǎn)在G中的位置可以利用定位的方法來獲得,設(shè)為",力。跟蹤的目的是在G中 找出F圖像中該特征點(diǎn)的位置。跟蹤模型可以采用最簡(jiǎn)單的平移,數(shù)學(xué)模型可以表示為J]+ Ax,x + A力-,乃))2 ~> min'=0 ...............公式(1 )其中,G(x,力,F(xiàn)(x,力代表了像素點(diǎn)(;c,力的灰度值,Ax:和Ay,代表了像素點(diǎn)0c,力的平移值。公式(1)的作用是找到合適的平移值A(chǔ)x, Ay,使G和平 移后對(duì)應(yīng)的F中的像素值之差的平方和達(dá)到最小。該公式可以用線性最優(yōu)化的 方法(如最小二乘算法)來解算。上述公式中的未知數(shù)為Ax和~ ,利用最小二乘的方法來計(jì)算Ax和Ay 。 首先需要進(jìn)行線性化,公式(1)展開為一階泰勒公式F(x + Ax, y + A力=F(;c, _y) +《Ax + Ay...............公式(2 )每個(gè)特征點(diǎn)對(duì)應(yīng)的誤差項(xiàng)為<formula>formula see original document page 9</formula>...............公式(3)公式(3)就是最小二乘誤差公式,利用每個(gè)特征點(diǎn)都可以得到公式(3), 并且通過矩陣相乘的分解公式可以利用累加的方法計(jì)算出Ax:和Ay最終的解。為了能夠跟蹤到比較劇烈的運(yùn)動(dòng),KLT跟蹤算法一般都是在金字塔圖像上 進(jìn)行的。另外,上述公式只能求出平移量,還可以對(duì)上述^^式進(jìn)行改進(jìn),實(shí)際上, 視頻中的目標(biāo)運(yùn)動(dòng)往往比較復(fù)雜,單純使用平移模型并不能很準(zhǔn)確地描述目標(biāo) 的運(yùn)動(dòng)和幀間的變形。這就需要用更復(fù)雜的模型來描述目標(biāo)的運(yùn)動(dòng),比如可以 用仿射變換來作為運(yùn)動(dòng)的模型,仿射變換的公式如下<formula>formula see original document page 9</formula>...............公式(4)
其中,(x,力是變形前的坐標(biāo),對(duì)應(yīng)了公式(l)中當(dāng)前幀圖像G中的坐標(biāo) 值,(x',力是變形后的坐標(biāo),對(duì)應(yīng)了公式(l)中前一幀圖像F的坐標(biāo)。仿射變 換也是一個(gè)線性變換,所以也可以用最小二乘來解算其6個(gè)未知參數(shù),使KLT 可以跟蹤到發(fā)生了仿射變化的特征點(diǎn)。重新確定單元13:重新確定單元13利用SIFT算法對(duì)嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特 征點(diǎn)的局部搜索,以重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。SIFT是Scale Invariant Feature Transform的縮寫。SIFT算法基于尺度空間理論提出,對(duì)圖像 縮放、旋轉(zhuǎn)甚至仿射變換都能保持不變性。由于SIFT提取的特征具有以上良 好的魯棒性,所以一經(jīng)提出,就成為了研究的熱點(diǎn),在目標(biāo)識(shí)別,特征點(diǎn)提取 和跟蹤,以及圖像搜索等領(lǐng)域方面都有著重要的應(yīng)用。SIFT算法首先在尺度空間進(jìn)行特征檢測(cè),并確定關(guān)鍵點(diǎn)(Keypoints)的位 置和關(guān)鍵點(diǎn)所處的尺度,然后使用關(guān)鍵點(diǎn)鄰域梯度的主方向作為該點(diǎn)的方向特 征,以實(shí)現(xiàn)算子對(duì)尺度和方向的無關(guān)性。SIFT算法提取的SIFT特征向量有如下特性a) SIFT特征是圖像的局部特征,其對(duì)旋轉(zhuǎn)、尺度縮放、亮度變化保持不 變性,對(duì)視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。b) 獨(dú)特性(Distinctiveness)好,信息量豐富,適用于在海量特征數(shù)據(jù)庫(kù)中進(jìn) 行快速、準(zhǔn)確的匹配。c) 多量性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFT特征向量。d) 高速性,經(jīng)優(yōu)化的SIFT匹配算法甚至可以達(dá)到實(shí)時(shí)的要求。e) 可擴(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。SIFT算子在圖像二維平面空間和高斯差分(DoG, Difference ~of-Gaussian) 尺度空間中同時(shí)檢測(cè)局部極值以作為特征點(diǎn),以使特征具備良好的獨(dú)特性和穩(wěn) 定性。DoG算子定義為兩個(gè)不同尺度的高斯核的差分,其具有計(jì)算簡(jiǎn)單的特 點(diǎn),是歸一化高斯提出的拉普拉斯算子(LoG, Laplacian-of-Gaussian)算子的近似。DoG算子如下式所示D(x,少,ct) = (G(x, _y, A:a) - G(jc, _y, a)) * /(>,力 =丄(x,少,A:cj)—〖(x, _y, a)SIFT特征匹配算法包括兩個(gè)階段,第一階段是SIFT特征的生成,即從多幅待匹配圖像中提取出對(duì)尺度縮放、旋轉(zhuǎn)、亮度變化無關(guān)的特征向量;第二階段是SIFT特征向量的匹配。 一幅圖像SIFT特征向量的生成算法總共包括步驟1、 尺度空間極值4企測(cè),用以初步確定關(guān)鍵點(diǎn)位置和所在尺度。2、 通過擬和三維二次函數(shù),用以精確確定關(guān)鍵點(diǎn)的位置和尺度,同時(shí)去 除低對(duì)比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn)(因?yàn)镈oG算子會(huì)產(chǎn)生較強(qiáng)的邊緣 響應(yīng)),用以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。3、 利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù), 使算子具備旋轉(zhuǎn)不變性。4、 生成SIFT特4正向量。10由于SIFT特征的較強(qiáng)的魯棒性,本發(fā)明實(shí)施例利用SIFT算法來計(jì)算嘴巴 上的特征點(diǎn)的特征。為了使特征具有較強(qiáng)的擴(kuò)展性,本發(fā)明實(shí)施例利用較多的 樣本來訓(xùn)練嘴巴特征點(diǎn)。對(duì)每個(gè)嘴巴樣本,提取出特征點(diǎn),然后計(jì)算SIFT特 征,最后將所有利用同一個(gè)位置計(jì)算出來的特征進(jìn)行平均就得到最終的訓(xùn)練結(jié) 果。驗(yàn)證單元32:驗(yàn)證單元32的作用是判斷跟蹤的特征點(diǎn)是否是真實(shí)的嘴巴特征點(diǎn)。由于 嘴巴的變形比較劇烈,所以常常會(huì)出現(xiàn)跟蹤丟失的情況,此時(shí)就需要對(duì)跟蹤的 點(diǎn)進(jìn)行-^i正。驗(yàn)證基于訓(xùn)練的SIFT特征,在跟蹤得到的點(diǎn)附近提取SIFT特征, 然后和訓(xùn)練的結(jié)果進(jìn)行比較,如果相似性較低,那么就認(rèn)為跟蹤失敗。如果嘴 巴上的大部分點(diǎn)驗(yàn)證失敗,那么就認(rèn)為跟蹤失敗,就需要進(jìn)行重新定位。參見圖2,本發(fā)明實(shí)施例提供的一種圖像檢測(cè)方法,總體包括步驟5101、 通it^t當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特 征點(diǎn)。5102、 對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重 新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。S103 、利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置 區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。 較佳地,步驟SIOI包括利用前一幀圖像上的嘴巴特征點(diǎn)所在的位置區(qū)域,對(duì)當(dāng)前幀圖像進(jìn)行嘴巴 特征點(diǎn)的跟蹤,初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。較佳地,若對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特征點(diǎn)的跟蹤操作失敗,則通過對(duì)當(dāng)前 幀圖像進(jìn)行嘴巴特征點(diǎn)定位,初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)'。4交佳地,步驟S101和S102之間,該方法還包括利用預(yù)先設(shè)置的嘴巴模型,對(duì)所述初步確定的嘴巴特征點(diǎn)所在的位置區(qū)域 進(jìn)行形狀約束。利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域 進(jìn)行形狀約束。利用預(yù)先訓(xùn)練的嘴巴特征點(diǎn),對(duì)經(jīng)過所述形狀約束后的位置區(qū) 域內(nèi)的嘴巴特征點(diǎn)進(jìn)行驗(yàn)證,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。本發(fā)明實(shí)施例提供的嘴巴特征點(diǎn)的檢測(cè)方法的具體實(shí)施過程參見圖3,包括第一步、首先從當(dāng)前幀圖像中定位出嘴巴上的特征點(diǎn)。 第二步、獲取下一幀圖像,利用KLT算法來對(duì)定位到的嘴巴特征點(diǎn)進(jìn)行 跟蹤。第三步、利用訓(xùn)練好的ASM模型來對(duì)第二步中跟蹤到的結(jié)果進(jìn)行形狀約束。第四步、采用SIFT算法對(duì)第三步處理后的結(jié)果進(jìn)行局部搜索。 第五步、利用訓(xùn)練好的ASM模型對(duì)第四步的處理結(jié)果進(jìn)行形狀約束。 第六步、對(duì)第五步的處理結(jié)果進(jìn)行驗(yàn)證,如果驗(yàn)證通過就跳到第二步,否 則跳到第 一步開始重新定位嘴巴上的特征點(diǎn)。綜上所述,本發(fā)明實(shí)施例,通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng) 前幀圖像上的嘴巴特征點(diǎn);對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn) 的局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);利用預(yù)先設(shè)置的嘴巴模型 對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀 圖像上的嘴巴特征點(diǎn),從而降低了對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的復(fù)雜度,并且提 高了對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的準(zhǔn)確性和速度。明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1、一種圖像檢測(cè)方法,其特征在于,該方法包括通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,通過對(duì)當(dāng)前幀圖像進(jìn)行嘴 巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)的步驟包括利用前一幀圖像上的嘴巴特征點(diǎn)所在的位置區(qū)域,對(duì)當(dāng)前幀圖像進(jìn)行嘴巴 特征點(diǎn)的跟蹤,初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于,若對(duì)當(dāng)前幀圖像進(jìn)行嘴巴 特征點(diǎn)的跟蹤操作失敗,則通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特征點(diǎn)定位,初步確定 當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
4、 根據(jù)權(quán)利要求l、 2或3所述的方法,其特征在于,在初步確定了當(dāng)前 幀圖像上的嘴巴特征點(diǎn)之后,進(jìn)行嘴巴特征點(diǎn)的局部搜索之前,該方法還包括利用預(yù)先設(shè)置的嘴巴模型,對(duì)所述初步確定的嘴巴特征點(diǎn)所在的位置區(qū)域 進(jìn)行形狀約束。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,利用預(yù)先設(shè)置的嘴巴模型 對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀 圖像上的嘴巴特征點(diǎn)的步驟包括利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域 進(jìn)行形狀約束;利用預(yù)先訓(xùn)練的嘴巴特征點(diǎn),對(duì)經(jīng)過所述形狀約束后的位置區(qū)域內(nèi)的嘴巴 特征點(diǎn)進(jìn)行驗(yàn)證,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
6、 一種圖係J險(xiǎn)測(cè)裝置,其特征在于,所述裝置包括初步確定單元,用于通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);重新確定單元,用于對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的 局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);最終確定單元,用于利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征 點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
7、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述初步確定單元包括 存儲(chǔ)單元,用于存儲(chǔ)圖像上的嘴巴特征點(diǎn)所在的位置區(qū)域;跟蹤單元,用于利用前一幀圖像上的嘴巴特征點(diǎn)所在的位置區(qū)域,對(duì)當(dāng)前 幀圖像進(jìn)行嘴巴特征點(diǎn)的跟蹤,初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
8、 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述初步確定單元包括 定位單元,用于對(duì)采集到的第一幀圖像,進(jìn)行嘴巴特征點(diǎn)定位,初步確定第一幀圖像上的嘴巴特征點(diǎn);以及,在所述跟蹤單元對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特 征點(diǎn)的跟蹤操作失敗時(shí),通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴特征點(diǎn)定位,初步確定當(dāng) 前幀圖像上的嘴巴特征點(diǎn)。
9、 根據(jù)權(quán)利要求6、 7或8所述的裝置,其特征在于,在所述初步確定單 元和所述重新確定單元之間,該裝置還包括形狀約束單元,用于利用預(yù)先設(shè)置的嘴巴模型,對(duì)所述初步確定單元初步 確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束。
10、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述最終確定單元包括 形狀約束單元,用于利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定單元重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束;驗(yàn)證單元,用于利用預(yù)先訓(xùn)練的嘴巴特征點(diǎn),對(duì)經(jīng)過所述形狀約束后的位 置區(qū)域內(nèi)的嘴巴特征點(diǎn)進(jìn)行驗(yàn)證,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
全文摘要
本發(fā)明公開了一種圖像檢測(cè)方法及裝置,用以降低對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的復(fù)雜度,并且提高對(duì)圖像中的嘴巴進(jìn)行檢測(cè)的準(zhǔn)確性和速度。本發(fā)明提供的一種圖像檢測(cè)方法包括通過對(duì)當(dāng)前幀圖像進(jìn)行嘴巴檢測(cè),初步確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);對(duì)所述嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行嘴巴特征點(diǎn)的局部搜索,重新確定當(dāng)前幀圖像上的嘴巴特征點(diǎn);利用預(yù)先設(shè)置的嘴巴模型對(duì)所述重新確定的嘴巴特征點(diǎn)所在的位置區(qū)域進(jìn)行形狀約束,最終確定當(dāng)前幀圖像上的嘴巴特征點(diǎn)。
文檔編號(hào)G06K9/00GK101635028SQ20091008579
公開日2010年1月27日 申請(qǐng)日期2009年6月1日 優(yōu)先權(quán)日2009年6月1日
發(fā)明者謝東海, 英 黃 申請(qǐng)人:北京中星微電子有限公司