專利名稱:影像穩(wěn)定方法及裝置、以及使用其的影像傳送與接收方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于影像穩(wěn)定方法及裝置、以及使用其的影像傳送與接收 方法,且特別是有關(guān)于運(yùn)用臉部偵測(cè)技術(shù)的影像穩(wěn)定方法及裝置、以及使 用其的影像傳送與接收方法。
背景技術(shù):
隨著通信與網(wǎng)絡(luò)技術(shù)的結(jié)合,視訊通話也漸漸成為手機(jī)(mobile phone)
的重要加值功能,并形成為一股新興的通話潮流。通話雙方僅需啟用手機(jī) 的視訊通話功能,便能傳送彼此的影像,使得雙方在視訊通話的過(guò)程中, 不但能聽(tīng)見(jiàn)對(duì)方的聲音,還能實(shí)時(shí)看見(jiàn)對(duì)方的影像。這樣的功能,非常便 于忙碌的現(xiàn)代人與身處遠(yuǎn)方的家人或朋友聯(lián)絡(luò),也無(wú)形中縮短了彼此的距 離。
一般而言,在進(jìn)行視訊通話的時(shí)候,拍攝點(diǎn)會(huì)固定在自己的臉,然由 于使用者通常是將手機(jī)拿在手上來(lái)進(jìn)行拍攝,因此拍攝到的畫面會(huì)產(chǎn)生不 想要的抖動(dòng)。這種問(wèn)題同樣也出現(xiàn)在其它具有攝影功能的手持式裝置、車 載攝影機(jī)之類的電子產(chǎn)品。針對(duì)這類問(wèn)題,傳統(tǒng)的解決方法如圖l所示。
請(qǐng)參照?qǐng)D1,其所示為已知的影像穩(wěn)定(video image stabilization)裝置 及其耦接方式。在此圖中,標(biāo)示104即為所述的影像穩(wěn)定裝置,其包括有 移動(dòng)估計(jì)(motion estimation)單元106及影像穩(wěn)定單元108。移動(dòng)估計(jì)單元 106用以接收攝影單元102所擷取到的動(dòng)態(tài)影像,并估計(jì)此影像的移動(dòng)向 量(motion vector)。影像穩(wěn)定單元108則會(huì)從此影像的整個(gè)畫面中選擇一個(gè) 移動(dòng)向量最小的區(qū)域,或是從中選擇多個(gè)移動(dòng)向量較小的區(qū)域來(lái)作為固定 對(duì)象,將選定的區(qū)域的大小及位置固定,而其它未獲選的區(qū)域則根據(jù)移動(dòng) 向量的估計(jì)結(jié)果施以適量的反向調(diào)整,進(jìn)而獲取穩(wěn)定的影像OUTPUT。
然而,由于在進(jìn)行視訊通話時(shí),無(wú)論是發(fā)話端或是受話端,最希望看 到的就是對(duì)方的臉,因此在拍攝人臉這個(gè)特殊應(yīng)用時(shí),由于在上述已知技術(shù)的解決策略上,并沒(méi)有特別去穩(wěn)定影像中的臉部區(qū)域,以致于會(huì)產(chǎn)生人 臉抖動(dòng)的問(wèn)題,故穩(wěn)定過(guò)后的影像并非是通話者想要的影像。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種影像穩(wěn)定方法,其可穩(wěn)定一影像中的臉部區(qū) 域,解決影像的人臉抖動(dòng)問(wèn)題。
本發(fā)明的另一目的是提供一種影像穩(wěn)定裝置,其可穩(wěn)定一影像中的臉 部區(qū)域,解決影像的人臉抖動(dòng)問(wèn)題。
本發(fā)明的又一目的是提供一種影像傳送方法,其可穩(wěn)定欲傳送的影像 中的臉部區(qū)域,解決影像的人臉抖動(dòng)問(wèn)題。
本發(fā)明的再一 目的是提供一種影像接收方法,其可穩(wěn)定所接收到的影 像中的臉部區(qū)域,解決影像的人臉抖動(dòng)問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種影像穩(wěn)定方法。在此方法中,首 先是對(duì)一影像進(jìn)行臉部偵測(cè),以取得此影像中的一臉部區(qū)域。接著,固定 上述臉部區(qū)域的大小及位置。
本發(fā)明還提出了一種影像穩(wěn)定裝置,其包括有臉部偵測(cè)單元及影像穩(wěn) 定單元。臉部偵測(cè)單元用以對(duì)一影像進(jìn)行臉部偵測(cè),以取得此影像中的一 臉部區(qū)域。影像穩(wěn)定單元?jiǎng)t用以固定上述臉部區(qū)域的大小及位置。
本發(fā)明還提出了一種影像傳送方法。在此方法中,首先是對(duì)一影像進(jìn) 行臉部偵測(cè),以取得此影像中的一臉部區(qū)域。接著,固定此臉部區(qū)域的大 小及位置。然后,壓縮上述已固定臉部區(qū)域的影像,以傳送至遠(yuǎn)程。
本發(fā)明還提出了一種影像接收方法。在此方法中,首先是接收并解壓 縮一影像壓縮數(shù)據(jù),以取得一影像。接著,對(duì)此影像進(jìn)行臉部偵測(cè),以取 得影像中的一臉部區(qū)域。然后,固定上述臉部區(qū)域的大小及位置,以獲得 一顯示影像。
依照本發(fā)明一實(shí)施例所述的影像穩(wěn)定方法,其還包括估計(jì)上述影像的 移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì)結(jié)果調(diào)整影像中,臉部區(qū)域以外的其它 區(qū)域。
依照本發(fā)明一實(shí)施例所述的影像穩(wěn)定裝置,其還包括一移動(dòng)估計(jì)單 元。此移動(dòng)估計(jì)單元用以估計(jì)上述影像的移動(dòng)向量,以將移動(dòng)向量的估計(jì)
6結(jié)果輸出至影像穩(wěn)定單元,使影像穩(wěn)定單元據(jù)以調(diào)整影像中,臉部區(qū)域以 外的其它區(qū)域。 —
依照本發(fā)明一實(shí)施例所述的影像傳送方法,其中在壓縮上述已固定臉 部區(qū)域的影像前,還包括估計(jì)此影像的移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì) 結(jié)果調(diào)整影像中,臉部區(qū)域以外的其它區(qū)域。
依照本發(fā)明一實(shí)施例所述的影像接收方法,其中在固定臉部區(qū)域的大 小及位置時(shí),還包括估計(jì)上述影像的移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì)結(jié) 果調(diào)整影像中,臉部區(qū)域以外的其它區(qū)域,以獲得顯示影像。
本發(fā)明因?qū)τ跋襁M(jìn)行臉部偵測(cè),以取得此影像中的一臉部區(qū)域,然后 再固定此臉部區(qū)域的大小及位置,故可穩(wěn)定影像中的臉部區(qū)域,解決影像 的人臉抖動(dòng)問(wèn)題。此外,若是再搭配估計(jì)上述影像的移動(dòng)向量,并根據(jù)移 動(dòng)向量的估計(jì)結(jié)果調(diào)整影像中,臉部區(qū)域以外的其它區(qū)域,便可得到更佳 的影像。
圖1所示為一已知的影像穩(wěn)定裝置及其耦接方式;
圖2所示為依照本發(fā)明一實(shí)施例的影像穩(wěn)定裝置及其耦接方式;。
圖3所示為依照本發(fā)明一實(shí)施例的影像穩(wěn)定方法的流程;
圖4所示為依照本發(fā)明一實(shí)施例的影像傳送方法的流程;
圖5所示為依照本發(fā)明一實(shí)施例的影像接收方法的流程。
具體實(shí)施例方式
為讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉 較佳實(shí)施例,并配合附圖作詳細(xì)說(shuō)明如下。
圖2所示為依照本發(fā)明一實(shí)施例的影像穩(wěn)定裝置及其耦接方式。在此 圖中,標(biāo)示204即為所述的影像穩(wěn)定裝置,其主要包括有臉部偵測(cè)單元208 及影像穩(wěn)定單元210,此外,還包括有移動(dòng)估計(jì)單元206。臉部偵測(cè)單元 208用以對(duì)攝影單元202所擷取到的動(dòng)態(tài)影像進(jìn)行臉部偵測(cè)(face detection),以取得此影像中的一臉部區(qū)域。移動(dòng)估計(jì)單元206則用以估計(jì) 此影像的移動(dòng)向量(motion vector),以產(chǎn)生移動(dòng)向量的估計(jì)結(jié)果。至于影像穩(wěn)定單元210,其用以固定上述臉部區(qū)域的大小及位置,并依據(jù)移動(dòng)向量 的估計(jì)結(jié)果調(diào)整此影像中,臉部區(qū)域以外的其它區(qū)域,進(jìn)而獲取穩(wěn)定的影 像OUTPUT 。
在此例中,移動(dòng)估計(jì)單元206估計(jì)移動(dòng)向量的方式,可以是采用估計(jì) 此影像的區(qū)域移動(dòng)向量(local motion vector)及全域移動(dòng)向量(global motion vector)的方式來(lái)實(shí)現(xiàn),亦或是采用其它可行的估計(jì)方式來(lái)實(shí)現(xiàn),并無(wú)特殊 限定。而臉部偵測(cè)單元208所采用的臉部偵測(cè)方式,可以是利用偵測(cè)人臉 的五官特征,例如偵測(cè)眼睛、鼻子、嘴巴...等特征來(lái)取得影像中的臉部區(qū) 域,也可以是利用偵測(cè)顏色的特征,例如偵測(cè)膚色、發(fā)色...等特征來(lái)取得 影像中的臉部區(qū)域,甚至是利用偵測(cè)紋理、形狀...等其它方式來(lái)取得所需 的臉部區(qū)域,也并無(wú)特殊限定。
至于上述的影像穩(wěn)定單元210,其固定臉部區(qū)域的位置的方式,可以 是將臉部區(qū)域固定在影像的畫面上的原獲取位置上,也可以是將臉部區(qū)域 固定在影像的畫面上的任何一預(yù)設(shè)位置。然而,在視訊通話的應(yīng)用中,最 理想的方式,就是將臉部區(qū)域固定在影像的畫面中央。而影像穩(wěn)定單元210
固定臉部區(qū)域的大小的方式,可以是將臉部區(qū)域固定在原獲取大小,也可 以是將臉部區(qū)域的大小與影像的整個(gè)畫面的大小固定在一預(yù)設(shè)比例,亦或 者是將臉部區(qū)域的大小固定在一預(yù)設(shè)面積。舉例來(lái)說(shuō),在視訊通話中,最 希望看到的就是大小及位置皆穩(wěn)定的人臉,因此可將影像穩(wěn)定單元210設(shè) 計(jì)成能將臉部區(qū)域固定在影像的畫面中央,且臉部區(qū)域的大小也與整個(gè)畫 面維持一定比例,因此就不會(huì)有人臉抖動(dòng)的情形發(fā)生。換句話說(shuō),無(wú)論視 訊通話中的手機(jī)怎么晃動(dòng),此影像穩(wěn)定單元210都可將偏移的臉部區(qū)域拉 回畫面中央,并利用縮放(zoomin/zoomout)臉部區(qū)域的方式將其大小固定 住。
此外,當(dāng)臉部偵測(cè)單元208對(duì)上述影像進(jìn)行臉部偵測(cè),因而取得多個(gè) 臉部區(qū)域時(shí),那么影像穩(wěn)定單元210便會(huì)選擇這些臉部區(qū)域的其中的一個(gè) 來(lái)作為固定對(duì)象,而其余的臉部區(qū)域則視為背景。而影像穩(wěn)定單元210選 擇固定對(duì)象的方式,可以是選擇最大的臉部區(qū)域、于畫面最中央的臉部區(qū) 域或符合一預(yù)設(shè)臉孔的臉部區(qū)域來(lái)作為固定對(duì)象,也可以是依據(jù)其它的預(yù) 設(shè)條件來(lái)選擇其中一臉部區(qū)域來(lái)作為固定對(duì)象。利用上述操作,可以歸納出一些基本的操作步驟,如圖3所示。圖3 所示為依照本發(fā)明一實(shí)施例的影像穩(wěn)定方法的流程。在此方法中,首先是 對(duì)一影像進(jìn)行臉部偵測(cè),以取得此影像中的一臉部區(qū)域(如步驟S302所 示)。接著,固定上述臉部區(qū)域的大小及位置(如步驟S304所示)。如此一 來(lái),便可穩(wěn)定此影像中的臉部區(qū)域,解決影像的人臉抖動(dòng)問(wèn)題。若欲取得 更佳的影像質(zhì)量,則可再估計(jì)此影像的移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì) 結(jié)果調(diào)整上述影像中,臉部區(qū)域以外的其它區(qū)域(如步驟S306所示)。
若欲傳送拍攝到的影像,則其基本操作步驟如圖4所示。圖4所示為 依照本發(fā)明一實(shí)施例的影像傳送方法的流程。在此方法中,首先也是對(duì)一 影像進(jìn)行臉部偵測(cè),以取得此影像中的一臉部區(qū)域(如步驟S402所示)。接 著,固定上述臉部區(qū)域的大小及位置(如步驟S404所示)。然后,壓縮上述 己固定臉部區(qū)域的影像,以傳送至一遠(yuǎn)程(如步驟S406所示)。如此一來(lái), 便可在傳送影像之前,先行穩(wěn)定此影像中的臉部區(qū)域,解決影像的人臉抖 動(dòng)問(wèn)題。當(dāng)然,若欲取得更佳的影像質(zhì)量,則可在壓縮上述己固定臉部區(qū) 域的影像前,估計(jì)上述影像的移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì)結(jié)果調(diào)整 影像中,臉部區(qū)域以外的其它區(qū)域。
若欲接收對(duì)方所拍攝到的影像,然對(duì)方卻沒(méi)有穩(wěn)定影像中的臉部區(qū)域 的功能,則其基本操作步驟如圖5所示。圖5所示為依照本發(fā)明一實(shí)施例 的影像接收方法的流程。在此方法中,首先是接收并解壓縮一影像壓縮數(shù) 據(jù),以取得一影像(如步驟S502所示)。接著,對(duì)此影像進(jìn)行臉部偵測(cè),以 取得影像中的一臉部區(qū)域(如步驟S504所示)。然后,固定臉部區(qū)域的大小 及位置,以獲得一顯示影像(如步驟S506所示)。如此一來(lái),便可在取得對(duì) 方所傳送的影像之后,先行穩(wěn)定此影像中的臉部區(qū)域,解決影像的人臉抖 動(dòng)問(wèn)題,然后再顯示出來(lái)。當(dāng)然,若欲取得較佳的影像,則可在固定臉部 區(qū)域的大小及位置時(shí),估計(jì)上述影像的移動(dòng)向量,并根據(jù)移動(dòng)向量的估計(jì) 結(jié)果調(diào)整影像中,臉部區(qū)域以外的其它區(qū)域,以獲得所需的顯示影像。
綜上所述,本發(fā)明因?qū)τ跋襁M(jìn)行臉部偵測(cè),以取得此影像中的一臉部 區(qū)域,然后再固定此臉部區(qū)域的大小及位置,故可穩(wěn)定影像中的臉部區(qū)域, 解決影像的人臉抖動(dòng)問(wèn)題。此外,若是再搭配估計(jì)上述影像的移動(dòng)向量, 并根據(jù)移動(dòng)向量的估計(jì)結(jié)果調(diào)整影像中,臉部區(qū)域以外的其它區(qū)域,便可
9得到更佳的影像。當(dāng)然,本發(fā)明除了可應(yīng)用在手機(jī)、其它具有攝影功能的 手持式裝置及車載攝影機(jī)之類的電子產(chǎn)品之外,亦可應(yīng)用在其它需要實(shí)時(shí) 傳送影像的相關(guān)領(lǐng)域。
雖然本發(fā)明已以較佳實(shí)施例描述如上,然其并非用以限定本發(fā)明,本 領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許得更動(dòng)與潤(rùn) 飾,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求書所界定的內(nèi)容為準(zhǔn)。
權(quán)利要求
1、一種影像穩(wěn)定方法,其特征是,包括對(duì)影像進(jìn)行臉部偵測(cè),以取得上述影像中的臉部區(qū)域;以及固定上述臉部區(qū)域的大小及位置。
2、 根據(jù)權(quán)利要求1所述的影像穩(wěn)定方法,其特征是,上述影像穩(wěn)定 方法包括估計(jì)上述影像的移動(dòng)向量,并根據(jù)上述移動(dòng)向量的估計(jì)結(jié)果調(diào)整 上述影像中,上述臉部區(qū)域以外的其它區(qū)域。
3、 根據(jù)權(quán)利要求2所述的影像穩(wěn)定方法,其特征是,上述移動(dòng)向量 的估計(jì)方式包括估計(jì)上述影像的區(qū)域移動(dòng)向量及全域移動(dòng)向量。
4、 根據(jù)權(quán)利要求1所述的影像穩(wěn)定方法,其特征是,當(dāng)對(duì)上述影像 進(jìn)行臉部偵測(cè),因而取得多個(gè)臉部區(qū)域時(shí),還選擇上述這些臉部區(qū)域的其 中一個(gè)來(lái)作為固定對(duì)象,而其余的臉部區(qū)域則視為背景。
5、 根據(jù)權(quán)利要求4所述的影像穩(wěn)定方法,其特征是,選擇最大的臉 部區(qū)域、于畫面最中央的臉部區(qū)域或符合預(yù)設(shè)臉孔的臉部區(qū)域來(lái)作為固定 對(duì)象。
6、 根據(jù)權(quán)利要求1所述的影像穩(wěn)定方法,其特征是,固定上述臉部 區(qū)域的位置的方式,包括將上述臉部區(qū)域的位置固定在上述影像的畫面中 央。
7、 根據(jù)權(quán)利要求1所述的影像穩(wěn)定方法,其特征是,固定上述臉部 區(qū)域的大小的方式,包括將上述臉部區(qū)域的大小與上述影像的整個(gè)畫面的 大小固定在預(yù)設(shè)比例。
8、 根據(jù)權(quán)利要求1所述的影像穩(wěn)定方法,其特征是,固定上述臉部 區(qū)域的大小的方式,包括是將上述臉部區(qū)域的大小固定在預(yù)設(shè)面積。
9、 一種影像穩(wěn)定裝置,其特征是,包括臉部偵測(cè)單元,用以對(duì)影像進(jìn)行臉部偵測(cè),以取得上述影像中的臉部 區(qū)域;以及影像穩(wěn)定單元,用以固定上述臉部區(qū)域的大小及位置。
10、 根據(jù)權(quán)利要求9所述的影像穩(wěn)定裝置,其特征是,上述影像穩(wěn)定裝置還包括移動(dòng)估計(jì)單元,用以估計(jì)上述影像的移動(dòng)向量,以將上述移動(dòng)向量的 估計(jì)結(jié)果輸出至上述影像穩(wěn)定單元,使上述影像穩(wěn)定單元據(jù)以調(diào)整上述影 像中,上述臉部區(qū)域以外的其它區(qū)域。
11、 根據(jù)權(quán)利要求10所述的影像穩(wěn)定裝置,其特征是,上述移動(dòng)估 計(jì)單元估計(jì)上述移動(dòng)向量的方式包括估計(jì)上述影像的區(qū)域移動(dòng)向量及全 域移動(dòng)向量。
12、 根據(jù)權(quán)利要求9所述的影像穩(wěn)定裝置,其特征是,當(dāng)上述臉部偵 測(cè)單元對(duì)上述影像進(jìn)行臉部偵測(cè),因而取得多個(gè)臉部區(qū)域時(shí),上述影像穩(wěn) 定單元還選擇上述這些臉部區(qū)域的其中一個(gè)來(lái)作為固定對(duì)象,而其余的臉 部區(qū)域則視為背景。
13、 根據(jù)權(quán)利要求12所述的影像穩(wěn)定裝置,其特征是,上述影像穩(wěn) 定單元選擇最大的臉部區(qū)域、于畫面最中央的臉部區(qū)域或符合預(yù)設(shè)臉孔的 臉部區(qū)域來(lái)作為固定對(duì)象。
14、 根據(jù)權(quán)利要求9所述的影像穩(wěn)定裝置,其特征是,上述影像穩(wěn)定 單元固定上述臉部區(qū)域的位置的方式,包括將上述臉部區(qū)域的位置固定在 上述影像的畫面中央。
15、 根據(jù)權(quán)利要求9所述的影像穩(wěn)定裝置,其特征是,上述影像穩(wěn)定 單元固定上述臉部區(qū)域的大小的方式,包括將上述臉部區(qū)域的大小與上述 影像的整個(gè)畫面的大小固定在預(yù)設(shè)比例。
16、 根據(jù)權(quán)利要求9所述的影像穩(wěn)定裝置,其特征是,上述影像穩(wěn)定 單元固定上述臉部區(qū)域的大小的方式,包括將上述臉部區(qū)域的大小固定在 預(yù)設(shè)面積。
17、 一種影像傳送方法,其特征是,包括 對(duì)影像進(jìn)行臉部偵測(cè),以取得上述影像中的臉部區(qū)域; 固定上述臉部區(qū)域的大小及位置;以及 壓縮己固定上述臉部區(qū)域的上述影像,以傳送至遠(yuǎn)程。
18、 根據(jù)權(quán)利要求17所述的影像傳送方法,其特征是,在壓縮已固 定上述臉部區(qū)域的上述影像前,上述影像傳送方法還包括估計(jì)上述影像的 移動(dòng)向量,并根據(jù)上述移動(dòng)向量的估計(jì)結(jié)果調(diào)整上述影像中,上述臉部區(qū) 域以外的其它區(qū)域。
19、 一種影像接收方法,其特征是,包括接收并解壓縮影像壓縮數(shù)據(jù),以取得影像;對(duì)上述影像進(jìn)行臉部偵測(cè),以取得上述影像中的臉部區(qū)域;以及 固定上述臉部區(qū)域的大小及位置,以獲得顯示影像。
20、 根據(jù)權(quán)利要求19所述的影像接收方法,其特征是,在固定上述 臉部區(qū)域的大小及位置時(shí),上述影像接收方法還包括估計(jì)上述影像的移動(dòng) 向量,并根據(jù)上述移動(dòng)向量的估計(jì)結(jié)果調(diào)整上述影像中,上述臉部區(qū)域以 外的其它區(qū)域,以獲得上述顯示影像。
全文摘要
一種影像穩(wěn)定方法及裝置、以及使用其的影像傳送與接收方法。在此影像穩(wěn)定方法中,首先是對(duì)一影像進(jìn)行臉部偵測(cè),以取得此影像中的一臉部區(qū)域。接著,固定此臉部區(qū)域的大小及位置。據(jù)此,可解決影像中的人臉抖動(dòng)問(wèn)題。
文檔編號(hào)H04N5/14GK101668114SQ200810215860
公開日2010年3月10日 申請(qǐng)日期2008年9月5日 優(yōu)先權(quán)日2008年9月5日
發(fā)明者簡(jiǎn)演龍 申請(qǐng)人:華碩電腦股份有限公司