專利名稱:影像處理方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種處理影像的方法,尤指一種影像處理方法及裝置。
背景技術(shù):
由于一般人在心理上有被識別(recognized)的需求,因此,當(dāng)對方叫出我們名字時(shí)的那種喜悅,絕非被通稱為“先生”或“小姐”所能比擬。此外,能記得每一張接觸過的臉并正確地說出他們的名字或頭銜,往往有助于拓展業(yè)務(wù)及維持良好的人際關(guān)系。
就目前發(fā)展中的技術(shù)而言,智慧型記憶及處理裝置的設(shè)計(jì)需包含神經(jīng)科學(xué)、精神物理學(xué)與電腦科學(xué)等跨領(lǐng)域的專業(yè)知識。通常人們會依賴復(fù)雜的“聯(lián)想”神經(jīng)網(wǎng)路來記憶臉部影像,例如,“他除了沒有胡子外,看起來很像我高中的數(shù)學(xué)老師”。就演化的觀點(diǎn)來看,這是人們?yōu)榱饲笊娑哂械谋灸?,如此才可減少犯錯(cuò)的機(jī)率。然而,若沒有通過更新記憶來加強(qiáng)“聯(lián)想”,記憶將會消失。
為了強(qiáng)調(diào)名字與面孔的關(guān)聯(lián)性以方便記憶,我們經(jīng)常通過夸大面孔的特征,讓臉部影像能夠更加鮮明,同時(shí)更容易記憶,這樣的個(gè)人技巧可以靠傳授,但是效果不得而知。另外一種改善臉部記憶的方式為使用電子產(chǎn)品繪制面孔輪廓,并附加上相關(guān)資訊做日后查尋。許多市面販?zhǔn)鄣膫€(gè)人數(shù)位助理(PDA)已經(jīng)提供這樣功能。但是這種解決問題的方式極缺乏效率,往往花了許多時(shí)間由程式預(yù)設(shè)的特征中挑出各種臉部特征后,只得到一個(gè)既不自然又缺乏可辨認(rèn)性的臉。因此,最好的方法就是保留真實(shí)的臉部影像并輔以相關(guān)資訊。但是,在一般場合中為陌生人拍照,不但唐突,同時(shí)技術(shù)上也有困難,例如,無法空出雙手時(shí)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種可瞬間取得臉部影像并有效率地加以處理的影像處理方法及裝置。
為了達(dá)到上述目的,本發(fā)明技術(shù)解決方案是一種影像處理裝置,包括臉部偵測裝置,用以偵測一影像,以找出其中的臉部影像;
臉部分類裝置,用以根據(jù)臉部特征將該臉部影像加以分類為群組;品質(zhì)分類裝置,用以根據(jù)影像的品質(zhì)將儲存于各群組的臉部影像加以分類;記憶裝置,用以依群組儲存該臉部影像。
所述影像處理裝置的臉部偵測裝置通過類神經(jīng)網(wǎng)路分析法偵測找出該臉部影像。
所述影像處理裝置的臉部偵測裝置通過主要元素分析法或特征范本分析法偵測找出該臉部影像。
所述影像處理裝置的臉部分類裝置通過主要元素分析法分類該臉部影像。
所述影像處理裝置的臉部分類裝置根據(jù)臉部特征來分類該臉部影像。
所述影像處理裝置的臉部分類裝置根據(jù)非臉部特征分類該臉部影像,該非臉部特征包括發(fā)型、身高、輪廓、衣服顏色、頭發(fā)顏色中的至少一項(xiàng)。
所述影像處理裝置的品質(zhì)分類裝置通過統(tǒng)計(jì)分析法來分類該群組的臉部影像。
所述影像處理裝置的品質(zhì)分類裝置通過灰皆分析法來分類該群組的臉部影像。
所述的影像處理裝置還包括一終止判斷裝置,其根據(jù)一預(yù)設(shè)信號或狀況決定是否進(jìn)入省電模式。
所述的影像處理裝置還包括一通訊接口,其用以存取一外在資料庫。
一種影像處理方法,包括下列步驟a)自一取得的影像中找出一臉部影像;b)將該臉部影像根據(jù)其特征加以分類,并儲存于個(gè)別的群組;c)將儲存于該個(gè)別群組的臉部影像根據(jù)影像品質(zhì)加以分類;d)將儲存于該群組的資料輸出。
所述影像處理方法的步驟a)通過類神經(jīng)網(wǎng)路分析法來完成。
所述影像處理方法的步驟a)通過主要元素分析法或特征范本分析法來完成。
所述影像處理方法的步驟b)通過主要元素分析法來完成。
所述影像處理方法的步驟b)根據(jù)臉部特征來分類該臉部影像。
所述影像處理方法的步驟b)根據(jù)非臉部特征來分類該臉部影像,該非臉部特征包括發(fā)型、身高、輪廓、衣服顏色、頭發(fā)顏色中的至少一項(xiàng)。
所述影像處理方法的步驟c)通過統(tǒng)計(jì)分析法來完成。
所述影像處理方法的步驟c)通過灰皆分析法來完成。
所述影像處理方法的步驟d)是將該資料輸出至一資料儲存裝置中。
采用上述方案后,本發(fā)明不但可有效率地幫助使用者記憶面孔,更重要的是,本發(fā)明使用一種在社交場合中可接受的手段來達(dá)到自動辨認(rèn)的目的。
圖1為使用本發(fā)明裝置的典型狀況;圖2A為本發(fā)明裝置較佳實(shí)施例的前視圖;圖2B為本發(fā)明裝置較佳實(shí)施例的側(cè)視圖;圖3為本發(fā)明較佳實(shí)施例的功能方塊圖;圖4為本發(fā)明較佳實(shí)施例的處理流程圖。
實(shí)施方式圖1為應(yīng)用本發(fā)明裝置的典型狀況。將該裝置以鏡頭向前的方式夾在襯衫口袋處,通過適當(dāng)方式啟動后,便可主動偵測并儲存有效的臉部影像,直到閑置時(shí)間超過預(yù)設(shè)值,亦即未再找到目標(biāo),便停止運(yùn)作。就一般鏡頭(非廣角鏡頭或伸縮鏡頭)及320240像素的解析度而言,取得有效臉部影像的距離約為50公分到3公尺。為應(yīng)用于不同場合,例如較長或者是較廣的有效距離,本裝置亦可更換適當(dāng)?shù)溺R頭。此外,本裝置尚可選擇不同外觀設(shè)計(jì),以便隱藏于帽子、領(lǐng)結(jié)、眼鏡等處。除了可隨身攜帶外,本發(fā)明亦可嵌入一位置固定不動的物體或裝置中。例如,將本裝置設(shè)于柜臺內(nèi),以此自動偵測客戶面孔,可自動辨認(rèn)或協(xié)助員工辨認(rèn)常客,并達(dá)到安全或加強(qiáng)服務(wù)的目的。
圖2A及圖2B為本發(fā)明裝置較佳實(shí)施例的前視圖與側(cè)視圖,其是一口袋型影像處理裝置,并命名為“臉部截取器(face grabber)”20。該臉部截取器20的外型有如一支體積較大的筆,因此在佩戴或操作時(shí)非常隱密。同時(shí)使用一針孔鏡頭,即使近距離也難以發(fā)現(xiàn)。鏡頭21設(shè)置于一旋轉(zhuǎn)帽蓋22中,因此可配合使用者的身高作調(diào)整??诖鼕A24則可將臉部截取器20固定于襯衫口袋或是任何方便操作的地方。臉部截取器20具有可瀏覽臉部影像及其他資訊的液晶顯示器(LCD)25、用于錄音的麥克風(fēng)23、以及控制按鈕26。
圖3為臉部截取器20的功能方塊圖30。用于取得數(shù)字影像的影像感應(yīng)器31可以是電荷耦合元件(CCD)或互補(bǔ)式金屬氧化半導(dǎo)體(CMOS)。為了節(jié)省電力,臉部截取器20通常使用省電模式,直到被啟動裝置33“喚醒”。啟動裝置33可包括使用藍(lán)牙(bluetooth)無線傳輸技術(shù)的無線遙控器、控制鈕34、紅外線感應(yīng)器、動作感應(yīng)器等。啟動裝置33最要緊的是可藉由最不醒目的方式來啟動臉部截取器20。中央處理器(CPU)32主要是提供臉部偵測和影像壓縮的計(jì)算功能。記憶體35包括計(jì)算時(shí)所需的緩沖器(buffer)以及可永久儲存臉部影像及其他資料的儲存裝置。典型的顯示器36為液晶顯示器(LCD),主要用于瀏覽臉部影像及其它資料。通訊接口37可包含下列各項(xiàng)以藍(lán)牙科技為基礎(chǔ)的無線傳輸、萬用序列匯流排(USB)、紅外線接口等。通訊接口37可由其它裝置取得資料,或者將資料傳送給其它裝置。例如,在一臺電腦與臉部截取器20之間同步處理臉部影像與聯(lián)絡(luò)資訊??刂柒o34用于下列基本操作設(shè)定日期和時(shí)間、啟動影像分類模式、啟動臉部辨認(rèn)模式、啟動拍照模式、啟動錄音模式、以各種方式瀏覽資訊、以各種模式清除或修正資料、啟動與另一裝置的通訊功能等。
圖4為本發(fā)明處理流程的較佳實(shí)施例。啟動步驟可通過前段所述的啟動裝置以各種方式達(dá)成。一旦開始,流程便進(jìn)入一個(gè)“偵測—分類—偵測—分類......”的回路,亦即重復(fù)步驟a)到步驟c),直到接收到終止訊號或符合預(yù)設(shè)的終止條件。
通常實(shí)際狀況使用者在走入人群之前,先按下控制按鈕26來啟動臉部截取器20,接著,依序或者來回地與許多人握手。此時(shí),影像截取裝置(數(shù)碼相機(jī))將被觸發(fā)而在步驟a1)產(chǎn)生一個(gè)影像。在本發(fā)明中,影像資料的形式?jīng)]有限制,可為數(shù)碼圖片(digitalpicture)、數(shù)碼影像(digital video)、類比影像(analog video)、影像檔(image files)。在步驟a2)中,所取得的影像則通過臉部偵測裝置找出臉部區(qū)域。該臉部偵測裝置可根據(jù)特征范本、神經(jīng)網(wǎng)路等演算法來設(shè)計(jì),此為習(xí)知技藝,故不再贅述。
步驟b)主要是根據(jù)臉部特征將步驟a2)中偵測到的臉部影像加以分類,并于緩沖器中建立個(gè)人的群組(cluster)可供儲存其影像資料,猶如每一位被拍照者皆擁有一個(gè)個(gè)人寫真集。通常此一步驟是通過主要元素分析法(PCA)完成,其為習(xí)知技藝,毋庸詳述。除了臉部特征外,非臉部特征亦可作為分類的輔助依據(jù),例如衣物顏色、頭發(fā)顏色、發(fā)型、身高、輪廓等。
步驟c)則再根據(jù)影像品質(zhì)將每個(gè)群組中的臉部影像加以分類。使用的技術(shù)為統(tǒng)計(jì)方法,例如通過灰皆分析法(histogram analysis)來評估眼、鼻、口等臉部特征的清晰度。此種影像品質(zhì)分類的技術(shù)亦為習(xí)知,且非常類似攝影機(jī)自動對焦的技術(shù)。
由上述的步驟b)及c)可知,本發(fā)明方法具有兩個(gè)顯著特征1)可有效控制同一人的影像資料量,因?yàn)椴襟Eb)是根據(jù)個(gè)人特征而將其分類至各自的群組中,而每一群組的容量可加以限制,這種情形可能發(fā)生于來回與人握手時(shí),由于經(jīng)過同一人而重復(fù)拍照;2)可避免積存過多品質(zhì)較差的影像,因?yàn)椴襟Ec)是根據(jù)影像品質(zhì)做分類,則品質(zhì)較差的影像便可被刪除。
上述的回路可在下列預(yù)設(shè)狀況發(fā)生時(shí)終止超過預(yù)設(shè)的操作時(shí)段、超過預(yù)設(shè)的閑置時(shí)段(亦即找不到任何面孔)或緩沖器中累積的臉部影像數(shù)目超過預(yù)設(shè)值等;上述回路還可在接收到下列裝置發(fā)出終止訊號時(shí)終止動作感應(yīng)器、無線遙控器、紅外線感應(yīng)器、按鈕等。通常,當(dāng)超過預(yù)設(shè)的閑置時(shí)段時(shí),例如30秒內(nèi)找不到任何面孔,程序會自動終止并切換至省電模式。
上述的回路終止后,即進(jìn)行步驟d)。在步驟d)中,可將品質(zhì)最佳的影像及緩沖器中的相關(guān)資料輸出至顯示器、內(nèi)部或外部的資料庫或列印裝置等。
由于本發(fā)明方法僅在程序啟動時(shí)紀(jì)錄臉部影像,因此所需的儲存容量非常小,甚至以普通的低成本配備,例如64兆的快閃記憶體,便可輕易地儲存數(shù)千張臉部影像,而仍有空間紀(jì)錄其他資訊及聲音。
此外,本發(fā)明裝置尚可視情況切換至“辨認(rèn)模式”。在此模式下,步驟b’)取代了步驟b)及c)。步驟b’)可通過主要元素分析法(PCA)來辨認(rèn)被偵測的臉部影像。識別的結(jié)果(例如資料庫中與該臉部影像結(jié)合的姓名)則可經(jīng)由通訊接口37傳送至無線耳機(jī)。因此,本發(fā)明不但有效率地幫助使用者記憶面孔,更重要的是,本發(fā)明使用一種在社交場合中可接受的手段來達(dá)到自動辨認(rèn)的目的。
以上所述僅為本發(fā)明方法及裝置的較佳實(shí)施例,因此,凡根據(jù)本發(fā)明的原理與精神加以修飾者,均應(yīng)屬本發(fā)明的范圍。
權(quán)利要求
1.一種影像處理裝置,其特征在于該裝置包括臉部偵測裝置,用以偵測一影像,以找出其中的臉部影像;臉部分類裝置,用以根據(jù)臉部特征將該臉部影像加以分類為群組;品質(zhì)分類裝置,用以根據(jù)影像的品質(zhì)將儲存于各群組的臉部影像加以分類;記憶裝置,用以依群組儲存該臉部影像。
2.如權(quán)利要求1所述的影像處理裝置,其特征在于該臉部偵測裝置通過類神經(jīng)網(wǎng)路分析法偵測找出該臉部影像。
3.如權(quán)利要求1所述的影像處理裝置,其特征在于該臉部偵測裝置通過主要元素分析法或特征范本分析法偵測找出該臉部影像。
4.如權(quán)利要求1所述的影像處理裝置,其特征在于該臉部分類裝置通過主要元素分析法分類該臉部影像。
5.如權(quán)利要求1所述的影像處理裝置,其特征在于該臉部分類裝置根據(jù)臉部特征來分類該臉部影像。
6.如權(quán)利要求1所述的影像處理裝置,其特征在于該臉部分類裝置根據(jù)非臉部特征分類該臉部影像,該非臉部特征包括發(fā)型、身高、輪廓、衣服顏色、頭發(fā)顏色中的至少一項(xiàng)。
7.如權(quán)利要求1所述的影像處理裝置,其特征在于該品質(zhì)分類裝置通過統(tǒng)計(jì)分析法來分類該群組的臉部影像。
8.如權(quán)利要求1所述的影像處理裝置,其特征在于該品質(zhì)分類裝置通過灰皆分析法來分類該群組的臉部影像。
9.如權(quán)利要求1所述的影像處理裝置,其特征在于該裝置還包括一終止判斷裝置,其根據(jù)一預(yù)設(shè)信號或狀況決定是否進(jìn)入省電模式。
10.如權(quán)利要求1所述的影像處理裝置,其特征在于該裝置還包括一通訊接口,其用以存取一外在資料庫。
11.一種影像處理方法,其特征在于該方法包括下列步驟a)自一取得的影像中找出一臉部影像;b)將該臉部影像根據(jù)其特征加以分類,并儲存于個(gè)別的群組;c)將儲存于該個(gè)別群組的臉部影像根據(jù)影像品質(zhì)加以分類;d)將儲存于該群組的資料輸出。
12.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟a)通過類神經(jīng)網(wǎng)路分析法來完成。
13.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟a)通過主要元素分析法或特征范本分析法來完成。
14.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟b)通過主要元素分析法來完成。
15.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟b)根據(jù)臉部特征來分類該臉部影像。
16.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟b)根據(jù)非臉部特征來分類該臉部影像,該非臉部特征包括發(fā)型、身高、輪廓、衣服顏色、頭發(fā)顏色中的至少一項(xiàng)。
17.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟c)通過統(tǒng)計(jì)分析法來完成。
18.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟c)通過灰皆分析法來完成。
19.如權(quán)利要求11所述的影像處理方法,其特征在于該步驟d)是將該資料輸出至一資料儲存裝置中。
全文摘要
本發(fā)明公開了一種影像處理方法及裝置,其是將取得的臉部影像根據(jù)其特征加以分類并儲存于各別的群組中。不同群組中的影像可再根據(jù)影像品質(zhì)予以分類,然后再保留品質(zhì)較佳的影像,其不僅可使記憶體的使用更有效率,并有利于后續(xù)的影像辨認(rèn)。本發(fā)明不但可有效率地幫助使用者記憶面孔,更重要的是,本發(fā)明使用一種在社交場合中可接受的手段來達(dá)到自動辨認(rèn)的目的。
文檔編號G06T1/00GK1567370SQ0314674
公開日2005年1月19日 申請日期2003年6月23日 優(yōu)先權(quán)日2003年6月23日
發(fā)明者張榮洲 申請人:威視科技股份有限公司