本發(fā)明涉及拍攝技術(shù)領(lǐng)域,尤其涉及一種拍攝方法及其終端。
背景技術(shù):
隨著拍照技術(shù)的快速發(fā)展,用戶喜歡利用拍照來記錄自己、家人、朋友及同事開心的時刻,在拍照的過程中,用戶都希望清晰地拍出自己眼睛,這樣拍出的圖像能夠突出重點,并能體現(xiàn)圖像中的人物的精神面貌。但在實踐中發(fā)現(xiàn),現(xiàn)有的拍照設(shè)備不能對人眼進(jìn)行準(zhǔn)確的對焦,拍出的人物圖像的人眼區(qū)域的清晰度不高。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種拍攝方法及其終端,可快速且準(zhǔn)確的對人眼進(jìn)行對焦,以提高所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
本發(fā)明實施例提供了一種拍攝方法,包括:
獲取當(dāng)前圖像并對所述當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,所述當(dāng)前對焦位置為人眼位置;
根據(jù)所述當(dāng)前對焦位置對進(jìn)行對焦;
接收拍攝指令以獲取目標(biāo)圖像。
本發(fā)明實施例還提供了一種終端,包括:
獲取單元,用于獲取當(dāng)前圖像;
處理單元,用于對所述獲取單元獲取的當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,所述當(dāng)前對焦位置為人眼位置;
對焦單元,用于根據(jù)所述出處理單元得到的當(dāng)前對焦位置對進(jìn)行對焦;
所述獲取單元還用于接收拍攝指令以獲取目標(biāo)圖像。
本發(fā)明實施例中,終端通過獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,并根據(jù)該當(dāng)前對焦位置進(jìn)行對焦,根據(jù)拍攝指令獲取目標(biāo)圖像。由于當(dāng)前對焦位置為人眼位置,因此可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
附圖說明
為了更清楚地說明本發(fā)明實施例技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一實施例提供的一種拍攝方法的流程示意圖;
圖2是本發(fā)明另一實施例提供的一種拍攝方法的流程示意圖;
圖3是本發(fā)明一實施例提供的一種特征模版的示意圖;
圖4是本發(fā)明一實施例提供的一種子窗口的結(jié)構(gòu)示意圖;
圖5是本發(fā)明另一實施例提供的一種子窗口的結(jié)構(gòu)示意圖;
圖6是本發(fā)明另一實施例提供的一種強(qiáng)分類器的結(jié)構(gòu)示意圖;
圖7是目標(biāo)人臉圖像的示意圖;
圖8是經(jīng)顯著性處理后的區(qū)域圖像示意圖;
圖9是本發(fā)明一實施例提供的一種終端的結(jié)構(gòu)示意圖;
圖10是本發(fā)明另一實施例提供的一種終端的結(jié)構(gòu)示意;
圖11是本發(fā)明再一實施例提供的一種終端的結(jié)構(gòu)示意。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
應(yīng)當(dāng)理解,當(dāng)在本說明書和所附權(quán)利要求書中使用時,術(shù)語“包括”和“包含”指示所描述特征、整體、步驟、操作、元素和/或組件的存在,但并不排除一個或多個其它特征、整體、步驟、操作、元素、組件和/或其集合的存在或添加。
還應(yīng)當(dāng)理解,在此本發(fā)明說明書中所使用的術(shù)語僅僅是出于描述特定實施例的目的而并不意在限制本發(fā)明。如在本發(fā)明說明書和所附權(quán)利要求書中所使用的那樣,除非上下文清楚地指明其它情況,否則單數(shù)形式的“一”、“一個”及“該”意在包括復(fù)數(shù)形式。
還應(yīng)當(dāng)進(jìn)一步理解,在本發(fā)明說明書和所附權(quán)利要求書中使用的術(shù)語“和/或”是指相關(guān)聯(lián)列出的項中的一個或多個的任何組合以及所有可能組合,并且包括這些組合。
如在本說明書和所附權(quán)利要求書中所使用的那樣,術(shù)語“如果”可以依據(jù)上下文被解釋為“當(dāng)...時”或“一旦”或“響應(yīng)于確定”或“響應(yīng)于檢測到”。類似地,短語“如果確定”或“如果檢測到[所描述條件或事件]”可以依據(jù)上下文被解釋為意指“一旦確定”或“響應(yīng)于確定”或“一旦檢測到[所描述條件或事件]”或“響應(yīng)于檢測到[所描述條件或事件]”。
具體實現(xiàn)中,本發(fā)明實施例中描述的終端包括但不限于諸如具有觸摸敏感表面(例如,觸摸屏顯示器和/或觸摸板)的移動電話、膝上型計算機(jī)或平板計算機(jī)之類的其它便攜式設(shè)備。還應(yīng)當(dāng)理解的是,在某些實施例中,所述設(shè)備并非便攜式通信設(shè)備,而是具有觸摸敏感表面(例如,觸摸屏顯示器和/或觸摸板)的臺式計算機(jī)。
在接下來的討論中,描述了包括顯示器和觸摸敏感表面的終端。然而,應(yīng)當(dāng)理解的是,終端可以包括諸如物理鍵盤、鼠標(biāo)和/或控制桿的一個或多個其它物理用戶接口設(shè)備。
終端支持各種應(yīng)用程序,例如以下中的一個或多個:繪圖應(yīng)用程序、演示應(yīng)用程序、文字處理應(yīng)用程序、網(wǎng)站創(chuàng)建應(yīng)用程序、盤刻錄應(yīng)用程序、電子表格應(yīng)用程序、游戲應(yīng)用程序、電話應(yīng)用程序、視頻會議應(yīng)用程序、電子郵件應(yīng)用程序、即時消息收發(fā)應(yīng)用程序、鍛煉支持應(yīng)用程序、照片管理應(yīng)用程序、數(shù)碼相機(jī)應(yīng)用程序、數(shù)字?jǐn)z影機(jī)應(yīng)用程序、web瀏覽應(yīng)用程序、數(shù)字音樂播放器應(yīng)用程序和/或數(shù)字視頻播放器應(yīng)用程序。
可以在終端上執(zhí)行的各種應(yīng)用程序可以使用諸如觸摸敏感表面的至少一個公共物理用戶接口設(shè)備??梢栽趹?yīng)用程序之間和/或相應(yīng)應(yīng)用程序內(nèi)調(diào)整和/或改變觸摸敏感表面的一個或多個功能以及終端上顯示的相應(yīng)信息。這樣,終端的公共物理架構(gòu)(例如,觸摸敏感表面)可以支持具有對用戶而言直觀且透明的用戶界面的各種應(yīng)用程序。
請參考圖1,是本發(fā)明一實施例提供的拍攝方法的流程示意圖,如圖所示,該方法可以包括以下步驟:
S101、終端獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,該當(dāng)前對焦位置為人眼位置。
需要說明的是,用戶可以通過觸控或者語音的方式向終端發(fā)送開啟拍照應(yīng)用的指令,終端在接收到用戶發(fā)送的開啟拍照應(yīng)用指令的時,可以開啟拍照應(yīng)用以獲取當(dāng)前圖像,可以對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,該當(dāng)前對焦位置為人眼位置。具體的,終端可以對該當(dāng)前圖像進(jìn)行灰度處理以得到灰度圖像,并可以對灰度圖像進(jìn)行人臉檢測,若檢測到人臉圖像,則可以對人臉圖像進(jìn)行顯著性檢測以獲得人眼位置;若沒有檢測到人臉圖像,則終端可以直接將當(dāng)前圖像作為目標(biāo)圖像,可以不執(zhí)行以下步驟。
其中,當(dāng)前圖像是指終端接收到開啟拍照應(yīng)用的指令時拍攝的,該當(dāng)前圖像以緩存的形式存儲在終端中,可用于獲取人眼位置,以便終端可以根據(jù)該人眼位置拍出清晰的目標(biāo)圖像,在拍完目標(biāo)圖像后,終端可以將該當(dāng)前圖像刪除。另外,上述當(dāng)前對焦位置可以是多個,也可以是一個,當(dāng)前對焦位置的數(shù)量由當(dāng)前圖像中的人物個數(shù)決定,也就是說一個人物對應(yīng)一個當(dāng)前對焦位置。上述終端可以是智能手機(jī)、照相機(jī)、平板電腦,智能可穿戴設(shè)備等具有拍照功能的設(shè)備,本發(fā)明實施例不做限定。
作為一種可選的實施方式,上述對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,可以包括以下步驟S1011、S1012和S1013。
S1011、終端對該當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像。
需要說明的是,終端可以根據(jù)當(dāng)前圖像的格式做出相應(yīng)的灰度處理以獲得灰度圖像,例如,若終端獲取的當(dāng)前圖像是YUV格式,可以通過提取Y通道的圖像以獲得灰度圖像;若終端獲取的當(dāng)前圖像是RGB格式,可以通過提取G通道的圖像以得到灰度圖像。以上兩種獲取當(dāng)前圖像的灰度圖像的方法僅是示意性的,本發(fā)明實施例對此不做限制。
S1012、終端對該灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像。
需要說明的是,終端可以采用人臉檢測方法對該灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像,以便進(jìn)一步獲取人眼位置,具體的,人臉檢測方法可以包括基于學(xué)習(xí)的人臉檢測方法或基于特征的人臉檢測方法等?;趯W(xué)習(xí)的人臉檢測方法可以包括基于Adaboost的方法、基于貝葉斯準(zhǔn)則的方法、基于人工神經(jīng)網(wǎng)絡(luò)的方法(Artificial Neural Network,ANN)或支持向量機(jī)的方法(Support Vector Machine,SVM)等?;谔卣鞯娜四槞z測方法包括底層特征分析方法、組群特征方法或變形模板方法等,其中,底層特征分析方法又包括基于膚色的人臉檢測方法。
其中,上述的目標(biāo)人臉圖像中,可以包括多個人物的人臉,也可以只有一個人物的人臉。
舉例來說,終端可以將灰度圖像劃分為若干個小方格,每個小方格為一個像素點,提取該灰度圖像的各個像素點的顏色信息,將各個像素點的顏色信息與人臉顏色信息數(shù)據(jù)庫進(jìn)行對比,若該像素點的顏色信息與人臉顏色信息數(shù)據(jù)庫匹配,則該像素點屬于人臉,將該灰度圖像中屬于人臉的像素點進(jìn)行聚類以得到目標(biāo)人臉圖像。
S1013、終端對該目標(biāo)人臉圖像進(jìn)行顯著性檢測以獲得該當(dāng)前對焦位置。
需要說明的是,由于人眼具有嚴(yán)格的對稱性、眼球形狀的特殊性,左右兩眼睛的距離具有相對固定性等特點,終端可以對目標(biāo)人臉圖像進(jìn)行顯著性檢測以獲得該當(dāng)前的對焦位置即人眼位置。
具體地,終端先對目標(biāo)人臉圖像進(jìn)行離散余弦變換及負(fù)離散余弦變換以得到區(qū)域圖像,再對比目標(biāo)人臉圖像及區(qū)域圖像并結(jié)合先驗知識得到當(dāng)前對焦位置。需要說明的是,通過顯著性檢測以獲得人眼位置的方法具有很強(qiáng)的時效性,可以優(yōu)化達(dá)到毫秒級。
結(jié)合步驟S1011、S1012、S1013來看,終端可以對該當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像,對該灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像,對該目標(biāo)人臉圖像進(jìn)行顯著性檢測以獲得該當(dāng)前對焦位置。
S102、終端根據(jù)該當(dāng)前對焦位置進(jìn)行對焦。
需要說明的是,終端在獲取該當(dāng)前對焦位置后,可以自動根據(jù)該當(dāng)前對焦位置來調(diào)節(jié)物距和相距進(jìn)行對焦,以便拍出清晰的人眼。
S103、終端接收拍攝指令以獲取該目標(biāo)圖像。
需要說明的是,終端接收到用戶通過語音、觸控操作等方式發(fā)送的拍攝指令時,可以拍攝目標(biāo)圖像。其中,目標(biāo)圖像是指終端接收到拍攝指令時,根據(jù)當(dāng)前對焦位置對人眼進(jìn)行定焦而拍出的圖像,終端可以將該目標(biāo)圖像存儲在圖片庫中,即該目標(biāo)圖像是用戶想要的圖像。
終端通過獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,并根據(jù)該當(dāng)前對焦位置進(jìn)行對焦,根據(jù)拍攝指令獲取目標(biāo)圖像。由于當(dāng)前對焦位置為人眼位置,因此可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
參見圖2,是本發(fā)明另一實施例提供的一種拍攝方法的流程示意圖,如圖所示,該方法可以包括以下步驟:
S201、終端獲取當(dāng)前圖像,并對該當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像。
終端可根據(jù)用戶發(fā)送的開啟拍照應(yīng)用指令以獲取當(dāng)前圖像,之后根據(jù)當(dāng)前圖像的格式做出相應(yīng)的灰度處理以獲得灰度圖像。例如,若終端獲取的當(dāng)前圖像是YUV格式,可以通過提取Y通道的圖像以獲得灰度圖像;若終端獲取的當(dāng)前圖像是RGB格式,可以通過提取G通道的圖像以得到灰度圖像。以上兩種獲取當(dāng)前圖像的灰度圖像的方法僅是示意性的,本發(fā)明實施例對此不做限制。
S202、終端按照預(yù)設(shè)縮小比例對該灰度圖像進(jìn)行縮小以得到第一圖像。
需要說明的是,終端可以按照預(yù)設(shè)縮小比例對該灰度圖像進(jìn)行縮小以得到第一圖像,以便提高檢測目標(biāo)人臉圖像的效率。例如,終端處理一張1300萬像素的圖像,需要20ms,如果將該1300萬像素的圖像縮小10倍,相應(yīng)的處理時間也會縮小。其中,預(yù)設(shè)放大比例可以根據(jù)終端處理圖像的性能決定。
S203、終端將該第一圖像進(jìn)行多次劃分以得到多張第二圖像,每張該第二圖像包括多個子窗口。
需要說明的是,終端可以將該第一圖像進(jìn)行多次劃分以得到多張第二圖像,每張該第二圖像包括多個子窗口,其中每次劃分的子窗口的個數(shù)越多,計算得出的Haar特征值也越多,檢測到的人臉圖像更加準(zhǔn)確,但是每次劃分的子窗口越多,計算Haar特征值的時間也會相應(yīng)增加,另外,子窗口的最大數(shù)量不能超過強(qiáng)分類器檢測的最大子窗口數(shù)量,所以劃分的子窗口的數(shù)量可以根據(jù)檢測人臉圖像的準(zhǔn)確性、計算Haar特征值的時間、強(qiáng)分類器子窗口的數(shù)量等因素綜合考慮。其中,Haar特征值可以通過圖像的子窗口的像素值計算得出,并用于描述圖像的灰度變化。
舉例來說,終端初次可以將第一圖像劃分為20*20個子窗口,然后可以按照等比例擴(kuò)大劃分子窗口的數(shù)量,如按照3倍的比例擴(kuò)大劃分子窗口的數(shù)量,即可以將該第一圖像劃分為60*60個子窗口、180*180個子窗口或540*540個子窗口等。
S204、終端根據(jù)積分圖計算每張該第二圖像中每個子窗口的Haar特征值。
需要說明的是,由于人臉圖像中人眼比臉頰顏色要深,鼻梁兩側(cè)比鼻梁顏色要深,嘴巴比周圍顏色要深等特征,所以可以采用Haar特征值描述第二圖像的灰度變化情況。由于計算Haar特征值需要已知每個子窗口的像素值,每個子窗口的像素值可以根據(jù)子窗口的端點處的積分圖計算出,所以可以根據(jù)積分圖計算每張第二圖像的Haar特征值。
作為一種可選的實施方式,上述根據(jù)積分圖計算每個子窗口的Haar特征值,可以包括:根據(jù)該積分圖計算該每個子窗口對應(yīng)的像素值;根據(jù)該每個子窗口的像素值計算該每個子窗口的Haar特征值。
需要說明的是,灰度圖像中的任意一點的積分圖是指從圖像的左上角到這點所構(gòu)成的矩形區(qū)域內(nèi)所有點的像素值值之和,同理對于具有多個子窗口第二圖像中,每個子窗口端點處的積分圖為該端點到該圖像左上角所包含的所有子窗口的像素值之和。所以在計算出各個子窗口端點處的積分圖的情況下,可以根據(jù)積分圖計算各個子窗口的像素值,并可以根據(jù)每個子窗口的像素值計算各子窗口的Haar特征值。
進(jìn)一步,在計算Haar特征值時,首先需要選擇合適的特征模版,特征模版是由兩個或多個的矩形組合而成,特征模板內(nèi)有黑色和白色兩種矩形,其中常見的特征模版如圖3所示。其中每種特征模版僅對應(yīng)一種特征,但每種特征可以對應(yīng)多種特征模版,常見的特征有邊緣特征、線性特征、點特征、對角特征,然后將特征模版按照預(yù)設(shè)規(guī)則放置在灰度圖像對應(yīng)的子窗口中,計算該特征模版放置區(qū)域?qū)?yīng)的Haar特征值,該Haar特征值由特征模版中白色矩形區(qū)域的像素和減去黑色矩形區(qū)域的像素和計算得出。其中,預(yù)設(shè)規(guī)則包括設(shè)置特征模版的大小、特征模版在子窗口中放置的位置,預(yù)設(shè)規(guī)則根據(jù)灰度圖像劃分的子窗口的數(shù)量決定。
其中,在選定特征模版的情況下,由于特征模版的大小不同,且在每張第二圖像的的子窗口中放置的位置不同,所以對于一個特征模版,每張第二圖像中對應(yīng)有多個Haar特征,同時可以選擇多個特征模版來計算每張第二圖像的Haar特征,另外,該每張第二圖像的劃分的子窗口的數(shù)量不一樣,所以每張第二圖像的Haar特征值的數(shù)量不一樣。
舉例來說,終端可以將灰度圖像縮小1000倍,并將該縮小后的灰度圖像劃分為20*20個子窗口,根據(jù)積分圖計算各個子窗口的像素值,其步驟包括:
1、計算各個子窗口端點處的積分圖,這里以計算如圖4中的子窗口D的端點(i,j)處的積分圖為例,端點(i,j)的積分圖為該點到灰度圖像左上角所包括的各子窗口的像素之和,可表示為:
Integral(i,j)=子窗口D的像素值+子窗口C的像素值+子窗口B的像素值+子窗口A的像素值;
因為Integral(i-1,j-1)=子窗口A的像素值;
Integral(i-1,j)=子窗口A的像素值+子窗口C的像素值;
Integral(i,j-1)=子窗口B的像素值+子窗口A的像素值;
所以,Integral(i,j)進(jìn)一步可以表示為:
Integral(i,j)=Integral(i,j-1)+Integral(i-1,j)-Integral(i-1,j-1)+子窗口D的像素值;
其中,Integral(,)表示某點的積分圖,進(jìn)過觀察發(fā)現(xiàn)(i,j)點的積分圖可以通過(i,j-1)點的積分圖Integral(i,j-1)加上第j列的像素和ColumnSum(j)獲得,即(i,j)點的積分圖可以表示為:
Integral(i,j)=Integral(i,j-1)+ColumnSum(j);
其中,ColumnSum(0)=0,Integral(0,j)=0,所以對于20*20的子窗口,灰度圖像上所有子窗口端點處的積分圖可以通過19+19+2*19*19=760次迭代求得。
2、根據(jù)各子窗口端點處的積分圖計算各個子窗口的像素值,這里以計算子窗口D的像素值為例,由步驟1可知子窗口D的像素值可以由端點(i,j)、(i,j-1),(i-1,j)及(i-1,j-1)處的積分圖計算得出,即子窗口D的像素值可表示為:
子窗口D的像素值=Integral(i,j)+Integral(i-1,j-1)-Integral(i-1,j)-Integral(i,j-1);
根據(jù)上式可知,只要已知各個子窗口端點處的積分圖,就可以計算出各個子窗口的像素值。
進(jìn)一步,在獲得各個子窗口的像素值以后,可以根據(jù)各個窗口的像素值計算Haar特征值,其中選擇不同的特征模版,放置的位置不同,且特征模版的尺寸不同,對應(yīng)的Haar特征值不同,選擇圖4中的以邊緣特征對應(yīng)的特征模板為例,如圖5所示,該特征模版對應(yīng)區(qū)域的Haar特征值可以由子窗口A的像素值減去子窗口B的像素值。
S205、終端根據(jù)強(qiáng)分類器及每張該第二圖像得到的Haar特征值檢測出多張第一人臉圖像。
需要說明的是,在計算出每張第二圖像中各個子窗口的Haar特征值后,終端可以根據(jù)強(qiáng)分類器及每張該第二圖像得到的Haar特征值檢測出多張第一人臉圖像,也就是說根據(jù)一張第二圖像的Haar特征值及強(qiáng)分類器可以檢測出一張第一人臉圖像。具體的,強(qiáng)分類器可以由若干個弱分類器組成,將每張第二圖像的子窗口的Haar特征值輸入到強(qiáng)分類器中,逐級通過各個弱分類器,相當(dāng)于弱分類器判斷Haar特征值是否滿足對應(yīng)的預(yù)設(shè)人臉特征條件,若滿足,則允許該Haar特征值通過,若不滿足,則不允許該Haar特征值通過。如果有一級未通過,則該Haar特征值對應(yīng)的子窗口將被拒絕,并分類為非人臉,每一級都能夠通過,則對該Haar特征值進(jìn)一步處理以找出該Haar特征值對應(yīng)的子窗口,并將該Haar特征值對應(yīng)的子窗口分類為人臉,對每張第二圖像中分類為人臉的子窗口進(jìn)行合并,以得到每張第二圖像對應(yīng)的第一人臉圖像(例如,將子窗口數(shù)量為20*20的第二圖像中檢測出的人臉子窗口進(jìn)行合并得到一張對應(yīng)的第一人臉圖像)。本實施例中所描述的根據(jù)強(qiáng)分類器及每張該第二圖像得到的Haar特征值檢測出多張第一人臉圖像的方法的步驟比較簡單,從而降低人臉圖像檢測的復(fù)雜度,且該強(qiáng)分類器可以是由多個弱分類器組成,所以提高了人臉檢測的準(zhǔn)確率。
舉例來說,如圖6所示,若該強(qiáng)分類器是由3個級聯(lián)的弱分類器組成,將子窗口數(shù)量為24*24的第二圖像的各個子窗口的Haar特征值依次輸入到3個弱分類器中,每個弱分類器判斷該Haar特征值是否滿足對應(yīng)的預(yù)設(shè)人臉特征條件,若滿足,則允許該Haar特征值通過,若不滿足,則不允許該Haar特征值通過。如果有一級未通過,則該Haar特征值對應(yīng)的子窗口將被拒絕,并分類為非人臉,每一級都能夠通過,則對該Haar特征值進(jìn)一步處理以找出該Haar特征值對應(yīng)的子窗口,并將該Haar特征值對應(yīng)的子窗口分類為人臉,將子窗口數(shù)量為24*24的第二圖像中分類為人臉的子窗口進(jìn)行合并,以得子窗口數(shù)量為24*24的第二圖像對應(yīng)的第一人臉圖像。同理可以根據(jù)以上步驟計算子窗口數(shù)量為36*36的第二圖像對應(yīng)的第一人臉圖。
進(jìn)一步地,在檢測出多張人臉圖像之前,還需要獲取強(qiáng)分類器。具體的,獲取強(qiáng)分類器的詳細(xì)描述如下:
1、選定訓(xùn)練樣本T={(x1,y1),(x2,y2)…(xi,yi)…(xN,yN)},并將該訓(xùn)練樣本存儲于指定位置,如樣本數(shù)據(jù)庫中。其中xi表示第i個樣本,yi=0時表示其為負(fù)樣本(非人臉),yi=1時表示其為正樣本(人臉)。N為訓(xùn)練樣本數(shù)量。
2、初始化訓(xùn)練樣本的權(quán)值分布D1,即給每個訓(xùn)練樣本設(shè)置相同的權(quán)值,可以表示為:
D1=(w11,w12…w1i…w1N),w1i=1/N,i=1,2…N
3、設(shè)置迭代次數(shù)T,用t=1,2,...,T表示第多少次迭代。
4、歸一化權(quán)值:
其中,Dt(i)為第t次循環(huán)中第i個樣本的權(quán)值,qt(i)為第t次循環(huán)中第i個樣本的歸一化權(quán)值。
5、對訓(xùn)練樣本進(jìn)行學(xué)習(xí)以得到多個弱分類器,并計算每一弱分類器在訓(xùn)練樣本上的分類誤差率:使用具有權(quán)值分布Dt的訓(xùn)練樣本學(xué)習(xí)得到弱分類器h(xi,fi,pi,θi),計算弱分類器的分類錯誤率εt:
其中,一個弱分類器h(xi,fi,pi,θi)是由特征fi,閾值θi,以及偏置位置pi組成:
另外,xi為一個訓(xùn)練樣本,特征fi與弱分類器hi(xi,fi,pi,θi)具有一一對應(yīng)的關(guān)系,偏置位pi的作用是控制不等式的方向,使得不等式符號都是小于等于號,訓(xùn)練一個弱分類器的就是找到最優(yōu)閾值值θi的過程。
6、從5中確定的弱分類器中,找出一個具有最小的分類錯誤率εt(i)的弱分類器ht。
7、根據(jù)分類誤差率計算弱分類器的系數(shù)βt:
βt=εt/(1-εt)
其中,該系數(shù)表示每一弱分類器在強(qiáng)分類器中所占的權(quán)值,當(dāng)xi被正確地分類時,ei的值取0,當(dāng)被xi錯誤地分類時,ei的值取1。并跟該系數(shù)對所有訓(xùn)練樣本的權(quán)值進(jìn)行更新:
8、所有訓(xùn)練樣本的權(quán)值更新后,循環(huán)執(zhí)行步驟4到7,直到迭代T次后,結(jié)束迭代,得到強(qiáng)分類器H(x):
其中,αt=log(1/βt)。
S206、終端將該多張第一人臉圖像進(jìn)行合并得到所述目標(biāo)人臉圖像。
需要說明的是,將該多張第一人臉圖像進(jìn)行合并得到該目標(biāo)人臉圖像,也就是說對不同子窗口數(shù)量的第二圖像得到的多張人臉圖像進(jìn)行合并得到該目標(biāo)人臉圖像。具體的,將不同的第一人臉圖像進(jìn)行對比,若某兩張第一人臉圖像重疊面積大于預(yù)設(shè)閾值,則認(rèn)為這兩張第一人臉圖像表示同一人臉,對這兩張第一人臉進(jìn)行合并,即將這兩張第一人臉的位置和大小的平均值作為合并后得到的人臉位置和大?。蝗绻硟蓮埖谝蝗四槇D像重疊面積小于預(yù)設(shè)閾值,則認(rèn)為該兩張第一人臉圖像表示兩個不同的人臉,將該兩張人臉圖像合并成一張圖像,該圖像具有兩個人臉區(qū)域,經(jīng)過多次對比及合并操作可以得到目標(biāo)人臉圖像。其中,該目標(biāo)人臉圖像可以是一個人臉圖像也可以是多個人臉圖像。
S207、終端對該目標(biāo)人臉圖像進(jìn)行顯著性檢測以獲得該當(dāng)前對焦位置。
具體地,終端先對目標(biāo)人臉圖像進(jìn)行離散余弦變換及負(fù)離散余弦變換以得到區(qū)域圖像,再對比目標(biāo)人臉圖像及區(qū)域圖像并結(jié)合先驗知識得到當(dāng)前對焦位置。需要說明的是,通過顯著性檢測以獲得人眼位置的方法具有很強(qiáng)的時效性,可以優(yōu)化達(dá)到毫秒級。
進(jìn)一步地,步驟S207具體包括:
(1)對如圖7所示的目標(biāo)人臉圖像,采用公式(1)進(jìn)行離散余弦變換(Discrete Cosine Transformation,DCT):
其中,x,y,u,v=0,1,…,N-1。
進(jìn)一步地,在公式(1)中,F(xiàn)(u,v)表示經(jīng)DCT變換后的信號,f(x,y)表示原始信號,N表示原始信號的個數(shù),c(u)、c(v)表示補(bǔ)償系數(shù),其可以使得經(jīng)DCT變換后的矩陣成為正交矩陣。
(2)采用公式(2)對步驟(1)中進(jìn)行DCT變換后的圖像進(jìn)行符號變換:
進(jìn)一步地,公式(2)表示從公式(1)中所得到的值為1或0或-1。
(3)采用公式(3)對步驟(2)中進(jìn)行符號變換后的圖像進(jìn)行負(fù)離散余弦變換(Inverse Discrete Cosine Transformation,IDCT)以得到如圖8所示的區(qū)域圖像:
其中,x,y,u,v=0,1,…,N-1.
進(jìn)一步地,在公式(2)中,F(xiàn)(u,v)表示經(jīng)DCT變換后的信號,f(x,y)表示原始信號,N表示原始信號的個數(shù),c(u)、c(v)表示補(bǔ)償系數(shù),其可以使得經(jīng)DCT變換后的矩陣成為正交矩陣。
(4)對比如圖7所示的目標(biāo)人臉圖像及如圖8所示的區(qū)域圖像并結(jié)合先驗知識得到當(dāng)前對焦位置。
S208、終端根據(jù)該當(dāng)前對焦位置進(jìn)行對焦。
S209、終端接收拍攝指令以獲取該目標(biāo)圖像。
本發(fā)明實施例中,終端通過按照預(yù)設(shè)縮小比例對灰度圖像進(jìn)行縮小以得到第一圖像,提高了檢測人臉圖像的效率,另外,終端通過將該第一圖像進(jìn)行多次劃分以得到多張第二圖像,每張該第二圖像包括多個子窗口,并根據(jù)積分圖計算每張該第二圖像中每個子窗口的Haar特征值,根據(jù)強(qiáng)分類器及每張該第二圖像得到的Haar特征值檢測出多張第一人臉圖像,降低了檢測人臉圖像的復(fù)雜度,并提高了人臉檢測的準(zhǔn)確率。進(jìn)一步,終端將該多張第一人臉圖像進(jìn)行合并得到目標(biāo)人臉圖像,通過采用顯著性檢測該目標(biāo)人臉圖像以獲得該當(dāng)前對焦位置,該對焦位置為人眼位置,提高了人眼位置檢測的時效性,更進(jìn)一步,終端通過根據(jù)該當(dāng)前對焦位置進(jìn)行對焦,接收拍攝指令以獲取該目標(biāo)圖像,可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
參見圖9,圖9是本發(fā)明實施例提供的一種終端的結(jié)構(gòu)示意圖,本實施例中所描述的終端,包括:
獲取單元701,用于獲取當(dāng)前圖像。
處理單元702,用于對所述獲取單元701獲取的當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,所述當(dāng)前對焦位置為人眼位置。
對焦單元703,用于根據(jù)所述處理單元702得到的當(dāng)前對焦位置進(jìn)行對焦。
所述獲取單元701,還用于接收拍攝指令以獲取目標(biāo)圖像。
進(jìn)一步地,該處理單元702具體用于:
對所述當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像;
對所述灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像;
對所述人臉圖像進(jìn)行顯著性檢測以獲得所述當(dāng)前對焦位置。
本發(fā)明實施例中,終端通過獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,并根據(jù)該當(dāng)前對焦位置進(jìn)行對焦,根據(jù)拍攝指令獲取該目標(biāo)圖像。由于當(dāng)前對焦位置為人眼位置,因此可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
請參見圖10,圖10是本發(fā)明另一實施例提供一種移動終端的結(jié)構(gòu)示意圖,如圖10所示,該移動終端可以包括:
獲取單元801,用于獲取當(dāng)前圖像
處理單元802,用于對所述獲取單元801獲取的當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,所述當(dāng)前對焦位置為人眼位置;
對焦單元803,用于根據(jù)所述處理單元802得到的當(dāng)前對焦位置進(jìn)行對焦;
所述獲取單元801還用于接收拍攝指令以獲取目標(biāo)圖像;
初始化單元804,用于初始化訓(xùn)練樣本的權(quán)值分布;
學(xué)習(xí)單元805,用于對訓(xùn)練樣本進(jìn)行學(xué)習(xí)以得到多個弱分類器;
計算單元806,用于計算所述學(xué)習(xí)單元805得到的每一所述弱分類器在所述訓(xùn)練樣本上的分類誤差率;
所述計算單元806,還用于根據(jù)所述分類誤差率計算所述弱分類器的系數(shù),所述系數(shù)表示每一所述弱分類器在所述強(qiáng)分類器中所占的權(quán)重;
更新單元807,用于根據(jù)所述計算單元806得到的系數(shù)更新所述訓(xùn)練樣本中的權(quán)值分布并進(jìn)行迭代計算,以得到所述強(qiáng)分類器,所述強(qiáng)分類器為每次迭代計算中加權(quán)分類誤差率最小的所述分類器。
進(jìn)一步地,該處理單元802具體用于:
對所述當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像;
對所述灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像;
對所述人臉圖像進(jìn)行顯著性檢測以獲得所述當(dāng)前對焦位置。
進(jìn)一步地,該處理單元802具體用于:
按照預(yù)設(shè)縮小比例對所述灰度圖像進(jìn)行縮小以得到第一圖像;
將所述第一圖像進(jìn)行多次劃分以得到多張第二圖像,每張所述第二圖像包括多個子窗口;
根據(jù)積分圖計算每張所述第二圖像中每個子窗口的Haar特征值;
根據(jù)強(qiáng)分類器及每張所述第二圖像得到的Haar特征值檢測出多張第一人臉圖像;
將所述多張第一人臉圖像進(jìn)行合并得到所述目標(biāo)人臉圖像。
進(jìn)一步地,根據(jù)積分圖計算每個子窗口的haar特征值具體包括:
根據(jù)所述積分圖計算所述每個子窗口的像素值;
根據(jù)所述每個子窗口對應(yīng)的像素值計算所述每個子窗口的Haar特征值。
本發(fā)明實施例中,終端通過獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,并根據(jù)該當(dāng)前對焦位置進(jìn)行對焦,根據(jù)拍攝指令獲取該目標(biāo)圖像。由于當(dāng)前對焦位置為人眼位置,因此可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝的目標(biāo)圖像的人眼區(qū)域的清晰度。
需要說明的是,圖9及圖10所示終端的具體工作流程已在前述方法流程部分做了詳述,在此不再贅述。
另外,需要說明的是,圖像的Haar特征值的計算過程與通過強(qiáng)分類器對人臉檢測的步驟可以在不同的終端上進(jìn)行實現(xiàn)。
參見圖11,圖11是本發(fā)明再一實施例提供的一種終端的結(jié)構(gòu)示意圖,本實施例中所描述的終端可以包括:一個或多個處理器903,一個或多個輸入接口901,一個或多個輸出接口902和存儲器904。處理器903、輸入接口901、輸出接口902和存儲器通過總線805連接。
輸入接口901可以包括觸控板、指紋采傳感器(用于采集人物的指紋信息和指紋的方向信息)、麥克風(fēng)等,輸出接口902可以包括顯示器(LCD等)、揚(yáng)聲器等。
處理器903可以是中央處理模塊(Central Processing Unit,CPU),該處理器還可以是其他通用處理器、數(shù)字信號處理器(Digital Signal Processor,DSP)、專用集成電路(Application Specific Integrated Circuit,ASIC)、現(xiàn)成可編程門陣列(Field-Programmable Gate Array,F(xiàn)PGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。
存儲器904可以是高速RAM存儲器,也可為非不穩(wěn)定的存儲器(non-volatile memory),例如磁盤存儲器。存儲器904用于存儲一組程序代碼,輸入接口901、輸出接口902和處理器903可以調(diào)用存儲器904中存儲的程序代碼。
處理器903調(diào)用存儲器904中的代碼可以執(zhí)行以下操作:
獲取當(dāng)前圖像并對所述當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,所述當(dāng)前對焦位置為人眼位置;
根據(jù)所述當(dāng)前對焦位置進(jìn)行對焦;
接收拍攝指令以獲取目標(biāo)圖像。
作為一種可選的實施方式,處理器903調(diào)用存儲器904中的代碼還可以執(zhí)行以下操作:
對所述當(dāng)前圖像進(jìn)行灰度處理以獲得灰度圖像;
對所述灰度圖像進(jìn)行人臉檢測以檢測出目標(biāo)人臉圖像;
對所述人臉圖像進(jìn)行顯著性檢測以獲得所述當(dāng)前對焦位置。
作為一種可選的實施方式,處理器903調(diào)用存儲器904中的代碼還可以執(zhí)行以下操作:
按照預(yù)設(shè)縮小比例對所述灰度圖像進(jìn)行縮小以得到第一圖像;
將所述第一圖像進(jìn)行多次劃分以得到多張第二圖像,每張所述第二圖像包括多個子窗口;
根據(jù)積分圖計算每張所述第二圖像中每個子窗口的Haar特征值;
根據(jù)強(qiáng)分類器及每張所述第二圖像得到的Haar特征值檢測出多張第一人臉圖像;
將所述多張第一人臉圖像進(jìn)行合并得到所述目標(biāo)人臉圖像。
作為一種可選的實施方式,處理器903調(diào)用存儲器904中的代碼還可以執(zhí)行以下操作:
根據(jù)所述積分圖計算所述每個子窗口的像素值;
根據(jù)所述每個子窗口對應(yīng)的像素值計算所述每個子窗口的Haar特征值。
作為一種可選的實施方式,處理器903調(diào)用存儲器904中的代碼還可以執(zhí)行以下操作:
初始化訓(xùn)練樣本的權(quán)值分布,所述訓(xùn)練樣本包括人臉樣本和非人臉樣本;
對訓(xùn)練樣本進(jìn)行學(xué)習(xí)以得到多個弱分類器;
計算每一所述弱分類器在所述訓(xùn)練樣本上的分類誤差率;
根據(jù)所述分類誤差率計算所述弱分類器的系數(shù),所述系數(shù)表示每一所述弱分類器在所述強(qiáng)分類器中所占的權(quán)重;
根據(jù)所述系數(shù)更新所述訓(xùn)練樣本中的權(quán)值分布并進(jìn)行迭代計算,以得到所述強(qiáng)分類器,所述強(qiáng)分類器為每次迭代計算中加權(quán)分類誤差率最小的所述分類器。
本發(fā)明實施例中,終端可以獲取當(dāng)前圖像并對該當(dāng)前圖像進(jìn)行處理以得到當(dāng)前對焦位置,該當(dāng)前對焦位置為人眼位置;根據(jù)該當(dāng)前對焦位置對目標(biāo)圖像進(jìn)行對焦;接收拍攝指令以獲取該目標(biāo)圖像,可以快速且準(zhǔn)確的對人眼進(jìn)行對焦,從而提高了所拍攝圖像的清晰度。
具體實現(xiàn)中,本發(fā)明實施例中所描述的處理器903、輸入接口901、輸出接口902可執(zhí)行本發(fā)明實施例提供的拍照方法的第一實施例和第二實施例中所描述的實現(xiàn)方式,也可執(zhí)行本發(fā)明實施例所描述的終端的實現(xiàn)方式,在此不再贅述。
本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機(jī)軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
此外,在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的、終端和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機(jī)械的或其它的形式連接。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本發(fā)明實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
本發(fā)明實施例方法中的步驟可以根據(jù)實際需要進(jìn)行順序調(diào)整、合并和刪減。本發(fā)明實施例終端中的單元可以根據(jù)實際需要進(jìn)行合并、劃分和刪減。以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。