對象檢測方法、對象檢測設(shè)備以及圖像拾取設(shè)備的制作方法
【專利摘要】本發(fā)明涉及對象檢測方法、對象檢測設(shè)備和圖像拾取設(shè)備。該對象檢測方法包括:通用模型存儲步驟,事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件;樣本圖像接收步驟,接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象;對象檢測器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及對象檢測步驟,利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。根據(jù)本發(fā)明,可以高靈活度精確地檢測出特定對象類型的各種對象。
【專利說明】對象檢測方法、對象檢測設(shè)備以及圖像拾取設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種對象檢測方法、對象檢測設(shè)備以及包含所述對象檢測設(shè)備的圖像拾取設(shè)備。
【背景技術(shù)】
[0002]在對象識別、圖像檢索以及圖像注冊等的處理中,對圖像中的視覺對象進(jìn)行的分析是重要的。在很多應(yīng)用領(lǐng)域中都涉及這樣的處理,所述很多應(yīng)用領(lǐng)域諸如是(安保用途的)監(jiān)視、視頻取證以及用于計(jì)算機(jī)輔助診斷的醫(yī)療圖像分析等。特別地,由于對于發(fā)展與真實(shí)世界相關(guān)的系統(tǒng)的需求的增長,對象識別已吸引了越來越多的關(guān)注。
[0003]在常規(guī)對象識別方法中,使用基于學(xué)習(xí)/訓(xùn)練的分類器,對于所述基于學(xué)習(xí)/訓(xùn)練的分類器,分類器參數(shù)的學(xué)習(xí)/訓(xùn)練過程是不可缺少的。然而,使用一個(gè)對象(例如,狗)的具體樣本而通過學(xué)習(xí)/訓(xùn)練過程獲得的分類器可能不能對于另一對象(例如,貓)獲得好的性能。為了使分類器對于其它對象獲得好的性能,不得不使用所述另一對象的具體樣本來重新執(zhí)行另一學(xué)習(xí)/訓(xùn)練過程,以便將分類器從用于所述一個(gè)對象的分類器修改為用于所述另一對象的分類器。這并不靈活而且花費(fèi)很長時(shí)間。
[0004]用于解決以上問題的一種方法是訓(xùn)練用于特定對象類型(例如,包括狗和貓的寵物)的通用分類器,但是這種通用分類器將使精度下降,并且檢測出用戶并不關(guān)心的對象。例如,即使用戶僅希望在圖像中檢測出狗,也會從該圖像中檢測出貓。
[0005]在美國專利申請公布N0.US2010014721A1以及美國專利公告N0.US7558408B1、N0.US7555148B1和N0.US7551755B1中討論了用于解決以上問題的另一方法。這些專利文獻(xiàn)中公開的方法首先使用某一對象類型的通用分類器(例如,用于寵物的分類器)來定位圖像中的候選對象的位置,然后使用具體分類器(例如,用于貓的分類器)來判斷該候選對象是否恰好是感興趣的對象。該方法已被用于照相機(jī)中。根據(jù)這種方法,可以由用戶事先注冊若干個(gè)具體分類器(例如,用于貓的分類器、用于一種狗的分類器和用于另一種狗的分類器),并且,用戶可以在拍攝圖片之前選擇用于要聚焦的對象的具體分類器之一。該照相機(jī)可被配置為自動(dòng)聚焦于從取景器中顯示的圖像檢測到的對象。
[0006]然而,本發(fā)明的發(fā)明人發(fā)現(xiàn),上述專利文獻(xiàn)中公開的方法也并不足夠好,這是因?yàn)槟軌虮粰z測的具體對象還是有限的,而且僅僅由用戶事先注冊的具體對象才能被檢測到。
【發(fā)明內(nèi)容】
[0007]在對象檢測技術(shù)中通常涉及兩個(gè)步驟,即訓(xùn)練的步驟和檢測的步驟。在訓(xùn)練的步驟中,通過使用對象的一個(gè)或更多個(gè)樣本進(jìn)行訓(xùn)練來獲得分類器。然后,在檢測的步驟中,這樣獲得的分類器被用于檢測對象。為了獲得穩(wěn)定且精確的分類器,對于訓(xùn)練一般需要相當(dāng)大量的樣本,而相當(dāng)大量的樣本將導(dǎo)致增大的計(jì)算量,這使得訓(xùn)練是耗費(fèi)時(shí)間的。在需要實(shí)時(shí)訓(xùn)練分類器的情況下,或者在計(jì)算能力有限的情況下(例如在應(yīng)用嵌入式系統(tǒng)的情況下),常規(guī)技術(shù)無法滿足要求。另一方面,如果試圖通過簡單減少樣本數(shù)量來縮短用于訓(xùn)練分類器的時(shí)間,則通過這樣的訓(xùn)練獲得的分類器將不會足夠穩(wěn)定,并且對于諸如對象的姿態(tài)、照明條件或視角等因素將會非常敏感。
[0008]因此,本發(fā)明所要解決的技術(shù)問題之一是提供用于對象檢測的新技術(shù),該用于對象檢測的新技術(shù)對于各種對象都具有靈活性和精確性。此外,還期望該新技術(shù)具有可接受的效率。
[0009]為了解決至少一個(gè)技術(shù)問題,本發(fā)明提供一種對象檢測方法,包括:通用模型存儲步驟,事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件;樣本圖像接收步驟,接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象;對象檢測器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及對象檢測步驟,利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。
[0010]此外,為了解決上述技術(shù)問題,本發(fā)明提供一種對象檢測設(shè)備,包括:通用模型存儲單元,被配置為事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件;樣本圖像接收單元,被配置為接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象;對象檢測器創(chuàng)建單元,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及對象檢測單元,被配置為利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。
[0011]此外,本發(fā)明提供一種圖像拾取設(shè)備,包括:攝影光學(xué)系統(tǒng);成像單元,被配置為執(zhí)行成像以形成圖像;如上所述的對象檢測設(shè)備,被配置為使用戶能夠輸入或選擇查詢對象,以及在所形成的圖像中檢測所述查詢對象;和成像控制單元,被配置為根據(jù)檢測到的查詢對象執(zhí)行成像控制。
[0012]得益于根據(jù)本發(fā)明的方法和設(shè)備,由于查詢對象可被用于創(chuàng)建檢測器,因此該特定對象類型的各種對象都能夠以高靈活性被精確檢測。此外,由于從事先離線存儲的通用模型創(chuàng)建檢測器,因此檢測的效率也可以是高的。
[0013]更具體地,本說明書中的公開內(nèi)容提供一種組合用于檢測具體對象的離線訓(xùn)練和在線查詢的機(jī)制。耗費(fèi)時(shí)間的用于訓(xùn)練分類器的步驟被事先離線地僅執(zhí)行一次,而在在線查詢步驟期間將分類器專門化。以這種方式,施加給在線計(jì)算模塊的計(jì)算量減小,而即使對于嵌入式系統(tǒng)也能實(shí)時(shí)執(zhí)行操作。根據(jù)本發(fā)明的一些實(shí)施例,用戶能夠輸入(查詢)要被檢測的對象,然后使系統(tǒng)在圖像中檢測查詢的對象。此外,根據(jù)本發(fā)明的一些實(shí)施例,由于通過在離線階段期間使用大量樣本進(jìn)行訓(xùn)練來獲得分類器,因此對象檢測具有高的精確度和強(qiáng)健性,并且還具有對對象差異的合理的容忍度。從參照附圖的以下描述,本發(fā)明的其他特性特征和優(yōu)點(diǎn)將變得清晰。
【專利附圖】
【附圖說明】
[0014]并入說明書并且構(gòu)成說明書的一部分的附圖圖示了本發(fā)明的實(shí)施例,并且與描述一起用于說明本發(fā)明的原理。[0015]圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的示例性硬件配置的框圖。
[0016]圖2是示出根據(jù)本發(fā)明的實(shí)施例的對象檢測方法的流程圖。
[0017]圖3a和3b示出通用模型的一些例子。
[0018]圖4a和4b示出使得用戶能夠在樣本圖像中標(biāo)記部件的用戶界面的例子。
[0019]圖5示出根據(jù)本發(fā)明的示例性實(shí)施例的對象檢測器創(chuàng)建步驟的示例性處理。
[0020]圖6是示出根據(jù)示例性實(shí)施例的包括多個(gè)部件之間的位置關(guān)系的通用模型的示意圖。
[0021]圖7示出根據(jù)一個(gè)示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。
[0022]圖8示出根據(jù)示例性實(shí)施例的部件分類器生成步驟的示例性處理的流程圖。
[0023]圖9示出根據(jù)另一示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。
[0024]圖10示出根據(jù)再另一個(gè)示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。
[0025]圖11示出根據(jù)該再另一個(gè)示例性實(shí)施例的部件分類器生成步驟的示例性處理的流程圖。
[0026]圖12示出根據(jù)示例性實(shí)施例的對象檢測步驟的示例性處理的流程圖。
[0027]圖13示出根據(jù)示例性實(shí)施例的第一檢測子步驟和第二檢測子步驟的示例性處理的流程圖。
[0028]圖14是示出根據(jù)示例性實(shí)施例的對象檢測設(shè)備的示例性配置的框圖。
[0029]圖15是示出根據(jù)示例性實(shí)施例的圖像拾取設(shè)備的示例性配置的框圖。
【具體實(shí)施方式】
[0030]以下,將參照附圖詳細(xì)描述本發(fā)明的實(shí)施例。
[0031]請注意,類似的參考數(shù)字和字母指的是圖中的類似的項(xiàng)目,因而一旦在一幅圖中定義了 一個(gè)項(xiàng)目,就不需要在之后的圖中討論了。
[0032]圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。
[0033]如圖1中所示,計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲器1130、固定非易失性存儲器接口 1140、可移動(dòng)非易失性存儲器接口 1150、用戶輸入接口 1160、網(wǎng)絡(luò)接口 1170、視頻接口 1190和輸出外圍接口1195。
[0034]系統(tǒng)存儲器1130包括ROM (只讀存儲器)1131和RAM (隨機(jī)存取存儲器)1132。BIOS (基本輸入輸出系統(tǒng))1133駐留在ROM 1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序數(shù)據(jù)1137駐留在RAM 1132中。
[0035]諸如硬盤之類的固定非易失性存儲器1141連接到固定非易失性存儲器接口1140。固定非易失性存儲器1141例如可以存儲操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。
[0036]諸如軟盤驅(qū)動(dòng)器1151和⑶-ROM驅(qū)動(dòng)器1155之類的可移動(dòng)非易失性存儲器連接到可移動(dòng)非易失性存儲器接口 1150。例如,軟盤1152可以被插入到軟盤驅(qū)動(dòng)器1151中,以及⑶(光盤)1156可以被插入到⑶-ROM驅(qū)動(dòng)器1155中。
[0037]諸如鼠標(biāo)1161和鍵盤1162之類的輸入設(shè)備被連接到用戶輸入接口 1160。
[0038]計(jì)算機(jī)1110可以通過網(wǎng)絡(luò)接口 1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180?;蛘撸W(wǎng)絡(luò)接口 1170可以連接到調(diào)制解調(diào)器(調(diào)制器一解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī)1180。
[0039]遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤之類的存儲器1181,其存儲遠(yuǎn)程應(yīng)用程序1185。
[0040]視頻接口 1190連接到監(jiān)視器1191。
[0041]輸出外圍接口 1195連接到打印機(jī)1196和揚(yáng)聲器1197。
[0042]圖1所示的計(jì)算機(jī)系統(tǒng)僅僅是說明性的并且決不意圖對本發(fā)明、其應(yīng)用或用途進(jìn)行任何限制。
[0043]圖1所示的計(jì)算機(jī)系統(tǒng)可以被實(shí)施于任何實(shí)施例,可作為獨(dú)立計(jì)算機(jī),或者也可作為設(shè)備中的處理系統(tǒng),可以移除一個(gè)或更多個(gè)不必要的組件,也可以向其添加一個(gè)或更多個(gè)附加的組件。例如,該計(jì)算機(jī)系統(tǒng)可被適配為適于被裝入照相機(jī)的計(jì)算機(jī)系統(tǒng)。
[0044]圖2是示出根據(jù)實(shí)施例的對象檢測方法的流程圖。在圖2所示的對象檢測方法中,要從目的圖像中檢測出特定對象類型的查詢對象。
[0045]在步驟S2100中,事先離線地存儲用于特定對象類型的通用模型。所述通用模型能夠描述特定對象類型的對象的通用特征。更特別地,所述通用模型能夠描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件。
[0046]圖3a和3b示出通用模型的一些例子。根據(jù)圖3a的例子,所述特定對象類型是“哺乳動(dòng)物的臉”,而預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件例如是“耳朵”、“眼睛”、“鼻子”、“嘴”和“毛發(fā)”。根據(jù)圖3b的例子,所述特定對象類型是“交通工具的正面視圖”,而預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件例如是“擋風(fēng)玻璃”、“后視鏡”、“頭燈”和“車牌”。
[0047]圖3a和圖3b中示出的通用模型的例子僅僅是示例性的和說明性的??梢愿鶕?jù)具體應(yīng)用來設(shè)計(jì)各種通用模型。例如,可以將特定對象類型定義為“人體”,由通用模型描述的多個(gè)部件可以包括“胳膊”、“腿”、“頭”和“軀干”。
[0048]根據(jù)實(shí)施例,通用模型被事先離線地存儲,并且該通用模型可被用于要被在線輸入的任何查詢對象,只要該查詢對象屬于該特定對象類型即可。在這里,查詢對象意味著要從目的圖像中檢測的對象。在特定對象類型是“哺乳動(dòng)物的臉”的情況下(圖3a中所示的例子),查詢對象例如可以是具體的貓的臉、具體的狗的臉、或者具體的人的臉等等。
[0049]在步驟S2200中,接收一個(gè)或多個(gè)樣本圖像的輸入。所述一個(gè)或多個(gè)樣本圖像各包括作為所述特定對象類型的對象的同一查詢對象。所述樣本圖像可以是具有歸一化尺寸的圖像。
[0050]也就是說,可以僅有一個(gè)樣本圖像,或者可以有多個(gè)(即兩個(gè)或更多個(gè))樣本圖像。當(dāng)有多個(gè)樣本圖像時(shí),樣本圖像可以是不同的圖像,但是包括屬于所述特定對象類型的同一查詢對象。對于圖3a所示的例子,查詢對象例如可以是特定貓的臉,而所述一個(gè)或多個(gè)樣本圖像可以是包含該特定貓的臉的一個(gè)或多個(gè)圖像。[0051]在步驟S2300中,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器。
[0052]在此步驟中,使用在樣本圖像中呈現(xiàn)的查詢對象,從通用模型來創(chuàng)建檢測器。該檢測器是專用于檢測該查詢對象的檢測器。對于圖3a所示的例子,使用哺乳動(dòng)物的臉的通用模型和包括特定貓的臉的一個(gè)或多個(gè)樣本圖像來創(chuàng)建該檢測器,以便專門檢測該特定貓的臉。
[0053]步驟S2300可以在輸入查詢對象之后在線地被執(zhí)行。
[0054]在步驟S2400中,使用所創(chuàng)建的專用于所述查詢對象的檢測器來從目的圖像檢測所述查詢對象。所述目的圖像可以是來自數(shù)據(jù)庫諸如圖像庫的圖像,或者可以是由照相機(jī)實(shí)時(shí)拍攝的圖像,或者可以是來自視頻的一幀。所述目的地圖像可以是具有歸一化尺寸的圖像。
[0055]根據(jù)本實(shí)施例的方法,由于通過使用查詢對象從通用模型在線創(chuàng)建具體檢測器,本方法對于各種對象都具有靈活性,并且不限于事先注冊的對象。此外,由于通用模型是離線地被生成和存儲的,因此檢測的效率是能夠令人接受的。
[0056]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在樣本圖像接收步驟S2200中,可以接收或者生成對所述一個(gè)或多個(gè)樣本圖像中的各個(gè)部件的標(biāo)記。
[0057]對各個(gè)部件的標(biāo)記可以是由用戶執(zhí)行的。在這種情況下,可以提供用戶界面以有助于所述標(biāo)記。
[0058]圖4a和4b示出使用戶能夠標(biāo)記樣本圖像中的部件的用戶界面的例子。
[0059]在圖4a示出的例子中,在屏幕上示出代表各個(gè)部件的按鈕。在選擇一個(gè)按鈕之后,用戶可以指出或者圈出樣本圖像中的相應(yīng)部件。例如,用戶可選擇部件“眼睛”(圖4a中的部件按鈕上的陰影意味著該部件被選中),然后在樣本圖像中圈出眼睛區(qū)域(在圖4a中用虛線示出由用戶標(biāo)記的圓圈)。
[0060]在圖4b所示的例子中,代表各個(gè)部件的圓圈示出在屏幕上,用戶可以拖動(dòng)圓圈和調(diào)整圓圈尺寸以使得它們包圍樣本圖像中的相應(yīng)部件。如圖4b所示,一只耳朵和一只眼睛已被用戶標(biāo)記出。
[0061]雖然圖4a和4b示出在樣本圖像中標(biāo)記各個(gè)部件的一些例子,但本發(fā)明不限于此。也可以自動(dòng)生成標(biāo)記而無用戶介入。例如,可以使用通用模型中的分類器在樣本圖像中標(biāo)記各個(gè)部件。也可以使用用于該特定對象類型的其它檢測器在樣本圖像中標(biāo)記各個(gè)部件。此外,還可以首先自動(dòng)執(zhí)行標(biāo)記,然后用戶手動(dòng)進(jìn)行調(diào)整。
[0062]此外,雖然沒有在圖4a和4b中示出,還可以從樣本圖像中標(biāo)記出整個(gè)查詢對象(本例子中為貓的臉)。
[0063]可以接收并且存儲標(biāo)記出的各個(gè)部件的位置和尺寸以供之后使用。也可存儲標(biāo)記出的查詢對象的位置和尺寸以供之后使用。
[0064]此外,可以對于相應(yīng)部件存儲標(biāo)記出的圖像區(qū)域以供之后使用。
[0065]圖5示出根據(jù)本發(fā)明的示例性實(shí)施例的對象檢測器創(chuàng)建步驟S2300的示例性處理。
[0066]如圖5所示,步驟S2300可以包括部件分類器生成步驟S2310和部件分類器組合步驟S2320。[0067]在步驟S2310中,使用通用模型中的各個(gè)部件與所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各個(gè)部件之間的匹配,生成專用于所述查詢對象的各個(gè)部件的多個(gè)部件分類器。
[0068]再以圖3a所示的例子為例,可以在圖3a所示的部件(哺乳動(dòng)物的眼睛和耳朵等)與圖4a和4b所示的部件(特定的貓的眼睛和耳朵等)之間執(zhí)行匹配,并且根據(jù)匹配的結(jié)果生成專用于該特定的貓的部件的多個(gè)部件分類器。例如,將生成專用于該特定的貓的眼睛的眼睛分類器,且將生成專用于該特定的貓的耳朵的耳朵分類器,等等。
[0069]在步驟S2320中,在步驟S2310中對應(yīng)于各個(gè)部件生成的部件分類器被組合以創(chuàng)建專用于所述查詢對象的檢測器。
[0070]在此可以采用組合部件分類器的各種方式。
[0071]例如,該組合可以被設(shè)計(jì)為使得:在多于預(yù)定數(shù)量或多于預(yù)定比例(例如,約60%)的部件被所述多個(gè)部件分類器檢測到的情況下(這意味著候選圖像區(qū)域應(yīng)該包括足夠的部件),所創(chuàng)建的專用于所述查詢對象的檢測器判斷為檢測到查詢對象。例如,在通用模型中總共有7個(gè)部件(即兩個(gè)眼睛、兩個(gè)耳朵、一個(gè)嘴、一個(gè)毛發(fā)和一個(gè)鼻子)的情況下,該組合可被設(shè)計(jì)為,在通過相應(yīng)部件分類器在候選圖像區(qū)域中檢測到4個(gè)或更多個(gè)部件時(shí),使得在候選圖像區(qū)域中檢測出查詢對象。
[0072]通用模型也可以進(jìn)一步包括多個(gè)部件之間的位置關(guān)系。
[0073]圖6是示出根據(jù)示例性實(shí)施例的包括多個(gè)部件之間的位置關(guān)系的通用模型的示意圖。
[0074]使用哺乳動(dòng)物的臉作為例子,部件之間的位置關(guān)系例如可以是:眼睛在毛發(fā)下方,鼻子在眼睛下方,嘴在鼻子下方,等等。
[0075]在這種情況下,所述組合可以被設(shè)計(jì)為使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到(這意味著候選圖像區(qū)域應(yīng)該包括足夠的部件)并且進(jìn)一步地,檢測到的部件之間滿足所述位置關(guān)系(這意味著檢測到的部件應(yīng)滿足預(yù)定關(guān)系)的情況下,專用于所述查詢對象的檢測器判斷為檢測到所述查詢對象。根據(jù)這種組合,即使在候選圖像區(qū)域中分別檢測到所有部件,如果該關(guān)系是錯(cuò)誤的(例如,如果一只眼睛在嘴下面或者一只耳朵在眼睛之間),則該檢測器也將不認(rèn)為在候選圖像區(qū)域中檢測到查詢對象。
[0076]對于用于定義部件之間的位置關(guān)系的方法和用于判斷兩個(gè)位置關(guān)系是否彼此匹配的方法,例如可以使用部分模型方法(例如見PedroFelzenszwalb等人的“ADiscriminatively Trained, Multiscale, Deformable Part Model,,,IEEE Conference onComputer Vision andPattern Recognition,2008.CVPR 2008, 2008年6 月 23-28 日,第 1-8頁)以及圖形相似度度量方法(例如見Laura Zager的“graphsimilarity and matching”,Thesis for Master of Science, MassachusettsInstitute of Technology,2005 年X
[0077]也可以采用用于定義所述組合的其它方法。例如,可以計(jì)算從各個(gè)部件分類器獲得的分類分?jǐn)?shù)(例如概率分?jǐn)?shù)或置信度分?jǐn)?shù))的和或平均值,并且在所述和或平均值大于預(yù)定閾值的情況下,檢測器確定為檢測到查詢對象。也就是說,在此可設(shè)計(jì)和使用任何組合。
[0078]以下將描述通用模型和部件分類器生成步驟S2310的一些示例性實(shí)施例。
[0079]圖7示出根據(jù)一個(gè)示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。
[0080]根據(jù)本示例性實(shí)施例的通用模型包括多個(gè)分類器組,所述多個(gè)分類器組中的每個(gè)分類器組都對應(yīng)于所述多個(gè)部件之一。所述多個(gè)分類器組中的每個(gè)分類器組都包括用于描述所述特定對象類型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類器。例如,通用模型包括用于眼睛的分類器組I和用于耳朵的分類器組2,如圖7所示。雖然未示出,但是通用模型還可包括用于鼻子的分類器組3、用于毛發(fā)的分類器組4和用于嘴的分類器組5。在此,不同的特征實(shí)例是指具有不同特征值的特征,其代表不同的外觀。不同的特征實(shí)例例如可以包括不同顏色、不同形狀或者不同紋理等。
[0081]以分類器組I為例,分類器組I可包括多個(gè)候選分類器,即對應(yīng)于特定的人的眼睛的候選分類器11、對應(yīng)于特定的貓的眼睛的候選分類器12、以及對應(yīng)于特定的狗的眼睛的候選分類器13。類似地,分類器組2可包括多個(gè)候選分類器,即對應(yīng)于特定的貓的耳朵的候選分類器21、對應(yīng)于特定的狗的耳朵的候選分類器22、以及對應(yīng)于另一特定的狗的耳朵的候選分類器23。
[0082]每個(gè)候選分類器都是通過利用相應(yīng)的訓(xùn)練樣本事先離線地被訓(xùn)練而被生成的。例如,一個(gè)眼睛的候選分類器是通過利用該類型的眼睛的訓(xùn)練樣本事先離線地被訓(xùn)練而被生成的。多種特征和訓(xùn)練/學(xué)習(xí)方法都可用于生成候選分類器。例如,可以使用公知的HOG特征(有向梯度的直方圖)和SVM (支持向量機(jī))方法。分類器的一個(gè)簡單例子可以定義一個(gè)特征空間,該特征空間包括一個(gè)或多個(gè)特征(特征陣列)作為特征點(diǎn)在特征空間中的坐標(biāo),并且,分類器對于輸入圖像輸出的分類分?jǐn)?shù)被計(jì)算為特征空間中的中心點(diǎn)(例如,通過多個(gè)訓(xùn)練圖像產(chǎn)生的特征陣列的統(tǒng)計(jì)模型的均值)與描述該輸入圖像的特征點(diǎn)之間的距離d的函數(shù)f(d)。該函數(shù)f(d)不限于特定的函數(shù),只要它是隨著該距離d的增大而嚴(yán)格單調(diào)減小的函數(shù)即可。計(jì)算該距離之前,也可先將各特征除以相應(yīng)特征的方差而將各特征歸一化或者按照特定應(yīng)用對各特征進(jìn)行加權(quán)。
[0083]對于用于生成用于諸如眼睛、鼻子和耳朵之類的器官的候選分類器的方法,例如可以使用在 Nicolas Courier Daniela Hall James L.Crowley 的 “Facial FeaturesDetection Robust to Pose, Illuminationand Identity,,,IEEE InternationalConference on Systems, Man andCybernetics,2004 年,第 617-622 頁,vol.1 ;NelloCristianini 和 JohnShawe-Taylor 的“An Introduction to Support Vector Machinesandother kernel-based learning methods,,,Cambridge University Press, 2000.1SBN0-521-78019-5 ([2] SVM Book);以及 Corinna Cortes 和 V.Vapnik 的 “Support-VectorNetworks”,Machine Learning, 20,第 273-297 頁,1995 中提出的方法。
[0084]雖然以上作為例子提及了一些分類器,但是可以使用所有類型的分類器,只要該分類器能夠?qū)D像作為輸入,并且輸出指示圖像包含該部件的概率或置信度的分類分?jǐn)?shù)即可。可以設(shè)置閾值,使得如果分類器輸出的分類分?jǐn)?shù)高于該閾值,則分類器就確定為圖像包含該部件。
[0085]在這個(gè)示例性實(shí)施例中,在部件分類器生成步驟S2310中,對于每個(gè)部件,從相應(yīng)分類器組中選擇對于描述所述查詢對象的該部件最優(yōu)的候選分類器,作為用于該部件的部件分類器。
[0086]例如,當(dāng)樣本圖像是圖4a或4b所示的樣本圖像時(shí),對于描述所述查詢對象(樣本圖像中所示的貓)的眼睛最優(yōu)的候選分類器可以是候選分類器12 (圓的貓眼睛),并且將從分類器組I中選擇候選分類器12作為用于眼睛的部件分類器。類似地,將從分類器組2中選擇候選分類器21作為用于耳朵的部件分類器。以這種方式,對于每個(gè)分類器組,選擇對于描述所述查詢對象(在本例子中為特定的貓)的各個(gè)部件最優(yōu)的候選分類器,并且將這些最優(yōu)候選分類器作為用于查詢對象的部件分類器。
[0087]圖8示出根據(jù)示例性實(shí)施例的部件分類器生成步驟S2310的示例性處理的流程圖。
[0088]如圖8所示,部件分類器生成步驟S2310可以包括分類器分?jǐn)?shù)獲得步驟S2311和選擇步驟S2312。
[0089]在步驟S2311中,對于每個(gè)分類器組中的每個(gè)候選分類器,通過使在各個(gè)樣本圖像中標(biāo)記的相應(yīng)部件通過該候選分類器而獲得的分類分?jǐn)?shù)被相加或取平均值,以獲得該候選分類器的分類器分?jǐn)?shù)。
[0090]對于圖7所示的例子,假設(shè)有兩個(gè)樣本圖像(第一樣本圖像和第二樣本圖像),并且,候選分類器11從第一和第二樣本圖像獲得的分類分?jǐn)?shù)分別為0.3和0.2,候選分類器12從第一和第二樣本圖像獲得的分類分?jǐn)?shù)分別為0.8和0.7,候選分類器13從第一和第二樣本圖像獲得的分類分?jǐn)?shù)分別為0.4和0.5。在這種情況下,當(dāng)候選分類器的分類器分?jǐn)?shù)由分類分?jǐn)?shù)的平均值表示時(shí),候選分類器11的分類器分?jǐn)?shù)為(0.3+0.2)/2=0.25,候選分類器12的分類器分?jǐn)?shù)為(0.8+0.7) /2=0.75,而候選分類器13的分類器分?jǐn)?shù)為(0.4+0.5)/2=0.45。
[0091]在步驟S2312中,對于每個(gè)分類器組,具有最大分類器分?jǐn)?shù)的候選分類器被認(rèn)為對于描述查詢對象的相應(yīng)部件是“最優(yōu)”的,并且被選擇作為用于相應(yīng)部件的部件分類器。
[0092]仍對于圖7所示的例子,由于如以上計(jì)算的那樣,候選分類器12具有最大分類器分?jǐn)?shù),候選分類器12將被選擇作為描述查詢對象的眼睛最優(yōu)的部件分類器。
[0093]以類似的方式,每個(gè)部件將具有通過利用樣本圖像從相應(yīng)分類器組選擇出的一個(gè)部件分類器,并且,這些部件分類器可以被組合為專用于查詢對象的檢測器。如前文所述,該組合可按照需要或者以合適方式被設(shè)計(jì)。
[0094]根據(jù)本示例性實(shí)施例,由于事先離線準(zhǔn)備包含候選分類器的通用模型,不必在每次要檢測新的查詢對象時(shí)構(gòu)建具體分類器,因此,檢測效率可以是高的。此外,由于對于每個(gè)部件可以有若干個(gè)候選分類器,因此該方法對于各種對象都具有足夠的靈活性和精確性。例如,在事先使用四個(gè)不同對象來訓(xùn)練各個(gè)候選分類器時(shí),N個(gè)分類器組中的每個(gè)分類器組將具有四個(gè)候選分類器,并且理論上可以通過組合這些候選分類器而從通用模型生成4N種可能的檢測器。
[0095]圖9示出根據(jù)另一示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。
[0096]根據(jù)本示例性實(shí)施例的通用模型包括多個(gè)粗分類器,所述多個(gè)粗分類器分別對應(yīng)于多個(gè)部件。所述多個(gè)粗分類器中的每一個(gè)可以描述特定對象類型的相應(yīng)部件的相應(yīng)通用特征。所述通用特征可以包括顏色、形狀、紋理、直方圖特征、或其組合等。通用特征可以具有適用于描述該特定類型的所有對象的相對寬的值范圍。例如,在用于哺乳動(dòng)物的眼睛的粗分類器中,眼睛的長寬比(長度與寬度的比值)可以被定義為在0.8?2的范圍內(nèi)(或者是均值為1.4且方差為0.6的統(tǒng)計(jì)模型)。
[0097]在此示例性實(shí)施例中,可以使用粗分類器在樣本圖像中自動(dòng)標(biāo)記出各個(gè)部件。[0098]根據(jù)此示例性實(shí)施例,在部件分類器生成步驟S2310中,對于每個(gè)部件,由相應(yīng)的粗分類器描述的相應(yīng)通用特征被進(jìn)一步限定(改進(jìn))為根據(jù)所述查詢對象的部件的相應(yīng)的具體特征,由此從相應(yīng)粗分類器生成用于描述相應(yīng)的具體特征的相應(yīng)部件分類器。
[0099]對于圖9所示的例子,哺乳動(dòng)物的眼睛的通用特征(例如,0.8^2的長寬比)可被進(jìn)一步限定(改進(jìn))為依據(jù)圖4a和4b中所示的特定的貓的具體特征。例如,當(dāng)樣本圖像示出長寬比為I的眼睛時(shí),眼睛的該具體特征(眼睛的長寬比)例如可被改進(jìn)為0.Cl.2 (或者均值為I且方差為均值的20%的統(tǒng)計(jì)模型),這比0.8^2更為具體。對于另一個(gè)例子,當(dāng)兩個(gè)樣本圖像示出長寬比為I的眼睛和長寬比為1.2的眼睛時(shí),眼睛的該具體特征(眼睛的長寬比)例如可被改進(jìn)為0.9^1.3 (或者均值為(1+1.2)/2且方差為(1.2-1)的統(tǒng)計(jì)模型),這比0.8^2更為具體。以這種方式,可以從粗分類器生成具有這種具體特征的部件分類器。
[0100]此外,或者作為替換方案,可以通過添加新的特征而將通用特征(特征陣列)改進(jìn)為具體特征陣列。例如,眼睛的通用特征可能僅包括長寬比特征,并且可以通過添加顏色特征和紋理特征而將該通用特征改進(jìn)為更加具體的特征陣列。
[0101]以類似的方式,每個(gè)部件將具有通過使用樣本圖像從通用模型的相應(yīng)粗分類器生成的一個(gè)部件分類器,并且這些部件分類器可以被組合成專用于查詢對象的檢測器。該組合可如前所述根據(jù)需要被設(shè)計(jì)或者以合適的方式被設(shè)計(jì)。
[0102]圖10示出根據(jù)再另一個(gè)示例性實(shí)施例的使用通用模型來生成部件分類器的方法的例子。 [0103]根據(jù)本實(shí)施例的通用模型包括分別對應(yīng)于多個(gè)部件的多個(gè)不完整分類器。所述多個(gè)不完整分類器中的每一個(gè)具有尚未確定的特征參數(shù)。
[0104]不完整分類器可以具有通用的構(gòu)造,但是該通用構(gòu)造的一個(gè)或多個(gè)特征參數(shù)未被確定。例如,分類器可以具有顏色和長寬比作為其特征,但是顏色和長寬比的中心值(統(tǒng)計(jì)模型的均值)和/或方差尚未被確定。
[0105]根據(jù)此示例性實(shí)施例,在部件分類器生成步驟S2310中,對于每個(gè)部件,根據(jù)所述查詢對象的該部件來確定相應(yīng)的不完整分類器的特征參數(shù),從而從相應(yīng)的不完整分類器形成特征參數(shù)已被確定的相應(yīng)的部件分類器。
[0106]圖11示出根據(jù)再另一個(gè)示例性實(shí)施例的部件分類器生成步驟的示例性處理的流程圖。
[0107]如圖11所示,部件分類器生成步驟S2310可以包括特征參數(shù)計(jì)算步驟S2313和組合計(jì)算步驟S2314。
[0108]在步驟S2313中,對于每個(gè)部件,通過根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來確定相應(yīng)的不完整分類器的特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù)。
[0109]在步驟S2314中,對于每個(gè)部件,通過組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算用于相應(yīng)的部件分類器的特征參數(shù)。
[0110]在此,組合所述特征參數(shù)例如可以是求這些特征參數(shù)的平均值。也可以按照其它方式來組合這些特征參數(shù)。也可以從對多個(gè)特征參數(shù)的組合來獲得其它值。例如,可以組合來自一個(gè)樣本圖像的等于2的特征參數(shù)和來自另一個(gè)樣本圖像的等于4的特征參數(shù),使得獲得均值3和方差2,作為查詢對象的特征參數(shù)。因此,該組合不限于任何具體的組合。[0111]對于圖10所示的例子,用于眼睛的不完整分類器可以包括涉及顏色特征和形狀特征的模型,但是尚未確定該模型的參數(shù)。例如,當(dāng)兩個(gè)樣本圖像示出長寬比為I且RGB顏色為(50,150, 200)的眼睛,以及長寬比為1.2且RGB顏色為(30,170, 220)的眼睛時(shí),查詢對象的眼睛模型的均值(特征空間的中心點(diǎn))可被確定為作為這兩個(gè)樣本圖像的參數(shù)的平均值的長寬比1.1和RGB顏色(40,160,210)。以這種方式,可以從不完整分類器生成參數(shù)已被確定的部件分類器。
[0112]以類似的方式,每個(gè)部件將具有通過使用樣本圖像從通用模型的相應(yīng)不完整分類器生成的一個(gè)部件分類器,并且這些部件分類器可以被組合成專用于查詢對象的檢測器。該組合可如前所述根據(jù)需要被設(shè)計(jì)或者以合適的方式被設(shè)計(jì)。
[0113]圖12示出根據(jù)示例性實(shí)施例的對象檢測步驟S2400的示例性處理的流程圖。
[0114]如圖12所示,步驟S2400可以包括候選圖像區(qū)域確定步驟S2410、第一檢測子步驟S2420和第二檢測子步驟S2430。
[0115]在步驟S2410中,通過使用滑動(dòng)窗而在目的圖像中確定候選圖像區(qū)域?;瑒?dòng)窗的初始尺寸可以被確定為能夠包含查詢對象的可能圖像的最小尺寸,并且可以根據(jù)具體應(yīng)用而被確定。
[0116]在步驟S2420中,檢測是否在候選圖像區(qū)域中存在多個(gè)部件中的至少一些。例如,在步驟S2420中,可以使用步驟S2300中生成的專用于查詢對象的檢測器的部件分類器來檢測候選圖像區(qū)域中的部件。
[0117]然后,在步驟S2430中,根據(jù)步驟S2420中的檢測結(jié)果,確定是否在候選圖像區(qū)域中檢測到查詢對象。
[0118]請注意,在步驟S2400中使用專用于查詢對象的檢測器來檢測查詢對象,因此步驟S2400中的具體檢測方式可以對應(yīng)于步驟S2300中生成檢測器的具體方式。因此,雖然步驟S241(TS2430示出用于步驟S2400的示例性處理,但是可以采用其它檢測方式,只要使用在步驟S2300中生成的專用于查詢對象的檢測器即可。
[0119]圖13示出根據(jù)示例性實(shí)施例的第一檢測子步驟S2420和第二檢測子步驟S2430的示例性處理的流程圖。
[0120]如圖13所示,步驟S2420可以包括分割步驟S2421和部件檢測步驟S2422。
[0121]在步驟S2421中,候選圖像區(qū)域被分割成多個(gè)部分候選區(qū)域。部分候選區(qū)域的尺寸可以通過候選圖像區(qū)域的尺寸和最大預(yù)期部件與查詢對象之間的比率而被確定,并且可以根據(jù)具體應(yīng)用而被確定。根據(jù)一個(gè)示例性實(shí)施例,在步驟S2200中,不僅部件而且查詢對象(此例子中為貓的臉)的位置和尺寸可以被標(biāo)記,并且,可以根據(jù)步驟S2200中執(zhí)行的標(biāo)記來確定最大預(yù)期部件與查詢對象之間的比率。
[0122]在步驟S2422中,所述多個(gè)部件分類器中的每一個(gè)被用于檢測是否在所述部分候選區(qū)域中的一個(gè)或多個(gè)中存在相應(yīng)部件。更特別地,對于每個(gè)部件以及對于每個(gè)部分候選區(qū)域,通過使用相應(yīng)的部件分類器,檢測該部件是否存在于該部分候選區(qū)域中??梢源鎯﹃P(guān)于哪個(gè)部分候選區(qū)域被檢測出包含哪個(gè)部件的檢測結(jié)果。
[0123]如圖13所示,步驟S2430可以包括組合確定步驟S2431,該步驟S2431通過組合步驟S2420中的各個(gè)部件的檢測結(jié)果來確定是否在候選圖像區(qū)域中檢測到所述查詢對象。
[0124]在這里,該組合可以對應(yīng)于在生成專用于查詢對象的檢測器時(shí)使用的組合。[0125]例如,在步驟S2431中,在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,可確定為在候選圖像區(qū)域中檢測到查詢對象。
[0126]再例如,在步驟S2431中,在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到并且檢測到的部件之間滿足一定位置關(guān)系的情況下,可確定為在候選圖像區(qū)域中檢測到查詢對象。在這種情況下,部件檢測步驟S2422還需要包括部件位置確定步驟,在檢測到部分候選區(qū)域包含部件的情況下確定該部件在候選圖像區(qū)域中的位置??梢杂酶鞣N方式確定部件的位置。例如,部件的位置可以根據(jù)部分候選區(qū)域的位置而被確定,或者可以通過檢測部件的中心(幾何中心或重心)的坐標(biāo)而被確定。
[0127]再例如,該組合也可被設(shè)計(jì)為使得在通過所述多個(gè)部件分類器獲得的分類分?jǐn)?shù)的加權(quán)和大于預(yù)定閾值的情況下在候選圖像區(qū)域中檢測到查詢對象。
[0128]由于可以使用組合部件分類器的各種方式來生成檢測器,因此可以使用組合各個(gè)部件的檢測結(jié)果的相應(yīng)方式,并且這些方式不限于已經(jīng)例示的那些。
[0129]如圖12所示,步驟S2400還可以包括候選圖像區(qū)域更新步驟S2440和對象定位步驟 S2450。
[0130]判斷是否滿足預(yù)定條件。如果不滿足預(yù)定條件,則流程進(jìn)行到步驟S2440,在步驟S2440中,更新候選圖像區(qū)域。然后,流程回到步驟S2410,并且對于更新后的候選圖像區(qū)域執(zhí)行候選圖像區(qū)域確定步驟S2410、第一檢測子步驟S2420和第二檢測子步驟S2430。
[0131]在此,可以根據(jù)具體應(yīng)用任意定義所述預(yù)定條件。例如,該預(yù)定條件可以是候選圖像區(qū)域達(dá)到了最大尺寸(例如,目的圖像的尺寸)。再例如,該預(yù)定條件可以是已經(jīng)有足夠數(shù)目的候選圖像區(qū)域被檢測為包含查詢對象。
[0132]可以通過偏移滑動(dòng)窗來執(zhí)行候選圖像區(qū)域的更新。此外,當(dāng)滑動(dòng)窗已遍歷了整個(gè)目的圖像時(shí),該滑動(dòng)窗可以被偏移到其初始位置,并且被調(diào)整尺寸(例如,尺寸遞增一個(gè)預(yù)
定量)。
[0133]如果滿足了預(yù)定條件,則流程進(jìn)行到步驟S2450,在步驟S2450中,根據(jù)檢測出查詢對象的候選圖像區(qū)域,確定查詢對象在目的圖像中的位置。
[0134]有可能將多于一個(gè)候選圖像區(qū)域檢測為包含查詢對象。在這種情況下,可以通過例如對被檢測為包含查詢對象的多個(gè)候選圖像區(qū)域的中心位置和尺寸取平均值來確定查詢對象的位置(中心位置和尺寸)。
[0135]通過參照圖12描述的示例性處理,在檢測到查詢對象的情況下,也可以確定查詢對象在目的圖像中的位置。
[0136]圖14是示出根據(jù)本發(fā)明的示例性實(shí)施例的對象檢測設(shè)備2000的示例性配置的框圖。
[0137]對象檢測設(shè)備2000包括:通用模型存儲單元2100,被配置為事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件;樣本圖像接收單元2200,被配置為接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象;對象檢測器創(chuàng)建單元2300,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及對象檢測單元2400,被配置為利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。[0138]單元2100、2200、2300和2400可以被配置為分別執(zhí)行步驟S2100、S2200、S2300和S2400的處理。
[0139]根據(jù)示例性實(shí)施例,所述樣本圖像接收單元2200還可被配置為接收或生成對所述一個(gè)或多個(gè)樣本圖像中的各個(gè)部件的標(biāo)記。在這種情況下,對象檢測器創(chuàng)建單元2300可包括部件分類器生成單元2310,被配置為利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專用于所述查詢對象的各部件的多個(gè)部件分類器。
[0140]對象檢測器創(chuàng)建單元2300還可包括部件分類器組合單元2320,被配置為通過組合對應(yīng)于各個(gè)部件的所生成的部件分類器,創(chuàng)建所述專用于所述查詢對象的檢測器。
[0141]根據(jù)本發(fā)明的示例性實(shí)施例,對象檢測單元2400可以包括:候選圖像區(qū)域確定單元2410,被配置為利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域;第一檢測子單元2420,被配置為檢測所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和第二檢測子單元2430,被配置為根據(jù)所述第一檢測子單元中的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
[0142]根據(jù)本發(fā)明的示例性實(shí)施例,對象檢測單元2400還可以包括:候選圖像區(qū)域更新單元2440,被配置為,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,所述候選圖像區(qū)域確定單元、所述第一檢測子單元和所述第二檢測子單元在更新后的候選圖像區(qū)域上進(jìn)行操作;和對象定位單元2450,被配置為根據(jù)從哪些候選圖像區(qū)域中檢測到所述查詢對象,確定所述查詢對象在所述目的圖像中的位置。
[0143]根據(jù)一些可能的實(shí)施例,部件分類器生成單元2310可被配置為執(zhí)行步驟S2310中執(zhí)行的處理(例如,步驟S2311和S2312中的處理或步驟S2313和S2314中的處理)。
[0144]例如,部件分類器生成單元2310可以包括:分類器分?jǐn)?shù)獲得單元2311,被配置為對于每個(gè)分類器組中的每個(gè)候選分類器,對各樣本圖像中所標(biāo)記的相應(yīng)部件通過該候選分類器所獲得的分類分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類器的分類器分?jǐn)?shù);和選擇單元2312,被配置為對于每個(gè)分類器組,選擇具有最大的分類器分?jǐn)?shù)的候選分類器,作為相應(yīng)部件的部件分類器。
[0145]再例如,部件分類器生成單元2310可以包括:特征參數(shù)計(jì)算單元2313,被配置為對于每個(gè)部件,通過根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來確定相應(yīng)不完整分類器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及組合計(jì)算單元2314,被配置為對于每個(gè)部件,通過組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類器的特征參數(shù)。
[0146]此外,第一檢測子單元2420可以被配置為執(zhí)行步驟S2420中執(zhí)行的處理(例如,步驟S2421和S2422中的處理)。
[0147]例如,第一檢測子單元2420可以包括:分割單元2421,被配置為將所述候選圖像區(qū)域分割成多個(gè)部分候選區(qū)域;和部件檢測單元2422,被配置為利用所述多個(gè)部件分類器中的每一個(gè),檢測是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件。
[0148]此外,所述第二檢測子單元2430可以被配置為執(zhí)行步驟S2430中執(zhí)行的處理(例如步驟S2431中的處理)。例如,第二檢測子單元2430可以包含:組合確定單元2431,被配置為通過組合在所述第一檢測子單元中的對于各個(gè)部件的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
[0149]此外,組合確定單元2431可以包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,確定為在所述候選圖像區(qū)域中檢測到所述查詢對象的單元。
[0150]以上描述的單元和以下要描述的單元是用于實(shí)施本公開中描述的處理的示例性和/或優(yōu)選的模塊。這些模塊可以是硬件單元(諸如場可編程門陣列、數(shù)字信號處理器或?qū)S眉呻娐返?和/或軟件模塊(諸如計(jì)算機(jī)可讀程序)。以上并未詳盡地描述用于實(shí)施各個(gè)步驟的模塊。然而,只要有執(zhí)行某個(gè)處理的步驟,就可以有用于實(shí)施同一處理的對應(yīng)的功能模塊或單元(由硬件和/或軟件實(shí)施)。通過所描述的步驟以及與這些步驟對應(yīng)的單元的所有組合限定的技術(shù)方案都被包括在本申請的公開內(nèi)容中,只要它們構(gòu)成的這些技術(shù)方案是完整并且可應(yīng)用的。
[0151]此外,由各種單元構(gòu)成的上述裝置可以作為功能模塊被并入到諸如計(jì)算機(jī)之類的硬件裝置中。除了這些功能模塊之外,計(jì)算機(jī)當(dāng)然可以具有其他硬件或者軟件部件。
[0152]根據(jù)實(shí)施例,由于通用模型被事先離線地生成和存儲,不必在每次要檢測新的查詢對象時(shí)都構(gòu)建檢測器的整個(gè)模型,因此可以提高檢測的效率。此外,由于通過使用特定查詢對象從通用模型在線地創(chuàng)建具體檢測器,因此該方法對于各種對象都具有靈活性和精確性,而且不限于事先注冊的對象。
[0153]本發(fā)明可被用于許多應(yīng)用中。根據(jù)本發(fā)明的對象檢測設(shè)備2000例如可被應(yīng)用于圖像拾取設(shè)備。
[0154]圖15是示出根據(jù)示例性實(shí)施例的圖像拾取設(shè)備3000的示例性配置的框圖。
[0155]如圖15所示,圖像拾取設(shè)備3000可以包括:攝影光學(xué)系統(tǒng)3100,其可例如包括用于拍攝的光學(xué)元件;成像單元3200,被配置為執(zhí)行成像以形成圖像,該成像單元3200可以包括諸如CXD傳感器或CMOS傳感器之類的成像傳感器;上述的對象檢測設(shè)備2000,被配置為使用戶能夠輸入或選擇查詢對象,以及在所形成的圖像中檢測所述查詢對象;和成像控制單元3300,被配置為根據(jù)檢測到的查詢對象執(zhí)行成像控制。
[0156]根據(jù)本發(fā)明的示例性實(shí)施例,所述成像控制可以包括:如果檢測到查詢對象,則增大拍攝的分辨率。以這種方式,除非在捕獲的圖像中出現(xiàn)特定對象,否則圖像拾取設(shè)備可以操作于節(jié)能模式(具有低分辨率)。
[0157]根據(jù)本發(fā)明的另一示例性實(shí)施例,所述成像控制可以包括:如果檢測到查詢對象,則使拍攝光學(xué)系統(tǒng)3100聚焦于檢測出的查詢對象。以這種方式,圖像拾取設(shè)備3000可被配置為聚焦于所感興趣的對象。
[0158]根據(jù)本發(fā)明的再另一示例性實(shí)施例,所述成像控制可以包括:在檢測到查詢對象時(shí),使拍攝光學(xué)系統(tǒng)3100保持跟蹤所檢測到的查詢對象,以使得查詢對象持續(xù)出現(xiàn)在要形成的圖像中。在此示例性實(shí)施例中,拍攝光學(xué)系統(tǒng)3100可以被配置有使得該拍攝光學(xué)系統(tǒng)3100能夠根據(jù)成像控制而自動(dòng)旋轉(zhuǎn)的機(jī)械結(jié)構(gòu)。以這種方式,圖像拾取設(shè)備3000可保持跟蹤感興趣的對象,并且盡可能多地獲得感興趣的對象的圖像。
[0159]可以通過許多方式來實(shí)施本發(fā)明的方法和設(shè)備。例如,可以通過軟件、硬件、固件、或其任何組合來實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其他方式明確說明。此外,在一些實(shí)施例中,本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序,其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。
[0160]雖然已通過示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是說明性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例可以被修改而不脫離本發(fā)明的范圍和實(shí)質(zhì)。本發(fā)明的范圍是通過所附的權(quán)利要求限定的。
【權(quán)利要求】
1.一種對象檢測方法,包括: 通用模型存儲步驟,事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件; 樣本圖像接收步驟,接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象; 對象檢測器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及 對象檢測步驟,利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。
2.根據(jù)權(quán)利要求1的對象檢測方法,其中 在所述樣本圖像接收步驟中,還接收或生成對所述一個(gè)或多個(gè)樣本圖像中的各部件的標(biāo)記,以及 所述對象檢測器創(chuàng)建步驟包含:部件分類器生成步驟,利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專用于所述查詢對象的各部件的多個(gè)部件分類器。
3.根據(jù)權(quán)利要求2的對象檢測方法,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)分類器組,所述多個(gè)分類器組中的每個(gè)分類器組包含用于描述所述特定對象類型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類器,以及 在所述部件分類器 生成步驟中,對于每個(gè)部件,從相應(yīng)的分類器組中選擇對于描述所述查詢對象的該部件而言最佳的候選分類器,作為部件分類器。
4.根據(jù)權(quán)利要求3的對象檢測方法,其中 所述部件分類器生成步驟包含: 分類器分?jǐn)?shù)獲得步驟,對于每個(gè)分類器組中的每個(gè)候選分類器,對各樣本圖像中所標(biāo)記的相應(yīng)部件通過該候選分類器所獲得的分類分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類器的分類器分?jǐn)?shù),和 選擇步驟,對于每個(gè)分類器組,選擇具有最大的分類器分?jǐn)?shù)的候選分類器,作為相應(yīng)部件的部件分類器。
5.根據(jù)權(quán)利要求2的對象檢測方法,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)粗分類器,所述多個(gè)粗分類器中的每個(gè)粗分類器用于描述所述特定對象類型的相應(yīng)部件的相應(yīng)通用特征,以及 在所述部件分類器生成步驟中,對于每個(gè)部件,通過根據(jù)所述查詢對象的該部件而將相應(yīng)粗分類器所描述的相應(yīng)通用特征進(jìn)一步限定為相應(yīng)具體特征,從相應(yīng)粗分類器生成描述所述相應(yīng)具體特征的相應(yīng)部件分類器。
6.根據(jù)權(quán)利要求2的對象檢測方法,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)不完整分類器,所述多個(gè)不完整分類器中的每一個(gè)具有尚未確定的特征參數(shù),以及 在所述部件分類器生成步驟中,對于每個(gè)部件,通過根據(jù)所述查詢對象的該部件來確定相應(yīng)不完整分類器的所述特征參數(shù),分別從相應(yīng)不完整分類器形成特征參數(shù)均已被確定的相應(yīng)部件分類器。
7.根據(jù)權(quán)利要求6的對象檢測方法,其中 所述部件分類器生成步驟包含: 特征參數(shù)計(jì)算步驟,對于每個(gè)部件,通過根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來確定相應(yīng)不完整分類器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及 組合計(jì)算步驟,對于每個(gè)部件,通過組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類器的特征參數(shù)。
8.根據(jù)權(quán)利要求2-7中任一項(xiàng)的對象檢測方法,其中 所述對象檢測器創(chuàng)建步驟還包含:部件分類器組合步驟,通過組合對應(yīng)于各個(gè)部件的所生成的部件分類器,創(chuàng)建所述專用于所述查詢對象的檢測器。
9.根據(jù)權(quán)利要求8的對象檢測方法,其中 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,所述專用于所述查詢對象的檢測器判斷為檢測到所述查詢對象。
10.根據(jù)權(quán)利要求8的對象檢測方法,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系,以及 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到并且檢測到的部件之間滿足所述位置關(guān)系的情況下,所述專用于所述查詢對象的檢測器判斷為檢測到所述查詢對象`。
11.根據(jù)權(quán)利要求2的對象檢測方法,其中 所述對象檢測步驟包含: 候選圖像區(qū)域確定步驟,利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域; 第一檢測子步驟,檢測所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和第二檢測子步驟,根據(jù)在所述第一檢測子步驟中的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
12.根據(jù)權(quán)利要求11的對象檢測方法,其中 所述第一檢測子步驟包含: 分割步驟,將所述候選圖像區(qū)域分割成多個(gè)部分候選區(qū)域;和部件檢測步驟,利用所述多個(gè)部件分類器中的每一個(gè),檢測是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件,以及所述第二檢測子步驟包含: 組合確定步驟,通過組合在所述第一檢測子步驟中的對于各個(gè)部件的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
13.根據(jù)權(quán)利要求12的對象檢測方法,其中 所述組合確定步驟包括:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,確定為在所述候選圖像區(qū)域中檢測到所述查詢對象。
14.根據(jù)權(quán)利要求12的對象檢測方法,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系, 所述部件檢測步驟包括:部件位置確定步驟,如果檢測為一個(gè)部分候選區(qū)域包含部件,則確定所述部件在所述候選圖像區(qū)域中的位置,以及 所述組合確定步驟包括:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到并且檢測到的部件之間滿足所述位置關(guān)系的情況下,確定為在所述候選圖像區(qū)域中檢測到所述查詢對象。
15.根據(jù)權(quán)利要求11的對象檢測方法,其中 所述對象檢測步驟還包括: 候選圖像區(qū)域更新步驟,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,在更新后的候選圖像區(qū)域中執(zhí)行所述候選圖像區(qū)域確定步驟、所述第一檢測子步驟和所述第二檢測子步驟;和 對象定位步驟,根據(jù)從哪些候選圖像區(qū)域中檢測到所述查詢對象,確定所述查詢對象在所述目的圖像中的位置。
16.一種對象檢測設(shè)備,包括: 通用模型存儲單元,被配置為事先離線地存儲用于特定對象類型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對象類型的單個(gè)對象中共同存在的多個(gè)部件; 樣本圖像接收單元,被配置為接收對一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢對象,所述查詢對象是所述特定對象類型的對象; 對象檢測器創(chuàng)建單元,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專用于所述查詢對象的檢測器;以及 對象檢測單元,被配置為利用所創(chuàng)建的專用于所述查詢對象的檢測器,從目的圖像中檢測所述查詢對象。`
17.根據(jù)權(quán)利要求16的對象`檢測設(shè)備,其中 所述樣本圖像接收單元還被配置為接收或生成對所述一個(gè)或多個(gè)樣本圖像中的各部件的標(biāo)記,以及 所述對象檢測器創(chuàng)建單元包含:部件分類器生成單元,被配置為利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專用于所述查詢對象的各部件的多個(gè)部件分類器。
18.根據(jù)權(quán)利要求17的對象檢測設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)分類器組,所述多個(gè)分類器組中的每個(gè)分類器組包含用于描述所述特定對象類型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類器,以及 所述部件分類器生成單元還被配置為,對于每個(gè)部件,從相應(yīng)的分類器組中選擇對于描述所述查詢對象的該部件而言最佳的候選分類器,作為部件分類器。
19.根據(jù)權(quán)利要求18的對象檢測設(shè)備,其中 所述部件分類器生成單元包含: 分類器分?jǐn)?shù)獲得單元,被配置為對于每個(gè)分類器組中的每個(gè)候選分類器,對各樣本圖像中所標(biāo)記的相應(yīng)部件通過該候選分類器所獲得的分類分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類器的分類器分?jǐn)?shù),和 選擇單元,被配置為對于每個(gè)分類器組,選擇具有最大的分類器分?jǐn)?shù)的候選分類器,作為相應(yīng)部件的部件分類器。
20.根據(jù)權(quán)利要求17的對象檢測設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)粗分類器,所述多個(gè)粗分類器中的每個(gè)粗分類器用于描述所述特定對象類型的相應(yīng)部件的相應(yīng)通用特征,以及 所述部件分類器生成單元還被配置為,對于每個(gè)部件,通過根據(jù)所述查詢對象的該部件而將相應(yīng)粗分類器所描述的相應(yīng)通用特征進(jìn)一步限定為相應(yīng)具體特征,從相應(yīng)粗分類器生成描述所述相應(yīng)具體特征的相應(yīng)部件分類器。
21.根據(jù)權(quán)利要求17的對象檢測設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對應(yīng)的多個(gè)不完整分類器,所述多個(gè)不完整分類器中的每一個(gè)具有尚未確定的特征參數(shù),以及 所述部件分類器生成單元還被配置為,對于每個(gè)部件,通過根據(jù)所述查詢對象的該部件來確定相應(yīng)不完整分類器的所述特征參數(shù),分別從相應(yīng)不完整分類器形成特征參數(shù)均已被確定的相應(yīng)部件分類器。
22.根據(jù)權(quán)利要求21的對象檢測設(shè)備,其中 所述部件分類器生成單元包含: 特征參數(shù)計(jì)算單元,被配置為對于每個(gè)部件,通過根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來確定相應(yīng)不完整分類器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及 組合計(jì)算單元,被配置為對于每個(gè)部件,通過組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類器的特征參數(shù)。
23.根據(jù)權(quán)利要求17-22中任一項(xiàng)的對象檢測設(shè)備,其中` 所述對象檢測器創(chuàng)建單元還包含:部件分類器組合單元,被配置為通過組合對應(yīng)于各個(gè)部件的所生成的部件分類器,創(chuàng)建所述專用于所述查詢對象的檢測器。
24.根據(jù)權(quán)利要求23的對象檢測設(shè)備,其中 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,所述專用于所述查詢對象的檢測器判斷為檢測到所述查詢對象。
25.根據(jù)權(quán)利要求23的對象檢測設(shè)備,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系,以及 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到并且檢測到的部件之間滿足所述位置關(guān)系的情況下,所述專用于所述查詢對象的檢測器判斷為檢測到所述查詢對象。
26.根據(jù)權(quán)利要求17的對象檢測設(shè)備,其中 所述對象檢測單元包含: 候選圖像區(qū)域確定單元,被配置為利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域; 第一檢測子單元,被配置為檢測所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和 第二檢測子單元,被配置為根據(jù)所述第一檢測子單元的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
27.根據(jù)權(quán)利要求26的對象檢測設(shè)備,其中 所述第一檢測子單元包含:分割單元,被配置為將所述候選圖像區(qū)域分割成多個(gè)部分候 選區(qū)域;和 部件檢測單元,被配置為利用所述多個(gè)部件分類器中的每一個(gè),檢測是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件,以及所述第二檢測子單元包含: 組合確定單元,被配置為通過組合所述第一檢測子單元的對于各個(gè)部件的檢測結(jié)果,確定是否在所述候選圖像區(qū)域中檢測到所述查詢對象。
28.根據(jù)權(quán)利要求27的對象檢測設(shè)備,其中 所述組合確定單元包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到的情況下,確定為在所述候選圖像區(qū)域中檢測到所述查詢對象的單元。
29.根據(jù)權(quán)利要求27的對象檢測設(shè)備,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系, 所述部件檢測單元包括:部件位置確定單元,被配置為如果檢測為一個(gè)部分候選區(qū)域包含部件,則確定所述部件在所述候選圖像區(qū)域中的位置, 所述組合確定單元包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類器檢測到并且檢測到的部件之間滿足所述位置關(guān)系的情況下,確定為在所述候選圖像區(qū)域中檢測到所述查詢對象的單元。
30.根據(jù)權(quán)利要求26的對象檢測設(shè)備,其中 所述對象檢測單元還包括: 候選圖像區(qū)域更新單元,被配置為,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,所述候選圖像區(qū)域確定單元、所述第一檢測子單元和所述第二檢測子單元在更新后的候選圖像區(qū)域上進(jìn)行操作;和 對象定位單元,被配置為根據(jù)從哪些候選圖像區(qū)域中檢測到所述查詢對象,確定所述查詢對象在所述目的圖像中的位置。
31.一種圖像拾取設(shè)備,包括: 攝影光學(xué)系統(tǒng); 成像單元,被配置為執(zhí)行成像以形成圖像; 根據(jù)權(quán)利要求16-30中的任一項(xiàng)的對象檢測設(shè)備,被配置為使用戶能夠輸入或選擇查詢對象,以及在所形成的圖像中檢測所述查詢對象;和 成像控制單元,被配置為根據(jù)檢測到的查詢對象執(zhí)行成像控制。
32.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測到查詢對象,則增大拍攝的分辨率。
33.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測到查詢對象,則使拍攝光學(xué)系統(tǒng)聚焦于檢測出的查詢對象。
34.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測到查詢對象,則使拍攝光學(xué)系統(tǒng)保持跟蹤所檢測到的查詢對象,以使得查詢對象持續(xù)出現(xiàn)在要形成的圖像中。
【文檔編號】G06K9/00GK103870798SQ201210550321
【公開日】2014年6月18日 申請日期:2012年12月18日 優(yōu)先權(quán)日:2012年12月18日
【發(fā)明者】姜涌, 胥立豐 申請人:佳能株式會社