專利名稱:信息處理裝置及信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種使用級聯(lián)連接的多個弱判別器(classifier)來處理數(shù)據(jù)的信息 處理技術(shù)。
背景技術(shù):
近年來,提出了從圖像數(shù)據(jù)中提取諸如人臉的特定對象的各種方法,并且投入實際使用。在這些方法中,在 Viola,P. & Jones,Μ.,s〃 Rapid Object Detection usinga Boosted Cascade of Simple Features " , (Proc. of Computer Vision andPattern Recognition, Dec. 2001, IEEE Computer Society, pp. 511-518)中所公開的方法因其高速 性而受到關(guān)注(下文中,將該文獻稱為“文獻1”)。該方法將由增強(boosting)學習算法生 成的多個弱判別器組構(gòu)成的判別器級聯(lián)連接,并在對各個判別器執(zhí)行終止判定的同時進行 處理。注意,在例如 Yoav Freund and Robert Ε. Schapire^s"A decision-theoreticgene ralization of on-line learning and an application to boosting" (InEurocolt' 95, Computational Learning and Theory ;Springer_Verlag,1995,pp. 23-37)中公幵了增強 學習算法的細節(jié)。圖24示出了這種技術(shù)所使用的總體結(jié)構(gòu)。2401至240n(其中,η是自然數(shù))是通 過學習生成的判別器(也稱為“級”),各個判別器由例如處理負荷低的多個矩形過濾器構(gòu) 成。由于這時使用的矩形過濾器中的各個的判別能力不是很高,因此將其通稱為“弱判別
典”
'ΠΒ' ο圖25是示出用于提取特定對象的矩形過濾器的圖。2501a至2501c是要使用矩形 過濾器進行提取的圖像塊的示例,其是從整個圖像數(shù)據(jù)中切出的預(yù)定尺寸的部分圖像。此外,圖26是表示要處理的圖像數(shù)據(jù)的圖。在該圖中,2601表示要處理的一幀圖 像數(shù)據(jù)。此外,2602表示作為對要處理的一幀圖像數(shù)據(jù)進行實際處理時使用的處理單位的 處理塊,處理塊是尺寸與矩形過濾器2052a至2502c的尺寸相對應(yīng)的部分圖像。通過使用 矩形過濾器2052a至2502c計算由白色區(qū)域和黑色區(qū)域表示的區(qū)域數(shù)據(jù)的總和之間的差, 來提取部分圖像內(nèi)的局部區(qū)域的特征。通過使用基于部分圖像2602的預(yù)定步長依次掃描整個圖像數(shù)據(jù)2601,并使用處 理單位處理圖像數(shù)據(jù),來提取圖像數(shù)據(jù)2601內(nèi)的特定對象。判別器2401至240η中的各個累積作為各矩形過濾器的確定結(jié)果的輸出的評價 值,并通過使用識別閾值進行閾值處理來確定是否存在特定對象。如上所述,將判別器2401 至240η級聯(lián)連接,僅當確定在處理單位的部分圖像2602中存在特定對象時,各判別器使處 理進入到后面的判別器。以這種方式,所描述的方法在各判別器(也稱為級)處確定處理單位的部分圖像 是特定對象,還是不是特定對象。在確定部分圖像不是特定對象的情況下,立即結(jié)束計算。 在實際圖像數(shù)據(jù)中,經(jīng)常在初期階段確定部分圖像不是特定對象,因此能夠?qū)崿F(xiàn)高速提取處理。在此,考慮在嵌入式設(shè)備等中實現(xiàn)使用諸如在文獻1中描述的方法提取特定對象 的功能的情況。這種情況需要根據(jù)提取的目的以及嵌入式設(shè)備的計算性能來調(diào)整提取精度 與提取處理速度之間的折衷(tradeoff)。作為一個示例,可以給出在規(guī)格彼此不同的多個嵌入式設(shè)備中,作為公用設(shè)備安 裝通過硬件來實現(xiàn)的單元(或集成電路)的情況。在這種情況下,期望基于安裝該單元的 嵌入式設(shè)備的操作時鐘、使用條件等,調(diào)整提取精度與提取處理速度之間的折衷。此外,即使在相同的嵌入式設(shè)備中安裝該單元時,也存在所需的提取精度及提取 處理時間根據(jù)安裝在嵌入式設(shè)備中的應(yīng)用程序的類型而不同的情況。在這些情況下,如果 能夠調(diào)整提取精度與提取處理速度之間的折衷,則還能夠?qū)⑶度胧皆O(shè)備的性能最優(yōu)化。傳統(tǒng)上,通過降低要處理的圖像數(shù)據(jù)的分辨率、加寬在基于部分圖像掃描要處理 的圖像數(shù)據(jù)時使用的步長等來應(yīng)對這些情況。例如,文獻1公開了一種改變步長的方法。然而,當應(yīng)對諸如這些的情況時,存在不能靈活地實現(xiàn)提取精度與提取處理速度 之間的折衷的問題。例如,當試著通過改變分辨率來控制提取處理速度時,需要將輸入的圖 像數(shù)據(jù)的分辨率轉(zhuǎn)換為相應(yīng)的分辨率。還需要準備與各分辨率相對應(yīng)的多個判別器。此外,即使當步長改變時,對折衷點(即提取精度與提取處理速度的適當組合)的 類型(例如將步長設(shè)定為η個像素的單位)有限制,從而導(dǎo)致不能以靈活的方式實現(xiàn)控制 的問題。如日本特開2005-100121號公報所公開的,考慮由要應(yīng)用該單元的嵌入式設(shè)備執(zhí) 行的計算量,能夠很好地應(yīng)對這種情況。在此,預(yù)先使用多個判別器進行學習,并在進行提 取處理時從多個判別器組中選擇適合該嵌入式設(shè)備的判別器組。然而,在這種情況下,需要 預(yù)先針對各折衷點準備多個不同的判別器組,從而導(dǎo)致需要增大諸如存儲器等的資源量的 問題。這在參數(shù)信息的量大的情況下(例如當要配置大量判別器時)尤其成問題。
發(fā)明內(nèi)容
在鑒于上述問題進行了構(gòu)想的情況下,本發(fā)明的目的是,使得當使用多個級聯(lián)連 接的弱判別器,從輸入的數(shù)據(jù)中提取特定對象時,能夠靈活地改變提取處理速度與提取精 度的組合。為了實現(xiàn)上述目的,根據(jù)本發(fā)明的信息處理裝置被配置為包括多個弱判別器,其 相互級聯(lián)連接,所述多個弱判別器對數(shù)據(jù)進行處理;第一存儲單元,其存儲指定所述弱判別 器中的各個的處理內(nèi)容的處理指定信息;第二存儲單元,其存儲表,在所述表中是指定的信 息,所述信息用于基于處理所述數(shù)據(jù)的條件來確定在對所述數(shù)據(jù)的處理中要使用所述弱判 別器中的哪些;選擇單元,其通過參照所述表,來從所述弱判別器中選擇在對所述數(shù)據(jù)的處 理中要使用的弱判別器;以及提取單元,其基于與所述選擇單元選擇的所述弱判別器相對 應(yīng)的所述處理指定信息,使用所述弱判別器對所述數(shù)據(jù)進行處理而獲得的評價值,從所述 數(shù)據(jù)中提取對象。根據(jù)本發(fā)明,當使用多個級聯(lián)連接的弱判別器,從輸入的數(shù)據(jù)中提取特定對象時, 能夠靈活地改變提取處理速度與提取精度的組合。從以下對示例性實施例的 描述(參照附圖),本發(fā)明的其它特征將變得明顯。
包括在說明書中并構(gòu)成說明書的一部分的附圖,示出了本發(fā)明的實施例,并且與 本說明一起,用于解釋本發(fā)明的原理。圖1是示出根據(jù)本發(fā)明的第一實施例的信息處理裝置的配置的示例的圖。 圖2是示出識別處理單元的細節(jié)的圖。圖3是詳細示出矩形過濾器計算單元的配置的圖。圖4是示出參數(shù)信息的示例的圖。圖5是示出根據(jù)本發(fā)明的第一實施例的模式識別裝置進行的操作的流程圖。圖6是示意性地示出弱判別器的總數(shù)與提取精度之間的關(guān)系的圖。圖7是示出將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。圖8是示出根據(jù)SAT數(shù)據(jù)計算矩形塊的方法的圖。圖9是示出根據(jù)本發(fā)明的第二實施例的模式識別裝置進行的操作的流程圖。圖10是示意性地示出使用增強學習算法獲得的弱判別器的數(shù)量與相應(yīng)弱判別器 的可靠度水平之間的關(guān)系的圖。圖11是示出將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。圖12是示出根據(jù)本發(fā)明的第三實施例的模式識別裝置進行的操作的流程圖。圖13是示出將前一幀中的提取目標對象的提取數(shù)量與使用的弱判別器的總數(shù)相 關(guān)聯(lián)的表的示例的圖。圖14是示出根據(jù)本發(fā)明的第四實施例的模式識別裝置進行的操作的流程圖。圖15是示出攝像模式的圖。圖16是示出將攝像模式與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。圖17是示出將操作模式與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。圖18是示意性地示出定義弱判別器的操作的參數(shù)信息及其使用狀態(tài)的圖。圖19是示出存儲器映射的示例的圖。圖20是示出根據(jù)本發(fā)明的第七實施例的模式識別裝置進行的操作的流程圖。圖21是示出根據(jù)本發(fā)明的第七實施例的模式識別裝置中的處理執(zhí)行確定單元的 部分的圖。圖22是示出將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。圖23是示出在有兩個提取模式的情況下用于確定提取條件的表的示例的圖。圖24是示出將多個判別器級聯(lián)連接并在對各個判別器進行終止判定的同時進行 處理的方法的圖。圖25是示出用于提取特定對象的矩形過濾器的示例的圖。圖26是表示要處理的圖像數(shù)據(jù)的圖。
具體實施例方式以下,參照附圖詳細描述本發(fā)明的各種實施例。(第一實施例)<模式識別裝置的硬件配置>
圖1是示出根據(jù)本發(fā)明的第一實施例的信息處理裝置(模式識別裝置100)的硬 件配置的示例的圖。模式識別裝置100具有從圖像數(shù)據(jù)中提取特定對象(圖像模式)的功 能。在圖1中,101是圖像輸入單元,其由光學系統(tǒng)、光電轉(zhuǎn)換設(shè)備、控制光電轉(zhuǎn)換設(shè)備 的驅(qū)動器電路、AD轉(zhuǎn)換器、進行各種圖像校正的信號處理電路、幀緩沖器等構(gòu)成。在此描述 的光電轉(zhuǎn)換設(shè)備包括CCD (電荷耦合器件)、CMOS (互補金屬氧化半導(dǎo)體)傳感器等。102是預(yù)處理單元,其進行使得能夠有效地執(zhí)行提取處理的各種預(yù)處理。更具體地 說,預(yù)處理單元102使用硬件,基于色彩轉(zhuǎn)換表、對比度校正信息等,進行諸如色彩轉(zhuǎn)換處 理、對比度校正處理等的圖像數(shù)據(jù)轉(zhuǎn)換。103是識別處理單元,其是執(zhí)行實現(xiàn)根據(jù)本實施例的信息處理方法所需的處理的 硬件塊。稍后將參照圖2給出關(guān)于識別處理單元103的細節(jié)。106 是 DMAC(直接存儲存取控制器,Direct Memory AccessController)。DMAC 106執(zhí)行諸如在連接到圖像總線104的各種處理設(shè)備之間以及連接到圖像總線104的設(shè)備 與連接到CPU (中央處理單元)總線107的RAM 110和ROM 109之間進行數(shù)據(jù)傳輸?shù)墓δ堋?
105是為圖像總線104與CPU總線107提供橋接功能的橋。108是控制模式識別 裝置100的總體操作的CPU。109是存儲規(guī)定CPU 108的操作的命令以及各種計算所需的 數(shù)據(jù)的ROM(只讀存儲器)。110是CPU 108的操作所需的存儲器(RAM,即隨機存取存儲器)。RAM 110由諸如 DRAM(動態(tài)RAM)等容量比較大的存儲器構(gòu)成。CPU 108能夠經(jīng)由橋105訪問連接到圖像總線104的各種處理單元。通過將圖像 總線104與CPU總線107分離,能夠同時操作通過硬件實現(xiàn)的各種處理單元(101至103) 和 CPU 108。111是接口單元,其是操作者用來指定模式識別裝置100的操作的輸入/輸出接□。<識別處理單元103的詳細配置>圖2是示出識別處理單元103的細節(jié)的圖。201是矩形過濾器計算單元,其對存儲 在RAM 204中的要處理的圖像數(shù)據(jù)210執(zhí)行預(yù)定矩形過濾器計算處理。RAM 204是存儲要 處理的圖像數(shù)據(jù)210的存儲器,其由高速、低延遲存儲器構(gòu)成。205是R0M,其存儲指定各矩 形過濾器的計算細節(jié)的參數(shù)信息211。矩形過濾器計算單元201根據(jù)存儲在ROM 205中的參數(shù)信息211中的矩形坐標信 息(稍后描述)訪問RAM 204中的圖像數(shù)據(jù)210,并使用通過預(yù)先進行的學習而生成的矩形 過濾器,依次執(zhí)行計算處理和弱判別處理。202是處理數(shù)量計數(shù)器,其由對處理當前正在使用的矩形過濾器的編號和當前正 在進行處理的級的編號進行計數(shù)的計數(shù)器等構(gòu)成。203是處理執(zhí)行確定單元,其根據(jù)處理數(shù) 量計數(shù)器202中設(shè)置的矩形過濾器處理數(shù)量計數(shù)器和級處理數(shù)量計數(shù)器、以及從外部指定 的矩形過濾器的執(zhí)行的有/無和結(jié)束條件,來控制矩形過濾器計算單元201。換句話說,在矩形過濾器計算單元201進行的實際處理中,使用處理執(zhí)行確定單 元203從預(yù)先通過學習而獲得的多個矩形過濾器中指定的矩形過濾器。206是識別處理單元103的內(nèi)部局部總線,假定其經(jīng)由橋(未示出)連接到圖像總線104。CPU 108經(jīng)由橋訪問連接到內(nèi)部局部總線206的各種設(shè)備(201至205)。<矩形過濾器計算單元201的詳細配置>圖3是詳細示出矩形過濾器計算單元201的配置的圖。圖3與圖24中的示出2401至240η的細節(jié)的圖相對應(yīng)。311至31k均為判別器,多個矩形過濾器根據(jù)存儲在ROM 205 中的參數(shù)信息211,執(zhí)行計算處理和弱判別處理。320是判別處理單元,其使用識別閾值對 評價值的累積值進行閾值處理,評價值是由矩形過濾器311至31k中的各個執(zhí)行的弱判別 處理的結(jié)果;然后,判別處理單元320確定是否存在提取目標對象。〈參數(shù)信息211的配置〉圖4是示出存儲在ROM 205中的參數(shù)信息211的示例的圖。圖4示出了一級中的 處理所需的參數(shù)信息的示例。在圖4中,矩形坐標402表示與一個矩形塊相對應(yīng)的四個頂點的坐標數(shù)據(jù)。該坐 標數(shù)據(jù)與提取目標對象內(nèi)的坐標值相對應(yīng)。矩形坐標402具有與矩形數(shù)量401相對應(yīng)的組 的坐標數(shù)據(jù)。過濾器閾值404是用于對目標矩形過濾器的輸出進行弱判別的閾值??煽慷人?403表示作為從目標矩形過濾器獲得的結(jié)果的評價值的可靠度水平(貢獻率)。各矩形過 濾器311到31k使通過將使用過濾器閾值對矩形過濾器計算處理的結(jié)果進行弱判別的結(jié)果 (1或-1)乘以可靠度水平而獲得的值,作為其輸出。識別閾值405是判別處理單元320用 來執(zhí)行識別處理的閾值。針對各個矩形過濾器存儲上述參數(shù)信息211 (因此,在圖4中存儲了 k個參數(shù)信息 211),此外,還針對各級存儲上述參數(shù)信息211。[模式識別裝置100中的處理的流程]以下,將使用圖5所示的流程圖詳細描述根據(jù)本實施例的模式識別裝置100進行 的操作。圖5使用一個流程圖示出了 CPU 108和識別處理單元103的操作。由圖5中的 “識別處理”表示的流程(即步驟S508至S518)與識別處理單元103的操作相對應(yīng)。首先,在步驟S501中,在開始識別處理之前,CPU 108執(zhí)行各種初始化處理。根據(jù) 來自CPU 108的初始化指令對各種處理單元(101至103)的內(nèi)部寄存器/存儲器進行初始 化。接著,在步驟S502中,指定在實際處理中要使用的矩形過濾器,并確定要在各級 進行的矩形過濾器處理的細節(jié)。更具體地說,逐級指定在處理中使用的矩形過濾器的數(shù)量。在步驟S503中,指定實際處理使用的級。更具體地說,指定在處理中使用的級的 數(shù)量。在此,根據(jù)模式識別裝置100的操作時鐘來確定在處理中使用的矩形過濾器的數(shù)量 和級的數(shù)量。圖6是示意性地示出弱判別器(矩形過濾器)的總數(shù)與提取精度之間的關(guān)系的 圖。弱判別器的總數(shù)表示在各級中包括的弱判別器的總和,而“誤檢”表示錯誤檢測的程度。如圖6所示,一般來說,隨著弱判別器的總數(shù)的增加,誤檢減少,由此提取精度提 高。此外,因為可以認為弱判別器的總數(shù)一般與提取處理時間成比例,因此通過控制弱判別 器的總數(shù),可以非常容易地調(diào)整提取處理速度與提取精度之間的折衷。圖7是將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例。在圖7中,m至 N3分別表示在操作時鐘1至3的情況下的級的數(shù)量,Sxy(χ 時鐘類型;y 級編號)表示各級內(nèi)的弱判別器的數(shù)量。針對m至N3以及Sxy中的各個,設(shè)定小于或等于通過學習生成的級的數(shù)量以及弱 判別器的數(shù)量的值。此外,THxyU 時鐘類型;y:級編號)是針對各級的識別閾值。使用增 強學習算法生成的判別器使用由公式(1)表示的累積值進行識別?!芶ihi(x)…(1)T 弱判別器的數(shù)量;α i 弱判別器i的可靠度水平;hi(X):弱判別器輸出的確定 結(jié)果在此,T是實際使用的弱判別器的數(shù)量;在弱判別器的數(shù)量減少的情況下,T是減 少后的數(shù)量。T的值在級之間可以不同。α i表示弱判別器的可靠度,其是通過弱判別器的學習而確定的值。還可以將α , 稱為弱判別器對判別器的貢獻率。hi(x)是作為弱判別器的輸出的評價值,其是使用過濾器閾值對圖25所示的矩形 過濾器2502a至2502c的輸出進行弱判別的結(jié)果(輸出士 1)。在弱判別器的數(shù)量減少的情 況下,公式(1)所示的T的值與學習時的值相比有變化,因此需要針對各預(yù)定條件準備新的 識別閾值Thxy。注意,在學習時和執(zhí)行時T的值相同的情況下,直接使用圖4所示的識別閾值。預(yù)先使用外部工作站等創(chuàng)建圖7所示的表,并將其預(yù)先存儲在R0M109等中。換句 話說,創(chuàng)建表,使得當操作時鐘為高時使用很多弱判別器,而當操作時鐘為低時使用很少判 另1J器。注意,可以使用傳統(tǒng)上提出的最優(yōu)化方法等,來確定級數(shù)的減少與級內(nèi)的弱判別 器的減少的組合。例如,可以預(yù)先使用測試數(shù)據(jù)集,基于提取精度與提取處理時間之間的關(guān) 系,來創(chuàng)建期望的組合。通過相互獨立地設(shè)定級的數(shù)量以及級內(nèi)的弱判別器的數(shù)量,能夠更 靈活地確定折衷點。此外,當確定弱判別器的數(shù)量時,通過利用弱判別器的可靠度水平,能夠減少弱判 別器的數(shù)量,同時還能夠抑制提取精度的降低。具有低可靠度水平的弱判別器對識別的影 響很小,一般來說,可靠度水平向后級降低。由于該原因,在例如在串聯(lián)連接的判別器中包 括弱判別器,并且在后面的判別器中包括的弱判別器的可靠度水平小于或等于預(yù)定值的情 況下,可以使用例如將多個判別器全部減少的方法。使用可靠度水平使得能夠獲得最優(yōu)化 變得容易的效果。在步驟S502和S503中,參照圖7所示的表,并將實際處理中使用的矩形過濾器的 數(shù)量、級的數(shù)量、識別閾值等設(shè)定在處理執(zhí)行確定單元203中包括的寄存器(未示出)中。當針對識別處理的各種設(shè)定結(jié)束時,在步驟S504中,啟運動圖像輸入單元101,在 步驟S506中,啟動預(yù)處理單元102。接著,這些相應(yīng)單元進行以下處理。首先,圖像輸入單元101將光電轉(zhuǎn)換設(shè)備獲得的一幀的圖像數(shù)據(jù)存儲在內(nèi)部緩沖 器(未示出)中。當該存儲結(jié)束時,圖像輸入單元101向CPU 108發(fā)送表示圖像數(shù)據(jù)的獲取結(jié)束的 中斷。當檢測到該中斷時,CPU 108啟動DMAC 106,并將獲取的圖像數(shù)據(jù)傳送到預(yù)處理單元 102中的內(nèi)部存儲器(未示出)。當接收到圖像數(shù)據(jù)時,預(yù)處理單元102開始預(yù)處理。更具體地說,預(yù)處理單元102基于預(yù)設(shè)的色彩轉(zhuǎn)換表、對比度校正信息等,執(zhí)行諸如色彩轉(zhuǎn)換處理、對比度校正處理等的圖像數(shù)據(jù)轉(zhuǎn)換處理。當圖像數(shù)據(jù)轉(zhuǎn)換處理結(jié)束時,預(yù)處理單元102向CPU 108發(fā)送中斷信號。接著,在步驟S506中,CPU 108檢測由預(yù)處理單元102發(fā)送的中斷信號,并基于轉(zhuǎn) 換處理后的圖像數(shù)據(jù)生成求和面積表(Summed AreaTable)數(shù)據(jù)(以下稱為“SAT數(shù)據(jù)”)。 SAT數(shù)據(jù)是適于以高速處理諸如圖25所示的矩形類型過濾器的數(shù)據(jù)格式。注意,在上述文 獻1中公開了 SAT數(shù)據(jù),因為SAT數(shù)據(jù)與本發(fā)明的特征無關(guān),因此省略其詳細描述。圖8是示出根據(jù)SAT數(shù)據(jù)計算矩形塊的方法的圖。使用SAT數(shù)據(jù)區(qū)域內(nèi)的四個點 的值Sl至S4(與輸入數(shù)據(jù)相同的坐標位置),通過公式S4+S1-(S2+S3),能夠算出輸入數(shù)據(jù) 區(qū)域801中的矩形區(qū)域802內(nèi)的數(shù)據(jù)的總和。通過參照SAT數(shù)據(jù),在由圖25中的2502a表 示的矩形過濾器的情況下,能夠使用例如六個數(shù)據(jù)讀取來進行矩形過濾器計算處理。在步驟S507中,CPU 108傳送生成的SAT數(shù)據(jù),并將其作為要處理的圖像數(shù)據(jù)存 儲在識別處理單元103的RAM 204中。當SAT數(shù)據(jù)到RAM204的該傳送結(jié)束時,識別處理單 元103進行的識別處理開始。<識別處理單元103中的識別處理的流程>以下,將描述如在步驟S508至S518所示的由識別處理單元103進行的識別處理 (硬件處理)的流程。在步驟S508中,在存儲在RAM 204中的圖像數(shù)據(jù)中指定用作處理單位的處理塊。 處理塊是由圖26中的2602表示的部分圖像;通過在以一個像素或一行為單位掃描該窗口 的同時進行提取,來提取在一幀圖像數(shù)據(jù)中包括的提取目標對象。在步驟S509中,矩形過濾器計算單元20IWROM 205中讀出參數(shù)信息211。接著, 在步驟S510中,矩形過濾器計算單元201參照處理塊中的預(yù)定圖像數(shù)據(jù)來執(zhí)行矩形過濾器 計算處理。如之前所述,矩形過濾器計算處理計算多個矩形過濾器相對于處理塊的差值。接著,在步驟S511中,將在步驟S509中獲得的矩形過濾器的輸出與ROM 205中針 對該過濾器存儲的矩形過濾器閾值進行比較。在矩形過濾器的輸出超出過濾器閾值的情況 下,針對該矩形過濾器的輸出,將通過計算矩形過濾器的可靠度水平的總和而獲得的評價 值加到累積值。然而,在矩形過濾器的輸出小于或等于過濾器閾值的情況下,針對該矩形過濾器 的輸出,將通過計算矩形過濾器的可靠度水平的總和而獲得的評價值從累積值中減去。當一個矩形過濾器計算(弱判別器計算)處理結(jié)束時,在步驟S512中,處理數(shù)量 計數(shù)器202更新矩形過濾器處理數(shù)量計數(shù)器。接著,在步驟S513中,確定針對一級內(nèi)的所有弱判別器鏈的矩形過濾器計算處理 是否結(jié)束。在此,處理執(zhí)行確定單元203將通過在步驟S502中指定的矩形過濾器的數(shù)量與 由處理數(shù)量計數(shù)器202輸出的矩形過濾器處理數(shù)量計數(shù)器的值進行比較,并確定該級內(nèi)的 矩形過濾器計算處理是否結(jié)束。在步驟S513中確定針對所有矩形過濾器,矩形過濾器計算處理未結(jié)束的情況下, 該過程返回步驟S509,在步驟S509中,針對下一個過濾器執(zhí)行矩形過濾器計算處理。另一方面,在步驟S513中確定針對所有矩形過濾器,矩形過濾器計算處理結(jié)束的 情況下,該過程進入步驟S514,在步驟S514中,判別處理單元320識別累積值,并確定是否終止該級。在此,通過將累積值與在步驟S502中設(shè)定的識別閾值405進行比較來確定在處理 塊中是否存在提取目標對象。在判別處理單元320進行的識別的結(jié)果表示不存在提取目標 對象的情況下,終止識別處理。當終止識別處理時,在步驟S517中記錄在該處理塊中不存在提取目標對象(即對 象不是提取目標對象)的情況。然而,在由判別處理單元320進行的識別的結(jié)果表示存在提取目標對象的情況 下,該過程進入步驟S515,在步驟S515中,更新處理數(shù)量計數(shù)器202的級數(shù)計數(shù)器。在步驟S516中,處理執(zhí)行確定單元203將級處理數(shù)量計數(shù)器與在步驟S503中指 定的級的數(shù)量進行比較。在基于步驟S516中進行的比較的結(jié)果確定未達到指定的級的數(shù) 量的情況下,該過程返回步驟S509,在步驟S509中,開始針對下一級的矩形過濾器計算處 理。然而,在基于步驟S516中進行的比較的結(jié)果確定已達到指定的級的數(shù)量的情況 下,該過程進入步驟S517,在步驟S517中,記錄在該處理塊中存在提取目標對象。在步驟S518中,確定是否針對要處理的圖像數(shù)據(jù)內(nèi)的所有處理塊,執(zhí)行了識別處 理。在確定針對要處理的圖像數(shù)據(jù)內(nèi)的所有處理塊,識別處理未結(jié)束的情況下,該過程返回 到步驟S508,在步驟S508中,選擇相鄰一個像素或一行的處理塊,并對其重復(fù)相同的處理。然而,在步驟S518中確定針對要處理的圖像數(shù)據(jù)內(nèi)的所有處理塊,識別處理結(jié)束 的情況下,該過程進入步驟S519,在步驟S519中,確定是否對下一幀的圖像數(shù)據(jù)執(zhí)行識別 處理。在要對下一幀的圖像數(shù)據(jù)執(zhí)行識別處理的情況下,該過程返回到步驟S504,重復(fù)從步 驟S504至步驟S518的處理。然而,在確定不對下一幀的圖像數(shù)據(jù)執(zhí)行識別處理的情況下, 處理結(jié)束。如上所述,本實施例具有根據(jù)執(zhí)行識別處理的模式識別裝置的操作時鐘,指定要 使用的弱判別器的數(shù)量以及級的數(shù)量(其與表示處理順序的編號相對應(yīng))的配置。因此, 當執(zhí)行識別處理時,執(zhí)行識別處理的模式識別裝置不針對在指定的級的數(shù)量之后的級執(zhí)行 矩形過濾器計算處理。換句話說,通過使用這種能夠根據(jù)操作時鐘來控制弱判別器的數(shù)量的配置,即使 當在具有不同規(guī)格的多個嵌入式設(shè)備中安裝了識別處理單元時,也能夠根據(jù)嵌入式設(shè)備的 操作時鐘調(diào)整提取精度與提取處理速度。(第二實施例)盡管上述第一實施例描述了通過指定使用的弱判別器的數(shù)量或者級的數(shù)量來調(diào) 整提取精度與提取處理速度之間的折衷的配置,但是本發(fā)明不限于此。例如,可以使用通過 基于可靠度水平指定是否執(zhí)行各個單獨的弱判別器來調(diào)整提取精度與提取處理速度之間 的折衷的配置。以下,將描述根據(jù)本實施例的用于調(diào)整提取精度與提取處理速度之間的折衷的模式識別裝置的細節(jié)。注意,根據(jù)本實施例的模式識別裝置的硬件配置、矩形過濾器計算單元 201的配置的細節(jié)、參數(shù)信息211的配置等與在上述第一實施例中所描述的相同,因此在此 省略其描述。圖9是示出根據(jù)本發(fā)明的第二實施例的模式識別裝置100進行的操作的流程圖。在此僅描述與第一實施例中不同的項目。在步驟S902中,確定要使用的弱判別器。圖10是示意性地示出使用增強學習算 法獲得的弱判別器的數(shù)量與相應(yīng)的弱判別器的可靠度水平之間的關(guān)系的圖。一般來說,增加弱判別器的數(shù)量導(dǎo)致弱判別器的相應(yīng)可靠度水平降低,但這種降 低不是恒定的;相反,這種降低上下波動,從而導(dǎo)致平均降低。因此,在步驟S902中,當確定要使用的弱判別器時,通過基于預(yù)定可靠度水平進 行判別來設(shè)定弱判別器。例如,在圖10所示的情況下,在實際處理中使用具有超過閾值Th 的可靠度水平的弱判別器,而不將小于或等于Th的弱判別器用于矩形過濾器計算處理。通過以這種方式指定要使用的弱判別器,與如同第一實施例那樣,基于處理的數(shù) 量統(tǒng)一確定要使用的弱判別器的情況相比,能夠指定具有較高可靠度水平的弱判別器(具 有較高貢獻率的判別器)。
在此,確定通過學習而生成的弱判別器鏈的可靠度水平,并預(yù)先生成將滿足預(yù)定 條件的弱判別器指定為“要使用的弱判別器”、而將不滿足預(yù)定條件的弱判別器指定為“不 使用的弱判別器”的標記信息。換句話說,在此討論的“標記信息”是表示是否使用弱判別 器的信息。圖11是示出將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。在圖 11中,m至N3以及ThxyU 時鐘類型;y 級編號)是與第一實施例中相同的變量。Mxy(X 時鐘類型;y 級編號)是指定各弱判別器是否執(zhí)行處理的標記信息,其用二進制位串來表 示。下面示出Mxy的示例。在此示出的示例是針對從MSB (最高有效位,Most Significant Bit)開始以升序分配32個弱判別器中的各個是否執(zhí)行處理的情況。Mll = 11111111111111111010100101010000對于各個位,在矩形過濾器計算處理中實際使用分配了 1的弱判別器,而在矩形 過濾器計算處理期間不使用分配了 0的弱判別器。例如,在矩形過濾器計算處理中使用第 1個弱判別器,而不使用第32個弱判別器。在步驟S902中,根據(jù)操作時鐘來選擇預(yù)定Mxy,并在處理執(zhí)行確定單元203中的寄 存器(未示出)中進行設(shè)定。步驟S903至S907所示的處理與圖7中的步驟S703至S707所示的處理相同,因 此省略其描述。此外,對于識別處理單元103的操作,即步驟S908至S919所示的處理,僅描述與 圖7中的步驟S708至S719所示的處理不同的處理。在步驟S920中,處理執(zhí)行確定單元203確定要使用的弱判別器。處理執(zhí)行確定單 元203基于由處理數(shù)量計數(shù)器202計數(shù)的矩形過濾器處理數(shù)量計數(shù)器以及在步驟S902中 設(shè)定的標記信息Mxy來確定在矩形過濾器計算處理中是否使用弱判別器。換句話說,基于矩形過濾器處理數(shù)量計數(shù)器的值來確定Mxy中的相應(yīng)位位置,接著 確定該位的值是0還是1。在確定與矩形過濾器處理數(shù)量計數(shù)器的值相對應(yīng)的位位置的值 是1的情況下,確定該弱判別器是“要使用的弱判別器”,并在步驟S909至S911中執(zhí)行矩形 過濾器計算處理和弱判別處理。在步驟S912中,更新矩形過濾器處理數(shù)量計數(shù)器,而不管是否使用弱判別器。接 著,在步驟S913中,確定針對一級內(nèi)的所有弱判別器鏈,矩形過濾器計算處理是否結(jié)束?;陬A(yù)先通過學習生成的弱判別器的數(shù)量與矩形過濾器處理數(shù)量計數(shù)器之間的比較來進行 該確定。接下來的步驟S913至S919中的處理與圖5中的步驟S513至S519中的處理相同,因此省略其描述。如上所述,本實施例具有根據(jù)執(zhí)行識別處理的模式識別裝置的操作時鐘指定要使用的弱判別器的數(shù)量的配置。使用這種配置,即使當在具有不同規(guī)格的多個嵌入式設(shè)備中 安裝了通過硬件作為公用設(shè)備實現(xiàn)的識別處理單元時,也能夠根據(jù)嵌入式設(shè)備的操作時鐘 調(diào)整提取精度與提取處理速度。此外,本實施例具有當指定要使用的弱判別器時根據(jù)弱判別器的可靠度水平進行 指定的配置。這使得與上述第一實施例相比能夠更加抑制提取精度的降低。(第三實施例)盡管上述第一和第二實施例描述了通過根據(jù)模式識別裝置的操作時鐘改變要使 用的弱判別器的數(shù)量來調(diào)整提取精度與提取處理速度之間的折衷,但是本發(fā)明不限于此。 例如,可以通過根據(jù)提取目標對象的提取狀態(tài)動態(tài)地改變要使用的弱判別器的數(shù)量,來調(diào) 整提取精度與提取處理速度之間的折衷。以下,將描述根據(jù)本實施例的用于調(diào)整提取精度與提取處理速度之間的折衷的模 式識別裝置的細節(jié)。注意,根據(jù)本實施例的模式識別裝置的硬件配置、矩形過濾器計算單元 201的配置的細節(jié)、參數(shù)信息211的配置等與在上述第一實施例中所描述的相同,因此在此 將省略其描述。圖12是示出根據(jù)本發(fā)明的第三實施例的模式識別裝置100進行的操作的流程圖。 為了簡單起見,以下僅描述與第二實施例的不同之處。步驟S1201至S1220所示的處理與圖9中的步驟S901至S920所示的處理相同。 然而,步驟S1202、S1203以及S1217中的處理分別具有與圖9所示的步驟S902、S903以及 S917不同的處理細節(jié)。在步驟S1221中,讀出在前一幀中提取的提取目標對象的數(shù)量。接著,在步驟 S1202和S1203中,基于如在此所描述的讀出的前一幀中的提取目標對象的數(shù)量,來確定要 使用的弱判別器的數(shù)量以及級的數(shù)量。例如,在前一幀中提取的提取目標對象的數(shù)量大的 情況下,減少要使用的弱判別器的數(shù)量。圖13是示出由本實施例的模式識別裝置保持的、將前一幀中的提取目標對象的 提取數(shù)量與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。在圖13中,m至N3、Thxy(χ 時鐘類型;y:級編號)以及Mxy(x 時鐘類型;y:級編號)與第二實施例中圖11所示的變量 相對應(yīng)。在圖13所示的表中存儲有與前一幀中的提取目標對象的提取數(shù)量相對應(yīng)的三個 參數(shù)。圖13中的Dl和D2與提取的提取目標對象的數(shù)量相對應(yīng)。本實施例被配置為當提 取的提取目標對象的數(shù)量大時,弱判別器的總數(shù)減少。注意,在ROM 109中存儲圖13所示 的表。在步驟S1202和S1203中,將在前一幀中提取的提取目標對象的數(shù)量(步驟 S1221)與表中所示的條件(D1、D2)進行比較。通過這樣,改變要使用的級的數(shù)量等。換句話說,當提取目標對象的數(shù)量改變時,在步驟S1202和S1203中,在處理執(zhí)行確定單元203的寄存器中設(shè)定與其相對應(yīng)的弱判別器的總數(shù)以及參數(shù)(m至N3、Thxy以及 Mxy)。根據(jù)在此設(shè)定的參數(shù),在步驟S1204至S1220中執(zhí)行識別處理。雖然步驟S1204至S1220中的處理與第二實施例中的步驟S904至S920中的處理相當,但是本實施例的不同之處在于在步驟S1217中對提取的提取目標對象的數(shù)量進行計數(shù)。在對下一幀進行識別處理期間,在步驟S1221中讀出并使用在步驟S1217中記錄 的提取目標對象的數(shù)量(幀處理后的計數(shù)值)。在步驟S1221中讀出計數(shù)器的值之后,將該 計數(shù)器復(fù)位。如上所述,本實施例具有根據(jù)從前一幀的提取結(jié)果動態(tài)地改變要使用的弱判別器 的數(shù)量的配置。通過這樣,當在前一幀中提取的提取目標對象的數(shù)量小時,執(zhí)行使用很多弱 判別器的高精度提取。另一方面,當在前一幀中提取的提取目標對象的數(shù)量大時,減少弱判 別器的數(shù)量,并使提取處理速度優(yōu)先地執(zhí)行處理。結(jié)果,即使在需要在預(yù)定量的時間內(nèi)實時 對運動圖像執(zhí)行提取處理的情況下,也能夠?qū)崿F(xiàn)適當?shù)奶崛√幚怼?第四實施例)盡管上述第三實施例描述了通過根據(jù)從前一幀的提取結(jié)果改變要使用的弱判別 器的數(shù)量來調(diào)整提取精度與提取處理速度之間的折衷,但是本發(fā)明不限于此。例如,可以通 過根據(jù)正在處理的當前幀的提取狀態(tài)改變要使用的弱判別器的數(shù)量來調(diào)整提取精度與提 取處理速度之間的折衷。以下將描述根據(jù)本實施例的模式識別裝置的配置。注意,根據(jù)本實施例的模式識 別裝置的硬件配置、矩形過濾器計算單元201的配置的細節(jié)、參數(shù)信息211的配置等與在上 述第一實施例中描述的相同,因此在此將省略其描述。圖14是示出根據(jù)本發(fā)明的第四實施例的模式識別裝置100進行的操作的流程圖。 為了簡單起見,以下將僅描述與第三實施例的不同之處。步驟S1401至S1421所示的處理大致與圖12中的步驟S1201至S1221所示的處 理相當;然而,在本實施例中,處理的順序以及步驟S1421的處理細節(jié)不同。當在步驟S1404至S1407中將SAT數(shù)據(jù)作為要處理的圖像數(shù)據(jù)存儲在RAM 204中 時,對要處理的幀開始識別處理。在步驟S1421中,讀出到當前為止提取的提取目標對象的數(shù)量。讀出值是在步驟 S1417中隨提取目標對象的每次提取而遞增的計數(shù)器值。注意,當在步驟S1421中處理幀中 的第一處理塊時,將該計數(shù)器初始化。在步驟S1402和S1403中,根據(jù)讀出的計數(shù)值(在幀中提取的提取目標對象的數(shù) 量)確定要使用的弱判別器。以與第三實施例相同的方式,通過參照圖13所示的表來進行 弱判別器的確定。換句話說,確定表中所示的條件是否發(fā)生了改變,在確定發(fā)生了改變的情況下,在 步驟S1402和S1403中設(shè)定相應(yīng)的參數(shù)。在步驟S1408至S1418中,對處理塊執(zhí)行識別處理,并在提取了提取目標對象的情 況下,在步驟S1417中,更新對提取的數(shù)量進行計數(shù)的計數(shù)器。當對作為部分圖像的處理塊 的處理結(jié)束時,基于該表,在步驟S1421、S1402以及S1403中重新設(shè)定要使用的弱判別器的數(shù)量。如上所述,在本實施例中,以處理塊為單位來重新設(shè)定弱判別器的數(shù)量,處理塊是部分圖像。換句話說,基于在當前處理的幀中提取的提取目標對象的數(shù)量,以處理塊為單位 動態(tài)地改變?nèi)跖袆e器的數(shù)量。通過這樣,在當前處理的幀內(nèi)的提取目標對象的數(shù)量增加,并 且可能沒有充裕的提取處理時間的情況下,在處理后續(xù)處理塊時,能夠減少弱判別器的數(shù) 量,并將縮短處理時間優(yōu)先。結(jié)果,即使在需要在預(yù)定量的時間內(nèi)實時對運動圖像執(zhí)行識別處理的情況下,也 能夠執(zhí)行適當?shù)淖R別處理。(第五實施例)盡管上述第一和第二實施例描述了通過根據(jù)操作時鐘改變要使用的弱判別器的 數(shù)量來調(diào)整提取精度與提取處理速度之間的折衷,但是本發(fā)明不限于此。例如,可以使用根 據(jù)用戶指定的攝像模式改變在處理中使用的弱判別器的數(shù)量的配置。以下,將描述根據(jù)本實施例的用于調(diào)整提取精度與提取處理速度之間的折衷的模 式識別裝置的配置的細節(jié)。注意,根據(jù)本實施例的模式識別裝置的硬件配置、矩形過濾器計 算單元201的配置的細節(jié)、參數(shù)信息211的配置等與在上述第一實施例中所描述的相同,因 此在此將省略其描述。此外,將使用上述第二實施例中的流程圖(圖9)對模式識別裝置100的操作進行 描述。在照相機中,一般可以根據(jù)要拍攝的被攝體設(shè)定多個攝像模式。圖15是示出這種 攝像模式的示例的圖,其示出了當以15a所示的肖像模式以及15b所示的標準模式進行拍 攝時使用的典型構(gòu)圖。1501和1502示意性地表示被攝體。在肖像模式下,在拍攝時,以比較大的尺寸拍 攝很少的被攝體1501,被攝體后面的背景變模糊(例如,控制圖像輸入單元101的光學系統(tǒng) 以減小景深)。因此,在某種程度上能夠基于攝像模式預(yù)測構(gòu)圖。換句話說,在要從構(gòu)圖中檢測被 攝體的情況下,能夠預(yù)測提取目標對象的數(shù)量。例如,因為在肖像模式下被攝體的數(shù)量少并 且背景區(qū)域模糊,所以要提取的提取目標對象的數(shù)量少。在本實施例中,基于該觀點來調(diào)整提取精度與提取處理速度之間的折衷。更具體 地說,在用戶使用I/F單元111指定了攝像模式的情況下,在步驟S902以及S903中,基于 指定的攝像模式來確定要實際使用的弱判別器的數(shù)量。圖16是示出將攝像模式與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖;該表 在步驟S902以及S903中確定要使用的弱判別器時使用。m至N2、Thxy(x:時鐘類型;y:級編號)以及Mxy (χ 時鐘類型;y 級編號)與第二 實施例中描述的表(圖11)相同。在這種情況下,Nl > N2,并對Mly中的所有位指定1等。換句話說,當使用肖像模式時,使用更多的弱判別器(預(yù)先通過學習生成的所有 判別器)進行識別,而在所有其它情況下減少弱判別器的數(shù)量。注意,該表存儲在ROM 109 中。在其它步驟中,根據(jù)在此設(shè)定的條件執(zhí)行識別處理。其它步驟與第二實施例中的步驟 相同,因此省略其描述。如上所述,本實施例具有在肖像模式下使用在學習期間確定的所有弱判別器進行高精度識別處理,而在標準模式下減少弱判別器的數(shù)量并進行高速處理的配置。通過這樣,能夠根據(jù)攝像模式控制使用的弱判別器的數(shù)量,因此能夠適當?shù)卣{(diào)整 提取精度與提取處理速度之間的折衷。(第六實施例)盡管上述第五實施例描述了根據(jù)攝像模式來控制要使用的弱判別器的數(shù)量的配 置,但是本發(fā)明不限于此。例如,可以使用根據(jù)用戶指定的操作模式來改變要使用的弱判別 器的數(shù)量的配置。根據(jù)攝像裝置的操作模式,存在與圖像數(shù)據(jù)的生成并行地對提取目標對象進行實 時提取的情況,以及在圖像數(shù)據(jù)的生成之后不從存儲在攝像裝置的存儲單元中的圖像數(shù)據(jù) 中對提取目標對象進行實時提取的情況。通常,將前者稱為聯(lián)機(online)模式,而將后者 稱為脫機(offline)模式。聯(lián)機模式與拍攝操作相對應(yīng),而脫機模式與例如對拍攝后的圖 像數(shù)據(jù)進行某種編輯、查詢等的操作模式相對應(yīng)。為此,在聯(lián)機模式下將提取處理速度優(yōu)先,而在脫機模式下將提取精度優(yōu)先。在本 實施 例中,以這種方式根據(jù)模式識別裝置的操作模式來控制要使用的弱判別器的數(shù)量。注 意,也使用第二實施例的流程圖(圖9)來描述本實施例的操作。更具體地說,在用戶使用I/F單元111指定了操作模式的情況下,在步驟S902以 及S903中,根據(jù)指定的操作模式,確定要使用的弱判別器的數(shù)量。圖17是示出將操作模式與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖;該表 在步驟S902以及S903中確定要使用的弱判別器時使用。m至N2、Thxy(x:時鐘類型;y:級編號)以及Mxy (χ 時鐘類型;y 級編號)與第二 實施例中描述的表(圖11)相同。在圖17中,設(shè)定參數(shù),使得在脫機模式下時,使用在學習期間生成的所有弱判別 器進行識別處理,而在聯(lián)機模式下時,使用數(shù)量減少的弱判別器進行識別處理。注意,該表 存儲在ROM 109中。在其它步驟中,根據(jù)在此設(shè)定的條件來執(zhí)行識別處理。其它步驟與第 二實施例中的步驟相同,因此將省略其描述。如上所述,本實施例具有在脫機模式下使用在學習期間確定的所有弱判別器進行 高精度識別處理,而在聯(lián)機模式下減少弱判別器的數(shù)量并進行高速識別處理的配置。通過這樣,能夠根據(jù)操作模式來控制使用的弱判別器的數(shù)量,因此能夠適當?shù)卣{(diào) 整提取精度與提取處理速度之間的折衷。(第七實施例)上述第一至第六實施例具有在調(diào)整提取精度與提取處理速度之間的折衷時將定 義弱判別器的操作的參數(shù)信息211存儲在ROM 205中的配置。然而,本發(fā)明不限于此。在本實施例中,描述將定義弱判別器的操作的參數(shù)信息211存儲在不可變存儲單 元(例如ROM)與可變存儲單元(例如RAM)兩者中的情況。圖18是示意性地示出存儲在ROM 205和RAM 204中的、定義弱判別器的操作的參 數(shù)信息及其使用狀態(tài)的圖。圖18中的18a示出在R0M205中存儲通過學習生成的弱判別器 的參數(shù)信息的狀態(tài)。各個箱(box)表示存儲在ROM 205中的預(yù)定區(qū)域中的、定義一個矩形過濾器的參 數(shù)信息數(shù)據(jù)集。換句話說,將圖4所示的一個矩形過濾器的參數(shù)信息存儲在一個箱中。從左邊開始,按照箱的布置順序,存儲要依次處理的多個矩形過濾器的參數(shù)信息。圖18的18b表示如在第一實施例中所描述的弱判別器的實際操作。各個陰影線 箱表示與該箱相對應(yīng)的矩形過濾器是在實際處理中使用的矩形過濾器。在這種情況下,通 過提前結(jié)束通過學習而生成的矩形過濾器的鏈來控制弱判別器(矩形過濾器)的數(shù)量。圖18中的18c表示如在第二實施例中描述的弱判別器的實際操作。在這種情況 下,通過進行跳過具有低可靠度水平的特定矩形過濾器的處理,來控制實際使用的弱判別 器(矩形過濾器)的數(shù)量。 圖18中的18d和18e表示的操作代表本實施例的特征。換句話說,在該配置中, 不僅在ROM 205中,而且在RAM 204中保持用于配置矩形過濾器的參數(shù)信息。此外,在預(yù)定 位置(以下稱為“分支點”)之后或在預(yù)定區(qū)間中使用存儲在RAM 204中的參數(shù)信息來執(zhí)行 矩形過濾器處理。圖19是示出ROM 205和RAM 204的存儲器映射的圖。將預(yù)先通過學習生成的參 數(shù)信息存儲在從ADRO至(ADRl-I)的范圍中。另一方面,RAM 204確保從ADRl往上的地址,使得能夠在裝置出廠后存儲用于提 高模式識別裝置的性能的附加參數(shù)信息等。在將參照的參數(shù)信息從ROM 205改變到RAM 204的情況下,在分支點,在稍后描述的指針寄存器中設(shè)定RAM 204區(qū)域的地址值(即ADRl 之后的值)。以下,使用圖20所示的流程圖描述本實施例的細節(jié)。為了簡單起見,以下僅描述 與第一實施例的不同之處。在步驟S2002中,基于操作時鐘來設(shè)定用于指定用于處理的矩形過濾器鏈的條 件。更具體地說,在處理執(zhí)行確定單元203內(nèi)的寄存器中設(shè)定分支的矩形過濾器數(shù)量(相 當于矩形過濾器編號)以及存儲相應(yīng)參數(shù)信息的地址。注意,以下,將從不同的物理存儲位 置加載參數(shù)信息的點稱為“分支”。圖21是示出本實施例特有的處理執(zhí)行確定單元203的部分的圖。2111至211η是 指針地址,其構(gòu)成存儲對指定矩形過濾器的參數(shù)信息進行參照的起始地址的寄存器。2121 至212η是指定矩形過濾器鏈的分支點的寄存器,其與矩形過濾器的數(shù)量相對應(yīng)。2130是將分支點寄存器與處理后的寄存器計數(shù)器進行比較并確定分支點的比較 器。當確定到達分支點時,比較器2130輸出地址加載信號和地址。2140是基于比較器的輸出從指針地址2111至211η中選擇與分支點相對應(yīng)的分 支目的地地址的選擇器。在步驟S2002中,設(shè)定分支點寄存器2121至212η以及指針地址 2111 至 211η。在圖18的d或e中示出的示例中,針對每級設(shè)定一個分支點寄存器和一個指針地址。圖22是示出將操作時鐘與使用的弱判別器的總數(shù)相關(guān)聯(lián)的表的示例的圖。在圖 22中,m至N3以及Thxy(x 時鐘類型;y 級編號)是與第一實施例中相同的變量。ADxy (χ 時鐘類型;y 級編號)是指定分支目的地地址的指針信息,Pxy (χ 時鐘類 型;y 級編號)是發(fā)生分支的矩形過濾器編號。在步驟S2002中,根據(jù)操作時鐘來參照所述表,在指針地址2111至211η中設(shè)定 ADxy,在指針寄存器2121至212η中設(shè)定Pxy。
在圖18的d所示的示例中,還將矩形過濾器的參數(shù)信息添加到預(yù)先通過學習而生 成的、使用ROM 205作為硬件來實現(xiàn)的矩形過濾器的參數(shù)信息中。在步驟S2021中,將用于 提高提取精度的附加的矩形過濾器的參數(shù)信息加載到作為在步驟S2002中指定的分支目 的地地址的RAM 204中。將附加的矩形過濾器的參數(shù)信息存儲在ROM 205等中,并且CPU108在該步驟中將 參數(shù)信息傳送到RAM 204。當識別處理單元103使用高速操作時鐘進行操作時,處理時間充裕,因此以這種 方式增加矩形過濾器的數(shù)量會提高提取精度。在圖18e所示的示例中,切換預(yù)先通過學習而生成的、使用ROM 205作為硬件來實 現(xiàn)的矩形過濾器的參數(shù)信息的部分。在步驟S2021中,將用于提高提取精度或提取處理速 度的交換矩形過濾器的參數(shù)信息加載到作為在步驟S2002中指定的分支目的地地址的RAM 204中。該參數(shù)信息是存儲在ROM 109等中的數(shù)據(jù),并且CPU 108在該步驟中將參數(shù)信息傳 送到 RAM 204。通過這種配置,即使作為硬件來實現(xiàn)識別處理單元103并最終確定了 ROM 205中 的細節(jié),也能夠切換矩形過濾器的參數(shù)信息的部分。在該切換中插入的參數(shù)信息可以是為 提高性能而新學習的參數(shù)信息,或可以是作為用于限制提取處理速度的條件而新附加地學 習的參數(shù)信息。因此,能夠通過切換參數(shù)信息的部分來調(diào)整提取精度與提取處理速度之間 的折衷。
在步驟S2003中,基于操作時鐘來確定級的數(shù)量。該處理與步驟S503中的處理相 同。接著,在步驟S2004至S2007中,將要處理的圖像數(shù)據(jù)傳送到RAM204。在步驟 S2008中,確定處理塊,在步驟S2009中,開始參數(shù)信息的讀出。接著,基于作為預(yù)定矩形過濾器計算處理的結(jié)果的評價值,來計算累積值(步驟 S2010至S2011)。在步驟S2012中,更新處理后的矩形過濾器的數(shù)量。在步驟S2020中,確定矩形過濾器鏈的分支。更具體地說,通過使用先前參照圖21 討論的比較器2130,對過濾器處理數(shù)量計數(shù)器與指定的分支點過濾器編號進行比較來進行確定。當確定了分支點時,在步驟S2021中,針對參數(shù)信息設(shè)定新的參照目的地起始地 址。更具體地說,根據(jù)地址加載信號,將圖21所示的指針地址2111加載到矩形過濾器計算 單元201的存儲器訪問地址計數(shù)器(未示出)中。之后,在參照在此設(shè)定的區(qū)域的同時,對矩形過濾器處理所需的參數(shù)信息進行處 理。這里假定將RAM 204的起始地址存儲在指針地址2111中(步驟S2002)。矩形過濾器計算單元201使用在此重新設(shè)定的地址作為起始地址,在按順序讀出 指定矩形過濾器的參數(shù)信息的同時,繼續(xù)進行處理(步驟S2009至S2013)。注意,基于預(yù)先生成并存儲在ROM 205中的弱判別器的數(shù)量與指定的用于提取的 弱判別器的數(shù)量之間的關(guān)系,從圖18的18d和18e中確定類型,因此就配置而言是相同的。下面的步驟S2013至S2019與第一實施例中的步驟S513至S519相同,因此省略 其描述。根據(jù)上述本實施例,能夠根據(jù)預(yù)定前提條件,靈活地切換弱判別器的鏈。
盡管本實施例描述了在步驟S2021中加載添加到已有的參數(shù)信息中或者用于改變已有的參數(shù)信息的參數(shù)信息,但是注意,可以配置為在各級加載信息。在這種情況下,當 確定一級結(jié)束時(步驟S2013),將參數(shù)信息加載到RAM 204中。因為當存在多級時,在級之 間共享RAM 204,因此這種配置使得能夠用較小的RAM 204來實現(xiàn)本實施例。此外,盡管圖18的18d和18e示出了有一個分支點的情況,但是分支點不限于一 個點,也可以有多個點。此外,盡管本實施例討論了在級內(nèi)以弱判別器為單位對弱判別器鏈 進行分支,但是本實施例不限于此。可以配置為以級為單位進行分支。換句話說,在特定級 的所有矩形過濾器計算處理所需的所有參數(shù)信息的存儲目的地可以是RAM 204。根據(jù)如上所述的本實施例,即使在作為一個硬件創(chuàng)建了識別處理單元103之后, 也能夠?qū)崿F(xiàn)性能的提高以及折衷調(diào)整。此外,能夠以小于使用將所有參數(shù)信息保持在RAM 中的配置時的規(guī)模來實現(xiàn)本發(fā)明。(第八實施例)盡管上述第五及第六實施例描述了根據(jù)攝像模式、操作模式等來確定要使用的弱 判別器的數(shù)量的配置,但是本發(fā)明不限于此,而可以被配置為用戶直接選擇提取條件。在這 種情況下,用戶經(jīng)由I/F單元111指定提取模式。圖23是示出用于在有兩個提取模式的情況下,確定提取條件的表的示例的圖。W 至N2、Thxy(X:時鐘類型;y:級編號)以及Mxy(x 時鐘類型;y:級編號)與第二實施例中的 相同。通過預(yù)先創(chuàng)建該表,用戶能夠直接調(diào)整提取精度與提取處理速度之間的折衷。此外,上述實施例中的各個討論了將文獻1公開的方法應(yīng)用到本發(fā)明,但是本發(fā) 明不限于此。本發(fā)明可以應(yīng)用于基于也可以應(yīng)用的多個級聯(lián)連接的弱判別器進行識別的各 種識別處理。此外,上述實施例的各個討論了使用矩形過濾器作為弱判別器,但是本發(fā)明不限 于此,也可以將本發(fā)明應(yīng)用于其它各種弱判別器。另外,雖然上述實施例中的各個討論了改變級的數(shù)量以及級內(nèi)的矩形過濾器的數(shù) 量,但是本發(fā)明不限于此。可以配置為將級的數(shù)量固定而僅改變級內(nèi)的弱判別器的數(shù)量。此 夕卜,根據(jù)算法,還存在僅有一級的情況,但是也可以將本發(fā)明應(yīng)用到這樣的方案中。此外,雖然上述實施例中的各個描述了從圖像數(shù)據(jù)中提取特定對象的情況,但是 本發(fā)明不限于此。還可以將本發(fā)明應(yīng)用到從諸如音頻信號的一維信號中識別特定對象(模 式)的設(shè)備。此外,盡管上述第二實施例描述了基于可靠度水平來創(chuàng)建預(yù)先指定要使用的弱判 別器的標記信息的配置,但是本發(fā)明不限于此。例如,可以配置為在處理執(zhí)行確定單元203 中直接設(shè)定可靠度水平閾值,而不在處理執(zhí)行確定單元203中設(shè)定圖11所示的標記信息 Mxy。此外,可以配置為每次在步驟S902中比較參數(shù)信息的可靠度水平與設(shè)定的可靠度水 平,并確定是否使用相應(yīng)的矩形過濾器。最后,盡管上述實施例中的各個描述了作為硬件設(shè)備來實現(xiàn)識別處理單元103,但 是注意,可以配置為使用DSP(數(shù)字信號處理器)等,作為軟件來實現(xiàn)識別處理設(shè)備103。(其它實施例)本發(fā)明可以應(yīng)用于由多個設(shè)備(例如,主計算機、接口設(shè)備、讀取器、打印機等)構(gòu) 成的系統(tǒng),也可以應(yīng)用于由一個設(shè)備構(gòu)成的裝置(例如,復(fù)印機、傳真機等)。
此外,毋庸置疑,通過向系統(tǒng)或裝置提供存儲有實現(xiàn)上述實施例功能的軟件的程 序代碼的存儲介質(zhì),也能夠?qū)崿F(xiàn)本發(fā)明的目的。在這種情況下,系統(tǒng)或裝置的計算機(或 CPU或MPU)加載并執(zhí)行存儲在記錄介質(zhì)中的程序代碼,由此實現(xiàn)上述功能。注意,在這種情 況下,本發(fā)明由存儲有程序代碼的存儲介質(zhì)構(gòu)成。 可以用于提供程序代碼的記錄介質(zhì)的示例包括軟(floppy(注冊商標))盤、硬盤、 光盤、磁光盤、CD-ROM、CD-R、磁帶、非易失性存儲卡以及ROM。然而,本發(fā)明不限于通過計算機讀出程序代碼并執(zhí)行該程序代碼來實現(xiàn)上述實施 例的功能的情況。毋庸置疑,本發(fā)明還包括例如在計算機上運行的操作系統(tǒng)(OS)基于程序 代碼的指令執(zhí)行部分或全部實際處理、通過該處理實現(xiàn)上述實施例的功能的情況。此外,還包括將從記錄介質(zhì)讀出的程序代碼寫入安裝在計算機的功能擴展板或連 接到計算機的功能擴展單元中設(shè)置的存儲器之后,實現(xiàn)上述實施例的功能的情況。也就是 說,在程序代碼被寫入存儲器之后,包含在功能擴展板或功能擴展單元中的CPU等基于程 序代碼的指令執(zhí)行部分或全部實際處理,并通過該處理實現(xiàn)功能。雖然參照示例性實施例描述了本發(fā)明,但是應(yīng)當理解,本發(fā)明不限于所公開的示 例性實施例。應(yīng)對所附權(quán)利要求的范圍給予最寬的解釋,以使其覆蓋所有這種變型、等同結(jié) 構(gòu)和功能。本申請要求2007年11月1日提交的日本專利申請第2007-285401號的優(yōu)先權(quán), 該申請的全部內(nèi)容通過引用包含于此。
權(quán)利要求
一種信息處理裝置,所述信息處理裝置包括多個弱判別器,其相互級聯(lián)連接,所述多個弱判別器對數(shù)據(jù)進行處理;第一存儲單元,其存儲指定所述弱判別器中的各個的處理內(nèi)容的處理指定信息;第二存儲單元,其存儲表,在所述表中是指定的信息,所述信息用于基于處理所述數(shù)據(jù)的條件來確定在對所述數(shù)據(jù)的處理中要使用所述弱判別器中的哪些;選擇單元,其通過參照所述表,來從所述弱判別器中選擇在對所述數(shù)據(jù)的處理中要使用的弱判別器;以及提取單元,其基于與所述選擇單元選擇的所述弱判別器相對應(yīng)的所述處理指定信息,使用所述弱判別器對所述數(shù)據(jù)進行處理而獲得的評價值,從所述數(shù)據(jù)中提取對象。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,在所述表中,使用所述提取單元的處理 速度作為所述條件,以級聯(lián)連接的多個弱判別器創(chuàng)建的級為單位,指定要使用的弱判別器 的數(shù)量作為所述處理指定信息。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,在所述表中,使用所述提取單元的處理 速度作為所述條件,以級聯(lián)連接的多個弱判別器創(chuàng)建的級為單位,指定要使用的弱判別器 的信息作為所述處理指定信息。
4.根據(jù)權(quán)利要求3所述的信息處理裝置,其中,基于在所述處理指定信息中包括的所 述弱判別器的可靠度水平,生成指示要使用的弱判別器的所述信息。
5.根據(jù)權(quán)利要求2至4中的一個所述的信息處理裝置,其中,所述處理速度與所述信息 處理裝置的操作時鐘相對應(yīng)。
6.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述數(shù)據(jù)是由多個幀構(gòu)成的圖像數(shù)據(jù);并且在所述表中,使用所述提取單元從所述圖像數(shù)據(jù)的前一幀中提取的對象的數(shù)量作為所 述條件,以級聯(lián)連接的多個弱判別器創(chuàng)建的級為單位,指定要使用的弱判別器的數(shù)量作為 所述處理指定信息。
7.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述數(shù)據(jù)是由攝像裝置生成的圖像數(shù)據(jù);并且在所述表中,使用當所述攝像裝置生成所述圖像數(shù)據(jù)時使用的攝像模式作為所述條 件,以級聯(lián)連接的多個弱判別器創(chuàng)建的級為單位,指定要使用的弱判別器的數(shù)量作為所述 處理指定信息。
8.根據(jù)權(quán)利要求7所述的信息處理裝置,其中,所述攝像模式包括標準模式和肖像模 式,并且在所述表中,與針對所述肖像模式相比,針對所述標準模式指定更少的要使用的弱 判別器的數(shù)量。
9.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述數(shù)據(jù)是由攝像裝置生成的圖像數(shù)據(jù);并且在所述表中,使用所述攝像裝置的操作模式作為所述條件,以級聯(lián)連接的多個弱判別 器創(chuàng)建的級為單位,指定要使用的弱判別器的數(shù)量作為所述處理指定信息。
10.根據(jù)權(quán)利要求9所述的信息處理裝置,其中,所述操作模式包括聯(lián)機模式和脫機模 式,在所述聯(lián)機模式中,與所述攝像裝置生成所述圖像數(shù)據(jù)的操作并行地處理所述圖像數(shù) 據(jù);在所述脫機模式中,在所述攝像裝置完成生成所述圖像數(shù)據(jù)的操作之后,處理所述圖像數(shù)據(jù),并且在所述表中,與針對所述脫機模式相比,針對所述聯(lián)機模式指定更少的要使用的 弱判別器的數(shù)量。
11.根據(jù)權(quán)利要求2至10中的一個所述的信息處理裝置,其中,在所述表中,指定要使用的級的數(shù)量作為所述處理指定信息;并且 所述提取單元使用通過使用所指定的級的數(shù)量,在每一級對所述數(shù)據(jù)進行處理而獲得 的所述弱判別器的評價值的累積值,從所述數(shù)據(jù)中提取對象。
12.根據(jù)權(quán)利要求1至11中的一個所述的信息處理裝置,其中,所述第一存儲單元包括只讀的第一存儲部和可重寫的第二存儲部;并且所述提取單元基于存儲在所述第二存儲部中的、針對所述級聯(lián)連接的多個弱判別器中 位于預(yù)定區(qū)間的弱判別器的所述處理指定信息,并基于存儲在所述第一存儲部中的、針對 所述級聯(lián)連接的多個弱判別器中不位于所述預(yù)定區(qū)間的弱判別器的所述處理指定信息,從 所述數(shù)據(jù)中提取對象。
13.一種信息處理裝置的信息處理方法,該信息處理裝置使用級聯(lián)連接的多個弱判別 器對數(shù)據(jù)進行處理,所述信息處理方法包括以下步驟通過參照表,來選擇在對所述數(shù)據(jù)的處理中要使用的弱判別器,在所述表中是指定的 信息,所述信息用于基于對所述數(shù)據(jù)進行處理的條件來確定在對所述數(shù)據(jù)的處理中要使用 的弱判別器;基于指定所述弱判別器中的各個的處理內(nèi)容的處理指定信息中的、與在所述選擇步驟 中選擇的所述弱判別器相對應(yīng)的所述處理指定信息,使用所述弱判別器來對所述數(shù)據(jù)進行 處理;并且使用在所述處理步驟中獲得的評價值,從所述數(shù)據(jù)中提取對象。
14.一種用于使計算機執(zhí)行根據(jù)權(quán)利要求13所述的信息處理方法的程序。
全文摘要
一種使用級聯(lián)連接的多個弱判別器處理數(shù)據(jù)的信息處理裝置,存儲指定所述多個弱判別器中的各個的處理內(nèi)容的處理指定信息。通過參照指定了用于基于處理所述數(shù)據(jù)的條件確定要使用的弱判別器的信息的表來從所述多個弱判別器中選擇在處理所述數(shù)據(jù)中要使用的弱判別器。然后所選擇的弱判別器基于與所選擇的弱判別器相對應(yīng)的所述處理指定信息處理所述數(shù)據(jù),并使用獲得的評價值從所述數(shù)據(jù)中提取對象。通過這樣,當從圖像數(shù)據(jù)中提取特定對象時,能夠以靈活地方式改變提取處理速度與提取精度的組合。
文檔編號G06T7/00GK101842809SQ20088011367
公開日2010年9月22日 申請日期2008年10月29日 優(yōu)先權(quán)日2007年11月1日
發(fā)明者伊藤嘉則, 加藤政美, 山本貴久 申請人:佳能株式會社